Intelligenza Artificiale

OpenAI lancia 03 e 03 mini, i nuovi modelli che portano l’IA su un altro livello

La presentazione di o3 segna l’inizio di una nuova era per l’intelligenza artificiale. Come sottolinea Altman: “Con o3, vediamo un’intelligenza artificiale in grado di risolvere problemi complessi con un ragionamento simile a quello umano”

OpenAI ha recentemente presentato o3 e o3 mini, due nuovi modelli di intelligenza artificiale che promettono di ridefinire le capacità e le applicazioni dell’IA. Questi modelli rappresentano un significativo passo avanti nella creazione di sistemi sempre più vicini al concetto di Artificial General Intelligence (AGI), come evidenziato da Sam Altman, CEO di OpenAI: “L’AGI non è un obiettivo binario: ‘l’abbiamo raggiunta sì/no’. È più utile considerarla come uno spettro, in cui o3 si avvicina sempre più alla ‘generalizzazione’ tipica dell’intelligenza umana“.

Caratteristiche rivoluzionarie di o3

Uno degli aspetti più straordinari di o3 è la sua capacità di generalizzare e risolvere problemi mai visti prima, dimostrando un approccio che si avvicina a quello umano. Questo risultato è stato raggiunto grazie a una combinazione di dati, algoritmi avanzati e una capacità di ragionamento definita “chain-of-thought” o “catena di pensiero”. Tale approccio permette al modello di valutare più strategie di soluzione e scegliere la migliore, simulando un ragionamento umano avanzato.

Computer | pexels @Nao Triponez – Cryptohack.it

Nel 2019, nel suo influente paper “On the Measure of Intelligence”, François Chollet introdusse il benchmark ARC-AGI per misurare la capacità di un sistema intelligente di affrontare problemi complessi e mai visti prima. Questo benchmark è stato superato brillantemente da o3, segnando un progresso senza precedenti.

  • ARC-AGI: il modello ha raggiunto un incredibile risultato, superando i precedenti limiti e dimostrando la sua capacità di risolvere problemi complessi con un ragionamento simile a quello umano.
  • Frontier Math Benchmark di EpochAI: o3 ha ottenuto un punteggio del 25,2%, contro il 2% dei migliori modelli precedenti. Questo benchmark valuta problemi matematici avanzati, richiedendo competenze teoriche e intuizione.
  • SWE-Bench Verified: con un punteggio del 71,7%, o3 ha ridefinito gli standard nell’ingegneria del software, dimostrando di poter scrivere codice efficiente e debuggarlo con estrema precisione.
  • AIME 2024 ha raggiunto un impressionante 96,7% in uno degli esami matematici più difficili al mondo.
  • Codeforces, con un punteggio ELO di 2727, si posiziona nel 99,95° percentile tra i migliori programmatori competitivi a livello globale.

Applicazioni pratiche

Le potenzialità di o3 si estendono a molteplici settori:

  • sanità: può analizzare sintomi complessi, identificare malattie rare e suggerire test diagnostici specifici.
  • finanza: può ottimizzare portafogli di investimento e migliorare i modelli di previsione del mercato.
  • ingegneria e scienza: può modellare fenomeni fisici complessi e formulare ipotesi innovative in ambiti come la biologia computazionale e l’astrofisica.
  • robotica avanzata: può affrontare scenari imprevedibili, come calcolare percorsi alternativi per un robot in un magazzino con ostacoli non standard.

Nonostante i risultati straordinari, o3 presenta ancora alcune sfide. La modalità high-compute di o3 richiede 172 volte più risorse rispetto alla modalità low-computer. Ridurre questi costi sarà cruciale per la scalabilità. OpenAI sta conducendo rigorosi test di “red teaming” con esperti esterni per garantire che o3 sia sicuro da utilizzare. Il red teaming include simulazioni di scenari di abuso, test di robustezza e valutazioni dei bias, assicurando che il modello sia eticamente e tecnicamente affidabile.

La presentazione di o3 segna l’inizio di una nuova era per l’intelligenza artificiale. Come sottolinea Altman: “Con o3, vediamo un’intelligenza artificiale in grado di risolvere problemi complessi con un ragionamento simile a quello umano. Entro il 2025 vedremo modelli di AI in grado di ‘eseguire compiti cognitivi davvero sorprendenti’ e di apparire più intelligenti degli esseri umani in molti problemi complessi.”

Giuliana Presti

Recent Posts

Sanità, Abruzzo all’avanguardia in ambito sanitario: immagini mediche 3D a occhio nudo

Sistema di diagnostica 3D rivoluziona la sanità abruzzese: immagini cliniche visibili senza visori, formazione universitaria…

5 giorni ago

FileFix: il nuovo attacco di social engineering basato su ClickFix

Cos'è la nuova tecnica di social engineering, che sfrutta la fiducia umana come superficie di…

2 settimane ago

Dopo anni di tentativi rimane incinta grazie all’AI: ecco cos’è il metodo Star e come funziona

Azoospermia, dopo 18 anni di tentativi una coppia aspetta un figlio grazie all’AI: ecco come…

4 settimane ago

ChatEurope, il chatbot dell’UE dà risposte sbagliate: i dettagli

Il chatbot europeo, ChatEurope, sta già riscontrando diversi problemi: ecco tutto ciò che c'è da…

4 settimane ago

L’IA nel lavoro: l’intelligenza artificiale coinvolge già il 57% dei dipendenti pubblici

L'intelligenza artificiale conquista il mondo del lavoro: ecco i dati del suo utilizzo nella Pubblica…

1 mese ago

L’IA passerebbe gli esami di Maturità 2025? Ecco come è andato ChatGPT nelle due prove

Non sono stati solamente gli studenti ad affrontare le due prove scritte della Maturità 2025:…

1 mese ago