La velocità non è l’unico criterio essenziale da tenere in considerazione nella scelta della tecnologia di intelligenza artificiale generativa. Mentre la maggior parte dei modelli IA sono stati ottimizzati per produrre risposte il più rapidamente possibile, il nuovo modello OpenAI o1 è stato progettato per rallentare e prendersi il tempo necessario per rispondere alle domande degli utenti.
Va notato che, sebbene l’imminente lancio di OpenAI o1 rappresenti un significativo passo in avanti nello sviluppo delle capacità di ragionamento dei modelli linguistici di grandi dimensioni (LLM), difficilmente susciterà l’entusiasmo di coloro che aspettavano il rilascio di GPT 5.
Al momento, la startup è valutata 150 miliardi di dollari e gli investitori si aspettano quindi progressi significativi nel campo dell’IA, un settore che si sta evolvendo molto rapidamente.
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond.
These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. https://t.co/peKzzKX1bu
— OpenAI (@OpenAI) September 12, 2024
Perché il nuovo modello OpenAI o1 ha capacità di ragionamento migliori?
Nell’ambito delle sue capacità di ragionamento, il modello OpenAI o1 utilizza l’apprendimento per rinforzo (RL) per ottimizzare la sua catena di pensiero, affinando gradualmente le modalità utilizzate per generare risposte, in modo da riconoscere e correggere gli errori senza supervisione umana.
Il noto professore di informatica Tom Yeh ha pubblicato un articolo che spiega in dettaglio il quadro dell’apprendimento per rinforzo “tradizionale” dal feedback umano (una modalità di apprendimento chiamata “RLHF”, che sta per ” Apprendimento per rinforzo dal feedback umano” ).
Yeh spiega che il processo incorpora un ciclo di feedback in cui le risposte generate dall’IA vengono sistematicamente riviste e valutate da un modello di risposta basato su criteri di qualità definiti dall’utente e che consente di migliorare gradualmente la qualità delle risposte fornite dal LLM.
La nuova tecnologia si basa anche su una modalità di apprendimento ancora più complessa che i ricercatori hanno chiamato: RLHF+COT, dove COT sta per “Catena di Pensiero”.
Questo modello elabora la richiesta di un utente (chiamata prompt) e “pensa” per fasi prima di generare una risposta e inviare i dati.
Usare la tecnologia generativa basata su COT in questo contesto significa che il modello svilupperà una spiegazione passo passo del suo processo di ragionamento per giustificare così la generazione della sua risposta.
OpenAI ha implementato una procedura ancora più avanzata, chiamata Inference+CoT, che permette al modello di ragionare da solo senza bisogno che un essere umano arrivi alla risposta.
Questa tecnologia consente all’IA di ragionare e interrogarsi prima di fornire una risposta all’utente, riducendo così la necessità di supervisione umana.
Va altresì specificato che in questa versione, i token CoT non sono disponibili per gli utenti finali.
Un nuovo modello che permette ad OpenAI di restare in gioco
Dal lancio di GPT-4 nel marzo 2023, i clienti hanno atteso (con impazienza) il rilascio di GPT-5 , ma a più di un anno di distanza non è stata ancora confermata ufficialmente alcuna data di rilascio. Tuttavia, lo sviluppo di GPT-5 non sembra aver rallentato le attività di OpenAI.
Rilasci intermittenti come GPT-4 Turbo, GPT-4V, GPT-4o, GPT personalizzati e ora OpenAI o1 hanno contribuito a mantenere l’azienda leader nel settore.
Ma qual è il vero punto di forza di Open o1? Le sue capacità di ragionamento gli permettono di risolvere problemi complessi in aree chiave come la scienza, la programmazione e la matematica?
Come ha spiegato a Techopedia Sandi Besen, ricercatore di intelligenza artificiale applicata presso IBM:
“Penso che la società OpenAI sia focalizzata sul miglioramento di uno dei maggiori limiti del modello linguistico: il ragionamento. Le valutazioni delle prestazioni del nuovo modello o1 in un contesto di domanda/risposta sembrano promettenti.”
“Le sue prestazioni sui parametri giuridici, dove la risposta in genere richiede un ragionamento in più fasi e molte informazioni da utilizzare come contesto, sono assolutamente notevoli.”
Infatti, secondo i dati forniti da OpenAI , il modello si comporta in modo simile agli studenti di dottorato su “compiti di riferimento difficili” in fisica, chimica e biologia, eccellendo in matematica e programmazione informatica.
OpenAI o1 offre prestazioni migliorate rispetto a GPT-4o in alcune aree, ad esempio, durante un esame di qualificazione per le Olimpiadi Internazionali di Matematica (IMO). In quell’ occasione GPT-4o ha risolto correttamente solo il 13% dei problemi, mentre OpenaAI o1 ha ottenuto un punteggio dell’83%.
OpenAI o1 offre prestazioni notevoli, ma…
Sebbene questo approccio innovativo al ragionamento nel campo delle tecnologie di intelligenza artificiale generativa offra prospettive molto promettenti per il futuro, il rilascio ufficiale di OpenAI o1 come soluzione di per sé è deludente.
I token COT non sono disponibili per gli utenti, fornendo poca trasparenza nel processo di ragionamento utilizzato dal modello. Inoltre, il modello stesso è piuttosto lento, con risposte a domande complesse che richiedono diversi minuti.
Anche il CEO dell’azienda, Sam Altman, sembra essere deluso dal rilascio di questo strumento. In un post su X ha infatti affermato:
” Vi presentiamo OpenAI o1, una serie dei nostri modelli più potenti e accurati implementati fino ad oggi […] o1 è sempre imperfetto, sempre limitato e sembra sempre più impressionante al primo utilizzo rispetto a dopo aver trascorso più tempo con esso.»
Il post sul blog dell’azienda rivela inoltre che OpenAI o1 non dispone ancora di molte delle funzionalità che rendono utile ChatGPT, inclusa la ricerca di informazioni sul Web e il caricamento di file e immagini, sebbene rappresenti un progresso significativo per attività di ragionamento complesse.
here is o1, a series of our most capable and aligned models yet:https://t.co/yzZGNN8HvD
o1 is still flawed, still limited, and it still seems more impressive on first use than it does after you spend more time with it. pic.twitter.com/Qs1HoSDOz1
— Sam Altman (@sama) September 12, 2024
Nonostante il rilascio di questa nuova versione abbia suscitato molte reazioni positive, non è stata accolta con entusiasmo da tutti gli operatori del settore.
Sean Ran, CEO e co-fondatore di Sahara AI, ha dichiarato recentemente:
“Ad essere onesti, non sono particolarmente impressionato da questo nuovo modello. Indossando il mio cappello da ricercatore/professore di intelligenza artificiale, vedo questo come un segno che il primo principio dello sviluppo del modello non è cambiato: stiamo ancora cercando di applicare l’apprendimento basato sulla ricompensa su grandi quantità di dati per migliorare il modello, ma con modalità più mirate.”
Quali sono le reazioni degli esperti al lancio di OpenAI o1?
Per avere un’idea della nuova versione, sono stati interpellati alcuni esperti per capire cosa pensasse la comunità tecnologica del nuovo modello OpenAI o1, e nel complesso le risposte sono state abbastanza positive.
Alon Yamin, co-fondatore e CEO di Copyleaks, ha dichiarato:
“La pubblicazione del modello o1 di OpenAI segna una vera pietra miliare nello sviluppo dell’intelligenza artificiale generativa. La sua capacità di valutare i passaggi prima di procedere è davvero rivoluzionaria.»
“Finora i modelli AI hanno avuto difficoltà con le sfumature, quindi sono curioso di vedere come si comporta il modello o1 in quest’area. Sono entusiasta dei potenziali progressi nella matematica, nelle scienze e nella programmazione informatica che questo modello potrebbe consentire, soprattutto nell’istruzione superiore.»
Anche Besen è rimasto molto colpito dal potenziale di questa versione.
“Nel complesso, sono piuttosto impressionato dal potenziale dei modelli che hanno migliori capacità di ragionamento senza dover aggiungere ulteriori metodi utilizzando prompt (ReAct, Chain of Thought, ecc.) o un’altra chiamata a un modello linguistico aggiuntivo per pianificare attività più complesse.»
“Spero che l’aumento della capacità di ragionamento migliorerà la precisione e quindi guadagnerà la fiducia dei leader aziendali nello sviluppo di più casi d’uso per GenAI”.»
Con questo nuovo modello, OpenAI dimostra come un approccio alternativo al miglioramento dell’intelligenza artificiale possa aiutare a migliorare le capacità di ragionamento degli LLM nel loro complesso.
Detto questo, OpenAI o1 potrebbe ricevere un’accoglienza molto calorosa da parte degli utenti che attendevano con impazienza il lancio dell’LLM basato sul progetto Strawberry.
In definitiva
OpenAI o1 sembra essere una nuova versione IA estremamente promettente, ma difficilmente sarà all’altezza dell’hype che generò quando era conosciuto come Project Strawberry .
Possiamo però notare che le critiche rivolte a questo nuovo modello appaiono ingiuste nei confronti di OpenAI.
Questa startup affronta vari approcci all’intelligenza artificiale in modi diversi e offre poi al pubblico l’opportunità di provarli sperimentalmente.
In un certo senso, il rilascio del nuovo modello OpenAI o1 solleva domande interessanti su come si evolverà il ragionamento dell’intelligenza artificiale nei prossimi anni.