OpenAI lancia il nuovo modello di IA “Reasoning”, o1

Image by Ishmael Daro, from Flickr

OpenAI lancia il nuovo modello di IA “Reasoning”, o1

Tempo di lettura: 3 Min.

  • Kiara Fabbri

    Scritto da: Kiara Fabbri Giornalista multimediale

  • Il team di localizzazione e traduzione

    Tradotto da Il team di localizzazione e traduzione Servizi di localizzazione e traduzione

OpenAI ha annunciato oggi il suo ultimo modello di Intelligenza Artificiale, o1, il primo di una nuova famiglia di modelli di “ragionamento” progettati per gestire problemi complessi più velocemente e con maggiore precisione rispetto ai modelli precedenti.

Insieme a o1, l’azienda sta anche rilasciando una versione più piccola e più economica chiamata o1-mini. Questo lancio viene descritto come una “anteprima”, segnalando che la tecnologia è ancora nelle sue fasi iniziali.

o1, precedentemente noto con il nome in codice “Strawberry”, è il primo di una serie di modelli “ragionanti” che OpenAI prevede di rilasciare, come segnalato da TechCrunch.

Jerry Tworek, capo della ricerca di OpenAI, ha riferito a The Verge che la formazione dietro o1 differisce significativamente dai modelli precedenti, anche se l’azienda è stata vaga sui dettagli specifici.

A differenza dei suoi predecessori, che erano progettati per imitare i modelli dai dati di addestramento, o1 utilizza l’apprendimento per rinforzo, un metodo che insegna al sistema a risolvere problemi attraverso ricompense e penalità.

Una delle caratteristiche più sorprendenti di o1 è la sua capacità di risolvere problemi multi-step e scrivere codice con un grado di precisione superiore rispetto ai modelli precedenti.

Ad esempio, in un esame di qualificazione per l’Olimpiade Internazionale di Matematica, o1 ha superato il precedente modello GPT-4o di OpenAI, risolvendo l’83% dei problemi rispetto al 13% di GPT-4o.

Questo salto di prestazione è attribuito al nuovo processo di formazione di o1, che incorpora quello che OpenAI definisce un meccanismo di “catena di pensiero”, permettendo al modello di scomporre e risolvere problemi passo per passo.

Tworek osserva che, sebbene il modello abbia ridotto la sua tendenza a “allucinare”, ovvero a fornire informazioni inesatte, il problema non è stato completamente risolto, come riportato da The Verge.

Oltre alla sua capacità matematica, o1 si è classificato nell’89esimo percentile nei concorsi di programmazione competitiva, dimostrando il suo potenziale come strumento per sviluppatori e ricercatori.

Secondo The Verge, ciò che ha colpito è come o1 sembrasse imitare intenzionalmente il pensiero umano. Frasi come “Sono curiosa”, “Sto pensando” e “Fammi vedere” hanno dato l’illusione di un processo di pensiero, sebbene il modello non stia effettivamente pensando. Quindi perché far sembrare che lo sia?

The Verge riporta che Tworek spiega che questa interfaccia ha lo scopo di dimostrare come il modello impieghi più tempo per elaborare ed esplorare problemi in maniera più approfondita.

Nonostante questi avanzamenti, OpenAI riconosce che o1 presenta ancora delle limitazioni. Sebbene eccella nella risoluzione di problemi complessi, è meno abile nel gestire conoscenze fattuali sul mondo. Inoltre, manca di alcune delle caratteristiche che rendono GPT-4o altamente versatile, come la capacità di navigare sul web o di elaborare file e immagini.

Inoltre, le nuove capacità di o1 hanno un costo. Il modello è significativamente più costoso da utilizzare rispetto a GPT-4o. Sull’API di OpenAI, o1-preview costa $15 per 1 milione di token in input e $60 per 1 milione di token in output, il che è tre o quattro volte più alto del costo di GPT-4o.

Sebbene la tecnologia sia ancora nelle sue fasi iniziali, il rilascio di o1 evidenzia i continui progressi nella capacità dell’IA di affrontare compiti complessi, offrendo potenziali benefici in vari settori che richiedono capacità avanzate di risoluzione dei problemi.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!
5.00 Votato da 1 utenti
Titolo
Commento
Grazie per la tua opinione!
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Mostra di più...