
Image by TechCrunch, from Flickr
Un’IA che pensa prima di parlare? Debutta Claude 3.7 Sonnet, l’ibrido di ragionamento
Anthropic ha lanciato Claude 3.7 Sonnet, una nuova versione del suo modello di intelligenza artificiale che introduce una modalità opzionale di “pensiero esteso”, dando agli utenti un maggior controllo su come il modello elabora compiti complessi.
Di fretta? Ecco i punti salienti!
- Il modello migliora il ragionamento e la risoluzione dei problemi permettendo l’autoriflessione prima di rispondere.
- La modalità di pensiero esteso è disponibile solo sui piani a pagamento.
- Claude Code, un assistente alla programmazione, è in anteprima limitata per gli sviluppatori
Anthropic ha rilasciato Claude 3.7 Sonnet, un modello AI aggiornato che introduce il ragionamento ibrido, permettendo agli utenti di scegliere tra risposte rapide e pensiero esteso.
Questo nuovo approccio mira a migliorare la risoluzione dei problemi permettendo al modello di prendere tempo aggiuntivo per valutare e perfezionare le sue risposte quando necessario.
In modalità standard, Claude 3.7 Sonnet funziona come un miglioramento iterativo rispetto al suo predecessore, Claude 3.5 Sonnet. In modalità di pensiero esteso, tuttavia, il modello si impegna in un’autoriflessione prima di produrre una risposta.
Michael Gerstenhaber, responsabile del prodotto AI di Anthropic, ha descritto la funzionalità come un modo per permettere agli utenti di bilanciare il tempo di risposta e la profondità del ragionamento. “L'[utente] ha molto controllo sul comportamento, su quanto tempo impiega a pensare, e può scambiare ragionamento e intelligenza con tempo e budget”, ha dichiarato, come riportato da WIRED.
Questo processo mira ad aumentare la precisione in aree che richiedono un ragionamento multi-step, come la matematica, la fisica, la programmazione e il seguire istruzioni. Gli utenti che interagiscono con il modello tramite API possono specificare un limite al numero di token che esso utilizza per “pensare”, permettendo così di controllare la velocità di risposta e il costo.
WIRED sottolinea che l’aggiornamento include anche una funzione “scratchpad”, che rende visibili i passaggi di ragionamento del modello durante l’elaborazione di una richiesta. Questo approccio è simile alle tecniche utilizzate in altri modelli di AI, come quello di DeepSeek.
Anthropic afferma che Claude 3.7 Sonnet è stato ottimizzato per applicazioni nel mondo reale piuttosto che per benchmark in stile competizione. I primi test suggeriscono che la modalità di ragionamento estesa migliora le prestazioni in compiti che coinvolgono codebase complessi, l’uso di strumenti avanzati e lo sviluppo di software full-stack.
Il modello è stato valutato su SWE-bench Verificato e TAU-bench, dove si dice che supera le versioni precedenti, come riportato da Anthropic.
CNN sottolinea che Anthropic ha mantenuto il prezzo per Claude 3.7 lo stesso dei modelli precedenti, posizionandolo sotto le ultime offerte di OpenAI. Costa $3 per milione di token di input e $15 per milione di token di output, rispetto ai $15 e $60 di OpenAI per livelli simili.
Lascia un commento
Annulla