
Image by Matheus Bertelli, from Pexels
DeepSeek’s AI Impara a Pensare per Sé Stessa
La startup cinese DeepSeek, in collaborazione con l’Università di Tsinghua, afferma di aver sviluppato un metodo più intelligente per aiutare i modelli di intelligenza artificiale a pensare in modo migliore e più veloce, senza necessità di enormi computer o risorse costose.
Sei di fretta? Ecco i fatti essenziali:
- DeepSeek ha creato un’intelligenza artificiale auto-migliorante utilizzando il Self-Principled Critique Tuning (SPCT).
- SPCT insegna all’IA a valutare il proprio lavoro utilizzando regole autogenerate.
- Il metodo aumenta le prestazioni senza l’uso di un’enorme potenza di calcolo.
La svolta proviene da una nuova tecnica chiamata Self-Principled Critique Tuning (SPCT). SPCT è diverso dal semplice ingrandimento dei modelli di IA per migliorare le prestazioni: SPCT non richiede molta energia e potenza di calcolo per insegnare all’IA a giudicare il proprio lavoro utilizzando un insieme di regole auto-create.
Il modo in cui funziona è attraverso un “giudice” incorporato che verifica che la risposta dell’IA sia conforme alle sue regole di ragionamento interne e sembri adatta per l’output umano. Quando l’IA fornisce una risposta solida, riceve un feedback positivo, che la aiuta a migliorare la sua capacità di rispondere a domande simili in future occasioni.
DeepSeek implementa questo metodo come parte del suo sistema DeepSeek-GRM, che sta per Generative Reward Modeling. GRM funziona diversamente dai metodi tradizionali perché esegue controlli paralleli per migliorare sia l’accuratezza che la coerenza.
“Proponiamo l’Auto-Principled Critique Tuning (SPCT) per promuovere comportamenti di generazione di ricompense scalabili”, hanno scritto i ricercatori nel loro articolo. “SPCT consente a [il modello] di definire in modo adattivo principi e critiche in base alla richiesta di input e alle risposte, portando a ricompense di risultato migliori.”
Con questo sistema, DeepSeek sostiene che il suo AI può ora superare i concorrenti come Gemini di Google, Llama di Meta e GPT-4o di OpenAI, soprattutto quando si tratta di compiti complessi come il ragionamento o la presa di decisioni, come riportato da Euronews.
È importante sottolineare che DeepSeek afferma di voler rilasciare questi nuovi strumenti come software open-source, sebbene non sia stata ancora comunicata una data di rilascio.
Lascia un commento
Annulla