Il Nuovo Algoritmo del MIT Aumenta l’Efficienza del Processo Decisionale dell’IA Fino a 50 Volte
I ricercatori del MIT hanno sviluppato un efficace algoritmo di addestramento per l’IA, potenziando le prestazioni selezionando i compiti migliori, migliorando il processo decisionale e riducendo i costi di formazione.
Di fretta? Ecco i fatti salienti!
- L’apprendimento trasferito basato su modelli (MBTL) migliora le prestazioni riducendo allo stesso tempo i dati e le esigenze computazionali.
- MBTL si è dimostrato da cinque a 50 volte più efficiente rispetto ai tradizionali metodi di apprendimento per rinforzo.
- I ricercatori prevedono di estendere l’MBTL a problemi reali più complessi.
I ricercatori del MIT hanno introdotto un nuovo algoritmo progettato per rendere i modelli decisionali dell’IA più efficienti, soprattutto per compiti complessi come il controllo del traffico nelle città.
L’algoritmo migliora l’apprendimento per rinforzo tradizionale, che spesso fatica a gestire la variabilità attraverso diverse attività.
Il comunicato stampa del MIT spiega che, ad esempio, un modello di intelligenza artificiale addestrato per controllare il traffico a un incrocio potrebbe fallire quando applicato ad altri con diversi schemi di traffico, numero di corsie o limiti di velocità.
Il nuovo approccio, noto come Model-Based Transfer Learning (MBTL), seleziona strategicamente un sottoinsieme di compiti per addestrare l’agente AI, concentrando l’attenzione su quelli che forniranno i miglioramenti più significativi in termini di prestazioni.
Riducendo il focus dell’addestramento, questo metodo riduce i dati e le risorse computazionali necessarie, aumentando al contempo l’efficienza del processo di apprendimento, afferma il MIT.
La ricerca del team, che sarà presentata alla Conferenza sui Sistemi di Elaborazione delle Informazioni Neurali, ha dimostrato che MBTL è tra cinque e 50 volte più efficiente dei metodi standard.
“Siamo stati in grado di vedere miglioramenti incredibili delle prestazioni, con un algoritmo molto semplice, pensando fuori dagli schemi,” ha detto Cathy Wu, autrice senior e professore associato al MIT.
“Un algoritmo che non è molto complicato ha maggiori possibilità di essere adottato dalla comunità perché è più facile da implementare e più facile da capire per gli altri.”
Tipicamente, i modelli di intelligenza artificiale per compiti come il controllo del traffico vengono addestrati in uno dei due modi: o utilizzando dati da tutti i compiti, o addestrando modelli separati per ogni compito.
Il MIT spiega che entrambi i metodi presentano svantaggi: l’addestramento di modelli separati richiede enormi quantità di dati, mentre l’addestramento su tutti i compiti porta spesso a prestazioni non ottimali.
Il metodo dei ricercatori trova un compromesso, addestrando un algoritmo su un sottoinsieme più piccolo di compiti che vengono selezionati strategicamente per massimizzare le prestazioni in tutti i compiti.
MBTL utilizza l’apprendimento trasferibile a zero colpi, un concetto in cui un modello addestrato per un compito viene applicato a compiti simili senza ulteriore riaddestramento.
Il MIT spiega che questo metodo stima quanto bene il modello si comporterà in compiti per i quali non è stato direttamente addestrato, selezionando così compiti che miglioreranno la generalizzazione complessiva.
“Con un aumento dell’efficienza del 50x, l’algoritmo MBTL potrebbe allenarsi su soltanto due compiti e ottenere le stesse prestazioni di un metodo standard che utilizza i dati provenienti da 100 compiti,” ha spiegato Wu.
Questo approccio riduce notevolmente la quantità di dati di addestramento necessari, migliorando sia la velocità che la convenienza dei costi nello sviluppo di modelli IA per la decisione complessa, secondo il MIT.
Guardando al futuro, il team prevede di perfezionare il metodo MBTL per sistemi più complessi e applicazioni reali, come i sistemi di mobilità di prossima generazione.
Lascia un commento
Annulla