L’organizzazione non-profit Ai2 lancia un nuovo LLM competitivo con il Llama di Meta
L’organizzazione di ricerca no profit The Allen Institute for Artificial Intelligence (Ai2) ha lanciato OLMo 2, la seconda famiglia del suo modello di linguaggio aperto, con strumenti altamente competitivi e capacità paragonabili a modelli leader nel mercato come il Llama 3.1 di Meta.
Hai fretta? Ecco i Fatti Essenziali!
- Ai2 ha lanciato ieri OLMo 2, un modello di linguaggio avanzato e open-source
- L’organizzazione lo descrive come “il miglior modello di linguaggio completamente aperto ad oggi”
- OLMo 2 compete con altri modelli open-source come Llama 3.1 di Meta
Ai2, fondata dal co-fondatore di Microsoft Paul Allen nel 2014, ha descritto questo modello come “il miglior modello di linguaggio completamente aperto fino ad oggi”.
“Presentiamo OLMo 2, una nuova famiglia di modelli 7B e 13B addestrati su fino a 5T di token,” ha scritto l’organizzazione in un annuncio sul suo sito web. “Questi modelli sono all’altezza o migliori rispetto ai modelli completamente aperti di dimensioni equivalenti, e competitivi con modelli a peso aperto come Llama 3.1 su benchmark accademici in inglese.”
OLMo 2 è il risultato di un miglioramento delle versioni precedenti dei modelli rilasciati durante l’anno: Ai2 ha annunciato il suo primo modello, OLMo, a febbraio, concentrandosi sul miglioramento di aspetti critici come la stabilità dell’addestramento, il preaddestramento, il post-addestramento all’avanguardia e le prestazioni attraverso un framework di valutazione.
Il nuovo modello è attualmente disponibile solo in inglese, e c’è una demo online disponibile al pubblico per testare OLMo 2.
Secondo TechCrunch, OLMo 2 soddisfa i criteri per essere considerato un’IA open source poiché i suoi dati e strumenti sono pubblicamente disponibili e pronti per essere testati.
Ai2 ha condiviso dati che dimostrano come questo nuovo modello possa superare altri modelli popolari con strutture simili.
“Abbiamo riscontrato che OLMo 2 7B e 13B sono i migliori modelli completamente aperti ad oggi, superando spesso i modelli a peso aperto di dimensioni equivalenti”, afferma il documento condiviso dall’organizzazione. “Non solo osserviamo un miglioramento drastico delle prestazioni in tutti i compiti rispetto al nostro precedente modello OLMo 0424, ma è da notare che l’OLMo 2 7B supera LLama-3.1 8B e l’OLMo 2 13B supera Qwen 2.5 7B nonostante il suo minor numero totale di FLOPs di addestramento.”
Alibaba ha rilasciato i nuovi modelli Qwen 2.5, considerati da Ai2 per il confronto, a settembre.
Lascia un commento
Annulla