DeepSeek Svela il Modello 3V, L’IA Open-Source più Potente Finora
La società cinese di intelligenza artificiale DeepSeek ha rilasciato questa settimana il suo ultimo modello open-source, DeepSeek-V3. La startup sostiene che il suo nuovo grande modello include 671B parametri e può eseguire meglio di modelli di punta come il GPT-4o di OpenAI e il Claude-Sonnet-3.5 di Anthropic.
Hai fretta? Ecco i Fatti Essenziali!
- DeepSeek ha rilasciato il suo ultimo modello di AI, DeepSeek-V3, affermando che le sue prestazioni sono migliori di GPT 4o e Claude-Sonnet-3.5.
- La compagnia cinese di AI ha spiegato che il nuovo modello include 671B parametri ed è tre volte più veloce del modello precedente.
- DeepSeek-V3 è ora il modello di AI open-source più potente sul mercato
Gli utenti possono interagire con il modello attraverso il sito ufficiale, leggere il documento dell’azienda e accedere al modello tramite Hugging Face. DeekSeek ha dichiarato che questo nuovo modello è tre volte più veloce della versione precedente rilasciata a novembre e ha capacità rafforzate e compatibilità API.
🚀 Vi presento DeepSeek-V3!
Il salto in avanti più grande fino ad ora:
⚡ 60 token/secondo (3 volte più veloce di V2!)
💪 Capacità potenziate
🛠 Compatibilità API intatta
🌍 Modelli e documenti completamente open-source🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 26 Dicembre 2024
“Presentiamo DeepSeek-V3, un robusto modello di linguaggio Mixture-of-Experts (MoE) con un totale di 671B parametri, di cui 37B attivati per ogni token,” ha scritto l’azienda su GitHub. “Valutazioni complete rivelano che DeepSeek-V3 supera altri modelli open-source e raggiunge prestazioni comparabili a quelle dei principali modelli closed-source.”
Molti utenti, organizzazioni e aziende hanno congratulato DeepSeek per il suo successo. “Complimenti per l’eccezionale release!” ha scritto Hugging Face su X, “I checkpoint del modello e un dettagliato rapporto: davvero è come se fosse Natale!”
Andrej Karpathy—ex ricercatore presso OpenAI e attuale responsabile dell’IA di Tesla—ha condiviso anche lui alcune riflessioni. “DeepSeek (azienda di IA cinese) oggi sembra rendere tutto facile con il rilascio aperto dei pesi di un LLM di grado avanzato, allenato con un budget ridicolo (2048 GPU per 2 mesi, $6M).”
DeepSeek-V3 è ora uno dei modelli AI open-source più potenti sul mercato e la sua API a pagamento rimane tra le più economiche disponibili.
Lascia un commento
Annulla