DeepSeek Svela il Modello 3V, L’IA Open-Source più Potente Finora

Photo by Mimi Thian on Unsplash

DeepSeek Svela il Modello 3V, L’IA Open-Source più Potente Finora

Tempo di lettura: 2 Min.

La società cinese di intelligenza artificiale DeepSeek ha rilasciato questa settimana il suo ultimo modello open-source, DeepSeek-V3. La startup sostiene che il suo nuovo grande modello include 671B parametri e può eseguire meglio di modelli di punta come il GPT-4o di OpenAI e il Claude-Sonnet-3.5 di Anthropic.

Hai fretta? Ecco i Fatti Essenziali!

  • DeepSeek ha rilasciato il suo ultimo modello di AI, DeepSeek-V3, affermando che le sue prestazioni sono migliori di GPT 4o e Claude-Sonnet-3.5.
  • La compagnia cinese di AI ha spiegato che il nuovo modello include 671B parametri ed è tre volte più veloce del modello precedente.
  • DeepSeek-V3 è ora il modello di AI open-source più potente sul mercato

Gli utenti possono interagire con il modello attraverso il sito ufficiale, leggere il documento dell’azienda e accedere al modello tramite Hugging Face. DeekSeek ha dichiarato che questo nuovo modello è tre volte più veloce della versione precedente rilasciata a novembre e ha capacità rafforzate e compatibilità API.

“Presentiamo DeepSeek-V3, un robusto modello di linguaggio Mixture-of-Experts (MoE) con un totale di 671B parametri, di cui 37B attivati per ogni token,” ha scritto l’azienda su GitHub. “Valutazioni complete rivelano che DeepSeek-V3 supera altri modelli open-source e raggiunge prestazioni comparabili a quelle dei principali modelli closed-source.”

Molti utenti, organizzazioni e aziende hanno congratulato DeepSeek per il suo successo. “Complimenti per l’eccezionale release!” ha scritto Hugging Face su X, “I checkpoint del modello e un dettagliato rapporto: davvero è come se fosse Natale!”

Andrej Karpathy—ex ricercatore presso OpenAI e attuale responsabile dell’IA di Tesla—ha condiviso anche lui alcune riflessioni. “DeepSeek (azienda di IA cinese) oggi sembra rendere tutto facile con il rilascio aperto dei pesi di un LLM di grado avanzato, allenato con un budget ridicolo (2048 GPU per 2 mesi, $6M).”

DeepSeek-V3 è ora uno dei modelli AI open-source più potenti sul mercato e la sua API a pagamento rimane tra le più economiche disponibili.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!

Siamo felici che ti sia piaciuto il nostro lavoro!

In qualità di stimato lettore, ti dispiacerebbe lasciare una recensione su Trustpilot? Richiede poco tempo e significa tantissimo per noi. Grazie mille!

Valutaci su Trustpilot
0 Votato da 0 utenti
Titolo
Commento
Grazie per la tua opinione!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Loader
Loader Mostra di più...