Alibaba Lancia il Nuovo Modello di Intelligenza Artificiale Qwen e Afferma che Supera DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba Lancia il Nuovo Modello di Intelligenza Artificiale Qwen e Afferma che Supera DeepSeek-V3

Tempo di lettura: 2 Min.

Il gigante cinese Alibaba ha rilasciato l’ultima versione del suo modello AI di punta, Qwen, questo mercoledì. L’azienda sostiene che può funzionare meglio del popolare DeepSeek-V3.

Hai fretta? Ecco i Fatti Essenziali!

  • Alibaba ha rilasciato il suo ultimo modello di ragionamento, Qwen 2.5-Max, questo mercoledì.
  • Il gigante cinese sostiene che supera modelli popolari come DeepSeek-V3, GPT-4o, e Llama-3.1-405B.
  • L’azienda ha anche lanciato Qwen2.5-VL questa settimana, un modello di intelligenza artificiale in grado di elaborare immagini e agire come un agente AI utilizzando computer e cellulari per svolgere compiti.

Secondo Reuters, Alibaba ha lanciato il nuovo Qwen 2.5-Max, come ha denominato il nuovo modello di ragionamento, proprio durante le festività del Capodanno Lunare in Cina, per unirsi ai massicci sviluppi di AI degli ultimi giorni e aggiungere competizione domestica.

Lunedì, DeepSeek ha raggiunto il primo posto sull’App Store di Apple negli Stati Uniti, superando ChatGPT, preoccupando altre aziende nel settore dell’IA e allarmando gli investitori: le azioni Nvidia sono scese del 17% in un solo giorno.

Ora, Alibaba ha annunciato le ultime versioni del suo modello Qwen: ha rilasciato 100 modelli di IA open-source per la suite Qwen a settembre dello scorso anno, promettendo risultati migliori rispetto ai popolari modelli di frontiera.

“Qwen 2.5-Max supera (…) quasi su tutti i fronti GPT-4o, DeepSeek-V3 e Llama-3.1-405B,” ha scritto l’azienda sul suo account WeChat ufficiale.

La nuova API del modello di ragionamento Qwen 2.5-Max è disponibile attraverso il cloud di Alibaba e gli utenti possono anche testare il modello sulla sua pagina di chat.

“Stiamo sviluppando Qwen2.5-Max, un modello MoE su larga scala che è stato pre-addestrato su oltre 20 trilioni di token e successivamente post-addestrato con metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF)”, ha scritto il Team Qwen su Github.

Il gigante cinese ha anche rilasciato Qwen2.5-VL lunedì, una serie di modelli AI multimodali che possono anche elaborare immagini e accedere a cellulari e computer per eseguire compiti. OpenAI ha annunciato una caratteristica simile, Operator, permettendo a ChatGPT di eseguire compiti autonomamente prendendo il controllo del computer dell’utente.

Secondo il team di Alibaba, tutti i modelli Qwen superano le versioni simili di OpenAI, Microsoft, Google, Meta e DeepSeek.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!

Siamo felici che ti sia piaciuto il nostro lavoro!

In qualità di stimato lettore, ti dispiacerebbe lasciare una recensione su Trustpilot? Richiede poco tempo e significa tantissimo per noi. Grazie mille!

Valutaci su Trustpilot
0 Votato da 0 utenti
Titolo
Commento
Grazie per la tua opinione!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Loader
Loader Mostra di più...