Photo by John Schnobrich on Unsplash

Alibaba Lancia il Nuovo Modello di Intelligenza Artificiale Qwen e Afferma che Supera DeepSeek-V3

Tempo di lettura: 2 Min.

Pubblicato per la prima volta il: Jan 31, 2025

Aggiornato 2 volte dalla data di pubblicazione

Scritto da Andrea Miliani Ex esperto di notizie tecnologiche
Tradotto da Il team di localizzazione e traduzione Servizi di localizzazione e traduzione

Il gigante cinese Alibaba ha rilasciato l’ultima versione del suo modello AI di punta, Qwen, questo mercoledì. L’azienda sostiene che può funzionare meglio del popolare DeepSeek-V3.

Hai fretta? Ecco i Fatti Essenziali!

Alibaba ha rilasciato il suo ultimo modello di ragionamento, Qwen 2.5-Max, questo mercoledì.
Il gigante cinese sostiene che supera modelli popolari come DeepSeek-V3, GPT-4o, e Llama-3.1-405B.
L’azienda ha anche lanciato Qwen2.5-VL questa settimana, un modello di intelligenza artificiale in grado di elaborare immagini e agire come un agente AI utilizzando computer e cellulari per svolgere compiti.

Secondo Reuters, Alibaba ha lanciato il nuovo Qwen 2.5-Max, come ha denominato il nuovo modello di ragionamento, proprio durante le festività del Capodanno Lunare in Cina, per unirsi ai massicci sviluppi di AI degli ultimi giorni e aggiungere competizione domestica.

Lunedì, DeepSeek ha raggiunto il primo posto sull’App Store di Apple negli Stati Uniti, superando ChatGPT, preoccupando altre aziende nel settore dell’IA e allarmando gli investitori: le azioni Nvidia sono scese del 17% in un solo giorno.

Ora, Alibaba ha annunciato le ultime versioni del suo modello Qwen: ha rilasciato 100 modelli di IA open-source per la suite Qwen a settembre dello scorso anno, promettendo risultati migliori rispetto ai popolari modelli di frontiera.

“Qwen 2.5-Max supera (…) quasi su tutti i fronti GPT-4o, DeepSeek-V3 e Llama-3.1-405B,” ha scritto l’azienda sul suo account WeChat ufficiale.

La nuova API del modello di ragionamento Qwen 2.5-Max è disponibile attraverso il cloud di Alibaba e gli utenti possono anche testare il modello sulla sua pagina di chat.

“Stiamo sviluppando Qwen2.5-Max, un modello MoE su larga scala che è stato pre-addestrato su oltre 20 trilioni di token e successivamente post-addestrato con metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF)”, ha scritto il Team Qwen su Github.

Il gigante cinese ha anche rilasciato Qwen2.5-VL lunedì, una serie di modelli AI multimodali che possono anche elaborare immagini e accedere a cellulari e computer per eseguire compiti. OpenAI ha annunciato una caratteristica simile, Operator, permettendo a ChatGPT di eseguire compiti autonomamente prendendo il controllo del computer dell’utente.

Secondo il team di Alibaba, tutti i modelli Qwen superano le versioni simili di OpenAI, Microsoft, Google, Meta e DeepSeek.

Alibaba Lancia il Nuovo Modello di Intelligenza Artificiale Qwen e Afferma che Supera DeepSeek-V3

Siamo felici che ti sia piaciuto il nostro lavoro!

Lascia un commento