Alibaba Lancia il Nuovo Modello di Intelligenza Artificiale Qwen e Afferma che Supera DeepSeek-V3
Il gigante cinese Alibaba ha rilasciato l’ultima versione del suo modello AI di punta, Qwen, questo mercoledì. L’azienda sostiene che può funzionare meglio del popolare DeepSeek-V3.
Hai fretta? Ecco i Fatti Essenziali!
- Alibaba ha rilasciato il suo ultimo modello di ragionamento, Qwen 2.5-Max, questo mercoledì.
- Il gigante cinese sostiene che supera modelli popolari come DeepSeek-V3, GPT-4o, e Llama-3.1-405B.
- L’azienda ha anche lanciato Qwen2.5-VL questa settimana, un modello di intelligenza artificiale in grado di elaborare immagini e agire come un agente AI utilizzando computer e cellulari per svolgere compiti.
Secondo Reuters, Alibaba ha lanciato il nuovo Qwen 2.5-Max, come ha denominato il nuovo modello di ragionamento, proprio durante le festività del Capodanno Lunare in Cina, per unirsi ai massicci sviluppi di AI degli ultimi giorni e aggiungere competizione domestica.
Lunedì, DeepSeek ha raggiunto il primo posto sull’App Store di Apple negli Stati Uniti, superando ChatGPT, preoccupando altre aziende nel settore dell’IA e allarmando gli investitori: le azioni Nvidia sono scese del 17% in un solo giorno.
Ora, Alibaba ha annunciato le ultime versioni del suo modello Qwen: ha rilasciato 100 modelli di IA open-source per la suite Qwen a settembre dello scorso anno, promettendo risultati migliori rispetto ai popolari modelli di frontiera.
“Qwen 2.5-Max supera (…) quasi su tutti i fronti GPT-4o, DeepSeek-V3 e Llama-3.1-405B,” ha scritto l’azienda sul suo account WeChat ufficiale.
La nuova API del modello di ragionamento Qwen 2.5-Max è disponibile attraverso il cloud di Alibaba e gli utenti possono anche testare il modello sulla sua pagina di chat.
“Stiamo sviluppando Qwen2.5-Max, un modello MoE su larga scala che è stato pre-addestrato su oltre 20 trilioni di token e successivamente post-addestrato con metodologie curate di Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF)”, ha scritto il Team Qwen su Github.
Il gigante cinese ha anche rilasciato Qwen2.5-VL lunedì, una serie di modelli AI multimodali che possono anche elaborare immagini e accedere a cellulari e computer per eseguire compiti. OpenAI ha annunciato una caratteristica simile, Operator, permettendo a ChatGPT di eseguire compiti autonomamente prendendo il controllo del computer dell’utente.
Secondo il team di Alibaba, tutti i modelli Qwen superano le versioni simili di OpenAI, Microsoft, Google, Meta e DeepSeek.
Lascia un commento
Annulla