Récemment, Alibaba a ouvert trois nouveaux modèles de taille moyenne, dont Qwen3.5-35B-A3B, Qwen3.5-122B-A10B et Qwen3.5-27B. Basés sur l'innovation architecturale et les percées en matière de formation, les trois modèles open source Qianwen 3.5 ont tous établi de nouveaux sommets de performances pour les modèles de taille moyenne, ce qui a attiré l'attention du marché. Musk a commenté le modèle Qwen d'Alibaba, en disant "une densité de renseignement impressionnante".


Il est entendu que la « densité d'intelligence » fait référence au raisonnement logique, à la réserve de connaissances et aux capacités de traitement des tâches qu'un modèle peut afficher avec la même échelle de paramètres ou la même consommation d'énergie de calcul.

Le 2 mars, Alibaba Qianwen a annoncé l'open source de quatre séries de modèles Qwen3.5 de petite taille : Qwen3.5-0.8B/2B/4B/9B. Selon les responsables, cette série de modèles hérite des gènes puissants de la famille Qwen3.5, adopte une formation multimodale native et la dernière architecture de modèle, et présente d'excellentes performances pour répondre à différents besoins, allant des contraintes de ressources extrêmes aux applications légères hautes performances.