Quick Technology a rapporté le 3 mai que la série de grands modèles DeepSeek V4 avait été officiellement lancée le 24 avril. Cela fait 15 mois depuis la mise à jour DeepSeek R1 de l'année dernière. Les performances du V4 ont également déclenché des discussions au pays et à l’étranger, et les Américains sont également très inquiets.

Il y a eu de nombreux tests pour évaluer la capacité de DeepSeek V4. Un précédent rapport de recherche organisé par 3 chercheurs seniors du Council on Foreign Relations a montré qu'il était en retard d'environ 7 mois par rapport aux grands modèles américains.

Désormais, le Center for Artificial Intelligence Standards and Innovation (CAISI), une filiale du National Institute of Standards and Technology (NIST), est également venu évaluer DeepSeek V4. Leur conclusion est que DeepSeek V4 est en retard d'environ 8 mois sur les États-Unis, ce qui est similaire à l'écart précédent.

Dans leurs résultats d'évaluation des capacités d'IA, DeepSeek V4 a marqué 800 points, et le plus puissant actuellement est GPT-5.5, avec un score de plus de 1200 points, GPT-5.4 et Opus 4.6 sont également au-dessus 1000 points.

Les performances globales de DeepSeek V4 sont similaires à celles de GPT-5 il y a 8 mois, mais les responsables de DeepSeek l'avaient précédemment considéré comme similaire à GPT-5.4 dans un rapport de publication.

Cependant, CAISI a également admis que DeepSeek V4 est le grand modèle d'IA le plus puissant en Chine qu'ils ont évalué, et qu'il est très performant dans neuf tests dans les cinq domaines des réseaux, du génie logiciel, des sciences naturelles, du raisonnement abstrait et des mathématiques.

Plus important encore, DeepSeek V4 est plus rentable. Même comparé au mini grand modèle GPT-5.4 le plus rentable aux États-Unis, DeepSeek V4 présente de meilleurs coûts de test dans 4 benchmarks sur 7, allant de 41 % à 53 % plus élevés.