DeepSeek redéfinit les limites de l'inclusion de grands modèles. Le 26 avril, DeepSeek a officiellement publié une annonce d'ajustement des prix de l'API. Le prix de tous les accès au cache d'entrée de l'API a été réduit à un dixième du prix initial. La mise à niveau V4‑Pro bénéficie d'une réduction de 25 % pour une durée limitée, et les accès au cache d'entrée d'un million de jetons sont aussi bas que 0,025 yuan, établissant un nouveau plus bas dans le prix des grands modèles dans le monde.

Selon l'annonce sur la page officielle de tarification de l'API de DeepSeek, cette réduction de prix couvre tous les modèles de la série V4, et les ajustements de base se concentrent sur les scénarios d'atteinte du cache d'entrée. Parmi eux, le prix du cache d'entrée DeepSeek-V4-Flash est passé de 0,2 yuan/million de jetons à 0,02 yuan/million de jetons.

面向企业级用户的DeepSeek-V4-Pro优惠力度更大,原价1元/百万Tokens的缓存输入降至0.1元,2026年5月5日前叠加2.5折限时特惠,实际仅0.025元/百万Tokens,缓存未命中输入从12元降至3元,输出从24元降至6元。


Source de l'image : site officiel de DeepSeek

DeepSeek a mentionné que les deux noms de modèles DeepSeek-Chat et DeepSeek-Reasoner seront obsolètes à l'avenir. Pour des raisons de compatibilité, les deux correspondent respectivement aux modes de non-réflexion et de réflexion de DeepSeek-V4-Flash.

对比调价前后不难发现,高频调用、长文本处理场景成本降幅超90%,RAG知识库、智能客服、文档分析等缓存命中率高的应用,可直接实现商用成本断崖式下跌,有助于打破AI规模化落地的成本枷锁。

La réduction significative du prix de DeepSeek est liée à la mise à niveau technologique de DeepSeek‑V4 et à la collaboration approfondie avec l'écosystème Shengteng.

Le 24 avril, la version préliminaire de DeepSeek‑V4 a été officiellement publiée. Les modèles open source Pro et Flash prennent en charge 1 million de contextes ultra-longs de jetons. L'architecture d'attention clairsemée auto-développée réduit considérablement la consommation de puissance de calcul d'inférence. La puissance de calcul à jeton unique de la version Pro ne représente que 27 % de celle de la V3.2 et le cache KV est réduit à 10 %, permettant ainsi une optimisation des coûts de bas en haut.

Les paramètres annoncés par DeepSeek montrent que DeepSeek‑V4‑Pro dispose de 49 B de paramètres d'activation et de 33 T de données de pré-entraînement, le positionnant comme un produit phare hautes performances ; DeepSeek‑V4‑Flash dispose de 13 B de paramètres d'activation et de 32 T de données de pré-entraînement, se concentrant sur la vitesse élevée et le faible coût.

Description du produit DeepSeek-V4-Pro Agent Agent Il est rapporté que DeepSeek-V4 est devenu le Modèle de codage agent utilisé par les employés internes de DeepSeek. Selon les retours d'évaluation, l'expérience d'utilisation est meilleure que celle de Sonnet 4.5, et la qualité de livraison est proche du mode sans réflexion de Claude Opus 4.6, mais il existe encore un certain écart avec le mode de réflexion Opus 4.6.

Dans l'évaluation des connaissances mondiales, DeepSeek-V4-Pro est nettement en avance sur les autres modèles open source et légèrement inférieur au meilleur modèle fermé Gemini-Pro-3.1. Dans l'évaluation des codes mathématiques, STEM et compétitifs, DeepSeek-V4-Pro a surpassé tous les modèles open source actuellement évalués publiquement et était comparable aux meilleurs modèles open source au monde.

Comparé à DeepSeek-V4-Pro, DeepSeek-V4-Flash est légèrement inférieur en termes de réserve mondiale de connaissances, mais il montre des capacités de raisonnement proches. Étant donné que les paramètres et les activations du modèle sont plus petits, V4-Flash peut fournir des services API plus rapides et plus économiques.

DeepSeek-V4 a également été le pionnier d'un nouveau mécanisme d'attention qui se compresse dans la dimension du jeton et le combine avec l'attention sparse DSA (DeepSeek Sparse Attention) pour obtenir des capacités de contexte long de pointe et réduire considérablement les besoins en mémoire informatique et graphique par rapport aux méthodes traditionnelles.

Ce qui est encore plus remarquable, c'est que toute la gamme de produits Ascend super node prend en charge les modèles de la série DeepSeek V4. Cela signifie également que DeepSeek émet davantage de signaux de localisation.

DeepSeek-V4 a mentionné dans un rapport technique : « Le schéma EP (Expert Parallel) à granularité fine a été vérifié sur deux plates-formes, NVIDIA GPU et Huawei Ascend NPU. Par rapport à la puissante ligne de base non fusionnée, le schéma a atteint une accélération de 1,50 à 1,73 fois dans les tâches de raisonnement général ;

DeepSeek a souligné qu'à mesure que la gamme complète de produits Ascend super node sera lancée par lots au cours du second semestre, le prix de la version Pro devrait être considérablement réduit.

DeepSeek-V4发布后,高盛发布分析报告指出,DeepSeek V4的核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间。对于纳入昇腾超节点,高盛认为DeepSeek的成本竞争力将进一步强化,为更广泛的应用落地创造条件。此外,在芯片持续收紧的背景下,中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书。

The Goldman Sachs report also cited news reports that Tencent and Alibaba are negotiating to invest in DeepSeek at a valuation of more than US$20 billion. Les dernières valeurs marchandes de Zhipu et MiniMax sont respectivement d'environ 53 milliards de dollars et 31 milliards de dollars. Cette transaction potentielle reflète la logique de la concurrence entre les géants pour les rares capacités d'IA de haut niveau.

Huatai Securities estime que le marché interprète facilement la V4 comme « une réduction des coûts et une réduction de la puissance de calcul et des besoins de stockage », mais le changement marginal le plus important est qu'après la diminution du coût du contexte long, la disponibilité d'agents complexes, l'analyse multidocuments, les tâches à long terme, l'apprentissage en ligne et d'autres scénarios augmenteront, et le nombre d'appels d'inférence et la fréquence d'accès au stockage devraient augmenter.