Le 12 mars, selon l'actualité exclusive de « Moby Lab », DeepSeek V4 et le nouveau modèle de Hunyuan dirigé par Yao Shunyu devraient tous deux sortir le mois prochain (avril 2026).Le 11 mars, OpenRouter a lancé deux nouveaux modèles mystérieux : Healer Alpha et Hunter Alpha.


Selon la page OpenRouter, Healer Alpha est décrit comme ayant une vision,audience, modèle entièrement modal de pointe de capacités de raisonnement et d'action ;


La communauté l'a donc rapidement lié à une nouvelle génération de modèles nationaux qui n'ont pas encore été commercialisés, capturant prétendument "le mot d'invite du système exigeant le strict respect des lois et réglementations chinoises".


https://x.com/chetaslua/status/2031983459057672455

Et le 12 mars, selon l'actualité exclusive de "Moby Dick Labs" (Exclusif | Liang Wenfeng apportera DeepSeek V4 pour frapper Yao Shunyu) :

DeepSeek V4 sera officiellement lancé en avril.

En tant que grand modèle multimodal que Liang Wenfeng a perfectionné depuis longtemps, DeepSeek V4 améliorera non seulement ses capacités de codage, mais réalisera également des percées dans la mémoire à long terme.

Cette orientation est fondamentalement cohérente avec les recherches publiques menées par l’équipe DeepSeek ces derniers mois.

En janvier 2026, Liang Wenfeng a proposé le mécanisme de « mémoire conditionnelle » dans son article signé « Mémoire conditionnelle via une recherche évolutive » ;

« mHC : Manifold-Constrained Hyper-Connections » en décembre 2025 continue de souligner l'optimisation de l'architecture sous-jacente.

Les deux articles tentent de résoudre les goulots d'étranglement de Transformer en termes de mémoire, de stabilité de la formation et de contexte long.

Selon les nouvelles exclusives de "Moby Lab" (Exclusif | Liang Wenfeng apportera DeepSeek V4 pour frapper Yao Shunyu) :

Le travail principal de Liang Wenfeng au cours des six derniers mois a été de combler les lacunes de DeepSeek en matière de traitement de contenu visuel et de recherche par IA.

Afin de renforcer les capacités de recherche de l'IA, DeepSeek a coopéré avec Baidu dès l'année dernière.

La direction d'itération clé que Liang Wenfeng a définie pour DeepSeek V4 cette fois est la capacité de mémoire à long terme.

DeepSeek V4 sera également profondément adapté aux puces nationales et devrait devenir le premier grand modèle à fonctionner entièrement sur l'écosystème de puissance de calcul national.

Un autre fait qui a été publiquement vérifié est que le volume des produits DeepSeek a augmenté les attentes du marché.

Depuis le lancement de l'application DeepSeek jusqu'au 9 février 2025, les téléchargements cumulés ont dépassé 110 millions de fois et le nombre d'utilisateurs actifs hebdomadaires a atteint un maximum de près de 97 millions.

Le nouveau modèle Hunyuan de Yao Shunyu

Sortie également prévue en avril

Outre DeepSeek, Tencent prépare également de nouvelles actions pour avril.

Yao Shunyu a été scientifique en chef de l'IA du bureau général de Tencent en décembre 2025, et est également chef du département AI Infra et du département des grands modèles linguistiques ;


En février 2026, CL-bench, un article signé par Yao Shunyu, a été publié, proposant un nouveau référentiel d'évaluation pour « l'apprentissage du contexte » et continuant à pousser les recherches de Tencent Hunyuan vers le contexte long et la disponibilité des agents.


https://arxiv.org/abs/2602.03587

Selon les nouvelles exclusives de "Moby Lab" (Exclusif | Liang Wenfeng apportera DeepSeek V4 pour frapper Yao Shunyu) :

Yao Shunyu lancera également un nouveau modèle Hunyuan en avril, avec une échelle d'environ 30 milliards de paramètres.

Dès le début de l’année 2025, Yao Shunyu avait accepté l’invitation à retourner en Chine ; en fait, la préparation de Yao Shunyu pour le nouveau modèle avait déjà commencé, pas moins de six mois après l'annonce officielle.

Fin janvier de cette année, "LatePost" a également annoncé la nouvelle (record complet de la guerre de l'IA entre Byte, Alibaba et Tencent : une guerre qui affecte le destin) :

Au sein de Tencent, Yao Shunyu a demandé à l'équipe de ne pas s'orienter vers le classement.


À en juger par la trajectoire publique, cette série de mises à jour en avril ne sera pas seulement une compétition de paramètres.

Les recherches connues de DeepSeek s'étendent à la mémoire à long terme, à la multimodalité et à l'architecture sous-jacente, tandis que Tencent Hunyuan accélère ses cours de rattrapage sur l'apprentissage contextuel et l'évaluation de tâches réelles.

Les deux parcours sont très différents, mais ils tentent tous deux de répondre à la même question : comment réellement entrer dans l’environnement de production pour la prochaine étape des grands modèles.