Cas du curseur, Huang Renxun en tant qu'invité DeepSeek appartient désormais à Kimi

Le 20 mars, l'outil de programmation d'IA Cursor a publié le modèle auto-développé Composer 2, prétendant être le premier résultat de l'entreprise d'une « pré-formation continue combinée à un apprentissage par renforcement » sur un modèle de base. Le blog de sortie ne mentionnait pas l'origine du modèle de base, mais le libellé semblait indiquer qu'il avait été fabriqué par Cursor lui-même.

En moins de deux heures, un développeur nommé Fynn a intercepté le véritable identifiant du modèle de Composer 2, kimi-k2p5-rl-0317-s515-fast, lors du débogage de l'API Cursor. En le démontant, kimi-k2p5 pointe vers Kimi K2.5, rl est Reinforcement Learning, suivi de la date et du numéro de version.

Du Yulun, responsable de la pré-formation pour Dark Side of the Moon, a immédiatement tweeté, affirmant que l'équipe avait testé le tokenizer de Composer 2 et avait constaté qu'il était "complètement cohérent" avec le tokenizer de Kimi, ce qui a presque confirmé qu'"il s'agit d'un ajustement supplémentaire de notre modèle". Il a directement @Cursor co-fondateur Michael Truell, demandant pourquoi la licence n'a pas été respectée et pourquoi aucun frais n'a été payé. Le tweet a ensuite été supprimé.

Mais le feu brûlait déjà. Musk a répondu "Ouais, c'est Kimi 2.5" au tweet de Fynn, ce qui a directement fait de la question une recherche brûlante.

De « se mettre à l’abri » à « coopérer », le renversement n’a pris que quelques heures

Kimi K2.5 adopte une version modifiée de la licence MIT, qui exige clairement que les produits commerciaux dont le chiffre d'affaires mensuel dépasse 20 millions de dollars américains ou dont le nombre d'utilisateurs actifs mensuels dépasse 100 millions doivent porter « Kimi K2.5 » bien en évidence sur l'interface utilisateur. Le chiffre d’affaires annuel de Cursor s’élève à environ 2 milliards de dollars américains, dépassant ce seuil de plus de 8 fois.

Mais le jour même où l’opinion publique fermentait, l’intrigue s’inverse. Le compte officiel de Dark Side of the Moon @Kimi_Moonshot a publié un message, changeant son ton de questions en félicitations, disant "Nous sommes fiers de voir Kimi K2.5 fournir la base de Composer 2" et précisant que l'utilisation de Cursor a été autorisée par le fournisseur de services d'inférence Fireworks AI.

Le co-fondateur de Cursor, Aman Sanger, a expliqué plus tard que l'équipe avait évalué plusieurs modèles de base et que Kimi K2.5 était le "plus fort", puis sur cette base, une pré-formation supplémentaire et un apprentissage par renforcement d'une échelle 4 fois supérieure ont été effectués. Il a admis que ne pas mentionner le Kimi K2.5 dans le blog de lancement était une erreur.

Depuis le différend sur l'accord open source jusqu'à l'annonce officielle de la coopération, l'ensemble du processus a pris moins de 24 heures.

Pourquoi le curseur « fait des erreurs »

Ce n’est pas la première fois que Cursor dispose d’une « base en Chine ». Lorsque Composer 1 est sorti en novembre 2025, la communauté a spéculé, grâce à l'analyse du tokenizer, qu'il était hautement cohérent avec DeepSeek et qu'il produirait occasionnellement du chinois lors de l'inférence. Cursor n’a pas non plus répondu à ce moment-là.

De DeepSeek à Kimi, la base du modèle auto-développé par Cursor a radicalement changé, pointant tous vers le même fait. Le modèle de base doté des capacités de programmation les plus puissantes au monde provient de la communauté open source chinoise.

La réticence de Cursor à divulguer la source de la base cache un problème structurel plus profond. Cursor s'est toujours appuyé sur les modèles Anthropic et OpenAI pour piloter ses produits, mais ces deux sociétés créent désormais elles-mêmes des outils de programmation. Claude Code et Codex se répandent tous deux rapidement et de nombreux développeurs ont commencé à migrer. Le paradoxe auquel Cursor est confronté est qu'il doit s'appuyer sur des modèles haut de gamme pour répondre aux besoins des utilisateurs, mais les modélistes sont aussi ses concurrents directs. Sans sa propre base de modèle contrôlable, Cursor sera toujours contrôlé par d'autres.

De ce point de vue, il est presque inévitable de choisir le modèle open source chinois pour le peaufiner, qui est suffisamment solide mais ne deviendra pas son propre concurrent. Mais c'est aussi la raison pour laquelle Cursor ne veut pas parler publiquement. En 2025, ce sera la star la plus en vogue dans le domaine de la programmation de l’IA, avec une valorisation de 29,3 milliards de dollars. Le 12 mars, Bloomberg a annoncé que la valorisation cible du nouveau cycle de financement était d'environ 50 milliards de dollars. Admettre que le modèle de base provient de la communauté open source chinoise à ce stade n’est pas favorable au récit de valorisation.

Composer 2 a obtenu 61,3 points sur CursorBench conçu par Cursor, dépassant les 58,2 points de Claude Opus 4.6, mais après tout, il s'agit d'un bulletin de questions auto-administrées et d'auto-examen. D'un autre côté, si un produit peaufiné basé sur un modèle open source peut rivaliser avec des géants dans les tâches de programmation, cette question en elle-même pourrait être plus intéressante que l'erreur de divulgation de Cursor. Clément Delangue, co-fondateur de Hugging Face, a déclaré : « L'open source chinois est désormais la plus grande force qui façonne la pile technologique mondiale d'IA. »

Pour Dark Side of the Moon, le résultat de cette polémique a été presque un événement de marque parfait. De « partie lésée » à « partenaire », elle a acquis un sentiment de présence dans la communauté mondiale des développeurs. Au final, Cursor a personnellement confirmé que "Kimi K2.5 a été choisi parce que c'est le plus fort".

La "Semaine d'or" de Kimi

Il y a quelques jours, Kimi vient de vivre un cycle d'exposition extrêmement dense.

Le 16 mars, Dark Side of the Moon a publié un document technique purement architectural "Attention Residuals" (Attention Residuals), essayant de remplacer un composant de base de l'architecture Transformer qui est resté presque intact depuis ResNet en 2015, la connexion résiduelle. Dans le passé, la sortie et l'entrée de chaque couche étaient directement ajoutées et transmises sans distinction. L'équipe Kimi permet à chaque couche de « regarder en arrière » et de sélectionner dynamiquement les couches précédentes dont extraire les informations. Les expériences montrent que l'efficacité de la formation est améliorée d'environ 25 % et que le délai d'inférence est augmenté de moins de 2 %. L'un des co-auteurs de l'article est un lycéen de Shenzhen âgé de 17 ans, aux côtés des principaux chercheurs de Kimi, Su Jianlin et Zhang Yu.

La nuit où le journal a été publié, Musk a commenté X comme étant « un travail impressionnant de Kimi », et Kimi a officiellement répondu : « Votre fusée n'est pas mauvaise non plus. » Andrej Karpathy a déclaré : « Il semble que nous n'ayons pas compris littéralement l'expression « L'attention est tout ce dont vous avez besoin ». Jerry Tworek, ancien vice-président de l'apprentissage par renforcement d'OpenAI, appelle cela le début du « deep learning 2.0 ».

Le lendemain, 17 mars, Huang Renxun a mentionné à plusieurs reprises le modèle open source chinois dans le discours d'ouverture du GTC 2026. Kimi K2.5 a remplacé DeepSeek de l'année dernière et est devenu le modèle de référence utilisé par Huang Renxun pour démontrer l'importance du raisonnement au monde.

Le 18 mars, Yang Zhilin a directement prononcé un discours au sous-forum GTC. Il est le seul représentant d'une grande start-up indépendante sur la liste des invités, aux côtés du directeur de l'IA de Tesla et de l'architecte principal de DeepMind. La conférence était également remplie de monde. Il a systématiquement divulgué le parcours technique derrière Kimi K2.5 et a résumé l'évolution du modèle en trois dimensions : l'efficacité des jetons, le contexte long et le cluster d'agents.

Avant que DeepSeek ne devienne complètement populaire, l'équipe chinoise de modèles open source qui partageait le plus sur GTC était DeepSeek.

Papers, GTC et Cursor, trois choses ont été lancées l'une après l'autre en une semaine, et ces faits saillants éblouissants ont tous le sens de « changer les temps » avec DeepSeek : dans le passé, chaque article de DeepSeek était recherché et republié par la communauté technologique mondiale et les patrons des KOL. Dans le passé, GTC était presque une conférence de lancement « non officielle » de DeepSeek. Même Cursor a été "discrètement caché" par DeepSeek, et en un instant, tout s'est transformé en Kimi, la face cachée de la Lune.

Se mettre à la place de DeepSeek

Cela a fait comprendre à beaucoup de gens que Kimi occupe la position de DeepSeek dans la communauté mondiale de l'IA.

L'apparition de DeepSeek R1 début 2025 a remodelé la perception de l'ensemble du secteur, transformant « l'IA chinoise » d'un concept vague en un modèle spécifique et opérationnel. Mais depuis lors, DeepSeek est resté relativement silencieux. La V4/R2, que la communauté attendait depuis longtemps, n'est pas sortie. Les versions V3.1, V3.2 et autres ont été continuellement mises à jour, mais l'impact de « réécrire les règles dès le lancement du jeu » n'a pas été reproduit pour l'instant.

Kimi est entré par hasard dans cette période fenêtre.

Après la Fête du Printemps en 2025, Kimi Daily était sous pression. Dark Side of the Moon a supprimé une grande partie de son budget marketing et a commencé à travailler sur des modèles à huis clos. En juillet, Kimi K2 a été lancé avec une architecture MoE comportant des milliards de paramètres. Après la sortie de K2, le nombre de téléchargements le premier jour de Hugging Face a dépassé tous les autres modèles de la plateforme. Le co-fondateur d'Anthropic, Jack Clark, l'a évalué comme « le meilleur modèle de pondération open source au monde ».

Fin janvier 2026, K2.5 est sorti, avec une multimodalité native et une architecture de cluster d'agents, et a remporté le prix du meilleur open source au monde dans plusieurs évaluations d'agents. Après l'arrivée de l'engouement pour OpenClaw, Kimi Claw s'est rapidement mise en ligne. Selon les rapports, moins d'un mois après la sortie de K2.5, les revenus cumulés de Kimi au cours des 20 derniers jours ont dépassé l'ensemble de l'année 2025. Les données de Stripe montrent que les ordres de paiement des abonnés individuels de Kimi ont augmenté de 8 280 % d'un mois à l'autre en janvier.

Le rythme au niveau de la capitale s’accélère également. Le tour C de 500 millions de dollars fin 2025, avec une valorisation post-money de 4,3 milliards de dollars ; en février 2026, elle a dépassé 700 millions de dollars américains et la valorisation est passée à 10 milliards de dollars américains ; à la mi-mars, un nouveau tour de table d'un milliard de dollars est en cours et la valorisation a atteint 18 milliards de dollars. Les valeurs boursières de Zhipu et MiniMax, qui étaient cotées à la bourse de Hong Kong au cours de la même période, ont atteint respectivement le niveau de 330 milliards de dollars de Hong Kong et 380 milliards de dollars de Hong Kong à la mi-mars. Dark Side of the Moon n'est pas encore entré sur le marché secondaire. À en juger par la prime actuelle du secteur de l'IA, il n'y a pas beaucoup de place pour l'imagination après la cotation.

De cette façon, Kimi a utilisé la méthode de DeepSeek pour supprimer le halo de DeepSeek.

L'architecture de Kimi K2 est directement dérivée de DeepSeek V3. Le mécanisme d’attention MLA et le cadre hybride expert du MoE sont les premiers à être lancés ou vérifiés à grande échelle par DeepSeek. La montée en puissance de Kimi elle-même s’inscrit dans la continuité de l’influence de la technologie DeepSeek. La stratégie open source de DeepSeek est également plus approfondie, utilisant une licence pure MIT sans aucune restriction de seuil de revenus, ce qui lui permet d'accumuler un taux de pénétration très élevé dans l'écosystème mondial des développeurs. La licence MIT modifiée de Kimi comporte une couche supplémentaire de restrictions sur l'utilisation commerciale. Cet incident de curseur est un exemple.

Pendant la période relativement calme de DeepSeek, Kimi a repris le micro du « China AI Open Source Representative ». Qu’il s’agisse du podium de Jen-Hsun Huang, de la base de modèles de Cursor ou d’articles universitaires et de communautés de développeurs, Kimi remplit un espace narratif qui nécessite un contenu constamment nouveau.

De plus, ce que fait Kimi, ce n’est pas seulement produire des modèles. L’article Attention Residuals aborde la structure sous-jacente de l’apprentissage profond qui n’a pas substantiellement changé en dix ans. Il s'agit de la même approche que le MLA de DeepSeek dans le passé, qui tentent tous deux de redéfinir l'infrastructure de l'industrie.

L'histoire de l'IA open source en Chine est en train de passer d'un « DeepSeek » à une histoire dans laquelle de nouveaux acteurs émergent constamment pour supprimer le halo. Cela ressemble de plus en plus au rythme de la Silicon Valley. OpenAI est suivi de Google, Google est suivi d'Anthropic, puis le cycle continue.

Les modèles open source chinois reprennent tour à tour les délais des développeurs du monde entier. Alors que les capacités du modèle montent en flèche, le droit de parole n'est pas laissé de côté : lorsque le nouveau modèle de DeepSeek apparaîtra, l'attention de Kimi sera-t-elle détournée ; les nouveaux travaux de MiniMax, Qwen, Wisdom, Step et du nouveau venu tout aussi agressif Xiaomi leur retireront-ils soudainement leurs positions de leader ? Tout cela permet à cette alternance en spirale de se poursuivre, et c’est une bonne chose pour tous les participants chinois à l’IA.