Pendant les vacances du 1er mai qui viennent de passer, certains utilisateurs ont découvert que Doubao avait ajouté trois nouvelles options d'abonnement payant sur la page d'accueil de l'application App Store : la version standard est de 80 yuans par mois, la version améliorée est de 200 yuans par mois pour un abonnement mensuel continu et la version professionnelle est de 599 yuans par mois, avec des frais annuels de 6 088 yuans. À titre de comparaison, le coût annuel de ChatGPT Pro, qui appartient également au camp professionnel, est d'environ 2 400 $ US (environ 16 366 RMB).


Doubao a répondu plus tard que le service gratuit continuerait à être fourni et que la version payante était principalement destinée aux tâches complexes et aux scénarios de productivité, et que la solution était encore en phase de test. Au moment de mettre sous presse, on ne sait pas quand l’entrée payante sera officiellement lancée.
La réponse de l'industrie à cette décision n'est pas uniforme, mais toutes les parties ont remarqué un fait fondamental : Il s'agit de la tentative la plus chère à ce jour parmi les produits nationaux d'assistant d'IA universel de extrémité C.
Le coût de la puissance de calcul est l'incitation la plus intuitive. Selon les données précédemment publiées par Volcano Engine, en mars 2026, les appels quotidiens moyens de jetons du modèle Doubao ont dépassé 120 000 milliards, soit près du double de celui d'il y a trois mois et plus de 1 000 fois celui de mai 2024, lors de sa sortie. Selon des rapports tiers, les dépenses en capital de ByteDance en 2025 s'élèveront à environ 160 milliards de yuans, dont une grande partie sera consacrée à l'achat de puissance de calcul d'IA et à la construction d'infrastructures. Ce chiffre a été vérifié par recoupement dans les rapports de plusieurs maisons de courtage.
Dans une estimation des coûts diffusée dans la communauté technologique, la dépréciation matérielle d'une seule inférence représente environ 58 % et le coût de l'électricité est d'environ 29 %. 120 000 milliards de jetons quotidiens signifient d’énormes clusters matériels et des factures d’électricité en hausse. Cette structure de coûts rend les services gratuits à grande échelle non viables, et ce n’est presque qu’une question de temps.
Doubao n'est pas le premier joueur à faire des ajustements. En février 2026, Zhipu a augmenté le prix de son plan de codage GLM de plus de 30 % ; en mars, le prix de l'API GLM-5-Turbo a encore augmenté de 20 % ; en avril, GLM-5.1 a continué d'augmenter son prix de 10 %. Les fournisseurs de cloud annulent également les remises les unes après les autres. Tencent Cloud a annoncé qu'à partir du 9 mai 2026, les prix des produits et services liés à la puissance de calcul de l'IA augmenteront de 5 %.
DeepSeek a superposé la page d'application pour la première fois avant le lancement officiel du modèle V4, activant le mode rapide et le mode expert. À cette époque, certains initiés de l'industrie pensaient que cette décision était une préparation de DeepSeek à des ajustements du système d'abonnement payant ultérieur. Cependant, après le lancement officiel de la V4, elle a lancé des remises à grande échelle, mis en œuvre des remises à durée limitée sur les API et ajusté les règles de facturation pour les accès au cache.
Lorsque le plus grand pool d'utilisateurs gratuits commence à fixer un seuil de paiement, il ne s'agit plus d'une considération financière d'une certaine entreprise, mais d'un changement collectif dans le modèle de prestation.
Modèle payant, destiné à la productivité ?
Le système de paiement à trois niveaux lancé cette fois par Doubao ne commence pas par la conversation elle-même.
Selon les informations sur la page produit et les personnes proches de l'entreprise, les capacités de paiement sont concentrées dans des scénarios de consommation informatique élevée tels que la génération PPT, l'analyse approfondie des données et la production cinématographique et télévisuelle. Les fonctions telles que le dialogue de base et le polissage du texte restent gratuites.
La logique de cette conception réside dans la stratification des utilisateurs. Les données de QuestMobile montrent que les utilisateurs actifs mensuels de Doubao au premier trimestre 2026 seront d'environ 345 millions. Parmi une telle échelle d'utilisateurs, seule une petite partie des utilisateurs profonds consomme beaucoup de ressources informatiques, mais leur consommation de jetons est bien supérieure au niveau moyen. Les trois niveaux de tarification éliminent ces utilisateurs et créent une relation correspondante entre une consommation élevée et le paiement.
Dans le même temps, les fonctions de base gratuites sont conservées, de sorte que la grande majorité des utilisateurs légers ne soient pas concernés. Cela maintient l’échelle et la base de base de Doubao en tant qu’application au niveau national.
Du point de vue de la concurrence des produits, cet ajustement a une autre intention. Pendant longtemps, la version gratuite pour contrôler les coûts a fait de nombreux compromis dans la version du modèle, la longueur du contexte et la profondeur d'inférence, ce qui a conduit à certains retours du marché selon lesquels la limite supérieure des capacités de Doubao est limitée.
Auparavant, un praticien de l'IA d'un grand fabricant a déclaré à Phoenix.com que Doubao avait de nombreuses préoccupations lors des tests de modèles professionnels. "La difficulté la plus intuitive concerne les utilisateurs à grande échelle. Il est très difficile d'atteindre les performances ultimes et de prendre soin d'une énorme base d'utilisateurs."
Mais en fait, les performances du modèle Seed 2.0 Pro publié par ByteDance en février de cette année sont entrées au premier échelon dans plusieurs tests de référence ; le modèle de génération vidéo Seedance 2.0 a également directement comparé Sora d'OpenAI. L'un des objectifs de la version payante est de fournir un débouché de livraison pour ces capacités techniques sans contrainte de coût.
Un autre initié de l'industrie a déclaré à Phoenix Technology : « La priorité actuelle en matière de puissance de calcul dans Byte est sur Seedance, et la recherche la plus innovante doit céder la place à Seedance. »
Du côté des applications, la mission progressive de Doubao App a été réalisée. Depuis la guerre des applications d’IA lors de la Fête du Printemps de cette année, le DAU des concurrents les plus puissants de Doubao a considérablement diminué. Cependant, la montée en puissance de Doubao se poursuit sans relâche. Le dernier « 2025 AI Application Layer Development Core Report » de QuestMobile montre qu'en décembre 2025, l'échelle des utilisateurs actifs mensuels (MAU) des applications natives d'IA nationales a montré une différenciation progressive évidente. Parmi eux, Doubao et DeepSeek se sont classés premier et deuxième avec une échelle active mensuelle de 226 millions et 135 millions respectivement, formant un modèle de « duopole » et menant l'ensemble du secteur de manière discontinue.

Après mars, l'avantage DAU de Doubao s'est encore élargi, formant un écart d'avance. Un autre initié de l'industrie a déclaré que les données provenant de plates-formes tierces montrent que le pic de DAU de Doubao était d'environ 150 millions.
Mais dans le même temps, le rapport QuestMobile a souligné que le nombre de nouveaux utilisateurs d'applications d'IA au premier trimestre montrait une tendance d'extension bidirectionnelle de « naufrage + cheveux argentés ». L'utilisation mensuelle moyenne de Doubao est de 54,8 fois et le taux d'activité des utilisateurs est de 33,5 %. Les deux indicateurs sont nettement supérieurs à ceux de Qianwen et DeepSeek.
Les initiés de l'industrie mentionnés ci-dessus ont déclaré que l'application Doubao compte essentiellement de nombreux jeunes et cheveux argentés sur le marché. On est loin de la scène de productivité actuelle que Doubao veut piller. Le modèle de paiement est destiné à l’aider à priver la productivité.
La puissance de calcul explose en premier ?
Dans une certaine mesure, l'essai de paiement de Doubao signifie que le plus grand acteur gratuit du marché chinois a pris l'initiative de calculer le coût du Token. Le contexte reviendra à l’examen de l’économie des jetons.
Pour utiliser une métaphore populaire, le modèle gratuit d'applications d'IA des deux dernières années équivaut à une usine d'eau. Non seulement elle ne facture pas de frais d’eau, mais elle promet également un approvisionnement illimité en eau, et le coût est entièrement supporté par l’entreprise elle-même. Plus les jetons sont consommés, plus les liquidités de l'entreprise sont brûlées rapidement.
Mais l’essence de « l’économie des jetons » est la réévaluation par l’industrie de l’IA du modèle non durable « d’approvisionnement en eau gratuit » mentionné ci-dessus.
Lors de la conférence GTC de cette année, Huang Renxun a expliqué l'économie des jetons : le jeton est un nouveau produit. S’ils parviennent à obtenir plus de capacité, ils pourront générer plus de jetons et leurs revenus augmenteront.
Le président de Volcan Engine, Tan Dai, a également fait une déclaration similaire. La différence de prix du Token reflète essentiellement la différence de capacités. Le modèle de nouvelle génération a des capacités plus fortes et le coût d’un seul jeton peut augmenter, mais la valeur économique marginale créée sera également plus élevée.
On peut dire que la tentative de facturation de Doubao est une vérification de cette « économie de jetons » dans le plus grand pool d'utilisateurs de Chine.
Le marché des capitaux a répondu avec enthousiasme. Le 6 mai, premier jour de bourse après les vacances, le secteur des puces informatiques s'est collectivement renforcé. Haiguang Information (688041) a bondi en volume après l'ouverture et a atteint la limite quotidienne, sa valeur marchande totale dépassant autrefois 820 milliards de yuans. Cambrian (688256) a augmenté de plus de 9 %. Du côté des puces mémoire, de nombreuses actions comme Netac Technology, Longsys, Montage Technology et Demingli ont atteint leur limite journalière ou ont augmenté de plus de 10 %. L’indice Science and Technology Innovation 50 a fortement augmenté ce jour-là.
Dans ce cycle de croissance, une logique qui a été évoquée à plusieurs reprises est la suivante : lorsque les acteurs gratuits les plus importants du secteur commencent à établir des paywalls, cela signifie que la rareté de l'informatique IA est confirmée par le mécanisme des prix. Après cela, les attentes en matière de retour commercial sur le matériel, les services cloud et les couches de modèles seront toutes réévaluées en conséquence.
Le PDG d'AMD, Su Zifeng, a également déclaré intuitivement lors de la dernière conférence téléphonique sur le rapport financier que le marché des processeurs pour centres de données se développerait à un taux de croissance annuel de plus de 35 %, et que l'échelle dépasserait 120 milliards de dollars américains d'ici 2030, et qu'il pourrait y avoir des « pénuries de capacité extrêmement graves » à l'avenir. Le cours de l'action AMD a augmenté de plus de 16 % après les heures d'ouverture après la publication du rapport sur les résultats.
Doubao ne fait plus exception. L’ensemble de la filière IA entre dans la phase de retarification.
La superposition des événements ci-dessus dans le temps forme une chaîne de transmission de prix de l'extrémité logicielle à l'extrémité matérielle. Kaiyuan Securities a déclaré dans un rapport de recherche que le nombre d'appels de jetons nationaux continue de battre de nouveaux sommets, ce qui indique que la mise en œuvre industrielle des grands modèles nationaux d'IA est dans une phase d'avancement complet. Soochow Securities a en outre souligné qu'au premier trimestre 2026, le secteur de la location de puissance de calcul a connu des « changements quantitatifs » dans l'augmentation des commandes et des augmentations de prix, ainsi que des « changements qualitatifs » dans la mise à niveau du modèle commercial de partage de jetons, et a ainsi conclu que « 2026 est la première année où la puissance de calcul de l'IA nationale est pleinement exploitée ».
Les données de Volcano Engine montrent également que le nombre d'entreprises clientes dont l'utilisation cumulée des jetons dépasse un billion est passé d'environ 100 fin 2025 à 140.
De l’ajustement des prix d’une application au niveau national à l’essor collectif du secteur des puces, ces événements se sont produits indépendamment, mais ont formé un récit complet au sein de la même fenêtre. L’ère libre de l’industrie de l’IA connaît une contraction systématique. Sous l’eau, la relation entre l’offre et la demande de puissance de calcul subit des changements fondamentaux.