Récemment, DeepSeek a annoncé qu'il ajusterait les prix des API à la mi-juillet, doublant ainsi le prix des appels de 9h00 à 12h00 et de 14h00 à 18h00 en semaine. Le prix de sortie du modèle V4-Pro est passé de 6 yuans à 12 yuans par million de jetons. Dans le même temps, les nouveaux prix de l'électricité industrielle et commerciale selon l'heure de consommation de la province du Zhejiang sont officiellement entrés en vigueur le 1er juillet, la période de 16h00 à 23h00 étant désignée comme période de pointe, et une période de « pointe » supplémentaire de 18h00 à 22h00 en été et en hiver, le rapport entre les prix de pointe et de vallée s'élargissant pour atteindre 2,05 à 0,2.

Une société d'IA a doublé le prix d'appel au cours de la journée et un réseau électrique provincial a été désigné après 16 heures. comme une « période d'électricité coûteuse ». Les deux secteurs ont utilisé la même logique pour ajuster les prix au cours du même mois : tous deux se sont appuyés sur les prix pour écarter la demande de pointe. DeepSeek gère la distribution temporelle de la puissance de calcul, et Zhejiang gère la distribution temporelle de l'électricité.
La répartition temporelle de la puissance de calcul est essentiellement la répartition temporelle de l'électricité.
La « facture d’électricité » d’AI commence à devenir chère
Jetons d’abord un coup d’œil aux factures mondiales.
Selon les données de Gartner, la consommation mondiale d'électricité des centres de données atteindra 565 TWh en 2026, soit une augmentation nette de 118 TWh par rapport aux 447 TWh de 2025. L'augmentation annuelle de 118 TWh équivaut presque à la consommation électrique annuelle des Pays-Bas. Parmi eux, la consommation électrique des serveurs optimisés pour l’IA est passée de 95 TWh à 175 TWh, soit une augmentation de 84 %. D’ici 2027, la consommation électrique des serveurs IA dépassera officiellement celle des serveurs traditionnels.
Le jugement du directeur de recherche de Gartner, Linglan Wang, est le suivant : « La puissance de calcul de l’IA d’aujourd’hui est limitée par l’alimentation électrique. »
Nadella, PDG de Microsoft, a déclaré dans le podcast : "Le plus gros problème auquel nous sommes confrontés actuellement n'est plus un excédent de ressources informatiques, mais la possibilité d'installer rapidement de l'énergie là où se trouvent des installations de données. Si nous ne pouvons pas le faire, nous pourrions avoir un tas de puces qui traînent dans l'entrepôt mais ne sont pas branchées."
La consommation électrique d'un serveur GPU est 3 à 5 fois supérieure à celle d'un serveur traditionnel, et la consommation électrique d'un seul GPU à architecture NVIDIA Blackwell est de 1 kW, soit 40 % de plus que les 700 W de la génération précédente Hopper. Le centre de données « Stargate » construit par OpenAI au Texas a une demande de puissance maximale de 1,4 GW et déploie plus de 400 000 GPU. Quel est le concept de 1,4 GW ? Assez pour une petite ville.
Le résultat est qu’en fin de compte, les sociétés d’IA dépensent des milliards pour acheter des puces, pour finalement découvrir que la puissance n’est peut-être pas suffisante.
La tarification de pointe et de vallée de DeepSeek est essentiellement la même opération dans le secteur de l'électricité : elle est plus chère pendant la journée et moins chère la nuit, en utilisant les prix pour diriger la demande vers les périodes creuses. En fait, DeepSeek a déplacé les règles du réseau électrique vers le marché de l’énergie de calcul.
Le prix de sortie du modèle V4-Pro est de 6 yuans par million de jetons pendant les périodes de pointe et de 12 yuans par million de jetons pendant les périodes de pointe. Le prix d'entrée des accès au cache est passé de 0,025 yuan à 0,05 yuan. En mai de cette année, DeepSeek a baissé définitivement son prix de 75 %, déclenchant une guerre des prix pour les gros modèles. Il y a un mois, nous facturions encore un « prix plancher », mais maintenant nous facturons un « supplément de pointe ».
Pourquoi ça tourne si vite ? Le goulot d’étranglement du côté de l’offre de puissance de calcul est plus important que prévu. Les données de surveillance publique de l'industrie montrent que la demande de puissance de calcul a augmenté plusieurs fois au cours de l'année écoulée, tandis que le taux d'expansion de l'offre est loin de suivre, l'écart entre l'offre et la demande étant d'environ la moitié. Tencent Cloud a augmenté de 5 % en avril, Alibaba Cloud a augmenté de 5 % à 34 % en mars, Baidu Smart Cloud a augmenté de 5 % à 30 %, AWS a augmenté de 15 % et certains services Google Cloud ont augmenté jusqu'à 100 % en mai. Augmenter les prix n’est pas une stratégie concurrentielle, c’est parce que l’offre ne peut vraiment pas la supporter.
Les prix de pointe et de vallée de DeepSeek montrent que son cluster GPU, comme le réseau électrique, a connu des pics de congestion.
Le Zhejiang a désigné la période après 16 heures. comme « période d'électricité coûteuse ».A quoi ça sert ?
La nouvelle version des prix de l'électricité industrielle et commerciale selon l'heure de consommation dans la province du Zhejiang, entrée en vigueur le 1er juillet, réduit le prix de l'électricité tout au long de la journée en cinq niveaux : pointe, pointe, section plate, creux et vallée profonde. Le rapport est de 2,05 à 1,85 à 1 à 0,4 à 0,2. Les sommets sont 10 fois plus chers que les vallées profondes. Les heures de pointe initiales du matin ont été supprimées et la plupart des heures de la journée ont été modifiées en tarifs forfaitaires. Toutes les heures de pointe sont de 16h00 à 23h00, et une pointe supplémentaire est de 18h00 à 22h00 en été comme en hiver.
Ces dernières années, la capacité photovoltaïque installée du Zhejiang s'est développée. La production d'énergie photovoltaïque est importante à midi et l'électricité est bon marché, voire excédentaire. Mais le soir, la production photovoltaïque tombe à zéro. Rentrer à la maison après le travail, allumer le climatiseur, cuisiner et recharger sont tous entassés et la charge sur le réseau électrique augmente fortement. C'est ce que l'industrie électrique appelle la « courbe du canard » : il y a trop d'électricité à utiliser pendant la journée et trop chère à utiliser la nuit.
L’ajustement du Zhejiang consiste à permettre aux usines et aux centres de données de déplacer le travail à midi. Le document mentionne que si une entreprise sidérurgique ayant une consommation annuelle d'électricité d'un milliard de kilowattheures transfère 10 % de sa consommation électrique de pointe vers les périodes creuses, elle peut économiser plus de 20 millions de yuans sur ses factures d'électricité chaque année, ce qui est suffisant pour construire un système de stockage d'énergie.
Le document mentionne également clairement que des secteurs tels que la logistique d'entreposage et les centres de données dotés de « charges stables et d'un grand espace réglable » peuvent pleinement profiter des dividendes des bas prix de l'électricité. En déplaçant les tâches informatiques à midi ou tard dans la nuit, vous pouvez économiser beaucoup sur vos factures d'électricité.
DeepSeek gère la distribution temporelle de la puissance de calcul, et Zhejiang gère la distribution temporelle de l'électricité. La répartition temporelle de la puissance de calcul est essentiellement la répartition temporelle de l’électricité : derrière chaque jeton se trouve l’électricité.
Selon les données du Gartner, la consommation électrique des serveurs optimisés pour l'IA a augmenté de 84 % en un an. Plus la demande de puissance de calcul est élevée, plus la consommation d’énergie est importante. Plus l’approvisionnement en électricité est restreint, plus la structure des coûts de la puissance de calcul ressemble à l’électricité.
Le rapport d'activité du gouvernement 2026 inclut pour la première fois « l'informatique et la collaboration informatique », révélant le plan de conception de haut niveau du pays en matière de puissance de calcul. Le centre de calcul et le réseau électrique doivent être planifiés ensemble. La puissance de calcul suivra la puissance et la répartition de la puissance dépend de la puissance de calcul. Ce n’est pas une vision, c’est une réalité qui s’impose. Gartner prévoit que la consommation électrique des centres de données dépassera 1 200 TWh d’ici 2030 et que l’alimentation électrique du réseau ne sera pas en mesure de répondre à la demande. Si la puissance de calcul et l’électricité ne sont pas liées au niveau de la planification, les choses seront plus difficiles par la suite.
Après le déjeuner libre,Commençons par calculer les détails
Bien que DeepSeek ait ajusté le prix de l'API, le prix pendant les périodes de pointe est en réalité exactement le même que celui après la réduction permanente du prix en mai. DeepSeek n'a pas "augmenté le prix", il a simplement ajouté un supplément pour les appels de jour.
Mais pour la plupart des développeurs, la journée est le temps de travail. De 9 heures à 12 heures et de 14 heures à 18 heures sont les heures de grande écoute pour écrire du code, ajuster les interfaces et exécuter des tests. Doubler le prix pendant cette période équivaut à ajouter davantage aux coûts quotidiens de la plupart des gens.
Foresight Energy comprend que dans ces conditions, le coût des applications interactives en temps réel peut augmenter et que les tâches informatiques hors ligne ne peuvent être déplacées que la nuit. Dans le passé, des centaines de milliers de petites équipes utilisaient des API presque gratuites pour vérifier les prototypes, et le coût était proche de zéro. Après la tarification de pointe et de vallée, si le modèle commercial repose sur des appels en temps réel, tels que le service client, la recherche et la complétion de code, la structure des coûts devra être recalculée.
Le rapport d'OpenRouter montre que l'écart entre les modèles open source et fermé est resté stable entre trois et six mois au cours des 18 derniers mois. La rentabilité du modèle open source engloutit le marché des API fermées. Si DeepSeek continue de s’engager dans une guerre des prix, il ne pourra pas réaliser une activité en boucle fermée. L’augmentation des prix n’est pas « plus d’argent », c’est le règlement après « plus d’argent ».
L’ajustement des prix de l’électricité dans le Zhejiang et les prix de pointe et de vallée de DeepSeek ont eu lieu la même semaine. L’un est en charge de l’électricité et l’autre de la puissance de calcul. La puissance de calcul devient une nouvelle façon d’utiliser l’électricité – et non les climatiseurs, les usines ou les véhicules électriques. Il s'agit du cluster GPU qui rugit tard dans la nuit, des jetons circulant entre les serveurs et d'un kilowattheure d'électricité brûlant derrière chaque morceau de code.
Gartner affirme que la puissance de calcul de l'IA est limitée par l'alimentation électrique. Nadella a déclaré que la puce pourrait ne pas se brancher. DeepSeek a déclaré que les appels pendant la journée coûteraient plus cher. Zhejiang a déclaré que vous deviez payer un supplément pour utiliser l'électricité la nuit. Ensemble, ces voix vont dans la même direction : la puissance de calcul n’est plus une question de « vous pouvez en avoir autant que vous voulez ». Cela a des coûts, des goulots d’étranglement, des hauts et des bas, cela nécessite un calendrier, cela nécessite une planification.
Le « repas gratuit » de l'industrie de l'IA se transforme en une facture d'électricité qui nécessite un calcul minutieux.