OpenAI est devenu de plus en plus optimiste quant aux revenus attendus des consommateurs et des entreprises, augmentant considérablement ses prévisions de revenus pour les cinq prochaines années. Cependant, l'ombre qui plane sur ces prévisions est que les coûts des serveurs cloud continuent d'augmenter et que le taux de croissance a dépassé le taux de croissance des revenus.

Cette pression était particulièrement évidente l'année dernière : la marge bénéficiaire brute d'OpenAI est tombée à 33 % contre 40 % en 2024, loin de son propre objectif de 46 %. Son principal rival Anthropic a également récemment relevé ses prévisions de revenus, mais a déclaré en décembre qu'il prévoyait une marge brute de 40 % en 2025. Bien qu'il s'agisse d'une énorme amélioration par rapport à la marge brute de -94 % en 2024, elle reste 10 points de pourcentage inférieure à l'objectif précédent d'Anthropic.

Pour les deux entreprises, l’une des principales raisons est la montée en flèche des coûts d’inférence – le montant que les entreprises paient aux fournisseurs de cloud pour la puissance de calcul lorsque les utilisateurs interagissent avec des chatbots ou appellent des modèles via des API.

Les coûts d'inférence d'OpenAI ont quadruplé l'année dernière pour atteindre 8,4 milliards de dollars, contre 6,6 milliards de dollars prévus l'été dernier. La société a déclaré aux investisseurs potentiels qu'elle devait acquérir des ressources de serveur à un coût plus élevé en raison d'une demande plus élevée que prévu pour ses services.

Les fournisseurs de services cloud facturent la location de serveurs à la demande (c'est-à-dire des instances ponctuelles), ce qui est généralement beaucoup plus élevé que le prix réservé à l'avance.

Dans le même temps, les coûts d'inférence d'Anthropic devraient plus que tripler pour atteindre 2,7 milliards de dollars en 2025, soit également plus que ce que l'entreprise avait prévu précédemment, pour des raisons qui restent floues.

Il convient de noter que malgré l’augmentation du nombre de personnes utilisant le service, les marges bénéficiaires brutes des deux sociétés se sont détériorées. Le prix moyen de location de la puissance de calcul tout au long de l'année est en fait en baisse, et les deux sociétés affirment avoir trouvé des moyens de faire fonctionner de grands modèles plus efficacement.

L'une des raisons de la baisse des marges brutes d'OpenAI pourrait être le coût d'exécution de ChatGPT pour un grand nombre d'utilisateurs gratuits. Comme je l’ai signalé, seulement 5 % environ des 910 millions d’utilisateurs hebdomadaires d’OpenAI sont des clients payants. Les projections financières de l'entreprise montrent que près de la moitié de ses coûts totaux d'inférence l'année dernière, soit 3,9 milliards de dollars, ont été dépensés pour soutenir les utilisateurs gratuits, contre 4,5 milliards de dollars pour les utilisateurs payants.

Un autre facteur est le type d’IA que ces entreprises utilisent. L'année dernière, OpenAI a lancé le modèle de génération vidéo Sora, qui nécessite bien plus de puissance de calcul que les requêtes en texte brut. Le modèle d'inférence également lancé au même moment nécessite également plus de puissance de calcul pour générer des réponses que les grands modèles de langage traditionnels.

Selon des personnes proches du dossier, la société permet également aux utilisateurs d'essayer un certain nombre de nouvelles fonctionnalités gourmandes en calcul avant d'introduire des limites d'utilisation, notamment le modèle GPT‑4o, populaire pour générer des images de style Ghibli.

Il existe cependant des points positifs.

L'efficacité du service d'OpenAI pour les utilisateurs payants s'est considérablement améliorée : sa marge bénéficiaire brute sur la puissance de calcul (les revenus restant après l'exécution de modèles pour ces utilisateurs) a atteint environ 70 % en octobre, ce qui est supérieur à environ 52 % fin 2024 et à environ 35 % en janvier 2024.

OpenAI prévoit de générer davantage de revenus grâce aux utilisateurs gratuits, principalement sous forme de publicité et de commerce électronique, et d'inciter davantage d'utilisateurs gratuits à se convertir en abonnés. Par exemple, en janvier, la société a lancé un forfait d'abonnement ChatGPT financé par la publicité, au prix mondial d'environ 5 à 8 dollars par mois.

Cette année, OpenAI prévoit de consacrer environ 66 % de son total de 14,1 milliards de dollars en coûts d'inférence au service des clients payants. D’ici fin 2030, 94 % des quelque 85 milliards de dollars de coûts d’inférence devraient être utilisés pour soutenir les utilisateurs payants. Cette même année, sa marge brute devrait atteindre 67 %.

Néanmoins, les récentes performances financières d’OpenAI et d’Anthropic soulèvent la question de savoir s’ils pourront atteindre leur objectif de marges brutes supérieures à 60 % d’ici la fin de 2030 – un niveau qui serait aujourd’hui comparable à celui de certaines des plus grandes sociétés de logiciels cotées en bourse.

OpenAI et Anthropic ne semblent actuellement avoir aucune pression pour amener les investisseurs à supporter ces coûts. Mais en fin de compte, ils doivent prouver que les revenus commerciaux générés par les utilisateurs sont suffisants pour couvrir le coût de la fourniture des services qui leur sont fournis.