Les données financières internes montrent que l'efficacité opérationnelle de l'intelligence artificielle d'OpenAI continue de s'améliorer

Alors qu’OpenAI négocie un cycle de financement sans précédent pouvant atteindre 100 milliards de dollars, l’entreprise est fière d’un certain nombre d’optimisations clés au niveau des opérations commerciales. Bien que le coût total de la puissance de calcul reste élevé en proportion du chiffre d'affaires, la société obtient des revenus plus élevés pour chaque cent des coûts d'exploitation du serveur investi dans le support de l'activité d'abonnement ChatGPT et dans la vente des droits d'utilisation du modèle aux entreprises clientes.

La marge de puissance de calcul d’OpenAI pour les utilisateurs payants – la part des revenus restant après déduction du coût de fonctionnement des modèles d’intelligence artificielle pour les utilisateurs payants – est passée d’environ 52 % à la fin de l’année dernière et d’environ 35 % en janvier 2024 à environ 70 % en octobre de cette année, selon une personne familière avec les finances de l’entreprise.

En revanche, la marge bénéficiaire de la puissance de calcul du concurrent Anthropic l’année dernière était d’environ 90 %, selon une analyse de ses données financières réalisée par The Information. L'analyse montre qu'Anthropic est en passe de porter cette marge à environ 53 % d'ici la fin de l'année, et ses prévisions les plus optimistes suggèrent qu'elle pourrait atteindre 68 % l'année prochaine.

Cependant, dans l'ensemble, les données prévisionnelles d'Anthropic montrent que si les coûts d'exploitation des modèles d'intelligence artificielle pour les utilisateurs non payants et le coût de la formation des modèles sont pris en compte, l'efficacité globale de fonctionnement des serveurs de l'entreprise dépassera celle d'OpenAI. OpenAI compte des centaines de millions d'utilisateurs de chatbots gratuits. À l’avenir, il faudra commercialiser ces utilisateurs par le biais de publicités ou de remises sur les achats pour combler cet écart d’efficacité. Le nombre d’utilisateurs gratuits du chatbot d’Anthropic est bien moindre.

Anthropic a estimé cet été que l’investissement total de l’entreprise dans la puissance de calcul pourrait atteindre 60 milliards de dollars entre 2025 et 2028, y compris le coût de la recherche et du développement de nouveaux modèles d’intelligence artificielle. Cette prévision ne prend pas en compte les récents accords de location de serveurs avec Google et Microsoft. Sur la même période, OpenAI prévoit de dépenser 220 milliards de dollars en serveurs.

L’énorme investissement d’OpenAI dans les serveurs reflète le jugement fondamental de la direction de l’entreprise : la pénurie de serveurs est le plus grand défi limitant le développement de l’entreprise et la voie vers l’intelligence artificielle générale. L'intelligence artificielle générale fait référence à l'intelligence artificielle qui a la capacité d'accomplir automatiquement la plupart des tâches à haute valeur économique.

"Sans une puissance de calcul suffisante, nous ne pouvons tout simplement pas faire progresser la recherche et le développement dans ce domaine. Nous sommes actuellement confrontés à un sérieux goulot d'étranglement en matière de puissance de calcul." Le PDG de la société, Sam Altman, a déclaré dans une interview en podcast publiée jeudi. "Si la puissance de calcul est doublée, je pense que les revenus actuels de l'entreprise peuvent également être doublés." Altman n’a pas donné davantage de détails à ce sujet.

Les investisseurs potentiels intéressés à investir dans OpenAI seront peut-être désireux de prêter attention à tout signe d'amélioration des marges bénéficiaires de l'entreprise liées aux utilisateurs payants, car l'amélioration de la marge bénéficiaire des packages payants devrait subventionner les coûts d'exploitation des utilisateurs gratuits. Malgré cela, la marge bénéficiaire de la puissance de calcul de 70 % reste bien inférieure au niveau de marge bénéficiaire similaire des sociétés de logiciels cotées en bourse : ces sociétés peuvent fournir des services aux nouveaux utilisateurs (y compris les utilisateurs gratuits) à un coût très faible.

OpenAI fait également face à un autre défi, son plus gros concurrent chatbot n’est autre que Google. Google utilise une unité de traitement tenseur auto-développée, une puce de serveur personnalisée, qui réduit efficacement les coûts d'exploitation ; tandis qu'OpenAI utilise des puces de serveur Nvidia coûteuses. Selon "The Information", les dirigeants d'OpenAI estiment que l'efficacité opérationnelle de l'intelligence artificielle de Google est bien supérieure à la sienne. Cela signifie que Google subira beaucoup moins de pression pour monétiser les utilisateurs gratuits.

Au début de cette année, OpenAI a donné la priorité à la réduction des coûts de fonctionnement des serveurs (c'est-à-dire les coûts d'inférence de modèle) des produits d'intelligence artificielle. Selon une personne proche du dossier, en février de cette année, après le lancement d'un nouveau modèle par DeepSeek, OpenAI a activé un mécanisme d'urgence interne « alerte rouge ». DeepSeek affirme que le coût de formation de son nouveau modèle est bien inférieur à celui des modèles propriétaires développés par des sociétés telles qu'OpenAI.

Une autre personne proche du dossier a déclaré que l'amélioration de la marge bénéficiaire de la puissance de calcul d'OpenAI est due à deux facteurs majeurs : premièrement, la baisse continue des coûts de location de la puissance de calcul tout au long de l'année, et deuxièmement, la société a optimisé et ajusté le modèle d'intelligence artificielle pour le rendre plus efficace. En outre, OpenAI a lancé des forfaits de services d'abonnement plus chers pour générer davantage de revenus auprès de certains groupes de clients.