Microsoft a récemment annoncé que son premier lot de puces d'IA auto-développées « Maia 200 » avait été officiellement mis en service dans un centre de données et prévoyait d'étendre davantage son déploiement mondial dans les mois à venir. Cette puce est positionnée par Microsoft comme un « moteur puissant de raisonnement IA » pour les scénarios de raisonnement, et est principalement optimisée pour les charges de travail de haute intensité au niveau de la production telles que le raisonnement en ligne sur de grands modèles. Les indicateurs de performance publiés par Microsoft montrent que Maia 200 peut surpasser la dernière puce Trainium d'Amazon et le TPU de dernière génération de Google en termes de vitesse de traitement. L'objectif est de s'emparer de l'avantage technologique dans la concurrence pour les puces d'accélération de l'IA développées par les fabricants de cloud.

Un contexte important pour les puces d'IA auto-développées par le géant du cloud computing est le coût actuel élevé et l'offre restreinte des derniers GPU haut de gamme de fabricants tels que Nvidia. Ce goulet d’étranglement de l’approvisionnement sera encore difficile à réduire à court terme. Cependant, même s’il dispose de puces IA hautes performances développées par lui-même, Microsoft n’arrêtera pas d’acheter des puces auprès de Nvidia et d’AMD. Le PDG de Microsoft, Satya Nadella, a déclaré que la société entretenait un « excellent partenariat » avec Nvidia et AMD, et que les deux parties continuaient de promouvoir l'innovation dans leurs domaines respectifs. Selon lui, l'opinion du marché est souvent encline à comparer "qui est en avance", mais la véritable clé est de conserver une avance sur une longue période.

Nadella a également souligné que Microsoft a la capacité de s'intégrer verticalement, mais cela ne signifie pas que l'entreprise utilisera uniquement sa propre technologie de haut en bas et abandonnera complètement les solutions des partenaires écologiques. En d’autres termes, en plus des puces auto-développées, Microsoft s’appuiera toujours sur un portefeuille de matériel diversifié provenant de fournisseurs tels que Nvidia et AMD pour répondre à ses besoins croissants en matière de cloud computing en matière d’IA.

Selon l'accord de Microsoft, Maia 200 sera confié en priorité à l'équipe interne "Superintelligence" de l'entreprise. L'équipe, dirigée par Mustafa Suleiman, ancien cofondateur de Google DeepMind, est chargée de créer une nouvelle génération de grands modèles de pointe pour Microsoft. Il est généralement admis que l’investissement de Microsoft dans la création de ses propres modèles de pointe vise à réduire dans une certaine mesure sa dépendance à l’égard de fournisseurs de modèles tiers tels qu’OpenAI et Anthropic à l’avenir. Suleiman publié sur la plateforme sociale

Dans le même temps, Maia 200 prendra également en charge les modèles OpenAI exécutés sur la plate-forme cloud Microsoft Azure, offrant ainsi aux clients du cloud davantage d'options de puissance de calcul en matière d'IA. Cependant, les retours de toutes les parties montrent que l'obtention des ressources matérielles d'IA les plus avancées reste un problème courant auquel est confronté l'ensemble du secteur. Cette situation tendue affecte non seulement les clients payants, mais affecte également les équipes internes de R&D en IA des fournisseurs de cloud. Dans un tel environnement d'approvisionnement, Microsoft accélère d'une part la mise en œuvre de puces d'accélération de l'IA auto-développées et, d'autre part, continue d'augmenter ses achats auprès de NVIDIA et d'AMD pour répondre aux doubles besoins de son infrastructure d'IA en termes d'expansion d'échelle et d'optimisation des performances.