NVIDIA accélère le lancement de sa plateforme phare d'IA de nouvelle génération, Vera Rubin. Les dernières nouvelles montrent que la plate-forme commencera à être livrée aux principaux clients nord-américains de services cloud et d'IA dès juillet de cette année, et entrera en production de masse au second semestre 2026. Les rumeurs précédentes selon lesquelles Vera Rubin aurait des problèmes avec sa conception et ses spécifications ont maintenant été fondamentalement démenties par le nouveau calendrier de production et d'expédition.

Il y a quelques jours, des nouvelles circulaient dans l'industrie concernant d'éventuels ajustements voire problèmes dans la conception et les spécifications de Vera Rubin, décrites comme similaires aux troubles rencontrés par le serveur GPU Blackwell avant sa sortie. Cependant, en s'appuyant sur l'expérience accumulée dans la livraison de racks et de serveurs IA de nouvelle génération avec des partenaires de la chaîne d'approvisionnement, Nvidia a une fois de plus démontré sa capacité à résoudre rapidement les défauts techniques avant la production en série. Un rapport du "Economic Daily" de Taiwan citant des sources de la chaîne industrielle a souligné que Nvidia avait finalisé la version finale de production en série de Vera Rubin avec ses partenaires ODM et avait fixé un rythme d'introduction clair.

Selon ce rapport, Nvidia lancera la production d'essai de la plate-forme Vera Rubin en juin de cette année, puis à partir de juillet, le premier lot de serveurs sera expédié à plusieurs grands fournisseurs de services cloud et clients de centres de données IA en Amérique du Nord. La première liste de clients comprend Microsoft, Google, Amazon, Meta et Oracle. Nvidia mettra probablement en avant sa coopération approfondie avec ces géants du cloud autour de Vera Rubin lors du prochain discours d'ouverture du Computex 2026. Le rapport mentionne également que TSMC a lancé le processus 3 nm plus tôt cette année pour démarrer la production en série de puces Vera Rubin, tandis que des partenaires fondeurs tels que Foxconn, Quanta et Wistron déploieront pleinement la production de machines et de cadres complets à partir du second semestre de cette année et réaliseront des expéditions à grande échelle dès le troisième trimestre 2026.

Alors que la poussière retombe sur les spécifications de production finales, les déclarations précédentes selon lesquelles la plate-forme Vera Rubin pourrait subir d'importantes modifications de conception ou de spécifications sont considérées comme "incohérentes avec les faits ou basées sur des informations précoces qui ont été révisées par la suite". L'industrie estime que le coût de chaque rack de serveur Vera Rubin AI s'élève à environ 180 millions de dollars. Avec cette plate-forme, la pénétration potentielle de Nvidia sur le marché mondial des infrastructures d'IA devrait atteindre le niveau de 1 000 milliards de dollars. Cela augmentera non seulement considérablement les marges bénéficiaires, mais apportera également une nouvelle dynamique de croissance aux partenaires, notamment aux fournisseurs de stockage et de mémoire.

Autour de la plate-forme Vera Rubin, l'écologie de la puce et de la mémoire est mise à niveau simultanément : les fabricants partenaires prévoient d'introduire une nouvelle génération de mémoire HBM4 à large bande passante pour le GPU Rubin, et en même temps de fournir une solution SOCAMM2 LPDDR5X avec une capacité allant jusqu'à 256 Go côté CPU pour répondre aux demandes de plus en plus strictes en matière de bande passante et de capacité dans la formation et l'inférence de modèles à grande échelle. Au niveau de l'architecture matérielle, Vera Rubin est décrite comme une plateforme complexe composée de sept puces, supportées par une puissante pile logicielle. Il est considéré comme temporairement inégalé dans l'industrie. Nvidia a annoncé qu'en s'appuyant sur Vera Rubin, elle devrait augmenter sa puissance de calcul jusqu'à 40 millions de fois le niveau actuel au cours des dix prochaines années. À en juger par les premières avancées technologiques, l’industrie s’attend généralement à ce que cette plate-forme apporte une nouvelle série de sauts en avant dans la puissance de calcul de l’IA.

À en juger par le calendrier, Vera Rubin s'éloigne des rumeurs et de l'incertitude et entre dans la phase d'essai de fond, de production et d'expédition. Avec l'arrivée du premier lot de racks dans les centres de données des fournisseurs de services cloud nord-américains à partir de juillet et le lancement par les OEM taïwanais d'une production de masse au second semestre, Vera Rubin deviendra le poids central de NVIDIA dans la prochaine étape de la concurrence en matière d'infrastructures d'IA, et aura également un impact profond sur le paysage mondial du cloud computing et de l'industrie de l'IA.