L'ère Vera Rubin de la plate-forme informatique IA de nouvelle génération de NVIDIA a officiellement commencé. Ceci est connu comme la plate-forme d’IA la plus rapide au monde. Il a été livré à un certain nombre de grands fournisseurs de services cloud pour tests et vérifications, ouvrant la voie à la prochaine étape du déploiement de la formation à grande échelle et de l'IA agentique.

Selon certaines informations, la plate-forme Vera Rubin est entrée dans la phase de production de masse et le premier lot de systèmes complets a été livré aux salles informatiques des principaux fournisseurs de cloud IA, notamment des sociétés telles qu'Oracle et CoreWeave. Auparavant, NVIDIA avait livré le mois dernier le premier lot de processeurs Vera à un certain nombre de grandes sociétés d'IA, jetant ainsi les bases de l'écologie de cette nouvelle plate-forme.

Mahesh Thiagarajan, vice-président exécutif d'Oracle Cloud Infrastructure, a publié pour la première fois des photos physiques du système de rack Vera Rubin NVL72 sur les plateformes sociales, montrant cet énorme cluster de rack composé de 72 GPU Rubin et de 36 processeurs Vera. Le positionnant officiellement comme la meilleure combinaison GPU et CPU actuelle pour les charges de travail d’IA, il vise à devenir une autre plate-forme marquante dans la gamme de produits d’IA de Nvidia après Grace Blackwell.

HKfY-0LaAAAeCwL.jpgHKfY-0ObYAATmc4.jpg

Thiagarajan a déclaré qu'Oracle est l'un des premiers fournisseurs de cloud à introduire le système Vera Rubin NVL72 dans le cloud et à effectuer des tests de vérification. Les deux parties travailleront en étroite collaboration pour fournir aux entreprises clientes une nouvelle génération de capacités informatiques accélérées dans des environnements cloud à grande échelle. À en juger par les photos prises sur place, l'armoire NVL72 est de grande taille et possède des structures de câblage et de refroidissement complexes, soulignant son orientation de conception pour les centres de données à très grande échelle.

Outre Oracle, la société de cloud computing CoreWeave a également annoncé l'achèvement de l'installation du premier système Vera Rubin NVL72 et a publié une vidéo complète de l'ensemble de la machine en cours de déchargement du véhicule de transport vers la salle informatique pour son déploiement. L'écran montre que l'installation d'une seule armoire nécessite le travail collaboratif de 3 à 4 ingénieurs. Cela reflète dans une certaine mesure les spécifications « niveau centre de données » du système en termes de volume et de poids. Cela implique également que des armoires similaires pourraient être déployées à l’avenir dans des centaines, voire des milliers de centres de données IA.

CoreWeave a également souligné qu'il était non seulement l'un des premiers fournisseurs de services cloud à introduire Vera Rubin NVL72, mais également le premier à réaliser le débogage et la vérification conjoints de la pile complète de logiciels et de matériel. À cette fin, la société a créé son propre système de refroidissement liquide défini par logiciel et des solutions de contrôle unifiées d'armoires, nommées respectivement Valvey et Racky, qui sont utilisées pour la gestion du refroidissement liquide et la planification unifiée de l'ensemble de la plate-forme Vera Rubin de l'armoire, et via « CoreWeave Mission Control » pour réaliser une surveillance opérationnelle au niveau du cluster d'armoires.

Dans la vision architecturale de « l'IA est un gâteau à cinq couches » proposée par Jensen Huang, PDG de NVIDIA, Vera Rubin NVL72 n'est qu'une couche de matériel. Derrière cela, il s'appuie également sur une infrastructure sophistiquée comprenant l'alimentation électrique, le refroidissement, l'interconnexion, le réseau, etc., ainsi que sur un support de pile logicielle construit sur de nombreuses années. Avec comme noyau CUDA et l'écosystème CUDA-X pour les charges de travail d'IA, NVIDIA intègre des logiciels et du matériel, ce qui rend difficile aux fabricants concurrents de rivaliser de front en termes de maturité écologique et d'adoption généralisée.

En termes de performances, les rapports indiquent que dans le scénario de formation du modèle Mix of Experts (MoE), la plate-forme Vera Rubin peut atteindre la même vitesse de formation que le système Blackwell de la génération précédente en utilisant seulement un quart du nombre de GPU, tandis que le coût par jeton dans la phase d'inférence peut être réduit à un dixième de celui de Blackwell. Cela signifie que lors du déploiement de modèles à grande échelle et de l'IA agentique au niveau de l'usine, Vera Rubin devrait apporter des avantages significatifs en termes de densité de puissance de calcul et d'efficacité énergétique, fournissant ainsi un soutien clé aux fournisseurs de cloud pour contrôler les coûts et étendre leur échelle.

Actuellement, la plate-forme Vera Rubin est entrée en production de masse et NVIDIA prévoit de lancer officiellement le premier lot de tâches d'exécution de production destinées aux clients au troisième trimestre de cette année. Alors que les principaux fournisseurs de services cloud tels qu'Oracle et CoreWeave prennent les devants pour finaliser le lancement et la vérification, le secteur s'attend généralement à ce que Vera Rubin devienne bientôt l'un des composants essentiels de la nouvelle génération d'infrastructure de centre de données d'IA, promouvant la mise en œuvre d'« usines d'IA agentique » et d'applications de grands modèles plus complexes.