Lors de la conférence NVIDIA GTC 2026 à San José,Intel a officiellement annoncé une coopération majeure et son processeur Xeon 6 (Xeon 6) deviendra le processeur hôte du système de serveur d'IA phare de nouvelle génération de NVIDIA, DGX Rubin NVL8.
Cette coopération va encore plus loin dans la coopération entre les deux sociétés sur l'architecture x86. Auparavant, sur la plate-forme basée sur le DGX B300 Blackwell, les deux parties ont établi une coopération sur l'architecture x86 utilisant le processeur Xeon 6776P. Cela signifie également qu'Intel a réussi à « adopter » NVIDIA et à s'implanter solidement dans le domaine des serveurs IA.
On rapporte que,DGX Rubin NVL8 est le système de serveur d'IA phare de nouvelle génération de NVIDIA, axé sur les scénarios d'application émergents tels que l'IA d'agent et les systèmes d'inférence. Dans ce système, le processeur hôte joue un rôle crucial et est principalement responsable de l'orchestration des tâches, de la gestion de la mémoire, de la planification et de la transmission des données vers l'accélérateur GPU.
À mesure que les charges de travail d'inférence d'IA se transforment progressivement en systèmes d'IA et d'inférence d'agent, ces tâches ont des exigences de plus en plus élevées en termes de performances monocœur et de bande passante mémoire.

Intel a déclaré que le processeur Xeon 6 pouvait simplement répondre à ces besoins grâce à des améliorations complètes de la capacité de mémoire, de la bande passante et des performances d'E/S. Le processeur est construit sur une plate-forme pouvant prendre en charge jusqu'à 8 To de mémoire système, ce qui, selon Intel, est particulièrement essentiel pour prendre en charge de grands modèles de langage alors que les caches clé-valeur continuent de s'étendre.
Grâce à la technologie MRDIMM, sa bande passante mémoire a été augmentée de 2,3 fois par rapport à la génération précédente, ce qui peut augmenter considérablement la vitesse de transmission des données vers l'accélérateur GPU.
Dans le même temps, le canal PCIe 5.0 permet des connexions accélératrices à large bande passante, et la fonction « Priority Core Turbo » d'Intel peut également concentrer de puissantes performances monothread sur les tâches d'orchestration, de planification et de transmission de données, garantissant que le GPU maintient une utilisation élevée même si la charge de travail devient plus complexe.
En termes de sécurité et de compatibilité, le processeur Xeon 6 peut assurer une protection de sécurité pour l'ensemble du chemin de données du CPU au GPU via Intel Trusted Domain Extensions (TDX). Parmi eux, la technologie TDX ajoutera des fonctions matérielles d'isolation et d'authentification via des tampons de rebond cryptés, qui peuvent simplement répondre aux besoins d'informatique confidentielle de bout en bout lorsque l'inférence de l'IA est déployée dans plusieurs scénarios tels que les centres de données, les nuages et les périphéries. De plus, Xeon 6 ajoute également la prise en charge du framework d'orchestration d'inférence NVIDIA Dynamo. Avec ce framework, les ressources CPU et GPU dans le même cluster peuvent être planifiées de manière hétérogène.
"Dans cette nouvelle ère, le rôle du processeur hôte est crucial." Jeff McVeigh, vice-président d'Intel et directeur général des projets stratégiques de centres de données, a déclaré que cela détermine directement l'efficacité de l'orchestration, la vitesse d'accès à la mémoire, la sécurité du modèle et le débit du système accéléré par GPU.
Intel a également mentionné que l'écosystème logiciel x86 mature du processeur Xeon, sa riche expérience de déploiement en entreprise et sa bonne compatibilité avec les piles logicielles d'IA existantes sont les principales raisons pour lesquelles NVIDIA l'a choisi.
Cette coopération entre les deux parties suit la même base architecturale que le DGX B300, permettant aux deux générations de produits Blackwell et Rubin d'assurer une continuité au niveau de la plate-forme, et devrait promouvoir la mise en œuvre à grande échelle de la technologie d'inférence d'IA dans les centres de données, les nuages, les périphéries et d'autres scénarios.
