Tard mardi, Microsoft Azure a partagé une image intéressante sur sa plateforme de médias sociaux
Microsoft est l'un des plus gros clients de Nvidia, et la société reçoit souvent des produits pour la première fois et les intègre dans le cloud computing et l'infrastructure de l'entreprise. Même Nvidia écoutera les commentaires d'entreprises comme Microsoft lors de la conception de futurs produits, en particulier des produits comme le système NVL36x2, désormais annulé. L'image ci-dessous montre un cluster massif qui divise grossièrement la zone de calcul en un tiers de l'ensemble du système et consacre les deux tiers du système au refroidissement liquide en boucle fermée.
L'ensemble du système utilise le réseau Infiniband, qui est la norme pour les systèmes accélérés par GPU en raison de sa faible latence de transfert de paquets. Bien que les détails du système soient un peu flous, nous pouvons voir qu'un système de refroidissement liquide en boucle fermée intégré permet au rack GPU de se présenter sous un format 1U pour une densité accrue.
Étant donné que ces systèmes seront intégrés au centre de données Microsoft Azure plus large, ils doivent être faciles à entretenir et à refroidir. Les centres de données Microsoft sont limités en termes de puissance et de chaleur qu'ils peuvent gérer. Ces types de systèmes sont donc généralement conçus pour répondre aux spécifications internes conçues par Microsoft. Bien sûr, il existe des systèmes plus denses en calcul, tels que le NVL72 de NVIDIA, mais les hyperscalers devraient généralement choisir d'autres solutions personnalisées adaptées aux spécifications de leur centre de données.
Enfin, Microsoft a noté que nous pouvons nous attendre à voir plus de détails et à en apprendre davantage sur le système d'IA alimenté par le GB200 lors de la prochaine conférence Microsoft Ignite en novembre.