Meta a annoncé avoir adopté une nouvelle solution de réutilisation de la mémoire dans son infrastructure de centre de données. Grâce à la puce personnalisée « Vistara » auto-développée, il connectera les clés mémoire DDR4 des serveurs obsolètes à la nouvelle génération de serveurs qui s'appuient sur la mémoire DDR5, réalisant ainsi des économies de coûts et une réutilisation des ressources dans le contexte de prix mondiaux élevés du matériel et de pénuries de mémoire à long terme.
Les prix mondiaux de la mémoire et d’autres composants matériels ont continué d’augmenter au cours de la période écoulée. Même les grandes entreprises technologiques dotées d’un énorme pouvoir d’achat ont commencé à chercher des moyens plus efficaces de contrôler leurs dépenses d’investissement. L'approche de Meta est une tentative dans cet environnement.

Selon le cycle actuel d'exploitation et de maintenance de Meta, ses serveurs sont généralement remplacés tous les trois à cinq ans, mais la durée de vie réelle des modules de mémoire qu'ils contiennent peut généralement atteindre sept à dix ans. Cela a pour conséquence que lorsque le serveur est mis hors service, les modules de mémoire DDR4 encore intacts et utilisables doivent être mis hors ligne, ce qui entraîne beaucoup de gaspillage. Pour résoudre ce problème de « décalage de durée de vie », Meta a conçu la puce Vistara de manière à ce que l'ancienne mémoire puisse continuer à servir sur les nouvelles plates-formes, prolongeant ainsi le cycle de vie du matériel et optimisant le coût total de possession global.
Selon les informations techniques divulguées lors de la conférence industrielle ISCA, Vistara est une puce ASIC personnalisée qui connecte la mémoire DDR4 aux processeurs de nouvelle génération sur le bus PCIe Gen5 x16 via l'interface CXL 2.0/1.1. Dans des déploiements spécifiques, Meta supprime les clés mémoire DDR4 des serveurs mis hors service et les installe dans des unités spécialisées, connues en interne sous le nom de « MemServers ». Chaque MemServer est configuré avec environ 768 Go de mémoire DDR5 et environ 256 Go de mémoire DDR4 recyclée. Le système d'exploitation traite ces DDR4 comme des nœuds de mémoire supplémentaires. Lorsque les principales ressources DDR5 deviennent limitées, le système peut planifier et utiliser cette mémoire étendue.
Meta a déclaré que les solutions matérielles CXL disponibles dans le commerce ne peuvent pas répondre à cette demande, car les interfaces CXL courantes sur le marché embarquent généralement le contrôleur avec sa propre mémoire, ce qui rend difficile l'insertion de fragments DDR4 retirés de différentes sources. La conception de Vistara découple délibérément le contrôleur de la mémoire, permettant au contrôleur d'exister indépendamment, permettant à Meta d'insérer des ressources de mémoire DDR4 existantes selon les besoins pour obtenir une architecture de réutilisation de la mémoire très flexible.
Au niveau de l'échelle, Meta prévoit de déployer cette nouvelle architecture dans son infrastructure hyperscale composée de millions de serveurs, en particulier les centres de données qui soutiennent son activité d'intelligence artificielle. Alors que l'entreprise continue d'investir dans des domaines tels que l'IA générative, y compris le déploiement généralisé de nouveaux modèles dotés de capacités d'inférence et multimodales tels que Muse Spark, les besoins en mémoire et en puissance de calcul de ces centres de données d'IA continuent de croître. En réutilisant la mémoire DDR4, on s’attend à ce qu’elle améliore l’efficacité globale tout en garantissant les performances.
Il convient de noter que Meta ne s'appuiera pas entièrement sur la mémoire « récupérée », et que la DDR5 et d'autres matériels nouvellement achetés joueront toujours un rôle important dans son infrastructure. Cependant, dans les scénarios de centres de données à très grande échelle, même l'utilisation de modules de mémoire DDR4 réutilisés pour une partie de la charge de travail suffit à générer des économies considérables sur les opérations à long terme et à réduire le gaspillage de ressources causé par la mise au rebut du matériel.