Alors que l'engouement pour l'intelligence artificielle (IA) a déclenché une pénurie extrêmement grave de mémoire DDR5 dans le monde, le géant de la technologie Meta s'est récemment associé à des géants de l'industrie tels que TSMC et Micron pour développer avec succès une technologie de transition disruptive afin de garantir que la progression de la construction de son centre de données d'IA ne soit pas entravée.Lors d'un test inédit dans l'industrie, Meta a réussi à permettre à des serveurs d'IA de pointe qui ne prennent en charge que la mémoire DDR5 de manière native d'exécuter en douceur l'ancienne mémoire DDR4, ouvrant ainsi une nouvelle issue à la crise de la chaîne d'approvisionnement.

Alors que les grandes entreprises technologiques recherchent sans cesse la puissance de calcul de l’IA, la capacité de production mondiale de mémoire DDR5 et de mémoire à large bande passante (HBM) a été réduite à ses limites, entraînant même une diminution significative des expéditions sur le marché traditionnel des PC en raison de la flambée des coûts des composants. Pour Meta, qui travaille dur pour construire un cluster d’IA à grande échelle, la pénurie totale de DDR5 équivaut à étouffer l’expansion de sa puissance de calcul. Afin de briser ce goulot d'étranglement matériel, Meta, TSMC, Micron et Alchip ont lancé conjointement une recherche secrète visant à rendre la mémoire DDR4, bien fournie et peu coûteuse sur le marché, rétrocompatible avec la dernière architecture d'IA.

Les experts en technologie soulignent qu’il existe des obstacles physiques et électriques presque insurmontables à la réalisation de cette idée. Il existe des différences essentielles entre la DDR5 et la DDR4 dans la conception des broches, la tension de fonctionnement, l'architecture de gestion de l'alimentation (la DDR5 intègre la puce de gestion de l'alimentation PMIC sur la clé USB, tandis que la DDR4 reste sur la carte mère) et la configuration des canaux. Afin de combler cet écart intergénérationnel, l'équipe commune a développé un espaceur de conversion de fente spécial (Interposer) exploité par TSMC et fourni par Micron. Ce joint agit comme un « traducteur », non seulement s'adaptant physiquement aux slots de différentes générations, mais convertissant également les signaux du protocole DDR5 en logique de contrôle que la DDR4 peut reconnaître en temps réel au niveau inférieur, tout en résolvant avec succès le problème de correspondance des signaux de tension et d'horloge.

Au cours d'une série de tests de charge métier extrêmement stricts, ce système, surnommé le « Stitch Monster », a démontré une stabilité étonnante. Bien que le système souffre inévitablement d'une baisse de performance d'environ 30 % en termes de bande passante en raison des limitations matérielles inhérentes à la DDR4, ses performances de latence restent à un niveau extrêmement faible. Les ingénieurs internes de Meta ont révélé que face à la soif actuelle de puissance de calcul, une perte de performances de 30 % se situe tout à fait dans la fourchette acceptable. Plus important encore, cette solution permet à Meta de contourner la longue période d'attente pour la DDR5 et de faire fonctionner immédiatement les serveurs d'IA qui étaient inactifs en raison du manque de matériel, économisant ainsi des centaines de millions de dollars en coûts d'attente.

Les analystes du secteur lui ont fait l'éloge. Cette décision de Meta montre clairement qu'aujourd'hui, alors que la course aux armements en matière d'IA entre dans son paroxysme, les principaux opérateurs de centres de données hyperscale (Hyperscalers) brisent progressivement le cycle d'itération matérielle fixé par les géants des puces traditionnels et résolvent plutôt les goulots d'étranglement de la chaîne d'approvisionnement grâce à de solides capacités indépendantes de recherche, développement et de personnalisation. Même si cette approche consistant à « intégrer la DDR4 dans la plate-forme DDR5 » ne constitue peut-être qu'un expédient à court et moyen terme, à l'heure où l'on ignore encore où les prix mondiaux de la mémoire reviendront à la normale, elle constitue sans aucun doute un modèle d'auto-sauvetage inspirant pour l'ensemble de l'industrie des technologies passives.