Dans une nouvelle vague d'intelligence artificielle représentée par « Agentic AI », l'architecture de mémoire unifiée (UMA) se réchauffe rapidement dans les domaines des PC et de l'informatique. AMD estime qu'il s'agit non seulement d'une opportunité importante, mais également d'une orientation clé pour l'architecture et la feuille de route futures des produits.

L'architecture de mémoire unifiée fait référence au couplage étroit du CPU, du GPU et de la mémoire sur la même puce système (SoC) pour former un grand pool de mémoire partagé, qui est alloué dynamiquement entre le CPU et le GPU par le système en fonction de la charge, au lieu du modèle de séparation traditionnel « mémoire système + mémoire vidéo indépendante ». Dans les charges de travail d'IA, en particulier l'inférence de grands modèles, cette conception peut réduire considérablement les goulots d'étranglement en matière de copie de données et de bande passante, de sorte qu'elle devient progressivement l'une des solutions principales pour les terminaux d'IA et les nouvelles formes de PC.
Avec le lancement de la série AMD Ryzen AI MAX et l'ajout de NVIDIA RTX Spark et d'autres produits, l'architecture de mémoire unifiée est devenue la pierre angulaire technique commune des plates-formes de terminaux IA. AMD a déclaré que sa solution Ryzen AI MAX de première génération peut fournir jusqu'à 128 Go de mémoire, dont jusqu'à 112 Go de mémoire système peuvent être divisés pour le GPU ; NVIDIA RTX Spark utilise également une idée similaire pour allouer dynamiquement de la mémoire entre le CPU et le GPU en fonction de la charge de travail, permettant à l'architecture de mémoire unifiée de couvrir un large éventail de scénarios d'application, de l'informatique générale à l'inférence d'IA.
Dans une interview avec les médias, il a été demandé au vice-président d'AMD, David McAfee, si davantage de produits utiliseraient les solutions UMA à l'avenir. Il a répondu que l'accent mis sur les systèmes de mémoire unifiée continuera de croître et que l'industrie explorera des « formes architecturales appropriées » autour de ces systèmes et continuera à itérer et à améliorer sur la base des plates-formes existantes. Il a souligné qu'il s'agit d'un nouveau type de charge de travail et d'espace informatique qui ouvrira « tout un monde de possibilités » pour AMD en matière de sélection de produits, de planification routière et de formes de déploiement.
AMD a étendu sa réflexion sur la mémoire unifiée à ses produits de nouvelle génération, la série Ryzen AI MAX 400. Selon l'introduction officielle, cette génération de produits peut prendre en charge jusqu'à 192 Go de mémoire unifiée et allouer jusqu'à 160 Go au GPU, qui peut être utilisé pour exécuter localement des modèles de langage étendus (LLM) avec une échelle de paramètres de plus de 300 milliards de niveaux pour répondre aux demandes extrêmes de capacité de mémoire et de bande passante des flux de travail d'IA complexes et des charges de travail créatives haut de gamme.

Lors de la table ronde médiatique, un journaliste a en outre demandé s'il était possible de voir des processeurs UMA Ryzen pour les jeux à l'avenir, ou une conception similaire à "Strix Halo + 3D V-Cache / mémoire à large bande passante au niveau du package" pour améliorer davantage les capacités UMA grâce à une intégration plus étroite et une mémoire packagée à faible latence. McAfee a déclaré qu'il n'avait actuellement « aucune réponse spécifique », mais a réitéré que des plates-formes telles que Strix Halo entrent dans la même voie que Nvidia, ce qui signifie que la conception de systèmes autour de l'UMA bénéficiera de davantage d'investissements en ressources et d'exploration architecturale au cours des prochaines années.
Il convient de noter que lorsque McAfee a parlé d'UMA, il a mentionné non seulement les terminaux mobiles et IA, mais également les systèmes de bureau hautes performances. Il estime que l'amélioration continue des capacités de prise en charge de l'architecture de mémoire unifiée et l'adoption de cette architecture par des acteurs plus écologiques favoriseront l'évolution globale des ordinateurs de bureau hautes performances et des formes de systèmes unifiés, et remodèleront la compréhension de l'industrie du « PC hautes performances + mémoire unifiée ». Selon lui, l'architecture unifiée adoptée par des plates-formes telles que Halo reste la « forme correcte » de ce type de système, et les récentes versions connexes de Nvidia peuvent être considérées comme une « approbation » de cette voie architecturale.
McAfee a également souligné qu'avec l'essor du calcul agent, l'exécution de « très grands modèles » sur les points finaux via un pool de mémoire unifié devient l'une des propositions de valeur uniques de ces systèmes. Pour AMD, ce type de système unifié joue un double rôle dans le portefeuille global de produits : d'une part, il prend en charge l'IA de pointe et les charges de travail de grands modèles, et d'autre part, il peut également devenir la plate-forme de base pour les ordinateurs de bureau hautes performances et les postes de travail créatifs avancés.
D’un point de vue industriel, l’architecture de mémoire unifiée n’est plus une expérience de niche, mais est rapidement devenue un pilier fondamental des plates-formes informatiques de nouvelle génération. Alors que la demande d'Agentic AI pour des pools de mémoire partagée de grande capacité continue d'augmenter, des fabricants tels qu'AMD et NVIDIA ont parié conjointement sur l'UMA, ce qui signifie également que cette voie architecturale a reçu une forte approbation au niveau de l'industrie. La planification active d'AMD pour de nouvelles plates-formes telles que Ryzen AI MAX 400 et son attitude ouverte envers la future forme de plates-formes hautes performances telles que Strix Halo montrent qu'elle n'est encore que le point de départ du développement d'une architecture de mémoire unifiée.
Dans un système unifié où les frontières entre CPU, GPU et mémoire s'estompent progressivement, la plate-forme de nouvelle génération devrait réaliser des progrès simultanés en termes de performances, d'efficacité énergétique et de limites de capacités. Cela s’applique non seulement à l’IA et aux charges de travail de grands modèles, mais peut également être étendu aux jeux et aux domaines de bureau haut de gamme. Pour AMD, l'architecture de mémoire unifiée est en train de devenir l'un des fondements essentiels de la conception de son architecture de produits de nouvelle génération et de sa planification à moyen et long terme, et l'ensemble de l'écosystème vient d'entrer dans la première étape de cette voie.