Hier, Arm a annoncé des progrès significatifs dans son plan de « conception totale ». Lancé il y a un an, le programme vise à accélérer le développement de puces personnalisées pour les centres de données en favorisant la collaboration entre les partenaires industriels. L'écosystème s'est élargi et compte près de 30 entreprises participantes, avec les récents ajouts d'AlcorMicro, Egis, PUFSecurity et SEMIFIVE.
Un développement remarquable est qu’Arm, Samsung Foundry, AD Technology et Rebellions ont collaboré pour créer une plate-forme de puce CPU d’intelligence artificielle. La collaboration vise à fournir des solutions pour les charges de travail cloud, HPC et IA/ML, combinant les accélérateurs d’IA de Rebellions avec les puces informatiques d’AD Technology, mises en œuvre à l’aide de la technologie FET Gate-All-Around (GAA) 2 nm de Samsung Foundry.
La plate-forme devrait apporter des améliorations significatives de l'efficacité aux charges de travail d'intelligence artificielle générative, et on estime que pour un LLM comme Llama3.1 avec 405 milliards de paramètres, son efficacité sera 2 à 3 fois supérieure à celle des conceptions de processeurs standard.
L’approche d’Arm souligne l’importance du calcul CPU dans la prise en charge de la pile complète d’IA, y compris les technologies avancées telles que le prétraitement des données, l’orchestration et la génération d’augmentation de récupération (RAG). Le sous-système de calcul (CSS) de la société est conçu pour répondre à ces exigences, en fournissant une base permettant aux partenaires de créer diverses solutions de chipset.
Plusieurs sociétés, dont AlcorMicro et Alphawave, ont annoncé leur intention de développer des puces CSS pour diverses applications d'intelligence artificielle et de calcul haute performance. Le programme se concentre également sur la préparation des logiciels, garantissant que les principaux frameworks et systèmes d'exploitation sont compatibles avec les systèmes basés sur Arm. Les efforts récents incluent l'introduction de la technologie ArmKleidi, qui optimise l'inférence basée sur le processeur pour les projets open source tels que PyTorch et Llama.cpp.
Il convient de noter que, comme le prétend Google, la plupart des charges de travail d'IA sont déduites du processeur. Il est donc tout à fait logique de créer le processeur le plus efficace et le plus performant pour l'IA.