L'image physique de l'accélérateur IA Ascend 950 de nouvelle génération de Huawei a été exposée pour la première fois, montrant la forme d'emballage de la puce auto-développée par l'entreprise et de la mémoire à large bande passante (HBM) auto-développée. Cette puce intègre le HBM de première génération développé par Huawei et une nouvelle génération d'unités d'accélération d'IA dans le même boîtier. Il est positionné pour les clusters informatiques à grande échelle et rivalise par l'échelle du système et la densité des clusters, plutôt que par ses rivaux « purs et durs » tels que Nvidia en termes de performances d'une seule puce.
Huawei a précédemment annoncé que la série Ascend 950 devrait être officiellement lancée début 2026 et comprendra au moins deux modèles.

Les rapports montrent que parmi la série Ascend 950, la version 950PR intègre 128 Go de HBM développé par Huawei, avec une bande passante d'environ 1,6 To/s ; tandis que la version 950DT augmente la capacité à 144 Go et augmente considérablement la bande passante à près de 4 To/s. Les objectifs de puissance de calcul des deux puces sont des performances FP8 de niveau 1 PetaFLOPS et des performances FP4 de niveau 2 PetaFLOPS pour une seule carte, ciblant les scénarios d'inférence et de formation de grands modèles actuels. La stratégie globale de Huawei met davantage l'accent sur le packaging haute densité et les réseaux d'interconnexion efficaces, et compense l'écart de performances des puces uniques en améliorant la puissance de calcul et l'efficacité de l'interconnexion au niveau des armoires et des centres de données.
En termes de processus de fabrication, l'article souligne qu'il n'existe actuellement aucune information officiellement confirmée sur les nœuds de processus, mais l'industrie s'attend généralement à ce que l'Ascend 950 utilise probablement le dernier processus N+3 du SMIC, qui est classé comme nœud de 5 nm. SMIC a précédemment annoncé que son nœud N+3 avait réalisé une production de masse sans recourir à des équipements EUV, et le premier client public est le produit terminal de Huawei équipé du SoC Kirin 9030. Dans ce contexte, en tant que produit stratégique d'accélération de l'IA de Huawei, il est considéré comme une inférence « naturelle » qu'Ascend 950 utilise le même nœud.
D'après l'image physique, l'Ascend 950 adopte une conception de boîtier multi-puces. Le cœur est constitué de deux puces de calcul et est associé à deux puces supplémentaires d'E/S suspectées et liées au réseau pour former un module multi-puces (MCM). On pense que ces E/S et puces réseau sont responsables de la connexion des cartes accélératrices à des clusters SuperPoD et SuperCluster plus grands, réalisant ainsi une interconnexion à large bande passante de centaines de milliers de cartes Ascend 950 grâce à une nouvelle génération de protocole d'interconnexion « Lingqu » et de technologie d'interconnexion optique. Le module avec un anneau de structure d'emballage réparti autour de la puce qui ressemble à la « forme hybride LPDDR/HBM » est supposé être le package HBM auto-développé par Huawei. Il est très probablement produit dans un boîtier indépendant, puis empilé et intégré sur le substrat de l'accélérateur dans un boîtier au niveau du système.
Dans l’ensemble, la conception de l’Ascend 950 présente certaines similitudes avec les GPU haut de gamme tels que NVIDIA Blackwell. Les deux utilisent un boîtier à double puce pour superposer plus de puissance de calcul sur une seule carte, et s'appuient sur un HBM à large bande passante et des protocoles d'interconnexion dédiés pour créer des clusters informatiques à grande échelle. La différence est qu'au stade actuel, Huawei se concentre davantage sur l'idée de « gagner par l'échelle », dans l'espoir de former des solutions alternatives sur les marchés de la puissance des centres de données et du cloud computing de l'IA grâce à un emballage dense, une interconnexion multi-cartes et des solutions de super cluster, tout en renforçant la contrôlabilité indépendante de la chaîne d'approvisionnement locale.