Bien que les installations matérielles de DeepSeek n'aient pas publié de détails, il est généralement admis qu'un grand nombre de puces NVIDIA AI sont utilisées, notamment H100, H800, H20 et d'autres modèles différents. Cependant, selon la dernière révélation, DeepSeek a également vérifié la dernière puce AI de Huawei, l'Ascend 910C.

L'Ascend 910C a été exposé plus tard en 2024. Il aurait été fourni par lots à certains clients, notamment Alibaba, Baidu et Tencent. Le premier lot d'environ 70 000 unités, avec une moyenne d'environ 20 000 yuans chacune seulement.

Le message montre,L'Ascend 910C est fabriqué à l'aide du processus 7 nm de SMIC, avec un boîtier intégré à double puce. Le nombre de transistors atteint 53 milliards et le taux de localisation global a atteint environ 55 %.

Il peut remplacer NVIDIA H100 et est également utilisé pour la formation et l’inférence d’IA à grande échelle. Il fonctionne bien sous différents types de données tels que FP8, FP16, FP32 et FP64.

Monter le 910C

Selon la dernière déclaration,Les données mesurées par l'équipe DeepSeek montrent que l'Ascend 910C de Huawei fonctionne de manière inattendue en matière d'inférence IA, atteignant environ 60 % de celle de la puce NVIDIA H100.

En outre,Grâce au noyau CUNN manuscrit et à l'optimisation, les performances de l'Ascend 910C peuvent être encore améliorées.

On dit queDeepSeek prend en charge les puces Huawei Ascend dès le premier jour, et gère indépendamment l'entrepôt PyTorch, qui peut convertir CUDA en CUNN avec une seule ligne de code. Le potentiel d’optimisation des performances est également énorme, et des performances plus élevées peuvent être obtenues grâce à une optimisation personnalisée.

Cependant, il convient de noter que ce que l'on sait actuellement, c'est que l'Ascend 910CAI possède d'excellentes performances d'inférence, maisLes performances de la formation en IA peuvent encore être insatisfaisantes.


Shengteng 910