Il existe actuellement sur le marché chinois plus de dix petites entreprises professionnelles spécialisées dans la réparation de puces haut de gamme telles que NVIDIA H100 et A100. Ces chips interdites à la vente aux États-Unis entrent principalement dans le pays par des canaux spéciaux.A la veille de la sortie du H100 en septembre 2022, le gouvernement américain l'a inscrit sur la liste des ventes interdites à la Chine en même temps que l'A100, commercialisé depuis deux ans.

Un commerçant de Shenzhen avec 15 ans d'expérience dans la réparation de GPU de jeu Nvidia s'est tourné vers la réparation de puces IA fin 2024. Son partenaire a déclaré sans détour : « La demande de réparations dépasse de loin les attentes ».En raison de l’augmentation des commandes, ils ont créé une nouvelle entreprise et réparent actuellement en moyenne 500 puces NVIDIA AI par mois. Pour garantir la qualité de la maintenance, l’entreprise est même équipée d’une salle de test de 256 serveurs pouvant simuler l’environnement du data center.

En raison de l'interdiction, NVIDIA n'est pas en mesure de fournir des services de réparation officiels pour ces produits restreints. Des sources ont révélé que dans d’autres pays, les GPU défaillants sous garantie sont généralement directement remplacés. Un porte-parole de NVIDIA a souligné que seuls les canaux officiellement autorisés peuvent fournir des services fiables et que les réparations non autorisées ne sont « pas techniquement et économiquement réalisables ».

Bien que Nvidia ait récemment été autorisé à vendre la version spéciale chinoise des puces H20, l'acceptation du marché est limitée.D'une part, un serveur équipé de 8 GPU H20 se vend à plus d'un million de yuans ; d'un autre côté, bien que ses performances d'inférence d'IA soient excellentes, elle ne peut pas répondre aux besoins de formation de grands modèles de langage.

Les initiés de l'industrie ont souligné que le taux de défaillance des H100/A100 utilisés en Chine continue d'augmenter en raison d'un fonctionnement à long terme et à forte charge. La durée de vie normale de ce type de GPU n’est généralement que de 2 à 5 ans.

En termes de devis de maintenance, deux prestataires de services de Shenzhen ont respectivement révélé que les frais de maintenance de base étaient de 10 000 à 20 000 yuans par bloc, soit 10 % du prix initial. Les services couvrent le débogage des logiciels, la réparation du matériel (ventilateur/circuit imprimé/mémoire vidéo) et le remplacement des composants. Il convient de noter que la demande du marché pour les dernières puces B200 est déjà apparue : le prix demandé sur le marché intérieur pour un serveur équipé de 8 puces B200 a dépassé les 3 millions de yuans.