La carte graphique de nouvelle génération de NVIDIA est lancée avec le processus A16 de 1,6 nm, une capacité de production trop faible pour mélanger et assortir 3nm

Lors de la conférence GTC de la semaine dernière, NVIDIA a clarifié davantage la feuille de route pour l'architecture GPU de nouvelle génération Feynman, qui devrait être lancée en 2028. Feynman utilisera non seulement des puces HBM personnalisées, mais utilisera également Die Stack, un processus d'empaquetage de pile 3D, pour la première fois.Parmi eux, le cœur GPU lancera le processus A16 de 1,6 nm de TSMC.

Il s’agit également du premier lancement par NVIDIA du nouveau processus TSMC depuis de nombreuses années. Le dernier lancement a eu lieu à l’ère du 55 nm. Après l’avènement de l’ère mobile, Apple a presque dominé le lancement du nouveau processus de TSMC. Cette fois, cela s'est reproduit avec la montée de l'ère de l'IA.

Le procédé A16 est une version améliorée du procédé 2 nm N2. Il ajoutera une nouvelle technologie supplémentaire au transistor GAA - l'alimentation arrière SRP, qui améliore la densité et les performances, ainsi que la capacité d'alimentation. Elle est donc adaptée au calcul HPC, mais ce n’est pas une puce basse consommation, et Apple ne sera pas le premier à la lancer.

Selon TSMC, le processus A16 peut améliorer les performances de 8 à 10 % par rapport au processus N2P amélioré 2nn, ou réduire la consommation d'énergie de 15 à 20 % et augmenter la densité des transistors de 7 à 10 %.

Bien que NVIDIA ait obtenu le processus A16 pour la première fois, il est confronté à de nombreux défis.La raison principale est que la capacité de production est limitée et que l’amélioration n’est pas celle attendue.La capacité de production de l'A16 ne sera que de 20 000 tranches par mois d'ici la fin de l'année prochaine et doublera pour atteindre 40 000 tranches en 2028. La capacité de production de l'ensemble de la famille de processus 2 nm devrait atteindre 200 000 tranches par mois, le ratio de capacité de production de l'A16 n'est donc pas élevé.

Cela a également obligé le GPU Feynman à apporter des modifications et à ne pouvoir utiliser le processus A16 que sur le GPU Die principal, qui est le plus sensible aux performances et à la consommation d'énergie.Moins de pièces essentielles utiliseront le processus N3P de TSMC, ce qui contribuera également à réduire les coûts.

En fait, NVIDIA a compris depuis longtemps que s'appuyer uniquement sur TSMC pour une capacité de production avancée serait trop risqué et ne serait pas propice aux négociations sur les prix, c'est pourquoi elle recherche également activement d'autres fonderies. Les puces LPU commercialisées cette fois sont fabriquées par Samsung et il est possible d'utiliser la technologie EMIB-T d'Intel pour conditionner des puces à l'avenir. Si la coopération se déroule sans problème, il n'est pas impossible d'utiliser le procédé 14A d'Intel pour fabriquer des puces GPU.