Le GPU Feynman de nouvelle génération de NVIDIA est sur le point de faire ses débuts : le premier processus 1,6 nm, une consommation d'énergie de plus de 1 000 W

NVIDIA tiendra la conférence GTC de cette année la semaine prochaine, du 16 au 19 mars. Elle devrait lancer au moins deux produits à succès, l'un est un LPU orienté vers le raisonnement et l'autre est l'architecture GPU de nouvelle génération Feynman. Feynman (le physicien Feynman) utilise toujours l'ancien système nommé d'après le célèbre scientifique. En fait, son existence était mentionnée sur la feuille de route de l’année dernière, mais il y avait trop peu d’informations. Il mentionnait uniquement la nouvelle de la compatibilité avec la mémoire HBM de nouvelle génération.

Selon les dernières nouvelles, la carte graphique Feynman sera lancée avec le processus A16 de TSMC.Il s’agit du premier processus au monde de niveau 1,6 nm et du premier processus de TSMC à utiliser l’alimentation arrière SRP., cette technologie peut non seulement améliorer la densité et les performances, mais également améliorer la capacité d'alimentation électrique, principalement pour le calcul haute performance HPC.

Cependant, le processus OEM A16 est coûteux. Il a été rapporté que NVIDIA envisageait de transférer certaines commandes de packaging à Intel et d'utiliser la technologie de packaging EMIB-T de ce dernier au lieu de s'appuyer entièrement sur le packaging CoWoS de TSMC pour réduire les coûts et augmenter la capacité de production.

Les cartes graphiques Feynman pousseront les performances de l’IA vers de nouveaux sommets, mais elles poseront également de nombreux problèmes. Le premier est la consommation d’énergie. L'architecture Blackwell actuelle est proche de 1 000 W et la consommation électrique du Blackwell Ultra à double revenu atteint même 1 400 W.Feynman atteindra également plus de 1 000 W, et les cartes dual-core devront peut-être atteindre 2 000 W.

L’augmentation de la consommation d’énergie entraînera naturellement une amélioration des performances, mais il y aura également des problèmes de dissipation thermique. Vera Rubin a clairement indiqué que tout le refroidissement liquide serait utilisé pour la dissipation de la chaleur, et Feynman devrait également se tourner vers un refroidissement liquide plus efficace.

Un autre changement est que Feynman intégrera la technologie LPU de Groq, mais je pense personnellement que ce n'est pas nécessairement le cas. La raison principale est que l'architecture Feynman aurait dû terminer la conception et que l'ensemble du LPU est trop tard, et NVIDIA intégrera évidemment le LPU dans une gamme de produits indépendante. Après tout, les exigences relatives aux puces IA dans les scénarios de formation et d’inférence sont différentes et doivent être traitées séparément.

Pour les joueurs, les cartes graphiques Feynman seront loin, aussi bonnes soient-elles, car Feynman est pour 2028.Les cartes de jeu seront encore mises à niveau vers l'architecture Rubin au cours du second semestre de l'année prochaine, et les cartes de jeu Feynman ne seront pas disponibles avant au moins 2029.