Au cœur de la Silicon Valley, au San Jose Convention Center en Californie, une fête technologique attendue a lieu cette semaine. Le 18 mars, heure locale, le PDG de Nvidia, Jen-Hsun Huang, vêtu de son emblématique veste en cuir noir, est entré dans le stade avec des dizaines de milliers de personnes, ressemblant à une rock star. "Bienvenue à la conférence GTC. J'espère que vous réalisez qu'il ne s'agit pas d'un concert, mais d'une conférence de développeurs." » Dit-il avec humour au début.
En fait, la Nvidia GPU Technology Conference (GTC) a été saluée par l'industrie comme le « Festival de musique de Woodstock dans le monde de l'IA », mais lors de cet événement, les notes dominantes sont les puces, les algorithmes, l'architecture informatique et les mathématiques.
En tant que « vendeur de pelles » à l'ère de l'IA, Nvidia a présenté de nombreuses « technologies noires » lors de la conférence GTC. Parmi eux, la nouvelle puce GPU basée sur l'architecture Blackwell offre des performances quatre fois supérieures à celles de la génération précédente et une efficacité énergétique 25 fois supérieure. Elle peut être décrite comme la « puce IA la plus puissante ». Les nouveaux microservices d'IA fournissent des services complets, depuis les logiciels d'application jusqu'à la programmation matérielle, avec une disposition complète du matériel, des logiciels et des systèmes.
Ce qui est plus remarquable, c'est que Huang Renxun a constamment mentionné le concept d'« usine d'IA » dans son discours, espérant que les entreprises pourront considérer les centres de données et les outils d'IA sous un angle différent. Il estime que le monde est déjà au début d’un nouveau cycle de révolution industrielle. La matière première de cette révolution industrielle est constituée de données, et le résultat est constitué de précieux jetons de données (digitaltokens). Le maillon intermédiaire dans le traitement et le raffinement des données est le centre de données. Selon les estimations de Huang Renxun, il s'agira d'un marché d'une taille annuelle de 250 milliards de dollars.
Les temps forts de l'événement IA sont nombreux : "La puce IA la plus puissante" Blackwell, humanoïderobot, jumeau numérique VisionPro
En 2016, Huang Renxun a personnellement offert le premier supercalculateur DGX-1 composé de puces GPU à OpenAI devant Musk et d'autres vétérans d'OpenAI. Aujourd’hui, toutes les entreprises impliquées dans la compétition pour les grands modèles de langage et l’IA générative se disputent les puces GPU de Nvidia. Il ne fait aucun doute que dans ce boom de l’IA générative, NVIDIA est le principal « vendeur de pelles » derrière tout cela.
Lors de la conférence GTC de cette semaine, Huang Renxun a répondu aux attentes et a présenté une série de « technologies noires » qui ont une fois de plus fait exploser le monde de l'IA.
Lors de cet événement technologique, Huang Renxun a officiellement annoncé la « bombe nucléaire IA » : une puce GPU basée sur l'architecture Blackwell. Les performances d'entraînement du GPU Blackwell sont 4 fois supérieures à celles du GPU Hopper de la génération précédente, les performances d'inférence sont 30 fois supérieures et l'efficacité énergétique est environ 25 fois supérieure. Les performances des GPU NVIDIA se sont améliorées si rapidement que Jim Fan, scientifique principal chez NVIDIA, a surnommé « la nouvelle loi de Moore ».
Par exemple, si vous souhaitez entraîner un modèle avec 1 800 milliards de paramètres (l’échelle de GPT-4), l’entraînement avec une puce à architecture Hopper peut nécessiter 8 000 GPU, consommer 15 mégawatts d’énergie et prendre environ 90 jours. Si vous utilisez Blackwell, vous n'avez besoin que de 2 000 GPU et de 4 mégawatts de puissance, ce qui réduit considérablement la consommation d'énergie.
Source de l'image : Jim[email protégé]
L'industrie s'attend à ce que les entreprises qui utiliseront la série de puces Blackwell incluent Amazon, Google, Meta, Microsoft, OpenAI, Tesla et xAI. Huang Renxun a révélé que le prix du nouveau GPU est compris entre 30 000 et 40 000 dollars, ce qui augmentera sans aucun doute encore les revenus de Nvidia.
NVIDIA a également lancé NIM (NVIDIA Inference Microservices), qui fournit des services complets allant des logiciels d'application à la programmation matérielle, permettant aux développeurs de créer et de déployer facilement des applications d'IA et d'accélérer la mise en œuvre de la technologie d'IA.
En outre, NVIDIA a également présenté une série de scénarios d'application d'IA intéressants, tels que ESMFold utilisé pour prédire la structure des protéines, le modèle de base du robot humanoïde Groot et la puce du robot humanoïde JetsonThor, la plate-forme informatique embarquée en coopération avec BYD, l'application Apple VisionPro sur la plate-forme Omniverse et le jumeau numérique du climat terrestre, etc.
Cette conférence GTC a également été accueillie avec enthousiasme par Wall Street. L'analyste de JPMorgan, Harlan Sur, estime que l'architecture Blackwell a consolidé la domination de Nvidia dans le domaine de l'IA et a "toujours une à deux longueurs d'avance" sur ses concurrents. L'analyste de Bank of America, Vivek Arya, a déclaré que les produits GPU basés sur Blackwell « ont fait un pas en avant dans les performances de formation et ont réalisé un bond en avant dans les performances d'inférence » et ont maintenu un prix cible de 1 100 $ et une note « d'achat ».
Toshiya Hari, analyste chez Goldman Sachs, estime que les fortes capacités d'innovation de Nvidia et ses relations clients approfondies stimuleront sa croissance continue, continueront à maintenir sa position dominante dans la concurrence future et exerceront une pression sur ses concurrents. Hari a donc augmenté son cours cible de l'action de 875 $ à 1 000 $.
Au moment de mettre sous presse, Nvidia a augmenté de 7,35 % cette semaine, avec une augmentation cumulée de 95,75 % depuis le début de cette année et une augmentation sur l'ensemble de l'année de 239 % en 2023.
En plus de vendre des puces, Nvidia vise un marché de 250 milliards de dollars
"Ce que nous vendons en réalité n'est pas une puce. La puce elle-même ne peut pas fonctionner. Elle doit être intégrée à un système pour fonctionner." Alors que les super performances des puces Blackwell ont suscité des discussions animées, Huang Renxun a continué à souligner ce point lors de la conférence GTC. "Nvidia a construit l'intégralité du centre de données pour l'IA, mais l'a simplement divisé en plusieurs morceaux, dont certains conviennent à votre entreprise."
Selon Huang Renxun, l'opportunité de marché de Nvidia ne réside pas dans les puces GPU, car de nombreuses entreprises développent également des GPU. Le véritable avantage concurrentiel de NVIDIA réside dans les solutions pour centres de données intégrant des puces, des logiciels, des moteurs d'algorithmes, des technologies de sécurité, des communications inter-puces, etc.
« Les centres de données évoluent rapidement vers l'informatique accélérée (faisant référence à l'utilisation de matériel spécialisé pour obtenir un traitement informatique efficace au-delà des performances informatiques conventionnelles du processeur). Il s'agit d'un marché d'une valeur de 250 milliards de dollars par an et en croissance annuelle de 20 à 25 %. Cela est principalement dû à la demande d'IA, et NVIDIA occupera une part importante. Huang Renxun a dit. Il a également déclaré que c'est sur cette base que la valeur marchande de Nvidia est passée de 1 000 milliards de dollars à 2 000 milliards de dollars en neuf mois.
Huang Renxun attache une grande importance au secteur des centres de données car il pense que les centres de données joueront un rôle central dans la nouvelle révolution industrielle. C'est pourquoi il a souligné à plusieurs reprises lors de la conférence GTC que le centre de données devait être compris dans l'optique d'une « usine IA ».
Huang Renxun a utilisé l'analogie de la révolution industrielle de l'énergie électrique pour expliquer « l'usine IA » : lors de la dernière révolution industrielle, l'entrée était l'eau et la sortie était l'électricité. Cependant, la matière première de la révolution industrielle qui s'est produite dans la salle du centre de données était les données, et le résultat après traitement était des jetons de données. "Ce type de jeton est invisible et sera distribué dans le monde entier. Il a une grande valeur."
Les initiés de l'industrie pensent que la soi-disant « usine d'IA » de Huang Renxun est en fait similaire au terme centre informatique intelligent national. Il s'agit d'une nouvelle « centrale électrique » qui fournit une puissance de calcul pour les grands modèles d'IA, les applications d'IA, etc., plutôt qu'un appareil traditionnel de stockage et de gestion des données.
La raison pour laquelle Huang Renxun insiste à plusieurs reprises sur le concept d'« usine IA » est en fait d'espérer que les entreprises considéreront les centres de données comme des unités lucratives plutôt que comme de simples investissements en équipements, incitant ainsi davantage d'entreprises à accélérer le déploiement des services NVIDIA. "Auparavant, les centres de données étaient considérés comme des centres de coûts et des dépenses en capital pour les entreprises, et on pourrait les considérer comme un coût. Cependant, les usines sont une autre histoire, gagner de l'argent. Le nouveau monde de l'IA générative donnera naissance à une nouvelle forme d'usine", a-t-il ajouté.
Avec l'explosion de l'IA générative, l'activité des centres de données est devenue le principal point de croissance de NVIDIA. Le dernier rapport financier trimestriel publié en février de cette année a montré que l'activité centres de données représentait 83 % du chiffre d'affaires de Nvidia au cours du trimestre, soit une augmentation d'une année sur l'autre de 409 % à 18,4 milliards de dollars. Cette croissance est indissociable de la demande pour l'architecture GPU Hopper de NVIDIA pour la formation et l'inférence de grands modèles. Avec l'avènement du GPU Blackwell, NVIDIA devrait continuer à occuper fermement la position de « vendeur de pelle » en IA.
Lors de la conférence GTC, Dell a annoncé qu'il construirait conjointement « AI Factory » de Dell avec NVIDIA et mettrait à niveau son serveur phare PowerEdgeXE9680 pour prendre en charge la dernière architecture GPU de NVIDIA. Le groupe Lenovo a également annoncé une coopération avec NVIDIA pour lancer une nouvelle solution hybride d'intelligence artificielle, qui fournira aux développeurs les microservices NVIDIA récemment lancés, notamment NVIDIANIM et NeMoRetriever. Le PDG de Microsoft, Nadella, a également déclaré que le processeur GB200 Grace Blackwell serait utilisé dans les centres de données mondiaux de Microsoft pour aider les organisations du monde entier à mettre en œuvre l'IA.
Alors que le cours de l'action de Nvidia monte en flèche, la question qui préoccupe tout le monde à Wall Street est de savoir jusqu'où Nvidia peut encore augmenter et s'il s'agit d'une bulle. Aux yeux des taureaux, ce cycle de boom de l'IA ne fait que commencer et Nvidia continuera de croître.
DanIves, un analyste bien connu de WedBush Securities, a déclaré dans un e-mail de commentaire envoyé au journaliste du « Daily Economic News » : « Les vagues déclenchées par le GPU « en or » de NVIDIA ont déclenché une vague de dépenses dans l'industrie technologique au cours des prochaines années. Dans cette quatrième révolution industrielle, alors que les entreprises et les consommateurs l'utilisent. et Meta ont tous des chiffres de dépenses en capital stupéfiants en matière d'investissements dans la transformation de l'IA, et NVIDIA est le leader.
À court terme, DanIves estime que les dépenses liées à l’IA dans les budgets informatiques des entreprises représenteront 8 à 10 % en 2024, alors que ce chiffre sera inférieur à 1 % en 2023.
Il convient également de mentionner que lors de la conférence NVIDIA GTC, en plus du discours d'ouverture de Jen-Hsun Huang, des invités tels que Li Feifei, académicien de la National Academy of Engineering et premier professeur de la chaire Sequoia à l'Université de Stanford, et Brad Lightcap, directeur des opérations d'OpenAI, ont également donné de merveilleux partages pour explorer les développements révolutionnaires dans l'IA, le calcul accéléré et d'autres domaines.