ASUS a récemment lancé la mini station de travail Ascent GX10, équipée de la puce NVIDIA GB10 Grace Blackwell Superchip. La version 1 To est au prix de 32 999 yuans.La taille globale de l'Ascent GX10 est de 150 x 150 × 51 mm, soit moins d'un dixième de la taille d'un poste de travail traditionnel. Il utilise un système de refroidissement personnalisé en interne, combinant des ailettes ultra-larges, cinq caloducs et deux ventilateurs de 140 × 80 mm pour garantir que l'appareil peut maintenir un fonctionnement stable sous des charges élevées et soutenues.

La superpuce NVIDIA GB10 Grace Blackwell équipée sur cet appareil est composée d'un GPU Blackwell et d'un processeur Grace et est optimisée pour un boîtier compact. Il peut exécuter de grands modèles de langage avec plus de 200 milliards de paramètres.Parmi eux, Grace CPU dispose de 20 cœurs Arm, qui peuvent améliorer l'efficacité du prétraitement et de l'orchestration des données, accélérer le réglage du modèle et l'inférence en temps réel.

En termes de configuration matérielle, l'Ascent GX10 est équipé de 128 Go de mémoire unifiée LPDDR5X et offre une variété d'options de stockage SSD de 1 To à 4 To. Le GPU est basé sur l'architecture Blackwell, possède 6 144 cœurs CUDA, intègre le Tensor Core de cinquième génération et prend en charge le format de données FP4. Grâce à la technologie d'interconnexion des puces NVIDIA NVLink-C2C, une interconnexion unifiée des modèles de mémoire CPU et GPU est obtenue, avec une bande passante atteignant cinq fois celle du PCIe 5.0.

Grâce au port réseau NVIDIA ConnectX-7 intégré, les utilisateurs peuvent connecter deux Ascent GX10 localement pour gérer des tâches d'IA plus complexes, telles que de grands modèles tels que Llama 3.1 avec jusqu'à 405 milliards de paramètres.

De plus, les utilisateurs peuvent terminer le développement et les tests de modèles d'IA dans un environnement local, puis migrer en toute transparence vers NVIDIA DGX Cloud ou une autre infrastructure accélérée de cloud et de centre de données. L'ensemble du processus ne nécessite pratiquement aucun ajustement du code, simplifiant ainsi considérablement le processus de prototypage, de réglage fin du modèle et d'itération.