À 9 heures ce matin, DeepSeek a continué à remplir son engagement lors de la Semaine Open Source et a publié le logiciel open sourceProfondGEMM. Une fois ce message transmis, il a immédiatement attiré21 000Le nombre de lectures est suffisant pour montrer sa popularité dans le pays et à l'étranger. Il est entendu que DeepGEMM est un projet axé surPC8La bibliothèque efficace de multiplication matricielle générale (GEMM) prend en charge les besoins de calcul matriciel des groupes d'experts ordinaires et mixtes (MoE) et peut optimiser dynamiquement l'allocation des ressources pour améliorer l'efficacité de la puissance de calcul.
Cette bibliothèque est basée surCUDAdévelopper, adopterModule léger de compilation juste à temps (JIT), compilez dynamiquement le noyau au moment de l'exécution sans pré-compilation ni installation.
Il convient de mentionner que DeepGEMM est conçu pourModèle DeepSeek-V3/R1Fournit un support sous-jacent simple et efficace pour la formation et l'inférence, en particulier pourOptimisation du GPU de l'architecture Hopper (comme le H800), en tenant compte des performances élevées et du faible coût.
Troisième résultat de l'Open Source Week, la sortie de DeepGEMM poursuit la stratégie précédente de DeepSeek en matière de modèles et d'outils open source (tels que FlashMLA), abaissant encore davantage le seuil d'application de la technologie informatique haute performance.
De plus, cet open source est le troisième projet de la "Open Source Week" de DeepSeek (24-28 février), qui a déjà été publiéFlashMLA (noyau de décodage efficace) et DeepEP (bibliothèque experte de communication parallèle).