Microsoft assouplit la « ligne dure » qu'il avait précédemment tracée autour des PC Copilot+, permettant à davantage d'appareils Windows 11 d'exécuter des charges de travail d'IA natives s'ils disposent du bon GPU.La dernière mise à jour montre que les systèmes dotés d'une carte graphique NVIDIA GeForce RTX 30 ou d'une carte graphique plus récente avec au moins 6 Go de mémoire vidéo prendront en charge l'API du modèle de langue locale de Windows. En apparence, il ne s’agit que d’un petit changement pour les développeurs, mais cela laisse entendre que Microsoft repense à l’opportunité de lier étroitement ses capacités natives d’IA sous la marque Copilot+.

Lorsque Copilot+ PC a été officiellement lancé le 18 juin 2024, le message de Microsoft était très clair : un matériel dédié à l’IA est une exigence. Certaines des caractéristiques déterminantes de ce type d'appareil sont les unités de traitement neuronal (NPU) intégrées, ainsi que les configurations de base telles que 16 Go de mémoire et les disques SSD. Parmi eux, NPU est délibérément conçu comme la clé pour débloquer les capacités natives d’IA de Windows.

Cependant, les NPU ne sont pas les seuls capables de gérer les charges de travail de l’IA. Les GPU modernes en particulier sont conçus pour le calcul massivement parallèle et sont utilisés depuis longtemps pour exécuter des modèles d’apprentissage automatique. En pratique, pour de nombreuses charges de travail d’IA, les GPU peuvent souvent fournir des capacités de débit plus élevées que les NPU actuels, souvent au prix d’une consommation d’énergie plus élevée.

Avant cet ajustement, Microsoft limitait la plupart des capacités d'IA intégrées aux appareils dotés de NPU. Cela empêche de nombreux PC dotés d'une puissance de calcul suffisante et s'appuyant uniquement sur des GPU d'utiliser la génération locale de texte et d'images, ainsi qu'une série d'outils d'IA tels que Windows Recall. Aujourd’hui, cet écart commence à être comblé. Microsoft a confirmé dans un document technique mis à jour et une publication GitHub que les développeurs peuvent désormais exécuter l'API du modèle de langage sur des PC non Copilot+ avec des GPU pris en charge.

Dans son introduction, Microsoft appelle cette fonctionnalité « API de modèle de langage exécutées sur des GPU (expérimentaux) », notant que ces API peuvent désormais s'exécuter sur des PC non Copilot+ avec des GPU pris en charge, apportant ainsi des capacités de modèle de langage natif à une plus large gamme d'appareils Windows 11. Le responsable a également précisé que le matériel actuellement pris en charge comprend la série NVIDIA GeForce RTX 30 et les produits plus récents équipés de plus de 6 Go de mémoire vidéo.

Au stade actuel, cette fonctionnalité est encore principalement au niveau des développeurs et n’est pas directement ouverte aux utilisateurs finaux ordinaires. Pour appeler ces API, vous devez développer ou utiliser une application intégrant Windows AI Framework. Cependant, cela a jeté les bases d’une expansion massive des capacités natives de l’IA sur davantage d’appareils Windows.

Au cœur de ce cadre se trouve un petit modèle de langage local appelé Phi Silica. Plutôt que d'être préinstallé sur tous les systèmes, Phi Silica est distribué à la demande via Windows Update : le modèle est téléchargé uniquement lorsqu'une application le demande. Une fois le modèle installé, il peut être exécuté sur du matériel local. Lorsqu'un GPU disponible est détecté, le GPU sera utilisé en premier pour accélérer l'inférence.

Les fonctions actuellement divulguées se concentrent principalement sur les tâches liées au texte. Grâce à l'API Windows.AI.Text, les applications peuvent effectuer des opérations telles que le résumé du contenu, la réécriture de texte, la conversion de texte dans un format structuré et la génération d'invites. Du point de vue de l'utilisateur, ces capacités sont similaires à l'expérience fournie par les outils d'IA cloud, sauf que les calculs sont effectués entièrement localement.

Fonctionner localement présente certains avantages pratiques. En réduisant la dépendance à la puissance du cloud computing, la vitesse de réponse du système devrait être améliorée. Dans le même temps, les données n'ont pas besoin d'être téléchargées sur des serveurs externes, ce qui permet aux données de rester sur la machine locale. Ce modèle est potentiellement attrayant à la fois pour les développeurs et les utilisateurs d'entreprise en termes de latence, de coûts de bande passante et de respect de la confidentialité, ce qui pourrait avoir un impact sur la manière dont ils adoptent les fonctionnalités de l'IA.

Il convient de préciser que cette ouverture ne signifie pas que le système Copilot+ est entièrement « déverrouillé ». Certaines des fonctionnalités les plus visibles de Copilot+, telles que Windows Recall et Click to Do, sont actuellement toujours liées aux systèmes alimentés par NPU. Dans l’état actuel des choses, la prise en charge du GPU est principalement limitée à la couche API du modèle de langage, plutôt qu’à une intégration complète dans l’ensemble de l’expérience IA.

Même si des limites subsistent, la tendance est déjà claire : Microsoft ne considère plus le NPU comme le seul point d’entrée pour l’IA native de Windows. Permettre au GPU de gérer cette partie de la charge de travail élargit considérablement la gamme de matériel compatible et affaiblit l'image « IA uniquement native » qu'avait Copilot+ PC au lancement.