Microsoft assouplit les restrictions locales en matière d'IA et les PC dotés de cartes graphiques de la série RTX 30 peuvent également exécuter le langage Windows 11 model

Microsoft a récemment mis à jour discrètement le document indiquant que tant que l'appareil est équipé d'une carte graphique discrète qui remplit les conditions, même s'il ne s'agit pas d'un PC Copilot+, il peut exécuter l'API du modèle de langue locale sur Windows 11. Ceci est considéré comme une étape importante dans l'affaiblissement de l'avantage exclusif de Copilot+ PC. Selon les dernières instructions, le matériel éligible inclut la série NVIDIA GeForce RTX 30 et les modèles plus récents, et nécessite 6 Go de mémoire vidéo et plus.

Cela signifie que certains PC hautes performances qui ne répondent pas à l'origine à la norme Copilot+ PC pourront obtenir des capacités d'IA locales au niveau du système via des GPU, au lieu de s'appuyer entièrement sur de nouveaux modèles dotés de NPU à haute puissance de calcul.

Copilot+ PC a été officiellement dévoilé le 18 juin 2024. Microsoft l'a présenté comme le « seul moyen » d'exécuter l'IA locale à l'époque et l'a utilisé comme argument de vente important pour promouvoir les mises à niveau du PC. Selon la définition originale de Microsoft, pour qu'un appareil soit étiqueté PC Copilot+, il doit être équipé d'au moins 16 Go de mémoire, d'un disque SSD et d'un NPU (unité de traitement neuronal) pouvant fournir pas moins de 40 TOPS de puissance de calcul. Le NPU est conçu pour exécuter efficacement des modèles d'IA, en mettant l'accent sur l'efficacité énergétique, tandis que le GPU est efficace pour le calcul parallèle à grande échelle et dispose d'une puissance de calcul brute plus élevée. Cependant, dans le cadre de la stratégie précédente, Microsoft limitait les fonctions d'IA locales telles que le rappel Windows et « Click to Do » aux PC Copilot+ équipés de NPU, ce qui empêchait de nombreux ordinateurs GPU dotés de performances matérielles tout aussi puissantes d'utiliser ces capacités d'IA intégrées.

Ce tour provient d'une note de mise à jour de Microsoft sur GitHub. Microsoft a confirmé dans le document que l'API du modèle de langage peut déjà être exécutée sur GPU sur des PC non Copilot+, à condition que deux conditions soient remplies : premièrement, vous disposez d'une carte graphique RTX 30 ou plus récente, et deuxièmement, la carte graphique dispose d'au moins 6 Go de mémoire vidéo. "L'API du modèle de langage fonctionne désormais sur des PC non-Copilot+ avec des GPU pris en charge, apportant des capacités de modèle de langage natif à une plus large gamme d'appareils Windows 11", a déclaré Microsoft dans la note. Le matériel pris en charge inclut actuellement la série NVIDIA GeForce RTX 30 et les gammes de produits ultérieures, et nécessite 6 Go de mémoire vidéo et plus. Concrètement, ce changement étend la portée des modèles linguistiques locaux depuis les nouveaux PC Copilot+ au grand nombre d'appareils Windows 11 hautes performances déjà utilisés.

Du point de vue du développeur, l'API du modèle de langage fournit un ensemble d'interfaces Windows.AI.Text qui peuvent être appelées localement, prises en charge par un petit modèle de langage appelé « Phi Silica ». Le modèle est déjà apparu dans des produits comme Microsoft Edge, pour des fonctionnalités telles que « Réécrire à l'aide de l'IA ». Selon les paramètres de Microsoft, les PC Windows ordinaires ne préinstallent actuellement pas les modèles d'IA locaux par défaut. Seuls les utilisateurs qui achètent des PC Copilot+ disposeront d'un contenu pertinent prédéfini dans le système. Dans le cadre du nouveau schéma, si un utilisateur exécute une application prenant en charge l'API du modèle de langue locale, le système peut télécharger le modèle Phi Silica via Windows Update et l'exécuter localement sur un GPU qualifié.

Sur la base des capacités d'interface actuellement annoncées, les fonctions d'IA locales que les développeurs peuvent appeler dans leurs applications incluent : le formatage de texte intelligent à l'aide de l'interface Windows.AI.Text, le résumé de texte (TextSummarizer), la réécriture (TextRewriter), le texte en tableau (TextToTableConverter) et la génération générale de mots d'invite, etc. qui présente plus d'avantages en matière de protection de la vie privée que Copilot ou ChatGPT qui s'appuient sur des modèles cloud.

Il convient de noter que Microsoft ne libéralise actuellement le champ d’application des GPU qu’au niveau de l’API du modèle de langage. À en juger par les informations disponibles, certaines fonctions d'IA dans des applications telles que Windows Recall, "Click to Do" et MS Paint ne sont toujours disponibles que sur les PC Copilot+ dotés de NPU intégrés. En d’autres termes, cet ajustement vise davantage à « débloquer » une gamme plus large de plates-formes matérielles pour les capacités locales d’IA telles que le texte et les invites, plutôt qu’à supprimer complètement le seuil pour les NPU dans l’écosystème Copilot+. Néanmoins, à mesure que les capacités d'IA locale s'étendent progressivement aux PC GPU hautes performances traditionnels, l'argument de vente du Copilot+ PC en tant que « le seul capable d'exécuter l'IA localement » a été considérablement affaibli, ce qui a également conduit à des spéculations extérieures sur la question de savoir si Microsoft assouplirait davantage, voire annulerait, les exigences obligatoires pour les NPU à l'avenir.