La communauté Linux a toujours eu des réactions mitigées face à l'arrivée des grands modèles de langage et de l'intelligence artificielle générative, mais Ubuntu a récemment exprimé clairement sa position à travers un article de discussion sur le projet sur « L'orientation future du développement de l'IA dans Ubuntu » : à partir d'Ubuntu 26.10 « Stoking Stingray » sorti en octobre 2026, qui est la prochaine version importante après la 26.04, les nouvelles capacités d'Ubuntu en matière d'IA seront progressivement ajoutées dans tout le système d'exploitation, mais ces capacités seront fournies en option plutôt qu'en tant que poussée obligatoire.

Jon Seager, le responsable technique du projet, a déclaré qu'après le début de 2026, Canonical a commencé à encourager les développeurs internes à utiliser les outils d'IA plus activement, mais l'accent n'est pas mis sur la recherche d'indicateurs de données superficiels, tels que l'utilisation des jetons ou « la quantité de code écrite par l'IA ». Au lieu de cela, il espère que les ingénieurs comprendront véritablement en profondeur les scénarios dans lesquels l’IA est efficace et dans quels scénarios elle n’est pas idéale, et les mesureront à travers les résultats réels. Selon lui, l'entreprise n'obligera pas toutes les équipes à adopter la même pile technologique d'IA, mais encouragera différentes équipes à essayer différentes solutions et à accumuler davantage d'expérience au niveau organisationnel dans les mois à venir.
Seager a également souligné que Canonical ne poussera pas l'IA dans tous les coins d'Ubuntu, mais utilisera la « responsabilité » et la « transparence » comme principes fondamentaux pour faire avancer ce travail. En termes de sélection de modèles, Canonical donnera la priorité aux modèles de poids ouverts, aux chaînes d'outils open source et aux méthodes de mise en œuvre qui s'appuient autant que possible sur l'inférence locale hors ligne ; dans le même temps, lorsque l'entreprise évaluera les modèles, elle examinera non seulement si les pondérations sont ouvertes, mais se concentrera également sur la compatibilité des termes de licence du modèle avec les valeurs d'Ubuntu.
Selon le plan de Canonical, les fonctions d'IA d'Ubuntu à l'avenir peuvent être grossièrement divisées en deux catégories : l'une est constituée de « fonctions d'IA implicites » et l'autre de « fonctions d'IA explicites ». L'IA dite implicite fait référence à l'intégration de l'IA dans les capacités du système d'exploitation existant sans modifier le modèle mental de l'utilisateur pour améliorer les performances des fonctions originales, telles que la synthèse vocale, la synthèse vocale, l'OCR et la lecture d'écran améliorée et d'autres capacités d'accessibilité. Seager estime que de telles fonctionnalités ressemblent davantage à des améliorations clés en matière d'accessibilité, plutôt que d'être simplement étiquetées comme « IA » ; dans de nombreux scénarios, ils peuvent être mis en œuvre efficacement via des frameworks open source, des modèles de pondération ouverts et des méthodes de raisonnement locales, tout en tenant compte de la précision et de l'efficacité.
Un autre type de fonctions explicites d’IA sont les nouvelles capacités qui sont plus évidemment centrées sur l’IA. Ils peuvent inclure des flux de travail avec certaines capacités d'agent, telles que la rédaction de documents, la génération d'applications, le dépannage automatisé et même la fourniture de résumés d'actualités quotidiens personnalisés. Cependant, Canonical admet également que de telles fonctions s'accompagnent de responsabilités de sécurité plus élevées, de sorte que des mécanismes de sécurité, d'isolement et de contrôle d'autorisation suffisants doivent être établis à l'avance pour éviter des effets secondaires inattendus. Selon les mots de Seager, l'IA implicite sera utilisée pour améliorer les fonctionnalités existantes d'Ubuntu, tandis que l'IA explicite sera progressivement introduite sous la forme de nouvelles fonctionnalités.
En termes de mise en œuvre technique spécifique, Canonical prévoit de continuer à promouvoir les « instantanés d'inférence (package Snap d'inférence) » qu'il a introduits auparavant. Selon la déclaration officielle, ce type de Snap permet aux utilisateurs d'appeler plus facilement localement des capacités d'inférence de modèle optimisées pour un matériel spécifique, réduisant ainsi la complexité des allers-retours entre Ollama, Hugging Face et un grand nombre de modèles quantitatifs. Par exemple, après qu'un utilisateur a installé un Snap d'inférence, si le fabricant de puces concerné a fourni une optimisation de l'adaptation, le système peut automatiquement obtenir une version de modèle plus adaptée à la plate-forme matérielle actuelle. De plus, ces Snaps d'inférence sont soumis aux mêmes règles d'isolation sandbox que les autres Snaps, réduisant ainsi le risque que le modèle ait un accès aveugle aux données natives et aux ressources système.
Seager a également mentionné que dans le passé, si vous souhaitiez utiliser pleinement les capacités des grands modèles, vous deviez généralement vous appuyer sur des modèles avec des paramètres de plus grande taille. Cependant, les progrès récents des modèles ont montré que les modèles de petite ou moyenne taille continuent d'améliorer leurs capacités avancées telles que l'appel d'outils. Par exemple, l'article indique que de nouveaux modèles tels que Gemma 4 et Qwen-3.6-35B-A3B ont démontré leur capacité à appeler des outils et peuvent théoriquement être utilisés pour rechercher des pages Web, interagir avec des API et des systèmes de fichiers externes, résoudre des problèmes de système en temps réel et effectuer des raisonnements sur des sujets dépassant la portée des données de formation d'origine. Par conséquent, l’un des prochains objectifs de Canonical est d’élargir les investissements de l’équipe, de suivre les dernières versions de modèles dès que possible et de fournir des versions optimisées pour autant de plates-formes de puces que possible.
En plus des capacités de raisonnement de base, Canonical envisage également une expérience de système d'exploitation plus « contextuelle ». Seager a déclaré qu'à mesure que de plus en plus d'utilisateurs s'habituent à travailler avec des « agents », Ubuntu espère présenter les puissantes capacités que Linux a accumulées au fil des années à un plus large éventail de personnes d'une manière plus facile à comprendre et à utiliser. Les responsables envisagent comment intégrer un flux de travail basé sur un agent dans Ubuntu, mais le principe doit toujours être conforme aux habitudes d'utilisation du groupe d'utilisateurs d'Ubuntu et respecter les valeurs de confidentialité et de sécurité. Selon lui, le mécanisme d'empaquetage restreint de Snap, ainsi que les bases posées par Ubuntu ces dernières années pour intégrer les fonctions de base du système, aideront Canonical à atteindre cet objectif de manière plus sécurisée.
L'écosystème de bureau Linux est connu depuis longtemps pour sa fragmentation. Cette fragmentation a contribué dans une certaine mesure à la prospérité de l’écosystème, mais elle a aussi souvent compliqué l’expérience d’intégration et frustré certains utilisateurs. Canonical estime que si de grands modèles peuvent être soigneusement appliqués au niveau du système, ils pourraient aider les utilisateurs à comprendre de manière plus intuitive les capacités des stations de travail Linux modernes, rendant ainsi le bureau Linux plus attrayant pour un plus large éventail de personnes.
Cette vision ne se limite pas au bureau. Seager a mentionné que si vous êtes un ingénieur en fiabilité de site (SRE) gérant un grand nombre de machines Ubuntu, le grand modèle peut également être utile dans divers scénarios, tels que l'interprétation des journaux lors de la gestion des incidents, l'accélération de l'analyse des causes profondes ou l'exécution d'une série de tâches de maintenance planifiées sous des garde-fous stricts. L'objectif de Canonical est de créer un cadre de capacités capable de s'adapter à différentes formes de périphériques Ubuntu, afin que les agents puissent « fonctionner aussi naturellement que les fonctions natives d'Ubuntu » sous différentes interfaces. Il a souligné que confier certaines tâches d'ingénierie de fiabilité des sites à des agents ne signifie pas nécessairement l'introduction d'une nouvelle catégorie de risque, car les environnements de production matures reposent par nature sur un contrôle d'accès strict, des pistes d'audit et une séparation claire entre l'observation et l'exécution ; ce qu'Ubuntu espère faire, c'est fournir aux agents des fonctionnalités de base pouvant fonctionner dans les limites existantes, telles qu'une analyse en lecture seule, des autorisations granulaires et un audit complet des décisions et des résultats.
Du point de vue des scénarios d'utilisation, les responsables envisagent qu'à l'avenir, les utilisateurs pourront demander directement à leurs appareils Linux de résoudre les problèmes de connexion Wi-Fi ou de créer automatiquement une plate-forme logicielle open source préconfigurée, sécurisée et dotée de capacités d'accès TLS. Dans d'autres scénarios, ce type de fonctionnalité peut même devenir l'entrée permettant à d'autres appareils de contrôler l'hôte Linux. La méthode d'interaction peut être constituée d'applications mobiles, de messages texte, de commandes vocales et d'autres médias.
Bien entendu, Canonical admet également que les capacités de raisonnement local sont étroitement liées aux conditions matérielles. Alors que les entreprises s'efforcent de faciliter l'exécution de modèles ouverts sur du matériel grand public ordinaire, les modèles dotés de paramètres plus petits ne peuvent actuellement pas rivaliser avec les modèles plus grands sur de nombreuses tâches. Cependant, Seager estime que cet écart n’est en grande partie qu’un problème progressif ; Alors que les fabricants mondiaux de puces continuent de développer de nouveaux matériels pour le marché grand public dotés de capacités de raisonnement croissantes, des capacités qui semblent aujourd'hui possibles uniquement avec une infrastructure d'IA de pointe deviendront progressivement plus courantes dans les mois, voire les années à venir.
Il a également souligné que lorsqu’on parle d’IA, il ne faut pas se limiter à la performance, mais aussi à l’efficacité. Bien qu'il soit facile pour les utilisateurs de comparer directement la vitesse de génération de jetons des grands modèles de cloud avec les performances des appareils locaux, la consommation d'énergie des accélérateurs natifs locaux sera également considérablement réduite lors du traitement de telles charges de travail, ce qui signifie également que le seuil d'utilisation devrait être encore réduit. Canonical prédit que tout cela ne sera pas achevé du jour au lendemain, mais Ubuntu espère être prêt lorsque les conditions seront réunies, et la coopération avec les fabricants de puces et les travaux d'adaptation associés joueront un rôle de plus en plus important.
Dans l'ensemble, le signal donné par Canonical est clair : Ubuntu n'a pas l'intention de se transformer en un « produit d'IA », mais espère introduire progressivement des capacités d'IA dans les versions futures d'une manière plus prudente, plus contrôlable et plus cohérente avec les valeurs open source. Les responsables ont déclaré que tout au long de 2026, l'équipe travaillerait autour de l'objectif de « permettre aux utilisateurs d'Ubuntu d'accéder à une IA de pointe de manière prudente, sûre et conforme à l'open source ». L'accent est mis sur la formation des ingénieurs, le raisonnement local efficace, l'amélioration de l'accessibilité et une expérience de système d'exploitation plus contextuelle.