Selon le MIT Technology Review, le ministère américain de la Défense envisage un changement majeur : créer un environnement de formation hautement confidentiel pour les sociétés d’intelligence artificielle générative afin qu’elles puissent former des versions militaires de grands modèles sur des données classifiées du renseignement militaire. Cela signifie que les modèles qui, à l'origine, ne faisaient que « lire » et « répondre à des questions » dans un environnement confidentiel peuvent directement utiliser des données confidentielles comme matériel de formation à l'avenir, « écrivant » ainsi des informations sensibles dans le modèle lui-même.

Déjà, certains modèles d’IA générative, comme Claude d’Anthropic, sont déployés dans des environnements classifiés pour répondre aux questions et faciliter l’analyse, y compris sur des cibles iraniennes. Cependant, ces modèles ne traitent actuellement que les informations confidentielles sur la base des capacités existantes et ne réutiliseront pas les données pour entraîner et mettre à jour les modèles eux-mêmes. S’il est autorisé à être entraîné sur des données classifiées, le modèle devrait être plus précis et plus efficace dans l’exécution de tâches militaires spécifiques, mais il introduira également des risques de sécurité sans précédent.
Un responsable américain anonyme de la défense a déclaré que la formation du modèle personnalisé de l'armée sur des données classifiées devrait améliorer considérablement ses performances et sa fiabilité dans des missions spécifiques. Ce projet intervient dans un contexte de demande croissante de modèles d'IA plus puissants dans l'armée américaine : le Pentagone a conclu des accords avec OpenAI et xAI de Musk pour faire fonctionner ses modèles dans un environnement classifié, et poursuit une nouvelle stratégie d'intelligence artificielle visant à transformer l'armée américaine en une « force de combat axée sur l'IA » en réponse à l'escalade du conflit avec l'Iran. Au moment de mettre sous presse, le Pentagone n’a pas officiellement commenté ce plan de formation.
Selon deux personnes familiarisées avec les modes de fonctionnement concernés, la formation ci-dessus sera organisée dans un centre de données certifié pour les projets classifiés, où une certaine version du modèle d'IA sera associée à des données classifiées dans le même environnement sécurisé. Selon le responsable de la défense, bien que la propriété des données reste la propriété du ministère américain de la Défense, dans de rares cas, les employés de l'entreprise d'IA peuvent également être autorisés à accéder aux données confidentielles si le personnel concerné dispose de l'habilitation de sécurité appropriée. Avant d’aborder réellement les données classifiées, le Pentagone prévoit de les tester d’abord sur des données non classifiées, telles que des images satellite commerciales, afin d’évaluer les améliorations réelles en termes de précision et d’efficacité du modèle formé.
L’armée américaine utilise depuis longtemps une ancienne génération de modèles de vision par ordinateur pour effectuer la reconnaissance d’objets sur des images et des vidéos collectées par des drones et des avions de reconnaissance, et a chargé des entreprises, dans le cadre de contrats gouvernementaux, de former des algorithmes sur ces données. Ces dernières années, de grands modèles linguistiques dédiés et des versions de chatbots pour les scénarios gouvernementaux sont également apparus les uns après les autres, comme Claude Gov lancé par Anthropic, qui met l'accent sur les capacités multilingues et le déploiement dans un environnement sécurisé. Cependant, cette déclaration des responsables de la défense est la première fois qu'il est clairement révélé que des entreprises telles qu'OpenAI et xAI qui développent des modèles linguistiques à grande échelle peuvent former directement des modèles personnalisés par le gouvernement sur des données confidentielles.
Aalok Mehta, ancien responsable de la politique d'IA chez Google et OpenAI et aujourd'hui directeur du Wadhwani AI Center du Centre d'études stratégiques et internationales (CSIS), a souligné que par rapport au simple « lire et répondre » dans un environnement confidentiel, l'utilisation véritable de données confidentielles pour former des modèles entraînera de nouveaux risques. Il estime que le plus gros problème est que les informations confidentielles absorbées par la formation des modèles peuvent « refaire surface » lorsqu'elles seront interrogées ou appelées par différents utilisateurs à l'avenir. Cela est particulièrement dangereux lors du partage d’un ensemble de modèles entre plusieurs services ou services présentant différents niveaux de sécurité et différents besoins en matière de renseignement.
Par exemple, Mehta a déclaré que si un modèle avait accès à des renseignements humains très sensibles, tels que l'identité d'un agent secret, ces informations pourraient être accidentellement « divulguées » à une autre branche de l'armée lorsque le modèle était utilisé par une autre branche de l'armée qui n'y avait pas accès. Non seulement cela poserait un risque de vie ou de mort pour les sources de renseignement et le personnel de première ligne, mais il serait également techniquement difficile de l'empêcher de manière absolue, surtout lorsque le même modèle est partagé par plusieurs unités. En revanche, il estime qu’il est relativement plus facile de « verrouiller » les informations confidentielles au sein de l’armée et d’éviter qu’elles ne reviennent vers l’Internet ouvert ou vers les sociétés d’IA.
À l'heure actuelle, le gouvernement américain a mis en place certaines infrastructures pertinentes : par exemple, la société de sécurité Palantir a reçu plusieurs contrats à grande échelle pour construire un système de sécurité pour le gouvernement, capable de répondre aux questions et réponses sur des sujets confidentiels sans transmettre les informations aux sociétés d'IA. Dans ces systèmes, les responsables peuvent remettre en question les modèles concernant les contenus classifiés, tandis que les données sont limitées à un environnement contrôlé. Cependant, appliquer la même architecture de sécurité à la formation, et pas seulement à l’inférence et à la réponse aux questions, reste un nouveau défi technique et de gestion.
En janvier de cette année, le secrétaire à la Défense Pete Hegseth a publié une note appelant à accélérer l’introduction de davantage de capacités d’IA dans l’ensemble du système de défense, faisant ainsi la promotion du plan de course du Pentagone dans ce domaine. L'IA générative a été utilisée dans des combats réels, par exemple pour classer les cibles potentielles et donner des suggestions de frappes prioritaires. Il a également été utilisé dans des travaux administratifs tels que la rédaction de contrats et l'organisation de rapports. Du point de vue du secteur de la défense, de nombreuses tâches initialement exécutées par des analystes humains pourraient à l’avenir s’appuyer sur des modèles d’IA plus puissants, mais cela signifie également que de grandes quantités de données confidentielles doivent être ouvertes aux modèles.
Mehta a déclaré que l'armée pourrait vouloir que l'IA apprenne certains jugements subtils qui s'appuient fortement sur l'expérience, comme l'identification d'indices extrêmement subtils dans des images comme un analyste principal, ou l'établissement de liens complexes entre des renseignements nouvellement acquis et des informations historiques. À cette fin, les vastes et multilingues données textuelles, audio, images et vidéo des agences de renseignement peuvent devenir des sources de matériel de formation. Cependant, il a également souligné qu'il est difficile d'expliquer au monde extérieur quelles tâches spécifiques nécessitent une formation sur des données confidentielles, car le ministère de la Défense est fortement incité à garder secrètes ses capacités spécifiques et ne veut pas que d'autres pays comprennent avec précision les limites technologiques des États-Unis dans ce domaine.
Aux yeux du monde extérieur, la démarche du Pentagone n’est pas seulement une réponse aux besoins de première ligne, mais aussi un pari technologique à haut risque : une fois que le renseignement confidentiel sera profondément intégré dans de grands modèles, l’armée bénéficiera de capacités d’analyse automatisée et d’aide à la décision qui dépassent de loin celles des systèmes traditionnels. Cependant, il devra également faire face à de nouveaux risques de sécurité tels qu'une « mémoire de modèle excessive », des fuites accidentelles et des limites d'accès floues. Actuellement, les agences de défense américaines tentent de trouver un équilibre entre « obtenir un avantage militaire » et « contrôler les risques de sécurité », qui n'a pas été pleinement testé dans la pratique, en établissant des centres de données sécurisés hautement isolés, un contrôle d'accès strict et des méthodes de déploiement de modèles en couches et personnalisés.