Une nouvelle étude montre que dans des scénarios de crise géopolitique simulés, les modèles avancés d'intelligence artificielle sont beaucoup plus « faciles » que les humains sur la question de l'utilisation des armes nucléaires, manquant des réserves et des préoccupations fortes que les décideurs humains affichent habituellement. La recherche a été dirigée par Kenneth Payne, chercheur au King's College de Londres, au Royaume-Uni, qui a opposé trois principaux modèles de langage à grande échelle - GPT-5.2, Claude Sonnet 4 et Gemini 3 Flash - les uns contre les autres dans une série de jeux de guerre pour examiner leurs modèles de comportement dans des jeux à enjeux élevés.

Ces scénarios couvrent des confrontations internationales très tendues telles que des conflits frontaliers, une compétition pour des ressources rares et des crises de vie ou de mort affectant la survie d'un régime. Les chercheurs ont conçu une « échelle d'escalade » permettant au modèle de choisir des actions à chaque tour, avec des options allant des protestations diplomatiques, un recours limité à la force, des compromis et même une capitulation totale, jusqu'au lancement d'une guerre nucléaire stratégique à grande échelle. Dans toutes les expériences, les trois IA ont joué un total de 21 parties, accumulant 329 tours de prise de décision et généré environ 780 000 mots de texte « raisons de décision », fournissant une grande quantité de matériel pour analyser leurs schémas de pensée.

Les résultats ont été inquiétants pour les chercheurs : dans 95 % des simulations, au moins une arme nucléaire tactique a été « activée » par un modèle. Payne a souligné que par rapport au « tabou nucléaire » à long terme dans la réalité, ces modèles d'IA ne reflètent évidemment pas la même force de liaison psychologique et morale. Ce qui est plus remarquable, c'est que même si la situation du champ de bataille est défavorable, ces modèles ne choisissent presque jamais de répondre complètement aux demandes de l'adversaire ou de déclarer leur capitulation ; dans les cas les plus bénins, ils ne font que réduire le niveau de violence par étapes, plutôt que de renoncer fondamentalement à la confrontation.

En outre, l'étude a également révélé que l'IA peut également commettre des erreurs dans des environnements simulés tels que le « brouillard de guerre ». Dans 86 % des conflits, le modèle prévoyait uniquement de prendre des mesures d'escalade de niveau inférieur sur la base de son propre raisonnement, mais en raison d'un biais de jugement ou d'exécution, la situation a dégénéré de manière inattendue en une confrontation plus intense. En d’autres termes, même sous un contrôle algorithmique pur, des erreurs de jugement et des « escalades d’accidents » se produisent encore fréquemment, ce qui peut avoir des conséquences fatales dans le monde réel.

James Johnson, de l'Université d'Aberdeen au Royaume-Uni, a qualifié ces résultats de « troublants » du point de vue du risque nucléaire. Il s'inquiète du fait que dans les décisions réelles à haut risque, la plupart des dirigeants humains ont tendance à faire preuve d'un certain degré de retenue et de délibération, mais si les systèmes d'IA se font concurrence, les « robots » des deux côtés pourraient continuer à augmenter l'intensité des réactions de chacun, poussant ainsi la situation au bord du désastre.

Cette recherche est importante car de nombreux pays à travers le monde expérimentent déjà l’utilisation de l’intelligence artificielle dans les jeux de guerre et la planification militaire. Zhao Tong, de l’Université de Princeton, a souligné que les grandes puissances d’aujourd’hui utilisent déjà l’IA pour participer à des jeux de guerre, mais on ne sait toujours pas dans quelle mesure les pays ont véritablement intégré ce type d’aide à la décision par l’IA dans leurs processus décisionnels militaires réels. Il estime que, au moins dans le domaine de la prise de décision en matière d’armes nucléaires, les pays resteront assez prudents dans des circonstances normales et qu’il est peu probable qu’ils permettent facilement à l’IA de participer directement, voire de dominer, les jugements sur l’utilisation des armes nucléaires.

Payne partage un point de vue similaire. Il a déclaré qu'en réalité, "personne ne remettrait la clé du lancement de missiles nucléaires à une machine et la laisserait ensuite décider seule". Cependant, Zhao Tong a rappelé que dans les situations où le temps de prise de décision est extrêmement réduit, comme lorsque le temps de vol des missiles est extrêmement court et que le commandement doit prendre des décisions de vie ou de mort en quelques minutes, l'armée peut être plus encline à s'appuyer sur l'IA pour fournir des évaluations et des solutions rapides, ce qui ouvre un espace pour que l'IA soit « sur la table » dans les liens clés.

Zhao Tong a également suggéré que la raison pour laquelle l'IA est si « belliqueuse » dans les simulations n'est peut-être pas simplement due au fait qu'elle n'a pas la peur et le fardeau émotionnel que ressentent les humains lorsqu'ils sont confrontés au « bouton rouge ». Il estime que le problème le plus profond réside dans le fait que ces modèles ne sont peut-être pas capables de comprendre véritablement le sens des « enjeux » comme le font les humains, et qu’il est difficile de convertir des chiffres abstraits de pertes en sentiments intuitifs sur la mort de la vie réelle et l’effondrement de la société. Ce défaut structurel du « manque de compréhension humaine des enjeux » pourrait être l’une des principales raisons pour lesquelles le pays choisit fréquemment la mise à niveau nucléaire.

Cela amène également les gens à réexaminer le principe fondamental de la « destruction mutuelle assurée » (MAD) qui maintient la stabilité de la dissuasion nucléaire depuis des décennies. Selon ce principe, aucun dirigeant rationnel ne prendra l’initiative d’une frappe nucléaire à grande échelle, car l’adversaire répondra inévitablement par une contre-attaque nucléaire égale, voire plus violente, conduisant à la destruction commune des deux parties et même de la civilisation humaine. Johnson a déclaré qu’il n’était pas clair si la logique de MAD fonctionnerait toujours si l’IA était impliquée dans de tels jeux.

Les recherches montrent qu’une fois qu’un modèle déploie des armes nucléaires tactiques dans une simulation, le modèle adverse choisit de désamorcer la situation et ne tente de désescalader que 18 % du temps environ. Cela signifie que dans la plupart des cas, l'IA ne considérera pas l'utilisation nucléaire de l'adversaire comme un « dernier avertissement » pour se forcer à arrêter, mais préférera continuer l'escalade ou maintenir une confrontation de haute intensité. Johnson estime que cela peut « renforcer la dissuasion » dans une certaine mesure parce que la menace de l'IA semble plus « crédible », mais en même temps, cela peut également modifier la fenêtre de temps dont disposent les dirigeants pour percevoir les menaces et prendre des décisions, augmentant ainsi de manière invisible le risque d'erreur de jugement et de perte de contrôle. Il a souligné que l'IA elle-même n'appuie peut-être pas directement sur le bouton d'une guerre nucléaire, mais qu'elle peut profondément façonner la cognition et la pression temporelle associées, et que ces facteurs finiront par déterminer si les dirigeants humains croient qu'ils n'ont « pas le choix ».

Cela reflète également en partie le fait que la transparence technique et la communication externe autour des applications militaires de l’IA, en particulier sur les questions de risque nucléaire, restent assez limitées, alors que ce domaine se place rapidement au centre des véritables agendas politiques et de sécurité.