Une nouvelle étude prédit que d’ici mi-2024, les campagnes d’intelligence artificielle menées par des « mauvais acteurs » causant du tort en ligne en diffusant de la désinformation seront monnaie courante. Les résultats sont préoccupants étant donné que plus de 50 pays, dont les États-Unis, organiseront des élections nationales cette année et que les résultats auront des conséquences mondiales.

Même avant la sortie de la dernière itération du système Generative Pretrained Transformer (GPT), les experts en IA prédisaient que d’ici 2026, 90 % du contenu en ligne serait généré par ordinateur sans intervention humaine, ce qui entraînerait la propagation de la désinformation et de la désinformation.

Certains partent du principe que les grandes plateformes de médias sociaux comptant le plus grand nombre d’utilisateurs devraient être réglementées afin de contrôler les risques. Cette hypothèse est correcte dans une certaine mesure et en fait également la cible de législations telles que la loi européenne sur les services numériques et la loi sur l’intelligence artificielle. Cependant, il existe d’autres « mauvais acteurs » plus petits – des individus, des groupes et des pays qui adoptent intentionnellement un comportement préjudiciable à autrui – qui abusent également de l’IA.

Une nouvelle étude menée par des chercheurs de l'Université George Washington (GW) fournit la première analyse scientifique quantitative examinant comment de mauvais acteurs abusent de l'intelligence artificielle et des systèmes GPT pour nuire aux plateformes de médias sociaux du monde entier, et ce qui peut être fait à leur sujet.

"Tout le monde parle des dangers de l'intelligence artificielle, mais avant notre étude, il n'y avait aucune science derrière cela", a déclaré Neil Johnson, l'auteur principal de l'étude. "Vous ne pouvez pas gagner une bataille sans une compréhension approfondie du champ de bataille."

Les chercheurs ont commencé par cartographier le réseau dynamique de communautés de médias sociaux interconnectées qui composent la population mondiale en ligne. Les utilisateurs – parfois quelques personnes, parfois des millions – rejoignent ces communautés en raison d’intérêts communs, qui peuvent entraîner des préjudices. Les chercheurs se sont concentrés sur les communautés « anti-X » extrêmes, où au moins deux des 20 messages les plus récents de chaque communauté contenaient des discours de haine explicites et/ou un nationalisme et/ou un racisme extrême. Ces communautés anti-X comprennent des communautés anti-américaines, anti-femmes, anti-avortement ou antisémites. Au fil du temps, les liens entre ces communautés peuvent former des regroupements communautaires au sein et entre différentes plateformes de médias sociaux.

"Toute communauté A peut créer un lien (c'est-à-dire un hyperlien) vers n'importe quelle communauté B, à condition que le contenu de B intéresse les membres de A. Le lien dirige l'attention des membres de A vers B, et les membres de A peuvent ajouter des commentaires sur B sans que les membres de B connaissent le lien - ainsi, les membres de la communauté B peuvent être exposés et potentiellement influencés par les membres de la communauté A", ont déclaré les chercheurs.

À l’aide de modèles mathématiques, les chercheurs ont identifié une activité possible entre les mauvais acteurs et l’IA et pourquoi. Plus précisément, ils ont constaté que les systèmes GPT les plus élémentaires, tels que GPT-2, étaient suffisants et plus susceptibles d'attirer les mauvais acteurs que les versions plus sophistiquées, telles que GPT-3 ou -4. En effet, GPT-2 peut facilement reproduire le style et le contenu humains dans des communautés en ligne extrêmes, et les « mauvais acteurs » peuvent exploiter des outils de base comme GPT-2 pour produire des résultats plus incendiaires en modifiant subtilement la forme des requêtes en ligne sans en changer la signification. En revanche, GPT-3 et -4 incluent un filtre qui remplace les réponses aux invites potentiellement controversées, empêchant ainsi une telle sortie.

Les chercheurs affirment que l’activité des mauvais acteurs en matière d’IA est susceptible de prospérer sur le « champ de bataille » en ligne qu’est la communauté des « mauvais acteurs » et les communautés auxquelles ils sont directement liés, c’est-à-dire la communauté dominante vulnérable. Ensemble, ces communautés constituent un écosystème en ligne de plus d’un milliard de personnes, permettant à l’intelligence artificielle méchant-acteur de s’épanouir à l’échelle mondiale. Les chercheurs ont cité la haine et l’extrémisme non générés par l’IA liés au COVID-19 et aux récentes guerres Russie-Ukraine et Israël-Hamas pour illustrer leur propos.

Ils prédisent que d’ici le milieu de l’année 2024, les mauvais comportements de l’IA deviendront monnaie courante. Pour le déterminer, ils ont utilisé des données proxy provenant de deux incidents historiquement similaires impliquant la manipulation de systèmes électroniques en ligne : l’attaque algorithmique automatisée de 2008 contre les marchés financiers américains et la cyberattaque chinoise de 2013 contre les infrastructures américaines. En analysant ces ensembles de données, ils ont déduit la fréquence des attaques de ces deux incidents dans le contexte des progrès actuels de la technologie de l’intelligence artificielle.

2024 est connue comme « la plus grande année électorale de l’histoire ». Plus de 50 pays, dont les États-Unis, organiseront des élections nationales cette année. De la Russie, de Taiwan, du Royaume-Uni et de l'Inde au Salvador et à l'Afrique du Sud, les résultats de certaines élections auront des ramifications mondiales et auront d'énormes conséquences sur les droits de l'homme, l'économie, les relations internationales et la paix mondiale. En conséquence, la menace que des acteurs malveillants utilisent l’intelligence artificielle pour diffuser et amplifier la désinformation lors de ces élections est réelle, affirment les chercheurs.

Ils recommandent aux sociétés de médias sociaux d’adopter des stratégies pour lutter contre la désinformation, plutôt que de supprimer tout contenu généré par de mauvais acteurs.

Compte tenu de l’évolution rapide de l’intelligence artificielle, les chercheurs ont émis une mise en garde quant à leurs conclusions. Néanmoins, la recherche met en évidence certains des défis importants posés par les mauvais acteurs exploitant l’intelligence artificielle.

Les chercheurs ont déclaré : « En raison du développement rapide de la technologie et de l'évolution rapide de l'environnement réseau, personne ne peut prédire avec précision ce qui arrivera à l'IA des mauvais acteurs à l'avenir. À strictement parler, les prédictions de cet article sont spéculatives. Cependant, ces prédictions sont quantifiées, testables et généralisables, fournissant ainsi un point de départ concret pour renforcer les discussions sur les politiques en matière d'IA des mauvais acteurs. »

La recherche a été publiée dans la revue PNAS Nexus.