Les chercheurs découvrent que ChatGPT peut divulguer des informations sensibles en répétant certains mots

Une équipe de chercheurs de Google a découvert que ChatGPT, le chatbot d'intelligence artificielle d'OpenAI, peut divulguer des informations sensibles dans ses données de formation, telles que les informations personnelles de personnes réelles. Il est rapporté que ChatGPT est un nouvel outil de chatbot IA lancé par OpenAI le 30 novembre 2022. Il peut générer rapidement des articles, des histoires, des paroles, de la prose, des blagues et même des codes selon les besoins des utilisateurs, et répondre à diverses questions.

Deux mois seulement après son lancement, ChatGPT a atteint 100 millions d'utilisateurs actifs mensuels, ce qui en fait l'une des applications grand public à la croissance la plus rapide de l'histoire. Lors de la première conférence des développeurs OpenAI qui s'est tenue le 6 novembre de cette année, le PDG d'OpenAI, Sam Altman, a annoncé que le nombre d'utilisateurs actifs hebdomadaires de ChatGPT avait atteint 100 millions.

Comme tous les grands modèles de langage (LLM), les modèles d'apprentissage automatique sous-jacents qui alimentent ChatGPT sont formés à l'aide de grandes quantités de données récupérées sur Internet. Mais ce qui est inquiétant, c'est que certaines des données de formation extraites contenaient des informations d'identification sur de vraies personnes, notamment des noms, des adresses e-mail et des numéros de téléphone.

Les chercheurs de Google ont trouvé un moyen pour que ChatGPT révèle certaines des données utilisées pour la formation en lui demandant de répéter certains mots « pour toujours ». Les données comprenaient des informations privées (par exemple, noms personnels, adresses e-mail, numéros de téléphone, etc.), des extraits de documents de recherche et d'articles de presse, des pages Wikipédia, etc.

Katherine Lee, chercheuse scientifique principale chez Google Brain, a déclaré : « Nous avons découvert cette vulnérabilité en juillet et en avons informé OpenAI le 30 août, et après la période de divulgation standard de 90 jours, nous avons publié la vulnérabilité. Maintenant que nous l'avons divulguée à OpenAI, la situation peut être différente maintenant. Les chercheurs ont déclaré qu'OpenAI avait corrigé la vulnérabilité le 30 août.

Les médias étrangers ont déclaré que la vulnérabilité de ChatGPT découverte par les chercheurs de Google soulevait de graves problèmes de confidentialité, en particulier pour les modèles formés sur des ensembles de données contenant des informations sensibles.