Meta a annoncé avoir collecté des publications publiques sur Facebook et Instagram pour entraîner certaines des fonctions de son nouvel assistant virtuel d'intelligence artificielle. Le géant des médias sociaux a souligné qu'il n'inclut pas les publications privées des utilisateurs ni les informations partagées avec leurs amis et leur famille dans les données d'entraînement.

"Nous essayons d'exclure les ensembles de données dans lesquels les informations personnelles représentent une grande partie des données", a déclaré Nick Clegg, président des affaires mondiales de l'entreprise, dans une interview à Reuters lors de la conférence Meta's Connect la semaine dernière. L’ancien vice-Premier ministre britannique a ajouté que la grande majorité des données utilisées par Meta pour la formation devaient initialement être publiques. "

Meta a annoncé mercredi dernier la version bêta de MetaAI, un assistant conversationnel avancé disponible sur WhatsApp, Messenger et Instagram, et sera disponible sur les lunettes intelligentes Ray-Ban Meta et Quest3.

MetaAI est alimenté par le modèle de langage LLaMA2 et le modèle texte-image Emu publiés en juillet de cette année, tous deux formés sur des publications publiques de Facebook et Instagram.

Clegg a déclaré que LinkedIn est un exemple dans lequel Meta n'utilise pas intentionnellement son contenu pour la formation des données en raison de problèmes de confidentialité.

L’un des nombreux éléments controversés de l’IA générative reste la question des droits d’auteur sur le contenu sur lequel ses LLM sont formés. Cette année, des artistes ont intenté des poursuites pour droits d'auteur contre StableDiffusion et Midjourney, tandis que des écrivains, dont John Grisham et George R.R. Martin, ont poursuivi OpenAI. Clegg a déclaré qu'il s'attendait à ce qu'il y ait « un nombre important de litiges » sur la question de savoir si le contenu créatif est couvert par les doctrines existantes en matière d'utilisation équitable.

"Nous le pensons, mais je doute fortement que cela fasse l'objet d'un procès", a déclaré Clegg.

Meta n'est pas la seule entreprise à utiliser le contenu des utilisateurs pour former l'intelligence artificielle. Le xAI d'Elon Musk fait la même chose en utilisant les tweets des utilisateurs, et Google a confirmé dans une mise à jour de sa politique en juillet que tout le contenu publié par les utilisateurs sera utilisé pour la formation en IA.

Mercredi dernier, le patron de Meta, Mark Zuckerberg, a également annoncé le lancement d'un certain nombre de chatbots basés sur l'intelligence artificielle, qui s'appuieront sur des célébrités et des personnalités influentes, notamment Tom Brady, Mr. Beast, Paris Hilton, Kendall Jenner et Snoop Dogg. Meta annonce qu'elle lancera 28 robots également alimentés par LLaMA2. L'événement n'a pas été un succès complet.