Les dirigeants de MetaPlatforms ont déclaré à Reuters dans une interview que la société utilisait des publications publiques sur Facebook et Instagram pour former certaines des fonctionnalités de son nouvel assistant virtuel d'intelligence artificielle Meta, mais excluait les publications privées partagées uniquement avec la famille et les amis dans le but de respecter la vie privée des consommateurs.

Meta n'utilise pas non plus les discussions privées sur son service de messagerie comme données de formation pour ses modèles et a pris des mesures pour filtrer les détails privés de l'ensemble de données publiques utilisé pour la formation, a déclaré Nick Clegg, président des affaires mondiales de Meta, en marge de la conférence annuelle Connect de l'entreprise cette semaine.

"Nous avons essayé d'exclure les ensembles de données dans lesquels les informations personnelles sont majoritairement présentes", a déclaré Clegg, ajoutant que la "grande majorité" des données utilisées par Meta pour la formation sont accessibles au public.

Citant LinkedIn comme exemple, il a souligné que Meta n'utilise pas intentionnellement le contenu du site pour des raisons de confidentialité.

Les commentaires de Clegg interviennent alors que des entreprises technologiques telles que Meta, OpenAI et Google d'Alphabet ont été critiquées pour avoir utilisé des informations récupérées sur Internet pour entraîner leurs modèles d'intelligence artificielle sans autorisation.

Les deux sociétés réfléchissent à la manière de traiter le matériel privé ou protégé par le droit d'auteur que leurs systèmes d'intelligence artificielle pourraient copier au cours du processus, tout en faisant également face à des poursuites judiciaires de la part d'auteurs les accusant de violation du droit d'auteur.

Le PDG Mark Zuckerberg a dévoilé mercredi le premier lot d'outils d'intelligence artificielle destinés aux consommateurs lors de la conférence produit annuelle de Meta « Connect », MetaAI étant le produit le plus important. La conférence de cette année était axée sur l’intelligence artificielle, contrairement aux conférences précédentes axées sur la réalité augmentée et la réalité virtuelle.

Meta indique que l'assistant utilise un modèle personnalisé basé sur le puissant modèle de langage à grande échelle Llama2, qui a été mis à disposition pour un usage commercial en juillet de cette année, ainsi qu'un nouveau modèle appelé Emu qui génère des images basées sur des invites textuelles.

Le produit sera capable de générer du texte, du son et des images, et pourra accéder à des informations en temps réel grâce à la coopération avec le moteur de recherche Bing de Microsoft. Les publications publiques sur Facebook et Instagram utilisées pour entraîner MetaAI incluent également du texte et des photos.

Un porte-parole de Meta a déclaré à Reuters que les publications étaient utilisées pour entraîner les capacités de génération d'images d'Emu, tandis que la fonction de chat était basée sur Llama2 avec l'ajout d'ensembles de données annotées accessibles au public.

L'interaction avec MetaAI peut également être utilisée pour améliorer les fonctionnalités futures, a déclaré le porte-parole. Meta impose des restrictions de sécurité sur ce que les outils MetaAI peuvent générer, par exemple en interdisant la création d'images réalistes de personnalités publiques.

Concernant le matériel protégé par le droit d'auteur, Clegg a déclaré qu'il s'attendait à « un nombre important de litiges » sur la question de savoir si « le contenu créatif relève de la doctrine existante de l'utilisation équitable », qui autorise une utilisation limitée des œuvres protégées à des fins telles que le commentaire, la recherche et la parodie.

Certaines entreprises disposant d'outils de génération d'images facilitent la reproduction de personnages emblématiques comme Mickey Mouse, tandis que d'autres paient pour les images ou évitent intentionnellement de les inclure dans leurs données d'entraînement.

OpenAI, par exemple, a signé cet été un accord de six ans avec le fournisseur de contenu Shutterstock pour utiliser la bibliothèque d'images, de vidéos et de musique de l'entreprise à des fins de formation.

Lorsqu'on lui a demandé si Meta avait pris de telles mesures pour éviter de copier des images protégées par le droit d'auteur, un porte-parole de Meta a noté que les nouvelles conditions d'utilisation interdisent le contenu généré par l'utilisateur qui viole la vie privée et les droits de propriété intellectuelle.