OpenAI déploie plus largement son dernier générateur de texte en image. Jeudi, la société mettra le nouveau modèle DALL-E3 à la disposition des clients ChatGPTPlus et des entreprises pour une utilisation dans l'application ChatGPT. OpenAI a déclaré avoir préparé une pile d'atténuation de sécurité pour le modèle, lui permettant d'étendre sa version.
DALL-E3 a été publié pour la première fois le mois dernier et OpenAI a montré comment il s'est amélioré par rapport au précédent DALL-E2 en permettant aux utilisateurs d'exploiter ChatGPT pour écrire des invites plus longues et plus visuellement descriptives à utiliser par les générateurs d'images. DALL-E3 a été ajouté à Bing Chat et Bing Image Generator, faisant de la plate-forme Microsoft la première à offrir un accès plus large aux modèles au public, avant même ChatGPT.
Les mesures de protection annoncées pour réduire les images nuisibles n'ont pas toujours fonctionné, les utilisateurs générant des images du World Trade Center montrant Bob l'éponge et d'autres personnages volant des avions vers les bâtiments. Même si Microsoft a essayé de bloquer certaines invites, d'autres solutions simples ont produit des résultats similaires.
Les générateurs de texte en image tels que Midjourney, StableDiffusion et les versions antérieures de DALL-E ont tous suscité la controverse. La technologie a exporté des images protégées par le droit d’auteur, de la nudité non consensuelle, des sujets de changement racial et des représentations photoréalistes fausses de personnalités publiques.
OpenAI promet cette fois-ci une approche plus large et a fourni un site Web présentant les recherches effectuées sur DALL-E3. La société affirme qu'elle "limitera la probabilité que les modèles génèrent du contenu stylisé par des artistes vivants et des images de personnalités publiques, et améliorera la représentation démographique des images générées". OpenAI dispose également d'un outil interne de « classificateur de provenance », qui, selon lui, est précis à 99 % pour détecter si une image a été générée par DALL-E3.