Google DeepMind ouvre à certains utilisateurs un nouveau modèle d'IA appelé Project Genie. Les utilisateurs peuvent générer instantanément un monde virtuel de n'importe quel style via des invites textuelles ou en téléchargeant des images, et peuvent l'explorer librement en contrôlant des personnages ou des véhicules comme en jouant à un jeu vidéo. Cette fonctionnalité est actuellement disponible via une application Web et les utilisateurs disposant d'un compte Google Ultra aux États-Unis et âgés de plus de 18 ans peuvent l'essayer.

Project Genie est basé sur le modèle Genie 3 que Google a déjà présenté à un petit groupe de testeurs en août 2025, et combine le modèle de génération d'images Nano Banana Pro de la société et le modèle multimodal Gemini pour convertir les signaux de langage naturel en scènes interactives immersives. Les types de mondes que les utilisateurs peuvent construire sont extrêmement divers, comme piloter un vaisseau spatial au-dessus d'une planète extraterrestre, piloter un dirigeable au-dessus d'une ville européenne de style années 1950 ou laisser un tapir s'enfoncer au fond de la forêt amazonienne, etc., qui peuvent tous être rapidement générés avec de simples descriptions ou des photos de référence.

En termes d'expérience spécifique, Project Genie générera des images dans le monde virtuel en temps réel en fonction de la façon dont le joueur déplace le personnage et fait pivoter la perspective, et prendra en charge l'interaction avec les objets de la scène et la réponse aux changements environnementaux. Par exemple, dans la vidéo de démonstration officielle, lorsqu'une balle bleue roule dans l'herbe blanche, tout ce qu'elle passe sera « peint » en bleu, formant un effet de trajectoire en constante évolution ; dans le même temps, l'application dispose également d'une bibliothèque de modèles mondiaux intégrée que les utilisateurs peuvent créer et modifier pour un démarrage rapide.

Les utilisateurs peuvent non seulement naviguer dans ces environnements, mais également télécharger leurs propres personnages dessinés, des photos d'objets du monde réel, etc. en tant que matériaux, et définir une logique d'interaction entre différents éléments pour créer une expérience virtuelle plus personnalisée. Dans certaines scènes, vous pouvez même voir un retour dynamique similaire à celui d'une interface de navigation GPS : lorsque le joueur tourne ou bouge, la carte sur l'interface se met également à jour, améliorant ainsi l'immersion et la jouabilité.

Dans une interview avec Jack Parker-Holder et Diego Rivas, membres de l'équipe Project Genie, le YouTuber Bilawal Sidhu a souligné que le système actuel présente encore des bugs occasionnels dans les démonstrations réelles et que chaque expérience est limitée à 60 secondes, ce qui est l'une des plus grandes contraintes fonctionnelles du moment. Cependant, l'équipe de développement a déclaré qu'à l'avenir, elle se concentrerait sur l'exploration de la manière de donner plus de contrôle sur l'environnement et le comportement des personnages lors de la saisie de l'utilisateur, et étudierait des solutions réalisables pour prolonger la durée du monde virtuel et dépasser la limite supérieure de 60 secondes.

Quant aux scénarios d’application, l’équipe DeepMind n’a pas encore donné de direction claire, mais est optimiste quant à son potentiel dans de multiples domaines. Les rapports indiquent que Project Genie devrait être utilisé pour prototyper rapidement des idées de jeux vidéo, aider les créateurs de films à visualiser des scènes et des storyboards, et aider les étudiants à comprendre des concepts complexes ou des scénarios professionnels de manière plus interactive en classe, par exemple en simulant la participation à des travaux de sauvetage après une catastrophe, sans exiger que les utilisateurs aient des compétences de développement professionnel.

L'auteur craint également que l'ouverture de cette technologie s'accompagne inévitablement de défis en matière de sécurité et de conformité du contenu, notamment sur la manière de mettre en place des « garde-corps » pour empêcher la génération de contenu nuisible ou inapproprié, et sur la manière d'éviter d'éventuels problèmes de violation du droit d'auteur pendant le processus de création. Google n'a pas encore entièrement divulgué en détail son mécanisme de gouvernance, mais il devrait continuer à ajuster ses stratégies pertinentes dans les futures itérations de produits.

Actuellement, les utilisateurs résidant aux États-Unis et abonnés à Google AI Ultra peuvent déjà découvrir Project Genie directement via la page du projet expérimental de Google. À mesure qu'elle s'ouvrira davantage à un plus grand nombre de régions et d'utilisateurs, cette nouvelle méthode d'interaction de l'IA consistant à « générer et accéder au monde virtuel en une seule phrase » pourrait devenir l'un des outils importants dans les domaines du développement de jeux, de la conception créative, de l'éducation et de la formation.