Selon Weibo, responsable de Bytedance Seed, l'équipe de Bytedance Seed a officiellement publié une nouvelle génération de modèle de création d'images Seedream 4.0. Selon les rapports, Seedream 4.0 utilise la même architecture pour implémenter des capacités d'édition graphiques et générales, intégrant des capacités de bon sens et de raisonnement. Par rapport aux modèles de génération précédente Seedream 3.0 et SeedEdit 3.0, Seedream 4.0 a réalisé des avancées significatives en termes d'effets multimodaux, de vitesse et de convivialité :


Extension de jeu multimodale : prend en charge de manière flexible la saisie combinée de texte et d'images, permettant des modes créatifs tels que des images basées sur du texte, des images basées sur des images, l'édition d'images, l'édition multi-images et la génération d'images de groupe. Le gameplay est créatif et diversifié.

Esthétique stylisée améliorée : prend en charge un haut degré de liberté dans la migration des styles artistiques, du baroque au cyberpunk, les styles sont en constante évolution et peuvent être combinés pour créer de nouveaux styles avec une esthétique exceptionnelle.

Compréhension logique améliorée : combiné à la connaissance du monde, il améliore la compréhension des entrées multimodales. Il peut d'abord « dessiner » et « penser », démontrant des capacités de raisonnement et de génération dans des tâches impliquant des contraintes physiques et temporelles, résoudre des énigmes et des mots croisés et continuer à écrire des bandes dessinées.

Génération adaptative et 4K : l'image la mieux proportionnée peut être générée selon des instructions ou des images de référence, et prend également en charge les tailles définies par l'utilisateur. La résolution maximale s'étend du 2K au 4K Ultra HD.

Saut de vitesse d'inférence : grâce à une nouvelle conception d'architecture efficace et à une accélération de distillation extrême, la vitesse d'inférence des graphiques générés par DiT est plus de 10 fois supérieure à celle de Seedream 3.0.

Selon le site officiel Weibo, Seedream 4.0 n'est pas seulement un modèle de génération d'images, mais aussi un moteur créatif multimodal complet. Basés sur les dernières capacités de Seedream 4.0, huit méthodes de jeu de base du modèle sont proposées. En plus de la génération et de l'édition générales d'images, le potentiel du modèle dans la création dérivée, la génération d'inférences et les applications professionnelles est également exploré.