Aujourd'hui, Volcano Engine a officiellement lancé le modèle de pouf 1.8 et le modèle de création audio et vidéo Seedance 1.5 pro lors de la FORCE Power Conference. Des données d'évaluation faisant autorité montrent que Doubao Big Model s'est classé premier au monde en termes de compréhension multimodale, de capacités de génération et de capacités d'agent.
Selon Tan Dai, président de Volcano Engine, en décembre de cette année, l'utilisation quotidienne moyenne des jetons de Doubao Big Model a dépassé 50 000 milliards, soit une augmentation de plus de 10 fois par rapport à la même période de l'année dernière ; Actuellement, plus de 100 entreprises clientes ont accumulé une utilisation de jetons de plus de 1 000 milliards.
En tant que dernier modèle phare de la famille Doubao, le grand modèle Doubao 1.8 (Doubao-Seed-1.8) a été optimisé pour les scénarios d'agents multimodaux. Sa capacité d'appel d'outils, sa capacité de suivi d'instructions complexes et sa capacité d'agent OS ont toutes été améliorées, améliorant ainsi le niveau de planification et d'exécution du modèle lors du traitement de tâches complexes.
En termes de compréhension visuelle, le nombre d’images de compréhension vidéo unique de Doubao 1.8 a doublé, passant de 640 images à 1 280 images. Le modèle prend en charge la compréhension de très longues vidéos à des fréquences d'images faibles et peut faire appel à des outils pour comprendre des segments clés à des fréquences d'images élevées. Cette fonctionnalité peut être largement utilisée dans l’éducation en ligne, l’inspection de la qualité des produits et d’autres scénarios.
En réponse à la demande croissante de création vidéo, Volcano Engine a lancé le modèle de création audio et vidéo professionnel Seedance 1.5. Ce modèle a non seulement une tension narrative au niveau du cinéma et de la télévision, peut capturer avec précision les détails du mouvement et présenter délicatement les émotions des personnages, mais a également réalisé des progrès révolutionnaires dans la technologie de synchronisation audio et vidéo.
Seedance 1.5 pro adopte une architecture innovante de génération conjointe audio et vidéo native, prend en charge les sons environnementaux, la musique de fond, les voix et d'autres éléments, et atteint une sortie audio et vidéo synchrone au niveau de la milliseconde. En termes de traitement du dialogue, le modèle prend en charge le dialogue multi-personnes et multilingues, avec un alignement précis de la bouche, couvrant les dialectes chinois (tels que le dialecte du Sichuan, le cantonais, etc.), l'anglais et les langues minoritaires, ce qui améliore considérablement le réalisme et le potentiel de création globale du contenu vidéo.
Afin de réduire encore le seuil et le coût de création, la série Seedance lancera prochainement la fonction « Draft sample ». Les créateurs peuvent d'abord générer un échantillon basse résolution pour un aperçu, et ses éléments clés sont très cohérents avec le film final, véritablement « un aperçu est ce que vous obtenez ». Les données montrent que cette fonctionnalité peut aider les créateurs à améliorer leur efficacité globale de 65 % et à réduire les coûts de création inefficaces de 60 %.
Actuellement, les utilisateurs individuels peuvent découvrir le modèle sur Doubao, Jimeng AI et d'autres plateformes ; les utilisateurs professionnels peuvent accéder au service de modèle professionnel Seedance 1.5 via l'API Volcano Engine à partir du 23 décembre.
Tan Dai a souligné que l'architecture informatique traditionnelle ne peut plus répondre aux besoins de l'ère des agents. L’architecture cloud native d’IA centrée sur les modèles prend forme et se reconstruit autour du développement et de l’exploitation des Agents.
Au niveau du développement des agents, Volcano Engine a entièrement mis à niveau la plateforme d'agents IA au niveau de l'entreprise, AgentKit. La plateforme couvre l'ensemble du cycle de vie de l'Agent, depuis le développement, le déploiement jusqu'à la gestion et le contrôle, et vise à résoudre les principaux défis rencontrés par les entreprises dans la mise en œuvre de l'Agent, tels que la gestion des droits d'identité, la certitude des modèles et l'intégration du système.
De plus, afin d'abaisser le seuil d'utilisation en entreprise, Volcano Engine a lancé le premier « Plan d'épargne IA » du secteur. Ce plan couvre tous les produits grand modèle qui nécessitent une tarification à l'utilisation et aide les entreprises à économiser jusqu'à 47 % des coûts grâce à des remises échelonnées.
