Une courte vidéo intitulée « Vœux de Nouvel An des patrons étrangers » a attiré une large attention sur Internet. Dans cette vidéo, Elon Musk, Bill Gates, Taylor Swift et d'autres personnalités de renommée internationale adressent leurs vœux du Nouvel An 2024 au public mondial dans un chinois courant. Cet exploit n’a pas été obtenu grâce à la prise de vue conventionnelle, mais grâce à l’utilisation d’une technologie avancée de génération d’IA. Cela démontre non seulement les puissantes capacités de l'intelligence artificielle en matière de traduction linguistique et de production vidéo, mais marque également une percée pour la technologie chinoise de l'IA dans des scénarios d'application pratiques.


Bénédictions chinoises des patrons étrangers (Source : Phoenix Technology)

L’IA s’adapte automatiquement à la forme et à l’accent de la bouche, et les vidéos modifiées comme par magie des internautes brisent le cercle

Cette courte vidéo populaire a été générée grâce à la traduction Silicon Language et est actuellement en cours de test en niveaux de gris sur l'applet WeChat. Il vous suffit de télécharger la vidéo, de sélectionner la langue et d'attendre quelques minutes pour prévisualiser et télécharger. Après l'avoir expérimenté, l'auteur estime que l'application est simple à utiliser et a un faible seuil d'utilisation. Il peut traduire le discours des personnages de la vidéo tout en obtenant une synchronisation labiale précise, et le timbre et la texture globaux sont également automatiquement adaptés.

Le fabricant qui a lancé ce mini programme n'est pas de « grands fabricants » comme Tencent et Alibaba, mais Silicon-based Intelligence, un fabricant d'IA qui se concentre sur la piste humaine numérique. Selon les informations officielles de Silicon Intelligence, « Silicon Language Translator » a été lancé le 27 décembre, et une personne proche de Silicon Intelligence a également révélé que le mini programme comptait plus de 100 000 utilisateurs le premier jour de son lancement.

L'application est simple, claire et facile à utiliser, et la langue, la forme de la bouche, l'accent et les expressions du film traduit sont parfaitement adaptées. La créativité et l'imagination apportées par les activités folles des internautes ont également donné naissance à une série d'œuvres magiques. Giao Ge et Guo Degang, qui discutent de la philosophie de la vie en anglais, vous apprennent à apprendre l'anglais à travers le stand-up traditionnel. C’est aussi ce petit programme qui a permis à Musk d’exhiber son chinois et à David Beckham d’envoyer ses vœux du Nouvel An en chinois. Cela a rendu virales un certain nombre de vidéos de vœux du Nouvel An chinois réalisées par des grands.


Promotion du commerce électronique transfrontalier en trois langues étrangères par la propriétaire obligatoire - Source : Chinagoods

La chute de la Tour de Babel et la commercialisation de l’IA

Au cours de l'année 2023, plus de 200 grands modèles d'IA ont été produits en Chine et utilisés dans diverses industries, notamment la génération d'images intelligentes, la génération de texte, la synthèse vocale, la génération de vidéos, les diffusions en direct assistées... Diverses applications émergent dans un flux incessant, et même si chaque application est devenue populaire et hors du cercle, nous avons en fait encore de nombreux mythes commerciaux sur l'IA, et nous devons réfléchir davantage aux possibilités de l'IA dans les scénarios d'applications commerciales. Cependant, un engouement pour le divertissement à court terme ne suffit pas à lui seul à apporter une valeur sociale à long terme à une entreprise, et il est difficile pour une entreprise de survivre longtemps en utilisant une logique commerciale.

Il existe encore de nombreux « points douloureux » et « points de démangeaison » pour ce type de produits d'IA : par exemple, le problème bien connu de stabilité des connexions réseau appelle davantage de fabricants nationaux d'IA à proposer des produits dotés de capacités techniques plus élevées ; et pour les utilisateurs, la facilité d’utilisation est toujours un obstacle insurmontable. Même si les mots d’invite sont faciles à utiliser, la démocratisation des applications sera confrontée à des défis. D’un point de vue optimiste, dans un avenir où l’expansion technologique est rapide, en particulier dans le contexte des efforts de la Chine pour intensifier ses efforts dans le secteur de l’intelligence artificielle, il y a une forte probabilité que ces problèmes soient résolus.

Après avoir essayé Silicon Language Translation, un petit programme national, je constate qu'un scénario commercial facile à utiliser, efficace et professionnel s'est déployé. Comme indiqué dans l'auto-introduction de Silicon Language Translation, avec l'aide de l'IA, les créateurs n'ont qu'à se concentrer sur la créativité elle-même, entretenir leur passion, réduire les coûts et améliorer l'efficacité, et produire davantage de contenu vidéo qui sert le monde.

Silicon Language Translation utilise une technologie de précision et de synchronisation labiale pour générer rapidement de courtes vidéos de marketing à l'étranger, aidant ainsi les praticiens à communiquer plus efficacement avec les clients mondiaux et à promouvoir la mise en œuvre de projets commerciaux ; le tournage de publicités ne nécessite pas de traduction multilingue, les modèles correspondent directement aux langues nationales requises et génèrent rapidement différentes versions d'œuvres publicitaires, économisant ainsi beaucoup de temps et de coûts de production ; Les blogueurs auto-médias peuvent facilement sélectionner la langue cible de la vidéo, réalisant ainsi la traduction en un clic du contenu cinématographique et télévisuel en langue étrangère, simplifiant ainsi le processus de création.

Parallèlement, pour les groupes professionnels et les gros utilisateurs, Silicon-based Intelligence a également lancé anylang.ai pour une utilisation sur PC. Contrairement à l'application de traduction Silicon Language, qui est plus légère et a un seuil plus bas, l'intelligence basée sur Silicon a doté anylang.ai de fonctions plus riches et plus puissantes, notamment le clonage rapide de personnes numériques, l'édition de contenu précise, la prise en charge de 27 langues, etc. Dans des scénarios spécifiques tels que les entreprises délocalisées, le commerce électronique transfrontalier, la publicité internationale, la publicité mondiale et la création vidéo, ces fonctions spéciales rendent l'efficacité, la précision et la commodité de l'IA plus vivantes.

Dans l'histoire biblique, les humains se sont unis pour construire la « Tour de Babel » menant au ciel, mais Dieu a fait que les humains parlent des langues différentes, incapables de communiquer entre eux, et se sont dispersés. Mais avec la bénédiction de l’IA, la « Tour de Babel » s’effondre désormais tranquillement. La traduction de l’IA semble être devenue un bon moyen d’ouvrir l’intelligence artificielle, créant un scénario concret pour une application commerciale rapide de l’intelligence artificielle.