L’Initiative nationale d’intelligence artificielle (AISG) de Singapour inaugure un changement stratégique crucial.Dans son dernier projet de grand modèle linguistique en Asie du Sud-Est, l'AISG a abandonné le modèle de Meta et a plutôt adopté l'architecture open source Qwen d'Alibaba. Ce choix reflète non seulement une reconsidération de la voie technique, mais marque également une étape importante dans l’expansion de l’influence mondiale du modèle d’IA open source chinois.
Le 25 novembre, l'AISG a publié le modèle « Qwen-SEA-LION-v4 » basé sur l'architecture Qwen, qui s'est rapidement classé en tête d'une liste open source mesurant les compétences linguistiques en Asie du Sud-Est. Cette décision vise à résoudre le problème d'adaptation linguistique qui tourmente depuis longtemps la région——Les modèles open source occidentaux, représentés par la série Llama de Meta, fonctionnent mal lorsqu'il s'agit de langues régionales telles que l'indonésien, le thaï et le malais, ce qui limite sérieusement l'efficacité du développement d'applications d'IA localisées.
Bien que Llama ait des performances de pointe parmi les modèles open source, sa conception sous-jacente « centrée sur l'anglais » est difficile à modifier fondamentalement et est extrêmement inefficace lors du traitement d'écritures non latines telles que le thaï et le birman. L’AISG a progressivement compris que s’appuyer sur les modèles open source de la Silicon Valley n’était pas la solution optimale pour les pays d’Asie du Sud-Est et qu’elle devait rechercher des modèles de base dotés de véritables capacités de compréhension multilingue, en particulier dans les contextes linguistiques asiatiques.

Dans ce contexte, l’AISG a finalement tourné son attention vers la Chine et a choisi le Qwen3-32B d’Alibaba comme base du modèle Sea-Lion de nouvelle génération.
Différent des modèles occidentaux, Qwen3 utilise jusqu'à 36 000 milliards de données symboliques au cours de la phase de pré-formation, couvrant 119 langueset dialectes à travers le monde.Cette « capacité multilingue native » non seulement « reconnaît » les caractères indonésiens, malais et autres, mais comprend également leur structure grammaticale par le bas, ce qui réduit considérablement le seuil technique pour la formation ultérieure de l'AISG.
Afin de mieux s'adapter aux habitudes d'écriture uniques des langues d'Asie du Sud-Est, Qwen-Sea-Lion-v4 abandonne le « tokenizer de phrase » couramment utilisé dans les modèles occidentaux et adopte à la place un tokenizer d'encodage par paires d'octets (BPE) plus avancé. Cette technologie peut segmenter plus précisément les caractères dans des langues sans espaces telles que le thaï et le birman, améliorant ainsi considérablement la précision de la traduction et la vitesse de raisonnement.
Outre les avantages technologiques, les considérations pratiques liées à la mise en œuvre commerciale sont également la clé du succès d'Alibaba. L’Asie du Sud-Est compte un grand nombre de petites et moyennes entreprises qui ne peuvent pas se permettre des clusters GPU H100 coûteux.Le Qwen-Sea-Lion-v4 optimisé peut fonctionner sans problème sur les ordinateurs portables grand public équipés de 32 Go de mémoire, permettant aux développeurs ordinaires de déployer localement ce modèle de niveau national. Cette caractéristique de « capacités au niveau industriel et seuil au niveau du consommateur » correspond précisément au problème posé par la rareté des ressources informatiques dans la région.
Cette coopération ne constitue pas un résultat technologique à sens unique, mais une profonde intégration bidirectionnelle. Selon l'accord, Alibaba fournit une puissante base de raisonnement universelle et l'AISG apporte ses 100 milliards de jetons linguistiques nettoyés en Asie du Sud-Est. Ces données évitent complètement les risques de droits d'auteur et la concentration du contenu d'Asie du Sud-Est atteint 13 %, soit 26 fois celle de Llama2.
Dans la liste d'évaluation de Sea-Helm, Sea-Lion v4 équipé de la technologie de base d'Alibaba est rapidement arrivé en tête de la liste des modèles open source de même ampleur, vérifiant la valeur technique et l'adaptabilité régionale de cette coopération stratégique.
