Selon les dernières nouvelles d'un grand fabricant, Meituan a publié un avis interne visant à restreindre l'utilisation des grands modèles de poufs. L'avis montre que toutes les équipes commerciales doivent procéder à un auto-examen des activités existantes liées aux poufs et prévoir de migrer vers des modèles tels que LongCat et DeepSeek. S'ils ne peuvent pas migrer depuis le grand modèle du volcan (doubao), ils doivent soumettre une raison + une explication de nécessité et passer par un processus d'approbation distinct.

Il est entendu que ce n'est pas la première fois que Meituan resserre le seuil d'utilisation de grands modèles externes. En avril de cette année, Meituan a apporté des ajustements à l'utilisation de grands modèles internes et ne recommande plus aux entreprises d'utiliser le modèle Qwen fourni par Alibaba Cloud. Si l'entreprise a encore besoin de l'utiliser, les raisons détaillées de son utilisation doivent être soumises et signalées au niveau X3 (niveau patron) pour approbation.

Les informations publiques montrent que LongCat est un grand modèle de langage développé indépendamment par Meituan. La recherche et le développement ont été lancés en 2023. Il a été open source et largement utilisé dans plusieurs scénarios commerciaux au sein de Meituan, y compris l'assistant d'IA intégré « Xiaotuan » de l'APP, l'assistant d'opérations marchandes, etc.

Récemment, Meituan a publié une nouvelle génération de grand modèle LongCat-2.0 comportant des milliards de paramètres, qui sera open source. En tant que modèle de mille milliards de paramètres qui complète la formation et l'inférence de processus complets sur un cluster informatique domestique de 50 000 ka (paramètres totaux 1,6 T, activation moyenne d'environ 48 B, plage dynamique 33 B ~ 56 B), l'échelle de données de pré-formation LongCat-2.0 dépasse 30 T de jetons, couvrant plusieurs types de données tels que le chinois, l'anglais, le multilingue et le code, et prend en charge nativement un contexte ultra-long de 1 million.