JetBrains open source 12 milliards de paramètres Mellum2 model

JetBrains a récemment annoncé que Mellum2, son modèle d'apprentissage automatique de nouvelle génération pour les systèmes d'ingénierie logicielle, était officiellement open source. C'est un peu plus d'un an après que la société a lancé en open source son premier modèle Mellum en 2025. À cette époque, Mellum était un petit modèle axé sur l'achèvement du code, avec une taille de paramètres d'environ 4 milliards. En comparaison, le nombre total de paramètres de Mellum2 est passé à 12 milliards.Cependant, JetBrains souligne qu'en adoptant une architecture de mélange d'experts (MoE) clairsemée, chaque jeton ne participe en réalité au calcul que d'environ 2,5 milliards de paramètres actifs, de sorte qu'il puisse toujours maintenir une vitesse d'inférence rapide sur du matériel standard.

Contrairement à Mellum « ciblé », qui effectue uniquement des tâches de complétion de code dans l'éditeur, Mellum2 se positionne comme un assistant de codage intelligent complet. Il peut générer et modifier du code, appeler des outils externes, exécuter des flux de travail « Agentic » en plusieurs étapes, prendre en charge de longues conversations et disposer de capacités de raisonnement explicites. Les développeurs peuvent utiliser ses modèles de base, adaptés aux directives et « Think Edition » sous la licence Apache 2.0 pour conserver un contrôle total sur leurs données lors de la création de produits ou d'outils internes.

En termes de spécifications, Mellum2 présente des changements significatifs dans plusieurs indicateurs clés par rapport au Mellum de première génération : le Mellum original utilisait une conception de paramètres denses, tandis que Mellum2 est passé à une architecture MoE ; le nombre total de paramètres est passé de 4 milliards à 12 milliards, mais les paramètres actifs ont chuté de 4 milliards à 2,5 milliards ; la fenêtre contextuelle a considérablement augmenté, passant de 8 192 jetons à 131 072 jetons, ce qui la rend plus adaptée au traitement de documents longs et de scénarios d'ingénierie complexes ; les deux générations de modèles utilisent la licence Open Source Apache 2.0.

JetBrains a déclaré que Mellum2 est particulièrement adapté au routage et à l'orchestration de charges de travail d'IA complexes, à la création de pipelines de génération augmentée de récupération (RAG) à faible latence, à la prise en charge d'inférences rapides pour les sous-agents dans les grands systèmes et au déploiement de l'IA dans des environnements locaux ou privés. Afin d'améliorer encore les performances du modèle dans des domaines professionnels tels que le code et les mathématiques, l'équipe a adopté un « cours » sur les données en trois étapes au cours de la phase de pré-formation, migrant progressivement de diverses données Web vers un contenu de code et de mathématiques plus soigneusement sélectionné.

En plus de Mellum2, JetBrains a également annoncé un ajustement de sa gamme de produits : la société cessera de maintenir DataSpell, son IDE de science des données pour les développeurs Python. Selon les informations officielles, DataSpell a été officiellement « retiré » le 28 mai et les fonctions associées de science des données seront intégrées dans la version professionnelle de PyCharm. Les abonnements DataSpell actifs existants seront automatiquement convertis en PyCharm Pro le 1er septembre 2026.