Anthropic lance Sonnet 4.6, améliorant considérablement les capacités de traitement du code et des textes longs

La société américaine d'intelligence artificielle Anthropic a annoncé le lancement de Sonnet 4.6, la dernière version de son modèle de taille moyenne Sonnet, poursuivant le rythme d'itération de l'entreprise tous les quatre mois. Les responsables ont déclaré que la nouvelle version a été considérablement améliorée en termes d'écriture de code, de suivi des instructions et de fonctionnement informatique. Sonnet 4.6 deviendra immédiatement le modèle par défaut pour les utilisateurs Pro gratuits et payants.

La version bêta de Sonnet 4.6 publiée cette fois prendra en charge une fenêtre de contexte allant jusqu'à 1 million de jetons, soit le double du contexte maximum disponible dans la série Sonnet précédente. Anthropic décrit cette capacité comme « suffisante pour accueillir une base de code entière, un long contrat ou des dizaines de documents de recherche en une seule demande ». Un contexte plus large signifie que les modèles sont capables de conserver davantage d'informations clés dans une conversation lorsqu'ils traitent de projets d'ingénierie complexes, de textes juridiques et de documents académiques.

Le lancement de Sonnet 4.6 intervient seulement deux semaines après le lancement du modèle haut de gamme Opus 4.6, et l'industrie s'attend à ce que le plus petit modèle Haiku reçoive également une mise à jour dans les semaines à venir. Cela montre qu'Anthropic maintient un rythme serré de mise à niveau de ses produits autour de modèles de différentes tailles pour couvrir plusieurs scénarios d'utilisation, du plus léger au plus phare.

En termes de performances, Anthropic a déclaré que Sonnet 4.6 a battu plusieurs records de référence, notamment OS World, qui mesure les capacités de fonctionnement des ordinateurs, et SWE-Bench, qui mesure les capacités d'ingénierie logicielle. Plus impressionnant encore, Sonnet 4.6 a obtenu un score de 60,4 % au test ARC-AGI-2, qui évalue les capacités « d'intelligence humaine ». Ce score place le Sonnet 4.6 au-dessus de la plupart des modèles de sa catégorie, mais reste à la traîne des modèles haut de gamme comme l'Opus 4.6, le Gemini 3 Deep Think et le GPT 5.2 affiné en termes de performances globales.

Du point de vue de la stratégie produit, Anthropic tente de consolider sa compétitivité dans des domaines tels que la bureautique générale de l'IA, le développement de logiciels et le traitement de textes longs en continuant à renforcer la série Sonnet dans la gamme de prix milieu de gamme. Avec des fenêtres contextuelles doublées et des capacités de raisonnement améliorées, Sonnet 4.6 devrait attirer davantage les utilisateurs d'entreprise et les développeurs qui doivent gérer de grands référentiels de code et des documents commerciaux complexes.