Les grands modèles nationaux ont été fréquemment mis à niveau au cours de la semaine dernière. Après l'open source de GLM-5.1 et MiniMax 2.7, l'aperçu du code Kimi K2.6 de Dark Side of the Moon est également disponible. Il s'agit d'un grand modèle avec des milliards de paramètres spécialement optimisés pour la programmation de l'IA. Le site officiel indique qu'il est déjà en ligne.Cependant, pour découvrir ce grand modèle, vous avez besoin du plan d’adhésion de Kimi, qui commence à 39 yuans par mois et peut être utilisé dans Kimi Code.

Cependant, le grand modèle K2.6-code-preview est relativement discret. Il n’y a pas eu beaucoup de publicité pour la version bêta interne précédente. Ce n’est que lors de sa sortie au cours des deux derniers jours que j’ai vu quelqu’un en parler. Les responsables de Kimi n’en ont pas fait la promotion en grande pompe. Même le site officiel n'a pas encore vu de mises à niveau spécifiques pour ce grand modèle.
À en juger par les retours bêta internes et les introductions auxquelles les gens ont participé sur Internet, l'aperçu du code K2.6 est amélioré sur la base de K 2.5, un grand modèle avec des milliards de paramètres. La principale optimisation reste la programmation de l’IA. Le score de la liste SWE-Bench Verified de K 2,5 est de 76,8 % et LiveCodeBench est de 85 %.
L'amélioration de K2.6-code-preview réside principalement dans la profondeur du raisonnement, la qualité de la planification des agents et la fiabilité des appels d'outils en plusieurs étapes.Certains testeurs internes ont déclaré que la chaîne de pensée avait le style d'Opus (c'est tellement profond).

Quant au niveau spécifique, il y a un grand gars Versun qui a mené sa propre évaluation des capacités de programmation.Le score de K2.6-code-preview est de 89, soit 6 points de plus que le score de 83 de K 2.5.Cependant, il existe encore un écart entre les meilleurs joueurs précédents.
Comparé à d'autres fabricants qui déclarent toujours qu'ils rattraperont ou dépasseront l'Opus 4.6 dans leur matériel promotionnel, certains internautes de K2.6-code-preview l'évaluent actuellement au niveau Sonnet 4.6, qui est également très fort.

Les avis donnés par les internautes qui l'ont utilisé sont toujours bons. La capacité de suivre les instructions n’est pas mauvaise, et la capacité est également bonne. Désormais combiné au package Coding Plan de Kimi, il fournit au moins une option puissante et rentable pour la programmation de l'IA.