DeepSeek-V3.1 officiellement publié : capacités d'agent renforcées

Aujourd'hui, DeepSeek a officiellement annoncé que DeepSeek-V3.1 était officiellement publié. Selon les rapports, cette mise à niveau comprend les changements majeurs suivants : architecture de raisonnement hybride : un modèle prend en charge à la fois le mode réflexion et le mode non-pensée ; efficacité de réflexion plus élevée : par rapport à DeepSeek-R1-0528, DeepSeek-V3.1-Think peut donner des réponses dans un délai plus court ; Capacités d'agent plus fortes : grâce à l'optimisation post-formation, les performances du nouveau modèle en termes d'utilisation des outils et de tâches d'agent ont été considérablement améliorées.

L'application officielle et le modèle Web ont été simultanément mis à niveau vers DeepSeek-V3.1. Les utilisateurs peuvent librement basculer entre le mode réflexion et le mode non-réflexion via le bouton « Pensée profonde ».

Agent de programmation : dans l'évaluation de réparation de code SWE et le test de tâches complexes (Terminal-Bench) dans l'environnement de terminal de ligne de commande, DeepSeek-V3.1 s'est considérablement amélioré par rapport aux modèles précédents de la série DeepSeek.

Agent de recherche : DeepSeek-V3.1 a réalisé de grandes améliorations dans plusieurs indicateurs d'évaluation de recherche. Dans le test de recherche complexe (browsecomp) qui nécessite un raisonnement en plusieurs étapes et le test difficile multidisciplinaire de niveau expert (HLE), les performances de DeepSeek-V3.1 ont été nettement supérieures à celles de R1-0528.

Les résultats des tests montrent qu'après l'entraînement à la compression de la chaîne de pensée, les performances moyennes de V3.1-Think sur diverses tâches sont les mêmes que celles de R1-0528, tandis que le nombre de jetons de sortie est réduit de 20 à 50 %. Dans le même temps, la longueur de sortie du V3.1 en mode sans réflexion a également été contrôlée efficacement. Par rapport au DeepSeek-V3-0324, il peut conserver les mêmes performances du modèle avec une longueur de sortie considérablement réduite.

De plus, à partir du petit matin du 6 septembre, le prix d'appel de l'interface API de la plateforme ouverte DeepSeek sera ajusté comme suit.