OpenAI publie GPT-4.5, le modèle le plus vaste et le plus compétent de date

Aujourd'hui, OpenAI a publié son nouveau modèle non inférentiel, GPT-4.5, qui est le modèle le plus vaste et le plus complet à ce jour. Comme son nom l'indique, GPT-4.5 est basé sur GPT-4o et développé au cours du processus de pré-formation. OpenAI a confirmé que GPT-4.5 n'est pas un modèle de pointe, mais il s'agit de leur plus grand LLM et possède plus de connaissances du monde, de meilleures compétences rédactionnelles et une personnalité plus raffinée que GPT-4o.

Les données des tests de référence montrent que GPT-4.5 ne constitue pas une mise à niveau significative par rapport à GPT-4o. Dans le test de référence SWE-benchVerified, GPT-4.5 a atteint 38 %, soit 2 à 7 % de plus que GPT-4o et 30 % de moins que le modèle de recherche approfondie basé sur O3 d'OpenAI. En comparaison, Claude3.7Sonnet d'Anthropic a réalisé une performance équivalente à 62,3% sur SWE-benchVerified.

Récemment, l'équipe de préparation d'OpenAI a développé un nouveau benchmark appelé SWE-Lancer pour évaluer les performances du LLM dans les tâches pratiques d'ingénierie logicielle, y compris le développement de fonctionnalités, la conception, la correction de bugs, etc. Dans ce nouveau benchmark, le modèle GPT-4.5 a pu résoudre 20 % des tâches ICSWE et 44 % des tâches SWEManager, une légère amélioration par rapport au modèle o1 d'OpenAI.

Vous pouvez lire les détails du nouveau modèle ici :

https://openai.com/index/introducing-gpt-4-5/

Sur le plan de la sécurité, le groupe consultatif sur la sécurité d'OpenAI a classé le nouveau modèle GPT-4.5 comme présentant un risque global moyen sur la base des résultats de l'évaluation de l'état de préparation. Il a également obtenu des résultats inférieurs en matière de cybersécurité et d’autonomie des modèles.

Le nouvel aperçu de recherche du modèle GPT-4.5 est désormais disponible pour les utilisateurs de ChatGPTPro et les développeurs sur tous les forfaits payants via l'API. La semaine prochaine, les utilisateurs de ChatGPTPlus bénéficieront également de cette fonctionnalité.