GPT-5 est vraiment « intellectuel », mais il réapparaît que la « main de Dieu » pointe vers le code trône

Test de QI GPT-5, n'a marqué que 70 points ? L'ensemble de l'Internet se plaint de la vérité derrière la « réduction de l'intelligence ». C'est en fait le « routage » qui détermine l'intelligence du modèle.Si vous souhaitez débloquer le GPT-5 de niveau divin, le secret réside dans l'invite. Non, les scientifiques médicaux ont recréé le moment de la « main de Dieu » avec l'aide de GPT-5.

72 heures après la sortie de GPT-5, le résultat d'un test de QI a choqué l'ensemble du réseau.

Dans le test Mensa IQ, GPT-5 a obtenu 118 points et 70 points dans le test hors ligne ; GPT-5 Thinking a marqué respectivement 85 points et 57 points.

Ce résultat est le record le plus bas de l’histoire du test de QI de la famille de modèles OpenAI.

En fait, la véritable raison derrière cela est due à des problèmes de « routage ».

Ce n'est pas que GPT-5 soit trop stupide, mais en tant que « modèle unique », un composant détermine son intelligence.

Ultraman a également répondu à des questions similaires dans une séance de questions-réponses sur Reddit AMA.

Il a déclaré qu'il y avait eu une grave défaillance interne (niveau Sev) et que le système de commutation automatique n'avait pas fonctionné, provoquant le comportement du GPT-5 comme une transe.

D’après le dernier rapport du METR, il ressort que GPT-5 est toujours à la frontière de Pareto et que la croissance exponentielle du renseignement n’a pas ralenti.

En d’autres termes, GPT-5 perpétue toujours le mythe de la loi de mise à l’échelle.

GPT-5 est très puissant, la clé réside dans l'invite

Les internautes qui se plaignent constamment du GPT-5 n’ont pas réellement exploré le potentiel du dernier modèle.

Le directeur de l'intelligence artificielle de Cline a déclaré que l'essentiel réside dans les pensées, les goûts et les méthodes de communication d'une personne.

Pour ceux qui ont une pensée systémique, GPT-5 est un outil révolutionnaire. Tant que vous êtes prêt à prendre le temps : construire un cadre de réflexion complet, formuler un cahier des charges clair et l'expliquer clairement au modèle.

En conséquence, il peut s’exécuter de manière indépendante et précise sans correction manuelle pendant tout le processus.

Par coïncidence, l'auteur à succès du New York Times, Mark Manson, a également déclaré que tout le monde parlait de GPT-5 de la mauvaise manière et que la clé était de prendre l'initiative.

De cette façon, faites-lui savoir que vous n’êtes pas facile à tromper et il vous donnera la réponse parfaite.

Par exemple, vous voulez demander à « myrtille » combien il y a de b et le menacer : « Si vous ne répondez pas correctement, la mère de Bambi viendra régler ses comptes avec vous.

À ce stade, GPT-5 ne commet aucune erreur.

Pour un autre exemple, les internautes se disputent à propos de GPT-5, qui ne peut même pas résoudre une équation simple, et le véritable truc réside également dans les invites.

Lorsque l’invite devient « réfléchissez plus fort et résolvez », vous pouvez arriver à la bonne solution.

Quelles astuces sont efficaces ? Certains internautes ont exposé l'invite du système GPT-5, que l'on peut qualifier de mine d'or.

Moment "Main de Dieu"

Dans le domaine médical, GPT-5 est déjà comparable aux experts humains.

La scientifique biomédicale Derya Unutmaz a profondément ressenti le moment de « l’étape 37 » d’AlphaGo après avoir expérimenté le GPT-5.

Le fait est qu'il y a deux ans, le laboratoire de Derya a réalisé une série d'expériences d'immunologie de pointe visant à réguler le métabolisme énergétique des cellules T.

Cette cellule immunitaire a un impact majeur sur l’immunothérapie du cancer, des maladies chroniques et des maladies auto-immunes.

À cette époque, ils ont obtenu un résultat étonnant, mais il y a eu une découverte qu’ils ne pouvaient pas expliquer.

L’équipe a travaillé là-dessus pendant des semaines et n’a obtenu que des réponses partielles.

Sur la base de ces expériences, Derya a téléchargé des graphiques de données non publiés sur GPT-5 Pro pour analyse, et les résultats ont été surprenants.

GPT-5 a identifié avec précision les principales conclusions et a fourni des suggestions de plans expérimentaux basés uniquement sur le tableau ci-dessus.

Le plus incroyable de tout, c’est que le mécanisme proposé expliquait finalement tout le résultat.

Derya Unutmaz a déclaré qu'il s'agissait simplement d'un moment de « main de Dieu » dans le domaine de l'IA. Ce processus a prouvé que GPT-5 est devenu un expert de premier plan et un véritable partenaire de recherche scientifique, capable de fournir des informations approfondies.

OpenAI amène GPT-5 sur le trône anthropique

Bien que GPT-5 ne soit pas encore AGI, ses puissantes capacités de programmation ont attiré davantage de développeurs.

De plus, ses nouvelles options de personnalisation et la réduction des phénomènes « d'illusion » pourraient attirer davantage d'utilisateurs quotidiens vers la version gratuite de ChatGPT.

C’est sans aucun doute un défi pour Anthropic.

La raison pour laquelle je dis cela est la suivante : le modèle d'IA le plus puissant pour écrire du code est généralement reconnu comme le modèle Claude d'Anthropic.

Par conséquent, lorsque OpenAI a publié un nouveau modèle, il a fortement mis l’accent sur les puissantes capacités de programmation de GPT-5.

GPT-5 est notre modèle de programmation le plus puissant à ce jour. GPT-5 fonctionne particulièrement bien lorsqu'il s'agit de générer des frontaux complexes et de déboguer de grandes bases de code.

Avec juste un indice, il crée de manière intuitive et élégante des sites Web, des applications et des jeux magnifiques et réactifs qui transforment les idées en réalité.

L'intention est très claire.

Lors de la conférence de presse, Altman a déclaré que le nouveau modèle est non seulement efficace en matière de codage, mais qu'il peut également transformer des projets logiciels d'idées en code utilisable en une seule étape.

Divers programmes générés par GPT-5

Pietro Schirano, PDG de la startup d'IA MagicPath, a qualifié GPT-5 de meilleur modèle de programmation actuellement disponible et d'« excellent collaborateur ». Il a dit :

C'est comme si l'électricité pénétrait dans des milliers de foyers, un moment de changement « sans précédent » qui changera complètement notre façon de nous développer.

OpenAI a passé une grande partie de la diffusion en direct d'une heure à présenter les capacités de programmation de GPT-5, notamment à démontrer une série de résultats de référence.

Cursor, Vercel et JetBrains ont également partagé des critiques des premiers tests de GPT-5.

Michael Truell, PDG de l'artefact de « programmation IA » Cursor, l'a salué comme « le modèle de codage le plus intelligent jamais utilisé » :

L’équipe a constaté que le GPT-5 était non seulement performant et facile à guider, mais qu’il affichait également une personnalité unique qu’aucun autre modèle n’avait.

Il peut non seulement détecter des erreurs profondément ancrées et difficiles à détecter, mais peut également exécuter des agents d'IA en arrière-plan à long terme et à plusieurs tours pour accomplir des tâches complexes - des tâches qui sont souvent difficiles à démarrer pour d'autres modèles.

Guillermo Rauch, fondateur et PDG de Vercel, estime que « GPT-5 est le meilleur modèle d'IA front-end » :

Notre première impression lors de l'utilisation de v0.dev est qu'il s'agit du meilleur modèle d'IA frontal, avec des performances optimales en termes d'esthétique et de qualité de code, et qu'il est unique.

Il excelle à l'intersection de l'informatique complexe et du talent artistique, marquant le moment du passage de la simple complétion de code du passé aux applications full-stack d'aujourd'hui sur les appareils et les écrans.

Kirill Skrygan, PDG du géant traditionnel des IDE JetBrains, a déclaré que « GPT-5 a bouleversé la programmation » :

GPT-5 constitue une avancée révolutionnaire dans le domaine du codage. En tant que modèle par défaut, il améliore les performances et la qualité de JetBrains AI Assistant et de l'agent de codage Junie de plus de 1,5 fois.

Sur Kineto, notre nouvelle plateforme sans code, GPT-5 double la qualité de bout en bout de la conception, du front-end et de l'expérience globale des applications.

Du point de vue des données, la croissance des revenus d'Anthropic est principalement due à ses solides capacités de programmation.

Le chiffre d'affaires annuel d'Anthropic approche les 5 milliards de dollars, selon The Information, contre 4 milliards de dollars plus tôt ce mois-ci, reflétant son statut de choix incontournable pour les programmeurs et les applications de programmation.

Pendant ce temps, le chiffre d'affaires annuel d'OpenAI s'élève désormais à 12 milliards de dollars, un chiffre qui reflète son activité plus large et sa plus grande échelle.

L'avenir est un raisonnement intelligent

Après la sortie de GPT-5, Mark Chen, directeur de la recherche d'OpenAI, et Greg Brockman, président, ont discuté de certains des points forts de la recherche et du développement du dernier modèle dans la dernière interview de TBPN.

Mark Chen a mentionné pour la première fois que la clé de la formation GPT-5 réside dans les données synthétiques.

Son succès signifie qu'il a complètement dépassé les limites de l'épuisement des données Internet et atteint une couverture de connaissances plus complète dans des domaines clés.

Ce que fait actuellement OpenAI conduit le monde vers l’ère du « raisonnement intelligent », et GPT-5 est la clé de cette transformation.

Réduisez l’intervention des utilisateurs avec des modèles plus rapides et plus intelligents, permettant à l’IA de s’intégrer de manière transparente dans l’utilisation quotidienne et professionnelle.

Mark a souligné qu'OpenAI travaille sur des modèles d'inférence depuis de nombreuses années, mais que dans le passé, l'interface était maladroite, comme le basculement entre GPT-4 et o1.

De nos jours, GPT-5 a réalisé une intégration transparente grâce à une optimisation de la vitesse, de sorte que les utilisateurs n'ont pas besoin d'attendre de longs processus d'inférence.

Il a donné un exemple détaillé : les modèles précédents tels que o1 fournissaient de meilleures réponses sur toutes les tâches, mais étaient trop lents. GPT-5 combine des capacités de raisonnement et de non-raisonnement pour devenir un « guichet unique ».

En particulier, la contribution de l'équipe post-formation fait du modèle un « monstre » dans des domaines comme le codage.

Interrogé sur le nom du modèle, Mark a ri et a qualifié le nom numérique de « fou », mais cela a fonctionné.

Il a déclaré que les capacités de GPT-5 en matière de collaboration créative et d'ingénierie logicielle ont en effet dépassé celles de GPT-4.5, et qu'elles sont plus rapides et moins chères.

GPT-5 est comme « un ordinateur » pour ChatGPT, comprenant Python REPL et un navigateur. Le modèle peut apprendre de nouveaux outils avec zéro échantillon, tout comme les humains expérimentent de nouveaux outils.

Dans certaines tâches qui nécessitent de la créativité, GPT-5 peut apporter des solutions surprenantes. La prochaine étape consiste à améliorer les capacités du LLM au niveau du « cadre théorique », à proposer de nouvelles hypothèses et à aider l'innovation en recherche scientifique.

Parallélisation multiligne, livraison à tout moment

Au sein d'OpenAI, les équipes opèrent sur différentes échelles de temps : de l'exploration des idées à la traduction jusqu'à la publication du modèle phare.

Il ne s’agit pas seulement d’une percée dans une seule technologie, mais d’un progrès multi-axes.

Mark l'a décrit comme un pipeline « d'exploration et d'exécution », soulignant la capacité de l'entreprise à itérer rapidement sur son modèle.

Nous lui donnons de l'espace pour grandir et l'expédions directement une fois qu'il est prêt.

À l'heure actuelle, le modèle OpenAI se concentre sur l'optimisation des algorithmes, tout en absorbant les résultats des améliorations du matériel et de l'architecture d'inférence, et en s'appuyant sur l'expérience de la communauté open source en matière d'accélération d'inférence.

Enfin, il a également mentionné que ChatGPT traite environ 71 % des requêtes de grands modèles dans le monde et fournit des informations uniques sur les données d'utilisation.

Mark a déclaré que le but non seulement de s'appuyer sur DUA ou des données similaires est d'éviter les biais de « restauration », mais aussi d'exploiter des signaux comportementaux implicites pour guider le modèle vers l'amélioration.

GPT-5 est déjà une « auto-itération » de l’IA

Greg Brockman a expérimenté chaque version de GPT-1 à GPT-5 et a résumé ses sentiments sur chaque version :

GPT-1 : utiliser des données publiques pour former Transformer, prouvant que « la pré-formation est utile ».

GPT-2 : Pour la première fois, j'ai pensé que « les choses générées sont plutôt cool » et qu'il y a une histoire de licorne.

GPT-3 : il franchit tout juste le seuil de « quelqu'un est prêt à l'utiliser », mais sa fiabilité est médiocre.

GPT-4 : Vraiment utilisable, je commence à être capable d'écrire du code et de faire des questions-réponses sur la santé.

GPT-5 : établit de nouvelles normes en matière de fiabilité, de praticité et de capacités de code, et l'ingénierie logicielle sera complètement transformée.

Fin 2019, GPT-3 est sorti. OpenAI a réalisé qu'elle devait créer un produit afin de continuer à faire avancer sa mission et à lever des fonds.

Ils ont décidé de créer une API et de laisser les autres explorer leurs propres utilisations.

Début 2020, l'équipe de Greg Brockman s'efforçait de trouver des clients prêts à essayer l'API.

OpenAI n’a mis l’API sur le marché qu’à la mi-2020 et ChatGPT n’a été lancé qu’en novembre 2022.

À cette époque, OpenAI envisageait d'appeler ChatGPT « Chat with GPT-3.5 ». ChatGPT propose également un produit prédécesseur appelé WebGPT, qui est également basé sur GPT-3.5. Tout au long de l’année 2022, OpenAI paie essentiellement les gens pour qu’ils utilisent le prédécesseur de ChatGPT : les utilisateurs ne paieront pas OpenAI, OpenAI doit les payer pour l’utiliser.

Quand avez-vous réalisé que ChatGPT allait exploser ?

Pour Greg Brockman, le moment qui l’a vraiment touché a été lorsqu’il a complété la formation GPT-4.

C'était le 8 août 2022, lorsqu'OpenAI a terminé la post-formation préliminaire de GPT-4. Même s'il y a beaucoup de bugs, la créativité est incroyable et c'est vraiment amusant.

Il a fallu environ un an et demi à OpenAI pour amener les capacités d'écriture créative du modèle au niveau de la version boguée.

À ce moment-là, OpenAI s'est rendu compte que ce modèle pouvait non seulement compléter le post-entraînement d'une tâche spécifique, mais aussi généraliser et montrer un comportement intelligent, même s'il n'était pas directement formé pour ce point. C'est clairement une application qui tue.

Par conséquent, la version initialement prévue de l'API GPT-4 a été reportée et ChatGPT a été construit en premier et lancé en novembre 2022.

Avec le recul, GPT-3.5 était en fait un « modèle utilisable » que la société n'avait jamais vu auparavant, mais aux yeux d'OpenAI, ce n'était que des défauts.

GPT-3.5 a déclenché une révolution dans le paradigme commercial d’OpenAI : un changement fondamental de « payer les gens pour tester » à « les utilisateurs s’abonnant activement ».

Ben Thompson a qualifié OpenAI d'« entreprise de consommation née accidentellement » : ChatGPT a dépassé le million d'utilisateurs dans les 72 heures suivant sa sortie, créant une demande phénoménale.

Beaucoup de gens ont dit par la suite qu'OpenAI visait à prouver que la « mise à l'échelle » était dès le début la clé du progrès de l'IA, mais en fait, c'était presque l'inverse : la mise à l'échelle était la seule chose qui fonctionnait après avoir essayé de nombreuses méthodes inefficaces.

Et maintenant, OpenAI a vu des modèles d’IA contribuer à créer la prochaine génération de modèles et superviser des tâches trop complexes pour les humains.

Greg Brockman a déclaré : Nous ne devons pas délibérément optimiser le CoT (chaîne de pensée) pour le bien de la beauté, ni forcer le modèle à cacher son processus de raisonnement, nous devons lui permettre d'afficher librement ses « idées ».

Greg Brockman a mentionné un jour qu'à mesure que les capacités des modèles s'améliorent, ils peuvent non seulement accomplir des tâches simples, mais également être compétents dans certaines tâches complexes difficiles à contrôler pour les humains.

Ce concept de « supervision évolutive » est proposé pour résoudre ce défi : utiliser des modèles d'IA puissants pour fournir un feedback et une supervision fiables pour des tâches complexes, ou assister des experts humains via des « modèles critiques » pour faciliter la supervision. Cela garantit que même si les systèmes d’IA deviennent plus intelligents et plus complexes, ils restent cohérents avec les valeurs humaines et sont gérés de manière sécurisée.

Références :

https://www.axios.com/2025/08/08/openai-aims-gpt-5-at-anthropics-coding-crown

https://x.com/thealexbanks/status/1953867094648385990

https://x.com/slow_developer/status/1954097563981812149

https://x.com/tbpn/status/1954249389796651184

https://www.youtube.com/watch?v=gaImbWPGgtU