Selon un rapport de Scientific American du 24 avril, Liam Price, un amateur passionné de mathématiques âgé de 23 ans, a utilisé le dernier grand modèle de langage disponible dans ChatGPT Pro pour résoudre de manière inattendue un problème d'Erdesh qui trouble la communauté mathématique depuis environ 60 ans, sans avoir reçu une formation avancée en système mathématique. Ces progrès ont attiré une grande attention de la part de nombreux mathématiciens de renom.
Selon les rapports, cette réalisation revêt une importance particulière non seulement parce que les problèmes associés ont longtemps échappé à de nombreux mathématiciens de haut niveau, mais également parce que l'idée de preuve donnée par l'IA n'est pas une simple reformulation de routines existantes, mais introduit une méthode que personne n'aurait pensé pouvoir utiliser pour de tels problèmes auparavant.

Le problème résolu cette fois concerne un ensemble spécial d’entiers appelés « ensembles primitifs ». L'ensemble dit primitif signifie que dans le même ensemble, aucun nombre n'est divisible par un autre nombre ; en ce sens, il étend la propriété des « nombres premiers ne peuvent être subdivisés » d'un seul nombre à l'ensemble des nombres. Par conséquent, il est étroitement lié aux nombres premiers, et tout ensemble de nombres premiers appartient naturellement à l’ensemble d’origine.
Le légendaire mathématicien hongrois Paul Erdos a un jour défini une « somme d'Erdös » pour ce type d'ensemble primitif, qui peut être comprise comme un indicateur permettant de mesurer un certain « poids » ou « score » de l'ensemble. Il a déjà prouvé que la valeur maximale de cette somme est d'environ 1,6 et a conjecturé que l'ensemble infini de tous les nombres premiers atteint également cette limite supérieure ; Le mathématicien de l'Université de Stanford, Jared Lichtman, a prouvé cette conjecture dans sa thèse de doctorat en 2022. Mais une conjecture connexe plus difficile est la suivante : lorsque les nombres d'un ensemble original deviennent très grands, son « score » continuera à diminuer et sa limite minimale théorique devrait être exactement 1. En d'autres termes, ce que cette question veut prouver, c'est que lorsque les éléments de l'ensemble tendent vers l'infini, ce score s'approchera de 1, et 1 est la limite inférieure qui ne peut pas être inférieure.
Le rapport souligne que Lichtman lui-même a également tenté de prouver cette conjecture, mais a échoué comme d’autres chercheurs précédents. Price a déclaré qu'au départ, il ne comprenait pas les tenants et les aboutissants de cette question. Un lundi après-midi ordinaire, il a saisi avec désinvolture la question d'Erdesh dans ChatGPT comme d'habitude pour voir si le modèle pouvait donner des idées. En conséquence, l'IA a renvoyé une réponse qui "semblait être la bonne réponse".
Price a ensuite envoyé les résultats à son partenaire, Kevin Barreto, étudiant en deuxième année de mathématiques à l'Université de Cambridge. Les deux avaient déjà attiré l'attention pour avoir transmis au hasard des énigmes publiques d'Erdesh à ChatGPT, et un chercheur en IA leur a même plus tard donné un abonnement ChatGPT Pro pour soutenir leur tentative expérimentale de « mathématiques atmosphériques ». Après avoir examiné les résultats, Barreto s'est rendu compte que quelque chose était inhabituel et a ensuite informé les experts concernés, qui ont rapidement répondu.
Terence Tao, mathématicien à l'Université de Californie à Los Angeles, a déclaré que les personnes qui ont étudié ce problème dans le passé suivaient presque toujours un chemin de départ relativement standard pour effectuer la dérivation, mais cette fois, le grand modèle de langage a emprunté un chemin complètement différent. Selon le rapport, l'IA utilisait une formule connue depuis longtemps dans des branches connexes des mathématiques, mais personne n'avait jamais pensé à l'appliquer à ce genre de problème. Tao Zhexuan estime que cela montre que les chercheurs humains peuvent collectivement avoir une sorte de « biais de pensée » dans leur choix initial de direction, manquant ainsi une voie de percée en réalité plus directe.
Cependant, les experts ont également souligné que le texte de preuve initialement produit par ChatGPT lui-même n'était pas mature. Lichtman a déclaré que la qualité du résultat original est en fait « assez mauvaise » et doit être triée, examinée et réécrite par des mathématiciens professionnels pour vraiment comprendre la logique fondamentale qu'il veut exprimer. Actuellement, lui et Terence Tao ont compressé et compilé cette preuve dans une version plus claire pour extraire plus précisément les informations clés de la solution d'IA.
Plutôt que "ce problème a été résolu" elle-même, la communauté mathématique apprécie davantage que cette fois l'IA semble avoir ouvert un nouveau canal de réflexion. Tao Zhexuan a déclaré que ces travaux pourraient signifier que les chercheurs ont découvert une nouvelle façon de comprendre « les grands nombres et leurs structures internes », et ce lien pourrait être transféré à un plus large éventail de problèmes à l'avenir ; cependant, il faudra encore du temps pour tester l’importance à long terme de cette avancée. Lichtman estime que ce résultat confirme son intuition depuis ses années d'études supérieures : il peut y avoir une structure commune entre de nombreux problèmes liés, et la nouvelle méthode proposée cette fois par ChatGPT fournit de nouvelles preuves de cette unité.