DeepMind, le laboratoire de recherche et développement en intelligence artificielle de Google, estime que la clé pour améliorer les capacités des systèmes d'intelligence artificielle réside peut-être dans la découverte de nouvelles façons de résoudre des problèmes géométriques complexes. À cette fin, DeepMind a publié aujourd'hui AlphaGeometry - un système qui, selon le laboratoire, peut résoudre des problèmes de géométrie à égalité avec le médaillé d'or moyen de l'Olympiade mathématique internationale.

AlphaGeometry, dont le code était open source ce matin, peut résoudre 25 problèmes de géométrie de l'Olympiade dans les délais standards, dépassant les 10 du système de pointe précédent.

"Résoudre les problèmes de géométrie au niveau des Olympiades est une étape importante dans le développement d'un raisonnement mathématique approfondi et une étape nécessaire vers des systèmes d'IA plus avancés et plus polyvalents", ont écrit Trieu Trinh et Thang Luong, chercheurs en IA de Google, dans un article de blog publié ce matin. "[Nous] espérons... qu'AlphaGeometry nous aidera à ouvrir de nouvelles possibilités dans les domaines des mathématiques, des sciences et de l'intelligence artificielle."

Pourquoi se concentrer sur la géométrie ? DeepMind affirme que prouver un théorème mathématique, ou expliquer logiquement pourquoi un théorème (comme le théorème de Pythagore) est vrai, nécessite à la fois un raisonnement et la capacité de sélectionner une solution parmi une série d'étapes possibles. Si DeepMind a raison, cette approche de résolution de problèmes pourrait un jour s’avérer utile dans les systèmes généraux d’intelligence artificielle.

DeepMind a écrit dans le communiqué de presse : « Prouver la vérité ou la fausseté d'une certaine conjecture dépasse les capacités des systèmes d'intelligence artificielle les plus avancés d'aujourd'hui. Pour atteindre cet objectif, être capable de prouver un théorème mathématique... est une étape importante car cela démontre la maîtrise du raisonnement logique et la capacité de découvrir de nouvelles connaissances.

Cependant, entraîner des systèmes d’intelligence artificielle à résoudre des problèmes géométriques pose des défis uniques.

En raison de la complexité de la conversion des preuves dans un format compréhensible par les machines, les données de formation géométrique disponibles sont rares. De nombreux modèles d’IA générative de pointe actuels, bien qu’excellents pour identifier des modèles et des relations dans les données, n’ont pas la capacité de raisonner logiquement à l’aide de théorèmes.

Lors de la conception d'AlphaGeometry, le laboratoire a associé un modèle de « langage neuronal », un modèle d'architecture similaire à ChatGPT, avec un « moteur de dérivation symbolique » (un moteur qui exploite des règles – comme les règles mathématiques – pour déduire des solutions aux problèmes). Les moteurs symboliques peuvent être rigides et lents, en particulier lorsque vous travaillez avec des ensembles de données volumineux ou complexes. Mais DeepMind atténue ces problèmes en laissant le modèle neuronal « guider » le moteur d'inférence pour trouver des réponses possibles à un problème géométrique donné.

Pour remplacer les données d'entraînement, DeepMind a créé ses propres données synthétiques, générant 100 millions de « théorèmes synthétiques » et des preuves de complexité variable. Le laboratoire a ensuite formé AlphaGeometry à partir de zéro sur des données synthétiques et l’a évalué sur des problèmes de géométrie olympique.

Les problèmes de géométrie olympique sont basés sur des diagrammes et vous devez ajouter des « constructions » telles que des points, des lignes ou des cercles avant de résoudre les problèmes. Lorsqu'il est appliqué à ces problèmes, le modèle neuronal d'AlphaGeometry prédit quelles constructions pourraient devoir être ajoutées. Le moteur symbolique d'AlphaGeometry utilise ces prédictions pour raisonner sur le diagramme afin de trouver des solutions similaires.

Trinh et Luong écrivent : « Avec autant d'exemples de la façon dont ces constructions mènent à des preuves, le modèle de langage d'AlphaGeometry est capable de faire de bonnes suggestions pour de nouvelles constructions lorsqu'on rencontre des problèmes de géométrie olympique. Un système fournit des idées rapides et « intuitives », tandis que l'autre système fournit des décisions plus réfléchies et rationnelles.

La solution d’AlphaGeometry, publiée cette semaine dans la revue Nature, est susceptible de déclencher un débat de longue date sur la question de savoir si les systèmes d’intelligence artificielle doivent être basés sur une manipulation symbolique – c’est-à-dire utiliser des règles pour manipuler des symboles représentant la connaissance – ou sur des réseaux de neurones qui ressemblent davantage à des cerveaux en surface.

Les partisans de l’approche des réseaux neuronaux estiment qu’un comportement intelligent – ​​de la reconnaissance vocale à la génération d’images – peut émerger d’énormes quantités de données et de calculs. Les réseaux de neurones tentent de résoudre des tâches par approximation statistique et apprentissage à partir d'exemples, contrairement aux systèmes symboliques, qui résolvent des tâches en définissant un ensemble de règles de manipulation de symboles spécialisées pour un travail spécifique (comme l'édition d'une ligne dans un logiciel de traitement de texte).

Les réseaux de neurones sont la pierre angulaire de puissants systèmes d’intelligence artificielle tels que DALL-E3 et GPT-4 d’OpenAI. Cependant, les partisans de l’IA symbolique soutiennent que les réseaux de neurones ne sont pas omnipotents ; ces partisans soutiennent que l'IA symbolique pourrait être mieux adaptée pour coder efficacement les connaissances sur le monde, raisonner dans des scénarios complexes et « expliquer » comment ils arrivent à des réponses.

En tant que système hybride de réseau symbolique et neuronal similaire à AlphaFold2 et AlphaGo de DeepMind, AlphaGeometry peut prouver que la combinaison des deux méthodes de manipulation symbolique et des réseaux neuronaux est le meilleur moyen de trouver une intelligence artificielle générale.

"Notre objectif à long terme reste de construire des systèmes d'IA à usage général en mathématiques, en développant les capacités complexes de résolution de problèmes et de raisonnement dont dépendent les systèmes d'IA à usage général, tout en repoussant les frontières de la connaissance humaine", ont écrit Trinh et Luong. "Cette approche pourrait façonner la manière dont les futurs systèmes d'intelligence artificielle découvriront de nouvelles connaissances en mathématiques et dans d'autres domaines."