Nouvelle recherche : les chatbots d’intelligence artificielle sont plus créatifs que la moyenne human

Une étude récente publiée dans la revue Scientific Reports suggère que les chatbots d'intelligence artificielle à grand modèle de langage (LLM) pourraient surpasser les humains ordinaires dans des tâches créatives, telles que le brainstorming d'utilisations alternatives d'objets courants, reflet d'une pensée divergente. Cependant, les individus ayant obtenu les scores les plus élevés sur ces tâches dépassaient toujours les résultats des chatbots les plus performants.

La pensée divergente est un processus de réflexion souvent associé à la créativité qui met l'accent sur la génération de nombreuses idées ou solutions différentes pour une tâche spécifique.

Il est généralement évalué par le biais de la tâche d'utilisation alternative (AUT), dans laquelle les participants sont invités à proposer autant d'utilisations alternatives que possible pour les objets du quotidien dans un court laps de temps. Les réponses ont été divisées en quatre catégories différentes : maîtrise, flexibilité, originalité et élaboration.

Mika Koivisto et Simone Grassini ont comparé les réponses de 256 participants humains avec celles de trois chatbots IA (ChatGPT3, ChatGPT4 et Copy.Ai) et leurs réponses AUT à quatre objets : une corde, une boîte, un crayon et une bougie. Les auteurs ont évalué l'originalité des réponses en évaluant la distance sémantique (le lien entre la réponse et l'utilisation originale de l'objet) et la créativité.

La distance sémantique est quantifiée à l'aide de méthodes informatiques sur une échelle de 0 à 2, tandis que les évaluateurs humains, aveugles à l'initiateur de la réponse, évaluent subjectivement la créativité sur une échelle de 1 à 5. En moyenne, les chatbots ont généré des réponses nettement supérieures aux réponses humaines en termes de distance sémantique (0,95 contre 0,91) et de créativité (2,91 contre 2,47).

Les réponses humaines avaient une gamme plus large sur les deux mesures : les scores les plus bas étaient bien inférieurs aux réponses de l'IA, mais les scores les plus élevés étaient généralement plus élevés. La meilleure réponse humaine a surpassé la meilleure réponse de chaque chatbot dans sept des huit catégories d'évaluation.

Ces résultats suggèrent que les chatbots IA peuvent désormais générer des idées au moins aussi bien que les êtres humains. Cependant, les auteurs notent qu’ils n’ont pris en compte que la performance sur une seule tâche pertinente pour l’évaluation de la créativité. Les auteurs suggèrent que de futures recherches pourraient explorer la manière d’intégrer l’intelligence artificielle dans le processus créatif pour améliorer les performances humaines.