Le 15 avril, Bloomberg a rapporté qu'une nouvelle étude montre que les chatbots basés sur l'IA fournissent des réponses aux questions problématiques environ la moitié du temps lors de la fourniture de conseils médicaux. Cette découverte met en lumière les risques sanitaires de l’IA, une nouvelle technologie de plus en plus intégrée à la vie quotidienne.

Des chercheurs des États-Unis, du Canada et du Royaume-Uni ont évalué cinq principales plateformes d’IA : ChatGPT, Gemini, Meta AI, Grok et DeepSeek, en posant à chaque plateforme 10 questions réparties dans cinq catégories de santé. Selon une étude publiée cette semaine dans la revue médicale BMJ Open, environ 50 % de toutes les réponses de ces chatbots IA ont été considérées comme « problématiques », et près de 20 % ont été classées comme « hautement discutables ».

L'étude a révélé que ces chatbots ont eu des résultats significativement différents sur différents types de questions : ils ont obtenu des résultats relativement meilleurs sur les questions fermées (les réponses sont certaines) et sur les questions liées aux vaccins et au cancer, mais ont obtenu de moins bons résultats sur les questions ouvertes et dans des domaines tels que la recherche sur les cellules souches et la nutrition.


Le jaune signifie qu'il y a un problème, l'orange signifie qu'il y a un problème de hauteur.

Les chercheurs ont déclaré que les réponses étaient souvent données sur un ton confiant et certain, mais qu’aucun des chatbots ne fournissait une liste de références complète et précise en réponse à une quelconque invite. Tout au long de l’étude, le chatbot n’a refusé de répondre aux questions qu’à deux reprises, toutes deux émanant de Meta AI.

Les résultats mettent en évidence une préoccupation croissante selon laquelle les gens utilisent de plus en plus de plateformes d’IA générative pour obtenir des conseils médicaux, mais ces plateformes ne sont pas autorisées à fournir des conseils médicaux et ne disposent pas du jugement clinique requis pour poser un diagnostic.

L’explosion des chatbots IA en a fait un outil populaire auprès des personnes cherchant des conseils sur leur maladie. OpenAI affirme que plus de 200 millions de personnes se tournent vers ChatGPT chaque semaine pour des questions de santé et de bien-être. La plateforme a annoncé en janvier de cette année qu'elle lancerait des outils de santé distincts pour les utilisateurs généraux et les cliniciens. Le même mois, Anthropic a également annoncé que son produit Claude lancerait un nouveau service de santé.

Les auteurs de l’étude, publiée dans BMJ Open, affirment qu’un risque important si les chatbots sont déployés sans éducation du public ni réglementation est qu’ils pourraient amplifier la propagation de la désinformation.

Ils ont déclaré que les résultats « mettent en évidence d’importantes limites comportementales de l’IA et suggèrent la nécessité de réévaluer la manière dont les chatbots IA sont déployés dans les communications médicales et de santé publique ». Ils notent également que ces systèmes sont souvent capables de générer « des réponses faisant autorité mais potentiellement erronées ».