L’IA pourrait avoir plus d’empathie et de succès qu’un médecin humain

Un système d’intelligence artificielle bien formé aux questions de santé peut faire preuve de plus d’empathie et de réussite qu’un médecin humain, mais il ne pourra en aucun cas les remplacer. Son grand avantage est qu’elle pourrait démocratiser les soins de santé.

Un système d’intelligence artificielle (IA) formé pour mener des entretiens médicaux a égalé, voire dépassé, les performances des médecins humains en conversant avec des patients simulés et en répertoriant les diagnostics possibles en fonction des antécédents médicaux des patients.

Le chatbot, basé sur un grand modèle de langage (LLM) développé par Google, était plus précis que les médecins de premier recours certifiés pour diagnostiquer, entre autres, les maladies respiratoires et cardiovasculaires.

Comparé aux médecins humains, il a réussi à obtenir une quantité similaire d’informations lors d’entretiens médicaux et a obtenu de meilleurs résultats en empathie.

AMIE expérimentale

Le chatbot, appelé Articulate Medical Intelligence Explorer (AMIE), est encore purement expérimental. Il n’a pas été testé sur des personnes ayant de réels problèmes de santé, mais uniquement sur des acteurs formés pour incarner des personnes souffrant de problèmes de santé.

« Nous voulons que les résultats soient interprétés avec prudence et humilité », expliqué à la nature Alan Karthikesalingam, chercheur clinique chez Google Health à Londres et co-auteur de l’étude, publiée le 11 janvier dans le référentiel de préimpression arXiv. Il n’a pas encore fait l’objet d’un examen par les pairs.

AMIE s’appuie sur un LLM capable de générer des réponses cohérentes et pertinentes à partir d’une grande quantité de données textuelles. Les LLM ont été utilisés pour diverses tâches, telles que la rédaction de résumés d’actualités, la composition de poèmes et même la création de thérapeutes virtuels.

application médicale

Cependant, quelques efforts visant à tirer parti des LLM pour la médecine ont cherché à savoir si les systèmes pouvaient imiter la capacité d’un médecin à prendre les antécédents médicaux d’une personne et à les utiliser pour établir un diagnostic.

Les étudiants en médecine consacrent beaucoup de temps à s’entraîner pour cela, dit-il Adam Rodman, docteur en médecine interne à la Harvard Medical School de Boston, Massachusetts, également cité par Nature. « C’est l’une des compétences les plus importantes et les plus difficiles à inculquer aux médecins. »

L’un des défis auxquels les développeurs ont été confrontés était le manque de véritables conversations médicales pouvant être utilisées comme données de formation, explique-t-il. Vivek Natarajanchercheur en IA chez Google Health à Mountain View, en Californie, et co-auteur de l’étude.

Propres conversations

Pour relever ce défi, les chercheurs ont conçu un moyen permettant au chatbot de s’entraîner avec ses propres « conversations ».

Le système a généré des dialogues fictifs entre un médecin et un patient, en utilisant des données provenant de dossiers médicaux réels et d’une base de connaissances médicales. Le chatbot a ensuite été formé sur ces dialogues pour apprendre à poser des questions pertinentes et à poser des diagnostics raisonnables.

Pour évaluer les performances du chatbot, les chercheurs ont comparé leurs entretiens médicaux avec ceux de 20 médecins de premier recours certifiés, qui ont conversé avec 301 acteurs prétendant souffrir de 50 problèmes de santé différents.

Les médecins et le chatbot ne savaient pas dans quelles conditions se trouvaient les acteurs. Les chercheurs ont évalué l’exactitude des diagnostics, la quantité d’informations obtenues, la durée des entretiens et l’empathie manifestée.

Rapidité et précision

Les résultats ont montré que le chatbot était capable de fournir un diagnostic correct dans 86 % des cas, contre 82 % pour les médecins humains. Le chatbot était également plus rapide, avec des entretiens d’une durée moyenne de 10,4 minutes, contre 11,9 minutes pour les médecins.

De plus, le chatbot a obtenu une note moyenne de 4,6 sur 5 en empathie, selon les notes des acteurs, tandis que les médecins ont obtenu une note de 4,3.

Les auteurs de l’étude affirment que le chatbot pourrait jouer un rôle dans la démocratisation des soins de santé, car il pourrait aider les personnes qui n’ont pas accès à un médecin ou qui préfèrent interagir avec une machine.

Cependant, ils reconnaissent également que le chatbot présente des limites, comme l’incapacité de détecter le ton de la voix ou le langage corporel des patients, ou de réaliser des examens physiques.

De plus, le chatbot pourrait être vulnérable aux biais ou aux erreurs découlant des données de formation ou de la base de connaissances médicales.

Soutenir les médecins, pas les remplacer

L’outil pourrait être utile, mais il ne devrait pas remplacer les interactions avec les médecins, dit Rodman. « La médecine, c’est bien plus que la collecte d’informations, c’est une question de relations humaines », dit-il.

Rodman note également que l’étude n’a pas évalué l’impact du chatbot sur les résultats cliniques des patients, tels que l’observance du traitement ou la satisfaction à l’égard des soins. « Nous ne savons pas si le chatbot améliore réellement la santé des gens », dit-il.

Les chercheurs de Google déclarent qu’ils prévoient de continuer à améliorer le chatbot et de le tester auprès de vrais patients à l’avenir.

Ils espèrent également collaborer avec d’autres chercheurs et professionnels de la santé pour explorer le potentiel et les défis de l’IA conversationnelle en médecine.

Référence

Vers une IA diagnostique conversationnelle. Tao Tu et coll. arXiv :2401.05654v1 (cs.AI).