Les diagnostics par intelligence artificielle sont plus précis que ceux des médecins dans de nombreux cas, selon une étude de l’Université de Tel-Aviv
Une étude menée par le Prof. Dan Zeltzer, expert en santé numérique de l’Ecole d’économie de l’Université de Tel-Aviv, à la clinique virtuelle de soins d’urgence Cedars-Sinai Connect de Los Angeles (gérée en collaboration avec la start-up israélienne K Health), a comparé la qualité des recommandations diagnostiques et thérapeutiques formulées par l’intelligence artificielle (IA) à celles des médecins urgentistes de la clinique.
Les résultats de l’étude, réalisée sur un échantillon de 461 consultations en ligne effectuées durant l’été 2024, ont montré que les recommandations diagnostiques et thérapeutiques fournies par l’IA sont, dans de nombreux cas, plus précises que celles formulées par les médecins. Selon les chercheurs, ces conclusions indiquent que l’IA pourrait devenir un outil précieux pour les médecins, en portant certaines données à leur attention et en accélérant la prise de décisions médicales tout en réduisant les erreurs humaines.
L’article a été publié dans la revue Annals of Internal Medicine et présenté lors de la conférence annuelle de l’American College of Physicians (ACP).
« Le centre médical Cedars-Sinai gère une clinique virtuelle de soins d’urgence proposant des consultations télémédicales avec des médecins urgentistes spécialisés », explique le Prof. Zelter. « Récemment, un système d’IA a été intégré à la clinique. Il s’agit d’un algorithme basé sur l’apprentissage automatique qui effectue l’accueil initial des patients via un Chat dédié, incorpore les données de son dossier médical et fournit au médecin traitant des suggestions détaillées de diagnostic et de traitement dès le début de la consultation, y compris prescriptions, examens et orientations. Après avoir interagi avec l’algorithme, le patient accède à une consultation vidéo avec un médecin qui détermine le diagnostic et le traitement. Afin de garantir la fiabilité des recommandations de l’IA, l’algorithme, entraîné sur des dossiers médicaux de millions de cas, ne propose des suggestions que lorsque son niveau de confiance est élevé, et ne recommande pas de traitement dans environ un cas sur cinq. Dans cette étude, nous avons comparé la qualité des recommandations du système d’IA avec les décisions réelles des médecins en clinique ».
L’IA plus précise que les médecins
Les chercheurs ont examiné un échantillon de 461 consultations en ligne effectuées sur une période d’un mois durant l’été 2024. L’étude s’est concentrée sur des patients adultes présentant des symptômes relativement courants : respiratoires, urinaires, oculaires, vaginaux et dentaires. Lors de toutes les consultations, les patients ont d’abord été évalués par l’algorithme, qui a fourni des recommandations, puis traités par un médecin lors d’une consultation vidéo. Toutes les recommandations, celles issues de l’algorithme et celles des médecins, ont ensuite été évaluées par un panel de quatre médecins ayant au moins dix ans d’expérience clinique, qui ont noté chaque recommandation sur une échelle de quatre points : optimale, raisonnable, inadéquate ou potentiellement dangereuse. Cette évaluation a pris en compte les antécédents médicaux du patient, les informations recueillies lors de la consultation et les transcriptions des consultations vidéo.
Les évaluations ont été compilées, conduisant aux conclusions suivantes: les recommandations de l’IA ont été jugées optimales dans 77 % des cas, contre seulement 67 % des décisions des médecins ; à l’autre extrémité de l’échelle, les recommandations de l’IA ont été évaluées comme potentiellement dangereuses dans une proportion plus faible que les décisions des médecins (2,8 % pour l’IA contre 4,6 % pour les décisions des médecins). Dans 68 % des cas, l’IA et le médecin ont obtenu le même score ; dans 21 % des cas, l’algorithme a obtenu un score supérieur à celui du médecin ; et dans 11 % des cas, la décision du médecin a été jugée meilleure.
dan zeltzer
Les explications de ces différences fournies par les évaluateurs mettent en évidence plusieurs avantages du système d’intelligence artificielle par rapport aux médecins : premièrement, l’IA adhère plus strictement aux recommandations des autorités médicales (par exemple, ne pas prescrire d’antibiotiques pour une infection virale) ; deuxièmement, l’IA identifie plus précisément les informations pertinentes dans le dossier médical (comme les cas récurrents d’infections similaires susceptibles d’influencer le traitement approprié) ; et troisièmement, l’IA identifie plus précisément les symptômes pouvant indiquer une affection plus grave, comme une douleur oculaire signalée par un porteur de lentilles de contact, qui pourrait signaler une infection. Les médecins, en revanche, sont plus flexibles que l’algorithme et bénéficient d’un avantage pour évaluer l’état réel du patient. Par exemple, si un patient atteint du coronavirus signale un essoufflement, un médecin peut diagnostiquer une congestion respiratoire relativement légère, alors que l’IA, se basant uniquement sur les réponses du patient, pourrait l’orienter inutilement vers les urgences.
Un dispositif d’aide précieux pour les médecins
« Dans cette étude, nous avons constaté que l’IA peut fournir des recommandations diagnostiques et thérapeutiques qui sont, dans de nombreux cas, plus précises que celles formulées par les médecins », conclut le Prof. Zelter. « L’une des limites de l’étude est que nous ne savons pas quels médecins ont effectivement consulté les recommandations fournies par l’IA, ni dans quelle mesure ils s’y sont fiés. L’étude n’a donc mesuré que la précision des recommandations de l’algorithme, et non leur impact sur les médecins ».
« La particularité de cette étude réside dans le fait qu’elle a testé l’algorithme en conditions réelles et sur des cas concrets, alors que la plupart des études se concentrent sur des exemples tirés d’examens de certification périodiques ou de manuels. De plus l’étude portaient sur des cas de pathologies relativement courantes qui représentent environ les deux tiers du volume des cas cliniques. Les résultats peuvent donc être utiles pour évaluer l’aptitude de l’IA à servir d’outil d’aide à la décision en médecine, et indique qu’elle pourrait devenir un dispositif précieux pour les médecins, en portant certaines données à leur attention et en accélérant la prise de décisions médicales tout en réduisant les erreurs humaines. Bien sûr, de nombreuses questions subsistent quant à la meilleure façon d’intégrer l’IA dans le processus de diagnostic et de traitement médical, ainsi que sur l’alliance optimale entre l’expertise humaine et l’intelligence artificielle en médecine.
Ont également participé à l’étude les Dr. Zehavi Kugler, Lior Hayat, Ran Ilan Ber, Keren Leibovich, Ilan Frank (K Health), Tamar Brufman et Tom Beer (MSc), Caroline Goldzweig et Joshua Pevnick (Cedars Sinai).
JForum.fr avec www.ami-universite-telaviv.com
Photo 2:
Le Prof. Dan Zeltzer (Crédit : Richard Haldis)
![]() |
![]() |