L'intelligence artificielle serait sur un pied d'égalité avec les experts humains lorsqu'il s'agit de faire des diagnostics médicaux basés sur des images médicales (scanner, IRM, etc.), selon une méta-analyse. L'article, publié dans la revue The Lancet Digital Health, fait ici référence aux "bonnes" études étayées, mais indique surtout que la science manque encore d'études de qualité suffisante sur l'utilisation de l'IA dans le domaine de la santé.

À la recherche du vrai potentiel

Le potentiel de l'intelligence artificielle dans le domaine des soins de santé suscite un certain enthousiasme, ses défenseurs affirmant qu'elle permettra d'alléger la pression sur les ressources, de libérer du temps pour les interactions entre le médecin et le patient, et même de développer un traitement personnalisé.

L'intelligence artificielle appliquée au diagnostic médical utilise la méthode du deep learning, ou apprentissage profond, qui permet à des machines d'effectuer des tâches complexes pour lesquelles elles ont été entraînées, comme la reconnaissance vocale ou visuelle.

Mais les experts mettent en garde contre les nombreuses recherches de mauvaise qualité dans le domaine. "L'intelligence artificielle (IA) semble détecter les maladies à partir de l'imagerie médicale avec les mêmes niveaux de pertinence que les professionnels de santé", mais "au vu du faible nombre d'études de bonne qualité disponibles, le vrai potentiel de l'IA reste incertain", soulignent ses auteurs.

Y a-t-il lieu de comparer ?

Sur plus de 20.000 publications passées en revue, moins de 1% étaient conçues avec une méthodologie suffisamment solide et des résultats confirmés par des experts indépendants. En tout, seules 14 études analysées ont comparé la performance des machines et des médecins sur les mêmes cas de patients.

L'équipe a mis en commun les résultats les plus prometteurs de chacune des 14 études pour révéler que les systèmes de deep learning détectent correctement une pathologie 87 % du temps - comparativement à 86 % pour les professionnels de la santé - et signifient correctement que tout est OK 93% du temps, comparativement à 91 % pour les experts humains. Cependant, dans ces scénarios, les professionnels de la santé n'ont pas reçu d'informations supplémentaires sur les patients qu'ils auraient pu obtenir dans le monde réel pour orienter leur diagnostic.

"Pas moins bien", mais...

"Parmi les quelques études de bonne qualité, nous avons établi que l'apprentissage profond pouvait effectivement détecter des maladies allant de cancers à des pathologies ophtalmiques avec autant d'exactitude que des professionnels de santé", note Alastair Denniston, consultant à l'University Hospitals de Birmingham (Royaume-Uni), qui a dirigé l'étude.

"On peut peut-être conclure que, d'après le maigre corpus disponible de travaux comparant l'IA aux médecins, l'IA ne fait pas moins bien que les humains. Mais les données sont limitées", a jugé Tessa Cook, professeure assistante de radiologie à l'université de Pennsylvanie (États-Unis), dans un commentaire indépendant. Comparer les deux est hasardeux, ajoute-t-elle, rappelant que les médecins travaillent dans le vrai monde, où les données médicales sont "brouillonnes, difficiles à cerner et imparfaites". (avec AFP)