État de l'art Vision AI en médecine

Introduction

L’intelligence artificielle appliquée à la vision par ordinateur connaît une expansion rapide dans le domaine médical. Grâce à l’augmentation de la puissance de calcul, à la disponibilité croissante des données d’imagerie et aux avancées en deep learning, les systèmes d’analyse d’images médicales sont très performants.

Vocabulaire

Anatomopathologie : spécialité qui étudie les tissus et les cellules pour établir un diagnostic, souvent à partir de lames histologiques numériques.
Radiologie : spécialité utilisant l’imagerie médicale pour visualiser l’intérieur du corps et détecter des anomalies.
Ophtalmologie : spécialité médicale consacrée aux maladies de l’œil.
Rétinopathie diabétique : complication du diabète affectant les vaisseaux sanguins de la rétine et pouvant entraîner une perte de vision.
Dégénérescence maculaire liée à l’âge : maladie chronique touchant la macula, responsable d’une baisse progressive de la vision centrale.
Endoscopie : technique d’exploration interne du corps à l’aide d’une caméra introduite par voie naturelle ou chirurgicale.
Segmentation d’image : technique informatique permettant de délimiter automatiquement des structures d’intérêt dans une image médicale.
Biomarqueur : indicateur mesurable associé à une maladie ou à son évolution, pouvant être biologique ou issu de l’imagerie.

Principaux domaines d’application

Radiologie

En radiologie, la Vision AI est largement utilisée pour la détection de nodules pulmonaires, l’identification de fractures, la détection de tumeurs cérébrales et l’analyse de mammographies. Les modèles de deep learning, comme les CNN (Convolutional Neural Network), peuvent atteindre dans certains contextes des performances comparables à celles de radiologues. Ces modèles servent surtout dans l’aide au triage, la réduction des faux négatifs et l’amélioration de la reproductibilité diagnostique.

Anatomopathologie

En anatomopathologie, l’IA permet par exemple la détection de cellules tumorales et la classification de sous‑types de cancer. Ces images, sont souvent complexes et volumineuses. Les approches basées sur le deep learning facilitent la segmentation tumorale, la quantification de biomarqueurs et l’analyse à grande échelle, ce qui permet d'exploiter des volumes de données difficilement analysables manuellement.

Ophtalmologie

L’ophtalmologie est l’un des domaines les plus avancés en matière de déploiement clinique. Les systèmes d’IA sont utilisés pour la détection de la rétinopathie diabétique et l’identification de la dégénérescence maculaire liée à l’âge (DMLA). Certains dispositifs ont déjà obtenu des autorisations réglementaires et sont intégrés dans des parcours de soins, notamment pour le dépistage automatisé en soins primaires.

Analyse vidéo médicale

L’analyse vidéo médicale représente un axe de recherche en forte croissance. Elle inclut l’endoscopie assistée par IA, la chirurgie augmentée et l’analyse du mouvement en rééducation. L’intégration de la dimension temporelle, via des modèles spatio‑temporels (CNN‑LSTM, Transformers vidéo), permet d’exploiter les séquences pour améliorer la détection en temps réel, le guidage per‑opératoire et l’évaluation fonctionnelle.

Approches techniques dominantes

Réseaux convolutifs (CNN)

Les CNN ont la capacité à extraire automatiquement des caractéristiques locales hiérarchiques. Ils sont performants pour la classification, la détection de lésions et l’analyse d’images 2D ou 3D (scanner, IRM).

Source :

He et al., Deep Residual Learning for Image Recognition, CVPR, 2016.

U‑Net et variantes

Proposé spécifiquement pour la segmentation biomédicale, U‑Net est utilisé pour la délimitation précise de structures anatomiques. Son architecture encodeur–décodeur permet de combiner les informations contextuelles et les détails fins.

Source :

Ronneberger et al., U‑Net: Convolutional Networks for Biomedical Image Segmentation, MICCAI, 2015.

Modèles spatio‑temporels

Pour l’analyse vidéo médicale (endoscopie, chirurgie assistée, imagerie cardiaque dynamique), les modèles ont besoins d'intégrer l’information spatiale et la dynamique temporelle. Des architectures qui combinent les CNN et LSTM (Long Short Term Memory) ou des Transformers vidéo permettent de capturer cette dimension séquentielle.

Source :

Donahue et al., Long-term Recurrent Convolutional Networks for Visual Recognition and Description, CVPR, 2015.

Performances et limites

Les modèles d’IA en imagerie médicale affichent souvent des performances élevées (AUC, Dice score, sensibilité, spécificité) dans des études expérimentales. Mais ces résultats sont généralement obtenus sur des jeux de données contrôlés et ont parfois du mal à refléter la réalité clinique.

Il y a plusieurs limites. D'abord les modèles sont souvent entraînés sur des bases mono-centriques (données provenant d'un seul établissement de santé, ce qui limite leur capacité de généralisation. Le manque de diversité démographique peut entraîner des écarts de performance entre les populations. Ils sont aussi sensibles aux variations d’équipements et de protocoles d’acquisition, les résultats peuvent donc être différent en fonction de chaque établissement

C'est pour ça que la robustesse et la la généralisation entre les différents établissements sont des enjeux majeurs pour déployer des modèles fiables pour chaque clinique.

Les enjeux pour le déploiement

Explicabilité

Un modèle performant mais opaque (boîte noire) peut ralentir son déploiement. Les professionnels de santé doivent comprendre sur quels éléments le système fonde sa décision, quelles zones de l’image sont déterminantes et quel est le niveau d’incertitude associé au résultat. L’explicabilité est très importante pour instaurer la confiance, faciliter la validation clinique et répondre aux exigences éthiques et réglementaires.

Intégration clinique

La performance technique ne suffit pas car l’outil doit s’intégrer naturellement dans les logiciels d’imagerie et les dossiers patients informatisés, sans alourdir le travail des équipes. Il faut qu'il soit rapide, ergonomique et compatible avec l'organisation existante. Si la solution perturbe les pratiques, même si elle est perfomante elle ne pourra pas être mise en place.

Réglementation

Les dispositifs médicaux qui intègrent de l’intelligence artificielle sont soumis à des exigences réglementaires strictes en Europe, notamment pour l’évaluation clinique, la gestion des risques et la traçabilité. La conformité doit être anticipée dès la conception des modèles poure permettre une mise sur le marché et un usage hospitalier sécurisé.

Qualité des données

La performance dépend directement de la qualité, de la précision des annotations et de la représentativité des données utilisées pour l’entraînement. Des données biaisées ou peu diversifiées mènent à des modèles instables et moins fiables. La structuration, la standardisation et la diversité des données sont des conditions essentielles pour garantir la robustesse et l'équité des résultats.

Conclusion

La vision par intelligence artificielle en santé ne se limite plus à démontrer des performances élevées en laboratoire. Afficher d’excellents résultats sur un jeu de données interne ne suffit plus car l’enjeu est de pouvoir passer à l’échelle clinique réelle.

La première évolution est la robustesse multi-centrique car un modèle doit garder ses performances même si il est déployé dans différents hôpitaux, avec des appareils parfois différents ou des des populations plus diverses. Il faut garantir la stabilité des performances dans des environnements multiples et non contrôlés.

La réduction des biais est aussi un autre axe majeur. Les modèles peuvent reproduire des déséquilibres démographiques, techniques ou cliniques présents dans les données d’entraînement. L’évaluation par sous-population, l’analyse des écarts de performance et l’intégration de données plus diversifiées sont indispensables pour avoir une utilisation équitable et fiable.

L’amélioration de l’interprétabilité est essentielle car en médecine une décision doit être comprise et justifiée. Un modèle peut être très performant mais il sera difficilement accepté s’il ne peut pas expliquer ses résultats. C'est pour ça que les recherches actuelles cherchent donc à montrer les zones qui ont influencé la décision car ça permet de mieux comprendre la prédiction et d’estimer l’incertitude.