Vous êtes ici : Accueil > Recherche > Informatique
  • Recherche,

Machine learning : une nouvelle méthode d’analyse d’images biomédicales développée par le chercheur Sylvain Cussat-Blanc

le 2 février 2024

Professeur des universités en informatique à UT Capitole, Sylvain Cussat-Blanc utilise la technique de la programmation génétique pour analyser des images biomédicales. En collaboration avec l’équipe de Salvatore Valitutti, chercheur au Centre de Recherches en Cancérologie de Toulouse (CRCT - CNRS/Inserm/UT3), il vient de publier un article sur une nouvelle méthode de machine learning capable de fonctionner avec peu de données et de façon transparente. Une avancée majeure pour la recherche en cancérologie.

Les récentes avancées en matière de deep learning ont révolutionné le domaine de la vision par ordinateur, créant des algorithmes qui rivalisent avec les experts humains dans les tâches de segmentation d'images biomédicales. Toutefois, pour être performants, ces outils ont besoin d'apprendre à partir d'un très grand volume de données annotées par l'homme, et les résultats qu'ils proposent sont difficiles à interpréter.

Dans l'article intitulé "Evolutionary design of explainable algorithms for biomedical image segmentation" et publié le 6 novembre 2023 dans la revue scientifique et multidisciplinaire "Nature Communications", Sylvain Cussat-Blanc propose un nouvel algorithme, baptisé Kartezio et basé sur la programmation génétique, qui apprend à segmenter les images à partir d'un tout petit jeu de données et dont les résultats peuvent être interprétés par les experts.
 

Un travail collaboratif entre chercheurs en informatique et biologistes


Cela fait presque 10 ans que l'équipe de Salvatore Valitutti, chercheur au  CRCT et spécialiste de la synapse immunologique, travaille avec des membres de l'IRIT sur différents sujets de recherche. Depuis 4 ans, une équipe IRIT@CRCT a même été mise en place et sept chercheurs en informatique se sont installés de façon permanente dans les locaux de l'Oncopole. Cette collaboration leur permet de mieux comprendre les besoins des médecins et biologistes, et de développer des outils qui peuvent être utilisés par la suite.
Notre objectif est d'être le plus proche possible des biologistes et des médecins du Cancéropôle afin de développer des algorithmes spécifiques qui répondent véritablement à leurs problématiques.

La nouvelle technique développée par l'équipe de Sylvain Cussat-Blanc répond à une problématique précise formulée par Salvatore Valitutti : la difficulté de segmenter, c'est à dire de détourer des objets spécifiques dans une image, et plus précisément des images de cellules du système immunitaire, les lymphocytes T cytotoxiques, qui combattent les cellules cancéreuses. Le nouvel algorithme permet de détecter ces cellules et de mieux comprendre comment elles interagissent entre elles.
 

Des pipelines d’analyse d’images transparents et interprétables


Contrairement au deep learning, qui nécessite des data set composés de milliers d'images annotées pour réussir à faire apprendre les réseaux neurones, ce nouvel algorithme peut apprendre à détourer des images à partir d'un tout petit jeu de données. « Dans l'article, on montre que cela fonctionne avec 10 images annotées seulement », souligne Sylvain Cussat-Blanc.
Les pipelines d’analyse d’images générés sont de qualité équivalente au deep learning mais en n’ayant besoin que de quelques images pour l’apprentissage.
Image extraite de l'article sur Kartezio
Image extraite de l'article sur Kartezio

Pour élaborer cette nouvelle technique, l'équipe de l'IRIT a réutilisé des algorithmes de vision par ordinateur déjà existants dans des bibliothèques standards. « Nous avons développé un algorithme capable d'optimiser et d'assembler automatiquement des algorithmes qui servent déjà depuis plusieurs décennies à analyser des images, à supprimer du flou, à détecter du bruit ou encore à détecter des frontières entre les différentes parties des images », explique le chercheur.
 
Autre avantage de cette nouvelle méthode : les résultats peuvent être lus, compris et expliqués. Alors que les réseaux du deep learning contiennent des millions, voire des milliards de paramètres à partir desquels l'outil propose un diagnostic, Kartezio, en se basant sur l'assemblage d'algorithmes déjà existants, obtient des pipelines interprétables.
 

Une avancée majeure pour la médecine


En médecine, les données sont souvent nombreuses mais très peu annotées. « Ce nouvel algorithme va faire gagner du temps d'annotation aux experts, aux médecins : si on leur demande d'annoter quelques images, et non des milliers, cela devient une quantité qui est acceptable », commente Sylvain Cussat-Blanc. Quant aux biologistes, ils ne disposent bien souvent que de très petits volumes de données. Kartezio est donc pour eux un outil d'analyse automatique très prometteur.
 
L'autre grand intérêt de cette technique pour les médecins est d'avoir à leur disposition un algorithme qui fonctionne et dont on peut expliquer pourquoi il prend telle ou telle décision pour un patient, ce qui est un aspect crucial dans les domaines critiques telle que la santé.
En médecine, quand on prend une décision ou que l'on fait un diagnostic, il faut pouvoir le justifier, c'est une obligation légale.
 

Un brevet en cours de dépôt


L'algorithme Kartezio est en cours de brevetage via Inserm Transfert. En parallèle, l'équipe de l'IRIT continue le développement de cette technique afin de réduire encore la quantité d'annotations nécessaires à l'outil et d'améliorer les résultats. Une entreprise, basée sur cet algorithme, verra peut-être également le jour à plus long terme, confie le chercheur.

Partenaires :
Mis à jour le 13 février 2024