false false
L’émergence de nouvelles approches et technologies issues de l’Intelligence Artificielle (IA), du traitement automatique du langage naturel (TALN) et du « deep learning » ouvre de plus en plus de perspectives dans le domaine de la santé et de la médecine. Parmi elles, le développement de « grands modèles de langage » (Large Language Models – LLM) se distingue comme une approche particulièrement prometteuse. Le principe : apprendre à modéliser et à générer automatiquement du « langage médical » au moyen d’une très grande quantité de données textuelles pour permettre le traitement de nombreuses applications médicales. Des chercheurs de Nantes Université, en collaboration avec Avignon Université, et la clinique des données du CHU de Nantes, ont adapté un LLM généraliste vers le domaine médical, totalement open-source à partir de données textuelles « ouvertes » en santé. Ce modèle inédit s’est classé parmi les cinq tendances mondiales sur la plateforme HuggingFace lors de sa sortie.
L’arrivée du modèle « BioMistral » marque une étape importante dans l’intégration de l’IA dans le secteur de la santé. Ses implications potentielles sont vastes, allant de l’amélioration de la recherche (accès à une meilleure connaissance) à l’amélioration de la prise de décision clinique. Déployé en open source / open data, ce grand modèle de langage a pu être en partie réalisé grâce au projet ANR MALADES, porté par le Laboratoire des sciences du numérique de Nantes (LS2N) et l’équipe TALN (Nantes Université – CNRS – Centrale Nantes), et a pu être rendu possible par le supercalculateur Jean Zay de Genci (Grand équipement national de calcul intensif).
Ce travail est également une belle réalisation collective s’appuyant sur un modèle d’une start-up française (Mistral) et utilisant la force de la recherche académique dans le domaine de la santé avec la collaboration d’Avignon Université (Yanis Labrak, Mickael Rouvier), de Nantes Université (Richard Dufour, Emmanuel Morin) et la Clinique des données du CHU de Nantes (Adrien Bazoge, Pierre-Antoine Gourraud).
Bien que BioMistral vise à intégrer des connaissances médicales, ce modèle peut présenter des risques et des biais non évalués, et ses performances n’ont pas été testés sur des applications cliniques. Par conséquent, son usage en contexte médical est déconseillé sans alignement spécifique et tests approfondis. Il est donc recommandé de l’utiliser uniquement comme un outil de recherche et d’exploration.
Grâce au précieux soutien d’HuggingFace, une démonstration du système de dialogue du modèle BioMistral est disponible sur leur plateforme.