Répertoire des expertises
Retour aux résultats de recherche

Titre du projet de recherche

GAI-ORKG : Generative AI for Oncology Research with Knowledge Graphs / Intelligence Artificielle Générative pour la Recherche en Oncologie avec Graphe de Connaissances (doctorat)

niveau d'étude

Doctorat

Directeur/codirecteur

Directeur : Amal Zouaq

Fin de l'affichage

19 juillet 2025

Domaines d'expertise

Intelligence artificielle

Sciences médicales

Unité(s) et département(s)

Département de génie informatique et génie logiciel

LAMA-WeST (Web, Sémantique et Texte)

Conditions

Le laboratoire LAMA-WeST (http://www.labowest.ca/) est en phase de recrutement de plusieurs étudiants et étudiantes au doctorat à partir de la session d’automne 2023.

Le candidat ou la candidate au doctorat doit détenir une maîtrise en traitement automatique des langues / apprentissage machine et/ou Web sémantique (création d’ontologies, bases de connaissances, etc). Il ou elle doit être passionné.e par la recherche et avoir une connaissance de la programmation Python. Une expérience dans le domaine de l’IA et de la santé est un plus.

Veuillez envoyer à amal.zouaq@polymtl.ca un CV, un relevé de notes, ainsi qu’une lettre motivant comment votre expérience passée peut contribuer à ce projet. Veuillez indiquer dans le sujet du message : Doctorat (D1 ou D2) - GAI-ORKG : Generative AI for Oncology Research with Knowledge Graph.

 

Description détaillée

Au cours des deux dernières décennies, les soins de santé sont passés d'une réalité sur papier à une réalité numérique et il existe désormais une mine de données de santé numériques. Simultanément, l’essor de l'intelligence artificielle a contribué à des avancées dans de nombreux domaines de la société. Toutefois, la nature non structurée et cloisonnée d'un grand nombre de données sur la santé signifie que ces développements parallèles ont à peine convergé et que les avantages de l'IA dans les soins de santé restent, à ce jour, peu concrétisés. Cela est particulièrement vrai dans les soins contre le cancer. Pour de nombreux patients atteints de cancer, des informations importantes sont enfouies dans des notes cliniques dans des parties disparates de leur dossier de santé électronique. De même, des informations utiles, qui pourraient contribuer à la recherche sur le cancer alimentée par l'IA, sont dans des silos inaccessibles aux chercheurs. Une solution pour combiner, consolider et exploiter les données de santé non structurées est nécessaire.

Pour atteindre cet objectif, l'équipe de recherche s'appuiera sur les normes modernes en matière de données de santé pour créer / apprendre une base de connaissances sur les patients atteints de cancer (c'est-à-dire un dossier entièrement structuré pour chaque patient) à partir de données structurées et non structurées dans les dossiers de santé électroniques. Nous étudierons comment les architectures neuronales, les modèles de langage pré-entraînés et les graphes de connaissances peuvent être utilisés pour extraire une telle base de connaissances et fournir des informations pertinentes aux spécialistes grâce à des approches de génération en langage naturel.

Deux doctorats sont prévus dans ce projet :

L’objectif du premier doctorat (D1) sera de concevoir et mettre en place une méthodologie pour extraire de l’information à partir de textes et peupler une base de connaissances en oncologie. Cela impliquera donc des défis de représentation de connaissances et d’extraction de connaissances, des défis d’alignement, ainsi que des modèles neuronaux (y compris génératifs) de traitement automatique des langues.

L’objectif du second doctorat (D2) sera de concevoir et mettre en place une méthodologie pour générer des synthèses adaptées à partir de notes cliniques et de la base de connaissances en oncologie. Cela impliquera donc des défis de synthèse et génération en langue naturelle et d’intégration de plongements de graphes de connaissances, ainsi que des méthodes pour éviter et détecter les problèmes d’hallucination des modèles.

Professeur(e)s impliqué(e)s dans le projet

Polytechnique Montréal :  Amal Zouaq
McGill :  John Kildea

Possibilité de financement

Financement disponible