Répertoire des expertises
Retour aux résultats de recherche

Titre du projet de recherche

Surveillance rentable et intelligente des systèmes logiciels à grande échelle

niveau d'étude

Maîtrise ou doctorat

Directeur/codirecteur

Directeur : Heng Li

Fin de l'affichage

31 août 2025

Domaines d'expertise

Génie logiciel

Logiciels et développement

Pôle d'excellence principal


Technologies de l'information et communications

Unité(s) et département(s)

Département de génie informatique et génie logiciel

Conditions

Plusieurs postes ouverts pour les étudiants de maîtrise et de doctorat.

Coordonnées: heng.li@polymtl.ca

Aide financière disponible.

Description détaillée

Les systèmes logiciels à grande échelle tels que les services Web d'Amazon jouent un rôle de plus en plus important dans notre vie quotidienne. D'autre part, les défaillances de ces systèmes à grande échelle peuvent avoir des conséquences importantes sur nos vies et notre sécurité, ainsi que sur l'économie et la sécurité de notre société. Par exemple, une défaillance des services Web d'Amazon en 2017 a entraîné la perte de centaines de millions de dollars et a eu des répercussions sur de nombreuses organisations et personnes qui dépendent de ces services. Pour remédier à de telles défaillances et améliorer la qualité des systèmes logiciels à grande échelle, il est important d'acquérir une compréhension suffisante de l'état interne et du comportement d'exécution de ces systèmes au cours de leur développement, de leur exploitation et de leur maintenance. L'observabilité des logiciels (c.-à-d. la mesure dans laquelle un système extériorise son état interne) permet aux ingénieurs logiciels d'acquérir une telle compréhension et de vérifier si un système se comporte comme prévu. Ce projet vise à améliorer l'observabilité des systèmes logiciels à grande échelle par le biais d'une surveillance rentable. Cependant, la surveillance des logiciels est confrontée à deux défis principaux : 1) la surcharge de surveillance - les ressources supplémentaires de calcul et de stockage nécessaires pour produire et gérer les données de surveillance ; et 2) la grande échelle et la complexité des données de surveillance - les systèmes logiciels à grande échelle génèrent généralement une très grande quantité de données de surveillance provenant de sources multiples (par exemple, les journaux, les traces et les mesures de performance de différents services Web et applications), ce qui pose des problèmes pour l'analyse et l'utilisation de ces données.

Dans ce projet, nous nous appuierons sur le génie logiciel, l'apprentissage automatique et les approches d'analyse statistique pour relever les défis de la surveillance des systèmes logiciels à grande échelle en suivant deux directions mutuellement complémentaires : 1) améliorer la qualité de la surveillance par l'automatisation et l'augmentation, de sorte que les informations importantes sur le fonctionnement du système puissent être enregistrées et gérées de manière efficace ; et 2) fournir un soutien intelligent (par exemple, des solutions basées sur l'apprentissage automatique) pour l'analyse de données de surveillance complexes et de grande taille. Les résultats de ce projet profiteront aux ingénieurs en logiciel et aux opérateurs en les aidant à mieux comprendre l'état général et le comportement interne en cours d'exécution de leurs systèmes logiciels à grande échelle, à économiser leurs efforts dans la construction, l'analyse, le débogage et la maintenance de ces systèmes, et à améliorer la qualité globale du système.

Ce projet formera des étudiants dans les domaines pluridisciplinaires du génie logiciel, de l'exploration de données, de l'apprentissage automatique, de l'analyse de programmes, de l'analyse statistique et du traitement du langage naturel.
 

Possibilité de financement

Aide financière disponible.