Programmes d'études
C. SPEC. : Machine Learning Evaluation

Programmes d'études
C. SPEC. : Machine Learning Evaluation
Programmes d'études
Détails et horaire du cours
Légende
Cours de jour
Cours de soir
Cours en ligne
Certificats et microprogrammes de 1er cycle
Baccalauréat (formation d'ingénieur)
Études supérieures
INF6953RE
C. SPEC. : Machine Learning Evaluation
Nombre de crédits :
4 (3 - 1.5 - 7.5)
Les chiffres indiqués entre parenthèses sous le sigle du cours, par exemple (3 - 2 - 4), constituent le triplet horaire.
Le premier chiffre est le nombre d'heures de cours théorique par semaine (les périodes de cours durent 50 minutes).
Le second chiffre est le nombre d'heures de travaux dirigés (exercices) ou laboratoire, par semaine.
(Note : certains cours ont un triplet (3 - 1.5 - 4.5). Dans ce cas, les 1,5 heure par semaine sont des laboratoires qui durent 3 heures mais qui ont lieu toutes les deux semaines. À Polytechnique, on parle alors de laboratoires bi-hebdomadaires).
Le troisième chiffre est un nombre d'heures estimé que l'étudiant doit investir de façon personnelle par semaine pour réussir son cours.
Le premier chiffre est le nombre d'heures de cours théorique par semaine (les périodes de cours durent 50 minutes).
Le second chiffre est le nombre d'heures de travaux dirigés (exercices) ou laboratoire, par semaine.
(Note : certains cours ont un triplet (3 - 1.5 - 4.5). Dans ce cas, les 1,5 heure par semaine sont des laboratoires qui durent 3 heures mais qui ont lieu toutes les deux semaines. À Polytechnique, on parle alors de laboratoires bi-hebdomadaires).
Le troisième chiffre est un nombre d'heures estimé que l'étudiant doit investir de façon personnelle par semaine pour réussir son cours.
Département :
Génies informatique & logiciel
Préalable(s) :
Corequis :
Notes :
Responsable(s) :
À venir
Description
Prediction (The Statistical Trap, Probability, Generalization, Repeatability). The Holdout Method (Stability, Internal Validity). Machine Learning Benchmarks (History of Benchmark Design, Evaluation Failures, Dynamic Benchmarks, Multi-Task Benchmarking, Sensitivity). External Validity, Reproducibility, Robustness (Distribution Shift). Adaptivity and Overfitting (Test Set Reuse). Construct Validity (Context, Scope, Lakatosian Defense). Evaluating Uncertainty (Calibration Error, Prediction Sets, Conformal Inference). Forecast Evaluation (Scoring Rules, Accounting for Uncertainty, Confidence Sequences). Games as Benchmarks (History of Benchmark Games). Evaluating Interventions (Temporal Validity, Compliance, Adjustment). Regulation and Deployment (Program Evaluation, Policy Evaluation, Auditing via Sequential Hypothesis Testing).
Prediction (The Statistical Trap, Probability, Generalization, Repeatability). The Holdout Method (Stability, Internal Validity). Machine Learning Benchmarks (History of Benchmark Design, Evaluation Failures, Dynamic Benchmarks, Multi-Task Benchmarking, Sensitivity). External Validity, Reproducibility, Robustness (Distribution Shift). Adaptivity and Overfitting (Test Set Reuse). Construct Validity (Context, Scope, Lakatosian Defense). Evaluating Uncertainty (Calibration Error, Prediction Sets, Conformal Inference). Forecast Evaluation (Scoring Rules, Accounting for Uncertainty, Confidence Sequences). Games as Benchmarks (History of Benchmark Games). Evaluating Interventions (Temporal Validity, Compliance, Adjustment). Regulation and Deployment (Program Evaluation, Policy Evaluation, Auditing via Sequential Hypothesis Testing).
Plan triennal
2025-2026 | 2026-2027 | 2027-2028 | ||||||
---|---|---|---|---|---|---|---|---|
Automne | Hiver | Été | Automne | Hiver | Été | Automne | Hiver | Été |
Cours de jour | - | - | - | - | - | - | - | - |