Programmes d'études
Topics in RL and Adaptive Agents
Programmes d'études
Topics in RL and Adaptive Agents
Programmes d'études
Détails et horaire du cours
Légende
Cours de jour
Cours de soir
Cours en ligne
Certificats et microprogrammes de 1er cycle
Baccalauréat (formation d'ingénieur)
Études supérieures
INF6953WE
Topics in RL and Adaptive Agents
Nombre de crédits :
4 (3 - 3 - 6)
Les chiffres indiqués entre parenthèses sous le sigle du cours, par exemple (3 - 2 - 4), constituent le triplet horaire.
Le premier chiffre est le nombre d'heures de cours théorique par semaine (les périodes de cours durent 50 minutes).
Le second chiffre est le nombre d'heures de travaux dirigés (exercices) ou laboratoire, par semaine.
(Note : certains cours ont un triplet (3 - 1.5 - 4.5). Dans ce cas, les 1,5 heure par semaine sont des laboratoires qui durent 3 heures mais qui ont lieu toutes les deux semaines. À Polytechnique, on parle alors de laboratoires bi-hebdomadaires).
Le troisième chiffre est un nombre d'heures estimé que l'étudiant doit investir de façon personnelle par semaine pour réussir son cours.
Le premier chiffre est le nombre d'heures de cours théorique par semaine (les périodes de cours durent 50 minutes).
Le second chiffre est le nombre d'heures de travaux dirigés (exercices) ou laboratoire, par semaine.
(Note : certains cours ont un triplet (3 - 1.5 - 4.5). Dans ce cas, les 1,5 heure par semaine sont des laboratoires qui durent 3 heures mais qui ont lieu toutes les deux semaines. À Polytechnique, on parle alors de laboratoires bi-hebdomadaires).
Le troisième chiffre est un nombre d'heures estimé que l'étudiant doit investir de façon personnelle par semaine pour réussir son cours.
Département :
Génies informatique & logiciel
Préalable(s) :
Corequis :
Notes :
INF8250AE (Apprentissage par renforcement) et INF8245AE (Apprentissage automatique) ou cours ou connaissances équivalents. Les étudiants doivent posséder de solides bases en mathématiques (probabilités, calcul différentiel et intégral, bases de l'analyse) et en programmation.
Responsable(s) :
Amir Massoud Farahmand
Description
This graduate seminar-style course explores many research topics in reinforcement learning (RL) and adaptive agent design. Students will engage with key papers in modern RL and related areas in adaptive agent design. The topics are Imitation Learning, Advances Policy Search, Empirical Evaluation in RL, Hierarchical RL, Advances in Exploration-Exploitation, Batch RL, Distributional RL, Multi-Agent RL, Safety and Robustness in RL, RL for Large Language Models, RL Acceleration, and Evolutionary Approach to Agent Design. The course emphasizes both algorithmic advances and theoretical foundations.
This graduate seminar-style course explores many research topics in reinforcement learning (RL) and adaptive agent design. Students will engage with key papers in modern RL and related areas in adaptive agent design. The topics are Imitation Learning, Advances Policy Search, Empirical Evaluation in RL, Hierarchical RL, Advances in Exploration-Exploitation, Batch RL, Distributional RL, Multi-Agent RL, Safety and Robustness in RL, RL for Large Language Models, RL Acceleration, and Evolutionary Approach to Agent Design. The course emphasizes both algorithmic advances and theoretical foundations.
Horaire
| Cours | ||||
|---|---|---|---|---|
| Groupe | Jour | Heure | Local | Enseignant(e)(s) |
| 01 | Lundi | 14h45, 15h45, 16h45 | L-3816 | Farahmand, Amir Massoud |
| Travaux pratiques | ||||
|---|---|---|---|---|
| Groupe | Jour | Heure | Local | Enseignant(e)(s) |
| 01 | Mercredi | 12h45, 13h45, 14h45 | L-6624 | Farahmand, Amir Massoud |
Plan triennal
| 2025-2026 | 2026-2027 | 2027-2028 | ||||||
|---|---|---|---|---|---|---|---|---|
| Automne | Hiver | Été | Automne | Hiver | Été | Automne | Hiver | Été |
| - | Cours de jour | - | - | - | - | - | - | - |