Block 1: Reinforcement learning¶

1. Week 1: Introduction et programmation dynamique

2. Week 2: Approches sans modèles et échantillonnage

3. Week 3: Approximation de la fonction de valeur

4. Week 4: Policy Gradient

5. Week 5: Actor Critic et ouvertures