Taller de Aprendizaje por Refuerzo
Perfilado de sección
-
En las clases dedicadas a los MDPs (por su sigla en inglés, Markov Decision Process) abordaremos los siguientes temas:
- Definición de MDP y de función de valor
- Ecuaciones de Bellman
- Métodos de resolución de MDPs: Value iteration, Policy iteration, Monte Carlo