Bienvenidos al curso de Aprendizaje por Recompensas.
Este es un curso de posgrado en que abordaremos la teoría y algoritmos fundamentales de reinforcement learning, donde se destacan policy gradient y q-learning. Entretanto, estableceremos las conexiones naturales que este tema tiene con los procesos de Markov, la optimización, la programación dinámica y el control.
El curso se dictará a través de zoom los miércoles y viernes de 10:00a 11:30 hs, comenzando el miércoles 10 de marzo.
Los docentes del curso son José Lezama, Agustín Castellano, y quien escribe, Juan Bazerque.
Su aprobación constará de cuatro repartidos con ejercicios matemáticos y de programación, que deberán resolver en sus casas y entregar para su corrección, más un examen final.
Por más detalles, adjunto el programa. En los próximos días agregaré más información.
Si tienen interés en el curso, por favor inscribanse a esta página EVA para que tengamos un estimativo del número de estudiantes, y para que les lleguen las noticias que enviemos al foro de novedades.
- Profesor Responsable: Juan Andres Bazerque Giusto