Bienvenidos al curso de Aprendizaje por Recompensas.

Este es un curso de posgrado en que abordaremos la teoría y  algoritmos fundamentales de reinforcement learning, donde se destacan policy gradient y q-learning. Entretanto, estableceremos las conexiones naturales que este tema tiene con los procesos de Markov, la optimización, la programación dinámica y el control. 

El curso se dictará a través de zoom los miércoles y viernes de 10:00a 11:30 hs, comenzando el miércoles 10 de marzo. 

Los docentes del curso son José Lezama, Agustín Castellano, y quien escribe, Juan Bazerque.

Su aprobación constará de cuatro repartidos con ejercicios matemáticos y de programación, que deberán resolver en sus casas y entregar para su corrección, más un examen final.

Por más detalles, adjunto el programa. En los próximos días  agregaré más información.

Si tienen interés en el curso, por favor inscribanse a esta página EVA para que tengamos un estimativo del número de estudiantes, y para que les lleguen las noticias que enviemos al foro de novedades.