Resumen de Aprendizaje por recompensas

APR Aprendizaje por recompensas

Bienvenidos al curso de Aprendizaje por Recompensas.

Este es un curso de posgrado en que abordaremos la teoría y algoritmos fundamentales de reinforcement learning, donde se destacan policy gradient y q-learning. Entretanto, estableceremos las conexiones naturales que este tema tiene con los procesos de Markov, la optimización, la programación dinámica y el control.

El curso se dictará a través de zoom los miércoles y viernes de 10:00a 11:30 hs, comenzando el miércoles 10 de marzo.

Los docentes del curso son José Lezama, Agustín Castellano, y quien escribe, Juan Bazerque.

Su aprobación constará de cuatro repartidos con ejercicios matemáticos y de programación, que deberán resolver en sus casas y entregar para su corrección, más un examen final.

Por más detalles, adjunto el programa. En los próximos días agregaré más información.

Si tienen interés en el curso, por favor inscribanse a esta página EVA para que tengamos un estimativo del número de estudiantes, y para que les lleguen las noticias que enviemos al foro de novedades.

Profesor Responsable: Juan Andres Bazerque Giusto