Sección: Aprendizaje por Recompensas | Aprendizaje por recompensas

Perfilado de sección

Seleccionar sección Aprendizaje por Recompensas
Bienvenidos al curso de Aprendizaje por Recompensas 2021.

Este es un curso de posgrado en que abordaremos la teoría y algoritmos fundamentales de reinforcement learning, donde se destacan policy gradient y q-learning. Entretanto, estableceremos las conexiones naturales que este tema tiene con los procesos de Markov, la optimización, la programación dinámica y el control.

El curso se dictará a través de zoom los miércoles y viernes de 10:00a 11:30 hs, comenzando el miércoles 10 de marzo.

También se prevé guardar copias grabadas de als clases.

Los docentes del curso son José Lezama, Agustín Castellano, y quien escribe, Juan Bazerque.

Su aprobación constará de cuatro repartidos con ejercicios matemáticos y de programación, que deberán resolver en sus casas y entregar para su corrección. También habrá un examen final.

Por más detalles, adjunto el programa. En los próximos días agregaré más información.

Si tienen interés en el curso, por favor inscribanse a esta página EVA para que tengamos un estimativo del número de estudiantes, y para que les lleguen las noticias que enviemos al foro de novedades. Pueden también enviar sus preguntas o comentarios al foro de consultas y discusión.

Clases por zoom

https://us02web.zoom.us/j/88618370121?pwd=OTJHeWZwdFk1TEtkZnlLSU9DRGpvUT09

Meeting ID: 886 1837 0121

Passcode: 666459

Evaluación

Entergables

HW1 (15%): Markov decision processes

HW2 (15%): Policy gradinet - Reinforce

HW3 (15%): Policy gradient with baselines

HW4 (15%): Actor critic - Q-learning

Examen final 40%

Preguntas teóricas y programación de ejemplos

Examen oral por zoom de control de conocimientos

Bibliografía

Reinforcement Learning: An introduction " Second edition

Richard S. Sutton and Andrew G. Barto

Online: http://webdocs.cs.ualberta.ca/sutton/book/the-book.html

Algorithms for Reinforcement Learning

Csaba Szepesvari

Online: https://sites.ualberta.ca/~szepesva/RLBook.html
- Seleccionar actividad Programa de la assignatura
  
  Programa de la assignatura Archivo
- Seleccionar actividad Formularios de Inscripción y Evaluación
  
  Los estudiantes deben
  
  Marcar como hecha
  
  Formularios de Inscripción y Evaluación
- Seleccionar actividad Formulario de Inscripción
  
  Formulario de Inscripción Encuesta
- Seleccionar actividad Formulario de evaluación
  
  Formulario de evaluación Encuesta
  
  Los estudiantes deben
  
  Enviar retroalimentación

Perfilado de sección

Bienvenidos al curso de Aprendizaje por Recompensas 2021.

Clases por zoom

Evaluación

Bibliografía

Formularios de Inscripción y Evaluación