Mañana continuamos con Q-learning.
Es el segundo método más celebrado de RL junto con policy gradient.
Cambiaremos de link y de Id en zoom, volviendo al original
https://us02web.zoom.us/j/88618370121?pwd=OTJHeWZwdFk1TEtkZnlLSU9DRGpvUT09
Meeting ID: 886 1837 0121
Passcode: 666459
Adjunto las transparencias para mañanas.
Saludos
Juan Bazerque