Practico 2, ejercicio 1.3

Practico 2, ejercicio 1.3

de Nelson Sebastian Laborde Castillo -
Número de respuestas: 3

No me queda claro si hay que correr la solución en MAP3 además de MAP1 y MAP2 ??, porque resulta que para el MAP3 tras varias pruebas de ir cambiando los hiper parámetros del algoritmo no logramos que aprenda la política.

Muchas Gracias

En respuesta a Nelson Sebastian Laborde Castillo

Re: Practico 2, ejercicio 1.3

de Agustin Castellano -
Hola,

el algoritmo lo pueden ensayar en cualquiera de los tres mapas, pero lo que les pedimos es que muestren los resultados para MAP2.
Agregamos el tercer mapa para que vean cómo se desempeña reinforce en un entorno más complejo, pero en general pasa un poco lo que vos decís. Para que converja bien hay que tener una mezcla de suerte en las primeras trayectorias y buena elección de hiperparámetros.

Saludos,
Agustin
En respuesta a Agustin Castellano

Re: Practico 2, ejercicio 1.3

de Nelson Sebastian Laborde Castillo -
Es necesario inicializar el "estado inicial" en diferentes puntos del tablero ?