Estimados,
existe una forma de ver una animación del carrito, usando el paquete gym de OpenAI. Ahí están implementados un montón de entornos de Reinforcement Learning, pueden vicharlos en su página (link).
Les adjunto un ejemplo de cómo correr la animación. Lamentablemente gym no corre bien desde un notebook, así que deberían correrlo desde sus máquinas. En el ejemplo tengo un archivo functions.py donde la política CustomPolicy resuelve el problema.
Si están usando Colab, pueden bajar la matriz de pesos de su política haciendo algo así:
from google.colab import files
with open('weights.txt', 'wb') as fp:
np.savetxt(fp, policy.weights)
files.download('weights.txt')
Cualquier consulta me avisan.
Saludos,
Agustin