Hola Facundo, Martin:
Me acaba de surgir una duda existencial: Al ejecutar una accion, ¿cuando debería terminar?
O sea, si la accion es girar a la izquierda con velocidades vl y vr (de los motores), ¿la accion termina luego de transcurridos X milisegundos, o cuando el sistema cambie de estado?
La pregunta viene por el hecho de que los estados están discretizados, entonces al girar X ms va a pasar que algunas veces cambies de estado y otras te quedes en el mismo. ¿Que pasa ahi? Como que es ambiguo para QLearning el efecto que tiene esa accion en ese estado, ¿no?
Capaz que estoy diciendo cualquier cosa ;)
Gracias,
Gabriel.