Cola eterna en Cluster

Cola eterna en Cluster

de Juan Jose Ferrand Incio -
Número de respuestas: 1

Estamos teniendo problemas con el cluster. Cada vez que queremos probar los cambios que realizamos en el código, la ejecución del nuevo proceso queda en una cola eterna.  Ayer trabajamos sin problema en el correr de la tarde, ya en la noche aproximadamente a las 20hs iniciamos un proceso y este no se ejecutó hasta hoy a las 7 de la mañana.

Realizamos los cambios y volvimos a ejecutarlo hoy a las 13 hs, todavía no se pudo obtener acceso a la gpu.

Existe alguna forma de asegurarnos un tiempo de espera menor? Este problema no surgio en las entregas anteriores pero hace varios días que viene pasando lo mismo y nos atrasa con la entrega.


En respuesta a Juan Jose Ferrand Incio

Re: Cola eterna en Cluster

de Ernesto Dufrechou -
Hola, cuando el cluster esté congestionado pueden probar correr usando la partición besteffort.

Deben cambiar el script de lanzamiento de la siguiente forma:
#SBATCH --partition=besteffort
#SBATCH --qos=besteffort_gpu

Saludos!