Hola,
La intención de incluir la flag es utilizar el set de instrucciones de las tarjetas del cluster. Si tu hardware objetivo es otra tarjeta necesitas cambiar esa flag. Si tenés una tarjeta Maxwell (sm_5x), el código compilado para una tarjeta 6.0 podría directamente no funcionar (un código compilado para 5.x sí debería funcionar en 6.0). Una forma fácil de saber las compute capabilities de tu tarjeta es ejecutando el ejemplo deviceQuery que se encuentra en el directorio CUDA_DIR/samples/1_Utilities (CUDA_DIR es donde tenés instalado CUDA). Ese ejemplo utiliza cudaGetDeviceProperties para obtener la información del dispositivo.
Saludos!