Clase de consulta 24/5

Clase de consulta 24/5

de Ernesto Dufrechou -
Número de respuestas: 0

Hola,

está disponible la grabación de la clase de consulta de hoy: https://youtu.be/vJAMaX-JGho

Entre otras cosas hablamos sobre cómo calcular la métrica shared_efficiency.


Sobre cómo utilizar nvprof en conjunto con Nvidia Visual Profiler para visualizar las métricas:

  • Primero volcar la salida de nvprof a un archivo:
    • nvprof --analysis-metrics -f -o salida.nvvp ./ejecutable par1 par2... etc
  • Luego transfieren el archivo a su máquina y lo visualizan en Nvidia Visual Profiler (se instala junto con todo el CUDA Toolkit y no es necesario tener una tarjeta de video instalada) 

A pesar de que nvprof y nvvp funcionan bien, NVIDIA está animando a utilizar las nuevas herramientas de profiling.

Para hacer lo mismo con Nsight Compute, primero hay que instalar la herramienta visual localmente:

  • https://developer.nvidia.com/nsight-compute
Luego para obtener el archivo de salida en cluster:
  • ncu -o profile ./ejecutable
Esto genera un archivo de salida profile.nsight-cuprof. Como en el caso anterior, deben copiarlo a su máquina local y visualizarlo con la gui (en linux el comando es ncu-ui)

Saludos!