Hola,
está disponible la grabación de la clase de consulta de hoy: https://youtu.be/vJAMaX-JGho
Entre otras cosas hablamos sobre cómo calcular la métrica shared_efficiency.
Sobre cómo utilizar nvprof en conjunto con Nvidia Visual Profiler para visualizar las métricas:
- Primero volcar la salida de nvprof a un archivo:
- nvprof --analysis-metrics -f -o salida.nvvp ./ejecutable par1 par2... etc
- Luego transfieren el archivo a su máquina y lo visualizan en Nvidia Visual Profiler (se instala junto con todo el CUDA Toolkit y no es necesario tener una tarjeta de video instalada)
A pesar de que nvprof y nvvp funcionan bien, NVIDIA está animando a utilizar las nuevas herramientas de profiling.
Para hacer lo mismo con Nsight Compute, primero hay que instalar la herramienta visual localmente:
- https://developer.nvidia.com/nsight-compute
- ncu -o profile ./ejecutable
Saludos!