Buenas tardes.
Realizando el Ejercicio 2 del Practico 4, tuvimos un problema al ejecutar el main. Primero realizamos el sbatch lanzar.sh con todos los archivos de materiales en el mismo directorio. Esto realiza entre otras cosas el make y genera el ejecutable ./main, el cual al ejecutar (./main A_matriz.mtx) nos devuelve el siguiente error:
./main: error while loading shared libraries: libcudart.so.12: cannot open shared object file: No such file or directory
Tambien nos devuelve el mismo error incluso sin parametros.
Segun investigamos, este error significa que el ejecutable main depende de la biblioteca compartida de CUDA libcudart.so.12, pero no puede encontrarla en las rutas de búsqueda del sistema. Intentamos solucionarlo realizando el siguiente comando:
export LD_LIBRARY_PATH=/clustergpu/apps/ollama/lib/ollama/cuda_v12:$LD_LIBRARY_PATH
Ya que buscamos la libreria en el sistema y la encontramos en ese PATH.
Sin embargo el problema persiste, pues ahora aparece el mismo error pero con una libreria diferente (libcudart.so.1), y esta no la encontramos.
Suponemos que este error no es un error de nuestra implementacion de main.cu.
Esperamos su respuesta, para poder salir de dudas y seguir trabajando,
Saludos
Consulta sobre ejecucion del main en el Ejercicio 2
Número de respuestas: 4
En respuesta a Diego Eduardo Pisa Sanchez
Re: Consulta sobre ejecucion del main en el Ejercicio 2
de Manuel Freire -
Hola,
Es dificil entender el error sin ver su codigo. Como decís parece ser un problema de librerías ¿cuál de las dos (cub/thrust) están usando? ¿Cambiaron el makefile que les di en algo? ¿En qué GPU ejecutan? Me parece raro porque en la solución que hice no estoy logrando generar ese error algo que debería ser fácil siendo un problema de librerias.
Saludos!
Manuel
Es dificil entender el error sin ver su codigo. Como decís parece ser un problema de librerías ¿cuál de las dos (cub/thrust) están usando? ¿Cambiaron el makefile que les di en algo? ¿En qué GPU ejecutan? Me parece raro porque en la solución que hice no estoy logrando generar ese error algo que debería ser fácil siendo un problema de librerias.
Saludos!
Manuel
En respuesta a Manuel Freire
Re: Consulta sobre ejecucion del main en el Ejercicio 2
Hola buenas tardes. Muchas gracias por su respuesta.
Para nuestra solucion estamos utilizando la libreria CUB, ademas de las dependencias originales incluidas en el archvio main.cu, agregamos: cub/cub.cuh.
El Makefile no lo modificamos en nada, no sabriamos si seria conveniente o no.
Espero que esta informacion sea suficiente, en caso de que no estoy a disposicion de proveer mas. Desde ya muchas gracias.
Para nuestra solucion estamos utilizando la libreria CUB, ademas de las dependencias originales incluidas en el archvio main.cu, agregamos: cub/cub.cuh.
El Makefile no lo modificamos en nada, no sabriamos si seria conveniente o no.
Espero que esta informacion sea suficiente, en caso de que no estoy a disposicion de proveer mas. Desde ya muchas gracias.
En respuesta a Diego Eduardo Pisa Sanchez
Re: Consulta sobre ejecucion del main en el Ejercicio 2
de Manuel Freire -
Hola Diego,
De lo que me decís no me doy cuenta cuál es el error, entiendo que debería funcionar. Dado que parece ser un problema de inclusión una prueba que pueden hacer es descargarse localmente CUB (https://github.com/NVIDIA/cub) y agregarlo como include local. Si eso no funciona te diría que me pases el código por mail (mfreire@fing.edu.uy) para intentar reproducir el error.
Saludos!
Manuel
En respuesta a Manuel Freire
Re: Consulta sobre ejecucion del main en el Ejercicio 2
Buenas noches,
Pudimos resolver al final, estábamos ejecutando mal.
Hacíamos sbatch lanzar.sh y después ./main A_matrix.mtx . En vez de ejecutar todo junto en un comando . Perdón por las molestias y gracias por la atención y las respuestas.
Pudimos resolver al final, estábamos ejecutando mal.
Hacíamos sbatch lanzar.sh y después ./main A_matrix.mtx . En vez de ejecutar todo junto en un comando . Perdón por las molestias y gracias por la atención y las respuestas.