dataset L1 inmanejable para SQL Server Managment Studio

Re: dataset L1 inmanejable para SQL Server Managment Studio

de Flavia Serra -
Número de respuestas: 2
Hola Agustín,

de tu planteo me surgen para ustedes las siguientes preguntas:

- Consideran que la mejor solución para la NL es una única tabla?
- Consideran que tener una única tabla permite explotar de la mejor manera la gestión de calidad de datos?
- Ustedes están pensando en una BD relacional como solución, siendo así, están teniendo en cuenta todo lo que han aprendido para diseñar BD relacionales?

Mi recomendación es que reflexionen respecto a estas preguntas que les dejo, para que analicen si están yendo por la mejor opción. Seguimos discutiendo.

Saludos,
Flavia
En respuesta a Flavia Serra

Re: dataset L1 inmanejable para SQL Server Managment Studio

de Agustín Torres Mari -
Buenas Flavia!
Tenés toda la razón del mundo, continuamos trabajando luego del mensaje que envié y mejoramos el diseño de la base de datos, lo que nos permitió poder generar reportes automáticos respecto a usuarios y libros.
Sin embargo, seguimos teniendo problema con generar reportes automáticos de los ratings, hay tantas reseñas (4 millones) que el pandas ocupa demasiada ram al generar el reporte y se corta el proceso.
Es una opción viable ver los reportes y realizar los mismos estudios mediante SQL, que está mucho más optimizado para hacer consultas?
Desde ya muchas gracias!
En respuesta a Agustín Torres Mari

Re: dataset L1 inmanejable para SQL Server Managment Studio

de Flavia Serra -
Hola Agustin,

entiendo que toda esta conversación es sobre el data profiling. Están en una BD postgreSQL, así que claro que tiene sentido usar SQL. Por otro lado, si quieren usar pandas tiene sentido usar un muestreo de los datos para hacer análisis, mientras que en postgres pueden usar los 4 millones sin problemas.

Saludos!
Flavia