Sobre tarea de integración

Sobre tarea de integración

de Flavia Serra -
Número de respuestas: 0

Estimad@s,

dadas las consultas realizadas sobre cómo hacer la integración de los datos, acá les dejamos algunas aclaraciones que deben tener en cuenta sobre el dataset resultado de la integración:

  • puede estar en una BD relacional Postgres, en un CSV o en lo que ustedes consideren más conveniente para sus tareas. Piensen en que el formato que elijan debe poder ser procesado en la medición de la calidad. Por ejemplo, en el caso que usen Postgres las métricas pueden ser implementadas usando consultas SQL.
  • los datos integrados deben quedar lo más "crudos" posible. Esto significa que no deben arreglarlos para poder integrarlos, porque si los dejan perfectos ya no tiene sentido la gestión de la calidad. Justamente, lo que queremos saber es qué tantos problemas de calidad deberíamos resolver una vez que se hayan integrado los datos. Resumiendo, deben hacer correcciones mínimas como para poder integrar, documentando y justificando todas las decisiones tomadas. Si alguna decisión les resulta muy arriesgada la pueden discutir con nosotras. 
  • tomen decisiones que les permita explotar los datos de la mejor forma, en el sentido de que puedan hacer la mayor cantidad de mediciones de calidad posible. Por ejemplo, si manejaran nombres, almacénenlos de forma tal que puedan verificar si están bien escritos, si son reales, etc, etc, etc.

Esperamos estas aclaraciones les ayude. Si aún así siguen con dudas, por favor, consultan por el foro, así las preguntas quedan disponibles para tod@s l@s compañer@s.

Saludos!

Flavia