Buenas tardes, les dejamos un par de preguntas que nos parecieron relevantes que los demás compañeros puedan ver:
- En la parte A, se menciona que se debe elegir una métrica como Calidad de Señal. En caso de elegir una (por ej: Qual), entendemos que no se podrían usar el resto de las métricas como columnas para el conjunto X. ¿Esto es así?
- Con respecto a las columnas del dataset g-nettrack, hay una gran cantidad de columnas sin nombre. ¿Cómo deberíamos interpretar estos datos? ¿Deberíamos ignorarlos o nos dan algún tipo de información?
- Al sumergirnos en el proceso de preprocesamiento de los datos nos encontramos con que varias columnas son del tipo Object y que para aplicar un modelo de aprendizaje automático, deberíamos transformar estas columnas a algún tipo numérico (podría ser one-hot encoding). Es un poco engorroso realizar este proceso para tanta cantidad de columnas, y más para las que no tenemos información específica de su significado. Existe algún conjunto de columnas que ustedes nos recomienden usar a priori, ¿o esto también entra en nuestra parte de la investigación?