Hola,
Tengo 2 dudas de letra de la tarea 2.
- Parte 2,1. Qué es desbalance de datos ? Qué la cantidad de párrafos de cada personaje no es igual ?
- Parte 2,3. No nos queda claro sobre qué conjunto de datos debemos entrenar y testear.
Gracias
Hola,
Tengo 2 dudas de letra de la tarea 2.
Hola Juan,
- Desbalance de datos es eso, cuando el número de observaciones de alguna clase es mucho mayor. Algunas métricas como la accuracy son muy malas en este tipo de casos, hay que discutir por qué.
- La idea es entrenar con todo el conjunto de train, sin apartar partes para validación como se hace en el punto anterior.