Pregunta del obligatorio

Pregunta del obligatorio

de Karolina Soca Rosas -
Número de respuestas: 3

Buenas, tengo una duda del obligatorio 1 la pregunta de validación cruzada, en el teórico hay una diapositiva que dice que el conjunto de entrenamiento se divide en N conjuntos  + el de test, dejando fijo el de test y luego se entra a iterar entre los N conjuntos variando en N el que corresponde al de validación siendo los restantes los de entrenamiento. En ninguna de las opciones de respuesta a la pregunta se considera la fracción de datos de entrenamiento que corresponden al test, que se deja fijo a parte, esto me llevó a elegir como correcta la de Ninguna de las anteriores. Y realmente no entiendo por qué eso está mal? Capaz estoy entreverando algo. Desde ya muchas gracias.

Diapositiva 

Saludos,

Karolina

En respuesta a Karolina Soca Rosas

Re: Pregunta del obligatorio

de Pablo Muse -
Hola Karolina,

La pregunta habla específicamente de cómo partir el conjunto de entrenamiento. No habla del conjunto de test, que es disjunto al conjunto de entrenamiento y que muchas veces nos viene dado externamente. La opción correcta era:

Dividir el conjunto de entrenamiento en 5 folds del mismo tamaño. Se itera sobre cada fold, seleccionando a éste como conjunto de validación y los otros cuatro como entrenamiento.

Saludos,

Pablo
En respuesta a Pablo Muse

Re: Pregunta del obligatorio

de Karolina Soca Rosas -
Perdón por insistir, quizá para mi no quedó tan claro, pero en ningún momento nombra que sea específicamente para el conjunto de entrenamiento o que el de test venga o no dado por separado. O sea la pregunta dice cómo se describe correctamente el procedimiento de validación cruzada de 5 fold, yo a eso entiendo que me están preguntando cómo es el procedimiento de validación cruzada como un todo con la característica que se va a particionar en 5 partes el conjunto de entrenamiento. Si bien entiendo lo que me decis de que el conjunto de test podría venir dado externamente, también entiendo que en el algoritmo muchas veces y como se menciona en las clases, se habla en cross validation, de primer paso generar el conjunto de entrenamiento y el de test, y luego en este conjunto de entrenamiento subdividirlo en los folds correspondientes. Realmente perdón por insistir, pero no me parece que esté tan claro que la pregunta apuntaba sólo a como se trabaja el conjunto de entrenamiento, esa opción se hubiera eliminado, eliminando el hecho de tener Ninguna de las anteriores como una opción.
Disculpas nuevamente. 

Saludos,

Karolina

En respuesta a Karolina Soca Rosas

Re: Pregunta del obligatorio

de Pablo Muse -
Karina,

El metodo de validación cruzada trata sobre validación, no sobre test. Es una forma de simular un conjunto de validación cuando la base de datos de train no es lo suficientemente grande. En clase hablamos y discutimos esto abundantemente. La prueba de ello es que la pregunta la contestaron correctamente 18 personas de 20. El otro compañero que contestó mal NO contestó "Ninguna de las anteriores". Por ende no consideramos que la pregunta sea ambigüa o induzca a error.

Saludos,

Pablo