Hola,
Acá va la tarea de finalización del curso. Consta de tres partes:
1) Hacer una búsqueda bibliografía sobre las variables surrogativas en CART y como se vincula con el concepto de importancia de las variables en CART.
2) Ejercicio 7 de la lista de ejercicios sobre CART
3) Para las bases de datos de iris (clasificación) y de airquality (regresión) armar un programa para evaluar el desempeño de k-NN, CART, Random Forest y SVM. El objetivo es de poder concluir sobre qué método es mejor para cada una de las bases de datos.
Se deberá:
- indicar claramente como fue la calibración de los distintos parámetros de los algoritmos.
- realizar 30 separación en train/test y sacar a partir de ellas un error promedio de cada técnica junto con su error estándar.
El plazo de entrega es el martes 20/4 a las 18:00.
La semana que viene intercambiaremos de manera de ir evacuando las distintas dudas que puedan surgir.
Saludos y buen fin de semana.
Mathias