Agregué a los materiales del curso la presentación del miércoles pasado sobre selección de variables en el modelo de regresión lineal, y el programa en R que consideramos hoy con la implementación de estas técnicas.
Sobre el final de la clase de hoy estuvimos comentando dos cosas adicionales:
- El problema de hacer inferencia (por ejemplo mirando p-valores), luego de seleccionar un modelo. Al respecto recomiendo la lectura del siguiente artículo:
http://www-stat.wharton.upenn.edu/~berkr/selection%20copy.pdf
- La alternativa de ajustar un modelo con todas los predictores pero agregando un término de penalización sobre el "tamaño" de los coeficientes (técnicas de regularización). Sobre ésto hay mucha bibliografía, en particular pueden ver el capítulo 6 de:
http://www-bcf.usc.edu/~gareth/ISL/
y los capítulos 3 y 18 de:
http://statweb.stanford.edu/~tibs/ElemStatLearn/
Si nos da el tiempo podremos ver algo más sobre estos temas la semana que viene. Sino por lo menos les quedan las referencias.
Saludos,
Sebastián.