Tema Nombre Descripción
Archivo Programa del curso

Programa del curso 

Tema 2 Archivo Introducción

Introducción

Archivo Preguntas realizadas en la clase II

Preguntas

URL Link a introducción visual- ej:árbol

http://www.r2d3.us/visual-intro-to-machine-learning-part-1/

URL Link visual: Complejidad del modelo, errores, sobreajuste...

Ejemplo que analiza compromiso complejidad del modelo, sesgo, varianza, error para árbol de decisión

URL link visualización k-means

link visualización k-means

Archivo Statistical Pattern Recognition: A Review, 2000, Jain et al. URL

Artículo

Archivo Information fusion in biometrics

Information fusion in biometrics- Ross, Jain

Tema 3 Archivo Métodos de clasificación sin métrica- Árboles de decisión

Arboles

Archivo ID3
Archivo Arboles_decisión_python

Ejemplo de árboles de decisión

Tema 4 Archivo Selección de características

Selección de características

Archivo Extracción de caracteristicas

Extracción de características

Archivo Artículo Feature Selection
URL Feature Extraction Course- Guyon

Link al curso

Archivo Wrappers for feature subset selection

Wrappers

Tema 5 Archivo Maxima verosimilitud y Estimación Bayesiana de parámetros

Maxima verosimilitud y Estimación Bayesiana de parámetros

Archivo Teoría Decisión Neyman Pearson

Teoría Decisión Neyman Pearson

Archivo Teoria Decisión Bayesiana

Teoria Decisión Bayesiana

Archivo Novel classifier scheme for imbalanced problems

Diseño de clasificador con función objetivo F-measure

Archivo A new framework for optimal classifier design

Articulo: diseño de clasificadores optimos para una medida de desempeño seleccionada.

Archivo Evaluation Measures for Models Assessment over Imbalanced Data Sets

Evaluation 

Archivo Evaluación empírica de estimadores

Evaluación empírica de estimadores

Archivo MLE empírico

MLE empírico

Archivo ROCs
Comparación de Rocs de distintos clasificadores
Archivo Ejemplo- Clasificador con Riesgos Bayesianos

Riesgos Bayesianos

Archivo Naive Bayes

Naive Bayes

Tema 6 Archivo Tecnicas Supervisadas No Parametricas I
Archivo Tecnicas Supervisadas No Parametricas II
Archivo Adaptive Nearest Neighbor Pattern Classification- Geva, Sitte
Archivo Comparación k-vecinos

Comparación k-vecinos

Archivo Estimación densidades kde

Estimación kde y costos

Tema 7 Archivo Transparencias de clase
Archivo Notas complementarias sobre regresión logística

Relación de la función de costo con la divergencia de Kullback-Leibler y la entropía cruzada.

Tema 8 Archivo Transparencias de clase, Support Vector Machines

Support Vector Machines: principio, definición del criterio, y deducción (optimizacíon) del hiperplano y los vectores de soporte.

Archivo Notas de clase, Support Vector Machines
Tema 9 Archivo Transparencias de clase (Redes Multicapa)

Redes Neuronales Multicapa

Tema 10 Archivo Transparencias de clase: no supervisado paramétrico

Mezcla de densidades
Mezcla de Gaussianas
EM, aplicación a mezcla de densidades

Archivo Ejemplo de uso de EM en High Dynamic Range Imaging

Artículo en donde las muestras saturadas por los captores de una imagen se tratan como datos faltantes

Archivo Transparencias de clase: clustering

Clustering particional y aglomerativo

Archivo Artículo "Data Clustering: 50 Years Beyond K-Means", A. K. Jain.
Archivo Lectura recomendada: clustering en presencia de outliers

Este método es sumamente apropiado para situaciones en las que el ruido o la cantidad de outliers domina, y los clusters de interés contienen pocos puntos con respecto a los outliers. El método detecta automáticamente la clusters relevantes, sin necesidad de especificar cuántos son, considerándolos como eventos raros si éstos siguieran la distribución "de fondo" que da orígen a los outliers.

Archivo Lectura recomendada: Bayesian Hierarchical Clustering
Tema 11 Archivo Combinación de clasificadores clase 1

Generalidades. Comités de clasificadores, bagging y boosting. 

Archivo Combinación de clasificadores clase 2

Random Forests, Gradient Boosting, Mezcla de expertos.

Archivo Artículo original de Bagging

Leo Breiman. "Bagging Predictors", Machine Learning, 24, 123–140 (1996) .

Archivo Artículo original de Random Forests (Breiman, 2001)
Archivo Artículo original de AdaBoost

Y. Freund and R.E. Schapire. "A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting". Journal of computer and system sciences 55, 119-139 (1997) .

 

Archivo Artículo Viola y Jones: detección de caras con boosting
Archivo Otro ejemplo: clasificación de lesiones de piel con imágenes dermatoscópicas

Una aplicación de la metodología desde la extracción de características hasta la clasificación.

Tema 12 Archivo The class imbalance problem in pattern classification and learning
Archivo Metacost (Domingos)
Archivo Cost-sensitive learning (Elkan)
Archivo SMOTE
Tema 13 Archivo Links a tutoriales y recursos de python

Links a tutoriales y recursos de python

Archivo Instalación de herramientas del curso

Instalación de herramientas del curso

Archivo ejemplo árbol de clasificación

Ejemplo de árbol de clasificación usando scikit-learn

Archivo Machine Learning in Python

Bibliotecas de python que se utilizarán en el curso

Archivo Hoja de ejercicios (tp1_2018.pdf)

Fecha límite de entrega 4/9/2017

Archivo Datos 0,3,8 MNIST

Base de datos con 5 características de 2500 patrones de digitos 0, 3 y 8 de MNIST.

Las características son:
-valor medio
-varianza
-proyección sobre el promedio de los 0s -promedio de los 3s
-proyección sobre el promedio de los 8s -promedio de los 3s
-proyección sobre el promedio de los 0s -promedio de los 8s

Archivo ecg mit en formato weka

electrocardiogramas en formato weka

Archivo 2018- Hoja de ejercicios (tp2_2018.pdf)

Práctico 2

Archivo Archivos práctico 2 (archivos_practico2_2018.zip)

Archivos necesarios para realizar el práctico 2

Archivo Hoja de ejercicios (tp3_2018.pdf)

Letra práctico 3

Archivo Archivos práctico 3 (archivos_practico3_2018.zip)

Archivos necesarios para realizar el práctico 3

Tema 14 Página Guía para propuestas de proyecto

Guía para la confección de la propuesta de proyecto a entregar por parte de los estudiantes.

Archivo Proyecto estándar 2018
URL Enlace a los datos del proyecto de curso estándar 2018

Son Dos archivos train_dataset.zip y train_genre.csv de tamaño 6GB y 820k. 

En la secretaría del instituto se dejará un pendrive con los datos por si es demasiado pesado para que los bajen por Internet.



URL Enlace a los datos de test del proyecto de curso estándar 2018

Son Dos archivos train_dataset.zip y train_genre.csv de tamaño 711MB y 94k. 


Página Trabajos Finales de años anteriores

Archivo de todos los informes de trabajos de años culminados.

Página Trabajos Finales 2015
Página Trabajos Finales 2016
Página Trabajos Finales 2017