{"cells":[{"cell_type":"markdown","metadata":{"id":"9w55iu84dhSc"},"source":["# Práctica 1: Reconocimiento de dígitos manuscritos con extracción manual de características\n","\n","El nuevo banco \"First bank of Wiki\" desea implementar un sistema de reconocimiento automático de cheques como el siguiente:\n","\n","![texto alternativo](https://upload.wikimedia.org/wikipedia/commons/b/b9/CanadianChequeSample.png)\n","\n","\n","Actualmente, el banco cuenta con un sistema capaz de aislar los dígitos y convertirlos en imágenes de 8 x 8, pero no de reconocer de qué dígito se trata. Por esa razón, nos ha solicitado realizar un módulo capaz de reconocer dígitos manuscritos dada una imagen de 8 x 8 pixeles:\n","\n","\n","![image.png]()\n","\n"]},{"cell_type":"markdown","metadata":{"id":"JRXCJPO4i9As"},"source":["# Cargando los datos\n","\n","Primero vamos a cargar el dataset y visualizar algunos dígitos."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"idhJWfyXjI01"},"outputs":[],"source":["from sklearn.datasets import load_digits\n","from sklearn.model_selection import train_test_split\n","import matplotlib.pyplot as plt\n","import numpy as np\n","\n","digits = load_digits()\n","\n","for i in range(1,17):\n"," plt.subplot(4,4,i)\n"," plt.imshow(digits.images[i,:,:], cmap=plt.get_cmap('gray_r'))\n"]},{"cell_type":"markdown","metadata":{"id":"Sg0KTo54o_5-"},"source":["# Binarizando el problema\n","\n","Para comenzar con un problema más simple, sólo trabajaremos en el escenario de clasificación binaria para dígitos 0 y 1. Para eso, primero filtramos los datos y luego los particionamos en training y test folds."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"kGgaFFAeMfZ7"},"outputs":[],"source":["# Cargo los dígitos\n","#X, y = load_digits(return_X_y=True)\n","X, y = digits.images, digits.target\n","\n","# Filtro los que sean 0 o 1\n","indices = np.array(range(X.shape[0]))\n","bin_indices = indices[(y==0) | (y == 1)]\n","\n","X_bin = X[bin_indices,:,:]\n","y_bin = y[bin_indices]\n","\n","# Creo los splits para training y test\n","X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)\n","X_bin_train, X_bin_test, y_bin_train, y_bin_test = train_test_split(X_bin, y_bin, test_size=0.33, random_state=42)\n","\n","print(\"Total de datos para clasificación entre 10 dígitos: \" + str(y.shape[0]))\n","print(\"Total de datos para clasificación binaria: \" + str(y_bin.shape[0]))\n","print(\"Total de 1s para clasificación binaria: \" + str(y_bin_test.sum()))\n","print(\"Total de 0s para clasificación binaria: \" + str(y_bin_test.shape[0] - y_bin_test.sum()))\n"]},{"cell_type":"markdown","metadata":{"id":"TyUyLdAA6V9D"},"source":["Visualizamos ahora los dígitos del problema binario"]},{"cell_type":"code","execution_count":null,"metadata":{"id":"wtL6E1nq6bpT"},"outputs":[],"source":["for i in range(1,17):\n"," plt.subplot(4,4,i)\n"," plt.imshow(X_bin[i,:,:], cmap=plt.get_cmap('gray_r'))"]},{"cell_type":"markdown","metadata":{"id":"SPuQbJ5r6j_K"},"source":["# Entrenando un perceptrón simple con extracción manual de características para clasificación binaria\n","\n","Ahora procederemos a entrenar un perceptrón usando la biblioteca Scikit Learn. Esta biblioteca de aprendizaje automático implementa muchísimos modelos listos para usar. En este caso, usaremos el perceptrón simple `sklearn.linear_model.Perceptron`\n","\n","Pero antes de definir el perceptrón, vamos a definir el método de extracción de características que transformará una imagen (`np.array`) de 8 x 8 en un vector unidimensional de 2 componentes. Para ello, podemos probar con dos estrategias diferentes (si se les ocurre alguna otra, adelante!):\n","\n","* **Estrategia 1:** vamos a considerar la feature 0 como la media de intensidades de la parte superior del dígito (filas 0 a 3) y y la feature 1 como la media de la parte inferior (filas 4 a 7) tal como indica la imagen:\n","\n","![image.png]()\n","\n","* **Estrategia 2:** Como alternativa, vamos a considerar la feature 0 como la media de toda la imagen, y la feature 1 como el desvío estandar:\n","\n","![image.png]()\n"]},{"cell_type":"code","execution_count":null,"metadata":{"id":"KSeo0BVNVuhe"},"outputs":[],"source":["def extract_features_mean_std(x):\n"," x_out = np.zeros(shape=(1,2))\n"," x_out[0,0] = ....\n"," x_out[0,1] = ....\n","\n"," return x_out\n","\n","def extract_features_mean_top_bottom(x):\n"," x_out = np.zeros(shape=(1,2))\n","\n"," ......\n","\n"," return x_out\n","\n","def preprocess_features_mean_std(X):\n"," X_pp = np.zeros(shape=(X.shape[0], 2))\n","\n"," for i in range(X.shape[0]):\n"," X_pp[i,:] = extract_features_mean_std(X[i,:,:])\n","\n"," return X_pp\n"," \n","def preprocess_features_mean_top_bottom(X):\n"," X_pp = np.zeros(shape=(X.shape[0], 2))\n","\n"," for i in range(X.shape[0]):\n"," X_pp[i,:] = extract_features_mean_top_bottom(X[i,:,:])\n","\n"," return X_pp"]},{"cell_type":"markdown","metadata":{"id":"a8-ngXGZNJls"},"source":["Ahora implementamos el perceptrón usando la clase `sklearn.linear_model.Perceptron` y lo entrenamos usando las features elegidas (probar con ambas features y ver cuál da mejor accuracy)."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"rZTR7ucsM7i9"},"outputs":[],"source":["\n","# Definimos un pereceptrón\n","clasificador = ...........\n","\n","# Transformamos las features de los datos para el problema binario\n","X_bin_train_features = preprocess_.....( .... )\n","X_bin_test_features = preprocess_.....( ...... )\n","\n","# Entrenamos el clasificador\n","clasificador.......\n","\n","# Imprimir la accuracy en los datos de test.\n","print(\"Accuracy en test: \" + str(clasificador.score( ......... )))\n","\n","# Imprimir las predicciones realizadas para los datos de test\n","\n","print(\"Predictions: \" + str(clasificador.predict( ......... )))\n","\n"]},{"cell_type":"markdown","metadata":{"id":"D4_AbzSsRPnk"},"source":["# Visualizando las features\n","\n","Para entender el grado de discriminabilidad que presentan nuestras features, vamos a visualizarlas. Para hacerlo, colorear los items de cada clase con un color diferente."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"x6Se0EBpU2Du"},"outputs":[],"source":["plt.figure()\n","plt.scatter( ..... )"]},{"cell_type":"markdown","metadata":{"id":"CBE98daaMkyj"},"source":["# Complicando las cosas: \n","\n","\n","Ahora volvemos al caso de 10 dígitos y probamos la misma estrategia que estábamos usando anteriormente."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"rmEkarqVYTfa"},"outputs":[],"source":["# Definimos un pereceptrón\n","clasificador10 = ........\n","\n","X_train_features = preprocess.......(X_train)\n","X_test_features = preprocess........(X_test)\n","\n","clasificador10.......\n","\n","# Imprimir la accuracy en los datos de test.\n","print(\"Accuracy en test: \" + str(clasificador10.score( ......... )))\n","\n","# Imprimir las predicciones realizadas para los datos de test\n","\n","print(\"Predictions: \" + str(clasificador10.predict( ......... )))\n"]},{"cell_type":"markdown","metadata":{"id":"HB_GNJ5rbjrH"},"source":["Para intentar entender por qué disminuye tan drásticamente la performance, visualicen las features de las 10 clases coloreando cada punto en un color diferente como hicimos anteriormente."]},{"cell_type":"code","execution_count":null,"metadata":{"id":"TARhDBtJbJfG"},"outputs":[],"source":["plt.figure()\n","plt.scatter( ....... )"]},{"cell_type":"markdown","metadata":{"id":"bq3syn9nantl"},"source":["# Entregable:\n","* Deberán entregar el Colab completo con el código funcionando. Además, deberán incluir (en el mismo Colab) un pequeño informe donde muestren las visualizaciones de las features, y responder a las siguientes preguntas:\n","\n","1. ¿Cuál fue la estrategia de extracción de características que mejor te funcionó? Visualizar las features generadas por los extractores implementados y utilizarlas para explicar por qué funcionó mejor esa estrategia.\n","\n","2. ¿Cuál sería la accuracy para un algoritmo que prediga aleatoriamente las clases en el caso del problema binario si los datos de test estuvieran balanceados? ¿Y en el caso del problema multiclase de 10 dígitos? \n","\n","3. El clasificador diseñado en cada caso (binario y multiclase), ¿Funcionó mejor que un clasificador aleatorio?\n","\n"]},{"cell_type":"markdown","metadata":{"id":"LILdOHhVPkdV"},"source":["# Respuesta:\n","\n"]},{"cell_type":"code","execution_count":null,"metadata":{"id":"7TJUynJJPqsK"},"outputs":[],"source":[]}],"metadata":{"accelerator":"GPU","colab":{"authorship_tag":"ABX9TyOVQwrMIt6JYG/KorouqouK","name":"Practica 1 UTDT 2021 - Estudiantes","provenance":[{"file_id":"1qaxOuOyuO6WDLWSM73gV_xn0qYB1EKtW","timestamp":1581540422452}]},"kernelspec":{"display_name":"Python 3","name":"python3"}},"nbformat":4,"nbformat_minor":0}