{ "nbformat": 4, "nbformat_minor": 0, "metadata": { "colab": { "provenance": [], "collapsed_sections": [ "WldJ7xmaUnqT", "V2OhTCi1iUcg" ] }, "kernelspec": { "name": "python3", "display_name": "Python 3" }, "language_info": { "name": "python" }, "accelerator": "GPU" }, "cells": [ { "cell_type": "markdown", "metadata": { "id": "R06NvGjGKANx" }, "source": [ "# CIFAR-10 Challenge\n", "\n", "En este práctico intentaremos resolver el challenge CIFAR-10 (https://www.cs.toronto.edu/~kriz/cifar.html) creando una red convolucional desde cero con Keras, y luego compararemos su performance con la obtenida al realizar Transfer Learning partiendo de alguna arquitectura conocida." ] }, { "cell_type": "markdown", "metadata": { "id": "GiQcA3RDK9bb" }, "source": [ "## Preparación y visualización de los datos" ] }, { "cell_type": "markdown", "metadata": { "id": "yYOnm3FoRKAr" }, "source": [ "Empezamos por importar y cargar el dataset, que ya viene separado en conjuntos de entrenamiento y evaluación.\n", "\n", "Por ahora no nos preocuparemos por tener una partición para validación durante el entrenamiento, Keras nos va a proveer una forma fácil de hacerlo al momento de entrenar nuestros modelos." ] }, { "cell_type": "code", "metadata": { "id": "9orrG1_oQ9V_", "colab": { "base_uri": "https://localhost:8080/" }, "outputId": "acc45ec8-db2e-4959-f7c9-ac11e095d309" }, "source": [ "import numpy as np\n", "from keras.datasets import cifar10\n", "\n", "(x_train, y_train), (x_test, y_test) = cifar10.load_data()" ], "execution_count": null, "outputs": [ { "output_type": "stream", "name": "stdout", "text": [ "Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz\n", "170500096/170498071 [==============================] - 11s 0us/step\n", "170508288/170498071 [==============================] - 11s 0us/step\n" ] } ] }, { "cell_type": "markdown", "metadata": { "id": "x9rhhko6Rg2k" }, "source": [ "Los datos vienen con valores RGB en el rango [0, 255], necesitamos llevarlos a [0,1]:" ] }, { "cell_type": "code", "metadata": { "id": "BSiMAaASRZg9" }, "source": [ "x_train = x_train.astype('float32')/255.0\n", "x_test = x_test.astype('float32')/255.0" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "ejyxiDpUSIr1" }, "source": [ "### Ejercicio 1 - Datos básicos de CIFAR-10\n", "\n", "1. ¿Cuántos ejemplos tiene cada partición (entrenamiento y evaluación)?\n", "1. ¿De qué tamaño son las imágenes del dataset?\n", "1. ¿Cuántos canales tienen las imágenes del dataset?\n", "1. ¿Cuántas categorías tiene el dataset?\n", "1. ¿Cuántas imágenes por categoría hay en el conjunto de entrenamiento?" ] }, { "cell_type": "code", "metadata": { "id": "RSS_GvUJU0E5" }, "source": [ "# código para responder las preguntas" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "WldJ7xmaUnqT" }, "source": [ "#### Pistas" ] }, { "cell_type": "markdown", "metadata": { "id": "dmMUPqJLT9_b" }, "source": [ "Para las tres primeras preguntas, basta con explorar las dimensiones de las variables `x_train` y `x_test` con el atributo `shape`. Las dimensiones tienen la forma (N, W, H, C), donde:\n", "* N es la cantidad de imágenes\n", "* W es el ancho de cada imagen\n", "* H es el alto de cada imagen\n", "* C es la cantidad de canales de cada imagen.\n", "\n", "Para las últimas preguntas, `np.unique` puede ser útil. Revisar la documentación: https://numpy.org/doc/stable/reference/generated/numpy.unique.html" ] }, { "cell_type": "markdown", "metadata": { "id": "8iyfGFohYwZ_" }, "source": [ "### Visualización" ] }, { "cell_type": "markdown", "metadata": { "id": "H8FH7CumbebS" }, "source": [ "Observamos que las etiquetas están codificadas como enteros, de 0 a 9. Para hacerlas legibles al momento de desplegarlas luego, utilizaremos la siguiente variable:" ] }, { "cell_type": "code", "metadata": { "id": "oBXpOOk5bfWv" }, "source": [ "labels = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "QWn3KmY1ZC49" }, "source": [ "Para visualizar imágenes del conjunto de entrenamiento podemos utilizar `matplotlib`:" ] }, { "cell_type": "code", "metadata": { "id": "aL1b_ra-bvzj" }, "source": [ "%matplotlib inline\n", "import matplotlib.pyplot as plt" ], "execution_count": null, "outputs": [] }, { "cell_type": "code", "metadata": { "id": "lT-TpiomY2Ct" }, "source": [ "plt.imshow(x_train[1])\n", "plt.show()\n", "print(f'Etiqueta: {labels[y_train[1][0]].upper()}')" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "Y-OnCK93cMnf" }, "source": [ "### Ejercicio 2 (opcional) - Mostrar imágenes aleatorias de una categoría\n", "\n", "Definir una función `show_random_image` que recibe como parámetro una de las categorías de CIFAR-10 y muestra una imagen aleatoria del conjunto de entrenamiento perteneciente a esa categoría." ] }, { "cell_type": "code", "metadata": { "id": "DjTb2GGdeE1M" }, "source": [ "def show_random_image(label: str):\n", " # completar" ], "execution_count": null, "outputs": [] }, { "cell_type": "code", "metadata": { "id": "fyAbStcghkww" }, "source": [ "show_random_image('truck')" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "V2OhTCi1iUcg" }, "source": [ "#### Pistas" ] }, { "cell_type": "markdown", "metadata": { "id": "bSUc2KWIiUci" }, "source": [ "Tratar de resolver el problema siguiendo estos pasos:\n", "1. filtrar `x_train` para quedarnos sólo con las imágenes que pertenecen a la categoría recibida\n", " * convertir el `string` de la categoría en un entero utilizando `labels`\n", " * obtener una lista de booleanos del largo de `y_train` con valores `True` en las posiciones que coinciden con el índice del paso anterior\n", " * utilizar boolean indexing para quedarnos sólo con las imágenes `x_train` que cumplen la condición\n", "1. utilizar `np.random.choice` para elegir un índice del dataset filtrado de forma aleatoria (https://numpy.org/doc/stable/reference/random/generated/numpy.random.choice.html)\n", "* finalmente, desplegar la imagen con `matlplotlib` como se hizo antes." ] }, { "cell_type": "markdown", "metadata": { "id": "G282myTAKu74" }, "source": [ "## Redes convolucionales en Keras" ] }, { "cell_type": "markdown", "metadata": { "id": "xn_TZ0ARpZ_U" }, "source": [ "Comenzaremos a explorar las herramientas que Keras nos ofrece para construir redes convolucionales. Utilizaremos nuevamente la API Sequential, y en particular las clases `Conv2D`, `MaxPool2D` y `Flatten`, además de las que ya vimos en clases anteriores." ] }, { "cell_type": "markdown", "metadata": { "id": "ffmMjwKep2O5" }, "source": [ "### Ejercicio 3: Bloque convolucional" ] }, { "cell_type": "markdown", "metadata": { "id": "uScwJJuqqhi4" }, "source": [ "Considerando el tamaño de entrada de las imágenes de CIFAR-10, y el siguiente bloque convolucional:\n", "\n", "1. Entrada\n", "1. Capa convolucional, 32 filtros de tamaño (3,3), padding de 1px, stride de 1px.\n", "1. Activación: ReLU.\n", "1. Capa convolucional, 64 filtros de tamaño (3,3), sin padding, stride de 1px.\n", "1. Activación: ReLU.\n", "1. MaxPooling de (2,2).\n", "\n", "Calcular la cantidad de parámetros total, y las dimensiones de la salida luego del MaxPooling." ] }, { "cell_type": "markdown", "source": [ "ESTUDIANTES: AGREGAR AQUÍ EL TEXTO CON EL DESARROLLO DE LA SOLUCION PARA LA ENTREGA" ], "metadata": { "id": "6E5l1lBYr2fD" } }, { "cell_type": "markdown", "metadata": { "id": "Qf9eNHxhvxNY" }, "source": [ "### Ejercicio 4: Implementación en Keras" ] }, { "cell_type": "markdown", "metadata": { "id": "B7mwzcU2HikL" }, "source": [ "Utilizando la API sequencial de Keras, y las capas `Conv2D` y `MaxPool2D`, completar la implementación del bloque convolucional del ejercicio anterior. Corroborar los cálculos anteriores utilizando el método `summary`. Documentación:\n", "* https://keras.io/api/layers/convolution_layers/convolution2d/\n", "* https://keras.io/api/layers/pooling_layers/max_pooling2d/\n" ] }, { "cell_type": "code", "metadata": { "id": "zfz1uN70IPmf" }, "source": [ "from keras.models import Sequential\n", "from keras.layers import Input, Dense, Conv2D, Flatten, MaxPool2D" ], "execution_count": null, "outputs": [] }, { "cell_type": "code", "metadata": { "id": "NkjEDnmlyrak" }, "source": [ "model = Sequential()\n", "\n", "model.add(Input(shape=(?,?,?)))\n", "model.add(Conv2D(???))\n", "model.add(Conv2D(???))\n", "model.add(MaxPool2D(???)\n", "model.summary()" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "rsJCRomGzc-g" }, "source": [ "### Completando la arquitectura" ] }, { "cell_type": "markdown", "metadata": { "id": "F-yDCVoWzg5F" }, "source": [ "Hasta ahora tenemos sólo un bloque convolucional básico, con un volumen como salida. Para poder entrenar un modelo para CIFAR-10, precisamos completar la arquitectura de forma de que la salida sea una predicción de categoría.\n", "\n", "Lo primero que tenemos que hacer, es utilizar la capa especial `Flatten` (https://keras.io/api/layers/reshaping_layers/flatten/) que se encarga de \"achatar\" el volumen de salida de la última capa, convirtiéndolo en un arreglo de una única dimensión. Además, esta capa no agrega parámetros, ya que sólo es un reshape. Podemos comprobar ambas aspectos observando la salida de `summary` nuevamente:" ] }, { "cell_type": "code", "metadata": { "id": "mfco6DG_0W2l" }, "source": [ "model.add(Flatten())\n", "model.summary()" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "IRZIvurk1aK4" }, "source": [ "Ahora, con estas dimensiones, ya podemos agregar una capa fully connected que será nuestra capa de salida, con las dimensiones adecuadas a nuestro problema (la cantidad de categorías de salida) y activación `softmax`:\n", "\n" ] }, { "cell_type": "code", "metadata": { "id": "Ei2gZHjm3Oi3" }, "source": [ "model.add(Dense(10, activation='softmax'))\n", "model.summary()" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "XgfjlDBv35VM" }, "source": [ "### Ejercicio 5: Compilar y entrenar" ] }, { "cell_type": "markdown", "metadata": { "id": "g9SECnM_4HUH" }, "source": [ "Con la arquitectura completa estamos listos para compilar el modelo y ponerlo a entrenar. Completar las siguientes celdas, considerando los siguientes puntos:\n", "* utilizar `Adam` con learning rate de 0.001\n", "* utilizar una loss adecuada al formato de etiquetas que tenemos. \n", "* utilizar `accuracy` como métrica de optimización\n", "* entrenar el modelo utilizando la partición de entrenamiento, separando un 10% para validar durante el entrenamiento\n", "* entrenar el modelo durante 10 épocas\n", "\n", "Documentación:\n", "* https://keras.io/api/optimizers/adam/\n", "* https://keras.io/api/losses/" ] }, { "cell_type": "code", "metadata": { "id": "B9_bL7uF4Zhh" }, "source": [ "from tensorflow.keras.optimizers import Adam\n", "\n", "# código para compilar y entrenar el modelo, no debería ser más de dos o tres líneas" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "gXNgPuzn6gCD" }, "source": [ "### Visualizar la historia de entrenamiento" ] }, { "cell_type": "markdown", "metadata": { "id": "1NIpP5_m6n8s" }, "source": [ "Utilizaremos la función `plot_history` para ver cómo evolucionaron la accuracy y la loss durante el entrenamiento:" ] }, { "cell_type": "code", "metadata": { "id": "NYJBxBG_6262" }, "source": [ "def plot_history(history):\n", " # Plot training & validation accuracy values\n", " plt.plot(history.history['accuracy'])\n", " plt.plot(history.history['val_accuracy'])\n", " plt.title('Model accuracy')\n", " plt.ylabel('Accuracy')\n", " plt.xlabel('Epoch')\n", " plt.legend(['Train', 'Validation'], loc='upper left')\n", " plt.show()\n", "\n", " # Plot training & validation loss values\n", " plt.plot(history.history['loss'])\n", " plt.plot(history.history['val_loss'])\n", " plt.title('Model loss')\n", " plt.ylabel('Loss')\n", " plt.xlabel('Epoch')\n", " plt.legend(['Train', 'Validation'], loc='upper left')\n", " plt.show()\n", " plt.clf()" ], "execution_count": null, "outputs": [] }, { "cell_type": "code", "metadata": { "id": "WZ0aLnw0CXxe" }, "source": [ "plot_history(model.history)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "KbnXG9PlCvrk" }, "source": [ "### Ejercicio 6: Controlando el sobreajuste" ] }, { "cell_type": "markdown", "metadata": { "id": "ciIrnS3SACy2" }, "source": [ "Si bien los resultados en la partición de entrenamiento no están nada mal, en el conjunto de validación no pasa lo mismo. Tenemos un claro sobreajuste. Vamos a agregar una capa FC más y un par de capas de Dropout, para mejorar este aspecto.\n", "\n", "Redefinir la arquitectura anterior, ajustando los siguientes puntos:\n", "* ajustar la primer capa convolucional para que tenga 64 filtros y padding `same`\n", "* ajustar la segunda capa convolucional para que tenga 128 filtros y padding `same`\n", "* agregar una capa de `Dropout` con ratio `0.5` luego de la capa `MaxPool2D`\n", "* agregar una nueva capa `Dense` con 256 neuronas y activación `relu` luego de la capa `Flatten`\n", "* agregar una capa de `Dropout` con ratio `0.5` luego de la capa `Dense` anterior\n", "\n", "Volver a compilar y entrenar el modelo." ] }, { "cell_type": "code", "metadata": { "id": "Gm4mJqjJGaqu" }, "source": [ "from keras.layers import Dropout\n", "\n", "model = Sequential()\n", "\n", "model.add(Input(shape=(?,?,?)))\n", "model.add(Conv2D(???))\n", "model.add(Conv2D(???))\n", "# agregar Dropout aquí\n", "model.add(MaxPool2D(???)\n", "model.add(Flatten())\n", "# agregar otra capa Dense aquí\n", "# agregar Dropout aquí\n", "model.add(Dense(10, activation='softmax'))\n", "\n", "# código para compilar y entrenar el nuevo modelo" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "_N9oqkqeSeEr" }, "source": [ "Ahora podemos revisar nuevamente las curvas de evolución de la loss y la accuracy:" ] }, { "cell_type": "code", "metadata": { "id": "cs-g7VZKI9u-" }, "source": [ "plot_history(model.history)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "ArYQ5mI1IkrT" }, "source": [ "### Ejercicio 7: Evaluación" ] }, { "cell_type": "markdown", "metadata": { "id": "4fNAozsJIpF8" }, "source": [ "Finalmente, evaluamos nuestro modelo. Primero visualizaremos algunas predicciones, y luego obtendremos la accuracy total sobre el conjunto de evaluación.\n", "\n", "1. Obtener las predicciones del modelo sobre el conjunto de evaluación (`x_test`).\n", "1. Mostrar la primer imagen del conjunto de evaluación junto con su predicción (utilizar la variable `labels`).\n", "1. Obtener la accuracy del modelo sobre el conjunto de evaluación. Utilizar `sklearn.metrics.accuracy_score`. NOTA: Tener cuidado con el formato de las variables, va a ser necesario transformar las predicciones.\n" ] }, { "cell_type": "code", "metadata": { "id": "sZX9qxNjI_QH" }, "source": [ "# código para evaluar el modelo" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "DaGo_B-sJes3" }, "source": [ "## Transfer Learning" ] }, { "cell_type": "markdown", "metadata": { "id": "_hNzKTOIIe85" }, "source": [ "Ahora vamos a probar utilizar transfer learning para poder aprovechar alguna red pre-entrenada y ajustarla a nuestro problema. Los modelos disponibles en Keras están listados acá: https://keras.io/api/applications/. También se incluyen algunos ejemplos de distintas formas para reutilizarlos.\n" ] }, { "cell_type": "markdown", "metadata": { "id": "2O7pozpy1FVm" }, "source": [ "En este ejemplo utilizaremos InceptionV3, la tercera iteración de Inception, la red originalmente publicada en \"Going Deeper With Convolutions\", de Szegedy et. al, ganadora del challenge ILSRVC en 2014." ] }, { "cell_type": "markdown", "metadata": { "id": "aV6DBL5l1drz" }, "source": [ "![inceptionv3onc--oview.png]()" ] }, { "cell_type": "markdown", "metadata": { "id": "A1MsF7pW2Esn" }, "source": [ "Vamos a cargar los pesos obtenidos de entrenar Inception en el dataset Imagenet, indicando además que no se carge la última sección de la red, que es específica para ese challenge. Luego vamos a especificar nuevas capas que se ajustan a la salida que necesitamos para CIFAR-10." ] }, { "cell_type": "code", "metadata": { "id": "E4Rgc8LccfRe" }, "source": [ "from keras.applications.inception_v3 import InceptionV3\n", "\n", "pretrained = InceptionV3(input_shape=(224, 224, 3),\n", " weights='imagenet',\n", " include_top=False)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "QvwvGo_624IR" }, "source": [ "El siguiente paso es \"congelar\" las capas de InceptionV3, de forma de no tener que entrenarlas. Veamos antes el resumen de la arquitectura de InceptionV3 (observar la cantidad de parámetros entrenables):" ] }, { "cell_type": "code", "metadata": { "id": "E-7Mxmsd3EOQ" }, "source": [ "pretrained.summary()" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "8Z2ZTMBC3WaE" }, "source": [ "### Ejercicio 9: \"Congelando\" capas" ] }, { "cell_type": "markdown", "metadata": { "id": "bekDdIgx3GeH" }, "source": [ "Ahora, si, congelemos las capas, y volvamos a revisar la cantidad de parámetros entrenables. Esto se logra simplemente iterando la lista de capas del modelo (atributo `layers`) y seteando el atributo `trainable` de cada una de ellas en `False`:" ] }, { "cell_type": "code", "metadata": { "id": "6BQ40pp43DRp" }, "source": [ "for layer in ???:\n", " layer.trainable = ???" ], "execution_count": null, "outputs": [] }, { "cell_type": "code", "metadata": { "id": "xx3Pcn2D3R_g" }, "source": [ "pretrained.summary()" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "Y-yQc_5U4HF8" }, "source": [ "### Construyendo un nuevo modelo a partir de InceptionV3" ] }, { "cell_type": "markdown", "metadata": { "id": "rmEWhzDH4U6c" }, "source": [ "Un detalle a resolver es que InceptionV3 espera imágenes de (224, 224) en vez de (32,32). Por esta razón, al crear el modelo, enseguida de la capa de entrada que teníamos antes, agregaremos una capa `Lambda`. Esta capa no tiene parámetros y se encargará de ajustar el tamaño de las imágenes." ] }, { "cell_type": "code", "metadata": { "id": "iG9IdfFM4Rau" }, "source": [ "import tensorflow as tf\n", "from keras.layers import Lambda\n", "\n", "transfer_model = Sequential()\n", "transfer_model.add(Input(shape=(32,32,3)))\n", "transfer_model.add(Lambda(lambda x: tf.image.resize(x, (224, 224))))" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "LrLERNj15JH1" }, "source": [ "Ahora podemos agregar todas las capas de InceptionV3 en un sólo paso, pasando como parámetro a `add`, el modelo pre-entrenado entero. Keras se encarga de resolver los detalles:" ] }, { "cell_type": "code", "metadata": { "id": "syV6TLbj5IH3" }, "source": [ "transfer_model.add(pretrained)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "PV0gV87o7E_l" }, "source": [ "### Ejercicio 10: Las capas finales" ] }, { "cell_type": "markdown", "metadata": { "id": "hVLlP0AU5Vxm" }, "source": [ "Finalmente, de forma similar a como vimos con la arquitectura anterior, necesitamos \"aplastar\" la salida de la última capa congelada de InceptionV3, y luego agregar nuestras propia capa de salida. Esta vez en vez de utilizar `Flatten`, utilizaremos la capa `GlobalAveragePooling2D`, para reducir la cantidad de parámetros y entrenar más rápido:\n", "\n", "Agregar al modelo:\n", "* una capa `GlobalAveragePooling2D`\n", "* una capa `Dense` de salida con 10 neuronas y activación `softmax`\n", "\n", "Para entender el funcionamiento de `GlobalAveragePooling2D` ver: https://keras.io/api/layers/pooling_layers/global_average_pooling2d/\n" ] }, { "cell_type": "code", "metadata": { "id": "MxweEOXI5XNf" }, "source": [ "from keras.layers import GlobalAveragePooling2D\n", "\n", "transfer_model.add(???)\n", "transfer_model.add(???)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "8a_x8W5ALpM6" }, "source": [ "### Preprocesar la entrada" ] }, { "cell_type": "markdown", "metadata": { "id": "tqjQVjknLuWK" }, "source": [ "Cada modelo puede aplicar diferentes métodos de preprocesamiento. Es importante que las imágenes siempre sean tratadas de igual forma, sino, es posible que los resultados no sean los esperados. Keras nos provee acceso a las funciones de preprocesamiento de InceptionV3 con el método `preprocess_input`. Debemos aplicar el preprocesamiento a ambas particiones (entrenamiento y evaluación) tal cual son provistas por `cifar10.load_data()`. Documentación: https://keras.io/api/applications/inceptionv3/" ] }, { "cell_type": "code", "metadata": { "id": "7kwe_ILLMmz-" }, "source": [ "from keras.applications.inception_v3 import preprocess_input\n", "\n", "# volvemos a cargar los datos en su formato original\n", "(x_train, y_train), (x_test, y_test) = cifar10.load_data()\n", "# preprocesamos los conjuntos de entrenamiento y evaluación\n", "x_train_pre = preprocess_input(x_train)\n", "x_test_pre = preprocess_input(x_test)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "W7oW51PL7V7j" }, "source": [ "### Entrenando la nueva red" ] }, { "cell_type": "markdown", "metadata": { "id": "SPJfBmhs6gVb" }, "source": [ "Con la arquitectura completa, ya podemos compilar y entrenar el modelo. Esta vez, reducimos la cantidad de épocas, porque cada época demora más, debido a que la pasada hacia adelante es más costosa (hacia atrás tenemos unos \"pocos\" pesos para actualizar). De todas formas, los resultados con apenas tres épocas deberían ser bastante mejores que los obtenidos anteriormente." ] }, { "cell_type": "code", "metadata": { "id": "gn4LjXQ44tr-" }, "source": [ "opt = Adam(learning_rate=0.0001)\n", "transfer_model.compile(optimizer=opt, loss='sparse_categorical_crossentropy', metrics=['accuracy'])\n", "transfer_model.summary()\n", "\n", "transfer_model.fit(x_train_pre, y_train, validation_split=0.1, epochs=3)" ], "execution_count": null, "outputs": [] }, { "cell_type": "markdown", "metadata": { "id": "tbfkBjfg8JAw" }, "source": [ "### Evaluación final" ] }, { "cell_type": "markdown", "metadata": { "id": "Hqm-wTnA8OaI" }, "source": [ "Para terminar, obtendremos la accuracy del nuevo modelo sobre el conjunto de evaluación, como hicimos antes:" ] }, { "cell_type": "code", "metadata": { "id": "-5vXHnQ18hT1" }, "source": [ "preds = transfer_model.predict(x_test_pre)\n", "accuracy_score(y_test, preds.argmax(axis=1))" ], "execution_count": null, "outputs": [] } ] }