# Laboratorio Redes Neuronales (parte 2)

En este laboratorio vamos a ver algunos ejemplos más de uso de Keras para resolver problemas con redes neuronales.

Primero vamos a ver un módulo, Keras Tuner ([link](https://keras.io/guides/keras_tuner/getting_started/)) que permite buscar, mediante diferentes métodos los mejores hiperparámetros, una tarea bastante tediosa.

Vemos que la búsqueda de hiperparámetros puede ser un poco tediosa. Para ello keras provee Keras Tuner , que simplifica la búsqueda manual, mediante diferentes métodos de búsqueda, que también pueden elegirse.

In [6]:
import numpy as np
from tensorflow import keras
from keras.datasets import mnist
import matplotlib.pyplot as plt
from sklearn.metrics import classification_report


In [7]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train.shape, x_test.shape

((60000, 28, 28), (10000, 28, 28))

Normalizamos...

In [8]:
# Utilizando la operacion reshape, convertir las imagenes de matriz a vector
x_train1 = x_train.reshape(60000,28*28)
x_test1 = x_test.reshape(10000,28*28)
# Convertir el tipo de los datos de tipo np.uint8 a np.float32
x_train1 = x_train1.astype(np.float32)
x_test1 = x_test1.astype(np.float32)
# Dividimos el valor de cada pixel entre 255. para asegurarnos que todos los pixeles queden en el rango $[0,1]$
x_train1 = x_train1 / 255.0
x_test1 = x_test1 / 255.0
# Restamos a cada pixel 0.5 para asegurarnos que todos los pixeles queden en el rango $[-0.5,0.5]$
x_train1 = x_train1 - 0.5
x_test1 = x_test1 - 0.5

####################################################################################################################


In [9]:
# Cuando verificamos que quedó bien, modificamos los datos originales
x_train = x_train1
x_test = x_test1


Separamos entrenamiento y validación

In [10]:
from sklearn.model_selection import train_test_split

x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, test_size=0.1, random_state=0)

# Verificamos que todo este bien
assert len(x_train) == len(y_train)
assert len(x_val) == len(y_val)

Primero instalamos Keras Tuner...

In [11]:
!pip install keras-tuner --upgrade
import keras_tuner as kt

Collecting keras-tuner
 Downloading keras_tuner-1.3.5-py3-none-any.whl (176 kB)
[2K [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m176.1/176.1 kB[0m [31m4.2 MB/s[0m eta [36m0:00:00[0m
Collecting kt-legacy (from keras-tuner)
 Downloading kt_legacy-1.0.5-py3-none-any.whl (9.6 kB)
Installing collected packages: kt-legacy, keras-tuner
Successfully installed keras-tuner-1.3.5 kt-legacy-1.0.5


Supongamos que queremos probar una red como la que trabajamos en la clase anterior para reconocer dígitos, y nos interesa saber si funciona mejor una relu o una sigmoid.

Para utilizar Keras Tuner vamos primero a crear una función que define el modelo, recibiendo los hiperparámetros como argumento (en este caso, definimos que la función de activación admite dos valores, y que la cantidad de unidades de la capa puede ser entre 1 y 32):



In [14]:
def build_model(hp):
 activation1 = hp.Choice('activation1',['relu','sigmoid'] )
 units1 = hp.Int("units", min_value=1, max_value=512, step=1)

 model = keras.Sequential()
 model.add(keras.layers.Dense(input_dim=(x_train.shape[1]),
 units =units1, activation = activation1))
 model.add(keras.layers.Dense(10, activation="softmax", name="output_layer"))

 model.compile(optimizer=keras.optimizers.SGD(0.001), loss='sparse_categorical_crossentropy',
 metrics=['accuracy'])
 return model


Vamos a definir luego el tuner, que permite probar diferentes modelos y elegir el mejor. Para eso, le vamos a decir que utilice como objetivo a minimizar la pérdida en el conjunto de validación, y un máximo de 5 intentos, a partir del modelo parametrizado que definimos en el paso anterior. El tuner que vamos a utilizar es una búsqueda aleatoria (Keras Tuner ofrece otras opciones)

In [27]:
tuner = kt.RandomSearch(build_model, objective='val_loss', max_trials=5, overwrite=True,
 directory="my_dir")
tuner.search_space_summary()

Search space summary
Default search space size: 2
activation1 (Choice)
{'default': 'relu', 'conditions': [], 'values': ['relu', 'sigmoid'], 'ordered': False}
units (Int)
{'default': None, 'conditions': [], 'min_value': 1, 'max_value': 512, 'step': 1, 'sampling': 'linear'}


Probamos con el tuner un aprendizaje con 5 épocas (observar que no llamamos a compile ni a try)

In [28]:
tuner.search(x_train, y_train, epochs=5, validation_data=(x_val, y_val))
best_model = tuner.get_best_models()[0]

tuner.results_summary()


Trial 5 Complete [00h 00m 42s]
val_loss: 1.2482744455337524

Best val_loss So Far: 0.45816174149513245
Total elapsed time: 00h 03m 16s
Results summary
Results in my_dir/untitled_project
Showing 10 best trials
Objective(name="val_loss", direction="min")

Trial 2 summary
Hyperparameters:
activation1: relu
units: 376
Score: 0.45816174149513245

Trial 3 summary
Hyperparameters:
activation1: relu
units: 167
Score: 0.46321651339530945

Trial 0 summary
Hyperparameters:
activation1: sigmoid
units: 501
Score: 1.2457010746002197

Trial 4 summary
Hyperparameters:
activation1: sigmoid
units: 477
Score: 1.2482744455337524

Trial 1 summary
Hyperparameters:
activation1: sigmoid
units: 53
Score: 1.542050838470459


Vemos el resultado de nuestro mejor modelo contra el conjunto de testeo

In [29]:

predictionstest = best_model.predict(x_test)
y_test_pred = np.argmax(predictionstest, axis=1)
print(classification_report(y_test, y_test_pred))

 precision recall f1-score support

 0 0.91 0.97 0.94 980
 1 0.92 0.96 0.94 1135
 2 0.89 0.84 0.87 1032
 3 0.86 0.88 0.87 1010
 4 0.87 0.89 0.88 982
 5 0.84 0.80 0.82 892
 6 0.89 0.91 0.90 958
 7 0.90 0.89 0.89 1028
 8 0.87 0.81 0.84 974
 9 0.85 0.86 0.85 1009

 accuracy 0.88 10000
 macro avg 0.88 0.88 0.88 10000
weighted avg 0.88 0.88 0.88 10000



*Se pide*: Implementar una búsqueda de hiperparámetros con RandomSearch, utilizando:

* Red de dos capas ocultas
* Optimizador SGD
* Entrenamiento en la búsqueda de 10 épocas
* Máximo de intentos: 20

Variar:

* Learning rate de SGD entre 1e-4 y 1e-2 (valor real)
* funciones de activación de capas ocultas: ['relu', 'sigmoid']
* Cantidad de neuronas de las capas: [8, 32, 64]

Mostrar métricas para el mejor modelo obtenido