# Introducción rápida a skimage

## Imports

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
from skimage import color, feature
from skimage.transform import rescale, resize, rotate
from skimage.transform import integral_image
from skimage.feature import haar_like_feature
from skimage.feature import haar_like_feature_coord
from skimage.feature import draw_haar_like_feature
from skimage.exposure import equalize_hist
from sklearn.decomposition import PCA

## Una imagen como matriz de pixels

### Imágenes RGB

In [None]:
# Podemos cargar una imagen desde un archivo jpg
filename = 'solo_manzana.jpg'
with open(filename, 'rb') as jpg:
 image_rgb = plt.imread(jpg)

La imagen se carga como una numpy array cuyo shape es (H,W,C) en donde:
- H = height, es la altura o el número de filas de la imagen,
- W = width, es el ancho o el número de columnas de la imagen,
- C = channel, es el número de canales (colores en una imagen RGB) de la imagen.

In [None]:
# La imagen es un 3D numpy array
print('Tipo: ', type(image_rgb))
print('Shape: ', image_rgb.shape)

In [None]:
# Podemos visualizar la imagen en colores
plt.imshow(image_rgb)
plt.title('Imagen Input')
plt.show()

In [None]:
# Extraemos el canal R (red)
image_red = image_rgb[:,:,0]

In [None]:
# La imagen resultante es un 2D numpy array
print('Tipo: ', type(image_red))
print('Shape: ', image_red.shape)

In [None]:
# Veamos un extracto
image_red[200:205,200:205]

In [None]:
# Visualización
plt.imshow(image_red)
plt.title('Imagen Input - Canal R')
plt.show()

In [None]:
# Extraemos el canal G (green)
image_green = image_rgb[:,:,1]

In [None]:
# Visualización
plt.imshow(image_green)
plt.title('Imagen Input - Canal G')
plt.show()

In [None]:
# Extraemos el canal B (blue)
image_blue = image_rgb[:,:,2]

In [None]:
# Visualización
plt.imshow(image_blue)
plt.title('Imagen Input - Canal B')
plt.show()

### Pasando a escala de grises

Podemos transformar una imagen color (RGB) en una imagen en escala de grises. En skimage la función rgb2gray combina los tres canales R, G y B de la siguiente manera:

Y = 0.2125 R + 0.7154 G + 0.0721 B

In [None]:
# Transformarla a escala de grises
image_gray = color.rgb2gray(image_rgb)

In [None]:
# La imagen en escala de grises tiene un solo canal
print('Tipo: ', type(image_gray))
print('Shape: ', image_gray.shape)

In [None]:
# Visualización de la imagen en escala de grises
plt.imshow(image_gray, cmap='gray')
plt.title('Imagen en escala de grises')
plt.show()

In [None]:
# Hagamos zoom en una ventana
window = image_gray[25:40,100:115]

In [None]:
# Visualización de la imagen en escala de grises
plt.imshow(window, cmap='gray')
plt.title('Haciendo zoom')
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(7,7))

H = window.shape[0]
W = window.shape[1]

ax.matshow(window, cmap='gray')

for i in range(H):
 for j in range(W):
 c = window[j,i]
 col = 'black' if c>0.15 else 'white'
 ax.text(i, j, str(round(c,ndigits=2)), va='center', ha='center', color=col)

ax.set_title('Valores de los pixels')

## Transformaciones básicas

### Rescalado

In [None]:
# Podemos bajar la resolución de una imagen
rescaled_image = rescale(image_gray, 0.1)
print('Shape original: ',image_gray.shape)
print('Shape rescalado: ',rescaled_image.shape)

In [None]:
# Visualización
plt.imshow(rescaled_image, cmap='gray')
plt.title('Imagen Input - Rescalado')
plt.show()

In [None]:
# Podemos "aumentar" artificialmente la resolución de una imagen
rescaled_image = rescale(image_gray, 10)
print('Shape original: ',image_gray.shape)
print('Shape rescalado: ',rescaled_image.shape)

In [None]:
# Visualización
plt.imshow(rescaled_image, cmap='gray')
plt.title('Imagen Input - Rescalado')
plt.show()

### Resize

In [None]:
# Podemos transformar el shape de la imagen
resized_image = resize(image=image_gray, output_shape=(128,64))
print('Shape original: ',image_gray.shape)
print('Shape resized: ',resized_image.shape)

In [None]:
# Visualización
plt.imshow(resized_image, cmap='gray')
plt.title('Imagen Input - Resize')
plt.show()

### Rotación

In [None]:
# Podemos rotar una imagen
rotated_image = rotate(image=image_gray,angle=60)
print('Shape original: ',image_gray.shape)
print('Shape resized: ',rotated_image.shape)

In [None]:
# Visualización
plt.imshow(rotated_image, cmap='gray')
plt.title('Imagen Input - Rotation')
plt.show()

In [None]:
# Podemos rotar una imagen
rotated_image = rotate(image=image_gray,angle=180)
print('Shape original: ',image_gray.shape)
print('Shape resized: ',rotated_image.shape)

In [None]:
# Visualización
plt.imshow(rotated_image, cmap='gray')
plt.title('Imagen Input - Rotation')
plt.show()

### Flip

In [None]:
# Con numpy podemos invertir la orientación de una imagen
image_ud = np.flipud(image_gray)
print('Shape original: ',image_gray.shape)
print('Shape flipped: ',image_ud.shape)

In [None]:
# Visualización
plt.imshow(image_ud, cmap='gray')
plt.title('Imagen Input - Up Down')
plt.show()

In [None]:
# Con numpy podemos ivertir la orientación de una imagen
image_lr = np.fliplr(image_gray)
print('Shape original: ',image_gray.shape)
print('Shape flipped: ',image_lr.shape)

In [None]:
# Visualización
plt.imshow(image_lr, cmap='gray')
plt.title('Imagen Input - Left Right')
plt.show()

## Una tontería: agregar un rectángulo a una imagen

In [None]:
# Ejemplo de cómo agregar rectángulos a una imagen
fig, ax = plt.subplots()
ax.imshow(image_gray, cmap='gray')

ax.add_patch(plt.Rectangle((200, 150), int(100), int(100), edgecolor='red', alpha=0.3, lw=2, facecolor='none'))
plt.show()

## Normalización: Histogram equalization

La ecualización es una técnica para normalizar una imagen. Consiste en transformar los pixels de la imagen de forma tal que su histograma sea uniforme. La idea básica se explica en los siguientes diagramas:

![Cuantiles_1.png](attachment:Cuantiles_1.png)

![Cuantiles_2.png](attachment:Cuantiles_2.png)

![Cuantiles_3.png](attachment:Cuantiles_3.png)

Ver [Histogram Equalization - Wikipedia](https://en.wikipedia.org/wiki/Histogram_equalization)

In [None]:
# Visualización de la imagen en escala de grises
plt.imshow(image_gray, cmap='gray')
plt.title('Imagen en escala de grises')
plt.show()

In [None]:
# Visualización de la imagen ecualizada
image_eq = equalize_hist(image_gray)
plt.imshow(image_eq, cmap='gray')
plt.title('Imagen ecualizada')
plt.show()

## Ejemplo de extracción de features: PCA

In [None]:
def image_to_vector(image_path):
 with open(image_path, 'rb') as jpg:
 image_rgb = plt.imread(jpg)
 return np.array(color.rgb2gray(image_rgb)).flatten()

In [None]:
with open('manzana_04.jpg', 'rb') as jpg:
 image_rgb = plt.imread(jpg)

image_shape = color.rgb2gray(image_rgb).shape

In [None]:
def vector_to_image(vector, shape):
 return vector.reshape(shape)

In [None]:
#Preprocesamiento de las imágenes
paths = ['manzana_01.jpg',
 'manzana_02.jpg',
 'manzana_03.jpg',
 'manzana_04.jpg',
 'banana_01.jpg',
 'banana_02.jpg',
 'banana_03.jpg',
 'banana_04.jpg'] # Lista con las rutas de las imagenes

image_matrix = np.array([image_to_vector(path) for path in paths])
etiquetas = 4*['Manzana']+4*['Banana']

In [None]:
image_matrix.shape

In [None]:
# Cálculo de la imagen promedio
mean_image_vector = np.mean(image_matrix, axis=0)
mean_manzanas_vector = np.mean(image_matrix[:4,], axis=0)
mean_bananas_vector = np.mean(image_matrix[4:8,], axis=0)
mean_image_shape = image_shape
mean_image = vector_to_image(mean_image_vector, mean_image_shape)
mean_manzanas = vector_to_image(mean_manzanas_vector, mean_image_shape)
mean_bananas = vector_to_image(mean_bananas_vector, mean_image_shape)

In [None]:
# 6. Visualización
plt.imshow(mean_image, cmap='gray')
plt.title("Imagen Promedio")
plt.show()

plt.imshow(mean_manzanas, cmap='gray')
plt.title("Manzana Promedio")
plt.show()

plt.imshow(mean_bananas, cmap='gray')
plt.title("Banana Promedio")
plt.show()


In [None]:
# Centrar las imágenes
centered_matrix = image_matrix - mean_image_vector

In [None]:
# PCA
pca = PCA(n_components=2)
pca.fit(centered_matrix)
components = pca.components_

In [None]:
# Imagen de componentes
first_component_image = vector_to_image(components[0], mean_image_shape)
second_component_image = vector_to_image(components[1], mean_image_shape)

In [None]:
# Proyección
projected_data = pca.transform(centered_matrix)

In [None]:
plt.imshow(first_component_image)
plt.title("Primera Componente Principal")
plt.show()

In [None]:
plt.imshow(second_component_image)
plt.title("Segunda Componente Principal")
plt.show()

In [None]:
# Scatter plot de la proyección
plt.scatter(projected_data[:4, 0], projected_data[:4, 1], color='red', label='Manzanas') # Suponiendo las primeras 4 son manzanas
plt.scatter(projected_data[4:, 0], projected_data[4:, 1], color='blue', label='Bananas') # Suponiendo las últimas 4 son bananas
plt.xlabel("Primera Componente Principal")
plt.ylabel("Segunda Componente Principal")
plt.legend()
plt.show()

## Ejemplo de extracción de features: las Haar features

#### La integral image

La integral image $S$ de una imagen $X$ contiene la suma de todos los elementos arriba y a la izquierda de un píxel dado:

$$
S[m, n]=\sum_{i \leq m} \sum_{j \leq n} X[i, j]
$$

* Parámetros:
 + Input image $X$ (ndarray)
* Devuelve:
 + Integral image $S$ (ndarray mismo shape que Input image)

In [None]:
fig, ax = plt.subplots(figsize=(7,7))

H = window.shape[0]
W = window.shape[1]

ax.matshow(window, cmap='gray')

for i in range(H):
 for j in range(W):
 c = window[j,i]
 col = 'black' if c>0.15 else 'white'
 ax.text(i, j, str(round(c,ndigits=2)), va='center', ha='center', color=col)

ax.set_title('Valores de los pixels')

In [None]:
ii = integral_image(window)

fig, ax = plt.subplots(figsize=(7,7))

ax.matshow(ii, cmap='gray')

for i in range(H):
 for j in range(W):
 c = np.round(ii[j,i],1)
 ax.text(i, j, str(c), va='center', ha='center', c='white', fontsize=10)

plt.show()

#### Haar feature

La función **haar_like_feature** calcula la Haar feature de una región de interés de una integral image.

* Parámetros:
 + int_image (M,N) (ndarray). Es la integral image para la cual se calcula la feature.
 + r (int). Fila del vértice arriba-izquierda de la subventana de interés.
 + c (int). Columna del vértice arriba-izquierda de la subventana de interés.
 + width (int). Ancho de la subventana de interés.
 + height (int). Altura de la subventana de interés.
 + feature_type (str or list of str or None), opcional. El tipo de la feature a considerar:
 + 'type-2-x': 2 rectángulos variando a lo largo del eje x;
 + 'type-2-y': 2 rectángulos variando a lo largo del eje y;
 + 'type-3-x': 3 rectángulos variando a lo largo del eje x;
 + 'type-3-y': 3 rectángulos variando a lo largo del eje y;
 + 'type-4': 4 rectángulos variando a lo largo de ambos ejes;.
 + feature_coord (ndarray of list of tuples or None), opcional. Array de coordenadas a ser extraídas. Es útil cuando se quiere computar un sibconjunto de features.
 
* Devuelve:
 + haar_features (n_features,) ndarray

In [None]:
haar = haar_like_feature(ii, 0, 0, H, W)

In [None]:
haar.shape

In [None]:
haar[0]

In [None]:
feature_coord, feature_type = haar_like_feature_coord(width=W,height=H)

In [None]:
feature_coord.shape

In [None]:
feature_coord[0]

In [None]:
feature_type[0]

In [None]:
plt.figure(figsize = (7,7))

feature_image = draw_haar_like_feature(window, 0, 0,
 W,
 H,
 [feature_coord[0]]
 )

plt.imshow(feature_image, cmap='gray')
plt.show()

## Otro ejemplo: Histogram of oriented gradients

In [None]:
hog_vec, hog_vis = feature.hog(image_gray, visualize=True)

In [None]:
plt.imshow(hog_vis)
plt.title('Imagen Input - HOG')
plt.show()