ALN: Tarea 3

Tarea 3

Cierre: lunes, 27 de noviembre de 2023, 23:59

Parte a)

Obtenga los valores y vectores propios de matrices densas de distintos tamaños y evalúe la velocidad de convergencia, el tiempo total, la precisión alcanzada, el uso de memoria, etc., del método elegido.

Parte b)

Obtenga los valores propios de un conjunto de distintas matrices SDP de la colección SuiteSparse (https://sparse.tamu.edu/) que sea variado considerando la dimensión y la cantidad de elementos distintos de cero de las matrices (puede usar el de la tarea 2).

Parte c)

Esta parte consiste en utilizar la SVD para clasificar imágenes de dígitos.

Descargue el dataset del eva. El dataset está separado en dos estructuras “train” y “test”. Cada una de estas contiene una matriz “data” que en cada columna tiene una imagen de 16x16 de un dígito expresada como un vector de 256 elementos, y “target”, que es un vector con el dígito que pertenece a cada columna de data.

El procedimiento para clasificar las imágenes es el siguiente:

Separar las columnas de train.data en 10 matrices que contengan, respectivamente, las imágenes correspondientes a un único dígito.
Calcular la SVD de cada una de esas 10 matrices.
Para clasificar cada dígito del conjunto test, la idea es comprobar con cuál de las 10 SVD se puede tener una mejor aproximación a la columna correspondiente de test.data. Para eso se debe resolver el problema de mínimos cuadrados min_y|| x - U_iy ||, donde x es la columna de test.data que se quiere clasificar y U_i es la matriz de vectores singulares izquierdos de la SVD de la matriz correspondiente al dígito i. Una vez obtenida la aproximación usando cada U_i, resta obtener para cuál de las matrices U_i se obtuvo una mejor aproximación a x.

c1) Realice la clasificación de las imágenes pertenecientes al conjunto test mediante el procedimiento anterior y compare las clasificaciones obtenidas con la clasificación real, que se encuentra en test.target. Obtenga la precisión del clasificador como la cantidad de clasificaciones correctas dividida por el total de instancias de test.

c2) Realice el mismo procedimiento de la parte c1) pero utilizando solo los primeros k vectores singulares izquierdos, variando k.

c3) Estudie la relación entre el uso de memoria y costo computacional del método con la precisión obtenida para las clasificaciones.

archive.zip
13 de noviembre de 2023, 17:12