Nuevas propuestas de proyecto: Análsis automático de documentos. Tres propuestas.

Nuevas propuestas de proyecto: Análsis automático de documentos. Tres propuestas.

de Gaston Garcia Gonzalez -
Número de respuestas: 0

Detección automática de sellos

El presente proyecto trata del estudio, implementación y evaluación sistemática de métodos para la detección y extracción de sellos en documentos escaneados. Se estudiarán los métodos existentes en la literatura, se implementará aquellos relevantes que no tengan implementación disponible, y se evaluarán sobre dos conjuntos de datos: a) conjuntos de evaluación de uso académico, público, como PubLayNet y b) los documentos del Proyecto Cruzar.uy, que incluyen el  Archivo Berruti y otros archivos digitalizados de organismos represivos que operaron durante la dictadura militar en Uruguay (1973-1984).

Este proyecto es la continuación de una primera aproximación al problema realizada en el año 2024. Se podrá utilizar todos los resultados y la documentación de dicho proyecto como punto de partida. 

El objetivo en esta segunda etapa es perfeccionar la interfaz de modo que quede utilizable para el proyecto Cruzar, e incorporar otros métodos no explorados en el proyecto original.


Análisis automático de estructura de documentos

El presente proyecto trata del estudio, implementación y evaluación sistemática de métodos de análisis de documentos (en inglés, Document Layout Analysis). El cometido principal de dichos métodos es, dado un documento, identificar sus partes y la relación lógica entre ellos: títulos, columnas, párrafos, encabezados, pie, gráficos/figuras, imágenes, tablas, etc.


Orientación Automática y Robusta de Documentos

El presente proyecto trata del estudio, implementación y evaluación sistemática de métodos para la detección de la orientación de páginas escaneadas. Se estudiarán los métodos existentes en la literatura, se implementará aquellos relevantes que no tengan implementación disponible, y se evaluarán sobre dos conjuntos de datos: a) conjuntos de evaluación de uso académico, público, como PubLayNet y b) los documentos del Proyecto Cruzar.uy, que incluyen el  Archivo Berruti y otros archivos digitalizados de organismos represivos que operaron durante la dictadura militar en Uruguay (1973-1984).


Responsable: Ignacio Ramírez, nacho@fing.edu.uy

Por más información sobre estas tres propuestas, y otras más, consultar en la base: Propuestas de proyecto de fin de carrera