4 - Recursos de datos y métodos de generación
Perfilado de sección
-
Los métodos actuales de procesamiento de lenguaje se apoyan fuertemente en datos. Además de los datos propios a cada aplicación existen recursos de uso general, tales como corpus , diccionarios o bases de datos léxicas, o repositorios generales de conocimiento del mundo, que son aprovechables por diversas aplicaciones. Algunas de estos repositorios fueron construidos manualmente, mientras que otros contienen datos extraídos de modo automático de grandes corpus, en los que se incluye la web.
El objetivo de esta unidad es conocer los recursos de uso más extendido y los métodos que los generan y actualizan.