Hola, haciendo el ejercicio 6 del práctico 3 me surgieron algunas dudas.
¿Cómo se definen los true positives (TP) en la clasificación secuencial? En particular, en las diapositivas se menciona que solo exact matches se aceptan como TP, pero entonces ¿como se definen FN, FP y TP?
Por lo que entendí, para el concepto de TP es necesario tener una clase objetivo, pero dado que ahora estoy clasificando secuencias de distinto tamaño, tengo al menos |Tags|^n clases para cada largo n (todas las permutaciones de largo n de tags). Si considero que las oraciones pueden ser de largo arbitrario tendría infinitas clases, y si me restrinjo a un N máximo, tendría un número exponencial de clases (algunas imposibles según la gramática del lenguaje) y acumular estadísticas significativas del rendimiento sería "imposible" (para armar la matríz de confusión).
Por otro lado, si tomo TP como el número de aciertos, entonces no puedo computar ni la precision ni el recall, solo la accuracy.
Por último, en el práctico se me pide que determine una relación entre accuracy, recall y presicion para un problema de reconocimiento de spans de texto, pero no me queda claro que debería hacer.
Saludos,
Rafael.