Prueba 2023 | Ejercicio 3

Prueba 2023 | Ejercicio 3

de Daniel Padron Simon -
Número de respuestas: 2

Buenas noches, 

Realizando el ejército 3 me surgió la siguiente duda. 


En la letra del ejercicio se especifica que se está trabajando con un LLM de bigramas, donde se provee la fórmula de la probabilidad conjunta (bigrama)  P(A,B) .

Según entiendo, lo que el ejército pide es el cálculo de  P(  \text{S María come pan /S} )


En clase dimos como se desarrollaría la siguiente fórmula usando la regla de la cadena: 




Entonces en nuestro caso debería ser 

 P( S \text{ María come pan } /S) = P(S) P(María | S) P(Come | María) P(Pan | /S)

Para llevarlo a probabilidades conjuntas, aplico la definición  P(A | B)P(B) = P(A,B)  

Quedando en:

P(\text{María come pan} /S) = \frac{  P(S) P(María | S) P(Come | María) P(Pan | /S)} {P(Maria) P(come) P(pan)} 


Entonces les consulto:

1) ¿Qué estoy entiendo mal de la fórmula para el cálculo de la probabilidad de la sentencia, por lo cual en la solución queda sin las probabilidades de “María” “Come” y “Pan”?

2) ¿Puede ser que en la letra se quería poner la fórmula de probabilidad de P(A|B)? Me parece lo más lógico dado lo de arriba, pero me llama la atención que en la solución lo menciona como probabilidad conjunta, y no hace mención a P(<S>)

3) Siguiendo los cálculos, si tomo como probabilidad de una palabra su frecuencia en el corpus (total ocurrencia de esa palabra en el corpus / total de palabras (contando repetición) en el corpus), sucede que la segunda oración tiene un poco más de probabilidad que la primera. Supongo que es debido a que efectivamente estamos tratando con probabilidad condicional en realidad, ¿No?


Saludos y gracias,

Daniel


En respuesta a Daniel Padron Simon

Re: Prueba 2023 | Ejercicio 3

de Aiala Rosá - InCo -
Hola,

La letra de este ejercicio propone una forma diferente de calcular la probabilidad de AB (utilizando una técnica de suavizado), por eso los cálculos son diferentes.

Este tema (suavizado) apenas fue mencionado en el curso de este año, en el contexto de modelos para clasificación.

Saludos,
Aiala