Buenas,
gracias Leandro por compartir tu duda, e Ignacio por tu respuesta, que está muy bien.
Como complemento, y para ayudar a pensarlo, puede ser útil tener en cuenta que los efectivamente son probabilidades (la probabilidad que si tomo un punto al azar dentro de siguiendo la distribución , caiga dentro del subconjunto ). Visto de otra manera, se puede pensar que es una función "de medida", que el tamaño de es 1, y que los son los "tamaños relativos" de los subconjuntos en relación a , siempre según la medida . El conjunto es nuestro conjunto universal, entonces su medida es 1; y está "partido" en varios disjuntos, entonces la suma de los "tamaños" de los tiene que ser el total, es decir 1.
Si luego vamos a hacer sorteos separados dentro de cada , tenemos que generar una distribución de probabilidad específica para cada diferente. El método plantea tomar como distribución de probabilidad a la misma distribución restringida dentro del conjunto , para esto hay que normalizarla para que la probabilidad dentro de sea igual a uno. Esto es lo que se hace definiendo como densidad de probabilidad .
Para un dado que pertenece a , la probabilidad de que ese valor se elija si sorteo dentro de es mayor que si sorteo dentro de en general. Creo que esto es bastante intuitivo, contiene a , por lo tanto hay más puntos donde elegir en que en ; si yo sorteo restringido al subespacio , cada punto es más fácil que salga. Por lo tanto, va a ser mayor que , si pertenece a . Esto es coherente con la fórmula anterior, donde estamos dividiendo por un número menor que 1, por lo cual el resultado va a ser mayor que el valor inicial.
Espero esto ayude/complemente los comentarios de Ignacio :).
Cualquier duda seguimos conversando. Saludos
Héctor