Duda sesión 14, muestreo estratificado

Re: Duda sesión 14, muestreo estratificado

de Hector Cancela -
Número de respuestas: 0

Buenas,

gracias Leandro por compartir tu duda, e Ignacio por tu respuesta, que está muy bien.

Como complemento, y para ayudar a pensarlo, puede ser útil tener en cuenta que los p_i efectivamente son probabilidades (la probabilidad que si tomo un punto al azar dentro de Z siguiendo la distribución F, caiga dentro del subconjunto Z_i).  Visto de otra manera, se puede pensar que F es una función "de medida", que el tamaño de Z es 1, y que los p_i son los "tamaños relativos" de los subconjuntos Z_i en relación a Z, siempre según la medida F.   El conjunto Z es nuestro conjunto universal, entonces su medida es 1; y está "partido" en varios Z_i disjuntos, entonces la suma de los "tamaños" de los Z_i tiene que ser el total, es decir 1.

Si luego vamos a hacer sorteos separados dentro de cada Z_i, tenemos que generar una distribución de probabilidad específica para cada i diferente. El método plantea tomar como distribución de probabilidad F_i a la misma distribución F restringida dentro del conjunto Z_i, para esto hay que normalizarla para que la probabilidad dentro de i sea igual a uno. Esto es lo que se hace definiendo como densidad de probabilidad dF_i(z)=F(z)/p_i.

Para un z dado que pertenece a Z_i, la probabilidad de que ese valor se elija si sorteo dentro de Z_i es mayor que si sorteo dentro de Z en general. Creo que esto es bastante intuitivo, Z contiene a Z_i, por lo tanto hay más puntos donde elegir en Z que en Z_i; si yo sorteo restringido al subespacio i, cada punto es más fácil que salga. Por lo tanto, dF_i(z) va a ser mayor que dF(z), si z pertenece a Z_i.  Esto es coherente con la fórmula anterior, donde estamos dividiendo F(i) por un número menor que 1, por lo cual el resultado va a ser mayor que el valor inicial.

Espero esto ayude/complemente los comentarios de Ignacio :).

Cualquier duda seguimos conversando. Saludos

 Héctor