Hola buenas tardes, me gustaría discutir un poco este ejercicio.
Si consideramos $$\chi :$$#$$empleos/persona$$, por letra, interpreto que $$P(\chi = 0) = 0'12;$$ $$P(\chi = 1) = 0'48;$$ $$P(\chi = 2) = 0'35;$$ $$P(\chi = 3) = 0'05;$$. Por lo tanto, se puede calcular la esperanza o valor esperado de $$\chi$$, $$E(\chi)= 0'48 + 2\times 0'35 + 3\times 0'05 = 1'33$$
Ya de entrada, el valor calculado difiere del promedio de empleo por persona en una muestra de 1400 individuos, que es de $$2'04$$. A priori, entiendo que el error puede provenir tanto de los porcentajes que te da la letra de entrada, como de el dato extraído de la muestra.
Además, si considero que en la muestra de 1400 personas hay 312 personas desempleadas, ello quiere decir que el $$22'28\%$$ de la población de estudio esta desempleada, nuevamente esto difiere con la probabilidad de no tener ningún empleo de la variable que consideramos antes ($$P(\chi = 0) = 0'12$$), según la información que se nos brindó inicialmente.
Lo que no calcule fue la varianza, pero no creo que sea necesario porque un $$10\%$$ de diferencia entre la observación y el cálculo inicial, creo yo que es lo suficientemente grande como para poder contemplarlo como dentro de los parámetros "normales".
Entiendo que la diferencia tan grande entre la observación y los datos podría llegar a explicarse si se supiese cual es la población total sobre la cual se brindan los porcentajes iniciales; Quizá lo que sucede es que la muestra de 1400 personas no es lo suficientemente representativa de la población total.
Si alguno más estuvo pensando en esto y quiere hacer algún aporte, o quiere señalar algún error en mi razonamiento, lo agradezco muchísimo!
Saludos.
Podría ser que no fuera representativa, pero eso ya es difícil de discernir con los datos que te dan. Lo que sí podrías hacer es calcular la probabilidad de que en una muestra de 1400 personas hayan 312 o más desempleadas suponiendo la distribución que te dicen al comienzo.
La varianza también te da una estimación de que tan lejos puede estar el promedio del valor real de la esperanza. Usando Chebyshev (práctico 8) podrías acotar la probabilidad de que el promedio esté tan lejos de la esperanza.
Saludos!
Hola Eduardo, buenas tardes.
Intente tomar tu consejo de calcular la probabilidad de que en una muestra de 1400 personas hayan 312 o más desempleadas, pero no se si entendí muy bien como hacerlo.
Lo que yo pensé fue en modelar con una variable aleatoria la cantidad de desempleados, y asumir que distribuye con una binomial de 1400 ensayos y probabilidad de éxito 0'12. Así, la probabilidad buscada sería:
$$ P(X \geq 312) = \sum_{k=0}^{1400} {1400 \choose k} \times (0'12)^k \times (0'88)^{1400-k} \approx 0$$ (La cuenta la hice en Wolfram Alpha, desconozco si hay alguna forma sencilla de hacerla a mano).
Una pregunta respecto a esto último: ¿Qué te aporta calcular $$P(X \geq 312)$$ contra calcular $$P(X = 312)$$? Considerando que lo que por letra sabes seguro es que en la muestra hay exactamente 312 desempleados, y no más. Entiendo que como es una suma de probabilidades evidentemente se cumple que $$P(X \geq 312) \geq P(X = 312)$$, pero ¿no hubiese sido lo mismo simplemente calcular $$P(X = 312)$$?
Me pareció raro que la probabilidad sea prácticamente cero, así que lo que hice fue calcular la esperanza y varianza de X: # Desempleados, e inferí que en base a la distribución que te da la letra, se puede esperar una media de $$ 168 \pm \sqrt{147'84} $$ desempleados en una muestra aleatoria de 1400 individuos, lo que significa que en promedio la cantidad de empleos por persona esta en el rango de $$[1'1252, 1'1476]$$ (calcule el rango de la media de cantidad de empleados por complemento, luego dividí 1400 por la cota inferior y por la cota superior de dicho rango); rango que ni si quiera contiene al promedio de 2'04 empleos por persona observado en la letra.
En base a esto último, entiendo que si no hubo un error de observación en la muestra de 1400 personas, y asumimos que es una muestra representativa, entonces lo que tiene que estar mal necesariamente es la distribución brindada, pues no permite hacer predicciones adecuadas de la realidad de la población.
No usé la desigualdad de Chebyshev porque no he llegado a verlo.
Saludos.
Intente tomar tu consejo de calcular la probabilidad de que en una muestra de 1400 personas hayan 312 o más desempleadas, pero no se si entendí muy bien como hacerlo.
Lo que yo pensé fue en modelar con una variable aleatoria la cantidad de desempleados, y asumir que distribuye con una binomial de 1400 ensayos y probabilidad de éxito 0'12. Así, la probabilidad buscada sería:
$$ P(X \geq 312) = \sum_{k=0}^{1400} {1400 \choose k} \times (0'12)^k \times (0'88)^{1400-k} \approx 0$$ (La cuenta la hice en Wolfram Alpha, desconozco si hay alguna forma sencilla de hacerla a mano).
Una pregunta respecto a esto último: ¿Qué te aporta calcular $$P(X \geq 312)$$ contra calcular $$P(X = 312)$$? Considerando que lo que por letra sabes seguro es que en la muestra hay exactamente 312 desempleados, y no más. Entiendo que como es una suma de probabilidades evidentemente se cumple que $$P(X \geq 312) \geq P(X = 312)$$, pero ¿no hubiese sido lo mismo simplemente calcular $$P(X = 312)$$?
Me pareció raro que la probabilidad sea prácticamente cero, así que lo que hice fue calcular la esperanza y varianza de X: # Desempleados, e inferí que en base a la distribución que te da la letra, se puede esperar una media de $$ 168 \pm \sqrt{147'84} $$ desempleados en una muestra aleatoria de 1400 individuos, lo que significa que en promedio la cantidad de empleos por persona esta en el rango de $$[1'1252, 1'1476]$$ (calcule el rango de la media de cantidad de empleados por complemento, luego dividí 1400 por la cota inferior y por la cota superior de dicho rango); rango que ni si quiera contiene al promedio de 2'04 empleos por persona observado en la letra.
En base a esto último, entiendo que si no hubo un error de observación en la muestra de 1400 personas, y asumimos que es una muestra representativa, entonces lo que tiene que estar mal necesariamente es la distribución brindada, pues no permite hacer predicciones adecuadas de la realidad de la población.
No usé la desigualdad de Chebyshev porque no he llegado a verlo.
Saludos.