Buenas tardes ¿cómo están? Consulto por una duda sobre el artículo de "Interval Estimation for a Binomial Proportion" de Brown, Cai y DasGupta, presentado en la sesión 5.
Para desalentar el uso del criterio utilizado en la época (2001), se citan varios ejemplos que contradicen la "creencia" de que para n "grandes" y p lejos de los límites (0 y 1) la cobertura se aproxima al nivel de confianza deseado. Sin embargo, en los ejemplos se usan n del mismo orden, en particular hay una figura que dejo recortada debajo:
que es comentada de la siguiente manera (dejo el texto traducido):
"Ejemplo 3: Ahora movamos
p realmente cerca del límite, digamos p=0.005. Mencionamos en la introducción que tales
p son relevantes en ciertas aplicaciones prácticas. Dado que p es tan pequeño, ahora uno puede esperar completamente que la probabilidad de cobertura del intervalo estándar sea pobre. La Figura 2 y la Tabla 2.2 muestran que todavía hay sorpresas y de hecho ahora comenzamos a ver un nuevo tipo de comportamiento errático. La oscilación de la probabilidad de cobertura no se muestra hasta que
n es bastante grande. De hecho, la probabilidad de cobertura hace una lenta ascensión hasta que n=591, y luego cae dramáticamente a 0.792 cuando
n=592. La Figura 2 muestra que después de eso, la oscilación se manifiesta con toda su fuerza, en contraste con los Ejemplos 1 y 2, donde la oscilación comenzó desde el principio".
Sin embargo, si uno mira la figura dos se puede ver cierto patrón, donde si bien hay oscilaciones estas se van "achicando" ¿cómo sabemos que ese patrón no continúa hasta que a partir de un n suficientemente grande la cobertura se aproxima al nivel de confianza dado, con oscilaciones mínimas? Este caso además sería de los "peores" porque p está bastante cerca de 0. Por otra parte, dicen contradecir la "creeencia popular" pero los "n grandes" que usan en los ejemplos son de 4 cifras a lo sumo.
Si bien luego en el artículo citan algunos criterios que se usan para recomendar el intervalo estándar y los contradicen, esto también aplica en general para n del orden mencionado. La duda que se me genera es qué tan desaconsejable es utilizar el enfoque más común para los casos que trabajamos en el curso (con n=10000,100000,1000000, etc). El artículo parece ser muy vehemente en desestimular dicho uso ("Estaríamos satisfechos si este artículo contribuye a una mayor apreciación de las graves fallas del popular intervalo estándar y a un acuerdo en que no merece ser utilizado en absoluto."), pero los ejemplos que presentan para esto no parecen ser tan concluyentes.
Gracias desde ya.
Saludos