Simulacion: 4.4.3. Intervalos de confianza

Hasta ahora hemos discutido la idea detrás del bootstrap y como se puede usar para estimar errores estándar. Comenzamos con el error estándar pues es la manera más común para describir la precisión de una estadística.

En términos generales, esperamos que $¯ x$ este a una distancia de $μ_{P}$ menor a un error estándar el 68% del tiempo, y a menos de 2 errores estándar el 95% del tiempo.
Estos porcentajes están basados el teorema central del límite que nos dice que bajo ciertas condiciones (bastante generales) de $P$ la distribución de $¯ x$ se aproximará a una distribución normal:

Veamos algunos ejemplos de como funciona el Teorema del Límite Central, buscamos ver como se aproxima la distribución muestral de la media (cuando las observaciones provienen de distintas distribuciones) a una Normal conforme aumenta el tamaño de muestra. Para esto, aproximamos la distribución muestral de la media usando simulación de la población.

Vale la pena observar que hay distribuciones que requieren un mayor tamaño de muestra

n

para lograr una buena aproximación (por ejemplo la log-normal), ¿a qué se debe esto?

Para la opción de Elecciones tenemos una población de tamaño

N = 143, 437

y el objetivo es estimar la media del tamaño de la lista nominal de las casillas (datos de las elecciones presidenciales de 2012). Podemos ver como mejora la aproximación Normal de la distribución muestral conforme aumenta el tamaño de muestra

n

; sin embargo, también sobresale que no es necesario tomar una muestra demasiado grande (

n = 60

ya es razonable).

En lo que sigue veremos distintas maneras de construir intervalos de confianza usando bootstrap.

Un intervalo de confianza

(1 - 2 α)

% para un parámetro

θ

es un intervalo

(a, b)

tal que

P (a \leq θ \leq b) = 1 - 2 α

para todo

θ \in Θ

Y comenzamos con la versión bootstrap del intervalo más popular.

Intervalo Normal con error estándar bootstrap. El intervalo para $\hat{θ}$ con un nivel de confianza de $100 \cdot (1 - 2 α) %$ se define como:

(\hat{θ} - z^{(1 - α)} \cdot {\hat{s e}}_{B}, \hat{θ} + z^{(1 - α)} \cdot \hat{s e})

donde

z^{(α)}

denota el percentil

100 \cdot α

de una distribución

N (0, 1)

este intervalo está soportado por el Teorema Central del Límite, sin embargo, no es adecuado cuando

\hat{θ}

no se distribuye aproximadamente Normal.

Simulacion

lunes, 4 de mayo de 2020

4.4.3. Intervalos de confianza

No hay comentarios:

Publicar un comentario

Archivo del blog