4.5.3. Muestras grandes: prueba de KarlPearson para ajuste de una distribución de probabilidades hipotética, discreta o continua (en hoja de cálculo o con paquete estadístico)
Los procedimientos de hipótesis que se han estudiado en las secciones previas son para problemas en los que se conoce la forma de la función de densidad de la variable aleatoria y la hipótesis involucra los parámetros de la distribución. Sin embargo, con frecuencia encontramos otro tipo de hipótesis: no conocemos la distribución de probabilidad de la variable aleatoria bajo estudio, digamos X, y deseamos probar la hipótesis de que X sigue una distribución de probabilidad particular. Por ejemplo, podría interesarnos probar la hipótesis de que X sigue la distribución normal. El procedimiento de prueba requiere una muestra aleatoria de tamaño n de la variable aleatoria X, cuya función de densidad de probabilidad se desconoce.Estas no observaciones se arreglan en un histograma de frecuencias, teniendo k. intervalos de clase. Sea O, la frecuencia observada en el intervalo de clase i-ésimo. A partir de la distribución de probabilidad hipotética, calculamos la frecuencia esperada en el intervalo de clase i-ésimo, denotada E¡= La estadística de prueba es:Puede demostrarse que sigue aproximadamente la distribución ji cuadrada con k – p – 1 grados de libertad,donde representa el número de parámetros de la distribución hipotética estimada por medio de estadísticas de muestra. Esta aproximación se mejora cuando n aumenta. Rechazaríamos la hipótesis de que X se ajusta a la distribución hipotética si .
La prueba χ² de Pearson se considera una pruebano paramétrica que mide la discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en el contraste de hipótesis. También se utiliza para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de contingencia.
La fórmula que da el estadístico es la siguiente:
Cuanto mayor sea el valor de , menos verosímil es que la hipótesis nula (que asume la igualdad entre ambas distribuciones) sea correcta. De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están ambas distribuciones.
No hay comentarios:
Publicar un comentario