H0: Los datos analizados siguen una distribución M.
H1: Los datos analizados no siguen una distribución M.
Estadístico de contraste:
D Fx Fx ≤ ≤ =
• xi es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de menor a mayor).
• ˆ ( ) F x n i es un estimador de la probabilidad de observar valores menores o iguales que xi.
• 0 F x( ) es la probabilidad de observar valores menores o iguales que xi cuando H0 es cierta.
Así pues, D es la mayor diferencia absoluta observada entre la frecuencia acumulada observada ˆ ( ) F x n y la frecuencia acumulada teórica 0 F x( ), obtenida a partir de la distribución de probabilidad que se especifica como hipótesis nula. Si los valores observados ˆ ( ) F x n son similares a los esperados 0 F x( ), el valor de D será pequeño. Cuanto mayor sea la discrepancia entre la distribución empírica ˆ ( ) F x n y la distribución teórica , mayor será el valor de D. Por tanto, el criterio para la toma de la decisión entre las dos hipótesis será de la forma:
Si D≤Dα ⇒ Aceptar H0
Si D>Dα ⇒ Rechazar H0
La toma de la decisión en el contraste anterior puede llevarse a cabo también mediante el empleo del p-valor asociado al estadístico D observado. El p-valor se define como:
p-valor = es cierta PD D H ( ) > obs 0
Si el p-valor es grande significa que, siendo cierta la hipótesis nula, el valor observado del estadístico D era esperable. Por tanto no hay razón para rechazar dicha hipótesis. Asimismo, si el p-valor fuera pequeño, ello indicaría que, siendo cierta la hipótesis nula, era muy difícil que se produjera el valor de D que efectivamente se ha observado. Ello obliga a poner muy en duda, y por tanto a rechazar, la hipótesis nula. De esta forma, para un nivel de significación α, la regla de decisión para este contraste es:
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0.
Obviamente, la obtención del p-valor requiere conocer la distribución de D bajo la hipótesis nula y hacer el cálculo correspondiente. En el caso particular de la prueba de Kolmogorov Smirnov, la mayoría de los paquetes de software estadístico realizan este cálculo y proporcionan el p-valor directamente.
No hay comentarios:
Publicar un comentario