Criterio de bondad de ajuste de Kolmogorov

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 13 de septiembre de 2013; la verificación requiere 21 ediciones .

La prueba de bondad de ajuste de Kolmogorov está diseñada para probar la hipótesis de que la muestra pertenece a alguna ley de distribución, es decir, para comprobar que la distribución empírica corresponde al modelo esperado .

El criterio de homogeneidad de Smirnov  se utiliza para probar la hipótesis de que dos muestras independientes pertenecen a la misma ley de distribución, es decir, que dos distribuciones empíricas corresponden a la misma ley .

Estos criterios llevan el nombre de los matemáticos Andrei Nikolaevich Kolmogorov y Nikolai Vasilievich Smirnov .

El criterio de Smirnov para probar la hipótesis de homogeneidad de dos leyes empíricas de distribución es uno de los criterios no paramétricos más utilizados .

Descripción

Si el criterio compara las frecuencias de dos distribuciones por separado para cada dígito, aquí las frecuencias se comparan primero para el primer dígito, luego para la suma del primer y segundo dígito, luego para la suma del primer, segundo y tercer dígito, etc. Por lo tanto, cada vez que el acumulado a este rango de frecuencia.

Si las diferencias entre las dos distribuciones son significativas, en algún momento la diferencia en las frecuencias acumuladas alcanzará un valor crítico y las diferencias pueden considerarse estadísticamente significativas.  Esta diferencia está incluida en la fórmula del criterio . Cuanto mayor es el valor empírico , más significativas son las diferencias.

Estadísticas de la prueba de Kolmogorov

Deje que la función de distribución empírica (EDF) , construida sobre la muestra , tenga la forma:

donde indica si la observación cayó en el área :

Se comprueba si la muestra es una variable aleatoria generada con una función de distribución . El estadístico de prueba para la función de distribución empírica se define como sigue:

donde by  es el supremo de la función .

Distribución de las estadísticas de Kolmogorov

Denotemos la hipótesis nula como la hipótesis de que la muestra obedece a la distribución . Entonces, según el teorema de Kolmogorov, para las estadísticas introducidas se cumple:

Tomamos en cuenta que el criterio tiene una región crítica dextrógira .

Tomar una decisión según el criterio de Kolmogorov.
Si la estadística excede el punto porcentual de la distribución de Kolmogorov de un nivel de significación dado , entonces se rechaza la hipótesis nula (sobre el cumplimiento de la ley ). En caso contrario, se acepta la hipótesis en el nivel .

Si está lo suficientemente cerca de 1, entonces se puede aproximar mediante la fórmula:

La potencia asintótica de la prueba es 1.

Denotemos ahora la hipótesis nula como la hipótesis de que las dos muestras en estudio obedecen a la misma distribución de la variable aleatoria .

El teorema de Smirnov.
Sean funciones de distribución empíricas construidas a partir de muestras independientes de volumen y variable aleatoria . Entonces, si , entonces , donde .

El teorema de Smirnov nos permite construir un criterio para probar la homogeneidad de dos muestras.

Tomar una decisión según el criterio de Smirnov.
Si las estadísticas exceden el cuantil de la distribución de Kolmogorov para un nivel de significancia dado , entonces se rechaza la hipótesis nula (sobre la homogeneidad de las muestras). En caso contrario, se acepta la hipótesis en el nivel .

Véase también

Nota 1

En el criterio de Kolmogorov, es preferible utilizar estadísticas con la corrección de Bolshev en la siguiente forma . La distribución de estas estadísticas ya no depende tanto del tamaño de la muestra. La dependencia de su distribución en el tamaño de la muestra se puede despreciar en .

Nota 2

La prueba clásica de Kolmogorov está diseñada para probar hipótesis simples . Si se está probando la hipótesis sobre la concordancia de la muestra observada con la ley, cuyos parámetros se conocen, entonces el criterio de Kolmogorov es libre de distribución : no importa con qué ley se verifique la concordancia. Si la hipótesis que se prueba es verdadera, la distribución límite de la estadística de Kolmogorov es la distribución de Kolmogorov .

Todo cambia cuando se contrastan hipótesis complejas , cuando la muestra analizada evalúa los parámetros de la ley teórica, cuya concordancia se comprueba. Al probar hipótesis complejas , se pierde la libertad de distribución. Al probar hipótesis complejas y la validez de la hipótesis que se prueba, las distribuciones de las estadísticas de las pruebas de bondad de ajuste no paramétricas (y la prueba de Kolmogorov) dependen de una serie de factores: del tipo de ley observada correspondiente a la hipótesis que se prueba; sobre el tipo de parámetro que se evalúa y el número de parámetros que se evalúan; en algunos casos, sobre el valor de un parámetro específico (por ejemplo, en el caso de familias de distribuciones gamma y beta); del método de estimación de parámetros. Las diferencias en las distribuciones marginales de las mismas estadísticas cuando se prueban hipótesis simples y complejas son tan significativas que de ninguna manera deben despreciarse.

Sobre la aplicación del criterio de Kolmogorov en la prueba de hipótesis complejas

Enlaces