Criterio de Kruskal-Wallis

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 27 de septiembre de 2020; las comprobaciones requieren 3 ediciones .

La prueba de Kruskal-Wallis está diseñada para probar la igualdad de las medianas de múltiples muestras . Esta prueba es una generalización multivariada de la prueba de Wilcoxon-Mann-Whitney . El criterio de Kruskal-Wallis es de rango uno, por lo que es invariante con respecto a cualquier transformación monótona de la escala de medida .

También conocido como: prueba H de Kruskal -Wallis, análisis de varianza unidireccional de Kruskal - Wallis , prueba de Kruskal-Wallis .  Nombrado en honor a los matemáticos estadounidenses William Kruskal y Allen Wallis .  

Ejemplos de problemas

La Copa del Mundo está en marcha. La primera muestra  es una encuesta a los fanáticos con la pregunta "¿Cuáles son las posibilidades de que gane el equipo ucraniano?" antes del inicio del campeonato. La segunda muestra es después del primer partido, la tercera es después del segundo partido, etc. Los valores en las muestras son las posibilidades de que Ucrania gane en una escala de diez puntos (1 — “sin perspectivas”, 10 — “llevar la copa a Ucrania es cuestión de tiempo”). Se requiere verificar si los resultados de las encuestas dependen del curso del campeonato.

Descripción de los criterios

Se dan muestras :

.

La selección combinada se verá así:

Adivinanzas adicionales:

  1. todas las muestras son simples, la muestra agrupada es independiente;
  2. las muestras se extraen de distribuciones continuas desconocidas .

La hipótesis nula se contrasta con la alternativa .

Ordenemos todos los elementos de las muestras en orden ascendente y denotemos el rango del -ésimo elemento de la -ésima muestra en la serie variacional resultante .

La estadística de la prueba de Kruskal-Wallis para probar la hipótesis de un cambio en los parámetros de posición de las dos muestras comparadas tiene la forma:

,

dónde

; .

La hipótesis de cambio se rechaza en el nivel de significancia si , donde  es el valor crítico, en y calculado a partir de las tablas. Para valores mayores, se aplican varias aproximaciones.

La aproximación de Kruskal-Wallis

Dejar

; ; ; .

Entonces , en ausencia de un cambio, las estadísticas tendrán una distribución con y grados de libertad. Por lo tanto, la hipótesis nula se rechaza en el nivel de significancia si .

Aproximación de Iman-Davenport

Según ella, la hipótesis del desplazamiento nulo se rechaza con certeza si , donde ; , y  son, respectivamente, los valores críticos de los estadísticos de Fisher y chi-cuadrado con los correspondientes grados de libertad.

Esta es una mejor aproximación que la aproximación de Kruskal-Wallis. En presencia de rangos relacionados (es decir, cuando los valores de valores de diferentes muestras coinciden y se les asignan los mismos rangos promedio), es necesario utilizar las estadísticas modificadas , donde ;  es el tamaño del th grupo de elementos idénticos;  es el número de grupos de elementos idénticos. En , la aproximación de la distribución de estadísticas es válida ; -distribución con grados de libertad, es decir, se rechaza la hipótesis nula si .

Véase también

Literatura

Enlaces