Prueba de Wilcoxon

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 25 de octubre de 2022; las comprobaciones requieren 12 ediciones .

Prueba t de Wilcoxon  : (también llamada prueba t de Wilcoxon, prueba de Wilcoxon, prueba de rango con signo de Wilcoxon, prueba de suma de rango de Wilcoxon) es una prueba estadística no paramétrica ( prueba ) utilizada para probar las diferencias entre dos muestras de mediciones pareadas o independientes por el nivel de cualquier rasgo cuantitativo medido en una escala continua u ordinal Propuesto por primera vez por Frank Wilcoxon [1] . Otros nombres son prueba W de Wilcoxon [2] , prueba de rango con signo de Wilcoxon , prueba de muestra conectada de Wilcoxon [3] . La prueba de Wilcoxon para muestras independientes también se denomina prueba de Mann-Whitney [4] .

La esencia del método es que se comparan los valores absolutos de la gravedad de los cambios en una dirección u otra. Para hacer esto, primero se clasifican todos los valores absolutos de los turnos y luego se resumen los rangos. Si los cambios en una dirección u otra ocurren por casualidad, entonces las sumas de sus rangos serán aproximadamente iguales. Si la intensidad de los cambios en una dirección es mayor, entonces la suma de los rangos de los valores absolutos de los cambios en la dirección opuesta será significativamente menor de lo que podría ser con cambios aleatorios.

Finalidad del criterio

El criterio está diseñado para comparar indicadores medidos bajo dos condiciones diferentes en la misma muestra de sujetos. Le permite establecer no solo la dirección de los cambios, sino también su gravedad, es decir, puede determinar si el cambio en los indicadores en una dirección es más intenso que en la otra.

Descripción de los criterios

El criterio es aplicable cuando los atributos se miden al menos en una escala ordinal. Es recomendable aplicar este criterio cuando la magnitud de los propios desplazamientos varía dentro de un cierto rango (10-15% de su magnitud). Esto se explica por el hecho de que la dispersión de los valores de cambio debe ser tal que sea posible clasificarlos. Si los turnos difieren ligeramente entre sí y toman algunos valores finitos (por ejemplo, +1, -1 y 0), no hay obstáculos formales para la aplicación del criterio, pero debido a la gran cantidad de rangos idénticos , el ranking pierde su significado, y los mismos resultados serían más fáciles de obtener usando el criterio del signo.

La esencia del método es que se comparan los valores absolutos de la gravedad de los cambios en una dirección u otra. Para hacer esto, primero se clasifican todos los valores absolutos de los turnos y luego se resumen los rangos. Si los cambios en una dirección u otra ocurren por casualidad, entonces las sumas de sus rangos serán aproximadamente iguales. Si la intensidad de los cambios en una dirección es mayor, entonces la suma de los rangos de los valores absolutos de los cambios en la dirección opuesta será significativamente menor de lo que podría ser con cambios aleatorios.

El valor mínimo de la cantidad: , donde n es el volumen de la segunda muestra. El valor máximo de , donde n es el volumen de la segunda muestra, m es el volumen de la primera muestra.

Restricciones de criterio

Con seguridad, la prueba de Wilcoxon se puede utilizar con un tamaño de muestra de hasta 25 elementos [5] . Esto se explica por el hecho de que con un mayor número de observaciones, la distribución de los valores de este criterio se acerca rápidamente a la normalidad. Por ello, en el caso de muestras grandes, recurren a convertir la prueba de Wilcoxon al valor de z (z-score) [5] . Es de destacar que el programa SPSS convierte la prueba de Wilcoson al valor de z siempre independientemente de los tamaños de muestra [5] .

Los turnos cero están excluidos de la consideración. (Este requisito puede eludirse reformulando el tipo de hipótesis. Por ejemplo: el cambio hacia valores crecientes supera el cambio hacia su disminución y la tendencia a permanecer en el mismo nivel).

Un cambio en la dirección más común se considera "típico" y viceversa.

También hay un atajo para comparar una sola muestra con un valor medio conocido .

Algoritmo

  1. Haga una lista de temas en cualquier orden, como alfabético.
  2. Calcule la diferencia entre los valores individuales en la segunda y la primera medición. Determine lo que se considerará un turno típico.
  3. Según el algoritmo de ranking, ordena los valores absolutos de las diferencias, asignando un rango más bajo al valor más pequeño, y comprueba la coincidencia de la suma de rangos resultante con el calculado.
  4. Marque de alguna manera los rangos correspondientes a los cambios en una dirección atípica. Calcular su suma T.
  5. Determinar los valores críticos de T para un tamaño de muestra dado. Si T-emp. menor o igual a T-cr. – Prevalece de forma fiable el cambio a la dirección “típica”.

De hecho, se evalúan los signos de los valores obtenidos al restar una serie de valores de una dimensión de otra. Si, como resultado, el número de valores disminuidos es aproximadamente igual al número de valores aumentados, entonces se confirma la hipótesis de la mediana nula .

Ejemplo de un algoritmo para una serie de dos experimentos

Sean dos series de experimentos, como resultado de los cuales se obtuvieron dos muestras de tamaños n y m. Sea la hipótesis nula H 0 : Las medias generales de ambas muestras son iguales. Para probar la hipótesis H 0 , es necesario:

  1. Sumar los elementos de la segunda muestra (calcular W)
  2. Calcular la expectativa matemática de una variable aleatoria W.
  3. Si H 0 es verdadera, la expectativa matemática de la variable aleatoria W está cerca de las estadísticas W.
  4. La prueba de hipótesis comienza con la elección del nivel de significación: un
  5. Calcule los límites de significación (a partir de la simetría, un límite es suficiente) y el límite de la región crítica W(a)
  6. La validez de la desigualdad W > W(a) indica la validez de la hipótesis nula. H 0 se toma en el nivel de significancia = a

Notas

  1. Wilcoxon, F. (1945). Comparaciones individuales por métodos de clasificación. Biometría, 1, 80-83.
  2. Prueba W Wilcoxon . Consultado el 10 de diciembre de 2013. Archivado desde el original el 8 de diciembre de 2013.
  3. Prueba de Wilcoxon para muestras conectadas . Consultado el 28 de marzo de 2011. Archivado desde el original el 26 de mayo de 2012.
  4. Chris salvaje. La prueba de la suma de rangos de Wilcoxon . ENCUENTROS CASUALIZADOS: Un primer curso de análisis e inferencia de datos . John Wiley & Sons, Nueva York (1999). Consultado el 7 de septiembre de 2018. Archivado desde el original el 27 de enero de 2019.
  5. 1 2 3 Graham Hole. Pruebas no paramétricas con muestras de gran tamaño . Consultado el 21 de abril de 2017. Archivado desde el original el 12 de julio de 2017.