Prueba exacta de Fisher

La prueba exacta de Fisher  es una prueba de significación estadística que se utiliza en el análisis de tabulaciones cruzadas para tamaños de muestra pequeños. Se relaciona con pruebas de significación exacta , ya que no utiliza aproximaciones de muestras grandes (asintóticas cuando el tamaño de la muestra tiende a infinito).

Nombrado en honor al inventor, Ronald Fisher , la creación del autor fue motivada por la declaración de Muriel Bristol ( ing.  Muriel Bristol ), quien afirmó que pudo detectar en qué orden se vertía el té y la leche en su taza.

Cita

La prueba se usa comúnmente para examinar la importancia de la relación entre dos variables en una tabla de dimensión factorial ( tabla de contingencia ). El valor de probabilidad de prueba se calcula como si se conocieran los valores en los límites de la tabla. Por ejemplo, en el caso de la degustación de té, la Sra. Bristol conoce la cantidad de tazas con cada preparación (leche o té primero), por lo que supuestamente proporciona la cantidad correcta de conjeturas en cada categoría. Como señaló Fisher, asumiendo la hipótesis nula de la independencia de la prueba, esto lleva a utilizar una distribución hipergeométrica para un puntaje dado en la tabla.

Con muestras grandes, la prueba de chi-cuadrado se puede utilizar en esta situación . Sin embargo, esta prueba no es adecuada cuando la media de los valores en cualquiera de las celdas de la tabla con límites dados es inferior a 10: la distribución de la muestra calculada de la estadística bajo prueba es solo aproximadamente igual a la distribución teórica de chi-cuadrado , y la aproximación es inadecuada bajo estas condiciones (que surgen cuando los tamaños de las muestras son pequeños, o los datos están distribuidos de manera muy desigual entre las celdas de la tabla). La prueba de Fisher, como su nombre indica, es precisa y, por lo tanto, se puede utilizar independientemente de las características de la muestra. La prueba se vuelve difícil de calcular para muestras grandes o tablas bien balanceadas, pero, afortunadamente, es para estas condiciones que el criterio de Pearson ( ) es bien aplicable.

Para los cálculos manuales, la prueba se puede realizar solo en el caso de las tablas de dimensión de factores . Sin embargo, el principio de la prueba se puede extender al caso general de las tablas , y algunos paquetes estadísticos brindan dichos cálculos (a veces usan un método de Monte Carlo para obtener una aproximación).

Ejemplo

Las pruebas precisas le permiten obtener análisis más precisos para muestras pequeñas o datos escasos. Las pruebas precisas de estudios no paramétricos son una herramienta estadística adecuada para tratar con datos desequilibrados. Los datos desequilibrados analizados por métodos asintóticos tienden a conducir a resultados poco fiables. Para conjuntos de datos grandes y bien equilibrados, las estimaciones de probabilidad exactas y asintóticas son muy similares. Pero para datos pequeños, escasos o desequilibrados, las estimaciones exactas y asintóticas pueden ser muy diferentes e incluso llevar a conclusiones opuestas sobre la hipótesis que se está desarrollando [1] [2] [3] .

La necesidad de la prueba de Fisher surge cuando tenemos datos divididos en dos categorías de dos maneras separadas. Por ejemplo, una muestra de adolescentes se puede dividir en categorías por un lado por género (niños y niñas), y por otro lado por estar a dieta o no. Se puede plantear la hipótesis de que la proporción de personas que siguen una dieta es mayor entre las niñas que entre los niños, y queremos determinar si alguna diferencia observada en las proporciones es estadísticamente significativa.

Los datos podrían parecerse a lo siguiente:

jóvenes muchachas Total
haciendo dieta una 9 diez
no a dieta once 3 catorce
Total 12 12 24

Dichos datos no son adecuados para el análisis de chi-cuadrado porque los valores esperados en la tabla siempre están por debajo de 10 y el número de grados de libertad en la tabla de tamaño factorial siempre es uno.

La pregunta que nos hacemos sobre estos datos es: dado que 10 de 24 adolescentes hacen dieta, y que 12 de esos 24 son niñas, ¿cuál es la probabilidad de que 10 personas que hacen dieta estén tan desigualmente distribuidas entre los sexos? Si tuviéramos que elegir 10 adolescentes al azar, ¿cuál es la probabilidad de que 9 de ellos fueran seleccionados de un conjunto de 12 mujeres y solo 1 de un conjunto de 12 niños?

Antes de continuar con el estudio de la prueba de Fisher, introduzcamos la notación necesaria. Denotemos los números en las celdas con las letras , y , y , en consecuencia, llamemos a los totales de suma por filas y columnas totales marginales (límite) y representemos el total con la letra .

Ahora la tabla se ve así:

jóvenes Muchachas Total
dieta
no a dieta
Total

Fisher demostró que la probabilidad de obtener cualquier conjunto de cantidades viene dada por la distribución hipergeométrica:

donde las columnas entre paréntesis son los coeficientes binomiales y el símbolo " " es el operador factorial .

Esta fórmula da la probabilidad exacta de observar cualquier conjunto específico de datos dados los resultados marginales, el total general y la hipótesis nula de la misma propensión a hacer dieta independientemente del género (la proporción entre los que hacen dieta y los que no hacen dieta es la misma para los niños que para los niños). para niñas).

Fisher mostró que solo podemos tratar con casos en los que los totales marginales  son los mismos que en la tabla anterior. En el ejemplo anterior, hay 11 casos de este tipo. De estos, solo uno es tan "sesgado" (en la dirección de una propensión femenina a la dieta) como la demostración:

jóvenes Muchachas Total
dieta 0 diez diez
no a dieta 12 2 catorce
Total 12 12 24

Para evaluar la significación estadística de los datos observados, es decir, la probabilidad general del mismo o más pronunciado "sesgo" hacia las niñas que siguen una dieta, asumiendo la hipótesis nula , debemos calcular las probabilidades de valor para ambas tablas y Agregalos. Esto da la llamada prueba de una cola; para una prueba de dos caras, también debemos considerar tablas que tienen un sesgo similar, pero en la dirección opuesta (es decir, considere el caso de una dieta predominantemente masculina).

Sin embargo, la clasificación de tablas según si están "extremadamente sesgadas" es problemática. El enfoque utilizado por el lenguaje de programación R propone calcular el valor del criterio sumando las probabilidades de todas las tablas con probabilidades menores o iguales a las probabilidades de la tabla observada. Para tablas con números de celdas pequeños, la puntuación de la prueba de dos colas puede ser significativamente diferente del doble de la puntuación de una cola, en contraste con el caso de las estadísticas que tienen una distribución de muestreo simétrica.

La mayoría de los paquetes estadísticos modernos calculan el valor de las pruebas de Fisher, en algunos casos incluso cuando también sería aceptable una aproximación de chi-cuadrado. Los cálculos reales realizados por los paquetes de software estadístico generalmente diferirán de los descritos. En particular, las dificultades numéricas pueden resultar de factoriales grandes. Los enfoques computacionales simples pero aún más eficientes se basan en el uso de la función gamma o la función gamma logarítmica, pero el cálculo exacto de las probabilidades hipergeométricas y binomiales es un área de investigación actual.

Notas

  1. Mehta, CR 1995. Prueba exacta de SPSS 6.1 para Windows. Acantilados de Englewood, Nueva Jersey: Prentice Hall
  2. Mehta, CR, Patel, NR y Tsiatis, AA 1984. Pruebas de significación exacta para establecer la equivalencia del tratamiento con datos categóricos ordenados. Biometría, 40(3), 819-825
  3. Mehta, CR, Patel, NR 1997. Inferencia exacta en datos categóricos. Biometría, 53(1), 112-117

Literatura

Enlaces