Prueba de bondad de ajuste de Pearson

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 9 de noviembre de 2021; la verificación requiere 1 edición .

La prueba de bondad de ajuste de Pearson o la prueba de bondad de ajuste (chi-cuadrado)  es un método no paramétrico que le permite evaluar la importancia de las diferencias entre el número real (revelado como resultado del estudio) de resultados o características cualitativas de la muestra que caen en cada categoría y el número teórico que se puede esperar en los grupos estudiados si la hipótesis nula es cierta. En términos más simples, el método le permite evaluar la importancia estadística de las diferencias entre dos o más indicadores relativos (frecuencias, acciones).

Es el criterio más comúnmente utilizado para probar la hipótesis de que el tamaño de la muestra observada pertenece a alguna ley de distribución teórica .

El criterio de chi-cuadrado para el análisis de tablas de contingencia fue desarrollado y propuesto en 1900 por el fundador de la estadística matemática , el científico inglés Karl Pearson .

El criterio se puede utilizar para probar hipótesis simples de la forma

donde  es el vector conocido de parámetros de la ley teórica, y al probar hipótesis complejas de la forma

cuando se calcula una estimación de un parámetro de distribución escalar o vectorial sobre la misma muestra.

Estadísticas de criterios

El procedimiento para probar hipótesis utilizando criterios de tipo implica agrupar observaciones. El dominio de definición de una variable aleatoria se divide en intervalos que no se intersecan mediante puntos límite

donde  es el límite inferior del dominio de definición de una variable aleatoria;  - borde superior.

De acuerdo con la partición dada, se calcula el número de valores de muestra que caen en el intervalo th y las probabilidades de caer en el intervalo

correspondiente a una ley teórica con una función de distribución

Donde

y

Al probar una hipótesis simple, se conocen tanto la forma de la ley como todos sus parámetros (se conoce el parámetro escalar o vectorial ).

Las estadísticas utilizadas en las pruebas de bondad de ajuste del tipo se basan en la medición de las desviaciones de .

El estadístico de bondad de ajuste de Pearson está determinado por la relación

En el caso de contrastar una hipótesis simple, en el límite en , este estadístico obedece a una distribución - con grados de libertad, si la hipótesis contrastada es verdadera . La densidad de la distribución, que es un caso especial de la distribución gamma , se describe mediante la fórmula

La hipótesis probada se rechaza para valores grandes de los estadísticos, cuando el valor de los estadísticos calculados a partir de la muestra es mayor que el valor crítico

o el nivel de significancia alcanzado ( valor p ) es menor que el nivel de significancia dado (la probabilidad de error dada del 1er tipo ) .

Prueba de hipótesis complejas

Al probar hipótesis complejas, si los parámetros de la ley para una misma muestra se estiman como resultado de la minimización de estadísticos o para una muestra agrupada utilizando el método de máxima verosimilitud , entonces el estadístico , si la hipótesis probada es verdadera, obedece a una distribución - con grados de libertad, donde  es el número de parámetros estimados a partir de la muestra.

Si los parámetros se estiman a partir de la muestra no agrupada original , la distribución de la estadística no será una distribución [1] . Además, la distribución de los estadísticos cuando la hipótesis sea cierta dependerá del método de agrupación, es decir, de cómo se divida el dominio de definición en intervalos [2] .

Al estimar el método de máxima verosimilitud de los parámetros para una muestra no agrupada, puede usar criterios modificados como [3] [4] [5] [6] .

Sobre el poder del criterio

Cuando se utilizan criterios de bondad de ajuste, por regla general, no se establecen hipótesis en competencia: la muestra pertenece a una ley particular y, como hipótesis en competencia, se considera cualquier otra ley. Naturalmente, el criterio podrá distinguir de diferentes maneras de la ley correspondiente, leyes cercanas o lejanas a ella. Si especificamos una hipótesis en competencia y alguna ley en competencia correspondiente a ella , entonces ya podemos hablar de errores de dos tipos: no solo de un error del 1er tipo (rechazo de la hipótesis que se prueba cuando es verdadera) y la probabilidad de este error , sino también sobre un error de segundo tipo (no rechazo bajo equidad ) y la probabilidad de este error .

El poder del criterio en relación con la hipótesis en competencia se caracteriza por el valor . Cuanto mejor reconoce el criterio un par de hipótesis en competencia y mayor es su poder.

La potencia de la prueba de bondad de ajuste de Pearson depende significativamente del método de agrupación [7] [8] y del número de intervalos elegido [8] [9] .

Bajo el agrupamiento asintóticamente óptimo, que maximiza varios funcionales de la matriz de información de Fisher sobre los datos agrupados (minimiza las pérdidas asociadas con el agrupamiento), la prueba de bondad de ajuste de Pearson tiene la potencia máxima en relación con las hipótesis competidoras "(muy) cercanas" [ 10] [8] [9] .

Cuando se prueban hipótesis simples y se usa una agrupación asintóticamente óptima, la prueba de bondad de ajuste de Pearson tiene una ventaja en potencia sobre las pruebas de bondad de ajuste no paramétricas. Al probar hipótesis complejas, el poder de los criterios no paramétricos aumenta y no existe tal ventaja [11] [12] . Sin embargo, para cualquier par de hipótesis en competencia (leyes en competencia), al elegir el número de intervalos y el método de dividir el dominio de definición de una variable aleatoria en intervalos, es posible maximizar el poder del criterio [13] .

Véase también

Notas

  1. Chernoff H., Lehmann EL El uso de estimaciones de máxima verosimilitud en la prueba de bondad de ajuste  //  The Annals of Mathematical Statistics. - 1954. - vol. 25 . - pág. 579-586 .
  2. Lemeshko B. Yu., Postovalov S. N. Sobre la dependencia de las distribuciones límite de las estadísticas de Pearson y la razón de verosimilitud del método de agrupación de datos  // Laboratorio industrial. - 1998. - T. 64 , núm. 5 . - S. 56-63 .
  3. Nikulin M.S. Chi-square test para distribuciones continuas con parámetros de desplazamiento y escala  // Teoría de la probabilidad y su aplicación. - 1973. - T. XVIII , núm. 3 . - S. 583-591 .
  4. Nikulin M.S. Sobre el criterio de chi-cuadrado para distribuciones continuas  // Teoría de la probabilidad y su aplicación. - 1973. - T. XVIII , núm. 3 . - S. 675-676 .
  5. Rao KC, Robson DS Una estadística de chi-cuadrado para pruebas de bondad de ajuste dentro de la familia exponencial  //  Commun. estadístico. - 1974. - vol. 3 . - P. 1139-1153 .
  6. Greenwood PE, Nikulin MS Una guía para la prueba de chi-cuadrado  . — Nueva York: John Wiley & Sons, 1996. — 280 p.
  7. Lemeshko B. Yu. Agrupación asintóticamente óptima de observaciones en criterios de bondad de ajuste  // Laboratorio de fábrica. - 1998. - T. 64 , núm. 1 . - S. 56-64 .
  8. 1 2 3 R 50.1.033-2001. Recomendaciones para la estandarización. Estadísticas aplicadas. Reglas para comprobar la concordancia entre la distribución experimental y la teórica. Parte I. Pruebas de chi-cuadrado . - M. : Editorial de normas, 2006. - 87 p.
  9. 1 2 Lemeshko B. Yu., Chimitova E. V. Sobre la elección del número de intervalos en los criterios de acuerdo de tipo  // Laboratorio de fábrica. diagnósticos materiales. - 2003. - T. 69 , núm. 1 . - S. 61-67 .
  10. Denisov V. I., Lemeshko B. Yu. Agrupación óptima en el procesamiento de datos experimentales // Medición de sistemas de información. - Novosibirsk, 1979. - S. 5-14.
  11. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Análisis comparativo del poder de los criterios de bondad de ajuste bajo hipótesis en estrecha competencia. I. Prueba de hipótesis simples  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , núm. 2(34) . - S. 96-111 .
  12. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N. Análisis comparativo del poder de las pruebas de bondad de ajuste con alternativas cercanas. II. Prueba de hipótesis complejas  // Siberian Journal of Industrial Mathematics. - 2008. - T. 11 , núm. 4(36) . - S. 78-93 .
  13. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. Análisis de datos estadísticos, modelado y estudio de patrones probabilísticos. Enfoque informático . - Novosibirsk: Editorial de NSTU, 2011. - 888 p. — (Monografías de NSTU). — ISBN 978-5-7782-1590-0 . — Apartado 4.9.

Literatura

Véase también

Enlaces