Prueba t de Student

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 4 de noviembre de 2020; las comprobaciones requieren 3 ediciones .

La prueba t de Student  es un nombre general para una clase de métodos para la prueba estadística de hipótesis ( pruebas estadísticas ) basadas en la distribución de Student . Los casos más comunes de aplicación de la prueba t están relacionados con la comprobación de la igualdad de las medias en dos muestras .

La estadística t generalmente se construye de acuerdo con el siguiente principio general: en el numerador, una variable aleatoria con expectativa matemática cero (cuando se cumple la hipótesis nula ), y en el denominador, la desviación estándar de la muestra de esta variable aleatoria, obtenida como el raíz cuadrada de la estimación no sesgada de la varianza.

Historia

Este criterio fue desarrollado por William Gosset para evaluar la calidad de la cerveza en Guinness . En relación con las obligaciones de la empresa por la no divulgación de secretos comerciales (la dirección de Guinness consideró tal uso del aparato estadístico en su trabajo), el artículo de Gosset se publicó en 1908 en la revista "Biometrics" bajo el seudónimo de "Student" ( Alumno).

Requisitos de datos

Para aplicar este criterio, es necesario que los datos originales tengan una distribución normal . En el caso de aplicar una prueba de dos muestras para muestras independientes , también es necesario cumplir con la condición de igualdad de varianzas . Sin embargo, existen alternativas a la prueba t de Student para situaciones con varianzas desiguales.

El requisito de que la distribución de datos sea normal es necesario para una prueba exacta . Sin embargo, incluso con otras distribuciones de datos, es posible usar -statistics. En muchos casos, estas estadísticas tienen asintóticamente una distribución normal estándar , por lo que puede usar los cuantiles de esta distribución. Sin embargo, a menudo incluso en este caso, los cuantiles no se utilizan de la distribución normal estándar, sino de la distribución de Student correspondiente, como en la prueba exacta. Son asintóticamente equivalentes, sin embargo, en muestras pequeñas, los intervalos de confianza de la distribución de Student son más amplios y más confiables.

Si no se cumplen estas condiciones, al comparar medias muestrales se deben utilizar métodos similares de estadística no paramétrica , entre los cuales los más famosos son la prueba U de Mann-Whitney (como prueba de dos muestras para muestras independientes), así como la prueba de signos y la prueba de Wilcoxon (utilizada en casos de muestras dependientes) .

Prueba t de una muestra

Se utiliza para probar la hipótesis nula sobre la igualdad de la esperanza matemática con algún valor conocido .

Obviamente, cuando se cumple la hipótesis nula . Teniendo en cuenta la supuesta independencia de las observaciones . Usando la estimación de la varianza no sesgada , obtenemos la siguiente estadística t:

Bajo la hipótesis nula, la distribución de este estadístico es . Por lo tanto, si el valor estadístico excede (en términos absolutos) el valor crítico de esta distribución (en un nivel de significación dado), se rechaza la hipótesis nula.

Prueba t de dos muestras para muestras independientes

Sean dos muestras independientes con volúmenes de variables aleatorias normalmente distribuidas . Es necesario probar la hipótesis nula de la igualdad de las expectativas matemáticas de estas variables aleatorias utilizando datos muestrales .

Considere la diferencia entre las medias muestrales . Obviamente, si se cumple la hipótesis nula, . En base a la independencia de las muestras, la varianza de esta diferencia es igual a: . Entonces, utilizando la estimación insesgada de la varianza , obtenemos una estimación insesgada de la varianza de la diferencia entre las medias muestrales: . Por lo tanto, el estadístico t para probar la hipótesis nula es

Este estadístico, bajo la validez de la hipótesis nula, tiene una distribución , donde .

Caso de igualdad de varianza

Si se supone que las varianzas muestrales son iguales, entonces

Entonces el estadístico t es:

Esta estadística tiene una distribución .

Prueba t de dos muestras para muestras dependientes

Para calcular el valor empírico del criterio - en una situación de prueba de una hipótesis sobre las diferencias entre dos muestras dependientes (por ejemplo, dos muestras de la misma prueba con un intervalo de tiempo), se utiliza la siguiente fórmula:

donde  es la diferencia media de los valores,  es la desviación estándar de las diferencias y n es el número de observaciones.

Esta estadística tiene una distribución .

Prueba de restricción lineal en parámetros de regresión lineal

Con la prueba t, también puede probar una restricción lineal arbitraria (única) en los parámetros de una regresión lineal estimada por el método de mínimos cuadrados ordinarios . Sea necesario probar la hipótesis . Obviamente, cuando se cumple la hipótesis nula . Aquí, se utiliza la propiedad de estimaciones LSM imparciales de los parámetros del modelo . Además, . Utilizando su estimación no sesgada en lugar de la varianza desconocida , obtenemos el siguiente estadístico t:

Este estadístico, cuando se satisface la hipótesis nula, tiene una distribución , por lo que si el valor del estadístico es mayor que el valor crítico, entonces se rechaza la hipótesis nula de una restricción lineal.

Prueba de hipótesis del coeficiente de regresión lineal

Un caso especial de una restricción lineal es probar la hipótesis de que el coeficiente de regresión es igual a un cierto valor . En este caso, el estadístico t correspondiente es:

donde  es el error estándar de la estimación del coeficiente y es la raíz cuadrada del elemento diagonal correspondiente de la matriz de covarianza de las estimaciones del coeficiente.

Si la hipótesis nula es verdadera, la distribución de este estadístico es . Si el valor absoluto de las estadísticas es mayor que el valor crítico, entonces la diferencia entre el coeficiente de es estadísticamente significativa (no aleatoria), de lo contrario, es insignificante (aleatoria, es decir, el verdadero coeficiente es probablemente igual o muy cercano a al valor esperado ).

Nota

La prueba de una muestra para las expectativas matemáticas se puede reducir a probar una restricción lineal en los parámetros de regresión lineal. En una prueba de una muestra, esta es una "regresión" en una constante. Por tanto, la regresión es una estimación muestral de la varianza de la variable aleatoria en estudio, la matriz es , y la estimación del “coeficiente” del modelo es igual a la media muestral. De esto obtenemos la expresión para el estadístico t dada arriba para el caso general.

De manera similar, se puede demostrar que una prueba de dos muestras con varianzas de muestra iguales también se reduce a probar restricciones lineales. En una prueba de dos muestras, se trata de una "regresión" sobre una constante y una variable ficticia que identifica una submuestra según el valor (0 o 1): . La hipótesis sobre la igualdad de las expectativas matemáticas de las muestras se puede formular como una hipótesis sobre la igualdad del coeficiente b de este modelo a cero. Se puede demostrar que el estadístico t correspondiente para probar esta hipótesis es igual al estadístico t dado para la prueba de dos muestras.

También se puede reducir a verificar la restricción lineal en el caso de diferentes variaciones. En este caso, la varianza de los errores del modelo toma dos valores. En base a esto, también se pueden obtener estadísticas t similares a las proporcionadas para la prueba de dos muestras.

Análogos no paramétricos

Un análogo de la prueba de dos muestras para muestras independientes es la prueba U de Mann-Whitney . Para la situación con muestras dependientes, los análogos son la prueba de signos y la prueba T de Wilcoxon .

Literatura

alumno. El error probable de una media. // Biometrika. 1908. Nº 6 (1). pág. 1-25.

Enlaces

Sobre los criterios para probar hipótesis sobre la homogeneidad de los medios en el sitio web de la Universidad Técnica Estatal de Novosibirsk