En estadística , el valor (valor) de una variable se llama estadísticamente significativo , si la probabilidad de ocurrencia aleatoria de este o incluso más valores extremos es pequeña. Aquí, el extremo se entiende como el grado de desviación de las estadísticas de prueba de la hipótesis nula .
Se dice que una diferencia es estadísticamente significativa si la existencia de los datos disponibles (o incluso datos más extremos) sería improbable, asumiendo que esta diferencia está ausente; esta expresión no significa que esta diferencia deba ser grande, importante o significativa en el sentido general de la palabra.
El cuadro general del problema es el siguiente: dada una muestra de un cierto espacio de eventos elementales (por ejemplo, una lista de pacientes que han sido examinados por una determinada enfermedad) y, posiblemente, valores en esta muestra de algunas variables (funciones de , por ejemplo, edad del paciente, intensidad de tabaquismo, número de horas de ejercicio físico, etc.). La distribución de probabilidad no se conoce, sino que, por el contrario, es el principal objeto de búsqueda aquí.
Diferentes hipótesis corresponden a diferentes posibles distribuciones de probabilidad en . El significado exacto del término "hipótesis" es un conjunto de declaraciones que contiene una descripción completa de alguna distribución de probabilidad .
Probar la hipótesis (especificando la distribución de probabilidad ) es como sigue. Se elige un evento (llamado prueba estadística ) que es (por alguna razón) "casi inconsistente" con la hipótesis , en el sentido de que la probabilidad condicional del evento (asumiendo que la hipótesis es verdadera) no excede un poco (en comparación con unidad) número , llamado nivel de significancia : . Luego se lleva a cabo el experimento. Si el evento ocurre, entonces se rechaza la hipótesis (se dice que hay una desviación de la hipótesis en el nivel de significancia ). De lo contrario, la hipótesis no se rechaza (sin embargo, ningún método estadístico, ni siquiera la ciencia en general, puede "probar de manera concluyente" la hipótesis).
Por lo tanto, el nivel de significación de una prueba es la probabilidad de rechazar una hipótesis si de hecho es verdadera (una decisión conocida como error de tipo I o decisión de falso positivo ).
Los niveles de significación populares son 10 %, 5 %, 1 % y 0,1 %.
Los diferentes valores del nivel α tienen sus ventajas y desventajas. Los niveles α más pequeños dan más confianza de que la hipótesis alternativa ya establecida es significativa, pero existe un mayor riesgo de no rechazar una hipótesis nula falsa (o rechazar una alternativa verdadera) ( error de tipo II , o " decisión negativa falsa "), y por lo tanto, menos poder estadístico . La elección del nivel α requiere inevitablemente un equilibrio entre la significancia y el poder y, por lo tanto, entre las probabilidades de error de Tipo I y Tipo II .
Cuando se utilizan pruebas de significación estadística, debe tenerse en cuenta que la prueba no da en absoluto motivos para aceptar la hipótesis [1] .
diccionarios y enciclopedias |
---|