distribucion _ Distribución Pearson | |
---|---|
Designacion | o |
Opciones | es el numero de grados de libertad |
Transportador | |
Densidad de probabilidad | |
función de distribución | |
Valor esperado | |
Mediana | sobre |
Moda |
0 para si |
Dispersión | |
Coeficiente de asimetría | |
Coeficiente de curtosis | |
entropía diferencial |
|
Función generadora de momentos | , si |
función característica |
Distribución (chi-cuadrado) con grados de libertad - distribución de la suma de cuadrados de variables aleatorias normales estándar independientes .
Sean variables aleatorias normales estándar conjuntamente independientes, es decir: . Entonces la variable aleatoria
tiene una distribución chi-cuadrado con grados de libertad, es decir , o, escrito de otra manera:
.La distribución chi-cuadrado es un caso especial de la distribución gamma , y su densidad es:
,donde es la distribución gamma y es la función gamma .
La función de distribución tiene la siguiente forma:
,donde y denotan las funciones gamma completa e incompleta , respectivamente.
tiene una distribución .
Tiene una distribución de Fisher con grados de libertad .
Otra generalización de la distribución de chi-cuadrado es la llamada distribución de chi-cuadrado no central que ocurre en algunos problemas estadísticos.
Un cuantil es un número (argumento) en el que la función de distribución es igual a una probabilidad requerida dada. En términos generales, un cuantil es el resultado de invertir una función de distribución, pero existen sutilezas con las funciones de distribución discontinuas.
El criterio fue propuesto por Karl Pearson en 1900 [1] . Su trabajo es considerado como la base de la estadística matemática moderna. Los predecesores de Pearson simplemente trazaron los resultados experimentales y afirmaron que eran correctos. En su artículo, Pearson dio algunos ejemplos interesantes del mal uso de las estadísticas. También demostró que algunas de las observaciones en la rueda de la ruleta (en la que experimentó durante dos semanas en Montecarlo en 1892) estaban tan alejadas de las frecuencias esperadas que las posibilidades de volver a obtenerlas, suponiendo que la rueda de la ruleta se arregla concienzudamente, son iguales a 1. de 10 29 .
Se puede encontrar una discusión general del criterio y una bibliografía extensa en el artículo de revisión de William J. Cochran [2] .
La distribución de chi-cuadrado tiene numerosas aplicaciones en la inferencia estadística, como el uso de la prueba de chi-cuadrado y la estimación de varianzas. Se utiliza en el problema de estimar la media de una población distribuida normalmente y el problema de estimar la pendiente de una línea de regresión debido a su papel en la distribución t de Student . Se utiliza en el análisis de varianza .
Los siguientes son ejemplos de situaciones en las que surge una distribución de chi-cuadrado a partir de una muestra normal:
Nombre | Estadísticas |
---|---|
distribución chi-cuadrado | |
distribución de chi-cuadrado no central | |
distribución chi | |
distribución de chi no central |
Para cualquier número p entre 0 y 1, se define un valor p : la probabilidad de obtener para un modelo probabilístico dado de la distribución de valores de una variable aleatoria el mismo o más valor extremo de las estadísticas (media aritmética, mediana, etc.), en comparación con la observada, siempre que la hipótesis nula sea cierta. En este caso, es la distribución . Dado que el valor de la función de distribución en un punto para los grados de libertad correspondientes da la probabilidad de obtener un valor estadístico menos extremo que este punto, el valor p se puede obtener restando el valor de la función de distribución de la unidad. Un valor p pequeño , por debajo del nivel de significancia seleccionado, significa significancia estadística . Esto será suficiente para rechazar la hipótesis nula. Para distinguir entre resultados significativos y no significativos, se suele utilizar un nivel de 0,05.
La tabla da valores p para los valores correspondientes a los primeros diez grados de libertad.
Grados de libertad ( gl ) | Valor [3] | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
una | 0.004 | 0.02 | 0.06 | 0.15 | 0.46 | 1.07 | 1.64 | 2.71 | 3.84 | 6.63 | 10.83 |
2 | 0.10 | 0.21 | 0,45 | 0.71 | 1.39 | 2.41 | 3.22 | 4.61 | 5.99 | 9.21 | 13.82 |
3 | 0.35 | 0.58 | 1.01 | 1.42 | 2.37 | 3.66 | 4.64 | 6.25 | 7.81 | 11.34 | 16.27 |
cuatro | 0.71 | 1.06 | 1,65 | 2.20 | 3.36 | 4.88 | 5.99 | 7.78 | 9.49 | 13.28 | 18.47 |
5 | 1.14 | 1.61 | 2.34 | 3.00 | 4.35 | 6.06 | 7.29 | 9.24 | 11.07 | 15.09 | 20.52 |
6 | 1.63 | 2.20 | 3.07 | 3.83 | 5.35 | 7.23 | 8.56 | 10.64 | 12.59 | 16.81 | 22.46 |
7 | 2.17 | 2.83 | 3.82 | 4.67 | 6.35 | 8.38 | 9.80 | 12.02 | 14.07 | 18.48 | 24.32 |
ocho | 2.73 | 3.49 | 4.59 | 5.53 | 7.34 | 9.52 | 11.03 | 13.36 | 15.51 | 20.09 | 26.12 |
9 | 3.32 | 4.17 | 5.38 | 6.39 | 8.34 | 10.66 | 12.24 | 14.68 | 16.92 | 21.67 | 27.88 |
diez | 3.94 | 4.87 | 6.18 | 7.27 | 9.34 | 11.78 | 13.44 | 15.99 | 18.31 | 23.21 | 29.59 |
valor p | 0,95 | 0.90 | 0.80 | 0.70 | 0.50 | 0.30 | 0.20 | 0.10 | 0.05 | 0.01 | 0.001 |
Estos valores se pueden calcular en términos del cuantil (función de distribución inversa) de la distribución chi-cuadrado [4] . Por ejemplo, el cuantil para p = 0,05 y df = 7 da = 14,06714 ≈ 14,07 , como en la tabla anterior. Esto significa que para la observación experimental de siete variables aleatorias independientes , con la validez de la hipótesis nula “cada variable está descrita por una distribución estándar normal con mediana 0 y desviación estándar 1”, el valor se puede obtener solo en 5% de implementaciones. Normalmente, la obtención de un valor mayor puede considerarse razón suficiente para rechazar esta hipótesis nula.
La tabla da redondeo a centésimas; para obtener tablas más precisas con más grados de libertad, consulte, por ejemplo, aquí [5] .
Distribuciones de probabilidad | |
---|---|
Discreto | |
Absolutamente continuo |