Distribución normal

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 20 de octubre de 2022; las comprobaciones requieren 2 ediciones .
Distribución normal

La línea verde corresponde a la distribución normal estándarDensidad de probabilidad

Los colores de esta tabla coinciden con la tabla anterior.función de distribución
Designacion
Opciones μ  - factor de desplazamiento ( real ) σ > 0  - factor de escala (real, estrictamente positivo)
Transportador
Densidad de probabilidad
función de distribución
Valor esperado
Mediana
Moda
Dispersión
Coeficiente de asimetría
Coeficiente de curtosis
entropía diferencial
Función generadora de momentos
función característica

La distribución normal [1] [2] , también llamada distribución gaussiana o de Gauss - Laplace [3]  es una distribución de probabilidad , que en el caso unidimensional viene dada por una función de densidad de probabilidad , coincidente con la función gaussiana :

, donde el parámetro  es la expectativa matemática (valor medio), la mediana y la moda de distribución, y el parámetro  es la desviación estándar ,  es la varianza de distribución .

Por lo tanto, la distribución normal unidimensional es una familia de distribuciones de dos parámetros que pertenece a la clase exponencial de distribuciones [4] . El caso multivariante se describe en el artículo " Distribución normal multivariante ".

La distribución normal estándar es una distribución normal con media y desviación estándar

Información general

Si una cantidad es la suma de muchas cantidades aleatorias débilmente interdependientes, cada una de las cuales hace una pequeña contribución relativa a la suma total, entonces la distribución centrada y normalizada de tal cantidad tiende a una distribución normal con un número suficientemente grande de términos .

Esto se deriva del teorema del límite central de la teoría de la probabilidad . En el mundo que nos rodea, a menudo hay cantidades cuyo valor está determinado por una combinación de muchos factores independientes. Este hecho, así como el hecho de que la distribución fuera considerada típica, ordinaria, hizo que a finales del siglo XIX se comenzara a utilizar el término “distribución normal”. La distribución normal juega un papel destacado en muchos campos de la ciencia, como la estadística matemática y la física estadística .

Una variable aleatoria que tiene una distribución normal se denomina variable aleatoria normal o gaussiana.

Definiciones

Distribución normal estándar

El caso más simple de una distribución normal, la distribución normal estándar  , es un caso especial cuando y Su densidad de probabilidad es:

El factor en la expresión proporciona la condición para la normalización de la integral [5] . Como el factor en el exponente proporciona una dispersión igual a uno, entonces la desviación estándar es igual a 1. La función es simétrica en el punto , su valor en él es máximo e igual a los puntos de Inflexión de la función: y

Gauss llamó a la distribución normal estándar con eso es:

Distribución normal con parámetros

Cada distribución normal es una variante de la distribución normal estándar cuyo rango se extiende por un factor (desviación estándar) y se traslada a (expectativa):

son parámetros de la distribución normal. La densidad de probabilidad debe normalizarse para que la integral sea igual a 1.

Si  es una variable aleatoria normal estándar, entonces el valor tendrá una distribución normal con expectativa matemática y desviación estándar , por el contrario, si  es una variable normal con parámetros entonces tendrá una distribución normal estándar.

Si abrimos los paréntesis en el exponente de densidad de probabilidad y tenemos en cuenta que , entonces:

Así, la densidad de probabilidad de cada distribución normal es el exponente de una función cuadrática :

dónde

A partir de aquí, se puede expresar la media como a y la varianza como Para la distribución normal estándar y

Designación

La densidad de probabilidad de la distribución normal estándar (con media cero y varianza unitaria) a menudo se denota con la letra griega ( phi ) [6] . También se usa con bastante frecuencia una forma alternativa de la letra griega phi .

La distribución normal a menudo se denota por o [7] . Si la variable aleatoria se distribuye de acuerdo a la ley normal con media y variación, entonces escribimos:

Función de distribución

La función de distribución de la distribución normal estándar generalmente se denota con una letra griega mayúscula ( phi ) y es una integral:

La función de error (integral de probabilidad) está asociada a ella, dando la probabilidad de que una variable aleatoria normal con media 0 y variación 1/2 caiga en el segmento :

Estas integrales no se expresan en funciones elementales y se denominan funciones especiales . Muchas de sus aproximaciones numéricas son conocidas. Véase más abajo .

Las funciones están relacionadas, en particular, por la relación:

.

Una distribución normal con densidad media y varianza tiene la siguiente función de distribución:

Puede usar la función  : le dará la probabilidad de que el valor de la variable aleatoria normal estándar exceda :

.

La gráfica de la función de distribución normal estándar tiene una simetría rotacional doble sobre el punto (0; 1/2), es decir, su integral indefinida es:

La función de distribución de una variable aleatoria normal estándar se puede expandir utilizando el método de integración por partes en una serie:

donde el signo significa doble factorial .

La expansión asintótica de la función de distribución para valores grandes también se puede realizar integrando por partes.

Desviación estándar

Alrededor del 68% de los valores de la distribución normal están a una distancia de no más de una desviación estándar σ de la media; alrededor del 95% de los valores se encuentran a una distancia de no más de dos desviaciones estándar; y el 99,7% no más de tres. Este hecho es un caso especial de la regla 3 sigma para una muestra normal.

Más precisamente, la probabilidad de obtener un número normal entre y es:

Con una precisión de 12 dígitos significativos, los valores de se dan en la tabla [8] :

OEIS
una 0.682689492137 0.317310507863
3.15148718753
A178647
2 0.954499736104 0.045500263896
21.9778945080
A110894
3 0.997300203937 0.002699796063
370.398347345
A270712
cuatro 0.999936657516 0.000063342484
15787.1927673
5 0.999999426697 0.000000573303
1744277.89362
6 0.999999998027 0.000000001973
506797345.897

Propiedades

Momentos

Los momentos y los momentos absolutos de una variable aleatoria se denominan expectativas matemáticas de las variables aleatorias y, respectivamente. Si la esperanza matemática es una variable aleatoria , estos parámetros se denominan momentos centrales . En la mayoría de los casos, los momentos de los números enteros son de interés.

Si tiene una distribución normal, entonces tiene momentos (finitos) para todos con parte real mayor que −1. Para enteros no negativos , los momentos centrales son:

Aquí  hay un número natural, y la notación significa el factorial doble del número, es decir (ya que es impar en este caso) el producto de todos los números impares del  1 al

Los momentos absolutos centrales para enteros no negativos son:

La última fórmula también es válida para arbitraria .

Transformada de Fourier y función característica

La transformada de Fourier de la densidad de probabilidad normal con desviación estándar media es [9] :

donde es la unidad imaginaria .

Si la expectativa entonces el primer factor es 1, y la transformada de Fourier, hasta una constante, es la densidad de probabilidad normal sobre intervalos de frecuencia, con expectativa igual a 0 y desviación estándar En particular, la distribución normal estándar es una función propia de Fourier transformar.

En la teoría de la probabilidad, la transformada de Fourier de la densidad de distribución de una variable aleatoria real está estrechamente relacionada con la función característica de esta variable, que se define como la expectativa matemática de una variable real y es función de ella (el parámetro de frecuencia de la variable aleatoria de Fourier). transformar). La definición se puede extender a una variable compleja [10] . La relación se escribe así:

Divisibilidad infinita

La distribución normal es infinitamente divisible .

Si las variables aleatorias y son independientes y tienen una distribución normal con media y varianza y respectivamente, entonces también tiene una distribución normal con media y varianza

Esto implica que una variable aleatoria normal puede representarse como la suma de un número arbitrario de variables aleatorias normales independientes.

Entropía máxima

La distribución normal tiene la entropía diferencial máxima entre todas las distribuciones continuas cuya varianza no excede un valor dado [11] [12] .

La regla de los tres sigma para una variable aleatoria gaussiana

La regla de tres sigma ( ) — casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo:

donde  son la esperanza matemática y el parámetro de una variable aleatoria normal.

Más precisamente, con una probabilidad aproximada de 0,9973, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado.

Simulación de variables pseudoaleatorias normales

En las simulaciones por computadora, especialmente cuando se aplica el método de Monte Carlo , es deseable utilizar cantidades distribuidas de acuerdo con la ley normal. Muchos algoritmos dan valores normales estándar, ya que el valor normal se puede obtener como:

donde Z es el valor normal estándar.

Los algoritmos también utilizan varias transformaciones de cantidades uniformes. Los métodos de modelado aproximado más simples se basan en el teorema del límite central . Si sumamos un número suficientemente grande de cantidades independientes distribuidas idénticamente con una varianza finita , entonces la suma tendrá una distribución cercana a la normal. Por ejemplo, si suma 100 variables aleatorias estándar independientes distribuidas uniformemente , la distribución de la suma será aproximadamente normal .

Para la generación programática de variables pseudoaleatorias normalmente distribuidas, es preferible utilizar la transformación de Box-Muller . Le permite generar un valor distribuido normalmente basado en uno distribuido uniformemente.

También existe el algoritmo Ziggurat , que es incluso más rápido que la transformada de Box-Muller. Sin embargo, es más difícil de implementar, pero su uso está justificado en los casos en que se requiere generar una gran cantidad de números aleatorios distribuidos de manera desigual.

Distribución normal en naturaleza y aplicaciones

La distribución normal se encuentra a menudo en la naturaleza. Por ejemplo, las siguientes variables aleatorias están bien modeladas por la distribución normal:

  • desviación durante el disparo;
  • errores de medición (sin embargo, los errores de algunos instrumentos de medición tienen una distribución diferente);
  • algunas características de los organismos vivos en una población.

Esta distribución está tan extendida porque es una distribución continua infinitamente divisible con varianza finita. Por lo tanto, algunos otros lo abordan en el límite, como el binomio y el de Poisson . Esta distribución modela muchos procesos físicos no deterministas [13] .

La distribución normal multivariante se utiliza en el estudio de variables aleatorias multivariantes (vectores aleatorios). Uno de los muchos ejemplos de tales aplicaciones es el estudio de los parámetros de la personalidad humana en psicología y psiquiatría .

Relación con otras distribuciones

  • La distribución normal es una distribución de Pearson tipo XI [14] .
  • El cociente de un par de variables aleatorias normalmente distribuidas estándar independientes tiene una distribución de Cauchy [15] . Es decir, si una variable aleatoria es una razón (donde y  son variables aleatorias normales estándar independientes), entonces tendrá una distribución de Cauchy.
  • Si  son variables aleatorias normales estándar conjuntamente independientes, es decir, entonces la variable aleatoria tiene una distribución chi-cuadrado con k  grados de libertad.
  • Si una variable aleatoria tiene una distribución lognormal , entonces su logaritmo natural tiene una distribución normal. Es decir, si entonces y viceversa, si entonces
  • Si son variables aleatorias independientes normalmente distribuidas con expectativas y varianzas matemáticas, entonces su media muestral es independiente de la desviación estándar muestral [16] , y el cociente de las siguientes dos variables tendrá una distribución t con grados de libertad:
  • Si las variables aleatorias normales estándar independientes, entonces la relación de sumas de cuadrados normalizadas tendrá una distribución de Fisher con ( ) grados de libertad [17] :

Historia

Por primera vez, la distribución normal como límite de la distribución binomial apareció en 1738 en la segunda edición de "La doctrina del azar" de De Moivre [18] . Esta fue la primera prueba de un caso especial del teorema del límite central . En 1809, Gauss, en La teoría del movimiento de los cuerpos celestes, introdujo esta distribución como resultado de mediciones repetidas del movimiento de los cuerpos celestes. Sin embargo, Gauss derivó una fórmula para variables aleatorias reales a partir del principio de maximizar la densidad conjunta de todas las medidas en un punto con coordenadas iguales al promedio de todas las medidas. Este principio ha sido posteriormente criticado. En 1812, Laplace en el teorema de Moivre-Laplace generalizó el resultado de Moivre para una distribución binomial arbitraria, es decir, para sumas de cantidades binarias independientes idénticamente distribuidas [3] .

Véase también

Notas

  1. Wentzel E. S. Teoría de la probabilidad. - 10ª ed., estereotipada.. - M. : Academia , 2005. - 576 p. — ISBN 5-7695-2311-5 .
  2. Shiryaev AN Probabilidad. — M .: Nauka, 1980.
  3. 1 2 Diccionario enciclopédico matemático . - M .: Enciclopedia soviética , 1988. - S.  139 -140.
  4. ^ Wasserman L. Todas las estadísticas . - Nueva York, NY: Springer, 2004. - Pág  . 142 . — 433 pág. — ISBN 978-1-4419-2322-6 .
  5. Prueba, véase Integral de Gauss
  6. Halperin, Hartley & Hoel, 1965 , artículo 7.
  7. MacPherson (1990 )
  8. Wolfram|Alpha: motor de conocimiento computacional . Wolframalpha.com . Recuperado: 3 de marzo de 2017.
  9. Bryc (1995 , pág. 23)
  10. Bryc (1995 , pág. 24)
  11. Portada, Thomas M.; Thomas, Joy A. Elementos de la teoría de la información. - John Wiley and Sons , 2006. - Pág. 254.
  12. Parque, Sung Y.; Bera, Anil K. Modelo de heteroscedasticidad condicional autorregresiva de máxima entropía  //  Journal of Econometrics : diario. - Elsevier, 2009. - Pág. 219-230 . Archivado desde el original el 7 de marzo de 2016.
  13. Taleb N. N. Cisne negro. Bajo el Signo de la Imprevisibilidad = El Cisne Negro: El Impacto de lo Altamente Improbable. - Colibrí, 2012. - 525 p. - ISBN 978-5-389-00573-0 .
  14. Korolyuk, 1985 , pág. 135.
  15. Galkin V. M., Erofeeva L. N., Leshcheva S. V. Estimaciones del parámetro de distribución de Cauchy // Actas de la Universidad Técnica Estatal de Nizhny Novgorod. R. E. Alekseeva . - 2014. - Nº 2 (104). - S. 314-319. - CDU  513.015.2 .
  16. Lukács, Eugene. Una caracterización de la distribución normal  //  The Annals of Mathematical Statistics : diario. - 1942. - vol. 13 , núm. 1 . - Pág. 91-3 . — ISSN 0003-4851 . -doi : 10.1214 / aoms/1177731647 . — .
  17. Lehmann, E. L. Prueba de hipótesis estadísticas . — 2do. — Springer, 1997. - S.  199 . — ISBN 978-0-387-94919-2 .
  18. La doctrina de las posibilidades; o, un método para calcular la probabilidad de eventos en juego, L., 1718, 1738, 1756; L., 1967 (edición reproducida); Miscellanea analitica de scriebus et quadraturis, L., 1730.

Literatura

  • Korolyuk V. S. , Portenko N. I. , Skorokhod A. V. , Turbin A. F. Manual de teoría de la probabilidad y estadística matemática. - M. : Nauka, 1985. - 640 p.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Estándares recomendados para símbolos y notación estadísticos. Comité COPSS sobre Símbolos y Notación  //  The American Statistician : diario. - 1965. - Vol. 19 , núm. 3 . - P. 12-14 . -doi : 10.2307/ 2681417 . — .
  • McPherson, Glen. Estadística en la Investigación Científica : su Base, Aplicación e Interpretación  . - Springer-Verlag , 1990. - ISBN 978-0-387-97137-7 .
  • Bryc, Wlodzimierz. La distribución normal: caracterizaciones con  aplicaciones . - Springer-Verlag , 1995. - ISBN 978-0-387-97990-8 .

Enlaces