Distribución normal | |
---|---|
La línea verde corresponde a la distribución normal estándar | |
Los colores de esta tabla coinciden con la tabla anterior. | |
Designacion | |
Opciones |
μ - factor de desplazamiento ( real ) σ > 0 - factor de escala (real, estrictamente positivo) |
Transportador | |
Densidad de probabilidad | |
función de distribución | |
Valor esperado | |
Mediana | |
Moda | |
Dispersión | |
Coeficiente de asimetría | |
Coeficiente de curtosis | |
entropía diferencial | |
Función generadora de momentos | |
función característica |
La distribución normal [1] [2] , también llamada distribución gaussiana o de Gauss - Laplace [3] es una distribución de probabilidad , que en el caso unidimensional viene dada por una función de densidad de probabilidad , coincidente con la función gaussiana :
, donde el parámetro es la expectativa matemática (valor medio), la mediana y la moda de distribución, y el parámetro es la desviación estándar , es la varianza de distribución .Por lo tanto, la distribución normal unidimensional es una familia de distribuciones de dos parámetros que pertenece a la clase exponencial de distribuciones [4] . El caso multivariante se describe en el artículo " Distribución normal multivariante ".
La distribución normal estándar es una distribución normal con media y desviación estándar
Si una cantidad es la suma de muchas cantidades aleatorias débilmente interdependientes, cada una de las cuales hace una pequeña contribución relativa a la suma total, entonces la distribución centrada y normalizada de tal cantidad tiende a una distribución normal con un número suficientemente grande de términos .
Esto se deriva del teorema del límite central de la teoría de la probabilidad . En el mundo que nos rodea, a menudo hay cantidades cuyo valor está determinado por una combinación de muchos factores independientes. Este hecho, así como el hecho de que la distribución fuera considerada típica, ordinaria, hizo que a finales del siglo XIX se comenzara a utilizar el término “distribución normal”. La distribución normal juega un papel destacado en muchos campos de la ciencia, como la estadística matemática y la física estadística .
Una variable aleatoria que tiene una distribución normal se denomina variable aleatoria normal o gaussiana.
El caso más simple de una distribución normal, la distribución normal estándar , es un caso especial cuando y Su densidad de probabilidad es:
El factor en la expresión proporciona la condición para la normalización de la integral [5] . Como el factor en el exponente proporciona una dispersión igual a uno, entonces la desviación estándar es igual a 1. La función es simétrica en el punto , su valor en él es máximo e igual a los puntos de Inflexión de la función: y
Gauss llamó a la distribución normal estándar con eso es:
Cada distribución normal es una variante de la distribución normal estándar cuyo rango se extiende por un factor (desviación estándar) y se traslada a (expectativa):
son parámetros de la distribución normal. La densidad de probabilidad debe normalizarse para que la integral sea igual a 1.
Si es una variable aleatoria normal estándar, entonces el valor tendrá una distribución normal con expectativa matemática y desviación estándar , por el contrario, si es una variable normal con parámetros entonces tendrá una distribución normal estándar.
Si abrimos los paréntesis en el exponente de densidad de probabilidad y tenemos en cuenta que , entonces:
Así, la densidad de probabilidad de cada distribución normal es el exponente de una función cuadrática :
dóndeA partir de aquí, se puede expresar la media como a y la varianza como Para la distribución normal estándar y
La densidad de probabilidad de la distribución normal estándar (con media cero y varianza unitaria) a menudo se denota con la letra griega ( phi ) [6] . También se usa con bastante frecuencia una forma alternativa de la letra griega phi .
La distribución normal a menudo se denota por o [7] . Si la variable aleatoria se distribuye de acuerdo a la ley normal con media y variación, entonces escribimos:
La función de distribución de la distribución normal estándar generalmente se denota con una letra griega mayúscula ( phi ) y es una integral:
La función de error (integral de probabilidad) está asociada a ella, dando la probabilidad de que una variable aleatoria normal con media 0 y variación 1/2 caiga en el segmento :
Estas integrales no se expresan en funciones elementales y se denominan funciones especiales . Muchas de sus aproximaciones numéricas son conocidas. Véase más abajo .
Las funciones están relacionadas, en particular, por la relación:
.Una distribución normal con densidad media y varianza tiene la siguiente función de distribución:
Puede usar la función : le dará la probabilidad de que el valor de la variable aleatoria normal estándar exceda :
.La gráfica de la función de distribución normal estándar tiene una simetría rotacional doble sobre el punto (0; 1/2), es decir, su integral indefinida es:
La función de distribución de una variable aleatoria normal estándar se puede expandir utilizando el método de integración por partes en una serie:
donde el signo significa doble factorial .
La expansión asintótica de la función de distribución para valores grandes también se puede realizar integrando por partes.
Desviación estándarAlrededor del 68% de los valores de la distribución normal están a una distancia de no más de una desviación estándar σ de la media; alrededor del 95% de los valores se encuentran a una distancia de no más de dos desviaciones estándar; y el 99,7% no más de tres. Este hecho es un caso especial de la regla 3 sigma para una muestra normal.
Más precisamente, la probabilidad de obtener un número normal entre y es:
Con una precisión de 12 dígitos significativos, los valores de se dan en la tabla [8] :
OEIS | |||||
---|---|---|---|---|---|
una | 0.682689492137 | 0.317310507863 |
|
A178647 | |
2 | 0.954499736104 | 0.045500263896 |
|
A110894 | |
3 | 0.997300203937 | 0.002699796063 |
|
A270712 | |
cuatro | 0.999936657516 | 0.000063342484 |
| ||
5 | 0.999999426697 | 0.000000573303 |
| ||
6 | 0.999999998027 | 0.000000001973 |
|
Los momentos y los momentos absolutos de una variable aleatoria se denominan expectativas matemáticas de las variables aleatorias y, respectivamente. Si la esperanza matemática es una variable aleatoria , estos parámetros se denominan momentos centrales . En la mayoría de los casos, los momentos de los números enteros son de interés.
Si tiene una distribución normal, entonces tiene momentos (finitos) para todos con parte real mayor que −1. Para enteros no negativos , los momentos centrales son:
Aquí hay un número natural, y la notación significa el factorial doble del número, es decir (ya que es impar en este caso) el producto de todos los números impares del 1 al
Los momentos absolutos centrales para enteros no negativos son:
La última fórmula también es válida para arbitraria .
La transformada de Fourier de la densidad de probabilidad normal con desviación estándar media es [9] :
donde es la unidad imaginaria .Si la expectativa entonces el primer factor es 1, y la transformada de Fourier, hasta una constante, es la densidad de probabilidad normal sobre intervalos de frecuencia, con expectativa igual a 0 y desviación estándar En particular, la distribución normal estándar es una función propia de Fourier transformar.
En la teoría de la probabilidad, la transformada de Fourier de la densidad de distribución de una variable aleatoria real está estrechamente relacionada con la función característica de esta variable, que se define como la expectativa matemática de una variable real y es función de ella (el parámetro de frecuencia de la variable aleatoria de Fourier). transformar). La definición se puede extender a una variable compleja [10] . La relación se escribe así:
La distribución normal es infinitamente divisible .
Si las variables aleatorias y son independientes y tienen una distribución normal con media y varianza y respectivamente, entonces también tiene una distribución normal con media y varianza
Esto implica que una variable aleatoria normal puede representarse como la suma de un número arbitrario de variables aleatorias normales independientes.
La distribución normal tiene la entropía diferencial máxima entre todas las distribuciones continuas cuya varianza no excede un valor dado [11] [12] .
La regla de tres sigma ( ) — casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo:
donde son la esperanza matemática y el parámetro de una variable aleatoria normal.Más precisamente, con una probabilidad aproximada de 0,9973, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado.
En las simulaciones por computadora, especialmente cuando se aplica el método de Monte Carlo , es deseable utilizar cantidades distribuidas de acuerdo con la ley normal. Muchos algoritmos dan valores normales estándar, ya que el valor normal se puede obtener como:
donde Z es el valor normal estándar.Los algoritmos también utilizan varias transformaciones de cantidades uniformes. Los métodos de modelado aproximado más simples se basan en el teorema del límite central . Si sumamos un número suficientemente grande de cantidades independientes distribuidas idénticamente con una varianza finita , entonces la suma tendrá una distribución cercana a la normal. Por ejemplo, si suma 100 variables aleatorias estándar independientes distribuidas uniformemente , la distribución de la suma será aproximadamente normal .
Para la generación programática de variables pseudoaleatorias normalmente distribuidas, es preferible utilizar la transformación de Box-Muller . Le permite generar un valor distribuido normalmente basado en uno distribuido uniformemente.
También existe el algoritmo Ziggurat , que es incluso más rápido que la transformada de Box-Muller. Sin embargo, es más difícil de implementar, pero su uso está justificado en los casos en que se requiere generar una gran cantidad de números aleatorios distribuidos de manera desigual.
La distribución normal se encuentra a menudo en la naturaleza. Por ejemplo, las siguientes variables aleatorias están bien modeladas por la distribución normal:
Esta distribución está tan extendida porque es una distribución continua infinitamente divisible con varianza finita. Por lo tanto, algunos otros lo abordan en el límite, como el binomio y el de Poisson . Esta distribución modela muchos procesos físicos no deterministas [13] .
La distribución normal multivariante se utiliza en el estudio de variables aleatorias multivariantes (vectores aleatorios). Uno de los muchos ejemplos de tales aplicaciones es el estudio de los parámetros de la personalidad humana en psicología y psiquiatría .
Por primera vez, la distribución normal como límite de la distribución binomial apareció en 1738 en la segunda edición de "La doctrina del azar" de De Moivre [18] . Esta fue la primera prueba de un caso especial del teorema del límite central . En 1809, Gauss, en La teoría del movimiento de los cuerpos celestes, introdujo esta distribución como resultado de mediciones repetidas del movimiento de los cuerpos celestes. Sin embargo, Gauss derivó una fórmula para variables aleatorias reales a partir del principio de maximizar la densidad conjunta de todas las medidas en un punto con coordenadas iguales al promedio de todas las medidas. Este principio ha sido posteriormente criticado. En 1812, Laplace en el teorema de Moivre-Laplace generalizó el resultado de Moivre para una distribución binomial arbitraria, es decir, para sumas de cantidades binarias independientes idénticamente distribuidas [3] .
diccionarios y enciclopedias | |
---|---|
En catálogos bibliográficos |
|
Distribuciones de probabilidad | |
---|---|
Discreto | |
Absolutamente continuo |