Covarianza

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 13 de abril de 2022; las comprobaciones requieren 7 ediciones .

Covarianza o momento de correlación de variables aleatorias: en teoría de probabilidad y estadística matemática , una medida de la dependencia de dos variables aleatorias .

En teoría de probabilidad y estadística, la covarianza es una medida de la variabilidad conjunta de dos variables aleatorias. Si valores grandes de una variable corresponden en su mayoría a valores grandes de otra variable, y lo mismo ocurre con valores más pequeños (es decir, las variables tienden a mostrar el mismo comportamiento), la covarianza es positiva. caso contrario, cuando valores grandes de una variable corresponden en su mayoría a valores más pequeños de la otra (es decir, las variables tienden a mostrar un comportamiento opuesto), la covarianza es negativa. Así, el signo de la covarianza muestra la tendencia a una relación lineal entre variables. El valor de la covarianza no es fácil de interpretar porque no está normalizado y por tanto depende de los valores de las variables. Sin embargo, la versión normalizada de la covarianza, el coeficiente de correlación, por su valor muestra la fuerza de la relación lineal.

Definición

Sean  dos variables aleatorias definidas en el mismo espacio de probabilidad . Entonces su covarianza se define como sigue:

,

donde está la expectativa matemática (en la literatura en inglés, se acepta la designación ).

Se supone que todas las expectativas matemáticas del lado derecho de esta expresión están definidas.

Observaciones

Coeficiente de covarianza de la muestra

Sea una muestra de volumen ,  sea una muestra de volumen y son generadas por variables aleatorias definidas en el mismo espacio de probabilidad . Entonces el coeficiente de covarianza de la muestra es el valor promedio de los productos de desviaciones de valores de los valores promedio de las muestras correspondientes [1] :

,

donde las medias muestrales (también llamadas medias muestrales) están determinadas por las fórmulas:

,  .

Si abre los paréntesis y usa la fórmula para la media de la muestra, entonces:

.

Propiedades

En particular, la covarianza (a diferencia del coeficiente de correlación ) no es invariable bajo el cambio de escala, lo que no siempre es conveniente en las aplicaciones.

Coeficiente de correlación

Por el valor absoluto de la covarianza , no se puede juzgar qué tan fuertemente están interconectados los valores , ya que la escala de la covarianza depende de sus varianzas . El valor de la covarianza se puede normalizar dividiéndolo por el producto de las desviaciones estándar (raíces cuadradas de las varianzas) de variables aleatorias. El valor resultante se denomina coeficiente de correlación de Pearson , que siempre está en el rango de −1 a 1:

, donde  es la desviación estándar.

Respectivamente,

[2] .

Las variables aleatorias que tienen covarianza cero se llaman no correlacionadas . Las variables aleatorias independientes siempre no están correlacionadas. La afirmación contraria no siempre es cierta. Es válido para variables aleatorias normalmente distribuidas.

Véase también

Notas

  1. Melnikov R. M. Econometría. Tutorial
  2. Coeficiente de correlación . Consultado el 8 de diciembre de 2011. Archivado desde el original el 17 de diciembre de 2011.

Enlaces