Coeficiente de correlación múltiple

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 23 de marzo de 2019; la verificación requiere 1 edición .

Coeficiente de correlación múltiple : caracteriza la estrechez de la correlación lineal entre una variable aleatoria y algún conjunto de variables aleatorias. Más precisamente, si (ξ 1 ,ξ 2 ,...,ξ k ) es un vector aleatorio de R k , entonces el coeficiente de correlación múltiple entre ξ 1 y ξ 2 ,...,ξ k es numéricamente igual al par coeficiente de correlación lineal entre el valor ξ 1 y su mejor aproximación lineal en las variables ξ 2 ...,ξ k , que es una regresión lineal de ξ1 en ξ 2 ,..., ξ k .

Propiedades

El coeficiente de correlación múltiple tiene la propiedad de que, bajo la condición

cuando es una regresión de ξ 1 sobre ξ 2 ,...,ξ k ,

entre todas las combinaciones lineales de variables ξ 2 ,...,ξ k la variable ξ 1 tendrá el máximo coeficiente de correlación con ξ 1 * , coincidiendo con . En este sentido, el coeficiente de correlación múltiple es un caso especial del coeficiente de correlación canónico . En k = 2 , el coeficiente de correlación múltiple coincide en valor absoluto con el coeficiente de correlación lineal por parejas ρ 12 entre ξ 1 y ξ 2 .

Cálculo

El coeficiente de correlación múltiple se calcula utilizando la matriz de correlación según la fórmula

,

donde es el determinante de la matriz de correlación, y es el complemento algebraico del elemento ρ 11 = 1 ; aquí _ Si , entonces con probabilidad 1 los valores de ξ 1 coinciden con la combinación lineal ξ 2 ,...,ξ k , por lo tanto, la distribución conjunta ξ 1 ,ξ 2 ,...,ξ k se encuentra en un hiperplano en el espacio R k . Por otro lado, para todos los coeficientes de correlación de pares ρ 12 = ρ 13 = ... = ρ 1k = 0 son iguales a cero, por lo tanto, los valores de ξ 1 no se correlacionan con los valores de ξ 2 , ..., ξ k . Lo contrario también es cierto. El coeficiente de correlación múltiple también se puede calcular usando la fórmula

,

donde es la varianza de ξ 1 y es la varianza de ξ 1 relativa a la regresión.

Ejemplo de coeficiente de correlación múltiple

El análogo muestral del coeficiente de correlación múltiple es el valor , donde y son estimaciones y se obtienen a partir de una muestra de tamaño n . La distribución de la estadística se utiliza para probar la hipótesis nula de no relación . Siempre que la muestra se tome de una distribución normal multivariante , el valor tendrá una distribución beta con parámetros si . Para el caso, se conoce el tipo de distribución , pero prácticamente no se utiliza por su engorroso.

Véase también

Literatura