Coeficiente de correlación múltiple

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 23 de marzo de 2019; la verificación requiere 1 edición .

Coeficiente de correlación múltiple : caracteriza la estrechez de la correlación lineal entre una variable aleatoria y algún conjunto de variables aleatorias. Más precisamente, si (ξ 1 ,ξ 2 ,...,ξ k ) es un vector aleatorio de R k , entonces el coeficiente de correlación múltiple entre ξ 1 y ξ 2 ,...,ξ k es numéricamente igual al par coeficiente de correlación lineal entre el valor ξ 1 y su mejor aproximación lineal en las variables ξ 2 ...,ξ k , que es una regresión lineal de ξ ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}}}$ ${\ estilo de visualización METRO (\ xi _ {1} | \ xi _ {2}, \ ldots, \ xi _ {k})}$ 1 en ξ 2 ,..., ξ k .

Propiedades

El coeficiente de correlación múltiple tiene la propiedad de que, bajo la condición

$M\xi _{1}=M\xi _{2}=\ldots =M\xi _{k}=0$ cuando es una regresión de ξ 1 sobre ξ 2 ,...,ξ k , $\xi _{1}^{*}=\beta _{2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\ xi _{k}$

entre todas las combinaciones lineales de variables ξ 2 ,...,ξ k la variable ξ 1 tendrá el máximo coeficiente de correlación con ξ 1 * , coincidiendo con . En este sentido, el coeficiente de correlación múltiple es un caso especial del coeficiente de correlación canónico . En k = 2 , el coeficiente de correlación múltiple coincide en valor absoluto con el coeficiente de correlación lineal por parejas ρ 12 entre ξ 1 y ξ 2 . ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}}}$

Cálculo

El coeficiente de correlación múltiple se calcula utilizando la matriz de correlación según la fórmula $\mathbf {R} =\left\{\rho _{i,j}\right\},i,j=1,\ldots,k$

$\rho _{\xi _{1}\bullet \xi _{2},\ldots,\xi _{k))^{2}=1-{\frac {\left\vert R\right \vert }{R_{11}}}$ ,

donde es el determinante de la matriz de correlación, y es el complemento algebraico del elemento ρ 11 = 1 ; aquí _ Si , entonces con probabilidad 1 los valores de ξ 1 coinciden con la combinación lineal ξ 2 ,...,ξ k , por lo tanto, la distribución conjunta ξ 1 ,ξ 2 ,...,ξ k se encuentra en un hiperplano en el espacio R k . Por otro lado, para todos los coeficientes de correlación de pares ρ 12 = ρ 13 = ... = ρ 1k = 0 son iguales a cero, por lo tanto, los valores de ξ 1 no se correlacionan con los valores de ξ 2 , ..., ξ k . Lo contrario también es cierto. El coeficiente de correlación múltiple también se puede calcular usando la fórmula ${\ estilo de visualización \ izquierda \ vert R \ derecha \ vert}$ ${\ estilo de visualización R_ {11}}$ $0\leqslant \rho_{\xi_{1}\bullet \xi_{2},\ldots,\xi_{k))\leqslant 1$ ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}} = 1}$ ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}} = 0}$

$\rho_{\xi_{1}\bullet \xi_{2},\ldots,\xi_{k))^{2}=1-{\frac {\sigma_{\xi _ {1}\bullet \xi _{2},\ldots,\xi _{k}}^{2}}{\sigma _{1}^{2}}}$ ,

donde es la varianza de ξ 1 y es la varianza de ξ 1 relativa a la regresión. $\sigma _{1}^{2}$ ${\ Displaystyle \ sigma _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}} ^ {2} = M (\ xi _ {1} - (\ beta _ {2}\xi _{2}+\beta _{3}\xi _{3}+\cdots +\beta _{k}\xi _{k}))^{2}}$

Ejemplo de coeficiente de correlación múltiple

El análogo muestral del coeficiente de correlación múltiple es el valor , donde y son estimaciones y se obtienen a partir de una muestra de tamaño n . La distribución de la estadística se utiliza para probar la hipótesis nula de no relación . Siempre que la muestra se tome de una distribución normal multivariante , el valor tendrá una distribución beta con parámetros si . Para el caso, se conoce el tipo de distribución , pero prácticamente no se utiliza por su engorroso. $r_{1\bullet 2,\ldots,k}={\sqrt {1-{\frac {s_{1\bullet 2,\ldots,k}^{2}}{s_{1}^{ 2}}}}}$ $s_{1\bullet 2,\ldots,k}^{2}$ ${\ estilo de visualización s_ {1} ^ {2}}$ ${\ estilo de visualización \ sigma _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}}^ {2}}$ $\sigma _{1}^{2}$ ${\displaystyle r_{1\bullet 2,\ldots,k))$ ${\displaystyle r_{1\bullet 2,\ldots,k}^{2))$ ${\frac {k-1}{2)),{\frac {nk}{2))$ ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}} = 0}$ ${\ estilo de visualización \ rho _ {\ xi _ {1} \ bala \ xi _ {2}, \ ldots, \ xi _ {k}} \ neq 0}$ ${\displaystyle r_{1\bullet 2,\ldots,k}^{2))$

Véase también

Coeficiente de determinación

Literatura

Kramer G. Métodos matemáticos de estadística, trad. del inglés, 2ª ed., M., 1975;
Kendall M., Steward A. , Inferencia estadística y relaciones, trad. de Inglés, M., 1973.