Coeficiente de correlación múltiple : caracteriza la estrechez de la correlación lineal entre una variable aleatoria y algún conjunto de variables aleatorias. Más precisamente, si (ξ 1 ,ξ 2 ,...,ξ k ) es un vector aleatorio de R k , entonces el coeficiente de correlación múltiple entre ξ 1 y ξ 2 ,...,ξ k es numéricamente igual al par coeficiente de correlación lineal entre el valor ξ 1 y su mejor aproximación lineal en las variables ξ 2 ...,ξ k , que es una regresión lineal de ξ1 en ξ 2 ,..., ξ k .
El coeficiente de correlación múltiple tiene la propiedad de que, bajo la condición
cuando es una regresión de ξ 1 sobre ξ 2 ,...,ξ k ,
entre todas las combinaciones lineales de variables ξ 2 ,...,ξ k la variable ξ 1 tendrá el máximo coeficiente de correlación con ξ 1 * , coincidiendo con . En este sentido, el coeficiente de correlación múltiple es un caso especial del coeficiente de correlación canónico . En k = 2 , el coeficiente de correlación múltiple coincide en valor absoluto con el coeficiente de correlación lineal por parejas ρ 12 entre ξ 1 y ξ 2 .
El coeficiente de correlación múltiple se calcula utilizando la matriz de correlación según la fórmula
,
donde es el determinante de la matriz de correlación, y es el complemento algebraico del elemento ρ 11 = 1 ; aquí _ Si , entonces con probabilidad 1 los valores de ξ 1 coinciden con la combinación lineal ξ 2 ,...,ξ k , por lo tanto, la distribución conjunta ξ 1 ,ξ 2 ,...,ξ k se encuentra en un hiperplano en el espacio R k . Por otro lado, para todos los coeficientes de correlación de pares ρ 12 = ρ 13 = ... = ρ 1k = 0 son iguales a cero, por lo tanto, los valores de ξ 1 no se correlacionan con los valores de ξ 2 , ..., ξ k . Lo contrario también es cierto. El coeficiente de correlación múltiple también se puede calcular usando la fórmula
,
donde es la varianza de ξ 1 y es la varianza de ξ 1 relativa a la regresión.
El análogo muestral del coeficiente de correlación múltiple es el valor , donde y son estimaciones y se obtienen a partir de una muestra de tamaño n . La distribución de la estadística se utiliza para probar la hipótesis nula de no relación . Siempre que la muestra se tome de una distribución normal multivariante , el valor tendrá una distribución beta con parámetros si . Para el caso, se conoce el tipo de distribución , pero prácticamente no se utiliza por su engorroso.