Las regresiones aparentemente no relacionadas ( SUR) son un sistema de ecuaciones econométricas , cada una de las cuales es una ecuación independiente con sus propias variables exógenas dependientes y explicativas. El modelo fue propuesto por Zelner en 1968. Una característica importante de estas ecuaciones es que, a pesar de la aparente falta de relación de las ecuaciones, se supone que sus errores aleatorios están correlacionados entre sí.
Sean m ecuaciones lineales econométricas , cada una de las cuales puede escribirse en forma matricial como sigue:
Se supone que el error aleatorio de cada ecuación satisface los supuestos clásicos sobre la ausencia de heterocedasticidad y autocorrelación , es decir, la matriz de covarianza del vector de errores aleatorios de cada ecuación tiene la forma: . Sin embargo, puede haber una correlación de errores aleatorios entre ecuaciones (en la misma observación). Además, las varianzas de los errores aleatorios en diferentes ecuaciones, en términos generales, no son las mismas. Denotemos las covarianzas entre errores aleatorios en diferentes ecuaciones . Entonces para cada observación el vector de errores aleatorios de las ecuaciones tiene una matriz de covarianza .
Introduzcamos la notación
Luego, el modelo se puede representar de la siguiente forma, similar a la regresión lineal habitual:
La matriz de covarianza del vector de error aleatorio de dicho modelo tendrá forma de bloque, cada uno de los cuales es igual a . Esto se puede simplificar en términos de una matriz utilizando el producto de Kronecker :
Dado que cada ecuación por supuesto satisface los supuestos clásicos, se puede utilizar el método habitual de mínimos cuadrados para estimar sus parámetros. Sin embargo, este enfoque no tiene en cuenta información adicional sobre las correlaciones entre ecuaciones. Se pueden obtener estimaciones más eficientes usando el método de mínimos cuadrados generalizados :
Sin embargo, el problema de aplicar el LSM generalizado, como es sabido, es la matriz de errores de covarianza desconocida, en este caso, la matriz . Por lo tanto, se utiliza el siguiente procedimiento de mínimos cuadrados generalizados accesibles (FGLS) de dos pasos. En el primer paso, se aplica el LSM habitual y se encuentran los restos de las ecuaciones. Con base en estos residuos, se estima la matriz : y luego se aplica el LSM generalizado. Teóricamente, el procedimiento se puede continuar iterativamente utilizando los residuos recién obtenidos para volver a evaluar la matriz de covarianza y aplicar los mínimos cuadrados generalizados.
Las estimaciones así obtenidas son consistentes y asintóticamente normales. Obviamente, si la matriz es diagonal, es decir, cuando los errores aleatorios de diferentes ecuaciones no se correlacionan entre sí, dichas estimaciones coincidirán con las estimaciones de los mínimos cuadrados habituales. Lo mismo es cierto cuando todas las ecuaciones contienen el mismo conjunto de variables, es decir, .
Además de estos enfoques básicos, también es posible utilizar el método de máxima verosimilitud bajo el supuesto de una distribución normal de errores aleatorios.