El método de las variables instrumentales (IP, IV - Variables instrumentales) es un método para estimar los parámetros de los modelos de regresión , basado en el uso de variables instrumentales adicionales que no participan en el modelo . El método se utiliza cuando los factores del modelo de regresión no satisfacen la condición exógena , es decir, son dependientes con errores aleatorios. En este caso, las estimaciones de mínimos cuadrados son sesgadas e inconsistentes .
Al parecer, el método de las variables instrumentales fue formulado por primera vez por Wright (Wright) en 1928 como un método para estimar las curvas de oferta y demanda . El término "variables del instrumento" en sí mismo se utilizó por primera vez en un artículo de 1941 de Riersol cuando se discutían los errores en las variables. Además, el método fue desarrollado en los trabajos de Durbin (1954), Sargan (1958) y otros En el contexto de sistemas de ecuaciones simultáneas, el método fue desarrollado en paralelo bajo el nombre de "método de mínimos cuadrados en dos pasos" (LSM )".
Sea un modelo de regresión lineal
Estimador OLS estándar
donde _
Esta estimación es obviamente consistente si converge en probabilidad a alguna matriz no singular y converge en probabilidad al vector cero. La segunda condición se cumple si los factores y los errores aleatorios no están correlacionados.
Si los factores y los errores aleatorios están correlacionados, entonces no se cumple la segunda condición y, por lo tanto, las estimaciones de MCO no son consistentes. Es decir, incluso con un gran número de observaciones, las estimaciones pueden no acercarse a los valores reales.
Sea Z factores no correlacionados con errores aleatorios, cuyo número es igual al número de factores iniciales. Estas variables se denominan variables instrumentales . Entre ellas pueden encontrarse tanto variables "puramente" instrumentales (ausentes en el modelo) como variables del modelo (se supone que estas últimas son exógenas). Entonces la estimación del método de variables instrumentales es la estimación de la siguiente forma:
Si la matriz converge en probabilidad a un vector no degenerado ya un vector cero, entonces la estimación del método IP es consistente.
Para el modelo IP, la estimación del coeficiente b es igual a
A pesar de la consistencia, en el caso general, las estimaciones de PI son sesgadas e ineficientes. Las estimaciones de PI son mejores cuanto más fuertes están las variables instrumentales correlacionadas con los factores originales del modelo (mientras permanecen sin correlación con los errores aleatorios). La elección de variables instrumentales es un problema separado bastante complicado. No hay recomendaciones estrictas sobre la elección de las herramientas.
Se puede demostrar que la estimación del método IP se puede reducir a un procedimiento de dos pasos: primero, los mínimos cuadrados ordinarios necesitan estimar la dependencia de los factores de entrada en las herramientas y usar las estimaciones obtenidas de los factores en lugar de los factores mismos. para estimar los parámetros del modelo original. Este es el llamado MNC de dos pasos.
Como variables instrumentales, se pueden elegir estimaciones de MCO de la regresión de factores sobre algunas otras variables Z, cuyo número no sea menor que el número de factores iniciales. Es decir, en la primera etapa, es necesario evaluar la regresión por mínimos cuadrados convencionales:
.
Entonces la matriz de variables instrumentales en este caso será igual a
En la segunda etapa, aplicamos el método de las variables instrumentales con los instrumentos resultantes :
Si la matriz de covarianza de errores aleatorios del modelo es proporcional a la unidad , entonces la matriz de covarianza de estas estimaciones es igual a
Si el número de herramientas z es el mismo que el número de variables originales (el caso de identificación exacta ), entonces las matrices son cuadradas. Como consecuencia
Es decir, obtenemos la fórmula clásica del método de las variables instrumentales. Por lo tanto, a pesar de que este método se deriva como un caso especial, puede considerarse una generalización del método IP clásico. Este es el llamado método generalizado de variables instrumentales (GIVE - Generalized Instrumental Variables Estimator) .
Se puede demostrar que si en la segunda etapa no aplicamos el método de variables instrumentales, sino el método habitual de mínimos cuadrados, obtendremos exactamente la misma fórmula, ya que
Como consecuencia
Así, el método generalizado de variables instrumentales es equivalente al método de mínimos cuadrados en dos pasos ( DMNC, TSLS, 2SLS - Two-Stage Least Squares ).