Cointegración

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 22 de julio de 2019; las comprobaciones requieren 10 ediciones .

La cointegración es una propiedad de varias series temporales no estacionarias ( integradas ) , que consiste en la existencia de alguna de sus combinaciones lineales estacionarias . El concepto de cointegración fue propuesto por primera vez por Granger en 1981. En el futuro, esta dirección fue desarrollada por Angle , Johansen, Philips y otros.

La cointegración es una propiedad importante de muchas variables económicas, lo que significa que a pesar de la naturaleza aleatoria (poco predecible) del cambio en las variables económicas individuales, existe una relación a largo plazo entre ellas, lo que conduce a algún cambio conjunto e interconectado. De hecho, estamos hablando de un modelo de corrección de errores (ECM - Error Correction Model), cuando los cambios a corto plazo se corrigen según el grado de desviación de la relación a largo plazo entre las variables. Este comportamiento es inherente a las series temporales cointegradas.

Definiciones

Cointegración. Ecuación de cointegración

Definicion formal. Sea un conjunto de series de tiempo, cada una de las cuales es un proceso integrado de primer orden . Se dice que estas series de tiempo están cointegradas si existe un vector tal que la serie de tiempo sea un proceso estacionario, es decir, . El vector se llama vector cointegrante . Obviamente , la multiplicación de un vector cointegrante por un número arbitrario no cambia la naturaleza cointegrante de este vector (dado que la multiplicación por un número arbitrario no cambia la estacionariedad del proceso). Por lo tanto, el vector de cointegración se puede parametrizar de la siguiente manera . En este caso, obtenemos la ecuación de cointegración (CE) : $y_{t}=(y_{{1t}},y_{{2t}},...,y_{{kt}})^{T}$ $y_{{it}}\sim I(1)$ $a=(a_{1},a_{2},...,a_{k})^{T}$ $\varepsilon _{t}=a^{T}y_{t}=\sum _{{i=1}}^{k}a_{i}y_{{it}}$ $\varepsilon _{t}\sim I(0)$ $a$ $a=(1,-a_{2},-a_{3},...,-a_{k})^{T}$

$y_{{1t}}=\sum _{{i=2}}^{k}a_{i}y_{{it}}+\varepsilon _{t}~,~~~\varepsilon _{t}$ -proceso estacionario

La ecuación de cointegración de series no estacionarias es análoga al modelo de regresión de series estacionarias.

espacio de cointegración. Rango de cointegración

También es obvio que si hay varios vectores cointegrantes, entonces una combinación lineal arbitraria de estos vectores también será un vector cointegrante (ya que una combinación lineal de series estacionarias también es una serie estacionaria). En consecuencia, se habla del espacio de vectores cointegrantes - el espacio cointegrante . La dimensión de este espacio se denomina rango de cointegración . El rango de cointegración es en realidad el número máximo de vectores de cointegración o ecuaciones de cointegración linealmente independientes . Si el rango de cointegración es igual al número de series de tiempo, entonces estas series de tiempo son estacionarias. Un rango de cointegración cero significa que no hay cointegración.

Si las series de tiempo están cointegradas, entonces para tales series la ecuación de cointegración se puede estimar mediante el método habitual de mínimos cuadrados. En este caso, no solo se obtienen estimaciones consistentes (como en el caso de la regresión clásica), sino estimaciones súper consistentes de los parámetros del modelo (una tasa de convergencia al valor real significativamente mayor con un aumento en el tamaño de la muestra). En ausencia de cointegración, la construcción de modelos de regresión de series temporales no estacionarias (integradas) entre sí puede conducir a una regresión falsa . Esto se debe a que en el caso general (cuando no hay cointegración) un error aleatorio en un modelo de regresión similar a la ecuación de cointegración no es un proceso estacionario. Esto significa que las estimaciones resultantes de los parámetros de dichos modelos, así como las estimaciones de las características estadísticas de estas estimaciones de los parámetros de los modelos, pueden ser sesgadas, inconsistentes e ineficientes. Por lo tanto, según las estadísticas de la muestra, se puede hacer una suposición incorrecta sobre la presencia de una conexión cuando, de hecho, no la hay.

Generalización

El concepto de cointegración admite la siguiente generalización. Sean series de tiempo, cada una de las cuales es un proceso integrado de orden p, es decir, . Entonces estas series de tiempo se llaman cointegradas de orden p, q (escrito ) si existe un vector distinto de cero tal que la combinación lineal es un proceso . La definición clásica de cointegración es un caso especial para , es decir . $y_{t}^{i},i=1..k$ $y_{t}^{i}\sim I(p)$ $y_{t}\sim CI(p,q)$ $a$ $a^{T}y$ $I(pq),~0<q\leqslant p$ ${\ estilo de visualización p = q = 1}$ ${\ estilo de visualización CI (1,1)}$

Prueba de Angle-Granger

La prueba se basa en una ecuación de cointegración estimada utilizando el método habitual de mínimos cuadrados . La idea de la prueba es que si los residuos de este modelo no son estacionarios (tienen raíz unitaria ), entonces no hay cointegración de series de tiempo. La hipótesis nula es la ausencia de cointegración, es decir, la presencia de una raíz unitaria en los errores del modelo (ecuación de cointegración). Para probar la hipótesis de raíz unitaria se utilizan los estadísticos de la prueba ampliada de Dickey-Fuler , sin embargo, a diferencia del caso clásico de esta prueba, en este caso los valores críticos de los estadísticos son diferentes, son mayores en valor absoluto . Los valores críticos son obtenidos por McKinnon y Davidson a través de simulación . Los valores estadísticos críticos asintóticos (tamaño de muestra infinito) del 1% se dan a continuación como ejemplo.

Tipo de modelo\Número de variables	2	3	cuatro	5	6
Modelo con una constante	-3.90	-4.29	-4.64	-4.96	-5.25
Modelo con constante y tendencia	-4.32	-4.66	-4.97	-5.25	-5.52

El enfoque de Johansen

Para ecuaciones simples, la prueba de integración consiste en verificar la igualdad de la presencia de raíces unitarias en la autorregresión correspondiente. En el caso de la cointegración, la autorregresión vectorial puede desempeñar un papel similar . En general, el procedimiento para probar la cointegración es el siguiente. Se considera el modelo vectorial de autorregresión VAR(p)

$y_{t}=\sum_{{i=1}}^{p}A_{i}y_{{ti}}+Bx_{t}+\varepsilon_{t}$

Este modelo se puede representar como un modelo vectorial de corrección de errores (VEC, Vector Error Correction)

$\vartriangle y_{t}=\Pi y_{{t-1}}+\sum _{{j=1}}^{{p-1}}\Gamma _{j}\vartriangle y_{{tj}} +Bx_{t}+\varepsilon _{t}~,~\Pi =\sum _{{i=1}}^{p}A_{i}-I~,~\Gamma _{j}=-\ suma _{{i=j+1}}^{p}A_{i}$

Haciendo abstracción de las variables exógenas x , esta representación muestra que si las primeras diferencias de la serie son estacionarias por suposición, entonces - también debe ser estacionaria. Según el teorema de representación de Granger, si el rango de cointegración es menor que el número de variables, la matriz P se puede representar como un producto de dos matrices , donde la segunda matriz es la matriz de vectores cointegrantes. El rango de la matriz determina el rango de cointegración. Johansen demostró que el problema de encontrar los parámetros es equivalente al problema de encontrar los vectores propios de una determinada matriz. Para probar el rango de cointegración, se utiliza la prueba de razón de verosimilitud, cuya estadística en este caso se reduce a una función de los valores propios de esta matriz. La hipótesis nula es asumir que el rango de cointegración es igual al valor dado de r. La hipótesis alternativa en el enfoque de Johansen es que el rango de cointegración es mayor que el dado. La estadística LR correspondiente es ( estadística de seguimiento ) $y_{t}$ $\Pi y_{{t-1}}$ $\alfa \beta ^{T}$ $\Pi$ $\beta$

$LR_{r}^{{tr}}=n\sum_{{i=r+1}}^{p}\ln(1-\lambda_{i})$

donde -i-ésimo valor propio más grande de una determinada matriz. $\lambda _{i}$

El procedimiento secuencial de Johansen es comenzar a probar la hipótesis desde el rango 0 hasta el rango k-1. Si la hipótesis no se rechaza para el rango 0, entonces el rango se considera cero (sin cointegración). Y así sucesivamente hasta k-1. En este último caso, la hipótesis alternativa es que las series originales son estacionarias.

También es posible probar la hipótesis nula contra la alternativa de que el rango es uno más que la hipótesis nula. En este caso, se aplica la estadística del valor propio máximo

$LR_{r}^{{máx}}=n\ln(1-\lambda _{{r+1}})$

La distribución del estadístico LR depende de la presencia de tendencias deterministas en los datos y en la ecuación de cointegración. Por lo tanto, debe probar varias opciones: no hay tendencias deterministas en los datos (en CE no se incluye una constante y una tendencia, o solo se incluye una constante), los datos tienen una tendencia determinista lineal (en CE una constante sin una tendencia o una constante y una tendencia), los datos tienen una tendencia cuadrática (en CE se incluyen una constante y una tendencia lineal).

Véase también

Prueba de Granger de causalidad

Literatura

Magnus Ya.R., Katyshev P.K., Peresetsky A.A. Econometría. Curso inicial. - M. : Delo, 2007. - 504 p. - ISBN 978-5-7749-0473-0 .
V.P. de Nosko Econometría. Introducción al análisis de regresión de series temporales . - M. , 2002. - 273 p.

diccionarios y enciclopedias	Gran danés Britannica (en línea)
En catálogos bibliográficos	BNF : 125567779 TIERRA : 4347470-6 J9U : 987007561289705171 LCCN : sh95008552