Panel de datos

Los datos de panel [1] [2] o datos longitudinales [2] son ​​datos multidimensionales utilizados en ciencias sociales y econometría , obtenidos por una serie de mediciones u observaciones durante varios períodos de tiempo para las mismas empresas o personas. Un estudio que utiliza datos de panel se denomina estudio de panel .

Ejemplo

Panel equilibrado
Humano Año Ingreso Años Piso
Nº 1 2016 1300 27 una
Nº 1 2017 1600 28 una
Nº 1 2018 2000 29 una
Nº 2 2016 2000 38 2
Nº 2 2017 2300 39 2
Nº 2 2018 2400 40 2
panel desequilibrado
Humano Año Ingreso Años Piso
Nº 1 2016 1600 23 una
Nº 1 2017 1500 24 una
Nº 2 2016 mil novecientos 41 2
Nº 2 2017 2000 42 2
Nº 2 2018 2100 43 2
Numero 3 2017 3300 34 una

El siguiente ejemplo muestra dos conjuntos de datos recopilados en una estructura de panel. Las características individuales (ingresos, edad, género) se recopilan para diferentes personas y diferentes años. En el primer conjunto de datos, se realiza un seguimiento de dos personas (#1, #2) cada año durante tres años (2016, 2017, 2018). En el segundo conjunto de datos, tres personas (n.° 1, n.° 2, n.° 3) se ven dos veces (persona n.° 1), tres veces (persona n.° 2) y una vez (persona n.° 3), respectivamente, durante tres años (2016). , 2017 , 2018); en particular, no hay datos para 2018 para la persona #1, y para 2016 y 2018 para la persona #3.

Un panel balanceado [3] (primer ejemplo) es un conjunto de datos en el que se observa cada año a cada miembro de un grupo (es decir, una persona). Por lo tanto, si un panel balanceado contiene N unidades de observación y T períodos, el número de observaciones (n) en el conjunto de datos será necesariamente n = N × T [4] .

Un panel no balanceado [3] (el segundo conjunto de datos en el ejemplo) es un conjunto de datos en el que al menos un miembro del grupo no tiene datos para todos los períodos. Por lo tanto, si un panel no balanceado contiene N unidades de observación y T períodos, entonces el número de observaciones (n) en el conjunto de datos es estrictamente menor que su producto: n < N × T [4] .

Ambos conjuntos de datos están estructurados en un formato largo, donde una fila contiene una observación a la vez. Otra forma de estructurar los datos del panel es el formato ancho, donde una fila representa una unidad de observación para todos los puntos de tiempo [5] (por ejemplo, en el formato ancho habrá solo dos (primer ejemplo) o tres (segundo ejemplo) filas de datos, con columnas adicionales para cada variable de tiempo (ingresos, edad).

Notas

  1. Ratnikova T. A. Introducción al análisis económico de datos de panel  // Revista Económica de la Escuela Superior de Economía. - 2006. - Nº 2 . - S. 267-316 . Archivado desde el original el 21 de enero de 2022.
  2. ↑ 1 2 Denisova I. A. Salida de cohortes de mayor edad del mercado laboral: análisis por métodos de supervivencia // Población y Economía .. - 2017. - V. 1 , No. 1 . - S. 22-49 .
  3. 1 2 Green W. G. Econometric analysis / traducción del inglés, editado por S. S. Sinelnikov y M. Yu. Turuntseva. - Moscú: Editorial "Delo" RANEPA, 2016. - T. 1. - S. 423. - 760 p.
  4. 1 2 Panel Data Econometrics: Theory  (inglés) / editado por Tsionas M.. - Academic Press (un sello editorial de Elsevier), 2019. - P. 348. - 432 p.
  5. Andreß H.-J., Golsch K., Schmidt A.W. Análisis de datos de panel aplicado para encuestas económicas y sociales  . — Springer Science & Business Media, 2013. — P. 28. — 327 p.

Literatura