Los datos de panel [1] [2] o datos longitudinales [2] son datos multidimensionales utilizados en ciencias sociales y econometría , obtenidos por una serie de mediciones u observaciones durante varios períodos de tiempo para las mismas empresas o personas. Un estudio que utiliza datos de panel se denomina estudio de panel .
Humano | Año | Ingreso | Años | Piso |
---|---|---|---|---|
Nº 1 | 2016 | 1300 | 27 | una |
Nº 1 | 2017 | 1600 | 28 | una |
Nº 1 | 2018 | 2000 | 29 | una |
Nº 2 | 2016 | 2000 | 38 | 2 |
Nº 2 | 2017 | 2300 | 39 | 2 |
Nº 2 | 2018 | 2400 | 40 | 2 |
Humano | Año | Ingreso | Años | Piso |
---|---|---|---|---|
Nº 1 | 2016 | 1600 | 23 | una |
Nº 1 | 2017 | 1500 | 24 | una |
Nº 2 | 2016 | mil novecientos | 41 | 2 |
Nº 2 | 2017 | 2000 | 42 | 2 |
Nº 2 | 2018 | 2100 | 43 | 2 |
Numero 3 | 2017 | 3300 | 34 | una |
El siguiente ejemplo muestra dos conjuntos de datos recopilados en una estructura de panel. Las características individuales (ingresos, edad, género) se recopilan para diferentes personas y diferentes años. En el primer conjunto de datos, se realiza un seguimiento de dos personas (#1, #2) cada año durante tres años (2016, 2017, 2018). En el segundo conjunto de datos, tres personas (n.° 1, n.° 2, n.° 3) se ven dos veces (persona n.° 1), tres veces (persona n.° 2) y una vez (persona n.° 3), respectivamente, durante tres años (2016). , 2017 , 2018); en particular, no hay datos para 2018 para la persona #1, y para 2016 y 2018 para la persona #3.
Un panel balanceado [3] (primer ejemplo) es un conjunto de datos en el que se observa cada año a cada miembro de un grupo (es decir, una persona). Por lo tanto, si un panel balanceado contiene N unidades de observación y T períodos, el número de observaciones (n) en el conjunto de datos será necesariamente n = N × T [4] .
Un panel no balanceado [3] (el segundo conjunto de datos en el ejemplo) es un conjunto de datos en el que al menos un miembro del grupo no tiene datos para todos los períodos. Por lo tanto, si un panel no balanceado contiene N unidades de observación y T períodos, entonces el número de observaciones (n) en el conjunto de datos es estrictamente menor que su producto: n < N × T [4] .
Ambos conjuntos de datos están estructurados en un formato largo, donde una fila contiene una observación a la vez. Otra forma de estructurar los datos del panel es el formato ancho, donde una fila representa una unidad de observación para todos los puntos de tiempo [5] (por ejemplo, en el formato ancho habrá solo dos (primer ejemplo) o tres (segundo ejemplo) filas de datos, con columnas adicionales para cada variable de tiempo (ingresos, edad).