La arqueología de datos es la reconstrucción y el descifrado de datos de medios de almacenamiento que se han vuelto obsoletos o dañados como resultado de un desastre natural o provocado por el hombre. También relacionado con la arqueología de datos está el proceso de descifrar la información registrada en un formato de datos obsoleto .
Las técnicas de arqueología de datos se utilizan más comúnmente para recuperar información científica y financiera. En particular, una parte importante de la información astronómica sigue almacenada en soportes física y moralmente obsoletos. Las organizaciones comerciales están obligadas a conservar la información financiera durante muchos años; sin embargo, los primeros registros financieros a menudo se vuelven inutilizables debido a los formatos cambiantes y las generaciones de medios de almacenamiento.
El término "arqueología de datos" se utilizó por primera vez en 1993 en la descripción del Proyecto de Rescate y Arqueología de Datos Oceanográficos Globales (GODAR). El objetivo del proyecto era reconstruir datos del satélite Nimbus 2 , que operó en los años 60 del siglo XX. La reconstrucción de estos datos hizo posible obtener información única sobre los cambios en el clima del Ártico en ese momento [1] .
Otro proyecto "arqueológico" importante fue el Proyecto de Recuperación de Imágenes del Orbitador Lunar (LOIRP). Especialistas de la NASA utilizaron métodos de arqueología de datos para rescatar información astronómica de una vieja cinta de computadora creada a mediados del siglo pasado [2] .
Las técnicas de arqueología de datos se utilizaron después del huracán Marilyn en 1996. Así, la Administración Nacional de Archivos y Registros en colaboración con el Laboratorio Nacional de Medios de EE. UU. (National Media Lab) han recuperado con éxito información de discos duros dañados por agua de mar y arena [3] .
La arqueología de datos utiliza muchos de los métodos comunes de recuperación de información , pero no se limita a ellos. Esto se debe al hecho de que, en el marco de la arqueología de datos, no basta con restaurar la información, es necesario que sea comprensible [3] .
Un factor importante en el proceso de extracción de información es la relación entre la importancia de la información y el costo de extraerla; con recursos ilimitados, la información se puede extraer y descifrar desde casi cualquier medio [4] .
El método a utilizar depende principalmente del tipo de medio. Por ejemplo, para la arqueología de datos colocados en una cinta magnética , en la etapa preparatoria, la reabsorción del revestimiento de la cinta, la aplicación de un lubricante especial a la cinta y el uso de métodos especiales de limpieza de cinta [5] [6] [6 ] se puede utilizar .
Existen organizaciones especializadas que utilizan métodos de arqueología de datos para recuperar información de medios obsoletos o dañados, entre las más grandes se encuentran National Media Lab USA y Storelab Data Recovery [7] [8] .
La Edad Oscura Digital es un posible escenario futuro en el que muchos documentos digitales históricos y multimedia se perderán efectivamente porque nadie podrá abrirlos. Hardware y sistemas operativos incompatibles , códecs perdidos y formatos de datos obsoletos imposibilitarán el acceso a muchos archivos de los siglos XX-XXI [9] [10] .