El almacenamiento direccionable por contenido (CAS) es una arquitectura de almacenamiento en la que el direccionamiento lo realiza la imagen de los datos almacenados . La imagen de datos se procesa y el hash se usa para ubicarla en dispositivos o sistemas de almacenamiento.
La arquitectura es altamente resistente a los duplicados y también puede ejecutarse de forma descentralizada, lo que le otorga una gran confiabilidad.
Es un análogo persistente de la memoria direccionable por contenido .
A diferencia de los sistemas de disco tradicionales (archivo, direccionamiento de bloques), la información no se coloca por el nombre del archivo o un sector específico en la superficie del disco, sino por su contenido. Para cada objeto (puede ser un archivo, un bloque de datos u otro flujo de información), se calcula una suma de comprobación ( MD5 , SHA-256, etc.), una especie de "huella digital", que es la dirección del información. Y en la misma dirección, el objeto se puede leer posteriormente desde el dispositivo. En la vida cotidiana, esto se asemeja a una casa de empeño no muy común, que tiene en cuenta los objetos, en primer lugar, no por sus nombres (como en los sistemas de archivos tradicionales), sino, por ejemplo, por un valor especial, excepcionalmente único que selecciona por evaluar objetos al aceptarlos para su almacenamiento, y que en el futuro servirán como un identificador para dicha casa de empeño al buscar un objeto entre otros para devolverlo. Si durante el almacenamiento se agregó algo al objeto o, por el contrario, se lo quitaron, al mismo tiempo, esta casa de empeño volverá a evaluar, cambiando su valor de identificación.
La propia arquitectura del sistema garantiza la inmutabilidad de la información almacenada. Si se ha cambiado algún objeto, tendrá una suma de verificación diferente y será un objeto diferente almacenado en una dirección diferente. Al acceder a la antigua dirección, el objeto se leerá en original garantizado, lo que excluye la sustitución, falsificación y otras acciones análogas, lo que tiene un valor incalculable en el ámbito de la jurisprudencia, la seguridad, el almacenamiento de pruebas clave, etc.
Para cada uno de los objetos registrados, se puede establecer un cierto período de retención, durante el cual no se puede eliminar. Este período puede ir desde unos pocos minutos hasta varios años, así como un almacenamiento ilimitado. En este último caso, la eliminación del archivo solo es posible en la fábrica o solo mediante la destrucción física del dispositivo. Además, el inicio del período de almacenamiento no se calcula necesariamente a partir del momento actual, sino que puede comenzar a partir de cualquier momento futuro definido o incluso indefinido, como el mantenimiento de un historial médico durante tres años a partir de la fecha de la muerte del paciente, que actualmente es desconocido.
Para nuestro país, esto es todavía solo una tendencia incipiente (como, por ejemplo, las instrucciones del Banco Central sobre los términos y requisitos para el almacenamiento de documentos bancarios [1] [2] ), sin embargo, ya existen bastantes estándares. en todo el mundo (como SEC 17a-4, HIPAA, 21CPR Parte 11, DoD 5015.2, etc.), que establecen los términos y características del almacenamiento de ciertos archivos por ley. Como se desprende de los párrafos anteriores, los dispositivos CAS pueden hacer frente a esta tarea, lo que se confirma mediante certificados de conformidad con las normas que les permiten ser utilizados en ciertas áreas. [3] [4]
La eliminación de un objeto en el dispositivo no ocurre sin dejar rastro. Además de que esto puede requerir ciertos derechos de acceso, así como la autorización de la dirección superior, después de eliminar un objeto, queda cierta información sobre el hecho de la eliminación, así como sobre los objetos y las personas asociadas a él. Por ejemplo, el dispositivo le permite crear un almacenamiento de registros de cámaras de CCTV, lo que le permite determinar si hubo un hecho de la presencia / ausencia de ciertos registros, así como los usuarios involucrados en su eliminación.
Una consecuencia de la arquitectura CAS es otra característica interesante: si se escriben varios archivos idénticos, pero con nombres diferentes, solo se escribirá un objeto, ya que las sumas de verificación y, en consecuencia, las direcciones de ubicación de todos los objetos coincidirán. lo que ahorra significativamente espacio en disco. Sin embargo, al leer, cada archivo se leerá con su propio nombre.
Además de estas características, los dispositivos CAS también tienen características de dispositivo de disco estándar, como escalabilidad , interfaz web, RAID , replicación, trituración, monitoreo avanzado, diagnósticos, notificaciones de fallas, así como indexación extensa, búsqueda de contenido y metadatos personalizados.
En base a estas propiedades, los dispositivos CAS se han generalizado para el almacenamiento de archivos, así como para el concepto de "archivo activo" (por ejemplo, cuando se usa el software "Disk Extender", "E-Mail Extender"), en el que los datos no utilizados se traslada imperceptiblemente a un almacenamiento de archivo más económico, siendo reemplazado por un enlace al archivo original, mediante el cual puede ser leído por un usuario que desconoce su ubicación real.
Las implementaciones específicas de los dispositivos CAS están representadas por productos: