Base de datos : un conjunto de datos almacenados de acuerdo con el esquema de datos , cuya manipulación se realiza de acuerdo con las reglas de las herramientas de modelado de datos [1] [2] [3] .
Muchos expertos señalan un error común, consistente en el uso incorrecto del término "base de datos" en lugar del término " sistema de gestión de base de datos ", y señalan la necesidad de distinguir entre estos conceptos [4] .
La literatura ofrece muchas definiciones del concepto de "base de datos", reflejando más bien la opinión subjetiva de ciertos autores, pero no existe una formulación unificada generalmente aceptada.
Definiciones de documentos reglamentarios, incluidas las normas :
Definiciones de monografías autorizadas :
Las definiciones más a menudo (explícita o implícitamente) contienen las siguientes características distintivas [10] :
De los signos enumerados, solo el primero es estricto, mientras que otros permiten diferentes interpretaciones y diferentes grados de evaluación. Solo se puede establecer cierto grado de cumplimiento de los requisitos para la base de datos.
En tal situación, la práctica común juega un papel importante. De acuerdo con él, por ejemplo, los archivos de archivos , los portales de Internet o las hojas de cálculo no se denominan bases de datos , a pesar de que en cierta medida tienen las características de una base de datos. Generalmente se acepta que este grado es insuficiente en la mayoría de los casos (aunque puede haber excepciones).
La historia de la aparición y el desarrollo de las tecnologías de bases de datos se puede considerar tanto en un aspecto amplio como limitado.
En un sentido amplio, el concepto de historia de las bases de datos se generaliza a la historia de cualquier medio por el cual la humanidad haya almacenado y procesado datos. En este contexto, por ejemplo, se mencionan los medios de contabilidad del tesoro real y los impuestos en la antigua Sumeria (4000 aC ) [12] , la escritura anudada de los incas - kipu , la escritura cuneiforme que contiene documentos del reino asirio , etc. .que la desventaja de este enfoque es la confusión del concepto de "base de datos" y su fusión real con los conceptos de " archivo " e incluso " escritura ".
La historia de las bases de datos en sentido estricto considera las bases de datos en el sentido tradicional (moderno). Esta historia comienza en 1955 con la introducción del firmware para el procesamiento de registros. El software de esta época admitía un modelo de procesamiento de registros basado en archivos. Se utilizaron tarjetas perforadas para el almacenamiento de datos [12] .
Las bases de datos de redes operativas aparecieron a mediados de la década de 1960 . Las operaciones en las bases de datos operativas se procesaban de forma interactiva mediante terminales. La organización de registro secuencial de índice simple evolucionó rápidamente a un modelo de registro orientado a conjuntos más poderoso. Charles Bachmann recibió el Premio Turing por liderar el trabajo del Grupo de trabajo de base de datos (DBTG), que desarrolló un lenguaje estándar de descripción y manipulación de datos .
Al mismo tiempo, el concepto de esquemas de bases de datos y el concepto de independencia de datos se desarrollaron en la comunidad de bases de datos COBOL .
El próximo paso importante está asociado con el advenimiento del modelo de datos relacionales a principios de la década de 1970 , gracias al trabajo de Edgar Codd . El trabajo de Codd allanó el camino para una estrecha conexión entre la tecnología de base de datos aplicada y las matemáticas y la lógica. Edgar F. Codd también recibió el Premio Turing por sus contribuciones a la teoría y la práctica .
El término base de datos en sí ( en inglés database ) apareció a principios de la década de 1960 y se introdujo en simposios organizados por SDC en 1964 y 1965 , aunque en un principio se entendió en un sentido bastante estrecho, en el contexto de los sistemas de inteligencia artificial . El término entró en uso generalizado en el sentido moderno sólo en la década de 1970 [13] .
Hay una gran cantidad de variedades de bases de datos que difieren en varios criterios . Por ejemplo, en la "Enciclopedia de tecnologías de bases de datos" [7] , sobre la base de la cual se escribe esta sección, se definen más de 50 tipos de bases de datos.
La clasificación por modelo de datos suele incluir:
La clasificación por entorno de almacenamiento distingue entre bases de datos que almacenan datos en memoria secundaria ("tradicional", base de datos convencional en inglés ), residente (todos los datos en la etapa de ejecución están en RAM ) y terciaria ( base de datos terciaria en inglés ), que almacena datos en dispositivos de almacenamiento masivo desmontables. - basado en cintas magnéticas o discos ópticos . Al mismo tiempo, en todas las clases, de una forma u otra, se utilizan todos los entornos de almacenamiento, por ejemplo, para las bases de datos residentes, el DBMS escribe registros de solo escritura en la memoria permanente , y para las bases de datos tradicionales, se utiliza un caché en RAM.
Asimismo, las bases de datos se pueden clasificar por contenido, por ejemplo, pueden ser geográficas, históricas, científicas, multimedia . Para algunas formas de contenido, se crean DBMS especializados o se agregan características especializadas a un DBMS de propósito general, entre tales bases de datos:
De acuerdo con el grado de distribución, las bases de datos se dividen en centralizadas (concentradas; base de datos centralizada ing. ), totalmente respaldadas en un equipo, y distribuidas ( base de datos distribuida ing. ). Entre la variedad de opciones para bases de datos distribuidas, se destacan las siguientes:
Las opciones mixtas son posibles, por ejemplo, para la misma base de datos distribuida, la fragmentación se usa para objetos grandes y la replicación se usa para objetos pequeños.
De acuerdo con las formas de organizar el almacenamiento, se pueden distinguir las bases de datos cíclicas (escriben datos nuevos en lugar de obsoletos), las bases de datos de transmisión .
Una base de datos muy grande ( English Very Large Database, VLDB ) es una base de datos que ocupa una cantidad extremadamente grande de espacio en un dispositivo de almacenamiento físico . El término implica los volúmenes máximos posibles de la base de datos, que están determinados por los últimos avances en tecnologías de almacenamiento de datos físicos y tecnologías de manejo de datos de software.
La definición cuantitativa del concepto de "volumen extremadamente grande" varía con el tiempo. Entonces, en 1997, la base de datos de texto más grande del mundo era DIALOG de Knight Ridder con un volumen de 7 terabytes [14] . En 2001, se consideró que la base de datos más grande tenía 10,5 terabytes, en 2003, 25 terabytes [15] . En 2005, las bases de datos más grandes del mundo se consideraban bases de datos con un volumen de almacenamiento de alrededor de cien terabytes [16] . En 2006, el motor de búsqueda de Google utilizó una base de datos de 850 terabytes [17] .
En 2010, se creía que el volumen de una base de datos ultragrande debería medirse en al menos petabytes [16] .
En 2011, Facebook almacenó datos en un clúster de 2000 nodos con una capacidad total de 21 petabytes [18] ; a fines de 2012, el volumen de datos de Facebook alcanzó los 100 petabytes [19] , y en 2014, los 300 petabytes [20] .
Para 2014, según estimaciones indirectas, Google almacenó en sus servidores hasta 10-15 exabytes de datos en total [21] .
Según algunas estimaciones, para 2025, los genetistas tendrán datos sobre los genomas de 100 millones a 2 mil millones de personas, y el almacenamiento de esta cantidad de datos requerirá de 2 a 40 exabytes [22] .
En general, según las estimaciones de IDC , la cantidad total de datos en el "universo digital" se duplica cada dos años y pasará de 4,4 zettabytes en 2013 a 44 zettabytes en 2020 [23] .
La investigación en el campo del almacenamiento y procesamiento de bases de datos VLDB muy grandes siempre está a la vanguardia de la teoría y la práctica de las bases de datos. En particular, desde 1975 se lleva a cabo anualmente la Conferencia Internacional sobre Bases de Datos Muy Grandes (“Conferencia Internacional sobre Bases de Datos Muy Grandes”). La mayor parte de la investigación se lleva a cabo bajo los auspicios de la organización sin fines de lucro VLDB Endowment (VLDB Endowment Fund), que garantiza la promoción del trabajo científico y el intercambio de información en el campo de bases de datos muy grandes y campos relacionados.
diccionarios y enciclopedias | ||||
---|---|---|---|---|
|
Base de datos | |
---|---|
Conceptos | |
Objetos |
|
Llaves | |
sql |
|
Componentes |
Almacén de datos | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
| ||||||||||||||
| ||||||||||||||
Categoría |