Tabla de hechos

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 3 de abril de 2016; las comprobaciones requieren 10 ediciones .

Tabla de hechos  : es la tabla principal del almacén de datos [1] [2] [3] [4] . Por regla general, contiene información sobre objetos o eventos, cuya totalidad se analizará más a fondo . Suelen hablar de los cuatro tipos de hechos más comunes . Éstos incluyen:

Una tabla de hechos normalmente contiene una clave compuesta única que une las claves primarias de las tablas de dimensiones . En la mayoría de los casos, estos son valores enteros o valores del tipo "fecha/hora" en formato entero; después de todo, una tabla de hechos puede contener cientos de miles o incluso millones de registros, y generalmente no es rentable almacenarlos. repitiendo descripciones de texto en él; es mejor colocarlas en tablas de medidas más pequeñas. Al mismo tiempo, tanto los campos clave como algunos no clave deben corresponder a las dimensiones futuras del cubo OLAP . Además, la tabla de hechos contiene uno o más campos numéricos, a partir de los cuales se obtendrán datos agregados más adelante.

Para el análisis multidimensional, son adecuadas las tablas de hechos que contienen tantos detalles como sea posible (es decir, correspondientes a los miembros de los niveles inferiores de la jerarquía de las dimensiones correspondientes). En este caso, es preferible tomar como base los hechos de la venta de bienes a clientes individuales, y no las sumas de ventas para diferentes países; este último aún será calculado por la herramienta OLAP, si se usa una. Se puede hacer una excepción, quizás, solo para las herramientas OLAP del cliente, ya que debido a una serie de restricciones no pueden manipular grandes cantidades de datos.

No hay información en la tabla de hechos sobre cómo agrupar registros al calcular datos agregados. Por ejemplo, tiene identificaciones de productos o clientes , pero no tiene información sobre a qué categoría pertenece un producto determinado o en qué ciudad se encuentra un cliente determinado. Esta información, que luego se utiliza para construir jerarquías en dimensiones de cubo, está contenida en tablas de dimensiones. En el caso de crear informes directamente desde el almacén de datos, se puede omitir el paso intermedio de crear cubos OLAP, las denominadas tablas de hechos agregados que contienen información de grano grueso, como el gasto total de un cliente en una tienda seleccionada durante un mes. también puede usarse en lugar de una tabla de hechos detallada con información detallada sobre cada compra, o además de ella.

Notas

  1. Kimball, Ralph (2008). El kit de herramientas del ciclo de vida del almacén de datos, 2. edición . Archivado el 17 de mayo de 2018 en Wayback Machine Wiley. ISBN978-0-470-14977-5.
  2. Orspod. Tablas de hechos y dimensiones - Azure Data Explorer  (ruso)  ? . docs.microsoft.com . Consultado el 1 de julio de 2021. Archivado desde el original el 9 de julio de 2021.
  3. Mikhail Vyacheslavovich Mikhailov, Maxim Vadimovich Kolomeets, Mikhail Vadimovich Bulgakov, Andrey Alekseevich Chechulin. Investigación y determinación de las principales ventajas y desventajas de los tipos existentes de almacenamiento de datos y análisis de su aplicación  // Ciencias técnicas: de la teoría a la práctica. - 2016. - Edición. 11 (59) . — P. 22–27 . — ISSN 2308-5991 . Archivado desde el original el 9 de julio de 2021.
  4. Gorban G. V. Aplicación de b*-trees para crear y calcular cubos OLAP utilizando un algoritmo combinatorio // Auditoría tecnológica y reservas de producción. - 2013. - V. 5 , núm. 4 (13) . — P. 10–12 . — ISSN 2226-3780 . Archivado desde el original el 9 de julio de 2021.

Véase también