Tabla de hechos
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 3 de abril de 2016; las comprobaciones requieren
10 ediciones .
Tabla de hechos : es la tabla principal del almacén de datos [1] [2] [3] [4] . Por regla general, contiene información sobre objetos o eventos, cuya totalidad se analizará más a fondo . Suelen hablar de los cuatro tipos de hechos más comunes . Éstos incluyen:
- hechos relacionados con transacciones ( ing. Hechos de transacciones ). Se basan en eventos individuales (los ejemplos típicos son una llamada telefónica o un retiro de cajero automático );
- Instantánea de hechos . _ Basado en el estado de un objeto (por ejemplo, una cuenta bancaria) en determinados momentos , por ejemplo, al final de un día o un mes. Ejemplos típicos de tales hechos son el volumen de ventas diario o los ingresos diarios ;
- hechos relacionados con los elementos del documento ( ing. Hechos de elementos de línea ). Basado en un documento en particular (por ejemplo, una factura por un producto o servicio) y contiene información detallada sobre los elementos de este documento (por ejemplo, cantidad, precio, porcentaje de descuento);
- Hechos relacionados con eventos o el estado de un objeto ( inglés Event o estado de hechos ). Representan la ocurrencia de un evento sin detalles al respecto (por ejemplo, solo el hecho de una venta o el hecho de su ausencia sin otros detalles).
Una tabla de hechos normalmente contiene una clave compuesta única que une las claves primarias de las tablas de dimensiones . En la mayoría de los casos, estos son valores enteros o valores del tipo "fecha/hora" en formato entero; después de todo, una tabla de hechos puede contener cientos de miles o incluso millones de registros, y generalmente no es rentable almacenarlos. repitiendo descripciones de texto en él; es mejor colocarlas en tablas de medidas más pequeñas. Al mismo tiempo, tanto los campos clave como algunos no clave deben corresponder a las dimensiones futuras del cubo OLAP . Además, la tabla de hechos contiene uno o más campos numéricos, a partir de los cuales se obtendrán datos agregados más adelante.
Para el análisis multidimensional, son adecuadas las tablas de hechos que contienen tantos detalles como sea posible (es decir, correspondientes a los miembros de los niveles inferiores de la jerarquía de las dimensiones correspondientes). En este caso, es preferible tomar como base los hechos de la venta de bienes a clientes individuales, y no las sumas de ventas para diferentes países; este último aún será calculado por la herramienta OLAP, si se usa una. Se puede hacer una excepción, quizás, solo para las herramientas OLAP del cliente, ya que debido a una serie de restricciones no pueden manipular grandes cantidades de datos.
No hay información en la tabla de hechos sobre cómo agrupar registros al calcular datos agregados. Por ejemplo, tiene identificaciones de productos o clientes , pero no tiene información sobre a qué categoría pertenece un producto determinado o en qué ciudad se encuentra un cliente determinado. Esta información, que luego se utiliza para construir jerarquías en dimensiones de cubo, está contenida en tablas de dimensiones. En el caso de crear informes directamente desde el almacén de datos, se puede omitir el paso intermedio de crear cubos OLAP, las denominadas tablas de hechos agregados que contienen información de grano grueso, como el gasto total de un cliente en una tienda seleccionada durante un mes. también puede usarse en lugar de una tabla de hechos detallada con información detallada sobre cada compra, o además de ella.
Notas
- ↑ Kimball, Ralph (2008). El kit de herramientas del ciclo de vida del almacén de datos, 2. edición . Archivado el 17 de mayo de 2018 en Wayback Machine Wiley. ISBN978-0-470-14977-5.
- ↑ Orspod. Tablas de hechos y dimensiones - Azure Data Explorer (ruso) ? . docs.microsoft.com . Consultado el 1 de julio de 2021. Archivado desde el original el 9 de julio de 2021. (indefinido)
- ↑ Mikhail Vyacheslavovich Mikhailov, Maxim Vadimovich Kolomeets, Mikhail Vadimovich Bulgakov, Andrey Alekseevich Chechulin. Investigación y determinación de las principales ventajas y desventajas de los tipos existentes de almacenamiento de datos y análisis de su aplicación // Ciencias técnicas: de la teoría a la práctica. - 2016. - Edición. 11 (59) . — P. 22–27 . — ISSN 2308-5991 . Archivado desde el original el 9 de julio de 2021.
- ↑ Gorban G. V. Aplicación de b*-trees para crear y calcular cubos OLAP utilizando un algoritmo combinatorio // Auditoría tecnológica y reservas de producción. - 2013. - V. 5 , núm. 4 (13) . — P. 10–12 . — ISSN 2226-3780 . Archivado desde el original el 9 de julio de 2021.
Véase también
Almacén de datos |
---|
Crear un almacén de datos |
---|
Conceptos |
|
---|
Opciones |
|
---|
Elementos |
|
---|
Datos |
|
---|
Medición |
|
---|
relleno |
- ETL
- Extracción
- Transformación
|
---|
|
Uso del almacén de datos |
---|
Conceptos |
|
---|
Idiomas |
|
---|
Instrumentos |
|
---|
|
Temas relacionados |
---|
Gente |
|
---|
Productos | Comparación de servidores OLAP |
---|
|
Categoría |