Examen base de datos

• Carga:

– La fase de carga es el momento en el cual los datos de la fase de transformación son cargados en el sistema de destino.
– En algunas bases de datos se sobrescribe la información antigua con nuevos datos, pero en los data warehouse mantienen un historial de los registros de manera que se pueda hacer una auditoría de los mismos, y disponer de un rastro de toda la historia de un valor a lo largo del tiempo.  – La fase de carga interactúa directamente con la base de datos de destino: al realizar esta operación se aplicarán todas las restricciones y triggers (disparadores) que se hayan definido en ésta (p. Ej., valores únicos, integridad referencial, campos obligatorios, rangos de valores), donde éstas restricciones y triggers (si están bien definidos)
contribuyen a que se garantice la calidad de los datos en el proceso ETL, y deben ser tomados en cuenta.

– Existen dos formas básicas de desarrollar el proceso de carga:

Acumulación simple

Consiste en realizar un resumen de todas las transacciones comprendidas en el período de tiempo seleccionado, y transportar el resultado como una única transacción hacia el data warehouse, almacenando un valor calculado que consistirá típicamente en un sumatorio o un promedio de la magnitud considerada.

Rolling

Se aplica en los casos en que se opta por mantener varios niveles de granularidad (jerarquías), donde se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo o diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud almacenada (p. Ej., totales diarios, totales semanales, totales mensuales, etc.).

Función clásica del negocio:
“Analizar la información disponible en los sistemas operacionales para apoyar la toma de decisiones de los ejecutivos”.

• Plataforma de HW y Software para procesar información de interés para la gestión, sobre el pasado, presente y futuro en que el negocio se ubica.

• Otros nombres que recibe:

– Business Performance Management (Meta Group).– CPM o Corporate Performance Management (Gartner).– Enterprise Performance Management.

• BI y un Proceso de Toma de Decisiones típico (Software de BI Tradicional):

– Rastrear:
monitorear los sistemas transaccionales para conocer el estado actual del negocio, a través de software que permite comparar resultados con metas establecidas.– Analizar: software que integra en un DW datos provenientes de múltiples sistemas, con el objetivo de apoyar el análisis de tendencias y patrones.
– Difundir: software que permite publicar a los usuarios del negocio los resultados del rastreo y análisis.

• BI y un Proceso de Toma de Decisiones típico

(Software de BI Avanzado) 

– Definir Hipótesis: software que ayudan a buscar nuevas alternativas de decisión (por ej. Software análisis de precios). – Modelar: software que permiten simular para explorar los efectos que tendrían los modelos generados.  – Decidir: la toma de decisiones es un proceso que involucra a un grupo de personas, por ello es vital utilizar software de apoyo para el trabajo colaborativo.

.– Los procesos ETL también se pueden utilizar para la integración con sistemas heredados.
– El estado de la data de origen es fundamental para el estudio de implementación, ya que los procesos ETL no son mágicos.

• Extracción:

– La mayoría de los proyectos de almacenamiento de datos fusionan datos provenientes de diferentes sistemas de origen, donde cada sistema por separado puede usar una

organización diferente de los datos o formatos distintos. 

– Una parte intrínseca del proceso de extracción es la de analizar los datos extraídos, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba, de no ser así, los datos son rechazados.

– Un requerimiento importante que se debe exigir a la tarea de extracción, es que ésta cause un impacto mínimo en el sistema origen, porque si los datos a extraer son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que éste no pueda utilizarse con normalidad para su uso cotidiano.

– Por esta razón, en grandes sistemas las operaciones de extracción suelen programarse en horarios o días donde este impacto sea nulo o mínimo, generándose una copia de la base de datos transaccional para, desde ahí, generar los procesos de extracción.

– Esto a su vez significa un aumento significativo de los costos, solo por mejorar el proceso de extracción de la  información.

– La extracción convierte los datos a un formato preparado para iniciar el proceso de transformación.

• Transformación:

– Esta fase aplica una serie de reglas de negocio o funciones sobre los datos extraídos, para convertirlos en datos útiles para los procedimientos de análisis, que ser cargados en función del nuevo modelo de datos del sistema de BI (nueva estructura). 

– La conversión y precálculo ahorran tiempo y capacidad procesamiento, ya que en general los sistemas de BI requieren de datos agregados desde su origen para el análisis de alto nivel, de manera de no tener que hacerla en tiempo de ejecución.

– Requiere un diseño del sistema de análisis muy detallado orientado a las exigencias de los usuarios, que permitan asegurar el éxito posterior del sistema.


– Las transformaciones son por ejemplo: Seleccionar sólo ciertas columnas para su carga (por ejemplo, que las columnas con valores nulos no se carguen). Traducir códigos (p. Ej., si la fuente almacena una «H» para Hombre y «M» para Mujer pero el destino almacena «1» para Hombre y «2» para Mujer).Codificar valores libres (p. Ej., convertir «Hombre» en «H» o «Sr» en «1»).Obtener nuevos valores calculados (p. Ej., total_venta = cantidad * precio).Unir datos de múltiples fuentes (p. Ej., búsquedas, combinaciones, etc.).Calcular totales de múltiples filas de datos (p. Ej., ventas totales de cada regíón).Transponer o pivotar (girando múltiples columnas en filas o viceversa).Dividir una columna en varias (p. Ej., columna «Nombre: García López, Miguel Ángel»; pasar a dos columnas «Nombre: Miguel Ángel», «Apellido1: García» y «Apellido2: López»).La aplicación de cualquier forma, simple o compleja, de validación de datos, y la consiguiente aplicación de la acción que en cada caso se requiera

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.