Modelo para el proceso de extracción, transformación y carga en bodegas de datos. Una aplicación con datos ambientales
Model for the extraction, transformation and load process in data warehouses. An application with environmental data
QRCode
Compartir este ítem
Citación
Fecha
2016-08-01
Autor
Duque Méndez, Néstor Darío
Hernández Leal, Emilcy Juliana
Pérez Zapata, Ángela María
Arroyave Tabares, Adrián Felipe
Espinosa Gómez, Daniel Andrés
Publicador
Universidad Militar Nueva Granada
Palabras claves
bodegas de datos; consistencia; integridad; procesamiento web; procesos etl
Metadatos
Mostrar el registro completo del ítemResumen
La administración de bodegas de datos o datawarehouse requiere de un procesamiento para garantizar la veracidad, integridad y centralización de los datos cuando existen diversas fuentes de información, haciendo necesario utilizar aplicativos especializados para la Extracción, Transformación y Carga de datos (ETL). Estos aplicativos presentan conflictos en su parametrización, carecen de la implementación de filtros de corrección adaptables a las características de los datos y pueden demandar altos costos para su implementación. En el presente artículo se plantea un modelo genérico que aplica las etapas de ETL y permite realizar seguimiento del proceso al mantener un registro histórico de errores filtrados y calcular indicadores para identificar la calidad en el procesamiento. La validación del modelo fue realizada sobre un caso de estudio con datos ambientales. El modelo demostró obtener resultados satisfactorios. Se plantea realizar más validaciones del modelo, en otros ámbitos, incluyendo nuevos tipos y estructuras de datos.
Abstract
Data warehouse management requires a procedure to ensure the accuracy, completeness, and centralization of data when there are several sources of information, thus making the use of specialized applications for Extraction, Transformation, and Loading of Data -ETL- necessary. These applications have conflicts with the parameterization, lack the implementation of correction filters adaptable to the data characteristics, and can demand high costs for their implementation. In this article, it is presented a generic model that applies the stages of ETL and allows monitoring the process to keep a historical record of errors filtered and to calculate indicators to identify quality in processing. Model validation was performed on a case study with environmental data. The model showed satisfactory results. Finally, it is planned to conduct validations of the model in other areas, including new types and data structures.
Enlace al recurso
https://revistas.unimilitar.edu.co/index.php/rcin/article/view/1799https://doi.org/10.18359/rcin.1799
Fuente
Ciencia e Ingenieria Neogranadina; Vol. 26 No. 2 (2016); 95-109Ciencia e Ingeniería Neogranadina; Vol. 26 Núm. 2 (2016); 95-109
Ciencia e Ingeniería Neogranadina; v. 26 n. 2 (2016); 95-109