domingo, 8 de abril de 2007

data warehouse



En el contexto de la Informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientadas a un dominio, integrado, no volátil y varía en el tiempo que ayuda a la toma de decisiones de la empresa u organización.

Se trata, sobre todo, de un expediente de una empresa más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer análisis y la divulgación eficientes de datos (especialmente OLAP). El almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de los datos contienen a menudo grandes cantidades de información que se subdividen a veces en unidades lógicas más pequeñas, llamadas los centros comerciales, dependientes de los datos.

Generalmente, dos ideas básicas dirigen la creación de un almacén de los datos:




  • Integración de los datos de bases de datos distribuidas y diferentemente estructuradas, que facilita una descripción global y un análisis comprensivo en el almacén de los datos.



  • Separación de los datos usados en operaciones diarias de los datos usados en el almacén de los datos para los propósitos de la divulgación, de la ayuda en la toma de decisiones, para el análisis y para controlar.

Periodicámente, se importan los datos de sistemas del planeamiento del recurso de la empresa (ERP) y de otros sistemas de software relacionados al negocio en el almacén de los datos para la transformación posterior. Es práctica común normalizar los datos antes de combinarlos en el almacén de datos, esta fase se suele realizar con una herramienta extracción, transformación y carga (ETL). Dicha aplicación lee los datos primarios (a menudo bases de datos OLTP de un negocio), realiza el proceso cualitativo o la filtración (incluyendo, si se juzga necesario, desnormalización) y escribe en el almacén.



No hay comentarios: