编辑导语:数据分析的前期工作一定要确保无误,才能保证后期在进行数据运用和构建时不出错。当你拿到一个数据分析的任务时,你可以先到数据仓库进行获取。本文作者介绍了企业数据仓库项目上的架构和组件工具管理问题,我们一起来看一下。

关于数据仓库的概念、原理、建设方法论,网上已经有很多内容了,也有很多的经典书籍,本文更想聊聊企业数据仓库项目上的架构和组件工具问题。
先来谈谈架构。
01 企业数据仓库架构
关于数据仓库,有一种简单粗暴的说法,就是“任何数据仓库都是通过数据集成工具连接一端的原始数据和另一端的分析界面的数据库”。
数据仓库用来管理企业庞大的数据集,提供转换数据、移动数据并将其呈现给终端用户的存储机制。许多架构方法以这样或那样的方式扩展数据仓库的能力,我们讲集中讨论最本质的问题,在不考虑过多技术细节的情况下,整个层次架构可以被划分为4层:
- 原始数据层(数据源)
- 数据仓库架构形态
- 数据的采集、收集、清洗和转换
- 应用分析层
闽ICP备13000641号-4