您现在的位置:   首页 >> 新闻中心 >> 数据分析

关于数仓基础知识的超全概括

发布人:www.yunke.ai 发布时间:2021-01-01 136 次浏览

编辑导语:数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合,它可以为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。在本篇文章中,作者就关于数仓的基础知识进行了超全概括。

面对大数据的多样性,在存储和处理这些大数据时,我们就必须要知道两个重要的技术,其分别是:数据仓库技术、Hadoop。当数据为结构化数据,来自传统的数据源,则采用数据仓库技术来存储和处理这些数据,如下图:

1. 什么是数据仓库

数据仓库之父 Bill Inmon 将数据仓库描述为一个面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持。

数据仓库本身并不 “生产” 任何数据;同时自身也不需要 “消费” 任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫 “仓库” ,而不叫 “工厂” 的原因。

2. 数据仓库的基本概念