您现在的位置:   首页 >> 新闻中心 >> 数据分析

数据产品生命线之数据质量

发布人:www.yunke.ai 发布时间:2021-01-01 136 次浏览

编辑导语:数据质量问题,是每个数据应用类的数据产品都需要时刻关注并解决的问题。本篇作者结合自己的工作经历与思考,跟我们分享了数据质量问题的类型、问题产生的原因、如何用数据质量监控产品,一起来看一下。

数据人最常听到,最扎心、刺耳的一句话,莫过于“你数据准不准?”。一次数据异常的“锅”,可能就抵过了过去数据支撑积累的所有业务价值感知。数据质量问题,是每个数据应用类的数据产品都需要时刻关注并解决的问题。

下面的场景,你是否曾经经历过?

  1. 9点钟刚开始上班,用户群里已经炸了锅,营销数据报表、经验概况……今天的数据怎么还没出来啊,晨会着急看数呢。
  2. CDP平台新客大礼包营销场景,为什么出现了是实为老客但系统判定成新客,多发的成本,损失谁来承担啊?
  3. 昨天DAU同比下降了80%,你们确认下数据对不对,是不是数据不全啊?
  4. 大数据安全法9月1日正式实行了,你们数据产品中怎么出现了用户身份信息,你违法了啊!
  5. 业务发现流量统计有个异常的峰值,被业务diss,你们数据产品自己不看数据吗,没有一点业务常识和数据sense吗?……

BI数据分析、数据化运营等数据价值应用类的数据产品,数据质量的问题将导致错误的业务决策,或者带来用户体验问题、直接的经济损失。因此,作为数据干饭人,要对数据产品的数据质量负责,早诊断、早发现、早解决,防患于未然,否则,蚁穴溃堤就为时已晚。

一、数据质量问题的类型

国际数据管理协会(DAMA)定义了数据质量维度,结合实际的业务场景,总结数据质量7个核心的维度:准确性、及时性、完整性、合理性、一致性、唯一性、安全性。