您现在的位置:   首页 >> 新闻中心 >> 数据分析

培养数据意识,从数据口径字典开始

发布人:www.yunke.ai 发布时间:2021-01-01 133 次浏览

信息社会,数据量日益庞大。对于产品经理来说,怎么样找准需要分析的数据去推动业务指标的达成,怎么样培养数据意识是必备的技能。对于应届产品来说,可以从整理数据口径字典开始。

上个月将修改好的metabase报表上线了,意识到数据口径字典的统一标准化的重要性是从一个需求发布到正式环境出问题开始的。这个需求上线后,发现某张统计表和明细表的数据数对不上,这时候需要测试协助去找出对不上的某几条数据,再一遍遍去找到问题-修改-重新发版。

这一切的源头,是产品对于数据定义和取数的不规范导致的。所以通过整理数据口径字典这个需求,希望理解为什么要做,怎么做以及怎么维护,从而去培养基础的数据意识。

一、 为什么做数据字典-why

第一个是实际场景需要的原因。在不同的数据报表中出现相同的数据名,但是定义不一致;在不同的数据报表中出现不同的数据名,但是定义一致。所以会导致在导出数据时会因出现相同数据名但定义不同而产生的数据不匹配现象。

第二个是业务数据规范的原因。由于我们公司的业务数据较多,如果将不同的业务数据糅合在一张表里存储,会造成数据的冗余、表关联的数量增多而出现关联出错的误操作、修改某几个数据时要同时处理多张表等问题。

因此我需要从整理数据口径字典开始,去为转介绍宽表做铺垫。把相同业务的所有数据放在同一张表中,目的在于提高数据提取的效率,便于后续迭代。

二、怎么做数据字典-how

数据口径字典整理的重点,我梳理主要有以下四点。

  • 数据口径和定义的重新规整,数据名和定义尽量做到清晰、明确、易懂,数据呈现格式也需记录;
  • 数据口径的原定义取数逻辑和现定义取数逻辑的记录,让后续开发和产品查找有迹可循;
  • 确认数据口径定义是否与业务方达成一致,避免歧义
  • 需涵盖尽可能多的相关业务数据,规整不同类别,形成一本可查询的字典

三、转介绍数据口径字典-what

以具体的转介绍业务,总结是如何建立数据口径字典的。