您现在的位置:   首页 >> 新闻中心 >> 数据分析

数据准确性是数据人的生命线

发布人:www.yunke.ai 发布时间:2021-01-01 136 次浏览

数据准确性是数据人的生命线,是数据人的能力体现。文章结合案例,对数据准确的重要性进行了总结。

如果有一件事情是数据人必须捍卫到底的,那就是数据准确性。

数据不准,意味着做数据的人和团队不靠谱,一旦被打上不靠谱的标签,翻身可就难了。如果,因为错误的数据,管理层做出了错误的业务决策,责任就更大。数据不准,数据人的里子、面子都没了,所以数据人错不起。

虽然数据不准的理由万万千,但数据不准的责任由数据人来担,因为是我们在输出数据。数据不准,我们寸步难行。数据不准可能是因为上游业务系统出问题,也可能是数据人自己没注意,也有可能是故意而为之。但不管哪种原因,因为数据是数据人提供的,首先被追责的还是数据人。

案例1:明目张胆的数据造假

由于系统的各种历史原因,指标无法准确计算。比如点击率=点击/曝光,但点击的数值采集了8个页面,曝光只采集了5个页面。

如果分子、分母都只计算5个页面,对业务来说,明显少算了自己的业绩,他们肯定不乐意。

如果把分母中少了的3个页面的曝光加上去,当然**,但大家盘了一下,发现技术、数据上下游好长一串要改动,一时半会驱动不了这么多资源,只能歇菜。

如果不做调整,直接按现有的数据计算,分子是8个页面的点击,分母是5个页面的曝光,则会出现大量点击率大于100%的情况,在很多业务场景都无法解释。

然而聪明的业务负责人,出了个招,分子依然是8个页面的点击,分母改为5个页面的曝光+8个页面的点击,这样一来不需要向大家解释为什么点击率超过100%,二来业务目标本来就是转化率越高越好,高说明自己的业务做的很棒,5个页面的曝光+8个页面的点击明显小于5个页面的曝光+3个未打点页面的真实曝光。

这支聪明又超有执行力的团队真的这么干了,一系列指标火速上线。上线后,由于这些是常用指标,和大量已有相关指标冲突,比如曝光在这个报表里看是50,在那个报表里看是80,数据被群起围攻求解释。

这是一起很恶劣的数据造假事件。事后复盘时,那位聪明人竭力否认自己干过这样的事。数据团队则认为自己很无辜,这是业务做的决策。但是数据团队只能抗下责任,因为指标是数据团队开发的。

案例2 :业务没抓手,那就看收据口径有没问题

某业务团队的KPI是买家数的增长,但团队耗尽脑力,没想出来好的业务抓手,怎么办?

这个团队的业务leader是数据背景转行的,给大家支了个招。大家盘点下数据口径,怎么样定义买家,是不是有些应该被算进来的,却被遗漏了?比如怎么定义注册,是否一定要注册?

然后整个业务团队的人天天都坐在数据团队办公,但数据团队没有人愿意支持这个业务团队。