您现在的位置:   首页 >> 新闻中心 >> 数据分析

如何校验用户画像的准确性?

发布人:www.yunke.ai 发布时间:2021-01-01 150 次浏览

用户画像是数据运营的基础,也是做深度挖掘的一个不可或缺的模块。只有先打好画像基础,确保画像质量,后续的深挖行为才有突破的可能。

在用户研究的课题中,用户画像是几乎每个公司都会去做的,浅层的包括统计类的:上月购买量,上周活跃天数等;深层的包括洞察类的:潜在需求偏好,生命周期阶段等;前者的校验简单,后者的校验需要通过一些特别的方式。本文就洞察类画像校验做一系列的梳理。

省略掉预处理设计的过程,画像校验的步骤主要集中在画像开发,画像上线,画像更新中,并且三个阶段中,每个阶段的校验方式不尽不同

一. 用户画像开发中

当我们所开发的用户画像是类似于用户的下单需求、用户的购车意愿、用户是否有注册意愿这一类存在历史的正负样本的有监督的问题,我们可以利用历史确定的数据来校验我们的画像准确性。比如,银行在设计用户征信的画像前,会有一批外部购买的坏样本和好样本,其实画像问题就转化为分类问题去解决评估了。

1. Recall、Pecision、K-S、F1曲线、Roc曲线、Confusion Matrix、AUC

针对这类问题,已经有较为成熟的理论基础,直接利用测试样本判断的准确程度判断画像是否准确

这张图是一张非常常见也是有效的来总结Recall、Pecision、Lift曲线、Roc曲线、Confusion Matrix的图。

FPR = FP/(FP + TN)

Recall=TPR=TP/(TP+FN)

Precision=TP/(TP+FP)

F1曲线:2*Precision*Recall/(Precision+Recall)

Roc曲线:TPR vs FPR,也就是Precision vs Recall

Auc:area under the roc curve ,也就是roc曲线下面的面积,积分或者投点法均可求解。