编辑导语:风控模型的应用场景非常广泛,只要牵扯互联网金融的行业就少不了风控,风控模型建好后还要映射到信用分数空间,才能呈现给用户;本文作者分享了详细的建模方法,教你如何建立模型分数,我们一起来看一下。

目前在个人信用风控建模领域主要使用的模型有两种:
- 基于线性回归分析的评分卡模型,常见于银行背景的放贷机构;
- 基于大数据的机器学习模型,如随即森林、XGBoost等,常见于互联网金融领域。
这两种建模方法无论哪种都需要将模型结果映射到信用分数空间,最终呈现给用户一个能够表征信用的分数,比如国内的芝麻分、美国的FICO分。
那么问题来了,模型结果和分数同样都是数值,为什么不直接呈现模型结果?为什么还要进一步转化为分数?为什么使用分数校准?
本文的目的就是要让你知其然也知其所以然。
深入到业务中,带你一步步搞懂分数映射产生的背景以及分数校准背后的业务需求;在了解了业务之后,你就会发现分数的意义和映射方法的内在逻辑。
一、分数映射的产生——一款产品一个模式
先从最简单的情况入手,假设我们现在成立了一家小信贷公司,推出一款借贷产品,详情如下:

(该产品数值仅作示意,不代表真实情况)
此时我们要解决的第一个问题是:如何让这款产品盈利?
信贷业务能够盈利的关键是还款人的利息能够覆盖坏账损失(不能收回的各种应收款项)。
也就是说要尽可能的把钱借给信用良好、按时还款的用户以保证产品盈利。
在产品参数确定后,逾期率是保证产品盈利的唯一影响因素。
这里要提一下关键的一点:如何定义逾期率?
在信贷领域通常逾期超过60天的用户基本上就不会再还钱了,自然的我们就可以通过逾期超过60天的比例来衡量用户的好坏程度。
在机器学习建模时,有时为了增加坏账样本的数量,也会将逾期超过30天的比例定义为逾期率。
闽ICP备13000641号-4