根据相关专业机构及专业人员的实际应用效果反馈,铁路数据在风控策略及助贷业务的客群资质识别都有非常明显的效果。本文详细解析覆盖8亿人的铁路数据,希望可以给到各部门伙伴一定的参考。

目录:
前言
一、覆盖8亿群体的12306历史发展
二、铁路客运用户画像系统
2.1系统总体架构设计
2.2对接系统及数据
2.3数据处理的类型
2.4铁路系统主要数据源分布
三、基于用户行为的用户画像
铁路旅客画像
四、铁路用户画像实现步骤
4.1数据源分析
4.2客票特征数据
4.3客票原始数据
4.4目标分析
4.5标签计算
4.6铁路用户特征
4.7铁路用户出行特性
五、客列车分类【主要关注GCD列车】
高速动车组列车(G字头)
城际动车组列车(C字头)
普通动车组列车(D字头)
直达特快旅客列车(Z字头)
特快旅客列车(T字头)
快速旅客列车(K字头)
普通旅客快车(普快)
普通旅客列车
临时旅客列车(L字头)
旅游列车(Y字头)
六、指标分析逻辑举例
6.1单个指标分析
6.2多指标分析
6.3通过旅客周转量及客流量做分析
6.4通过客运量做分析
6.5常住地界定
七、用户画像系统铁路公司对外应用场景
7.1核验服务
7.2精准营销
7.3业务预测
7.4风险识别
八、用户画像系统的应用
8.1征信服务
8.2用户核验系统
九、铁路数据应用场景及价值
9.1社会价值
9.2经济价值
十、结语
前言
在个人金融风控场景,常见的数据除了基础核验外(身份证2要素、银行卡3/4要素、运营商3要素)外,运营商爬虫(现禁用)、央行征信(持牌机构使用较多、助贷机构及金科使用较少)、民间借贷记录、设备行为统计形成的用户画像等,社保、公积金、电商数据由于数据的开放性问题,其实使用的不多。
然后由于最近半年的数据行业的缓存及敏感数据的外泄或与高利贷合作的不良行为,导致主营运营商爬虫及民间借贷记录2类数据产品的机构被查,相关产品无法对外,引起了大部分包括银行在内的相关风控策略的大调整及产品调整。
很多行业的伙伴都在愁,有无什么数据来源合规安全且可以在一定程度上替换运营商爬虫及民间借贷记录数据效果的,航旅及铁路或者是相对有效的。
根据相关专业机构及专业人员的实际应用效果反馈,铁路数据在风控策略及助贷业务的客群资质识别都有非常明显的效果。
之前已经分析过航旅数据,这次详细解析覆盖8亿人的铁路数据,希望可以给到各部门伙伴一定的参考。
铁路数据部分字段维度是这样的:

一、覆盖8亿群体的12306历史发展
12306网站于2010年1月30日(2010年春运首日)开通并进行了试运行。用户在该网站可查询列车时刻、票价、余票、代售点、正晚点等信息。
2011年06月12日,京津城际铁路率先试水网络售票。
2011年9月30日,所有动车组线路实施网上订票。
2011年11月20日,Z字头全部直达特快列车车票实施网上订票。
2011年12月23日,铁道部最终兑现在年底前网络售票覆盖所有车次的承诺。
2013年11月20日,12306新增支付宝支付通道。
2013年12月6日,改版后的12306网站上线。
2013年12月8日,12306手机客户端正式开放下载。
自2015年11月26日铁路春运售票工作启动以来,截止12月15日,铁路部门共发售火车票1.7亿张,其中,通过12306网站发售车票突破1亿张,已占到售票总量60%。自2011年推出网络购票以来,12306网站累计发售火车票35亿张。
自2017年7月17日起,乘坐G、D字头列车的乘客可以通过12306网站或客户端提前预订动车上的饭菜以及站外的食物。同时,如果是通过电话、车站窗口、代售点、自动售票机等其他方式购票,也可登录12306网站或移动客户端,从首页选择“订餐服务”,输入车次和联系人信息后,同样能进行点餐,可以通过微信和支付宝实现快捷支付。
另外,已经订好的旅客,如果要进行网上退票、改签、变更到站,系统会自动提醒旅客进行退餐,在实体窗口进行了以上操作的旅客,也可在网上自行办理退餐。【意味着,铁路体系的用户餐饮消费记录最早可以溯源到2017年7月。】
2019年5月,来自中国国家铁路集团有限公司的统计显示,系统年售票量已超过31亿张,日售票能力达到1500万张,高峰时每秒售票量达700张,网页浏览量超过1500亿次/天。互联网售票占铁路售票总量的82.8%,12306已经成为世界上规模**的实时票务交易系统。【10000次浏览量才有1张票成交,万分一的成交率。这其中应该大多都是抢票软件带来的流量。】
中国铁路客票系统作为全球交易量**的铁路票务系统,已服务8亿人群,并有3亿12306网站注册用户,2亿12306客户端总装机量。

目前,12306互联网售票占比**超过80%。

铁路客运快速发展积累了大量数据,这些数据产生于系统运行、业务运营、旅客出行等各个环节,对它们的整合和分析可为管理部门提供决策支持,为运营部门业务开展提供支撑,为旅客用户提供更个性化、更好的社会化服务。因此,充分发掘和利用这些数据资产,可为铁路产生巨大的价值。
中国铁路客票团队从2012年开始进行大数据的应用技术研究,针对数据采集、存储、处理、共享、可视化及数据安全等形成技术积累和人才储备,对客运业务及运营需求进行数据归类、模型建立和经验总结,将技术与应用结合实践,搭建小规模的大数据平台,并在部分业务系统中开展试点应用。
【铁道部是在2011年年底前实现网络售票覆盖所有车次,代表铁路+互联网已初步实现,互联网化过程会产生大量线上数据,这就需要铁路部门开始建设相应的数据治理平台及数据在内部应用的尝试】
二、铁路客运用户画像系统
大众出行的工具无非就是自行车、摩托车、汽车、客车、铁路、航空、海运等。铁路作为人们出行的重要交通工具之一,一开始也只是想着或者只提供单一的快速出行服务。但互联网的高速发展、给予了铁路更便捷的购票方式体验,而高速铁路班次的开通为注重出行质量的群体多了一个选择,这样的基础环境下,铁路用户的数量增长很快。
但其实还是会持续面临竞争对手汽运、空运的竞争,并且互联网时代用户都习惯了一条龙的服务。即便是传统的铁路服务也不能不随之升级转变,逐渐往生态合作的方向嵌入出行链前后的产品服务,提升用户体验,提升竞争能力,也为铁路集团延展了更多的收入入口。
例如站车WIFI运营服务、互联网订餐、约车、酒店、旅游等延伸服务系统,延伸服务的开发为铁路客运一站式服务提供了基础。维护客户关系的核心的保障核心服务质量的同时,给与客户出行链条全方位的增值服务。

与之匹配的,将原本的客运决策系统,仅能基于客座率、运行图、旅客出行规律等提供决策服务的,重新升级打造成为增加针对旅客购票行为、出行行为、订餐行为、站车WIFI上网等数据进行深入挖掘的的用户特征的分析系统,满足不同旅客的个性化产品服务需求。
铁路客运用户画像系统对内不仅能够为铁路12306互联网售票系统、站车WI-FI运营服务系统、互联网订餐服务系统等铁路各个系统提供旅客群体分析、用户异常行为发现、客运产品智能精准营销、广告投放等服务,对外可以为第三方企业提供数据核验、精准营销方案等服务。
【旅客群体分析及用户异常行为发现等,其实都需要相关场景板块用户参与频次够多才可以实现,单纯依靠铁路体系的沉淀数据,进展会相对较慢。另外对外服务的产品能力其实是参考运营商体系搭建的,铁路数据核验=运营商3要素核验,铁路客户精准营销=运营商精准营销。从单的客群覆盖率来说,铁路是比任一一家运营商的覆盖都大的,但从频率和维度来说,铁路之前的数据沉淀肯定还是有待提高的。】
铁路客运用户画像系统综合考虑了分布在业务系统专网、铁路服务内网、铁路服务外网等网络中的相关服务系统,构建了安全可靠的数据采集子模块以及数据服务子模块,在保证各铁路客运信息系统正常运行的情况下,能够进行业务数据采集存储,深度挖掘潜在的价值,并将分析结果运用到各个业务系统内,提高各个信息系统的服务质量。
客运用户画像的规划起因:
- 一方面,铁路企业无法依赖传统的运输服务来分析旅客的特征及分类;
- 另一方面,随着铁路的竞争对手(航空、公路等)对旅客用户标签特征的越来越重视,这种反差会直接导致铁路高价值旅客的大量流失。因此才有铁路公司自行打造客运用户画像系统的念头。
闽ICP备13000641号-4