编辑导语:政府数据是政府在运作过程中采集到的数据,我们在日常办事中会遇到,比如常遇到的身份认证、信息绑定等等,这就是政府数据的案例;本文作者详细的分享了关于政府数据与如今各行业的发展与融合的思考,我们一起来了解一下。

笔者以前主要关注的是在金融科技行业相关的数据、场景及应用,持续观察了解过程,发现这个行业的数据玩家的数据采集、数据使用及数据权属非常不清晰,存在风险非常大,与政策的整体大基调是相悖的。
虽然2020年前都没有明确的政策文件,但猎人基于一些相关的个人信息安全法等数据及信息安全条文,及基于任何场景的最终使用对象肯定会落实到人这一基础点;无论是前期的数据采集及最终的数据的使用均需要自然人及法人的授权,而当时情况至少80%以上数据采集及数据使用未获得用户授权;最近几年很多不合规的头部机构倒闭或停掉相关业务,其实也在映证这一点。
这类头部数据玩家90%以上属于非备案、非征信、非官方机构,但却做着合规机构的相似的业务,这个商业模式就存在非常大的风险。而与这些数据机构合作的正规机构业务由于核心数据产品均采用其数据为主,这些数据机构倒闭或数据不能服务都对正规机构核心数据产品业务直接停滞或风控能力大幅度降低,营收水平大大受挫。
而政府数据(国家拥有的数据,或者泛指政府拥有的数据,分为部委数据(全国性数据),地方政府数据(区域型数据))作为权属最清晰,也是来源最合规的数据出口;在笔者的研究中发现,在这块的定位、这类数据的服务平台或产品应用服务公司,其实非常少。
但政府数据的一些基础的市场化应用其实在我们日常生活都经常接触到,是最直接的收益群体;例如身份证信息核验、跨行绑定银行卡信息核验、手机号实名制识别等,这些产品其实也就是我们的政府数据应用案例,身份证信息核验来自公安部、跨行绑定银行卡信息核验来自银联、手机号实名制识别来自运营商。
因此,笔者判断政府数据的潜在价值有待释放,特别是在金融科技行业,这个最需要合规安全的数据源的场景。
一、政府数据潜在价值体现
政府数据相信很多读者都不怎么熟悉,这里各位可以先看下这些关键词,感受下这些关键词背后政府数据的价值所在。

我这里把这些关键词,连成一段话给各位感受下:数据是第五大生产力,在我国数据中80%属于政府数据,政府数据属于新型国有资产,归国资委管理。
国家正在大力推动数据要素市场化,引导数据交易在合规数据交易平台上交易。数字经济规模占GDP的3分之一,核心要素是数据。
数字经济发展趋势有“五化”:数字产业化、产业数字化、数字化治理、数据价值化及数据资产化。
二、政府数据是什么

政府数据的概念可以参考《深圳经济特区数据条例(征求意见稿)》中的“公共数据”的定义:
“公共数据”是指本市各级行政机关和依法授权行使行政职能的组织以及具有公共管理和服务职能的企事业单位(以下统称“公共管理和服务机构”)在依法履职或提供公共管理和服务过程中收集或产生的,以一定形式记录、保存的各类数据及其衍生数据。
本条例所称具有公共管理和服务职能的企事业单位包括但不限于本市行政区域内与人民群众利益密切相关的教育、卫生健康、供水、供电、供气、供热、金融、电信、公共交通等企事业单位。
政府数据简单理解为政府在运作过程中采集到的数据,这些数据因为政府相关部门职能的不一样,采集到的数据维度类型也是不同的。
为了让各位更直观的了解政府数据的现有形态及情况,猎人通过比较熟悉的数据宝公司的政府数据矩阵给各位做个简单的内容普及;数据宝作为全国在政府数据这块的领跑者,已链接了近50家部委(全国约70家部委)的数据,我们通过数据宝的政府数据链接谱图,来更进一步了解政府数据的情况,同时了解为什么政府数据能支持如何多的应用场景。
政府数据分散于各个部委、厅局委办局的各系统中,由各部委、厅局委办局各自保管,通过设定特定部门、成立全资子公司来对外提供数据出口。
数据宝作为全国范围不足20家机构企业中拥有大数据资产交易资质的公司,现在链接的政府数据包括覆盖14亿人口的公安部数据,覆盖全国73亿+的银联数据,覆盖全网的近16亿手机用户数据、覆盖全国上亿企业的相关数据、覆盖全国31个省2亿台车的高速卡口数据、覆盖全国全量车辆及全量驾驶证群体的数据,覆盖8亿+的铁路用户出行数据等——人车企三种类型均有相对较全面的覆盖。
以上部委数据可以通过单个部委或多个部委数据融合形成产品再为数字经济赋能。如我们使用的各种APP注册实名时需要用到公安部和运营商的数据实现信息真实性判断,我们绑定各行银行卡时需要银联的数据能力支持跨行绑卡信息真实性识别。
我们申请贷款时,个人贷款需要社保公积金数据,需要人社部门的数据支持;申请企业贷款时,需要央行征信及税务局的数据支持;如果没有这些政府数据的开放支持,很多业务都无法正常运作及对外服务,所以政府数据的开放程度及维度在一定程度上直接决定了企业能提高什么服务及提供服务的效率是高还是低。
三、政府数据与其他类型数据的区别
行业内的营销部门、风控部门及渠道采购部门可能接触较多的数据有企业数据、公开数据及个人数据。
1)企业数据:主要指企业在正常运营过程中,通过为客户提供产品及服务,合规合理有度的采集到并留存下来的客户自动提供或被动获取的相关数据,及整个运营过程中各类产品及服务产生的其他相关数据。行业内的巨头数据量级及维度都是领先,因此其在业务服务类型及能力上都远超其他跟随者,企业业务覆盖人群越广,能积累的数据也越多,形成良性循环;而体量不够大的企业,只能做垂直细分场景。企业数据用的好的机构如阿里的借呗花呗、京东的白条产品等。
2)公开数据:简单理解为我们从搜索引擎能搜索到的及各类网站上公开的信息,当然有一大部分公开数据属于政府公开的数据;公开数据的数据积累的核心要点在于该企业掌握的爬虫引擎能力的强弱,因此爬取公开数据经常需要与目标网站做技术对抗;虽说很多网站的数据都是公开的,但这些网站的数据搜集起来也是不容易的,他们也不希望辛苦积累的数据被其他公司轻易爬走。公开数据用的较好的机构如天眼查、企查查等。
3)个人数据:个人才有的或能够在特定场合提供的信息数据,例如线下贷款填表填的一些信息。
而政府数据比较特殊,政府数据按照相应的整体方针的规划,分三类,无条件开放-公开数据、有条件开放-脱敏授权、不允许开放-涉密数据。
政府数据的价值为什么大,最简单的原因是,政府掌握大部分的企业经营数据、公开数据大部分是政府公开的数据、政府数据涵盖了大部分的个人数据;政府数据没覆盖的是企业运作过程中比较隐秘的未公开数据、个人私有的独特数据。

四、政府数据市场化核心三步走
政府数据是个宝藏,但至今还是在市场化开放的起跑线上,属于初步阶段。
原因是大部分的政府数据都是没经过标准化处理的,还停留在信息化内部使用阶段,能够市场化的数据少之又少,同时政府部门也没有专门的团队去专门研究这个事情,因此政府数据到市场这个过程是有很大一块工作需要处理的。
2020年新基建的大力发展,很多的政府机构都在积极响应,而各种智能城市大脑建设的大厂也在积极为政府数据做数据治理相关工作,打好数据基础;但实际情况是,这些大厂能实现的其实是升级版的政府信息化,达不到政府数据市场化的要求,因为这不是个简单的技术活,而是实打实的数据应用创新变现的活。

这里以数据宝为全国交通部数据从治理到应用变现的全生命周期过程总结的方法论来了解下政府数据市场化的核心三步走是个什么情况。
数据宝内部总结出来的政府数据市场化三步走叫做“商品化三级治理”,一级治理主要目的是实现基础化治理,使各政府部门各类系统汇集的数据达到有序化;二级治理的主要目的是合规化治理,达到政府数据共享开放标准,并实现数据安全分级分类;包括行业的一些大厂在为政府提升数据治理时也只能做到二级治理,也就是建立各种数据资源目录。
而数据宝掌握了特有的第三级治理,商品化治理,针对数据应用场景,实现政府数据资源商品化,达到市场可交易变现的标准。通过定目标、定角色、定任务、定机制、定流程及定考核来保障全流程。治理后的政府数据将获得以下属性:数据权属清晰、标注充分、全面安全属性、能跨网安全流转及实现商品化应用——这也是政府数据市场化前必须实现的步骤。

五、政府数据市场化案例-交通部

交通部掌握了全国31个省(目前西藏和海南特殊原因无有效数据),2亿台车(乘用车及运营车),覆盖12000个高速出入口站点,25000多个ETC门架,数据量级达数百亿级。
2020年的主要数据如车牌号都是通过摄像头拍摄提取,各省站点建设之初,建设的摄像头能力不一;同时由于各种现场环境因素如天气、位置、灯光等导致采集数据会产生缺失或误识别,这类原因导致的各种脏乱数据非常多,无法直接市场化。
因此需要三步走,先进行数据有序化治理,实现数据标准基础化,然后各省间数据共享比对,进行数据有效优化;同时也能促进各省部门积极采集及共享数据,同时按照交通部的治理反馈优化内部采集流程提高区域数据采集质量;**通过商品化产品打造流程,将数据维度按照场景需求进行拆分,结合各自模型能力实现相应的产品形态。

六、政府数据赋能产业潜在市场规模
国务院《促进大数据发展行动纲要》目标要求,大大加速了大数据行业的发展,2015年底我国大数据核心产业规模是696.7亿元,2017年达到1335亿元,到2020年爆发式增长到1万亿元;到2020年,我国大数据关联产业产值将达到10万亿元,大数据融合产业产值将达到20万亿元。
金融科技仅是数字科技的一个提前发力的板块,但不是全部。整个大数据产业分为核心产业、关联产业、融合产业,每个细分产业都是10万亿以上的潜在规模;金融科技板块的发展路径,数据融合创新思路等方面的经验均可以作为我们研究其他产业科技的发展路径及数据融合创新应用思路的借鉴。
七、政府响应数据市场化开放具体表现
截至2019年,全国已有23个省份成立省级大数据管理机构,超过20个城市成立市级大数据管理机构。
当下各级政府正在如火如荼地推进的智慧城市建设,大数据无疑更是关键中的关键;然而,从各地智慧城市、数字政府建设的具体实践来看,**痛点和瓶颈也正是数据的匮乏;各地大数据匮乏的核心症结在于各级部门未能充分认识到大数据的重要性,缺乏汇集大数据的意识和动力,而关键则是缺乏相应的大数据相关机构。
大数据管理局的成立表明,当地政府已充分认识到大数据的重要性,专职机构的设立也能真正敦促各级各部门更重视大数据建设;各级政府机构拥有海量的原始数据,如气象、人口、环境、土地等公共数据,安全、海关、旅游等管理数据,教育、医疗、金融等服务数据,这些构成了社会发展与运行的基础。

当数据在具体的政府单一部门时,产生不了任何价值,但如果将这些数据进行关联分析,将产生巨大的社会价值和经济效益,但是由于各级各部门从部门利益出发,宁愿让数据烂在自己手中也不愿意共享数据;这一方面导致了一个个的“数据孤岛”,难以实现数据的互联互通。另一方面相互割裂的数据事实上根本不是大数据,只能被称为“小数据”。
例如,工商数据在工商部门,金融数据在金融办,医疗数据在医疗部门,房屋数据在房管部门,教育数据在教育部门;而通过新设立的大数据管理局,通过有效措施切实打破各部门之间的“数据孤岛”,数据联网之后则数据可以在各个部门之间同步交互、共享,一个市民在房管部门住房状态的改变可以同步到公安部门,这样不仅能够提升效率,而且能够帮助相关部门提升现代治理能力。
政府内部在打破“数据孤岛”,这个过程会促进区域政府数据的汇集,区域政府数据的汇集最终流向部委。
八、政府数据市场化开放进程

政府数据的市场化在2001年就已经在初步尝试了,但整体进展到了2020年还是相对较慢;而企业类、公开类数据的市场化路径及进展非常快,但主要也是得利于互联网金融野蛮生长对数据的需求,用数据换时间,用时间换效率,用效率换规模,简单点就是:数据=规模。
闽ICP备13000641号-4