申翔宇:野蛮生长的数据交易市场需要公正透明的平台
- 发布时间:2016-10-18
- 浏览次数:31669
2015年,可以说是大数据交易所的发展元年。据不完全统计,2015年成立的大数据交易所和交易中心有:贵阳大数据交易所、东湖大数据交易中心、京津冀大数据交易中心、华中大数据交易所、河北大数据交易中心等。2016年,全国也不断涌现数据交易中心的新面孔,如:上海数据交易中心、长江大数据交易中心、浙江大数据交易中心、丝路辉煌大数据交易中心等。
其中,上海数据交易中心成立于2016年4月1日。10月7日,上海数据交易中心正式宣布开放交易系统,实现24小时去中心化线上数据交易。成立半年以来,上海数据交易中心是如何进行数据交易的?又如何保障数据安全性?近日,带着这些问题,记者专访了上海数据交易中心合伙人申翔宇。
上海数据交易中心合伙人申翔宇
问:请问申总我们“上海数据交易中心”的理念是什么?有什么样的愿景?
申翔宇:“上海数据交易中心”没有简单使用“交易”两字,我们的使命定位是“数据互联、智慧未来”。什么意思?就是更多的数据不是一个简单的交易,更希望能够在大家的应用中,所需求的数据能够直接应用。所以我们用了“互联”两个字。这个方式下整个数据会有更多的融合,更多的融合能够创造更多的智慧和价值。同时我们希望在创新、诚信和共赢的理念下,把交易中心打造成一个龙头性的企业,促进国内合法数据流通的生态形成。这个应该也切合了今天整个会议的情况,随着社会化分工的进展,数据流通到了形成专门交易机构的时间点了。
问:目前我们中国数据交易市场现状如何?上海数据交易中心进行了哪些探索?
申翔宇:现在整个国内的交易情况,我们感觉是在野蛮生长的过程中,各行各业很多都在做,龙蛇混杂。如果包括黑灰色市场,说起来整个国内的数据交易或者流通量很不小。正规的,比如“你上新浪,怎么看到一些前面刚百度搜索过的东西在我广告页展现出来了?”,这种就是数据流通范畴下的事情。同时现在黑灰色市场也很猖獗,比如前段时间徐玉玉案件的信息倒卖情况,它也是一种数据流通,只不过是一种非法下的流通,直接就是违法。
一直以来,上海市政府希望有一个阳光下的、公正透明的数据交易平台,支持我们合法、正规、有商业信誉的企业用好数据,更多实现商业数据价值。
问:上海数据交易中心如何保证数据交易的安全性?
申翔宇:这个过程中,我们上海交易中心也是不敢走得太快,我们成立是16年4月1日,不过我们15年已经开始筹建过程了。这过程中做的步事情是在“有效”和“合规”这4个字上面花了很多精力。为此,我们更多在规则制度上进行了一些探索和研究。举个例子,像合规这个事情,大家一直在说中国缺一个“个人信息保护法”,其实我们和华东政法、华师大的联合课题项目发现,我们国家对个人信息保护很严格,也可以说特别严格,更有明确到刑法层面的内容,比如倒卖个人隐私信息,是直接录在我们的刑法中的;还有很多人大、国务院、工信部出过不少这方面的法律法规,可能的问题是在“分散”。
通过对这些法律法规研究,其实我们现在能够定出什么样的数据可以进行流通。同时我们更研究了“在什么样的前提条件、关于什么对象标识,什么样的方式格式来描述数据”,这3样东西清晰定义出来,我们就有了一个框,通过这个框很方便来评判和形成合法流通数据。
第二个,“有效”。其实有效很简单,就是你给我的东西对我有没有市场价值。所以它的判断点应该是在应用这侧:我的应用使用了你的数据,是否帮我形成了更多价值,带来更多用户,等等。所以我们对“有效”的定义是对应用有帮助,能够提升应用价值的数据。
然后“有效”和“合规”对应起来,我们就可以定义出一个很清晰的实现流程,我们叫“小可用数据”。数据是针对你应用加工的,而应用所需的数据是有限的;再在整个合规的框架下面进行瘦身,尽量“小”;后形成一个可交易的交易品。
基于以上内容,10月7日发布了我们的交易系统。把前期准备的“个人数据保护原则”、“数据互联禁止清单”、“数据处理准则”(即应该准备什么样的数据)和“数据互联规则”(相互间交易互联流通的规则)这4份文件进行公开发布。
从现在我们试运行试验阶段看,我们这些体系、规范得到了很多成员的支持,我们在前期的成员邀请过程中难度并不高,基本就是1、2次交流,说清我们是怎样组织数据的,大家就都很愿意加入数据交易中心。
问:接下来后一个问题,上海数据交易中心是如何进行数据交易的?
申翔宇:刚才说到10月7日我们发布这个交易平台,这个平台简单来说包含了5大功能板块,个板块是成员注册板块。我们现在是严格管理的一个方式,必须是国内注册并合法存续的一个企业法人或非法人的组织机构,第二个如果你作为一个数据供应方,需要有清晰的数据来源证明(包括用户的采集授权文件,或数据收集方给你的授权)。
第二个板块是数据挂牌。明示我们成员之间有哪些数据需要和供应。挂牌内容不仅包括数据,还可以包括应用和工具,共三种挂牌内容。整个挂牌内容格式我们也申请了,叫数据的六要素管理结构,通过对对象数据标识约定(Id),维度的约定(Key),描述颗粒度的约定(Value),数据使用的条件约束(Limit)、时间轴的约束(Time)、和价格(Price)的六要素的清晰描述,能够很方便告知大家有什么数据,需要什么数据,方便达成诉求。挂牌以后涉及到我们叫撮合的环节,主要解决相互之间对价值的认同度。一般来说现在实际情况,需方的价格和供方的价格会有一个价值差,怎么双方之间后达成一个共识,里面有很多窍门,也有一些理论性研究。像我们刚才说的六要素,后一共形成40多个字段,包括你的应用场景、约束条件等等,这些都会影响价格。我们会形成指导价格、需求方价格和供应方价格三者的撮合,后形成一个供需双方能够接受的价格进入后续的配送和流通。
第四步,像会上说的:我们仅仅是一个桥梁,帮助大家从供需方之间数据流动起来,所以需要有一个技术平台和接口支持你同步或者异步,在线完成数据传递。
后一步是清算、结算。因为供方和需方的付款到底是以你记录的量为准,还是用他记录的量为准。需要有一个第三方或者平台方来确认记录相互之间的结算量,然后每个月按这个记录量,完成双方之间的清算工作。
(原标题:数据观专访申翔宇:野蛮生长的数据交易市场需要公正透明的平台)