资讯中心

大数据将带来公共管理的重大革命

来源:行政论坛
编辑:一不做
2017/9/7 9:01:09
80710
导读:大数据具有数量大、数据多样化、价值密度低、速度快的特征,通过技术提供独特的也是全新的思维奠定了我们的学习创新(深度学习)、科技创新和管理创新。
  【中国智能制造网 学术论文】大数据具有数量大、数据多样化、价值密度低、速度快的特征,通过技术提供独特的也是全新的思维奠定了我们的学习创新(深度学习)、科技创新和管理创新。大数据科学与管理科学的结合从而产生大数据的管理,大数据独特的收集功能、储存功能、分析功能、价值挖掘功能和预测功能,促使公共管理从封闭性的管理结构转向开放性的管理结构;从官僚科层制转向扁平化结构;从公共管理与政治管理边界模糊的结构转向公共管理与政治管理边界清晰的结构;从专注于对人的管理转变为对数据的管理并借助于大数据来为人服务的模式;从被动应对性的公共决策转向基于大数据之上的主动性的优化决策。当然,这些变革也就意味着风险,其中包括导致公共管理中的不确定性风险和不可靠性风险。
 
  关键词:大数据/公共管理/大数据功能/公共管理变革
 
  作者简介:胡键(1968-),男,湖南道县人,上海社会科学院研究员,博士研究生导师,从事中国软实力研究,上海 200020
 
  基金项目:国家社会科学基金项目“中国软实力评估及增进方略研究”(14BKS064)
 
  公共管理是公权力的行使者决定公共资源在公共领域配置的过程。公权力配置公共资源并不是随意性的,科学配置公共资源必须建立在对公共领域详细了解的基础上;否则,公共资源的配置就会出现扭曲,终导致公共资源的浪费和无效配置。传统的公共管理是借助于历史经验的反复比较,正所谓“以史为鉴,可知兴替”。今天虽然历史纵向的比较仍然可以获得经验,但这并非的方法,甚至可以说是一种陈旧的方法论。新的方法是基于大数据的公共管理,大数据将带来公共管理的重大革命。
 
  一、大数据的内涵和特征
 
  “大数据”是近年来的一个技术热词,也是一个学术热词,同时也是一个政府施政的热词①。大数据究竟是什么?并非一个人人都能回答的问题。有学者把大数据视为一种统计工具,并将大数据解释为“不是基于人工设计、借助传统方法而获得的有限、固定、不连续、不可扩充的结构型数据,而是基于现代信息技术与工具可以自动记录、储存和连续扩充的、大大超出传统统计记录与储存能力的一切类型的数据”[1]。在这些学者看来,大数据对人类思维的影响也仅仅是表现在“认识数据思维的变化”、“收集数据思维的变化”和“分析数据思维的变化”[1]。即便有学者对大数据有比前者更深入的理解,认为“大数据将深刻影响人类的决策模式和社会经济的运行模式”,但也仍然是从统计学的角度来思考大数据的意义[2]。从技术上来看,大数据可以归人统计工具之内,但大数据与统计工具是存在巨大差别的。传统统计工具是以传统统计方法为代表的“以算法为中心”的,而大数据是以数据挖掘为核心的“以数据为中心”的统计[3]。前者通常需要提前对数据分布和误差结构等做出假设,在某种意义上其结果只是人工拟合的近似世界而非真实世界,而后者基于总体数据可以给出更加的描述和预测[4]。由此可见,大数据虽然可以归入统计工具之内,但它不是一般意义上的统计,一般的统计只是基于既有数据的分析,而大数据是透过既有的数据可以挖掘出既有数据隐藏着的数据和价值。尤其是大数据中的非结构性数据本身就隐藏着巨大的价值,这是战略预测的重要依据;相反,传统统计工具一般不会对非结构性数据产生兴趣。也有学者认为,大数据既是数据,也是一种技术和能力,“是数据收集、分析的前沿技术,是从各种类型的庞大数据中快速获得有价值信息的能力”[5]。持这种观点的学者认为,大数据实际上是用来决策的工具。但是,大数据在于它的全数据、混杂性和相关性,大数据根本无法提供决策的工具。不过,大数据却能够提供一种独特的思维。也就是说,大数据并不是提供决策的具体工具的,而是提供全新的决策思维的。指望用大数据来提供一种的决策工具是不可能的,但大数据思维的确使决策对数据产生严重的依赖性,然而,正如舍恩伯格所说的那样,“数据远远没有我们想象的那么可靠”[6]208,“大数据为我们提供的不是终答案,只是参考答案”[6]233。还有学者认为,大数据就是指人们借助于云技术运用数据的能力,当然这种数据不是一般的数据,而是海量数据包括结构性数据和非结构性数据。也即是人们借助于云技术使用结构型数据和非结构性数据的能力,而这种能力体现在国家治理、隐私保护、公共服务、医疗卫生等。这方面的成果不少,但基本上都是从集体的领域来分析的,这里不一一列举。
 
  大数据固然是数据,也是技术、能力和价值,也正因为如此,人们都是从这些方面来认识大数据特征的,即通常用4个V(即Volume,Variety,Value,Velocity)来概括大数据的特征。
 
  1.数据体量巨大(Volume)。据估计,人类生产的所有印刷材料的数据量是200PB(1PB=2[10]TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=2[10]PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级②。
 
  2.数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出更高的要求。
 
  3.价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一两秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”,成为目前大数据背景下亟待解决的难题[7]。由于数据多、总量大、价值密度低,因此,人们对数据(信息)的关注度就非常低。正如约瑟夫·奈所说:“丰富的信息导致关注的贫乏。当我们被大量的信息淹没在其中之时,我们难以确定关注什么。注意力取代信息成为稀有资源,而可以将有价值的信号与白噪音区分开来的人就获得了权力。”[8]奈所说的“将有价值的信号与白噪音区分开来”,在大数据中就是数据挖掘;而“获得了权力”的意思在大数据中就是指获得价值。另外,Value还有一层意思是指大数据所蕴含的巨大价值。大数据虽然因信息超大规模而导致关注度降低,进而使数据的价值密度降低,但是,大数据之大在于数据具有“再生性”,数据的价值具有巨大的增值效应。大数据的使用者并非停留在对表层数据的使用和发现表层数据的价值,而是通过表层数据不断挖掘,既可挖掘更深层次的数据,也可通过深层次的各种数据(包括结构性数据和非结构性数据),从而挖掘出更大的价值。
 
  4.速度快(Velocity)。大数据框架内的速度包括两个方面:一方面,指如何加快数据的导入;另一方面,指如何加快分析和利用新导入的数据。前者的一个重要原因是大数据时代数据产生迅速,而大数据本身要求的是全数据,如果没有快速导入数据的技术,那么就很难做到全数据,不是全数据就不能成为大数据。后者则是由大数据的目标所决定的。大数据的目标是利用大数据进行科学分析和科学预测,新数据不断产生,那就意味着新问题、新情况也迅速产生。没有快速分析和利用新数据的能力,那么,所有的预测都是滞后的。滞后的预测会导致大数据丧失其预测功能。因此,在如此海量的数据面前,处理数据的效率就是一个机构的生命力所在。
 
  除了上述四个特征,大数据更重要的还是提供一种独特的思维,即大数据思维。什么是大数据思维呢?(1)开放性思维。由于大数据的来源是多源性、多路径的,也就是说,数据本身是开放性的。因此,在分析数据和基于大数据进行预测的时候也需要一种开放性的思维来进行分析和预测。(2)非线性思维。这种思维要求我们在分析问题的时候不能仅仅凭几个要素来进行决策,而是要把所有相关性因素都要纳入分析框架。尤其是不能用简单的因果关系来进行决策,要充分考虑问题的复杂性。(3)价值思维,不能把数据仅仅看作数据,要认识到数据背后的巨大价值。传统的数据思维是数理统计思维,认为数据的本质在于统计,统计的目的是揭示历史过往中的基本特征和基本规律,根本没有通过数据来获得价值的思维。大数据思维就是通过数据的导人、分析,挖掘出巨大的价值。这种思维是完全不同于传统思维的全新思维。这种思维奠定了我们的学习创新(深度学习)、科技创新和管理创新。
 
  二、大数据与公共管理的结合
 
  公共管理的数据来自何处?弄清楚这个问题,首先要清楚数字和数据的区别,以及数据科学与管理科学是怎样结合在一起的。不但数字与数据有巨大的差别,而且传统数据与大数据也有本质的区别。一个数字只是一个符号,表现为一个数值或者是文本型数字,数字只是数据的一种形式。而数据则是一个很宽泛的概念,“只要是对客观事物记录下来的、可以鉴别的符号都可以称之为数据,包括数字、文字、音频、视频等等”[9]。也就是说,数据是关于某个(些)方面的一组数字,表现形式就不只是数字,而是有更多的表现形式。数字毫无疑问是统计科学的基本素材,但统计主要是对结构化数据进行统计分析,对非结构化数据一般都不会纳入传统统计之内,而实际上,云技术普及应用之后,90%的数据是非结构性数据,而且是富含大量价值的数据。由此可见,数字和数据不但在形式上完全不一样,而且在内容上也是大相径庭的。在云技术出现之前,数据仍然主要表现为以结构性数据为主的传统数据。这种数据虽然也会用于分析和研究,也表现为定量的微观分析,但它所诠释的仍然是一个问题的宏观和整体的状况,而且根据这种数据所进行的决策也仍然是宏观决策。这主要是受制于传统数据的采集方法、分类方法和采集标准。然而,云技术诞生以后,大数据的采集、分类、分析等方法和手段都彻底精细化,这样大数据才能对所涉及的对象进行微观性和个性化的分析。换言之,传统的数据只能算是小数据,小数据揭示问题的宏观现象,而大数据则可以揭示问题的内在本质。
 
  大数据产生之后,数据科学迎来划时代的变革,这种变革的大表现是数据科学与其他科学的内在结合,并形成基于大数据的新兴科学。数据科学初与企业管理结合得紧,主要原因是:随着社会化分工越来越细,企业生产的社会化程度也越来越高,因而企业的管理包括预测、决策等都越来越复杂,越来越依赖于完整的客观数据。而基于云平台和云计算的大数据可以为企业提供这种大数据服务。随着数据科学的迅速发展,公共管理、社会管理等也都全面引入数据科学。尤其是在新世纪,各国在继20世纪90年代推行的各行各业包括政府的“上网工程”之后,各国在新世纪又大力推行大数据战略。所以,大数据已经全面介入公共管理、社会管理之中。在这种情形下,数据科学与管理科学的高度相符嵌入而实现管理实践的巨大飞跃,尤其是使基于大数据之上的精细化管理和微观管理成为现实。在继西方各大国大数据战略之后,中国政府也颁布相应的大数据战略,制定“建立‘用数据说话、用数据决策、用数据管理、用数据创新’的管理机制,实现基于数据的科学决策,将推动政府管理理念和社会治理模式进步”的行动方案[10]。这也表明,大数据将在短期内成为公共管理等领域内的主要技术工具,也是提升政府治理能力的重要技术手段。
 
  既然大数据全面嵌入公共管理,那么,公共管理所依赖的大数据又来自何处呢?众所周知,公共管理的内容非常广泛,公共管理以社会公共事务作为管理对象,而社会公共事务的具体内容分为公共资源、公共项目、社会问题等内容。因此,用于公共管理的大数据并不是单一性的,而是来自各个领域的大数据。几十年互联网的发展为数据积累提供了重要技术平台,加之大数据搜索引擎的发展,使社会产生的所有数据都能够获得迅速且有效的收集和储存。特别是世界各国的电子政务建设为公共管理积累了大量数字化的业务数据,既是政府大数据的重要来源,也是用于公共管理的大数据。这些数据主要来自以下四个方面:
 

热门评论

下一篇:余乃忠:实践论是大数据时代知识大战的阵地

相关新闻

<