任萍萍:真正的人工智能爆发即将到来
- 发布时间:2016-12-13
- 浏览次数:46119
【中国智能制造网 行业精英】2016年12月10日下午,第十八届北大光华新年论坛“智能浪潮下的商业价值与机遇”奥迪分论坛在北京大学光华管理学院举行。北大光华管理学院与一汽-大众奥迪携手聚焦知名企业,探讨人工智能的商业化应用、产业生态与布局,邀请专家与业内领军人士,探索人工智能带来的行业变革与商业价值。光华管理学院管理科学与信息系统系邱凌云教授主持了此次分论坛。
任萍萍:真正的人工智能爆发即将到来
科大讯飞公司的市场总监任萍萍在论坛上指出,随着近年来深度学习概念的提出,2012年语音识别技术上DNN成功地应用,以及2012年CNN在图像识别上的应用,以及2014年机器翻译中的应用,在深度学习、机器翻译以及图象识别等等技术上的突破,以及我们的大数据、我们的运算能力不断加强,我们觉得真正的人工智能爆发即将到来。
以下为演讲实录:
谢谢大家,很荣幸受到学院的邀请跟大家一起分享一下关于人工智能的话题,我们知道生物医药的突破让人的预期寿命都会超过100岁,人工智能技术的突破会让我们简单重复的劳动会被机器所替代,人们的生活会越来越美好。
当下人工智能技术到底进展到什么程度?哪些技术又有哪些应用的突破?我想站在企业的角度,我们也做了一些尝试和大家一起来分享一下。
讲到人工智能我们不得不回顾60年前的Dartmouth会议,今天我们都说人工智能60周年,这60年当中有了几次的起伏,比如说第二次人工智能的黄金期是90年代,90年代由于信息技术的发展解决了大家的问题,同样人工智能也没有达到大家想要的高度。
随着近年来深度学习概念的提出,2012年语音识别技术上DNN成功地应用,以及2012年CNN在图像识别上的应用,以及2014年机器翻译中的应用,在深度学习、机器翻译以及图象识别等等技术上的突破,以及我们的大数据、我们的运算能力不断加强,我们觉得真正的人工智能爆发即将到来。
其实不仅是我们这样提,中国的学术界在这样提,产业界在这样提,放眼全球大家都在这样提,2016世界经济论坛当中有十大经济技术,大家都提到了AR的生态,在人工智能的百年研究当中,斯坦福有一份报告当中也提出了2030年人工智能与我们的生活将有怎样的关系。我们觉得人工智能比我们想象的要快,麦肯锡的一份报告提到我们有45%的工作都会被机器代替,连CEO20%的工作都会被机器人代替,所有报告上的展示我就不一一说了。
我们觉得人工智能发展经历了三个阶段,个阶段我们所说的叫运算智能阶段,也就是计算机计算的能力和存储的能力,第二个是感知智能阶段,我们会让计算机会说话,就像奥巴马一样,说成英文、中文,以及未来还有韩语、日语等多语种,它不仅支持了我们的普通话,还支持了30多种方言,未来外语也会听得懂,这是第二个阶段。我们后人工智能一定会进入到认知智能的阶段,它不仅能听会说,它还要能理解、会思考,会帮我们做更多、更复杂的工作。
讲了人工智能的三个阶段,其实在人工智能发展过程中有一些比较核心技术的突破,接下来我就会把几个核心的技术给大家做一些分享。
我们说的个技术一定是以语音为入口的人机交互的技术,它会有声音的识别、学习的推理等等,首先我们看一下语音合成的技术,合成的技术其实刚刚奥巴马的声音就是已经很直观地给大家感受到了,在我们过去的一些比赛当中,我们连续11年获得了叫做自然度合成的一个比赛的。在这个比赛当中有美国的MIT等等有参加,讯飞有一个数据比较好玩,我们连续参加了七年讯飞都是,今年组委会改变了规则,我们不比中文,我们比亨利语,我们还是获得了。
除了合成之外我们又讲了识别,识别技术其实也有了比较大的突破,今天早上在我们新年论坛主论坛上展示的就是我们主要的识别技术,识别技术现在连续语音识别的转写率,如果是普通话水平的话,差不多能达到95%以上。其实我们在去年12月份跟速记员做过一场对比,我们找了五个业界资深的速记员和我们的机器进行PK,PK的结果是速记大概在一小时的转写的准确率可以达到70%,机器可以达到90%。
同样我们在12月份也会有发布一些除了我们的听见转写之外,在全球抗噪情况下,在噪音情况下的一些识别率,平时的时候都是比较安静的情况,在噪声环境下识别率到底怎么样,等等一系列的比赛。
除了语音识别之外,我们想说一下我们的翻译技术,翻译技术这也是业界的一些包括我们跟MIT跟香港大学一起我们把翻译技术也做到了比较高的水平,现在实时翻译比如说是在日常交易的场景下,差不多能达到6级的水平。
有了合成、有了识别、有了翻译,我们看看我们机器的认知智能到了哪个阶段,我们做机器合成的时候有几个好玩的例子,比如说爸爸举起他的儿子,因为他很重。我们来理解这个很简单,他很重一定是指儿子,对于机器来说它要理解这个逻辑是比较难的。我们在整个测试当中我们发现机器现在已经有了初步的认知智能的阶段,它可以分清第二个他指的是谁,它有基础的认知智能的阶段。
有了识别的突破、合成的识别、翻译的突破、认知智能的突破,人工智能就会像水和电一样未来改变着我们的生活,比如说在机器人的助理领域,银行领域,未来的银行大厅当中会有越来越多的机器人给我们做服务。在我们汽车的驾驶领域一会儿重点应用当中也会讲到,在安全驾驶的过程中我们眼睛没有办法看屏,我们跟这块屏如何做交互?如何让它帮助我们成为我们行驶当中的小助理,在智慧教育领域,如何做到全学科的自动阅卷等,在智慧医疗领域,我们现在做的图象识别的技术已经能达到什么样程度呢?对于一个肺部的图片,我们经过深度神经网络的学习,通过它的大小、胃部结节的位置来判断这个肿瘤是良性还是恶性的。
讲了这么多核心技术,我们也在这个行业的应用上做了一些探索,我们其实把核心的讯飞的超脑、语音技术、识别技术都开放给了合作伙伴,合作伙伴会进行二次开发,我们各种穿戴设备,我们的手表、我们的机器人、陪伴型机器人等等。在这个基础上,我们现在已经有20万的合作伙伴在这个基础上进行开发,也会有9亿的语音的总用户,各种终端设备加在一起,每一天运用语音做交互的次数已经达到了30亿。其实下面一组数据是一年前的数据,可以看到这个数据比较大的翻倍的增长。
我们想在万物互联的时代,语音作为重要的入口,如何能控制我们所有的智能穿戴式设备,我们如何能把未来的智能穿戴式设备联合起来?比如说我一回家可能空调就自动打开,我的咖啡机就会给我煮一杯咖啡,一切穿戴式设备就会进入我在家,或者我离开家的一种模式。
这是我们在智能家居当中的一些探索,我们在汽车领域的一些探索,我们觉得在汽车行驶过程当中一定是高噪音的,如何做降噪的处理,机器需要唤醒,比如说汽车我们要唤醒它它才能为我们服务,有没有可能机器在听我讲话的时候可以分析,比如说我现在说我想打电话给谁,机器知道我是有打电话的指令的,比如说来一首歌吧,我想听什么歌,这时候机器发出我想听音乐的指令,这个自由转化的系统已经可以做到了,我们可以在汽车内直接跟它说我想打电话给谁,包括谁打电话进来了,包括路况的播报、查路况等等,都可以做到。整个过程中机器会有一个交互,传统的方式是机器讲完我接着说,现在我们做了随意打断,机器给我反馈的时候,我可以直接跟它说话,它会有一个像听得懂我说话的朋友,我可以随时打断它,随时跟它做交互。
我们所谓的在汽车领域做的叫飞鱼助理,比如说麦克风的使用模式,比如说对话的识别、语意的理解等等,这个系统当中用到了人工智能领域关键的因素。
我们觉得未来的人工智能一定是以人机交互为主要的界面,这个界面需要有远场,我原来传统的识别需要把机器放在我的嘴边,现在已经远场去识别它,我们不能要求每个用户都用普通话做交互,两年前有一个山东大汉的视频大家很开心,现在技术的突破、方言的识别做得已经有了一些突破,同样的山东大汉这个过程当中必须等机器说完他才能说,现在叫全双工,比如说还有一个纠错,比如说他有一个说错了,我可以纠错等等。比如说我现在跟机器说我想查一下北京的天气,接下来我会说上海的呢?我没有说上海的天气,他通过上下文的语意理解就知道我问的是上海的天气。
随着技术的突破,我们觉得人工智能+机器人,现在已经有3000多家合作伙伴,基于我们的基础上做了很多开发,在这个基础上我们觉得机器人未来是否能帮我们做更多的工作,是否能成为我们的助理,可能主要的是要它听得懂我们的话,能理解我们的工作,越来越多地替代我们简单重复的工作。
这里会讲到一些在教育领域的尝试,我们通过一些课堂作业,包括考试的过程中的监控,对它的大数据进行一些分析,我们会调取出来在整个学习的过程中有哪些知识点没有掌握?以及一些深度的分析,告诉他要做哪些课题来提升他的学习效率。我们在上半年的时候跟工信部一起发布了中国的人工智能《深圳宣言》,我们希望在人工智能的领域是用产学研共同推动人工智能的核心技术、源头技术的创新一定要控制在我们自己手里面。同时,我们希望人工智能的产业发展需要有一些标准的制定,包括一些未来万物互联的时代,大家要有共同的标准、共同的接口来对待人工智能的产业链。同样的我们需要有更多的生态来打造人工智能的整个产业平台,人工智能也会带来一些新的话题,比如说机器人伤人等等一些法律法规。
同样,我们希望我们一起共同迎接AR的降临,我们希望超越不可能,在中国用人工智能改变世界,谢谢大家!
(原标题:任萍萍:真正的人工智能爆发即将到来)