智能制造网

登录

陆奇:云计算和人工智能给微软带来怎样的新机会?

发布时间:2016-08-10
浏览次数:36105
  【中国智能制造网 访谈】从2014年5月29日发布以来,“小冰”已经更新到了第四代,年纪也从16岁长到了18岁。过去两年多时间里,小冰在微信、微博、美图等平台上积累了上千万的用户,对话量超过了200亿条。
  
  陆奇:云计算和人工智能给微软带来怎样的新机会?
  
  在相互的对话过程中,她也表现得越来越像一个正常人。比如她可以识别你发给她的图片,能在文字和语音之间进行切换,能够采用某种“策略”把你带出消极情绪,甚至,可以跟你打电话。
  
  “小冰”已经成为了微软在人工智能领域的一个战略级产品,而作为这个项目的之一,微软全球执行副总裁陆奇也从美国飞到了北京。在发布会结束之后,他跟记者聊起了小冰、微软的人工智能战略,还有如何在过去几年进行产品和业务转型升级。
  
  陆奇认为,人工智能终将表现在“对话”这个核心的诉求点上。当人工智能可以向电影《她》中那样与人类自然对话,与人类产生情感联系,那么将给整个社会带来巨在的变化。而微软小冰已经在这条路上走了两年多。
  
  陆奇在进入微软之前,很长一段时间就职于雅虎。当被问到微软这个巨人应该如何转身,而避免雅虎的悲剧时,他觉得两个公司面临的情况并不太相同。雅虎的门户已经被搜索引擎和社交网络取代,而微软在借助云计算技术之后,把原有的产品重新推向了一个更为广阔的市场。
  
  以下是采访实录。
  
  关于微软小冰
  
  记者:小冰一个很大的特色是它的情感计算框架。但是人类的情感是很复杂的,包括积极的情感、消极的情感。从目前现看,小冰基本上表现的都是积极的情感,与人平等的对话可能会涉及消极的表达,小冰在这方面会有学习吗?
  
  陆奇:按照我们人工智能、大数据和机器学习技术,人的情感只要有数字化的介入,行为的规范基本上是可以学出来的。微软想要建立人工智能是代表正能量的,是为人类服务,帮助人类的。所以在这种情况下,我们想要建立的对话,采用的策略,基本上引导人类从他的消极或者负面环境(中走出来)。
  
  记者:小冰已经可以做到和人类打电话了。但人和机器之间文字的交流,实时的讲话,实时的了解人的语境,进行语音的反馈,这方面是挺难的吧?
  
  陆奇:从某种意义上来讲,我们为人工智能所产生的对话能力,提出了一个新的标准,如何在实时性方向,非常智能的,就像人与人之间交流,确实技术上有很大的问题。
  
  我们首先要听得懂,语音识别要非常清楚,速度得非常非常快;第二,交互的能力非常广,但是如何把这些技术,有难度的核心技术提高到一定的层次,把它集合起来,使整个的用户体验,真的像人与人之间智能交互,这是非常重要的。
  
  刚才有一位女士上去试了一下,小冰可能今天没法测试说今天给我打电话的是个男的还是女的,有很多事情要解决。
  
  记者:为什么要赋予小冰这样一种实时对话的能力?
  
  陆奇:人类跟任何种类不一样的地方,我们发明了语言,人与人之间近距离的交换,后来有了电话以后,可以远距离的交换,就是实时的交换,不光把人类进化,而且产生人类知识,人生整个演进过程中起了非常大的作用,人工智能会成为新的人与人之间交流的基准桥梁。
  
  其实是蛮振奋人心的,虽然我们没有完全把技术问题解决,但是我们至少定义了这是一个新的里程碑,将来不管是机器人也好,它是一个自然的交流形式,完全可以连续实时的、可以不断的,毫无保留的讲。
  
  记者:我们离这个理想的自然交流状态有多远?
  
  陆奇:根据我们现在的深度学习技术,只是一个时间问题。把数据输进去,不断地去训练,在2009年之前,错误率接近30%,这么几年已经从30%降到8%,可以预测再过一两年,就差不多1.5%左右,这也是我们技术上可以解决的。
  
  我们的语音团队是全球性的团队,小冰在开拓性领域,我在美国的语音团队他们讲,他们必须把中文的优先级继续提高,小冰从技术上来讲,用户体验上是全球领先的。今天演示的时候,我们还是比较紧张的,错误率在8%左右,一旦听不准以后,接下来的交互完全不准确了。
  
  记者:在开发小冰日语版的时候,是基于中文翻译平台,还是从零开始,本地语言开发出来?
  
  陆奇:从零开始,文化语言环境完全不一样。一开始我们跟项目负责人有过讨论,是不是这个产品只有中国玩的转?我们说至少试试,看哪个国家哪个语言跟我们接近,就是日本。试下来以后我们就知道了,这个产品肯定是全球化的。但是每个国家必须要从零开始,因为每个国家的语言和文化不一样,你没法搬过去。
  
  记者:现在做人工智能其实是用深度学习的方式,利用现有的很多样本。那微软是怎么样产生这样的样本的?人工给一个图片,或者一段话分析他的情感,给小冰来训练吗?
  
  陆奇:从算法上来说,机器学习从整个历史上来讲有几种大的方式,一种是你有样本,真正做到人工智能的有非常大的限制。AlphaGo大的创新,是使用了增强学习,可以自我学习,但是这也有它的限制,它的限制就是你探索的环境多大,如果探索环境不大的话,你学来学去,就是学一个封闭的系统。
  
  我们公司的团队研发迁移,我自己个人也做了不少,人与人之间知识可以传输的,迁移也必须要做。后还要解决一部分问题,人一部分的知识,我没有做增强,也没有人来教我,我自己琢磨。所以人的知识就是三部分把它总结起来,增强学习,这是三部分学习的方式,我们微软这方面做的研发做的比较多。
  
  记者:小冰各方面的能力,对情感的把握和去年相比有很大的提升,微软有没有想过把商业化给提上议程?
  
  陆奇:小冰的盈利空间是非常大的,我们完全有机会创建新一代盈利形式,跟搜索广告一样,我觉得搜索广告可能是盈利好的代表。
  
  为什么搜索广告业务有效性非常强,同时用户体验可以维持在很高的水平,有几个层面,个,信息结构。搜索广告和自然搜索的结果是完全一样,都是针对关键词。第二,用户体验也是吻合;第三,搜索广告效益完全可以用的方法来测试;第四,搜索广告盈利体系是建立市场机制,每个广告商要不断地提高广告的质量。
  
  像小冰这样的产品,它的战略意义,对整个生态系统的广泛度,在这个阶段我对团队的要求,基本上是完全注重用户体验和生态系统的健康。如果过早的做盈利,用户体验会受到损伤,整个生态系统会受到一些约束,我们觉得这个是不值得,在这方面,一定要把基础打扎实才行。
  
  记者:您刚刚提到了用户体验,要做用户体验可做的事情非常多,而且是一个很庞杂的系统工程,微软在内部有没有一套自己制定的标准或者是方法,把它变成有规划性的事情?
  
  陆奇:我们整个工业创新的核心是在三个圆圈的结合,个圆圈是人类的需求;第二个圆圈是技术上是否可行;第三个圆圈是商业上能不能建立有效的商业,这三个必须都成立才行。其中人的需求是难预测的,难预测的是将来。
  
  目前美国科技公司成绩做的好,发展潜力强,是Facebook,第二是苹果,这两个共同有共同点,他们都是产品研发,技术对他们来讲是一个工具,他们公司着重点如何把用户体验做的越简单、越。在中国,我个人觉得现在实力强的是腾讯,腾讯完全是一个产品导向。张小龙以前有一个PPT讲微信哲学,我们把它翻译成英文,给我的团队去讲。
  
  在新一代,在移动和云这块,手机也好,手表也好,这些数字化的用户体验已经不再是一个工具,是个体的延伸,我们对它要求是非常非常高。我个人觉得用户体验的简单、,对整个公司起着战略性的作用越来越大,技术当然永远是重要,但是用户体验是下一代企业核心竞争力。
  
  微软的传统文化是比较注重技术,这是好事情,我们还是继续重视技术,但是我们必须要改进我们的文化,不断地执着的追求用户体验的简单,世界上可能复杂的事情把用户体验做的简单,做到简单的用户体验是不容易的。

上一篇:邓力:以独特视角诠释语音识别领域新技术进展

下一篇:岳梅樱:数据挖掘分析和建模 是智慧城市建设的“三大件”

相关资讯:

分享到: