资讯中心

阿里大数据科学家金榕:机器人的粮食是数据

来源:阿里技术矩阵 原标题:阿里大数据科学家金榕:机器人的粮食是数据
2016/7/27 10:54:10
32377
导读:7月23日,阿里巴巴大数据科学家金榕教授做了主题为《机器人的粮食是数据》的演讲。
  【中国智能制造网 名家论坛】7月23日,阿里巴巴大数据科学家金榕教授做了主题为《机器人的粮食是数据》的演讲。金榕教授目前在阿里巴巴搜索团队负责大数据及人工智能相关研究,拥有美国卡内基梅隆大学博士学位,曾任美国密歇根州立大学终身教授,长期致力于统计机器学习研究。金榕教授曾担任NIPS、SIGIR等会议领域主席,KDD、AAAI、IJCAI等会议程序委员会委员,获得过美国国家科学基金会NSFCareerAward。
  
阿里巴巴大数据科学家金榕教授
 
  以下为演讲实录:
  
  大家下午好,我的名字叫金榕。可能大家都知道,大部分阿里的员工都有花名,是吧?但是金榕是我的真名不是花名。我是2014年加入阿里的,我原先是在美国密歇根州工作了十几年,实际上我在阿里做的工作主要是数据、智能、机器学习的事情。我们主要的产品是在淘宝上的个性化搜索和个性化推荐,大家如果对淘宝推荐和搜索产品有任何建议,欢迎跟我联系。
  
  今天我想说的话题,是数据和智能之间的关系。我们先看一个例子,就是汽车自动驾驶这件事情,现在自动驾驶已经被炒得非常热了,从Google早开始推出智能驾驶的车,实际上在内华达州已经有了制造,到很多车厂都已经开始做自动驾驶这件事情。可能很少人知道,这件事情也是一个非常老的话题,1994年的美国的卡内基梅隆大学有一个项目-AlvinProject,目的就是要做一个自动驾驶的车,1994年已经很成功的把一个车从东海岸开到西海岸,基本上是自动驾驶的,以每小时120公里的速度开。对我来讲,一个很有意思的问题,我想大家也会问,这样一个20年前就已经比较成型的技术,为什么到现在真正的商业化才开始呢?对吧?当然这个除了商业化的原因以外,实际上一个非常重要的原因是什么?就是数据的问题。
  
  早期在做自动驾驶的时候,实际上收集的数据是非常少的,基本上只有几十个小时的驾驶数据,对复杂路况的处理能力比现在低很多,从安全性上讲是不够的。这就造成了为什么这样一个技术在20年前已经相当成熟了,但是到今天大家才真正给它商业化、规模化,其中一个很大的原因是由于Google或者说其他的车厂有非常大的能力收集几十万小时的驾驶信息,而且有非常大的处理数据能力,能够把所有的信息抽出来,能让车在非常复杂的情况下有一个很好的处理能力。从这个意义上来讲,大的数据真的是很重要的。
  
  另外一个是AlphaGo,大家现在都知道Google做一个能够下围棋的机器人,可以自动去读棋谱能够跟的围棋选手下,而且一直保持非常好的胜率。但是同样,大家也知道下棋这件事情不是今天才发生,很早年前IBM的DeepBlue(深蓝)是非常成功的例子,他制作了一套系统能够跟好的象棋大师做对弈。我也想提一下,所有Google在AlphaGo里面做的系统,包括深度学习、强化学习这件事情,实际上在20年前就已经被人在游戏上应用了。在1996年的时候,我估计现场有些同学可能都还没出生,那时候有一个系统叫TD(λ)的算法,有几位科学家把这个算法应用在一个在美国挺流行的游戏上,很快成为了世界。
  
  这里头神奇的地方,跟AlphaGo比起来的话,AlphaGo还需要读人类棋手的棋谱,从中吸取经验成长成为世界的选手,但是对于我刚才说的TD(λ)的算法来讲,当时就是做了两个不同版本的算法,这两个版本自己跟自己下了150万盘,就成了世界。某种意义上讲,真的是自学成才的算法。
  
  那么说回来,为什么说这样一套AlphaGo的系统大部分的核心技术点,实际上在20年前都已经很成熟,为什么到今天大家才把它的面纱揭开来呢?关键还是数据的问题,20年前我们的计算机不足以处理这么多的数据,现在我们有了GPU可以非常有效的处理这些数据。
  

热门评论

上一篇:智能家居普及路上的“拦路虎”:平台入口之争

下一篇:Optomec如何从750亿美元的市场分一瓢羹?

相关新闻

<