“谷歌大脑背后的大脑”Jeff Dean:15年或实现通用人工智能
- 发布时间:2016-08-03
- 浏览次数:62297
JeffDean
谷歌CEOSundarPichai曾说谷歌将从根本上成为一家人工智能公司。作为系统和基础构架部门的资深研究员,Dean和他的团队对于实现这一目标至关重要。在这篇内容广泛的访谈中,Dean描述了他在谷歌的多种角色、公司的AI愿景,他对于谷歌如何在成为巨头后保持企业奋斗精神的看法,以及许多其他话题。
谷歌如何与官僚主义战斗
PeterHigh:JeffDean,你从1999年起就加入了谷歌,见证了谷歌的大部分岁月。请简要介绍一下在谷歌的17年间你的角色演变。
JeffDean:当我加入时,公司还很小。我们都挤在帕洛阿尔托的大学街上的一座小办公室里。我做的件主要任务是建造我们的个广告系统。而后我用了四五年时间做抓取、索引和搜索系统,这些是每一次谷歌检索都会用到的服务。之后,我大多与我的同事SanjayGhemawat等人一起工作,建造软件基础构架,谷歌用该构架来存储和处理大数据集、做建立搜索索引或处理卫星图像之类的事。近,我一直在做机器学习系统方面的工作。
High:你的涉猎范围如此广阔,你的职责也如此多样,我猜想你不会有模式化的工作日常。你怎样决定与公司内外的哪些人互动?我很感兴趣的是,你如何在你现在从事的不同事务上分配时间。
Dean:我没有典型的工作日常。在前十四到十五年里,我没有担任任何管理职位,因此我有更多的自由时间来专注写代码。在过去的几年里,我在一些机器学习项目上担任了管理职位,这对我来说很有趣,也是一种新的学习体验。在公司历史上我做过许多项目,我想要与这些不同项目的进展保持联系,所以我常常会收到很多电子邮件。
我花许多时间来处理电子邮件,大部分时间用来删除邮件,或是浏览邮件以了解正在发生什么。我有几个只要有时间就会去做的技术项目,我在各种会议和设计评审之类的事之余抽时间去做这些项目。
High:谷歌在经过戏剧性的增长之后仍然是创新的典范。它仍然像当年小企业时期那样雄心勃勃、富于创新,另一方面它已拥有了科技巨头的人力和财力资源。公司如何与停滞和官僚主义战斗,以便能让自己保持敏捷,不被规模拖累?
Dean:从我加入时起,我们一直经历着公司的持续增长。在早年,我们每年都会将雇佣人数翻倍。如果用百分比来衡量,我们现在大大放慢了招聘新员工的速度,然而如果用数量来衡量,我们仍然在经历着实质性增长,大约每年新增10%、20%的雇员。每当公司规模翻倍,这都会驱使我们重新思考公司做事的方式。那些在X规模水平上有效的方法,在2X规模水平上就不再有效了。我们已经解决了如何让我们的企业风格、工程方法、组织结构、团队动力适应新的规模。
我认为,对我们的成长帮助很大的一件事是,我们倾向于把工作分岔成许多不同领域,这些领域与谷歌正在做的其他东西保持一定的独立。建造能带来互联网接入的高空热气球,这种项目就和搜索服务之间没多大关系。我们实质上拥有多个不同的活跃项目,这些项目不像核心业务内部的项目那样需要大量的沟通,由此我们可以获得规模和效率。
High:据我理解,谷歌/Alphabet之间的分离也体现了这种逻辑——试图保持敏捷性,同时将各种不同的活动分离开。可以这么说吗?
Dean:可以。我认为这使得Alphabet下的其他一些部门能更独立的运行。关于这种规模上的翻倍,我想说的点是,这确实带来了一些变化,过去我们每个人都在同一座办公楼里工作,现在每个人都需要在不同的办公楼间往返。
另一件事是,过去我们的工程人员都位于山景城,后来我们在苏黎世、纽约、东京和西雅图都建立了工程机构。有一段时间,我们同时拥有这五个机构,而它们也都发展得更庞大。之后的短短几年里,我们从五个工程机构发展到三十五个工程机构,因为我们感到,我们可以在世界各地找到那些有天分的人,并在他们附近建立机构吸引他们。这使得我们必须重新思考我们如何将工程方面的努力组织起来。
如果你只有一家小机构,那么你大概不应该让员工去做一百件事;他们应该只去做少数几件事,并专注于将它们做好。一些小机构曾经以山景城总部的做法为榜样,他们会去看山景城的人在做什么;他们发现山景城的人在做一百件不同的工作,于是他们以为自己也应该去做一百件不同的工作。我们经历周折才找到一种更好的方式,把分布在各地的工程机构的员工都调动起来。
个人猜测:快15年实现通用人工智能
High:谷歌CEOSundarPichai曾说,从长期看,硬件设备将退隐,而计算将从移动优先演化到人工智能优先。关于这个人工智能优先的世界,你将如何表述谷歌的愿景?
Dean:我认为我们已经从桌面计算转移到了移动计算,现在每个人都随身携带者计算设备。随着设备持续降价,语音识别和其他替代性的用户界面变得更加实用,这些将改变我们与计算设备互动的方式。设备将隐退到背景中,环绕在附近,让我们能够随时与他们说话,就想我们能与信赖的同伴说话一样。
它们将帮助我们获得更多信息,或帮我们完成各种任务。我认为这是机器学习前进的主要目标之一:让计算机能像人类同伴一样提供建议,在需要时搜寻更多的信息,以及这一类的事情。我认为未来五到十年将会令人振奋。
High:随着技术进步以及人工智能各种目标的实现,似乎人们不再将这些已实现的东西称为人工智能。也就是说,人工智能似乎总是以“将来时”的形态被谈论。你如何定义人工智能的界限?
Dean:我认为真正的人工智能将是这样一个系统,它能执行人类水平的推理、理解,完成复杂任务。我们很明显尚未达到这一点,但你说的很对,我们已取得了很多进展。五年前,还根本不可能让电脑从图像中生成对图片进行人类水平的语句描述。如今,电脑生成的句子可能会说,“这是一张男子在网球场上手持网球拍的图片”。与此同时,人类可能会说,“这是一张网球手准备发球的图片”。
人类所做的描述更精妙,不过计算机已经可以生成接近人类水平的图片说明,这一事实本身就是一个巨大的进步。这只是过去五到六年里人们将更复杂的机器学习模型投入应用所取得的进展之一。当人们将模型应用于更大的数据集和更多的计算时,结果将变得更好。
High:你认为我们离通用人工智能还有多远?
Dean:如果你问不同的人,就会得到不同的答案。出于纯粹的猜测,我认为我们离通用人工智能的距离是15年到50年——或许15年左右的可能性更大。
High:正如你提到的,语言是关键要素,而谷歌的许多人工智能创新都围绕着语言,无论是从网络中读取和理解事物,还是从事智能对话或理解文本。你能否谈谈,通过什么路径能让机器更好地阐释信息?在你看来,什么是能够让我们哪怕不能实现也至少能接近通用人工智能的阶梯?你在这方面做哪些工作?
Dean:我认为,一个重要的领域是信息检索领域,而这一领域正是谷歌早期工作的基础。按照传统,信息检索并不试图真的理解当用户输入查询时想要什么。它更多地是关于查找那些包含某个单词或相近单词的文档。有趣的是,近四五年来,我们已能够开始研发一些技术,这些技术能更好地理解“汽车”这个单词的本质。当我们知道“汽车”、“汽车们”、“车”、“客车”、“皮卡”等单词都以某种方式联系在一起时,我们就能够以平滑的方式匹配文档,使许多语言理解任务导向更好的结果。
我们不仅能理解词语,我们也已经快要能够理解两个句子互为同义句。这一点是新的语言理解水平的起点,在新的水平上,我们将能够以机器学习的方式理解长得多的文本。
我们对未来几年的一个良好目标是,我们希望实现:输入数百或数千份文件,然后可以就这些文件的内容进行对话。或许系统将会总结文件的内容,或许系统将对文件内容进行提问或回答。我认为,这才是真正能展现高水平语言理解的东西。