亚马逊Alexa进化史当语音邂逅人工智能
- 来源:网易智能
- 编辑:半城明灭
- 2017/8/15 10:00:29
- 36913
【中国智能制造网 企业动态】随着人工智能技术的发展,语音识别设备的功能不断扩张。亚马逊Alexa从原本的一个“点唱机”,成长成为智能家居中的“王”,从“对话”到“购物”,正给人们带来更多惊喜。
人工智能语音设备不仅仅是一台可以表达观点的自动唱机,它们很可能成为人机互动的主要方式之一。
Alexa的诞生与技能扩张
2012年8月31日,四名亚马逊工程师注册了一项基础性,这项的内容日后终演变成了Alexa。涉及了一种人工智能系统,该系统旨在与人类语言,这一世界上大、复杂的数据集进行互动。工程师当时只需要使用11个单词和一个简单的图表就能描述它的工作原理。
一个男性用户在一个安静的房间里说:“请播放甲壳虫乐队的Let It Be。”
一台小型台式电脑回答说:“没问题。”
然后系统开始播放这首歌曲。
由此开始,家用语音人工智能成为了亚马逊的一项重要业务,而这一领域也成为亚马逊与其科技界的竞争对手们较量的重要战场。谷歌,苹果、三星和微软都在这一领域投入了上千名研究人员和商业专家,以期待制造出可以同人类进行交流,且便于使用的强大设备。
直到现在,我们还必须去打字、敲击或者滑动来解锁设备和操作。而目前,新的用户界面正在逐渐适应人类,Witlingo公司的执行官Ahmed Bouzid说道。该公司制造了各种各样适用于银行、大学、法律公司和其他企业的语音驱动应用程序。
对于亚马逊来说,其初只是想制造一个自动唱机,但后来这一项目变得越来越大:它变成了一种基于人类数据并且可以不断学习的人工智能系统。它生产的Echo和体积更小的Dot是无处不在的家庭好帮手,它们可以关灯,讲笑话,或者让你不用手就能知晓天下事。
他们还收集了大量关于用户的数据,这些数据被用来改善设备本身,并增加他们的功能。自2014年上市以来,已经售出了上千万台的Alexa设备。据第三方机构统计,亚马逊目前已经占据了美国人工智能语音设备70%的市场。
目前,Alexa同超过50种智能照明系统合作,包括飞利浦、通用电气和宜家等。 2016年,德语版的Alexa诞生,其他非英语语种的Alexa也将陆续诞生。但是,亚马逊并没有试图从可与Alexa相连接设备的制造商那里获得收入,这些设备包括智能恒温器、灯泡等。不过,照这样的趋势发展,未来亚马逊与这些公司之间很有可能会签订收入共享合同或者是采取其他的支付方式。这三个市场中小的一个是家庭自动化市场,在这一市场中每年的支出已经超过了50亿美元,而去年美国的零售总额为4.9万亿美元。
如今,亚马逊通过出售这些设备来赚钱,设备的价格从50美元到230美元不等,的Echo show产品带有视频屏幕。如果选购这些设备的用户终在亚马逊庞大的网上商店中购买了更多的商品,那么亚马逊就能再赚上一笔(不过亚马逊是不会透露这些数据的)。若要让Echo像智能手机那样普及,他们还需要更多的努力。为此,亚马逊鼓励独立在其平台上开发新服务,正如苹果长期以来与所做的那样。
到目前为止,已经出现了超过15000个这样的“技能”或应用程序。应用程序构建工具十分易于使用,以至于不具备太多知识的人现在可以在大约一小时内打造出一个简单的技能。其中受欢迎的应用是优步和Lyft的叫车服务。而Duds拥有48种不同的技能,可以以狂轰滥炸之势诋毁它的听众。
而那些具雄心的开发商中包括了制造、销售与Alexa配合的硬件或服务的公司。例如,Capital One向其银行客户提供基于Alexa的账单支付服务。而总部位于多伦多的Ecobee公司是一家智能恒温器制造商,该公司生产的恒温器可以受Alexa控制,用户可以仅仅通过几个简单的指令就能够提高或降低室温。
“我们的客户都很忙,”Ecobee的执行官Stuart Lombard说。该公司现在从其与Alexa合作的产品中获得的销售额占总销售额的40%,这些产品也成为了该公司10年来增长快的业务。
“为了回家,他们不得不忍受交通拥堵,然后他们还要给孩子们喂饭,换尿布,谁知道还要干什么别的。”
“我们让他们不用双手就能完成一些工作,这样他们就可以‘多管齐下’了。”
Google Home也有了数百万的销量,苹果和微软也在研发他们自己的设备。这些努力的终回报是有机会可以占领或至少可以影响三个重要的市场:家庭自动化、家庭娱乐和购物。
虽然可能没有太多人愿意和他们的冰箱交谈,但不可否认的是,生活方式在发生巨大改变。正如同智能手机改变了生活的方方面面,语音人工智能设备也在变革着我们的居家生活。为什么需要从床上爬起来去锁门,或者是在大冷天还要去手动开启车上的暖风呢?Alexa或是它的“亲戚”们就能帮你做这些事了。
当话语遇见AI
基于语音的人工智能技术之所以如此吸引消费者,是因为它满足了人类的要求:它按照人类的交流方式进行交流和思考,而使我们不再需要在键盘或屏幕上打字。
但这样的技术同时也很难打造。人类在说话时完全不考虑规律性。相反,我们打断自己的话。我们的思维时常反反复复。我们还常常莫名其妙地说出一些只言片语,有时点头有时摇头,甚至有时支支吾吾说不出话。对于人类,有时明明是在胡说八道,我们仍相信自己说的话有道理。
数千名亚马逊员工正在努力应对这一挑战,这包括在其位于西雅图、加州森尼维尔和马萨诸塞州剑桥等地研究中心的研究人员们。即便如此,亚马逊近还在为1100个分布在各个部门的、和Alexa相关的工作岗位进行招聘,其中包括215个机器学习专家职位。在公司位于剑桥的办公室召开的一次会议上,经过询问Alexa的科学家Rohit Prasad关于为什么他需要这么多的人,以及他的研究团队何时才能完全建成等问题。Prasad回答说:“你的问题在我听来简直太好笑了。我已经从事了20年的语音技术研究工作,绝大多数时候,我们取得进展的速度都非常缓慢。然而,在过去的五年里出现了很多难逢的良机。”
发明一个真正奏效的语音激活式人工智能系统是一个非常复杂且尚未被攻克的难题。在过去,语言科学家们在试图一次性确定杂乱语句的具体含义时遇到了困难。而现在,新的机器学习方法另觅蹊径,以期待能解决这一问题:他们在一开始时就着手处理那些不的词语搭配,继而通过临时性的猜测快速调整这些搭配。
Prasad表示:“问题的关键是具备处理大量用户数据的能力,并可以从之前的错误中吸取教训。随着Alexa同用户相处的时间增加,它收集到的数据会越来越多,它也随之变得越来越聪明。伴随着这些进步,越来越多的机会出现,随之而来也需要越来越多的人力。”这也就是为什么需要招聘这么多人的原因。
“让我给你举个例子,”Prasad说,“如果你问‘阿黛尔的张专辑是什么’?答案应该是《19》。如果你说‘播放它’,那么Alexa就可以获得足够多的信息,并开始播放那张专辑。但如果有一些对话式的玩笑夹杂其间会怎么样呢?如果你先问一下专辑是哪一年出版的,它卖了多少张,又会发生什么呢?如果进行了上述对话,后用一个具有困惑性的‘播放它’结束,那么早期版本的Alexa可能就会被难住。而现在这项技术可以遵循一种思维方式,这使得它至少在部分时间可以意识到‘播放它’中的‘它’仍然意味着专辑《19》。”
这种改进来自于机器学习技术对于此前数千次类似交流的反思,在这些交流中Alexa被搞糊涂过。系统了解了用户真正想听的是哪首歌曲,以及具体是在之前对话的什么地方出现了那首歌曲的名字。麻省理工学院口语系统小组的负责人James Glass说:“一开始你需要做一些关于人们如何提要求的假设,然后收集数据,对你的模型进行调整。”Glass表示,这种机器学习方法得到了广泛的认可,但如果想让它发挥作用,那需要的数据则远远超过了大学研究人员所能掌握的。
随着Alexa的使用量激增,亚马逊现在拥有了一个巨大的人机对话数据库——这让它在改进语音技术方面拥有了一定的优势,而谷歌长期以来一直凭借其文本搜索查询获得的数据进行这样的改进。外部数据也是有帮助的:例如,2016年一个庞大的歌词数据库被载入了Alexa中,这可以帮助确保当客户提出想听“drove my Chevy to the levee” (歌曲《American Pie》中的歌词)时,系统可以自动播放歌手Don McLean的名曲《American Pie》。
Prasad团队的一个新项目凸显了这一方法的灵活性。这一项目致力于破解用户在何时会重新提及他们之前提过的要求。提示方式可能千差万别:有些人常说“不,不,不”,但另一些人偏向于使用“停止那个”,也有人喜欢尝试不同的表达,比如“等一下,实际上,我是想这么做”。但Alexa不需要解码所有的话语。大规模的样本数据和半监督式机器学习使系统能够勾画出一组可能的否定性语言标记,之后它可以在这些表达出现变化时,从这组标记中找到一个易于理解的新的请求方式。
版权与免责声明:凡本网注明“来源:智能制造网”的所有作品,均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品,未经本网授权不
展开全部
热门评论