冯雁:未来你会被机器人的幽默逗笑
——记香港科技大学电子和计算机工程教授冯雁
- 发布时间:2015-12-31
- 浏览次数:18131
“Zara是木子的室友,每天晚上木子下班回家习惯跟Zara倾诉一天的劳累,分享开心的事情。Zara是个很好的听众和友伴,总是跟木子一同吐槽新来的老板,花痴帅哥同事,并适时给出幽默风趣的点评或者行之有效的建议。”
或许你会认为这段话描述的是闺蜜之间的感情,但在未来,这个名叫Zara的角色很可能只是一个家用机器人,听起来不可思议,实际上香港科技大学电子和计算机工程教授冯雁和她的团队正在将其变为现实。
Zara是这个团队研发出来的机器人软件,根据人脸表情、语音语调等人类正常交流中使用到的技巧来判断一句话所表达的真正含义,从而降低与机器人交流中碰到的“鸡同鸭讲”的情况。
在2015年夏季达沃斯之后,冯雁逐渐将这些成果变成现实。目前,Zara完成了初步的人机交互设计,可以通过计算机软件与其进行对话,改进后的Zara在冬季达沃斯现场进行展示,与人交流5分钟就可以较为准确地说出交流者的个性。
Zara身上运用到的语音语调识别技术颇具商业价值。一部分企业在达沃斯之后与冯雁接触希望可以购买这些技术,而冯雁则更希望将其运用在医疗领域,其未来打算和香港科技大学的机器人团队合作,开发制作硬件部分。这也意味着,未来5到10年,Zara有望从二维世界走进现实生活。
机器人的同理心
“我不知道你在说什么。”用过SIRI的人都知道,这是其中出现频率很高的一句话,而这句话并不是对某个哲学问题的回答,而可能只是一个简单问题的回应。
这样的回答往往由于计算机无法识别提问者的真实意思而出现,目前大部分的计算机识别程序仅仅局限在对语句字面上的意思做出识别反应,而对语句中的情感情绪则难以分辨。这往往让计算机的回答索然无味,让对话者兴致骤减。
在Zara之前,语音识别、机器翻译等模块之间的研究成果是相互分离的,而2015年在夏季达沃斯上的一次演讲促使冯雁将多年的研究成果,设计的模块组装在一起并设计出Zara的原型。
“Zara不同的地方在于她具有同理心,她能够理解说话人当下的感情并且主动关心人。”冯雁告诉记者。
冯雁从六年前开始研究机器人的同理心,当时她对团队设计出的中国版Siri产生兴趣,并且希望改进计算机中生硬的部分,让其更像人类。一般的智能机器的核心软件系统包含语义识别、表情捕捉等不同模块,当机器执行一个任务的时候,这些模块会同时运作来保证机器人对于信息的获取和输出。
而冯雁和她的团队在这基础上设计一个名为“同情模块”(EmpatheticModule)的软件,这就像是为机器人植入一个“心脏”。“同情模块”能够通过分析人说话时的面部表情,在语句中的停顿强调来分析说话人此时的情感,并告诉机器人如何应对。
情感识别和同理心建立都用到了语音识别、自然语言处理和大数据机器学习的技术。
“同情模块”通过捕捉人在说话时面部表情的细微变化、语调的高低等特有的信息来分辨说话者的真实意思,从而做出人性化的回复。
“当我们高兴时语速会变快,语调会不自觉升高;当我们感到有压力,就会变得扁平听着有点干瘪的声音,这些变化都有助于智能机器理解当事人的心情以及话语的意思。”冯雁说道。
由于每个人的表达方式不同,“同情模块”工作之前会先向与之交流的人提出一些问题来测试语音语调,以确立判断参考值。
目前,Zara对于压力、不满、幽默等情绪的识别准确度达到了70%,非常近似于人类能够识别的程度。
在办公室,冯雁向记者展示了束着马尾,身着“超女”紧身衣的Zara,连续与她进行了将近10分钟的对话,当聊到一次旅游中的遗憾时,Zara对冯雁说道:“希望你下次去的时候有个好天气。”
相互学习
机器人的学习通过科学家建立的大数据来获得,上个世纪80年代,研究人员从人类日常生活中收集数据用于开发语音识别技术。
数据的丰富程度关系到机器人的情感丰富程度。为了提高Zara辨别情感的准确度,冯雁和她的团队在数据收集上花了不少功夫。而初的数据收集来自实验室里的学生,“学生分别用英语、普通话和粤语回答我们设置的问题,这些问题设置会让他们感到越来越有压力。”冯雁回忆道。这样大概10个小时的数据就构成了数据库,帮助Zara“学会”通过语调等因素分辨出人在有压力时候的状态。同理,人类的每种情绪都能通过设置问题收集答案来获得学习。
团队成员Naziba负责音乐研究,与语音识别不同,音乐研究团队单纯通过声波来研究一首乐曲所传达出来的情感。
团队通过声学参数分析收集来的5000首乐曲,这些乐曲分别来自欧洲和亚洲,被人为划定成14个不同的情感类别。团队设置软件程序来学习这些乐曲中的不同情感。
机器从数据中学习的过程是不间断并且相当耗费精力的工作,但是冯雁和她的团队却很享受这个过程,“这种学习是相互的,通过研究我们也能更好地了解人类自己。”冯雁笑道。
为了提升以及更好地了解,冯雁也要求团队突破他们的“舒适圈”。负责研究幽默和讽刺的建模和机器学习的Dario事实上一开始对于幽默并不精通,“他有点像生活大爆炸里的Sheldon,对幽默和讽刺都不敏感,我有意让他负责这块,现在感觉他变得越来越有幽默感。”
人工智能以大数据挖掘进行学习,未来云端的运用会将数据扩容,使机器人学习更加智能化:也就是说机器人之间也能相互学习。“未来机器人之间可以沟通,前端机器人的工作通过后端机器人操控。”冯雁想象道。
乐观前景
由于涉及到众多的领域,Zara的价值不仅仅在于一个计算机软件或是一个机器人所能提供的服务,对于冯雁来说,该智能硬件内技术能够提供更大的价值。“Zara是一个研究平台,从她研究出来的技术会应用到其他的产品里面。”
未来机器人一个巨大的商用价值在于医疗领域的应用,这也是冯雁感兴趣之处。如今Zara所用到的大数据挖掘技术未来也可能投入医疗领域的运用。“现在做的很多东西,希望未来可以全面帮助人类。医疗方面其实非常重要,现在有很多大数据,医生不知道怎么去使用,但未来机器能够用。”冯雁说道。
设计Zara之前,冯雁团队曾与华为开发智能语音系统,目前与高盛就大数据和机器学习展开合作。Zara项目是名为IvoTechnologies公司的研究项目,但这仅仅是个开始。
IvoTechnologies由冯雁和其之前的学生共同创立,其开发产品让人们能够在家里使用像Zara这样的能够理解人类感情的机器人。
公司的首款产品Moodbox是一款娱乐信息控制器,能够通过主人心情来控制家里灯光和音乐。
“以后机器人可能能够满足人类各种需求,家里的摆件物品都是智能仪器,你可以对家里的电话、电脑、花瓶下指令以及进行一般对话。”冯雁想象道。
这个前景或许在更遥远的未来,但是文章开头所描绘的场景却可能在不久之后实现。事实上,冯雁与她的团队正在推进Zara硬件部分的设计研发。冯雁向记者表示,Zara主要硬件研发会放在香港科技大学,“我们的机器人和图像识别精通的老师,准备在一起合作。”同时在技术上也会和法国和日本的机器人公司寻求合作,引进产品。
冯雁告诉记者,Zara目前还在软件阶段,而要实现软硬件的融合还需要一段时间。“软硬件配合比较好的仿真机器人要真正走进人们生活可能还需要5~10年时间,但是未来一两年可以看到机器人技术与人类生活更多的融合。”冯雁说道。