资讯中心

投资人“唱衰”语音识别行业巨头加紧市场布局

来源:猎云网
编辑:一不做
2017/4/13 9:21:03
31244
导读:语音是人类自然、重要的信息交互方式,得益于深度学习和人工神经网络的发展,语音识别近年来取得了一系列突破性进展,并逐渐成为各智能设备的标配技术。
  【中国智能制造网 市场分析】语音是人类自然、重要的信息交互方式,得益于深度学习和人工神经网络的发展,语音识别近年来取得了一系列突破性进展,并逐渐成为各智能设备的标配技术。


投资人“唱衰”语音识别 行业巨头加紧市场布局

 
  据Research and Markets公开数据现实,预计到2020年,语音市场规模预计将达到191.7亿美元。为了争夺人机交互的下一个入口,互联网巨头开启了在智能语音市场疯狂的“军备竞赛”。
 
  投资人“唱衰”语音识别,行业巨头加紧市场布局
 
  面对各大公司在语音交互市场的明争暗斗,一向看好AI创业的李开复却泼来一盆冷水,他表示,语音识别是所有技术里面不成熟的,99%的项目会死掉。
 
  “语音的识别和理解完全是两个事情,我听懂讲的每个字不代表听懂了意思,所以自然语言理解到平台化使用还有十万八千里。”
 
  无独有偶,新入局的互联网巨头Facebook也及时调整了其AI研究的战略方向。由于Messenger聊天机器人的错误率高达70%,在有人力干预的情况下,能够正确处理人类请求的概率不到30%,Facebook决定消减对机器学习和人工智能技术的投资,转向于训练Messenger聊天机器人专注处理一些特定的任务。
 
  然而,行业其他巨头在语音、语义技术等领域的研发和创业势头依然强劲——苹果、亚马逊、谷歌、微软、三星、科大讯飞、百度和华为等巨头纷纷通过并购与自研推出自己的语音产品,加大市场布局。
 
  2010年,乔布斯2亿美金收购自然语音应用软件Siri,随后又收购了英国语音技术公司VocalIQ来改进Siri,尽管Siri看起来更像iPhone可有可无的鸡肋存在,但苹果依然可凭借十亿级的设备数量以及HomeKit平台来争夺智能家居入口。
 
  亚马逊方面,搭载人工智能语音助理Alexa的智能音箱Echo仅去年就卖出了超过650万台;随后,谷歌推出了家用智能硬件Google Home,作为智能家居的中枢控制音箱,用户可与之进行双向对话来调节灯光、恒温器等;
 
  微软智能助理Cortana(小娜)后来居上,为提高语音识别精度,微软采用了神经网络来存储海量的数据,帮助识别软件更“聪明”地识别出人类语音表达的模式。
 
  同样,三星于去年斥2.15亿美元的巨资收购了加州一家虚拟助手初创公司Viv,Viv团队就是苹果Siri的创始团队。据称,在处理复杂要求的能力上Viv比Siri更为强大,且具备更强的机器学习能力。
 
  再看国内,科大讯飞旗下的讯飞开发平台是具规模的智能交互技术服务平台,目前已为超过6万个App、以及8.9亿终端用户提供智能语音交互服务,占有中文语音技术市场70%以上市场份额。
 
  百度是国内早布局人工智能的互联网企业,不久前完成了对渡鸦科技的全资收购,并同时将原度秘团队升级为度秘事业部,加速人工智能战略布局。
 
  此外,华为也在深圳组建了100名工程师团队,用于开发语音助手服务。尽管项目还处于早期研发阶段,但目标却瞄准了苹果Siri、亚马逊Alexa和Google Assistant。
 
  市场日趋明朗化,但技术还不够强大
 
  种种迹象表明,智能语音交互市场的趋势逐渐明朗化。相比5年前,今天的语音识别技术准确率已经提高了20%以上,但基于用户特定场景需求的逻辑理解能力以及成熟可靠的商业模式,依然距离遥远。
 
  首先是噪音等干扰下的识别率问题。目前业内普遍宣称的97%识别准确率,更多的是在安静的室内并近距离靠近麦克风的场合。但在噪音或者远场识别环境下,错误率是近场识别错误率的近两倍。
 
  其次是更好的识别算法。例如其快速自适应的方法(unsupervised adaptation),比如面对口音、方言,机器或许一开始听不懂,但几句之后就能听懂了。这种方法在很多情况下能够提升语音识别率。
 
  第三,人机对话缺少语境。正如亚马逊Alexa负责人Toni Reid所说,“目前用户大的期待,同时也是人机对话中存在的大问题:语境。比如,我和你面对面交谈,很多视觉线索会告诉我你是否真的听懂了我在说什么,或者是否赞同我的观点。但是在人机对话场景下,这种视觉线索是缺失的”。从AI角度来说,补齐缺失的语境,是解决人机交互体验的当务之急。
 
  此外,现有的语音识别技术还缺乏逻辑推理与表达因果关系的能力。即使是行业巨头的人工智能语音助理,基本定位也只是在信息检索、资讯收集等非常初级简单的工作,例如它们能够回答今天天气怎么样,但面对稍微复杂的问题,附近的麦当劳是否可以用微信支付等就无能为力了。
 
  显然,无法根据逻辑进行多层次推演,就无法承担起更深层的服务。这也是我们看到即使是巨头研发的聊天机器人,都只能做到几轮对话的原因。
 
  创业不是科研项目,从科研出发到核心技术,进而形成产品,关键的地方在于“致用”。
 
  为此,猎云网将4月13日于北京四季酒店召开“解码人工智能·2017人工智能产业创业创新峰会”,正是希望通过人工智能领域学者、专家和业界精英代表的参与,共同探讨当今AI的发展创新与变革,将产业与人们的实际应用相结合,为人工智能的普及奠定可行性的基础。
 

热门评论

上一篇:深陷“泡沫”之扰 中国工业机器人能否突围?

下一篇:中国工业机器人增速加快 产业旺盛背后是喜是忧?

相关新闻

<