智能制造网

登录

云知声锁定IoT:AI独角兽如何应对资本寒冬?

——专访云知声CEO黄伟
发布时间:2016-07-21
浏览次数:34248
  【中国智能制造网 访谈】提到云知声,业内人士通常会同时想起国内的科大讯飞、思必驰和捷通华声以及国外的Nuance。云知声以语音技术起家,4年团队发展过200人。根据公开报道显示,云知声2014年底完成B轮融资,估值2亿美金。然而CEO黄伟坦言,在语音技术路线选择上各家公司差异不大。要在国内相对恶劣的竞争环境和资本寒冬中生存下去,云知声正全力押注IoT赛道,在车载后装、家居、医疗等应用场景优化产品细节,提高激活量和使用频次,争取更多客户订单,努力提高营收。
  
  云知声锁定IoT:AI独角兽如何应对资本寒冬?
  
  【技术与研发】谷歌等开源平台铸剑,云知声扎实落地苦练剑法
  
  语音识别领域LSTM-CTC技术效果好,效率提升40%。
  
  百度、讯飞、云知声等各家企业技术路径相似,差异在于针对不同场景优化不同细节。
  
  【记者】和国际巨头以及科大讯飞相比,云知声的语音技术什么不同?
  
  【黄伟】坦率来讲,业内一线的公司包括Google、百度、科大讯飞等使用的技术都差不多。因为现在学术、技术层面的沟通是相对非常充分的。比如,语音识别领域,效果好的就是LSTM-CTC。以前用的统计模型,以帧来做优化单位,会纠缠到局部细节里,但LSTM-CTC以整句优化为目标,忽略一些中间细节,不纠缠于对帧的处理,解码效率会提高很多。工业界看来,采用这种技术之后,语音识别的效率会比以前提升40%以上。云知声近也刚刚做了引擎的升级,跟以前相比,语音识别平均的错误率下降了20%到40%,这些都是新技术带来的帮助。无论百度、讯飞,还是我们,都可以follow前沿的技术,在技术路线方面不会有太大偏差。但不同在于,基于每家公司对算法的理解程度不一样,加上面向的应用场景不同,针对不同场景的优化细节会不太一样。
  
  【记者】云知声会不会采用例如Google开源的资源?
  
  【黄伟】云知声有些东西确实使用开源的资源,没必要全部模块自己写。像Google、Facebook等,他们在铸一把剑,我们来练剑法。但Google、Facebook开源的基本上是离线部分,我们拿来做模型训练,它实际上是一个是开发工具,并不是一个商业产品。真正要上线的产品一定是靠自己写的。
  
  【记者】作为一家AI技术公司,云知声的技术储备如何?
  
  【黄伟】硬件基础设施上,我们在国内北京,上海、广州和成都4个城市布有机房,今年新添置的GPU花费大概在200多万,累计下来硬件研发上的花费有1、2千万,不包括第三方服务。另外,我们也在逐步地使用一些第三方的服务,比如说阿里云,他们也逐渐开放了GPU的云服务资源。
  
  人才方面,公司工程师占比78%,核心团队博士占比超过45%。云知声开始的创始人都跟我背景相近,CTO梁家恩是我以前盛大的同事,也是科大的师弟,另外几个创始人,比如康恒以前也是一起共事过,基本都是从学术界到工业界一直在做这块的。后面,我们也在不断引入多元化人才加入,有很多海归,不是说海归一定比我们强,而是在这个领域里,需要中国跟美国的技术人才在一起,在国内产业格局理解和国际前沿跟踪方面有个良好的呼应。
  
  【记者】云知声每年在研发上的经费有多少,占多大比例?
  
  【黄伟】我们每年成本差不多几千万,研发投入占到总支出的70%。
  
  【产品与业务】AllIn物联网AI,投注车载、家居、医疗三大领域
  
  IoT领域AI技术服务云知声All-In,手机端非其业务重点。车载后装、家居、医疗三领域为云知声产品主要应用场景,目前几乎无利润。
  
  产品服务激活量及其使用频次是重点评价指标之一,生产合同签订和实际落地出货量是关键指标之二。
  
  【记者】云知声的业务领域侧重哪方面?
  
  【黄伟】我们的定位是专注物联网领域的人工智能服务,所以主要在IoT领域做优化,IoT领域的重点又集中在家居和车载两方面,以及在这两方面发展要整合的服务。比如,开车的时候,除了要对POI(pointofinterest)进行识别,用户可能还有一些如歌曲娱乐、餐饮、加油站等周边生活服务的需求,我们就要针对这些专门做优化;此外,IoT领域,很多场景跟硬件有关,我们不能只做云端识别,还要做一些本地的、甚至低功耗的,这也是我们优化的目标。
  
  【记者】为什么会定位在IoT领域?与讯飞这样的巨头相比有什么差异?
  
  【黄伟】云知声从2012年9月开始做语音云平台,发现了一些很有意义的数据:有一些用户量很大的APP,其实语音使用的频次并不多;反倒是一些硬件设备厂商,数量上虽然没有软件多,但语音的使用频次很高。比如,今天乐视超级电视每天的语音激活几乎是100%,每个用户每天的语音使用频次在几十次以上,这是一个相对高频的数字,但我们也会看到一些号称用户过亿的APP,每天语音使用其实只有1%-2%。所以我们判断语音并不是手机应用的刚需,再加上公司资源有限,所以从成立至今云知声一直没有在手机领域投入太多资源,而是专注在IoT领域。
  
  我觉得我们和讯飞大的差异就在于定位不一样。讯飞毋庸置疑是伟大的企业,是我师兄创立的公司,我对他非常尊敬。讯飞的主营业务,集中在教育、运营商、金融、政府领域,所以会侧重把人力和资源投入到这些方面。另外,讯飞是一家上市公司,要关注资源投入和收益产出比。坦率来讲,今天IoT的业务几乎是赔本的,所以我们跟讯飞技术都很,但是为了让客户买单的话,技术优化目标不一样,提供的service不一样的,对客户的服务水平也不一样。整体而言就是资源投入上讯飞可能不会作为重点,但对云知声来说IoT是ALLIN来做的事情,今天它的规模并不大,但我们更相信未来。不过,今年我们渐渐看到讯飞对这块已经开始重视了。
  
  【记者】云知声目前在IoT领域的业务做得怎么样?
  
  【黄伟】IoT领域来讲,云知声应该是国内早落地的公司。去年IoT所有的语音收入几乎是被我们拿的,差不多有几千万,今年可能会有几个亿,但总体来讲市场规模并不大。我们是TOB的公司,站在客户的身后,这方面对外界讲得一直比较少,但比如说在汽车后装车载市场,云知声的车载语音交互方案已经有近百家合作客户,市场占有率,大概在60%至70%。
  
  【记者】为什么选择后装车载市场,又是如何挖掘这块市场的?
  
  【黄伟】我科大毕业后在摩托罗拉工作,后来加入盛大,在加入盛大之前还有大半年在Nuance工作,就是负责车载,对车载的市场了解比较多。车载前装市场,测试周期很长,流程非常严格,一般需要3-5年,流程都走完后发现一款车的销量其实很少。就像今天我们花100多万去买一辆好车,但发现电子设备都很落后,因为那是几年前定装的。对一个初创企业来说,做前装性价比不高。

上一篇:黄中医智库创始人兼CEO周晋:站在中医医生背后的“大数据”

下一篇:房亮:智能家居“大安防+”保障技术安全

相关资讯:

分享到: