资讯中心

实现语音实时转换成文字?“速记神器”搜狗听写上线

来源:中国智能制造网
编辑:沐子飞
2017/8/14 11:27:41
50097
导读:对于很多文字工作者来说,痛苦的工作莫过于花费几个小时去听一段录音。近日,搜狗公司正式推出语音实时变文字的速记工具——搜狗听写,可谓是文字工作者的福音。
  【中国智能制造网 新品速递】对于很多文字工作者来说,痛苦的工作莫过于花费几个小时去听一段录音。近日,搜狗公司正式推出语音实时变文字的速记工具——搜狗听写,可谓是文字工作者的福音。
 
  语音记录,是记者、编辑、作家等文字工作者们常用的记录方式。但是,对于记录者来说,语音并不方便后期的整理、分享和追溯,这也导致听语音记录的过程耗时耗力,影响信息的沟通。
 
  8月8日,搜狗召开发布会,正式推出其自研的速记神器--搜狗听写。这是一款能够将语音实时转变成文字的速记工具,使用了搜狗知音引擎的长时语音转写技术,为文字工作者提供会议、采访、写作等场景下的速记要求,用户可以在App商店免费下载。
 
  根据搜狗听写产品经理牛露云介绍,搜狗听写包括“听写”和“转写”两种模式:“听写”模式可在录音的同时给出实时识别结果;“转写”模式则可在离线状态下录音,录音完成后一次性获取文字结果。为了保证在各种复杂场景下都能转写,搜狗听写使用了搜狗知音研发的长时语音转写技术,并与业内的端到端深度神经网络技术深度整合。
 
  搜狗方面认为,虽然语音技术当前仍然不够,但实际上已经可以商业落地了,而“搜狗听写”便是搜狗语音技术新的落地。
 
  另外,值得一提的是,搜狗听写还与搜狗输入法打通,可以使用搜狗输入法中的个性化词库功能,从而使得搜狗听写能够识别相关的专业词汇。
 
  搜狗听写APP的出现,颠覆了用户的想象,录音转文字只是一瞬间的事,让语音转文字的方法从纯手工时代进化成人工智能时代。
 
  搜狗公司语音交互技术中心总经理王砚峰表示,搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互+知识计算”的技术战略。发展一年之后,目前已经完善了引擎架构:基于搜狗输入法和搜索引擎两个入口,以大数据+深度学习为基础,上层建造语言AI+语音AI+图像AI,再延伸至对话、翻译、TTS、OCR、识图等。搜狗的语音识别技术服务的日访问量也从2015年的0.55亿次/日 一路发展到2017年的2.6亿次/日。
 
  目前,搜狗已经建立了语音自研团队,每天超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断学习,识别准确率越来越高,可应用的场景也越来越广泛。
 
  此次推出搜狗听写产品,是搜狗语音深入用户垂直场景下的又一个全新探索,通过更加专注于特定的场景和人群,去理解用户需求、解决实际问题,从而让语音技术为更多人所用。综合搜狗在人工智能上的产品布局,可以清晰地发现,让人工智能更接地气,已经成为搜狗在人工智能领域的独特标志。
 
  同时,为了使的文字整理效率更高,搜狗听写还加入了边听边改、无线标重点(通过一个蓝牙外设实现)、多端同步、信息分享等功能。
 
  王砚峰表示,在未来一年里,搜狗AI将会在更多的产品落地:1、可穿戴、车载、客厅场景内自主研发更多硬件;2、进一步推广AI云平台;3、在更多用户垂直场景下,推出更多用户产品。
 
  搜狗很早就开始做语音识别,并通过雄厚的语音技术储备,在去年语音产品开始爆发的情况下开始对外输出,并且也开始逐步进行产品落地。从去年开始到今年,已经有些产品使用搜狗的 AI 能力。相信在未来,搜狗将会有更多的产品获得 AI 技术结合的能力。

热门评论

上一篇:首台印度制造的工业机器人TAL Brabo面世

下一篇:科幻升级!美科技初创公司发明用意念控制VR头盔

相关新闻

<