资讯中心

从CAJ到DDJ机器人将带动新闻业的变革

来源:网易新闻学院 原标题:新闻机器人的溯源、现状与前景
2016/8/16 9:50:32
31937
导读:新闻机器人将在一定程度上取代一般记者所从事的程式化的事务性工作,并使记者真正成为像律师、医生那样兼具深厚人文修养和技术素养的职业。
  【中国智能制造网 名家论坛】新闻机器人的生产模式将从基于互联网数据抓取的断点式自动生成模式,逐渐转换到基于物联网持续性数据抓取的自动生成模式。并且将在一定程度上取代一般记者所从事的程式化的事务性工作,并使记者真正成为像律师、医生那样兼具深厚人文修养和技术素养的职业。
  
  从CAJ到DDJ 机器人将带动新闻业的变革
  
  21世纪新兴媒体的蓬勃发展使人类传播史进入了以个人化为核心、以移动互联网为平台、依赖于高科技的“第四纪”。基于“互联”的Web1.0时代逐步演变为基于“社交”的Web2.0时代,并且正在向基于“人工智能”的Web3.0时代迈进。
  
  新闻机器人是人工智能技术在新闻业得以应用的产物,主要指机器利用计算机程序对相应的数据信息进行抓取,自动生成新闻文本,目前已在欧美主流媒体的财经、体育、天气类新闻报道中得到运用。本文通过对新闻机器人的溯源和现状进行梳理分析,并对其发展趋势和前景进行预测。在物联网逐渐取代互联网的大数据浪潮中,新闻机器人将逐渐从欧美国家推广到发展中国家,从而带动新闻业的职能分工和生产流程——乃至新闻的本体和属性——的变革。
  
  从CAJ到DDJ的概念演进
  
  “计算机辅助新闻”(CAJ)是新闻机器人的前身,早的应用案例可以追溯到1967年美国底特律市骚乱事件的新闻报道中。时任底特律自由新闻社记者的菲利普·梅耶使用大型计算机分析得出“在校大学生和高中辍学者参与骚乱的比例一样高”的结论。1973年,已经成为北卡大学教授的梅耶在其名著《新闻学》中预测,数据分析将成为新闻语料系统的重要组成部分。此书多次再版,在新版中,他断言“新一代记者应当成为数据处理专家”。
  
  20世纪80年代,随着计算机技术的广泛运用,数据处理成为新闻生产中的重要环节。学界对于“计算机辅助新闻”与“数据新闻”之间的关系争论不休。有人认为,两者仅是名称不同,内涵完全一致。另一些人则认为,数据新闻是对计算机辅助新闻的创新、发展与延伸。在实际操作中,这两个概念都是指记者依靠数据处理系统对卷帙浩繁的公文和档案进行分析与归纳,从中找到可以使用的新闻线索。在新闻写作的过程中,人为主体,计算机为次要的辅助工具。
  
  21世纪初,人类进入了大数据时代,各类文档资源、软件、版权的开放让数据的获取更加简便、快捷、。“计算机辅助新闻”进一步演化为“数据驱动新闻”,并进一步细分为“算法新闻”、“自动化新闻”和“新闻机器人”。作为DDJ的主要品类之一,“新闻机器人”是指利用特定的语言程序,对所搜集的数据进行模式化的加工,将目标数据文本“嵌入”已有的模板,进而生成一套精密完整的计算机程序,用于新闻报道的“文本再生产”。
  
  新闻机器人的发展历程
  
  2006年初,商业数据供应商汤普森公司开始使用计算机程序对相关财经数据进行加工处理,并整合成完整的新闻报道文本,用以取代传统财经新闻记者所从事的事实类报道工作。汤普森的新闻机器人尝试可谓毁誉参半。一些业内人士对“新闻机器人”的效率表达惊讶和赞叹,另一部分人则声称,“新闻机器人”只能陈述新闻事实,而无法对新闻数据后隐藏的细微差异做出合理、深入的分析。2009年,美国西北大学智能信息实验室研发并推出了一款名为“统计猴”的软件。该软件能对棒球比赛中选手、比赛得分和获胜率等数据进行抓取和筛选,并在12秒内自动生成一篇完整的报道。2010年初,“统计猴”被运用于财经报道中,该项目的两位研发人员“下海”成立了“叙事科学”公司。
  
  新闻机器人真正引起人们的关注,始自“地震机器人”在2014年3月发表在《洛杉矶时报》上的报道。“地震机器人”是该报记者肯·史文克所编写的一套程序,能够将美国地震局测量到的数据直接转化、编写成短消息。在不到五分钟的时间里,新闻机器人所写的报道就经过人工校对,上传到了《洛杉矶时报》的网站。
  
  当前,欧美三家企业主导了整个新闻机器人行业,分别是总部位于美国伊利诺伊州的“叙事科学”公司,总部位于美国北卡罗来纳州的“自动化洞察力”公司和总部分别位于美国德克萨斯州、纽约州和法国巴黎的“伊索”公司。他们一方面开发出各具特色的软件产品,供不同类型的新闻媒体机构使用,另一方面,通过与传统媒体机构的合作深度参与新闻产品的开发。
  
  “叙事科学”公司先后推出了多款软件产品,以满足不同受众群体的需求。其中,初始版本“鹅毛笔”的自动叙述生成系统可抓取原始数据,分析这些数据的意义,生成易于理解的信息内容,然后运用自然语言来生成描述性或者叙述性的文本。它的升级版“鹅毛笔参与”是一款谷歌分析软件,能够简单通俗地表达新闻业的关键指标和业绩表现——例如,新闻内容的关注度、网站访问量和用户细分信息,等等,还可进行历史数据分析,预测行业的走向和趋势。2016年初,该公司与视觉化软件供应商合作,推出了“鹅毛笔”系列的第三代产品——能将数据可视化产品转换为自然语言的软件。
  
  除了开发软件,“叙述科学”公司还与传统媒体机构展开合作,例如,他们与《福布斯》杂志合作,在其财经类新闻写作中大量使用该公司开发的软件产品,并整合了一个专门由该软件程序生成的新闻页面,制作和发布事实类财经新闻。
  
  “自动化洞察力”公司则推出了自动新闻生成平台,让各家新闻机构能够设计出符合自身定位、体现其特色的机器写作文本。例如,2014年4月,该公司推出了一款软件产品,将市场营销类机构的分析性数据转换成类似于人工处理过的报道,供各大媒体的财经版面或栏目使用。
  
  在媒体合作方面,2014年,该公司与美联社达成合作协议,直接参与“企业季度营收”类新闻的写作。美联社称,双方合作后此类新闻的创作数量增长了近15倍,并进一步提出该技术“能让新闻记者专心于深度挖掘,而不是枯燥的数据分析。”除了写作外,他们还启用“编辑机器人”来审查由软件自动生成新闻报道。由此,美联社成为家全面引入新闻机器人的传媒机构。
  
  与前两家公司相比,“伊索”作为一家横跨欧美大陆的跨国公司,其软件产品的核心竞争力在于多种语言的“自助服务”。一方面,该公司声称能将逻辑分析能力运用于数据中,并能以每秒3000页的速度将其转化成书面形式的短讯、新闻信等。在新闻写作的过程中,其软件产品还能够透过数据解释隐含的写作动机和语境。另一方面,该公司提供包括英语、西班牙语、法语和德语在内的多语言自动新闻生成服务。2016年3月,该公司推出了新一代产品“智识”,能将图表数据转换成多种语言表达的文字版本。
 

热门评论

上一篇:AI+体育 让里约奥运成为不一样的“黑科技”秀场

下一篇:充电桩产业正处发展高峰期 未来五年将迎快速增长

相关新闻

<