人工智能在全球的发展,那是日新月异,其中 AI 与工业结合 ,AI 与医疗结合 ,AI 与制造业结合 ,AI 与教育结合等等 ,真可谓是百花齐放。随着互联网持续不间断不断地演进 ,移动智能终端达到高度成熟的状态 ,信息“爆炸”的时代已经不知不觉悄然无声地来到了大众的身边。在这个有着海量信息存于背后的情况下 ,衍生出了一种新的“媒体人” ,它们并非是人类 ,而是被称作“机器人”的存在。
10月时,广州国际人工智能产业研究院正式入驻广州市南沙区,该研究院带着16支人工智能领域高端人才团队率先在了南沙入驻。重点实验室里,有一支AI研发团队——云天弈,它专注于人工智能和自然语言处理NLP在资讯内容领域的应用,也就是大家早就听说过的“写稿机器人”。
智能机器人,除了具备能下围棋的能力之外,还能够写稿吗?早在2009年的时候,美国棒球大联盟首次启用了智能机器人StatsMonkey做完了比赛稿件的撰写工作,而在2015年,国内互联网企业腾讯上线了写稿机器人DreamWriter,截止到目前这个系统已经运作了将近三年时间。人工智能已经慢慢地融入到当下的内容创作之中,“写稿机器人”的“智商”到底会有多高呢?人工智能又能够为媒体行业带来怎么样的变化呢?
在未来,物联网技术会不断深入发展,处于万物互联的大背景之中,这一领域的专家针对全媒体记者,描绘出比之前更“科幻”的一个场景。
广州日报全媒体记者 文静(署名除外)
智能写稿机器人数量不断壮大
提到智能写稿机器人,最早能回溯到2009年,美国棒球大联盟首次借助智能机器人StatsMonkey,凭借统计分析,去识别比赛期间的重大事件,进而总结整体比赛动态,最终自动编写了一篇体育报道。
2015年时,“写稿机器人”才于行业里真正出现爆发态势,国内外众多媒体开始对写稿机器人进行“试水”使用。据了解得知,在国外,《纽约时报》借助Blossomblot系统来筛选文章并向社交网站这类平台推送 ;《洛杉矶时报》的智能系统专门致力于处理地震等突发新闻。在国内,2015年腾讯旗下那个叫Dreamwriter的写稿机器人正式上线,还发布了一篇标题为《8月CPI涨2% 创12个月新高》的报道。随后,国内媒体也相继“尝鲜”,新华社搞出机器人写稿项目,阿里巴巴联合第一财经弄出“DT稿王”,今日头条推出了“xiaomingbot”,在内容生产范畴,传统媒体、移动互联网媒体纷纷追赶这股技术热潮,想要把写稿机器人运用到日益海量的新闻报道、内容生产以及分发的进程里,在技术领域,人工智能业界有越来越多的研究团队投身到“写稿机器人”的研发之中。
揭秘写稿机器人
那么,“写稿机器人”怎样“写”出一篇稿件呢?国内AI新闻实验室云天弈CEO金利杰博士,在接受记者采访时讲道,“写稿机器人”是让外界能更易理解的称呼,在业内他们更倾向把这类人工智能系统称作“智能辅助创作系统”,这是更恰当的说法。
拿 “小弈写作” 平台来说,它能从海量的资讯里头,快速地提炼出内容线索,依据用户输入的关键词,一键生成文章框架,还能从多个方面自动评判内容价值。用户既可借助 “系统热门话题” 列表,搜寻当下最热的新闻话题,一键生成相关主题的文章;又能够通过输入关键词,让 “小弈” 写出一篇命题作文。
由全媒体记者知悉,“写稿机器人”跟传统新闻采写模式不一样,“写稿机器人”每日自动“抓取”各类大量信息,当记者以及编辑需要某一新闻内容之际,输入关键词,系统会依据关键词先“抓取”来自各个渠道的上万条相关信息,进而生成初稿,在“小弈写作”平台上,国际资讯方面的活跃数据跨越两年,整体而言更是存储了大概5至6年的资讯,这也从侧面体现了写稿机器人平台背后所拥有的海量数据。实际情况里,这同样是身为人工智能平台所必须具备的条件,就是唯有具备足够大的那些数据储备,机器人才能够实现分类以及运行学习,基于此去营建事件的知识图谱。
当然了,不一样的人工智能平台有着不一样的算法以及思路,比如说云天弈的AI系统并不是完全凭借机器人去写出一篇完整的稿件,“绝大多数稿件是由编辑来进行后期加工以及润色的”。
“机器人”主要集中
在体育、财经类新闻报道
指出的为腾讯媒体研究院所发布的研究内容 ,“写稿机器人”总共分成三类 ,且都依赖自然语言处理技术。第一类是基于模板的写作 ,也就是使用一个文章模板 ,把存在于数据库里的结构化信息 (涵盖具体数字 、百分比等)填充进去。第二类是提取后再整理 ,即针对包含无用信息的长自然语言文本予以分析 ,提取文章里的关键信息 ,重新组织语言之后输出。第三类是完全借助机器自动生成,通常是经由训练语言模型,针对语言开展数学建模,接下来不采用原始文本,而是运用人工智能的办法逐句生成算法认定“最能够展现原文含义并且看上去像一句话”的文字。
据知晓,当下数量众多的写稿机器人,或者换句话讲大部分“智能辅助创作系统”都把第一类模板写作以及提取后整理当作主要方式。其比较专心且专长的写作领域主要是体育类、财经类和灾难类新闻。这几类新闻的共同特性在于,其内容大部分都借助数据“发言”。以NBA赛事新闻作为例子,大部分构成是比分加上队员的得分表现,也就是以数据分析作为主的新闻类型。所以,在“机器人”的数据库当中会有这类新闻的模板。同时,系统凭借人工智能所拥有的深度学习能力,在撰写这类新闻之际,剖析记者或编辑是怎样进行处理的,进而获取更大量的数据,构建更为多种多样的模式。
留意到的全媒体记者发觉,腾讯Dreamwriter所撰写出来的财经类类新闻,其中大部分都是有关某只股票股价升跌情况的即时新闻。根据Dreamwriter负责人刘康所交代的情况来看,Dreamwriter最开始诞生之际所要去进行解决的最为核心关键的问题是,“财经新闻的生产相关能力满足不了对应的内容全部需求”。
云天弈的“小弈写作”属基于广泛题材的智能资讯写作系统,是为第二类与第三类的结合,其写作范围并非局限于靠数据“说话”的新闻领域。经测算,一个小型编辑团队,于“小弈写作”智能创作平台助力下,其工作效率能够提升五倍,“传统记者/编辑一天大概能够写两篇长篇幅新闻,而于‘小弈写作’配合下,一天可完成十篇左右”。在整个智能辅助创作进程里,系统不仅能够助力选题,还能够产出与记者或者编辑想要撰写内容的关联程度极高的文章架构,能够极大地简化写作步骤,缩减成稿用时。
今年1月,名为“小弈”的机器人在GET资讯App开始工作。通常情况下,对于传统新闻资讯的写作,编辑的工作占比为80%,机器占20%。当前GET资讯团队能够达成机器完成65%,人工完成35%的状况,未来期望能达成机器完成80%,编辑仅负责20%。在我们的认知里,能够由机器完全生产并自动发布的内容只占据极少部分,原因在于任何媒体都需要进行监管以及内容审核。未来,新闻资讯平台的人力也会主要集中在这一部分。不过,将人力成本予以降低,把时效性加以提高是必然的,比如说,以往由30人团队去完成的工作,如今由10人或人数更少的团队同样能够予以完成。”金利杰予以表明。
在国内大型内容资讯平台,依据其阅读量数据进行统计,在“小弈写作”提供帮助的情况下,GET资讯所撰写的诸多新闻,其阅读量可达成几万至十几万,其中有的阅读量甚至能达到上百万。
经过训练能有效提升
“机器”的内容生成能力

众多互联网企业聚焦写稿机器人,众多科技研发团队也聚焦写稿机器人,近三年来移动端新闻资讯平台领域蓬勃发展与之不无关系,众多新闻内容客户端出现,这意味着每天都需要产出海量的新闻内容资讯,并且要保持按分钟计算的更新速度,另一方面则是互联网用户对于新闻、新资讯有着渴求,如今在坐地铁上下班的路上,大家会“刷”手机,在坐公交上下班的路上,大家也会“刷”手机,对内容资讯的需求量更是呈几何级数地增加。需值得留意的是,去年的时候,企鹅智库面向外界发布了一份名为《未来地图:2017年中国新媒体趋势报告》的报告,这个报告所显示出来的情况是,我国网民平均每一天花费在阅读新闻资讯上面的时长大概是67分钟,在这其中,日均时长超过两个小时的那些“重度用户”所占的比例达到了14.6%。
现今,国内规模较大的内容资讯分发平台皆是讲究着“千人千面”,借助大数据、算法、标签等途径,使得每个人所看到的内容并非完全一样。同样的,“写稿机器人”也能够凭借后台的大数据、机器学习能力,针对每一个单独的人开展不同的内容推送。云天弈是这样进行比喻的:“想象一下,写稿机器人如同渔夫,每一天都会去‘打鱼’,它把打回来的鱼、虾、蟹等,经由人工智能算法来进行分类组合。”。每个人进入智能平台的“入口”不一样,需求不一样,撰写的内容也不一样,所以平台能“知道”他有哪些内容需求,哪方面需求多。另外,机器给读者提供的内容是24小时持续更新的。
云天弈方面表示,经过海量优质内容训练的,由人工智能驱动的智能辅助写作系统以及自动写作系统,一天能产出成百上千篇资讯文章,这会极大提升资讯内容的生产效率与时效性,人工智能技术在传统资讯内容生命周期运作的部分环节达成了革新。
讨论:
写稿机器人能代替人类工作?
业界认为更多是辅助功能
在写稿机器人刚开始上线的时候,出现了“机器人来抢记者饭碗了”“记者们要哭晕”等情况,一时间,这引起了科技业界的高度关注,也引起了媒体业界的高度关注。近几年来,写稿机器人会不会代替人类成为“新闻报道者”,这个问题也一直随着技术的发展,变得愈发激烈。
马持节,广东财经大学人文与传播学院院长、新闻学博士表明,当下智能机器人等先进技术不过是助写手段,工具价值非常强。新闻传播行业不会消失,而是会搭乘先进技术快车行稳致远,就像“工欲善其事,必先利其器”所说的那样。然而,新闻行业之所依靠的,必定是善于利用先进技术的媒体工作者,并非技术自身。智能机器人,由于跟大数据、还有云计算、以及AR/VR等前沿技术高度融合,所以具备了很强的数据采集能力、亦具备很强的提取能力、还具备很强的运算能力、并且具备了信息自组织能力呢,这有助于媒体工作者提高内容生产效率,不过同时也强化了媒体竞争。
当谈及“写稿机器人”的优势以及劣势之时,他持有这样一种观点,那就是,要是将其与人类相比较的话,智能机器人在内容加工生产这片领域之中展现出的优势是较为显著的,可以体现为,数据量特别大,其所包含的信息点极其繁多,生产速度相当之快,计算化生产服务呈现出非凡的精准程度,并且这个生产运作能够突破时间以及空间所带来的束缚。然而,不得不承认,它所存在的不足之处也是极为明显的,举例来说,它通常是从数据方面出发的,始终站在了纯客观的视角之上,给人一种“目中无人”的感觉,在议程设置、新闻评论以及舆论引导等诸多涉及信息增值的相关领域缺乏自如把控以及妥当操纵的能力。
写稿机器人不会成为未来媒体的一个分支,人类一直在借助新技术提升内容生产效率,当下前沿技术是智能机器人,所以智能机器人被媒体化的预设是合理的,智能机器人只能用“它”来指代,因为它是机器,是智能技术,不能成为媒体,媒体的核心是主观能动性很强的人。
金利杰博士直言,其进行研发的最初想法是,期望借助智能辅助创作系统,把记者以及编辑,从那些新闻报道内里,存在的枯燥且辛苦,还带有重复性的工作中解救出来,进而将精力集中于内容创作的关键内核上。
马持节博士也曾着重指出,新闻工作者出现失业这种情况,并非是源于技术取得的进步所致,而是由于行业跟随时代发展,从而引发了新闻工作者群体出现自我淘汰的这般后果,有部分从事记者、编辑工作的人员,他们并不适应已然发生变化的时代提出的相关要求,所以一定无法适应同样发生了变化的新闻传播行业,如此一来,失业者必然是会存在的。
相关链接:
猝不及防 我国首个AI主播“上岗”
在乌镇世界互联网大会刚刚举行之时,我国互联网企业搜狗和新华社一块儿推出了全球首个“AI合成主播”,据了解,虚拟主播以新华社某主持人为原型,它不但可以模仿人的声音,而且还能够模仿人的表情。
据了解,AI合成主播可达成高效的新闻播报,用户只要输入新闻文本,它就能以和真人一样的声音播报,而且连唇形、面部表情也跟真实的主持人相符。
具体的操作做法是,由真人主播来面对某一个镜头,去录制一段播报新闻的视频,“搜狗分身”呢,借着这段视频,能够去提取真人主播的声音、唇动、表情动作等方面的特征,随后,借助语音合成、唇形合成、表情合成以及深度学习等相关技术,进而“克隆”出跟真人主播特别相似的、具备新闻播报能力的AI虚拟主播。
据搜狗称,“搜狗分身”借助其旗下的AI能力,于图像表情层面,对AI展开拟人化训练,又在声音语言习惯层面,对AI进行拟人化训练,还从逻辑思维等层面,对AI实施拟人化训练,之后“克隆”出人类的AI分身,从而助力人类提升信息表达以及传递的效率。