厂房出租 • 产业园区招商 • 企业选址平台

全国客服热线

4000781099转1001

当前位置: 中工招商网 > 资讯首页 > 机器人资讯 > 李舟军:人工智能在新闻领域能做些什么

李舟军:人工智能在新闻领域能做些什么

发布时间:2015-12-22 来源:新华网思客 622

  前言:在12月20日首届“智能+”传媒超脑论坛上北京航空航天大学教授李舟军发表了演讲,本次论坛由新华网主办,中国国家话剧院、中国新闻技术工作者联合会协办。本文根据演讲内容整理。

  各位领导、各位嘉宾、各位来宾、各位专家,大家上午好。我报告的题目是人工智能与记者写作,这是一个初步的探讨。人工智能在新闻领域的应用:人工智能与新闻编辑、人工智能与新闻写作。

  现在通过大数据,大家热搜的词,很多时候可以产生出热点新闻,进行筛选和编辑,也可以进行个性化的推荐。比如像“今日头条”,百度进行统计分析、挖掘来推送。《纽约时报》每天有很多的报道,但是哪些东西会推荐到世界媒体上,是通过机器来计算。它推荐的比人工推荐点击率要高38倍,机器非常合适做这方面的事。

  维基百科对突发事件的突发新闻,用检测有多少人编辑哪些词条,可以发现一些异常的新闻。突发新闻检测是谷歌的一个工程师写的,第一时间发出了关于波士顿马拉松爆炸案的新闻,检测到维基百科词条被异常编辑的现象,寻找短时间内被狂热编辑的条目。如何知道网上的新闻是可信的,这一点还是比较困难的,因为虚假新闻很多。

  新闻写作,腾讯财经新闻通过国家统计局的数据来报道,美联社财经体育也是通过机器人来采写报道,Wordsmith平台,写作速度很快。

  在这个领域,部分已知的机器人写作系统,包括美联社财报体育、腾讯财经通过国家统计局的数据来写财经报道;新华社快笔小新做财经体育方面的报道,一般通过数据采写,模式比较简单一点。

  我们看看编辑,从步骤上讲也很简单。新闻编辑通过海量的新闻、数据、素材,通过被大家搜索、浏览,热索词进行排序,把最热点的内容呈现给大家。对不同的人,不同的东西,都有一些个性化的要求,不能千篇一律。所有人都是一样,有些人对体育感兴趣,有些人对财经感兴趣。根据每个人的阅读习惯,通过实实在在的阅读意识,你读过什么,在什么地方停留多长时间,通过各种数据可以进行个性化的推荐。

  我们说新闻写作现在也是一个初步的阶段,美联社Wordsmith的平台写作,主要是写财经方面和体育方面的报道。第二个是自动提取关键信息,对它进行一些过滤,然后设定报道选题,到底做哪个方面的报道。现在写作基本上还是详细的、简单的,或者用各种风格的模块来填一些内容,主要是填数据,加上一些简单的语义加工,还有一些所谓的风格,最后就是编辑过目后再发布,最大的优势就是写作速度非常快。

  从我们跟新华社新华网的合作,主要的亮点就是传感信号,真实记录了用户的体验。在各种数据的整合下,进行语义分析识别。比如《战马》上半场、下半场时间段的对应。然后是新闻模块的写作和人机交互。在这个过程当中应用很多,比如数据的可视化等等。

  我们总结,模块+数据+语义+智力分析+其他信源。第一段通过传感器的数据来填充模块,要有一些语义分析的成分在里面。通过这些东西再加上一些线上内容的组合,来产生一些报道。

  我们也可以做这种成人、儿童观看《战马》的不一样感受,比如老年人、男人、女人,通过数据做各种对比。

  其次,像腾讯也基本上是这样,有模块填充数据,然后从网上采访多个信息源来补充。

  这是生成的页面,各种对比的数据,包括可以选择的东西。这种做法可以跟新闻记者,或者写作的人提供更客观、更真实的观剧的反应和数字,而不是调查采访,可以从多个角度、各种比例得出统计数据。

  另外,写完新闻之后新闻发布还是有规则的。比如洛杉矶时报关于地震的自动报道,6.0级以上就是自动报道。3.0级至6.0级则会将报道发送至编辑,由其决定是否值得追踪报道。3.0级以下则不会收到消息,因为多数情况下,这意味着不值得大惊小怪。机器人写作的步骤通过高质量数据采集、新闻的计算、人机交互。首先是大数据的分析,数据的采集,你是来自于哪个方面,上升怎么样,有几个波峰波谷,流入流出,有数字特征的信息就比较好。高质量数据的采集,线上、线下,特别是一些传感技术,还有新闻的计算,数据的新闻价值判断,选择故事的“角度”。

  当下写作主要是基于统计的数据比较多。未来,我们觉得生物传感技术这些东西也比较重要,能抓到兴奋程度、注意力、人体生物体征的东西。这种东西掩饰不了,可以应用于观剧、观看电影、广告的投放,人的真实反应和课堂学习的反馈,还有人群健康状况的监测。这是将来很重要的一个方面。

  新闻的计算,新闻价值的判断,数据异常检测适用范围,如何核实异常数据数据为新闻?如何引入人工智能进行综合建模?机器学习方法需要的数据从哪里来?辅助记者选择新闻的角度,如何面向不同领域的记者,辅助整理报道逻辑和路径?如何为记者检索甚至量身定制恰当的叙事模块。

  人机交互,数据可视化,基本图表的生成,复杂数据的可视化。自然语言的生成,匹配相应的语义信息的句子模块,串联融合各句子的篇章结构模块,文字的“风格”建模,如用词习惯等。

  人工智能与新闻传播,如何使新闻传播得更广,如何使得特定的人群更感兴趣?我们可以看看世界媒体分析,比如,流星的预测时间、受众、转发,比如谁是信息传播的关键用户,谁是意见领袖和有影响力用户的发言。

  我们除了做自然语言的处理,我有好几个博士围绕小冰做过一些世界媒体分析和传播方面的工作。信息传播研究、信息瀑布预测,用户影响力的挖掘,基于用户社交圈广度的用户影响力排序,信息传播网络推断。一个“社交圈广度”的概念,也是通过这种网络分析大数据。

  最后,说说新闻采集与传播的智能辅助设备。比如无人机的航拍,和荷兰合作的生物传感器,对于人类情绪的客观数据提供很有用。记者写作从看新闻到怎么听新闻。例如我采访,从语音到文本,就是给记者提供方便、快速。

  2015年我们看到了太多这样的话题,计算机将在未来15年内写作90%的新闻,在5年内获得普利策奖。新闻是有温度的,机器人做新闻却没有温度,很可能昙花一现。

  美国曾安排机器人记者与记者进行短报道“PK”,还是人类记者写的东西读者认可比较多,人在联想、演绎深度报道比较强。机器人在数据和综合方面,对消息类稿件比较强。

  人工智能可以从多个方面来辅助记者,获取不容易得到的数据。机器人在处理数据和信息的速度、精度、广度上,有着人类无法企及的水平。随着机器智能的发展,帮助到人类的地方越来越多。

  最后,我还是比较保守,我觉得它是不完全能替代人的,机器干的归机器,人擅长的归人,这是我的意见。 

返回列表

分享到: