是时候用“技术”反击“标题党”和“假新闻”了

当某些人频繁利用“标题党”或者“假新闻”在互联网平台上获取流量时,人工审核机制显得迟钝而缓慢,这个时候,就需要引入“技术”的变量,以弥补甚至惩罚“人性的弱点”。

4月7日,百度App再度被约谈,人们在官方的通报中发现了这样的字眼——“标题党”“内容审核不严”。

都已经2020年了,想不到“标题党”“假新闻”还是没办法根治,如雨后韭菜,收割一波,生长一波,似有缠绵不休之势。

从1994年中国接入国际互联网、1998年新浪、搜狐、网易等门户网站诞生以来,人们相信信息、资讯的生产、传播与分享迈入了自由大门,而不是局限在A1大小的报纸或者二十多寸的电视荧幕上。

人们满心欢喜地呼吸着自由资讯带来的气息,但沉迷尚未多久,这种“美好体验”随即被“标题党”“假新闻”等击碎一空。

自由伴随着UGC文化的兴起而变得浑水摸鱼。尤其2009年新浪微博、2012年今日头条以及微信公众号的成立,在草根狂欢以及人人发声的同时,“标题党”以及“虚假新闻”找到了最合适滋生的温床。

一位媒体人无奈地说:“这是一个劣币驱逐良币的时代。”

就连“互联网之父”之称的蒂姆·伯纳斯-李(Tim Berners-Lee)在2017年,也发公开信称,“我们必须鼓励谷歌和Facebook等信息传递者,继续解决这一问题的努力,打击虚假信息,同时,我们不能建立一个集中的机构,由它来划分‘虚假’和‘真实’信息。”

虚假信息以及“标题党”在互联网上变成了“双兔傍地走,安能辨我是雌雄”,这究竟是怎么发生的,难道这一切都无解了吗?

“标题党”的兴起:流量思维的顽疾

公众号“记者论坛”曾发文阐述“标题党”,文中以四大名著《三国演义》《西游记》《红楼梦》《水浒传》为例,如果放置到不同平台上,四本书的名称可能是另一番面貌:

网文版《回到东汉当皇帝》《美猴王之我欲封神》《霸道公子爱上我之贾府情缘》《山东黑道往事二十年》。

朋友圈版《他是最成功的创业者,从小贩到皇帝!》《佛说念经的人心要诚,看了这个故事,男人会沉默女人会流泪》《在她病逝的那一天,他居然跟别的女人成了亲!》《劲爆!山东黑帮暴力抗法真相,抓紧看马上删!》。

畅销书版《跟着曹操学管理》《阿弥陀佛摸摸哒》《红楼凌晨四点半》和《梁山教父》。

图像 2020-4-14,上午11当代版本的“四大名著”标题 /来源:“记者论坛”公众号

“标题党”是一种自由表达的新式语言范式,还是一种贩卖噱头的营销?目前来看,合理的探索当然是合适的,但 “震惊式” “悬念式”“冲突式”“热词类”“情色类”标题无疑会深度伤害内容产业的长远发展。

在崇拜点击量的增量时代,每个互联网平台都在极力扩充创作者,以实现拉新,增加注册用户、日活(DAU)等数据,在2019年之前,这种平台的急速扩张与官方的愤怒表达呈现正比。

2018年,官方处理了“唐纳德说”“傅首尔”“紫竹张先生”“野史秘闻”等9800个自媒体账号,并相继约谈微信、新浪微博等自媒体平台,指其“主体责任缺失,疏于管理”。

2017年7月,北京市网信办依法约谈搜狐、网易、凤凰、百度、今日头条等网站,责令平台方对存在的“惊悚引诱 标题党现象泛滥”“无中生有 散步虚假信息”等8大乱象进行专项清理整治。

但互联网用户增长的天花板迟早会到,当这一临界值到来之时,互联网平台的主要任务从拉新转向了“激活”与“留存”。

图像 2020-4-14,上午11数据来源:QuestMobile

2019年7月,QuestMobile发布了《中国移动互联网2019半年大报告》。2018 年全年,中国移动互联网月活用户规模净增4607万,而2019年这一增长趋势逐步放缓,半年累积只增加了570万,2019年第二季度移动互联网用户净减200万,中国移动互联网月度活用户规模触顶11.4亿。

这预示着在官方的监管之外,市场的大环境和用户体验也会倒逼平台进行改革,改善信息内容的生产、发布与审核机制。

人工审核的背后:庞大、起诉与阴影

“当我们漠视用户体验时,就会碰到真正的危机;当我们丢掉了兢兢业业、勤勤恳恳为用户服务的文化的时候,就会遭遇真正的灾难。”腾讯董事会主席兼首席执行官马化腾在2018年接受媒体采访时说。

在流量之外,一切都回归到了“人”的层面。

平台方的注册机制正在变得严格,比如互联网的注册、留言实行实名。这个建议最早可追溯到2002年,之后一直延宕至2014年,中国上网实名制方才基本完成。在发布机制上也变得严格,比如,在标题中,系统如果发现包含“震惊”等惊悚词汇时,创作者平台会提示作者进行修改。

事实上,互联网内容产业的平台审核机制也从未缺席。

2018年1月,根据媒体统计,当时今日头条的内容审核团队超过了4000人,当时发布的招聘信息显示,今日头条在天津招募内容审核编辑,每个员工每天需要审核1000条左右的内容。

另外一个资讯平台“趣头条”在天津和芜湖组建有一支超过1000人的内容审核团队。

根据媒体的报道,网易、陌陌、豆瓣、搜狐、快手、微博等互联网公司也在天津布局有审核业务。

图像 2020-4-14,上午11互联网“独角兽”斗鱼的审核员在监控视频直播  /图源:网络

但这种人工审核机制往往笼罩着某种忌讳与阴影。

2019年3月份,3000多名在印度外包巨头高知特(Cognizant)公司担任Facebook内容审核员的美国员工发起了一宗集体诉讼,Facebook和高知特被列为被告方,这些内容审核员要求对这份工作引发的精神损害进行经济补偿。

据说,Facebook公司在全世界雇佣了上万人的内容审核员,阅读用户上传的内容,并且根据该公司的用户协议进行监管和删除。

甚至,Facebook还拨款设立了一个类似“删帖法庭”的内部委员会,聘请一些外部专家参与工作,在出现用户删帖争议的情况下进行讨论和裁决。

在印刷时代,对内容的审核掌握在一小部分人手中,这被视为一种“特权”。但在互联网时代,在充满冗余、暴力、色情的海量信息重,这样的人工审核演变成某种“伤害”。

在内容行业这场“真假”“良币对劣币”的战争中,“技术”注定要出力更多。

技术狙击“标题党”与“假新闻”

在AI时代,人工审核显得有点不合时宜,事实上,“技术”已经成为这场狙击战和阵地战的主力军了。

比如Facebook,作为一个优质超过20亿用户的超级平台,其也深受“标题党”其害,2017年,它再次修改NewsFeed功能的算法,“在标题中刻意隐藏信息或夸大信息,它们的目的都是诱导甚至强迫用户点击阅读文章”。这是自2016年8月宣布打击标题党以来,Facebook对内容标题做出的又一举措。 

技术在支撑起内容产业的繁荣时,也必然承担着“警卫员”的角色。

又比如,针对“假新闻”,比如腾讯新闻推出的“较真”系统,据了解,这个专业“辟谣”的系统已经从平台级别升级为中台了,搭建底层的中央处理系统,利用AI等技术工具,将工业化的技术能力应用于高效的辟谣。

“较真”中台一端每天接入海量的信息,对这些信息进行识别和处理,另一端连接用户,将辟谣内容分发给用户。当前,这个中台已集合谣言发现与预警、谣言识别与鉴定、辟谣生产与触达,以及谣言研究与科普四大能力。

图像 2020-4-14,上午11腾讯“较真”平台(小程序)截图  

在此次新冠肺炎疫情中,伴随着疫情的发展,假新闻与谣言四起,人们要么处在信息空白的境地,要么承受着过载、包含着“假新闻”的信息。

1月24日下午,腾讯新闻较真平台“新型冠状病毒肺炎”特别版迅速上线,旋即甄别出“武汉将断网”“戴多层口罩才能有效预防病毒”“喝高度白酒蒸桑拿能防病毒”等“假新闻”。尤其是关于“中成药双黄连口服液可抑制新型冠状病毒”的专业查证,很大程度减少了大众不理智的哄抢行为。

截至2月15日下午,“新型冠状病毒肺炎”特别版已为用户提供超过5.36亿次服务。

这个“较真”系统是腾讯“ConTech”布局的一部分。

2019年5月,腾讯公司副总裁陈菊红发表题为《内容消费的规模陷阱和ConTech新世界》的主题演讲,提出“content+Tech”的模式解决挑战——“在流量思维下,海量的内容供给让用户处于‘沙里淘金’的困境,导致内容消费从基础体验开始,就面临很大的挑战”。

这是一个贯穿“人机协同”思想的统一行动,“人机协同,我们一直希望将人的经验、智慧赋能给机器,人可以解放出来,从事一些更高端甚至是创造性的工作。”腾讯新闻算法负责人刘军宁说。

在2019年12月的一次公开会议上,腾讯的相关人士宣布,ConTech产生了以下记录:智能内容生产引擎青云系统每天可以生产1000条视频;智能写作系统可以在天气、体育等领域快讯写作上,形成24小时不间断写作,累积完成24亿字的写作。此外,腾讯开发的一款错误检测和识别模型,每天可以处理来自腾讯内外的纠错请求达101万篇。

技术不仅在把关与审核,更是深度切入了内容生产领域,从源头把控了平台内容生态的持续发展。

4月13日,中国国家信息中心发布《2019中国网络媒体社会价值白皮书》,腾讯网排名第三,仅次于人民网与新华网。显示了腾讯新闻作为商业媒体,显示出的责任担当与自我要求。

图像 2020-4-14,上午11《2019中国网络媒体社会价值白皮书》相关图

但技术终究掌握在人的手中,技术可以充当警察,也可以充当施暴者。

当某些人频繁利用“标题党”或者“假新闻”在互联网平台上获取流量时,平台方如何在平台端更新速度以秒计的状况下做出快速判断——“Y”或者“N”,人工审核机制显得迟钝而缓慢,这个时候,就需要引入“技术”的变量,以弥补甚至惩罚“人性的弱点”。

猜你喜欢