English | 南开大学

王芳 连芷萱:公共危机情境下谣言真实度计算及其与正面信息交锋研究

发布时间: 2020-03-02
浏览次数: 404

*原文载于图情档学界公众号

一  引言

Alport与Postman两位心理学者将谣言定义为“缺乏具体资料以证实其确切性的、与当时事件相关的命题”。可见,谣言的核心要义在于“未经证实”的信息,经过事实证明很有可能是真实情况。所以,在公共危机事件中对高真实度的谣言处理不当,不仅会浪费辟谣的行政成本,也会伤害政府公信力。因此,本文在研究公共危机中网络谣言发生机制的基础上,通过建立谣言与辟谣信息交互的信息生态模型讨论真实度因素对谣言传播的影响机理,试图回答以下三个方面的问题:一是什么特征的谣言被证实的可能性高;二是真实度如何量化;三不同真实度谣言与正面信息的交互有何规律可循?在此基础上,建议针对不同真实度谣言选定适当的辟谣策略,最大程度节省社会资源并实现精准辟谣的效果。

二  文献回顾

2.1 公共危机谣言

公共危机谣言产生于公众受到公共危机环境的刺激而产生的心理情感及情绪的适应性反应,此种谣言属于危机信息的一种,具有一定的社会预警功能。赵军锋认为,公共危机谣言在内容上、情绪传播上具有很强的寄生性。因为公共危机谣言产生于特定的社会条件与心理状态,所以公共危机谣言的危害主要体现在恐慌的传播上。同时,Al Lily等认为一旦谣言影响公共舆论,尽管被辟谣,其影响也不可能完全消退。基于此,本文的研究价值可以体现在两个方面:一是分析公共危机中谣言的预警预测问题,二是揭示谣言对公众情绪的影响。

2.2 谣言传播要素

谣言的传播受到多方面因素的影响。吴建、马超参考了多位学者的观点,在Alport与Postman提出的经典谣言模型基础上,将谣言的新闻性以及传播过程中的管控力度考虑进来,改进了谣言传播公式,如式1:

其中,分子部分从事件角度讲包括“不确定性”、“重要性”、“新闻价值”;从传播者角度讲包括“涉入感”和“刺激性”,同时经由媒体放大。同时,谣言传播与传播者的“批判意识”、传播环境的“透明度”及“管控力度”负相关。同时,就谣言的内容而言,喻国明对基于腾讯大数据筛选的六千余条网络谣言进行了内容类别、叙事结构、场景构筑、标题特征四方面的文本分析。施爱东发现谣言内容的周期性与社会活动的周期性、时间季节性、代际规律、相似的社会条件与社会心理状态有关。基于前人研究,本文主要研究的谣言要素包括事件不确定性、传播者涉入感、传播媒介、内容类别、叙事结构、内容周期性和公众情绪因素。

2.3 谣言真实度

目前计算谣言真实度(Authenticity Grade)的常规做法是从信源(如传播者、传播媒体)本身的信誉度入手,基于谣言案例库对信息的传播特征与文本内容进行比对,从而初步判别谣言真实度。例如,Choi研究了6大网站中28万条谣言,认为经常传播谣言的人对谣言有放大作用,这种人被定义为“回音室”成员;之后,Pierri从谣言传播过程中的推送算法、回音室、人类偏见等角度评估推送信息的网站的可靠性,探究真实信息与谣言在拓扑网络中的传播特征,从而得出能够识别真实度的信息分类方法。上述大多数学者是针对谣言的信源可靠性进行研究,在识别恶意造谣、谣言机器人方面效果卓越。但是,本文研究的是普通民众对未知情况进行初步判断时所产生的谣言,这种谣言往往具有一定的真实基础,只是因为传播者个体知识水平、认知能力、信息占有量等方面的限制,有意或无意地放大、缩小、隐藏、演绎、篡改、添加部分实事,虽然易对人产生误导,但很有可能被证实为真,那么单纯以信源可靠性来推断信息真实度则会说服力不高。因此,本文对谣言真实度的定义不同于其他论文所定义的“可信度”、“信誉度”、“Reliability”,而是指谣言被证实为真的概率。

2.4 信息生态学视角下公共危机谣言的真实度

信息生态学是研究信息主体与信息环境之间相互作用的一门学科,研究范围包括个体、种群、系统三个层次。公共危机产生的谣言是依托特定的社会、心理条件产生的,不是孤立存在的,所以以信息生态学为视角研究谣言可以全面、系统地看问题。在由官方、媒体和公众三方舆论场建构的网络舆论生态系统中,谣言治理存在着结构性问题,过度辟谣会造成行政成本增高,错误辟谣则会导致政府公信力下降,应当因质因量在舆情生态系统中寻找最优解决方案。本文认为,将不同真实度的谣言传播问题置于信息生态背景下,有助于系统、整体地把握谣言与辟谣信息间的互动规律,从而从生态平衡的视角寻找最优辟谣策略。

三  研究思路

本文着重研究谣言真实度的界定、计算与影响。研究路线如图1所示:

第一、通过定性分析对谣言进行概念化,构建谣言真实度评价指标与评分体系。

第二、利用python爬虫、NLPIR自然语言处理软件等,构建舆情-谣言案例库。首先,随机选取网络热点舆情组成舆情-谣言案例库,计算真实度下各观测变量的相关性。其次,根据官方公布的辟谣信息对谣言信息特征进行打分。最后,通过Logistic模型计算各指标的相关性系数,得到真实度计算公式。

第三,利用微分方程对谣言、正面信息之间的关系进行信息生态建模。分别建立谣言-正面信息生态系统和谣言传播过程中负面-正面情绪生态系统,通过数值仿真得到有关谣言真实度的影响路径假设。

第四,采集谣言案例,数据标准化后进行真实度计算,并将案例大致分为高、中、低三个层级。针对不同层级的数据进行趋势拟合,检验步骤三所提出的假设。

四  公共危机谣言真实度计算

4.1 构建真实度评价指标打分体系

当前针对谣言真实度的指标主要是从谣言内容特征、谣言传播特征两方面测构建的,具体指标体系包括研究视角层、潜变量层、观测变量层、数据来源、评分层五个层次,共得到7个观测变量,如表1所示。首先假定观测变量之间权重一致,再通过对案例库案例进行Logistic回归分析,计算各个指标的相关系数,再以该系数作为观测变量权重。

其中,各个指标含义如下:

F11:事件不确定性评价的是信息的精确程度。一条信息中所包含的实体词涵射的意义范围不同,从而表意的精确性不同。如在2019年底爆发的新冠肺炎疫情危机中,医生李文亮曾于12月底发布消息“华南海鲜市场发现7例SARS”,此条信息的地点、时间、数目和事件名称都比较精确。相比之下,2019年夏天在中医学术论坛上有学者提出的类似信息则比较模糊,根据五运六气学说推断“冬至左右将发生瘟疫”,无论时间“冬至左右”还是发生的事件名称“瘟疫”都不够准确。

F12:根据喻国明的研究,谣言中科学常识类占47%、社会类27%、明星八卦类占15%,其余累计占11%。在公共危机中,科学常识谣言一般表现在“特效药”上,如“洗热水澡能防新冠肺炎”、“双黄连能治疗新冠肺炎”、印度甚至流传“牛尿能治疗新冠肺炎”等;社会时政类可具体分为预测类、物资短缺类、阴谋论类等,例如“武汉肺炎患者将达到十万”、“北京菜市场关门一周”、“中国经济将因为新冠肺炎瘫痪”等;公共危机中明星八卦类谣言多体现在不良行为的揭示上,如“志愿者私分救援物资”以及某明星“一毛不拔”,等等。据此,本文将公共危机谣言类别大致分为科学类、社会类、不良行为类。

F13:喻国明还提出谣言的程式化“六段论”常模:第一是“标题党”式的题目;二是叙事度较高,通常引用“经美国研究”、“权威部门”、“公安局紧急通知”;三是以第一人称叙述;四是例举生活案例;五是引用权威期刊如“柳叶刀”;六是为了增加扩散程度,结尾道德绑架,如“不转不是中国人”。

F14:施爱东将同一类公共危机中爆发的相似谣言称为“流感谣言”,它不是原发性的,而是一种继发性、感染性、不定期发作的谣言,一般需要受到相似的自然条件或社会心理才借题发挥,如地震、瘟疫等自然灾害,或者核泄漏、踩踏事故等突发性社会事件。纵观国内外历次自然灾害,都不约而同发生了关于物资短缺的谣言,如“日本核泄漏将影响我国食盐供应”,新冠肺炎“北京菜市场关门一周”,等等。

F15:学者阿卜杜勒阿里讨论了谣言对公众情绪的影响,并假设谣言中极端的情绪对正常舆论影响巨大。常见的情绪测量方法有情感极性测量。因为谣言可能表达“恐惧”(如某某地多人感染),也可能表达“愿望”(如特效药出现),所以本文仅对情绪的极性进行评分。

F21:谣言的产生有可能是认知错误或误听误信,也有可能是基于某种目的恶意造谣,如旨在打击政敌的谣言“柬埔寨洪森感染新冠肺炎”和旨在某种经济目的的谣言“中医药板块将炸板”。因此十分有必要探究谣言的源信息是否来自亲身经历。

F22:考察传播媒介可靠性的主要原因是某些谣言的传播存在“回音室”节点。一般可靠性高的媒介会对事件认真核实,而可靠性低的媒介则可能为了提高流量等目的传播未经核实的信息。

4.2 舆情-谣言案例库构建方法

首先,通过爬虫得到当天最热新闻帖子列表,针对官方辟谣事件列表(如新浪微博官微发布的辟谣列表),对新闻帖子是否为谣言进行0、1赋值,形成样品案。然后,依据真实度评价指标对每个案例的特征值进行评分,作为Logistic回归分析的计算输入量。

4.3 真实度计算方法

五  公共危机谣言真实度信息生态模型构建

5.1 模型机理分析

将谣言置于公共危机事件的网络生态环境中,借鉴捕食关系的信息生态模型,构建不同真实度等级的谣言传播模型,研究谣言真实度对谣言传播上限、公众情绪正负转化以及平息谣言所需要的辟谣力度的影响,通过建模仿真得到谣言应对最得当的力度与响应速度,为政府辟谣和治理网络谣言提供理论依据。

如图2所示,首先,谣言真实度会影响谣言群落的扩张规模。因为“人们更愿意传播自认为真实的信息”,高真实度的谣言本身就具有一定的合理性,能够在较大程度上满足公众的信息需求和心理安慰需求。因此,一个高真实度的谣言往往能得到较高程度的真实性验证,与网民形成共鸣,随之引爆舆情。

其次,谣言真实度会影响辟谣难度。Einwller认为辟谣的有效性在于将谣言的真实部分与主观臆断部分区别开来逐个击破。但是,高真实度的谣言真假混杂,合理推断与主观臆断不能很好区分,从而增加了辟谣难度。

最后,谣言真实度会影响甚至引导公众情绪,尤其是谣言带来的不确定感在传播恐慌方面危害巨大。辟谣就是通过消除未知来控制恐慌传播,辟谣的情绪引导力与开始辟谣的时间和引导力度有关,但是公众在广泛传播的谣言中因沉默的螺旋更愿意相信自认为“真”的谣言,因此谣言真实度会影响辟谣的情绪引导力度。


5.2 模型构建


在公共危机发生并产生谣言后,政府通过权威媒体发布正面信息,并由网民继续传播。处于信息传播中的网民可以分为谣言传播者和辟谣者两个部分,不同网民群体发布的信息数量变化可以反映谣言的传播程度与辟谣力度。基于此,提出以下限定条件。

第一,在围观者充足的前提下,如果不及时辟谣,谣言会以一个常数为增长率无线增长,网络谣言真实度会促进谣言传播速度;

第二,假定围观者思辨力较高,当得到真实信息后便不会相信谣言,所以辟谣者可以“捕食”谣言传播者,但是高真实度的谣言难以被“捕食”,谣言真实度会影响辟谣难度;

第三,假定负面情绪随着谣言数量的增长而增长;

第四,假定正面信息发布及时,公众情绪单纯的由负转正,谣言真实度会影响公众情绪转化速度与情绪引导力度。

经过前文分析,谣言传播中构成了捕食关系、竞争关系两个信息生态系统(图3)。分别针对两个生态系统进行仿真,并基于仿真结果提出假设。


5.3 针对生态系统1的假设与仿真

5.4 针对生态系统2的假设与仿真

综合以上,公共危机时,政府在治理谣言的过程中,需要提前预估这些参数,做到“心里有数”,在辟谣时才能“张弛有度”、“有的放矢”。

六  公共危机中谣言传播模型实证分析

6.1 谣言真实度特征系数计算

本文利用PYTHON编程对2019年12月15日到2020年2月25日的新浪微博进行爬取,以新冠肺炎为检索对象,共收集相关信息10845条,为了计算准确性,利用NLPIR软件对信息去重并二次筛选,最后随机选取相关信息50条。本文对谣言的判别以新浪官微公布的辟谣信息列表为准,对新冠肺炎信息中属于谣言的打标为1,非谣言打标为0,其次按照真实度评价打分体系进行打分,结果如附录1所示。

6.2 谣言真实度影响实证分析

本文通过PYTHON编程对2019年12月15日到2020年2月2日的百度新闻进行抓取,以“武汉新冠肺炎”中的相关舆情对假设H1、H2、H3进行实证检验。


6.2.1 数据来源

本文以国内最大的搜索引擎百度为数据来源,选择2019年底爆发的新冠肺炎的相关舆情为研究对象,编写爬虫程序,对2019年12月15日-2020年2月2日内的相关舆情进行统计,爬虫字段为“发布时间”、“标题”、“发布媒体”、“内容”、“链接”。共采集相关信息2457条,数据清洗整理后,本文选择三组不同真实度的谣言信息,与两组不同说服力的正面信息作为分析样本。

6.2.2 数据采集

经过爬虫,本文收集了低真实度谣言“武汉有十万感染者”有效信息53条、中等真实度谣言“武汉发现SARS”有效信息175条、高真实度谣言“武汉肺炎人传人”有效信息198条。以谣言的传播天数为时间单位,统计各个谣言每天的新闻帖子累加量。同时,本文将此三个案例的426条新闻输入NLPIR软件,针对每条新闻的情感测评进行打分,统计三个案例每天发布的新闻帖子负面情绪累加值,形成三组时间序列数据,整理结果如附录2所示。

谣言“武汉发现SARS”于2019年12月15日贴在网上,随之得到官方辟谣未证明武汉肺炎为SARS,并发布辟谣信息“武汉出现不明肺炎”,最后于2020年1月15号将武汉肺炎确诊为“新型冠状肺炎”并发布较为有力的辟谣信息。因此,在辟谣信息方面,以“武汉发现SARS”、“武汉发现不明肺炎”与“武汉肺炎确诊为新型冠状肺炎”为对象进行实证分析。抓取2019年12月15日-2020年2月2日之间,“武汉发现SARS”的有效信息175条、低说服力辟谣信息“武汉发现不明肺炎”有效信息297条,高说服力辟谣信息“武汉肺炎确诊为新冠肺炎”的有效信息361条,并对数据进行累加处理(如附录3)。

6.2.3 实证分析结果

(1)针对假设H1的实证分析

本文将“武汉有十万感染者”、“武汉发现SARS”和 “武汉肺炎人传人”来进行实证分析(附录2)。首先将三组案例对照前文4.1杨所述的真实度评价指标进行打分,然后根据6.1节得出的真实度系数进行计算,计算结果如表5所示。可知,“武汉有十万感染者”真实度最低;“武汉发现SARS”真实度中等;“武汉肺炎人传人”真实度最高。


(2)针对假设H2的实证分析

结合附录3中关于谣言“武汉发现SARS”以及与其相关的两组辟谣信息的相关数据,对三组数据累加量特征进行初步观察,并进行拟合,得到“武汉发现SARS”的拟合图(图8),对三组信息的拟合表达式求二阶导数,以得到三组信息的累加量增长拐点(计算结果如9),得到比较结果(图10)。计算可得,“武汉发现SARS”在17日左右进入增长后期,即增长率开始降低,与“武汉发现不明肺炎”的爆发期吻合;“武汉发现SARS”在30日左右进入消退期,与“新冠肺炎确诊”发布时间吻合。“武汉发现不明肺炎”的二阶导数与“武汉发现SARS”负相关,即当此辟谣信息大量发布时,谣言增速变缓。“新冠肺炎”的二阶导数与谣言、“武汉发现不明肺炎”皆负相关,即当此辟谣信息大量发布时,谣言快速消退,同时低说服力的辟谣信息也开始消退

通过以上分析可知,谣言“武汉发现SARS”在低说服力的辟谣信息发布时,其增长率便开始下降,直到辟谣信息“新冠状肺炎”发布才得到有效遏制,由此可知,高说服力的辟谣信息辟谣效果显著强于低说服力的辟谣信息,辟谣效果取决于辟谣质量而非数量,假设H2得到验证。


3)针对假设H3的实证分析

6.3 研究结论

本文从理论方面构建谣言、辟谣交互模型,讨论了谣言真实度对谣言发布量增长上限、有效辟谣率与公众情绪的影响;在实践方面,以百度新闻帖子为数据来源,充分分析了在武汉肺炎疫情中的多条谣言信息与正面信息之间的交互作用。研究结果表明,第一,谣言真实度与谣言相关信息数量增长的上限正相关,高真实度的谣言传播更广;第二,提高有效辟谣率可以有效遏制谣言,高说服力的正面信息即使发布量较少也可以取得较好效果;第三,谣言真实度对公众情绪有影响,真实度越高情绪影响范围越大

七  谣言真实度分级管理建议

谣言的发展动因是社会冲突,社会冲突的解决需要一个动态交互的过程,在此过程中如果社会不允许或压制谣言,一旦谣言积累爆发,其程度势必会更加严重,将对社会结构产生破坏作用[3]。所以,在网络信息生态中,信息多样化是保持生态平衡的关键,谣言作为一种负面信息对于整个生态来说具有一定的正面作用。

在此次新冠病毒肺炎疫情中,我国政府在谣言控制方面举措有力,各级部门及时通报疫情消息,各大媒体都开通了辟谣专线,如“假口罩流入市场”、“双黄连可预防新冠肺炎”、“协和医院患者逃跑”等谣言都得到了及时辟谣,有力的控制了恐慌蔓延。但是,也暴露出过渡辟谣导致行政成本增高、影响公信力等问题,如“武汉八人造谣被拘”等 。在2019年12月疫情之初,网上便有“武汉发现SARS”和“武汉肺炎人传人”等信息预警,不加求证便立刻删帖、封号甚至训诫,失去了谣言预警的社会功能,就像人体强行割除了扁桃体,一旦病毒感染便会深入脾肺。

所以,即要发挥谣言的正面预警功能,又不能听之任之。因此,应对谣言真实度进行分级管理,采取分级分类治理的对策。对于低真实度的谣言,及时辟谣即可不攻自破,不需要大规模筛查删帖,节约行政成本;对于中等真实度的谣言,要及时提醒相关部门加紧核查,发布真实准确的信息,防止信息扩散泛滥引起恐慌;对于高真实度的谣言,一定问清查明,听取各方意见,及时发布高说服力的正面信息。


(此文对原文有删减,原文请查看《图书与情报》官网)



王芳:南开大学商学院信息资源管理系教授、博士生导师,网络社会治理研究中心主任;国家社科基金重大项目“我国网络社会治理研究”首席专家,中美富布赖特高级研究学者(2009-2010);研究领域为网络空间治理、知识发现与情感分析、政府信息资源管理等领域。