基于复杂网络的网络舆情论文

2022-05-03 版权声明 我要投稿

摘要:网络舆情是目前社会科学领域和自然科学领域中的研究热点。为了探索网络舆情传播机制,该文首先构建了BBS社会网络组成,然后利用复杂网络理论,探讨了高校校园BBS网的无尺度特性和小世界特征,最后分析评价了社会网络拓扑结构对网络舆情传播的影响。下面是小编精心推荐的《基于复杂网络的网络舆情论文 (精选3篇)》,仅供参考,大家一起来看看吧。

基于复杂网络的网络舆情论文 篇1:

基于复杂网络理论的舆情信息传播与治理研究

〔摘 要〕文章首先将复杂网络研究方法引入到舆情网络信息分析之中,并介绍了该方法的基本研究步骤;重点介绍了目前比较成熟且与复杂网络结合紧密的网络病毒传播理论和舆情网络模型;最后,文章提出了基于复杂网络的舆情信息治理的具体办法,包括3种免疫策略和靴襻渗流模型策略。文章为搭建高效合理的舆情网络环境提供了一种研究新思路,进而可以帮助政府提升对网络舆情信息管理的水平。

〔关键词〕复杂网络;舆情信息;免疫预防;靴襻渗流

DOI:10.3969/j.issn.1008-0821.2016.04.005

〔Key words〕complex network;public opinion;immunity and prevention;bootstrap percolation

进入21世纪以来,我国大量的社会矛盾和经济矛盾叠加在一起,预示着我国已经进入到一个关键社会变革期,而伴随而来的就是一件件的群体性冲突事件。据报道,此类事件的总数已经多达6万起,参与人数陡然增加到300多万人,这些突发事件给国家带来的影响不光是经济损失,更多的是社会稳定根基问题。所以,对于这些事件的分析与对策研究已经显得十分迫切。通过我们的观察发现,伴随通信与交流方式的改变,网络舆情已经成为群体性事件发展演变的一大要素,许多谣言乃至群体性恶性事件的发生背后都有网络传播的推动。对于网络舆情信息的具体研究而言,首先是网络舆情研判的方式方法。简而言之,就是如何发现网络中的非正常舆论信息及倾向。目前,全世界对网络舆情的研究已经非常普遍,但还没有形成一套标准化的操作模式和规范。这其中最具代表的方法包括人海浏览法、关键词搜索法、多文档精选法、模板因子法及网络实验法[1]。这些方法基本上都是建立在传统的人文领域,主要是阐述了信息在网络中传递的过程。这些方法的侧重点在于定性的衡量突发事件在网络中传播的规律和因果关系。这些方法的分析结果往往多是一级文本信息,而目前舆情分析更多的关注点在于网民在某一事件之后的情绪变化,特别是信息转发率与信息评论。这些内容如果单纯依靠人工收集和分析判断就显得心有余而力不足。另外,现在许多舆情传播预测及治理方法还在依靠舆情员进行分理,这极有可能造成有价值信息的流失。我们目前更需要的是准确分析传播信息网络结构的研究,及其能够详细到信息传播时机,以及传播的方式与途径及演化方式的模拟[6]。

1 复杂网络与舆情信息结合

近年来,复杂网络已逐渐成为研究复杂系统的一种重要方法,对复杂网络的研究正受到来自不同领域的越来越多的研究人员的关注,复杂网络已经成为一个跨学科的研究热点。复杂网络的理论及实证研究对网络安全、网络控制、计算机病毒传播的控制与防御等研究产生了重大影响。用图论的语言来描述,一个网络可以抽象为一个由节点的集合V和边集E组成的图G=(V,E)。节点数记为N=V,边数记为M=E。E中每条边都有V中一对点与之相对应。对于社会舆情网络而言,点集指的是在社会某一具体环境下的社会成员(如图1中U1~U4)与实际存在的信息页面(如图1中P1~P6),而边集就是成员与发生在社会中某一具体话题之间的关系,这些关系可以是有向的,也可以是无向的,当我们将这些信息提取出来就构成了一个完整的复杂网络,如图1所示。我们尝试去发现呈现在这些表象之中的内在机制和模式,进而试图找寻出支配和影响网络舆情发生和演化的规律。

本文首先将复杂网络理论的研究方法与应用技术引入到网络舆情传播规律的研究之中,然后结合我国目前网络突发事件的具体特点,着重阐述了网络舆情传播研究中的网络传播模型。对于网络传播媒介模型的研究紧扣模型的真实性和应用性。在研究过程中,将网络舆情信息复杂网络化,也就是产生舆情信息网络的拓扑结构,观察在该结构上信息传播的特点以及形成特点和演化的规律。一旦掌握这些内容,将极大地帮助管理层开展事件的引导与危机处理。该研究内容对知识、预测和引导事件具有重要的理论意义和应用价值[2-3]。对于复杂网络与舆情信息结合的研究问题,需要定义两个复杂性的问题。一个是突发性群体性事件信息的传播复杂化;另一个是舆情信息传播网络拓扑结构的复杂化[4]。尝试在复杂化的舆情信息中找到扰动因子,寻找发现、引导与控制舆情信息传播的方法。我们将所有的研究内容定义为3个步骤,第一步:经过对舆情信息网络进行抽象和模拟,建立具有小世界特性和无标度性质的模拟复杂网络,然后比较这两种网络的异同。我们利用多种方法来建立网络,其中最直接的方式就是来自城市中某一阶段的通话记录来建立网络,其中每位用户代表节点,存在的通话用连线代表,由此构成了一个巨大的模拟网络。第二步:对于舆情复杂网络的研究起始于基本的复杂网络研究参数,具体包括了聚集系数,平均度和度分布特征。尝试发现这些参数与模拟网络的关系,这就是建立舆情信息网络生长模型的过程。这一过程的特点规律与网络疾病的传播非常相似,网络节点在整个复杂网络中表现出的状态包括正面认知、负面认知和不确定认知。不同个体对同一信息所表现出的状态各不相同。我们要尝试求解这3种认知的传播概率。这3种状态的迁移伴随着信息的冲突,个人处理时间的延续等一系列问题。第三步:该步骤就是系统仿真的过程,将上一步得到的模拟图进行验证,运用随机分析和统计技术的手段改变参数,去揭示模型与实际舆情信息传播的契合度,进而验证出一个合理且有效的模型框架,并试图以时间变化为基准,尝试去预测舆情信息可能发展的范围。

2 基于复杂网络信息传播预测研究

2.1 舆情传播预测

舆情信息的传播与网络的生命力直接相关。而英特网上的谣言导致的群体事件已经给社会稳定带来了巨大的威胁,我们必须采用一系列的对策来解决它。通过实际舆情信息传播的分析,我们需要利用现有的网络的特定状况,来推测出网络演化过程。这一问题,现在学术界引入了一种简单而且有效的网络疾病传播概率预测方法[6]。其中最实用的传染病模型分别是SIR和SIS模型,还有SI与SIRS模型如表1所示。经典的病毒传播理论与复杂网络分析相结合发现,对于一个均匀网络,往往存在一个临界值,当传染强度大于该临界值时,病毒会在网络中长期存在,并且大量传播开去。而小于该临界值的话,病毒会逐渐以指数强度消失。而对于一个无标度网络,不存在这样的一个临界值,该结构中病毒会长期存在,但是不会大量爆发。这和舆情信息中的突发性谣言病毒的发作原理是完全一样的。临界值与网络拓扑结构的界定,对于舆情信息的引导具有指导意义和现实价值。

在网络传播的SIR模型之中,我们可以将网络信息中传播的节点分为3类,第一种节点表现在具体现实中为一般的受众,他们不会去传播谣言信息,但却容易受到谣言信息的感染,我们称其为易染节点(S)。第二类节点代表为信息传播中接收谣言并信任接下来进行传播信息的节点,他们对于舆情事件的发展具有决定性影响,我们称其为感染节点(I);第三类节点代表为网络中的可信节点,对于谣言信息具有鉴别能力,不会被传染也不会被影响,我们称之为免疫节点(R)。在网络病毒传播模型中,我们用V代表被感染的概率,用U代表被治愈的概率,将λ=V/U定义为有效感染率,一些书籍中将感染节点占总节点数的比例,称之为稳态传染概率。把稳态感染率从零向正实数变化的那个点对应的值称为传播临界值。其感染密度的时间化方程式ρ[-1+λ〈κ〉(1-ρ)]=0,其传播临界值为λc=〈κ〉-1,也就是

ρ=0 (if?"λ<λc)

ρ≈λ-λc (if?"λ≥λc)

现在存在的许多网络其网络拓扑结构是均匀的泊松分布,其最大的特点是网络节点的平均度与各节点的度趋向于一致,网络拓扑结构如图2(a)所示,根据我们实验得出,一般的网络谣言的病毒传播临界值在P=0.16%,当整个网络中1 000个节点中有16个节点被谣言感染时,该谣言就会在整个网络中快速传播,产生爆发之式,产生群体性事件的可能也会激增。

网络中的第二种模型是我们称之为SIS模型。它将网络中所有的节点也划分为3类:第一类节点是易感染节点(S),在整个网络中表现为可能被谣言影响,但不会主动参与到信息传播中去;第二类节点是染病节点(I),在整个网络中的表现是轻信谣言并且去传播谣言,是网络中极具破坏性的节点部分;第三类是免疫节点(S),他们表现为对谣言信息具有一定的判断力,但不是绝对性的,还有可能轻信谣言再次被感染。该种网络中单个感染节点产生的新感染节点的平均密度,它与有效传播率λ,节点的平均度〈k〉,健康节点相连概率1-ρ(t)成比例。在均匀网络中存在一个有限的正值传播临界值λc。如果有效传播率λ>λc,则病毒可以在网络中传播开来,并最终稳定于ρ=1-λc/λ,此时为激活相态。如果有效传播率λ<λc,病毒呈现指数衰减,无法大范围传播,最终不能传播,此时网络为吸收相态。这种节点也称之为幂率分布的无标度网络,其最大的特点和我们目前的微信与微博中的大V类似,很多随意的节点更倾向于去联结有影响力的节点,一旦这种大V节点被谣言感染或者就是谣言源头的话,它的谣言传播速度比SIR模型更快,网络拓扑结构如图2(b)所示。我们将其中的传播临界值定义为λc=〈k〉/〈k2〉。通过我们的研究发现,这种拓扑结构的网络,谣言信息会长期在这种结构中存在,永远无法根除,甚至在传染几率很小的情况下,也可能造成大爆发[7-8]。

2.2 舆情谣言治理

目前,针对网络舆情信息传播进行防护提出了一种基于复杂网络病毒预防的新办法,该方法主要基于网络的基本拓扑结构,能够从最大限度上防范网络舆情信息导致的群体性事件的发生,其中的办法主要包括3种:(1)随机免疫(均匀免疫);(2)目标免疫(选择免疫);(3)熟人免疫[7]。基于复杂网络的舆情信息的第一种免疫策略我们采用随机免疫策略,其主要内容是随机的选取一部分节点进行免疫保护。所有网络中的节点都一视同仁,而无论它的度的大小区别。换个说法,该免疫策略很难达到谣言信息的彻底消灭。该种免疫方式对于节点较少的网络比较容易使用,而且效果较好。随机免疫策略对于幂律分布的无标度网络的效果有限,而对于泊松分布的均匀网络则显示出非常好的效果。第二种免疫策略我们将使用目标免疫方法,它特别针对幂律分布的网络,在实际的操作过程中,即选取网络中个别度最大的节点进行控制免疫,抓住这些节点也就是抓住了整个网络谣言传播的重要通道,这样就可以最大程度上的减少谣言传播的可能途径。目标免疫的前提条件是必须了解整个网络的结构,对于小型网络是适用的,而对于大型网站来说实现是不可能的。第三种免疫策略我们称之为熟人免疫,其基本思想是从已知的节点中随机选取一定比例的节点,如5%或者10%,再从选中的节点中找到一个邻居节点进行免疫。该种免疫策略的最大特点在于计算机操作性强,工作效率高,同时不需要对每个节点进行免疫。

另外,针对网络舆情信息传播治理还有一种比较成熟的补充方法,我们称之为复杂网络靴襻渗流研究。该理论最早于1979年提出,主要研究对象是磁铁由于非磁性杂质致磁有序的降低并最终消失的现象[9]。该理论的基本模型如下:在网络空间中所有的节点都存在两种状态:一种是活跃状态;另一种是非活跃状态,而且各个节点是独立的。在初始时刻,各个节点都处于非活跃状态,并以一定的概率值变为活跃状态。而且,当其中一个节点周围的活跃节点达到一定系数时,该节点由非活跃节点变成活跃节点并一直保持下去。该模型的描述与网络舆情中谣言的病毒性传播特性具有绝对的一致性[10-11]。目前该研究始发于两个方面:一个是临界概率的发现;另一个是最大活跃子图的发现。如图3所示,在我们对于泊松分布网络的实证研究中,发现该类型网络随初始活跃节点的变化,存在一个非常明显的跳跃,这个变化点恰恰是网络谣言大面积爆发的初始临界点。该值会伴随节点平均度k的变小而逐步消失。这就说明用户相互连通较少的网络出现谣言爆发的可能性就小一点。给我们的实际指导意义在于要适当控制网络的规模及其连通度,适当调节网络的活跃度。图4所示的幂率分布的无标度网络,它的连通能力直接与幂指数a相关。正如图中的实验数据结果所示,当幂指数a在[-5,-4]之间时,有明显的相变点出现,也就是出现所谓的网络谣言大爆发概率变大,需给予足够的关注。而当幂指数在[-3,-2]之间时,无明显的相变点出现,也就是不会出现所谓的网络谣言大爆发[11]。

3 结束语

目前,基于传统人文领域的研究方法对于网络舆情的研究越来越显示出局限性,其主要原因在于对网络信息传播的成因、流程和规律无法定量的加以研究。基于复杂网络的舆情研究提供了一条新的思路,其核心内容发自对网络核心架构的搭建,以及演化机理的阐述,尝试从结构方面进行趋势的研究,从而引导网络舆情信息发展的趋势,加强对社会群体事件的管理。

参考文献

[1]王兰成.网络舆情分析技术[M].北京:国防工业出版社,2014.

[2]李维杰,刘晖,吴世忠.互联网舆情理论分析[M].北京:科学出版社,2015.

[3]杨兴坤.舆情引导与危机处理[M].北京:中国传媒大学出版社,2015.

[4]何大韧,刘宗华,汪秉宏.复杂系统与复杂网络[M].北京:高等教育出版社,2009.

[5]郭雷,许晓鸣.复杂网络[M].上海:上海科技教育出版社,2006.

[6]燕道成.群体事件中的网络舆情研究[M].北京:新华出版社,2013.

[7]林敏.网络拓扑结构对自组织临界行为影响的研究[D].天津:南开大学,2005.

[8]韩定定.复杂网络的拓扑、动力学行为及其实证研究[D].上海:华东师范大学,2008.

[9]陈小龙.复杂网络爆炸渗流研究综述[J].电子科技大学学报,2015,27(1):12-21.

[10]万宝惠,张鹏,张晶,等.二分网上的靴襻渗流[J].物理学报,2012,61(16):369-374.

[11]张.渗流相变现象的行为特征与演化机制研究[D].北京:北京航空航天大学,2014.

(本文责任编辑:孙国雷)

作者:张瑞

基于复杂网络的网络舆情论文 篇2:

基于复杂网络的高校校园BBS社会网络舆情传播研究

摘 要:网络舆情是目前社会科学领域和自然科学领域中的研究热点。为了探索网络舆情传播机制,该文首先构建了BBS社会网络组成,然后利用复杂网络理论,探讨了高校校园BBS网的无尺度特性和小世界特征,最后分析评价了社会网络拓扑结构对网络舆情传播的影响。

关键词:复杂网络;高校BBS网;社会网络;舆情传播

随着互联网的飞速发展,网络用户是网络内容的浏览者和制造者。社交网站、微博、BBS等已成为信息传播的主要方式。由于网络舆论所具有新的复杂特征,传统理论和模型已难以描述其演化过程[1]。因此,研究社会网络的信息传播机制,发现其内在的规律,具有重要的理论意义和实际应用价值。

互联网具有分散性、去中心性、交互性等特点[2]。近年来,舆论发演化的过程与机制问题吸引了自然和社会学学者们的广泛关注,使舆论信息传播的研究成为名符其实的交叉学科。研究人员试图用不同领域的思想和理论,建立舆论信息传播的定量和定性描述,如:复杂性科学认为社会结构的形成是可以用数学的方法来描述[3]。目前舆情传播的研究主要集中在传播过程的建模上,这些模型解释了舆情传播的模式及原因。几年来,基于复杂网络的舆情传播研究逐渐展开,主要围绕S(Sznajd)模型、n(neant)模型和KH(Kause and Hegselmann)等进行研究,所得结论数量不多,且不十分确定[4]。为了探索网络舆情传播机制,本文采用复杂网络理论,利用相关数据,分析了社会网络结构的特点及其对舆情传播的影响。

1 BBS社会网络的构建

点和线是社会网络的最基本元素,点代表用户,线代表用户间的联系,点和线构成图。此网络是由团体、社区、家庭和用户等组成的互连网和社交网络,连接其中节点的连线表示节点之间的关系,用户间的“关注”与“被关注”、是否通信、是否为好友等表示节点间的关系;同时,此社会网络是有向网络,节点与节点是双向的关系,但关联程度不一样,即有向边上的权值不一样。用A、B、C、D、E表示5个社会网络的用户,他们之间的关系为相互交流,但重视程度不一样[5],此这5个节点及其关系所构成的社会网络如下图1所示。

上图构成社会网络基本要素的节点和关系。这里,为了简化研究方便,我们仅关注用户间是否有联系而忽略关注程度。用非对称的二维关系矩阵来表示此有向网络,“0”表示用户间无联系,“1”表示存在联系。对于列用户,“0”表示节点自身的关系。社会网络的非对称性使该矩阵可表示为一个对角线为“0”的非对称二维关系矩阵。将计算所得邻接矩阵导入Ucinet社会网络分析软件,得到图形化的有向社会网络结构[6]。

2 基于复杂网络理论的网络分析

2.1 无尺度特性分析

复杂网络的重要特性之一是无尺度特性,少数节点拥有较大的度分布,而大部分节点的度分布较小是它的主要论点。N节点的网络图中,节点度为0到N-1,节点度为0的节点为孤立节点。在有向图中,节点度分为入度和出度,入度是指向某一节点的连线数目,出度是指此节点所关联的节点数目。社会网络中的入度说明受欢迎程度,出度说明影响力。节点平均度是网络中所有节点i的度K(i)的平均值[5]。分布函数P(k)用来描述节点的度分布情况。无尺度网络的节点度分布遵循幂律分布,其分布函数为:P(k)=ck-λ,其中c为系数;λ为幂律指数,λ描述分布函数的倾斜程度,将坐标系中的节点度数和节点数分别取对数,所得直线的斜率即为λ[6]。此直线方程表示为:

Log(P(k)=log(c)-λlog(k) (1)

2.2 小世界特性测度

复杂网络的另一特性是小世界性,它描述了网络内部节点间紧密程度,可通过平均最短路径长度和聚类系数来衡量。这里,我们可利用是否有联系来取得社会网络用户间的关系,探讨社会网络的拓扑结构。

(1)平均最短路径长度:dij为节点i和j间的距离,大小为连接i和j最短路径的边数,网络直径D=max(dij)为任意两个节点间距离,L为网络的平均路径长度,大小为任意两节点间距离的平均值[6],式中N为网络节点数。

L=1/[0.5n(N+1)Σdij] (2)

(2)聚类系数:一般地,假设网络中一个节点i有k条边,即有k个邻居节点,则这k个节点间最多有k(k-1)/2条边,节点i的聚类系数Ci为此k个节点间实际存在的边数E与总边数k(k-1)/2之比,即:

Ci=2Ei/k(k-1)/2 (3)

C是整个网络的聚类系数,其大小为所有节点聚类系数的平均值,范围在0到1间。直接相连的两节点的聚类系数为1[7]。对一个N个节点的完全随机网络,当N很大时,

C=O(N-1) (4)

要研究网络结构必须上述特征,并以此为基础构造的网络,分析节点的建立、巩固和消除的过程以及信息传播的规律,因此,本文的研究将有助于了解BBS社会网络的底层拓扑特性,从而深入认识并掌握其信息传播规律。

3 高校校園BBS的社会网络舆情传播分析

3.1 高校校园BBS社会网络的构建

高校校园网提供了应用程序接口API,通过API可获取相关数据,但是一般程序调用会受到校园网API接口的限限制,不能获取大量数据,本文通过JAVA编程收集了一定量的相关数据。通过编程获得节点关系的过程如下:首先在网络中任选取一原始节点,在此节点的下层节点中随机挑选40个节点,再从这40个节点的下一层节点中随机挑选另外40个节点,由此获得不重复的1000个节点,并用这些节点构建校园网BBS社会网络。判断网络任意两用户ID间的关系,获得网络连线,最终形成关系值为“0”、“1”的非对称邻接矩阵,由此得到构建校园BBS网络所需数据,然后由邻接矩阵构造校园BBS社会网络,并进行结构分析。将邻接矩阵导入Ucinet分析软件,可得到该网络结构,分析可知它与规则网络和随机网络完全不同,有自己的特点。计算得知该网络的节点数N=1000,边数M=14984,是一个有向网络。

3.2 高校校園BBS社会网络舆情传播复杂网络分析

3.2.1 校园BBS社会网络舆情传播的无尺度特性

Java编程和Eviews可以帮助分析节点的度分布规律。在BBS社会网络中,用x轴表示节点度数,y轴表示节点数,y作为因变量、x作为自变量进行回归,得出入度回归方程如下:

y=7.9-0.3x; (5)

y=11.8-0.6x (6)

将幂律分布函数P(k)=ck-λ两边取对数,变形后得到出/入度的度分布方程分别为:

Log(y)=3.8-0.9log(x) (7)

Log(y)=3.7-0.8log(x) (8)

计算可知,高校校园BBS社会网络具有幂律分布特性,其出入度的幂律指数分别为0.8和1.0,入度大于出度,这是由于校园BBS社会网络用户可以主动关注某一主题,因而很容易成为被关注对象,拥有较高的入度。

3.2.2 校园BBS社会网络舆情传播的小世界特性

小世界特性从平均最短路径长度和聚类系统两个方面反映。

(1)平均最短路径长度。从关系矩阵可获知节点路径分布。L为BBS社会网络的平均最短路径长度,通过公式5、6、7、8的计算表明得到L为2.12,在社会网络中此值相对比较小,因而可以认为高校校园BBS社会网络具有较短的平均最短路径。这表明:平均只需通过两个用户,网络中的任一用户就能与其他用户建立联系。尽管L会随网络规模的增大而增大,但它依然具有平均最短路径的特征。

(2)聚类系数。通过计算可得校园BBS社会网络聚类系数为0.231。与其他同等规模随机网络相比较,该网络具有小世界的特性。例如,与Erdos-Renyi随机网络相比较,其理论度分布为泊松分布。构造该网络时,假设密度设为0.05,与BBS网络相同,计算可知其聚类系数为0.05,而高校校园BBS社会网络的聚类系数为0.231,前者远小于后者;平均路径长度L为2.13,与BBS社会网络的L为2.12,二者相近。因而高校校园BBS社会网络具有较大的聚类系数,这表明高校校园BBS社会网络的用户所关注的内容大致相同。

4 结论

本文从社会网络中最基本的元素点和线出发,利用复杂网络分析方法对高校校园BBS社会网络结构进行分析。研究发现,高校校园BBS社会网络符合幂律分布规律,具有无尺度和小世界特性,为研究BBS社会网络的舆情传播路径和方式提供了有力帮助,进而为制定预防各种突发事件的发生提供新的参考。

参考文献:

[1]中国互联网络信息中心(CNNIC).第29次中国互联网络发展状况统计报告[R].2012.ht1p://vmwxnnic.cn/research/bgxz/tjbg/201201/t20120116_23668.html.

[2]王来华.舆情研究概论——理论、方法和现实热点[M].天津:天津社会科学院出版社,2003:336.

[3]张建勇.论群体性突发事件的产生原因及有效防范[J].兰州学刊,2004(3):901-902.

[4]Kwak H,Lee C Y,Park H, et al.What is twitter,a social network or a news media?[C]//Proceeding of the 19th International World Wide Web Conference.Raleigh,North Carolina USA,2010.

[5]金鑫,谢斌,朱建明.基于复杂网络分析的微博网络舆情传播[J].吉林大学学报(工学版),2012,9(42).

[6]Watts D.J.,Strogatz S. H. Collective dynamics of small world networks[J].Nature 1998,393:440-442.

[7]Barrat A.Comment on small-world networks: evidence for a crossover picture[J].PhysRevLett,1999.

作者简介:童亚拉,女,湖南桃源人,博士,教授,主研领域:智能计算,复杂网络,数据挖掘。

作者单位:湖北工业大学理学院,武汉 430068;奥斯丁学院,美国德克萨斯 75090

基金项目:湖北教育厅人文社会科学研究重点项目(2010d025);武汉市社会科学研究基金(whsk10087)。

作者:童亚拉 君妍

基于复杂网络的网络舆情论文 篇3:

网络舆情知识复杂度指标体系构建研究

〔摘 要〕从知识管理的角度出发,构建网络舆情知识复杂度指标体系。指标体系的设计充分顾及了网络舆情的知识复杂性,在对网络舆情知识复杂度影响因素进行全面分析的基础上,通过指标量化方法和复杂度映射函数建立网络舆情知识复杂度评价指标体系。最后,利用灰色相似度思想和偏差分析方法对所提指标体系进行了有效性验证,结果表明,所提指标体系具有较高的有效性指数,能够作为政府应用知识管理理论和方法应对网络舆情的决策参考。

〔关键词〕网络舆情;知识复杂度;指标体系

DOI:10.3969/j.issn.1008-0821.2015.07.008

〔Key words〕online public opinions;knowledge complexity;the evaluation indicator system

网络舆情作为社会舆情的重要内容,指的是人们经过互联网传播媒介抒发对各种事件刺激而产生的所有认知、态度、情感和行为倾向的集合。平日里各种隐性的社会矛盾和不满情绪借助网络这个载体,逐渐浮出水面,释放它们巨大能量,并对社会表现出越来越强劲的现实影响力。随着中国网民素质的提升,网民对社会事件的免疫力不断加强,情节简单、是非明确的社会事件无法引起网民和网媒的支持关注,难以形成网络舆情[1],能够引起极大关注并形成网络舆情的事件通常是错综复杂、处置困难、形式多变的。在网络舆情日趋多元化和复杂化的形势下,学术界建立了丰富多样的指标体系用于网络舆情的预警与监测,其根本目的是为了防止网络舆情影响的进一步扩大,却忽略网络舆情自身的复杂性和正当诉求。与其治标不如治本,本文通过对网络舆情自身的知识复杂性分析,研究网络舆情的知识复杂度的指标体系及其量化方法,并对其进行有效性验证,从而更加客观、全面、深入的分析舆情,有助于从知识管理的角度提出网络舆情的解决之道[2]。

1 网络舆情知识复杂性概述

网络舆情知识复杂性分为网络舆情事件内部复杂性和事件外部环境复杂性两类,它们之间相互联系又相互区别:网络舆情事件内部复杂性引起了外部网络环境中民众的广泛关注和热烈讨论从而形成网络舆情,而网络舆情话题的升级、关注热度的升温、影响力的扩大等外部因素反过来又影响网络舆情事件的发展和处置,从而影响了事件主体之间关系的变化。为了深入理解网络舆情事件内外部复杂性的差异,下面具体分析各自的概念及特点:

11 网络舆情事件内部复杂性概念及特点

网络舆情事件内部复杂性指的是网络舆情事件主体之间相互影响、冲突、依赖等错综繁杂的关系、行为和状态的总和。换而言之,网络舆情事件内部复杂性是事件内部利益相关者之间交互作用的结果,也是引起网络舆情的根源性问题,其特点主要包括如下3个方面:

111 主体矛盾难以调和

网络舆情事件主体之间往往存在激烈的矛盾冲突和复杂的利益纠葛,并且容易激化、升级或转化。事件主体的多元化导致了矛盾的愈加复杂和难以调和。大量的利益或非利益主体卷入了利益博弈中,博弈变得复杂,利益更难以调和。典型的是有关房地产的政策法规,房地产商、地方政府、炒房者、投资者、需求者、中央政府、金融机构、学者都参与到博弈中。

112 事件机理值得分析

网络舆情事件能够形成一定的影响力和关注度,说明该事件具有典型性,事件所蕴含的深层次规律和机理能够引起社会各界舆情受众的探讨和交流。例如,近几年的热点事件“雾霾及其治理”就雾霾产生的原因及其如何防治,引发了网络全民大讨论,原中央电视台知名新闻记者“柴静”专门制作了名为“穹顶之下”的雾霾深度调查视频,引爆了网络话题,深刻反映了事件背后的内在机理是高度知识复杂性网络舆情的重要特点。

113 折射公众利益

网络舆情事件多是社会矛盾的突出反映,往往直接或者间接折射公众利益。网民更加倾向于关注那些关系到其所处阶级自身利益问题,换而言之,这类能够折射公众利益的事件更容易形成网络舆情。而涉及公众利益的问题,一般都与社会、经济、政治等机制体制问题密不可分,因此事件折射公众利益的深度和广泛性也是网络舆情知识复杂性重要体现。

12 网络舆情事件外部复杂性概念及特点

网络舆情事件外部复杂性指的是外部网络环境受到网络舆情事件传播影响,形成的各种错综复杂的态度、观点、情绪、行为的总和。网络舆情事件外部复杂性主要呈现如下4个方面的特点:

121 网络舆情信息表现形态的复杂性

网络舆情信息表现为文本、图像、音视频等多种形式[3]。其中,文本类舆情是促进网络交流的主要手段,图像类舆情更有说服力和视觉冲击感,音视频类舆情能够在短时间内整合最直观最丰富的信息量呈现在网民面前。

122 网络舆情渠道的复杂性

公众了解和参与网络舆情的渠道形式多样,例如各大新闻网站、电子邮件、即时通信工具、论坛、网络音乐等都可以作为传播和扩散网络舆情的渠道和媒介。网络舆情借助这些渠道能够迅速向全社会蔓延渗透。

123 网络舆情受众结构的复杂性

截至2014年6月,我国网民规模达632亿,半年共计新增网民1 442万人。互联网普及率为469%。尽管学生网民依然是中国网民中的最大群体,但是其他职业人群比例也在逐年上升,尤其是党政机关/事业单位领导干部的参与热情持续升温,使得网络舆情受众结构越来越全面,同时受众结构的庞大也使得网络舆情复杂性与日俱增。

124 观点、态度的多样性

复杂的公共事件引发的网络舆情一般都呈现多极化的舆论态势。社会各界站基于各自不同立场在网络上表明态度、发表意见,形成了混杂繁复的观点群。例如我国人保部关于“延迟退休”的网络舆情事件,虽然研究制定渐进式延迟退休年龄政策是大势所趋,但对于不同职业、不同工种的网民来说,自然对其有着各自不一样的态度和意见。

2 网络舆情知识复杂度影响因素分析

网络舆情的知识复杂度是对网络舆情知识复杂性的量化评估值,从系统论的角度来看,是由网络舆情事件的主体、客体、传播和受众4个因素相互作用共同影响的结果:网络舆情事件的产生是由舆情事件主体和客体之间相互作用的结果,进一步通过网络媒体的传播,对舆情受众生产影响,每一个环节知识复杂性的波动,都会引起其他因素的复杂性动态波动,从而使得整体网络舆情知识复杂度的升级(如图1所示)。在进行影响因素分析时,笔者参考了大量网络舆情的案例和其他文献中关于网络舆情的指标体系,从知识复杂性的角度尽可能全面地得出影响网络舆情知识复杂度的因素,从而设计出相应的指标体系。

21 舆情事件主体

首先,“网络舆情事件”的定义有别于“网络舆情”,它是在现实中产生,网络中传播,并由网络舆情推动其发展演进而形成的具有较大影响力的公共事件[4]。

舆情事件主体指的是在网络舆情事件中行使某项行为的自然人、组织等要素的总称,是影响网络舆情知识复杂度的主要源头,也是决定网络舆情事态发展的关键所在[5]。网络舆情事件多是社会矛盾的反应,往往涉及较广范围群体的现实利益,具体到网络舆情事件主体知识复杂性问题,主要考察了政府部门相关度、利益相关群组指数和利益相关群体的地理分散度3个指标,具体分析如下:

211 政府部门相关度

网络舆情事件主体的知识复杂性首先体现在事件与政府部门的相关度上。事件的性质和地理分布决定了与其相关的职能部门和关联部门的等级。跨地区、跨部门的政府参与规模反映了事件的复杂性和影响力。越多政府部门介入网络舆情事件,需要越多的决策知识用于支持部门间的协调联动、整合最广泛的政府资源来处理事件引发的各种问题,即它的知识复杂度就越高。本文将独立法人的政府部门数量用于表征政府部门相关度的高低。

212 相关利益群组数

网络舆情事件利益相关群组是指那些引起、制造、挑起事件,以及受到事件发生和处置过程所影响的个人或群体,这些群组是事件的直接或间接的参与者,包括了事件发生的社会矛盾的主体以及矛盾所涉及的部门、群体和个人[6]。他们分别形成了立场不同的利益相关群组,在事件中相互影响、相互制约。不同的相关利益群组在事件中的利益、权力和要求不同,群组之间存在相互协同、对立、冲突、支持等多种复杂关系,利益相关群组数越多,矛盾越复杂,需要越多的知识工具和方法用于分析、处理和协调群组之间的关系,即知识复杂度越高。

213 利益相关群体的地理分布

网络舆情事件中的利益相关群体地理分散性与网络舆情知识复杂度成正相关关系,因为地理分布广泛会使问题的差异性、处理难度、影响力以及协调资源分配的非均衡性明显增大,相应的知识复杂度也更高。

22 舆情事件客体

舆情事件客体因素主要包含了网络舆情的关键指向物种类数及其主要的相关领域别两个指标,具体分析如下:

221 关键指向物种类

网络舆情事件的关键指向物指的是网络舆情事件中起关键性作用的现实对象,是触发利益相关群组发生联系的主要客观因素。关键指向物可以是实体对象,也可以是虚拟对象,是网络舆情事件中关键物质因素的总和。关键指向物种类数也是衡量网络舆情知识复杂度的一个重要指标。为了量化该指标,文章在分析了2009-2014年十大网络舆情热点事件的基础上,整理了舆情事件关键指向物总类表,如表1所示。事实证明,即使最高复杂度的网络舆情事件,其关键指向物种类数也不会超过10个。

222 相关领域别

关键指向物的属性虽然一定程度上反映了该网络舆情事件的领域归属,但不能替代相关领域别指标。相关领域别取决于网络舆情的事件属性,是从全局角度对网络舆情事件特性的划分,因此,相较于关键指向物种类数,相关领域别的数量是从更高层次描述了网络舆情的知识复杂度,笔者也从大量舆情案例中整理了相关领域的种类,用于量化该指标(如表2所示)。对5年内的十大网络舆情案例分析得出:即使最高复杂度的网络舆情事件,其相关领域别也不会超过6个。

23 媒体传播因素

媒体是公共事件扩散成网络舆情的重要平台,媒体传播的深度、频繁度和持续度不仅反映了网络舆情知识复杂度,而且也会引发对事件更深入的知识挖掘和分析。

231 报道深度

对于越复杂、观点越多的网络舆情事件,媒体报道的篇幅越大,因此媒体报道的深度可以用主要媒体最长报道字数的平均数来表示。

232 报道频繁度

这里用事件发生后1个月内的媒体指数(百度指数舆情监测软件提供)来表征报道的频繁度,密集的媒体报道反映了网络舆情事件包含的信息量及其动态发展情况,是网络舆情知识复杂度的重要指针。

233 报道持续度

报道的持续时间越长,说明网络舆情事件影响力越深远,复杂程度越高,例如马航失联航班事件,在长达近一年的时间内,相关报道仍然时常出现在各大网媒主要版面上。旧的问题尚未解决、新的问题层出不穷,虽然报道热度有所下降,但复杂程度有增无减。考虑到指标的普适性,我们采用事件发生后的1个月为测量时间窗,统计1个月(30天)内媒体指数大于10的天数的比例作为量化报道持续度的指标。

24 舆情受众

舆情受众指的是在互联网上关注该网络舆情事件的公众的集合体,是形成网络舆情的主要因素。舆情受众指标包含了关注热度、受众素养、受众主动发声率和受众未知度4个二级指标。

241 关注热度

关注热度是网络舆情的基础指标,是高知识复杂度网络舆情的必要条件。该指标采用了“百度指数舆情监测软件”中的搜索指数作为基础数据,将事件的搜索指数与年度最热事件的搜索指数的比值作为监测指标。

242 受众素养

网络舆情受众的素养一般指其受教育水平的高低。受众的素养越高,认识和分析事件的能力越高,因此更能挖掘出该网络舆情事件的深层内涵和延伸信息,从而提高了网络舆情的知识复杂性。

243 受众主动发声率

受众主动发声率是通过对主要论坛的发帖数与浏览数的比值平均数计算得到的。舆情受众的疑问和诉求主要通过发帖的形式体现的,虽然其中带有情绪宣泄的成分,但受众主动发声率仍然能够反映受众对网络舆情的“求知欲”,侧面刻画了网络舆情的知识复杂性。

244 受众未知度

受众的未知度说明了舆情受众对事件的不熟悉的程度,受众对舆情事件未知程度越高,体现了网络舆情对一般大众的知识复杂度越高,可以用事件主要搜索词在事件发生前后搜索指数的差与事件整体搜索指数的比值的平均值来体现。

3 网络舆情知识复杂度指标体系的确立及量化方法

通过对网络舆情知识复杂度指标体系的详细分析和设计,构建了网络舆情知识复杂度的指标体系:主要包括了舆情事件主体、舆情事件客体、媒体传播、舆情受众4个一级指标,政府部门相关度、利益相关群组数等12个二级指标,分别确定了每一指标的具体量化方法(如表3所示)。

由表3可知,网络舆情知识复杂度指标体系的每一项指标均可量化计算得出。指标量化的方法大体分为四类:反正切映射函数、Sigmoid映射函数、基准比较量化法、均值法。

31 反正切映射函数

经过21分析可知,指标e11与知识复杂度有正相关关系,笔者对大量网络舆情案例分析得知,当政府相关部门数量超过10时,复杂度已经相当高了,即超过这个阀值时,无论相关数量10还是100,我们都赋予这个指标最高等级的知识复杂度,而绝大部分网络舆情事件的相关部门数量小于10,而且我们希望在(0,10)的区间内对不同事件的知识复杂度划分等级,因此,量化的函数能够实现自变量在10以内有明显变化,超过10时趋向一个极限值,同时,考虑到我国有34个省级行政区,为了反映现实情况,函数值必须在自变量超过30时变化才趋于平稳,因此,本文设计的映射函数为:

e11=2arctan(x/5)π

其中x表示相关的政府部门数,它为大于等于0的整数。该函数能保证函数值全部映射在[0,1)的区间内,并且符合上述数据特征的变化(如图2所示)。指标体系中的e13也有相似的数据特征,因此也采用这种量化方法。

32 Sigmoid映射函数

通过23的分析,指标e31用报道的篇幅表征该指标的知识复杂程度,根据笔者对大量热点舆情案例的搜索研究,即使是疑点重重的“2014年马航失联”案例,主要网媒的最大篇幅也不到5千字,一般网络舆情事件的字数都在1千字到3千字不等,因此映射函数的设计必须满足步长为1的自变量在(0,5)区间内的显著变化以及超过5时就有逼近极限值的平滑变化的效果。Sigmoid函数的变化正好符合这种效果(如图3所示)[7],公式为:

e13=11+e-x

其中x表示主要网媒单篇最长报道字数平均数(单位:千字),它为大于等于0的实数。指标体系中的e12也有相似的数据特征,因此也采用这种量化方法。

33 基准比较量化法

经过分析,我们知道诸如报道频繁度e32和关注热度e41与网络舆情的知识复杂度有重要关联,但单纯以“百度指数”提供的数据对其进行量化是不客观的。这两个指标与事件发生的时间窗内媒体数量、媒体渠道数量、网民数量、通信方式的变化等因素相关,因此不同时间窗内的事件的指数高低是不具可比性的。考虑到这些因素,同时为了使指标值映射在固定区间内,选取评估事件所在时间窗(这里时间窗设置为1年)内搜索指数和媒体指数最高的网络舆情事件作为量化基准,将当前事件的媒体指数和搜索指数分别与最热网络舆情事件的相应指数的比值作为e32、e41的指标值。

34 平均值法

考虑到指标值的客观性和普适性,网络舆情的知识复杂度指标量化上尽量使用平均值来替代单一数据指针。例如受众未知度e44就以3个主题词搜索指数变化的平均值作为指标值,同理可得受众主动发声率e43的指标值。

4 网络舆情知识复杂度指标体系有效性检验

41 网络舆情知识复杂度指标体系有效性评价方法

为检验所构建的指标体系是否科学可行,有必要对其进行有效性分析。指标体系的有效性是指评价者利用指标体系进行评价时,该指标体系的有效程度,具体包括了该指标系统能否充分表达评价目标、并且充分反映了待评价对象的本质,以及指标体系的灵敏程度和冗余程度[8]。

文章借鉴灰色相似度思想以及数值分析中偏差分析的方法,确立了相似关联程度指数,文中称之为有效性指数,即专家对指标的评价与实际值之间的相似程度,通过指标有效性指数判断所构建的指标体系的有效性。

设评价指标集H={h1,h2,…,hi,…,hn},其中,n为评价指标的个数;参与指标评价的专家人数为m,所有专家对指标hi的评分集为yi={yi1,yi2,…,yim}。

假设指标hi得分的平均值为:

i=1m∑mj=1yij

根据统计学的思想,可以将视为指标的真实有效程度,即可以将i作为指标hi的实际值。根据有效性指数的含义和灰色相似关联度的公式[9],定义指标hi的有效性指数为βi:

βi=11+σi

其中,σi为数值分析中的误差公式定义的指标hi的偏差系数,其公式定义如下:

σi=1m∑mj=1i-yiji

从而,整个指标体系H的有效性指数β定义如下:

β=1m∑ni=1βi

指标体系的有效性指数越高,代表专家对指标的评估值与实际值之间的误差越小,意味着专家对指标体系与被评价对象的评价意见就越趋于一致,则可认为该指标体系具有良好的有效性。一般来说,当β≥85%时,即可认定该指标体系的有效性较好,能够进行实际应用。

42 网络舆情知识复杂度指标体系有效性检验

根据上述有效性检验的方法,选取了10位评价者,按照对网络舆情知识复杂度从低到高5个等级对每一个指标进行打分,分数的高低表示专家对该指标的认可程度。10位专家包括了政府宣传部门的公务员3名(从事政府宣传工作5年以上)、媒体工作者3名(从事新闻广播工作5年及以上)、资深网民3名(网龄10年以上),情报领域的海外专家1名(硕士以上学历),结果如表4所示。

评价结果显示,在所有指标中,获得专家认可度最高的是利益相关群组数指数和相关领域别。利益相关群组数体现了网络舆情事件本身矛盾多方相互影响、相互制约的复杂关系,是网络舆情知识复杂性的根源所在,处理好利益相关群组之间的问题是应对网络舆情的核心和首要问题。网络舆情的相关领域别是对网络舆情问题进行定性的重要参考,网络舆情问题涉及领域越多,越需要多领域专家群体思考和决策,对其进行处理和解决,评价结果说明专家认为跨多领域的网络舆情事件知识复杂度较高。从评价结果中还可以看出,专家对指标“受众主动发声率”的认可度低于其他指标,该指标是通过受众对网络舆情事件的质疑能够侧面反映其复杂程度,但近年来网络舆论受到网络水军的干扰,一定程度上影响了该指标的真实性,所以在进行评估时可以适当降低该指标的权重。

通过分析和计算,最后得到网络舆情知识复杂度评价指标体系的有效性指数为08524>085,说明所构建的指标体系具有较高的有效性,可以用于网络舆情知识复杂度的评估。

5 讨 论

文章分析了网络舆情知识复杂性的概念与特点,并从“舆情主体、舆情客体、传播深度和舆情受众”4个方面构建了网络舆情知识复杂度评估指标体系,提出了多种函数和量化机制,实现对网络舆情知识复杂度指标的量化及其在数据区间内的映射。进一步借鉴灰色相似关联度和有效性检验的原理,定义了有效性指数,用以验证所构建指标体系的有效性,为进一步研究网络舆情知识复杂度评估提供理论与实证研究的基础。

参考文献

[1]郑小雪,陈福集.面向网络舆情的政府知识管理动因研究[J].图书馆学研究,2013,(7):28-33.

[2]郑小雪,陈福集.面向网络舆情的政府知识管理理论体系构建研究[J].图书馆学研究,2014,(15):1-3.

[3]唐喜亮.国际突发公共事件中传播舆情分析——以马航空难为例[J].新闻知识,2015,(2):10.

[4]黄成军.网络舆情与公共事件关系研究[D].重庆:重庆大学新闻学,2009:4-15.

[5]王平,谢耘耕.突发公共事件网络舆情的形成及演变机制研究[J].现代传播:中国传媒大学学报,2013,(3):63-69.

[6]熊建,杨爱华.基于利益相关者理论的群体性事件对策研究[J].北京航空航天大学学报:社会科学版,2008,21(4):26-30.

[7]谈国新,万一.突发公共事件网络舆情监测指标体系研究[J].华中师范大学学报:人文社会科学版,2010,(3):66-70.

[8]付允,刘怡君.指标体系有效性的RST评价方法及应用[J].管理评论,2009,21(7):91-95.

[9]张文德,袁圆.数字图书馆知识产权风险评估[J].情报理论与实践,2012,35(5):28-32.

(本文责任编辑:孙国雷)

作者:郑小雪 陈福集

上一篇:地方四大后现代电影大师论文下一篇:高中物理研究性学习研究论文