CN111428113A

CN111428113A - 一种基于模糊综合评判的网络舆论引导效果预测方法

Info

Publication number: CN111428113A
Application number: CN202010229129.5A
Authority: CN
Inventors: 李弼程; 熊尧; 潘乐; 黄涛
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2020-07-17
Anticipated expiration: 2040-03-27
Also published as: CN111428113B

Abstract

本发明公开了一种基于模糊综合评判的网络舆论引导效果预测方法，通过网络爬虫技术爬取事件相关信息，根据网络舆论态势指数，构建网络舆论威胁评估指标体系；对网络舆论态势指标进行威胁等级模糊化，并利用模糊综合评判合成威胁等级模糊集；对威胁等级模糊集解模糊化，得到网络舆情威胁指数，进行舆情评估；实现了对网络舆论引导方法的效果预测，为有效的舆论引导提供辅助决策信息，对事件的进行实时监测和预警，也可用于事件引导仿真的效果度量。

Description

一种基于模糊综合评判的网络舆论引导效果预测方法

技术领域

本发明涉及网络舆论引导效果预测分析领域，特别是指一种基于模糊综合评判的网络舆论引导效果预测方法。

背景技术

近年来，关于网络舆情的学术研究主要体现在网络舆情监测、预警和预测，网络舆情演化/传播模型与网络舆论引导。舆论引导的主流研究方法，一般是基于信任代理或者是基于用户行为偏好的方法。以上研究方法从定量角度出发，分析得出利用信任代理可以实现引导网络节点逐渐产生共识，并且通过用户行为偏好分析，利用相似行为偏好的邻居节点也可以实现引导的目的。但是以上引导方法停留在理论研究层面，没有结合具体舆论事件详细分析舆论引导效果和对引导效果进行评估。尝试从知网以舆情引导为关键词进行搜索，相关研究的论文多属于社科类，定性分析舆论引导，极少研究舆论引导效果预测。其中个别文献利用问卷调查，并对数据进行了分析，在此基础上，确立了评估指标体系，构建新媒体语境中重大公共危机事件舆论和舆情引导效果预测指标体系。虽然在文献中建立了舆情引导效果预测指标体系，但是没有提出综合考虑各指标，对引导效果进行评估的具体方法。

发明内容

本发明的主要目的在于为了解决以上现有研究中关于网络舆论引导效果预测定量分析的方法缺失，提供了一种基于模糊综合评判的网络舆论引导效果预测方法。

本发明采用如下技术方案：

步骤S1.通过网络爬虫技术爬取事件在微博平台上的相关原帖和转发贴，根据产生相关行为时间点，划分事件时间切片，统计每个时间切片内数据。

步骤S2.根据网络舆论态势指数，构建网络舆论威胁评估指标体系；

步骤S3.利用层次分析法，确定威胁评估指标体系中各层指标权重，得到二级和三级指标对舆论主体的影响程度；

步骤S4.对网络舆论态势指标进行威胁等级模糊化，并利用模糊综合评判合成威胁等级模糊集；

步骤S5.对威胁等级模糊集解模糊化，得到网络舆情威胁指数I1；

步骤S6.网络引导后，重复步骤S1-S5，得到网络引导后网络舆情威胁指数I2；

步骤S7.根据网络舆情威胁指数I1和I2，得出网络引导效果指数T＝I2-I1。

具体地，步骤S1中划分事件时间切片的具体方法为：

步骤S1.1将从微博平台获得的与事件相关的原帖和转发贴进行数据预处理，其中包括中文分词、信息敏感与否归类和信息正面、中立和负面态度归类；

步骤S1.2在事件发展过程中，，根据产生相关行为时间点，顺序的两个时间点之间形成一个事件时间切片。

具体地，步骤S2中构建网络舆论威胁评估指标体系的具体方法为：通过网络舆论态势指标，通过概念范畴算法提炼形成三级指标体系。

步骤S2.1网络舆论态势指标包括：重要程度x₁、负面倾向占比x₂、发帖数量x₃、搜索指数x₄、媒体指数x₅和话题持续时间x₆6个三级态势指标。

步骤S2.2 6个三级态势指标初步处理；

步骤S2.2.1对事件每个时间切片内的话题重要程度进行计算，方法为：

根据步骤S1.1中处理的将语料进行敏感与非敏感分类和步骤1.3中将事件进行时间切片，统计每个时间切片p_i,i∈(1,…,n-1)中信息总量num₁、敏感信息量num₂和非敏感信息量num₃，对应的权值分别为r₁,r₂,r₃，其中r₁+r₂+r₃＝1，话题时间切片内的话题重要性为：

步骤2.2.2对事件每个时间切片内的负面倾向占比进行统计计算；

步骤2.2.3对事件每个时间切片内的发帖数量进行统计计算；

步骤2.2.4对事件每个时间切片内的搜索指数进行统计计算；

步骤2.2.5对事件每个时间切片内的媒体指数进行统计计算；

步骤2.2.6对事件每个时间切片内的话题持续时间记录统计计算：

步骤2.3通过概念范畴从三级指标中提炼出话题重要性y₁、公众反应y₂和话题热度y₃3个二级指标。

步骤2.4将3个二级指标凝练成事件舆论威胁指数y₀一级指标，从而构建网络舆论威胁评估指标体系。

具体地，步骤S3中确定威胁评估指标体系中各层指标权重的方法为：

根据S2中构建的网络舆论威胁评估指标体系，将网络舆论威胁等级判定分为三层结构：

L₀：事件舆论威胁指数y₀；

L₁：话题重要性y₁，公众反应y₂，话题热度y₃；

L₂：话题重要程度x₁，负面倾向性占比x₂，发帖数量x₃，搜索指数x₄，媒体指数x₅，话题持续时间x₆。

步骤S3.1以y₀为准则，在网络舆情预警中，指标的重要性排序为：y₁>y₂>y₃，从而构造比较判断矩阵A；

步骤S3.1.1用式

对判断矩阵进行按列归一化得到矩阵A'；

步骤S3.1.2对A'按行求和

得向量矩阵W：；

步骤S3.1.3再归一化后即得权重系数矩阵，W₀：。

步骤S3.2以y₁为准则时，为一个指标，故其权重系数矩阵：W₁＝w₁₁＝1；

步骤S3.3以y₂为准则时，指标的重要性排序为：x₂>x₃>x₄，根据步骤S3.1计算得权重系数矩阵,W-2.；

步骤3.4以y₃为准则时，指标的的重要性排序为：x₅>x₆，根据步骤S3.1，计算得权重系数矩阵,W-3.。

具体地，步骤S4中对网络舆论态势指标进行威胁等级模糊化，并利用模糊综合评判合成威胁等级模糊集的具体方法为：

步骤S4.1把网络舆论的威胁等级划分为：轻警情(Ⅳ级，非常态)、中度警情(Ⅲ级，警示级)、重警情(Ⅱ级，危险级)和特重警情(I级，极度危险级)四个等级。，分别用4个模糊子集来表示：

其隶属函数

步骤S4.2，采用高斯函数来定义隶属函数

分别表示指标x_i对4个网络舆论威胁等级的评价。

具体的，步骤S5中对威胁等级模糊集解模糊化，得到网络舆情威胁指数的方法为：

根据隶属函数

以及基于层次分析法，并利用模糊综合评判的技术来计算

步骤S5.1由三级指标对4个网络舆论威胁等级的评估，计算二级指标对应的评估；

由步骤S3.2描述的W₁可以计算，话题热重要性对4个网络舆论威胁等级的评估

由步骤S3.3描述的W₂可以计算，公众反应对4个网络舆论威胁等级的评估

由步骤S3.4描述的W₃可以计算，话题热度对4个网络舆论威胁等级的评估

步骤5.2利用二级指标对应的评估，由步骤S3.1.3描述的W₀可以计算，网络舆论威胁等级

步骤5.3对威胁等级模糊集解模糊化，得到网络舆情威胁指数/：

具体的，步骤S7中得出网络引导效果指数的具体方法为：

步骤S7.1假设时间点t_i(要结合具体事件具体分析)发生了舆论引导的行为，然后利用步骤S2-S5计算(t_i-1,t_i)时间切片的网络舆情威胁指数I_i-1，计算(t_i,t_i+1)时间切片的网络舆情威胁指数I_i

步骤S7.2计算网络引导效果指数T＝I_i-I_i-1。

由上述对本发明的描述可知，与现有技术相比，本发明具有如下有益效果：

1.网络舆论引导的目的是降低网络舆论对事件主体的威胁指数，因此，可以利用威胁指数的变化值，评估事件主体选择网络舆论引导方法/策略的优劣。本发明提出了利用模糊综合评判的方法解决了网络舆论引导效果预测的定量分析问题。

2.将事件的发展过程按照特殊时间点切片，利用本发明中的方法可以计算每个时间切片的事件威胁指数，实现对事件的实时监测和预警。

3.实现了对网络舆论引导方法的效果预测，可以为有效的舆论引导提供辅助决策信息，也可用于事件引导仿真的效果度量。

附图说明

图1为本发明的数据预处理流程图；

图2为本发明基于模糊综合评判的网络舆论引导效果预测流程图；

图3为本发明的网络舆论威胁评估指标体系图。

具体实施方式

以下通过具体实施方式对本发明作进一步的描述。

本发明采用如下技术方案：

步骤1.通过网络爬虫技术爬取事件在微博平台上的相关原帖和转发贴，在事件发展过程中，相关人/地/组织在某时间点产生事件相关行为，并引发事件讨论，根据产生相关行为时间点，划分事件时间切片，统计每个时间切片内数据。

步骤2.根据网络舆论态势指数，构建网络舆论威胁评估指标体系；

步骤3.利用层次分析法，确定威胁评估指标体系中各层指标权重，得到二级和三级指标对舆论主体的影响程度；

步骤4.对网络舆论态势指标进行威胁等级模糊化，并利用模糊综合评判合成威胁等级模糊集；

步骤5.对威胁等级模糊集解模糊化，得到网络舆情威胁指数I1；

S6.网络引导后，重复步骤S1-S5，得到网络引导后网络舆情威胁指数I2；

S7.根据网络舆情威胁指数I1和I2，得出网络引导效果指数T＝I2-I1。

如图1，为本发明的数据预处理流程图；

步骤1.1将从微博平台获得的与某一事件相关的原帖和转发贴进行数据预处理，其中包括中文分词、信息敏感与否归类和信息正面、中立和负面态度归类；

使用NLPIR汉语分词系统对所用的事件微博语料进行分词和去停用词处理，将语料按照正面、中立和负面态度归类，再与敏感词库进行对比，语料内包含敏感词库内的词语则归为敏感信息，反之则归为非敏感信息。

步骤1.2在事件发展过程中，事件相关人/地/组织在某时间点产生事件相关行为，并引发事件讨论，根据产生相关行为时间点，顺序的两个时间点之间形成一个事件切片；

假设事件c由n个相关事件时间点组成，相关事件时间点指的是在事件发展过程当中的时间点，在这些时间点上发生了新的推动事件发展的小事件(新的言论、新的证据等)，所以事件c有相关时间点序列s＝{t₁,t₂,…,t_n}，两个顺序的时间点之间形成一个事件时间切片。则事件c的时间点切片p＝{(t₁,t₂),(t₂,t₃),…,(t_n-1,t_n)}，一共有n-1个时间切片。

如图2是基于模糊综合评判的网络舆论引导效果预测流程图；图3为本发明的网络舆论威胁评估指标体系图。

步骤2中构建网络舆论威胁评估指标体系的方法为：根据网络舆论态势指标，再通过概念范畴提炼形成三级指标体系。

步骤2.1话题重要程度x₁、负面倾向占比x₂、发帖数量x₃、搜索指数x₄、媒体指数x₅和话题持续时间x₆6个三级态势指标。

步骤2.26个三级态势指标初步处理；

步骤2.2.1对事件每个时间切片内的话题重要程度进行计算方法为：

根据步骤1.1中处理的将语料进行敏感与非敏感分类和步骤1.3中将事件进行时间切片，统计每个时间切片p_i,i∈(1,…,n-1)中信息总量num₁、敏感信息量num₂和非敏感信息量num₃，对应的权值分别为r₁,r₂,r₃，其中r₁+r₂+r₃＝1，话题时间切片内的话题重要性为：

对话题内容的重要程度进行归一化，归一化重要程度x₁∈[0,1]。x₁越高，危险级别越高。

步骤2.2.2对事件每个时间切片内的负面倾向占比进行计算方法为：

根据步骤1.1中处理将语料进行正面、中立和负面分类和步骤1.3中将事件进行时间切片，统计每个时间切片p_i,i∈(1,…,n-1)中负面语料所占比例记为x₂，比例得出是百分制，数据归一化。

步骤2.2.3对事件每个时间切片内的发帖数量进行计算方法为：

根据步骤1.3中将事件进行时间切片，统计每个时间切片p_i,i∈(1,…,n-1)的帖文数量，并归一化x₃∈[0,1]，时间切片内的帖文数量代表了时间段内网民对该事件的参与度。

步骤2.2.4对事件每个时间切片内的搜索指数进行计算方法为：

搜索指数代表互联网用户对关键词搜索关注程度及持续变化情况，以网民在百度的搜索量为数据基础，以关键词为统计对象，科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权。根据数据来源的不同，搜索指数分为PC搜索指数和移动搜索指数。本发明直接使用相关事件在爆发期间百度搜索统计的搜索指数。指数越高，公众参与性越高。对舆论话题事件整个过程的每单位时间的搜索指数程度进行归一化，得到归一化搜索指数x₄∈[0,1]。

步骤2.2.5对事件每个时间切片内的媒体指数进行计算方法为：

媒体指数是新闻资讯在互联网上对特定关键词的关注及报道程度，以各大互联网媒体报道的新闻中，与关键词相关的，采用新闻标题包含关键词的统计标准。本发明直接使用相关事件在爆发期间百度搜索统计的媒体指数。指数越高，话题热度越高。对舆论话题事件整个过程的每单位时间的媒体指数程度进行归一化，得到归一化媒体指数x₅∈[0,1]。

步骤2.2.6对事件每个时间切片内的话题持续时间记录方法为：

话题持续时间指的是舆论事件持续的时间，持续时间越长，热度越高。对持续时间进行归一化，得到归一化持续时间x₆∈[0,1]。

步骤2.3通过概念范围从三级指标中提炼出话题重要性y₁、公众反应y₂和话题热度y₃3个二级指标。

三级指标话题重要程度x₁属于二级指标话题重要性y₁；

三级指标负面倾向占比x₂，发帖数量x₃，搜索指数x₄属于二级指标公众反应y₂；

三级指标媒体指数x₅，话题持续时间x₆属于二级指标话题热度y₃。

进一步地，步骤3中确定威胁评估指标体系中各层指标权重的具体方法为：

根据构建网络舆论威胁评估指标体系，本发明把网络舆论威胁等级判定分为三层结构：

L₀：事件舆论威胁指数y₀；

L₁：话题重要性y₁，公众反应y₂，话题热度y₃；

步骤3.1以y₀为准则，在网络舆情预警中，因素的重要性排序为：y₁>y₂>y₃，根据层次分析法，从而构造比较判断矩阵A如下：

步骤3.1.1用式

对判断矩阵进行按列归一化得到矩阵A'如下：

步骤3.1.2对A'按行求和

得向量：W＝(1.4714,0.9357,0.5919)^T

步骤3.1.3再归一化后即得权重系数：W₀＝(w₁,w₂,w₃)^T＝(0.49,0.31,0.20)^T

步骤3.2以y₁为准则时，只有一个元素，故其权值：W₁＝w₁₁＝1

步骤3.3以y₂为准则时，因素的重要性排序为：x₂>x₃>x₄，根据(1)中的步骤可以计算的权值向量为：W₂＝(w₂₁,w₂₂,w₂₃)^T＝(0.49,0.31,0.20)^T

步骤3.4以y₃为准则时，因素的重要性排序为：x₅>x₆，根据(1)中的步骤，可以得权重向量为：W₃＝(w₃₁,w₃₂)^T＝(0.67,0.33)^T

进一步地，步骤4中对网络舆论态势指标进行威胁等级模糊化，并利用模糊综合评判合成威胁等级模糊集的具体方法为：

步骤4.1把网络舆论的威胁等级划分为：轻警情(Ⅳ级，非常态)、中度警情(Ⅲ级，警示级)、重警情(Ⅱ级，危险级)和特重警情(I级，极度危险级)四个等级。分别用4个模糊子集来表示：

其隶属函数

步骤4.2对每个因素x_i，它本身就包含了因素与评语集的关系，故可以定义4个模糊子集：

分别表示因素x_i对4个网络舆论威胁等级的评价，采用高斯函数来定义隶属函数

其隶属函数分别为：

其中，x_i∈[0,1]，σ_i表示宽度，i＝1,2,…,6。

进一步地，步骤5中对威胁等级模糊集解模糊化，得到网络舆情威胁指数的具体方法为：

根据

以及层次分析法确定威胁评估指标体系中各层指标权重的方法，并利用模糊综合评判的技术来计算

步骤5.1由三级指标对4个网络舆论威胁等级的评估，计算二级指标对应的评估；

由W₁可以计算，话题热重要性对4个网络舆论威胁等级的评估：

由W₂可以计算，公众反应对4个网络舆论威胁等级的评估：

由W₃可以计算，话题热度对4个网络舆论威胁等级的评估:

步骤5.2利用二级指标对应的评估，由W₀可以计算，网络舆论威胁等级：

步骤5.3对威胁等级模糊集解模糊化，得到网络舆情威胁指数I：

具体地，根据假设事件c由n个相关事件时间点组成，事件c的相关时间点序列s＝{t₁,t₂,…,t_n}，两个顺序的时间点之间形成一个事件切片。则事件c的时间点切片p＝{(t₁,t₂),(t₂,t₃),…,(t_n-1,t_n)}，一共有n-1个按照相关事件时间切片。

步骤6.1假设时间点t_i(要结合具体事件具体分析)发生了舆论引导的行为，然后利用计算(t_i-1,t_i)时间切片的网络舆情威胁指数I_i-1，计算(t_i,t_i+1)时间切片的网络舆情威胁指数I_i；网络引导效果指数T＝I_i-I_i-1△I＝I_i-I_i-1。其中，I_i为引导后的网络威胁指数，I_i-1为引导前的威胁指数。T>0表示在发生引导后，事件的威胁指数增加，引导失败；△I<0表示在发生引导后，事件的威胁指数下降，引导成功。

1.网络舆论引导的目的就是，降低网络舆论对事件主体的威胁指数。因此，可以利用威胁指数的变化值，评估事件主体选择网络舆论引导方法/策略的优劣。本发明提出了利用模糊综合评判的方法解决了网络舆论引导效果预测的定量分析问题。

上述仅为本发明的具体实施方式，但本发明的设计构思并不局限于此，凡利用此构思对本发明进行非实质性的改动，均应属于侵犯本发明保护范围的行为。