CN111324795A

CN111324795A - 基于微博平台下食品安全网络舆情监测与评估模型的构建

Info

Publication number: CN111324795A
Application number: CN201811530753.8A
Authority: CN
Inventors: 马永军; 吴增铎; 柴梦瑶
Original assignee: Tianjin University of Science and Technology
Current assignee: Tianjin University of Science and Technology
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2020-06-23

Abstract

本文以食品安全网络舆情信息主题关注度变化趋势和食品安全网络舆情信息演化过程两个目标层构建监测指标，从舆情威胁等级与可信度两个目标层食构建评估指标，并通过采用粗糙集的指标量化方法对指标赋权，实现了对食品安全网络舆情监测与评估模型的构建。

Description

基于微博平台下食品安全网络舆情监测与评估模型的构建

技术领域

本发明属于食品安全网络舆情技术领域，尤其是微博平台下食品安全网络舆情监测与评估模型的构建。

背景技术

随着微博等新媒体的出现，以及微博用户规模日益的扩大，多元化和多样化的信息在已微博为载体的媒介下井喷式的出现，网络舆情也随即产生，其中包括了真实的与虚假的信息，而关于食品安全的话题占据绝大多数，这些关于食品安全的网络舆情必定会对人们的生活以及社会造成一定威胁与影响，尤其是虚假造谣的信息造成的社会危害更是严重，据统计食品类别的网络谣言占比高达45％。因此，食品安全网络舆情信息的可信度的评估以及威胁等级的评估成为迫切需要被解决的问题。

目前关于食品安全网络舆情的研究有：网络信息的可信度代表用户主观上对信息的信任程度，而不仅仅是狭义理解上客观的“真”或者“假”，目前关于可信度的研究有：

结合具有心理学特征的形态-媒介-交互性-适航性”(Modality，Agency，Interactivity，and Naviga-bility，MAIN)模型并以微信公众号为例对社会化信息可信度影响因素进行了研究，发现技术承载力(Affordance)形成的线索(Cues)触发了用户的启发式(Heuristics)思考，从而影响了用户对信息质量(Quality)的评估，继而影响了用户对信息可信度的判断(Credibility Judgment)，最后研究表明，信息内容的实用性、客观性、可靠性和相关性对社会化媒体信息可信度会产生积极影响，但是信息内容的一致性则不会产生直接影响；构建基于BA无标度网络的食品安全网络舆情传播仿真模型，在考虑信息真伪的情况下对食品安全网络舆情传播仿真与管理对策研究；从网络信息可信性分类及可信度定义、信息可信度特征与指标体系的建立、内容可信度分析建模、信息内容可信度测量评价方法四个方面对网络传播信息内容的可信度研究进展进行了研究；针对现有微博可信度评估中缺少对传播信息的分析，提出一种基于数据起源的微博可信度评估方法，对微博的信息来源和传播过程进行研究。以新浪微博为研究对象，分析用户的关键指标以及微博信息的传播场景，建立微博的PROV数据起源模型，记录微博信息的来源和传播过程的数据起源信息，并验证其有效性。结合传播过程中用户的可信度，利用数据起源信息，完善微博可信度评估的参考依据，弥补了现有一般评估方法中传播信息缺失的不足。

关于舆情威胁等级的研究有：

基于KNN与SVM结合的方法建立了网络安全态势的评估模型，从而提高了评估的正确率；基于TOPSIS方法建立网络威胁评估模型，采用AHP确定指标权重后利用TOPSIS方法对舆情进行排序；通过建立多级指标对我国网络舆情进行模糊评判；通过对突发事件网络舆情的发生周期构建了舆情生成，舆情扩散，舆情衰退的指标体系；从事态扩散、民众关注、内容直观、主题敏感、态度倾向五个维度构建了对群体性事件网络舆情的安全评估指标体系；从事态扩散、民众关注、内容直观、主题敏感、态度倾向五个维度构建了对突发事件网络舆情的安全评估指标体系，实现了对突发事件网络舆情的安全态势评估；从舆情要素，舆情热度，舆情活性三个维度构建了网络舆情评估EHA三维指标体系；以廉政网络舆情为例构建了四个象限的网络舆情危机等级评价模型；从传播扩散、民众关注、内容敏感性、态度倾向性四个维度构建网络舆情安全评估指标体系，实现了对某一具体的网络舆情信息的安全态势评估。

发明内容

本发明的目的在于克服现有关于食品安全网络舆情监测与评估模型的不足，综合监测与评估指标构建，利用粗糙集赋权法，带入到多级评估模型中，对食品安全网络舆情的威胁等级与可信度进行评估。

为实现上述目的，本发明的技术方案是：基于微博平台下食品安全网络舆情监测与评估模型的构建，包括以下步骤：

步骤1：利用爬虫获取微博中与食品安全相关的信息。

步骤2：利用现有的数据预处理平台对爬去的数据进行数据预处理，包括分词，提取特征向量。

步骤3：构建食品安全网络舆情监测与评估指标。

步骤4：利用粗糙集指标赋权法将指标量化

步骤5：将量化后的值带入到多级评估模型中进行威胁等级与可信度的计算本发明的优点和积极效果是：

相较于现有食品安全网络舆情监测与评估技术，本发明的有益效果：更全面的指标构建，以威胁等级与可信度为两个目标层进行指标构建；另外，采用粗糙集赋权法更加客观，避免了主观因素的干扰。

附图说明

图1为食品安全网络舆情的演化过程图。食品安全网络舆情的演化过程分为舆情萌芽阶段，舆情发展阶段，舆情井喷阶段，和舆情衰退阶段。当一个食品安全类的话题在网络上产生的时候，食品安全网络舆情便进入到演化过程中的萌芽阶段，此时网民在接收到此舆情信息后产生的情绪态度意见等与网络媒体进行互动，即进入到发展阶段，当发展阶段持续一段时间后，事件随着时间推移大规模的舆情信息产生并传播，导致事件进一步扩大，而事件的进一步扩大会反作用于舆情信息使之规模更大，如此循环直到一个顶峰后，在相关部门的介入后，舆情信息停止传播与扩散，开始进入到衰退阶段，舆情信息随时间推移逐渐平息。

具体实施方式

以下结合附图对本发明实施例做进一步详述：

一种基于微博平台下食品安全网络舆情监测与评估模型的构建，包括以下步骤：

相关定义：

(1)舆情，即“舆论情况”，是指在一定的社会空间内，围绕中介性社会事件的发生、发展和变化，作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。

(2)网络舆情是以网络为载体，以事件为核心，是广大网民情感、态度、意见、观点的表达，传播与互动，以及后续影响力的集合。带有广大网民的主观性，未经媒体验证和包装，直接通过多种形式发布于互联网上。网络舆情六大要素：网络、事件、网民、情感、传播互动、影响力。网络舆情是社会舆情在互联网空间的映射，是社会舆情的直接反映。而随着互联网的发展，大众往往以信息化的方式发表各自看法。

步骤1：监测与评估指标的构建。

食品安全网络舆情的演化过程分为舆情萌芽阶段，舆情发展阶段，舆情井喷阶段，和舆情衰退阶段，舆情演化的过程，因此食品安全网络舆情监测过程可以通过对食品安全网络舆情的演化过程进行监测。

通过对网络舆情演化、传播规律的分析和对食品安全网络舆情自身的性质和特点的了解以及在监测指标的基础上，以食品安全网络舆情为评估对象，以食品安全网络舆情可信度和食品安全网络舆情威胁等级为两个目标层，构建食品安全网络舆情评估指标

步骤2：利用粗糙集赋权法将指标量化。

粗糙集理论用一个四元组S＝(U，A，V，f)来描述一个知识系统，其中这里的S表示信息系统；U称为论域，表示对象的非空有限集合；A表示研究对象的属性集合；V表示某一属性的属性值；f表示一个信息函数，可以为对象的每个属性赋值如果用x表示对象集合U中的元素，用a表示属性集合A中的元素，则当a∈A，x∈U，必有f(x，a)∈Va。

粗糙集赋权步骤：

(1)构建决策表。将之前构建的指标中的评价因素视为决策表中的条件属性C＝{c1，c2，...，cn}，评价指标y视为决策属性，决策属性集D＝{y}。

(2)计算属性依赖度。由公式计算决策属性D对条件属性C的依赖度：

同时还需计算剔除某一属性c_i后，决策属性D对条件属性集C-c_i的依赖度，如公式：

(3)计算单个属性重要性。根据公式分别计算第i个属性c_i对决策属性D的重要性：

其中i＝1，2，...，m。

(4)归一化处理。通过归一化运算得出第i个条件属性的权重系数，即为对应评价指标的权重，如公式：

步骤3：将量化后的数据带入多级评估模型中计算。

W＝∑(A_i*∑(B_j*∑(C_k*w)))

其中A_i为一级指标权重，B_j为二级指标权重，C_k为三级指标权重，w为某三级指标的计算值。多级评判的结果W越大表示舆情威胁等级越高，可信度越高。

当w不为比率指标时需要对其做进一步的计算，计算方法根据指标的不同而不同。

(1)w为属性指标的计算。

属性指标指的是用户名、是否实名认证、是否有大V标识、发布时间、发布地点这些关于用户信息资料的指标。计算公式如公式所示：

其中n表示舆情信息的总数，f(i)表示属性指标，信息为空时，f(i)＝0，否则，f(i)＝1。

(2)w为数值指标的计算

数值指标指的是粉丝数、关注数、发微博数、转发量、评论量、点赞量等指标。计算公式如公式所示：

其中m表示舆情信息的指标量，M表示所有舆情信息指标量出现的最大的一个值。

(3)w为持续时间指标的计算

持续时间指标指的是舆情活跃时间、舆情衰退时间、舆情关注持续时间等指标。计算公式如公式所示：

w＝t₂-t₁

其中t₂表示结束时间，t₁表示开始时间。

Claims

1.一种基于微博平台下食品安全网络舆情监测与评估模型的构建，其特征在于包括以下步骤：

步骤1：构建监测指标和以构建舆情威胁等级与可信度为两个目标层评估指标。

步骤2：采用粗糙集客观赋权法对指标进行量化，避免了主观因素的干扰。

步骤3：将量化后的数据带入到监测算法与多级评估模型中计算出结果。

2.根据权利要求1所述的基于粗糙集的客观指标赋权法，其特征在于：用一个四元组S＝(U，A，V，f)来描述一个知识系统，其中这里的S表示信息系统；U称为论域，表示对象的非空有限集合；A表示研究对象的属性集合；V表示某一属性的属性值；f表示一个信息函数，可以为对象的每个属性赋值如果用x表示对象集合U中的元素，用a表示属性集合A中的元素，则当a∈A，x∈U，必有f(x，a)∈Va。

粗糙集赋权步骤：

其中i＝1，2，...，m。

3.根据权利要求1所述的监测算法，其特征在于：食品安全网络舆情信息的主题关注度是指在任意一个时间段，食品安全舆情主题被网民所关注的程度，可以用该食品安全舆情主题的相关信息点的数量来进行衡量。用函数f_A(t)表示某一信息点A的相关信息点数随时间的变化，则在时间段t₁到t₂内，信息点A的关于食品安全网络舆情的相关信息点数可以表示为：

R_A(t_1，2)＝f_A(t₂)-f_A(t₁)

R_A(t_1，2)表示在t₂时刻所统计的数据，称为信息点A在t₂时刻的主题关注度。主题关注度的变化率K_A(t_1，2)的计算公式为：

K_A(t_1，2)的值为正表示舆情关注度呈增长趋势，为负则表明舆情关注度在衰退。值越大表示变化趋势越快。

多级评估模型，其特征在于：