CN111324795A - 基于微博平台下食品安全网络舆情监测与评估模型的构建 - Google Patents

基于微博平台下食品安全网络舆情监测与评估模型的构建 Download PDF

Info

Publication number
CN111324795A
CN111324795A CN201811530753.8A CN201811530753A CN111324795A CN 111324795 A CN111324795 A CN 111324795A CN 201811530753 A CN201811530753 A CN 201811530753A CN 111324795 A CN111324795 A CN 111324795A
Authority
CN
China
Prior art keywords
attribute
index
information
public opinion
indexes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811530753.8A
Other languages
English (en)
Inventor
马永军
吴增铎
柴梦瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University of Science and Technology
Original Assignee
Tianjin University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University of Science and Technology filed Critical Tianjin University of Science and Technology
Priority to CN201811530753.8A priority Critical patent/CN111324795A/zh
Publication of CN111324795A publication Critical patent/CN111324795A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本文以食品安全网络舆情信息主题关注度变化趋势和食品安全网络舆情信息演化过程两个目标层构建监测指标,从舆情威胁等级与可信度两个目标层食构建评估指标,并通过采用粗糙集的指标量化方法对指标赋权,实现了对食品安全网络舆情监测与评估模型的构建。

Description

基于微博平台下食品安全网络舆情监测与评估模型的构建
技术领域
本发明属于食品安全网络舆情技术领域,尤其是微博平台下食品安全网络舆情监测与评估模型的构建。
背景技术
随着微博等新媒体的出现,以及微博用户规模日益的扩大,多元化和多样化的信息在已微博为载体的媒介下井喷式的出现,网络舆情也随即产生,其中包括了真实的与虚假的信息,而关于食品安全的话题占据绝大多数,这些关于食品安全的网络舆情必定会对人们的生活以及社会造成一定威胁与影响,尤其是虚假造谣的信息造成的社会危害更是严重,据统计食品类别的网络谣言占比高达45%。因此,食品安全网络舆情信息的可信度的评估以及威胁等级的评估成为迫切需要被解决的问题。
目前关于食品安全网络舆情的研究有:网络信息的可信度代表用户主观上对信息的信任程度,而不仅仅是狭义理解上客观的“真”或者“假”,目前关于可信度的研究有:
结合具有心理学特征的形态-媒介-交互性-适航性”(Modality,Agency,Interactivity,and Naviga-bility,MAIN)模型并以微信公众号为例对社会化信息可信度影响因素进行了研究,发现技术承载力(Affordance)形成的线索(Cues)触发了用户的启发式(Heuristics)思考,从而影响了用户对信息质量(Quality)的评估,继而影响了用户对信息可信度的判断(Credibility Judgment),最后研究表明,信息内容的实用性、客观性、可靠性和相关性对社会化媒体信息可信度会产生积极影响,但是信息内容的一致性则不会产生直接影响;构建基于BA无标度网络的食品安全网络舆情传播仿真模型,在考虑信息真伪的情况下对食品安全网络舆情传播仿真与管理对策研究;从网络信息可信性分类及可信度定义、信息可信度特征与指标体系的建立、内容可信度分析建模、信息内容可信度测量评价方法四个方面对网络传播信息内容的可信度研究进展进行了研究;针对现有微博可信度评估中缺少对传播信息的分析,提出一种基于数据起源的微博可信度评估方法,对微博的信息来源和传播过程进行研究。以新浪微博为研究对象,分析用户的关键指标以及微博信息的传播场景,建立微博的PROV数据起源模型,记录微博信息的来源和传播过程的数据起源信息,并验证其有效性。结合传播过程中用户的可信度,利用数据起源信息,完善微博可信度评估的参考依据,弥补了现有一般评估方法中传播信息缺失的不足。
关于舆情威胁等级的研究有:
基于KNN与SVM结合的方法建立了网络安全态势的评估模型,从而提高了评估的正确率;基于TOPSIS方法建立网络威胁评估模型,采用AHP确定指标权重后利用TOPSIS方法对舆情进行排序;通过建立多级指标对我国网络舆情进行模糊评判;通过对突发事件网络舆情的发生周期构建了舆情生成,舆情扩散,舆情衰退的指标体系;从事态扩散、民众关注、内容直观、主题敏感、态度倾向五个维度构建了对群体性事件网络舆情的安全评估指标体系;从事态扩散、民众关注、内容直观、主题敏感、态度倾向五个维度构建了对突发事件网络舆情的安全评估指标体系,实现了对突发事件网络舆情的安全态势评估;从舆情要素,舆情热度,舆情活性三个维度构建了网络舆情评估EHA三维指标体系;以廉政网络舆情为例构建了四个象限的网络舆情危机等级评价模型;从传播扩散、民众关注、内容敏感性、态度倾向性四个维度构建网络舆情安全评估指标体系,实现了对某一具体的网络舆情信息的安全态势评估。
发明内容
本发明的目的在于克服现有关于食品安全网络舆情监测与评估模型的不足,综合监测与评估指标构建,利用粗糙集赋权法,带入到多级评估模型中,对食品安全网络舆情的威胁等级与可信度进行评估。
为实现上述目的,本发明的技术方案是:基于微博平台下食品安全网络舆情监测与评估模型的构建,包括以下步骤:
步骤1:利用爬虫获取微博中与食品安全相关的信息。
步骤2:利用现有的数据预处理平台对爬去的数据进行数据预处理,包括分词,提取特征向量。
步骤3:构建食品安全网络舆情监测与评估指标。
步骤4:利用粗糙集指标赋权法将指标量化
步骤5:将量化后的值带入到多级评估模型中进行威胁等级与可信度的计算本发明的优点和积极效果是:
相较于现有食品安全网络舆情监测与评估技术,本发明的有益效果:更全面的指标构建,以威胁等级与可信度为两个目标层进行指标构建;另外,采用粗糙集赋权法更加客观,避免了主观因素的干扰。
附图说明
图1为食品安全网络舆情的演化过程图。食品安全网络舆情的演化过程分为舆情萌芽阶段,舆情发展阶段,舆情井喷阶段,和舆情衰退阶段。当一个食品安全类的话题在网络上产生的时候,食品安全网络舆情便进入到演化过程中的萌芽阶段,此时网民在接收到此舆情信息后产生的情绪态度意见等与网络媒体进行互动,即进入到发展阶段,当发展阶段持续一段时间后,事件随着时间推移大规模的舆情信息产生并传播,导致事件进一步扩大,而事件的进一步扩大会反作用于舆情信息使之规模更大,如此循环直到一个顶峰后,在相关部门的介入后,舆情信息停止传播与扩散,开始进入到衰退阶段,舆情信息随时间推移逐渐平息。
具体实施方式
以下结合附图对本发明实施例做进一步详述:
一种基于微博平台下食品安全网络舆情监测与评估模型的构建,包括以下步骤:
相关定义:
(1)舆情,即“舆论情况”,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
(2)网络舆情是以网络为载体,以事件为核心,是广大网民情感、态度、意见、观点的表达,传播与互动,以及后续影响力的集合。带有广大网民的主观性,未经媒体验证和包装,直接通过多种形式发布于互联网上。网络舆情六大要素:网络、事件、网民、情感、传播互动、影响力。网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。而随着互联网的发展,大众往往以信息化的方式发表各自看法。
步骤1:监测与评估指标的构建。
食品安全网络舆情的演化过程分为舆情萌芽阶段,舆情发展阶段,舆情井喷阶段,和舆情衰退阶段,舆情演化的过程,因此食品安全网络舆情监测过程可以通过对食品安全网络舆情的演化过程进行监测。
通过对网络舆情演化、传播规律的分析和对食品安全网络舆情自身的性质和特点的了解以及在监测指标的基础上,以食品安全网络舆情为评估对象,以食品安全网络舆情可信度和食品安全网络舆情威胁等级为两个目标层,构建食品安全网络舆情评估指标
步骤2:利用粗糙集赋权法将指标量化。
粗糙集理论用一个四元组S=(U,A,V,f)来描述一个知识系统,其中这里的S表示信息系统;U称为论域,表示对象的非空有限集合;A表示研究对象的属性集合;V表示某一属性的属性值;f表示一个信息函数,可以为对象的每个属性赋值如果用x表示对象集合U中的元素,用a表示属性集合A中的元素,则当a∈A,x∈U,必有f(x,a)∈Va。
粗糙集赋权步骤:
(1)构建决策表。将之前构建的指标中的评价因素视为决策表中的条件属性C={c1,c2,...,cn},评价指标y视为决策属性,决策属性集D={y}。
(2)计算属性依赖度。由公式计算决策属性D对条件属性C的依赖度:
Figure BSA0000175830970000041
同时还需计算剔除某一属性ci后,决策属性D对条件属性集C-ci的依赖度,如公式:
Figure BSA0000175830970000042
(3)计算单个属性重要性。根据公式分别计算第i个属性ci对决策属性D的重要性:
Figure BSA0000175830970000051
其中i=1,2,...,m。
(4)归一化处理。通过归一化运算得出第i个条件属性的权重系数,即为对应评价指标的权重,如公式:
Figure BSA0000175830970000052
步骤3:将量化后的数据带入多级评估模型中计算。
W=∑(Ai*∑(Bj*∑(Ck*w)))
其中Ai为一级指标权重,Bj为二级指标权重,Ck为三级指标权重,w为某三级指标的计算值。多级评判的结果W越大表示舆情威胁等级越高,可信度越高。
当w不为比率指标时需要对其做进一步的计算,计算方法根据指标的不同而不同。
(1)w为属性指标的计算。
属性指标指的是用户名、是否实名认证、是否有大V标识、发布时间、发布地点这些关于用户信息资料的指标。计算公式如公式所示:
Figure BSA0000175830970000053
其中n表示舆情信息的总数,f(i)表示属性指标,信息为空时,f(i)=0,否则,f(i)=1。
(2)w为数值指标的计算
数值指标指的是粉丝数、关注数、发微博数、转发量、评论量、点赞量等指标。计算公式如公式所示:
Figure BSA0000175830970000061
其中m表示舆情信息的指标量,M表示所有舆情信息指标量出现的最大的一个值。
(3)w为持续时间指标的计算
持续时间指标指的是舆情活跃时间、舆情衰退时间、舆情关注持续时间等指标。计算公式如公式所示:
w=t2-t1
其中t2表示结束时间,t1表示开始时间。

Claims (3)

1.一种基于微博平台下食品安全网络舆情监测与评估模型的构建,其特征在于包括以下步骤:
步骤1:构建监测指标和以构建舆情威胁等级与可信度为两个目标层评估指标。
步骤2:采用粗糙集客观赋权法对指标进行量化,避免了主观因素的干扰。
步骤3:将量化后的数据带入到监测算法与多级评估模型中计算出结果。
2.根据权利要求1所述的基于粗糙集的客观指标赋权法,其特征在于:用一个四元组S=(U,A,V,f)来描述一个知识系统,其中这里的S表示信息系统;U称为论域,表示对象的非空有限集合;A表示研究对象的属性集合;V表示某一属性的属性值;f表示一个信息函数,可以为对象的每个属性赋值如果用x表示对象集合U中的元素,用a表示属性集合A中的元素,则当a∈A,x∈U,必有f(x,a)∈Va。
粗糙集赋权步骤:
(1)构建决策表。将之前构建的指标中的评价因素视为决策表中的条件属性C={c1,c2,...,cn},评价指标y视为决策属性,决策属性集D={y}。
(2)计算属性依赖度。由公式计算决策属性D对条件属性C的依赖度:
Figure FSA0000175830960000011
同时还需计算剔除某一属性ci后,决策属性D对条件属性集C-ci的依赖度,如公式:
Figure FSA0000175830960000012
(3)计算单个属性重要性。根据公式分别计算第i个属性ci对决策属性D的重要性:
Figure FSA0000175830960000013
其中i=1,2,...,m。
(4)归一化处理。通过归一化运算得出第i个条件属性的权重系数,即为对应评价指标的权重,如公式:
Figure FSA0000175830960000021
3.根据权利要求1所述的监测算法,其特征在于:食品安全网络舆情信息的主题关注度是指在任意一个时间段,食品安全舆情主题被网民所关注的程度,可以用该食品安全舆情主题的相关信息点的数量来进行衡量。用函数fA(t)表示某一信息点A的相关信息点数随时间的变化,则在时间段t1到t2内,信息点A的关于食品安全网络舆情的相关信息点数可以表示为:
RA(t1,2)=fA(t2)-fA(t1)
RA(t1,2)表示在t2时刻所统计的数据,称为信息点A在t2时刻的主题关注度。主题关注度的变化率KA(t1,2)的计算公式为:
Figure FSA0000175830960000022
KA(t1,2)的值为正表示舆情关注度呈增长趋势,为负则表明舆情关注度在衰退。值越大表示变化趋势越快。
多级评估模型,其特征在于:
W=∑(Ai*∑(Bj*∑(Ck*w)))
其中Ai为一级指标权重,Bj为二级指标权重,Ck为三级指标权重,w为某三级指标的计算值。多级评判的结果W越大表示舆情威胁等级越高,可信度越高。
当w不为比率指标时需要对其做进一步的计算,计算方法根据指标的不同而不同。
(1)w为属性指标的计算。
属性指标指的是用户名、是否实名认证、是否有大V标识、发布时间、发布地点这些关于用户信息资料的指标。计算公式如公式所示:
Figure FSA0000175830960000031
其中n表示舆情信息的总数,f(i)表示属性指标,信息为空时,f(i)=0,否则,f(i)=1。
(2)w为数值指标的计算
数值指标指的是粉丝数、关注数、发微博数、转发量、评论量、点赞量等指标。计算公式如公式所示:
Figure FSA0000175830960000032
其中m表示舆情信息的指标量,M表示所有舆情信息指标量出现的最大的一个值。
(3)w为持续时间指标的计算
持续时间指标指的是舆情活跃时间、舆情衰退时间、舆情关注持续时间等指标。计算公式如公式所示:
w=t2-t1
其中t2表示结束时间,t1表示开始时间。
CN201811530753.8A 2018-12-13 2018-12-13 基于微博平台下食品安全网络舆情监测与评估模型的构建 Pending CN111324795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811530753.8A CN111324795A (zh) 2018-12-13 2018-12-13 基于微博平台下食品安全网络舆情监测与评估模型的构建

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811530753.8A CN111324795A (zh) 2018-12-13 2018-12-13 基于微博平台下食品安全网络舆情监测与评估模型的构建

Publications (1)

Publication Number Publication Date
CN111324795A true CN111324795A (zh) 2020-06-23

Family

ID=71170171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811530753.8A Pending CN111324795A (zh) 2018-12-13 2018-12-13 基于微博平台下食品安全网络舆情监测与评估模型的构建

Country Status (1)

Country Link
CN (1) CN111324795A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297498A (zh) * 2021-06-22 2021-08-24 南京晓庄学院 基于互联网的食品属性挖掘方法及系统
CN113918794A (zh) * 2021-12-13 2022-01-11 宝略科技(浙江)有限公司 企业网络舆情效益分析方法、系统、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297498A (zh) * 2021-06-22 2021-08-24 南京晓庄学院 基于互联网的食品属性挖掘方法及系统
CN113297498B (zh) * 2021-06-22 2023-05-26 南京晓庄学院 基于互联网的食品属性挖掘方法及系统
CN113918794A (zh) * 2021-12-13 2022-01-11 宝略科技(浙江)有限公司 企业网络舆情效益分析方法、系统、电子设备及存储介质
CN113918794B (zh) * 2021-12-13 2022-03-29 宝略科技(浙江)有限公司 企业网络舆情效益分析方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110222267B (zh) 一种游戏平台信息推送方法、系统、存储介质及设备
Meng et al. Rating the crisis of online public opinion using a multi-level index system
CN110417721A (zh) 安全风险评估方法、装置、设备及计算机可读存储介质
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
CN104820629A (zh) 一种智能的舆情突发事件应急处理系统及方法
CN111898040B (zh) 一种结合社交网络的圈层用户影响力评估方法
CN111428113B (zh) 一种基于模糊综合评判的网络舆论引导效果预测方法
CN108833139B (zh) 一种基于类别属性划分的ossec报警数据聚合方法
CN111292008A (zh) 一种基于知识图谱的隐私保护数据发布风险评估方法
CN111275333A (zh) 污染数据处理方法和装置
KR102135074B1 (ko) 인공지능 기반의 팩트 체크 가이드라인을 이용한 가짜 뉴스 판별 시스템
CN111898041A (zh) 一种结合社交网络的圈层用户综合影响力评估及伪造判别方法
CN111324795A (zh) 基于微博平台下食品安全网络舆情监测与评估模型的构建
CN114444910A (zh) 一种面向电力物联网的边缘网络系统健康度评估方法
CN106961441B (zh) 一种用于Hadoop云平台的用户动态访问控制方法
CN113591148B (zh) 基于区块链的食品安全上链数据可信性度量方法
Hui Construction of information security risk assessment model in smart city
Mitsuzuka et al. Analysis of CSR activities affecting corporate value using machine learning
CN112860973A (zh) 基于社交网络分析的组织健康评估方法
CN107767278B (zh) 社群层次结构构建方法和装置
CN115952216A (zh) 一种养老保险数据挖掘方法、装置、存储介质及电子设备
Bharathi et al. A supervised learning approach for criminal identification using similarity measures and K-Medoids clustering
CN112506930B (zh) 一种基于机器学习技术的数据洞察系统
CN114092216A (zh) 企业信贷评级方法、装置、计算机设备和存储介质
CN113920366A (zh) 一种基于机器学习的综合加权主数据识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200623