CN111428113A - 一种基于模糊综合评判的网络舆论引导效果预测方法 - Google Patents

一种基于模糊综合评判的网络舆论引导效果预测方法 Download PDF

Info

Publication number
CN111428113A
CN111428113A CN202010229129.5A CN202010229129A CN111428113A CN 111428113 A CN111428113 A CN 111428113A CN 202010229129 A CN202010229129 A CN 202010229129A CN 111428113 A CN111428113 A CN 111428113A
Authority
CN
China
Prior art keywords
public opinion
index
threat
level
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010229129.5A
Other languages
English (en)
Other versions
CN111428113B (zh
Inventor
李弼程
熊尧
潘乐
黄涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaqiao University
Original Assignee
Huaqiao University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaqiao University filed Critical Huaqiao University
Priority to CN202010229129.5A priority Critical patent/CN111428113B/zh
Publication of CN111428113A publication Critical patent/CN111428113A/zh
Application granted granted Critical
Publication of CN111428113B publication Critical patent/CN111428113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于模糊综合评判的网络舆论引导效果预测方法,通过网络爬虫技术爬取事件相关信息,根据网络舆论态势指数,构建网络舆论威胁评估指标体系;对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集;对威胁等级模糊集解模糊化,得到网络舆情威胁指数,进行舆情评估;实现了对网络舆论引导方法的效果预测,为有效的舆论引导提供辅助决策信息,对事件的进行实时监测和预警,也可用于事件引导仿真的效果度量。

Description

一种基于模糊综合评判的网络舆论引导效果预测方法
技术领域
本发明涉及网络舆论引导效果预测分析领域,特别是指一种基于模糊综合评判的网络舆论引导效果预测方法。
背景技术
近年来,关于网络舆情的学术研究主要体现在网络舆情监测、预警和预测,网络舆情演化/传播模型与网络舆论引导。舆论引导的主流研究方法,一般是基于信任代理或者是基于用户行为偏好的方法。以上研究方法从定量角度出发,分析得出利用信任代理可以实现引导网络节点逐渐产生共识,并且通过用户行为偏好分析,利用相似行为偏好的邻居节点也可以实现引导的目的。但是以上引导方法停留在理论研究层面,没有结合具体舆论事件详细分析舆论引导效果和对引导效果进行评估。尝试从知网以舆情引导为关键词进行搜索,相关研究的论文多属于社科类,定性分析舆论引导,极少研究舆论引导效果预测。其中个别文献利用问卷调查,并对数据进行了分析,在此基础上,确立了评估指标体系,构建新媒体语境中重大公共危机事件舆论和舆情引导效果预测指标体系。虽然在文献中建立了舆情引导效果预测指标体系,但是没有提出综合考虑各指标,对引导效果进行评估的具体方法。
发明内容
本发明的主要目的在于为了解决以上现有研究中关于网络舆论引导效果预测定量分析的方法缺失,提供了一种基于模糊综合评判的网络舆论引导效果预测方法。
本发明采用如下技术方案:
步骤S1.通过网络爬虫技术爬取事件在微博平台上的相关原帖和转发贴,根据产生相关行为时间点,划分事件时间切片,统计每个时间切片内数据。
步骤S2.根据网络舆论态势指数,构建网络舆论威胁评估指标体系;
步骤S3.利用层次分析法,确定威胁评估指标体系中各层指标权重,得到二级和三级指标对舆论主体的影响程度;
步骤S4.对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集;
步骤S5.对威胁等级模糊集解模糊化,得到网络舆情威胁指数I1;
步骤S6.网络引导后,重复步骤S1-S5,得到网络引导后网络舆情威胁指数I2;
步骤S7.根据网络舆情威胁指数I1和I2,得出网络引导效果指数T=I2-I1。
具体地,步骤S1中划分事件时间切片的具体方法为:
步骤S1.1将从微博平台获得的与事件相关的原帖和转发贴进行数据预处理,其中包括中文分词、信息敏感与否归类和信息正面、中立和负面态度归类;
步骤S1.2在事件发展过程中,,根据产生相关行为时间点,顺序的两个时间点之间形成一个事件时间切片。
具体地,步骤S2中构建网络舆论威胁评估指标体系的具体方法为:通过网络舆论态势指标,通过概念范畴算法提炼形成三级指标体系。
步骤S2.1网络舆论态势指标包括:重要程度x1、负面倾向占比x2、发帖数量x3、搜索指数x4、媒体指数x5和话题持续时间x66个三级态势指标。
步骤S2.2 6个三级态势指标初步处理;
步骤S2.2.1对事件每个时间切片内的话题重要程度进行计算,方法为:
根据步骤S1.1中处理的将语料进行敏感与非敏感分类和步骤1.3中将事件进行时间切片,统计每个时间切片pi,i∈(1,…,n-1)中信息总量num1、敏感信息量num2和非敏感信息量num3,对应的权值分别为r1,r2,r3,其中r1+r2+r3=1,话题时间切片内的话题重要性为:
Figure BDA0002428688000000031
步骤2.2.2对事件每个时间切片内的负面倾向占比进行统计计算;
步骤2.2.3对事件每个时间切片内的发帖数量进行统计计算;
步骤2.2.4对事件每个时间切片内的搜索指数进行统计计算;
步骤2.2.5对事件每个时间切片内的媒体指数进行统计计算;
步骤2.2.6对事件每个时间切片内的话题持续时间记录统计计算:
步骤2.3通过概念范畴从三级指标中提炼出话题重要性y1、公众反应y2和话题热度y33个二级指标。
步骤2.4将3个二级指标凝练成事件舆论威胁指数y0一级指标,从而构建网络舆论威胁评估指标体系。
具体地,步骤S3中确定威胁评估指标体系中各层指标权重的方法为:
根据S2中构建的网络舆论威胁评估指标体系,将网络舆论威胁等级判定分为三层结构:
L0:事件舆论威胁指数y0
L1:话题重要性y1,公众反应y2,话题热度y3
L2:话题重要程度x1,负面倾向性占比x2,发帖数量x3,搜索指数x4,媒体指数x5,话题持续时间x6
步骤S3.1以y0为准则,在网络舆情预警中,指标的重要性排序为:y1>y2>y3,从而构造比较判断矩阵A;
步骤S3.1.1用式
Figure BDA0002428688000000032
对判断矩阵进行按列归一化得到矩阵A';
步骤S3.1.2对A'按行求和
Figure BDA0002428688000000033
得向量矩阵W:;
步骤S3.1.3再归一化后即得权重系数矩阵,W0:。
步骤S3.2以y1为准则时,为一个指标,故其权重系数矩阵:W1=w11=1;
步骤S3.3以y2为准则时,指标的重要性排序为:x2>x3>x4,根据步骤S3.1计算得权重系数矩阵,W-2.;
步骤3.4以y3为准则时,指标的的重要性排序为:x5>x6,根据步骤S3.1,计算得权重系数矩阵,W-3.。
具体地,步骤S4中对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集的具体方法为:
步骤S4.1把网络舆论的威胁等级划分为:轻警情(Ⅳ级,非常态)、中度警情(Ⅲ级,警示级)、重警情(Ⅱ级,危险级)和特重警情(I级,极度危险级)四个等级。,分别用4个模糊子集来表示:
Figure BDA0002428688000000041
其隶属函数
Figure BDA0002428688000000042
Figure BDA0002428688000000043
步骤S4.2,采用高斯函数来定义隶属函数
Figure BDA0002428688000000044
分别表示指标xi对4个网络舆论威胁等级的评价。
具体的,步骤S5中对威胁等级模糊集解模糊化,得到网络舆情威胁指数的方法为:
根据隶属函数
Figure BDA0002428688000000045
以及基于层次分析法,并利用模糊综合评判的技术来计算
Figure BDA0002428688000000046
步骤S5.1由三级指标对4个网络舆论威胁等级的评估,计算二级指标对应的评估;
由步骤S3.2描述的W1可以计算,话题热重要性对4个网络舆论威胁等级的评估
Figure BDA0002428688000000047
由步骤S3.3描述的W2可以计算,公众反应对4个网络舆论威胁等级的评估
Figure BDA0002428688000000048
由步骤S3.4描述的W3可以计算,话题热度对4个网络舆论威胁等级的评估
Figure BDA0002428688000000049
步骤5.2利用二级指标对应的评估,由步骤S3.1.3描述的W0可以计算,网络舆论威胁等级
Figure BDA0002428688000000051
步骤5.3对威胁等级模糊集解模糊化,得到网络舆情威胁指数/:
具体的,步骤S7中得出网络引导效果指数的具体方法为:
步骤S7.1假设时间点ti(要结合具体事件具体分析)发生了舆论引导的行为,然后利用步骤S2-S5计算(ti-1,ti)时间切片的网络舆情威胁指数Ii-1,计算(ti,ti+1)时间切片的网络舆情威胁指数Ii
步骤S7.2计算网络引导效果指数T=Ii-Ii-1
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
1.网络舆论引导的目的是降低网络舆论对事件主体的威胁指数,因此,可以利用威胁指数的变化值,评估事件主体选择网络舆论引导方法/策略的优劣。本发明提出了利用模糊综合评判的方法解决了网络舆论引导效果预测的定量分析问题。
2.将事件的发展过程按照特殊时间点切片,利用本发明中的方法可以计算每个时间切片的事件威胁指数,实现对事件的实时监测和预警。
3.实现了对网络舆论引导方法的效果预测,可以为有效的舆论引导提供辅助决策信息,也可用于事件引导仿真的效果度量。
附图说明
图1为本发明的数据预处理流程图;
图2为本发明基于模糊综合评判的网络舆论引导效果预测流程图;
图3为本发明的网络舆论威胁评估指标体系图。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。
本发明采用如下技术方案:
步骤1.通过网络爬虫技术爬取事件在微博平台上的相关原帖和转发贴,在事件发展过程中,相关人/地/组织在某时间点产生事件相关行为,并引发事件讨论,根据产生相关行为时间点,划分事件时间切片,统计每个时间切片内数据。
步骤2.根据网络舆论态势指数,构建网络舆论威胁评估指标体系;
步骤3.利用层次分析法,确定威胁评估指标体系中各层指标权重,得到二级和三级指标对舆论主体的影响程度;
步骤4.对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集;
步骤5.对威胁等级模糊集解模糊化,得到网络舆情威胁指数I1;
S6.网络引导后,重复步骤S1-S5,得到网络引导后网络舆情威胁指数I2;
S7.根据网络舆情威胁指数I1和I2,得出网络引导效果指数T=I2-I1。
如图1,为本发明的数据预处理流程图;
步骤1.1将从微博平台获得的与某一事件相关的原帖和转发贴进行数据预处理,其中包括中文分词、信息敏感与否归类和信息正面、中立和负面态度归类;
使用NLPIR汉语分词系统对所用的事件微博语料进行分词和去停用词处理,将语料按照正面、中立和负面态度归类,再与敏感词库进行对比,语料内包含敏感词库内的词语则归为敏感信息,反之则归为非敏感信息。
步骤1.2在事件发展过程中,事件相关人/地/组织在某时间点产生事件相关行为,并引发事件讨论,根据产生相关行为时间点,顺序的两个时间点之间形成一个事件切片;
假设事件c由n个相关事件时间点组成,相关事件时间点指的是在事件发展过程当中的时间点,在这些时间点上发生了新的推动事件发展的小事件(新的言论、新的证据等),所以事件c有相关时间点序列s={t1,t2,…,tn},两个顺序的时间点之间形成一个事件时间切片。则事件c的时间点切片p={(t1,t2),(t2,t3),…,(tn-1,tn)},一共有n-1个时间切片。
如图2是基于模糊综合评判的网络舆论引导效果预测流程图;图3为本发明的网络舆论威胁评估指标体系图。
步骤2中构建网络舆论威胁评估指标体系的方法为:根据网络舆论态势指标,再通过概念范畴提炼形成三级指标体系。
步骤2.1话题重要程度x1、负面倾向占比x2、发帖数量x3、搜索指数x4、媒体指数x5和话题持续时间x66个三级态势指标。
步骤2.26个三级态势指标初步处理;
步骤2.2.1对事件每个时间切片内的话题重要程度进行计算方法为:
根据步骤1.1中处理的将语料进行敏感与非敏感分类和步骤1.3中将事件进行时间切片,统计每个时间切片pi,i∈(1,…,n-1)中信息总量num1、敏感信息量num2和非敏感信息量num3,对应的权值分别为r1,r2,r3,其中r1+r2+r3=1,话题时间切片内的话题重要性为:
Figure BDA0002428688000000071
对话题内容的重要程度进行归一化,归一化重要程度x1∈[0,1]。x1越高,危险级别越高。
步骤2.2.2对事件每个时间切片内的负面倾向占比进行计算方法为:
根据步骤1.1中处理将语料进行正面、中立和负面分类和步骤1.3中将事件进行时间切片,统计每个时间切片pi,i∈(1,…,n-1)中负面语料所占比例记为x2,比例得出是百分制,数据归一化。
步骤2.2.3对事件每个时间切片内的发帖数量进行计算方法为:
根据步骤1.3中将事件进行时间切片,统计每个时间切片pi,i∈(1,…,n-1)的帖文数量,并归一化x3∈[0,1],时间切片内的帖文数量代表了时间段内网民对该事件的参与度。
步骤2.2.4对事件每个时间切片内的搜索指数进行计算方法为:
搜索指数代表互联网用户对关键词搜索关注程度及持续变化情况,以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权。根据数据来源的不同,搜索指数分为PC搜索指数和移动搜索指数。本发明直接使用相关事件在爆发期间百度搜索统计的搜索指数。指数越高,公众参与性越高。对舆论话题事件整个过程的每单位时间的搜索指数程度进行归一化,得到归一化搜索指数x4∈[0,1]。
步骤2.2.5对事件每个时间切片内的媒体指数进行计算方法为:
媒体指数是新闻资讯在互联网上对特定关键词的关注及报道程度,以各大互联网媒体报道的新闻中,与关键词相关的,采用新闻标题包含关键词的统计标准。本发明直接使用相关事件在爆发期间百度搜索统计的媒体指数。指数越高,话题热度越高。对舆论话题事件整个过程的每单位时间的媒体指数程度进行归一化,得到归一化媒体指数x5∈[0,1]。
步骤2.2.6对事件每个时间切片内的话题持续时间记录方法为:
话题持续时间指的是舆论事件持续的时间,持续时间越长,热度越高。对持续时间进行归一化,得到归一化持续时间x6∈[0,1]。
步骤2.3通过概念范围从三级指标中提炼出话题重要性y1、公众反应y2和话题热度y33个二级指标。
三级指标话题重要程度x1属于二级指标话题重要性y1
三级指标负面倾向占比x2,发帖数量x3,搜索指数x4属于二级指标公众反应y2
三级指标媒体指数x5,话题持续时间x6属于二级指标话题热度y3
步骤2.4将3个二级指标凝练成事件舆论威胁指数y0一级指标,从而构建网络舆论威胁评估指标体系。
进一步地,步骤3中确定威胁评估指标体系中各层指标权重的具体方法为:
根据构建网络舆论威胁评估指标体系,本发明把网络舆论威胁等级判定分为三层结构:
L0:事件舆论威胁指数y0
L1:话题重要性y1,公众反应y2,话题热度y3
L2:话题重要程度x1,负面倾向性占比x2,发帖数量x3,搜索指数x4,媒体指数x5,话题持续时间x6
步骤3.1以y0为准则,在网络舆情预警中,因素的重要性排序为:y1>y2>y3,根据层次分析法,从而构造比较判断矩阵A如下:
Figure BDA0002428688000000091
步骤3.1.1用式
Figure BDA0002428688000000092
对判断矩阵进行按列归一化得到矩阵A'如下:
Figure BDA0002428688000000093
步骤3.1.2对A'按行求和
Figure BDA0002428688000000094
得向量:W=(1.4714,0.9357,0.5919)T
步骤3.1.3再归一化后即得权重系数:W0=(w1,w2,w3)T=(0.49,0.31,0.20)T
步骤3.2以y1为准则时,只有一个元素,故其权值:W1=w11=1
步骤3.3以y2为准则时,因素的重要性排序为:x2>x3>x4,根据(1)中的步骤可以计算的权值向量为:W2=(w21,w22,w23)T=(0.49,0.31,0.20)T
步骤3.4以y3为准则时,因素的重要性排序为:x5>x6,根据(1)中的步骤,可以得权重向量为:W3=(w31,w32)T=(0.67,0.33)T
进一步地,步骤4中对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集的具体方法为:
步骤4.1把网络舆论的威胁等级划分为:轻警情(Ⅳ级,非常态)、中度警情(Ⅲ级,警示级)、重警情(Ⅱ级,危险级)和特重警情(I级,极度危险级)四个等级。分别用4个模糊子集来表示:
Figure BDA0002428688000000101
其隶属函数
Figure BDA0002428688000000102
Figure BDA0002428688000000103
步骤4.2对每个因素xi,它本身就包含了因素与评语集的关系,故可以定义4个模糊子集:
Figure BDA0002428688000000104
分别表示因素xi对4个网络舆论威胁等级的评价,采用高斯函数来定义隶属函数
Figure BDA0002428688000000105
其隶属函数分别为:
Figure BDA0002428688000000106
Figure BDA0002428688000000107
其中,xi∈[0,1],σi表示宽度,i=1,2,…,6。
进一步地,步骤5中对威胁等级模糊集解模糊化,得到网络舆情威胁指数的具体方法为:
根据
Figure BDA0002428688000000108
以及层次分析法确定威胁评估指标体系中各层指标权重的方法,并利用模糊综合评判的技术来计算
Figure BDA0002428688000000109
Figure BDA00024286880000001010
步骤5.1由三级指标对4个网络舆论威胁等级的评估,计算二级指标对应的评估;
由W1可以计算,话题热重要性对4个网络舆论威胁等级的评估:
Figure BDA0002428688000000111
由W2可以计算,公众反应对4个网络舆论威胁等级的评估:
Figure BDA0002428688000000112
由W3可以计算,话题热度对4个网络舆论威胁等级的评估:
Figure BDA0002428688000000113
步骤5.2利用二级指标对应的评估,由W0可以计算,网络舆论威胁等级:
Figure BDA0002428688000000114
步骤5.3对威胁等级模糊集解模糊化,得到网络舆情威胁指数I:
Figure BDA0002428688000000115
S6.网络引导后,重复步骤S1-S5,得到网络引导后网络舆情威胁指数I2;
S7.根据网络舆情威胁指数I1和I2,得出网络引导效果指数T=I2-I1。
具体地,根据假设事件c由n个相关事件时间点组成,事件c的相关时间点序列s={t1,t2,…,tn},两个顺序的时间点之间形成一个事件切片。则事件c的时间点切片p={(t1,t2),(t2,t3),…,(tn-1,tn)},一共有n-1个按照相关事件时间切片。
步骤6.1假设时间点ti(要结合具体事件具体分析)发生了舆论引导的行为,然后利用计算(ti-1,ti)时间切片的网络舆情威胁指数Ii-1,计算(ti,ti+1)时间切片的网络舆情威胁指数Ii;网络引导效果指数T=Ii-Ii-1△I=Ii-Ii-1。其中,Ii为引导后的网络威胁指数,Ii-1为引导前的威胁指数。T>0表示在发生引导后,事件的威胁指数增加,引导失败;△I<0表示在发生引导后,事件的威胁指数下降,引导成功。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
1.网络舆论引导的目的就是,降低网络舆论对事件主体的威胁指数。因此,可以利用威胁指数的变化值,评估事件主体选择网络舆论引导方法/策略的优劣。本发明提出了利用模糊综合评判的方法解决了网络舆论引导效果预测的定量分析问题。
2.将事件的发展过程按照特殊时间点切片,利用本发明中的方法可以计算每个时间切片的事件威胁指数,实现对事件的实时监测和预警。
3.实现了对网络舆论引导方法的效果预测,可以为有效的舆论引导提供辅助决策信息,也可用于事件引导仿真的效果度量。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

Claims (7)

1.一种基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,包括以下步骤:
步骤S1.通过网络爬虫技术爬取事件在微博平台上的相关原帖和转发贴,根据产生相关行为时间点,划分事件时间切片,统计每个时间切片内数据。
步骤S2.根据网络舆论态势指数,构建网络舆论威胁评估指标体系;
步骤S3.利用层次分析法,确定威胁评估指标体系中各层指标权重,得到二级和三级指标对舆论主体的影响程度;
步骤S4.对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集;
步骤S5.对威胁等级模糊集解模糊化,得到网络舆情威胁指数I1;
步骤S6.网络引导后,重复步骤S1-S5,得到网络引导后网络舆情威胁指数I2;
步骤S7.根据网络舆情威胁指数I1和I2,得出网络引导效果指数T=I2-I1。
2.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S1中划分事件时间切片的具体方法为:
步骤S1.1将从微博平台获得的与事件相关的原帖和转发贴进行数据预处理,其中包括中文分词、信息敏感与否归类和信息正面、中立和负面态度归类;
步骤S1.2在事件发展过程中,,根据产生相关行为时间点,顺序的两个时间点之间形成一个事件时间切片。
3.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S2中构建网络舆论威胁评估指标体系的具体方法为:通过网络舆论态势指标,通过概念范畴算法提炼形成三级指标体系。
步骤S2.1网络舆论态势指标包括:重要程度x1、负面倾向占比x2、发帖数量x3、搜索指数x4、媒体指数x5和话题持续时间x66个三级态势指标。
步骤S2.2 6个三级态势指标初步处理;
步骤S2.2.1对事件每个时间切片内的话题重要程度进行计算,方法为:
根据步骤S1.1中处理的将语料进行敏感与非敏感分类和步骤1.3中将事件进行时间切片,统计每个时间切片pi,i∈(1,…,n-1)中信息总量num1、敏感信息量num2和非敏感信息量num3,对应的权值分别为r1,r2,r3,其中r1+r2+r3=1,话题时间切片内的话题重要性为:
Figure FDA0002428687990000021
步骤2.2.2对事件每个时间切片内的负面倾向占比进行统计计算;
步骤2.2.3对事件每个时间切片内的发帖数量进行统计计算;
步骤2.2.4对事件每个时间切片内的搜索指数进行统计计算;
步骤2.2.5对事件每个时间切片内的媒体指数进行统计计算;
步骤2.2.6对事件每个时间切片内的话题持续时间记录统计计算:
步骤2.3通过概念范畴从三级指标中提炼出话题重要性y1、公众反应y2和话题热度y33个二级指标。
步骤2.4将3个二级指标凝练成事件舆论威胁指数y0一级指标,从而构建网络舆论威胁评估指标体系。
4.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S3中确定威胁评估指标体系中各层指标权重的方法为:
根据S2中构建的网络舆论威胁评估指标体系,将网络舆论威胁等级判定分为三层结构:
L0:事件舆论威胁指数y0
L1:话题重要性y1,公众反应y2,话题热度y3
L2:话题重要程度x1,负面倾向性占比x2,发帖数量x3,搜索指数x4,媒体指数x5,话题持续时间x6
步骤S3.1以y0为准则,在网络舆情预警中,指标的重要性排序为:y1>y2>y3,从而构造比较判断矩阵A;
步骤S3.1.1用式
Figure FDA0002428687990000022
对判断矩阵进行按列归一化得到矩阵A';
步骤S3.1.2对A'按行求和
Figure FDA0002428687990000031
得向量矩阵W;
步骤S3.1.3再归一化后即得权重系数矩阵,W0
步骤S3.2以y1为准则时,为一个指标,故其权重系数矩阵:W1=w11=1;
步骤S3.3以y2为准则时,指标的重要性排序为:x2>x3>x4,根据步骤S3.1计算得权重系数矩阵,W2
步骤3.4以y3为准则时,指标的的重要性排序为:x5>x6,根据步骤S3.1,计算得权重系数矩阵,W3
5.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S4中对网络舆论态势指标进行威胁等级模糊化,并利用模糊综合评判合成威胁等级模糊集的具体方法为:
步骤S4.1把网络舆论的威胁等级划分为:轻警情(Ⅳ级,非常态)、中度警情(Ⅲ级,警示级)、重警情(Ⅱ级,危险级)和特重警情(I级,极度危险级)四个等级。,分别用4个模糊子集来表示:
Figure FDA0002428687990000032
其隶属函数
Figure FDA0002428687990000033
Figure FDA0002428687990000034
步骤S4.2,采用高斯函数来定义隶属函数
Figure FDA0002428687990000035
分别表示指标xi对4个网络舆论威胁等级的评价。
6.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S5中对威胁等级模糊集解模糊化,得到网络舆情威胁指数的方法为:
根据隶属函数
Figure FDA0002428687990000036
以及基于层次分析法,并利用模糊综合评判的技术来计算
Figure FDA0002428687990000037
步骤S5.1由三级指标对4个网络舆论威胁等级的评估,计算二级指标对应的评估;
由步骤S3.2描述的W1可以计算,话题热重要性对4个网络舆论威胁等级的评估
Figure FDA0002428687990000041
由步骤S3.3描述的W2可以计算,公众反应对4个网络舆论威胁等级的评估
Figure FDA0002428687990000042
由步骤S3.4描述的W3可以计算,话题热度对4个网络舆论威胁等级的评估
Figure FDA0002428687990000043
步骤5.2利用二级指标对应的评估,由步骤S3.1.3描述的W0可以计算,网络舆论威胁等级
Figure FDA0002428687990000044
步骤5.3对威胁等级模糊集解模糊化,得到网络舆情威胁指数。
7.根据权利要求1所述的基于模糊综合评判的网络舆论引导效果预测方法,其特征在于,步骤S7中得出网络引导效果指数的具体方法为:
步骤S7.1假设时间点ti(要结合具体事件具体分析)发生了舆论引导的行为,然后利用步骤S2-S5计算(ti-1,ti)时间切片的网络舆情威胁指数Ii-1,计算(ti,ti+1)时间切片的网络舆情威胁指数Ii
步骤S7.2计算网络引导效果指数T=Ii-Ii-1
CN202010229129.5A 2020-03-27 2020-03-27 一种基于模糊综合评判的网络舆论引导效果预测方法 Active CN111428113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010229129.5A CN111428113B (zh) 2020-03-27 2020-03-27 一种基于模糊综合评判的网络舆论引导效果预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010229129.5A CN111428113B (zh) 2020-03-27 2020-03-27 一种基于模糊综合评判的网络舆论引导效果预测方法

Publications (2)

Publication Number Publication Date
CN111428113A true CN111428113A (zh) 2020-07-17
CN111428113B CN111428113B (zh) 2022-07-01

Family

ID=71549040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010229129.5A Active CN111428113B (zh) 2020-03-27 2020-03-27 一种基于模糊综合评判的网络舆论引导效果预测方法

Country Status (1)

Country Link
CN (1) CN111428113B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949848A (zh) * 2020-08-06 2020-11-17 国家计算机网络与信息安全管理中心 一种基于特定事件的跨平台传播态势评估及分级方法
CN112101002A (zh) * 2020-09-15 2020-12-18 南京行者易智能交通科技有限公司 一种基于大数据的案件态势感知预警方法、措施推荐方法、装置及终端设备
CN112711691A (zh) * 2021-01-08 2021-04-27 深圳市网联安瑞网络科技有限公司 网络舆情引导效果数据信息处理方法、系统、终端及介质
CN112785146A (zh) * 2021-01-20 2021-05-11 中慧绿浪科技(天津)集团有限公司 一种网络舆情的评估方法及系统
CN117494897A (zh) * 2023-11-14 2024-02-02 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法
CN117573814A (zh) * 2024-01-17 2024-02-20 中电科大数据研究院有限公司 一种舆论态势评估方法、装置、系统以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599065A (zh) * 2016-11-16 2017-04-26 北京化工大学 一种基于Storm分布式框架的食品安全网络舆情预警系统
KR20180091496A (ko) * 2017-02-07 2018-08-16 주식회사 에스엘커뮤니케이션즈 감정 분석 기반의 소셜 네트워크를 이용한 여론 형성방법
CN110232109A (zh) * 2019-05-17 2019-09-13 深圳市兴海物联科技有限公司 一种网络舆情分析方法以及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599065A (zh) * 2016-11-16 2017-04-26 北京化工大学 一种基于Storm分布式框架的食品安全网络舆情预警系统
KR20180091496A (ko) * 2017-02-07 2018-08-16 주식회사 에스엘커뮤니케이션즈 감정 분석 기반의 소셜 네트워크를 이용한 여론 형성방법
CN110232109A (zh) * 2019-05-17 2019-09-13 深圳市兴海物联科技有限公司 一种网络舆情分析方法以及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
叶健等: "基于大规模弹幕数据监听和情感分类的舆情分析模型", 《华东师范大学学报(自然科学版)》 *
叶健等: "基于大规模弹幕数据监听和情感分类的舆情分析模型", 《华东师范大学学报(自然科学版)》, 30 May 2019 (2019-05-30), pages 86 - 100 *
连芷萱等: "面向大数据的网络舆情多维动态分类与预测模型研究", 《情报杂志》 *
连芷萱等: "面向大数据的网络舆情多维动态分类与预测模型研究", 《情报杂志》, vol. 37, no. 5, 30 May 2018 (2018-05-30), pages 123 - 140 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949848A (zh) * 2020-08-06 2020-11-17 国家计算机网络与信息安全管理中心 一种基于特定事件的跨平台传播态势评估及分级方法
CN111949848B (zh) * 2020-08-06 2022-05-31 国家计算机网络与信息安全管理中心 一种基于特定事件的跨平台传播态势评估及分级方法
CN112101002A (zh) * 2020-09-15 2020-12-18 南京行者易智能交通科技有限公司 一种基于大数据的案件态势感知预警方法、措施推荐方法、装置及终端设备
CN112711691A (zh) * 2021-01-08 2021-04-27 深圳市网联安瑞网络科技有限公司 网络舆情引导效果数据信息处理方法、系统、终端及介质
CN112711691B (zh) * 2021-01-08 2024-04-30 深圳市网联安瑞网络科技有限公司 网络舆情引导效果数据信息处理方法、系统、终端及介质
CN112785146A (zh) * 2021-01-20 2021-05-11 中慧绿浪科技(天津)集团有限公司 一种网络舆情的评估方法及系统
CN117494897A (zh) * 2023-11-14 2024-02-02 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法
CN117494897B (zh) * 2023-11-14 2024-05-17 西安康奈网络科技有限公司 一种单一舆情事件发展倾向性判断方法
CN117573814A (zh) * 2024-01-17 2024-02-20 中电科大数据研究院有限公司 一种舆论态势评估方法、装置、系统以及存储介质
CN117573814B (zh) * 2024-01-17 2024-05-10 中电科大数据研究院有限公司 一种舆论态势评估方法、装置、系统以及存储介质

Also Published As

Publication number Publication date
CN111428113B (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN111428113B (zh) 一种基于模糊综合评判的网络舆论引导效果预测方法
CN102929873B (zh) 一种基于情境搜索提取搜索价值词的方法及装置
US20090094231A1 (en) Selecting Tags For A Document By Analyzing Paragraphs Of The Document
EP2045740A1 (en) Recommending terms to specify ontology space
El Alaoui et al. Big data quality metrics for sentiment analysis approaches
CN107895008B (zh) 基于大数据平台的情报信息热点发现方法
CN106599065A (zh) 一种基于Storm分布式框架的食品安全网络舆情预警系统
Agarwal et al. Comparison of machine learning approaches in the prediction of terrorist attacks
Petroni et al. An extensible event extraction system with cross-media event resolution
Hu et al. Generating breakpoint-based timeline overview for news topic retrospection
CN111898040A (zh) 一种结合社交网络的圈层用户影响力评估方法
Wang et al. Urban crisis detection technique: A spatial and data driven approach based on latent Dirichlet allocation (LDA) topic modeling
Assery et al. Comparing learning-based methods for identifying disaster-related tweets
Chi et al. A supernetwork-based online post informative quality evaluation model
CN111738843A (zh) 一种使用流水数据的量化风险评价系统和方法
Sharma et al. Going beyond content richness: Verified information aware summarization of crisis-related microblogs
Ostrowski Semantic social network analysis for trend identification
Ritha et al. Sentiment Analysis of Health Protocol Policy Using K-Nearest Neighbor and Cosine Similarity
CN113254580A (zh) 一种特殊群体搜索方法及系统
Wen et al. Towards finding valuable topics
Konagala et al. Fake news detection using deep learning: supervised fake news detection analysis in social media with semantic similarity method
Kulshrestha Detection of organized activity in online escort advertisements
Alhammadi Using Machine Learning in Disaster Tweets Classification
Ni Legal Early Warning of Public Crisis in Network Public Opinion Events Based on Emotional Tendency
Zhang et al. Detecting fake reviewers in heterogeneous networks of buyers and sellers: a collaborative training-based spammer group algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant