CN113326437B - 一种基于双引擎网络和drqn的微博早期谣言检测方法 - Google Patents
一种基于双引擎网络和drqn的微博早期谣言检测方法 Download PDFInfo
- Publication number
- CN113326437B CN113326437B CN202110693819.0A CN202110693819A CN113326437B CN 113326437 B CN113326437 B CN 113326437B CN 202110693819 A CN202110693819 A CN 202110693819A CN 113326437 B CN113326437 B CN 113326437B
- Authority
- CN
- China
- Prior art keywords
- rumor
- information
- microblog
- vector
- reply information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 claims abstract description 45
- 239000013598 vector Substances 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 23
- 230000009471 action Effects 0.000 claims description 21
- 230000007246 mechanism Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 10
- 230000006386 memory function Effects 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 4
- 238000000844 transformation Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 description 8
- 230000002787 reinforcement Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 241000288105 Grus Species 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明属于社交网络谣言检测技术领域,具体涉及一种基于双引擎网络和DRQN的微博早期谣言检测方法。本发明针对社交网络中的微博谣言早期阶段识别,通过由双引擎网络实现的谣言检测模块,将微博的原始信息和回复信息针对其各自的特征分别进行处理,提高了谣言检测的准确率。本发明通过由DRQN实现的控制模块,可以自动化地控制微博回复信息的读取数量,从而达到在谣言出现早期进行检测的目的,同时可以动态地平衡谣言检测的准确性和及时性。
Description
技术领域
本发明属于社交网络谣言检测技术领域,具体涉及一种基于双引擎网络和DRQN的微博早期谣言检测方法。
背景技术
随着互联网的飞速发展,社交网络与人们的生活变得逐渐紧密,网民的参与度和使用率迅速攀升。“We Are Social”2019年公布的全球数字化统计报告显示,截止2018年底,全世界的社交网络用户高达34.8亿人,占据世界总人数的45%。以Twitter、微博为代表的社交网络平台为网民提供了发布信息、发表意见的功能,新闻媒体也逐渐在社交网络上建立了官方账号进行新闻报道,因此社交网络逐渐成为了人们主要的信息来源。
社交网络的普及在提高人们生活效率的同时,也成为网络谣言滋生的环境。在信息量爆炸的今天,每天有海量的信息在社交网络中传播,其中不乏大量的谣言信息。谣言对社会的危害是不容忽视的。面对谣言横行的网络环境,社交网路平台纷纷建立了辟谣账号进行人工辟谣,但是仅靠人工审核来制止谣言不仅人工成本高,而且效率十分低下,所以基于人工智能的谣言检测技术逐渐成为研究的热点。谣言传播过程具有明显的时效性,具体来讲,谣言早期出现的时候以爆发的形式迅速扩散,但随着时间的推移,其传播速度会大幅度降低,直至最终消亡。如果谣言在早期出现时就能被准确识别并控制其传播行为,虚假谣言带来的不良影响就可以大幅度降低,因此社交网络早期谣言检测研究十分重要。
当前关于谣言的早期检测方面涉及较少。目前的早期谣言检测方法可以分为三种:
(1)实时谣言检测,如Castillo等人提出的模型,该模型采用支持向量机对原始信息进行分类而不考虑回复信息,所以在检测时间上不存在延迟问题,从而达到实时检测的目的。虽然实时谣言检测方法能够保证在谣言出现早期对其实施检测,但是其误判率较高,实用价值不大。
(2)基于静态检查点的早期谣言检测,如Dungs等人提出的模型基于隐马尔可夫理论,其原理是在模型读取回复信息的过程中,以固定的回复信息数量为间隔(文献中使用的间隔长度为5)设定一个静态检查点,每个检查点都会考虑是否输出检测结果,如果输出检测结果,则谣言检测流程结束,否则继续读取回复信息,直到出现一个检测点输出检测结果。该方法也是目前比较流行的方法,虽然理论上能够实现早期检测,但不够灵活,无法发挥模型的潜在性能。
(3)基于强化学习的早期谣言检测,如Zhou等人提出的模型。该模型由谣言检测模块和检查点模块两部分组成,其中检查点模块是由强化学习模型实现,它通过动态地控制输入谣言检测模块回复信息的数量实现早期谣言检测。模型可以通过强化学习,不断权衡检测时间和检测准确率,以达到兼顾谣言检测的“早期性”和准确性的最优的平衡点。
对比三种方法,实时谣言检测的方法虽然可以较好地实现谣言早期检测,但是较高的误检率使其难以实际应用;基于静态检查点的早谣检测方法,可以保证一定的准确性,并在一定程度上可以做到谣言的早期检测,但是其无法在谣言检测的早期性和准确性上找到最优的平衡点;基于强化学习的早期谣言检测方法可以在学习过程中,动态特平衡检测准确率和检测的时间延迟。
发明内容
本发明的目的在于提供一种基于双引擎网络和DRQN的微博早期谣言检测方法。
本发明的目的通过如下技术方案来实现:包括以下步骤:
步骤1:谣言检测模块中的原始信息网络读取微博的原始博文信息,得到微博的状态向量;
步骤1.1:通过元数据特征提取器提取原始博文信息的元数据特征;对于提取到的元数据特征使用线性归一化函数进行归一化处理,将每个特征进行等比例缩放,映射到[0,1]区间;
步骤1.2:通过GRU提取原始博文信息的语义特征ht;
xt=WordEmbedding(wt)
ht=GRU(xt,ht-1)
其中,wt为单词的数字表示;xt为单词经过词嵌入层后的单词向量表示;t∈[1,n];
步骤1.3:对于GRU提取到的语义特征ht进行单词层面的自注意力机制加权处理,让更有意义的单词获得更大的权重;
X=[h1,h2,...,hn]
Q=WQX+bQ
Kt=WKht+bK
Vt=WVht+bV
f(Q,Kt)=QTWaKt
at=softmax(f(Q,Kt))
Attention(X)=∑tatVt
其中,向量Q、K、V分别代表Query、Key和Value,这三个向量由向量X经过三次不同的线性变换得到;f(Q,Kt)为Q和Kt之间的相似度计算函数;
步骤2:谣言检测模块中的回复信息网络读取微博的回复信息,得到微博的状态向量;
步骤2.1:针对回复信息语序的不稳定性,采用双向GRU提取基本的语义特征;
xt=WordEmbedding(wt)
步骤2.2:将两个方向的向量进行合并,得到句子的向量表示ht;
步骤2.3:针对回复信息表达方式的随意性特征,采用Text-CNN提取非正常语序的语义特征;
所述的Text-CNN由卷积层和池化层组成;
所述的卷积层提取文本特征,一个卷积核提取文本特征的过程表示为:
ai=f(W*Mi:i+h-1+b)
A=[a1,a2,...,an-k+1]
其中,Mi:i+h-1为词向量矩阵中第i到i+h行的词向量;ai表示用长度为h卷积核提取的第i个文本特征;
所述的池化层采用最大池化函数,即在得到卷积层提取的特征后,从中选出一个最大的特征代表所有特征;
步骤2.2:将所有回复信息经过特征提取后进行句子层面自注意力机制的加权;
步骤3:将微博状态向量输入控制模块,获得是否要继续读取微博回复信息的指令;如果指令为读取回复信息,则将一条新的回复信息输入谣言检测模块;如果指令为不读取回复信息,则执行步骤4;
控制模块由DRQN实现,DRQN是一个典型的部分可观察马尔科夫决策过程,循环神经网络的加入使得模型拥有了状态序列的记忆功能,进而可以学习到状态序列中的潜在特征;在控制模块采用LSTM来实现状态序列的记忆功能,LSTM通过观测状态信息和上一次的判断情况,得出它认为合理的动作,具体计算过程如下列公式所示:
ht=LSTM(statet,ht-1)
F=Wrht+bf
其中,LSTM网络除了接收当前的状态信息statet以外,还接收上一时刻的LSTM神经元信息ht-1,输出ht后经过全连接层得到长度为二的向量F,最后经过sofmax输出动作概率分布;LSTM的输入状态为谣言检测模块中最后用于分类的向量,输出动作有两个:
继续读取:表示当前的信息不足以得出是否为谣言的判断,让谣言检测模块再读取一条回复信息;
终止读取:表示检测流程的结束,输出检测结果,换言之即谣言检测模块已经有充足的信息做出原始推文是否为谣言的判断,提前输出结果,达到早期检测的目的;
控制模块中的奖励函数如下:
其中,当模型做出终止读取动作后,如果预测正确,直接获得值为R的奖励,避免陷入局部最优;如果预测错误时分两种情况,当实际标签为谣言时,将受到-2P的惩罚;当实际标签为非谣言时,受到-P的惩罚;当模型做出继续读取数据动作时,会受到-(log n+ε)的惩罚,n表示模型读取的回复信息数量,ε为一个较小的值,避免读取第一条回复信息时受到惩罚为0的情况;
步骤4:用Softmax函数对当前的微博状态向量进行是否为谣言的分类,输出分类结果。
本发明的有益效果在于:
本发明针对社交网络中的微博谣言早期阶段识别,通过由双引擎网络实现的谣言检测模块将微博的原始信息和回复信息针对其各自的特征分别进行处理,提高了谣言检测的准确率。本发明通过由DRQN实现的控制模块,可以自动化地控制微博回复信息的读取数量,从而达到在谣言出现早期进行检测的目的,同时可以动态地平衡谣言检测的准确性和及时性。
附图说明
图1为本发明的总体流程图。
图2为谣言检测模块的网络架构图。
图3为控制模块的网络架构图。
图4为元数据特征表。
图5为文本特征表。
图6为训练DRQN的伪代码图。
具体实施方式
下面结合附图对本发明做进一步描述。
本发明涉及的是社交网络谣言检测领域,具体涉及社交网络中对早期谣言的检测方法。
本发明的目的在于为提高微博早期谣言检测准确率和及时性,提供一种基于双引擎网络和DRQN(Deep Recurrent Q-Learning Network)的微博早期谣言检测方法。
一种基于双引擎网络和DRQN的微博早期谣言检测方法,包括以下步骤:
步骤1:谣言检测模块中的原始信息网络读取微博的原始博文信息,得到微博的状态向量;
步骤1.1:通过元数据特征提取器提取原始博文信息的元数据特征;对于提取到的元数据特征使用线性归一化函数进行归一化处理,将每个特征进行等比例缩放,映射到[0,1]区间;
步骤1.2:通过GRU提取原始博文信息的语义特征ht;
xt=WordEmbedding(wt)
ht=GRU(xt,ht-1)
其中,wt为单词的数字表示;xt为单词经过词嵌入层后的单词向量表示;t∈[1,n];
步骤1.3:对于GRU提取到的语义特征ht进行单词层面的自注意力机制加权处理,让更有意义的单词获得更大的权重;
X=[h1,h2,...,hn]
Q=WQX+bQ
Kt=WKht+bK
Vt=WVht+bV
f(Q,Kt)=QTWaKt
at=softmax(f(Q,Kt))
Attention(X)=∑tatVt
其中,向量Q、K、V分别代表Query、Key和Value,这三个向量由向量X经过三次不同的线性变换得到;f(Q,Kt)为Q和Kt之间的相似度计算函数;
步骤2:谣言检测模块中的回复信息网络读取微博的回复信息,得到微博的状态向量;
步骤2.1:针对回复信息语序的不稳定性,采用双向GRU提取基本的语义特征;
xt=WordEmbedding(wt)
步骤2.2:将两个方向的向量进行合并,得到句子的向量表示ht;
步骤2.3:针对回复信息表达方式的随意性特征,采用Text-CNN提取非正常语序的语义特征;
所述的Text-CNN由卷积层和池化层组成;
所述的卷积层提取文本特征,一个卷积核提取文本特征的过程表示为:
ai=f(W*Mi:i+h-1+b)
A=[a1,a2,…,an-k+1]
其中,Mi:i+h-1为词向量矩阵中第i到i+h行的词向量;ai表示用长度为h卷积核提取的第i个文本特征;
所述的池化层采用最大池化函数,即在得到卷积层提取的特征后,从中选出一个最大的特征代表所有特征;
步骤2.2:将所有回复信息经过特征提取后进行句子层面自注意力机制的加权;
步骤3:将微博状态向量输入控制模块,获得是否要继续读取微博回复信息的指令;如果指令为读取回复信息,则将一条新的回复信息输入谣言检测模块;如果指令为不读取回复信息,则执行步骤4;
控制模块由DRQN实现,DRQN是一个典型的部分可观察马尔科夫决策过程,循环神经网络的加入使得模型拥有了状态序列的记忆功能,进而可以学习到状态序列中的潜在特征;在控制模块采用LSTM来实现状态序列的记忆功能,LSTM通过观测状态信息和上一次的判断情况,得出它认为合理的动作,具体计算过程如下列公式所示:
ht=LSTM(statet,ht-1)
F=Wfht+bf
其中,LSTM网络除了接收当前的状态信息statet以外,还接收上一时刻的LSTM神经元信息ht-1,输出ht后经过全连接层得到长度为二的向量F,最后经过sofmax输出动作概率分布;LSTM的输入状态为谣言检测模块中最后用于分类的向量,输出动作有两个:
继续读取:表示当前的信息不足以得出是否为谣言的判断,让谣言检测模块再读取一条回复信息;
终止读取:表示检测流程的结束,输出检测结果,换言之即谣言检测模块已经有充足的信息做出原始推文是否为谣言的判断,提前输出结果,达到早期检测的目的;
控制模块中的奖励函数如下:
其中,当模型做出终止读取动作后,如果预测正确,直接获得值为R的奖励,避免陷入局部最优;如果预测错误时分两种情况,当实际标签为谣言时,将受到-2P的惩罚;当实际标签为非谣言时,受到-P的惩罚;当模型做出继续读取数据动作时,会受到-(log n+ε)的惩罚,n表示模型读取的回复信息数量,ε为一个较小的值,避免读取第一条回复信息时受到惩罚为0的情况;
步骤4:用Softmax函数对当前的微博状态向量进行是否为谣言的分类,输出分类结果。
本发明针对社交网络中的微博谣言早期阶段识别,提供了一种基于双引擎网络和DRQN的检测方法。由双引擎网络实现的谣言检测模块,将微博的原始信息和回复信息针对其各自的特征分别进行处理,提高了谣言检测的准确率;此外,由DRQN实现的控制模块,可以自动化地控制微博回复信息的读取数量,从而达到在谣言出现早期进行检测的目的,同时可以动态地平衡谣言检测的准确性和及时性。
1、在谣言检测模块的原始信息网络中,元数据特征提取器用来提取原始推文的元数据特征,其对于谣言检测十分重要,因为元数据可以反映推文发布者的可信度和原始推文的基本情况,具体特征如图4所示。
在特征提取完毕后,使用线性归一化函数进行归一化处理(Min-Max scaling),将每个特征进行等比例缩放,映射到[0,1]区间,归一化过程如公式(1)所示:
由于原始推文的表达方式较为谨慎,有较强的语义性,所以在句子经过词嵌入层后,用GRU提取语义特征。具体计算公式如下:
xt=WordEmbedding(wt),t∈[1,n] (2)
ht=GRU(xt,ht-1),t∈[1,n] (3)
其中wt为单词的数字表示,xt为单词经过经过词嵌入层后的单词向量表示,ht为句子最终的向量表示。
2、谣言检测模块中的回复信息网络,主要由GRU、Text-CNN、文本特征提取器构成。由于回复信息在表达上通常带有强烈的情感色彩,且较为随意,存在不稳定的语序,所以考虑用双向GRU、Text-CNN、文本特征提取器三者并行的方式提取特征,最后进行向量拼接形成最后的特征向量。
(1)用双向GRU提取基本的语义特征,由于回复信息语序的不稳定性,为了提取到更多信息,所以本模块的GRU为双向网络,具体计算过程如下列公式所示:
xt=WordEmbedding(wt),t∈[1,n] (4)
其中,表示正向GRU,表示单词正向序列w1~wn经过后的向量表示;同理表示单词逆向序列wn~w1经过后的向量表示。之后将两个方向的向量进行合并(concatenate),如公式(7)所示,得到对句子最终的向量表示。
(2)针对回复信息表达方式的随意性特征,采用Text-CNN提取非正常语序的语义特征。Text-CNN由卷积层和池化层组成。
卷积层是Text-CNN的核心,用来提取文本特征。提取文本特征的过程可以用如下公式表示:
ai=f(W*Mi:i+h-1+b) (8)
A=[a1,a2,...,an-k+1] (9)
其中Mi:i+h-1为词向量矩阵中第i到i+h行的词向量,对Mi:i+h-1做一次线性变换后,经过激活函数f,ai则表示用长度为h卷积核提取的第i个文本特征。最后将该卷积核提取的所有特征做拼接得到向量A。这是一个卷积核的结果,对于多个卷积核,则重复相同的步骤。
此外,本模型的池化函数采用最大池化函数,即在得到卷积层提取的特征后,从中选出一个最大的特征代表所有特征,可以用公式(10)表示。
(3)文本特征提取器可以提取比较直观的文本特征,比如统计消极词汇、是否出现感叹号、和原始推文的相似度等,如图5所示。
其中余弦相似度的计算公式如下:
在特征提取完毕后,同样使用公式(1)进行归一化处理。
3、谣言检测模块中的双自注意机制(DoubleSelf-Attention,简称DSA),在模型中由句子层面的自注意力机制和单词层面的自注意力机制实现,从句子和单词两个维度解决数据冗余的问题。
(1)句子层面的自注意力机制是指将所有回复信息经过特征提取后进行自注意力机制的加权,使模型注意到有用的回复信息,具体计算过程如下列公式所示:
R=[reply1,reply2,...,replyn] (12)
Q=WQR+bQ (13)
K=WKR+bK (14)
V=WVR+bV (15)
在公式(12)中,replyn表示回复信息网络对一条回复信息的编码,向量R为回复信息编码的集合。由于自注意力机制需要三个向量Q、K、V分别代表Query、Key和Value,这三个向量由向量R经过三次不同的线性变换得到。得到向量Q、K、V之后,就可以进行注意力的计算了,具体计算过程如下列公式所示:
f(Q,Ki)=QTWaKi (16)
Attention(Q,K,V)=∑i aiVi (18)
在公式(16)中,f(Q,Ki)为Q和K之间的相似度计算函数,本发明使用一般的线性变换。之后经过sotfmax函数得出对于每条评论需要注意的权重ai,最后将权重与向量V的乘积作为经过注意力处理的回复信息表示。
(2)单词层面的自注意力机制是指,将原始推文通过GRU的处理结果,进行自注意力机制的加权处理,让更有意义的单词获得更大的权重。不在处理回复信息的GRU的输出上进行单词层面的自注意力机制的原因是,回复信息一般比较短,GRU结合TextCNN的处理机制可满足需求。
具体的自注意力机制的计算过程和句子层面的自注意力机制的计算过程基本基本一致,唯一的不同是输入部分。单词层面的自注意力机制的输入如公式(19)所示。
X=[x1,x2,...,xn] (19)
其中的xi表示GRU在每个时刻的神经元状态信息,也就是GRU对xi以及xi之前信息的编码。之后对输入X以同样地方式变换为Q、K、V,并进行后续的自注意力机制的计算。
3、控制模块由DRQN实现,DRQN是一个典型的部分可观察马尔科夫决策过程,循环神经网络的加入使得模型拥有了状态序列的记忆功能,进而可以学习到状态序列中的潜在特征。在控制模块中本发明采用LSTM来实现状态序列的记忆功能,LSTM通过观测状态信息和上一次的判断情况,得出它认为合理的动作。
具体计算过程如下列公式所示:
ht=LSTM(statet,ht-1),t∈[1,n] (20)
F=Wfht+bf (21)
其中,LSTM网络除了接收当前的状态信息statet以外,还接收上一时刻的LSTM神经元信息ht-1,输出ht后经过全连接层得到长度为二的向量F,最后经过sofmax输出动作概率分布。
值得注意的是,LSTM的输入状态为谣言检测模块中最后用于分类的向量,输出动作有两个:
(1)继续读取:表示当前的信息不足以得出是否为谣言的判断,让谣言检测模块再读取一条回复信息;
(2)终止读取:表示检测流程的结束,输出检测结果,换言之即谣言检测模块已经有充足的信息做出原始推文是否为谣言的判断,提前输出结果,达到早期检测的目的。
4、控制模块中的奖励函数如下:
其中,当模型做出终止读取动作后,如果预测正确,直接获得值为R的奖励,避免陷入局部最优;如果预测错误时分两种情况,当实际标签为谣言时,将受到-2P的惩罚;当实际标签为非谣言时,受到-P的惩罚。采用该策略的原因包括:一方面考虑到谣言样本少的情况,另一方面考虑到在两种错误判断的情况下,谣言检测系统所造成的损失是存在差异的,具体来说,对比将原本是谣言的信息错误判断为不是谣言所产生的影响,和将非谣言识别为谣言所产生的影响,显然前者的影响会更大,因为模型对谣言的遗漏会在使谣言更大程度地进行扩散,但对于后者,虽然增加了误判的成本,但是没有遗漏谣言。所以如果将原本是谣言的信息判断为不是谣言,模型会受到双倍的惩罚。
当模型做出继续读取数据动作时,会受到-(log n+ε)的惩罚,n表示模型读取的回复信息数量,ε为一个较小的值,避免读取第一条回复信息时受到惩罚为0的情况。这样考虑的原因是让模型感知到时间的早晚,读取的回复信息越多,做出继续读取动作受到的惩罚会越大。
5、在构建模型过程中,采用预训练谣言检测模块(以下简称RDM)和时间差分法训练控制模块(以下简称CM)的方式。
(1)预训练RDM
在训练CM之前必须得有一个可靠的RDM作为基础,这个预训练的RDM在训练过程中读取了所有的回复信息,这也意味着之后加入CM后最终得到的早期谣言检测,其性能不会高于预训练的RDM的性能,因为在早期谣言检测过程中获取到的信息不会多于所有信息,因此加入CM的意义就是如何让RDM用最少的信息得到最佳的性能,而最佳的性能就是预训练RDM的性能。
(2)训练DRQN
如果直接训练DRQN会使模型的参数缺乏稳定性,导致模型难以收敛。所以为了加快收敛,本文采用双网络结构和经验回放机制训练DRQN。
双网络是两个结构相同的DRQN网络,其被称为:当前网络(参数为θ)和目标网络(参数为θ′)。经验池存储了M个关于环境的四元组记录(st,ai,rt,st+1),每次训练从经验池中随机地取出一批样本进行训练。训练过程为先训练当前网络,当达到一定批次后用当前网络的参数更新目标网络。
由于谣言检测问题较为特殊,传统的强化学习是针对于一个环境,例如一个游戏场景,但是在谣言检测问题中,每个谣言数据其实都是一个环境,所以在构造经验库过程中需要考虑到多环境的因素,具体训练步骤如图6所示。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.一种基于双引擎网络和DRQN的微博早期谣言检测方法,其特征在于,包括以下步骤:
步骤1:谣言检测模块中的原始信息网络读取微博的原始博文信息,得到微博的状态向量;
步骤1.1:通过元数据特征提取器提取原始博文信息的元数据特征;对于提取到的元数据特征使用线性归一化函数进行归一化处理,将每个特征进行等比例缩放,映射到[0,1]区间;
步骤1.2:通过GRU提取原始博文信息的语义特征ht;
xt=WordEmbedding(wt)
ht=GRU(xt,ht-1)
其中,wt为单词的数字表示;xt为单词经过词嵌入层后的单词向量表示;t∈[1,n];
步骤1.3:对于GRU提取到的语义特征ht进行单词层面的自注意力机制加权处理,让更有意义的单词获得更大的权重;
X=[h1,h2,...,hn]
Q=WQX+bQ
Kt=WKht+bK
Vt=WVht+bV
f(Q,Kt)=QTWaKt
at=softmax(f(Q,Kt))
Attention(X)=∑tatVt
其中,向量Q、K、V分别代表Query、Key和Value,这三个向量由向量X经过三次不同的线性变换得到;f(Q,Kt)为Q和Kt之间的相似度计算函数;
步骤2:谣言检测模块中的回复信息网络读取微博的回复信息,得到微博的状态向量;
步骤2.1:针对回复信息语序的不稳定性,采用双向GRU提取基本的语义特征;
xt=WordEmbedding(wt)
步骤2.2:将两个方向的向量进行合并,得到句子的向量表示ht;
步骤2.3:针对回复信息表达方式的随意性特征,采用Text-CNN提取非正常语序的语义特征;
所述的Text-CNN由卷积层和池化层组成;
所述的卷积层提取文本特征,一个卷积核提取文本特征的过程表示为:
ai=f(W*Mi:i+h-1+b)
A=[a1,a2,…,an-k+1]
其中,Mi:i+h-1为词向量矩阵中第i到i+h行的词向量;ai表示用长度为h卷积核提取的第i个文本特征;
所述的池化层采用最大池化函数,即在得到卷积层提取的特征后,从中选出一个最大的特征代表所有特征;
步骤2.2:将所有回复信息经过特征提取后进行句子层面自注意力机制的加权;
步骤3:将微博状态向量输入控制模块,获得是否要继续读取微博回复信息的指令;如果指令为读取回复信息,则将一条新的回复信息输入谣言检测模块;如果指令为不读取回复信息,则执行步骤4;
控制模块由DRQN实现,DRQN是一个典型的部分可观察马尔科夫决策过程,循环神经网络的加入使得模型拥有了状态序列的记忆功能,进而可以学习到状态序列中的潜在特征;在控制模块采用LSTM来实现状态序列的记忆功能,LSTM通过观测状态信息和上一次的判断情况,得出它认为合理的动作,具体计算过程如下列公式所示:
ht=LSTM(statet,ht-1)
F=Wfht+bf
其中,LSTM网络除了接收当前的状态信息statet以外,还接收上一时刻的LSTM神经元信息ht-1,输出ht后经过全连接层得到长度为二的向量F,最后经过sofmax输出动作概率分布;LSTM的输入状态为谣言检测模块中最后用于分类的向量,输出动作有两个:
继续读取:表示当前的信息不足以得出是否为谣言的判断,让谣言检测模块再读取一条回复信息;
终止读取:表示检测流程的结束,输出检测结果,换言之即谣言检测模块已经有充足的信息做出原始推文是否为谣言的判断,提前输出结果,达到早期检测的目的;
控制模块中的奖励函数如下:
其中,当模型做出终止读取动作后,如果预测正确,直接获得值为R的奖励,避免陷入局部最优;如果预测错误时分两种情况,当实际标签为谣言时,将受到-2P的惩罚;当实际标签为非谣言时,受到-P的惩罚;当模型做出继续读取数据动作时,会受到-(logn+ε)的惩罚,n表示模型读取的回复信息数量,ε为一个较小的值,避免读取第一条回复信息时受到惩罚为0的情况;
步骤4:用Softmax函数对当前的微博状态向量进行是否为谣言的分类,输出分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693819.0A CN113326437B (zh) | 2021-06-22 | 2021-06-22 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693819.0A CN113326437B (zh) | 2021-06-22 | 2021-06-22 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113326437A CN113326437A (zh) | 2021-08-31 |
CN113326437B true CN113326437B (zh) | 2022-06-21 |
Family
ID=77424418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110693819.0A Active CN113326437B (zh) | 2021-06-22 | 2021-06-22 | 一种基于双引擎网络和drqn的微博早期谣言检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113326437B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357172B (zh) * | 2022-01-07 | 2024-08-09 | 北京邮电大学 | 一种基于ERNIE-BiGRU-Attention的谣言检测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104216964A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种面向微博的非分词突发话题检测方法 |
CN105095419A (zh) * | 2015-07-15 | 2015-11-25 | 哈尔滨工程大学 | 一种面向微博特定类型用户的信息影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
CN110069718A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 一种基于主题的社交网络谣言抑制方法 |
CN110134873A (zh) * | 2019-04-15 | 2019-08-16 | 周口师范学院 | 一种基于转发网络层次分析的微博谣言预测方法 |
CN111966786A (zh) * | 2020-07-31 | 2020-11-20 | 南京邮电大学 | 一种微博谣言检测方法 |
CN112200197A (zh) * | 2020-11-10 | 2021-01-08 | 天津大学 | 一种基于深度学习和多模态的谣言检测方法 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112597439A (zh) * | 2020-12-07 | 2021-04-02 | 贵州财经大学 | 一种在线社交网络异常账号的检测方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3462331B1 (en) * | 2017-09-29 | 2021-08-04 | Tata Consultancy Services Limited | Automated cognitive processing of source agnostic data |
-
2021
- 2021-06-22 CN CN202110693819.0A patent/CN113326437B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104216964A (zh) * | 2014-08-22 | 2014-12-17 | 哈尔滨工程大学 | 一种面向微博的非分词突发话题检测方法 |
CN105095419A (zh) * | 2015-07-15 | 2015-11-25 | 哈尔滨工程大学 | 一种面向微博特定类型用户的信息影响力最大化方法 |
CN110046224A (zh) * | 2019-04-15 | 2019-07-23 | 哈尔滨工程大学 | 一种基于区域的社交网络谣言抑制方法 |
CN110069718A (zh) * | 2019-04-15 | 2019-07-30 | 哈尔滨工程大学 | 一种基于主题的社交网络谣言抑制方法 |
CN110134873A (zh) * | 2019-04-15 | 2019-08-16 | 周口师范学院 | 一种基于转发网络层次分析的微博谣言预测方法 |
CN111966786A (zh) * | 2020-07-31 | 2020-11-20 | 南京邮电大学 | 一种微博谣言检测方法 |
CN112200197A (zh) * | 2020-11-10 | 2021-01-08 | 天津大学 | 一种基于深度学习和多模态的谣言检测方法 |
CN112256981A (zh) * | 2020-11-13 | 2021-01-22 | 北京理工大学 | 一种基于线性和非线性传播的谣言检测方法 |
CN112597439A (zh) * | 2020-12-07 | 2021-04-02 | 贵州财经大学 | 一种在线社交网络异常账号的检测方法及系统 |
Non-Patent Citations (3)
Title |
---|
A survey on fake news and rumour detection techniques;Alessandro Bondielli;《Information Sciences》;20190513;第497卷;第38-55页 * |
Fake news, rumor, information pollution in social media and web: A contemporary survey of state-of-the-arts, challenges and opportunities;Priyanka Meel;《Expert Systems With Applications》;20191004;第153卷;全文 * |
基于深层双向Transformer 编码器的早期谣言检测;琚心怡;《信息通信》;20200531(第209期);第17-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113326437A (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401061A (zh) | 基于BERT及BiLSTM-Attention的涉案新闻观点句识别方法 | |
CN110427461A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN111653275B (zh) | 基于lstm-ctc尾部卷积的语音识别模型的构建方法及装置、语音识别方法 | |
CN111046178B (zh) | 一种文本序列生成方法及其系统 | |
CN112905776B (zh) | 一种情感对话模型构建方法、情感对话系统及方法 | |
CN111522915A (zh) | 中文事件的抽取方法、装置、设备及存储介质 | |
CN111522908A (zh) | 一种基于BiGRU和注意力机制的多标签文本分类方法 | |
CN106202031A (zh) | 一种基于在线社交平台群聊数据对群成员进行关联的系统及方法 | |
CN111914553B (zh) | 一种基于机器学习的金融信息负面主体判定的方法 | |
CN116304717B (zh) | 文本分类方法及装置、存储介质及电子设备 | |
CN114004283A (zh) | 文本对抗攻击方法、装置、设备和存储介质 | |
CN111930931A (zh) | 一种摘要评价方法及装置 | |
CN113326437B (zh) | 一种基于双引擎网络和drqn的微博早期谣言检测方法 | |
CN113704393A (zh) | 关键词提取方法、装置、设备及介质 | |
CN115495671A (zh) | 一种基于图结构迁移的跨领域谣言传播控制方法 | |
CN113741759B (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN116127060A (zh) | 一种基于提示词的文本分类方法及系统 | |
CN117558270B (zh) | 语音识别方法、装置、关键词检测模型的训练方法和装置 | |
CN116522165B (zh) | 一种基于孪生结构的舆情文本匹配系统及方法 | |
CN113127643A (zh) | 一种融合微博主题及评论的深度学习谣言检测方法 | |
CN113157993A (zh) | 一种基于时序图极化分析的网络水军行为预警模型 | |
CN116738331A (zh) | 基于多维度特征融合和残差图神经网络的社交机器人检测方法及装置 | |
CN114238738A (zh) | 一种基于注意力机制与双向gru的谣言检测方法 | |
CN112199492A (zh) | 一种复杂网络中的谣言传播控制方法及装置 | |
CN110765108A (zh) | 一种基于群智数据融合的假消息早期检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |