CN116304028B - 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 - Google Patents
基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 Download PDFInfo
- Publication number
- CN116304028B CN116304028B CN202310139875.9A CN202310139875A CN116304028B CN 116304028 B CN116304028 B CN 116304028B CN 202310139875 A CN202310139875 A CN 202310139875A CN 116304028 B CN116304028 B CN 116304028B
- Authority
- CN
- China
- Prior art keywords
- emotion
- news
- representation
- graph
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 179
- 238000001514 detection method Methods 0.000 title claims abstract description 32
- 230000008447 perception Effects 0.000 claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000005096 rolling process Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims 1
- 230000003993 interaction Effects 0.000 description 6
- 230000002996 emotional effect Effects 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000192 social effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,包括,通过预训练Bert模型对历史新闻文本数据以及历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;通过情感评分模型计算历史评论文本信息的情感分值;根据文本表示和情感分值构建多关系情感感知图;基于多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;获取待预测的新闻文本以及评论文本,基于情感图表示,生成待预测的新闻文本以及评论文本最终预测结果。通过本发明提出的方法,显著提升虚假新闻的检测效率。
Description
技术领域
本发明属于数据处理领域。
背景技术
互联网的快速发展使得社交平台逐渐兴起,极大地改变了人们参与信息传播的方式。人们可以不受空间距离的限制,在社交平台上创造、分享、获取信息。由于其方便性和实时性,社交平台吸引了大量的用户。然而,各大社交平台在方便用户交流的同时也成为虚假新闻快速传播的渠道。
虚假新闻的广泛传播产生了诸多不良社会影响。首先,其容易造成社会恐慌,扰乱社会稳定。其次,虚假新闻的广泛传播削弱了政府的公信力。第三,虚假新闻会干扰人们对事情的判断并引发人们对社会的信任危机。一项研究表明,长时间接收虚假社会性新闻的人非常容易对社会产生厌烦态度,个人的精神健康也深受影响。因此,遏制虚假新闻传播,控制其对社会的负面影响至关重要。
目前,虚假新闻检测面临诸多挑战。首先,它往往是经过特意编辑后发布出来的,旨在迷惑大众,因此,仅仅依靠新闻内容很难准确判断新闻的真实性。其次,社交媒体上的新闻数量庞大、内容形式丰富多样、大多由用户生成,数据噪声大。因此,依赖人工检测不仅非常耗时,且效率低下。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,用于提高虚假新闻检测准确性。
为达上述目的,本发明第一方面实施例提出了一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,包括:
通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
通过情感评分模型计算所述历史评论文本信息的情感分值;
根据所述文本表示和所述情感分值构建多关系情感感知图;
基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果。
另外,根据本发明上述实施例的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示,包括:
使用Bert模型对新闻进行编码,以所述Bert模型中cls位置对应的嵌入向量作为新闻表示,用T0∈Rd表示,计算方法如下:
T0=PreBert(P),
其中,P表示新闻文本内容,由一连串词语{w1,w2,w3...wk}组成,d是T0的维度,PreBert(·)代表预训练模型;
使用Bert模型对评论进行编码,以所述Bert模型中cls位置对应的表示作为评论ci的文本嵌入,用Ti来表示,计算方法如下:
Ti=PreBert(ci),
其中,ci∈C是一条评论,由一组词语组成。
进一步地,在本发明的一个实施例中,所述通过情感评分模型计算所述历史评论文本信息的情感分值,包括:
通过下式计算评论ci的情感类型:
si=scorer(ci),i∈{1,2...|C|},
其中,scorer(·)表示情感评分模型,评论ci的情感类型按照如下计算方式推导:
式中,min表示情感评分模型的区间下限,对于Vader模型来说为-1,max描述区间上限,对于Vader模型来说为1,L是评分区间的长度,由max-min计算得出。
进一步地,在本发明的一个实施例中,根据所述文本表示和所述情感分值构建多关系情感感知图,包括:
定义情感感知图为其中vi∈V是新闻节点及评论节点,(vi,r,vj)∈E表示节点之间的边,/>是关系类型;将关系r下的邻接矩阵表示为Ar,它的初始值为:
对邻接矩阵进行拉普拉斯平滑操作,得到矩阵计算方式为:
其中,Dr表示Ar的对角矩阵,I为单位矩阵。
进一步地,在本发明的一个实施例中,所述基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示,包括:
定义X=[T0,T1,T2,T3...T|C|]∈R(|C|+1)×d表示节点特征矩阵,给定矩阵集和特征矩阵X,/>表示第i个节点在第l+1层的表示,计算公式如下所示:
其中,l表示卷积层的序列号,是第i个节点之间周围关系为r的邻居节点集合,Wr代表网络参数,/>表示第i个节点在第l层的表示,相应地,/>表示第j个节点在第l层的表示,激活函数为ReLU;
设置模型输入为h0,其值为X,ci,r是归一化常数,计算方法如下:
其中,i∈[1,|C|+1],通过堆叠两个卷积层学习情感感知图潜在的特征交互,用hG∈R(|C|+1)×g表示节点嵌入,其中g为网络的输出维度;
将节点嵌入经过平均池化,得到图表示,计算方法为:
进一步地,在本发明的一个实施例中,所述基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果,包括:
将情感感知的图表示作为输入,通过softmax层预测标签/> 为0表示新闻为假,相反则为真,其中/>可以按照如下方式推导:
其中,b为偏置项,Wf为网络需要学习的参数矩阵,通过最小化交叉熵损失函数来训练模型:
式中,θ表示整个模型中需要学习的参数,y代表新闻的真实标签。
为达上述目的,本发明第二方面实施例提出了一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置,包括以下模块:
获取模块,用于通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
计算模块,用于通过情感评分模型计算所述历史评论文本信息的情感分值;
构建模块,用于根据所述文本表示和所述情感分值构建多关系情感感知图;
学习模块,用于基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
生成模块,用于获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
本发明实施例提出的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,首先通过预训练Bert模型编码新闻及评论以获取文本表示。其次,选用较为流行的情感评分模型计算评论的情感分值,以获取用户的情感倾向。与已有的将新闻与评论建模成序列的方法不同,本发明从情感的层面将之建模为图用以捕捉评论和新闻之间以及同种情感的评论之间的潜在交互。然后,基于构建的多关系图,使用关系图卷积网络学习情感图的表示。最后,基于融合了拓扑信息及语义信息的情感图表示,生成最终预测结果。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法的流程示意图。
图2为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法组件示意图。
图3为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置的流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
图1为本发明实施例所提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法的流程示意图。
如图1所示,该基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法包括以下步骤:
S101:通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
S102:通过情感评分模型计算所述历史评论文本信息的情感分值;
S103:根据所述文本表示和所述情感分值构建多关系情感感知图;
S104:基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
S105:获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果。
本方法选用预训练Bert模型作为新闻文本编码器。对于英文数据集,选用在无标签英文语料库上训练得到的模型bert-base-uncase。对于中文数据集,则选择chinese-roberta-wwm-ext模型来对文本进行编码。所有预训练模型的输入均为词语,输出为处理后得到的向量。
进一步地,在本发明的一个实施例中,所述通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示,包括:
使用Bert模型对新闻进行编码,以所述Bert模型中cls位置对应的嵌入向量作为新闻表示,用T0∈Rd表示,计算方法如下:
T0=PreBert(P),
其中,P表示新闻文本内容,由一连串词语{w1,w2,w3...wk}组成,d是T0的维度,PreBert(·)代表预训练模型;
使用Bert模型对评论进行编码,以所述Bert模型中cls位置对应的表示作为评论ci的文本嵌入,用Ti来表示,计算方法如下:
Ti=PreBert(ci),
其中,ci∈C是一条评论,由一组词语组成。
由于每条新闻长短不一,因而对输入进行零填充,设置最大长度为预训练模型的默认长度。为了保证获得的文本嵌入具有实际意义,设置评论的最小长度不少于2。
评论是人们参与话题讨论的主要表达方式,除了语义之外通常还包含丰富的情感信号。本发明将情感分为三种类型以便清楚地描述用户的情感倾向。具体划分如下:a)积极的:文本所传达的情绪是快乐的、感激的或兴奋的;b)消极的:文本所反映的情绪是愤怒的、悲观的或怨恨的;c)中性的:表示那些只是陈述事件或表达意见的评论,没有明显的情感倾向。
对于英文数据集,采用广泛用于英文文本情感检测的预训练模型Vader[36],情感得分区间为[-1,+1]。分数接近0意味着句子的情感倾向于中性,而-1表示该评论有强烈的负面情感倾向,相反,评分接近1意味着积极的情感倾向。
进一步地,在本发明的一个实施例中,所述通过情感评分模型计算所述历史评论文本信息的情感分值,包括:
通过下式计算评论ci的情感类型:
si=scorer(ci),i∈{1,2...|C|},
其中,scorer(·)表示情感评分模型,评论ci的情感类型按照如下计算方式推导:
式中,min表示情感评分模型的区间下限,对于Vader模型来说为-1,max描述区间上限,对于Vader模型来说为1,L是评分区间的长度,由max-min计算得出。
由于中文语法结构和英文存在差异,对于中文数据集,选用较为流行的中文情感分析工具snownlp,它的情感输出区间为[0,1]。由于snownlp模型的原始语料是来自电子商务平台的评论,因此,本方法选择领域内应用较为广泛的微博情感语料对模型进行预训练,以便更加准确地对微博数据进行情感评分。
本发明通过构建一个多关系情感感知的新闻-评论图来建模新闻和评论之间的信息交互以及评论之间的情感共鸣。具有相同情感的评论之间存在信息交流,侧面反映了它们在情感层面上是相通的。因此,本方法中构建的图是基于情感连接而不是回复结构。由于用户的情感是由新闻引起的,因而新闻节点与所有评论节点相连,其关系由评论的情感决定。例如,如果评论的情绪是“积极的”,评论和新闻之间的关系就是“赞同”,这意味着新闻引起了积极的情绪或评论对新闻持赞同态度。如果评论的情绪是“负面”的,那么关系就是“消极”。最后,“中性”的情绪对应“中性”关系。评论之间的连接取决于情感共鸣,具有相同情感类型的评论互相连接,因为它们在情感层面上是相互支持的,定义连接关系为“赞同”。多关系情感感知图属于无向图,边两端的节点可以互相交换信息,便于信息传播。
进一步地,在本发明的一个实施例中,根据所述文本表示和所述情感分值构建多关系情感感知图,包括:
定义情感感知图为其中vi∈V是新闻节点及评论节点,(vi,r,vj)∈E表示节点之间的边,/>是关系类型;将关系r下的邻接矩阵表示为Ar,它的初始值为:
对邻接矩阵进行拉普拉斯平滑操作,得到矩阵计算方式为:
其中,Dr表示Ar的对角矩阵,I为单位矩阵。
为了挖掘情感感知图上潜在的特征交互,本发明通过关系图卷积网络对图进行编码。相较于图卷积网络(GCN),RGCN在捕捉多关系图特征方面有更好的表现。与GCN类似,RGCN通过堆叠多层卷积网络聚合邻居节点特征。
进一步地,在本发明的一个实施例中,所述基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示,包括:
定义X=[T0,T1,T2,T3...T|C|]∈R(|C|+1)×d表示节点特征矩阵,给定矩阵集和特征矩阵X,/>表示第i个节点在第l+1层的表示,计算公式如下所示:
其中,l表示卷积层的序列号,是第i个节点之间周围关系为r的邻居节点集合,Wr代表网络参数,/>表示第i个节点在第l层的表示,相应地,/>表示第j个节点在第l层的表示,激活函数为ReLU;
设置模型输入为h0,其值为X,ci,r是归一化常数,计算方法如下:
其中,i∈[1,|C|+1],通过堆叠两个卷积层学习情感感知图潜在的特征交互,用hG∈R(|C|+1)×g表示节点嵌入,其中g为网络的输出维度;
将节点嵌入经过平均池化,得到图表示,计算方法为:
进一步地,在本发明的一个实施例中,所述基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果,包括:
将情感感知的图表示作为输入,通过softmax层预测标签/> 为0表示新闻为假,相反则为真,其中/>可以按照如下方式推导:
其中,b为偏置项,Wf为网络需要学习的参数矩阵,通过最小化交叉熵损失函数来训练模型:
式中,θ表示整个模型中需要学习的参数,y代表新闻的真实标签。
以上为完整的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法流程,图2为本发明的方法组件示意图。
本发明实施例提出的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,首先通过预训练Bert模型编码新闻及评论以获取文本表示。其次,选用较为流行的情感评分模型计算评论的情感分值,以获取用户的情感倾向。与已有的将新闻与评论建模成序列的方法不同,本发明从情感的层面将之建模为图用以捕捉评论和新闻之间以及同种情感的评论之间的潜在交互。然后,基于构建的多关系图,使用关系图卷积网络学习情感图的表示。最后,基于融合了拓扑信息及语义信息的情感图表示,生成最终预测结果。
为了实现上述实施例,本发明还提出基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置。
图3为本发明实施例提供的一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置的结构示意图。
如图3所示,该基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置包括:获取模块100,计算模块200,构建模块300,学习模块400,生成模块500,其中,
获取模块,用于通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
计算模块,用于通过情感评分模型计算所述历史评论文本信息的情感分值;
构建模块,用于根据所述文本表示和所述情感分值构建多关系情感感知图;
学习模块,用于基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
生成模块,用于获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法,其特征在于,包括以下步骤:
通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
通过情感评分模型计算所述历史评论文本信息的情感分值;
根据所述文本表示和所述情感分值构建多关系情感感知图;
基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果;
其中,所述通过情感评分模型计算所述历史评论文本信息的情感分值,包括:
通过下式计算评论的情感类型:
,
其中,scorer (·)表示情感评分模型,评论的情感类型按照如下计算方式推导:
,
式中,min表示情感评分模型的区间下限,对于Vader模型来说为−1,max描述区间上限,对于Vader模型来说为1,L是评分区间的长度,由计算得出;
其中,根据所述文本表示和所述情感分值构建多关系情感感知图,包括:
定义情感感知图为,其中/>是新闻节点及评论节点,表示节点之间的边,/> 是关系类型;将关系/>下的邻接矩阵表示为/>,它的初始值为:
,
对邻接矩阵进行拉普拉斯平滑操作,得到矩阵,计算方式为:
,
其中,表示/>的对角矩阵,I为单位矩阵;
所述基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示,包括:
定义表示节点特征矩阵,给定矩阵集和特征矩阵/>,/>表示第i个节点在第/>层的表示,计算公式如下所示:
,
其中,表示卷积层的序列号,/> 是第i个节点之间周围关系为r的邻居节点集合,/>表示第i个节点在第/>层的表示,相应地,/>表示第j个节点在第l层的表示,激活函数为ReLU;
设置模型输入为,其值为/>,/>是归一化常数,计算方法如下:
,
其中,,通过堆叠两个卷积层学习情感感知图潜在的特征交互,用表示节点嵌入,其中/>为网络的输出维度;
将节点嵌入经过平均池化,得到图表示,计算方法为:
。
2.根据权利要求1所述的方法,其特征在于,所述通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示,包括:
使用Bert模型对新闻进行编码,以所述Bert模型中cls位置对应的嵌入向量作为新闻表示,用表示,计算方法如下:
,
其中,表示新闻文本内容,由一连串词语/>组成,/>是/>的维度,代表预训练模型;
使用Bert模型对评论进行编码,以所述Bert模型中cls位置对应的表示作为评论的文本嵌入,用/>来表示,计算方法如下:
,
其中,是一条评论,由一组词语/>}组成。
3.根据权利要求1所述的方法,其特征在于,所述基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果,包括:
将情感感知的图表示作为输入,通过softmax层预测标签/>,/>为0表示新闻为假,相反则为真,其中/>可以按照如下方式推导:
,
其中,为偏置项,/>为网络需要学习的参数矩阵,通过最小化交叉熵损失函数来训练模型:
,
式中,表示整个模型中需要学习的参数,/>代表新闻的真实标签。
4.一种基于社会情感共鸣与关系图卷积网络的虚假新闻检测装置,其特征在于,包括以下模块:
获取模块,用于通过预训练Bert模型对历史新闻文本数据以及所述历史新闻文本数据对应的历史评论文本数据进行编码,获取文本表示;
计算模块,用于通过情感评分模型计算所述历史评论文本信息的情感分值;
构建模块,用于根据所述文本表示和所述情感分值构建多关系情感感知图;
学习模块,用于基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示;
生成模块,用于获取待预测的新闻文本以及评论文本,基于所述情感图表示,生成所述待预测的新闻文本以及评论文本最终预测结果;
其中,所述通过情感评分模型计算所述历史评论文本信息的情感分值,包括:
通过下式计算评论的情感类型:
,
其中,scorer (·)表示情感评分模型,评论的情感类型按照如下计算方式推导:
,
式中,min表示情感评分模型的区间下限,对于Vader模型来说为−1,max描述区间上限,对于Vader模型来说为1,L是评分区间的长度,由计算得出;
其中,根据所述文本表示和所述情感分值构建多关系情感感知图,包括:
定义情感感知图为,其中/>是新闻节点及评论节点,表示节点之间的边,/> 是关系类型;将关系/>下的邻接矩阵表示为/>,它的初始值为:
,
对邻接矩阵进行拉普拉斯平滑操作,得到矩阵,计算方式为:
,
其中,表示/>的对角矩阵,I为单位矩阵;
所述基于所述多关系情感感知图,使用关系图卷积网络学习所述多关系情感感知图的情感图表示,包括:
定义表示节点特征矩阵,给定矩阵集和特征矩阵/>,/>表示第i个节点在第/>层的表示,计算公式如下所示:
,
其中,表示卷积层的序列号,/> 是第i个节点之间周围关系为r的邻居节点集合,/>表示第i个节点在第/>层的表示,相应地,/>表示第j个节点在第l层的表示,激活函数为ReLU;
设置模型输入为,其值为/>,/>是归一化常数,计算方法如下:
,
其中,,通过堆叠两个卷积层学习情感感知图潜在的特征交互,用表示节点嵌入,其中/>为网络的输出维度;
将节点嵌入经过平均池化,得到图表示,计算方法为:
。
5.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-3中任一所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3任意一项所述的基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310139875.9A CN116304028B (zh) | 2023-02-20 | 2023-02-20 | 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310139875.9A CN116304028B (zh) | 2023-02-20 | 2023-02-20 | 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116304028A CN116304028A (zh) | 2023-06-23 |
CN116304028B true CN116304028B (zh) | 2023-10-03 |
Family
ID=86835198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310139875.9A Active CN116304028B (zh) | 2023-02-20 | 2023-02-20 | 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304028B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593204A (zh) * | 2009-06-05 | 2009-12-02 | 北京大学 | 一种基于新闻评论网页的情感倾向性分析系统 |
CN108647191A (zh) * | 2018-05-17 | 2018-10-12 | 南京大学 | 一种基于有监督情感文本和词向量的情感词典构建方法 |
WO2022017299A1 (zh) * | 2020-07-24 | 2022-01-27 | 北京字节跳动网络技术有限公司 | 一种文本检测方法、装置、电子设备及存储介质 |
CN115034224A (zh) * | 2022-01-26 | 2022-09-09 | 华东师范大学 | 一种融合多种文本语义结构图表示的新闻事件检测方法和系统 |
CN115329210A (zh) * | 2022-07-29 | 2022-11-11 | 华中科技大学 | 一种基于交互图分层池化的虚假新闻检测方法 |
-
2023
- 2023-02-20 CN CN202310139875.9A patent/CN116304028B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593204A (zh) * | 2009-06-05 | 2009-12-02 | 北京大学 | 一种基于新闻评论网页的情感倾向性分析系统 |
CN108647191A (zh) * | 2018-05-17 | 2018-10-12 | 南京大学 | 一种基于有监督情感文本和词向量的情感词典构建方法 |
WO2022017299A1 (zh) * | 2020-07-24 | 2022-01-27 | 北京字节跳动网络技术有限公司 | 一种文本检测方法、装置、电子设备及存储介质 |
CN115034224A (zh) * | 2022-01-26 | 2022-09-09 | 华东师范大学 | 一种融合多种文本语义结构图表示的新闻事件检测方法和系统 |
CN115329210A (zh) * | 2022-07-29 | 2022-11-11 | 华中科技大学 | 一种基于交互图分层池化的虚假新闻检测方法 |
Non-Patent Citations (1)
Title |
---|
Hongnian Chen et al.A Deep Learning Method for Landing Pitch Prediction based on Flight Data .《2020 IEEE 2nd International Conference on Civil Aviation Safety and Information Technology (ICCASIT)》.2020,第199-204页. * |
Also Published As
Publication number | Publication date |
---|---|
CN116304028A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832353B (zh) | 一种社交媒体平台虚假信息识别方法 | |
CN111538848A (zh) | 一种融合多源信息的知识表示学习方法 | |
CN109711465B (zh) | 基于mll和asca-fr的图像字幕生成方法 | |
CN107766506A (zh) | 一种基于层次化注意力机制的多轮对话模型构建方法 | |
CN112256981B (zh) | 一种基于线性和非线性传播的谣言检测方法 | |
CN112084373B (zh) | 一种基于图嵌入的多源异构网络用户对齐方法 | |
CN107402859B (zh) | 软件功能验证系统及其验证方法 | |
CN107662617A (zh) | 基于深度学习的车载交互控制算法 | |
CN111753207A (zh) | 一种基于评论的神经图协同过滤模型 | |
CN109960755B (zh) | 一种基于动态迭代快速梯度的用户隐私保护方法 | |
CN111767472A (zh) | 一种社交网络异常账号检测方法及系统 | |
CN107665356A (zh) | 一种图像标注方法 | |
CN115495568A (zh) | 一种对话模型的训练方法及装置、对话响应方法及装置 | |
CN113283236A (zh) | 一种复杂中文文本中的实体消歧方法 | |
CN116091152A (zh) | 基于多层次对比学习与多模态知识图谱的推荐方法及系统 | |
CN114595306A (zh) | 基于距离感知自注意力机制和多角度建模的文本相似度计算系统及方法 | |
CN116028604A (zh) | 一种基于知识增强图卷积网络的答案选择方法及系统 | |
CN115329210A (zh) | 一种基于交互图分层池化的虚假新闻检测方法 | |
CN115983148A (zh) | 一种cfd仿真云图预测方法、系统、电子设备及介质 | |
CN114942998A (zh) | 融合多源数据的知识图谱邻域结构稀疏的实体对齐方法 | |
CN114912020A (zh) | 一种基于用户偏好图的多子目标对话推荐方法 | |
CN113177393B (zh) | 改进针对网页结构理解的预训练语言模型的方法和装置 | |
CN116304028B (zh) | 基于社会情感共鸣与关系图卷积网络的虚假新闻检测方法 | |
CN110197521B (zh) | 基于语义结构表示的视觉文本嵌入方法 | |
CN117194806A (zh) | 一种基于新闻传播过程的虚假新闻检测方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |