CN113191144A - 一种基于传播影响力的网络谣言识别系统及方法 - Google Patents

一种基于传播影响力的网络谣言识别系统及方法 Download PDF

Info

Publication number
CN113191144A
CN113191144A CN202110297717.7A CN202110297717A CN113191144A CN 113191144 A CN113191144 A CN 113191144A CN 202110297717 A CN202110297717 A CN 202110297717A CN 113191144 A CN113191144 A CN 113191144A
Authority
CN
China
Prior art keywords
matrix
rumor
information
user
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110297717.7A
Other languages
English (en)
Other versions
CN113191144B (zh
Inventor
段大高
白宸宇
韩忠明
张楚童
张秋丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN202110297717.7A priority Critical patent/CN113191144B/zh
Publication of CN113191144A publication Critical patent/CN113191144A/zh
Application granted granted Critical
Publication of CN113191144B publication Critical patent/CN113191144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于传播影响力的网络谣言识别方法,具体包括如下步骤:对多个包含谣言信息的文本进行神经网络训练,得到文本特征矩阵;获取第一用户节点信息矩阵;构建传播图结构;构建发布用户传递注意力节点模型;根据更新后的第二用户节点信息矩阵和所述文本特征矩阵来训练神经网络模型,得到谣言识别模型;根据所述谣言识别模型识别网络谣言。本发明还公开一种基于传播影响力的网络谣言识别系统,包括:文本特征矩阵获取模块、用户节点信息获取模块、第一构建模块、第二构建模块、训练模块、识别模块;综上,本发明有效的捕获了谣言信息在转发关系中不同维度的节点信息,能够有效识别谣言信息。

Description

一种基于传播影响力的网络谣言识别系统及方法
技术领域
本发明属于网络谣言识别技术领域,特别是涉及一种基于传播影 响力的网络谣言识别系统及方法。
背景技术
在线社会网络与我们的生活、工作息息相关,不断丰富的信息对 于信息挖掘十分有利,但也会导致虚假信息泛滥。人们不仅仅能够通 过网络获取各式各样的信息,而且还能够参与到信息内容的创作中 去。凭借参与、公开、交流、对话、社区化的特性,在线社会网络大 大加速了人与人之间信息交流的速度与深度,与此同时,我们还需要 看到:它在为人们提供便利的信息交流、互动的同时,也降低了不实 信息的传播成本。因此,寻找一种有效的虚假消息识别方法来减少虚 假负面消息的影响成为研究人员关注的问题。
目前有许多检测谣言的方法,其中应用最为广范的检测方法大致 分为两种:(1)基于人工特征的方法:该方法主要通过构建相关谣言 微博的特征,使用决策树或支持向量机等机器学习分类器进行事件分 类,通用性较差,这种基于特征工程的方法虽然取得了一定的成效, 但是需要耗费大量资源,并且受限于人工设计的规则。(2)基于深度 神经网络模型:这类模型在语义表示与谣言检测运用方面更具优势; 神经网络模型与机器学习方法相比,能够自动从数据中学习事件特 征,避免了大量的特征工程,在捕获上下文之间复杂的语义关系方面 也有更好的拓展性。但目前神经网络谣言检测模型,并没有很好的充 分利用谣言相关的文本信息和用户节点信息,对于文本信息学习效果 不够好,对于用户节点信息表示单一化不够完善,未利用用户节点间 的影响力。
发明内容
为了解决上述技术问题,提供一种基于传播影响力的网络谣言识 别方法,具体包括如下步骤:
S101:对多个包含谣言信息的文本进行神经网络训练,得到文本 特征矩阵;
S102:基于谣言信息的发布用户,得到第一用户节点信息矩阵;
S103:基于所述第一用户节点信息矩阵和所述发布用户在多个所 述文本之间的转发和评论关系,构建传播图结构;
S104:基于所述传播图结构,构建发布用户传递注意力节点模型, 并将所述第一用户节点信息矩阵输入该模型中,输出更新后的第二用 户节点信息矩阵;
S105:根据所述更新后的第二用户节点信息矩阵和所述文本特征 矩阵来训练神经网络模型,得到谣言识别模型;
S106:根据所述谣言识别模型识别网络谣言。
优选地,所述步骤S101具体为:
S101.1:对多个所述包含谣言信息的文本进行清洗和长度规范 化;
S101.2:对多个所述文本中的单词进行神经网络训练,得到所述 单词的词汇量;
S101.3:基于所述词向量,得到多个所述文本的第一词特征矩阵;
S101.4:将所述第一词特征矩阵通过注意力机制学习所述单词之 间的依赖关系,得到第二词特征矩阵;
S101.5:将所述第二词特征矩阵输入卷积层和最大池化层,得到 所述文本特征矩阵。
优选地,所述神经网络是采用Word2Vec中的Skip-Gram神经网 络模型;所述Skip-Gram神经网络模型使用的窗口大小为5;所述词 向量的嵌入维度为300。
优选地,所述步骤S101.4具体为:
将所述第一词特征矩阵通过相同的h组多头注意力机制进行学 习,得到h组更新后的第一词特征矩阵,h为大于1的正整数;
将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征 矩阵。
优选地,所述步骤S102具体为:
将发布谣言信息的用户作为节点,并将所述节点给予一定顺序; 并对不同用户的节点采用Node2Vec方法进行学习,得到不同用户节点 嵌入信息,将得到的给定顺序中的不同用户节点嵌入信息构成构成第 一用户节点信息矩阵。
优选地,所述步骤S103具体为:
构建传播图结构,所述图结构中的节点为多个所述用户节点嵌入 信息,所述图结构中的邻接矩阵为所述谣言信息的发布用户在多个所 述文本之间的转发和评论关系;将谣言信息对应的用户节点,并根据 所述转发和评论关系,构成传播图结构。
优选地,所述步骤S104具体为:
S104.1:学习相邻用户节点间的注意力系数sij
S104.2:对每个用户节点的所有邻居的注意力系数eij进行归一 化,并更新影响力矩阵M下的所述第一用户节点信息矩阵
Figure BDA0002984951010000041
S104.3:基于注意力矩阵,构建传递注意力矩阵M′;并通过所 述传递注意力矩阵,学习其他节点做为中间节点在内的节点i和节点 j的影响力系数e′ij,并对其进行归一化,更新传递注意力矩阵M′下 的所述第一用户节点信息矩阵
Figure BDA0002984951010000043
S104.4:将经过不同注意力矩阵M和M′更新后的第一用户节点 信息
Figure BDA0002984951010000044
Figure BDA0002984951010000045
合并,得到更新后的二用户节点信息
Figure BDA0002984951010000046
优选地,所述步骤S105具体为:
S105.1:将所述更新后的第二用户节点信息矩阵和所述步骤S101 中的文本特征矩阵输入到全连接层以及Softmax层,得到谣言预测类 别;
S105.2:根据所述谣言预测类别和真实谣言类别反向训练所述神 经网络模型,得到谣言识别模型。
一种基于传播影响力的网络谣言识别系统,包括:
文本特征矩阵获取模块,用于将多个包含谣言信息的文本进行神 经网络训练,得到文本特征矩阵;
用户节点信息获取模块,用于获取谣言信息对应用户的用户节点 信息。
第一构建模块,用于构建传播图结构,所述图结构中的节点为多 个所述用户节点信息,所述图结构中的邻接矩阵为所述谣言信息的发 布用户在多个所述文本之间的转发和评论关系;
第二构建模块,用于构建基于用户传递注意力的节点表示方法来 更新用户节点间的影响力,所述基于用户传递注意力的节点表示方法 的输入为所述第一用户节点信息矩阵,所述基于用户传递注意力的节 点表示方法的输出为更新后的第二用户节点信息矩阵。
训练模块,用于根据所述谣言特征矩阵训练神经网络模型,得到 谣言识别模型。
识别模块,用于根据所述谣言识别模型识别网络谣言。
优选地,所述文本特征矩阵获取模块还包括:
训练单元,用于训练包含谣言信息的多个文本中的单词;
获取单元,用于根据所述词向量获取多个所述文本的第一词特征 矩阵;
学习单元,用于将所述第一词特征矩阵通过注意力机制学习所述 单词之间的依赖关系,得到第二词特征矩阵。
输入单元,用于将所述第二词特征矩阵输入卷积层和最大池化层 得到文本特征矩阵。
本发明的有益效果在于:
(1)本发明结合了节点不同维度的信息,通过转发关系构图, 充分利用了用户节点信息和文本特征内容信息。对比于传统地手工构 造特征地模型,能够自动的提取更高维度的特征表示,减少了人工介 入,更方便于使用,更适用于社交媒体复杂环境。
(2)本发明中利用信息间的转发顺序对用户节点进行构图,区 别于以用户关注关系进行构图,这种方式可以使得图结构更加简洁, 并且这种方式可以避免了依赖大规模的用户信息,因为现实生活中我 们很难获取大量的用户信息。
(3)本发明中构造了一种传递注意力的方法,因为现实生活中 未直接转发或评论的用户之间也存在间接的影响力,本发明通过传递 注意力的方法可以学习到这种影响力关系,更好的捕获用户节点特 征。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面 将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描 述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来 讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他 的附图。
图1为本发明方法流程图;
图2为本发明注意力机制原理图;
图3为本发明文本特征矩阵的卷积层和池化层原理图;
图4为本发明网络谣言识别方法的原理图;
图5为本发明网络谣言识别系统的系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方 案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部 分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普 通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结 合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
参照图1所示,本发明提出一种基于传播影响力的网络谣言识别 方法,包括:
S101:对多个包含谣言信息的文本进行神经网络训练,得到文本 特征矩阵;
S101.1:对多个所述文本进行清洗和长度规范化。
具体为:去除文本中不规则的符号。由于每条文本信息中的文本 长度不同,假设文本长度为L,当文本不足长度L时,在文本前补零, 当文本长度大于L时,截取L长度之后的部分。
S101.2:对多个所述文本中的单词进行神经网络训练,得到所述 单词的词汇量;
具体为:根据Word2Vec中的Skip-Gram神经网络模型训练包含 谣言信息的多个文本中的单词,得到所述单词的词向量;其中,所述 Skip-Gram神经网络模型使用的窗口大小为5,所述词向量的嵌入维 度为300。
S101.3:基于所述词向量,得到多个所述文本的第一词特征矩阵;
第一词特征矩阵用vi∈RL*d表示,其中,L为文本长度,d为词向 量的维度。
S101.4:将所述第一词特征矩阵通过注意力机制学习所述单词之 间的依赖关系,得到第二词特征矩阵;
具体为:将所述第一词特征矩阵通过相同的h组多头注意力机制 进行学习,得到h组更新后的第一词特征矩阵,h为大于1的正整数。 将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩 阵。
参照图2所示为注意力机制原理图,多头注意力机制由相同的h 组构成,每组中的缩放点积注意力方法的计算公式如下:
Figure BDA0002984951010000081
其中,Q,K,V相同,Q∈RL*d,K∈RL*d,V∈RL*d均表示第一词 特征矩阵vi;Wi Q,Wi K,Wi V表示线性层1的不同参数矩阵,i∈[1,h];
Figure BDA0002984951010000082
表示防止内积过大且易于训练的规范数,一般选择K的维度; QWi Q,KWi K,VWi V为Q,K,V经过不同组的线性变化得到的。
多头自注意力机制通过计算多次来捕获不同子空间上的相关信 息,然后将计算出的h组Z1~Zh连接起来,经过一个线性层2输出第 二词特征矩阵O∈RL*D,公式如下:
O=W0(Concat(Z1,Z2...Zh))
其中,W0为线性层2的参数矩阵。
S101.5:将所述第二词特征矩阵输入卷积层和最大池化层得到文 本特征矩阵;
如图3所示,为本发明实施例1提供的获得文本特征矩阵的卷积 层和池化层原理图。
将所述第二词特征矩阵输入卷积层,得到卷积层特征,公式为:
Figure BDA0002984951010000091
其中,σ为非线性激活函数,W∈Rc*d为卷积核,Word为单词,
Figure BDA0002984951010000092
为单词的词向量。经过卷积层得到卷积层特征e,e=[e1,e2...eL-c+1], 其中,L为文本中的单词数量。
将所述卷积层特征输入最大池化层,得到所述文本特征矩阵。
具体为:对e∈R(L-c+1)*d在d维度进行最大池化得到m∈Rd,通过各 文本特征得到文本特征矩阵:M=(m1,m2...mn)∈Rn*d
S102:根据谣言信息的发布用户得到第一用户节点信息矩阵;
将谣言传播过程中的用户作为节点U={u1,u2...un},利用谣言信 息存在的转发或评论关系,例如给定顺序 E={u1→u2;u1→u3;u2→u4....ui→un},通过Node2Vec方法对用户节 点进行学习,得到用户节点嵌入信息ui,将给定顺序中的不同用户节 点嵌入信息ui构成第一用户节点信息矩阵U=[u1,u2...un]∈Rn*d, 其中,n为用户节点数目,d为用户节点嵌入信息的维度。
S103:构建传播图结构,所述图结构中的节点为多个所述用户节 点嵌入信息,所述图结构中的邻接矩阵为所述谣言信息的发布用户在 多个所述文本之间的转发和评论关系;
所述传播图结构G=(U,E),其中,节点信息矩阵U表示和谣言相 关的多个用户节点嵌入信息,边集合E为用户节点是否转发或评论另 一用户节点的微博信息,用邻接矩阵A∈Rn*n表示,其中,n为U中节 点的个数,邻接矩阵中对应位置元素为aij,若用户节点间存在转发 或评论关系则为1,否则为0,对应关系如下:
Figure BDA0002984951010000101
S104:构建基于用户传递注意力节点模型;
所述基于用户传递注意力节点模型的输入为所述第一用户节点 信息矩阵,所述基于用户传递注意力节点模型的输出为更新后的第二 用户节点信息矩阵;
S104.1:学习相邻用户节点间的注意力系数Sij
Figure BDA0002984951010000102
其中,
Figure BDA0002984951010000103
Figure BDA0002984951010000104
为所述节点信息矩阵U中节点i和节点j的节点信 息,W是可以学习的参数矩阵,
Figure BDA0002984951010000105
表示线性变换层的参数矩阵, LeakyReLU为激活函数。
S104.2:对每个节点的所有邻居的注意力进行归一化,归一化后 更新节点模型。
其中,影响力系数(注意力系数)归一化公式为:
Figure BDA0002984951010000111
更新影响力矩阵M(注意力矩阵)下的第一用户节点信息表示为:
Figure BDA0002984951010000112
其中,Ni表示所述邻接矩阵A中所有和节点i相邻的节点。W为 可学习的参数矩阵。
S104.3:构造注意力矩阵M∈Rn×n,n为节点个数,对应位置元 素为eij,即上述公式中的eij。构造传递注意力矩阵M′,构造公式为: M′=M×M,其中M′∈Rn×n。通过构造的该传递注意力矩阵,学 习其他节点做为中间节点在内的节点i和节点j的影响力系数 s′ij=∑Ksik×skj,归一化并更新用户节点表示。
其中,影响力系数归一化公式:
e′ij=softmax(s′ij)
更新影响力矩阵M′下的第一用户节点信息表示为:
Figure BDA0002984951010000121
S104.4:将经过不同注意力矩阵M和M′更新后的第一用户节点 信息
Figure BDA0002984951010000122
Figure BDA0002984951010000123
合并,得到最终得第二用户节点信息
Figure BDA0002984951010000124
其中:
Figure BDA0002984951010000125
之后将得到的第二用户节点信息
Figure BDA0002984951010000126
构成第二用户节点信息矩阵
Figure BDA0002984951010000127
S105:根据所述更新后的第二用户节点信息矩阵和文本特征矩阵 训练神经网络模型,得到谣言识别模型。
S105.1:将所述第二用户节点信息矩阵和步骤101中所获取的文 本特征矩阵输入到全连接层以及Softmax层得到谣言预测类别。具体 为:
参照图4所示,将所述第二用户节点信息矩阵Ul和所述步骤S101 中所获取的文本特征矩阵M进行合并,得到最终节点向量矩阵Vl,其 中Vl=concat(Ul,M)。然后将最终节点向量矩阵输入到全连接层和 Softmax层得到谣言预测类别,公式为:
Figure BDA0002984951010000128
其中
Figure BDA0002984951010000129
为 谣言预测类别,W∈R2d*classl为可学习的参数矩阵,b为偏置项。
S105.2:根据所述谣言预测类别和真实谣言类别反向训练所述神 经网络模型,得到谣言识别模型。具体为:
获取所述谣言预测类别与所述真实谣言类别之间的差值。
判断所述差值是否在预设阈值范围内。
若是,则确定所述神经网络模型为所述谣言识别模型。
若否,则根据所述差值反向训练所述神经网络模型,使所述差值 在所述预设阈值范围内。
其中,神经网络通过反向传播,随机梯度下降法迭代,每次选择 64Batch size做训练样本训练网络,计算出预测输出,将预测输出 与实际类别值进行比较,并将比较结果之间的差值称为误差,使用误 差来表示损失函数loss,并根据误差通过优化方法更新神经网络中 可学习的参数模型权重,以最小化损失函数loss,对每个批次重复 上述过程,直到对整个样本集来说,损失函数最小,并更新模型中的 参数。
S106:根据所述谣言识别模型识别网络谣言。
参照图5所示,本发明还提供一种基于传播影响力的网络谣言识 别系统,包括:文本特征矩阵获取模块、用户节点信息获取模块、第 一构建模块、第二构建模块、训练模块、识别模块;
文本特征矩阵获取模块201,用于将多个包含谣言信息的文本进 行神经网络训练,得到文本特征矩阵;
其中,所述文本特征矩阵获取模块201还包括:
训练单元2011,用于训练包含谣言信息的多个文本中的单词, 得到所述单词的词向量。
获取单元2012,用于根据所述词向量获取多个所述文本的第一 词特征矩阵。
学习单元2013,用于将所述第一词特征矩阵通过注意力机制学 习所述单词之间的依赖关系,得到第二词特征矩阵。
输入单元2014,用于将所述第二词特征矩阵输入卷积层和最大 池化层得到文本特征矩阵。
用户节点信息获取模块202,用于获取谣言信息对应用户的用户 节点信息。
第一构建模块203,用于构建传播图结构,所述图结构中的节点 为多个所述用户节点信息,所述图结构中的邻接矩阵为所述谣言信息 的发布用户在多个所述文本之间的转发和评论关系。
第二构建模块204,用于构建基于用户传递注意力的节点表示方 法来更新用户节点间的影响力,所述基于用户传递注意力的节点表示 方法的输入为所述第一用户节点信息矩阵,所述基于用户传递注意力 的节点表示方法的输出为更新后的第二用户节点信息矩阵。
训练模块205,用于根据所述谣言特征矩阵训练神经网络模型, 得到谣言识别模型。
识别模块206,用于根据所述谣言识别模型识别网络谣言。
综上,本发明结合了节点不同维度的信息,通过转发关系构图, 充分利用了用户节点信息和文本特征内容信息。对比于传统地手工构 造特征地模型,能够自动的提取更高维度的特征表示,减少了人工介 入,更方便于我们的使用,更适用于社交媒体复杂环境;本发明利用 信息间的转发顺序对用户节点进行构图,区别于以用户关注关系进行 构图,这种方式可以使得图结构更加简洁,并且这种方式可以避免了 依赖大规模的用户信息,因为现实生活中我们很难获取大量的用户信 息;本发明构造了一种传递注意力的方法,因为现实生活中未直接转 发或评论的用户之间也存在间接的影响力,我们通过传递注意力的方法可以学习到这种影响力关系,更好的捕获用户节点特征。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对 本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领 域普通技术人员对本发明的技术方案做出的各种变形和改进,均应 落入本发明权利要求书确定的保护范围内。

Claims (10)

1.一种基于传播影响力的网络谣言识别方法,其特征在于,具体包括如下步骤:
S101:对多个包含谣言信息的文本进行神经网络训练,得到文本特征矩阵;
S102:基于谣言信息的发布用户,得到第一用户节点信息矩阵;
S103:基于所述第一用户节点信息矩阵和所述发布用户在多个所述文本之间的转发和评论关系,构建传播图结构;
S104:基于所述传播图结构,构建发布用户传递注意力节点模型,并将所述第一用户节点信息矩阵输入该模型中,输出更新后的第二用户节点信息矩阵;
S105:根据所述更新后的第二用户节点信息矩阵和所述文本特征矩阵来训练神经网络模型,得到谣言识别模型;
S106:根据所述谣言识别模型识别网络谣言。
2.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S101具体为:
S101.1:对多个所述包含谣言信息的文本进行清洗和长度规范化;
S101.2:对多个所述文本中的单词进行神经网络训练,得到所述单词的词汇量;
S101.3:基于所述词向量,得到多个所述文本的第一词特征矩阵;
S101.4:将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;
S101.5:将所述第二词特征矩阵输入卷积层和最大池化层,得到所述文本特征矩阵。
3.根据权利要求2所述的基于传播影响力的网络谣言识别方法,其特征在于,所述神经网络是采用Word2Vec中的Skip-Gram神经网络模型;所述Skip-Gram神经网络模型使用的窗口大小为5;所述词向量的嵌入维度为300。
4.根据权利要求2所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S101.4具体为:
将所述第一词特征矩阵通过相同的h组多头注意力机制进行学习,得到h组更新后的第一词特征矩阵,h为大于1的正整数;
将h组所述更新后的第一词特征矩阵连接起来,得到第二词特征矩阵。
5.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S102具体为:
将发布谣言信息的用户作为节点,并将所述节点给予一定顺序;并对不同用户的节点采用Node2Vec方法进行学习,得到不同用户节点嵌入信息,将得到的给定顺序中的不同用户节点嵌入信息构成构成第一用户节点信息矩阵。
6.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S103具体为:
构建传播图结构,所述图结构中的节点为多个所述用户节点嵌入信息,所述图结构中的邻接矩阵为所述谣言信息的发布用户在多个所述文本之间的转发和评论关系;将谣言信息对应的用户节点,并根据所述转发和评论关系,构成传播图结构。
7.根据权利要求1所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S104具体为:
S104.1:学习相邻用户节点间的注意力系数sij
S104.2:对每个用户节点的所有邻居的注意力系数eij进行归一化,并更新影响力矩阵M下的所述第一用户节点信息矩阵
Figure FDA0002984949000000031
S104.3:基于注意力矩阵,构建传递注意力矩阵M′;并通过所述传递注意力矩阵,学习其他节点做为中间节点在内的节点i和节点j的影响力系数e′ij,并对其进行归一化,更新传递注意力矩阵M′下的所述第一用户节点信息矩阵
Figure FDA0002984949000000032
S104.4:将经过不同注意力矩阵M和M′更新后的第一用户节点信息
Figure FDA0002984949000000033
Figure FDA0002984949000000034
合并,得到更新后的二用户节点信息
Figure FDA0002984949000000035
8.根据权利要求7所述的基于传播影响力的网络谣言识别方法,其特征在于,所述步骤S105具体为:
S105.1:将所述更新后的第二用户节点信息矩阵和所述步骤S101中的文本特征矩阵输入到全连接层以及Softmax层,得到谣言预测类别;
S105.2:根据所述谣言预测类别和真实谣言类别反向训练所述神经网络模型,得到谣言识别模型。
9.一种基于传播影响力的网络谣言识别系统,其特征在于,包括:
文本特征矩阵获取模块,用于将多个包含谣言信息的文本进行神经网络训练,得到文本特征矩阵;
用户节点信息获取模块,用于获取谣言信息对应用户的用户节点信息;
第一构建模块,用于构建传播图结构,所述图结构中的节点为多个所述用户节点信息,所述图结构中的邻接矩阵为所述谣言信息的发布用户在多个所述文本之间的转发和评论关系;
第二构建模块,用于构建基于用户传递注意力的节点表示方法来更新用户节点间的影响力,所述基于用户传递注意力的节点表示方法的输入为所述第一用户节点信息矩阵,所述基于用户传递注意力的节点表示方法的输出为更新后的第二用户节点信息矩阵;
训练模块,用于根据所述谣言特征矩阵训练神经网络模型,得到谣言识别模型;
识别模块,用于根据所述谣言识别模型识别网络谣言。
10.根据权利要求8所述的基于传播影响力的网络谣言识别系统,其特征在于,所述文本特征矩阵获取模块还包括:
训练单元,用于训练包含谣言信息的多个文本中的单词;
获取单元,用于根据所述词向量获取多个所述文本的第一词特征矩阵;
学习单元,用于将所述第一词特征矩阵通过注意力机制学习所述单词之间的依赖关系,得到第二词特征矩阵;
输入单元,用于将所述第二词特征矩阵输入卷积层和最大池化层得到文本特征矩阵。
CN202110297717.7A 2021-03-19 2021-03-19 一种基于传播影响力的网络谣言识别系统及方法 Active CN113191144B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110297717.7A CN113191144B (zh) 2021-03-19 2021-03-19 一种基于传播影响力的网络谣言识别系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110297717.7A CN113191144B (zh) 2021-03-19 2021-03-19 一种基于传播影响力的网络谣言识别系统及方法

Publications (2)

Publication Number Publication Date
CN113191144A true CN113191144A (zh) 2021-07-30
CN113191144B CN113191144B (zh) 2024-04-09

Family

ID=76973503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110297717.7A Active CN113191144B (zh) 2021-03-19 2021-03-19 一种基于传播影响力的网络谣言识别系统及方法

Country Status (1)

Country Link
CN (1) CN113191144B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113919440A (zh) * 2021-10-22 2022-01-11 重庆理工大学 一种融合双重注意力机制和图卷积社交网络谣言检测系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685153A (zh) * 2018-12-29 2019-04-26 武汉大学 一种基于特征聚合的社交网络谣言鉴别方法
CN112069397A (zh) * 2020-08-21 2020-12-11 三峡大学 自注意力机制与生成对抗网络相结合的谣言检测方法
CN112199608A (zh) * 2020-11-03 2021-01-08 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法
CN112231562A (zh) * 2020-10-15 2021-01-15 北京工商大学 一种网络谣言识别方法及系统
US20210019339A1 (en) * 2018-03-12 2021-01-21 Factmata Limited Machine learning classifier for content analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210019339A1 (en) * 2018-03-12 2021-01-21 Factmata Limited Machine learning classifier for content analysis
CN109685153A (zh) * 2018-12-29 2019-04-26 武汉大学 一种基于特征聚合的社交网络谣言鉴别方法
CN112069397A (zh) * 2020-08-21 2020-12-11 三峡大学 自注意力机制与生成对抗网络相结合的谣言检测方法
CN112231562A (zh) * 2020-10-15 2021-01-15 北京工商大学 一种网络谣言识别方法及系统
CN112199608A (zh) * 2020-11-03 2021-01-08 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HONGBIN LIN: "A Graph Convolutional Encoder and Decoder Model for Rumor Detection", INTERNATIONAL CONFERENCE ON DATA SCIENCE AND ADVANCED ANALYTICS (DSAA), 31 December 2020 (2020-12-31), pages 300 - 306 *
ROOHANI: "Rumor Propagation: A State-of-the-art Survey of Current Challenges and Opportunities", INTERNATIONAL CONFERENCE ON INTELLIGENT COMMUNICATION AND COMPUTATIONAL TECHNIQUES (ICCT), 29 September 2019 (2019-09-29), pages 64 - 69, XP033694808, DOI: 10.1109/ICCT46177.2019.8969023 *
段大高: "基于梯度提升决策树的微博虚假消息检测", 计算机应用, vol. 38, no. 2, 10 February 2018 (2018-02-10), pages 410 - 414 *
胡斗: "一种基于多关系传播树的谣言检测方法", 计算机研究与发展, vol. 58, no. 7, 10 August 2020 (2020-08-10), pages 1395 - 1411 *
韩忠明: "基于网络嵌入方法的耦合网络节点表示学习", 中国科学, vol. 50, no. 8, 6 August 2020 (2020-08-06), pages 1197 - 1216 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113919440A (zh) * 2021-10-22 2022-01-11 重庆理工大学 一种融合双重注意力机制和图卷积社交网络谣言检测系统

Also Published As

Publication number Publication date
CN113191144B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN112231562B (zh) 一种网络谣言识别方法及系统
CN112084335B (zh) 一种基于信息融合的社交媒体用户账号分类方法
CN110795641B (zh) 基于表示学习的网络谣言传播控制方法
CN112395466B (zh) 一种基于图嵌入表示和循环神经网络的欺诈节点识别方法
CN111966823B (zh) 一种面向标签噪声的图节点分类方法
CN111753024A (zh) 一种面向公共安全领域的多源异构数据实体对齐方法
CN112417099A (zh) 一种基于图注意力网络的欺诈用户检测模型构建方法
CN107688576B (zh) 一种cnn-svm模型的构建及倾向性分类方法
CN112016601B (zh) 基于知识图谱增强小样本视觉分类的网络模型构建方法
CN111753207B (zh) 一种基于评论的神经图协同过滤方法
CN112199608A (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN109523021A (zh) 一种基于长短时记忆网络的动态网络结构预测方法
CN114036406A (zh) 一种基于图对比学习和社交网络增强的推荐方法及系统
CN113343126B (zh) 基于事件与传播结构的谣言检测方法
CN113434628B (zh) 一种基于特征级与传播关系网络的评论文本置信检测方法
CN113254652B (zh) 一种基于超图注意力网络的社交媒体贴文真实性检测方法
AU2021102006A4 (en) A system and method for identifying online rumors based on propagation influence
CN112199606A (zh) 一种基于层次用户表示的面向社交媒体的谣言检测系统
CN111428151A (zh) 一种基于网络增速的虚假消息识别方法及其装置
CN113191144A (zh) 一种基于传播影响力的网络谣言识别系统及方法
CN111581379A (zh) 一种基于作文扣题度的自动作文评分计算方法
CN113762372B (zh) 即时通讯信息中组织成员识别方法及装置
CN113157993A (zh) 一种基于时序图极化分析的网络水军行为预警模型
CN115169538A (zh) 基于增强网络对比约束的多通道社交圈子识别装置及方法
CN114491029A (zh) 基于图神经网络的短文本相似度计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant