CN113111267A - 一种基于双向传播图的多任务谣言检测方法 - Google Patents
一种基于双向传播图的多任务谣言检测方法 Download PDFInfo
- Publication number
- CN113111267A CN113111267A CN202110485893.3A CN202110485893A CN113111267A CN 113111267 A CN113111267 A CN 113111267A CN 202110485893 A CN202110485893 A CN 202110485893A CN 113111267 A CN113111267 A CN 113111267A
- Authority
- CN
- China
- Prior art keywords
- rumor
- feature
- matrix
- gcn
- propagation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 15
- 238000010586 diagram Methods 0.000 title claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims abstract description 76
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000010354 integration Effects 0.000 claims abstract description 9
- 238000011176 pooling Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000013145 classification model Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 239000004576 sand Substances 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- QUKGLNCXGVWCJX-UHFFFAOYSA-N 1,3,4-thiadiazol-2-amine Chemical group NC1=NN=CS1 QUKGLNCXGVWCJX-UHFFFAOYSA-N 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于双向传播图的多任务谣言检测方法,该方法可用于社交网络帖子的谣言检测以及评论信息的立场检测。本发明首先根据谣言帖子的内容生成文本特征矩阵、用户特征矩阵和文本统计特征矩阵,之后构建谣言的双向传播图,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,训练softmax分类器,获取谣言检测和立场检测结果。本发明能够有效地获取谣言的顺序传播特征和广度散布特征,并且引入用户评论的立场检测作为辅助任务,从而提高模型的泛化性,进一步提高谣言检测任务的准确率。
Description
技术领域
本发明涉及一种基于双向传播图的多任务谣言检测方法,该方法可用于社交网络帖子的谣言检测以及评论信息的立场检测,属于互联网与自然语言处理技术领域。
背景技术
近年来,社交网络取得了快速发展,并迅速成为人们获取新闻资讯的重要途径之一。由于社交网络的信息量庞大且传播速度远超于传统媒介,大量未经证实的谣言得以在网络空间内肆意传播,并成为了一种日益严重的问题。互联网已经成为了继陆地、海洋、天空、太空后的“第五空间”,而利用社交网络平台散布谣言,借机实施网络犯罪、散布暴恐信息、煽动颜色革命等违法犯罪行为已对网络空间安全构成了严峻的威胁。
现有社交网络谣言检测方法主要包括人工谣言检测方法、基于机器学习的谣言检测方法和基于深度学习的谣言检测方法。大多数主流社交网络平台仍将人工谣言检测方法作为甄别疑似谣言信息的主流机制,虽然有着较高的判别准确性,但存在滞后性,且受人为因素的影响较大,因而无法满足社交网络谣言检测的需求。基于机器学习的方法将谣言检测工作归结为二分类问题,使用监督学习方法自动检测谣言信息,对特征工程有着较高的要求,且无法获取谣言在传播和散布过程中的深层特征,故无法获得较高的识别率。而许多基于深度学习的谣言检测方法从谣言的时序传播结构入手,通过抽取谣言在传播过程中深层特征检测疑似谣言信息,往往仅注重谣言的顺序传播特征而忽视了广度散布特征,因此在谣言检测任务中仍存在一定的精度损失。
针对目前社交网络谣言对网络空间安全所构成的严峻威胁和现有谣言检测方法无法有效抽取谣言传播特征的问题,本发明提出一种基于双向传播图的多任务谣言检测方法,使用一种改进的双向图卷积神经网络(Bi-GCN)抽取谣言的顺序传播特征和广度散布特征,并引入对评论文本的立场检测作为辅助任务,提升谣言检测任务的表现与泛化性,从而提高谣言检测的准确率。
发明内容
针对现有技术存在的问题与不足,本发明提供一种基于双向传播图的多任务谣言检测方法,该方法能够实时检测疑似谣言信息以及评论文本的立场,相比现有方法,能够更有效地获取谣言的顺序传播特征和广度散布特征,从而改善现有谣言检测方法准确率不足的问题。
为了实现上述目的,本发明的技术方案如下:一种基于双向传播图的多任务谣言检测方法,该方法涵盖社交网络谣言检测的全过程,主要包括特征提取、特征融合、评论立场类型分类和谣言类型分类等过程,能够有效地抽取谣言的传播特征,从而提高谣言检测任务的准确率。该方法主要包括三个步骤,具体如下:
步骤1,构筑谣言和立场样本数据集。首先使用Twitter15和Twitter16数据集中的用户uid,通过推特开放API获取用户信息,用于谣言检测的任务训练,同时,将PHEME数据集用于用户评论立场检测任务的训练,二者共同构成多任务模型的训练数据集。
步骤2,多任务分类模型训练。对于数据集中的每一个谣言帖子,首先使用TF-IDF算法抽取其文本特征,并生成用户特征和文本统计特征,之后构建谣言的双向传播图,接着将文本特征、用户特征和文本统计特征作为输入,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,训练softmax分类器。
步骤3,对待检测帖子进行分类预测。对于待检测帖子,首先提取其文本特征、用户特征和文本统计特征,接着构建该帖子的双向传播图,通过计算双向图卷积并进行根节点特征增强抽取传播特征,利用训练好的softmax分类器获得谣言检测和立场检测的结果。
相对于现有技术,本发明的有益效果如下:
1.该方法采用改进的Bi-GCN网络获取谣言的传播特征,能够有效地获取谣言的顺序传播特征和广度散布特征,从而提高谣言检测任务的准确率,相比改进前的Bi-GCN模型84%-86%的检测准确率,该改进模型在其基础上提升了1-1.5个百分点。
2.该方法引入用户评论的立场检测作为辅助任务,能够有效提模型的泛化性,同时进一步提高谣言检测任务的准确率,达到了86%-88.5%的水平。
附图说明
图1为本发明实施例的方法流程图;
图2为本发明实施例的方法总体框架图;
图3为本发明实施例涉及的双向图卷积计算流程图;
图4为本发明实施例涉及的改进双向图卷积网络框架图;
图5为本发明实施例涉及的TD-GCN中的注意力机制示意图;
图6为本发明实施例涉及的BU-GCN中的注意力机制示意图。
具体实施方式
为了加深对本发明的认识和理解,下面结合具体实施例进一步阐明本发明。
实施例:本发明的具体流程和整体框架分别如图1和图2所示,一种基于双向传播图的多任务谣言检测方法,本发明的具体实施步骤如下:
步骤1,构筑谣言和立场样本数据集。本发明首先从Twitter15和Twitter16数据集中获取用户uid,并通过推特开放API获取430000位用户的特征信息用于谣言检测任务的训练,同时,将PHEME数据集用于用户评论立场检测任务的训练,二者共同构成多任务模型的训练数据集。
步骤2,多任务分类模型训练。对于数据集中的每一个谣言帖子,首先使用TF-IDF算法抽取其文本特征Xs,并生成用户特征Xm=1和文本统计特征Xm=2,之后构建谣言的双向传播图,接着将文本特征Xs、用户特征Xm=1和文本统计特征Xm=2作为输入,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征S,最后对传播特征S进行平均池化和特征整合后,训练softmax分类器。该步骤实施过程分为7个子步骤:
TF-IDF(i,wj)=TF(i,wj)·IDF(wj) (3)
其中,TF(i,wj)表示推文i中单词wj的词频,推文i中单词wj出现的次数由Count(i,wj)表示,Count(i)表示推文i的单词总数;IDF(wj)表示单词wj的逆向频率,|T|表示推文总数,CountTweets(wj)表示包含单词wj的推文总数。
子步骤2-2,生成用户特征矩阵Xm=1。对于每一个谣言帖子,从其包含的每一条推文中抽取其对应用户的特征信息(否有简介、性别、所在地区等),生成用户特征的向量表示,并逐条拼接生成用户特征矩阵Xm=1。用户特征信息的具体内容如如表1所示:
表1用户特征
子步骤2-3,生成文本统计特征矩阵Xm=2。对于每一个谣言帖子,从其包含的每一条推文中抽取其对应推文的统计特征信息(否定词数量、咒骂词数量、句号数量等),生成文本统计特征的向量表示,并逐条拼接生成文本统计特征矩阵Xm=2。文本统计特征信息的具体内容如表2所示。其中本发明设置的否定词汇包括not、no、nobody、nothing、none、never、neither、nor、nowhere、hardly、scarcely、barely、don’t、isn’t、wasn’t、shouldn’t、wouldn’t、couldn’t、doesn’t;咒骂词汇参照开源nlp工具textfilter中的英文脏话词典。
表2文本统计特征
子步骤2-4,构建双向传播图。对于谣言帖子,根据其包含的所有推文间的转发/回复关系,构建邻接矩阵A。若Ats=1,则说明存在节点t指向节点s的有向边。之后使用DropEdge策略从A中随机提出一些边:
A′=A-Adrop (4)
其中Adrop为以概率p随机从A中挑选的边集合对应的邻接矩阵。于是,对于自顶向下传播图,其邻接矩阵为ATD=A′,而对于自底向上传播图,其邻接矩阵为ABU=A′T。
子步骤2-5,抽取谣言传播特征。如图3所示,将子步骤2-1、2-2和2-3生成的文本特征矩阵Xs、用户特征矩阵Xm=1和文本统计特征矩阵Xm=2输入如图4所示的改进Bi-GCN网络中,通过计算双向图卷积,抽取谣言的传播特征。以自顶向下图卷积神经网络(TD-GCN)为例,参数共享层的第一层TD-GCN对应的隐藏矩阵定义为:
σ(·)为非线性的ReLU激活函数。
接着,使用如图5所示的注意力机制计算根节点root对于节点i的AttentionScore:
之后计算节点i对应的根节点特征增强向量,定义为:
其中σ(·)为非线性的sigmoid激活函数。
因此,TD-GCN在根节点增强后生成的特征矩阵为:
于是,BU-GCN在根节点增强后生成的特征矩阵为:
子步骤2-7,特征融合及分类结果输出。对于谣言检测任务,用平均池化操作整合TD-GCN的顺序传播特征STD和BU-GCN提取出的广度散布特征SBU:
使用拼接操作后获得整合特征S,定义为:
S=concat(STD,SBU) (25)
对于立场检测任务,将TD-GCN和BU-GCN提取出的隐藏层特征进行拼接,获得一个整合特征矩阵Z:
步骤3,对待检测帖子进行分类预测。对于待检测帖子,首先使用TF-IDF算法抽取其文本特征Xs,并生成用户特征Xm=1和文本统计特征Xm=2,之后构建谣言的双向传播图,接着将文本特征Xs、用户特征Xm=1和文本统计特征Xm=2作为输入,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,输入步骤2中训练好的softmax分类器获取谣言检测和立场检测结果。
综上,本发明首先根据谣言帖子的内容生成文本特征矩阵、用户特征矩阵和文本统计特征矩阵,之后构建谣言的双向传播图,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,训练softmax分类器,获取谣言检测和立场检测结果。本发明能够有效地获取谣言的顺序传播和广度散布特征,并且引入用户评论的立场检测作为辅助任务,从而提高模型的泛化性,进一步提高谣言检测任务的准确率。
基于相同的发明构思,本发明实施例公开的一种基于双向传播图的多任务谣言检测方法与装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现上述基于双向传播图的多任务谣言检测方法与装置。
需要说明的是,上述实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
Claims (5)
1.一种基于双向传播图的多任务谣言检测方法,其特征在于,所述方法包括以下步骤:
步骤1,构筑谣言和立场样本数据集,
步骤2,多任务分类模型训练,
步骤3,对待检测帖子进行分类预测。
2.根据权利要求1所述的基于双向传播图的多任务谣言检测方法,其特征在于,步骤1,构筑谣言和立场样本数据集,具体如下,首先使用Twitter15和Twitter16数据集中的用户uid,通过推特开放API获取用户信息,用于谣言检测的任务训练,同时,将PHEME数据集用于用户评论立场检测任务的训练,二者共同构成多任务模型的训练数据集。
3.根据权利要求1所述的基于双向传播图的多任务谣言检测方法,其特征在于,步骤2,多任务分类模型训练,具体如下,对于数据集中的每一个谣言帖子,首先使用TF-IDF算法抽取其文本特征Xs,并生成用户特征Xm=1和文本统计特征Xm=2,之后构建谣言的双向传播图,接着将文本特征Xs、用户特征Xm=1和文本统计特征Xm=2作为输入,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征S,最后对传播特征S进行平均池化和特征整合后,训练softmax分类器。
4.根据权利要求1所述的基于双向传播图的多任务谣言检测方法,其特征在于,步骤2,多任务分类模型训练,该步骤实施过程分为7个子步骤:
TF-IDF(i,wj)=TF(i,wj)·IDF(wj) (3)
其中,TF(i,wj)表示推文i中单词wj的词频,推文i中单词wj出现的次数由Count(i,wj)表示,Count(i)表示推文i的单词总数;IDF(wj)表示单词wj的逆向频率,|T|表示推文总数,CountTweets(wj)表示包含单词wj的推文总数;
子步骤2-2,生成用户特征矩阵Xm=1,对于每一个谣言帖子,从其包含的每一条推文中抽取其对应用户的特征信息,生成用户特征的向量表示,并逐条拼接生成用户特征矩阵Xm=1,用户特征信息的具体内容如如表1所示:
表1用户特征
子步骤2-3,生成文本统计特征矩阵Xm=2,对于每一个谣言帖子,从其包含的每一条推文中抽取其对应推文的统计特征信息,生成文本统计特征的向量表示,并逐条拼接生成文本统计特征矩阵Xm=2,文本统计特征信息的具体内容如表2所示,
表2文本统计特征
子步骤2-4,构建双向传播图,对于谣言帖子,根据其包含的所有推文间的转发/回复关系,构建邻接矩阵A,若Ats=1,则说明存在节点t指向节点s的有向边,之后使用DropEdge策略从A中随机提出一些边:
A′=A-Adrop (4)
其中Adrop为以概率p随机从A中挑选的边集合对应的邻接矩阵,于是,对于自顶向下传播图,其邻接矩阵为ATD=A′,而对于自底向上传播图,其邻接矩阵为ABU=A′T,
子步骤2-5,抽取谣言传播特征,将子步骤2-1、2-2和2-3生成的文本特征矩阵Xs、用户特征矩阵Xm=1和文本统计特征矩阵Xm=2输入改进Bi-GCN网络中,通过计算双向图卷积,抽取谣言的传播特征,以自顶向下图卷积神经网络(TD-GCN)为例,参数共享层的第一层TD-GCN对应的隐藏矩阵定义为:
σ(·)为非线性的ReLU激活函数;
接着,使用注意力机制计算根节点root对于节点i的Attention Score:
之后计算节点i对应的根节点特征增强向量,定义为:
其中σ(·)为非线性的sigmoid激活函数,
因此,TD-GCN在根节点增强后生成的特征矩阵为:
于是,BU-GCN在根节点增强后生成的特征矩阵为:
子步骤2-7,特征融合及分类结果输出。对于谣言检测任务,用平均池化操作整合TD-GCN的顺序传播特征STD和BU-GCN提取出的广度散布特征SBU:
使用拼接操作后获得整合特征S,定义为:
S=concat(STD,SBU) (25)
对于立场检测任务,将TD-GCN和BU-GCN提取出的隐藏层特征进行拼接,获得一个整合特征矩阵Z:
5.根据权利要求1所述的基于双向传播图的多任务谣言检测方法,其特征在于,步骤3,对待检测帖子进行分类预测,对于待检测帖子,首先使用TF-IDF算法抽取其文本特征Xs,并生成用户特征Xm=1和文本统计特征Xm=2,之后构建谣言的双向传播图,接着将文本特征Xs、用户特征Xm=1和文本统计特征Xm=2作为输入,通过计算双向图卷积并进行根节点特征增强抽取谣言的传播特征,最后对传播特征进行平均池化和特征整合后,输入步骤2中训练好的softmax分类器获取谣言检测和立场检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110485893.3A CN113111267A (zh) | 2021-04-30 | 2021-04-30 | 一种基于双向传播图的多任务谣言检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110485893.3A CN113111267A (zh) | 2021-04-30 | 2021-04-30 | 一种基于双向传播图的多任务谣言检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113111267A true CN113111267A (zh) | 2021-07-13 |
Family
ID=76720828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110485893.3A Withdrawn CN113111267A (zh) | 2021-04-30 | 2021-04-30 | 一种基于双向传播图的多任务谣言检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111267A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094596A (zh) * | 2021-04-26 | 2021-07-09 | 东南大学 | 一种基于双向传播图的多任务谣言检测方法 |
-
2021
- 2021-04-30 CN CN202110485893.3A patent/CN113111267A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113094596A (zh) * | 2021-04-26 | 2021-07-09 | 东南大学 | 一种基于双向传播图的多任务谣言检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113094596A (zh) | 一种基于双向传播图的多任务谣言检测方法 | |
CN109558487A (zh) | 基于层次性多注意力网络的文档分类方法 | |
CN110321563B (zh) | 基于混合监督模型的文本情感分析方法 | |
CN108363753A (zh) | 评论文本情感分类模型训练与情感分类方法、装置及设备 | |
CN108197109A (zh) | 一种基于自然语言处理的多语言分析方法和装置 | |
CN111814454B (zh) | 一种社交网络上的多模态网络欺凌检测模型 | |
CN111160452A (zh) | 一种基于预训练语言模型的多模态网络谣言检测方法 | |
CN110502626A (zh) | 一种基于卷积神经网络的方面级情感分析方法 | |
CN109697288B (zh) | 一种基于深度学习的实例对齐方法 | |
CN110348227A (zh) | 一种软件漏洞的分类方法及系统 | |
Sunarya et al. | Comparison of accuracy between convolutional neural networks and Naïve Bayes Classifiers in sentiment analysis on Twitter | |
Al-Tai et al. | Deep learning for fake news detection: Literature review | |
CN112182585A (zh) | 源代码漏洞检测方法、系统及存储介质 | |
CN116467443A (zh) | 基于主题识别的网络舆情文本分类方法 | |
Bölücü et al. | Hate Speech and Offensive Content Identification with Graph Convolutional Networks. | |
Mahdin et al. | Sentiment analysis on COVID-19 vaccine tweets using machine learning and deep learning algorithms | |
Hassan et al. | A survey on automatic fake news identification techniques for online and socially produced data | |
Nisha et al. | Detection and classification of cyberbullying in social media using text mining | |
CN113111267A (zh) | 一种基于双向传播图的多任务谣言检测方法 | |
Ahmed et al. | Hateful meme prediction model using multimodal deep learning | |
Phan et al. | Little flower at memotion 2.0 2022: Ensemble of multi-modal model using attention mechanism in memotion analysis | |
CN113190681B (zh) | 一种基于胶囊网络遮罩记忆注意力的细粒度文本分类方法 | |
Seliverstov et al. | Detection of low-toxic texts in similar sets using a modified XLM-RoBERTa neural network and toxicity confidence parameters | |
CN114840665A (zh) | 一种基于情感分析的谣言检测方法、装置及相关介质 | |
Jiang et al. | Sentiment classification based on clause polarity and fusion via convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210713 |