CN111858928A - 一种基于图结构对抗学习的社交媒体谣言检测方法及装置 - Google Patents

一种基于图结构对抗学习的社交媒体谣言检测方法及装置 Download PDF

Info

Publication number
CN111858928A
CN111858928A CN202010553467.4A CN202010553467A CN111858928A CN 111858928 A CN111858928 A CN 111858928A CN 202010553467 A CN202010553467 A CN 202010553467A CN 111858928 A CN111858928 A CN 111858928A
Authority
CN
China
Prior art keywords
original
message
social network
rumor
network structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010553467.4A
Other languages
English (en)
Other versions
CN111858928B (zh
Inventor
张熙
杨小雨
吕悦菲
王春露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202010553467.4A priority Critical patent/CN111858928B/zh
Publication of CN111858928A publication Critical patent/CN111858928A/zh
Application granted granted Critical
Publication of CN111858928B publication Critical patent/CN111858928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种基于图结构对抗学习的社交媒体谣言检测方法及装置,其中方法包括:获取社交媒体中待检测消息的内容信息及社交网络结构;将待检测消息的内容信息及社交信息作为检测器的输入,通过检测器得到待检测消息的目标谣言检测结果,其中,目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,检测器是基于样本集,以对抗训练的方式训练得到的,样本集中一个样本为一个原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在对抗训练的方式中增加伪装策略,以完成检测器的训练,这样检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言并且检测流程简单。

Description

一种基于图结构对抗学习的社交媒体谣言检测方法及装置
技术领域
本发明涉及通信技术领域,特别是涉及一种基于图结构对抗学习的社交媒体谣言检测方法及装置。
背景技术
社交媒体上谣言的广泛传播,对政治、经济、日常生活等方方面面产生了巨大影响,所以社交媒体上的谣言检测受到工业界和学术界的极大关注。
谣言检测的方法一般有基于特征工程的检测方法,由于基于特征工程的方法需要人工设计很多特征,这使得检测流程很复杂,并且检测效果欠佳。
发明内容
本发明实施例的目的在于提供一种基于图结构对抗学习的社交媒体谣言检测方法及装置,用以解决现有技术中基于特征工程的方法需要人工设计很多特征,使得检测流程很复杂,并且检测效果欠佳的技术问题。具体技术方案如下:
第一方面,本发明实施例提供了一种基于图结构对抗学习的社交媒体谣言检测方法,包括:
获取社交媒体中待检测消息的内容信息及社交网络结构;
将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
进一步的,所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,通过如下步骤,训练得到所述检测器:
各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;
每次对一个样本执行如下步骤:
步骤
Figure BDA0002543342610000021
建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
步骤
Figure BDA0002543342610000022
对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
步骤
Figure BDA0002543342610000023
将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
步骤
Figure BDA0002543342610000024
基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
对所述样本集中的各样本,通过所述步骤
Figure BDA0002543342610000025
至所述步骤
Figure BDA0002543342610000026
得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
确定所有原始消息的鉴别结果的准确率,返回步骤
Figure BDA0002543342610000027
继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
进一步的,所述建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络生成伪装后社交网络结构,包括:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征,包括:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果,包括:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
进一步的,所述基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,包括:采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
第二方面,本发明实施例提供了一种基于图结构对抗学习的社交媒体谣言检测装置,包括:
获取模块,用于获取社交媒体中待检测消息的内容信息及社交网络结构;
检测模块,用于将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
进一步的,所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;所述装置包括:每次对一个样本执行如下步骤:
社交网络结构特征提取模块,用于建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
文本内容特征提取模块,用于对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
连接模块,用于将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
分类模块,用于基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;对所述样本集中的各样本,通过所述社交网络结构特征提取模块继续执行,得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
处理模块,用于确定所有原始消息的鉴别结果的准确率,所述社交网络结构特征提取模块继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
进一步的,所述社交网络结构特征提取模块,具体用于:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述文本内容特征提取模块,具体用于:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述分类模块,具体用于:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
进一步的,所述分类模块,具体用于:
采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一的方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一的方法。
本发明实施例有益效果:
本发明实施例提供的一种基于图结构对抗学习的社交媒体谣言检测方法及装置,检测器处于训练阶段在原始社交网络上以对抗训练的方式,模拟四种伪装策略,这样在训练阶段可以有效地降低伪装对检测器带来的影响,这样在使用阶段检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言,从而提高检测效果;并且,由于只需要将待检测消息的内容信息及社交信息作为检测器的输入,即可得到待检测消息的目标谣言检测结果,检测流程简单。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测方法的第一流程示意图;
图2为本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测方法的第二流程示意图;
图3为本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测方法的详细流程示意图;
图4为本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测装置的结构示意图;
图5为本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先,为了方便理解本发明实施例,在此先介绍一下本发明实施例中下文的使用术语“待检测消息”、“原始消息”、“原始社交网络结构”、“伪装后社交网络结构”、“伪装后社交网络结构”、“目标谣言检测结果”、“分类结果”及“鉴别结果”等。
上述待检测消息中的“待检测”和原始消息中的“原始”是为了区分两个消息。此消息包括内容信息和社交信息,其中内容信息可以但不限于包括:发表内容和评论内容,此发表内容和评论内容可以但不限于是文本、图片和视频中的一种或者多种来表;社交信息可以但不限于包括用户信息、图结构的社交网络结构等。其中,用户信息可以但不限于包括:对发表内容进行评论的用户以及发表内容的用户。对此消息可以但不限于是社交媒体上的任何消息,比如但不限于为一条微博或者一条特推。
进一步的,待检测消息为尚未确定是谣言或不是谣言的数据,这样此待检测消息需要使用检测器进行检测,才能知道消息的目标谣言检测结果。而原始消息为作为检测器的样本集中的一个样本,是此原始消息带有标签,此标签包括:用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签。使用此原始消息,通过对抗训练的方式训练,使得检测器能够学习到此样本是否是谣言的特征。本发明实施例将谣言检测的方法视为二分类问题,c∈{0,1}表示消息的类别标签,其中,c=1代表谣言的标签,c=0代表不是谣言的标签。这样训练得到一个二分类器f(·),检测获得的任一消息的标签,如果f(pi)=1,则分类结果表示消息pi是谣言,如果f(pi)=0则分类结果表示消息pi不是谣言,i表示序号,pi表示第i个消息,也就是任一消息。
上述“原始社交网络结构”中“原始”及“伪装后社交网络结构”中“伪装后”是为了区分两个社交网络结构。此社交网络结构可以包括:异质信息网络结构及同质信息网络结构。
进一步的,异质信息网络结构可以但不限于包含多种类型的节点或者多种类型的边的图。此异质信息网络使用G表示,G=(V,E,A),V表示异质信息网络中节点集合,E表示异质信息网络中边的集合A∈{0,1}|V|×|V|表示异质信息网络对应的原始社交网络结构,|V|表示异质信息网络中节点的数量。该异质信息网络中包含三类型的节点:用户节点、消息节点、评论节点。节点之间的边包括:(1)用户和该用户发表的消息之间存在连边;(2)用户和用户之间根据关注/被关注关系进行连边;(3)如果一条评论的内容是另一条评论的评论,那么这两条评论之间存在连边。简单起见,本发明实施例不考虑边的方向,所以异质信息网络G是一个无向图。
上述“目标谣言检测结果”中的“目标谣言检测”、“分类结果”中“分类”及“鉴别结果”中的“鉴别”是为了区分不同执行过程的三个结果。此三个结果均可以表示消息是谣言,或者不是谣言。此谣言为不符合事实的消息;非谣言为符合事实的消息。这样可以实现检测分类。
基于上述使用术语的介绍,下面继续对本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测方法进行介绍。
针对现有技术中基于特征工程的方法需要人工设计很多特征,这使得检测流程很复杂,并且检测效果欠佳的问题,本发明实施例提供一种基于图结构对抗学习的社交媒体谣言检测方法,检测器处于训练阶段在原始社交网络上以对抗训练的方式,模拟四种伪装策略,这样在训练阶段可以有效地降低伪装对检测器带来的影响,这样在使用阶段检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言,从而提高检测效果;并且,由于只需要将待检测消息的内容信息及社交信息作为检测器的输入,即可得到待检测消息的目标谣言检测结果,检测流程简单。
下面继续对本发明实施例提供的基于图结构对抗学习的社交媒体谣言检测方法进行介绍。
本发明实施例所提供的一种基于图结构对抗学习的社交媒体谣言检测方法,可以应用于社交媒体。此社交媒体是指互联网上基于用户关系的内容生产与交换平台,用于用户彼此之间用来分享意见、见解、经验和观点的工具和平台,社交媒体包括社交网站、微博、微信、博客、论坛、播客等等。在此不做限定。
如图1所示,本发明实施例所提供的一种基于图结构对抗学习的社交媒体谣言检测方法,该方法可以包括如下步骤:
步骤110,获取社交媒体中待检测消息的内容信息及社交网络。
步骤120,将待检测消息的内容信息及社交信息作为检测器的输入,通过检测器得到待检测消息的目标谣言检测结果,其中,目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,检测器是基于样本集,以对抗训练的方式训练得到的,样本集中一个样本为一个原始消息,原始消息包括原始内容信息和图结构的原始社交网络中的节点,通过在对抗训练的方式中增加伪装策略,以完成检测器的训练,伪装策略对应于各原始社交网络结构中变化的边。此处的伪装策略对应于各原始社交网络结构中变化的边,可以是指伪装策略对应于各原始社交网络结构中增删的边,也就是增加的边或删除的边。
对于本发明实施例而言,此节点可以包括:消息节点以及与用户节点及评论节点。相对于消息节点而言,相关节点是与消息节点相关联的节点,因此此节点也可以是包括:消息节点以及相关节点,所述相关节点包括:用户节点及评论节点。用户节点包括对发表内容进行评论的用户节点及发表内容的用户节点,消息节点为发表内容的节点。
上述样本集可以使用
Figure BDA0002543342610000101
表示,
Figure BDA0002543342610000102
其中,
Figure BDA0002543342610000103
表示样本集,p1表示第1个样本,pi表示第i个样本,p2表示第2个样本,
Figure BDA0002543342610000104
表示第
Figure BDA0002543342610000105
个样本,|·|中的·如果是集合,那么||表示取集合·的基数,也就是集合中元素的个数,因此
Figure BDA0002543342610000106
表示样本集中的样本数量,
Figure BDA0002543342610000107
的取值范围是自然数,i表示序号,
Figure BDA0002543342610000108
上述样本集的对发表内容进行评论的评论集合可以使用
Figure BDA0002543342610000109
表示,此评论集合只包括对发表内容进行评论的内容,不包括评论的用户,评论集合
Figure BDA00025433426100001010
其中,r1表示第i个样本的第1条评论,r2表示第i个样本的第2条评论,
Figure BDA00025433426100001011
第i个样本的第
Figure BDA00025433426100001012
条评论。上述社交媒体上的用户集合使用
Figure BDA00025433426100001013
表示,此社交媒体上的用户集合只包括:发表消息的用户和对该消息进行评论的评论用户,
Figure BDA00025433426100001014
其中,u1表示社交媒体上的第1用户,u2表示社交媒体上的第2用户,
Figure BDA00025433426100001015
表示社交媒体上的第
Figure BDA00025433426100001016
用户。
在本发明实施例中,检测器处于训练阶段在原始社交网络上以对抗训练的方式,模拟四种伪装策略,这样在训练阶段可以有效地降低伪装对检测器带来的影响,这样在使用阶段检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言,从而提高检测效果;并且,由于只需要将待检测消息的内容信息及社交信息作为检测器的输入,即可得到待检测消息的目标谣言检测结果,检测流程简单。
需要说明的是:对抗训练是一种训练模型的方式,在本发明实施例中,由两部分构成,这两部分属于同一个目标函数,但是一部分会最大化目标函数,另一部分会最小化目标函数。本发明实施例中的这两部分分别指的是攻击方和检测方。以下基于攻击方和检测方,对训练得到检测器进行说明:
作为攻击方,每次对所述一个样本执行如下步骤:
此处可以是从第一个样本开始,每次对一个样本执行,本次一个样本与上次一个样本不同;或者也可以对执行过的样本做标记,从任一样本开始,每次执行一个样本,本次一个样本为未标记的样本。各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签。
参见图2所示,步骤111,建立一个样本中消息节点与相关节点之间的关联;对建立关联的消息节点及相关节点,根据伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征。
为了模拟谣言散布者常用的伪装策略,基于以下四种伪装场景,本发明实施例将用户分为两类:正常用户和谣言散布者。发表或转发过至少一条谣言的人视为谣言散布者,其他人则是正常用户。本发明实施例支持以下四种伪装,如图3所示。
(1)、谣言散布者会买大量粉丝,这样在社交网络中就会有很多正常用户和谣言散布者有连接,事实上,本发明实施例认为粉丝数量越多的用户所发表的消息更值得信任。
(2)、谣言散布者会转发一些不是谣言的消息,也就是正常用户发表的消息,从而让自己的账号看起来是正常的,这也会使得自己发表的消息更有可信度。
(3)、谣言散布者发布谣言后可能引来负面的评论,此时谣言散布者可以通过删除对自己不利的评论,让谣言看起来更可信。
(4)、谣言散布者盗取或者购买正常账号,使用正常用户转发谣言,从而让谣言看起来更可信。
基于上述四种伪装,建立的伪装策略用于完成构建伪装后社交网络结构,其包括伪装类型、伪装行动遮罩、行为。其中,伪装类型用于反映各个伪装情况,本发明实施例包括四种伪装类型,其包括:谣言散布者与两个以上正常用户建立连接形成的伪装类型,谣言散布者伪装发表非谣言的消息形成的伪装类型,谣言散布者发表谣言的消息并删除该谣言的消息中非谣言的评论形成的伪装类型以及谣言散布者冒用正常用户转发谣言的消息形成伪装类型。为了正式地描述四种伪装类型,本发明实施例中定义谣言类型的具体表现形式可以为伪装类型矩阵,如下表1。
表1伪装类型矩阵
Figure BDA0002543342610000121
如表1所示,表1中的0表示对应的两种节点之间不能构成伪装,1表示对应的两种节点之间能构成伪装。上述节点包括:用户节点、消息节点、评论节点,用户节点包括:正常用户节点及谣言散布者节点,以及消息节点包括:非谣言节点及谣言节点。本发明实施例使用了大数据的统计规律,从而完成原始消息的学习以及待检测消息的谣言检测。
根据上述伪装类型矩阵的表格中的数字,可以形成上述伪装类型矩阵。基于伪装类型矩阵,本步骤111的一种可能的实现方式中,进一步的可以包括:获取伪装类型矩阵;根据伪装类型矩阵,确定在原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;根据伪装类型矩阵以及行动遮罩矩阵,改变原始社交网络结构中的边,得到改变后社交网络结构;根据伪装类型矩阵,确定改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;在改变后社交网络结构的基础上,建立行动遮罩及行为的对应关系;在原始社交网络结构及对应关系,得到伪装后社交网络结构;在伪装后社交网络中使用图卷积神经网络提取伪装后社交网络结构的特征。
其中,行动遮罩矩阵为用于表明在原始社交网络结构中的两个节点能否进行伪装。即,确定上述行动遮罩矩阵为M∈{0,1}|V|×|V|,其中,V表示社交网络中的节点集合,|·|中的·如果是集合,那么||表示取集合·的基数,也就是集合中元素的个数,因此|V|表示社交网络中节点的数量,Mij表示矩阵M的第i行第j列处的元素以及Mij的取值范围是0或者1。举例说明,Mij=1为节点ni和节点nj({ni,nj}∈V)之间能构成伪装;Mij=0表示节点ni和节点nj之间不能构成伪装。举例来说,因为表1中谣言节点和评论节点对应的值为1,如果节点ni是第i个节点,此节点ni为谣言节点,节点nj是第j个节点,此节点nj为评论节点,那么对应的Mij=1,i和j表示序号。
基于上述行动遮罩矩阵,上述根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构包括:
根据所述伪装类型矩阵以及所述行动遮罩矩阵,通过如下辅助矩阵,增加或删除所述原始社交网络结构中的边,得到改变后社交网络结构;其中,所述辅助矩阵C∈{-1,0,1,}|V|×|V|。辅助矩阵
Figure BDA0002543342610000131
其中,
Figure BDA0002543342610000132
表示的补图,
Figure BDA0002543342610000133
的取值范围{0,1},A表示原始社交网络结构,
Figure BDA0002543342610000134
11T表示两个矩阵相乘,一个矩阵是1,另一个矩阵是1T,1表示形状和A一样的全1矩阵,1T表示全1矩阵的转置,I是单位矩阵,(11T-I)表示全连接图。因为辅助矩阵
Figure BDA0002543342610000135
所以C+A会使得A中的所有元素(除了对角线上的元素),由0变为1或者由1变为0,这样便对应伪装策略中的添加边或者删除边。
为了方便使用上述辅助矩阵C将下面Aij和下面Sij进行统一,基于上述改变后社交网络结构,行为矩阵为用于表明改变后社交网络结构中的两个节点能否执行伪装的行为矩阵。即,确定上述行为矩阵为S∈{0,1}|V|×|V|。Sij表示矩阵S第i行第j列的元素,Sij的取值范围为{0,1},对应于节点而言,表示执行节点ni和节点nj之间的伪装关系。举例说明,如果Sij=1则表示执行节点ni和节点nj之间的伪装,如果Sij=0则表示不执行节点ni和节点nj之间的伪装。原始社交网络结构A,Aij表示矩阵A第i行第j列的元素,对应于节点而言,表示节点ni和节点nj之间的边关系,Aij=1表示节点ni和节点nj之间存在连边,Aij=0表示节点ni和节点nj之间不存在连边,Aij的取值范围为{0,1}。举个例子,如果Aij=1并且Sij=1,那么表示删除节点ni和节点nj之间的边,从而实现伪装,此时有Aij=0。
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系为
Figure BDA0002543342610000143
其中
Figure BDA0002543342610000144
表示对应位置的元素乘积。
事实上,只有当Mij=1,Sij=1时,才能执行具体的伪装,所以在原始社交网络结构及所述对应关系,得到伪装后社交网络结构为:
Figure BDA0002543342610000142
需要说明的是:A、M和C是根据样本集可以直接得到,而Sij会在训练过程中不断更新。为了降低优化的难度,缩短优化时间,本发明实施例将Sij∈{0,1}放缩到Sij∈[0,1],在之后的过程中,使用注意力机制获取S中的元素值。举例如下:
假设ni是第i个节点,此节点ni为消息节点,nj是第j个节点,此节点nj为正常用户节点。在本发明实施例中,所有类型的节点的向量初始长度都是d,vi表示ni的节点向量和vj表示nj的节点向量,
Figure BDA0002543342610000141
表示实数集。考虑到本发明实施例中异质信息网络结构的异质性。首先,通过Wpvi和Wuvj将vi和vj转换到相同的特征空间中,其中
Figure BDA0002543342610000151
是消息节点的参数矩阵,和
Figure BDA0002543342610000152
用户节点的参数矩阵,同理
Figure BDA0002543342610000153
表示评论节点的参数矩阵,此时便将vi转换成长度为d′的向量。然后,使用一个单层的神经网络g:
Figure BDA0002543342610000154
获取注意力系数
Figure BDA0002543342610000155
其中σ表示激活函数,比如ReLU,
Figure BDA0002543342610000156
Figure BDA0002543342610000157
分别表示消息节点和用户节点在注意力机制中的参数,同理
Figure BDA0002543342610000158
表示评论节点在注意力机制中的参数,eij表示节点nj对于节点ni的重要程度。再使用归一化指数函数softmax函数将
Figure BDA0002543342610000159
中各个节点对于节点ni的重要性进行归一化,其中,
Figure BDA00025433426100001510
表示能够与节点ni构成伪装的所有节点,得到
Figure BDA00025433426100001511
其中,αij表示节点nj对于节点ni的注意力系数,eij表示节点nj对于节点ni的重要程度,softmaxi(·)表示一种数学计算,可以叫归一化指数函数,eik表示节点nk对于节点ni的重要程度,eik中ik与eij中的ij用于区分两个e,i,j,k表示节点序号。本发明实施例中,节点nj对于节点ni越重要,那么αij的值越大。让Sij=αij,此时Sij表示节点nj和节点ni构成的伪装程度,这样将A′参数化。接下来本发明实施例会介绍如何提取社交网络结构特征。
步骤121,对一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征。
在本步骤121的一种可能的实现方式中,采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;采用卷积神经网络捕捉所述原始消息的词向量的语义信息,得到所述原始消息的特征图;使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征。
其中,为了能够很好地提取网络结构特征,可以采用图神经网络,比如,可以但不限于包括图卷积神经网络(Graph Convolutional Networks,简称GCN)和图注意力神经网络(Graph Attention Networks,简称GAT)。可选的,本发明实施例采用的图神经网络是GCN。
首先,在社交网络中加入自连接,即
Figure BDA0002543342610000161
其中,
Figure BDA0002543342610000162
表示增加了自连接伪装后社交网络结构。在GCN中,从第l层到第(l+1)层的传播公式是
Figure BDA0002543342610000163
其中,l表示卷积神经网络的层数,σ表示激活函数,比如ReLU,H(l)∈R|V|×d是第l层的激活矩阵,R表示实数,d表示节点向量的初始长度,H(0)等于节点向量矩阵B∈R|V|×d,度矩阵
Figure BDA0002543342610000164
中的元素
Figure BDA0002543342610000165
表示矩阵
Figure BDA0002543342610000166
中第i行第j列的元素,对应于节点而言,增加了自连接伪装后社交网络结构中节点ni和节点nj之间边的关系,W(l)是一个可训练的参数矩阵。本发明实施例使用一个两层的GCN提取社交网络结构特征
Figure BDA0002543342610000167
其中
Figure BDA0002543342610000168
表示对称归一化后的伪装后社交网络结构,
Figure BDA0002543342610000169
Figure BDA00025433426100001610
都是图卷积神经网络的参数矩阵,W(0)是图卷积神经网络第一层的参数矩阵,W(1)是图卷积神经网络第二层的参数矩阵,
Figure BDA00025433426100001611
是节点向量矩阵,d′表示节点向量的最终长度。本发明实施例使用
Figure BDA00025433426100001612
表示f(B,A)中的第i个节点向量,该向量表示消息pi的社交网络结构特征。
除了从伪装后社交网络结构A′中提取伪装后社交网络结构特征hi′,本发明实施例也从原始社交网络结构A中提取原始社交网络结构特征hi,之后伪装后社交网络结构特征hi′和文本内容特征连接,以及原始社交网络结构特征hi和文本内容特征连接,用于消息分类。
原始消息的最终特征的表示方式有多种,一种表示方式是通过从原始社交网络结构中提取原始社交网络结构的特征,并由所述原始社交网络结构的特征和原始内容信息的特征连接得到的原始消息的最终特征;另一表示方式是通过从伪装后社交网络结构中提取伪装后社交网络结构的特征,并由伪装后社交网络结构的特征和原始内容信息的特征连接得到的原始消息的最终特征,以此伪装后社交网络结构的特征和原始内容信息的特征连接,以得到原始消息的最终特征进行说明。
步骤131,将伪装后社交网络结构的特征及原始内容信息的特征连接,作为原始消息的最终特征。
为了得到原始消息的最终特征,本步骤131具体包括:
对消息的内容信息进行处理,获取消息的文本内容;其中,所述此处消息的文本内容仅包括发表的内容,不包括评论的内容。
对消息的文本内容进行预处理,得到填充后文本内容,其中,将文本内容的长度限制为L,截断超过L的部分文本内容,不足L的文本内容用零进行填充,得到填充后文本内容。
Figure BDA0002543342610000171
表示消息pi中第j个单词的词向量,消息pi的向量表示为
Figure BDA0002543342610000172
其中
Figure BDA0002543342610000173
表示长度L的消息pi中第j个单词的词向量,
Figure BDA0002543342610000174
表示消息pi中第1个单词的词向量,
Figure BDA0002543342610000175
表示消息pi中第2个单词的词向量,
Figure BDA0002543342610000176
表示消息pi中第L个单词的词向量。
然后,本发明实施例采用多头自注意力机制更新词向量,多头的自注意力机制可以从不同的角度挖掘词向量之间的联系。h表示自注意力的头的个数,考虑一个h头自注意力机制,j表示序号,对于第j个头的三个矩阵,分别是查询矩阵
Figure BDA0002543342610000177
键矩阵
Figure BDA0002543342610000178
和值矩阵
Figure BDA0002543342610000179
Figure BDA00025433426100001710
为例,方便起见本发明实施例将用X表示
Figure BDA00025433426100001711
那么有
Figure BDA00025433426100001712
Figure BDA00025433426100001713
其中
Figure BDA00025433426100001714
为自注意力机制中第j个头的键矩阵对应的参数矩阵,
Figure BDA00025433426100001715
为自注意力机制中第j个头的查询矩阵对应的参数矩阵,
Figure BDA00025433426100001716
为自注意力机制中第j个头的值矩阵对应的参数矩阵。第j个头的输出为
Figure BDA00025433426100001717
其中,
Figure BDA00025433426100001718
本发明实施例,将h头自注意力机制的输出表示为Z=[Z1;Z2;...;Zh],Z1为第1个头的输出,Z2为第2个头的输出,Zh为第h个头的输出,那么有Z=MultiHead(X,X,X)=Concat(Z1,...,Zh)WO,其中,
Figure BDA0002543342610000181
WO表示h头自注意力机制的参数矩阵,
Figure BDA0002543342610000182
再然后,本发明实施例使用卷积神经网络捕捉文本内容中的语义信息,使用卷积核
Figure BDA0002543342610000183
Figure BDA0002543342610000184
进行卷积,其中k表示卷积核的感受野大小,那么对于
Figure BDA0002543342610000185
中的所有词来说,卷积的过程可以表示为
Figure BDA0002543342610000186
其中,tj是卷积后得到的特征,*表示卷积操作,
Figure BDA0002543342610000187
是偏置项,σ是激活函数,比如tanh,e表示序数,比如表示消息pi中的第e个词,此处
Figure BDA0002543342610000188
表示消息pi中的第e个词到第e+k-1个词。使用W对
Figure BDA0002543342610000189
中所有可能的窗口进行卷积,最终得到pi的特征图t=[t1,t2,...,tL-k+1],其中,
Figure BDA00025433426100001810
t1表示卷积神经网络中第一个卷积窗口的输出特征,t2表示卷积神经网络中第二个卷积窗口的输出特征,tL-k+1表示卷积神经网络中第L-k+1个卷积窗口的输出特征。这样使用卷积神经网络处理文本中的词向量,从而获得文本内容的语义特征。
之后,使用步长为L-k+1的最大池化处理特征图t,得到文本内容特征
Figure BDA00025433426100001811
本发明实施例使用感受野大小为k∈{5,6,7}的卷积核对文本内容进行卷积,每种大小的感受野有d/3个,这样便会得到三个长度为d/3的特征向量,将这三个特征向量连接在一起得到消息pi最终的文本内容特征
Figure BDA00025433426100001812
作为原始内容信息的特征。
作为检测方,步骤141,基于原始消息的最终特征,鉴别原始消息是否为谣言,得到原始消息为谣言的概率以及不为谣言的概率的鉴别结果。
本步骤141在一种可能的实现方式中,第一步,基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;第二步,将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。第一步进一步包括:采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数中包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。具体说明如下:
对于消息pi,本发明实施例分别从原始社交网络结构A和伪装后社交网络结构A′中,分别得到伪装后社交网络结构特征hi′和原始社交网络结构特征hi,以及从原始内容信息对应文本内容中,得到了文本内容特征mi;将伪装后社交网络结构特征hi′和文本内容特征mi连接,得到Pi′=[hi′;mi],再将hi和mi连接得到Pi=[hi;mi],即原始消息的最终特征
Figure BDA0002543342610000191
Figure BDA0002543342610000192
接着,本发明实施例将原始消息的最终特征Pi′及Pi,分别经过两个全连接层,得到两个输出,
Figure BDA0002543342610000193
Figure BDA0002543342610000194
其中
Figure BDA0002543342610000195
是最终特征Pi′及Pi对应的系数矩阵,
Figure BDA0002543342610000196
是偏置项,
Figure BDA0002543342610000197
Figure BDA0002543342610000198
表示输入的消息为谣言的概率和输入的消息不为谣言的概率,最终将两个概率中较大概率的对应的类别作为检测器的分类结果。
之后,使用交叉熵作为总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器,其中所述总体损失函数包括:基于原始社交网络结构A得到的第一损失项
Figure BDA0002543342610000199
以及基于伪装后社交网络结构A′得到的第二损失项
Figure BDA00025433426100001910
总体损失函数表示为
Figure BDA00025433426100001911
其中,当消息pi是谣言时yi=[1,0]当消息pi不是谣言时yi=[0,1],N是参与训练的数据量,θs表示伪装后社交网络结构A′中的参数,不包括节点向量矩阵B,其余的参数用θd表示,β是超参数,用来控制
Figure BDA00025433426100001912
占总损失的比重大小,θs中的s与θd中的d用于区分两个参数,c为消息的标签,c=1表示谣言,c=1表示非谣言,
Figure BDA00025433426100001913
表示基于原始的社交网络得到的关于消息是谣言的概率和不是谣言的概率,
Figure BDA0002543342610000201
表示基于伪装后的社交网络得到的关于消息是谣言的概率和不是谣言的概率。
针对以上述总体损失函数作为目标函数
Figure BDA0002543342610000202
本发明实施例采用对抗训练的方式获取检测器的最终参数,对抗训练的过程是一个极大极小博弈过程,可以表示为
Figure BDA0002543342610000203
训练时先通过梯度上升的方法调整θs,从而最大化
Figure BDA0002543342610000204
然后再通过梯度下降的方法调整θd,从而最小化
Figure BDA0002543342610000205
经过多轮博弈后,便可得到最终的参数θs和θd
通过所述步骤121至所述步骤141,步骤151,对样本集中的各样本,得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
步骤161,确定所有原始消息的鉴别结果的准确率,返回步骤111继续执行;
步骤171,判断本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值是否大于预设阈值,为了方便描述,可以简称判断本轮准确率相较于上一轮准确率之间变化幅度的绝对值是否大于预设阈值。如果是,也就是,判定本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值是大于预设阈值,则步骤111继续执行;如果否,也就是判定本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,步骤181,训练得到检测器。其中,预设阈值可以是根据用户需要设置的,可选的,预设阈值在[2%至5%]的范围内取值。
上述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。比如,样本集总数为15000,是谣言的标签的原始消息总数为10000,不是谣言的标签的原始消息总数为5000,谣言的标签的原始消息总数占样本集总数的占比为2/3,不是谣言的标签的原始消息总数占样本集总数占比为1/3,所有原始消息的鉴别结果中得到原始消息为谣言的概率为1/3,所有原始消息的鉴别结果中得到原始消息不是谣言的概率为1/3,此1/3可能包括将原始消息为谣言的内容误识别为原始消息不是谣言,另外有1/3属于未能识别的原始消息。
因此,所有原始消息的鉴别结果中得到原始消息为谣言的概率为1/3,相较于谣言的标签的原始消息总数占比为2/3为50%;所有原始消息的鉴别结果中得到原始消息不为谣言的概率为1/3,相较于谣言的标签的原始消息总数占比不为1/3为100%。
再比如,样本集总数为15000,并且已知15000样本集带有标签,假设本发明实施例每次训练的时候使用128个样本,如果128个样本中有100个样本鉴别正确,那么准确率为100/128,下一次训练时再使用128个样本,同样根据这种方式计算准确率。这样可以更加快速的计算出准确率。当然准确率的计算方式并不限于此,任何可以实现本发明实施例准确率的计算方式,均属于本发明实施例的保护范围,在此不再赘述。
相较于相关技术中,单独使用社交网络结构特征存在风险,因为谣言散布者很可能通过各种伪装策略来改变社交网络结构,比如谣言散布者会买大量粉丝,这样在社交网络中就会有很多用户和谣言散布者有连接,事实上,本发明实施例往往认为粉丝数量越多的用户所发表的消息更值得信任;再比如,谣言散布者会转发一些正常的消息,从而让自己的账号看起来是正常的,这也会使得自己发表的消息更有可信度;所以谣言散布者能够通过不同的伪装手段刻意改变社交网络结构,进而导致谣言检测方法提取出的社交网络结构特征,误导最终的检测结果。这样直接使用社交网络结构特征存在风险,由于谣言散布者很可能通过各种伪装策略来改变社交网络结构,检测器如果不能识别社交网络中的伪装手段的话便可能做出错误的判断。
在本发明实施例中,检测器可以模拟谣言散布者常用的伪装策略,使得检测器在训练阶段可以调整自身参数去应对各种伪装策略,这样在测试阶段便可以有效地降低伪装对检测带来的影响;不仅如此,为了让检测器应对尽可能多的伪装方案,本发明实施例采用的对抗训练的方式。每一轮对抗时,攻击方都会采用新的伪装策略去降低检测器的检测效果,所以经过多轮对抗训练后,检测器已经针对各种不同的伪装策略采取防御。所以本发明实施例的检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略。
下面继续对本发明实施例提供的一种基于图结构对抗学习的社交媒体谣言检测装置进行介绍。
参见图4,图4为本发明实施例提供的一种基于图结构对抗学习的社交媒体谣言检测装置的结构示意图。本发明实施例所提供的一种基于图结构对抗学习的社交媒体谣言检测装置,可以至少包括如下模块:
获取模块11,用于获取社交媒体中待检测消息的内容信息及社交网络结构;
检测模块12,用于将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
在本发明实施例中,检测器处于训练阶段在原始社交网络上以对抗训练的方式,模拟四种伪装策略,这样在训练阶段可以有效地降低伪装对检测器带来的影响,这样在使用阶段检测器既考虑了社交网络中的伪装带来的影响,又能让检测器抵御尽可能多的不同的伪装策略,更加有效地检测谣言,从而提高检测效果;并且,由于只需要将待检测消息的内容信息及社交信息作为检测器的输入,即可得到待检测消息的目标谣言检测结果,检测流程简单。
在一种可能的实现方式中,所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;所述装置包括:每次对一个样本执行如下步骤:
社交网络结构特征提取模块,用于建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
文本内容特征提取模块,用于对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
连接模块,用于将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
分类模块,用于基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;对所述样本集中的各样本,通过所述社交网络结构特征提取模块继续执行,得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
处理模块,用于确定所有原始消息的鉴别结果的准确率,所述社交网络结构特征提取模块继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
在一种可能的实现方式中,所述社交网络结构特征提取模块,具体用于:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述文本内容特征提取模块,具体用于:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述分类模块,具体用于:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
在一种可能的实现方式中,所述分类模块,具体用于:
采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
本发明实施例定义了四种广泛使用的伪装策略,并自动学习在图形上生成伪装;然后,本发明实施例从每个消息中提取结构表示。除了结构信息外,本发明实施例还利用消息内容提取每个消息的文本表示形式,并将文本和结构表示形式融合在一起进行分类。具有伪装结构特征的分类损失将与具有非伪装结构特征的另一标准分类损失结合。为了优化这两个损失的总和,本发明实施例采用对抗性学习方法来端到端训练模型。流程图如图3所示。这样可以准确地模拟现实场景中的四种伪装策略,也使用文本内容特征和社交网络结构特征对消息进行检测。
下面继续对本发明实施例提供的电子设备进行介绍。
参见图5,图5为本发明实施例提供的电子设备的结构示意图。本发明实施例还提供了一种电子设备,包括处理器21、通信接口22、存储器23和通信总线24,其中,处理器21,通信接口22,存储器23通过通信总线24完成相互间的通信,
存储器23,用于存放计算机程序;
处理器21,用于执行存储器23上所存放的程序时,实现上述一种基于图结构对抗学习的社交媒体谣言检测方法的步骤,在本发明一个可能的实现方式中,可以实现如下步骤:
获取社交媒体中待检测消息的内容信息及社交网络结构;
将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
上述电子设备提到的通信总线可以是PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供的方法可以应用于电子设备。具体的,该电子设备可以为:台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定,任何可以实现本发明实施例的电子设备,均属于本发明的保护范围。
本发明实施例提供了一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的一种基于图结构对抗学习的社交媒体谣言检测方法的步骤。
本发明实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述的一种基于图结构对抗学习的社交媒体谣言检测方法的步骤。
本发明实施例提供了一种计算机程序,当其在计算机上运行时,使得计算机执行上述的一种基于图结构对抗学习的社交媒体谣言检测方法的步骤。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/存储介质/包含指令的计算机程序产品/计算机程序实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种基于图结构对抗学习的社交媒体谣言检测方法,其特征在于,包括:
获取社交媒体中待检测消息的内容信息及社交网络结构;
将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
2.如权利要求1所述的方法,其特征在于,所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,通过如下步骤,训练得到所述检测器:
各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;
每次对一个样本执行如下步骤:
步骤
Figure FDA0002543342600000011
建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
步骤
Figure FDA0002543342600000012
对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
步骤
Figure FDA0002543342600000013
将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
步骤
Figure FDA0002543342600000014
基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
对所述样本集中的各样本,通过所述步骤
Figure FDA0002543342600000015
至所述步骤
Figure FDA0002543342600000016
得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
确定所有原始消息的鉴别结果的准确率,返回步骤
Figure FDA0002543342600000021
继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
3.如权利要求2所述的方法,其特征在于,所述建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征,包括:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征,包括:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果,包括:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
4.如权利要求3所述的方法,其特征在于,所述基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,包括:采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
5.一种基于图结构对抗学习的社交媒体谣言检测装置,其特征在于,包括:
获取模块,用于获取社交媒体中待检测消息的内容信息及社交网络结构;
检测模块,用于将所述待检测消息的内容信息及社交信息作为检测器的输入,通过所述检测器得到所述待检测消息的目标谣言检测结果,其中,所述目标谣言检测结果为谣言的检测结果或不为谣言的检测结果,所述检测器是基于样本集,以对抗训练的方式训练得到的,所述样本集中一个样本为一个原始消息,所述原始消息包括原始内容信息和图结构的原始社交网络结构中的节点,通过在所述对抗训练的方式中增加伪装策略,以完成所述检测器的训练,所述伪装策略对应于各原始社交网络结构中变化的边。
6.如权利要求5所述的装置,其特征在于,
所述节点包括:消息节点以及与所述消息节点相关联的相关节点,所述相关节点包括:用户节点及评论节点,各样本带有标签,所述标签用于表示原始消息是谣言的标签和用于表示原始消息不是谣言的标签;所述装置包括:每次对一个样本执行如下步骤:
社交网络结构特征提取模块,用于建立所述一个样本中所述消息节点与所述相关节点之间的关联;对建立关联的所述消息节点及所述相关节点,根据所述伪装策略并基于注意力机制进行伪装,使用图卷积神经网络提取伪装后社交网络结构特征;
文本内容特征提取模块,用于对所述一个样本中的原始内容信息,使用自注意力机制和卷积神经网络,获取原始内容信息的特征;
连接模块,用于将伪装后社交网络结构的特征及原始内容信息的特征连接,作为所述原始消息的最终特征;
分类模块,用于基于所述原始消息的最终特征,鉴别所述原始消息是否为谣言,得到所述原始消息为谣言的概率以及不为谣言的概率的鉴别结果;对所述样本集中的各样本,通过所述社交网络结构特征提取模块继续执行,得到所有原始消息为谣言的概率以及不为谣言的概率的鉴别结果;
处理模块,用于确定所有原始消息的鉴别结果的准确率,所述社交网络结构特征提取模块继续执行,直至本轮所有原始消息的鉴别结果的准确率相较于上一轮所有原始消息的鉴别结果的准确率之间变化幅度的绝对值不大于预设阈值,以训练得到所述检测器,其中,所述所有原始消息的鉴别结果的准确率是指所有原始消息的鉴别结果相较于所述样本集中所有原始消息的标签的准确率。
7.如权利要求6所述的装置,其特征在于,所述社交网络结构特征提取模块,具体用于:
获取伪装类型矩阵;
根据所述伪装类型矩阵,确定在所述原始社交网络结构中的两个节点能否进行伪装的行动遮罩矩阵;
根据所述伪装类型矩阵以及所述行动遮罩矩阵,改变所述原始社交网络结构中的边,得到改变后社交网络结构;
根据所述伪装类型矩阵,确定所述改变后社交网络结构中的两个节点能否执行伪装的行为矩阵;
在所述改变后社交网络结构的基础上,建立所述行动遮罩及所述行为的对应关系;
在原始社交网络结构及所述对应关系,得到伪装后社交网络结构;
在伪装后社交网络中使用图卷积神经网络提取所述伪装后社交网络结构的特征;
所述文本内容特征提取模块,具体用于:
采用多头的自注意力机制,利用查询矩阵、键矩阵、值矩阵,确定所述原始消息的词向量;
采用卷积神经网络捕捉,所述原始消息的词向量的语义信息,得到所述原始消息的特征图;
使用预设步长的最大池化,处理所述特征图,得到文本内容特征,作为原始内容信息的特征;
所述分类模块,具体用于:
基于所述原始消息的最终特征,通过分类器,对所述原始消息进行分类,得到分类结果,其中所述分类结果为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率;
将所述分类结果,作为所述原始消息为谣言的概率以及所述原始消息不为谣言的概率的鉴别结果。
8.如权利要求7所述的装置,其特征在于,所述分类模块,具体用于:
采用总体损失函数,控制所述分类器的分类结果与所述分类器的所述原始消息的标签之间的交叉熵损失,向损失最小的方向进行调整所述分类器;其中,所述总体损失函数包括:基于原始社交网络结构,得到的第一损失项以及基于伪装后社交网络结构,得到的第二损失项;
基于所述原始消息的最终特征,通过所述调整后分类器,对所述原始消息分类,得到所述分类结果。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器,所述通信接口,所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN202010553467.4A 2020-06-17 2020-06-17 一种基于图结构对抗学习的社交媒体谣言检测方法及装置 Active CN111858928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010553467.4A CN111858928B (zh) 2020-06-17 2020-06-17 一种基于图结构对抗学习的社交媒体谣言检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010553467.4A CN111858928B (zh) 2020-06-17 2020-06-17 一种基于图结构对抗学习的社交媒体谣言检测方法及装置

Publications (2)

Publication Number Publication Date
CN111858928A true CN111858928A (zh) 2020-10-30
CN111858928B CN111858928B (zh) 2022-11-18

Family

ID=72987769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010553467.4A Active CN111858928B (zh) 2020-06-17 2020-06-17 一种基于图结构对抗学习的社交媒体谣言检测方法及装置

Country Status (1)

Country Link
CN (1) CN111858928B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380098A (zh) * 2020-11-19 2021-02-19 平安科技(深圳)有限公司 一种时序异常检测方法、装置、计算机设备及存储介质
CN112541081A (zh) * 2020-12-21 2021-03-23 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112765313A (zh) * 2020-12-31 2021-05-07 太原理工大学 一种基于原文和评论信息分析算法的虚假信息检测方法
CN112884062A (zh) * 2021-03-11 2021-06-01 四川省博瑞恩科技有限公司 一种基于cnn分类模型和生成对抗网络的运动想象分类方法及系统
CN113515634A (zh) * 2021-07-09 2021-10-19 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN114936285A (zh) * 2022-05-25 2022-08-23 齐鲁工业大学 基于对抗性多模态自动编码器的危机信息检测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009633A (zh) * 2017-12-15 2018-05-08 清华大学 一种面向跨领域智能分析的多网络对抗学习方法和系统
JP2018142325A (ja) * 2017-02-27 2018-09-13 澤蒼 顧 超深層回帰分析の機械学習モデルの構築方法、その装置、及びそのプログラム、及びそのプログラムが搭載された汎用モバイル端末装置
CN109325125A (zh) * 2018-10-08 2019-02-12 中山大学 一种基于cnn优化的社交网络谣言方法
CN109685153A (zh) * 2018-12-29 2019-04-26 武汉大学 一种基于特征聚合的社交网络谣言鉴别方法
CN110795641A (zh) * 2019-11-05 2020-02-14 重庆邮电大学 基于表示学习的网络谣言传播控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018142325A (ja) * 2017-02-27 2018-09-13 澤蒼 顧 超深層回帰分析の機械学習モデルの構築方法、その装置、及びそのプログラム、及びそのプログラムが搭載された汎用モバイル端末装置
CN108009633A (zh) * 2017-12-15 2018-05-08 清华大学 一种面向跨领域智能分析的多网络对抗学习方法和系统
CN109325125A (zh) * 2018-10-08 2019-02-12 中山大学 一种基于cnn优化的社交网络谣言方法
CN109685153A (zh) * 2018-12-29 2019-04-26 武汉大学 一种基于特征聚合的社交网络谣言鉴别方法
CN110795641A (zh) * 2019-11-05 2020-02-14 重庆邮电大学 基于表示学习的网络谣言传播控制方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380098A (zh) * 2020-11-19 2021-02-19 平安科技(深圳)有限公司 一种时序异常检测方法、装置、计算机设备及存储介质
CN112380098B (zh) * 2020-11-19 2024-03-19 平安科技(深圳)有限公司 一种时序异常检测方法、装置、计算机设备及存储介质
CN112541081A (zh) * 2020-12-21 2021-03-23 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112541081B (zh) * 2020-12-21 2022-09-16 中国人民解放军国防科技大学 一种基于领域自适应的可迁移谣言检测方法
CN112765313A (zh) * 2020-12-31 2021-05-07 太原理工大学 一种基于原文和评论信息分析算法的虚假信息检测方法
CN112765313B (zh) * 2020-12-31 2022-06-28 太原理工大学 一种基于原文和评论信息分析算法的虚假信息检测方法
CN112884062A (zh) * 2021-03-11 2021-06-01 四川省博瑞恩科技有限公司 一种基于cnn分类模型和生成对抗网络的运动想象分类方法及系统
CN112884062B (zh) * 2021-03-11 2024-02-13 四川省博瑞恩科技有限公司 一种基于cnn分类模型和生成对抗网络的运动想象分类方法及系统
CN113515634A (zh) * 2021-07-09 2021-10-19 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN113515634B (zh) * 2021-07-09 2023-08-01 福州大学 基于分层异质图神经网络的社交媒体谣言检测方法及系统
CN114936285A (zh) * 2022-05-25 2022-08-23 齐鲁工业大学 基于对抗性多模态自动编码器的危机信息检测方法及系统
CN114936285B (zh) * 2022-05-25 2024-07-12 齐鲁工业大学 基于对抗性多模态自动编码器的危机信息检测方法及系统

Also Published As

Publication number Publication date
CN111858928B (zh) 2022-11-18

Similar Documents

Publication Publication Date Title
CN111858928B (zh) 一种基于图结构对抗学习的社交媒体谣言检测方法及装置
CN110009174B (zh) 风险识别模型训练方法、装置及服务器
CN110473083B (zh) 树状风险账户识别方法、装置、服务器及存储介质
CN112861967B (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
Hu et al. Online social spammer detection
JP6594329B2 (ja) 顔表現のためのシステムおよび方法
CN111400452B (zh) 文本信息分类处理方法、电子设备及计算机可读存储介质
CN112000819A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN106874253A (zh) 识别敏感信息的方法及装置
CN112966763A (zh) 一种分类模型的训练方法、装置、电子设备及存储介质
CN111079930B (zh) 数据集质量参数的确定方法、装置及电子设备
CN111046949A (zh) 一种图像分类方法、装置及设备
CN111639696A (zh) 一种用户分类方法及装置
CN110795558B (zh) 标签获取方法和装置、存储介质及电子装置
Borkar et al. Real or fake identity deception of social media accounts using recurrent neural network
CN112560105B (zh) 保护多方数据隐私的联合建模方法及装置
CN111415167A (zh) 网络欺诈交易检测方法及装置、计算机存储介质和终端
Tian et al. Synergetic focal loss for imbalanced classification in federated xgboost
WO2020140687A1 (zh) 一种识别风险对象的方法、装置及设备
Xu et al. Smart real estate assessments using structured deep neural networks
CN113761286A (zh) 一种知识图谱的图嵌入方法、装置及电子设备
CN107402984B (zh) 一种基于主题的分类方法及装置
Sharma et al. Comparative analysis of different algorithms in link prediction on social networks
CN112559640B (zh) 图谱表征系统的训练方法及装置
CN112364258B (zh) 基于图谱的推荐方法、系统、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant