CN116843342A - 基于图神经网络的金融欺诈检测方法、装置、设备及介质 - Google Patents
基于图神经网络的金融欺诈检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116843342A CN116843342A CN202310805809.0A CN202310805809A CN116843342A CN 116843342 A CN116843342 A CN 116843342A CN 202310805809 A CN202310805809 A CN 202310805809A CN 116843342 A CN116843342 A CN 116843342A
- Authority
- CN
- China
- Prior art keywords
- node
- relation
- graph
- nodes
- fraud
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000003062 neural network model Methods 0.000 claims abstract description 38
- 238000010586 diagram Methods 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 34
- 230000002776 aggregation Effects 0.000 claims description 31
- 238000004220 aggregation Methods 0.000 claims description 31
- 230000007246 mechanism Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 230000004931 aggregating effect Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000379 polymerizing effect Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 3
- 239000000758 substrate Substances 0.000 claims 4
- 230000008569 process Effects 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 11
- 239000000284 extract Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Computer Security & Cryptography (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及金融欺诈检测技术领域,特别涉及一种基于图神经网络的金融欺诈检测方法、装置、设备及介质,其中方法包括:获取用户信息及用户关系数据;基于获取的用户信息及用户关系数据,构建多关系欺诈图;基于构建的多关系欺诈图,通过训练好的图神经网络模型进行检测,对多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户。本发明能够提高金融欺诈检测的查准率和查全率。
Description
技术领域
本发明涉及金融欺诈检测技术领域,特别涉及一种基于图神经网络的金融欺诈检测方法、装置、设备及介质。
背景技术
金融欺诈,指的是以非法占有为目的,采用虚构事实或隐瞒事实真相的方法,骗取公私财物或金融机构信用、破坏金融管理秩序的行为。在近几年来,数字支付的空前增长推动了欺诈和金融犯罪的衍生,给全球经济带来了令人震惊的损失,威胁着资本市场的效率与稳定。
由于金融欺诈往往呈现出团伙作案的聚集性现象,欺诈者之间往往存在着紧密的联系,因此,充分利用用户间的关系数据有助于进行欺诈检测。近年来,基于图神经网络的金融欺诈检测方法由于其对用户间关系数据的优秀建模能力,大幅提高了检测欺诈用户的准确率与召回率,吸引了众多研究者,逐渐成为检测金融欺诈的主流方法。
目前,基于图神经网络的金融欺诈检测方法虽然相较于其它欺诈检测方法具有明显优势,但仍然是基于图的同质性假设来进行的,难以适应异质关系图的应用场景,准确性、可靠性均有待提高。
发明内容
针对现有基于图神经网络的金融欺诈检测方法难以适应异质性关系图应用场景的问题,本发明实施例提供了一种基于图神经网络的金融欺诈检测方法、装置、设备及介质,能够针对异质性关系图进行处理,提高金融欺诈检测的查准率和查全率。
第一方面,本发明实施例提供了一种基于图神经网络的金融欺诈检测方法,包括:
获取用户信息及用户关系数据;
基于获取的用户信息及用户关系数据,构建多关系欺诈图;所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的;所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
基于用于分类的节点表示,得到相应的分类结果。
可选地,单个邻居节点的多频率信息,采用如下方式进行提取,包括:
以Beta小波作为卷积核,通过改变对应的概率密度函数的参数,提取邻居节点在多个不同频率范围内的信息。
可选地,所述聚合得到单个邻居节点的待聚合表示,包括:
针对单个邻居节点,利用注意力机制,计算不同频率信息相对于待检测节点的注意力权重;
基于不同频率信息及对应的注意力权重,加权求和得到单个邻居节点的待聚合表示。
可选地,所述基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息,包括:
利用注意力机制,计算一幅关系图中所有邻居节点的待聚合表示相对于待检测节点的注意力权重;
基于所有邻居节点的待聚合表示及对应的注意力权重,加权求和得到相关节点综合信息。
可选地,所述基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示,包括:
利用注意力机制,计算每幅关系图对应的相关节点综合信息相对于待检测节点的注意力权重;
基于每幅关系图对应的相关节点综合信息及对应的注意力权重,加权求和得到用于分类的节点表示。
可选地,所述图神经网络模型在训练过程中使用加权交叉熵损失作为损失函数。
可选地,所述图神经网络模型采用MLP层输出每个节点的分类概率,若分类概率高于预设阈值,则判断节点对应的用户为欺诈用户,否则判断节点对应的用户为正常用户。
第二方面,本发明实施例还提供了一种基于图神经网络的金融欺诈检测装置,包括:
数据获取模块,用于获取用户信息及用户关系数据;
图构建模块,用于基于获取的用户信息及用户关系数据,构建多关系欺诈图;所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
节点检测模块,用于基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的;所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
基于用于分类的节点表示,得到相应的分类结果。
第三方面,本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本说明书任一实施例所述的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书任一实施例所述的方法。
本发明实施例提供了一种基于图神经网络的金融欺诈检测方法、装置、电子设备及存储介质,本发明构建并训练图神经网络模型进行检测,所述图神经网络模型提取相关节点的多频率信息,再通过三层聚合得到分类的节点表示,最终实现节点分类,以判定相应的用户是否为欺诈用户;本发明能够针对异质性关系图进行处理,通过改变图神经网络的信息提取及聚合策略,充分利用同类与非同类邻居节点的有效信息,提高金融欺诈检测的查准率和查全率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于图神经网络的金融欺诈检测方法流程图;
图2是本发明一实施例提供的一种图神经网络模型结构示意图;
图3是本发明一实施例提供的一种电子设备的硬件架构图;
图4是本发明一实施例提供的一种基于图神经网络的金融欺诈检测装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
基于图神经网络的金融欺诈检测方法由于其对用户间关系数据的优秀建模能力,大幅提高了检测欺诈用户的准确率与召回率,吸引了众多研究者,逐渐成为检测金融欺诈的主流方法。图神经网络的效果好坏很大程度上依赖于图的同质性假设,在欺诈检测问题中,同质性假设认为节点更倾向于与其同类节点产生连接,欺诈节点的邻居节点中往往存在着更多的欺诈节点。因此,可以利用同类邻居节点的信息来放大欺诈节点自身的信息特征,以便更好地识别欺诈者。但在实际情况中,由于欺诈者行为的伪装性,金融关系图常呈现出异质性特点,主要体现在欺诈用户倾向于与正常用户建立连接,规避其它欺诈节点来伪装自己。在这种情况下,传统的图神经网络检测方法会平滑各个节点的特征表示,导致难以区分出欺诈节点与正常节点。
另外,在关系图中,欺诈节点往往只占全部节点的很小一部分,甚至占比不到1%,导致类别分布严重不平衡。欺诈节点的缺少导致在聚合时缺少欺诈类别特征,无法有效增强欺诈节点的欺诈特征用于识别。
如前所述,目前基于图神经网络的金融欺诈检测方法仍然是基于图的同质性假设来进行的。由于欺诈用户行为的复杂性以及数据的长尾分布等问题,导致金融欺诈检测面临着两个主要难点:(1)关系图不满足同质性假设,呈现出异质性的特点;(2)关系图中节点类别严重不平衡。如何基于异质金融关系图,针对其中动机更强、形式更阴险、计划更狡猾的金融欺诈行为,提出契合度更高、鲁棒性更强的欺诈检测方法,成为亟待解决的关键问题。
有鉴于此,本发明提出了一种专门针对异质关系图的金融欺诈检测方法,通过改变图神经网络的聚合策略,充分利用同类与非同类邻居节点的有效信息,以提高金融欺诈检测的查准率和查全率。
下面描述以上构思的具体实现方式。
请参考图1,本发明实施例提供了一种基于图神经网络的金融欺诈检测方法,该方法包括:
步骤100,获取用户信息及用户关系数据;
用户信息,即用户的个人资料,包括例如姓名、住址、账户余额等属性特征;
用户关系数据包括相关用户及用户间关系,用户间关系可包括多种类型的关系,如交易关系、转账关系、社交关系等,可根据具体情况设置;
步骤102,基于获取的用户信息及用户关系数据,构建多关系欺诈图;
所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
例如,若用户A与用户B之间只存在社交关系,用户A与用户C之间只存在转账关系,则在构建的多关系欺诈图中,对应社交关系的一幅关系图里,代表用户A的节点a与代表用户B的节点b之间存在边,代表用户C的节点c与节点a之间则不存在边,而在对应转账关系的另一幅关系图里,节点a与节点c之间存在边,节点a与节点b之间则不存在边;关系图通常以矩阵形式表示及存储;
步骤104,基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
利用训练好的图神经网络模型对输入的所述多关系欺诈图中的每个节点进行分类判断,即可判断节点对应的用户是否为欺诈用户。
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的。样本多关系欺诈图即确定了图中各个节点分类结果的多关系欺诈图,可根据现有的数据集构建。
为实现对多关系欺诈图中的各个节点进行分类判断,所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
步骤104-0,对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
邻居节点,即在一幅关系图中与待检测节点(或称中心节点)同过一条边直接相连的节点;待检测节点在一幅关系图中可能有若干个邻居节点,在不同关系图中的邻居节点可能不同;此步骤104-0旨在针对每个邻居节点,提取邻居节点的不同频率的信息;
步骤104-2,对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
此步骤104-2对每幅关系图中确定的所有邻居节点,分别进行频率信息聚合,将一个邻居节点的多频率信息聚合得到该邻居节点的待聚合表示,待聚合表示中综合了该邻居节点在不同频率范围的信息;
步骤104-4,对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
此步骤104-2对待检测节点在每幅关系图中对应的所有邻居节点的待聚合表示进行聚合,也就是综合一幅关系图中待检测节点所有邻居节点的相关信息,得到相关节点综合信息;
步骤104-6,基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
此步骤104-6对所述多关系欺诈图中所有关系图对应的相关节点综合信息进行聚合,得到最终用来分类的节点表示;
步骤104-8,基于用于分类的节点表示,得到相应的分类结果。
在同质性假设下,节点更倾向于与其同类节点产生连接,而同类节点之间的表示往往比较相近,在这种情况下,关系图中包含的低频信息占主导。图神经网络在聚合的过程中可以有效利用邻居结构中的低频信息,即节点之间共性的、相似的信息来增强中心节点表示。但在由于欺诈者在特征以及拓扑关系伪装形成的异质金融关系图中,中心节点与邻居节点往往不再相似,甚至存在着较大的差异,导致关系图中存在大量高频信号,即节点间的差异信息。传统的图神经网络检测方法无法有效地提取和利用这些高频信息,仅仅利用低频信息进行检测,在异质关系图中的表现难以达到预期。本发明实施例针对关系图异质性的特点,对待检测节点的每个邻居节点提取不同频率的信息,也就是说,既提取了低频的、表示相似性的信息,也提取了高频的、表示差异性的信息,然后再通过逐层级聚合,综合中心节点在多关系欺诈图中所有邻居节点的不同频率信息,最终得到用于分类的节点表示。本发明充分利用了同类与非同类邻居节点的有效信息,可提高金融欺诈检测的查准率和查全率。
可选地,步骤104-0中,单个邻居节点的多频率信息,采用如下方式进行提取,包括:
小波变换(Wavelet Transform)通过在不同尺度上对图信号进行分解,从而提取不同频段的信息。小波变换需要选择适当的小波基函数,通过该函数与图信号进行卷积运算来提取频段信息。本发明将Beta分布的不同参数设置形式作为小波基函数来进行频率信息提取,因此称之为Beta小波(Beta Wavelets,或β小波)。以Beta小波作为卷积核,通过改变对应的概率密度函数的参数,提取邻居节点在多个不同频率范围内的信息。
Beta小波对应的概率密度函数表达式如下:
其中,ω表示频率,p和q是Beta分布的两个形状参数,p决定了分布的形状的偏斜程度,q决定了分布的峰度,B()表示Beta函数,用于规范化,βp,q(ω)表示Beta分布的概率密度函数值,也即频率值为ω的概率。当对p或q的数值进行修改时,该分布的形状也会发生改变,当p+q的值固定为4时,随着p的增大及q的减小,概率密度函数从低频区域逐渐向高频区域进行移动。因此,可以通过改变概率密度函数中p,q值来提取不同频率范围中的信息。
进一步地,通过改变对应的概率密度函数的参数,提取邻居节点在多个不同频率范围内的信息,包括:
设p+q的值为固定的预设值,得到多组不同的(p,q)值;
基于各组不同的(p,q)值所对应的概率密度函数,提取邻居节点在多个不同频率范围内的信息。
具体的,p+q的值(即预设值)可固定为4,得到的多组不同的(p,q)值可选(0,4)、(1,3)、(2,2)和(3,1),进而基于各组不同的(p,q)值所对应的概率密度函数分别提取邻居节点的不同频率信息,对每个邻居节点,可得到4组不同频率范围的信息。
根据信号在谱域中的傅里叶变换公式,可得到图卷积的一般公式为:
g*x=Ugθ(Λ)UTx
其中,x表示输入的信号,在关系图中是一个个节点向量表示,g表示卷积核,*表示卷积运算;gθ()表示所使用卷积核的概率密度函数,Λ表示关系图的拉普拉斯矩阵所对应的特征值构成的对角矩阵,U表示关系图的拉普拉斯矩阵所对应的特征向量矩阵,N表示对应特征值的个数,UT表示U的转置矩阵。
根据上述公式,可得到将Beta小波作为卷积核的变换矩阵为:
其中,Wp,q表示变换矩阵,βp,q()表示Beta分布的概率密度函数,L表示关系图的拉普拉斯矩阵;
节点特征向量(即邻居节点的节点特征)通过该变换矩阵就可以得到对应频率范围的特征向量表示(即提取后的、在一定频率范围内的频率信息),通过改变p,q值,设计多组变换矩阵,即可实现对多频率信息的提取,将最终提取得到的结果用表示,Nfrequency表示当前不同频率的数量。
上述实施例利用Beta小波作为卷积核提取邻居节点的多频率信息,通过改变概率密度函数中的参数,实现有效地利用从低频段到高频段的不同频率信息,实现方式简单,且有利于保留不同频率信息间的深层关联。在其他实施例中,也可采用其他形式的卷积核来提取不同频率信息,只是实现方式相对复杂。通过设置参数可变的Beta小波作为卷积核,所述图神经网络模型有效综合利用多频率信息,在充分适配异质金融关系图场景的同时,也能在同质图上取得优秀的结果。
可选地,步骤104-2中,聚合得到单个邻居节点的待聚合表示,包括:
针对单个邻居节点,利用注意力机制,计算不同频率信息相对于待检测节点的注意力权重,表达式为:
其中,αi表示第i个频率信息相对于待检测节点的注意力权重,zi表示第i个频率信息,Nfrequency表示当前不同频率的数量,i=1,...,Nfrequency,aT表示可学习的参数矩阵,用于在训练过程中不断更新学习,σ()表示sigmoid函数,用作非线性激活函数,将输出限制在[0,1]范围内,||表示特征向量的拼接,X表示中心节点的特征向量;
基于不同频率信息及对应的注意力权重,加权求和得到单个邻居节点的待聚合表示,表达式为:
其中,Zx,j表示当前计算的第j个邻居节点相对于中心节点x的待聚合表示。
通过Beta小波提取邻居节点的多频率信息之后,由于中心节点和各邻居节点的相似性与差异性不同,因此重点关注的频率信息也不同。比如,相似的节点之间往往倾向于聚合低频信息,而差异比较大的节点之间则更关注彼此之间的高频信息。因此,有必要对提取出来的不同频率范围的信息有所侧重。上述实施例利用注意力机制计算邻居节点不同频率信息表示相对于中心节点表示的注意力权重,加权求和后得到该邻居节点的待聚合表示,能够有效关注不同频率信息,放大关键频率范围的信息,避免重点的高频信息被平滑掉。在其他实施例中,也可采用其他聚合方式得到单个邻居节点的待聚合表示。
可选地,步骤104-4中,基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息,包括:
利用注意力机制,计算一幅关系图中所有邻居节点的待聚合表示相对于待检测节点的注意力权重;
基于所有邻居节点的待聚合表示及对应的注意力权重,加权求和得到相关节点综合信息。
由于待检测节点的邻居节点中,并不是所有节点都拥有着同样的重要性,因此,优选利用注意力机制对一幅关系图对应的所有邻居节点的待聚合表示进行聚合,以便更加关注于那些相关性更高的邻居节点,其公式如下:
其中,x表示中心节点,Nneighbor表示邻居节点的个数,Zx,j表示节点x对应的第j个邻居节点待聚合表示,γj表示第j个邻居节点待聚合表示相对于待检测节点(即中心节点x)的注意力权重,j=1,...,Nneighbor,AGGneighbor()表示对于邻居节点表示的聚合函数,Hr表示中心节点聚合后的特征向量,也即相关节点综合信息,对应第r幅关系图。
上述实施例利用注意力机制关注不同邻居节点,放大相关性更高的关键邻居节点对中心节点的影响,以提高检测性能。在其他实施例中,也可采用其他聚合方式得到相关节点综合信息。
可选地,步骤104-6中,聚合得到待检测节点对应的、用于分类的节点表示,进一步包括:
利用注意力机制,计算每幅关系图对应的相关节点综合信息相对于待检测节点的注意力权重;
基于每幅关系图对应的相关节点综合信息及对应的注意力权重,加权求和得到用于分类的节点表示。
由于在金融关系图中,用户之间可能存在多种不同类型的关系,而上述过程对不同关系的关系图是单独进行处理的。假设总计有R幅关系图,经过步骤104-4的聚合之后,同一个节点会得到R个不同关系图下的聚合表示。不同关系图的重要性可能也不同。在金融欺诈检测中,用户间的转账关系图可能比社交关系图更加重要,因为欺诈者可能在完成欺诈行为后,将金额通过多次小笔转账分散到多个欺诈账户中。优选同样也使用注意力机制进行聚合,其公式如下:
其中,Xfinal表示对多幅关系图对应的相关节点综合信息进行聚合得到的、最终用于分类的节点表示,AGGrelation()表示对于不同关系图中中心节点表示的聚合函数,λr表示第r幅关系图对应的相关节点综合信息相对于待检测节点的注意力权重,r=1,...,R,R表示关系图的数量,Hr表示第r幅关系图对应的相关节点综合信息。
上述实施例利用注意力机制关注不同关系图,放大关键关系信息。采用基于多频信息自适应聚合策略的检测方法,能够有效提高检测准确率。在其他实施例中,也可采用其他聚合方式得到用于分类的节点表示。
可选地,所述图神经网络模型在训练过程中使用加权交叉熵损失作为损失函数,损失函数Loss的表达式为:
其中,wc表示节点类别概率的倒数,yi,c表示当前节点类别为c的实际概率,取值为0或1,表示当前节点类别为c的预测概率,取值在[0,1]范围内,Ntrain表示训练集的节点个数,C表示所有节点的类别总数。
由于欺诈者数量占比小,且其行为具有复杂性、伪装性,金融关系图存在不满足同质性假设和标签分布严重倾斜的问题,导致一般的图神经网络无法有效地对该类异质性关系图进行处理。为了解决节点类别严重不平衡而导致的模型对欺诈节点分类效果差的问题,上述实施例在模型训练过程中使用加权交叉熵损失作为损失函数,在计算节点对应类别损失时,通过乘以对应的节点类别概率的倒数wk,来增加少数类别节点的损失项,加强对少数类别节点的关注度,减少类别严重倾斜分布所导致的对少数类别分类效果不佳问题的影响。
可选地,所述图神经网络模型采用MLP(多层感知机)层输出每个节点的分类概率,若分类概率高于预设阈值,则判断节点对应的用户为欺诈用户,否则判断节点对应的用户为正常用户。
采用MLP(多层感知机)层输出每个节点的分类概率,节点的分类概率是一个范围在[0,1]的小数,预设阈值优选为0,5,如果该数值大于0.5,那么将会被分类为欺诈用户,反之则会被认为是正常用户。其他实施例中,也可根据需要调整具体的预设阈值。
一个具体的实施例中,为得到所述图神经网络模型,本发明采用如下方式对其进行训练:
步骤S1:获取训练数据。
在模型训练的过程中,训练数据的质量和数量很大程度上决定了模型表现的上限,充分的数据才能够训练出优秀的模型。本发明收集了网络上公开的金融欺诈检测数据集:YelpChi和Amazon。这两个数据集均是包含了三种关系的异质金融图数据,存在数万个用户节点以及百万级的关系边。
步骤S2:划分数据集。
为了保证最终评测结果的公平性,在进行数据集划分时,每个图数据集中的节点以6:2:2的比例随机划分为训练集、验证集以及测试集。
步骤S3:训练模型。
在训练集上训练模型,选取的评估指标为F1-macro以及AUC值,并在验证集上进行模型的评估,选择验证集上表现最优的模型在测试集上进行测试。为了解决节点类别严重不平衡导致的模型对欺诈节点分类效果差的问题,在模型训练过程中使用加权交叉熵损失作为损失函数。一种图神经网络模型如图2所示,主要分为三大块内容,其一为输入,用于获取样本多关系欺诈图,多关系欺诈图包括多幅关系图,图2中以u表示中心节点,在关系图1中v为u的邻居节点,在关系图2中e为u的邻居节点;其二为多频率聚合,对应上述步骤104-0至步骤104-6,为便于显示,图2中多频率抽取模块用于执行步骤104-0,当p+q的值固定为4,得到的多组不同的(p,q)值可选(0,4)、(1,3)、(2,2)和(3,1)时,根据Beta小波(图2中λ表示频率,gθ(λ)表示概率密度函数)的特点,对于u的邻居节点v可得到至/>分别对应(p,q)值为(0,4)、(1,3)、(2,2)和(3,1)时的多频率信息,对于邻居节点e同理,可得到/>至分别对应(p,q)值为(0,4)、(1,3)、(2,2)和(3,1)时的多频率信息,多频率注意力模块用于执行步骤104-2和步骤104-4,基于多频率信息得到u各邻居节点的待聚合表示,再聚合得到u在关系图1对应的相关节点综合信息/>(/>根据u在关系图1中的所有邻居节点e、f、g、h、v对应的待聚合表示/>至/>聚合得到,/>由/>至/>聚合得到),u在关系图2对应的相关节点综合信息/>(/>根据u在关系图2中的所有邻居节点f、g、h、e对应的待聚合表示/>至/>聚合得到,/>由/>至/>聚合得到),其三为多关系图(即多关系欺诈图)聚合与预测,欺诈多关系图聚合模块用于执行步骤104-6,多层感知机用于执行步骤104-8,得到分类结果/>
本发明利用公开的金融欺诈检测数据集Amazon和YelpChi对本发明提供的检测方法进行了测试。Amazon数据集有三种类型边:U-P-U(至少评论一款相同产品的用户)、U-S-U(一周内至少有一个相同星级评价的用户)和U-V-U(相互评论相似性排名前5%的用户);YelpChi数据集同样存在三种类型边:R-U-R(同一用户发布的评论)、R-S-R(同一产品下相同星级的评论)以及R-T-R(同一月发布在同一产品下的评论)。另外,本发明还在金融领域的关系图数据集T-Finance上进行了测试,T-Finance旨在发现交易网络中的异常账户。
本发明选用了近几年在欺诈检测领域的基于同质性假设的SOTA模型CARE-GNN、PC-GNN和FRAUDRE以及针对异质关系图的SOTA模型H2-FDetector作为基准对比模型,并使用AUC值作为最终的评价指标。根据测试结果,首先,相对于基于同质性假设的图欺诈检测模型,针对异质关系图的模型(即本发明提供的图神经网络模型)在四个数据集上的AUC值均有较大的提升,这充分说明了对于关系图的异质性特点,不能再使用传统的聚合策略来聚合邻居节点的低频信息,而需要利用好高频信息帮助分类。另外,相比于22年的SOTA模型H2-FDetector,本发明提供的图神经网络模型在四个数据集上的AUC值均有提升,在Amazon数据集上提升了0.42%,在Yelp数据集上提升了2.5%,在T-Finance数据集上提升了1.95%。并且,本发明还通过消融实验来验证了所述图神经网络模型利用高频信息的有效性,通过控制Beta小波卷积核的参数,使其只提取低频信息,在Amazon和YelpChi数据集上的AUC值分别下降了0.38%和3.0%。
如图3、图4所示,本发明实施例提供了一种基于图神经网络的金融欺诈检测装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的一种基于图神经网络的金融欺诈检测装置所在电子设备的一种硬件架构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在电子设备的CPU将非易失性存储器中对应的计算机程序读取到内存中运行形成的。本实施例提供的一种基于图神经网络的金融欺诈检测装置,包括:
数据获取模块401,用于获取用户信息及用户关系数据;
图构建模块402,用于基于获取的用户信息及用户关系数据,构建多关系欺诈图;所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
节点检测模块403,用于基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的;所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
基于用于分类的节点表示,得到相应的分类结果。
在本发明实施例中,数据获取模块401可用于执行上述方法实施例中的步骤100,图构建模块402可用于执行上述方法实施例中的步骤102,节点检测模块403可用于执行上述方法实施例中的步骤104。
可选地,单个邻居节点的多频率信息,采用如下方式进行提取,包括:
以Beta小波作为卷积核,通过改变对应的概率密度函数的参数,提取邻居节点在多个不同频率范围内的信息。
可选地,所述聚合得到单个邻居节点的待聚合表示,包括:
针对单个邻居节点,利用注意力机制,计算不同频率信息相对于待检测节点的注意力权重;
基于不同频率信息及对应的注意力权重,加权求和得到单个邻居节点的待聚合表示。
可选地,所述基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息,包括:
利用注意力机制,计算一幅关系图中所有邻居节点的待聚合表示相对于待检测节点的注意力权重;
基于所有邻居节点的待聚合表示及对应的注意力权重,加权求和得到相关节点综合信息。
可选地,所述基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示,包括:
利用注意力机制,计算每幅关系图对应的相关节点综合信息相对于待检测节点的注意力权重;
基于每幅关系图对应的相关节点综合信息及对应的注意力权重,加权求和得到用于分类的节点表示。
可选地,所述图神经网络模型在训练过程中使用加权交叉熵损失作为损失函数。
可选地,所述图神经网络模型采用MLP层输出每个节点的分类概率,若分类概率高于预设阈值,则判断节点对应的用户为欺诈用户,否则判断节点对应的用户为正常用户。
可以理解的是,本发明实施例示意的结构并不构成对一种基于图神经网络的金融欺诈检测装置的具体限定。在本发明的另一些实施例中,一种基于图神经网络的金融欺诈检测装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各模块之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
本发明实施例还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现本发明任一实施例中的一种基于图神经网络的金融欺诈检测方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被处理器执行时,使所述处理器执行本发明任一实施例中的一种基于图神经网络的金融欺诈检测方法。
具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展模块上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
综上,本发明提出了一种基于图神经网络的金融欺诈检测方法、装置、设备及介质,针对金融关系图的异质性特性,提高欺诈用户的检测准确率。
在本发明的一个实施例中,本发明针对于由于欺诈者的伪装现象导致的异质性金融关系图中高频信息占主导,基于同质性假设的传统图神经网络在聚合时没有充分的低频相似信息可利用,导致检测准确率不尽人意的问题,设计一种基于多频信息的自适应聚合策略,来准确提取和利用邻居节点中的不同频段信息。该聚合策略将Beta小波作为卷积核,其特点是具有高频部分和相对平缓的低频部分,可以通过控制其概率密度函数参数p,q来提取信号中从低频到高频的不同频率成分用来自适应地聚合。
在本发明的一个实施例中,本发明充分利用了注意力机制的强大建模能力,分别在频率级别、节点级别以及关系级别进行了注意力操作,得到最终用于分类的高质量节点表示。由于中心节点可能对邻居节点不同频率成分有着不同的关注度,如:两个类别相同的节点表示可能更相似,在聚合过程中关注的是低频的相似信息;而两个类别不同的节点表示可能有很大区别,因此更加关注高频的差别信息。当提取得到邻居节点的不同频率成分的向量表示后,通过频率级别的注意力机制为每一个频率表示计算其相对于中心节点表示的注意力权重(代表该频率对于中心节点的重要性),再将该权重与每个频率表示加权求和得到该邻居节点的待聚合信息表示。在得到所有邻居节点的待聚合信息表示之后,通过节点级别的注意力机制对相关性更强的节点聚合更多的信息,而对于那些相关性不强的节点聚合更少的信息。如:欺诈节点为了加入更多的欺诈信息,对邻居节点的欺诈节点会更加关注。在多关系欺诈图中,每个节点存在着不同关系的边,不同关系的重要性可能不同,因此通过关系级别的注意力对同一节点的不同关系图下的聚合表示进行聚合,得到该节点的最终用于分类的向量表示。
在本发明的一个实施例中,本发明考虑到金融关系图的欺诈节点和正常节点存在着类别严重不平衡的问题,欺诈节点往往占总节点的10%以下,甚至不到1%。类别不平衡会导致训练损失受多数类样本支配,模型对少数节点类别的分类结果较差的问题,而往往少数节点类别才应是关注的重点。因此为了解决该问题,本发明在训练过程中采用了加权交叉熵损失,通过放大少数类别样本的损失,缩小多数类样本的损失来使模型更加关注少数类别的分类准确率。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于图神经网络的金融欺诈检测方法,其特征在于,包括:
获取用户信息及用户关系数据;
基于获取的用户信息及用户关系数据,构建多关系欺诈图;所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的;所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
基于用于分类的节点表示,得到相应的分类结果。
2.根据权利要求1所述的方法,其特征在于,
单个邻居节点的多频率信息,采用如下方式进行提取,包括:
以Beta小波作为卷积核,通过改变对应的概率密度函数的参数,提取邻居节点在多个不同频率范围内的信息。
3.根据权利要求1所述的方法,其特征在于,
所述聚合得到单个邻居节点的待聚合表示,包括:
针对单个邻居节点,利用注意力机制,计算不同频率信息相对于待检测节点的注意力权重;
基于不同频率信息及对应的注意力权重,加权求和得到单个邻居节点的待聚合表示。
4.根据权利要求3所述的方法,其特征在于,
所述基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息,包括:
利用注意力机制,计算一幅关系图中所有邻居节点的待聚合表示相对于待检测节点的注意力权重;
基于所有邻居节点的待聚合表示及对应的注意力权重,加权求和得到相关节点综合信息。
5.根据权利要求4所述的方法,其特征在于,
所述基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示,包括:
利用注意力机制,计算每幅关系图对应的相关节点综合信息相对于待检测节点的注意力权重;
基于每幅关系图对应的相关节点综合信息及对应的注意力权重,加权求和得到用于分类的节点表示。
6.根据权利要求1所述的方法,其特征在于,
所述图神经网络模型在训练过程中使用加权交叉熵损失作为损失函数。
7.根据权利要求1所述的方法,其特征在于,
所述图神经网络模型采用MLP层输出每个节点的分类概率,若分类概率高于预设阈值,则判断节点对应的用户为欺诈用户,否则判断节点对应的用户为正常用户。
8.一种基于图神经网络的金融欺诈检测装置,其特征在于,包括:
数据获取模块,用于获取用户信息及用户关系数据;
图构建模块,用于基于获取的用户信息及用户关系数据,构建多关系欺诈图;所述多关系欺诈图包括多幅不同的关系图,每幅关系图对应一种类型的用户关系,所述关系图以节点表示用户信息、以节点之间的边表示用户之间存在关系;
节点检测模块,用于基于构建的所述多关系欺诈图,通过训练好的图神经网络模型进行检测,对所述多关系欺诈图中的每个节点进行分类判断,以确定欺诈用户;
其中,所述图神经网络模型是以样本多关系欺诈图为输入和以样本多关系欺诈图中每个节点的分类结果为输出进行训练的;所述图神经网络模型用于对输入的多关系欺诈图中每个节点执行如下操作:
对于输入的每幅关系图,分别确定待检测节点的所有邻居节点,并分别提取每个邻居节点的多频率信息;
对于每个邻居节点,基于相应的多频率信息,分别聚合得到单个邻居节点的待聚合表示;
对于每幅关系图,分别基于所有邻居节点的待聚合表示,聚合得到相关节点综合信息;
基于待检测节点在所有关系图中对应的相关节点综合信息,聚合得到用于分类的节点表示;
基于用于分类的节点表示,得到相应的分类结果。
9.一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1-7中任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310805809.0A CN116843342A (zh) | 2023-07-03 | 2023-07-03 | 基于图神经网络的金融欺诈检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310805809.0A CN116843342A (zh) | 2023-07-03 | 2023-07-03 | 基于图神经网络的金融欺诈检测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116843342A true CN116843342A (zh) | 2023-10-03 |
Family
ID=88173807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310805809.0A Pending CN116843342A (zh) | 2023-07-03 | 2023-07-03 | 基于图神经网络的金融欺诈检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116843342A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709967A (zh) * | 2023-12-19 | 2024-03-15 | 深圳前海微众银行股份有限公司 | 反洗钱检测方法和系统 |
-
2023
- 2023-07-03 CN CN202310805809.0A patent/CN116843342A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709967A (zh) * | 2023-12-19 | 2024-03-15 | 深圳前海微众银行股份有限公司 | 反洗钱检测方法和系统 |
CN117709967B (zh) * | 2023-12-19 | 2024-08-06 | 深圳前海微众银行股份有限公司 | 反洗钱检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018103456A1 (zh) | 一种基于特征匹配网络的社团划分方法、装置及电子设备 | |
CN109063966B (zh) | 风险账户的识别方法和装置 | |
CN110046929B (zh) | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 | |
CN111461855B (zh) | 基于欠采样的信用卡欺诈检测方法及系统、介质、设备 | |
CN112600810B (zh) | 一种基于图分类的以太坊网络钓鱼诈骗检测方法及装置 | |
CN111695597B (zh) | 基于改进式孤立森林算法的信贷欺诈团伙识别方法和系统 | |
CN110930218B (zh) | 一种识别欺诈客户的方法、装置及电子设备 | |
CN109598542A (zh) | 一种营销权益的投放方法、装置及电子设备 | |
CN114187112A (zh) | 账户风险模型的训练方法和风险用户群体的确定方法 | |
CN112200644B (zh) | 欺诈用户识别方法、装置、计算机设备以及存储介质 | |
CN116843342A (zh) | 基于图神经网络的金融欺诈检测方法、装置、设备及介质 | |
CN112560105B (zh) | 保护多方数据隐私的联合建模方法及装置 | |
CN113111930A (zh) | 一种端到端的以太坊钓鱼账户检测方法和系统 | |
CN112669143A (zh) | 基于关联网络的风险评估方法、装置、设备以及存储介质 | |
CN104751234B (zh) | 一种用户资产的预测方法及装置 | |
CN106897880A (zh) | 一种账号风险评估方法和设备 | |
CN109711984B (zh) | 一种基于催收的贷前风险监控方法及装置 | |
CN116805245A (zh) | 基于图神经网络与解耦表示学习的欺诈检测方法及系统 | |
Bian et al. | FedAvg-DWA: A Novel Algorithm for Enhanced Fraud Detection in Federated Learning Environment | |
CN107423982A (zh) | 基于账户的业务实现方法和装置 | |
CN113706279B (zh) | 欺诈分析方法、装置、电子设备及存储介质 | |
CN110855641B (zh) | 社区属性信息确定方法、装置及存储介质 | |
CN114913347A (zh) | 一种衣物颜色识别方法、系统、设备及存储介质 | |
Ampel et al. | Disrupting ransomware actors on the bitcoin blockchain: A graph embedding approach | |
CN110046783B (zh) | 冒用账户识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |