CN116664292A - 一种交易异常预测模型的训练方法和交易异常预测方法 - Google Patents

一种交易异常预测模型的训练方法和交易异常预测方法 Download PDF

Info

Publication number
CN116664292A
CN116664292A CN202310411608.2A CN202310411608A CN116664292A CN 116664292 A CN116664292 A CN 116664292A CN 202310411608 A CN202310411608 A CN 202310411608A CN 116664292 A CN116664292 A CN 116664292A
Authority
CN
China
Prior art keywords
transaction
user nodes
nodes
node
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310411608.2A
Other languages
English (en)
Other versions
CN116664292B (zh
Inventor
王愚
侯兴翠
王化楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianlian Hangzhou Information Technology Co ltd
Lianlian Yintong Electronic Payment Co ltd
Original Assignee
Lianlian Hangzhou Information Technology Co ltd
Lianlian Yintong Electronic Payment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianlian Hangzhou Information Technology Co ltd, Lianlian Yintong Electronic Payment Co ltd filed Critical Lianlian Hangzhou Information Technology Co ltd
Priority to CN202310411608.2A priority Critical patent/CN116664292B/zh
Publication of CN116664292A publication Critical patent/CN116664292A/zh
Application granted granted Critical
Publication of CN116664292B publication Critical patent/CN116664292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Technology Law (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请涉及计算机技术领域,特别涉及一种交易异常预测模型的训练方法和交易异常预测方法;交易异常预测模型的训练方法包括:生成第一图神经网络;对预设异常用户节点的属性特征进行特征融合,得到新增异常用户节点的属性特征;确定任一新增异常用户节点与其他用户节点之间的交易信息;更新得到第二图神经网络;基于第二图神经网络中各交易用户节点的属性特征以及第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型;通过在训练样本中通过预设异常用户节点合成新增异常用户节点,提高训练过程中异常用户节点的节点数量,进而提高交易异常预测模型对于异常状态的预测精度。

Description

一种交易异常预测模型的训练方法和交易异常预测方法
技术领域
本申请涉及计算机技术领域,特别涉及一种交易异常预测模型的训练方法和交易异常预测方法。
背景技术
在多个用户的交易过程中,会出现异常交易的情况;具体的,在跨境支付场景中,存在交易风险等异常情况。现有技术中,通常利用机器学习的方法对交易的异常进行识别预测,例如,通过交易异常预测模型对交易的异常情况进行预测。
但现有的交易异常预测模型中无法处理复杂的网络关系数据;且在交易异常预测模型的训练过程中,交易异常数据的样本数据较少,导致针对交易异常数据的训练次数较少,进而导致交易异常预测模型对交易异常数据的敏感性较低,进而导致采用交易异常预测模型的交易异常预测效果不佳。
发明内容
针对现有技术的上述问题,本申请的目的在于提供一种交易异常预测模型的训练方法,在训练样本中通过预设异常用户节点合成新增异常用户节点,提高交易异常预测模型训练过程中异常用户节点的节点数量,进而提高交易异常预测模型对于异常状态的预测精度。
为了解决上述问题,本申请提供了一种交易异常预测模型的训练方法,包括:
生成第一图神经网络;所述第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;所述多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;所述正常用户节点为不存在异常交易行为的用户所对应的节点,所述预设异常用户节点为存在异常交易行为的用户所对应的节点;
对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征;
确定任一新增异常用户节点与其他用户节点之间的交易信息;所述其他用户节点包括所述多个正常用户节点、所述多个预设异常用户节点,以及除所述任一新增异常用户节点以外的其他新增异常用户节点;
基于所述任一新增异常用户节点与其他用户节点之间的交易信息对所述第一图神经网络进行更新,得到第二图神经网络;
基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
在本申请实施例中,所述对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征包括:
基于所述多个预设异常用户节点对应的属性特征,确定任一预设异常用户节点与其他预设异常用户节点之间的属性距离;其他预设异常用户节点为所述多个预设异常用户节点中除所述任一预设异常用户节点以外的节点;
基于所述任一预设异常用户节点与其他预设异常用户节点之间的属性距离,确定所述任一预设异常用户节点的邻近用户节点;所述邻近用户节点与所述任一预设异常用户节点的属性距离满足预设距离条件;
基于所述任一预设异常用户节点的属性特征与所述邻近用户节点的属性特征,确定所述新增异常用户节点对应的属性特征。
在本申请实施例中,所述确定任一新增异常用户节点与其他用户节点之间的交易信息包括:
将所述任一新增异常用户节点对应的属性特征以及任一其他用户节点对应的属性特征输入至训练后的边预测模型中,得到所述任一新增异常用户节点与所述任一其他用户节点之间的交易概率;
基于所述交易概率,确定所述任一新增异常用户节点与所述任一其他用户节点之间的交易信息。
在本申请实施例中,所述方法还包括所述边预测模型的训练方法,所述边预测模型的训练方法包括:
将样本图神经网络中的多个样本交易用户节点各自对应的属性特征输入待训练的边预测模型中,得到多个样本交易用户节点对应的预测交易关系集;
基于所述样本图神经网络对应的标签交易关系集以及所述预测交易关系集进行损失计算,得到预测损失值;
基于所述预测损失值对所述待训练的边预测模型进行参数调整,确定所述训练后的边预测模型。
在本申请实施例中,所述交易异常预测模型的训练方法还包括:
获取所述第二图神经网络对应的节点网络图;所述节点网络图包括多个网络节点,以及各网络节点之间的连接边,所述多个网络节点包括所述多个正常用户节点、多个预设异常用户节点以及所述新增异常用户节点;
将所述节点网络图进行图分割,得到多个网络子图;
确定所述多个网络子图各自对应的位置编码矩阵;所述位置编码矩阵的行表征所述网络节点数量,所述位置编码矩阵的列表征各网络节点对应的位置信息;
基于所述位置编码矩阵,确定所述第二神经网络中各交易用户节点对应的位置特征;所述位置特征表征任一交易用户节点对应的网络节点在相应网络子图中的节点位置信息。
在本申请实施例中,所述基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型包括:
基于所述第二图神经网络中各交易用户节点的属性特征、所述第二神经网络中各交易用户节点对应的位置特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
在本申请实施例中,所述确定所述多个网络子图各自对应的位置编码矩阵包括:
获取目标网络子图对应的邻接矩阵;所述目标网络子图对应的邻接矩阵表征所述目标网络子图中各网络节点对应的连接关系;
对所述目标网络子图对应的邻接矩阵进行对角矩阵变换,得到所述目标网络子图对应的拉普拉斯矩阵;
将所述拉普拉斯矩阵进行矩阵分解,得到多组分解对;所述分解对包括特征值和特征向量;
基于所述特征值,对所述多组分解对进行排序;
基于排序后的特征值,确定目标数量;
从排序后的特征向量中选取所述目标数量的目标特征向量;
将所述目标数量的目标特征向量进行特征合并,得到所述目标网络子图对应的位置编码矩阵。
另一方面,本申请还提供一种交易异常预测方法,包括:
获取实时交易信息;所述实时交易信息包括多个当前交易用户节点,以及所述多个当前交易用户节点之间的实际交易关系;
将所述实时交易信息加入预存储的第三图神经网络中,确定所述多个当前交易用户节点对应的属性特征以及所述多个当前交易用户节点之间的交易信息;
将所述多个当前交易用户节点对应的属性特征以及所述当前交易用户节点之间的交易信息输入经过如上述交易异常预测模型的训练方法训练后的交易异常预测模型中,确定所述多个当前交易用户节点对应的异常预测结果。
另一方面,本申请还提供一种交易异常预测模型的训练装置,包括:
第一图神经生成模块,用于生成第一图神经网络;所述第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;所述多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;所述正常用户节点为不存在异常交易行为的用户所对应的节点,所述预设异常用户节点为存在异常交易行为的用户所对应的节点;
特征融合模块,用于对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征;
交易信息确定模块,用于确定任一新增异常用户节点与其他用户节点之间的交易信息;所述其他用户节点包括所述多个正常用户节点、所述多个预设异常用户节点,以及除所述任一新增异常用户节点以外的其他新增异常用户节点;
第二图神经生成模块,用于基于所述任一新增异常用户节点与其他用户节点之间的交易信息对所述第一图神经网络进行更新,得到第二图神经网络;
模型训练模块,用于基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
另一方面,本申请实施例还提供一种交易异常预测装置,包括:
获取模块,用于获取实时交易信息;所述实时交易信息包括多个当前交易用户节点,以及所述多个当前交易用户节点之间的实际交易关系;
存储模块,用于将所述实时交易信息加入预存储的第三图神经网络中,确定所述多个当前交易用户节点对应的属性特征以及所述多个当前交易用户节点之间的交易信息;
预测模块,用于将所述多个当前交易用户节点对应的属性特征以及所述当前交易用户节点之间的交易信息输入经过如上述交易异常预测模型的训练方法训练后的交易异常预测模型中,确定所述多个当前交易用户节点对应的异常预测结果。
另一方面,本申请还提供一种电子设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述交易异常预测模型的训练方法或交易异常预测方法。
另一方面,本申请还提供一种计算机存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述交易异常预测模型的训练方法或交易异常预测方法。
由于上述技术方案,本申请所述的一种交易异常预测模型的训练方法具有以下
有益效果:
通过在第一图神经网络中,基于预设异常用户节点的属性特征得到新增异常用户节点对应的属性特征;确定新增异常用户节点与其他用户节点之间的交易信息;并基于新增异常用户节点对应的属性特征以及新增异常用户节点与其他用户节点之间的交易信息,将新增异常用户节点更新至第一图神经网络中,得到第二图神经网络;基于更新后的第二图神经网络对交易异常预测模型进行训练;图神经网络中包括交易用户节点的节点属性以及各交易用户节点之间的交易信息,以多个维度的信息对交易异常预测模型进行训练,提高了样本信息的全面性,进而提高交易异常预测模型的预测精度;以及,由于图神经网络中包括交易用户节点的节点属性以及各交易用户节点之间的交易信息,以多个维度的信息对交易异常预测模型进行训练,进而交易异常预测模型的训练过程中可以从交易用户节点的周围获取交易用户节点的潜在特征,而无需交易用户节点的强相关特征的训练输入,进而提高了交易异常预测模型的适用范围;此外,在第一图神经网络的基础上,增加了异常用户节点的训练样本,提高交易异常预测模型训练过程中异常用户节点的样本数量,进而提高交易异常预测模型的预测精度,进而提高交易异常预测模型的鲁棒性和泛化能力。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种交易异常预测模型的训练方法流程示意图;
图2是本申请实施例提供的一种交易异常预测模型的训练方法中新增异常用户节点的属性特征确定流程示意图;
图3是本申请实施例提供的一种交易异常预测模型的训练方法中新增异常用户节点与其他用户节点之间的交易信息确定流程示意图;
图4是本申请实施例提供的一种交易异常预测模型的训练方法中边预测模型的训练方法的流程示意图;
图5是本申请实施例提供的一种交易异常预测模型的训练方法中节点的位置信息确定流程示意图;
图6是本申请实施例提供的一种交易异常预测模型的训练方法中交易异常预测模型的结构示意图;
图7是本申请实施例提供的一种交易异常预测模型的训练方法中节点的位置编码矩阵确定流程示意图;
图8是本申请实施例提供的一种交易异常预测方法的流程示意图;
图9是本申请实施例提供的一种交易异常预测模型的训练装置的结构示意图;
图10是本申请实施例提供的一种交易异常预测装置的结构示意图;
图11是本申请实施例提供的一种交易异常预测模型的训练方法以及交易异常预测方法的硬件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
此处所称的“一个实施例”或“实施例”是指可包含于本申请至少一个实现方式中的特定特征、结构或特性。在本申请的描述中,需要理解的是,术语“上”、“下”、“左”、“右”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含的包括一个或者更多个该特征。而且,术语“第一”、“第二”等是用于区别类似的用户,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
结合图1,介绍本申请实施例提供的一种交易异常预测模型的训练方法,该方法包括:
S1001、生成第一图神经网络;第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;正常用户节点为不存在异常交易行为的用户所对应的节点,预设异常用户节点为存在异常交易行为的用户所对应的节点。
在本申请实施例中,交易用户节点的属性特征可以表征用户在一段时间内的交易行为特征;交易用户节点之间的交易信息可以表征用户之间的交易权重,例如,交易金额以及交易次数等;存在异常交易行为的用户表征存在交易异常的用户。
在本申请具体实施例中,多个交易用户节点之间的交易信息是指第一图神经网络中多个交易用户节点之间的边信息。
在本申请具体实施例中,S1001包括:
S1011、基于多个用户之间的历史交易信息以用户为交易用户节点,交易信息为边构建交易节点网络。
在本申请具体实施例中,历史交易信息是指历史交易日志中存在的交易信息;交易用户节点表征用户,交易信息表征用户与用户之间的交易内容以及交易次数。
S1012、获取交易节点网络中网络节点对应的统计信息以及边统计信息;统计信息表征对交易用户信息的初步统计,例如,用户类型以及用户交易次数等;边统计信息表征对交易信息的初步统计,例如,交易关系以及交易次数等。
S1012、获取交易节点网络对应的邻接矩阵;邻接矩阵表征交易节点网络中各网络节点之间的连接关系;连接关系表征交易节点之间是否存在交易行为,在交易节点之间存在交易行为的情况下,连接关系为1;在交易节点之间不存在交易行为的情况下,连接关系为0。
S1013、基于交易节点网络中网络节点对应的统计信息以及边统计信息进行信息融合,得到交易节点网络中网络节点对应的属性特征以及交易信息;可以知晓的是,网络节点与第一图神经网络中的交易用户节点一一对应;网络节点对应的属性特征等同于交易用户节点的属性特征。
在本申请具体实施例中,交易用户节点的属性特征表征用户的信息特征,其中,用户的信息包括但不限于用户的账户信息、IP信息、交易设备信息以及交易用户节点信息等信息;交易信息表征用户之间的交易信息,其中交易信息包括但不限于交易内容、交易次数以及交易金额等信息;交易信息等同于边统计信息。
其中,将目标网络节点相邻的网络节点的统计信息以及相邻的边统计信息进行信息融合,得到目标网络节点对应的属性特征;优选的,采用无监督训练的方法将目标网络节点相邻的网络节点的统计信息以及相邻的边统计信息进行信息融合;相邻的网络节点是指与目标网络节点存在交易行为的网络节点;相邻的边统计信息可以是指与目标网络节点直接连接的边对应的统计信息,相邻的边统计信息也可以是指与目标网络节点直接连接的边对应的统计信息以及相邻的网络节点直接连接的边对应的统计信息。
在本申请实施例中,每条交易信息中各个维度对应的信息内容均不一致,以使交易信息包含的信息内容更多,进而提高交易信息的全面性,进而提高节点信息的差异性。
在本申请具体实施例中,还可以对交易信息进行归一化处理,以降低信息处理数据,提高数据处理效率;具体的,可以采用双向随机归一化的方法对交易信息进行归一化处理。
S1014、基于交易节点网络对应的邻接矩阵、交易节点网络中网络节点对应的属性特征以及交易信息生成第一图神经网络;第一图神经网络可以是现有技术中任意类型的图神经网络,例如图形自动编码器(Graph Auto-Encoders,GAE)、图形变分自动编码器(GraphVariational Autoencoder,GVAE)以及图形注意网络(Graph Attention Networks,GAT)。
S1002、对多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征;特征融合可以是指将至少两个节点对应的属性特征进行加权处理,得到新节点对应的属性特征;新增异常用户节点表征基于预设异常用户节点生成的相似节点,新增异常用户节点并无实际交易用户相对应。
S1003、确定任一新增异常用户节点与其他用户节点之间的交易信息;其他用户节点包括多个正常用户节点、多个预设异常用户节点,以及除任一新增异常用户节点以外的其他新增异常用户节点;基于新增异常用户节点并无实际交易用户相对应,因此,需要对新增异常用户节点与其他用户节点之间的交易信息进行预测。
S1004、基于任一新增异常用户节点与其他用户节点之间的交易信息对第一图神经网络进行更新,得到第二图神经网络;基于任一新增异常用户节点与其他用户节点之间的交易信息对第一图神经网络进行更新表征将任一新增异常用户节点添加至第一图神经网络中,其中,加入第一图神经网络的信息包括任一新增异常用户节点对应的属性特征以及任一新增异常用户节点与其他用户节点之间的交易信息;使得新增异常用户节点变成第二图神经网络中的交易用户节点。
S1005、基于第二图神经网络中各交易用户节点的属性特征以及第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
在本申请实施例中,通过在第一图神经网络中,基于预设异常用户节点的属性特征得到新增异常用户节点对应的属性特征;确定新增异常用户节点与其他用户节点之间的交易信息;并基于新增异常用户节点对应的属性特征以及新增异常用户节点与其他用户节点之间的交易信息,将新增异常用户节点更新至第一图神经网络中,得到第二图神经网络;基于更新后的第二图神经网络对交易异常预测模型进行训练;图神经网络中包括交易用户节点的节点属性以及各交易用户节点之间的交易信息,以多个维度的信息对交易异常预测模型进行训练,提高了样本信息的全面性,进而提高交易异常预测模型的预测精度;以及,由于图神经网络中包括交易用户节点的节点属性以及各交易用户节点之间的交易信息,以多个维度的信息对交易异常预测模型进行训练,进而交易异常预测模型的训练过程中可以从交易用户节点的周围获取交易用户节点的潜在特征,而无需交易用户节点的强相关特征的训练输入,进而提高了交易异常预测模型的适用范围;此外,在第一图神经网络的基础上,增加了异常用户节点的训练样本,提高交易异常预测模型训练过程中异常用户节点的样本数量,进而提高交易异常预测模型的预测精度,进而提高交易异常预测模型的鲁棒性和泛化能力。
参考图2,在本申请实施例中,S1002包括:
S2001、基于多个预设异常用户节点对应的属性特征,确定任一预设异常用户节点与其他预设异常用户节点之间的属性距离;其他预设异常用户节点为多个预设异常用户节点中除任一预设异常用户节点以外的节点;任一预设异常用户节点与其他预设异常用户节点之间的属性距离表征任一预设异常用户节点与其他预设异常用户节点之间的相似度,具体的,两个预设异常用户节点各自对应的属性特征的差值即为两个预设异常用户节点之间的属性距离。
S2002、基于任一预设异常用户节点与其他预设异常用户节点之间的属性距离,确定任一预设异常用户节点的邻近用户节点;邻近用户节点与任一预设异常用户节点的属性距离满足预设距离条件;任一预设异常用户节点的邻近用户节点表征与任一预设异常用户节点的属性距离最近的其他预设异常用户节点,即邻近用户节点与任一预设异常用户节点的属性距离小于非邻近用户节点的其他预设异常用户节点与任一预设异常用户节点的属性距离;因此,任一预设异常用户节点的邻近用户节点可以是一个也可以是多个。
S2003、基于任一预设异常用户节点的属性特征与邻近用户节点的属性特征,确定新增异常用户节点对应的属性特征。
在本申请实施例中,通过基于任一预设异常用户节点的属性特征与邻近用户节点的属性特征,确定新增异常用户节点对应的属性特征,以使新增异常用户节点对应的属性特征接近于预设异常用户节点对应的属性特征,进而提高新增样本数据的可靠性,提高交易异常预测模型的训练数据可靠性,提高交易异常预测模型的预测精度。
在本申请实施例中,在任一预设异常用户节点与邻近用户节点之间进行插值,得到新增异常用户节点;也就是说,新增异常用户节点为任一预设异常用户节点与邻近用户节点之间的节点。
在本申请具体实施例中,可以采用下述插值公式,确定新增异常用户节点对应的属性特征:
hv2=(1-sigma)×hv0+sigma×hv1 (1)
其中,hv2是指新增异常用户节点对应的属性特征,sigma是指服从(0,1)均匀分布的随机变量,hv0是指任一预设异常用户节点对应的属性特征,hv1是指任一预设异常用户节点的邻近用户节点对应的属性特征。
在本申请具体实施例中,在邻近用户节点为两个或两个以上的节点的情况下,预先将多个邻近用户节点进行加权平均,得到hv1
在本申请实施例中,邻近用户节点与任一预设异常用户节点的属性距离小于预设属性距离,具体的,孤立的预设异常用户节点与较远的邻近用户节点之间的相似度较低,通过避免孤立的预设异常用户节点与较远的邻近用户节点生成新增异常用户节点,以避免无效的新增异常用户节点数据,进而提高样本数据可靠性。
在本申请实施例中,还可以限定新增异常用户节点数量,具体的,将任一预设异常用户节点与邻近用户节点的属性距离从小到大进行排序;选取预设数量对任一预设异常用户节点与邻近用户节点进行特征融合,得到预设数量个新增异常用户节点;优选的,预设数量可以是20,也可以是30;通过限定新增异常用户节点数量,从而避免过多新增异常用户节点,既提高了样本数据,又避免了数据冗余,实现高效精准的对交易异常预测模型的训练。
参考图3,在本申请实施例中,S1003包括:
S3001、将任一新增异常用户节点对应的属性特征以及任一其他用户节点对应的属性特征输入至训练后的边预测模型中,得到任一新增异常用户节点与任一其他用户节点之间的交易概率;边预测模型用于对节点与节点之间的连接关系进行预测;连接关系表征交易节点之间是否存在交易行为;交易概率表征节点与节点之间存在连接关系的可能性。
S3002、基于交易概率,确定任一新增异常用户节点与任一其他用户节点之间的交易信息;具体的,交易信息包括预测交易关系以及交易行为信息;在预测交易关系表征存在连接关系的情况下,确定连接关系的边对应的交易行为信息;在预测交易关系表征不存在连接关系的情况下,交易信息即为预测交易关系。
在本申请具体实施例中,基于交易概率,确定任一新增异常用户节点与任一其他用户节点之间的预测交易关系;预测交易关系表征存在交易行为或不存在交易行为。
在本申请实施例中,节点与节点之间存在连接关系的情况下,其交易概率即为1,节点与节点之间不存在连接关系的情况下,其交易概率即为0;但边预测模型预测出的交易概率为[0,1]中的预测值;因此,S3002包括:
在交易概率大于或等于预设概率值的情况下,确定任一新增异常用户节点与任一其他用户节点之间存在连接关系;预设概率值为预先设定的数值,具体的,预设概率值可以是0.5,也可以是0.6,在此不做限定。
在交易概率小于预设概率的情况下,确定任一新增异常用户节点与任一其他用户节点之间不存在连接关系。
在本申请具体实施例中,基于预设的特征维度,随机初始化生成交易行为信息。
在本申请实施例中,通过训练后的边预测模型对新增异常用户节点与其他用户节点之间的交易关系进行预测,提高了新增异常用户节点对应的交易信息的准确性;此外,确定包括交易行为信息的交易信息,增加新增异常用户节点对应边的信息内容,以使新增异常用户节点以及新增异常用户节点对应的交易信息内容更为全面,进而提高新增异常用户节点的可靠性,提高交易异常预测模型的训练可靠性。
参考图4,在本申请实施例中,交易异常预测模型的训练方法还包括边预测模型的训练方法,边预测模型的训练方法包括:
S4001、将样本图神经网络中的多个样本交易用户节点各自对应的属性特征输入待训练的边预测模型中,得到多个样本交易用户节点对应的预测交易关系集;预测交易关系集表征边预测模型对多个样本交易用户节点之间的预测连接关系;具体的,预测交易关系集为预测邻接矩阵。
S4002、基于样本图神经网络对应的标签交易关系集以及预测交易关系集进行损失计算,得到预测损失值;标签交易关系集表征多个样本交易用户节点之间在样本图神经网络中的实际连接关系;具体的,标签交易关系集为标签邻接矩阵。
在本申请具体实施例中,可以采用下述公式进行损失计算:
Q=|E-A|2 (2)
其中,Q表征损失值,E表征预测邻接矩阵,A表征标签邻接矩阵。
S4003、基于预测损失值对待训练的边预测模型进行参数调整,确定训练后的边预测模型。
在本申请具体实施例中,预测损失值越小,边预测模型的预测精度越准确。
在本申请具体实施例中,边预测模型可以采用下述公式表示:
其中,Ev,表征节点v和节点u的交易概率,预测的邻接矩阵表征任一新增异常用户节点与任一其他用户节点之间的连接关系;sigmod表征将交易概率转化成0或1的函数;σ表征激活函数,例如relu函数;表征节点v的属性特征;/>表征节点u的属性特征;S表征权重矩阵,同时S也为训练过程中需要调整的参数。
在本申请实施例中,通过采用自监督的训练方法对边预测模型进行训练,从而提高边预测模型的预测精度,进而提高交易异常预测模型的训练可靠性。
参考图5,在本申请实施例中,交易异常预测模型的训练方法还包括:
S5001、获取第二图神经网络对应的节点网络图;节点网络图包括多个网络节点,以及各网络节点之间的连接边,多个网络节点包括多个正常用户节点、多个预设异常用户节点以及新增异常用户节点;节点网络图表征多个网络节点之间的交易关系,具体的,节点网络图中的网络节点与第二图神经网络中的交易用户节点一一对应,网络节点之间的连接边与交易用户节点之间的连接关系一一对应。
S5002、将节点网络图进行图分割,得到多个网络子图。
在本申请具体实施例中,采用层次化的分割算法(multi-level partitioning,metis)对节点网络图进行图分割,通过采用层次化的分割算法(multi-levelpartitioning,metis)能够降低图分割过程中交易信息的损失,进而提高交易用户节点位置特征的信息准确性;此外,采用层次化的分割算法(multi-level partitioning,metis)还能够提高对大量数据时候的图分割的效率。
S5003、确定多个网络子图各自对应的位置编码矩阵;位置编码矩阵的行表征网络节点数量,位置编码矩阵的列表征各网络节点对应的位置信息;也就是说,位置编码矩阵表征网络节点在对应网络子图中的节点位置信息;节点位置信息能够表征网络节点的潜在特征。
S5004、基于位置编码矩阵,确定第二神经网络中各交易用户节点对应的位置特征;位置特征表征任一交易用户节点对应的网络节点在相应网络子图中的节点位置信息。
在本申请实施例中,通过获取节点网络图以及对网络子图进行分割,确定各网络节点在相应网络子图中的节点位置信息,进而确定各交易用户节点的位置特征;即通过关注各交易用户节点与周围相邻交易用户节点之间的位置关系,又将少量交易用户节点之间远距离的位置信息进行了剔除,既降低了交易用户节点的位置特征提取难度,又提高了交易用户节点的位置特征的信息提取可靠性。
在本申请实施例中,S1005包括:
基于第二图神经网络中各交易用户节点的属性特征、第二神经网络中各交易用户节点对应的位置特征以及第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
在本申请实施例中,通过在交易异常预测模型的训练过程中,增加交易用户节点对应的位置特征,提高交易异常预测模型训练的训练信息输入,提高交易用户节点的信息维度以及提高交易用户节点之间的节点区分度,进而提高训练后的交易异常预测模型的预测精度。
在本申请具体实施例中,将目标交易用户节点对应的属性特征、目标边对应的交易信息以及邻居交易用户节点对应的属性特征作为交易异常预测模型的输入,得到目标交易用户节点对应的输出属性特征以及目标边对应的输出交易信息;其中,目标交易用户节点通过目标边与邻居交易用户节点连接。
优选的,目标交易用户节点对应的位置特征分别与目标交易用户节点对应的属性特征以及邻居交易用户节点对应的属性特征进行信息融合,得到目标节点融合信息以及邻居节点融合信息;基于目标节点融合信息以及邻居节点融合信息得到目标交易用户节点对应的输出属性特征以及目标边对应的输出交易信息。
将目标交易用户节点对应的输出属性特征与目标交易用户节点对应的统计信息进行信息融合,得到识别融合信息;基于识别融合信息,确定目标用户的异常预测结果;基于目标用户对应的类型标签以及异常预测结果进行有监督训练,得到训练后的交易异常预测模型;目标用户对应的类型标签包括异常用户节点标签和正常用户节点标签。
参考图6,在本申请具体实施例中,交易异常预测模型包括输入层、中间层、输出层以及识别层;将目标交易用户节点对应的属性特征、目标边对应的交易信息以及邻居交易用户节点对应的属性特征作为输入层的输入,经过中间层,得到目标交易用户节点对应的输出属性特征以及目标边对应的输出交易信息;其中,目标交易用户节点通过目标边与邻居交易用户节点连接;中间层用于对输入的数据进行处理,得到输出数据;识别层用于基于识别融合信息,确定目标用户的异常预测结果。
在本申请具体实施例中,将目标交易用户节点对应的属性特征、目标边对应的交易信息以及邻居交易用户节点对应的属性特征作为输入层的输入,以提高交易用户节点的特征数据来源,进而提高不同交易用户节点之间的特征差异性,进而提高预测模型的预测精度。
在本申请具体实施例中,中间层包括注意力提取层以及提取数据优化层;注意力提取层用于基于目标交易用户节点对应的属性特征、目标边对应的交易信息以及邻居交易用户节点对应的属性特征,对目标交易用户节点以及目标边进行特征提取,得到目标交易用户节点的提取特征以及目标边的提取特征;提取数据优化层用于分别对目标交易用户节点的提取特征以及目标边的提取特征进行数据优化。
具体的,将目标交易用户节点的提取特征和目标节点融合信息做残差连接,得到第一残差结果;将第一残差结果输入前馈神经网络(Feedforward Neural Network,FNN),得到第一前馈输出;将第一前馈输出与第一残差结果进行残差连接,得到目标交易用户节点对应的输出属性特征;以及将目标边的提取特征和目标边对应的交易信息进行残差连接,得到第三残差结果;将第三残差结果输入前馈神经网络(Feedforward NeuralNetwork,FNN),得到第一前馈输出与第三残差结果进行残差连接,得到目标边对应的输出交易信息。
在本申请具体实施例中,交易异常预测模型包括具有边缘特征的图形转换器(Graph Transformer Layer with edge features)和分类器。
在本申请具体实施例中,通过对提取特征进行两次残差连接,以及输入至前馈神经网络中,保留了数据的原始差异,进而提高了不同目标交易用户节点对应的输出属性特征之间的差异性,以及不同目标边对应的输出交易信息之间的差异性,进而提高交易异常预测模型的预测精度。
在本申请具体实施例中,前馈神经网络中,还可以对数据进行归一化处理,以降低数据处理量,进而提高交易异常预测模型的数据处理速率。
参考图7,在本申请实施例中,S5003包括:
S7001、获取目标网络子图对应的邻接矩阵;目标网络子图对应的邻接矩阵表征目标网络子图中各网络节点对应的连接关系;连接关系表征交易节点之间是否存在交易行为。
S7002、对目标网络子图对应的邻接矩阵进行对角矩阵变换,得到目标网络子图对应的拉普拉斯矩阵。
S7003、将拉普拉斯矩阵进行矩阵分解,得到多组分解对;分解对包括特征值和特征向量;特征向量的向量维度等于目标网络子图中的网络节点数量。
S7004、基于特征值,对多组分解对进行排序。
在本申请具体实施例中,S7004包括:
基于特征值的大小,将多组分解对从大到小进行排序。
S7005、基于排序后的特征值,确定目标数量。
在本申请具体实施例中,S7005包括:
S7051、依次选取n个特征值。
S7052、基于n个特征值的平方和以及全部特征值的平方和,确定平方和占比;平方和占比表征n个特征值的平方和与全部特征值的平方和的比值。
S7053、在平方和占比小于预设占比的情况下,更新n=n+1,重复执行步骤:依次选取n个特征值,至基于n个特征值的平方和以及全部特征值的平方和,确定平方和占比,直至平方和占比大于或等于预设占比。
S7054、在平方和占比大于或等于预设占比的情况下,确定n为目标数量;初始值n可以为1,也可以为3,在此不做限定。
S7006、从排序后的特征向量中选取目标数量的目标特征向量;
S7007、将目标数量的目标特征向量进行特征合并,得到目标网络子图对应的位置编码矩阵;特征合并是指将特征向量作为列进行拼接,进而得到目标网路子图对应的位置编码矩阵。
在本申请实施例中,基于分解后的分解对,确定目标网络子图对应的位置编码矩阵,实现对目标网络子图中各网络节点对应的位置信息的提取,进而提高第二图神经网络中各交易用户节点的潜在特征信息,提高对交易异常预测模型的训练数据维度,进而提高交易异常预测模型的预测精确性。
参考图8,本申请实施例还提供一种交易异常预测方法,交易异常预测方法包括:
S8001、获取实时交易信息;实时交易信息包括多个当前交易用户节点,以及多个当前交易用户节点之间的实际交易关系。
S8002、将实时交易信息加入预存储的第三图神经网络中,确定多个当前交易用户节点对应的属性特征以及多个当前交易用户节点之间的交易信息;第三图神经网络为预存储的图神经网络,可以是上述的第二图神经网络,也可以是其他预设的图神经网络。
在本申请实施例中,通过将实时交易信息加入预存储的第三图神经网络,以使当前交易用户节点具备更多维度上的信息,进而提高当前交易用户节点的信息维度,提高预测精度。
S8003、将多个当前交易用户节点对应的属性特征以及当前交易用户节点之间的交易信息输入经过本申请实施例中的交易异常预测模型的训练方法训练后的交易异常预测模型中,确定多个当前交易用户节点对应的异常预测结果。
参考图9,本申请实施例还提供一种交易异常预测模型的训练装置,该装置包括:
第一图神经生成模块101,用于生成第一图神经网络;第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;正常用户节点为不存在异常交易行为的用户所对应的节点,预设异常用户节点为存在异常交易行为的用户所对应的节点。
特征融合模块102,用于对多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征。
交易信息确定模块103,用于确定任一新增异常用户节点与其他用户节点之间的交易信息;其他用户节点包括多个正常用户节点、多个预设异常用户节点,以及除任一新增异常用户节点以外的其他新增异常用户节点。
第二图神经生成模块104,用于基于任一新增异常用户节点与其他用户节点之间的交易信息对第一图神经网络进行更新,得到第二图神经网络。
模型训练模块105,用于基于第二图神经网络中各交易用户节点的属性特征以及第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
特征融合模块包括:
属性距离确定单元,用于基于多个预设异常用户节点对应的属性特征,确定任一预设异常用户节点与其他预设异常用户节点之间的属性距离;其他预设异常用户节点为多个预设异常用户节点中除任一预设异常用户节点以外的节点;
邻近用户节点确定单元,用于基于任一预设异常用户节点与其他预设异常用户节点之间的属性距离,确定任一预设异常用户节点的邻近用户节点;邻近用户节点与任一预设异常用户节点的属性距离满足预设距离条件;
新增异常用户节点确定单元,用于基于任一预设异常用户节点的属性特征与邻近用户节点的属性特征,确定新增异常用户节点对应的属性特征。
交易信息确定模块包括:
交易概率确定单元,用于将任一新增异常用户节点对应的属性特征以及任一其他用户节点对应的属性特征输入至训练后的边预测模型中,得到任一新增异常用户节点与任一其他用户节点之间的交易概率;
交易关系确定单元,用于基于交易概率,确定任一新增异常用户节点与任一其他用户节点之间的交易关系;
交易信息确定单元,用于基于任一新增异常用户节点与任一其他用户节点之间的交易关系,确定任一新增异常用户节点与任一其他用户节点之间的交易信息。
交易异常预测模型的训练装置还包括边预测训练模块,边预测训练模块包括:
预测矩阵确定单元,用于将样本图神经网络中的多个样本交易用户节点各自对应的属性特征输入待训练的边预测模型中,得到多个样本交易用户节点对应的预测交易关系集;
损失计算单元,用于基于样本图神经网络对应的标签交易关系集以及预测交易关系集进行损失计算,得到预测损失值;
参数调整单元,用于基于预测损失值对待训练的边预测模型进行参数调整,确定训练后的边预测模型。
交易异常预测模型的训练装置还包括:
节点网络图获取模块,用于获取第二图神经网络对应的节点网络图;节点网络图包括多个网络节点,以及各网络节点之间的连接边,多个网络节点包括多个正常用户节点、多个预设异常用户节点以及新增异常用户节点;
图分割模块,用于将节点网络图进行图分割,得到多个网络子图;
位置编码信息确定模块,用于确定多个网络子图各自对应的位置编码矩阵;位置编码矩阵的行表征网络节点数量,位置编码矩阵的列表征各网络节点对应的位置信息;
位置特征确定模块,用于基于位置编码矩阵,确定第二神经网络中各交易用户节点对应的位置特征;位置特征表征任一交易用户节点对应的网络节点在相应网络子图中的节点位置信息。
模型训练模块包括:
模型训练单元,用于基于第二图神经网络中各交易用户节点的属性特征、第二神经网络中各交易用户节点对应的位置特征以及第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
位置编码信息确定模块包括:
连接关系获取单元,用于获取目标网络子图对应的邻接矩阵;目标网络子图对应的邻接矩阵表征目标网络子图中各网络节点对应的连接关系;
矩阵变换单元,用于对目标网络子图对应的邻接矩阵进行对角矩阵变换,得到目标网络子图对应的拉普拉斯矩阵;
矩阵分解单元,用于将拉普拉斯矩阵进行矩阵分解,得到多组分解对;分解对包括特征值和特征向量;
排序单元,用于基于特征值,对多组分解对进行排序;
目标数量确定单元,用于基于排序后的特征值,确定目标数量;
目标特征向量确定单元,用于从排序后的特征向量中选取目标数量的目标特征向量;
特征合并单元,用于将目标数量的目标特征向量进行特征合并,得到目标网络子图对应的位置编码矩阵。
参考图10,本申请实施例还提供一种交易异常预测装置,该装置包括:
获取模块201,用于获取实时交易信息;实时交易信息包括多个当前交易用户节点,以及多个当前交易用户节点之间的实际交易关系;
存储模块202,用于将实时交易信息加入预存储的第三图神经网络中,确定多个当前交易用户节点对应的属性特征以及多个当前交易用户节点之间的交易信息;
预测模块203,用于将多个当前交易用户节点对应的属性特征以及当前交易用户节点之间的交易信息输入经过本申请实施例中的交易异常预测模型的训练方法训练后的交易异常预测模型中,确定多个当前交易用户节点对应的异常预测结果。
本申请实施例还提供一种电子设备,该电子设备包括处理器和存储器,储器中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上述的交易异常预测模型的训练方法或交易异常预测方法。
存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个硬盘存储器件、闪存器件或其他易失性固态存储器件。相应的,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置等电子设备中执行。图11是本申请实施例提供的电子设备。如图11所示,该电子设备900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)910(处理器910可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器930,一个或一个以上存储应用程序923或数据922的存储介质920(例如一个或一个以上海量存储设备)。其中,存储器930和存储介质920可以是短暂存储或持久存储。存储在存储介质920的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器910可以设置为与存储介质920通信,在电子设备900上执行存储介质920中的一系列指令操作。电子设备900还可以包括一个或一个以上电源960,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口940,和/或,一个或一个以上操作系统921,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口940可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备900的通信供应商提供的无线网络。在一个实例中,输入输出接口940包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口940可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图11所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,电子设备900还可包括比图11中所示更多或者更少的组件,或者具有与图11所示不同的配置。
本申请的实施例还提供一种存储介质,该存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现如上述的交易异常预测模型的训练方法或交易异常预测方法。
上述说明已经充分揭露了本申请的具体实施方式。需要指出的是,熟悉该领域的技术人员对本申请的具体实施方式所做的任何改动均不脱离本申请的权利要求书的范围。相应地,本申请的权利要求的范围也并不仅仅局限于前述具体实施方式。

Claims (12)

1.一种交易异常预测模型的训练方法,其特征在于,包括:
生成第一图神经网络;所述第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;所述多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;所述正常用户节点为不存在异常交易行为的用户所对应的节点,所述预设异常用户节点为存在异常交易行为的用户所对应的节点;
对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征;
确定任一新增异常用户节点与其他用户节点之间的交易信息;所述其他用户节点包括所述多个正常用户节点、所述多个预设异常用户节点,以及除所述任一新增异常用户节点以外的其他新增异常用户节点;
基于所述任一新增异常用户节点与其他用户节点之间的交易信息对所述第一图神经网络进行更新,得到第二图神经网络;
基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
2.根据权利要求1所述的交易异常预测模型的训练方法,其特征在于,所述对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征包括:
基于所述多个预设异常用户节点对应的属性特征,确定任一预设异常用户节点与其他预设异常用户节点之间的属性距离;其他预设异常用户节点为所述多个预设异常用户节点中除所述任一预设异常用户节点以外的节点;
基于所述任一预设异常用户节点与其他预设异常用户节点之间的属性距离,确定所述任一预设异常用户节点的邻近用户节点;所述邻近用户节点与所述任一预设异常用户节点的属性距离满足预设距离条件;
基于所述任一预设异常用户节点的属性特征与所述邻近用户节点的属性特征,确定所述新增异常用户节点对应的属性特征。
3.根据权利要求1所述的交易异常预测模型的训练方法,其特征在于,所述确定任一新增异常用户节点与其他用户节点之间的交易信息包括:
将所述任一新增异常用户节点对应的属性特征以及任一其他用户节点对应的属性特征输入至训练后的边预测模型中,得到所述任一新增异常用户节点与所述任一其他用户节点之间的交易概率;
基于所述交易概率,确定所述任一新增异常用户节点与所述任一其他用户节点之间的交易信息。
4.根据权利要求3所述的交易异常预测模型的训练方法,其特征在于,所述方法还包括所述边预测模型的训练方法,所述边预测模型的训练方法包括:
将样本图神经网络中的多个样本交易用户节点各自对应的属性特征输入待训练的边预测模型中,得到多个样本交易用户节点对应的预测交易关系集;
基于所述样本图神经网络对应的标签交易关系集以及所述预测交易关系集进行损失计算,得到预测损失值;
基于所述预测损失值对所述待训练的边预测模型进行参数调整,确定所述训练后的边预测模型。
5.根据权利要求1所述的交易异常预测模型的训练方法,其特征在于,所述方法还包括:
获取所述第二图神经网络对应的节点网络图;所述节点网络图包括多个网络节点,以及各网络节点之间的连接边,所述多个网络节点包括所述多个正常用户节点、多个预设异常用户节点以及所述新增异常用户节点;
将所述节点网络图进行图分割,得到多个网络子图;
确定所述多个网络子图各自对应的位置编码矩阵;所述位置编码矩阵的行表征所述网络节点数量,所述位置编码矩阵的列表征各网络节点对应的位置信息;
基于所述位置编码矩阵,确定所述第二神经网络中各交易用户节点对应的位置特征;所述位置特征表征任一交易用户节点对应的网络节点在相应网络子图中的节点位置信息。
6.根据权利要求5所述的交易异常预测模型的训练方法,其特征在于,所述基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型包括:
基于所述第二图神经网络中各交易用户节点的属性特征、所述第二神经网络中各交易用户节点对应的位置特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
7.根据权利要求5所述的交易异常预测模型的训练方法,其特征在于,所述确定所述多个网络子图各自对应的位置编码矩阵包括:
获取目标网络子图对应的邻接矩阵;所述目标网络子图对应的邻接矩阵表征所述目标网络子图中各网络节点对应的连接关系;
对所述目标网络子图对应的邻接矩阵进行对角矩阵变换,得到所述目标网络子图对应的拉普拉斯矩阵;
将所述拉普拉斯矩阵进行矩阵分解,得到多组分解对;所述分解对包括特征值和特征向量;
基于所述特征值,对所述多组分解对进行排序;
基于排序后的特征值,确定目标数量;
从排序后的特征向量中选取所述目标数量的目标特征向量;
将所述目标数量的目标特征向量进行特征合并,得到所述目标网络子图对应的位置编码矩阵。
8.一种交易异常预测方法,其特征在于,包括:
获取实时交易信息;所述实时交易信息包括多个当前交易用户节点,以及所述多个当前交易用户节点之间的实际交易关系;
将所述实时交易信息加入预存储的第三图神经网络中,确定所述多个当前交易用户节点对应的属性特征以及所述多个当前交易用户节点之间的交易信息;
将所述多个当前交易用户节点对应的属性特征以及所述当前交易用户节点之间的交易信息输入经过如权利要求1-7任一所述的交易异常预测模型的训练方法训练后的交易异常预测模型中,确定所述多个当前交易用户节点对应的异常预测结果。
9.一种交易异常预测模型的训练装置,其特征在于,包括:
第一图神经生成模块,用于生成第一图神经网络;所述第一图神经网络表征多个交易用户节点的属性特征以及多个交易用户节点之间的交易信息;所述多个交易用户节点包括多个正常用户节点以及多个预设异常用户节点;所述正常用户节点为不存在异常交易行为的用户所对应的节点,所述预设异常用户节点为存在异常交易行为的用户所对应的节点;
特征融合模块,用于对所述多个预设异常用户节点对应的属性特征进行特征融合,得到新增异常用户节点对应的属性特征;
交易信息确定模块,用于确定任一新增异常用户节点与其他用户节点之间的交易信息;所述其他用户节点包括所述多个正常用户节点、所述多个预设异常用户节点,以及除所述任一新增异常用户节点以外的其他新增异常用户节点;
第二图神经生成模块,用于基于所述任一新增异常用户节点与其他用户节点之间的交易信息对所述第一图神经网络进行更新,得到第二图神经网络;
模型训练模块,用于基于所述第二图神经网络中各交易用户节点的属性特征以及所述第二图神经网络中各交易用户节点之间的交易信息对待训练的交易异常预测模型进行训练,得到训练后的交易异常预测模型。
10.一种交易异常预测装置,其特征在于,包括:
获取模块,用于获取实时交易信息;所述实时交易信息包括多个当前交易用户节点,以及所述多个当前交易用户节点之间的实际交易关系;
存储模块,用于将所述实时交易信息加入预存储的第三图神经网络中,确定所述多个当前交易用户节点对应的属性特征以及所述多个当前交易用户节点之间的交易信息;
预测模块,用于将所述多个当前交易用户节点对应的属性特征以及所述当前交易用户节点之间的交易信息输入经过如权利要求1-7任一所述的交易异常预测模型的训练方法训练后的交易异常预测模型中,确定所述多个当前交易用户节点对应的异常预测结果。
11.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如权利要求1-7任一所述的交易异常预测模型的训练方法或权利要求8所述的交易异常预测方法。
12.一种电子设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-7任一所述的交易异常预测模型的训练方法或权利要求8所述的交易异常预测方法。
CN202310411608.2A 2023-04-13 2023-04-13 一种交易异常预测模型的训练方法和交易异常预测方法 Active CN116664292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310411608.2A CN116664292B (zh) 2023-04-13 2023-04-13 一种交易异常预测模型的训练方法和交易异常预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310411608.2A CN116664292B (zh) 2023-04-13 2023-04-13 一种交易异常预测模型的训练方法和交易异常预测方法

Publications (2)

Publication Number Publication Date
CN116664292A true CN116664292A (zh) 2023-08-29
CN116664292B CN116664292B (zh) 2024-05-28

Family

ID=87721343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310411608.2A Active CN116664292B (zh) 2023-04-13 2023-04-13 一种交易异常预测模型的训练方法和交易异常预测方法

Country Status (1)

Country Link
CN (1) CN116664292B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408705A (zh) * 2023-12-15 2024-01-16 广州敏行数字科技有限公司 一种基于人工智能的异常检测方法及系统
CN117828449A (zh) * 2024-03-06 2024-04-05 江苏中创供应链服务有限公司 一种基于云计算的跨境电商用户画像数据处理方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209820A (zh) * 2019-06-05 2019-09-06 腾讯科技(深圳)有限公司 用户标识检测方法、装置及存储介质
WO2021027260A1 (zh) * 2019-08-15 2021-02-18 创新先进技术有限公司 处理交互序列数据的方法及装置
CN112541575A (zh) * 2020-12-06 2021-03-23 支付宝(杭州)信息技术有限公司 图神经网络的训练方法及装置
CN113011979A (zh) * 2021-03-29 2021-06-22 中国银联股份有限公司 交易检测方法、模型的训练方法、装置及计算机可读存储介质
WO2021169209A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 一种基于语音及图像特征的异常行为识别方法、装置及设备
CN113420190A (zh) * 2021-08-23 2021-09-21 连连(杭州)信息技术有限公司 一种商户风险识别方法、装置、设备及存储介质
US11227217B1 (en) * 2020-07-24 2022-01-18 Alipay (Hangzhou) Information Technology Co., Ltd. Entity transaction attribute determination method and apparatus
US20220101103A1 (en) * 2020-09-25 2022-03-31 Royal Bank Of Canada System and method for structure learning for graph neural networks
CN115049397A (zh) * 2021-03-09 2022-09-13 腾讯科技(深圳)有限公司 识别社交网络中的风险账户的方法及装置
CN115296984A (zh) * 2022-08-08 2022-11-04 中国电信股份有限公司 异常网络节点的检测方法及装置、设备、存储介质
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209820A (zh) * 2019-06-05 2019-09-06 腾讯科技(深圳)有限公司 用户标识检测方法、装置及存储介质
WO2021027260A1 (zh) * 2019-08-15 2021-02-18 创新先进技术有限公司 处理交互序列数据的方法及装置
WO2021169209A1 (zh) * 2020-02-27 2021-09-02 平安科技(深圳)有限公司 一种基于语音及图像特征的异常行为识别方法、装置及设备
US11227217B1 (en) * 2020-07-24 2022-01-18 Alipay (Hangzhou) Information Technology Co., Ltd. Entity transaction attribute determination method and apparatus
US20220101103A1 (en) * 2020-09-25 2022-03-31 Royal Bank Of Canada System and method for structure learning for graph neural networks
CN112541575A (zh) * 2020-12-06 2021-03-23 支付宝(杭州)信息技术有限公司 图神经网络的训练方法及装置
CN115049397A (zh) * 2021-03-09 2022-09-13 腾讯科技(深圳)有限公司 识别社交网络中的风险账户的方法及装置
CN113011979A (zh) * 2021-03-29 2021-06-22 中国银联股份有限公司 交易检测方法、模型的训练方法、装置及计算机可读存储介质
CN113420190A (zh) * 2021-08-23 2021-09-21 连连(杭州)信息技术有限公司 一种商户风险识别方法、装置、设备及存储介质
CN115293919A (zh) * 2022-07-22 2022-11-04 浙江大学 面向社交网络分布外泛化的图神经网络预测方法及系统
CN115296984A (zh) * 2022-08-08 2022-11-04 中国电信股份有限公司 异常网络节点的检测方法及装置、设备、存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
J YOU ET AL.: "Position-aware Graph Neural Networks", INTERNATIONAL CONFERENCE ON MACHIME LEARNING, 31 December 2019 (2019-12-31), pages 7134 - 7143 *
L. YU ET AL.: "Abnormal Transaction Detection based on Graph Networks", 2021 IEEE 45TH ANNUAL COMPUTERS, SOFTWARE, AND APPLICATION CONFERENCE(COMPSAC), 9 September 2021 (2021-09-09), pages 312 - 317 *
POPO: "学习笔记:GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks", pages 1 - 6, Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/463233535> *
TANG J. ET AL.: "Rethinking Graph Neural Networks for Anomaly Detection", PROCEEDINGS OF THE 39TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING, 31 December 2022 (2022-12-31), pages 21076 - 21089 *
TIANXIANG ZHAO ET AL.: "GraphSMOTE: Imbalanced Node Classification on Graphs with Graph Neural Networks", PROCEEDINGS OF THE 14TH ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING, 8 March 2021 (2021-03-08), pages 833 - 841, XP058743891, DOI: 10.1145/3437963.3441720 *
周超: "基于图的网上交易数据异常检测框架的设计与实现", 中国优秀硕士学位论文全文数据库(电子期刊), 15 August 2020 (2020-08-15), pages 138 - 54 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408705A (zh) * 2023-12-15 2024-01-16 广州敏行数字科技有限公司 一种基于人工智能的异常检测方法及系统
CN117408705B (zh) * 2023-12-15 2024-04-30 广州敏行数字科技有限公司 一种基于人工智能的异常检测方法及系统
CN117828449A (zh) * 2024-03-06 2024-04-05 江苏中创供应链服务有限公司 一种基于云计算的跨境电商用户画像数据处理方法及系统
CN117828449B (zh) * 2024-03-06 2024-05-14 江苏中创供应链服务有限公司 一种基于云计算的跨境电商用户画像数据处理方法及系统

Also Published As

Publication number Publication date
CN116664292B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN116664292B (zh) 一种交易异常预测模型的训练方法和交易异常预测方法
CN112084383B (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
US11487941B2 (en) Techniques for determining categorized text
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
CN110363449B (zh) 一种风险识别方法、装置及系统
US20210027182A1 (en) Automated machine learning systems and methods
CN110929840A (zh) 使用滚动窗口的连续学习神经网络系统
US11210368B2 (en) Computational model optimizations
KR102068715B1 (ko) 변수 중요도에 따른 가중치가 적용된 변수를 이용한 이상값 탐지 장치 및 방법
CA3151805A1 (en) Automated path-based recommendation for risk mitigation
CN103649905A (zh) 用于统一信息表示的方法和系统及其应用
US11868861B2 (en) Offline security value determination system and method
CN112801773A (zh) 企业风险预警方法、装置、设备及存储介质
CN113190670A (zh) 一种基于大数据平台的信息展示方法及系统
KR20210009906A (ko) 인공지능 기반의 쇼핑몰 상품구매 예측 플랫폼 제공 장치 및 방법
CN116861331A (zh) 一种融合专家模型决策的数据识别方法及系统
Huang et al. An energy-efficient and trustworthy unsupervised anomaly detection framework (EATU) for IIoT
CN115759748A (zh) 风险检测模型生成方法和装置、风险个体识别方法和装置
CN115238815A (zh) 异常交易数据获取方法、装置、设备、介质和程序产品
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN116737111A (zh) 一种基于场景化的安全需求分析方法
US20230342428A1 (en) System and method for labelling data for trigger identification
CN112992367B (zh) 基于大数据的智慧医疗交互方法及智慧医疗云计算系统
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
CN112991025A (zh) 一种保险智能推荐方法、系统、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant