WO2023109085A1

WO2023109085A1 - 账户风险模型的训练方法和风险用户群体的确定方法

Info

Publication number: WO2023109085A1
Application number: PCT/CN2022/101737
Authority: WO
Inventors: 曹世鸿; 肖和兵
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2021-12-15
Filing date: 2022-06-28
Publication date: 2023-06-22
Also published as: CN114187112A

Abstract

本申请提供一种账户风险模型的训练方法和风险用户群体的确定方法，账户风险模型的训练方法包括：通过根据多个样本用户账号的交易数据，生成至少一个样本连通图（S21），针对任一样本连通图，根据预设交易数额和样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵（S22），根据至少一个样本带权邻接矩阵，生成样本训练矩阵集（S23），使用样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型（S24）。通过使用根据样本带权邻接矩阵生成的样本训练矩阵集对账户风险模型进行有监督训练，样本带权邻接矩阵中包含样本用户账号间的交易关系，提高了训练好的账户风险模型的识别准确度。

Description

账户风险模型的训练方法和风险用户群体的确定方法

本申请要求于2021年12月15日提交中国专利局、申请号为202111534628.6、申请名称为“账户风险模型的训练方法和风险用户群体的确定方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及科技金融技术领域，尤其涉及一种账户风险模型的训练方法和风险用户群体的确定方法。

背景技术

随着金融机构在互联网金融业务的不断深入发展，互联网金融在为大众提供更多便利的同时，也给不法分子提供了洗钱活动的渠道。对洗钱团伙进行准确的识别，能够有效打击经济犯罪，减轻其对社会产生的危害，维护社会公平。因此，如何对洗钱团伙进行识别是关键。

目前，识别洗钱团伙主要通过预设的反洗钱模型对待识别用户的交易金额进行识别分析，从而从所有待识别用户中识别出洗钱团伙。其中，反洗钱模型通常为决策树、随机森林、卷积神经网络、循环神经网络和长短期记忆人工神经网络等。

然而，现有技术中在基于反洗钱模型对洗钱团伙进行识别时仅考虑了待识别用户的交易金额，可能会导致将正常用户识别为洗钱团伙的情况，存在识别准确度低的问题。

发明内容

本申请的目的在于提供一种账户风险模型的训练方法和风险用户群体的确定方法，以解决可能会导致将正常用户识别为洗钱团伙的情况，存在识别准确度低的问题。

第一方面，本申请实施例提供一种账户风险模型的训练方法，包括：

根据多个样本用户账号的交易数据，生成至少一个样本连通图，所述样本连通图中的节点为样本用户账号的账号信息，所述样本连通图中的路径为所述路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额，所述账号信息包括样本用户账号的样本风险值，所述样本风险值为所述样本用户账号存在异常操作的可能性；

针对任一样本连通图，根据预设交易数额和所述样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵；

根据至少一个样本带权邻接矩阵，生成样本训练矩阵集；

使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，所述训练好的账户风险模型用于根据多个待检测用户账号的交易数据和所述预设交易数额，获取每个待检测用户账号的目标风险值。

可选的，所述根据至少一个样本带权邻接矩阵，生成样本训练矩阵集，包括：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易时间和所述样本带权邻接矩阵，获取所述样本用户账号的样本风险向量，所述样本风险向量用于表示所述样本用户账号的初始样本风险值；

根据每个样本带权邻接矩阵和每个样本用户账号的样本风险向量，生成样本训练矩阵集。

可选的，所述针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易时间和所述样本带权邻接矩阵，获取所述样本用户账号的样本风险向量，包括：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易频次，交易总额以及与所述样本用户账号进行交易的账号个数，生成第一样本风险值；

根据连接所述样本用户账号的路径对应的权重，生成第二样本风险值；

根据所述样本用户账号的账号信息和与其他的样本用户账号之间的交易时间，生成第三样本风险值；

根据所述样本用户账号与其他的样本用户账号之间的交易关系和交易数额，生成第四样本风险值；

将所述第一样本风险值，所述第二样本风险值，所述第三样本风险值和所述第四样本风险值确定为所述样本风险向量。

可选的，所述根据多个样本用户账号的交易数据，生成至少一个样本连通图，包括：

根据多个样本用户账号的交易数据，获取样本知识图谱；

删除所述样本知识图谱中的孤立点，从所述样本知识图谱中获取至少一个样本连通图。

可选的，所述使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，包括：

根据所述样本训练矩阵集和多头注意力机制对所述账户风险模型进行训练，得到所述训练好的账户风险模型。

第二方面，本申请实施例提供一种风险用户群体的确定方法，包括：

根据多个待检测用户账号的交易数据，生成至少一个目标连通图，所述目标连通图中的节点为待检测用户账号的账号信息，所述目标连通图中的路径为所述路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵；

将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，所述目标风险值为所述待检测用户账号存在异常操作的可能性，所述训练好的账户风险模型是使用多个样本用户账号的交易数据以及所述预设交易数额对账户风险模型进行训练得到的；

根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号；

计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体。

可选的，所述计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体，包括：

计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据计算得到的至少一个相似度从其他的待检测用户账号中确定出至少一个第二目标用户账号；

将至少一个第一目标用户账号对应的用户和至少一个第二目标用户账号对应的用户确定为所述风险用户群体。

可选的，所述针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵，包括：

针对任一目标连通图，根据所述预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成带权邻接矩阵；

将每个带权邻接矩阵中小于预设权重值的权重元素的值设置为0，生成目标带权邻接矩阵；

相应的，所述生成目标带权邻接矩阵之后，所述方法还包括：

根据每个目标带权邻接矩阵中的至少一个非零元素，生成非零元素向量集，所述非零元素向量集包括第一向量，第二向量和第三向量，所述第一向量用于存储所述目标带权邻接矩阵中所有的非零元素，所述第二向量用于存储所有的非零元素的行位置，所述第三向量用于存储所有的非零元素的列位置；

相应的，所述将至少一个目标带权邻接矩阵输入训练好的账户风险模型，包括：

将至少一个非零元素向量集输入训练好的账户风险模型。

可选的，所述生成目标带权邻接矩阵之后，所述方法还包括：

针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易时间和所述目标带权邻接矩阵，获取所述待检测用户账号的目标风险向量，所述目标风险向量用于表示所述待检测用户账号的初始风险值；

将至少一个非零元素向量集和每个待检测用户账号的风险向量，输入所述训练好的账户风险模型。

可选的，所述针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易时间和所述目标带权邻接矩阵，获取所述待检测用户账号的目标风险向量，包括：

针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易频次，交易总额以及与所述待检测用户账号进行交易的账号个数，生成第一初始风险值；

根据连接所述待检测用户账号的路径对应的权重，生成第二初始风险值；

根据所述待检测用户账号的账号信息和与其他的待检测用户账号之间的交易时间，生成第三初始风险值；

根据所述待检测用户账号与其他的待检测用户账号之间的交易关系和交易数额，生成第四初始风险值；

将所述第一初始风险值，所述第二初始风险值，所述第三初始风险值和所述第四初始风险值确定为所述目标风险向量。

可选的，所述获取每个待检测用户账号的目标风险值之后，所述方法还包括：

获取更新后的目标风险向量；

相应的，所述计算每个第一目标用户账号与其他的待检测用户账号的相似度，包括：

根据所述更新后的目标风险向量，计算每个第一目标用户账号与其他的待检测用户账号的第一相似度；

根据每个第一目标用户账号与其他的待检测用户账号之间的交易时间，计算每个第一目标用户账号与其他的待检测用户账号的第二相似度；

根据每个第一目标用户账号与其他的待检测用户账号之间的交易金额，计算每个第一目标用户账号与其他的待检测用户账号的第三相似度；

根据所述第一相似度，所述第二相似度和所述第三相似度，生成每个第一目标用户账号与其他的待检测用户账号的相似度。

可选的，所述根据多个待检测用户账号的交易数据，生成至少一个目标连通图，包括：

根据多个待检测用户账号的交易数据，构建目标知识图谱；

删除所述目标知识图谱中的孤立点，获取至少一个初始连通图；

舍弃节点数量小于预设节点数量的初始连通图，将节点数量大于或等于所述预设节点数量的初始连通图确定为目标连通图。

第三方面，本申请实施例提供一种账户风险模型的训练装置，包括：

生成模块，用于根据多个样本用户账号的交易数据，生成至少一个样本连通图，所述样本连通图中的节点为样本用户账号的账号信息，所述样本连通图中的路径为所述路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额，所述账号信息包括样本用户账号的样本风险值，所述样本风险值为所述样本用户账号存在异常操作的可能性；

所述生成模块，还用于针对任一样本连通图，根据预设交易数额和所述样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵；

所述生成模块，还用于根据至少一个样本带权邻接矩阵，生成样本训练矩阵集；

训练模块，用于使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，所述训练好的账户风险模型用于根据多个待检测用户账号的交易数据和所述预设交易数额，获取每个待检测用户账号的目标风险值。

第四方面，本申请实施例提供一种风险用户群体的确定装置，包括：

生成模块，用于根据多个待检测用户账号的交易数据，生成至少一个目标连通图，所述目标连通图中的节点为待检测用户账号的账号信息，所述目标连通图中的路径为所述路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

所述生成模块，还用于针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵；

输入模块，用于将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，所述目标风险值为所述待检测用户账号存在异常操作的可能性，所述训练好的账户风险模型是使用多个样本用户账号的交易数据以及所述预设交易数额对账户风险模型进行训练得到的；

确定模块，用于根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号；

所述确定模块，还用于计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体。

第五方面，本申请实施例提供一种电子设备，包括：处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序指令，所述处理器执行所述计算机程序指令时用于实现第一方面、第二方面以及在第一方面和第二方面中各种可能的设计提供的方法。

第六方面，本申请实施例可提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现第一方面、第二方面以及在第一方面和第二方面中各种可能的设计提供的方法。

第七方面，本申请实施例提供一种计算机程序，包括程序代码，当计算机运行所述计算机程序时，所述程序代码执行如第一方面、第二方面以及在第一方面和第二方面中各种可能的设计提供的方法。

本申请实施例提供了一种账户风险模型的训练方法和风险用户群体的确定方法，该账户风险模型的训练方法包括：通过根据多个样本用户账号的交易数据，生成至少一个样本连通图，针对任一样本连通图，根据预设交易数额和样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵，根据至少一个样本带权邻接矩阵，生成样本训练矩阵集，使用样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型。通过使用根据样本带权邻接矩阵生成的样本训练矩阵集对账户风险模型进行有监督训练，样本带权邻接矩阵中包含样本用户账号间的交易关系，提高了训练好的账户风险模型的识别准确度，以使在后续使用该训练好的账户风险模型时降低假阳性率，提高了洗钱团伙的情况识别准确度。

附图说明

图1为本申请实施例提供的账户风险模型的训练方法的一种应用场景示意图；

图2为本申请实施例提供的账户风险模型的训练方法实施例一的流程示意图；

图3为本申请实施例提供的账户风险模型的训练方法实施例二的流程示意图；

图4为本申请实施例提供的可疑交易实施例一的结构示意图；

图5为本申请实施例提供的可疑交易实施例二的结构示意图；

图6为本申请实施例提供的可疑交易实施例三的结构示意图；

图7为本申请实施例提供的风险用户群体的确定方法实施例一的流程示意图；

图8为本申请实施例提供的待检测用户账号的目标风险值的获取流程示意图；

图9为本申请实施例提供的风险用户群体的确定方法实施例二的流程示意图；

图10为本申请实施例提供的风险用户群体的确定方法实施例三的流程示意图；

图11为本申请实施例提供的风险用户群体的确定方法实施例三的流程示意图；

图12为本申请实施例提供的账户风险模型的训练装置的结构示意图；

图13为本申请实施例提供的风险用户群体的确定装置的结构示意图；

图14为本申请实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在介绍本申请的实施例之前，首先对本申请实施例所涉及的名词进行解释：

洗钱：一般是指掩饰或者隐瞒各类犯罪收益的性质和来源，通过各种转换、转移及隐藏非法所得及其所产生收益的手段，使其表象上合法化的活动和过程。同时也包括了将合法的所得转化成了非法所得，以及转化所得资金以满足特定非法用途的活动和过程。

深度学习：是指计算机程序一类从样本数据中学习内在规律和表达层次，从而预测未知数据的过程，它是一种结构化神经网络学习模型。

图神经网络(Graph Neural Networks，GNN)：是一种直接作用于图结构上的神经网络。

图注意力神经网络(Graph Attention Networks，GAT)：图注意力神经网络，是图神经网络的一种，通过注意力机制来对邻居节点做聚合操作，实现对不同邻居权重的自适应分配，以提高图神经网络模型的表达能力。

归纳任务：指训练和测试使用不同的图结构。

Neo4j图数据库：是一种在线数据库管理系统，具有处理图形数据模型的创建，读取，更新和删除操作。Neo4j图数据库是所有图数据库中使用最广泛的。

相似度算法：相似度算法是指计算机程序一类利用相关数据衡量对象之间的相似程度。

有向图：边有方向的图。

度：在有向图中，度分为出度和入度。一个节点的出度指该节点指向其他节点的边的个数，入度是指向该节点的边的个数。

连通图：任意两个顶点之间都能够连通，即从一个顶点到达另一顶点，存在至少一条路径(也就是边)。其中，顶点也可以称为节点。

稀疏矩阵：将矩阵中的元素按照零和非零分为两个集合，对于零元素，其占整个矩阵的元素个数比称为稠密度，稠密度小于0.05为稀疏矩阵。

本申请具体的应用背景如下：反洗钱是金融机构在监管合规方面的重要任务，在反洗钱领域，通常通过预设的反洗钱模型对待识别用户的交易金额进行识别分析，以使反洗钱模型输出账户是否存在洗钱活动。在获取存在洗钱活动的账号后，确定该账号对应的用户，通过人工查看该用户流水等其他信息确定与该用户处于同一洗钱团伙的其他成员。

然而，现有技术中在基于反洗钱模型对洗钱团伙进行识别时仅考虑了待识别用户的交易金额，可能会导致将正常用户识别为洗钱团伙的情况，存在识别准确度低的问题。进一步的，在获取每个账户是否存在洗钱活动后，还需要人工确定与该用户处于同一洗钱团伙的其他成员，人力成本较高。

针对上述问题，本申请的发明构思如下：由于洗钱团伙中各成员间存在可疑的交易关系和交易结构，如可能存在资金分散转入、集中转出；集中转入、分散转出；短期内相同收付款人之间频繁发生资金收付，且交易金额接近大额交易标准等特点。因此，若考虑待检测用户账号之间的交易关系，根据多个待检测用户账号的交易数据获取至少一个目标带权邻接矩阵，基于训练好的账户风险模型，获取每个待检测用户账号的目标风险值，就能够确定出至少一个第一目标用户账号(也就是洗钱团伙的核心成员)，并根据上述可疑的交易关系和交易结构确定该洗钱团伙中的其他成员，从而提高识别洗钱团伙的准确度。

示例性的，本申请实施例提供的账户风险模型的训练方法可以应用于图1所示的一种应用场景示意图中。图1为本申请实施例提供的账户风险模型的训练方法的一种应用场景示意图，用以解决上述技术问题。如图1所示，该应用场景可以包括：业务终端设备和电子设备，还可以包括与电子设备连接的图数据库。

在本申请实施例中，业务终端设备主要用于在用户办理业务时为用户提供服务，并存储用户在办理业务时产生的交易数据。电子设备获取预设时间窗口内存储在业务终端设备中用户账号的交易数据，并将该用户账号确定为样本用户账号。进一步的，电子设备将样本用户账号的交易数据导入图数据库，并获取图数据库根据该交易数据构建好的样本知识图谱。

进一步的，电子设备对样本知识图谱进行处理，生成样本训练矩阵集，并使用该样本训练矩阵集对账户风险模型进行训练，从而得到训练好的账户风险模型。

可以理解的是，本申请实施例的执行主体可以是终端设备，例如，计算机、平板电脑等，也可以是服务器，例如，后台的处理平台等。因而，本实施例以终端设备和服务器统称为电子设备进行解释说明，关于该电子设备具体为终端设备，还是服务器，其可以实际情况确定。

下面，通过具体实施例对本申请的技术方案进行详细说明。

需要说明的是，下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。

图2为本申请实施例提供的账户风险模型的训练方法实施例一的流程示意图。如图2所示，该账户风险模型的训练方法可以包括如下步骤：

S21、根据多个样本用户账号的交易数据，生成至少一个样本连通图。

在本申请的实施例中，电子设备可以与至少一个业务终端设备连接，当从某个业务终端设备获取到样本用户账号的交易数据后，可以对获取到的数据进行处理，生成至少一个样本连通图。电子设备还可以是自身存储数据的设备，因而，其可以获取到自身存储的样本用户账号的交易数据，进而对其进行分析，生成至少一个样本连通图。

其中，交易数据包括样本用户账号的账号信息、样本用户账号之间的交易关系和交易数额(也可以理解为交易金额)。账号信息包括实体(也就是样本用户账号)，账号属性和样本用户账号的样本风险值，该样本风险值为样本用户账号存在异常操作的可能性。账号属性包括账号年龄、账号余额与其他信息等。交易关系包括转账、提现和充值等。

示例性的，异常操作可以为存在洗钱行为。

示例性的，样本用户账号可以为样本用户的银行卡账号，还可以是用户使用的其他的支付软件的账户名，如支付宝账号或微信账号等，还可以包括其他现有技术中具有交易功能的账号，本申请实施例对此不进行具体限制。

其中，样本用户账号的账号可以为不用样本用户的不同账号，还可以是相同样本用户的不同账号。

在一种具体的实施方式中，根据多个样本用户账号的交易数据，获取样本知识图谱，删除样本知识图谱中的孤立点，从样本知识图谱中获取至少一个样本连通图。将多个样本用户账号的交易数据导入图数据库中，从而获取图数据库根据多个样本用户账号的交易数据构建的样本知识图谱。进一步的，删除样本知识图谱中的孤立点，还可以通过其他现有的手段去除样本知识图谱中的异常数据，并从样本知识图谱中获取至少一个样本连通图。通过删除独立点，相当于将非洗钱团伙的节点删除，降低样本训练矩阵集的数据冗余，提高后续计算的准确性和效率。

示例性的，图数据库可以为Neo4j图数据库。

其中，样本连通图中的节点(也可称为顶点)为样本用户账号的账号信息，样本连通图中的路径为路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额。

S22、针对任一样本连通图，根据预设交易数额和样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵。

示例性的，预设交易数额可以为10000、11000或12000等，可以根据实际应用中的经验进行设定，本申请实施例对此不进行具体限制。

在一种具体的实现方式中，针对任一样本连通图，将该样本连通图中每个路径对应的交易数额与预设交易数额的比值确定为该路径对应的权重，并生成样本带权邻接矩阵。

示例性的，假设预设交易数额为10000，节点1和节点2之间交易数据为100000，也就是说节点1和节点2之间的路径对应的交易数额为100000，则该路径对应的权重为10。

S23、根据至少一个样本带权邻接矩阵，生成样本训练矩阵集。

在一种可能的实现方式中，可以直接集合所有的样本带权邻接矩阵，从而生成样本训练矩阵集。

在另一种可能的实现方式中，可以根据至少一个样本带权邻接矩阵和每个样本用户账号的样本风险向量，生成样本训练矩阵集。

可选的，可以将至少一个样本带权邻接矩阵确定为第一子样本训练矩阵集，将每个样本用户账号的样本风险向量确定为第二子样本训练矩阵集，集合第一子样本训练矩阵集和第二子样本训练矩阵集，生成样本训练矩阵集。

可选的，还可以将每个样本用户账号的样本风险向量拼接至至少一个样本带权邻接矩阵中的对应位置，生成样本训练矩阵集。

在该方法中，每个样本用户账号的样本风险向量可以通过以下方式确定：

1)，可以通过随机方法，对每个样本用户账号进行初始化处理，从而获取每个样本用户账号的样本风险向量。

2)，还可以针对任一样本带权邻接矩阵中的任一样本用户账号，根据样本用户账号与其他的样本用户账号之间的交易时间和样本带权邻接矩阵，获取样本用户账号的样本风险向量。关于获取每个样本用户账号的初始样本风险向量的具体实现原理可以参见下述图3所示实施例的记载，此处不再赘述。

其中，样本风险向量用于表示样本用户账号的初始样本风险值。鉴于账户风险模型对参数的初始值较敏感，因此通过样本用户账号与其他的样本用户账号之间的交易时间和样本带权邻接矩阵，获取样本用户账号的样本风险向量，对样本风险值进行初始化处理，从而得到初始样本风险值，提高了后续对账户风险模型训练的准确性。

S24、使用样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型。

其中，账户风险模型可以是预先存储在电子设备中的模型，还可以是电子设备从其他存储数据设备中获取的模型。

可选的，账户风险模型可以为GAT模型，还可以为其他的图神经网络模型，本申请实施例对此不进行具体限制。

在一种具体的实施方式中，根据样本训练矩阵集和多头注意力机制对账户风险模型进行训练，得到训练好的账户风险模型。

示例性的，假设账户风险模型共有三层隐藏层，分别为第一隐藏层、第二隐藏层和第三隐藏层。多头注意力机制为K头注意力机制，也就是说共有K个注意力(英文：Attention)，每个Attention生成的注意力向量为：

其中，h _j为节点j的样本风险向量，h′ _i为更新后的节点i的样本风险值，σ为softmax函数，α _ij为计算注意力系数，N _i为节点i的一阶邻居节点。

进一步的，计算注意力系数可以通过下述公式获取：

其中，LeakyRelu为非线性激活函数，a为预设的映射向量，用于将V _ij[Wh _i||Wh _j]映射为实数，W是线性参数矩阵。

可选的，计算注意力系数还可以通过下述公式获取：

其中，c ¹为存储有样本带权邻接矩阵中所有非零元素的向量，c ²为存储有所有非零元素的行位置，c ³为存储有所有非零元素的列位置。

对于第一隐藏层和第二隐藏层来说，在对账户风险模型进行训练时使用的注意力向量为K个Attention生成的注意力向量拼接在一起获取的，可以通过公式：

获取。

对于第三隐藏层来说，在对账户风险模型进行训练时使用的注意力向量为对K个Attention生成的注意力向量进行平均处理得到的，可以通过公式：

获取。

在该实施方式下，使用样本训练矩阵集对账户风险模型进行训练，不断优化W，从而得到训练好的账户风险模型。通过引入了多头注意力机制，放大了洗钱团伙中核心成员的作用，提高了准确率和运算速率。

其中，训练好的账户风险模型用于根据多个待检测用户账号的交易数额和预设交易数额，获取每个待检测用户账号的目标风险值。

可选的，在对账户风险模型进行训练时，不对注意力系数施加Dropout。Dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。

本申请实施例提供的账户风险模型的训练方法，通过根据多个样本用户账号的交易数据，生成至少一个样本连通图，针对任一样本连通图，根据预设交易数额和样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵，根据至少一个样本带权邻接矩阵，生成样本训练矩阵集，使用样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型。通过使用根据样本带权邻接矩阵生成的样本训练矩阵集对账户风险模型进行有监督训练，样本带权邻接矩阵中包含样本用户账号间的交易关系，提高了训练好的账户风险模型的识别准确度，从而在后续使用该训练好的账户风险模型时降低假阳性率。

其中，相比其他深度学习方法，GAT算法不会对所有节点一视同仁，可以根据不同节点间的权重分配不同的注意力。这对于提高洗钱团伙的识别准确率是很有帮助的，因为在洗钱案例中，洗钱团伙的核心成员处于交易的中心，不能将其视为普通节点。为了使训练好的账户风险模型更契合洗钱活动的特征，在计算注意力系数时加入了样本带权邻接矩阵，加快了训练过程的收敛速度。而其他的深度学习方法，如卷积神经网络(Convolutional Neural Networks，CNN)、循环神经网络(Recurrent Neural Network，RNN)、长短期记忆网络(Long Short-Term Memory，LSTM)等，无法处理图数据，因此在识别洗钱团伙时无法考虑用户间的交易关系，准确度较差。

再者，洗钱活动的多样性使得数据的图结构是多变的，属于归纳任务。若使用其他深度学习方法，只能针对某一类的洗钱活动，应用范围受限。一旦针对其他类型的洗钱行为，就需要重新训练模型，这大大增加了模型成本，且，现有技术或因为技术性质，无法扩展，或因为考虑模型成本，使其未能考虑现实的交易数据量，导致实际应用起来效率不高。而GAT模型本身的特性能够很好的完成归纳任务，从而提高训练好的账户风险模型的适用范围，可以对进行所有类型的洗钱活动的风险度进行识别，人工成本低。

图3为本申请实施例提供的账户风险模型的训练方法实施例二的流程示意图。如图3所示，基于上述任一实施例，针对任一样本带权邻接矩阵中的任一样本用户账号，根据样本用户账号与其他的样本用户账号之间的交易时间和样本带权邻接矩阵，获取样本用户账号的样本风险向量可以通过如下步骤获得：

S31、针对任一样本带权邻接矩阵中的任一样本用户账号，根据样本用户账号与其他的样本用户账号之间的交易频次，交易总额以及与样本用户账号进行交易的账号个数，生成第一样本风险值。

在本申请实施例中，结合实际洗钱活动的场景，根据可疑交易案例的特点，洗钱活动包括以下可疑交易结构：

1)，示例性的，图4为本申请实施例提供的可疑交易实施例一的结构示意图。如图4所示，共有5个样本用户账号，分别为账号1、账号2、账号3、账号4以及账号5，账号 1将资金分别转入账号2、账号3、账号4以及账号5中，即存在资金集中转出的交易结构。

应理解，在该结构下，常伴随有资金分散转入的交易结构。

2)，示例性的，图5为本申请实施例提供的可疑交易实施例二的结构示意图。如图5所示，共有5个样本用户账号，分别为账号6、账号7、账号8、账号9以及账号10，账号7、账号8、账号9以及账号10分别将资金转入账号6中，即存在资金集中转入的交易结构。

应理解，在该结构下，常伴随有资金分散转出的交易结构。

3)，短期内相同收付款人之间频繁发生资金收付，且交易金额接近大额交易标准。

示例性的，图6为本申请实施例提供的可疑交易实施例三的结构示意图。如图6所示，共有2个样本用户账号，分别为账号A和账号B，账号A和账号B共发生5次交易。其中，账号A向账号B转账2次，账号B向账号A转账3次。

4)，长期闲置的账户原因不明的突然启用或者平时资金流量小的账户突然出现异常资金流入，且短期内出现大量的资金收付。

因此，可以根据上述可疑交易结构获取样本带权邻接矩阵中所有样本用户账号的风险向量。

在一种具体的实现方式中，预先设置有预设交易频次，预设交易总额以及预设账号个数。针对任一样本带权邻接矩阵中的任一样本用户账号，确定样本用户账号与其他的样本用户账号之间的交易频次，交易总额以及与样本用户账号进行交易的账号个数中，超过预设交易频次，预设交易总额以及预设账号个数的个数，并将该个数确定为第一样本风险值。

示例性的，针对于样本用户账号A，假设预设交易频次为10次/天，预设交易总额10000元以及预设账号个数为10个。样本用户账号A与其他的样本用户账号之间的交易频次为15次/天，交易总额为1000000元，共与5个样本用户账号进行了交易。由于交易频次大于预设交易频次，交易总额大于预设交易总额，账号个数小于预设账号个数，即交易频次、交易总额、账号个数中超过预设交易频次，预设交易总额以及预设账号个数的个位为2个(交易频次和交易总额)，则第一样本风险值为2。

其中，第一样本风险值可以用risk ₁进行表示。

其中，预设交易频次，预设交易总额以及预设账号个数可以根据经验进行设定，本申请实施例对此不进行具体限制。

S32、根据连接样本用户账号的路径对应的权重，生成第二样本风险值。

在一种具体的实现方式中，可以将连接该样本用户账号的路径对应的权重进行求和，将求和得到的权重和作为第二样本风险值。

进一步的，第二样本风险值可以通过公式：

获取。其中，S为权重和，risk ₂为第二样本风险值。

S33、根据样本用户账号的账号信息和与其他的样本用户账号之间的交易时间，生成第三样本风险值。

在一种具体的实现方式中，判断该样本用户账号的总交易金额是否大于预设交易总额，在未超过时，将第三样本风险值确定为0；在超过时，计算该样本用户账号从开户到第一笔交易的总时间差T，并通过公式：

获取第三样本风险值，risk ₃为第三样本风险值。

S34、根据样本用户账号与其他的样本用户账号之间的交易关系和交易数额，生成第四样本风险值。

在一种可实现的方式中，考虑转出转入的金额比越接近1，洗钱的风险就越大，通过公式：

获取第四样本风险值，其中P为该样本用户账号转出转入的金额比，risk ₄为第四样本风险值。

S35、将第一样本风险值，第二样本风险值，第三样本风险值和第四样本风险值确定为样本风险向量。

在一种可实现的方式中，可以通过公式：

确定样本风险向量。其中，

为样本风险向量，risk为样本用户账号的初始样本风险值。

在上述实施例中，由于使用GAT算法的账户风险模型对参数的初始值比较敏感，即不同的初始值，可能会造成不一样的准确率，因此根据可疑交易结构的特点，确定样本风险向量，从而完成对样本风险值进行初始化处理，得到初始样本风险值，使得训练好的账户风险模型变得更可解释化。

在得到上述训练好的账户风险模型之后，可以使用该训练好的账户风险模型，获取每个待检测用户账号的目标风险值，从而确定风险用户群体。下面结合具体地实施例对使用该训练好的账户风险模型，从而确定风险用户群体的过程进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

具体实现时，风险用户群体的确定方法的执行主体为电子设备。应理解，该执行风险用户群体的确定方法的电子设备，与，执行上述账户风险模型的训练方法的电子设备，可以是同一设备，也可以是不同设备。

图7为本申请实施例提供的风险用户群体的确定方法实施例一的流程示意图。如图7所示，该风险用户群体的确定方法可以包括如下步骤：

S71、根据多个待检测用户账号的交易数据，生成至少一个目标连通图。

在本申请的实施例中，电子设备可以与至少一个业务终端设备连接，以便于实时获取某个业务终端设备中的多个待检测用户账号的交易数据，并对获取到的交易数据进行处理，从而生成至少一个目标连通图。电子设备还可以是自身存储数据的设备，因而，其可以获取到自身存储的多个待检测用户账号的交易数据，进而对其进行分析，生成至少一个目标连通图。

其中，交易数据包括待检测用户账号的账号信息、待检测用户账号之间的交易关系和交易数额(也可以理解为交易金额)。账号信息包括实体(也就是待检测用户账号)和账号属性。账号属性包括账号年龄、账号余额与其他信息等。交易关系包括转账、提现和充值等。

示例性的，待检测用户账号可以为待检测用户的银行卡账号，还可是用户使用的其他的支付软件的账户名，如支付宝账号或微信账号等，还可以包括其他现有技术中用于表征用户身份的账号，本申请实施例对此不进行具体限制。

其中，待检测用户账号的账号可以为不用待检测用户的不同账号，还可以是相同待检测用户的不同账号。

其中，目标连通图中的节点为待检测用户账号的账号信息，目标连通图中的路径为路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

在一种具体实施方式中，根据多个待检测用户账号的交易数据，构建目标知识图谱。之后删除目标知识图谱中的孤立点，获取至少一个初始连通图。最后舍弃节点数量小于预设节点数量的初始连通图，将节点数量大于或等于预设节点数量的初始连通图确定为目标连通图。通过删除独立点，相当于将非洗钱团伙的节点删除，降低了目标带权邻接矩阵的数据冗余，从而提高后续计算的准确性和效率。

示例性的，假设预设节点数量为50，电子设备将多个待检测用户账号的交易数据导入图数据库中，从而获取图数据库根据多个待检测用户账号的交易数据构建的目标知识图谱。进一步的，电子设备删除目标知识图谱中的孤立点，还可以通过其他现有的手段去除目标知识图谱中的异常数据，并从目标知识图谱中获取至少一个初始连通图。最后，电子设备将所有初始连通图中节点数量大于50的初始连通图确定为目标连通图。

示例性的，图数据库可以为Neo4j图数据库。

S72、针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵。

其中，关于该步骤的具体实现可以参见S22中根据样本连通图生成样本带权邻接矩阵的记载，其实现原理和技术效果类似，在此不再赘述。

S73、将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值。

其中，目标风险值为待检测用户账号存在异常操作的可能性，训练好的账户风险模型是使用多个样本用户账号的交易数据以及预设交易数额对账户风险模型进行训练得到的。

示例性的，图8为本申请实施例提供的待检测用户账号的目标风险值的获取流程示意图。如图8所示，训练好的账户风险模型共有三层隐藏层(图8中的第一隐藏层、第二隐藏层和第三隐藏层)，将目标带权邻接矩阵输入训练好的账户风险模型，训练好的账户风险模型中的三层隐藏层依次对目标带权邻接矩阵进行处理，从而获取目标带权邻接矩阵中每个待检测用户账号的目标风险值。

可选的，目标风险值可以为该待检测用户为洗钱团伙的可能性。

S74、根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号。

在一种具体的实现方式中，可以预先设置有预设用户个数，将所有待检测用户账号按照目标风险值由大到小的顺序进行排列，并将排在前预设用户个数的待检测用户账号确定为第一目标用户账号。

示例性的，假设预设用户个数为10个，则将所有待检测用户账号按照目标风险值由大到小的顺序进行排列，将排在前10位的用户确定为第一目标用户账号。

S75、计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据待检测用户账号对应的用户中确定出风险用户群体。

应理解，在洗钱活动的场景中，第一目标用户账号可以是检测出来的洗钱团伙中的核心成员，而同一洗钱团伙中的其他成员的必定与核心成员有直接或者间接的交易联系，因此可以根据节点间的相似度，确定与核心成员处于同一洗钱团伙中的其他成员。

在一种具体的实现方式中，计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据计算得到的至少一个相似度从其他的待检测用户账号中确定出至少一个第二目标用户账号，并将至少一个第一目标用户账号对应的用户和至少一个第二目标用户账号对应的用户确定为风险用户群体。

展开来说，电子设备预先设置有预设相似度，计算每个第一目标用户账号与其邻居节点的相似度，并选取相似度大于预设相似度的邻居节点作为第一节点。之后，进一步计算该第一节点与其邻居节点的的相似度，并选取相似度大于预设相似度的邻居节点作为第二节点。然后，再计算该第二节点与其邻居节点的相似度，并选取相似度大于预设相似度的邻居节点作为第三节点。重复上述步骤，直到第N节点与其邻居节点的相似度都小于预设相似度，则将第1节点至第N节点确定为第二目标用户账号。其中N为大于等于2的正整数。鉴于同一洗钱团伙中的其他成员的必定与核心成员有直接或者间接的交易联系，根据计算其他成员与核心成员的相似度，能够更准确和快速的确认出与该核心成员处于同一洗钱团伙中的其他成员。

其中，计算两个节点间的相似度可以下述公式获取：

其中，x ₁为节点1，x ₂为节点2，x _1Q为节点1的Q元素，x _2Q为节点2的Q元素，

为节点1中各元素的平均值，

为节点2中各元素的平均值。

本申请实施例提供的风险用户群体的确定方法，根据多个待检测用户账号的交易数据，生成至少一个目标连通图，针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵，将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号，计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据待检测用户账号对应的用户中确定出风险用户群体。通过使用训练好的账户风险模型对多个待检测用户账号进行风险性检测，获取训练好的账户风险模型输出的每个待检测用户账号的目标风险值，并进一步通过第一目标用户账号与其他的待检测用户账号的相似度，确定出洗钱团伙中的全部成员，无需人工干预，提高了确定出的洗钱团伙的准确性，降低假阳性率，节省了人力成本。

图9为本申请实施例提供的风险用户群体的确定方法实施例二的流程示意图。如图9所示，基于上述任一实施例，S72可以通过如下步骤实现：

S91、针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成带权邻接矩阵。

S92、将每个带权邻接矩阵中小于预设权重值的权重元素的值设置为0，生成目标带权邻接矩阵。

其中，预设权重值可以根据经验值进行预先设定，如1、0.9、0.8等，本申请实施例不进行具体限制。

相应的，生成目标带权邻接矩阵之后，该风险用户群体的确定方法还包括：

根据每个目标带权邻接矩阵中的至少一个非零元素，生成非零元素向量集，非零元素向量集包括第一向量(c ¹)，第二向量(c ²)和第三向量(c ³)，第一向量用于存储目标带权邻接矩阵中所有的非零元素，第二向量用于存储所有的非零元素的行位置，第三向量用于存储所有的非零元素的列位置。

可选的，可以通过稀疏矩阵算法中的坐标存储算法(coordinate storage，coo)确定非零元素向量集。

相应的，将至少一个目标带权邻接矩阵输入训练好的账户风险模型，包括：

将至少一个非零元素向量集输入训练好的账户风险模型。

在上述实施例中，将目标带权邻接矩阵处理成至少一个非零元素向量集，节省内存开销，加快运算速度。

可选的，本实施例训练好的账户风险模型可以为GAT模型，在计算时只需知道每个节点的邻节点即可，对于大规模的目标连通图，通过并行计算节点-邻居节点来提高运算效率。

可选的，在一些实施例中，在生成目标带权邻接矩阵之后，该风险用户群体的确定方法还可以包括以下步骤：

针对任一非零元素向量集中的任一待检测用户账号，根据待检测用户账号与其他的待检测用户账号之间的交易时间和目标带权邻接矩阵，获取待检测用户账号的目标风险向量。

其中，目标风险向量用于表示待检测用户账号的初始风险值。通过确定目标风险向量，从而对风险值进行初始化处理，得到初始风险值，减少了训练好的账户风险模型对参数的初始值的敏感性。

其中，目标风险向量可以由第一初始风险值、第二初始风险值、第三初始风险值和第四初始风险值确定。其中，第一初始风险值、第二初始风险值、第三初始风险值和第四初始风险值的确定方式如下：

1)，针对任一非零元素向量集中的任一待检测用户账号，根据待检测用户账号与其他的待检测用户账号之间的交易频次，交易总额以及与待检测用户账号进行交易的账号个数，生成第一初始风险值。

2)，根据连接待检测用户账号的路径对应的权重，生成第二初始风险值。

3)，根据待检测用户账号的账号信息和与其他的待检测用户账号之间的交易时间，生成第三初始风险值。

4)，根据待检测用户账号与其他的待检测用户账号之间的交易关系和交易数额，生成第四初始风险值。

其中，第一初始风险值，第二初始风险值，第三初始风险值和第四初始风险值的具体确定方式可以参见S31、S32、S33和S34中的记载，其实现原理和技术效果类似，在此不再赘述。根据可疑交易结构的特点，确定目标风险向量，使得训练好的账户风险模型变得更可解释化，进一步提高了后续计算的准确性。

相应的，在该实施例中，将至少一个目标带权邻接矩阵输入训练好的账户风险模型，可以通过下述步骤实现：

将至少一个非零元素向量集和每个待检测用户账号的风险向量，输入训练好的账户风险模型。

图10为本申请实施例提供的风险用户群体的确定方法实施例三的流程示意图。如图10所示，基于上述任一实施例，获取每个待检测用户账号的目标风险值之后，该风险用户群体的确定方法还包括以下步骤：

获取更新后的目标风险向量。

相应的，计算每个第一目标用户账号与其他的待检测用户账号的相似度可以通过以下步骤实现：

S101、根据更新后的目标风险向量，计算每个第一目标用户账号与其他的待检测用户账号的第一相似度。

其中，可以通过公式：sim ₁＝sim(risk _i,risk _j)，获取。sim ₁为第一相似度，risk _i为节点i的更新后的目标风险向量，risk _j的节点j的更新后的目标风险向量。

S102、根据每个第一目标用户账号与其他的待检测用户账号之间的交易时间，计算每个第一目标用户账号与其他的待检测用户账号的第二相似度。

其中，在洗钱活动的应用场景中，交易时间是一个重要的维度，不同类型的洗钱团伙在交易时间的选择上也不同。如：一种类型的洗钱团伙通常选择半夜交易，而另一种类型的洗钱团伙选择交易时间通常比较平均。

其中，可以通过公式：

获取第二相似度。

sim ₂为第二相似度，

为以一个小时为一个时间段，一天内每个时间段的节点i与其他的待检测用户账号之间的交易笔数，映射成的24维向量；

为以一个小时为一个时间段，一天内每个时间段的节点j与其他的待检测用户账号之间的交易笔数，映射成的24维向量；D为交易时间区间，假设S71从7天内的数据中提取了多个待检测用户账号的交易数据，则此时D为7。

S103、根据每个第一目标用户账号与其他的待检测用户账号之间的交易金额，计算每个第一目标用户账号与其他的待检测用户账号的第三相似度。

其中，可以通过公式：

获取第三相似度。

sim ₃为第二相似度，

为以一个小时为一个时间段，一天内每个时间段的节点i与其他的待检测用户账号的交易总额，映射成的24维向量；

为以一个小时为一个时间段，一天内每个时间段的节点j与其他的待检测用户账号的交易总额，映射成的24维向量。

S104、根据第一相似度，第二相似度和第三相似度，生成每个第一目标用户账号与其他的待检测用户账号的相似度。

其中，可以通过公式：

获取第一目标用户账号与其他的待检测用户账号的相似度。

进一步的，还可以通过公式：sim ₄＝sim(other _i,other _j)，计算每个第一目标用户账号与其他的待检测用户账号的第四相似度。其中，other _i为节点i的账号信息映射成的多维向量，other _j为节点j的账号信息映射成的多维向量，账号信息包括账龄(参与洗钱的账户，往往偏向于新开不久的，在发生洗钱行为后注销)，在一周内的账户余额差，所处的地域，购买水平以及购买频次等。

相应的，在获取第四相似度后，还可以通过公式：

获取第一目标用户账号与其他的待检测用户账号的相似度。

在上述实施例中，从风险相似度、交易笔数相似度、交易量相似度等多维度的角度思考其他待检测用户账号和核心洗钱成员的相似度，更准确的发现团伙，大大降低假阳性率。

图11为本申请实施例提供的风险用户群体的确定方法实施例三的流程示意图。如图11所示，该风险用户群体的确定方法包括：

S111、根据多个待检测用户账号的交易数据，构建目标知识图谱。

S112、删除目标知识图谱中的孤立点，获取至少一个目标连通图。

S113、针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵。

S114、将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值。

S115、根据每个待检测用户账号的目标风险值，从待检测用户账号对应的用户中确定出风险用户群体。

S116、将待检测用户账号的交易数据确定为下一周期的样本用户账号的交易数据。

在上述实施例中，采用应用与训练相结合的方式，推进账户风险模型的迭代更新，避免了样本训练矩阵集过大造成的过拟合，提高了账户风险模型的准确度和泛化性。

示例性的，本月可以使用上个月训练好的账户风险模型，获取每个待检测用户账号的目标风险值。同样，并行的将本月的待检测用户账号的交易数据作为下个月的样本用户账号的交易数据。

同时，还可以从最近三个月的数据中提取多个样本用户账号的交易数据，从而对账户风险模型进行训练。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

图12为本申请实施例提供的账户风险模型的训练装置的结构示意图。如图12所示，该账户风险模型的训练装置包括：

生成模块121，用于根据多个样本用户账号的交易数据，生成至少一个样本连通图，样本连通图中的节点为样本用户账号的账号信息，样本连通图中的路径为路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额，账号信息包括样本用户账号的样本风险值，样本风险值为样本用户账号存在异常操作的可能性；

生成模块121，还用于针对任一样本连通图，根据预设交易数额和样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵；

生成模块121，还用于根据至少一个样本带权邻接矩阵，生成样本训练矩阵集；

训练模块122，用于使用样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，训练好的账户风险模型用于根据多个待检测用户账号的交易数据和预设交易数额，获取每个待检测用户账号的目标风险值。

在本申请实施例的一种可能设计中，生成模块121，具体用于：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据样本用户账号与其他的样本用户账号之间的交易时间和样本带权邻接矩阵，获取样本用户账号的样本风险向量，样本风险向量用于表示样本用户账号的初始样本风险值；

可选的，生成模块121，具体用于：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据样本用户账号与其他的样本用户账号之间的交易频次，交易总额以及与样本用户账号进行交易的账号个数，生成第一样本风险值；

根据连接样本用户账号的路径对应的权重，生成第二样本风险值；

根据样本用户账号的账号信息和与其他的样本用户账号之间的交易时间，生成第三样本风险值；

根据样本用户账号与其他的样本用户账号之间的交易关系和交易数额，生成第四样本风险值；

将第一样本风险值，第二样本风险值，第三样本风险值和第四样本风险值确定为样本风险向量。

在本申请实施例的另一种可能设计中，生成模块121，具体用于：

根据多个样本用户账号的交易数据，获取样本知识图谱；

删除样本知识图谱中的孤立点，从样本知识图谱中获取至少一个样本连通图。

在本申请实施例的再一种可能设计中，训练模块122，具体用于：

根据样本训练矩阵集和多头注意力机制对账户风险模型进行训练，得到训练好的账户风险模型。

本申请实施例提供的账户风险模型的训练装置，可用于执行上述任一实施例中的账户风险模型的训练方法，其实现原理和技术效果类似，在此不再赘述。

图13为本申请实施例提供的风险用户群体的确定装置的结构示意图。如图13所示，该风险用户群体的确定装置包括：

生成模块131，用于根据多个待检测用户账号的交易数据，生成至少一个目标连通图，目标连通图中的节点为待检测用户账号的账号信息，目标连通图中的路径为路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

生成模块131，还用于针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵；

输入模块132，用于将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，目标风险值为待检测用户账号存在异常操作的可能性，训练好的账户风险模型是使用多个样本用户账号的交易数据以及预设交易数额对账户风险模型进行训练得到的；

确定模块133，用于根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号；

确定模块133，还用于计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据待检测用户账号对应的用户中确定出风险用户群体。

在本申请实施例的一种可能设计中，确定模块133，具体用于：

将至少一个第一目标用户账号对应的用户和至少一个第二目标用户账号对应的用户确定为风险用户群体。

可选的，生成模块131，具体用于：

针对任一目标连通图，根据预设交易数额和目标连通图中的每个路径对应的交易数额，生成带权邻接矩阵；

相应的，生成目标带权邻接矩阵之后，生成模块131，还用于：

根据每个目标带权邻接矩阵中的至少一个非零元素，生成非零元素向量集，非零元素向量集包括第一向量，第二向量和第三向量，第一向量用于存储目标带权邻接矩阵中所有的非零元素，第二向量用于存储所有的非零元素的行位置，第三向量用于存储所有的非零元素的列位置；

相应的，输入模块132，具体用于：

将至少一个非零元素向量集输入训练好的账户风险模型。

可选的，生成目标带权邻接矩阵之后，生成模块131，还用于：

针对任一非零元素向量集中的任一待检测用户账号，根据待检测用户账号与其他的待检测用户账号之间的交易时间和目标带权邻接矩阵，获取待检测用户账号的目标风险向量，目标风险向量用于表示待检测用户账号的初始风险值；

相应的，输入模块132，具体用于：

可选的，生成模块131，具体用于：

针对任一非零元素向量集中的任一待检测用户账号，根据待检测用户账号与其他的待检测用户账号之间的交易频次，交易总额以及与待检测用户账号进行交易的账号个数，生成第一初始风险值；

根据连接待检测用户账号的路径对应的权重，生成第二初始风险值；

根据待检测用户账号的账号信息和与其他的待检测用户账号之间的交易时间，生成第三初始风险值；

根据待检测用户账号与其他的待检测用户账号之间的交易关系和交易数额，生成第四初始风险值；

将第一初始风险值，第二初始风险值，第三初始风险值和第四初始风险值确定为目标风险向量。

可选的，获取每个待检测用户账号的目标风险值，获取模块，还用于：

获取更新后的目标风险向量；

相应的，确定模块133，具体用于：

根据更新后的目标风险向量，计算每个第一目标用户账号与其他的待检测用户账号的第一相似度；

根据第一相似度，第二相似度和第三相似度，生成每个第一目标用户账号与其他的待检测用户账号的相似度。

在本申请实施例的另一种可能设计中，生成模块131，用于：

根据多个待检测用户账号的交易数据，构建目标知识图谱；

删除目标知识图谱中的孤立点，获取至少一个初始连通图；

舍弃节点数量小于预设节点数量的初始连通图，将节点数量大于或等于预设节点数量的初始连通图确定为目标连通图。

本申请实施例提供的风险用户群体的确定装置，可用于执行上述任一实施例中的风险用户群体的确定方法，其实现原理和技术效果类似，在此不再赘述。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。此外，这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

图14为本申请实施例提供的电子设备的结构示意图。如图14所示，该电子设备可以包括：处理器141、存储器142及存储在所述存储器142上并可在处理器141上运行的计算机程序指令，所述处理器141执行所述计算机程序指令时实现前述任一实施例提供的账户风险模型的训练方法或风险用户群体的确定方法。

可选的，该电子设备的上述各个器件之间可以通过系统总线连接。

存储器142可以是单独的存储单元，也可以是集成在处理器中的存储单元。处理器的数量为一个或者多个。

可选的，电子设备还可以包括与其他设备进行交互的接口。

应理解，处理器141可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

系统总线可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。系统总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。存储器可能包括随机存取存储器(random access memory，RAM)，也可能还包括非易失性存储器(non-volatile memory，NVM)，例如至少一个磁盘存储器。

实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储器中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储器(存储介质)包括：只读存储器(read-only memory，ROM)、RAM、快闪存储器、硬盘、固态硬盘、磁带(英文：magnetic tape)、软盘(英文：floppy disk)、光盘(英文：optical disc)及其任意组合。

本申请实施例提供的电子设备，可用于执行上述任一方法实施例提供的账户风险模型的训练方法或风险用户群体的确定方法，其实现原理和技术效果类似，在此不再赘述。

本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机指令，当该计算机指令在计算机上运行时，使得计算机执行上述账户风险模型的训练方法或风险用户群体的确定方法。

上述的计算机可读存储介质，上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器，电可擦除可编程只读存储器，可擦除可编程只读存储器，可编程只读存储器，只读存储器，磁存储器，快闪存储器，磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。

可选的，将可读存储介质耦合至处理器，从而使处理器能够从该可读存储介质读取信息，且可向该可读存储介质写入信息。当然，可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific Integrated Circuits，ASIC)中。当然，处理器和可读存储介质也可以作为分立组件存在于设备中。

本申请实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中，至少一个处理器可以从该计算机可读存储介质中读取该计算机程序，所述至少一个处理器执行所述计算机程序时可实现上述账户风险模型的训练方法或风险用户群体的确定方法。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims

一种账户风险模型的训练方法，其特征在于，包括：

根据多个样本用户账号的交易数据，生成至少一个样本连通图，所述样本连通图中的节点为样本用户账号的账号信息，所述样本连通图中的路径为所述路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额；

针对任一样本连通图，根据预设交易数额和所述样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵；

根据至少一个样本带权邻接矩阵，生成样本训练矩阵集；

使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，所述训练好的账户风险模型用于根据多个待检测用户账号的交易数据和所述预设交易数额，获取每个待检测用户账号的目标风险值。
根据权利要求1所述的方法，其特征在于，所述根据至少一个样本带权邻接矩阵，生成样本训练矩阵集，包括：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易时间和所述样本带权邻接矩阵，获取所述样本用户账号的样本风险向量，所述样本风险向量用于表示所述样本用户账号的初始样本风险值；

根据每个样本带权邻接矩阵和每个样本用户账号的样本风险向量，生成样本训练矩阵集。
根据权利要求2所述的方法，其特征在于，所述针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易时间和所述样本带权邻接矩阵，获取所述样本用户账号的样本风险向量，包括：

针对任一样本带权邻接矩阵中的任一样本用户账号，根据所述样本用户账号与其他的样本用户账号之间的交易频次，交易总额以及与所述样本用户账号进行交易的账号个数，生成第一样本风险值；

根据连接所述样本用户账号的路径对应的权重，生成第二样本风险值；

根据所述样本用户账号的账号信息和与其他的样本用户账号之间的交易时间，生成第三样本风险值；

根据所述样本用户账号与其他的样本用户账号之间的交易关系和交易数额，生成第四样本风险值；

将所述第一样本风险值，所述第二样本风险值，所述第三样本风险值和所述第四样本风险值确定为所述样本风险向量。
根据权利要求1-3任一项所述的方法，其特征在于，所述根据多个样本用户账号的交易数据，生成至少一个样本连通图，包括：

根据多个样本用户账号的交易数据，获取样本知识图谱；

删除所述样本知识图谱中的孤立点，从所述样本知识图谱中获取至少一个样本连通图。
根据权利要求1-4任一项所述的方法，其特征在于，所述使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，包括：

根据所述样本训练矩阵集和多头注意力机制对所述账户风险模型进行训练，得到所述训练好的账户风险模型。
一种风险用户群体的确定方法，其特征在于，包括：

根据多个待检测用户账号的交易数据，生成至少一个目标连通图，所述目标连通图中的节点为待检测用户账号的账号信息，所述目标连通图中的路径为所述路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵；

将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，所述训练好的账户风险模型是使用多个样本用户账号的交易数据以及所述预设交易数额对账户风险模型进行训练得到的；

根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号；

计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体。
根据权利要求6所述的方法，其特征在于，所述计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体，包括：

计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据计算得到的至少一个相似度从其他的待检测用户账号中确定出至少一个第二目标用户账号；

将至少一个第一目标用户账号对应的用户和至少一个第二目标用户账号对应的用户确定为所述风险用户群体。
根据权利要求6或7所述的方法，其特征在于，所述针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵，包括：

针对任一目标连通图，根据所述预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成带权邻接矩阵；

将每个带权邻接矩阵中小于预设权重值的权重元素的值设置为0，生成目标带权邻接矩阵；

相应的，所述生成目标带权邻接矩阵之后，所述方法还包括：

根据每个目标带权邻接矩阵中的至少一个非零元素，生成非零元素向量集，所述非零元素向量集包括第一向量，第二向量和第三向量，所述第一向量用于存储所述目标带权邻接矩阵中所有的非零元素，所述第二向量用于存储所有的非零元素的行位置，所述第三向量用于存储所有的非零元素的列位置；

相应的，所述将至少一个目标带权邻接矩阵输入训练好的账户风险模型，包括：

将至少一个非零元素向量集输入训练好的账户风险模型。
根据权利要求8所述的方法，其特征在于，所述生成目标带权邻接矩阵之后，所述方法还包括：

针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易时间和所述目标带权邻接矩阵，获取所述待检测用户账号的目标风险向量，所述目标风险向量用于表示所述待检测用户账号的初始风险值；

相应的，所述将至少一个目标带权邻接矩阵输入训练好的账户风险模型，包括：

将至少一个非零元素向量集和每个待检测用户账号的风险向量，输入所述训练好的账户风险模型。
根据权利要求9所述的方法，其特征在于，所述针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易时间和所述目标带权邻接矩阵，获取所述待检测用户账号的目标风险向量，包括：

针对任一非零元素向量集中的任一待检测用户账号，根据所述待检测用户账号与其他的待检测用户账号之间的交易频次，交易总额以及与所述待检测用户账号进行交易的账号个数，生成第一初始风险值；

根据连接所述待检测用户账号的路径对应的权重，生成第二初始风险值；

根据所述待检测用户账号的账号信息和与其他的待检测用户账号之间的交易时间，生成第三初始风险值；

根据所述待检测用户账号与其他的待检测用户账号之间的交易关系和交易数额，生成第四初始风险值；

将所述第一初始风险值，所述第二初始风险值，所述第三初始风险值和所述第四初始风险值确定为所述目标风险向量。
根据权利要求9或10所述的方法，其特征在于，所述获取每个待检测用户账号的目标风险值之后，所述方法还包括：

获取更新后的目标风险向量；

相应的，所述计算每个第一目标用户账号与其他的待检测用户账号的相似度，包括：

根据所述更新后的目标风险向量，计算每个第一目标用户账号与其他的待检测用户账号的第一相似度；

根据每个第一目标用户账号与其他的待检测用户账号之间的交易时间，计算每个第一目标用户账号与其他的待检测用户账号的第二相似度；

根据每个第一目标用户账号与其他的待检测用户账号之间的交易金额，计算每个第一目标用户账号与其他的待检测用户账号的第三相似度；

根据所述第一相似度，所述第二相似度和所述第三相似度，生成每个第一目标用户账号与其他的待检测用户账号的相似度。
根据权利要求6-11任一项所述的方法，其特征在于，所述根据多个待检测用户账号的交易数据，生成至少一个目标连通图，包括：

根据多个待检测用户账号的交易数据，构建目标知识图谱；

删除所述目标知识图谱中的孤立点，获取至少一个初始连通图；

舍弃节点数量小于预设节点数量的初始连通图，将节点数量大于或等于所述预设节点数量的初始连通图确定为目标连通图。
一种账户风险模型的训练装置，其特征在于，包括：

生成模块，用于根据多个样本用户账号的交易数据，生成至少一个样本连通图，所述样本连通图中的节点为样本用户账号的账号信息，所述样本连通图中的路径为所述路径连接的两个节点对应的样本用户账号之间的交易关系和交易数额，所述账号信息包括样本用户账号的样本风险值，所述样本风险值为所述样本用户账号存在异常操作的可能性；

所述生成模块，还用于针对任一样本连通图，根据预设交易数额和所述样本连通图中的每个路径对应的交易数额，生成样本带权邻接矩阵；

所述生成模块，还用于根据至少一个样本带权邻接矩阵，生成样本训练矩阵集；

训练模块，用于使用所述样本训练矩阵集对账户风险模型进行训练，得到训练好的账户风险模型，所述训练好的账户风险模型用于根据多个待检测用户账号的交易数据和所述预设交易数额，获取每个待检测用户账号的目标风险值。
一种风险用户群体的确定装置，其特征在于，包括：

生成模块，用于根据多个待检测用户账号的交易数据，生成至少一个目标连通图，所述目标连通图中的节点为待检测用户账号的账号信息，所述目标连通图中的路径为所述路径连接的两个节点对应的待检测用户账号之间的交易关系和交易数额；

所述生成模块，还用于针对任一目标连通图，根据预设交易数额和所述目标连通图中的每个路径对应的交易数额，生成目标带权邻接矩阵；

输入模块，用于将至少一个目标带权邻接矩阵输入训练好的账户风险模型，获取每个待检测用户账号的目标风险值，所述目标风险值为所述待检测用户账号存在异常操作的可能性，所述训练好的账户风险模型是使用多个样本用户账号的交易数据以及所述预设交易数额对账户风险模型进行训练得到的；

确定模块，用于根据每个待检测用户账号的目标风险值，从待检测用户账号中确定出至少一个第一目标用户账号；

所述确定模块，还用于计算每个第一目标用户账号与其他的待检测用户账号的相似度，根据所述待检测用户账号对应的用户中确定出风险用户群体。
一种电子设备，包括：处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序指令，其特征在于，所述处理器执行所述计算机程序指令时用于实现如权利要求1至12任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1至12任一项所述的方法。
一种计算机程序，其特征在于，包括程序代码，当计算机运行所述计算机程序时，所述程序代码执行如权利要求1至12任一项所述的方法。