CN116127353A

CN116127353A - 分类方法、分类模型训练方法、设备及介质

Info

Publication number: CN116127353A
Application number: CN202211693477.3A
Authority: CN
Inventors: 赵宏宇; 赵国庆; 蒋宁; 肖冰
Original assignee: Mashang Xiaofei Finance Co Ltd
Current assignee: Mashang Xiaofei Finance Co Ltd
Priority date: 2022-12-28
Filing date: 2022-12-28
Publication date: 2023-05-16

Abstract

本申请提供的一种分类方法、分类模型训练方法、设备及介质，涉及人工智能技术领域。该方法包括：获取目标对象的图结构，在得到图结构后，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据，并对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，在筛选出K个节点后，对K个节点进行分类，进而确定出目标对象的类别。采用本技术方案，能够避免由于模型初始参数的随机性导致的分类不准确的问题，用上述节点的类别作为目标对象的类别，若节点所代表的用户具备欺诈属性，则该团队具备欺诈属性，这样可以实现对欺诈团队的预警，进而提升金融安全性。

Description

分类方法、分类模型训练方法、设备及介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种分类方法、分类模型训练方法、设备及介质。

背景技术

目前，金融欺诈基本都是通过团伙有组织地进行。因此，越来越多的金融公司采用关系网络进行反欺诈检测。关系网络指的是一种基于图的数据结构，由节点和边组成。图的结构不是一个连通的结构，而是由一个个孤立的团体组成的网络，每个团体可以认为是一个图的数据结构。

目前，根据图的数据结构识别欺诈团队的准确率比较低，导致无法真正确定出欺诈团体。

因此，亟需一种分类方法、分类模型训练方法，能够改善上述情况，进而能够准确地识别出欺诈团体，提升金融安全性。

发明内容

本申请提供一种分类方法、分类模型训练方法、设备及介质，能够准确地识别出欺诈团体，提升金融安全性。

第一方面，本申请提供一种分类方法，所述方法包括：

获取目标对象的图结构，所述目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，所述图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；

根据所述图结构，确定所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据；

对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，所述K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点；

对所述K个节点进行分类，得到所述目标对象的类别；其中，所述目标对象的类别表征所述目标对象的属性信息，其中，N为正整数，K为小于N的正整数。

在一个示例中，所述对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，包括：

将所述每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据输入至分类模型中的图卷积层进行特征提取，确定所述每个节点的目标特征向量；

将所述N个节点的目标特征向量输入至所述分类模型中的图池化层进行节点重要性评估，得到K个节点。

在一个示例中，所述将所述N个节点的目标特征向量输入至所述分类模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于所述分类模型中的图池化层，对所述每个节点的目标特征向量进行预设维度的投影计算，得到所述每个节点的投影数值；其中，所述预设维度是由所述分类模型中的图池化层的参数值确定的；

对所述每个节点的投影数值进行幂次函数处理，得到所述每个节点的重要性分数；

基于所述每个节点的重要性分数，得到K个节点。

在一个示例中，所述对所述每个节点的投影数值进行幂次函数处理，得到所述每个节点的重要性分数，包括：

对所述每个节点的投影数值进行二次幂函数的处理，得到第一处理结果；

对所述每个节点的投影数值进行三次幂函数的处理，得到第二处理结果；

根据所述投影数值、所述第一处理结果和所述第二处理结果，得到所述每个节点的重要性分数。

在一个示例中，所述对所述K个节点进行分类，得到所述目标对象的类别，包括：

根据所述K个节点的目标特征向量，确定所述K个节点的平均目标特征向量以及所述K个节点的最大目标特征向量；

基于所述分类模型的多层感知机，对所述K个节点的平均目标特征向量以及所述K个节点的最大目标特征向量进行处理，得到所述目标对象的类别。

第二方面，本申请提供一种分类模型训练方法，所述方法包括：

获取训练对象的图结构和所述训练对象的类别；其中，所述训练对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户；所述图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；所述训练对象的类别表征所述训练对象的属性信息，其中，N为正整数，K为小于N的正整数；

对所述K个节点进行分类，得到所述训练对象的预测类别；

根据所述训练对象的类别和所述训练对象的预测类别，训练初始模型，以得到分类模型；其中，所述分类模型用于对所述目标对象的图结构进行分类，以确定所述目标对象的类别。

将所述每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据输入至初始模型中的图卷积层进行特征提取，确定所述每个节点的目标特征向量；

将所述N个节点的目标特征向量输入至所述初始模型中的图池化层进行节点重要性评估，得到K个节点。

在一个示例中，所述将所述N个节点的目标特征向量输入至所述初始模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于所述初始模型中的图池化层，对所述每个节点的目标特征向量进行预设维度的投影计算，得到所述每个节点的投影数值；其中，所述预设维度是由所述初始模型中的图池化层的参数值确定的；

基于所述每个节点的重要性分数，得到K个节点。

第三方面，本申请提供一种分类装置，所述装置包括：

第一获取单元，用于获取目标对象的图结构，所述目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，所述图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；

第一确定单元，用于根据所述图结构，确定所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据；

第一重要性评估单元，用于对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，所述K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点；

第一分类单元，用于对所述K个节点进行分类，得到所述目标对象的类别；其中，所述目标对象的类别表征所述目标对象的属性信息，其中，N为正整数，K为小于N的正整数。

第四方面，本申请提供一种分类模型训练装置，所述装置包括：

第二获取单元，用于获取训练对象的图结构和所述训练对象的类别；其中，所述训练对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户；所述图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；所述训练对象的类别表征所述训练对象的属性信息，其中，N为正整数，K为小于N的正整数；

第二确定单元，用于根据所述图结构，确定所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据；

第二重要性评估单元，用于对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，所述K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点；

第二分类单元，用于对所述K个节点进行分类，得到所述训练对象的预测类别；

训练单元，用于根据所述训练对象的类别和所述训练对象的预测类别，训练初始模型，以得到分类模型；其中，所述分类模型用于对所述目标对象的图结构进行分类，以确定所述目标对象的类别。

第五方面，本申请提供一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如第一方面或第二方面所述的方法。

第六方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面或第二方面所述的方法。

第七方面，本申请提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如第一方面或第二方面所述的方法。

本申请提供的一种分类方法、分类模型训练方法、设备及介质，该方法包括：获取目标对象的图结构，其中，目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，图结构包括N个节点，每个节点表征注册预设账户信息的一个用户，在得到图结构后，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据，并对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，在筛选出K个节点后，对K个节点进行分类，进而确定出目标对象的类别。采用本技术方案，能够对组成图结构的N个用户进行准确的分类，进而确定出能够代表该图结构的节点，能够避免由于模型初始参数的随机性导致的分类不准确的问题。用上述节点的类别作为目标对象的类别，若节点所代表的用户具备欺诈属性，则该团队具备欺诈属性，这样可以实现对欺诈团队的预警，进而提升金融安全性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

图1是根据本申请实施例一提供的一种分类方法的流程示意图；

图2是根据本申请实施例二提供的一种分类方法的流程示意图；

图3是根据本申请实施例二提供的一种全局图池化模型结构示意图；

图4是根据本申请实施例二提供的一种分层图池化模型结构示意图；

图5是根据本申请实施例三提供的一种分类模型训练方法的流程示意图；

图6是根据本申请实施例四提供的一种分类装置示意图；

图7是根据本申请实施例五提供的一种分类模型训练装置的示意图；

图8是根据一示例性实施例示出的一种电子设备的框图。

通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

对于传统的图神经网络模型，虽然也能够将图结构中的重要节点筛选出来，用筛选出的重要节点表征图结构。但是，由于传统的图神经网络模型中图池化层初始的模型参数值是随机选择的，因此，会导致根据图池化层确定的预设维度的向量值是随机的，这样就会导致图结构中节点进行投影后，得到的投影值具备一定的随机性，导致投影值的大小并不一定能够表征该节点的特征是最明显的。

因此，本申请中，为了避免由于初始的模型参数值导致的结果不准确的问题，而采用了对重要节点的投影值进行拉伸，从而增强重要节点之间的区别性，使得这些具有区分度、5代表性的少数重要节点通过分类模型进行自适应的筛选，进而提升结果的准确性。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

图1是根据本申请实施例一提供的一种分类方法的流程示意图。本申请由电子设备执0行，具体的，该电子设备可以是可以为服务器，也可以为智能终端，智能终端可以以各种形式来实施。例如，本申请中描述的智能终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理、便捷式媒体播放器、导航装置、可穿戴设备、智能手环、计步器等智能终端，以及诸如台式计算机等固定终端。实施例一中包括如下步骤：

S101、获取目标对象的图结构，目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，图结构包括N个节点；每个节点表征注册预设账户信息的一个用户。

本实施例中，预设账户信息是应用程序中的账户信息或者是浏览网站上的账户信息。用户的地理位置在预设范围内是指用户的经纬度地址信息、GPS数据信息、IP数据信息以及OCR数据信息在预设范围内，其中，预设范围可以是15米以内的距离，本领域技术人员应当知晓，预设范围是可以预先设定的，在此只是举例说明，并不做具体限制。本申请的技术方案中，所涉及的金融数据或用户数据等信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

本实施例中，图结构还包括节点之间的连线，节点之间连线是用户之间的关联关系，其中，关联关系可以是用户的地理位置的关联关系。

S102、根据图结构，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据。

本实施例中，节点的初始特征数据包括多个维度的特征数据，具体包括：用户的基础特征数据、用户的业务特征数据和用户的衍生特征数据。其中，用户的基础特征数据包括

用户的姓名、用户的年龄和用户的工作单位等；用户的业务特征数据包括合同编号、合同0金额和贷款期数；用户的衍生特征数据包括贷款合同的数量、合同总额、逾期总额和预设期限的逾期次数，其中，预设期限可以是1个月的逾期次数、3个月的逾期次数和5个月的逾期次数。

本实施例中，每个节点的邻阶矩阵数据表征该节点与其他节点之间的连接关系的矩阵，可以从邻阶矩阵数据中看出节点之间的结构关系，其中，结构关系是指节点之间是具备连接关系的还是不具备连接关系的。

S103、对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点。

本实施例中，节点重要性评估是评估每一个节点在N个节点中的重要性程度或者权重信息，节点在N个节点中的重要性分数越高，则该节点在N个节点中的重要性程度越高或者权重信息越大。

本实施例中，对于N个节点而言，节点重要性分数能够满足预设阈值的节点可能不止一个，因此，可以设定预设阈值，从N个节点中筛选出K个节点，进而通过K个节点代表该目标对象的图结构。

S104、对K个节点进行分类，得到目标对象的类别；其中，目标对象的类别表征目标对象的属性信息，其中，N为正整数，K为小于N的正整数。

在一个示例中，对K个节点进行分类，分类结果代表目标对象的类别，进而能够确定目标对象的属性信息。例如，可以得到目标对象的类别是欺诈团队还是非欺诈团队。

本申请提供的一种分类方法，该方法包括：获取目标对象的图结构，其中，目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，图结构包括N个节点，每个节点表征注册预设账户信息的一个用户，在得到图结构后，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据，并对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，在筛选出K个节点后，对K个节点进行分类，进而确定出目标对象的类别。采用本技术方案，能够对组成图结构的N个用户进行分类，进而确定出能够代表该图结构的节点，用上述节点的类别作为目标对象的类别，若节点所代表的用户具备欺诈属性，则该团队具备欺诈属性，这样可以实现对欺诈团队的预警，进而提升金融安全性。

图2是根据本申请实施例二提供的一种分类方法的流程示意图。实施例二中包括如下步骤：

S201、获取目标对象的图结构，目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，图结构包括N个节点；每个节点表征注册预设账户信息的一个用户。

示例性地，本步骤可以参见上述步骤S101，不再赘述。

S202、根据图结构，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据。

示例性地，本步骤可以参见上述步骤S102，不再赘述。

S203、将每个节点的初始特征数据以及每个节点的邻阶矩阵数据输入至分类模型中的图卷积层进行特征提取，确定每个节点的目标特征向量。

本实施例中，每一个节点的目标特征向量是融合了该节点的初始特征数据以及该节点的邻阶矩阵数据后，得到的特征向量。每一个节点的目标特征向量既能够代表该节点的节点信息，又能够代表该节点的结构信息。

为了更好地说明分类模型中的图卷积层特征提取的过程，令节点为Xi，i用于区分不同的节点，其中，Xi为N个C维的初始特征数据，C表征每一个节点特征数据的维度，例如，节点特征数据的维度为用户的姓名、用户的年龄、用户的工作单位、合同编号、合同金额和贷款期数，则C为6；令该节点的邻阶矩阵数据为A，A的维度为N*N的矩阵数据，每个节点的目标特征向量为H_i(l+1)，其中，H_i(l+1)为N个F维的向量，N为节点的数量，F表征每一个节点目标特征向量的维度，l表示图卷积层的层数。

本实施例中，可以通过如下公式确定每个节点的目标特征向量：

其中，σ为激活函数，可以为ReLU，W₀为图卷积层N*F维的参数，为A的归一化矩阵，D为A的度矩阵。

S204、将N个节点的目标特征向量输入至分类模型中的图池化层进行节点重要性评估，得到K个节点；其中，K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点。

本实施例中，分类模型中的图池化层能够根据输入的N个节点的目标特征向量对N个节点计算重要性分数，并从N个重要性分数中筛选出K个满足预设阈值的重要性分数，将这K个重要性分数对应的K个节点作为分类模型的图池化层。

在一个示例中，将N个节点的目标特征向量输入至分类模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于分类模型中的图池化层，对每个节点的目标特征向量进行预设维度的投影计算，得到每个节点的投影数值；其中，预设维度是由分类模型中的图池化层的参数值确定的；

对每个节点的投影数值进行幂次函数处理，得到每个节点的重要性分数；

基于每个节点的重要性分数，得到K个节点。

本实施例中，每个节点的投影数值是由每个节点的目标特征向量在预设维度进行投影得到的，本实施例中，N个节点可以得到N个投影数值。本实施例中，基于分类模型中的图池化层得到每个节点的投影数值可以通过如下公式实现：

其中，Ri是每个节点的投影数值，为A的归一化矩阵，每个节点的目标特征向量为H_i(l+1)，i用于区分不同的节点，W_f为分类模型中的图池化层的参数值，W_f可以确定预设维度。

本实施例中，每个节点的重要性分数可以由Ri确定，这里设节点的重要性分数为Rj，Rj为对Ri进行幂次函数处理后得到的，其中，j为小于等于N的数值，从Rj中筛选出K个节点的重要性分数，具体的，可以通过如下公式确定：

S_f＝sigmoid(TopK(R_j))；

其中，f为小于等于K的值，sigmoid是激活函数.TopK函数用于获取满足预设阈值的K个节点。

具体的，在一个示例中，对每个节点的投影数值进行幂次函数处理，得到每个节点的重要性分数，包括：

对每个节点的投影数值进行二次幂函数的处理，得到第一处理结果；

对每个节点的投影数值进行三次幂函数的处理，得到第二处理结果；

根据投影数值、第一处理结果和第二处理结果，得到每个节点的重要性分数。

本实施例中，第一处理结果为第二处理结果为则每个节点的重要性分数Rj可以由如下公式确定：

其中，α、β和λ可以进行预先设置。

本实施例中，为了保证图结构的维度不变，则对图结构在图池化层做如下操作：

M＝M(a,b)·H_i(l+1)；

其中，a和b表示每一个节点在图结构中的位置，M为图池化层的输出结果，H_i(l+1)为每个节点的目标特征向量。

S205、根据K个节点的目标特征向量，确定K个节点的平均目标特征向量以及K个节点的最大目标特征向量。

本实施例中，K个节点的平均目标特征向量可以通过如下公式计算：

其中，K为节点数，H_i(l+1)为每个节点的目标特征向量，由于Hi(l+1)为F维，则Y₁为F维，Y₁为平均目标特征向量，其中，Y₁为1*F维。

本实施例中，K个节点的最大目标特征向量可以通过如下公式计算：

Y₂＝max(H_i(l+1))；

其中，Y₂为最大目标特征向量，H_i(l+1)为每个节点的目标特征向量，由于H_i(l+1)为F维，则Y₂为F维，是在每一个维度选数值最大的节点，其中，Y₂为1*F维。

S206、基于分类模型的多层感知机，对K个节点的平均目标特征向量以及K个节点的最大目标特征向量进行处理，得到目标对象的类别。其中，目标对象的类别表征目标对象的属性信息，其中，N为正整数，K为小于N的正整数。

本实施例中，将K个节点的平均目标特征向量以及K个节点的最大目标特征向量进行拼接，得到K₃。通过分类模型的多层感知机对K₃进行处理，得到目标对象的类别。

本实施例中，分类模型可以为全局图池化模型或者分层图池化模型。具体的，可以参见图3中示出的一种全局图池化模型结构示意图，其中，全局图池化模型是由三个图卷积层、一个图池化层、一个输出层以及多层感知机组成，在全局图池化模型中输入图结构，输出目标对象的类别。图4中示出的一种分层图池化模型结构示意图。分层图池化模型由三个图卷积层、三个图池化层以及三个输出层组成。其中，第一个图卷积层和第一个图池化层的结果作为第一个输出层的结果，第一个图卷积层和第一个图池化层的结果也为第二个图卷积层的输入。第二个图卷积层和第二个图池化层的结果作为第二个输出层的输出结果，第二个图卷积层和第二个图池化层的结果也为第三个图卷积层的输入。第三个图卷积层和第三个图池化层的结果作为第三个输出层的输出结果。第一个输出层的输出结果、第二个输出层的输出结果和第三个输出层的输出结果拼接后，将拼接结果输入至多层感知机，由多层感知机输出目标对象的类别。

本实施例中，如果是全局图池化模型，则可以通过如下公式表示目标对象的类别：

Z₁＝MLP(Y₁+Y₂)；

其中，Y₁为平均目标特征向量，Y₂为最大目标特征向量，其中，MLP表征多层感知机。

如果是分层图池化模型，则可以通过如下公式表示目标对象的类别：

Y_3m＝Y₁+Y₂；

Z₂＝MLP(Y₃₁+Y₃₂+Y₃₃)；

其中，Y₁为平均目标特征向量，Y₂为最大目标特征向量，Y_3m表征平均目标特征向量和最大目标特征向量的求和结果。其中，m＝3，表示3层输出层；Y₃₁表征第一层输出层的结果，Y₃₂表征第二层输出层的结果，Y₃₃表征第三层输出层的结果。

本实施例中，通过公开数据验证分类模型。通过与DiffPool、gPool、SAGPool等模型进行比较，实验数据采用公开数据集D&D、PROTEINS和NCI1。使用Accuracy来评估预测的效果。具体的实验结果参见表1，所有模型运行10次取平均值。

表1分类模型与其他模型的比较结果

Model	D&D	PROTEINS	NCI1
				<![CDATA[DiffPool<sub>g</sub>]]>	71.27±0.84	66.06±1.66	68.55±1.92
<![CDATA[gPool<sub>g</sub>]]>	72.53±1.19	66.72±3.56	73.82±0.96
				<![CDATA[SAGPool<sub>g</sub>]]>	76.19±0.94	70.04±1.47	74.18±1.20
<![CDATA[MA-Pool<sub>g</sub>]]>	78.49±2.29	75.35±1.53	76.15±1.70
				<![CDATA[DiffPool<sub>h</sub>]]>	66.95±2.41	68.20±2.02	62.32±1.90
<![CDATA[gPool<sub>h</sub>]]>	75.01±0.86	71.10±0.90	67.02±2.25
				<![CDATA[SAGPool<sub>h</sub>]]>	76.45±0.97	71.86±0.97	67.45±1.11
<![CDATA[MA-Pool<sub>h</sub>]]>	77.25±1.47	74.82±1.99	72.85±2.55

从表1中可以看出，对于公开数据集D&D、PROTEINS和NCI1，MA-Poolg的结果准确度是高于DiffPool、gPool、SAGPool等模型的，其中，MA-Poolg表征全局图池化模型。对于公开数据集D&D、PROTEINS和NCI1，MA-Poolh的结果准确度是高于DiffPool、gPool、SAGPool等模型的，其中，MA-Poolh表征分层图池化模型。

本申请提供的一种分类方法，该方法包括：获取目标对象的图结构，根据图结构中每个节点的初始特征数据以及每个节点的邻阶矩阵数据，确定每一个节点的目标特征向量，并对每一个节点的目标特征向量进行预设维度的投影计算，得到每个节点的投影数值，并确定每个节点的重要性分数，得到K个节点，并基于分类模型的多层感知机，对K个节点的平均目标特征向量以及K个节点的最大目标特征向量进行处理，得到目标对象的类别。采用本技术方案，对重要性分数进行拉伸，从而增强重要节点之间的区别性，自适应找到具有典型特征的、少量特征的个体，将他们的特征作为图结构的特征进行分类，提升金融安全性。

图5是根据本申请实施例三提供的一种分类模型训练方法的流程示意图。实施例三中包括如下步骤：

S501、获取训练对象的图结构和所述训练对象的类别；其中，训练对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户；图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；训练对象的类别表征训练对象的属性信息，其中，N为正整数，K为小于N的正整数。

示例性地，本步骤可以参见上述步骤S101，不再赘述。

S502、根据图结构，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据。

示例性地，本步骤可以参见上述步骤S102，不再赘述。

S503、对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点。

示例性地，本步骤可以参见上述步骤S103，不再赘述。

S504、对K个节点进行分类，得到训练对象的预测类别。

示例性地，本步骤可以参见上述步骤S104，不再赘述。

S505、根据训练对象的类别和训练对象的预测类别，训练初始模型，以得到分类模型；其中，分类模型用于对目标对象的图结构进行分类，以确定目标对象的类别。

本实施例中，若训练对象的类别与训练对象的预测类别一致，则可以确定此时的模型为分类模型；若训练对象的类别与训练对象的预测类别不一致，则继续训练初始模型，直至训练对象的类别与训练对象的预测类别一致，并将此时的模型作为分类模型。

在一个示例中，对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，包括：

将每个节点的初始特征数据以及每个节点的邻阶矩阵数据输入至初始模型中的图卷积层进行特征提取，确定每个节点的目标特征向量；

将N个节点的目标特征向量输入至初始模型中的图池化层进行节点重要性评估，得到K个节点。

在一个示例中，将N个节点的目标特征向量输入至初始模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于初始模型中的图池化层，对每个节点的目标特征向量进行预设维度的投影计算，得到每个节点的投影数值；其中，预设维度是由初始模型中的图池化层的参数值确定的；

基于每个节点的重要性分数，得到K个节点。

在一个示例中，对每个节点的投影数值进行幂次函数处理，得到每个节点的重要性分数，包括：

在一个示例中，对K个节点进行分类，得到训练对象的预测类别，包括：

根据K个节点的目标特征向量，确定K个节点的平均目标特征向量以及K个节点的最大目标特征向量；

基于初始模型的多层感知机，对K个节点的平均目标特征向量以及K个节点的最大目标特征向量进行处理，得到训练对象的预测类别。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述方法的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请所提出的分类方法、分类模型训练方法可以应用于金融欺诈场景下。目前，金融欺诈基本都是通过团伙有组织的进行。因此，越来越多的金融公司采用关系网络进行反欺诈检测。关系网络就可以用本申请中的图结构所表征，以贷前用户申请贷款为例，申请时GPS接近的用户可以构成图结构，即一个团体。该团体中包括多个节点，每一个节点表征一个用户，每一个用户都有自身的特征，包括用户的基础信息，如姓名、年龄、工作单位等；包括业务信息，如合同编号、合同金额、贷款期数等；包括衍生特征，如贷款合同数量：合同总额、逾期总额、近1月/3月/5月逾期次数等。通过单个用户的特征可以分析得到整个团体是否为欺诈团体的可能性。

本申请中，分类模型的目标是找到能够代表整个图结构的少数节点，用这些少数节点作为图结构的特征，判断图结构的性质，判断团体是否为欺诈团体。本申请中，分类模型能够凸显具有欺诈行为的节点，当节点特征投影进行非线性拉伸时，能够得到少数具有区别性特征的节点，并保留下来。传统的图神经网络方法，有一定的可能性将边缘节点漏掉，因为边缘节点没有较多的邻居节点进行特征聚合，自身的节点信息不够丰富，有可能提前被删除掉。本申请更加关注少数节点，边缘节点虽然信息量较少，但是自身具备区分度较高的特征，也具备少数节点体现图结构的特点，所以有一定的概率不被删除掉，从而获得比传统图神经网络更好的图分类结果。

图6是根据本申请实施例四提供的一种分类装置示意图。实施例四中的装置60包括：

第一获取单元601，用于获取目标对象的图结构，目标对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户，图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；

第一确定单元602，用于根据图结构，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据；

第一重要性评估单元603，用于对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点；

第一分类单元604，用于对K个节点进行分类，得到目标对象的类别；其中，目标对象的类别表征目标对象的属性信息，其中，N为正整数，K为小于N的正整数。

在一个示例中，第一重要性评估单元603，用于：

将每个节点的初始特征数据以及每个节点的邻阶矩阵数据输入至分类模型中的图卷积层进行特征提取，确定每个节点的目标特征向量；

将N个节点的目标特征向量输入至分类模型中的图池化层进行节点重要性评估，得到K个节点。

第一重要性评估单元603，用于：

基于每个节点的重要性分数，得到K个节点。

第一重要性评估单元603，用于：对每个节点的投影数值进行二次幂函数的处理，得到第一处理结果；

在一个示例中，第一分类单元604，用于根据K个节点的目标特征向量，确定K个节点的平均目标特征向量以及K个节点的最大目标特征向量；

基于分类模型的多层感知机，对K个节点的平均目标特征向量以及K个节点的最大目标特征向量进行处理，得到目标对象的类别。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图7是根据本申请实施例五提供的一种分类模型训练装置的示意图。实施例五中的装置70包括：

第二获取单元701，用于获取训练对象的图结构和训练对象的类别；其中，训练对象为注册预设账户信息时用户的地理位置在预设范围内的N个用户；图结构包括N个节点；每个节点表征注册预设账户信息的一个用户；训练对象的类别表征训练对象的属性信息，其中，N为正整数，K为小于N的正整数；

第二确定单元702，用于根据图结构，确定N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据；

第二重要性评估单元703，用于对N个节点中每个节点的初始特征数据以及每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点；其中，K个节点为基于每个节点的重要性分数从N个节点中筛选重要性分数满足预设阈值的节点；

第二分类单元704，用于对K个节点进行分类，得到训练对象的预测类别；

训练单元705，用于根据训练对象的类别和训练对象的预测类别，训练初始模型，以得到分类模型；其中，分类模型用于对目标对象的图结构进行分类，以确定目标对象的类别。

在一个示例中，第二重要性评估单元703，用于：

在一个示例中，第二重要性评估单元703，还用于：

基于每个节点的重要性分数，得到K个节点。

在一个示例中，第二重要性评估单元703，还用于：

在一个示例中，第二分类单元704，用于根据K个节点的目标特征向量，确定K个节点的平均目标特征向量以及K个节点的最大目标特征向量；

图8是根据一示例性实施例示出的一种电子设备的框图，该设备可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

电子设备800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)接口812，传感器组件814，以及通信组件816。

处理组件802通常控制电子设备800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为电子设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当电子设备800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为电子设备800提供各个方面的状态评估。例如，传感器组件814可以检测到电子设备800的打开/关闭状态，组件的相对定位，例如所述组件为电子设备800的显示器和小键盘，传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变，用户与电子设备800接触的存在或不存在，电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由电子设备800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当该存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述电子设备的一种分类方法、分类模型训练方法。

本申请还公开了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如本实施例中所述的方法。

本申请以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或电子设备上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据电子设备)、或者包括中间件部件的计算系统(例如，应用电子设备)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和电子设备。客户端和电子设备一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-电子设备关系的计算机程序来产生客户端和电子设备的关系。电子设备可以是云电子设备，又称为云计算电子设备或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。电子设备也可以为分布式系统的电子设备，或者是结合了区块链的电子设备。应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求书指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。

Claims

1.一种分类方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述N个节点的目标特征向量输入至所述分类模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于所述每个节点的重要性分数，得到K个节点。

4.根据权利要求3所述的方法，其特征在于，所述对所述每个节点的投影数值进行幂次函数处理，得到所述每个节点的重要性分数，包括：

5.根据权利要求2所述的方法，其特征在于，所述对所述K个节点进行分类，得到所述目标对象的类别，包括：

6.一种分类模型训练方法，其特征在于，所述方法包括：

对所述K个节点进行分类，得到所述训练对象的预测类别；

根据所述训练对象的类别和所述训练对象的预测类别，训练初始模型，以得到分类模型；其中，所述分类模型用于对目标对象的图结构进行分类，以确定所述目标对象的类别。

7.根据权利要求6所述的方法，其特征在于，所述对所述N个节点中每个节点的初始特征数据以及所述每个节点的邻阶矩阵数据进行节点重要性评估，得到K个节点，包括：

8.根据权利要求7所述的方法，其特征在于，所述将所述N个节点的目标特征向量输入至所述初始模型中的图池化层进行节点重要性评估，得到K个节点，包括：

基于所述每个节点的重要性分数，得到K个节点。

9.一种电子设备，其特征在于，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如权利要求1-5或者权利要求6中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-5或权利要求6中任一项所述的方法。

11.一种计算机程序产品，其特征在于，包括计算机程序，该计算机程序被处理器执行时实现如权利要求1-5或权利要求6中任一项所述的方法。