CN116010793A

CN116010793A - 分类模型训练方法及装置、类别检测方法

Info

Publication number: CN116010793A
Application number: CN202310007561.3A
Authority: CN
Inventors: 梁倩乔; 韩冰; 卫华; 李江; 郭胜
Original assignee: Zhejiang eCommerce Bank Co Ltd
Current assignee: Zhejiang eCommerce Bank Co Ltd
Priority date: 2023-01-04
Filing date: 2023-01-04
Publication date: 2023-04-25

Abstract

本说明书实施例提供分类模型训练方法及装置、类别检测方法，其中，该分类模型训练方法，包括：确定无标签的样本用户集合、以及有标签的正样本用户集合；将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

Description

分类模型训练方法及装置、类别检测方法

技术领域

本说明书实施例涉及计算机技术领域，特别涉及分类模型训练方法及装置、类别检测方法。

背景技术

欺诈检测指的是通过学习欺诈者的行为模式，从所有用户中识别出欺诈者，从而防止欺诈者通过系统漏洞或者其他手段，获得不合法财产的检测。欺诈检测应用于许多行业，例如银行行业的伪造支票、盗用信用卡等，保险行业中夸大损失、伪造事故等。

目前，研究者尝试利用有监督的深度学习来训练欺诈检测分类器，基于有监督的深度学习的欺诈检测，把标注的欺诈者作为正样本，未被标注的欺诈者作为负样本，进行有监督的深度学习。

但是，一方面，在现实生活中，银行或者保险公司等主体只有在欺诈者发生欺诈之后，才能清晰确认欺诈者的身份并对其进行标注，而难以确定未被标注的用户的真实身份。事实上，未被标注为正样本的用户中也包含欺诈用户。另一方面，欺诈检测中天然存在数据不平衡问题，即欺诈用户的数量远小于非欺诈用户的数量。这就使得有监督的深度学习的欺诈检测的效果受限。

发明内容

有鉴于此，本说明书实施例提供了一种分类模型训练方法。本说明书一个或者多个实施例同时涉及一种分类模型训练装置，一种类别检测方法，一种类别检测装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，以解决现有技术中存在的技术缺陷。

根据本说明书实施例的第一方面，提供了一种分类模型训练方法，包括：

确定无标签的样本用户集合、以及有标签的正样本用户集合；

将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；

将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；

根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

根据本说明书实施例的第二方面，提供了一种分类模型训练装置，包括：

样本用户确定模块，被配置为确定无标签的样本用户集合、以及有标签的正样本用户集合；

聚类模块，被配置为将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；

分类模块，被配置为将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；

模型训练模块，被配置为根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

根据本说明书实施例的第三方面，提供了一种类别检测方法，包括：

确定待检测用户；

将所述待检测用户输入所述分类模型，获得所述待检测用户的目标类别，其中，所述分类模型为上述分类模型训练方法中的分类模型。

根据本说明书实施例的第四方面，提供了一种类别检测装置，包括：

用户确定模块，被配置为确定待检测用户；

类别确定模块，被配置为将所述待检测用户输入所述分类模型，获得所述待检测用户的目标类别，其中，所述分类模型为上述分类模型训练方法中的分类模型。

根据本说明书实施例的第五方面，提供了一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现上述分类模型训练方法的步骤或者上述类别检测方法的步骤。

根据本说明书实施例的第六方面，提供了一种计算机可读存储介质，其存储有计算机可执行指令，该指令被处理器执行时实现上述分类模型训练方法的步骤或者上述类别检测方法的步骤。

根据本说明书实施例的第七方面，提供了一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述分类模型训练方法的步骤或者上述类别检测方法的步骤。

本说明书一个实施例提供了一种分类模型训练方法，包括：确定无标签的样本用户集合、以及有标签的正样本用户集合；将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

具体的，该分类模型训练方法，针对欺诈检测中的数据类别不平衡以及数据未标注进行有监督的深度学习造成检测效果较差问题的情况下，根据无标签的样本用户以及有标签的样本用户，对分类模型进行半监督训练；通过将聚类模型引入欺诈检测场景的分类模型训练中，无监督地学习未标注数据的类别以及复杂分布，并通过将分类模型引入欺诈检测场景的分类模型训练中，结合聚类模型的聚类结果半监督地学习有标注数据以及未标注数据的类别，极大的提升了分类模型的后续类别检测性能。

附图说明

图1是本说明书一个实施例提供的一种分类模型训练方法的流程图；

图2是本说明书一个实施例提供的一种类别检测方法的流程图；

图3是本说明书一个实施例提供的一种分类模型训练装置的结构示意图；

图4是本说明书一个实施例提供的一种类别检测装置的结构示意图；

图5是本说明书一个实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本说明书内涵的情况下做类似推广，因此本说明书不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本说明书一个或多个实施例涉及的名词术语进行解释。

正例与未标注学习：PU Learning(Positive-unlabeled learning)是半监督学习的一个研究方向，指在只有正样本数据和无标记数据(即无标签的数据)的情况下，训练二分类器。

聚类：聚类是一种包括数据点分组的机器学习技术；给定一组数据点，可以用聚类算法将每个数据点分到特定的组中。理论上，属于同一组的数据点应该有相似的属性和/或特征，而属于不同组的数据点应该有非常不同的属性和/或特征。聚类是一种无监督学习的方法，是一种在许多领域常用的统计数据分析技术。

经验风险预估器：经验风险最小化是机器学习分类问题的基本策略之一，是基于训练集所有样本点损失函数的平均最小化。经验风险是局部优选，是现实的可求的。

数据类别不平衡：数据类别不平衡(class imbalance)，也叫数据偏斜(classskew)。以常见的二分类问题为例，如我们希望预测病人是否得了某种罕见疾病。但在历史数据中，阳性的比例可能很低(如百分之0.1)。在这种情况下，学习出好的分类器是很难的，而且在这种情况下得到结论往往也是很具迷惑性的。

半监督学习：半监督学习(Semi-Supervised Learning，SSL)是模式识别和机器学习领域研究的重点问题，是监督学习与无监督学习相结合的一种学习方法；半监督学习使用大量的未标记数据以及同时使用标记数据，来进行模式识别工作。

变分自编码器：变分自编码器可用于对先验数据分布进行建模。它包括两部分：编码器和解码器。编码器将数据分布的高维特征映射到数据的低维表征，低维表征叫作本征向量(latent vector)；解码器吸收数据的低维表征，然后输出同样数据的高维表征。

在本说明书中，提供了一种分类模型训练方法。本说明书一个或者多个实施例同时涉及一种分类模型训练装置，一种类别检测方法，一种类别检测装置，一种计算设备，一种计算机可读存储介质以及一种计算机程序，在下面的实施例中逐一进行详细说明。

参见图1，图1示出了根据本说明书一个实施例提供的一种分类模型训练方法的流程图，具体包括以下步骤。

步骤102：确定无标签的样本用户集合、以及有标签的正样本用户集合。

其中，无标签的样本用户集合由多个无标签的样本用户组成，在欺诈检测场景中，该无标签的样本用户集合中包括无标签的欺诈用户或者无标签的非欺诈用户；同理，有标签的正样本用户集合由多个有标签的正样本用户组成，在欺诈检测场景中，该有标签的正样本用户集合中包括有标签的欺诈用户，例如标签为1的情况下，表示用户为正样本用户，即欺诈用户。

步骤104：将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果。

具体的，在将无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果之前，需要对聚类模型进行无监督训练，使得聚类模型无监督地学习无标签的样本用户的类别以及复杂分布，后续可以对无标签的样本用户进行更加准确合理的聚类。

实际应用中，该聚类模型可以理解为变分自动编码网络，即上述的变分自编码器VAE(VariationalAuto-Encoders)；从神经网络的角度来看，VAE具有编码器和解码器两个子网络。解码器接受输入x，输出为隐变量z；解码器负责将隐变量z解码为重建的x；并且VAE对隐变量z的分布有显式地约束，希望隐变量z符合预设的先验分布P(z)。因此，在损失函数的设计上，除了原有的重建误差项外，还添加了隐变量z分布的约束项。

那么，在该聚类模型为变分自编码器的情况下，对聚类模型的训练过程如下所述：

所述聚类模型为变分自动编码网络；

所述将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果之前，还包括：

将所述无标签的样本用户集合中无标签的样本用户的原始特征，输入所述变分自动编码网络的编码器，获得所述无标签的样本用户集合中无标签的样本用户的类别预测结果、以及所述无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布；

将所述无标签的样本用户的类别预测结果、以及所述无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布，输入所述变分自动编码网络的解码器，获得解码后的无标签的样本用户的原始特征。

并且，所述获得解码后的无标签的样本用户的原始特征之后，还包括：

根据所述无标签的样本用户的原始特征、所述解码后的无标签的样本用户的原始特征、所述无标签的样本用户的类别预测结果下的无标签的样本用户潜在特征的分布、以及预设分布，确定所述聚类模型的聚类损失函数；

根据所述聚类损失函数训练获得所述聚类模型，

其中，所述预设分布为预设的所述无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布。

其中，无标签的样本用户集合中无标签的样本用户的类别预测结果，可以理解为无标签的样本用户集合中无标签的样本用户的类别，如类别a；沿用该例，无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布，则可以理解为该类别a下的无标签的样本用户潜在特征的分布。

举例说明，以聚类模型为变分自动编码网络为例进行详细介绍。

在确定无标签的样本用户集合后，将无标签的样本用户集合中无标签的样本用户输入变分自动编码网络的编码器进行编码，获得无标签的样本用户集合中无标签的样本用户的类别预测结果、以及无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布。

然后，将无标签的样本用户的类别预测结果、以及无标签的样本用户的类别预测结果下的、无标签的样本用户潜在特征的分布，输入变分自动编码网络的解码器进行解码，获得解码的无标签的样本用户集合。

最后，即可根据无标签的样本用户的原始特征、解码后的无标签的样本用户的原始特征、无标签的样本用户的类别预测结果下的无标签的样本用户潜在特征的分布、以及预设分布，计算该聚类模型的聚类损失函数。

具体实施时，由于该聚类模型可以理解为变分自动编码网络，即上述的变分自编码器VAE(VariationalAuto-Encoders)；从神经网络的角度来看，VAE具有编码器和解码器两个子网络。解码器接受输入x，输出为隐变量z；解码器负责将隐变量z解码为重建的x；并且VAE对隐变量z的分布有显式地约束，希望隐变量z符合预设的先验分布P(z)。因此，在损失函数的设计上，除了原有的重建误差项外，还添加了隐变量z分布的约束项。

由于变分自动编码网络包括编码器和解码器两部分。首先，需要假设样本用户的分布形式。编码器输入为无标签的样本用户，即无标签的样本用户的原始特征，其中，每个样本用户的原始特征(即初始特征)可以表示为x，经过编码器学习出每个样本用户的类别以及该类别下的样本用户的潜在特征的分布。解码器输入为样本用户的潜在表征所属的分布，经过解码器解码出无标签的样本用户的解码初始特征(即预测特征)。最后，优化过程通过编码器和解码器的结果来进行无监督优化。其中，分布假设、编码器、解码器、优化目标的具体实现如下所述：

分布假设：为了充分学习无标签的样本用户集合中的类别信息，假设从无标签的样本用户中学习到的潜在分布z～c∈{-1，+1}表示潜在特征，其中，c表示样本用户的所属类别，z遵循双分量高斯混合分布。

首先，给出联合概率p(x，c，z)＝p(c)p(z|c)p(x|z，c)，其中，p(c)表示样本用户属于类别c的概率；p(z|c)表示样本用户的潜在表征所属的分布；c服从分类分布，p(z|c)是高斯分布，因此，z遵循双分量高斯混合分布，每个分布分别是潜在的正分布和负分布。具体来说：

即，c服从分类分布；每个类别下的样本用户的潜在特征z|c服从均值为μ_z(c)、协方差矩阵为

的多元高斯分布；在样本用户的潜在特征下生成的样本用户的解码原始特征x|z，c服从均值为μ_x(z，c)，协方差矩阵为

的多元高斯分布。

编码器：编码器首先输入每个样本用户的原始特征x，输出为每个样本数据的类别以及该类别下的样本用户潜在特征的分布p_θ(z，c|x)。实际应用中，可以采用一个简单的推理模型作为编码器，使用新分布q_φ(z，c|x)(新分布是编码器学习出来的分布。在变分自编码器的研究中，一般用符号q代表学习出的分布、p代表潜在的ground-truth分布)来近似后验分布p_θ(z，c|x)，它是从特定类中提取的、并由可训练参数φ参数化。具体来说，假设q_φ(z，c|x)可以分解为

其中，

可以根据原始数据的模态，。由任意的深度神经网络f_z(c，x；φ_z)学习，如卷积神经网络、循环神经网络、图神经网络等。f_z表示参数为φ_z的神经网络。

然后，可以计算

其中，q(c|x)表示样本用户的类别分布。

最后，可以从样本用户的类别分布q(c|x)中采样出样本用户的所属的潜在类别。

解码器：解码器输入为样本用户的潜在特征的分布，输出为解码出的样本用户的原始特征，即预测特征。具体来说，解码器p(z|c)＝f_z(c；θ_z)，p(x|z，c)＝f_x(z，c；θ_x)均可以利用深度神经网络来进行学习。

优化目标：变分自编码器(即聚类模型)的学习目标最小化证据下限(EvidenceLower Bound，ELBO)，其计算公式如下所述：

具体实施时，该分类模型训练方法应用于欺诈检测场景中，而欺诈检测的挑战来自埋藏在未标记集合中的欺诈用户(即无标签的样本用户)，由于未标记的数据没有监督，本说明书实施例提供的该分类模型训练方法通过构建无监督的未标记数据的聚类模型，该聚类模型基于聚类变分自动编码器，充分利用无标签的样本用户集合中的聚类信息，即未标注的欺诈者和未标注的非欺诈者两类，学习无标签的样本用户集合中的类别以及复杂结构信息，以使得后续应用中可以准确识别无标签的用户中的欺诈者。

步骤106：将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果。

沿用上例，在欺诈检测场景中，分类预测结果可以理解为分类，如分类1为欺诈用户、分类0为非欺诈用户。

具体的，在将无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果的同时，将无标签的样本用户集合以及有标签的正样本用户集合，分别输入分类模型，获得无标签的样本用户集合中无标签的样本用户的分类预测结果、以及有标签的正样本用户集合中有标签的正样本用户的分类预测结果。

即，将无标签的样本用户集合中的无标签的样本用户，输入分类模型，获得无标签的样本用户集合中无标签的样本用户的分类预测结果；如在欺诈检测场景中，将无标签的样本用户集合中的无标签的样本用户，输入分类模型，获得无标签的样本用户集合中无标签的样本用户的分类预测结果：分类1或者分类0。同理，将有标签的正样本用户集合中的有标签的正样本用户，输入分类模型，获得有标签的正样本用户集合中有标签的正样本用户的分类预测结果；如在欺诈检测场景中，将有标签的正样本用户集合中的有标签的正样本用户，输入分类模型，获得有标签的正样本用户集合中有标签的正样本用户的分类预测结果：分类1或者分类0。

步骤108：根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

具体的，在确定第一聚类结果、第二聚类结果、无标签的样本用户的分类预测结果、以及有标签的正样本用户的分类预测结果之后，则可以根据上述参数计算分类损失函数，以便基于该分类损失函数调整分类模型的网络参数，实现对分类模型的训练。具体实现方式如下所述：

所述根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型，包括：

根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，确定分类损失函数；

根据所述分类损失函数训练获得所述分类模型。

本说明书实施例提供的分类模型训练方法，应用于欺诈检测场景中，首先利用欺诈用户的属性、历史行为、邻居结构等特征，对未标注的样本(即无标签的样本用户)进行聚类，学习未标注的样本中的聚类信息，获得聚类结果以及无监督的聚类损失函数；再基于聚类结果、无标签的样本用户的分类预测结果、有标签的正样本用户的分类预测结果，训练分类网络，获得分类结果及其分类损失函数；后续即可根据聚类损失与分类损失，协同训练分类器，以获得精确的分类模型。

实际应用中，由于聚类模型输出的无标签的样本用户集合的第一聚类结果以及第二聚类结果为无类别的聚类结果，即第一聚类结果和第二聚类结果仅为两个聚类，而并没有实质的分类，为了后续的分类损失函数的计算，则可以根据无标签的样本用户的分类预测结果以及有标签的正样本用户的分类预测结果，确定出第一聚类结果的分类以及第二聚类结果的分类。具体实现方式如下所述：

所述根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，确定分类损失函数，包括：

根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合中确定目标无标签的正样本用户；

将所述目标无标签的正样本用户分别与所述第一聚类结果、所述第二聚类结果取交集，以确定所述第一聚类结果的分类、所述第二聚类结果的分类；

根据所述有标签的正样本用户的分类预测结果、所述第一聚类结果的分类、所述第二聚类结果的分类，确定分类损失函数。

具体的，先根据无标签的样本用户的分类预测结果，从无标签的样本集合中确定目标无标签的正样本用户；再将目标无标签的正样本用户分别与第一聚类结果、所述第二聚类结果取交集，例如，第一聚类结果中包括无标签的样本用户1、无标签的样本用户2、无标签的样本用户3，第二聚类结果中包括无标签的样本用户4、无标签的样本用户5、无标签的样本用户6；目标无标签的正样本用户包括无标签的样本用户1、无标签的样本用户2、无标签的样本用户4；那么目标无标签的正样本用户与第一聚类结果的交集为：无标签的样本用户1、无标签的样本用户2；而目标无标签的正样本用户与第二聚类结果的交集为：无标签的样本用户4。

最后，即可根据交集确定第一聚类结果以及第二聚类结果的分类；再根据有标签的正样本用户的分类预测结果、第一聚类结果的分类、第二聚类结果的分类，计算分类损失函数。

具体实施时，所述根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合中确定目标无标签的正样本用户，包括：

根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合的无标签的样本用户中选择初始无标签的正样本用户；

根据所述初始无标签的正样本用户的分类预测结果，从所述初始无标签的正样本用户中选择预设数量的目标无标签的正样本用户。

其中，预设数量可以根据实际需要进行设置，本说明书实施例对此不作任何限定，例如预设数量为50或100等。

例如无标签的样本用户的分类预测结果为分类1或分类0，其中，在欺诈检测场景中，分类1表示欺诈用户，即正样本用户，分类0表示非欺诈用户，即负样本用户；则可以根据该无标签的样本用户的分类预测结果，从无标签的样本集合的无标签的样本用户，将分类预测结果为分类1的无标签的样本用户作为初始无标签的正样本用户；再从该初始无标签的正样本用户中，选择预设数量的初始无标签的正样本用户作为目标无标签的正样本用户。具体实现方式如下所述：

所述根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合的无标签的样本用户中选择初始无标签的正样本用户，包括：

根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合的无标签的样本用户中，选择分类预测结果为第一分类预测结果的无标签的样本用户，为初始无标签的正样本用户；

相应地，所述根据所述初始无标签的正样本用户的分类预测结果，从所述初始无标签的正样本用户中选择预设数量的目标无标签的正样本用户，包括：

根据所述初始无标签的正样本用户的分类预测结果中的预测概率，从所述初始无标签的正样本用户中选择预设数量的目标无标签的正样本用户。

具体的，根据该无标签的样本用户的分类预测结果，从无标签的样本集合的无标签的样本用户，将分类预测结果为分类1的无标签的样本用户作为初始无标签的正样本用户；再根据初始无标签的正样本用户的分类预测结果中的预测概率，从初始无标签的正样本用户中选择预设数量的初始无标签的正样本用户作为目标无标签的正样本用户；以便后续可以根据该目标无标签的正样本用户与第一聚类结果以及第二聚类结果取交集，从而合理确定第一聚类结果中无标签的样本用户的分类、以及第二聚类结果中无标签的样本用户的分类。

实际应用中，所述将所述目标无标签的正样本用户分别与所述第一聚类结果、所述第二聚类结果取交集，以确定所述第一聚类结果的分类、所述第二聚类结果的分类，包括：

将所述目标无标签的正样本用户与所述第一聚类结果取交集，获得第一交集结果，以及将所述目标无标签的正样本用户与所述第二聚类结果取交集，获得第二交集结果；

根据所述第一交集结果以及所述第二交集结果，确定所述第一聚类结果中无标签的样本用户的分类、以及所述第二聚类结果中无标签的样本用户的分类。

沿用上例，将目标无标签的正样本用户与第一聚类结果取交集，获得第一交集结果：无标签的样本用户1、无标签的样本用户2，以及将目标无标签的正样本用户与第二聚类结果取交集，获得第二交集结果：无标签的样本用户4；根据第一交集结果以及第二交集结果可以确定目标无标签的正样本用户与第一聚类结果的交集中交叉的无标签的样本用户的数量2，大于目标无标签的正样本用户与第二聚类结果的交集中交叉的无标签的样本用户的数量1；此时，则可以确定第一聚类结果中无标签的样本用户的分类为分类1，即第一聚类结果中无标签的样本用户为正样本用户，确定第二聚类结果中无标签的样本用户的分类为分类0，即第二聚类结果中无标签的样本用户为负样本用户。

本说明书实施例提供的该分类模型训练方法，根据目标无标签的正样本用户与第一聚类结果的第一交集结果、以及目标无标签的正样本用户与第二聚类结果的第二交集结果，即可快速且合理的确定第一聚类结果中无标签的样本用户的分类、以及第二聚类结果中无标签的样本用户的分类。

那么即可根据有标签的正样本用户的分类预测结果、第一聚类结果的分类、第二聚类结果的分类通过如下公式，计算该分类损失函数：

其中，l+(Φ(x))＝-log(Φ(x))、l-(Φ(x))＝-log(1-Φ(x))、

指的是在PL(标记为正样本的样本用户)中求期望，

指的是在PU(未标记的样本用户中由协同模块的交集方法标记为正样本的数据)中求期望，

指的是在U(未标记的样本用户)中求期望，π'＝0.5。

其中，该公式中的classify PL samples部分标记的为正样本的样本用户以及预测出来的该正样本的样本用户的类别所引起的损失、classify U samples表示由交集得出的未标记的样本用户中的正样本的样本用户以及预测出来的该正样本的样本用户的类别所引起的损失、classify PU samples表示未标记的样本用户以及分类器预测出来的未标记的样本用户的类别所引起的损失。

此外，传统的深度欺诈检测模型把欺诈检测看作是二分类问题，根据样本用户的模态选择深度神经网络，对样本用户进行深度表征，最后利用风险预估器作为损失函数的计算器，迭代优化深度神经网络。然而无标签的样本用户集合中存在欺诈者，传统的训练二分类模型所用到的风险预估器在把未标记数据直接看做负样本的情况下会造成偏差。因此，本说明书实施例提供的该分类模型训练方法引入有标签的正样本以及无标签的样本学习方法，对风险预估器进行调整，得到风险预估器如下所述：

其中，π_PL表示被标记样本占总样本的比例，π_U表示未标记样本占总样本的比例，Φ_PU表示未被正样本占总样本的比例，Φ(x)表示欺诈检测分类模型产生的结果。

通过该风险预估器可知，该风险预估器不仅没有错误地把未标注样本直接看作负样例，还充分利用未标注样本训练的聚类模型中输出的未标记正样本信息来逼近正样本的真实分布。

然而，该风险预估器(即风险预估函数)在正负样本极度不平衡的情况下仍无法获得很好的效果。为了进一步处理基于正负样本不平衡问题，还设计了一个伪数据再平衡过程。因为观察到的数据集是从包含不平衡正负样本的潜在数据集D_PN中采样的，伪数据重新平衡过程根据正样本分布p_P对D_PN中的正数据进行过采样以获得平衡数据集D_balancePN，其中，正样本远多于D_PN。将π'表示为D_balancePN数据集中的正类比例，即正样本的占所有样本的数量。之后，可以通过从D_balancePN中采样获得一个新的平衡数据集。这种伪数据再平衡过程的一个优点是，即使联合分布发生变化，它也不会改变正负样本的分布。这样，就真的不需要抽取正样本了，只需要修改风险预估器如下：

基于该风险预估器，结合有标签的正样本用户的分类预测结果、第一聚类结果的分类、第二聚类结果的分类，即可以获得欺诈检测分类模型产生的分类损失函数并训练该分类模型。具体实现方式如下所述：

所述根据所述有标签的正样本用户的分类预测结果、所述第一聚类结果的分类、所述第二聚类结果的分类，确定分类损失函数，包括：

将所述有标签的正样本用户的分类预测结果、所述第一聚类结果的分类、所述第二聚类结果的分类，通过风险预估函数进行计算，获得分类损失函数。

综上，本说明书实施例提供的分类模型训练方法的整个算法如下所述：

给定一组有标签欺诈者X_PL，一个无标签的用户集合X_U，以及模型的一些参数和超参数，在半监督学习方式下，使用训练神经网络中常用的二元交叉熵(BCE)损失，预训练不平衡正例与未标注学习分类器(即分类模型)。在训练过程中，首先分别从X_PL和X_U中采样批数据，然后，通过以协作方式比较来自聚类模型和不平衡正例与未标注学习模块(即分类模型)的预测来构造伪X_PU(即目标无标签的正样本用户)。最后，根据无标签的用户集合计算未标注样例聚类模块(即聚类模型)的ELBO，即

以及根据有标签欺诈者以及无标签的用户集合计算风险的欺诈检测分类损失，即R(Φ)，用于更新欺诈检测模型。

本说明书实施例提供的该分类模型训练方法，针对欺诈检测中的数据类别不平衡以及数据未标注进行有监督的深度学习造成检测效果较差问题的情况下，根据无标签的样本用户以及有标签的样本用户，对分类模型进行半监督训练；通过将聚类模型引入欺诈检测场景的分类模型训练中，无监督地学习未标注数据的类别以及复杂分布，并通过将分类模型引入欺诈检测场景的分类模型训练中，结合聚类模型的聚类结果半监督地学习有标注数据以及未标注数据的类别，极大的提升了分类模型的后续类别检测性能。

而在训练获得分类模型之后，即可根据该分类模型快速且准确的检测该待检测用户的目标类别，即判断该待检测用户为欺诈用户或者非欺诈用户。具体实现方式如下所述：

所述训练所述分类模型之后，还包括：

将待检测用户输入所述分类模型，获得所述待检测用户的目标类别。

本说明书实施例提供的该分类模型训练方法，针对未标注样本(即无标签的)中含有正样例(即正样本用户)的问题，设计了自动变分聚类模型，来无监督地学习未标注样例中的类别以及复杂分布，还设计无偏的风险预估器来准确预估欺诈检测分类器(即分类模型)的损失；针对欺诈检测中天然存在的正负样例数据不平衡的问题，通过设计了一个伪数据再平衡过程，对风险预估器进行改进，使得分类模型更适用于真实的欺诈检测场景。

同时，本方案把欺诈检测问题定义为数据类别不平衡的正例与未标注学习问题，该问题建模更加贴合实际应用场景；本方案针对欺诈检测问题，即类别不平衡的正例与未标注学习问题，将变分自动编码器(即聚类模型)引入欺诈检测进行协同学习，这既能缓解欺诈检测中的数据类别不平衡问题，也能解决欺诈检测中存在大量无标记样本且无标记样本混杂的问题。

参见图2，图2示出了本说明书一个实施例提供的一种类别检测方法的流程图，具体包括如下步骤。

步骤202：确定待检测用户。

其中，待检测用户可以理解为待进行类别检测的用户；例如，在欺诈检测场景中，该待检测用户即可理解为待进行欺诈检测的用户。

步骤204：将所述待检测用户输入所述分类模型，获得所述待检测用户的目标类别。

其中，分类模型为上述分类模型训练方法中的分类模型。

具体的，将该待检测用户输入通过上述分类模型训练方法的实施例，训练的分类模型中，即可获得分类模型输出的该待检测用户的目标类别。

沿用上例，在欺诈检测场景中，该分类模型输出的该待检测用户的目标类别则可以理解为欺诈用户或者非欺诈用户等。

本说明书实施例提供的类别检测方法中，通过上述分类模型训练方法的实施例，训练的分类模型，即可快速且准确的确定待检测用户的目标类别，提升用户使用体验。

与上述方法实施例相对应，本说明书还提供了分类模型训练装置实施例，图3示出了本说明书一个实施例提供的一种分类模型训练装置的结构示意图。如图3所示，该装置包括：

样本用户确定模块302，被配置为确定无标签的样本用户集合、以及有标签的正样本用户集合；

聚类模块304，被配置为将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；

分类模块306，被配置为将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；

模型训练模块308，被配置为根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型。

可选地，所述聚类模型为变分自动编码网络；

所述装置，还包括：

编解码处理模块，被配置为：

可选地，所述装置，还包括：

聚类模型训练模块，被配置为：

根据所述聚类损失函数训练获得所述聚类模型，

可选地，所述模型训练模块308，进一步被配置为：

根据所述分类损失函数训练获得所述分类模型。

可选地，所述模型训练模块308，进一步被配置为：

可选地，所述装置，还包括：

类别检测模块，被配置为：

本说明书实施例提供的该分类模型训练装置，针对欺诈检测中的数据类别不平衡以及数据未标注进行有监督的深度学习造成检测效果较差问题的情况下，根据无标签的样本用户以及有标签的样本用户，对分类模型进行半监督训练；通过将聚类模型引入欺诈检测场景的分类模型训练中，无监督地学习未标注数据的类别以及复杂分布，并通过将分类模型引入欺诈检测场景的分类模型训练中，结合聚类模型的聚类结果半监督地学习有标注数据以及未标注数据的类别，极大的提升了分类模型的后续类别检测性能。

上述为本实施例的一种分类模型训练装置的示意性方案。需要说明的是，该分类模型训练装置的技术方案与上述的分类模型训练方法的技术方案属于同一构思，分类模型训练装置的技术方案未详细描述的细节内容，均可以参见上述分类模型训练方法的技术方案的描述。

与上述方法实施例相对应，本说明书还提供了类别检测装置实施例，图4示出了本说明书一个实施例提供的一种类别检测装置的结构示意图。如图4所示，该装置包括：

用户确定模块402，被配置为确定待检测用户；

类别确定模块404，被配置为将所述待检测用户输入所述分类模型，获得所述待检测用户的目标类别，其中，所述分类模型为上述分类模型训练方法中的分类模型。

本说明书实施例提供的类别检测装置，通过上述分类模型训练方法的实施例，训练的分类模型，即可快速且准确的确定待检测用户的目标类别，提升用户使用体验。

上述为本实施例的一种类别检测装置的示意性方案。需要说明的是，该类别检测装置的技术方案与上述的类别检测方法的技术方案属于同一构思，类别检测装置的技术方案未详细描述的细节内容，均可以参见上述类别检测方法的技术方案的描述。

图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接，数据库550用于保存数据。

计算设备500还包括接入设备540，接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN，Public SwitchedTelephone Network)、局域网(LAN，Local Area Network)、广域网(WAN，Wide AreaNetwork)、个域网(PAN，Personal Area Network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC，networkinterface controller))中的一个或多个，诸如IEEE802.11无线局域网(WLAN，WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX，WorldwideInteroperability for Microwave Access)接口、以太网接口、通用串行总线(USB，Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC，Near FieldCommunication)。

在本说明书的一个实施例中，计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图5所示的计算设备结构框图仅仅是出于示例的目的，而不是对本说明书范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备500可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或个人计算机(PC，Personal Computer)的静止计算设备。计算设备500还可以是移动式或静止式的服务器。

其中，处理器520用于执行如下计算机可执行指令，该计算机可执行指令被处理器执行时实现上述数据处理方法的步骤。上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的分类模型训练方法或者类别检测方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述分类模型训练方法或者类别检测方法的技术方案的描述。

本说明书一实施例还提供一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现上述分类模型训练方法的步骤或者上述类别检测方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的分类模型训练方法或者类别检测方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述分类模型训练方法或者类别检测方法的技术方案的描述。

本说明书一实施例还提供一种计算机程序，其中，当所述计算机程序在计算机中执行时，令计算机执行上述分类模型训练方法或者类别检测方法的步骤。

上述为本实施例的一种计算机程序的示意性方案。需要说明的是，该计算机程序的技术方案与上述的分类模型训练方法或者类别检测方法的技术方案属于同一构思，计算机程序的技术方案未详细描述的细节内容，均可以参见上述分类模型训练方法或者类别检测方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本说明书实施例并不受所描述的动作顺序的限制，因为依据本说明书实施例，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本说明书实施例所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本说明书实施例的内容，可作很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本说明书实施例的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种分类模型训练方法，包括：

2.根据权利要求1所述的分类模型训练方法，所述聚类模型为变分自动编码网络；

3.根据权利要求2所述的分类模型训练方法，所述获得解码后的无标签的样本用户的原始特征之后，还包括：

根据所述聚类损失函数训练获得所述聚类模型，

4.根据权利要求1所述的分类模型训练方法，所述根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，训练所述分类模型，包括：

根据所述分类损失函数训练获得所述分类模型。

5.根据权利要求1-4任意一项所述的分类模型训练方法，所述根据所述第一聚类结果、所述第二聚类结果、所述无标签的样本用户的分类预测结果、以及所述有标签的正样本用户的分类预测结果，确定分类损失函数，包括：

6.根据权利要求5所述的分类模型训练方法，所述根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合中确定目标无标签的正样本用户，包括：

7.根据权利要求6所述的分类模型训练方法，所述根据所述无标签的样本用户的分类预测结果，从所述无标签的样本集合的无标签的样本用户中选择初始无标签的正样本用户，包括：

8.根据权利要求5所述的分类模型训练方法，所述将所述目标无标签的正样本用户分别与所述第一聚类结果、所述第二聚类结果取交集，以确定所述第一聚类结果的分类、所述第二聚类结果的分类，包括：

9.根据权利要求5所述的分类模型训练方法，所述根据所述有标签的正样本用户的分类预测结果、所述第一聚类结果的分类、所述第二聚类结果的分类，确定分类损失函数，包括：

10.根据权利要求1所述的分类模型训练方法，所述训练所述分类模型之后，还包括：

11.一种分类模型训练装置，包括：

第一聚类模块，被配置为将所述无标签的样本用户集合输入聚类模型，获得第一聚类结果以及第二聚类结果；

第一分类模块，被配置为将所述无标签的样本用户集合以及所述有标签的正样本用户集合输入分类模型，获得所述无标签的样本用户集合中无标签的样本用户的分类预测结果、以及所述有标签的正样本用户集合中有标签的正样本用户的分类预测结果；

12.一种类别检测方法，包括：

确定待检测用户；

将所述待检测用户输入所述分类模型，获得所述待检测用户的目标类别，

其中，所述分类模型为权利要求1至10任意一项所述分类模型训练方法中的分类模型。

13.一种计算设备，包括：

存储器和处理器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至10任意一项所述分类模型训练方法的步骤或者权利要求12所述类别检测方法的步骤。

14.一种计算机可读存储介质，其存储有计算机可执行指令，该计算机可执行指令被处理器执行时实现权利要求1至10任意一项所述分类模型训练方法的步骤或者权利要求12所述类别检测方法的步骤。