CN111145026B

CN111145026B - 一种反洗钱模型的训练方法及装置

Info

Publication number: CN111145026B
Application number: CN201911394159.5A
Authority: CN
Inventors: 刘正夫
Original assignee: 4Paradigm Beijing Technology Co Ltd
Current assignee: 4Paradigm Beijing Technology Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2023-05-09
Anticipated expiration: 2039-12-30
Also published as: CN111145026A

Abstract

本发明公开了一种反洗钱模型的训练方法及装置，涉及数据处理技术领域；主要包括：获取交易样本数据集，交易样本数据集中包括多个具有多分类标签的交易样本数据，多分类标签用于标识交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为；基于交易样本数据集训练老师模型；获取多个温度参数值；对于每个温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对交易样本数据集进行预测，得到各交易样本数据分别对应的预测值；用各交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用新的交易样本数据集训练学生模型；集成多个训练后的学生模型形成反洗钱模型。

Description

一种反洗钱模型的训练方法及装置

技术领域

本发明涉及数据处理技术领域，特别是涉及一种反洗钱模型的训练方法及装置。

背景技术

随着互联网技术的发展，金融领域的交易行为越来越多的依赖于互联网进行，但是相伴而生的洗钱行为逐渐渗入到互联网中。洗钱，是指通过合法的活动或建设将违法获得的收入隐藏、伪装或投资的过程，为了维护社会公正和打击腐败等经济犯罪，需要在互联网中进行反洗钱监控。

目前，互联网中的反洗钱监控主要通过预设的反洗钱模型对互联网数据进行识别分析，从而识别出洗钱行为。通常使用的反洗钱模型存在如下两种：一种是，数据拟合力较强的反洗钱模型，虽然这种模型的反洗钱识别能力较好，但是为了满足数据拟合能力，这种模型较为复杂。比如，这种模型选用神经网络模型时，为了增强数据拟合力，通常会对神经网络加层/节点数，这会导致神经网络的网络结构非常复杂，从而导致识别计算时间花销较大，不能满足在线模型实时性的需求。第二种，在线实时性较好的反洗钱模型，这种模型为了满足在线实时性的需求，通常用较简单的模型来拟合数据，例如随机森林，gbdt等等。这种模型虽然能满足实时性的要求，但是由于本身结构比较简单，需要开发人员为其设计大量的特征，设计耗时耗力，且反洗钱识别效果不佳。

发明内容

有鉴于此，本发明提出了一种基于知识蒸馏的反洗钱模型的训练方法方法及装置，主要目的在于训练出数据拟合能力较强，且反洗钱能力较好的反洗钱模型。

第一方面，本发明提供了一种反洗钱模型的训练方法，该方法包括：

获取交易样本数据集，所述交易样本数据集中包括多个具有多分类标签的交易样本数据，其中，所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为；

基于所述交易样本数据集训练老师模型；

获取多个温度参数值；

对于每个所述温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型；

集成多个训练后的学生模型形成反洗钱模型。

第二方面，本发明提供了一种反洗钱模型的训练装置，该装置包括：

第一获取单元，用于获取交易样本数据集，所述交易样本数据集中包括多个具有多分类标签的交易样本数据，其中，所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为；

第一训练单元，用于基于所述交易样本数据集训练老师模型；

第二获取单元，用于获取多个温度参数值；

第二训练单元，用于对于每个所述温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型；

集成单元，用于集成多个训练后的学生模型形成反洗钱模型。

第三方面，本发明提供了一种计算机可读存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行第一方面所述的反洗钱模型的训练方法。

第四方面，本发明提供了一种存储管理设备，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行第一方面所述的反洗钱模型的训练方法。

借由上述技术方案，本发明提供的反洗钱模型的训练方法及装置，获取多个温度参数值，利用各温度参数值分别调整交易样本数据集训练完成的老师模型后，利用老师模型对交易样本数据集进行预测，得到各交易样本数据在各温度参数值下分别对应的预测值。用各温度参数值下交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到各温度参数值下新的交易样本数据集，并用新的交易样本数据集训练学生模型，得到各温度参数值分别对应的学生模型。集成各温度参数值分别对应的学生模型形成反洗钱模型。可见，本发明提供的方案中的反洗钱模型由多个学生模型集成而成。由于多个学生模型是基于不同的温度参数值训练而得，因此各学生模型具有不同的反洗钱能力，从而由多个学生模型集成的反洗钱模型具有较强的数据拟合能力，且在采用反洗钱模型完成反洗钱任务时，实质上是由多个学生模型共同来完成反洗钱任务，各学生模型发挥各自的发洗钱能力，能够达到良好的反洗钱效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明一个实施例提供的一种反洗钱模型的训练方法的流程图；

图2示出了本发明一个实施例提供的一种老师模型的示意图；

图3示出了本发明一个实施例提供的另一种老师模型的示意图；

图4示出了本发明一个实施例提供的另一种反洗钱模型的训练方法的流程图；

图5示出了本发明一个实施例提供的一种反洗钱模型的训练装置的结构示意图；

图6示出了本发明另一个实施例提供的一种反洗钱模型的训练装置的结构示意图。

具体实施方式

下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示，本发明实施例提供了一种反洗钱模型的训练方法，该方法主要包括：

101、获取交易样本数据集，所述交易样本数据集中包括多个具有多分类标签的交易样本数据，其中，所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为。

在实际应用中，洗钱行为往往隐藏在金融领域的交易过程中，故金融领域的交易过程中的交易行为所产生的数据中包括有大量洗钱行为相关的特征，而这些特征可以作为反洗钱模型的训练基础，故获取的交易样本数据集为面向金融领域的数据集。获取的交易样本数据集中包括有大量交易样本数据，而这些交易样本数据均具有其各自对应的多分类标签，而多分类标签用于表征交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为。

示例性的，如表-1所示，表-1中包括有多个交易样本数据，每一个交易样本数据均具有其各自对应的多分类标签。通过多分类标签可以看出：交易编号为id1和id5-id9的交易样本数据为非洗钱行为；交易编号为id2的交易样本数据为洗钱行为，且具体为毒品洗钱行为；交易编号为id3的交易样本数据为洗钱行为，且具体为走私洗钱行为；交易编号为id4的交易样本数据为洗钱行为，且具体为腐败洗钱行为。

表-1

交易编号	f1	f2	f3	转账类型
					id1	18	2	1	非洗钱行为
id2	19	4	2	毒品洗钱
					id3	70	20	10	走私洗钱
id4	60	25	13	腐败洗钱
					id5	13	34	32	非洗钱行为
id6	23	52	17	非洗钱行为
					id7	42	29	83	非洗钱行为
id8	27	96	27	非洗钱行为
					id9	56	25	32	非洗钱行为

需要说明的是，表-1中的f1、f2和f3分别表征交易样本数据的特征，而转账类型具体表征交易样本数据的多分类标签。

102、基于所述交易样本数据集训练老师模型。

在本实施例中，在基于交易样本数据集训练老师模型时，为了方便训练，则对交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各交易样本数据的离散化标签，然后利用具有离散化标签的各交易样本数据训练老师模型。

在本实施例中，对交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各交易样本数据的离散化标签的具体过程为：

首先，统计交易样本数据集中所有多分类标签的集合{c1，c2，…，cm}。

其次，针对每一个交易样本数据：比对该交易样本数据的多分类标签与该所有多分类标签的集合{c1，c2，…，cm}中的每一个多分类标签，若该交易样本数据的多分类标签与该集合中的多分类标签cm相同，则该多分类标签对应的值为1；若该交易样本数据的多分类标签与该集合中的多分类标签cm不同，则该集合中的多分类标签对应的值为0。当比对该交易样本数据的多分类标签与该多分类标签的集合{c1，c2，…，cm}中的每一个多分类标签完成时，利用该集合中的多分类标签对应的值形成该交易样本数据的离散化标签，该离散化标签由0和1组成。

示例性的，以确定表-1中交易编号为id1的交易样本数据的离散化标签为例进行说明，首先统计表-1中所有多分类标签的集合为{非洗钱行为，毒品洗钱，走私洗钱，腐败洗钱}，然后将交易编号为id1的交易样本数据的多分类标签“非洗钱行为”分别与集合{非洗钱行为，毒品洗钱，走私洗钱，腐败洗钱}中的每一个多分类标签进行比对。交易编号为id1的交易样本数据的多分类标签“非洗钱行为”与该集合中的第一个多分类标签“非洗钱行为”相同，则第一个多分类标签“非洗钱行为”对应的值为1。而该集合后续的多分类标签“毒品洗钱，走私洗钱，腐败洗钱”均与交易编号为id1的交易样本数据的多分类标签“非洗钱行为”不同，则确定对应的值均为0，则交易编号为id1的交易样本数据的离散化标签为(1，0，0，0)。

示例性的，表-2为对表-1中各交易样本数据的多分类标签进行离散化处理，得到的各交易样本数据的离散化标签。

表-2

交易编号	f1	f2	f3	label(非洗钱行为，毒品洗钱，走私洗钱，腐败洗钱)
					id1	18	2	1	(1，0，0，0)
id2	19	4	2	(0，1，0，0)
					id3	70	20	10	(0，0，1，0)
id4	60	25	13	(0，0，0，1)
					id5	13	34	32	(1，0，0，0)
id6	23	52	17	(1，0，0，0)
					id7	42	29	83	(1，0，0，0)
id8	27	96	27	(1，0，0，0)
					id9	56	25	32	(1，0，0，0)

在本实施例中，老师模型的具体类型可以基于业务要求确定，本实例中不做具体限定。可选的，老师模型为神经网络模型或GBDT(Gradient Boosting Decision Tree，梯度提升迭代决策树)模型等。

在本实施例中，进一步的，为了避免训练得到的老师模型出现过拟合的情况，在基于交易样本数据集训练老师模型之后，对基于交易样本数据集训练的老师模型进行裁剪处理，将裁剪处理后的老师模型确定为训练完成的老师模型。需要说明的是，对老师模型进行裁剪处理时，将老师模型中权重较小的边裁剪掉。

示例性的，下面以老师模型为神经网络模型为例，对老师模型的裁剪处理过程进行说明：图2是基于交易样本数据集训练的老师模型，该老师模型中的网络层数包括有4层，这4层分别为输入层、隐藏层1、隐藏层2和输出层。然后利用dropout方法对老师模型隐藏层中的神经元进行裁剪，从而使得老师模型的网络结构更加精简，降低了老师模型的复杂性。如图3所示，图3位裁剪后的老师模型，从图3中可以看出裁剪后的老师模型隐藏层1和隐藏层2中的神经元均由原来的6个变为了4个。

103、获取多个温度参数值。

在本实施例中，多个温度参数值的获取方法至少包括如下两种：

第一种，从预设的温度参数值集中选取多个温度参数值。其中，预设的温度参数值集中包括多个依据经验标定好的温度参数值。

第二种，确定温度参数值的获取次数。对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数。

具体的，温度参数值的获取次数与温度参数值的数量相同，每一次获取均能获取一个温度参数值。

具体的，为了保证抽样数据选取的多样性，则从预设的抽样方法集中选取抽样方法，从而针对不同的温度参数值采用多样的方法来抽取抽样数据，保证不同的温度参数值下抽样数据的多样性。预设的抽样方法集中预设有多个抽样方法。抽样方法集中的抽样方法可以基于业务要求选择，本实施例中对抽样方法不做具体限定。可选的，抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。在针对每次温度参数值的获取过程中，从抽样方法集中选取抽样方法的情况至少存在如下几种：第一种，每次温度参数值的获取过程中，从抽样方法集中选取的抽样方法均不相同。第二种，每次温度参数值的获取过程中，从抽样方法集中选取的抽样方法均相同。第三种，每次温度参数值的获取过程中，从抽样方法集中选取的抽样方法与之前的获取过程中所选取的抽样方法相同或不同。

具体的，在选取出抽样方法后，利用该抽样方法从预设的抽样数据集中抽取N个抽样数据，该N为大于或等于2的数值。这里所述的抽样数据集中预设有多个抽样数据，利用该抽样方法可以随机的从该抽样数据集中抽取N个抽样数据。

具体的，由于温度参数值本质上属于学生模型的一个超参数，因此为了观察温度参数值对学生模型的影响情况，则在得到N个抽样数据之后，确定该N个抽样数据在学生模型上的评价指标。该评价指标能够量化学生模型的优劣情况。需要说明的是，该学生模型与老师模型的种类和结构均相同。

具体的，确定N个抽样数据在学生模型上的评价指标的具体过程为：将N个抽样数据划分为训练集和测试集；基于训练集训练所述学生模型；获取训练后的学生模型在所述测试集上的预测结果，将所述预测结果确定为评价指标。该评价指标可以包括但不限于交叉熵或MSE(均方误差)。

具体的，确定N个抽样数据在学生模型上的评价指标之后，对应组合N个抽样数据及其各自对应的评价指标，形成初始数据。示例性的，N个抽样数据为t1，t2，……，tn。N个抽样数据在学生模型上的评价指标为v1，v2，……，vn。则初始数据为{(t1，v1)，(t2，v2)，……，(tn，vn)}，对初始数据进行贝叶斯优化，将贝叶斯优化结果中最优的值确定为温度参数值。

在本实施例中，温度参数值的每次获取时，均从抽样方法集中抽取出本次获取所需的抽样方法。由于不同次获取温度参数值时，均需要重新抽取抽样方法，从而保证了不同温度参数值下的初始数据的多样性，使得更容易找到最优的温度参数值。

在本实施例中，至少可以通过如下伪代码来获取多个温度参数值：

104、对于每个所述温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型。

在本实施例中，利用老师模型对交易样本数据集进行预测，得到各交易样本数据分别对应的预测值的过程具体包括：利用老师模型对交易样本数据集进行预测，得到各交易样本数据的预测结果，其中，所述预测结果为老师模型对多分类问题的预测结果；基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各交易样本数据分别对应的预测值。

具体的，老师模型对交易样本数据的预测结果能够表征出交易样本数据在各分类上的概率。示例性的，表-3为老师模型对表-2所示的各交易样本数据进行预测的预测结果。

表-3

从表-3中可以看出老师模型对一个交易样本数据的预测结果之和并非为1，因此需要对各交易样本数据的预测结果进行归一化处理，以便将交易样本数据的预测结果映射成为(0，1)的值，映射到(0，1)的值可以理解成概率，分类对应的概率越大，则说明交易样本数据为这个分类的概率越大。将归一化处理后的结果作为交易样本数据的预测值。

在本实施例中，在对各交易样本数据的预测结果进行归一化处理时，引用了温度参数值，通过控制温度参数值，达到控制各个分类的概率之间的差异情况。具体的，基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值，具体包括如下步骤：对于每一个所述交易样本数据：通过第一公式，对该交易样本数据的预测结果进行归一化处理，确定该交易样本数据的预测结果中的各分类的预测值；组合预测结果中的各分类的预测值，得到该交易样本数据的预测值。其中，第一公式为：

其中，所述q_i表征交易样本数据的预测结果中针对第i个分类的预测值；所述j表征交易样本数据的预测结果中所涉及的所有分类的总数量；所述z_j表征交易样本数据的预测结果中所涉及的所有分类中第j个分类的预测结果；T表征当前温度参数值；exp表征以自然数e为底的指数函数。

示例性，温度参数值为“T＝1”，且在“T＝1”时，老师模型针对表-2进行预测，得到老师模型的预测结果如表-3所示。下面以交易编号id1的交易样本数据的老师模型的预测结果(0.9，0.3，0.1，0.1)，来说明交易编号id1的交易样本数据的预测值的确定过程。可以看出，老师模型的预测结果中针对分类“非洗钱行为”的预测结果为0.9、针对分类“毒品洗钱”的预测结果为0.3、针对分类“走私洗钱”的预测结果为0.1、针对分类“腐败洗钱”的预测结果为0.1。

则，针对分类“非洗钱行为”的预测结果的预测值为：

则，针对分类“毒品洗钱”的预测结果的预测值为：

则，针对分类“走私洗钱”的预测结果的预测值为：

则，针对分类“腐败洗钱”的预测结果的预测值为：

则最终确定交易编号id1的交易样本数据的预测值为(0.4085，0.2242,0.1835,0.1835)。

示例性的，表-4中为在温度参数值为“T＝1”的情况下，针对表-3的老师模型的预测结果，得到的各交易样本数据的预测值。

表-4

示例性的，表-5中为在温度参数值为“T＝2”的情况下，针对表-3的老师模型的预测结果，得到的各交易样本数据的预测值。

表-5

在本实施例中，在一个温度参数值下，得到各交易样本数据分别对应的预测值之后，用各交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集。

示例性的，表-6为温度参数值为“T＝1”时，利用表-4中的各交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集。

表-6

示例性的，表-7为温度参数值为“T＝2”时，利用表-5中的各交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集。

表-7

交易编号	f1	f2	f3	label
					id1	18	2	1	(0.3245,0.2404,0.2175,0.2175)
id2	19	4	2	(0.2151,0.3209,0.2261,0.2377)
					id3	70	20	10	(0.2534,0.293,0.3096,0.2075)
id4	60	25	13	(0.2223,0.2337,0.2583,0.2855)
					id5	13	34	32	(0.3024,0.2240,0.2131,0.2603)
id6	23	52	17	(0.3096,0.2293,0.2075,0.2534)
					id7	42	29	83	(0.3063,0.2269,0.2158,0.2508)
id8	27	96	27	(0.3101,0.2185,0.2297,0.2415)
					id9	56	25	32	(0.2789,0.2401,0.2524,0.2284)

在本实施例中，在得到新的交易样本数据集之后，用新的交易样本数据集训练学生模型。需要说明的是，不同的温度参数值下，得到不同的新的交易样本数据集，因此，不同的温度参数值下，训练出不同的学生模型。训练出的不同的学生模型具有不同的反洗钱能力。

105、集成多个训练后的学生模型形成反洗钱模型。

在本实施例中，集成多个训练后的学生模型形成反洗钱模型，由于多个训练后的学生模型是基于不同的温度参数值训练而得，因此各学生模型具有不同的反洗钱能力。因此采用发洗钱模型完成反洗钱任务时，多个学生模型共同来完成反洗钱任务，各学生模型发挥各自的发洗钱能力，从而达到良好的反洗钱效果。

本发明实施例提供的反洗钱模型的训练方法，获取多个温度参数值，利用各温度参数值分别调整交易样本数据集训练完成的老师模型后，利用老师模型对交易样本数据集进行预测，得到各交易样本数据在各温度参数值下分别对应的预测值。用各温度参数值下交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到各温度参数值下新的交易样本数据集，并用新的交易样本数据集训练学生模型，得到各温度参数值分别对应的学生模型。集成各温度参数值分别对应的学生模型形成反洗钱模型。可见，本发明实施例提供的方案中的反洗钱模型由多个学生模型集成而成。由于多个学生模型是基于不同的温度参数值训练而得，因此各学生模型具有不同的反洗钱能力，从而由多个学生模型集成的反洗钱模型具有较强的数据拟合能力，且在采用反洗钱模型完成反洗钱任务时，实质上是由多个学生模型共同来完成反洗钱任务，各学生模型发挥各自的发洗钱能力，能够达到良好的反洗钱效果。

进一步的，根据图1所示的方法，本发明的另一个实施例还提供了一种反洗钱模型的训练方法，如图4所示，所述方法主要包括：

201、获取交易样本数据集，所述交易样本数据集中包括多个具有多分类标签的交易样本数据，其中，所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为。

202、对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各所述交易样本数据的离散化标签。

203、利用具有离散化标签的各交易样本数据训练所述老师模型。

204、对基于所述交易样本数据集训练的老师模型进行裁剪处理，将裁剪处理后的老师模型确定为训练完成的老师模型。

205、确定温度参数值的获取次数。

206、对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值。

207、对于每个所述温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型。

208、集成多个训练后的学生模型形成反洗钱模型。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种反洗钱模型的训练装置，如图5所示，所述装置包括：

第一获取单元31，用于获取交易样本数据集，所述交易样本数据集中包括多个具有多分类标签的交易样本数据，其中，所述多分类标签用于标识所述交易样本数据是否为洗钱行为以及是洗钱行为时具体是何种类型的洗钱行为；

第一训练单元32，用于基于所述交易样本数据集训练老师模型；

第二获取单元33，用于获取多个温度参数值；

第二训练单元34，用于对于每个所述温度参数值：利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型；

集成单元35，用于集成多个训练后的学生模型形成反洗钱模型。

本发明实施例提供的反洗钱模型的训练装置，获取多个温度参数值，利用各温度参数值分别调整交易样本数据集训练完成的老师模型后，利用老师模型对交易样本数据集进行预测，得到各交易样本数据在各温度参数值下分别对应的预测值。用各温度参数值下交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到各温度参数值下新的交易样本数据集，并用新的交易样本数据集训练学生模型，得到各温度参数值分别对应的学生模型。集成各温度参数值分别对应的学生模型形成反洗钱模型。可见，本发明实施例提供的方案中的反洗钱模型由多个学生模型集成而成。由于多个学生模型是基于不同的温度参数值训练而得，因此各学生模型具有不同的反洗钱能力，从而由多个学生模型集成的反洗钱模型具有较强的数据拟合能力，且在采用反洗钱模型完成反洗钱任务时，实质上是由多个学生模型共同来完成反洗钱任务，各学生模型发挥各自的发洗钱能力，能够达到良好的反洗钱效果。

可选的，如图6所示，所述第二获取单元33包括：

确定模块331，用于确定温度参数值的获取次数，

获取模块332，用于对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值。

可选的，如图6所示，所述获取模块332包括：

划分子模块3321，用于将所述N个抽样数据划分为训练集和测试集；

训练子模块3322，用于基于所述训练集训练所述学生模型；

获取子模块3323，用于获取训练后的学生模型在所述测试集上的预测结果，将所述预测结果确定为所述评价指标。

可选的，如图6所示，所述获取模块332所涉及的所述抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。

可选的，如图6所示，所述第二训练单元34包括：

预测模块341，用于利用老师模型对所述交易样本数据集进行预测，得到各交易样本数据的预测结果，其中，所述预测结果为所述老师模型对多分类的预测结果；

处理模块342，用于基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值。

可选的，如图6所示，所述处理模块342，用于对于每一个所述交易样本数据：通过第一公式，对该交易样本数据的预测结果进行归一化处理，确定该交易样本数据的预测结果中的各分类的预测值；组合预测结果中的各分类的预测值，得到该交易样本数据的预测值；

所述第一公式为：

可选的，如图6所示，述第一训练单元32，用于对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各所述交易样本数据的离散化标签；利用具有离散化标签的各交易样本数据训练所述老师模型。

可选的，如图6所示，所述装置还包括：

裁剪单元36，用于对所述第一训练单元32基于所述交易样本数据集训练的老师模型进行裁剪处理，将裁剪处理后的老师模型确定为训练完成的老师模型。

本发明实施例提供的反洗钱模型的训练装置中，各个功能模块运行过程中所采用的方法详解可以参见图1、图4方法实施例的对应方法详解，在此不再赘述。

进一步的，依据上述实施例，本发明的另一个实施例还提供了一种计算机可读存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的反洗钱模型的训练方法。

进一步的，依据上述实施例，本发明的另一个实施例还提供了一种存储管理设备，其特征在于，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行上述中任意一项所述的反洗钱模型的训练方法。

本发明实施例公开了：

A1.一种反洗钱模型的训练方法，包括：

基于所述交易样本数据集训练老师模型；

获取多个温度参数值；

集成多个训练后的学生模型形成反洗钱模型。

A2.根据A1所述的方法，获取多个温度参数值，包括：

确定温度参数值的获取次数，

对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值。

A3.根据A2所述的方法，确定所述N个抽样数据在学生模型上的评价指标，包括：

将所述N个抽样数据划分为训练集和测试集；

基于所述训练集训练所述学生模型；

获取训练后的学生模型在所述测试集上的预测结果，将所述预测结果确定为所述评价指标。

A4.根据A2所述的方法，所述抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。

A5.根据A1所述的方法，利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值，包括：

利用老师模型对所述交易样本数据集进行预测，得到各交易样本数据的预测结果，其中，所述预测结果为所述老师模型对多分类的预测结果；

基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值。

A6.根据A5所述的方法，基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值，包括：

对于每一个所述交易样本数据：通过第一公式，对该交易样本数据的预测结果进行归一化处理，确定该交易样本数据的预测结果中的各分类的预测值；组合预测结果中的各分类的预测值，得到该交易样本数据的预测值；

所述第一公式为：

A7.根据A1-A6中任一所述的方法，基于所述交易样本数据集训练老师模型，包括：

对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各所述交易样本数据的离散化标签；

利用具有离散化标签的各交易样本数据训练所述老师模型。

A8.根据A1-A6中任一所述的方法，在基于所述交易样本数据集训练老师模型之后，所述方法还包括：

对基于所述交易样本数据集训练的老师模型进行裁剪处理，将裁剪处理后的老师模型确定为训练完成的老师模型。

B1.一种反洗钱模型的训练装置，包括：

第二获取单元，用于获取多个温度参数值；

B2.根据B1所述的装置，其特征在于，所述第二获取单元包括：

确定模块，用于确定温度参数值的获取次数，

获取模块，用于对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值。

B3.根据B2所述的装置，所述获取模块包括：

划分子模块，用于将所述N个抽样数据划分为训练集和测试集；

训练子模块，用于基于所述训练集训练所述学生模型；

获取子模块，用于获取训练后的学生模型在所述测试集上的预测结果，将所述预测结果确定为所述评价指标。

B4.根据B2所述的装置，所述抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。

B5.根据B1所述的装置，所述第二训练单元包括：

预测模块，用于利用老师模型对所述交易样本数据集进行预测，得到各交易样本数据的预测结果，其中，所述预测结果为所述老师模型对多分类的预测结果；

处理模块，用于基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值。

B6.根据B5所述的装置，所述处理模块，用于对于每一个所述交易样本数据：通过第一公式，对该交易样本数据的预测结果进行归一化处理，确定该交易样本数据的预测结果中的各分类的预测值；组合预测结果中的各分类的预测值，得到该交易样本数据的预测值；

所述第一公式为：

B7.根据B1-B6中任一所述的装置，所述第一训练单元，用于对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各所述交易样本数据的离散化标签；利用具有离散化标签的各交易样本数据训练所述老师模型。

B8.根据B1-B6中任一所述的装置，所述装置还包括：

裁剪单元，用于对所述第一训练单元基于所述交易样本数据集训练的老师模型进行裁剪处理，将裁剪处理后的老师模型确定为训练完成的老师模型。

C1.一种计算机可读存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行A1至A8中任意一项所述的反洗钱模型的训练方法。

D1.一种存储管理设备，其特征在于，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行A1至A8中任意一项所述的反洗钱模型的训练方法。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

可以理解的是，上述方法及装置中的相关特征可以相互参考。另外，上述实施例中的“第一”、“第二”等是用于区分各实施例，而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种反洗钱模型的训练方法，其特征在于，包括：

基于所述交易样本数据集训练老师模型；

获取多个温度参数值；

对于每个所述温度参数值：利用该温度参数值调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型；其中，不同的温度参数值下，训练出不同的学生模型，且训练出的不同的学生模型具有不同的反洗钱能力；

集成多个训练后的学生模型形成反洗钱模型；

获取多个温度参数值，包括：

确定温度参数值的获取次数；温度参数值的获取次数与温度参数值的数量相同；

对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值；

其中，每次温度参数值的获取过程中，从所述抽样方法集中选取的抽样方法均不相同。

2.根据权利要求1所述的方法，其特征在于，确定所述N个抽样数据在学生模型上的评价指标，包括：

将所述N个抽样数据划分为训练集和测试集；

基于所述训练集训练所述学生模型；

3.根据权利要求1所述的方法，其特征在于，所述抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。

4.根据权利要求1所述的方法，其特征在于，利用该温度参数调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值，包括：

5.根据权利要求4所述的方法，其特征在于，基于该温度参数，对各交易样本数据的预测结果进行归一化处理，得到各所述交易样本数据分别对应的预测值，包括：

所述第一公式为：

6.根据权利要求1-5中任一所述的方法，其特征在于，基于所述交易样本数据集训练老师模型，包括：

利用具有离散化标签的各交易样本数据训练所述老师模型。

7.根据权利要求1-5中任一所述的方法，其特征在于，在基于所述交易样本数据集训练老师模型之后，所述方法还包括：

8.一种反洗钱模型的训练装置，其特征在于，包括：

第二获取单元，用于获取多个温度参数值；

第二训练单元，用于对于每个所述温度参数值：利用该温度参数值调整训练完成的老师模型后，利用老师模型对所述交易样本数据集进行预测，得到各所述交易样本数据分别对应的预测值；用各所述交易样本数据分别对应的预测值替换交易样本数据集中原始的多分类标签，得到新的交易样本数据集；用所述新的交易样本数据集训练学生模型；其中，不同的温度参数值下，训练出不同的学生模型，且训练出的不同的学生模型具有不同的反洗钱能力；

集成单元，用于集成多个训练后的学生模型形成反洗钱模型；

所述第二获取单元包括：

确定模块，用于确定温度参数值的获取次数；温度参数值的获取次数与温度参数值的数量相同；

获取模块，用于对于每次获取均执行如下步骤：从预设的抽样方法集中选取抽样方法，利用所述抽样方法从预设的抽样数据集中抽取N个抽样数据；确定所述N个抽样数据在学生模型上的评价指标；对应组合N个抽样数据及其各自对应的评价指标，形成初始数据；对所述初始数据进行贝叶斯优化，得到所述温度参数值；

9.根据权利要求8所述的装置，其特征在于，所述获取模块包括：

训练子模块，用于基于所述训练集训练所述学生模型；

10.根据权利要求8所述的装置，其特征在于，所述抽样方法集包括如下方法中的至少一种：基于正态分布的抽样方法、基于均匀分布的抽样方法和基于指数分布的抽样方法。

11.根据权利要求8所述的装置，其特征在于，所述第二训练单元包括：

12.根据权利要求11所述的装置，其特征在于，所述处理模块，用于对于每一个所述交易样本数据：通过第一公式，对该交易样本数据的预测结果进行归一化处理，确定该交易样本数据的预测结果中的各分类的预测值；组合预测结果中的各分类的预测值，得到该交易样本数据的预测值；

所述第一公式为：

13.根据权利要求8-12中任一所述的装置，其特征在于，所述第一训练单元，用于对所述交易样本数据集中各交易样本数据的多分类标签进行离散化处理，得到各所述交易样本数据的离散化标签；利用具有离散化标签的各交易样本数据训练所述老师模型。

14.根据权利要求8-12中任一所述的装置，其特征在于，所述装置还包括：

15.一种计算机可读存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的反洗钱模型的训练方法。

16.一种存储管理设备，其特征在于，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行权利要求1至权利要求7中任意一项所述的反洗钱模型的训练方法。