CN111429282B

CN111429282B - 基于反洗钱模型迁移的交易反洗钱方法及装置

Info

Publication number: CN111429282B
Application number: CN202010227822.9A
Authority: CN
Inventors: 卢健; 李晓萍; 徐琳玲
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2023-08-25
Anticipated expiration: 2040-03-27
Also published as: CN111429282A

Abstract

本申请实施例提供一种基于反洗钱模型迁移的交易反洗钱方法及装置，方法包括：将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为目标交易的洗钱预测结果，目标反洗钱模型是预先基于标准反洗钱模型和第二历史交易数据集训练得到，标准反洗钱模型为预先应用预设的GBDT方式和第一历史交易数据集训练得到，第一历史交易数据集的数据量大于第二历史数据集的数据量；若基于洗钱预测结果确定目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止交易达成。本申请能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的同时，提高洗钱预测结果的准确性及可靠性，进而提高交易安全性及可靠性。

Description

基于反洗钱模型迁移的交易反洗钱方法及装置

技术领域

本申请涉及反洗钱模型迁移技术领域，具体涉及基于反洗钱模型迁移的交易反洗钱方法及装置。

背景技术

反洗钱是银行风控系统的重要任务之一，也是金融机构的内在义务。随着大数据、AI技术的发展，部分银行已经广泛应用机器学习模型来提升反洗钱系统的风控能力，并取得了非常好的成效。与专家规则相比，机器学习反洗钱模型的案件侦查率更高，且可以减少人力成本。缺点是一个成功的模型需要依赖大量数据标注训练得到。

目前，部分地方性银行或小型金融机构并不具有大量标注样本的积累，但其依然希望使用机器学习模型来提升其反洗钱系统，若要保证其应用机器学习模型来进行反洗钱预测的准确性，则现有的解决办法是通过扩充其数据量来训练模型，但不同银行或金融机构之间的数据显然是不可能相互转移和共存的，而若要部分地方性银行或小型金融机构自行积攒数据量来进行数据量的扩充，再自行应用扩充后的数据进行反洗钱模型的训练，则需要消耗大量的时间成本，也就是说，针对部分地方性银行或小型金融机构来说，现有的应用机器学习模型来进行基于反洗钱模型迁移的交易反洗钱的方式无法在兼顾预测过程的成本消耗的同时，保证洗钱预测结果的准确性。

发明内容

针对现有技术中的问题，本申请提供一种基于反洗钱模型迁移的交易反洗钱方法及装置，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高交易的安全性及可靠性。

为解决上述技术问题，本申请提供以下技术方案：

第一方面，本申请提供一种基于反洗钱模型迁移的交易反洗钱方法，包括：

将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量；

若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成。

进一步地，在所述将目标交易对应的交易数据输入预设的目标反洗钱模型中之前，还包括：

在检测到任一交易服务器接收到目标交易请求时，读取该目标交易请求，其中，该目标交易请求中包括目标交易的交易数据；

相对应的，所述输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成，包括：

向接收到所述目标交易请求的交易服务器发送针对所述目标交易的洗钱告警信息，以使所述目标交易服务器根据该洗钱告警信息停止处理所述目标交易请求。

接收一标准模型提供服务器发送的标准反洗钱模型文件包，其中，所述标准反洗钱模型文件包中包含有所述标准反洗钱模型以及对应的数据处理逻辑文件；

应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型。

进一步地，所述标准反洗钱模型的生成过程包括：

一标准模型提供服务器应用预设的数据预处理方式将第一历史交易数据集转换为对应的训练集，其中，所述第一历史交易数据集中包含有标准模型提供服务器所属企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据；

所述标准模型提供服务器基于所述训练集，应用预设的GBDT方式对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型作为所述标准反洗钱模型；

以及，所述标准模型提供服务器生成包含有所述标准反洗钱模型对应的数据预处理方式的数据处理逻辑文件，并对应生成包含有所述标准反洗钱模型和对应的所述数据处理逻辑文件的标准反洗钱模型文件包。

进一步地，所述应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型，包括：

获取第二历史交易数据集，其中，所述第二历史交易数据集包括目标企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据；

应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式将所述第二历史交易数据集转换为对应的目标训练集；

基于所述标准反洗钱模型获取所述目标训练集中各个所述历史用户交易数据各自对应的洗钱识别数据，并生成由各个所述历史用户交易数据各自对应的洗钱识别数据组成的预测集；

应用所述预测集及所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型作为所述目标反洗钱模型。

应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式，将所述第二历史交易数据集转换为对应的目标训练集；

基于所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型与所述标准反洗钱模型进行加权相加处理，得到对应的所述目标反洗钱模型。

第二方面，本申请提供一种基于反洗钱模型迁移的交易反洗钱装置，包括：

洗钱预测模块，用于将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量；

洗钱告警模块，用于若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成。

进一步地，还包括：

交易请求拦截模块，用于在检测到任一交易服务器接收到目标交易请求时，读取该目标交易请求，其中，该目标交易请求中包括目标交易的交易数据；

相对应的，所述洗钱告警模块包括：

洗钱告警信息发送单元，用于向接收到所述目标交易请求的交易服务器发送针对所述目标交易的洗钱告警信息，以使所述目标交易服务器根据该洗钱告警信息停止处理所述目标交易请求。

进一步地，还包括：

标准模型接收模块，用于接收一标准模型提供服务器发送的标准反洗钱模型文件包，其中，所述标准反洗钱模型文件包中包含有所述标准反洗钱模型以及对应的数据处理逻辑文件；

目标反洗钱模型训练模块，用于应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型。

进一步地，所述标准反洗钱模型的生成过程包括：

进一步地，所述目标反洗钱模型训练模块包括：

历史数据获取单元，用于获取第二历史交易数据集，其中，所述第二历史交易数据集包括目标企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据；

训练集生成单元，用于应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式将所述第二历史交易数据集转换为对应的目标训练集；

预测集生成单元，用于基于所述标准反洗钱模型获取所述目标训练集中各个所述历史用户交易数据各自对应的洗钱识别数据，并生成由各个所述历史用户交易数据各自对应的洗钱识别数据组成的预测集；

第一模型训练单元，用于应用所述预测集及所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型作为所述目标反洗钱模型。

进一步地，所述应用所述目标反洗钱模型训练模块包括：

训练集生成单元，用于应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式，将所述第二历史交易数据集转换为对应的目标训练集；

第二模型训练单元，用于基于所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型与所述标准反洗钱模型进行加权相加处理，得到对应的所述目标反洗钱模型。

第三方面，本申请提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现所述的基于反洗钱模型迁移的交易反洗钱方法的步骤。

第四方面，本申请提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的基于反洗钱模型迁移的交易反洗钱方法的步骤。

由上述技术方案可知，本申请提供的一种基于反洗钱模型迁移的交易反洗钱方法及装置，方法包括：将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量；若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成，基于GBDT模型的迁移学习过程，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例中的基于反洗钱模型迁移的交易反洗钱方法的流程示意图。

图2是本申请实施例中的包含有步骤010和步骤201的基于反洗钱模型迁移的交易反洗钱方法的流程示意图。

图3是本申请实施例中的包含有步骤020和步骤030的基于反洗钱模型迁移的交易反洗钱方法的流程示意图。

图4是本申请实施例中的基于反洗钱模型迁移的交易反洗钱方法中步骤030的第一种流程示意图。

图5是本申请实施例中的基于反洗钱模型迁移的交易反洗钱方法中步骤030的第二种流程示意图。

图6是本申请应用实例中的基于GBDT的标准反洗钱模型训练过程的流程示意图。

图7是本申请应用实例中的基于反洗钱模型迁移的交易反洗钱系统的结构示意图。

图8是本申请实施例中的基于反洗钱模型迁移的交易反洗钱装置的第一种结构示意图。

图9是本申请实施例中的基于反洗钱模型迁移的交易反洗钱装置的第二种结构示意图。

图10是本申请实施例中的基于反洗钱模型迁移的交易反洗钱装置的第三种结构示意图。

图11是本申请实施例中的基于反洗钱模型迁移的交易反洗钱装置中的目标反洗钱模型训练模块03的第一种结构示意图。

图12是本申请实施例中的基于反洗钱模型迁移的交易反洗钱装置中的目标反洗钱模型训练模块03的第二种结构示意图。

图13是本申请实施例中的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

梯度提升迭代决策树GBDT(Gradient Boosting Decision Tree)是一种在结构化数据场景通常表现比较好的模型。它与逻辑回归，深度学习等AI算法模型不同，是一种基于决策树的boost类模型。所谓boost(梯度方向提升)就是指模型在训练的过程中会不断依据前面已经训练好的决策树的表现情况对后续的决策树进行生长。这种机制和深度学习模型的训练机制完全不同，所以在进行迁移学习时，模型的微调方式也有很大差异。在反洗钱模型建设中，本申请也应用了这种模型，也即，在本申请的一个或多个实施例中，所述GBDT方式即至应用现有的梯度提升迭代决策树GBDT算法来训练现有的决策树模型。

相对应的，在本申请的一个或多个实施例中，所述决策树模型(Decision Tree，也可以被称之为决策树或分类树)，机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术，可以用于分析数据，同样也可以作预测之用。

在本申请的一个或多个实施例中，所述标准反洗钱模型和目标反洗钱模型均可以为应用预设的GBDT方式训练得到的决策树模型，这种决策树模型的输入为交易数据，且该决策树模型的输出为该交易数据存在洗钱嫌疑的概率。

在本申请的一个或多个实施例中，所述交易数据包括对应交易的属性数据，举例来说：所述属性数据可以包含有交易双方的用户身份信息、交易双方在预设时间内的交易笔数信息以及每笔交易数额的信息。相对应的，所述第二历史交易数据集和所述第一历史交易数据集中的历史用户交易数据与所述交易数据的数据类型也相同，也包含有对应交易的属性数据。

在本申请的一个或多个实施例中，所述交易服务器是指用于达成交易请求中的交易的专用服务器，所述标准模型提供服务器是指用于训练、存储和发送标准反洗钱模型及相关数据的服务器，所述标准反洗钱模型服务器所述企业是指前述的具备大体量交易数据的大型金融企业，该大型金融企业由于拥有的数据量巨大，其所预先训练得到的标准反洗钱模型的预测准确性很高。

而在本申请的一个或多个实施例中提及的目标企业，则是前述的能够用于模型训练的数据量很少的小型金融企业，该类小型金融企业为了能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高反洗钱识别的准确性及可靠性，需要采用本申请的一个或多个实施例中提供的基于反洗钱模型迁移的交易反洗钱方法，来基于大型金融企业已有的标准反洗钱模型构建自身的目标反洗钱模型，也就是说，用于实现本申请实施例中提供的基于反洗钱模型迁移的交易反洗钱方法的执行主体为前述的用于模型训练的数据量很少的小型企业的服务器或客户端设备。

基于此，本申请提供一种基于反洗钱模型迁移的交易反洗钱方法、基于反洗钱模型迁移的交易反洗钱装置、电子设备及计算机可读存储介质，通过将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量；若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成，基于GBDT模型的迁移学习过程，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

具体通过下述多个实施例分别进行说明。

为了能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高反洗钱识别的准确性及可靠性，本申请提供一种基于反洗钱模型迁移的交易反洗钱方法的实施例，参见图1，所述基于反洗钱模型迁移的交易反洗钱方法具体包含有如下内容：

步骤100：将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量。

步骤200：若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成。

为了能够有效且高效的阻止洗钱交易的发生，进一步提高了反洗钱的可靠性及有效性，在本申请提供的基于反洗钱模型迁移的交易反洗钱方法的一个实施例中，参见图2，所述基于反洗钱模型迁移的交易反洗钱方法的步骤100之前，还具体包含有如下内容：

步骤010：在检测到任一交易服务器接收到目标交易请求时，读取该目标交易请求，其中，该目标交易请求中包括目标交易的交易数据。

相对应的，所述步骤200包括：

步骤201：向接收到所述目标交易请求的交易服务器发送针对所述目标交易的洗钱告警信息，以使所述目标交易服务器根据该洗钱告警信息停止处理所述目标交易请求。

为了能够快速且可靠性地应用其他企业用户发送的标准反洗钱模型训练自身的目标反洗钱模型，进而能够更进一步地降低自身企业训练反洗钱模型所需的数据量、成本及时间，并能够有效保证反洗钱识别的准确性及可靠，在本申请提供的基于反洗钱模型迁移的交易反洗钱方法的一个实施例中，参见图3，所述基于反洗钱模型迁移的交易反洗钱方法的步骤010之前，还具体包含有如下内容：

步骤020：接收一标准模型提供服务器发送的标准反洗钱模型文件包，其中，所述标准反洗钱模型文件包中包含有所述标准反洗钱模型以及对应的数据处理逻辑文件。

步骤030：应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型。

为了能够保证标准反洗钱模型的获取可靠性及准确性，进而能够保证目标反洗钱模型的训练可靠性及应用准确性，进而能够进一步提高反洗钱识别的准确性及可靠，在本申请提供的基于反洗钱模型迁移的交易反洗钱方法的一个实施例中，所述标准反洗钱模型的生成过程包括：

(1)一标准模型提供服务器应用预设的数据预处理方式将第一历史交易数据集转换为对应的训练集，其中，所述第一历史交易数据集中包含有标准模型提供服务器所属企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据。

(2)所述标准模型提供服务器基于所述训练集，应用预设的GBDT方式对预设的决策树模型进行训练，并将训练后的决策树模型作为所述标准反洗钱模型。

(3)所述标准模型提供服务器生成包含有所述标准反洗钱模型对应的数据预处理方式的数据处理逻辑文件，并对应生成包含有所述标准反洗钱模型和对应的所述数据处理逻辑文件的标准反洗钱模型文件包。

为了能够进一步降低自身企业训练反洗钱模型所需的数据量、成本及时间，并能够保证反洗钱识别的准确性及可靠性，在本申请提供的基于反洗钱模型迁移的交易反洗钱方法的一个实施例中，参见图4，所述基于反洗钱模型迁移的交易反洗钱方法的步骤030的一种具体实现方式包含有如下内容：

步骤031：获取第二历史交易数据集，其中，所述第二历史交易数据集包括目标企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据。

步骤032：应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式将所述第二历史交易数据集转换为对应的目标训练集。

步骤033：基于所述标准反洗钱模型获取所述目标训练集中各个所述历史用户交易数据各自对应的洗钱识别数据，并生成由各个所述历史用户交易数据各自对应的洗钱识别数据组成的预测集。

步骤034：应用所述预测集及所述目标训练集对预设的决策树模型进行训练，并将训练后的决策树模型作为所述目标反洗钱模型。

为了能够在降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效简化模型的训练难度，并同时能够保证反洗钱识别的准确性及可靠性，在本申请提供的基于反洗钱模型迁移的交易反洗钱方法的一个实施例中，参见图5，所述基于反洗钱模型迁移的交易反洗钱方法的步骤030的另一种具体实现方式包含有如下内容：

步骤032：应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式，将所述第二历史交易数据集转换为对应的目标训练集。

步骤035：基于所述目标训练集对预设的决策树模型进行训练，并将训练后的决策树模型作为所述目标反洗钱模型。

为进一步说明本方案，本申请还提供一种基于反洗钱模型迁移的交易反洗钱方法的具体应用实例，本应用实例使用新型迁移学习方法解决结构化数据场景样本数据不足问题，提供一种基于GBDT的迁移学习过程，在本实施例中，甲方和数据充分方均指大型金融企业，乙方为小型金融机构，具体包含有如下内容：

参见图6，基于GBDT的标准反洗钱模型训练过程为：

S101：准备充分甲方训练数据；也为数据充分方的甲方训练数据；

S102：编写数据处理逻辑L生成可训练数据；即，首先编写数据处理逻辑L，并基于数据处理逻辑L生成可直接训练数据，包括变量部分和标签部分；

S103：训练反洗钱模型f；即在甲方训练反洗钱模型f(标准反洗钱模型)；

S201：准备乙方训练数据；即准备数据不充分方的乙方训练数据；

S202：复用逻辑L生成训练数据X′；即复用数据处理逻辑L生成乙方的可直接训练数据X′；

S203：基于模型f生成一列预测值f(X′)；即，使用模型f对乙方数据生成一列预测值f(X′)；

S301：基于X′和f(X′)训练最终预测模型(目标反洗钱模型)g；

具体的gbdt模型是一系列决策树模型加权相加：

每一个f_i都是一个决策树(一个分段函数)，α_i为标准化学习率，这里简化为用f表示。另外本申请的重点是基于GBDT模型的迁移学习过程，尤其针对当前业界只有针对神经网络的迁移学习方法，而不具有基于GBDT迁移学习方法的情况下，本申请提供的自研的迁移学习方案也应用在实际项目中。

S302：基于X′训练模型g,再与f进行组合，最终得到预测模型(目标反洗钱模型)为：

其中，n是甲方的训练数据量，n′是乙方的训练数据量，X′为反洗钱模型输入的特征数据，是一个多维度向量(x′₁,x′₂,...x′_k)，其中，f和g均表示GBDT模型；f是在甲方银行训练的GBDT模型，g是在乙方银行基于自身的数据训练的GBDT模型。

参见图7，本具体应用实例中的基于反洗钱模型迁移的交易反洗钱方法应用一种基于反洗钱模型迁移的交易反洗钱系统实现，所述基于反洗钱模型迁移的交易反洗钱系统具体包含有：

(一)甲方子系统：

(1)甲方数据准备模块401，用于执行上述步骤S101。

(2)甲方数据处理模块402，用于执行上述步骤S102，负责将数据转化为可直接训练数据。

(3)甲方数据训练模块403，用于执行上述步骤S103。

(二)乙方子系统：

(1)乙方数据准备模块501，用于执行上述步骤S201。

(2)乙方数据处理模块502，用于执行上述步骤S202。

(3)乙方模型调优模块503，用于执行上述步骤S203。

(4)乙方最终组合模型的预测模块504，用于执行上述步骤S301和步骤S302。

基于上述内容，标准反洗钱模型的迁移过程如下：

(1)在数据样本充足的一方(比如甲方)准备好有标注的数据样本；

(2)编写数据处理逻辑成可直接训练数据包括特征X，标注y；

(3)基于GBDT训练数据得到模型f；

(4)将数据处理逻辑L和模型f一起迁移到缺乏数据样本的乙方环境；

(5)用逻辑L处理乙方的少量样本生成可训练数据X′，y′；

(6)用模型f预测数据X′生成一列预测数据f(X′)；

(7)本步骤提供两种方案，选其一：

A.将f(X′)和X′拼接,然后结合y′训练模型g；最终得到的反洗钱模型为：

B.直接基于X′和y′训练模型g；最终得到的反洗钱模型为：

其中n是X的数据量，n′是X'的数据量。

目前，部分大型银行已经基于历史大量的数据积累，训练好了成熟的反洗钱模型，并取得了很好的成效。并将模型对外输出到了部分小型银行。但是小型银行的数据积累不够且其数据亦不能传输到大型银行与大型银行数据混合，而大型银行数据亦不能传输到乙方与之混合。也就是说两方数据不可能明文混合在一起进行模型训练。本应用实例提出了一种未有先例的基于GBDT模型进行迁移的方式，先在大型银行训练好标准反洗钱模型，在迁移到小型银行进行复用并训练得到目标反洗钱模型，最终将两个模型组合在一起使用，既解决了数据不能混合问题，又为小型银行建立了高准确率和泛化能力的反洗钱模型，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

从软件层面来说，为了能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性，本申请提供一种用于实现所述基于反洗钱模型迁移的交易反洗钱方法中全部或部分内容的基于反洗钱模型迁移的交易反洗钱装置的实施例，参见图8，所述基于反洗钱模型迁移的交易反洗钱装置具体包含有如下内容：

洗钱预测模块10，用于将目标交易对应的交易数据输入预设的目标反洗钱模型中，并将该目标反洗钱模型的输出作为所述目标交易的洗钱预测结果，其中，所述目标反洗钱模型是预先基于一迁移得到的标准反洗钱模型以及第二历史交易数据集训练得到的，且所述标准反洗钱模型为预先应用预设的GBDT方式以及第一历史交易数据集训练得到的，所述第一历史交易数据集的数据量大于所述第二历史数据集的数据量。

洗钱告警模块20，用于若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成。

为了能够有效且高效的阻止洗钱交易的发生，进一步提高了反洗钱的可靠性及有效性，在本申请提供的基于反洗钱模型迁移的交易反洗钱装置的一实施例中，参见图9，所述基于反洗钱模型迁移的交易反洗钱装置中还具体包含有如下内容：

交易请求拦截模块01，用于在检测到任一交易服务器接收到目标交易请求时，读取该目标交易请求，其中，该目标交易请求中包括目标交易的交易数据。

相对应的，所述洗钱告警模块20包括：

洗钱告警信息发送单元21，用于向接收到所述目标交易请求的交易服务器发送针对所述目标交易的洗钱告警信息，以使所述目标交易服务器根据该洗钱告警信息停止处理所述目标交易请求。

为了能够快速且可靠性地应用其他企业用户发送的标准反洗钱模型训练自身的目标反洗钱模型，进而能够更进一步地降低自身企业训练反洗钱模型所需的数据量、成本及时间，并能够有效保证反洗钱识别的准确性及可靠，在本申请提供的基于反洗钱模型迁移的交易反洗钱装置的一实施例中，参见图10，所述基于反洗钱模型迁移的交易反洗钱装置中还具体包含有如下内容：

标准模型接收模块02，用于接收一标准模型提供服务器发送的标准反洗钱模型文件包，其中，所述标准反洗钱模型文件包中包含有所述标准反洗钱模型以及对应的数据处理逻辑文件。

目标反洗钱模型训练模块03，用于应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型。

为了能够保证标准反洗钱模型的获取可靠性及准确性，进而能够保证目标反洗钱模型的训练可靠性及应用准确性，进而能够进一步提高反洗钱识别的准确性及可靠，所述标准反洗钱模型的生成过程包括：

一标准模型提供服务器应用预设的数据预处理方式将第一历史交易数据集转换为对应的训练集，其中，所述第一历史交易数据集中包含有标准模型提供服务器所属企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据。

所述标准模型提供服务器基于所述训练集，应用预设的GBDT方式对预设的决策树模型进行训练，并将训练后的决策树模型作为所述标准反洗钱模型。

为了能够进一步降低自身企业训练反洗钱模型所需的数据量、成本及时间，并能够保证反洗钱识别的准确性及可靠性，在本申请提供的基于反洗钱模型迁移的交易反洗钱装置的一实施例中，参见图11，所述基于反洗钱模型迁移的交易反洗钱装置中的目标反洗钱模型训练模块03的第一种实现方式具体包含有如下内容：

历史数据获取单元31，用于获取第二历史交易数据集，其中，所述第二历史交易数据集包括目标企业的多个历史用户交易数据以及各个所述历史用户交易数据各自对应的标签，所述标签用于表示对应的历史用户交易数据是否为洗钱交易数据。

训练集生成单元32，用于应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式将所述第二历史交易数据集转换为对应的目标训练集。

预测集生成单元33，用于基于所述标准反洗钱模型获取所述目标训练集中各个所述历史用户交易数据各自对应的洗钱识别数据，并生成由各个所述历史用户交易数据各自对应的洗钱识别数据组成的预测集。

第一模型训练单元34，用于应用所述预测集及所述目标训练集对预设的决策树模型进行训练，并将训练后的决策树模型作为所述目标反洗钱模型。

为了能够在降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效简化模型的训练难度，并同时能够保证反洗钱识别的准确性及可靠性，在本申请提供的基于反洗钱模型迁移的交易反洗钱装置的一实施例中，参见图12，所述基于反洗钱模型迁移的交易反洗钱装置中的目标反洗钱模型训练模块03的第二种实现方式具体包含有如下内容：

训练集生成单元32，用于应用所述标准反洗钱模型对应的数据处理逻辑文件中的数据预处理方式，将所述第二历史交易数据集转换为对应的目标训练集。

第二模型训练单元35，用于基于所述目标训练集对预设的决策树模型进行训练，并将训练后的决策树模型作为所述目标反洗钱模型。

从上述描述可知，本申请实施例提供的基于反洗钱模型迁移的交易反洗钱装置，基于GBDT模型的迁移学习过程，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

从硬件层面来说，为了能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性，本申请提供一种用于实现所述基于反洗钱模型迁移的交易反洗钱方法中的全部或部分内容的电子设备的实施例，所述电子设备具体包含有如下内容：

处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线；其中，所述处理器、存储器、通信接口通过所述总线完成相互间的通信；所述通信接口用于实现电子设备与用户终端以及相关数据库等相关设备之间的信息传输；该电子设备可以是台式计算机、平板电脑及移动终端等，本实施例不限于此。在本实施例中，该电子设备可以参照实施例中的基于反洗钱模型迁移的交易反洗钱方法的实施例，以及，基于反洗钱模型迁移的交易反洗钱装置的实施例进行实施，其内容被合并于此，重复之处不再赘述。

图13为本申请实施例的电子设备9600的系统构成的示意框图。如图13所示，该电子设备9600可以包括中央处理器9100和存储器9140；存储器9140耦合到中央处理器9100。值得注意的是，该图13是示例性的；还可以使用其他类型的结构，来补充或代替该结构，以实现电信功能或其他功能。

在一实施例中，基于反洗钱模型迁移的交易反洗钱功能可以被集成到中央处理器中。其中，中央处理器可以被配置为进行如下控制：

从上述描述可知，本申请实施例提供的电子设备，基于GBDT模型的迁移学习过程，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

在另一个实施方式中，基于反洗钱模型迁移的交易反洗钱装置可以与中央处理器9100分开配置，例如可以将基于反洗钱模型迁移的交易反洗钱装置配置为与中央处理器9100连接的芯片，通过中央处理器的控制来实现基于反洗钱模型迁移的交易反洗钱功能。

如图13所示，该电子设备9600还可以包括：通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是，电子设备9600也并不是必须要包括图13中所示的所有部件；此外，电子设备9600还可以包括图13中没有示出的部件，可以参考现有技术。

如图13所示，中央处理器9100有时也称为控制器或操作控件，可以包括微处理器或其他处理器装置和/或逻辑装置，该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。

其中，存储器9140，例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息，此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序，以实现信息存储或处理等。

输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器，但并不限于此。

该存储器9140可以是固态存储器，例如，只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器，其即使在断电时也保存信息，可被选择性地擦除且设有更多数据，该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142，该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。

存储器9140还可以包括数据存储部9143，该数据存储部9143用于存储数据，例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。

基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块9110，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132，以经由扬声器9131提供音频输出，并接收来自麦克风9132的音频输入，从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外，音频处理器9130还耦合到中央处理器9100，从而使得可以通过麦克风9132能够在本机上录音，且使得可以通过扬声器9131来播放本机上存储的声音。

本申请的实施例还提供能够实现上述实施例中的基于反洗钱模型迁移的交易反洗钱方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的基于反洗钱模型迁移的交易反洗钱方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

从上述描述可知，本申请实施例提供的计算机可读存储介质，基于GBDT模型的迁移学习过程，能够将在有大量数据积累的银行训练好的模型直接迁移到只有少量数据样本的小型金融机构，再进行进一步微调就可得到一个泛化能力较好的模型，以解决小型金融机构的样本不足且无法获取更多样本的困扰，能够在有效降低自身企业训练反洗钱模型所需的数据量、成本及时间的基础上，有效提高洗钱预测结果的准确性及可靠性，进而能够有效提高基于反洗钱模型迁移的交易反洗钱的识别效率，能够有效提高交易的安全性及可靠性。

本领域内的技术人员应明白，本发明的实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于反洗钱模型迁移的交易反洗钱方法，其特征在于，包括：

若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成；

在所述将目标交易对应的交易数据输入预设的目标反洗钱模型中之前，还包括：

应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型；

所述应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型，包括：

应用所述预测集及所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型作为所述目标反洗钱模型，通过如下表达式表示：

其中，为所述目标反洗钱模型，g为目标迁移方基于自身的数据训练的GBDT模型，f为源迁移方基于自身的数据训练的GBDT模型，X′为复用与源迁移方相同的数据处理逻辑生成的目标迁移方的训练数据，f(X′)为基于f的预测集中的预测值；

基于所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型与所述标准反洗钱模型进行加权相加处理，得到对应的所述目标反洗钱模型，通过如下表达式表示：

其中，为所述目标反洗钱模型，g为目标迁移方基于自身的数据训练的GBDT模型，f为源迁移方基于自身的数据训练的GBDT模型，X′为复用与源迁移方相同的数据处理逻辑生成的目标迁移方的训练数据，f(X′)为基于f的预测集中的预测值，g(X′)为基于g的预测集中的预测值，n为源迁移方的训练数据量，n′为目标迁移方的训练数据量。

2.根据权利要求1所述的基于反洗钱模型迁移的交易反洗钱方法，其特征在于，在所述将目标交易对应的交易数据输入预设的目标反洗钱模型中之前，还包括：

3.根据权利要求1所述的基于反洗钱模型迁移的交易反洗钱方法，其特征在于，所述标准反洗钱模型的生成过程包括：

4.一种基于反洗钱模型迁移的交易反洗钱装置，其特征在于，包括：

洗钱告警模块，用于若基于所述洗钱预测结果确定对应的目标交易为洗钱交易，则输出针对该目标交易的洗钱告警信息以阻止该目标交易的达成；

还包括：

目标反洗钱模型训练模块，用于应用所述第二历史交易数据集以及所述标准反洗钱模型文件包训练得到目标反洗钱模型；

所述目标反洗钱模型训练模块包括：

第一模型训练单元，用于应用所述预测集及所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型作为所述目标反洗钱模型，通过如下表达式表示：

所述应用所述目标反洗钱模型训练模块包括：

第二模型训练单元，用于基于所述目标训练集对预设的预测模型决策树模型进行训练，并将训练后的预测模型决策树模型与所述标准反洗钱模型进行加权相加处理，得到对应的所述目标反洗钱模型，通过如下表达式表示：

5.根据权利要求4所述的基于反洗钱模型迁移的交易反洗钱装置，其特征在于，还包括：

相对应的，所述洗钱告警模块包括：

6.根据权利要求4所述的基于反洗钱模型迁移的交易反洗钱装置，其特征在于，所述标准反洗钱模型的生成过程包括：

7.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至3任一项所述的基于反洗钱模型迁移的交易反洗钱方法的步骤。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至3任一项所述的基于反洗钱模型迁移的交易反洗钱方法的步骤。