CN110689135A - 一种反洗钱模型的训练方法、装置及电子设备 - Google Patents
一种反洗钱模型的训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110689135A CN110689135A CN201910839229.7A CN201910839229A CN110689135A CN 110689135 A CN110689135 A CN 110689135A CN 201910839229 A CN201910839229 A CN 201910839229A CN 110689135 A CN110689135 A CN 110689135A
- Authority
- CN
- China
- Prior art keywords
- marked
- transaction
- model
- transaction sample
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004900 laundering Methods 0.000 title claims abstract description 149
- 238000012549 training Methods 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012216 screening Methods 0.000 claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000010801 machine learning Methods 0.000 claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 29
- 239000013598 vector Substances 0.000 claims description 29
- 238000003860 storage Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种反洗钱模型的训练方法、装置及电子设备,该训练方法包括:获取初始的已标记交易样本集;根据预先选定的机器学习算法,基于初始的已标记交易样本集进行机器学习模型训练,得到预测模型;获取未标记的交易样本集,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本;在至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据至少一个新的已标记交易样本对预测模型进行迭代更新训练;判断预测模型是否满足预设的终止条件,是则基于预测模型得到反洗钱模型,否则返回执行获取未标记的交易样本集的步骤。
Description
技术领域
本发明涉及机器学习模型技术领域,更具体地,涉及一种反洗钱模型的训练方法、一种反洗钱模型的训练装置、一种电子设备、及一种可读存储介质。
背景技术
洗钱是指为了预防通过各种方式掩饰、隐瞒毒品犯罪、黑社会性质的组织犯罪、恐怖活动犯罪、走私犯罪、贪污贿赂犯罪、破坏金融管理秩序犯罪等犯罪所得及其收益的来源和性质的洗钱活动。反洗钱是一个常见的风控场景,是对可能的洗钱活动予以识别,打击通过各种途径将非法所得及其收益的洗钱活动的系统工程。
随着机器学习和数据挖掘技术的发展,现有技术中通常采用机器学习模型来识别洗钱行为。最近几年,机器学习模型在反洗钱场景上取得了较大的成功。但是,机器学习需要将所有样本交给专家进行标记,而训练反洗钱的机器学习模型需要大量的样本,这就导致样本的标记需要消耗大量的人力,增加了人工成本。而且,还会在训练集中引入冗余样本,不利于反洗钱模型的训练。
发明内容
本发明提供了一种训练反洗钱模型的新的技术方案。
根据本发明的第一个方面,提供了一种反洗钱模型的训练方法,包括:
获取初始的已标记交易样本集,其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易;
根据预先选定的机器学习算法,基于所述初始的已标记交易样本集进行机器学习模型训练,得到预测模型;
获取未标记的交易样本集,根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本;
在所述至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据所述至少一个新的已标记交易样本对所述预测模型进行迭代更新训练;
判断所述预测模型是否满足预设的终止条件,是则基于所述预测模型得到反洗钱模型,否则返回执行所述获取未标记的交易样本集的步骤。
可选的,所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
从所述未标记的交易样本集中筛选出预测结果在第一设定范围内的未标记的交易样本,作为所述待标记的交易样本。
可选的,所述预测模型包括目标反洗钱模型和由多个模型组成的筛选模型;
所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本的步骤包括:
根据所述目标反洗钱模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
从所述未标记的交易样本集中筛选出第一预测结果在第一设定范围内的未标记的交易样本,作为所述候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成所述筛选模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本。
可选的,所述根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本的步骤包括:
根据每个候选待标记的交易样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述至少一个待标记的交易样本。
可选的,所述根据每个候选待标记的样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述待标记的交易样本的步骤包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出所述第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据所述标记值向量对所述候选待标记的交易样本进行去重处理,得到所述待标记的交易样本。
可选的,所述终止条件包括以下任意一项或多项:
所述候选待标记的交易样本的数量小于或等于预设的第一数量阈值;
所述未标记的交易样本集中,筛选出的所述候选待标记的交易样本所占比例,小于或等于预设的第一比例阈值;
所述未标记的交易样本的数量小于或等于预设的第二数量阈值;
所述未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
可选的,多个预测模型采用的算法不同或者超参数不同。
可选的,所述基于所述预测模型得到反洗钱模型的方法包括以下任意一项:
将所述目标反洗钱模型作为所述反洗钱模型;
选取任意一个所述筛选模型作为所述反洗钱模型;
将至少两个所述筛选模型进行组合,得到所述反洗钱模型;
将所述目标反洗钱模型和至少一个所述筛选模型进行组合,得到所述反洗钱模型。
可选的,所述预测模型由多个模型组成;
所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本的步骤包括:
根据所述预测模型中的一个模型或至少两个模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
根据所述第一预测结果从所述未标记的交易样本集中筛选出符合预设条件的候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成所述预测模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本。
可选的,所述根据所述预测模型中的一个模型或至少两个模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果的步骤包括:
从组成所述预测模型的多个模型中选出一个模型,对于每个未标记的交易样本,根据选出的模型进行预测得到对应的第一预测结果;
或者,
从组成所述预测模型的多个模型中选出至少两个模型,对于每个未标记的交易样本,根据选出的至少两个模型分别进行预测得到预测结果,再将所述至少两个模型分别对应的预测结果进行平均得到第一预测结果。
可选的,所述根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出所述第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据所述标记值向量对所述候选待标记的交易样本进行去重处理,得到所述至少一个待标记的交易样本。
可选的,所述基于所述预测模型得到反洗钱模型的步骤包括:
获取任意一个预测模型,作为所述反洗钱模型;或者,
将至少两个预测模型进行组合,得到所述反洗钱模型。
可选的,所述机器学习算法为随机森林算法。
可选的,所述训练方法还包括:
获取待预测的目标交易样本;
根据所述反洗钱模型对所述目标交易样本进行预测,得到所述目标交易样本的预测结果。
可选的,所述训练方法还包括:
展示所述目标样本的预测结果。
根据本发明的第二方面,提供了一种反洗钱模型的训练装置,包括:
初始样本获取模块,用于获取初始的已标记交易样本集,其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易;
模型初始训练模块,用于根据预先选定的机器学习算法,基于所述初始的已标记交易样本集进行机器学习模型训练,得到预测模型;
待标记样本筛选模块,用于获取未标记的交易样本集,根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本;
模型迭代训练模块,用于在所述至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据所述至少一个新的已标记交易样本对所述预测模型进行迭代更新训练;
终止条件判断模块,用于判断所述预测模型是否满足预设的终止条件,是则基于所述预测模型得到反洗钱模型,否则返回执行所述获取未标记的交易样本集的步骤。
可选的,所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
从所述未标记的交易样本集中筛选出预测结果在第一设定范围内的未标记的交易样本,作为所述待标记的交易样本。
可选的,所述预测模型包括目标反洗钱模型和由多个模型组成的筛选模型;
所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
根据所述目标反洗钱模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
从所述未标记的交易样本集中筛选出第一预测结果在第一设定范围内的未标记的交易样本,作为所述候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成所述筛选模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本。
可选的,所述根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本包括:
根据每个候选待标记的交易样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述至少一个待标记的交易样本。
可选的,所述根据每个候选待标记的样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述待标记的交易样本包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出所述第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据所述标记值向量对所述候选待标记的交易样本进行去重处理,得到所述待标记的交易样本。
可选的,所述终止条件包括以下任意一项或多项:
所述候选待标记的交易样本的数量小于或等于预设的第一数量阈值;
所述未标记的交易样本集中,筛选出的所述候选待标记的交易样本所占比例,小于或等于预设的第一比例阈值;
所述未标记的交易样本的数量小于或等于预设的第二数量阈值;
所述未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
可选的,多个预测模型采用的算法不同或者超参数不同。
可选的,所述基于所述预测模型得到反洗钱模型包括以下任意一项:
将所述目标反洗钱模型作为所述反洗钱模型;
选取任意一个所述筛选模型作为所述反洗钱模型;
将至少两个所述筛选模型进行组合,得到所述反洗钱模型;
将所述目标反洗钱模型和至少一个所述筛选模型进行组合,得到所述反洗钱模型。
可选的,所述预测模型由多个模型组成;
所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
根据所述预测模型中的一个模型或至少两个模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
根据所述第一预测结果从所述未标记的交易样本集中筛选出符合预设条件的候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成所述预测模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本。
可选的,所述根据所述预测模型中的一个模型或至少两个模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果的包括:
从组成所述预测模型的多个模型中选出一个模型,对于每个未标记的交易样本,根据选出的模型进行预测得到对应的第一预测结果;
或者,
从组成所述预测模型的多个模型中选出至少两个模型,对于每个未标记的交易样本,根据选出的至少两个模型分别进行预测得到预测结果,再将所述至少两个模型分别对应的预测结果进行平均得到第一预测结果。
可选的,所述根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出所述第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据所述标记值向量对所述候选待标记的交易样本进行去重处理,得到所述至少一个待标记的交易样本。
可选的,所述基于所述预测模型得到反洗钱模型包括:
获取任意一个预测模型,作为所述反洗钱模型;或者,
将至少两个预测模型进行组合,得到所述反洗钱模型。
可选的,所述机器学习算法为随机森林算法。
可选的,所述训练装置还包括:
用于获取待预测的目标交易样本的模块;
用于根据所述反洗钱模型对所述目标交易样本进行预测,得到所述目标交易样本的预测结果的模块。
可选的,所述训练装置还包括:
用于展示所述目标样本的预测结果的模块。
根据本发明的第三方面,提供了一种电子设备,包括:
如本发明第二方面所述的训练装置;或者,
处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器执行根据本发明第一方面所述的训练方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如本发明第一方面所述的训练方法。
通过本发明的实施例,首先基于预先选定的机器学习算法,基于少量的初始的已标记交易样本集进行机器学习训练得到预测模型,再根据该预测模型对未标记的交易样本的预测结果,筛选出需要专家标记的待标记的交易样本,并根据专家对待标记的交易样本进行标记后得到的新的已标记交易样本对预测模型进行迭代训练,得到反洗钱模型。这样,可以减少专家标记的交易样本的数量,使得预测模型更容易学习到有价值的信息。而且,通过对候选待标记的交易样本进行去重处理,还可以减少预测模型迭代训练过程中的计算量。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是显示可用于实现本发明的实施例的电子设备的硬件配置的例子的框图;
图2示出了本发明的实施例的反洗钱模型的训练方法的流程图;
图3示出了本发明的实施例的筛选待标记的交易样本的步骤的流程图;
图4示出了本发明的实施例的反洗钱模型的训练方法的一个例子的流程图;
图5示出了本发明的实施例的反洗钱模型的训练装置的原理框图;
图6示出了本发明的实施例的电子设备的框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
下面,参照附图描述根据本发明实施例的各个实施例和例子。
<硬件配置>
图1是示出可以实现本发明的实施例的电子设备1000的硬件配置的框图。
电子设备1000可以是便携式电脑、台式计算机、手机、平板电脑等。如图1所示,电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克风1800等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、耳机接口等。通信装置1400例如能够进行有线或无线通信,具体地可以包括Wifi通信、蓝牙通信、2G/3G/4G/5G通信等。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏、键盘、体感输入等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
图1所示的电子设备仅仅是说明性的并且决不意味着对本发明、其应用或使用的任何限制。应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100进行操作以执行本发明实施例提供的任意一项反洗钱模型的训练方法。本领域技术人员应当理解,尽管在图1中对电子设备1000示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及处理器1100和存储装置1200。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<方法实施例>
在本实施例中,提供一种反洗钱模型的训练方法。该反洗钱模型的训练方法可以是由电子设备实施。该电子设备可以是如图1所示的电子设备1000。
根据图2所示,本实施例的反洗钱模型的训练方法可以包括如下步骤S2100~S2500:
步骤S2100,获取初始的已标记交易样本集。
其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易。
例如,可以是将已标记交易样本集中是洗钱交易的样本标记为1,将不是洗钱交易的样本标记为0。
在本实施例中,已标记交易样本集中的每条样本可以是专家标记的,也可以是由电子设备根据预先设定的规则来标记的。
步骤S2200,根据预先选定的机器学习算法,基于初始的已标记交易样本集进行机器学习模型训练,得到预测模型。
在一个实施例中,预先选定的机器学习算法,例如可以是随机森林算法、GBDT(Gradient Boosting Decison Tree,梯度提升树)算法和XGBOOST(eXtreme GradientBoosting,极端梯度提升)算法、逻辑回归算法、神经网络算法等机器学习算法中的任意一个或多个。
基于步骤S2100中所获取的已标记交易样本集和预先选定的机器学习算法,进行机器学习模型训练,可以得到至少一个预测模型。
步骤S2300,获取未标记的交易样本集,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本。
未标记的交易样本集中包括多条未标记的交易样本,即每条未标记的交易样本均没有被预先标记为是洗钱交易或不是洗钱交易。
在第一个实施例中,预测模型可以是一个模型,那么,根据该预测模型对未标记的交易样本集进行预测处理,可以得到每个未标记的交易样本的预测结果。该预测结果可以是0~1之间的分数,用于表示基于该预测模型来预测对应交易样本是否为洗钱交易的概率。
在本实施例中,可以是从未标记的交易样本中筛选出预测结果在第一设定范围内的未标记的交易样本,作为待标记的交易样本。
当预测结果越接近1时,即预测模型认为对应的交易样本为洗钱交易的可能性越大。当预测结果越接近于0时,即预测模型认为对应的交易样本不是洗钱交易的可能性越大。换句话说,当预测结果与0.5之间差值的绝对值越大,预测模型越容易判断出对应交易样本的类型(即是洗钱交易或不是洗钱交易)。交易样本的预测结果与0.5之间差值的绝对值越大,对预测模型来说就越没有标注价值。由于只有预测模型不能准确预测的交易样本,才有标注价值,因此可以是选取预测结果在第一设定范围内的未标记的交易样本,作为待标记的交易样本。
第一设定范围可以是预先根据应用场景或具体需求设定好的。例如,该第一设定范围可以是[0.4,0.6],那么,可以是选取预测结果大于等于0.4且小于等于0.6的未标记的交易样本,作为待标记的交易样本。
在第二个实施例中,预测模型包括目标反洗钱模型和由多个模型组成的筛选模型。
进一步地,多个预测模型所采用的机器学习算法不同,和/或,设置的超参数不同,以使得根据相同的初始的已标记交易样本集进行机器学习模型训练,所得到多个预测模型不同。
那么,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本可以进一步包括如图3所示的步骤S2310~S2340:
步骤S2310,根据目标反洗钱模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果。
该第一预测结果可以是0~1之间的分数,用于表示基于目标反洗钱模型来预测对应交易样本是否为洗钱交易的概率。
步骤S2320,从未标记的交易样本中筛选出第一预测结果在第一设定范围内的为标记的交易样本,作为候选待标记的交易样本。
当第一预测结果越接近1时,即目标反洗钱模型认为对应的交易样本为洗钱交易的可能性越大。当第一预测结果越接近于0时,即目标反洗钱模型认为对应的交易样本不是洗钱交易的可能性越大。换句话说,当第一预测结果与0.5之间差值的绝对值越大,目标反洗钱模型越容易判断出对应交易样本的类型(即是洗钱交易或不是洗钱交易)。交易样本的第一预测结果与0.5之间差值的绝对值越大,对目标反洗钱模型来说就越没有标注价值。由于只有目标反洗钱模型不能准确预测的交易样本,才有标注价值,因此可以是选取第一预测结果在第一设定范围内的未标记的交易样本,作为候选待标记的交易样本。
第一设定范围可以是预先根据应用场景或具体需求设定好的。例如,该第一设定范围可以是[0.4,0.6],那么,可以是选取预测结果大于等于0.4且小于等于0.6的未标记的交易样本,作为候选待标记的交易样本。
步骤S2330,对于每个候选待标记的交易样本,根据组成筛选模型的多个模型分别进行预测,得到对应的第二预测结果。
具体的,可以基于组成筛选模型的多个模型,对每个候选待标记的交易样本进行预测,得到每个候选待标记的交易样本对应筛选模型中每个模型的第二预测结果。
例如,预测模型包括由n个模型组成的筛选模型,通过步骤S2320得到m个候选待标记的交易样本,第i(i∈[1,m])个候选待标记的交易样本对应筛选模型中第j(j∈[1,n])个模型的第二预测结果可以为Pi,j。
步骤S2340,根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本。
在一个实施例中,可以是根据每个候选待标记的交易样本的第二预测结果,对候选待标记的交易样本进行去重处理,得到至少一个待标记的交易样本。
在一个实施例中,对候选待标记的交易样本进行去重处理的方式可以包括如下所示的步骤S2341~S2343:
步骤S2341,对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值。
在本实施例中,可以通过候选待标记的交易样本的第二预测结果是否在第二设定范围内,来判定对应模型预测该候选待标记的交易样本是否为洗钱交易的结果。
例如,可以是第二预测结果在第二设定范围内的情况下,对应模型预测对应的候选待标记的交易样本不是洗钱交易;第二预测结果超出第二设定范围的情况下,对应模型预测对应的候选待标记的交易样本是洗钱交易。
第二设定范围可以是预先根据应用场景或具体需求设定。例如,第二设定范围可以是[0,0.5],那么,可以是将大于等于0且小于等于0.5(即在第二设定范围内)的第二预测结果的标记值设置为第一设定值,将大于0.5(即超出第二设定范围)的第二预测结果的标记值设置为第二设定值。
该第一设定值和第二设定值也可以是预先根据应用场景或具体需求设定的具体数值,且第一设定值和第二设定值的具体数值不同。例如,第一设定值可以是0,第二设定值可以是1。
在一个例子中,组成筛选模型的模型数量为3,对其中4个候选待标记的交易样本进行预测得到的第二预测结果可以是如下表1所示:
表1
第1个模型 | 第2个模型 | 第3个模型 | |
第1个候选待标记的交易样本 | 0.7 | 0.2 | 0.6 |
第2个候选待标记的交易样本 | 0.8 | 0.3 | 0.7 |
第3个候选待标记的交易样本 | 0.7 | 0.7 | 0.8 |
第4个候选待标记的交易样本 | 0.9 | 0.1 | 0.9 |
将表1中在第二设定范围内的第二预测结果对应的标记值设置为第一设定值0;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值1,得到的4个候选待标记的交易样本对应每个模型的标记值可以是如下表2所示:
表2
第1个模型 | 第2个模型 | 第3个模型 | |
第1个候选待标记的交易样本 | 1 | 0 | 1 |
第2个候选待标记的交易样本 | 1 | 0 | 1 |
第3个候选待标记的交易样本 | 1 | 1 | 1 |
第4个候选待标记的交易样本 | 1 | 0 | 1 |
步骤S2342,对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量。
预设的顺序,可以是组成筛选模型的多个模型的顺序,该顺序可以是预先根据应用场景或具体需求设定好的。
例如,预测模型包括由n个模型组成的筛选模型,通过步骤S2320得到m个候选待标记的交易样本,第i(i∈[1,m])个候选待标记的交易样本对应筛选模型中第j(j∈[1,n])个模型的第二预测结果为Pi,j,第二预测结果Pi,j对应的标记值可以表示为Bi,j。如果n个模型顺序排列,那么,得到的第i个候选待标记的交易样本的标记值向量可以表示为:(Bi,1,Bi,2,…,Bi,j,…,Bi,n-1,Bi,n)。
在如表2所示的例子中,第1个候选待标记的交易样本的标记值向量可以表示为(1,0,1),第2个候选待标记的交易样本的标记值向量可以表示为(1,0,1),第3个候选待标记的交易样本的标记值向量可以表示为(1,1,1),第4个候选待标记的交易样本的标记值向量可以表示为(1,0,1)。
步骤S2343,根据标记值向量对候选待标记的交易样本进行去重处理,得到待标记的交易样本。
在一个实施例中,根据标记值向量对候选待标记的交易样本进行去重处理,得到待标记的交易样本的方式可以是:对于每个标记值向量,从对应的至少一个候选待标记的交易样本中选取一个作为待标记的交易样本。
在如表2所示的例子中,第1个、第3个和第4个候选待标记的交易样本的标记值向量均为(1,0,1),那么可以是从第1个、第3个和第4个候选待标记的交易样本任选一个作为待标记的交易样本。另外,由于仅有第2个候选待标记的交易样本的标记值向量为(1,1,1),因此,可以将第2个候选待标记的交易样本直接作为待标记的交易样本。
在第三个实施例中,预测模型由多个模型组成,那么,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本可以进一步包括如下所示的步骤S2350~S2380:
步骤S2350,根据预测模型中的一个模型或至少两个模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果。
在一个实施例中,根据预测模型中的一个模型或至少两个模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果可以包括:从组成预测模型的多个模型中选出一个模型,对于每个未标记的交易样本,根据选出的模型进行预测得到对应的第一预测结果。
该第一预测结果可以是0~1之间的分数,用于表示基于选出的模型来预测对应的未标记的交易样本是否为洗钱交易的概率。
在另一个实施例中,根据预测模型中的一个模型或至少两个模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果可以包括:从组成预测模型的多个模型中选出至少两个模型;对于每个未标记的交易样本,根据选出的至少两个模型分别进行预测得到预测结果,再将至少两个模型分别对应的预测结果进行平均得到第一预测结果。
该每个选出的模型的预测结果可以是0~1之间的分数,用于表示对应模型来预测对应交易样本是否为洗钱交易的概率。第一预测结果为每个选出的模型的预测结果的平均值。
步骤S2360,根据第一预测结果从未标记的交易样本集中筛选出符合预设条件的候选待标记的交易样本。
当第一预测结果越接近1时,即选出的-个模型或至少两个模型认为对应的交易样本为洗钱交易的可能性越大。当第一预测结果越接近于0时,即选出的一个模型或至少两个模型认为对应的交易样本不是洗钱交易的可能性越大。换句话说,当第一预测结果与0.5之间差值的绝对值越大,选出的一个模型或至少两个模型越容易判断出对应交易样本的类型(即是洗钱交易或不是洗钱交易)。交易样本的第一预测结果与0.5之间差值的绝对值越大,对选出的一个模型或至少两个模型来说就越没有标注价值。由于只有选出的一个模型或至少两个模型不能准确预测的交易样本,才有标注价值,因此可以是选取第一预测结果在第一设定范围内的未标记的交易样本,作为候选待标记的交易样本。
第一设定范围可以是预先根据应用场景或具体需求设定好的。例如,该第一设定范围可以是[0.4,0.6],那么,可以是选取预测结果大于等于0.4且小于等于0.6的未标记的交易样本,作为候选待标记的交易样本。
步骤S2370,对于每个候选待标记的交易样本,根据组成预测模型的多个模型分别进行预测,得到对应的第二预测结果。
具体的,可以基于组成预测模型的多个模型,对每个候选待标记的交易样本进行预测,得到每个候选待标记的交易样本对应预测模型中每个模型的第二预测结果。
例如,预测模型由k个模型组成,通过步骤S2320得到m个候选待标记的交易样本,第i(i∈[1,m])个候选待标记的交易样本对应筛选模型中第j(j∈[1,k])个模型的第二预测结果可以为P′i,j。
步骤S2380,根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本。
在一个实施例中,根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本包括如下所示的步骤S2381~S2383:
步骤S2381,对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值。
该步骤S2381可以参照前述的步骤S2341的描述,在此不再赘述。
步骤S2382,对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量。
该步骤S2382可以参照前述的步骤S2342的描述,在此不再赘述。
步骤S2383,根据标记值向量对候选待标记的交易样本进行去重处理,得到至少一个待标记的交易样本。
该步骤S2383可以参照前述的步骤S2343的描述,在此不再赘述。
在根据上述第一个实施例、或第二个实施例、或第三个实施例得到至少一个待标记的交易样本之后,继续执行步骤S2400。
步骤S2400,在至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据至少一个新的已标记交易样本对预测模型进行迭代更新训练。
在一个实施例中,可以是将通过步骤S2300得到的待标记的交易样本提供至执行标记动作的专家,由专家对每个待标记的交易样本进行标记,得到对应的新的已标记交易样本。
执行本发明实施例的电子设备可以是在待标记的交易样本被标记后,获取标记后的新的已标记交易样本,并根据新的已标记交易样本对预测模型进行迭代更新训练。
在前述的第一个实施例的基础上,预测模型是一个模型,那么,可以是根据新的已标记交易样本对该模型进行迭代更新训练。
在前述的第二个实施例的基础上,预测模型包括目标反洗钱模型和由多个模型组成的筛选模型,那么,可以根据新的已标记交易样本对目标反洗钱模型和由多个模型组成的筛选模型进行迭代更新训练。
在前述的第三个实施例的基础上,预测模型由多个模型组成,那么,可以根据新的已标记交易样本对组成预测模型的多个模型进行迭代更新训练。
步骤S2500,判断预测模型是否满足预设的终止条件,是则基于预测模型得到反洗钱模型,否则返回执行所述获取未标记的交易样本集的步骤。
在上述第一个实施例的基础上,终止条件可以包括以下任意一项或多项:
待标记的交易样本的数量小于或等于预设的第一数量阈值;
未标记的交易样本集中,筛选出的待标记的交易样本所占比例,小于或等于预设的第一比例阈值;
未标记的交易样本的数量小于或等于预设的第二数量阈值;
未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
在终止条件包括待标记的交易样本的数量小于或等于预设的第一数量阈值的实施例中,第一数量阈值可以是预先根据应用场景或具体需求设定的,例如,第一数量阈值可以是100,那么,在通过步骤S2300获得的待标记的交易样本的数量小于或等于100时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本集中,筛选出的待标记的交易样本所占比例,小于或等于预设的第一比例阈值的实施例中,可以是确定通过步骤S2300筛选出的待标记的交易样本的数量作为待标记数量,确定通过步骤S2300获取的未标记的交易样本集中未标记的交易样本的数量,作为未标记数量,并计算待标记数量和未标记数量的比值,即为未标记的交易样本集中筛选出的待标记的交易样本所占比例。该第一比例阈值可以是预先根据应用场景或具体需求设定好的,例如,该第一比例阈值可以是10%,那么,可以在通过步骤S2300得到的未标记的交易样本集中筛选出的待标记的交易样本所占比例小于或等于10%时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本的数量小于或等于预设的第二数量阈值的实施例中,第二数量阈值可以是预先根据应用场景或具体需求设定的,例如,第二数量阈值可以是100,那么,在通过步骤S2300获取的未标记的交易样本集中未标记的交易样本的数量小于或等于100时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值的实施例中,可以是确定通过步骤S2300筛选出的待标记的交易样本的数量作为待标记数量,确定通过步骤S2300获取的未标记的交易样本集中未标记的交易样本的数量,作为未标记数量,并计算未标记数量与待标记数量的差值,并计算该差值和未标记数量的比值,即为未被标记的交易样本所占比例。该第二比例阈值可以是预先根据应用场景或具体需求设定好的,例如,该第二比例阈值可以是10%,那么,可以在通过步骤S2300得到的未被标记的交易样本所占比例小于或等于10%时,判定预测模型满足终止条件。
在上述第二个实施例或第三个实施例的基础上,终止条件可以包括以下任意一项或多项:
候选待标记的交易样本的数量小于或等于预设的第一数量阈值;
未标记的交易样本集中,筛选出的候选标记的交易样本所占比例,小于或等于预设的第一比例阈值;
未标记的交易样本的数量小于或等于预设的第二数量阈值;
未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
在终止条件包括候选待标记的交易样本的数量小于或等于预设的第一数量阈值的实施例中,第一数量阈值可以是预先根据应用场景或具体需求设定的,例如,第一数量阈值可以是100,那么,在通过步骤S2320或步骤S2360获得的候选待标记的交易样本的数量小于或等于100时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本集中,筛选出的候选待标记的交易样本所占比例,小于或等于预设的第一比例阈值的实施例中,可以是确定通过步骤S2320或步骤S2360筛选出的候选待标记的交易样本的数量作为候选待标记数量,确定通过步骤S2320或步骤S2360获取的未标记的交易样本集中未标记的交易样本的数量,作为未标记数量,并计算候选待标记数量和未标记数量的比值,即为未标记的交易样本集中筛选出的候选待标记的交易样本所占比例。该第一比例阈值可以是预先根据应用场景或具体需求设定好的,例如,该第一比例阈值可以是10%,那么,可以在通过步骤S2320或步骤S2360得到的未标记的交易样本集中筛选出的候选待标记的交易样本所占比例小于或等于10%时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本的数量小于或等于预设的第二数量阈值的实施例中,第二数量阈值可以是预先根据应用场景或具体需求设定的,例如,第二数量阈值可以是100,那么,在通过步骤S2320或步骤S2360获取的未标记的交易样本集中未标记的交易样本的数量小于或等于100时,判定预测模型满足终止条件。
在终止条件包括未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值的实施例中,可以是确定通过步骤S2320或步骤S2360筛选出的候选待标记的交易样本的数量作为候选待标记数量,确定通过步骤S2320或步骤S2360获取的未标记的交易样本集中未标记的交易样本的数量,作为未标记数量,并计算未标记数量与候选待标记数量的差值,并计算该差值和未标记数量的比值,即为未被标记的交易样本所占比例。该第二比例阈值可以是预先根据应用场景或具体需求设定好的,例如,该第二比例阈值可以是10%,那么,可以在通过步骤S2320或步骤S2360得到的未被标记的交易样本所占比例小于或等于10%时,判定预测模型满足终止条件。
在上述第一个实施例的基础上,预测模型是一个模型,那么,在预测模型满足预设的终止条件时,基于预测模型得到反洗钱模型可以包括:将该预测模型作为反洗钱模型。
在上述第二个实施例的基础上,预测模型包括目标反洗钱模型和由多个模型组成的筛选模型,那么,在预测模型满足预设的终止条件时,基于预测模型得到反洗钱模型可以包括以下任意一项:
将目标反洗钱模型作为反洗钱模型;
选取任意一个筛选模型作为反洗钱模型;
将至少两个筛选模型进行组合,得到反洗钱模型;
将目标反洗钱模型和至少一个筛选模型进行组合,得到反洗钱模型。
在一个实施例中,对至少两个模型进行组合得到反洗钱模型的方式可以包括:对至少两个模型进行加权求和、或加权求平均等方式进行组合。
在上述第三个实施例的基础上,预测模型由多个模型组成,那么,在预测模型满足预设的终止条件时,基于预测模型得到反洗钱模型可以包括:
获取组成预测模型的任意一个模型,作为反洗钱模型;或者,
将组成预测模型的至少两个模型进行组合,得到反洗钱模型。
在一个实施例中,对至少两个模型进行组合得到反洗钱模型的方式可以包括:对至少两个模型进行加权求和、或加权求平均等方式进行组合。
在预测模型满足不预设的终止条件时,返回执行获取未标记的交易样本集的步骤。
在一个实施例中,每次返回执行获取未标记的交易样本集的步骤所获取的未标记的交易样本集,相当于是前次执行获取未标记的交易样本集的步骤所获取的未标记的交易样本集的子集。其中,本说明书中提到的前次,是指本次之前的任意一次。
通过本发明的实施例,首先基于预先选定的机器学习算法,基于少量的初始的已标记交易样本集进行机器学习训练得到预测模型,再根据该预测模型对未标记的交易样本的预测结果,筛选出需要专家标记的待标记的交易样本,并根据专家对待标记的交易样本进行标记后得到的新的已标记交易样本对预测模型进行迭代训练,得到反洗钱模型。这样,可以减少专家标记的交易样本的数量,使得预测模型更容易学习到有价值的信息。而且,通过对候选待标记的交易样本进行去重处理,还可以减少预测模型迭代训练过程中的计算量。
在获得反洗钱模型之后,该方法还可以包括:
获取待预测的目标交易样本;
根据反洗钱模型对目标交易样本进行预测,得到目标交易样本的预测结果。
在一个实施例中,该方法还可以包括:展示目标交易样本的预测结果,以供监督人员根据预测结果对目标交易样本执行相应的管控处理。例如,可以是根据预测结果来判定目标交易样本是否为洗钱交易,在是洗钱交易的情况下,对目标交易样本的执行人进行处罚,或者撤销对应的交易。
<例子1>
以下将结合图4进一步说明本实施例中提供的反洗钱模型的训练方法。如图4所示,该方法包括:
步骤S4001,获取初始的已标记交易样本集。
步骤S4002,根据预先选定的机器学习算法,基于初始的已标记交易样本集进行机器学习模型训练,得到目标反洗钱模型和由多个模型组成的筛选模型。
步骤S4003,获取未标记的交易样本集。
步骤S4004,根据目标反洗钱模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果。
步骤S4005,从未标记的交易样本中筛选出第一预测结果在第一设定范围内的为标记的交易样本,作为候选待标记的交易样本。
步骤S4006,对于每个候选待标记的交易样本,根据组成筛选模型的多个模型分别进行预测,得到对应的第二预测结果。
步骤S4007,对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值。
步骤S4008,对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量。
步骤S4009,根据标记值向量对候选待标记的交易样本进行去重处理,得到待标记的交易样本。
步骤S4010,在至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据至少一个新的已标记交易样本对目标反洗钱模型和筛选模型进行迭代更新训练。
步骤S4011,判断预测模型是否满足预设的终止条件。
在满足终止条件时,执行步骤S4012;在不满足终止条件时,返回执行步骤S4003。
步骤S4012,将目标反洗钱模型作为反洗钱模型。
<装置实施例>
在本实施例中,提供一种反洗钱模型的训练装置5000,如图5所示,包括初始样本获取模块5100、模型初始训练模块5200、待标记样本筛选模块5300、模型迭代训练模块5400和终止条件判断模块5500。
上述初始样本获取模块5100用于获取初始的已标记交易样本集,其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易。
上述模型初始训练模块5200用于根据预先选定的机器学习算法,基于初始的已标记交易样本集进行机器学习模型训练,得到预测模型。
上述待标记样本筛选模块5300用于获取未标记的交易样本集,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本。
上述模型迭代训练模块5400用于在至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据至少一个新的已标记交易样本对预测模型进行迭代更新训练。
上述终止条件判断模块5500用于判断预测模型是否满足预设的终止条件,是则基于预测模型得到反洗钱模型,否则控制待标记样本筛选模块5300获取未标记的交易样本集,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本。
在一个实施例中,根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
从未标记的交易样本集中筛选出预测结果在第一设定范围内的未标记的交易样本,作为待标记的交易样本。
在一个实施例中,预测模型包括目标反洗钱模型和由多个模型组成的筛选模型;
根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
根据目标反洗钱模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
从未标记的交易样本集中筛选出第一预测结果在第一设定范围内的未标记的交易样本,作为候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成筛选模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本。
在一个实施例中,根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本包括:
根据每个候选待标记的交易样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到至少一个待标记的交易样本。
在一个实施例中,根据每个候选待标记的样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到待标记的交易样本包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据标记值向量对候选待标记的交易样本进行去重处理,得到待标记的交易样本。
在一个实施例中,终止条件包括以下任意一项或多项:
候选待标记的交易样本的数量小于或等于预设的第一数量阈值;
未标记的交易样本集中,筛选出的候选待标记的交易样本所占比例,小于或等于预设的第一比例阈值;
未标记的交易样本的数量小于或等于预设的第二数量阈值;
未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
在一个实施例中,多个预测模型采用的算法不同或者超参数不同。
在一个实施例中,基于预测模型得到反洗钱模型包括以下任意一项:
将目标反洗钱模型作为反洗钱模型;
选取任意一个筛选模型作为反洗钱模型;
将至少两个筛选模型进行组合,得到反洗钱模型;
将目标反洗钱模型和至少一个筛选模型进行组合,得到反洗钱模型。
在一个实施例中,预测模型由多个模型组成;
根据预测模型对未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
根据预测模型中的一个模型或至少两个模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
根据第一预测结果从未标记的交易样本集中筛选出符合预设条件的候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成预测模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本。
在一个实施例中,根据预测模型中的一个模型或至少两个模型对未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果的包括:
从组成预测模型的多个模型中选出一个模型,对于每个未标记的交易样本,根据选出的模型进行预测得到对应的第一预测结果;
或者,
从组成预测模型的多个模型中选出至少两个模型,对于每个未标记的交易样本,根据选出的至少两个模型分别进行预测得到预测结果,再将至少两个模型分别对应的预测结果进行平均得到第一预测结果。
在一个实施例中,根据对应的第二预测结果,从候选待标记的交易样本中筛选出至少一个待标记的交易样本包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据标记值向量对候选待标记的交易样本进行去重处理,得到至少一个待标记的交易样本。
在一个实施例中,基于预测模型得到反洗钱模型包括:
获取任意一个预测模型,作为反洗钱模型;或者,
将至少两个预测模型进行组合,得到反洗钱模型。
在一个实施例中,机器学习算法为随机森林算法。
在一个实施例中,该训练装置5000还包括:
用于获取待预测的目标交易样本的模块;
用于根据反洗钱模型对目标交易样本进行预测,得到目标交易样本的预测结果的模块。
在一个实施例中,该训练装置5000还包括:
用于展示目标样本的预测结果的模块。
本领域技术人员应当明白,可以通过各种方式来实现反洗钱模型的训练装置5000。例如,可以通过指令配置处理器来实现反洗钱模型的训练装置5000。例如,可以将指令存储在ROM中,并且当启动设备时,将指令从ROM读取到可编程器件中来实现反洗钱模型的训练装置5000。例如,可以将反洗钱模型的训练装置5000固化到专用器件(例如ASIC)中。可以将反洗钱模型的训练装置5000分成相互独立的单元,或者可以将它们合并在一起实现。反洗钱模型的训练装置5000可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
在本实施例中,反洗钱模型的训练装置5000可以具有多种实现形式,例如,反洗钱模型的训练装置5000可以是任何的提供交易服务的软件产品或者应用程序中运行的功能模块,或者是这些软件产品或者应用程序的外设嵌入件、插件、补丁件等,还可以是这些软件产品或者应用程序本身。
<电子设备>
在本实施例中,还提供一种电子设备6000。该电子设备6000可以是图1所示的电子设备1000。
在一方面,该电子设备6000可以包括前述的反洗钱模型的训练装置5000,用于实施本发明任意实施例的反洗钱模型的训练方法。
在另一方面,如图6所示,电子设备6000还可以包括处理器6100和存储器6200,该存储器6200用于存储可执行的指令;该处理器6100用于根据指令的控制运行电子设备6000执行根据本发明任意实施例的反洗钱模型的训练方法。
在本实施例中,该电子设备6000可以是手机、平板电脑、掌上电脑、台式机、笔记本电脑、工作站、游戏机等设备。
<计算机可读存储介质>
在本实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时实现如本发明任意实施例的反洗钱模型的训练方法。
本发明可以是设备、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种反洗钱模型的训练方法,其特征在于,包括:
获取初始的已标记交易样本集,其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易;
根据预先选定的机器学习算法,基于所述初始的已标记交易样本集进行机器学习模型训练,得到预测模型;
获取未标记的交易样本集,根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本;
在所述至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据所述至少一个新的已标记交易样本对所述预测模型进行迭代更新训练;
判断所述预测模型是否满足预设的终止条件,是则基于所述预测模型得到反洗钱模型,否则返回执行所述获取未标记的交易样本集的步骤。
2.根据权利要求1所述的训练方法,其特征在于,所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本包括:
从所述未标记的交易样本集中筛选出预测结果在第一设定范围内的未标记的交易样本,作为所述待标记的交易样本。
3.根据权利要求1所述的训练方法,其特征在于,所述预测模型包括目标反洗钱模型和由多个模型组成的筛选模型;
所述根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从未标记的交易样本集中筛选出至少一个待标记的交易样本的步骤包括:
根据所述目标反洗钱模型对所述未标记的交易样本集进行预测,得到每个未标记的交易样本的第一预测结果;
从所述未标记的交易样本集中筛选出第一预测结果在第一设定范围内的未标记的交易样本,作为所述候选待标记的交易样本;
对于每个候选待标记的交易样本,根据组成所述筛选模型的多个模型分别进行预测,得到对应的第二预测结果;
根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本。
4.根据权利要求3所述的训练方法,其特征在于,所述根据对应的第二预测结果,从所述候选待标记的交易样本中筛选出所述至少一个待标记的交易样本的步骤包括:
根据每个候选待标记的交易样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述至少一个待标记的交易样本。
5.根据权利要求4所述的训练方法,其特征在于,所述根据每个候选待标记的样本对应的第二预测结果,对候选待标记的交易样本进行去重处理,得到所述待标记的交易样本的步骤包括:
对于每个候选待标记的交易样本,将在第二设定范围内的第二预测结果对应的标记值设置为第一设定值;将超出所述第二设定范围的第二预测结果对应的标记值设置为第二设定值;
对于每个候选待标记的交易样本,基于预设的顺序,根据对应候选待标记的交易样本的第二预测结果所对应的标记值,得到标记值向量;
根据所述标记值向量对所述候选待标记的交易样本进行去重处理,得到所述待标记的交易样本。
6.根据权利要求1所述的训练方法,其特征在于,所述终止条件包括以下任意一项或多项:
所述候选待标记的交易样本的数量小于或等于预设的第一数量阈值;
所述未标记的交易样本集中,筛选出的所述候选待标记的交易样本所占比例,小于或等于预设的第一比例阈值;
所述未标记的交易样本的数量小于或等于预设的第二数量阈值;
所述未标记的交易样本集中,未被标记的交易样本所占比例小于或等于预设的第二比例阈值。
7.根据权利要求3所述的训练方法,其特征在于,多个预测模型采用的算法不同或者超参数不同。
8.一种反洗钱模型的训练装置,其特征在于,包括:
初始样本获取模块,用于获取初始的已标记交易样本集,其中,已标记样本集中的每条样本均已被标记为是洗钱交易或不是洗钱交易;
模型初始训练模块,用于根据预先选定的机器学习算法,基于所述初始的已标记交易样本集进行机器学习模型训练,得到预测模型;
待标记样本筛选模块,用于获取未标记的交易样本集,根据所述预测模型对所述未标记的交易样本集进行预测处理,并根据预测结果从所述未标记的交易样本集中筛选出至少一个待标记的交易样本;
模型迭代训练模块,用于在所述至少一个待标记的交易样本被标记后得到至少一个新的已标记交易样本,根据所述至少一个新的已标记交易样本对所述预测模型进行迭代更新训练;
终止条件判断模块,用于判断所述预测模型是否满足预设的终止条件,是则基于所述预测模型得到反洗钱模型,否则返回执行所述获取未标记的交易样本集的步骤。
9.一种电子设备,包括:
如权利要求8所述的训练装置;或者,
处理器和存储器,所述存储器用于存储指令,所述指令用于控制所述处理器执行根据权利要求1至7中任一项所述的训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如权利要求1至7中任一项所述的训练方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910839229.7A CN110689135B (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
CN202211475923.3A CN116128068A (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910839229.7A CN110689135B (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211475923.3A Division CN116128068A (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110689135A true CN110689135A (zh) | 2020-01-14 |
CN110689135B CN110689135B (zh) | 2022-10-11 |
Family
ID=69107787
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910839229.7A Active CN110689135B (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
CN202211475923.3A Pending CN116128068A (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211475923.3A Pending CN116128068A (zh) | 2019-09-05 | 2019-09-05 | 一种反洗钱模型的训练方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN110689135B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429282A (zh) * | 2020-03-27 | 2020-07-17 | 中国工商银行股份有限公司 | 基于反洗钱模型迁移的交易反洗钱方法及装置 |
CN112116411A (zh) * | 2020-08-10 | 2020-12-22 | 第四范式(北京)技术有限公司 | 一种用于商品推荐的排序模型的训练方法、装置及系统 |
CN112116478A (zh) * | 2020-09-28 | 2020-12-22 | 中国建设银行股份有限公司 | 银行反洗钱可疑报告处理方法及装置 |
CN113256300A (zh) * | 2021-05-27 | 2021-08-13 | 支付宝(杭州)信息技术有限公司 | 一种交易的处理方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103903441A (zh) * | 2014-04-04 | 2014-07-02 | 山东省计算中心 | 一种基于半监督学习的道路交通状态判别方法 |
CN107507613A (zh) * | 2017-07-26 | 2017-12-22 | 合肥美的智能科技有限公司 | 面向场景的中文指令识别方法、装置、设备和存储介质 |
CN108053087A (zh) * | 2017-10-20 | 2018-05-18 | 深圳前海微众银行股份有限公司 | 反洗钱监测方法、设备及计算机可读存储介质 |
CN109359793A (zh) * | 2018-08-03 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 一种针对新场景的预测模型训练方法及装置 |
CN109460795A (zh) * | 2018-12-17 | 2019-03-12 | 北京三快在线科技有限公司 | 分类器训练方法、装置、电子设备及计算机可读介质 |
CN109919684A (zh) * | 2019-03-18 | 2019-06-21 | 上海盛付通电子支付服务有限公司 | 用于生成信息预测模型的方法、电子设备和计算机可读存储介质 |
CN109960808A (zh) * | 2019-03-26 | 2019-07-02 | 广东工业大学 | 一种文本识别方法、装置、设备及计算机可读存储介质 |
CN109960800A (zh) * | 2019-03-13 | 2019-07-02 | 安徽省泰岳祥升软件有限公司 | 基于主动学习的弱监督文本分类方法及装置 |
-
2019
- 2019-09-05 CN CN201910839229.7A patent/CN110689135B/zh active Active
- 2019-09-05 CN CN202211475923.3A patent/CN116128068A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103903441A (zh) * | 2014-04-04 | 2014-07-02 | 山东省计算中心 | 一种基于半监督学习的道路交通状态判别方法 |
CN107507613A (zh) * | 2017-07-26 | 2017-12-22 | 合肥美的智能科技有限公司 | 面向场景的中文指令识别方法、装置、设备和存储介质 |
CN108053087A (zh) * | 2017-10-20 | 2018-05-18 | 深圳前海微众银行股份有限公司 | 反洗钱监测方法、设备及计算机可读存储介质 |
CN109359793A (zh) * | 2018-08-03 | 2019-02-19 | 阿里巴巴集团控股有限公司 | 一种针对新场景的预测模型训练方法及装置 |
CN109460795A (zh) * | 2018-12-17 | 2019-03-12 | 北京三快在线科技有限公司 | 分类器训练方法、装置、电子设备及计算机可读介质 |
CN109960800A (zh) * | 2019-03-13 | 2019-07-02 | 安徽省泰岳祥升软件有限公司 | 基于主动学习的弱监督文本分类方法及装置 |
CN109919684A (zh) * | 2019-03-18 | 2019-06-21 | 上海盛付通电子支付服务有限公司 | 用于生成信息预测模型的方法、电子设备和计算机可读存储介质 |
CN109960808A (zh) * | 2019-03-26 | 2019-07-02 | 广东工业大学 | 一种文本识别方法、装置、设备及计算机可读存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429282A (zh) * | 2020-03-27 | 2020-07-17 | 中国工商银行股份有限公司 | 基于反洗钱模型迁移的交易反洗钱方法及装置 |
CN111429282B (zh) * | 2020-03-27 | 2023-08-25 | 中国工商银行股份有限公司 | 基于反洗钱模型迁移的交易反洗钱方法及装置 |
CN112116411A (zh) * | 2020-08-10 | 2020-12-22 | 第四范式(北京)技术有限公司 | 一种用于商品推荐的排序模型的训练方法、装置及系统 |
CN112116478A (zh) * | 2020-09-28 | 2020-12-22 | 中国建设银行股份有限公司 | 银行反洗钱可疑报告处理方法及装置 |
CN113256300A (zh) * | 2021-05-27 | 2021-08-13 | 支付宝(杭州)信息技术有限公司 | 一种交易的处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110689135B (zh) | 2022-10-11 |
CN116128068A (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689135B (zh) | 一种反洗钱模型的训练方法、装置及电子设备 | |
US10834251B2 (en) | System and method detecting fraud using machine-learning and recorded voice clips | |
Schwartz et al. | Towards a standard for identifying and managing bias in artificial intelligence | |
US9576248B2 (en) | Record linkage sharing using labeled comparison vectors and a machine learning domain classification trainer | |
US20170236215A1 (en) | User experience using social and financial information | |
CN110599335A (zh) | 一种基于多模型的用户金融风险评估方法和装置 | |
CN110795568A (zh) | 基于用户信息知识图谱的风险评估方法、装置和电子设备 | |
CN111179031A (zh) | 一种商品推荐模型的训练方法、装置及系统 | |
US11023442B2 (en) | Automated structuring of unstructured data | |
US10558919B2 (en) | Predictive analysis with large predictive models | |
CN113393306A (zh) | 产品推荐方法、装置、电子设备及计算机可读介质 | |
CN112214775A (zh) | 对图数据的注入式攻击方法、装置、介质及电子设备 | |
US11727119B2 (en) | Migration risk assessment, recommendation, and implementation | |
CN111210109A (zh) | 基于关联用户预测用户风险的方法、装置和电子设备 | |
CN110852761A (zh) | 制定反作弊策略的方法、装置及电子设备 | |
CN111191677B (zh) | 用户特征数据生成方法、装置及电子设备 | |
US11321397B2 (en) | Composition engine for analytical models | |
US11769063B2 (en) | Providing predictive analytics with predictions tailored for a specific domain | |
US20200357030A1 (en) | Facilitating responding to multiple product or service reviews associated with multiple sources | |
CN114742645B (zh) | 基于多阶段时序多任务的用户安全等级识别方法及装置 | |
US20220245460A1 (en) | Adaptive self-adversarial negative sampling for graph neural network training | |
US11281747B2 (en) | Predicting variables where a portion are input by a user and a portion are predicted by a system | |
CN110704619B (zh) | 文本分类方法、装置及电子设备 | |
CN114065641A (zh) | 多分类梯度提升树的构建方法、装置及电子设备 | |
CN114981820A (zh) | 用于在边缘设备上评估和选择性蒸馏机器学习模型的系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |