CN114004356A - 反洗钱模型训练方法、反洗钱方法以及装置 - Google Patents

反洗钱模型训练方法、反洗钱方法以及装置 Download PDF

Info

Publication number
CN114004356A
CN114004356A CN202111307452.0A CN202111307452A CN114004356A CN 114004356 A CN114004356 A CN 114004356A CN 202111307452 A CN202111307452 A CN 202111307452A CN 114004356 A CN114004356 A CN 114004356A
Authority
CN
China
Prior art keywords
money laundering
sample
feature data
user
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111307452.0A
Other languages
English (en)
Inventor
杨云杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202111307452.0A priority Critical patent/CN114004356A/zh
Publication of CN114004356A publication Critical patent/CN114004356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本说明书实施例提供反洗钱模型训练方法、反洗钱方法以及装置,其中所述反洗钱模型训练方法包括:获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型,综合考虑了用户的多个特征数据,并且针对不同的特征数据对应预设有权重,则在训练时,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息进行迭代训练,使训练得到的反洗钱模型更加精准,提高了反洗钱的识别准确度。

Description

反洗钱模型训练方法、反洗钱方法以及装置
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种反洗钱模型训练方法。本说明书一个或者多个实施例同时涉及一种反洗钱模型训练装置,一种反洗钱方法,一种反洗钱装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着计算机技术和互联网技术的不断发展,金融领域的交易行为越来越多的依赖于互联网进行,但是相伴而生的洗钱行为逐渐渗入到互联网中。洗钱,是指通过合法的手段将违法获得的财产隐藏、伪装的过程,为了维护社会稳定和打击经济犯罪,需要在互联网中进行洗钱行为的监测。
一般情况下,由人工监督是否有洗钱行为的发生,如果某个用户发生洗钱行为,则会将该用户加入黑名单中,则后续再接收到该用户的交易请求,均会认为存在洗钱行为,进行反洗钱处理。由于用户越来越多、交易行为越来越复杂,需要提供更加精准、命中率高的反洗钱方案。
发明内容
有鉴于此,本说明书实施例提供了一种反洗钱模型训练方法及一种反洗钱方法。本说明书一个或者多个实施例同时涉及一种反洗钱模型训练装置及一种反洗钱装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种反洗钱模型训练方法,包括:
获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
可选地,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型的步骤,包括:
提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量,其中,第一样本用户为多个样本用户中的任意一个;
利用各特征数据对应的预设权重,对第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果;
根据加权结果,得到第一样本用户的洗钱行为预测结果;
将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重,并返回执行提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量的步骤;
在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
可选地,将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重的步骤,包括:
将洗钱行为预测结果与第一样本用户的标注信息进行比较,得到洗钱行为预测结果与第一样本用户的标注信息之间的差异值;
若差异值大于预设阈值,则调整预设神经网络的网络参数和各特征数据对应的权重;
在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型的步骤,包括:
若差异值小于或等于预设阈值,则停止迭代训练,得到训练后的反洗钱模型。
可选地,在将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重,并返回执行提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量的步骤之后,该方法还包括:
累计迭代训练次数;
在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型的步骤,包括:
若迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型。
可选地,根据加权结果,得到第一样本用户的洗钱行为预测结果的步骤,包括:
将加权结果输入预设神经网络中的预测层,得到第一样本用户的洗钱行为预测结果,其中,洗钱行为预测结果包括第一样本用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,每个样本用户具有的多个特征数据至少包括:用户身份信息、用户交易信息、用户犯罪信息、用户征信信息。
根据本说明书实施例的第二方面,提供了一种反洗钱方法,包括:
获取目标用户的多个特征数据;
将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
可选地,将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果的步骤,包括:
将目标用户的多个特征数据输入反洗钱模型,得到目标用户的各特征数据对应的特征向量;
利用反洗钱模型中各特征数据对应的权重,对目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果;
根据加权结果,得到目标用户的洗钱行为识别结果。
可选地,洗钱行为识别结果包括目标用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,在将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果的步骤之后,该方法还包括:
输出反洗钱提示消息,其中,反洗钱提示消息包括目标用户存在洗钱行为的概率,反洗钱提示消息用于提示进行反洗钱处理。
根据本说明书实施例的第三方面,提供了一种生成反洗钱模型装置,包括:
训练样本集获取模块,被配置为获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
模型生成模块,被配置为利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块,进一步被配置为提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量,其中,第一样本用户为多个样本用户中的任意一个;利用各特征数据对应的预设权重,对第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果;根据加权结果,得到第一样本用户的洗钱行为预测结果;将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重,并返回执行提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量的步骤;在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块,进一步被配置为将洗钱行为预测结果与第一样本用户的标注信息进行比较,得到洗钱行为预测结果与第一样本用户的标注信息之间的差异值;若差异值大于预设阈值,则调整预设神经网络的网络参数和各特征数据对应的权重;若差异值小于或等于预设阈值,则停止迭代训练,得到训练后的反洗钱模型。
可选地,该装置还包括:
训练次数累计模块,被配置为累计迭代训练次数;
模型生成模块,进一步被配置为若迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块,进一步被配置为将加权结果输入预设神经网络中的预测层,得到第一样本用户的洗钱行为预测结果,其中,洗钱行为预测结果包括第一样本用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,每个样本用户具有的多个特征数据至少包括:用户身份信息、用户交易信息、用户犯罪信息、用户征信信息。
根据本说明书实施例的第四方面,提供了一种反洗钱装置,包括:
用户特征数据获取模块,被配置为获取目标用户的多个特征数据;
行为识别结果生成模块,被配置为将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
可选地,行为识别结果生成模块,进一步被配置为将目标用户的多个特征数据输入反洗钱模型,得到目标用户的各特征数据对应的特征向量;利用反洗钱模型中各特征数据对应的权重,对目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果;根据加权结果,得到目标用户的洗钱行为识别结果。
可选地,洗钱行为识别结果包括目标用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,该装置还包括:
消息提示模块,被配置为输出反洗钱提示消息,其中,反洗钱提示消息包括目标用户存在洗钱行为的概率,反洗钱提示消息用于提示进行反洗钱处理。
根据本说明书实施例的第五方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
根据本说明书实施例的第六方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取目标用户的多个特征数据;
将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
根据本说明书实施例的第七方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述反洗钱模型训练方法的步骤或者实现上述反洗钱方法的步骤。
本说明书一个实施例实现了获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型,综合考虑了用户的多个特征数据,并且针对不同的特征数据对应预设有权重,则在训练时,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息进行迭代训练,使训练得到的反洗钱模型更加精准,提高了反洗钱的识别准确度。
附图说明
图1是本说明书一个实施例提供的一种反洗钱模型训练方法的流程图;
图2是本说明书一个实施例提供的另一种反洗钱模型训练方法的流程图;
图3是本说明书一个实施例提供的一种反洗钱方法的流程图;
图4是本说明书一个实施例提供的一种反洗钱模型训练装置的结构示意图;
图5是本说明书一个实施例提供的一种反洗钱装置的结构示意图;
图6是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
洗钱:一种将非法所得合法化的行为。主要指将违法所得及其产生的收益,通过各种手段掩饰、隐瞒其来源和性质,使其在形式上合法化。
在本说明书中,提供了一种反洗钱模型训练方法和反洗钱方法,本说明书同时涉及一种反洗钱模型训练装置和反洗钱装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
图1示出了根据本说明书一个实施例提供的一种反洗钱模型训练方法的流程图,包括步骤102至步骤104。
步骤102:获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据。
在金融领域,用户交易过程中往往隐藏了一些洗钱行为,由于交易过程中用户的特征数据包括有大量与洗钱行为相关的特征数据,因此用户的特征数据可以作为反洗钱模型训练的基础。其中,用户的特征数据可以包括很多种,主要是指用户在进行交易行为时产生的数据,例如用户的身份、交易金额、交易时间等数据,具体根据实际情况设定,本说明书实施例对此不作限定。
本说明书一个或多个实施例中,每个样本用户具有的多个特征数据至少包括:用户身份信息、用户交易信息、用户犯罪信息、用户征信信息。
本说明书一个或多个实施例中,各样本用户是否存在洗钱行为的标注信息是对用户在历史交易过程中是否存在洗钱行为的标注,不仅仅是将用户标注为洗钱用户和正常用户,也可以标注用户的信誉度、犯罪率等,对用户是否存在洗钱行为的标注,一般情况下是人为进行标注的,在实际应用中,该标注信息也可以是机器获取并分析用户历史交易记录,对用户进行行为标注,具体根据实际情况设定,本说明书实施例对此不作限定。
步骤104:利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
本说明书一个或多个实施例中,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,其中,各特征数据对应的预设权重设有初始值,所有权重和为1,通常情况下,分配每个特征数据对应的权重时依据平均分配的原则,在实际应用中,也可以根据具体情况设定。预设神经网络是指能够实现反洗钱识别的初始网络,可选地为CNN(Convolutional Neural Networks,卷积神经网络)、或RNN(Recurrent Neural Network,循环神经网络)、或LSTM(Long Short-TermMemory,长短期记忆网络)等等,具体根据实际情况选择,本说明书实施例对此不作限定。
应用本说明书实施例的方案,获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型,综合考虑了用户的多个特征数据,并且针对不同的特征数据对应预设有权重,则在训练时,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息进行迭代训练,使训练得到的反洗钱模型更加精准,提高了反洗钱的识别准确度。
图2示出了本说明书一个实施例提供的另一种反洗钱模型训练方法的处理过程流程图,具体步骤包括步骤202至步骤212。
步骤202:获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据。
其中,步骤202与前述实施例的步骤102相同,本实施例便不再赘述。
步骤204:提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量,其中,第一样本用户为多个样本用户中的任意一个。
步骤206:利用各特征数据对应的预设权重,对第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果。
步骤208:根据加权结果,得到第一样本用户的洗钱行为预测结果。
步骤210:将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重。
在执行步骤210后,会返回执行步骤204。
步骤212:在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
本说明书一个或多个实施例中,提取第一样本用户的各特征数据,其中,特征数据至少包括:用户身份信息、用户交易信息、用户犯罪信息、用户征信信息。通过输入层将第一样本用户的特征数据输入至预设神经网络,得到第一样本用户的各特征数据对应的特征向量,利用各特征数据对应的预设权重,对第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果,根据加权结果得到第一样本用户的洗钱行为预测结果,将预测结果与第一样本用户的标注信息进行比较,根据比较结果调整预设神经网络的网络参数和各特征数据对应的权重,并返回执行步骤204,在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。其中,预设训练停止条件包括但不限于达到预设阈值。通过对预设神经网络的网络参数和各特征数据对应的权重的不断调整,使反洗钱模型更加灵活,提高对洗钱行为识别的准确性。
示例性的,提取样本用户A的身份信息、交易信息、犯罪信息和征信信息,将这四个特征数据输入至预设神经网络,得到用户A的各特征数据对应的特征向量,其中,用户A的身份信息、交易信息、犯罪信息和征信信息对应的权重均是0.25,将用户A的各特征数据对应的特征向量进行加权运算,得到加权结果,根据加权结果得到用户A的洗钱行为预测结果,根据预测结果调整预设神经网络的网络参数,并将身份信息、交易信息、犯罪信息和征信信息对应的权重分别调整为0.2、0.4.、0.1、0.3,之后返回执行步骤204,在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
下面对图2所示实施例中每个步骤的具体实现进行详细说明。
在本说明书一个或多个实施例中,步骤208具体可以通过如下步骤实现:
将加权结果输入预设神经网络中的预测层,得到第一样本用户的洗钱行为预测结果,其中,洗钱行为预测结果包括第一样本用户是否存在洗钱行为以及存在洗钱行为的概率。
在本说明书一个或多个实施例中,将加权结果输入预设神经网络中的预测层,得到第一样本用户的洗钱行为预测结果,其中,预测层指的是神经网络的输出层,一般是全连接层、softmax层等,具体根据实际情况设定,本说明书实施例对此不作限定。通过得到第一样本用户是否存在洗钱行为以及存在洗钱行为的概率,使预测结果更加清楚明了,提高反洗钱的识别准确度。
在本说明书一个或多个实施例中,步骤210具体可以通过如下步骤实现:
将洗钱行为预测结果与第一样本用户的标注信息进行比较,得到洗钱行为预测结果与第一样本用户的标注信息之间的差异值;
若差异值大于预设阈值,则调整预设神经网络的网络参数和各特征数据对应的权重;
步骤212具体可以通过如下步骤实现:
若差异值小于或等于预设阈值,则停止迭代训练,得到训练后的反洗钱模型。
在本说明书一个或多个实施例中,通过将洗钱行为预测结果与第一样本的标注信息进行比较,得到洗钱行为预测结果与第一样本用户的标注信息之间的差异值,若差异值大于预设阈值,则调整预设神经网络的网络参数和各特征数据对应的权重,若差异值小于或等于预设阈值,则停止迭代训练,得到训练后的反洗钱模型,使反洗钱模型更加灵活,提高对洗钱行为识别的准确性,其中,预设阈值具体根据实际情况设定,本说明书实施例对此不作限定。
在本说明书一个或多个实施例中,步骤210具体还可以通过如下步骤实现:
累计迭代训练次数;
步骤212具体还可以通过如下步骤实现:
若迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型。
在本说明书一个或多个实施例中,将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重,还可以累计迭代训练次数,若迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型,使反洗钱模型更加灵活,提高对洗钱行为识别的准确性,其中,预设次数具体根据实际情况设定,本说明书实施例对此不作限定。
图3示出了本说明书一个实施例提供的一种反洗钱方法的流程图,包括步骤302至步骤304。
步骤302:获取目标用户的多个特征数据。
在本说明书一个或多个实施例中,用户的特征数据可以包括很多种,主要是指用户在进行交易行为时产生的数据,例如用户的身份、交易金额、交易时间等数据,在实际应用中,特征数据不仅仅包括上述数据,还可以包括除上述数据以外的其他数据,具体根据实际情况设定,本说明书实施例对此不作限定。
步骤304:将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果。
其中,反洗钱模型利用图1或图2所示的反洗钱模型训练方法训练得到。
在本说明书一个或多个实施例中,获取目标用户的多各特征数据,将目标用户的多各特征数据输入反洗钱模型,通过神经网络算法得到目标用户的洗钱行为识别结果,实现了端对端的数据识别,解决了传统的在监管机构系统里获取黑名单,根据黑名单来确定用户涉及洗钱的犯罪活动的精准度不高,便利性差的问题,提高了反洗钱的识别准确度。
下面对图3所示实施例中每个步骤的具体实现进行详细说明。
在本说明书一个或多个实施例中,步骤304具体可以通过如下步骤实现:
将目标用户的多个特征数据输入反洗钱模型,得到目标用户的各特征数据对应的特征向量;
利用反洗钱模型中各特征数据对应的权重,对目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果;
根据加权结果,得到目标用户的洗钱行为识别结果。
本说明书一个或多个实施例中,将目标用户的多个特征数据输入反洗钱模型,得到目标用户的各特征数据对应的特征向量,利用各特征数据对应的预设权重,对目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果,根据加权结果得到目标用户的洗钱行为识别结果。通过利用反洗钱模型对用户洗钱行为进行识别,提高了对洗钱行为识别的准确性。
本说明书一个或多个实施例中,洗钱行为识别结果包括目标用户是否存在洗钱行为以及存在洗钱行为的概率。
本说明书一个或多个实施例中,洗钱行为识别结果不仅包含了目标用户是否存在洗钱行为,还可以包括用户存在洗钱行为的概率,使洗钱行为结果更加清楚明了,方便相关部门对洗钱行为进行处理。
在本说明书一个或多个实施例中,步骤304之后,还包括:
输出反洗钱提示消息,其中,反洗钱提示消息包括目标用户存在洗钱行为的概率,反洗钱提示消息用于提示进行反洗钱处理。
本说明书一个或多个实施例中,得到目标用户的洗钱行为识别结果之后,可以输出反洗钱提示消息,用于提示相关部门进行反洗钱处理,为了更加清楚的表示用户洗钱行为的识别结果,反洗钱提示消息中包括目标用户存在洗钱行为的概率,反洗钱处理包括但不限于冻结用户账户,具体根据实际情况设定,本说明书实施例对此不作限定。
与上述方法实施例相对应,本说明书还提供了反洗钱模型训练装置实施例,图4示出了本说明书一个实施例提供的一种反洗钱模型训练装置的结构示意图。如图4所示,该装置包括:
训练样本集获取模块402,被配置为获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
模型生成模块404,被配置为利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块404,进一步被配置为提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量,其中,第一样本用户为多个样本用户中的任意一个;利用各特征数据对应的预设权重,对第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果;根据加权结果,得到第一样本用户的洗钱行为预测结果;将洗钱行为预测结果与第一样本用户的标注信息进行比较,根据比较结果,调整预设神经网络的网络参数和各特征数据对应的权重,并返回执行提取第一样本用户的各特征数据,将第一样本用户的各特征数据输入预设神经网络,得到第一样本用户的各特征数据对应的特征向量的步骤;在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块404,进一步被配置为将洗钱行为预测结果与第一样本用户的标注信息进行比较,得到洗钱行为预测结果与第一样本用户的标注信息之间的差异值;若差异值大于预设阈值,则调整预设神经网络的网络参数和各特征数据对应的权重;若差异值小于或等于预设阈值,则停止迭代训练,得到训练后的反洗钱模型。
可选地,该装置还包括:
训练次数累计模块,被配置为累计迭代训练次数;
模型生成模块404,进一步被配置为若迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型。
可选地,模型生成模块404,进一步被配置为将加权结果输入预设神经网络中的预测层,得到第一样本用户的洗钱行为预测结果,其中,洗钱行为预测结果包括第一样本用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,每个样本用户具有的多个特征数据至少包括:用户身份信息、用户交易信息、用户犯罪信息、用户征信信息。
应用本说明书实施例的方案,获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型,综合考虑了用户的多个特征数据,并且针对不同的特征数据对应预设有权重,则在训练时,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息进行迭代训练,使训练得到的反洗钱模型更加精准,提高了反洗钱的识别准确度。
上述为本实施例的一种反洗钱模型训练装置的示意性方案。需要说明的是,该反洗钱模型训练装置的技术方案与上述的反洗钱模型训练方法的技术方案属于同一构思,反洗钱模型训练装置的技术方案未详细描述的细节内容,均可以参见上述反洗钱模型训练方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了反洗钱装置实施例,图5示出了本说明书一个实施例提供的一种反洗钱装置的结构示意图。如图5所示,该装置包括:
用户特征数据获取模块502,被配置为获取目标用户的多个特征数据;
行为识别结果生成模块504,被配置为将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
可选地,行为识别结果生成模块504,进一步被配置为将目标用户的多个特征数据输入反洗钱模型,得到目标用户的各特征数据对应的特征向量;利用反洗钱模型中各特征数据对应的权重,对目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果;根据加权结果,得到目标用户的洗钱行为识别结果。
可选地,洗钱行为识别结果包括目标用户是否存在洗钱行为以及存在洗钱行为的概率。
可选地,该装置还包括:
消息提示模块,被配置为输出反洗钱提示消息,其中,反洗钱提示消息包括目标用户存在洗钱行为的概率,反洗钱提示消息用于提示进行反洗钱处理。
应用本说明书实施例的方案,获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型,综合考虑了用户的多个特征数据,并且针对不同的特征数据对应预设有权重,则在训练时,利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息进行迭代训练,使训练得到的反洗钱模型更加精准,提高了反洗钱的识别准确度。
上述为本实施例的一种反洗钱装置的示意性方案。需要说明的是,该反洗钱装置的技术方案与上述的反洗钱方法的技术方案属于同一构思,反洗钱装置的技术方案未详细描述的细节内容,均可以参见上述反洗钱方法的技术方案的描述。
图6示出了根据本说明书一个实施例提供的一种计算设备600的结构框图。该计算设备600的部件包括但不限于存储器610和处理器620。处理器620与存储器610通过总线630相连接,数据库650用于保存数据。
计算设备600还包括接入设备640,接入设备640使得计算设备600能够经由一个或多个网络660通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备640可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备600的上述部件以及图6中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图6所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备600可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备600还可以是移动式或静止式的服务器。
其中,处理器620用于执行如下计算机可执行指令:获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的反洗钱模型训练方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述反洗钱模型训练方法的技术方案的描述。
其中,处理器620还用于执行如下计算机可执行指令:获取目标用户的多个特征数据;将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
需要说明的是,该计算设备的技术方案与上述的反洗钱方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述反洗钱方法的技术方案的描述。
本说明书一实施例提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:获取训练样本集,其中,训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;利用多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的反洗钱模型训练方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述反洗钱模型训练方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:将目标用户的多个特征数据输入反洗钱模型,得到目标用户的洗钱行为识别结果,其中,反洗钱模型利用上述反洗钱模型训练方法训练得到。
需要说明的是,该存储介质的技术方案与上述的反洗钱方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述反洗钱方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

Claims (10)

1.一种反洗钱模型训练方法,包括:
获取训练样本集,所述训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
利用所述多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
2.根据权利要求1所述的方法,所述利用所述多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型的步骤,包括:
提取第一样本用户的各特征数据,将所述第一样本用户的各特征数据输入预设神经网络,得到所述第一样本用户的各特征数据对应的特征向量,所述第一样本用户为所述多个样本用户中的任意一个;
利用所述各特征数据对应的预设权重,对所述第一样本用户的各特征数据对应的特征向量进行加权运算,得到加权结果;
根据所述加权结果,得到所述第一样本用户的洗钱行为预测结果;
将所述洗钱行为预测结果与所述第一样本用户的标注信息进行比较,根据比较结果,调整所述预设神经网络的网络参数和所述各特征数据对应的权重,并返回执行所述提取第一样本用户的各特征数据,将所述第一样本用户的各特征数据输入预设神经网络,得到所述第一样本用户的各特征数据对应的特征向量的步骤;
在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型。
3.根据权利要求2所述的方法,所述将所述洗钱行为预测结果与所述第一样本用户的标注信息进行比较,根据比较结果,调整所述预设神经网络的网络参数和所述各特征数据对应的权重的步骤,包括:
将所述洗钱行为预测结果与所述第一样本用户的标注信息进行比较,得到所述洗钱行为预测结果与所述第一样本用户的标注信息之间的差异值;
若所述差异值大于预设阈值,则调整所述预设神经网络的网络参数和所述各特征数据对应的权重;
所述在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型的步骤,包括:
若所述差异值小于或等于所述预设阈值,则停止迭代训练,得到训练后的反洗钱模型。
4.根据权利要求2或3所述的方法,在所述将所述洗钱行为预测结果与所述第一样本用户的标注信息进行比较,根据比较结果,调整所述预设神经网络的网络参数和所述各特征数据对应的权重,并返回执行所述提取第一样本用户的各特征数据,将所述第一样本用户的各特征数据输入预设神经网络,得到所述第一样本用户的各特征数据对应的特征向量的步骤之后,所述方法还包括:
累计迭代训练次数;
所述在达到预设训练停止条件的情况下,停止迭代训练,得到训练后的反洗钱模型的步骤,包括:
若所述迭代训练次数达到预设次数,则停止迭代训练,得到训练后的反洗钱模型。
5.根据权利要求2所述的方法,所述根据所述加权结果,得到所述第一样本用户的洗钱行为预测结果的步骤,包括:
将所述加权结果输入所述预设神经网络中的预测层,得到所述第一样本用户的洗钱行为预测结果,所述洗钱行为预测结果包括所述第一样本用户是否存在洗钱行为以及存在洗钱行为的概率。
6.一种反洗钱方法,包括:
获取目标用户的多个特征数据;
将所述目标用户的多个特征数据输入反洗钱模型,得到所述目标用户的洗钱行为识别结果,其中,所述反洗钱模型利用如权利要求1-5任一项所述的方法训练得到。
7.根据权利要求6所述的方法,所述将所述目标用户的多个特征数据输入反洗钱模型,得到所述目标用户的洗钱行为识别结果的步骤,包括:
将所述目标用户的多个特征数据输入反洗钱模型,得到所述目标用户的各特征数据对应的特征向量;
利用所述反洗钱模型中所述各特征数据对应的权重,对所述目标用户的各特征数据对应的特征向量进行加权运算,得到加权结果;
根据所述加权结果,得到所述目标用户的洗钱行为识别结果。
8.一种生成反洗钱模型的装置,包括:
训练样本集获取模块,被配置为获取训练样本集,所述训练样本集包括多个样本用户的特征数据以及各样本用户是否存在洗钱行为的标注信息,每个样本用户具有多个特征数据;
模型生成模块,被配置为利用所述多个样本用户的特征数据、各特征数据对应的预设权重以及各样本用户的标注信息,对预设神经网络进行迭代训练,得到训练后的反洗钱模型。
9.一种反洗钱装置,包括:
用户特征数据获取模块,被配置为获取目标用户的多个特征数据;
行为识别结果生成模块,被配置为将所述目标用户的多个特征数据输入反洗钱模型,得到所述目标用户的洗钱行为识别结果,其中,所述反洗钱模型利用如权利要求1-5任一项所述的方法训练得到。
10.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现权利要求1至5任意一项所述反洗钱模型训练方法的步骤或者实现权利要求6至7任意一项所述反洗钱方法的步骤。
CN202111307452.0A 2021-11-05 2021-11-05 反洗钱模型训练方法、反洗钱方法以及装置 Pending CN114004356A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111307452.0A CN114004356A (zh) 2021-11-05 2021-11-05 反洗钱模型训练方法、反洗钱方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111307452.0A CN114004356A (zh) 2021-11-05 2021-11-05 反洗钱模型训练方法、反洗钱方法以及装置

Publications (1)

Publication Number Publication Date
CN114004356A true CN114004356A (zh) 2022-02-01

Family

ID=79927707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111307452.0A Pending CN114004356A (zh) 2021-11-05 2021-11-05 反洗钱模型训练方法、反洗钱方法以及装置

Country Status (1)

Country Link
CN (1) CN114004356A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742655A (zh) * 2022-06-13 2022-07-12 杭银消费金融股份有限公司 基于机器学习的反洗钱行为识别系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN111915437A (zh) * 2020-06-30 2020-11-10 深圳前海微众银行股份有限公司 基于rnn的反洗钱模型的训练方法、装置、设备及介质
CN113095927A (zh) * 2021-02-23 2021-07-09 广发证券股份有限公司 一种反洗钱可疑交易识别方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470253A (zh) * 2018-04-02 2018-08-31 腾讯科技(深圳)有限公司 一种用户识别方法、装置及存储设备
CN110046952A (zh) * 2019-01-30 2019-07-23 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN111915437A (zh) * 2020-06-30 2020-11-10 深圳前海微众银行股份有限公司 基于rnn的反洗钱模型的训练方法、装置、设备及介质
CN113095927A (zh) * 2021-02-23 2021-07-09 广发证券股份有限公司 一种反洗钱可疑交易识别方法及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742655A (zh) * 2022-06-13 2022-07-12 杭银消费金融股份有限公司 基于机器学习的反洗钱行为识别系统

Similar Documents

Publication Publication Date Title
US11836643B2 (en) System for secure federated learning
CN109583468B (zh) 训练样本获取方法,样本预测方法及对应装置
Su et al. A deep learning approach to android malware feature learning and detection
KR101879416B1 (ko) 이상 금융거래 탐지 방법 및 그 전자 장치
WO2019114344A1 (zh) 一种基于图结构模型的异常账号防控方法、装置以及设备
WO2019210695A1 (zh) 模型训练和业务推荐
Shi et al. Active deep learning attacks under strict rate limitations for online API calls
US20180330226A1 (en) Question recommendation method and device
CN111260220B (zh) 群控设备识别方法、装置、电子设备和存储介质
CN111738441A (zh) 兼顾预测精度和隐私保护的预测模型训练方法及装置
TW202001749A (zh) 套現識別方法和裝置
CN110717758B (zh) 异常交易识别方法和装置
CN114004356A (zh) 反洗钱模型训练方法、反洗钱方法以及装置
CN110675263A (zh) 交易数据的风险识别方法以及装置
CN112818868B (zh) 基于行为序列特征数据的违规用户识别方法和装置
Ramanujam et al. Multi-lingual Spam SMS detection using a hybrid deep learning technique
CN110796450B (zh) 可信关系处理方法以及装置
CN115935265B (zh) 训练风险识别模型的方法、风险识别方法及对应装置
CN110555007B (zh) 盗号行为判别方法、装置、计算设备及存储介质
CN110808978B (zh) 实名认证方法以及装置
JP7331938B2 (ja) 学習装置、推定装置、学習方法及び学習プログラム
CN115171725A (zh) 一种基于自监督的防语音合成攻击方法和系统
Nandakumar et al. Scamblk: A voice recognition-based natural language processing approach for the detection of telecommunication fraud
CN111552846A (zh) 识别可疑关系的方法以及装置
CN111383028B (zh) 预测模型训练方法及装置、预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination