CN112906765A - 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统 - Google Patents

一种基于rbf神经网络的客户洗钱风险等级划分方法及系统 Download PDF

Info

Publication number
CN112906765A
CN112906765A CN202110136263.5A CN202110136263A CN112906765A CN 112906765 A CN112906765 A CN 112906765A CN 202110136263 A CN202110136263 A CN 202110136263A CN 112906765 A CN112906765 A CN 112906765A
Authority
CN
China
Prior art keywords
data
obtaining
network model
output
money laundering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110136263.5A
Other languages
English (en)
Inventor
冯于羚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202110136263.5A priority Critical patent/CN112906765A/zh
Publication of CN112906765A publication Critical patent/CN112906765A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于RBF神经网络的客户洗钱风险等级划分方法及系统:获得客户洗钱风险等级划分的输入数据;根据所述输入数据,获得训练数据集;通过APC‑III聚类算法确定基函数中心Xi;获得RBF网络模型的方差σ;获得所述RBF网络模型中隐含层与输出层之间的权值W;将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。解决了现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题。

Description

一种基于RBF神经网络的客户洗钱风险等级划分方法及系统
技术领域
本发明涉及洗钱风险等级划分相关领域,尤其涉及一种基于RBF神经网络的客户洗钱风险等级划分方法及系统。
背景技术
客户洗钱风险评估和等级分类是反洗钱管理的核心内容,是洗钱风险管控差异化的主要标尺,其结果的准确性将直接影响客户可使用建行产品和服务的范围。洗钱风险评估指标体系包括客户特性、地域、业务、行业4类基本要素和20个风险子项。各金融机构目前普遍采用权重法,对每一基本要素及其风险子项进行权重赋值,各项权重均大于0,综合等于100。对于风险控制效果影响力越大的基本要素及其风险子项,赋值相应越高。最后,根据各风险子项评分及权重赋值计算客户风险等级总分。按照权重法实施洗钱风险等级划分,必须预先对风险子项进行权重赋值,权重设置的科学性和合理性将直接影响全局的风险划分结果。而各风险子项异质性较强,难以辨别孰轻孰重,准确赋值操作难度较大。此外,金融机构目前的风险等级划分结果在按照权重法重新划分风险等级时无法被再利用。各金融机构如何实现既在一定期限内保留原有客户风险等级划分结果,又按新的指标分解客户风险,实现《指引》的平稳过渡,是当前迫切需要解决的问题。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题。
发明内容
本申请实施例通过提供一种基于RBF神经网络的客户洗钱风险等级划分方法及系统,解决了现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
鉴于上述问题,提出了本申请实施例提供一种基于RBF神经网络的客户洗钱风险等级划分方法及系统。
第一方面,本申请实施例提供了一种基于RBF神经网络的客户洗钱风险等级划分方法,所述方法包括:获得客户洗钱风险等级划分的输入数据;根据所述输入数据,获得训练数据集;通过APC-III聚类算法确定基函数中心Xi;获得RBF网络模型的方差σ;获得所述RBF网络模型中隐含层与输出层之间的权值W;将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
另一方面,本申请还提供了一种基于RBF神经网络的客户洗钱风险等级划分系统,所述系统包括:第一获得单元,所述第一获得单元用于获得客户洗钱风险等级划分的输入数据;第二获得单元,所述第二获得单元用于根据所述输入数据,获得训练数据集;第一确定单元,所述第一确定单元用于通过APC-III聚类算法确定基函数中心Xi;第三获得单元,所述第三获得单元用于获得RBF网络模型的方差σ;第四获得单元,所述第四获得单元用于获得所述RBF网络模型中隐含层与输出层之间的权值W;第五获得单元,所述第五获得单元用于将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
第三方面,本发明提供了一种基于RBF神经网络的客户洗钱风险等级划分系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述方法的步骤。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了根据所述客户洗钱风险等级划分的输入数据,获得训练数据集,通过APC-III聚类算法确定基函数中心Xi,获得RBF网络模型的方差σ,获得所述RBF网络模型中隐含层与输出层之间的权值W,将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型的方式,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例一种基于RBF神经网络的客户洗钱风险等级划分方法的流程示意图;
图2为本申请实施例一种基于RBF神经网络的客户洗钱风险等级划分系统的结构示意图;
图3为本申请实施例示例性电子设备的结构示意图。
附图标记说明:第一获得单元11,第二获得单元12,第一确定单元13,第三获得单元14,第四获得单元15,第五获得单元16,总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
本申请实施例通过提供一种基于RBF神经网络的客户洗钱风险等级划分方法及系统,解决了现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
客户洗钱风险评估和等级分类是反洗钱管理的核心内容,是洗钱风险管控差异化的主要标尺,其结果的准确性将直接影响客户可使用建行产品和服务的范围。洗钱风险评估指标体系包括客户特性、地域、业务、行业4类基本要素和20个风险子项。各金融机构目前普遍采用权重法,对每一基本要素及其风险子项进行权重赋值,各项权重均大于0,综合等于100。对于风险控制效果影响力越大的基本要素及其风险子项,赋值相应越高。最后,根据各风险子项评分及权重赋值计算客户风险等级总分。按照权重法实施洗钱风险等级划分,必须预先对风险子项进行权重赋值,权重设置的科学性和合理性将直接影响全局的风险划分结果。而各风险子项异质性较强,难以辨别孰轻孰重,准确赋值操作难度较大。此外,金融机构目前的风险等级划分结果在按照权重法重新划分风险等级时无法被再利用。各金融机构如何实现既在一定期限内保留原有客户风险等级划分结果,又按新的指标分解客户风险,实现《指引》的平稳过渡,是当前迫切需要解决的问题。但现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请实施例提供了一种基于RBF神经网络的客户洗钱风险等级划分方法,所述方法包括:获得客户洗钱风险等级划分的输入数据;根据所述输入数据,获得训练数据集;通过APC-III聚类算法确定基函数中心Xi;获得RBF网络模型的方差σ;获得所述RBF网络模型中隐含层与输出层之间的权值W;将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了一种基于RBF神经网络的客户洗钱风险等级划分方法,其中,所述方法包括:
步骤S100:获得客户洗钱风险等级划分的输入数据;
具体而言,所述输入数据包括银行对公对私客户信息表、对私对公账户信息表、持有产品、基于客户账户的交易数据表等基础数据;还包括已报送的可疑交易报告数据;还包括外部数据,如对公的工商数据等,在客户许可的基础上,将所述数据作为输入数据。
步骤S200:根据所述输入数据,获得训练数据集;
具体而言,通过上述数据选样,将所述输入数据进行比例分配,举例而言,所述比例可以是2:8比例,根据所述比例分配,80%数据用于训练,20%用于测试,将所述用于训练的数据进行数据处理,所述处理方式包括但不限于缺失率筛选、数据标准化处理、进行输入变量个数分析等。
步骤S300:通过APC-III聚类算法确定基函数中心Xi
具体而言,所述APC-III聚类算法是聚类算法的一种,聚类算法是数据挖掘的一个重要算法,它只需对样本集只学习一次,具有很高的学习速率。通过确定聚类半径,确定聚类数。当所有的训练样本学习完毕后且中心的分布不再变化时,最后得到的Xi即为RBF神经网络最终的基函数中心。
步骤S400:获得RBF网络模型的方差σ;
具体而言,当所述RBF网络模型的中心向量Xi确定后,所述RBF网络模型的方差为Gaussian函数的宽度,计算公式如下:
Figure BDA0002927063680000061
步骤S500:获得所述RBF网络模型中隐含层与输出层之间的权值W;
具体而言,由于之前梯度下降算法在收敛速度方面表现出减慢,在寻求解决隐含层与输出层之间连接值的问题的时候,其实是一个线性优化问题,所以采用RLS算法,确定所述RBF网络模型中隐含层与输出层之间的权值W。
步骤S600:将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
具体而言,通过上述训练数据,将所述训练数据作为输入数据,运用计算机语言输入所述训练数据,通过调参得到隐含层的节点数、方差和隐含层到输出层之间的权值,构建所述RBF网络模型,根据训练集的网络计算输出值与目标输出值之间的均方差(MSE)和相关系数(R)来综合评价网络模型的学习效果,确定最佳的网络模型。将第一客户的数据输入所述获得所述RBF网络模型,获得所述RBF网络模型的输出结果,所述输出结果包括第一客户洗钱风险等级划分结果。达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
进一步而言,所述获得客户洗钱风险等级划分的输入数据,本申请实施例步骤S100还包括:
步骤S110:获得客户基础数据;
步骤S120:获得已报送的可疑交易报告数据;
步骤S130:获得外部数据;
步骤S140:根据所述客户基础数据、所述已报送的可疑交易报告数据和所述外部数据,获得客户洗钱风险等级划分的输入数据。
具体而言,所述基础数据可以是对私对公客户信息基本表、对私对公账户信息表、持有产品、基于客户账户的交易数据表的基础数据,所述可疑交易报告数据可以是已经报送的可疑交易报告数据,所述外部数据包括对公的工商数据,将所述数据作为所述客户洗钱风险等级划分的输入数据。
进一步的,所述根据所述输入数据,获得训练数据集,本申请实施例步骤S200还包括:
步骤S210:获得预定分配比例;
步骤S220:按照所述预定分配比例,将所述输入数据划分为训练数据集和测试数据集。
具体而言,所述预定分配比例为预先设定的分配比例,根据所述预定分配比例,将所述输入数据分为训练数据集和测试数据集,即通过训练数据集对所述RBF网络模型进行训练,通过所述测试数据集进行RBF网络模型的测试,以保证所述RBF网络模型的处理数据的准确性。举例而言,所述比例可以是2:8的比例,通过所述比例进行分配,即80%的数据用于训练20%的数据用于测试。
进一步而言,所述将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果之前,本申请实施例步骤S600还包括:
步骤S610:判断所述输入数据属于测试数据集还是训练数据集;
步骤S620:如果所述输入数据属于所述训练数据集,将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据。
进一步而言,所述判断所述输入数据属于测试数据集还是训练数据集之后,本申请实施例步骤S610还包括:
步骤S611:如果所述输入数据属于所述测试数据集,将所述测试数据集中的数据作为输入数据,输入所述RBF网络模型,获得第二输出数据信息,其中,所述第二输出数据信息包括第二客户洗钱风险等级划分结果。
具体而言,对所述经过数据选样、和数据处理的数据进行判断,当判断所述数据属于训练数据集时,将所述数据作为数据学习的输入数据,运用计算机语言将所述数据输入RBF网络模型,通过调参得到隐含层的节点数、方差和隐含层到输出层之间的权值。根据训练集的网络计算输出值与目标输出值之间的均方差(MSE)和相关系数(R)来综合评价网络模型的学习效果,确定最佳的网络模型。当所述数据属于测试数据集时,通过所述测试集来测试所确定的网络模型,用网络计算的风险值和实测的风险值之间的(MSE)和(R)来评价该网络模型的预测性能。通过所述训练数据的训练,和测试数据对的RBF网络模型调整,获得更加准确的模型处理所述输入数据,进而达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
进一步而言,所述获得客户洗钱风险等级划分的输入数据之后,本申请实施例步骤S100还包括:
步骤S150:获得所述输入数据的缺失率;
步骤S160:获得预定缺失率阈值;
步骤S170:判断所述输入数据的缺失率是否超过所述预定缺失率阈值;
步骤S180:如果所述输入数据的缺失率超过所述预定缺失率阈值,将所述输入数据删除。
具体而言,所述预定缺失率阈值为为保证所述训练数据的有效性获得的预定的缺失率阈值,即所述数据在满足所述缺失率阈值范围内时,所述数据仍然可继续作为训练数据进行使用。举例而言,所述缺失率阈值可以为80%,判断所述输入数据的缺失率是否在所述预定缺失率阈值范围内,当所述输入数据的缺失率超过所述预定缺失率阈值时,此时所述输入数据不能满足作为训练数据或测试数据的要求,此时,将所述数据删除处理。通过对所述输入数据的缺失率进行筛选,达到获得真实、有效、准确的数据作为构建RBF网络模型的基础框架数据,进而达到获得更加准确的RBF网络模型,为后续降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估夯实了基础。
进一步而言,本申请实施例还包括:
步骤S230:获得预定偏离度阈值;
步骤S240:根据标准统计函数获得样本均值、方差、中值、偏度和峰度,和预定偏离度阈值,删除输入数据中偏离度超过所述预定偏离度阈值的数据,获得筛选后的训练数据集和测试数据集。
具体而言,训练RBF神经网络前,对所有变量使用极差法进行数据标准化处理,使其在[0,1]区间内。通过标准统计函数计算样本均值(mean)、方差(var)、中值(median)、偏度(skewness)、峰度(kurtosis)值,根据其结果剔除偏离太大的数据留下合适的训练集和测试集,合理减少输入变量个数,通过多变量相关分析筛选出对输出变量有重要作用的输入变量。
进一步而言,所述通过APC-Ⅲ聚类算法确定基函数中心Xi,具体包括:
Figure BDA0002927063680000111
其中,p为样本个数;
α为常数;
Xi为所述基函数中心;
最后的聚类数由R0的大小决定。当所有的训练样本学习完毕且中心的分布不再变化,则最后得到的Xi即为RBF神经网络最终的基函数中心。
进一步而言,本申请实施例还包括:
步骤S612:获得目标输出值;
步骤S613:根据所述第一输出数据和所述目标输出值,对所述RBF网络模型的学习效果进行评估,获得第一评估结果;
步骤S614:根据所述第一评估结果,获得第一RBF网络模型。
具体而言,所述目标输出值可以理解为所述训练数据的监督数据,即所述RBF网络模型处理所述数据的理想输出结果,获得所述RBF网络模型处理所述输入数据的第一输出结果,通过所述目标输出值对所述第一输出数据进行评估,获得第一评估结果,根据所述第一评估结果的情况对所述RBF网络模型进行修正,获得修正后的RBF网络模型。
进一步而言,本申请实施例还包括:
步骤S6141:将所述测试数据集中的数据输入所述第一RBF网络模型,获得第三输出数据信息,其中,所述第三输出数据信息包括第三客户洗钱风险等级划分结果;
步骤S6142:根据所述第三输出数据和所述目标输出值,对所述第一RBF网络模型的预测性能进行评估,获得第二评估结果。
进一步而言,本申请实施例还包括:
步骤S6143:实时更新所述第一RBF网络模型的参数信息;
步骤S6144:根据所述实时更新所述第一RBF网络模型的参数信息,对所述第一RBF网络模型进行在线学习。
具体而言,将所述测试数据集中的数据输入所述第一RBF网络模型,所述输入测试数据的过程为进行所述第一RBF网络模型性能评估的过程,将上述经过数据选样、数据处理、数据分配后的数据用于测试的数据输入所述第一RBF网络模型,获得第三输出数据信息,所述第三输出数据信息为所述第一RBF网络模型的输出结果,获得所述测试数据集与输出结果对应的目标输出值,根据所述目标输出值对所述第一RBF网络模型的预测性能进行评估,根据所述目标输出值与第三输出数据信息的差异,获得第二评估结果。所述实时更新参数信息具体为所述第一RBF网络模型不断的进行自学习和自适应的过程,不断的丰满数据样本,所述第一RBF网络模型通过新增样本不断的进行学习和调整,完善模型性能,进行在线学习和进步,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
进一步而言,所述实时更新所述第一RBF网络模型的参数信息本申请实施例步骤S6143还包括:
步骤S61431:从所述第一输出数据、所述第二输出数据和所述第三输出数据中获得第四输出数据,其中,所述第四输出数据为所述第一输出数据、所述第二输出数据和所述第三输出数据中的部分数据;
步骤S61432:根据所述第四输出数据,对所述参数信息进行更新。
进一步而言,本申请实施例步骤S61442还包括:
步骤S614321:对所述第四输出数据进行数据预处理,获得案例数据;
步骤S614322:根据所述案例数据,对所述参数信息进行更新。
具体而言,所述实时更新所述第一RBF网络模型的参数信息为进行参数学习的过程,通过抽取第一输出数据、第二输出数据、第三输出数据中的部分数据,将所述数据作为第四输出数据,将所述第四输出数据进行数据的预处理后作为案例数据进行参数的实时更新和调整,将调整好参数的RBF网络模型作为最新的RBF网络模型。
综上所述,本申请实施例所提供的一种基于RBF神经网络的客户洗钱风险等级划分方法及系统具有如下技术效果:
1、由于采用了根据所述客户洗钱风险等级划分的输入数据,获得训练数据集,通过APC-III聚类算法确定基函数中心Xi,获得RBF网络模型的方差σ,获得所述RBF网络模型中隐含层与输出层之间的权值W,将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型的方式,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
2、由于采用了通过所述训练数据的训练和测试数据对的RBF网络模型调整的方式,获得更加准确的模型处理所述输入数据,进而达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
3、由于采用了通过对所述输入数据的缺失率进行筛选的方式,达到获得真实、有效、准确的数据作为构建RBF网络模型的基础框架数据,进而达到获得更加准确的RBF网络模型,为后续降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估夯实了基础。
实施例二
基于与前述实施例中一种基于RBF神经网络的客户洗钱风险等级划分方法同样发明构思,本发明还提供了一种基于RBF神经网络的客户洗钱风险等级划分系统,如图2所示,所述系统包括:
第一获得单元11,所述第一获得单元11用于获得客户洗钱风险等级划分的输入数据;
第二获得单元12,所述第二获得单元12用于根据所述输入数据,获得训练数据集;
第一确定单元13,所述第一确定单元13用于通过APC-III聚类算法确定基函数中心Xi
第三获得单元14,所述第三获得单元14用于获得RBF网络模型的方差σ;
第四获得单元15,所述第四获得单元15用于获得所述RBF网络模型中隐含层与输出层之间的权值W;
第五获得单元16,所述第五获得单元16用于将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
进一步的,所述系统还包括:
第六获得单元,所述第六获得单元用于获得客户基础数据;
第七获得单元,所述第七获得单元用于获得已报送的可疑交易报告数据;
第八获得单元,所述第八获得单元用于获得外部数据;
第九获得单元,所述第九获得单元用于根据所述客户基础数据、所述已报送的可疑交易报告数据和所述外部数据,获得客户洗钱风险等级划分的输入数据。
进一步的,所述系统还包括:
第十获得单元,所述第十获得单元用于获得预定分配比例;
第一划分单元,所述第一划分单元用于按照所述预定分配比例,将所述输入数据划分为训练数据集和测试数据集。
进一步的,所述系统还包括:
第一判断单元,所述第一判断单元用于判断所述输入数据属于测试数据集还是训练数据集;
第十一获得单元,所述第十一获得单元用于如果所述输入数据属于所述训练数据集,将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据。
进一步的,所述系统还包括:
第十二获得单元,所述第十二获得单元用于如果所述输入数据属于所述测试数据集,将所述测试数据集中的数据作为输入数据,输入所述RBF网络模型,获得第二输出数据信息,其中,所述第二输出数据信息包括第二客户洗钱风险等级划分结果。
进一步的,所述系统还包括:
第十三获得单元,所述第十三获得单元用于获得所述输入数据的缺失率;
第十四获得单元,所述第十四获得单元用于获得预定缺失率阈值;
第二判断单元,所述第二判断单元用于判断所述输入数据的缺失率是否超过所述预定缺失率阈值;
第一删除单元,所述第一删除单元用于如果所述输入数据的缺失率超过所述预定缺失率阈值,将所述输入数据删除。
进一步的,所述系统还包括:
第十五获得单元,所述第十五获得单元用于获得预定偏离度阈值;
第十六获得单元,所述第十六获得单元用于根据标准统计函数获得样本均值、方差、中值、偏度和峰度,和预定偏离度阈值,删除输入数据中偏离度超过所述预定偏离度阈值的数据,获得筛选后的训练数据集和测试数据集。
进一步的,所述系统还包括:
第十七获得单元,所述第十七获得单元用于获得目标输出值;
第十八获得单元,所述第十八获得单元用于根据所述第一输出数据和所述目标输出值,对所述RBF网络模型的学习效果进行评估,获得第一评估结果;
第十九获得单元,所述第十九获得单元用于根据所述第一评估结果,获得第一RBF网络模型。
进一步的,所述系统还包括:
第一输入单元,所述第一输入单元用于将所述测试数据集中的数据输入所述第一RBF网络模型,获得第三输出数据信息,其中,所述第三输出数据信息包括第三客户洗钱风险等级划分结果;
第二十获得单元,所述第二十获得单元用于根据所述第三输出数据和所述目标输出值,对所述第一RBF网络模型的预测性能进行评估,获得第二评估结果。
进一步的,所述系统还包括:
第一更新单元,所述第一更新单元用于实时更新所述第一RBF网络模型的参数信息;
第一学习单元,所述第一学习单元用于根据所述实时更新所述第一RBF网络模型的参数信息,对所述第一RBF网络模型进行在线学习。
进一步的,所述系统还包括:
第二十一获得单元,所述第二十一获得单元用于从所述第一输出数据、所述第二输出数据和所述第三输出数据中获得第四输出数据,其中,所述第四输出数据为所述第一输出数据、所述第二输出数据和所述第三输出数据中的部分数据;
第二更新单元,所述第二更新单元用于根据所述第四输出数据,对所述参数信息进行更新。
进一步的,所述系统还包括:
第二十二获得单元,所述第二十二获得单元用于对所述第四输出数据进行数据预处理,获得案例数据;
第三更新单元,所述第三更新单元用于根据所述案例数据,对所述参数信息进行更新。
前述图1实施例一中的一种基于RBF神经网络的客户洗钱风险等级划分方法的各种变化方式和具体实例同样适用于本实施例的一种基于RBF神经网络的客户洗钱风险等级划分系统,通过前述对一种基于RBF神经网络的客户洗钱风险等级划分方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于RBF神经网络的客户洗钱风险等级划分系统的实施方法,所以为了说明书的简洁,在此不再详述。
示例性电子设备
下面参考图3来描述本申请实施例的电子设备。
图3图示了根据本申请实施例的电子设备的结构示意图。
基于与前述实施例中一种基于RBF神经网络的客户洗钱风险等级划分方法的发明构思,本发明还提供一种基于RBF神经网络的客户洗钱风险等级划分系统,其上存储有计算机程序,该程序被处理器执行时实现前文所述一种基于RBF神经网络的客户洗钱风险等级划分方法的任一方法的步骤。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他系统通信的单元。
处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的数据。
本发明实施例提供的一种基于RBF神经网络的客户洗钱风险等级划分方法,所述方法包括:获得客户洗钱风险等级划分的输入数据;根据所述输入数据,获得训练数据集;通过APC-III聚类算法确定基函数中心Xi;获得RBF网络模型的方差σ;获得所述RBF网络模型中隐含层与输出层之间的权值W;将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。解决了现有技术中存在数据报告标准模糊、操作量大、误报率高,对洗钱风险评估不准确、不及时的技术问题,达到降低报告数据冗余,对客户洗钱风险进行准确、及时、有效的评估的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品,该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (15)

1.一种基于RBF神经网络的客户洗钱风险等级划分方法,其中,所述方法包括:
获得客户洗钱风险等级划分的输入数据;
根据所述输入数据,获得训练数据集;
通过APC-III聚类算法确定基函数中心Xi
获得RBF网络模型的方差σ;
获得所述RBF网络模型中隐含层与输出层之间的权值W;
将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
2.如权利要求1所述的方法,其中,所述获得客户洗钱风险等级划分的输入数据,包括:
获得客户基础数据;
获得已报送的可疑交易报告数据;
获得外部数据;
根据所述客户基础数据、所述已报送的可疑交易报告数据和所述外部数据,获得客户洗钱风险等级划分的输入数据。
3.如权利要求1所述的方法,其中,所述根据所述输入数据,获得训练数据集,包括:
获得预定分配比例;
按照所述预定分配比例,将所述输入数据划分为训练数据集和测试数据集。
4.如权利要求3所述的方法,其中,所述将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果之前,包括:
判断所述输入数据属于测试数据集还是训练数据集;
如果所述输入数据属于所述训练数据集,将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据。
5.如权利要求4所述的方法,其中,所述判断所述输入数据属于测试数据集还是训练数据集之后,包括:
如果所述输入数据属于所述测试数据集,将所述测试数据集中的数据作为输入数据,输入所述RBF网络模型,获得第二输出数据信息,其中,所述第二输出数据信息包括第二客户洗钱风险等级划分结果。
6.如权利要求1所述的方法,其中,所述获得客户洗钱风险等级划分的输入数据之后,包括:
获得所述输入数据的缺失率;
获得预定缺失率阈值;
判断所述输入数据的缺失率是否超过所述预定缺失率阈值;
如果所述输入数据的缺失率超过所述预定缺失率阈值,将所述输入数据删除。
7.如权利要求3所述的方法,其中,所述方法包括:
获得预定偏离度阈值;
根据标准统计函数获得样本均值、方差、中值、偏度和峰度,和预定偏离度阈值,删除输入数据中偏离度超过所述预定偏离度阈值的数据,获得筛选后的训练数据集和测试数据集。
8.如权利要求1所述的方法,其中,所述通过APC-III聚类算法确定基函数中心Xi,具体包括:
Figure FDA0002927063670000031
其中,p为样本个数;
α为常数;
Xi为所述基函数中心。
9.如权利要求5所述的方法,其中,所述方法包括:
获得目标输出值;
根据所述第一输出数据和所述目标输出值,对所述RBF网络模型的学习效果进行评估,获得第一评估结果;
根据所述第一评估结果,获得第一RBF网络模型。
10.如权利要求9所述的方法,其中,所述方法包括:
将所述测试数据集中的数据输入所述第一RBF网络模型,获得第三输出数据信息,其中,所述第三输出数据信息包括第三客户洗钱风险等级划分结果;
根据所述第三输出数据和所述目标输出值,对所述第一RBF网络模型的预测性能进行评估,获得第二评估结果。
11.如权利要求10所述的方法,其中,所述方法包括:
实时更新所述第一RBF网络模型的参数信息;
根据所述实时更新所述第一RBF网络模型的参数信息,对所述第一RBF网络模型进行在线学习。
12.如权利要求11所述的方法,其中,所述实时更新所述第一RBF网络模型的参数信息,包括:
从所述第一输出数据、所述第二输出数据和所述第三输出数据中获得第四输出数据,其中,所述第四输出数据为所述第一输出数据、所述第二输出数据和所述第三输出数据中的部分数据;
根据所述第四输出数据,对所述参数信息进行更新。
13.如权利要求12所述的方法,其中,所述根据所述第四输出数据,对所述参数信息进行更新,包括:
对所述第四输出数据进行数据预处理,获得案例数据;
根据所述案例数据,对所述参数信息进行更新。
14.一种基于RBF神经网络的客户洗钱风险等级划分系统,其中,所述系统包括:
第一获得单元,所述第一获得单元用于获得客户洗钱风险等级划分的输入数据;
第二获得单元,所述第二获得单元用于根据所述输入数据,获得训练数据集;
第一确定单元,所述第一确定单元用于通过APC-III聚类算法确定基函数中心Xi
第三获得单元,所述第三获得单元用于获得RBF网络模型的方差σ;
第四获得单元,所述第四获得单元用于获得所述RBF网络模型中隐含层与输出层之间的权值W;
第五获得单元,所述第五获得单元用于将所述训练数据集中的数据作为输入数据,根据所述基函数中心Xi、所述方差σ和隐含层与输出层之间的权值W,构建RBF网络模型,获得第一输出数据,所述第一输出数据包括第一客户洗钱风险等级划分结果。
15.一种基于RBF神经网络的客户洗钱风险等级划分系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现权利要求1-13任一项所述方法的步骤。
CN202110136263.5A 2021-02-01 2021-02-01 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统 Pending CN112906765A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110136263.5A CN112906765A (zh) 2021-02-01 2021-02-01 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110136263.5A CN112906765A (zh) 2021-02-01 2021-02-01 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统

Publications (1)

Publication Number Publication Date
CN112906765A true CN112906765A (zh) 2021-06-04

Family

ID=76120831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110136263.5A Pending CN112906765A (zh) 2021-02-01 2021-02-01 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统

Country Status (1)

Country Link
CN (1) CN112906765A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117291716A (zh) * 2023-11-24 2023-12-26 南通千鸟纸通宝信息科技有限公司 一种货款数据的风险评估方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633455A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 基于数据模型的信用评估方法及装置
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、系统、计算机装置及介质
CN110298574A (zh) * 2019-06-21 2019-10-01 国网辽宁省电力有限公司鞍山供电公司 一种基于卷积神经网络的用电用户缴费风险评级方法
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633455A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 基于数据模型的信用评估方法及装置
CN110046993A (zh) * 2018-12-15 2019-07-23 深圳壹账通智能科技有限公司 非法所得合法化行为监测方法、系统、计算机装置及介质
CN110298574A (zh) * 2019-06-21 2019-10-01 国网辽宁省电力有限公司鞍山供电公司 一种基于卷积神经网络的用电用户缴费风险评级方法
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吕林涛 等: "基于RBF 神经网络的可疑交易监测模型", 《计算机工程与应用》 *
吕林涛 等: "基于RBF 神经网络的可疑交易监测模型", 《计算机工程与应用》, vol. 46, no. 3, 21 January 2010 (2010-01-21), pages 207 - 210 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117291716A (zh) * 2023-11-24 2023-12-26 南通千鸟纸通宝信息科技有限公司 一种货款数据的风险评估方法

Similar Documents

Publication Publication Date Title
CN107633265A (zh) 用于优化信用评估模型的数据处理方法及装置
CN112258093A (zh) 风险等级的数据处理方法及装置、存储介质、电子设备
CN109191282A (zh) 一种基于行为模型的贷中监测评分方法以及系统
CN108734567A (zh) 一种基于大数据人工智能风控的资产管理系统及其评估方法
CN111275338A (zh) 一种企业欺诈行为的判定方法、装置、设备及存储介质
CN110310199B (zh) 借贷风险预测模型的构建方法、系统及借贷风险预测方法
CN104022899A (zh) 一种网络管理系统的三维评估方法及系统
CN113393316B (zh) 基于海量大数据、核心算法的贷款全过程精准风控及管理系统
CN112906765A (zh) 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统
CN116911994B (zh) 对外贸易风险预警系统
CN113919432A (zh) 一种分类模型构建方法、数据分类方法及装置
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
CN116739742A (zh) 信贷风控模型的监控方法、装置、设备及存储介质
CN111382909A (zh) 基于生存分析模型扩展坏样本的拒绝推断方法及相关设备
CN110866694A (zh) 一种电网建设项目财务评价系统及其方法
CN115330526A (zh) 一种企业信用评分方法及装置
CN112346995B (zh) 一种基于银行业的测试风险预估模型的构建方法及装置
CN110196797A (zh) 适于信用评分卡系统的自动优化方法和系统
CN113837481B (zh) 一种基于区块链的金融大数据管理系统
KR101478935B1 (ko) 리스크-프로파일 생성 장치
CN117436770B (zh) 基于bim的建筑工程建设管理方法及系统
Kuznietsova et al. Adaptive Approach to Building Risk Models of Financial Systems.
CN116780524B (zh) 一种基于lstm深度学习的工业企业短期负荷预测方法
CN116611345A (zh) 钢轨承受载重预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210604