CN111105240B - 资源敏感的联合金融欺诈检测模型训练方法及检测方法 - Google Patents

资源敏感的联合金融欺诈检测模型训练方法及检测方法 Download PDF

Info

Publication number
CN111105240B
CN111105240B CN201911275791.8A CN201911275791A CN111105240B CN 111105240 B CN111105240 B CN 111105240B CN 201911275791 A CN201911275791 A CN 201911275791A CN 111105240 B CN111105240 B CN 111105240B
Authority
CN
China
Prior art keywords
global
local
fraud detection
parameters
detection model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911275791.8A
Other languages
English (en)
Other versions
CN111105240A (zh
Inventor
阳文斯
叶可江
须成忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201911275791.8A priority Critical patent/CN111105240B/zh
Publication of CN111105240A publication Critical patent/CN111105240A/zh
Application granted granted Critical
Publication of CN111105240B publication Critical patent/CN111105240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种资源敏感的联合金融欺诈检测方法及检测模型训练方法,模型训练方法包括:S01、服务器端将欺诈检测模型的参数初始化为初始的全局参数;S02、模型训练,包括:S021、本地迭代:各客户端分别获取全局参数,用各自的样本数据集分别训练欺诈检测模型后,更新欺诈检测模型的参数作为本地参数传回服务器端;S022、全局更新:服务器端将本地参数整合成全局参数,并将全局参数发回各客户端进行步骤S021;S03、训练完成,生成采用最后的全局参数的欺诈检测模型。本发明使得各个银行或者金融机构在不共享自己私有数据集的前提下协同训练欺诈检测模型,解决了数据孤岛问题,而又不会侵犯客户隐私或泄露商业秘密,提升了金融欺诈检测效率和准确性。

Description

资源敏感的联合金融欺诈检测模型训练方法及检测方法
技术领域
本发明涉及金融安全技术领域,尤其涉及一种资源敏感的联合金融欺诈检测模型训练方法及检测方法。
背景技术
近年来,随着电子商务和移动互联网的发展,极大地增加了各个银行的信用卡交易数量,由于信用卡的使用越来越多,诈骗者也试图寻找更多的机会来进行信用卡欺诈,同时各个银行和金融机构也不得不面对越来越多的信用卡欺诈行为。信用卡欺诈是一种犯罪行为,它给银行和金融机构以及持卡人带来了巨大的经济损失。
现有的信用卡欺诈检测技术主要分为以下两种:
1、基于规则的欺诈识别,该方法是通过规则建立防范机制是比较传统的一类信用卡欺诈检测技术。其通过分析大量欺诈样本,将欺诈行为特点记录下来应用规则引擎及统计分析技术形成“规则”,然后进行多维度多规则的组合,每条规则被赋予一定的权重,命中相关规则的行为会得到累积的分值。即对单次信用卡交易行为的欺诈度进行综合量化,从而来预测欺诈的概率确定诈骗风险评级。
2、基于机器学习的模型,指的是采用数据挖掘方法,基于历史数据而建立的分类模型,利用海量数据通过机器训练模型来对信用卡交易进行判断,通过分析消费行为来进行模式识别。通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型,具有对未知数据进行推测和分类的能力,比如在已知“好”和“坏”标签的前提下,尝试从历史数据中,分析出欺诈交易的典型特征和消费行为模式,从而遇到相似的行为时可以分辨是否是欺诈交易。
然而,上述两种方法都具有一定的缺点。
例如,前一种基于规则的欺诈识别的反欺诈规则引擎中,这些甄别欺诈行为的规则依赖于从大量历史案例中总结出来的“专家知识”,也称之为“规则”。随着数据量的增大,数据类型的增多,传统的基于规则匹配的离散式欺诈分析预警系统已经无法准确识别欺诈。
由于单靠人工分析是很难检测到信用卡交易事务数据集中的欺诈模式的,所以开发出一种系统来自动实施欺诈检测对于银行和金融机构而言,是必不可少的。
然而,基于传统的机器学习的方法中,由于持卡人在不同客户群上的消费模式各不相同,因此需要使用考虑每个客户群动态的数据集来训练性能最佳的模型,但一部分传统的机器学习模型都是运用本地数据集建立独立的内部欺诈检测模型,对用户群的消费模式并不能完全了解,所以独立的内部模型的效果时常不佳。
鉴于银行和金融类公司间的竞争性质,他们不愿彼此或在数据中心中共享其专有数据,传统的用于欺诈检测的机器学习模型通常仅使用每家银行或金融机构单独收集的内部数据进行训练。由于这一原因,导致了信用卡欺诈检测过程中出现了严重的数据孤岛问题,导致信用卡欺诈检测效率和检测准确率都不理想。
发明内容
鉴于现有技术存在的不足,本发明提供了一种资源敏感的联合金融欺诈检测模型训练方法及检测方法,使得银行、各金融机构等之间的大规模协作成为可能,使得各个银行、金融机构在不共享自己私有数据集的前提下协同训练欺诈检测模型,提高训练效率和准确性。
为了实现上述的目的,本发明采用了如下的技术方案:
一种资源敏感的联合金融欺诈检测模型训练方法,包括:
S01、初始化:服务器端将欺诈检测模型的参数初始化为初始的全局参数;
S02、模型训练,包括:
S021、本地迭代:各客户端分别从服务器端获取全局参数,用各自的样本数据集分别训练欺诈检测模型后,更新欺诈检测模型的参数作为本地参数传回服务器端;
S022、全局更新:服务器端整合收到的本地参数后生成全局参数,并将全局参数发送回各客户端进行步骤S021的本地迭代;
S03、训练完成,生成采用最后的全局参数的欺诈检测模型。
作为其中一种实施方式,所述最后的全局参数w*满足:
w*=argminF(w),且
Figure BDA0002315527430000031
其中,F(w)为所有样本数据集上的全局损失函数,Fi(w)为第i个客户端上的样本数据集的本地损失函数,fj(w)为第i个客户端上的第j个样本数据的本地损失,Di为第i个客户端上的样本数据集,|Di|为样本数据集Di的大小,i、j均为正整数。
作为其中一种实施方式,步骤S01中,服务器端将欺诈检测模型的两轮全局更新间的本地迭代的轮数τ初始化为τ0,τ0≥1;
步骤S021中,各客户端在各自的样本数据集Di下使用梯度下降法对欺诈检测模型进行本地迭代训练;
步骤S022包括:计算各样本数据集Di的本地损失函数梯度
Figure BDA0002315527430000032
与全局损失函数梯度
Figure BDA0002315527430000033
之差的收敛的上界δ,
Figure BDA0002315527430000034
然后根据上界δ得出新的到下一轮全局更新前的本地迭代的轮数τ,并将其发送回各客户端。
作为其中一种实施方式,各客户端的一轮本地迭代的过程包括:从样本数据集Di中选取一个样本数据,计算出该样本数据对应的本地损失函数的梯度
Figure BDA0002315527430000035
用梯度下降法更新欺诈检测模型的参数,重复上述过程直至遍历样本数据集Di中的样本数据,即完成一轮本地迭代。
作为其中一种实施方式,所述步骤S022中的生成全局参数过程还包括:
服务器计算剩余资源量是否可供下一次本地迭代和全局更新,当剩余资源量不足下一次本地迭代和全局更新时,减小新的本地迭代的轮数τ至可能的最大值,并停止训练。
作为其中一种实施方式,所述得出新的到下一轮全局更新前的本地迭代的轮数τ的过程包括:
各客户端利用各自的样本数据集Di计算第一中间参数ρi、第二中间参数βi以及样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA0002315527430000036
其中,
Figure BDA0002315527430000037
wi(t)代表第i个客户端上的第t轮迭代的欺诈检测模型的参数,w(t)代表全局参数;
服务器根据第一中间参数ρi、第二中间参数βi、样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA0002315527430000041
分别得到第一全局中间参数ρ、第二全局中间参数β、所有样本数据集的本次本地迭代中的最后一轮本地迭代t0的全局损失函数梯度
Figure BDA0002315527430000042
其中,
Figure BDA0002315527430000043
Figure BDA0002315527430000044
结合公式
Figure BDA0002315527430000045
得到新的本地迭代的轮数τ,其中,η为梯度下降的步长,
Figure BDA0002315527430000046
为常数,
Figure BDA0002315527430000047
Figure BDA0002315527430000048
本发明的另一目的在于提供一种资源敏感的联合金融欺诈检测方法,采用一种上述的资源敏感的联合金融欺诈检测模型训练方法训练欺诈检测模型后,将欺诈检测模型用来预测待检测数据。
本发明通过构建一种能进行资源优化的联合的机器学习框架,使得各个银行或者金融机构在不共享自己私有数据集的前提下协同训练欺诈检测模型,使得银行或者各金融机构间的大规模协作成为可能,解决了数据孤岛问题,而又不会侵犯客户隐私或泄露商业秘密,提升了金融欺诈检测效率和准确性。同时,还可以对整个系统的资源(如计算资源和通信资源)消耗情况进行统计分析,自适应地协调整个欺诈检测系统的资源和性能,使得整个系统在有限的带宽、能量、时间等资源预算下获得最佳的学习性能。
附图说明
图1为本发明实施例的联合金融欺诈检测系统的结构示意图;
图2为本发明实施例的联合金融欺诈检测模型训练方法的流程图。
图3为本发明实施例的联合金融欺诈检测方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参阅图1,本发明的联合金融欺诈检测系统主要分为两部分:服务器端A和客户端Bi(i为正整数),客户端Bi即银行或者金融机构。
在客户端Bi,本地数据集被收集并存储在各客户端节点,作为各客户端Bi训练用的样本数据集Di。各客户端Bi利用各自的样本数据集Di训练自己的本地欺诈检测系统,并以迭代的方式更新欺诈检测模型的参数,同时,统计资源消耗量。当本地的欺诈检测模型的参数更新一定轮数后,将最后的欺诈检测模型的参数(作为本地参数)和统计的资源消耗量等参数传输至服务器端A,进行聚合计算。
在服务器端A,服务器整合各客户端Bi上传的欺诈检测模型的本地参数,生成全局参数,并将该全局参数发送回各客户端Bi,进行下一次的本地迭代循环。
在实际应用中,每个客户端的本地更新和服务器端的全局更新都会消耗一定的计算资源和通信资源。在一些分布式机器学习的欺诈检测系统中并未考虑系统的通信成本,系统的计算资源和通信资源的消耗对整个系统具有较大的影响甚至会成为整个系统的性能瓶颈。考虑到消耗的资源量可能会随时间变化,所以服务器端还需要协调全局聚合的频率、模型训练精度和资源消耗之间复杂的关系。本实施例中,当服务器端A在将该全局参数发送回各客户端Bi时,还同时将资源控制参数发送回各客户端Bi,具体主要表现为控制下一轮全局更新前的本地迭代的轮数τ。
具体地,结合图2和图3所示,本实施例提供的一种资源敏感和保护隐私的联合金融欺诈检测模型训练方法,包括:
S01、初始化:服务器端A将欺诈检测模型的参数初始化为初始的全局参数w(0)。
在此过程中,服务器端A还定义了一系列资源控制参数:将欺诈检测模型两轮全局更新间的的一次本地迭代包含的轮数τ初始化为τ0,τ0≥1,这里优选τ0=1;同时,还定义资源计算器s来统计资源使用情况,并设置一个STOP标志位,当该标志位被标记时,则停止迭代训练。初始化时,资源计算器s为0,初始化STOP标志位不被标记。服务器在初始化全局参数和这些资源控制参数后,将其发送给各客户端Bi
S02、模型训练,包括:
S021、本地迭代:各客户端Bi分别从服务器端A获取(下载)全局参数,用各自的样本数据集Di分别训练欺诈检测模型后,更新欺诈检测模型的参数作为本地参数传回服务器端A。
优选地,在该步骤S021中,各客户端Bi在各自的样本数据集Di下使用梯度下降法对欺诈检测模型进行本地迭代训练。
S022、全局更新:服务器端A整合收到的本地参数后生成全局参数,并将全局参数发送回各客户端Bi进行步骤S021的本地迭代。
在进行第一次本地迭代过程(还未执行步骤S022全局更新)时,客户端Bi获取到的全局参数为w(0),各客户端Bi利用全局参数进行τ轮本地迭代训练后,将最后一轮本地迭代更新后的欺诈检测模型的参数作为本地参数传输给服务器端A,同时也将资源使用情况传回;服务器端A根据各客户端Bi传回的本地参数进行整合,形成新的全局参数,并根据资源使用情况计算到下一轮全局更新前的本地迭代的轮数τ,并将新的全局参数传回各客户端Bi进行一次全局更新。当进行一次全局更新后,全局参数发生变化,到下一轮全局更新前的本地迭代的轮数τ也发生变化,因此,既可以实现各客户端Bi之间的大规模协作,提高机器学习的精度和准确性,又能实时动态地调整全局聚合的频率,自适应地进行资源优化,避免资源瓶颈对于计算效率的影响,在固定资源预算下训练最优化、效果最佳的模型。
S03、训练完成,生成采用最后的全局参数w*的欺诈检测模型。
如图1所示,假设有N个客户端,各个客户端Bi的样本数据集Di分别为D1,D2,D3,…DN。对于第i个客户端Bi上的样本数据集Di,其损失函数定义为:
Figure BDA0002315527430000061
这里,定义Di=|Di|,|·|表示计算数据集的大小。
Figure BDA0002315527430000062
当i≠i′有
Figure BDA0002315527430000063
则在所有样本数据集上的全局损失函数为:
Figure BDA0002315527430000064
因此,整个系统的目标函数可以转换为找到一组全局参数w*,使得F(w)最小,即最后的全局参数w*满足:
w*=argminF(w),且
Figure BDA0002315527430000065
其中,F(w)为所有样本数据集上的全局损失函数,Fi(w)为第i个客户端上的样本数据集的本地损失函数,fj(w)为第i个客户端上的第j个样本数据的本地损失,Di为第i个客户端Bi上的样本数据集,|Di|为样本数据集Di的大小,i、j均为正整数。
对于每一轮全局更新t=1,2,…T,客户端从服务器端接收全局参数w(t)和到下一轮全局更新前的本地迭代更新轮数τ。这里,定义每进行一轮全局更新,所有客户端的本地迭代更新消耗c(c>0)个单元的资源,每一次的全局更新消耗b(b>0)个单元的资源,对于给定的总的全局更新轮数T和每两轮全局更新间的本地迭代更新轮数τ,整个迭代过程消耗的资源量为
Figure BDA0002315527430000071
R为已知的总的资源预算,则上述问题重新定义为:
Figure BDA0002315527430000072
其满足:
Figure BDA0002315527430000073
通过最小化F(w(T))-F(w*)的上界,即可求得最优模型。
本实施例假设:
(1)本地损失函数Fi(w)满足利普希茨(Lipschitz)条件,其中,ρ为利普希茨常数;
(2)Fi(w)是β-smooth的函数(β光滑函数),通过理论计算有:
Figure BDA0002315527430000074
其中,ω、ε为中间变量,η已知,为梯度下降的步长,ρ为第一全局中间参数、β为第二全局中间参数,η≤1/β。
而又由于本地损失函数梯度
Figure BDA0002315527430000075
与全局损失函数梯度
Figure BDA0002315527430000076
之差的收敛的上界δ满足:
Figure BDA0002315527430000077
Figure BDA0002315527430000078
整个系统的优化目标为:
Figure BDA0002315527430000079
其满足:
Figure BDA00023155274300000710
相当于:
Figure BDA0002315527430000081
上式除以Rω/c,令控制参数
Figure BDA0002315527430000082
最后的优化目标为:
Figure BDA0002315527430000083
Figure BDA0002315527430000084
因此,只需给定控制参数
Figure BDA0002315527430000085
为常量,即可通过计算得出ρ、β、ω、ε、δ、h(τ),从而得到优化目标τ*
因此,固定系统总的资源预算R,给定控制参数
Figure BDA0002315527430000086
以及搜索范围修正参数γ,这里,为避免因初始的各种参数估计不准确导致τ增长过快,给定的资源控制参数还包括给定搜索范围修正参数γ(γ>0),γ限制了搜索空间也避免了因为初始参数估计不准确使得τ增长过快的情况发生。
结合图2和图3所示,联合金融欺诈检测模型训练方法具体包括:
S01、初始化。
S02、模型训练,其中:
S021、本地迭代:各客户端Bi的一轮本地迭代的过程包括:从样本数据集Di中选取一个样本数据,计算出该样本数据对应的本地损失函数的梯度
Figure BDA0002315527430000087
用梯度下降法更新欺诈检测模型的参数,重复上述过程直至遍历样本数据集Di中的样本数据,即完成一轮本地迭代。
在客户端,当τ轮本地迭代完成后,用t0存储下一次全局更新前的最后一轮本地迭代的迭代索引,即t0←t。每一轮本地迭代更新各客户端Bi的欺诈检测模型的参数
Figure BDA0002315527430000088
即,如果尚未进行全局更新,则
Figure BDA0002315527430000089
如果存在全局更新,则
Figure BDA00023155274300000810
各客户端Bi利用各自的样本数据集Di计算第一中间参数ρi、第二中间参数βi以及样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA00023155274300000811
其中,
Figure BDA00023155274300000812
Figure BDA0002315527430000091
wi(t)代表第i个客户端上的第t轮迭代的欺诈检测模型的参数,w(t)代表全局参数。
在每轮本地迭代过程中,利用各样本数据集Di计算第i个客户端的第t轮本地迭代的欺诈检测模型的参数wi(t):
Figure BDA0002315527430000092
Figure BDA0002315527430000093
估计第i个客户端Bi每一轮的资源消耗量ci,并将本地迭代的欺诈检测模型的参数wi(t)、资源消耗量ci、第一中间参数ρi、第二中间参数βi和样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA0002315527430000094
传送给服务器端进行欺诈检测模型的参数的全局更新、τ的更新以及资源消耗的计算。
S022、全局更新:
在服务器端,服务器端A在接收各个客户端的欺诈检测模型的参数wi(t)、资源消耗量ci、第一中间参数ρi、第二中间参数βi和样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA0002315527430000095
后,更新欺诈检测模型的全局参数w(t):
Figure BDA0002315527430000096
根据第一中间参数ρi、第二中间参数βi、样本数据集Di的本次本地迭代中的最后一轮本地迭代t0的本地损失函数梯度
Figure BDA0002315527430000097
分别得到第一全局中间参数ρ、第二全局中间参数β、所有样本数据集的本次本地迭代中的最后一轮本地迭代t0的全局损失函数梯度
Figure BDA0002315527430000098
其中:
Figure BDA0002315527430000099
Figure BDA00023155274300000910
Figure BDA00023155274300000911
计算各样本数据集Di的本地损失函数梯度
Figure BDA00023155274300000912
与全局损失函数梯度
Figure BDA0002315527430000101
之差的收敛的上界δ:
Figure BDA0002315527430000102
Figure BDA0002315527430000103
由上述式子,计算得出中间变量ω、ε,最后由公式
Figure BDA0002315527430000104
Figure BDA0002315527430000105
即可计算得出新的轮数τ。将τmax←γτ,得出本地迭代轮数的可能的最大值τmax作为接下来的本地迭代轮数τ,将生成的全局参数w(t)、新的τ传送给各客户端Bi
具体在生成可能的最大值τmax时,服务器端根据各客户端传输回的资源消耗量ci和上一个轮数τ,计算出本轮全局更新的资源消耗量b和本轮全局更新后下一次本地迭代的每一轮资源消耗量c,并计算剩余资源量是否可供当前轮的全局更新和接下来的本地迭代。在实际计算过程中,c的值是根据客户端节点的资源消耗的测量值估算的,估算方法取决于所考虑的资源类型。例如,当资源为能源时,所有客户端节点上的总能源消耗(本地迭代中的每一轮更新)被视为c;当资源为时间时,所有客户端节点上的最大计算时间(本地迭代中的每一轮更新)视为c。同样的道理,b的值是根据服务器端的资源消耗测量值估算的,例如服务器端消耗的能源或者计算所用的时间。其中,能源和时间可以直接测量得到。
服务器端基于估算值b、c监控总资源消耗s,并将总资源消耗与总的资源预算R进行比较。具体是,总资源消耗量s的计算:
s←s+cτ+b;
如果s+cτ+b≥R,则减小τ到可能的最大值τmax,使得本轮全局更新后剩下的本地迭代需要消耗的资源量在总的资源预算R之内,同时,标记STOP标志位,代表训练完成,将全局参数w(t)返回作为欺诈检测模型的最后的全局参数,即,进行下一步骤S03,生成采用最后的全局参数w*的欺诈检测模型,随后即可进行欺诈检测。
本发明还提供了一种资源敏感和保护隐私的联合金融欺诈检测方法,在上述的联合金融欺诈检测模型训练方法训练欺诈检测模型后,将欺诈检测模型用来预测待检测数据即可。
本发明通过构建一种能进行资源优化的联合的机器学习框架,使得各个银行或者金融机构之间打破数据壁垒,在不共享自己私有数据集的前提下协同训练欺诈检测模型,使得银行或者各金融机构间的大规模协作成为可能,解决了数据孤岛问题,而又不会侵犯客户隐私或泄露商业秘密,提升了金融欺诈检测效率和准确性。同时,还可以对整个系统的资源(如计算资源和通信资源)消耗情况进行统计分析,通过控制本地迭代更新轮数和共享模型的全局参数更新次数,自适应地协调整个欺诈检测系统的计算资源与通信资源,使得整个系统在有限的资源预算下获得最佳的学习性能。
以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (5)

1.一种资源敏感的联合金融欺诈检测模型训练方法,其特征在于,包括:
S01、初始化:服务器端(A)将欺诈检测模型的参数初始化为初始的全局参数;
S02、模型训练,包括:
S021、本地迭代:各客户端(Bi)分别从服务器端(A)获取全局参数,用各自的样本数据集(Di)分别训练欺诈检测模型后,更新欺诈检测模型的参数作为本地参数传回服务器端(A);
S022、全局更新:服务器端(A)整合收到的本地参数后生成全局参数,并将全局参数发送回各客户端(Bi)进行步骤S021的本地迭代;
S03、训练完成,生成采用最后的全局参数w*的欺诈检测模型;
其中,所述最后的全局参数w*满足:
w*=argminF(w),且
Figure FDA0003859713830000011
其中,F(w)为所有样本数据集上的全局损失函数,Fi(w)为第i个客户端上的样本数据集的本地损失函数,fj(w)为第i个客户端上的第j个样本数据的本地损失,Di为第i个客户端(Bi)上的样本数据集,|Di|为样本数据集Di的大小,i、j均为正整数,
Figure FDA0003859713830000012
其中,步骤S01中,服务器端(A)将欺诈检测模型的两轮全局更新间的本地迭代的轮数τ初始化为τ0,τ0≥1;
其中,步骤S021中,各客户端(Bi)在各自的样本数据集(Di)下使用梯度下降法对欺诈检测模型进行本地迭代训练;
其中,步骤S022包括:计算各样本数据集Di的本地损失函数梯度
Figure FDA0003859713830000013
与全局损失函数梯度
Figure FDA0003859713830000014
之差的收敛的上界δ,
Figure FDA0003859713830000015
Figure FDA0003859713830000016
然后根据上界δ得出新的到下一轮全局更新前的本地迭代的轮数τ,并将其发送回各客户端(Bi)。
2.根据权利要求1所述的资源敏感的联合金融欺诈检测模型训练方法,其特征在于,
各客户端(Bi)的一轮本地迭代的过程包括:从样本数据集(Di)中选取一个样本数据,计算出该样本数据对应的本地损失函数的梯度
Figure FDA00038597138300000212
用梯度下降法更新欺诈检测模型的参数,重复上述过程直至遍历样本数据集(Di)中的样本数据,即完成一轮本地迭代。
3.根据权利要求1所述的资源敏感的联合金融欺诈检测模型训练方法,其特征在于,
所述步骤S022中的生成全局参数过程还包括:
服务器计算剩余资源量是否可供下一次本地迭代和全局更新,当剩余资源量不足下一次本地迭代和全局更新时,减小新的本地迭代的轮数τ至可能的最大值,并停止训练。
4.根据权利要求1所述的资源敏感的联合金融欺诈检测模型训练方法,其特征在于,所述得出新的到下一轮全局更新前的本地迭代的轮数τ的过程包括:
各客户端(Bi)利用各自的样本数据集(Di)计算第一中间参数ρi、第二中间参数βi以及样本数据集(Di)的本次本地迭代中的最后一轮本地迭代(t0)的本地损失函数梯度
Figure FDA0003859713830000021
其中,
Figure FDA0003859713830000022
Figure FDA0003859713830000023
wi(t)代表第i个客户端上的第t轮迭代的欺诈检测模型的参数,w(t)代表全局参数;
服务器根据第一中间参数ρi、第二中间参数βi、样本数据集(Di)的本次本地迭代中的最后一轮本地迭代(t0)的本地损失函数梯度
Figure FDA0003859713830000024
分别得到第一全局中间参数ρ、第二全局中间参数β、所有样本数据集的本次本地迭代中的最后一轮本地迭代(t0)的全局损失函数梯度
Figure FDA0003859713830000025
其中,
Figure FDA0003859713830000026
Figure FDA0003859713830000027
结合公式
Figure FDA0003859713830000028
得到新的本地迭代的轮数τ,其中,η为梯度下降的步长,
Figure FDA0003859713830000029
为常数,
Figure FDA00038597138300000210
Figure FDA00038597138300000211
5.一种资源敏感的联合金融欺诈检测方法,其特征在于,采用权利要求1~4任一所述的资源敏感的联合金融欺诈检测模型训练方法训练欺诈检测模型后,将欺诈检测模型用来预测待检测数据。
CN201911275791.8A 2019-12-12 2019-12-12 资源敏感的联合金融欺诈检测模型训练方法及检测方法 Active CN111105240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911275791.8A CN111105240B (zh) 2019-12-12 2019-12-12 资源敏感的联合金融欺诈检测模型训练方法及检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911275791.8A CN111105240B (zh) 2019-12-12 2019-12-12 资源敏感的联合金融欺诈检测模型训练方法及检测方法

Publications (2)

Publication Number Publication Date
CN111105240A CN111105240A (zh) 2020-05-05
CN111105240B true CN111105240B (zh) 2022-12-20

Family

ID=70423240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911275791.8A Active CN111105240B (zh) 2019-12-12 2019-12-12 资源敏感的联合金融欺诈检测模型训练方法及检测方法

Country Status (1)

Country Link
CN (1) CN111105240B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368336B (zh) * 2020-05-27 2020-09-04 支付宝(杭州)信息技术有限公司 基于秘密共享的训练方法、装置、电子设备及存储介质
CN112085588B (zh) * 2020-09-02 2022-11-29 支付宝(杭州)信息技术有限公司 规则模型的安全性的确定方法、装置和数据处理方法
CN114358912A (zh) * 2021-11-17 2022-04-15 北京交通大学 一种基于联邦学习的风险权重融合的异常检测方法
CN114782758B (zh) * 2022-06-21 2022-09-02 平安科技(深圳)有限公司 图像处理模型训练方法、系统、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008122643A2 (en) * 2007-04-10 2008-10-16 Apertio Limited Improved data access in distributed server systems
CN109600255A (zh) * 2018-12-04 2019-04-09 中山大学 一种去中心化的参数服务器优化算法
CN110460600A (zh) * 2019-08-13 2019-11-15 南京理工大学 可抵御生成对抗网络攻击的联合深度学习方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9064364B2 (en) * 2003-10-22 2015-06-23 International Business Machines Corporation Confidential fraud detection system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008122643A2 (en) * 2007-04-10 2008-10-16 Apertio Limited Improved data access in distributed server systems
CN109600255A (zh) * 2018-12-04 2019-04-09 中山大学 一种去中心化的参数服务器优化算法
CN110460600A (zh) * 2019-08-13 2019-11-15 南京理工大学 可抵御生成对抗网络攻击的联合深度学习方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Wensi Yang ET.."FFD:A Federated Learning Based Method for Credit Card Fraud Detection".《Lecture Notes in Computer Science》.2019, *

Also Published As

Publication number Publication date
CN111105240A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN111105240B (zh) 资源敏感的联合金融欺诈检测模型训练方法及检测方法
US11423365B2 (en) Transaction card system having overdraft capability
CN113240509B (zh) 一种基于多源数据联邦学习的贷款风险评估方法
CN112733995B (zh) 训练神经网络的方法、行为检测方法及行为检测装置
CN111179089B (zh) 洗钱交易识别方法、装置和设备
CN111309788A (zh) 一种银行客户交易网络的社区结构发现方法及系统
BR112020007685A2 (pt) modelagem e medição de atribuição automatizadas
CN112799708A (zh) 联合更新业务模型的方法及系统
CN114862587A (zh) 异常交易账户的识别方法、装置及计算机可读存储介质
CN114691932A (zh) 用于生成合成数据的系统、方法和计算机程序产品
CN114641811A (zh) 用于用户网络活动异常检测的系统、方法和计算机程序产品
Speakman et al. Three population covariate shift for mobile phone-based credit scoring
Zhang et al. Managing risk of bidding in display advertising
WO2019023406A1 (en) SYSTEM AND METHOD FOR DETECTING TRANSACTION MODELS AND RESPONSE TO THESE
US11551317B2 (en) Property valuation model and visualization
CN113436006A (zh) 基于区块链的贷款风险预测方法及装置
Li et al. Risk management via anomaly circumvent: mnemonic deep learning for midterm stock prediction
Houssou et al. Adaptive financial fraud detection in imbalanced data with time-varying poisson processes
CN116681519A (zh) 违约预测方法、装置、电子设备、介质和程序产品
CN112085586A (zh) 一种基于密集子图的银行信用卡反套现方法
Zhao et al. Network-based feature extraction method for fraud detection via label propagation
CN101449284A (zh) 使用互相关的流量参数对至网络站点的流量质量进行的评分
CN114331463A (zh) 基于线性回归模型的风险识别方法及其相关设备
Joseph et al. Non-parametric estimation of multi-dimensional marked Hawkes processes
CN110570301B (zh) 风险识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant