CN116977054A - 一种基于联邦模式的信贷风险控制方法、系统及装置 - Google Patents
一种基于联邦模式的信贷风险控制方法、系统及装置 Download PDFInfo
- Publication number
- CN116977054A CN116977054A CN202310808422.0A CN202310808422A CN116977054A CN 116977054 A CN116977054 A CN 116977054A CN 202310808422 A CN202310808422 A CN 202310808422A CN 116977054 A CN116977054 A CN 116977054A
- Authority
- CN
- China
- Prior art keywords
- local
- model
- global model
- data
- credit risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012954 risk control Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 230000002776 aggregation Effects 0.000 claims abstract description 7
- 238000004220 aggregation Methods 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 8
- 238000013058 risk prediction model Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- Finance (AREA)
- Medical Informatics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于联邦模式的信贷风险控制方法、系统及装置,包括用于对原始数据进行预处理的数据预处理层、利用参与方本地数据训练本地模型并在本地模型聚合后形成全局模型的联邦学习层以及通信前加密解密的半同态加密层,通过利用数据预处理、隐私数据加密和基于联邦学习的风险预测模型,解决了本地数据量小和隐私泄露为风险控制带来的问题。不需要数据中心化建模,能够保证用户隐私不被窃取。能联合众多不同的参与方进行风险控制建模,提高建模精度,最终提升风险控制能力,为企业减少不必要的经济损失。
Description
技术领域
本申请涉及金融数据处理技术领域,尤其涉及一种基于联邦模式的信贷风险控制方法、系统及装置。
背景技术
个人信贷数据是判断客户是否违约的关键信息,其涉及到很多例如个人金融状况,历史信贷信息,个人行为评分等可以反映个人金融行为的信息。但对于很多民间借贷公司而言,所持有的数据量过少导致大数据风控模型效果较差。而如今的法律法规对用户数据的隐私性要求逐年提高,无法达到多家公司互通数据中心建模。随着计算机硬件和学术界的飞速发展,联邦学习开始辐射到各个领域,其中如何使用联邦学习技术来解决金融领域成为热门话题。目前,许多研究者在联邦学习与个人信贷方面做了大量研究,提出了很多使用的技术。
现有技术中专利《个人信贷风险预测模型训练方法及装置》(公开号CN113487423A)提供了一种个人信贷风险预测模型训练方法及装置,涉及人工智能技术领域,该方法包括:获取第一用户行为数据和秘钥信息;根据第一用户行为数据和秘钥信息生成第一加密信息,将第一加密信息发送至目标联邦学习端,并接收目标联邦学习端发送的第二加密信息;利用第一加密信息和第二加密信息训练目标神经网络模型,并将第一训练结果发送至目标端;接收目标端发送的权重参数,并根据权重参数更新目标神经网络模型,得到个人信贷风险预测模型。其缺点如下:由于该方法是对于初始目标数据进行加密与传输,在传输阶段仍有被截获信息并破译的风险,加密等级不高,隐私性仍有存疑。且模型训练时对原始数据的要求较高,若数据质量差则难以训练出有效的全局模型。
现有技术中专利《一种基于联邦模式的信贷风险控制系统及方法》(公开号CN111461874A)提供一种基于联邦模式的信贷风险控制系统及方法。该系统包括用于接入并转化数据的异构数据接入层、用于对原始数据进行预处理的数据预处理层、用于使不同数据提供者的训练样本保持对齐的样本对齐层,以及利用参与方本地数据训练本地模型并在梯度聚合后形成全局模型的联邦学习层。本发明提出了统一数据接入格式、数据预处理以及基于联邦学习的风险预测模型,解决了数据异构和隐私泄露为风险控制带来的挑战问题。不需要中央服务器参与到模型训练和学习过程中,能够保证用户隐私不被窃听。能联合众多不同的参与方进行风险控制建模,规范化建模流程,最终提升风险控制能力,为企业减少成本。其缺点如下:仍然仅仅利用了RSA算法进行加密,即需要在中央服务器中进行解密操作,仍有可能被截获并破译。同时数据预处理的阶段也没有对于本地数据质量较差的情况做优化,若本地数据极端不平衡,训练出的全局模型的精度可能比本地模型更低。
发明内容
有鉴于此,本申请提供一种基于联邦模式的信贷风险控制方法、系统及装置,基于联邦学习FedPDC算法、同态加密和Transformer模型,能够实现数据不平衡且本地数据量小的情况下的大数据风控。
本申请公开了一种基于联邦模式的信贷风险控制方法,其特征在于:具体步骤如下:
步骤1,中央系统构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;
步骤2,本地系统将接收到的全局模型解密后,将预处理后的本地数据输入全局模型用于对全局模型进行优化更新,得到第i个本地系统在第t轮的本地模型,并利用公共数据集对本地模型验证得到精度;对本地模型进行加密得到,将加密后的本地模型与精度传输给中央系统;
步骤3,中央系统接收到各本地系统发送的加密后的本地模型,根据每个本地模型的精度进行加权平均得到t+1轮加密中的全局模型;重复步骤2至步骤3,直至全局模型达到收敛条件,即均方误差达到预设值或模型验证精度达到预设值时,输出训练优化后的全局模型;
步骤4,利用完成训练优化后的全局模型对目标的信贷风险进行预测。
优选的,步骤1中全局模型为用于预测目标数据是否为违约数据的transformer模型。
优选的,步骤2中本地数据预处理的具体步骤如下:
本地数据包括个人信贷数据以及违约判定,将本地数据中存在缺失值的数据进行删除得到特征;再将个人信贷数据以及违约判定中的特征进行量化,并对不能直接量化的特征利用专家打分对的方法完成量化。
优选的,步骤2中本地系统采用更新后的梯度损失函数加入PDC-loss的惩罚项,进行损失的计算和反向传播更新模型。
优选的,步骤2中本地系统对接收到的全局模型进行解密的具体步骤如下:
本地系统接收上一轮的加密全局模型,采用paillier算法对其进行解密得到本轮全局模型,公式如下:
式中,为第t轮的加密全局模型,为第t轮解密后的全局模型,n=p×q,λ=lcm(p-1,q-1);p,q为随机选取的两个素数,lcm(,)为两数的最小公倍数,g为随机数,满足且满足/>函数L(x)的定义为/>公钥为(n,g),私钥为(λ,μ)。
优选的,步骤2中对本地模型进行加密得到的具体步骤如下:
采用paillier算法对本地模型进行加密,具体公式如下:
式中,第i个本地系统在第t轮的完成加密的本地模型,为第i个本地系统在第t轮优化得到的本地模型。
优选的,步骤3中中央系统接收到各本地系统发送的和精度后,计算全局模型的具体步骤如下:
中央系统采用PDC-agg聚合策略,将第t轮每个本地系统的加密本地模型进行聚合,具体公式如下:
式中,En(wt+1)为第t+1轮的加密全局模型,为第i个本地系统在第t轮的完成加密的本地模型,∑表示密文空间加法,例如密文与做同态加结果为En(C),En(c)=En(c1)×En(c2)modn2,/>表示同态数乘,即密文与明文k相乘,结果为En(c)=En(c1)kmodn2。
进一步的,全局模型的选择过程中,确定目标是一个信贷违约的预警模型,即一个二分类模型,用于预测目标数据是违约数据或非违约数据。选择使用transformer模型,对比传统RNN能实现并行计算操作,节约时间资源消耗。
进一步的,对未量化特征进行专家打分,具体操作步骤为:将该特征的表现根据从高到低进行1-5分的打分,由于在打分时会受到个人评价标准的偏侧,专家评分制度选取不少于3人的均值权重。
进一步的,本地系统接收到全局模型后,与本地数据进行E个epoch的本地模型训练,使用交叉熵损失函数加上PDC-loss的惩罚项,得到第i个本地系统在第t轮的本地模型,具体公式如下:
l←lsup+lcon
式中,lcon为PDC-loss的惩罚项,为二分类中经典交叉熵损失函数,l为总损失函数,λ为灵敏度系数,衡量本地模型更新方向与公共数据集拟合方向的关联度,本算法用了自适应的方式使,n为本次训练的通信轮次。
在本地模型优化过程中整体训练损失函数为:
交叉熵损失函数为:
式中,N为样本数量,yi为预测值,pi为yi发生的概率,为惩罚项。
进一步的,公共数据集为每家公司能调用的同一批数据接口,包括但不限于征信数据、蚂蚁信用数据等。
进一步的,验证精度已不属于原数据或模型参数,并没有涵盖个人信息,因此本地系统反馈中央系统的精度不需要加密,而且由于后续聚合方式中有同态加法与同态乘法,必须使用全同态加密,加密精度会使极大消耗计算资源,同时增加加密解密时间,对本框架的性能影响极大。另外,本地系统反馈中央系统数据中仅有模型数据以及精度数据,并不反馈本地具体的个人信贷数据,完全避免了用户隐私被窃取的风险。
本申请的有益效果在于:第一,提出了包含数据预处理、隐私数据加密和基于联邦学习的风险预测模型,解决了本地数据量小和隐私泄露为风险控制带来的问题,不需要数据中心化建模,能够保证用户隐私不被窃取,能联合众多不同的参与方进行风险控制建模,提高建模精度,最终提升风险控制能力,为企业减少不必要的经济损失;第二,本发明经过多轮大批量的迭代训练,即可使得全局模型可以很好的预测个人信贷风险,从而实现数据不平衡且本地数据量小的情况下的大数据风控,允许在本地数据集明显不平衡的情况下依旧达到较好的识别效果;第三,相对于已有的个人信贷风险控制技术相比,由于训练数据量较大,建模精度有着大幅度提升。
附图说明
图1是本发明一种基于联邦模式的信贷风险控制方法的流程图;
图2为本发明一种基于联邦模式的信贷风险控制方法中联邦学习FedPDC算法。
具体实施方式
下面将结合本申请实施例对本申请实施例中的技术方案进行清楚、完整地描述。
一种基于联邦模式的信贷风险控制方法,如图1和图2所示,包括若干个本地系统客户端和中央系统服务器端,具体步骤如下:
步骤1,全局模型构建:
本实施例中,选择全局模型时,确定目标是一个信贷违约的预警模型,即一个二分类模型,用于预测目标数据是违约数据或非违约数据。从问题的本质来看,不论是那个领域,二分类模型都是相通的。相对于计算机视觉领域图形二分类问题,其差异点在于图像是多通道数据的融合,且相互之间的位置关系是图像识别和分类的一个重要的依据。而在普通RNN模型由于各特征之间无法相互关联,就在精度上可能较低。Transformer的Attention机制能有效将模型关注点着重于重要特征。因此,全局模型选择使用transformer模型。中央系统构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;
步骤2,本地系统数据分类和数据预处理:
本实施例中,将每个本地系统内的个人信贷数据进行预处理,对存在缺失值的数据进行删除,将预处理后的个人信贷数据作为输入,首先判断数据是哪一类,即判断是违约数据还非违约数据,并确定所有特征是否为已量化的特征,对于未量化的特征,则经过专家打分方法对这些特征进行量化,通过数据的量化消除单位和量纲的影响。
对未量化特征进行专家打分,具体操作步骤为:将该特征的表现根据从高到低进行1-5分的打分,由于在打分时会受到个人评价标准的偏侧,专家评分制度选取3人均值权重。
步骤3,本地训练及公共数据集验证:
本实施例中,根据全局模型和本地系统数据,进行E个epoch的本地模型训练,采用更新后的梯度损失函数加入PDC-loss的惩罚项,进行损失的计算和反向传播更新模型,得到第i个本地系统在第t轮的本地模型,将第i个本地系统在第t轮的本地模型在公共数据集中验证得到精度;
损失函数选取二分类中经典交叉熵损失函数,再将其加入PDC-loss的惩罚项,具体公式如下:
l←lsup+lcon
式中,lcon为PDC-loss的惩罚项,为二分类中经典交叉熵损失函数,l为总损失函数,为灵敏度系数,衡量本地模型更新方向与公共数据集拟合方向的关联度,本算法用了自适应的方式使,n为本次训练的通信轮次。
本实施例中,整体训练损失函数为:
其中交叉熵损失函数为:
式中,N为样本数量,yi为预测值,pi为yi发生的概率,为惩罚项。
步骤4,本地加密并通信:
本实施例中,将本地模型使用Paillier算法进行半同态加密,并将加密后的本地模型与精度传输给中央服务器;由于精度不涉及用户隐私,故不需要加密。
步骤5,中央服务器聚合并将全局模型回传:
本实施例中,中央系统采用PDC-agg聚合策略,将第t轮每个本地系统的加密本地模型进行聚合,具体公式如下:
式中,为第t+1轮的加密全局模型,第i个本地系统在第t轮的完成加密的本地模型;式中所用标量乘法与加法均在密文空间中实现,其中表示密文空间加法,例如密文与做同态加结果为En(C),En(c)=En(c1)×En(c2)modn2,表示同态数乘,即密文与明文k相乘,结果为En(c)=En(c1)kmodn2。
若未达到收敛条件,即均方误差未达到预设值或模型验证精度未达到预设值时,将聚合后的全局模型发送至每个本地系统,若达到收敛条件则停止下一轮训练并输出全局模型。
步骤6,本地解密:
本实施例中,本地系统接收上一轮的全局加密模型发,对其使用Paillier算法进行解密得到本轮全局模型,再进行步骤3至步骤6的循环。
本实施例中,步骤4和步骤6中的用于对全局模型进行加密和解密的Paillier算法,其加密、解密具体步骤如下:
步骤S1:密钥产生,选取两个随机的大素数p,q,计算n=p×q和λ=lcm(p-1,q-1),lcm(,)为两个参数的最小公倍数,选取随机数g,满足且满足存在,其中函数L(x)的定义如下/>此时,公钥为(n,g),私钥为(λ,μ)。
步骤S2:对本地模型进行加密的具体公式为:
步骤S3:对加密的全局模型进行解密的具体公式为:
本实施例中,公共数据集即每家公司能调用的同一批数据接口,如:征信、蚂蚁信用等。将各本地模型在公共数据集上进行预测,得到预测正确率即。
综上,本技术方案包括用于对原始数据进行预处理的数据预处理层、利用参与方本地数据训练本地模型并在本地模型聚合后形成全局模型的联邦学习层以及通信前加密解密的半同态加密层,通过数据预处理、隐私数据加密和基于联邦学习的风险预测模型,解决了本地数据量小和隐私泄露为风险控制带来的问题。不需要数据中心化建模,能够保证用户隐私不被窃取。能联合众多不同的参与方进行风险控制建模,提高建模精度,最终提升风险控制能力,为企业减少不必要的经济损失。
基于相同的构思,本申请实施例还提供一种基于联邦模式的信贷风险控制系统,包括:
本地系统,所述的本地系统被配置为从中央系统接收全局模型并解密,将预处理后的本地数据输入全局模型用于对全局模型进行优化更新,得到第i个本地系统在第t轮的本地模型,并利用公共数据集对本地模型验证得到精度;对本地模型进行加密得到,将加密后的本地模型与精度传输给中央系统;
中央系统,所述的中央系统被配置为构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;还用于接收到各本地系统发送的加密后的本地模型,根据每个本地模型的精度进行加权平均得到t+1轮加密中的全局模型;直至全局模型达到收敛条件,输出训练优化后的全局模型;
输出系统,所述的输出系统利用完成训练优化后的全局模型对目标的信贷风险进行预测。
需要说明的是,本实施例的基于联邦模式的信贷风险控制系统是与上述基于联邦模式的信贷风险控制方法相对应的系统。系统中的功能模块分别对应预测方法中的相应步骤。本实施例的基于联邦模式的信贷风险控制系统可与上述基于联邦模式的信贷风险控制方法相互相配合实施。相应地,本实施例的基于联邦模式的信贷风险控制系统中提到的相关技术细节也可应用在基于联邦模式的信贷风险控制方法中。此外,上述的各功能模块实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的部分或全部步骤,或以上的各功能模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
本施例中还提供的基于联邦模式的信贷风险控制装置,包括与系统总线连接的处理器、存储器和通信接口,其中,处理器用于提供控制计算能力;存储器上存储有计算机程序,该计算机程序被处理器执行时实现基于联邦模式的信贷风险控制方法。存储器包括计算机存储介质和内存储器,计算机存储介质为非易失性存储介质,该非易失性存储介质存储有操作系统和计算机程序,内存储为操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络等。
在一些实施例中,处理器执行计算机程序指令时实现以下步骤:
步骤1,中央系统构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;
步骤2,本地系统将接收到的全局模型解密后,将预处理后的本地数据输入全局模型用于对全局模型进行优化更新,得到第i个本地系统在第t轮的本地模型,并利用公共数据集对本地模型验证得到精度;对本地模型进行加密得到,将加密后的本地模型与精度传输给中央系统;
步骤3,中央系统接收到各本地系统发送的加密后的本地模型,根据每个本地模型的精度进行加权平均得到t+1轮加密中的全局模型;重复步骤2至步骤3,直至全局模型达到收敛条件,输出训练优化后的全局模型;
步骤4,利用完成训练优化后的全局模型对目标的信贷风险进行预测。
上对本申请实施例所提供的一种基于联邦模式的信贷风险控制方法、系统及装置进行了详细介绍,本申请中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的技术方案及其核心思想;本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。
Claims (9)
1.一种基于联邦模式的信贷风险控制方法,其特征在于:具体步骤如下:
步骤1,中央系统构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;
步骤2,本地系统将接收到的全局模型解密后,将预处理后的本地数据输入全局模型用于对全局模型进行优化更新,得到第i个本地系统在第t轮的本地模型,并利用公共数据集对本地模型验证得到精度;对本地模型进行加密得到,将加密后的本地模型与精度传输给中央系统;
步骤3,中央系统接收到各本地系统发送的加密后的本地模型,根据每个本地模型的精度进行加权平均得到t+1轮加密中的全局模型;重复步骤2至步骤3,直至全局模型达到收敛条件,输出训练优化后的全局模型;
步骤4,利用完成训练优化后的全局模型对目标的信贷风险进行预测。
2.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤1中全局模型为用于预测目标数据是否为违约数据的transformer模型。
3.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤2中本地数据预处理的具体步骤如下:
本地数据包括个人信贷数据以及违约判定,将本地数据中存在缺失值的数据进行删除得到特征;再将个人信贷数据以及违约判定中的特征进行量化,并对不能直接量化的特征利用专家打分对的方法完成量化。
4.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤2中本地系统采用更新后的梯度损失函数加入PDC-loss的惩罚项,进行损失的计算和反向传播更新模型。
5.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤2中本地系统对接收到的全局模型进行解密的具体步骤如下:
本地系统接收上一轮的加密全局模型,采用paillier算法对其进行解密得到本轮全局模型,公式如下:
式中,为第t轮的加密全局模型,为第t轮解密后的全局模型,n=p×q,λ=lcm(p-1,q-1);p,q为随机选取的两个素数,lcm(,)为两数的最小公倍数,g为随机数,满足且满足μ=(L(gλmodn2))-1,函数L(x)的定义为/>公钥为(n,g),私钥为(λ,μ)。
6.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤2中对本地模型进行加密得到的具体步骤如下:
采用paillier算法对本地模型进行加密,具体公式如下:
式中,第i个本地系统在第t轮的完成加密的本地模型,为第i个本地系统在第t轮优化得到的本地模型。
7.根据权利要求1所述的一种基于联邦模式的信贷风险控制方法,其特征在于:所述的步骤3中中央系统接收到各本地系统发送的和精度后,计算全局模型的具体步骤如下:
中央系统采用PDC-agg聚合策略,将第t轮每个本地系统的加密本地模型进行聚合,具体公式如下:
式中,En(wt+1)为第t+1轮的加密全局模型,为第i个本地系统在第t轮的完成加密的本地模型,∑表示密文空间加法,/>表示同态数乘。
8.一种基于联邦模式的信贷风险控制系统,其特征在于,包括:
本地系统,所述的本地系统被配置为从中央系统接收全局模型并解密,将预处理后的本地数据输入全局模型用于对全局模型进行优化更新,得到第i个本地系统在第t轮的本地模型,并利用公共数据集对本地模型验证得到精度;对本地模型进行加密得到,将加密后的本地模型与精度传输给中央系统;
中央系统,所述的中央系统被配置为构建用于信贷风险判定的全局模型后,将全局模型发送至每个本地系统;还用于接收到各本地系统发送的加密后的本地模型,根据每个本地模型的精度进行加权平均得到t+1轮加密中的全局模型;直至全局模型达到收敛条件,输出训练优化后的全局模型;
输出系统,所述的输出系统利用完成训练优化后的全局模型对目标的信贷风险进行预测。
9.一种基于联邦模式的信贷风险控制装置,其特征在于,包括处理器以及存储有计算机程序指令的存储器;
所述处理器执行计算机程序指令时实现权利要求1至7任一项所述的基于联邦模式的信贷风险控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310808422.0A CN116977054A (zh) | 2023-07-04 | 2023-07-04 | 一种基于联邦模式的信贷风险控制方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310808422.0A CN116977054A (zh) | 2023-07-04 | 2023-07-04 | 一种基于联邦模式的信贷风险控制方法、系统及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116977054A true CN116977054A (zh) | 2023-10-31 |
Family
ID=88477558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310808422.0A Pending CN116977054A (zh) | 2023-07-04 | 2023-07-04 | 一种基于联邦模式的信贷风险控制方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116977054A (zh) |
-
2023
- 2023-07-04 CN CN202310808422.0A patent/CN116977054A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020134704A1 (zh) | 基于联邦学习的模型参数训练方法、终端、系统及介质 | |
CN112906903A (zh) | 网络安全风险预测方法、装置、存储介质及计算机设备 | |
CN113627085B (zh) | 横向联邦学习建模优化方法、设备、介质 | |
CN111428887B (zh) | 一种基于多个计算节点的模型训练控制方法、装置及系统 | |
CN111612167B (zh) | 机器学习模型的联合训练方法、装置、设备及存储介质 | |
CN112039702B (zh) | 基于联邦学习和相互学习的模型参数训练方法及装置 | |
CN110991905A (zh) | 风险模型训练方法以及装置 | |
CN112508199B (zh) | 针对跨特征联邦学习的特征选择方法、装置及相关设备 | |
US12088719B2 (en) | Method and system for incremental training of machine learning models on edge devices | |
CN117835246B (zh) | 一种面向任务的隐私语义通信方法 | |
CN111935168A (zh) | 面向工业信息物理系统的入侵检测模型建立方法 | |
CN112668877A (zh) | 结合联邦学习和强化学习的事物资源信息分配方法及系统 | |
CN113747442A (zh) | 基于irs辅助的无线通信传输方法、装置、终端及存储介质 | |
Cheng et al. | Dynamic games for social model training service market via federated learning approach | |
CN113792890A (zh) | 一种基于联邦学习的模型训练方法及相关设备 | |
Kim et al. | P2P computing for trusted networking of personalized IoT services | |
US20210258371A1 (en) | System and method for concurrent training and updating of machine learning models at edge nodes in a peer to peer network | |
CN115174237B (zh) | 一种物联网系统恶意流量的检测方法、装置和电子设备 | |
CN116977054A (zh) | 一种基于联邦模式的信贷风险控制方法、系统及装置 | |
CN116821952A (zh) | 基于区块链共识机制的隐私数据计算可追溯系统及方法 | |
YANG et al. | Enabling Intelligence at Network Edge: An Overview of Federated Learning | |
Li et al. | An Empirical Study on GAN‐Based Traffic Congestion Attack Analysis: A Visualized Method | |
CN116506206A (zh) | 基于零信任网络用户的大数据行为分析方法及系统 | |
CN111786937A (zh) | 用于识别恶意请求的方法和装置 | |
Liu et al. | PPEFL: An Edge Federated Learning Architecture with Privacy‐Preserving Mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |