CN115439219A - 违约风险检测模型的训练方法及装置 - Google Patents

违约风险检测模型的训练方法及装置 Download PDF

Info

Publication number
CN115439219A
CN115439219A CN202211111915.0A CN202211111915A CN115439219A CN 115439219 A CN115439219 A CN 115439219A CN 202211111915 A CN202211111915 A CN 202211111915A CN 115439219 A CN115439219 A CN 115439219A
Authority
CN
China
Prior art keywords
risk detection
training
target
detection model
default risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211111915.0A
Other languages
English (en)
Inventor
王延昭
唐华云
李�荣
商丽丽
华娇娇
孙爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Bond Jinke Information Technology Co ltd
Original Assignee
China Bond Jinke Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Bond Jinke Information Technology Co ltd filed Critical China Bond Jinke Information Technology Co ltd
Priority to CN202211111915.0A priority Critical patent/CN115439219A/zh
Publication of CN115439219A publication Critical patent/CN115439219A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种违约风险检测模型的训练方法及装置,其中违约风险检测模型的训练方法包括:基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集;基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备;利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。通过上述方法,基于联邦学习服务器对第一初始违约风险检测模型进行训练,利用聚合模型参数对模型进行更新,提高了模型性能的同时,不需要暴露数据原文,避免了用户数据发生泄露的风险。

Description

违约风险检测模型的训练方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种违约风险检测模型的训练方法及装置。
背景技术
传统违约风险检测模型中,信用评级等基于主观打分的方法往往存在模型较为简单、依赖专家经验且难以形成量化风险指标的问题;基于统计规则的方法通常依赖财务数据,违约预警滞后,难以做到事前预测;基于神经网络和支持向量机等机器学习的方法以量化的方式对违约相关指标进行了特征提取,获得了较好的效果。
然而在相关技术中,违约风险检测模型未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型,同时存在机构之间数据无法共享的数据孤岛问题。
因此,如何提高违约风险检测模型的性能的同时,避免各机构之间数据发生泄露是目前业界亟待解决的重要课题。
发明内容
针对现有技术存在的问题,本发明提供一种违约风险检测模型的训练方法及装置。
本发明提供一种违约风险检测模型的训练方法,应用于各分布式节点,包括:
基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;
利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
可选地,所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,包括:
在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理;
将加密后的模型参数上传至所述节点设备。
可选地,在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集之前,还包括:
基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要;
将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备,以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要,对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
可选地,在所述得到第一目标违约风险检测模型之后,还包括:
在所述训练样本集更新的情况下,从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数,所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的;
基于所述目标模型参数生成第二初始违约风险检测模型;
基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
本发明还提供一种违约风险检测模型的训练方法,应用于联邦学习服务器,包括:
将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;
将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
可选地,在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前,还包括:
从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要,所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的;
对所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要;
对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
可选地,所述将各所述模型参数进行加权聚合处理生成聚合模型参数,包括:
基于属性基加密算法对加密后的各模型参数进行解密处理,得到各所述模型参数,所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理后得到的;
将各所述模型参数进行加权聚合处理生成聚合模型参数。
可选地,在所述将所述聚合模型参数发送至各所述分布式节点之后,还包括:
将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储;
在所述训练样本集更新的情况下,将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点,以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型,基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
本发明还提供一种违约风险检测模型的训练装置,应用于各分布式节点,包括:
确定模块,用于基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
训练模块,用于基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;
更新模块,用于利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
本发明还提供一种违约风险检测模型的训练装置,应用于联邦学习服务器,包括:
第一发送模块,用于将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
处理模块,用于从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;
第二发送模块,用于将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述违约风险检测模型的训练方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述违约风险检测模型的训练方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述违约风险检测模型的训练方法。
本发明提供的违约风险检测模型的训练方法及装置,通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,各分布式节点确定出各自的训练样本集,利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,利用区块链去中心化及防篡改的特点,确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改,对恶意数据具备事后分析查验能力;由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的,因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新,充分的融合了各分布式节点的数据信息,能够得到性能更好的第一目标违约风险检测模型,同时在对第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息),避免了用户数据发生泄露的风险。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的违约风险检测模型的训练方法的流程示意图之一;
图2是本发明提供的第一初始违约风险检测模型的结构示意图;
图3是本发明提供的违约风险检测模型的训练方法的流程示意图之二;
图4是本发明提供的违约风险检测模型的训练装置的结构示意图之一;
图5是本发明提供的违约风险检测模型的训练装置的结构示意图之二;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于更加清晰地理解本申请各实施例,首先对一些相关的背景知识进行如下介绍。
联邦学习是一项结合传统密码学及机器学习的分布式学习技术,旨在面向多家不愿或不能暴露自家明文数据的数据提供方,在满足数据隐私安全的前提下进行联合模型训练,达到保护隐私的同时完成数据价值释放的效果。
区块链是一项包含密码学、分布式系统与共识协议、博弈论等技术和理论,使用块链式数据结构和分布式节点共识算法,通过密码学保证数据传输和访问的安全,使用自动化智能合约实现价值网络互联互通的技术,因为其技术公开、不可篡改的先天优势在金融行业广受关注。
增量学习是一项无需保存或依赖历史数据,使用增量新数据提升原有模型性能的机器学习技术,能够减少模型训练时间和数据占用空间,同时应用新产生的数据提升机器学习模型性能。
传统债券评级模型中信用评级等基于主观打分的方法往往存在模型较为简单、依赖专家经验且难以形成量化风险指标的问题;基于统计规则的方法通常依赖财务数据,违约预警滞后,难以做到事前预测;基于神经网络和支持向量机等机器学习的方法以量化的方式对违约相关指标进行了特征提取,获得了较好的效果。
但目前的研究较浅,以机器学习算法的跨领域应用为主,未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型,同时存在机构之间数据无法共享的数据孤岛问题和模型无法根据新数据进行进一步调整的问题。
因此,针对上述存在的技术问题,为了提高违约风险检测模型性能的同时,避免各机构之间数据发生泄露,本发明提供一种违约风险检测模型的训练方法及装置。
下面结合图1-图3对本发明提供的违约风险检测模型的训练方法进行具体描述。图1是本发明提供的违约风险检测模型的训练方法的流程示意图之一,参见图1所示,该方法包括步骤101-步骤103,其中:
步骤101、基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息。
本发明实施例可应用于利用违约风险检测模型进行违约风险检测的场景中,利用违约风险检测模型可以检测出债券是否有违约风险,有利于引导债券市场良性发展,助力监管机构及金融机构加强债券信用风险管理,完善债券市场体系和制度,支持投资决策和风险评估识别。
由于在相关技术中,违约风险检测模型未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型,同时存在机构之间数据无法共享的数据孤岛问题。
因此,为了提高违约风险检测模型性能的同时,避免各机构之间数据发生泄露,在本实施例中,首先联邦学习中心服务器会向各分布式节点发送目标待检测债券对应的目标债券特征摘要及目标债券标识摘要。
在实际应用中,每个目标待检测债券均有对应的特征信息及标识信息;
对于不同种类的目标待检测债券会有不同特征信息及标识信息,标识信息可以是债券代码、债券名称或债券编号;特征信息可以是目标待检测债券对应的属性信息,例如债券发行人的净资产收益率、债券的市场隐含评级、持有该债券的基金家数等信息。
各分布式节点在接收到目标债券特征摘要及目标债券标识摘要之后,需要基于目标债券特征摘要及目标债券标识摘要,确定训练样本集,其中,训练样本集包括各目标待检测债券对应的特征信息及标识信息。
需要说明的是,联邦学习是一种机器学习范式,可以在一个联邦学习中心服务器的协调下让多个分布式节点互相合作,即便在数据分散在各分布式节点的情况下也可以得到一个完整的机器学习模型。
步骤102、基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数。
在本实施例中,各分布式节点在确定出包括有各目标待检测债券对应的特征信息及标识信息的训练样本集之后,需要基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练。
各分布式节点从联邦学习服务器获取第一初始违约风险检测模型的模型参数;第一初始违约风险检测模型是可以实现违约风险检测功能的任何模型,例如卷积神经网络模型(Convolutional Neural Networks,CNN)、循环神经网络模型(Recurrent NeuralNetwork,RNN)、长短期记忆网络模型(Long Short Term Memory,LSTM)等。
具体地,图2是本发明提供的第一初始违约风险检测模型的结构示意图,如图2所示,第一初始违约风险检测模型包括输入层、L个隐藏层以及输出层,模型参数例如可以是各隐藏层与输出层的神经元个数、训练批次的大小、最大迭代次数、停止迭代阈值等参数;其中,初始化各隐藏层与输出层之间的线性关系系数矩阵和偏倚向量为随机值。
在对各第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点按照联邦学习服务器预设的训练批次大小,将特征信息及标识信息进行填充和分组,训练过程使用均方差作为损失函数,其中,均方差损失函数可以通过以下公式(1)表示:
Figure BDA0003843751590000101
其中,J表示均方差损失函数;W表示权值矩阵;b表示偏移量;x表示第一初始违约风险检测模型的输入;y表示第一初始违约风险检测模型的输出;aL表示第L层神经元的输出。
各分布式节点需要将每一次迭代训练过程中各第一初始违约风险检测模型的模型参数上传至区块链中的节点设备;
相应地,联邦学习中心服务器从节点设备中获取各模型参数,并将各模型参数进行加权聚合处理,生成聚合模型参数。
步骤103、利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
在本实施例中,在联邦学习中心服务器将聚合模型参数发送至各分布式节点之后,各分布式节点需要利用聚合模型参数对第一初始违约风险检测模型进行更新;具体过程如下:
各分布式节点利用聚合模型参数对第一初始违约风险检测模型进行训练,训练一轮后,将各第一初始违约风险检测模型的模型参数再一次上传至区块链中的节点设备,联邦学习中心服务器从节点设备获取模型参数再次进行加权聚合,得到更新的聚合模型参数并下发至各分布式节点,各分布式节点利用更新的聚合模型参数再进行训练,直至各分布式节点上所有第一初始违约风险检测模型收敛或达到预设训练停止条件(例如达到最大训练迭代次数),进而得到第一目标违约风险检测模型。
本发明提供的违约风险检测模型的训练方法,通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,各分布式节点确定出各自的训练样本集,利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,利用区块链去中心化及防篡改的特点,确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改,对恶意数据具备事后分析查验能力;由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的,因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新,充分的融合了各分布式节点的数据信息,能够得到性能更好的第一目标违约风险检测模型,同时在对第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息),避免了用户数据发生泄露的风险。
可选地,所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,可以通过以下方式实现,具体包括步骤1)-步骤2):
步骤1)、在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理;
步骤2)、将加密后的模型参数上传至所述节点设备。
在本实施例中,各分布式节点基于训练样本集对各第一初始违约风险检测模型进行迭代训练,在对第一初始违约风险检测模型每一次迭代训练的过程中,需要基于属性及加密算法对各模型参数进行加密处理,避免将各模型参数上传至区块链过程中发生各模型参数数据泄露的风险。
在属性基加密算法中,用户密钥与属性(或访问结构)相关联,密文与访问结构(或属性)相关联,当用户密钥满足密文访问结构(或密文属性满足密钥访问结构)时,用户可以解密消息,实现了细粒度的访问控制。
具体地,属性基加密完整步骤如下:
1、初始化:各分布式节点使用基于密钥策略的属性加密算法,选择系统安全系数和属性集,生成对应的主密钥和公共参数并执行智能合约将其上传至区块链中的节点设备;
2、各分布式节点分别给自己和联邦学习中心服务器分配具有访问权限的访问密钥,通过安全信道进行密钥分发;
3、各分布式节点对完成一批次训练后的模型参数进行属性基加密,调用智能合约将加密后的模型参数有上传至节点设备的节点账本中。
在上述实施方式中,在对第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各模型参数进行加密处理,将加密后的模型参数上传至节点设备,解决了对称加密密钥传输带来的密钥泄露的问题,实现了加密数据(即加密后的模型参数)的细粒度访问控制,即数据拥有者可以指定谁可以访问加密数据,数据拥有者对数据具有完全的控制权,避免将各模型参数上传至区块链过程中发生各模型参数数据泄露的风险。
可选地,在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集之前,联邦学习中心服务器还需要生成目标债券特征摘要及目标债券标识摘要;具体可以通过以下步骤[1]-步骤[2]实现:
步骤[1]、基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要;
步骤[2]、将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备,以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要,对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
在本实施例中,各分布式节点需要基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要;
其中,原始债券特征信息及原始债券标识信息是各分布式节点自己所拥有的数据;例如,原始债券标识信息可以是本地数据库中存储的债券代码、债券名称或债券编号;原始债券特征信息可以是原始债券对应的属性信息,例如债券发行人的净资产收益率、债券的市场隐含评级、持有该债券的基金家数等信息。
SM3密码杂凑算法一种密码散列函数标准,适用于商用密码应用中的数字签名和验证,是在SHA-256基础上改进实现的一种算法,其安全性和SHA-256相当。
基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要的具体流程如下:
1、初始化:定义8个32bit长的容器或者寄存器V[8],初始值赋值为对一个IV值;
2、数据填充:首先将比特“1”添加到原始债券特征信息及原始债券标识信息的末尾,再添加若干个比特“0”,使填充后的原始债券特征信息及原始债券标识信息的比特长度为512的倍数,便于进行数据分组压缩;
3、迭代压缩:针对分组大小为64字节的数据进行迭代压缩,使用异或、循环左移等操作进行数据计算,最终将分组计算后的值填入寄存器,获得原始债券特征摘要及原始债券标识摘要。
在获得原始债券特征摘要及原始债券标识摘要之后,需要将原始债券特征摘要及原始债券标识摘要上传至节点设备;
相应地,联邦学习中心服务器对节点设备中的原始债券特征摘要进行排序处理,生成目标债券特征摘要;对原始债券标识摘要进行去重处理,生成目标债券标识摘要。
也就是说,联邦学习中心服务器从节点设备中取得各分布式节点上传的原始债券特征摘要以及原始债券标识摘要之后,需要对原始债券标识摘要进行去重处理,将重复的原始债券标识摘要发送至各分布式节点将其从训练样本集中移除;
然后联邦学习中心服务器按照预设排序规则对原始债券特征摘要进行排序,生成排序后的目标债券特征摘要;
各分布式节点基于目标债券标识摘要以及排序后的目标债券特征摘要能够知晓训练样本集中目标债券对应的特征信息的排序顺序,以便于对训练样本集进行数据填充。
在上述实施方式中,通过基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,使各节点设备无需将真实数据上传至区块链,仅需将原始债券特征摘要及原始债券标识摘要上传至节点设备,实现对各分布式节点本地数据具备较高的保护能力;联邦学习中心服务器对节点设备中的原始债券特征摘要进行排序处理,生成目标债券特征摘要,对原始债券标识摘要进行去重处理,生成目标债券标识摘要,各分布式节点根据目标债券特征摘要以及目标债券标识摘要能够确定出对模型训练性能较高的训练样本集,利用该训练样本集对第一初始违约风险检测模型进行训练,能够提高违约风险检测模型的性能。
可选地,在所述得到第一目标违约风险检测模型之后,在各分布式节点提供新增数据的情况下,还可以对各新增数据进行增量学习,以保证违约风险检测模型可以实时更新以获得更好的性能,避免大量原始数据存储和重新训练模型造成存储和计算资源的浪费;对新增数据进行增量学习,具体可以通过以下步骤[a]-步骤[c]实现:
步骤[a]、在所述训练样本集更新的情况下,从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数,所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的;
步骤[b]、基于所述目标模型参数生成第二初始违约风险检测模型;
步骤[c]、基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
在本实施例中,在得到第一目标违约风险检测模型之后,联邦学习中心服务器会将第一目标违约风险检测模型对应的目标模型参数上传至区块链中的节点设备进行存储;其中,目标模型参数例如包括第一目标违约风险检测模型的模型参数、目标债券特征摘要、目标债券标识摘要、时间信息、各分布式节点对应的参与方信息。
在对训练样本集进行更新的情况下(即在原始训练样本集基础上新增债券特征信息及债券标识信息),各分布式节点会从区块链的节点设备中获取第一目标违约风险检测模型对应的目标模型参数,将目标模型参数作为针对新增数据(即新增的债券特征信息及债券标识信息)进行增量学习的原始参数。
也就是说,将目标模型参数作为原始参数,并生成第二初始违约风险检测模型,然后各分布式节点基于更新训练样本集对第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
需要说明的是,各分布式节点基于更新训练样本集对第二初始违约风险检测模型进行增量学习的过程与各分布式节点基于训练样本集对第一初始违约风险检测模型进行迭代训练的过程相同,具体流程如下:
步骤1、各分布式节点基于SM3算法将新增的债券特征信息及债券标识信息进行处理,得到新增债券特征摘要及新增债券标识摘要;将新增债券特征摘要及新增债券标识摘要上传至区块链的节点设备。
步骤2、联邦学习中心服务器对节点设备中的新增债券特征摘要进行排序处理,对新增债券标识摘要进行去重处理。
步骤3、基于排序后的新增债券特征摘要以及去重后的新增债券标识摘要,生成更新训练样本集;基于更新训练样本集对第二初始违约风险检测模型进行迭代训练。
步骤4、在对第二初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各模型参数进行加密处理;将加密后的模型参数上传至区块链中的节点设备。
步骤5、联邦学习中心服务器基于属性基加密算法对节点设备中加密后的各模型参数进行解密处理,得到各第二初始违约风险检测模型对应的模型参数;对各模型参数进行加权聚合处理,生成聚合模型参数,并下发至各分布式节点。
步骤6、各分布式节点利用聚合模型参数对第二初始违约风险检测模型进行更新,直至达到训练停止条件,得到第二目标违约风险检测模型。
在上述实施方式中,在得到第一目标违约风险检测模型之后,在各分布式节点提供新增数据的情况下,对各新增数据进行增量学习,保证违约风险检测模型可以实时更新以获得更好的性能,避免了大量原始数据存储和重新训练模型造成存储和计算资源的浪费。
图3是本发明提供的违约风险检测模型的训练方法的流程示意图之二,参见图3所示,该方法包括步骤301-步骤303,其中:
步骤301、将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息。
在本实施例中,首先联邦学习中心服务器会将目标债券特征摘要及目标债券标识摘要发送至各分布式节点
各分布式节点在接收到目标债券特征摘要及目标债券标识摘要之后,需要基于目标债券特征摘要及目标债券标识摘要,确定训练样本集,并基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练;其中,训练样本集包括各目标待检测债券对应的特征信息及标识信息。
步骤302、从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的。
在本实施例中,各分布式节点将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备;然后联邦学习中心服务器会从区块链中的节点设备获取各模型参数,并将各模型参数进行加权聚合处理生成聚合模型参数。
步骤303、将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
在本实施例中,联邦学习中心服务器生成聚合模型参数之后,将聚合模型参数发送至各分布式节点;
各分布式节点利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
本发明提供的违约风险检测模型的训练方法,联邦学习中心服务器通过将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,以使各分布式节点确定出各自的训练样本集,利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,利用区块链去中心化及防篡改的特点,确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改,对恶意数据具备事后分析查验能力;联邦学习中心服务器从区块链中的节点设备获取第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各模型参数进行加权聚合处理生成聚合模型参数并发送至各分布式节点,各分布式节点利用聚合模型参数对第一初始违约风险检测模型进行更新,充分的融合了各分布式节点的数据信息,能够得到性能更好的第一目标违约风险检测模型,同时在对第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息),避免了用户数据发生泄露的风险。
可选地,在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前,联邦学习中心服务器还需要生成目标债券特征摘要及目标债券标识摘要,具体可以通过以下步骤[1]-步骤[3]实现:
步骤[1]、从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要,所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的;
步骤[2]、对所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要;
步骤[3]、对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
可选地,所述将各所述模型参数进行加权聚合处理生成聚合模型参数,具体可以通过以下步骤[a]-步骤[b]实现:
步骤[a]、基于属性基加密算法对加密后的各模型参数进行解密处理,得到各所述模型参数,所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理后得到的;
步骤[b]、将各所述模型参数进行加权聚合处理生成聚合模型参数。
可选地,在所述将所述聚合模型参数发送至各所述分布式节点之后,在各分布式节点提供新增数据的情况下,还可以使各分布式节点对各新增数据进行增量学习,以保证违约风险检测模型可以实时更新以获得更好的性能,避免大量原始数据存储和重新训练模型造成存储和计算资源的浪费,具体可以通过以下步骤a)-步骤b)实现:
步骤a)、将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储;
步骤b)、在所述训练样本集更新的情况下,将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点,以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型,基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
下面对本发明提供的违约风险检测模型的训练装置进行描述,下文描述的违约风险检测模型的训练装置与上文描述的违约风险检测模型的训练方法可相互对应参照。图4是本发明提供的违约风险检测模型的训练装置的结构示意图之一,如图4所示,该违约风险检测模型的训练装置包括:确定模块401、训练模块402、更新模块403,其中:
确定模块401,用于基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
训练模块402,用于基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;
更新模块403,用于利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
本发明提供的违约风险检测模型的训练装置,通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,各分布式节点确定出各自的训练样本集,利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,利用区块链去中心化及防篡改的特点,确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改,对恶意数据具备事后分析查验能力;由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的,因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新,充分的融合了各分布式节点的数据信息,能够得到性能更好的第一目标违约风险检测模型,同时在对第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息),避免了用户数据发生泄露的风险。
可选地,训练模块402,进一步用于:
在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理;
将加密后的模型参数上传至所述节点设备。
可选地,确定模块401,进一步用于:
基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要;
将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备,以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要,对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
可选地,更新模块403,进一步用于:
在所述训练样本集更新的情况下,从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数,所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的;
基于所述目标模型参数生成第二初始违约风险检测模型;
基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
图5是本发明提供的违约风险检测模型的训练装置的结构示意图之二,如图5所示,该违约风险检测模型的训练装置包括:第一发送模块501、处理模块502、第二发送模块503,其中:
第一发送模块501,用于将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
处理模块502,用于从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;
第二发送模块503,用于将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
本发明提供的违约风险检测模型的训练方法,联邦学习中心服务器通过将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,以使各分布式节点确定出各自的训练样本集,利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,利用区块链去中心化及防篡改的特点,确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改,对恶意数据具备事后分析查验能力;联邦学习中心服务器从区块链中的节点设备获取第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各模型参数进行加权聚合处理生成聚合模型参数并发送至各分布式节点,各分布式节点利用聚合模型参数对第一初始违约风险检测模型进行更新,充分的融合了各分布式节点的数据信息,能够得到性能更好的第一目标违约风险检测模型,同时在对第一初始违约风险检测模型进行迭代训练的过程中,各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息),避免了用户数据发生泄露的风险。
可选地,第一发送模块501,进一步用于:
从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要,所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的;
对所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要;
对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
可选地,处理模块502,进一步用于:
基于属性基加密算法对加密后的各模型参数进行解密处理,得到各所述模型参数,所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理后得到的;
将各所述模型参数进行加权聚合处理生成聚合模型参数。
可选地,第二发送模块503,进一步用于:
将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储;
在所述训练样本集更新的情况下,将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点,以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型,基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
图6是本发明提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行违约风险检测模型的训练方法,该方法应用于各分布式节点,包括:基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型;
或者,执行违约风险检测模型的训练方法,该方法应用于联邦学习服务器,包括:将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的违约风险检测模型的训练方法,该方法应用于各分布式节点,包括:基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型;
或者,执行违约风险检测模型的训练方法,该方法应用于联邦学习服务器,包括:将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的违约风险检测模型的训练方法,该方法应用于各分布式节点,包括:基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型;
或者,执行违约风险检测模型的训练方法,该方法应用于联邦学习服务器,包括:将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种违约风险检测模型的训练方法,其特征在于,应用于各分布式节点,包括:
基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;
利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
2.根据权利要求1所述的违约风险检测模型的训练方法,其特征在于,所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,包括:
在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理;
将加密后的模型参数上传至所述节点设备。
3.根据权利要求1所述的违约风险检测模型的训练方法,其特征在于,在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集之前,还包括:
基于SM3算法将原始债券特征信息及原始债券标识信息进行处理,得到原始债券特征摘要及原始债券标识摘要;
将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备,以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要,对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
4.根据权利要求1至3任一项所述的违约风险检测模型的训练方法,其特征在于,在所述得到第一目标违约风险检测模型之后,还包括:
在所述训练样本集更新的情况下,从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数,所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的;
基于所述目标模型参数生成第二初始违约风险检测模型;
基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
5.一种违约风险检测模型的训练方法,其特征在于,应用于联邦学习服务器,包括:
将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;
将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
6.根据权利要求5所述的违约风险检测模型的训练方法,其特征在于,在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前,还包括:
从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要,所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的;
对所述原始债券特征摘要进行排序处理,生成所述目标债券特征摘要;
对所述原始债券标识摘要进行去重处理,生成所述目标债券标识摘要。
7.根据权利要求5所述的违约风险检测模型的训练方法,其特征在于,所述将各所述模型参数进行加权聚合处理生成聚合模型参数,包括:
基于属性基加密算法对加密后的各模型参数进行解密处理,得到各所述模型参数,所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中,基于属性基加密算法对各所述模型参数进行加密处理后得到的;
将各所述模型参数进行加权聚合处理生成聚合模型参数。
8.根据权利要求5至7任一项所述的违约风险检测模型的训练方法,其特征在于,在所述将所述聚合模型参数发送至各所述分布式节点之后,还包括:
将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储;
在所述训练样本集更新的情况下,将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点,以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型,基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习,直至达到训练停止条件,生成第二目标违约风险检测模型。
9.一种违约风险检测模型的训练装置,其特征在于,应用于各分布式节点,包括:
确定模块,用于基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要,确定训练样本集,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
训练模块,用于基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备,以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理,生成聚合模型参数;
更新模块,用于利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
10.一种违约风险检测模型的训练装置,其特征在于,应用于联邦学习服务器,包括:
第一发送模块,用于将目标债券特征摘要及目标债券标识摘要发送至各分布式节点,所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集,基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练,所述训练样本集包括各目标待检测债券对应的特征信息及标识信息;
处理模块,用于从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数,将各所述模型参数进行加权聚合处理生成聚合模型参数,各所述模型参数是各所述分布式节点上传至所述节点设备的;
第二发送模块,用于将所述聚合模型参数发送至各所述分布式节点,以使各所述分布式节点对所述第一初始违约风险检测模型进行更新,直至达到训练停止条件,得到第一目标违约风险检测模型。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述违约风险检测模型的训练方法,或者权利要求5至8任一项所述违约风险检测模型的训练方法。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述违约风险检测模型的训练方法,或者权利要求5至8任一项所述违约风险检测模型的训练方法。
CN202211111915.0A 2022-09-13 2022-09-13 违约风险检测模型的训练方法及装置 Pending CN115439219A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211111915.0A CN115439219A (zh) 2022-09-13 2022-09-13 违约风险检测模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211111915.0A CN115439219A (zh) 2022-09-13 2022-09-13 违约风险检测模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN115439219A true CN115439219A (zh) 2022-12-06

Family

ID=84247241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211111915.0A Pending CN115439219A (zh) 2022-09-13 2022-09-13 违约风险检测模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN115439219A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273760A (zh) * 2017-06-09 2017-10-20 济南浪潮高新科技投资发展有限公司 一种基于区块链多ca应用认证方法
CN110766164A (zh) * 2018-07-10 2020-02-07 第四范式(北京)技术有限公司 用于执行机器学习过程的方法和系统
CN113590796A (zh) * 2021-08-04 2021-11-02 百度在线网络技术(北京)有限公司 排序模型的训练方法、装置和电子设备
CN114742239A (zh) * 2022-03-09 2022-07-12 大连理工大学 基于联邦学习的金融保险理赔风险模型训练方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273760A (zh) * 2017-06-09 2017-10-20 济南浪潮高新科技投资发展有限公司 一种基于区块链多ca应用认证方法
CN110766164A (zh) * 2018-07-10 2020-02-07 第四范式(北京)技术有限公司 用于执行机器学习过程的方法和系统
CN113590796A (zh) * 2021-08-04 2021-11-02 百度在线网络技术(北京)有限公司 排序模型的训练方法、装置和电子设备
CN114742239A (zh) * 2022-03-09 2022-07-12 大连理工大学 基于联邦学习的金融保险理赔风险模型训练方法及装置

Similar Documents

Publication Publication Date Title
CN110399742B (zh) 一种联邦迁移学习模型的训练、预测方法及装置
CN110533429A (zh) 区块链中的交易背书方法、装置和区块链网络
CN110598442A (zh) 一种敏感数据自适应的脱敏方法、系统
CN113159327A (zh) 基于联邦学习系统的模型训练方法、装置、电子设备
CN115102763B (zh) 基于可信联邦学习多域DDoS攻击检测方法与装置
CN110516464A (zh) 基于神经网络计算的数据保护方法及相关设备
CN112347500B (zh) 分布式系统的机器学习方法、装置、系统、设备及存储介质
CN112862001A (zh) 一种隐私保护下的去中心化数据建模方法
CN112039702A (zh) 基于联邦学习和相互学习的模型参数训练方法及装置
CN112446791A (zh) 基于联邦学习的车险评分方法、装置、设备及存储介质
WO2022156594A1 (zh) 联邦模型训练方法、装置、电子设备、计算机程序产品及计算机可读存储介质
CN113779355A (zh) 基于区块链的网络谣言溯源取证方法及系统
Li Combination of blockchain and AI for music intellectual property protection
CN117171779B (zh) 基于交集保护的数据处理装置
Tong et al. BFSN: a novel method of encrypted traffic classification based on bidirectional flow sequence network
CN113055153B (zh) 一种基于全同态加密算法的数据加密方法、系统和介质
CN113239401A (zh) 一种基于电力物联网的大数据分析系统、方法及计算机存储介质
CN110618989B (zh) 信息处理方法、信息处理装置及相关产品
CN116185296A (zh) 一种基于多媒体远程会议信息的分布式安全储存系统
CN115439219A (zh) 违约风险检测模型的训练方法及装置
CN114422105A (zh) 联合建模方法、装置、电子设备及存储介质
CN108108913A (zh) 一种去中心化应用系统的监管方法
CN112734050A (zh) 文本模型的训练方法、识别方法、装置、设备及存储介质
CN113254989A (zh) 目标数据的融合方法、装置和服务器
CN111698284A (zh) 基于区块链的计算机加密系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20221206