CN115439219A

CN115439219A - 违约风险检测模型的训练方法及装置

Info

Publication number: CN115439219A
Application number: CN202211111915.0A
Authority: CN
Inventors: 王延昭; 唐华云; 李�荣; 商丽丽; 华娇娇; 孙爽
Original assignee: China Bond Jinke Information Technology Co ltd
Current assignee: China Bond Jinke Information Technology Co ltd
Priority date: 2022-09-13
Filing date: 2022-09-13
Publication date: 2022-12-06

Abstract

本发明提供一种违约风险检测模型的训练方法及装置，其中违约风险检测模型的训练方法包括：基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集；基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备；利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。通过上述方法，基于联邦学习服务器对第一初始违约风险检测模型进行训练，利用聚合模型参数对模型进行更新，提高了模型性能的同时，不需要暴露数据原文，避免了用户数据发生泄露的风险。

Description

违约风险检测模型的训练方法及装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种违约风险检测模型的训练方法及装置。

背景技术

传统违约风险检测模型中，信用评级等基于主观打分的方法往往存在模型较为简单、依赖专家经验且难以形成量化风险指标的问题；基于统计规则的方法通常依赖财务数据，违约预警滞后，难以做到事前预测；基于神经网络和支持向量机等机器学习的方法以量化的方式对违约相关指标进行了特征提取，获得了较好的效果。

然而在相关技术中，违约风险检测模型未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型，同时存在机构之间数据无法共享的数据孤岛问题。

因此，如何提高违约风险检测模型的性能的同时，避免各机构之间数据发生泄露是目前业界亟待解决的重要课题。

发明内容

针对现有技术存在的问题，本发明提供一种违约风险检测模型的训练方法及装置。

本发明提供一种违约风险检测模型的训练方法，应用于各分布式节点，包括：

基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；

利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

可选地，所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，包括：

在对所述第一初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各所述模型参数进行加密处理；

将加密后的模型参数上传至所述节点设备。

可选地，在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集之前，还包括：

基于SM3算法将原始债券特征信息及原始债券标识信息进行处理，得到原始债券特征摘要及原始债券标识摘要；

将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备，以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理，生成所述目标债券特征摘要，对所述原始债券标识摘要进行去重处理，生成所述目标债券标识摘要。

可选地，在所述得到第一目标违约风险检测模型之后，还包括：

在所述训练样本集更新的情况下，从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数，所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的；

基于所述目标模型参数生成第二初始违约风险检测模型；

基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习，直至达到训练停止条件，生成第二目标违约风险检测模型。

本发明还提供一种违约风险检测模型的训练方法，应用于联邦学习服务器，包括：

将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集，基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各所述模型参数进行加权聚合处理生成聚合模型参数，各所述模型参数是各所述分布式节点上传至所述节点设备的；

将所述聚合模型参数发送至各所述分布式节点，以使各所述分布式节点对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

可选地，在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前，还包括：

从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要，所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的；

对所述原始债券特征摘要进行排序处理，生成所述目标债券特征摘要；

对所述原始债券标识摘要进行去重处理，生成所述目标债券标识摘要。

可选地，所述将各所述模型参数进行加权聚合处理生成聚合模型参数，包括：

基于属性基加密算法对加密后的各模型参数进行解密处理，得到各所述模型参数，所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各所述模型参数进行加密处理后得到的；

将各所述模型参数进行加权聚合处理生成聚合模型参数。

可选地，在所述将所述聚合模型参数发送至各所述分布式节点之后，还包括：

将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储；

在所述训练样本集更新的情况下，将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点，以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型，基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习，直至达到训练停止条件，生成第二目标违约风险检测模型。

本发明还提供一种违约风险检测模型的训练装置，应用于各分布式节点，包括：

确定模块，用于基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

训练模块，用于基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；

更新模块，用于利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

本发明还提供一种违约风险检测模型的训练装置，应用于联邦学习服务器，包括：

第一发送模块，用于将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集，基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

处理模块，用于从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各所述模型参数进行加权聚合处理生成聚合模型参数，各所述模型参数是各所述分布式节点上传至所述节点设备的；

第二发送模块，用于将所述聚合模型参数发送至各所述分布式节点，以使各所述分布式节点对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述违约风险检测模型的训练方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述违约风险检测模型的训练方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述违约风险检测模型的训练方法。

本发明提供的违约风险检测模型的训练方法及装置，通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，各分布式节点确定出各自的训练样本集，利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，利用区块链去中心化及防篡改的特点，确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改，对恶意数据具备事后分析查验能力；由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的，因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新，充分的融合了各分布式节点的数据信息，能够得到性能更好的第一目标违约风险检测模型，同时在对第一初始违约风险检测模型进行迭代训练的过程中，各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息)，避免了用户数据发生泄露的风险。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的违约风险检测模型的训练方法的流程示意图之一；

图2是本发明提供的第一初始违约风险检测模型的结构示意图；

图3是本发明提供的违约风险检测模型的训练方法的流程示意图之二；

图4是本发明提供的违约风险检测模型的训练装置的结构示意图之一；

图5是本发明提供的违约风险检测模型的训练装置的结构示意图之二；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了便于更加清晰地理解本申请各实施例，首先对一些相关的背景知识进行如下介绍。

联邦学习是一项结合传统密码学及机器学习的分布式学习技术，旨在面向多家不愿或不能暴露自家明文数据的数据提供方，在满足数据隐私安全的前提下进行联合模型训练，达到保护隐私的同时完成数据价值释放的效果。

区块链是一项包含密码学、分布式系统与共识协议、博弈论等技术和理论，使用块链式数据结构和分布式节点共识算法，通过密码学保证数据传输和访问的安全，使用自动化智能合约实现价值网络互联互通的技术，因为其技术公开、不可篡改的先天优势在金融行业广受关注。

增量学习是一项无需保存或依赖历史数据，使用增量新数据提升原有模型性能的机器学习技术，能够减少模型训练时间和数据占用空间，同时应用新产生的数据提升机器学习模型性能。

传统债券评级模型中信用评级等基于主观打分的方法往往存在模型较为简单、依赖专家经验且难以形成量化风险指标的问题；基于统计规则的方法通常依赖财务数据，违约预警滞后，难以做到事前预测；基于神经网络和支持向量机等机器学习的方法以量化的方式对违约相关指标进行了特征提取，获得了较好的效果。

但目前的研究较浅，以机器学习算法的跨领域应用为主，未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型，同时存在机构之间数据无法共享的数据孤岛问题和模型无法根据新数据进行进一步调整的问题。

因此，针对上述存在的技术问题，为了提高违约风险检测模型性能的同时，避免各机构之间数据发生泄露，本发明提供一种违约风险检测模型的训练方法及装置。

下面结合图1-图3对本发明提供的违约风险检测模型的训练方法进行具体描述。图1是本发明提供的违约风险检测模型的训练方法的流程示意图之一，参见图1所示，该方法包括步骤101-步骤103，其中：

步骤101、基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息。

本发明实施例可应用于利用违约风险检测模型进行违约风险检测的场景中，利用违约风险检测模型可以检测出债券是否有违约风险，有利于引导债券市场良性发展，助力监管机构及金融机构加强债券信用风险管理，完善债券市场体系和制度，支持投资决策和风险评估识别。

由于在相关技术中，违约风险检测模型未能针对债券违约相关指标的特征设计泛化能力强、拥有反馈机制、预测效果好的专用模型，同时存在机构之间数据无法共享的数据孤岛问题。

因此，为了提高违约风险检测模型性能的同时，避免各机构之间数据发生泄露，在本实施例中，首先联邦学习中心服务器会向各分布式节点发送目标待检测债券对应的目标债券特征摘要及目标债券标识摘要。

在实际应用中，每个目标待检测债券均有对应的特征信息及标识信息；

对于不同种类的目标待检测债券会有不同特征信息及标识信息，标识信息可以是债券代码、债券名称或债券编号；特征信息可以是目标待检测债券对应的属性信息，例如债券发行人的净资产收益率、债券的市场隐含评级、持有该债券的基金家数等信息。

各分布式节点在接收到目标债券特征摘要及目标债券标识摘要之后，需要基于目标债券特征摘要及目标债券标识摘要，确定训练样本集，其中，训练样本集包括各目标待检测债券对应的特征信息及标识信息。

需要说明的是，联邦学习是一种机器学习范式，可以在一个联邦学习中心服务器的协调下让多个分布式节点互相合作，即便在数据分散在各分布式节点的情况下也可以得到一个完整的机器学习模型。

步骤102、基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数。

在本实施例中，各分布式节点在确定出包括有各目标待检测债券对应的特征信息及标识信息的训练样本集之后，需要基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练。

各分布式节点从联邦学习服务器获取第一初始违约风险检测模型的模型参数；第一初始违约风险检测模型是可以实现违约风险检测功能的任何模型，例如卷积神经网络模型(Convolutional Neural Networks，CNN)、循环神经网络模型(Recurrent NeuralNetwork，RNN)、长短期记忆网络模型(Long Short Term Memory，LSTM)等。

具体地，图2是本发明提供的第一初始违约风险检测模型的结构示意图，如图2所示，第一初始违约风险检测模型包括输入层、L个隐藏层以及输出层，模型参数例如可以是各隐藏层与输出层的神经元个数、训练批次的大小、最大迭代次数、停止迭代阈值等参数；其中，初始化各隐藏层与输出层之间的线性关系系数矩阵和偏倚向量为随机值。

在对各第一初始违约风险检测模型进行迭代训练的过程中，各分布式节点按照联邦学习服务器预设的训练批次大小，将特征信息及标识信息进行填充和分组，训练过程使用均方差作为损失函数，其中，均方差损失函数可以通过以下公式(1)表示：

其中，J表示均方差损失函数；W表示权值矩阵；b表示偏移量；x表示第一初始违约风险检测模型的输入；y表示第一初始违约风险检测模型的输出；a^L表示第L层神经元的输出。

各分布式节点需要将每一次迭代训练过程中各第一初始违约风险检测模型的模型参数上传至区块链中的节点设备；

相应地，联邦学习中心服务器从节点设备中获取各模型参数，并将各模型参数进行加权聚合处理，生成聚合模型参数。

步骤103、利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

在本实施例中，在联邦学习中心服务器将聚合模型参数发送至各分布式节点之后，各分布式节点需要利用聚合模型参数对第一初始违约风险检测模型进行更新；具体过程如下：

各分布式节点利用聚合模型参数对第一初始违约风险检测模型进行训练，训练一轮后，将各第一初始违约风险检测模型的模型参数再一次上传至区块链中的节点设备，联邦学习中心服务器从节点设备获取模型参数再次进行加权聚合，得到更新的聚合模型参数并下发至各分布式节点，各分布式节点利用更新的聚合模型参数再进行训练，直至各分布式节点上所有第一初始违约风险检测模型收敛或达到预设训练停止条件(例如达到最大训练迭代次数)，进而得到第一目标违约风险检测模型。

本发明提供的违约风险检测模型的训练方法，通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，各分布式节点确定出各自的训练样本集，利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，利用区块链去中心化及防篡改的特点，确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改，对恶意数据具备事后分析查验能力；由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的，因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新，充分的融合了各分布式节点的数据信息，能够得到性能更好的第一目标违约风险检测模型，同时在对第一初始违约风险检测模型进行迭代训练的过程中，各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息)，避免了用户数据发生泄露的风险。

可选地，所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，可以通过以下方式实现，具体包括步骤1)-步骤2)：

步骤1)、在对所述第一初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各所述模型参数进行加密处理；

步骤2)、将加密后的模型参数上传至所述节点设备。

在本实施例中，各分布式节点基于训练样本集对各第一初始违约风险检测模型进行迭代训练，在对第一初始违约风险检测模型每一次迭代训练的过程中，需要基于属性及加密算法对各模型参数进行加密处理，避免将各模型参数上传至区块链过程中发生各模型参数数据泄露的风险。

在属性基加密算法中，用户密钥与属性(或访问结构)相关联,密文与访问结构(或属性)相关联,当用户密钥满足密文访问结构(或密文属性满足密钥访问结构)时,用户可以解密消息,实现了细粒度的访问控制。

具体地，属性基加密完整步骤如下：

1、初始化：各分布式节点使用基于密钥策略的属性加密算法，选择系统安全系数和属性集，生成对应的主密钥和公共参数并执行智能合约将其上传至区块链中的节点设备；

2、各分布式节点分别给自己和联邦学习中心服务器分配具有访问权限的访问密钥，通过安全信道进行密钥分发；

3、各分布式节点对完成一批次训练后的模型参数进行属性基加密，调用智能合约将加密后的模型参数有上传至节点设备的节点账本中。

在上述实施方式中，在对第一初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各模型参数进行加密处理，将加密后的模型参数上传至节点设备，解决了对称加密密钥传输带来的密钥泄露的问题，实现了加密数据(即加密后的模型参数)的细粒度访问控制，即数据拥有者可以指定谁可以访问加密数据，数据拥有者对数据具有完全的控制权，避免将各模型参数上传至区块链过程中发生各模型参数数据泄露的风险。

可选地，在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集之前，联邦学习中心服务器还需要生成目标债券特征摘要及目标债券标识摘要；具体可以通过以下步骤[1]-步骤[2]实现：

步骤[1]、基于SM3算法将原始债券特征信息及原始债券标识信息进行处理，得到原始债券特征摘要及原始债券标识摘要；

步骤[2]、将所述原始债券特征摘要及所述原始债券标识摘要上传至所述节点设备，以使所述联邦学习中心服务器对所述节点设备中的所述原始债券特征摘要进行排序处理，生成所述目标债券特征摘要，对所述原始债券标识摘要进行去重处理，生成所述目标债券标识摘要。

在本实施例中，各分布式节点需要基于SM3算法将原始债券特征信息及原始债券标识信息进行处理，得到原始债券特征摘要及原始债券标识摘要；

其中，原始债券特征信息及原始债券标识信息是各分布式节点自己所拥有的数据；例如，原始债券标识信息可以是本地数据库中存储的债券代码、债券名称或债券编号；原始债券特征信息可以是原始债券对应的属性信息，例如债券发行人的净资产收益率、债券的市场隐含评级、持有该债券的基金家数等信息。

SM3密码杂凑算法一种密码散列函数标准，适用于商用密码应用中的数字签名和验证，是在SHA-256基础上改进实现的一种算法，其安全性和SHA-256相当。

基于SM3算法将原始债券特征信息及原始债券标识信息进行处理，得到原始债券特征摘要及原始债券标识摘要的具体流程如下：

1、初始化：定义8个32bit长的容器或者寄存器V[8]，初始值赋值为对一个IV值；

2、数据填充：首先将比特“1”添加到原始债券特征信息及原始债券标识信息的末尾，再添加若干个比特“0”，使填充后的原始债券特征信息及原始债券标识信息的比特长度为512的倍数，便于进行数据分组压缩；

3、迭代压缩：针对分组大小为64字节的数据进行迭代压缩，使用异或、循环左移等操作进行数据计算，最终将分组计算后的值填入寄存器，获得原始债券特征摘要及原始债券标识摘要。

在获得原始债券特征摘要及原始债券标识摘要之后，需要将原始债券特征摘要及原始债券标识摘要上传至节点设备；

相应地，联邦学习中心服务器对节点设备中的原始债券特征摘要进行排序处理，生成目标债券特征摘要；对原始债券标识摘要进行去重处理，生成目标债券标识摘要。

也就是说，联邦学习中心服务器从节点设备中取得各分布式节点上传的原始债券特征摘要以及原始债券标识摘要之后，需要对原始债券标识摘要进行去重处理，将重复的原始债券标识摘要发送至各分布式节点将其从训练样本集中移除；

然后联邦学习中心服务器按照预设排序规则对原始债券特征摘要进行排序，生成排序后的目标债券特征摘要；

各分布式节点基于目标债券标识摘要以及排序后的目标债券特征摘要能够知晓训练样本集中目标债券对应的特征信息的排序顺序，以便于对训练样本集进行数据填充。

在上述实施方式中，通过基于SM3算法将原始债券特征信息及原始债券标识信息进行处理，使各节点设备无需将真实数据上传至区块链，仅需将原始债券特征摘要及原始债券标识摘要上传至节点设备，实现对各分布式节点本地数据具备较高的保护能力；联邦学习中心服务器对节点设备中的原始债券特征摘要进行排序处理，生成目标债券特征摘要，对原始债券标识摘要进行去重处理，生成目标债券标识摘要，各分布式节点根据目标债券特征摘要以及目标债券标识摘要能够确定出对模型训练性能较高的训练样本集，利用该训练样本集对第一初始违约风险检测模型进行训练，能够提高违约风险检测模型的性能。

可选地，在所述得到第一目标违约风险检测模型之后，在各分布式节点提供新增数据的情况下，还可以对各新增数据进行增量学习，以保证违约风险检测模型可以实时更新以获得更好的性能，避免大量原始数据存储和重新训练模型造成存储和计算资源的浪费；对新增数据进行增量学习，具体可以通过以下步骤[a]-步骤[c]实现：

步骤[a]、在所述训练样本集更新的情况下，从所述节点设备中获取所述第一目标违约风险检测模型对应的目标模型参数，所述目标模型参数是所述联邦学习中心服务器基于所述第一目标违约风险检测模型确定并上传至所述节点设备中的；

步骤[b]、基于所述目标模型参数生成第二初始违约风险检测模型；

步骤[c]、基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习，直至达到训练停止条件，生成第二目标违约风险检测模型。

在本实施例中，在得到第一目标违约风险检测模型之后，联邦学习中心服务器会将第一目标违约风险检测模型对应的目标模型参数上传至区块链中的节点设备进行存储；其中，目标模型参数例如包括第一目标违约风险检测模型的模型参数、目标债券特征摘要、目标债券标识摘要、时间信息、各分布式节点对应的参与方信息。

在对训练样本集进行更新的情况下(即在原始训练样本集基础上新增债券特征信息及债券标识信息)，各分布式节点会从区块链的节点设备中获取第一目标违约风险检测模型对应的目标模型参数，将目标模型参数作为针对新增数据(即新增的债券特征信息及债券标识信息)进行增量学习的原始参数。

也就是说，将目标模型参数作为原始参数，并生成第二初始违约风险检测模型，然后各分布式节点基于更新训练样本集对第二初始违约风险检测模型进行增量学习，直至达到训练停止条件，生成第二目标违约风险检测模型。

需要说明的是，各分布式节点基于更新训练样本集对第二初始违约风险检测模型进行增量学习的过程与各分布式节点基于训练样本集对第一初始违约风险检测模型进行迭代训练的过程相同，具体流程如下：

步骤1、各分布式节点基于SM3算法将新增的债券特征信息及债券标识信息进行处理，得到新增债券特征摘要及新增债券标识摘要；将新增债券特征摘要及新增债券标识摘要上传至区块链的节点设备。

步骤2、联邦学习中心服务器对节点设备中的新增债券特征摘要进行排序处理，对新增债券标识摘要进行去重处理。

步骤3、基于排序后的新增债券特征摘要以及去重后的新增债券标识摘要，生成更新训练样本集；基于更新训练样本集对第二初始违约风险检测模型进行迭代训练。

步骤4、在对第二初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各模型参数进行加密处理；将加密后的模型参数上传至区块链中的节点设备。

步骤5、联邦学习中心服务器基于属性基加密算法对节点设备中加密后的各模型参数进行解密处理，得到各第二初始违约风险检测模型对应的模型参数；对各模型参数进行加权聚合处理，生成聚合模型参数，并下发至各分布式节点。

步骤6、各分布式节点利用聚合模型参数对第二初始违约风险检测模型进行更新，直至达到训练停止条件，得到第二目标违约风险检测模型。

在上述实施方式中，在得到第一目标违约风险检测模型之后，在各分布式节点提供新增数据的情况下，对各新增数据进行增量学习，保证违约风险检测模型可以实时更新以获得更好的性能，避免了大量原始数据存储和重新训练模型造成存储和计算资源的浪费。

图3是本发明提供的违约风险检测模型的训练方法的流程示意图之二，参见图3所示，该方法包括步骤301-步骤303，其中：

步骤301、将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集，基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息。

在本实施例中，首先联邦学习中心服务器会将目标债券特征摘要及目标债券标识摘要发送至各分布式节点

各分布式节点在接收到目标债券特征摘要及目标债券标识摘要之后，需要基于目标债券特征摘要及目标债券标识摘要，确定训练样本集，并基于训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练；其中，训练样本集包括各目标待检测债券对应的特征信息及标识信息。

步骤302、从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各所述模型参数进行加权聚合处理生成聚合模型参数，各所述模型参数是各所述分布式节点上传至所述节点设备的。

在本实施例中，各分布式节点将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备；然后联邦学习中心服务器会从区块链中的节点设备获取各模型参数，并将各模型参数进行加权聚合处理生成聚合模型参数。

步骤303、将所述聚合模型参数发送至各所述分布式节点，以使各所述分布式节点对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

在本实施例中，联邦学习中心服务器生成聚合模型参数之后，将聚合模型参数发送至各分布式节点；

各分布式节点利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

本发明提供的违约风险检测模型的训练方法，联邦学习中心服务器通过将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，以使各分布式节点确定出各自的训练样本集，利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，利用区块链去中心化及防篡改的特点，确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改，对恶意数据具备事后分析查验能力；联邦学习中心服务器从区块链中的节点设备获取第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各模型参数进行加权聚合处理生成聚合模型参数并发送至各分布式节点，各分布式节点利用聚合模型参数对第一初始违约风险检测模型进行更新，充分的融合了各分布式节点的数据信息，能够得到性能更好的第一目标违约风险检测模型，同时在对第一初始违约风险检测模型进行迭代训练的过程中，各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息)，避免了用户数据发生泄露的风险。

可选地，在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前，联邦学习中心服务器还需要生成目标债券特征摘要及目标债券标识摘要，具体可以通过以下步骤[1]-步骤[3]实现：

步骤[1]、从所述节点设备获取各所述分布式节点上传的原始债券特征摘要及原始债券标识摘要，所述原始债券特征摘要及原始债券标识摘要是各所述分布式节点基于SM3算法将原始债券特征信息及原始债券标识信息进行处理得到的；

步骤[2]、对所述原始债券特征摘要进行排序处理，生成所述目标债券特征摘要；

步骤[3]、对所述原始债券标识摘要进行去重处理，生成所述目标债券标识摘要。

可选地，所述将各所述模型参数进行加权聚合处理生成聚合模型参数，具体可以通过以下步骤[a]-步骤[b]实现：

步骤[a]、基于属性基加密算法对加密后的各模型参数进行解密处理，得到各所述模型参数，所述加密后的各模型参数是各所述节点设备在对所述第一初始违约风险检测模型每一次迭代训练的过程中，基于属性基加密算法对各所述模型参数进行加密处理后得到的；

步骤[b]、将各所述模型参数进行加权聚合处理生成聚合模型参数。

可选地，在所述将所述聚合模型参数发送至各所述分布式节点之后，在各分布式节点提供新增数据的情况下，还可以使各分布式节点对各新增数据进行增量学习，以保证违约风险检测模型可以实时更新以获得更好的性能，避免大量原始数据存储和重新训练模型造成存储和计算资源的浪费，具体可以通过以下步骤a)-步骤b)实现：

步骤a)、将所述第一目标违约风险检测模型对应的目标模型参数上传至所述节点设备进行存储；

步骤b)、在所述训练样本集更新的情况下，将存储于所述节点设备中的所述目标模型参数发送至各所述分布式节点，以使各所述分布式节点根据所述目标模型参数生成第二初始违约风险检测模型，基于更新训练样本集对所述第二初始违约风险检测模型进行增量学习，直至达到训练停止条件，生成第二目标违约风险检测模型。

下面对本发明提供的违约风险检测模型的训练装置进行描述，下文描述的违约风险检测模型的训练装置与上文描述的违约风险检测模型的训练方法可相互对应参照。图4是本发明提供的违约风险检测模型的训练装置的结构示意图之一，如图4所示，该违约风险检测模型的训练装置包括：确定模块401、训练模块402、更新模块403，其中：

确定模块401，用于基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

训练模块402，用于基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；

更新模块403，用于利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

本发明提供的违约风险检测模型的训练装置，通过联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，各分布式节点确定出各自的训练样本集，利用训练样本集对部署在各分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，利用区块链去中心化及防篡改的特点，确保训练样本集数据原文不出本地的同时实现计算过程可追溯防篡改，对恶意数据具备事后分析查验能力；由于聚合模型参数是联邦学习中心服务器将各分布式节点上第一初始违约风险检测模型的模型参数进行加权聚合处理得到的，因此利用联邦学习中心服务器发送的聚合模型参数对第一初始违约风险检测模型进行更新，充分的融合了各分布式节点的数据信息，能够得到性能更好的第一目标违约风险检测模型，同时在对第一初始违约风险检测模型进行迭代训练的过程中，各分布式节点仅相互交换各模型参数而不需要暴露真实的数据原文(即各目标待检测债券对应的特征信息及标识信息)，避免了用户数据发生泄露的风险。

可选地，训练模块402，进一步用于：

将加密后的模型参数上传至所述节点设备。

可选地，确定模块401，进一步用于：

可选地，更新模块403，进一步用于：

基于所述目标模型参数生成第二初始违约风险检测模型；

图5是本发明提供的违约风险检测模型的训练装置的结构示意图之二，如图5所示，该违约风险检测模型的训练装置包括：第一发送模块501、处理模块502、第二发送模块503，其中：

第一发送模块501，用于将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集，基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；

处理模块502，用于从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各所述模型参数进行加权聚合处理生成聚合模型参数，各所述模型参数是各所述分布式节点上传至所述节点设备的；

第二发送模块503，用于将所述聚合模型参数发送至各所述分布式节点，以使各所述分布式节点对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

可选地，第一发送模块501，进一步用于：

可选地，处理模块502，进一步用于：

将各所述模型参数进行加权聚合处理生成聚合模型参数。

可选地，第二发送模块503，进一步用于：

图6是本发明提供的电子设备的结构示意图，如图6所示，该电子设备可以包括：处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640，其中，处理器610，通信接口620，存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令，以执行违约风险检测模型的训练方法，该方法应用于各分布式节点，包括：基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型；

或者，执行违约风险检测模型的训练方法，该方法应用于联邦学习服务器，包括：将目标债券特征摘要及目标债券标识摘要发送至各分布式节点，所述目标债券特征摘要及所述目标债券标识摘要用于各所述分布式节点确定训练样本集，基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；从区块链中的节点设备获取所述第一初始违约风险检测模型在进行每一次迭代训练过程中的各模型参数，将各所述模型参数进行加权聚合处理生成聚合模型参数，各所述模型参数是各所述分布式节点上传至所述节点设备的；将所述聚合模型参数发送至各所述分布式节点，以使各所述分布式节点对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型。

此外，上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的违约风险检测模型的训练方法，该方法应用于各分布式节点，包括：基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的违约风险检测模型的训练方法，该方法应用于各分布式节点，包括：基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集，所述训练样本集包括各目标待检测债券对应的特征信息及标识信息；基于所述训练样本集对部署在各所述分布式节点的第一初始违约风险检测模型进行迭代训练，将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，以使所述联邦学习中心服务器将所述节点设备中的各所述模型参数进行加权聚合处理，生成聚合模型参数；利用所述联邦学习中心服务器发送的所述聚合模型参数对所述第一初始违约风险检测模型进行更新，直至达到训练停止条件，得到第一目标违约风险检测模型；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种违约风险检测模型的训练方法，其特征在于，应用于各分布式节点，包括：

2.根据权利要求1所述的违约风险检测模型的训练方法，其特征在于，所述将每一次迭代训练过程中的各模型参数上传至区块链中的节点设备，包括：

将加密后的模型参数上传至所述节点设备。

3.根据权利要求1所述的违约风险检测模型的训练方法，其特征在于，在所述基于联邦学习中心服务器发送的目标债券特征摘要及目标债券标识摘要，确定训练样本集之前，还包括：

4.根据权利要求1至3任一项所述的违约风险检测模型的训练方法，其特征在于，在所述得到第一目标违约风险检测模型之后，还包括：

基于所述目标模型参数生成第二初始违约风险检测模型；

5.一种违约风险检测模型的训练方法，其特征在于，应用于联邦学习服务器，包括：

6.根据权利要求5所述的违约风险检测模型的训练方法，其特征在于，在所述将目标债券特征摘要及目标债券标识摘要发送至各分布式节点之前，还包括：

7.根据权利要求5所述的违约风险检测模型的训练方法，其特征在于，所述将各所述模型参数进行加权聚合处理生成聚合模型参数，包括：

将各所述模型参数进行加权聚合处理生成聚合模型参数。

8.根据权利要求5至7任一项所述的违约风险检测模型的训练方法，其特征在于，在所述将所述聚合模型参数发送至各所述分布式节点之后，还包括：

9.一种违约风险检测模型的训练装置，其特征在于，应用于各分布式节点，包括：

10.一种违约风险检测模型的训练装置，其特征在于，应用于联邦学习服务器，包括：

11.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至4任一项所述违约风险检测模型的训练方法，或者权利要求5至8任一项所述违约风险检测模型的训练方法。

12.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述违约风险检测模型的训练方法，或者权利要求5至8任一项所述违约风险检测模型的训练方法。