CN111935157A

CN111935157A - 一种基于安全防御的联盟学习系统

Info

Publication number: CN111935157A
Application number: CN202010808796.9A
Authority: CN
Inventors: 陈思恩; 廖雅哲; 杨紫胜; 吴炎泉
Original assignee: Tech Valley Xiamen Information Technology Co ltd
Current assignee: Tech Valley Xiamen Information Technology Co ltd
Priority date: 2020-08-12
Filing date: 2020-08-12
Publication date: 2020-11-13
Anticipated expiration: 2040-08-12
Also published as: CN111935157B

Abstract

本发明公开了一种基于安全防御的联盟学习系统，包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元，联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理，联盟成员角色包括发起方、参与方及协作方，数据集市单元用于数据上架管理、数据查找、授权订阅管理，可视化建模单元用于根据联邦学习任务，实现算法流程的可视化配置，模型训练单元基于算法流程进行模型训练，联盟管理单元包括角色权限配置模块，角色权限配置模块用于配置联盟成员角色的数据共享权限，数据共享权限具体为：协作方获得的数据仅是发起方和参与方的梯度值和损失值，发起方与参与方不获得对方数据的特征值。

Description

一种基于安全防御的联盟学习系统

技术领域

本发明涉及机器学习技术领域，特别涉及一种基于安全防御的联盟学习系统。

背景技术

现代机器学习系统可能容易遭受各种故障，这些故障包括非恶意故障，例如预处理管道中的错误，嘈杂的培训标签，不可靠的客户端以及针对培训和部署管道的显式攻击。联合学习的分布式性质、体系结构设计以及数据约束打开了新的故障模式和攻击面。在联合学习中保护隐私的安全机制可以使检测和纠正这些故障和攻击成为一项特别具有挑战性的任务。

发明内容

为解决上述问题，本发明提供了一种基于安全防御的联盟学习系统。

本发明采用以下技术方案：

一种基于安全防御的联盟学习系统，包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元，所述联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理，所述联盟成员角色包括发起方、参与方及协作方，所述数据集市单元用于数据上架管理、数据查找、授权订阅管理，所述可视化建模单元用于根据联邦学习任务，实现算法流程的可视化配置，所述模型训练单元基于所述算法流程进行模型训练；

所述算法流程的可视化配置具体为：发起方创建训练任务，并选择联盟成员，然后对算法流程进行可视化配置；

所述模型训练具体为：基于所述算法流程提交训练任务，发起方、参与方及协作方分别执行训练任务，彼此之间进行加密通信，所述执行训练任务包括ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合；

所述联盟管理单元包括角色权限配置模块，所述角色权限配置模块用于配置联盟成员角色的数据共享权限，所述数据共享权限具体为：协作方获得的数据仅是发起方和参与方的梯度值和损失值，发起方与参与方不获得对方数据的特征值。

优选地，所述加密通信具体为：在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中，发起方、参与方及协作方之间彼此进行信息交互，信息交互过程中进行非对称同态加密。

优选地，所述非对称同态加密采用RSA加密算法或Paillier加密算法。

优选地，所述非对称同态加密具体为：

协作者将公钥分发给发起者和参与者，用以对训练过程中需要交换的数据进行加密；

发起者和参与者以加密形式交互用于计算梯度值的中间结果；

发起者和参与者分别基于加密的梯度值进行计算，同时参与者根据其标签数据计算损失，并把汇总结果给协作者，协作者通过汇总结果计算总梯度值并利用私钥将其解密；

协作者将解密后的总梯度值分别回传给发起者和参与者，发起者和参与者根据总梯度值更新各自模型的参数。

优选地，所述模型训练单元包括鲁邦优化模块，所述鲁邦优化模块用于减小训练过程的恶意攻击。

优选地，所述鲁邦优化模块采用差分隐私算法来减小恶意攻击。

采用上述技术方案后，本发明与背景技术相比，具有如下优点：

本发明通过定义联盟成员角色的数据共享权限，并在数据交互过程中进行非对称同态加密，保护了联盟成员的样本数据的隐私，避免了模型训练过程中的信息泄露；同时通过鲁邦优化的方法，来对抗以恶意手段干扰训练过程，确保了系统的健壮性。

附图说明

图1为本发明的系统框架示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例

本发明公开了一种基于安全防御的联盟学习系统，包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元，其中：

联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理，联盟成员角色包括发起方、参与方及协作方。联盟管理单元包括角色权限配置模块，角色权限配置模块用于配置联盟成员角色的数据共享权限，数据共享权限具体为：协作方获得的数据仅是发起方和参与方的梯度值和损失值，发起方与参与方不获得对方数据的特征值。

数据集市单元用于数据上架管理、数据查找、授权订阅管理。

可视化建模单元用于根据联邦学习任务，实现算法流程的可视化配置。算法流程的可视化配置具体为：发起方创建训练任务，并选择联盟成员，然后对算法流程进行可视化配置。

模型训练单元基于算法流程进行模型训练。模型训练具体为：基于算法流程提交训练任务，发起方、参与方及协作方分别执行训练任务，彼此之间进行加密通信，执行训练任务包括ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合。加密通信具体为：在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中，发起方、参与方及协作方之间彼此进行信息交互，信息交互过程中进行非对称同态加密。非对称同态加密采用RSA加密算法或Paillier加密算法。在本实施例中，非对称同态加密具体为：

模型训练单元包括鲁邦优化模块，鲁邦优化模块用于减小训练过程的恶意攻击。鲁邦优化模块采用差分隐私算法来减小恶意攻击。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于安全防御的联盟学习系统，其特征在于，包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元，所述联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理，所述联盟成员角色包括发起方、参与方及协作方，所述数据集市单元用于数据上架管理、数据查找、授权订阅管理，所述可视化建模单元用于根据联邦学习任务，实现算法流程的可视化配置，所述模型训练单元基于所述算法流程进行模型训练；

2.如权利要求1所述的一种基于安全防御的联盟学习系统，其特征在于，所述加密通信具体为：在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中，发起方、参与方及协作方之间彼此进行信息交互，信息交互过程中进行非对称同态加密。

3.如权利要求2所述的一种基于安全防御的联盟学习系统，其特征在于：所述非对称同态加密采用RSA加密算法或Paillier加密算法。

4.如权利要求2所述的一种基于安全防御的联盟学习系统，其特征在于：所述非对称同态加密具体为：

5.如权利要求1-4任一项所述的一种基于安全防御的联盟学习系统，其特征在于：所述模型训练单元包括鲁邦优化模块，所述鲁邦优化模块用于减小训练过程的恶意攻击。

6.如权利要求5所述的一种基于安全防御的联盟学习系统，其特征在于：所述鲁邦优化模块采用差分隐私算法来减小恶意攻击。