CN111935157A - 一种基于安全防御的联盟学习系统 - Google Patents

一种基于安全防御的联盟学习系统 Download PDF

Info

Publication number
CN111935157A
CN111935157A CN202010808796.9A CN202010808796A CN111935157A CN 111935157 A CN111935157 A CN 111935157A CN 202010808796 A CN202010808796 A CN 202010808796A CN 111935157 A CN111935157 A CN 111935157A
Authority
CN
China
Prior art keywords
alliance
initiator
data
unit
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010808796.9A
Other languages
English (en)
Other versions
CN111935157B (zh
Inventor
陈思恩
廖雅哲
杨紫胜
吴炎泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tech Valley Xiamen Information Technology Co ltd
Original Assignee
Tech Valley Xiamen Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tech Valley Xiamen Information Technology Co ltd filed Critical Tech Valley Xiamen Information Technology Co ltd
Priority to CN202010808796.9A priority Critical patent/CN111935157B/zh
Publication of CN111935157A publication Critical patent/CN111935157A/zh
Application granted granted Critical
Publication of CN111935157B publication Critical patent/CN111935157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/105Multiple levels of security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • H04L63/0442Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply asymmetric encryption, i.e. different keys for encryption and decryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/30Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy
    • H04L9/3006Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy underlying computational problems or public-key parameters
    • H04L9/302Public key, i.e. encryption algorithm being computationally infeasible to invert or user's encryption keys not requiring secrecy underlying computational problems or public-key parameters involving the integer factorization problem, e.g. RSA or quadratic sieve [QS] schemes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于安全防御的联盟学习系统,包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元,联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理,联盟成员角色包括发起方、参与方及协作方,数据集市单元用于数据上架管理、数据查找、授权订阅管理,可视化建模单元用于根据联邦学习任务,实现算法流程的可视化配置,模型训练单元基于算法流程进行模型训练,联盟管理单元包括角色权限配置模块,角色权限配置模块用于配置联盟成员角色的数据共享权限,数据共享权限具体为:协作方获得的数据仅是发起方和参与方的梯度值和损失值,发起方与参与方不获得对方数据的特征值。

Description

一种基于安全防御的联盟学习系统
技术领域
本发明涉及机器学习技术领域,特别涉及一种基于安全防御的联盟学习系统。
背景技术
现代机器学习系统可能容易遭受各种故障,这些故障包括非恶意故障,例如预处理管道中的错误,嘈杂的培训标签,不可靠的客户端以及针对培训和部署管道的显式攻击。联合学习的分布式性质、体系结构设计以及数据约束打开了新的故障模式和攻击面。在联合学习中保护隐私的安全机制可以使检测和纠正这些故障和攻击成为一项特别具有挑战性的任务。
发明内容
为解决上述问题,本发明提供了一种基于安全防御的联盟学习系统。
本发明采用以下技术方案:
一种基于安全防御的联盟学习系统,包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元,所述联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理,所述联盟成员角色包括发起方、参与方及协作方,所述数据集市单元用于数据上架管理、数据查找、授权订阅管理,所述可视化建模单元用于根据联邦学习任务,实现算法流程的可视化配置,所述模型训练单元基于所述算法流程进行模型训练;
所述算法流程的可视化配置具体为:发起方创建训练任务,并选择联盟成员,然后对算法流程进行可视化配置;
所述模型训练具体为:基于所述算法流程提交训练任务,发起方、参与方及协作方分别执行训练任务,彼此之间进行加密通信,所述执行训练任务包括ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合;
所述联盟管理单元包括角色权限配置模块,所述角色权限配置模块用于配置联盟成员角色的数据共享权限,所述数据共享权限具体为:协作方获得的数据仅是发起方和参与方的梯度值和损失值,发起方与参与方不获得对方数据的特征值。
优选地,所述加密通信具体为:在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中,发起方、参与方及协作方之间彼此进行信息交互,信息交互过程中进行非对称同态加密。
优选地,所述非对称同态加密采用RSA加密算法或Paillier加密算法。
优选地,所述非对称同态加密具体为:
协作者将公钥分发给发起者和参与者,用以对训练过程中需要交换的数据进行加密;
发起者和参与者以加密形式交互用于计算梯度值的中间结果;
发起者和参与者分别基于加密的梯度值进行计算,同时参与者根据其标签数据计算损失,并把汇总结果给协作者,协作者通过汇总结果计算总梯度值并利用私钥将其解密;
协作者将解密后的总梯度值分别回传给发起者和参与者,发起者和参与者根据总梯度值更新各自模型的参数。
优选地,所述模型训练单元包括鲁邦优化模块,所述鲁邦优化模块用于减小训练过程的恶意攻击。
优选地,所述鲁邦优化模块采用差分隐私算法来减小恶意攻击。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明通过定义联盟成员角色的数据共享权限,并在数据交互过程中进行非对称同态加密,保护了联盟成员的样本数据的隐私,避免了模型训练过程中的信息泄露;同时通过鲁邦优化的方法,来对抗以恶意手段干扰训练过程,确保了系统的健壮性。
附图说明
图1为本发明的系统框架示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
本发明公开了一种基于安全防御的联盟学习系统,包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元,其中:
联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理,联盟成员角色包括发起方、参与方及协作方。联盟管理单元包括角色权限配置模块,角色权限配置模块用于配置联盟成员角色的数据共享权限,数据共享权限具体为:协作方获得的数据仅是发起方和参与方的梯度值和损失值,发起方与参与方不获得对方数据的特征值。
数据集市单元用于数据上架管理、数据查找、授权订阅管理。
可视化建模单元用于根据联邦学习任务,实现算法流程的可视化配置。算法流程的可视化配置具体为:发起方创建训练任务,并选择联盟成员,然后对算法流程进行可视化配置。
模型训练单元基于算法流程进行模型训练。模型训练具体为:基于算法流程提交训练任务,发起方、参与方及协作方分别执行训练任务,彼此之间进行加密通信,执行训练任务包括ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合。加密通信具体为:在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中,发起方、参与方及协作方之间彼此进行信息交互,信息交互过程中进行非对称同态加密。非对称同态加密采用RSA加密算法或Paillier加密算法。在本实施例中,非对称同态加密具体为:
协作者将公钥分发给发起者和参与者,用以对训练过程中需要交换的数据进行加密;
发起者和参与者以加密形式交互用于计算梯度值的中间结果;
发起者和参与者分别基于加密的梯度值进行计算,同时参与者根据其标签数据计算损失,并把汇总结果给协作者,协作者通过汇总结果计算总梯度值并利用私钥将其解密;
协作者将解密后的总梯度值分别回传给发起者和参与者,发起者和参与者根据总梯度值更新各自模型的参数。
模型训练单元包括鲁邦优化模块,鲁邦优化模块用于减小训练过程的恶意攻击。鲁邦优化模块采用差分隐私算法来减小恶意攻击。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种基于安全防御的联盟学习系统,其特征在于,包括联盟管理单元、数据集市单元、可视化建模单元及模型训练单元,所述联盟管理单元用于配置联盟成员角色、维护联盟成员信息及合作申请验证管理,所述联盟成员角色包括发起方、参与方及协作方,所述数据集市单元用于数据上架管理、数据查找、授权订阅管理,所述可视化建模单元用于根据联邦学习任务,实现算法流程的可视化配置,所述模型训练单元基于所述算法流程进行模型训练;
所述算法流程的可视化配置具体为:发起方创建训练任务,并选择联盟成员,然后对算法流程进行可视化配置;
所述模型训练具体为:基于所述算法流程提交训练任务,发起方、参与方及协作方分别执行训练任务,彼此之间进行加密通信,所述执行训练任务包括ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合;
所述联盟管理单元包括角色权限配置模块,所述角色权限配置模块用于配置联盟成员角色的数据共享权限,所述数据共享权限具体为:协作方获得的数据仅是发起方和参与方的梯度值和损失值,发起方与参与方不获得对方数据的特征值。
2.如权利要求1所述的一种基于安全防御的联盟学习系统,其特征在于,所述加密通信具体为:在ID匹配对齐、特征分箱、模型梯度传递及模型梯度聚合过程中,发起方、参与方及协作方之间彼此进行信息交互,信息交互过程中进行非对称同态加密。
3.如权利要求2所述的一种基于安全防御的联盟学习系统,其特征在于:所述非对称同态加密采用RSA加密算法或Paillier加密算法。
4.如权利要求2所述的一种基于安全防御的联盟学习系统,其特征在于:所述非对称同态加密具体为:
协作者将公钥分发给发起者和参与者,用以对训练过程中需要交换的数据进行加密;
发起者和参与者以加密形式交互用于计算梯度值的中间结果;
发起者和参与者分别基于加密的梯度值进行计算,同时参与者根据其标签数据计算损失,并把汇总结果给协作者,协作者通过汇总结果计算总梯度值并利用私钥将其解密;
协作者将解密后的总梯度值分别回传给发起者和参与者,发起者和参与者根据总梯度值更新各自模型的参数。
5.如权利要求1-4任一项所述的一种基于安全防御的联盟学习系统,其特征在于:所述模型训练单元包括鲁邦优化模块,所述鲁邦优化模块用于减小训练过程的恶意攻击。
6.如权利要求5所述的一种基于安全防御的联盟学习系统,其特征在于:所述鲁邦优化模块采用差分隐私算法来减小恶意攻击。
CN202010808796.9A 2020-08-12 2020-08-12 一种基于安全防御的联盟学习系统 Active CN111935157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010808796.9A CN111935157B (zh) 2020-08-12 2020-08-12 一种基于安全防御的联盟学习系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010808796.9A CN111935157B (zh) 2020-08-12 2020-08-12 一种基于安全防御的联盟学习系统

Publications (2)

Publication Number Publication Date
CN111935157A true CN111935157A (zh) 2020-11-13
CN111935157B CN111935157B (zh) 2022-05-06

Family

ID=73311589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010808796.9A Active CN111935157B (zh) 2020-08-12 2020-08-12 一种基于安全防御的联盟学习系统

Country Status (1)

Country Link
CN (1) CN111935157B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434818A (zh) * 2020-11-19 2021-03-02 脸萌有限公司 模型构建方法、装置、介质及电子设备
CN112651592A (zh) * 2020-11-27 2021-04-13 科技谷(厦门)信息技术有限公司 一种基于多式联运的企业信用评估系统
CN113705825A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 适用于多方使用的数据模型共享方法
CN113704768A (zh) * 2021-08-10 2021-11-26 深圳致星科技有限公司 联邦学习执行流程的安全审计方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109684855A (zh) * 2018-12-17 2019-04-26 电子科技大学 一种基于隐私保护技术的联合深度学习训练方法
CN110363305A (zh) * 2019-07-17 2019-10-22 深圳前海微众银行股份有限公司 联邦学习方法、系统、终端设备及存储介质
US20200193292A1 (en) * 2018-12-04 2020-06-18 Jinan University Auditable privacy protection deep learning platform construction method based on block chain incentive mechanism
CN111445031A (zh) * 2020-03-31 2020-07-24 深圳前海微众银行股份有限公司 一种应对攻击的方法及联邦学习装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200193292A1 (en) * 2018-12-04 2020-06-18 Jinan University Auditable privacy protection deep learning platform construction method based on block chain incentive mechanism
CN109684855A (zh) * 2018-12-17 2019-04-26 电子科技大学 一种基于隐私保护技术的联合深度学习训练方法
CN110363305A (zh) * 2019-07-17 2019-10-22 深圳前海微众银行股份有限公司 联邦学习方法、系统、终端设备及存储介质
CN111445031A (zh) * 2020-03-31 2020-07-24 深圳前海微众银行股份有限公司 一种应对攻击的方法及联邦学习装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434818A (zh) * 2020-11-19 2021-03-02 脸萌有限公司 模型构建方法、装置、介质及电子设备
CN112434818B (zh) * 2020-11-19 2023-09-26 脸萌有限公司 模型构建方法、装置、介质及电子设备
CN112651592A (zh) * 2020-11-27 2021-04-13 科技谷(厦门)信息技术有限公司 一种基于多式联运的企业信用评估系统
CN112651592B (zh) * 2020-11-27 2022-05-06 科技谷(厦门)信息技术有限公司 一种基于多式联运的企业信用评估系统
CN113705825A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 适用于多方使用的数据模型共享方法
CN113704768A (zh) * 2021-08-10 2021-11-26 深圳致星科技有限公司 联邦学习执行流程的安全审计方法、装置及系统

Also Published As

Publication number Publication date
CN111935157B (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN111935157B (zh) 一种基于安全防御的联盟学习系统
Miao et al. Privacy-preserving Byzantine-robust federated learning via blockchain systems
CN112163896B (zh) 一种联邦学习系统
CN111898145B (zh) 一种神经网络模型训练方法、装置、设备及介质
WO2020006302A1 (en) Method and apparatus for obtaining input of secure multiparty computation protocol
CN113609508A (zh) 一种基于区块链的联邦学习方法、装置、设备及存储介质
CN113505894A (zh) 纵向联邦学习线性回归和逻辑回归模型训练方法及装置
Mondal et al. Poster: Flatee: Federated learning across trusted execution environments
CN111666987A (zh) 基于联邦学习的跨域数据安全互联方法及系统
Xu et al. Proof-carrying cloud computation: The case of convex optimization
He et al. Secure logistic regression for vertical federated learning
CN107154916A (zh) 一种认证信息获取方法、提供方法及装置
CN114239862A (zh) 一种保护用户数据隐私的抗拜占庭攻击的联邦学习方法
CN114996762A (zh) 一种基于联邦学习的医疗数据共享与隐私保护方法和系统
CN113420886B (zh) 纵向联邦学习模型的训练方法、装置、设备及存储介质
Chen et al. Verifiable privacy-preserving association rule mining using distributed decryption mechanism on the cloud
CN116502732B (zh) 基于可信执行环境的联邦学习方法以及系统
CN116776970B (zh) 一种联邦学习参数传输方法、聚合服务器及联邦学习系统
Zhu et al. Outsourcing set intersection computation based on bloom filter for privacy preservation in multimedia processing
CN113901500B (zh) 图拓扑嵌入方法、装置、系统、设备及介质
CN114462626B (zh) 联邦模型训练方法、装置、终端设备以及存储介质
CN113472524B (zh) 一种抗恶意传输数据攻击的数据聚合签名系统及方法
Miao et al. RFed: Robustness-Enhanced Privacy-Preserving Federated Learning Against Poisoning Attack
Lee How to formally model features of network security protocols
Li et al. Efficient and traceable data sharing for the Internet of Things in smart cities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant