CN114491616A - 基于区块链和同态加密的联邦学习方法和应用 - Google Patents

基于区块链和同态加密的联邦学习方法和应用 Download PDF

Info

Publication number
CN114491616A
CN114491616A CN202111512267.5A CN202111512267A CN114491616A CN 114491616 A CN114491616 A CN 114491616A CN 202111512267 A CN202111512267 A CN 202111512267A CN 114491616 A CN114491616 A CN 114491616A
Authority
CN
China
Prior art keywords
model
local
client
block chain
homomorphic encryption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111512267.5A
Other languages
English (en)
Inventor
张延楠
尚璇
张帅
谢逸俊
李伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Qulian Technology Co Ltd
Original Assignee
Hangzhou Qulian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Qulian Technology Co Ltd filed Critical Hangzhou Qulian Technology Co Ltd
Priority to CN202111512267.5A priority Critical patent/CN114491616A/zh
Publication of CN114491616A publication Critical patent/CN114491616A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)

Abstract

本发明公开了一种基于区块链和同态加密的联邦学习方法和应用,包括以下步骤:基于区块链参与联邦学习的客户端进行智能合约注册;客户端利用本地数据训练本地模型,计算本地模型对评价数据的预测标签后将其和本地模型经区块链传至账本客户端;账本客户端基于预测标签对本地模型进行贡献度评价并为本地客户端构建超级节点;对每个超级节点所属的客户端的本地模型进行聚合,每个超级节点对应的聚合模型再经聚合并同态加密后上传至账本客户端;账本客户端对加密的聚合模型进行同态解密后上传至区块链,客户端从区块链下载解密后模型进行下一轮训练。该方法通过对联邦学习的同态加密,保证数据安全,同时提高模型的鲁棒性。

Description

基于区块链和同态加密的联邦学习方法和应用
技术领域
本发明属于联邦学习及数据安全领域,具体涉及一种基于区块链和同态加密的联邦学习方法和应用。
背景技术
为了解决数据孤岛问题,联邦学习作为一种极具潜力的解决方案应运而生,其主要创新性在于提供了一种具有隐私保护特性的分布式机器学习框架,并且能够以分布式的方式协同数以千计的参与者针对某个特定机器学习模型进行迭代训练。联邦学习的目标是在保证数据隐私安全及合法合规的基础上,实现共同建模,提升AI模型的效果。这就允许客户在本地独立计算他们的模型更新,同时保持基本的隐私级别。
尽管联邦学习在学习过程中交换的是本地训练出来的模型,但是模型的训练来源于数据集的喂入。特别是,本地数据较少的情况下,提交的模型中会含有大量的用户信息,并且研究者发现,服务器端利用模型更新的梯度可以对训练数据做到反推的效果,这一事实突出了联邦学习过程的不安全性。但是根本原因是联邦学习并没有针对恶意服务器的加密策略,严重影响联邦学习的安全性,造成严重的安全隐患。
此外,联邦学习也面临其他安全风险。参与方所提供的参数缺乏相应的质量验证机制:恶意的参与用户可能会提供虚假的模型参数来破坏学习过程。如果这些虚假参数未经验证便聚合到整体模型中,会直接影响整体模型的质量,甚至会导致整个联邦学习过程失效。因此,工业界也在寻找一种可以对模型训练参与者进行有效评价的机制来使得模型训练的过程更加公平合理,减少对模型提升较小的以及恶意模型参数的上传。
同态加密是很久以前密码学界就提出来的一个问题。同态加密是基于数学难题的计算复杂性理论的密码学技术。对经过同态加密的数据进行处理得到一个输出,将这一输出进行解密,其结果与用同一方法处理未加密的原始数据得到的输出结果是一样的。同态加密分为半同态加密:只支持加法或乘法中的一种运算。其中,只支持加法运算的又叫加法同态加密;全同态加密:支持任意次的加法和乘法运算。模型在进行同态加密后,数据和模型本身不会进行传输,因此在数据层面上不存在泄露的可能,也不违反更严格的数据保护法案如GDPR等。目前联邦学习通用的同态加密算法为Paillier同态加密,使用的是加法半同态加密,联邦学习的客户端之间通过对模型或者梯度更新进行加密操作后交换,最后达到模型训练的效果。
区块链是比特币的底层技术,通过一种无第三方以及去中心化的上链技术,被应用于解决各类数据安全储存和信任问题。联邦学习通过集成区块链能够以一种去中心化、安全、高度抗中断和可审计的方式记录联邦学习模型以及模型更新,为系统框架提供可问责性和不可否认性。
发明内容
鉴于上述,本发明的目的在于提供一种基于区块链和同态加密的联邦学习方法,通过对联邦学习的同态加密,保证数据安全,同时提高模型的鲁棒性。
为实现上述第一发明目的,实施例提供了一种基于区块链和同态加密的联邦学习方法,包括以下步骤:
步骤1,初始化管理账本的客户端为账本客户端,基于区块链参与联邦学习的客户端进行智能合约注册;
步骤2,客户端利用本地数据训练本地模型,计算本地模型对评价数据的预测标签后,将预测标签和本地模型经区块链传至账本客户端;
步骤3,账本客户端基于预测标签对本地模型进行贡献度评价,依据贡献度评价结果为本地客户端构建超级节点;
步骤4,对每个超级节点所属的客户端的本地模型进行聚合,每个超级节点对应的聚合模型再经聚合并同态加密后,经区块链传至账本客户端;
步骤5,账本客户端对加密的聚合模型进行同态解密后上传至区块链,客户端从区块链下载解密后模型进行下一轮训练。
在一个实施例中,智能合约注册包括数据的初始化和模型的初始化,其中,在在进行模型初始化时,账本客户端生成公钥Pk和私钥Sk。
在一个实施例中,账本客户端从区块中下载当前轮次的本地模型和预测标签后,基于预测标签对本地模型进行贡献度评价,包括:
Figure BDA0003398320680000031
其中,
Figure BDA0003398320680000032
为本地模型的贡献度,Cor[·]为预测标签
Figure BDA0003398320680000033
与实际标签Tt+1的正确率,正确率越高,表示贡献度越高。
在一个实施例中,账本客户端依据贡献度评价结果为本地客户端构建超级节点,包括:将所有本地模型按照贡献度进行排序,然后均分到Q个超级节点时,按照贡献度大小依次选择K/Q个客户端的本地模型划分到1个超级节点。
在一个实施例中,对每个超级节点所属的客户端的本地模型进行聚合时,依据每个本地模型的POW值进行聚合,得到的聚合模型
Figure BDA0003398320680000034
为:
Figure BDA0003398320680000041
其中,Qs表示第s个超级节点包含的本地模型的个数,n为本地模型和客户端的索引,
Figure BDA0003398320680000042
表示第t训练时第n个本地模型,
Figure BDA0003398320680000043
表示本地模型
Figure BDA0003398320680000044
的POW值,也就是贡献度值,
Figure BDA0003398320680000045
表示第s个超级节点的聚合模型。
在一个实施例中,每个超级节点对应的聚合模型再经过聚合得到的最终聚合模型Lt为:
Figure BDA0003398320680000046
其中,
Figure BDA0003398320680000047
表示第s个超级节点的POW值,Q表示超级节点的个数;
利用公钥Pk对最终聚合模型Lt进行同态加密处理后上传至区块,其中,同态加密后的最终聚合模型Et=En[Lt]Pk,En[·]Pk表示同态加密操作。
在一个实施例中,第s个超级节点的
Figure BDA00033983206800000410
通过以下方式计算得到:
Figure BDA0003398320680000048
其中,
Figure BDA0003398320680000049
表示t轮次时第s个超级节点的累计POW值,是多次POW值的累计和,将当前时刻的本地模型的贡献度作为当前轮次的POW值。
在一个实施例中,账本客户端从区块下载加密后的最终聚合模型,然后利用私钥Sk同态解密以得到解密后模型Gt=De[Et]Sk,其中,De[·]Sk表示同态解密操作。解密后模型存储在区块中,客户端从区块中下载解密后模型进行下一轮训练。
本发明的另一目的在于提供一种应用在金融领域的贷款违约预测模型的构建方法,属于金融领域,通过联邦学习构建贷款违约预测模型时,作为客户端的银行之间利用本地贷款相关数据进行数据分析,做到数据的使用权与所有权分离,达到保护数据的目的。其次,银行之间在进行联合建模时,在模型训练阶段以及模型预测,可以利用评分机制来提升模型训练的质量。
为实现上述另一发明目的,实施例提供了一种应用在金融领域的贷款违约预测模型的构建方法,所述贷款违约预测模型用于用户的贷款违约预测,通过上述基于区块链和同态加密的联邦学习方法构建得到,即客户端为银行,拥有的本地数据为贷款相关数据,基于该贷款相关数据,构建的聚合模型为所述贷款违约预测模型;
应用时,用户的贷款相关数据输入至贷款违约预测模型,经计算输出贷款违约预测结果。
本发明的技术构思为:联邦学习在解决数据孤岛问题的同时,中心化程度比较明显,容易收到来自服务器端的攻击。基于此种情况,首先利用区块链的去中心化操作来防止恶意客户端的出现,同时可以利用同态加密机制,对模型进行进一步的加密,防止上传的本地模型泄露训练数据集的隐私,利用同态加密和区块链的双重机制实现联邦学习的安全性保证。其次利用账户客户端来进行模型的功能验证,账户客户端首先构建出通用的评价数据,在各个客户端训练结束后,利用评价数据来对模型进行评价,并根据评价结果来产生超级节点和PoW的值。最后根据PoW的值来进行账本的去中心化,将训练完成的模型作为聚合模型进行下次更新。
实施例提供的基于区块链和同态加密的联邦学习方法和应用,具有的有益效果包括:
利用同态加密来对客户端模型进行加密以解决明文的联邦学习的安全性较差的问题。同时,为了优化通信效率,采用区块链的超级节点机制来处理客户端之间的通信。并且可以利用区块链的奖励机制来提升用户的积极性,提升联邦模型的训练质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是实施例提供的基于区块链和同态加密的联邦学习方法的流程图;
图2是实施例提供的基于区块链和同态加密的联邦学习方法的示意框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
实施例提供了一种基于区块链和同态加密的联邦学习方法,具体通过引入区块链技术的去中心化特点,可以使聚合模型的中心化程度降低,减轻潜在的因设备故障而导致的全局模型的性能下降风险。此外,利用区块链技术的记账功能,引入一套信任机制,通过分发同态加密的公钥私钥来对账本持有者进行模型加密,防止其获得用户隐私,同时通过区块链的超级节点机制来对模型进行聚合,减小通信量,并建立评分机制来激励参与方上传高质量参数,提高自己的信用度,提高聚合模型的训练质量,增强使用者对聚合模型的信任度。该方法可以应用到构建贷款违约预测模型中,在该应用中,通过基于区块链和同态加密的联邦学习方法构建的聚合模型为贷款违约预测模型。
图1是实施例提供的基于区块链和同态加密的联邦学习方法的流程图;图2是实施例提供的基于区块链和同态加密的联邦学习方法的示意框图。如图1和图2所示,实施例提供的基于区块链和同态加密的联邦学习方法,包括以下步骤:
步骤1,初始化管理账本的客户端为账本客户端,基于区块链参与联邦学习的客户端进行智能合约注册。
实施例中,联邦学习任务为多个银行或证券机构作为客户端通过联邦学习构建用于贷款违约预测的贷款违约预测模型,每个客户端用于贷款相关数据作为本地数据。参与联邦学习的客户端与区块链的矿工通信连接,该矿工将客户端上传的数据再上传至区块进行保存。当然客户端也可以直接与区块通信,上传数据至区块,不经过矿工。
首先从所有客户端中初始化管理账本的客户端为账本客户端。智能合约注册由初始的账本客户端主导完成。其中,智能合约注册包括数据的初始化和模型的初始化。当客户端的数据不够用时,可以进行数据初始化,即可以使用Lending Club发布的LOAN数据集,Lending Club可以通过预测判断贷款人是否会违约,从而决定是否向申请人发放贷款。实施例中将LOAN数据集按照客户端的设备数分成M份。
在进行模型初始化时,账本客户端CP生成公钥Pk和私钥Sk,设定整体训练轮次E、本地数据D、评价数据ED、评价标签Tt+1、参与联邦学习的整体设备数M、每轮参与训练的总客户端数为Mt以及模型结构,其中,评价数据ED和评价标签Tt+1由账本客户端CP生成并将评价数据ED分给本地客户端,用于模型评估。在构建贷款违约预测模型时,模型结构可以为深度神经网络、逻辑回归模型以及决策树模型。
步骤2,客户端利用本地数据训练本地模型,计算本地模型对评价数据的预测标签后,将预测标签和本地模型经区块链传至账本客户端。
在第t轮联邦学习时,参与联邦学习的第k个本地客户端Ck利用本地数据Dk进行本地模型训练,生成本地模型
Figure BDA00033983206800000814
基于本地模型
Figure BDA0003398320680000081
计算得到的t+1轮的模型参数为:
Figure BDA0003398320680000082
其中,(x,y)分别是本地数据集Dk的数据和标签,
Figure BDA0003398320680000083
表示数据x输入至本地模型
Figure BDA0003398320680000084
得到的预测值与标签y的交叉熵损失函数,
Figure BDA0003398320680000085
Figure BDA0003398320680000086
表示第t轮和第t+1轮的模型权重参数。
在得到模型权重参数
Figure BDA0003398320680000087
后,利用模型权重参数
Figure BDA0003398320680000088
对应的本地模型
Figure BDA0003398320680000089
对评价数据集ED进行预测,得到预测标签
Figure BDA00033983206800000810
连同本地模型上传值区块,账本客户端度区块具有账本管理权,从区块下载当前轮次的本地模型和预测标签。
步骤3,账本客户端基于预测标签对本地模型进行贡献度评价,并依据贡献度评价结果为本地客户端构建超级节点。
实施例中,账本客户端从区块中下载当前轮次的本地模型和预测标签,后,基于预测标签对本地模型进行贡献度评价,包括:
Figure BDA00033983206800000811
其中,
Figure BDA00033983206800000812
为本地模型的贡献度,Cor[·]为预测标签
Figure BDA00033983206800000813
与实际标签Tt+1的正确率,正确率越高,表示贡献度越高。
在每轮联邦学习中,根据每个客户端的贡献度决定下轮账本保管权,即根据客户端的贡献度选择一个客户端作为下轮的账本客户端。
账本客户端依据贡献度评价结果为本地客户端构建超级节点,包括:
按照贡献度将不同客户端的本地模型进行联接,划分到Q个超级节点,则组成一个超级节点至少需要K/Q个本地客户端,具体划分过程为:将所有本地模型按照贡献度进行排序,然后均分到Q个超级节点时,按照贡献度大小依次选择K/Q个客户端的本地模型划分到1个超级节点,假设有12个本地客户端,要换分到3个超级节点中,则对于按照贡献度排序的12个本地客户端,则将排序靠前的4个本地客户端划分到1个超级节点,排序靠后的4个本地客户端划分到另1个超级节点,剩下中间的4个本地客户端划分到剩下1个超级节点。
实施例中,每个超级节点的工作量证明(POW值)由超级节点中贡献度最低的本地模型的PoW值决定,即:
Figure BDA0003398320680000091
其中,
Figure BDA0003398320680000092
表示t轮次时第s个超级节点的累计POW值,是多次POW值的累计和,将当前时刻的本地模型的贡献度作为当前轮次的POW值,并且贡献度越高,当前轮次获得的POW值收益越高。
步骤4,对每个超级节点所属的客户端的本地模型进行聚合,每个超级节点对应的聚合模型再经聚合并同态加密后,经区块链传至账本客户端。
实施例中,对每个超级节点所属的客户端的本地模型进行聚合时,依据每个本地模型的POW值进行聚合,得到的聚合模型
Figure BDA0003398320680000093
为:
Figure BDA0003398320680000094
其中,Qs表示第s个超级节点包含的本地模型的个数,n为本地模型和客户端的索引,
Figure BDA0003398320680000095
表示第t训练时第n个本地模型,
Figure BDA0003398320680000096
表示本地模型
Figure BDA0003398320680000097
的POW值,也就是贡献度值,
Figure BDA0003398320680000098
表示第s个超级节点的聚合模型。
实施例中,每个超级节点对应的聚合模型再经过聚合得到的最终聚合模型Lt为:
Figure BDA0003398320680000101
其中,
Figure BDA0003398320680000102
表示第s个超级节点的POW值,Q表示超级节点的个数;
利用公钥Pk对最终聚合模型Lt进行同态加密处理后上传至区块,其中,同态加密后的最终聚合模型Et=En[Lt]Pk,En[·]Pk表示同态加密操作;
步骤5,账本客户端对加密的聚合模型进行同态解密后上传至区块链,客户端从区块链下载解密后模型进行下一轮训练。
账本客户端从区块下载加密后的最终聚合模型,然后利用私钥Sk同态解密以得到解密后模型Gt=De[Et]Sk,其中,De[·]Sk表示同态解密操作。解密后模型存储在区块中,客户端从区块中下载解密后模型进行下一轮训练。
重复循环步骤2-步骤5,直到训练结束,得到的最终聚合模型作为贷款违约预测模型用于贷款违约预测。
上述一种基于区块链和同态加密的联邦学习方法,利用联邦学习和区块链两者的优点,解决客户端的数据孤岛问题,同时由于区块链的账本非更改模式降低了安全风险。在联邦学习中加入了区块链中的奖励机制,来提升客户端的积极性,提高聚合模型的训练质量,最终可以提升聚合模型的鲁棒性,在进行贷款违约预测时,提升预测准确度。
上述一种基于区块链和同态加密的联邦学习方法,利用同态加密对聚合模型进行加密,聚合模型只要出本地,就会被加密,可以防止在联邦学习的任意阶段泄露模型数据,进一步保证了客户端数据的安全性。并且采用超级节点后,利用贡献度机制将多个本地模型聚类在一起,多个本地模型进行联邦平均算法后无法还原出单个客户端的训练数据,保证了银行的贷款相关数据的安全。
上述一种基于区块链和同态加密的联邦学习方法,从去中心化账本的角度来看,每个加入到区块链都要保存一份完整的账本。区块链通过竞争记账方式解决去中心化的账本一致性问题。竞争记账是过程,而不证明竞争结果。采用工作量证明的机制来实现竞争结果判定,实现了去中心化,进一步保证了数据安全。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于区块链和同态加密的联邦学习方法,其特征在于,包括以下步骤:
步骤1,初始化管理账本的客户端为账本客户端,基于区块链参与联邦学习的客户端进行智能合约注册;
步骤2,客户端利用本地数据训练本地模型,计算本地模型对评价数据的预测标签后,将预测标签和本地模型经区块链传至账本客户端;
步骤3,账本客户端基于预测标签对本地模型进行贡献度评价,依据贡献度评价结果为本地客户端构建超级节点;
步骤4,对每个超级节点所属的客户端的本地模型进行聚合,每个超级节点对应的聚合模型再经聚合并同态加密后,经区块链传至账本客户端;
步骤5,账本客户端对加密的聚合模型进行同态解密后上传至区块链,客户端从区块链下载解密后模型进行下一轮训练。
2.根据权利要求1所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤1中,智能合约注册包括数据的初始化和模型的初始化,其中,在在进行模型初始化时,账本客户端生成公钥Pk和私钥Sk。
3.根据权利要求1所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤3中,账本客户端从区块中下载当前轮次的本地模型和预测标签,后,基于预测标签对本地模型进行贡献度评价,包括:
Figure FDA0003398320670000011
其中,
Figure FDA0003398320670000012
为本地模型的贡献度,Cor[·]为预测标签
Figure FDA0003398320670000013
与实际标签Tt+1的正确率,正确率越高,表示贡献度越高。
4.根据权利要求1所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤3中,账本客户端依据贡献度评价结果为本地客户端构建超级节点,包括:将所有本地模型按照贡献度进行排序,然后均分到Q个超级节点时,按照贡献度大小依次选择K/Q个客户端的本地模型划分到1个超级节点。
5.根据权利要求1所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤4中,对每个超级节点所属的客户端的本地模型进行聚合时,依据每个本地模型的POW值进行聚合,得到的聚合模型
Figure FDA0003398320670000021
为:
Figure FDA0003398320670000022
其中,Qs表示第s个超级节点包含的本地模型的个数,n为本地模型和客户端的索引,
Figure FDA0003398320670000023
表示第t训练时第n个本地模型,
Figure FDA0003398320670000024
表示本地模型
Figure FDA0003398320670000025
的POW值,也就是贡献度值,
Figure FDA0003398320670000026
表示第s个超级节点的聚合模型。
6.根据权利要求1所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤4中,每个超级节点对应的聚合模型再经过聚合得到的最终聚合模型Lt为:
Figure FDA0003398320670000027
其中,
Figure FDA0003398320670000028
表示第s个超级节点的POW值,Q表示超级节点的个数;
利用公钥Pk对最终聚合模型Lt进行同态加密处理后上传至区块,其中,同态加密后的最终聚合模型Et=En[Lt]Pk,En[·]Pk表示同态加密操作。
7.根据权利要求6所述的基于区块链和同态加密的联邦学习方法,其特征在于,第s个超级节点的
Figure FDA0003398320670000029
通过以下方式计算得到:
Figure FDA00033983206700000210
其中,
Figure FDA0003398320670000031
表示t轮次时第s个超级节点的累计POW值,是多次POW值的累计和,将当前时刻的本地模型的贡献度作为当前轮次的POW值。
8.根据权利要求6所述的基于区块链和同态加密的联邦学习方法,其特征在于,步骤5中,账本客户端从区块下载加密后的最终聚合模型,然后利用私钥Sk同态解密以得到解密后模型Gt=De[Et]Sk,其中,De[·]Sk表示同态解密操作。解密后模型存储在区块中,客户端从区块中下载解密后模型进行下一轮训练。
9.一种应用在金融领域的贷款违约预测模型的构建方法,其特征在于,所述贷款违约预测模型用于用户的贷款违约预测,通过权利要求1-8任一项所述的基于区块链和同态加密的联邦学习方法构建得到,即客户端为银行,拥有的本地数据为贷款相关数据,基于该贷款相关数据,构建的聚合模型为所述贷款违约预测模型;
应用时,用户的贷款相关数据输入至贷款违约预测模型,经计算输出贷款违约预测结果。
CN202111512267.5A 2021-12-08 2021-12-08 基于区块链和同态加密的联邦学习方法和应用 Pending CN114491616A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111512267.5A CN114491616A (zh) 2021-12-08 2021-12-08 基于区块链和同态加密的联邦学习方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111512267.5A CN114491616A (zh) 2021-12-08 2021-12-08 基于区块链和同态加密的联邦学习方法和应用

Publications (1)

Publication Number Publication Date
CN114491616A true CN114491616A (zh) 2022-05-13

Family

ID=81491855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111512267.5A Pending CN114491616A (zh) 2021-12-08 2021-12-08 基于区块链和同态加密的联邦学习方法和应用

Country Status (1)

Country Link
CN (1) CN114491616A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114692098A (zh) * 2022-06-01 2022-07-01 中国海洋大学 基于区块链和联邦学习的软件行为智能管控方法
CN115795518A (zh) * 2023-02-03 2023-03-14 西华大学 一种基于区块链的联邦学习隐私保护方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114692098A (zh) * 2022-06-01 2022-07-01 中国海洋大学 基于区块链和联邦学习的软件行为智能管控方法
CN115795518A (zh) * 2023-02-03 2023-03-14 西华大学 一种基于区块链的联邦学习隐私保护方法
CN115795518B (zh) * 2023-02-03 2023-04-18 西华大学 一种基于区块链的联邦学习隐私保护方法

Similar Documents

Publication Publication Date Title
CN110490738A (zh) 一种混合联邦学习方法及架构
CN112733967B (zh) 联邦学习的模型训练方法、装置、设备及存储介质
Kaur et al. Scalability in blockchain: Challenges and solutions
CN112257873A (zh) 机器学习模型的训练方法、装置、系统、设备及存储介质
CN112770291B (zh) 基于联邦学习和信任评估的分布式入侵检测方法及系统
CN112862011A (zh) 基于联邦学习的模型训练方法、装置及联邦学习系统
CN109493062B (zh) 一种基于信誉权益证明的区块链共识方法
CN110084377A (zh) 用于构建决策树的方法和装置
CN114491616A (zh) 基于区块链和同态加密的联邦学习方法和应用
CN112039702B (zh) 基于联邦学习和相互学习的模型参数训练方法及装置
CN108712409B (zh) 一种基于私有区块链的电子账单交易系统
Asfia et al. Energy trading of electric vehicles using blockchain and smart contracts
CN113515760A (zh) 横向联邦学习方法、装置、计算机设备和存储介质
CN115549888A (zh) 一种基于区块链与同态加密的联邦学习隐私保护方法
CN114626547A (zh) 一种基于区块链的群组协同学习方法
CN113065143A (zh) 基于区块链的工业数据安全共享
CN111553795A (zh) 一种不同区块链系统信息多路调度方法
CN114971421B (zh) 一种基于区块链技术的水电站运行风险管控系统
CN114491615A (zh) 基于区块链的异步纵向联邦学习公平激励机制方法
CN113360514A (zh) 联合更新模型的方法、装置及系统
CN116627970A (zh) 一种基于区块链和联邦学习的数据共享方法及装置
CN116595094A (zh) 基于区块链的联邦学习激励方法、装置、设备和存储介质
CN114760023A (zh) 基于联邦学习的模型训练方法、装置及存储介质
CN110838069A (zh) 数据处理方法、装置以及系统
Sun et al. Fed-DFE: A Decentralized Function Encryption-Based Privacy-Preserving Scheme for Federated Learning.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination