CN115510494A - 一种基于区块链与联邦学习的多方安全数据共享方法 - Google Patents

一种基于区块链与联邦学习的多方安全数据共享方法 Download PDF

Info

Publication number
CN115510494A
CN115510494A CN202211253419.9A CN202211253419A CN115510494A CN 115510494 A CN115510494 A CN 115510494A CN 202211253419 A CN202211253419 A CN 202211253419A CN 115510494 A CN115510494 A CN 115510494A
Authority
CN
China
Prior art keywords
data
model
local
training
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211253419.9A
Other languages
English (en)
Other versions
CN115510494B (zh
Inventor
彭长根
龙洋洋
陈玉玲
谭伟杰
豆慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou University
Original Assignee
Guizhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou University filed Critical Guizhou University
Priority to CN202211253419.9A priority Critical patent/CN115510494B/zh
Publication of CN115510494A publication Critical patent/CN115510494A/zh
Application granted granted Critical
Publication of CN115510494B publication Critical patent/CN115510494B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于区块链与联邦学习的多方安全数据共享方法。该方法实施步骤如下:数据请求者向其附近的超级节点发出一个数据共享请求,一旦附近的超级节点接收到数据共享请求,它会验证请求者的ID,并对区块链进行检索以确认在此之前该请求是否被处理过。在该过程中,由委员会节点验证分布式数据提供者的模型更新并执行共识过程。数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播。最后,系统上传全局模型到区块链,返回结果给任务请求者。数值结果表明,该发明能有效防止工业物联网数据中毒攻击,可以有效降低共识计算量,提高模型更新的隐私保护能力,实现工业物联网数据的多方安全共享。

Description

一种基于区块链与联邦学习的多方安全数据共享方法
技术领域
本发明属于工业物联网领域,具体涉及一种基于区块链与联邦学习的多方安全数据共享方法。
背景技术
工业物联网中的数据具有规模大、实时性高、结构复杂的特点,使得工业物联网的安全性和安全需求得到了前所未有的增长。因此,如何在工业物联网中保护和使用这些有价值的数据,以高效、安全、经济的方式共享成为数据所有者和提供商亟待解决的问题。近年来,随着人工智能的发展,人们开始关注基于机器学习的隐私保护。区块链具有去中心化、不可篡改、开放透明和可追溯性等特性,最近被用于工业物联网的联邦学习,以提供数据完整性和激励,吸引足够的客户数据和计算资源用于模型训练。但工业物联网应用需要系统的、整体的体系结构设计来支持系统的开发以及有效的方法来解决工业物联网设备的多方数据共享中数据异构的挑战,而在多个不受信任方之间进行分布式数据共享则需要新的联邦学习机制。2019年Li等人在论文《Smartpc:Hierarchical pace control in real-time federated learning system》中为分层在线速度的智能PC控制框架提出了联邦学习策略,在节约能源的同时平衡训练时间和模型精度。但在传统的联邦学习中,中央服务器将维护全局机器学习模型,这可能会带来不良的安全问题。2022年Feng等人在论文《Blockchain-empowered decentralized horizontal federated learning for 5g-enabled UAVs》针对5G无人机提出了一种区块链授权的分散跨域联邦学习框架,并利用同态加密和多方计算抵御对本地更新的攻击。
作为解决计算和存储资源受限问题的一种方法,区块链在分布式场景中协同使用数据有广泛的应用。但分布式多方数据共享在工业物联网中的应用也仍然面临着一些挑战:一是现有工作通常针对中央服务器或协作者的攻击威胁,而忽略了不诚实协作者破坏联合建模过程所造成的模型质量问题;二是数据提供者在分布式多方数据共享过程中对数据隐私泄露的担忧,导致数据提供者共享数据的意愿持续下降。
综上所述,虽然研究人员们取得了最新的进展和研究成果,但联邦学习中存在的一些分布式安全和效率漏洞,例如共识代价和中毒攻击,这些都还有待改进。通过提供基于区块链的安全模型共享和具有多重隐私保护的联邦学习,在解决分布式安全和效率漏洞问题上会有一定的帮助。
发明内容
本发明的目的是提出一种基于区块链与联邦学习的多方安全数据共享方法,以解决上述技术问题。
为实现上述目的,本发明提供了如下方案:
一种基于区块链与联邦学习的多方安全数据共享方法,该方法包括构建基于区块链与联邦学习的多方安全数据共享模型,该模型可分为两个阶段:数据共享阶段、共识阶段。
(1)数据共享阶段
采用该方法进行一次数据共享的步骤分为:数据共享任务初始化、数据检索、本地模型训练、全局模型聚合、结果反馈;具体过程如下:
(1.1)数据共享任务初始化
任务发起者r向其附近的超级节点SNreq发出一个数据共享请求Req={r1,r2,...,rn},并支付一定数量的代币。请求包含r的ID,数据类别和时间戳,r使用私钥SKr的数字签名。
(1.2)数据检索
一旦附近的节点SN接收到数据共享请求,它会验证请求者r的ID,并对区块链进行检索以确认在此之前该请求是否被处理过。如果有记录,将从区块链下载模型作为请求ri的应答返回。
(1.3)本地模型训练
各相关参与节点分别采用梯度下降法进行模型训练。每个参与者使用它的本地数据集和初始模型参数wini进行本地模型训练。在t轮迭代中,每个参与节点pi∈P通过计算局部梯度下降
Figure BDA0003888880060000021
根据wi(t-1)在其本地数据Di上训练一个本地数据模型wi(t),如下式所示:
Figure BDA0003888880060000031
其中,γ为分布式梯度下降的学习率。
然后pi将训练好的模型参数wi(t)发送给其他参与者,并上传到区块链进行进一步的验证和聚合。
(1.4)全局模型聚合
一旦接收到模型参数wi(t),pi+1将根据wi(t)使用其本地数据Di+1训练一个新的本地数据模型wi(t+1),并向其他参与者广播wi(t+1)。数据模型在参与者之间进行迭代训练。最后,将参与节点的本地模型wi(t)进行加权,得到全局模型w(t),如下式所示:
Figure BDA0003888880060000032
其中,N为节点数量,Ci为节点i在t轮迭代中对整个训练过程的贡献。
(1.5)结果反馈
数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播。所有记录收集成区块,由收集节点进行加密和签名。经过多次迭代训练,得到了请求任务对应的全局数据模型w(t)。系统根据每个参与者的贡献度,将任务请求者支付的代币作为奖励分配给参与模型训练的数据持有者,这可以激励下次数据持有者积极参与请求任务的模型训练。最后,系统上传并存储全局模型w(t)到区块链,返回结果w(t)给任务请求者。
(2)共识阶段
采用该方法达成一次有效共识的步骤分为:委员会节点及领导选择、本地模型训练、模型更新验证;具体过程如下:
(2.1)委员会节点及领导选择
共识过程是由选定的委员会根据模型训练的质量来选举的。委员会节点是所有参与者节点的一个子集,负责驱动整个共识过程并对请求的数据模型进行学习。准确率最高的委员会节点将作为领导者,汇总这些本地更新,并将汇总结果发送给其他委员会节点进行验证,其余的委员会节点则作为当前共识过程的跟随者。
(2.2)本地模型训练
各参与节点pi协作训练由数据共享任务请求者发布的初始化全局模型wini,并迭代生成他们自己的本地模型更新wi。然后,各参与节点将其的本地模型更新wi和数字签名上传到委员会。交易表示FL过程中更新的本地模型wi(t)的参数,可以记录为ENC(ski(tm),pki)。由于大多数节点是诚实的,并希望其自身的交易能在短期内得到验证,我们为每个交易生成一个权重,以提高共识效率,该权重由发行节点计算。交易的权重W(wi(t))与模型训练的准确性和交易发起节点投入的计算资源成正比,其计算公式是
Figure BDA0003888880060000041
其中|di|是参与者pi用于本地训练的数据大小,
Figure BDA0003888880060000042
是参与者pi用于本地聚合本地模型的累积数据大小,ρ∈[0,1)是一个小的控制因子。si是车辆参与者pi在其本地训练中执行的时间,Acc(wi(t))是交易发起节点pi提供的准确度,可以定义为
Figure BDA0003888880060000043
其中Fi(w)是参与参与者pi协同训练任务发布者发布的初始化模型参数。
为了确保交易权重的可靠性,我们根据交易本身的权重和其他M笔交易根据验证的准确性估计的权重之和,定义交易的累积权重CW(wi(t))为
Figure BDA0003888880060000051
其中W(j)是第j笔交易验证wi(t)的权重,Accj是第j笔交易的发起节点计算的wi(t)的准确度。
(2.3)模型更新验证
在收到本地模型更新后,委员会节点pj首先选择累计权重较高的交易进行验证。而后pj将通过验证发送者的数字签名来验证其合法性,并使用其本地数据集评估本地模型更新的质量。需要注意的是,由于大多数参与节点是诚实的,并且希望他们的交易在短期内得到验证,委员会成员更有可能选择累计权重高的交易进行验证。
委员会节点pj凭借其自身的数据集,只有训练精度高于给定阈值σ的本地模型更新的交易才会被接受并发送给当前共识过程的领导者,阈值σ是由数据共享任务请求者根据实际应用要求确定。经过t轮的本地训练和聚合,领导者搜集符合条件的本地模型更新,并进行全局聚合。然后,所有的全局模型w(t)会被领导者打包成一个区块
Figure BDA0003888880060000052
并进行数字签名,区块Bk将被广播给其他跟随者进行验证。注意,Hk是区块Bk的区块头。当跟随者收到Bk时,会验证领导者的数字签名、交易数据、以及所有交易的签名。
本发明的有益效果:本发明提出了一种基于区块链的联合学习方法,用于工业物联网中的多方安全数据共享;本发明通过共享数据模型而不是原始数据,将数据共享问题转化为机器学习问题,使工业物联网终端设备以高效、安全、经济的方式共享其有价值的数据;此外,通过本发明中基于训练质量的共识机制,可以有效降低共识过程的计算量,减少恶意攻击,以及提高多方数据共享过程的准确性和效率。
附图说明
图1为本发明的机制架构图;
图2为本发明的工作流程图;
图3为本发明的基于区块链的联邦学习的共识过程图;
具体实施方式
下面将结合附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的架构由区块链模块和分布式客户端组成,如图1所示。区块链由配备了计算和存储资源的实体维护,称为超级节点,可以是边缘计算中的边缘服务器,蜂窝网络中的基站等。出于隐私的考虑和存储的限制,本方法只使用区块链来检索相关数据和管理数据的可访问性,而不记录原始数据。区块链模块中有两种类型的事务:检索事务和数据共享事务。此外,区块链记录了所有数据的共享事件,可以跟踪数据的使用情况,以便进一步审计。客户端可以是机构、智能手机或个人电脑,每个客户端都持有一个本地数据集。客户端可以在自己本地的数据集上训练一个共同的模型,并通过有线或无线连接将他们的本地更新上传到委员会节点。
本发明的工作流程图如图2所示,当任务发起者向其附近的超级节点SN发出一个数据共享请求Req时,其中Fx={f1,f2,...,fx}。SN首先搜索区块链,确认之前是否处理过请求Req。如果区块链中有记录,则将请求转发到缓存节点,然后该节点将缓存结果作为结果发送给请求者。否则,对于一个新的数据共享请求,执行任务相关方检索过程,根据注册记录选择参与节点。选定的参与节点一起学习联邦数据模型M。一旦训练好模型,数据请求者r使用Req={f1,f2,...,fx}作为模型M的输入,得到对应的共享结果M(Req)。数据模型M可以接受查询集Fx中的任何查询fx,并为查询提供结果M(fx)。
具体步骤如下:
(1)数据共享阶段
采用该方法进行一次数据共享的步骤分为:数据共享任务初始化、数据检索、本地模型训练、全局模型聚合、结果反馈;具体过程如下:
(1.1)数据共享任务初始化
任务发起者r向其附近的超级节点SNreq发出一个数据共享请求Req={r1,r2,...,rn},并支付一定数量的代币。请求包含r的ID,数据类别和时间戳,r使用私钥SKr的数字签名。
(1.2)数据检索
一旦附近的节点SN接收到数据共享请求,它会验证请求者r的ID,并对区块链进行检索以确认在此之前该请求是否被处理过。如果有记录,将从区块链下载模型作为请求ri的应答返回。
(1.3)本地模型训练
各相关参与节点采用分布梯度下降法进行模型训练。每个参与者使用它的本地数据集和初始模型参数wini进行本地模型训练。在t轮迭代中,每个参与节点pi∈P通过计算局部梯度下降
Figure BDA0003888880060000071
根据wi(t-1)在其本地数据Di上训练一个本地数据模型wi(t),如下式所示:
Figure BDA0003888880060000072
其中,γ为分布式梯度下降的学习率。
然后pi将训练好的模型参数wi(t)发送给其他参与者,并上传到区块链进行进一步的验证和聚合。
(1.4)全局模型聚合
一旦接收到模型参数wi(t),pi+1将根据wi(t)使用其本地数据Di+1训练一个新的本地数据模型wi(t+1),并向其他参与者广播wi(t+1)。数据模型在参与者之间进行迭代训练。最后,将参与节点的本地模型wi(t)进行加权,得到全局模型w(t),如下式所示:
Figure BDA0003888880060000081
其中,N为节点数量,Ci为节点i在t轮迭代中对整个训练过程的贡献。
(1.5)结果反馈
数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播。所有记录收集成区块,由收集节点进行加密和签名。经过多次迭代训练,得到了请求任务对应的全局数据模型w(t)。系统根据每个参与者的贡献度,将任务请求者支付的代币作为奖励分配给参与模型训练的数据持有者,这可以激励下次数据持有者积极参与请求任务的模型训练。最后,系统上传并存储全局模型w(t)到区块链,返回结果w(t)给任务请求者。
(2)共识阶段
如何将附加质量验证所带来的资源成本降至最低,是验证方案所关注的主要问题。通过在多方数据共享场景中使用所提出的基于质量的共识协议,本方法将质量验证过程与联邦学习的更新过程结合起来。
在本方法中有N个代表,其中恶意代表的最大数量为G。为了确保区块链的安全性,假设N>3G+1是令人满意的,领导者在每一轮共识结束时更换。详细的共识过程如图3所示。采用该方法达成一次有效共识的步骤分为:委员会节点及领导选择、本地模型训练、模型更新验证;具体过程如下:
(2.1)委员会节点及领导选择
共识过程是由选定的委员会根据模型训练的质量来选举的。委员会节点是所有参与者节点的一个子集,负责驱动整个共识过程并对请求的数据模型进行学习。准确率最高的委员会节点将作为领导者,汇总这些本地更新,并将汇总结果发送给其他委员会节点进行验证,其余的委员会节点则作为当前共识过程的跟随者。
(2.2)本地模型训练
各参与节点pi协作训练由数据共享任务请求者发布的初始化全局模型wini,并迭代生成他们自己的本地模型更新wi。然后,各参与节点将其的本地模型更新wi和数字签名上传到委员会。交易表示FL过程中更新的本地模型wi(t)的参数,可以记录为ENC(ski(tm),pki)。由于大多数节点是诚实的,并希望其自身的交易能在短期内得到验证,我们为每个交易生成一个权重,以提高共识效率,该权重由发行节点计算。交易的权重W(wi(t))与模型训练的准确性和交易发起节点投入的计算资源成正比,其计算公式是
Figure BDA0003888880060000091
其中di是参与者pi用于本地训练的数据大小,
Figure BDA0003888880060000092
是参与者pi用于本地聚合本地模型的累积数据大小,ρ∈[0,1)是一个小的控制因子。si是车辆参与者pi在其本地训练中执行的时间,Acc(wi(t))是交易发起节点pi提供的准确度,可以定义为
Figure BDA0003888880060000093
其中Fi(w)是参与参与者pi协同训练任务发布者发布的初始化模型参数。
为了确保交易权重的可靠性,我们根据交易本身的权重和其他M笔交易根据验证的准确性估计的声誉之和,定义交易的累积权重CW(wi(t))为
Figure BDA0003888880060000094
其中W(j)是第j笔交易验证wi(t)的权重,Accj是第j笔交易的发起节点计算的wi(t)的准确度。
(2.3)模型更新验证
在收到本地模型更新后,委员会节点pj首先选择累计权重较高的交易进行验证。而后pj将通过验证发送者的数字签名来验证其合法性,并使用其本地数据集评估本地模型更新的质量。需要注意的是,由于大多数参与节点是诚实的,并且希望他们的交易在短期内得到验证,委员会成员更有可能选择累计权重高的交易进行验证。
委员会节点pj凭借其自身的数据集,只有训练精度高于给定阈值σ的本地模型更新的交易才会被接受并发送给当前共识过程的领导者,阈值σ是由数据共享任务请求者根据实际应用要求确定。经过t轮的本地训练和聚合,领导者搜集符合条件的本地模型更新,并进行全局聚合。然后,所有的全局模型w(t)会被领导者打包成一个区块
Figure BDA0003888880060000101
并进行数字签名,区块Bk将被广播给其他跟随者进行验证。注意,Hk是区块Bk的区块头。当跟随者收到Bk时,会验证领导者的数字签名、交易数据、以及所有交易的签名。
综上所述:本发明的基于区块链的联邦学习方法适用于工业物联网中的多方数据共享。该方法通过共享数据模型而不是原始数据,将数据共享问题转化为机器学习问题,使工业物联网终端设备以高效、安全、经济的方式共享其有价值的数据。通过本发明中基于训练质量的共识协议,可以有效减少共识计算量,减少恶意参与节点的模型中毒、恶意服务器的隐私泄露等恶意攻击。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (9)

1.一种基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述方法包括构建基于区块链与联邦学习的多方安全数据共享模型,该模型分为两个阶段:数据共享阶段和共识阶段;该方法包括如下步骤:数据请求者向其附近的超级节点发出一个数据共享请求,一旦附近的超级节点接收到数据共享请求,它会验证请求者的ID,并对区块链进行检索以确认在此之前该请求是否被处理过;如果有记录,将从区块链下载模型作为请求的应答返回;若无,则选择各相关参与节点采用分布梯度下降法进行模型训练;在该过程中,由委员会节点验证分布式数据提供者的模型更新并执行共识过程;数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播;最后,系统上传全局模型到区块链,返回结果给任务请求者。
2.根据权利要求1所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,在数据共享阶段中,进行一次数据共享的步骤分为:数据共享任务初始化、数据检索、本地模型训练、全局模型聚合、结果反馈;其中,所述数据共享任务初始化包括:任务发起者r向其附近的超级节点SNreq发出一个数据共享请求Req={r1,r2,...,rn},并支付一定数量的代币;请求包含r的ID,数据类别和时间戳,r使用私钥SKr的数字签名。
3.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述数据检索包括:附近的节点SN接收到数据共享请求,它会验证请求者r的ID,并对区块链进行检索以确认在此之前该请求是否被处理过;如果有记录,将从区块链下载模型作为请求ri的应答返回。
4.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述本地模型训练包括:各相关参与节点分别采用梯度下降法进行模型训练;每个参与者使用它的本地数据集和初始模型参数wini进行本地模型训练;在t轮迭代中,每个参与节点pi∈P通过计算局部梯度下降
Figure FDA0003888880050000023
根据wi(t-1)在其本地数据Di上训练一个本地数据模型wi(t),如下式所示:
Figure FDA0003888880050000021
其中,γ为分布式梯度下降的学习率;
然后pi将训练好的模型参数wi(t)发送给其他参与者,并上传到区块链进行进一步的验证和聚合。
5.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述全局模型聚合包括:一旦接收到模型参数wi(t),pi+1将根据wi(t)使用其本地数据Di+1训练一个新的本地数据模型wi(t+1),并向其他参与者广播wi(t+1);数据模型在参与者之间进行迭代训练;最后,将参与节点的本地模型wi(t)进行加权,得到全局模型w(t),如下式所示:
Figure FDA0003888880050000022
其中,N为节点数量,Ci为节点i在t轮迭代中对整个训练过程的贡献。
6.根据权利要求2所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述结果反馈包括:数据请求者和数据提供者之间的数据共享事件以事务的形式生成,并在区块链中广播;所有记录收集成区块,由收集节点进行加密和签名;经过多次迭代训练,得到了请求任务对应的全局数据模型w(t);系统根据每个参与者的贡献度,将任务请求者支付的代币作为奖励分配给参与模型训练的数据持有者,以激励下次数据持有者积极参与请求任务的模型训练;最后,系统上传并存储全局模型w(t)到区块链,返回结果w(t)给任务请求者。
7.根据权利要求1所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,在共识阶段中,采用该方法达成一次有效共识的步骤分为:委员会节点及领导选择、本地模型训练、模型更新验证;其中,所述委员会节点及领导选择包括:共识过程是由选定的委员会根据模型训练的质量来选举的;委员会节点是所有参与者节点的一个子集,负责驱动整个共识过程并对请求的数据模型进行学习;准确率最高的委员会节点将作为领导者,汇总这些本地更新,并将汇总结果发送给其他委员会节点进行验证,其余的委员会节点则作为当前共识过程的跟随者。
8.根据权利要求7所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述本地模型训练包括:各参与节点pi协作训练由数据共享任务请求者发布的初始化全局模型wini,并迭代生成他们自己的本地模型更新wi;然后,各参与节点将其的本地模型更新wi和数字签名上传到委员会;交易表示FL过程中更新的本地模型wi(t)的参数,可以记录为ENC(ski(tm),pki);为每个交易生成一个权重,以提高共识效率,该权重由发行节点计算;交易的权重W(wi(t))与模型训练的准确性和交易发起节点投入的计算资源成正比,其计算公式是:
Figure FDA0003888880050000031
其中|di|是参与者pi用于本地训练的数据大小,
Figure FDA0003888880050000032
是参与者pi用于本地聚合本地模型的累积数据大小,ρ∈[0,1)是一个小的控制因子;si是车辆参与者pi在其本地训练中执行的时间,Acc(wi(t))是交易发起节点pi提供的准确度,可以定义为:
Figure FDA0003888880050000033
其中Fi(w)是参与参与者pi协同训练任务发布者发布的初始化模型参数;
根据交易本身的权重和其他M笔交易根据验证的准确性估计的权重之和,定义交易的累积权重CW(wi(t))为:
Figure FDA0003888880050000034
其中W(j)是第j笔交易验证wi(t)的权重,Accj是第j笔交易的发起节点计算的wi(t)的准确度。
9.根据权利要求7所述的基于区块链与联邦学习的多方安全数据共享方法,其特征在于,所述模型更新验证包括:在收到本地模型更新后,委员会节点pj首先选择累计权重较高的交易进行验证;而后pj将通过验证发送者的数字签名来验证其合法性,并使用其本地数据集评估本地模型更新的质量;委员会节点pj凭借其自身的数据集,只有训练精度高于给定阈值σ的本地模型更新的交易才会被接受并发送给当前共识过程的领导者,阈值σ是由数据共享任务请求者根据实际应用要求确定;经过t轮的本地训练和聚合,领导者搜集符合条件的本地模型更新,并进行全局聚合;然后,所有的全局模型w(t)会被领导者打包成一个区块
Figure FDA0003888880050000041
并进行数字签名,区块Bk将被广播给其他跟随者进行验证;当跟随者收到Bk时,会验证领导者的数字签名、交易数据、以及所有交易的签名。
CN202211253419.9A 2022-10-13 2022-10-13 一种基于区块链与联邦学习的多方安全数据共享方法 Active CN115510494B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211253419.9A CN115510494B (zh) 2022-10-13 2022-10-13 一种基于区块链与联邦学习的多方安全数据共享方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211253419.9A CN115510494B (zh) 2022-10-13 2022-10-13 一种基于区块链与联邦学习的多方安全数据共享方法

Publications (2)

Publication Number Publication Date
CN115510494A true CN115510494A (zh) 2022-12-23
CN115510494B CN115510494B (zh) 2023-11-21

Family

ID=84509410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211253419.9A Active CN115510494B (zh) 2022-10-13 2022-10-13 一种基于区块链与联邦学习的多方安全数据共享方法

Country Status (1)

Country Link
CN (1) CN115510494B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795518A (zh) * 2023-02-03 2023-03-14 西华大学 一种基于区块链的联邦学习隐私保护方法
CN116029370A (zh) * 2023-03-17 2023-04-28 杭州海康威视数字技术股份有限公司 基于区块链的联邦学习的数据共享激励方法、装置及设备
CN116384514A (zh) * 2023-06-01 2023-07-04 南方科技大学 可信分布式服务器集群的联邦学习方法、系统及存储介质
CN116451277A (zh) * 2023-06-16 2023-07-18 中用科技有限公司 一种基于共享情况下工业数据安全的保护系统及方法
CN116723192A (zh) * 2023-08-10 2023-09-08 苏州海加网络科技股份有限公司 一种基于联邦学习的分布式共识系统及其运行方法
CN116860707A (zh) * 2023-06-13 2023-10-10 北京科技大学 基于区块链的材料基因工程大数据安全共享方法及系统
CN117472866A (zh) * 2023-12-27 2024-01-30 齐鲁工业大学(山东省科学院) 一种区块链监管与激励下的联邦学习数据共享方法
CN117955748A (zh) * 2024-03-26 2024-04-30 中电工业互联网有限公司 基于隐私计算的数据资产化处理方法、系统、设备及介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111901309A (zh) * 2020-07-03 2020-11-06 北京邮电大学 一种数据安全共享方法、系统及装置
US20200394552A1 (en) * 2019-06-12 2020-12-17 International Business Machines Corporation Aggregated maching learning verification for database
US20210160068A1 (en) * 2018-12-14 2021-05-27 Advanced New Technologies Co., Ltd. Data sharing method, apparatus, and system, and electronic device
US20210174257A1 (en) * 2019-12-04 2021-06-10 Cerebri AI Inc. Federated machine-Learning platform leveraging engineered features based on statistical tests
CN113570065A (zh) * 2021-07-08 2021-10-29 国网河北省电力有限公司信息通信分公司 基于联盟链和联邦学习的数据管理方法、装置及设备
CN114297722A (zh) * 2022-03-09 2022-04-08 广东工业大学 一种基于区块链的隐私保护异步联邦共享方法及系统
CN114417398A (zh) * 2021-12-16 2022-04-29 福建师范大学 一种基于区块链和联邦学习的数据共享方法
CN114492739A (zh) * 2022-01-04 2022-05-13 北京邮电大学 基于车联网的联邦学习方法、路边单元、车辆节点和基站
US20220255764A1 (en) * 2021-02-06 2022-08-11 SoterOne, Inc. Federated learning platform and machine learning framework
CN115102763A (zh) * 2022-06-22 2022-09-23 北京交通大学 基于可信联邦学习多域DDoS攻击检测方法与装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210160068A1 (en) * 2018-12-14 2021-05-27 Advanced New Technologies Co., Ltd. Data sharing method, apparatus, and system, and electronic device
US20200394552A1 (en) * 2019-06-12 2020-12-17 International Business Machines Corporation Aggregated maching learning verification for database
US20210174257A1 (en) * 2019-12-04 2021-06-10 Cerebri AI Inc. Federated machine-Learning platform leveraging engineered features based on statistical tests
CN111901309A (zh) * 2020-07-03 2020-11-06 北京邮电大学 一种数据安全共享方法、系统及装置
US20220255764A1 (en) * 2021-02-06 2022-08-11 SoterOne, Inc. Federated learning platform and machine learning framework
CN113570065A (zh) * 2021-07-08 2021-10-29 国网河北省电力有限公司信息通信分公司 基于联盟链和联邦学习的数据管理方法、装置及设备
CN114417398A (zh) * 2021-12-16 2022-04-29 福建师范大学 一种基于区块链和联邦学习的数据共享方法
CN114492739A (zh) * 2022-01-04 2022-05-13 北京邮电大学 基于车联网的联邦学习方法、路边单元、车辆节点和基站
CN114297722A (zh) * 2022-03-09 2022-04-08 广东工业大学 一种基于区块链的隐私保护异步联邦共享方法及系统
CN115102763A (zh) * 2022-06-22 2022-09-23 北京交通大学 基于可信联邦学习多域DDoS攻击检测方法与装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘俊旭 等: "机器学习的隐私保护研究综述", 计算机研究与发展, no. 02 *
周俊 等: "联邦学习安全与隐私保护研究综述", 西华大学学报(自然科学版), no. 04 *
周炜 等: "基于区块链的隐私保护去中心化联邦学习模型", 计算机研究与发展, vol. 59, no. 11, pages 2423 - 2436 *
程熙 等: "多尺度的不透水面信息遥感提取方法与应用", 西南交通大学出版社, pages: 63 - 72 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795518B (zh) * 2023-02-03 2023-04-18 西华大学 一种基于区块链的联邦学习隐私保护方法
CN115795518A (zh) * 2023-02-03 2023-03-14 西华大学 一种基于区块链的联邦学习隐私保护方法
CN116029370A (zh) * 2023-03-17 2023-04-28 杭州海康威视数字技术股份有限公司 基于区块链的联邦学习的数据共享激励方法、装置及设备
CN116029370B (zh) * 2023-03-17 2023-07-25 杭州海康威视数字技术股份有限公司 基于区块链的联邦学习的数据共享激励方法、装置及设备
CN116384514B (zh) * 2023-06-01 2023-09-29 南方科技大学 可信分布式服务器集群的联邦学习方法、系统及存储介质
CN116384514A (zh) * 2023-06-01 2023-07-04 南方科技大学 可信分布式服务器集群的联邦学习方法、系统及存储介质
CN116860707A (zh) * 2023-06-13 2023-10-10 北京科技大学 基于区块链的材料基因工程大数据安全共享方法及系统
CN116860707B (zh) * 2023-06-13 2024-02-13 北京科技大学 基于区块链的材料基因工程大数据安全共享方法及系统
CN116451277B (zh) * 2023-06-16 2023-09-29 中用科技有限公司 一种基于共享情况下工业数据安全的保护系统及方法
CN116451277A (zh) * 2023-06-16 2023-07-18 中用科技有限公司 一种基于共享情况下工业数据安全的保护系统及方法
CN116723192A (zh) * 2023-08-10 2023-09-08 苏州海加网络科技股份有限公司 一种基于联邦学习的分布式共识系统及其运行方法
CN116723192B (zh) * 2023-08-10 2023-11-28 苏州海加网络科技股份有限公司 一种基于联邦学习的分布式共识系统及其运行方法
CN117472866A (zh) * 2023-12-27 2024-01-30 齐鲁工业大学(山东省科学院) 一种区块链监管与激励下的联邦学习数据共享方法
CN117472866B (zh) * 2023-12-27 2024-03-19 齐鲁工业大学(山东省科学院) 一种区块链监管与激励下的联邦学习数据共享方法
CN117955748A (zh) * 2024-03-26 2024-04-30 中电工业互联网有限公司 基于隐私计算的数据资产化处理方法、系统、设备及介质

Also Published As

Publication number Publication date
CN115510494B (zh) 2023-11-21

Similar Documents

Publication Publication Date Title
CN115510494B (zh) 一种基于区块链与联邦学习的多方安全数据共享方法
Ma et al. When federated learning meets blockchain: A new distributed learning paradigm
Zhao et al. Privacy-preserving blockchain-based federated learning for IoT devices
Weng et al. Deepchain: Auditable and privacy-preserving deep learning with blockchain-based incentive
Toyoda et al. Mechanism design for an incentive-aware blockchain-enabled federated learning platform
Koteska et al. Blockchain implementation quality challenges: a literature
Nguyen et al. Federated learning meets blockchain in edge computing: Opportunities and challenges
US11694110B2 (en) Aggregated machine learning verification for database
US11940958B2 (en) Artificial intelligence software marketplace
US11562228B2 (en) Efficient verification of machine learning applications
US11734259B2 (en) Anonymous database rating update
CN113794675A (zh) 基于区块链和联邦学习的分布式物联网入侵检测方法及系统
US11983608B2 (en) Efficient verification of machine learning applications
US11057188B2 (en) Database service token
US11849046B2 (en) Freshness visibility in supply-chain
US11568393B2 (en) Methods and systems for transferring unspent transaction output (UTXO) tokens in a blockchain network
US11488099B2 (en) Supply-chain simulation
US11475365B2 (en) Verification of stochastic gradient descent
US20210406876A1 (en) Permissioned eventing in a decentralized database
US20230208638A1 (en) Future asset reclamation via blockchain
Gao et al. BFR‐SE: A Blockchain‐Based Fair and Reliable Searchable Encryption Scheme for IoT with Fine‐Grained Access Control in Cloud Environment
Bai et al. A method to improve the privacy and security for federated learning
US20220278845A1 (en) Honest behavior enforcement via blockchain
CN113889208A (zh) 基于区块链的链上-链下医疗数据共享方法、装置及设备
WO2022216293A1 (en) Processing of machine learning modeling data to improve accuracy of categorization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant