CN114048515B - 一种基于联邦学习和区块链的医疗大数据共享方法 - Google Patents

一种基于联邦学习和区块链的医疗大数据共享方法 Download PDF

Info

Publication number
CN114048515B
CN114048515B CN202210026561.3A CN202210026561A CN114048515B CN 114048515 B CN114048515 B CN 114048515B CN 202210026561 A CN202210026561 A CN 202210026561A CN 114048515 B CN114048515 B CN 114048515B
Authority
CN
China
Prior art keywords
data
calculation
node
nodes
intelligent contract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210026561.3A
Other languages
English (en)
Other versions
CN114048515A (zh
Inventor
匡亚岚
曾筱茜
何得淮
应志野
陈一龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
West China Hospital of Sichuan University
Original Assignee
Sichuan University
West China Hospital of Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University, West China Hospital of Sichuan University filed Critical Sichuan University
Priority to CN202210026561.3A priority Critical patent/CN114048515B/zh
Publication of CN114048515A publication Critical patent/CN114048515A/zh
Application granted granted Critical
Publication of CN114048515B publication Critical patent/CN114048515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种基于联邦学习和区块链的医疗大数据共享方法,具体流程为:数据使用方根据节点信任度选择节点,申请数据,并向智能合约缴纳使用费用;数据提供方收到申请并同意后,将自己的算力和数据样本大小公布上链;数据使用方发送模型和收敛条件到智能合约;数据提供方下载模型,当所有节点准备好,开始联邦学习,同时智能合约开始超时计算;……;智能合约进行聚合计算并判断是否收敛;智能合约更新每个节点的信任值,并根据贡献值发放酬劳。本发明提出的节点信任度评价机制,对本次训练的贡献度高的节点激励更多,增加节点“作恶”的“成本”,可以解决联邦学习中节点不可信问题,提高联邦学习的准确性,实现医疗大数据安全且高质量的共享。

Description

一种基于联邦学习和区块链的医疗大数据共享方法
技术领域
本发明涉及区块链技术领域,具体涉及一种基于联邦学习和区块链的医疗大数据共享方法。
背景技术
现代生物医学研究中只有大量的多方、多源大数据才能支持研究模型预测的高适用性和高准确性。然而目前的生物医疗数据和个人隐私息息相关,如何合理地保护个人敏感信息,在隐私信息不被泄露前提下又能有效地进行生物医疗数据分享、联合分析以及多元医疗数据融合,是当前医学信息领域重点研究课题之一。
联邦学习这一技术的出现能有效帮助多个医疗机构在满足隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模,使原始数据在无需归集与共享的情况下,实现多节点间的协同计算和数据隐私保护。然而联邦学习面临如下挑战:(1)多个参与方互信问题:由于联邦学习的数据来自不同的组织或机构,彼此间缺乏信任,需要在多方不信任的基础上协作运算;(2)安全风险:参与方提供的数据质量问题,数据背书问题,都可能影响整个机器学习任务模型的质量,进而影响联邦学习的结果保证;(3)通信链路的可靠性:多方学习的数据在传输过程中被攻击或篡改都会影响最终联邦学习的结果;(4)中心节点的安全性:联邦学习很大程度依赖于中心节点的调度,若中心节点遭到攻击,会导致整个联邦计算宕机。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,具有去中心化、不可篡改、全程留痕、可以追溯、集体维护、公开透明等特点,解决信息不对称问题,实现多个主体之间的协作信任与一致行动。
中国发明专利申请CN111698322A公开一种基于区块链和联邦学习的医疗数据安全共享方法,数据申请方经数据提供方的链上授权后方可使用数据,数据指纹则将授权的数据进行哈希摘要上链,防止被授权的数据被恶意篡改,以造成数据不一致问题,整个流程中共享的是原数据的使用权,数据使用方无法直接获取数据,仅能通过联邦学习来挖掘数据的价值。联邦学习每轮迭代计算中,模型参数和聚合结果也将进行资产上链,可实现联邦学习计算的可信溯源。数据共享流程中每一步操作都将由监管方进行相关的审计,比如身份审查、数据核对、交易细节审计等。本发明不需要借助中央服务器来进行聚合计算,实现去中心化联邦学习,通过智能合约实现聚合计算,避免中央服务器被恶意操控而导致各节点接收到恶意的聚合计算结果。
中国发明专利申请CN111931242A公开了一种数据共享方法以及应用其的计算机设备及可读存储介质,结合区块链技术和联邦学习技术,构建基于区块链和联邦学习的数据安全共享模型,设计数据共享基本流程;以实现可靠的联邦学习为目标,设计基于区块链和节点工作质量的工作节点选择算法;修改区块链的共识方法,设计一种基于模型训练质量的激励机制共识算法,已达到鼓励优秀工作节点工作和简化共识过程,减少共识成本的目的;以平衡数据安全性和模型实用性为目标,选择适用于联邦学习的差分隐私算法。本发明能够解决数据共享过程中隐私泄露的问题;将区块链技术结合到数据共享中,保障数据的安全可信;同时将提高联邦学习任务的效率。
上述发明都基于联邦学习和区块链提出一种数据安全共享的方法,一方面,由于联邦学习的参与方设备异构,现有技术缺乏对不同设备的运算能力差异考虑,另一方面联邦学习更关注隐私和安全,假设参与方和服务器都是可信的,未充分考虑节点的行为,在进行激励计算时,只考虑节点的积极行为,未对节点的“恶意”行为进行“惩罚”,也未结合节点的历史表现对节点的声誉进行客观的评价;且不能防止恶意的数据使用行为。
发明内容
为解决上述现有技术中存在的不足,本发明提供一种基于联邦学习和区块链的医疗大数据共享方法,基于联邦学习和区块链,提出一种节点信任度评价机制,解决联邦学习中节点不可信问题,提高联邦学习的准确性,解决医疗大数据的孤岛性,实现医疗大数据安全且高质量的共享。
为实现上述技术目的,本发明采用的技术方案为:
一种基于联邦学习和区块链的医疗大数据共享方法,具体流程为:
S1、数据使用方根据节点信任度选择合适的节点,向提供方申请数据,并向智能合约缴纳使用费用;
S2、数据提供方收到申请并同意后,将自己的算力和数据样本大小公布上链;
S3、数据使用方发送模型和收敛条件到智能合约;
S4、数据提供方下载模型,当所有节点准备好,开始联邦学习,同时智能合约开始超时计算;
S5、各节点将中间结果加密发送到智能合约,智能合约记录每个节点的时间,并对中间结果进行评价,结果上链;
S6、智能合约在收到所有节点发送的中间结果后,做聚合计算并判断是否收敛,若收敛则计算停止,若不收敛,则更新模型,重复步骤4,直到结果收敛;
S7、计算停止,智能合约更新每个节点的信任值,并根据贡献值,发放酬劳。
进一步地,在步骤S1中,所述节点信任度包括静态信任值、动态信任值、历史信任值,并用式(1)计算:
Figure 823584DEST_PATH_IMAGE001
(1)
其中
Figure 350380DEST_PATH_IMAGE002
表示节点
Figure 347155DEST_PATH_IMAGE003
的信任度,
Figure 809361DEST_PATH_IMAGE004
表示节点
Figure 626007DEST_PATH_IMAGE003
的静态信任值,
Figure 956494DEST_PATH_IMAGE005
表示节点
Figure 73355DEST_PATH_IMAGE003
的动态信任值,
Figure 440882DEST_PATH_IMAGE006
表示节点
Figure 275983DEST_PATH_IMAGE003
的历史信任值,
Figure 144582DEST_PATH_IMAGE007
Figure 991315DEST_PATH_IMAGE008
Figure 917027DEST_PATH_IMAGE009
分别为其权重,
Figure 849211DEST_PATH_IMAGE010
进一步地,在步骤S7中,以
Figure 521501DEST_PATH_IMAGE011
值作为本次联邦计算节点
Figure 347374DEST_PATH_IMAGE003
的贡献值发放酬劳。
进一步地,所述静态信任值表现在节点提供的算力、数据量以及数据质量,计算方法如式(2):
Figure 587863DEST_PATH_IMAGE012
(2)
其中
Figure 866397DEST_PATH_IMAGE013
表示节点
Figure 217744DEST_PATH_IMAGE003
提供的算力,
Figure 898124DEST_PATH_IMAGE014
是其权重;
Figure 434148DEST_PATH_IMAGE015
表示本次计算节点
Figure 340924DEST_PATH_IMAGE003
提供的数据量大小,
Figure 620596DEST_PATH_IMAGE016
是其权重;
Figure 30848DEST_PATH_IMAGE017
表示节点
Figure 737773DEST_PATH_IMAGE003
的数据质量,
Figure 993830DEST_PATH_IMAGE018
是其权重。
进一步地,所述节点的数据质量
Figure 686979DEST_PATH_IMAGE017
采用式(3)本地模型的准确率来计算;其中
Figure 607531DEST_PATH_IMAGE019
表示测试数据,
Figure 829565DEST_PATH_IMAGE020
表示测试数据的数量,
Figure 569988DEST_PATH_IMAGE021
表示测试任务的数量,
Figure 925883DEST_PATH_IMAGE022
表示节点
Figure 576307DEST_PATH_IMAGE003
本地模型预测结果;
Figure 625034DEST_PATH_IMAGE023
(3)。
进一步地,所述动态信任值计算公式如式(4):
Figure 728119DEST_PATH_IMAGE024
(4)
其中:
Figure 622126DEST_PATH_IMAGE025
表示本次计算总共进行的迭代次数,
Figure 517270DEST_PATH_IMAGE026
表示激励基数。
Figure 612265DEST_PATH_IMAGE027
表示节点
Figure 327280DEST_PATH_IMAGE003
每轮计算所需的理论时间,
Figure 165923DEST_PATH_IMAGE028
表示每轮计算实际收到节点
Figure 647064DEST_PATH_IMAGE003
所发参数所消耗的时间,
Figure 912960DEST_PATH_IMAGE029
是时间控制函数;
Figure 849692DEST_PATH_IMAGE030
是时间衰减函数。
进一步地,节点
Figure 351081DEST_PATH_IMAGE003
每轮计算所需的理论时间
Figure 830604DEST_PATH_IMAGE027
在算力支撑的计算时间基础上增加2个MSL时间,防止误将网络的延迟造成的超时计为恶意攻击的超时,
Figure 392035DEST_PATH_IMAGE027
的计算公式如式(5);
Figure 957009DEST_PATH_IMAGE031
(5)
其中:
Figure 996509DEST_PATH_IMAGE015
表示本次计算节点
Figure 330538DEST_PATH_IMAGE003
提供的数据量大小;
Figure 797292DEST_PATH_IMAGE013
表示节点
Figure 974195DEST_PATH_IMAGE003
提供的算力。
进一步地,所述时间衰减函数
Figure 692752DEST_PATH_IMAGE030
用于衡量节点
Figure 5922DEST_PATH_IMAGE003
每轮计算行为对信任值的影响,计算公式如式(6):
Figure 784522DEST_PATH_IMAGE032
(6)
Figure 451651DEST_PATH_IMAGE033
是时间衰减因子,距离当前的迭代越远,时间衰弱越大,对节点的信任度动态评价影响越小。
进一步地,所述历史信任值是节点
Figure 832954DEST_PATH_IMAGE003
在过去一段时间内所得信任值的平均值,计算公式如式(7):
Figure 141576DEST_PATH_IMAGE034
(7)
其中
Figure 950132DEST_PATH_IMAGE035
表示节点
Figure 976994DEST_PATH_IMAGE003
总共参与的计算次数。
与现有技术相比,本发明的有益效果有:
本发明首先通过联邦学习对多源医疗数据进行建模,根据各节点在当前联邦计算中的行为、历史行为,以及提供的数据质量和算力等,提出一种节点信任度评价机制,对本次训练的贡献度高的节点激励更多,增加节点“作恶”的“成本”,并利用区块链将各节点训练的中间模型参数和节点的信任值上链,保证结果的可追溯性和节点信任值的不可篡改性。节点的信任值也能为计算参与方的选择提供一定的依据,以激励更多的节点积极参与联邦计算,提供更高质量的数据和更强的计算能力,帮助计算模型更快收敛,精度更高。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明的基于联邦学习和区块链的医疗大数据共享方法的流程图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明提供一种基于联邦学习和区块链的医疗大数据共享方法,如图1所示,具体流程为:
S1、当需要进行科学计算时,数据使用方根据节点信任度选择合适的节点,向提供方申请数据,并向智能合约缴纳使用费用。
各医疗机构组成区块链或联盟链,当需要进行联邦学习时,数据使用方根据各节点的信任度,以及节点的数据拥有情况,向节点申请数据使用,并向智能合约缴纳一定的使用费,在一定程度上防止恶意的数据使用。
节点的信任度主要包括三个方面:静态信任值、动态信任值、历史信任值,节点的信任度的计算公式如式(1)。
Figure 896408DEST_PATH_IMAGE001
(1)
其中
Figure 184170DEST_PATH_IMAGE002
表示节点
Figure 570152DEST_PATH_IMAGE003
的信任度,
Figure 677785DEST_PATH_IMAGE004
表示节点
Figure 400891DEST_PATH_IMAGE003
的静态信任值,
Figure 684104DEST_PATH_IMAGE005
表示节点
Figure 100042DEST_PATH_IMAGE003
的动态信任值,
Figure 835917DEST_PATH_IMAGE006
表示节点
Figure 383221DEST_PATH_IMAGE003
的历史信任值,
Figure 520941DEST_PATH_IMAGE007
Figure 107781DEST_PATH_IMAGE008
Figure 330952DEST_PATH_IMAGE009
分别为其权重,
Figure 395859DEST_PATH_IMAGE010
具体的,所述静态信任值在计算开始之前就确定好的,不随节点行为改变的特征,主要表现在节点提供的算力、数据量以及数据质量,提供的数据量大且质量高,且节点计算能力强,模型能更快地收敛,精度更好,静态信任值的计算方法如式(2):
Figure 512720DEST_PATH_IMAGE012
(2)
其中:
Figure 145827DEST_PATH_IMAGE013
表示节点
Figure 980928DEST_PATH_IMAGE003
提供的算力,算力主要与CPU、GPU算力以及存储效率相关,
Figure 724893DEST_PATH_IMAGE036
是其权重;
Figure 696260DEST_PATH_IMAGE015
表示本次计算节点
Figure 624901DEST_PATH_IMAGE003
提供的数据量大小,
Figure 822665DEST_PATH_IMAGE016
是其权重;
Figure 494954DEST_PATH_IMAGE017
表示节点
Figure 196194DEST_PATH_IMAGE003
的数据质量,
Figure 564246DEST_PATH_IMAGE018
是其权重。
节点的数据质量采用式(3)本地模型的精确度来评价,包括但不限于精确率、精度、召回率等,
Figure 983726DEST_PATH_IMAGE023
(3)
其中
Figure 459707DEST_PATH_IMAGE019
表示测试数据,
Figure 281032DEST_PATH_IMAGE020
表示测试数据的数量,
Figure 551477DEST_PATH_IMAGE021
表示测试任务的数量,
Figure 317307DEST_PATH_IMAGE022
表示节点
Figure 206766DEST_PATH_IMAGE003
本地模型预测结果。
所述动态信任值与节点在计算中的行为相关,有的节点表现活跃,积极参与;有的节点行为懒惰,没有及时地反馈梯度值;有的节点行为恶劣,反馈虚假的梯度,造成联邦学习超时、系统宕机等,因此在联邦计算结束后,对节点动态信任值进行更新,动态信任值的计算公式如式(4):
Figure 272811DEST_PATH_IMAGE037
(4)
其中:
Figure 714157DEST_PATH_IMAGE025
表示本次计算总共进行的迭代次数,
Figure 108229DEST_PATH_IMAGE026
表示激励基数;
Figure 660433DEST_PATH_IMAGE027
表示节点
Figure 190771DEST_PATH_IMAGE003
每轮计算所需的理论时间,
Figure 68597DEST_PATH_IMAGE028
表示每轮计算实际收到节点
Figure 949966DEST_PATH_IMAGE003
所发参数所消耗的时间,
Figure 568510DEST_PATH_IMAGE029
是时间控制函数,当超时行为发生时,
Figure 218934DEST_PATH_IMAGE038
会是负数,且超时时间越长,对信任值的影响也越大,实现对不诚实行为的惩罚,以此来避免不诚实参与者和激励参与者提供正确数据模型的积极性;
Figure 736503DEST_PATH_IMAGE030
是时间衰减函数。
进一步地,为防止误将网络的延迟造成的超时计为恶意攻击的超时,节点
Figure 229802DEST_PATH_IMAGE003
每轮计算所需的理论时间
Figure 264754DEST_PATH_IMAGE027
在算力支撑的计算时间基础上增加2个MSL(Maximum SegmentLifetime,报文最大生存时间)时间,计算公式如式(5):
Figure 159898DEST_PATH_IMAGE039
(5)
其中:
Figure 989313DEST_PATH_IMAGE015
表示本次计算节点
Figure 969908DEST_PATH_IMAGE003
提供的数据量大小;
Figure 808551DEST_PATH_IMAGE013
表示节点
Figure 292622DEST_PATH_IMAGE003
提供的算力。
Figure 558518DEST_PATH_IMAGE030
是时间衰减函数,用于衡量节点
Figure 495250DEST_PATH_IMAGE003
每轮计算行为对信任值的影响,
Figure 137584DEST_PATH_IMAGE040
计算公式如式(6):
Figure 741740DEST_PATH_IMAGE032
(6)
Figure 774943DEST_PATH_IMAGE033
是时间衰减因子,距离当前的迭代越远,时间衰弱越大,对节点的信任度动态评价影响越小,即近期的行为是更为重要的评价指标。节点近期的诚实行为更为频繁,其动态评价也会愈好,对其现有的信任度评价的促进作用会更为明显。
所述历史信任值是节点
Figure 339917DEST_PATH_IMAGE003
在过去一段时间内所得信任值的平均值,
Figure 644996DEST_PATH_IMAGE035
表示节点
Figure 979025DEST_PATH_IMAGE003
总共参与的计算次数,计算公式如式(7):
Figure 711358DEST_PATH_IMAGE041
(7)。
S2、数据提供方收到申请并同意后,将自己的算力和数据样本大小公布上链;
考虑到随着时间的推移,各医疗机构的数据是动态变化的,所以数据提供方收到请求后,将自己可提供的数据量大小和算力上链,不可篡改,以计算各节点超时时间。
S3、数据使用方发送模型和收敛条件到智能合约。
S4、数据提供方下载模型,当所有节点准备好,开始联邦学习,同时智能合约开始超时计算。
S5、各节点将中间结果加密发送到智能合约,智能合约记录每个节点的时间,并对中间结果进行评价,结果上链。
为了防止恶意的参与者,避免由这些参与者提供不正确的梯度,参与者在上传梯度之前需要给出加密的梯度和正确性证明,并且允许第三方审核参与者的验证,以此来保证数据的可审计性。
S6、智能合约在收到所有节点发送的中间结果后,做聚合计算并判断是否收敛,若收敛则计算停止,若不收敛,则更新模型,重复步骤4,直到结果收敛。
S7、计算停止,智能合约更新每个节点的信任值,并根据贡献值,发放酬劳。
所述发放酬劳的依据为:静态信任值和动态信任值分别乘以其权重之后的总和,即
Figure 622682DEST_PATH_IMAGE011
值。
本发明首先通过联邦学习对多源医疗数据进行建模,根据各节点在当前联邦计算中的行为、历史行为,以及提供的数据质量和算力等,提出一种节点信任度评价机制,对本次训练的贡献度高的节点激励更多,增加节点“作恶”的“成本”,并利用区块链将各节点训练的中间模型参数和节点的信任值上链,保证结果的可追溯性和节点信任值的不可篡改性。节点的信任值也能为计算参与方的选择提供一定的依据,以激励更多的节点积极参与联邦计算,提供更高质量的数据和更强的计算能力,帮助计算模型更快收敛,精度更高。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (3)

1.一种基于联邦学习和区块链的医疗大数据共享方法,其特征在于:具体流程为:
S1、数据使用方根据节点信任度选择合适的节点,向提供方申请数据,并向智能合约缴纳使用费用;所述节点信任度包括静态信任值、动态信任值、历史信任值,并用式(1)计算:
Figure DEST_PATH_IMAGE001
(1)
其中
Figure DEST_PATH_IMAGE002
表示节点
Figure DEST_PATH_IMAGE003
的信任度,
Figure DEST_PATH_IMAGE004
表示节点
Figure 889004DEST_PATH_IMAGE003
的静态信任值,
Figure DEST_PATH_IMAGE005
表示节点
Figure 868461DEST_PATH_IMAGE003
的动态信任值,
Figure DEST_PATH_IMAGE006
表示节点
Figure 192739DEST_PATH_IMAGE003
的历史信任值,
Figure DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
分别为其权重,
Figure DEST_PATH_IMAGE010
所述静态信任值表现在节点提供的算力、数据量以及数据质量,计算方法如式(2):
Figure DEST_PATH_IMAGE011
(2)
其中
Figure DEST_PATH_IMAGE012
表示节点
Figure 604260DEST_PATH_IMAGE003
提供的算力,
Figure DEST_PATH_IMAGE013
是其权重;
Figure DEST_PATH_IMAGE014
表示本次计算节点
Figure 762840DEST_PATH_IMAGE003
提供的数据量大小,
Figure DEST_PATH_IMAGE015
是其权重;
Figure DEST_PATH_IMAGE016
表示节点
Figure 178778DEST_PATH_IMAGE003
的数据质量,
Figure DEST_PATH_IMAGE017
是其权重;所述节点的数据质量
Figure 250071DEST_PATH_IMAGE016
采用式(3)本地模型的准确率来计算,其中
Figure DEST_PATH_IMAGE018
表示测试数据,
Figure DEST_PATH_IMAGE019
表示测试数据的数量,m表示测试任务的数据,
Figure DEST_PATH_IMAGE020
表示节点
Figure 58758DEST_PATH_IMAGE003
本地模型预测结果;
Figure DEST_PATH_IMAGE021
(3);
所述动态信任值计算公式如式(4):
Figure DEST_PATH_IMAGE022
(4)
其中:
Figure DEST_PATH_IMAGE023
表示本次计算总共进行的迭代次数,
Figure DEST_PATH_IMAGE024
表示激励基数;
Figure DEST_PATH_IMAGE025
表示节点
Figure 134162DEST_PATH_IMAGE003
每轮计算所需的理论时间,
Figure DEST_PATH_IMAGE026
表示每轮计算实际收到节点
Figure 940575DEST_PATH_IMAGE003
所发参数所消耗的时间,
Figure DEST_PATH_IMAGE027
是时间控制函数;
Figure DEST_PATH_IMAGE028
是时间衰减函数;所述时间衰减函数
Figure 22800DEST_PATH_IMAGE028
用于衡量节点
Figure 290971DEST_PATH_IMAGE003
每轮计算行为对信任值的影响,计算公式如式(6):
Figure DEST_PATH_IMAGE029
(6)
Figure DEST_PATH_IMAGE030
是时间衰减因子,距离当前的迭代越远,时间衰弱越大,对节点的信任度动态评价影响越小;
所述历史信任值是节点
Figure 890055DEST_PATH_IMAGE003
在过去一段时间内所得信任值的平均值,计算公式如式(7):
Figure DEST_PATH_IMAGE031
(7)
其中
Figure DEST_PATH_IMAGE032
表示节点
Figure 398528DEST_PATH_IMAGE003
总共参与的计算次数;
S2、数据提供方收到申请并同意后,将自己的算力和数据样本大小公布上链;
S3、数据使用方发送模型和收敛条件到智能合约;
S4、数据提供方下载模型,当所有节点准备好,开始联邦学习,同时智能合约开始超时计算;
S5、各节点将中间结果加密发送到智能合约,智能合约记录每个节点的时间,并对中间结果进行评价,结果上链;
S6、智能合约在收到所有节点发送的中间结果后,做聚合计算并判断是否收敛,若收敛则计算停止,若不收敛,则更新模型,重复步骤4,直到结果收敛;
S7、计算停止,智能合约更新每个节点的信任值,并根据贡献值,发放酬劳。
2.根据权利要求1所述的基于联邦学习和区块链的医疗大数据共享方法,其特征在于:在步骤S7中,以
Figure DEST_PATH_IMAGE033
值作为本次联邦计算节点
Figure 436891DEST_PATH_IMAGE003
的贡献值发放酬劳。
3.根据权利要求1所述的基于联邦学习和区块链的医疗大数据共享方法,其特征在于:节点
Figure 243173DEST_PATH_IMAGE003
每轮计算所需的理论时间
Figure 168534DEST_PATH_IMAGE025
在算力支撑的计算时间基础上增加2个MSL时间,防止误将网络的延迟造成的超时计为恶意攻击的超时,
Figure 769280DEST_PATH_IMAGE025
的计算公式如式(5);
Figure DEST_PATH_IMAGE034
(5)
其中:
Figure 560519DEST_PATH_IMAGE014
表示本次计算节点
Figure 904912DEST_PATH_IMAGE003
提供的数据量大小;
Figure 684781DEST_PATH_IMAGE012
表示节点
Figure 987586DEST_PATH_IMAGE003
提供的算力。
CN202210026561.3A 2022-01-11 2022-01-11 一种基于联邦学习和区块链的医疗大数据共享方法 Active CN114048515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210026561.3A CN114048515B (zh) 2022-01-11 2022-01-11 一种基于联邦学习和区块链的医疗大数据共享方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210026561.3A CN114048515B (zh) 2022-01-11 2022-01-11 一种基于联邦学习和区块链的医疗大数据共享方法

Publications (2)

Publication Number Publication Date
CN114048515A CN114048515A (zh) 2022-02-15
CN114048515B true CN114048515B (zh) 2022-03-22

Family

ID=80196180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210026561.3A Active CN114048515B (zh) 2022-01-11 2022-01-11 一种基于联邦学习和区块链的医疗大数据共享方法

Country Status (1)

Country Link
CN (1) CN114048515B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417361B (zh) * 2022-03-31 2022-08-26 天聚地合(苏州)科技股份有限公司 基于区块链的跨域ai隐私计算的协商方法及系统
CN116189874B (zh) * 2023-03-03 2023-11-28 海南大学 一种基于联邦学习和联盟链的远程医疗系统数据共享方法
CN117114126B (zh) * 2023-07-07 2024-05-31 北方工业大学 一种Web3.0联邦学习云架构及激励方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111698322A (zh) * 2020-06-11 2020-09-22 福州数据技术研究院有限公司 一种基于区块链和联邦学习的医疗数据安全共享方法
CN111988381A (zh) * 2020-08-07 2020-11-24 南通大学 一种基于HashGraph的车联网分布式信任系统及信任值计算方法
CN112380067A (zh) * 2020-11-30 2021-02-19 四川大学华西医院 一种Hadoop环境下基于元数据的大数据备份系统及方法
CN112420187A (zh) * 2020-10-15 2021-02-26 南京邮电大学 一种基于迁移联邦学习的医疗疾病分析方法
CN112804101A (zh) * 2021-01-11 2021-05-14 电子科技大学 一种基于投票与信用机制的主从多链跨链方法及系统
CN113467927A (zh) * 2021-05-20 2021-10-01 杭州趣链科技有限公司 一种基于区块链的参与方可信任的联邦学习方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL210169A0 (en) * 2010-12-22 2011-03-31 Yehuda Binder System and method for routing-based internet security
CN112132293A (zh) * 2020-09-30 2020-12-25 腾讯科技(深圳)有限公司 纵向联邦学习中的计算方法、装置、设备及介质
CN111931242B (zh) * 2020-09-30 2021-02-19 国网浙江省电力有限公司电力科学研究院 一种数据共享方法以及应用其的计算机设备及可读存储介质
CN113467928A (zh) * 2021-05-20 2021-10-01 杭州趣链科技有限公司 基于区块链去中心化的联邦学习成员推理攻击防御方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111698322A (zh) * 2020-06-11 2020-09-22 福州数据技术研究院有限公司 一种基于区块链和联邦学习的医疗数据安全共享方法
CN111988381A (zh) * 2020-08-07 2020-11-24 南通大学 一种基于HashGraph的车联网分布式信任系统及信任值计算方法
CN112420187A (zh) * 2020-10-15 2021-02-26 南京邮电大学 一种基于迁移联邦学习的医疗疾病分析方法
CN112380067A (zh) * 2020-11-30 2021-02-19 四川大学华西医院 一种Hadoop环境下基于元数据的大数据备份系统及方法
CN112804101A (zh) * 2021-01-11 2021-05-14 电子科技大学 一种基于投票与信用机制的主从多链跨链方法及系统
CN113467927A (zh) * 2021-05-20 2021-10-01 杭州趣链科技有限公司 一种基于区块链的参与方可信任的联邦学习方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Tumor Cell Load and Heterogeneity Estimation From Diffusion-Weighted MRI Calibrated With Histological Data: an Example From Lung Cancer;Yi Yin等;《网页在线公开:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7913723》;20170427;第1-12页 *
联邦学习算法综述;王健宗等;《大数据》;20210225;第6卷(第6期);第64-82页 *
边缘计算环境下基于区块链和联邦学习的医疗健康数据共享模型;邢丹等;《医学信息学杂志》;20210426;第42卷(第2期);第33-37页 *
魏小林等;新疆某三甲医院2013-2017年出院患者疾病构成分析;《现代医药卫生》;20200408;第36卷(第4期);第481-486页 *

Also Published As

Publication number Publication date
CN114048515A (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
Xu et al. Sok: Decentralized exchanges (dex) with automated market maker (amm) protocols
CN114048515B (zh) 一种基于联邦学习和区块链的医疗大数据共享方法
CN113794675B (zh) 基于区块链和联邦学习的分布式物联网入侵检测方法及系统
Bouraga A taxonomy of blockchain consensus protocols: A survey and classification framework
Miao et al. Privacy-preserving Byzantine-robust federated learning via blockchain systems
Feng et al. MCS-Chain: Decentralized and trustworthy mobile crowdsourcing based on blockchain
US10554649B1 (en) Systems and methods for blockchain validation of user identity and authority
Miller et al. Nonoutsourceable scratch-off puzzles to discourage bitcoin mining coalitions
Sun et al. Voting-based decentralized consensus design for improving the efficiency and security of consortium blockchain
CN112053043B (zh) 一种基于区块链的群智感知方法及系统
CN110535836A (zh) 一种基于角色分类的信任区块链共识方法
An et al. PPQC: A blockchain-based privacy-preserving quality control mechanism in crowdsensing applications
CN112613601B (zh) 神经网络模型更新方法、设备及计算机存储介质
Huang et al. Blockchain-assisted personalized car insurance with privacy preservation and fraud resistance
Yang et al. An explainable federated learning and blockchain-based secure credit modeling method
Yu et al. Towards a privacy-preserving smart contract-based data aggregation and quality-driven incentive mechanism for mobile crowdsensing
Ekanayake et al. Lightweight blockchain framework using enhanced master-slave blockchain paradigm: Fair rewarding mechanism using reward accuracy model
Obushnyi et al. Blockchain as a transaction protocol for guaranteed transfer of values in cluster economic systems with digital twins
Ali et al. Incentive-driven federated learning and associated security challenges: A systematic review
Muazu et al. Iomt: A medical resource management system using edge empowered blockchain federated learning
CN112702410B (zh) 一种基于区块链网络的评估系统、方法及相关设备
CN115438322A (zh) 一种支持身份证明的联邦学习方法、系统、设备及介质
CN114626934A (zh) 基于区块链的多层级风控系统及管控方法
Jain et al. A security analysis of lightweight consensus algorithm for wearable kidney
Aghania Hybrid tip selection algorithm in IOTA

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant