CN116936048B - 异构医疗信息的联邦学习医院选择方法、设备及存储介质 - Google Patents

异构医疗信息的联邦学习医院选择方法、设备及存储介质 Download PDF

Info

Publication number
CN116936048B
CN116936048B CN202310808640.4A CN202310808640A CN116936048B CN 116936048 B CN116936048 B CN 116936048B CN 202310808640 A CN202310808640 A CN 202310808640A CN 116936048 B CN116936048 B CN 116936048B
Authority
CN
China
Prior art keywords
hospitals
hospital
server
model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310808640.4A
Other languages
English (en)
Other versions
CN116936048A (zh
Inventor
张凌羽
康健
李强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202310808640.4A priority Critical patent/CN116936048B/zh
Publication of CN116936048A publication Critical patent/CN116936048A/zh
Application granted granted Critical
Publication of CN116936048B publication Critical patent/CN116936048B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/098Distributed learning, e.g. federated learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种异构医疗信息的联邦学习医院选择方法、设备及存储介质,属于医疗系统数据分析技术领域,所述方法应用于电子设备,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的基于妇产科异构医疗信息的联邦学习医院选择方法的各步骤。所述方法通过计算各医院本地计算和通信速度,并通过准确率将医院分类进行不均匀采样的方式,打破了传统联邦学习全部客户端参与训练或均匀抽样的方式,同时考虑了资源异构性和数据异构性,加快训练速度,减少通信轮数,并且可以获得更好的模型精度,在以后使用新的疾病影像进行诊断时,可以提高对疾病分类判断的准确性,减少误诊率,增加各医院医生的诊断效率。

Description

异构医疗信息的联邦学习医院选择方法、设备及存储介质
技术领域
本发明涉及医疗系统数据分析技术领域,特别是涉及一种异构医疗信息的联邦学习医院选择方法、设备及存储介质。
背景技术
联邦学习作为分布式机器学习范式,可以有效解决数据孤岛问题,让各参与方在不共享数据的基础上联合建模,能从技术上打破数据孤岛,实现协作。因此,医院出于保证患者隐私的目的,选择使用联邦学习的方法协作训练医疗诊断模型,期望通过患者的疾病影像资料可以得出初步诊断。
但是,在实际应用过程中存在着异构性问题。各医院在实际场景、存储、本地计算、通信速度等方面都存在着较大差异性,这是资源异构性的问题。数据异构性是各医院在训练中使用的影像资料数据样本数量不同,并且由于各医院所处地理位置不同导致好发疾病类型不同、擅长治疗的疾病类别不同,因此各医院之间的疾病数据类别和特征分布也不均匀。
目前所存在的联邦学习算法只是解决资源异构性和数据异构性两种异构性其中的一种,即并没有同时解决资源和数据异构性。
发明内容
有鉴于此,本发明的目的是提供一种异构医疗信息的联邦学习医院选择方法、设备及存储介质,可以有效同时解决资源异构性和数据异构性,增加训练效率并且获得更好的模型精度。
为实现上述目的,本发明采用如下技术方案:
本发明实施例的第一方面提供了一种异构医疗信息的联邦学习医院选择方法,包括:
获取所有医院的资源异构性排序,所述资源异构性排序为考虑每家医院的本地计算能力和服务器的通信能力进行的由高到低的排序,该排序结果存储在服务器的资源异构性排序表中,所述资源异构性排序表是一个字典数据结构,对应的数据包括一个键值对,键值对包括键和值,键为医院的编号,值为该医院的排序号;
服务器进行初始化操作,服务器向全部医院分发初始模型,使用的模型结构为VGG16网络结构,包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层),所述初始模型是经服务器初始化得到的模型,其模型参数服从正态分布,所有医院使用该初始模型和本地医疗数据进行训练并将训练得到的新模型回传给服务器,服务器使用FedAvg算法中的聚合步骤进行聚合操作,将聚合后的迭代模型再次分发给全部医院,所有医院计算本地医疗数据在该聚合后的迭代模型上的准确率,将各自的准确率返回给服务器,存储在一个准确率列表中,所述准确率列表是一个列表数据结构,按顺序存储各医院返回的准确率,索引值为医院的编号;
服务器对准确率列表中各医院的准确率由大到小进行排序操作,得到排序后的医院索引值,服务器分别按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式计算每类中含有的医院数量,即若总共有N家医院参与训练,则每类中含有医院10%*N,15%*N,…,30%*N的数量,并按准确率由大到小的顺序将医院分为五类,所述分类准确率依次减小。此处举例说明:若有100家医院,将这100家医院的准确率进行由大到小的排序,然后将准确率最高的10家医院分为第一类,接下来第11至第25家医院为第二类,第26至第45家医院为第三类,第46至第70家医院为第四类,第71至100家医院为第五类,这五大类医院整体准确率依次减少,并且每类中医院有尽可能近似的准确率;
服务器在每一类中对医院进行选择,在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10%、15%、20%、25%和30%的医院数量参与训练,即若每一轮中选择m家医院参与训练,则在五类中按顺序分别选择10%*m,15%*m,…,30%*m数量的医院,同时结合存储在服务器的资源异构性排序表,按照排序的顺序在每一类中对医院进行选择。此处举例说明:若有100家医院,每一轮次需要选择其中10家医院参加训练,此时已将全部医院按照准确率分为了五类,每一类中分别有10、15、20、25、30家医院,那么在对医院的选择中需要分别在每类中选择1、1、2、2、4家医院参与训练,并且在每一类中选择时同时考虑资源异构性排序表,选择资源异构性排序最靠前的医院参加训练。
通过使用本发明提出的异构医疗信息的联邦学习医院选择方法,可以解决资源异构性,加快联邦学习整体训练速度,减少达到收敛时所需的训练轮次,减少了整体训练时间;可以解决数据异构性,增强对代表性数据的选择,获得更好的模型精度,在以后使用新的疾病影像进行诊断时,可以提高对疾病分类判断的准确性,减少误诊率,增加各医院医生的诊断效率。
结合第一方面,在第一方面的第一种可能实现方式中,服务器获取所有医院的资源异构性排序的步骤,包括:
由服务器向所有参与训练的医院分发第一初始模型和各医院训练轮数syncround,所述第一初始模型/>是使用的模型结构为VGG16网络结构,包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层),所述第一初始模型/>是经服务器初始化得到的模型,其模型参数服从正态分布,用于进行资源异构性排序的测试;
所有医院接收服务器分发的第一初始模型使用本地医疗数据集Di进行模型训练,回传训练所需的时间RTi,训练使用交叉熵损失函数,该损失函数由以下关系式获得:其中,w为模型参数,ni为医院i的本地数据集样本数,y*是数据标签的真实值,y是由卷积神经网络训练得出的值,为了使损失函数收敛,得到与真实标签最接近的预测值,求出损失函数梯度g下降的方向,梯度下降关系式为:/>其中,x为医院本地医疗数据集Di中的本地数据,最终损失函数收敛,梯度下降优化完成,训练过程就结束了;
服务器接收各医院的本地训练时间RTi,对所有RTi进行排序,即按照各医院的训练时间快慢进行排序,各医院按照训练时间由快到慢获得其排序号resource[i],其中,排序号取值范围为1~N,N为参与训练的医院总数,i为医院的编号,资源异构性排序结果存储在资源异构性排序表resource中,所述资源异构性排序表resource为字典数据结构,键为医院的编号i,值为该医院的排序号resource[i]。
结合第一方面,在第一方面的第二种可能实现方式中,服务器进行初始化操作并获取各医院准确率的步骤,包括:
服务器向全部医院分发第二初始模型w0,所述第二初始模型w0是使用的模型结构为VGG16网络结构,包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层),所述第二初始模型w0是经服务器初始化得到的模型,其模型参数服从正态分布,所有N家医院使用该初始模型w0和本地医疗数据集Di进行训练并将训练得到的新模型回传给服务器;
服务器使用FedAvg算法进行聚合操作,将聚合后的迭代模型w1再次分发给全部医院,所述FedAvg算法包含对医院的选择步骤和对模型的聚合方法,在本发明所有聚合步骤中只使用该算法对模型的聚合方法,该方法为业内应用最为广泛效率最高的聚合方法;
所有医院计算本地训练数据Di在该迭代模型w1上的准确率acci,将各自的准确率acci返回给服务器,存储在一个准确率列表acc中,所述准确度列表acc是一个列表数据结构,按顺序存储各医院返回的准确率acci,索引值i为医院的编号。
结合第一方面的第二种可能实现方式,在第一方面的第三种可能实现方式中服务器对准确率列表acc中各医院的准确率acci由大到小进行排序操作,得到排序后医院的索引值,将其按顺序存入一个医院编号列表index中,所述医院编号列表index为一个列表数据结构,存储的为按各医院准确率由大到小排序后各医院的编号i;
服务器分别按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式按顺序将医院编号列表index分为五类即将所有的医院按照准确率分为不均匀的五类,所述五类中的医院准确率依次减小。
结合第一方面的第一种和第三种可能实现方式,在第一方面的第四种可能实现方式中服务器在类中对医院进行选择,在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10%、15%、20%、25%和30%的医院数量参与训练,同时结合存储在服务器的资源异构性排序表resource,按照排序的顺序在每一类中选择排序号较小的医院,即优先选择本地计算速度更快的医院。
结合第一方面,在第一方面的第五种可能实现方式中,获取联邦学习模型训练过程中若干医院执行模型训练后回传迭代模型的步骤,包括:
获取联邦学习医疗信息的训练任务,所述训练任务中包含有初始化训练模型以及训练轮数等任务所需参数;
服务器将所述初始化训练模型下发至若干医院分别进行训练,使所述医院执行模型训练后回传迭代模型,其中,所述若干医院的选择根据第四种可能实现方式中的选择方法决定;
服务器接收参与训练的医院回传的迭代模型,使用FedAvg算法进行聚合,更新模型。
本发明实施例的第二方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面提供的异构医疗信息的联邦学习医院选择方法的各步骤。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的异构医疗信息的联邦学习医院选择方法的各步骤。
通过上述设计方案,本发明可以带来如下有益效果:本发明提出一种异构医疗信息的联邦学习医院选择方法、设备及存储介质,本发明的异构医疗信息的联邦学习医院选择方法在各医院联合采用联邦学习方式训练一个医疗模型的过程中,首先根据各医院本地资源和医疗信息数据进行资源异构性排序,本地计算能力和通信能力越强的医院排序号越小,在选择步骤中优先被选择,加快联邦学习整体训练速度,解决资源异构性;同时对各医院本地数据在现有模型上的准确率进行计算,通过准确率将医院分类,准确率越低的类别中所含医院数量越多,每一轮次该类中被选择的医院也越多,即认为准确率低的医院在现阶段并未得到良好训练,在接下来的训练中应作出更大贡献,增加被选择的次数,解决数据异构性。本发明通过计算各医院本地计算和通信速度,并通过准确率将医院分类进行不均匀采样的方式,打破了传统联邦学习全部医院参与训练或均匀抽样的方式,同时考虑了资源异构性和数据异构性,加快训练速度,减少通信轮数,并且可以获得更好的模型精度,在以后使用新的疾病影像进行诊断时,可以提高对疾病分类判断的准确性,减少误诊率,增加各医院医生的诊断效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明示意性实施例及其说明用于理解本发明,并不构成本发明的不当限定,在附图中:
图1是本发明实施例提供的异构医疗信息的联邦学习医院选择方法总体步骤流程图;
图2为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中计算资源异构性排序的流程示意图;
图3为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中初始化计算准确率的流程示意图;
图4为本发明实施例提供的异构医疗信息的联邦学习医院选择方法对准确率分类流程示意图;
图5为本发明实施例提供的异构医疗信息的联邦学习医院选择方法进行医院选择的流程示意图;
图6为本发明实施例提供的异构医疗信息的联邦学习医院选择方法模型聚合流程示意图;
图7为本发明实施例提供的一种电子设备的基本结构框图。
具体实施方式
为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。为了避免混淆本发明的实质,公知的方法、过程、流程并没有详细叙述。
本发明应用在若干医院使用患者医疗影像数据集,应用联邦学习方法协同训练一个医学诊断模型,包含有一个可信的第三方服务器和若干家医院。在本申请实施例中,包含一个可信的第三方服务器和总计一百家三甲医院,所有医院共同训练一个妇产科医学诊断模型,包括以下十种妇产科诊断:子宫肌瘤、卵巢畸胎瘤、卵巢子宫内膜异位症、异位妊娠、妊娠状态、葡萄胎、子宫内膜癌、子宫腺肌病、卵巢恶性肿瘤和宫颈恶性肿瘤。其中,各医院实现的软件版本为python 3.7.0,PyTorch 1.2.0,各医院使用的模型结构为VGG16网络结构,包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层),各医院本地使用的数据集是这些疾病的医疗影像图像,因为医院所处地区和医院规模不同,因此每家医院的疾病影像图像数据量和疾病类型并不统一,并且每家医院本地的计算和通信能力也并不一致,在联邦学习的模型训练中会存在资源和数据异构性,会影响训练速度,并且在最终的模型上可能会产生偏差,影响训练得到的最终全局模型的精度,影响使用该模型进行诊断的准确率。本发明可以同时解决资源异构性和数据异构性问题,加快训练速度,减少通信轮数,并且获得更好的模型精度,提升对相关疾病进行初步诊断的准确率。
在本申请实施例中,被选择的医院通过接收器从服务器接收机器学习模型并对该接收到的机器学习模型进行存储,通过学习器执行联邦学习过程中每一轮次的模型训练,如使用本地的医疗数据对机器学习模型进行更新,然后将更新后的机器学习模型上传到服务器。服务器接收回传的更新后的机器学习模型后,通过其内置的聚合器将从各个医院获取到的机器学习模型进行聚合来获得新的全局模型,以及通过其内置的评估器对医院进行异构性排序和准确率分类,所述机器学习模型为一个卷积神经网络模型。
请参阅图1,图1为本申请第一实施例提供的一种异构医疗信息的联邦学习医院选择方法的整体实现流程图。详述如下:
步骤S1:服务器初始化机器学习模型,得到第一初始模型所述第一初始模型/>是服务器随机初始化获得的模型,使用的模型结构为VGG16网络结构,仅用于进行资源异构性排序的测试,服务器将第一初始模型/>和各医院训练轮数syncround发给全部参与训练的医院,所述训练轮数syncround是步骤S2中各医院需要本地训练的轮数;
步骤S2:所有医院接收服务器发送的第一初始模型和训练轮数syncround,使用本地医疗数据集Di进行模型训练,回传训练所需的时间RTi,重复syncround次,服务器接收返回的时间RTi进行求和并且进行排序;
步骤S3:服务器向全部医院分发第二初始模型w0,所述第二初始模型w0是经服务器初始化得到的模型,但由于模型参数是从正态分布中随机得到,因此与第一初始模型是相同的模型结构,但相关模型参数不同,第二初始模型w0用于以后的训练阶段,所有医院使用该第二初始模型w0和本地医疗数据集Di进行训练并将训练得到N家医院的新模型回传给服务器,服务器使用FedAvg算法中的聚合步骤进行聚合操作,将聚合后的迭代模型w1再次分发给全部医院,所有医院计算本地训练数据Di在该模型w1上的准确率acci,将各自的准确率acci返回给服务器;
步骤S4:服务器对各医院的准确率acci由大到小进行排序,并按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式按顺序将医院分为五类
步骤S5:服务器在类中对医院进行选择,在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10%、15%、20%、25%和30%的医院数量参与训练,并且参考步骤S2中得到的资源异构性排序,在每类的医院中选择资源异构性排序靠前的医院;
步骤S6:服务器向被选择的医院发送迭代模型wr,该迭代模型wr是第二初始模型w0经过r轮训练后得到的模型,迭代模型wr使用的模型结构为VGG16网络结构,医院使用本地数据集Di进行模型更新后得到模型将模型/>上传回服务器,模型/>是经过第r+1轮训练第i家医院得到的模型,服务器采用FedAvg算法进行聚合操作;
步骤S7:服务器将聚合后新的迭代模型wr+1分发给全部医院,该迭代模型wr+1是经过r+1轮训练后各医院将模型上传至服务器经服务器聚合后得到的模型,医院使用本地数据集Di在迭代模型wr+1上计算准确率acci,将各自的准确率acci返回给服务器;
步骤S8:重复步骤S4~S7,直到达到迭代轮数或模型收敛。
以上可以看出,本实施例提供的异构医疗信息的联邦学习医院选择方法,通过计算资源异构性排序,本地训练吞吐量越大的医院其资源异构性排序越靠前,被选择的概率就越大,优先选择这些医院就可以加快训练速度,减少延迟,可以解决资源异构性问题;通过考虑模型在本地训练集上的准确率,准确率低的医院视为其本地代表性医疗数据没有在全局模型(即最终训练得到的模型)中得到体现,应该在下一轮训练中作出更大的贡献,可以解决数据异构性问题;将资源异构性和数据异构性综合考虑,可以同时解决资源异构性和数据异构性问题,加快收敛,获得更好的模型精度。
本发明的一些实施例中,请参阅图2,图2为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中计算资源异构性排序的流程示意图。详细如下:
步骤S21:所有医院接收服务器分发的第一初始模型和训练所需要的轮数syncround
步骤S22:所有医院使用第一初始模型和其本地医疗数据集Di进行一轮模型训练,记录实际训练时间RTi,并将其回传到服务器,此步骤重复syncround次;
步骤S23:服务器接收各医院的本地训练时间RTi,分别对各医院的RTi进行求和,按照RTi值的大小进行排序,将排序结果存储在资源异构性排序表resource中。
本实施例中,服务器向所有医院分发第一初始模型和配置参数syncround后,要求医院对其本地数据Di进行训练,每一轮等待Tmax时间,在Tmax时间内完成本地训练并返回本地训练时间RTi的医院,服务器正常记录,超过Tmax时间未返回的医院,服务器视为该医院处于掉线状态,时间按照Tmax递增。本地训练使用交叉熵损失函数,该损失函数由以下关系式获得:/>其中,w为模型参数,ni为医院i的本地数据集样本数,y*是数据标签的真实值,y是由卷积神经网络训练得出的值,为了使损失函数收敛,得到与真实标签最接近的预测值,求出损失函数梯度g下降的方向,梯度下降关系式为:/> 其中,x为医院的本地数据,最终损失函数收敛,梯度下降优化完成,训练过程就结束了,在训练轮次完毕后,对于Ti=syncround*Tmax的医院视为掉线状态,不再参与接下来的训练。服务器接收各医院的本地训练时间RTi,对RTi进行求和操作,然后按照RTi值的大小进行由小到大的排序,按照每家医院i的排序位置赋予每家医院排序号resourec[i],其中,排序号取值范围为1~N,N为参与训练的医院总数,i为医院的编号,资源异构性排序结果存储在资源异构性排序表resource中,所述资源异构性排序表resource为字典数据结构,键为医院的编号i,值为该医院的排序号resource[i]。
本发明的一些实施例中,请参阅图3,图3为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中初始化计算准确率的流程示意图。详细如下:
步骤S31:服务器向全部医院分发第二初始模型w0,所述第二初始模型w0是经服务器初始化得到的模型;
步骤S32:所有医院(共N家)使用该第二初始模型w0和本地医疗数据集Di进行训练并将所有医院(共N家)训练得到的新模型回传给服务器端;
步骤S33:服务器使用FedAvg算法进行聚合操作,将聚合后的迭代模型w1再次分发给全部医院;
步骤S34:所有医院计算本地训练数据Di在该迭代模型w1上的准确率acci,将各自的准确率acci返回给服务器,存储在一个准确率列表acc中。
本实施例中,服务器进行初始化操作,在初始化阶段将模型w0分发给全部参与训练的医院,所有医院都使用该模型w0和每家医院本地的医疗数据Di进行一轮训练,将训练后的模型回传给服务器进行聚合操作,服务器再将更新后的模型w1分发给全部医院,各计算计算本地医疗数据Di在更新模型上的准确率,经过分析,可知此准确率反应了每家医院其本地医疗数据Di对模型w1的贡献情况,准确率低的医院的医疗数据在之前的全局训练轮次中没有得到很好的训练,以至于全局模型对于该医院的本地数据准确率较低,即该医院存在代表性数据没有被选择加入模型训练,以至于模型出现偏差导致模型在该数据上准确率较低,因此在以后的训练中该医院应该作出更大的贡献,即在以后的训练中应该有更大的概率被选择参加训练。
本发明的一些实施例中,请参阅图4,图4为本发明实施例提供的异构医疗信息的联邦学习医院选择方法对准确率分类流程示意图。详细如下:
步骤S41:服务器对准确率列表acc中各医院的准确率acci进行由大到小的排序操作;
步骤S42:将排序后的医院编号按顺序存入一个医院编号列表index中;
步骤S43:服务器分别按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式按顺序将医院编号列表index分为五类
本实施例中,数据在模型上的准确率反应了每家医院其本地医疗数据对模型的贡献情况,准确率低的医院有代表性数据没有得到足够的训练,以至于模型出现偏差导致模型在该数据上准确率较低,同时也反应了每家医院的非独立同分布数据的分布情况,准确率近似的医院的数据分布也很可能是近似的。按照准确率进行不均匀分类以便使准确率较低的类别中存在的医院数量较多,从而在下一轮次的训练中这些准确率低的医院可以有更大的数量和概率参与训练,提高模型精度,减少误诊率。
本发明的一些实施例中,请参阅图5,图5为本发明实施例提供的异构医疗信息的联邦学习医院选择方法进行医院选择的流程示意图。详细如下:
步骤S51:服务器计算每一类中医院的选择数量,在每一类中采用向下取整的方式计算需要选择医院总数的10%、15%、20%、25%和30%的医院数量参与训练;
步骤S52:在每一类中按照资源异构性排序表resource的顺序选择所需数量的医院,加入到选择列表St中。
本实施例中,一轮训练总共需要选择m家医院,m=m1+m2+m3+m4+m5,在类中分别含有M1,M2,…,M5家医院,首先分别计算每一类中医院的选择数量m1,m2,…,m5。服务器使用向下取整的方式进行计算/>这里用到的Ki分别取10%、15%、20%、25%和30%。接下来在每一类中进行选择,此时查找资源异构性排序表resource,在每一类中选择在资源异构性排序表resource中前mi家医院,将这些医院加入到选择列表St中。因为计算准确率分类的步骤每一轮训练结束都需要进行一次,并且因为各医院参与训练的情况不同其准确率也应当是动态变化的,因此基于准确率的分类也是动态变化的,同时为每家医院设置一个被选择上限crediti=15,每被选择一次该值减少一,当减少为0时该医院不再参与训练,因此不会出现过度选择相同医院造成过拟合的情况。
本发明的一些实施例中,请参阅图6,图6为本发明实施例提供的异构医疗信息的联邦学习医院选择方法模型聚合流程示意图。详细如下:
步骤S61:服务器根据选择列表St选择参加训练的医院i,将全局模型wr分发给被选择的医院i;
步骤S62:医院i接收全局模型wr,使用医院的本地数据进行训练,得到更新后的模型将模型回传给服务器;
步骤S63:服务器接收各医院传回的更新模型进行聚合操作,得到新的全局模型wr+1
本实施例中,服务器将全局模型wr广播给选择列表中的医院i,服务器将被选择的医院的crediti值减少一,医院i将接收到的模型作为本轮训练的初始模型,利用医院的本地数据进行训练,用wr和本地数据计算梯度所述Fi(w)为损失函数,然后更新模型/>η是执行梯度下降所使用的学习率。将更新模型/>上传到服务器,服务器接收更新模型/>使用FedAvg算法进行聚合操作,即计算各医院更新模型/>的平均值,具体计算方式如下:/>其中,K为选中参与训练的医院数量,ni是医院i的数据样本数量。
表1展示了使用本发明和使用传统联邦学习方法FedAvg进行100轮训练的准确度对比,FedAvg方法首先提出了随机选择若干个客户端采样(此处客户端即为各家医院),对这若干个客户端的梯度进行平均以形成全局更新,同时用当前得到的新的全局模型Wr+1替换未采样的客户端的模型Wr。在使用默认方法的情况下,在全局训练100轮次的情况下,模型准确率只有40.20%,而在应用本发明后,在同样情况下,模型准确率可以提升到63.21%。由此可见,本发明可以很好解决在联邦学习训练中的异构性问题。
表1
表2展示了使用本发明和使用传统联邦学习方法FedAvg进行训练达到收敛时所需通信轮数对比,在使用默认方法的情况下,在250轮达到收敛,而在应用本发明后,可以在190轮达到收敛。
表2
联邦学习方法 达到收敛所需通信轮数
默认方法(FedAvg) 250
本发明 190
表3展示了使用本发明和使用传统联邦学习方法FedAvg进行训练100轮次所需训练时间对比,在使用默认方法的情况下,训练100轮次需要290分钟,而在应用本发明后,训练100轮次需要235分钟,节约了20%的训练时间。
表3
联邦学习方法 训练100轮次所需训练时间
默认方法(FedAvg) 290分钟
本发明 240分钟
本发明的一些实施例中,请参阅图7,图7为本发明实施例提供的一种电子设备的基本结构框图。如图7所示,该实施例的电子设备7包括:处理器71、存储器72和存储在所述存储器72中并能够在所述处理器71上运行的计算机程序73,例如异构医疗信息的联邦学习医院选择方法程序。处理器71执行所述计算机程序73时实现上述各个异构医疗信息的联邦学习医院选择方法各实施例中的步骤。具体请参阅实施例中的相关描述,此处不再赘述。
示例性的,所述计算机程序73可以被分割成一个或多个模块(单元),所述一个或者多个模块被存储在所述存储器72中,并由所述处理器71执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如,所述计算机程序73可以被分割成获取模块、处理模块和执行模块,各模块具体功能如上所述。
所述处理器71可以是中央处理单元(CPU),还可以是其他通用处理器。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器72可以是所述电子设备7的内部存储单元,例如电子设备7的硬盘或内存。所述存储器72也可以是所述电子设备7的外部存储设备,例如所述电子设备7上配备的插接式硬盘,智能存储卡(SMC),安全数字卡(SD),闪存卡(Flash Card)等。进一步地,所述存储器72还可以既包括所述电子设备7的内部存储单元也包括外部存储设备。所述存储器72用于存储所述计算机程序,所述存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。在本实施例中,所述计算机可读存储介质可以是非易失性,也可以是易失性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (7)

1.异构医疗信息的联邦学习医院选择方法,其特征在于,所述方法由联邦学习系统执行,所述联邦学习系统包括服务器和拥有本地医疗数据集的医院所在客户端,其特征在于,所述方法包括:
获取所有医院的资源异构性排序,所述资源异构性排序为考虑每家医院的本地计算能力和服务器的通信能力进行的由高到低的排序,该排序结果存储在服务器的资源异构性排序表中,所述资源异构性排序表是一个字典数据结构,对应的数据包括一个键值对,键值对包括键和值,键为医院的编号,值为该医院的排序号;
服务器进行初始化操作,服务器向全部医院分发初始模型,使用的模型结构为VGG16网络结构,所述初始模型是经服务器初始化得到的模型,其模型参数服从正态分布,各医院使用该初始模型和各自本地医疗数据进行训练并将训练得到的新模型回传给服务器,服务器使用FedAvg算法中的聚合步骤进行聚合操作,将聚合后的迭代模型再次分发给全部医院,所有医院计算本地医疗数据在该聚合后的迭代模型上的准确率,将各自的准确率返回给服务器,存储在一个准确率列表中,所述准确率列表是一个列表数据结构,按顺序存储各医院返回的准确率,索引值为医院的编号;
服务器对准确率列表中各医院的准确率由大到小进行排序操作,得到排序后的医院索引值,服务器分别按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式计算每类中含有的医院数量,并按准确率由大到小的顺序将医院分为五类;
服务器在每一类中对医院进行选择,分别在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10%、15%、20%、25%和30%的医院数量参与训练,并且选择每类中资源异构性排序靠前的医院;
服务器向被选择的医院发送迭代模型,各医院完成训练后将新模型回传给服务器,服务器使用FedAvg算法中的聚合步骤进行聚合操作;
服务器将聚合后的模型再次发送给全部医院,各医院计算各自本地医疗数据在该模型上的准确率,并将准确率返回给服务器,直至达到迭代轮数或模型收敛,得到用于完成异构医疗信息的联邦学习医院选择方法的全局模型。
2.根据权利要求1所述的异构医疗信息的联邦学习医院选择方法,其特征在于,服务器获取所有医院的资源异构性排序的步骤,包括:
由服务器向所有参与训练的医院分发第一初始模型和各医院训练轮数syncround,所述第一初始模型/>是使用的模型结构为VGG16网络结构,所述第一初始模型/>是经服务器初始化得到的模型,其模型参数服从正态分布;
所有医院接收服务器分发的第一初始模型并使用本地医疗数据集Di进行模型训练,回传训练所需的时间RTi,训练使用交叉熵损失函数,该损失函数由以下关系式获得:其中,w为模型参数,ni为医院i的本地数据集样本数,y*是数据标签的真实值,y是由卷积神经网络训练得出的值,为了使损失函数收敛,得到与真实标签最接近的预测值,求出损失函数梯度g下降的方向,梯度下降关系式为:/>其中,x为医院本地医疗数据集Di中的本地数据,最终损失函数收敛,梯度下降优化完成,结束训练过程;
服务器接收各医院的本地训练时间RTi,对所有RTi进行排序,即按照各医院的训练时间快慢进行排序,各医院按照训练时间由快到慢获得其排序号resource[i],其中,排序号取值范围为1~N,N为参与训练的医院总数,i为医院的编号,资源异构性排序结果存储在资源异构性排序表resource中,所述资源异构性排序表resource为字典数据结构,键为医院的编号i,值为该医院的排序号resource[i]。
3.根据权利要求2所述的异构医疗信息的联邦学习医院选择方法,其特征在于,服务器进行初始化操作并获取各医院准确率的步骤包括:
服务器向全部医院分发第二初始模型w0,所述第二初始模型w0是使用的模型结构为VGG16网络结构,所述第二初始模型w0是经服务器初始化得到的模型,其模型参数服从正态分布,所有N家医院使用该初始模型w0和本地医疗数据集Di进行训练并将训练得到的新模型回传给服务器;
服务器使用FedAvg算法进行聚合操作,将聚合后的迭代模型w1再次分发给全部医院;
所有医院计算本地训练数据Di在该模型w1上的准确率acci,将各自的准确率acci返回给服务器,存储在一个准确率列表acc中,所述准确率列表acc是一个列表数据结构,按顺序存储各医院返回的准确率acci,索引值i为医院的编号。
4.根据权利要求3所述的异构医疗信息的联邦学习医院选择方法,其特征在于,对准确率分类的过程为:
服务器对准确率列表acc中各医院的准确率acci由大到小进行排序操作,得到排序后医院的索引值,将其按顺序存入一个医院编号列表index中,所述医院编号列表index为一个列表数据结构,其存储的是按各医院准确率由大到小排序后各医院的编号i;
服务器分别按照医院总数的10%、15%、20%、25%和30%的比例,使用向上取整的方式按顺序将医院编号列表index分为五类即将所有的医院按照准确率分为不均匀的五类,所述五类中的医院准确率依次减小。
5.根据权利要求4所述的异构医疗信息的联邦学习医院选择方法,其特征在于,服务器在每一类中对医院进行选择的过程为:
服务器在类中对医院进行选择,分别在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10%、15%、20%、25%和30%的医院数量参与训练,同时结合存储在服务器的资源异构性排序表resource,按照排序的顺序在每一类中选择排序号较小的医院。
6.一种电子设备,包括存储器、处理器以及存储在所述存储器中并能够在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-5任一项所述的异构医疗信息的联邦学习医院选择方法的各步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一项所述的异构医疗信息的联邦学习医院选择方法的各步骤。
CN202310808640.4A 2023-07-04 2023-07-04 异构医疗信息的联邦学习医院选择方法、设备及存储介质 Active CN116936048B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310808640.4A CN116936048B (zh) 2023-07-04 2023-07-04 异构医疗信息的联邦学习医院选择方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310808640.4A CN116936048B (zh) 2023-07-04 2023-07-04 异构医疗信息的联邦学习医院选择方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN116936048A CN116936048A (zh) 2023-10-24
CN116936048B true CN116936048B (zh) 2024-03-19

Family

ID=88387118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310808640.4A Active CN116936048B (zh) 2023-07-04 2023-07-04 异构医疗信息的联邦学习医院选择方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116936048B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444263A (zh) * 2019-08-21 2019-11-12 深圳前海微众银行股份有限公司 基于联邦学习的疾病数据处理方法、装置、设备及介质
CN112201342A (zh) * 2020-09-27 2021-01-08 博雅正链(北京)科技有限公司 基于联邦学习的医疗辅助诊断方法、装置、设备及存储介质
CN113133768A (zh) * 2021-04-21 2021-07-20 东南大学 基于联邦学习的心血管疾病辅助诊断模型及训练方法
CN113792856A (zh) * 2021-09-09 2021-12-14 电子科技大学 基于vae医疗保健联邦学习框架的确定方法
CN114385376A (zh) * 2021-12-09 2022-04-22 北京理工大学 一种异构数据下边缘侧联邦学习的客户端选择方法
CN114528304A (zh) * 2022-02-18 2022-05-24 安徽工业大学 一种自适应客户端参数更新的联邦学习方法、系统及存储介质
CN114566277A (zh) * 2022-02-24 2022-05-31 中国石油大学(华东) 一种基于联邦元学习的罕见疾病分类方法
CN114822863A (zh) * 2022-05-12 2022-07-29 浙江大学 基于联邦学习系统的医疗数据分析方法、设备、存储介质和程序产品
CN115470932A (zh) * 2022-09-06 2022-12-13 哈尔滨理工大学 基于强化学习的联邦学习客户端智能选择方法
CN115547437A (zh) * 2022-09-21 2022-12-30 哈尔滨理工大学 一种基于医疗联邦方的训练系统及训练方法
CN115600691A (zh) * 2022-09-22 2023-01-13 深圳大学(Cn) 联邦学习中的客户端选择方法、系统、装置和存储介质
CN115881306A (zh) * 2023-02-22 2023-03-31 中国科学技术大学 基于联邦学习的网络化icu智能医疗决策方法及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110444263A (zh) * 2019-08-21 2019-11-12 深圳前海微众银行股份有限公司 基于联邦学习的疾病数据处理方法、装置、设备及介质
CN112201342A (zh) * 2020-09-27 2021-01-08 博雅正链(北京)科技有限公司 基于联邦学习的医疗辅助诊断方法、装置、设备及存储介质
CN113133768A (zh) * 2021-04-21 2021-07-20 东南大学 基于联邦学习的心血管疾病辅助诊断模型及训练方法
CN113792856A (zh) * 2021-09-09 2021-12-14 电子科技大学 基于vae医疗保健联邦学习框架的确定方法
CN114385376A (zh) * 2021-12-09 2022-04-22 北京理工大学 一种异构数据下边缘侧联邦学习的客户端选择方法
CN114528304A (zh) * 2022-02-18 2022-05-24 安徽工业大学 一种自适应客户端参数更新的联邦学习方法、系统及存储介质
CN114566277A (zh) * 2022-02-24 2022-05-31 中国石油大学(华东) 一种基于联邦元学习的罕见疾病分类方法
CN114822863A (zh) * 2022-05-12 2022-07-29 浙江大学 基于联邦学习系统的医疗数据分析方法、设备、存储介质和程序产品
CN115470932A (zh) * 2022-09-06 2022-12-13 哈尔滨理工大学 基于强化学习的联邦学习客户端智能选择方法
CN115547437A (zh) * 2022-09-21 2022-12-30 哈尔滨理工大学 一种基于医疗联邦方的训练系统及训练方法
CN115600691A (zh) * 2022-09-22 2023-01-13 深圳大学(Cn) 联邦学习中的客户端选择方法、系统、装置和存储介质
CN115881306A (zh) * 2023-02-22 2023-03-31 中国科学技术大学 基于联邦学习的网络化icu智能医疗决策方法及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Federated Meta Learning Enhanced Acoustic Radio Cooperative Framework for Ocean of Things Underwater Acoustic Communications";Hao Zhao et al;《arxiv》;1-11 *
"Towards efficient federated learning-based scheme in medical cyber-physical systems for distributed data";Kehua Guo et al;《WILEY》;2274–2289 *
"基于标签量信息的联邦学习节点选择算法";马嘉华 等;《物联网学报》;第5卷(第4期);46-53 *

Also Published As

Publication number Publication date
CN116936048A (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
CN112308157B (zh) 一种面向决策树的横向联邦学习方法
CN113469373A (zh) 基于联邦学习的模型训练方法、系统、设备及存储介质
CN116501711A (zh) 一种基于“存算分离”架构的算力网络任务调度方法
CN112288087A (zh) 一种神经网络剪枝方法、装置、电子设备及存储介质
WO2023036184A1 (en) Methods and systems for quantifying client contribution in federated learning
CN113537509A (zh) 协作式的模型训练方法及装置
CN116263681A (zh) 移动边缘计算任务卸载方法、装置、设备及存储介质
CN115600691A (zh) 联邦学习中的客户端选择方法、系统、装置和存储介质
Qi et al. Graph neural bandits
CN116936048B (zh) 异构医疗信息的联邦学习医院选择方法、设备及存储介质
CN117575044A (zh) 数据遗忘学习方法、装置、数据处理系统和存储介质
CN117523291A (zh) 基于联邦知识蒸馏和集成学习的图像分类方法
CN109101329A (zh) 通过多个移动终端采集数据的细粒度任务分配方法及系统
CN115454608A (zh) 基于权值散度和更新增量的联邦学习客户端调度方法
CN114912627A (zh) 推荐模型训练方法、系统、计算机设备及存储介质
CN112396325B (zh) 案件处理方法、装置、介质及电子设备
CN115016911A (zh) 面向大规模联邦学习的任务编排方法、装置、设备和介质
CN114861936A (zh) 一种基于特征原型的联邦增量学习方法
CN114217933A (zh) 多任务调度方法、装置、设备以及存储介质
CN113887495A (zh) 基于迁移学习的视频标注方法及装置
CN110942345A (zh) 种子用户的选取方法、装置、设备及存储介质
CN111312368A (zh) 一种基于边缘计算的加速医学图像处理速度的方法
CN117557870B (zh) 基于联邦学习客户端选择的分类模型训练方法及系统
Juan et al. Enhancing Communication Efficiency and Training Time Uniformity in Federated Learning through Multi-Branch Networks and the Oort Algorithm
CN114862606B (zh) 一种基于云服务的保险信息处理方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant