CN116936048B

CN116936048B - 异构医疗信息的联邦学习医院选择方法、设备及存储介质

Info

Publication number: CN116936048B
Application number: CN202310808640.4A
Authority: CN
Inventors: 张凌羽; 康健; 李强
Original assignee: Jilin University
Current assignee: Jilin University
Priority date: 2023-07-04
Filing date: 2023-07-04
Publication date: 2024-03-19
Anticipated expiration: 2043-07-04
Also published as: CN116936048A

Abstract

本发明公开了一种异构医疗信息的联邦学习医院选择方法、设备及存储介质，属于医疗系统数据分析技术领域，所述方法应用于电子设备，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现第一方面提供的基于妇产科异构医疗信息的联邦学习医院选择方法的各步骤。所述方法通过计算各医院本地计算和通信速度，并通过准确率将医院分类进行不均匀采样的方式，打破了传统联邦学习全部客户端参与训练或均匀抽样的方式，同时考虑了资源异构性和数据异构性，加快训练速度，减少通信轮数，并且可以获得更好的模型精度，在以后使用新的疾病影像进行诊断时，可以提高对疾病分类判断的准确性，减少误诊率，增加各医院医生的诊断效率。

Description

异构医疗信息的联邦学习医院选择方法、设备及存储介质

技术领域

本发明涉及医疗系统数据分析技术领域，特别是涉及一种异构医疗信息的联邦学习医院选择方法、设备及存储介质。

背景技术

联邦学习作为分布式机器学习范式，可以有效解决数据孤岛问题，让各参与方在不共享数据的基础上联合建模，能从技术上打破数据孤岛，实现协作。因此，医院出于保证患者隐私的目的，选择使用联邦学习的方法协作训练医疗诊断模型，期望通过患者的疾病影像资料可以得出初步诊断。

但是，在实际应用过程中存在着异构性问题。各医院在实际场景、存储、本地计算、通信速度等方面都存在着较大差异性，这是资源异构性的问题。数据异构性是各医院在训练中使用的影像资料数据样本数量不同，并且由于各医院所处地理位置不同导致好发疾病类型不同、擅长治疗的疾病类别不同，因此各医院之间的疾病数据类别和特征分布也不均匀。

目前所存在的联邦学习算法只是解决资源异构性和数据异构性两种异构性其中的一种，即并没有同时解决资源和数据异构性。

发明内容

有鉴于此，本发明的目的是提供一种异构医疗信息的联邦学习医院选择方法、设备及存储介质，可以有效同时解决资源异构性和数据异构性，增加训练效率并且获得更好的模型精度。

为实现上述目的，本发明采用如下技术方案：

本发明实施例的第一方面提供了一种异构医疗信息的联邦学习医院选择方法，包括：

获取所有医院的资源异构性排序，所述资源异构性排序为考虑每家医院的本地计算能力和服务器的通信能力进行的由高到低的排序，该排序结果存储在服务器的资源异构性排序表中，所述资源异构性排序表是一个字典数据结构，对应的数据包括一个键值对，键值对包括键和值，键为医院的编号，值为该医院的排序号；

服务器进行初始化操作，服务器向全部医院分发初始模型，使用的模型结构为VGG16网络结构，包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层)，所述初始模型是经服务器初始化得到的模型，其模型参数服从正态分布，所有医院使用该初始模型和本地医疗数据进行训练并将训练得到的新模型回传给服务器，服务器使用FedAvg算法中的聚合步骤进行聚合操作，将聚合后的迭代模型再次分发给全部医院，所有医院计算本地医疗数据在该聚合后的迭代模型上的准确率，将各自的准确率返回给服务器，存储在一个准确率列表中，所述准确率列表是一个列表数据结构，按顺序存储各医院返回的准确率，索引值为医院的编号；

服务器对准确率列表中各医院的准确率由大到小进行排序操作，得到排序后的医院索引值，服务器分别按照医院总数的10％、15％、20％、25％和30％的比例，使用向上取整的方式计算每类中含有的医院数量，即若总共有N家医院参与训练，则每类中含有医院10％*N,15％*N,…,30％*N的数量，并按准确率由大到小的顺序将医院分为五类，所述分类准确率依次减小。此处举例说明：若有100家医院，将这100家医院的准确率进行由大到小的排序，然后将准确率最高的10家医院分为第一类，接下来第11至第25家医院为第二类，第26至第45家医院为第三类，第46至第70家医院为第四类，第71至100家医院为第五类，这五大类医院整体准确率依次减少，并且每类中医院有尽可能近似的准确率；

服务器在每一类中对医院进行选择，在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10％、15％、20％、25％和30％的医院数量参与训练，即若每一轮中选择m家医院参与训练，则在五类中按顺序分别选择10％*m,15％*m,…,30％*m数量的医院，同时结合存储在服务器的资源异构性排序表，按照排序的顺序在每一类中对医院进行选择。此处举例说明：若有100家医院，每一轮次需要选择其中10家医院参加训练，此时已将全部医院按照准确率分为了五类，每一类中分别有10、15、20、25、30家医院，那么在对医院的选择中需要分别在每类中选择1、1、2、2、4家医院参与训练，并且在每一类中选择时同时考虑资源异构性排序表，选择资源异构性排序最靠前的医院参加训练。

通过使用本发明提出的异构医疗信息的联邦学习医院选择方法，可以解决资源异构性，加快联邦学习整体训练速度，减少达到收敛时所需的训练轮次，减少了整体训练时间；可以解决数据异构性，增强对代表性数据的选择，获得更好的模型精度，在以后使用新的疾病影像进行诊断时，可以提高对疾病分类判断的准确性，减少误诊率，增加各医院医生的诊断效率。

结合第一方面，在第一方面的第一种可能实现方式中，服务器获取所有医院的资源异构性排序的步骤，包括：

由服务器向所有参与训练的医院分发第一初始模型和各医院训练轮数sync_round，所述第一初始模型/>是使用的模型结构为VGG16网络结构，包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层)，所述第一初始模型/>是经服务器初始化得到的模型，其模型参数服从正态分布，用于进行资源异构性排序的测试；

所有医院接收服务器分发的第一初始模型使用本地医疗数据集D_i进行模型训练，回传训练所需的时间RT_i，训练使用交叉熵损失函数，该损失函数由以下关系式获得：其中，w为模型参数，n_i为医院i的本地数据集样本数，y^*是数据标签的真实值，y是由卷积神经网络训练得出的值，为了使损失函数收敛，得到与真实标签最接近的预测值，求出损失函数梯度g下降的方向，梯度下降关系式为：/>其中，x为医院本地医疗数据集D_i中的本地数据，最终损失函数收敛，梯度下降优化完成，训练过程就结束了；

服务器接收各医院的本地训练时间RT_i，对所有RT_i进行排序，即按照各医院的训练时间快慢进行排序，各医院按照训练时间由快到慢获得其排序号resource[i]，其中，排序号取值范围为1～N，N为参与训练的医院总数，i为医院的编号，资源异构性排序结果存储在资源异构性排序表resource中，所述资源异构性排序表resource为字典数据结构，键为医院的编号i，值为该医院的排序号resource[i]。

结合第一方面，在第一方面的第二种可能实现方式中，服务器进行初始化操作并获取各医院准确率的步骤，包括：

服务器向全部医院分发第二初始模型w₀，所述第二初始模型w₀是使用的模型结构为VGG16网络结构，包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层)，所述第二初始模型w₀是经服务器初始化得到的模型，其模型参数服从正态分布，所有N家医院使用该初始模型w₀和本地医疗数据集D_i进行训练并将训练得到的新模型回传给服务器；

服务器使用FedAvg算法进行聚合操作，将聚合后的迭代模型w₁再次分发给全部医院，所述FedAvg算法包含对医院的选择步骤和对模型的聚合方法，在本发明所有聚合步骤中只使用该算法对模型的聚合方法，该方法为业内应用最为广泛效率最高的聚合方法；

所有医院计算本地训练数据D_i在该迭代模型w₁上的准确率acc_i，将各自的准确率acc_i返回给服务器，存储在一个准确率列表acc中，所述准确度列表acc是一个列表数据结构，按顺序存储各医院返回的准确率acc_i，索引值i为医院的编号。

结合第一方面的第二种可能实现方式，在第一方面的第三种可能实现方式中服务器对准确率列表acc中各医院的准确率acc_i由大到小进行排序操作，得到排序后医院的索引值，将其按顺序存入一个医院编号列表index中，所述医院编号列表index为一个列表数据结构，存储的为按各医院准确率由大到小排序后各医院的编号i；

服务器分别按照医院总数的10％、15％、20％、25％和30％的比例，使用向上取整的方式按顺序将医院编号列表index分为五类即将所有的医院按照准确率分为不均匀的五类，所述五类中的医院准确率依次减小。

结合第一方面的第一种和第三种可能实现方式，在第一方面的第四种可能实现方式中服务器在类中对医院进行选择，在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10％、15％、20％、25％和30％的医院数量参与训练，同时结合存储在服务器的资源异构性排序表resource，按照排序的顺序在每一类中选择排序号较小的医院，即优先选择本地计算速度更快的医院。

结合第一方面，在第一方面的第五种可能实现方式中，获取联邦学习模型训练过程中若干医院执行模型训练后回传迭代模型的步骤，包括：

获取联邦学习医疗信息的训练任务，所述训练任务中包含有初始化训练模型以及训练轮数等任务所需参数；

服务器将所述初始化训练模型下发至若干医院分别进行训练，使所述医院执行模型训练后回传迭代模型，其中，所述若干医院的选择根据第四种可能实现方式中的选择方法决定；

服务器接收参与训练的医院回传的迭代模型，使用FedAvg算法进行聚合，更新模型。

本发明实施例的第二方面提供了一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序，所述处理器执行所述计算机程序时实现第一方面提供的异构医疗信息的联邦学习医院选择方法的各步骤。

本发明实施例的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现第一方面提供的异构医疗信息的联邦学习医院选择方法的各步骤。

通过上述设计方案，本发明可以带来如下有益效果：本发明提出一种异构医疗信息的联邦学习医院选择方法、设备及存储介质，本发明的异构医疗信息的联邦学习医院选择方法在各医院联合采用联邦学习方式训练一个医疗模型的过程中，首先根据各医院本地资源和医疗信息数据进行资源异构性排序，本地计算能力和通信能力越强的医院排序号越小，在选择步骤中优先被选择，加快联邦学习整体训练速度，解决资源异构性；同时对各医院本地数据在现有模型上的准确率进行计算，通过准确率将医院分类，准确率越低的类别中所含医院数量越多，每一轮次该类中被选择的医院也越多，即认为准确率低的医院在现阶段并未得到良好训练，在接下来的训练中应作出更大贡献，增加被选择的次数，解决数据异构性。本发明通过计算各医院本地计算和通信速度，并通过准确率将医院分类进行不均匀采样的方式，打破了传统联邦学习全部医院参与训练或均匀抽样的方式，同时考虑了资源异构性和数据异构性，加快训练速度，减少通信轮数，并且可以获得更好的模型精度，在以后使用新的疾病影像进行诊断时，可以提高对疾病分类判断的准确性，减少误诊率，增加各医院医生的诊断效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明示意性实施例及其说明用于理解本发明，并不构成本发明的不当限定，在附图中：

图1是本发明实施例提供的异构医疗信息的联邦学习医院选择方法总体步骤流程图；

图2为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中计算资源异构性排序的流程示意图；

图3为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中初始化计算准确率的流程示意图；

图4为本发明实施例提供的异构医疗信息的联邦学习医院选择方法对准确率分类流程示意图；

图5为本发明实施例提供的异构医疗信息的联邦学习医院选择方法进行医院选择的流程示意图；

图6为本发明实施例提供的异构医疗信息的联邦学习医院选择方法模型聚合流程示意图；

图7为本发明实施例提供的一种电子设备的基本结构框图。

具体实施方式

为了更清楚地说明本发明，下面结合优选实施例和附图对本发明做进一步的说明。本领域技术人员应当理解，下面所具体描述的内容是说明性的而非限制性的，不应以此限制本发明的保护范围。除非另作定义，此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。为了避免混淆本发明的实质，公知的方法、过程、流程并没有详细叙述。

本发明应用在若干医院使用患者医疗影像数据集，应用联邦学习方法协同训练一个医学诊断模型，包含有一个可信的第三方服务器和若干家医院。在本申请实施例中，包含一个可信的第三方服务器和总计一百家三甲医院，所有医院共同训练一个妇产科医学诊断模型，包括以下十种妇产科诊断：子宫肌瘤、卵巢畸胎瘤、卵巢子宫内膜异位症、异位妊娠、妊娠状态、葡萄胎、子宫内膜癌、子宫腺肌病、卵巢恶性肿瘤和宫颈恶性肿瘤。其中，各医院实现的软件版本为python 3.7.0，PyTorch 1.2.0，各医院使用的模型结构为VGG16网络结构，包含了16个隐藏层(16个隐藏层包括13个卷积层和3个全连接层)，各医院本地使用的数据集是这些疾病的医疗影像图像，因为医院所处地区和医院规模不同，因此每家医院的疾病影像图像数据量和疾病类型并不统一，并且每家医院本地的计算和通信能力也并不一致，在联邦学习的模型训练中会存在资源和数据异构性，会影响训练速度，并且在最终的模型上可能会产生偏差，影响训练得到的最终全局模型的精度，影响使用该模型进行诊断的准确率。本发明可以同时解决资源异构性和数据异构性问题，加快训练速度，减少通信轮数，并且获得更好的模型精度，提升对相关疾病进行初步诊断的准确率。

在本申请实施例中，被选择的医院通过接收器从服务器接收机器学习模型并对该接收到的机器学习模型进行存储，通过学习器执行联邦学习过程中每一轮次的模型训练，如使用本地的医疗数据对机器学习模型进行更新，然后将更新后的机器学习模型上传到服务器。服务器接收回传的更新后的机器学习模型后，通过其内置的聚合器将从各个医院获取到的机器学习模型进行聚合来获得新的全局模型，以及通过其内置的评估器对医院进行异构性排序和准确率分类，所述机器学习模型为一个卷积神经网络模型。

请参阅图1，图1为本申请第一实施例提供的一种异构医疗信息的联邦学习医院选择方法的整体实现流程图。详述如下：

步骤S1：服务器初始化机器学习模型，得到第一初始模型所述第一初始模型/>是服务器随机初始化获得的模型，使用的模型结构为VGG16网络结构，仅用于进行资源异构性排序的测试，服务器将第一初始模型/>和各医院训练轮数sync_round发给全部参与训练的医院，所述训练轮数sync_round是步骤S2中各医院需要本地训练的轮数；

步骤S2：所有医院接收服务器发送的第一初始模型和训练轮数sync_round，使用本地医疗数据集D_i进行模型训练，回传训练所需的时间RT_i，重复sync_round次，服务器接收返回的时间RT_i进行求和并且进行排序；

步骤S3：服务器向全部医院分发第二初始模型w₀，所述第二初始模型w₀是经服务器初始化得到的模型，但由于模型参数是从正态分布中随机得到，因此与第一初始模型是相同的模型结构，但相关模型参数不同，第二初始模型w₀用于以后的训练阶段，所有医院使用该第二初始模型w₀和本地医疗数据集D_i进行训练并将训练得到N家医院的新模型回传给服务器，服务器使用FedAvg算法中的聚合步骤进行聚合操作，将聚合后的迭代模型w₁再次分发给全部医院，所有医院计算本地训练数据D_i在该模型w₁上的准确率acc_i，将各自的准确率acc_i返回给服务器；

步骤S4：服务器对各医院的准确率acc_i由大到小进行排序，并按照医院总数的10％、15％、20％、25％和30％的比例，使用向上取整的方式按顺序将医院分为五类

步骤S5：服务器在类中对医院进行选择，在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10％、15％、20％、25％和30％的医院数量参与训练，并且参考步骤S2中得到的资源异构性排序，在每类的医院中选择资源异构性排序靠前的医院；

步骤S6：服务器向被选择的医院发送迭代模型w_r，该迭代模型w_r是第二初始模型w₀经过r轮训练后得到的模型，迭代模型w_r使用的模型结构为VGG16网络结构，医院使用本地数据集D_i进行模型更新后得到模型将模型/>上传回服务器，模型/>是经过第r+1轮训练第i家医院得到的模型，服务器采用FedAvg算法进行聚合操作；

步骤S7：服务器将聚合后新的迭代模型w_r+1分发给全部医院，该迭代模型w_r+1是经过r+1轮训练后各医院将模型上传至服务器经服务器聚合后得到的模型，医院使用本地数据集D_i在迭代模型w_r+1上计算准确率acc_i，将各自的准确率acc_i返回给服务器；

步骤S8：重复步骤S4～S7，直到达到迭代轮数或模型收敛。

以上可以看出，本实施例提供的异构医疗信息的联邦学习医院选择方法，通过计算资源异构性排序，本地训练吞吐量越大的医院其资源异构性排序越靠前，被选择的概率就越大，优先选择这些医院就可以加快训练速度，减少延迟，可以解决资源异构性问题；通过考虑模型在本地训练集上的准确率，准确率低的医院视为其本地代表性医疗数据没有在全局模型(即最终训练得到的模型)中得到体现，应该在下一轮训练中作出更大的贡献，可以解决数据异构性问题；将资源异构性和数据异构性综合考虑，可以同时解决资源异构性和数据异构性问题，加快收敛，获得更好的模型精度。

本发明的一些实施例中，请参阅图2，图2为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中计算资源异构性排序的流程示意图。详细如下：

步骤S21：所有医院接收服务器分发的第一初始模型和训练所需要的轮数sync_round；

步骤S22：所有医院使用第一初始模型和其本地医疗数据集D_i进行一轮模型训练，记录实际训练时间RT_i，并将其回传到服务器，此步骤重复sync_round次；

步骤S23：服务器接收各医院的本地训练时间RT_i，分别对各医院的RT_i进行求和，按照RT_i值的大小进行排序，将排序结果存储在资源异构性排序表resource中。

本实施例中，服务器向所有医院分发第一初始模型和配置参数sync_round后，要求医院对其本地数据D_i进行训练，每一轮等待T_max时间，在T_max时间内完成本地训练并返回本地训练时间RT_i的医院，服务器正常记录，超过T_max时间未返回的医院，服务器视为该医院处于掉线状态，时间按照T_max递增。本地训练使用交叉熵损失函数，该损失函数由以下关系式获得：/>其中，w为模型参数，n_i为医院i的本地数据集样本数，y^*是数据标签的真实值，y是由卷积神经网络训练得出的值，为了使损失函数收敛，得到与真实标签最接近的预测值，求出损失函数梯度g下降的方向，梯度下降关系式为：/> 其中，x为医院的本地数据，最终损失函数收敛，梯度下降优化完成，训练过程就结束了，在训练轮次完毕后，对于T_i＝sync_round*T_max的医院视为掉线状态，不再参与接下来的训练。服务器接收各医院的本地训练时间RT_i，对RT_i进行求和操作，然后按照RT_i值的大小进行由小到大的排序，按照每家医院i的排序位置赋予每家医院排序号resourec[i]，其中，排序号取值范围为1～N，N为参与训练的医院总数，i为医院的编号，资源异构性排序结果存储在资源异构性排序表resource中，所述资源异构性排序表resource为字典数据结构，键为医院的编号i，值为该医院的排序号resource[i]。

本发明的一些实施例中，请参阅图3，图3为本发明实施例提供的异构医疗信息的联邦学习医院选择方法中初始化计算准确率的流程示意图。详细如下：

步骤S31：服务器向全部医院分发第二初始模型w₀，所述第二初始模型w₀是经服务器初始化得到的模型；

步骤S32：所有医院(共N家)使用该第二初始模型w₀和本地医疗数据集D_i进行训练并将所有医院(共N家)训练得到的新模型回传给服务器端；

步骤S33：服务器使用FedAvg算法进行聚合操作，将聚合后的迭代模型w₁再次分发给全部医院；

步骤S34：所有医院计算本地训练数据D_i在该迭代模型w₁上的准确率acc_i，将各自的准确率acc_i返回给服务器，存储在一个准确率列表acc中。

本实施例中，服务器进行初始化操作，在初始化阶段将模型w₀分发给全部参与训练的医院，所有医院都使用该模型w₀和每家医院本地的医疗数据D_i进行一轮训练，将训练后的模型回传给服务器进行聚合操作，服务器再将更新后的模型w₁分发给全部医院，各计算计算本地医疗数据D_i在更新模型上的准确率，经过分析，可知此准确率反应了每家医院其本地医疗数据D_i对模型w₁的贡献情况，准确率低的医院的医疗数据在之前的全局训练轮次中没有得到很好的训练，以至于全局模型对于该医院的本地数据准确率较低，即该医院存在代表性数据没有被选择加入模型训练，以至于模型出现偏差导致模型在该数据上准确率较低，因此在以后的训练中该医院应该作出更大的贡献，即在以后的训练中应该有更大的概率被选择参加训练。

本发明的一些实施例中，请参阅图4，图4为本发明实施例提供的异构医疗信息的联邦学习医院选择方法对准确率分类流程示意图。详细如下：

步骤S41：服务器对准确率列表acc中各医院的准确率acc_i进行由大到小的排序操作；

步骤S42：将排序后的医院编号按顺序存入一个医院编号列表index中；

步骤S43：服务器分别按照医院总数的10％、15％、20％、25％和30％的比例，使用向上取整的方式按顺序将医院编号列表index分为五类

本实施例中，数据在模型上的准确率反应了每家医院其本地医疗数据对模型的贡献情况，准确率低的医院有代表性数据没有得到足够的训练，以至于模型出现偏差导致模型在该数据上准确率较低，同时也反应了每家医院的非独立同分布数据的分布情况，准确率近似的医院的数据分布也很可能是近似的。按照准确率进行不均匀分类以便使准确率较低的类别中存在的医院数量较多，从而在下一轮次的训练中这些准确率低的医院可以有更大的数量和概率参与训练，提高模型精度，减少误诊率。

本发明的一些实施例中，请参阅图5，图5为本发明实施例提供的异构医疗信息的联邦学习医院选择方法进行医院选择的流程示意图。详细如下：

步骤S51：服务器计算每一类中医院的选择数量，在每一类中采用向下取整的方式计算需要选择医院总数的10％、15％、20％、25％和30％的医院数量参与训练；

步骤S52：在每一类中按照资源异构性排序表resource的顺序选择所需数量的医院，加入到选择列表S_t中。

本实施例中，一轮训练总共需要选择m家医院，m＝m₁+m₂+m₃+m₄+m₅，在类中分别含有M₁,M₂,…,M₅家医院，首先分别计算每一类中医院的选择数量m₁,m₂,…,m₅。服务器使用向下取整的方式进行计算/>这里用到的K_i分别取10％、15％、20％、25％和30％。接下来在每一类中进行选择，此时查找资源异构性排序表resource，在每一类中选择在资源异构性排序表resource中前m_i家医院，将这些医院加入到选择列表S_t中。因为计算准确率分类的步骤每一轮训练结束都需要进行一次，并且因为各医院参与训练的情况不同其准确率也应当是动态变化的，因此基于准确率的分类也是动态变化的，同时为每家医院设置一个被选择上限credit_i＝15，每被选择一次该值减少一，当减少为0时该医院不再参与训练，因此不会出现过度选择相同医院造成过拟合的情况。

本发明的一些实施例中，请参阅图6，图6为本发明实施例提供的异构医疗信息的联邦学习医院选择方法模型聚合流程示意图。详细如下：

步骤S61：服务器根据选择列表S_t选择参加训练的医院i，将全局模型w_r分发给被选择的医院i；

步骤S62：医院i接收全局模型w_r，使用医院的本地数据进行训练，得到更新后的模型将模型回传给服务器；

步骤S63：服务器接收各医院传回的更新模型进行聚合操作，得到新的全局模型w_r+1。

本实施例中，服务器将全局模型w_r广播给选择列表中的医院i，服务器将被选择的医院的credit_i值减少一，医院i将接收到的模型作为本轮训练的初始模型，利用医院的本地数据进行训练，用w_r和本地数据计算梯度所述F_i(w)为损失函数，然后更新模型/>η是执行梯度下降所使用的学习率。将更新模型/>上传到服务器，服务器接收更新模型/>使用FedAvg算法进行聚合操作，即计算各医院更新模型/>的平均值，具体计算方式如下：/>其中，K为选中参与训练的医院数量，n_i是医院i的数据样本数量。

表1展示了使用本发明和使用传统联邦学习方法FedAvg进行100轮训练的准确度对比，FedAvg方法首先提出了随机选择若干个客户端采样(此处客户端即为各家医院)，对这若干个客户端的梯度进行平均以形成全局更新，同时用当前得到的新的全局模型W_r+1替换未采样的客户端的模型W_r。在使用默认方法的情况下，在全局训练100轮次的情况下，模型准确率只有40.20％，而在应用本发明后，在同样情况下，模型准确率可以提升到63.21％。由此可见，本发明可以很好解决在联邦学习训练中的异构性问题。

表1

表2展示了使用本发明和使用传统联邦学习方法FedAvg进行训练达到收敛时所需通信轮数对比，在使用默认方法的情况下，在250轮达到收敛，而在应用本发明后，可以在190轮达到收敛。

表2

联邦学习方法	达到收敛所需通信轮数
		默认方法(FedAvg)	250
本发明	190

表3展示了使用本发明和使用传统联邦学习方法FedAvg进行训练100轮次所需训练时间对比，在使用默认方法的情况下，训练100轮次需要290分钟，而在应用本发明后，训练100轮次需要235分钟，节约了20％的训练时间。

表3

联邦学习方法	训练100轮次所需训练时间
		默认方法(FedAvg)	290分钟
本发明	240分钟

本发明的一些实施例中，请参阅图7，图7为本发明实施例提供的一种电子设备的基本结构框图。如图7所示，该实施例的电子设备7包括：处理器71、存储器72和存储在所述存储器72中并能够在所述处理器71上运行的计算机程序73，例如异构医疗信息的联邦学习医院选择方法程序。处理器71执行所述计算机程序73时实现上述各个异构医疗信息的联邦学习医院选择方法各实施例中的步骤。具体请参阅实施例中的相关描述，此处不再赘述。

示例性的，所述计算机程序73可以被分割成一个或多个模块(单元)，所述一个或者多个模块被存储在所述存储器72中，并由所述处理器71执行，以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如，所述计算机程序73可以被分割成获取模块、处理模块和执行模块，各模块具体功能如上所述。

所述处理器71可以是中央处理单元(CPU)，还可以是其他通用处理器。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器72可以是所述电子设备7的内部存储单元，例如电子设备7的硬盘或内存。所述存储器72也可以是所述电子设备7的外部存储设备，例如所述电子设备7上配备的插接式硬盘，智能存储卡(SMC)，安全数字卡(SD)，闪存卡(Flash Card)等。进一步地，所述存储器72还可以既包括所述电子设备7的内部存储单元也包括外部存储设备。所述存储器72用于存储所述计算机程序，所述存储器72还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。在本实施例中，所述计算机可读存储介质可以是非易失性，也可以是易失性。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.异构医疗信息的联邦学习医院选择方法，其特征在于，所述方法由联邦学习系统执行，所述联邦学习系统包括服务器和拥有本地医疗数据集的医院所在客户端，其特征在于，所述方法包括：

服务器进行初始化操作，服务器向全部医院分发初始模型，使用的模型结构为VGG16网络结构，所述初始模型是经服务器初始化得到的模型，其模型参数服从正态分布，各医院使用该初始模型和各自本地医疗数据进行训练并将训练得到的新模型回传给服务器，服务器使用FedAvg算法中的聚合步骤进行聚合操作，将聚合后的迭代模型再次分发给全部医院，所有医院计算本地医疗数据在该聚合后的迭代模型上的准确率，将各自的准确率返回给服务器，存储在一个准确率列表中，所述准确率列表是一个列表数据结构，按顺序存储各医院返回的准确率，索引值为医院的编号；

服务器对准确率列表中各医院的准确率由大到小进行排序操作，得到排序后的医院索引值，服务器分别按照医院总数的10％、15％、20％、25％和30％的比例，使用向上取整的方式计算每类中含有的医院数量，并按准确率由大到小的顺序将医院分为五类；

服务器在每一类中对医院进行选择，分别在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10％、15％、20％、25％和30％的医院数量参与训练，并且选择每类中资源异构性排序靠前的医院；

服务器向被选择的医院发送迭代模型，各医院完成训练后将新模型回传给服务器，服务器使用FedAvg算法中的聚合步骤进行聚合操作；

服务器将聚合后的模型再次发送给全部医院，各医院计算各自本地医疗数据在该模型上的准确率，并将准确率返回给服务器，直至达到迭代轮数或模型收敛，得到用于完成异构医疗信息的联邦学习医院选择方法的全局模型。

2.根据权利要求1所述的异构医疗信息的联邦学习医院选择方法，其特征在于，服务器获取所有医院的资源异构性排序的步骤，包括：

由服务器向所有参与训练的医院分发第一初始模型和各医院训练轮数sync_round，所述第一初始模型/>是使用的模型结构为VGG16网络结构，所述第一初始模型/>是经服务器初始化得到的模型，其模型参数服从正态分布；

所有医院接收服务器分发的第一初始模型并使用本地医疗数据集D_i进行模型训练，回传训练所需的时间RT_i，训练使用交叉熵损失函数，该损失函数由以下关系式获得：其中，w为模型参数，n_i为医院i的本地数据集样本数，y^*是数据标签的真实值，y是由卷积神经网络训练得出的值，为了使损失函数收敛，得到与真实标签最接近的预测值，求出损失函数梯度g下降的方向，梯度下降关系式为：/>其中，x为医院本地医疗数据集D_i中的本地数据，最终损失函数收敛，梯度下降优化完成，结束训练过程；

3.根据权利要求2所述的异构医疗信息的联邦学习医院选择方法，其特征在于，服务器进行初始化操作并获取各医院准确率的步骤包括：

服务器向全部医院分发第二初始模型w₀，所述第二初始模型w₀是使用的模型结构为VGG16网络结构，所述第二初始模型w₀是经服务器初始化得到的模型，其模型参数服从正态分布，所有N家医院使用该初始模型w₀和本地医疗数据集D_i进行训练并将训练得到的新模型回传给服务器；

服务器使用FedAvg算法进行聚合操作，将聚合后的迭代模型w₁再次分发给全部医院；

所有医院计算本地训练数据D_i在该模型w₁上的准确率acc_i，将各自的准确率acc_i返回给服务器，存储在一个准确率列表acc中，所述准确率列表acc是一个列表数据结构，按顺序存储各医院返回的准确率acc_i，索引值i为医院的编号。

4.根据权利要求3所述的异构医疗信息的联邦学习医院选择方法，其特征在于，对准确率分类的过程为：

服务器对准确率列表acc中各医院的准确率acc_i由大到小进行排序操作，得到排序后医院的索引值，将其按顺序存入一个医院编号列表index中，所述医院编号列表index为一个列表数据结构，其存储的是按各医院准确率由大到小排序后各医院的编号i；

5.根据权利要求4所述的异构医疗信息的联邦学习医院选择方法，其特征在于，服务器在每一类中对医院进行选择的过程为：

服务器在类中对医院进行选择，分别在每一类中采用向下取整的方式选择每一轮参与训练的医院总数的10％、15％、20％、25％和30％的医院数量参与训练，同时结合存储在服务器的资源异构性排序表resource，按照排序的顺序在每一类中选择排序号较小的医院。

6.一种电子设备，包括存储器、处理器以及存储在所述存储器中并能够在电子设备上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1-5任一项所述的异构医疗信息的联邦学习医院选择方法的各步骤。

7.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-5任一项所述的异构医疗信息的联邦学习医院选择方法的各步骤。