CN112508907A - 一种基于联邦学习的ct图像检测方法及相关装置 - Google Patents
一种基于联邦学习的ct图像检测方法及相关装置 Download PDFInfo
- Publication number
- CN112508907A CN112508907A CN202011393242.3A CN202011393242A CN112508907A CN 112508907 A CN112508907 A CN 112508907A CN 202011393242 A CN202011393242 A CN 202011393242A CN 112508907 A CN112508907 A CN 112508907A
- Authority
- CN
- China
- Prior art keywords
- model
- average value
- equipment
- image
- devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000004891 communication Methods 0.000 claims abstract description 26
- 230000002159 abnormal effect Effects 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 abstract description 6
- 230000006835 compression Effects 0.000 abstract description 3
- 238000007906 compression Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 14
- 238000002372 labelling Methods 0.000 description 8
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 201000005202 lung cancer Diseases 0.000 description 7
- 208000020816 lung neoplasm Diseases 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 206010056342 Pulmonary mass Diseases 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 208000009956 adenocarcinoma Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
Abstract
本申请提供了一种基于联邦学习的CT图像检测方法及相关装置,应用于智慧医疗,其中,一种基于联邦学习的CT图像检测方法包括:第一设备基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数;第一设备将第一模型参数发送至第二设备;第一设备接收第二设备发送的第一平均值和第二平均值;第一设备根据第一平均值和第二平均值按预设规则更新第一模型参数后,基于第一类CT图像对第一模型重新训练,获得训练好的第二模型和第二模型参数;第一设备基于第二模型标记输入的CT图像的异常区域。实施本申请实施例通过联邦建模方法为不同平台的协作提供了可能,而且本申请实施例采用了新的压缩算法,有效地提高了通信的效率。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种基于联邦学习的CT图像检测方法及相关装置。
背景技术
肺癌是癌症中全球死亡率最高的一种,而早期肺癌可以通过手术切除的方式达到治愈的目的。因此,肺癌早期的检测是至关重要的。肺癌的早期表现形式是肺结节,医生一般通过CT扫描图像判断肺结节的良恶性,而肺结节普遍具有体积小,形态不易辨别,变化范围大的特点,给医生的诊断工作带来了许多不便。为减轻工作量并提高准确率,在目前的肺结节检测中,使用了计算机辅助检测(CAD)来辅助医生诊断,另外,现有的深度学习算法也针对肺结节的特点,采用2D深度学习、3D深度学习等方法构建针对CT图像的神经网络辅助肺癌的早期筛查;但大多数研究均建立在公开的数据集LIDC-IDRI上,存在着数据量小,种类不丰富,适用性较低的问题;而本身拥有更多CT图像的医院,由于数据私密性高,无法流通,就无法将拥有的数据投入模型的训练;导致了模型识别精度差,投入人工成本高(手动标注图像)的问题。
因此,我们需要考虑如何在保证数据安全的前提下,提高模型的识别精度,减少人工成本,是亟需解决的问题。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于联邦学习的CT图像检测生成方法及装置。
第一方面,本申请实施例提供了一种基于联邦学习的CT图像检测方法,可包括:
第一设备基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;
所述第一设备将所述第一模型参数发送至第二设备;
所述第一设备接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;
所述第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数;
所述第一设备基于所述第二模型标记输入的CT图像的异常区域。
本申请实施例提供了一种基于联邦学习的CT图像检测方法,各个医院(相当于本申请实施例中的多个第一设备)在保证患者隐私不被暴露的情况下,通过提取本地的CT图像数据(相当于本申请实施例中的第一类CT图像),将参数加密上传至云端(相当于本申请实施例中的第二设备)进行联合训练,解决数据集缺失的问题,提高肺癌早期检测的精度。而且,针对于对于联邦学习中可能存在的设备过多导致信息传输速度慢的问题,为了减少所需的通信字节数,通过比较正值梯度更新和负值梯度更新的大小,进一步减少需要参与计算的梯度值,减少了需要参与计算的数据量,有效地提高了通信的效率。
在一种可能实现的方式中,所述方法还包括:所述第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数,所述第三模型为所述第二设备根据所述第一模型获得的,所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像,对所述第三模型进行训练获得的,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;所述第一设备根据所述第三模型,基于所述第一类的CT图像进行训练,获得训练好的所述第三模型的模型参数;所述第一设备将所述训练好的所述第三模型的模型参数发送至所述第二设备中。
在一种可能实现的方式中,所述方法还包括:所述第一设备接收并更新所述第二设备发送的第四模型和第四模型参数,所述第四模型为所述第二设备根据所述第三模型获得的;所述第一设备基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。
第二方面,本申请实施例提供了一种基于联邦学习的CT图像检测方法,可包括:
第二设备接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;
所述第二设备将接收到的梯度值按照预设贡献度规则进行排序;
所述第二设备分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;
所述第二设备将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
本申请实施例为了减少所需的通信字节数,新的压缩算法放弃了将所有梯度值进行平均,而且根据梯度的贡献程度,按照预设贡献度规则选出贡献度最高k%的梯度参与更新(k为算法的输入值);并且,通过比较正值梯度更新和负值梯度更新的大小,进一步减少需要参与计算的梯度值,有效地减少了需要参与计算的数据量,提高了通信的效率。
在一种可能实现的方式中,所述方法还包括:若所述第一平均值大于或等于所述第二平均值,所述第二设备将所有的负值梯度值更新为0,正值梯度值更新为所述第一平均值;若所述第一平均值小于所述第二平均值,所述第二设备将所有的正值梯度值更新为0,负值梯度值更新为所述第二平均值。
在一种可能实现的方式中,所述第一模型参数为第一模型的模型参数,所述第一模型包括解码(decoder)网络和特征提取网络;所述方法还包括:所述第二设备接收所述多个第一设备分别发送的第二模型参数,所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后,基于第一类CT图像对所述第一模型训练,获得训练好的第二模型参数,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像;所述第二设备根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数;所述第二设备根据所述第一模型,获得第三模型,所述第三模型包括两条解码网络,所述两条解码网络共享所述特征提取网络,所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出;所述第二设备基于所述第一类CT图像和第二类CT图像,对所述第三模型进行训练,获得训练好的第三模型参数,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。
在一种可能实现的方式中,所述方法还包括:所述第二设备接收所述多个第一设备发送的特征参数,所述特征参数所述多个第一设备根据所述第三模型,基于所述第一设备中第一类CT图像进行训练,获得的模型参数;所述第二设备根据所述特征参数获取第四模型参数;所述第二设备在所述第三模型的基础上增加全连接层和分类器,获得第四模型;所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。
第三方面,本申请实施例提供了一种基于联邦学习的CT图像检测装置,应用于第一设备,可包括:
第一训练单元,用于基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;
第一发送单元,用于将所述第一模型参数发送至第二设备;
第一接收单元,用于接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;
第二训练单元,用于根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数;
第一标记单元,用于基于所述第二模型标记输入的CT图像的异常区域。
在一种可能实现的方式中,所述装置还包括:第二接收单元,用于接收并更新所述第二设备发送的第三模型和训练好的第三模型参数,所述第三模型为所述第二设备根据所述第一模型获得的,所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像,对所述第三模型进行训练获得的,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;第三训练单元,用于根据所述第三模型,基于所述第一类的CT图像进行训练,获得训练好的所述第三模型的模型参数;第二发送单元,用于将所述训练好的所述第三模型的模型参数发送至所述第二设备中。
在一种可能实现的方式中,所述装置还包括:第三接收单元,用于接收并更新所述第二设备发送的第四模型和第四模型参数,所述第四模型为所述第二设备根据所述第三模型获得的;第二标记单元,用于基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。
第四方面,本申请实施例提供了另一种基于联邦学习的CT图像检测装置,应用于第二设备,可包括:
第四接收单元,用于接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;
排序单元,用于将接收到的梯度值按照预设贡献度规则进行排序;
计算单元,用于分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;
第三发送单元,用于将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
在一种可能实现的方式中,所述装置还包括:第一更新单元,用于若所述第一平均值大于或等于所述第二平均值,所述第二设备将所有的负值梯度值更新为0,正值梯度值更新为所述第一平均值;若所述第一平均值小于所述第二平均值,所述第二设备将所有的正值梯度值更新为0,负值梯度值更新为所述第二平均值。
在一种可能实现的方式中,所述第一模型参数为第一模型的模型参数,所述第一模型包括解码(decoder)网络和特征提取网络;所述装置还包括:第五接收单元,用于接收所述多个第一设备分别发送的第二模型参数,所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后,基于第一类CT图像对所述第一模型训练,获得训练好的第二模型参数,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像;确定单元,用于根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数;第一模型单元,用于根据所述第一模型,获得第三模型,所述第三模型包括两条解码网络,所述两条解码网络共享所述特征提取网络,所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出;第四训练单元,用于基于所述第一类CT图像和第二类CT图像,对所述第三模型进行训练,获得训练好的第三模型参数,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;第二更新单元,用于将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。
在一种可能实现的方式中,所述装置还包括:第六接收单元,用于接收所述多个第一设备发送的特征参数,所述特征参数所述多个第一设备根据所述第三模型,基于所述第一设备中第一类CT图像进行训练,获得的模型参数;获取单元,用于根据所述特征参数获取第四模型参数;第二模型单元,用于在所述第三模型的基础上增加全连接层和分类器,获得第四模型;第三更新单元,用于将所述第四模型和所述第四模型参数更新至所述多个第一设备中。
第五方面,本申请实施例提供了又一种基于联邦学习的CT图像检测装置,包括存储组件,处理组件和通信组件,存储组件,处理组件和通信组件相互连接,其中,存储组件用于存储计算机程序,通信组件用于与外部设备进行信息交互;处理组件被配置用于调用计算机程序,执行第一方面所述的方法,此处不再赘述。
第六方面,本申请实施例提供了又一种基于联邦学习的CT图像检测装置,包括存储组件,处理组件和通信组件,存储组件,处理组件和通信组件相互连接,其中,存储组件用于存储计算机程序,通信组件用于与外部设备进行信息交互;处理组件被配置用于调用计算机程序,执行第二方面所述的方法,此处不再赘述。
第七方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
第八方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第二方面的方法。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本申请实施例提供的一种基于联邦学习的CT图像检测系统架构示意图。
图2是本申请实施例提供的一种基于联邦学习的CT图像检测方法流程的示意图。
图3是本申请实施例提供的一种U-Net网络结构示意图。
图4是本申请实施例提供的一种基于联邦学习的CT图像检测的流程示意图。
图5是本申请实施例提供的一种基于联邦学习的CT图像检测装置的结构示意图。
图6是本申请实施例提供的另一种基于联邦学习的CT图像检测装置的结构示意图。
图7是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图。
图8是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例进行描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本申请中使用的术语“服务器”、“单元”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如,服务器可以是但不限于,处理器,数据处理平台,计算设备,计算机,两个或更多个计算机等。
首先,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。
(1)联邦机器学习又名联邦学习,联合学习,联盟学习。联邦机器学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
(2)Cisco的网际操作系统(IOS),是一个为网际互连优化的操作系统,与硬件分离的软件体系结构,随网络技术的不断发展,可动态地升级以适应不断变化的技术(硬件和软件),具有模块性、灵活性、可伸缩性、可操控性。
(3)Windows Phone(简称为WP)是微软于2010年10月21日正式发布的一款手机操作系统,Windows Phone具有桌面定制、图标拖拽、滑动控制等一系列前卫的操作体验。其主屏幕通过提供类似仪表盘的体验来显示新的电子邮件、短信、未接来电、日历约会等。它还包括一个增强的触摸屏界面,更方便手指操作。
其次,对本申请实施例所基于的其中一种基于联邦学习的CT图像检测系统架构进行描述。请参考附图1,图1是本申请实施例提供的一种基于联邦学习的CT图像检测系统架构示意图,包括:多个第一设备101和第二设备102。其中:
第一设备可以包括但不限于后台服务器、组件服务器、数据处理服务器等,为客户提供本地服务的程序。本申请实施例中的第一设备相当于医院的服务器,可包括但不限于实施:基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;将所述第一模型参数发送至第二设备;接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数基于所述第二模型标记输入的CT图像的异常区域。
第二设备102可以安装并运行相关的应用。应用是指与第一设备相对应,当上述第二设备102为服务器时,所述服务器可以通过互联网与多个第一设备进行通信,服务器上也需要运行有相应的程序来提供相应的模型训练服务等等。例如,服务器可以接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;将接收到的梯度值按照预设贡献度规则进行排序;分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
第一设备101可以向第二设备发送信息(例如:第一模型参数等)和接收第二设备发送的信息(例如:第一平均值和第二平均值等)以及其他共享信息等等。本方案实施例中的第一设备和第二设备可以包括但不限于任何一种基于智能操作系统的电子产品,其可与用户通过键盘、虚拟键盘、触摸板、触摸屏以及声控设备等输入设备来进行人机交互,诸如平板电脑、个人电脑等。其中,智能操作系统包括但不限于任何通过向移动设备提供各种移动应用来丰富设备功能的操作系统,诸如:iOSTM、Windows PhoneTM等等。
还可以理解的是,图1的基于联邦学习的CT图像检测系统架构只是本申请实施例中的部分示例性的实施方式,本申请实施例中的基于联邦学习的CT图像检测系统架构包括但不仅限于以上基于联邦学习的CT图像检测系统架构。
参考附图2,图2是本申请实施例提供的一种基于联邦学习的CT图像检测方法流程的示意图。可应用于上述图1中的系统,下面将结合图2从第一设备101和第二设备102之间的交互进行描述。该方法可以包括以下步骤S201-步骤S213。
步骤S201,第一设备基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数。
具体的,第一设备基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值。可以理解的是,第一类CT图像为在所述第一设备中未公开的CT图像,即不能够被其他的第一设备获取。因此,每个第一设备(医院)可以在本地使用U-Net作为神经网络模型,基于自己的第一类CT图像数据集训练模型,获得训练好的第一模型和第一模型参数。请参考附图3,图3是本申请实施例提供的一种U-Net网络结构示意图。如图3所示,所属第一模型包括:用于下采样的输入层,卷积层,池化层,以及用于上采样的反池化层,卷积转置层和输出层。
步骤S202,第二设备接收多个第一设备分别发送的第一模型参数。
具体的,多个第一设备将第一模型参数分别发送至第二设备。第二设备接收所述多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值。其中,第二设备相当于云服务器可以与多个第一设备通信。需要说明的是,在本申请实施例中第一设备与第二设备之间进行数据交互时,可以对通信的数据进行加密,或者使用加密的通信方式,本申请对比不做具体的限定。
步骤S203,第二设备将接收到的梯度值按照预设贡献度规则进行排序。
具体的,第二设备将接收到的梯度值按照预设贡献度规则进行排序。其中,所述梯度值对应的贡献度与第一设备中训练第一模型时,采用的第一类CT图像数据的大小相对应。例如:训练过程中第一类CT图像越丰富,其对应第一模型的梯度的贡献度越大。本申请对其预设贡献度规则不作具体限定。
步骤S204,第二设备分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值。
具体的,第二设备分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数。可以理解的是,输入所有的梯度更新值,并确定所需的梯度值比例k。在所有的梯度更新值中,取前k%的梯度更新代替所有的正值梯度更新,取最末k%的梯度更新代替所有的负值更新。
可选的,若所述第一平均值大于或等于所述第二平均值,所述第二设备将所有的负值梯度值更新为0,正值梯度值更新为所述第一平均值;若所述第一平均值小于所述第二平均值,所述第二设备将所有的正值梯度值更新为0,负值梯度值更新为所述第二平均值。
步骤S205,第二设备将第一平均值和第二平均值分别发送至多个第一设备。
具体的,第二设备将所述第一平均值和所述第二平均值分别发送至所述多个第一设备,以使第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数。
步骤S206,第一设备根据第一平均值和第二平均值按预设规则更新第一模型参数后,基于第一类CT图像对第一模型重新训练,获得训练好的第二模型和第二模型参数。
具体的,第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数。可以理解的,第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,使用MSE作为损失函数,对所述第一模型重新训练,使得损失函数,快速收敛,得到初始化模型。其中,其中,yi为数据的真实值,y′i为模型的预测值。
可选的,第一设备基于所述第二模型标记输入的CT图像的异常区域。可以理解的是,第二模型为新联好的初始化模型,可以对输入的CT图像进行简单的异常区域标记。
步骤S207,第二设备可以根据多个第一设备分别发送的第二模型参数确定第三模型参数。
具体的,多个第一设备(医院)将上一阶段最后一次训练好的模型参数和梯度更新加密上传至云端。第二设备接收所述多个第一设备分别发送的第二模型参数,然后根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数。其具体的实施方式可对应参考上述步骤203-步骤S204的相关描述,本申请对此不再赘述。
步骤S208,第二设备根据第一模型,获得第三模型。
具体的,第二设备根据所述第一模型,获得第三模型,所述第三模型包括两条解码网络,所述两条解码网络共享所述特征提取网络,所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出。
可选的,所述第一模型参数为第一模型的模型参数,所述第一模型包括解码(decoder)网络和特征提取网络。
步骤S209,第二设备基于第一类CT图像和第二类CT图像,对第三模型进行训练,获得训练好的第三模型参数。
具体的,第二设备基于所述第一类CT图像和第二类CT图像,对所述第三模型进行训练,获得训练好的第三模型参数,所述第二类CT图像为在所述多个第一设备之间共享的CT图像,所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。其中,第二设备可以使用加权损失函数来评价模型的训练结果。其中,加权损失函数为:
步骤S210,第一设备根据第三模型,基于第一类的CT图像进行训练,获得训练好的第三模型的模型参数。
具体的,第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数,第一设备根据所述第三模型,基于所述第一类的CT图像进行训练,获得训练好的所述第三模型的模型参数,其中,训练好的所述第三模型的模型参数为特征参数。
步骤S211,第二设备根据特征参数获取第四模型参数;
具体的,第二设备根据所述多个第一设备发送的特征参数获得第四模型参数,其具体的实施方式可对应参考上述步骤203-步骤S204的相关描述,本申请对此不再赘述。
步骤S212,第二设备在第三模型的基础上增加全连接层和分类器,获得第四模型。
具体的,第二设备在所述第三模型的基础上增加全连接层和分类器,获得第四模型,所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。
步骤S213,第一设备基于第四模型对输入的CT图像进行分类并标记输入的CT图像的异常区域。
具体的,第一设备基于所述第四模型和所述第四模型参数对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。可以理解的是,根据第一设备中本地待分类的CT图像可以进行fine-tune继续训练,实现炎症、鳞癌、腺癌和其他的四分类。请参考附图4,图4是本申请实施例提供的一种基于联邦学习的CT图像检测的流程示意图。如图4所示,首先对第一阶段进行未标注的数据集(相当于本申请中的第一类CT图像),即医院私有数据集进行训练,然后第二阶段进行未标注数据集(医院私有数据集)和已标注数据集(公开数据集,相当于本申请实施例中的第二类CT图像)的共同训练。最后进行联邦迁移学习,将训练好的参数(相模型参数)和模型对输入的未标注图像实现炎症、鳞癌、腺癌和其他的四分类和标注。
本申请实施例可以提供了一种基于联邦学习的CT图像检测方法,各个医院(相当于本申请实施例中的多个第一设备)在保证患者隐私不被暴露的情况下,通过提取本地的CT图像数据(相当于本申请实施例中的第一类CT图像),将参数加密上传至云端(相当于本申请实施例中的第二设备)进行联合训练,解决数据集缺失的问题,提高肺癌早期检测的精度。而且,针对于对于联邦学习中可能存在的设备过多导致信息传输速度慢的问题,为了减少所需的通信字节数,新的压缩算法放弃了将所有梯度值进行平均,而且根据梯度的贡献程度,按照预设贡献度规则选出贡献度最高k%的梯度参与更新(k为算法的输入值);并且,通过比较正值梯度更新和负值梯度更新的大小,进一步减少需要参与计算的梯度值,有效地减少了需要参与计算的数据量,提高了通信的效率。
上述详细阐述了本申请实施例的方法,下面提供了与本申请实施例的相关基于联邦学习的CT图像检测装置,应用于第一设备,基于联邦学习的CT图像检测装置可以是一种通过快速获取、处理、分析和提取有价值的数据,以交互数据为基础,为第三方使用带来各种便利的服务设备。请参考附图5,图5是本申请实施例提供的一种基于联邦学习的CT图像检测装置的结构示意图。基于联邦学习的CT图像检测装置30可以包括第一训练单元301,第一发送单元302,第一接收单元303,第二训练单元304和第一标记单元305,还可以包括第二接收单元306,第三训练单元307,第二发送单元308,第三接收单元309和第二标记单元310。
第一训练单元301,用于基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;
第一发送单元302,用于将所述第一模型参数发送至第二设备;
第一接收单元303,用于接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;
第二训练单元304,用于根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数;
第一标记单元305,用于基于所述第二模型标记输入的CT图像的异常区域。
在一种可能实现的方式中,所述装置还包括:第二接收单元306,用于接收并更新所述第二设备发送的第三模型和训练好的第三模型参数,所述第三模型为所述第二设备根据所述第一模型获得的,所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像,对所述第三模型进行训练获得的,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;第三训练单元307,用于根据所述第三模型,基于所述第一类的CT图像进行训练,获得训练好的所述第三模型的模型参数;第二发送单元308,用于将所述训练好的所述第三模型的模型参数发送至所述第二设备中。
在一种可能实现的方式中,所述装置还包括:第三接收单元309,用于接收并更新所述第二设备发送的第四模型和第四模型参数,所述第四模型为所述第二设备根据所述第三模型获得的;第二标记单元310,用于基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。
需要说明的是,各个操作的实现还可以对应参照图2-图4所示的方法实施例的相应描述,此处不再赘述。
如图6所示,图6是本申请实施例提供的另一种基于联邦学习的CT图像检测装置的结构示意图,应用于第二设备,该装置40包括:第四接收单元401,排序单元402,计算单元403和第三发送单元404,还可以包括:第一更新单元405,第五接收单元406,确定单元407,第一模型单元408,第四训练单元409,第二更新单元410,第六接收单元411,获取单元412,第二模型单元413和第三更新单元414。
第四接收单元401,用于接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;
排序单元402,用于将接收到的梯度值按照预设贡献度规则进行排序;
计算单元403,用于分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;
第三发送单元404,用于将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
在一种可能实现的方式中,所述装置还包括:第一更新单元405,用于若所述第一平均值大于或等于所述第二平均值,所述第二设备将所有的负值梯度值更新为0,正值梯度值更新为所述第一平均值;若所述第一平均值小于所述第二平均值,所述第二设备将所有的正值梯度值更新为0,负值梯度值更新为所述第二平均值。
在一种可能实现的方式中,所述第一模型参数为第一模型的模型参数,所述第一模型包括解码(decoder)网络和特征提取网络;所述装置还包括:第五接收单元406,用于接收所述多个第一设备分别发送的第二模型参数,所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后,基于第一类CT图像对所述第一模型训练,获得训练好的第二模型参数,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像;确定单元407,用于根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数;第一模型单元408,用于根据所述第一模型,获得第三模型,所述第三模型包括两条解码网络,所述两条解码网络共享所述特征提取网络,所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出;第四训练单元409,用于基于所述第一类CT图像和第二类CT图像,对所述第三模型进行训练,获得训练好的第三模型参数,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;第二更新单元410,用于将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。
在一种可能实现的方式中,所述装置还包括:第六接收单元411,用于接收所述多个第一设备发送的特征参数,所述特征参数所述多个第一设备根据所述第三模型,基于所述第一设备中第一类CT图像进行训练,获得的模型参数;获取单元412,用于根据所述特征参数获取第四模型参数;第二模型单元413,用于在所述第三模型的基础上增加全连接层和分类器,获得第四模型;第三更新单元414,用于将所述第四模型和所述第四模型参数更新至所述多个第一设备中。
需要说明的是,各个操作的实现还可以对应参照图2-图4所示的方法实施例的相应描述,此处不再赘述。
如图7所示,图7是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图,该装置50应用于第一设备,包括至少一个处理器501,至少一个存储器502、至少一个通信接口503。此外,该设备还可以包括天线等通用部件,在此不再详述。
处理器501可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口503,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),核心网,无线局域网(Wireless Local Area Networks,WLAN)等。
存储器502可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器502用于存储执行以上方案的应用程序代码,并由处理器501来控制执行。所述处理器501用于执行所述存储器502中存储的应用程序代码。
存储器502存储的代码可执行以上图2提供的基于联邦学习的CT图像检测方法,比如,当装置50为基于联邦学习的CT图像检测装置时,可以基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;将所述第一模型参数发送至第二设备;接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数基于所述第二模型标记输入的CT图像的异常区域。
需要说明的是,本申请实施例中所描述的基于联邦学习的CT图像检测装置中各功能单元的功能可参照图2-图4所示的方法实施例的相应描述,此处不再赘述。
如图8所示,图8是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图,该装置60应用于第二设备,包括至少一个处理器601,至少一个存储器602、至少一个通信接口603。此外,该设备还可以包括天线等通用部件,在此不再详述。
处理器601可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口603,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),核心网,无线局域网(Wireless Local Area Networks,WLAN)等。
存储器602可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器602用于存储执行以上方案的应用程序代码,并由处理器601来控制执行。所述处理器601用于执行所述存储器602中存储的应用程序代码。
存储器602存储的代码可执行以上图2提供的基于联邦学习的CT图像检测方法,比如,当装置60为基于联邦学习的CT图像检测装置时,可以接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;将接收到的梯度值按照预设贡献度规则进行排序;分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
需要说明的是,本申请实施例中所描述的基于联邦学习的CT图像检测装置中各功能单元的功能可参照图2-图4所示的方法实施例的相应描述,此处不再赘述。
在本申请中,所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。
另外,在本申请各个实施例中的各功能组件可以集成在一个组件也可以是各个组件单独物理存在,也可以是两个或两个以上组件集成在一个组件中。上述集成的组件既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的组件如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。尽管在此结合各实施例对本申请进行了描述,然而,在实施例所要求保护的本申请过程中,本领域技术人员可理解并实现公开实施例的其他变化。
Claims (10)
1.一种基于联邦学习的CT图像检测方法,其特征在于,包括:
第一设备基于第一数据对第一模型进行训练,获得训练好的第一模型和第一模型参数,所述第一设备为多个第一设备中的任意一个,所述第一数据包括所述第一设备中的第一类CT图像,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像,所述第一模型参数包括梯度值;
所述第一设备将所述第一模型参数发送至第二设备;
所述第一设备接收所述第二设备发送的第一平均值和第二平均值,所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的,所述第一平均值用于代替所述第一模型参数中正值梯度值,所述第二平均值用于代替所述第一模型参数中负值梯度值;
所述第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后,基于所述第一类CT图像对所述第一模型重新训练,获得训练好的第二模型和第二模型参数;
所述第一设备基于所述第二模型标记输入的CT图像的异常区域。
2.根据权利要求1所述方法,其特征在于,所述方法还包括:
所述第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数,所述第三模型为所述第二设备根据所述第一模型获得的,所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像,对所述第三模型进行训练获得的,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;
所述第一设备根据所述第三模型,基于所述第一类的CT图像进行训练,获得训练好的所述第三模型的模型参数;
所述第一设备将所述训练好的所述第三模型的模型参数发送至所述第二设备中。
3.根据权利要求2所述方法,其特征在于,所述方法还包括:
所述第一设备接收并更新所述第二设备发送的第四模型和第四模型参数,所述第四模型为所述第二设备根据所述第三模型获得的;
所述第一设备基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。
4.一种基于联邦学习的CT图像检测方法,其特征在于,包括:
第二设备接收多个第一设备分别发送的第一模型参数,所述第一模型参数包括梯度值;
所述第二设备将接收到的梯度值按照预设贡献度规则进行排序;
所述第二设备分别计算排序后的前k%的所述梯度值的第一平均值和后k%的所述梯度值的第二平均值,所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新,所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新,k为预设常数;
所述第二设备将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。
5.根据权利要求4所述方法,其特征在于,所述方法还包括:
若所述第一平均值大于或等于所述第二平均值,所述第二设备将所有的负值梯度值更新为0,正值梯度值更新为所述第一平均值;
若所述第一平均值小于所述第二平均值,所述第二设备将所有的正值梯度值更新为0,负值梯度值更新为所述第二平均值。
6.根据权利要求4或5所述方法,其特征在于,所述第一模型参数为第一模型的模型参数,所述第一模型包括解码(decoder)网络和特征提取网络;所述方法还包括:
所述第二设备接收所述多个第一设备分别发送的第二模型参数,所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后,基于第一类CT图像对所述第一模型训练,获得训练好的第二模型参数,所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像;
所述第二设备根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数;
所述第二设备根据所述第一模型,获得第三模型,所述第三模型包括两条解码网络,所述两条解码网络共享所述特征提取网络,所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出;
所述第二设备基于所述第一类CT图像和第二类CT图像,对所述第三模型进行训练,获得训练好的第三模型参数,所述第二类CT图像为在所述多个第一设备之间共享的CT图像;
所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。
7.根据权利要求6所述方法,其特征在于,所述方法还包括:
所述第二设备接收所述多个第一设备发送的特征参数,所述特征参数所述多个第一设备根据所述第三模型,基于所述第一设备中第一类CT图像进行训练,获得的模型参数;
所述第二设备根据所述特征参数获取第四模型参数;
所述第二设备在所述第三模型的基础上增加全连接层和分类器,获得第四模型;
所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。
8.一种基于联邦学习的CT图像检测装置,其特征在于,包括处理组件、存储组件和通信模组件,处理组件、存储组件和通信组件相互连接,其中,存储组件用于存储计算机程序,通信组件用于与外部设备进行信息交互;处理组件被配置用于调用计算机程序,执行如权利要求1-3任意一项所述的方法。
9.一种基于联邦学习的CT图像检测装置,其特征在于,包括处理组件、存储组件和通信模组件,处理组件、存储组件和通信组件相互连接,其中,存储组件用于存储计算机程序,通信组件用于与外部设备进行信息交互;处理组件被配置用于调用计算机程序,执行如权利要求4-7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-3或4-7任意一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011393242.3A CN112508907B (zh) | 2020-12-02 | 一种基于联邦学习的ct图像检测方法及相关装置 | |
PCT/CN2021/083805 WO2022116439A1 (zh) | 2020-12-02 | 2021-03-30 | 一种基于联邦学习的ct图像检测方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011393242.3A CN112508907B (zh) | 2020-12-02 | 一种基于联邦学习的ct图像检测方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112508907A true CN112508907A (zh) | 2021-03-16 |
CN112508907B CN112508907B (zh) | 2024-05-14 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113239972A (zh) * | 2021-04-19 | 2021-08-10 | 温州医科大学 | 一种面向医学影像的人工智能辅助诊断模型构建系统 |
WO2022116439A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 一种基于联邦学习的ct图像检测方法及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170356976A1 (en) * | 2016-06-10 | 2017-12-14 | Board Of Trustees Of Michigan State University | System and method for quantifying cell numbers in magnetic resonance imaging (mri) |
US20190114537A1 (en) * | 2017-10-16 | 2019-04-18 | Facebook, Inc. | Distributed training and prediction using elastic resources |
US20190180145A1 (en) * | 2016-08-03 | 2019-06-13 | Infervision | Method and device for performing transformation-based learning on medical image |
CN110288094A (zh) * | 2019-06-10 | 2019-09-27 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法及装置 |
WO2020029585A1 (zh) * | 2018-08-10 | 2020-02-13 | 深圳前海微众银行股份有限公司 | 基于迁移学习的神经网络联邦建模方法、设备及存储介质 |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170356976A1 (en) * | 2016-06-10 | 2017-12-14 | Board Of Trustees Of Michigan State University | System and method for quantifying cell numbers in magnetic resonance imaging (mri) |
US20190180145A1 (en) * | 2016-08-03 | 2019-06-13 | Infervision | Method and device for performing transformation-based learning on medical image |
US20190114537A1 (en) * | 2017-10-16 | 2019-04-18 | Facebook, Inc. | Distributed training and prediction using elastic resources |
WO2020029585A1 (zh) * | 2018-08-10 | 2020-02-13 | 深圳前海微众银行股份有限公司 | 基于迁移学习的神经网络联邦建模方法、设备及存储介质 |
CN110288094A (zh) * | 2019-06-10 | 2019-09-27 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116439A1 (zh) * | 2020-12-02 | 2022-06-09 | 平安科技(深圳)有限公司 | 一种基于联邦学习的ct图像检测方法及相关装置 |
CN113239972A (zh) * | 2021-04-19 | 2021-08-10 | 温州医科大学 | 一种面向医学影像的人工智能辅助诊断模型构建系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2022116439A1 (zh) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10997787B2 (en) | 3D hand shape and pose estimation | |
CA3097712C (en) | Systems and methods for full body measurements extraction | |
US11798261B2 (en) | Image face manipulation | |
US20210104087A1 (en) | Avatar style transformation using neural networks | |
US11294545B2 (en) | Interface to display shared user groups | |
KR102382401B1 (ko) | 조직 레벨의 전체 슬라이드 이미지의 적은 수의 사진 학습 기반 이미지 인식 | |
CN103092826B (zh) | 一种根据用户的输入信息构建输入词条的方法与设备 | |
US20200241895A1 (en) | Interactive informational interface | |
CN111566646B (zh) | 用于对数据进行混淆和解码的电子装置以及用于控制该电子装置的方法 | |
US11809972B2 (en) | Distributed machine learning for improved privacy | |
EP3844718A1 (en) | Active image depth prediction | |
US11574005B2 (en) | Client application content classification and discovery | |
US20230418910A1 (en) | Multimodal sentiment classification | |
CN111816300A (zh) | 基于深度强化学习的数据分类方法、装置、设备及介质 | |
WO2022227171A1 (zh) | 关键信息提取方法、装置、电子设备及介质 | |
US11475254B1 (en) | Multimodal entity identification | |
CN111724360B (zh) | 一种肺叶分割方法、装置和存储介质 | |
Zhang et al. | A two-stage federated transfer learning framework in medical images classification on limited data: A COVID-19 case study | |
CN112508907B (zh) | 一种基于联邦学习的ct图像检测方法及相关装置 | |
CN112508907A (zh) | 一种基于联邦学习的ct图像检测方法及相关装置 | |
CN109948638A (zh) | 对象匹配方法、装置、设备及计算机可读存储介质 | |
WO2022212669A1 (en) | Determining classification recommendations for user content | |
CN114004802A (zh) | 基于模糊综合评价法的数据标注方法、装置及存储介质 | |
JP2019179445A (ja) | 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム | |
CN116935002A (zh) | 肺部图像预测方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40041502 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |