CN112508907A

CN112508907A - 一种基于联邦学习的ct图像检测方法及相关装置

Info

Publication number: CN112508907A
Application number: CN202011393242.3A
Authority: CN
Inventors: 王健宗; 李泽远; 朱星华
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-12-02
Filing date: 2020-12-02
Publication date: 2021-03-16
Anticipated expiration: 2040-12-02
Also published as: WO2022116439A1

Abstract

本申请提供了一种基于联邦学习的CT图像检测方法及相关装置，应用于智慧医疗，其中，一种基于联邦学习的CT图像检测方法包括：第一设备基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数；第一设备将第一模型参数发送至第二设备；第一设备接收第二设备发送的第一平均值和第二平均值；第一设备根据第一平均值和第二平均值按预设规则更新第一模型参数后，基于第一类CT图像对第一模型重新训练，获得训练好的第二模型和第二模型参数；第一设备基于第二模型标记输入的CT图像的异常区域。实施本申请实施例通过联邦建模方法为不同平台的协作提供了可能，而且本申请实施例采用了新的压缩算法，有效地提高了通信的效率。

Description

一种基于联邦学习的CT图像检测方法及相关装置

技术领域

本申请涉及互联网技术领域，尤其涉及一种基于联邦学习的CT图像检测方法及相关装置。

背景技术

肺癌是癌症中全球死亡率最高的一种，而早期肺癌可以通过手术切除的方式达到治愈的目的。因此，肺癌早期的检测是至关重要的。肺癌的早期表现形式是肺结节，医生一般通过CT扫描图像判断肺结节的良恶性，而肺结节普遍具有体积小，形态不易辨别，变化范围大的特点，给医生的诊断工作带来了许多不便。为减轻工作量并提高准确率，在目前的肺结节检测中，使用了计算机辅助检测(CAD)来辅助医生诊断，另外，现有的深度学习算法也针对肺结节的特点，采用2D深度学习、3D深度学习等方法构建针对CT图像的神经网络辅助肺癌的早期筛查；但大多数研究均建立在公开的数据集LIDC-IDRI上，存在着数据量小，种类不丰富，适用性较低的问题；而本身拥有更多CT图像的医院，由于数据私密性高，无法流通，就无法将拥有的数据投入模型的训练；导致了模型识别精度差，投入人工成本高(手动标注图像)的问题。

因此，我们需要考虑如何在保证数据安全的前提下，提高模型的识别精度，减少人工成本，是亟需解决的问题。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于联邦学习的CT图像检测生成方法及装置。

第一方面，本申请实施例提供了一种基于联邦学习的CT图像检测方法，可包括：

第一设备基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值；

所述第一设备将所述第一模型参数发送至第二设备；

所述第一设备接收所述第二设备发送的第一平均值和第二平均值，所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的，所述第一平均值用于代替所述第一模型参数中正值梯度值，所述第二平均值用于代替所述第一模型参数中负值梯度值；

所述第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数；

所述第一设备基于所述第二模型标记输入的CT图像的异常区域。

本申请实施例提供了一种基于联邦学习的CT图像检测方法，各个医院(相当于本申请实施例中的多个第一设备)在保证患者隐私不被暴露的情况下，通过提取本地的CT图像数据(相当于本申请实施例中的第一类CT图像)，将参数加密上传至云端(相当于本申请实施例中的第二设备)进行联合训练，解决数据集缺失的问题，提高肺癌早期检测的精度。而且，针对于对于联邦学习中可能存在的设备过多导致信息传输速度慢的问题，为了减少所需的通信字节数，通过比较正值梯度更新和负值梯度更新的大小，进一步减少需要参与计算的梯度值，减少了需要参与计算的数据量，有效地提高了通信的效率。

在一种可能实现的方式中，所述方法还包括：所述第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数，所述第三模型为所述第二设备根据所述第一模型获得的，所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像，对所述第三模型进行训练获得的，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；所述第一设备根据所述第三模型，基于所述第一类的CT图像进行训练，获得训练好的所述第三模型的模型参数；所述第一设备将所述训练好的所述第三模型的模型参数发送至所述第二设备中。

在一种可能实现的方式中，所述方法还包括：所述第一设备接收并更新所述第二设备发送的第四模型和第四模型参数，所述第四模型为所述第二设备根据所述第三模型获得的；所述第一设备基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。

第二方面，本申请实施例提供了一种基于联邦学习的CT图像检测方法，可包括：

第二设备接收多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值；

所述第二设备将接收到的梯度值按照预设贡献度规则进行排序；

所述第二设备分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数；

所述第二设备将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。

本申请实施例为了减少所需的通信字节数，新的压缩算法放弃了将所有梯度值进行平均，而且根据梯度的贡献程度，按照预设贡献度规则选出贡献度最高k％的梯度参与更新(k为算法的输入值)；并且，通过比较正值梯度更新和负值梯度更新的大小，进一步减少需要参与计算的梯度值，有效地减少了需要参与计算的数据量，提高了通信的效率。

在一种可能实现的方式中，所述方法还包括：若所述第一平均值大于或等于所述第二平均值，所述第二设备将所有的负值梯度值更新为0，正值梯度值更新为所述第一平均值；若所述第一平均值小于所述第二平均值，所述第二设备将所有的正值梯度值更新为0，负值梯度值更新为所述第二平均值。

在一种可能实现的方式中，所述第一模型参数为第一模型的模型参数，所述第一模型包括解码(decoder)网络和特征提取网络；所述方法还包括：所述第二设备接收所述多个第一设备分别发送的第二模型参数，所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后，基于第一类CT图像对所述第一模型训练，获得训练好的第二模型参数，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像；所述第二设备根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数；所述第二设备根据所述第一模型，获得第三模型，所述第三模型包括两条解码网络，所述两条解码网络共享所述特征提取网络，所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出；所述第二设备基于所述第一类CT图像和第二类CT图像，对所述第三模型进行训练，获得训练好的第三模型参数，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。

在一种可能实现的方式中，所述方法还包括：所述第二设备接收所述多个第一设备发送的特征参数，所述特征参数所述多个第一设备根据所述第三模型，基于所述第一设备中第一类CT图像进行训练，获得的模型参数；所述第二设备根据所述特征参数获取第四模型参数；所述第二设备在所述第三模型的基础上增加全连接层和分类器，获得第四模型；所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。

第三方面，本申请实施例提供了一种基于联邦学习的CT图像检测装置，应用于第一设备，可包括：

第一训练单元，用于基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值；

第一发送单元，用于将所述第一模型参数发送至第二设备；

第一接收单元，用于接收所述第二设备发送的第一平均值和第二平均值，所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的，所述第一平均值用于代替所述第一模型参数中正值梯度值，所述第二平均值用于代替所述第一模型参数中负值梯度值；

第二训练单元，用于根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数；

第一标记单元，用于基于所述第二模型标记输入的CT图像的异常区域。

在一种可能实现的方式中，所述装置还包括：第二接收单元，用于接收并更新所述第二设备发送的第三模型和训练好的第三模型参数，所述第三模型为所述第二设备根据所述第一模型获得的，所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像，对所述第三模型进行训练获得的，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；第三训练单元，用于根据所述第三模型，基于所述第一类的CT图像进行训练，获得训练好的所述第三模型的模型参数；第二发送单元，用于将所述训练好的所述第三模型的模型参数发送至所述第二设备中。

在一种可能实现的方式中，所述装置还包括：第三接收单元，用于接收并更新所述第二设备发送的第四模型和第四模型参数，所述第四模型为所述第二设备根据所述第三模型获得的；第二标记单元，用于基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。

第四方面，本申请实施例提供了另一种基于联邦学习的CT图像检测装置，应用于第二设备，可包括：

第四接收单元，用于接收多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值；

排序单元，用于将接收到的梯度值按照预设贡献度规则进行排序；

计算单元，用于分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数；

第三发送单元，用于将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。

在一种可能实现的方式中，所述装置还包括：第一更新单元，用于若所述第一平均值大于或等于所述第二平均值，所述第二设备将所有的负值梯度值更新为0，正值梯度值更新为所述第一平均值；若所述第一平均值小于所述第二平均值，所述第二设备将所有的正值梯度值更新为0，负值梯度值更新为所述第二平均值。

在一种可能实现的方式中，所述第一模型参数为第一模型的模型参数，所述第一模型包括解码(decoder)网络和特征提取网络；所述装置还包括：第五接收单元，用于接收所述多个第一设备分别发送的第二模型参数，所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后，基于第一类CT图像对所述第一模型训练，获得训练好的第二模型参数，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像；确定单元，用于根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数；第一模型单元，用于根据所述第一模型，获得第三模型，所述第三模型包括两条解码网络，所述两条解码网络共享所述特征提取网络，所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出；第四训练单元，用于基于所述第一类CT图像和第二类CT图像，对所述第三模型进行训练，获得训练好的第三模型参数，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；第二更新单元，用于将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。

在一种可能实现的方式中，所述装置还包括：第六接收单元，用于接收所述多个第一设备发送的特征参数，所述特征参数所述多个第一设备根据所述第三模型，基于所述第一设备中第一类CT图像进行训练，获得的模型参数；获取单元，用于根据所述特征参数获取第四模型参数；第二模型单元，用于在所述第三模型的基础上增加全连接层和分类器，获得第四模型；第三更新单元，用于将所述第四模型和所述第四模型参数更新至所述多个第一设备中。

第五方面，本申请实施例提供了又一种基于联邦学习的CT图像检测装置，包括存储组件，处理组件和通信组件，存储组件，处理组件和通信组件相互连接，其中，存储组件用于存储计算机程序，通信组件用于与外部设备进行信息交互；处理组件被配置用于调用计算机程序，执行第一方面所述的方法，此处不再赘述。

第六方面，本申请实施例提供了又一种基于联邦学习的CT图像检测装置，包括存储组件，处理组件和通信组件，存储组件，处理组件和通信组件相互连接，其中，存储组件用于存储计算机程序，通信组件用于与外部设备进行信息交互；处理组件被配置用于调用计算机程序，执行第二方面所述的方法，此处不再赘述。

第七方面，本申请实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现上述第一方面的方法。

第八方面，本申请实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现上述第二方面的方法。

附图说明

为了更清楚地说明本申请实施例或背景技术中的技术方案，下面将对本申请实施例或背景技术中所需要使用的附图进行说明。

图1是本申请实施例提供的一种基于联邦学习的CT图像检测系统架构示意图。

图2是本申请实施例提供的一种基于联邦学习的CT图像检测方法流程的示意图。

图3是本申请实施例提供的一种U-Net网络结构示意图。

图4是本申请实施例提供的一种基于联邦学习的CT图像检测的流程示意图。

图5是本申请实施例提供的一种基于联邦学习的CT图像检测装置的结构示意图。

图6是本申请实施例提供的另一种基于联邦学习的CT图像检测装置的结构示意图。

图7是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图。

图8是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例进行描述。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于描述特定顺序。此外，“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

在本申请中使用的术语“服务器”、“单元”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如，服务器可以是但不限于，处理器，数据处理平台，计算设备，计算机，两个或更多个计算机等。

首先，对本申请中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)联邦机器学习又名联邦学习，联合学习，联盟学习。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。

(2)Cisco的网际操作系统(IOS)，是一个为网际互连优化的操作系统，与硬件分离的软件体系结构，随网络技术的不断发展，可动态地升级以适应不断变化的技术(硬件和软件)，具有模块性、灵活性、可伸缩性、可操控性。

(3)Windows Phone(简称为WP)是微软于2010年10月21日正式发布的一款手机操作系统，Windows Phone具有桌面定制、图标拖拽、滑动控制等一系列前卫的操作体验。其主屏幕通过提供类似仪表盘的体验来显示新的电子邮件、短信、未接来电、日历约会等。它还包括一个增强的触摸屏界面，更方便手指操作。

其次，对本申请实施例所基于的其中一种基于联邦学习的CT图像检测系统架构进行描述。请参考附图1，图1是本申请实施例提供的一种基于联邦学习的CT图像检测系统架构示意图，包括：多个第一设备101和第二设备102。其中：

第一设备可以包括但不限于后台服务器、组件服务器、数据处理服务器等，为客户提供本地服务的程序。本申请实施例中的第一设备相当于医院的服务器，可包括但不限于实施：基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值；将所述第一模型参数发送至第二设备；接收所述第二设备发送的第一平均值和第二平均值，所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的，所述第一平均值用于代替所述第一模型参数中正值梯度值，所述第二平均值用于代替所述第一模型参数中负值梯度值；根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数基于所述第二模型标记输入的CT图像的异常区域。

第二设备102可以安装并运行相关的应用。应用是指与第一设备相对应，当上述第二设备102为服务器时，所述服务器可以通过互联网与多个第一设备进行通信，服务器上也需要运行有相应的程序来提供相应的模型训练服务等等。例如，服务器可以接收多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值；将接收到的梯度值按照预设贡献度规则进行排序；分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数；将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。

第一设备101可以向第二设备发送信息(例如：第一模型参数等)和接收第二设备发送的信息(例如：第一平均值和第二平均值等)以及其他共享信息等等。本方案实施例中的第一设备和第二设备可以包括但不限于任何一种基于智能操作系统的电子产品，其可与用户通过键盘、虚拟键盘、触摸板、触摸屏以及声控设备等输入设备来进行人机交互，诸如平板电脑、个人电脑等。其中，智能操作系统包括但不限于任何通过向移动设备提供各种移动应用来丰富设备功能的操作系统，诸如：iOS^TM、Windows Phone^TM等等。

还可以理解的是，图1的基于联邦学习的CT图像检测系统架构只是本申请实施例中的部分示例性的实施方式，本申请实施例中的基于联邦学习的CT图像检测系统架构包括但不仅限于以上基于联邦学习的CT图像检测系统架构。

参考附图2，图2是本申请实施例提供的一种基于联邦学习的CT图像检测方法流程的示意图。可应用于上述图1中的系统，下面将结合图2从第一设备101和第二设备102之间的交互进行描述。该方法可以包括以下步骤S201-步骤S213。

步骤S201，第一设备基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数。

具体的，第一设备基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值。可以理解的是，第一类CT图像为在所述第一设备中未公开的CT图像，即不能够被其他的第一设备获取。因此，每个第一设备(医院)可以在本地使用U-Net作为神经网络模型，基于自己的第一类CT图像数据集训练模型，获得训练好的第一模型和第一模型参数。请参考附图3，图3是本申请实施例提供的一种U-Net网络结构示意图。如图3所示，所属第一模型包括：用于下采样的输入层，卷积层，池化层，以及用于上采样的反池化层，卷积转置层和输出层。

步骤S202，第二设备接收多个第一设备分别发送的第一模型参数。

具体的，多个第一设备将第一模型参数分别发送至第二设备。第二设备接收所述多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值。其中，第二设备相当于云服务器可以与多个第一设备通信。需要说明的是，在本申请实施例中第一设备与第二设备之间进行数据交互时，可以对通信的数据进行加密，或者使用加密的通信方式，本申请对比不做具体的限定。

步骤S203，第二设备将接收到的梯度值按照预设贡献度规则进行排序。

具体的，第二设备将接收到的梯度值按照预设贡献度规则进行排序。其中，所述梯度值对应的贡献度与第一设备中训练第一模型时，采用的第一类CT图像数据的大小相对应。例如：训练过程中第一类CT图像越丰富，其对应第一模型的梯度的贡献度越大。本申请对其预设贡献度规则不作具体限定。

步骤S204，第二设备分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值。

具体的，第二设备分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数。可以理解的是，输入所有的梯度更新值，并确定所需的梯度值比例k。在所有的梯度更新值中，取前k％的梯度更新代替所有的正值梯度更新，取最末k％的梯度更新代替所有的负值更新。

可选的，若所述第一平均值大于或等于所述第二平均值，所述第二设备将所有的负值梯度值更新为0，正值梯度值更新为所述第一平均值；若所述第一平均值小于所述第二平均值，所述第二设备将所有的正值梯度值更新为0，负值梯度值更新为所述第二平均值。

步骤S205，第二设备将第一平均值和第二平均值分别发送至多个第一设备。

具体的，第二设备将所述第一平均值和所述第二平均值分别发送至所述多个第一设备，以使第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数。

步骤S206，第一设备根据第一平均值和第二平均值按预设规则更新第一模型参数后，基于第一类CT图像对第一模型重新训练，获得训练好的第二模型和第二模型参数。

具体的，第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数。可以理解的，第一设备根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，使用MSE作为损失函数，对所述第一模型重新训练，使得损失函数，快速收敛，得到初始化模型。其中，

其中，y_i为数据的真实值，y′_i为模型的预测值。

可选的，第一设备基于所述第二模型标记输入的CT图像的异常区域。可以理解的是，第二模型为新联好的初始化模型，可以对输入的CT图像进行简单的异常区域标记。

步骤S207，第二设备可以根据多个第一设备分别发送的第二模型参数确定第三模型参数。

具体的，多个第一设备(医院)将上一阶段最后一次训练好的模型参数和梯度更新加密上传至云端。第二设备接收所述多个第一设备分别发送的第二模型参数，然后根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数。其具体的实施方式可对应参考上述步骤203-步骤S204的相关描述，本申请对此不再赘述。

步骤S208，第二设备根据第一模型，获得第三模型。

具体的，第二设备根据所述第一模型，获得第三模型，所述第三模型包括两条解码网络，所述两条解码网络共享所述特征提取网络，所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出。

可选的，所述第一模型参数为第一模型的模型参数，所述第一模型包括解码(decoder)网络和特征提取网络。

步骤S209，第二设备基于第一类CT图像和第二类CT图像，对第三模型进行训练，获得训练好的第三模型参数。

具体的，第二设备基于所述第一类CT图像和第二类CT图像，对所述第三模型进行训练，获得训练好的第三模型参数，所述第二类CT图像为在所述多个第一设备之间共享的CT图像，所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。其中，第二设备可以使用加权损失函数来评价模型的训练结果。其中，加权损失函数为：

其中，公式中λ₁和λ₂表示两条decoder网络的权重值，y_i表示未标注图像的真实值，y′_i表示未标注图像的预测值；y_j表示已标注图像的真实值，y′_j表示已标注图像的预测值。

步骤S210，第一设备根据第三模型，基于第一类的CT图像进行训练，获得训练好的第三模型的模型参数。

具体的，第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数，第一设备根据所述第三模型，基于所述第一类的CT图像进行训练，获得训练好的所述第三模型的模型参数，其中，训练好的所述第三模型的模型参数为特征参数。

步骤S211，第二设备根据特征参数获取第四模型参数；

具体的，第二设备根据所述多个第一设备发送的特征参数获得第四模型参数，其具体的实施方式可对应参考上述步骤203-步骤S204的相关描述，本申请对此不再赘述。

步骤S212，第二设备在第三模型的基础上增加全连接层和分类器，获得第四模型。

具体的，第二设备在所述第三模型的基础上增加全连接层和分类器，获得第四模型，所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。

步骤S213，第一设备基于第四模型对输入的CT图像进行分类并标记输入的CT图像的异常区域。

具体的，第一设备基于所述第四模型和所述第四模型参数对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。可以理解的是，根据第一设备中本地待分类的CT图像可以进行fine-tune继续训练，实现炎症、鳞癌、腺癌和其他的四分类。请参考附图4，图4是本申请实施例提供的一种基于联邦学习的CT图像检测的流程示意图。如图4所示，首先对第一阶段进行未标注的数据集(相当于本申请中的第一类CT图像)，即医院私有数据集进行训练，然后第二阶段进行未标注数据集(医院私有数据集)和已标注数据集(公开数据集，相当于本申请实施例中的第二类CT图像)的共同训练。最后进行联邦迁移学习，将训练好的参数(相模型参数)和模型对输入的未标注图像实现炎症、鳞癌、腺癌和其他的四分类和标注。

本申请实施例可以提供了一种基于联邦学习的CT图像检测方法，各个医院(相当于本申请实施例中的多个第一设备)在保证患者隐私不被暴露的情况下，通过提取本地的CT图像数据(相当于本申请实施例中的第一类CT图像)，将参数加密上传至云端(相当于本申请实施例中的第二设备)进行联合训练，解决数据集缺失的问题，提高肺癌早期检测的精度。而且，针对于对于联邦学习中可能存在的设备过多导致信息传输速度慢的问题，为了减少所需的通信字节数，新的压缩算法放弃了将所有梯度值进行平均，而且根据梯度的贡献程度，按照预设贡献度规则选出贡献度最高k％的梯度参与更新(k为算法的输入值)；并且，通过比较正值梯度更新和负值梯度更新的大小，进一步减少需要参与计算的梯度值，有效地减少了需要参与计算的数据量，提高了通信的效率。

上述详细阐述了本申请实施例的方法，下面提供了与本申请实施例的相关基于联邦学习的CT图像检测装置，应用于第一设备，基于联邦学习的CT图像检测装置可以是一种通过快速获取、处理、分析和提取有价值的数据，以交互数据为基础，为第三方使用带来各种便利的服务设备。请参考附图5，图5是本申请实施例提供的一种基于联邦学习的CT图像检测装置的结构示意图。基于联邦学习的CT图像检测装置30可以包括第一训练单元301，第一发送单元302，第一接收单元303，第二训练单元304和第一标记单元305，还可以包括第二接收单元306，第三训练单元307，第二发送单元308，第三接收单元309和第二标记单元310。

第一训练单元301，用于基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值；

第一发送单元302，用于将所述第一模型参数发送至第二设备；

第一接收单元303，用于接收所述第二设备发送的第一平均值和第二平均值，所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的，所述第一平均值用于代替所述第一模型参数中正值梯度值，所述第二平均值用于代替所述第一模型参数中负值梯度值；

第二训练单元304，用于根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数；

第一标记单元305，用于基于所述第二模型标记输入的CT图像的异常区域。

在一种可能实现的方式中，所述装置还包括：第二接收单元306，用于接收并更新所述第二设备发送的第三模型和训练好的第三模型参数，所述第三模型为所述第二设备根据所述第一模型获得的，所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像，对所述第三模型进行训练获得的，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；第三训练单元307，用于根据所述第三模型，基于所述第一类的CT图像进行训练，获得训练好的所述第三模型的模型参数；第二发送单元308，用于将所述训练好的所述第三模型的模型参数发送至所述第二设备中。

在一种可能实现的方式中，所述装置还包括：第三接收单元309，用于接收并更新所述第二设备发送的第四模型和第四模型参数，所述第四模型为所述第二设备根据所述第三模型获得的；第二标记单元310，用于基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。

需要说明的是，各个操作的实现还可以对应参照图2-图4所示的方法实施例的相应描述，此处不再赘述。

如图6所示，图6是本申请实施例提供的另一种基于联邦学习的CT图像检测装置的结构示意图，应用于第二设备，该装置40包括：第四接收单元401，排序单元402，计算单元403和第三发送单元404，还可以包括：第一更新单元405，第五接收单元406，确定单元407，第一模型单元408，第四训练单元409，第二更新单元410，第六接收单元411，获取单元412，第二模型单元413和第三更新单元414。

第四接收单元401，用于接收多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值；

排序单元402，用于将接收到的梯度值按照预设贡献度规则进行排序；

计算单元403，用于分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数；

第三发送单元404，用于将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。

在一种可能实现的方式中，所述装置还包括：第一更新单元405，用于若所述第一平均值大于或等于所述第二平均值，所述第二设备将所有的负值梯度值更新为0，正值梯度值更新为所述第一平均值；若所述第一平均值小于所述第二平均值，所述第二设备将所有的正值梯度值更新为0，负值梯度值更新为所述第二平均值。

在一种可能实现的方式中，所述第一模型参数为第一模型的模型参数，所述第一模型包括解码(decoder)网络和特征提取网络；所述装置还包括：第五接收单元406，用于接收所述多个第一设备分别发送的第二模型参数，所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后，基于第一类CT图像对所述第一模型训练，获得训练好的第二模型参数，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像；确定单元407，用于根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数；第一模型单元408，用于根据所述第一模型，获得第三模型，所述第三模型包括两条解码网络，所述两条解码网络共享所述特征提取网络，所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出；第四训练单元409，用于基于所述第一类CT图像和第二类CT图像，对所述第三模型进行训练，获得训练好的第三模型参数，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；第二更新单元410，用于将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。

在一种可能实现的方式中，所述装置还包括：第六接收单元411，用于接收所述多个第一设备发送的特征参数，所述特征参数所述多个第一设备根据所述第三模型，基于所述第一设备中第一类CT图像进行训练，获得的模型参数；获取单元412，用于根据所述特征参数获取第四模型参数；第二模型单元413，用于在所述第三模型的基础上增加全连接层和分类器，获得第四模型；第三更新单元414，用于将所述第四模型和所述第四模型参数更新至所述多个第一设备中。

如图7所示，图7是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图，该装置50应用于第一设备，包括至少一个处理器501，至少一个存储器502、至少一个通信接口503。此外，该设备还可以包括天线等通用部件，在此不再详述。

处理器501可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

通信接口503，用于与其他设备或通信网络通信，如以太网，无线接入网(RAN)，核心网，无线局域网(Wireless Local Area Networks，WLAN)等。

存储器502可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

其中，所述存储器502用于存储执行以上方案的应用程序代码，并由处理器501来控制执行。所述处理器501用于执行所述存储器502中存储的应用程序代码。

存储器502存储的代码可执行以上图2提供的基于联邦学习的CT图像检测方法，比如，当装置50为基于联邦学习的CT图像检测装置时，可以基于第一数据对第一模型进行训练，获得训练好的第一模型和第一模型参数，所述第一设备为多个第一设备中的任意一个，所述第一数据包括所述第一设备中的第一类CT图像，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像，所述第一模型参数包括梯度值；将所述第一模型参数发送至第二设备；接收所述第二设备发送的第一平均值和第二平均值，所述第一平均值和所述第二平均值为基于所述多个第一设备分别对应的第一模型参数确定的，所述第一平均值用于代替所述第一模型参数中正值梯度值，所述第二平均值用于代替所述第一模型参数中负值梯度值；根据所述第一平均值和所述第二平均值按预设规则更新所述第一模型参数后，基于所述第一类CT图像对所述第一模型重新训练，获得训练好的第二模型和第二模型参数基于所述第二模型标记输入的CT图像的异常区域。

需要说明的是，本申请实施例中所描述的基于联邦学习的CT图像检测装置中各功能单元的功能可参照图2-图4所示的方法实施例的相应描述，此处不再赘述。

如图8所示，图8是本申请实施例提供的又一种基于联邦学习的CT图像检测装置的结构示意图，该装置60应用于第二设备，包括至少一个处理器601，至少一个存储器602、至少一个通信接口603。此外，该设备还可以包括天线等通用部件，在此不再详述。

处理器601可以是通用中央处理器(CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制以上方案程序执行的集成电路。

通信接口603，用于与其他设备或通信网络通信，如以太网，无线接入网(RAN)，核心网，无线局域网(Wireless Local Area Networks，WLAN)等。

存储器602可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器可以是独立存在，通过总线与处理器相连接。存储器也可以和处理器集成在一起。

其中，所述存储器602用于存储执行以上方案的应用程序代码，并由处理器601来控制执行。所述处理器601用于执行所述存储器602中存储的应用程序代码。

存储器602存储的代码可执行以上图2提供的基于联邦学习的CT图像检测方法，比如，当装置60为基于联邦学习的CT图像检测装置时，可以接收多个第一设备分别发送的第一模型参数，所述第一模型参数包括梯度值；将接收到的梯度值按照预设贡献度规则进行排序；分别计算排序后的前k％的所述梯度值的第一平均值和后k％的所述梯度值的第二平均值，所述第一平均值用于代替所述多个第一设备对应的所述第一模型参数中正值梯度值更新，所述第二平均值用于代替所述多个第一设备对应的所述第一模型参数中负值梯度值更新，k为预设常数；将所述第一平均值和所述第二平均值分别发送至所述多个第一设备。

在本申请中，所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例方案的目的。

另外，在本申请各个实施例中的各功能组件可以集成在一个组件也可以是各个组件单独物理存在，也可以是两个或两个以上组件集成在一个组件中。上述集成的组件既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的组件如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。尽管在此结合各实施例对本申请进行了描述，然而，在实施例所要求保护的本申请过程中，本领域技术人员可理解并实现公开实施例的其他变化。

Claims

1.一种基于联邦学习的CT图像检测方法，其特征在于，包括：

所述第一设备将所述第一模型参数发送至第二设备；

2.根据权利要求1所述方法，其特征在于，所述方法还包括：

所述第一设备接收并更新所述第二设备发送的第三模型和训练好的第三模型参数，所述第三模型为所述第二设备根据所述第一模型获得的，所述训练好的第三模型参数为所述第二设备基于所述多个第一设备分别对应的第一类CT图像和第二类CT图像，对所述第三模型进行训练获得的，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；

所述第一设备根据所述第三模型，基于所述第一类的CT图像进行训练，获得训练好的所述第三模型的模型参数；

所述第一设备将所述训练好的所述第三模型的模型参数发送至所述第二设备中。

3.根据权利要求2所述方法，其特征在于，所述方法还包括：

所述第一设备接收并更新所述第二设备发送的第四模型和第四模型参数，所述第四模型为所述第二设备根据所述第三模型获得的；

所述第一设备基于所述第四模型对输入的CT图像进行分类并标记所述输入的CT图像的异常区域。

4.一种基于联邦学习的CT图像检测方法，其特征在于，包括：

5.根据权利要求4所述方法，其特征在于，所述方法还包括：

若所述第一平均值大于或等于所述第二平均值，所述第二设备将所有的负值梯度值更新为0，正值梯度值更新为所述第一平均值；

若所述第一平均值小于所述第二平均值，所述第二设备将所有的正值梯度值更新为0，负值梯度值更新为所述第二平均值。

6.根据权利要求4或5所述方法，其特征在于，所述第一模型参数为第一模型的模型参数，所述第一模型包括解码(decoder)网络和特征提取网络；所述方法还包括：

所述第二设备接收所述多个第一设备分别发送的第二模型参数，所述第二模型参数为所述多个第一设备更新所述第一平均值和所述第二平均值后，基于第一类CT图像对所述第一模型训练，获得训练好的第二模型参数，所述第一类CT图像为在所述第一设备中未与其他第一设备共享的CT图像；

所述第二设备根据所述多个第一设备分别发送的第二模型参数确定所述第三模型参数；

所述第二设备根据所述第一模型，获得第三模型，所述第三模型包括两条解码网络，所述两条解码网络共享所述特征提取网络，所述两条解码网络分别进行第一类CT图像的分类结果输出和第二类CT图像的分类结果输出；

所述第二设备基于所述第一类CT图像和第二类CT图像，对所述第三模型进行训练，获得训练好的第三模型参数，所述第二类CT图像为在所述多个第一设备之间共享的CT图像；

所述第二设备将所述第三模型和所述训练好的第三模型参数分别更新至所述多个第一设备中。

7.根据权利要求6所述方法，其特征在于，所述方法还包括：

所述第二设备接收所述多个第一设备发送的特征参数，所述特征参数所述多个第一设备根据所述第三模型，基于所述第一设备中第一类CT图像进行训练，获得的模型参数；

所述第二设备根据所述特征参数获取第四模型参数；

所述第二设备在所述第三模型的基础上增加全连接层和分类器，获得第四模型；

所述第二设备将所述第四模型和所述第四模型参数更新至所述多个第一设备中。

8.一种基于联邦学习的CT图像检测装置，其特征在于，包括处理组件、存储组件和通信模组件，处理组件、存储组件和通信组件相互连接，其中，存储组件用于存储计算机程序，通信组件用于与外部设备进行信息交互；处理组件被配置用于调用计算机程序，执行如权利要求1-3任意一项所述的方法。

9.一种基于联邦学习的CT图像检测装置，其特征在于，包括处理组件、存储组件和通信模组件，处理组件、存储组件和通信组件相互连接，其中，存储组件用于存储计算机程序，通信组件用于与外部设备进行信息交互；处理组件被配置用于调用计算机程序，执行如权利要求4-7任意一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1-3或4-7任意一项所述的方法。