CN117036910B

CN117036910B - 一种基于多视图及信息瓶颈的医学图像训练方法

Info

Publication number: CN117036910B
Application number: CN202311264129.9A
Authority: CN
Inventors: 杨飞; 孙宸远; 高埂; 何云飞; 肖风丽; 孟丽; 张志强; 陈润泽
Original assignee: Hefei Qianshou Medical Technology Co ltd
Current assignee: Hefei Qianshou Medical Technology Co ltd
Priority date: 2023-09-28
Filing date: 2023-09-28
Publication date: 2024-01-12
Anticipated expiration: 2043-09-28
Also published as: CN117036910A

Abstract

本发明涉及医学图像处理技术领域，公开了一种基于多视图及信息瓶颈的医学图像训练方法，所述客户端对医用图像的获取以及处理进行图像训练，该训练包括以下步骤：步骤1，图像转换，由数据服务器将预处理后的图像传输至客户端中；步骤2，数据优化，客户端对从服务器传输的图像数据进行分析，对获取的图像数据经过损失函数对数据降低噪声信息；步骤3，输出结果预测；步骤4，加密传输；步骤5，更新客户端模型；采用对应的方式在使用时可以实现相对堆单一图像的转让，使得起适应更多设备的所以的数据格式，并且经过改方式的转化使得起训练效率高，训练成本降低，同时使用时降低训练模型的误差。

Description

一种基于多视图及信息瓶颈的医学图像训练方法

技术领域

本发明涉及医学图像处理技术领域，公开了一种基于多视图及信息瓶颈的医学图像训练方法。

背景技术

近年来，随着图像分类、图像分割等深度学习技术的发展，人工智能在医学领域得到广泛应用，例如，通过将神经网络与皮肤病诊断相结合，即皮肤病智能诊断，是当前皮肤病领域提升诊断效率和准确性的新趋势。人工智能辅助诊断的准确率在于深度学习的训练效果，深度学习模型训练效果的上限在于数据集，通过使用大规模医学图像进行训练的智能诊断系统已成为研究热点。通常情况下，大规模数据从多个医院或者科研单位获取，由于涉及患者隐私问题，医疗数据通常被储存在分布式设备中，无法直接提取出来统一训练，联邦学习被广泛用于处理这种情况。然而，在联邦学习中，分布式设备的异构性和数据分布的不均衡往往会出现以下几个问题：

问题1：单个数据源图像视图种类少，大部分临床医学图像为RGB视图，格式单一，无法学习到更多的特征；

问题2：输入图像的特征向量维度过高导致数据处理复杂度高、模型训练效率低、训练时间长导致训练成本高；

问题3：鲁棒性不够好，比如有节点恶意发送错误的梯度给服务器，会让训练的模型变差。

发明内容

现有技术中针对医学图像采用的格式单一，特征少同时处理数据复杂度高等问题。

本发明提出的一种基于多视图及信息瓶颈的医学图像训练方法及其加工方法，解决了医学图像采用的格式单一，特征少同时处理数据复杂度高等问题。

本发明提出的一种基于多视图及信息瓶颈的医学图像训练方法，包括客户端与数据服务器，其中客户端与数据服务器建立网络数据连接，数据服务器端接收医用图像数据获取终端产生的图像，再对图像进行预处理将获取的基础数据转化为RGB格式，所述客户端对医用图像的获取以及处理进行图像训练，该训练方法包括以下步骤：

步骤1，图像转换，由数据服务器将预处理后的图像传输至客户端中，将图像基础数据分别转换为HSL视图和YCbCr视图；

步骤2，数据优化，客户端对从服务器传输的图像数据进行分析，对获取的图像数据经过损失函数对数据降低噪声信息；

步骤3，输出结果预测，基于数据软投票，确定客户端模型最终输出概率；

步骤4，加密传输，由客户端与数据服务器之间由同态加密算法建立基础数据转换，数据服务器基于同态加密的加权平均对收到的数据进行安全聚合；

步骤5，更新客户端模型，数据服务器完成安全聚合操作后，将聚合后的结果发送给各客户端，各客户端对收到的梯度进行解密，并使用解密后的梯度结果更新各自的模型参数。

优选的，其中，步骤1的图像由RGB医学图像数据转换为HSL视图的计算方式为：

HSL：HSL通过公式（1）-公式（3）表示：

；

（1）

（2）

（3）

其中，R,G,B为RGB格式图像所对应的三个通道的参数值,范围均是0-255；r,g,b为R,G,B的百分比；

MAX为r,g,b中的最大值，MIN为r,g,b中的最小值；H,S,L分别为从R,G,B计算而来的HSL格式图像的三通道数值。

优选的，其中，步骤1的图像由RGB医学图像数据转换为YCbCr视图的计算方式其中Y用公式（4）表示，Cr用公式（5）表示，Cb用公式（6）表示：

YCbCr：

（4）

（5）

（6）

其中，Y,Cr,Cb分别是从R,G,B计算而来的YCbCr格式图像的三通道数值。

优选的，其中，步骤2采用的数据优化分析方法选用信息瓶颈理论；

其中，信息瓶颈理论选用用公式（7）表示：

（7）

其中，是信息瓶颈，/>是网络的参数（要优化的东西），/>是拉格朗日乘子；是神经网络最终预测输出结果Y和中间隐层特征信息Z的互信息，/>是输入的图像标签X和中间隐层特征信息Z的互信息。

优选的，其中，步骤2采用的数据优化分析方法选用希尔伯特独立性准则，并辅助计算模型该计算模型为：

设有输入的特征X和真实值标签Y，通过HSIC计算他们之间的损失如下公式（8），核函数公式（9）表示：

（8）

（9）

H为公式（10）表示：

（10）

其中，为单位矩阵。

HSIC的核函数计算公式还如下公式（11）表示：

（11）

其中，HSIC为希尔伯特独立性准则的缩写，N为每批次处理数据量，和/>都为核矩阵，/>以及/>为核矩阵/>中的元素。

优选的，其中，步骤3中客户端模型的最终输出概率计算采用如下计算：

（12）

其中，为输入数据，/>为神经网络对RGB图像的预测结果，/>为神经网络对HSL图像的预测结果,/>为神经网络对YCbCr图像的预测结果。

本发明的有益效果：

本申请采用对应的方式在使用时可以实现相对堆单一图像的转让，使得起适应更多设备的所以的数据格式，并且经过改方式的转化使得起训练效率高，训练成本降低，同时使用时降低训练模型的误差。

实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

实施例1：一种基于多视图及信息瓶颈的医学图像训练方法，包括客户端与数据服务器，其中客户端与数据服务器建立网络数据连接，数据服务器端接收医用图像数据获取终端产生的图像，再对图像进行预处理将获取的基础数据转化为RGB格式，所述客户端对医用图像的获取以及处理进行图像训练，该训练包括以下步骤：

其中，步骤1的图像由RGB医学图像数据转换为HSL视图的计算方式为：

HSL通过公式（1）-公式（3）表示：

；

（1）

（2）

（3）

其中，步骤1的图像由RGB医学图像数据转换为YCbCr视图的计算方式为：

YCbCr：

（4）

（5）

（6）

其中，步骤2采用的数据优化分析方法选用信息瓶颈理论；

其中，信息瓶颈理论选用以下公式：

（7）

其中，步骤3中客户端模型的最终输出概率计算采用如下计算：

（12）

步骤4，加密传输，由客户端与数据服务器之间由同态加密算法建立基础数据转换，数据服务器基于同态加密的加权平均对收到的数据进行安全聚合。

其中，由信息瓶颈理论得到相应的多级隐藏层语义捕捉，在客户端的神经网络训练过程中，考虑到多层网络信息传播过程中信息损失的问题，模型可能在学习过程中受到不良信息或者隐藏层的干扰，进而在错误的方向偏离学习的目标，信息瓶颈理论是一种信息论的方法，旨在寻找输入数据与输出数据之间最重要的信息，其核心思想是在保留最重要信息的同时最小化输入数据与输出数据之间的信息损失。

实施例2：一种基于多视图及信息瓶颈的医学图像训练方法，包括客户端与数据服务器，其中客户端与数据服务器建立网络数据连接，数据服务器端接收医用图像数据获取终端产生的图像，再对图像进行预处理将获取的基础数据转化为RGB格式，所述客户端对医用图像的获取以及处理进行图像训练，该训练包括以下步骤：

HSL通过公式（1）-公式（3）表示：

；

（1）

（2）

（3）

YCbCr：

（4）

（5）

（6）

其中，步骤2采用的数据优化分析方法选用希尔伯特独立性准则，并辅助计算模型该计算模型为：

设有输入的特征X和真实值标签Y，通过HSIC计算他们之间的损失如下：通过HSIC计算他们之间的损失如下公式（8），核函数公式（9）表示：

（8）

（9）

H为公式（10）表示：

（10）

其中，为单位矩阵。

HSIC的核函数计算公式还如下公式（11）表示：

（11）

（12）

其中，该方法在采用希尔伯特独立性准则替代互信息作为损失函数用于辅助模型学习，以捕捉神经网络各层之间的依赖，并且压缩其中的噪声信息，有效约束信息聚合的纯洁性。

实验说明:

为了验证本发明提出的在联邦学习中基于多视图及信息瓶颈的医学图像训练方法 (MCC) 的有效性，我们使用 ResNet-50 、DensNet-169、Inception-v4、ConvNeXt-B 四种经典的卷积神经网络(CNN)在一个色素减退性病 (HD)数据集和公开的ISIC2018 数据集上进行了实验。这四种CNN 分别在使用 MCC 和不使用MCC 下进行训练，然后使用相同的测试集对生成的模型进行测试，测试指标包括准确率 (Accuracy)、精确率(Precision)、召回率(Recall) 和 F1值(F1-score)。

为了保证实验的公平性，所有 CNN的训练和测试都在同一实验环境中进行，超参数也保持一致。实验中使用的深度学习框架是 Pytorch(版本1. 10.2),显卡型号是NVIDIAGeForce RTX3090Ti。超参数设置为：优化器类型，SGD;学习率，0.01;每批次训练数据量，32;训练轮数，100。为了丰富数据集和提高模型的鲁棒性，在数据预处理阶段使用了随机剪切和镜像翻转数据增强方法。

测试结果如表1所示。从表中可以看出，在HD 数据集上， ResNet-50、DensNet-169、Inception-v4 和 ConvNeXt-B 在使用 MCC 框架后，各项指标都有不同程度的提高。四种 CNN 的准确率分别提高了3.06%、9.54%、6.10%和0.77%。精确率分别提高了4.9%、8.85%、8.17%和1.82%;召回率分别提高了3.79%、9.38%、5.77%和0.91%; F1 值分别提高了4.15%、9.58%、7.37%和1.56%。在ISIC2018 数据集上，ResNet-50、DensNet-169、Inception-v4 和 ConvNeXt-B 在使用MCC 后，各项指标也有不同程度的提升。四种 CNN的准确率分别提高了2.05%、5.62%、1.39%和2.06%。精确率分别提高了3.3%、8.28%、0.22%和1.17%;召回率分别提高了1.99%、7.49%、3.36%和2.33%; F1 值分别提高了3.1%、8.03%、2.72%和2.42%。

MCC对每个CNN性能的改善程度各不相同，这主要是由于不同CNN 学习到的特征存在差异。如果MCC能帮助CNN 学习到CNN 本身学习不到的特征较多，那么 CNN的性能就会大幅提高，反之，则性能提升就不明显。总的来说，通过加入MCC,CNN的性能可以得到提升，这表明了本发明的有效性。表1示出使用HD Dataset数据库和ISIC2018 Dataset数据库通过不同的网络模型进行训练的结果。

表1训练性能结果

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于多视图及信息瓶颈的医学图像训练方法，包括客户端与数据服务器，其中客户端与数据服务器建立网络数据连接，数据服务器端接收医用图像数据获取终端产生的图像，再对图像进行预处理将获取的基础数据转化为RGB格式，其特征在于，所述客户端对医用图像的获取以及处理进行图像训练，该训练方法包括以下步骤：

步骤2，数据优化，客户端对从服务器传输的图像数据进行分析，对获取的图像数据经过损失函数对数据降低噪声信息，步骤2采用的数据优化分析方法选用希尔伯特独立性准则；

步骤3中客户端模型的最终输出概率计算采用如下计算：

（12）

其中，为输入数据，/>为神经网络对RGB图像的预测结果，/>为神经网络对HSL图像的预测结果,/>为神经网络对YCbCr图像的预测结果；

步骤5，更新客户端模型，数据服务器完成安全聚合操作后，将聚合后的结果发送给各客户端，各客户端对收到的梯度进行解密，并使用解密后的梯度结果更新各自的模型参数；

HSL通过公式（1）-公式（3）表示：

；

（1）

（2）

（3）

其中，R,G,B为RGB格式图像所对应的三个通道的参数值,范围均是0-255；r,g,b为R,G,B的百分比, 公式（1）中的mod为取余数的运算符；

MAX为r,g,b中的最大值，MIN为r,g,b中的最小值；H,S,L分别为从R,G,B计算而来的HSL格式图像的三通道数值；

其中，步骤2采用的数据优化分析方法选用信息瓶颈理论；

其中，信息瓶颈理论选用公式（7）表示：

（7）

其中，是信息瓶颈，/>是网络的参数，/>是拉格朗日乘子；/>是神经网络最终预测输出结果Y和中间隐层特征信息Z的互信息，/>是输入的图像标签X和中间隐层特征信息Z的互信息。

2.根据权利要求1所述的一种基于多视图及信息瓶颈的医学图像训练方法，其特征在于，其中，步骤1的图像由RGB医学图像数据转换为YCbCr视图的计算方式其中Y用公式（4）表示，Cr用公式（5）表示，Cb用公式（6）表示：

YCbCr：

（4）

（5）

（6）

3.根据权利要求1所述的一种基于多视图及信息瓶颈的医学图像训练方法，其特征在于，其中，步骤2采用的数据优化分析方法选用希尔伯特独立性准则，并辅助计算模型该计算模型为：

（8）

（9）

核函数属于实数范围的N维矩阵,H用公式（10）表示：

（10）

其中，为N维单位矩阵，H为属于实数范围的N维矩阵；

HSIC的核函数计算公式还如下公式（11）表示：

（11）