CN115223193B

CN115223193B - 一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法

Info

Publication number: CN115223193B
Application number: CN202210693997.8A
Authority: CN
Inventors: 马悦; 朱芳芳; 郭桂宝; 古梦婷; 杨衍荣; 李胜; 何熊熊
Original assignee: Zhejiang Ada Technology Co ltd
Current assignee: Zhejiang Ada Technology Co ltd
Priority date: 2022-06-19
Filing date: 2022-06-19
Publication date: 2023-07-04
Anticipated expiration: 2042-06-19
Also published as: CN115223193A

Abstract

本发明涉及一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，以ResNeSt为主干网络建立注意力基础网络，在主干网络的瓶颈模块中加入基于病灶特征重要性的通道注意力模块，提取特征图的通道信息及衡量通道重要性的系数，设置加权函数，对特征设置对应的权重，得到用于识别图像病灶的最终的神经网络；获取训练胶囊内窥镜疾病分类的数据集对神经网络进行训练和测试；以测试后满足预设条件的神经网络用于胶囊内窥镜图像病灶识别。本发明通过对通道注意力中提取的特征赋予不同权重，更好地凸显病灶相关特征的重要性；根据衡量通道重要性的系数，动态调整加权系数，进一步提升网络性能；可以与任何前馈网络模型以端到端方式进行训练。

Description

一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法

技术领域

本发明涉及图像分析，特别涉及一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法。

背景技术

小肠的长度通常超过4米，使用传统手持式胃肠镜检查无法实现小肠的完整检查，因此胶囊内窥镜成为消化道疾病尤其是小肠疾病诊断的有效方法。无线胶囊内窥镜(WCE)作为一种消化道疾病诊断工具，能够以无创伤、无痛的方式直接检查患者完整的胃肠道。

然而，当采用无线胶囊内窥镜时，自患者吞下胶囊药丸进行检查的8-12小时内，胶囊内窥镜会拍摄约50000帧视频图像，临床医生通常需要花费数小时才能将整个WCE视频检查完毕，并且在长时间疲劳检查的情况下容易出现误诊、漏诊的情况，因此，设计计算机辅助系统协助医生阅片具有非常大的意义。

近年来，神经网络注意力机制因其效果显著、计算简单，在胶囊内窥镜图像病灶识别中得到了广泛应用。然而，胃肠道内的病灶种类繁多、拍摄环境复杂，病灶特征在颜色、纹理等方面的表现可能与正常组织存在较高的相似性进而难以被识别。例如胃肠道中存在的糜烂、红斑等病灶，在某些情况下与周围正常组织十分相似，导致一般神经网络难以识别。

发明内容

本发明解决了现有技术中存在的问题，提供了一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，通过强调病灶相关特征实现更好的病灶识别能力，利用特征图的通道信息及衡量通道重要性的系数，提出基于该系数的加权函数，通过赋予相应通道不同的权重来凸显病灶相关特征的重要性。

本发明所采用的技术方案是，一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，所述方法以ResNeSt为主干网络建立注意力基础网络，在主干网络的瓶颈模块中加入基于病灶特征重要性的通道注意力模块，提取特征图的通道信息及衡量通道重要性的系数，基于此系数设置加权函数，对特征设置对应的权重，得到用于识别图像病灶的最终的神经网络；

获取用于训练胶囊内窥镜疾病分类的数据集，对所述神经网络进行训练和测试；

以测试后满足预设条件的神经网络用于胶囊内窥镜图像病灶识。

优选地，建立所述注意力基础网络时，以ResNeSt作为主干网络，在ResNeSt基础上加入基于病灶特征重要性的通道注意力，其中，x_i∈R^3×H×W表示输入图像三个通道像素值构成的特征向量，H、W分别为特征图的高度和宽度，带标签的样本i表示为(x_i,y_i)，以y_i为样本类别标签，其值为0表示有病灶，其值为1表示无病灶。

优选地，通过瓶颈模块提取输入图像的高维特征；

所述瓶颈模块通过至少两个卷积核对输入图像进行卷积，得到至少两个分支，通过元素求和对所有的分支的输出进行融合，得到融合结果；

所述融合结果通过全局平均池化层处理，生成通道统计信息，再通过两个全连接层和Softmax函数，得到通道权重；

将通道与所述通道权重融合，得到融合后的cardinal组；

各个所述融合后的cardinal组沿通道方向串联，得到结果T，令输入瓶颈模块的特征为快捷链接Q，Q与T按元素相加输出，提取高维特征F。

优选地，基于病灶特征重要性的通道注意力包括顺次设置的通道注意子模块和批量归一化层；

所述通道注意子模块先对F全局池化，然后再使用一个多层感知机MLP得到注意力图F_c；对注意力图F_c进行批量归一化操作，得到结果F_BN。

优选地，所述批量归一化层引入参数γ和β，γ为缩放因子向量，β为平移因子。

优选地，令某一层的输出通道个数为k，则通道对应的γ系数可以表示为γ₁,γ₂,...,γ_k，则输入每个通道的γ系数对应的每个通道的加权系数W_i＝f(γ_i)，其中，i∈[1,k]。

优选地，在训练的过程中γ系数的值不断更新，不同γ的数值分布对应不同的加权函数。

优选地，对F_BN进行加权操作，并且进一步融合注意力图F_c作为输出F_out，

优选地，满足预设条件的神经网络由准确率Accuracy、F1-score、精确率Precision评估。

本发明涉及一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，所述方法以ResNeSt为主干网络建立注意力基础网络，在主干网络的瓶颈模块中加入基于病灶特征重要性的通道注意力模块，提取特征图的通道信息及衡量通道重要性的系数，基于此系数设置加权函数，对特征设置对应的权重，得到用于识别图像病灶的最终的神经网络；获取用于训练胶囊内窥镜疾病分类的数据集，对所述神经网络进行训练和测试；以测试后满足预设条件的神经网络用于胶囊内窥镜图像病灶识别。

本发明的有益效果在于：

(1)引入基于病灶特征重要性的注意力机制，与传统的基于空间或者通道注意力方法相比，本发明的方法通过对通道注意力中提取的特征赋予不同的权重，更好地凸显病灶相关特征的重要性；

(2)设计了一种全新的加权函数，根据衡量通道重要性的系数，动态的调整加权系数，进一步提升了网络性能；

(3)构建了一个具有多个参数的基于病灶特征重要性的通道注意力，可以与任何前馈网络模型以端到端方式进行训练。

附图说明

图1是本发明的整体流程框图；

图2是本发明中瓶颈模块提取高维特征的流程图；

图3是本发明中基于病灶特征重要性的注意力图。

具体实施方式

下面结合实施例对本发明做进一步的详细描述，但本发明的保护范围并不限于此。

本发明涉及一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，从Kvasir-Capsule公开数据集上选取部分图片来制作肠道疾病分类的数据集，此数据集包含有病灶、无病灶两类图像各1118张，其中有病灶数据集中包含了9类疾病(血管扩张、出血、血色素、糜烂、红斑、异物、淋巴样增生、息肉、溃疡)；按照3:1:1的比例将每一类别图像随机划分为训练集、验证集和测试集，得到1340张图像的训练集、448张图像的验证集和448张图像的测试集；图像大小被调整到256×256像素，为了增强模型的鲁棒性和稳定性，将训练集和验证集的图像随机裁剪成分辨率为224×224的图像，并进行随机水平翻转以及随机角度变换操作，将测试集的图像中心裁剪成分辨率为224×224的图像。

过程中包括以下步骤：

S1、获取用于训练胶囊内窥镜疾病分类的数据集。

在本发明实施例的步骤S1中，用于病灶识别的数据集设为X＝{x₁,x₂,...,x_n}，其中，X矩阵表示数据集，n表示总的样本数量，x_i表示输入图像。

定义算法目标为：获取数据集的分类结果，判断图像为有病灶或者无病灶。

S2、采用ResNeSt主干网络建立注意力基础网络。

在本发明实施例的步骤S2中，具体过程如下：

S21、采用ResNeSt作为主干网络构建注意力基础网络；

S22、在ResNeSt基础上加入基于病灶特征重要性的通道注意力，其中，x_i∈R^3×H×W表示输入图像三个通道像素值构成的特征向量，H、W分别为特征图的高度和宽度。(x_i,y_i)表示带标签的样本i，y_i表示样本类别标签，其值为0表示有病灶，其值为1表示无病灶，从而可以判断图像中是否存在病灶。

S3、在S2模型中通过瓶颈模块提取S1所述数据集的高维特征；

在本发明实施例的步骤S3中，其中高维特征是指经多个卷积操作后得到的特征。参照图2，具体过程如下：

S31、(1)通过至少两个卷积核对所述数据集图像进行卷积，得到至少两个分支；

(2)通过元素求和对至少两个所述分支进行融合，得到融合结果；

(3)对所述融合结果进行全局平均池化处理，生成通道统计信息；

(4)通过两个全连接层和Softmax函数，得到通道权重；

(5)将通道与所述通道权重融合，得到融合后的cardinal组；

(6)各个所述融合后的cardinal组沿通道方向串联；

(7)各个所述融合后的cardinal组沿通道方向串联，得到结果T，令输入瓶颈模块的特征为快捷链接Q，Q与T按元素相加输出，提取高维特征F。

具体地，ResNeSt作为一个单独的计算网络，主要包含特征图组和注意力分散操作：

特征组中，每一张输入的已标注训练集图像都可以被划分为多个特征组，数量取决于定义的超参数cardinality K，因此也可称之为cardinal组；在每一个cardinal组之中，又被再次分成R个Split单元，因此总的特征组数量为G＝KR，后续对于每一个组进行一系列的变换运算，Split的方法是使用多个卷积核对输入进行卷积，以形成多个分支；

cardinal组中的注意力分散中，首先通过元素求和的方式，从多个分支中融合出结果，再通过使用全局平均池化来嵌入全局信息，从而生成信道统计信息。

经过全局平均池化操作后，网络仅仅得到的是一个全局描述，这个描述并不能作为该通道的权重。基于此，通过两个全连接层，包括样本正则化、激励函数ReLU和Softmax函数，得到全面的通道级别的依赖，接着，在cardinal组内，将各个Split单元结合权重进行融合，采用的是乘积相加的形式。经过融合后的cardinal组，沿通道方向进行串联：

T＝Concat(T₁,T₂,…T_K)

最终ResNeSt中瓶颈模块的输出Y是由串联的结果T和一个快捷链接Q叠加得到，Y＝T+Q。

本发明中，得到融合后的cardinal组后，沿着通道方向串联后输出的结果是ResNeSt中split-Attention这一个小块得到的输出，为结果T，再加上输入瓶颈模块的特征快捷链接Q，确切地说，Q与T按元素相加，得到最后的输出为高维特征F，是一个完整的高维卷积提取的过程。

S32、由S31得到的结果进一步卷积和归一化操作，完成瓶颈模块中提取高维特征的过程，输出特征为F。

S4、在S3的基础上建立基于病灶特征重要性的通道注意力，形成最终模型；

在本发明实施例的步骤S4中，具体过程如下：

S41、首先输入通道注意子模块中推断出注意力图，如式(1)所示。先对F全局池化，得到一个F_Avg∈R^C×H×W的通道向量，然后再使用一个多层感知机(Muhi-Layer Perception，MLP)，得到注意力图F_c。

如图3中所示，使用一个多层感知机(MLP)，目的是为了从通道向量F_c估计跨通道的注意力，为了节省开销，将隐藏激活大小设置为

其中r是缩减率。

S42、由通道注意子模块得到的输出F_c，首先经过批量归一化(BN)。具体过程如下：

考虑一个大小为m的小批量数据集B，由于归一化被单独地应用于每一个激活值上，所以让我们集中在一个特定的激活值x(k)，为了清楚起见省略k。那么由m个数据可以获得m个激活，即B＝{x₁,...,x_m}。μ_B是这m个激活的均值，

是这m个激活的方差，如式(2)所示。

设归一化的值为

则有/>

其中ε是一个常数，用来避免方差过小时导致的计算问题。

每一层网络的输入数据经过归一化后，其分布将变得稳定，但却导致了数据表达能力的缺失。批量归一化(BN)又引入了两个可学习的参数γ和β，γ为缩放因子向量，β为平移因子向量。这两个参数的引入是为了恢复数据本身的表达能力，对归一化后的数据进行线性变换，并且参数在训练过程中不断学习更新。

那么对于每一个激活值，上述过程可表达为式(3)，其中

依据步骤S42中的具体过程，对步骤S41中得到注意力图F_c做所述批量归一化(BN)操作，得到结果F_BN。

S43、设某一层的输出通道个数为k，则通道对应的γ系数可以表示为γ₁,γ₂,...,γ_k。本专利设计了一种全新的加权函数，如(4)中的公式。输入每个通道的γ系数的能够得到每个通道的加权系数，

W_i＝f(γ_i) (2)

其中i∈[1,k]。

在训练的过程中γ系数的值不断更新，不同γ的数值分布对应不同的加权函数。

由于γ系数的值在训练的过程中不断的更新，f(γ_i)函数的设计需要考虑不同γ的数值分布情况。当不同通道的系数值分布密集时，可以选用方案一中的加权函数。当系数值分布稀疏的时候，可以选用方案二中的加权函数，如下表1所示；

表1

方案一中，加权函数的幅度变化较大。当γ系数值差异较小时，其分布较为密集，表中幅度变化较大的函数能让通道的加权系数W呈现较大的差异，以此凸显更加重要的通道信息；方案二中，加权函数的幅度变化较为缓和。当γ系数值差异较大时，其分布也相对稀疏，则设计幅度较为缓和的加权函数来进一步强调特征的重要性。

S44、依据步骤S43，对步骤S42中得到的结果F_BN进行加权操作，并且进一步融合所述步骤S41中获得的注意力图F_c，如式(5)所示，

得到最终的输出F_out。

S45、将输出结果F_out送入网络的下一层，以此建立基于病灶特征重要性的注意力神经网络，形成最终模型。

S5、基于S1的训练数据集，对S4中的最终模型进行训练，得到图像预测模型。

在本发明实施例的步骤S5中，具体过程如下：

基于S1中的胶囊内窥镜疾病分类的数据集，代入S4中的最终模型进行训练，得到图像识别的预测模型。

S6、针对S1中的测试数据集，将其输入所述图像预测模型中进行图像分类。

在本发明实施例的步骤S6中，具体过程如下：

在得到S5步骤中的预测模型后，再输入测试集图像对预测模型进行预测，使用准确率Accuracy、F1-score、精确率Precision三个指标来评估模型的性能，得到胶囊内窥镜图像分类预测结果。

本发明的效果可通过以下仿真实验进一步说明。

(1)仿真条件

实验采用一台配置Intel(R)Xeon(R)Silver 4210R CPU@2.40GHz

2.39GHz(2处理器)，64GB内存，Windows10操作系统和3块NVIDIA GeForce RTX2080SUPER显卡的工作站，Cuda版本为10.0，模型基于PyTorch深度学习框架实现，PyTorch版本为1.6.0+cu101，Python版本为3.7。训练过程的Batch-size设为32，使用Adam算法来优化总体参数，学习率设置为0.0001，并使用StepLR机制调整学习率，训练100epoch后模型收敛。

(2)仿真结果

本发明将提出的方法与多种分类网络在相同的数据集上进行了对比实验。使用图像分类中常用的准确率Accuracy、F1-score、精确率Precision指标来对模型进行评估；

如表2所示，为不同的神经网络的指标；

表2

从表2中可以看出，本发明方法相对于其他分类网络具有更优的效果，有效提升了分类的性能，能够更好地应用在无线胶囊内窥镜图像病灶识别辅助诊断上，具有巨大的实际工程应用价值。

为了实现上述内容，本发明还涉及一种计算机可读存储介质，其上存储有基于病灶特征重要性的胶囊内窥镜图像病灶识别程序，该程序被处理器执行时实现上述基于病灶特征重要性的胶囊内窥镜图像病灶识别方法。

为了实现上述内容，本发明还涉及一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现上述基于病灶特征重要性的胶囊内窥镜图像病灶识别方法。

通过所述计算机可读存储介质及所述计算机设备在介质，通过向设备输入待识别内窥镜图像，通过强调病灶相关特征实现更好的病灶识别能力，利用特征图的通道信息及衡量通道重要性的系数，提出了基于该系数的加权函数，通过赋予相应通道不同的权重来凸显病灶相关特征的重要性。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：所述方法以ResNeSt为主干网络建立注意力基础网络，在主干网络的瓶颈模块中加入基于病灶特征重要性的通道注意力模块，提取特征图的通道信息及衡量通道重要性的系数，基于此系数设置加权函数，对特征设置对应的权重，得到用于识别图像病灶的最终的神经网络；所述基于病灶特征重要性的通道注意力包括顺次设置的通道注意子模块和批量归一化层；通道注意子模块先对高维特征F全局池化，然后再使用一个多层感知机MLP得到注意力图F_c；对注意力图F_c进行批量归一化操作，得到结果F_BN；批量归一化层引入参数γ和β，γ为缩放因子向量，β为平移因子，在训练的过程中γ系数的值不断更新，不同γ的数值分布对应不同的加权函数；

2.根据权利要求1所述的一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：建立所述注意力基础网络时，以ResNeSt作为主干网络，在ResNeSt基础上加入基于病灶特征重要性的通道注意力，其中，x_i∈R^3×H×W表示输入图像三个通道像素值构成的特征向量，H、W分别为特征图的高度和宽度，带标签的样本i表示为(x_i,y_i)，以y_i为样本类别标签，其值为0表示有病灶，其值为1表示无病灶。

3.根据权利要求2所述的一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：通过瓶颈模块提取输入图像的高维特征；

将通道与所述通道权重融合，得到融合后的cardinal组；

4.根据权利要求1所述的一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：令某一层的输出通道个数为k，则通道对应的γ系数可以表示为γ₁,γ₂,...,γ_k，则输入每个通道的γ系数对应的每个通道的加权系数W_i＝f(γ_i)，其中，i∈[1,k]。

5.根据权利要求1所述的一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：对F_BN进行加权操作，并且进一步融合注意力图F_c作为输出F_out，

6.根据权利要求1所述的一种基于病灶特征重要性的胶囊内窥镜图像病灶识别方法，其特征在于：满足预设条件的神经网络由准确率Accuracy、F1-score、精确率Precision评估。