CN110363751B

CN110363751B - 一种基于生成协作网络的大肠内视镜息肉检测方法

Info

Publication number: CN110363751B
Application number: CN201910586253.4A
Authority: CN
Inventors: 黄予怀; 丁克峰
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2019-07-01
Filing date: 2019-07-01
Publication date: 2021-08-03
Anticipated expiration: 2039-07-01
Also published as: CN110363751A

Abstract

本发明公开了一种基于生成协作网络的大肠内视镜息肉检测方法，包括如下步骤：基于分段激励函数构建神经元模型；在特征检测开始之前，将原始彩色大肠内视镜图像进行预处理，将图像调整到统一大小；构建基于卷积神经网络的生成器模型；对所输入的彩色大肠息肉医学图像进行图像特征的提取并转化为数字信号，然后以所述数字信号为训练样本进行神经网络的训练；同时在卷积神经网络的训练过程中，生成器模型产生的中间产物被保存以用于训练网络的权重；构建基于卷积神经网络的协作器模型；该模型将生成器产生的中间产物转换为可视化的黑白灰阶图像数据，最终和原始图像进行结合得到最终的图像标示结果。

Description

一种基于生成协作网络的大肠内视镜息肉检测方法

技术领域

本发明涉及一种基于生成协作网络的大肠内视镜息肉检测方法，属于机器学习领域和医学图像检测领域。

背景技术

在当前人工智能与机器学习技术发展迅速的今天，机器学习技术已经应用到了人们生产生活的方方面面。癌症一直是当今世界一直难以攻克的疾病难题，同时也是人类死因之首，而大多数的大肠肿瘤都是由大肠息肉病变而成。因此及时的发现并且治愈大肠息肉可以有效的预防肿瘤的发生。随着模式识别与人工智能计算的发展，大肠内息肉的检测技术越来越多地被学者们关注，已经成为了医学图像处理研究的一个重要的方面。

在过去的十年来，有着大量的医学图像检测与图像标注的方法。很多经典的大肠息肉检测方法是以大量训练样本为前提的，但是在实际应用中，往往大量的医学图像样本很难收集完全。因此，在缺乏标记样本的情况下，大量的大肠息肉检测方法受到限制，其检测能力会受到制约。

类似于人脸检测方法，大肠内镜息肉检测主要采用的是线性判别分析法，K近邻算法以及协同表示分类器等机器学习方法。线性判别分析法是一种典型的监督学习算法，该算法实现分类的原理是通过利用标记信息，通过选择一个投影向量使同类的点经投影后尽可能靠近，而不同类的点经投影后尽可能分散。但是该算法对图像噪声十分敏感，在实际应用中往往效率不高。K近邻算法的分类原则是基于距离相似度。尽管该算法可以使得样本局部近邻之间的结构关系得到有效的保持，但是这种分类方法往往容易受到图像噪声等干扰因素的影响，并且过分地依赖于样本之间的欧式距离。

在大肠内镜息肉的检测中，为了减少对噪声对于检测结果的影响，学者们提出了SRC算法。该算法首先利用训练数据去线性稀疏重构测试样本，然后通过比较重构残差得到分类结果。由于受到图像噪声干扰较少，该方法在医学图像检测领域得到了广泛的应用。但是该方法的计算过程需要耗费大量的时间，同时需要大量的计算样本，因此在实际应用中仍然存在很多的问题。

虽然已有上述多种大肠息肉检测方法，但是已有的医学图像目标检测技术往往存在着检测精度低，容易受到噪声干扰等问题，不能够有效地检测出病变部位的所在，因此提出一种高效的大肠息肉检测方法是十分必要的。作为一种通过组合低层特征形成更加抽象的高层表示属性特征，以发现数据的分布式特征表示的方式，深度学习已经引起了学者们的广泛关注，但当前在国内外的前沿研究中，尚未存在深度学习应用于大肠内视镜息肉检测的相关技术。

发明内容

针对传统的基于监督学习内视镜息肉检测方法精度不高，过分依赖于大规模训练样本，使得现有的大肠内视镜息肉检测方法在实际的医学检测应用场景中难以高效的实现工作任务的问题，本发明以深度学习技术为基础，提出了一种基于生成协作网络的大肠内视镜息肉检测方法。

为了实现上述目的，本发明采用的技术方案如下：

一种基于生成协作网络的大肠内视镜息肉检测方法，包括如下步骤：

步骤1，基于分段激励函数构建神经元模型；

步骤2，在特征检测开始之前，将原始彩色大肠内视镜图像进行预处理，将图像调整到统一大小；

步骤3，构建基于卷积神经网络的生成器模型；对所输入的彩色大肠息肉医学图像进行图像特征的提取并转化为数字信号，然后以所述数字信号为训练样本进行神经网络的训练；同时在卷积神经网络的训练过程中，生成器模型产生的中间产物被保存以用于训练网络的权重；

步骤4，构建基于卷积神经网络的协作器模型；该模型将生成器产生的中间产物转换为可视化的黑白灰阶图像数据，最终和原始图像进行结合得到最终的图像标示结果。

进一步地，步骤3包括以下的步骤：

步骤(31)，构建生成器卷积层部分；预处理后的彩色大肠内视镜图输入到生成器的卷积层部分，卷积层部分包含两层卷积神经网络；

步骤(32)，构建带有标准化处理的生成器全连接层部分；包括两层全连接层、和批标准化层，使用批标准化算法对生成器两层全连接层的输出进行标准化，通过全连接层的标准化处理之后得到一维的特征向量；

步骤(33)，构建两层转置卷积神经网络部分；转置卷积神经网络的作用是将特征向量转换为黑白图像的大肠内视镜息肉检测图片，即中间产物。

进一步地，步骤4包括以下的步骤：

步骤(41)，构建协作器卷积层部分，协作器中卷积层部分输入的是生成器输出的中间产物，卷积层部分包含两层卷积神经网络；

步骤(42)，构建带有标准化处理的协作器全连接层部分；包括两层全连接层、和批标准化层，使用批标准化算法对生成器中两层全连接层的输出进行标准化，通过协作器全连接层的标准化处理之后得到一维特征向量；

步骤(43)，构建协作器两层转置卷积神经网络部分；协作器的转置卷积层输出的黑白检测图像与原始图像结合得到最终的大肠内视镜息肉检测结果。

更进一步地，所述的标准化处理，具体为：

其中，x₁～x_m为卷积神经网络的m个输出，即批标准化层的输入，u_B为批标准化层的输入的平均值，

为批标准化层的输入的方差，ε是常数，

为批标准化层的输入的标准化数值，γ,β为批标准化层中的可学习的参数，用来扩大和平移输入的分布；BN(BatchNormalization)为批标注化。其中，ε的设定是按照经验取值的，一般都是设小于1的值；ε>0是一个很小的常数，保证公式中分母大于0。

进一步地，对于卷积层部分，设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2，第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2；卷积层使用的是Leaky relu激励函数；对于转置卷积神经网络部分，设置第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2，第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2，第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。

进一步地，对于卷积层部分，设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2，第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2，卷积层使用的是Leaky relu激励函数；对于转置卷积神经网络部分，第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2，第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2，第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。

本发明的技术特点在于：

本发明提出了一种基于生成协作网络的大肠内视镜息肉检测方法，该方法由两个子网络生成器模型和协作器模型所构成。两个子网络模型分别再由卷积神经网络和转置卷积神经网络构成。整个生成协作网络会从训练资料中学习如何萃取肿物的特征，再将其映射回大肠内视镜图，将肿物定位标记出来。其中，生成器模型在监督式学习过程中，需要有输入肠镜图片及其对应的黑白标注图片，满足有问题和答案的监督式学习过程。在后期网络学习将趋于收敛，此时该过程能产生许多带有杂讯的类似输入源肠镜图片所对应的黑白标注图群，进而拟合未曾学习过的图片但类似学习过的黑白标注图。协作器模型对输入的黑白标注图进行去杂讯化处理，使得这些带有杂讯的黑白标注图群的中间产物能成为训练集所需的数据，进而达到数据量自扩充的作用。两个子网络模型的所有可训练权重参数均依照各自的损失函数更新自身数值，互相不会产生干扰。同时，利用一种自定义的标准化处理方法对卷积层部分输出的特征图做标准化处理，将分散的数据处理成统一的格式。

本发明在大肠内视镜息肉检测方法上克服了传统方法容易受图像噪声干扰、特征提取精度不高，高度依赖数据一致性的缺点。使用包含卷积层和全连接层的卷积神经网络不仅避免了卷积池化层会造成特征位置信息的丢失的问题，同时不需要对其输入图片进行人工特征选取，而是由网络自行学习如何提取特征来达成目标。对于人类无法理解的抽象图像提取，本发明通过在卷积神经网络后面添加了转置卷积网络，通过转置卷积神经网络的逆转过程将抽象特征转变为特征向量。在对比训练资料所提供的原始肠镜图和与之对应的参考答案后，可以将该特征转换成可视化的肿物侦测图，以实现检测结果的可视化。

本发明具有以下的优点：

1、通过构建一种包含卷积层和全连接层的卷积神经网络，避免了卷积池化层会造成特征位置信息的丢失的问题，同时不需要对其输入图片进行人工特征选取，节省了构建数据集的时间与人力成本。

2、构建生成器模型和协作器模型的两个子网络模型，通过样本学习的方式萃取肿物的特征，再将其映射回大肠内视镜图，将肿物定位标记出来。该方法有效实现了特征提取结果的可视化处理，方便看到特征提取结果，为医护人员提供有效的医疗决策支持。

3、使用一种自定义的标准化处理方法在全连接层部分对卷积层部分输出的特征图做标准化处理，将分散的数据处理成统一的格式。该方法弥补当前部分同类产品对数据一致性高度依赖的缺陷，使之具有更好的推广价值。

4、通过生成器模型和协作器模型的交互作用，利用生成器产生产生带有杂讯的黑白标注图群，然后对黑白标注图群进行去杂讯处理，得到的中间产物作为训练集所需的数据，可是实现数据的自动扩充。该方法克服了传统的大肠内视镜息肉检测方法对大规模训练样本的依赖，降低了对训练样本的需求量。

附图说明

图1为本发明的执行流程；

图2为本发明设计的生成器模型结构图；

图3为本发明设计的协作器模型结构图。

具体实施方式

下面结合附图与具体实施例对本发明的技术方案做进一步说明。

本发明的一种基于生成协作网络的大肠内视镜息肉检测方法，包括如下步骤：。基于分段激励函数构建神经元模型；在特征检测开始之前，将原始彩色大肠内视镜图像进行预处理，将图像调整到统一大小；构建基于卷积神经网络的生成器模型；对所输入的彩色大肠息肉医学图像进行图像特征的提取并转化为数字信号，然后以所述数字信号为训练样本进行神经网络的训练；同时在卷积神经网络的训练过程中，生成器模型产生的中间产物被保存以用于训练网络的权重；构建基于卷积神经网络的协作器模型；该模型将生成器产生的中间产物转换为可视化的黑白灰阶图像数据，最终和原始图像进行结合得到最终的图像标示结果。

本发明利用分段激励函数的神经元模型，基于卷积神经网络的生成器模型，基于卷积神经网络的协作器模型，与自定义的样本数据标准化处理方法实现了基于生成协作网络的大肠内视镜息肉检测方法。首先，构建使用分段激励函数的神经元模型，神经元通过这种分段激活函数输入映射为神经元输出并且加深神经网络深度及缓解过度拟合的状态。其次，对原始图像进行预处理，调整至统一大小，第三，构建基于卷积神经网络的生成器模型，通过生成器模型将图像特征转换为数字信号，然后将数字信号作为训练样本进行神经网络的训练。同时，在卷积神经网络的训练过程中，生成器模型产生的中间产物被作为辨识学习的原材料来训练网络的权重。中间产物被保存以供下一次训练使用，如此可以达到简化数据需求的目的。第四，构建基于卷积神经网络的协作器模型，该协作器模型可以将中间产物转换为可视化的黑白灰阶图像数据，然后通过与原始的进行结合得到最终的标志结果。此外，由于原始的训练数据存在不同大小、色差、解析度的图像，因此在神经网络的隐含层中会遇到资料分散的问题，本发明提出一种标准化处理的方法，通过对神经网络的输出进行标准化处理降低了传统方法对数据一致性的高度依赖。

一种基于生成协作网络的大肠内视镜息肉检测方法的具体实施例，包括以下步骤：

步骤1.构建基于分段式激励函数的神经元模型。

在神经网络模型中，多个神经元相连接后可以构成多层的神经网络，而每层网络均可通过反向传播来更新其权重参数。本发明设定每一个神经元都有多个输入值x₁～x_n以及一个输出值y。输入值与输出值之间的数学关系使用输入值的加权乘积和的函数来表示，即：

其中，w₁～w_n神经元输入的权重，b为偏移量，f()为激励函数。为了使输入和输出脱离线性关系来加深神经网络的深度，本发明使用分段激励函数RELU，通过分段激励函数的线性性质能有效地克服梯度消失的问题,使部分神经元的输出为0让神经网络变得稀疏，加深神经网络深度及缓解过度拟合的状态。

步骤2.输入图像预处理。

在实际应用中，由于数据集中的图像存在不同的大小，为了方便后续的特征检测，本发明对图像进行预处理，将输入的原始的彩色大肠内视镜图处理成大小为128*128的图像。

步骤3.构建基于卷积神经网络的生成器模型。

通过基于卷积神经网络的生成器对输入的数据图像进行特征提取，转化为数字信息并进行数字化特征的学习训练。在卷积神经网络的训练过程中，生成器模型会批量生成带有杂讯、镜像位移等中间产物，利用中间产物进行辨识学习来训练网络的权重。同时，这些所生成的中间产物在网络权重训练完成后会被保存供下一次训练使用，以实现数据量需求的简化。在卷积神经网络的卷积层中，原始图片与特征侦测器进行运算，通过卷积核提取出原始图片中的特征，不同的卷积核提取出的特征不同，然后对应卷积核会产生同等数量的特征图。为了避免丢失特征位置信息，本发明取消设置池化层，即第一层卷积层后面直接连接第二层卷积层。生成器模型从左到右依次包含了三个部分：两层卷积层，两层全连接层与两层转置卷积层。

步骤3.1.构建生成器的卷积层部分。

预处理后的彩色大肠内视镜图输入到生成器的卷积层部分，卷积层部分包含两层卷积神经网络。本发明设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2。第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2。卷积层使用的是Leaky relu激励函数。通过卷积层得到29*29*32的特征图。由于卷积层参数会影响特征图的大小，因此本发明设置卷积层参数的参数如下：

其中，W₁与H₁代表输入图片的宽度和长度，W₂与H₂代表经卷积后的特征图的宽度和长度。k代表卷积核的尺寸大小，s表示卷积核移动的步伐数。p代表对原始图片外层进行填补0的行列数量，用于控制特征图的大小。

本实施例定义了基于卷积神经网络的生成器的损失函数，其数学表达式为：

Loss＝||G(X_a)-X_d||+||C(G(X_a))-C(X_d)||

其中，X_a为生成器的输入，即原始的大肠内视镜图。G(X_a)为生成器的输出。X_d为标准的内视镜大肠肿瘤检测图，作为训练的标签数据。C(G(X_a))为输入G(X_a)时协作器的输出，也就是最终的息肉检测结果。C(X_d)为输入为X_d时协作器的输出。

步骤3.2.构建生成器的全连接层部分。

在实际应用中，由于存在不同大小、色差、解析度的图像数据集，因此本发明使用一种自定义的批标准化算法对生成器中两层全连接层的输出进行标准化。使用该标准化算法不仅可以克服传统的方法对高度一致数据集的依赖性，同时可以保证生成器模型在训练过程的收敛稳定性。通过全连接层的标准化处理之后得到1024的特征向量。全连接层使用的是Leaky relu激励函数。

批标准化架构用于将不同大小、色差、解析度的图像进行均一化处理，以便输入卷积神经网络使用。本发明设计的标准化方法如下所示：

其中，x₁～x_m为卷积神经网络的输出，即批标准化层的输入，u_B为批标准化层的输入的平均值，

为批标准化层的输入的方差。ε是为了增加变异量数的稳定性而添加的常数。

为批标准化层的输入的标准化数值。γ,β为批标准化层中的可学习的参数，用来扩大和平移输入的分布。

步骤3.3.构建生成器的转置卷积层部分。

转置卷积神经网络在最开始就先连接全连结层，然后再重塑成的特征图，即卷积神经网络的摊平倒反但不具有池化层。转置卷积神经网络的作用是将特征向量转换为黑白图像的大肠内视镜息肉检测图片。第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2。第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2。第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。在卷积神经网络的训练过程中，生成器模型批量生成带有杂讯、镜像位移等中间产物，通过中间产物进行特征辨识学习来训练网络的权重。在训练完成后，该生成器模型会将带有杂讯的中间产物保存以供下一次训练使用，以达到简化数据量的作用。

本发明设置转置卷积层参数的参数如下：

W₂＝(W₁-1)*S-2*P+K

H₂＝(H₁-1)*S-2*P+K

步骤4.建立基于卷积神经网络的协作器模型。

该模型将生成器产生的中间产物进行杂讯滤波并将数学矢量数据倒转为可视化的黑白灰阶图像数据，以完成1组数据由图像-数学矢量-图像的转化过程。最终和原始图像进行结合得到最终的图像标示结果。与生成器模型结构类似，协作器从左到右依次包含了三个部分：两层卷积层，两层全连接层与两层转置卷积层。

步骤4.1.构建协作器卷积层部分。

协作器中卷积层部分输入的是生成器输出的中间产物，卷积层部分包含两层卷积神经网络。本发明设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2。第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2。卷积层使用的是Leaky relu激励函数。通过卷积层得到29*29*32的特征图。本发明设置协作器中卷积层参数的参数如下：

其中，W₁ ^x与

代表输入图片的宽度和长度，

与

代表经卷积后的特征图的宽度和长度。K^x代表卷积核的尺寸大小，S^x表示卷积核移动的步伐数。P^x代表对原始图片外层进行填补0的行列数量，用于控制特征图的大小。

本实施例定义了基于卷积神经网络的协作器的损失函数，其数学表达式为：

Loss＝α||C(X_d)-X_d||+(1-α)||C(G(X_a))-X_d||

步骤4.2.构建协作器全连接层部分。

通过协作器过全连接层的标准化处理之后得到1024的特征向量。协作器全连接层使用的是Leaky relu激励函数。

其中，

为协作器卷积神经网络的输出，即批标准化层的输入，

为批标准化层的输入的平均值，

步骤4.3.构建协作器转置卷积部分。

第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2。第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2。第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。协作器的转置卷积层输出的黑白检测图像与原始图像结合得到最终的大肠内视镜息肉检测结果。

本发明设置转置卷积层参数的参数如下：

其中，W₁ ^x与

代表输入图片的宽度和长度，

与

Claims

1.一种基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，包括如下步骤：

步骤1，基于分段激励函数构建神经元模型；

2.根据权利要求1所述的基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，步骤3包括以下的步骤：

步骤(32)，构建带有标准化处理的生成器全连接层部分；包括两层全连接层、和批标准化层，使用批标准化算法对生成器中两层全连接层的输出进行标准化，通过全连接层的标准化处理之后得到一维的特征向量；

3.根据权利要求1所述的基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，

步骤4包括以下的步骤：

4.根据权利要求2或3所述的基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，所述的标准化处理，具体为：

为批标准化层的输入的方差，ε是常数，

为批标准化层的输入的标准化数值，γ,β为批标准化层中的可学习的参数，用来扩大和平移输入的分布；BN为批标注化。

5.根据权利要求2所述的基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，对于卷积层部分，设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2，第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2；卷积层使用的是Leaky relu激励函数；对于转置卷积神经网络部分，设置第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2，第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2，第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。

6.根据权利要求3所述的基于生成协作网络的大肠内视镜息肉检测方法，其特征在于，对于卷积层部分，设置第一层卷积层的卷积核的数量为16，大小设定为8*8*3，步长设定为2*2，第二层卷积层的卷积核数量设置为32，大小设定为5*5，步长设置为2*2，卷积层使用的是Leaky relu激励函数；对于转置卷积神经网络部分，第一层转置卷积层的卷积核的数量设置为16，大小设定为5*5，步长设置为2*2，第二层转置卷积层的卷积核的数量设置为1，大小设定为8*8，步长设置为2*2，第一层转置卷积层使用的激励函数为Leaky relu函数，而第二层使用的激活函数为sigmoid函数。