CN112580639A

CN112580639A - 一种基于进化神经网络模型压缩的早期胃癌图像识别方法

Info

Publication number: CN112580639A
Application number: CN202110223672.9A
Authority: CN
Inventors: 胡兵; 章毅; 张潇之; 周尧; 刘伟; 吴雨; 袁湘蕾
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-03-01
Filing date: 2021-03-01
Publication date: 2021-03-30
Anticipated expiration: 2041-03-01
Also published as: CN112580639B

Abstract

本发明公开一种基于进化神经网络模型压缩的早期胃癌图像识别方法，涉及计算机应用技术领域，解决现有卷积神经网络模型中的参数冗余、早期胃癌识别过程中神经网络模型计算量消耗大而导致的实时性差的问题；包括以下步骤：采集早期胃癌图像数据集;训练神经网络模型；构建二值编码方式来对神经网络模型中的参数进行编码;使用进化算法对训练后的神经网络模型进行压缩;微调压缩后的神经网络模型，并识别新输入的胃镜检查图像上的早期胃癌病变区域；本发明能够根据收集的胃镜检查图像数据压缩用于检测的神经网络模型，从而提高早期胃癌检测任务中神经网络模型的效率，使得深度神经网络方法在早期胃癌检测方面具有好的实时性能。

Description

一种基于进化神经网络模型压缩的早期胃癌图像识别方法

技术领域

本发明涉及计算机应用技术领域，具体涉及一种基于进化神经网络模型压缩的早期胃癌图像识别方法。

背景技术

胃癌(Gastric cancer, GC)是是世界范围内致死率第三高的恶性疾病。由于早期的症状很轻微，胃癌通常都是在晚期才被诊断出来，其5年生存率低于30%。如果早期识别到胃癌，并且采取了相应的治疗，其5年生存率可以提升到95%以上。因此早期胃癌的识别对于降低胃癌致死率具有极其重要的意义。胃镜检查目前已被广泛用于早期胃癌的诊断，可以为早期的干预和治疗提供指导。由于早期胃癌通常只表现出黏膜上的一些细微变化，因此胃癌识别的敏感性一般相对较低。此外，具有丰富临床经验和熟练操作技巧的医生目前仍然较为缺乏，这一情况在欠发达地区更为严重。近年来，基于神经网络的人工智能方法在胃癌早期诊断中取得了许多成功的应用。虽然神经网络方法取得了较好得效果，但是其计算代价消耗巨大，对高性能计算硬件设备(比如高性能GPU)具有较大的依赖，难以满足胃镜检查场景下的实时性分析的要求。

现有的技术方案主要通过神经网络方法来辅助进行早期胃癌识别。为了减少神经网络对于大量训练数据的依赖，迁移学习被用于早期胃癌的识别。通过先在大量其他图像上进行预训练，可以使得低层的卷积层具备较好的初始化的值，从而避免胃癌内镜图像较少而带来的过拟合问题。早期胃癌肉眼识别主要分为肿瘤状态隆起的“隆起型”，未观察到隆起和凹陷的“表面隆起型”以及轻微凹陷的“表面凹陷型”，为了定位这些胃癌病变的具体位置，有研究者提出在图上随机截取癌症部分和正常部分，然后训练神经网络分类器来实现对整张图像上病变位置的识别。此外，像SSD (Single Shot MultiBox Detector)等通用目标识别方法也被用于早癌胃癌的识别。可以直接从原始图像上学习并预测胃癌病变目标的位置。

以卷积神经网络为代表的人工智能方法，通常需要构建具有大量参数的模型来保证其良好的性能。大模型通常需要消耗大量的计算资源，由此导致了运算速度方面的局限性。在胃镜检查的临床流程中，实时性的辅助提示是非常重要的。已有的技术方法大多采用现有的神经网络模型来对胃镜检查图像进行处理分析，然而这些模型是针对大规模的通用图像场景而设计的，因此存在一定的冗余。特别是目标识别模型，涉及到更加复杂的上采样操作以及多尺度特征融合过程，使得整个模型的运算效率在早期胃癌识别的场景下显得更加局限。此外，胃镜检查图像的数量通常比较有限，现有早期胃癌识别方法中神经网络模型参数的冗余，不仅制约了实际临床应用的实时性能，也增加了模型过拟合的风险。总的来说，深度神经网络方法的网络模型通常包含大量参数，并且存在一定的冗余性，这导致了巨额的计算开销，进而制约了基于深度神经网络的方法在内镜检查图像清晰度高和实时性要求高的场景下的应用。

发明内容

本发明的目的在于：针对现有技术的不足，提供了一种基于进化神经网络模型压缩的早期胃癌图像识别方法，该方法基于进化算法，可高效地自动发现现有卷积神经网络模型中的参数冗余，解决早期胃癌识别过程中神经网络模型计算量消耗大而导致的实时性差的问题。

本发明为了实现上述目的具体采用以下技术方案：

一种基于进化神经网络模型压缩的早期胃癌图像识别方法，包括以下步骤：

（1）采集并标注用于训练神经网络模型的早期胃癌图像数据集;

（2）训练神经网络模型;

（3）构建二值编码方式来对神经网络模型中的参数进行编码;

（4）使用进化算法对训练后的神经网络模型进行压缩;

（5）微调压缩后的神经网络模型，并识别新输入的胃镜检查图像上的早期胃癌病变区域。

进一步地，所述步骤（1）中，采集并标注用于训练神经网络模型的胃镜图像数据集，包括以下步骤：

（11）录制胃镜检查视频流，筛选并裁剪出包含早期胃癌病变以及正常胃部图像的视频片段；

（12）抽取相应包含早期胃癌病变区域的视频帧，并随机抽取正常胃部的视频帧；

（13）使用矩形对病变区域进行标注，并且对病变和正常视频帧分别进行图像级别标注；

（14）将标注后的数据集划分成训练集、验证集、测试集三个部分。

进一步地，所述步骤（2）训练神经网络模型，包括以下步骤：

（21）构建神经网络检测模型，并使用步骤(1)中标注的数据训练早期胃癌检测神经网络模型，网络模型同时输出早期胃癌病变区域位置的矩形框的坐标值；

（22）设置聚类数目，使用K-means算法对所有的早期胃癌标记区域的尺寸进行聚类，K-means算法获得的聚类中心设置为早期胃癌识别神经网络模型的默认anchor的大小；神经网络模型输出的结果用于对默认anchors进行修正，并且和标记的识别方框进行比对，使用交叉熵和欧式距离来计算二者的综合误差，然后使用反向传播算法对模型进行训练。

进一步地，所述神经网络模型包括主干网络和检测头网络；主干网络包括数层卷积层，用于对输入图像进行下采样；检测头网络包括若干层卷积层和数个上采样层，将主干网络的输出图进行上采样处理后产生数个代表不同的尺度信息的检测输出，用于识别不同大小的早期胃癌病变区域；数个不同尺度的检测输出结果通过非极大值抑制产生最后的识别框的预测输出。

进一步地，所述主干网络包括四个卷积层，四个卷积层的步长为2，卷积核数目分别为128、256、512和1024，卷积核大小均为

；检测头网络的检测输出结果为3个。

进一步地，所述主干网络和检测头网络的所有卷积层后面都使用批归一化和ReLU激活函数。

进一步地，步骤（3）构建二值编码方式对神经网络模型中的参数进行编码，包括以下步骤：

（31）确定编码长度：根据神经网络识别模型中的卷积核的数量，使用一个同样长度的一维向量来表示所有待剪枝的卷积核，其中1代表保留，0代表删除；

（32）确定遗传操作：基于二值编码方式，确定进化算法所需要使用的交叉操作和变异操作，用于进行启发式搜索。

进一步地，所属步骤（4）使用进化算法对训练后的神经网络模型进行压缩，具体包括如下步骤：

（41）确定优化目标函数：目标函数包括网络模型计算代价和识别误差，网络模型计算代价采用浮点运算数量度量，识别误差通过在验证数据集上的目标识别分类误差的交叉熵以及识别框偏差程度的欧式距离进行量化；将网络模型计算代价和识别误差进行加权，加权后的代价函数作为进化算法的适应度函数；

（42）设计种群初始化方法：在开始阶段，将种群中所有的候选解都初始化为1，从而保留所有的参数；随着进化算法的运行，逐渐通过置0来修剪掉部分卷积核，实现模型压缩；

（43）通过构建的目标函数选择较优的解，每一代进化都将当前种群中的解随机进行两两配对，并且通过上一步构造的交叉和变异操作产生新的解，并且淘汰较差的解。

进一步地，所述步骤（5）微调压缩后的神经网络模型，并识别新输入的胃镜检查图像上的早期胃癌病变区域，具体包括以下步骤：

(51)从步骤（43）中进化算法得到的解集中，选择适应度函数最好的解；

(52)将解的二值编码转换为实际的压缩后的神经网络模型，从原网络中继承相应的权重参数，然后继续在早期胃癌图像数据训练集上进行微调；

(53)将微调后的模型用于测试集，评估效果，用于识别新输入的早期胃癌病变的病变区域。

本发明的有益效果如下：

1、本发明能够根据根据收集到的胃镜检查图像自动对现有的目识别卷积神经网络模型进行压缩，其采用的进化算法可根据具体的优化问题，设计候选解表示方法，有效对网络模型压缩问题建模,在保持网络模型准确率的前提下减少冗余参数、提高模型运算效率,进而减小模型过拟合风险;构建基于进化神经网络模型压缩的早期胃癌识别方法，可以实现自动化的网络模型压缩，从而提高早期胃癌识别任务中神经网络模型的效率，提升神经网络模型识别早期胃癌病变的实时分析效率，促进神经网络方法在早期胃癌识别方面的实际临床应用；

2、本发明的方法基于进化算法，可高效地自动发现现有卷积神经网络模型中的参数冗余，能够自动压缩用于早期胃癌识别的神经网络模型，无需人工设置网络模型压缩率。

附图说明

图1是本发明基于进化神经网络模型压缩的早期胃癌识别方法的整体流程示意图；

图2是本发明神经网络模型结构图；

图3是模型压缩中的卷积核剪枝操作示意图；

图4是基于二值编码的交叉操作示意图；

图5是基于二值编码的变异操作示意图；

图6是进化压缩算法流程图；

图7是早期胃癌识别结果示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示，本实施例提供的基于进化神经网络模型压缩的早期胃癌识别方法，包括以下步骤：

（2）训练神经网络模型;

（4）使用进化算法对训练后的神经网络模型进行压缩; 在维持网络性能的同时减少模型计算量；

其中，所述步骤（1）中，采集并标注用于训练神经网络模型的胃镜图像数据集，包括以下步骤：

其中，步骤（2）训练神经网络模型，包括以下步骤：

具体的，对一个

层的神经网络，设其训练样本集合为

,其中m为单个样本的维度，

表示训练样本的个数；那么第

个样本可表示为

,网络第1层的的权值为

，设第1层的激活函数为

,则网络的前向计算过程为：

在本实施例中，所述神经网络模型包括主干网络和检测头网络；主干网络包括数层卷积层，用于对输入图像进行下采样；检测头网络包括若干层卷积层和数个上采样层，将主干网络的输出图进行上采样处理后产生数个代表不同的尺度信息的检测输出，用于识别不同大小的早期胃癌病变区域；数个不同尺度的检测输出结果通过非极大值抑制产生最后的识别框的预测输出。

作为本实施例的一个优选实施方式，参照图2，主干网络包括四个卷积层，分别为卷积层Conv1、Conv2、Conv3和Conv4，四个卷积层的步长为2，卷积核数目分别为128、 256、512和1024，卷积核大小均为

；检测头网络使用一个包含

卷积核的步长为1的卷积层Conv5将主干网络最后一个卷积层Conv4合并后的特征图的总通道数减半，然后通过上采样层Up1进行双线性插值方式的上采样，产生的结果和主干网络中卷积层Conv3的输出在通道级别进行合并；合并后的结果继续使用一个包含

卷积核的步长为1的卷积层Conv6来将前一步合并后的特征图的总通道数减半，然后通过上采样层Up2进行双线性插值方式的上采样，Up2层的结果和Conv2层的结果在通道级别上进行合并，并且通过步长为2的卷积层Conv7-1产生第一个检测输出y1，进一步，使用步长为1的卷积层Conv7-2来将特征图的总通道数目翻倍；类似的，使用步长为2的卷积层Conv8-1产生检测输出y2，使用步长为1的卷积层Conv8-2来将特征图的总通道数目翻倍；最后使用步长为2的卷积层Conv9产生检测输出y3。这三个检测输出代表了不同的尺度信息，可以用于检测不同大小的早期胃癌病变区域。

其中主干网络和检测头网络的所有卷积层后面都使用批归一化和ReLU激活函数。

（22）设置聚类数目，使用K-means算法对所有的早期胃癌标记区域的尺寸进行聚类，本实施例中聚类数目设置为9，K-means算法获得的聚类中心设置为早期胃癌识别神经网络模型的默认anchor的大小；神经网络模型输出的结果用于对默认anchors进行修正，并且和标记的识别方框进行比对，使用交叉熵和欧式距离来计算二者的综合误差，然后使用反向传播算法对模型进行训练。

具体的，假设网络中一个分支输出的特征图的大小为S

S，对应的可以将输入图像划分为S

S的网格。该特征图上的每一个位置的元素包含了五个部分的内容，用于对B个anchor进行变换：分别是预测框的中心点的水平和垂直位置坐标

、预测框的高和宽

、预测框内包含早期胃癌病变区域的概率

。对于第

位置所对应的anchor，其中对应原图像区域是否包含已标注的早期胃癌病变标注可以通过

来表示，包含则为1，不包含则为0。与此相反，

表示不包含病变区域标注。假设使用

来表示标注的病变区域的矩形框信息，则网络训练的损失函数可以表示为：

将胃镜检查图像或者视频帧输入到网络中，将网络输出结果和anchor结合，使用非极大值抑制（nms）来产生预测框，并且与标注的病变区域的位置框来进行比较，计算损失函数，进而使用反向传播算法实现网络权值的更新：

参考图3至图5，步骤（3）构建二值编码方式对神经网络模型中的参数进行编码，包括以下步骤：

参考图6，步骤（4）使用进化算法对训练后的神经网络模型进行压缩，具体包括如下步骤：

（41）确定优化目标函数：目标函数包括网络模型计算代价和识别误差，网络模型计算代价采用浮点运算数量(FLOPs)度量，识别误差通过在验证数据集上的目标识别分类误差的交叉熵以及识别框偏差程度的欧式距离进行量化；将网络模型计算代价和识别误差

进行加权，此处的

设置为0.1，加权后的代价函数作为进化算法的适应度函数；

（42）设计种群初始化方法：在开始阶段，将种群中所有的候选解都初始化为1（1表示保留卷积核，而0表示修剪掉卷积核），每一个候选解都对应着一个不同的压缩后的模型，随着进化算法的运行，每一代都会通过交叉变异的遗传操作将候选解中的1替换为0，实现卷积核修剪，实现模型压缩；

其中，也可以将0替换为1来恢复被修剪掉的卷积核。

（43）通过构建的目标函数选择较优的解（即目标函数值较小的解）：每一代进化都将当前种群中的解随机进行两两配对，并且通过上一步构造的交叉和变异操作产生新的解。每一个新产生的解需要解码为对应的剪枝后的网络模型，并且在构建的早期胃癌验证数据集上重新计算误差函数和FLOPs，进而构造一个新的种群，其大小和之前的种群相同。最后，将新的种群和之前的种群合并，然后根据合并后的种群中所有解的目标函数值，淘汰一半数量的较差（目标函数值较大）的解，从而在进化过程维持一个固定大小的种群。

步骤（5）微调压缩后的神经网络模型，并识别新输入的胃镜检查图像上的早期胃癌病变区域，具体包括以下步骤：

(53)将微调后的模型用于测试集，评估效果，用于识别新输入的早期胃癌病变的病变区域，如图7所示。

Claims

1.一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，包括以下步骤：

（2）训练神经网络模型;

（4）使用进化算法对训练后的神经网络模型进行压缩;

2.根据权利要求1所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述步骤（1）中，采集并标注用于训练神经网络模型的胃镜图像数据集，包括以下步骤：

（14)将标注后的数据集划分成训练集、验证集、测试集三个部分。

3.根据权利要求1所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述步骤（2）训练神经网络模型，包括以下步骤：

（21)构建神经网络检测模型，并使用步骤(1)中标注的数据训练早期胃癌检测神经网络模型，网络模型同时输出早期胃癌病变区域位置的矩形框的坐标值；

4.根据权利要求3所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述神经网络模型包括主干网络和检测头网络；主干网络包括数层卷积层，用于对输入图像进行下采样；检测头网络包括若干层卷积层和数个上采样层，将主干网络的输出图进行上采样处理后产生数个代表不同的尺度信息的检测输出，用于识别不同大小的早期胃癌病变区域；数个不同尺度的检测输出结果通过非极大值抑制产生最后的识别框的预测输出。

5.根据权利要求4所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述主干网络包括四个卷积层，四个卷积层的步长为2，卷积核数目分别为128、 256、512和1024，卷积核大小均为

；检测头网络的检测输出结果为3个。

6.根据权利要求4所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述主干网络和检测头网络的所有卷积层后面都使用批归一化和ReLU激活函数。

7.根据权利要求1所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，步骤（3）构建二值编码方式对神经网络模型中的参数进行编码，包括以下步骤：

8.根据权利要求1所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述步骤（4）使用进化算法对训练后的神经网络模型进行压缩，具体包括如下步骤：

9.根据权利要求8所述的一种基于进化神经网络模型压缩的早期胃癌图像识别方法，其特征在于，所述步骤（5）微调压缩后的神经网络模型，并识别新输入的胃镜检查图像上的早期胃癌病变区域，具体包括以下步骤：