CN111862095B

CN111862095B - 根据内镜白光图像预测生成nbi图像的卷积神经网络模型及其构建方法和应用

Info

Publication number: CN111862095B
Application number: CN202010864512.8A
Authority: CN
Inventors: 王泽楠; 刘明; 刘心娟; 郝建宇
Original assignee: Beijing Chaoyang Hospital
Current assignee: Beijing Chaoyang Hospital
Priority date: 2020-08-25
Filing date: 2020-08-25
Publication date: 2024-03-08
Anticipated expiration: 2040-08-25
Also published as: CN111862095A

Abstract

本发明提供了一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型及其构建方法和应用。本发明的卷积神经网络模型的构建方法，包括：步骤S1：建立包括输入层、编码器、解码器和输出层的神经网络结构；步骤S2：采用融合迁移学习算法对所述神经网络结构进行赋值，获得初始模型；步骤S3：采用包括多对成对的白光图像和NBI图像的数据集对所述初始模型进行训练。本发明的卷积神经网络模型无需借助NBI设备即可根据内镜白光图像预测生成NBI图像并分析病变性质，在保证准确度的前提下达到了实时预测的速度要求，为临床中消化内镜的图像分析提供了新的思路。

Description

根据内镜白光图像预测生成NBI图像的卷积神经网络模型及其构建方法和应用

技术领域

本发明涉及卷积神经网络技术领域，尤其是涉及一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型及其构建方法和应用。

背景技术

消化道肿瘤的发病率高、危害大，早期诊治尤为重要。然而，消化道肿瘤病变的早期表现多种多样，传统白光内镜识别和诊断存在困难，有时还难以确定边界和浸润深度。

研究表明，与白光成像相比，内镜窄带成像术(Narrow Band Imaging，NBI)联合放大内镜对胃早癌诊断的敏感性、特异性更高。目前，内镜医师多使用NBI对消化道病变进行观察。NBI技术通过利用滤光器过滤掉内镜光源所发出的红蓝绿光波中的宽带光谱，仅留下窄带光谱，即为415nm蓝光和540nm绿光，能够被血红蛋白强吸收，得到微血管的高对比度成像，并且勾勒黏膜表面和表浅的微细结构，可用于观察黏膜微结构和微血管形态，从而更精确地判断病变性质，尤其是对于消化道病变的良恶性进行甄别，并且能够发现微小病灶、确定病变范围，这对消化道肿瘤的早期诊疗和增加生存期至关重要。

然而，基层医院很少配备有NBI设备，此外内镜医生的经验和知识也往往不足，因此难以满足消化道肿瘤诊治的需要。如能不依靠NBI设备，运用图像处理算法，根据患者的内镜白光图像自动预测生成NBI图像，并对病变性质进行初步判断，则能够帮助基层医师方便高效地进行疾病筛查，实现消化道疾病的早诊早治，这对医疗条件欠佳地区患者而言尤为重要，并且能够节省大量的医疗资源，减轻卫生医疗体系的负担。如何不借助NBI设备，根据白光图像预测生成出相对应的NBI图像，是问题的关键。

在处理这类图像问题的时候，传统算法主要依靠人工提取特征的方式，如利用传统的计算机图形学得到几何形状、病变位置大小、边角等的语义特征，或使用边缘检测的canny滤波来得到图像的轮廓特征。随着机器学习的发展，也有研究利用传统方法得到图像特征，然后结合机器学习算法对图像进行分析。然而，这些基于人工提取特征的方法具有很大的局限性，无法有效地得到更抽象的深层次语义信息，从而影响了图像分析的准确性。因此，需要借助更好的图像处理算法来解决这一问题。

鉴于此，特提出本发明。

发明内容

本发明的目的在于提供一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型及其构建方法和应用，该卷积神经网络模型无需借助NBI设备即可对内镜白光图像进行NBI图像的预测生成并分析病变性质。

本发明提供一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型的构建方法，包括：

步骤S2：采用融合迁移学习算法对所述神经网络结构进行赋值，获得初始模型；

步骤S3：采用包括多对成对的白光图像和NBI图像的数据集对所述初始模型进行训练；

步骤S4：采用测试集对训练后的模型进行检测、评估和优化。

卷积神经网络(Convolutional Neural Networks，CNN)是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一，具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。在图像领域，CNN具有三大任务，分别为分类、目标检测和分割，现有相关研究主要集中在图像分类和检测领域，基于CNN强大的特征提取和表达能力对图像进行分类判断或者目标检测。然而，在本发明中需要通过白光图像预测生成NBI图像，其是一个像素级别的图像分割任务，需要精准预测出每个像素点从白光图像到NBI图像的映射关系；基于此，本发明特提出上述用于预测生成NBI图像的卷积神经网络模型的构建方法。

在上述神经网络结构中，输入层用于输入图像，其在训练时可以输入成对的白光图像和NBI图像、病理图像等，其在应用时可以输入待分析的白光图像；输入层为图像预处理层，包括对图像进行旋转、平移、颜色变换等数据增强操作。

编码器用于提取输入图像中的特征并输出特征图，通过激活函数将上下层函数关系非线性化，通过池化层对特征图进行特征选择并完成特征图的重构，将重构的特征不断地卷积、池化，输入到解码器；编码器由E1、E2、E3、E4四个卷积层组成，层与层之间通过池化层连接，由此对图像进行特征抽取。

解码器通过上采样和反卷积融合不同卷积层得到特征图，其利用反卷积和上采样技术将预训练编码器输出的特征图进行融合，进而得到进行预测和分类的特征图。具体地，解码器由D0、D1、D2、D3、D4组成，D0由卷积层和池化层组合，D1-D4层由反卷积层和卷积层组合。解码器D0对E4的输出进行卷积和池化操作，D1对D0进行反卷积操作得到上采样，然后跟E4进行特征融合，作为D2的输入。D2对D1进行反卷积上采样，然后和E3做特征融合做D3的输入。D3对D2进行反卷积上采样和E2进行特征融合，D1对D2的输出做反卷积长采样和E1进行特征融合，最后输出到输出层。

输出层用于输出预测生成的特征图，其结构包括卷积层和全连接层。输出层由一些卷积层组成，最后一个卷积层的通道数为1，用来输出完整的图像；此外，针对良恶性分类，输出层还可以建立一个单独的预测分支，由卷积层和全连接层组成，用来预测良恶性分类。

在上述构建方法的步骤S1中，采用反卷积和上采样技术使预训练编码器每一层的特征矩阵与解码器对应层的特征矩阵进行特征融合。

在CNN模型结构中，浅层网络能够抽取到图像的边角、形状等几何信息，深层网络能抽取到高阶语义信息；为了充分地利用CNN的这一特性以及解决医学图像“小样本”的问题，本发明使用反卷积以及上采样技术，让编码器每一层的特征矩阵跟解码器对应层进行特征融合(特征矩阵相加)，这样解码器既保留了低阶的几何信息又融合了高阶的语义信息，增强了模型的多尺度处理能力，提高了模型的表达能力和预测能力。

上述构建方法的步骤S2包括：将公开数据集ImageNet上充分预训练的卷积神经网络权重逐层迁移到预训练编码器上作为初始化权重，获得初始模型。

更具体地，在多尺度多任务的CNN模型框架下，可以在百万量级的公开数据集ImageNet(http://www.image-net.org/)上充分预训练的卷积神经网络权重逐层迁移到特征编码器上，作为模型的初始化权重。在迁移过程中，去除全连接层，只保留卷积层；例如，对VGG16而言，只需要迁移前13个卷积层，可以丢掉后面3层卷积层。

上述构建方法的步骤S3包括：向对所述初始模型中输入成对的白光图像和NBI图像、病理结果，通过预训练编码器提取特征并输出特征图，通过激活函数将上下层函数关系非线性化，通过池化层对特征图进行特征选择并完成特征图的重构，将重构的特征不断地卷积、池化后输入到解码器中，解码器通过上采样和反卷积融合不同卷积层得到特征图。

进一步地，步骤S3中，可以采用随机失活算法、批归一化算法和添加正则项来防止过拟合发生；此外，可以采用随机梯度下降法等进行权重更新，通过不断迭代和优化模型参数，获得卷积神经网络模型。

进一步地，步骤S3中，可以利用损失函数对训练结果进行误差反向传播，通过反馈优化调整模型参数并验证模型训练效果。

特别是，步骤步骤S3还可以包括：采用包括多个病理图像的数据集对所述初始模型进行训练。此时，在底层共享的特征图上，可以额外增加一个良恶性分类的头部网络，最后的输出层上分为两个分支，分别预测生成NBI图像和进行良恶性分类，从而赋予模型更多的能力。

在本发明中，成对的白光图像和NBI图像指的是针对同一对象、相互一一对应的白光图像和NBI图像，其中白光图像是通过白光内镜诊断获得的，NBI图像是通过内镜窄带成像术获得的，病理结果指的是同一张图像所对应的病理。通过将正确方式采集到的大量成对的白光图像和NBI图像、病理结果直接输入卷积神经网络模型，可以加快模型的训练速度，提升模型的预测效果。

在步骤S4中，在训练好模型之后，将测试集的数据送入模型进行测试，并验证模型的精确度，以测试的反馈信息来评价和改进模型。其中，以DICE系数(集合相似度度量函数，通常用于计算两个样本的相似度)、MAE(mean absolute error，平均绝对误差)、MSE(meansquare error，均方误差)等多个指标来评估预测生成对应的NBI图像的效果；以ROC(receiver operating characteristic，受试者工作特征)曲线、AUC(ROC曲线下面积)、准确率、特异性、敏感性、阳性预测值(positive predictive value，PPV)、阴性预测值(negative predictive value，NPV)等多个指标来评估图像的良恶性分类效果。

在本发明中，CNN模型搭建与训练所采用的GPU硬件环境可以为NVIDIARTX2080Ti，显存11G，软件环境可以为64位Linux Ubuntu 18.04操作系统，CUDA(ComputeUnified Device Architecture)10.2，可以使用Pytorch开源计算框架，以及Model Zoo中通过ImageNet数据集预训练好的CNN。

本发明的上述构建方法打破了传统方法无法获得图像全面信息这一局限性，同时也免去了预测生成NBI图像时的人工手动打标过程，减少了人工干预的成本，这对需要巨量图像数据训练的深度学习模型尤其重要，意味着通过正确方式采集到的大量图像可以直接输入卷积神经网络模型，从而加快模型的训练速度，提升预测效果。

本发明还提供一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型，按照上述构建方法构建得到。

本发明还提供上述卷积神经网络模型在白光图像分析中的应用。

本发明还提供一种白光图像分析方法，将白光图像输入上述卷积神经网络模型并输出分析结果；其中，所述分析结果包括NBI图像和病变性质中的至少一种。

与现有技术相比，本发明至少具有以下优势：

1、本发明在国内外首次提出运用卷积神经网络模型对白光内镜图像进行NBI图像的预测生成，并优化图像处理算法，在保证准确度的前提下，达到实时预测的速度要求；

2、本发明的卷积神经网络模型能够良好地应用于内镜图像处理，使之在NBI图像预测生成的同时，能够进行NBI图像的良恶性分类，并且模型能够适用于不同倍数、尺度的白光-NBI配对图像；

3、本发明为内镜医生提供了辅助诊断和新的图像分析思路，为临床中消化内镜图像分析提供了新的角度和新的临床应用方法，其贴合临床应用，有利于提高消化道病变的诊治效率，利于推广到基层医院以造福患者。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施方式的神经网络结构的示意图；

图2为本发明一实施方式的卷积神经网络模型的构建及应用示意图；

图3为本发明另一实施方式的神经网络结构的示意图；

图4为本发明另一实施方式的卷积神经网络模型的构建及应用示意图；

图5为本发明试验例利用构建得到的卷积神经网络模型根据内镜白光图像对NBI图像的预测生成结果；其中，A为白光原图；B为中间生成的Mask；C为Mask作用于原图；D为预测生成的NBI图像；E为与A配对的NBI原图。

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也包括复数形式，此外，还应当理解的是，当在本说明中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

本实施例的用于预测生成NBI图像的卷积神经网络模型的构建方法，步骤如下：

1.建立神经网络结构

本实施例建立如图1所示的神经网络结构，该网络结构包含四个部分：输入层、预训练编码器、解码器、输出层。

在CNN模型结构中，浅层网络能够抽取到图像的边角、形状等几何信息，深层网络能抽取到高阶语义信息；为了充分的利用CNN的这一特性以及解决医学图像“小样本”的问题，使用反卷积以及上采样技术，让编码器每一层的特征矩阵跟解码器对应层进行特征融合(特征矩阵相加)，这样解码器既保留了低阶的几何信息又融合了高阶的语义信息，增强了模型的多尺度处理能力，提高了模型的表达能力和预测能力。

解码器包含四个CNN模块，通过反卷积和上采样技术将编码器得到的特征图进行融合，得到进行预测和分类的特征图。

2.融合迁移学习算法

在多尺度多任务的CNN模型框架下，把在百万量级的公开数据集ImageNet(http://www.image-net.org/)上充分预训练的卷积神经网络权重逐层迁移到特征编码器上，作为模型的初始化权重。在迁移过程中，去除全连接层，只保留卷积层(例如对VGG16而言，只需要迁移前13个卷积层，丢掉后面3层)。

在模型训练过程中，采用随机失活(Drop-out)算法、批归一化(BatchNormalization)算法、添加正则项防止过拟合发生，采用随机梯度下降法(Stochasticgradient descent，SGD)来更新权重，通过不断迭代和优化，使模型能够不断逼近真实的NBI图像和分类结果。

本实施例中，CNN模型搭建与训练所采用的GPU硬件环境为NVIDIA RTX 2080Ti，显存11G，软件环境为64位Linux Ubuntu 18.04操作系统，CUDA(Compute Unified DeviceArchitecture)10.2，使用Pytorch开源计算框架，以及Model Zoo中通过ImageNet数据集预训练好的CNN。

3.模型训练

A.输入成对的白光图和NBI图，通过预训练的编码器提取特征并输出特征图，通过激活函数将上下层函数关系非线性化，通过池化层对特征图进行特征选择并完成特征图的重构，将重构的特征不断地卷积、池化，输入到解码器中，解码器通过上采样和反卷积融合不同卷积层得到特征图，最后得到输出的预测特征图。分别进行NBI图像预测生成和良恶性分类。

B.模型训练采用随机梯度下降方法等权重更新算法，利用损失函数对学习结果进行误差反向传播，两个不同分支的任务通过反馈同时优化调整模型参数，在模型训练每隔100步的时候会自动验证模型训练效果，完成训练模型-验证模型-调整模型-再训练模型-再验证模型的循环学习过程。

在采用包括2万对成对的白光图像和NBI图像的数据集进行训练后，构建得到用于预测生成NBI图像的卷积神经网络模型。

4.模型应用

如图2所示，将待分析的白光图像输入上述构建得到的卷积神经网络模型中，即可输出对应的NBI图像。

实施例2

如图3所示，本实施例的用于预测生成NBI图像的卷积神经网络模型的构建方法，在实施例1的构建方法的基础下进行如下改进：

步骤1建立神经网络结构中，在底层共享的特征图上，额外增加一个良恶性分类的头部网络，最后的输出层上分为两个分支，分别预测生成NBI图像和进行良恶性分类，从而赋予模型更多的能力。

步骤3模型训练中，还采用包括多个病理结果的数据集对所述初始模型进行训练，构建得到用于预测生成NBI图像和病变图像良恶性分类的卷积神经网络模型。

步骤4模型应用中，如图4所示，将待分析的白光图像输入上述构建得到的卷积神经网络模型中，即可输出对应的NBI图像和病变性质。

试验例1

通过收集的白光-NBI配对图像，进行图像筛选之后，一共配对了112对白光-NBI图像数据，利用计算机图形学的关键点检测等算法对训练数据进行校准配对，把校准对齐后的数据作为输入，使用实施例1构建得到的卷积神经网络模型进行白光-NBI的配对图像预测。训练一共进行了100个epoch，利用最后一个epoch的模型作为最终的预测模型。

预测结果见图5；其中A为白光原图，D为预测生成的NBI图像，E为NBI原图。由图5可以看出，利用构建得到的卷积神经网络模型进行NBI图像的预测时，预测结果和NBI原图较为相似，主体的血管脉络都能准确地预测出来，说明上述模型能够良好地根据内镜白光图像来预测生成NBI图像，预测结果的准确性高。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种根据内镜白光图像预测生成NBI图像的卷积神经网络模型的构建方法，其特征在于，包括：

步骤S1：建立包括输入层、编码器、解码器和输出层的神经网络结构；

步骤S4：采用测试集对训练后的模型进行检测、评估和优化；

步骤S1中，采用反卷积和上采样技术使编码器每一层的特征矩阵与解码器对应层的特征矩阵进行特征融合；

步骤S2包括：将公开数据集ImageNet上充分预训练的卷积神经网络权重逐层迁移到编码器上作为初始化权重，获得初始模型；

步骤S3包括：向对所述初始模型中输入成对的白光图像和NBI图像，通过编码器提取特征并输出特征图，通过激活函数将上下层函数关系非线性化，通过池化层对特征图进行特征选择并完成特征图的重构，将重构的特征不断地卷积、池化后输入到解码器中，解码器通过上采样和反卷积融合不同卷积层得到特征图。

2.根据权利要求1所述的构建方法，其特征在于，所述评估包括采用DICE系数、MAE和MSE中的至少一个指标来评估生成NBI图像的效果。

3.根据权利要求1所述的构建方法，其特征在于，步骤S3还包括：采用包括多个病理图像的数据集对所述初始模型进行训练。

4.根据权利要求1所述的构建方法，其特征在于，所述评估还包括采用ROC曲线、AUC、准确率、特异性、敏感性、阳性预测值和阴性预测值中的至少一个指标来评估图像的良恶性分类效果。

5.根据权利要求1所述的构建方法，其特征在于，在迁移过程中，去除全连接层并保留卷积层。

6.根据权利要求1所述的构建方法，其特征在于，步骤S3中，采用随机失活算法、批归一化算法和添加正则项来防止过拟合发生，采用随机梯度下降法进行权重更新，通过不断迭代和优化，获得卷积神经网络模型。

7.根据权利要求1所述的构建方法，其特征在于，步骤S3中，利用损失函数对训练结果进行误差反向传播，通过反馈优化调整模型参数并验证模型训练效果。

8.一种用于预测生成NBI图像的卷积神经网络模型，其特征在于，按照权利要求1-7任一项所述的构建方法构建得到。

9.权利要求8所述的卷积神经网络模型在白光图像分析中的应用。

10.一种白光图像分析方法，其特征在于，将白光图像输入权利要求8所述的卷积神经网络模型并输出分析结果。

11.根据权利要求10所述的白光图像分析方法，其特征在于，所述分析结果包括NBI图像和病变性质中的至少一种。