CN111968091A

CN111968091A - 一种临床图像中病变区域的检测和分类方法

Info

Publication number: CN111968091A
Application number: CN202010834609.4A
Authority: CN
Inventors: 汪彦刚; 王凯妮; 陈阳; 周光泉
Original assignee: Nanjing Tuge Medical Technology Co ltd
Current assignee: Nanjing Tuge Medical Technology Co ltd
Priority date: 2020-08-19
Filing date: 2020-08-19
Publication date: 2020-11-20
Anticipated expiration: 2040-08-19
Also published as: WO2022037642A1; EP4198819A1; EP4198819A4; CN111968091B

Abstract

本发明公开了一种临床图像中病变区域的检测和分类方法，包括对原始临床图像进行预处理，得到全局图像数据集；将得到的全局图像数据集输入基于检测图像中目标区域的卷积神经网络模型中进行训练，检测图像中的可能病变区域；将检测到的可能病变区域用矩形框框出，切割矩形框区域得到病变区域，并对切割后得到的病变区域进行归一化和数据增强，得到包含病变区域的局部图像数据集；将全局图像数据集和包含病变区域的局部图像数据集作为双模态输入到双流卷积神经网络中进行分类。本发明方法更好的利用临床图像的多模态信息，结合原始图像的全局信息和病变区域图像的局部信息，进而提高分类的准确率。

Description

一种临床图像中病变区域的检测和分类方法

技术领域

本发明属于临床图像处理技术领域，具体涉及一种临床图像中病变区域的检测和分类方法。

背景技术

肿瘤是危害生命健康的一大杀手，具有较高的死亡率，恶性肿瘤的临床表现因其所在的器官、部位以及发展程度不同而不同，恶性肿瘤早期多无明显症状，即便有症状也常无特异性，等患者出现特异性症状时，肿瘤常已属于晚期。通常对患者的临床表现和体征进行综合分析，结合实验室检查和影像学、细胞病理学检查做出明确诊断，以便拟定治疗方案和评估预后。但目前仍缺乏理想的特异性强的早期诊断方法，尤其对深部肿瘤的早期诊断更为困难。

目前，临床检查结合病理活检是目前确认病变组织学类型的金标准，如果不进行病理检查，医师无法通过肉眼进行鉴定腺瘤和息肉。临床研究表明，很多恶性肿瘤是从已经存在的腺瘤转化而来，因此尽早发现腺瘤对早期治疗有良好的预后，发现并切除肿瘤可以避免不必要的活检，并且还可以减少活检手术引起的并发症，进一步降低死亡率。

近年来，随着深度学习方法的发展，许多学者已将深度学习应用于临床医学图像的检测和分类。卷积神经网络(CNN)是一种经典的深度学习模型，它通过模拟人类视觉系统的识别过程来提取下层边缘纹理的局部特征，并提取深层中的高维特征，具有较高的泛化性能。但是大多数当前深度学习架构通常只考虑单模态，而不能充分利用临床图像的多模态信息。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足，提供一种临床图像中病变区域的检测和分类方法，可实现自动检测临床图像中的病变区域，并结合病变区域和初始临床图像的全局信息和局部信息，利用双流卷积神经网络准确的分类疾病。

为实现上述技术目的，本发明采取的技术方案为：

一种临床图像中病变区域的检测和分类方法，包括：

步骤1、对原始临床图像进行预处理，先去除原始临床图像中多余图像部分和噪声，再进行归一化和数据增强，得到全局图像数据集；

步骤2、将步骤1得到的全局图像数据集输入基于检测图像中目标区域的卷积神经网络模型(RCNN)中进行训练，检测图像中的可能存在的病变区域；

步骤3、将步骤2检测到的可能存在的病变区域用矩形框框出，切割矩形框区域得到病变区域，并对切割后得到的病变区域进行归一化和数据增强，得到包含病变区域的局部图像数据集；

步骤4、将步骤1得到的全局图像数据集和步骤3得到的包含病变区域的局部图像数据集作为双模态输入到双流卷积神经网络中进行分类。

为优化上述技术方案，采取的具体措施还包括：

上述的步骤1包括：

步骤101、利用灰度阈值分割法，去除图像中的白边和过渡曝光的部分；

步骤102、根据图像垂直方向和水平方向的灰度投影直方图，获取后续算法所需要区域的长和宽，根据得到的所需要区域长和宽截取所需要的区域，以去除所需要的区域之外的多余图像部分；

步骤103、使用低通滤波器，去除图像信号中的噪声；

步骤104、通过插值将图像标准化为相同尺寸，减少计算的复杂度；

步骤105、将标准化后的图像归一化到0-1，便于后续检测和分类网络更快速寻找最优解；

步骤106、利用三种数据增强的方式，分别是翻转，旋转，水平和垂直偏移图像，扩充现有的图像数据集，得到全局图像数据集。

上述的步骤105使用如下公式对图像归一化：

其中，y是输出像素值，x是输入像素值，Minvalue是临床图像像素最小值，Maxvalue是临床图像像素最大值。

上述的步骤2所述基于检测图像中目标区域的卷积神经网络模型(RCNN)包括基于Resnet网络架构的卷积神经网络、特征金字塔(FPN)网络和区域生成网络(RPN)；

所述特征金字塔网络使用具有横向连接的自顶向下架构，从单一规模的输入构建网络功能金字塔，获取不同尺寸的特征图，更完整保留图像信息；

所述区域生成网络采用滑动窗口扫描整幅图像，目的是寻找图像中所有可能存在病变的区域。

上述的步骤2包括：

步骤201、根据基于Resnet网络架构的卷积神经网络和特征金字塔网络，提取图像中的多尺度特征；

步骤202、根据提取的多尺度特征，结合区域生成网络，获得图像中所有可能存在病变区域的提取框；

步骤203、利用非最大抑制方法筛选步骤202生成目标区域，利用基于检测图像中目标区域的卷积神经网络模型对筛选后的目标区域进行回归和分类，最终判断出可能存在的病变区域。

上述的基于检测图像中目标区域的卷积神经网络模型的损失函数为：

L＝L_cls+L_box+L_mask

其中，L是损失函数，L_cls是回归框的分类损失值，L_box是回归框的分类损失值，L_mask是病变区域的损失值。

上述的步骤3所述切割矩形框区域得到病变区域，并对切割后得到的病变区域归一化和数据增强，包括以下步骤：

步骤301、根据步骤2检测到的可能存在的病变区域矩形框的位置，裁剪得到含有病变的区域，即病变区域；

步骤302、将病变区域图像通过插值标准化为相同尺寸，减少计算的复杂度；

步骤303、将标准化后的图像归一化到0-1，便于后续检测和分类网络更快速寻找最优解；

步骤304、利用三种数据增强的方式，分别是翻转，旋转，水平和垂直偏移图像，扩充现有的图像数据集，得到包含病变区域的局部图像数据集。

上述的步骤4包括：

步骤401、将全局图像数据集输入到双流卷积神经网络中的一路卷积神经网络完成卷积计算，得到全局特征图；

步骤402、将包含病变区域的局部图像数据集作为另一流输入到双流卷积神经网络完成卷积运算，得到局部特征图；

步骤403、连接双流卷积神经网络两流输出的特征图，作为最终特征输入到双流卷积神经网络的终端的全连接层，并得到最终的分类结果。

上述的双流卷积神经网络，根据Resnet的残差网络结合数据集特点修改所得，损失函数为Softmax。

上述的双流卷积神经网络为resnet50网络，resnet50网络中，网络装载初始权重，resnet50利用残差网络结构提取图像特征，其中，残差网络的公式如下：

R(x)＝F(x)+x

其中，R(x)代表残差块的输入，F(x)代表左侧主路径的输出，x代表输入；

所述双流卷积神经网络的损失函数计算公式为：

其中，y_k是输入的预测概率值，θ_k是网络训练权重超参数,x是输入。

本发明具有以下有益效果：

(1)本发明的方法可实现基于深度学习下临床图像数据自动检测和分类，既可以避免费时的手工启发式学习，还能避免不必要的活检，减少由于活检手术引起的并发症

(2)本发明方法充分利用了临床图像多模态信息，双模态分类网络结合了全局特征和局部特征，从而提高了模型的泛化能力和包含病变信息的临床图像的分类准确率。

附图说明

图1是本发明方法的流程框图。

图2是本发明应用在临床内窥镜肠道图像检测和分类肠道病变的结构框图。

图3是以内窥镜肠道图像为例，经步骤101-步骤103预处理后和原始图像对比的一种结果图。

图4是以内窥镜肠道图像为例，采用三种数据增强方式后的一种结果图。

图5是以内窥镜肠道图像为例，输入图经过基于检测图像中病变区域的卷积神经网络模型后的输出结果图。

图6是Resnet中残差网络的结构图。

图7是三种内窥镜肠道图像。

具体实施方式

以下结合附图对本发明的实施例作进一步详细描述。

如图1所示，是本发明的基于多模态深度学习的临床图像检测和分类方法的流程图，该方法包括以下步骤：

步骤1、对原始肠镜临床图像进行预处理，去除肠镜临床图像多余信息和噪声，并对其归一化和数据增强，得到全局图像数据集；

临床图像由医学成像系统所得，并依据病人病理分为不同类图像，例如良性和恶性等。

步骤2、将全局图像数据集输入基于检测图像中目标区域的卷积神经网络模型(RCNN)中进行训练，检测图像中的可能存在的病变区域；

步骤3、将可能病变区域用矩形框出，切割矩形框区域得到病变区域，并对切割后得到的病变区域归一化和数据增强，得到包含病变区域的局部图像数据集；

如图2所示，是本发明应用在临床内窥镜肠道图像检测和分类肠道病变的结构框图。

实施例中，在步骤1中，所述对原始图像预处理包括：

步骤102、根据图像垂直方向和水平方向的灰度投影直方图，获取图像中肠镜区域的长和宽，根据得到的长和宽截取所需要的区域，以去除多余的信息；

步骤103、使用低通滤波器，去除图像信号中的噪声。

如图3所示，是以内窥镜肠道图像为例，经过步骤101-步骤103预处理后和原始图像对比的一种结果图。

步骤104、将临床图像通过插值标准化为相同尺寸，减少计算的复杂度；

这里，依据肠镜临床图像的大小将肠镜临床图像归一化到512×512。

步骤105、将标准化后的图像归一化到0-1，便于后续检测和分类网络更快速寻找最优解；通过使用如下公式对图像归一化：

步骤106、利用三种数据增强的方式，分别是翻转，旋转，水平和垂直偏移图像，扩充现有的数据集，得到全局图像数据集。

如图4所示，是以内窥镜肠道图像为例，是采用上述实施例三种数据增强方式后的一种结果图。

实施例中，步骤2所述基于检测图像中目标区域的卷积神经网络模型包括基于Resnet网络架构的卷积神经网络、特征金字塔网络和区域生成网络；

利用非最大抑制方法生成目标区域，利用卷积神经网络模型对生成的目标区域进行回归和分类，最终判断出的病变区域；所述区域生成网络采用滑动窗口扫描整幅图像，目的是寻找图像中所有可能存在病变的区域。

步骤2具体包括：

步骤201、根据卷积神经网络和特征金字塔网络，提取图像中的多尺度特征；

步骤202、根据多尺度特征结合区域生成网络，获得图像中所有可能存在病变区域提取框；

步骤203、利用非最大抑制方法筛选步骤202生成的目标区域，结合最终的分类回归层确定可能病变区域是否为肠道病变区域。

在步骤201中，将经过步骤1处理后的图像输入到卷积神经网络和特征金字塔里训练，这里的卷积神经网络是基于Resnet网络架构，特征金字塔使用具有横向连接的自顶向下架构，从单一规模的输入构建网络功能金字塔。使用ResNet-FPN主干架构进行特征提取，可以在精度和速度方面获得极大的提升。

在步骤202中，将步骤201提取到的特征图输入到区域生成网络(RPN)，该网络用滑动窗口扫描图像，寻找可能存在病变的区域。

在步骤203中，步骤202选出的可能存在病变的区域，但如果有多个anchor互相重叠，本发明采用非最大抑制的方法保留拥有最高前景分数的候选框，并舍弃余下的。然后可得到最终的候选框，采用ROIAlign的方法将所有候选框插值到同一个大小，这些相同大小的候选框经过分类、回归和分割网络得到最终的检测结果，最终的损失函数为：

L＝L_cls+L_box+L_mask

如图5所示，是以内窥镜肠道图像为例，基于检测图像中病变区域的卷积神经网络模型的(R-CNN)的输入输出对比图。

实施例中，步骤3具体包括：

步骤301、根据步骤2检测到的可能存在的病变区域矩形框的位置，裁剪得到含有病变的区域；

这里，临床图像病变区域的大小决定图像标准化大小，依据肠道病变的统计学知识，将肠镜临床图像归一化到128×128。

步骤303、将标准化后的图像归一化到0-1，便于后续检测和分类网络更快速寻找最优解；通过使用如下公式对图像归一化：

其中，y是输出像素值，x是输入像素值，Minvalue是临床图像像素最小值，Maxvalue是临床像素最大值。

步骤304利用三种数据增强的方式，分别是翻转，旋转，水平和垂直偏移图像，扩充现有的数据集，得到包含病变区域的局部图像数据集。

实施例中，步骤4具体包括：

步骤401将全局图像数据集输入到双流卷积神经网络中的一路卷积神经网络完成卷积计算，得到全局特征图；

步骤402将包含病变区域的局部图像数据集作为另一流输入到双流卷积神经网络完成卷积运算，得到局部特征图；

步骤403连接两流输出的特征图，作为最终特征输入到全连接层，并得到最终的分类结果。

步骤404根据所述训练数据集特点微调所述多模态深度学习网络模型得到最优模型。

在步骤401中，将经过步骤1处理后得到的全局图像数据集输入到resnet50网络中，网络装载初始权重，resnet50利用残差结构提取图像特征，其中，残差网络的公式如下：

R(x)＝F(x)+x

其中，R(x)代表残差块的输入，F(x)代表左侧主路径的输出，x代表输入。

如图6所示：resnet中残差网络的结构图。

在步骤402中，将经过步骤3处理后的病变区域图像，即包含病变区域的局部图像数据集输入到双流卷积神经网络中，提取局部特征，这里的双流卷积神经网络也是基于resnet，但根据输入图像大小残差网络数目有所调整，调整到输出的特征图和步骤401的输出特征图拥有相同大小。

在步骤403中，以肠镜临床图像为例，全局图像和病变区域图像大小分别是512×512，128×128分别作为输入进行卷积计算，得到的特征图拥有相同的大小，大小分别为8×8×2048和8×8×1024，将两部分的特征图融合，融合后的特征大小为8×8×3072。

将步骤403中融合后的特征图，送到全连接层进行预测和分类临床图像病变。最终的损失函数计算公式为：

本发明所述的一种基于多模态深度学习的临床图像检测和分类的方法和系统，临床图像由医学成像系统所得，并依据病人病理分为不同类图像，例如良性和恶性等。其中，例中的内窥镜肠道图像由内窥镜系统所得，共三类图像，分别为正常类，系肉类和腺瘤类。

如图7所示，三类内窥镜肠道图像。

综述，本发明的适用于自动检测和分类临床图像病变，利用临床图像的全局信息和局部信息，本发明提供了一个完整的系统准确预测病变种类，帮助临床医生快速诊断病变类型，节省诊断时间，避免手术活检，降低病人的风险率，与此同此帮助医生更好地决策下一步治疗方案。

本说明书中的实施例采用递进的方式描述，通过上述实施例逐步详细说明了本发明的具体流程及相关实施细节。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种临床图像中病变区域的检测和分类方法，其特征在于，包括：

步骤2、将步骤1得到的全局图像数据集输入基于检测图像中目标区域的卷积神经网络模型中进行训练，检测图像中的可能存在的病变区域；

2.根据权利要求1所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述步骤1包括：

步骤102、根据图像垂直方向和水平方向的灰度投影直方图，获取图像中包含病变区域的矩形框位置、长和宽，根据得到的矩形框长和宽截取所需要的区域，以去除所需要的区域之外的多余图像部分；

步骤103、使用低通滤波器，去除图像信号中的噪声；

3.根据权利要求2所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述步骤105使用如下公式对图像归一化：

4.根据权利要求1所述的一种临床图像中病变区域的检测和分类方法，其特征在于，步骤2所述基于检测图像中目标区域的卷积神经网络模型包括基于Resnet网络架构的卷积神经网络、特征金字塔网络和区域生成网络；

5.根据权利要求4所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述步骤2包括：

步骤203、利用非最大抑制方法筛选步骤202生成的提取框，利用基于检测图像中目标区域的卷积神经网络模型对筛选后的目标区域进行回归和分类，最终判断出可能存在的病变区域。

6.根据权利要求4所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述基于检测图像中目标区域的卷积神经网络模型的损失函数为：

L＝L_cls+L_box+L_mask

7.根据权利要求1所述的一种临床图像中病变区域的检测和分类方法，其特征在于，步骤3所述切割矩形框区域得到病变区域，并对切割后得到的病变区域归一化和数据增强，包括以下步骤：

8.根据权利要求1所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述步骤4包括：

步骤401、将全局图像集输入到双流卷积神经网络中的一路卷积神经网络完成卷积计算，得到全局特征图；

步骤403、连接双流卷积神经网络两流输出的特征图，作为最终特征输入到双流卷积神经网络对应终端的全连接层，并得到最终的分类结果。

9.根据权利要求8所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述双流卷积神经网络，根据Resnet的残差网络结合数据集特点修改所得，损失函数为Softmax。

10.根据权利要求9所述的一种临床图像中病变区域的检测和分类方法，其特征在于，所述双流卷积神经网络为resnet50网络，resnet50网络中，网络装载初始权重，resnet50利用残差网络结构提取图像特征，其中，残差网络的公式如下：

R(x)＝F(x)+x

所述双流卷积神经网络的损失函数计算公式为：