CN110826629A

CN110826629A - 一种基于细粒度分类的耳镜图像辅助诊断方法

Info

Publication number: CN110826629A
Application number: CN201911085774.8A
Authority: CN
Inventors: 李远清; 肖立超; 余晋刚
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-11-08
Filing date: 2019-11-08
Publication date: 2020-02-21

Abstract

本发明公开了一种基于细粒度分类的耳镜图像辅助诊断方法，所述辅助诊断方法如下：输入图像，使用全局分类器，获得全局分类结果，以及显示主体区域的显著性图；使用显著性图，通过局部选择器，选择k张病灶所在的局部图像，并将其输入局部分类器，获得每张局部图像对应的分类结果，求平均后即为局部分类结果；将两个分类结果平均，即得到对该图像的最终诊断结果；本发明仅要求训练集中的图像有类别标签的标注，不要求有定位信息的标注，相比强监督的细粒度分类方法简化了数据收集与标注过程；本发明同时融合了全局信息与局部信息，能够处理更细粒度的特征，相对直接使用通用卷积神经网络而言，对耳镜图像有更好的分类性能。

Description

一种基于细粒度分类的耳镜图像辅助诊断方法

技术领域

本发明属于计算机视觉及医学图像辅助诊断技术领域，以融合不同尺度的信息为出发点，具体涉及一种基于细粒度分类的耳镜图像辅助诊断方法。

背景技术

细粒度图像分类的目标为区分一个基本类别下的众多子类，在现有的实践中，包括区分不同种类的鸟，不同型号的汽车、飞机等。为了能够区分外观相近的子类，其关键在于找到具有判别力的局部信息。传统方法上一般需要使用人工标注的特征点辅助寻找这些定位信息，例如人工对鸟类头部、翅膀以及尾部标注出关键点，对数据标注人员的要求较高。已有的公知方法中，也有致力于在弱监督条件下能够寻找出具有关键信息的局部图像的方法，如《两级注意模型在深度卷积神经网络细粒度图像分类中的应用》提出的两级注意力方法，此方法可以在预训练模型的帮助下筛选输入图像的主体部分，并提取出多个关键部位，在聚类后分别输入到深度卷积神经网络中提取特征，拼接后使用支持向量机获得局部分类结果，最后将局部分类结果与使用整张图片获得的全局结果融合，可以提高分类性能。此公知方法的优点在于框架简单而有效，但要求有一个包含目标数据集的预训练模型，大幅度限制了它的使用范围。如果应用的目标领域不在ImageNet的1000种类别之中，将无法筛选输入图像的主体部分。

基于医学图像的辅助诊断与细粒度分类的现有实践相似，都要求根据细微的局部差别区分不同的疾病子类，例如使用耳镜图像区分慢性化脓性中耳炎的活动期与静止期。在使用耳镜图像辅助诊断的现有公知方法中，也使用了关键点定位技术，如迈伯勒的《发展中国家中耳炎的鼓膜影像诊断分析》，首先使用人工提取的特征方法定位到锤骨以及鼓膜上，使用人工定义的测量方法获得每个部位的特征数据，再使用决策树分类获得诊断结果，但人工选择的特征由于不一定是最适合分类的，存在性能和鲁棒性的问题。因此在医学图像辅助诊断中也引入了深度学习方法，是用深度卷积神经网络在训练集上仅提供类别标签，训练后的模型在测试集上即有良好的性能，免去了人工调整与设计的局限性，但在特征提取及分类方面，现有的公知方法并没有实现弱监督地利用局部信息，即在仅提供类别标签的情况下，自动识别关键部位，提取局部特征，以提高分类的准确率。

为了在仅提供类别标签的情况下，自动识别关键部位，提取局部信息与全局信息融合，提高分类的准确率为此我们提出一种基于细粒度分类的耳镜图像辅助诊断方法。

发明内容

本发明的目的在于提供一种基于细粒度分类的耳镜图像辅助诊断方法，在仅提供类别标签的情况下，自动识别关键部位，提取局部信息与全局信息融合，提高分类的准确率。

为实现上述目的，本发明提供如下技术方案：一种基于细粒度分类的耳镜图像辅助诊断方法，所述辅助诊断方法如下：

步骤一：输入图像，使用全局分类器，获得全局分类结果，以及显示主体区域的显著性图；

步骤二：使用显著性图，通过局部选择器，选择k张病灶所在的局部图像，并将其输入局部分类器，获得每张局部图像对应的分类结果，求平均后即为局部分类结果；

步骤三：将两个分类结果平均，即得到对该图像的最终诊断结果。

作为本发明的一种优选的技术方案，所述全局分类器为使用训练集的整张图像与对应的类别标签训练所得的卷积神经网络。

作为本发明的一种优选的技术方案，所述显著性图由全局分类器产生，可以显示区域对分类结果的贡献程度，产生方法为在神经网络中分别对每个类别出输节点到输入求偏导，取绝对值后求和，再归一化。

作为本发明的一种优选的技术方案，所述局部选择器使用区域提取算法为输入的全局图像提取众多候选的局部图像，并根据显著性图为每个局部图像打分，最后返回分数最高的k张局部图像。

作为本发明的一种优选的技术方案，所述局部分类器为使用训练集中图像提取的局部图像与原全局图像的类别标签训练所得的卷积神经网络。

作为本发明的一种优选的技术方案，图像提取时使用双线性插值算法对图片进行缩放，利用卷积核对图像进行卷积处理，确定处理后图像各特征图大小。

作为本发明的一种优选的技术方案，在训练时对输入图像进行数据增强操作，包括：平移、缩放、旋转、左右翻转以及左右拉伸。

与现有技术相比，本发明的有益效果是：

(1)本发明仅要求训练集中的图像有类别标签的标注，不要求有定位信息的标注，如关键位置的边界框，关键点，蒙版，相比强监督的细粒度分类方法简化了数据收集与标注过程；

(2)本发明同时融合了全局信息与局部信息，能够处理更细粒度的特征，相对直接使用通用卷积神经网络而言，对耳镜图像有更好的分类性能；

(3)本发明图像提取时使用双线性插值算法对图片进行缩放，利用卷积核对图像进行卷积处理，确定处理后图像各特征图大小，提高了图像特征提取的准确度。

附图说明

图1为本发明的细粒度分类方法流程图；

图2为本发明的实施例中局部选择器的流程与效果图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1和图2，本发明提供一种技术方案：一种基于细粒度分类的耳镜图像辅助诊断方法，辅助诊断方法如下：

本实施例中，优选的，全局分类器为使用训练集的整张图像与对应的类别标签训练所得的卷积神经网络。

本实施例中，优选的，显著性图由全局分类器产生，可以显示区域对分类结果的贡献程度，产生方法为在神经网络中分别对每个类别出输节点到输入求偏导，取绝对值后求和，再归一化。

本实施例中，优选的，局部选择器使用区域提取算法为输入的全局图像提取众多候选的局部图像，并根据显著性图为每个局部图像打分，最后返回分数最高的k张局部图像。

本实施例中，优选的，局部分类器为使用训练集中图像提取的局部图像与原全局图像的类别标签训练所得的卷积神经网络。

本实施例中，优选的，图像提取时使用双线性插值算法对图片进行缩放，利用卷积核对图像进行卷积处理，确定处理后图像各特征图大小。

本实施例中，优选的，在训练时对输入图像进行数据增强操作，包括：平移、缩放、旋转、左右翻转以及左右拉伸。

全局分类器可以使用深度卷积神经网络实现，包括通用的InceptionV3、ResNet-50以及MobileNet-V2，值得注意的是，可以使用其他任意深度卷积神经网络结构。具体地，在本发明实施例中，InceptionV3、ResNet-50由于在ImageNet数据集上预训练的模型支持任意分辨率，因此将输入图像在保持宽高比的情况下缩放使最长边为600像素；在使用MobileNet-V2时，最长边则为224像素；预训练模型在训练集上使用样本图像及样本图像的类别标签微调后，即可用作全局分类器。

局部选择器实现弱监督定位功能，其接收来自全局分类器的显著性图，通过区域提取与区域打分，选择出具有高判别力的局部图像，其执行步骤如说明书附图图2所示。在本实施例中，显著性图基于Simonyan K.提出的显著图实现，其原理为对神经网络最后的柔性最大值传输函数层对应某个类别的节点，求其相对输入图像的梯度的绝对值，即为该类别的显著图，其物理意义为衡量输入图像每个像素对输出分数的贡献，因此具有很强的定位能力。由于在耳镜图像中，病灶都位于鼓膜区域内，而且在测试阶段输入图像的类别是未知的，因此在本实施例中，对所有类别节点求显著图，相加后归一化，即为弱监督定位所用的显著性图。区域选择的目的是在输入图像中产生候选区域，为了简化起见，本实施例使用了一系列的滑动窗口，即边长分别为400，299以及99像素的正方形，以20像素的步长，在原图像上滑动，产生一系列的候选区域。区域打分即为对每一个候选区域打分，具体为候选区域在显著性图对应区域上的平均强度。通过这一系列操作，即可选择出与主体相关的k个局部图像。本实施例对于每张输入图像，在每个尺度上选择2个分数最高的局部图像，一共选择6个局部图像。

本实施例的局部分类器可以使用深度卷积神经网络实现，处理局部选择器获得的局部图像。在训练时，对训练集的所有样本图像，使用全局分类器提取显著性图后，经过局部选择器选择得到对应的局部图像；局部图像的标签即为对应的样本图像的标签。具体地，在本发明实施例中，InceptionV3作为局部分类器时，输入图像被缩放至299×299像素，而对于ResNet-50与MobileNet-V2，则使用224×224的输入分辨率。

在本实施例中，训练网络时对输入图像进行数据增强操作，包括：平移、缩放、旋转、左右翻转以及左右拉伸。其具体参数为最大值为图像宽度0.1倍的随机平移及左右拉伸、由0.9到1.1倍的随机缩放，在0度到30度之间的随机旋转，以及50％几率的左右翻转，确保每个训练批次中输入的都是网络从未见过的训练样本。

为了进一步说明本发明提出的细粒度分类方法的优点，最后将在真实数据集上应用本发明所提出的方法，并与通用深度卷积神经网络对比。真实数据集包含了6065张大小从500×500像素到700×700像素之间的耳镜图像。其中1040张图像属于正常鼓膜，2613张图像属于分泌性中耳炎，1661张图像属于慢性化脓性中耳炎静止期，751张图像属于慢性化脓性中耳炎活动期。实验使用五折交叉验证，在切分数据集时确保同一个病例的不同图片不会同时出现在训练集与测试集中。实验使用准确率作为评价指标，即测试集中分类正确的图像数，占测试集图像总数的比例，获得的结果如表1所示。相对于直接使用通用深度卷积神经网络，本发明所提出的方法在使用各种网络结构时都能够有效提升分类的准确率。

表1使用不同网络结构的性能对比

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：所述辅助诊断方法如下：

2.根据权利要求1所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：所述全局分类器为使用训练集的整张图像与对应的类别标签训练所得的卷积神经网络。

3.根据权利要求1所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：所述显著性图由全局分类器产生，可以显示区域对分类结果的贡献程度，产生方法为在神经网络中分别对每个类别出输节点到输入求偏导，取绝对值后求和，再归一化。

4.根据权利要求1所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：所述局部选择器使用区域提取算法为输入的全局图像提取众多候选的局部图像，并根据显著性图为每个局部图像打分，最后返回分数最高的k张局部图像。

5.根据权利要求1所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：所述局部分类器为使用训练集中图像提取的局部图像与原全局图像的类别标签训练所得的卷积神经网络。

6.根据权利要求4或5所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：图像提取时使用双线性插值算法对图片进行缩放，利用卷积核对图像进行卷积处理，确定处理后图像各特征图大小。

7.根据权利要求1-6任一项所述的一种基于细粒度分类的耳镜图像辅助诊断方法，其特征在于：在训练时对输入图像进行数据增强操作，包括：平移、缩放、旋转、左右翻转以及左右拉伸。