CN113221945A

CN113221945A - 基于口腔全景片和双重注意力模块的龋齿识别方法

Info

Publication number: CN113221945A
Application number: CN202110360203.1A
Authority: CN
Inventors: 曹政; 叶冠琛; 朱海华; 吴健; 朱赴东; 陈谦明
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2021-08-06
Anticipated expiration: 2041-04-02
Also published as: CN113221945B

Abstract

本发明提供一种基于口腔全景片和双重注意力模块的龋齿识别方法，使用深度学习技术对口腔全景片中的龋齿区域同时进行边缘分割和相应的病变程度识别方法。深度学习技术包括了基于图像空间域和通道域的双重注意力模块，以及基于该双重注意力模块建立的分割和分类网络。本龋齿识别系统由三个模块组成：数据预处理模块、双重注意力分割网络模块和双重注意力分类网络模块。本方法在深度学习过程中对图像区域的注意力进行分层采样和计算，将分割网络和分类网络串联起来，实现了端到端的一站式龋齿区域的定位以及病变程度的识别。通过实现口腔全景片中龋齿区域的自动分割以及对应龋齿病变的结果导出，对于口腔健康的维护具有重要的临床和社会意义。

Description

基于口腔全景片和双重注意力模块的龋齿识别方法

技术领域

本发明属于医疗辅助领域，涉及基于口腔全景片和双重注意力模块的龋齿识别方法，主要是利用基于双重注意力分割网络模块和分类网络模块的深度学习模型实现口腔全景片中的龋齿病变程度的识别。

背景技术

龋齿是一种由口腔中多种因素复合作用所导致的牙齿硬组织进行性病损，是口腔主要的常见病，也是人类最普遍的疾病之一。临床上可见龋齿有色、形、质的变化，而以质变为主，色、形变化是质变的结果，随着病程的发展，病变由釉质进入牙本质，组织不断被破坏、崩解而逐渐形成龋洞，临床上常根据龋坏程度分为浅、中、深龋三个阶段。由于目前大众对口腔健康的需求日益增长，越来越多人到医院或诊所进行口腔方面的咨询或治疗。而由于病患多，诊疗时间有限，有时医生不得已只能优先关注有症状的牙齿，而忽略了其他潜在的程度较轻的龋齿，龋病的进一步发展，提高了治疗难度和治疗费用。全景片是口腔临床上最常见的辅助检查手段，全景片包括了口内所有牙齿，且费用低，辐射量小。随着现代医疗水平的提高，如何利用电子信息技术实现基于口腔全景片的龋齿病变程度自动化检测成为一个热门的研究课题。

作为人工智能的重要组成部分，深度学习技术在医疗辅助诊断领域取得了很好的效果。与传统的方法相比，深度学习通过使用更多的数据量学习特征，能取得更好的泛化性能。深度学习中的深度神经网络可以在网络中自动提取特征，而不需要人为的特征选择，提取过的特征又可以根据网络的全连接层进行分类，从而使得特征提取和分类结合在了一起，获得比传统方法更出色的结果。

然而现有的深度学习方法直接输入口腔全景图进行龋齿辅助识别，卷积神经网络在特征的提取过程中通常会丢失大部分全局信息，深度学习模型所聚焦的区域也非常分散，在龋齿识别任务中表现不佳。因此，开发一种改进的深度学习算法准确进行龋齿的识别是本领域亟需解决的问题。

发明内容

本发明的目的是在已有的使用深度学习方法对龋齿进行识别的基础上，提出了一种分割再分类的两阶段识别方法，以及对应的双重注意力模块，使得深度学习模型可以聚焦在判断牙齿的患龋区域提取特征。在保证运行速度，泛化性的同时，提高了识别方法的性能。

本发明使用口腔全景片作为数据输入，设计了双重注意力模块，提取图像的通道域和空间域特征，并加以融合进深度学习模型中，使得模型能够学习到特定区域的丰富特征。基于双重注意力模块，设计了双重注意力分割网络和双重注意力分类网络。口腔全景片首先经过分割网络提取出龋齿区域，裁剪为图像块；再使用分割出的图像块输入至分类网络，判断该龋齿区域病变程度的分类情况。该龋齿识别方法由三个模块组成：数据预处理模块、双重注意力分割网络模块，和双重注意力分类网络模块。

为实现上述目的，本发明提供以下技术步骤：

1.数据预处理：利用资料库中的口腔全景片进行数据标注及标准化预处理，准备训练集；

具体包括：

(1)从放射检查中得到图像清晰的口腔全景片，调节亮度与对比度至可以区分骨骼间隙；

(2)放缩并裁减原始图像，得到一幅1920*1080像素尺寸的图片作为数据输入。

2.分割龋齿区域：通过双重注意力分割网络模块，分割口腔全景片图像中所有的龋齿区域，分离口腔背景区域和目标区域，提取对应的图像块；

具体包括：

(1)计算双重注意力模块，包括并行计算空间域的注意力和通道域的注意力信息；

(2)将计算出的空间域和通道域的注意力信息进行叠加操作；

(3)构建物体分割模型，包含五层的下采样和五层的上采样操作；

(4)在五层的下采样之后分别计算其双重注意力模块信息，并与下采样结果叠加；

(5)在五层的上采样之后输出口腔全景片每一个龋齿区域的图像块。

3.实现龋齿病变程度分类：使用双重注意力分类网络计算对应图像块龋齿病变程度的分类情况。

具体包括：

(1)得到分割网络输出产生的图像块，轮流作为网络的输入；

(3)计算双重注意力模块，包括并行计算空间域的注意力和通道域的注意力信息；

(3)将计算出的空间域和通道域的注意力信息进行叠加操作；

(4)构建残差连接分类网络，包含五层的残差连接块；

(5)在每一层残差连接块后计算其双重注意力模块信息，并与残差连接块的计算结果叠加，输入至下一残差连接块；

(6)输出对应图像块龋齿病变程度的分类结果。

其中注意力计算模块以分割网络产生的特征图作为输入，通过特征图分类网络后，会得到一个3个类别的概率向量，它与特征图所对应的原图的标签通过损失函数可以得到一个损失值，这个损失值作为总损失值的一部分。原始图像分类网络模块以原始图像作为输入，通过原始图像分类网络后，会得到一个3个类别的概率向量，它与原始图像的标签通过损失函数可以得到一个损失值，这个损失值作为同样总损失值的一部分。

步骤4的分类网络模块通过提取分割网络模块和注意力计算模块的中间层特征，作为模块的输入数据，通过卷积神经网络的作用，得到输入数据的注意力权值，然后对两个输入数据分别施以不同的注意力得到注意力特征图，最后把两个注意力特征图融合起来得到新的特征图，再对新生成的特征图进行简单的分类，得到最终预测结果。

本发明的优点：(1)与以往的简单使用深度学习来进行龋齿识别不同，本发明使用了分割+分类的两阶段识别方法，先对可以判断为龋齿的区域分割为图像块，再使用分类网络进行识别，极大提升了识别的准确率。(2)针对深度学习中信息丢失的问题，提出了双重注意力机制，同时提取通道域和空间域的注意力信息，并融合进分割和分类网络中，进一步提高了本发明的整体性能。(3)本发明使用过程中不需要人工参与，属于全自动的龋齿识别方法。

附图说明

图1为整体工作流程图。

图2为双重注意力模块图。

图3为双重注意力分割网络图。

图4为双重注意力分类网络图。

具体实施方式

下面将结合附图和实施例，具体说明本发明基于口腔全景片和双重注意力模块的龋齿识别方法的过程。

我们将龋齿识别方法拆解为三个相互关联的模块，最终实现基于双重注意力模块的龋齿识别。

实施例1

参见图1，展示了龋齿深度识别方法的流程图：首先，读取原始口腔全景片图像，经过数据预处理模块，将图像缩放并裁减到1920*1080的尺寸，输入到双重注意力分割网络中。再将分割网络模块输出的龋齿区域进行裁剪，得到对应的图像块。最后将分割网络模块输出图像块输入到双重注意力分类网络模块中，获取最终的龋齿深度识别结果。

结合图2-4分别说明本发明中各个模块的工作方法。

图2介绍了双重注意力模块，该模块能够尽可能的捕获全局上下文信息，从而对特征全局的情况进行判断，获得在全局层面上模型应该关注的区域。假设原始特征图形状为H×W×C，对于通道域分支，最大池化与平均池化所提取的特征拼接后得到一个长度为2C的特征，利用全连接层，将其重新映射到长度为C，之后再将其扩张为原特征图形状。对于空间域分支，最大池化与平均池化所提取的特征拼接后得到形状为H×W×2的特征图，利用卷积大小为1×1的卷积层，将其重新映射H×W×1大小，之后再将其扩张为原特征图形状。将通道域与空间域扩张后的特征图进行连接，拼接后特征图大小为H×W×2C。由于需将其转化为与输入形状相同的特征，因此通过卷积和sigmoid操作，卷积使其形状形状为H×W×C，sigmoid做平滑处理，最终得到注意力特征图。由于模块输入输出的尺寸相同，因此该模块可以嵌入至普通深度学习模型中以提升性能。

图3展示了双重注意力分割网络模块。首先，基于普通U-Net网络，在其中每层的基本模块中加入了双重注意力模块。网络主要由特征提取的五层下采样部分以及解析并上采样的解码部分组成，编码器模块由四个双重注意力模块组成，每个双重注意力模块中包含了两组卷积、批标准化层以及ReLU激活函数，再经过双重注意力模块的调整，与短路连接之前的特征进行求和。每个双重注意力模块后都接着一个最大池化，以实现对特征的下采样。图片进入网络后首先也会经过一个残差模块，得到通道数为64的特征，之后四个双重注意力模块输出的特征图通道数依次为：128，256，512，1024。解码器模块与编码器模块基本一致，先通过上采样，将特征采样至与编码器相应层数的特征大小，之后通过特征拼接，融合不同网络层级的多尺度上下文信息，再经过双重注意力模块，得到解码子模块的中间结果。

图4中介绍了双重注意力分类网络模块，基于ResNet-18建立了了双重注意力分类网络。该网络具有18层卷积结构，除去网络第一层和最后一层均为残差连接的卷积模块。双重注意力分类网络在每一层残差块后插入了双重注意力模块，利用双重注意力模块对输入的特征图进行全局的调整，之后再将经过双重注意力模块调整后的特征图与短路连接后的特征图进行求和。该类型的网络可以更好的学习到全局图像特征，拥有更好的分类性能。

Claims

1.一种基于口腔全景片和双重注意力模块的龋齿识别方法，其特征在于，通过以下步骤实现：

(1)数据预处理：利用资料库中的口腔全景片进行数据标注及标准化预处理，准备训练集；

(2)分割龋齿区域：通过双重注意力分割网络模块，分割口腔全景片图像中所有的龋齿区域，分离口腔背景区域和目标区域，提取对应的图像块；

(3)实现龋齿病变程度分类：通过双重注意力分类网络模块计算对应图像块龋齿病变程度的分类情况。

2.根据权利要求1所述的识别方法，其特征在于，所述步骤(1)具体包括：

(1)从放射检查中得到图像清晰的口腔全景片，调节亮度与对比度；

3.根据权利要求1所述的识别方法，其特征在于，所述步骤(2)具体包括：

(1)计算双重注意力模块信息，包括并行计算空间域的注意力和通道域的注意力信息；

(2)将计算出的空间域和通道域的注意力信息进行叠加操作；

4.根据权利要求1所述的方法，其特征在于，所述步骤(3)具体包括：

(1)得到分割网络输出产生的图像块，轮流作为网络的输入；

(2)计算双重注意力模块信息，包括并行计算空间域的注意力和通道域的注意力信息；

(3)将计算出的空间域和通道域的注意力信息进行叠加操作；

(4)构建残差连接分类网络，包含五层的残差连接块；

(6)输出对应图像块龋齿病变程度的分类结果。