CN114581432B

CN114581432B - 一种基于深度学习的舌象仪舌象分割方法

Info

Publication number: CN114581432B
Application number: CN202210272316.0A
Authority: CN
Inventors: 田昶; 龚涛
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2022-03-18
Filing date: 2022-03-18
Publication date: 2024-02-20
Anticipated expiration: 2042-03-18
Also published as: CN114581432A

Abstract

本发明公开了一种基于深度学习的舌象仪舌象分割方法，包括：使用图像采集装置进行舌象数据采集；对采集到图像进行数据增强操作，扩大数据集数量，人为对扩大后数据集中的每个图像的舌体区域进行标注，并对标注后的数据集进行划分，划分为训练集、验证集与测试集；将训练集与验证集放入优化后的DeeplabV3+网络进行训练；利用训练好的模型对测试集进行预测，获得舌体图像的每个像素点的分类，与真实值进行对比，得到mIoU值衡量模型能力；对得到的像素点分类，进行新图创建与复制原图对应像素点操作获得分割后的舌象。

Description

一种基于深度学习的舌象仪舌象分割方法

技术领域

本发明涉及舌象仪嵌入式技术领域，具体为一种基于深度学习的舌象仪舌象分割方法。

背景技术

随着人工智能体系技术越来越成熟，深度学习的应用也不断增加，如今深度学习在医学等领域已有应用，申请号为202010034495.5，发明名称为基于U-net模型的舌体自动分割方法的专利申请提出了将其运用在舌像分割当中，但在应用时，其采用传统的网络框架，没有关注舌体的边缘信息，最终得到的图片中舌体形成锯齿或图像缺失，锯齿会使得舌体是否有齿痕以及形状是否正常变得难以判断，图像缺失会使得舌体是否有黑点，颜色是否正常变得难以确定，这些都将导致中医或人工智能在舌诊时容易误诊，因此让网络架构自适应的学习舌体边缘的特点，保证舌体图像提取的完整性、准确性是十分重要的。

发明内容

为解决背景技术中的问题，本发明提出一种基于深度学习的改良后的舌像分割方法，使用图像增强的数据处理方法，并结合优化的深度学习网络进行训练，能更加精准高效地辨别舌体边缘，减少误分割，能大大提高舌象仪分析的准确性，带来患者便利与中医技术推广的双向发展。

本发明采取如下的技术方案：

基于深度学习的舌象仪舌像分割方法，包括如下步骤：

步骤1：使用图像采集装置进行舌象数据采集；

步骤2：对步骤1采集到的图像进行数据增强操作，扩大数据集数量，人为对扩大后数据集中的每个图像的舌体区域进行标注，并对标注后的数据集进行划分，划分为训练集、验证集与测试集；

步骤3：将步骤2中的训练集与验证集放入优化后的DeeplabV3+网络进行训练；

步骤4：利用步骤3中训练好的模型对步骤2中测试集进行预测，获得舌体图像的每个像素点的分类，与真实值进行对比，得到mIoU值衡量模型能力；

步骤5：对步骤4得到的像素点分类，进行新图创建与复制原图对应像素点，获得分割后的舌象。

注意力模型最初被用于机器翻译，现在已成为神经网络领域的一个重要概念。在人工智能领域，注意力已成为神经网络结构的重要组成部分，并在自然语言处理、统计学习、语音和计算机等领域有着大量的应用。注意力模型通过允许模型动态地关注有助于执行手头任务的输入的某些部分，选取合适的注意力机制，并将其添加在恰到好处的地方，可以让网络架构强化对舌体特征的把握，划分出平滑无锯齿无黑点的完整舌体。

进一步的，所述步骤1具体包括：采用分辨率为1920×1080的相机进行图像拍摄采集，采集范围为鼻梁中间以下，下颚以上。

进一步的，所述步骤2具体包括：对采集到的图像以一定概率随机进行-15度到+15度的随机图像旋转，图片镜像翻转，图片放大缩小，以此方法将数据集图像数量扩大至原集合四倍，将数据集按照81：9：1的比例划分为训练集、验证集与测试集。

进一步的，所述步骤3具体包括：在两个特征层的融合处加入CBAM空间通道注意力机制，不改变融合时的宽高和通道数，改进了DeeplabV3+网络，然后将训练集尺寸设为512×512，程序自动放缩图片，并在空余部位填充像素默认值，输入改进的DeeplabV3+网络进行模型训练，使用BCE-Dice损失函数评估模型效果，得到训练好的模型。

进一步的，所述步骤4具体包括：输入测试集中的图像进入训练好的模型，模型读取图像后对读取图像进行自适应尺寸标准化处理，然后进行像素点分类，获得预测的像素点分类矩阵，mIoU评测函数读取文件路径中的真实值进行误差计算。

进一步的，所述步骤5具体包括：创建一幅新图像，获取分类为舌体的像素点的位置，获取对应位置的RGB值，复制到新图像的对应位置，得到只有舌体的分割图像。

本发明的有益效果在于：

本发明所述检测方法能划分出平滑无锯齿、无黑点的完整舌体，为后续的舌象诊断提供了保障。

附图说明

图1为本方法流程图；

图2为采集所得部分图片截图；

图3为labelme软件中标注的图片；

图4为添加空间通道注意力后的DeeplabV3+网络结构示意图；

图5为预测分类值和真实分类值的可视化结果；

图6为基于mIoU方法评判的正确率；

图7为舌象原图像与本发明算法处理后的图像对比，其中7a为舌象原图像，7b为经本发明算法处理后的图像。

具体实施方式

下面结合说明书附图和实施例，对本发明作进一步详细说明。

如图1所示，一种基于深度学习的舌象仪舌像分割方法,包括以下步骤：

步骤1：使用图像采集装置进行舌象数据采集，具体为：

在自然光照下，采用分辨率为1920×1080的相机进行图像拍摄采集，拍摄角度与被拍摄者持平或呈斜15度俯视。拍摄范围大致为鼻梁中间点的水平面到下颚端面。同时拍摄时有意适当调整角度和拍摄图片比例以提高网络的适用性，采集所得照片如图2所示。

步骤2：对步骤1采集到的图像以0.85的概率随机进行-15度到+15度的随机图像旋转，以0.5的概率随机进行图片镜像翻转，以0.8的概率随机进行图片放大缩小，范围为0.85-1.25倍，以此方法将数据集图像数量扩大至原集合四倍(3600张数据集)，将数据集按照81：9：1的比例划分为训练集、验证集与测试集，这样可以提升模型泛化性能，防止过早出现过拟合。标注采用label软件，标注区域应保留舌体且剔除牙齿和唇部，如图3所示。

步骤3：将步骤2中的训练集与验证集放入优化后的DeeplabV3+网络进行训练，具体为：

如图4所示为优化后的DeeplabV3+网络结构示意图，将训练集尺寸设为512×512像素，输入DeeplabV3+网络进行训练，优化后的DeeplabV3+采用Xception作为主干网络，其特点是每一个block由深度可分离卷积构成，使网络的可训练性提高，然后得到的浅层特征层通过ASPP模块得到感受野各不相同的特征层，本发明在得到不同特征层进行特征融合后，融合特征层加入空间通道注意力机制，即CBAM Block，让其网络学习到更多对于每个层来说的关注点，这样在特征融合时，可以得到更多的边缘信息。最后在与浅层特征融合时再次调用空间通道注意力机制，使融合的可训练性提高。

本发明选用BCE-Dice损失函数评估模型效果，在BCE损失的基础上加入Dice损失，可以更好的分析预测图像与真值图像的像素差异，训练出更好的权重，能让模型更优秀地进行预测。

模型共训练100轮次，前50轮次为迁移训练，即冻结主干网络训练，后50轮次为非冻结训练，模型约在90轮次收敛完毕。

步骤4：利用步骤3中训练好的模型对步骤2中测试集进行预测，获得舌体图像的每个像素点的分类，与真实值进行对比，可视化结果如图5，计算得到mIoU(平均交并比，用来衡量预测区域和真实区域之间的差距)值衡量模型能力，具体为：

导入测试集中的图像进入步骤3中训练好的模型，上述模型读取输入的图像后，对图像进行自适应尺寸处理，使舌象图片能适应网络输入，然后进行像素点预测，并与路径下的真值图进行对比，计算mIoU值，得到mIoU指标良好，如图6。

步骤5：对步骤4得到的像素点分类，进行新图创建与复制原图对应像素点获得分割后的舌象，具体为：

步骤4得到的像素点分类存储在三维矩阵中，矩阵的二维为是图像的平面大小，第三维是分类数，将原图像也转化为矩阵，在第三维的舌象层，被识别为舌体的对应像素位置的值为1，与原图像矩阵进行相乘操作，得到新的RGB三维矩阵，再转换为图片，得到分割图如图7，结果在显示器上显示出来。

应当理解的是，本发明书未详细阐述的部分均属于现有技术。

以上结合附图所示，仅为本发明的具体实施方法及流程，但本发明的保护范围并不局限于此，任何熟悉本领域的技术人员应当理解，此仅为举例说明，可以对此实施方法做出多种变化和替代，而不背离本发明的实质内容。本发明的范围仅有所附权利要求书限定。

Claims

1.一种基于深度学习的舌象仪舌像分割方法，其特征在于，包括如下步骤：

步骤1：使用图像采集装置进行舌象数据采集；

2.根据权利要求1所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，采用分辨率为1920×1080的相机进行图像拍摄采集，采集范围为鼻梁中间以下，下颚以上。

3.根据权利要求1所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，对步骤1采集到的图像以一定概率随机进行-15度到+15度的随机图像旋转，图片镜像翻转，图片放大缩小，以此方法将数据集图像数量扩大至原集合四倍，将数据集按照81：9：1的比例划分为训练集、验证集与测试集。

4.根据权利要求1所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，步骤3所述优化后的DeeplabV3+网络是在DeeplabV3+网络的两个特征层的融合处加入CBAM空间通道注意力机制，不改变融合时的宽高和通道数。

5.根据权利要求4所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，步骤3具体为：将训练集尺寸设为512×512，程序自动放缩图片，并在空余部位填充像素默认值，输入改进的DeeplabV3+网络进行模型训练，使用BCE-Dice损失函数评估模型效果，得到训练好的模型。

6.根据权利要求1所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，步骤4具体为：输入测试集中的图像进入训练好的模型，模型读取图像后对读取图像进行自适应尺寸标准化处理，然后进行像素点分类，获得预测的像素点分类矩阵，mIoU评测函数读取文件路径中的真实值进行误差计算。

7.根据权利要求1所述的一种基于深度学习的舌象仪舌像分割方法，其特征在于，步骤5具体为：创建一幅新图像，获取分类为舌体的像素点的位置，获取对应位置的RGB值，复制到新图像的对应位置，得到只有舌体的分割图像。