CN113553991A

CN113553991A - 一种基于深度学习的舌象识别方法

Info

Publication number: CN113553991A
Application number: CN202110920926.2A
Authority: CN
Inventors: 孙逊; 章学林; 侯佳伟; 李恒峰; 周学中
Original assignee: Longhua Hospital Affiliated to Shanghai University of TCM
Current assignee: Longhua Hospital Affiliated to Shanghai University of TCM
Priority date: 2021-08-11
Filing date: 2021-08-11
Publication date: 2021-10-26

Abstract

本发明公开了一种基于深度学习的舌象识别方法，包括如下步骤：采集若干张舌象图像作为训练图像；对所有训练图像进行尺寸归一化处理和RGB三通道数据归一化处理，得到若干个训练样本；构建舌象识别卷积神经网络模型，并将获得的训练样本作为输入，对舌象识别卷积神经网络模型进行训练；拍摄待测的舌象图像，对待测的舌象图像进行尺寸归一化处理和RGB三通道数据归一化处理，得到测试样本；将测试样本输入经过训练后的舌象识别卷积神经网络模型中，进行舌象图像的自动识别。本方案通过基于深度学习的神经网络模型对舌象图像进行合格性的分析和判断，不仅提高了中医舌诊图像的质量，而且通过深入挖掘舌象的高阶特征，进一步提升了舌体识别的准确度。

Description

一种基于深度学习的舌象识别方法

技术领域

本发明涉及舌体图像识别的技术领域，特别涉及一种基于深度学习的舌象识别方法。

背景技术

中医四诊“望、闻、问、切”是中医学辩证论治的精髓，而望诊又居“四诊”之首，通过望诊就可以初步了解患者的一般状态，在中医诊断中占最重要的地位。舌诊是望诊的重要组成部分，通过观察面色以及舌头的色泽、形态的变化来辅助诊断及鉴别机体生理功能和病理变化。然而，传统的舌诊都是由人眼观察，而不是通过数字仪器记录，因此很难对舌头图像进行定量存储和处理。这一内在缺陷严重阻碍了望诊的标准化、客观化和定量化。为了解决该问题，计算机舌诊技术应运而生。

中医舌图像采集是中医舌诊客观化中最为基础和关键的部分，高质量的舌体图像的获取有助于后续详尽的舌象特征分析和高准确度的病理辅助研究。通常认为舌诊需要收集到完整的舌体图像，但是很多舌象仪没有考虑到图像的合格性判断，并没有对采集的图像进行质控，例如患者是否完全伸直了舌头，是否采集的是人脸等。

目前，常用的一些舌体检测算法是采用基于颜色空间的阈值分割法来识别舌体的。然而，这样的舌图形采集系统尚不存在通用的标准。因此，不同的采集系统，光源色温不一，显示指数不同，成像相机型号多变，成像环境有开放式、半开放式或密闭式的，这些因素都会对采集到的舌象产生不可估量的影响，进而导致其准确度较低。

发明内容

本发明要解决的技术问题是：现有的舌象识别方法对舌体图像的采集和判断合理性较差，进而导致对舌象的判断准确度较低。

本发明解决其技术问题所采用的技术方案是：

一种基于深度学习的舌象识别方法，包括如下步骤：

训练图像的采集：采集若干张舌象图像作为训练图像；

S2、获取训练样本：对所有训练图像进行尺寸归一化处理，将其处理为224*224像素，然后对训练图像的RGB三通道进行数据归一化处理，得到若干个训练样本；

S3、构建并训练舌象识别卷积神经网络模型：构建舌象识别卷积神经网络模型，并将获得的训练样本作为输入，对舌象识别卷积神经网络模型进行训练；

S4、采集舌象图像：采用舌诊仪或数码摄像头拍摄待测的舌象图像，

S5、获取测试样本：对待测的舌象图像按224*224像素进行尺寸归一化处理，然后对待测的舌象图像的RGB三通道进行数据归一化处理，得到测试样本；

S6、识别舌象图像：将测试样本输入经过训练后的舌象识别卷积神经网络模型中，进行舌象图像的自动识别。

进一步优选技术方案，所述训练图像包括三类图像，三类图像分别为舌头伸直的图像、舌头未伸直的图像以及自然非人脸的图像。

进一步优选技术方案，所述RGB三通道的数据归一化处理的具体处理公式如下：

其中，

代表调整后的RGB通道的值，

代表调整前的RGB通道的值，

代表数据的均值，

为数据的方差，数据归一化以后RGB三个通道中的数据都会处在[-1，1]区间范围之内。

进一步优选技术方案，所述构建并训练舌象识别卷积神经网络模型包括如下步骤：

S31、构建舌象识别卷积神经网络模型，所述卷积神经网络模型由17个卷积层和1个全连接层构成，具体包括：

预处理模块，所述预处理模块包括第一卷积层和一个最大池化层；所述第一卷积层的卷积核大小为7×7，步长为2；

八组卷积层模块，每组卷积层模块分别由2个卷积层构成，且卷积核大小为3×3，步长为1；

激活函数和Batch Normalization层，所述激活函数采用ReLu函数；

此外，每2层都会加入跳跃连接，即进行一次残差学习，并连接一个最大池化层；

所述最大池化层的卷积核大小为2×2，步长为2；

S32、优化舌象识别卷积神经网络模型，采用Adam优化器进行参数优化，权重衰减为1e-6，学习率为1e-4；

S33、测试舌象识别卷积神经网络模型，利用所述训练样本对舌象识别卷积神经网络模型进行准确性验证。

进一步优选技术方案，所述Adam优化器结合了AdaGrad和RMSProp两种优化算法的特点，其公式如下：

	(1)
			(2)

其中，

为迭代次数，

表示步长，

和

是衰弱速率，

代表模型的参数，

表示指数移动均值，

表示平方梯度，ϵ是一个非常小参数，防止在实际运算中除以0。

进一步优选技术方案，所述舌象识别卷积神经网络模型在Pytorch平台进行训练。

本发明的有益效果是：本方案通过基于深度学习的神经网络模型对舌象图像进行合格性的分析和判断，不仅提高了中医舌诊图像的质量，而且通过深入挖掘舌象的高阶特征，进一步提升舌体识别的准确度。

附图说明

图1是本发明中的舌象识别方法的流程图。

具体实施方式

以下结合附图。对本发明做进一步说明。

本发明为了解决舌体的识别问题，我们引入深度学习中的卷积神经网络，提出了一种基于深度学习的舌象识别方法，其整体包括训练样本的获取、舌象识别卷积神经网络模型的构建、舌象识别卷积神经网络模型的训练、获取测试样本、实现舌象图像的自动识别。

以上具体的讲包括如下步骤：

S1、训练图像的采集：利用舌诊仪或数码摄像头采集若干张舌象图像作为训练图像；其中，采集图像时需要为正常姿势下的人脸照片，其中，训练图像包括三类图像，三类图像分别为舌头伸直的图像、舌头未伸直的图像以及自然非人脸的图像；

S2、获取训练样本：对所有训练图像进行尺寸归一化处理，将其处理为224*224像素，随后对图像RGB三通道进行数据归一化处理，进而得到若干个训练样本；

其中，

代表调整后的RGB通道的值，

代表调整前的RGB通道的值，

代表数据的均值，

为数据的方差，数据归一化以后RGB三个通道中的数据都会处在[-1，1]区间范围之内。例如：数据的均值和方差可以分别归一化到如下值[0.485,0.456,0.406]，[0.229,0.224,0.225]，有利于后续网络的训练；

S3、构建并训练舌象识别卷积神经网络模型：构建舌象识别卷积神经网络模型，并将获得的训练样本作为输入，在Pytorch平台对舌象识别卷积神经网络模型进行训练；

其中，对舌象图像的RGB三通道的数据归一化处理的具体公式如下：

其中，

代表调整后的RGB通道的值，

代表调整前的RGB通道的值，

代表数据的均值，

为数据的方差，数据归一化以后RGB三个通道中的数据都会处在[-1，1]区间范围之内。例如：数据的均值和方差可以分别归一化到如下值[0.485,0.456,0.406]，[0.229,0.224,0.225]，有利于后续网络的训练。

在上述步骤S3中，构建并训练舌象识别卷积神经网络模型包括如下步骤：

激活函数和Batch Normalization层，所述激活函数采用ReLu函数；

所述最大池化层的卷积核大小为2×2，步长为2；

其中，Adam优化器结合了AdaGrad和RMSProp两种优化算法的特点，其公式如下：

	(1)
			(2)

其中，

为迭代次数，

表示步长，

和

是衰弱速率，

代表模型的参数，

表示指数移动均值，

评价指标：准确率，精准率，召回率以及 F1值，所有指标均越高，说明分类性能越高。所有指标均为越高越好，最常评判的指标是准确率，一般高性能的方法需要高于95%。

准确率（Acc）：所有的预测正确（正类负类）的占总的比重。

精确率（Pre）：正确预测为正的占全部预测为正的比例。

召回率（Recall）：正确预测为正的占全部实际为正的比例。

F1值：F1值为算数平均数除以几何平均数

其中，TP：真阳性、FP：假阳性、TN：真阴性、 FN：假阴性

训练参数：在Pytorch平台进行训练，GPU采用RTX Nvidia 2080Ti.利用Adam优化器，权重衰减为1e-6，学习率为1e-4，每个批次大小为4，共训练50次。

实验结果：实验结果如下表1所示，可以取得较高的分类准确率。

表1

以上显示和描述了本方案的基本原理和主要特征和本方案的优点。本行业的技术人员应该了解，本方案不受上述实施例的限制，上述实施例和说明书中描述的只是说明本方案的原理，在不脱离本方案精神和范围的前提下，本方案还会有各种变化和改进，这些变化和改进都落入要求保护的本方案范围内。本方案要求保护范围由所附的权利要求书及其等效物界定。