CN113780250A

CN113780250A - 一种针对小样本的端到端面部腧穴定位方法及电子设备

Info

Publication number: CN113780250A
Application number: CN202111329541.5A
Authority: CN
Inventors: 张婷婷; 杨红雨; 陈虎
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-11-11
Filing date: 2021-11-11
Publication date: 2021-12-10
Anticipated expiration: 2041-11-11
Also published as: CN113780250B

Abstract

本发明涉及中医腧穴和机器视觉技术交叉领域，特别是一种针对小样本的端到端面部腧穴定位方法及电子设备。本发明所述方法构建了面部腧穴智能定位任务数据集用于端到端面部腧穴定位研究。利用神经网络的非线性建模能力，深度挖掘面部抽象特征，极大地提高了面部腧穴定位准确度。同时，本发明提出了两阶段模型训练策略，可实现通过少量面部腧穴样本数据训练即可达到良好的面部腧穴定位效果，能够有效降低基于神经网络模型的面部腧穴定位方法对标注数据的依赖。此外，本发明融合了机器学习的注意力机制，促使深度神经网络模型关注目标的细节信息，抑制无用信息，进一步提高了本发明所述方法的面部腧穴定位精度。

Description

一种针对小样本的端到端面部腧穴定位方法及电子设备

技术领域

本发明涉及中医腧穴和机器视觉技术交叉领域，特别是一种针对小样本的端到端面部腧穴定位方法及电子设备。

背景技术

目前，中医针灸疗法已在全球超过183个国家获得广泛应用和认可。由于每个人形体上存在高矮胖瘦的差异，导致针灸疗法对从业医师的临床经验要求很高，具体表现之一是对腧穴定位的准确程度。腧穴，又称穴位，是人体脏腑经络之气输注于体表的部位，是针灸治疗疾病的刺激点与反应点。虽然中医经络腧穴学具有完整的理论体系，但仍存在人工取穴主观性强、难以标准化和传承困难等问题。本发明主要针对面部腧穴定位进行研究和探索，为中医穴位相关的智能化治疗奠定技术基础。

临床上常用的腧穴定位法有三种：体表解剖标志定位法、骨度折量定位法及指寸定位法。其中，面部大部分腧穴（鱼腰、印堂、下关等）通过体表解剖标志定位法更为精准，少部分腧穴（夹承浆、瞳子髎等）通过骨度折量定位法较为准确。面部腧穴智能定位指的是通过自动人脸检测并分析面部五官轮廓特征，定位出面部腧穴。随着人工智能技术的快速发展，当前腧穴智能定位方法主要分为：基于双目视觉和编码结构光相结合的人脸腧穴定位方法、基于人脸关键点算法的腧穴定位方法和基于卷积神经网络的端到端腧穴定位方法等。

目前较为流行的是基于人脸关键点算法的面部腧穴定位方法，该方法通过面部特征点定位技术对人脸进行检测并获取人脸关键点（左右嘴角、鼻尖中心、眉毛左角、眉毛中心、眉毛右角、下巴最低点等）坐标，然后结合中医取穴手法中的骨度折量定位法，利用眉心和发际点的距离计算人脸的同身寸长度，最终基于人脸关键点位置和同身寸长度计算面部腧穴坐标。这种方法基于人脸关键点检测结果做计算，而非直接定位面部腧穴坐标。一方面，人脸关键点检测结果存在误差，导致基于人脸关键点计算的腧穴坐标产生累计误差。另一方面，从临床经验分析，大部分面部腧穴定位采用体表解剖标志定位法的结果相比骨度折量定位法更为精准。比如承浆穴位于颏唇沟的正中凹陷处，如通过骨度折量定位法计算口唇下方0.5同身寸未必刚好是颏唇沟正中凹陷处。

因此，为了提高中医面部腧穴定位精度，同时考虑到面部腧穴标注非常依赖专家经验和人工成本高的问题，本发明提出了一种针对小样本的端到端面部腧穴定位方法及电子设备。

发明内容

本发明目的在于克服现有技术中存在的面部腧穴定位精度不足以及面部腧穴数据人工标注强依赖专家知识且成本高昂的问题，提供一种针对小样本的端到端面部腧穴定位方法及电子设备。

为了实现上述发明目的，本发明提供了以下技术方案：

一种针对小样本的端到端面部腧穴定位方法，包括以下步骤：

给定一张人脸图片，将图片输入已训练的端到端面部腧穴定位模型，得到面部腧穴热图及其对应的腧穴坐标；

其中，所述端到端面部腧穴定位模型包括以下训练过程：

S1：构建面部腧穴智能定位任务数据集；

S2：搭建基于深度神经网络的端到端面部腧穴定位模型；

S3：通过图像重建任务对所述端到端面部腧穴定位模型进行非监督自编码模型预训练；

S4：通过所述面部腧穴智能定位任务数据集对预训练后的所述端到端面部腧穴定位模型进行监督学习训练；

S5：获取监督学习训练后的所述端到端面部腧穴定位模型，并在测试数据集上进行评估，计算预测坐标与真实坐标之间的NME（Normalized Mean Error，归一化平均误差）数值和/或AUC（Area-Under-the-Curve，曲线下面积）数值，当所述NME数值小于第一预设值和/或所述AUC数值大于第二预设值后，输出监督学习训练后的所述端到端面部腧穴定位模型；否则进入步骤S4继续训练。

本发明所述方法通过端到端的方法对面部腧穴进行定位，充分利用神经网络的非线性建模能力，深度挖掘面部抽象特征，极大地提高了面部腧穴定位准确度。同时提出了两阶段模型训练策略，可实现通过少量面部腧穴样本数据训练即可达到良好的面部腧穴定位效果，能够有效降低基于神经网络模型的面部腧穴定位方法对标注数据的依赖。此外，本发明融合了机器学习的注意力机制，促使深度神经网络模型更关注目标的细节，进一步提升本发明所述方法的面部腧穴定位精度。

作为本发明的优选方案，所述端到端面部腧穴定位模型包括图像特征编码模块、共享图像重建生成模块以及特征交叉传输模块；

所述图像特征编码模块包括编码器，所述编码器采用ResNet网络模型；

所述共享图像重建生成模块包括生成器以及隐性空间鉴别器，所述生成器采用逆ResNet网络模型，所述生成器包括多个逆残差模块；所述隐性空间鉴别器包括多个全连接层，且每个所述全连接层设有多个神经元；

所述特征交叉传输模块包括多个交叉传输层，所述交叉传输层包括卷积模块及通道和空间注意力机制模块；所述交叉传输层的数量与所述逆残差模块一致，且交叉传输层与所述共享图像重建生成模块的生成器中的逆残差模块交叉设置。本发明提出的网络结构利用交叉传输层融入通道和空间维度上的注意力机制，使模型更关注于目标本身，面部特征提取效果更好，进一步提高了面部腧穴的定位准确度。

作为本发明的优选方案，所述步骤S3包括：

S31：选取公开的人脸数据集作为图像重建任务的训练样本；

S32：设定训练参数，并通过重建人脸图像任务对所述端到端面部腧穴定位模型的所述图像特征编码模块以及所述共享图像重建生成模块进行预训练；

所述训练参数包括训练迭代次数、编码器输入图像尺寸、生成器输出图像尺寸、批次训练量以及学习速率等；所述预训练模型包括编码器、生成器和鉴别器。本发明通过重构大量公开人脸图像数据集学习人脸隐性知识，之后基于学习到的面部隐性知识，有监督地训练面部腧穴定位模型。

作为本发明的优选方案，所述步骤S32中人脸图像重建过程的损失函数表达式为：

，

其中，

为人脸图像重建过程中的损失函数，

为编码器，

为生成器，

为真假图片鉴别器，

为隐性空间鉴别器，

为重构损失、

为结构图像损失、

为编码特征损失、为对抗特征损失，

分别为

的权重。

作为本发明的优选方案，所述步骤S4是通过所述面部腧穴智能定位任务数据集以及所述模型参数对所述端到端面部腧穴定位模型进行模型训练；所述模型训练的损失函数为：

，

其中，

为给定图像，

为监督学习训练时的损失函数，

是第一层逆ResNet层后经过激活函数处理的结果，

为面部腧穴热图的真实值，

为交叉传输层（卷积及通道和空间注意力模块）运算。

作为本发明的优选方案，所述面部腧穴的位置表达式为：

，

为预测的面部腧穴热图，

为第

个面部腧穴的预测坐标，

分别为所述预测的面部腧穴热图的横坐标和纵坐标。

作为本发明的优选方案，所述步骤S3和所述步骤S4还包括数据扩充过程；

所述数据扩充过程包括但不限于对训练数据中的图片进行随机水平翻转、平移、旋转及剪裁。

作为本发明的优选方案，所述步骤S1包括：

S11：采集真实人脸数据或从公开的人脸数据集中选取数据样本作为原始未标注数据；

S12：针对所述原始未标注数据进行预处理，输出预处理数据；所述预处理包括但不限于图像去噪、人脸检测与分割、光照归一化以及人脸姿态矫正；

S13：对所述预处理数据中的面部腧穴类别和坐标进行人工标注，并输出面部腧穴智能定位任务数据集；所述面部腧穴智能定位任务数据集包括训练集和测试集，所述训练集和所述测试集中的数据来源相互独立。本发明基于公开人脸数据集构建面部腧穴智能定位任务数据集，且采用体表解剖标志定位法和骨度折量定位法结合对其进行人工标注，保证面部腧穴数据标注的准确性，为面部腧穴定位提供了良好的数据基础，解决了目前无公开的数据集用于面部腧穴定位任务的难题。作为本发明的优选方案，所述步骤S13中标注内容通过数据标注软件人工标注；所述标注内容包括腧穴类别和坐标；

其中，所述腧穴类别包括：鱼腰、印堂、下关、瞳子髎、太阳、素髎、丝竹空、四白、水沟、上迎香、迎香、颧髎、攒竹、睛明、承泣、口禾髎、巨髎、地仓、承浆、夹承浆、颊车、大迎、兑端、球后。

一种电子设备，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述任一项所述的方法。

与现有技术相比，本发明的有益效果：

1.本发明所述方法通过端到端的方式对面部腧穴进行定位，充分利用神经网络的非线性建模能力，深度挖掘面部抽象特征，极大地提高了面部腧穴定位准确度。

2.本发明提出了两阶段模型训练策略，通过重构大量公开人脸图像数据集学习人脸隐性信息，之后基于学习到的面部隐性知识有监督地训练面部腧穴定位模型，可实现基于少量面部腧穴样本数据训练即可达到良好的面部腧穴定位效果，能够有效降低基于神经网络模型的面部腧穴定位方法对标注数据的依赖。

3.本发明提出的网络结构利用交叉传输层融入通道和空间维度上的注意力机制，使模型更关注于目标本身，面部特征提取效果更好，从而提高了面部腧穴定位的准确度。

4.本发明通过在公开人脸数据集的基础上对面部腧穴类别和坐标进行标注并构建可用于面部腧穴定位模型训练的数据集，解决了目前无公开的数据集用于面部腧穴定位任务的难题。同时，采用体表解剖标志定位法和骨度折量定位法结合进行腧穴标定，保证面部腧穴数据标注的准确性，为面部腧穴定位研究提供良好的数据基础。

附图说明

图1为本发明实施例1所述的一种针对小样本的端到端面部腧穴定位方法的流程示意图；

图2为本发明实施例1所述的一种针对小样本的端到端面部腧穴定位方法中所述端到端面部腧穴定位模型的训练过程示意图；

图3为本发明实施例3所述的一种针对小样本的端到端面部腧穴定位方法的面部腧穴智能定位任务数据集样本示意图；

图4为本发明实施例3所述的一种针对小样本的端到端面部腧穴定位方法中的端到端面部腧穴定位模型的流程运行示例图；

图5为本发明实施例3所述的一种针对小样本的端到端面部腧穴定位方法中人脸图像重建任务网络模型示意图；

图6为本发明实施例3所述的一种针对小样本的端到端面部腧穴定位方法中端到端面部腧穴定位任务网络模型示意图；

图7为本发明实施例4所述的一种利用了实施例1所述的一种针对小样本的端到端面部腧穴定位方法的一种电子设备。

具体实施方式

下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

实施例1

如图1所示，一种针对小样本的端到端面部腧穴定位方法，包括以下步骤：

其中，如图2所示，所述端到端面部腧穴定位模型包括以下训练过程：

S1：构建面部腧穴智能定位任务数据集。

S13：对所述预处理数据中的面部腧穴进行人工标注，并输出面部腧穴智能定位任务数据集；所述面部腧穴智能定位任务数据集包括训练集和测试集，所述训练集和所述测试集中的数据来源相互独立。其中，标注内容通过数据标注软件人工标注；所述标注内容包括腧穴类别和坐标；

S2：搭建基于深度神经网络的端到端面部腧穴定位模型。

所述端到端面部腧穴定位模型包括图像特征编码模块、共享图像重建生成模块以及特征交叉传输模块；

所述图像特征编码模块包括编码器，所述编码器采用ResNet网络模型（所述ResNet网络模型包括但不限于ResNet-18以及ResNet-50网络模型）；

所述共享图像重建生成模块包括生成器以及隐性空间鉴别器，所述生成器采用逆ResNet网络模型（所述逆ResNet网络模型包括但不限于逆ResNet-18以及逆ResNet-50网络模型，且采用网络模型与所述编码器结构相对应），包括多个逆残差模块；所述隐性空间鉴别器包括多个全连接层，且每个所述全连接层设有多个神经元；

所述特征交叉传输模块包括多个交叉传输层，所述交叉传输层包括卷积模块及通道和空间注意力机制模块；所述交叉传输层的数量与所述逆残差模块一致，且交叉传输层与所述共享图像重建生成模块的生成器中的逆残差模块交叉设置。

S3：通过图像重建任务对所述端到端面部腧穴定位模型进行非监督自编码模型预训练。

S31：选取公开的人脸数据集作为图像重建任务的训练样本；

所述训练参数包括训练迭代次数、编码器输入图像尺寸、生成器输出图像尺寸、批次训练量以及学习速率等；所述预训练模型包括编码器、生成器和鉴别器。

其中，人脸图像重建过程的损失函数表达式为：

，

其中，

为人脸图像重建过程中的损失函数，

为编码器，

为生成器，

为真假图片鉴别器，

为隐性空间鉴别器，

为重构损失、

为结构图像损失、

为编码特征损失、

为对抗特征损失，

分别为

、

、

、

的权重。

S4：通过所述面部腧穴智能定位任务数据集对预训练后的所述端到端面部腧穴定位模型进行监督学习训练。

所述模型训练的损失函数为：

，

其中，

为给定图像，

为监督学习训练时的损失函数，

是第一层逆ResNet层后经过激活函数处理的结果，

为面部腧穴热图的真实值，

为交叉传输层运算。

所述面部腧穴的位置表达式为：

，

为预测的面部腧穴热图，

为第

个面部腧穴的预测坐标，

分别为所述预测的面部腧穴热图的横坐标和纵坐标。

S5：获取监督学习训练后的所述端到端面部腧穴定位模型，并在测试数据集上进行评估，计算预测坐标与真实坐标之间的NME数值和/或AUC数值，当所述NME数值小于第一预设值和/或所述AUC数值大于第二预设值后，输出监督学习训练后的所述端到端面部腧穴定位模型；否则进入步骤S4继续训练。

所述步骤S3和所述步骤S4还包括数据扩充过程：所述数据扩充过程包括但不限于对训练数据中的图片进行随机水平翻转、平移、旋转及剪裁。

实施例2

本实施例与实施例1的区别在于，所述步骤S5还包括一个训练迭代次数阈值，当所述步骤S5执行次数达到所述迭代阈值后，直接输出监督学习训练后的所述端到端面部腧穴定位模型，并在测试数据集上进行评估，计算预测坐标与真实坐标之间的NME数值和/或AUC数值，以及此时的所述端到端面部腧穴定位模型，以避免由于模型评估性能不达标导致模型训练无法终止。

实施例3

本实施例为实施例1的实际应用例，具体包括以下步骤：

步骤1：构建面部腧穴智能定位任务数据集。

步骤1-1：从人脸公开数据集CAS-PEAL中挑选654个个体的共654张正面人脸图像。其中，所述654张正面人脸图像中男女性别数据各占一半。

步骤1-2：针对步骤1-1中的原始未标注数据进行预处理，包括图像归一化处理、人脸检测与分割等。

步骤1-3：邀请某中医大三位经验丰富的从业医师使用开源labelme软件对每一张图像进行人工标注。标注内容包括面部的24个穴位（鱼腰、印堂、下关、瞳子髎、太阳、素髎、丝竹空、四白、水沟、上迎香、迎香、颧髎、攒竹、睛明、承泣、口禾髎、巨髎、地仓、承浆、夹承浆、颊车、大迎、兑端、球后）。因部分穴位在面部只有一个，部分穴位在面部左右两侧各一个，经计算共43个穴位点。面部腧穴标注数据样本示例如图3所示。并将654张面部腧穴数据样本分为600张训练数据和54张测试数据。其中，训练集和测试集中男女性别数据各占一半。

步骤2：构建基于深度神经网络的端到端面部腧穴定位模型；本发明所述模型执行流程如图4所示。

步骤2-1：构建图像特征编码模块的编码器（E）采用标准的ResNet-18。

步骤2-2：构建共享图像重建生成模块的生成器（G）采用逆ResNet-18，隐性空间鉴别器（

）采用3个全连接层，每层有1000个神经元。图像特征编码模块的编码器和共享图像重建生成模块的生成器首先用于人脸图像重建任务与训练，其网络结构如图5所示。

步骤2-3：构建特征交叉传输模块，在逆ResNet层中间插入交叉传输层（ITL）——3×3的卷积及通道和空间注意力机制模块（CBAM模块），交叉传输层的主要作用是提取生成器每一层卷积层的关键特性。每个交叉传输层产生与原始逆ResNet层相同数量的输出通道。特征交叉传输模块用于与上述模块一起构成本发明针对小样本的端到端面部腧穴定位任务模型，其网络结构如图6所示。

步骤3：通过图像重建任务对所述端到端面部腧穴定位模型进行非监督自编码模型预训练。

步骤3-1：选取VGGFace2和AffectNet公开人脸数据集作为非监督训练人脸图像重建任务的训练样本。

步骤3-2：设定训练参数，通过重建人脸图像任务对所述端到端面部腧穴定位模型中的所述图像特征编码模块以及所述共享图像重建生成模块进行预训练；鉴于面部腧穴训练样本数量较少，本发明首先利用对抗自编码器网络重构大量公开人脸数据，学习面部的隐性知识，为后续针对小样本的端到端面部腧穴定位模型做模型预训练。其中，真假图片鉴别器（

）采用DCGAN鉴别器。给定图像

，编码器

产生特征向量

；生成器

将

投影回图像空间：

。所述鉴别器

的任务是区分

是否为真实图像。

所述训练参数包括训练迭代次数、编码器输入图像尺寸、生成器输出图像尺寸、批次训练量以及学习速率等。具体设定神经网络模型的训练迭代次数epochs为50，编码器输入图像尺寸为128×128，输出大小为99维的向量。生成器输出图像尺寸为128×128，批次训练量batch-size设置为64，使用Adam算法进行优化，学习速率lr为2×10^-5，

，

；训练过程中，采用随机水平翻转、平移、旋转及剪裁等方法对训练图片进行数据增强，提高模型的泛化能力。

步骤4：通过所述面部腧穴智能定位任务数据集对所述端到端面部腧穴定位模型进行监督学习训练。

步骤4-1：冻结步骤3中自编码器的所有参数，并训练优化特征交叉传输模块参数以适用于针对小样本的端到端面部腧穴定位任务，最后一个卷积层映射到L通道的热图（L是要预测的腧穴的个数）。

步骤4-2：将步骤1构建所得面部腧穴智能定位任务数据集用于该步模型训练，分别将训练数据集样本量设置为50、100、200、300和400等（男女性别数据各占一半），测试数据集保持不变。训练过程的损失函数

使用真实面部腧穴热图与预测面部腧穴热图之间的L2距离，训练完成输出最终的针对小样本的端到端面部腧穴定位模型。

腧穴的坐标计算公式为：

。

其中，

是给定的人脸图片，

是第一层逆ResNet之后经过激活函数处理所得结果，

为面部腧穴热图的真实值，

为预测的面部腧穴热图，

为交叉传输层运算，

为所述预测的面部腧穴热图的横坐标和纵坐标。

步骤4-3：设定神经网络模型的训练迭代次数epochs为3000次，输入图片经预处理调整为256×256，输出的面部腧穴热图尺寸为128×128，学习速率lr为0.001；所述NME第一预设值为1.2，所述AUC第二预设值为0.9；设定完参数后，开始网络模型训练，最终输出针对小样本的端到端面部腧穴定位模型，用于面部腧穴定位。

步骤5：对训练所得针对小样本的端到端面部腧穴定位模型进行验证。

步骤5-1：给定一张所构建数据集内的人脸图片和对应的面部腧穴坐标，将图片输入步骤4训练所得针对小样本的端到端面部腧穴定位模型得到面部腧穴坐标预测值，并与人工标注面部腧穴坐标真实值做对比。使用NME和AUC衡量模型性能，其定义如下：

，

其中，

面部腧穴坐标的真实值，

面部腧穴坐标的预测值，

表示样本数量，

表示用于归一化的外眼角距离。NME数值越小，表示面部腧穴坐标预测结果越准确。

，

其中，

表示归一化误差，

（Cumulative ErrorDistribution，CED）函数。AUC数值越大，表示面部腧穴坐标预测结果越准确。

具体实验结果如下表：

表1 本发明方法实验结果

步骤6：模型实际运行实例。

给定一张所构建数据集以外的人脸图片，将图片输入步骤4训练所得的所述端到端面部腧穴定位模型得到面部腧穴坐标预测结果（包括面部腧穴热图以及对应的腧穴坐标），通过专业的从业医师对预测结果进行打分，以评估该模型的性能。

实施例4

如图7所示，一种电子设备，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述实施例所述的一种针对小样本的端到端面部腧穴定位方法。所述输入输出接口可以包括显示器、键盘、鼠标、以及USB接口，用于输入输出数据；电源用于为电子设备提供电能。

本领域技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（Read Only Memory，ROM）、磁碟或者光盘等各种可以存储程序代码的介质。

当本发明上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。