CN115019367A

CN115019367A - 遗传病面部识别装置及方法

Info

Publication number: CN115019367A
Application number: CN202210638807.2A
Authority: CN
Inventors: 付文; 王建峰; 梁波
Original assignee: Suzhou Chaoyun Life Intelligence Industry Research Institute Co ltd
Current assignee: Suzhou Chaoyun Life Intelligence Industry Research Institute Co ltd
Priority date: 2022-06-07
Filing date: 2022-06-07
Publication date: 2022-09-06

Abstract

本发明实施例公开了一种遗传病面部识别装置及方法，该装置包括：图像获取模块以及图像识别模块；其中，图像获取模块，用于获取待处理图像，并将待处理图像发送至图像识别模块；其中，待处理图像包括面部区域；图像识别模块，与图像获取模块相连接，用于接收待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与待处理图像对应的目标遗传病类别；其中，目标遗传病识别模型根据样本原始图像以及与样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到，目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建。通过本发明实施例的技术方案，实现了根据面部图像来准确识别遗传病类别的效果。

Description

遗传病面部识别装置及方法

技术领域

本发明实施例涉及面部识别技术，尤其涉及一种遗传病面部识别装置及方法。

背景技术

遗传病面部识别是利用深度学习分析患者的面部特征来诊断遗传病，基于图像分类技术，对于给定的输入遗传病患者图像，来预测图像的遗传病类别。

目前，针对遗传病识别通常使用FDNA(面部表情新型分析技术)公司的DeepGestalt框架，通过照片对用户进行健康检测的脸部疾病识别，以尽早发现一些罕见或者难以诊断的遗传综合征。但是，由于其使用的是浅层的神经网络，该网络由十个卷积层组成，无法有效学习所有数据的特征。并且，由于遗传病种类较多有200多种，存在样本数据不平衡的问题。因此，通过上述方式训练出来的遗传病面部识别模型效果不够准确，难以根据面部图像准确遗传病类别。

发明内容

本发明实施例提供了一种遗传病面部识别装置及方法，以实现根据面部图像来准确识别遗传病类别的效果。

第一方面，本发明实施例提供了一种遗传病面部识别装置，该装置包括：图像获取模块以及图像识别模块；其中，

所述图像获取模块，用于获取待处理图像，并将所述待处理图像发送至所述图像识别模块；其中，所述待处理图像包括面部区域；

所述图像识别模块，与所述图像获取模块相连接，用于接收所述待处理图像，并将所述待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与所述待处理图像对应的目标遗传病类别；其中，所述目标遗传病识别模型根据样本原始图像以及与所述样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到，所述目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建。

第二方面，本发明实施例还提供了一种遗传病面部识别方法，该方法包括：

基于图像获取模块，获取待处理图像，并将所述待处理图像发送至图像识别模块；其中，所述待处理图像包括面部区域；

基于所述图像识别模块，接收所述待处理图像，并将所述待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与所述待处理图像对应的目标遗传病类别；其中，所述目标遗传病识别模型根据样本原始图像以及与所述样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到，所述目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建。

本发明实施例的技术方案，通过图像获取模块，获取待处理图像，并将待处理图像发送至图像识别模块，通过图像识别模块，接收待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与待处理图像对应的目标遗传病类别，其中，目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建，解决了模型识别不准确以及泛化能力较差的问题，实现提高遗传病面部识别准确率和泛化能力的效果。

附图说明

为了更加清楚地说明本发明示例性实施例的技术方案，下面对描述实施例中所需要用到的附图做一简单介绍。显然，所介绍的附图只是本发明所要描述的一部分实施例的附图，而不是全部的附图，对于本领域普通技术人员，在不付出创造性劳动的前提下，还可以根据这些附图得到其他的附图。

图1为本发明实施例一所提供的一种遗传病面部识别装置的结构示意图；

图2为本发明实施例二所提供的一种遗传病面部识别装置的结构示意图；

图3为本发明实施例三所提供的一种遗传病面部识别方法的流程示意图；

图4为本发明实施例四所提供的一种遗传病面部识别方法的流程示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一所提供的一种遗传病面部识别装置的结构示意图，本实施例可适用于根据面部图像识别遗传病类别的情况，该装置可以执行遗传病面部识别方法，该装置可以通过软件和/或硬件的形式实现，该硬件可以是电子设备，可选的，电子设备可以是移动终端、PC端、服务器等。

如图1所示，本实施例的遗传病面部识别装置包括：图像获取模块1以及图像识别模块2。

其中，图像获取模块1，用于获取待处理图像，并将待处理图像发送至图像识别模块2；其中，待处理图像包括面部区域；图像识别模块2，与图像获取模块1相连接，用于接收待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与待处理图像对应的目标遗传病类别；其中，目标遗传病识别模型根据样本原始图像以及与样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到，目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建。

图像获取模块1，用于获取待处理图像，并将待处理图像发送至图像识别模块2。

其中，待处理图像可以是基于拍摄装置对目标对象拍摄得到的图像，拍摄装置可以是如照相机、摄像机等装置，目标对象可以是待进行遗传病识别的人，待处理图像包括面部区域，即目标对象的面部区域。

具体的，通过图像获取模块1可以针对目标对象进行拍摄，得到待处理图像，并将待处理图像发送至图像识别模块2，以便对待处理图像进行遗传病的分类和识别。

图像识别模块2，与图像获取模块1相连接，用于接收待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与待处理图像对应的目标遗传病类别。

其中，目标遗传病识别模型根据样本原始图像以及与样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到。样本原始图像可以是包含面部区域的图像，并且，每个样本原始图像都具有一个与之对应的样本遗传病类别。目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建，初始遗传病识别模型也是基于同时兼顾速度与精度的模型放缩方法构建的。目标遗传病类别是针对待处理图像的识别结果。

需要说明的是，同时兼顾速度与精度的模型放缩方法可以是EfficientNet，EfficientNet通过复合系数来从网络深度、网络宽度、图像分辨率三个维度放大网络，从而增加了网络的层数，还获取到更多的信息并提取更多的特征。

具体的，图像识别模块2可以接收图像获取模块1发送的待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，通过目标遗传病识别模型对待处理图像进行处理可以得到处理结果，即目标遗传病类别。

在上述各实施例的基础上，目标遗传病识别模型基于EfficientNet构建或基于ResNeSt269、EfficientNet-B7以及EfficientNet-B8中的至少两个模型加权融合确定。

具体的，目标遗传病识别模型可以是基于EfficientNet构建的，也可以是选用模型ResNeSt269、EfficientNet-B7以及EfficientNet-B8分别进行多次训练，最终，选择准确率最高的预设数量的模型(如：3个模型等)，通过加权平均法进行模型融合得到目标遗传病识别模型。

需要说明的是，使用加权融合方法确定目标遗传病识别模型时所选择的预设数量的模型可以是同一类别的模型也可以是不同类别的模型，具体需要根据模型准确率确定。

还需要说明的是，ResNeSt269、EfficientNet-B7以及EfficientNet-B8只是示例性说明，若根据使用需求，也可以其他类型的深度学习模型进行融合。

实施例二

图2为本发明实施例二所提供的一种遗传病面部识别装置的结构示意图。如图2所述，本实施例的遗传病面部识别装置包括：图像获取模块1以及图像识别模块2，还包括样本获取模块3以及模型训练模块4。

其中，样本获取模块3，用于获取包括面部区域的样本原始图像，确定与样本原始图像对应的样本遗传病类别，并将样本原始图像以及样本遗传病类别发送至模型训练模块4；模型训练模块4，与样本获取模块3和图像识别模块2分别连接，用于基于接收的样本原始图像以及与样本原始图像对应的样本遗传病类别构建训练样本集，根据训练样本集中的样本原始图像以及与样本原始图像对应样本遗传病类别对初始遗传病识别模型进行训练，将训练完成的初始遗传病识别模型作为目标遗传病识别模型，将目标遗传病识别模型发送至图像识别模块2。

样本获取模块3，用于获取包括面部区域的样本原始图像，确定与样本原始图像对应的样本遗传病类别，并将样本原始图像以及样本遗传病类别发送至模型训练模块4。

具体的，样本获取模块3可以是通过公开数据库获取样本原始图像以及与样本原始图像对应的样本遗传病类别，也可以是将日常诊断中确认患有遗传病的患者的图像作为样本原始图像，并将该遗传病作为与样本原始图像相对应的样本遗传病类别。进而，将样本原始图像以及样本遗传病类别发送至模型训练模块4，以进行模型训练得到目标遗传病识别模型。

模型训练模块4，与样本获取模块3和图像识别模块2分别连接，用于基于接收的样本原始图像以及与样本原始图像对应的样本遗传病类别构建训练样本集，根据训练样本集中的样本原始图像以及与样本原始图像对应样本遗传病类别对初始遗传病识别模型进行训练，将训练完成的初始遗传病识别模型作为目标遗传病识别模型，将目标遗传病识别模型发送至图像识别模块2。

其中，训练样本集可以是样本原始图像以及与样本原始图像对应的样本遗传病类别组成的样本集，用于对初始遗传病识别模型进行训练。

具体的，根据训练样本集中的样本原始图像以及与样本原始图像对应样本遗传病类别对初始遗传病识别模型进行训练，以训练得到合适的参数和/或超参数。例如，当达到收敛条件时停止训练，将此时的参数和/或超参数确定为目标遗传病识别模型中的参数和/或超参数。进而，将确定了参数和/或超参数的目标遗传病识别模型发送至图像识别模块2，以便后续使用目标遗传病识别模型进行识别。

在上述各实施例的基础上，如图2所述，样本获取模块3包括：图像预处理单元31，用于针对样本原始图像进行图像预处理。

其中，图像预处理包括数据清洗和图像裁剪中的至少一种。

具体的，图像预处理单元31对获取的样本原始图像进行图像预处理以提高样本质量，便于后续提高模型训练的准确度。数据清洗可以是去除尺寸较小、图像模糊的样本原始图像。图像裁剪可以是对样本原始图像中的面部区域进行裁剪，以排除冗余信息的干扰。

需要说明的是，图像预处理后的图形尺寸需要调整为与初始遗传病识别模型相适配的尺寸。

在上述各实施例的基础上，如图2所述，样本获取模块3包括：图像增强单元32，用于针对样本原始图像进行图像增强处理。

其中，图像增强处理包括旋转、镜像、锐化、平移、色彩增强、亮度、饱和度以及缩放中的至少一种。

具体的，图像增强单元32对获取的样本原始图像进行图像增强，以进行数据扩增，来增加训练样本集中的样本量。

需要说明的是，训练样本集中各遗传病类型的样本数目差距较大，例如：少的只有几十张，多的有一千多张。样本不均衡会造成部分遗传病类型的准确率很低的问题。并且，图像数据的分辨率、大小、颜色、人脸姿态也有很大的差距。因此，可以通过图像增强单元32使用旋转、镜像、锐化、平移、色彩增强、亮度、饱和度等十多种图像处理方法解决样本不均衡问题。

示例性的，样本量少的样本原始图像可以多使用这些图像增强方法，样本量多的样本原始图像可以少使用些图像增强方法，以使最终每种遗传病类别对应的样本量相同或相差数量在预设范围内，例如，达到2500±50张。通过图像增强方法，一方面可以增加训练样本集的样本量，另一方面可以减少模型过拟合程度，增强模型的泛化能力。

在上述各实施例的基础上，如图2所述，模型训练模块4中进行训练的方式为：基于训练热身方法以及预先设置的学习率的下降方式对初始遗传病识别模型进行训练。

具体的，采用warmup策略进行学习率的训练。在开始训练时以很小的学习率进行训练，使得网络模型熟悉数据，随着训练的进行，学习率慢慢变大，到了一定程度，以设置的初始学习率进行训练，接着学习率再慢慢变小。并且，选择预先设置的学习率下降方式进行训练，示例性的，可以使用余弦衰减(cosine_decay)，使用该学习率下降方式无需调整超参数，鲁棒性也比较高，收敛效果较好。

在上述各实施例的基础上，模型训练模块4中模型训练的批量大小值与学习率呈线性关系。

具体的，批量大小值(Batch size)的设置与学习率的值呈线性关系，以避免模型训练时的收敛精度受到影响。

在上述各实施例的基础上，模型训练模块4中进行训练时使用的模型优化器为Adam。

具体的，在模型优化过程中可以使用Adam作为模型优化器，以使损失函数尽可能的小，收敛速度相对更快。Adam模型优化器的优点在于计算效率高、内存需求低、适合数据和/或参数较大的问题、适用于非常嘈杂和/或稀疏梯度的问题，并且超参数具有直观的解释，通常需要很少的调整。

在上述各实施例的基础上，如图2所述，本实施例的遗传病面部识别装置还包括：初始遗传病识别模型更新模块5，与模型训练模块4相连接，用于基于人脸数据集对初始遗传病识别模型进行预训练，将预训练完成的初始遗传病识别模型发送至所述模型训练模块4。

其中，人脸数据集可以是用于对模型进行预训练的数据集，可以包括各种角度、光照条件等的人脸图像。

具体的，使用人脸数据集训练初始遗传病识别模型进行预训练，得到预训练模型，并将预训练完成的初始遗传病识别模型发送述模型训练模块4，以加快模型训练时的收敛速度，并提升模型的精度，也能够提高模型的泛化效果。

在上述各实施例的基础上，模型训练模块4中进行训练时运用标签平滑，来对损失函数的修正，产生更好的校准网络，从而提高泛化能力，以对不可见的数据产生准确的预测。

本发明实施例的技术方案，通过样本获取模块，获取包括面部区域的样本原始图像，确定与样本原始图像对应的样本遗传病类别，并将样本原始图像以及样本遗传病类别发送至模型训练模块；通过模型训练模块，基于接收的样本原始图像以及与样本原始图像对应的样本遗传病类别构建训练样本集，根据训练样本集中的样本原始图像以及与样本原始图像对应样本遗传病类别对初始遗传病识别模型进行训练，将训练完成的初始遗传病识别模型作为目标遗传病识别模型，将目标遗传病识别模型发送至图像识别模块，解决了模型建立不准确以及泛化能力较差的问题，实现提高遗传病面部模型的训练效果，以提高识别准确率和泛化能力。

实施例三

在上述各实施例的基础上，图3为本发明实施例三所提供的一种遗传病面部识别方法的流程示意图。

如图3所示，本实施例的遗传病面部方法包括：

(1)图像预处理

训练数据(训练样本集)对模型的影响是决定性的，将收集到的数据(样本原始图像)进行清洗，去除尺寸较小、图像模糊的数据，然后进行人脸裁剪，排除冗余信息的干扰，同时，裁剪之后图像的尺寸要和模型(如：EficientNet)要求的尺寸一致。

(2)图像增强

由于训练样本集各类样本数目差距较大，少的只有几十张，多的有一千多张，会造成部分类别的准确率很低。因此，使用旋转、镜像、锐化、平移、色彩增强、亮度、饱和度等十多种图像处理方法解决数据不平衡问题。原则上，数据少的多使用些图像处理方法，数据多的少使用些图像处理方法，使每种遗传病的数量达到2500左右。图像增强方法增强了训练数据量，减少了网络过拟合程度，增强了模型的泛化能力。

(3)模型选择

使用卷积神经网络EfficientNet，即一个简单而高效的复合系数来从网络深度、网络宽度、图像分辨率三个维度放大网络，从而增加了网络的层数，还获取到更多的信息和提取更多的特征。通过卷积神经网络EfficientNet不会像传统深度学习方法任意缩放网络的维度，而是基于神经结构搜索技术可以获得最优的一组参数，即复合系数。

(4)调参

采用warmup策略(训练热身方法)，选择的学习率下降方式是cosine_decay，无需调整超参数，鲁棒性高，收敛效果好。Batch size(批量大小值)的设置与学习率的值呈线性关系，避免收敛精度受到影响。优化器的选择，选择自适应学习率的优化器Adam，让损失函数尽可能的小，收敛速度相对更快，以找到合适的参数来完成分类识别任务。

(5)训练模型

在多分类模型(目标遗传病识别模型)训练之前，先使用海量人脸数据集(人脸数据集)训练出EfficientNet预训练模型(预训练完成的初始遗传病识别模型)，以后续加快多分类模型训练时的收敛速度并提升模型的精度，获得更好的泛化效果。在训练过程中，运用了标签平滑来对损失函数的修正，产生更好的校准网络，以更好泛化，来对不可见的数据产生更准确的预测。进而，将训练完成的多分类模型确定为预测模型(目标遗传病识别模型)。

可选的，可以选用分类识别效果较好的ResNeSt269、EfficientNet-B7和EfficientNet-B8分别进行多次训练，最终，选择准确率最高的三个(预设数量)模型，进行加权平均法模型融合，以得到预测模型。

需要说明的是，使用准确率最高的一个模型作为预测模型对100种遗传病的平均识别准确率为92.8％，使用准确率最高的三个模型的融合模型对100种遗传病的平均识别准确率为95.2％。

本发明实施例的技术方案，通过深度学习技术、交叉损失训练，结合迁移学习技术，实现从人脸拍照到遗传病评估的整个环节。本发明实施例的技术方案采用深度残差网络模型，克服常规卷积神经网络在加深网络层数时出现的弊端，通过深度学习网络识别细粒度的人脸每一个区域的细微特征，细致分析人脸每一个细节特征，进而，分析人脸遗传病属性和相似性特征，解决了模型识别不准确以及泛化能力较差的问题，实现提高遗传病面部识别准确率和泛化能力的效果。

实施例四

图4为本发明实施例四所提供的一种遗传病面部识别方法的流程示意图，本实施例可适用于根据面部图像识别遗传病类别的情况，该方法可以由遗传病面部识别装置执行。

如图4所示，本实施例的方法具体包括如下步骤：

S410、基于图像获取模块，获取待处理图像，并将待处理图像发送至图像识别模块。

其中，待处理图像包括面部区域。

S420、基于图像识别模块，接收待处理图像，并将待处理图像输入至预先训练完成的目标遗传病识别模型中，得到与待处理图像对应的目标遗传病类别。

其中，目标遗传病识别模型根据样本原始图像以及与样本原始图像对应的样本遗传病类别对初始遗传病识别模型训练得到，目标遗传病识别模型基于同时兼顾速度与精度的模型放缩方法构建。

在上述各实施例的基础上，可选的，还包括：

基于样本获取模块，获取包括面部区域的样本原始图像，确定与所述样本原始图像对应的样本遗传病类别，并将所述样本原始图像以及所述样本遗传病类别发送至所述模型训练模块；

基于模型训练模块，基于接收的样本原始图像以及与所述样本原始图像对应的样本遗传病类别构建训练样本集，根据所述训练样本集中的样本原始图像以及与所述样本原始图像对应样本遗传病类别对所述初始遗传病识别模型进行训练，将训练完成的初始遗传病识别模型作为目标遗传病识别模型，将所述目标遗传病识别模型发送至所述图像识别模块。

在上述各实施例的基础上，可选的，所述样本获取模块包括：图像预处理单元；基于图像预处理单元，针对样本原始图像进行图像预处理，其中，所述图像预处理包括数据清洗和图像裁剪中的至少一种。

在上述各实施例的基础上，可选的，所述样本获取模块包括：图像增强单元；基于图像增强单元，针对样本原始图像进行图像增强处理，其中，所述图像增强处理包括旋转、镜像、锐化、平移、色彩增强、亮度、饱和度以及缩放中的至少一种。

在上述各实施例的基础上，可选的，所述模型训练模块中进行训练的方式为：

基于训练热身方法以及预先设置的学习率的下降方式对所述初始遗传病识别模型进行训练。

在上述各实施例的基础上，可选的，所述模型训练模块中模型训练的批量大小值与所述学习率呈线性关系。

在上述各实施例的基础上，可选的，所述模型训练模块中进行训练时使用的模型优化器为Adam。

在上述各实施例的基础上，可选的，还包括：

基于初始遗传病识别模型更新模块，基于人脸数据集对初始遗传病识别模型进行预训练，将预训练完成的初始遗传病识别模型发送至所述模型训练模块。

在上述各实施例的基础上，可选的，所述目标遗传病识别模型基于EfficientNet构建或基于ResNeSt269、EfficientNet-B7以及EfficientNet-B8中的至少两个模型加权融合确定。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种遗传病面部识别装置，其特征在于，包括：图像获取模块以及图像识别模块；其中，

2.根据权利要求1所述的装置，其特征在于，还包括：样本获取模块以及模型训练模块；其中，

所述样本获取模块，用于获取包括面部区域的样本原始图像，确定与所述样本原始图像对应的样本遗传病类别，并将所述样本原始图像以及所述样本遗传病类别发送至所述模型训练模块；

所述模型训练模块，与所述样本获取模块和所述图像识别模块分别连接，用于基于接收的样本原始图像以及与所述样本原始图像对应的样本遗传病类别构建训练样本集，根据所述训练样本集中的样本原始图像以及与所述样本原始图像对应样本遗传病类别对所述初始遗传病识别模型进行训练，将训练完成的初始遗传病识别模型作为目标遗传病识别模型，将所述目标遗传病识别模型发送至所述图像识别模块。

3.根据权利要求2所述的装置，其特征在于，所述样本获取模块包括：

图像预处理单元，用于针对样本原始图像进行图像预处理，其中，所述图像预处理包括数据清洗和图像裁剪中的至少一种。

4.根据权利要求2所述的装置，其特征在于，所述样本获取模块包括：

图像增强单元，用于针对样本原始图像进行图像增强处理，其中，所述图像增强处理包括旋转、镜像、锐化、平移、色彩增强、亮度、饱和度以及缩放中的至少一种。

5.根据权利要求2所述的装置，其特征在于，所述模型训练模块中进行训练的方式为：

6.根据权利要求5所述的装置，其特征在于，所述模型训练模块中模型训练的批量大小值与所述学习率呈线性关系。

7.根据权利要求2所述的装置，其特征在于，所述模型训练模块中进行训练时使用的模型优化器为Adam。

8.根据权利要求2所述的装置，其特征在于，还包括：

初始遗传病识别模型更新模块，与所述模型训练模块相连接，用于基于人脸数据集对初始遗传病识别模型进行预训练，将预训练完成的初始遗传病识别模型发送至所述模型训练模块。

9.根据权利要求1所述的装置，其特征在于，所述目标遗传病识别模型基于EfficientNet构建或基于ResNeSt269、EfficientNet-B7以及EfficientNet-B8中的至少两个模型加权融合确定。

10.一种遗传病面部识别方法，其特征在于，包括：