CN106682628B

CN106682628B - 一种基于多层深度特征信息的人脸属性分类方法

Info

Publication number: CN106682628B
Application number: CN201611251749.9A
Authority: CN
Inventors: 丁保剑; 冯琰一; 王洋
Original assignee: PCI Suntek Technology Co Ltd
Current assignee: PCI Technology Group Co Ltd
Priority date: 2016-12-30
Filing date: 2016-12-30
Publication date: 2020-01-10
Anticipated expiration: 2036-12-30
Also published as: CN106682628A

Abstract

本发明公开了一种基于多层深度特征信息的人脸属性分类方法，具体步骤如下：S1：假设x是任意角度的人脸图像，S2：使用局部特征区域提取算法将原始图像变换为局部信息，S3：使用多层特征提取算法来提取多层特征信息，S4：利用多特征融合算法来自适应融合多维度的信息。本发明提供了一种基于多层深度信息的人脸属性分类技术，该方法可以有效识别人脸图像中人的属性，从而实现智能视频监控和智能判断，该方法使用深度学习的方法对人脸属性样本进行训练，网络模型分为公共卷积层，特征提取层以及属性分类层。在特征提取层中，连接多层特征，融合多个尺度的信息，有助于提取更加有区分能力的特征。

Description

一种基于多层深度特征信息的人脸属性分类方法

技术领域

本发明涉及计算机视觉技术领域，具体为一种基于多层深度特征信息的人脸属性分类方法。

背景技术

智能视频监控以数字化、网络化视频监控为基础，但又有别于一般的网络化视频监控，它是一种更高端的视频监控应用。智能视频监控系统能够识别不同的物体。发现监控画面中的异常情况，并能以最快和最佳的方式发出警报和提供有用信息，从而能够更加有效地协助安全人员处理危机，并最大限度地降低误报和漏报现象。智能视频监控中的人脸属性分析则是实现这一环节的关键技术。目前比较常用的人脸属性分析方法大致分为两类，一种是使用传统特征提取方法来提取特征，如hog、sift等，再连接分类器进行属性分类。另外一种是使用深度学习的方法来进行属性分类。

由于常见的方法所得到的效果尚不可进行实际应用，业界亟待一种能够准确地分析人脸的属性，并能够应用到实际场景中的具体方法。

发明内容

本发明的目的在于提供一种基于多层深度特征信息的人脸属性分类方法，具体步骤如下：

S1：x是任意角度的人脸图像，y是正脸图像，寻找f使得f(x)＝y，这样构建多层f_i＝θ(w，x)，使得f成立，这里通过深度学习的方式来学习w参数，从而找到f函数，首先通过预处理正脸图像，旋转出不同角度的图像作为训练图像，而对应的正脸图像作为想要得到的结果，为了使得网络的输入和输出为同尺寸图像，特征层后面连接上采样层，损失函数使用L2 norm比较最后一个特征层和正脸图像，通过逐步迭代调优，使得最后一个特征层接近正脸图像，最后训练出来的网络就是要寻找的f，通过该函数就可以保证输入的人脸图像具有旋转不变性；

S2：使用局部特征区域提取算法将原始图像变换为局部信息，利用像素级分类方法，将整个人脸图像分为多个区域，首先预处理图像，标记出想要区分的部位作为真实局部区域，构建一个全卷积网络，对应尺寸的特征层有一个线性链接，可以在局部区域分类时使用多个尺寸信息，特征层后面连接上采样层，区分多个类型区域，得到整个图像的像素级分类，最终可以获取局部部位的区域，通过这个网络，就可以把原始图像转变为局部信息；

S3：使用多层特征提取算法来提取多层特征信息，构建一个特征提取块，提取块由3个卷积层构成，3个卷积层为同深度，构成一个宽度为3的层，称为提取块，卷积层参数分别为kernel size：1、pad：0、stride：1，kernel size：3、pad：1、stride：1以及kernel size：5、pad：2、stride：1，经过提取块计算后的特征尺度不变，叠加多个提取块，以获取不同感受野下的特征信息；

S4：利用多特征融合算法来自适应融合多维度的信息，x_i为特征i，每一个特征都有一个权值w_i对应，使得

为融合后的特征，使用深度学习的方式来学习权值w_i，通过L2 norm比较融合后的特征和正脸图像，通过如下函数更新权值，

在多特征提取层和L2 norm层加入以w_i为权值的层，融合多维特征，端到端地训练整个网络。

与现有技术相比，本发明的有益效果是：本发明提供了一种基于多层深度信息的人脸属性分类技术，该方法可以有效识别人脸图像中人的属性，从而实现智能视频监控和智能判断。该方法使用深度学习的方法对人脸属性样本进行训练，网络模型分为公共卷积层，特征提取层以及属性分类层。在特征提取层中，连接多层特征，融合多个尺度的信息，有助于提取更加有区分能力的特征。同时，在训练好公共卷积层后，使用逐层训练的方法，根据需要增加特征层的层数，直至所有属性达到最佳性能。

附图说明

图1为本发明步骤流程图；

图2为本发明算法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合具体实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例1

一种基于多层深度特征信息的人脸属性分类方法，具体步骤如下：

S3：使用多层特征提取算法来提取多层特征信息，构建一个特征提取块，提取块由3个卷积层构成，3个卷积层为同深度，构成一个宽度为3的层，称为提取块，如图1所示，卷积层参数分别为kernel size：1、pad：0、stride：1，kernel size：3、pad：1、stride：1以及kernel size：5、pad：2、stride：1，经过提取块计算后的特征尺度不变，叠加多个提取块，以获取不同感受野下的特征信息；

本发明分为训练阶段和部署阶段。

训练阶段详细说明：

1、人脸属性信息处理流程：

第一步，获取人脸正脸图像，使用仿射变换获取不同角度的人脸图像，得到正脸对应多角度的人脸的图像队列。

第二步，对正脸图像进行像素级的分类标注，得到正脸图像的标注队列。

第三步，对属性进行均衡化处理，得到属性标签队列。

2、人脸深度特征处理流程：

第一步，使用上述第一步得到的图像队列，训练角度校正模型的参数，模型收敛后，将损失层移除，最后一层输出后将值从[-1，1]变换至[0，255]。保存训练后的模型参数。

第二步，使用上述第二步得到的标注队列，训练局部特征提取模型的参数，模型收敛后，将损失层移除，对最后一层特征的每个像素进行分类。分类结果保存为mark矩阵，保存局部特征模型的参数。

3、基于深度特征的人脸属性分析流程：

第一步，连接多层特征提取层、特征融合层以及属性分类损失层，使用均衡化后的属性标签同时训练整个模型。

第二步，重复调整特征提取层，使得各个属性达到最优的性能。保存训练后的特征提取模型、特征融合模型以及属性分类层的参数。

部署阶段详细说明：

本发明输入数据为包含人脸的图像，要求的格式为RGB。

输出的结果为属性分类序列，一张人脸图像对应一个属性分类序列，包含所有属性的分类结果。

人脸属性分类流程：

第一步，加载在训练阶段保存的模型参数。

第二步，输入图像，通过角度校正算法将输入图像校正为正脸图像。

第三步，将输出的正脸图像输入局部特征提取算法，得到图像的局部信息矩阵。同时将正脸图像输入到公共卷积层，提取公共特征。

第四步，使用步骤三得到局部信息，将图像分为各个局部区域。

第五步，使用特征提取层对局部区域进行深度特征提取，得到多维特征。

第六步，使用多维特征融合算法融合多维特征，输入至属性分类层，得到属性分类结果。

第七步，属性分类结束。

本发明提供了一种基于多层深度信息的人脸属性分类技术，该方法可以有效识别人脸图像中人的属性，从而实现智能视频监控和智能判断。该方法使用深度学习的方法对人脸属性样本进行训练，网络模型分为公共卷积层，特征提取层以及属性分类层。在特征提取层中，连接多层特征，融合多个尺度的信息，有助于提取更加有区分能力的特征。同时，在训练好公共卷积层后，使用逐层训练的方法，根据需要增加特征层的层数，直至所有属性达到最佳性能。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于多层深度特征信息的人脸属性分类方法，其特征在于：具体步骤如下：