CN110399812A - 人脸特征智能提取方法、装置及计算机可读存储介质 - Google Patents
人脸特征智能提取方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110399812A CN110399812A CN201910613842.7A CN201910613842A CN110399812A CN 110399812 A CN110399812 A CN 110399812A CN 201910613842 A CN201910613842 A CN 201910613842A CN 110399812 A CN110399812 A CN 110399812A
- Authority
- CN
- China
- Prior art keywords
- key point
- face
- region
- sample collection
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种人工智能技术,揭露了一种人脸特征智能提取方法,包括:接收图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作;接收预处理完成的图像集,并基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并输入至所述卷积神经网络模型训练;直至损失值小于阈值时,所述卷积神经网络模型退出训练;接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。本发明还提出一种人脸特征智能提取装置以及一种计算机可读存储介质。本发明可以实现精准的人脸特征智能提取功能。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种人脸特征智能提取方法、装置及计算机可读存储介质。
背景技术
人脸表情在人们日常交往中有非常重要的作用,是非语言交流的一种重要方式。表情含有丰富的情感信息,是计算机理解人类情感的前提。想要实现自然和谐的人际交互,使计算机能够更好地为人类服务,人脸及表情的识别是需要重点研究的方向之一。然而,对于人脸特征的精确识别还存有很多问题,如应用场景多数比较复杂,背景的局部动态变化、光照不均所造成目标阴影等会对识别增加难度,另外,人脸是非刚性目标,拥有丰富的姿态特征,同一人脸所处的不同的姿态,在检测和识别中往往差别很大。目前,市场上很多厂商还在使用传统的人脸特征点的提取算法,这些算法虽然模型简单直接,但是其近似于穷举搜索的关键点定位方式在很大程度上限制了运算效率。
发明内容
本发明提供一种人脸特征智能提取方法、装置及计算机可读存储介质,其主要目的在于当用户输入人脸图片时,给用户呈现出人脸特征智能提取结果。
为实现上述目的,本发明提供的一种人脸特征智能提取方法,包括:
数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层;
数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述处理完成的正样本集输入至所述卷积神经网络模型;
所述卷积神经网络模型接收所述负样本集与所述处理完成的正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;
接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
可选地,所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸;
所述灰度化操作为:
灰阶值=0.30*R+0.59*G+0.11*B
其中,R、G、B为所述图像集内数据的RGB三种像素值。
可选地,基于Canny边缘检测法标记出人脸区域,包括寻找所述正样本集图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域;
所述基于区域增长法标记出人脸轮廓关键点,包括从所述人脸区域的上下左右四个子区域中各任选一个像素点,得到4个像素点组成种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
可选地,所述基于梯度方向直方运算和支持向量机模型提取所述人脸区域的人脸内部关键点,包括:
计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵;
将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型;
所述支持向量机模型根据约束方程标记人脸内部关键点,所述约束方程为:
其中,αi≥0,i=1,2,...m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
可选地,所述激活函数为Softmax函数,所述损失函数为最小二乘函数;
所述Softmax函数为:
其中,Oj表示所述卷积神经网络输出层第j个神经元的人脸关键点输出值,Ij表示所述卷积神经网络输出层第j个神经元的输入值,t表示所述输出层神经元的总量,e为无限不循环小数;
所述最小二乘法L(s)为:
其中,s为所述预测的人脸轮廓及内部关键点和所述人脸轮廓关键点与人脸内部关键点的误差值,k为所述图像集的数量,yi为所述人脸轮廓关键点与人脸内部关键点,y′i为所述预测的人脸轮廓及内部关键点。
此外,为实现上述目的,本发明还提供一种人脸特征智能提取装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的人脸特征智能提取程序,所述人脸特征智能提取程序被所述处理器执行时实现如下步骤:
数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层;
数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述正样本集输入至所述卷积神经网络模型;
所述卷积神经网络模型接收所述负样本集与正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;
接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
可选地,所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸;
所述灰度化操作为:
灰阶值=0.30*R+0.59*G+0.11*B
其中,R、G、B为所述图像集内数据的RGB三种像素值。
可选地,所述基于Canny边缘检测法标记出人脸区域,包括寻找所述正样本集图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域;
所述基于区域增长法标记出人脸轮廓关键点,包括从所述人脸区域的上下左右四个子区域中各任选一个像素点,得到4个像素点为种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
可选地,所述基于梯度方向直方运算和支持向量机模型提取所述人脸区域的人脸内部关键点,包括:
计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵;
将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型;
所述支持向量机模型根据约束方程标记人脸内部关键点,所述约束方程为:
其中,αi≥0,i=1,2,...m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸特征智能提取程序,所述人脸特征智能提取程序可被一个或者多个处理器执行,以实现如上所述的人脸特征智能提取方法的步骤。
本发明提出的人脸特征智能提取方法、装置及计算机可读存储介质,接收包括正样本集与负样本集的图像集;所述正样本集标记出人脸区域、人脸轮廓关键点、人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,所述卷积神经网络模型接收所述负样本集与所述处理完成的正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。本发明使用深度学习算法,准确率和效率更优异,因此本发明可以实现精准的人脸特征智能提取功能。
附图说明
图1为本发明一实施例提供的人脸特征智能提取方法的流程示意图;
图2为本发明一实施例提供的人脸特征智能提取装置的内部结构示意图;
图3为本发明一实施例提供的人脸特征智能提取装置中人脸特征智能提取程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种人脸特征智能提取方法。参照图1所示,为本发明一实施例提供的人脸特征智能提取方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,人脸特征智能提取方法包括:
S1、数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层。
本发明较佳实施例所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸。
本发明较佳实施例所述灰度化操作是将所述正样本集和所述负样本内的数据从RGB格式转为灰阶格式,所述转换方法为:
获取所述正样本集和所述负样本内数据的R、G、B像素值;
利用下述公式将所述R、G、B像素值转换为灰阶值:
灰阶值=0.30*R+0.59*G+0.11*B
所述降噪操作是基于自适应图像降噪滤波法对所述灰阶值进行降噪处理,所述自适应图像降噪滤波法为:
g(x,y)=η(x,y)+f(x,y)
其中,(x,y)表示图像像素点坐标,f(x,y)为基于自适应图像降噪滤波法对所述灰阶值进行降噪处理后的输出数据,η(x,y)为噪声,g(x,y)为所述灰阶值数据,为所述灰阶值数据的噪声总方差,为所述(x,y)的像素灰度均值,为所述(x,y)的像素灰度方差,L表示当前像素点坐标。
所述矫正操作是基于矩阵定位法矫正倾斜人脸,所述矩阵定位法是在倾斜的人脸图像中标记四个点,并根据变换矩阵转换为不倾斜的人脸图像。
S2、数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述处理完成的正样本集输入至所述卷积神经网络模型。
本发明较佳实施例中,所述Canny边缘检测法包括寻找图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域。
本发明较佳实施例中,所述区域增长法包括从所述人脸区域的上下左右的四个子区域中各任选一个像素点,得到4个像素点组成种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
本发明较佳实施例中,所述梯度方向直方运算包括计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵,并将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加,得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型。所述支持向量机模型根据约束方程标记人脸内部关键点。其中,所述约束方程为:
其中,αi≥0,i=1,2,...m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
S3、所述卷积神经网络模型接收所述负样本集与所述处理完成的正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练。
本发明较佳实施例中,所述卷积神经网络模型包括输入层、卷积层、池化层、全连接层和输出层,所述输入层接收所述负样本集与所述处理完成的正样本集,所述卷积层、池化层、全连接层结合所述激活函数预测人脸轮廓及内部关键点并通过输出层输出。
本发明较佳实施例选择激活函数为Softmax函数,所述损失函数为最小二乘函数。所述所述Softmax函数为:
其中,Oj表示所述卷积神经网络输出层第j个神经元的人脸关键点输出值,Ij表示所述卷积神经网络输出层第j个神经元的输入值,t表示所述输出层神经元的总量,e为无限不循环小数;
所述最小二乘法L(s)为:
其中,s为所述预测的人脸轮廓及内部关键点和所述人脸轮廓关键点与人脸内部关键点的误差值,k为所述图像集的数量,yi为所述人脸轮廓关键点与人脸内部关键点,y′i为所述预测的人脸轮廓及内部关键点。
S4、接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点并输出结果。
发明还提供一种人脸特征智能提取装置。参照图2所示,为本发明一实施例提供的人脸特征智能提取装置的内部结构示意图。
在本实施例中,所述人脸特征智能提取装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该人脸特征智能提取装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是人脸特征智能提取装置1的内部存储单元,例如该人脸特征智能提取装置1的硬盘。存储器11在另一些实施例中也可以是人脸特征智能提取装置1的外部存储设备,例如人脸特征智能提取装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括人脸特征智能提取装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于人脸特征智能提取装置1的应用软件及各类数据,例如人脸特征智能提取程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行人脸特征智能提取程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在人脸特征智能提取装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及人脸特征智能提取程序01的人脸特征智能提取装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对人脸特征智能提取装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有人脸特征智能提取程序01;处理器12执行存储器11中存储的人脸特征智能提取程序01时实现如下步骤:
步骤一、数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层。
本发明较佳实施例所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸。
本发明较佳实施例所述灰度化操作是将所述正样本集和所述负样本内的数据从RGB格式转为灰阶格式,所述转换方法为:
获取所述正样本集和所述负样本内数据的R、G、B像素值;
利用下述公式将所述R、G、B像素值转换为灰阶值:
灰阶值=0.30*R+0.59*G+0.11*B
所述降噪操作是基于自适应图像降噪滤波法对所述灰阶值进行降噪处理,所述自适应图像降噪滤波法为:
g(x,y)=η(x,y)+f(x,y)
其中,(x,y)表示图像像素点坐标,f(x,y)为基于自适应图像降噪滤波法对所述灰阶值进行降噪处理后的输出数据,η(x,y)为噪声,g(x,y)为所述灰阶值数据,为所述灰阶值数据的噪声总方差,为所述(x,y)的像素灰度均值,为所述(x,y)的像素灰度方差,L表示当前像素点坐标。
所述矫正操作是基于矩阵定位法矫正倾斜人脸,所述矩阵定位法是在倾斜的人脸图像中标记四个点,并根据变换矩阵转换为不倾斜的人脸图像。
步骤二、数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述处理完成的正样本集输入至所述卷积神经网络模型。
本发明较佳实施例中,所述Canny边缘检测法包括寻找图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域。
本发明较佳实施例中,所述区域增长法选取包括所述人脸区域的上下左右四个子区域中各任选一个像素点,得到4个像素点为种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
本发明较佳实施例中,所述梯度方向直方运算是计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵,并将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加,得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型。所述支持向量机模型根据约束方程标记人脸内部关键点。其中,所述约束方程为:
其中,αi≥0,i=1,2,...m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
步骤三、所述卷积神经网络模型接收所述负样本集与所述处理完成的正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练。
本发明较佳实施例中,所述卷积神经网络模型包括输入层、卷积层、池化层、全连接层和输出层,所述输入层接收所述负样本集与所述处理完成的正样本集,所述卷积层、池化层、全连接层结合所述激活函数预测人脸轮廓及内部关键点并通过输出层输出。
本发明较佳实施例选择激活函数为Softmax函数,所述损失函数为最小二乘函数。所述所述Softmax函数为:
其中,Oj表示所述卷积神经网络输出层第j个神经元的人脸关键点输出值,Ij表示所述卷积神经网络输出层第j个神经元的输入值,t表示所述输出层神经元的总量,e为无限不循环小数;
所述最小二乘法L(s)为:
其中,s为所述预测的人脸轮廓及内部关键点和所述人脸轮廓关键点与人脸内部关键点的误差值,k为所述图像集的数量,yi为所述人脸轮廓关键点与人脸内部关键点,y′i为所述预测的人脸轮廓及内部关键点。
步骤四、接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点并输出结果。
可选地,在其他实施例中,人脸特征智能提取程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述人脸特征智能提取程序在人脸特征智能提取装置中的执行过程。
例如,参照图3所示,为本发明人脸特征智能提取装置一实施例中的人脸特征智能提取程序的程序模块示意图,该实施例中,所述人脸特征智能提取程序可以被分割为数据接收模块10、数据处理模块20、模型训练模块30、人脸特征输出模块40,示例性地:
所述数据接收模块10用于:接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层。
所述数据处理模块20用于:接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述正样本集输入至所述卷积神经网络模型。
所述模型训练模块30用于:所述卷积神经网络模型接收所述负样本集与所述正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练。
所述人脸特征输出模块40用于:接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
上述数据接收模块10、数据处理模块20、模型训练模块30、人脸特征输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸特征智能提取程序,所述人脸特征智能提取程序可被一个或多个处理器执行,以实现如下操作:
接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层;
接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述处理完成的正样本集输入至所述卷积神经网络模型;
所述卷积神经网络模型接收所述负样本集与所述处理完成的正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;
接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
本发明计算机可读存储介质具体实施方式与上述人脸特征智能提取装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种人脸特征智能提取方法,其特征在于,所述方法包括:
数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层;
数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述正样本集输入至所述卷积神经网络模型;
所述卷积神经网络模型接收所述负样本集与所述正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;
接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
2.如权利要求1所述的人脸特征智能提取方法,其特征在于,所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸;
所述灰度化操作为:
灰阶值=0.30*R+0.59*G+0.11*B
其中,R、G、B为所述图像集内数据的三种像素值。
3.如权利要求1所述的人脸特征智能提取方法,其特征在于,所述基于Canny边缘检测法标记出人脸区域,包括寻找所述正样本集图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域;
所述基于区域增长法标记出人脸轮廓关键点,包括从所述人脸区域的上下左右四个子区域中各任选一个像素点,得到4个像素点组成种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
4.如权利要求3中的人脸特征智能提取方法,其特征在于,所述基于梯度方向直方运算和支持向量机模型提取所述人脸区域的人脸内部关键点,包括:
计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵;
将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型;
所述支持向量机模型根据约束方程标记人脸内部关键点,所述约束方程为:
其中,αi≥0,i=1,2,…m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
5.如权利要求1所述的人脸特征智能提取方法,其特征在于,所述激活函数为Softmax函数,所述损失函数为最小二乘函数;
所述Softmax函数为:
其中,Oj表示所述卷积神经网络输出层第j个神经元的人脸关键点输出值,Ij表示所述卷积神经网络输出层第j个神经元的输入值,t表示所述输出层神经元的总量,e为无限不循环小数;
所述最小二乘法L(s)为:
其中,s为所述预测的人脸轮廓及内部关键点和所述人脸轮廓关键点与人脸内部关键点的误差值,k为所述图像集的数量,yi为所述人脸轮廓关键点与人脸内部关键点,y′i为所述预测的人脸轮廓及内部关键点。
6.一种人脸特征智能提取装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的人脸特征智能提取程序,所述人脸特征智能提取程序被所述处理器执行时实现如下步骤:
数据接收层接收包括正样本集与负样本集的图像集,对所述图像集进行包括灰度化、降噪与矫正的预处理操作后输入至数据处理层;
数据处理层接收预处理完成的图像集,将所述负样本集输入至卷积神经网络模型,将所述正样本集基于Canny边缘检测法标记出人脸区域,基于区域增长法标记出人脸轮廓关键点,基于梯度方向直方运算和支持向量机模型标记所述人脸区域的人脸内部关键点,并将所述人脸区域、人脸轮廓关键点和人脸内部关键点组成标签集,将所述标签集和所述正样本集输入至所述卷积神经网络模型;
所述卷积神经网络模型接收所述负样本集与所述正样本集并训练,基于激活函数输出预测的人脸轮廓关键点及人脸内部关键点,并组成输出集,将所述输出集和所述标签集输入至损失函数计算出损失值,当所述损失值小于阈值时,所述卷积神经网络模型退出训练;
接收用户的测试图像集,利用所述卷积神经网络模型计算所述测试图像集的人脸轮廓和内部关键点,并输出结果。
7.如权利要求1所述的人脸特征智能提取装置,其特征在于,所述正样本集内的数据都包括人脸,所述负样本集内的数据都不包括人脸;
所述灰度化操作为:
灰阶值=0.30*R+0.59*G+0.11*B
其中,R、G、B为所述图像集内数据的RGB三种像素值。
8.如权利要求1或2所述的人脸特征智能提取装置,其特征在于,所述基于Canny边缘检测法标记出人脸区域,包括寻找所述正样本集图片中的像素灰度有阶跃变化的像素点,从而标记出所述人脸区域;
所述基于区域增长法标记出人脸轮廓关键点,包括从所述人脸区域的上下左右四个子区域中各任选一个像素点,得到4个像素点组成种子点,并计算所述每个种子点上下左右的像素与所述每个种子点的像素差,选择所述像素差绝对值小于预设门限T的像素,并和对应种子点组成种子点区域,所述种子点区域即为所述人脸轮廓关键点。
9.如权利要求1所述的人脸特征智能提取装置,其特征在于,所述基于梯度方向直方运算和支持向量机模型提取所述人脸区域的人脸内部关键点,包括:
计算所述人脸区域内各像素点的梯度幅值和梯度方向值,并将所述梯度幅值作为第一分量,所述梯度方向值作为第二分量形成梯度矩阵;
将所述梯度矩阵内数据划分为多个小块,将各小块的梯度幅值与梯度方向值相加得到和值,并将所述和值串联形成梯度方向直方特征输入至支持向量机模型;
所述支持向量机模型根据约束方程标记人脸内部关键点,所述约束方程为:
其中,αi≥0,i=1,2,…m
其中,m为所述梯度方向直方特征的数量,xi、xj表示梯度方向直方特征,αi,αj为所述约束求解的拉格朗日数乘因子,yi,yj为所述梯度方向直方特征的梯度,s.t为约束条件。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有人脸特征智能提取程序,所述人脸特征智能提取程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的人脸特征智能提取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910613842.7A CN110399812B (zh) | 2019-07-08 | 2019-07-08 | 人脸特征智能提取方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910613842.7A CN110399812B (zh) | 2019-07-08 | 2019-07-08 | 人脸特征智能提取方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110399812A true CN110399812A (zh) | 2019-11-01 |
CN110399812B CN110399812B (zh) | 2023-05-30 |
Family
ID=68322880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910613842.7A Active CN110399812B (zh) | 2019-07-08 | 2019-07-08 | 人脸特征智能提取方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110399812B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144368A (zh) * | 2019-12-31 | 2020-05-12 | 重庆和贯科技有限公司 | 基于长短时记忆神经网络的学生行为检测方法 |
CN111339064A (zh) * | 2020-03-03 | 2020-06-26 | 中国平安人寿保险股份有限公司 | 数据倾斜矫正方法、装置及计算机可读存储介质 |
CN113052369A (zh) * | 2021-03-15 | 2021-06-29 | 北京农业智能装备技术研究中心 | 智能农机作业管理方法及系统 |
CN114943989A (zh) * | 2022-06-17 | 2022-08-26 | 平安科技(深圳)有限公司 | 基于人工智能的狗脸关键点检测方法及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007272435A (ja) * | 2006-03-30 | 2007-10-18 | Univ Of Electro-Communications | 顔特徴抽出装置及び顔特徴抽出方法 |
US20160283780A1 (en) * | 2015-03-25 | 2016-09-29 | Alibaba Group Holding Limited | Positioning feature points of human face edge |
CN107633209A (zh) * | 2017-08-17 | 2018-01-26 | 平安科技(深圳)有限公司 | 电子装置、动态视频人脸识别的方法及存储介质 |
CN108257194A (zh) * | 2018-01-23 | 2018-07-06 | 哈尔滨工程大学 | 基于卷积神经网络的人脸简笔画生成方法 |
US20190065906A1 (en) * | 2017-08-25 | 2019-02-28 | Baidu Online Network Technology (Beijing) Co., Ltd . | Method and apparatus for building human face recognition model, device and computer storage medium |
CN109543629A (zh) * | 2018-11-26 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种眨眼识别方法、装置、设备及可读存储介质 |
-
2019
- 2019-07-08 CN CN201910613842.7A patent/CN110399812B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007272435A (ja) * | 2006-03-30 | 2007-10-18 | Univ Of Electro-Communications | 顔特徴抽出装置及び顔特徴抽出方法 |
US20160283780A1 (en) * | 2015-03-25 | 2016-09-29 | Alibaba Group Holding Limited | Positioning feature points of human face edge |
CN107633209A (zh) * | 2017-08-17 | 2018-01-26 | 平安科技(深圳)有限公司 | 电子装置、动态视频人脸识别的方法及存储介质 |
US20190065906A1 (en) * | 2017-08-25 | 2019-02-28 | Baidu Online Network Technology (Beijing) Co., Ltd . | Method and apparatus for building human face recognition model, device and computer storage medium |
CN108257194A (zh) * | 2018-01-23 | 2018-07-06 | 哈尔滨工程大学 | 基于卷积神经网络的人脸简笔画生成方法 |
CN109543629A (zh) * | 2018-11-26 | 2019-03-29 | 平安科技(深圳)有限公司 | 一种眨眼识别方法、装置、设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
戴诗琪等: "基于深度学习的疲劳驾驶检测算法", 《计算机系统应用》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144368A (zh) * | 2019-12-31 | 2020-05-12 | 重庆和贯科技有限公司 | 基于长短时记忆神经网络的学生行为检测方法 |
CN111339064A (zh) * | 2020-03-03 | 2020-06-26 | 中国平安人寿保险股份有限公司 | 数据倾斜矫正方法、装置及计算机可读存储介质 |
CN113052369A (zh) * | 2021-03-15 | 2021-06-29 | 北京农业智能装备技术研究中心 | 智能农机作业管理方法及系统 |
CN113052369B (zh) * | 2021-03-15 | 2024-05-10 | 北京农业智能装备技术研究中心 | 智能农机作业管理方法及系统 |
CN114943989A (zh) * | 2022-06-17 | 2022-08-26 | 平安科技(深圳)有限公司 | 基于人工智能的狗脸关键点检测方法及相关设备 |
CN114943989B (zh) * | 2022-06-17 | 2024-06-28 | 平安科技(深圳)有限公司 | 基于人工智能的狗脸关键点检测方法及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110399812B (zh) | 2023-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399812A (zh) | 人脸特征智能提取方法、装置及计算机可读存储介质 | |
CN107633204B (zh) | 人脸遮挡检测方法、装置及存储介质 | |
CN109637664A (zh) | 一种bmi评测方法、装置及计算机可读存储介质 | |
CN109492612A (zh) | 基于骨骼点的跌倒检测方法及其跌倒检测装置 | |
CN110516705A (zh) | 基于深度学习的目标跟踪方法、装置及计算机可读存储介质 | |
CN112651438A (zh) | 多类别图像的分类方法、装置、终端设备和存储介质 | |
CN107679447A (zh) | 面部特征点检测方法、装置及存储介质 | |
CN107679475B (zh) | 门店监控评价方法、装置及存储介质 | |
CN110163884B (zh) | 一种基于全连接深度学习神经网络的单个图像分割方法 | |
CN113705461B (zh) | 人脸清晰度检测方法、装置、设备及存储介质 | |
CN110363747A (zh) | 智能化异常细胞判断方法、装置及计算机可读存储介质 | |
CN109460774A (zh) | 一种基于改进的卷积神经网络的鸟类识别方法 | |
CN109711399A (zh) | 基于图像的店铺识别方法、装置,电子设备 | |
CN113610934B (zh) | 图像亮度调整方法、装置、设备及存储介质 | |
CN109920018A (zh) | 基于神经网络的黑白照片色彩恢复方法、装置及存储介质 | |
CN110415212A (zh) | 异常细胞检测方法、装置及计算机可读存储介质 | |
CN110335206B (zh) | 智能滤镜方法、装置及计算机可读存储介质 | |
CN112419326B (zh) | 图像分割数据处理方法、装置、设备及存储介质 | |
CN110008997A (zh) | 图像纹理相似度识别方法、装置及计算机可读存储介质 | |
CN110135889A (zh) | 智能推荐书单的方法、服务器及存储介质 | |
CN110135421A (zh) | 车牌识别方法、装置、计算机设备及计算机可读存储介质 | |
CN109598249A (zh) | 服饰检测方法和装置、电子设备、存储介质 | |
CN109871751A (zh) | 基于人脸表情识别的服务态度评估方法、装置及存储介质 | |
CN112651333A (zh) | 静默活体检测方法、装置、终端设备和存储介质 | |
CN115223239B (zh) | 一种手势识别方法、系统、计算机设备以及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |