CN109117817A - 人脸识别的方法及装置 - Google Patents
人脸识别的方法及装置 Download PDFInfo
- Publication number
- CN109117817A CN109117817A CN201810991582.2A CN201810991582A CN109117817A CN 109117817 A CN109117817 A CN 109117817A CN 201810991582 A CN201810991582 A CN 201810991582A CN 109117817 A CN109117817 A CN 109117817A
- Authority
- CN
- China
- Prior art keywords
- input
- deep learning
- classifier
- learning model
- constructing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种人脸识别的方法及装置,包括:获取人脸图像信息和识别环境信息;将人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;将人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;比较人脸图像阈值与预设阈值的大小,得到比较结果;根据比较结果输出识别结果;根据识别环境信息更新分类器。所以,只需要根据识别环境信息更新分类器就可以较大程度地避免识别环境改变带来的不利影响,无需重新训练深度学习模型。基于此,在多变的环境中,本申请的技术方案的可以更快地适配新的识别环境。
Description
技术领域
本申请设计生物特征识别技术领域,尤其涉及一种人脸识别的方法及装置。
背景技术
在当今信息化时代,如何准确鉴定一个人的身份、保护信息安全,已成为一个必须解决的关键社会问题。传统的身份认证由于极易伪造和丢失,越来越难以满足社会的需求,目前最为便捷与安全的解决方案无疑就是生物特征识别技术。
其中,人脸识别技术就是一种生物特征识别技术。现有技术中,一般通过训练的深度神经网络系统对人脸进行识别,而针对多变的识别环境,比如煤码头环境,为了提高识别的准确性,往往会依据环境的变化重新训练特定的深度神经网络系统,多变的环境中,环境的变化往往比较频繁,这就对训练深度神经网络系统的时间有一定的要求,要求较快的训练速度,但是,深度神经网络一般包含有大量的学习参数,训练深度神经网络系统的代价较为昂贵,在较短时间内完成训练有一定的困难,难以在短时间内适配改变后的新的识别环境。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种人脸识别的方法及装置。
根据本申请实施例的第一方面,提供一种人脸识别的方法,包括:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
可选的,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
可选的,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
根据本申请实施例的第二方面,提供一种人脸识别的装置,包括:
获取模块,用于获取人脸图像信息和识别环境信息;
第一输入模块,用于将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
第二输入模块,用于将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较模块,用于比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
输出模块,用于根据所述比较结果输出识别结果;
更新模块,用于根据所述识别环境信息更新所述分类器。
可选的,还包括:
第一构建模块,用于构建所述深度学习模型的结构;
第二构建模块,用于构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
第一训练模块,用于根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述第一构建模块包括:
第一构建单元,用于构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
第二构建单元,用于构建最大池化层;
第三构建单元,用于构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
第四构建单元,用于构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,还包括:
第三构建模块,用于构建分类算法;
第三输入模块,用于将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
第四输入模块,用于将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存模块,用于保存所述分类算法参数,进而形成所述分类器。
可选的,所述第三构建模块包括:
第五构建单元,用于构建原问题;
转换单元,用于将所述原问题转化为拉格朗日形式;
设置单元,用于设置核函数。
根据本申请实施例的第三方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种人脸识别的方法,所述方法包括:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
可选的,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
可选的,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
根据本申请实施例的第四方面,提供一种人脸识别的装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
可选的,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
可选的,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
本申请提供的技术方案可以包括以下有益效果:在获取到人脸图像信息和识别环境信息后,将人脸图像信息输入到深度学习模型中,得到人脸特征向量,然后将人脸特征向量输入到分类其中得到人脸图像阈值,在比较人脸图像阈值和预设阈值的大小后,得到比较结果,根据比较结果输出识别结果,然后根据识别环境信息更新分类器。由于在本申请中负责提取人脸特征向量的深度学习模型和计算人脸图像阈值的分类器是两个部分,在构建和训练时便可以单独构建和训练,而识别环境发生的变化对提取人脸特征向量的过程的影响较低,所以,只需要根据识别环境信息更新分类器就可以较大程度地避免识别环境改变带来的不利影响,无需重新训练深度学习模型。基于此,在多变的环境中,本申请的技术方案的可以更快地适配新的识别环境。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请的一个实施例示出的一种人脸识别的方法的流程图。
图2是本申请的一个实施例示出的深度学习模型构建和训练的流程图。
图3是本申请的一个实施例示出的一种神学习模型的构建流程图。
图4是本申请的一个实施例示出的一种分类器构建和训练的流程图
图5是本申请的另一个实施例示出的一种人脸识别装置结构示意图。
图6是本申请的另一个实施例示出的一种人脸识别装置结构示意图。
图7是本申请的另一个实施例示出的一种第一构建模块的结构示意图。
图8是本申请的另一个实施例示出的一种人脸识别装置结构示意图。
图9是本申请的另一个实施例示出的一种第三构建模块的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是本申请的一个实施例示出的一种人脸识别的方法的流程图,如图1 所示,人脸识别的方法用于终端中,包括以下步骤。
步骤11、获取人脸图像信息和识别环境信息;
步骤12、将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
步骤13、将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
步骤14、比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
步骤15、根据所述比较结果输出识别结果;
步骤16、根据所述识别环境信息更新所述分类器。
由于在获取到人脸图像信息和识别环境信息后,将人脸图像信息输入到深度学习模型中,得到人脸特征向量,然后将人脸特征向量输入到分类其中得到人脸图像阈值,在比较人脸图像阈值和预设阈值的大小后,得到比较结果,根据比较结果输出识别结果,然后根据识别环境信息更新分类器。由于在本申请中负责提取人脸特征向量的深度学习模型和计算人脸图像阈值的分类器是两个部分,在构建和训练时便可以单独构建和训练,而识别环境发生的变化对提取人脸特征向量的过程的影响较低,所以,只需要根据识别环境信息更新分类器就可以较大程度地避免识别环境改变带来的不利影响,无需重新训练深度学习模型。基于此,在多变的环境中,本申请的技术方案的可以更快地适配新的识别环境。
在步骤11中,获取获取人脸图像信息和识别环境信息的方法可以为多种,比如,可以先调用函数opencv启动摄像头,利用摄像头采集上述原始信息,同时还可以将上述原始信息转换为可处理的图像数据矩阵,然后调用函数dlib 对图像数据矩阵进行处理,处理过程可以包括:
对图像数据矩阵进行灰度化处理。由于dlib函数不能对彩色图像进行人脸检测,所以需要对opencv采集到的人脸原始图像进行灰度化,以便dlib对人脸进行检测。
对图像数据矩阵进行插值处理。实际应用场景当中采集到的信息并不一定满足后续裁剪的要求,当不满足裁剪要求时,需要由主函数对获取到的图像进行插值处理,尽可能恢复图像信息,以便后续的人脸检测,插值后的图像也需要进行灰度化。
裁剪人脸图像,根据dlib给出的boundingbox位置信息对插值以及灰度化后的图像进行裁剪,形成能够输入深度学习模型的便于识别的人脸图像信息。
另外,为了保证识别时的精度和处理速度,同时便于应对多变的识别环境,本方案可以对opencv采集到的数据进行如下处理:
其中x表示输入的图形数据矩阵,E(x)表示对图形进行均值化。Std表示数据标准差,Xs表示输入图像矩阵的维度信息。
步骤14和步骤15中,比较结果可以为人脸图像阈值大于预设阈值或人脸图像阈值小于预设阈值。
当比较结果为人脸图像阈值大于预设阈值时,说明人脸图像阈值满足设定的要求,输出的识别结果便可以是与人脸图像信息对应的人的基本信息,基本信息可以包括:姓名、工号等;
当比较结果为人脸图像阈值小于预设阈值时,说明人脸图像阈值不满足设定的要求,则可以输出字符串“Who are you?”,以表示本地预先录入的数据中没有与人脸图像信息对应的人员信息。
另外,预设阈值可以由用户进行调整,以适应不同安全等级的应用场景。阈值的设定可以实现对安防场景严格性的控制,如果较为严格,可以设定较高的阈值。不过,如果训练样本集的照片数量相对较少,则不建议设置过高的阈值,以降低拒绝率。
进一步地,如图2所示,深度学习模型的构建和训练过程可以包括:
步骤21、构建所述深度学习模型的结构;
步骤22、构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
步骤23、根据网络数据库中的图像数据对所述深度学习模型进行训练。
在步骤22中,由于人脸识别的损失函数与一般图像分类的损失函数存在区别,需要在一般交叉熵损失函数的基础上进行修改。人脸识别的特殊性,使得如果只采用单一交叉熵损作为监督训练过程的损失函数,训练出的深度神经网络将很难应对复杂环境变化,当表情、妆容、光照等环境发生变化时,极其容易导致识别失败,同时也极其不便于后续系统的迁移。因此,本实施例可以采用3个损失函数,结合交叉熵、三元以及中心损失的多损失函数作为监督深度学习模型训练的损失函数,具体如下:
其中上式第一部分为交叉熵部分,第二个内积部分为中心部分,第三个内积至最后部分为三元,表示属于i个训练样本的权值向量,由于本方案将人脸特征向量映射为512维高维空间,所以权值w的维度也为512维。xi表示经过特征变换的人脸特征向量,维度512。表示属于第i个分类的人脸特征中心,xi α为待优化的选中的特征向量,xi p为正确分类的特征向量,xi n为错误分类的特征向量,m为一个batch。xi、xi p等特征向量的维度相同。
其中,交叉熵是基础,三元和中心是辅助。训练时交叉熵首先负责将大部分的特征区别开。交叉熵下降到一定程度时,其作用就会减小,这时仍然存在部分样本的类内距离小于类间距离(也就是误判),这时中心损失就会起作用,中心损失负责缩小类内距离,增加类间距,也就是负责将属于同一个人脸的数据向该人脸数据的均值(中心点靠拢),增大区分度。随着时间的推进,中心损失优化之后,仍然存在部分点,这些点距离类中心的距离小于某个不属于该点所在类的样本点的距离,也就是仍然存在误判的风险。为了降低这种风险,就采用三元损失函数,减小这些点与类中心的距离,增加这些点与某个不属于该点所在类的最近的样本点间的距离,进一步增加区分度。单采用交叉熵和单采用三元是可以训练的,但是单采用中心损失是不行的。而采用交叉熵和中心损失是可以训练的,但是仍然是存在误判风险的,采用这种三元方式,是进一步降低风险,增加区分度,这样才能尽可能保证环境变化时只去训练svc而不用训练神经网络,因为神经网络已经具有较高的区分度,可以作为标准特征提取器来用了。单采用三元的训练,需要对三元组进行仔细筛选,这种筛选需要很多技巧,不仅计算量大,算法也可能不收敛,经过前两步处理之后,三元组的选择会简单,计算量也会减小,相对也就会在一定程度上提高训练速度。
在步骤23中,训练时,每经过一定的迭代次数,特征中心可以随之更新,更新量可以为:
其中δ为条件判断,如果满足条件则为1,否则为0,即在训练过程当中相当于计数器的作用。
进一步地,如图3所示,构建所述深度学习模型的结构,可以包括:
步骤31、构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
步骤32、构建最大池化层;
步骤33、构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
步骤34、构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
在步骤31中,本实施例的初层网络结构可以包括4层神经网络结构,均采用标准的卷积模式,为了保证连接,本实施例中的padding模式可以为 SAME,卷积步长可以为2。
在步骤32中,构建最大池化层,也就是说均采用最大池化层,放置特征提取信息模糊化,保证信息进度,提高特征提取效果。
在步骤33中,中间层网络结构可以包括:3个卷积层,以及中间结构。中间结构又可以包括:4个分支的卷积结构,其中3个分支是标准卷积连接,进行特征提取,另一个分支是残差连接,进行梯度信息回传,加速深度学习模型的收敛速度。其中,3个分支中的一个分支由3个卷积层构成,形成一个多通道卷积模块,3个分支产生的特征向量在深度上进行concat连接,连接后的特征向量再进行一个卷积运算,进行特征提取,提取后产生的特征向量与一个标量进行矩阵相乘操作,乘积结果与采用残差连接的分支相加,形成传向下一层的特征向量。
在步骤34中,为了便于人脸特征向量的线性可分,同时保证特征向量的表示结果或表示空间的丰富性及人脸特征可比性,以适应不同环境的变动,构建嵌入层,本实施例的嵌入层可以将深度学习系统的最后一层特征提取的人脸特征向量的维度变换为高维度,比如可以是512维度,即最终特征向量包括512个分量,并对嵌入层的特征向量做如下变换:
其中xi为深度特征提取之后的512维人脸特征向量,ε为大于0的数值,保证数值计算的稳定性。
进一步地,如图4所示,分类器的构建和训练过程包括:
步骤41、构建分类算法;
步骤42、将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
步骤43、将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
步骤44、保存所述分类算法参数,进而形成所述分类器。
在步骤41中,构建分类算法可以包括:
构建原问题:
St.
其中w是待训练的输入参数的权值向量,C为惩罚项的惩罚系数,为各项松弛因子,引入松弛因子的目的是允许支持向量,以一定的距离偏离决策边界,以防止人脸识别系统迁移时造成部分线性不可分问题。最终目标是训练参数w,C以及使得目标函数最小化。St后的方程表示约束项,约束项当中最核心的部分是核函数φ(xi),其中核函数的输入为xi,即经过图像特征提取的512维人脸特征向量。
将所述原问题转化成拉格朗日形式:
其中ri 均为松弛变量,上式的关键是核函数矩阵,或者说核函数变换,由于本方案设计的深度系统已经将人脸特征转化为512维高维空间向量,高维空间向量一般具有较好的线性可分性,因此,为了保证人脸的实时识别,同时保证svc训练的高效性,以应对煤码头500-1000类别的中型应用场景,本方案选择线性变换函数作为svc的特征变换基础。
设置核函数,为了便于识别系统的迁移即训练速度,将核函数的矩阵元素设置为:
Qij=yiyjK(xi,xj)K(xi,yj)=φ(xi)Tφ(xi)
其中y为取值为1或-1的n维向量,转换函数φ(xi)表示取512维人脸特征向量的内积,这种结构的svc分类器,能够在保证识别精度的同时,提升训练速度,适合应用于多变的识别环境。
图5是本申请的另一个实施例示出的一种人脸识别装置结构示意图。参照图5,该装置包括获取模块51、第一输入模块52、第二输入模块53、比较模块54、输出模块55和更新模块56。
获取模块,用于获取人脸图像信息和识别环境信息;
第一输入模块,用于将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
第二输入模块,用于将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较模块,用于比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
输出模块,用于根据所述比较结果输出识别结果;
更新模块,用于根据所述识别环境信息更新所述分类器。
进一步地,如图6所示,本实施例的装置还可以包括:
第一构建模块61,用于构建所述深度学习模型的结构;
第二构建模块62,用于构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
第一训练模块63,用于根据网络数据库中的图像数据对所述深度学习模型进行训练。
另外,如图7所示,第一构建模块可以包括:
第一构建单元71,用于构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
第二构建单元72,用于构建最大池化层;
第三构建单元73,用于构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
第四构建单元74,用于构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
进一步地,如图8所示,本装置还可以包括:
第三构建模块81,用于构建分类算法;
第三输入模块82,用于将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
第四输入模块83,用于将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存模块84,用于保存所述分类算法参数,进而形成所述分类器。
其中,如图9所示,第三构建模块可以包括:
第五构建单元91,用于构建原问题;
转换单元92,用于将所述原问题转化为拉格朗日形式;
设置单元93,用于设置核函数。
另外,本申请的另一个实施例提供一种人脸识别的设备,所述人脸识别设备包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行如下所述的人脸识别的方法:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
可选的,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
可选的,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
所述处理器用于调用并执行所述存储器中的所述计算机程序。
本申请的另一个实施例还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如下所述的人脸识别的方法中各个步骤:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
可选的,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
可选的,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
可选的,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
可选的,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种人脸识别的方法,其特征在于,包括:
获取人脸图像信息和识别环境信息;
将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
根据所述比较结果输出识别结果;
根据所述识别环境信息更新所述分类器。
2.根据权利要求1所述的方法,其特征在于,所述深度学习模型的构建和训练过程包括:
构建所述深度学习模型的结构;
构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
根据网络数据库中的图像数据对所述深度学习模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述构建所述深度学习模型的结构,包括:
构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
构建最大池化层;
构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
4.根据权利要求1所述的方法,其特征在于,所述分类器的构建和训练过程包括:
构建分类算法;
将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存所述分类算法参数,进而形成所述分类器。
5.根据权利要求4所述的方法,其特征在于,所述构建分类算法,包括:
构建原问题;
将所述原问题转化为拉格朗日形式;
设置核函数。
6.一种人脸识别的装置,其特征在于,包括:
获取模块,用于获取人脸图像信息和识别环境信息;
第一输入模块,用于将所述人脸图像信息输入到预先构建和训练的深度学习模型中,得到人脸特征向量;
第二输入模块,用于将所述人脸特征向量输入到预先构建和训练的分类器中,得到人脸图像阈值;
比较模块,用于比较所述人脸图像阈值与预设阈值的大小,得到比较结果;
输出模块,用于根据所述比较结果输出识别结果;
更新模块,用于根据所述识别环境信息更新所述分类器。
7.根据权利要求6所述的装置,其特征在于,还包括:
第一构建模块,用于构建所述深度学习模型的结构;
第二构建模块,用于构建至少两个损失函数;所述损失函数用于监督所述深度学习模型的训练过程;
第一训练模块,用于根据网络数据库中的图像数据对所述深度学习模型进行训练。
8.根据权利要求7所述的装置,其特征在于,所述第一构建模块包括:
第一构建单元,用于构建初层网络结构;所述初层网络结构包括多层标准卷积结构;
第二构建单元,用于构建最大池化层;
第三构建单元,用于构建中间层网络结构;所述中间层网络结构包括多个分支,所述多个分支中至少有一个分支采用残差连接结构;
第四构建单元,用于构建嵌入层;所述嵌入层用于将人脸特征向量变换为高维度的人脸特征向量。
9.根据权利要求6所述的装置,其特征在于,还包括:
第三构建模块,用于构建分类算法;
第三输入模块,用于将本地人脸数据或识别环境数据输入到所述深度学习模型中,得到分类器输入数据;
第四输入模块,用于将所述分类器输入数据输入到所述分类算法中,得到分类算法参数;
保存模块,用于保存所述分类算法参数,进而形成所述分类器。
10.根据权利要求9所述的装置,其特征在于,所述第三构建模块包括:
第五构建单元,用于构建原问题;
转换单元,用于将所述原问题转化为拉格朗日形式;
设置单元,用于设置核函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810991582.2A CN109117817B (zh) | 2018-08-28 | 2018-08-28 | 人脸识别的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810991582.2A CN109117817B (zh) | 2018-08-28 | 2018-08-28 | 人脸识别的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109117817A true CN109117817A (zh) | 2019-01-01 |
CN109117817B CN109117817B (zh) | 2022-06-14 |
Family
ID=64861380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810991582.2A Active CN109117817B (zh) | 2018-08-28 | 2018-08-28 | 人脸识别的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109117817B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110268419A (zh) * | 2019-05-08 | 2019-09-20 | 深圳市汇顶科技股份有限公司 | 一种人脸识别方法、人脸识别装置和计算机可读存储介质 |
WO2020186886A1 (zh) * | 2019-03-18 | 2020-09-24 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
CN112597862A (zh) * | 2020-12-16 | 2021-04-02 | 北京芯翌智能信息技术有限公司 | 一种用于人脸数据清洗的方法与设备 |
CN112633154A (zh) * | 2020-12-22 | 2021-04-09 | 云南翼飞视科技有限公司 | 一种异源人脸特征向量之间的转换方法及系统 |
CN112686202A (zh) * | 2021-01-12 | 2021-04-20 | 武汉大学 | 一种基于3d重建的人头识别方法及系统 |
CN116050507A (zh) * | 2023-01-18 | 2023-05-02 | 合肥中科立恒智能科技有限公司 | 一种二氧化碳排放监测方法与系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080029222A (ko) * | 2006-09-28 | 2008-04-03 | 한국전자통신연구원 | 손 모양을 인식하는 방법 및 이를 위한 장치 |
CN102169544A (zh) * | 2011-04-18 | 2011-08-31 | 苏州市慧视通讯科技有限公司 | 基于多特征融合的人脸遮挡检测方法 |
CN105488044A (zh) * | 2014-09-16 | 2016-04-13 | 华为技术有限公司 | 数据处理的方法和设备 |
CN107886064A (zh) * | 2017-11-06 | 2018-04-06 | 安徽大学 | 一种基于卷积神经网络的人脸识别场景适应的方法 |
-
2018
- 2018-08-28 CN CN201810991582.2A patent/CN109117817B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080029222A (ko) * | 2006-09-28 | 2008-04-03 | 한국전자통신연구원 | 손 모양을 인식하는 방법 및 이를 위한 장치 |
CN102169544A (zh) * | 2011-04-18 | 2011-08-31 | 苏州市慧视通讯科技有限公司 | 基于多特征融合的人脸遮挡检测方法 |
CN105488044A (zh) * | 2014-09-16 | 2016-04-13 | 华为技术有限公司 | 数据处理的方法和设备 |
CN107886064A (zh) * | 2017-11-06 | 2018-04-06 | 安徽大学 | 一种基于卷积神经网络的人脸识别场景适应的方法 |
Non-Patent Citations (1)
Title |
---|
郭闪闪: "基于深度学习的人脸识别", 《中国优秀硕士学位论文全文数据库.信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020186886A1 (zh) * | 2019-03-18 | 2020-09-24 | 中国科学院深圳先进技术研究院 | 一种人脸识别模型的生成方法及设备 |
CN110268419A (zh) * | 2019-05-08 | 2019-09-20 | 深圳市汇顶科技股份有限公司 | 一种人脸识别方法、人脸识别装置和计算机可读存储介质 |
WO2020223937A1 (zh) * | 2019-05-08 | 2020-11-12 | 深圳市汇顶科技股份有限公司 | 一种人脸识别方法、人脸识别装置和计算机可读存储介质 |
CN112597862A (zh) * | 2020-12-16 | 2021-04-02 | 北京芯翌智能信息技术有限公司 | 一种用于人脸数据清洗的方法与设备 |
CN112633154A (zh) * | 2020-12-22 | 2021-04-09 | 云南翼飞视科技有限公司 | 一种异源人脸特征向量之间的转换方法及系统 |
CN112686202A (zh) * | 2021-01-12 | 2021-04-20 | 武汉大学 | 一种基于3d重建的人头识别方法及系统 |
CN116050507A (zh) * | 2023-01-18 | 2023-05-02 | 合肥中科立恒智能科技有限公司 | 一种二氧化碳排放监测方法与系统 |
CN116050507B (zh) * | 2023-01-18 | 2023-12-22 | 合肥中科立恒智能科技有限公司 | 一种二氧化碳排放监测方法与系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109117817B (zh) | 2022-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109117817A (zh) | 人脸识别的方法及装置 | |
CN108596039B (zh) | 一种基于3d卷积神经网络的双模态情感识别方法及系统 | |
CN108780519B (zh) | 卷积神经网络的结构学习 | |
CN103824054B (zh) | 一种基于级联深度神经网络的人脸属性识别方法 | |
CN105184312B (zh) | 一种基于深度学习的文字检测方法及装置 | |
CN106096535B (zh) | 一种基于双线性联合cnn的人脸验证方法 | |
CN106203363A (zh) | 人体骨架运动序列行为识别方法 | |
CN109558832A (zh) | 一种人体姿态检测方法、装置、设备及存储介质 | |
CN107220635A (zh) | 基于多造假方式的人脸活体检测方法 | |
CN109196526A (zh) | 用于生成多模态数字图像的方法和系统 | |
CN110188795A (zh) | 图像分类方法、数据处理方法和装置 | |
CN109902546A (zh) | 人脸识别方法、装置及计算机可读介质 | |
CN107766850A (zh) | 基于结合人脸属性信息的人脸识别方法 | |
CN109543548A (zh) | 一种人脸识别方法、装置及存储介质 | |
CN106778682A (zh) | 一种卷积神经网络模型的训练方法及其设备 | |
CN106570477A (zh) | 基于深度学习的车型识别模型构建方法及车型识别方法 | |
CN108363997A (zh) | 一种在视频中对特定人的实时跟踪方法 | |
CN109190566A (zh) | 一种融合局部编码与cnn模型手指静脉识别方法 | |
CN108304364A (zh) | 关键词提取方法和装置 | |
KR102593835B1 (ko) | 휴리스틱 가우스 클라우드 변환에 기반하는 얼굴인식 기술 | |
CN108537120A (zh) | 一种基于深度学习的人脸识别方法及系统 | |
CN110175248A (zh) | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 | |
CN111582396A (zh) | 一种基于改进卷积神经网络的故障诊断方法 | |
CN107784630A (zh) | 对人脸图像进行属性翻转的方法、装置和终端 | |
CN106611156B (zh) | 一种自适应深度空间特征的行人识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |