CN108416326B - 人脸识别方法和装置 - Google Patents
人脸识别方法和装置 Download PDFInfo
- Publication number
- CN108416326B CN108416326B CN201810259989.6A CN201810259989A CN108416326B CN 108416326 B CN108416326 B CN 108416326B CN 201810259989 A CN201810259989 A CN 201810259989A CN 108416326 B CN108416326 B CN 108416326B
- Authority
- CN
- China
- Prior art keywords
- face recognition
- image
- model
- recognition model
- visible light
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本申请实施例公开了人脸识别方法和装置。该方法的一具体实施方式包括:将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,待检测图像为可见光图像或者近红外图像,人脸识别模型通过如下步骤训练得到:获取包含可见光图像和近红外图像的训练样本;将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对判别模型和初始人脸识别模型进行对抗训练,得到人脸识别模型。该实施方式实现了对近红外图像中的人脸对象的有效识别。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及人脸识别方法和装置。
背景技术
随着计算机技术的发展,图像处理技术应用到了越来越多的领域。通常,可以使用机器学习方法训练人脸识别模型,利用人脸识别模型对图像中的人脸进行识别。
现有的人脸识别模型通常是仅使用可见光图像作为训练样本进行训练得到的。这种人脸识别模型仅适用于对可见光图像中的人脸进行识别。现有的另一种方式是同时使用可见光图像和近红外图像作为训练样本,直接进行有监督训练后得到人脸识别模型。
发明内容
本申请实施例提出了人脸识别方法和装置。
第一方面,本申请实施例提供了一种人脸识别方法,该方法包括:将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,待检测图像为可见光图像或者近红外图像,人脸识别模型通过如下步骤训练得到:获取包含可见光图像和近红外图像的训练样本;将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对判别模型和初始人脸识别模型进行对抗训练,得到人脸识别模型,其中,初始人脸识别模型用于对可见光图像所包含的人脸对象进行人脸识别,判别模型用于确定被输入至的特征信息是否取自可见光图像。
在一些实施例中,训练样本中的每一个图像带有图像类型标注,初始人脸识别模型所生成的该图像的特征信息带有图像类型标注,图像类型标注用于指示图像是否为可见光图像。
在一些实施例中,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,利用判别模型对初始人脸识别模型进行对抗训练,包括:迭代执行如下训练步骤:固定初始人脸识别模型的参数,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型生成的特征信息作为判别模型的输入,将特征信息所带有的图像类型标注作为判别模型的输出,利用机器学习方法,对判别模型进行训练;固定训练后的判别模型的参数,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型生成的特征信息输入至训练后的判别模型,基于训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对初始人脸识别模型的参数进行更新。
在一些实施例中,初始人脸识别模型通过如下步骤训练得到:提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注;利用机器学习算法,将预置训练样本输入至预先建立的卷积神经网络,基于预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。
在一些实施例中,判别模型为用于进行二分类的神经网络。
在一些实施例中,利用初始人脸识别模型从可见光图像中提取的特征信息与利用初始人脸识别模型从近红外图像中提取的特征信息的分布不同,特征信息的分布包括特征信息中的数值的取值范围。
在一些实施例中,该方法还包括:响应于确定人脸识别结果指示无法识别待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
第二方面,本申请实施例提供了一种人脸识别装置,该装置包括:输入单元,配置用于将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,待检测图像为可见光图像或者近红外图像,人脸识别模型通过如下步骤训练得到:获取包含可见光图像和近红外图像的训练样本;将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对判别模型和初始人脸识别模型进行对抗训练,得到人脸识别模型,其中,初始人脸识别模型用于对可见光图像所包含的人脸对象进行人脸识别,判别模型用于确定被输入至的特征信息是否取自可见光图像。
在一些实施例中,训练样本中的每一个图像带有图像类型标注,初始人脸识别模型所生成的该图像的特征信息带有图像类型标注,图像类型标注用于指示图像是否为可见光图像。
在一些实施例中,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,利用判别模型对初始人脸识别模型进行对抗训练,包括:迭代执行如下训练步骤:固定初始人脸识别模型的参数,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型生成的特征信息作为判别模型的输入,将特征信息所带有的图像类型标注作为判别模型的输出,利用机器学习方法,对判别模型进行训练;固定训练后的判别模型的参数,将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型生成的特征信息输入至训练后的判别模型,基于训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对初始人脸识别模型的参数进行更新。
在一些实施例中,初始人脸识别模型通过如下步骤训练得到:提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注;利用机器学习算法,将预置训练样本输入至预先建立的卷积神经网络,基于预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。
在一些实施例中,判别模型为用于进行二分类的神经网络。
在一些实施例中,利用初始人脸识别模型从可见光图像中提取的特征信息与利用初始人脸识别模型从近红外图像中提取的特征信息的分布不同,特征信息的分布包括特征信息中的数值的取值范围。
在一些实施例中,该装置还包括:显示单元,配置用于响应于确定人脸识别结果指示无法识别待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如人脸识别方法中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如人脸识别方法中任一实施例的方法。
本申请实施例提供的人脸识别方法和装置,通过将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。由于训练该人脸识别模型时所使用的训练样本既包含可见光图像,又包含近红外图像,因而该人脸识别模型可以同时适用于对可见光图像和近红外图像中的人脸对象的识别。另外,采用对初始人脸识别模型和判别模型进行对抗训练的方式得到的人脸识别模,其从可见光图像中所提取的特征与从近红外图像中所提取的特征具有相同的特征分布,因而使用该人脸识别模可以提高对近红外图像中的人脸对象的识别的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的人脸识别方法的一个实施例的流程图;
图3是根据本申请的人脸识别方法的一个应用场景的示意图;
图4是根据本申请的人脸识别方法的又一个实施例的流程图;
图5是根据本申请的人脸识别装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的人脸识别方法或人脸识别装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持图像拍摄的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
终端设备101、102、103中可以存储有人脸识别模型,在拍摄到待检测图像后,可以基于该人脸识别模型对该图像中的人脸对象进行识别。
服务器105可以是提供各种服务的服务器,例如对用户的特征信息进行存储的存储服务器,存储服务器可以存储多个用户的特征信息,每个用户的特征信息可以是从用户在注册时所上传的人脸图像中提取的。需要说明的是,服务器105可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
需要指出的是,本申请实施例所提供的人脸识别方法一般由终端设备101、102、103执行,相应地,人脸识别装置一般设置于终端设备101、102、103中。需要说明的是,上述人脸识别模型也可以存储于服务器105中,终端设备101、102、103可以通过网络104将待检测图像发送至服务器105,服务器105利用该人脸识别模型对上述待检测图像中的人脸对象进行识别。此时,人脸识别方法可以由服务器105执行,相应地,人脸识别装置也可以设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的人脸识别方法的一个实施例的流程200。该人脸识别方法,包括以下步骤:
步骤201,将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。
在本实施例中,人脸识别方法的执行主体(例如图1所示的终端设备101、102、103)中可以存储有预先训练的人脸识别模型。在获取到待检测图像后,可以将该待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。其中,上述人脸识别模型可以用于从图像中提取特征信息。上述特征信息可以是用于对人脸特征进行表征的信息,其中,人脸特征可以是与人脸相关的各种基本要素(例如人脸中的特征点间的欧氏距离、曲率、角度等,人脸的某一个局部和人脸的另一个局部之间的结构关系的几何描述等)。实践中,特征信息可以用向量或矩阵表示。
此处,上述待检测图像可以为可见光图像(例如RGB(Red Green Blue,红绿蓝)模式的图像)或者近红外(Near Infrared,NIR)图像。其中,可见光图像也可以用RGB三通道的矩阵进行表达。近红外图像可以用内容相同的三通道的矩阵进行表达。
在一种实现方式中,上述执行主体中可以预先存储有待检测图像,上述执行主体可以直接将该待检测图像输入至上述人脸识别模型,得到人脸识别结果。
在另一种实现方式中,上述执行主体可以安装有用于采集可见光图像的摄像头和用于采集近红外图像的摄像头。用户可以选择需开启的摄像头,进而利用所选择的摄像头进行拍摄(利用进行用户头部或者脸部的自拍),得到待检测图像。
需要说明的是,上述人脸识别模型可以通过如下步骤训练得到:
步骤202,获取包含可见光图像和近红外图像的训练样本。
此处,上述训练样本中的可见光图像和近红外图像中可以包含人脸对象。可见光图像所包含的人脸对象与近红外图像中所包含的人脸对象可以相同或不同,此处不作限定。
步骤203,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对上述判别模型和上述初始人脸识别模型进行对抗训练,得到人脸识别模型。
此处,上述初始人脸识别模型可以用于对可见光图像所包含的人脸对象进行人脸识别。可以使用各种现有的、利用可见光图像作为训练样本所训练完成的人脸识别模型作为初始人脸识别模型。例如,上述初始人脸识别模型可以是利用机器学习方法和由可见光图像所构成的训练样本对现有的卷积神经网络结构(例如DenseBox、VGGNet、ResNet、SegNet等)进行有监督训练而得到的。
上述判别模型可以用于确定被输入至该判别模型的特征信息是否取自可见光图像。实践中,判别模型若确定被输入至其中的特征信息取自可见光图像,可以输出某个预设数值(例如1);若确定被输入至其中的特征信息取自可见光图像,可以输出另一个预设数值(例如0)。需要说明的是,上述判别模型可以是各种现有的、可实现分类功能的模型(例如朴素贝叶斯模型(Naive Bayesian Model,NBM)、支持向量机(Support Vector Machine,SVM)、包含全连接层(fully connected layers,FC)的神经网络)或分类函数(例如softmax函数等)。
具体地,在对上述对判别模型和上述初始人脸识别模型进行对抗训练的过程中,可以对上述判别模型和上述初始人脸识别模型进行单独交替迭代地训练。
例如,可以首先固定上述初始人脸识别模型的参数,对判别模型进行第一次训练;而后,固定第一次训练后的判别模型的参数,对上述初始人脸识别模型进行第一次训练;之后,固定第一次训练后的初始人脸识别模型的参数,对第一次训练后的判别模型进行第二次训练,以此类推,将最终训练后所得到的初始人脸识别模型作为最终的人脸识别模型。
作为又一示例,可以首先固定上述判别模型的参数,对上述初始人脸识别模型进行第一次训练;而后,固定第一次训练后的初始人脸识别模型的参数,对上述判别模型进行第一次训练;之后,固定第一次训练后的判别模型的参数,对第一次训练后的初始人脸识别模型进行第二次训练,以此类推,将最终训练后所得到的初始人脸识别模型作为最终的人脸识别模型。
此处,每一次对判别模型的训练,可以是利用机器学习方法,将当前训练后的初始神经网络所输出的特征信息输入至该判别模型,通过有监督训练的方式进行的。训练判别模型的目标是使之对被输入至的特征信息是否来自可见光图像的判定越来越准确。
每一次对初始人脸识别模型的训练,可以是基于当前训练后的判别网络的输出结果,进行利用反向传播算法和梯度下降算法对上述当前的人脸识别模型的参数进行更新的方式进行的。训练初始人脸识别模型的目的是使之所生成的近红外图像的特征信息的分布越来越接近可见光图像的特征信息的分布(即使判别模型无法准确判别被输入至的特征信息是否来自可见光图像)。此处,特征信息的分布可以包括特征信息中的数值的取值范围等等。
实践中,反向传播算法也可称为误差反向传播(Error Back Propagation,BP)算法,或误差逆传播算法。反向传播算法是由学习过程由信号的正向传播与误差的反向传播(权重更新)两个过程组成,正向传播与误差的反向传播过程反复循环迭代,直到网络的对输入的响应达到预定的目标范围为止。
具体地,以某一次对初始人脸识别模型训练为例,训练样本中的一批数据经当前的初始人脸识别模型(初始人脸识别模型可以是对卷积神经网络训练得到的)的输入层输入,通过隐层计算,由输出层输出特征信息。所输出的特征信息被输入至当前的判别模型后,判别模型输出判别结果。判别结果被代入至初始人脸识别模型对应的目标函数(用于表征判别结果与真实结果的差异程度,差异程度越大,则目标函数的值越小),确定目标函数的值。若目标函数的值不为最小值,则进行反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,初始人脸识别模型的学习在权值修改过程中完成。误差达到所期望值(即上述最小值)时,该次对初始人脸识别模型的训练完成。
需要说明的是,上述反向传播算法和梯度下降算法是目前广泛研究和应用的公知技术,在此不再赘述。
继续参见图3,图3是根据本实施例的人脸识别方法的应用场景的一个示意图。在图3的应用场景中,用户手持终端设备301,终端设备的摄像头对准面部进行人脸图像的拍摄。上述摄像头可以是用于拍摄可见光图像的摄像头,也可以是用于拍摄近红外图像的摄像头。上述终端设备在获取到人脸图像后,将该人脸图像输入至预先训练的人脸识别模型,得到人脸识别结果。若人脸识别结果指示识别成功,则可以进行解锁。用户可以在上述终端设备解锁后,对该终端设备进行操作。
本申请的上述实施例提供的方法,通过将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。由于训练该人脸识别模型时所使用的训练样本既包含可见光图像,又包含近红外图像,因而该人脸识别模型可以同时适用于对可见光图像和近红外图像中的人脸对象的识别。另外,采用对初始人脸识别模型和判别模型进行对抗训练的方式得到的人脸识别模,其从可见光图像中所提取的特征与从近红外图像中所提取的特征具有相同的特征分布,因而使用该人脸识别模可以提高对近红外图像中的人脸对象的识别的准确性。
进一步参考图4,其示出了人脸识别方法的又一个实施例的流程400。该人脸识别方法的流程400,包括以下步骤:
步骤401,将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。
在本实施例中,人脸识别方法的执行主体(例如图1所示的终端设备101、102、103)中可以存储有预先训练的人脸识别模型。在获取到待检测图像后,可以将该待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。其中,上述待检测图像可以为可见光图像或者近红外图像。
需要说明的是,上述人脸识别模型可以通过如下步骤训练得到:
第一步,获取包含可见光图像和近红外图像的训练样本。
此处,上述训练样本中的可见光图像和近红外图像中可以包含人脸对象。可见光图像所包含的人脸对象与近红外图像中所包含的人脸对象可以相同或不同,此处不作限定。
需要说明的是,上述训练样本中的每一个图像带有图像类型标注,上述初始人脸识别模型所生成的该图像的特征信息也可以带有上述图像类型标注,图像类型标注可以用于指示图像是否为可见光图像。作为示例,用于指示图像为可见光图像的图像类型标注可以是1,用于指示图像不为可见光图像的图像类型标注可以是0。此处,由于训练样本中除可见光图像以外的图像为近红外图像,因此,用于指示图像不为可见光图像的图像类型标注也可用于指示图像为近红外图像。
第二步,迭代执行如下训练步骤:首先,固定上述初始人脸识别模型的参数,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型生成的特征信息作为上述判别模型的输入,将特征信息所带有的图像类型标注作为上述判别模型的输出,利用机器学习方法,对上述判别模型进行训练。之后,固定训练后的上述判别模型的参数,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型生成的特征信息输入至上述训练后的判别模型,基于上述训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对上述初始人脸识别模型的参数进行更新。
需要说明的是,上述训练步骤可以迭代执行多次。实践中,可以在确定训练后的判别模型无法准确判断被输入至的特征信息是否来自可见光图像时,确定训练完成。也可以在迭代执行上述训练步骤的次数达到预设次数(例如5000次)时,确定训练完成。还可以在人为确定训练后的初始人脸识别模型可以对可见光图像和近红外图像中的对象进行有效的人脸识别后,确定训练完成。
此处,上述判别模型可以为用于进行二分类的神经网络,例如,可以是包含全连接层的神经网络。上述初始人脸识别模型通过如下步骤训练得到:首先,提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注。用户身份标注可以是用于区别和确定用户的向量。之后,利用机器学习算法,将上述预置训练样本输入至预先建立的卷积神经网络,基于上述预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。需要说明的是,对卷积神经网络的训练方法是目前广泛研究和应用的公知技术,在此不再赘述。
需要说明的是,利用上述初始人脸识别模型从可见光图像中提取的特征信息与利用上述初始人脸识别模型从近红外图像中提取的特征信息的分布不同。特征信息的分布可以包括特征信息中的数值的取值范围。例如,从可见光图像中提取的特征信息中的各数值的取值范围为不小于零且不大于1;从近红外图像中提取的特征信息中的各数值的取值范围可以为大于1且不大于100。
步骤402,响应于确定人脸识别结果指示无法识别待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
在本实施例中,上述执行主体响应于确定人脸识别结果指示无法识别待检测图像,可以显示用于提示用户重新获取待检测图像的提示信息。例如,显示字符串“请重新获取图像”。
在一种实现方式中,上述执行主体中可以预存有用户的特征信息,且预存的特征信息可以是从该用户在注册时所上传的人脸图像中提取的。上述执行主体可以将利用上述人脸识别模型从上述待检测图像中所提取的特征信息作为人脸识别结果,若该人脸识别结果与预存的特征信息不匹配(例如相似度小于某个预设数值),则可以确定上述待检测图像识别未通过。
实践中,若待检测图像中的人脸对象较为模糊,或者与用户在注册时所上传的人脸图像中的人脸对象的角度差异较大等情况下,人脸识别模型从该待检测图像中所提取的特征信息与预存的特征信息差异较大,此时,人脸识别结果可以指示无法对该待检测图像进行识别。
从图4中可以看出,与图2对应的实施例相比,本实施例中的人脸识别方法的流程400突出了训练人脸识别模型步骤和在无法识别待检测图像后显示提示信息的步骤。由此,本实施例描述的方案不仅可以提高对近红外图像中的人脸对象的识别的准确性,在无法识别待检测图像后提示重新获取待检测图像,还可以提高人脸识别的灵活性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种人脸识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例所述的人脸识别装置500包括:输入单元501,配置用于将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,上述待检测图像为可见光图像或者近红外图像,上述人脸识别模型通过如下步骤训练得到:获取包含可见光图像和近红外图像的训练样本;将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对上述判别模型和上述初始人脸识别模型进行对抗训练,得到人脸识别模型,其中,上述初始人脸识别模型用于对可见光图像所包含的人脸对象进行人脸识别,上述判别模型用于确定被输入至的特征信息是否取自可见光图像。
在一些实施例中,训练样本中的每一个图像带有图像类型标注,上述初始人脸识别模型所生成的该图像的特征信息带有上述图像类型标注,图像类型标注用于指示图像是否为可见光图像。
在一些实施例中,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,利用上述判别模型对上述初始人脸识别模型进行对抗训练,包括:迭代执行如下训练步骤:固定上述初始人脸识别模型的参数,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型生成的特征信息作为上述判别模型的输入,将特征信息所带有的图像类型标注作为上述判别模型的输出,利用机器学习方法,对上述判别模型进行训练;固定训练后的上述判别模型的参数,将上述训练样本输入至预先训练的初始人脸识别模型,将上述初始人脸识别模型生成的特征信息输入至上述训练后的判别模型,基于上述训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对上述初始人脸识别模型的参数进行更新。
在本实施例的一些可选的实现方式中,上述初始人脸识别模型可以通过如下步骤训练得到:提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注;利用机器学习算法,将上述预置训练样本输入至预先建立的卷积神经网络,基于上述预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。
在本实施例的一些可选的实现方式中,上述判别模型可以为用于进行二分类的神经网络。
在本实施例的一些可选的实现方式中,利用上述初始人脸识别模型从可见光图像中提取的特征信息可以与利用上述初始人脸识别模型从近红外图像中提取的特征信息的分布不同,特征信息的分布可以包括特征信息中的数值的取值范围。
在本实施例的一些可选的实现方式中,该装置还可以包括显示单元(图中未示出)。其中,上述显示单元可以配置用于响应于确定上述人脸识别结果指示无法识别上述待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
本申请的上述实施例提供的装置,通过输入单元501将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果。由于训练该人脸识别模型时所使用的训练样本既包含可见光图像,又包含近红外图像,因而该人脸识别模型可以同时适用于对可见光图像和近红外图像中的人脸对象的识别。另外,采用对初始人脸识别模型和判别模型进行对抗训练的方式得到的人脸识别模,其从可见光图像中所提取的特征与从近红外图像中所提取的特征具有相同的特征分布,因而使用该人脸识别模可以提高对近红外图像中的人脸对象的识别的准确性。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括触摸屏、触摸板等的输入部分606;包括诸如、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括输入单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,输入单元还可以被描述为“将待检测图像输入至预先训练的人脸识别模型的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,待检测图像为可见光图像或者近红外图像,人脸识别模型通过如下步骤训练得到:获取包含可见光图像和近红外图像的训练样本;将训练样本输入至预先训练的初始人脸识别模型,将初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对判别模型和初始人脸识别模型进行对抗训练,得到人脸识别模型。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (16)
1.一种人脸识别方法,包括:
将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,所述待检测图像为可见光图像或者近红外图像,所述人脸识别模型通过如下步骤训练得到:
获取包含可见光图像和近红外图像的训练样本;
将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对所述判别模型和所述初始人脸识别模型进行对抗训练,得到人脸识别模型,其中,所述初始人脸识别模型用于对可见光图像所包含的人脸对象进行人脸识别,所述判别模型用于确定被输入至的特征信息是否取自可见光图像。
2.根据权利要求1所述的人脸识别方法,其中,所述训练样本中的每一个图像带有图像类型标注,所述初始人脸识别模型所生成的该图像的特征信息带有所述图像类型标注,图像类型标注用于指示图像是否为可见光图像。
3.根据权利要求2所述的人脸识别方法,其中,所述将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,利用所述判别模型对所述初始人脸识别模型进行对抗训练,包括:
迭代执行如下训练步骤:固定所述初始人脸识别模型的参数,将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型生成的特征信息作为所述判别模型的输入,将特征信息所带有的图像类型标注作为所述判别模型的输出,利用机器学习方法,对所述判别模型进行训练;固定训练后的所述判别模型的参数,将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型生成的特征信息输入至所述训练后的判别模型,基于所述训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对所述初始人脸识别模型的参数进行更新。
4.根据权利要求3所述的人脸识别方法,其中,所述初始人脸识别模型通过如下步骤训练得到:
提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注;
利用机器学习算法,将所述预置训练样本输入至预先建立的卷积神经网络,基于所述预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。
5.根据权利要求1所述的人脸识别方法,其中,所述判别模型为用于进行二分类的神经网络。
6.根据权利要求1所述的人脸识别方法,其中,利用所述初始人脸识别模型从可见光图像中提取的特征信息与利用所述初始人脸识别模型从近红外图像中提取的特征信息的分布不同,特征信息的分布包括特征信息中的数值的取值范围。
7.根据权利要求1所述的人脸识别方法,其中,所述方法还包括:
响应于确定所述人脸识别结果指示无法识别所述待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
8.一种人脸识别装置,包括:
输入单元,配置用于将待检测图像输入至预先训练的人脸识别模型,得到人脸识别结果,其中,所述待检测图像为可见光图像或者近红外图像,所述人脸识别模型通过如下步骤训练得到:
获取包含可见光图像和近红外图像的训练样本;
将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,对所述判别模型和所述初始人脸识别模型进行对抗训练,得到人脸识别模型,其中,所述初始人脸识别模型用于对可见光图像所包含的人脸对象进行人脸识别,所述判别模型用于确定被输入至的特征信息是否取自可见光图像。
9.根据权利要求8所述的人脸识别装置,其中,所述训练样本中的每一个图像带有图像类型标注,所述初始人脸识别模型所生成的该图像的特征信息带有所述图像类型标注,图像类型标注用于指示图像是否为可见光图像。
10.根据权利要求9所述的人脸识别装置,其中,所述将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型所生成的特征信息输入至预先建立的判别模型,利用所述判别模型对所述初始人脸识别模型进行对抗训练,包括:
迭代执行如下训练步骤:固定所述初始人脸识别模型的参数,将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型生成的特征信息作为所述判别模型的输入,将特征信息所带有的图像类型标注作为所述判别模型的输出,利用机器学习方法,对所述判别模型进行训练;固定训练后的所述判别模型的参数,将所述训练样本输入至预先训练的初始人脸识别模型,将所述初始人脸识别模型生成的特征信息输入至所述训练后的判别模型,基于所述训练后的判别模型所输出的判别结果,利用反向传播算法和梯度下降算法对所述初始人脸识别模型的参数进行更新。
11.根据权利要求10所述的人脸识别装置,其中,所述初始人脸识别模型通过如下步骤训练得到:
提取由可见光图像构成的预置训练样本,其中,每一个可见光图像带有用户身份标注;
利用机器学习算法,将所述预置训练样本输入至预先建立的卷积神经网络,基于所述预置训练样本中的可见光图像所带有的用户身份标注,训练得到初始人脸识别模型。
12.根据权利要求8所述的人脸识别装置,其中,所述判别模型为用于进行二分类的神经网络。
13.根据权利要求8所述的人脸识别装置,其中,利用所述初始人脸识别模型从可见光图像中提取的特征信息与利用所述初始人脸识别模型从近红外图像中提取的特征信息的分布不同,特征信息的分布包括特征信息中的数值的取值范围。
14.根据权利要求8所述的人脸识别装置,其中,所述装置还包括:
显示单元,配置用于响应于确定所述人脸识别结果指示无法识别所述待检测图像,显示用于提示用户重新获取待检测图像的提示信息。
15.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259989.6A CN108416326B (zh) | 2018-03-27 | 2018-03-27 | 人脸识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810259989.6A CN108416326B (zh) | 2018-03-27 | 2018-03-27 | 人脸识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108416326A CN108416326A (zh) | 2018-08-17 |
CN108416326B true CN108416326B (zh) | 2021-07-16 |
Family
ID=63133612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810259989.6A Active CN108416326B (zh) | 2018-03-27 | 2018-03-27 | 人脸识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416326B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102460A (zh) * | 2018-08-28 | 2018-12-28 | Oppo广东移动通信有限公司 | 一种图像处理方法、图像处理装置及终端设备 |
CN109543640B (zh) * | 2018-11-29 | 2022-06-17 | 中国科学院重庆绿色智能技术研究院 | 一种基于图像转换的活体检测方法 |
CN111259698B (zh) * | 2018-11-30 | 2023-10-13 | 百度在线网络技术(北京)有限公司 | 用于获取图像的方法及装置 |
CN109614910B (zh) * | 2018-12-04 | 2020-11-20 | 青岛小鸟看看科技有限公司 | 一种人脸识别方法和装置 |
CN109741481A (zh) * | 2018-12-14 | 2019-05-10 | 深圳壹账通智能科技有限公司 | 基于人脸识别的健身时长计算方法、装置及健身设备 |
CN109858472B (zh) * | 2019-04-09 | 2023-08-04 | 武汉领普科技有限公司 | 一种嵌入式实时人形检测方法和装置 |
CN110334763B (zh) * | 2019-07-04 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 模型数据文件生成、图像识别方法、装置、设备及介质 |
CN111339964B (zh) * | 2020-02-28 | 2024-07-16 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111612081B (zh) * | 2020-05-25 | 2024-04-02 | 深圳前海微众银行股份有限公司 | 识别模型的训练方法、装置、设备及存储介质 |
CN112258592A (zh) * | 2020-09-17 | 2021-01-22 | 深圳市捷顺科技实业股份有限公司 | 一种人脸可见光图的生成方法及相关装置 |
CN112950732B (zh) * | 2021-02-23 | 2022-04-01 | 北京三快在线科技有限公司 | 一种图像生成方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622589A (zh) * | 2012-03-13 | 2012-08-01 | 辉路科技(北京)有限公司 | 一种基于gpu的多光谱人脸检测方法 |
CN107423700A (zh) * | 2017-07-17 | 2017-12-01 | 广州广电卓识智能科技有限公司 | 人证核实的方法及装置 |
CN107491771A (zh) * | 2017-09-21 | 2017-12-19 | 百度在线网络技术(北京)有限公司 | 人脸检测方法和装置 |
CN107577987A (zh) * | 2017-08-01 | 2018-01-12 | 广州广电卓识智能科技有限公司 | 身份认证的方法、系统和装置 |
CN107609481A (zh) * | 2017-08-14 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 为人脸识别生成训练数据的方法、装置和计算机存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10007866B2 (en) * | 2016-04-28 | 2018-06-26 | Microsoft Technology Licensing, Llc | Neural network image classifier |
-
2018
- 2018-03-27 CN CN201810259989.6A patent/CN108416326B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622589A (zh) * | 2012-03-13 | 2012-08-01 | 辉路科技(北京)有限公司 | 一种基于gpu的多光谱人脸检测方法 |
CN107423700A (zh) * | 2017-07-17 | 2017-12-01 | 广州广电卓识智能科技有限公司 | 人证核实的方法及装置 |
CN107577987A (zh) * | 2017-08-01 | 2018-01-12 | 广州广电卓识智能科技有限公司 | 身份认证的方法、系统和装置 |
CN107609481A (zh) * | 2017-08-14 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 为人脸识别生成训练数据的方法、装置和计算机存储介质 |
CN107491771A (zh) * | 2017-09-21 | 2017-12-19 | 百度在线网络技术(北京)有限公司 | 人脸检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108416326A (zh) | 2018-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416326B (zh) | 人脸识别方法和装置 | |
CN108491805B (zh) | 身份认证方法和装置 | |
CN109800732B (zh) | 用于生成漫画头像生成模型的方法和装置 | |
US10902245B2 (en) | Method and apparatus for facial recognition | |
CN108427939B (zh) | 模型生成方法和装置 | |
CN108280477B (zh) | 用于聚类图像的方法和装置 | |
CN108269254B (zh) | 图像质量评估方法和装置 | |
CN108416323B (zh) | 用于识别人脸的方法和装置 | |
US10719693B2 (en) | Method and apparatus for outputting information of object relationship | |
CN108256479B (zh) | 人脸跟踪方法和装置 | |
CN108491823B (zh) | 用于生成人眼识别模型的方法和装置 | |
CN108830329B (zh) | 图片处理方法和装置 | |
CN108960316B (zh) | 用于生成模型的方法和装置 | |
CN108509892B (zh) | 用于生成近红外图像的方法和装置 | |
CN109447156B (zh) | 用于生成模型的方法和装置 | |
CN108460365B (zh) | 身份认证方法和装置 | |
CN109034069B (zh) | 用于生成信息的方法和装置 | |
CN108182412A (zh) | 用于检测图像类型的方法及装置 | |
CN111523413A (zh) | 生成人脸图像的方法和装置 | |
CN109389096B (zh) | 检测方法和装置 | |
CN108229375B (zh) | 用于检测人脸图像的方法和装置 | |
CN110298850B (zh) | 眼底图像的分割方法和装置 | |
CN114419363A (zh) | 基于无标注样本数据的目标分类模型训练方法及装置 | |
CN112215831B (zh) | 一种用于人脸图像质量的评价方法和系统 | |
CN111767750A (zh) | 图像处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |