CN104680119A - 图像身份识别方法和相关装置及身份识别系统 - Google Patents

图像身份识别方法和相关装置及身份识别系统 Download PDF

Info

Publication number
CN104680119A
CN104680119A CN201310632582.0A CN201310632582A CN104680119A CN 104680119 A CN104680119 A CN 104680119A CN 201310632582 A CN201310632582 A CN 201310632582A CN 104680119 A CN104680119 A CN 104680119A
Authority
CN
China
Prior art keywords
mover
msub
identity
mrow
rightarrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310632582.0A
Other languages
English (en)
Other versions
CN104680119B (zh
Inventor
张维
刘健庄
李志锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310632582.0A priority Critical patent/CN104680119B/zh
Priority to PCT/CN2014/081636 priority patent/WO2015078183A1/zh
Publication of CN104680119A publication Critical patent/CN104680119A/zh
Application granted granted Critical
Publication of CN104680119B publication Critical patent/CN104680119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了图像身份识别方法和相关装置和身份识别系统。一种图像身份识别方法,可包括:对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量;基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量;计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度;输出Z1个样本人脸图像对应的身份信息。本发明实施例的方案有利于提高图像身份识别的准确性和通用性,进而尽可能满足更多种应用场景的需求。

Description

图像身份识别方法和相关装置及身份识别系统
技术领域
本发明涉及图像处理技术领域,具体涉及图像身份识别方法和相关装置和身份识别系统。
背景技术
基于图像的人脸识别在人的身份鉴定、金融、保安系统和资料鉴定等领域具有广泛的应用。随着人的年龄增长,人脸会产生脸型轮廓,色素和纹理等方面的变化。例如,老龄人一般会显示出皱纹,色素沉着等。这些跟年龄相关联的变化使得匹配不同年龄的人脸变得非常具有挑战性。图1举例示出了同一个人在不同年龄阶段下的照片,可以看出,同一人的脸在不同年龄段是具有一定差异的。
现有一种流行的技术是基于生成型模型进行人脸身份识别,其核心思想是建立生成型模型来模拟人脸老化过程,具体其做法是先对测试的人脸图像做年龄补偿以抵消它和数据库中的参考人脸图像的年龄差异,然后再对补偿之后的图像做匹配。
在对现有技术的研究和实践过程中,本发明的发明人发现,尽管上述现有算法取得了一定效果,但它具有如下一些局限性,首先,构造这样的生成模型非常困难,因为人脸老化过程非常复杂,涉及到人的生理、心理、遗传、生活和工作习惯、人生经历等多方面的因素,难以用一个固定的老化模型对其精确表达。并且,在很多情况下年龄补偿效果并不好,反而引入了很多噪声,这对后期的识别反倒起了负作用。此外,这类算法需要一些格外信息比如人脸的年龄信息,但是在很多应用场合往往缺乏这类信息。因此,这类算法的有效性和适用性受到很多的限制。
发明内容
本发明实施例提供图像身份识别方法和相关装置和身份识别系统,以期进一步提高图像身份识别的准确性和通用性,进而尽可能满足更多种应用场景的需求。
本发明第一方面提供一种图像身份识别方法,可包括:
对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;
基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;
计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;
输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
结合第一方面,在第一种可能的实施方式中,
所述对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,包括:对待识别的人脸图像进行预处理;对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量。
结合第一方面的第一种可能的实施方式中,在第二种可能的实施方式中,所述对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,包括:从进行预处理后的所述待识别的人脸图像中提取原始综合特征向量,对提取到的所述原始综合特征向量进行降维处理以得到所述待识别的人脸图像对应的可用综合特征向量。
结合第一方面或第一方面的第一种可能的实施方式或第一方面的第一种可能的实施方式,在第三种可能的实施方式中,所述原始综合特征向量或可用综合特征向量基于梯度方向直方图得到。
结合第一方面或第一方面的第一种可能的实施方式或第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第四种可能的实施方式中,
所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T → = β → + U x → + V y → + ϵ → ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
结合第一方面的第四种可能的实施方式,在第五种可能的实施方式中,
所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量,包括:通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F → = UU T Σ - 1 ( T → - β → )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
结合第一方面或第一方面的第一种可能的实施方式或者第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式,在第六种可能的实施方式中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T → = [ t → 1 . . . . . . t → n ] ;
其中,所述身份-年龄因子模型如下:
t q → = β → q + U q x q → + V q y q → + ϵ → q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
结合第一方面的第六种可能的实施方式,在第七种可能的实施方式中,
所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量,包括:通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F → = [ f → 1 . . . . . . f → n ] ;
f q → = U q U q T Σ q - 1 ( t q → - β q → )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
结合第一方面或第一方面的第一种可能的实施方式或者第一方面的第一种可能的实施方式或第一方面的第三种可能的实施方式或第一方面的第四种可能的实施方式或第一方面的第五种可能的实施方式或第一方面的第六种可能的实施方式或第一方面的第七种可能的实施方式,在第八种可能的实施方式中,所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,通过所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离来表征。
本发明第二方面提供一种模型训练方法,可包括:
获取Z个样本人脸图像对应的可用综合特征向量;
利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数;
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中, T → = [ t → 1 . . . . . . t → n ] ;
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型如下:
t q → = β → q + U q x q → + V q y q → + ϵ → q
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 θ q = { β → q , U q , V q , σ q 2 } .
结合第二方面,在第一种可能的实施方式中,,所述可用综合特征向量基于梯度方向直方图得到。
本发明第三方面提供一种模型训练方法,可包括:
获取Z个样本人脸图像对应的可用综合特征向量;
利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数,
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中,所述身份-年龄因子模型如下:
T → = β → + U x → + V y → + ϵ → ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子,其中,所述模型参数 θ = { β → , U , V , σ 2 } .
结合第三方面,在第一种可能的实施方式中,所述可用综合特征向量基于梯度方向直方图得到。
本发明第四方面提供一种图像身份识别装置,可包括:
提取单元,用于对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;
计算单元,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;
匹配单元,用于计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;
输出单元,用于输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述匹配单元计算出所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
结合第四方面,在第一种可能的实施方式中,
所述提取单元具体用于,对待识别的人脸图像进行预处理;对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量。
结合第四方面的第一种可能的实施方式,在第二种可能的实施方式中,在所述对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量的方面,所述提取单元具体用于,从进行预处理后的所述待识别的人脸图像中提取原始综合特征向量,对提取到的所述原始综合特征向量进行降维处理以得到所述待识别的人脸图像对应的可用综合特征向量。
结合第四方面或第四方面的第一种可能的实施方式或者第四方面的第二种可能的实施方式,在第三种可能的实施方式中,所述原始综合特征向量或所述可用综合特征向量基于梯度方向直方图得到。
结合第四方面或第四方面的第一种可能的实施方式或者第四方面的第二种可能的实施方式或第四方面的第三种可能的实施方式,在第四种可能的实施方式中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T → = β → + U x → + V y → + ϵ → ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
结合第四方面的第四种可能的实施方式,在第五种可能的实施方式中,
所述计算单元具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F → = UU T Σ - 1 ( T → - β → )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
结合第四方面或第四方面的第一种可能的实施方式或者第四方面的第二种可能的实施方式或第四方面的第三种可能的实施方式,在第六种可能的实施方式中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T → = [ t → 1 . . . . . . t → n ] ;
其中,所述身份-年龄因子模型如下:
t q → = β → q + U q x q → + V q y q → + ϵ → q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
结合第四方面的第六种可能的实施方式,在第七种可能的实施方式中,
所述计算单元具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
其中, F → = [ f → 1 . . . . . . f → n ] ;
f q → = U q U q T Σ q - 1 ( t q → - β q → )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
结合第四方面或第四方面的第一种可能的实施方式或者第四方面的第二种可能的实施方式或第四方面的第三种可能的实施方式或第四方面的第四种可能的实施方式或第四方面的第五种可能的实施方式或第四方面的第六种可能的实施方式或第四方面的第七种可能的实施方式,在第八种可能的实施方式中,所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,通过所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离来表征。
本发明第五方面提供一种模型训练装置,可包括:
获取单元,用于获取Z个样本人脸图像对应的可用综合特征向量;
训练单元,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数;
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中, T → = [ t → 1 . . . . . . t → n ] ;
其中,所述身份-年龄因子模型如下:
t q → = β → q + U q x q → + V q y q → + ϵ → q
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 θ q = { β → q , U q , V q , σ q 2 } .
结合第五方面,在第一种可能的实施方式中,,所述可用综合特征向量基于梯度方向直方图得到。
本发明第六方面提供一种模型训练装置,包括:
获取单元,用于获取Z个样本人脸图像对应的可用综合特征向量;
训练单元,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数,
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中,所述身份-年龄因子模型如下:
T → = β → + U x → + V y → + ϵ → ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子,其中,所述模型参数 θ = { β → , U , V , σ 2 } .
结合第六方面,在第一种可能的实施方式中,所述可用综合特征向量基于梯度方向直方图得到。
本发明第七方面提供一种身份识别系统,包括:
客户端,用于向身份识别服务器发送待识别的人脸图像;
其中,所述身份识别服务器,用于接收来自所述客户端的所述待识别的人脸图像,对所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;想所述客户端输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
结合第七方面,在第一种可能的实施方式中,
所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T → = β → + U x → + V y → + ϵ → ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
结合第七方面的第一种可能的实施方式中,在第二种可能的实施方式中,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F → = UU T Σ - 1 ( T → - β → )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
结合第七方面,在第三种可能的实施方式中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T → = [ t → 1 . . . . . . t → n ] ;
其中,所述身份-年龄因子模型如下:
t q → = β → q + U q x q → + V q y q → + ϵ → q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
结合第七方面的第三种可能的实施方式中,在第四种可能的实施方式中,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F → = [ f → 1 . . . . . . f → n ] ;
f q → = U q U q T Σ q - 1 ( t q → - β q → )
的分段q对应的身份特征向量。
可以看出,本发明的一些实施例中,利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,并基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的由身份因子确定的身份特征向量,计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,并将Z个样本人脸图像之中,与上述待识别的人脸图像对应的身份特征向量的相似度满足要求的Z1个样本人脸图像对应的身份信息,作为上述待识别的人脸图像对应的可能身份信息进行输出。由于是利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的同一人的脸在不同年龄段的照片;
图2是本发明实施例提供的一种图像身份识别方法的流程示意图;
图3是本发明实施例提供的一种模型训练方法的流程示意图;
图4是本发明实施例提供的另一种模型训练方法的流程示意图;
图5是本发明实施例提供的一种图像身份识别装置的示意图;
图6是本发明实施例提供的一种模型训练装置的示意图;
图7是本发明实施例提供的另一种模型训练装置的示意图;
图8是本发明实施例提供的一种身份识别系统的示意图;
图9是本发明实施例提供的一种身份识别设备的示意图;
图10是本发明实施例提供的一种模型训练设备的示意图;
图11是本发明实施例提供的另一种模型训练设备的示意图。
具体实施方式
本发明实施例提供图像身份识别方法和相关装置和身份识别系统,以期进一步提高图像身份识别的准确性和通用性,进而尽可能满足更多种应用场景的需求。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
以下分别进行详细说明。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明一种图像身份识别方法的一个实施例,其中,一种图像身份识别方法可以包括:对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,其中,上述可用综合特征向量由用于描述上述待识别的人脸图像所对应人物的身份的身份因子和用于描述上述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,上述身份因子和上述年龄因子互不相关;基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量;计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,上述身份特征向量由身份因子确定,上述Z为正整数;输出Z1个样本人脸图像对应的身份信息,其中,上述Z1个样本人脸图像为上述Z个样本人脸图像的子集,上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,大于上述Z个样本人脸图像之中除上述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,或上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,上述输出的Z1个样本人脸图像对应的身份信息为上述待识别的人脸图像对应的可能身份信息。
参见图2,图2为本发明的一个实施例提供的一种图像身份识别方法的流程示意图。如图2所示,本发明的一个实施例提供的一种图像身份识别方法可包括以下内容:
201、对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,其中,上述可用综合特征向量由用于描述上述待识别的人脸图像所对应人物的身份的身份因子和用于描述上述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,上述身份因子和上述年龄因子互不相关。
其中,可通过多种可能的特征提取处理方式,对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量。在本发明一些可能的应用场景中,上述可用综合特征向量例如可基于梯度方向直方图或其它方式来得到。
在本发明一些可能的应用场景中,上述对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,可以包括:对待识别的人脸图像进行预处理(预处理可以包括几何校正、修剪和/或归一化处理等);对进行预处理后的上述待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量。当然,如果获得的待识别的人脸图像已经符合了直接进行特征提取的相关要求,则亦可省略对待识别的人脸图像进行预处理的步骤。在本发明的一些实施例中,原始综合特征向量例如可基于梯度方向直方图或基于其它方式来得到。
在本发明一些可能的应用场景中,上述对进行预处理后的上述待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,可以包括:从进行预处理后的上述待识别的人脸图像中提取原始综合特征向量,对提取到的上述原始综合特征向量进行降维处理以得到上述待识别的人脸图像对应的可用综合特征向量。其中,降维处理的方式可例如可以是PCA+LDA的的降维处理方式。可以理解,降维处理的主要目的是降低计算复杂度,如果具有足够的计算能力来支持,当然亦可不执行对提取到的上述原始综合特征向量进行降维处理的步骤,例如可直接将提取到的原始综合特征向量作为上述待识别的人脸图像对应的可用综合特征向量。
202、基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量。
203、计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,上述身份特征向量由身份因子确定,上述Z为正整数。
204、输出Z1个样本人脸图像对应的身份信息(其中,Z1个样本人脸图像中的每个样本人脸图像对应的身份信息是可用于指示出该样本人脸图像所对应人物的身份的任何信息(如姓名、身份证号、身份证图片、护照号和/或护照图片等等),甚至可以是样本人脸图像本身(若样本人脸图像用于指示出该样本人脸图像所对应人物的身份)),其中,上述Z1个样本人脸图像为上述Z个样本人脸图像的子集,上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,大于上述Z个样本人脸图像之中除上述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,或上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值。其中,上述输出的Z1个样本人脸图像对应的身份信息为上述待识别的人脸图像对应的可能身份信息。
在本发明一些可能的应用场景中,上述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述。
出于简化和稳定性等方面的考虑,身份-年龄因子模型例如可采用线性模型进行表达。并且,年龄特征向量和身份特征向量可以认为是分别由年龄因子和身份因子通过线性变换得到。
其中,上述身份-年龄因子模型例如可如下:
T → = β → + U x → + V y → + ϵ → .
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子。
基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量都由下面三个部分组成:身份信息年龄信息和噪声其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别;依赖于人脸图像所对应人物的年龄,可用于进行人物年龄估计。
其中,描述任何人脸图像对应的可用综合特征向量的身份-年龄因子模型都具有相同的模型参数 θ = { β → , U , V , σ 2 } . 可利用多个样本人脸图像对应的可用综合特征向量对上述身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数 θ = { β → , U , V , σ 2 } 的取值。
其中,基于上述可能的应用场景,上述基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量,具体可以包括:通过如下方式,基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量:
F → = UU T Σ - 1 ( T → - β → ) .
其中,上述表示上述身份特征向量,
其中,上述∑=σ2I+UUT+VVT
其中,身份因子的预测分布如下:
P ( x → | T → ) = N ( x → | U T Σ - 1 ( T → - β → ) , I - U T Σ - 1 U )
因此,
F &RightArrow; = U < x &RightArrow; | t &RightArrow; > = UU T &Sigma; - 1 ( t &RightArrow; - &beta; &RightArrow; ) .
在本发明另一些可能的应用场景中,上述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q .
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } , 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
其中,基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量的分段q对应的可用综合特征子向量都由下面三个部分组成:身份信息年龄信息和噪声
其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别。依赖于人脸图像所对应人物的年龄,可用于进行对应人物年龄的估计。
可以理解,上述举例中以对分段从1到n顺序编号为例来进行描述的,当然在实际应用中也可不按照顺序对各分段进行编号。
其中,描述任何人脸图像对应的可用综合特征向量所包含的分段q对应的可用综合特征子向量的身份-年龄因子模型都具有相同的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 可利用多个样本人脸图像对应的可用综合特征向量对上述身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的取值,对于用于描述每个分段对应的可用综合特征向量的身份-年龄因子模型所具有的模型参数的取值均可按照上述举例方式来确定。
其中,基于上述另一些可能的应用场景,上述基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量可包括:通过如下方式,基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,上述∑qq 2I+UqUq T+VqVq T
其中,上述表示上述身份特征向量,上述表示上述的分段q对应的身份特征向量。其中,由n个分段q对应的身份特征向量组成。
其中,身份因子的预测分布如下:
P ( x &RightArrow; q | t &RightArrow; q ) = N ( x &RightArrow; q | U q T &Sigma; q - 1 ( t &RightArrow; q - &beta; &RightArrow; q ) , I - U q T &Sigma; q - 1 U q )
因此,
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; ) .
在本发明的一些可能的应用场景中,上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,例如通过上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离(或能够表征两者相似度的其它参数)来表征。
举例来说,可用如下公式求取两个身份特征向量对应的余弦距离:
d c = 1 - F &RightArrow; n T F &RightArrow; m | | F &RightArrow; n | | | | F &RightArrow; m | |
其中,dc表示身份特征向量和身份特征向量的余弦距离。求取两个身份特征向量的欧氏距离或曼哈顿距离的方式此处不再具体详细描述。
可以看出,本实施例中利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,并基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的由身份因子确定的身份特征向量,计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,并将Z个样本人脸图像之中,与上述待识别的人脸图像对应的身份特征向量的相似度满足要求的Z1个样本人脸图像对应的身份信息,作为上述待识别的人脸图像对应的可能身份信息进行输出。由于是利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
为便于更好的理解和实施上述图像身份识别方法,下面通过一些具体的应用场合进行举例说明。本发明实施例的上述方案可用于需验证或识别跨年龄阶段的不同人脸图像的多种应用场合。
其中,一种可能应用场景为相册管理。在当今社会,由于各种数码采集设备(手机、数码相机、数码摄像机、平板电脑等)的飞速发展和普及,用户的电脑里经常储存了海量的数码照片,其中,绝大部分是和使用人或其亲戚朋友密切相关的,因此,很有必要根据照片中出现的人脸的身份来更有效地进行区分储存、管理、检索这些照片,这就涉及到跨年龄阶段人脸识别。通过对不同照片中的人脸进行识别,找出身份相同的照片,可根据识别结果对照片做相应的储存和管理。
另一种可能应用场景可以为,用于政府相关部门检测申请人是否具有多重证件(比如护照等)。在现实生活中,有时有这样的情况,一个人用不同的名字在不同时期申请和拥有不止一本护照。迄今为止,政府相关部门主要是根据申请人的姓名和身份证号等文字信息来判别是否有这种现象,但是这种做法只防君子不防小人。对于那些有意用虚假身份信息来申报多重护照的人,传统的手段难以解决问题。因此,一个可行的思路是采用本发明实施例提出的方案来进行跨年龄阶段的人脸识别。例如,对于护照的申请人根据其提供的护照标准照片,在现有的已发护照的标准人脸图像数据库中利用本发明提出的方案进行相似度检索,可能在数据库中找出和输入照片最像的若干(例如50张或100张)照片,然后可通过人工进一步核准。
可以看出,本发明实施例的方案,引入新的隐形因子分析模型,可以显著提高跨年龄阶段人脸识别性能,具有广泛的应用价值。例如在国际上最大的人脸年龄数据库(MORPH)上做了大规模测试,在一些情况下识别率达到国际领先水平。
下面还提供几种身份-年龄因子模型的训练方法。
请参见图3,图3为本发明的一个实施例提供的一种模型训练方法的流程示意图。其中,如图3所示,本发明的一个实施例提供的一种模型训练方法可包括以下内容:
301、获取Z个样本人脸图像对应的可用综合特征向量。
302、利用上述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数。
其中,上述可用综合特征向量通过身份-年龄因子模型描述,
其中,上述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子,其中,上述模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量都由下面三个部分组成:身份信息年龄信息和噪声其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别;依赖于人脸图像所对应人物的年龄,可用于进行人物年龄估计。
在本发明一些可能的实施方式中,上述可用综合特征向量基于梯度方向直方图或基于其它方式得到。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; , 由于身份-年龄因子模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } , 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } 的取值,训练好的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
为便于更好的理解和实施上述模型训练方法,下面通过一些具体的应用场景进行举例说明。
假设待训练的身份-年龄因子模型如下所示:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; .
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子。
上述身份-年龄因子模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
例如可通过最大化联合概率分布公式来最优化模型参数,其中,最大化联合概率分布公式例如可如下公式1所示:
L = &Sigma; i , k ln p &theta; ( T &RightArrow; i k , x &RightArrow; i , y &RightArrow; k )
其中,公式1中,k表示样本人脸图像所对应人物的年龄,i表示样本人脸图像所对应人物的身份标识,表示身份标识为i且年龄为k的样本人脸图像对应的可用综合特征向量,表示身份标识为i的样本人脸图像所对应人物的身份因子,是年龄为k的样本人脸图像所对应人物的年龄因子,pθ表示在给定模型参数θ的条件之下,联合概率分布。其中,L表示联合概率分布。
其中,由于公式1中的两个隐形因子不能直接观测。例如可采用坐标上升算法对因子进行分析,即在一个因子固定的情况下对另一个隐形因子进行优化。其中,对于给定的模型参数θ,可估计出先验概率分布从而可以通过最大化联合概率分布L的条件期望来得到先验概率分布进而更新模型参数θ的取值。
也就是说,给定初始化估计值θ0,通过最大化如下公式2中的Lc来得到一个新的θ:
L c = &Sigma; i , k &Integral; p &theta; 0 ( x &RightArrow; i , y &RightArrow; k | T ) ln p &theta; ( t &RightArrow; i k , x &RightArrow; i , y &RightArrow; k ) d x &RightArrow; i d y &RightArrow; k
其中,公式2中的T表示样本集合中的各样本人脸图像(假设有Z个样本人脸图像)对应的可用综合特征向量,Lc是联合概率分布L在给定初始模型参数θ0的条件期望。其中,因为隐形因子未知,因此L不能直接最大化。但是可通过初始化模型参数θ0来估计隐形因子的分布,进而得到在下分布之下联合概率分布L的条件期望,该条件期望即Lc
下面提出上述身份-年龄因子模型适应化的最大条件期望值(EM)算法:
输入为:标有身份和年龄的样本图像的特征向量集
输出为:特征模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 }
具体的,可先初始化下面几个参数:
σ2←0.1、
U←rand(-0.1,0.1)、
V←rand(-0.1,0.1);
将初始化的σ2、U、V带入身份-年龄因子模型公式中,求得
基于模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } 计算隐形因子
其中,
< x &RightArrow; i > = &Phi; - 1 U T &Sigma; - 1 Nc i &Sigma; k ( T &RightArrow; i k - &beta; &RightArrow; ) ;
< x &RightArrow; i x &RightArrow; i T > = &Phi; - 1 Nc i + < x &RightArrow; i > < x &RightArrow; i > T
< y &RightArrow; k > = W - 1 V T C - 1 Ns k &Sigma; i = 1 ( T &RightArrow; i k - &beta; &RightArrow; )
< y &RightArrow; k y &RightArrow; k T > = W - 1 Ns k + < y &RightArrow; k > < y &RightArrow; k > T ;
其中,Σ=σ2I+VVT
C=σ2I+UUT
Φ=I+UTΣ-1U;
W=I+VTC-1V。
其中,上述Nci表示训练样本人脸图像中,身份标识为i的样本人脸图像的个数,上述Nsk表示训练样本人脸图像中,年龄为k的样本人脸图像的个数。
基于计算出的隐形因子更新模型参数σ2、U和V。
其中,
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
&sigma; 2 = 1 Nd &Sigma; i , k T &RightArrow; i k - &beta; &RightArrow; - U < x &RightArrow; i > - V < y &RightArrow; k > T ( T &RightArrow; i k - &beta; &RightArrow; ) ;
其中, A = &Sigma; i , k < x &RightArrow; i x &RightArrow; i T > ; B = &Sigma; i , k < y &RightArrow; k y &RightArrow; k T > ;
C = &Sigma; i , k ( T &RightArrow; i k - &beta; &RightArrow; ) < x &RightArrow; i > T ;
D = &Sigma; i , k ( T &RightArrow; i k - &beta; &RightArrow; ) < y &RightArrow; k > T
E = &Sigma; i , k < y &RightArrow; k > < x &RightArrow; i > T ;
F = &Sigma; i , k < x &RightArrow; i > < y &RightArrow; k > T .
其中,上述N表示样本人脸图像的总个数,d是样本本人脸图像的可用综合特征向量的长度。
基于上述方式,利用Z个样本人脸图像对应的可用综合特征向量中的多个可用综合特征向量多次求取参数σ2、U和V,直到收敛。通过上述算法可较准确地计算出上述身份-年龄因子模型的模型参数
当然亦可通过其它方式训练得到模型参数的具体取值。并不限于上述举例的训练方法。
请参见图4,图4为本发明的一个实施例提供的另一种模型训练方法的流程示意图。其中,如图4所示,本发明的一个实施例提供的另一种模型训练方法可包括以下内容:
401、获取Z个样本人脸图像对应的可用综合特征向量。
当然,Z个样本人脸图像对应的可用综合特征向量中的身份因子和年龄因子均已确定。
402、利用上述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数。
其中,上述可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
其中,基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量的分段q对应的可用综合特征子向量都由下面三个部分组成:身份信息年龄信息和噪声
其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别。依赖于人脸图像所对应人物的年龄,可用于进行对应人物年龄的估计。
可以理解,上述举例中以对分段从1到n顺序编号为例来进行描述的,当然在实际应用中也可不按照顺序对各分段进行编号。
在本发明一些可能的实施方式中,上述可用综合特征向量基于梯度方向直方图或基于其它方式得到。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q , 由于身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的取值,训练好的各分段对应的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
为便于更好的理解和实施上述模型训练方法,下面通过一些具体的应用场景进行举例说明。
假设可用综合特征向量的分段q对应的可用综合特征子向量的对应的待训练身份-年龄因子模型如下所示:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q .
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
例如可通过最大化联合概率分布公式来最优化模型参数,其中,最大化联合概率分布公式例如可如下公式3所示:
L q = &Sigma; i , k ln p &theta; q ( t &RightArrow; ( q , i ) k , x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) )
其中,公式2中,k表示样本人脸图像所对应人物的年龄,i表示样本人脸图像所对应人物的身份标识,其中,表示身份标识为i且年龄为k的样本人脸图像对应的中的分段q对应的可用综合特征子向量,表示所对应的身份因子,所对应的年龄因子,表示在给定模型参数θq的条件之下,联合概率分布。
其中,Lq表示联合概率分布。其中,可基于对应不同年龄不同身份的多个样本人脸图像上进行试验。
其中,由于身份-年龄因子模型中的两个隐形因子不能直接观测。例如可采用坐标上升算法对因子进行分析,即在一个因子固定的情况下对另一个隐形因子进行优化。其中,对于给定的模型参数θq,可估计出先验概率分布从而可以通过最大化联合概率分布Lq的条件期望来得到先验概率分布进而更新模型参数θq的取值。
也就是说,给定初始化估计值θ(q,0),通过最大化如下公式4中的来得到一个新的θq
L c q = &Sigma; i , k &Integral; ( p &theta; ( q , 0 ) ( x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) | T q ) *
ln p &theta; ( q , 0 ) ( t &RightArrow; ( q , i ) k , x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) ) d x &RightArrow; ( q , i ) d y &RightArrow; ( q , k )
其中,公式4中的 T q = { t &RightArrow; ( q , i ) k } , Tq表示样本集合中的各样本人脸图像(假设有Z个样本人脸图像)对应的可用综合特征向量之中的分段q对应的可用综合特征子向量,是联合概率分布Lq在给定初始模型参数θ(q,0)的条件期望。其中,因为,隐形因子未知,因此L不能直接最大化。但是可通过初始化模型参数θ(q,0)来估计隐形因子的分布,进而得到在下分布之下联合概率分布Lq的条件期望,该条件期望即Lc
下面提出上述身份-年龄因子模型适应化的最大期望值(EM)算法:
输入为:多个标有身份和年龄的样本人脸图像可用综合特征向量中的分段q对应的可用综合特征子向量组成的特征子向量集:
T q = { t &RightArrow; ( q , i ) k }
输出为:分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数:
&theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 }
具体的,可先初始化下面几个参数:
σq 2←0.1、
Uq←rand(-0.1,0.1)、
Vq←rand(-0.1,0.1);
将初始化的σq 2、Uq、Vq带入身份-年龄因子模型公式中,求得
基于模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 计算隐形因子
其中,
< x &RightArrow; ( q , i ) > = &Phi; - 1 U q T &Sigma; - 1 Nc i &Sigma; k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) ;
< x &RightArrow; ( q , i ) x &RightArrow; ( q , i ) T > = &Phi; - 1 Nc i + < x &RightArrow; ( q , i ) > < x &RightArrow; ( q , i ) > T ;
< y &RightArrow; ( q , k ) > = W - 1 V q T C - 1 Ns k &Sigma; i = 1 ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) ;
< y &RightArrow; ( q , k ) y &RightArrow; ( q , k ) T > = W - 1 Ns k + < y &RightArrow; ( q , k ) > < y &RightArrow; ( q , k ) > T ;
其中,Σ=σq 2I+VqVq T
C=σq 2I+UqUq T
Φ=I+Uq TΣ-1Uq
W=I+Vq TC-1Vq
其中,上述Nci表示训练样本人脸图像中,身份标识为i的样本人脸图像的个数,上述Nsk表示训练样本人脸图像中,年龄为k的样本人脸图像的个数。
进一步基于计算出的隐形因子更新模型参数σq 2、Uq和Vq
其中,
Uq=(C-DB-1E)(A-FB-1E)-1
Vq=(D-CA-1F)(B-EA-1F)-1
&sigma; q 2 = 1 Nd &Sigma; i , k t &RightArrow; ( q , i ) k - &beta; &RightArrow; q - U q < x &RightArrow; ( q , i ) > - V q < y &RightArrow; ( q , k ) > T ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; )
其中, A = &Sigma; i , k < x &RightArrow; ( q , i ) x &RightArrow; ( q , i ) T > .
B = &Sigma; i , k < y &RightArrow; ( q , k ) y &RightArrow; ( q , k ) T > .
C = &Sigma; i , k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) < x &RightArrow; ( q , i ) > T .
D = &Sigma; i , k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) < y &RightArrow; ( q , k ) > T .
E = &Sigma; i , k < y &RightArrow; ( q , k ) > < x &RightArrow; ( q , i ) > T .
F = &Sigma; i , k < x &RightArrow; ( q , i ) > < y &RightArrow; ( q , k ) > T .
其中,上述N表示样本人脸图像的总个数,d是样本本人脸图像的可用综合特征向量的分度q对应的可用综合特征子向量的长度。
基于上述方式,利用Z个样本人脸图像对应的可用综合特征向量之中分段q对应的可用综合特征子向量多次求取参数σq 2、Uq和Vq,直到收敛为止。其中,通过上述算法可较准确地计算出上述分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 当然,亦可通过其它方式训练得到模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的具体取值。并不限于上述举例的训练方法。通过上述举例的方式,亦可得到其它分段对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数。
为便于更好的理解和实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
参见图5,本发明实施例提供一种图像身份识别装置500,可包括:
提取单元510、计算单元520、匹配单元530和输出单元540。
其中,提取单元510,用于对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;
计算单元520,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;
匹配单元530,用于计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;
输出单元540,用于输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述匹配单元计算出所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
在本发明的一些实施例中,提取单元510可具体用于,对待识别的人脸图像进行预处理;对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量。
在本发明的一些实施例中,在所述对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量的方面,提取单元510可具体用于,从进行预处理后的所述待识别的人脸图像中提取原始综合特征向量,对提取到的所述原始综合特征向量进行降维处理以得到所述待识别的人脸图像对应的可用综合特征向量。
在本发明的一些实施例中,所述原始综合特征向量或所述可用综合特征向量基于梯度方向直方图得到。
在本发明的一些实施例中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
在本发明的一些实施例中,计算单元520具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
在本发明的另一些实施例中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
在本发明的一些实施例中,计算单元520具体用于,通过如下方式基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
其中, F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
在本发明的一些实施例中,所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,通过所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离来表征。
可以理解的是,本实施例的装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例中利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,并基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的由身份因子确定的身份特征向量,计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,并将Z个样本人脸图像之中,与上述待识别的人脸图像对应的身份特征向量的相似度满足要求的Z1个样本人脸图像对应的身份信息,作为上述待识别的人脸图像对应的可能身份信息进行输出。由于是利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
参见图6,本发明实施例还提供一种模型训练装置600,包括:
获取单元610和训练单元620。
获取单元610,用于获取Z个样本人脸图像对应的可用综合特征向量。
训练单元620,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数;
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
在本发明的一些实施例中,所述可用综合特征向量基于梯度方向直方图得到。
可以理解的是,本实施例的装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q , 由于身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的取值,训练好的各分段对应的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
参见图7,本发明实施例还提供另一种模型训练装置700,可包括:
获取单元710,用于获取Z个样本人脸图像对应的可用综合特征向量;
训练单元720,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数,
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子,其中,所述模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
在本发明的一些实施例中,所述可用综合特征向量基于梯度方向直方图得到。
可以理解的是,本实施例的装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; , 由于身份-年龄因子模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } . 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } 的取值,训练好的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
参见图8,本发明实施例还提供一种身份识别系统,可包括:
客户端810和身份识别服务器820。
客户端810,用于向身份识别服务器820发送待识别的人脸图像;
其中,身份识别服务器820,用于接收来自客户端810的所述待识别的人脸图像,对所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;想所述客户端输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
在本发明的一些实施例中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
在本发明的一些实施例中,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
在本发明的一些实施例中,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
在本发明的一些实施例中,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
可以理解的是,本实施例的装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例中是身份识别服务器利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,并基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的由身份因子确定的身份特征向量,计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,并将Z个样本人脸图像之中,与上述待识别的人脸图像对应的身份特征向量的相似度满足要求的Z1个样本人脸图像对应的身份信息,作为上述待识别的人脸图像对应的可能身份信息进行输出。由于是利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
参见图9,图9描述了本发明实施例提供的身份识别设备900的结构,该身份识别设备900包括:至少一个处理器901,例如CPU,至少一个网络接口904或者其他用户接口903,存储器905,至少一个通信总线902。通信总线902用于实现这些组件之间的连接通信。身份识别设备900可选的包含用户接口903,包括显示器,键盘或点击设备(如鼠标,轨迹球(trackball),触感板或者触感显示屏)。存储器905可能包含高速RAM存储器,当然也还可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器905可选的可以包含至少一个位于远离前述处理器901的存储装置。
在一些实施方式中,存储器905存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
操作系统9051,包含各种系统程序,用于实现各种基础业务以及处理基于硬件的任务;
应用程序模块9052,包含各种应用程序,用于实现各种应用业务。
应用程序模块9052中包括但不限于提取单元510、计算单元520、匹配单元530和输出单元540。
应用程序模块9052中各模块的具体实现参见图5所示实施例中的相应模块,在此不赘述。
在本发明一些实施例中,通过调用存储器905存储的程序或指令,处理器901可用于:对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,其中,上述可用综合特征向量由用于描述上述待识别的人脸图像所对应人物的身份的身份因子和用于描述上述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,上述身份因子和上述年龄因子互不相关。基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量;计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,上述身份特征向量由身份因子确定,上述Z为正整数;输出Z1个样本人脸图像对应的身份信息(其中,Z1个样本人脸图像中的每个样本人脸图像对应的身份信息是可用于指示出该样本人脸图像所对应人物的身份的任何信息(如姓名、身份证号、身份证图片、护照号和/或护照图片等等),甚至可以是样本人脸图像本身(若样本人脸图像用于指示出该样本人脸图像所对应人物的身份)),其中,上述Z1个样本人脸图像为上述Z个样本人脸图像的子集,上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,大于上述Z个样本人脸图像之中除上述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度,或上述Z1个样本人脸图像对应的身份特征向量与上述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值。其中,上述输出的Z1个样本人脸图像对应的身份信息为上述待识别的人脸图像对应的可能身份信息。
其中,可通过多种可能的特征提取处理方式,对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量。在本发明一些可能的应用场景中,上述可用综合特征向量例如可基于梯度方向直方图或其它方式来得到。
在本发明一些可能的应用场景中,上述对待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,可以包括:对待识别的人脸图像进行预处理(预处理可以包括几何校正、修剪和/或归一化处理等);对进行预处理后的上述待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量。当然,如果获得的待识别的人脸图像已经符合了直接进行特征提取的相关要求,则亦可省略对待识别的人脸图像进行预处理的步骤。在本发明的一些实施例中,原始综合特征向量例如可基于梯度方向直方图或基于其它方式来得到。
在本发明一些可能的应用场景中,上述对进行预处理后的上述待识别的人脸图像进行特征提取处理以得到上述待识别的人脸图像对应的可用综合特征向量,可以包括:从进行预处理后的上述待识别的人脸图像中提取原始综合特征向量,对提取到的上述原始综合特征向量进行降维处理以得到上述待识别的人脸图像对应的可用综合特征向量。其中,降维处理的方式可例如可以是PCA+LDA的的降维处理方式。可以理解,降维处理的主要目的是降低计算复杂度,如果具有足够的计算能力来支持,当然亦可不执行对提取到的上述原始综合特征向量进行降维处理的步骤,例如可直接将提取到的原始综合特征向量作为上述待识别的人脸图像对应的可用综合特征向量。
在本发明一些可能的应用场景中,上述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述。
出于简化和稳定性等方面的考虑,身份-年龄因子模型例如可采用线性模型进行表达。并且,年龄特征向量和身份特征向量可以认为是分别由年龄因子和身份因子通过线性变换得到。
其中,上述身份-年龄因子模型例如可如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; .
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子。
基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量都由下面三个部分组成:身份信息年龄信息和噪声其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别;依赖于人脸图像所对应人物的年龄,可用于进行人物年龄估计。
其中,描述任何人脸图像对应的可用综合特征向量的身份-年龄因子模型都具有相同的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } . 可利用多个样本人脸图像对应的可用综合特征向量对上述身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数的取值。
其中,基于上述可能的应用场景,上述基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量,具体可以包括:通过如下方式,基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; ) .
其中,上述表示上述身份特征向量,
其中,上述∑=σ2I+UUT+VVT
其中,身份因子的预测分布如下:
P ( x &RightArrow; | T &RightArrow; ) = N ( x &RightArrow; | U T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; ) , I - U T &Sigma; - 1 U )
因此,
F &RightArrow; = U < x &RightArrow; | t &RightArrow; > = UU T &Sigma; - 1 ( t &RightArrow; - &beta; &RightArrow; ) .
在本发明另一些可能的应用场景中,上述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q .
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
其中,基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量的分段q对应的可用综合特征子向量都由下面三个部分组成:身份信息年龄信息和噪声
其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别。依赖于人脸图像所对应人物的年龄,可用于进行对应人物年龄的估计。
可以理解,上述举例中以对分段从1到n顺序编号为例来进行描述的,当然在实际应用中也可不按照顺序对各分段进行编号。
其中,描述任何人脸图像对应的可用综合特征向量所包含的分段q对应的可用综合特征子向量的身份-年龄因子模型都具有相同的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 可利用多个样本人脸图像对应的可用综合特征向量对上述身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的取值,对于用于描述每个分段对应的可用综合特征向量的身份-年龄因子模型所具有的模型参数的取值均可按照上述举例方式来确定。
其中,基于上述另一些可能的应用场景,上述基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量可包括:通过如下方式,基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,上述∑qq 2I+UqUq T+VqVq T
其中,上述表示上述身份特征向量,上述表示上述的分段q对应的身份特征向量。其中,由n个分段q对应的身份特征向量组成。
其中,身份因子的预测分布如下:
P ( x &RightArrow; q | t &RightArrow; q ) = N ( x &RightArrow; q | U q T &Sigma; q - 1 ( t &RightArrow; q - &beta; &RightArrow; q ) , I - U q T &Sigma; q - 1 U q )
因此,
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; ) .
在本发明的一些可能的应用场景中,上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,例如通过上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离(或能够表征两者相似度的其它参数)来表征。
举例来说,可用如下公式求取两个身份特征向量对应的余弦距离:
d c = 1 - F &RightArrow; n T F &RightArrow; m | | F &RightArrow; n | | | | F &RightArrow; m | |
其中,dc表示身份特征向量和身份特征向量的余弦距离。求取两个身份特征向量的欧氏距离或曼哈顿距离的方式此处不再具体详细描述。
可以看出,本实施例中利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,并基于上述待识别的人脸图像对应的可用综合特征向量计算上述待识别的人脸图像所对应的由身份因子确定的身份特征向量,计算上述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,并将Z个样本人脸图像之中,与上述待识别的人脸图像对应的身份特征向量的相似度满足要求的Z1个样本人脸图像对应的身份信息,作为上述待识别的人脸图像对应的可能身份信息进行输出。由于是利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
参见图10,图10描述了本发明实施例的模型训练设备1000的结构,该模型训练设备1000包括:至少一个处理器1001,例如CPU,至少一个网络接口1004或者其他用户接口1003,存储器1005,至少一个通信总线1002。通信总线1002用于实现这些组件之间的连接通信。其中,模型训练设备1000可选的包含用户接口1003,包括:显示器,键盘或点击设备(如鼠标,轨迹球(trackball),触感板或者触感显示屏)。存储器1005可能包含高速RAM存储器,当然也还可能包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的可以包含至少一个位于远离前述处理器1001的存储装置。
在一些实施方式中,存储器1005存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
操作系统10051,包含各种系统程序,用于实现各种基础业务以及处理基于硬件的任务;
应用程序模块10052,包含各种应用程序,用于实现各种应用业务。
应用程序模块10052中包括但不限于获取单元610和训练单元620。
应用程序模块10052中各模块的具体实现参见图6所示实施例中的相应模块,在此不赘述。
本发明一些实施例中,通过调用存储器1005存储的程序或指令,处理器1001可用于:获取Z个样本人脸图像对应的可用综合特征向量(当然,Z个样本人脸图像对应的可用综合特征向量中的身份因子和年龄因子均已确定)利用上述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数。
其中,上述可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } , 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
其中,基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量的分段q对应的可用综合特征子向量都由下面三个部分组成:身份信息年龄信息和噪声
其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别。依赖于人脸图像所对应人物的年龄,可用于进行对应人物年龄的估计。
可以理解,上述举例中以对分段从1到n顺序编号为例来进行描述的,当然在实际应用中也可不按照顺序对各分段进行编号。
在本发明一些可能的实施方式中,上述可用综合特征向量基于梯度方向直方图或基于其它方式得到。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q , 由于身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } , 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的取值,训练好的各分段对应的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
假设可用综合特征向量的分段q对应的可用综合特征子向量的对应的待训练身份-年龄因子模型如下所示:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q .
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] .
其中,上述q=1,2,......n。
其中,上述表示上述可用综合特征向量,上述n表示上述可用综合特征向量的分段总数(即,可用综合特征向量被划分为等长度或不等长度的n个分段,每个分段对应一个可用综合特征子向量,包括n个分段对应的可用综合特征子向量,即包括n个可用综合特征子向量),上述表示的分段q对应的可用综合特征子向量。上述Uq表示对应的身份因子系数。上述Vq表示对应的年龄因子系数,上述表示对应的样本特征平均值。其中,上述表示对应的身份因子,上述表示对应的年龄因子,其中,上述表示对应的高斯白噪声,其中,对应的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 即,用于描述可用综合特征向量的分段q对应的可用综合特征子向量的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
处理器1001例如可通过最大化联合概率分布公式来最优化模型参数,其中,最大化联合概率分布公式例如可如下公式3所示:
L q = &Sigma; i , k ln p &theta; q ( t &RightArrow; ( q , i ) k , x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) )
其中,公式2中,k表示样本人脸图像所对应人物的年龄,i表示样本人脸图像所对应人物的身份标识,其中,表示身份标识为i且年龄为k的样本人脸图像对应的中的分段q对应的可用综合特征子向量,表示所对应的身份因子,所对应的年龄因子,表示在给定模型参数θq的条件之下,联合概率分布。
其中,Lq表示联合概率分布。其中,可基于对应不同年龄不同身份的多个样本人脸图像上进行试验。
其中,由于身份-年龄因子模型中的两个隐形因子不能直接观测。例如可采用坐标上升算法对因子进行分析,即在一个因子固定的情况下对另一个隐形因子进行优化。其中,对于给定的模型参数θq,可估计出先验概率分布从而可以通过最大化联合概率分布Lq的条件期望来得到先验概率分布进而更新模型参数θq的取值。
也就是说,给定初始化估计值θ(q,0),通过最大化如下公式4中的来得到一个新的θq
L c q = &Sigma; i , k &Integral; ( p &theta; ( q , 0 ) ( x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) | T q ) *
ln p &theta; ( q , 0 ) ( t &RightArrow; ( q , i ) k , x &RightArrow; ( q , i ) , y &RightArrow; ( q , k ) ) d x &RightArrow; ( q , i ) d y &RightArrow; ( q , k )
其中,公式4中的 T q = { t &RightArrow; ( q , i ) k } , Tq表示样本集合中的各样本人脸图像(假设有Z个样本人脸图像)对应的可用综合特征向量之中的分段q对应的可用综合特征子向量,是联合概率分布Lq在给定初始模型参数θ(q,0)的条件期望。其中,因为,隐形因子未知,因此L不能直接最大化。但是可通过初始化模型参数θ(q,0)来估计隐形因子的分布,进而得到在下分布之下联合概率分布Lq的条件期望,该条件期望即Lc
下面提出上述身份-年龄因子模型适应化的最大期望值(EM)算法:
输入为:多个标有身份和年龄的样本人脸图像可用综合特征向量中的分段q对应的可用综合特征子向量组成的特征子向量集:
T q = { t &RightArrow; ( q , i ) k }
输出为:分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数:
&theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 }
具体的,可先初始化下面几个参数:
σq 2←0.1、
Uq←rand(-0.1,0.1)、
Vq←rand(-0.1,0.1);
将初始化的σq 2、Uq、Vq带入身份-年龄因子模型公式中,求得
基于模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 计算隐形因子
其中,
< x &RightArrow; ( q , i ) > = &Phi; - 1 U q T &Sigma; - 1 Nc i &Sigma; k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) ;
< x &RightArrow; ( q , i ) x &RightArrow; ( q , i ) T > = &Phi; - 1 Nc i + < x &RightArrow; ( q , i ) > < x &RightArrow; ( q , i ) > T ;
< y &RightArrow; ( q , k ) > = W - 1 V q T C - 1 Ns k &Sigma; i = 1 ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) ;
< y &RightArrow; ( q , k ) y &RightArrow; ( q , k ) T > = W - 1 Ns k + < y &RightArrow; ( q , k ) > < y &RightArrow; ( q , k ) > T ;
其中,Σ=σq 2I+VqVq T
C=σq 2I+UqUq T
Φ=I+Uq TΣ-1Uq
W=I+Vq TC-1Vq
其中,上述Nci表示训练样本人脸图像中,身份标识为i的样本人脸图像的个数,上述Nsk表示训练样本人脸图像中,年龄为k的样本人脸图像的个数。
进一步基于计算出的隐形因子更新模型参数σq 2、Uq和Vq
其中,
Uq=(C-DB-1E)(A-FB-1E)-1
Vq=(D-CA-1F)(B-EA-1F)-1
&sigma; q 2 = 1 Nd &Sigma; i , k t &RightArrow; ( q , i ) k - &beta; &RightArrow; q - U q < x &RightArrow; ( q , i ) > - V q < y &RightArrow; ( q , k ) > T ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; )
其中, A = &Sigma; i , k < x &RightArrow; ( q , i ) x &RightArrow; ( q , i ) T > .
B = &Sigma; i , k < y &RightArrow; ( q , k ) y &RightArrow; ( q , k ) T > .
C = &Sigma; i , k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) < x &RightArrow; ( q , i ) > T .
D = &Sigma; i , k ( t &RightArrow; ( q , i ) k - &beta; q &RightArrow; ) < y &RightArrow; ( q , k ) > T .
E = &Sigma; i , k < y &RightArrow; ( q , k ) > < x &RightArrow; ( q , i ) > T .
F = &Sigma; i , k < x &RightArrow; ( q , i ) > < y &RightArrow; ( q , k ) > T .
其中,上述N表示样本人脸图像的总个数,d是样本本人脸图像的可用综合特征向量的分度q对应的可用综合特征子向量的长度。
基于上述方式,利用Z个样本人脸图像对应的可用综合特征向量之中分段q对应的可用综合特征子向量多次求取参数σq 2、Uq和Vq,直到收敛为止。其中,通过上述算法可较准确地计算出上述分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } . 当然,亦可通过其它方式训练得到模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } 的具体取值。并不限于上述举例的训练方法。通过上述举例的方式,亦可得到其它分段对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数。
参见图11,图11描述了本发明实施例的模型训练设备1100的结构,该模型训练设备1100包括:至少一个处理器1101,例如CPU,至少一个网络接口1104或者其他用户接口1103,存储器1105,至少一个通信总线1102。通信总线1102用于实现这些组件之间的连接通信。其中,模型训练设备1100可选的包含用户接口1103,包括:显示器,键盘或点击设备(如鼠标,轨迹球(trackball),触感板或者触感显示屏)。存储器1105可能包含高速RAM存储器,当然也还可能包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1105可选的可以包含至少一个位于远离前述处理器1101的存储装置。
在一些实施方式中,存储器1105存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
操作系统11051,包含各种系统程序,用于实现各种基础业务以及处理基于硬件的任务;
应用程序模块11052,包含各种应用程序,用于实现各种应用业务。
应用程序模块11052中包括但不限于获取单元710和训练单元720。
应用程序模块11052中各模块的具体实现参见图7所示实施例中的相应模块,在此不赘述。
本发明一些实施例中,通过调用存储器1105存储的程序或指令,处理器1101可用于:获取Z个样本人脸图像对应的可用综合特征向量。利用上述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定上述身份-年龄因子模型的模型参数。
其中,上述可用综合特征向量通过身份-年龄因子模型描述,
其中,上述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子,其中,上述模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
基于上述身份-年龄因子模型可看出,任何人脸图像对应的可用综合特征向量都由下面三个部分组成:身份信息年龄信息和噪声其中,依赖于人脸图像所对应人物的身份,可认为不随着人物年龄进行变化,可用于进行人物身份识别;依赖于人脸图像所对应人物的年龄,可用于进行人物年龄估计。
在本发明一些可能的实施方式中,上述可用综合特征向量基于梯度方向直方图或基于其它方式得到。
可以看出,本实施例中提出人脸图像对应的可用综合特征向量可通过身份-年龄因子模型描述,其中,上述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; , 由于身份-年龄因子模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } . 因此利用Z个样本人脸图像对应的可用综合特征向量可以对上述身份-年龄因子模型进行训练以确定模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } 的取值,训练好的身份-年龄因子模型能够为任何待识别的人脸图像的识别奠定良好基础。其中,由于利用互不相关的身份因子和年龄因子来共同确定待识别的人脸图像的可用综合特征向量,因此有利于将待识别的人脸图像的可用综合特征向量中包含的与身份相关的特征剥离出来,进而有利于剔除待识别的人脸图像的可用综合特征向量中包含的与年龄相关的特征对身份识别的影响,进而有利于提高图像身份识别的准确性和通用性,进而有利于尽可能满足更多种应用场景的需求。
为便于更好的理解和实施上述模型训练方法,下面通过一些具体的应用场景进行举例说明。
假设处理器1101待训练的身份-年龄因子模型如下所示:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; .
其中,上述表示上述可用综合特征向量,上述表示样本特征平均值,上述U表示身份因子系数,上述V表示年龄因子系数,,上述表示高斯白噪声,上述表示身份因子,上述表示年龄因子。
上述身份-年龄因子模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
例如处理器1101可通过最大化联合概率分布公式来最优化模型参数,其中,最大化联合概率分布公式例如可如下公式1所示:
L = &Sigma; i , k ln p &theta; ( T &RightArrow; i k , x &RightArrow; i , y &RightArrow; k )
其中,公式1中,k表示样本人脸图像所对应人物的年龄,i表示样本人脸图像所对应人物的身份标识,表示身份标识为i且年龄为k的样本人脸图像对应的可用综合特征向量,表示身份标识为i的样本人脸图像所对应人物的身份因子,是年龄为k的样本人脸图像所对应人物的年龄因子,pθ表示在给定模型参数θ的条件之下,联合概率分布。其中,L表示联合概率分布。
其中,由于公式1中的两个隐形因子不能直接观测。例如可采用坐标上升算法对因子进行分析,即在一个因子固定的情况下对另一个隐形因子进行优化。其中,对于给定的模型参数θ,可估计出先验概率分布从而可以通过最大化联合概率分布L的条件期望来得到先验概率分布进而更新模型参数θ的取值。
也就是说,给定初始化估计值θ0,通过最大化如下公式2中的Lc来得到一个新的θ:
L c = &Sigma; i , k &Integral; p &theta; 0 ( x &RightArrow; i , y &RightArrow; k | T ) ln p &theta; ( t &RightArrow; i k , x &RightArrow; i , y &RightArrow; k ) d x &RightArrow; i d y &RightArrow; k
其中,公式2中的T表示样本集合中的各样本人脸图像(假设有Z个样本人脸图像)对应的可用综合特征向量,Lc是联合概率分布L在给定初始模型参数θ0的条件期望。其中,因为隐形因子未知,因此L不能直接最大化。但是可通过初始化模型参数θ0来估计隐形因子的分布,进而得到在下分布之下联合概率分布L的条件期望,该条件期望即Lc
下面提出上述身份-年龄因子模型适应化的最大条件期望值(EM)算法:
输入为:标有身份和年龄的样本图像的特征向量集
输出为:特征模型的模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 }
具体的,可先初始化下面几个参数:
σ2←0.1、
U←rand(-0.1,0.1)、
V←rand(-0.1,0.1);
将初始化的σ2、U、V带入身份-年龄因子模型公式中,求得基于模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } 计算隐形因子
其中,
< x &RightArrow; i > = &Phi; - 1 U T &Sigma; - 1 Nc i &Sigma; k ( T &RightArrow; i k - &beta; &RightArrow; ) ;
< x &RightArrow; i x &RightArrow; i T > = &Phi; - 1 Nc i + < x &RightArrow; i > < x &RightArrow; i > T ;
< y &RightArrow; k > = W - 1 V T C - 1 Ns k &Sigma; i = 1 ( T &RightArrow; i k - &beta; &RightArrow; ) ;
< y &RightArrow; k y &RightArrow; k T > = W - 1 Ns k + < y &RightArrow; k > < y &RightArrow; k > T ;
其中,Σ=σ2I+VVT
C=σ2I+UUT
Φ=I+UTΣ-1U;
W=I+VTC-1V。
其中,上述Nci表示训练样本人脸图像中,身份标识为i的样本人脸图像的个数,上述Nsk表示训练样本人脸图像中,年龄为k的样本人脸图像的个数。
基于计算出的隐形因子更新模型参数σ2、U和V。
其中,
U=(C-DB-1E)(A-FB-1E)-1
V=(D-CA-1F)(B-EA-1F)-1
&sigma; 2 = 1 Nd &Sigma; i , k T &RightArrow; i k - &beta; &RightArrow; - U < x &RightArrow; i > - V < y &RightArrow; k > T ( T &RightArrow; i k - &beta; &RightArrow; ) ;
其中, A = &Sigma; i , k < x &RightArrow; i x &RightArrow; i T > ; B = &Sigma; i , k < y &RightArrow; k y &RightArrow; k T > ;
C = &Sigma; i , k ( T &RightArrow; i k - &beta; &RightArrow; ) < x &RightArrow; i > T ;
D = &Sigma; i , k ( T &RightArrow; i k - &beta; &RightArrow; ) < y &RightArrow; k > T
E = &Sigma; i , k < y &RightArrow; k > < x &RightArrow; i > T ;
F = &Sigma; i , k < x &RightArrow; i > < y &RightArrow; k > T .
其中,上述N表示样本人脸图像的总个数,d是样本本人脸图像的可用综合特征向量的长度。
基于上述方式,利用Z个样本人脸图像对应的可用综合特征向量中的多个可用综合特征向量多次求取参数σ2、U和V,直到收敛。通过上述算法可较准确地计算出上述身份-年龄因子模型的模型参数
当然亦可通过其它方式训练得到模型参数的具体取值。并不限于上述举例的训练方法。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的电源前馈控制方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (31)

1.一种图像身份识别方法,其特征在于,包括:
对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;
基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;
计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;
输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
2.根据权利要求1所述的方法,其特征在于,
所述对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,包括:对待识别的人脸图像进行预处理;对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量。
3.根据权利要求2所述的方法,其特征在于,所述对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,包括:从进行预处理后的所述待识别的人脸图像中提取原始综合特征向量,对提取到的所述原始综合特征向量进行降维处理以得到所述待识别的人脸图像对应的可用综合特征向量。
4.根据权利要求1至3所述的方法,其特征在于,所述原始综合特征向量或可用综合特征向量基于梯度方向直方图得到。
5.根据权利要求1至4任一项所述的方法,其特征在于,
所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
6.根据权利要求5所述的方法,其特征在于,
所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量,包括:通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
7.根据权利要求1至4任一项所述的方法,其特征在于,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
8.根据权利要求7所述的方法,其特征在于,
所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量,包括:通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
9.根据权利要求1至7任意一项所述的方法,其特征在于,所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,通过所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离来表征。
10.一种模型训练方法,其特征在于,包括:
获取Z个样本人脸图像对应的可用综合特征向量;
利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数;
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
11.根据权利要求10所述的方法,其特征在于,所述可用综合特征向量基于梯度方向直方图得到。
12.一种模型训练方法,其特征在于,包括:
获取Z个样本人脸图像对应的可用综合特征向量;
利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数,
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子,其中,所述模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
13.根据权利要求12所述的方法,其特征在于,所述可用综合特征向量基于梯度方向直方图得到。
14.一种图像身份识别装置,其特征在于,包括:
提取单元,用于对待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;
计算单元,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;
匹配单元,用于计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;
输出单元,用于输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述匹配单元计算出所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
15.根据权利要求14所述的装置,其特征在于,
所述提取单元具体用于,对待识别的人脸图像进行预处理;对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量。
16.根据权利要求15所述的装置,其特征在于,在所述对进行预处理后的所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量的方面,所述提取单元具体用于,从进行预处理后的所述待识别的人脸图像中提取原始综合特征向量,对提取到的所述原始综合特征向量进行降维处理以得到所述待识别的人脸图像对应的可用综合特征向量。
17.根据权利要求14至16任一项所述的装置,其特征在于,所述原始综合特征向量或所述可用综合特征向量基于梯度方向直方图得到。
18.根据权利要求14至17任一项所述的装置,其特征在于,
所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
19.根据权利要求18所述的装置,其特征在于,
所述计算单元具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
20.根据权利要求14至17任一项所述的装置,其特征在于,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
21.根据权利要求20所述的装置,其特征在于,
所述计算单元具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
其中, F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
22.根据权利要求14至20任意一项所述的装置,其特征在于,所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,通过所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的余弦距离或欧氏距离或曼哈顿距离来表征。
23.一种模型训练装置,其特征在于,包括:
获取单元,用于获取Z个样本人脸图像对应的可用综合特征向量;
训练单元,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数;
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
其中,所述的分段q对应的可用综合特征子向量对应的身份-年龄因子模型的模型参数 &theta; q = { &beta; &RightArrow; q , U q , V q , &sigma; q 2 } .
24.根据权利要求23所述的装置,其特征在于,所述可用综合特征向量基于梯度方向直方图得到。
25.一种模型训练装置,其特征在于,包括:
获取单元,用于获取Z个样本人脸图像对应的可用综合特征向量;
训练单元,用于利用所述Z个样本人脸图像对应的可用综合特征向量对身份-年龄因子模型进行训练,以确定所述身份-年龄因子模型的模型参数,
其中,所述可用综合特征向量通过身份-年龄因子模型描述,
其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子,其中,所述模型参数 &theta; = { &beta; &RightArrow; , U , V , &sigma; 2 } .
26.根据权利要求25所述的装置,其特征在于,所述可用综合特征向量基于梯度方向直方图得到。
27.一种身份识别系统,其特征在于,包括:
客户端,用于向身份识别服务器发送待识别的人脸图像;
其中,所述身份识别服务器,用于接收来自所述客户端的所述待识别的人脸图像,对所述待识别的人脸图像进行特征提取处理以得到所述待识别的人脸图像对应的可用综合特征向量,其中,所述可用综合特征向量由用于描述所述待识别的人脸图像所对应人物的身份的身份因子和用于描述所述待识别的人脸图像所对应人物的年龄的年龄因子共同确定,其中,所述身份因子和所述年龄因子互不相关;基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量;计算所述待识别的人脸图像对应的身份特征向量与Z个样本人脸图像中的每个样本人脸图像所对应身份特征向量的相似度,其中,所述身份特征向量由身份因子确定,所述Z为正整数;想所述客户端输出Z1个样本人脸图像对应的身份信息,其中,所述Z1个样本人脸图像为所述Z个样本人脸图像的子集,所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,大于所述Z个样本人脸图像之中除所述Z1个样本人脸图像之外的其它样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度,或所述Z1个样本人脸图像对应的身份特征向量与所述待识别的人脸图像对应的身份特征向量的相似度大于设定阈值,其中,所述输出的Z1个样本人脸图像对应的身份信息为所述待识别的人脸图像对应的可能身份信息。
28.根据权利要求27所述的身份识别系统,其特征在于,
所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,其中,所述身份-年龄因子模型如下:
T &RightArrow; = &beta; &RightArrow; + U x &RightArrow; + V y &RightArrow; + &epsiv; &RightArrow; ;
其中,所述表示所述可用综合特征向量,所述表示样本特征平均值,所述U表示身份因子系数,所述V表示年龄因子系数,所述表示高斯白噪声,所述表示身份因子,所述表示年龄因子。
29.根据权利要求28所述的身份识别系统,其特征在于,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式,基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = UU T &Sigma; - 1 ( T &RightArrow; - &beta; &RightArrow; )
其中,所述表示所述身份特征向量,
其中,所述∑=σ2I+UUT+VVT
30.根据权利要求27所述的身份识别系统,其特征在于,所述待识别的人脸图像对应的可用综合特征向量通过身份-年龄因子模型描述,
其中, T &RightArrow; = [ t &RightArrow; 1 . . . . . . t &RightArrow; n ] ;
其中,所述身份-年龄因子模型如下:
t q &RightArrow; = &beta; &RightArrow; q + U q x q &RightArrow; + V q y q &RightArrow; + &epsiv; &RightArrow; q ;
其中,所述q=1,2,......n;
其中,所述表示所述可用综合特征向量,所述n表示所述可用综合特征向量的分段总数,所述表示所述的分段q对应的可用综合特征子向量,所述Uq表示对应的身份因子系数,所述Vq表示所述对应的年龄因子系数,所述表示所述对应的样本特征平均值,其中,所述表示所述对应的身份因子,所述表示所述对应的年龄因子,其中,所述表示所述对应的高斯白噪声,
31.根据权利要求30所述的身份识别系统,其特征在于,在所述基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量的方面,所述身份识别服务器具体用于,通过如下方式基于所述待识别的人脸图像对应的可用综合特征向量计算所述待识别的人脸图像所对应的身份特征向量:
F &RightArrow; = [ f &RightArrow; 1 . . . . . . f &RightArrow; n ] ;
f q &RightArrow; = U q U q T &Sigma; q - 1 ( t q &RightArrow; - &beta; q &RightArrow; )
其中,所述∑qq 2I+UqUq T+VqVq T
其中,所述表示所述身份特征向量,所述表示所述的分段q对应的身份特征向量。
CN201310632582.0A 2013-11-29 2013-11-29 图像身份识别方法和相关装置及身份识别系统 Active CN104680119B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310632582.0A CN104680119B (zh) 2013-11-29 2013-11-29 图像身份识别方法和相关装置及身份识别系统
PCT/CN2014/081636 WO2015078183A1 (zh) 2013-11-29 2014-07-04 图像身份识别方法和相关装置及身份识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310632582.0A CN104680119B (zh) 2013-11-29 2013-11-29 图像身份识别方法和相关装置及身份识别系统

Publications (2)

Publication Number Publication Date
CN104680119A true CN104680119A (zh) 2015-06-03
CN104680119B CN104680119B (zh) 2017-11-28

Family

ID=53198301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310632582.0A Active CN104680119B (zh) 2013-11-29 2013-11-29 图像身份识别方法和相关装置及身份识别系统

Country Status (2)

Country Link
CN (1) CN104680119B (zh)
WO (1) WO2015078183A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899579A (zh) * 2015-06-29 2015-09-09 小米科技有限责任公司 人脸识别方法和装置
CN105654056A (zh) * 2015-12-31 2016-06-08 中国科学院深圳先进技术研究院 人脸识别的方法及装置
CN106951857A (zh) * 2017-03-17 2017-07-14 山东浪潮商用系统有限公司 一种身份提醒方法、装置及系统
CN107357799A (zh) * 2017-05-17 2017-11-17 广州视源电子科技股份有限公司 评估人脸识别系统注册上限的方法及装置
CN109509144A (zh) * 2018-11-01 2019-03-22 中山大学 一种基于对抗生成网络的与职业相关的人脸老化方法
CN109523463A (zh) * 2018-11-20 2019-03-26 中山大学 一种基于条件生成对抗网络的人脸老化方法
CN111738194A (zh) * 2020-06-29 2020-10-02 深圳力维智联技术有限公司 一种用于人脸图像相似性的评价方法和装置
CN112395859A (zh) * 2020-11-20 2021-02-23 中国平安人寿保险股份有限公司 一种文本处理方法及相关装置
WO2021135863A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 一种图像识别方法及装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9836669B2 (en) 2016-02-22 2017-12-05 International Business Machines Corporation Generating a reference digital image based on an indicated time frame and searching for other images using the reference digital image
CN108171185B (zh) * 2018-01-03 2020-06-30 阿里巴巴集团控股有限公司 身份识别的方法、装置及系统
CN110309691B (zh) * 2018-03-27 2022-12-27 腾讯科技(深圳)有限公司 一种人脸识别方法、装置、服务器及存储介质
CN110969072B (zh) * 2018-09-30 2023-05-02 杭州海康威视系统技术有限公司 模型优化方法、设备及图像分析系统
KR102177453B1 (ko) * 2018-10-16 2020-11-11 서울시립대학교 산학협력단 얼굴 인식 방법 및 얼굴 인식 장치
CN111291765A (zh) * 2018-12-07 2020-06-16 北京京东尚科信息技术有限公司 用于确定相似图片的方法和装置
CN109829782A (zh) * 2019-01-03 2019-05-31 深圳壹账通智能科技有限公司 香烟售卖控制方法及装置、存储介质和电子设备
CN110674748B (zh) * 2019-09-24 2024-02-13 腾讯科技(深圳)有限公司 图像数据处理方法、装置、计算机设备以及可读存储介质
CN113408556B (zh) * 2020-03-16 2023-08-22 杭州海康威视数字技术股份有限公司 身份识别方法及装置
CN111652049A (zh) * 2020-04-17 2020-09-11 北京三快在线科技有限公司 人脸图像处理模型训练方法、装置、电子设备及存储介质
CN112149530A (zh) * 2020-09-08 2020-12-29 安徽兰臣信息科技有限公司 一种基于儿童跨年龄段无感人脸识别技术的警用穿戴眼镜
CN114463830B (zh) * 2022-04-14 2022-08-26 合肥的卢深视科技有限公司 亲缘关系判定方法、装置、电子设备及存储介质
CN118135062B (zh) * 2024-05-10 2024-08-30 粤港澳大湾区数字经济研究院(福田) 一种图像编辑方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070098225A1 (en) * 2005-10-28 2007-05-03 Piccionelli Gregory A Age verification method for website access
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
CN101833672A (zh) * 2010-04-02 2010-09-15 清华大学 基于约束采样与形状特征的稀疏表示人脸识别方法
US20130266194A1 (en) * 2012-04-05 2013-10-10 Ancestry.Com Operations Inc. System and method for associating a photo with a data structure node
CN103413270A (zh) * 2013-08-15 2013-11-27 北京小米科技有限责任公司 一种图像的处理方法、装置和终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070098225A1 (en) * 2005-10-28 2007-05-03 Piccionelli Gregory A Age verification method for website access
CN101819628A (zh) * 2010-04-02 2010-09-01 清华大学 结合形状特征的稀疏表示人脸识别方法
CN101833672A (zh) * 2010-04-02 2010-09-15 清华大学 基于约束采样与形状特征的稀疏表示人脸识别方法
US20130266194A1 (en) * 2012-04-05 2013-10-10 Ancestry.Com Operations Inc. System and method for associating a photo with a data structure node
CN103413270A (zh) * 2013-08-15 2013-11-27 北京小米科技有限责任公司 一种图像的处理方法、装置和终端设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899579A (zh) * 2015-06-29 2015-09-09 小米科技有限责任公司 人脸识别方法和装置
CN105654056A (zh) * 2015-12-31 2016-06-08 中国科学院深圳先进技术研究院 人脸识别的方法及装置
CN106951857A (zh) * 2017-03-17 2017-07-14 山东浪潮商用系统有限公司 一种身份提醒方法、装置及系统
CN107357799A (zh) * 2017-05-17 2017-11-17 广州视源电子科技股份有限公司 评估人脸识别系统注册上限的方法及装置
CN109509144A (zh) * 2018-11-01 2019-03-22 中山大学 一种基于对抗生成网络的与职业相关的人脸老化方法
CN109523463A (zh) * 2018-11-20 2019-03-26 中山大学 一种基于条件生成对抗网络的人脸老化方法
CN113128278A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 一种图像识别方法及装置
WO2021135863A1 (zh) * 2019-12-31 2021-07-08 华为技术有限公司 一种图像识别方法及装置
CN113128278B (zh) * 2019-12-31 2024-07-23 华为技术有限公司 一种图像识别方法及装置
CN111738194A (zh) * 2020-06-29 2020-10-02 深圳力维智联技术有限公司 一种用于人脸图像相似性的评价方法和装置
CN111738194B (zh) * 2020-06-29 2024-02-02 深圳力维智联技术有限公司 一种用于人脸图像相似性的评价方法和装置
CN112395859A (zh) * 2020-11-20 2021-02-23 中国平安人寿保险股份有限公司 一种文本处理方法及相关装置
CN112395859B (zh) * 2020-11-20 2024-05-17 中国平安人寿保险股份有限公司 一种文本处理方法及相关装置

Also Published As

Publication number Publication date
CN104680119B (zh) 2017-11-28
WO2015078183A1 (zh) 2015-06-04

Similar Documents

Publication Publication Date Title
CN104680119B (zh) 图像身份识别方法和相关装置及身份识别系统
EP3084682B1 (en) System and method for identifying faces in unconstrained media
CN107330904B (zh) 图像处理方法、装置、电子设备及存储介质
CN106803055B (zh) 人脸识别方法和装置
US8249361B1 (en) Interdependent learning of template map and similarity metric for object identification
CN110503076B (zh) 基于人工智能的视频分类方法、装置、设备和介质
US20150242689A1 (en) System and method for determining graph relationships using images
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN109426831B (zh) 图片相似匹配及模型训练的方法、装置及计算机设备
CN113255557B (zh) 一种基于深度学习的视频人群情绪分析方法及系统
US11004239B2 (en) Image retrieval device and method, photograph time estimation device and method, repetitive structure extraction device and method, and program
Shu et al. Age progression: Current technologies and applications
CN109816543B (zh) 一种图像查找方法及装置
CN110458644A (zh) 一种信息处理方法及相关设备
Son et al. Spectral clustering with brainstorming process for multi-view data
CN111553838A (zh) 模型参数的更新方法、装置、设备及存储介质
Seo et al. Robust recognition of face with partial variations using local features and statistical learning
CN114090401B (zh) 处理用户行为序列的方法及装置
Sharma et al. Prediction of face age progression with generative adversarial networks
TW201828156A (zh) 圖像識別方法、度量學習方法、圖像來源識別方法及裝置
CN112070744B (zh) 一种人脸识别的方法、系统、设备及可读存储介质
CN114494809A (zh) 特征提取模型优化方法、装置及电子设备
Akinyemi et al. An individualized face pairing model for age-invariant face recognition
CN112257689A (zh) 人脸识别模型的训练和识别方法、存储介质及相关设备
Zhou et al. A 3d face recognition algorithm using histogram-based features

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant