CN104318214A - 一种基于结构化词典域转移的交叉视角人脸识别方法 - Google Patents
一种基于结构化词典域转移的交叉视角人脸识别方法 Download PDFInfo
- Publication number
- CN104318214A CN104318214A CN201410583963.9A CN201410583963A CN104318214A CN 104318214 A CN104318214 A CN 104318214A CN 201410583963 A CN201410583963 A CN 201410583963A CN 104318214 A CN104318214 A CN 104318214A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- source domain
- face
- aiming field
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012546 transfer Methods 0.000 title claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 60
- 230000001815 facial effect Effects 0.000 claims description 59
- 230000006870 function Effects 0.000 claims description 27
- 239000012141 concentrate Substances 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000000513 principal component analysis Methods 0.000 claims description 6
- 230000008602 contraction Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims 1
- 238000012706 support-vector machine Methods 0.000 abstract description 9
- 230000000007 visual effect Effects 0.000 description 12
- 238000003491 array Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 208000027697 autoimmune lymphoproliferative syndrome due to CTLA4 haploinsuffiency Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明是一种基于结构化词典域转移的交叉视角人脸识别方法,其包括步骤:S1:将训练出每个对样本类别有区分性的子词典串接构成结构化的源域词典;S2:学习目标域和多个中间域词典;S3:对源域及目标域的图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到并分别将源域及目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征和目标域人脸图像的域共享特征;S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
Description
技术领域
本发明属于交叉视角人脸识别技术领域,具体涉及一种基于结构化词典域转移的交叉视角人脸识别方法。
背景技术
目前大多数的自动人脸识别系统在正脸视角下可以达到较高的识别性能。但是,在实际应用场景中获取的人脸图片一般处于各种各样的视角,这种情况会使得人脸识别系统的性能大幅度退化。交叉视角人脸识别的困难主要在于人脸视角的变化处于3D空间中,而人脸图像仅捕获2D的外观特征。随着视角的变化,不同的人脸部件呈现在图像中。这导致一个特殊的现象:不同身份相似视角的人脸图像比相同身份不同视角的人脸图像更为相似。由视角变化导致的差异比身份变化导致的差异更大,使得交叉视角人脸识别非常困难。
目前常用的交叉视角人脸识别方法大致可以分为两类:一类研究主要致力于对侧面视角的人脸生成虚拟的正脸图像,这样就可以在一个统一的视角下面进行人脸识别。典型地,Blanz提出为给定的2D人脸图像构造对应的3D形变模型,并在3D形状纹理空间中进行人脸匹配。但是,这类方法计算量较大且依赖人工标定人脸关键点。Chai提出了局部线性回归模型(LLR)直接在2D域中合成虚拟的正面人脸。另外一类方法主要致力于学习针对特定视角的变换,然后用这些变换将样本投影到一个公共的子空间中进行识别。Lin提出了公共区分性特征提取方法(CDEF)来将不同模态的样本投影到一个公共的特征空间;Sharma和Li引入了偏最小二乘法(PLS)和典型相关分析(CCA)来最大化投影空间中变化视角人脸的类内相关性。最近,基于域自适应的交叉视角人脸识别方法被很多学者提出。其中主流的思想是学习源域到目标域之间的一系列的中间域表示,并利用这些中间域构造一条虚拟路径来建模两个域之间统计上的联系。其中,基于子空间的中间域表示为一类常用的虚拟路径构造方法。
发明内容
本发明的目的是要解决交叉视角人脸识别中,相同身份不同视角的人脸图像分布差异大的问题,为此,本发明的目的是提供一种基于结构化词典域转移的交叉视角人脸识别方法。
为了实现所述目的,本发明基于结构化词典域转移的交叉视角人脸识别方法,该方法包括以下步骤:
步骤S1:根据源域人脸集的人脸图像特征,对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典;所有类的子词典串接在一起,构成结构化的源域词典;
步骤S2:通过递增地减少源域词典在目标域人脸集上的重构误差,逐渐地将源域词典转移到目标域,同时学习目标域词典和多个中间域词典;
步骤S3:计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码,对源域图像人脸编码、源域词典、目标域词典和多个中间域词典分别计算,得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像;将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征;
计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码,分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像,将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征;
步骤S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
本发明的有益效果:本发明首先对源域数据集区分性的学习结构化的源域词典,有效地建模源域数据集的特征;根据域自适应的思想学习一条基于中间域词典的虚拟路径,基于该路径的特征表示能有效地减小不同域人脸图像之间的差异。
附图说明
图1是本发明的基于结构化词典域转移的交叉视角人脸识别方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
请参照图1示出本发明基于结构化词典域转移的交叉视角人脸识别方法,具体实施例步骤如下:
步骤S1:根据源域人脸集的人脸图像特征,对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典;所有类的子词典D1,D2,…,Dc串接在一起,构成结构化的源域词典;所述训练出源域词典中每个对样本类别有区分性的子词典的步骤如下:
步骤S11:为了使源域词典D0能有效的构建源域人脸集模型,将源域词典在源域人脸集上的重构误差进行最小化,并构建出最小化目标函数如下表示:
所述ES为源域词典在源域人脸集上的重构误差,XS为源域人脸集YS在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵,s.t表示优化条件;为稀疏编码系数阵XS的第l列,l为稀疏编码系数阵XS的列的序号;表示F2范数;||.||0表示l0范数为统计向量中的非零元素个数;T0是稀疏编码的稀疏水平参数;源域人脸集中样本类别序号为i=1,2,3,…C,C为源域人脸集中样本类别数目;Di为源域词典中第i类样本的子词典。
步骤S12:为了使结构化的源域词典能够区分源域人脸集中的每一类样本,构建源域词典中的每个子词典与源域人脸集中对应的第i类样本的重构能力约束项和区分性约束项模型;所述构建所述约束项模型的步骤包括如下:
步骤S121:每个子词典Di对对应的源域人脸集中的第i类样本集Yi S应该有良好的重构能力的约束项,这项约束项可表示为:所述良好的区分性是约束项r(Di)越小区分性越好;
步骤S122:第i类样本的子词典Di对源域人脸集中每类样本集具有良好的区分性约束项r(Di)表示为:所述良好的重构能力是重构误差越小重构能力越好;
步骤S13:结合最小化目标函数、重构能力约束项和区分性约束项,构建新目标函数并如下表示:
所述为第i类样本集Yi S对应子词典Di的稀疏编码系数矩阵,是重构误差,为第j类样本集对应子词典Di的稀疏编码系数矩阵,源域人脸集中除第i类以外的其他样本类别的序号j=1,2,3,…C,α为正的惩罚参数;
步骤S14:通过对源域词典及其稀疏编码系数矩阵迭代更新来求解新目标函数,训练出源域词典中每个子词典。
其中,求解所述源域词典及其稀疏编码系数矩阵的步骤包括:
步骤S141:首先,假设源域词典D的取值一定,则将新目标函数简化为标准的稀疏编码问题。最优解可以通过多种成熟的追踪算法对标准的稀疏编码求解,得到最优解的稀疏编码系数矩阵表示XS,所述追踪算法为匹配追踪(MP)算法和正交匹配追踪(OMP)算法。
步骤S142:设定稀疏编码系数矩阵XS的取值,将第i类样本的则每个子词典Di可以依据以下的子问题依次更新:
通过令目标函数J0对于源域词典中第i类样本的子词典Di的一阶导数为零,可以得到源域词典中第i类样本的子词典Di的闭集解;按照以上的步骤迭代更新源域词典和稀疏编码系数矩阵{D,XS},当迭代次数达到预设迭代次数T0时,迭代终止。所学习得到词典D即为结构化的源域词典。
步骤S2:通过递增地减少源域词典D0在目标域人脸集上的重构误差,逐渐地将源域词典转移到目标域,同时学习目标域词典Dk和多个中间域词典{D(1),D(2),D(3),...D(k-1)};其中,所述学习目标域词典和多个中间域词典D(k+1)的具体训练步骤为:
步骤S21:依据稀疏表示的原则,通过最小化第k个中间域词典D(k)在目标域人脸集集Yt上的重构误差来求解第k个稀疏编码系数矩阵Xt (k),对稀疏编码系数矩阵Xt (k)进行优化的目标函数表示为:
公式中,D(k)为给定的第k个中间域词典,k为中间域词典的序号;Xt为待求解的稀疏编码系数矩阵;为稀疏编码系数阵Xt的第l列,l为稀疏编码系数阵Xt的列的序号;以上优化目标可以通过多种成熟的追踪算法求解,例如匹配追踪(MP)和正交匹配追踪(OMP)算法。
步骤S22:将稀疏编码系数矩阵Xt (k)写做Xt (k)={X1 t(k),X2 t(k),...,XC t(k)},其中Xt t(k)为目标域人脸集Yt对第i类样本的子词典Dt (k)的稀疏编码系数矩阵,那么重构误差可以分解为:
其中,Ei表示去除子词典Di (k)后,目标域人脸集Yt在中间域词典D(k)上的重构误差。Xj t(k)为目标域人脸集Yt对第j类样本的子词典Dj (k)的稀疏编码系数矩阵;为了最小化重构误差Et,我们优化子词典Di (k)使得它能最好的拟合当前的残余重构误差Ei,同时,为了惩罚相邻中间域词典间的突变,我们限制相邻词典的增量ΔDi (k)=Di (k+1)-Di (k)要小,Di (k+1)为子词典Di (k)的更新值;最终优化目标函数表示为:
步骤S23:为了求解以上的目标函数,首先定义ωi为目标域人脸集Yt中使用子词典Di (k)作为重构元素的样本索引集ωi={l|1≤l≤Nt,即在重构稀疏编码系数矩阵中对应列有非零元素的列索引集;其Nt为目标域数据集的样本总数,Xt t(k)为目标域人脸集Yt对子词典Di (k)的稀疏编码系数矩阵,l为稀疏编码系数矩阵的列的序号。设Ωi为Nt×|ωi|大小的收缩矩阵,且收缩矩阵Ωi中坐标为(ωi(l),l)的元素的值Ωi(ωi(l),l)=1,收缩矩阵Ωi中其余值为0;定义稀疏编码系数矩阵Xi t(k)的收缩矩阵为目标域人脸集Yt的收缩矩阵为重构误差Ei的收缩矩阵为则以上的优化目标函数J1等价于:
步骤S24:我们迭代更新值Di (k+1)和来求解以上的目标函数J1。给定通过令目标函数J1对于参数Di (k+1)的一阶导数为零来求解Di (k+1);给定Di (k+1),通过令目标函数J1对于参数的一阶导数为零来求解的更新值利用以上的训练框架来迭代更新参数学习得到多个中间域词典迭代更新算法得到的最后一个词典定义为目标域词典DK;其中:K为学习目标域词典和多个中间域词典的总数,K-1为中间域词典的个数,k为中间域词典的序号,k=1,2,3,...K-1。
步骤S3:计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码,分别对源域图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像;将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征;计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码,分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像,将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征;
其中,对源域人脸图像ys在源域词典D0上的稀疏编码系数矩阵为xs、源域词典D0、目标域词典和DK多个中间域词典分别进行计算,得到源域人脸图像的源域重构图像(D0xs)T、目标域重构图像(DKxs)T和中间域重构图像序列{(D(1)xs)T,...,(D(K-1)xs)T};将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征目标域人脸图像yt在目标域词典DK上的稀疏编码系数矩阵为xt;稀疏编码系数矩阵xt与源域词典D0、目标域词典DK和多个中间域词典分别计算,得到目标域人脸图像的源域重构图像(D0xt)T、目标域重构图像(DKxt)T和中间域重构图像序列{(D(1)xt)T,...,(D(K-1)xt)T};将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征
由于域共享特征的维数较高,利用主成分分析算法对域共享特征进行降维;主成分分析中主成分的维数通过保留域共享特征的98%的数据能量来确定。
步骤S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
其中,获得目标域人脸图像的类别的步骤如下:
步骤S41:源域人脸集中人脸图像的域共享特征表示为以源域人脸集中第i类样本的域共享特征集Yi S作为正样本,以源域人脸集中除第i类样本以外的所有其他类的样本集Yj S(j≠i)作为负样本,训练出代表第i类样本的的支持向量机(SVM)模型γi。
步骤S42:将目标域人脸图像的域共享特征yt输入源域人脸集的所有类别的支持向量机(SVM)模型γi计算,得到目标域人脸图像与源域人脸集的所有类别的支持向量机对应的模型匹配分数Scorei。取得分数最高的SVM模型对应的子类类别定义为目标域人脸图像的类别identity(yt)表示如下:
所有的模型匹配分数Scorei中的最大值。
相对于目前流行的交叉视角人脸识别方法,本发明所提出的基于结构化词典域转移的交叉视角人脸识别方法为交叉域的数据集之间构建了一条平稳的虚拟内插路径,基于该路径的域共享特征表示能有效地减小不同域人脸图像之间的差异,达到较好的识别性能。我们在CMU-PIE人脸数据库上进行了测试,实验中采用正面视角作为源域数据集,多种侧面视角作为目标域数据集。本发明提出的方法相较目前性能最好的基于内插路径的方法识别率有较大的提高。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内。
Claims (10)
1.一种基于结构化词典域转移的交叉视角人脸识别方法,特征在于,该方法包括以下步骤:
步骤S1:根据源域人脸集的人脸图像特征,对源域人脸集中的每一类样本训练出每个对样本类别有区分性的子词典;所有类的子词典串接在一起,构成结构化的源域词典;
步骤S2:通过递增地减少源域词典在目标域人脸集上的重构误差,逐渐地将源域词典转移到目标域,同时学习目标域词典和多个中间域词典;
步骤S3:计算源域人脸集的人脸图像在源域词典上的源域图像人脸编码,对源域图像人脸编码、源域词典、目标域词典和多个中间域词典分别计算,得到源域人脸图像的源域重构图像、目标域重构图像和中间域重构图像;将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征;
计算目标域人脸集的人脸图像在目标域词典上的目标域图像人脸编码,分别对目标域图像人脸编码、源域词典、目标域词典和多个中间域词典计算,得到目标域人脸图像的源域重构图像、目标域重构图像和中间域重构图像,将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征;
步骤S4:根据源域人脸图像的域共享特征,对源域人脸集中的每一类样本训练一个支持向量机模型;将目标域人脸图像的域共享特征输入所有类别的支持向量机模型,取得分数最高的支持向量机模型对应的类别定义为目标域人脸图像的类别。
2.根据权利要求1所述的交叉视角人脸识别方法,其特征在于,训练出源域词典中每个对样本类别有区分性的子词典的步骤如下:
步骤S11:为了使源域词典能有效的构建源域人脸集模型,将源域词典在源域人脸集上的重构误差进行最小化并构建出最小化目标函数:
步骤S12:为了使结构化的源域词典能够区分源域人脸集中的每一类样本,构建源域词典中的每个子词典与源域人脸集中对应的第i类样本的重构能力约束项和区分性约束项模型;
步骤S13:结合最小化目标函数、重构能力约束项和区分性约束项,构建新目标函数;
步骤S14:通过对源域词典及其稀疏编码系数矩阵迭代更新来求解新目标函数,训练出源域词典中每个子词典。
3.根据权利要求2所述的交叉视角人脸识别方法,其特征在于,所述最小化目标函数表示为:
其中,ES为源域词典在源域人脸集上的重构误差,XS为源域人脸集YS在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵,s.t表示优化条件;为稀疏编码系数矩阵XS的第l列,l为稀疏编码系数矩阵XS的列的序号;‖.‖0表示l0范数为统计向量中的非零元素个数;T0是稀疏编码的稀疏水平参数;i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目;Di为源域词典中第i类样本的子词典。
4.根据权利要求2所述的交叉视角人脸识别方法,其特征在于,构建所述约束项模型的步骤包括如下:
步骤S121:每个子词典对源域人脸集中的第i类样本集具有良好的重构能力的约束项表示为:所述良好的重构能力是重构误差越小重构能力越好;
步骤S122:第i类样本的子词典对源域人脸集中每类样本集具有良的子词典,为第i类样本集对应子词典Di的稀疏编码系数矩阵,是重构误差,i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目;为第j类样本集对应子词典Di的稀疏编码系数矩阵。
5.根据权利要求2所述的交叉视角人脸识别方法,其特征在于,所述构建新的目标函数J表示为:
其中,XS为源域人脸集YS在所有类的子词典串接构成的结构化的源域词典D上的稀疏编码系数矩阵,Yi S为第i类样本集,Di为源域人脸集中第i类样本的子词典,为第i类样本集Yi S对应子词典Di的稀疏编码系数矩阵,r(Di)表示为子词典Di对源域人脸集中每类样本集的区分性约束项,α为正的惩罚参数,表示F2范数;i为源域人脸集中样本类别序号,C为源域人脸集中样本类别数目。
6.根据权利要求2所述的交叉视角人脸识别方法,其特征在于,求解所述源域词典及其稀疏编码系数矩阵的步骤包括:
步骤S141:设定源域词典的取值,将新目标函数简化为标准的稀疏编码问题;利用追踪算法对标准的稀疏编码进行求解,得到最优解的稀疏编码系数矩阵;所述追踪算法为匹配追踪或正交匹配追踪算法;
步骤S142:设定稀疏编码系数矩阵XS的取值,将第i类样本的子词典依据以下的子问题依次更新:
通过令新目标函数J0对于源域词典中第i类样本的子词典Di的一阶导数为零,得到源域词典中第i类样本的子词典Di的闭集解;迭代更新源域词典和稀疏编码系数矩阵;当迭代次数达到预设迭代次数T0时,迭代终止;其中为第i类样本集Yi S对应子词典Di的稀疏编码系数矩阵;r(Di)表示子词典Di对源域人脸集中每类样本集的区分性约束项,α为正的惩罚参数。
7.根据权利要求1所述的交叉视角人脸识别方法,其特征在于,所述学习目标域词典和多个中间域词典的具体步骤为:
步骤S21:依据稀疏表示的原则,通过最小化第k个中间域词典在目标域人脸集Yt上的重构误差来求解第k个稀疏编码系数矩阵Xt (k),对稀疏编码系数矩阵Xt (k)进行优化的目标函数表示为:
其中,D(k)为给定的第k个中间域词典,k为中间域词典的序号;Xt为待求解的稀疏编码系数矩阵;s.t表示优化条件;l为稀疏编码系数矩阵Xt的列的序号;为稀疏编码系数矩阵Xt的第l列;‖.‖0表示l0范数,统计向量中的非零元素个数;T0是稀疏编码的稀疏水平参数;以上优化目标通过追踪算法求解;
步骤S22:将稀疏编码系数矩阵Xt (k)写做Xt (k)={X1 t(k),X2 t(k),...,XC t(k)},其中Xi t(k)为目标域人脸集Yt对第i类样本的子词典Di (k)的稀疏编码系数矩阵,那么重构误差可以分解为:
其中,Ei表示去除子词典Di (k)后,目标域人脸集Yt在中间域词典D(k)上的重构误差;Xj t(k)为目标域人脸集Yt对第j类样本的子词典Dj (k)的稀疏编码系数矩阵;j≠i;为了最小化重构误差Et,优化子词典Di (k)使得它能拟合当前的残余重构误差Ei,同时,为了惩罚相邻的中间域词典间的突变,限制相邻词典的增量ΔDi (k)=Di (k+1)-Di (k)要小,Di (k+1)为子词典Di (k)的更新值;最终,优化目标函数表示为:
步骤S23:假设ωi为目标域人脸集Yt中使用子词典Di (k)作为重构元素的样本的序号索引集其中,Nt为目标域人脸集的样本总数,Xi t(k)为目标域人脸集Yt对子词典Di (k)的稀疏编码系数矩阵,l为Xi t(k)的列的序号,设Ωi为Nt×|ωi|大小的收缩矩阵,且收缩矩阵Ωi中坐标为(ωi(l),l)的元素的值Ωi(ωi(l),l)=1,收缩矩阵Ωi中其余值为0;定义稀疏编码系数矩阵Xi t(k)的收缩矩阵为目标域人脸集Yt的收缩矩阵为重构误差Ei的收缩矩阵为则步骤S22中的优化目标函数J1等价于:
步骤S24:通过对Di (k+1)和迭代更新来求解目标函数J1;给定通过令目标函数J1对于参数Di (k+1)的一阶导数为零来求解Di (k+1);给定Di (k+1),通过令目标函数J1对于参数的一阶导数为零求来求解的更新值迭代更新参数当相邻词典的增量ΔDi (k)小于某一预设阈值T1时,迭代操作终止,学习得到多个中间域词典迭代更新算法得到的最后一个词典定义为目标域词典DK;其中K为学习目标域词典和多个中间域词典的总数,K-1为中间域词典的个数,k为中间域词典的序号。
8.根据权利要求1所述的交叉视角人脸识别方法,其特征在于,对源域人脸图像ys在源域词典上的稀疏编码系数矩阵为xs、源域词典D0、目标域词典DK和多个中间域词典分别进行计算,得到源域人脸图像的源域重构图像(D0xs)T、目标域重构图像(DKxs)T和中间域重构图像序列{(D(1)xs)T,...,(D(K-1)xs)T};将源域重构图像、目标域重构图像和中间域重构图像串接组成源域人脸图像的域共享特征目标域人脸图像yt在目标域域词典DK上的稀疏编码系数矩阵为xt;稀疏编码系数矩阵xt与源域词典D0、目标域词典DK和多个中间域词典分别计算,得到目标域人脸图像的源域重构图像(D0xt)T、目标域重构图像(DKxt)T和中间域重构图像序列{(D(1)xt)T,...,(D(K-1)xt)T};将源域重构图像、目标域重构图像和中间域重构图像串接组成目标域人脸图像的域共享特征其中,T表示矩阵的转置;K为学习目标域词典和多个中间域词典的总数,K-1为中间域词典的个数,k为中间域词典的序号。
9.根据权利要求8所述的交叉视角人脸识别方法,其特征在于,由于域共享特征的维数较高,利用主成分分析算法对域共享特征进行降维;主成分分析中主成分的维数通过保留域共享特征的98%的数据能量来确定。
10.根据权利要求1所述的交叉视角人脸识别方法,其特征在于,获得目标域人脸图像的类别的具体步骤如下:
步骤S41:源域人脸集中人脸图像的域共享特征表示为以源域人脸集中第i类样本的域共享特征集Yi S作为正样本,以源域人脸集中除第i类样本以外的所有其他类别的样本集Yj S(j≠i)作为负样本,训练出代表第i类样本的支持向量机模型γi;
步骤S42:将目标域人脸图像的域共享特征yt输入源域人脸集的所有类别的支持向量机模型γi中计算,得到目标域人脸图像与源域人脸集的所有类别的支持向量机模型的匹配分数Scorei;取得分数最高的支持向量机模型对应的子类类别定义为目标域人脸图像的类别identity(yt):
其中,Yi S表示源域人脸集中第i类样本的域共享特征集,i为源域人脸集中样本类别的序号,C表示源域人脸集中的样本类别数;j为源域人脸集中除第i类以外的其他类别的序号;表示所有的模型匹配分数Scorei中的最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410583963.9A CN104318214B (zh) | 2014-10-27 | 2014-10-27 | 一种基于结构化词典域转移的交叉视角人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410583963.9A CN104318214B (zh) | 2014-10-27 | 2014-10-27 | 一种基于结构化词典域转移的交叉视角人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104318214A true CN104318214A (zh) | 2015-01-28 |
CN104318214B CN104318214B (zh) | 2017-09-15 |
Family
ID=52373444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410583963.9A Expired - Fee Related CN104318214B (zh) | 2014-10-27 | 2014-10-27 | 一种基于结构化词典域转移的交叉视角人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104318214B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108304876A (zh) * | 2018-01-31 | 2018-07-20 | 国信优易数据有限公司 | 分类模型训练方法、装置及分类方法及装置 |
CN108460415A (zh) * | 2018-02-28 | 2018-08-28 | 国信优易数据有限公司 | 伪标签生成模型训练方法及伪标签生成方法 |
CN109034080A (zh) * | 2018-08-01 | 2018-12-18 | 桂林电子科技大学 | 多源域自适应的人脸识别方法 |
CN109308485A (zh) * | 2018-08-02 | 2019-02-05 | 中国矿业大学 | 一种基于字典域适应的迁移稀疏编码图像分类方法 |
CN109643383A (zh) * | 2016-07-28 | 2019-04-16 | 谷歌有限责任公司 | 域分离神经网络 |
CN110047056A (zh) * | 2018-01-16 | 2019-07-23 | 西门子保健有限责任公司 | 用深度图像到图像网络和对抗网络的跨域图像分析和合成 |
CN111611909A (zh) * | 2020-05-18 | 2020-09-01 | 桂林电子科技大学 | 多子空间域自适应人脸识别方法 |
CN111882055A (zh) * | 2020-06-15 | 2020-11-03 | 电子科技大学 | 一种基于CycleGAN与伪标签的目标检测自适应模型的构建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310687A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Face Recognition Using Discriminatively Trained Orthogonal Tensor Projections |
CN101673348A (zh) * | 2009-10-20 | 2010-03-17 | 哈尔滨工程大学 | 基于监督等度规投影的人脸识别方法 |
CN102609681A (zh) * | 2012-01-12 | 2012-07-25 | 北京大学 | 基于字典学习模型的人脸识别方法 |
-
2014
- 2014-10-27 CN CN201410583963.9A patent/CN104318214B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080310687A1 (en) * | 2007-06-15 | 2008-12-18 | Microsoft Corporation | Face Recognition Using Discriminatively Trained Orthogonal Tensor Projections |
CN101673348A (zh) * | 2009-10-20 | 2010-03-17 | 哈尔滨工程大学 | 基于监督等度规投影的人脸识别方法 |
CN102609681A (zh) * | 2012-01-12 | 2012-07-25 | 北京大学 | 基于字典学习模型的人脸识别方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109643383A (zh) * | 2016-07-28 | 2019-04-16 | 谷歌有限责任公司 | 域分离神经网络 |
CN109643383B (zh) * | 2016-07-28 | 2023-09-01 | 谷歌有限责任公司 | 域分离神经网络 |
CN110047056A (zh) * | 2018-01-16 | 2019-07-23 | 西门子保健有限责任公司 | 用深度图像到图像网络和对抗网络的跨域图像分析和合成 |
CN110047056B (zh) * | 2018-01-16 | 2023-10-13 | 西门子保健有限责任公司 | 用深度图像到图像网络和对抗网络的跨域图像分析和合成 |
CN108304876B (zh) * | 2018-01-31 | 2021-07-06 | 国信优易数据股份有限公司 | 分类模型训练方法、装置及分类方法及装置 |
CN108304876A (zh) * | 2018-01-31 | 2018-07-20 | 国信优易数据有限公司 | 分类模型训练方法、装置及分类方法及装置 |
CN108460415A (zh) * | 2018-02-28 | 2018-08-28 | 国信优易数据有限公司 | 伪标签生成模型训练方法及伪标签生成方法 |
CN108460415B (zh) * | 2018-02-28 | 2021-06-15 | 国信优易数据股份有限公司 | 一种语种识别方法 |
CN109034080A (zh) * | 2018-08-01 | 2018-12-18 | 桂林电子科技大学 | 多源域自适应的人脸识别方法 |
CN109308485A (zh) * | 2018-08-02 | 2019-02-05 | 中国矿业大学 | 一种基于字典域适应的迁移稀疏编码图像分类方法 |
CN109308485B (zh) * | 2018-08-02 | 2022-11-29 | 中国矿业大学 | 一种基于字典域适应的迁移稀疏编码图像分类方法 |
CN111611909A (zh) * | 2020-05-18 | 2020-09-01 | 桂林电子科技大学 | 多子空间域自适应人脸识别方法 |
CN111882055B (zh) * | 2020-06-15 | 2022-08-05 | 电子科技大学 | 一种基于CycleGAN与伪标签的目标检测自适应模型的构建方法 |
CN111882055A (zh) * | 2020-06-15 | 2020-11-03 | 电子科技大学 | 一种基于CycleGAN与伪标签的目标检测自适应模型的构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104318214B (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104318214A (zh) | 一种基于结构化词典域转移的交叉视角人脸识别方法 | |
CN108052512B (zh) | 一种基于深度注意力机制的图像描述生成方法 | |
CN105740909B (zh) | 一种基于空间变换的自然场景下文本识别方法 | |
CN111860257A (zh) | 融合多种文本特征及几何信息的表格识别方法及系统 | |
CN111291556B (zh) | 基于实体义项的字和词特征融合的中文实体关系抽取方法 | |
CN107871014A (zh) | 一种基于深度融合哈希的大数据跨模态检索方法及系统 | |
CN104268593A (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
CN111325165B (zh) | 考虑空间关系信息的城市遥感影像场景分类方法 | |
CN108846350A (zh) | 容忍年龄变化的人脸识别方法 | |
CN108197294A (zh) | 一种基于深度学习的文本自动生成方法 | |
CN106203363A (zh) | 人体骨架运动序列行为识别方法 | |
CN109241995B (zh) | 一种基于改进型ArcFace损失函数的图像识别方法 | |
WO2022217746A1 (zh) | 一种高分辨率高光谱计算成像方法、系统及介质 | |
CN109389166A (zh) | 基于局部结构保存的深度迁移嵌入聚类机器学习方法 | |
CN112464004A (zh) | 一种多视角深度生成图像聚类方法 | |
CN104462196A (zh) | 多特征联合哈希信息检索方法 | |
CN107909115A (zh) | 一种图像中文字幕生成方法 | |
CN106991355A (zh) | 基于拓扑保持的解析型字典学习模型的人脸识别方法 | |
CN105631469A (zh) | 一种多层稀疏编码特征的鸟类图像识别方法 | |
CN113190688A (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及系统 | |
CN111881716A (zh) | 一种基于多视角生成对抗网络的行人重识别方法 | |
CN106157254A (zh) | 基于非局部自相似性的稀疏表示遥感图像去噪方法 | |
CN110598746A (zh) | 一种基于ode求解器自适应的场景分类方法 | |
CN113255366A (zh) | 一种基于异构图神经网络的方面级文本情感分析方法 | |
CN116152554A (zh) | 基于知识引导的小样本图像识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170915 Termination date: 20211027 |
|
CF01 | Termination of patent right due to non-payment of annual fee |