CN105930796A - 一种基于深度自编码器的单样本人脸图像识别方法 - Google Patents

一种基于深度自编码器的单样本人脸图像识别方法 Download PDF

Info

Publication number
CN105930796A
CN105930796A CN201610250705.8A CN201610250705A CN105930796A CN 105930796 A CN105930796 A CN 105930796A CN 201610250705 A CN201610250705 A CN 201610250705A CN 105930796 A CN105930796 A CN 105930796A
Authority
CN
China
Prior art keywords
depth
coding device
data
degree
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610250705.8A
Other languages
English (en)
Other versions
CN105930796B (zh
Inventor
张彦
彭华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PLA Information Engineering University
Original Assignee
PLA Information Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PLA Information Engineering University filed Critical PLA Information Engineering University
Priority to CN201610250705.8A priority Critical patent/CN105930796B/zh
Publication of CN105930796A publication Critical patent/CN105930796A/zh
Application granted granted Critical
Publication of CN105930796B publication Critical patent/CN105930796B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

本发明属于人脸图像的识别方法领域,涉及一种基于深度自编码器的单样本人脸识别方法,该方法包括:一、建立广义深度自编码器,二、建立特定类别深度自编码器,三、将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像,四、计算测试图像与重构图像的最小二范数距离,确定测试图像的类别,或者用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,确定测试图像的类别。利用深度自编码器的自学习功能,通过全部训练图像学习训练图像中包含的所有变化,得到广义深度自编码器,再用单个样本的复制微调广义深度自编码器得到特定类别深度自编码器,将多样本目标的变化推广至单样本目标,从而提高单样本人脸识别问题的识别率。

Description

一种基于深度自编码器的单样本人脸图像识别方法
技术领域
本发明属于单样本人脸数字图像的识别方法领域,具体涉及一种基于深度自编码器的单样本人脸识别方法。
背景技术
人脸作为作为身份认证、身份识别的重要生物特征,因其非接触、易采集等特点更适于作为安全领域的生物特征。近年来,随着信息技术的迅速发展,身份认证及识别有广泛的应用需求,因此人脸识别技术得到了快速发展,并得到了广泛的应用。
深度学习方法为解决人脸识别问题提供了全新的思路,一般情况下,深度学习需要大量的训练样本,然而在具体的人脸识别任务中,很多情况待识别的目标只有一张或者几张人脸照片,样本数少给人脸识别技术带来了一定的困难。
发明内容
本发明针对现有技术在具体的人脸识别任务中,很多情况待识别的目标只有一张或者几张人脸照片,这种小样本问题给人脸识别技术带来了一定的困难等问题,提出一种基于深度自编码器的单样本人脸识别方法。
本发明的技术方案是:一种基于深度自编码器的单样本人脸图像识别方法,该方法包括以下步骤:
步骤一:建立广义深度自编码器;
步骤二:建立特定类别深度自编码器;
步骤三:将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像。
步骤四:计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别,或者用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别。
所述的基于深度自编码器的单样本人脸图像识别方法,所述建立广义深度自编码器的具体步骤为:
步骤101:获取已知库内所有图像,得到训练数据其中:m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VI为多样本目标图像集合,M为每个目标的样本数,N1为每个目标个数,VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤102:对训练数据进行规范化,将数据规范化至[0,1]之间,规范化方法为:直接将每个图像灰度值除以255,或者将图像规范化至[-1,1],然后线性映射到[0,1]之间;
步骤103:数据经过PCA白化处理或者不经过PCA白化处理。
步骤104:将步骤103得到的数据复制多倍,用所有数据训练深度自编码器,训练过程包括预训练、展开、微调得到广义深度自编码器;
所述的基于深度自编码器的单样本人脸图像识别方法,所述建立特定类别深度自编码器的具体步骤为:
步骤201:得到特定类别深度自编码器的训练数据其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤202:将每个进行规范化处理,规范化到[0,1]之间,规范化方法与广义深度自编码器训练数据规范化方法相同;
步骤203:数据经过PCA白化处理或者不经过白化处理,与广义深度自编码器的训练数据处理相同;
步骤204:将步骤203得到的数据复制多倍;
步骤205:用步骤204得到的数据微调广义深度自编码器,得到N2个对应于单样本目标的特定类别深度自编码器CDi,i=1,...,N2。
所述的基于深度自编码器的单样本人脸图像识别方法,所述将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像的具体步骤为:
步骤301:得到测试图像集合其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数,NT为测试图像个数;
步骤302:对测试图像进行规范化处理,规范化到[0,1]之间,规范化方法与特定类别深度自编码器处理方式相同;
步骤303:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤304:将步骤303得到的测试图像输入每个特定类别深度自编码器,得到每个特定类别深度自编码器的输出
所述的基于深度自编码器的单样本人脸图像识别方法,所述计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别的具体步骤为:
步骤401:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤402:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤403:将步骤402得到的数据规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤404:将对应的特定类别深度自编码器输出规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤405:计算步骤403得到的数据与步骤404得到数据的二范数距离
步骤406:计算步骤405得到的最小二范数距离的最小值,并记录最小值对应的标号测试图像的类别与最小值对应的标号相同,Identity(y)=NI。
所述的基于深度自编码器的单样本人脸图像识别方法,所述用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别得具体步骤为:
步骤501:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤502:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤503:将步骤304得到的特定类别深度自编码器的输出规范化至[0,1]之间,规范化方法为将数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤504:用步骤503得到的特定类别深度自编码器的输出及类别训练Softmax回归模型,得到分类器S。
步骤505:将步骤502得到的数据规范化至[0,1]之间,规范化方法为数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤506:将步骤505处理的数据输入训练得到的分类器,给出测试图像的类别,Identity(yi)=S(yi)。
所述的基于深度自编码器的单样本人脸图像识别方法,所述PCA白化处理,包括以下步骤:
步骤A:将数据矩阵中X=[X1,X2,..,XN]的每个向量减去其均值,规范化为0均值向量;
步骤B:对数据矩阵求SVD分解:USD=XX′/N;
步骤C:PCA白化后的数据为:其中diag()为取矩阵的对角线上的值,ε为某个常数向量,一般取0.001。
本发明的有益效果是:1、利用深度自编码器的自学习功能,通过全部训练图像学习训练图像中包含的所有变化,得到广义深度自编码器,再用单个样本的复制微调广义深度自编码器得到特定类别深度自编码器,将多样本目标的变化推广至单样本目标,当输入测试图像时,重构出该目标与测试图像相同环境下的照片,以提高单样本人脸识别问题的识别率。
2、本发明的人脸识别方法不经过PCA白化的数据识别率达到79.57%(最小2范数距离)和79.60%(softmax回归模型分类)。经过PCA白化的数据识别率达到92.5%(最小2范数距离)和92.7%softmax回归模型分类),可见,本发明的人脸识别方法提高了识别目标只有一幅图像时的识别率,具有较好的推广应用前景。
附图说明
图1是本发明方法的流程图;
图2是本发明广义深度自编码器的训练流程图;
图3是本发明特定类别深度自编码器的训练流程图;
图4是本发明实施例中采用的测试图像。
具体实施方式
实施例1:结合图1-图4,一种基于深度自编码器的单样本人脸图像识别方法,该方法包括以下步骤:
步骤一:建立广义深度自编码器;建立广义深度自编码器的具体步骤为:
步骤101:获取已知库内所有图像,得到训练数据其中:m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VI为多样本目标图像集合,M为每个目标的样本数,N1为每个目标个数,VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤102:对训练数据进行规范化,将数据规范化至[0,1]之间,规范化方法为:直接将每个图像灰度值除以255,或者将图像规范化至[-1,1],然后线性映射到[0,1]之间;
步骤103:数据经过PCA白化处理或者不经过PCA白化处理。
步骤104:将步骤103得到的数据复制多倍,用所有数据训练深度自编码器,训练过程包括预训练、展开、微调得到广义深度自编码器;
步骤二:建立特定类别深度自编码器;建立特定类别深度自编码器的具体步骤为:
步骤201:得到特定类别深度自编码器的训练数据其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤202:将每个进行规范化处理,规范化到[0,1]之间,规范化方法与广义深度自编码器训练数据规范化方法相同;
步骤203:数据经过PCA白化处理或者不经过白化处理,与广义深度自编码器的训练数据处理相同;
步骤204:将步骤203得到的数据复制多倍;
步骤205:用步骤204得到的数据微调广义深度自编码器,得到N2个对应于单样本目标的特定类别深度自编码器CDi,i=1,...,N2。
步骤三:将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像,将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像的具体步骤为:
步骤301:得到测试图像集合其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数,NT为测试图像个数;
步骤302:对测试图像进行规范化处理,规范化到[0,1]之间,规范化方法与特定类别深度自编码器处理方式相同;
步骤303:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤304:将步骤303得到的测试图像输入每个特定类别深度自编码器,得到每个特定类别深度自编码器的输出
步骤四:计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别,或者用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别。
计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别的具体步骤为:
步骤401:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤402:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤403:将步骤402得到的数据规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤404:将对应的特定类别深度自编码器输出规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤405:计算步骤403得到的数据与步骤404得到数据的二范数距离
步骤406:计算步骤405得到的最小二范数距离的最小值,并记录最小值对应的标号测试图像的类别与最小值对应的标号相同,Identity(y)=NI。
用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别得具体步骤为:
步骤501:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤502:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤503:将步骤304得到的特定类别深度自编码器的输出规范化至[0,1]之间,规范化方法为将数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤504:用步骤503得到的特定类别深度自编码器的输出及类别训练Softmax回归模型,得到分类器S。
步骤505:将步骤502得到的数据规范化至[0,1]之间,规范化方法为数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤506:将步骤505处理的数据输入训练得到的分类器,给出测试图像的类别,Identity(yi)=S(yi)。
实施例2:一种基于深度自编码器的单样本人脸图像识别方法,下面结合附图对本发明作进一步详细的描述;参考附图1,本发明的各部分具体实施细节如下:
步骤一:产生广义深度自编码器,广义深度自编码器是描述所有图像在不同光照、表情、遮挡、姿态、身份的情况下的深度神经网络,参见图2,包括以下步骤:
101)得到广义深度自编码器训练数据:已知图像库内所有图像为训练数据m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数。VI为多样本目标图像集合,M为每个目标的样本数,N1为每个目标个数。VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像(如身份证,护照等证件上的照片)。
102)规范化数据至[0,1]之间,规范化方法1:将每个向量的数据直接除以255.方法2:先将单个图像数据即对每个列向量规范化为均值为0,方差为1的向量。再将每个列向量的数据除以2,加上1,规范化至[0,1]之间。
103)数据经过PCA白化处理或者不经过白化处理。
104)将第103)步得到的数据复制多倍。
105)将第104)步得到的训练数据输入深度自编码器,经过预训练,展开,微调过程得到广义深度自编码器。
步骤二:产生特定类别深度自编码器特,所述的特定类别深度自编码器是描述某个类别包含不同光照、表情、遮挡、姿态的情况下的深度神经网络,参见图3,包括以下步骤:
201)得到特定类别深度自编码器的训练数据m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数。VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像(如身份证,护照等证件上的照片)。
202)规范化每个图像向量规范化至[0,1]之间,规范化方法1:将每个向量的数据直接除以255.方法2:先将单个图像数据即对每个列向量规范化为均值为0,方差为1的向量。再将每个列向量的数据除以2,加上1,规范化至[0,1]之间。规范化方法要与广义深度自编码器训练数据规范化方法相同。
203)数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器的训练数据处理相同。
204)将第203)步得到的数据复制多倍。
205)用第204)步得到的数据微调广义深度自编码器,得到对应于N2个单样本类别的特定类别深度自编码器CDi,i=1,...,N2。
步骤三:测试图像的识别,包括以下步骤:
301)得到测试图像集合m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数。NT为测试图像个数。
302)对测试图像进行规范化处理,规范化到[0,1]之间。规范化方法1:将每个向量的数据直接除以255.方法2:先将单个图像数据即对每个列向量规范化为均值为0,方差为1的向量。再将每个列向量的数据除以2,加上1,规范化至[0,1]之间。规范化方法要与特定类别深度自编码器训练数据规范化方法相同。
303)数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器的训练数据处理相同。
304)用第303)步得到的测试图像输入每个特定类别深度自编码器,得到每个特定类别深度自编码器的输出
305)数据规范化;将第303)步得到的数据规范化至[-1,1]之间,规范化方法为将图像向量规范化为均值为0,方差为1的数据。将对应的特定类别深度自编码器输出规范化至[-1,1]之间,规范化方法为将输出向量规范化为均值为0,方差为1的数据。
306)使用最小二范数进行分类:计算第305)步得到的数据与第305)步得到的每个特定类别深度自编码器输出的二范数距离yi的身份由给出最小二范数距离的特定类别深度自编码器的类别决定。
307)使用Softmax回归模型分类:规范化特定类别深度自编码器的输出为[0,1]之间,用规范化后的特定类别深度自编码器的输出及类别训练Softmax回归模型得到分类器。将第303)步得到的数据规范化至[0,1]之间输入训练得到的分类器,给出测试图像的类别。
PCA白化处理,包含以下步骤:
a)将数据矩阵中X=[X1,X2,..,XN]的每个向量减去其均值,规范化为0均值向量。
b)对数据矩阵求SVD分解:USD=XX′/N
c)PCA白化后的数据为:其中diag()为取矩阵的对角线上的值,ε为某个常数向量,一般取0.001。
在Extended Yale Face Database B上,选择18个人每人39张较为均匀的照片和剩余的20个人每人一张标准图像(光照均匀,表情自然)作为广义深度自编码器数据训练集,训练集内共有722个图像,原图为192×168大小的图像,经过下采样,变为21×21大小的图像。训练集数据为441×722的矩阵,将此矩阵列复制32倍,得到441×23104训练数据矩阵。输入深度自编码器得到广义深度自编码器。20个人每人一张标准图像构成特定类别深度自编码器训练数据,将每个向量复制1000倍,得到20个441×1000数据矩阵,用每个数据矩阵微调广义深度自编码器,得到20个特定类别深度自编码器。测试时共有760个测试图像,将测试图像输入每个特定类别深度自编码器得到20个441×760的输出矩阵。计算测试图像与每个矩阵中对应输出的2范数距离,得出最小距离对应的特定类别深度自编码器的编号,得到测试图像的类别。或用20个输出矩阵及其对应的特定类别深度自编码器的编号训练Softmax回归模型,得到分类器,将760个测试图像输入分类器,得到每个测试图像的类别。本仿真实验在软件MATLAB2012a下实现,机器为1.89GHz的16核服务器。。经过仿真实验验证,本发明的人脸识别方法不经过PCA白化的数据识别率达到79.57%(最小2范数距离)和79.60%(softmax回归模型分类)。经过PCA白化的数据识别率达到92.5%(最小2范数距离)和92.7%softmax回归模型分类),可见,本发明的人脸识别方法提高了识别目标只有一幅图像时的识别率,具有较好的推广应用前景。

Claims (7)

1.一种基于深度自编码器的单样本人脸图像识别方法,其特征在于:该方法包括以下步骤:
步骤一:建立广义深度自编码器;
步骤二:建立特定类别深度自编码器;
步骤三:将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像。
步骤四:计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别,或者用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别。
2.根据权利要求1所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述建立广义深度自编码器的具体步骤为:
步骤101:获取已知库内所有图像,得到训练数据其中:m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VI为多样本目标图像集合,M为每个目标的样本数,N1为每个目标个数,VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤102:对训练数据进行规范化,将数据规范化至[0,1]之间,规范化方法为:直接将每个图像灰度值除以255,或者将图像规范化至[-1,1],然后线性映射到[0,1]之间;
步骤103:数据经过PCA白化处理或者不经过PCA白化处理。
步骤104:将步骤103得到的数据复制多倍,用所有数据训练深度自编码器,训练过程包括预训练、展开、微调得到广义深度自编码器。
3.根据权利要求1所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述建立特定类别深度自编码器的具体步骤为:
步骤201:得到特定类别深度自编码器的训练数据其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数;VN为单样本目标图像集合,N2为目标个数,每个目标有一张人脸照片,一般为光照均匀,表情自然图像;
步骤202:将每个进行规范化处理,规范化到[0,1]之间,规范化方法与广义深度自编码器训练数据规范化方法相同;
步骤203:数据经过PCA白化处理或者不经过白化处理,与广义深度自编码器的训练数据处理相同;
步骤204:将步骤203得到的数据复制多倍;
步骤205:用步骤204得到的数据微调广义深度自编码器,得到N2个对应于单样本目标的特定类别深度自编码器CDi,i=1,...,N2。
4.根据权利要求1所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述将测试图像输入特定类别深度自编码器,得到每个特定类别深度自编码器的重构图像的具体步骤为:
步骤301:得到测试图像集合其中,m为单个图像表示维数,为人脸照片按照行取然后列取的顺序将二维照片拉成一维列向量,维数为m=行数*列数,NT为测试图像个数;
步骤302:对测试图像进行规范化处理,规范化到[0,1]之间,规范化方法与特定类别深度自编码器处理方式相同;
步骤303:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤304:将步骤303得到的测试图像输入每个特定类别深度自编码器,得到每个特定类别深度自编码器的输出
5.根据权利要求1所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述计算测试图像与重构图像的最小二范数距离,最小距离对应的特定类别深度自编码器的类别为测试图像的类别的具体步骤为:
步骤401:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤402:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤403:将步骤402得到的数据规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤404:将对应的特定类别深度自编码器输出规范化至[-1,1]之间,规范化方法为将向量规范化为均值为0,方差为1的数据;
步骤405:计算步骤403得到的数据与步骤404得到数据的二范数距离
步骤406:计算步骤405得到的最小二范数距离的最小值,并记录最小值对应的标号测试图像的类别与最小值对应的标号相同,Identity(y)=NI。
6.根据权利要求1所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述用重构图像及其对应的特定类别深度自编码器的类别训练Softmax回归模型,得到分类器,将测试图像输入分类器,得到分类的类别的具体步骤为:
步骤501:将测试图像yi规范化至[0,1]之间,规范化方法与特定类别深度自编码器训练数据的规范化方法相同;
步骤502:数据经过PCA白化处理或者不经过白化处理,与特定类别深度自编码器训练数据的处理过程相同;
步骤503:将步骤304得到的特定类别深度自编码器的输出规范化至[0,1]之间, 规范化方法为将数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤504:用步骤503得到的特定类别深度自编码器的输出及类别训练Softmax回归模型,得到分类器S。
步骤505:将步骤502得到的数据规范化至[0,1]之间,规范化方法为数据规范化至[-1,1],然后线性映射到[0,1]之间;
步骤506:将步骤505处理的数据输入训练得到的分类器,给出测试图像的类别,Identity(yi)=S(yi)。
7.根据权利要求2或3或4或5或6所述的基于深度自编码器的单样本人脸图像识别方法,其特征在于:所述PCA白化处理,包括以下步骤:
步骤A:将数据矩阵中X=[X1,X2,..,XN]的每个向量减去其均值,规范化为0均值向量;
步骤B:对数据矩阵求SVD分解:USD=XX′/N;
步骤C:PCA白化后的数据为:其中diag()为取矩阵的对角线上的值,ε为某个常数向量,一般取0.001。
CN201610250705.8A 2016-04-21 2016-04-21 一种基于深度自编码器的单样本人脸图像识别方法 Expired - Fee Related CN105930796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610250705.8A CN105930796B (zh) 2016-04-21 2016-04-21 一种基于深度自编码器的单样本人脸图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610250705.8A CN105930796B (zh) 2016-04-21 2016-04-21 一种基于深度自编码器的单样本人脸图像识别方法

Publications (2)

Publication Number Publication Date
CN105930796A true CN105930796A (zh) 2016-09-07
CN105930796B CN105930796B (zh) 2019-05-07

Family

ID=56838701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610250705.8A Expired - Fee Related CN105930796B (zh) 2016-04-21 2016-04-21 一种基于深度自编码器的单样本人脸图像识别方法

Country Status (1)

Country Link
CN (1) CN105930796B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599807A (zh) * 2016-12-01 2017-04-26 中科唯实科技(北京)有限公司 一种基于自编码的行人检索方法
CN108038455A (zh) * 2017-12-19 2018-05-15 中国科学院自动化研究所 基于深度学习的仿生机器孔雀图像识别方法
CN109800767A (zh) * 2018-12-12 2019-05-24 天津津航技术物理研究所 基于hog特征和自编码器的目标检测方法
CN111178196A (zh) * 2019-12-19 2020-05-19 东软集团股份有限公司 一种细胞分类的方法、装置及设备
CN112115443A (zh) * 2020-11-19 2020-12-22 索信达(北京)数据技术有限公司 一种终端用户鉴权方法及系统
CN112598000A (zh) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 题目识别方法、装置、电子设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298973A (zh) * 2014-10-09 2015-01-21 北京工业大学 基于自编码器的人脸图像旋转方法
CN105205453A (zh) * 2015-08-28 2015-12-30 中国科学院自动化研究所 基于深度自编码器的人眼检测和定位方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298973A (zh) * 2014-10-09 2015-01-21 北京工业大学 基于自编码器的人脸图像旋转方法
CN105205453A (zh) * 2015-08-28 2015-12-30 中国科学院自动化研究所 基于深度自编码器的人眼检测和定位方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SHENGHUA GAO 等: "Single Sample Face Recognition via Learning Deep Supervised Autoencoders", 《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》 *
倪嘉成 等: "结合侧抑制机制的自动编码器训练新算法", 《计算机应用与软件》 *
徐培: "基于少量样本的快速目标检测与识别", 《中国博士学位论文全文数据库信息科技辑》 *
池燕玲: "基于深度学习的人脸识别方法的研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599807A (zh) * 2016-12-01 2017-04-26 中科唯实科技(北京)有限公司 一种基于自编码的行人检索方法
CN108038455A (zh) * 2017-12-19 2018-05-15 中国科学院自动化研究所 基于深度学习的仿生机器孔雀图像识别方法
CN109800767A (zh) * 2018-12-12 2019-05-24 天津津航技术物理研究所 基于hog特征和自编码器的目标检测方法
CN111178196A (zh) * 2019-12-19 2020-05-19 东软集团股份有限公司 一种细胞分类的方法、装置及设备
CN111178196B (zh) * 2019-12-19 2024-01-23 东软集团股份有限公司 一种细胞分类的方法、装置及设备
CN112115443A (zh) * 2020-11-19 2020-12-22 索信达(北京)数据技术有限公司 一种终端用户鉴权方法及系统
CN112115443B (zh) * 2020-11-19 2021-02-12 索信达(北京)数据技术有限公司 一种终端用户鉴权方法及系统
CN112598000A (zh) * 2021-03-03 2021-04-02 北京世纪好未来教育科技有限公司 题目识别方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN105930796B (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
CN105930796A (zh) 一种基于深度自编码器的单样本人脸图像识别方法
CN110175613A (zh) 基于多尺度特征和编解码器模型的街景图像语义分割方法
CN108376267A (zh) 一种基于类别转移的零样本分类方法
CN105184298B (zh) 一种快速局部约束低秩编码的图像分类方法
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
Aditya et al. Batik classification using neural network with gray level co-occurence matrix and statistical color feature extraction
CN106446954A (zh) 一种基于深度学习的字符识别方法
CN106709997B (zh) 基于深度神经网络和稀疏自编码器的三维关键点检测方法
CN105574475A (zh) 一种基于共同向量词典的稀疏表示分类方法
CN104700089A (zh) 一种基于Gabor小波和SB2DLPP的人脸识别方法
CN110738071A (zh) 一种基于深度学习和迁移学习的人脸算法模型训练方法
CN114332544B (zh) 一种基于图像块评分的细粒度图像分类方法和装置
CN113610540A (zh) 一种河蟹防伪溯源方法及系统
CN109598671A (zh) 图像生成方法、装置、设备及介质
CN106056074A (zh) 一种基于区域稀疏的单张训练样本人脸识别方法
CN108229505B (zh) 基于fisher多级字典学习的图像分类方法
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法
CN105844605A (zh) 基于自适应表示的人脸画像合成方法
CN109241869A (zh) 答题卡分数识别方法、装置及终端设备
CN103984918B (zh) 一种基于类内及类间变化的人脸图像识别方法
CN117011274A (zh) 自动化玻璃瓶检测系统及其方法
CN111950415A (zh) 一种图像检测方法和装置
Vyas et al. Face recognition using feature extraction and neuro-fuzzy techniques
CN106650678B (zh) Gabor小波子带相关结构人脸识别方法
CN115205877A (zh) 一种不规则排版发票单据布局预测方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190507

Termination date: 20210421

CF01 Termination of patent right due to non-payment of annual fee