CN112380995B - 稀疏表示域中基于深度特征学习的人脸识别方法及系统 - Google Patents

稀疏表示域中基于深度特征学习的人脸识别方法及系统 Download PDF

Info

Publication number
CN112380995B
CN112380995B CN202011275794.4A CN202011275794A CN112380995B CN 112380995 B CN112380995 B CN 112380995B CN 202011275794 A CN202011275794 A CN 202011275794A CN 112380995 B CN112380995 B CN 112380995B
Authority
CN
China
Prior art keywords
image
face
sparse representation
face recognition
face image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011275794.4A
Other languages
English (en)
Other versions
CN112380995A (zh
Inventor
向友君
阮荣钜
翁子淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202011275794.4A priority Critical patent/CN112380995B/zh
Publication of CN112380995A publication Critical patent/CN112380995A/zh
Application granted granted Critical
Publication of CN112380995B publication Critical patent/CN112380995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种稀疏表示域中基于深度特征学习的人脸识别方法及系统,其中方法包括以下步骤:获取人脸图像;采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示;将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果。本发明通过二维小波变换、局部二值算子和梯度算子处理原始人脸获得稀疏表示,去除冗余信息并保留了富含语义的信息,更适合神经网络对深度特征进行提取,提高人脸识别准确度,可广泛应用于计算机视觉领域。

Description

稀疏表示域中基于深度特征学习的人脸识别方法及系统
技术领域
本发明涉及计算机视觉领域,尤其涉及一种稀疏表示域中基于深度特征学习的人脸识别方法及系统。
背景技术
生物特征识别技术是目前学术界与工业界致力于研究的一个重要方向,而在生物特征识别中的人脸识别是主要的组成成分。人脸识别的任务是身份鉴定,人脸是一个人身份外在的最直观的表现。同样可以作为身份鉴定的线索有很多,可以大致分为两类,一类是非生物特征,比如各种证件等,这类线索在这个时代可能会逐步被智能产物所更新替代;另一类则是生物特征,作为代表的有指纹、虹膜、掌纹等等。这类线索是人体的内在属性,具有很强的区分性和不可替代性,是目前计算机视觉研究者致力于研究的重要方向。在生物特征识别技术中,相比于指纹,虹膜,掌纹,人脸由于不需要采集对象高度配合,便于收集,自由灵活等优点,成为了最为广泛研究的生物特征。
人脸识别在访问控制,刷脸支付,远程服务等应用中有着重大作用,但是由于现实环境的复杂性,人脸识别也存在许多难题。一方面,同一个人会因为拍摄环境的灯光,拍摄角度,其自身的表情等因素的影响而造成差异,即类内差异大;另一方面,又可能由于基因相似或是某些外部因素如化妆等,造成不同人的人脸图像接近,即类外差异小。这使得深度模型能否从高维人脸图像提取具有强判别能力的特征成为关键。而强判别能力的特征所强调的是该特征的差异在类内应该尽可能小,而在不同类之间应该尽可能大。
由于人脸图像的维度很高,一般都在万维以上,高分辨率得人脸图像甚至能达百万维,以高维的人脸图像训练深度网络,会使得网络参数以及计算量大幅增加,且由于人脸图像存在冗余,还会使训练过程变得非常缓慢,同时这样的人脸数据也会增加存储空间。为了应对这一系列问题,有部分学术界的研究者在人脸识别中引入稀疏表示的理论基础,随后稀疏表示也成为人脸识别中的另一个研究方向。一方面,需要找到一种合适的方式方法对人脸数据进行稀疏变换;另一方面,需要在稀疏域中用合适的方法进行深度特征的提取以满足前面所述利用深度模型提取具有强判别能力的特征。通过合适的稀疏变换方法将高维人脸图像进行稀疏表示,在稀疏域中进行深度特征的学习,可以大大缩短迭代次数及训练时间,同时与直接使用原始图像进行训练相比,使用富含语义信息的稀疏域特征更有利于深度模型的学习。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种稀疏表示域中基于深度特征学习的人脸识别方法及系统。
本发明所采用的技术方案是:
一种稀疏表示域中基于深度特征学习的人脸识别方法,包括以下步骤:
获取人脸图像;
采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示;
将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果。
进一步,所述人脸识别模型为MobileFaceNet模型,所述MobileFaceNet模型在训练过程中,采用基于Angular margin的目标函数进行监督。
进一步,所述采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示,包括:
对所述人脸图像进行二维小波分解,获得第一图像;
采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像;
将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示。
进一步,所述第一图像为四通道图像,所述对所述人脸图像进行二维小波分解,获得第一图像,包括:
确定二维小波变换的阶数以及所使用的频率分量后,对所述人脸图像进行二维小波分解,获得四通道图像。
进一步,所述第二图像为二通道图像,所述采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像,包括:
确定局部二值模式以及梯度算子的计算区域大小后,采用局部二值算子与梯度算子对所述人脸图像进行处理,获得二通道图像。
进一步,所述将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示,包括:
将所述第一图像的尺寸和所述第二图像的尺寸调整为同一尺寸;
将尺寸调整后的所述第一图像和所述第二图像进行融合拼接,获得融合图像作为所述人脸图像的稀疏表示。
进一步,所述MobileFaceNet模型包括15个Bottleneck单元块、1个7*7平均池化层和1个全连接层。
进一步,所述Bottleneck单元块的组成为:一层的点卷积层,一层深度卷积层,最后再经一层点卷积层。
进一步,所述点卷积层包括尺寸为1*1的卷积核、批归一化操作和PReLU激活函数,所述深度卷积层包括尺寸为3*3的卷积核,且所述尺寸为3*3的卷积核的通道数与所述稀疏表示的通道数匹配。
本发明所采用的另一技术方案是:
一种稀疏表示域中基于深度特征学习的人脸识别系统,包括:
图像输入模块,用于获取人脸图像;
图像处理模块,用于采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示;
人脸识别模块,用于将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果。
本发明的有益效果是:本发明通过二维小波变换、局部二值算子和梯度算子处理原始人脸获得稀疏表示,去除冗余信息并保留了富含语义的信息,更适合神经网络对深度特征进行提取,提高人脸识别准确度。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1是本发明实施例中一种稀疏表示域中基于深度特征学习的人脸识别方法的结构框图;
图2是本发明实施例中二阶小波分解过程的示意图;
图3是本发明实施例中局部二值化模板的示意图;
图4是本发明实施例中一种稀疏表示域中基于深度特征学习的人脸识别方法的步骤流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
参见图1和图4,本实施例提供一种稀疏表示域中基于深度特征学习的人脸识别方法,包括以下步骤:
S1、构建人脸识别模型。该人脸识别模型为MobileFaceNet模型,该MobileFaceNet模型在训练时,采用基于Angular margin的目标函数CosFace Loss进行监督。
S2、获取人脸图像。
S3、采用二维小波分解、局部二值算子与梯度算子对人脸图像进行处理,获得人脸图像的稀疏表示。
其中,步骤S3包括步骤S31-S33:
S31、对人脸图像进行二维小波分解,获得第一图像。第一图像为四通道图像,具体地:确定二维小波变换的阶数以及所使用的频率分量后,对人脸图像进行二维小波分解,获得四通道图像。
S32、采用局部二值算子与梯度算子对人脸图像进行处理,获得第二图像。第二图像为二通道图像,具体地:确定局部二值模式以及梯度算子的计算区域大小后,采用局部二值算子与梯度算子对人脸图像进行处理,获得二通道图像。
S33、将第一图像和第二图像进行融合,获得融合图像作为人脸图像的稀疏表示。
步骤S33包括以下步骤S331-S332:
S331、将第一图像的尺寸和第二图像的尺寸调整为同一尺寸;
S332、将尺寸调整后的第一图像和第二图像进行融合拼接,获得融合图像作为人脸图像的稀疏表示。
S4、将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果。
其中,人脸识别模型的系统框架如图1所示,构建人脸识别模型包括以下步骤:
步骤1:通过应用二维小波分解、局部二值算子与梯度算子到人脸图像上得到其稀疏表示的组合形式。
其中,二维小波分解的过程如图2所示,即将人脸图像首先在水平方向分别进行高通低通滤波,进行降采样后再在垂直方向进行高通低通滤波,以此得到一阶小波分解的结果,其包含四个分量,分别是全局低频,水平高频,垂直高频和全局高频其对应为人脸图像的平滑以及边缘细节特征;接着将通过两次低通滤波的结果取出,进行重复同样的操作即可得到二阶小波分解的结果,同理,N阶小波变换结果也是这样得出。本实施例将一阶结果的四个分量取出作为第一种稀疏表示结果(即第一图像)。
第二种稀疏表示结果(即第二图像)为两个部分组成,一个是局部二值算子的结果,另一个则是在局部二值算子的基础上再通过Sobel梯度算子增强边缘信息的结果。局部二值算子计算的区域大小为半径为二的圆形,在该圆上等距采样,其模板如图3所示。将该模板在人脸图像上进行遍历,以所遍历到的窗口的中心像素为阈值,与模板上对应位置的8个像素的灰度值进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样就可以得到一个8位二进制数,再将其转为十进制数,该值即为该窗口中心像素的局部二值特征值。遍历完整幅图像可以得到一个局部二值特征图,作为第二种稀疏表示结果的第一个通道。再对第一个通道计算其梯度得到第二个通道图,表示为其梯度特征。由此可得到第二种稀疏变换的结果。
通常有一些采样点不在整数坐标上,也就是采样点的像素值不能直接获取,需要通过近似的方法来得到,通过双线性插值来得到采样点位置的像素值:
经过局部二值算子和Sobel梯度算子处理后得到的第二种稀疏表示结果可以表示为“一副二通道图像”,将第一种稀疏变换方法缩放尺寸并将四种分量组合成“一副四通道图像”,再讲两种稀疏表示通过通道拼接得到“一副六通道图像”作为最终的训练以及测试数据。
在将通道拼接融合的过程中,需先将两种稀疏表示结果缩放到同一尺寸,再进行通道的拼接;即人脸图像进行两种变换方法得到了两种结果,第一种结果是一个4通道的特征图,第二种结果得到的是二通道的特征图(这里的通道可以这样理解,常见的彩色图像是RGB图像,即有R,G,B三个通道,那这里通道可以类比于RGB,即每个代表的信息不同,比如通道1-4代表不同频率下的小波变换结果,5-6是上文提到的局部二值特征图和梯度特征图)。然后拼接就是在通道这个维度上,把上述提到的4通道和2通道合起来变成一个6通道的特征图。
步骤2:对于步骤1得到的人脸图像的稀疏表示,采用MobileFaceNet模型对其进行深度特征的学习。
具体的,MobileFaceNet的网络结构如表1所示,首先经过一个3*3的卷积核,再通过一个3*3的深度卷积,深度卷积定义为:使用与输入通道数一致的卷积核数量,卷积核与通道对应进行卷积操作,输出特征图与输入特征图通道数一致,即深度卷积只对大小有影响,对通道数没有影响;进而通过15个Bottleneck提取深层语义信息,再通过1*1卷积核将各通道之间信息进行融合,进一步通过7*7的Average Pooling得到每个通道的特征值,最后通过一个全连接层得到人脸的128维表示向量。
表1
输入 卷积 t c n
112×112×3 conv3×3 - 64 1
56×56×64 Depth-wise conv3×3 - 64 1
56×56×64 Bottleneck 2 64 5
28×28×64 Bottleneck 4 128 1
14×14×128 Bottleneck 2 128 6
14×14×128 Bottleneck 4 128 1
7×7×128 Bottleneck 2 128 2
7×7×128 Conv1×1 - 512 1
7×7×512 Average pooling 7×7 - 512 1
1×1×512 Linear conv1×1 - 128 1
具体的,所述Bottleneck单元块的具体组成以及顺序为:一层的点卷积层,该点卷积层为1*1的卷积核、批归一化操作和PReLU激活函数组合而成;一层深度卷积层,该深度卷积层为尺寸3*3,通道数与输入特征图通道数一一对应的卷积核、批归一化操作和PReLU激活函数组合而成;最后再经一层点卷积层,该层为1*1的卷积核和批归一化组合而成。
步骤3:通过一种基于Angular margin的目标函数CosFace Loss对网络的训练进行监督;
其中,CosFace Loss目标函数如公式2所示:
其中s为特征向量归一化后的放大倍数,m为余弦值的约束项,在本发明实例中,这两个超参数分别设置为32和0.5,在训练阶段,该目标函数作为监督网络学习强判别特征的有效手段,将128维的网络输出通过该函数得到该人脸分类为所有类别的概率值。则如果在对应的真实标签的位置越接近1则损失越小。
步骤4:通过将上述步骤1-3进行整合,实现一个端到端的人脸识别系统。更具体的,只需将人脸图像作为系统输入,系统在提取图片时会进行二维小波分解、局部二值算子和梯度算子等处理,并将结果融合作为MobileFaceNet的输入,进而将结果作为输出。从人脸图像的输入到输出完全不用在进行多余的操作,实现系统的端到端功能。
此外,本实施例还进行大量的对照试验,在进行大量的实验后最终得到了99.05%的识别准确率。在稀疏表示方法,网络模型以及目标函数都进行了多种办法的尝试,在经过大量的实验后最终选择最优的组合方式,即上文对应的各步骤的具体方法,实验结果过如表2所示。
表2
综上所述,相较于现有技术,本实施例稀疏表示域中基于深度特征学习的人脸识别方法具有以下优点:
(1)、本实施例将稀疏变换方法应用于人脸识别任务中,对高维人脸进行预处理,出去冗余信息并保留了富含语义的信息,更适合神经网络进行深度特征的学习。
(2)、本实施例是将人脸识别任务分为三个方面,即数据,模型以及策略,在三个方面均选择多种解决方法进行对比,通过大量的实验才得出最后这种最优的组合式,即通过二维小波变换、局部二值算子和梯度算子处理原始人脸得到稀疏表示,在通过CosfaceLoss监督训练MobileFaceNet学习强判别能力的深度特征。
本实施例还提供一种稀疏表示域中基于深度特征学习的人脸识别系统,包括:
图像输入模块,用于获取人脸图像;
图像处理模块,用于采用二维小波分解、局部二值算子与梯度算子对人脸图像进行处理,获得人脸图像的稀疏表示;
人脸识别模块,用于将稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果。
本实施例的一种稀疏表示域中基于深度特征学习的人脸识别系统,可执行本发明方法实施例所提供的一种稀疏表示域中基于深度特征学习的人脸识别方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (5)

1.一种稀疏表示域中基于深度特征学习的人脸识别方法,其特征在于,包括以下步骤:
获取人脸图像;
采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示;
将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果;
所述人脸识别模型为MobileFaceNet模型,所述MobileFaceNet模型在训练过程中,采用基于Angular margin的目标函数进行监督;
所述采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示,包括:
对所述人脸图像进行二维小波分解,获得第一图像;
采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像;
将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示;
所述第一图像为四通道图像,所述对所述人脸图像进行二维小波分解,获得第一图像,包括:
确定二维小波变换的阶数以及所使用的频率分量后,对所述人脸图像进行二维小波分解,获得四通道图像;
所述第二图像为二通道图像,所述采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像,包括:
确定局部二值模式以及梯度算子的计算区域大小后,采用局部二值算子与梯度算子对所述人脸图像进行处理,获得二通道图像;
所述将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示,包括:
将所述第一图像的尺寸和所述第二图像的尺寸调整为同一尺寸;
将尺寸调整后的所述第一图像和所述第二图像进行融合拼接,获得融合图像作为所述人脸图像的稀疏表示。
2.根据权利要求1所述的一种稀疏表示域中基于深度特征学习的人脸识别方法,其特征在于,所述MobileFaceNet模型包括15个Bottleneck单元块、1个7*7平均池化层和1个全连接层。
3.根据权利要求2所述的一种稀疏表示域中基于深度特征学习的人脸识别方法,其特征在于,所述Bottleneck单元块的组成为:一层的点卷积层,一层深度卷积层,最后再经一层点卷积层。
4.根据权利要求3所述的一种稀疏表示域中基于深度特征学习的人脸识别方法,其特征在于,所述点卷积层包括尺寸为1*1的卷积核、批归一化操作和PReLU激活函数,所述深度卷积层包括尺寸为3*3的卷积核,且所述尺寸为3*3的卷积核的通道数与所述稀疏表示的通道数匹配。
5.一种稀疏表示域中基于深度特征学习的人脸识别系统,其特征在于,包括:
图像输入模块,用于获取人脸图像;
图像处理模块,用于采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示;
人脸识别模块,用于将所述稀疏表示输入人脸识别模型进行人脸识别,获得人脸识别结果;
所述人脸识别模型为MobileFaceNet模型,所述MobileFaceNet模型在训练过程中,采用基于Angular margin的目标函数进行监督;
所述采用二维小波分解、局部二值算子与梯度算子对所述人脸图像进行处理,获得所述人脸图像的稀疏表示,包括:
对所述人脸图像进行二维小波分解,获得第一图像;
采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像;
将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示;
所述第一图像为四通道图像,所述对所述人脸图像进行二维小波分解,获得第一图像,包括:
确定二维小波变换的阶数以及所使用的频率分量后,对所述人脸图像进行二维小波分解,获得四通道图像;
所述第二图像为二通道图像,所述采用局部二值算子与梯度算子对所述人脸图像进行处理,获得第二图像,包括:
确定局部二值模式以及梯度算子的计算区域大小后,采用局部二值算子与梯度算子对所述人脸图像进行处理,获得二通道图像;
所述将所述第一图像和所述第二图像进行融合,获得融合图像作为所述人脸图像的稀疏表示,包括:
将所述第一图像的尺寸和所述第二图像的尺寸调整为同一尺寸;
将尺寸调整后的所述第一图像和所述第二图像进行融合拼接,获得融合图像作为所述人脸图像的稀疏表示。
CN202011275794.4A 2020-11-16 2020-11-16 稀疏表示域中基于深度特征学习的人脸识别方法及系统 Active CN112380995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011275794.4A CN112380995B (zh) 2020-11-16 2020-11-16 稀疏表示域中基于深度特征学习的人脸识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011275794.4A CN112380995B (zh) 2020-11-16 2020-11-16 稀疏表示域中基于深度特征学习的人脸识别方法及系统

Publications (2)

Publication Number Publication Date
CN112380995A CN112380995A (zh) 2021-02-19
CN112380995B true CN112380995B (zh) 2023-09-12

Family

ID=74584032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011275794.4A Active CN112380995B (zh) 2020-11-16 2020-11-16 稀疏表示域中基于深度特征学习的人脸识别方法及系统

Country Status (1)

Country Link
CN (1) CN112380995B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004902A (zh) * 2010-11-12 2011-04-06 湖南大学 一种基于小波和稀疏表示理论的近红外人脸图像识别方法
CN103413119A (zh) * 2013-07-24 2013-11-27 中山大学 基于人脸稀疏描述子的单样本人脸识别方法
CN106570464A (zh) * 2016-10-31 2017-04-19 华南理工大学 一种快速处理人脸遮挡的人脸识别方法及装置
CN107292256A (zh) * 2017-06-14 2017-10-24 西安电子科技大学 基于辅任务的深度卷积小波神经网络表情识别方法
CN108664911A (zh) * 2018-05-04 2018-10-16 武汉科技大学 一种基于图像稀疏表示的鲁棒人脸识别方法
CN111178130A (zh) * 2019-11-25 2020-05-19 重庆特斯联智慧科技股份有限公司 一种基于深度学习的人脸识别方法、系统和可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004902A (zh) * 2010-11-12 2011-04-06 湖南大学 一种基于小波和稀疏表示理论的近红外人脸图像识别方法
CN103413119A (zh) * 2013-07-24 2013-11-27 中山大学 基于人脸稀疏描述子的单样本人脸识别方法
CN106570464A (zh) * 2016-10-31 2017-04-19 华南理工大学 一种快速处理人脸遮挡的人脸识别方法及装置
CN107292256A (zh) * 2017-06-14 2017-10-24 西安电子科技大学 基于辅任务的深度卷积小波神经网络表情识别方法
CN108664911A (zh) * 2018-05-04 2018-10-16 武汉科技大学 一种基于图像稀疏表示的鲁棒人脸识别方法
CN111178130A (zh) * 2019-11-25 2020-05-19 重庆特斯联智慧科技股份有限公司 一种基于深度学习的人脸识别方法、系统和可读存储介质

Also Published As

Publication number Publication date
CN112380995A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN110414507B (zh) 车牌识别方法、装置、计算机设备和存储介质
US20190205758A1 (en) Gland segmentation with deeply-supervised multi-level deconvolution networks
CN105917353B (zh) 用于生物认证的特征提取及匹配以及模板更新
EP2344980B1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung einer geste in einem bild, sowie vorrichtung, verfahren und computerprogramm zur steuerung eines geräts
Kumar et al. Live detection of face using machine learning with multi-feature method
Bouchaffra et al. Structural hidden Markov models for biometrics: Fusion of face and fingerprint
CN112801146A (zh) 一种目标检测方法及系统
CN112257665A (zh) 图像内容的识别方法、图像识别模型的训练方法及介质
HN et al. Human Facial Expression Recognition from static images using shape and appearance feature
CN114821682B (zh) 一种基于深度学习算法的多样本混合掌静脉识别方法
CN111275070B (zh) 一种基于局部特征匹配的签名验证方法及设备
Liu et al. Iris recognition in visible spectrum based on multi-layer analogous convolution and collaborative representation
CN110619280B (zh) 一种基于深度联合判别学习的车辆重识别方法及装置
Barodi et al. An enhanced artificial intelligence-based approach applied to vehicular traffic signs detection and road safety enhancement
Sun et al. Iris recognition based on local circular Gabor filters and multi-scale convolution feature fusion network
CN112686247A (zh) 一种身份证号码检测方法、装置、可读存储介质和终端
Buniatyan et al. Weakly supervised deep metric learning for template matching
CN112380995B (zh) 稀疏表示域中基于深度特征学习的人脸识别方法及系统
CN109460768B (zh) 一种用于组织病理学显微图像的文本检测与去除方法
CN111488811A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
CN114387489A (zh) 电力设备识别方法、装置和终端设备
CN111951287A (zh) 一种二维码检测和识读方法
Ebanesar et al. Human Ear Recognition Using Convolutional Neural Network
KR20200051903A (ko) 위조지문 검출 가능한 지문인식 방법 및 시스템
Benchaou et al. New approach of features extraction for numeral recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant