CN110598584A - 一种基于小波变换和dct的卷积神经网络人脸识别算法 - Google Patents

一种基于小波变换和dct的卷积神经网络人脸识别算法 Download PDF

Info

Publication number
CN110598584A
CN110598584A CN201910790630.6A CN201910790630A CN110598584A CN 110598584 A CN110598584 A CN 110598584A CN 201910790630 A CN201910790630 A CN 201910790630A CN 110598584 A CN110598584 A CN 110598584A
Authority
CN
China
Prior art keywords
neural network
dct
convolutional neural
image
layers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910790630.6A
Other languages
English (en)
Inventor
雷志春
王嘉欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201910790630.6A priority Critical patent/CN110598584A/zh
Publication of CN110598584A publication Critical patent/CN110598584A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开种基于小波变换和DCT的卷积神经网络人脸识别算法,包括如下步骤:采用二维离散小波变换将目标图像分解成不同子带并保留低频子带;通过DCT变换获得低频子带图像部分DCT系数;将DCT系数输入卷积神经网络中提取特征,进行训练分类,最后获得用于识别面部图像的的卷积神经网络模型。本发明是在人脸图像进入卷积神经网络之前,先对图像小波变换,得到低频子带图像并对其做DCT变换,提取部分DCT系数,从而减少冗余信息量,降低运算复杂度,最后将DCT系数输入卷积神经网络进行训练分类,提高了人脸识别的准确率同时缩短了训练时间。

Description

一种基于小波变换和DCT的卷积神经网络人脸识别算法
技术领域
本发明涉及人脸识别技术领域,特别是涉及一种基于小波变换和DCT的卷积神经网络人脸识别算法。
背景技术
人脸识别流程包括四个阶段:人脸检测、人脸对齐、特征提取和人脸分类。其中,最重要的阶段是特征提取阶段,特征提取的好坏直接影响识别的准确率。总体来说人脸识别方法可以总结为:基于自然特征的方法、基于模块匹配的方法、基于子空间方法、基于人脸特征的方法、基于深度学习的方法。
深度学习越来越受到人们的关注。卷积神经网络CNN(Convolutional NeuralNetwork)是深度学习中非常重要的方法,而且卷积神经网络对图像识别具有很强的优势。但利用卷积神经网络对人脸进行识别过程中,由于图像存在维数过高,信息量大,计算复杂等问题,使得训练周期过长。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于小波变换和DCT的卷积神经网络人脸识别算法。
为实现本发明的目的所采用的技术方案是:
一种基于小波变换和DCT的卷积神经网络人脸识别算法,包括如下步骤:
采用二维离散小波变换将目标图像分解成不同子带并保留低频子带;
通过DCT变换获得低频子带图像部分DCT系数;
将DCT系数输入卷积神经网络中提取特征,进行训练分类,最后获得用于识别面部图像的的卷积神经网络模型。
其中,所述卷积神经网络包括卷积层,池化层,全连接层,所述卷积层为4个,所述池化层为4个,所述全连接层为两个,所述全连接层连接分类器。
其中,所述分类器为softmax分类器。
其中,第一层和第二层的卷积层卷积核大小为5×5,后两层使用3×3的卷积核,在每一个卷积层后均使用了ReLU激活函数,池化层均采用最大池化,池化规模为2×2,步长为2。
本发明是在人脸图像进入卷积神经网络之前,首先对图像进行小波变换,得到低频子带图像并对其做DCT变换,提取部分DCT系数,以减少冗余信息量,最后将DCT系数输入卷积神经网络进行训练分类。
附图说明
图1为本发明的三维图
图2所示为二维小波分解示意图;
图3a-3b所示为原始图像与一级小波分解图像的对比;
图4a-4c所示为128×128原始图像与分别提取24×24,48×48数量的DCT系数重构的人脸图像;
图5所示为卷积神经网络的最大池化操作的示意图;
图6所示为本发明所用的卷积神经网络结构图。
具体实施方式
以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明基于小波变换和DCT的卷积神经网络人脸识别算法,其步骤,对于给定的图像,首先采用二维离散小波变换将图像分解成不同子带并保留低频子带;接下来,通过DCT变换获得低频子带图像部分系数以减少信息冗余;然后通过将DCT系数输入CNN以提取特征,最后,训练的CNN网络模型用于识别面部图像。
二维离散小波变换是将二维图像在不同的尺度上进行分解,得到各方向细节分量,如图2所示,LL包含低频信息,LH和HL分别包含水平高频信息和垂直高频信息,HH是对角高频信息。图3a为原始人脸图像,经过二维小波变换后得到右侧的图3b。由图3a-3b可知,图像的大部分能量信息集中在低频部分,高频部分含少量纹理和边缘信息。当直接对低频分量提取特征时,图像中有用信息相对集中,因此能有效地降低图像的维数同时降低计算量。
DCT(离散余弦变换)变换可将信号或图像由空间域变换到频域,原理如下式:
逆变换为:
其中,u=0,1…,N-1,v=0,1…,N-1。F(u,v)为变换结果,也称为DCT系数。
c(u),c(v)定义如下:
离散余弦变换的特点是:频域变化因子较大时u,v较大时,DCT系数F(u,v)的值比较小,而数值较大的F(u,v)主要分布在(u,v)较小的左上角区域,这也是有用信息的集中区域,其大部分能量主要集中在低频部分。利用DCT系数重建图像时,保留少数离散余弦变换的低频分量,而舍去大部分高频分量,利用反变换仍可获得与原始图像相近的恢复图像。
新图像与原图像虽然存在一定误差但重要信息被保存下来。如图4b、4c为分别提取24×24,48×48数量的DCT系数重构的人脸图像。可以看出,只需要提取部分合适的系数,就可很好地重构出原图。在人脸识别中,通过提取适当的DCT系数,大大降低了计算的复杂度。
在本发明中,经过DCT变换后,DCT系数输入卷积神经网络提取特征。卷积神经网络模型是监督学习的网络模型。卷积神经网络的基本操作有卷积、池化、全连接等。
卷积的作用是提取输入数据的特征信息。卷积的计算公式可以用下式表示:
其中,f(·)为激活函数,其作用是为了增加神经网络模型的非线性以及学习更强的特征表示。采用Rectified Linear Unit(ReLU)激活函数。
池化的作用是缩小特征图的大小。池化操作不仅可以使卷积层提取的特征维度变小,减少运算数据量,还可一定程度上降低网络的过拟合程度,改善网络性能。常见的池化方式有:平均池化(取局部平均值),最小池化(取局部最小值),最大池化(取局部最大值)。如图5所示是最大池化操作,池化规模为2×2,步长为2。
采用的卷积神经网络结构如图6所示,包括四层卷积层,第一层和第二层卷积层卷积核大小为5×5,后两层使用3×3的卷积核。在每一个卷积层后均使用了ReLU激活函数,其作用是增加网络的非线性表达能力。池化层均采用最大池化,池化规模为2×2,步长为2。接着是是两层全连接层。最后一层是softmax函数,用来分类。
本发明还可以将小波变换扩展到lifting scheme,lifting scheme可以更快地实现小波变换,操作数可减少两倍。
需要说明的是,不同的小波分解层数和提取不同数量的DCT系数会对识别率产生影响。对于小波分解层数,若分解的层次太少会使提取的分类信息不足,而分解层次太多又会造成计算量的增加,且分解的区域过小会增强小波变换的边界效应,从而影响分类的正确性。对于DCT系数的提取,不是越多越好,太多的DCT系数并不表示可以很好地识别。由前面分析可知,经DCT变换后,主要信息集中在左上角低频部分,所以提取不同数量的DCT系数也会影响识别结果。下表1为不同小波分解级数和DCT系数对识别率的影响。
表1
由表1可知,当对图像进行一级小波分解保留低频子带图像,再对低频部分DCT变换,提取系数为40×40时,识别率达到最高。表2对本发明与原始卷积神经网络的识别率与训练时间进行了比较。
表2
从以上可知,当小波分解级数为1,DCT系数为40×40时(原图像大小为128×128),人脸识别率最高。当小波分解级数为1,DCT系数为48×48以及小波分解级数为2,DCT系数为24×24时,人脸识别效果也很好。当图像较大时,可以适当将小波分解级数变大;当图像较小时,可以适当提取较少的DCT系数。
本发明通过首先对人脸图像进行小波变换,小波变换后图像大部分能量信息集中在低频部分,高频部分含少量纹理和边缘信息。当直接对低频分量提取特征时,图像中的有用信息相对集中,因此能有效地降低图像的维数。再对小波变换后的低频子图像进行DCT变换提取部分DCT系数,可以减少冗余信息量,降低运算复杂度。最后将DCT系数输入卷积神经网络进行训练分类,从而提高了人脸识别的准确率同时缩短了训练时间。
以上所述仅是本发明的优选实施方式,应当指出的是,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于小波变换和DCT的卷积神经网络人脸识别算法,其特征在于,包括如下步骤:
采用二维离散小波变换将目标图像分解成不同子带并保留低频子带;
通过DCT变换获得低频子带图像部分DCT系数;
将DCT系数输入卷积神经网络中提取特征,进行训练分类,最后获得用于识别面部图像的的卷积神经网络模型。
2.根据权利要求1所述基于小波变换和DCT的卷积神经网络人脸识别算法,其特征在于,所述卷积神经网络包括卷积层,池化层,全连接层,所述卷积层为4个,所述池化层为4个,所述全连接层为两个,所述全连接层连接分类器。
3.根据权利要求2所述基于小波变换和DCT的卷积神经网络人脸识别算法,其特征在于,所述分类器为softmax分类器。
4.根据权利要求2所述基于小波变换和DCT的卷积神经网络人脸识别算法,其特征在于,第一层和第二层的卷积层卷积核大小为5×5,后两层使用3×3的卷积核,在每一个卷积层后均使用了ReLU激活函数,池化层均采用最大池化,池化规模为2×2,步长为2。
CN201910790630.6A 2019-08-26 2019-08-26 一种基于小波变换和dct的卷积神经网络人脸识别算法 Pending CN110598584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910790630.6A CN110598584A (zh) 2019-08-26 2019-08-26 一种基于小波变换和dct的卷积神经网络人脸识别算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910790630.6A CN110598584A (zh) 2019-08-26 2019-08-26 一种基于小波变换和dct的卷积神经网络人脸识别算法

Publications (1)

Publication Number Publication Date
CN110598584A true CN110598584A (zh) 2019-12-20

Family

ID=68855848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910790630.6A Pending CN110598584A (zh) 2019-08-26 2019-08-26 一种基于小波变换和dct的卷积神经网络人脸识别算法

Country Status (1)

Country Link
CN (1) CN110598584A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382795A (zh) * 2020-03-09 2020-07-07 交叉信息核心技术研究院(西安)有限公司 基于频域小波基处理的神经网络的图像分类处理方法
CN111582354A (zh) * 2020-04-30 2020-08-25 中国平安财产保险股份有限公司 图片识别方法、装置、设备及存储介质
CN111783803A (zh) * 2020-08-14 2020-10-16 支付宝(杭州)信息技术有限公司 实现隐私保护的图像处理方法及装置
CN112364809A (zh) * 2020-11-24 2021-02-12 辽宁科技大学 一种高准确率的人脸识别改进算法
CN112434590A (zh) * 2020-11-18 2021-03-02 中国人民解放军国防科技大学 一种基于小波变换的sar影像风条纹识别方法
CN113643261A (zh) * 2021-08-13 2021-11-12 江南大学 一种基于频率注意网络的胸肺部疾病诊断方法
CN113691818A (zh) * 2021-08-25 2021-11-23 深圳龙岗智能视听研究院 视频目标检测方法、系统、存储介质、计算机视觉终端
WO2021238956A1 (zh) * 2020-05-27 2021-12-02 支付宝(杭州)信息技术有限公司 基于隐私保护的身份核验方法、装置及设备
CN113792573A (zh) * 2021-07-13 2021-12-14 浙江理工大学 一种小波变换低频信息与Xception网络的静态手势识别方法
CN113810724A (zh) * 2021-09-29 2021-12-17 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104661023A (zh) * 2015-02-04 2015-05-27 天津大学 基于预失真和训练滤波器的图像或视频编码方法
CN107748895A (zh) * 2017-10-29 2018-03-02 北京工业大学 基于dct‑cnn模型的无人机着陆地貌图像分类方法
CN108234982A (zh) * 2018-02-02 2018-06-29 天津大学 一种自动识别图像多原色分量的视频传输方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104661023A (zh) * 2015-02-04 2015-05-27 天津大学 基于预失真和训练滤波器的图像或视频编码方法
CN107748895A (zh) * 2017-10-29 2018-03-02 北京工业大学 基于dct‑cnn模型的无人机着陆地貌图像分类方法
CN108234982A (zh) * 2018-02-02 2018-06-29 天津大学 一种自动识别图像多原色分量的视频传输方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘芳: "基于离散余弦变换和深度网络的地貌图像分类", 《光学学报》 *
梁淑芬: "基于局部小波变换与DCT的人脸识别算法", 《微计算机信息》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382795B (zh) * 2020-03-09 2023-05-05 交叉信息核心技术研究院(西安)有限公司 基于频域小波基处理的神经网络的图像分类处理方法
CN111382795A (zh) * 2020-03-09 2020-07-07 交叉信息核心技术研究院(西安)有限公司 基于频域小波基处理的神经网络的图像分类处理方法
CN111582354A (zh) * 2020-04-30 2020-08-25 中国平安财产保险股份有限公司 图片识别方法、装置、设备及存储介质
WO2021238956A1 (zh) * 2020-05-27 2021-12-02 支付宝(杭州)信息技术有限公司 基于隐私保护的身份核验方法、装置及设备
CN111783803A (zh) * 2020-08-14 2020-10-16 支付宝(杭州)信息技术有限公司 实现隐私保护的图像处理方法及装置
CN111783803B (zh) * 2020-08-14 2022-06-28 支付宝(杭州)信息技术有限公司 实现隐私保护的图像处理方法及装置
CN112434590A (zh) * 2020-11-18 2021-03-02 中国人民解放军国防科技大学 一种基于小波变换的sar影像风条纹识别方法
CN112434590B (zh) * 2020-11-18 2023-11-24 中国人民解放军国防科技大学 一种基于小波变换的sar影像风条纹识别方法
CN112364809A (zh) * 2020-11-24 2021-02-12 辽宁科技大学 一种高准确率的人脸识别改进算法
CN113792573A (zh) * 2021-07-13 2021-12-14 浙江理工大学 一种小波变换低频信息与Xception网络的静态手势识别方法
CN113643261A (zh) * 2021-08-13 2021-11-12 江南大学 一种基于频率注意网络的胸肺部疾病诊断方法
CN113691818A (zh) * 2021-08-25 2021-11-23 深圳龙岗智能视听研究院 视频目标检测方法、系统、存储介质、计算机视觉终端
CN113810724A (zh) * 2021-09-29 2021-12-17 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法
CN113810724B (zh) * 2021-09-29 2023-12-08 广东博华超高清创新中心有限公司 一种基于avs帧内压缩编码的视频目标分割方法

Similar Documents

Publication Publication Date Title
CN110598584A (zh) 一种基于小波变换和dct的卷积神经网络人脸识别算法
Yan et al. Nonlocal hierarchical dictionary learning using wavelets for image denoising
Bashar et al. Exploring duplicated regions in natural images
Hsieh et al. An effective algorithm for fingerprint image enhancement based on wavelet transform
Singh et al. Dual-tree wavelet scattering network with parametric log transformation for object classification
CN105279740A (zh) 一种基于稀疏正则化的图像去噪方法
Singh et al. ResDNN: deep residual learning for natural image denoising
CN108664911A (zh) 一种基于图像稀疏表示的鲁棒人脸识别方法
CN110717423B (zh) 一种老人面部表情的情感识别模型的训练方法及装置
CN113554112B (zh) 一种遥感图像融合方法、系统、设备及介质
Liang et al. A novel framework based on wavelet transform and principal component for face recognition under varying illumination
Dhar et al. Accurate segmentation of complex document image using digital shearlet transform with neutrosophic set as uncertainty handling tool
CN106803105B (zh) 一种基于稀疏表示字典学习的图像分类方法
Atta et al. An efficient face recognition system based on embedded DCT pyramid
Alsayyh et al. A Novel Fused Image Compression Technique Using DFT, DWT, and DCT.
Chen et al. Texture image retrieval based on contourlet-2.3 and generalized Gaussian density model
CN109543724B (zh) 一种多层鉴别卷积稀疏编码学习方法
CN116630964A (zh) 一种基于离散小波注意力网络的食品图像分割方法
Hamidi et al. Local selected features of dual‐tree complex wavelet transform for single sample face recognition
Jiang et al. Bregman iteration algorithm for sparse nonnegative matrix factorizations via alternating l 1-norm minimization
Luo Iris feature extraction and recognition based on wavelet-based contourlet transform
Chen et al. Removing structural noise in handwriting images using deep learning
Talebi et al. Asymptotic performance of global denoising
Wu et al. Conditional transferring features: Scaling GANs to thousands of classes with 30% less high-quality data for training
Dang et al. A patch-based non-local means method for image denoising

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191220

WD01 Invention patent application deemed withdrawn after publication