CN110287818B - 基于分层矢量化的人脸特征向量优化方法 - Google Patents
基于分层矢量化的人脸特征向量优化方法 Download PDFInfo
- Publication number
- CN110287818B CN110287818B CN201910485872.4A CN201910485872A CN110287818B CN 110287818 B CN110287818 B CN 110287818B CN 201910485872 A CN201910485872 A CN 201910485872A CN 110287818 B CN110287818 B CN 110287818B
- Authority
- CN
- China
- Prior art keywords
- vector
- face
- feature
- dictionary
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 64
- 238000005457 optimization Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 title claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000013507 mapping Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 14
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Image Processing (AREA)
Abstract
本发明公开一种基于分层矢量化的人脸特征向量优化方法,为了将两张照片映射到同一特征空间中进行比较,以基于分层矢量化的人脸特征向量优化结合深度神经网络,甚至双层深度神经网络,实现不同图像空间到相同特征的空间映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性。
Description
技术领域
本发明涉及分层矢量化领域,尤其涉及基于分层矢量化的人脸特征向量优化方法。
背景技术
随着互联网和电信技术的发展,移动互联网已成为当今信息化社会下的关键趋势,在移动互联网中,运营商将提供基于个人身份的服务、基于个人位置的服务,并且用户可以随时随地的创造内容,由过去的内容被动接受者变为内容的主动创造者,因此用户能接收到无处不在的信息服务,而信息是消费者消费行为中最重要的因素。移动互联网所具备的信息整合与人际传播功能,为消费者行为提供了重要的信息服务,使得消费行为具有了主动性、选择性和创造性,改变了传统的消费行为。
而自2010年9月1日“手机实名制”政策的尘埃落定以来,运营商需贯彻政策的实施(拟3年内补、录齐原有存量客户个人身份信息),且目前电信营业厅办理入网手续,固话和移动电话新增用户需要登记真实的身份信息。而在身份信息核实过程中经常运用到的关于人脸识别技术,人脸识别中核心技术为人脸特征比对技术,针对深度神经网络需要大量数据的问题,需要研究分层矢量化多媒体信息表达体系。深度卷积神经网络(DCNN)是机器学习、模式识别领域的研究热点,目前已经在图像分类、人脸识别等方面取得了十分成功的应用。他主要的特点是利用线性或非线性的函数通过组合底层特征形成更加抽象的高层标识。但是在数据不足时,DCNN会有严重的过拟合,降低使用效果,同时人证对比中,即验证身份证芯片照与现场照的身份是否一致,由于两张照片失配程度较大(非同源、身份证照片分辨率低,两张照片年龄跨度大),会导致特征空间中样本分布的差异性较大,导致对比失败。
发明技术方案
为解决上述技术问题,本发明提供一种基于分层矢量化的人脸特征向量优化方法,为了将两张照片映射到同一特征空间中进行比较,以基于分层矢量化的人脸特征向量优化结合深度神经网络,甚至双层深度神经网络,实现不同图像空间到相同特征的空间映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性
本发明技术方案为一种基于分层矢量化的人脸特征向量优化方法,其特征在于,包含图片库、人脸图像块、人脸图像块特征字典、人脸图像特征集;
第一步,对图片库中采集得人脸图像进行分块;
第二步,对分块后的人类图像每块区域提取局部特征形成局部特征描述子;
第三步,对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典,制定对于多层的特征编码只需要把上一层的人脸图像的特征向量作为输入重新提取特征并进行量化形成字典编码;
第四步,根据形成的字典信息和人脸图像的映射,编码形成人脸图像的特征向量,形成分层矢量化的人脸特征向量。
其中,第一步包含:
a)提取集中人脸图像形成色阶矩阵;
b)计算得到色阶矩阵各条向量的平均值;
c)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
d)求得差值矩阵的较大的若干个奇异值;
e)根据奇异值设定阀值区域分块。
其中,第二步包含:
a)根据每块区域计算得到色阶矩阵各条向量的平均值;
b)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
c)将差值向量投影到所述的特征脸空间,形成局部特征描述子向量
d) 对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典。
其中,所述人工神经网络字典包含输入层、隐藏层、输出层,其中隐藏层包含2层;
输入层:所有形成局部特征描述子进行量化生成目标数据w向量和b向量;
构建第一神经元隐藏层:定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.5;
构建第二神经元隐藏层:根据构建第一神经元隐藏层数据定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.2;
输出层:根据构建第二神经元隐藏层数据经过算法$ =2w^2-2 b,这里直接通过表达式生成字典编码。
其中w向量和b向量为根据将输入人脸的主成分特征和输入人脸的局部二值特征的值获得,w=2x^2/0.5y,b=1.5x^2/y,x、y为人脸的主成分特征和人脸的局部二值特征。
进而在实际实施中将两张照片映射到同一特征空间中进行比较,以基于分层矢量化的人脸特征向量优化结合深度神经网络,甚至双层深度神经网络,实现不同图像空间到相同特征的空间映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性。
本发明的有益效果为:采用一种基于分层矢量化的人脸特征向量优化方法,为了将两张照片映射到同一特征空间中进行比较,以基于分层矢量化的人脸特征向量优化结合深度神经网络,甚至双层深度神经网络,实现不同图像空间到相同特征的空间映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性 。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例分层矢量化的人脸特征向量优化示意图;
图2为本发明实施例构成人工神经网络形成字典示意图。
具体实施方式
本发明实施例提供了一种基于分层矢量化的人脸特征向量优化方法,其特征在于,包含图片库、人脸图像块、人脸图像块特征字典、人脸图像特征集;
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。
如图1-2所示,本发明技术方案实施例提供一种基于分层矢量化的人脸特征向量优化方法,其特征在于,包含图片库、人脸图像块、人脸图像块特征字典、人脸图像特征集;
第一步,对图片库中采集得人脸图像进行分块;
第二步,对分块后的人类图像每块区域提取局部特征形成局部特征描述子;
第三步,对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典,制定对于多层的特征编码只需要把上一层的人脸图像的特征向量作为输入重新提取特征并进行量化形成字典编码;
第四步,根据形成的字典信息和人脸图像的映射,编码形成人脸图像的特征向量,形成分层矢量化的人脸特征向量。
其中,第一步包含:
a)提取集中人脸图像形成色阶矩阵;
b)计算得到色阶矩阵各条向量的平均值;
c)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
d)求得差值矩阵的较大的若干个奇异值;
e)根据奇异值设定阀值区域分块。
其中,第二步包含:
a)根据每块区域计算得到色阶矩阵各条向量的平均值;
b)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
c)将差值向量投影到所述的特征脸空间,形成局部特征描述子向量
d) 对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典。
如图1-2所示,其中,所述人工神经网络字典包含输入层、隐藏层、输出层,其中隐藏层包含2层;
输入层:所有形成局部特征描述子进行量化生成目标数据w向量和b向量;
构建第一神经元隐藏层1:定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.5;
构建第二神经元隐藏层2:根据构建第一神经元隐藏层1数据定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.2;
输出层:根据构建第二神经元隐藏层2数据经过算法$ =2w^2-2 b,这里直接通过表达式生成字典编码。
其中w向量和b向量为根据将输入人脸的主成分特征和输入人脸的局部二值特征的值获得,w=2x^2/0.5y,b=1.5x^2/y,x、y为人脸的主成分特征和人脸的局部二值特征。
进而在实际实施中将两张照片映射到同一特征空间中进行比较,以基于分层矢量化的人脸特征向量优化结合深度神经网络,甚至双层深度神经网络,实现不同图像空间到相同特征的空间映射。在特征空间中,相同身份人脸图像的类内差异变小,而不同身份人脸图像的类间差异变大,从而增强了特征的判别性。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (1)
1.基于分层矢量化的人脸特征向量优化方法,其特征在于,包含图片库、人脸图像块、人脸图像块特征字典、人脸图像特征集;
第一步,对图片库中采集的人脸图像进行分块;
第二步,对分块后的人脸图像每块区域提取局部特征形成局部特征描述子;
第三步,对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典,制定对于多层的特征编码只需要把上一层的人脸图像的特征向量作为输入重新提取特征并进行量化形成字典编码;
第四步,根据形成的字典信息和人脸图像的映射,编码形成人脸图像的特征向量,形成分层矢量化的人脸特征向量,
所述第一步包含:a)提取集中人脸图像形成色阶矩阵;
b)计算得到色阶矩阵各条向量的平均值;
c)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
d)求得差值矩阵的较大的若干个奇异值;
e)根据奇异值设定阀值区域分块,
第二步包含:a)根据每块区域计算得到色阶矩阵各条向量的平均值;
b)计算得到色阶矩阵各条向量与平均值的差值并形成差值矩阵;
c)将差值向量投影到特征空间,形成局部特征描述子向量;
对所有形成局部特征描述子进行量化生成目标数据,由目标数据构成人工神经网络形成字典,
所述人工神经网络字典包含输入层、隐藏层、输出层,其中隐藏层包含2层;
输入层:所有形成局部特征描述子进行量化生成目标数据w向量和b向量,其中w向量和b向量为根据将输入人脸的主成分特征和输入人脸的局部二值特征的值获得,w=2x^2/0.5y,b=1.5x^2/y,x、y为人脸的主成分特征和人脸的局部二值特征;
构建第一神经元隐藏层:定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.5;
构建第二神经元隐藏层:根据构建第一神经元隐藏层数据定义损失函数,整个算法的目的就是寻找一组w向量和b向量使得损失函数最小化,损失函数通常可以定义为实际值和预测值的均方误差绝对值,学习率是一个超参数,这里设为0.2;
输出层:根据构建第二神经元隐藏层数据经过算法$=2w^2-2b,这里直接通过表达式生成字典。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910485872.4A CN110287818B (zh) | 2019-06-05 | 2019-06-05 | 基于分层矢量化的人脸特征向量优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910485872.4A CN110287818B (zh) | 2019-06-05 | 2019-06-05 | 基于分层矢量化的人脸特征向量优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287818A CN110287818A (zh) | 2019-09-27 |
CN110287818B true CN110287818B (zh) | 2024-01-16 |
Family
ID=68003341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910485872.4A Active CN110287818B (zh) | 2019-06-05 | 2019-06-05 | 基于分层矢量化的人脸特征向量优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287818B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291638A (zh) * | 2020-01-19 | 2020-06-16 | 上海云从汇临人工智能科技有限公司 | 一种对象比对方法、系统、设备及介质 |
CN111260697A (zh) * | 2020-01-19 | 2020-06-09 | 上海云从汇临人工智能科技有限公司 | 目标对象的识别方法、系统、设备及介质 |
CN111797793A (zh) * | 2020-07-10 | 2020-10-20 | 重庆三峡学院 | 一种基于人脸识别技术的校园身份智能管理系统 |
CN111797792A (zh) * | 2020-07-10 | 2020-10-20 | 重庆三峡学院 | 一种基于校园管理的新型身份识别装置与方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008081152A2 (fr) * | 2006-12-22 | 2008-07-10 | France Telecom | Procede et systeme de reconnaissance d'un objet dans une image |
CN102708576A (zh) * | 2012-05-18 | 2012-10-03 | 西安电子科技大学 | 基于结构字典的分块图像压缩感知重建方法 |
CN104408478A (zh) * | 2014-11-14 | 2015-03-11 | 西安电子科技大学 | 一种基于分层稀疏判别特征学习的高光谱图像分类方法 |
CN106056074A (zh) * | 2016-05-27 | 2016-10-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于区域稀疏的单张训练样本人脸识别方法 |
CN107908646A (zh) * | 2017-10-10 | 2018-04-13 | 西安电子科技大学 | 一种基于分层卷积神经网络的图像检索方法 |
CN107908999A (zh) * | 2017-06-23 | 2018-04-13 | 广东工业大学 | 一种结构特征层次化的疲劳表情识别方法 |
CN108492252A (zh) * | 2018-03-20 | 2018-09-04 | 南昌工程学院 | 基于二次重建的人脸图像超分辨率重建方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8873812B2 (en) * | 2012-08-06 | 2014-10-28 | Xerox Corporation | Image segmentation using hierarchical unsupervised segmentation and hierarchical classifiers |
-
2019
- 2019-06-05 CN CN201910485872.4A patent/CN110287818B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008081152A2 (fr) * | 2006-12-22 | 2008-07-10 | France Telecom | Procede et systeme de reconnaissance d'un objet dans une image |
CN102708576A (zh) * | 2012-05-18 | 2012-10-03 | 西安电子科技大学 | 基于结构字典的分块图像压缩感知重建方法 |
CN104408478A (zh) * | 2014-11-14 | 2015-03-11 | 西安电子科技大学 | 一种基于分层稀疏判别特征学习的高光谱图像分类方法 |
CN106056074A (zh) * | 2016-05-27 | 2016-10-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于区域稀疏的单张训练样本人脸识别方法 |
CN107908999A (zh) * | 2017-06-23 | 2018-04-13 | 广东工业大学 | 一种结构特征层次化的疲劳表情识别方法 |
CN107908646A (zh) * | 2017-10-10 | 2018-04-13 | 西安电子科技大学 | 一种基于分层卷积神经网络的图像检索方法 |
CN108492252A (zh) * | 2018-03-20 | 2018-09-04 | 南昌工程学院 | 基于二次重建的人脸图像超分辨率重建方法 |
Non-Patent Citations (2)
Title |
---|
Diabetic Retinopathy Classification using Deeply Supervised ResNet;Debiao Zhang 等;《2017 IEEE SmartWorld, Ubiquitous Intelligence & Computing, Advanced & Trusted Computed, Scalable Computing & Communications, Cloud & Big Data Computing, Internet of People and Smart City Innovation 》;20180628;全文 * |
基于双层异构深度神经网络模型的人脸识别关键技术研究;李晋等;《电信工程技术与标准化》;20170615(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110287818A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287818B (zh) | 基于分层矢量化的人脸特征向量优化方法 | |
Liu et al. | Parallel fractal compression method for big video data | |
Chen et al. | Saliency detection via the improved hierarchical principal component analysis method | |
Feng et al. | Biogeography-based optimization with improved migration operator and self-adaptive clear duplicate operator | |
CN113971735A (zh) | 一种深度图像聚类方法、系统、设备、介质及终端 | |
CN114003744A (zh) | 基于卷积神经网络和向量同态加密的图像检索方法及系统 | |
Feng et al. | Evit: Privacy-preserving image retrieval via encrypted vision transformer in cloud computing | |
CN116257648A (zh) | 基于噪声网络和图像预处理的图像检索防御方法及系统 | |
CN114937304A (zh) | 基于同态加密的人脸表情识别方法 | |
Deepthi et al. | RTL implementation of image compression techniques in WSN | |
Sasazaki et al. | Vector quantization of images with variable block size | |
CN108235019A (zh) | 一种压缩图像的存储方法及装置 | |
Leng | Data hiding scheme based on regular octagon-shaped shells | |
CN116467415A (zh) | 基于GCNsformer混合网络和多通道语义的双向跨域会话推荐方法 | |
CN115631330A (zh) | 特征提取方法、模型训练方法、图像识别方法及应用 | |
Li et al. | A new aesthetic QR code algorithm based on salient region detection and SPBVM | |
Li et al. | Semantic analysis of literary vocabulary based on microsystem and computer aided deep research | |
Cheng | [Retracted] Computer Graphic Image Design and Visual Communication Design in the Internet of Things Scenario | |
CN114444443A (zh) | 一种标识识别方法、装置及终端设备 | |
Badawi et al. | Fuzzy encoder framework for four layers color QR code | |
Celebi | Fast color quantization using weighted sort-means clustering | |
CN113886547A (zh) | 基于人工智能的客户实时对话转接方法、装置和电子设备 | |
Wang et al. | Deep scalable supervised quantization by self-organizing map | |
Na et al. | Blockwise collaborative representation‐based classification via L2‐norm of query data for accurate face recognition | |
Tassouli et al. | Maximizing signal to interference noise ratio for massive MIMO: A stochastic neurodynamic approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |