CN107169446A - 一种基于注意定势度量学习的视频面部识别方法 - Google Patents
一种基于注意定势度量学习的视频面部识别方法 Download PDFInfo
- Publication number
- CN107169446A CN107169446A CN201710334543.0A CN201710334543A CN107169446A CN 107169446 A CN107169446 A CN 107169446A CN 201710334543 A CN201710334543 A CN 201710334543A CN 107169446 A CN107169446 A CN 107169446A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- weight
- asml
- mfrac
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Geometry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明中提出的一种基于注意定势度量学习的视频面部识别方法,其主要内容包括:注意定势的度量学习(ASML)、记忆注意权重、将ASML自然融入到卷积神经网络(CNN)中,其过程为,先定义图像集上的有效距离度量,显著地最小化集合内距离,并同时最大化集中距离,再把权重作为神经图灵机,其中人脸特征集作为记忆,权重作为地址读写内存,最后将ASML自然融入到卷积神经网络中,从而形成端到端的学习方案。本发明缩小了相同集合的概率分布之间的差距,同时扩大了不同集合之间的差距;减少了视频或图像集中的样本偏差和噪声,有效地利用视频或图像集中的信息,从而提高了识别的性能。
Description
技术领域
本发明涉及面部识别领域,尤其是涉及了一种基于注意定势度量学习的视频面部识别方法。
背景技术
由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术可以从监控视频图像中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。因此,视频人脸识别广泛应用在协助公安刑侦破案、门禁系统、摄像监视系统、身份辨识和支付系统等。然而,由于照明变化、分辨率低、姿态变化和运动产生的模糊等,给视频脸部识别技术的研究带来了一定的难度。
本发明提出了一种基于注意定势度量学习的视频面部识别方法,先定义图像集上的有效距离度量,显著地最小化集合内距离,并同时最大化集中距离,再把权重作为神经图灵机,其中人脸特征集作为记忆,权重作为地址读写内存,最后将注意定势的度量学习(ASML)自然融入到卷积神经网络中,从而形成端到端的学习方案。本发明缩小了相同集合的概率分布之间的差距,同时扩大了不同集合之间的差距;减少了视频或图像集中的样本偏差和噪声,有效地利用视频或图像集中的信息,从而提高了识别的性能。
发明内容
针对由于照明变化、分辨率低、姿态变化和运动产生的模糊等问题,本发明的目的在于提供一种基于注意定势度量学习的视频面部识别方法,先定义图像集上的有效距离度量,显著地最小化集合内距离,并同时最大化集中距离,再把权重作为神经图灵机,其中人脸特征集作为记忆,权重作为地址读写内存,最后将ASML自然融入到卷积神经网络中,从而形成端到端的学习方案。
为解决上述问题,本发明提供一种基于注意定势度量学习的视频面部识别方法,其主要内容包括:
(一)注意定势的度量学习(ASML);
(二)记忆注意权重;
(三)将ASML自然融入到卷积神经网络(CNN)中。
其中,所述的注意定势的度量学习(ASML),它纠正了样本偏差,并测量面部图像组之间的相关性,缩小了相同集合的概率分布之间的差距,同时扩大了不同集合之间的差距;与ASML组合的端对端可训练的深卷积神经网络(CNN),可以学习更多的歧视性深层次表示,获得可靠的人脸识别;ASML是最大平均偏差与记忆注意权重的广义扩展。
进一步地,所述的最大平均偏差(MMD),设是一类函数f:同上定义p,q,X,Y;MMD及其经验估计为:
当是紧凑度量空间上定义的一个单位球,方程成立,当且仅当p=q;直观地说,MMD越小,X和Y之间的分布越相关;因此,MMD越大,分布之间的差异越大,特征完全不同的。
进一步地,所述的基于集合的度量学习(MSML),根据最大平均偏差,基于集合的度量学习(MSML)表示为:
MSML(X,Y,Z)=‖Ex~p[f(x)]-Ey~q[f(y)]‖2+[α-‖Ex~p[f(x)]-Ez~q[f(z)]‖2]+ (3)
其中,[·]+表示最大值,(·,0)和α是一个恒定的余量;X,Y,Z表示图像集;其中,X和Y来自同一类,但又不同于Z;减小MSML的数量,可以增加相同与不同组之间的相关性和差异分别。
进一步地,所述的不考虑样本偏差和异常值的集合,最大平均偏差不考虑样本偏差和异常值的集合:
其中,是一个分布,其对应于p;ω(x)可以纠正样本偏差和消除异常值(或减少噪音)。
进一步地,所述的整流平均差异(RMD),ω(x)作为样本偏差为MMD修正项,整流平均差异(RMD)如下:
RMD(X,Y)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2
结合公式(3)和公式(5),我们联结基于整流项的度量学习的平均集,并获得高级的度量学习方法,命名为注意定势度量学习的视频人脸识别:
ASML(X,Y,Z)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2+[α-‖Eω(x)[f(x)]-Eω(x)[f(z)]‖2]+
s.t.∑ω(x)=1,∑ω(y)=1,∑ω(z)=1 (6)
如上式所示。
其中,所述的记忆注意权重,权重应满足以下三点:
(1)加权方法容易集成在CNN的框架,其参数是端到端可训练的监督方式;
(2)权重基于全球内容和设置感知,因为构建了一个训练实例作为特殊的图像,能更好地利用信息;
(3)学习权重图像顺序必须不变,每个图像的权重和图像在训练实例中是无序。
进一步地,所述的权重,把权重作为神经图灵机(NTM),其中人脸特征集作为记忆,权重视为地址读写内存;NTM涉及三个基本组件:读取向量,擦除向量和添加向量;令{fi}成为一个面部特征集,在si上应用softmax操作以形成归一化权重ωi;公式(6)中操作和重新配置的Eω[f(x)]如下:
权重{ωi}是无序的,{si}是可微的。
进一步地,所述的将ASML自然融入到卷积神经网络(CNN)中,CNN包含29层残块卷积和最大特征映射操作;基于网络,ASML和记忆注意权重耦合,实现视频人脸识别;Softmax是重要的监督信号方法,得到以下目标函数:
L=λ1Softmax+λ2ASML (9)
其中,λ1和λ2是这两个项之间的权重;Softmax功能用于标准的人脸识别任务,ASML惩罚项增加了相关性、类似的分布和不同脸部集合之间的差异。
进一步地,所述的卷积神经网络(CNN),网络中的所有参数是可微的,梯度可以计算:
其中,θ代表网络参数。
附图说明
图1是本发明一种基于注意定势度量学习的视频面部识别方法的系统流程图。
图2是本发明一种基于注意定势度量学习的视频面部识别方法的基本框架图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
图1是本发明一种基于注意定势度量学习的视频面部识别方法的系统流程图。主要包括注意定势的度量学习(ASML),记忆注意权重,将ASML自然融入到卷积神经网络(CNN)中。
注意定势的度量学习(ASML),它纠正了样本偏差,并测量面部图像组之间的相关性,缩小了相同集合的概率分布之间的差距,同时扩大了不同集合之间的差距;与ASML组合的端对端可训练的深卷积神经网络(CNN),可以学习更多的歧视性深层次表示,获得可靠的人脸识别;ASML是最大平均偏差与记忆注意权重的广义扩展。
最大平均偏差(MMD),设是一类函数f:同上定义p,q,X,Y;MMD及其经验估计为:
当是紧凑度量空间上定义的一个单位球,方程成立,当且仅当p=q;直观地说,MMD越小,X和Y之间的分布越相关;因此,MMD越大,分布之间的差异越大,特征完全不同的。
基于集合的度量学习(MSML),根据最大平均偏差,基于集合的度量学习(MSML)表示为:
MSML(X,Y,Z)=‖Ex~p[f(x)]-Ey~q[f(y)]‖2+[α-‖Ex~p[f(x)]-Ez~q[f(z)]‖2]+ (3)
其中,[·]+表示最大值,(·,0)和α是一个恒定的余量;X,Y,Z表示图像集;其中,X和Y来自同一类,但又不同于Z;减小MSML的数量,可以增加相同与不同组之间的相关性和差异分别。
不考虑样本偏差和异常值的集合,最大平均偏差不考虑样本偏差和异常值的集合:
其中,是一个分布,其对应于p;ω(x)可以纠正样本偏差和消除异常值(或减少噪音)。
整流平均差异(RMD),ω(x)作为样本偏差为MMD修正项,整流平均差异(RMD)如下:
RMD(X,Y)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2
结合公式(3)和公式(5),我们联结基于整流项的度量学习的平均集,并获得高级的度量学习方法,命名为注意定势度量学习的视频人脸识别:
ASML(X,Y,Z)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2+[α-‖Eω(x)[f(x)]-Eω(x)[f(z)]‖2]+
s.t.∑ω(x)=1,∑ω(y)=1,∑ω(z)=1 (6)
如上式所示。
记忆注意权重,权重应满足以下三点:
(1)加权方法容易集成在CNN的框架,其参数是端到端可训练的监督方式;
(2)权重基于全球内容和设置感知,因为构建了一个训练实例作为特殊的图像,能更好地利用信息;
(3)学习权重图像顺序必须不变,每个图像的权重和图像在训练实例中是无序。
把权重作为神经图灵机(NTM),其中人脸特征集作为记忆,权重视为地址读写内存;NTM涉及三个基本组件:读取向量,擦除向量和添加向量;令{fi}成为一个面部特征集,在si上应用softmax操作以形成归一化权重ωi;公式(6)中操作和重新配置的Eω[f(x)]如下:
权重{ωi}是无序的,{si}是可微的。
将ASML自然融入到卷积神经网络(CNN)中,CNN包含29层残块卷积和最大特征映射操作;基于网络,ASML和记忆注意权重耦合,实现视频人脸识别;Softmax是重要的监督信号方法,得到以下目标函数:
L=λ1Softmax+λ2ASML (9)
其中,λ1和λ2是这两个项之间的权重;Softmax功能用于标准的人脸识别任务,ASML惩罚项增加了相关性、类似的分布和不同脸部集合之间的差异。
网络中的所有参数是可微的,梯度可以计算:
其中,θ代表网络参数。
图2是本发明一种基于注意定势度量学习的视频面部识别方法的基本框架图。该框架的每个训练实例由三个不同脸部视频的子集组成。与ASML组合的端对端可训练的深卷积神经网络(CNN),可以学习更多的歧视性深层次表示,获得可靠的人脸识别。过程为:先定义图像集上的有效距离度量,显著地最小化集合内距离,并同时最大化集中距离,再把权重作为神经图灵机,其中人脸特征集作为记忆,权重作为地址读写内存,最后将ASML自然融入到卷积神经网络中,从而形成端到端的学习方案。
对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
Claims (10)
1.一种基于注意定势度量学习的视频面部识别方法,其特征在于,主要包括注意定势的度量学习(ASML)(一);记忆注意权重(二);将ASML自然融入到卷积神经网络(CNN)中(三)。
2.基于权利要求书1所述的注意定势的度量学习(ASML)(一),其特征在于,它纠正了样本偏差,并测量面部图像组之间的相关性,缩小了相同集合的概率分布之间的差距,同时扩大了不同集合之间的差距;与ASML组合的端对端可训练的深卷积神经网络(CNN),可以学习更多的歧视性深层次表示,获得可靠的人脸识别;ASML是最大平均偏差与记忆注意权重的广义扩展。
3.基于权利要求书1所述的最大平均偏差(MMD),其特征在于,设是一类函数f:x→R,同上定义p,q,X,Y;MMD及其经验估计为:
当是紧凑度量空间x上定义的一个单位球,方程成立,当且仅当p=q;直观地说,MMD越小,X和Y之间的分布越相关;因此,MMD越大,分布之间的差异越大,特征完全不同的。
4.基于权利要求书3所述的基于集合的度量学习(MSML),其特征在于,根据最大平均偏差,基于集合的度量学习(MSML)表示为:
MSML(X,Y,Z)=‖Ex~p[f(x)]-Ey~q[f(y)]‖2+[α-‖Ex~p[f(x)]-Ez~q[f(z)]‖2]+ (3)
其中,[·]+表示最大值,(·,0)和α是一个恒定的余量;X,Y,Z表示图像集;其中,X和Y来自同一类,但又不同于Z;减小MSML的数量,可以增加相同与不同组之间的相关性和差异分别。
5.基于权利要求书3所述的不考虑样本偏差和异常值的集合,其特征在于,最大平均偏差不考虑样本偏差和异常值的集合:
<mrow>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>p</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mo>(</mo>
<mover>
<mi>p</mi>
<mo>^</mo>
</mover>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
<mo>:</mo>
</mrow>
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
<mi>i</mi>
<mi>m</mi>
<mi>i</mi>
<mi>z</mi>
<mi>e</mi>
</mrow>
<mrow>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&GreaterEqual;</mo>
<mn>0</mn>
</mrow>
</munder>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>E</mi>
<mi>p</mi>
</msub>
<mo>&lsqb;</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>-</mo>
<msub>
<mi>E</mi>
<mover>
<mi>p</mi>
<mo>^</mo>
</mover>
</msub>
<mo>&lsqb;</mo>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>2</mn>
</msub>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>E</mi>
<mover>
<mi>p</mi>
<mo>^</mo>
</mover>
</msub>
<mo>&lsqb;</mo>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>=</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,是一个分布,其对应于p;ω(x)可以纠正样本偏差和消除异常值(或减少噪音)。
6.基于权利要求书5所述的整流平均差异(RMD),其特征在于,ω(x)作为样本偏差为MMD修正项,整流平均差异(RMD)如下:
RMD(X,Y)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<mo>|</mo>
<mo>|</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>2</mn>
</msub>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>s</mi>
<mo>.</mo>
<mi>t</mi>
<mo>.</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
<mo>,</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>m</mi>
</munderover>
<mi>&omega;</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>1</mn>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
结合公式(3)和公式(5),我们联结基于整流项的度量学习的平均集,并获得高级的度量学习方法,命名为注意定势度量学习的视频人脸识别:
ASML(X,Y,Z)=‖Eω(x)[f(x)]-Eω(x)[f(y)]‖2+[α-‖Eω(x)[f(x)]-Eω(x)[f(z)]‖2]+
s.t.∑ω(x)=1,∑ω(y)=1,∑ω(z)=1 (6)
如上式所示。
7.基于权利要求书1所述的记忆注意权重(二),其特征在于,权重应满足以下三点:
(1)加权方法容易集成在CNN的框架,其参数是端到端可训练的监督方式;
(2)权重基于全球内容和设置感知,因为构建了一个训练实例作为特殊的图像,能更好地利用信息;
(3)学习权重图像顺序必须不变,每个图像的权重和图像在训练实例中是无序。
8.基于权利要求书7所述的权重,其特征在于,把权重作为神经图灵机(NTM),其中人脸特征集作为记忆,权重视为地址读写内存;NTM涉及三个基本组件:读取向量,擦除向量和添加向量;令{fi}成为一个面部特征集,在si上应用softmax操作以形成归一化权重ωi;公式(6)中操作和重新配置的Eω[f(x)]如下:
<mrow>
<msub>
<mi>&omega;</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>&Sigma;</mi>
<mi>j</mi>
</msub>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>E</mi>
<mi>&omega;</mi>
</msub>
<mo>&lsqb;</mo>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>=</mo>
<munder>
<mo>&Sigma;</mo>
<mi>i</mi>
</munder>
<mo>&lsqb;</mo>
<mfrac>
<mrow>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>&Sigma;</mi>
<mi>j</mi>
</msub>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>s</mi>
<mi>j</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>&CenterDot;</mo>
<msub>
<mi>f</mi>
<mi>i</mi>
</msub>
<mo>&rsqb;</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
权重{ωi}是无序的,{si}是可微的。
9.基于权利要求书1所述的将ASML自然融入到卷积神经网络(CNN)中(三),其特征在于,CNN包含29层残块卷积和最大特征映射操作;基于网络,ASML和记忆注意权重耦合,实现视频人脸识别;Softmax是重要的监督信号方法,得到以下目标函数:
L=λ1Softmax+λ2ASML (9)
其中,λ1和λ2是这两个项之间的权重;Softmax功能用于标准的人脸识别任务,ASML惩罚项增加了相关性、类似的分布和不同脸部集合之间的差异。
10.基于权利要求书9所述的卷积神经网络(CNN),其特征在于,网络中的所有参数是可微的,梯度可以计算:
<mrow>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>&theta;</mi>
</mrow>
</mfrac>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>1</mn>
</msub>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>S</mi>
<mi>o</mi>
<mi>f</mi>
<mi>t</mi>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>&theta;</mi>
</mrow>
</mfrac>
<mo>+</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>A</mi>
<mi>S</mi>
<mi>M</mi>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>&theta;</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>s</mi>
</mrow>
</mfrac>
<mo>=</mo>
<msub>
<mi>&lambda;</mi>
<mn>2</mn>
</msub>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>A</mi>
<mi>S</mi>
<mi>M</mi>
<mi>L</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>&omega;</mi>
</mrow>
</mfrac>
<mo>.</mo>
<mfrac>
<mrow>
<mo>&part;</mo>
<mi>&omega;</mi>
</mrow>
<mrow>
<mo>&part;</mo>
<mi>s</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>11</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,θ代表网络参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710334543.0A CN107169446A (zh) | 2017-05-12 | 2017-05-12 | 一种基于注意定势度量学习的视频面部识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710334543.0A CN107169446A (zh) | 2017-05-12 | 2017-05-12 | 一种基于注意定势度量学习的视频面部识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107169446A true CN107169446A (zh) | 2017-09-15 |
Family
ID=59814910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710334543.0A Withdrawn CN107169446A (zh) | 2017-05-12 | 2017-05-12 | 一种基于注意定势度量学习的视频面部识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169446A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783699A (zh) * | 2020-07-06 | 2020-10-16 | 周书田 | 一种基于高效分解卷积与时间金字塔网络的视频人脸识别方法 |
CN111950429A (zh) * | 2020-08-07 | 2020-11-17 | 南京审计大学 | 一种基于加权协同表示的人脸识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123560A (zh) * | 2014-07-03 | 2014-10-29 | 中山大学 | 基于相位编码特征和多度量学习的模糊人脸图像验证方法 |
-
2017
- 2017-05-12 CN CN201710334543.0A patent/CN107169446A/zh not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123560A (zh) * | 2014-07-03 | 2014-10-29 | 中山大学 | 基于相位编码特征和多度量学习的模糊人脸图像验证方法 |
Non-Patent Citations (1)
Title |
---|
YIBO HU等: "Attention-Set based Metric Learning for Video Face Recognition", 《网页在线公开:HTTPS://ARXIV.ORG/ABS/1704.03805》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783699A (zh) * | 2020-07-06 | 2020-10-16 | 周书田 | 一种基于高效分解卷积与时间金字塔网络的视频人脸识别方法 |
CN111950429A (zh) * | 2020-08-07 | 2020-11-17 | 南京审计大学 | 一种基于加权协同表示的人脸识别方法 |
CN111950429B (zh) * | 2020-08-07 | 2023-11-14 | 南京审计大学 | 一种基于加权协同表示的人脸识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhattacharya et al. | Smart attendance monitoring system (SAMS): a face recognition based attendance system for classroom environment | |
CN102932605B (zh) | 一种视觉感知网络中摄像机的组合选择方法 | |
CN107103281A (zh) | 基于聚集损失深度度量学习的人脸识别方法 | |
CN107862705A (zh) | 一种基于运动特征和深度学习特征的无人机小目标检测方法 | |
CN106874347A (zh) | 一种匹配人体特征与mac地址的方法及系统 | |
CN107871100A (zh) | 人脸模型的训练方法和装置、人脸认证方法和装置 | |
CN103345735B (zh) | 一种基于Kalman滤波器的压缩时空多传感器融合跟踪方法 | |
CN107705324A (zh) | 一种基于机器学习的视频目标检测方法 | |
CN103278170A (zh) | 基于显著场景点检测的移动机器人级联地图创建方法 | |
CN101271515A (zh) | 能识别多角度目标的图像检测装置 | |
CN103994765B (zh) | 一种惯性传感器的定位方法 | |
CN104484881B (zh) | 基于图像采集的Visual Map数据库建立方法及利用该数据库的室内定位方法 | |
Zeng et al. | Design of intelligent classroom attendance system based on face recognition | |
CN101286237A (zh) | 基于视觉仿生的运动目标检测方法 | |
CN101996308A (zh) | 人脸认证方法及系统、人脸模型训练方法及系统 | |
CN107230267A (zh) | 基于人脸识别算法的幼儿园智能签到方法 | |
CN110458005A (zh) | 一种基于多任务渐进配准网络的旋转不变人脸检测方法 | |
CN107169446A (zh) | 一种基于注意定势度量学习的视频面部识别方法 | |
WO2015165227A1 (zh) | 人脸识别方法 | |
CN109831648A (zh) | 防盗远程监控方法、装置、设备及存储介质 | |
CN108898612A (zh) | 基于多智能体深度增强学习的多目标跟踪方法 | |
CN110968711A (zh) | 一种基于序列图像特征的自主无人系统位置识别定位方法 | |
CN106874867A (zh) | 一种融合肤色及轮廓筛选的人脸自适应检测与跟踪方法 | |
CN110401977A (zh) | 一种基于Softmax回归多分类识别器的多楼层室内定位方法 | |
Herath et al. | Neural inertial localization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20170915 |
|
WW01 | Invention patent application withdrawn after publication |