CN113435225A - 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法 - Google Patents

一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法 Download PDF

Info

Publication number
CN113435225A
CN113435225A CN202010205355.XA CN202010205355A CN113435225A CN 113435225 A CN113435225 A CN 113435225A CN 202010205355 A CN202010205355 A CN 202010205355A CN 113435225 A CN113435225 A CN 113435225A
Authority
CN
China
Prior art keywords
gait
feature
sample
space
fusion model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010205355.XA
Other languages
English (en)
Other versions
CN113435225B (zh
Inventor
贲晛烨
翟鑫亮
陈雷
李玉军
魏文辉
宋延新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202010205355.XA priority Critical patent/CN113435225B/zh
Publication of CN113435225A publication Critical patent/CN113435225A/zh
Application granted granted Critical
Publication of CN113435225B publication Critical patent/CN113435225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,包括:获取训练样本集,构建三元组组合,预处理后构建分块水平金字塔时空特征融合模型并训练;获取注册样本集、待识别步态样本,预处理后进行初步步态识别:将注册样本集和待识别身份的步态样本送入训练好的分块水平金字塔时空特征融合模型中得到注册特征库和步态特征,通过欧式距离计算得到初步候选身份的候选集合;根据候选集合,计算互近邻特征集合,输出欧式距离最近的特征所对应的样本的身份为待识别样本的身份,得到最终的识别结果。本发明对时空特征进行融合,能在较低的计算复杂度且不增加学习参数的情况下将时空特征融合到一起,识别率高。

Description

一种基于分块水平金字塔时空特征融合模型和步态重排序的 跨视角步态识别方法
技术领域
本发明涉及一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,属于深度学习和模式识别技术领域。
背景技术
步态识别是一种利用人的行走姿势进行身份识别的生物识别技术。它依据不同个体间的步态不相同这一特点,根据人们走路姿势的不同来区分个体身份。与现有的生物特征识别技术如人脸识别、指纹识别、静脉识别、虹膜识别等技术相比,步态识别具有低分辨率、受环境影响小、易采集等特点。此外,诸如现有的人脸识别、指纹识别、静脉识别以及虹膜识别等技术,都需要待识别人的接触和配合才可以进行精准的身份识别,而步态识别技术可以在个体非接触、非受控和无察觉的情况下识别目标的身份信息。另外,个体行走姿势也不易模仿和伪装,这些都使得步态识别越来越受到研究人员的关注。
影响步态识别准确率的因素主要包括穿衣戴帽、携带物品、行走速度、注册步态与待识别步态视角存在差异等,其中视角变化对步态识别的影响是最具有挑战性的攻克难题。目前主流的步态识别方法大致可分为两大类:一类是基于模型的方法,这类方法的目的是提取鲁棒的步态特征并避免噪声干扰,全身的变化用一个低维矢量来表征,但是建模及其匹配过程都很复杂;另外一类是基于运动的方法,这类方法避开了建立复杂模型的过程,可以在无需拟合模型参数的情况下表征人体的运动模式。但当摄像机拍摄人行走方向发生变化时,同一人的运动外观会发生显著变化,导致基于运动的步态识别方法表现不佳。
通过观察行人步态特点,行人不同的身体部位对行人身份识别的贡献是不同的,比如现实生活中人们往往仅通过行人走路的腿部运动就可以判断出该目标的身份,而上半身以及头部可以作为辅助部分使识别更加准确。所以,将行人身体进行分块处理可以更加有效地进行步态特征学习。另外,重排序技术已经被证实在身份识别如人脸识别、行人重识别等领域有着优越表现,但是在步态识别中却没有被引入。所以,步态识别初步排序完成后,将候选身份进行重排序会提高步态识别的准确率。
发明内容
针对现有技术的不足,本发明提供一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法。
发明概述:
一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,包括步态样本处理、分块水平金字塔时空特征融合模型训练、初步识别以及步态重排序。
为了避免步态序列尺度不同造成的干扰,将步态样本进行轮廓矫正处理后作为输入数据。为了使提取的步态特征更具有判别能力和鲁棒性,采用分块水平金字塔时空特征融合模型作为特征提取模型。为了改善初步识别的结果,采用步态重排序方法进行二次排序。
术语解释:
注册数据集:是指提前录入的已知标签的样本所构成的数据集,用来与待识别样本进行比对,并把该样本识别为与注册数据集中最接近的那个样本的标签。
本发明的技术方案如下:
一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,包括:
(一)获取训练样本集,构建三元组组合,三元组组合包括锚样本、正样本、负样本,锚样本的视角为某一视角,正样本的视角与锚样本视角不同且正样本身份与锚样本身份相同,负样本的视角为任意视角且与锚样本的身份不同;
A、对训练样本的步态轮廓图进行预处理
对步态轮廓图进行轮廓矫正,以避免因行人距离摄像头距离的不同所造成的干扰;
将矫正后的步态轮廓图进行尺寸调整;
B、分块水平金字塔时空特征融合模型构建及训练
构建分块水平金字塔时空特征融合模型;所述分块水平金字塔时空特征融合模型包含分块水平金字塔网络和时空特征融合两个部分,其中第一部分将步态轮廓图样本分成单幅图像进行二维空间图像下的初步特征提取,第二部分将第一部分得到的不同分块以及不同帧的特征进行时空特征融合以得到该步态轮廓图样本的最终特征表达;
训练分块水平金字塔时空特征融合模型以得到判别能力强的特征提取模型;
(二)获取某一视角的注册样本集、另一视角的待识别步态样本,对两个样本的步态轮廓图进行预处理,所述预处理包括轮廓矫正、尺寸调整;
C、初步识别
根据训练好的分块水平金字塔时空特征融合模型,将预处理过的注册样本集送入模型中,得到该视角下的注册特征库;将待识别身份的步态轮廓图样本送入训练好的分块水平金字塔时空特征融合模型中得到步态特征,将步态特征与注册特征库中的每个特征进行欧式距离计算得到初步候选身份的候选集合;
D、步态重排序
根据候选集合,计算互近邻特征集合,输出欧式距离最近的特征所对应的样本的身份为待识别样本的身份,得到最终的识别结果。
本发明分块水平金字塔时空特征融合模型包含分块水平金字塔网络和时空特征融合两个部分,其中第一部分将步态序列样本分成单幅图像进行二维空间图像下的初步特征提取,第二部分将第一部分得到的不同分块以及不同帧的特征进行时空特征融合以得到该步态序列样本最终的特征表达。最后,在识别阶段,本发明将待查询身份的步态样本送入训练好的分块水平金字塔时空特征融合模型,得到步态特征后与注册数据集的特征进行比对,得到候选身份排序结果,再经过步态重排序,输出最终的识别结果。
优选的,步骤A中,步态轮廓图为实际场景中摄像头采集到行人视频后进行分割得到的步态轮廓图,或做实验时采用CASIA-B数据库提供的步态轮廓图。
根据本发明优选的,所述步骤A,步态轮廓图预处理,给定包含N个行人V种视角变化的步态数据集
Figure BDA0002420879970000035
表示数据集中第i个人的第v种视角的步态序列,
Figure BDA0002420879970000036
Figure BDA0002420879970000037
中的第j帧步态轮廓图,其中j=1,2,…,ni,v,ni,v表示该步态序列的长度,包括:
a、读取每个步态序列,将包含行人的部分置于每帧图像的中心,并使头部置顶到图像的上部边缘,脚步置底到图像的下部边缘;
b、将步骤a得到的矫正后的步态序列都调整成相同的图像大小W×H,得到最终处理好的行人轮廓图,作为分块水平金字塔时空特征融合模型的输入。
根据本发明优选的,所述步骤B,分块水平金字塔时空特征融合模型构建及训练,包括:
c、对于每一帧行人轮廓图,先将其水平划分为R个区域,表示为
Figure BDA0002420879970000031
那么分块水平金字塔特征可以表示为:
Figure BDA0002420879970000032
上式中,
Figure BDA0002420879970000033
表示图像
Figure BDA0002420879970000034
的第r个分块区域,r=1,2,…,R;F(·)表示由二维卷积神经网络构成的深度特征提取器,共包括六个卷积层及两个池化层,其具体网络结构参数如表1所示,本发明中深度特征提取器的网络结构是固定的,不会根据输入调整,每个分块独立学习不共享参数;HK(·)表示K阶水平金字塔池化函数,它是将输入特征图沿着水平方向分别划分为20,21,…,2K个带状空间,总计M个带状空间,
Figure BDA0002420879970000041
如附图1所示,然后对于每个带状空间分别进行水平金字塔池化,即计算其平均值和最大值的和,最后经过一层全连接操作后作为这个带状空间的特征表达;
Figure BDA0002420879970000042
表示第r个分块的水平金字塔特征,即为初步特征,其中
Figure BDA0002420879970000043
表示一个l维的特征列向量;
表1深度特征提取器(F)网络参数
名称 核大小 步幅 填充 输出通道数
Conv-1 5×5 1 2 32
Conv-2 3×3 1 1 32
Pool-1 2×2 2 0 32
Conv-3 3×3 1 1 64
Conv-4 3×3 1 1 64
Pool-2 2×2 2 0 64
Conv5 3×3 1 1 128
Conv6 3×3 1 1 128
d、根据步骤c得到的每个分块的初步特征,以不同分块权重拼接的方式进行空间特征融合,得到一帧完整行人轮廓图的特征,具体表达如下:
Figure BDA0002420879970000044
其中p1,p2,…,pR表示可学习的不同分块的权重,
Figure BDA0002420879970000045
是一个l*R维的向量;
e、根据步骤d得到的空间特征融合后的一帧完整行人轮廓图的特征表达,以最大步态能量表示的方式提取整个步态序列的时空特征,具体操作如下:对于一个长度为ni,v的步态序列,经过步骤d每一帧进行空间特征融合后得到的此步态序列的特征集合为
Figure BDA0002420879970000046
则该步态序列的时空特征
Figure BDA0002420879970000047
为:
Figure BDA0002420879970000051
其中EleMax表示对应位置元素取最大值,
Figure BDA0002420879970000052
为最终特征,
Figure BDA0002420879970000053
表示一个l*R维的特征向量;得到分块水平金字塔时空特征融合模型,根据此模型,可提取锚样、正样本、负样本的步态特征;
f、根据步骤c、d、e所构建的分块水平金字塔时空特征融合模型,初始化模型参数,以减小三元组损失Ltriplet作为训练目标,训练分块水平金字塔时空特征融合模型,损失函数如下:
Figure BDA0002420879970000054
上式中,其中d表示欧式距离度量函数,
Figure BDA0002420879970000055
表示第i个人第v种视角的步态序列
Figure BDA0002420879970000056
的特征,
Figure BDA0002420879970000057
表示第i个人第v′种视角的步态序列
Figure BDA00024208799700000518
的特征,
Figure BDA0002420879970000058
表示第j个人第v″种视角的步态序列
Figure BDA0002420879970000059
的特征,α表示余量(Margin)。由公式(4)可以看出,模型优化的目的是让同一行人不同视角的样本特征之间的距离越小越好,而不同行人之间的距离越大越好,以此实现跨视角步态识别。
根据本发明优选的,所述步骤C,初步识别,包括:
g、根据训练好的分块水平金字塔时空特征融合模型,将视角为v的注册数据集的数据经步骤a和步骤b后送入模型中,得到视角为v的注册特征库;
h、将待识别身份的视角为v′的步态样本q经过步骤a和步骤b后送入训练好的分块水平金字塔时空特征融合模型中得到步态特征
Figure BDA00024208799700000510
通过与步骤g得到的视角为v的注册特征库中每个特征进行欧式距离计算,进而得到距离最小的前s个特征集合
Figure BDA00024208799700000511
作为候选集合。
根据本发明优选的,所述步骤D,步态重排序,包括:
i、根据步骤h所得到候选集合,计算特征
Figure BDA00024208799700000512
的互近邻特征集合,计算方法如下:
Figure BDA00024208799700000513
上式中,
Figure BDA00024208799700000514
Figure BDA00024208799700000515
在步骤g得到的注册特征库(除去
Figure BDA00024208799700000516
本身)以及
Figure BDA00024208799700000517
之中计算欧式距离后得到的距离最小的前s个特征;
j、从步骤i得到的互近邻特征集合MutualNear(q,s)中找出与
Figure BDA0002420879970000061
的欧式距离最近的特征,输出该最近的特征所对应样本的身份,完成识别。
本发明的有益效果在于:
1、本发明所涉及的分块水平金字塔模型,将人体分块后经过水平金字塔提取空间特征,可以学习到行人不同身体部分对识别的贡献大小,有助于识别率和鲁棒性的提高。
2、本发明所涉及的时空特征融合方法,能够以可学习地方式为不同分块的特征分配相应地权重,并采取最大步态能量表示方法对时空特征进行融合,能够在较低的计算复杂度且不增加学习参数的情况下将时空特征很好地融合到一起。
3、本发明采用互近邻策略对初步识别结果进行重排序调整,提高了识别过程中目标的匹配精度。
附图说明
图1为本发明中的分块水平金字塔网络流程图;
图2为本发明一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法流程图。
具体实施方式
下面通过实施例并结合附图对本发明做进一步说明,但不限于此。
实施例1:
一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,包括:
(一)获取训练样本集,构建三元组组合,三元组组合包括锚样本、正样本、负样本,锚样本的视角为某一视角,正样本的视角与锚样本视角不同且正样本身份与锚样本身份相同,负样本的视角为任意视角且与锚样本的身份不同;如图1所示:
A、步态轮廓图预处理,对步态轮廓图进行轮廓矫正,以避免因行人距离摄像头距离的不同所造成的干扰;将矫正后的步态轮廓图进行尺寸调整;
给定包含N个行人V种视角变化的步态数据集
Figure BDA0002420879970000062
Figure BDA0002420879970000063
表示数据集中第i个人的第v种视角的步态序列,
Figure BDA0002420879970000064
Figure BDA0002420879970000065
中的第j帧步态轮廓图,其中j=1,2,…,ni,v,ni,v表示该步态序列的长度,包括:
a、读取每个步态序列,将包含行人的部分置于每帧图像的中心,并使头部置顶到图像的上部边缘,脚步置底到图像的下部边缘;
b、将步骤a得到的矫正后的步态序列都调整成相同的图像大小W×H,得到最终处理好的行人轮廓图,作为分块水平金字塔时空特征融合模型的输入。
B、分块水平金字塔时空特征融合模型构建及训练
构建分块水平金字塔时空特征融合模型;所述分块水平金字塔时空特征融合模型包含分块水平金字塔网络和时空特征融合两个部分,其中第一部分将步态轮廓图样本分成单幅图像进行二维空间图像下的初步特征提取,第二部分将第一部分得到的不同分块以及不同帧的特征进行时空特征融合以得到该步态轮廓图样本的最终特征表达;训练分块水平金字塔时空特征融合模型以得到判别能力强的特征提取模型;
包括:
c、对于每一帧行人轮廓图,先将其水平划分为R个区域,表示为
Figure BDA0002420879970000071
那么分块水平金字塔特征可以表示为:
Figure BDA0002420879970000072
上式中,
Figure BDA0002420879970000073
表示图像
Figure BDA0002420879970000074
的第r个分块区域,r=1,2,…,R;F(·)表示由二维卷积神经网络构成的深度特征提取器,共包括六个卷积层及两个池化层,其具体网络结构参数如表1所示,本发明中深度特征提取器的网络结构是固定的,不会根据输入调整,每个分块独立学习不共享参数;HK(·)表示K阶水平金字塔池化函数,它是将输入特征图沿着水平方向分别划分为20,21,…,2K个带状空间,总计M个带状空间,
Figure BDA0002420879970000075
如附图1所示,然后对于每个带状空间分别进行水平金字塔池化,即计算其平均值和最大值的和,最后经过一层全连接操作后作为这个带状空间的特征表达;
Figure BDA0002420879970000076
表示第r个分块的水平金字塔特征,即为初步特征,其中
Figure BDA0002420879970000077
表示一个l维的特征列向量;
表1深度特征提取器(F)网络参数
名称 核大小 步幅 填充 输出通道数
Conv-1 5×5 1 2 32
Conv-2 3×3 1 1 32
Pool-1 2×2 2 0 32
Conv-3 3×3 1 1 64
Conv-4 3×3 1 1 64
Pool-2 2×2 2 0 64
Conv5 3×3 1 1 128
Conv6 3×3 1 1 128
d、根据步骤c得到的每个分块的初步特征,以不同分块权重拼接的方式进行空间特征融合,得到一帧完整行人轮廓图的特征,具体表达如下:
Figure BDA0002420879970000081
其中p1,p2,…,pR表示可学习的不同分块的权重,
Figure BDA0002420879970000082
是一个l*R维的向量;
e、根据步骤d得到的空间特征融合后的一帧完整行人轮廓图的特征表达,以最大步态能量表示的方式提取整个步态序列的时空特征,具体操作如下:对于一个长度为ni,v的步态序列,经过步骤d每一帧进行空间特征融合后得到的此步态序列的特征集合为
Figure BDA0002420879970000083
则该步态序列的时空特征
Figure BDA0002420879970000084
为:
Figure BDA0002420879970000085
其中EleMax表示对应位置元素取最大值,
Figure BDA0002420879970000086
为最终特征,
Figure BDA0002420879970000087
表示一个l*R维的特征向量;得到分块水平金字塔时空特征融合模型,根据此模型,可提取锚样、正样本、负样本的步态特征;
f、根据步骤c、d、e所构建的分块水平金字塔时空特征融合模型,初始化模型参数,以减小三元组损失Ltriplet作为训练目标,训练分块水平金字塔时空特征融合模型,损失函数如下:
Figure BDA0002420879970000088
上式中,其中d表示欧式距离度量函数,
Figure BDA0002420879970000089
表示第i个人第v种视角的步态序列
Figure BDA00024208799700000810
的特征,
Figure BDA00024208799700000811
表示第i个人第v′种视角的步态序列
Figure BDA00024208799700000812
的特征,
Figure BDA00024208799700000813
表示第j个人第v″种视角的步态序列
Figure BDA00024208799700000814
的特征,α表示余量(Margin)。由公式(4)可以看出,模型优化的目的是让同一行人不同视角的样本特征之间的距离越小越好,而不同行人之间的距离越大越好,以此实现跨视角步态识别。
(二)获取某一视角的注册样本集、另一视角的待识别步态样本,对两个样本的步态轮廓图进行预处理,所述预处理包括轮廓矫正、尺寸调整;
C、初步识别
根据训练好的分块水平金字塔时空特征融合模型,将预处理过的注册样本集送入模型中,得到该视角下的注册特征库;将待识别身份的步态轮廓图样本送入训练好的分块水平金字塔时空特征融合模型中得到步态特征,将步态特征与注册特征库中的每个特征进行欧式距离计算得到初步候选身份的候选集合;包括:
g、根据训练好的分块水平金字塔时空特征融合模型,将视角为v的注册数据集的数据经步骤a和步骤b后送入模型中,得到视角为v的注册特征库;
h、将待识别身份的视角为v′的步态样本q经过步骤a和步骤b后送入训练好的分块水平金字塔时空特征融合模型中得到特征
Figure BDA0002420879970000091
通过与步骤g得到的视角为v的注册特征库中每个特征进行欧式距离计算,进而得到距离最小的前s个特征集合
Figure BDA0002420879970000092
作为候选集合。
D、步态重排序
根据候选集合,计算互近邻特征集合,输出欧式距离最近的特征所对应的样本的身份为待识别样本的身份,得到最终的识别结果。包括:
i、根据步骤h所得到候选集合,计算特征
Figure BDA0002420879970000093
的互近邻特征集合,计算方法如下:
Figure BDA0002420879970000094
上式中,
Figure BDA0002420879970000095
Figure BDA0002420879970000096
在步骤g得到的注册特征库(除去
Figure BDA0002420879970000097
本身)以及
Figure BDA0002420879970000098
之中计算欧式距离后得到的距离最小的前s个特征;
j、从步骤i得到的互近邻特征集合MutualNear(q,s)中找出与
Figure BDA0002420879970000099
的欧式距离最近的特征,输出该最近的特征所对应样本的身份,完成识别。
本实施例中,在训练阶段,将输入步态轮廓图的大小W×H设置为64×44,并设置分块水平金字塔分块数R=3,金字塔阶数K=3,所以对于每个步态序列最终会得到20+21+22+23=15个特征表达。选择Adam作为神经网络的优化器,使用Adam优化器会使模型收敛速度较快,Adam优化器的学习率设置为1e-4。三元组损失的余量α设置为0.2。迭代次数为30K次,批量大小设置为8个行人,其中每个行人取8个视角的步态序列。在测试阶段,步态识别重排序的互近邻算法中的k值设置为5。
为了验证本发明一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法的先进性,将本发明与现有10种先进步态识别方法进行比较,包括GEI、MFA、C3A、CMCC、VTM+QM、SVD、SVR、MvDA、Deep CNNs以及CPA。这些方法所涉及的超参数设置均采用各自方法的推荐值。由于CASIA-B数据库所涵盖的视角较为全面,本发明在CASIA-B数据集上对跨视角识别任务进行了充分的实验。表2到表12列出了在CASIA-B数据库上取得的实验结果,分别展示了不同方法在0°到180°查询视角下各个角度的识别率。可以看出,本发明的方法在多数情况下都能够取得最好的识别结果,并且都超过了80%的识别精度。特别是在所跨角度较大的情况下,如查询视角为0°注册视角为90°的极端情况下,本章方法比其他所有方法的识别率要高很多。
表2不同方法在CASIA-B数据库上的实验结果(0°查询视角)
Figure BDA0002420879970000101
表3不同方法在CASIA-B数据库上的实验结果(18°查询视角)
Figure BDA0002420879970000111
表4不同方法在CASIA-B数据库上的实验结果(36°查询视角)
Figure BDA0002420879970000112
表5不同方法在CASIA-B数据库上的实验结果(54°查询视角)
Figure BDA0002420879970000121
表6不同方法在CASIA-B数据库上的实验结果(72°查询视角)
Figure BDA0002420879970000122
表7不同方法在CASIA-B数据库上的实验结果(90°查询视角)
Figure BDA0002420879970000131
表8不同方法在CASIA-B数据库上的实验结果(108°查询视角)
Figure BDA0002420879970000132
表9不同方法在CASIA-B数据库上的实验结果(126°查询视角)
Figure BDA0002420879970000141
表10不同方法在CASIA-B数据库上的实验结果(144°查询视角)
Figure BDA0002420879970000142
表11不同方法在CASIA-B数据库上的实验结果(162°查询视角)
Figure BDA0002420879970000151
表12不同方法在CASIA-B数据库上的实验结果(180°查询视角)
Figure BDA0002420879970000152

Claims (6)

1.一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,包括:
(一)获取训练样本集,构建三元组组合,三元组组合包括锚样本、正样本、负样本,锚样本的视角为某一视角,正样本的视角与锚样本视角不同且正样本身份与锚样本身份相同,负样本的视角为任意视角且与锚样本的身份不同;
A、步态轮廓图预处理
对步态轮廓图进行轮廓矫正;
将矫正后的步态轮廓图进行尺寸调整;
B、分块水平金字塔时空特征融合模型构建及训练
构建分块水平金字塔时空特征融合模型;所述分块水平金字塔时空特征融合模型包含分块水平金字塔网络和时空特征融合两个部分,其中第一部分将步态轮廓图样本分成单幅图像进行二维空间图像下的初步特征提取,第二部分将第一部分得到的不同分块以及不同帧的特征进行时空特征融合以得到该步态轮廓图样本的最终特征表达;
训练分块水平金字塔时空特征融合模型以得到判别能力强的特征提取模型;
(二)获取某一视角的注册样本集、另一视角的待识别步态样本,对两个样本的步态轮廓图进行预处理,所述预处理包括轮廓矫正、尺寸调整;
C、初步识别
根据训练好的分块水平金字塔时空特征融合模型,将预处理过的注册样本集送入模型中,得到该视角下的注册特征库;将待识别身份的步态轮廓图样本送入训练好的分块水平金字塔时空特征融合模型中得到步态特征,将步态特征与注册特征库中的每个特征进行欧式距离计算得到初步候选身份的候选集合;
D、步态重排序
根据候选集合,计算互近邻特征集合,输出欧式距离最近的特征所对应的样本的身份为待识别样本的身份,得到最终的识别结果。
2.根据权利要求1所述的基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,步骤A中,步态轮廓图为实际场景中摄像头采集到行人视频后进行分割得到的步态轮廓图,或采用CASIA-B数据库提供的步态轮廓图。
3.根据权利要求1所述的基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,所述步骤A,步态轮廓图预处理,给定包含N个行人V种视角变化的步态数据集
Figure FDA0002420879960000021
Figure FDA0002420879960000022
表示数据集中第i个人的第v种视角的步态序列,
Figure FDA0002420879960000023
Figure FDA0002420879960000024
中的第j帧步态轮廓图,其中j=1,2,…,ni,v,ni,v表示该步态序列的长度,包括:
a、读取每个步态序列,将包含行人的部分置于每帧图像的中心,并使头部置顶到图像的上部边缘,脚步置底到图像的下部边缘;
b、将步骤a得到的矫正后的步态序列都调整成相同的图像大小W×H,得到最终处理好的行人轮廓图,作为分块水平金字塔时空特征融合模型的输入。
4.根据权利要求3所述的基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,所述步骤B,分块水平金字塔时空特征融合模型构建及训练,包括:
c、对于每一帧行人轮廓图,先将其水平划分为R个区域,表示为
Figure FDA0002420879960000025
那么分块水平金字塔特征可以表示为:
Figure FDA0002420879960000026
上式中,
Figure FDA0002420879960000027
表示图像
Figure FDA0002420879960000028
的第r个分块区域,r=1,2,…,R;F(·)表示由二维卷积神经网络构成的深度特征提取器,共包括六个卷积层及两个池化层,每个分块独立学习不共享参数;HK(·)表示K阶水平金字塔池化函数,它是将输入特征图沿着水平方向分别划分为20,21,…,2K个带状空间,总计M个带状空间,
Figure FDA0002420879960000029
然后对于每个带状空间分别进行水平金字塔池化,即计算其平均值和最大值的和,最后经过一层全连接操作后作为这个带状空间的特征表达;
Figure FDA00024208799600000210
表示第r个分块的水平金字塔特征,即为初步特征,其中
Figure FDA00024208799600000211
表示一个l维的特征列向量;
d、根据步骤c得到的每个分块的初步特征,以不同分块权重拼接的方式进行空间特征融合,得到一帧完整行人轮廓图的特征,具体表达如下:
Figure FDA0002420879960000031
其中p1,p2,…,pR表示可学习的不同分块的权重,
Figure FDA0002420879960000032
是一个l*R维的向量;
e、根据步骤d得到的空间特征融合后的一帧完整行人轮廓图的特征表达,以最大步态能量表示的方式提取整个步态序列的时空特征,具体操作如下:对于一个长度为ni,v的步态序列,经过步骤d每一帧进行空间特征融合后得到的此步态序列的特征集合为
Figure FDA0002420879960000033
则该步态序列的时空特征
Figure FDA0002420879960000034
为:
Figure FDA0002420879960000035
其中EleMax表示对应位置元素取最大值,
Figure FDA0002420879960000036
为最终特征,
Figure FDA0002420879960000037
表示一个l*R维的特征向量;得到分块水平金字塔时空特征融合模型,根据此模型,可提取锚样、正样本、负样本的步态特征;
f、根据步骤c、d、e所构建的分块水平金字塔时空特征融合模型,初始化模型参数,以减小三元组损失Ltriplet作为训练目标,训练分块水平金字塔时空特征融合模型,损失函数如下:
Figure FDA0002420879960000038
上式中,其中d表示欧式距离度量函数,
Figure FDA0002420879960000039
表示第i个人第v种视角的步态序列
Figure FDA00024208799600000310
的特征,
Figure FDA00024208799600000311
表示第i个人第v′种视角的步态序列
Figure FDA00024208799600000312
的特征,
Figure FDA00024208799600000313
表示第j个人第v″种视角的步态序列
Figure FDA00024208799600000314
的特征,α表示余量。
5.根据权利要求4所述的基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,所述步骤C,初步识别,包括:
g、根据训练好的分块水平金字塔时空特征融合模型,将视角为v的注册数据集的数据经步骤a和步骤b后送入模型中,得到视角为v的注册特征库;
h、将待识别身份的视角为v′的步态样本q经过步骤a和步骤b后送入训练好的分块水平金字塔时空特征融合模型中得到步态特征
Figure FDA0002420879960000041
通过与步骤g得到的视角为v的注册特征库中每个特征进行欧式距离计算,进而得到距离最小的前s个特征集合
Figure FDA0002420879960000042
作为候选集合。
6.根据权利要求5所述的基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法,其特征在于,所述步骤D,步态重排序,包括:
i、根据步骤h所得到候选集合,计算特征
Figure FDA0002420879960000043
的互近邻特征集合,计算方法如下:
Figure FDA0002420879960000044
上式中,
Figure FDA0002420879960000045
Figure FDA0002420879960000046
在步骤g得到的注册特征库以及
Figure FDA0002420879960000047
之中计算欧式距离后得到的距离最小的前s个特征;
j、从步骤i得到的互近邻特征集合MutualNear(q,s)中找出与
Figure FDA0002420879960000048
的欧式距离最近的特征,输出该最近的特征所对应样本的身份,完成识别。
CN202010205355.XA 2020-03-23 2020-03-23 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法 Active CN113435225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010205355.XA CN113435225B (zh) 2020-03-23 2020-03-23 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010205355.XA CN113435225B (zh) 2020-03-23 2020-03-23 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法

Publications (2)

Publication Number Publication Date
CN113435225A true CN113435225A (zh) 2021-09-24
CN113435225B CN113435225B (zh) 2022-07-12

Family

ID=77752506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010205355.XA Active CN113435225B (zh) 2020-03-23 2020-03-23 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法

Country Status (1)

Country Link
CN (1) CN113435225B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947814A (zh) * 2021-10-28 2022-01-18 山东大学 一种基于时空信息增强和多尺度显著性特征提取的跨视角步态识别方法
CN114677755A (zh) * 2022-03-14 2022-06-28 山东大学 一种基于分层及分块特征融合的跨视角步态识别方法
CN114882593A (zh) * 2022-05-18 2022-08-09 厦门市美亚柏科信息股份有限公司 一种鲁棒的时空混合步态特征学习方法和系统
CN115050093A (zh) * 2022-05-23 2022-09-13 山东大学 一种基于分阶段多级金字塔的跨视角步态识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886090A (zh) * 2019-01-07 2019-06-14 北京大学 一种基于多时间尺度卷积神经网络的视频行人再识别方法
CN109902646A (zh) * 2019-03-08 2019-06-18 中南大学 一种基于长短时记忆网络的步态识别方法
CN110688898A (zh) * 2019-08-26 2020-01-14 东华大学 基于时空双流卷积神经网络的跨视角步态识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886090A (zh) * 2019-01-07 2019-06-14 北京大学 一种基于多时间尺度卷积神经网络的视频行人再识别方法
CN109902646A (zh) * 2019-03-08 2019-06-18 中南大学 一种基于长短时记忆网络的步态识别方法
CN110688898A (zh) * 2019-08-26 2020-01-14 东华大学 基于时空双流卷积神经网络的跨视角步态识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WU LIU ET AL: "Learning Efficient Spatial-Temporal Gait Features with Deep Learning for Human Identification", 《NEUROINFORMATICS》 *
ZHONGCHAO XIA ET AL: "Cross-view Gait Recognition Based on Spatio-temporal Feature Fusion", 《INTERNATIONAL JOURNAL OF COMPUTER TECHNIQUES》 *
陈欣: "基于人体行走轨迹重排序的跨视角步态识别", 《万方数据知识服务平台》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113947814A (zh) * 2021-10-28 2022-01-18 山东大学 一种基于时空信息增强和多尺度显著性特征提取的跨视角步态识别方法
CN113947814B (zh) * 2021-10-28 2024-05-28 山东大学 一种基于时空信息增强和多尺度显著性特征提取的跨视角步态识别方法
CN114677755A (zh) * 2022-03-14 2022-06-28 山东大学 一种基于分层及分块特征融合的跨视角步态识别方法
CN114677755B (zh) * 2022-03-14 2024-04-26 山东大学 一种基于分层及分块特征融合的跨视角步态识别方法
CN114882593A (zh) * 2022-05-18 2022-08-09 厦门市美亚柏科信息股份有限公司 一种鲁棒的时空混合步态特征学习方法和系统
CN115050093A (zh) * 2022-05-23 2022-09-13 山东大学 一种基于分阶段多级金字塔的跨视角步态识别方法
CN115050093B (zh) * 2022-05-23 2024-05-31 山东大学 一种基于分阶段多级金字塔的跨视角步态识别方法

Also Published As

Publication number Publication date
CN113435225B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN113435225B (zh) 一种基于分块水平金字塔时空特征融合模型和步态重排序的跨视角步态识别方法
CN109871750B (zh) 一种基于骨架图序列异常关节修复的步态识别方法
CN110135375B (zh) 基于全局信息整合的多人姿态估计方法
CN107832672B (zh) 一种利用姿态信息设计多损失函数的行人重识别方法
CN107145842B (zh) 结合lbp特征图与卷积神经网络的人脸识别方法
CN111027464B (zh) 对卷积神经网络和序特征编码联合优化的虹膜识别方法
CN109711366B (zh) 一种基于群组信息损失函数的行人重识别方法
CN111368683B (zh) 基于模约束CenterFace的人脸图像特征提取方法及人脸识别方法
CN104008370B (zh) 一种视频人脸识别方法
CN109299643B (zh) 一种基于大姿态对准的人脸识别方法及系统
CN109934195A (zh) 一种基于信息融合的反欺骗三维人脸识别方法
CN108537181A (zh) 一种基于大间距深度度量学习的步态识别方法
CN107066969A (zh) 一种人脸识别方法
CN105869153B (zh) 融合相关块信息的非刚性人脸图像配准方法
CN111428689B (zh) 一种多池化信息融合的人脸图像特征提取方法
CN114219984A (zh) 一种基于改进YOLOv3的微小病虫害检测系统及其方法
CN110991398A (zh) 一种基于改进步态能量图的步态识别方法及系统
CN111476077A (zh) 一种基于深度学习的多视角步态识别方法
CN114299279B (zh) 基于脸部检测和识别的无标记群体恒河猴运动量估计方法
CN116625249A (zh) 基于2d和3d视觉的工件自动检测方法、装置及其相关介质
CN111862147A (zh) 视频中多车辆和多行人目标的跟踪方法
CN113256789B (zh) 一种三维实时人体姿态重建方法
CN115311691B (zh) 一种基于腕部静脉和腕部纹理的联合识别方法
CN110008902B (zh) 一种融合基本特征和形变特征的手指静脉识别方法及系统
CN110111368B (zh) 一种基于人体姿态识别的相似移动目标的检测跟踪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant