CN115861869A - 一种基于Transformer的步态重识别方法 - Google Patents

一种基于Transformer的步态重识别方法 Download PDF

Info

Publication number
CN115861869A
CN115861869A CN202211359431.8A CN202211359431A CN115861869A CN 115861869 A CN115861869 A CN 115861869A CN 202211359431 A CN202211359431 A CN 202211359431A CN 115861869 A CN115861869 A CN 115861869A
Authority
CN
China
Prior art keywords
gait
model
silhouette
image
sending
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211359431.8A
Other languages
English (en)
Inventor
王乾宇
周金明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Inspector Intelligent Technology Co ltd
Original Assignee
Nanjing Inspector Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Inspector Intelligent Technology Co ltd filed Critical Nanjing Inspector Intelligent Technology Co ltd
Priority to CN202211359431.8A priority Critical patent/CN115861869A/zh
Publication of CN115861869A publication Critical patent/CN115861869A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于Transformer的步态重识别方法,该方法包括如下步骤:使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列;对于剪影图序列中的每张图从高度维度均分,得到剪影分部图集合;将剪影分部图送入Flatten网络层进行拉伸,得到特征;用H‑Trans网络模型提取步态每个部分的跨时间特征;将跨时间特征送入合并特征提取模型G‑Trans网络模型中提取最终步态特征;将最终步态特征送入全连接层中,得到目标人员的类别,并使用大间隔余弦损失函数计算损失,进行模型训练,得到训练好的模型M;采用模型M对每个底库人员进行识别。通过使用Transformer提取步态特征,提高了识别精度。

Description

一种基于Transformer的步态重识别方法
技术领域
本发明涉及图像识别研究领域,具体涉及一种基于Transformer的步态重识别方法。
背景技术
图像重识别是根据摄像机获取的图像判断两个人是否属于同一个人的技术,广泛应用于监控、安防等场景下特定人物搜索。并且目前重识别技术主要是人脸重识别、行人重识别,而这些都对摄像机的距离、像素有着极高的要求,对摄像机的安装带来了困难。步态识别是行人重识别的一种特例。步态是一种极具潜质的生物特征,它反映了行人的行走模式。由于存在运动差异和体型差异,每个人的步态都是唯一的,利用步态可以唯一识别视频中的目标行人。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Transformer的步态重识别方法,通过使用Transformer提取步态特征,先跨时间分部提取特征,再合并分部特征,提高了识别精度。技术方案如下:
本发明提供了一种基于Transformer的步态重识别方法,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度。
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij)。
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj);
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
步骤7,将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M;
对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=arg maxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
优选的,步骤1将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一的64×64大小。
优选的,步骤1中预训练好的实例分割模型为Mask RCNN。
优选的,步骤2中M等分为8等分。
优选的,步骤6中使用大间隔余弦损失函数计算损失L,具体为:
Figure BDA0003921739720000021
其中B表示训练时的批大小,b表示一个样本,b=1,2,…,B,GFb表示样本b归一化后的步态特征,对于样本b所在的类别k,yb表示FC的权重矩阵W中第k行权重归一化后的向量。
优选的,步骤7相似度simg具体为:
Figure BDA0003921739720000022
与现有技术相比,上述技术方案中的一个技术方案具有如下有益效果:通过将同一部分不同时间的图像放到一起,利用Transformer的综合信息的能力提取步态特征,使得网络能够充分提取到身体每个部分的语义信息;通过将这些特征送到Transformer模块中合并信息,可以综合所有部分的特征,使得最终识别的精度更高。
附图说明
图1为本公开实施例提供的一种对齐后剪影图示例图;
图2为本公开实施例提供的一种H-Trans网络结构示意图;
图3为本公开实施例提供的一种G-Trans网络结构示意图。
具体实施方式
为了阐明本发明的技术方案和工作原理,下面将结合附图对本公开实施方式做进一步的详细描述。上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本申请的说明书和权利要求书及上述附图中的术语“步骤1”、“步骤2”、“步骤3”等类似描述是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里描述的那些以外的顺序实施。
第一方面:本公开实施例提供了一种基于Transformer的步态重识别方法,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型(例如Mask RCNN)对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,例如64×64,如附图1所示,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度。
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,优选的M=8;因为行人行走过程中,身体每一个部分的特征都不相同,所以从高度维度分部提取特征,使得最终特征更加丰富。
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij)。
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj),因为行人在行走的过程中,每个部分的变化都是在单独的范围内波动的,所以将同一部分不同时间的图像放到一起,利用Transformer的综合信息的能力提取特征,使得网络能够充分提取到身体每个部分的语义信息。H-Trans网络结构如附图2所示,图中C为特征长度,例如512。
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);G-Trans网络结构如附图3所示;
前一步骤已经分部提取了每个部分的特征,最终识别行人需要综合所有部分的特征,将这些特征送到Transformer模块中合并信息,可以综合所有部分的特征,使得最终识别的精度更高。
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
优选的,步骤6中使用大间隔余弦损失函数计算损失L,具体为:
Figure BDA0003921739720000041
其中B表示训练时的批大小,b表示一个样本,b=1,2,…,B,GFb表示样本b归一化后的步态特征,对于样本b所在的类别k,yb表示FC的权重矩阵W中第k行权重归一化后的向量。
将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M。
步骤7,对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=argmaxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
优选的,步骤7相似度simg具体为:
Figure BDA0003921739720000042
以上结合附图对本发明进行了示例性描述,显然,本发明具体实现并不受上述方式的限制,凡是采用了本发明的方法构思和技术方案进行的各种非实质性的改进;或者未经改进、等同替换,将本发明的上述构思和技术方案直接应用于其他场合的,均在本发明的保护范围之内。

Claims (6)

1.一种基于Transformer的步态重识别方法,其特征在于,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度;
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij);
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj);
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
步骤7,将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M;
对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=arg maxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
2.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤1将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一的64×64大小。
3.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤1中预训练好的实例分割模型为Mask RCNN。
4.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤2中M等分为8等分。
5.根据权利要求1-4任一项所述的一种基于Transformer的步态重识别方法,其特征在于,步骤6中使用大间隔余弦损失函数计算损失L,具体为:
Figure FDA0003921739710000021
其中B表示训练时的批大小,b表示一个样本,b=1,2,…,B,GFb表示样本b归一化后的步态特征,对于样本b所在的类别k,yb表示FC的权重矩阵W中第k行权重归一化后的向量。
6.根据权利要求5所述的一种基于Transformer的步态重识别方法,其特征在于,步骤7相似度simg具体为:
Figure FDA0003921739710000022
/>
CN202211359431.8A 2022-11-02 2022-11-02 一种基于Transformer的步态重识别方法 Pending CN115861869A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211359431.8A CN115861869A (zh) 2022-11-02 2022-11-02 一种基于Transformer的步态重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211359431.8A CN115861869A (zh) 2022-11-02 2022-11-02 一种基于Transformer的步态重识别方法

Publications (1)

Publication Number Publication Date
CN115861869A true CN115861869A (zh) 2023-03-28

Family

ID=85662292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211359431.8A Pending CN115861869A (zh) 2022-11-02 2022-11-02 一种基于Transformer的步态重识别方法

Country Status (1)

Country Link
CN (1) CN115861869A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116524592A (zh) * 2023-04-18 2023-08-01 凯通科技股份有限公司 一种步态序列剪影生成方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116524592A (zh) * 2023-04-18 2023-08-01 凯通科技股份有限公司 一种步态序列剪影生成方法、装置、电子设备及存储介质
CN116524592B (zh) * 2023-04-18 2024-02-06 凯通科技股份有限公司 一种步态序列剪影生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109740413B (zh) 行人重识别方法、装置、计算机设备及计算机存储介质
CN109961051B (zh) 一种基于聚类和分块特征提取的行人重识别方法
CN104751136B (zh) 一种基于人脸识别的多相机视频事件回溯追踪方法
CN111783576B (zh) 基于改进型YOLOv3网络和特征融合的行人重识别方法
CN110717411A (zh) 一种基于深层特征融合的行人重识别方法
CN101095149B (zh) 图像比较设备和图像比较方法
US20210012094A1 (en) Two-stage person searching method combining face and appearance features
US20090141940A1 (en) Integrated Systems and Methods For Video-Based Object Modeling, Recognition, and Tracking
JP2004199669A (ja) 顔検出
CN112580525B (zh) 一种基于行人再识别的病例活动轨迹监测方法
CN110969087A (zh) 一种步态识别方法及系统
CN109784270A (zh) 一种提升人脸图片识别完整性的处理方法
CN110728216A (zh) 一种基于行人属性自适应学习的无监督行人再识别方法
CN112215156A (zh) 一种视频监控中的人脸抓拍方法及系统
CN111079720B (zh) 一种基于聚类分析自主再学习的人脸识别方法
CN111539351A (zh) 一种多任务级联的人脸选帧比对方法
WO2023123923A1 (zh) 人体重识别方法、人体重识别装置、计算机设备及介质
CN114998928A (zh) 多粒度特征利用的跨模态行人重识别方法
CN115861869A (zh) 一种基于Transformer的步态重识别方法
CN114581990A (zh) 一种跑步智能测试方法以及装置
CN113963371A (zh) 人体异常姿态检测方法
US20080019595A1 (en) System And Method For Identifying Patterns
CN112418078B (zh) 分数调制方法、人脸识别方法、装置及介质
Abayomi-Alli et al. Facial image quality assessment using an ensemble of pre-trained deep learning models (EFQnet)
CN111160115B (zh) 一种基于孪生双流3d卷积神经网络的视频行人再识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination