CN115861869A - 一种基于Transformer的步态重识别方法 - Google Patents
一种基于Transformer的步态重识别方法 Download PDFInfo
- Publication number
- CN115861869A CN115861869A CN202211359431.8A CN202211359431A CN115861869A CN 115861869 A CN115861869 A CN 115861869A CN 202211359431 A CN202211359431 A CN 202211359431A CN 115861869 A CN115861869 A CN 115861869A
- Authority
- CN
- China
- Prior art keywords
- gait
- model
- silhouette
- image
- sending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于Transformer的步态重识别方法,该方法包括如下步骤:使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列;对于剪影图序列中的每张图从高度维度均分,得到剪影分部图集合;将剪影分部图送入Flatten网络层进行拉伸,得到特征;用H‑Trans网络模型提取步态每个部分的跨时间特征;将跨时间特征送入合并特征提取模型G‑Trans网络模型中提取最终步态特征;将最终步态特征送入全连接层中,得到目标人员的类别,并使用大间隔余弦损失函数计算损失,进行模型训练,得到训练好的模型M;采用模型M对每个底库人员进行识别。通过使用Transformer提取步态特征,提高了识别精度。
Description
技术领域
本发明涉及图像识别研究领域,具体涉及一种基于Transformer的步态重识别方法。
背景技术
图像重识别是根据摄像机获取的图像判断两个人是否属于同一个人的技术,广泛应用于监控、安防等场景下特定人物搜索。并且目前重识别技术主要是人脸重识别、行人重识别,而这些都对摄像机的距离、像素有着极高的要求,对摄像机的安装带来了困难。步态识别是行人重识别的一种特例。步态是一种极具潜质的生物特征,它反映了行人的行走模式。由于存在运动差异和体型差异,每个人的步态都是唯一的,利用步态可以唯一识别视频中的目标行人。
发明内容
为了克服现有技术的不足,本发明提供了一种基于Transformer的步态重识别方法,通过使用Transformer提取步态特征,先跨时间分部提取特征,再合并分部特征,提高了识别精度。技术方案如下:
本发明提供了一种基于Transformer的步态重识别方法,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度。
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij)。
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj);
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
步骤7,将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M;
对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=arg maxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
优选的,步骤1将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一的64×64大小。
优选的,步骤1中预训练好的实例分割模型为Mask RCNN。
优选的,步骤2中M等分为8等分。
优选的,步骤6中使用大间隔余弦损失函数计算损失L,具体为:
其中B表示训练时的批大小,b表示一个样本,b=1,2,…,B,GFb表示样本b归一化后的步态特征,对于样本b所在的类别k,yb表示FC的权重矩阵W中第k行权重归一化后的向量。
优选的,步骤7相似度simg具体为:
与现有技术相比,上述技术方案中的一个技术方案具有如下有益效果:通过将同一部分不同时间的图像放到一起,利用Transformer的综合信息的能力提取步态特征,使得网络能够充分提取到身体每个部分的语义信息;通过将这些特征送到Transformer模块中合并信息,可以综合所有部分的特征,使得最终识别的精度更高。
附图说明
图1为本公开实施例提供的一种对齐后剪影图示例图;
图2为本公开实施例提供的一种H-Trans网络结构示意图;
图3为本公开实施例提供的一种G-Trans网络结构示意图。
具体实施方式
为了阐明本发明的技术方案和工作原理,下面将结合附图对本公开实施方式做进一步的详细描述。上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本申请的说明书和权利要求书及上述附图中的术语“步骤1”、“步骤2”、“步骤3”等类似描述是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里描述的那些以外的顺序实施。
第一方面:本公开实施例提供了一种基于Transformer的步态重识别方法,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型(例如Mask RCNN)对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,例如64×64,如附图1所示,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度。
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,优选的M=8;因为行人行走过程中,身体每一个部分的特征都不相同,所以从高度维度分部提取特征,使得最终特征更加丰富。
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij)。
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj),因为行人在行走的过程中,每个部分的变化都是在单独的范围内波动的,所以将同一部分不同时间的图像放到一起,利用Transformer的综合信息的能力提取特征,使得网络能够充分提取到身体每个部分的语义信息。H-Trans网络结构如附图2所示,图中C为特征长度,例如512。
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);G-Trans网络结构如附图3所示;
前一步骤已经分部提取了每个部分的特征,最终识别行人需要综合所有部分的特征,将这些特征送到Transformer模块中合并信息,可以综合所有部分的特征,使得最终识别的精度更高。
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
优选的,步骤6中使用大间隔余弦损失函数计算损失L,具体为:
其中B表示训练时的批大小,b表示一个样本,b=1,2,…,B,GFb表示样本b归一化后的步态特征,对于样本b所在的类别k,yb表示FC的权重矩阵W中第k行权重归一化后的向量。
将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M。
步骤7,对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=argmaxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
优选的,步骤7相似度simg具体为:
以上结合附图对本发明进行了示例性描述,显然,本发明具体实现并不受上述方式的限制,凡是采用了本发明的方法构思和技术方案进行的各种非实质性的改进;或者未经改进、等同替换,将本发明的上述构思和技术方案直接应用于其他场合的,均在本发明的保护范围之内。
Claims (6)
1.一种基于Transformer的步态重识别方法,其特征在于,该方法包括如下步骤:
步骤1,通过摄像机采集步态的视频连续帧,使用预训练好的实例分割模型对画面中的行人进行分割,再使用跟踪算法,得到每个行人的剪影图序列,将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一大小,将对齐后的剪影图序列记为S={Si}(i=1,2,…,N),N为序列长度;
步骤2,对于剪影图序列S中的每张图Si从高度维度分为M等分,得到剪影分部图集合Pi={Pij}(j=1,2,…,M),Pij表示第i张图的第j个部分图,
步骤3,将剪影分部图转化为特征,将Pij送入Flatten网络层进行拉伸,得到特征Fij(i=1,2,…,N,j=1,2,…,M);
Fij=Flatten(Pij);
步骤4,对于每个j(j=1,2,…,M),使用H-Trans网络模型提取步态每个部分的跨时间特征HF,HF={HFj},HFj=H-Trans(F1j,F2j,…,FNj);
步骤5,将跨时间特征HF送入合并特征提取模型G-Trans网络模型中提取最终步态特征GF,GF=G-Trans(HF1,HF2,…,HFM);
步骤6,在训练阶段,将最终步态特征GF送入全连接层FC中,得到目标人员的类别Z,并使用大间隔余弦损失函数计算损失L,进行模型训练,Z=FC(GF);
步骤7,将训练数据集使用反向传播算法,通过步骤1~6得到损失进行训练,得到训练好的模型M;
对于每个底库人员g,使用模型M经过步骤1~5提取特征GFg,对于输入的检测视频流,使用模型M经过步骤1~5提取每个行人t的特征GFq t,然后使用余弦距离对每个底库人员g的特征计算相似度simg,最后寻找最大的相似度对应的底库人员G,G=arg maxgsimg;如果simG大于预设的相似度阈值,则判定识别到地库人员G,否则为未知人员。
2.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤1将剪影图序列的每张图片都对齐到方形图中心,并缩放到统一的64×64大小。
3.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤1中预训练好的实例分割模型为Mask RCNN。
4.根据权利要求1所述的一种基于Transformer的步态重识别方法,其特征在于,步骤2中M等分为8等分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211359431.8A CN115861869A (zh) | 2022-11-02 | 2022-11-02 | 一种基于Transformer的步态重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211359431.8A CN115861869A (zh) | 2022-11-02 | 2022-11-02 | 一种基于Transformer的步态重识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115861869A true CN115861869A (zh) | 2023-03-28 |
Family
ID=85662292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211359431.8A Pending CN115861869A (zh) | 2022-11-02 | 2022-11-02 | 一种基于Transformer的步态重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115861869A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116524592A (zh) * | 2023-04-18 | 2023-08-01 | 凯通科技股份有限公司 | 一种步态序列剪影生成方法、装置、电子设备及存储介质 |
-
2022
- 2022-11-02 CN CN202211359431.8A patent/CN115861869A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116524592A (zh) * | 2023-04-18 | 2023-08-01 | 凯通科技股份有限公司 | 一种步态序列剪影生成方法、装置、电子设备及存储介质 |
CN116524592B (zh) * | 2023-04-18 | 2024-02-06 | 凯通科技股份有限公司 | 一种步态序列剪影生成方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740413B (zh) | 行人重识别方法、装置、计算机设备及计算机存储介质 | |
CN109961051B (zh) | 一种基于聚类和分块特征提取的行人重识别方法 | |
CN104751136B (zh) | 一种基于人脸识别的多相机视频事件回溯追踪方法 | |
CN111783576B (zh) | 基于改进型YOLOv3网络和特征融合的行人重识别方法 | |
CN110717411A (zh) | 一种基于深层特征融合的行人重识别方法 | |
CN101095149B (zh) | 图像比较设备和图像比较方法 | |
US20210012094A1 (en) | Two-stage person searching method combining face and appearance features | |
US20090141940A1 (en) | Integrated Systems and Methods For Video-Based Object Modeling, Recognition, and Tracking | |
JP2004199669A (ja) | 顔検出 | |
CN112580525B (zh) | 一种基于行人再识别的病例活动轨迹监测方法 | |
CN110969087A (zh) | 一种步态识别方法及系统 | |
CN109784270A (zh) | 一种提升人脸图片识别完整性的处理方法 | |
CN110728216A (zh) | 一种基于行人属性自适应学习的无监督行人再识别方法 | |
CN112215156A (zh) | 一种视频监控中的人脸抓拍方法及系统 | |
CN111079720B (zh) | 一种基于聚类分析自主再学习的人脸识别方法 | |
CN111539351A (zh) | 一种多任务级联的人脸选帧比对方法 | |
WO2023123923A1 (zh) | 人体重识别方法、人体重识别装置、计算机设备及介质 | |
CN114998928A (zh) | 多粒度特征利用的跨模态行人重识别方法 | |
CN115861869A (zh) | 一种基于Transformer的步态重识别方法 | |
CN114581990A (zh) | 一种跑步智能测试方法以及装置 | |
CN113963371A (zh) | 人体异常姿态检测方法 | |
US20080019595A1 (en) | System And Method For Identifying Patterns | |
CN112418078B (zh) | 分数调制方法、人脸识别方法、装置及介质 | |
Abayomi-Alli et al. | Facial image quality assessment using an ensemble of pre-trained deep learning models (EFQnet) | |
CN111160115B (zh) | 一种基于孪生双流3d卷积神经网络的视频行人再识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |