CN111967326B - 一种基于轻量化多尺度特征提取的步态识别方法 - Google Patents
一种基于轻量化多尺度特征提取的步态识别方法 Download PDFInfo
- Publication number
- CN111967326B CN111967326B CN202010687318.7A CN202010687318A CN111967326B CN 111967326 B CN111967326 B CN 111967326B CN 202010687318 A CN202010687318 A CN 202010687318A CN 111967326 B CN111967326 B CN 111967326B
- Authority
- CN
- China
- Prior art keywords
- scale
- gait
- feature extraction
- convolution operation
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/23—Recognition of whole body movements, e.g. for sport training
- G06V40/25—Recognition of walking or running movements, e.g. gait recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于轻量化多尺度特征提取的步态识别方法,包括以下步骤:从基准数据集中分割出训练集和测试集;通过单一尺度特征的步态提取模型训练网络,以此来获得模型的基准精确度;在多尺度特征提取网络中不断嵌入3*3的卷积模块,并重新训练的网络模型参数;对比初始的单一尺度下的步态特征提取模型的精确度,选择最优的轻量化多尺度的步态识别特征提取模型,以此可以获得较好的步态识别结果。
Description
技术领域
本发明属于模式识别中的步态识别领域,具体涉及一种基于轻量化多尺度特征提取的步态识别方法。
背景技术
步态识别是根据人体行走时的姿态进行识别的一种生物识别技术,是近年来计算机视觉、深度学习等研究领域的前沿和热点问题。因此,也吸引了国内外越来越多研究者的关注。步态识别区别于传统的生物识别技术,具有无需接触、非侵犯、识别过程不需要配合、难于隐藏和伪装等优点,可以广泛应用于门禁系统、安全监控、人机交互、医疗诊断等领域。例如,在公共安全维护方面,通过视频监控系统,步态识别可以应用于银行、机场、车站、地铁等场所,通过对特定人员进行步态识别,确定人员身份,有助于构建智能监控体系,为提高公共安全水平。
一个典型的步态识别系统主要包括三个部分,即步态图像预处理,人体步态特征提取和基于步态特征的识别分类。首先,由于实际情况下采集的人体的步态视频可能存在各种噪声,所以需要对视频进行清洗处理,以便后续阶段对步态识别进行特征提取和识别工作。其次,需要基于预处理后的人体步态视频构建相应的步态数据库,通过人体步态数据库可以训练出适用于提取人体步态特征的特征提取模型。训练出的人体步态特征提取模型可以从清洗过的人体步态视频中生成易于认证的特征向量。最后,基于人体步态特征提取模型的提取结果,利用相应的识别分类模型,就可以得到步态识别分类的结果。
人体步态特征提取模型是步态识别的核心,直接关系到步态识别的效果。目前,人体步态特征提取模型多采用二维卷积或三维卷积进行构造,但构造过程仅仅基于单一的卷积尺度。一方面,由于单一的卷积尺度,只能从特定大小的感受野获取信息,可能会导致获取信息不充分,存在局限性。因此,本发明针对上述缺点,提出了基于多卷积尺度特征提取的步态识别方法。本发明从多个卷积尺度提取不同尺度的步态特征,并进行特征融合生成组合的特征。该组合特征融合了不同尺度的感受野信息能够有效的提高步态识别的精确度。另一方面,多尺度特征提取一般依赖于各个卷积尺度的卷积核,例如卷积尺度为3x3、5x5、7x7和9x9的卷积核,对应的感受野为9,25,49和81。但是大卷积尺度可能引入过多的参数,从而造成过拟合现象。例如,9x9的卷积的参数量是3x3卷积参数量的9倍。为了避免过拟合的现象,本发明进一步的提出了轻量化的多尺度特征提取模型。多尺度的特性可以使得特征提取模型生成更具辨别力的步态特征,从而提高步态识别的精确度。轻量化的特征可以使得特征提取模型的识别速度更快,参数更小。
发明内容
本发明针对现有步态识别方法,提供一种基于轻量化多尺度特征提取的步态识别方法。
本发明是通过如下技术方案实现的:
一种基于轻量化多尺度特征提取的步态识别方法,包括如下步骤:
步骤一)训练基于轻量化多尺度的步态特征提取模型:
构建神经网络的训练集和测试集;
卷积神经网络的输入大小被设置为B*C*H*W,其中B表示批量维度,C表示输入步态图像的通道的数,H和W为每帧步态视频序列的长和宽;
通过迭代优化策略,利用样本及样本标签训练3*3尺度的步态特征提取模型,训练完成后获得模型的基准精确度;
步骤二)在特征提取模块中增加一个新的卷积操作,增加的卷积操作为2个串联的3*3尺度卷积,将各次卷积操作得到的特征图相加得到多尺度特征图;比较添加卷积操作前后的模型的精确度;
步骤三)精确度提高,则重复步骤二),其中须将第n次增加的卷积操作改为n+1个串联的3*3尺度卷积;
当增加新的卷积操作使得精确度下降时,停止步骤;
步骤四)将得到的多尺度特征提取模块应用到步态识别神经网络中。
进一步的,所述训练集和测试集由CASIA-B步态数据集中分割得到。
进一步的,所述神经网络输入归一化至64*44大小。
进一步的,所述进行步骤二)时先对输入的步态图像通过卷积尺度1x1的卷积操作对通道进行降维;在步骤二)结束时再进行卷积尺度1x1的卷积操作对通道进行升维。
与现有技术相比,本发明具有以下优点:
该方法利用轻量化和多尺度的特性增加提取步态特征的鲁棒性派生出最佳组合的特征进行步态特征提取模型的建立,统一解决现有的步态识别方法中存在的仅从单一尺度提取步态特征的问题,同时优化了多尺度特征提取模型,采用了轻量化的方式构建。
附图说明
图1为多尺度特征提取框架;
图2为轻量化多尺度特征提取框架。
具体实施方式
本发明的基于轻量化多尺度特征提取的步态识别方法,针对的对象为中科院发布的CASIA-B步态数据集进行的实验,具体包括以下内容:
步骤一)训练基于轻量化多尺度的步态特征提取模型。
1.1)从基准数据集CASIA-B中分割出训练集和测试集。
1.2)二维卷积神经网络的输入大小被设置为B*C*H*W,其中B表示批量维度,C表示输入步态图像的通道的数,H和W为每帧步态视频序列的长和宽。在本方法中将样本的长宽归一化至64*44大小。
1.3)通过迭代优化策略,利用样本及样本标签训练单一尺度的步态特征提取模型,使得训练后的步态特征提取模型人体步态中提取出较好的多尺度特征。
步骤二)在特征提取模块中增加一个新的卷积操作,增加的卷积操作为2个串联的3*3尺度卷积,将各次卷积操作得到的特征图相加得到多尺度特征图;
步骤三)比较添加卷积操作前后的模型的精确度,精确度提高,则重复步骤二),其中第n次增加的卷积操作为n+1个串联的3*3尺度卷积;
由以上步骤得到的神经网络即可实现步态识别。
该方法利用轻量化和多尺度的特性增加提取步态特征的鲁棒性派生出最佳组合的特征进行步态特征提取模型的建立,具体阐释如下:
1.搭建多尺度模块。
步态识别中特征提取网络往往基于单一尺度构建,而单一尺度所产生的感受野存在局限性。单一尺度可能导致步态特征信息提取不够充分,造成识别精度的下降。传统的单一尺度特征提取方式可以公式化如下(1):
Xi+1=Ca*a(Xi) (1)
其中Xi为第i层的特征图,而Xi+1为第i+1层的特征图。上下两层之间的特征映射操作Ca*a(·)意味着卷积尺度为a*a的卷积操作。其中a可以为3,5,7和9,意味着使用了对应数值尺度的卷积操作。由于该方法仅利用了单一的卷积尺度进行特征提取,存在着信息利用不充分且丢失的问题。因此可以采用多尺度特征提取的方式实现,上下层的特征映射,多尺度特征提取方式可以公式化如下(2):
Xi+1=C3*3(Xi)+C5*5(Xi)+C7*7(Xi)+C9*9(Xi) (2)
其中不同卷积尺度的卷积操作同时运用与第i层的特征图Xi以生成对应的特征图,通过特征图相加的方式合成最终的组合特征图Xi+1。多尺度特征提取框架如图1所示。
在进行公式(2)的特征映射之前与之后会先通过卷积尺度1x1的卷积操作对通道进行降维和升维操作,从而降低整个多尺度特征提取框架的参数量,加快识别的速度。考虑到过大的卷积尺度可能引入过多的参数,导致参数冗余现象。本发明基于此框架进一步的引入了轻量化的特征。
2.搭建轻量化多尺度特征提取模块。
(1)搭建轻量化多尺度特征提取模块。
在卷积神经网络网络的搭建过程往往依赖于单一3*3尺度的卷积进行特征映射,而过大尺度的卷积容易引起参数冗余的现象。为了改进参数冗余现象,会对大尺度的卷积进行近似替换。例如公式(3)(4)所示,5*5卷积可以由两个串联的3*3卷积进行替代而7*7的卷积可以有三个串联的3*3卷积替代。
C5*5(Xi)=C3*3(C3*3(Xi)) (3)
C7*7(Xi)=C3*3(C3*3(C3*3(Xi))) (4)
假设输入通道以及输出通道为C1和C2,则使用卷积尺度为5*5的卷积操作进行特征映射,参数量为5*5*C1*C2。而使用两个串联额3*3卷积进行近似替代,参数量为2*3*3*C1*C2。相比于原始的5*5卷积参数量下降了28%。因此,本方面基于近似替换的方式搭建了轻量化多尺度特征提取模块,如图2所示。
其中,整体的框架采用串联的方式进行构建,相比于图1并联的方式,该方法提取特征的速度更快。其次,整体的多尺度特征提取框架都是基于3x3卷积进行搭建的,使用了两个3*3卷积替代一个5*5卷积,使用了三个3*3卷积替代一个7*7卷积以及使用了四个3*3卷积替代一个9*9卷积。相比于图1的方式参数量降低了79%。同时该模块具备更高的可扩展性,可以不断堆叠3x3卷积获得更大尺度的特征。公式(2)可以转化为如下公式(5):
Xi+1=C3*3(Xi)+C3*3(C3*3(Xi))+C3*3(C3*3(C3*3(Xi)))+C3*3(C3*3(C3*3(C3*3(Xi)))) (5)
尽管本发明通过这些实施例进行阐述和说明,但需要注意的是本发明并不仅仅局限于这些实施例。
Claims (4)
1.一种基于轻量化多尺度特征提取的步态识别方法,其特征在于,包括如下步骤:
步骤一)训练基于轻量化多尺度的步态特征提取模型:
构建神经网络的训练集和测试集;
卷积神经网络的输入大小被设置为B*C*H*W,其中B表示批量维度,C表示输入步态图像的通道的数,H和W为每帧步态视频序列的长和宽;
通过迭代优化策略,利用样本及样本标签训练3*3尺度的步态特征提取模型,训练完成后获得模型的基准精确度;
步骤二)在特征提取模块中增加一个新的卷积操作,增加的卷积操作为2个串联的3*3尺度卷积,将各次卷积操作得到的特征图相加得到多尺度特征图;比较添加卷积操作前后的模型的精确度;
步骤三)精确度提高,则重复步骤二),其中须将第n次增加的卷积操作改为n+1个串联的3*3尺度卷积;
当增加新的卷积操作使得精确度下降时,停止步骤;
步骤四)将得到的多尺度特征提取模块应用到步态识别神经网络中。
2.如权利要求1所述的一种基于轻量化多尺度特征提取的步态识别方法,其特征在于,所述训练集和测试集由CASIA-B步态数据集中分割得到。
3.如权利要求1所述的一种基于轻量化多尺度特征提取的步态识别方法,其特征在于,所述神经网络输入归一化至64*44大小。
4.如权利要求1所述的一种基于轻量化多尺度特征提取的步态识别方法,其特征在于,进行步骤二)时先对输入的步态图像通过卷积尺度1x1的卷积操作对通道进行降维;在步骤二)结束时再进行卷积尺度1x1的卷积操作对通道进行升维。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010687318.7A CN111967326B (zh) | 2020-07-16 | 2020-07-16 | 一种基于轻量化多尺度特征提取的步态识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010687318.7A CN111967326B (zh) | 2020-07-16 | 2020-07-16 | 一种基于轻量化多尺度特征提取的步态识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111967326A CN111967326A (zh) | 2020-11-20 |
CN111967326B true CN111967326B (zh) | 2021-09-28 |
Family
ID=73361874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010687318.7A Active CN111967326B (zh) | 2020-07-16 | 2020-07-16 | 一种基于轻量化多尺度特征提取的步态识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111967326B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022236579A1 (zh) * | 2021-05-10 | 2022-11-17 | 中国科学院深圳先进技术研究院 | 一种基于轻量注意力卷积神经网络的步态识别方法和系统 |
CN113139499A (zh) * | 2021-05-10 | 2021-07-20 | 中国科学院深圳先进技术研究院 | 一种基于轻量注意力卷积神经网络的步态识别方法和系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473539B (zh) * | 2013-09-23 | 2015-07-15 | 智慧城市系统服务(中国)有限公司 | 步态识别方法和装置 |
US9984284B2 (en) * | 2016-09-19 | 2018-05-29 | King Fahd University Of Petroleum And Minerals | Apparatus and method for gait recognition |
CN109214241A (zh) * | 2017-07-03 | 2019-01-15 | 中国科学院文献情报中心 | 基于深度学习算法的行人检测方法 |
CN108647668A (zh) * | 2018-05-21 | 2018-10-12 | 北京亮亮视野科技有限公司 | 多尺度轻量级人脸检测模型的构建方法及基于该模型的人脸检测方法 |
CN109446991A (zh) * | 2018-10-30 | 2019-03-08 | 北京交通大学 | 基于全局和局部特征融合的步态识别方法 |
CN110781765B (zh) * | 2019-09-30 | 2024-02-09 | 腾讯科技(深圳)有限公司 | 一种人体姿态识别方法、装置、设备及存储介质 |
CN110909612A (zh) * | 2019-10-28 | 2020-03-24 | 湖北讯獒信息工程有限公司 | 一种基于深度神经网络与机器视觉的步态识别方法及系统 |
CN111414840A (zh) * | 2020-03-17 | 2020-07-14 | 浙江大学 | 步态识别方法、装置、设备及计算机可读存储介质 |
-
2020
- 2020-07-16 CN CN202010687318.7A patent/CN111967326B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111967326A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
CN110287805B (zh) | 基于三流卷积神经网络的微表情识别方法及系统 | |
CN110084318B (zh) | 一种结合卷积神经网络和梯度提升树的图像识别方法 | |
CN103605972B (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN111898736B (zh) | 基于属性感知的高效行人重识别方法 | |
CN111723738B (zh) | 一种基于迁移学习的煤岩壳质组显微图像分类方法及系统 | |
CN109241995B (zh) | 一种基于改进型ArcFace损失函数的图像识别方法 | |
CN107451565B (zh) | 一种半监督小样本深度学习图像模式分类识别方法 | |
CN110992351B (zh) | 基于多输入卷积神经网络的sMRI图像分类方法和装置 | |
CN108921019A (zh) | 一种基于GEI和TripletLoss-DenseNet的步态识别方法 | |
CN112784763A (zh) | 基于局部与整体特征自适应融合的表情识别方法及系统 | |
CN108171318A (zh) | 一种基于模拟退火—高斯函数的卷积神经网络集成方法 | |
CN103824054A (zh) | 一种基于级联深度神经网络的人脸属性识别方法 | |
CN111967326B (zh) | 一种基于轻量化多尺度特征提取的步态识别方法 | |
CN114038037B (zh) | 基于可分离残差注意力网络的表情标签修正和识别方法 | |
CN111401303B (zh) | 一种身份与视角特征分离的跨视角步态识别方法 | |
CN106778501A (zh) | 基于压缩跟踪与ihdr增量学习的视频人脸在线识别方法 | |
CN114176607B (zh) | 一种基于视觉Transformer的脑电信号分类方法 | |
CN113011386B (zh) | 一种基于等分特征图的表情识别方法及系统 | |
CN111461201A (zh) | 基于相空间重构的传感器数据分类方法 | |
CN112949560B (zh) | 双通道特征融合下长视频表情区间连续表情变化识别方法 | |
Jayakumar et al. | Automatic prediction and classification of diseases in melons using stacked RNN based deep learning model | |
CN106611156B (zh) | 一种自适应深度空间特征的行人识别方法和系统 | |
CN110599502A (zh) | 一种基于深度学习的皮肤病变分割方法 | |
KR20210067815A (ko) | 사용자의 건강 상태를 측정하기 위한 방법 및 이를 위한 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |