CN111539336B - 一种提高局部注意力的行人重识别方法 - Google Patents
一种提高局部注意力的行人重识别方法 Download PDFInfo
- Publication number
- CN111539336B CN111539336B CN202010335967.0A CN202010335967A CN111539336B CN 111539336 B CN111539336 B CN 111539336B CN 202010335967 A CN202010335967 A CN 202010335967A CN 111539336 B CN111539336 B CN 111539336B
- Authority
- CN
- China
- Prior art keywords
- feature
- local
- local feature
- pedestrian
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
技术领域
本发明属于计算机视觉与模式识别技术领域,特别涉及一种提高局部注意力的行人重识别方法。
背景技术
行人重识别技术是一种在图片集或视频中寻找特定行人的技术,能够广泛的应用在视频监控、智能安防等领域。随着科技的发展进步,大街小巷已经遍布了摄像头,这些摄像头在帮助寻找丢失儿童、警察破案的过程中扮演了重要的角色。警察在以往的破案过程中,首先调取案发现场的监控,然后靠人眼去判断其他大街小巷的监控录像中是否出现过此犯罪嫌疑人,这种方法费事费力,而且受光线、人体姿势的影响,准确率较低。借助于人工智能技术,尤其是针对于图像的卷积神经网络技术,计算机能够自动处理大量的视频监控数据,自动从中提取出不同摄像头中记录的犯罪嫌疑人的图像,为破案提供坚强的保证。
申请号为201610922236.X的专利提出了一套行人重识别的框架,但是起检测行人特征的方法为直方图法。但是不同视频监控中对于不能保证能够拍到行人的完整身影,不同百分比的身影的直方图有较大的差别,使用该方法不能保证识别的准确率。申请号为201510445055.8的专利提出了一种基于迁移学习的行人重识别方法,该方法将首先从图片中提取出人体,分别提取头部、左上肢、右上肢、左腿、右腿的颜色、边缘和纹理特征,将其融合后作为行人的特征。但是由于光照和行人背景较为复杂,基于颜色特征去检测人体本来就是非常复杂的任务,提取人体的头部和四肢的颜色纹理信息的准确率就更低了,这也导致了行人重识别的准确率受特征影响较大。申请号为201910820960.5的专利提出了一种基于卷积神经网络的方法进行行人重识别,区别于之前的基于颜色纹理等人为提取的特征,卷积神经网络能够自动提取特征。同时该方法为了解决摄像头有可能拍不完全行人的问题,提出了将人的身体分为上半身和下半身分别提取特征,最后行人的特征融合了上半身、下半身和全身的信息。但是这种方法对人体的划分较为简单,并且上半身、下半身和全身的特征没有优先级,不知哪一部分在识别中发挥的作用大,若能够给不同部分的特征添加权值,会提高整体的识别率。
发明内容
本发明的目的在于克服现有技术的缺点,提供一种提高局部注意力的行人重识别方法,解决现有行人重识别方法存在的准确率低、识别力差等技术问题。
本发明是通过以下技术方案实现的:一种提高局部注意力的行人重识别方法,包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui的合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE(Squeeze Excitation)模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;在图1中表示为横条;
②Fex过程:
如图2所示,经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
本发明通过将图片划分为若干小的区域,忽略掉图片通道的影响,着重关注局部区域作用,创新性使用针对区域的SE模块,增加系统的非线性,让系统自动学习不同部位特征所占的权重,增大发挥作用的局部特征权值,并减小不发挥作用的局部特征的权值。基于细分网格的人体局部特征,能够充分避免人体遮挡和人体背景杂乱对行人重识别带来的影响,提高识别的准确率。与现有技术相比,本发明具有识别准确率高、识别力强等优点。
附图说明
图1是提取行人图片特征的流程;
图2是最终特征的计算过程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细描述。
如图1和图2所示,本实施例中的一种提高局部注意力的行人重识别方法,包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui的合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE(Squeeze Excitation)模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;在图1中表示为横条;
②Fex过程:
如图2所示,经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于前述的细节,而应在权利要求所限定的范围内广泛地解释,因此落入权利要求或其等效范围内的变化和改型都应为权利要求所涵盖。
Claims (1)
1.一种提高局部注意力的行人重识别方法,其特征在于:包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;
②Fex过程:
经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335967.0A CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335967.0A CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111539336A CN111539336A (zh) | 2020-08-14 |
CN111539336B true CN111539336B (zh) | 2023-06-20 |
Family
ID=71977162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010335967.0A Active CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111539336B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718882A (zh) * | 2016-01-19 | 2016-06-29 | 上海交通大学 | 一种分辨率自适应特征提取与融合的行人重识别方法 |
CN107316031A (zh) * | 2017-07-04 | 2017-11-03 | 北京大学深圳研究生院 | 用于行人重识别的图像特征提取方法 |
CN109784258A (zh) * | 2019-01-08 | 2019-05-21 | 华南理工大学 | 一种基于多尺度特征切割与融合的行人重识别方法 |
CN110070010A (zh) * | 2019-04-10 | 2019-07-30 | 武汉大学 | 一种基于行人重识别的人脸属性关联方法 |
CN110110642A (zh) * | 2019-04-29 | 2019-08-09 | 华南理工大学 | 一种基于多通道注意力特征的行人重识别方法 |
US10503966B1 (en) * | 2018-10-11 | 2019-12-10 | Tindei Network Technology (Shanghai) Co., Ltd. | Binocular pedestrian detection system having dual-stream deep learning neural network and the methods of using the same |
CN110728263A (zh) * | 2019-10-24 | 2020-01-24 | 中国石油大学(华东) | 一种基于距离选择的强判别特征学习的行人重识别方法 |
CN110751018A (zh) * | 2019-09-03 | 2020-02-04 | 上海交通大学 | 一种基于混合注意力机制的群组行人重识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764065B (zh) * | 2018-05-04 | 2020-12-08 | 华中科技大学 | 一种行人重识别特征融合辅助学习的方法 |
CN109034044B (zh) * | 2018-06-14 | 2022-04-05 | 天津师范大学 | 一种基于融合卷积神经网络的行人再识别方法 |
CN109472248B (zh) * | 2018-11-22 | 2022-03-25 | 广东工业大学 | 一种行人重识别方法、系统及电子设备和存储介质 |
CN109583502B (zh) * | 2018-11-30 | 2022-11-18 | 天津师范大学 | 一种基于对抗擦除注意力机制的行人再识别方法 |
CN110070073A (zh) * | 2019-05-07 | 2019-07-30 | 国家广播电视总局广播电视科学研究院 | 基于注意力机制的全局特征和局部特征的行人再识别方法 |
CN110543841A (zh) * | 2019-08-21 | 2019-12-06 | 中科视语(北京)科技有限公司 | 行人重识别方法、系统、电子设备及介质 |
-
2020
- 2020-04-25 CN CN202010335967.0A patent/CN111539336B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718882A (zh) * | 2016-01-19 | 2016-06-29 | 上海交通大学 | 一种分辨率自适应特征提取与融合的行人重识别方法 |
CN107316031A (zh) * | 2017-07-04 | 2017-11-03 | 北京大学深圳研究生院 | 用于行人重识别的图像特征提取方法 |
US10503966B1 (en) * | 2018-10-11 | 2019-12-10 | Tindei Network Technology (Shanghai) Co., Ltd. | Binocular pedestrian detection system having dual-stream deep learning neural network and the methods of using the same |
CN109784258A (zh) * | 2019-01-08 | 2019-05-21 | 华南理工大学 | 一种基于多尺度特征切割与融合的行人重识别方法 |
CN110070010A (zh) * | 2019-04-10 | 2019-07-30 | 武汉大学 | 一种基于行人重识别的人脸属性关联方法 |
CN110110642A (zh) * | 2019-04-29 | 2019-08-09 | 华南理工大学 | 一种基于多通道注意力特征的行人重识别方法 |
CN110751018A (zh) * | 2019-09-03 | 2020-02-04 | 上海交通大学 | 一种基于混合注意力机制的群组行人重识别方法 |
CN110728263A (zh) * | 2019-10-24 | 2020-01-24 | 中国石油大学(华东) | 一种基于距离选择的强判别特征学习的行人重识别方法 |
Non-Patent Citations (3)
Title |
---|
张伟信 ; 刘斌 ; .基于残差网络的特征加权行人重识别研究.微电子学与计算机.2020,(第04期),全文. * |
张耿宁 ; 王家宝 ; 李阳 ; 苗壮 ; 张亚非 ; 李航 ; .基于特征融合与核局部Fisher判别分析的行人重识别.计算机应用.2016,(第09期),全文. * |
陈胜杰 ; .基于视觉注意机制的行人重识别技术研究.河南科技.2020,(第05期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111539336A (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110706157B (zh) | 一种基于身份先验生成对抗网络的人脸超分辨率重建方法 | |
CN109829443B (zh) | 基于图像增强与3d卷积神经网络的视频行为识别方法 | |
WO2021208275A1 (zh) | 一种交通视频背景建模方法及系统 | |
CN107622258B (zh) | 一种结合静态底层特征和运动信息的快速行人检测方法 | |
CN108109385B (zh) | 一种输电线防外破的车辆识别与危险行为判别系统与方法 | |
WO2021213158A1 (zh) | 一种智能视频会议终端的实时人脸摘要服务的方法及系统 | |
CN113052210A (zh) | 一种基于卷积神经网络的快速低光照目标检测方法 | |
CN108537754B (zh) | 基于形变引导图的人脸图像复原系统 | |
CN111241975B (zh) | 一种基于移动端边缘计算的人脸识别检测方法及系统 | |
CN111723773B (zh) | 遗留物检测方法、装置、电子设备及可读存储介质 | |
CN107066963B (zh) | 一种自适应人群计数方法 | |
CN114219984A (zh) | 一种基于改进YOLOv3的微小病虫害检测系统及其方法 | |
CN112241939B (zh) | 一种基于多尺度和非局部的轻量去雨方法 | |
CN115188066A (zh) | 基于协同注意力和多尺度融合的运动目标检测系统及方法 | |
Wang et al. | Image deraining and denoising convolutional neural network for autonomous driving | |
KR20200060868A (ko) | 객체 탐지 및 자동 추적이 가능한 다시점 영상 감시 시스템 | |
CN111539336B (zh) | 一种提高局部注意力的行人重识别方法 | |
CN117011160A (zh) | 一种基于密集循环网络融合注意力机制的单图像去雨方法 | |
Šarić et al. | Dense semantic forecasting in video by joint regression of features and feature motion | |
CN113870129B (zh) | 基于空间感知与时间差异学习的视频去雨方法 | |
CN115953312A (zh) | 一种基于单幅图像的联合去雾检测方法、装置及存储介质 | |
CN109948530B (zh) | 基于交叉学习的行人再识别性能提升方法 | |
CN112070048B (zh) | 基于RDSNet的车辆属性识别方法 | |
Hu et al. | Enhancing Rainy Weather Driving: Deep Unfolding Network with PGD Algorithm for Single Image Deraining | |
Wei et al. | Single Image Desnow Based on Vision Transformer and Conditional Generative Adversarial Network for Internet of Vehicles. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230731 Address after: 030000 Shanxi Province Taiyuan City Wanbailin District Shanxi Comprehensive Reform Demonstration Zone Taiyuan Xuefu Park Science and Technology Street No. 9 Danyang Science and Technology Building 12th Floor Yunzhu Company Maker Space Station 10 Patentee after: Shanxi Kehui Technology Consulting Management Co.,Ltd. Address before: 046011 No. 73 North East Street, Changzhi City, Shanxi Province Patentee before: CHANGZHI University |