CN111539336B - 一种提高局部注意力的行人重识别方法 - Google Patents
一种提高局部注意力的行人重识别方法 Download PDFInfo
- Publication number
- CN111539336B CN111539336B CN202010335967.0A CN202010335967A CN111539336B CN 111539336 B CN111539336 B CN 111539336B CN 202010335967 A CN202010335967 A CN 202010335967A CN 111539336 B CN111539336 B CN 111539336B
- Authority
- CN
- China
- Prior art keywords
- feature
- local
- pedestrian
- weight
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000007906 compression Methods 0.000 claims abstract description 4
- 230000004913 activation Effects 0.000 claims abstract 2
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000003909 pattern recognition Methods 0.000 abstract description 2
- 230000006835 compression Effects 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 210000001364 upper extremity Anatomy 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
Description
技术领域
本发明属于计算机视觉与模式识别技术领域,特别涉及一种提高局部注意力的行人重识别方法。
背景技术
行人重识别技术是一种在图片集或视频中寻找特定行人的技术,能够广泛的应用在视频监控、智能安防等领域。随着科技的发展进步,大街小巷已经遍布了摄像头,这些摄像头在帮助寻找丢失儿童、警察破案的过程中扮演了重要的角色。警察在以往的破案过程中,首先调取案发现场的监控,然后靠人眼去判断其他大街小巷的监控录像中是否出现过此犯罪嫌疑人,这种方法费事费力,而且受光线、人体姿势的影响,准确率较低。借助于人工智能技术,尤其是针对于图像的卷积神经网络技术,计算机能够自动处理大量的视频监控数据,自动从中提取出不同摄像头中记录的犯罪嫌疑人的图像,为破案提供坚强的保证。
申请号为201610922236.X的专利提出了一套行人重识别的框架,但是起检测行人特征的方法为直方图法。但是不同视频监控中对于不能保证能够拍到行人的完整身影,不同百分比的身影的直方图有较大的差别,使用该方法不能保证识别的准确率。申请号为201510445055.8的专利提出了一种基于迁移学习的行人重识别方法,该方法将首先从图片中提取出人体,分别提取头部、左上肢、右上肢、左腿、右腿的颜色、边缘和纹理特征,将其融合后作为行人的特征。但是由于光照和行人背景较为复杂,基于颜色特征去检测人体本来就是非常复杂的任务,提取人体的头部和四肢的颜色纹理信息的准确率就更低了,这也导致了行人重识别的准确率受特征影响较大。申请号为201910820960.5的专利提出了一种基于卷积神经网络的方法进行行人重识别,区别于之前的基于颜色纹理等人为提取的特征,卷积神经网络能够自动提取特征。同时该方法为了解决摄像头有可能拍不完全行人的问题,提出了将人的身体分为上半身和下半身分别提取特征,最后行人的特征融合了上半身、下半身和全身的信息。但是这种方法对人体的划分较为简单,并且上半身、下半身和全身的特征没有优先级,不知哪一部分在识别中发挥的作用大,若能够给不同部分的特征添加权值,会提高整体的识别率。
发明内容
本发明的目的在于克服现有技术的缺点,提供一种提高局部注意力的行人重识别方法,解决现有行人重识别方法存在的准确率低、识别力差等技术问题。
本发明是通过以下技术方案实现的:一种提高局部注意力的行人重识别方法,包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui的合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE(Squeeze Excitation)模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;在图1中表示为横条;
②Fex过程:
如图2所示,经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
本发明通过将图片划分为若干小的区域,忽略掉图片通道的影响,着重关注局部区域作用,创新性使用针对区域的SE模块,增加系统的非线性,让系统自动学习不同部位特征所占的权重,增大发挥作用的局部特征权值,并减小不发挥作用的局部特征的权值。基于细分网格的人体局部特征,能够充分避免人体遮挡和人体背景杂乱对行人重识别带来的影响,提高识别的准确率。与现有技术相比,本发明具有识别准确率高、识别力强等优点。
附图说明
图1是提取行人图片特征的流程;
图2是最终特征的计算过程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细描述。
如图1和图2所示,本实施例中的一种提高局部注意力的行人重识别方法,包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui的合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE(Squeeze Excitation)模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;在图1中表示为横条;
②Fex过程:
如图2所示,经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
本发明能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于前述的细节,而应在权利要求所限定的范围内广泛地解释,因此落入权利要求或其等效范围内的变化和改型都应为权利要求所涵盖。
Claims (1)
1.一种提高局部注意力的行人重识别方法,其特征在于:包括以下步骤:
1)提取特征:进行图片到初步特征的映射操作Ftr,该操作使用残差卷积神经网络提取输入图片X的特征,并将其映射到与之对应的特征U上;输入输出的定义表示为:
Ftr:X→U,X∈RH′×W′×C′,U∈RH×W×C
其中:X代表了一幅行人图片,W’和H’分别代表了该图片的宽度和长度,C’代表了图片的通道数量;
U为全局特征,将U划分为H行W列,W和H分别代表了特征U的宽度和长度,即得到局部特征Ui,其中i=1,2...H*W,每个局部特征都有C个通道,即C代表了特征U的通道数;
2)计算最终特征:
S1、主线1:保留所有的局部特征Ui合集留作计算,其中i=1,2……H*W;
S2、主线2:通过SE模块计算出每个局部特征的权值:
①Fsq压缩过程:对每个局部特征Ui的C个通道求均值,得到的zi即为该局部特征的初步权值,具体定义为:
共得到H*W个权值,将其水平排列,得到H*W个局部特征权值的集合z;
②Fex过程:
经过Fsq得到H*W个权值集合z之后,进行Fex全连接操作,W1的维度为H*W/r,W2的维度为H*W,最后连接sigmoid激活;定义为:
s=Fex(z,W)=δ(W2W1z)
得到的s的维度为1*1*(H*W),将其变形为二维H*W维矩阵,即为局部特征的权重系数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335967.0A CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010335967.0A CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111539336A CN111539336A (zh) | 2020-08-14 |
CN111539336B true CN111539336B (zh) | 2023-06-20 |
Family
ID=71977162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010335967.0A Active CN111539336B (zh) | 2020-04-25 | 2020-04-25 | 一种提高局部注意力的行人重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111539336B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718882A (zh) * | 2016-01-19 | 2016-06-29 | 上海交通大学 | 一种分辨率自适应特征提取与融合的行人重识别方法 |
CN107316031A (zh) * | 2017-07-04 | 2017-11-03 | 北京大学深圳研究生院 | 用于行人重识别的图像特征提取方法 |
CN109784258A (zh) * | 2019-01-08 | 2019-05-21 | 华南理工大学 | 一种基于多尺度特征切割与融合的行人重识别方法 |
CN110070010A (zh) * | 2019-04-10 | 2019-07-30 | 武汉大学 | 一种基于行人重识别的人脸属性关联方法 |
CN110110642A (zh) * | 2019-04-29 | 2019-08-09 | 华南理工大学 | 一种基于多通道注意力特征的行人重识别方法 |
US10503966B1 (en) * | 2018-10-11 | 2019-12-10 | Tindei Network Technology (Shanghai) Co., Ltd. | Binocular pedestrian detection system having dual-stream deep learning neural network and the methods of using the same |
CN110728263A (zh) * | 2019-10-24 | 2020-01-24 | 中国石油大学(华东) | 一种基于距离选择的强判别特征学习的行人重识别方法 |
CN110751018A (zh) * | 2019-09-03 | 2020-02-04 | 上海交通大学 | 一种基于混合注意力机制的群组行人重识别方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764065B (zh) * | 2018-05-04 | 2020-12-08 | 华中科技大学 | 一种行人重识别特征融合辅助学习的方法 |
CN109034044B (zh) * | 2018-06-14 | 2022-04-05 | 天津师范大学 | 一种基于融合卷积神经网络的行人再识别方法 |
CN109472248B (zh) * | 2018-11-22 | 2022-03-25 | 广东工业大学 | 一种行人重识别方法、系统及电子设备和存储介质 |
CN109583502B (zh) * | 2018-11-30 | 2022-11-18 | 天津师范大学 | 一种基于对抗擦除注意力机制的行人再识别方法 |
CN110070073A (zh) * | 2019-05-07 | 2019-07-30 | 国家广播电视总局广播电视科学研究院 | 基于注意力机制的全局特征和局部特征的行人再识别方法 |
CN110543841A (zh) * | 2019-08-21 | 2019-12-06 | 中科视语(北京)科技有限公司 | 行人重识别方法、系统、电子设备及介质 |
-
2020
- 2020-04-25 CN CN202010335967.0A patent/CN111539336B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718882A (zh) * | 2016-01-19 | 2016-06-29 | 上海交通大学 | 一种分辨率自适应特征提取与融合的行人重识别方法 |
CN107316031A (zh) * | 2017-07-04 | 2017-11-03 | 北京大学深圳研究生院 | 用于行人重识别的图像特征提取方法 |
US10503966B1 (en) * | 2018-10-11 | 2019-12-10 | Tindei Network Technology (Shanghai) Co., Ltd. | Binocular pedestrian detection system having dual-stream deep learning neural network and the methods of using the same |
CN109784258A (zh) * | 2019-01-08 | 2019-05-21 | 华南理工大学 | 一种基于多尺度特征切割与融合的行人重识别方法 |
CN110070010A (zh) * | 2019-04-10 | 2019-07-30 | 武汉大学 | 一种基于行人重识别的人脸属性关联方法 |
CN110110642A (zh) * | 2019-04-29 | 2019-08-09 | 华南理工大学 | 一种基于多通道注意力特征的行人重识别方法 |
CN110751018A (zh) * | 2019-09-03 | 2020-02-04 | 上海交通大学 | 一种基于混合注意力机制的群组行人重识别方法 |
CN110728263A (zh) * | 2019-10-24 | 2020-01-24 | 中国石油大学(华东) | 一种基于距离选择的强判别特征学习的行人重识别方法 |
Non-Patent Citations (3)
Title |
---|
张伟信 ; 刘斌 ; .基于残差网络的特征加权行人重识别研究.微电子学与计算机.2020,(第04期),全文. * |
张耿宁 ; 王家宝 ; 李阳 ; 苗壮 ; 张亚非 ; 李航 ; .基于特征融合与核局部Fisher判别分析的行人重识别.计算机应用.2016,(第09期),全文. * |
陈胜杰 ; .基于视觉注意机制的行人重识别技术研究.河南科技.2020,(第05期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111539336A (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539273B (zh) | 一种交通视频背景建模方法及系统 | |
CN106204779B (zh) | 基于多人脸数据采集策略和深度学习的课堂考勤方法 | |
CN108830252B (zh) | 一种融合全局时空特征的卷积神经网络人体动作识别方法 | |
CN107622258B (zh) | 一种结合静态底层特征和运动信息的快速行人检测方法 | |
CN104598883B (zh) | 一种多摄像机监控网络中目标再识别的方法 | |
CN111325111A (zh) | 一种融合逆注意力和多尺度深度监督的行人重识别方法 | |
CN110188835B (zh) | 基于生成式对抗网络模型的数据增强行人再识别方法 | |
CN108537754B (zh) | 基于形变引导图的人脸图像复原系统 | |
CN114219984A (zh) | 一种基于改进YOLOv3的微小病虫害检测系统及其方法 | |
CN103020606B (zh) | 一种基于时空上下文信息的行人检测方法 | |
CN109977773A (zh) | 基于多目标检测3d cnn的人体行为识别方法及系统 | |
CN111260687B (zh) | 一种基于语义感知网络和相关滤波的航拍视频目标跟踪方法 | |
CN112653899A (zh) | 一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法 | |
CN111310633A (zh) | 基于视频的并行时空注意力行人重识别方法 | |
CN111639580B (zh) | 一种结合特征分离模型和视角转换模型的步态识别方法 | |
CN110751018A (zh) | 一种基于混合注意力机制的群组行人重识别方法 | |
CN113269224B (zh) | 一种场景图像分类方法、系统及存储介质 | |
CN104376334B (zh) | 一种多尺度特征融合的行人比对方法 | |
CN110647820B (zh) | 基于特征空间超分辨映射的低分辨率人脸识别方法 | |
CN111582036B (zh) | 可穿戴设备下基于形状和姿态的跨视角人物识别方法 | |
CN108009493A (zh) | 基于动作增强的人脸防欺骗识别方法 | |
CN110866453B (zh) | 基于卷积神经网络的实时人群稳定状态识别方法及装置 | |
CN115188066A (zh) | 基于协同注意力和多尺度融合的运动目标检测系统及方法 | |
Li et al. | A self-attention feature fusion model for rice pest detection | |
CN115565204A (zh) | 一种利用局部监督的跨模态行人重识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230731 Address after: 030000 Shanxi Province Taiyuan City Wanbailin District Shanxi Comprehensive Reform Demonstration Zone Taiyuan Xuefu Park Science and Technology Street No. 9 Danyang Science and Technology Building 12th Floor Yunzhu Company Maker Space Station 10 Patentee after: Shanxi Kehui Technology Consulting Management Co.,Ltd. Address before: 046011 No. 73 North East Street, Changzhi City, Shanxi Province Patentee before: CHANGZHI University |
|
TR01 | Transfer of patent right |