CN110222682B - 一种基于多特征的行人目标检测系统 - Google Patents
一种基于多特征的行人目标检测系统 Download PDFInfo
- Publication number
- CN110222682B CN110222682B CN201910493445.0A CN201910493445A CN110222682B CN 110222682 B CN110222682 B CN 110222682B CN 201910493445 A CN201910493445 A CN 201910493445A CN 110222682 B CN110222682 B CN 110222682B
- Authority
- CN
- China
- Prior art keywords
- lens
- recognition area
- detection system
- main body
- pedestrian
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 45
- 238000011176 pooling Methods 0.000 claims abstract description 20
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 14
- 230000017525 heat dissipation Effects 0.000 claims description 6
- 238000005452 bending Methods 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 238000000034 method Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000010191 image analysis Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
- G03B17/02—Bodies
- G03B17/12—Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets
- G03B17/14—Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets interchangeably
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
本发明提出一种基于多特征的行人目标检测系统,检测系统主体由颜色识别区和外形识别区构成,颜色识别区和外形识别区上各设有一个摄像头,检测系统主体的中部设有滤镜组件,滤镜组件与检测系统主体内部的电机相连,电机用于带动滤镜组件沿检测系统主体的轴向旋转,滤镜组件包括若干组滤镜。检测系统主体内部设有图像处理单元,图像处理单元内置卷积神经网络模型,图像处理单元的工作流程包括:接收颜色识别区和外形识别区捕获的图像信息;扩大检测到的行人区域;将扩大后的行人区域送入卷积神经网络模型。卷积神经网络模型由6个卷积层、3个池化层、1个全连接层组成,所述全连接层分为若干部分,每部分与指定检测特征对应的标签层相连。
Description
技术领域
本发明属于图像检测设备领域,尤其是一种基于多特征的行人目标检测系统。
背景技术
实际生活中,在一些案件发生后,如果现场有目击证人,现场目击者一般会记忆嫌疑人性别、大体身高、穿着颜色等大体信息。而警方通过嫌疑人的描述在附近的摄像头内寻找有用的嫌疑人视频,费时费力。因此需要一种可以检测多特征的行人目标检测系统,以便于实现对视频中的人员的属性特征信息自动提取识别,包含性别、年龄段、是否戴帽、衣着颜色、随身携带的物品等。减低业务人员的工作量,进一步提高视频侦查的效率。
发明内容
本发明提出一种基于多特征的行人目标检测系统,采用的技术方案如下:
一种基于多特征的行人目标检测系统,检测系统主体由颜色识别区和外形识别区构成,颜色识别区和外形识别区上各设有一个摄像头,检测系统主体的中部设有滤镜组件,滤镜组件与检测系统主体内部的电机相连,电机用于带动滤镜组件沿检测系统主体的轴向旋转,滤镜组件包括若干组滤镜,每组滤镜包括第一镜头和第二镜头,滤镜组件主体上,靠近第一镜头一侧设有第一环形LED灯,滤镜组件主体上,靠近第二镜头一侧设有第二环形LED 灯。
进一步的,颜色识别区的直径小于外形识别区的直径,第一镜头通过第一镜头连接部连接在滤镜组件的主体上,第二镜头通过第二镜头连接部连接在滤镜组件的主体上,第一镜头连接部、第二镜头连接部表面为曲面,第一镜头连接部、第二镜头连接部的折弯处用于使第一镜头贴近颜色识别区、使第二镜头贴近外形识别区。
进一步的,滤镜组件主体上,第一镜头和第二镜头之间还设有调整环,调整环用于人工调整滤镜组件的位置。
进一步的,第一镜头包括偏光镜和滤光镜,第二镜头包括广角镜头、长焦镜头和标准镜头。
进一步的,检测系统主体的顶面和底面设有用于散热的金属散热板。
进一步的,检测系统主体(1)内部设有图像处理单元,图像处理单元内置卷积神经网络模型,图像处理单元的工作流程包括:
S1.接收颜色识别区(11)和外形识别区(12)捕获的图像信息;
S2.扩大检测到的行人区域;
S3.将扩大后的行人区域送入卷积神经网络模型。
进一步的,所述卷积神经网络模型由6个卷积层、3个池化层、1个全连接层组成,其中池化层与指定的卷积层相连;所述全连接层分为若干部分,每部分与指定检测特征对应的标签层相连。
与现有技术相比,本发明的有益效果在于:滤镜组件包括若干组滤镜,每组滤镜包括第一镜头和第二镜头,操作人员根据现场情况选择合适的镜头,使得拍摄的图片进行了初步处理,便于图像分析时最大程度的分析出目标人物携带物品和骑车等行为细节,保证系统的分析效率。检测需要分为颜色识别区和外形识别区,提高了图像分析时,对于是否骑车、性别、上衣颜色、下衣颜色、年龄、行进方向、是否背包、是否戴帽等特征的检测准确性。
附图说明
图1是检测系统整体结构示意图;
图2是卷积神经网络示意图;
图3是行人区域扩大过程示意图。
附图标记说明:
检测系统主体-1,颜色识别区-11,外形识别区12,滤镜组件-2,第一镜头-21,第一镜头连接部-22,调整环-23,第一环形LED灯-24,第二环形LED灯-25,第二镜头连接部-26,第二镜头-27。
具体实施方式
如图1所示,本实施例中,提出一种基于多特征的行人目标检测系统,检测系统主体1由颜色识别区11和外形识别区12构成,颜色识别区11和外形识别区12上各设有一个摄像头,检测系统主体1的中部设有滤镜组件2,滤镜组件2与检测系统主体1内部的电机相连,电机用于带动滤镜组件2沿检测系统主体1的轴向旋转,滤镜组件2包括若干组滤镜,每组滤镜包括第一镜头21和第二镜头27,滤镜组件2主体上,靠近第一镜头21一侧设有第一环形LED灯24,滤镜组件2主体上,靠近第二镜头27一侧设有第二环形 LED灯25。其中颜色识别区11的直径小于外形识别区12的直径,第一镜头21通过第一镜头连接部22连接在滤镜组件2的主体上,第二镜头27通过第二镜头连接部26连接在滤镜组件2的主体上,第一镜头连接部22、第二镜头连接部26表面为曲面,第一镜头连接部22、第二镜头连接部26的折弯处用于使第一镜头21贴近颜色识别区11、使第二镜头27贴近外形识别区 12。滤镜组件2主体上,第一镜头21和第二镜头27之间还设有调整环23,调整环23用于人工调整滤镜组件2的位置。第一镜头21包括偏光镜和滤光镜,第二镜头27包括广角镜头、长焦镜头和标准镜头。检测系统主体1的顶面和底面设有用于散热的金属散热板。设备工作时,操作人员根据现场情况选择合适的镜头,使得拍摄的图片进行了初步处理,便于图像分析时最大程度的分析出目标人物携带物品和骑车等行为细节。
本实施例中,检测系统主体1内部设有图像处理单元,图像处理单元内置卷积神经网络模型,图像处理单元的工作流程包括:
S1.接收颜色识别区11和外形识别区12捕获的图像信息;
S2.扩大检测到的行人区域;
S3.将扩大后的行人区域送入卷积神经网络模型。
本实施例中,如图2所示,使用的卷积神经网络模型由6个卷积层、3 个池化层、1个全连接层组成,其中池化层与指定的卷积层相连;所述全连接层分为若干部分,每部分与指定检测特征对应的标签层相连。
使用的卷积神经网络模型具体结构为:
第一层卷积:卷积核大小:11*11,卷积核个数:96,滑动步长:4,激活函数ReLU;
第一层池化:池化方式:最大池化,步长:2,池化核大小:3;
第二层卷积:卷积核大小:5*5,卷积核个数:256,滑动步长:1,激活函数:ReLU;
第二层池化:池化方式:最大池化,步长:2,池化核大小:3;
第三层卷积:卷积核大小:3*3,卷积核个数:384,滑动步长:1,激活函数:ReLU;
第四卷积层:卷积核大小:3,卷积核个数:384,滑动步长:1,激活函数:ReLU;
第四层池化:池化方式:平均池化,步长:2,池化核大小:3;
第五层卷积:卷积核大小:3,卷积核个数:256,滑动步长:1,激活函数:ReLU;
第六层卷积:卷积核大小:1,卷积核个数:128,滑动步长:1,激活函数:ReLU,Drop:0.5;
第七层:全连接层:输出个数:4096:Drop:0.5;Fc8_1层:输出个数: 2;Fc8_2层:输出个数:2;Fc8_3层:输出个数:6;Fc8_4层,输出个数: 6;Fc8_5层,输出个数:5;Fc8_6层:输出个数:4;Fc8_7层,输出个数: 2;Fc8_8层,输出个数:2。
部分卷积层连接池化层的目的在于:在降低计算量的同时,尽可能多的保留特征信息。
本实施例中,根据检测的行人特征:是否骑车、性别、上衣颜色、下衣颜色、年龄、行进方向、是否背包、是否戴帽共8项特征,将全连接层分为 8份,分别与标签层对应链接,构成8个不同的二次代价函数作为损失函数,进行训练。
特征损失函数中,是否骑车、性别、是否背包、是否戴帽为2分类;
上衣颜色、下衣颜色为常见主要颜色(黑、白、红、棕、绿、蓝)六分类;行进方向分为:前、后、左、右四分类;年龄:儿童、少年、青年、中年、老年五分类。
如图3所示,步骤S2中,行人区域扩大方法具体为:记录行人检测矩形框矩的尺寸,即长和宽。从人行检测框的1/2处进行轴对称扩充,扩充框长=1/2行人检测框长,扩充框宽=行人检测框长。最终输入分类的框是“凸”形。
以上结合具体实施例描述了本发明的技术原理,这些描述只是为了解释本发明的技术原理,而不能以任何方式解释为对本发明保护范围的限制。基于此解释,本领域内的技术人员不需要付出创造性的劳动即可联想到本发明的其他具体实施方式都将落入本发明的保护范围内。
Claims (2)
1.一种基于多特征的行人目标检测系统,其特征在于,
检测系统主体(1)包括颜色识别区(11)和外形识别区(12),颜色识别区(11)和外形识别区(12)上各设有一个摄像头,检测系统主体(1)的中部设有滤镜组件(2),滤镜组件(2)与检测系统主体(1)内部的电机相连,电机用于带动滤镜组件(2)沿检测系统主体(1)的轴向旋转,滤镜组件(2)包括若干组滤镜,每组滤镜包括第一镜头(21)和第二镜头(27),滤镜组件(2)主体上,靠近第一镜头(21)一侧设有第一环形LED灯(24),滤镜组件(2)主体上,靠近第二镜头(27)一侧设有第二环形LED灯(25);
颜色识别区(11)的直径小于外形识别区(12)的直径,第一镜头(21)通过第一镜头连接部(22)连接在滤镜组件(2)的主体上,第二镜头(27)通过第二镜头连接部(26)连接在滤镜组件(2)的主体上,第一镜头连接部(22)、第二镜头连接部(26)表面为曲面,第一镜头连接部(22)、第二镜头连接部(26)的折弯处用于使第一镜头(21)贴近颜色识别区(11)、使第二镜头(27)贴近外形识别区(12);
滤镜组件(2)主体上,第一镜头(21)和第二镜头(27)之间还设有调整环(23),调整环(23)用于人工调整滤镜组件(2)的位置;
第一镜头(21)包括偏光镜和滤光镜,第二镜头(27)包括广角镜头、长焦镜头和标准镜头;
检测系统主体(1)内部设有图像处理单元,图像处理单元内置卷积神经网络模型,图像处理单元的工作流程包括:
S1.接收颜色识别区(11)和外形识别区(12)捕获的图像信息;
S2.扩大检测到的行人区域;
S3.将扩大后的行人区域送入卷积神经网络模型;
所述卷积神经网络模型由6个卷积层、3个池化层、1个全连接层组成,其中池化层与指定的卷积层相连;所述全连接层分为若干部分,每部分与指定检测特征对应的标签层相连;
步骤S2中,行人区域扩大方法具体为:记录行人检测矩形框矩的尺寸,即长和宽,从人行检测框的1/2处进行轴对称扩充,扩充框长=1/2行人检测框长,扩充框宽=行人检测框长,最终输入分类的框是“凸”形。
2.如权利要求1所述一种基于多特征的行人目标检测系统,其特征在于,
检测系统主体(1)的顶面和底面设有用于散热的金属散热板。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910493445.0A CN110222682B (zh) | 2019-06-06 | 2019-06-06 | 一种基于多特征的行人目标检测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910493445.0A CN110222682B (zh) | 2019-06-06 | 2019-06-06 | 一种基于多特征的行人目标检测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222682A CN110222682A (zh) | 2019-09-10 |
CN110222682B true CN110222682B (zh) | 2024-05-07 |
Family
ID=67816228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910493445.0A Active CN110222682B (zh) | 2019-06-06 | 2019-06-06 | 一种基于多特征的行人目标检测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222682B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619314A (zh) * | 2019-09-24 | 2019-12-27 | 杭州宇泛智能科技有限公司 | 安全帽检测方法、装置及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715238A (zh) * | 2015-03-11 | 2015-06-17 | 南京邮电大学 | 一种基于多特征融合的行人检测方法 |
CN105023008A (zh) * | 2015-08-10 | 2015-11-04 | 河海大学常州校区 | 基于视觉显著性及多特征的行人再识别方法 |
CN105554364A (zh) * | 2015-07-30 | 2016-05-04 | 宇龙计算机通信科技(深圳)有限公司 | 一种图像处理方法及终端 |
CN105825494A (zh) * | 2015-08-31 | 2016-08-03 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN106127164A (zh) * | 2016-06-29 | 2016-11-16 | 北京智芯原动科技有限公司 | 基于显著性检测和卷积神经网络的行人检测方法及装置 |
CN106897673A (zh) * | 2017-01-20 | 2017-06-27 | 南京邮电大学 | 一种基于retinex算法和卷积神经网络的行人再识别方法 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN107835351A (zh) * | 2017-12-14 | 2018-03-23 | 信利光电股份有限公司 | 一种双摄像头模组以及终端 |
CN109583481A (zh) * | 2018-11-13 | 2019-04-05 | 杭州电子科技大学 | 一种基于卷积神经网络的细粒度服装的属性识别方法 |
-
2019
- 2019-06-06 CN CN201910493445.0A patent/CN110222682B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715238A (zh) * | 2015-03-11 | 2015-06-17 | 南京邮电大学 | 一种基于多特征融合的行人检测方法 |
CN105554364A (zh) * | 2015-07-30 | 2016-05-04 | 宇龙计算机通信科技(深圳)有限公司 | 一种图像处理方法及终端 |
WO2017016030A1 (zh) * | 2015-07-30 | 2017-02-02 | 宇龙计算机通信科技(深圳)有限公司 | 一种图像处理方法及终端 |
CN105023008A (zh) * | 2015-08-10 | 2015-11-04 | 河海大学常州校区 | 基于视觉显著性及多特征的行人再识别方法 |
CN105825494A (zh) * | 2015-08-31 | 2016-08-03 | 维沃移动通信有限公司 | 一种图像处理方法及移动终端 |
CN106127164A (zh) * | 2016-06-29 | 2016-11-16 | 北京智芯原动科技有限公司 | 基于显著性检测和卷积神经网络的行人检测方法及装置 |
CN106897673A (zh) * | 2017-01-20 | 2017-06-27 | 南京邮电大学 | 一种基于retinex算法和卷积神经网络的行人再识别方法 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN107835351A (zh) * | 2017-12-14 | 2018-03-23 | 信利光电股份有限公司 | 一种双摄像头模组以及终端 |
CN109583481A (zh) * | 2018-11-13 | 2019-04-05 | 杭州电子科技大学 | 一种基于卷积神经网络的细粒度服装的属性识别方法 |
Non-Patent Citations (2)
Title |
---|
Human Target Detection and Tracking Under Parallel Binocular Cameras;XING Yufeng et al;《Institute of Electrical and Electronics Engineers》;第1-5页 * |
静态图像下多特征融合的行人检测方法研究;欧阳瑞彬;《中国优秀硕士学位论文全文数据库 信息科技辑》;第2017年卷(第4期);第I138-452页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110222682A (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3648448B1 (en) | Target feature extraction method and device, and application system | |
CN111126325B (zh) | 一种基于视频的智能人员安防识别统计方法 | |
WO2020206850A1 (zh) | 基于高维图像的图像标注方法和装置 | |
CN108053449A (zh) | 双目视觉系统的三维重建方法、装置及双目视觉系统 | |
CN109271921A (zh) | 一种多光谱成像的智能识别方法及系统 | |
CN106469309A (zh) | 车辆监控的方法和装置、处理器、图像采集设备 | |
CN104780308A (zh) | 一种信息处理方法及电子设备 | |
CN106778645A (zh) | 一种图像处理方法及装置 | |
CN102542246A (zh) | Atm机异常人脸检测方法 | |
CN112149513A (zh) | 基于深度学习的工业制造现场安全帽佩戴识别系统和方法 | |
CN105069816B (zh) | 一种进出口人流量统计的方法及系统 | |
US20180183998A1 (en) | Power reduction and performance improvement through selective sensor image downscaling | |
CN113673584A (zh) | 一种图像检测方法及相关装置 | |
CN112258559A (zh) | 一种基于多目标跟踪的智能跑步计时评分系统和方法 | |
Ribeiro et al. | Driver gaze zone dataset with depth data | |
CN110222682B (zh) | 一种基于多特征的行人目标检测系统 | |
CN113065568A (zh) | 目标检测、属性识别与跟踪方法及系统 | |
CN109284759A (zh) | 一种基于支持向量机(svm)的魔方颜色识别方法 | |
CN205601704U (zh) | 一种红外全景环视系统 | |
CN111724349B (zh) | 一种基于hsv和svm的图像脏污识别方法 | |
WO2022088544A1 (zh) | 基于编码热红外标志的跟随机器人多目标识别系统及方法 | |
CN104809435B (zh) | 一种基于视觉一致性约束的图像目标分类方法 | |
US10360478B2 (en) | Systems and methods for inline object detection using a hue saturation value | |
CN113657183A (zh) | 一种基于多层特征的光滑神经网络下车辆24色识别方法 | |
CN210428488U (zh) | 一种基于多特征的行人目标检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |