CN112183164A - 一种监控视频下的行人属性识别方法 - Google Patents
一种监控视频下的行人属性识别方法 Download PDFInfo
- Publication number
- CN112183164A CN112183164A CN201910599026.5A CN201910599026A CN112183164A CN 112183164 A CN112183164 A CN 112183164A CN 201910599026 A CN201910599026 A CN 201910599026A CN 112183164 A CN112183164 A CN 112183164A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- attribute
- classification
- grained
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种监控视频下的行人属性识别方法,首先采用行人检测技术,对视频中的行人和背景进行区分,并且提取出包含行人部分的图像,再进一步通过行人属性检测技术,对行人属性的粗粒度属性,包括头部、上身、下身、鞋子和附属物进行检测并提取相应部位的图像,最后选用多分类网络对检测到的每个粗粒度属性部位进行细粒度分类,选择置信度最大的属性类别作为最终结果。本发明在行人属性识别的精确度上相对于以往方法有所提高,用于安防领域,有利于监控人员在海量视频中快速检索可疑目标,节省了大量时间和精力。
Description
技术领域
本发明涉及智能视频监控、计算机视觉领域,具体涉及一种监控视频下的行人属性识别方法,主要应用于安防项目中视频监控。
背景技术
近年来,随着硬件设施的进步及算法的改进,机器学习、神经网络和人工智能逐渐普遍应用于解决各类实际问题,并且在各种传统计算机视觉领域有杰出的表现。很多学者就将卷积神经网络延伸使用在了行人属性识别的领域,大部分学者在解决行人属性识别时都采用神经网络的方法,其中包括Sudowe等人提出的ACN行人属性分类模型,Li Dangwei等人提出的DeepSAR多个单分类网络和DeepMAR单向量输入网络,中科院李子青团队提出的MLCNN端到端网络模型。这些方法主要都是通过多次训练网络模型参数,通过直接输入图像直接分类得到行人属性,存在以下不足:
1、没有对属性位置的精确检测,从而造成识别结果不准确;
2、没有考虑属性之间的关联性,仅仅完成分类任务;
3、训练网络的数据集较小,不具有代表性。
造成这些缺陷的原因一方面是硬件和数据支撑欠缺,另一方面是采用的方法只针对分类问题,而没有考虑问题的大背景和解决问题的其他因素。
发明内容
本发明针对解决监控视频下行人属性识别的难题,提供一种监控视频下的行人属性识别方法,采用检测与多属性分类相结合的思想,追加一层根据属性之间的关联性辅助优化分类结果的网络层,基于符合实际监控场景的数据集对网络进行训练,用实际监控视频对训练得到的参数进行测试。
本发明的技术方案如下:
一种监控视频下的行人属性识别方法,其特征在于:首先采用行人检测技术,对视频中的行人和背景进行区分,并且提取出包含行人部分的图像,再进一步通过行人属性检测技术,对行人属性的粗粒度属性,包括头部、上身、下身、鞋子和附属物进行检测并提取相应部位的图像,最后选用多分类网络对检测到的每个粗粒度属性部位进行细粒度分类,选择置信度最大的属性类别作为最终结果。
上述方法中,对于视频中的行人检测选择使用目标检测技术YOLO;对于行人属性的检测采用Faster-RCNN;在属性分类时采用AlexNet;最后在分类之后叠加线性计算层,增强某些属性的置信度。
本发明在行人属性识别的精确度上相对于以往方法有所提高,在相同数据测试集的情况下,本发明与现有技术在某些属性准确率的对照如下表:
网络 | Acc | Prec | Rec | F1 |
ACN | 73.66 | 84.06 | 81.26 | 82.64 |
DeepMAR | 75.07 | 83.68 | 83.14 | 83.41 |
本专利方法 | 75.40 | 87.11 | 81.07 | 83.98 |
本发明在安防领域,可以解决监控视频中的行人属性识别问题,有利于监控人员在海量视频中快速检索可疑目标,节省了大量时间和精力。对于公安来说,提高了监控系统侦测嫌疑人的能力,从而加速了警方的破案进程。另外,通过对识别的属性的检索,监控人员可以更方便得找到目标所在视频段,了解异常行为或案发过程。
对于多属性识别研究现状来说,虽然多属性识别的效果无法与单张图片标签和人脸识别分类的准确率相提并论,但是这也同时说明针对多分类问题,有很大的提升空间。本发明将为其他监控视频方面的课题,如视频摘要、视频检索、行人重识别等打下坚实的数据基础。
具体实施方式
本发明对于监控视频,首先采用视频中的行人检测技术,对视频中的行人和背景进行区分,并且提取出包含行人部分的图像,再进一步通过较为精确的行人属性检测技术,对行人属性的粗粒度属性头部、上身、下身、鞋子和附属物进行检测并提取相应部位的图像。最后选用多分类网络对检测到的每个粗粒度属性部位进行细粒度分类(如具体的夹克、羽绒服、T恤),选择置信度最大的属性类别作为最终结果。
本发明对于视频中的行人检测选择使用最新的目标检测技术YOLOv3。YOLO系列算法有以下特点:YOLO训练和检测均是在一个单独网络中进行,没有显示地求取建议区域的过程,减少了大量的运算时间;YOLO将物体检测作为一个回归问题进行求解,输入图像经过一次预测,便能得到图像中所有物体的位置和其所属类别及相应的置信概率。因此。这种检测方法可以满足实时高效的需求。
对于行人属性的检测选用Faster-RCNN,Faster-RCNN在VOC2007上的平均准确率能达到73%。Faster-RCNN主要采用了区域建议网络的思想,提取特征后网络可以给出多个建议区域,再对这些区域中的特征进行进一步分类,有助于精确检测属性的各个部位,为分类打下坚实的基础。
在属性分类时选用AlexNet,AlexNet网络结构模型赢得了2012届图像识别大赛的冠军,虽然网络层数较浅但是分类速度快,准确率高。
最后在分类之后叠加线性计算层,增强某些属性的置信度。例如女性性别可以与长发,背包,裙子,红色衣服产生关联。
Claims (2)
1.一种监控视频下的行人属性识别方法,其特征在于:首先采用行人检测技术,对视频中的行人和背景进行区分,并且提取出包含行人部分的图像,再进一步通过行人属性检测技术,对行人属性的粗粒度属性,包括头部、上身、下身、鞋子和附属物进行检测并提取相应部位的图像,最后选用多分类网络对检测到的每个粗粒度属性部位进行细粒度分类,选择置信度最大的属性类别作为最终结果。
2.根据权利要求1所述的监控视频下的行人属性识别方法,其特征在于:对于视频中的行人检测选择使用目标检测技术YOLO;对于行人属性的检测采用Faster-RCNN;在属性分类时采用AlexNet;最后在分类之后叠加线性计算层,增强某些属性的置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599026.5A CN112183164A (zh) | 2019-07-04 | 2019-07-04 | 一种监控视频下的行人属性识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910599026.5A CN112183164A (zh) | 2019-07-04 | 2019-07-04 | 一种监控视频下的行人属性识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112183164A true CN112183164A (zh) | 2021-01-05 |
Family
ID=73915537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910599026.5A Pending CN112183164A (zh) | 2019-07-04 | 2019-07-04 | 一种监控视频下的行人属性识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183164A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113361319A (zh) * | 2021-04-02 | 2021-09-07 | 中国电子科技集团公司第五十四研究所 | 一种基于目标检测和人员属性识别的室内场景探测方法 |
CN115131825A (zh) * | 2022-07-14 | 2022-09-30 | 北京百度网讯科技有限公司 | 人体属性的识别方法、装置、电子设备和存储介质 |
-
2019
- 2019-07-04 CN CN201910599026.5A patent/CN112183164A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113361319A (zh) * | 2021-04-02 | 2021-09-07 | 中国电子科技集团公司第五十四研究所 | 一种基于目标检测和人员属性识别的室内场景探测方法 |
CN115131825A (zh) * | 2022-07-14 | 2022-09-30 | 北京百度网讯科技有限公司 | 人体属性的识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | Detection of workers without the helments in videos based on YOLO V3 | |
CN107230267B (zh) | 基于人脸识别算法的幼儿园智能签到方法 | |
CN105787472B (zh) | 一种基于时空拉普拉斯特征映射学习的异常行为检测方法 | |
D'Angelo et al. | People re-identification in camera networks based on probabilistic color histograms | |
CN106331636A (zh) | 基于行为事件触发的输油管道智能视频监控系统及方法 | |
CN104077605A (zh) | 一种基于颜色拓扑结构的行人搜索识别方法 | |
CN109522853A (zh) | 面向监控视频的人脸检测与搜索方法 | |
CN106682573B (zh) | 一种单摄像头的行人跟踪方法 | |
CN110378179A (zh) | 基于红外热成像的地铁逃票行为检测方法及系统 | |
CN106355154B (zh) | 一种监控视频中检测频繁过人的方法 | |
CN107688830B (zh) | 一种用于案件串并的现勘视觉信息关联图层生成方法 | |
CN109271932A (zh) | 基于颜色匹配的行人再识别方法 | |
CN110728216A (zh) | 一种基于行人属性自适应学习的无监督行人再识别方法 | |
CN106127812A (zh) | 一种基于视频监控的客运站非出入口区域的客流统计方法 | |
CN110569843A (zh) | 一种矿井目标智能检测与识别方法 | |
CN111738218A (zh) | 人体异常行为识别系统及方法 | |
CN113362374A (zh) | 一种基于目标跟踪网络的高空抛物检测方法及系统 | |
CN115527269B (zh) | 一种人体姿态图像智能识别方法及系统 | |
CN112528823B (zh) | 一种基于关键帧检测和语义部件分割的条斑鲨运动行为分析方法及系统 | |
CN106778637B (zh) | 一种对男女客流的统计方法 | |
CN112183164A (zh) | 一种监控视频下的行人属性识别方法 | |
CN109583339A (zh) | 一种基于图像处理的atm视频智能监控方法 | |
CN113191273A (zh) | 基于神经网络的油田井场视频目标检测与识别方法及系统 | |
CN112417937A (zh) | 一种基于时间序列的变电站视频目标检测方法 | |
CN115169673A (zh) | 一种智慧校园疫情风险监测与预警系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210105 |