CN108256481A - 一种利用身体上下文的行人头部检测方法 - Google Patents
一种利用身体上下文的行人头部检测方法 Download PDFInfo
- Publication number
- CN108256481A CN108256481A CN201810048350.3A CN201810048350A CN108256481A CN 108256481 A CN108256481 A CN 108256481A CN 201810048350 A CN201810048350 A CN 201810048350A CN 108256481 A CN108256481 A CN 108256481A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- model
- head
- detection
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种利用身体上下文的行人头部检测方法,其步骤为:数据准备,对图像的每一个行人标注行人整体框、上半身框、头肩框以及头部框,共四个外界矩形框;模型设计,将深度卷积神经网络、行人全身候选框生成网络、难例挖掘模块以及由全身特征到局部的检测网络组成模型;模型训练,将训练集输入到上述模型中进行训练,利用校验集验证模型训练效果;训练完成获得模型M’;模型测试,以得到检测结果。本发明将难例挖掘、更精细的多尺寸融合特征与由全身到局部的检测框架配合使用,极大地提高了行人头部检测的精度;并且使用了更加轻量级的特征提取卷积神经网络,使得在保存较高检测精度下,在GPU上能够达到准实时的检测速度。
Description
技术领域
本发明涉及一种检测方法,尤其涉及一种利用身体上下文的行人头部检测方法,属于计算机视觉技术领域。
背景技术
行人头部检测广泛应用在公共区域人流统计、人脸检测和行人监控等应用场景。目前头部检测方法大多基于手工设计的特征和支持向量机分类器框架。主要方法有:
1)基于模板的梯度特征和支持向量机(SVM)的头部检测。其主要技术手段为:提取第i个感兴趣区域(ROI)图像的基于模板的梯度特征(TGF),并用SVM对这些特征进行分类。问题及缺点为:该法对于不同的角度、不同的光照很敏感,容易造成误检;其次,对于高度非线性的特征,SVM不能有效的分类。
2)基于特征值的椭圆模型头部检测。其主要技术手段为:采用投影矩阵对二值图像中的检测区域进行椭圆模型的特征值提取,判断检测区域的特征值是否符合椭圆模型。问题及缺点为:椭圆模型头部检测只对头部轮廓比较清晰、头部尺寸较大时的检测比较鲁棒,而对圆形或者椭圆形的非头部物体不能够有效的区分。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种利用身体上下文的行人头部检测方法。
为了解决以上技术问题,本发明采用的技术方案是:一种利用身体上下文的行人头部检测方法,其整体步骤为:
步骤S1、数据准备阶段:
对图像的每一个行人标注行人整体框、上半身框、头肩框以及头部框,共四个外界矩形框;
步骤S2、模型设计阶段:
a、模型由以下部分组成:深度卷积神经网络P、行人全身候选框生成网络RPN、难例挖掘模块以及由全身特征到局部的检测网络;
b、对于输入的图像I,利用深度卷积神经网络P提取精细的多尺度融合特征F;
c、将精细的多尺度融合特征F输入到行人全身候选框生成网络RPN,由RPN网络生成大量的行人全身候选框;难例挖掘模块在通过提前计算大量行人候选框的分类和回归损失之和来挑选出难例参与到网络的训练,使得检测网络能够更加侧重于难例的检测;
d、通过RPN网络和难例挖掘模块产生的行人全身候选框,在多尺度融合特征F上采样相应的行人全身特征,得到行人全身特征X;
e、将行人全身特征X输入到由全身特征到局部的检测网络中,得到行人头部检测框;
步骤S3、模型训练阶段:
a、将步骤S1获得的带有行人全身、上半身、头肩和头部外接矩形框标注的行人图像集合D分为训练集T和校验集V;
b、将训练集T输入到步骤S2设计的模型中,利用批次随机梯度下降方法进行模型训练,监督信号为行人全身、上半身、头肩和头部外接矩形框标注;利用校验集V验证模型训练效果,即当模型在校验集V上获得较好的头部检测精度并且该精度不能随着训练过程再提升时,停止训练;
c、最终训练完成获得模型M’。
步骤S4、模型测试阶段:
输入图像为包含行人的图像I,将图像I输入步骤S3获得的模型M’中,以得到该行人头部的检测结果。
本发明将难例挖掘、更精细的多尺寸融合特征与由全身到局部的检测框架配合使用,极大地提高了行人头部检测的精度;并且使用了更加轻量级的特征提取卷积神经网络,使得在保存较高检测精度下,在图形处理器(GPU)上能够达到准实时的检测速度。
附图说明
图1为RGB图像上的行人标注示例图。
图2为本发明的整体步骤流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
一种利用身体上下文的行人头部检测方法,其整体步骤如下:
步骤S1、数据准备阶段:
对RGB图像的每一个行人标注行人整体框、上半身框、头肩框和头部框,一共4个外界矩形框。RGB图像上的标注示例如图1所示。
步骤S2、模型设计阶段:
a、进行端到端的模型设计,使模型由以下部分组成:深度卷积神经网络P、行人全身候选框生成网络RPN、难例挖掘模块以及由全身特征到局部的检测网络;其中,由全身特征到局部的检测网络包含身体上下文检测模块和可对特征提取结果进行优化的优化模块,如图2所示;将整个模型记为M;
b、对于输入的图像I,利用深度卷积神经网络P提取精细的多尺度融合特征F;
c、将精细的多尺度融合特征F输入到行人全身候选框生成网络RPN,RPN网络生成大量的行人全身候选框,难例挖掘模块在通过提前计算大量行人候选框的分类和回归损失之和来挑选出难例参与到网络的训练,使得检测网络能够更加侧重于难例的检测;
d、通过RPN网络和难例挖掘模块产生的行人全身候选框,在多尺度融合特征F上采样相应的行人全身特征,得到行人全身特征X;
e、将行人全身特征X输入到由全身特征到局部的检测网络中,得到行人头部检测框。
步骤S3、模型训练阶段:
a、将步骤S1获得的带有行人全身、上半身、头肩和头部外接矩形框标注的行人图像集合D分为训练集T和校验集V;
b、将训练集T输入到步骤S2设计的模型M中,利用批次随机梯度下降方法进行模型训练,监督信号为行人全身、上半身、头肩和头部外接矩形框标注;利用校验集V验证模型训练效果,即当模型在校验集V上获得较好的头部检测精度并且该精度不能随着训练过程再提升时,停止训练;
c、最终训练完成获得模型M’。
步骤S4、模型测试阶段:
输入图像为包含行人的图像I,将图像I输入步骤S3获得的模型M’中,以得到该行人头部的检测结果。
本发明与现有技术相比,具有以下关键点及优势:
1)难例挖掘:通过提前计算大量行人候选框的分类和回归损失之和来挑选出难例参与到网络的训练,使得检测网络能够更加侧重于难例的检测;
2)更精细的多尺寸融合特征:通过反卷积上采样多尺寸的特征并融合,得到更精细的多尺度融合特征;通过该特征能够更加有效的检测到不同尺寸的行人头部;
3)由全身到局部的检测框架:该检测方法特点在于由全身到局部的学习行人全身、上半身、头肩和头部的信息,从而提高行人头部检测的准确率。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。
Claims (1)
1.一种利用身体上下文的行人头部检测方法,其特征在于:所述方法的整体步骤为:
步骤S1、数据准备阶段:
对图像的每一个行人标注行人整体框、上半身框、头肩框以及头部框,共四个外界矩形框;
步骤S2、模型设计阶段:
a、模型由以下部分组成:深度卷积神经网络P、行人全身候选框生成网络RPN、难例挖掘模块以及由全身特征到局部的检测网络;
b、对于输入的图像I,利用深度卷积神经网络P提取精细的多尺度融合特征F;
c、将精细的多尺度融合特征F输入到行人全身候选框生成网络RPN,由RPN网络生成大量的行人全身候选框;难例挖掘模块在通过提前计算大量行人候选框的分类和回归损失之和来挑选出难例参与到网络的训练,使得检测网络能够更加侧重于难例的检测;
d、通过RPN网络和难例挖掘模块产生的行人全身候选框,在多尺度融合特征F上采样相应的行人全身特征,得到行人全身特征X;
e、将行人全身特征X输入到由全身特征到局部的检测网络中,得到行人头部检测框;
步骤S3、模型训练阶段:
a、将步骤S1获得的带有行人全身、上半身、头肩和头部外接矩形框标注的行人图像集合D分为训练集T和校验集V;
b、将训练集T输入到步骤S2设计的模型中,利用批次随机梯度下降方法进行模型训练,监督信号为行人全身、上半身、头肩和头部外接矩形框标注;利用校验集V验证模型训练效果,即当模型在校验集V上获得较好的头部检测精度并且该精度不能随着训练过程再提升时,停止训练;
c、最终训练完成获得模型M’;
步骤S4、模型测试阶段:
输入图像为包含行人的图像I,将图像I输入步骤S3获得的模型M’中,以得到该行人头部的检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810048350.3A CN108256481A (zh) | 2018-01-18 | 2018-01-18 | 一种利用身体上下文的行人头部检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810048350.3A CN108256481A (zh) | 2018-01-18 | 2018-01-18 | 一种利用身体上下文的行人头部检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108256481A true CN108256481A (zh) | 2018-07-06 |
Family
ID=62741228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810048350.3A Pending CN108256481A (zh) | 2018-01-18 | 2018-01-18 | 一种利用身体上下文的行人头部检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256481A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145770A (zh) * | 2018-08-01 | 2019-01-04 | 中国科学院合肥物质科学研究院 | 一种基于多尺度特征融合网络与定位模型相结合的麦蜘蛛自动计数方法 |
CN109803090A (zh) * | 2019-01-25 | 2019-05-24 | 睿魔智能科技(深圳)有限公司 | 无人拍摄自动变焦方法及系统、无人摄像机及存储介质 |
CN110135243A (zh) * | 2019-04-02 | 2019-08-16 | 上海交通大学 | 一种基于两级注意力机制的行人检测方法及系统 |
CN111814885A (zh) * | 2020-07-10 | 2020-10-23 | 云从科技集团股份有限公司 | 一种管理图像框的方法、系统、设备及介质 |
CN112101139A (zh) * | 2020-08-27 | 2020-12-18 | 普联国际有限公司 | 人形检测方法、装置、设备及存储介质 |
CN112597943A (zh) * | 2020-12-28 | 2021-04-02 | 北京眼神智能科技有限公司 | 行人重识别的特征提取方法及装置、电子设备、存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050117779A1 (en) * | 2003-11-27 | 2005-06-02 | Konica Minolta Holdings, Inc. | Object detection apparatus, object detection method and computer program product |
CN101350064A (zh) * | 2008-08-29 | 2009-01-21 | 北京中星微电子有限公司 | 二维人体姿态估计方法及装置 |
CN102169543A (zh) * | 2011-04-15 | 2011-08-31 | 苏州市慧视通讯科技有限公司 | 基于多源信息融合和在线学习的人头计数方法 |
CN105335716A (zh) * | 2015-10-29 | 2016-02-17 | 北京工业大学 | 一种基于改进udn提取联合特征的行人检测方法 |
CN106874894A (zh) * | 2017-03-28 | 2017-06-20 | 电子科技大学 | 一种基于区域全卷积神经网络的人体目标检测方法 |
-
2018
- 2018-01-18 CN CN201810048350.3A patent/CN108256481A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050117779A1 (en) * | 2003-11-27 | 2005-06-02 | Konica Minolta Holdings, Inc. | Object detection apparatus, object detection method and computer program product |
CN101350064A (zh) * | 2008-08-29 | 2009-01-21 | 北京中星微电子有限公司 | 二维人体姿态估计方法及装置 |
CN102169543A (zh) * | 2011-04-15 | 2011-08-31 | 苏州市慧视通讯科技有限公司 | 基于多源信息融合和在线学习的人头计数方法 |
CN105335716A (zh) * | 2015-10-29 | 2016-02-17 | 北京工业大学 | 一种基于改进udn提取联合特征的行人检测方法 |
CN106874894A (zh) * | 2017-03-28 | 2017-06-20 | 电子科技大学 | 一种基于区域全卷积神经网络的人体目标检测方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145770A (zh) * | 2018-08-01 | 2019-01-04 | 中国科学院合肥物质科学研究院 | 一种基于多尺度特征融合网络与定位模型相结合的麦蜘蛛自动计数方法 |
CN109803090A (zh) * | 2019-01-25 | 2019-05-24 | 睿魔智能科技(深圳)有限公司 | 无人拍摄自动变焦方法及系统、无人摄像机及存储介质 |
CN110135243A (zh) * | 2019-04-02 | 2019-08-16 | 上海交通大学 | 一种基于两级注意力机制的行人检测方法及系统 |
CN110135243B (zh) * | 2019-04-02 | 2021-03-19 | 上海交通大学 | 一种基于两级注意力机制的行人检测方法及系统 |
CN111814885A (zh) * | 2020-07-10 | 2020-10-23 | 云从科技集团股份有限公司 | 一种管理图像框的方法、系统、设备及介质 |
CN112101139A (zh) * | 2020-08-27 | 2020-12-18 | 普联国际有限公司 | 人形检测方法、装置、设备及存储介质 |
CN112101139B (zh) * | 2020-08-27 | 2024-05-03 | 普联国际有限公司 | 人形检测方法、装置、设备及存储介质 |
CN112597943A (zh) * | 2020-12-28 | 2021-04-02 | 北京眼神智能科技有限公司 | 行人重识别的特征提取方法及装置、电子设备、存储介质 |
CN112597943B (zh) * | 2020-12-28 | 2024-08-20 | 北京眼神智能科技有限公司 | 行人重识别的特征提取方法及装置、电子设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256481A (zh) | 一种利用身体上下文的行人头部检测方法 | |
WO2021208275A1 (zh) | 一种交通视频背景建模方法及系统 | |
CN104834898B (zh) | 一种人物摄影图像的质量分类方法 | |
CN108961675A (zh) | 基于卷积神经网络的跌倒检测方法 | |
CN107945153A (zh) | 一种基于深度学习的路面裂缝检测方法 | |
CN109064461A (zh) | 一种基于深度学习网络的钢轨表面缺陷检测方法 | |
TWI396143B (zh) | 照片分割方法及系統及照片之影像配合方法 | |
CN110222628A (zh) | 一种基于生成式对抗网络的人脸修复方法 | |
CN108830252A (zh) | 一种融合全局时空特征的卷积神经网络人体动作识别方法 | |
CN108596046A (zh) | 一种基于深度学习的细胞检测计数方法及系统 | |
CN109657612B (zh) | 一种基于人脸图像特征的质量排序系统及其使用方法 | |
CN103810491B (zh) | 融合深度和灰度图像特征点的头姿估计兴趣点检测方法 | |
CN110807775A (zh) | 基于人工智能的中医舌像分割装置、方法及存储介质 | |
CN106096542A (zh) | 基于距离预测信息的图像视频场景识别方法 | |
CN110689000B (zh) | 一种基于生成复杂环境下车牌样本的车辆车牌识别方法 | |
CN104615996B (zh) | 一种多视角二维人脸特征点自动定位方法 | |
CN110599463B (zh) | 一种基于轻量级联神经网络的舌像检测及定位算法 | |
CN105447859A (zh) | 一种田间麦蚜虫计数方法 | |
CN108256462A (zh) | 一种商场监控视频中的人数统计方法 | |
CN110490099A (zh) | 一种基于机器视觉的地铁公共地点人流量分析方法 | |
CN107657225A (zh) | 一种基于聚合通道特征的行人检测方法 | |
CN108416304B (zh) | 一种利用上下文信息的三分类人脸检测方法 | |
CN110543848B (zh) | 一种基于三维卷积神经网络的驾驶员动作识别方法及装置 | |
CN110533026A (zh) | 基于计算机视觉的电竞图像数字与图标信息获取方法 | |
CN112613428B (zh) | 基于平衡损失的Resnet-3D卷积牛视频目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |