CN104091152A - 大数据环境下的行人检测的方法 - Google Patents
大数据环境下的行人检测的方法 Download PDFInfo
- Publication number
- CN104091152A CN104091152A CN201410308037.0A CN201410308037A CN104091152A CN 104091152 A CN104091152 A CN 104091152A CN 201410308037 A CN201410308037 A CN 201410308037A CN 104091152 A CN104091152 A CN 104091152A
- Authority
- CN
- China
- Prior art keywords
- sample
- mrow
- class
- feature
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000691 measurement method Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 230000002349 favourable effect Effects 0.000 abstract description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000000746 body region Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种大数据环境下的行人检测的方法,步骤如下:1)将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征;2)使用汉明码距离相似性度量方法,计算特征相似性;3)根据特征的相似性对样本进行聚类,将样本分为多个类别;4)对于每一个类别分别进行训练,得到多个分类器模型;5)联合多个分类器对新样本进行测试。 本发明计算效率高,为实时处理提供了有利条件。
Description
技术领域
本发明涉及计算机视觉和模式识别领域,更具体地说,是一种在大数据环境下对行人检测的方法。
背景技术
行人检测是指在输入图像或者视频序列中将人体区域从背景中分割出来的过程。随着信息化时代的高速发展,图像数据规模日益增大,如何有效利用大规模图像数据进行行人检测,成为一个新的挑战。
大规模图像数据行人检测的主要难点在于数据规模庞大、数据维度高,对计算机的处理效率要求高,以及数据本身的低信噪比和弱配准。低信噪比是指人体数据中噪声所占比例较大而能够被用于对人体进行判别的信息相对较少。弱配准是指因人体形态上的差异而很难将人体的各个部分进行比较好的对齐。这些难点问题综合作用结果就是人体数据具有非常大的类内散度。因此如何从大规模图像数据中提取有效的特征信息对行人检测至关重要,直接影响到行人检测的准确率。
常见的行人检测特征提取方法有方向梯度直方图(Histogram of Oriented Gradient,HOG)、局部二值模式(Local Binary Pattern,LBP)、局部轮廓方向特征(Edgelet)等方法。HOG特征主要是通过刻画图像的局部梯度幅值和方向特征来描述行人,这种方法可以有效的提取人体的边缘特征,其缺点在于维度高、计算慢等;LBP是一种用于描 述图像局部纹理特征的算子,对于单调变化的灰度特征具有不变性,但是对于低分辨率的图像其判别能力较差;Edgelet主要是用于描述行人的局部轮廓方向特征,缺点主要是该特征的计算比较复杂。这些特征在大规模图像数据环境下表现为特征数据维度高,计算开销大,以及难以有效的描述行人的多变性。另外,在大规模图像数据下的行人检测需虑到大规模图像数据本身特征信息的相关性,直接训练分类器对行人进行检测,会使得特征本身对行人的描述能力不够强,检测准确率不高。
发明内容
本发明的目的在于针对大规模图像数据环境下的数据规模大和类内散度大的问题,提出一种随机特征的方法来对大规模图像数据进行聚类和训练分类器,最终完成在大规模图像数据环境下的行人检测的方法。
实现本发明目的的技术方案为:该方法主要包括以下步骤:
1)将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征;
2)使用汉明码距离相似性度量方法,计算特征相似性;
3)根据特征的相似性对样本进行聚类,将样本分为多个类别;
4)对于每一个类别分别进行训练,得到多个分类器模型;
5)联合多个分类器对新样本进行测试。
上述方法中,所述步骤1)中样本分为正例样本和反例样本,正 例样本是指含有行人的图像,反例样本是指不含有行人的图像。
所述步骤1)中计算样本图像的特征包括以下具体步骤:
11)针对样本图像随机初始化fn个的相同大小的区域块,fn的取值范围为1000~10000,每个区域块随机初始化tn个的坐标点对,这里可以设tn={4,8,16,32};
12)针对每一个区域块,计算坐标点对的像素差值,若差值大于自定义的阈值ρ,则该坐标点对的形成的特征值为1,若差值小于或等于自定义的阈值ρ则为0。每个区域块的特征是由0和1组成,长度为tn的序列;
13)对于每一个样本图像,计算fn个区域块的特征,所有区域块的特征最终形成样本图像的特征T,特征T是由fn个长度为tn的序列组成。
上述方法中,所述步骤2)中计算特征相似性包括以下具体步骤:
21)计算码长为tn的汉明码距离,并将其存储于查找表LUT中;
22)计算特征的汉明码距离,例如,对于样本图像Xi的特征Ti和样本图像Xj的特征Tj,计算公式如下:
其中,表示特征Ti第k段序列,表示特征Tj第k段序列,符号^表示异或运算,符号~表示取反运算。
上述方法中,所述步骤3)中样本聚类包括以下具体步骤:
31)正例样本聚类;
32)反例样本聚类。
上述方法中,所述步骤31)包括以下具体步骤:
311)初始化类个数为零,即c=0,类的特征向量为空,即V=NULL;
312)对于正例样本Xi的特征Ti,利用步骤2)分别计算Ti与现有类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
313)在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik}为负或小于阈值ρP则该样本归为新的一类,并且该类的特征向量为Vi。否则该样本归为第k类;
314)重复312)~313)直至计算完所有正样本,最终生成c个类别。
上述方法中,所述步骤32)包括以下具体步骤:
321)对于反例样本Xi的特征Ti,利用步骤2)分别计算Ti与c个类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
322)在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik}大于或等于阈值ρN则该样本归为第k类,否则该样本归为第c+1类;
323)重复321)~322)直至计算完所有负样本。
正例样本聚类后共得到c个类,反例样本聚类后共得到c+1个类,分别取正例样本的前c个类和反例样本的前c个类来训练分类器。
上述方法中,所述步骤4)训练分类器模型包括以下具体步骤:
41)对于第i类,分别将正例样本和反例样本的第i类对应所有样本特征载入libsvm分类器中,得到该类的分类器模型Mi;
42)重复步骤41)直至所有的类别都已经训练完。
上述方法中,所述步骤5)包括以下具体步骤:
51)对于每一个测试样本Xi,按照步骤1)提取特征Ti。选取所有c个分类器模型作为组合分类器;
52)将特征Ti载入到模型Mj中进行测试得到测试分数Sj;
53)重复步骤52)直至所有的模型已经测试完并且得到总分数:
54)若Sum大于0,则该样本测试为正例,否则该样本测试为反例;
55)重复上述步骤51)~步骤54)直至所有的样本测试完毕。
本发明与现有技术相比,其显著优点:为了实现从大规模图像数据中进行目标检测,先对大规模图像数据进行处理,即进行聚类。在大规模图像数据环境下根据目标特征的不同将其分为多个类,再分别对每一个类进行分类器训练,则在目标检测时能够提高计算效率。另外,本发明提出了采用像素周围的随机两点的深度差作为像素的特征,只涉及像素值的简单算术运算,计算效率高,为实时处理提供了有利条件。另外,该特征反映了像素周围的局域梯度信息,具有空间位置不变性。
附图说明
图1是基于大数据环境下的行人检测方法流程图。
图2是行人检测特征提取示意图。
图3是训练样本集生成聚类模型示意图
图4是测试样本集测试示意图。
图5是在大数据环境下的测试结果示意图。
具体实施方式
本发明的整体操作流程如图1所示。下面结合附图对本发明的具体实施方式作进一步详细说明。
本发明主要包括对训练样本聚类、训练分类器和应用分类器进行目标分类三个过程。
样本聚类的过程指通过已知的训练样本,根据其特征的不同将样本分为几个类别的过程。主要包括计算训练样本的随机特征和随机特征相似性度量,以及根据特征相似性进行聚类的过程,样本分为正例样本和反例样本,正例样本是指含有行人的图像,反例样本是指不含有行人的图像。
步骤1:将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征。
步骤11:针对样本图像随机初始化fn个的相同大小的区域块,fn的取值范围为1000~10000,每个区域块随机初始化tn个的坐标点对,这里可以设tn={4,8,16,32};
步骤12:针对每一个区域块,计算坐标点对的像素差值,若差 值大于在自定义的阈值ρ,则该坐标点对的形成的特征值为1,反之为0,因此,每个区域块的特征是由0和1组成,长度为tn的序列;
步骤13:对于每一个样本图像,计算fn个区域块的特征,所有区域块的特征最终形成样本图像的特征T。特征T是由fn个长度为tn的序列组成。如图2所示。
步骤2:使用汉明码距离相似性度量方法,计算特征相似性。
步骤21:计算码长为tn的汉明码距离,并将其存储于查找表LUT中;
步骤22:计算特征的汉明码距离,例如,对于样本图像Xi的特征Ti和样本图像Xj的特征Tj,计算公式如下:
其中,表示特征Ti第k段序列,表示特征Tj第k段序列,符号^表示开方运算,符号~表示取反运算。
步骤3:根据特征的相似性对样本进行聚类,将样本分为多个类别。
步骤31:正例样本聚类;
步骤311:初始化类个数为零,即c=0,类的特征向量为空,即V=NULL;
步骤312:对于正例样本Xi的特征Ti,利用步骤2分别计算Ti与现有类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
步骤313:在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik} 为负或小于阈值ρP则该样本归为新的一类,并且该类的特征向量为Vi。否则该样本归为第k类;
步骤314:重复步骤312~步骤313直至计算完所有正样本,最终生成c个类。
步骤32:反例样本聚类。
步骤321:对于反例样本Xi的特征Ti,利用步骤2分别计算Ti与c个类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
步骤322:在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik}大于或等于阈值ρN则该样本归为第k类,否则该样本归为第c+1类;
步骤323:重复步骤321~步骤322直至计算完所有负样本;
正例样本共得到c个类,反例样本共得到c+1个类,取正例样本的前c个类和反例样本的前c个类来训练分类器。
步骤4:针对每一个类别分别进行训练,得到多个分类器模型。
步骤41:对于第i类,分别将正例样本和反例样本的第i类对应所有样本特征载入libsvm分类器中,得到该类的分类器模型Mi;
步骤42:重复步骤41直至所有的类都已经训练完,如图3所示。
步骤5:联合多个分类器对新样本进行测试。
步骤51:对于每一个测试样本Xi,按照步骤1提取特征Ti。选取所有c个分类器模型作为组合分类器,如图4所示;
步骤52:将特征Ti载入到模型Mj中进行测试得到测试分数Sj;
步骤53:重复步骤52直至所有的模型已经测试完并且得到总分 数:
步骤54:若Sum大于0,则该样本测试为正例,否则该样本测试为反例;
步骤55:重复上述步骤51~步骤54直至所有的样本测试完毕。
测试结果如图5所示。其中纵坐标miss rate表示将正例样本误检为反例样本的个数占所有正例样本的比率,横坐标FPPW表示将反例样本误检为正例样本的个数占所有反例样本的比率。从图5中可以看到,分类器表现出良好的性能。在FPPW为10-2时,误检率为6.3%,在FPPW为10-3时,误检率为19.2%。
Claims (8)
1.一种大数据环境下的行人检测的方法,其特征在于步骤如下:
1)将所选取的训练样本图像统一为相同尺寸大小的图像,计算样本图像的特征;
2)使用汉明码距离相似性度量方法,计算特征相似性;
3)根据特征的相似性对样本进行聚类,将样本分为多个类别;
4)对于每一个类别分别进行训练,得到多个分类器模型;
5)联合多个分类器对新样本进行测试。
2.根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤1)包括以下具体步骤:
11)针对样本图像随机初始化fn个的相同大小的区域块,fn的取值范围为1000~10000,每个区域块随机初始化tn个的坐标点对,设tn={4,8,16,32};
12)针对每一个区域块,计算坐标点对的像素差值,若差值大于自定义的阈值ρ,则该坐标点对的形成的特征值为1,若差值小于或等于自定义的阈值ρ则为0,因此,每个区域块的特征是由0和1组成,长度为tn的序列;
13)对于每一个样本图像,计算fn个区域块的特征,所有区域块的特征最终形成样本图像的特征T,特征T是由fn个长度为tn的序列组成。
3.根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤2)计算特征相似性包括以下具体步骤:
21)计算码长为tn的汉明码距离,并将其存储于查找表LUT中;
22)计算特征的汉明码距离,对于样本图像Xi的特征Ti和样本图像Xj的特征Tj,计算公式如下:
其中,表示特征Ti第k段序列,表示特征Tj第k段序列,符号^表示异或运算,符号~表示取反运算。
4.根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:样本分为正例样本和反例样本,正例样本是指含有行人的图像,反例样本是指不含有行人的图像,所述步骤3)样本聚类包括以下具体步骤:
31)正例样本聚类;
32)反例样本聚类。
5.根据权利要求4所述的大数据环境下的行人检测的方法,其特征在于:所述步骤31)包括以下具体步骤:
311)初始化类个数为零,即c=0,类的特征向量为空,即V=NULL;
312)对于正例样本Xi的特征Ti,利用步骤2)分别计算Ti与现有类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
313)在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik}为负或小于阈值ρP则该样本归为新的一类,并且该类的特征向量为Vi,否则该样本归为第k类;
314)重复312)~313)直至计算完所有正样本,最终生成c个类别。
6.根据权利要求4所述大数据环境下的行人检测的方法,其特征在于:所述步骤32)包括以下具体步骤:
321)对于反例样本Xi的特征Ti,利用步骤2)分别计算Ti与c个类的特征向量Vj的汉明码距离Dij,j=0,1,...c;
322)在Dij,j=0,1,...c中,其最大值记为Max{Dik},若Max{Dik}大于或等于阈值ρN则该样本归为第k类,否则该样本归为第c+1类;
323)重复321)~322)直至计算完所有负样本。
7.根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤4)训练分类器模型包括以下具体步骤:
41)对于第i类,分别将正例样本和反例样本的第i类对应所有样本特征载入libsvm分类器中,得到该类的分类器模型Mi;
42)重复步骤41)直至所有的类别都已经训练完。
8.根据权利要求1所述的大数据环境下的行人检测的方法,其特征在于:所述步骤5)包括以下具体步骤:
51):对于每一个测试样本Xi,按照步骤1)提取特征Ti,选取所有c个分类器模型作为组合分类器;
52):将特征Ti载入到模型Mj中进行测试得到测试分数Sj;
53):重复步骤52)直至所有的模型已经测试完并且得到总分数:
54):若Sum大于0,则该样本测试为正例,否则该样本测试为反例;
55):重复上述步骤51)~步骤54)直至所有的样本测试完毕。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308037.0A CN104091152A (zh) | 2014-06-30 | 2014-06-30 | 大数据环境下的行人检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308037.0A CN104091152A (zh) | 2014-06-30 | 2014-06-30 | 大数据环境下的行人检测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104091152A true CN104091152A (zh) | 2014-10-08 |
Family
ID=51638867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410308037.0A Pending CN104091152A (zh) | 2014-06-30 | 2014-06-30 | 大数据环境下的行人检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104091152A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657665A (zh) * | 2015-03-12 | 2015-05-27 | 四川神琥科技有限公司 | 一种文件处理方法 |
CN109189959A (zh) * | 2018-09-06 | 2019-01-11 | 腾讯科技(深圳)有限公司 | 一种构建图像数据库的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661559A (zh) * | 2009-09-16 | 2010-03-03 | 中国科学院计算技术研究所 | 一种数字图像训练和检测方法 |
CN102810161A (zh) * | 2012-06-07 | 2012-12-05 | 江苏物联网研究发展中心 | 一种用于拥挤场景下的多个行人检测方法 |
CN103049751A (zh) * | 2013-01-24 | 2013-04-17 | 苏州大学 | 一种改进的加权区域匹配高空视频行人识别方法 |
CN103413145A (zh) * | 2013-08-23 | 2013-11-27 | 南京理工大学 | 基于深度图像的关节点定位方法 |
-
2014
- 2014-06-30 CN CN201410308037.0A patent/CN104091152A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101661559A (zh) * | 2009-09-16 | 2010-03-03 | 中国科学院计算技术研究所 | 一种数字图像训练和检测方法 |
CN102810161A (zh) * | 2012-06-07 | 2012-12-05 | 江苏物联网研究发展中心 | 一种用于拥挤场景下的多个行人检测方法 |
CN103049751A (zh) * | 2013-01-24 | 2013-04-17 | 苏州大学 | 一种改进的加权区域匹配高空视频行人识别方法 |
CN103413145A (zh) * | 2013-08-23 | 2013-11-27 | 南京理工大学 | 基于深度图像的关节点定位方法 |
Non-Patent Citations (1)
Title |
---|
LI ZHANG ET AL: "detection and tracking of multiple humans with extensive pose articulation", 《IEEE 11TH INTERNATIONAL CONFERENCE ON COMPUTER VISION 2007》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657665A (zh) * | 2015-03-12 | 2015-05-27 | 四川神琥科技有限公司 | 一种文件处理方法 |
CN104657665B (zh) * | 2015-03-12 | 2017-12-08 | 四川神琥科技有限公司 | 一种文件处理方法 |
CN109189959A (zh) * | 2018-09-06 | 2019-01-11 | 腾讯科技(深圳)有限公司 | 一种构建图像数据库的方法及装置 |
CN109189959B (zh) * | 2018-09-06 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 一种构建图像数据库的方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109753914B (zh) | 一种基于深度学习的车牌字符识别方法 | |
CN105809198B (zh) | 基于深度置信网络的sar图像目标识别方法 | |
CN104091147B (zh) | 一种近红外眼睛定位及眼睛状态识别方法 | |
CN109815956B (zh) | 一种基于自适应位置分割的车牌字符识别方法 | |
CN105574063B (zh) | 基于视觉显著性的图像检索方法 | |
CN107633226B (zh) | 一种人体动作跟踪特征处理方法 | |
CN110348319A (zh) | 一种基于人脸深度信息和边缘图像融合的人脸防伪方法 | |
CN106156777B (zh) | 文本图片检测方法及装置 | |
CN102867195B (zh) | 一种遥感图像多类目标检测和识别方法 | |
CN110569738A (zh) | 基于密集连接网络的自然场景文本检测方法、设备和介质 | |
CN108021890B (zh) | 一种基于plsa和bow的高分遥感影像港口检测方法 | |
Thalji et al. | Iris Recognition using robust algorithm for eyelid, eyelash and shadow avoiding | |
CN107862680B (zh) | 一种基于相关滤波器的目标跟踪优化方法 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN107886539B (zh) | 一种工业场景下高精度齿轮视觉检测方法 | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 | |
Soon et al. | Malaysian car number plate detection and recognition system | |
Lin et al. | A traffic sign recognition method based on deep visual feature | |
CN104063682A (zh) | 一种基于边缘分级和centrist特征的行人检测方法 | |
CN106548195A (zh) | 一种基于改进型hog‑ulbp特征算子的目标检测方法 | |
CN104537392A (zh) | 一种基于判别性语义部件学习的对象检测方法 | |
CN104091152A (zh) | 大数据环境下的行人检测的方法 | |
CN104517300A (zh) | 基于颜色统计特征的视觉判别跟踪方法 | |
CN115937492B (zh) | 一种基于特征识别的变电设备红外图像识别方法 | |
Kavitha et al. | A robust script identification system for historical Indian document images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141008 |
|
RJ01 | Rejection of invention patent application after publication |