CN109726621B - 行人检测方法、装置及设备 - Google Patents
行人检测方法、装置及设备 Download PDFInfo
- Publication number
- CN109726621B CN109726621B CN201711049699.0A CN201711049699A CN109726621B CN 109726621 B CN109726621 B CN 109726621B CN 201711049699 A CN201711049699 A CN 201711049699A CN 109726621 B CN109726621 B CN 109726621B
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- identified
- region
- determining
- kinds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明提出一种行人检测方法、装置及设备,其中方法包括:利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;分别确定N种特征向量与对应的N种分类器间的N个匹配度,其中,N种分类器分别对应N种行人姿态;根据N个匹配度的大小,确定待识别区域中是否包括行人。本发明的行人检测方法有效提高了对行人的检测准确度和识别率。
Description
技术领域
本发明涉及计算机和图像处理技术领域,尤其涉及一种行人检测方法、装置及设备。
背景技术
现如今,为了提高汽车行驶过程中的安全性,各生产商开始致力于开发更加安全可靠的汽车辅助系统。其中,基于视觉方式的主动安全系统是汽车辅助系统中的一种重要实现方式。而行人检测作为其中一项必不可少的功能,对主动安全系统功能的生效起着重要的作用。
在实际使用过程中,行人检测基本上都是基于机器学习的方式实现,例如,使用方向梯度直方图(Histogram of Oriented Gradients,简称HOG)特征作为行人的特征,然后结合支持向量机(Support Vector Machine,简称为SVM)的学习方法来进行训练和检测,最终实现各种姿态的行人的检测识别。
然而,发明人发现利用上述方式进行行人检测时,行人的各种姿态都是通过方向梯度直方图特征来表示,这就可能出现行人姿态描述不完整,从而出现检测不准确的问题,导致识别率低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种行人检测方法。该方法有效提高了对行人的检测准确度和识别率。
本发明的第二个目的在于提出一种行人检测装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种行人检测方法,包括:
利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;
分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;
根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人。
本实施例提供的行人检测方法中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
另外,本发明上述实施例提出的行人检测方法还可以具有如下附加的技术特征:
在本发明的一个实施例中,所述提取待识别区域的N种特征向量之前,还包括:
确定当前图像中的初始待识别区域;
对所述初始待识别区域进行M级缩放处理,生成M个待识别区域,其中M为大于1的正整数。
在本发明的另一个实施例中,所述初始待识别区域中包括行人;
所述确定所述待识别区域中是否包括行人之后,还包括:
确定所述M个待识别区域中的L个待识别区域中分别包括的行人的姿态及位置信息,其中,L为大于或等于1,且小于或等于M的正整数;
根据所述L个待识别区域中分别包括的行人的姿态及位置信息,确定所述初始待识别区域中行人的姿态及位置。
在本发明的另一个实施例中,所述确定当前图像中的初始待识别区域之前,还包括:
对所述当前图像进行灰度及直方图均衡化处理;
所述确定当前图像中的初始待识别区域,包括:
根据图像采集装置在汽车中的位置,确定处理后的图像中的初始待识别区域。
在本发明的另一个实施例中,所述分别提取待识别区域的N种特征向量,包括:
利用预设的检测窗口及步长,对所述待识别区域依次进行检测,确定每个检测窗口分别对应的N种特征向量。
在本发明的另一个实施例中,所述分别确定所述N种特征向量与对应的N种分类器间的N个匹配度之前,还包括:
分别对包括不同姿态行人的图像进行训练,生成用于检测所述不同姿态行人的N种分类器。
在本发明的另一个实施例中,所述根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人,包括:
若所述N个匹配度中的第i个匹配度大于阈值,则确定所述待识别区域中包括与所述第i种分类器对应姿态的行人。
为达上述目的,本发明第二方面实施例提出了一种行人检测装置,包括:
提取模块,用于利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;
第一确定模块,用于分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;
第二确定模块,用于根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人。
本实施例提供的行人检测装置中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
另外,本发明上述实施例提出的行人检测装置还可以具有如下附加的技术特征:
在本发明的一个实施例中,还包括:
第三确定模块,用于确定当前图像中的初始待识别区域;
生成模块,用于对所述初始待识别区域进行M级缩放处理,生成M个待识别区域,其中M为大于1的正整数。
在本发明的另一个实施例中,所述初始待识别区域中包括行人;
所述装置,还包括:
第四确定模块,用于确定所述M个待识别区域中的L个待识别区域中分别包括的行人的姿态及位置信息,其中,L为大于或等于1,且小于或等于M的正整数;
第五确定模块,用于根据所述L个待识别区域中分别包括的行人的姿态及位置信息,确定所述初始待识别区域中行人的姿态及位置。
在本发明的另一个实施例中,还包括:
处理模块,用于对所述当前图像进行灰度及直方图均衡化处理;
所述第三确定模块具体包括:
根据图像采集装置在汽车中的位置,确定处理后的图像中的初始待识别区域。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:存储器、处理器及通信端口;
所述通信端口,用于传输待识别图像数据;
所述存储器,用于存储可执行程序代码;
所述处理器,用于读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现第一方面实施例所述的行人检测方法。
本实施例提供的计算机设备中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面实施例所述的行人检测方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一个实施例的行人检测方法的流程图;
图2是本发明一个实施例的对直立的行人样本图像进行单元划分示意图;
图3是本发明一个实施例的使用积分图方法计算骑车行人的Haar特征示意图;
图4是本发明的另一个实施例的行人检测方法的流程图;
图5是本发明一个实施例的对初始待识别区域进行M级缩放的示意图;
图6是本发明一个实施例的对M个待识别区域进行特征向量提取的过程示意图;
图7是本发明一个实施例的在原始图像中进行绘制检测结果的示意图;
图8是本发明一个实施例的对重复检测结果进行聚类处理后的示意图;
图9是本发明一个实施例的行人检测装置的结构示意图;
图10是本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明主要针对现有技术中,利用方向梯度直方图和支持向量机进行行人检测时,出现的行人姿态描述不完整,使得行人检测不准确,导致识别率低的问题,提出一种行人检测方法。
本发明提出的行人检测方法,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数,然后将提取的N种特征向量分别输入至N种分类器,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,其中,N种分类器分别对应N种行人姿态,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高了对行人的检测准确度,提高行人识别率。
下面结合附图对本发明实施例提供的行人检测方法进行详细描述。
图1是本发明一个实施例的行人检测方法的流程图。
如图1所述,本实施例的行人检测方法可以包括以下步骤:
步骤101,利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数。
具体的,本实施例提供的行人检测方法,可以由本发明提供的行人检测装置执行,该装置可以被配置在计算机设备中,以对待识别区域的行人检测进行控制。
其中,本实施例中预设的N种特征提取方法可以是,但不限于方向梯度直方图特征(HOG)、Haar-like特征等,本发明对此不作具体限定。
需要说明的是,在本实施例中待识别区域可以是图像上的任意区域,本发明对此不做具体限定。其中,上述图像可以是基于汽车上的图像采集装置实时获取的。
具体实现时,可通过上述的N种特征提取方法,利用预设的检测窗口及步长,对待识别区域依次进行检测,以确定每个检测窗口分别对应的N种特征向量。
其中,预设的检测窗口及步长可以根据实际需要进行适应性设置,本发明对此不作具体限定。比如,预设的检测窗口可以为32,或者64等,步长可以为4,或者8等。
也就是说,本实施例中N种特征提取方法通过利用预设的检测窗口及步长,对待识别区域进行划区域检测,从而避免了对图像的检测出现漏检情况,使得提取出来的N种特征向量能完整的反映图像特征。
步骤102,分别确定N种特征向量与对应的N种分类器间的N个匹配度,其中,N种分类器分别对应N种行人姿态。
其中,在本实施例中,根据在路上出现的行人的移动方式,将行人分为:直立的行人和骑车的行人。即本实施例中行人的不同姿态可以包括以下几类:直立的行人和骑车的行人。其中,直立的行人可以包括行走、奔跑等;骑车的行人可以包括骑自行车的人、骑摩托车的人、骑电动车的人等等。
具体的,在提取到N种特征向量之后,本发明可利用与预设的N种特征提取方法对应的N种分类器对提取的N种特征向量进行匹配操作,并得到对应的匹配度。
需要说明的,本发明在利用N种分类器对提取的N种特征向量进行特征匹配之前,需要先分别对包括不同姿态行人的图像进行训练,以生成用于检测不同姿态行人的N种分类器。
为了清楚的说明本发明实施例,下面对生成的N种分类器的过程进行具体描述。
若本实施例中N种特征提取方法分别为HOG特征提取方法和Haar-like特征提取方法,那么训练生成N种分类器则包括HOG类型的分类器和Haar-like分类器。在具体实现时,可先从各工况录制的视频中获取包含行人的样本图像,并将样本图像按照直立的行人和骑车的行人样本进行区分,并提取上述样本对应的负样本。其中,负样本是指除了行人之外的其他场景信息,比如街道马路、天空、路灯等等。
需要说明的是,为了使得生成的分类器的准确度更高,本实施例中可以获取多张样本图像进行训练,比如,几万张、几十万张、甚至几百万张等等,本发明对此不作具体限制。
在获取上述正样本和负样本之后,通过HOG特征提取方法对直立的行人样本图像进行HOG特征提取操作。
具体实现时,可以包括以下几个步骤:
步骤一,将直立的行人样本图像进行尺度统一化处理。
其中,由于获取的多张直立的行人样本图像尺度可能大小不一致,因此为了方便后续处理,需要先对上述直立的行人样本图像的尺度进行统一化处理。
具体实现时,可按照(检测窗口宽度+2)*(检测窗口长度+2)进行处理,其中,多加的2用于计算样本图像边缘像素梯度时使用。
其中,在本实施例中,检测窗口的宽度可以为32,长度可以为64,本发明对此不作具体限定。
步骤二,计算直立的行人样本图像的梯度幅值和梯度方向。
具体的,由于图像的梯度幅值和梯度方向是基于水平梯度和垂直梯度来获取的,因此需要先计算水平梯度和垂直梯度。具体可参见以下公式(1)和(2),计算水平梯度和垂直梯度:
水平梯度:Gx(x,y)=H(x+1,y)-H(x-1,y)………………………(1)
垂直梯度:Gy(x,y)=H(x,y+1)-H(x,y-1)………………………(2)
然后,利用水平梯度和垂直梯度计算直立的行人样本图像的梯度幅值和梯度方向,具体计算过程参见公式(3)和(4)所示:
也就是说,本实施例通过计算直立的行人样本图像的梯度幅值和梯度方向,可以准确捕获图像的轮廓信息,同时还能进一步弱化光照的干扰。
步骤三,对直立的行人样本图像进行单元(cell)划分。
具体实现时,可先定义cell的大小,然后将检测窗口以cell为单位进行划分,并计算每个cell的bin向量分布结果(即梯度直方图),然后根据bin向量分布结果生成检测窗口的bin平面图,具体可参见图2所示。
步骤四,确定直立的行人样本图像的HOG描述子。
具体的,可预先定义块(block)的大小及block的移动步长,并根据移动步长移动block,然后计算每个block的L2范数归一化结果,然后将上述结果按顺序排列起来,得到直立的行人样本图像的HOG描述子。
其中,本实施例中块可以根据需要通过多个cell组成的,例如四个cell组成一个block。
进一步的,利用Haar-like特征提取方法对骑车的行人样本图像进行Haar特征提取操作。
具体实现时,可使用积分图方法计算出骑车行人的Haar特征。
举例说明,如图3所示,计算D区域的像素的和,可以利用1、2、3、4点的积分图来计算,由于:
i1=区域A的像素和
i2=区域A的像素和+区域B的像素和
i3=区域A的像素和+区域C的像素和
i4=区域A的像素和+区域B的像素和+区域C的像素和+区域D的像素和
因此:区域D的像素和=i4+i1–(i2+i3)。
另外,对获取到的直立的行人和骑车的行人分别建立负样本库,并使用上述同样的特征方法来提取HOG特征和Haar特征。
在得到直立的行人的HOG特征和骑车的行人的Harr特征之后,本实施例可使用Adaboost分类器对HOG特征和Haar特征分别进行训练,得到对应的直立的行人分类器和骑车的行人分类器,并得到对应的.xml格式的训练结果文件。
具体实现时,可使用以下算法进行训练,举例说明如下:
输入:
训练样本集S={(x1,y1),(x2,y2),...(xm,ym)},其中xi∈X,x是训练样本集,yi是类别标签,1代表正样本,-1代表负样本,yi∈Y,Y={1,2,3,...k};
其中,训练样本集可以是直立的行人的HOG特征和对应负样本的HOG特征,或者,也可以是骑车的行人的Harr特征和对应的负样本的Harr特征,本发明对此不作具体限定。
执行:
for:t=1,2,...T
调用弱学习算法,返回一个弱假设ht,ht=L(D,wt)ht:X→Y
输出:
需要说明的是,本实施例中也可以使用支持向量机(Support Vector Machine,简称为SVM)进行训练,生成对应的类型的分类器,本发明对此不作具体限定。
进一步地,在训练生成N种分类器之后,本实施例可将提取到N种特征向量分别输入至N种分类器中,以确定N种特征向量与N个分类器之间的匹配度。
步骤103,根据N个匹配度的大小,确定待识别区域中是否包括行人。
具体的,在确定出N个匹配度的大小之后,本实施例可将N个匹配度与阈值进行比对,以确定待识别区域中是否包括行人。
其中,若确定出N个匹配度中的第i个匹配度大于阈值,则确定待识别区域中包括与第i种分类器对应姿态的行人。其中,i为大于1的正整数。
在本实施例中,阈值可以根据N个分类器的实际检测精度进行适应性设置,本发明对此不做具体限定。
本实施例提供的行人检测方法中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
通过上述分析可知,通过利用N种特征提取方法,提取待识别区域的N种特征向量,然后确定N种向量与对应的分类器的匹配度,以确定待识别区域中是否包括行人。在本发明的一种实现情景中,为了提高对行人检测的准确性,本发明可先对待识别图像进行一系列的处理操作,以使得处理后的图像识别率更高。下面结合图4,对上述情况进行具体描述。
图4是本发明另一个实施例行人检测方法的流程图。
如图4所示,本实施例行人检测方法可以包括以下几个步骤:
步骤401,确定当前图像中的初始待识别区域。
其中,本实施例中确定当前图像中的初始待识别区域,可以是提取行人的感兴趣区域。
具体的,可基于采集的实时图像中行人可能发生碰撞的位置信息估计,对部分不可能出现行人及行人不处于危险区域的图像不计入检测,例如去除图像上下部分像素的天空和地面场景,以及图像左右部分像素的马路两边场景,从而设定行人的感兴趣区域,只在较小范围内搜索行人,减少图像处理面积,从而减少数据处理量,提高算法实时性。
进一步地,在本发明的另一个实施例中,本发明在确定当前图像中的初始待识别区域之前,还包括:
对当前图像进行灰度及直方图均衡化处理。
也就是说,本发明通过对当前图像进行预处理操作,可以减少对当前图像的计算量,提高检测速度,使得后续的处理效率更高。
因此,本实施例中确定当前图像中的初始待识别区域可以包括:根据图像采集装置在汽车中的位置,确定处理后的图像中的初始待识别区域。
步骤402,对初始待识别区域进行M级缩放处理,生成M个待识别区域,其中M为大于1的正整数。
具体的,为了实现对不同大小尺度的行人进行多尺度的检测,本实施例可通过对初始待识别区域进行多级缩放,以形成图像金字塔,如图5所示。
需要注意的是,对初始待识别区域进行每一级的缩放尺寸时,需要考虑到周边像素计算梯度时的所需要的额外像素点。例如,设定cell大小为4,检测窗口移动步长亦为4,那么每一级缩放图像的尺寸大小都要对齐到4,然后再加2。
步骤403,利用预设的N种特征提取方法,分别提取M个待识别区域的N种特征向量,其中,N为大于1的正整数。
举例说明,如图6所示,可使用固定大小的检测窗口在各级缩放图像中以cell为步长进行滑动,并按照利用预设的N种特征提取方法提取M个待识别区域的N种特征向量。
步骤404,分别确定N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态。
步骤405,根据N个匹配度的大小,确定M个待识别区域中是否包括行人。
具体的,将提取的提取M个待识别区域的N种特征向量分别输入至N种分类器中,进行比较分类操作并确定M个待识别区域中包括对象是直立行人、骑车行人还是背景部分。如果包括的是直立的行人或者骑车的行人,则将直立行人或骑车行人的结果分别记录到相应的缓冲中。
进一步地,本实施例在确定出M个待识别区域中包括行人时,可将检测结果在原始图像中进行绘制,得到如图7所示的显示结果。
步骤406,确定M个待识别区域中的L个待识别区域中分别包括的行人的姿态及位置信息,其中,L为大于或等于1,且小于或等于M的正整数。
步骤407,根据L个待识别区域中分别包括的行人的姿态及位置信息,确定初始待识别区域中行人的姿态及位置。
具体的,由于对初始待识别区域进行了多级缩放处理,可能导致对M个待识别区域的检测结果出现以下几种情况:
第一种,放大多次之后,近距离的行人可能无法被识别;
第二种,缩小多次之后,远距离的行人可能无法被识别。
并且,对待识别区域进行多级缩放之后,还使得步骤405的检测结果中存在许多重复的检测。因此为了剔除上述重复的检测,本发明可采用聚类的方法,将相近的窗口进行合并,以得到的最终检测结果如图8所示,从而提高了行人检测的准确度。
本实施例提供的行人检测方法中,通过先确定当前图像的初始待识别区域,并对初始待识别区域进行多级缩放处理得到M个待识别区域,然后利用预设的N种特征提取方法,分别提取M个待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定M个待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率,满足了用户需求,进一步提升了用户使用体验。
为了实现上述实施例,本发明还提出了一种行人检测装置。
图9是本发明一个实施例的行人检测装置的结构示意图。
如图9所示,该行人检测装置包括:提取模块11、第一确定模块12和第二确定模块13。
其中,提取模块11用于利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;
第一确定模块12用于分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;
第二确定模块13用于根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人。
需要说明的是,前述对行人检测方法实施例的解释说明也适用于该实施例的行人检测装置,其实现原理类似,此处不再赘述。
本实施例提供的行人检测装置中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
为了实现上述实施例,本发明还提出一种计算机设备。
图10是本发明一个实施例的计算机设备的结构示意图。
参见图10,本发明的计算机设备包括存储器21、处理器22及通信端口23;
所述通信端口23用于传输待识别图像数据;
所述存储器21用于存储可执行程序代码;
所述处理器22用于读取所述存储器21中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现第一方面实施例所述的行人检测方法。其中行人检测方法包括:利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人。
需要说明的是,前述对行人检测方法实施例的解释说明也适用于该实施例的计算机设备,其实现原理类似,此处不再赘述。
本实施例提供的计算机设备中,通过利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,并分别确定N种特征向量与对应的N种分类器间的N个匹配度,然后根据N个匹配度的大小,确定待识别区域中是否包括行人。由此,实现了在对行人进行检测时,利用多种特征向量来表示行人的姿态,使得行人姿态描述的更完整,从而提高对行人的检测准确度,提高行人识别率。
为了实现上述实施例,本发明还提出了一种计算机可读存储介质。
该计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时以用于实现第一方面实施例所述的行人检测方法。其中行人检测方法包括:利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人。
在本发明中,除非另有明确的规定和限定,术语“设置”、“连接”等术语应做广义理解,例如,可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种行人检测方法,其特征在于,包括:
利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;
分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;
根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人;
其中,所述N种特征向量用以表示行人的姿态;所述N种分类器通过对包括不同姿态行人的图像进行训练得到,用于检测不同姿态的行人。
2.如权利要求1所述的方法,其特征在于,所述提取待识别区域的N种特征向量之前,还包括:
确定当前图像中的初始待识别区域;
对所述初始待识别区域进行M级缩放处理,生成M个待识别区域,其中M为大于1的正整数。
3.如权利要求2所述的方法,其特征在于,所述初始待识别区域中包括行人;
所述确定所述待识别区域中是否包括行人之后,还包括:
确定所述M个待识别区域中的L个待识别区域中分别包括的行人的姿态及位置信息,其中,L为大于或等于1,且小于或等于M的正整数;
根据所述L个待识别区域中分别包括的行人的姿态及位置信息,确定所述初始待识别区域中行人的姿态及位置。
4.如权利要求2所述的方法,其特征在于,所述确定当前图像中的初始待识别区域之前,还包括:
对所述当前图像进行灰度及直方图均衡化处理;
所述确定当前图像中的初始待识别区域,包括:
根据图像采集装置在汽车中的位置,确定处理后的图像中的初始待识别区域。
5.如权利要求1-4任一所述的方法,其特征在于,所述分别提取待识别区域的N种特征向量,包括:
利用预设的检测窗口及步长,对所述待识别区域依次进行检测,确定每个检测窗口分别对应的N种特征向量。
6.如权利要求1-4任一所述的方法,其特征在于,所述分别确定所述N种特征向量与对应的N种分类器间的N个匹配度之前,还包括:
分别对包括不同姿态行人的图像进行训练,生成用于检测所述不同姿态行人的N种分类器。
7.如权利要求1-4任一所述的方法,其特征在于,所述根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人,包括:
若所述N个匹配度中的第i个匹配度大于阈值,则确定所述待识别区域中包括与第i种分类器对应姿态的行人。
8.一种行人检测装置,其特征在于,包括:
提取模块,用于利用预设的N种特征提取方法,分别提取待识别区域的N种特征向量,其中,N为大于1的正整数;
第一确定模块,用于分别确定所述N种特征向量与对应的N种分类器间的N个匹配度,其中,所述N种分类器分别对应N种行人姿态;
第二确定模块,用于根据所述N个匹配度的大小,确定所述待识别区域中是否包括行人;
其中,所述N种特征向量用以表示行人的姿态;所述N种分类器通过对包括不同姿态行人的图像进行训练得到,用于检测不同姿态的行人。
9.一种计算机设备,其特征在于,包括:存储器、处理器及通信端口;
所述通信端口,用于传输待识别图像数据;
所述存储器,用于存储可执行程序代码;
所述处理器,用于读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-7任一所述的行人检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一所述的行人检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711049699.0A CN109726621B (zh) | 2017-10-31 | 2017-10-31 | 行人检测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711049699.0A CN109726621B (zh) | 2017-10-31 | 2017-10-31 | 行人检测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109726621A CN109726621A (zh) | 2019-05-07 |
CN109726621B true CN109726621B (zh) | 2021-05-14 |
Family
ID=66293585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711049699.0A Active CN109726621B (zh) | 2017-10-31 | 2017-10-31 | 行人检测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109726621B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458227B (zh) * | 2019-08-08 | 2021-11-23 | 杭州电子科技大学 | 一种基于混合分类器的adas行人检测方法 |
CN110866534B (zh) * | 2019-08-13 | 2023-09-12 | 广州三木智能科技有限公司 | 一种梯度幅度分布梯度朝向直方图的远红外行人训练方法 |
CN111432526B (zh) | 2020-04-13 | 2023-02-21 | 昂宝电子(上海)有限公司 | 用于led照明系统的功率因子优化的控制系统和方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101290660A (zh) * | 2008-06-02 | 2008-10-22 | 中国科学技术大学 | 一种用于行人检测的树状组合分类方法 |
CN103049751A (zh) * | 2013-01-24 | 2013-04-17 | 苏州大学 | 一种改进的加权区域匹配高空视频行人识别方法 |
CN103745196A (zh) * | 2013-12-27 | 2014-04-23 | 东软集团股份有限公司 | 广义行人检测方法和装置 |
CN105260712A (zh) * | 2015-10-03 | 2016-01-20 | 上海大学 | 一种车辆前方行人检测方法及系统 |
CN105404857A (zh) * | 2015-11-04 | 2016-03-16 | 北京联合大学 | 一种基于红外的夜间智能车前方行人检测方法 |
US9495874B1 (en) * | 2012-04-13 | 2016-11-15 | Google Inc. | Automated system and method for modeling the behavior of vehicles and other agents |
-
2017
- 2017-10-31 CN CN201711049699.0A patent/CN109726621B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101290660A (zh) * | 2008-06-02 | 2008-10-22 | 中国科学技术大学 | 一种用于行人检测的树状组合分类方法 |
US9495874B1 (en) * | 2012-04-13 | 2016-11-15 | Google Inc. | Automated system and method for modeling the behavior of vehicles and other agents |
CN103049751A (zh) * | 2013-01-24 | 2013-04-17 | 苏州大学 | 一种改进的加权区域匹配高空视频行人识别方法 |
CN103745196A (zh) * | 2013-12-27 | 2014-04-23 | 东软集团股份有限公司 | 广义行人检测方法和装置 |
CN105260712A (zh) * | 2015-10-03 | 2016-01-20 | 上海大学 | 一种车辆前方行人检测方法及系统 |
CN105404857A (zh) * | 2015-11-04 | 2016-03-16 | 北京联合大学 | 一种基于红外的夜间智能车前方行人检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109726621A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108388879B (zh) | 目标的检测方法、装置和存储介质 | |
Liang et al. | Moving object classification using local shape and HOG features in wavelet-transformed space with hierarchical SVM classifiers | |
Gall et al. | An introduction to random forests for multi-class object detection | |
TW201926140A (zh) | 影像標註方法、電子裝置及非暫態電腦可讀取儲存媒體 | |
US9245206B2 (en) | Image processing apparatus and image processing method | |
US9443137B2 (en) | Apparatus and method for detecting body parts | |
US11380010B2 (en) | Image processing device, image processing method, and image processing program | |
TWI567660B (zh) | 多類別物件分類方法及系統 | |
Zhang et al. | Hybrid support vector machines for robust object tracking | |
US11138464B2 (en) | Image processing device, image processing method, and image processing program | |
CN110659550A (zh) | 交通标志牌识别方法、装置、计算机设备和存储介质 | |
Ohn-Bar et al. | Fast and robust object detection using visual subcategories | |
CN109726621B (zh) | 行人检测方法、装置及设备 | |
Shirpour et al. | Traffic object detection and recognition based on the attentional visual field of drivers | |
Chen et al. | A vision based traffic accident detection method using extreme learning machine | |
CN109902576B (zh) | 一种头肩图像分类器的训练方法及应用 | |
Meus et al. | Embedded vision system for pedestrian detection based on HOG+ SVM and use of motion information implemented in Zynq heterogeneous device | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 | |
KR20190018274A (ko) | 이미지에 포함된 특징 포인트의 시간 또는 공간의 움직임에 기초하여 이미지에 존재하는 피사체를 인식하는 장치 및 방법 | |
Araar et al. | Traffic sign recognition using a synthetic data training approach | |
Gepperth et al. | Real-time detection and classification of cars in video sequences | |
JP5759124B2 (ja) | カメラ・システムから得られた画像の中のオブジェクトを分析するためのコンピュータ化方法及びシステム | |
CN107886060A (zh) | 基于视频的行人自动检测与跟踪方法 | |
CN110555406B (zh) | 一种基于Haar-like特征及CNN匹配的视频运动目标识别方法 | |
Tamersoy et al. | Robust vehicle detection for tracking in highway surveillance videos using unsupervised learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230131 Address after: A2701, Innovation Plaza, 2007 Pingshan Avenue, Liulian Community, Pingshan Street, Pingshan District, Shenzhen City, Guangdong Province, 518118 Patentee after: Shenzhen Dipai Zhixing Technology Co.,Ltd. Address before: 518118 BYD Road, Pingshan New District, Shenzhen, Guangdong 3009 Patentee before: BYD Co.,Ltd. |