CN104050481A - 多模板轮廓特征和灰度相结合的红外图像实时行人检测 - Google Patents

多模板轮廓特征和灰度相结合的红外图像实时行人检测 Download PDF

Info

Publication number
CN104050481A
CN104050481A CN201410266907.2A CN201410266907A CN104050481A CN 104050481 A CN104050481 A CN 104050481A CN 201410266907 A CN201410266907 A CN 201410266907A CN 104050481 A CN104050481 A CN 104050481A
Authority
CN
China
Prior art keywords
window
windows
hist
pixel
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410266907.2A
Other languages
English (en)
Other versions
CN104050481B (zh
Inventor
权东晓
何先灯
朱畅华
易运晖
陈南
裴昌幸
赵楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian Univ
Original Assignee
权东晓
何先灯
朱畅华
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 权东晓, 何先灯, 朱畅华 filed Critical 权东晓
Priority to CN201410266907.2A priority Critical patent/CN104050481B/zh
Publication of CN104050481A publication Critical patent/CN104050481A/zh
Application granted granted Critical
Publication of CN104050481B publication Critical patent/CN104050481B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种多模板的轮廓特征和灰度相结合的红外图像实时行人检测方法,模板参数提取的过程中考虑边界的影响,根据检测窗口大小保存成不同大小的样本库。正样本要包括不同体形和动作的行人,负样本要包括少部分容易引起误判的图像。实时检测部分对所有像素进行一遍计算就可以计算出整幅图像的轮廓特征,并且SVM分类的判决给与较低的门限,以保证不会漏检。在DSP中再根据人体形态学对检测结果进行进一步的判断,剔除虚假目标。本发明由于采用了多模板的检测方法,虽然训练的复杂度略有提高,但是实时检测时需要的硬件资源较少,并且由于采用了轮廓特征和人体形态学相结合的方法,保证了漏检概率较小,正确率也较高。

Description

多模板轮廓特征和灰度相结合的红外图像实时行人检测
技术领域
本发明属于红外图像处理,涉及多模板轮廓特征和灰度相结合的红外图像实时行人检测。
背景技术
随着车辆交通的发展,每年因车祸造成死亡的人数达100万之多,由于目前国内各地区的省道、国道、高速或准高速公路都没有照明设备,夜间车祸事故的死亡人数占到其中的70%之多,夜间行车安全变得尤为重要,汽车夜视系统孕育而生。在汽车夜视系统中,红外夜视由于不需要任何照明,即使在夜间,也可以轻松探测到1公里之外的动物和车辆,探测距离远,必将成为主流技术。由于在国道高速等路况的行驶过程中,容易出现疲劳驾驶,为了提高行人的安全程度,因此红外夜视系统应该具有实时的行人检测功能,能及时提醒驾驶员注意避让行人。
已有的不少行人检测方法绝大多数都是基于训练的思想,提取人的HOG(Histogram of Oriented Gradient)特征,进行模式匹配来完成。如一种基于轮廓和色彩相似对称分布特征的行人检测方法,专利申请号:CN201310481275.7;一种基于视频处理的行人检测方法,专利申请号:CN201310238127.2,一种基于组合特征的行人检测方法,专利申请号:CN201210275898.4等都是基于SVM(Support VectorMachine)分类的结果来进行,但都没有训练多个模板。因此为了检测不同距离的行人,通常要对一副图像进行不同尺度的变换来和模板匹配。通常,图像处理都采用FPGA(Field Programmable Gate Array)或DSP(Digital Signal Processing)实现,其硬件资源越大,所实现的算法越复杂,同时成本也越高。上述专利,所耗费的硬件资源都很大。而且通过实际测试发现,轮胎和行人的HOG特征很相近,在检测过程中容易造成误检,因此提出了多模板的HOG和灰度特征相结合的红外图像行人检测方法。该方法需要的硬件资源较少,能够满足实时性的要求,且检测概率很高,能够应用到车载红外夜视系统中。
发明内容
本发明的目的在于提供多模板轮廓特征和灰度相结合的红外图像的实时行人检测方法,解决了现有的红外图像行人检测由于基于单模板,因而需要硬件资源大,速度慢,准确率较低的问题。
本发明采用的技术方案是按照以下步骤进行:
步骤1:进行模板参数提取,包括不同检测窗口的SVM分类器参数和block的四个权重;
步骤2:对整个输入图像,以8*8个像素为单元,计算每个单元的平均灰度值和每个单元的最大灰度值;
步骤3:对于输入图像,计算出每一个像素的梯度及角度φ值;
步骤4:将0°-180°平均分成9个区间,根据第步骤3计算的每一个像素的梯度和角度φ,按照线性距离的概念投影到这9个区间,每个像素对所影响的上下两个区间的权重分别定义为幅度*该角度到区间中心角度的归一化线性距离,即分别为:gradweight_high=l*dh,gradweight_low=l*dl;
步骤5:对整个输入图像,按照16*16个像素为单元,首先在水平方向以8个像素为单位从左往右滑动,到达最右端后再返回最左端,然后在竖直方向向下滑动8个像素,再以8个像素为单位从左往右滑动,依次进行直到图像的右下角,把整个图像分成(img_width/8-1)*(img_height/8-1)个block;
步骤6:对整个输入图像,按照8*8个像素为单元,把整个图像分成img_width*img_height/64个cell,设当前像素在每个cell的下标为(i,j),取出当前像素的下相邻区间t,依次取出他所影响到的四个block的his,依次令mx=i+8,ny=j+8;mx=i+8,ny=j;mx=i,ny=j+8;mx=i,ny=j进行如下计算:
hist(t)=hist(t)+WEIGHT1(mx,ny)*gradweight_low;
hist(t+9)=hist(t+9)+WEIGHT2(mx,ny)*gradweight_low;
hist(t+18)=hist(t+18)+WEIGHT3(mx,ny)*gradweight_low;
hist(t+27)=hist(t+27)+WEIGHT4(mx,ny)*gradweight_low;
然后取出当前像素的上相邻区间,用权重gradweight_hig重复以上过程,当一个block的his计算完毕后,利用公式
newhist ( k ) = hist ( k ) Σ k = 0 35 hist ( k ) 对其直方图进行归一化,所有cell计算完成后,整幅图像的block计算完成;
步骤7:在原始图像上滑动检测窗口,三个窗口的大小分别为24*48,32*64,40*80,根据窗口的位置,依次取出相应的block的归一化直方图newhist,且最后插入一个数值1,将此数组和SVM参数进行点乘,如果结果result_windows大于0,则将其记录到当前窗口的windows_result,并对以其为中心的9个窗口的累积结果windows_leiji都加上t1*result_windows,最终每个窗口的结果为:t2*windows_result+t3*windows_leiji;如果此值大于判决门限,则记录此窗口左上角的坐标和长宽,一帧图像计算完毕后,将记录窗口的结果上传给DSP,且令windows_leiji=t4*windows_leiji,通过t1,t2和t3调节窗口的累积效果,通过t4调节目标跟踪效果;
步骤8:将步骤7上传的窗口进行合并,形成和别的窗口都没有重叠的独立窗口。
步骤9:利用步骤2中计算的每个单元的最大灰度信息和平均灰度信息在DSP中结合人体形态学对行人做进一步的筛选;
步骤10:按照一定比例缩小目标窗口,并在图像上用方框标出目标。
进一步,所述步骤8中形成和别的窗口都没有重叠的独立窗口过程为如果一个窗口和别的窗口有重叠,则合并成一个包括这两个窗口的大窗口。
进一步,所述步骤9的筛选过程为:对于步骤6中设置的门限为0.1,利用步骤2中计算的灰度信息在DSP中结合人体形态学对行人做进一步的筛选,首先窗口的上1/4的中心应该大于一个最大亮度的阈值,此阈值因为人的头部,亮度比较大进行设定,以窗口中点为中心的宽度等于1/2窗口宽度,高度等于3/4窗口高度内平均灰度的方差大于一个阈值,此阈值考虑人的衣着,和轮胎,电线杆等统一亮度的物体进行区别,且水平方向上大于一定门限值的宽度和电线杆等细长物体进行区分。
本发明的有益效果是通过训练多个模板进行检测,减小了需要的硬件资源,提高了行人检测的速度,通过和灰度特征相结合提高了检测的准确率。
附图说明
图1是行人检测的流程图;
图2是不同大小模板正样本的样本图像;
图3是不同大小模板容易产生误判的负样本的样本图像;
图4是24*48检测窗口的block划分示意图;
图5是block高斯权重计算示意图;
图6是block中cell的划分示意图;
图7是block位置权重区域划分示意图;
图8是线性距离示意图;
图9是cell与其影响到的block的对应关系示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明所采用的技术方案是首先通过训练得到多模板的行人的SVM参数,计算出block的模板参数。然后实时计算每个block的轮廓特征以及灰度平均值和最大值,利用多个窗口在图像上滑动和SVM参数进行匹配选出目标窗口。最后进行窗口合并,并利用灰度信息进一步排除虚假目标。多模板的轮廓特征和灰度相结合的红外图像实时行人检测方法流程图如图1所示,包括模板参数提取和实时检测两个部分,模板参数包括SVM分类器参数的提取和block的四个权重的提取。
步骤1:首先进行模板参数提取,原有的行人检测通常只有一个SVM分类器参数,为了检测不同距离的行人,通常要对一副图像进行不同尺度的缩放,然后滑动窗口和已有的参数进行匹配,这样需要的FPGA资源很大,导致硬件成本很高。这里我们为了检测不同距离的行人,训练三个不同大小的模板:24*48、32*64和40*80,在实时检测的时候也采用这样的窗口大小。训练的主要步骤如下:
SVM分类器参数提取的具体步骤:
1.首先采集大量的行人图片,图片背景和内容要丰富。背景包括简单场景和复杂场景,背景采集的时间也应该包括春夏秋冬不同时节,阴晴雨雪等天气状况。行人包括不同体型,不同动作的行人,衣着也应该尽量丰富,随身也可以佩戴不同的装饰。注意,一定是直立的行人,四肢应该有各种姿势。实际上为了捕获到行人的不同动作,可以录制大量视频,转换成图片。
2.裁剪正样本,从原始图片中裁剪行人正样本的方法为,首先选中行人区域,然后根据行人大小再向外进行边界扩张,最后将扩张后的图片进行线性缩放,保存为不同大小的样本。考虑到人的长宽比2∶1,这里图片的长宽比也为2∶1。规定一个block为16*16的像素,block在原始图像上以8个像素为单位在水平和竖直方向上滑动,所以样本行人的宽度也按照8个像素进行增加。为了检测不同距离的行人,我们选定了三个检测窗口:24*48,32*64,40*80。样本要有一定的边界,因此设定这三个检测窗口对应的样本大小分别为:32*64,40*80和48*96。设行人的宽度为W,需要在原始图像宽度上裁取的边界为edge_w,则有
在原始图像宽度方向上截取的边界为2*edge_w,最终裁剪的图像宽为W+2*edge_w,由于图片为2∶1,则高为2*(W+2*edge_w)。对裁剪后的图像,通过线性缩放,使得W+2*edge_w的取值分别缩放为32、40和48,即可分别得到32*64,40*80和48*96的三种模板的正样本。最终的正样本如图2所示,样本要丰富,包括同一个人的不同动作和各种体型的人。
3.裁剪负样本,负样本可以从没有行人的图片中随机选择,但也要尽量丰富,同时要包括少部分容易产生误判的图像。负样本不用考虑边界问题,可以直接压缩到需要的大小。与获取正样本相似的方式,从原始图片采集不同的图片保存为32*64,40*80和48*96模板大小的负样本。负样本的选择要尽量丰富,同时要包括少部分容易产生误判的图像。在这里主要包括大树树干,路灯,以及汽车轮胎的侧面,如图3所示。可以看出,轮胎侧面图像与行人很相似。
4.由于人具有对称性,所以将正负样本以其中心垂线为对称轴左右像素对调(镜像)得到新的样本来丰富样本库。生成正负样本的列表,利用法国国家计算机技术和控制研究所(INRIA)开发的训练程序OLTbinaries.zip进行训练,得到不同窗口大小人物的SVM分类器参数,分别为361,757和1297个。这里得到的参数是按照block列优先的顺序存放的,为了后面FPGA读取数据方便,将训练结果按照行优先的顺序重新排列。以24*48检测窗口大小为例进行说明,由于block的大小为16*16,每次按照8个像素滑动,所以block的划分如图4所示,每个block包括以标注为中心的四个8*8的正方形像素,可以看出有10个block,每个block包括36个参数,所以有360个参数,加上最后一个修正参数,总共有361个参数。列优先顺序指的是block1,block2,block3,block4,block5,block6,block7,block8,block9,block10,行优先的顺序是指block1,block6,block2,block7,block3,block8,block4,block9,block5,block10。
block的四个权重的提取步骤:
1.首先获取高斯权重:对于一个16*16个像素构成的block,按照每个像素距离block的中心像素(9,9)的垂直距离来产生高斯矩阵。如图5所示:设垂直距离分别为d1,d2,则高斯权重为:σ取值为4。根据定义,可计算出中心点的权重为1。
2.将每个block分成四个cell,如图6所示。下面求出block的每个像素对这四个cell的统计信息的权重值,分别记为weight_1,weight_2,weight_3,weight_4。具体求法为:设当前像素点的坐标为(x,y),则对第1个cell的中心点的归一化水平距离为d31=|x-4.5|/8,归一化垂直距离为d41=|y-4.5|/8,第2个cell的中心点的归一化水平距离为d32=|x-4.5|/8,归一化垂直距离为d42=|y-12.5|/8,第3个cell的中心点的归一化水平距离为d33=|x-12.5|/8,归一化垂直距离为d43=|y-4.5|/8,第4个cell的中心点的归一化水平距离为d34=|x-12.5|/8,归一化垂直距离为d44=|y-12.5|/8。则如果d3i和d4i,i=1,2,3,4,都小于1,则相应的weight_i=(1-d3i)*(1-d4i),否则相应的weight_i=0。对应于图7中,当像素位于位置3,6,7,8,9时,weight_1=0;当像素位于位置1,2,3,6,9时,weight_2=0;当像素位于位置1,4,7,8,9时,weight_3=0;当像素位于位置1,2,3,4,7时,weight_4=0。
3.将weight_i都乘以高斯权重weight得到我们最终检测需要的block的四个权重WEIGHT1,WEIGHT2,WEIGHT3,WEIGHT4,其将用于实时检测的步骤。
步骤2:对整个输入图像,用I(s,t)表示坐标(s,t)处像素的灰度值。将整个图像按照8*8个像素为单元进行划分,(P,q)表示这个单元左上角像素的坐标,用AG_pq表示这个单元的平均灰度值,MG_pq表示这个单元的最大灰度值。则可以利用
AG _ pq = 1 64 Σ u , v = 0,7 I ( p + u , q + v ) 计算出每个单元的平均灰度值,利用MG_pq=max(I(p+u,q+v),u,v=0-7)计算出每个单元的最大灰度值,上传给数字信号处理器以备后面利用灰度值进行进一步判断。
步骤3:对于输入图像,用I(s,t)表示坐标(s,t)处像素的灰度值,计算出每一个像素的梯度。假设当前像素的坐标为(m,n),则X方向的梯度为:Y方向的梯度为:如果X和Y方向的梯度符号不同,则否则 φ = arctan ▿ Y / ▿ X , 可以看出φ的取值范围为0°-180°。
步骤4:将0°-180°平均分成9个区间,即分别为:0°-20°,20°-40°,40°-60°,60°-80°,80°-100°,100°-120°,120°-140°,140°-160°,160°-180°,记为0-8,0的下相邻区间为8,8的上相邻区间定义为0。根据上一步计算的每一个像素的角度φ,按照线性距离的概念投影到九个区间,投影过程中一个点会影响到上相邻区间和下相邻区间。如果这个角度位于一个区间n的左半部分,则其影响到的下相邻区间为n-1,其影响到的上相邻区间为n;如果这个角度位于一个区间n的右半部分,则其影响到的下相邻区间为n,其影响到的上相邻区间为n+1。利用High_region和Low_region分别表示上下相邻区间,则如果Low_region==-1,则Low_region=8;High_region=Low_region+1,如果High_region==9,则High_region==0。在图8中,箭头所示位置位于区间4的左半部分,所以下相邻区间为3,上相邻区间为4,到下相邻区间中心的距离记为dl,到上相邻区间中心的距离记为dh。则对于角度φ,到下相邻区间中心的归一化距离为到上相邻区间中心的归一化距离为:dh=1-dl。角度φ的幅度的定义为:则每个像素对所影响的上下两个区间的权重分别定义为:gradweight_high=l*dh,gradweight_low=l*dl。
步骤5:对整个输入图像,按照16*16个像素为单元(block),首先在水平方向以8个像素为单位从左往右滑动,到达最右端后再返回最左端,然后在竖直方向向下滑动8个像素,再以8个像素为单位从左往右滑动,依次进行直到图像的右下角。把整个图像分成(img_width/8-1)*(img_height/8-1)个block。在图6所示的block中,每个block由四个cell构成,由于每个cell根据角度投影到了9个区间,所以每个cell有9个hist值。cell1的hist记为hist1-hist9,cell2的hist记为hist10-hist18,cell3的hist记为hist19-hist27,cell4的hist记为hist28-hist36。为了易于FPGA流处理,我们考虑到每个cell会出现到四个block里面,如图9所示,会影响到这四个block的统计信息。因此每个像素的投影区间和权重计算完成后,就直接计算出对这四个block的hist的影响。计算方法如下一步所示。
步骤6:对整个输入图像,按照8*8个像素为单元(cell),把整个图像分成img_width*img_height/64个cell。设当前像素在每个cell的下标为(i,j),则在图9的四种情况下,能够根据步骤1中得到的对四个cell的权重对统计信息hist进行计算,其权重的下标依次为(i+8,j+8),(i+8,j),(i,j+8),(i,j),记为(mx,ny)。取出当前像素的下相邻区间t,取出图9中的block1的hist,令mx=i+8,ny=j+8,进行如下计算:
hist(t)=hist(t)+WEIGHT1(mx,ny)*gradweight_low;
hist(t+9)=hist(t+9)+WEIGHT2(mx,ny)*gradweight_low;
hist(t+18)=hist(t+18)+WEIGHT3(mx,ny)*gradweight_low;
hist(t+27)=hist(t+27)+WEIGHT4(mx,ny)*gradweight_low;
然后取出block2的hist,令mx=i+8,ny=j重复上述过程;再取出取出block3的hist,令mx=i,ny=j+8重复上述过程;最后取出block4的hist,令mx=i,ny=j重复上述过程。
然后再取出当前像素的上相邻区间,对4个block的hist重复上面的过程,这里对上相邻区间的权重为gradweight_high。当Cell的所有像素计算完成后,block1的his已经计算完成,对其直方图进行归一化,
newhist ( k ) = hist ( k ) Σ k = 0 35 hist ( k )
当所有cell计算完毕后,整幅图像的block计算完毕。
步骤7:在原始图像上滑动检测窗口,三个窗口的大小分别为24*48,32*64,40*80,每个窗口含有的block的数目为:(width/8-1)*(height/8-1),分别为10,21和36个。根据窗口的位置,依次取出相应的block的归一化直方图newhist,按照行优先的顺序排列起来,且最后插入一个数值1。将此数组和训练得到的SVM参数点乘,得到一个值result_windows,如果此值大于0,则首先将其记录到当前窗口的windows_result,再对以其为中心的9个窗口的累积结果windows_leiji都加上t1*result_windows,t1为累积影响因子,取值范围为0-1。最终用来判断该窗口是否含有目标的结果由两部分构成,一部分是当前窗口的计算结果,另外一部分为周围窗口对当前窗口的影响结果,即为t2*windows_result+t3*windows_leiji,t2和t3的取值范围为0-1,通过t1,t2和t3调节窗口的累积效果。如果其值大于判决门限,则表明此窗口可能含有目标,记录此窗口左上角的坐标和长宽,待一帧图像计算完毕后,将记录窗口的结果上传给数字信号处理器DSP进行进一步判断。一帧图像计算完毕后,将windows_leiji=t4*windows_leiji,t4的取值为0-1,通过其调节当前帧结果对下一帧的影响,可以进行人物的跟踪。
步骤8:此后的部分在DSP中进行,首先将步骤7上传的窗口进行合并,得到可能含有目标的大窗口。方法为,如果一个窗口和别的窗口有重叠,则合并成一个包括这两个窗口的大窗口。通过此步骤将形成和别的窗口都没有重叠的独立窗口。
步骤9:为了检测出远处的行人,我们的检测窗口比较小,轮胎,树干等和人的HOG特征比较接近,因此我们步骤6中设置的门限值较低,对应到没有定标的情况下为0.1,以至于不漏检。下面再利用步骤2中计算的灰度信息在DSP中结合人体形态学对行人做进一步的筛选。规则为:首先窗口的上1/4的中心应该大于一个最大亮度的阈值(人的头部,亮度比较大);以窗口中点为中心的宽度等于1/2窗口宽度,高度等于3/4窗口高度内平均灰度的方差大于一个阈值(考虑人的衣着等,可以和轮胎,电线杆等统一亮度的物体进行区别),且水平方向上大于一定门限值的宽度(和电线杆等细长物体进行区分)。
步骤10:由于考虑了检测窗口对周围窗口的影响,以及窗口合并的影响,最终形成的检测窗口比较大,因此对于含有目标的窗口,按照一定比例来缩小窗口,newwindow_width=window_width*0.8,newwindow_height=window_height*0.8,并在图像上用方框标出目标。
本发明通过训练多个模板,在实时检测时候进行多模板匹配节省了硬件资源、提高了检测速度,并且将轮廓特征和人体形态学结合起来,从而使得漏检概率较小,正确率也较高。

Claims (3)

1.多模板轮廓特征和灰度相结合的红外图像实时行人检测,其特征在于按照以下步骤进行:
步骤1:进行模板参数提取,包括不同检测窗口的SVM分类器参数和block的四个权重;
步骤2:对整个输入图像,以8*8个像素为单元,计算每个单元的平均灰度值和每个单元的最大灰度值;
步骤3:对于输入图像,计算出每一个像素的梯度及角度φ值;
步骤4:将0°-180°平均分成9个区间,根据第步骤3计算的每一个像素的梯度和角度φ,按照线性距离的概念投影到这9个区间,每个像素对所影响的上下两个区间的权重分别定义为幅度*该角度到区间中心角度的归一化线性距离,即分别为:gradweight_high=l*dh,gradweight_low=l*dl;
步骤5:对整个输入图像,按照16*16个像素为单元,首先在水平方向以8个像素为单位从左往右滑动,到达最右端后再返回最左端,然后在竖直方向向下滑动8个像素,再以8个像素为单位从左往右滑动,依次进行直到图像的右下角,把整个图像分成(img_width/8-1)*(img_height/8-1)个block;
步骤6:对整个输入图像,按照8*8个像素为单元,把整个图像分成img_width*img_height/64个cell,设当前像素在每个cell的下标为(i,j),取出当前像素的下相邻区间t,依次取出他所影响到的四个block的his,依次令mx=i+8,ny=j+8;mx=i+8,ny=j;mx=i,ny=j+8;mx=i,ny=j进行如下计算:
hist(t)=hist(t)+WEIGHT1(mx,ny)*gradweight_low;
hist(t+9)=hist(t+9)+WEIGHT2(mx,ny)*gradweight_low;
hist(t+18)=hist(t+18)+WEIGHT3(mx,ny)*gradweight_low;
hist(t+27)=hist(t+27)+WEIGHT4(mx,ny)*gradweight_low;
然后取出当前像素的上相邻区间,用权重gradweight_hig重复以上过程,当一个block的his计算完毕后,利用公式
newhist ( k ) = hist ( k ) Σ k = 0 35 hist ( k ) 对其直方图进行归一化,所有cell计算完成后,整幅图像的block计算完成;
步骤7:在原始图像上滑动检测窗口,三个窗口的大小分别为24*48,32*64,40*80,根据窗口的位置,依次取出相应的block的归一化直方图newhist,且最后插入一个数值1,将此数组和SVM参数进行点乘,如果结果result_windows大于0,则将其记录到当前窗口的windows_result,并对以其为中心的9个窗口的累积结果windows_leiji都加上t1*result_windows,最终每个窗口的结果为:t2*windows_result+t3*windows_leiji;如果此值大于判决门限,则记录此窗口左上角的坐标和长宽,一帧图像计算完毕后,将记录窗口的结果上传给DSP,且令windows_leiji=t4*windows_leiji,通过t1,t2和t3调节窗口的累积效果,通过t4调节目标跟踪效果;
步骤8:将步骤7上传的窗口进行合并,形成和别的窗口都没有重叠的独立窗口;
步骤9:利用步骤2中计算的每个单元的最大灰度信息和平均灰度信息在DSP中结合人体形态学对行人做进一步的筛选;
步骤10:按照一定比例缩小目标窗口,并在图像上用方框标出目标。
2.按照权利要求1所述多模板轮廓特征和灰度相结合的红外图像实时行人检测,其特征在于:所述步骤8中形成和别的窗口都没有重叠的独立窗口过程为如果一个窗口和别的窗口有重叠,则合并成一个包括这两个窗口的大窗口。
3.按照权利要求1所述多模板轮廓特征和灰度相结合的红外图像实时行人检测,其特征在于:所述步骤9的筛选过程为:对于步骤6中设置的门限为0.1,利用步骤2中计算的灰度信息在DSP中结合人体形态学对行人做进一步的筛选,首先窗口的上1/4的中心应该大于一个最大亮度的阈值,此阈值因为人的头部,亮度比较大进行设定,以窗口中点为中心的宽度等于1/2窗口宽度,高度等于3/4窗口高度内平均灰度的方差大于一个阈值,此阈值考虑人的衣着,和轮胎,电线杆等统一亮度的物体进行区别,且水平方向上大于一定门限值的宽度和电线杆等细长物体进行区分。
CN201410266907.2A 2014-06-17 2014-06-17 多模板轮廓特征和灰度相结合的红外图像实时行人检测 Expired - Fee Related CN104050481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410266907.2A CN104050481B (zh) 2014-06-17 2014-06-17 多模板轮廓特征和灰度相结合的红外图像实时行人检测

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410266907.2A CN104050481B (zh) 2014-06-17 2014-06-17 多模板轮廓特征和灰度相结合的红外图像实时行人检测

Publications (2)

Publication Number Publication Date
CN104050481A true CN104050481A (zh) 2014-09-17
CN104050481B CN104050481B (zh) 2017-05-03

Family

ID=51503293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410266907.2A Expired - Fee Related CN104050481B (zh) 2014-06-17 2014-06-17 多模板轮廓特征和灰度相结合的红外图像实时行人检测

Country Status (1)

Country Link
CN (1) CN104050481B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850844A (zh) * 2015-05-27 2015-08-19 成都新舟锐视科技有限公司 一种基于快速构建图像特征金字塔的行人检测方法
CN105395210A (zh) * 2015-12-22 2016-03-16 管迪 一种ct扫描成像方法
CN105608717A (zh) * 2015-12-22 2016-05-25 肖古华 一种ct系统和ct图像重建方法
CN105748105A (zh) * 2016-01-18 2016-07-13 刘焕涛 一种乳腺检查系统
CN106101614A (zh) * 2016-06-07 2016-11-09 朱兰英 一种基于三维轮廓的室内巡逻估计分析系统
CN106295693A (zh) * 2016-08-05 2017-01-04 深圳云天励飞技术有限公司 一种图像识别方法及装置
CN106778852A (zh) * 2016-12-07 2017-05-31 中国科学院信息工程研究所 一种修正误判的图像内容识别方法
CN106874881A (zh) * 2017-02-23 2017-06-20 电子科技大学 一种多模板时空关联的局部反联合稀疏表示目标跟踪方法
CN107273799A (zh) * 2017-05-11 2017-10-20 上海斐讯数据通信技术有限公司 一种室内定位方法及定位系统
CN107851327A (zh) * 2015-11-06 2018-03-27 欧姆龙株式会社 粗细搜索方法及图像处理装置
CN108111783A (zh) * 2017-12-22 2018-06-01 河南英富迪光电科技有限公司 一种野外自充电图像识别红外成像仪
CN112233116A (zh) * 2020-12-11 2021-01-15 常州微亿智造科技有限公司 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609716A (zh) * 2012-01-10 2012-07-25 银江股份有限公司 一种基于改进的hog特征和pca的行人检测方法
CN103065133A (zh) * 2013-01-21 2013-04-24 信帧电子技术(北京)有限公司 雾天行人检测方法及装置
KR20130058286A (ko) * 2011-11-25 2013-06-04 한국전자통신연구원 보행자 검출기의 보행자 검출 방법
CN103177262A (zh) * 2013-02-19 2013-06-26 山东大学 基于hog和svm的行人检测系统的fpga架构及其实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130058286A (ko) * 2011-11-25 2013-06-04 한국전자통신연구원 보행자 검출기의 보행자 검출 방법
CN102609716A (zh) * 2012-01-10 2012-07-25 银江股份有限公司 一种基于改进的hog特征和pca的行人检测方法
CN103065133A (zh) * 2013-01-21 2013-04-24 信帧电子技术(北京)有限公司 雾天行人检测方法及装置
CN103177262A (zh) * 2013-02-19 2013-06-26 山东大学 基于hog和svm的行人检测系统的fpga架构及其实现方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MICHAEL HAHNLE 等: ""FPGA-based Real-Time Pedestrian Detectionon High-Resolution Images"", 《IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION WORKSHOPS》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850844A (zh) * 2015-05-27 2015-08-19 成都新舟锐视科技有限公司 一种基于快速构建图像特征金字塔的行人检测方法
CN104850844B (zh) * 2015-05-27 2019-02-26 成都新舟锐视科技有限公司 一种基于快速构建图像特征金字塔的行人检测方法
CN107851327A (zh) * 2015-11-06 2018-03-27 欧姆龙株式会社 粗细搜索方法及图像处理装置
CN107851327B (zh) * 2015-11-06 2021-06-11 欧姆龙株式会社 粗细搜索方法、图像处理装置及记录介质
CN105395210A (zh) * 2015-12-22 2016-03-16 管迪 一种ct扫描成像方法
CN105608717A (zh) * 2015-12-22 2016-05-25 肖古华 一种ct系统和ct图像重建方法
CN105748105A (zh) * 2016-01-18 2016-07-13 刘焕涛 一种乳腺检查系统
CN106101614A (zh) * 2016-06-07 2016-11-09 朱兰英 一种基于三维轮廓的室内巡逻估计分析系统
CN106295693B (zh) * 2016-08-05 2019-06-07 杭州励飞软件技术有限公司 一种图像识别方法及装置
CN106295693A (zh) * 2016-08-05 2017-01-04 深圳云天励飞技术有限公司 一种图像识别方法及装置
CN106778852A (zh) * 2016-12-07 2017-05-31 中国科学院信息工程研究所 一种修正误判的图像内容识别方法
CN106874881A (zh) * 2017-02-23 2017-06-20 电子科技大学 一种多模板时空关联的局部反联合稀疏表示目标跟踪方法
CN106874881B (zh) * 2017-02-23 2019-09-24 电子科技大学 一种多模板时空关联的局部反联合稀疏表示目标跟踪方法
CN107273799A (zh) * 2017-05-11 2017-10-20 上海斐讯数据通信技术有限公司 一种室内定位方法及定位系统
CN108111783A (zh) * 2017-12-22 2018-06-01 河南英富迪光电科技有限公司 一种野外自充电图像识别红外成像仪
CN108111783B (zh) * 2017-12-22 2020-08-14 河南英富迪光电科技有限公司 一种野外自充电图像识别红外成像仪
CN112233116A (zh) * 2020-12-11 2021-01-15 常州微亿智造科技有限公司 基于邻域决策与灰度共生矩阵描述的凹凸痕视觉检测方法

Also Published As

Publication number Publication date
CN104050481B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN104050481A (zh) 多模板轮廓特征和灰度相结合的红外图像实时行人检测
CN102509091B (zh) 一种飞机尾号识别方法
CN105260749B (zh) 基于方向梯度二值模式和软级联svm的实时目标检测方法
CN106128121B (zh) 基于局部特征分析的车辆排队长度快速检测算法
CN106127137A (zh) 一种基于3d轨迹分析的目标检测识别算法
CN103049751A (zh) 一种改进的加权区域匹配高空视频行人识别方法
CN103902976A (zh) 一种基于红外图像的行人检测方法
CN104268528A (zh) 一种人群聚集区域检测方法和装置
Milford et al. Condition-invariant, top-down visual place recognition
CN101094413A (zh) 用于视频监控的实时运动检测方法
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN103020614B (zh) 基于时空兴趣点检测的人体运动识别方法
CN110633678B (zh) 一种基于视频图像的快速高效的车流量计算方法
Bremer et al. Eigenvalue and graph-based object extraction from mobile laser scanning point clouds
CN103593679A (zh) 一种基于在线机器学习的视觉人手跟踪方法
CN106570490A (zh) 一种基于快速聚类的行人实时跟踪方法
CN105046218A (zh) 一种基于串并行处理的多特征交通视频烟雾检测方法
CN105512622A (zh) 一种基于图分割和监督学习的可见光遥感图像海陆分割方法
CN106529391B (zh) 一种鲁棒的限速交通标志检测与识别方法
CN103077383B (zh) 基于时空梯度特征的分部位的人体运动识别方法
CN110909656A (zh) 一种雷达与摄像机融合的行人检测方法和系统
CN104835142A (zh) 一种基于纹理特征的车辆排队长度检测方法
Wang et al. Multiscale traffic sign detection method in complex environment based on YOLOv4
CN104008374B (zh) 一种矿井图像中基于条件随机场的矿工检测方法
CN102081741A (zh) 一种基于视觉注意原理的行人检测方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160120

Address after: Xi'an City, Shaanxi province Taibai Road 710071 No. 2

Applicant after: Xidian University

Address before: 105 box 710071, Xi'an Electronic and Science University, 2 Taibai South Road, Shaanxi, Xi'an

Applicant before: Quan Dongxiao

Applicant before: He Xiandeng

Applicant before: Zhu Changhua

DD01 Delivery of document by public notice

Addressee: He Xiandeng

Document name: Notification of Passing Examination on Formalities

GR01 Patent grant
GR01 Patent grant
DD01 Delivery of document by public notice
DD01 Delivery of document by public notice

Addressee: Xidian University

Document name: Notification of Passing Examination on Formalities

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170503

Termination date: 20180617