CN101945257A - 基于监控视频内容提取车辆底盘图像的合成方法 - Google Patents

基于监控视频内容提取车辆底盘图像的合成方法 Download PDF

Info

Publication number
CN101945257A
CN101945257A CN201010264070.XA CN201010264070A CN101945257A CN 101945257 A CN101945257 A CN 101945257A CN 201010264070 A CN201010264070 A CN 201010264070A CN 101945257 A CN101945257 A CN 101945257A
Authority
CN
China
Prior art keywords
image
frame
bounding volume
expression
rectangular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010264070.XA
Other languages
English (en)
Other versions
CN101945257B (zh
Inventor
路通
巫义锐
王利民
田智源
孙再亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201010264070XA priority Critical patent/CN101945257B/zh
Publication of CN101945257A publication Critical patent/CN101945257A/zh
Application granted granted Critical
Publication of CN101945257B publication Critical patent/CN101945257B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供了一种基于监控视频内容提取车辆底盘图像的合成方法,主要包括如下步骤:取帧转为灰度图片,进行预处理操作;形成运动区域不规则多边形;通过面积筛除部分不规则多边形;形成矩形包围盒;w-SIFT算法匹配;计算Y向平均偏移距离;做x方向的拉伸变换;图像拼接以及平滑过渡。本发明的有益效果在于:输入一段车辆底盘监控视频,可自动将其转换为包括该车辆完整底盘描述的单一静态图像,该图像可用于进一步的图像识别等。该方法可节省大量人工拼接图片的时间开销,并显著提高拼接后的效果;得到的结果可以直观反应监控视频所要表达的重要内容。

Description

基于监控视频内容提取车辆底盘图像的合成方法
技术领域
本发明涉及车辆运动图像监控领域,特别是一种基于监控视频内容提取车辆底盘图像的合成方法。
背景技术
近年来,视频已广泛应用于数字娱乐、电子商务、安全监控、广告宣传等众多领域,并将随着无线网络、智能移动终端等的进一步普及而快速发展。与此相应,各种基于视频的特征提取、关键帧提取、视频摘要、视频内容分析与理解等算法也逐步成为多媒体技术、计算机视觉与模式识别交叉方向中的研究热点。
传统视频监控大多依赖人工干预,而通过监控视频的内容合成则在以下方面遇到困难:1)视频内容分析容易受到拍摄质量、光照影响,且目标对象并不都位于同一成像平面,因此存在视角畸变因素的干扰;2)视频内容相对复杂,单一帧往往由对应场景下的多个目标构成,不同目标的精确分割与识别存在一定困难;3)视频数据量相对较大,内容提取算法难以做到实时、有效。因此,如何从大量视频二进制监控视频数据流中直接提取并合成其中的重要内容,已成为进一步扩展各类视频应用的瓶颈之一。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于监控视频内容提取车辆底盘图像的合成方法。
为了实现本发明所述的目的,本发明提供的一种基于监控视频内容提取车辆底盘图像的合成方法,其特征是,包含以下步骤:(1)输入车辆底盘监控视频,每间隔一段时间对视频帧取样,将每一帧转成灰度图像,并作帧间差分;
(2)设当前处理帧为fi,在帧fi中生成若干由封闭轮廓连接的多边形;
(3)通过最小包围盒面积筛选排除帧fi中不对应于汽车底盘的多边形;
(4)在帧fi中,从剩余的多边形轮廓中生成汽车底盘运动区域所对应的矩形包围盒boundary_box(fi);
(5)取帧fi的上一相邻帧fi-1,在这两帧中的矩形包围盒boundary_box(fi)与矩形包围盒boundary_box(fi-1)之间,计算得到一组匹配的特征点集合FP(fi-1,fi);
(6)遍历特征点集合FP(fi-1,fi)中的所有匹配特征点坐标值,计算两相邻帧fi-1与帧fi间的Y向平均偏移距离
Figure BSA00000245094400011
(7)取帧fi中的矩形包围盒boundary_box(fi)区域内所有像素,对其作X方向的拉伸变换,用于消除局部视频拍摄中的帧间X向视角畸变;
(8)设当前结果车辆底盘图像为Iresult,取该图像中底边为下边界、高度为Y向平均偏移距离
Figure BSA00000245094400021
的矩形区域图像为I′result;设在当前帧fi中,通过X向拉伸变换后的矩形包围盒boundary_box(fi)区域中,以顶边为上边界、高度为Y向平均偏移距离
Figure BSA00000245094400022
的矩形区域图像为I′merge(fi),将矩形区域图像I′result与算法生成的矩形区域图像I′merge(fi)作融合算法平滑过渡后,得到新的矩形区域图像Iresult;将矩形包围盒boundary_box(fi)中的其余矩形区域图像合并至矩形区域图像Iresult
本发明的步骤(1)中,间隔时间设定为20ms~100ms,优选地隔设定为30ms。
本发明步骤(1)中,彩色图片转为灰度图片采用如下公式:
gray=0.299R+0.587G+0.114B
其中R,G,B分别表示图像像素点的红色、绿色和蓝色分量,gray为灰度分量。
本发明步骤(1)中,帧间差分采用以下公式:
R m ( x , y ) = | I m i ( x , y ) - I m i - 1 ( x , y ) |
表示第i幅图像中坐标为(x,y)的点的像素灰度值。
本发明步骤(1)中,二值化处理使用如下公式:
dst ( x , y ) = 255 , if ( R m ( x , y ) > 35 ) = 0 , otherwise ,
其中dst(x,y)为(x,y)处像素二值化后的取值,其中二值化阈值取固定值35。
本发明步骤(1)中,膨胀操作使用Gaussian金字塔分解对输入图像先做向下采样,膨胀完成后作向上采样,通过上述形态学操作可以减少图像间差分所形成的细小空洞,使区域更为完整,该步骤主要用于为运动区域提取提供初始数据。
本发明步骤(2)中,先对二值化后的轮廓曲线进行最小二乘法的直线拟合,拟合后只取直线的起始点和终点进行存储,而后以若干直线段连接这些点,即可生成汽车底盘初始不规则多边形,该步骤得到由封闭曲线构成的一组不规则候选封闭轮廓。
本发明步骤(3)用于去除面积过小、不可能对应汽车底盘的候选封闭区域,其中最小包围盒面积筛选公式如下:
Area(pi)<λ0*x*y
其中pi表示各不规则候选封闭轮廓,Area(pi)为其包围盒面积,表示目标底盘区域图像面积占当前帧总图像面积大小的最小比值阈值,本发明取λ0=0.6,x为当前帧的长度、y为当前帧的宽度。
本发明中步骤(4)从剩余候选封闭轮廓生成对应于汽车底盘所对应的矩形包围盒,其方法是首先对当前帧fi中的各剩余封闭轮廓计算如下矩形运动区域:
Ic ( c i ) x 0 = ( 1 - a ) min ( x i ) + a max ( x i ) y 0 = ( 1 - c ) min ( y i ) + c max ( y i ) height = ( 1 - c - d ) ( max ( y i ) - min ( y i ) ) width = ( 1 - a - b ) ( max ( x i ) - min ( x i ) ) ( x i , y i ) ∈ boundary ( c i ) ,
其中boundary(ci)是某封闭轮廓ci对应的边界轮廓,其中ci∈fi,a、b、c、d为其矩形运动区域调节系数,,a,b,c,d取值由用户自主确定,取值范围在0到1之间,a,b,c,d的不同取值将影响矩形在视频帧中的生成位置,以这些矩形为基础可以展开拼接操作,本发明中优选地分别取a=0.05,b=0.35,c=0.05,d=0.50,x0表示矩形包围盒左上点的横坐标,y0表示矩形包围盒左上点的纵坐标,width表示矩形包围盒的长,hegitht表示矩形包围盒的宽,(xi,yi)代表封闭轮廓ci中的具体某一点,a取值将影响x0位置,c取值将影响y0位置,a,b共同作用影响width变量,c,d共同作用影响hegitht变量。然后应用如下方法得到最终底盘矩形包围盒boundary_box(fi):
boudnary _ box ( f i ) x avg = Σ i = 0 N w i x i y avg = Σ 0 N w i y i height avg = Σ 0 N w i height i width avg = Σ 0 N w i width i where Σ 0 N w i = 1 ,
xavg表示矩形包围盒左上点的横坐标,yavg表示矩形包围盒左上点的纵坐标,widthavg表示矩形包围盒的长,hegithtavg表示矩形包围盒的宽,wi表示权值序列,其取值特征为中间所占比重大,序列头尾所占比重小,0≤wi≤1,所述
Figure BSA00000245094400033
表示各视频帧矩形框的权值总和为1。
本发明中,由于所输入的车辆底盘监控视频可能存在成像质量差、光照干扰大、车辆运动速度快缺点,在步骤(5)中,使用一种针对现有尺度不变特征变换算法(以下简称SIFT算法)的改进算法,来计算两相邻帧fi-1与fi中的匹配特征点,步骤如下:
(a)使用如下高斯核函数建立图像的尺度空间:
G ( x , y ) = 1 2 π σ 2 e - ( ( ξ x x ) 2 + ( ξ y y ) 2 ) 2 σ 2 ,
其中ξx和ξy分别为X向与Y向调节系数,本发明取ξx=2,ξy=1,并由此将SIFT算法中的128维特征向量减少至64维;
(b)分别在矩形包围盒boundary_box(fi-1)与矩形包围盒boundary_box(fi)中按上式计算SIFT特征点;该特征点计算包含以下步骤:构造差分尺度空间;在差分尺度空间中进行候选特征点检测,候选特征点指该点像素值与其相邻26点相比为极小值或极大值;对特征点进行精确定位,剔除一些对比度低的点以及边缘相应点;当然,计算特征点可以采用现有方法实现,具体参见相关论文:DAVID G.LOWE Distinctive ImageFeatures from Scale-Invariant Keypoints.International Journal of Computer Vision 60(2),91-110,2004。
(c)对帧fi-1与帧fi中计算出的任意两个SIFT特征点(x1,y1)与(x2,y2),采用如下改进公式计算其匹配度:
dfinal(x1,y1),(x2,y2)=dEuclidean((x1,y1),(x2,y2))+dextrs((x1,y1),(x2,y2))其中dEuclidean表示两点间的欧氏距离,dextea表示两个特征点间的偏移量,由下式获得:
Figure BSA00000245094400042
其中ξmax表示最大X坐标位移阈值,所述ξmax≥0;在本发明中,ξmax取10;
(d)将特征点匹配度大小升序排序,计算最近邻和次近邻的比值,并判断该比值是否小于设定的阈值,如果小于等于设定的阈值则保留该特征点成为SIFT匹配点,而后将所有SIFT匹配点加入匹配特征点集合FP(fi-1,fi),否则不将该点加入匹配特征点集合,本发明中优选该阈值为0.49;
本发明的步骤(6)中,两相邻帧fi-1与帧fi间Y向平均偏移距离
Figure BSA00000245094400043
的计算方法公式为:
Δ y ~ i ( f i - 1 , f i ) = Σ j = 1 n ( f i - 1 , f i ) ξ j Δ y j ,
其中n(fi-1,fi)表示集合FP(fi-1,fi)中的匹配点个数,Δy表示匹配点间Y坐标的差值,其中ξj变量表示权值,由下式确定:
ξ j = K j Σ K j ,
且,
K j = 1 n ( f i - 1 , f i ) - 1 Σ k = 1 n ( f i - 1 , f i ) ( Δy j - Δ y k ) 2 .
本发明步骤(7)中,帧间X向畸变消除计算公式为
Figure BSA00000245094400053
y)为畸变消除前的像素坐标,Itarget(x’,y’)为畸变消除后的像素坐标。Itarget(x′,y′)表示畸变消除后图像中(x′,y′)位置的像素值,Isource(x,y)表示畸变消除前图像中(x,y)处的像素值,上式中,表示进行线性插值时的权值系数,Su表示畸变消除拉伸系数,S0表示基础调整值,k表示拉伸斜率值,且k取值范围为1.2~1.5,S0需要根据视频帧宽度大小具体取值,S0取值需要大于0,本发明中优选地取值为30,所述表示x上取整运算。本发明步骤(8)中,对图像拼接处的平滑过渡算法公式为:
(1-ω(y))Iresult(x,y)+ω(y)I′merge(fi)(x,y),(x,y)∈Iresult⌒I′merge(fi)
其中ω为平滑系数,ω(y)=y/length。式中y表示纵坐标取值,length表示视频宽度。
有益效果:输入一段车辆底盘监控视频,可自动将其转换为包括该车辆完整底盘描述的单一静态图像,该图像可用于进一步的图像识别等。该方法可节省大量人工拼接图片的时间开销,并显著提高拼接后的效果;得到的结果可以直观反应监控视频所要表达的重要内容
本发明针对车辆底盘监控中的实时安全检测、危险品检查等需求,直接从监控视频中提取、生成一副完整车辆底盘图像,节省大量人工拼接图片的时间开销。所得结果可进一步用于车辆底盘危险品自动检查、底盘异常物品识别、车辆底盘损坏及异常实时报警等,可适用于各类安全检测、车辆维护等场合。与监控视频相比,可大大节省人工监控的时间开销、成本低,可靠性高;且所保存的单一静态图像数据量小、便于维护、查询与管理。本发明算法适合于低质量车辆底盘监控视频的合成。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明流程图。
图2为本发明汽车底盘所对应的矩形包围盒示例图。
图3为本发明针对汽车底盘初始不规则多边形生成效果图。
图4为本发明w-SIFT算法描述子改进示例图。
图5为本发明相邻图片偏移示例图。
图6为本发明成像场景演示示例图。
图7为本发明针对汽车底盘融合拼接效果图。
具体实施方式:
基于运动目标合成的视频内容提取方法的基本出发点是通过对视频隔固定时间取帧,转化为灰度图片,图片经一系列预处理操作后得到矩形运动区域,后进行改进w-SIFT匹配,根据匹配点y坐标的偏移值做拼接操作,并消除局部匹配的畸变,匹配区域拼接融合后可得到一副运动目标完整图像。
下面结合附图对本发明做更加详细的解释:
如图1所示。图1中的步骤1是初始动作,输入车辆底盘监控视频。
步骤2隔固定时间间隔30ms对视频帧取样;并采用下述公式将每一帧转成灰度图像
gray=0.299R+0.587G+0.114B
其中R,G,B分别表示图像像素点的红色、绿色和蓝色分量,gray为灰度分量;
而后按作帧间差分,公式如下:
R m ( x , y ) = | I m i ( x , y ) - I m i - 1 ( x , y ) |
Figure BSA00000245094400062
表示视频m的第i幅图像中坐标为(x,y)的点的像素灰度值,Rm(x,y)为帧间差分结果。
接着进行二值化处理,公式如下:
dst ( x , y ) = 255 , if ( R m ( x , y ) > 35 ) = 0 , otherwise ,
其中dst(x,y)为(x,y)处像素二值化后的取值,其中二值化阈值取固定值35。
最后进行膨胀操作,该操作使用Gaussian金字塔分解对输入图像先做向下采样,膨胀完成后作向上采样,通过上述形态学操作可以减少图像间差分所形成的细小空洞,使区域更为完整。该步骤主要用于为运动区域提取提供初始数据。
步骤3中先对二值化后的轮廓曲线进行最小二乘法的直线拟合,拟合后只取直线的起始点和终点进行存储,而后以若干直线段连接这些点,即可生成汽车底盘初始不规则封闭多边形,关于汽车底盘的具体应用示例的初始不规则多边形生成效果如图3所示,图中深黑色曲线即为初始不规则多边形,这些不规则多边形共同描述了视频帧中的运动区域,下一步将需要从中筛选出汽车底盘运动区域。
本发明中,由于步骤三中生成的多边形个数较多,可使用最小包围盒面积筛选公式去除面积过小、不可能对应汽车底盘的候选封闭区域,该公式如下:
Area(pi)<λ0*x*y
其中pi表示各不规则候选封闭轮廓,Area(pi)为其包围盒面积,λ0表示目标底盘区域面积占当前帧总面积大小的最小比值阈值,本发明取λ0=0.6,x、y分别为当前帧的长度与宽度。
步骤5中使用公式处理当前帧fi中的各剩余封闭轮廓计算如下矩形区域:
Ic ( c i ) x 0 = ( 1 - a ) min ( x i ) + a max ( x i ) y 0 = ( 1 - c ) min ( y i ) + c max ( y i ) height = ( 1 - c - d ) ( max ( y i ) - min ( y i ) ) width = ( 1 - a - b ) ( max ( x i ) - min ( x i ) ) ( x i , y i ) ∈ boundary ( c i ) ,
其中boundary(ci)是封闭轮廓ci对应的边界轮廓其中ci∈fi,a、b、c、d为其矩形运动区域调节系数,在发明实施例中分别取a=0.05,b=0.35,c=0.05,d=0.50,a,b,c,d取值也可由用户自由确定,取值范围在0到1之间,a,b,c,d的不同取值将影响矩形在视频帧中的生成位置,后续步骤则将以这些矩形为基础可以展开拼接操作;x0表示矩形包围盒左上点的横坐标,y0表示矩形包围盒左上点的纵坐标,width表示矩形包围盒的长,hegitht表示矩形包围盒的宽,(xi,yi)代表封闭轮廓ci中的具体某一点。
该公式效果示意图如图2所示,可见在闭合的不规则区域中形成了所需要的矩形区域,其中,height为本发明步骤5中的矩形包围盒高度;width为本发明步骤5中的矩形包围盒宽度;
根据如下步骤得到最终底盘矩形包围盒boundary_box(fi):
boudnary _ box ( f i ) x avg = Σ i = 0 N w i x i y avg = Σ 0 N w i y i height avg = Σ 0 N w i height i width avg = Σ 0 N w i width i where Σ 0 N w i = 1
xavg表示矩形包围盒左上点的横坐标,yavg表示矩形包围盒左上点的纵坐标,widthavg表示矩形包围盒的长,hegithtavg表示矩形包围盒的宽,wi表示权值序列,其取值特征为中间所占比重大,序列头尾所占比重小,0≤wi≤1,
Figure BSA00000245094400082
表示各视频帧矩形框的权值总和应为1。
步骤6中,在步骤5中,由于所输入的车辆底盘监控视频可能存在成像质量差、光照干扰大、车辆运动速度快缺点,使用一种针对现有尺度不变特征变换算法(以下简称SIFT算法)的改进算法,来计算两相邻帧fi-1与fi中的匹配特征点,步骤如下:
(a)使用如下高斯核函数建立图像的尺度空间:
G ( x , y ) = 1 2 π σ 2 e - ( ( ξ x x ) 2 + ( ξ y y ) 2 ) 2 σ 2 ,
其中ξx和ξy分别为X向与Y向调节系数,本发明取ξx=2,ξy=1,并由此将SIFT算法中的128维特征向量减少至64维,具体改变如图4所示,中间图形表明特征向量在上述两种方法中具体的构造方法,128维将形成如左图的特征向量,64维则将构成如右图的特征向量;
(b)分别在矩形包围盒boundary_box(fi-1)与矩形包围盒boundary_box(fi)中按上式计算SIFT特征点;该特征点计算包含以下步骤:构造差分尺度空间;在差分尺度空间中进行候选特征点检测,候选特征点指该点像素值与其相邻26点相比为极小值或极大值;对特征点进行精确定位,剔除一些对比度低的点以及边缘相应点;当然,计算特征点可以采用现有方法实现,具体参见相关论文:DAVID G.LOWE Distinctive Image Features from Scale-Invariant Keypoints.Intemational Journal of Computer Vision 60(2),91-110,2004。
(c)对帧fi-1与帧fi中计算出的任意两个SIFT特征点(x1,y1)与(x2,y2),采用如下改进公式计算其匹配度:
dfinal(x1,y1),(x2,y2)=dEuclidean((x1,y1),(x2,y2))+dextra((x1,y1),(x2,y2))
其中dEnclidean表示两点间的欧氏距离,dextra表示两个特征点间的偏移量,由下式获得:
d extra = ∞ , y 2 - y 1 > 0 or | x 2 - x 1 | > ξ max 0 , otherwise ,
其中ξmax表示最大X坐标位移阈值,所述ξmax≥0;在本发明中,ξmax取10;
(d)将特征点匹配度大小升序排序,计算最近邻和次近邻的比值,并判断该比值是否小于设定的阈值,如果小于等于设定的阈值则保留该特征点成为SIFT匹配点,而后将所有SIFT匹配点加入匹配特征点集合FP(fi-1,fi),如果大于则不将该点加入匹配特征点集合,本发明中优选该阈值为0.49;
步骤7中,本发明所针对的应用场景如图5所示,纵坐标为位移,横坐标为时间,图中两个箭头之间为相邻两帧之间的距离
Figure BSA00000245094400092
遍历特征点集合FP(fi-1,fi)中的所有匹配特征点坐标值,计算两相邻帧fi-1与fi间的Y向平均偏移距离
Figure BSA00000245094400093
Y向平均偏移距离
Figure BSA00000245094400094
的计算方法公式为:
Figure BSA00000245094400095
其中n(fi-1,fi)表示集合FP(fi-1,fi)中的匹配点个数,Δy表示匹配点间Y坐标的差值,ξj由下式确定:
ξ j = K j Σ K j ,
且, K j = 1 n ( f i - 1 , f i ) - 1 Σ k = 1 n ( f i - 1 , f i ) ( Δ y j - Δ y k ) 2 .
步骤8中,本应用的成像场景如图6所示,可见视频拍摄存在一定的倾斜角度导致了成像空间与车辆底盘空间不同进而使车辆底盘投影在视频中的图像将会产生x方向的畸变,因而取当前帧fi中的矩形包围盒boundary_box(fi)区域内所有像素,采用基于帧间X向偏移量做如下计算,以完成X方向的拉伸变换,消除局部视频拍摄中的视角畸变,该计算公式为;
Figure BSA00000245094400098
其中Isource(x,y)为畸变消除前的像素坐标,Itarget(x’,y’)为畸变消除后的像素坐标。Itarget(x′,y′)表示畸变消除后图像中(x′,y′)位置的像素值,Isource(x,y)表示畸变消除前图像中(x,y)处的像素值,上式中
Figure BSA00000245094400101
,表示进行线性插值时的权值系数,Su表示畸变消除拉伸系数,S0表示基础调整值,k表示拉伸斜率值,且k取值范围为1.2~1.5,S0需要根据视频帧宽度大小具体取值,S0取值需要大于0,本发明中优选地取值为30,所述
Figure BSA00000245094400102
表示x上取整运算。
步骤9中,设当前结果车辆底盘图像为Iresult,取该图像中底边为下边界、高度为Y向平均偏移距离
Figure BSA00000245094400103
的矩形区域作为I′result;设在当前帧fi中,通过X向拉伸变换后的矩形包围盒boundary_box(fi)区域中,以顶边为上边界、高度为Y向平均偏移距离
Figure BSA00000245094400104
的矩形区域为I′merge(fi),将当前结果车辆底盘图像I′result与算法生成的图像I′merge(fi)作融合算法平滑过渡后,得到新的Iresult;矩形包围盒boundary_box(fi)中的其余矩形区域直接合并至Iresult
图像拼接处的平滑过渡算法公式如下:
(1-ω(y))Iresult(x,y)+ω(y)I′mergw(fi)(x,y),(x,y)∈Iresult⌒I′merge(fi)
其中ω为平滑系数,ω(y)=y/length,,式中y表示纵坐标取值,length表示视频宽度。
最后可完成监控视频内容提取,合成一幅汽车底盘图像,具体应用示例的合成拼接效果如图7所示。
本发明提供了一种基于监控视频内容提取车辆底盘图像的合成方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (10)

1.一种基于监控视频内容提取车辆底盘图像的合成方法,其特征在于,包含以下步骤:
(1)输入车辆底盘监控视频,每间隔一段时间对视频帧取样,将每一帧转成灰度图像,并作帧间差分;
(2)设当前处理帧为fi,在帧fi中生成若干由封闭轮廓连接的多边形;
(3)通过最小包围盒面积筛选排除帧fi中不对应于汽车底盘的多边形;
(4)在帧fi中,从剩余的多边形轮廓中生成汽车底盘运动区域所对应的矩形包围盒boundary_box(fi);
(5)取帧fi的上一相邻帧fi-1,在这两帧中的矩形包围盒boundary_box(fi)与矩形包围盒boundary_box(fi-1)之间,计算得到一组匹配的特征点集合FP(fi-1,fi);
(6)遍历特征点集合FP(fi-1,fi)中的所有匹配特征点坐标值,计算两相邻帧fi-1与帧fi间的Y向平均偏移距离
Figure FSA00000245094300011
(7)取帧fi中的矩形包围盒boundary_box(fi)区域内所有像素,对其作X方向的拉伸变换,用于消除局部视频拍摄中的帧间X向视角畸变;
(8)设当前结果车辆底盘图像为Iresult,取该图像中底边为下边界、高度为Y向平均偏移距离
Figure FSA00000245094300012
的矩形区域图像为I′result;设在当前帧fi中,通过X向拉伸变换后的矩形包围盒boundary_box(fi)区域中,以顶边为上边界、高度为Y向平均偏移距离
Figure FSA00000245094300013
的矩形区域图像为I′merge(fi),将矩形区域图像I′result与算法生成的矩形区域图像I′merge(fi)作融合算法平滑过渡后,得到新的矩形区域图像Iresult;将矩形包围盒boundary_box(fi)中的其余矩形区域图像合并至矩形区域图像Iresult
2.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(1)中,间隔时间设定为20ms~100ms;
将每一帧转成灰度图像采用如下公式:
gray=0.299R+0.587G+0.114B,
其中R,G,B分别表示图像像素点的红色、绿色和蓝色分量,gray为灰度分量;
帧间差分采用以下公式:
R m ( x , y ) = | I m i ( x , y ) - I m i - 1 ( x , y ) | ,
Figure FSA00000245094300015
表示视频m的第i幅图像中坐标为(x,y)的点的像素灰度值,Rm(x,y)为帧间差分结果。
3.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(1)中,包括二值化处理和膨胀操作,所述二值化处理使用如下公式:
dst ( x , y ) = 255 , if ( R m ( x , y ) > 35 ) = 0 , otherwise ,
其中dst(x,y)为(x,y)处像素二值化后的取值;
所述膨胀操作对输入图像先做向下采样,膨胀完成后作向上采样,用于减少图像间差分所形成的细小空洞,使区域图像完整。
4.如权利要求3所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(2)中,先对二值化后的轮廓曲线进行最小二乘法的直线拟合,拟合后只取直线的起始点坐标和终点坐标进行存储,而后以直线段连接所述起始点坐标和终点坐标,即生成车辆底盘初始多边形。
5.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,最小包围盒面积筛选公式如下:
Area(pi)<λ0*x*y
其中pi表示各不规则候选封闭轮廓,Area(pi)为其包围盒面积,λ0表示目标底盘区域图像面积占当前帧总图像面积大小的最小比值阈值,x为当前帧的长度、y为当前帧的宽度。
6.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(4)中,从剩余的多边形轮廓中生成汽车底盘运动区域所对应的矩形包围盒boundary_box(fi)包括如下步骤,
对当前帧fi中的各剩余封闭轮廓计算如下矩形区域:
Ic ( c i ) x 0 = ( 1 - a ) min ( x i ) + a max ( x i ) y 0 = ( 1 - c ) min ( y i ) + c max ( y i ) height = ( 1 - c - d ) ( max ( y i ) - min ( y i ) ) width = ( 1 - a - b ) ( max ( x i ) - min ( x i ) ) ( x i , y i ) ∈ boundary ( c i ) ,
其中boundary(ci)是封闭轮廓ci对应的边界轮廓,其中ci∈fi,a、b、c、d为其矩形运动区域调节系数,a、b、c、d取值范围为0~1之间的任意实数;x0表示矩形包围盒左上点的横坐标,y0表示矩形包围盒左上点的纵坐标,width表示矩形包围盒的长,hegitht表示矩形包围盒的宽,(xi,yi)代表封闭轮廓ci中的一点;
根据如下步骤得到最终底盘矩形包围盒boundary_box(fi):
boudnary _ box ( f i ) x avg = Σ i = 0 N w i x i y avg = Σ 0 N w i y i height avg = Σ 0 N w i height i width avg = Σ 0 N w i width i where Σ 0 N w i = 1 ,
xavg表示矩形包围盒左上点的横坐标,yavg表示矩形包围盒左上点的纵坐标,widthavg表示矩形包围盒的长,hegithtavg表示矩形包围盒的宽,wi表示权值序列,0≤wi≤1,所述
Figure FSA00000245094300032
表示各视频帧矩形框的权值总和为1。
7.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(5)中,计算两相邻帧fi-1与fi中的匹配特征点的步骤如下:
(a)使用如下高斯核函数建立图像的尺度空间:
G ( x , y ) = 1 2 π σ 2 e - ( ( ξ x x ) 2 + ( ξ y y ) 2 ) 2 σ 2 ,
其中ξx和ξy分别为X向与Y向调节系数;
(b)分别在矩形包围盒boundary_box(fi-1)与矩形包围盒boundary_box(fi)中计算特征点;
(c)对帧fi-1与帧fi中计算出的特征点(x1,y1)与特征点(x2,y2),采用如下公式计算其匹配度:
dfinal(x1,y1),(x2,y2)=dEuclidean((x1,y1),(x2,y2))+dextra((x1,y1),(x2,y2)),
其中dEuclidean表示两点间的欧氏距离,dextra表示两个特征点间的偏移量,由下式获得:
d extra = ∞ , y 2 - y 1 > 0 or | x 2 - x 1 | > ξ max 0 , otherwise ,
其中ξmax表示最大X坐标位移阈值,所述ξmax≥0;
(d)将特征点匹配度大小升序排序,计算最近邻和次近邻的比值,并判断该比值是否小于设定的阈值,如果小于等于设定的阈值则保留该特征点成为SIFT匹配点,而后将所有SIFT匹配点加入匹配特征点集合FP(fi-1,fi),否则不将该点加入匹配特征点集合。
8.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,在步骤(6)中,相邻的帧fi-1与帧fi间Y向平均偏移距离
Figure FSA00000245094300041
的计算公式为:
Figure FSA00000245094300042
其中n(fi-1,fi)表示集合FP(fi-1,fi)中的匹配点个数,Δy表示匹配点间Y坐标的差值,其中ξj变量表示权值,由下式确定:
ξ j = K j Σ K j ,
且, K j = 1 n ( f i - 1 , f i ) Σ k = 1 n ( f i - 1 , f i ) ( Δ y i - Δ y k ) 2 .
9.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(7)中,帧间X向视角畸变消除计算公式为:
Figure FSA00000245094300045
其中Isource(x,y)为畸变消除前的像素坐标,Itarget(x’,y’)为畸变消除后的像素坐标;Itarget(x′,y′)表示畸变消除后图像中(x′,y′)位置的像素值,Isource(x,y)表示畸变消除前图像中(x,y)处的像素值,上式中
Figure FSA00000245094300051
,表示进行线性插值时的权值系数,Su表示畸变消除拉伸系数,S0表示基础调整值,k表示拉伸斜率值,且k取值范围为1.2~1.5,
Figure FSA00000245094300052
表示x上取整运算。
10.如权利要求1所述的基于监控视频内容提取车辆底盘图像的合成方法,其特征是,步骤(8)中,将矩形区域图像I′result与算法生成的矩形区域图像I′merge(fi)作融合算法平滑过渡的公式为:
(1-ω(y))Iresult(x,y)+ω(y)I′merge(fi)(x,y),(x,y)∈Iresult⌒I′merge(fi),
其中ω为平滑系数,ω(y)=y/length,式中y表示纵坐标取值,length表示视频宽度。
CN201010264070XA 2010-08-27 2010-08-27 基于监控视频内容提取车辆底盘图像的合成方法 Expired - Fee Related CN101945257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010264070XA CN101945257B (zh) 2010-08-27 2010-08-27 基于监控视频内容提取车辆底盘图像的合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010264070XA CN101945257B (zh) 2010-08-27 2010-08-27 基于监控视频内容提取车辆底盘图像的合成方法

Publications (2)

Publication Number Publication Date
CN101945257A true CN101945257A (zh) 2011-01-12
CN101945257B CN101945257B (zh) 2012-03-28

Family

ID=43436989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010264070XA Expired - Fee Related CN101945257B (zh) 2010-08-27 2010-08-27 基于监控视频内容提取车辆底盘图像的合成方法

Country Status (1)

Country Link
CN (1) CN101945257B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338325A (zh) * 2013-06-14 2013-10-02 杭州普维光电技术有限公司 基于全景摄像机的车底盘图像采集方法
CN103646248A (zh) * 2013-11-28 2014-03-19 西安理工大学 基于双目线阵ccd汽车底盘成像的异物检测方法
CN103714524A (zh) * 2013-12-20 2014-04-09 鞍钢股份有限公司 一种冷轧带钢表面图像自动融合方法
CN103986912A (zh) * 2014-05-21 2014-08-13 南京大学 基于民用ipc的双向实时车辆底盘图像合成方法
CN104484997A (zh) * 2014-12-24 2015-04-01 福州大学 一种基于视频图像技术的区域运动车流量检测方法
CN105308649A (zh) * 2013-06-27 2016-02-03 罗伯特·博世有限公司 机动车底部异形表面的检查
CN105611141A (zh) * 2014-11-17 2016-05-25 现代自动车株式会社 检查车身的系统及其方法
WO2016107478A1 (zh) * 2014-12-30 2016-07-07 清华大学 车辆底盘检查方法和系统
CN106251695A (zh) * 2016-09-29 2016-12-21 成都通甲优博科技有限责任公司 基于车位状态监控的目的地停车位智能推荐系统及方法
CN106608220A (zh) * 2015-10-22 2017-05-03 比亚迪股份有限公司 车辆底部影像的生成方法、装置和车辆
CN109816045A (zh) * 2019-02-11 2019-05-28 青岛海信智能商用系统股份有限公司 一种商品识别方法及装置
CN110751151A (zh) * 2019-10-12 2020-02-04 上海眼控科技股份有限公司 车身图像的文本字符检测方法及设备
CN112801874A (zh) * 2021-02-03 2021-05-14 广州六环信息科技有限公司 一种车辆图像拼接方法、装置和车辆
CN112988098A (zh) * 2021-04-06 2021-06-18 恒玄科技(上海)股份有限公司 终端设备、图像处理方法和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040170327A1 (en) * 2001-06-19 2004-09-02 Whoi-Yul Kim Method of extracting shape variation descriptor for retrieving image sequence
CN101159855A (zh) * 2007-11-14 2008-04-09 南京优科漫科技有限公司 基于特征点分析的多目标分离预测方法
US20080226253A1 (en) * 2005-08-17 2008-09-18 Orad Hi-Tec Systems Ltd. System and Method For Managing the Visual Effects Insertion in a Video Stream
CN101770568A (zh) * 2008-12-31 2010-07-07 南京理工大学 基于仿射不变点及光流计算的目标自动识别和跟踪方法
CN101770643A (zh) * 2008-12-26 2010-07-07 富士胶片株式会社 图像处理装置、图像处理方法以及图像处理程序

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040170327A1 (en) * 2001-06-19 2004-09-02 Whoi-Yul Kim Method of extracting shape variation descriptor for retrieving image sequence
US20080226253A1 (en) * 2005-08-17 2008-09-18 Orad Hi-Tec Systems Ltd. System and Method For Managing the Visual Effects Insertion in a Video Stream
CN101159855A (zh) * 2007-11-14 2008-04-09 南京优科漫科技有限公司 基于特征点分析的多目标分离预测方法
CN101770643A (zh) * 2008-12-26 2010-07-07 富士胶片株式会社 图像处理装置、图像处理方法以及图像处理程序
CN101770568A (zh) * 2008-12-31 2010-07-07 南京理工大学 基于仿射不变点及光流计算的目标自动识别和跟踪方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103338325A (zh) * 2013-06-14 2013-10-02 杭州普维光电技术有限公司 基于全景摄像机的车底盘图像采集方法
US10482347B2 (en) 2013-06-27 2019-11-19 Beissbarth Gmbh Inspection of the contoured surface of the undercarriage of a motor vehicle
CN105308649A (zh) * 2013-06-27 2016-02-03 罗伯特·博世有限公司 机动车底部异形表面的检查
CN103646248B (zh) * 2013-11-28 2016-08-03 西安理工大学 基于双目线阵ccd汽车底盘成像的异物检测方法
CN103646248A (zh) * 2013-11-28 2014-03-19 西安理工大学 基于双目线阵ccd汽车底盘成像的异物检测方法
CN103714524B (zh) * 2013-12-20 2016-05-11 鞍钢股份有限公司 一种冷轧带钢表面图像自动融合方法
CN103714524A (zh) * 2013-12-20 2014-04-09 鞍钢股份有限公司 一种冷轧带钢表面图像自动融合方法
CN103986912B (zh) * 2014-05-21 2017-04-12 南京大学 基于民用ipc的双向实时车辆底盘图像合成方法
CN103986912A (zh) * 2014-05-21 2014-08-13 南京大学 基于民用ipc的双向实时车辆底盘图像合成方法
CN105611141A (zh) * 2014-11-17 2016-05-25 现代自动车株式会社 检查车身的系统及其方法
CN104484997A (zh) * 2014-12-24 2015-04-01 福州大学 一种基于视频图像技术的区域运动车流量检测方法
WO2016107478A1 (zh) * 2014-12-30 2016-07-07 清华大学 车辆底盘检查方法和系统
CN106608220B (zh) * 2015-10-22 2019-06-25 比亚迪股份有限公司 车辆底部影像的生成方法、装置和车辆
CN106608220A (zh) * 2015-10-22 2017-05-03 比亚迪股份有限公司 车辆底部影像的生成方法、装置和车辆
CN106251695A (zh) * 2016-09-29 2016-12-21 成都通甲优博科技有限责任公司 基于车位状态监控的目的地停车位智能推荐系统及方法
CN109816045A (zh) * 2019-02-11 2019-05-28 青岛海信智能商用系统股份有限公司 一种商品识别方法及装置
CN110751151A (zh) * 2019-10-12 2020-02-04 上海眼控科技股份有限公司 车身图像的文本字符检测方法及设备
CN112801874B (zh) * 2021-02-03 2024-04-05 广州六环信息科技有限公司 一种车辆图像拼接方法、装置和车辆
CN112801874A (zh) * 2021-02-03 2021-05-14 广州六环信息科技有限公司 一种车辆图像拼接方法、装置和车辆
CN112988098A (zh) * 2021-04-06 2021-06-18 恒玄科技(上海)股份有限公司 终端设备、图像处理方法和存储介质

Also Published As

Publication number Publication date
CN101945257B (zh) 2012-03-28

Similar Documents

Publication Publication Date Title
CN101945257B (zh) 基于监控视频内容提取车辆底盘图像的合成方法
CN107818303B (zh) 无人机油气管线影像自动对比分析方法、系统及软件存储器
CN105182350B (zh) 一种应用特征跟踪的多波束声呐目标探测方法
CN102132323A (zh) 自动图像矫直
JPH0877334A (ja) 顔画像の特徴点自動抽出方法
CN101577005A (zh) 一种目标跟踪方法及装置
CN105678318B (zh) 交通标牌的匹配方法及装置
US9196053B1 (en) Motion-seeded object based attention for dynamic visual imagery
CN108171157A (zh) 基于多尺度局部块LBP直方图特征与Co-HOG特征相结合的人眼检测算法
Kanter Color Crack: Identifying Cracks in Glass
CN108038458B (zh) 基于特征摘要图的视频中的户外场景文本自动获取方法
CN111062331A (zh) 图像的马赛克检测方法、装置、电子设备及存储介质
Katramados et al. Real-time visual saliency by division of gaussians
CN115063785A (zh) 高速公路场景使用目标识别模型定位车牌的方法及装置
US10796442B2 (en) Two-dimensional image depth of field generation method and device
CN109711420B (zh) 基于人类视觉注意机制的多仿射目标的检测与识别方法
CN111028263A (zh) 一种基于光流颜色聚类的运动物体分割方法及其系统
CN102930292A (zh) 一种基于p-SIFT特征的物体识别方法
KR101334794B1 (ko) 특징정보를 이용하는 꽃 인식 장치 및 방법
JP5201184B2 (ja) 画像処理装置及びプログラム
CN111079516B (zh) 基于深度神经网络的行人步态分割方法
CN112734914A (zh) 一种增强现实视觉的图像立体重建方法及装置
CN110111368B (zh) 一种基于人体姿态识别的相似移动目标的检测跟踪方法
Bala et al. Image simulation for automatic license plate recognition
CN106056575A (zh) 一种基于似物性推荐算法的图像匹配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120328

Termination date: 20170827

CF01 Termination of patent right due to non-payment of annual fee