CN104408701A - 一种大场景视频图像拼接方法 - Google Patents

一种大场景视频图像拼接方法 Download PDF

Info

Publication number
CN104408701A
CN104408701A CN201410727895.9A CN201410727895A CN104408701A CN 104408701 A CN104408701 A CN 104408701A CN 201410727895 A CN201410727895 A CN 201410727895A CN 104408701 A CN104408701 A CN 104408701A
Authority
CN
China
Prior art keywords
background
image
point
images
prospect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410727895.9A
Other languages
English (en)
Other versions
CN104408701B (zh
Inventor
程德强
郑珍
刘洋
王仕琛
张剑英
张媛媛
张佳琳
邓杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN201410727895.9A priority Critical patent/CN104408701B/zh
Publication of CN104408701A publication Critical patent/CN104408701A/zh
Priority to PCT/CN2015/094076 priority patent/WO2016086754A1/zh
Application granted granted Critical
Publication of CN104408701B publication Critical patent/CN104408701B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction

Abstract

本发明公开了一种大场景视频图像拼接方法,该方法包括:采集两路拍摄场景有重叠的两路视频数据;对两路视频数据提取两幅背景图像,计算两幅背景图像间的单应性变换矩阵,通过单应性变换矩阵确定两幅背景图像的重叠背景区域;利用背景变换矩阵对两幅背景图像进行变换、拼接、融合得到当前帧的背景拼接图像;逐帧对两路视频数据提取两幅前景图像;对在重叠背景区域的前景图像提取特征点并匹配,利用匹配的特征点位置关系对背景变换矩阵中的图像平移参数进行调整,得到前景图像的变换矩阵,通过前景变换矩阵对两幅前景图像进行变换、拼接、融合;将前景拼接图像与背景拼接图像合成当前帧的拼接图像。本发明实施例可以满足拼接实时性的要求。

Description

一种大场景视频图像拼接方法
技术领域
本发明实施例涉及图像技术领域,尤其涉及一种大场景视频图像拼接方法。
背景技术
视频拼接技术利用多路有重合区域的视角的视频经过变换、拼接、融合成为一个大视场的视频,相对于使用鱼眼镜头或者广角镜头获取大视场视频,有着畸变小,宽动态,更高分辨率等优点,视频拼接技术是静态图像拼接技术的拓展,但是对实时性有很高要求,如果对视频逐帧应用静态图像拼接方法进行拼接,因为目前已有图像拼接方法非常耗时,这样将无法满足视频拼接实时性的要求,现有技术通过对最初的视频帧图像运用静态图像拼接算法计算视频帧之间的单应性变换矩阵,之后的所有视频帧都使用最初得到的单应性变换矩阵进行变换、拼接、融合,因为少去了对每次对帧图像间变换矩阵的计算,大大提高拼接的速度,来满足实时性的要求。但是因为前景的运动,之后的帧图像间单应性变换矩阵发生变换,拼接得到的视频帧图像拼接效果不好,将会出现“鬼影”。
发明内容
本发明提供一大场景视频图像拼接方法,用以满足拼接实时性的要求。
本发明实施例提供一种大场景视频图像拼接方法,该方法包括:
步骤A、采集两路拍摄场景有重叠的两路视频数据;
步骤B、对所述两路视频数据提取两幅背景图像,计算所述两幅背景图像间的单应性变换矩阵,通过所述单应性变换矩阵确定所述两幅背景图像的重叠背景区域;利用背景变换矩阵对所述两幅背景图像进行变换、拼接、融合得到所述当前帧的背景拼接图像;
步骤C、逐帧对所述两路视频数据提取两幅前景图像;对在所述步骤B中的重叠背景区域的前景图像提取特征点并匹配,利用匹配的特征点位置关系对所述步骤B中的所述背景变换矩阵中的图像平移参数进行调整,得到前景图像的变换矩阵,通过所述前景变换矩阵对所述两幅前景图像进行变换、拼接、融合,得到当前帧的前景拼接图像;
步骤D、将所述前景拼接图像与所述背景拼接图像合成所述当前帧的拼接图像,输出所述拼接图像。
本发明实施例提供的大场景视频图像拼接方法,通过对前景、背景图像分别进行拼接,计算前景变换矩阵时,特征点的提取与匹配仅仅是对重叠区域内前景区域的小区域图像进行,同时前景变换矩阵仅仅需要对背景变换矩阵的平移参数调整获得,因此非常迅速,可以满足拼接实时性的要求;由于每一帧时刻拼接图像都是对前景区域的图像进行拼接后补回原背景拼接图像中得到,而不是对整幅图进行拼接,因此充分利用了视频流中帧与帧之间的时间、空间信息;此外,视频中前景背景的图像景深差别较大,各自视差相差较大,避免了现有技术中使用同一个单应性变换矩阵进行变换、拼接会出现视差失真的问题。
附图说明
图1为本发明实施例中所适用的摄像头的位置关系示意图。
图2为本发明一个实施例提供的大场景视频图像拼接方法的流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例中所适用的摄像头的位置关系示意图,如图1所示,本发明实施例中视频的采集由两路拥有相同焦距,镜头的同款摄像机完成,两路摄像机左右水平排列且成一定夹角放置,水平方向视角重叠区域大约为25%,采集得到的视频数据由若干由原始YUV的格式转换为图像处理所需的RGB格式的视频帧图像。
图2为本发明一个实施例提供的大场景视频图像拼接方法的流程示意图,如图2所示,本发明实施例包括如下步骤:
步骤201、采集两路拍摄场景有重叠的两路视频数据;
步骤202、对两路视频数据提取两幅背景图像,计算两幅背景图像间的单应性变换矩阵,通过单应性变换矩阵确定两幅背景图像的重叠背景区域;利用背景变换矩阵对两幅背景图像进行变换、拼接、融合得到当前帧的背景拼接图像;
步骤203、逐帧对两路视频数据提取两幅前景图像;对在步骤202中的重叠背景区域的前景图像提取特征点并匹配,并利用匹配的特征点位置关系对步骤202中的背景变换矩阵中的图像平移参数进行调整,得到前景图像的变换矩阵,通过前景变换矩阵对两幅前景图像进行变换、拼接、融合,得到当前帧的前景拼接图像;
步骤204、将前景拼接图像与背景拼接图像合成当前帧的拼接图像,输出拼接视频。
进一步地,步骤102中的对两路视频数据提取两幅背景图像,计算两幅背景图像间的单应性变换矩阵,通过单应性变换矩阵确定两幅背景图像的重叠背景区域,具体包括以下步骤:
步骤B1、对两幅背景图像进行特征提取;
步骤B2、提取两幅背景图像中各自背景图像的特征点,并进行匹配,应用随机采样一致算法剔除误匹配的特征点对,得到左图特征点X匹配的右图特征点X′;根据匹配点位置关系,计算初步的单应性变换矩阵M;
步骤B3、对步骤B2中得到的变换矩阵进行迭代求精,得到精确的背景变换矩阵Hb
H b = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1
步骤B4、利用背景变换矩阵将两幅背景图像中的右路背景图像变换投影到两幅背景图像中的左路背景图像中,得到:
x ′ y ′ 1 = H b x y 1 = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1 x y 1
步骤B5、采用加权平均法融合得到两路视频数据的背景拼接图像;
步骤B6、利用背景变换矩阵,将右路背景图像的左上角、左下角的变换投影到左路背景图像的位置点与左路背景图像的右上角、右下角位置点,该四个位置点构成的四边形内区域为左路背景图像中与右路背景图像的重叠区域;其中,左路背景图像的右上角、右下角的投影变换到左路背景图像的位置点与右路背景图像的左上角、左下角位置点,该四个位置点构成的四边形内区域为右路背景图像中与左路背景图像的重叠区域;从而确定右路背景图像中的重叠区域以及左路背景图像中的重叠区域。
进一步地,步骤203具体包括如下步骤:
步骤C1、使用3帧差法得到前景图像。该前景图像中,在前景区域的图像点亮度值不为0,在背景区域的图像点亮度值被置为0。
步骤C2、对于落在步骤B中得到的背景重叠区域的左右两路路前景图像部分进行特征点提取,匹配,左图特征点L与其匹配的右图特征点R,R投影到左图点R′,坐标位置分别为(xLn,yLn)、(xRn,yRn)、(x′Rn,y′Rn),对背景变换矩阵Hb中平移参数进行调整,得到前景变换矩阵Hf;如果得不到足够数量的匹配点,前景变换矩阵用背景变换矩阵替代;
步骤C3、根据得到的前景变换矩阵对前景图像进行拼接、融合。
进一步地,步骤204具体包括如下步骤:
步骤D1、遍历背景拼接图像中每一个图像点。
步骤D2、判断每个图像点在前景拼接图像中对应位置的图像点的亮度值是否为0;若不为0,则该图像点位置属于前景区域,将该图像点的RGB值替换为前景拼接图像中对应位置的图像点的RGB值;若为0,则该图像点位置属于背景区域,该图像点的RGB值保持不改变。
步骤D3、对前景拼接图像和背景拼接图像合成当前帧的拼接图像,输出拼接视频。
进一步地,对前景变换矩阵的计算间隔N帧进行,N帧共用同一个前景变换矩阵。
进一步地,该方法还包括:
通过设定间隔时间对背景拼接图像进行更新。
进一步地,在步骤B1中,为了提取两路视频各自的背景图像,对两路视频提取同一时刻的视频帧,以10帧时间为间隔分别提取100次,得到两组视频帧序列,左右两路视频提取的视频帧序列分别为{I1,I2,I3,...I100},{I1′,I2′,I3′,...I′100},其中In与In′对应同一时刻提取自左右两路视频的视频帧图像,格式为RGB。
在步骤B2中,使用快速平均法对两路视频提取背景图像时,通过对提取的两组序列图像的R,G,B三个通道分别做平均,得到各自的RGB格式的背景图像。通过公式(2)实现。
R b ( x , y ) ‾ = Σ i = 1 100 R i ( x , y ) G b ( x , y ) ‾ = Σ i = 1 100 G i ( x , y ) B b ( x , y ) ‾ = Σ i = 1 100 B i ( x , y ) - - - ( 2 )
其中,分别为R,G,B通道中背景图像在图像坐标(x,y)处的亮度值。Ri(x,y),Gi(x,y),Bi(x,y)分别为R,G,B通道中第i帧图像在坐标(x,y)处的亮度值。
步骤B3中,为得到背景变换矩阵,首先对左右视频提取的背景图像提取特征点,并且匹配。这里使用的是标准的SIFT特征点提取技术。因为SIFT特征点的提取查找匹配为现有技术,本发明实施例不再对该步骤方法进行赘述。
得到的两幅图像的匹配SIFT特征点对,使用随机采样一致算法(RANdomSAmple Consensus,RANSAC)对匹配点对进行筛选,剔除误匹配的特征点对。具体实现方法如下:
(1)从以上匹配的SIFT特征点对的中随机抽选4对不同的匹配点对组成一个RANSAC样本;
(2)根据这4对匹配点位置关系,结合公式(3)计算变换矩阵M;
X=MX′         (3)
其中,X,X′分别代表左、右背景图中匹配特征点的位置。
(3)根据样本集,变换矩阵M,和误差度量函数,其他匹配点位置关系是否符合当前变换矩阵M关系,即满足公式(3)。得到当前变换矩阵的一致集,并返回一致集中元素个数;
(4)根据当前一致集中元素个数判断是否最优(最大)一致集,若是则更新当前最优一致集
(5)更新当前错误概率P,若P大于允许的最小错误概率则重复(1)至(4)继续迭代,直到当前错误概率P小于最小错误概率0.99。
这个过程被重复执行固定的次数S,每次产生的模型要么因为局内点太少而被舍弃,要么因为比现有的模型更好而被选用。步骤中的当前的错误概率可以由公式(4)计算得到。
P=(1-pk)s       (4)
式中,p为随机选择一对匹配点为正确匹配点的概率,k为每次随机选择的匹配点数,这里k=4。每次选择k对匹配点,都属于正确匹配点(内点)的概率为pk,因此重复迭代S次以后依然都没有得到正确的匹配点(内点)集为每次随机选择k对匹配点都不全是内点的概率,即为错误概率P。
该算法重复N次随机采样过程,通过寻找匹配误差的最小值得到一组与H一致的数目最多的内点,得到了这些内点后,重新计算出相对精确的H初始值H0,单应性变换矩阵表示为公式5所示的3×3矩阵,参数h00,h01,h10,h11控制尺寸变换和旋转变换,h20、h21分别控制水平方向缩放、竖直方向位移缩放,h02、h12分别控制水平方向、竖直方向位移: H = h 00 h 01 h 02 h 10 h 11 h 12 h 20 h 21 h 22 , h 22 = 1 - - - ( 5 )
步骤B4,为了得到更加精确背景图像间变换矩阵,对于之前变换矩阵H0使用Levenberg-Marquardt 非线性最小化迭代算法(LM算法)迭代求精。本发明实施例中LM算法具体实现如下:
步骤(1)利用误差函数, E ( H ) = Σ i = 1 N e i 2 ( H ) = e ( H ) T e ( H ) = Σ i = 1 N [ ( y i ′ - y i ) 2 + ( x i ′ - x i ) 2 ] - - - ( 6 )
其中,xi、yi为匹配的特征点在左背景图中的横纵坐标位置,x′i、y′i为在右图中对应的匹配点坐标(xRi,yRi)根据H矩阵公式变换到左图的横纵坐标位置x′i、y′i
xRi、yRi与x′i、y′i之间的关系参见公式(7)。 x i ′ = h 00 x Ri + h 01 y Ri + h 02 h 20 x Ri + h 21 y Ri + 1 y i ′ = h 10 x Ri + h 11 y Ri + h 12 h 20 x Ri + h 21 y Ri + 1 - - - ( 7 )
其中,h00h01h02h10h11h12h20h21为矩阵H中对应的参数。
步骤(2)初始化k=0,Hk=H0,训练误差允许值ε为2像素值,试探性参数μ=0.001,μ的调整系数β=2。
步骤(3)取所有左背景图像与右背景图像对应匹配点,坐标分别(x,y)、(xR,yR),根据公式计算点(xR,yR)根据Hk矩阵变换到左图中的坐标(x′,y′),计算当前E(Hk),若E(Hk)<ε,转至步骤(7)。
步骤(4)计算当前E(Hk)的Jacobian矩阵J[Hk],
步骤(5)根据公式8计算ΔHk
ΔHk=[JT[Hk]J[Hk]+μI]-1JT[Hk]e(Hk)T   (8)
其中,I为单位矩阵。
步骤(6)由公式9计算Hk+1,按步骤(3)方法计算得到E(Hk+1),若E(Hk+1)<E(Hk),则更新当前H矩阵,k=k+1,同时令μ=μ/β,转至步骤(3);否则不更新当前H矩阵,令μ=βμ,转至步骤(5)。
Hk+1=Hk+ΔHk   (9)
步骤(7)Hk即为所求结果,结束。
最终提取的背景变换矩阵为 H b = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1 .
步骤B5,利用变换矩阵对右路背景图像进行变换在投影到左路背景图像,如公式10。
x &prime; y &prime; 1 = H b x y 1 = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1 x y 1 - - - ( 10 )
步骤B6,得到变换后的图像进行拼接融合采用的加权平均法得到拼接背景图像,如公式(11)。
Icomp(x,y)=α(x,y)IR′(x,y)+(1-α(x,y))×IL(x,y)   (11)
其中,α(x,y)代表融合过程中象素点在最终拼接图像中的权重,定义如公式(12),IR′(x,y)代表右路视频背景图像R投影到左路视频背景图像L的图像R′,IL(x,y)代表左路视频背景图像L。
&alpha; ( x , y ) = 1 if min ( x , y , | x - W | , | y - H | ) > T sin ( &pi; &times; ( min ( x , y , | x - W | , | y - H | ) / T - 0.5 ) + 1 ) 2 otherwise - - - ( 12 )
其中,W和H分别是图像的长度和宽带,T是非线性边界的宽度可以调节渐变区域和中心区域之间的效果,具体根据融合图像需要的效果来选择。
步骤B利用公式(13)将右图的左上角,左下角的变换投影到左图中,右图的左上角,左下角投影到左图中的点与左图的右上角,右下角位置点,四个点构成的四边形内区域就是左图中与右图重叠区域;使用公式(14)将左图的右上角,右下角的变换投影到左图中,左图的左上角,左下角投影到右图中的点与右图的左上角,左下角位置点,四个点构成的四边形内就是右图中与左图的重叠区域。
x R &prime; y R &prime; 1 = H b x R y R 1 - - - ( 13 )
其中,xR、yR代表右路视频背景图像中点坐标点,其投影到左路视频背景图像的点坐标为x′R、y′R,Hb为背景变换矩阵,参考图像为左路背景图像。
x L &prime; y L &prime; 1 = H b - 1 x L y L 1 - - - ( 14 )
其中,xL、yL代左路视频背景图像中点坐标点,其投影到右路视频背景图像的点坐标为x′L、y′L为背景变换矩阵Hb的逆矩阵。
对于步骤C具体实现方式如下:
步骤C1中,对左右两路视频动态提取每帧图像IL,IR,使用三帧差法对每帧图像前景区域进行动态提取。
对于当前帧I(k),获取其前一帧I(k-1)与后一帧I(k+1),对3帧图像做灰度化,得到对应灰度图像,由公式(15)对相邻两帧灰度图像求差值。
D ( k , k - 1 ) [ x , y ] = | I ( k ) [ x , y ] - I ( k - 1 ) [ x , y ] | D ( k + 1 , k ) [ x , y ] = | I ( k + 1 ) [ x , y ] - I ( k ) [ x , y ] | - - - ( 15 )
其中,为D(k,k-1)为I(k)与I(k-1)做差值得到的差值图像,D(k+1,k)为I(k+1)与I(k)做差值得到的差值图像,由公式(16)对差值图像二值化。
B ( k , k - 1 ) [ x , y ] = 1 if D ( k , k - 1 ) [ x , y ] &GreaterEqual; T 0 otherwise B ( k + 1 , k ) [ x , y ] = 1 if D ( k + 1 , k ) [ x , y ] &GreaterEqual; T 0 otherwise - - - ( 16 )
其中,B(k,k-1),B(k+1,k)分别为D(k,k-1)与D(k+1,k)的二值图像。T为阈值,具体实施中可以取10。
B(k,k-1),B(k+1,k)图像做与计算,如公式(17)。
对得到的二值图像B(k)做闭运算,最后得到标识前景区域的二值图像。用来标识前景背景区域。二值图像中像素值为1区域对应帧图像前景区域,二值图像中像素值为0区域对应的帧图像中背景区域。
将当前帧图像和得到的标识前景区域的二值图像做“与”计算,得到前景图像。
步骤C2中,前景变换矩阵表示为 H f = f 00 f 01 f 02 f 10 f 11 f 12 f 20 f 21 1 , 因为前景变换矩阵与背景变换矩阵中仅平移参数不同,因此可以通过背景变换矩阵Hb对平移参数调整得到,此时前景变换矩阵表示为 H f = b 00 b 01 f 02 b 10 b 11 f 12 b 20 b 21 1 , 计算水平平移参数f02,竖直平移参数f12可以得到前景变换矩阵Hf
提取左右视频帧图像中在重叠区域内的前景图像的SIFT特征点集合L,R,对两幅特征点进行匹配,得到n对匹配的特征点集合L{L1,L2,L3,...,Ln},R{R1,R2,R3,...,Rn},其中Ln、Rn分别为匹配的左右特征点,位置坐标分别为(xLn,yLn),(xRn,yRn)。根据公式(15),将右图特征点R位置投影到左图中得到位置点R′{R′1,R′2,R′,...,R′},R′坐标为(x′Rn,y′Rn)。
x Rn &prime; y Rn &prime; 1 = H b x Rn y Rn 1 - - - ( 18 )
为了排除错误匹配点的影响,首先利用公式(19)计算左图特征点Ln位置(xLn,yLn)与对应右图特征点R投影到左图的R′n点的位置(x′Rn,y′Rn)的差值(xn,yn)。
x n = x Ln - x Rn &prime; y n = y Ln - y Rn &prime; - - - ( 19 )
统计L到对应R′n所有差值(xn,yn)的平均值对于差值(xn,yn)到平均值的欧氏距离大于ω的匹配特征点进行剔除,ω为误差阈值。重复以上步骤剔除外点并计算新的直到所有匹配点的向量差值(xn,yn)到的欧氏距离小于ω。剔除所有外点后,利用保留的左图中所有特征点Ln位置(xLn,yLn)、对应匹配的右图特征点Rn位置(xRn,yRn)及Rn对应的R′n点位置(x′Ln,y′Ln),通过公式(20),计算得到前景变换矩阵Hf的平移参数。
f 02 = b 02 + ( x Ln - x Rn &prime; ) ( b 20 x Rn + b 21 y Rn + 1 ) f 12 = b 12 + ( y Ln - y Rn &prime; ) ( b 20 x Rn + b 21 y Rn + 1 ) - - - ( 20 )
对所有匹配点分别求取的f02、f12求平均,得到最终的水平平移参数竖直平移参数最终得到前景变换矩阵Hf
对于最终得到的匹配特征点数量不足3时,使用以上方法计算前景变换矩阵Hf可能会引起较大误差甚至无法计算得到Hf。由于匹配特征点过少一般是因为前景距离摄像机很远,使得前景区域过小导致,此时前景物体距离摄像机很远因此其与背景物体视差相差较小,前景变换矩阵Hf用背景变换矩阵Hb替代。
对于公式(20)的推导流程如下:
点Ln,Rn坐标变换关系使用前景变换矩阵Hf表示。
R n &prime; = H b R n L n = H f R n
H f = b 00 b 01 f 02 b 10 b 11 f 12 b 20 b 21 1 , H b = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1
由上式的得到:
x Ln = b 00 x Rn + b 01 y Rn + f 02 b 20 x Rn + b 21 y Rn + 1 y Ln = b 10 x Rn + b 11 y Rn + f 12 b 20 x Rn + b 21 y Rn + 1
x Rn &prime; = b 00 x Rn + b 01 y Rn + b 02 b 20 x Rn + b 21 y Rn + 1 y Rn &prime; = b 10 x Rn + b 11 y Rn + b 12 b 20 x Rn + b 21 y Rn + 1
两式相减,得到:
x Ln - x Rn &prime; = f 02 - b 02 b 20 x Rn + b 21 y Rn + 1 y Ln - y Rn &prime; = f 12 - b 12 b 20 x Rn + b 21 y Rn + 1
变换得到:
f 02 = b 02 + ( x Ln - x Rn &prime; ) ( b 20 x Rn + b 21 y Rn + 1 ) f 12 = b 12 + ( y Ln - y Rn &prime; ) ( b 20 x Rn + b 21 y Rn + 1 )
标准的SIFT特征点描述子使用邻近4×4个块区域的8方向梯度值表示,本方法具体实施中对于高帧率的视频拼接,SIFT特征点描述子使用特征点位置邻近2×2个块区域的8方向梯度值,从而将SIFT特征点描述子从标准的128维降低到64维,牺牲部分特征点精度来提高特征点提取和匹配的速度,来满足更高的实时性要求。
步骤C3中,根据得到的前景变换矩阵Hf对前景图像进行拼接、融合。
对于步骤D,具体实现方法如下:
步骤D1中,遍历背景拼接图像中每一个图像点。
步骤D2中,判断每个图像点在前景拼接图像中对应位置的图像点的亮度值是否为0;若不为0,则该图像点位置属于前景区域,将该图像点的RGB值替换为前景拼接图像中对应位置的图像点的RGB值;若为0,则该图像点位置属于背景区域,该图像点的RGB值保持不改变。
步骤D3中,对前景拼接图像和背景拼接图像合成当前帧的拼接图像,输出拼接视频。
其中,间隔时间t开辟一个独立线程对两路视频进行步骤B操作得到新的背景拼接图像后,立即对背景拼接图像进行更新。
前景变换矩阵的求取间隔3帧进行,3帧前景图像的变换使用同一前景变换矩阵。
综上,本发明实施例对前景和背景图像拼接分别采用不同的变换矩阵,可有效消除拼接中因为前景、背景图像景深不同而造成的视差失真。由于每次得到当前帧的拼接图像时只需要对前景区域动态的更新前景拼接图像之后将前景拼接图像补回之前得到的背景拼接图像,无需对每次对整幅图像区域计算变换矩阵后拼接,同时前景变换矩阵利用背景变换矩阵进行动态调整变换矩阵平移参数得到,充分利用了帧与帧之间的时间、空间信息来实现实时的大场景视频拼接。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种大场景视频图像拼接方法,其特征在于,包括以下步骤:
步骤A、采集两路拍摄场景有重叠的两路视频数据;
步骤B、对所述两路视频数据提取两幅背景图像,计算所述两幅背景图像间的单应性变换矩阵,通过所述单应性变换矩阵确定所述两幅背景图像的重叠背景区域;利用背景变换矩阵对所述两幅背景图像进行变换、拼接、融合得到所述当前帧的背景拼接图像;
步骤C、逐帧对所述两路视频数据提取两幅前景图像;对在所述步骤B中的重叠背景区域的前景图像提取特征点并匹配,利用匹配的特征点位置关系对所述步骤B中的所述背景变换矩阵中的图像平移参数进行调整,得到前景图像的变换矩阵,通过所述前景变换矩阵对所述两幅前景图像进行变换、拼接、融合,得到当前帧的前景拼接图像;
步骤D、将所述前景拼接图像与所述背景拼接图像合成所述当前帧的拼接图像,输出所述拼接图像。
2.根据权利要求1所述的方法,其特征在于,所述步骤B中的所述对所述两路视频数据提取两幅背景图像,计算所述两幅背景图像间的单应性变换矩阵,通过所述单应性变换矩阵确定所述两幅背景图像的重叠背景区域,具体包括以下步骤:
步骤B1、对所述两幅背景图像进行特征提取;
步骤B2、提取所述两幅背景图像中各自背景图像的特征点,并进行匹配,应用随机采样一致算法剔除误匹配的特征点对,得到左图特征点X匹配的右图特征点X′;根据匹配点位置关系,计算初步的单应性变换矩阵M;
步骤B3、对所述步骤B2中得到的所述变换矩阵进行迭代求精,得到精确的背景变换矩阵 H b = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1 ;
步骤B4、利用所述背景变换矩阵将所述两幅背景图像中的右路背景图像变换投影到所述两幅背景图像中的左路背景图像中,得到:
x &prime; y &prime; 1 = H b x y 1 = b 00 b 01 b 02 b 10 b 11 b 12 b 20 b 21 1 x y 1
步骤B5、采用加权平均法融合得到所述两路视频数据的背景拼接图像;
步骤B6、利用所述背景变换矩阵,将所述右路背景图像的左上角、左下角变换投影到所述左路背景图像所形成的位置点,与所述左路背景图像的右上角、右下角位置点,该四个位置点构成的四边形内区域为所述左路背景图像中与所述右路背景图像的重叠区域;同理,所述左路背景图像的右上角、右下角投影变换到所述左路背景图像所形成的位置点,与所述右路背景图像的左上角、左下角位置点,该四个位置点构成的四边形内区域为所述右路背景图像中与所述左路背景图像的重叠区域;从而确定所述右路背景图像中的重叠区域与所述左路背景图像中的重叠区域。
3.根据权利要求1所述的方法,其特征在于,所述步骤C具体包括如下步骤:
步骤C1、使用3帧差法得到前景图像;该前景图像中,在前景区域的图像点亮度值不为0,在背景区域的图像点亮度值被置为0;
步骤C2、对于落在所述步骤B中得到的背景重叠区域的左右两路路前景图像部分进行特征点提取,匹配,左图特征点L与其匹配的右图特征点R,R投影到左图点R′,坐标位置分别为(xLn,yLn)、(xRn,yRn)、(x′Rn,y′Rn),对背景变换矩阵Hb中图像平移参数进行调整,得到前景变换矩阵Hf;如果得不到足够数量的匹配点,前景变换矩阵用背景变换矩阵替代;
步骤C3、根据得到的前景变换矩阵对前景图像进行拼接、融合。
4.根据权利要求1所述的方法,其特征在于,所述步骤D具体包括如下步骤:
步骤D1、遍历背景拼接图像中每一个图像点;
步骤D2、判断每个图像点在前景拼接图像中对应位置的图像点的亮度值是否为0;若不为0,则该图像点位置属于前景区域,将该图像点的RGB值替换为前景拼接图像中对应位置的图像点的RGB值;若为0,则该图像点位置属于背景区域,该图像点的RGB值保持不改变;
步骤D3、对前景拼接图像和背景拼接图像合成当前帧的拼接图像,输出拼接视频。
5.根据权利要求2所述的方法,其特征在于,对前景变换矩阵的计算间隔N帧进行,N帧共用同一个前景变换矩阵。
6.根据权利要求1-5任一所述的方法,其特征在于,所述方法还包括:通过设定间隔时间对所述背景变换矩阵和背景拼接图像进行更新。
CN201410727895.9A 2014-12-03 2014-12-03 一种大场景视频图像拼接方法 Active CN104408701B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410727895.9A CN104408701B (zh) 2014-12-03 2014-12-03 一种大场景视频图像拼接方法
PCT/CN2015/094076 WO2016086754A1 (zh) 2014-12-03 2015-11-07 一种大场景视频图像拼接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410727895.9A CN104408701B (zh) 2014-12-03 2014-12-03 一种大场景视频图像拼接方法

Publications (2)

Publication Number Publication Date
CN104408701A true CN104408701A (zh) 2015-03-11
CN104408701B CN104408701B (zh) 2018-10-09

Family

ID=52646330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410727895.9A Active CN104408701B (zh) 2014-12-03 2014-12-03 一种大场景视频图像拼接方法

Country Status (2)

Country Link
CN (1) CN104408701B (zh)
WO (1) WO2016086754A1 (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488777A (zh) * 2015-04-22 2016-04-13 兰雨晴 一种基于移动前景下全景图实时生成系统及其方法
WO2016086754A1 (zh) * 2014-12-03 2016-06-09 中国矿业大学 一种大场景视频图像拼接方法
CN105915804A (zh) * 2016-06-16 2016-08-31 恒业智能信息技术(深圳)有限公司 视频拼接方法及系统
CN106683051A (zh) * 2016-12-29 2017-05-17 北京奇艺世纪科技有限公司 一种图像拼接方法及装置
CN106709894A (zh) * 2015-08-17 2017-05-24 北京亿羽舜海科技有限公司 一种图像实时拼接方法及系统
CN107038686A (zh) * 2017-04-21 2017-08-11 成都观界创宇科技有限公司 一种图像拼接处理的方法及设备
CN108038825A (zh) * 2017-12-12 2018-05-15 维沃移动通信有限公司 一种图像处理方法及移动终端
CN108304766A (zh) * 2017-12-12 2018-07-20 交通运输部规划研究院 一种基于高分辨率遥感筛选危险品堆场的方法
CN109348140A (zh) * 2018-10-12 2019-02-15 西安理工大学 一种监控场景下实时视频的拼接方法
WO2019061066A1 (en) * 2017-09-27 2019-04-04 Intel Corporation APPARATUS AND METHOD FOR OPTIMIZED IMAGE MESHING BASED ON OPTICAL FLOW
CN109636793A (zh) * 2018-12-14 2019-04-16 中航华东光电(上海)有限公司 显示器的检测系统及其检测方法
CN110211076A (zh) * 2019-05-09 2019-09-06 上海联影智能医疗科技有限公司 图像拼接方法、图像拼接设备和可读存储介质
CN110246153A (zh) * 2019-04-30 2019-09-17 安徽四创电子股份有限公司 一种基于视频监控的运动目标实时检测跟踪方法
CN111105350A (zh) * 2019-11-25 2020-05-05 南京大学 大视差场景下基于自身单应性变换的实时视频拼接方法
CN111107307A (zh) * 2018-10-29 2020-05-05 曜科智能科技(上海)有限公司 基于单应性变换的视频融合方法、系统、终端及介质
CN111355928A (zh) * 2020-02-28 2020-06-30 济南浪潮高新科技投资发展有限公司 一种基于多摄像头内容分析的视频拼接方法及其系统
CN113793382A (zh) * 2021-08-04 2021-12-14 北京旷视科技有限公司 视频图像的拼缝搜索方法、视频图像的拼接方法和装置
CN114723607A (zh) * 2022-03-21 2022-07-08 北京卓视智通科技有限责任公司 一种图像拼接方法及系统

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106530214B (zh) * 2016-10-21 2023-11-17 微景天下(北京)科技有限公司 图像拼接系统和图像拼接方法
CN106851079A (zh) * 2017-04-10 2017-06-13 深圳市世纪佳华电子科技有限公司 一种广角摄像系统
DE112019001358T5 (de) * 2018-03-15 2020-12-31 Murakami Corporation Vorrichtung zur erstellung zusammengesetzter videobilder, verfahren zur erstellung zusammengesetzter videobilder und programm zur erstellung zusammengesetzter videobilder
CN108986025B (zh) * 2018-06-08 2023-02-10 西北工业大学 基于不完备姿轨信息的高精度异时图像拼接及校正方法
CN109064385A (zh) * 2018-06-20 2018-12-21 何中 360度全景展示效果生成工具及发布系统
CN109598675B (zh) * 2018-11-13 2023-03-10 北京交通大学 多重复纹理图像的拼接方法
CN109493282A (zh) * 2018-11-21 2019-03-19 清华大学深圳研究生院 一种消除运动重影的立体图像拼接方法
CN109919832B (zh) * 2019-02-27 2022-12-06 西安汇智信息科技有限公司 一种用于无人驾驶的交通图像拼接方法
CN110211043B (zh) * 2019-05-11 2023-06-27 复旦大学 一种用于全景图像拼接的基于网格优化的配准方法
CN110246161B (zh) * 2019-06-04 2022-10-28 哈尔滨工程大学 一种360度全景图像无缝拼接的方法
CN110232656B (zh) * 2019-06-13 2023-03-28 上海倍肯智能科技有限公司 一种解决特征点不足的图像拼接优化方法
CN110490045A (zh) * 2019-06-25 2019-11-22 上海市城市排水有限公司 一种无人机航拍图像差异分析方法
CN110689485B (zh) * 2019-10-14 2022-11-04 中国空气动力研究与发展中心超高速空气动力研究所 一种应用于大型压力容器红外无损检测的sift图像拼接方法
CN110991466A (zh) * 2019-11-21 2020-04-10 同济大学 一种基于新型视觉传感设备的高速公路路面状况检测系统
CN111192194B (zh) * 2019-12-05 2023-08-08 同济大学 一种针对幕墙建筑立面的全景图像拼接方法
CN111127318B (zh) * 2019-12-05 2023-04-07 南京莱斯电子设备有限公司 一种机场环境下的全景图像拼接方法
CN110930310B (zh) * 2019-12-09 2023-04-07 中国科学技术大学 全景图像拼接方法
CN113012030A (zh) * 2019-12-20 2021-06-22 北京金山云网络技术有限公司 图像拼接方法、装置及设备
CN111160326B (zh) * 2020-04-02 2020-07-28 南京安科医疗科技有限公司 Ct扫描全景实时监测方法和系统
CN111585535B (zh) * 2020-06-22 2022-11-08 中国电子科技集团公司第二十八研究所 一种反馈式数字自动增益控制电路
CN111738211B (zh) * 2020-07-17 2023-12-19 浙江大学 基于动态背景补偿与深度学习的ptz摄像机运动目标检测与识别方法
CN111830504B (zh) * 2020-07-23 2023-11-24 中山大学 基于序贯融合因式分解的序列isar三维成像方法
CN112188163B (zh) * 2020-09-29 2022-09-13 厦门汇利伟业科技有限公司 一种实时视频图像自动去重拼接的方法和系统
CN112465702B (zh) * 2020-12-01 2022-09-13 中国电子科技集团公司第二十八研究所 一种多路超高清视频同步自适应拼接显示处理方法
CN112862674B (zh) * 2020-12-07 2024-02-13 西安电子科技大学 一种多图像自动拼接方法和系统
CN112712487A (zh) * 2020-12-23 2021-04-27 北京软通智慧城市科技有限公司 一种场景视频融合方法、系统、电子设备及存储介质
CN112767245B (zh) * 2021-01-04 2024-03-29 航天时代飞鸿技术有限公司 基于多无人机实时视频图像的地图拼接构建的系统及方法
GB202109804D0 (en) * 2021-07-07 2021-08-18 Mo Sys Engineering Ltd image stitching
CN113052119B (zh) * 2021-04-07 2024-03-15 兴体(广州)智能科技有限公司 球类运动跟踪摄像方法及系统
CN113052751B (zh) * 2021-04-27 2023-05-30 浙江水科文化集团有限公司 人工智能处理方法
CN113222817A (zh) * 2021-05-13 2021-08-06 哈尔滨工程大学 基于图像特征提取的12路视频图像拼接以及图像配准方法
CN113537238B (zh) * 2021-07-05 2022-08-05 上海闪马智能科技有限公司 一种信息处理方法及图像识别装置
CN114125178A (zh) * 2021-11-16 2022-03-01 阿里巴巴达摩院(杭州)科技有限公司 视频拼接方法、设备和可读介质
CN114240845B (zh) * 2021-11-23 2024-03-26 华南理工大学 一种应用于切削工件的光切法表面粗糙度测量方法
CN114584747B (zh) * 2022-03-04 2023-10-31 大连海事大学 一种360°环幕无缝投影软矫正方法
CN116612390B (zh) * 2023-07-21 2023-10-03 山东鑫邦建设集团有限公司 一种建筑工程用的信息管理系统
CN116883248B (zh) * 2023-09-07 2023-11-14 成都市晶林科技有限公司 一种基于特征点匹配的红外全景图像拼接方法
CN117111803B (zh) * 2023-10-20 2024-04-05 荣耀终端有限公司 背景图显示方法和电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1756313A (zh) * 2004-09-30 2006-04-05 中国科学院计算技术研究所 运动视频的全景图合成方法
CN101388115A (zh) * 2008-10-24 2009-03-18 北京航空航天大学 一种结合纹理信息的深度图像自动配准方法
CN101621634A (zh) * 2009-07-24 2010-01-06 北京工业大学 动态前景分离的大幅面视频拼接方法
CN101626513A (zh) * 2009-07-23 2010-01-13 深圳大学 全景视频生成方法及系统
CN101799939A (zh) * 2010-04-02 2010-08-11 天津大学 基于左右视点图像的中间视点快速、自适应生成算法
CN102006425A (zh) * 2010-12-13 2011-04-06 交通运输部公路科学研究所 一种基于多摄像机的视频实时拼接方法
US20120114229A1 (en) * 2010-01-21 2012-05-10 Guoqing Zhou Orthorectification and mosaic of video flow

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408701B (zh) * 2014-12-03 2018-10-09 中国矿业大学 一种大场景视频图像拼接方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1756313A (zh) * 2004-09-30 2006-04-05 中国科学院计算技术研究所 运动视频的全景图合成方法
CN101388115A (zh) * 2008-10-24 2009-03-18 北京航空航天大学 一种结合纹理信息的深度图像自动配准方法
CN101626513A (zh) * 2009-07-23 2010-01-13 深圳大学 全景视频生成方法及系统
CN101621634A (zh) * 2009-07-24 2010-01-06 北京工业大学 动态前景分离的大幅面视频拼接方法
US20120114229A1 (en) * 2010-01-21 2012-05-10 Guoqing Zhou Orthorectification and mosaic of video flow
CN101799939A (zh) * 2010-04-02 2010-08-11 天津大学 基于左右视点图像的中间视点快速、自适应生成算法
CN102006425A (zh) * 2010-12-13 2011-04-06 交通运输部公路科学研究所 一种基于多摄像机的视频实时拼接方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016086754A1 (zh) * 2014-12-03 2016-06-09 中国矿业大学 一种大场景视频图像拼接方法
CN105488777A (zh) * 2015-04-22 2016-04-13 兰雨晴 一种基于移动前景下全景图实时生成系统及其方法
CN106709894A (zh) * 2015-08-17 2017-05-24 北京亿羽舜海科技有限公司 一种图像实时拼接方法及系统
CN105915804A (zh) * 2016-06-16 2016-08-31 恒业智能信息技术(深圳)有限公司 视频拼接方法及系统
CN106683051A (zh) * 2016-12-29 2017-05-17 北京奇艺世纪科技有限公司 一种图像拼接方法及装置
CN107038686A (zh) * 2017-04-21 2017-08-11 成都观界创宇科技有限公司 一种图像拼接处理的方法及设备
WO2019061066A1 (en) * 2017-09-27 2019-04-04 Intel Corporation APPARATUS AND METHOD FOR OPTIMIZED IMAGE MESHING BASED ON OPTICAL FLOW
US11748952B2 (en) 2017-09-27 2023-09-05 Intel Corporation Apparatus and method for optimized image stitching based on optical flow
CN108038825A (zh) * 2017-12-12 2018-05-15 维沃移动通信有限公司 一种图像处理方法及移动终端
CN108304766A (zh) * 2017-12-12 2018-07-20 交通运输部规划研究院 一种基于高分辨率遥感筛选危险品堆场的方法
CN109348140A (zh) * 2018-10-12 2019-02-15 西安理工大学 一种监控场景下实时视频的拼接方法
CN111107307A (zh) * 2018-10-29 2020-05-05 曜科智能科技(上海)有限公司 基于单应性变换的视频融合方法、系统、终端及介质
CN109636793A (zh) * 2018-12-14 2019-04-16 中航华东光电(上海)有限公司 显示器的检测系统及其检测方法
CN110246153A (zh) * 2019-04-30 2019-09-17 安徽四创电子股份有限公司 一种基于视频监控的运动目标实时检测跟踪方法
CN110211076A (zh) * 2019-05-09 2019-09-06 上海联影智能医疗科技有限公司 图像拼接方法、图像拼接设备和可读存储介质
CN111105350A (zh) * 2019-11-25 2020-05-05 南京大学 大视差场景下基于自身单应性变换的实时视频拼接方法
CN111105350B (zh) * 2019-11-25 2022-03-15 南京大学 大视差场景下基于自身单应性变换的实时视频拼接方法
CN111355928A (zh) * 2020-02-28 2020-06-30 济南浪潮高新科技投资发展有限公司 一种基于多摄像头内容分析的视频拼接方法及其系统
CN113793382A (zh) * 2021-08-04 2021-12-14 北京旷视科技有限公司 视频图像的拼缝搜索方法、视频图像的拼接方法和装置
CN114723607A (zh) * 2022-03-21 2022-07-08 北京卓视智通科技有限责任公司 一种图像拼接方法及系统

Also Published As

Publication number Publication date
WO2016086754A1 (zh) 2016-06-09
CN104408701B (zh) 2018-10-09

Similar Documents

Publication Publication Date Title
CN104408701A (zh) 一种大场景视频图像拼接方法
CN111047510B (zh) 一种基于标定的大视场角图像实时拼接方法
CN103996174B (zh) 一种对Kinect深度图像进行空洞修复的方法
US9900505B2 (en) Panoramic video from unstructured camera arrays with globally consistent parallax removal
CN101883291B (zh) 感兴趣区域增强的视点绘制方法
CN101394573B (zh) 一种基于特征匹配的全景图生成方法及系统
CN204090039U (zh) 一体化大场景全景视频监控装置
CN110211043A (zh) 一种用于全景图像拼接的基于网格优化的配准方法
CN104301677A (zh) 面向大场景的全景视频监控的方法及装置
CN101276415A (zh) 用多定焦摄像机实现多分辨率图像采集的装置和方法
CN103945207B (zh) 一种基于视点合成的立体图像垂直视差消除方法
CN105635602A (zh) 一种采用两路视频间亮度和色偏对视频拼接的系统及其调整方法
CN103702103B (zh) 基于双目相机的光栅立体印刷图像合成方法
CN107220955A (zh) 一种基于重叠区域特征点对的图像亮度均衡方法
CN105894443A (zh) 一种基于改进的surf算法的实时视频拼接方法
CN108090877A (zh) 一种基于图像序列的rgb-d相机深度图像修复方法
CN105635603A (zh) 一种采用两路视频间亮度和色偏对视频拼接的系统
CN109166076B (zh) 多相机拼接的亮度调整方法、装置及便携式终端
CN106056622A (zh) 一种基于Kinect相机的多视点深度视频复原方法
CN105657268A (zh) 一种基于多分辨率的多视点视频拼接融合算法
CN103544696A (zh) 一种用于fpga实现的缝合线实时查找方法
CN113052765B (zh) 基于最优栅格密度模型的全景图像拼接方法
CN108564654B (zh) 三维大场景的画面进入方式
CN103646397A (zh) 基于多源数据融合的实时合成孔径透视成像方法
CN107330856B (zh) 一种基于投影变换和薄板样条的全景成像方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant