CN104166580A - 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法 - Google Patents

基于参考帧变换及拼接尺寸自适应的同步在线拼接方法 Download PDF

Info

Publication number
CN104166580A
CN104166580A CN201410406496.2A CN201410406496A CN104166580A CN 104166580 A CN104166580 A CN 104166580A CN 201410406496 A CN201410406496 A CN 201410406496A CN 104166580 A CN104166580 A CN 104166580A
Authority
CN
China
Prior art keywords
splicing
prime
frame
reference frame
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410406496.2A
Other languages
English (en)
Inventor
杨涛
张艳宁
王斯丙
马文广
姚博伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN201410406496.2A priority Critical patent/CN104166580A/zh
Publication of CN104166580A publication Critical patent/CN104166580A/zh
Pending legal-status Critical Current

Links

Abstract

本发明涉及一种基于参考帧变换及拼接尺寸自适应的同步在线拼接方法。针对拼接结果与视频流要求同步一致的情况,本发明使用了共享内存技术,保证待拼接帧为当前最新帧,从而实现同步性;为了保证拼接结果的准确性,使用了参考帧变换技术,减少了累积误差,增加了视频流的可拼接时长;针对给拼接结果分配固定尺寸,造成的内存资源浪费和拼接性能下降的问题,本发明使用了拼接尺寸自适应技术,动态计算应该分配的尺寸大小,减少不必要的内存开销,提高拼接性能。

Description

基于参考帧变换及拼接尺寸自适应的同步在线拼接方法
技术领域
本发明涉及一种同步在线图像拼接技术,具体为基于参考帧变换及拼接尺寸自适应的同步在线拼接技术。
背景技术
图像拼接技术不仅是计算机视觉领域研究的热点问题,在实际的生活中也有广泛的应用,小到手机中的全景拼接,大到卫星所摄星系图像的拼接。图像拼接技术最核心的目的就是提供更全、更准确的全局信息,向观测者反映一片区域、一个场景的完整信息。其中,实时视频流的同步在线拼接又是未来拼接技术的发展趋势。试想一下,无人机对一片未知的区域进行拍摄,在拍摄过程中,能同步地对回传图像结果进行拼接和显示,这种拼接技术能够为军事侦查、地形勘测、灾后救援等需求提供所摄区域的同步全景信息,从而减少应用者做出决策的时间。
文献“何贝,王贵锦,沈永玲,等.结合地理参数的航拍视频实时拼接算法[J].应用科学学报,2012,30(2):151-157.”提出了一种结合地理参数的航拍视频实时拼接算法。此方法根据地理参数对相机运动模型进行分解,完成视频帧间的实时配准,估计视频每帧的主运动方向,将现有的单一主方向的流形拼接算法拓展到任意方向,最后根据地理坐标局部修正拼接条带。这种方法对于有地理坐标区域和所摄视频中未出现拍摄倾角变化的情况,能够产生比较好的结果。实际的需求往往是需要对一块未知区域进行地图绘制,这时该方法会失效,并且无人机在航拍的时候,会受到气流、雨水等自然条件的影响,不可能长时间保持一种拍摄角度,拍摄倾角必定会发生变化,这也会影响拼接的整体质量。而且,根据文章中的实验结果可知,其拼接结果的尺寸为固定大小,并没有用到拼接尺寸自适应技术,生成图中有效结果部分占整个生成图的比例很小,这会造成内存的极大浪费和拼接性能的降低。除此之外,该方法并不能同步在线进行拼接,即无法同步显示当前拼接的结果。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于参考帧变换及拼接尺寸自适应的同步在线拼接方法。
技术方案
一种基于参考帧变换及拼接尺寸自适应的同步在线拼接方法,其特征在于步骤如下:
步骤1:将第一帧图像作为参考帧,下一帧作为拼接帧,提取当前参考帧与最新拼接帧的SIFT特征点并进行匹配,将参考帧和拼接帧的能够匹配的特征点数量与设定的阈值进行比较:
如果特征点数量高于设定的阈值,进入步骤2;如果特征点数量小于设定的阈值,再重新取下一帧作为拼接帧进行比较:如果特征点数量高于设定的阈值,进入步骤2;否则认为这两次匹配无效,重新选择参考帧,新的参考帧为与旧参考帧能够有效匹配的最新拼接帧;
步骤2:根据两帧图像之间的特征点对应关系,计算透视变换模型:
H = h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 - - - ( 1 )
其中,h1,h2,h3用于表示拼接帧图像在给定世界坐标系x轴方向上的平移和旋转,h4,h5,h6用于表示拼接帧图像在给定世界坐标系y轴方向上的平移和旋转,h7,h8,h9用于表示拼接帧图像的尺度变换;
步骤3:计算透视变化模型的重投影误差,判断透视变化模型参数是否无效:
a、假设待拼接图像中任意像素p=(x,y,1)T,由下式计算此像素在参考帧图像中对应的像素p'=(x',y',1)T
x ′ = ( h 1 x + h 2 y + h 3 ) / ( h 7 x + h 8 y + h 9 ) y ′ = ( h 4 x + h 5 y + h 6 ) / ( h 7 x + h 8 y + h 9 ) - - - ( 2 )
写成矩阵的形式为:
( x ′ , y ′ , 1 ) T = 1 ( h 7 x + h 8 y + h 9 ) h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 ( x , y , 1 ) T - - - ( 3 )
b、计算p'=(x',y',1)T重新投影到此拼接帧图像的对应像素p″=(x″,y″,1)T
( x ′ ′ , y ′ ′ , 1 ) T = 1 ( h 7 ′ x + h 8 ′ y + h 9 ′ ) H - 1 ( x ′ , y ′ , 1 ) T - - - ( 4 )
其中,h'7、h'8、h'9是H-1第三行的元素;
c、重投影误差由下式计算:
error = 1 N Σ i = 1 N | x i ′ ′ - x i | 2 + | y i ′ ′ - y i | 2 - - - ( 5 )
如果误差大于5个像素,则认为此透视变化模型参数无效;
步骤4:自适应调整拼接图像尺寸:
根据透视变换模型和公式3,计算拼接帧四个顶点的图像坐标经过透视变换后在参考帧图像坐标系下的坐标:
所述的拼接帧四个顶点的图像坐标:左上角Left_Up=(0,0),右上角Right_Up=(width,0),左下角Left_Bottom=(0,height),右下角Right_Bottom=(width,height);
所述的经过透视变换后的在参考帧图像坐标系下的坐标:左上角Left_Up=(xlu,ylu),右上角Right_Up=(xru,yru),左下角Left_Bottom=(xlb,ylb),右下角Right_Bottom=(xrb,yrb);
确定width,xlu,xru,xlb,xrb和height,ylu,yru,ylb,yrb中的最大值和最小值:
max X = max ( width , x lu , x ru , x lb , x rb ) min X = min ( 0 , x lu , x ru , x lb , x rb ) max Y = max ( height , y lu , y ru , y lb , y rb ) min Y = min ( 0 , y lu , y ru , y lb , y rb ) - - - ( 5 )
计算需要生成的拼接结果的尺寸,其中εw、εh是尺寸补偿:
new _ width = max X - min X + ϵ w new _ height = max Y - min Y + ϵ h - - - ( 6 )
按照此尺寸动态地分配内存空间给拼接帧图像,再利用逐像素复制,完成图像拼接。
所述的阈值的取值范围为大于10且小于输入图像的分辨率大小。
所述的εw、εh根据输入图像的分辨率确定,εw为图像宽的20%,εh为图像高的20%。
有益效果
本发明提出的一种基于参考帧变换及拼接尺寸自适应的同步在线拼接方法,产生的有益效果:使用共享内存技术,保证拼接的每一帧都是当前视频流的最新一帧,从而保证同步性;利用变换参考帧方法,减少累积误差,增加视频流的可拼接时长;利用拼接尺寸自适应技术,动态地分配内存空间,以减少拼接结果的内存消耗,提高拼接性能。
具体实施方式
现结合实施例对本发明作进一步描述:
本方法首先在计算机中开辟一段地址固定的内存区,无人机每拍摄一张图像都将其复制到这块内存中,后端处理程序一直检测这块内存区是否有数据进入,如果有数据,立即将数据取走,否则继续检测。这样既能保证视频采集模块和拼接模块具有一定的独立性,又能保证数据的同步性。累积误差是图像拼接中最常见的问题,只拼接几十张图像可能累积误差的问题并不会暴露,但是如果拼接几千,几万张,累计误差问题就会严重影响拼接质量,甚至导致拼接失败。基于此分析,本发明提出参考帧变换方法,找到不同图像帧与参考帧之间的特征点匹配关系,估计透视变换模型参数。使用变换参考帧的方法减少累计误差。对拼接模块从内存中取出的每一帧图像提取特征点,匹配当前参考帧与最新拼接帧的特征点,得到这两帧的匹配关系。由于无人机在进行航拍时,会受到风力、气流等自然因素的影响,不可能长时间保持一个拍摄角度,所以不能使用仿射变换模型进行估计,为了减少这些不可控因素对拼接结果的影响,本发明使用自由度更高的透视变换模型描述两帧之间的联系。根据之前得到的透视变换模型,计算重投影误差,只有当此误差在5个像素以内时,才认为估计的参数有效。采用拼接尺寸自适应技术,给拼接结果分配合理的尺寸,不仅能避免内存空间的浪费,也能够提高拼接整体性能。具体步骤如下:
步骤1:将第一帧图像作为参考帧,下一帧作为拼接帧,提取当前参考帧与最新拼接帧的SIFT特征点并进行匹配,将参考帧和拼接帧的能够匹配的特征点数量与设定的阈值进行比较,阈值的取值范围为大于10且小于输入图像的分辨率大小:
如果特征点数量高于设定的阈值,进入步骤2;如果特征点数量小于设定的阈值,再重新取下一帧作为拼接帧进行比较:如果特征点数量高于设定的阈值,进入步骤2;否则认为这两次匹配无效,重新选择参考帧,新的参考帧为与旧参考帧能够有效匹配的最新拼接帧;
步骤2:根据两帧图像之间的特征点对应关系,计算透视变换模型:
H = h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 - - - ( 1 )
其中,h1,h2,h3用于表示拼接帧图像在给定世界坐标系x轴方向上的平移和旋转,h4,h5,h6用于表示拼接帧图像在给定世界坐标系y轴方向上的平移和旋转,h7,h8,h9用于表示拼接帧图像的尺度变换;
步骤3:计算透视变化模型的重投影误差,判断透视变化模型参数是否无效:
a、假设待拼接图像中任意像素p=(x,y,1)T,由下式计算此像素在参考帧图像中对应的像素p'=(x',y',1)T
x ′ = ( h 1 x + h 2 y + h 3 ) / ( h 7 x + h 8 y + h 9 ) y ′ = ( h 4 x + h 5 y + h 6 ) / ( h 7 x + h 8 y + h 9 ) - - - ( 2 )
写成矩阵的形式为:
( x ′ , y ′ , 1 ) T = 1 ( h 7 x + h 8 y + h 9 ) h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 ( x , y , 1 ) T - - - ( 3 )
b、计算p'=(x',y',1)T重新投影到此拼接帧图像的对应像素p″=(x″,y″,1)T
( x ′ ′ , y ′ ′ , 1 ) T = 1 ( h 7 ′ x + h 8 ′ y + h 9 ′ ) H - 1 ( x ′ , y ′ , 1 ) T - - - ( 4 )
其中,h'7、h'8、h'9是H-1第三行的元素;
c、重投影误差由下式计算:
error = 1 N Σ i = 1 N | x i ′ ′ - x i | 2 + | y i ′ ′ - y i | 2 - - - ( 5 )
如果误差大于5个像素,则认为此透视变化模型参数无效;
步骤4:自适应调整拼接图像尺寸:
根据透视变换模型和公式3,计算拼接帧四个顶点的图像坐标经过透视变换后在参考帧图像坐标系下的坐标:
所述的拼接帧四个顶点的图像坐标:左上角Left_Up=(0,0),右上角Right_Up=(width,0),左下角Left_Bottom=(0,height),右下角Right_Bottom=(width,height);
所述的经过透视变换后的在参考帧图像坐标系下的坐标:左上角Left_Up=(xlu,ylu),右上角Right_Up=(xru,yru),左下角Left_Bottom=(xlb,ylb),右下角Right_Bottom=(xrb,yrb);
确定width,xlu,xru,xlb,xrb和height,ylu,yru,ylb,yrb中的最大值和最小值:
max X = max ( width , x lu , x ru , x lb , x rb ) min X = min ( 0 , x lu , x ru , x lb , x rb ) max Y = max ( height , y lu , y ru , y lb , y rb ) min Y = min ( 0 , y lu , y ru , y lb , y rb ) - - - ( 5 )
计算需要生成的拼接结果的尺寸,其中εw、εh是尺寸补偿,εw、εh根据输入图像的分辨率确定,εw为图像宽的20%,εh为图像高的20%:
new _ width = max X - min X + ϵ w new _ height = max Y - min Y + ϵ h - - - ( 6 )
按照此尺寸动态地分配内存空间给拼接帧图像,再利用逐像素复制,完成图像拼接。

Claims (3)

1.一种基于参考帧变换及拼接尺寸自适应的同步在线拼接方法,其特征在于步骤如下:
步骤1:将第一帧图像作为参考帧,下一帧作为拼接帧,提取当前参考帧与最新拼接帧的SIFT特征点并进行匹配,将参考帧和拼接帧的能够匹配的特征点数量与设定的阈值进行比较:
如果特征点数量高于设定的阈值,进入步骤2;如果特征点数量小于设定的阈值,再重新取下一帧作为拼接帧进行比较:如果特征点数量高于设定的阈值,进入步骤2;否则认为这两次匹配无效,重新选择参考帧,新的参考帧为与旧参考帧能够有效匹配的最新拼接帧;
步骤2:根据两帧图像之间的特征点对应关系,计算透视变换模型:
H = h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 - - - ( 1 )
其中,h1,h2,h3用于表示拼接帧图像在给定世界坐标系x轴方向上的平移和旋转,h4,h5,h6用于表示拼接帧图像在给定世界坐标系y轴方向上的平移和旋转,h7,h8,h9用于表示拼接帧图像的尺度变换;
步骤3:计算透视变化模型的重投影误差,判断透视变化模型参数是否无效:
a、假设待拼接图像中任意像素p=(x,y,1)T,由下式计算此像素在参考帧图像中对应的像素p'=(x',y',1)T
x ′ = ( h 1 x + h 2 y + h 3 ) / ( h 7 x + h 8 y + h 9 ) y ′ = ( h 4 x + h 5 y + h 6 ) / ( h 7 x + h 8 y + h 9 ) - - - ( 2 )
写成矩阵的形式为:
( x ′ , y ′ , 1 ) T = 1 ( h 7 x + h 8 y + h 9 ) h 1 h 2 h 3 h 4 h 5 h 6 h 7 h 8 h 9 ( x , y , 1 ) T - - - ( 3 )
b、计算p'=(x',y',1)T重新投影到此拼接帧图像的对应像素p″=(x″,y″,1)T
( x ′ ′ , y ′ ′ , 1 ) T = 1 ( h 7 ′ x + h 8 ′ y + h 9 ′ ) H - 1 ( x ′ , y ′ , 1 ) T - - - ( 4 )
其中,h'7、h'8、h'9是H-1第三行的元素;
c、重投影误差由下式计算:
error = 1 N Σ i = 1 N | x i ′ ′ - x i | 2 + | y i ′ ′ - y i | 2 - - - ( 5 )
如果误差大于5个像素,则认为此透视变化模型参数无效;
步骤4:自适应调整拼接图像尺寸:
根据透视变换模型和公式3,计算拼接帧四个顶点的图像坐标经过透视变换后在参考帧图像坐标系下的坐标:
所述的拼接帧四个顶点的图像坐标:左上角Left_Up=(0,0),右上角Right_Up=(width,0),左下角Left_Bottom=(0,height),右下角Right_Bottom=(width,height);
所述的经过透视变换后的在参考帧图像坐标系下的坐标:左上角Left_Up=(xlu,ylu),右上角Right_Up=(xru,yru),左下角Left_Bottom=(xlb,ylb),右下角Right_Bottom=(xrb,yrb);
确定width,xlu,xru,xlb,xrb和height,ylu,yru,ylb,yrb中的最大值和最小值:
max X = max ( width , x lu , x ru , x lb , x rb ) min X = min ( 0 , x lu , x ru , x lb , x rb ) max Y = max ( height , y lu , y ru , y lb , y rb ) min Y = min ( 0 , y lu , y ru , y lb , y rb ) - - - ( 5 )
计算需要生成的拼接结果的尺寸,其中εw、εh是尺寸补偿:
new _ width = max X - min X + ϵ w new _ height = max Y - min Y + ϵ h - - - ( 6 )
按照此尺寸动态地分配内存空间给拼接帧图像,再利用逐像素复制,完成图像拼接。
2.根据权利要求1所述的基于参考帧变换及拼接尺寸自适应的同步在线拼接方法,其特征在于所述的阈值的取值范围为大于10且小于输入图像的分辨率大小。
3.根据权利要求1所述的基于参考帧变换及拼接尺寸自适应的同步在线拼接方法,其特征在于所述的εw、εh根据输入图像的分辨率确定,εw为图像宽的20%,εh为图像高的20%。
CN201410406496.2A 2014-08-18 2014-08-18 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法 Pending CN104166580A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410406496.2A CN104166580A (zh) 2014-08-18 2014-08-18 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410406496.2A CN104166580A (zh) 2014-08-18 2014-08-18 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法

Publications (1)

Publication Number Publication Date
CN104166580A true CN104166580A (zh) 2014-11-26

Family

ID=51910414

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410406496.2A Pending CN104166580A (zh) 2014-08-18 2014-08-18 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法

Country Status (1)

Country Link
CN (1) CN104166580A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106210560A (zh) * 2016-07-17 2016-12-07 合肥赑歌数据科技有限公司 基于流形的视频拼接方法
WO2017092007A1 (en) * 2015-12-03 2017-06-08 SZ DJI Technology Co., Ltd. System and method for video processing
CN111681170A (zh) * 2020-06-10 2020-09-18 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101146231A (zh) * 2007-07-03 2008-03-19 浙江大学 根据多视角视频流生成全景视频的方法
CN101379513A (zh) * 2005-08-04 2009-03-04 微软公司 视频对准和图像序列缝合
CN102201115A (zh) * 2011-04-07 2011-09-28 湖南天幕智能科技有限公司 无人机航拍视频实时全景图拼接方法
CN103227888A (zh) * 2013-04-21 2013-07-31 中国科学技术大学 一种基于经验模式分解和多种评价准则的视频去抖动方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101379513A (zh) * 2005-08-04 2009-03-04 微软公司 视频对准和图像序列缝合
CN101146231A (zh) * 2007-07-03 2008-03-19 浙江大学 根据多视角视频流生成全景视频的方法
CN102201115A (zh) * 2011-04-07 2011-09-28 湖南天幕智能科技有限公司 无人机航拍视频实时全景图拼接方法
CN103227888A (zh) * 2013-04-21 2013-07-31 中国科学技术大学 一种基于经验模式分解和多种评价准则的视频去抖动方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张秀伟等: ""基于Co-motion 的可见光-热红外图像序列自动配准算法"", 《自动化学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092007A1 (en) * 2015-12-03 2017-06-08 SZ DJI Technology Co., Ltd. System and method for video processing
CN108370454A (zh) * 2015-12-03 2018-08-03 深圳市大疆创新科技有限公司 用于视频处理的系统和方法
CN106210560A (zh) * 2016-07-17 2016-12-07 合肥赑歌数据科技有限公司 基于流形的视频拼接方法
CN111681170A (zh) * 2020-06-10 2020-09-18 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置及电子设备
CN111681170B (zh) * 2020-06-10 2023-05-02 杭州海康威视数字技术股份有限公司 一种图像处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN108537721B (zh) 全景图像的处理方法、装置及电子设备
US11350073B2 (en) Disparity image stitching and visualization method based on multiple pairs of binocular cameras
Darabi et al. Image melding: Combining inconsistent images using patch-based synthesis
US9307165B2 (en) In-camera panorama image stitching assistance
CN107369129B (zh) 一种全景图像的拼接方法、装置及便携式终端
WO2019101113A1 (zh) 一种图像融合方法及其设备、存储介质、终端
CN109064409B (zh) 一种移动机器人的视觉图像拼接系统及方法
WO2022089657A1 (zh) 拼接图像的色差消除方法、装置、设备和可读存储介质
CN204090039U (zh) 一体化大场景全景视频监控装置
CN107451952B (zh) 一种全景视频的拼接融合方法、设备以及系统
WO2017088533A1 (zh) 合并图像的方法和装置
WO2019052534A1 (zh) 图像拼接方法及装置、存储介质
Yuan et al. Multiscale gigapixel video: A cross resolution image matching and warping approach
CN105488775A (zh) 一种基于六摄像机环视的柱面全景生成装置及方法
CN110264396B (zh) 视频人脸替换方法、系统及计算机可读存储介质
CN102013110A (zh) 三维全景图像生成方法及系统
WO2021027585A1 (zh) 人脸图像处理方法及电子设备
CN106981078A (zh) 视线校正方法、装置、智能会议终端及存储介质
US10798300B2 (en) Method and device for unfolding lens image into panoramic image
Jain et al. A review paper on various approaches for image mosaicing
CN109035134B (zh) 全景图像拼接方法、装置、电子设备及存储介质
CN104166580A (zh) 基于参考帧变换及拼接尺寸自适应的同步在线拼接方法
CN112509106A (zh) 文档图片展平方法、装置以及设备
Collins et al. Locally affine and planar deformable surface reconstruction from video
US11055818B2 (en) Panorama image alignment method and device based on multipath images, and portable terminal

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141126

WD01 Invention patent application deemed withdrawn after publication