CN112465704A - 一种全局-局部自适应优化的全景光场拼接方法 - Google Patents

一种全局-局部自适应优化的全景光场拼接方法 Download PDF

Info

Publication number
CN112465704A
CN112465704A CN202011438515.1A CN202011438515A CN112465704A CN 112465704 A CN112465704 A CN 112465704A CN 202011438515 A CN202011438515 A CN 202011438515A CN 112465704 A CN112465704 A CN 112465704A
Authority
CN
China
Prior art keywords
light field
spliced
light
transformation matrix
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011438515.1A
Other languages
English (en)
Other versions
CN112465704B (zh
Inventor
金欣
周思瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen International Graduate School of Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen International Graduate School of Tsinghua University filed Critical Shenzhen International Graduate School of Tsinghua University
Priority to CN202011438515.1A priority Critical patent/CN112465704B/zh
Publication of CN112465704A publication Critical patent/CN112465704A/zh
Application granted granted Critical
Publication of CN112465704B publication Critical patent/CN112465704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

本发明公开了一种全局‑局部自适应优化的全景光场拼接方法,包括:输入多个待拼接光场;提取、匹配和筛选待拼接光场的特征点,以计算得到所有待拼接光场的全局单应性变换矩阵;将多个待拼接光场分别进行4D网格化,根据所述全局单应性变换矩阵评价每个网格的全局配准精度,计算全局配准精度低于预设阈值的网格的局部单应性变换矩阵,并根据所述局部单应性变换矩阵评价对应的网格的局部配准精度;比较全局配准精度和局部配准精度,对于每个网格取精度最高的单应性变换矩阵,融合光场,得到拼接结果。本发明保证了光场整体和细节拼接结果均最为准确,从而实现精确的多光场全景拼接方法。

Description

一种全局-局部自适应优化的全景光场拼接方法
技术领域
本发明涉及计算机视觉与数字图像处理领域,尤其涉及一种全局-局部自适应优化的全景光场拼接方法。
背景技术
光场相机主镜头和传感器之间的微透镜阵列可以有效捕捉光线信息,在一次拍摄中同时记录光线的方向和强度信息。因此,光场可以准确地再现场景中的立体视差、运动视差、反射、折射、重聚焦等效果,为用户提供极具真实感的沉浸式体验,给虚拟现实领域的研究提供极大助力。然而,受光场相机光学结构的限制,其视场角较小,为了从光场的巨大潜力中获益,必须扩展光场的视场角。全景光场拼接算法不依赖于特殊光学设计,也不需要复杂的采集方式,应用性较强。但是现有的全景光场拼接算法通常存在视差所带来的错位和重影问题,导致拼接结果不够准确。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为解决上述技术问题,本发明提出一种全局-局部自适应优化的全景光场拼接方法,保证了光场整体和细节拼接结果均最为准确,从而实现精确的多光场全景拼接方法。
为了达到上述目的,本发明采用以下技术方案:
本发明的一个实施例公开了一种全局-局部自适应优化的全景光场拼接方法,包括以下步骤:
S1:输入多个待拼接光场;
S2:提取、匹配和筛选待拼接光场的特征点,以计算得到所有待拼接光场的全局单应性变换矩阵;
S3:将多个待拼接光场分别进行4D网格化,根据所述全局单应性变换矩阵评价每个网格的全局配准精度,计算全局配准精度低于预设阈值的网格的局部单应性变换矩阵,并根据所述局部单应性变换矩阵评价对应的网格的局部配准精度;
S4:比较全局配准精度和局部配准精度,对于每个网格取精度最高的单应性变换矩阵,融合光场,得到拼接结果。
优选地,步骤S1具体还包括:解码和预处理多个待拼接光场以得到光场子孔径图像阵列:
SAIi(u0,v0)={Li(u,v,s,t)|u=u0,v=v0}
其中SAIi(u0,v0)是光场在视角(u0,v0)处的子孔径图像,待拼接光场Li(u,v,s,t)解码后得到光场子孔径图像阵列{SAIi(u0,v0)|u0∈[1,U],v0∈[1,V]},U、V是光场子孔径图像阵列的行数和列数,(u,v)为角度域坐标,(s,t)为空间域坐标。
优选地,步骤S1具体还包括:将多个待拼接光场投影至双球面坐标系,其中双平面坐标和双球面坐标之间的转换关系为:
Figure BDA0002821482790000021
其中,
Figure BDA0002821482790000022
是角度域球坐标,
Figure BDA0002821482790000023
是空间域球坐标,(u,v)为角度域坐标,(s,t)为空间域坐标,r是双球面的外球半径,f是光场相机焦距,α0是光场的俯仰角;
经过转换后,得到双球面坐标系下的待拼接光场
Figure BDA0002821482790000024
优选地,步骤S2具体包括:
S21:提取、匹配和筛选待拼接光场的特征点,计算待拼接光场对之间的单应性变换矩阵;
S22:确定参考光场和拼接顺序,计算所有待拼接光场变换到所述参考光场所在的坐标系的全局单应性变换矩阵。
优选地,步骤S21具体包括:将输入的多个待拼接光场两两配对,使用SIFT特征提取方法提取对应的子孔径图像中的特征点对,对每一组的特征点对使用连续一致抽样检测算法进行筛选,合并每一组筛选后的特征点对,得到光场中有效的匹配特征点对;
根据光场中有效的匹配特征点对预测得到待拼接光场对之间的单应性变换矩阵Hij为:
Pj=HijPi
其中,Pi和Pj是待拼接光场Li和待拼接光场Lj的有效匹配特征点对,Hij表示待拼接光场Li和待拼接光场Lj之间的单应性变换矩阵;
再根据下式求解待拼接光场对之间的单应性变换矩阵Hij的最优解
Figure BDA0002821482790000031
Figure BDA0002821482790000032
其中,矩阵Aij∈R4N×25通过矩阵变换得到:04×1=Aij×Hij,N为有效匹配特征点对的数量。
优选地,步骤S22中确定参考光场具体包括:遍历所有的待拼接光场,将与其他所有待拼接光场之间的有效匹配特征点对数量最多的待拼接光场作为参考光场Lr
进一步地,步骤S22中确定拼接顺序具体包括:从所述参考光场开始,采用贪心算法搜索最优拼接顺序,计算每一个待拼接光场到参考光场的拼接路径,并根据路径索引取对应的全局单应性变换矩阵Hir
更进一步地,采用光束平差法优化全局单应性变换矩阵,取特征点映射残差作为优化目标:
Figure BDA0002821482790000033
其中,Pr和Pi是所述参考光场Lr和待拼接光场Li的有效匹配特征点对;
Figure BDA0002821482790000045
为全局单应性变换矩阵Hir的最优解。
优选地,步骤S3中将多个待拼接光场分别进行4D网格化,评价每个网格的全局配准精度具体包括:
将多个待拼接光场分别进行4D网格化,划分网格数量为1×1×X×Y,并对每一个网格进行映射,采用映射后网格中心子视角之间的RMSE来评价全局单应性变换矩阵Hir的配准精度:
Figure BDA0002821482790000041
其中,Gixy是将待拼接光场Li进行分割后的网格,HirGixy是从待拼接光场Li所在的坐标系通过全局单应性变换矩阵Hir映射到所述参考光场Lr所在的坐标系的网格,x∈[1,X],y∈[1,Y],M为待拼接光场的数量;
进一步地,对于Q(Hir)高于预设阈值的网格,计算所有特征点与该网格中心点的距离权重,以计算得到该网格的局部单应性变换矩阵Hixy
Figure BDA0002821482790000042
其中,wk是特征点与该网格中心点的距离权重,
Figure BDA0002821482790000043
是局部单应性变换矩阵Hixy的最优解,矩阵Air∈R4N×25通过矩阵变换得到:04×1=Air×Hir,N为有效匹配特征点对的数量;
再采用映射后网格中心子视角之间的RMSE来评价局部单应性变换矩阵Hixy的配准精度:
Figure BDA0002821482790000044
其中,HixyGixy是从待拼接光场Li所在的坐标系通过局部单应性变换矩阵Hixy映射到所述参考光场Lr所在的坐标系的网格,x∈[1,X],y∈[1,Y],M为待拼接光场的数量。
优选地,步骤S4具体包括:遍历待拼接光场的每个网格,比较全局配准精度和局部配准精度,对每个网格取精度最高的单应性变换矩阵:
Figure BDA0002821482790000051
其中,T为预设阈值;
再采用单应性变换矩阵集合{Hixy|i∈[1,M],x∈[1,X],y∈[1,Y]}将所有待拼接光场映射到所述参考光场所在的坐标系中,并采用4D图割进行光场融合,得到拼接结果。
优选地,采用4D图割进行光场融合具体包括:
将4D光场映射到一个带权无向图中,计算能量优化函数:
Figure BDA0002821482790000052
其中p、p'是光场重叠区域O中相邻的像素,R(p)是区域项,B(p,p')是边界项;最后通过最小化能量优化函数找到光场拼接的最优缝合线,实现光场融合。
本发明的另一实施例公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使处理器实现上述的全景光场拼接方法的步骤。
与现有技术相比,本发明的有益效果在于:本发明提出的全局-局部自适应优化的全景光场拼接方法,充分利用每个光场的特征点,计算待拼接光场到参考光场的单应性变换矩阵,由全局单应性变换矩阵与局部单应性变换矩阵混合配准光场并融合光场,得到整体效果合理且细节准确度高的拼接结果,大大提高多光场的全景拼接精度。
附图说明
图1是本发明实施例公开的全局-局部自适应优化的全景光场拼接方法;
图2是本发明优选实施例公开的全局-局部自适应优化的全景光场拼接方法。
具体实施方式
下面对照附图并结合优选的实施方式对本发明作进一步说明。在具体的实施方案中执行本发明的步骤时,可以按照以下方式操作。需注意的是,在实施过程中所采用的具体方法都仅为举例说明,本发明所涵盖的范围包括但不局限于所列举的以下方法。
现有的光场拼接方法通过特征匹配和单应性变换矩阵映射的方法进行光场配准,分为全局单应性变换矩阵配准和网格单应性变换矩阵配准两种方式,全局单应性变换矩阵配准的光场整体形态合理,但不能解决视差所带来的错位和重影,网格单应性变换矩阵配准是将光场划分为网格,对每个网格估计单应性变换矩阵并配准的,可以解决小视差带来的配准错误,但由于网格单应性变换矩阵主要由该网格内部的特征点对求解得出,所以配准结果与局部细节相关,而无法保证整体准确。
本发明基于现有的光场拼接方法所存在的问题,提出一种全局-局部自适应优化的全景光场拼接方法,结合全局和局部单应性准确地配准光场;具体地,本方法中将光场划分为4D网格,引入局部准确度评价函数,引导拼接过程中自适应地选择全局或局部单应性变换矩阵,能够同时保证全景光场整体形态正常且局部细节准确。
如图1,本发明的一个实施例公开了一种全局-局部自适应优化的全景光场拼接方法,包括以下步骤:
S1:输入多个待拼接光场;
S2:提取、匹配和筛选待拼接光场的特征点,以计算得到所有待拼接光场的全局单应性变换矩阵;
S3:将多个待拼接光场分别进行4D网格化,根据全局单应性变换矩阵评价每个网格的全局配准精度,计算全局配准精度低于预设阈值的网格的局部单应性变换矩阵,并根据局部单应性变换矩阵评价对应的网格的局部配准精度;
S4:比较全局配准精度和局部配准精度,对于每个网格取精度最高的单应性变换矩阵,融合光场,得到拼接结果。
如图2,本发明的一个优选实施例公开了一种全局-局部自适应优化的全景光场拼接方法,包括以下步骤:
A1:解码和预处理待拼接光场,得到光场子孔径图像阵列,并且将待拼接光场投影至双球面坐标系;
在本实施例中,以拼接M个光场为例,
Figure BDA0002821482790000061
为待拼接光场,其中(u,v)为角度域坐标,(s,t)为空间域坐标。对输入光场进行解码和预处理,得到光场的子孔径图像方法如下:
SAIi(u0,v0)={Li(u,v,s,t)|u=u0,v=v0}. (1)
其中SAIi(u0,v0)是光场在视角(u0,v0)处的子孔径图像;光场Li解码后得到子孔径图像阵列{SAIi(u0,v0)|u0∈[1,U],v0∈[1,V]},U、V是子孔径图像阵列的行数和列数。
本实施例在球坐标系下拼接光场全景,解码后的光场参数化的形式是双平面法,需投影到光场的双球面坐标系下再做下一步拼接,双平面坐标和双球面坐标之间的转换关系如下:
Figure BDA0002821482790000071
其中,
Figure BDA0002821482790000072
是角度域球坐标,
Figure BDA0002821482790000073
是空间域球坐标,r是双球面的外球半径,f是光场相机焦距,α0是光场的俯仰角。为了简化计算,本实施例依然使用坐标(u,v)作为角度域坐标以表示视角,使用等矩形投影(Equirectangular Projection,ERP)表示空间域坐标:
Figure BDA0002821482790000074
经过变换,得到双球面坐标系下的待拼接光场集合
Figure BDA0002821482790000075
A2:提取、匹配和筛选光场特征点,确定参考光场和拼接顺序,并计算全局单应性变换矩阵配准光场,使用光束平差优化全景光场的配准精度。
具体地,步骤A2包括以下步骤:
A21:提取、匹配和筛选光场特征点,计算光场对之间的单应性变换矩阵;
在本实施例中,将输入光场两两配对,使用SIFT特征提取方法提取对应子孔径图像中的特征点对,对每一组的特征点对使用连续一致抽样检测(RANSAC)算法进行筛选,合并每一组筛选后的特征点对,得到光场中有效的匹配特征点对。
在本实施例中,预测的待拼接光场Li和待拼接光场Lj之间的单应性变换矩阵Hij为:
Pj=HijPi (4)
其中,
Figure BDA0002821482790000081
Figure BDA0002821482790000082
是待拼接光场Li和待拼接光场Lj的有效匹配特征点对。
在本实施例中,从特征点对求解光场对之间的单应性变换矩阵的方法如下:
Figure BDA0002821482790000083
其中
Figure BDA0002821482790000084
为单应性变换矩阵Hij的最优解,矩阵Aij∈R4N×25(R为实数,N为有效匹配特征点对的数量)通过矩阵变换得到:
04×1=Aij×Hij (6)
A22:确定参考光场和拼接顺序,计算所有待拼接光场变换到参考坐标系的链条式全局单应性变换矩阵,使用光束平差优化全景光场的配准精度。
本实施例中,待拼接光场Li和待拼接光场Lj之间的特征点对数量为Sij,所有配对光场之间的特征点对数量组成的集合为[Sij]M×M。遍历待拼接光场,与其他所有光场之间的有效匹配特征点对数量最多的光场为参考光场Lr,参考光场满足条件:
Figure BDA0002821482790000085
其中,Srj表示参考光场Lr和待拼接光场Lj之间的特征点对数量,Sij表示待拼接光场Li和待拼接光场Lj之间的特征点对数量。
从参考光场开始,使用贪心算法搜索最优拼接顺序,计算每一个待拼接光场到参考光场的拼接路径,并根据路径索引取对应的全局单应性变换矩阵Hir或将多个H相乘获得Hir,并使用光束平差法优化全局单应性变换矩阵集合,取特征点映射残差作为优化目标:
Figure BDA0002821482790000086
得到链条式全局单应性变换矩阵集合
Figure BDA0002821482790000087
也即所有待拼接光场变换到参考光场所在的坐标系的全局单应性变换矩阵;其中,Pr和Pi是参考光场Lr和待拼接光场Li的有效匹配特征点对;
Figure BDA0002821482790000088
为全局单应性变换矩阵Hir的最优解,Hir表示待拼接光场Li变换到参考光场Lr所在的坐标系的全局单应性变换矩阵。
A3:将待拼接光场进行4D网格化,划分网格数量为1×1×X×Y,评价每个网格的全局配准精度,对于精度较低的网格,计算所有特征点与该网格中心点的距离权重,以此估计该网格的局部单应性变换矩阵,并评价网格的局部配准精度。
具体地,步骤A3包括以下步骤:
A31:将待拼接光场进行4D网格化,评价每个网格的全局配准精度;
在本实施例中,将输入光场数据分割成规则的4维立体网格,然后对每一个网格进行映射:
Gixy'=HirGixy (9)
其中Gixy是将输入的待拼接光场Li分割后的网格,Gixy'是从待拼接光场Li所在的坐标系通过全局单应性变换矩阵Hir映射到参考光场Lr所在的坐标系映射后的网格,x∈[1,X],y∈[1,Y],X、Y表示网格的总数。
本实施例中,使用映射后网格中心子视角之间的RMSE评价全局单应性变换矩阵配准精度。
Figure BDA0002821482790000091
其中,
Figure BDA0002821482790000092
是与当前网格映射到参考坐标系(参考光场所的坐标系)相同区域的所有待输入光场中的对应网格。
如果RMSE高于阈值T,则表明对应的网格的单应性变换矩阵配准精度较低,对当前网格估计局部网格单应性变换矩阵。
A32:对于精度较低的网格,计算所有特征点与该网格中心点的距离权重,以此估计该网格的局部单应性变换矩阵,并评价网格的局部配准精度。
在本实施例中,求解每个网格的单应性变换矩阵方式如下:
Figure BDA0002821482790000093
其中wk是与网格所在的位置有关的权值(即特征点与该网格中心点的距离权重),
Figure BDA0002821482790000094
是局部单应性变换矩阵Hixy的最优解,矩阵Air∈R4N×25通过矩阵变换得到:04×1=Air×Hir,N为有效匹配特征点对的数量;
具体地,权值wk定义为:
Figure BDA0002821482790000101
其中α是比例系数,η∈[0,1]是权值矩阵的最小阈值,(x*,y*)是网格中心的位置坐标,(xk,yk)是特征点所在的位置坐标。
再采用映射后网格中心子视角之间的RMSE来评价局部单应性变换矩阵Hixy的配准精度:
Figure BDA0002821482790000102
其中,HixyGixy是从待拼接光场Li所在的坐标系通过局部单应性变换矩阵Hixy映射到参考光场Lr所在的坐标系的网格,x∈[1,X],y∈[1,Y],M为待拼接光场的数量。
在本实施例中,对于使用全局单应性变换矩阵映射后RMSE值较高的网格(也即全局配准精度较低的网格),根据网格位置设定权重矩阵,重新估计网格单应性变换矩阵,该矩阵主要由靠近网格中心的特征点决定,因此与网格内部细节相关性强,能够准确配准细节;在重新估计网格的局部单应性变换矩阵后,还对局部单应性变换矩阵映射后的RMSE值来进行评价局部配准精度。
A4:比较全局配准精度和局部配准精度,对每个网格取精度最高的单应性变换矩阵,融合光场,得到拼接结果。
在本实施例中,遍历待拼接光场的每个网格,比较全局配准精度和局部配准精度,对每个网格取精度最高的单应性变换矩阵:
Figure BDA0002821482790000103
T为预设阈值;使用单应性变换矩阵集合{Hixy|i∈[1,M],x∈[1,X],y∈[1,Y]}将所有待拼接光场映射到参考光场所在的坐标系中,然后使用4Dgraphcut(4D图割)进行光场融合,得到拼接结果。
在本实施例中,首先将4D光场映射到一个带权无向图中,其次计算能量优化函数:
Figure BDA0002821482790000104
其中p,p'是光场重叠区域O中相邻的像素,R(p)是区域项,B(p,p')是边界项。最后通过最小化能量优化函数找到光场拼接的最优缝合线,实现光场融合。
本优选实施例基于光场双球面坐标系,在拼接过程中实现全局-局部单应性变换矩阵自适应配准,保证了光场整体和细节拼接结果均最为准确,从而实现精确的多光场全景拼接方法。
上述优选实施例公开的全景光场拼接方法是用于球面全景光场的拼接,本发明所公开的全景光场拼接方法也可以应用于非球面全景光场,应用于非球面全景光场时不需将待拼接光场投影至双球面坐标系,只需直接在双平面坐标系上进行拼接即可,同样可以在拼接过程中实现全局-局部单应性变换矩阵自适应配准,保证光场整体和细节拼接结果均最为准确,从而实现精确的多光场全景拼接方法。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述的全景光场拼接方法,具体实现可参见方法实施例,在此不再赘述。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (10)

1.一种全局-局部自适应优化的全景光场拼接方法,其特征在于,包括以下步骤:
S1:输入多个待拼接光场;
S2:提取、匹配和筛选待拼接光场的特征点,以计算得到所有待拼接光场的全局单应性变换矩阵;
S3:将多个待拼接光场分别进行4D网格化,根据所述全局单应性变换矩阵评价每个网格的全局配准精度,计算全局配准精度低于预设阈值的网格的局部单应性变换矩阵,并根据所述局部单应性变换矩阵评价对应的网格的局部配准精度;
S4:比较全局配准精度和局部配准精度,对于每个网格取精度最高的单应性变换矩阵,融合光场,得到拼接结果。
2.根据权利要求1所述的全景光场拼接方法,其特征在于,步骤S1具体还包括:解码和预处理多个待拼接光场以得到光场子孔径图像阵列:
SAIi(u0,v0)={Li(u,v,s,t)|u=u0,v=v0}
其中SAIi(u0,v0)是光场在视角(u0,v0)处的子孔径图像,待拼接光场Li(u,v,s,t)解码后得到光场子孔径图像阵列{SAIi(u0,v0)|u0∈[1,U],v0∈[1,V]},U、V是光场子孔径图像阵列的行数和列数,(u,v)为角度域坐标,(s,t)为空间域坐标。
3.根据权利要求1所述的全景光场拼接方法,其特征在于,步骤S1具体还包括:将多个待拼接光场投影至双球面坐标系,其中双平面坐标和双球面坐标之间的转换关系为:
Figure FDA0002821482780000011
其中,
Figure FDA0002821482780000013
是角度域球坐标,
Figure FDA0002821482780000012
是空间域球坐标,(u,v)为角度域坐标,(s,t)为空间域坐标,r是双球面的外球半径,f是光场相机焦距,α0是光场的俯仰角;
经过转换后,得到双球面坐标系下的待拼接光场
Figure FDA0002821482780000023
4.根据权利要求1所述的全景光场拼接方法,其特征在于,步骤S2具体包括:
S21:提取、匹配和筛选待拼接光场的特征点,计算待拼接光场对之间的单应性变换矩阵;
S22:确定参考光场和拼接顺序,计算所有待拼接光场变换到所述参考光场所在的坐标系的全局单应性变换矩阵。
5.根据权利要求4所述的全景光场拼接方法,其特征在于,步骤S21具体包括:将输入的多个待拼接光场两两配对,使用SIFT特征提取方法提取对应的子孔径图像中的特征点对,对每一组的特征点对使用连续一致抽样检测算法进行筛选,合并每一组筛选后的特征点对,得到光场中有效的匹配特征点对;
根据光场中有效的匹配特征点对预测得到待拼接光场对之间的单应性变换矩阵Hij为:
Pj=HijPi
其中,Pi和Pj是待拼接光场Li和待拼接光场Lj的有效匹配特征点对,Hij表示待拼接光场Li和待拼接光场Lj之间的单应性变换矩阵;
再根据下式求解待拼接光场对之间的单应性变换矩阵Hij的最优解
Figure FDA0002821482780000021
Figure FDA0002821482780000022
其中,矩阵Aij∈R4N×25通过矩阵变换得到:04×1=Aij×Hij,N为有效匹配特征点对的数量。
6.根据权利要求5所述的全景光场拼接方法,其特征在于,步骤S22中确定参考光场具体包括:遍历所有的待拼接光场,将与其他所有待拼接光场之间的有效匹配特征点对数量最多的待拼接光场作为参考光场Lr
进一步地,步骤S22中确定拼接顺序具体包括:从所述参考光场开始,采用贪心算法搜索最优拼接顺序,计算每一个待拼接光场到参考光场的拼接路径,并根据路径索引取对应的全局单应性变换矩阵Hir
更进一步地,采用光束平差法优化全局单应性变换矩阵,取特征点映射残差作为优化目标:
Figure FDA0002821482780000031
其中,Pr和Pi是所述参考光场Lr和待拼接光场Li的有效匹配特征点对;
Figure FDA0002821482780000032
为全局单应性变换矩阵Hir的最优解。
7.根据权利要求1所述的全景光场拼接方法,其特征在于,步骤S3中将多个待拼接光场分别进行4D网格化,评价每个网格的全局配准精度具体包括:
将多个待拼接光场分别进行4D网格化,划分网格数量为1×1×X×Y,并对每一个网格进行映射,采用映射后网格中心子视角之间的RMSE来评价全局单应性变换矩阵Hir的配准精度:
Figure FDA0002821482780000033
其中,Gixy是将待拼接光场Li进行分割后的网格,HirGixy是从待拼接光场Li所在的坐标系通过全局单应性变换矩阵Hir映射到所述参考光场Lr所在的坐标系的网格,x∈[1,X],y∈[1,Y],M为待拼接光场的数量;
进一步地,对于Q(Hir)高于预设阈值的网格,计算所有特征点与该网格中心点的距离权重,以计算得到该网格的局部单应性变换矩阵Hixy
Figure FDA0002821482780000034
其中,wk是特征点与该网格中心点的距离权重,
Figure FDA0002821482780000035
是局部单应性变换矩阵Hixy的最优解,矩阵Air∈R4N×25通过矩阵变换得到:04×1=Air×Hir,N为有效匹配特征点对的数量;
再采用映射后网格中心子视角之间的RMSE来评价局部单应性变换矩阵Hixy的配准精度:
Figure FDA0002821482780000036
其中,HixyGixy是从待拼接光场Li所在的坐标系通过局部单应性变换矩阵Hixy映射到所述参考光场Lr所在的坐标系的网格,x∈[1,X],y∈[1,Y],M为待拼接光场的数量。
8.根据权利要求7所述的全景光场拼接方法,其特征在于,步骤S4具体包括:遍历待拼接光场的每个网格,比较全局配准精度和局部配准精度,对每个网格取精度最高的单应性变换矩阵:
Figure FDA0002821482780000041
其中,T为预设阈值;
再采用单应性变换矩阵集合{Hixy|i∈[1,M],x∈[1,X],y∈[1,Y]}将所有待拼接光场映射到所述参考光场所在的坐标系中,并采用4D图割进行光场融合,得到拼接结果。
9.根据权利要求8所述的全景光场拼接方法,其特征在于,采用4D图割进行光场融合具体包括:
将4D光场映射到一个带权无向图中,计算能量优化函数:
Figure FDA0002821482780000042
其中p、p'是光场重叠区域O中相邻的像素,R(p)是区域项,B(p,p')是边界项;最后通过最小化能量优化函数找到光场拼接的最优缝合线,实现光场融合。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,所述计算机可执行指令促使处理器实现权利要求1至9任一项所述的全景光场拼接方法的步骤。
CN202011438515.1A 2020-12-07 2020-12-07 一种全局-局部自适应优化的全景光场拼接方法 Active CN112465704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011438515.1A CN112465704B (zh) 2020-12-07 2020-12-07 一种全局-局部自适应优化的全景光场拼接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011438515.1A CN112465704B (zh) 2020-12-07 2020-12-07 一种全局-局部自适应优化的全景光场拼接方法

Publications (2)

Publication Number Publication Date
CN112465704A true CN112465704A (zh) 2021-03-09
CN112465704B CN112465704B (zh) 2024-02-06

Family

ID=74800591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011438515.1A Active CN112465704B (zh) 2020-12-07 2020-12-07 一种全局-局部自适应优化的全景光场拼接方法

Country Status (1)

Country Link
CN (1) CN112465704B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066010A (zh) * 2021-04-06 2021-07-02 无锡安科迪智能技术有限公司 全景拼接图像的二次调整方法、装置、电子设备及存储介质
CN113483695A (zh) * 2021-07-01 2021-10-08 先临三维科技股份有限公司 三维扫描系统、辅助件、处理方法、装置、设备及介质
CN113537238A (zh) * 2021-07-05 2021-10-22 上海闪马智能科技有限公司 一种信息处理方法及图像识别装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105701820A (zh) * 2016-01-14 2016-06-22 上海大学 一种基于匹配区域的点云配准方法
CN107067370A (zh) * 2017-04-12 2017-08-18 长沙全度影像科技有限公司 一种基于网格变形的图像拼接方法
CN107113381A (zh) * 2014-11-13 2017-08-29 华为技术有限公司 时空局部变形及接缝查找的容差视频拼接
CN108921781A (zh) * 2018-05-07 2018-11-30 清华大学深圳研究生院 一种基于深度的光场拼接方法
US20190234746A1 (en) * 2016-09-14 2019-08-01 Zhejiang University Method for simultaneous localization and mapping
WO2019217366A1 (en) * 2018-05-11 2019-11-14 Intuitive Surgical Operations, Inc. Systems and methods related to registration for image guided surgery

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107113381A (zh) * 2014-11-13 2017-08-29 华为技术有限公司 时空局部变形及接缝查找的容差视频拼接
CN105701820A (zh) * 2016-01-14 2016-06-22 上海大学 一种基于匹配区域的点云配准方法
US20190234746A1 (en) * 2016-09-14 2019-08-01 Zhejiang University Method for simultaneous localization and mapping
CN107067370A (zh) * 2017-04-12 2017-08-18 长沙全度影像科技有限公司 一种基于网格变形的图像拼接方法
CN108921781A (zh) * 2018-05-07 2018-11-30 清华大学深圳研究生院 一种基于深度的光场拼接方法
WO2019217366A1 (en) * 2018-05-11 2019-11-14 Intuitive Surgical Operations, Inc. Systems and methods related to registration for image guided surgery

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SIYAO ZHOU ET AL.: "Light Field Stitching Based On Concentric Spherical Modeling", 2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), pages 2616 - 2620 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113066010A (zh) * 2021-04-06 2021-07-02 无锡安科迪智能技术有限公司 全景拼接图像的二次调整方法、装置、电子设备及存储介质
CN113483695A (zh) * 2021-07-01 2021-10-08 先临三维科技股份有限公司 三维扫描系统、辅助件、处理方法、装置、设备及介质
CN113483695B (zh) * 2021-07-01 2024-01-26 先临三维科技股份有限公司 三维扫描系统、辅助件、处理方法、装置、设备及介质
CN113537238A (zh) * 2021-07-05 2021-10-22 上海闪马智能科技有限公司 一种信息处理方法及图像识别装置
CN113537238B (zh) * 2021-07-05 2022-08-05 上海闪马智能科技有限公司 一种信息处理方法及图像识别装置

Also Published As

Publication number Publication date
CN112465704B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
Berman et al. Single image dehazing using haze-lines
He et al. Epipolar transformers
CN108921781B (zh) 一种基于深度的光场拼接方法
Wang et al. Multi-view stereo in the deep learning era: A comprehensive review
JP6847718B6 (ja) ライトフィールドデータを処理する方法およびデバイス
CN112465704B (zh) 一种全局-局部自适应优化的全景光场拼接方法
KR101643607B1 (ko) 영상 데이터 생성 방법 및 장치
CN107635129B (zh) 一种三维三目摄像装置及深度融合方法
Ai et al. Deep learning for omnidirectional vision: A survey and new perspectives
CN108734657B (zh) 一种具有视差处理能力的图像拼接方法
CN109118544B (zh) 基于透视变换的合成孔径成像方法
CN112949508A (zh) 模型训练方法、行人检测方法、电子设备及可读存储介质
CN111343367A (zh) 一种十亿像素虚拟现实视频采集装置、系统与方法
CN113570530B (zh) 图像融合方法、装置、计算机可读存储介质和电子设备
CN108444452B (zh) 目标经纬度和拍摄装置的三维空间姿态的检测方法及装置
CN115578704A (zh) 深度估计模型训练、深度估计方法、装置、设备及介质
Zhang et al. Wide-area crowd counting: Multi-view fusion networks for counting in large scenes
CN112243518A (zh) 获取深度图的方法、装置及计算机存储介质
CN116563693A (zh) 基于轻量级注意力机制的水下图像色彩复原方法
CN116486250A (zh) 一种基于嵌入式的多路图像采集与处理方法及系统
Xue et al. Fisheye distortion rectification from deep straight lines
Ramirez et al. Booster: a benchmark for depth from images of specular and transparent surfaces
CN116912675A (zh) 一种基于特征迁移的水下目标检测方法及系统
Chen et al. A defocus and similarity attention-based cascaded network for multi-focus and misaligned image fusion
CN116883981A (zh) 一种车牌定位识别方法、系统、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant