CN107274448B - 一种基于水平树结构的可变权重代价聚合立体匹配算法 - Google Patents

一种基于水平树结构的可变权重代价聚合立体匹配算法 Download PDF

Info

Publication number
CN107274448B
CN107274448B CN201710559664.5A CN201710559664A CN107274448B CN 107274448 B CN107274448 B CN 107274448B CN 201710559664 A CN201710559664 A CN 201710559664A CN 107274448 B CN107274448 B CN 107274448B
Authority
CN
China
Prior art keywords
weight
cost
image
horizontal
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710559664.5A
Other languages
English (en)
Other versions
CN107274448A (zh
Inventor
白瑞林
彭建建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN201710559664.5A priority Critical patent/CN107274448B/zh
Publication of CN107274448A publication Critical patent/CN107274448A/zh
Application granted granted Critical
Publication of CN107274448B publication Critical patent/CN107274448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明是一种基于水平树结构的可变权重代价聚合立体匹配算法,该方法包括计算匹配代价、计算引导图像、构建水平权值树与垂直权值树、代价聚合、更新权值树、代价聚合和视差优化等阶段。在代价聚合阶段获得初始视差值后,对四领域图边的权值进行相应的调整,将平滑约束和权值调整结合起来,通过对四领域图边的权值更新,构建新的水平权值树和垂直权值树,沿着水平树、垂直树聚合,代价聚合结果表明对背景区域和图像边界区域匹配精度有一定提高。

Description

一种基于水平树结构的可变权重代价聚合立体匹配算法
技术领域
本发明属于计算机立体视觉领域的立体匹配部分,涉及到一种基于水平树结构的可变权重代价聚合立体匹配算法,可应用于虚拟现实、机器人导航、3D场景绘制与重建等领域。
背景技术
立体匹配是根据同一场景内不同视角下的两幅图像,通过寻找像素之间的对应关系来获得3D场景中物体的深度信息的过程。它是计算机视觉领域中最悠久且尚未解决的问题之一。
根据约束条件的不同,立体匹配算法可分为全局立体匹配和局部立体匹配两类。现行的全局匹配算法通常考虑局部的颜色信息和结构信息,并为图像建立全局的能量函数,通过一些优化方法,如置信度传播、动态规划、图割等来为每个像素点分配视差值。虽然全局立体匹配算法有较高的匹配精度,但是其复杂度和运算量过大,往往需要分布式系统和专用计算设备的支持,难以满足实时性要求。局部立体匹配由于每个像素点只依靠相邻像素的支持,而这些提供支持的邻域像素,必须具备深度相似性。而支持窗口的的大小、形状在没有图像的先验信息的情况下很难确定。若采用固定的小窗口可以很好的估计丰富纹理区域和边缘区域的视差值,但是导致弱纹理区域的误匹配,并且易受噪声影响。而较大的窗口对弱纹理区域匹配较好,但是会导致深度不连续区域过于平滑,即前景膨胀现象。
Yang于2015年提出了一种新颖的代价量正则化(cost volume regularization)和水平树权值传播相结合的非局部立体匹配算法。其中水平树权值传播方法利用图论中的概念,把参照图像视为一个4连通无向图结构。其将图像中每个像素点作为一个节点,像素点与相邻像素之间的距离作为权重支持,所有像素沿着水平树和垂直树结构通过权值传播对目标像素提供支持。针对大多数局部立体匹配都基于一基本假设-局部支持区域视差相同。其得到的视差图出现视差分层现象且对于倾斜平面视差估计很差。因此Yang在代价聚合阶段引入全局匹配中的平滑项(smoothness terms)的思想,大大增加了倾斜平面的视差精度。但是该算法在代价聚合阶段只使用颜色信息计算四邻域边的权值,忽视了真实场景中颜色相同区域可能深度不同,不同颜色区域可能深度相同现象。这导致图像背景区域和相同颜色边界区域视差估计不准确。
发明内容
本发明所要解决的技术问题是,针对前述现有技术的缺陷,提出一种基于水平树结构的可变权重代价聚合立体匹配算法,提高匹配精度。
本发明通过下述技术方案解决前述技术问题:
一种基于水平树结构的可变权重代价聚合立体匹配算法,包括如下步骤:
(1)计算匹配代价:分别选取左、右图像为参考图,利用图像的亮度信息、水平梯度信息计算匹配代价;
(2)计算引导图像:对左右参考图像进行窗口大小为3*3的中值滤波获得引导图像,减小图像噪声对代价聚合阶段中的权值计算的影响;
(3)构建水平权值树与垂直权值树:根据四邻域像素之间的颜色差异构建水平权值树与垂直权值树;
(4)计算代价聚合值:把图像中的每个像素当做一个节点,根据步骤(3)得到的权值和Yang提出的代价量正则化对步骤(1)获得的每个像素点的匹配代价值进行代价聚合;
(5)计算初始视差图:利用“胜者为王”算法(英文名称为:Winner Take All,简称为WTA算法)获得初始视差图,这个算法是在视差范围内通过选择每个像素聚合后的匹配代价中最小值所对应的视差值作为最终视差值,获得初始视差图D;
(6)更新水平权值树与垂直权值树:根据步骤(5)得到的初始视差图,将像素视差信息与颜色信息相结合重新计算相邻像素之间的权值;
(7)重新计算代价聚合值:把图像中的每个像素当做一个节点,根据步骤(6)获得的权值和代价正则化匹配聚合算法对步骤(1)获得的每个像素点的匹配代价值进行代价聚合;
(8)计算视差图:同步骤(5)利用“胜者为王”算法获得视差图D1;
(9)视差优化:采用左右一致性检测方法检测步骤(8)获得的视差图D1,将满足左右一致性像素点归类为可靠像素点,不满足的归类为不可靠像素点,对像素点代价量根据下式
Figure BDA0001346736890000021
做更新,获得新的代价量。其中dp为像素点p的视差值,β∈[0,1]。根据步骤(8)获得的视差图D1与像素之间的颜色信息依据步骤(6)重新计算相邻像素之间的权值,通过步骤(7)水平树权值传播与代价正则化对新获得的代价量Cnew进行聚合,然后采用胜者为王算法获得最终的视差图。
本发明的有益效果:
本发明针对非局部聚合中只采用颜色信息计算相邻像素之间的权值,其对真实场景中相同颜色但深度不同或颜色不同但深度相同等情况不能进行有效的表述,因此在这些区域视差估计精度不高,基于实际场景中视差值应满足平滑性约束,本发明在获取初始视差值后,对四邻域图边的权值进行相应的调整,将平滑性约束和权值调整结合起来,通过对四邻域图边的权值更新,构建新的水平权值树和垂直权值树,采用Yang提出的代价正则化聚合方法,聚合结果表明相比Yang能有效提高背景区域和边缘匹配精度。
附图说明
图1是本发明整体流程。
图2是水平权值树与垂直权值树权值计算图。
图3是聚合阶段权值传播方向图。
图4是误差图。
具体实施方式
下面结合实例和附图对本发明内容作进一步的说明,但不是对本发明的限定。
如图1所示,一种基于水平树结构的可变权重代价聚合立体匹配算法,包含以下几个步骤:
(1)计算匹配代价:
依次选取左、右图为参考图,用图像的颜色信息和水平梯度信息相结合计算匹配代价
Figure BDA0001346736890000031
Figure BDA0001346736890000032
C(x,y,d)=α*Cc(x,y,d)+(1-α)*Cg(x,y,d)
其中,k代表图像R,G,B三个通道,
Figure BDA0001346736890000035
Figure BDA0001346736890000036
分别表示左、右彩色图像转换成灰度图像后的水平方向梯度图,Tc和Tg为截断阈值,取值为Tc=7、Tg=2。α是平衡因子,一般取值为0.11。Cc(x,y,d)代表参考像素点在视差假设为d的亮度匹配代价,Cg(x,y,d)代表参考像素点在视差假设为d的水平梯度匹配代价,C(x,y,d)表示参考像素点在视差为d的初始匹配代价。
(2)计算引导图像:
对左、右图像进行窗口大小为3*3的中值滤波
I(x,y)=Median(IH(x,y))
获得引导图像I(x,y),其中,IH(x,y)为左右图像中以像素点(x,y)为中心,窗口大小为3*3内的像素灰度值,Median(IH(x,y))为序列IH(x,y)的中值。
(3)构建水平权值树与垂直权值树:
首先将引导图像中的每个像素当做一个节点,当考虑水平方向上相邻像素之间的权重关系时构建如图2中左图的水平树结构,同理当考虑垂直方向相邻像素权重关系时构建图2右图垂直树结构。以图2左图中节点a、b和右图中节点1、2为例,用如下公式计算它们之间的权重:
Figure BDA0001346736890000033
Figure BDA0001346736890000034
Figure BDA0001346736890000041
Figure BDA0001346736890000042
其中,Ta,b(I)表示在水平树中,节点a、b之间的权重,T1,2(I)表示在垂直树中节点1、2之间的权重,R,G,B表示图像三个通道,wa,b表示节点a、b之间的颜色距离,w1,2表示节点1、2之间的颜色距离,σ为平滑因子,一般取值为255*0.08。
(4)计算代价聚合值:
如图3所示,对于图像中的每个像素点P,图像其余像素点对该点的聚合路径为沿 着水平方向向像素点P汇合,当到达像素点p所在的垂直方向时,沿着垂直方向向p聚合。用 如下公式计算点p初次聚合之后在深度d处的匹配代价Cp(dp):
Figure BDA0001346736890000043
Figure BDA0001346736890000044
Figure BDA0001346736890000045
其中,Ti,j(I)为已获得的水平权值树和垂直权值树中像素点i,j之间的权值,q为图像内所有像素点,Lp,q为像素点q到目标像素点p的聚合路径,Wp,q(I)为沿着聚合路径权值乘积,亦是像素q对p的权值,mp(dp)为未进行代价聚合前在视差d下的匹配代价,v(p)为图像内所有像素点,D为像素视差搜索范围,s(dp,dq)为平滑惩戒因子,实验验证选取Psmooth=2、dstep=1。
(5)计算初始视差图:
在对匹配代价进行聚合之后,采用胜者为王算法,获取初始视差图。过程如下:匹配代价聚合后,获得每个像素点在不同视差值假设下的匹配代价,利用胜者为王算法选出这些匹配代价当中的最小值,而这个最小值所对应的视差值就是该点的视差值。因此,可求得图像中每个像素点的视差值。
(6)更新水平权值树和垂直权值树:
利用初始视差图更新水平权值树和垂直权值树,更新方法为:对于水平树和垂直树中任两个相邻像素s、r,令D(s)和D(r)分别表示两个像素点的初始视差值,更新后的权重
Figure BDA0001346736890000046
Figure BDA0001346736890000047
Tupdate=exp(-w′s,r)
其中,R,G,B为三彩色通道,ws,r为像素s、r之间的颜色距离,w′s,r为深度信息与颜色信息相结合对像素距离更新,μ∈[0,1];优选μ=0.5,β为视差因子,取值为255*0.08,σ为平滑因子,取值为255*0.08,当s、r为水平方向相邻时,遍历图像所有像素点更新水平权值树,当s、r为垂直方向相邻时,遍历图像所有像素点更新垂直权值树。
(7)重新计算代价聚合值:
在新的水平权值树和垂直权值树的基础上,依据步骤(4)的方法进行新的匹配代价聚合。
(8)计算视差图:
在获得新的匹配代价聚合的基础上,利用步骤(5)的方法计算获得视差图。
(9)视差优化:
根据前述的方法,我们可分别求得左视图和右视图的视差图。获得左右视差图后,通过左右一致性检测将像素点分为可靠像素点和不可靠像素点,对像素点代价量根据下式做更新,获得新的代价量。
Figure BDA0001346736890000051
其中dp为像素点p的视差值,β∈[0,1],优选β=0.1。再次使用步骤(6)获得的水平权值树和垂直权值树以及步骤(4)的方法对新的代价量进行聚合,然后采用胜者为王算法获得最终的视差图。
为了验证算法的有效性,选用Middlebury测试平台提供的图像进行测试。如图4所示,其中(a)为Teddy,baby1,Dolls,Reindeer四组左视图图像,(b)为真实的视差图,(c)为步骤(8)的初始视差图,(d)为步骤(9)得到的最终视差图。从图中可以看出本发明算法在倾斜平面和无纹理区域能得到很好的效果。

Claims (1)

1.一种基于水平树结构的可变权重代价聚合立体匹配算法,其特征在于,包含以下几个步骤:
(1)计算匹配代价:分别选取左、右图像为参考图,利用图像的颜色信息、水平梯度信息计算匹配代价;
(2)计算引导图像:对左右参考图像进行窗口大小为3*3的中值滤波获得引导图像,减小图像噪声对代价聚合阶段中的权值计算的影响;
(3)构建水平权值树与垂直权值树:根据四邻域像素之间的颜色差异构建水平权值树与垂直权值树;
(4)计算代价聚合值:把图像中的每个像素当做一个节点,根据步骤(3)得到的权值和代价量正则化匹配聚合算法对步骤(1)获得的每个像素点的匹配代价值进行代价聚合;
(5)计算初始视差图:利用“胜者为王”算法获得初始视差图D;
(6)更新水平权值树与垂直权值树:根据步骤(5)得到的初始视差图,将像素视差信息与颜色信息相结合重新计算相邻像素之间的权值;包括:对于水平树和垂直树中任两个相邻像素s、r,令D(s)和D(r)分别表示两个像素点的初始视差值,更新后的权重
Figure FDA0004168590020000011
Figure FDA0004168590020000012
Tupdate=exp(-w′s,r)
其中,R,G,B为三彩色通道,ws,r为像素s、r之间的亮度距离,w′s,r为深度信息与彩色信息相结合对像素距离更新,μ∈[0,1];β为视差因子,取值为255*0.08,σ为平滑因子,取值为255*0.08,当s、r为水平方向相邻时,遍历图像所有像素点更新水平权值树,当s、r为垂直方向相邻时,遍历图像所有像素点更新垂直权值树;
(7)重新计算代价聚合值:把图像中的每个像素当做一个节点,根据步骤(6)获得的权值和代价正则化匹配聚合算法对步骤(1)获得的每个像素点的匹配代价值进行代价聚合;
(8)计算视差图:同步骤(5)利用“胜者为王”算法获得视差图D1;
(9)视差优化:首先采用左右一致性检测方法检测步骤(8)获得的视差图D1,将满足左右一致性像素点归类为可靠像素点,不满足的归类为不可靠像素点,对像素点代价量根据下式
Figure FDA0004168590020000021
做更新,获得新的代价量,其中dp为像素点p的视差值,β∈[0,1],根据步骤(8)获得的视差图D1与像素之间的颜色信息依据步骤(6)重新计算相邻像素之间的权值,通过步骤(7)水平树权值传播与代价正则化对新获得的代价量Cnew进行聚合,然后采用胜者为王算法获得最终的视差图。
CN201710559664.5A 2017-07-11 2017-07-11 一种基于水平树结构的可变权重代价聚合立体匹配算法 Active CN107274448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710559664.5A CN107274448B (zh) 2017-07-11 2017-07-11 一种基于水平树结构的可变权重代价聚合立体匹配算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710559664.5A CN107274448B (zh) 2017-07-11 2017-07-11 一种基于水平树结构的可变权重代价聚合立体匹配算法

Publications (2)

Publication Number Publication Date
CN107274448A CN107274448A (zh) 2017-10-20
CN107274448B true CN107274448B (zh) 2023-05-23

Family

ID=60072395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710559664.5A Active CN107274448B (zh) 2017-07-11 2017-07-11 一种基于水平树结构的可变权重代价聚合立体匹配算法

Country Status (1)

Country Link
CN (1) CN107274448B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109887008B (zh) * 2018-08-31 2022-09-13 河海大学常州校区 基于前后向平滑和o(1)复杂度视差立体匹配方法、装置和设备
CN109978934B (zh) * 2019-03-04 2023-01-10 北京大学深圳研究生院 一种基于匹配代价加权的双目视觉立体匹配方法及系统
CN111784753B (zh) * 2020-07-03 2023-12-05 江苏科技大学 自主水下机器人回收对接前景视场三维重建立体匹配方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106340036A (zh) * 2016-08-08 2017-01-18 东南大学 一种基于双目立体视觉的立体匹配方法
CN106355570B (zh) * 2016-10-21 2019-03-19 昆明理工大学 一种结合深度特征的双目立体视觉匹配方法
CN106504276B (zh) * 2016-10-25 2019-02-19 桂林电子科技大学 非局部立体匹配方法

Also Published As

Publication number Publication date
CN107274448A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN108520554B (zh) 一种基于orb-slam2的双目三维稠密建图方法
Sun et al. Stereo matching with reliable disparity propagation
WO2018214505A1 (zh) 立体匹配方法与系统
Shi et al. High-accuracy stereo matching based on adaptive ground control points
Chen et al. Transforming a 3-d lidar point cloud into a 2-d dense depth map through a parameter self-adaptive framework
CN107274448B (zh) 一种基于水平树结构的可变权重代价聚合立体匹配算法
CN109523595A (zh) 一种建筑工程直线棱角间距视觉测量方法
CN113393577B (zh) 一种倾斜摄影地形重建方法
Xu et al. Accurate and efficient stereo matching by log-angle and pyramid-tree
CN109859249B (zh) Rgbd序列中基于自动分层的场景流估计方法
CN106408596A (zh) 基于边缘的局部立体匹配方法
CN109887008B (zh) 基于前后向平滑和o(1)复杂度视差立体匹配方法、装置和设备
CN102740096A (zh) 一种基于时空结合的动态场景立体视频匹配方法
Shivakumar et al. Real time dense depth estimation by fusing stereo with sparse depth measurements
CN113034681B (zh) 空间平面关系约束的三维重建方法及装置
CN117132737B (zh) 一种三维建筑模型构建方法、系统及设备
CN107155100A (zh) 一种基于图像的立体匹配方法及装置
CN107610216B (zh) 基于粒子群优化多视角立体点云生成方法及应用的摄像机
CN111402429B (zh) 一种尺度还原、三维重建方法、系统、存储介质及设备
CN111652901B (zh) 一种基于置信度和特征融合的无纹理三维物体跟踪方法
CN117501313A (zh) 基于深度神经网络的毛发渲染系统
Kim et al. Real-time stereo matching using extended binary weighted aggregation
He et al. Minimum spanning tree based stereo matching using image edge and brightness information
Miyama Fast stereo matching with super-pixels using one-way check and score filter
CN109341530B (zh) 一种双目立体视觉中物点定位方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant