CN104166988B - 一种融入稀疏匹配信息的立体图像同步分割方法 - Google Patents
一种融入稀疏匹配信息的立体图像同步分割方法 Download PDFInfo
- Publication number
- CN104166988B CN104166988B CN201410327865.9A CN201410327865A CN104166988B CN 104166988 B CN104166988 B CN 104166988B CN 201410327865 A CN201410327865 A CN 201410327865A CN 104166988 B CN104166988 B CN 104166988B
- Authority
- CN
- China
- Prior art keywords
- background
- color
- image
- pixel
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims abstract description 37
- 230000002452 interceptive effect Effects 0.000 claims abstract description 13
- 230000000694 effects Effects 0.000 claims abstract description 12
- 238000013179 statistical model Methods 0.000 claims abstract description 4
- 230000003993 interaction Effects 0.000 claims description 7
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 239000003086 colorant Substances 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 230000001960 triggered effect Effects 0.000 claims description 4
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 2
- 238000004138 cluster model Methods 0.000 claims 1
- 238000007796 conventional method Methods 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 238000012733 comparative method Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种融入稀疏匹配信息的立体图像同步分割方法。首先输入一组立体图像,通过提取特征点并匹配的方法得到立体图像之间的稀疏匹配对应点。然后,在其中一图中通过笔刷勾画的方式,指定部分前、背景。根据指定部分分别建立前、背景的颜色分布的先验统计模型。以此为基础,在图割理论框架下形式化对应关系约束以及颜色、梯度等约束,构造能量函数。最后,采用图的最大流/最小割算法求解最优化结果。若用户没有得到理想的效果,还可以继续对图中错误区域进行勾画,直到得到理想结果。与现有方法相比,在同样的交互量的前提下,本发明的分割效果更好。
Description
技术领域
本发明属于计算机视觉、计算机图形学和图像处理等交叉领域,涉及一种融入稀疏匹配信息的立体图像同步分割方法。
背景技术
近年来,3D摄影、电视、电影以及监控技术得到快速发展,大量立体图像数据随之涌现出来。针对立体图像的相关处理的研究也因此变得火热。交互式立体图像分割是立体图像处理中一个非常重要的子课题。立体图像交互式分割即通过简单的用户交互,实现立体图像中感兴趣目标物的智能选择。现有专门针对立体图像进行分割的方法,多通过计算视差图或匹配关键点的方法得到立体图像间的对应关系。然后,将对应关系约束,连同图像内的颜色、梯度等线索,共同实现立体图像的同步分割。基于视差图的方法,例如Price等人在2011年的ICCV上发表的“StereoCut:Consistent Interactive Obiect Selection inStereo Image Pairs”中,利用视差图决定的立体图像间的稠密对应信息,计算复杂度高。另外,现有计算视差图的算法得到的视差图存在误差,StereoCut方法并没有对视差图误差做出判断和纠正,降低了分割过程的智能化程度。基于关键点匹配的方法采用关键点确定的立体图像间的稀疏对应,计算效率高于前者。然而,现有基于关键点匹配的立体图像分割同步分割方法对匹配信息的利用率较低,导致智能化程度较低。
发明内容
鉴于现有技术中存在的匹配信息利用率低的问题,本发明力图将稀疏匹配对应关系和传统约束项定义在一个统一的理论框架中,充分利用对应关系,提高分割过程的智能化。
为实现这个目标,本发明采取如下技术方案:首先输入一组立体图像之,通过提取特征点并匹配的方法得到立体图像之间的稀疏匹配对应点。然后,在其中一图中通过例如笔刷勾画的方式,交互式指定部分前、背景。根据指定部分分别建立前、背景的颜色分布的先验统计模型。以此为基础,在图割理论框架下形式化对应关系约束以及颜色、梯度等约束,构造能量函数。最后,采用图的最大流/最小割算法求解最优化结果。若用户没有得到理想的效果,还可以继续在图中添加前、背景线索,直到得到理想结果。本发明同时提供一种简单的交互方式,保障在关键点对应错误或缺失时,能够轻松修改分割结果。
与现有技术相比,本发明具有以下优点:将立体图像之间的关键点对应信息形式化为能量函数项,连同传统的颜色、梯度约束,在图割理论框架下实现立体图像同步分割。相比现 有方法,在同样的交互量的前提下,分割效果更好。
附图说明
图1为本发明所涉及方法的流程图;
图2为应用本发明与现有方法进行图像分割的效果比较:(a)、(b)为输入的左、右图像;(c)、(d)是采用Price等人在2011年的ICCV上发表的“StereoCut:ConsistentInteractive Object Selection in Stereo Image Pairs”中的方法计算的结果;图2(e)、(f)为本发明的分割结果,围绕目标物的闭合线为分割目标物的轮廓;两种方法所用的用户输入在(c)、(e)图中显示,目标物内部的实线(在分割后的轮廓内部)指示前景,目标物外部的虚线(在分割后的轮廓外部)指示背景;
图3为应用本发明的添加对应点的交互方法改善分割结果:(a)为添加对应点前的左右图的分割结果,(b)是添加对应点效果和添加对应点后的左右图的分割结果,暗色半透明区域标记背景,虚线用于初始标记背景、目标物内部的实线用于初始标记前景,(b)中的白色小方块和白色圆点是添加的对应点。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。
本发明的流程如图1所示,具体包括如下步骤:
步骤一,提取并匹配立体图像关键点。
读入图像后,对左右视图中的关键特征点进行提取和匹配。可以选用的关键特征点的描述算子包括SIFT(Scale Invariant Feature Transform)、SURF(Speeded UpRobust Features)、ORB(ORiented Brief)等。本发明建议采用SIFT特征描述子。
步骤二,添加前、背景线索。
通过所设计的界面指定部分前、背景像素。本发明的图例中(见图2(e)),采用Price等人在2011年的ICCV上发表的“StereoCut:Consistent Interactive ObiectSelection in Stereo Image Pairs”中提到的方式,通过鼠标、触摸屏或者手写笔等输入设备,通过在图像上勾画不同颜色的线条指定部分前、背景像素。如图2(e)所示,目标物内部的实线覆盖的像素属于前景,目标物外部的虚线覆盖的像素属于背景。但本发明的后续步骤对于该步骤中所用的前、背景像素的指定方式并无限制,其它方式亦可使用。
步骤三,定义前、背景颜色先验模型。
用F表示用户指示的前景像素集合,用B表示用户指示的背景像素集合。前、背景的颜色模型可采用GMM(高斯混合模型)、直方图、颜色类簇等模型,通过F与B中的像素颜色值的集合拟合或统计得到。本发明建议采用K-means聚类方法,在后续的说明过程中,均以 此方法计算得到的颜色模型为基础。采用K-means聚类方法对F与B中的像素的颜色值分别进行聚类,得到Nc个前景颜色类簇Mc个背景颜色类簇分别表示前、背景的颜色分布统计模型。本发明建议Nc=Mc=64。
步骤四,定义能量函数。
立体图像I={Il,Ir}可以表示成一个无向图G=<v,ε>。其中,v为图G中的节点集合,ε为边的集合。图G中的每个顶点,对应立体图像I中的一个像素。图像中除集合F和集合B中的像素外,其余像素设定属于集合U。交互式立体图像同步分割是在输入的线索的约束下,为U中的每个像素pi赋予一个标签xi。xi∈{1,0},分别表示前、背景。图G中的边包含图像内相邻像素的连接边,以及稀疏关键点匹配决定的立体图像对应点之间的连接边。
求解上述二元标记问题,可视为求解使得以下能量函数最小化的标记集合:
其中,fD(pi,xi)为数据项,又称一元项,表示当前像素pi到前景和背景已知颜色模型的相似性,相似性越高,数值越大。fB(pi,pj)与分别是图像内二元项和图像间二元项。fB(pi,pj)反映出像素与其相邻像素(Neighbor Pixel)之间的颜色差异,也称为梯度项。其中,NB表示的集合包含左右图中所有像素点的邻接关系,相邻元素差异越大,则该二元项的值越小,在计算最大流时,连接这两个相邻像素的边越倾向于被割开。为立体图像间的对应关系,也称为对应项。NC表示所有特征匹配对。λD,λB,λC是调节各能量项之间的权值。
(1)定义颜色约束项
数据项主要采用像素颜色与前、背景之间的颜色模型的距离来描述该像素与前、背景的相似性:
fD(pi,xi)=1-Pc(xi|ci) (2)
其中,Pc(xi|ci)表示给定pi的颜色ci,该像素被标记为前、背景的概率。ci与xi对应模型的距离越小,即相似度越高,则概率值越高,pi取xi标签的可能性越大。那么,对应的能量函数项fD(pi,xi)应当越小,因此有fD(pi,xi)=1-PC(xi|ci)。本发明给出用类簇表达前、背景颜色模型的前提下,Pc(xi|ci)的表达:
其中,
(2)定义图像内梯度约束项
梯度约束项的作用是:两相邻元素颜色越靠近,其梯度约束项的值越大,越不倾向于被分割。本发明对梯度约束项的定义建议如下:
该项也可以采用其他形式,如Price等人在2011年的ICCV上发表的“StereoCut:Consistent Interactive Object Selection in Stereo Image Pairs”中用到的指数形式。
(3)定义图像间对应约束项
对应项的使用,是为了保持立体图像匹配对应像素标签(Label)的一致性。本发明设定对于任意,有:
即对于一对匹配对应像素,设定二者之间的边的权值为无穷大(在实际编程中,设定为一个很大的值)。避免在通过最优化求解最大流时,割断这两个像素之间的边,造成对应像素标签的不一致。
步骤五,求解能量函数最小值。
本发明采用图割算法,例如Yuri Boykov等人于2004年在《IEEE Transaction onPAMI》上发表的论文“An Experimental Comparison of Min-Cut/Max-Flow Algorithmsfor Energy Minimization in Vision”中所提出的最大流/最小割算法,通过最优化本发明所定义的能量函数(式(1)),得到最优的标记结果,即分割结果。用户如对分割结果不满意,可返回步骤二,继续添加前、背景线索。每添加一次,将触发一次分割过程。
步骤六,添加对应点优化分割结果。
基于关键点匹配得到的某些左右图对应关系并不正确。为了克服上述问题,本发明提供了一个新的交互方法解决这个问题:基于当前分割结果,用户交互式对一张图像中分割正确,但在另外一张图像中分割错误的地方添加一对对应点,图3(b)给出了交互方法的演示说明。该交互与指定前、背景线索的交互,在本发明的软件中可同时供选择使用。
进行手动匹配并不需要严格遵循极线几何的对应关系,只需要满足对应点同属于前景或者同属于背景区域即可。每添加一个对应点,会触发一次能量函数更新(即图结构的更新)和图割算法求解。给定一组新的匹配对应点,用表示用,令:
该约束保证新的对应点标签一致。将该约束融合进能量函数(式(1))并采用图割算法重新求解,得到更新过的分割结果。
下面给出本发明的一个应用实例。
为了验证本发明所述方法的有效性,与Price等人在2011年的ICCV上发表的“StereoCut:Consistent Interactive Obiect Selection in Stereo Image Pairs”中的方法进行对比。图2给出了效果对比。(a)、(b)为输入的左、右图像。(c)、(d)是采用StereoCut方法计算的结果;(e)、(f)为本发明的分割结果;两种方法所用的用户输入在(c)、(e)图中显示,目标物内部的实线(在分割后的轮廓内部)指示前景,目标物外部的虚线(在分割后的轮廓外部)指示背景。从图中可看出,在相同交互量的前提下,本发明的方法能够得到更好的分割结果。而对比方法得到的结果较差。对比方法为了得到更好的结果,需要交互式添加更多的前、背景线索。因此,可以说本发明方法较对比方法智能化程度更高。另外,本发明还可以通过简单的添加对应点的方式实现分割结果纠正。如图3(b)图中连接左右图中的线的两端是新加入的特征点对。图3(a)显示了没有添加这对对应点时的分割效果。(b)图显示了添加了对应点后的效果。暗色半透明区域标记分割后的背景,虚线用于初始标记背景、目标物内部的实线用于初始标记前景。可以看出,在添加对应点后分割效果得到了提升。值得一提的是,相比StereoCut,本发明方法所构建的图结构复杂度大幅降低,导致图结构的构建和分割求解过程,所耗时间远少于StereoCut方法。
Claims (1)
1.一种融入稀疏匹配信息的立体图像同步分割方法,其特征在于包括以下步骤:
步骤一,读入图像,对左右视图中的关键特征点进行提取和匹配;
步骤二,添加前、背景线索;
通过所设计的界面指定部分前、背景像素;利用鼠标、触摸屏或者手写笔等输入设备,通过在图像上勾画不同颜色的线条指定部分前、背景像素;
步骤三,定义前、背景颜色先验模型;
用F表示用户指示的前景像素集合,用B表示用户指示的背景像素集合;前、背景的颜色模型可采用高斯混合模型、直方图、颜色类簇模型,通过F与B中的像素颜色值的集合拟合或统计得到;采用K-means聚类方法对F与B中的像素的颜色值分别进行聚类,得到Nc个前景颜色类簇Mc个背景颜色类簇分别表示前、背景的颜色分布统计模型;
步骤四,定义能量函数;
立体图像I={Il,Ir}可以表示成一个无向图G=<ν,ε>;其中,ν为图G中的节点集合,ε为边的集合;图G中的每个顶点,对应立体图像I中的一个像素;图像中除集合F和集合B中的像素外,其余像素设定属于集合U;交互式立体图像同步分割是在输入的线索的约束下,为U中的每个像素pi赋予一个标签xi;xi∈{1,0},分别表示前、背景;图G中的边包含图像内相邻像素的连接边,以及稀疏关键点匹配决定的立体图像对应点之间的连接边;
求解上述二元标记问题,可视为求解使得以下能量函数最小化的标记集合:
其中,fD(pi,xi)为数据项,又称一元项,表示当前像素pi到前景和背景已知颜色模型的相似性,相似性越高,数值越大;fB(pi,pj)与分别是图像内二元项和图像间二元项;fB(pi,pj)反映出像素与其相邻像素之间的颜色差异,也称为梯度项;其中,NB表示的集合包含左右图中所有像素点的邻接关系,相邻元素差异越大,则该二元项的值越小,在计算最大流时,连接这两个相邻像素的边越倾向于被割去;为立体图像间的对应关系,也称为对应项;NC表示所有特征匹配对;λD,λB,λC是调节各能量项之间的权值;
(1)定义颜色约束项
数据项主要采用像素颜色与前、背景之间的颜色模型的距离来描述该像素与前、背景的相似性:
fD(pi,xi)=1-Pc(xi|ci) (2)
其中,Pc(xi|ci)表示给定pi的颜色ci,该像素被标记为前、背景的概率;ci与xi对应模型的距离越小,即相似度越高,则概率值越高,pi取xi标签的可能性越大;那么,对应的能量函数项fD(pi,xi)应当越小,因此有fD(pi,xi)=1-Pc(xi|ci);用类簇表达前、背景颜色模型的前提下,Pc(xi|ci)的表达式为:
其中,
(2)定义图像内梯度约束项
梯度约束项的作用是:两相邻元素颜色越靠近,其梯度约束项的值越大,越不倾向于被分割;对梯度约束项的定义如下:
(3)定义图像间对应约束项
使用对应项是为了保持立体图像匹配对应像素标签(Label)的一致性;对于任意设定:
即对于一对匹配对应像素,设定二者之间的边的权值为无穷大,在实际编程中,设定为一个很大的值,避免在通过最优化求解最大流时,割断这两个像素之间的边,造成对应像素标签的不一致;
步骤五,求解能量函数最小值;
采用图割算法,通过最优化本方法所定义的能量函数,即式(1),得到最优的标记结果,即分割结果;如果对分割结果不满意,返回步骤二,继续添加前、背景线索;每添加一次,将触发一次分割过程;
步骤六,添加对应点优化分割结果;
基于当前分割结果,用户交互式对一张图像中分割正确,但在另外一张图像中分割错误的地方添加一对对应点;该交互与指定前、背景线索的交互可同时使用;
进行手动匹配并不需要严格遵循极线几何的对应关系,只需要满足对应点同属于前景或者同属于背景区域即可;每添加一个对应点,会触发一次能量函数更新和图割算法求解;给定一组新的匹配对应点,用表示,令:
该约束保证新的对应点标签一致;将该约束融合进能量函数,即式(1),并采用图割算法重新求解,得到更新过的分割结果;步骤一所述关键特征点的描述算子包括SIFT、SURF和ORB;步骤三所述的Nc和Mc均取64;所述公式(4)也可以采用指数形式的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410327865.9A CN104166988B (zh) | 2014-07-10 | 2014-07-10 | 一种融入稀疏匹配信息的立体图像同步分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410327865.9A CN104166988B (zh) | 2014-07-10 | 2014-07-10 | 一种融入稀疏匹配信息的立体图像同步分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104166988A CN104166988A (zh) | 2014-11-26 |
CN104166988B true CN104166988B (zh) | 2017-06-06 |
Family
ID=51910779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410327865.9A Active CN104166988B (zh) | 2014-07-10 | 2014-07-10 | 一种融入稀疏匹配信息的立体图像同步分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104166988B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046689B (zh) * | 2015-06-24 | 2017-12-15 | 北京工业大学 | 一种基于多层次图结构的交互式立体图像快速分割方法 |
CN105719316B (zh) * | 2015-09-29 | 2018-08-03 | 温州大学 | 一种基于交互式的立体图像分割方法 |
CN106056606A (zh) * | 2016-05-30 | 2016-10-26 | 乐视控股(北京)有限公司 | 图像处理方法及装置 |
CN108073871A (zh) * | 2016-11-18 | 2018-05-25 | 北京体基科技有限公司 | 基于两种预定区域识别手部区域的方法及装置 |
CN108961265B (zh) * | 2018-05-30 | 2022-02-18 | 南京汇川图像视觉技术有限公司 | 一种基于颜色显著性和高斯模型的精确目标分割方法 |
CN110378359B (zh) * | 2018-07-06 | 2021-11-05 | 北京京东尚科信息技术有限公司 | 一种图像识别方法和装置 |
CN109658425B (zh) * | 2018-12-12 | 2021-12-28 | 上海联影医疗科技股份有限公司 | 一种肺叶分割方法、装置、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065321A (zh) * | 2013-01-09 | 2013-04-24 | 上海电力学院 | 一种图像特征点匹配模块的面向对象系统框架建立方法 |
CN103714549A (zh) * | 2013-12-30 | 2014-04-09 | 南京大学 | 基于快速局部匹配的立体图像对象分割方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720282B2 (en) * | 2005-08-02 | 2010-05-18 | Microsoft Corporation | Stereo image segmentation |
US7822289B2 (en) * | 2006-07-25 | 2010-10-26 | Microsoft Corporation | Locally adapted hierarchical basis preconditioning |
-
2014
- 2014-07-10 CN CN201410327865.9A patent/CN104166988B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103065321A (zh) * | 2013-01-09 | 2013-04-24 | 上海电力学院 | 一种图像特征点匹配模块的面向对象系统框架建立方法 |
CN103714549A (zh) * | 2013-12-30 | 2014-04-09 | 南京大学 | 基于快速局部匹配的立体图像对象分割方法 |
Non-Patent Citations (2)
Title |
---|
Image Segmentation with Automatically Balanced Constraints;Wei Ma et al.;《 2013 Second IAPR Asian Conference on Pattern Recognition》;20131108;第557页第1栏第3段第10-15行、第2栏第4段,第558页第1栏第1-2行、第20-32行、第2栏第1-5行、第21-28行 * |
StereoCut: Consistent Interactive Object Selection in Stereo Image Pairs;Brian L. Price et al.;《2011 IEEE International Conference on Computer Vision》;20111113;第1149页第2栏第3段-第1150页第2栏第1段,第1152页第1栏第2-3段,图1 * |
Also Published As
Publication number | Publication date |
---|---|
CN104166988A (zh) | 2014-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104166988B (zh) | 一种融入稀疏匹配信息的立体图像同步分割方法 | |
Wei et al. | Toward automatic building footprint delineation from aerial images using CNN and regularization | |
Huang et al. | Single-view reconstruction via joint analysis of image and shape collections. | |
Liu et al. | Local similarity pattern and cost self-reassembling for deep stereo matching networks | |
CN103886619B (zh) | 一种融合多尺度超像素的目标跟踪方法 | |
CN109448015A (zh) | 基于显著图融合的图像协同分割方法 | |
CN104134234A (zh) | 一种全自动的基于单幅图像的三维场景构建方法 | |
CN105046689B (zh) | 一种基于多层次图结构的交互式立体图像快速分割方法 | |
CN108388882A (zh) | 基于全局-局部rgb-d多模态的手势识别方法 | |
CN102682477A (zh) | 一种基于结构先验的规则场景三维信息提取方法 | |
Fácil et al. | Single-view and multi-view depth fusion | |
CN101951511B (zh) | 一种通过分析深度进行视频场景分层的方法 | |
CN103473551A (zh) | 基于sift算子的台标识别方法及系统 | |
CN104091336B (zh) | 一种基于稠密视差图的立体图像同步分割方法 | |
Haines et al. | Recognising planes in a single image | |
Xu et al. | Weakly supervised deep semantic segmentation using CNN and ELM with semantic candidate regions | |
CN104504734A (zh) | 一种基于语义的图像颜色传输方法 | |
CN102982524B (zh) | 玉米果穗有序图像的拼接方法 | |
CN103578107B (zh) | 一种交互式图像分割方法 | |
CN103093470A (zh) | 一种具有尺度无关特性的快速多模态图像协同分割方法 | |
CN103198479A (zh) | 基于语义信息分类的sar图像分割方法 | |
CN104063701B (zh) | 基于surf词汇树和模板匹配的快速电视台台标识别系统及其实现方法 | |
CN109215047B (zh) | 基于深海视频的运动目标检测方法和装置 | |
CN101765019A (zh) | 一种用于运动模糊和光照变化图像的立体匹配方法 | |
Wang et al. | Image-based building regularization using structural linear features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |