CN102270338B - 基于改进图表示的重复物体有效分割方法 - Google Patents
基于改进图表示的重复物体有效分割方法 Download PDFInfo
- Publication number
- CN102270338B CN102270338B CN 201110173510 CN201110173510A CN102270338B CN 102270338 B CN102270338 B CN 102270338B CN 201110173510 CN201110173510 CN 201110173510 CN 201110173510 A CN201110173510 A CN 201110173510A CN 102270338 B CN102270338 B CN 102270338B
- Authority
- CN
- China
- Prior art keywords
- pixel
- penalty term
- level
- background
- smooth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提出了一种基于改进图表示的重复物体有效分割方法。该方法首先对输入图像采用均值偏移算法进行过分割,在此基础上,用改进的图表示方法对过分割得到的分块,以及相邻、相似分块之间的关系进行表示,并采用最大流优化算法进行图割运算,实现对多个重复物体高效、准确的分割。
Description
技术领域
本发明属于计算机图像处理方法,具体涉及一种基于改进图表示的重复物体分割方法。
背景技术
图像分割指的是将输入图像中的前景图像从其背景中分离出来。由于图像分割是图像处理领域的基础工作,并且在诸如模式识别、机器学习等领域有着极其重要的作用,因此很多人对此进行了深入而广泛的研究,提出了很多很优秀的分割算法。尽管如此,从任意输入图像中将有意义的前景图像完全自动且准确地分割出来仍然是非常困难的。交互技术是目前解决这一问题的有效途径。但是,无论是自动分割,还是引入交互技术,当前存在的图像分割算法多数是针对一个前景物体进行分割,而对具有多个重复物体的输入图像进行前景图像分割的研究还不是很多。
重复性在人们的生活中到处存在,比如一群鸭子、一排楼房等,所以包含重复物体的图像也很多。另一方面,人类视觉系统的一个重要功能就是对所看到的物体进行相似性和差异性的比较,从而达到识别物体的目的,以便理解周围的世界(D.W.Thompson,On Growth and Form.Dover,1992)。然而,经典的图像分割算法不适宜交互式地分割重复物体,因为在分割过程中可能需要非常多的交互,即便如此,分割结果也可能很不理想。
LazySnapping(Y.Li,J.Sun,C.-K.Tang,and H.-Y.Shum,“Lazy snapping,”ACM Transactions on Graphics,vol.23,no.3,pp.303-308,2004)算法将图割优化算法和过分割结合起来,使得算法可以根据用户的交互实时地得到分割结果。Grabcut(C.Rother,V.Kolmogorov,and A.Blake,““grabcut”:interactiveforeground extraction using iterated graph cuts,”ACM Transactions on Graphics,vol.23,pp.309-314,2004)反复采用高斯混合模型对前、背景颜色进行训练,然后采用图割优化算法得到分割结果。用户交互在这两种算法中是非常关键且有效的,但是这两种算法都是针对单个物体进行分割,对于多个重复物体的分割效果并不十分理想(如图1(a)(b)所示)。
基于轮廓形状的比较,程明明等提出了一种重复物体检测算法RepFinder(M.M.Cheng,F.L.Zhang,N.J.Mitra,X.Huang,and S.M.Hu,“RepFinder:finding approximately repeated scene elements for image editing,”ACMTransactions on Graphics,vol.29,no.4,pp.83-90,2010)。当重复物体之间的形变较小时,检测效果较好;但是,当重复物体形状变化较大时,该算法无法成功检测到重复物体。
最近几年,图像的一致分割受到越来越多的重视。对图像进行一致分割指的是对两幅或者两幅以上包含相同或者相似前景物体的图像同时进行分割,从背景图像中提取出其前景物体。考虑到多幅图像中所共有的物体应该具有相同或者相近的颜色分布,可以通过直方图匹配并结合图表示对多幅图像进行一致分割。颜色直方图匹配可以采用L1范数(C.Rother,T.Minka,A.Blake,and V.Kolmogorov,“Cosegmentation of image pairs by histogrammatching-incorporating a global constraint into mrfs,”in Computer Vision andPattern Recognition,2006,pp.993-1000.)或者L2范数(L.Mukherjee,V.Singh,and C.R.Dyer,“Half-integrality based algorithms for cosegmentation ofimages,”in Computer Vision and Pattern Recognition,2009),但是这两种算法在最优化过程中会带来很大的计算量。相比于对颜色直方图的错误匹配进行惩罚,匹配代价也可以通过对颜色直方图的正确匹配进行奖励得到。该方法可以将计算复杂度降低为多项式时间(D.S.Hochbaum and V.Singh,“Anefficient algorithm for cosegmentation,”in Computer Vision and PatternRecognition,2009)。
发明内容
本发明的目的是提供一种基于改进图表示的重复物体有效分割方法,该方法通过对传统的图表示进行改进,对单幅图像中的多个重复物体进行分割的有效算法,只需要用户提供非常少的交互,即可将图像中的大量重复物体准确地分割出来(如图1(c)所示),使得其能够对重复物体进行高效、准确的分割。
为达到上述目的,本发明采用的技术方案是:
对于输入图像I,为输入的图像I中的每一个像素p∈I指定一个标签fp∈{0,1},得到前景像素集合F={p:fp=0},背景像素集合B={p:fp=1},为了求得标签集合{fp},构造了一个新的能量函数,该能量函数是在传统的马尔科夫随机场(MRF,Markov Random Field)模型的能量函数
的基础上增加了重复物体像素间的平滑惩罚项得到的,其形式如下:
首先,用户通过白色和黑色比划分别确定种子前景区域F和种子背景区域B,用作分割时的先验信息,根据用户提供的先验信息,确定式2中的数据惩罚项Dp如下:
其中C(p)表示像素p在RGB颜色空间中的坐标;
基于4邻域的平滑惩罚项Vp,q定义如下:
Vp,q=λ·exp(-β·||C(p)-C(q)||2),<p,q>∈E
其中λ常量用来平衡数据惩罚项和平滑惩罚项之间的权重,β常量用来控制在分割过程中对梯度变化的容忍程度;
根据像素点对在RGB颜色空间中的距离,确定相似点对集合H:如果像素i和像素j在RGB颜色空间中的距离小于一个给定的阈值ε,则<i,j>∈H,与此对应的式2中的第三项定义为:
Ui,j=μ·exp(-β·||C(p)-C(q)||2),<i,j>∈H
其中μ为常量;
根据上述对数据惩罚项Dp、基于空间位置关系的平滑惩罚项Vp,q和基于RGB颜色相似性的平滑惩罚项Ui,j的定义,通过最大流优化算法对式2进行快速求解,从而实现对多个重复物体的同时分割。
本发明在图的构造方面,对传统的图表示方法进行了改进,使其适宜对大量重复物体进行分割。为了提高运行速度,对输入图像采用均值偏移算法进行过分割,以分割得到的分块为基础进行图的构造,而不是在像素的基础上进行,在保证性能的基础上大大提高了算法的速度。
附图说明
图1(a)是LazySnapping、图1(b)是Grabcut和本发明图1(c)的分割结果,其中白色交互表示种子前景区域,黑色交互表示种子背景区域,Grabcut中的灰色方框表示初始化矩形框;
图2是传统MRF模型图的构建示意图和本发明算法中图的构建示意图,其中图(a)为输入图像,图(b)为传统MRF模型图的构建示意图,图(c)为输入图像各像素在RGB空间中的分布示意图,图(d)为本发明算法图的构建示意图;
图3是在相同的用户交互情况下,传统MRF模型的分割结果(c)和本发明算法的分割结果(d),其中图(a)表示传统的MRF模型算法和本发明算法的交互比划,黑色比划表示背景,白色比划表示前景,图(b)表示对于图像中的每一个像素p,根据其与种子前景区域F和种子背景区域B的相似性来判断其归属情况,图(c)表示传统MRF模型的分割结果,图(d)表示本发明算法的分割结果;
图4是采用均值偏移算法进行过分割之后图的构建示意图,图(a)为采用均值偏移算法对输入图像进行分割的结果,图(b)表示根据分割结果构建图的示意图;
图5是几种分割算法的分割结果比较,从左到右依次为:原图,本发明算法的分割结果,LazySnapping的分割结果,Grabcut的分割结果,RepFinder的分割结果。前三种分割结果中的白色交互表示种子前景区域,黑色交互表示种子背景区域,Grabcut中的灰色方框表示初始化矩形框,RepFinder中的黑色轮廓表示模板物体外轮廓。
具体实施方式
下面将根据附图对本发明进行详细说明。
本发明主要包括两部分:
1)图的改进
本发明对传统的图表示算法进行了重要改进,使其适用于对多个重复物体进行分割,详述如下。
对于输入图像I,图像分割的目的是为每一个像素p∈I指定一个标签fp∈{0,1},得到前景像素集合F={p:fp=0},背景像素集合B={p:fp=1}。标签集合{fp}通常是通过最优化一个能量函数得到。
与传统的图像二值分割一样(Y.Boykov and M.Jolly,“Interactive graphcuts for optimal boundary®ion segmentation of objects in n-d images,”inInternational Conference on Computer Vision,2001),本发明亦将图像的二值分割看作一个马尔科夫随机场(MRF,Markov Random Field)问题。首先,将输入图像用一个图G=(P,N)来表示,其中P表示图中的结点集合,每一个结点pi∈P对应于输入图像中的一个像素,N表示图中结点之间的边,每一条边对应于两个相邻的结点<pj,qk>。应用于图像分割的MRF模型便有如下的能量函数:
[式1]
其中,p<q表示图中相邻结点之间的单向组合,这里的“相邻”可以是四邻域相邻或者八邻域相邻;Dp(fp)表示将结点p的标签设为fp时带来的数据项惩罚,即按照先验知识,该结点为前景,系统将其判为背景带来的惩罚,或者按照先验知识,该结点为背景,系统将其判为前景带来的惩罚;Vp,q(fp,fq)表示两相邻结点<p,q>分别被判为前、背景时带来的平滑项惩罚。各结点的标签{fp}通过最小化上述能量函数得到。
一般情况下,上述能量函数的全局最优解是很难求得的,但是可以通过图割优化算法快速得到上述问题的局部最优解(V.Kolmogorov and R.Zabih,“What energy functions can be minimized via graph cuts,”IEEE Transactions onPattern Analysis and Machine Intelligence,vol.26,no.2,pp.147-159,2004),该方法已经在图像分割领域得到了广泛的应用。在用图割优化算法求解图像分割问题时,通常需要加入两个终止结点s和t,以及这两个终止结点与原图每一个结点之间的连接边,形成s-t图G=(P∪{s,t},E),图中边的权值用数据惩罚项Dp和平滑惩罚项Vp,q来表示(如图2(b)所示),然后应用最大流算法即可得到图像分割边界。
本发明试图通过图割优化算法对输入图像中的重复物体进行同时分割。然而,之前的MRF模型完全不能满足这一需求,原因是平滑惩罚项Vp,q仅仅反映了相邻像素间的局部相似性,而没有考虑非相邻的重复区域之间的相似性,这一点决定了之前的MRF模型不适用于对多个重复物体进行同时分割。
对于包含多个重复物体的图像来说,重复区域之间虽然在空间位置上相距较远,但是在颜色、纹理或者形状空间,这些区域可能相距很近,如图2(a)所示,2号和3号位置在空间位置上相距较远,2号和1号位置在空间位置上相距较近,但是在颜色空间里(如图2(c)所示),2号和3号相距较近,2号和1号相距较远。
受图像一致分割的启发,本发明对传统的MRF模型的能量函数(式1)进行了重要改进,增加了重复物体像素间的平滑惩罚项,得到如下的能量函数:
[式2]
其中Dp和Vp,q的定义同式1,Ui,j为重复区域像素之间的平滑惩罚项,H为相似像素点对集合。
下面将详细论述图的构建和改造细节。
首先,用户通过白色和黑色比划分别确定种子前景区域F和种子背景区域B(如图3(a)所示),用作分割时的先验信息。根据用户提供的先验信息,确定式2中的数据惩罚项Dp如下:
其中C(p)表示像素p在RGB颜色空间中的坐标。
基于4邻域的平滑惩罚项Vp,q定义如下:
Vp,q=λ·exp(-β·||C(p)-C(q)||2),<p,q>∈E
其中λ常量用来平衡数据惩罚项和平滑惩罚项之间的权重,β常量用来控制在分割过程中对梯度变化的容忍程度。
有了上面的设置,该算法即可对单独物体进行分割(如图3(c)所示)。为了使算法适用于多个重复物体的同时分割,本发明根据像素点对在RGB颜色空间中的距离,确定相似点对集合H:如果像素i和像素j在RGB颜色空间中的距离小于一个给定的阈值ε,则<i,j>∈H,与此对应的式2中的第三项定义为:
Ui,j=μ·exp(-β·||C(p)-C(q)||2),<i,j>∈H
其中μ为常量。
根据上述对数据惩罚项Dp、基于空间位置关系的平滑惩罚项Vp,q和基于RGB颜色相似性的平滑惩罚项Ui,j的定义,可以通过最大流优化算法对式2进行快速求解,从而实现对多个重复物体的同时分割(如图3(d)所示)。
2)输入图像的过分割
由于基于像素所构建的图通常包含大量的结点和边,尽管使用了最大流优化算法,计算复杂度仍然较高。为了进一步降低计算量,本发明首先借鉴LazySnapping的方法,对输入图像采用均值偏移算法进行过分割,所得分块数目相对于原像素数目大为减少,同时分割所得分块很好地保留了物体的局部结构。在技术方案1)中的图是基于像素以及相邻、相似像素构建的,在这里,则是通过分块、相邻、相似分块进行构建,其中分块之间的相似性指的是分块区域颜色平均值在RGB空间中的坐标距离。所得图在复杂性上远远小于基于像素所构建的图,如图4所示,图结点由原来的196,608(512×384,图像尺寸)降为1,612,边的数目从11,251,740降为19,210。这就大大提升了本发明算法的运算速度,对于用户的交互,可以实时得到分割结果,提高了本算法的用户体验。
以上详细介绍了基于改进图表示的重复物体有效分割方法,图5展示了一些本发明分割方法与其它一些经典算法的分割结果比较。
如上所述,本发明提出了一种基于改进图表示的重复物体有效分割方法,通过对传统图表示进行改进,使其适用于对多个重复物体进行高效、准确分割。
尽管已经参考附图对本发明进行了详细解释和描述,专业技术人员应该理解,在不脱离本发明精神和范围的情况下,可以在其中对其进行各种其它改变、增删。
Claims (1)
1.一种基于改进图表示的重复物体有效分割方法,其特征在于:对于输入图像I,为输入的图像I中的每一个像素p∈I指定一个标签fp∈{0,1},得到前景像素集合F={p:fp=0},背景像素集合B={p:fp=1},为了求得标签集合{fp},构造了一个新的能量函数,该能量函数是在传统的马尔科夫随机场(MRF,Markov Random Field)模型的能量函数
的基础上增加了重复物体像素间的平滑惩罚项得到的,其形式如下:
其中,P表示当输入图像I用一个图G=(P,N)来表示时图中的结点集合,N代表图中结点之间的边;q代表图像I中的q像素,fp为p像素的标签;fi代表相似像素点对集合H中的i像素的标签,fj代表相似像素点对集合H中的j像素标签,p<q表示图中相邻像素之间的单向组合,这里的“相邻”是四邻域相邻或者八邻域相邻;Dp(fp)表示将像素p的标签设为fp时带来的数据惩罚项,即按照先验知识,该像素为前景,系统将其判为背景带来的惩罚,或者按照先验知识,该像素为背景,系统将其判为前景带来的惩罚;Vp,q(fp,fq)表示两相邻像素<p,q>分别被判为前、背景时带来的平滑惩罚项,Ui,j为重复区域像素之间的平滑惩罚项,H为相似像素点对集合,各结点的标签集合{fp}通过最小化上述能量函数式(2)得到;
首先,用户通过白色和黑色笔画分别确定种子前景区域F和种子背景区域B,用作分割时的先验信息,根据用户提供的先验信息,确定式(2)中的数据惩罚项Dp如下:
其中C(p)表示像素p在RGB颜色空间中的坐标;
基于4邻域的平滑惩罚项Vp,q定义如下:
其中λ常量用来平衡数据惩罚项和平滑惩罚项之间的权重,该平滑惩罚项表示两相邻像素<p,q>分别被判为前、背景时带来的平滑惩罚项Vpq(fp,fq),β常量用来控制在分割过程中对梯度变化的容忍程度,C(p)表示像素p在RGB颜色空间中的坐标,E表示相邻节点间的边,C(q)表示像素q在RGB颜色空间中的坐标;
根据像素点对在RGB颜色空间中的距离,确定相似点对集合H:如果像素i和像素j在RGB颜色空间中的距离小于一个给定的阈值ε,则<i,j>∈H,与此对应的式(2)中的第三项定义为:
Ui,j=μ·exp(-β·||C(p)-C(q)||2),<i,j>∈H
其中μ为常量;
根据上述对数据惩罚项Dp、基于空间位置关系的平滑惩罚项Vp,q和基于RGB颜色相似性的平滑惩罚项Ui,j的定义,通过最大流优化算法对式(2)进行快速求解,从而实现对多个重复物体的同时分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110173510 CN102270338B (zh) | 2011-06-27 | 2011-06-27 | 基于改进图表示的重复物体有效分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110173510 CN102270338B (zh) | 2011-06-27 | 2011-06-27 | 基于改进图表示的重复物体有效分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102270338A CN102270338A (zh) | 2011-12-07 |
CN102270338B true CN102270338B (zh) | 2013-07-31 |
Family
ID=45052636
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110173510 Expired - Fee Related CN102270338B (zh) | 2011-06-27 | 2011-06-27 | 基于改进图表示的重复物体有效分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102270338B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103198470B (zh) * | 2013-02-26 | 2017-02-15 | 清华大学 | 图像的分割方法及系统 |
CN105025199B (zh) * | 2015-07-27 | 2018-06-15 | 北京邮电大学世纪学院 | 一种纹样基因的标注方法及装置 |
CN109146894A (zh) * | 2018-08-07 | 2019-01-04 | 庄朝尹 | 一种三维建模的模型区域分割方法 |
CN116433701B (zh) * | 2023-06-15 | 2023-10-10 | 武汉中观自动化科技有限公司 | 一种工件孔洞轮廓的提取方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493941A (zh) * | 2009-02-26 | 2009-07-29 | 上海交通大学 | 基于GPU硬件加速的Graph Cuts三维图像分割方法 |
CN101702236A (zh) * | 2009-10-30 | 2010-05-05 | 无锡景象数字技术有限公司 | 一种多目标前景分割方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040008886A1 (en) * | 2002-07-02 | 2004-01-15 | Yuri Boykov | Using graph cuts for editing photographs |
US8379957B2 (en) * | 2006-01-12 | 2013-02-19 | Siemens Corporation | System and method for segmentation of anatomical structures in MRI volumes using graph cuts |
US8280133B2 (en) * | 2008-08-01 | 2012-10-02 | Siemens Aktiengesellschaft | Method and system for brain tumor segmentation in 3D magnetic resonance images |
-
2011
- 2011-06-27 CN CN 201110173510 patent/CN102270338B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493941A (zh) * | 2009-02-26 | 2009-07-29 | 上海交通大学 | 基于GPU硬件加速的Graph Cuts三维图像分割方法 |
CN101702236A (zh) * | 2009-10-30 | 2010-05-05 | 无锡景象数字技术有限公司 | 一种多目标前景分割方法 |
Non-Patent Citations (2)
Title |
---|
刘嘉等.一种基于图割的交互式图像分割方法.《电子与信息学报》.2008,第30卷(第8期),第1973-1976页. * |
张少娟等.图割综述.《北方工业大学学报》.2010,第22卷(第3期),第10-15页. * |
Also Published As
Publication number | Publication date |
---|---|
CN102270338A (zh) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Martinovic et al. | 3d all the way: Semantic segmentation of urban scenes from start to end in 3d | |
CN104537676B (zh) | 一种基于在线学习的渐进式图像分割方法 | |
Kumar et al. | Efficiently selecting regions for scene understanding | |
Grady et al. | Random walks for interactive alpha-matting | |
CN103337072B (zh) | 一种基于纹理与几何属性联合模型的室内对象解析方法 | |
Xiao et al. | Joint affinity propagation for multiple view segmentation | |
Cheng et al. | Exploiting nonlocal spatiotemporal structure for video segmentation | |
CN102663757A (zh) | 基于核传递的半自动图像分割方法 | |
CN101951511B (zh) | 一种通过分析深度进行视频场景分层的方法 | |
CN102651128A (zh) | 一种基于采样的图像集分割方法 | |
CN103413307A (zh) | 一种基于超图的图像共分割方法 | |
Korah et al. | Analysis of building textures for reconstructing partially occluded facades | |
CN102270338B (zh) | 基于改进图表示的重复物体有效分割方法 | |
CN103093470A (zh) | 一种具有尺度无关特性的快速多模态图像协同分割方法 | |
CN102663762B (zh) | 医学图像中对称器官的分割方法 | |
Zhou et al. | An efficient two-stage region merging method for interactive image segmentation | |
Liu et al. | KMOP-vSLAM: Dynamic visual SLAM for RGB-D cameras using K-means and OpenPose | |
CN107204000A (zh) | 基于Kinect深度相机的人体分割方法 | |
Zhao et al. | Per-pixel translational symmetry detection, optimization, and segmentation | |
Lim et al. | Multi-scale conditional random fields for over-segmented irregular 3D point clouds classification | |
CN103793913A (zh) | 一种结合均值漂移的谱聚类图像分割方法 | |
CN107610133B (zh) | 一种多目标服装图像协同分割方法 | |
Stückler et al. | Hierarchical object discovery and dense modelling from motion cues in RGB-D video | |
Liu et al. | Graph cut based mesh segmentation using feature points and geodesic distance | |
Szeliski et al. | Segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130731 Termination date: 20160627 |