CN109272467B - 一种基于多尺度边缘线索的层次化图像分割方法 - Google Patents
一种基于多尺度边缘线索的层次化图像分割方法 Download PDFInfo
- Publication number
- CN109272467B CN109272467B CN201811113242.6A CN201811113242A CN109272467B CN 109272467 B CN109272467 B CN 109272467B CN 201811113242 A CN201811113242 A CN 201811113242A CN 109272467 B CN109272467 B CN 109272467B
- Authority
- CN
- China
- Prior art keywords
- edge
- node
- hierarchical
- segmentation
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003709 image segmentation Methods 0.000 title claims abstract description 18
- 230000011218 segmentation Effects 0.000 claims abstract description 58
- 238000000926 separation method Methods 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims description 19
- 238000005457 optimization Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 6
- 238000005192 partition Methods 0.000 claims description 5
- 238000011524 similarity measure Methods 0.000 claims description 4
- 238000003708 edge detection Methods 0.000 abstract description 8
- 235000019587 texture Nutrition 0.000 description 26
- 238000010586 diagram Methods 0.000 description 14
- 239000010410 layer Substances 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/44—Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度边缘线索的层次化图像分割方法,包括以下步骤:对输入图像进行超像素化,获得图像的过分割区域;对输入图像进行多尺度的内容风格分离,从而提取图像的内容部件,并使用边缘检测方法检测图像内容部件的边缘信息,获取多尺度的边缘概率图;根据多尺度边缘线索度量过分割区域之间的相似度,并进行迭代式区域合并,生成层次合并树;根据层次合并树和先验信息建立能量函数,并采用动态规划方法求解能量函数从而优化层次合并树结构,实现图像的层次化分割。
Description
技术领域
本发明属于图像处理技术领域,尤其涉及一种基于多尺度边缘线索的层次化图像分割方法。
背景技术
图像分割作为计算机视觉领域中十分重要的研究工作,在许多图像处理算法和应用中都有着广泛的应用,例如,目标检测、图像检索和风格迁移等。一般的图像分割问题定义为:“将图像划分为区域内像素具有相似特征的不同区域”。层次化分割则可以看作是由粗到细多层图像分割结果的组合,从而用一种单一的多尺度结构分割图像中所有尺度下的目标,实现对图像多尺度的处理和表示,相比于传统的单层图像分割能够表现出更多的图像信息。层次化分割的结果可以用树形结构进行表示和存储,对层次合并树进行阈值划分可以得到由粗到细不同粒度的图像分割结果。因此图像层次化分割极大提高了图像处理的效率,同时作为目标检测、风格迁移等的预处理模块,对其研究发展有着重大的影响。
目前已有许多研究者针对图像的层次化分割任务展开了研究,例如文献1:Arbelaez P.Boundary extraction in natural images using ultrametric contourmaps[C].Computer Vision and Pattern Recognition Workshop,2006.CVPRW'06.Conference on.IEEE,2006:182-182。他们利用区域轮廓线索度量区域相似性,并采用区域合并进行层次化分割。文献2:Arbelaez P,Maire M,Fowlkes C,et al.Contourdetection and hierarchical image segmentation[J].IEEE transactions on patternanalysis and machine intelligence,2011,33(5):898-916。他们提取并融合亮度、颜色和纹理梯度等局部特征作为融合线索并结合分水岭算法实现层次化分割。这类方法通常采用先过分割再迭代地区域合并来进行图像的层次化,区域间相似性的度量对于分割结果有十分重要的影响,仅采用基本的局部特征作为视觉线索进行度量难以保证整体的图像分割效果,即单层的分割结果难以在语义上保持一致性,同一类别的目标对象,可能在不同层次上被分割出来。
另一方面,文献3:Pont-Tuset.Multiscale Combinatorial Grouping for ImageSegmentation and Object Proposal Generation.IEEE Transactions on PatternAnalysis&Machine Intelligence 39.1(2016):128-140。在已有层次化分割算法的基础上,对输入图像进行进行多尺度的层次化分割,并对多尺度的层次化分割结果进行对齐合并,获得更优的图像层次化分割并将其用于目标检测。对图像进行多尺度处理可以获取更多的图像信息,提高算法效果,但此方法仅对输入图像进行尺度缩放,无法保证分割过程中多尺度的图像信息对分割结果有效地进行控制。文献4:Pont-Tuset J,Arbelaez P,BarronJ T,et al.Multiscale combinatorial grouping for image segmentation and objectproposal generation[J].IEEE transactions on pattern analysis and machineintelligence,2017,39(1):128-140。采用高斯模糊和层次化聚类对图像进行层次化纹理分割,以提取不同尺度下的纹理区域。但这种方法只能根据图像的纹理信息对图像进行层次化分割,难以对图像中的目标对象进行较好的分割。综上所述,现有的层次化分割方法主要存在两个问题:第一,无法保证每层分割结果在语义上保持一致性;第二,无法在分割过程中对多尺度图像信息进行合理地利用和控制。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种图像层次化分割方法,用于减轻或消除层次化图像分割的上述缺点。
为了解决上述技术问题,本发明公开了一种基于多尺度边缘线索的图像层次化分割方法,包括以下步骤:
步骤1:多尺度边缘线索:对输入图像在变尺度的情况下进行纹理滤波,并提取多尺度边缘线索,用于度量区域相似度;
步骤2:生成层次合并树:对输入图像进行超像素化,将超像素区域转化为图结构,根据多尺度边缘线索度量边权重,并进行迭代式区域合并,生成层次合并树;
步骤3:优化层次合并树:建立能量函数,实现对层次合并树结构的优化。
步骤1包括以下步骤:
步骤1-1,多尺度内容风格分离:对输入图像进行尺度缩放,分别将其长宽像素缩小至原图N1、N2、N3、N4(取值分别为0.2、0.4、0.6和0.8)比例的大小,并采用内容分割分离方法对其进行纹理滤波,滤除不同尺度的纹理信息,保留并提取不同尺度下的内容部件;
步骤1-2,提取边缘概率图:根据步骤1-1中提取的内容部件,采用差值放大方法将其缩放至原图像大小,并提取基于边缘概率图(Edge Possible Map)的多尺度边缘线索,边缘概率图记为EPM={EPMt},其中EPMt表示不同尺度t下的边缘概率图,t为边缘概率图对应的步骤1-1中五种尺度大小,即N1、N2、N3、N4和原图尺度,epmi∈EPMt表示边缘概率图中第i个像素属于边缘的概率,取值为0≤epmi≤1。
步骤2包括以下步骤:
步骤2-1,超像素化:采用SLIC(简单线性迭代聚类,Simple Linear IterativeCluster)算法对输入图像I进行超像素化,并将获得超像素结果记为S={si},其中si表示第i个被分割区域,区域标签i∈{1,2,...,L},L为对输入图像超像素化后的超像素区域数量,所有超像素区域的集合S即组成整个输入图像I;
步骤2-2,图结构表示:根据步骤2-1中的超像素区域,构建区域邻接图G=(V,E,W),将图像分割任务转化为图结构的处理,其中,V表示节点集合,E表示边集合,W表示边权重集合,图中的第i个节点vi∈V表示超像素区域的集合中对应的第i个被分割区域si∈S,图中的每条边eij∈E表示第i个节点vi与第j个节点vj相连,对应于在输入图像中相邻的两个区域,即第i个区域si和第j个区域sj,wij∈W表示图结构中边eij的权重,对应于两个相邻区域si和sj之间的相似度;
步骤2-3,区域相似度度量:根据步骤1-2提取的多尺度边缘线索,计算步骤2-2中图结构的边权重,即相邻区域间的相似度;
步骤2-4,合并迭代式区域:每次选取图结构中边权重最小的一对相邻节点进行合并,并更新区域邻接图,重复该操作,直到所有节点合并为一个节点,并记录整个迭代合并过程为层次合并树T=(Vt,Et),其中,Vt表示节点集合,Et表示连接父节点与子节点的边,每个节点表示输入图像I中的一个分割区域,d为该节点编号,i表示该节点是由第i次区域合并生成,与该节点在层次合并树中的深度相关,所有初始节点即初始超像素区域的i值为0。
步骤2-3中,相似度度量公式如下:
f(si,sj)=1-avg({EPMt(x)|x∈B(si,sj)})
B(si,sj)=(si∩N(sj))∪(sj∩N(si))
其中f(si,sj)表示区域si与区域sj之间的相似度,EPMt(x)表示尺度t下的边缘概率图,N(si)表示输入图像中与超像素区域si相邻的像素点,函数B(si,sj)表示第i个区域si和第j个区域sj之间的相邻像素,采用8邻接定义像素相邻关系;相邻区域的相似度度量则由两区域间相邻像素对应的边缘概率的均值决定。
步骤3包括以下步骤:
步骤3-1,构建能量函数:对层次合并树优化问题看做是对每个节点i值的优化,将该优化任务转化为能量函数求解任务,根据预定义的先验信息确定三个风格层次的语义标准和约束条件,分别为颜色先验、目标先验和纹理先验,对应于由粗到细不同层的分割结果,根据三种语义先验,分别提取相关的局部特征,构建对应于三层分割结果的三个能量函数,颜色特征采用基于Lab颜色空间的直方图特征,对象特征采用基于目标检测算法的目标包围框,纹理特征采用Tamura纹理特征;
步骤3-2,优化层次合并树:对于生成的初始层次合并树,其结构优化过程是对每个节点的深度d进行调整的过程,即在初始层次合并树中寻找一个节点集合,集合中所有节点的并集组成输入图像,且节点之间两两不存在交集,这样一个集合叫做对层次合并树的一次划分,划分上方的节点为未分割状态,划分中的节点为分割状态,划分下方的节点为过分割状态,分别记为其中处于过分割状态和未分割状态的节点对划分选择具有约束作用:未分割节点的父节点也是未分割节点;过分割节点的子节点也是过分割节点;
为生成由粗到细三层划分结果,根据步骤3-1中定义的三个语义约束,分别构建三个能量函数,并使用动态规划方法进行求解,并根据得到的三层划分结果对层次合并树中所有的节点深度进行调整优化,使得由粗到细的层次化分割结果语义一致性更加明确。
步骤3-2中所述能量函数公式如下:
其中表示使得能量函数E(X)能量最小化的节点分布,E(X)为优化目标的能量函数,由能量项和损失项两部分组成,参数λ为损失项的权重系数,表示节点位于划分L中,表示节点的像素面积,di为该节点的深度;分别用于度量单个节点能量增益的函数和能量损失的函数如下所示:
有益效果:本发明具有以下优点:首先,本发明采用多尺度的边缘线索指导分割过程,充分利用了多尺度图像信息,有效提高了层次化分割的效果。其次,本发明通过优化层次合并树,保持了不同层次的分割结果在语义上一致性,使得分割结果的结构更加清晰。最后,合理地改变先验信息,本发明可以得到更符合用户意图的层次化分割结果。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1是本发明的处理流程示意图。
图2a~2f是对实施例的输入图像尺度缩放后,在不同尺度下进行纹理滤波的示意图,图2a为输入图像,图2b为在0.2尺度下的纹理滤波结果图。图2c为在0.4尺度下的纹理滤波结果图。图2d为在0.6尺度下的纹理滤波结果图。图2e为在0.8尺度下的纹理滤波结果图。图2f为在1.0尺度下的纹理滤波结果图。
图3a~3f是对图2a~2f进行内容部件进行边缘概率图检测的示意图,图3a为实施例的输入图像,图3b为对图2b进行边缘检测生成的相应尺度下的边缘概率图。图3c为对图2c进行边缘检测生成的相应尺度下的边缘概率图。图3d为对图2d进行边缘检测生成的相应尺度下的边缘概率图。图3e为对图2e进行边缘检测生成的相应尺度下的边缘概率图。图3f为对图2f进行边缘检测生成的相应尺度下的边缘概率图。
图4a~4d是实施例的输入图像生成层次合并树示意图,图4a是输入图像,图4b是对图4a进行超像素化生成超像素区域的示意图,图4c是对图4b进行图表示的区域邻接图示意图,图4d是对图4c的进行递进式区域合并生成的层次合并树示意图。
图5是对图4d的层次合并树进行结构优化的示意图。
图6a~6d是对图5进行阈值划分得到的层次化分割的示意图,图6a是输入图像,图6b是粗粒度分割结果的示意图,图6c是中粒度分割结果的示意图,图6d是细粒度分割结果的示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1所示,本发明公开的是一种基于多尺度边缘线索的图像层次化分割方法,具体包括以下步骤:
步骤一:多尺度边缘线索:对输入图像在变尺度的情况下进行纹理滤波,并提取多尺度边缘线索,用于度量区域相似度;
步骤二:层次合并树生成:对输入图像进行超像素化,将超像素区域转化为图结构,根据多尺度边缘线索度量边权重,并进行迭代式区域合并,生成层次合并树;
步骤三:层次合并树优化:根据层次合并树和先验信息建立能量函数,使用动态规划算法进行求解,实现对层次合并树结构的优化。
下面具体介绍各个步骤的主要流程:
1.多尺度边缘线索
多尺度边缘线索对输入图像在变尺度的情况下进行纹理滤波,并提取多尺度边缘线索作为图像信息,用于后面的区域相似度度量和指导层次化分割过程,包括多尺度内容风格分离和边缘概率图提取两个步骤。
步骤1-1,多尺度内容风格分离。对输入图像进行尺度缩放,分别将其长宽像素缩小至原图0.2、0.4、0.6和0.8比例的大小,并采用内容分割分离方法对其进行纹理滤波,滤除不同尺度的纹理信息,保留并提取不同尺度下的内容部件。内容风格分离使用文献5:LeeH,Jeon J,Kim J,et al.Structure-Texture Decomposition of Images with IntervalGradient[C].Computer Graphics Forum.2017,36(6):262-274.中所述的纹理滤波方法,保留所有尺度下的纹理滤波结果作为内容部件,对于每张输入图像共有5个变尺度内容部件。
步骤1-2,边缘概率图提取。根据步骤1-1中提取的多尺度图像内容部件,采用差值放大方法将其缩放至原图像大小,并提取基于边缘概率图的多尺度边缘线索EPM={EPMt},其中t表示边缘概率图对应的上述五种尺度大小(含原尺度),边缘概率图中每个像素epmi∈EPMt表示该像素属于边缘的概率,取值为0≤epmi≤1。边缘线索使用文献6:Dollár P,Zitnick C L.Fast edge detection using structured forests[J].IEEE transactionson pattern analysis and machine intelligence,2015,37(8):1558-1570.中所述的边缘概率图提取方法,用于表示图像中所有像素在原图中属于边缘的概率。
2.层次合并树生成
对输入图像进行超像素化,将超像素区域转化为区域邻接图,同时将分割问题转化为一个图割问题,根据多尺度边缘线索度量边权重,对图结构进行迭代式区域合并,生成层次合并树,层次合并树可以看作是一个初步的层次化分割结果。包括以下步骤:
步骤2-1,超像素化。采用SLIC算法对输入图像I进行超像素化,并将获得超像素结果记为S=(si),其中si表示编号为i被分割区域,所有超像素区域的集合S即组成整个输入图像I。对输入图像的超像素表示使用文献7:Achanta R,Shaji A,Smith K,et al.SLICsuperpixels compared to state-of-the-art superpixel methods[J].PatternAnalysis and Machine Intelligence,IEEE Transactions on,2012,34(11):2274-2282.中所述的SLIC超像素化方法,相关的超像素化参数:超像素区域大小和正则化参数分别设为20和0.1。
步骤2-2,图结构表示。根据步骤2-1中的超像素区域,构建区域邻接图G=(V,E,W),将图像分割任务转化为图结构的处理,其中图中的每个节点vi∈V表示超像素结果中对应的分割区域si∈S,图中的每条边eij∈E表示节点vi与节点vj相连,对应于在输入图像中相邻的两个区域si和sj,wij∈W表示图结构中边eij的权重,对应于两个相邻区域si和sj之间的相似度。
步骤2-3,区域相似度度量。根据步骤1-2提取的多尺度边缘线索,计算步骤2-2中图结构的边权重,即相邻区域间的相似度,相似度度量公式如下:
f(si,sj)=1-avg({EPMt(x)|x∈B(si,sj)})
B(si,sj)=(si∩N(sj))∪(sj∩N(si))
其中EPMt(x)表示尺度t下的边缘概率图,N(si)表示输入图像中与超像素区域si相邻的像素点,函数B(si,sj)表示相邻区域si和sj之间的相邻像素,采用8邻接定义像素相邻关系。相邻区域的相似度度量则由两区域间相邻像素对应的边缘概率的均值决定。
步骤2-4,迭代式区域合并。根据步骤2-2中获取的区域邻接图和步骤2-3中计算的区域相似度,迭代进行一下合并操作:每次选取图结构中边权重最小的一对相邻节点进行合并,并更新区域邻接图。重复上述操作,直到所有节点合并为一个节点,并记录整个迭代合并过程为层次合并树T=(Vt,Et),其中每个节点表示输入图像I中的一个分割区域,d为该节点编号,i表示该节点是由第i次区域合并生成,与该节点在层次合并树中的深度相关,所有初始节点(初始超像素区域)的i值为0。
3.层次合并树优化
根据定义的先验信息,对层次合并树中的三层建立对应的能量函数,并使用动态规划算法进行求解,根据求解结果对层次合并树的结构进行优化。包括以下步骤:
步骤3-1,能量函数构建。层次结构树中的每个节点的i值会直接决定该节点对应区域在层次化分割结果中所处的位置,因此,对层次合并树优化问题可以看做是对每个节点i值的优化,每个节点对应于期望的分割结果存在三种状态:过分割、正确分割和未分割,分别用x(vi)∈{-1,0,1}表示。本发明将该优化任务转化为能量函数求解任务,根据预定义的先验信息确定三个风格层次的语义标准和约束条件,分别为颜色先验、目标先验和纹理先验,对应于由粗到细不同层的分割结果。根据三种语义先验,分别提取相关的局部特征,构建对应于三层分割结果的能量函数,颜色特征采用基于Lab颜色空间的直方图特征,对象特征采用文献8:Ren S,He K,Girshick R,et al.Faster r-cnn:Towards real-time object detection with region proposal networks[C].Advances in neuralinformation processing systems.2015:91-99.目标包围框检测算法,纹理特征采用文献9:Tamura H,Mori S,Yamawaki T.Textural features corresponding to visualperception[J].IEEE Transactions on Systems,man,and cybernetics,1978,8(6):460-473.中的Tamura纹理特征。整个层次合并树优化任务的公式如下:
步骤3-2,层次合并树优化。对于步骤3-1构建的三个能量函数,使用动态规划方法分别进行求解,并根据得到的解优化层次合并树中的所有节点深度,生成语义一致性更加明确的层次合并树。对层次合并树选取合适的阈值进行阈值分割,从而得到输出由粗到细的层次化分割结果。能量函数求解采用文献10:Cormen T H.Introduction to algorithms[M].MIT press,2009.中的动态规划算法。
实施例
本实施例中个,如图2a所示为输入的待分割图像,图2b~2f为对输入图像进尺度缩放以及内容风格分离后的多尺度图像内容部件,本实施例展示了5种尺度下的结果,按顺序分别为缩放至原图像0.2、0.4、0.6、0.8和1.0。图3b~3f为对图像内容部件进行边缘检测的边缘概率图,与图2b~2f的示意图一一对应。图4a~4d为从输入图像到层次合并树的生成过程,其中图4b为图4a的超像素化结果,图4c为将图4b转化为区域邻接图后的图结构表示,图4d为对图4c进迭代式区域合并后生成的层次合并树。图5表示通过能量函数构建和动态规划求解对层次合并树进行优化的过程。图6a~6d为输入图像及其由粗到细三个层次的分割结果。
具体实施过程如下:
步骤一中,对图2a所示的输入图像进行尺度缩放,得到0.2、0.4、0.6、0.8和1.0五种尺度的图像,之后根据内容风格分离算法对其进行纹理滤波,得到的图像即为内容部件并将其缩放回原图像分辨率大小,结果如图2b~2f所示;对图2b~2f中的每幅图像,采用边缘检测算法检测五种图像内容部件中每个像素点属于边缘的概率,并用边缘概率图进行表示,结果如图3b~3f所示。
步骤二中,根据输入图像和多尺度边缘线索生成层次合并树。首先对图4a所示的输入图像进行超像素化,生成较为细小的过分割区域,超像素化结果如图4b所示;对于图4b所示的超像素区域,可以根据其位置关系和区域间的相邻关系,构造对应的区域邻接图,生成如图4c所示的图结构,像素邻接关系采用8邻域。每次从区域邻接图中选取相似度最高的两个节点进行合并,并更新图结构表示及新生成节点的编号,迭代重复上述操作直到所有节点合并为一个父节点停止,记录整个迭代合并过程并采用树结构进行表示,层次合并树结果如图4d所示,区域相似性度量由图3b~3f的多尺度边缘线索进行融合并计算得到。
步骤三中,对图4d的层次合并树构建对应于不同层级的能量函数,采用动态规划求解并优化层次合并树结构,如图5所示,根据动态规划求解的结果对层次合并树中每个节点的深度进行调整,从而优化树形结构。对优化后的层次合并树选取合适的阈值进行划分,生成输出的层次化分割结果如图6b~6d所示。
本发明提供了一种基于多尺度边缘线索的层次化图像分割方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (1)
1.一种基于多尺度边缘线索的层次化图像分割方法,其特征在于,包括以下步骤:
步骤1:多尺度边缘线索:对输入图像在变尺度的情况下进行纹理滤波,并提取多尺度边缘线索,用于度量区域相似度;
步骤2:生成层次合并树:对输入图像进行超像素化,将超像素区域转化为图结构,根据多尺度边缘线索度量边权重,并进行迭代式区域合并,生成层次合并树;
步骤3:优化层次合并树:建立能量函数,实现对层次合并树结构的优化;
步骤1包括以下步骤:
步骤1-1,多尺度内容风格分离:对输入图像进行尺度缩放,分别将其长宽像素缩小至原图N1、N2、N3、N4比例的大小,并采用内容分割分离方法对其进行纹理滤波,滤除不同尺度的纹理信息,保留并提取不同尺度下的内容部件;
步骤1-2,提取边缘概率图:根据步骤1-1中提取的内容部件,采用差值放大方法将其缩放至原图像大小,并提取基于边缘概率图的多尺度边缘线索,边缘概率图记为EPM={EPMt},其中EPMt表示不同尺度t下的边缘概率图,t为边缘概率图对应的步骤1-1中五种尺度大小,即N1、N2、N3、N4和原图尺度,epmi∈EPMt表示边缘概率图中第i个像素属于边缘的概率,取值为0≤epmi≤1;
步骤2包括以下步骤:
步骤2-1,超像素化:采用SLIC简单线性迭代聚类算法对输入图像I进行超像素化,并将获得超像素结果记为S={si},其中si表示第i个被分割区域,所有超像素区域的集合S即组成整个输入图像I;
步骤2-2,图结构表示:根据步骤2-1中的超像素区域,构建区域邻接图G=(V,E,W),将图像分割任务转化为图结构的处理,其中,V表示节点集合,E表示边集合,W表示边权重集合,图中的第i个节点vi∈V表示超像素区域的集合中对应的第i个被分割区域si∈S,图中的每条边eij∈E表示第i个节点vi与第j个节点vj相连,对应于在输入图像中相邻的两个区域,即第i个区域si和第j个区域sj,wij∈W表示图结构中边eij的权重,对应于两个相邻区域si和sj之间的相似度;
步骤2-3,区域相似度度量:根据步骤1-2提取的多尺度边缘线索,计算步骤2-2中图结构的边权重,即相邻区域间的相似度;
步骤2-4,合并迭代式区域:每次选取图结构中边权重最小的一对相邻节点进行合并,并更新区域邻接图,重复该操作,直到所有节点合并为一个节点,并记录整个迭代合并过程为层次合并树T=(Vt,Et),其中,Vt表示节点集合,Et表示连接父节点与子节点的边,每个节点表示输入图像I中的一个分割区域,d为该节点编号,i表示该节点是由第i次区域合并生成,与该节点在层次合并树中的深度相关,所有初始节点即初始超像素区域的i值为0;
步骤2-3中,相似度度量公式如下:
f(si,sj)=1-avg({EPMt(x)|x∈B(si,sj)})
B(si,sj)=(si∩N(sj))∪(sj∩N(si))
其中f(si,sj)表示区域si与区域sj之间的相似度,EPMt(x)表示尺度t下的边缘概率图,N(si)表示输入图像中与超像素区域si相邻的像素点,函数B(si,sj)表示第i个区域si和第j个区域sj之间的相邻像素,采用8邻接定义像素相邻关系;相邻区域的相似度度量则由两区域间相邻像素对应的边缘概率的均值决定;
步骤3包括以下步骤:
步骤3-1,构建能量函数:对层次合并树优化问题看做是对每个节点i值的优化,将该优化任务转化为能量函数求解任务,根据预定义的先验信息确定三个风格层次的语义标准和约束条件,分别为颜色先验、目标先验和纹理先验,对应于由粗到细不同层的分割结果,根据三种语义先验,分别提取相关的局部特征,构建对应于三层分割结果的三个能量函数,颜色特征采用基于Lab颜色空间的直方图特征,对象特征采用基于目标检测算法的目标包围框,纹理特征采用Tamura纹理特征;
步骤3-2,优化层次合并树:对于生成的初始层次合并树,其结构优化过程是对每个节点的深度d进行调整的过程,即在初始层次合并树中寻找一个节点集合,集合中所有节点的并集组成输入图像,且节点之间两两不存在交集,该集合是对层次合并树的一次划分,划分上方的节点为未分割状态,划分中的节点为分割状态,划分下方的节点为过分割状态,分别记为
根据步骤3-1中定义的三个语义约束,分别构建三个能量函数,并使用动态规划方法进行求解,并根据得到的三层划分结果对层次合并树中所有的节点深度进行调整优化;
步骤3-2中所述能量函数公式如下:
其中表示使得能量函数E(X)能量最小化的节点分布,E(X)为优化目标的能量函数,由能量项和损失项两部分组成,参数λ为损失项的权重系数,表示节点位于划分L中,表示节点的像素面积,di为该节点的深度;分别用于度量单个节点能量增益的函数和能量损失的函数如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113242.6A CN109272467B (zh) | 2018-09-25 | 2018-09-25 | 一种基于多尺度边缘线索的层次化图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811113242.6A CN109272467B (zh) | 2018-09-25 | 2018-09-25 | 一种基于多尺度边缘线索的层次化图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109272467A CN109272467A (zh) | 2019-01-25 |
CN109272467B true CN109272467B (zh) | 2022-03-15 |
Family
ID=65197357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811113242.6A Active CN109272467B (zh) | 2018-09-25 | 2018-09-25 | 一种基于多尺度边缘线索的层次化图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109272467B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110047098A (zh) * | 2019-04-18 | 2019-07-23 | 成都四方伟业软件股份有限公司 | 像素拾取方法、装置、电子设备和可读存储介质 |
CN110298855B (zh) * | 2019-06-17 | 2023-05-16 | 上海大学 | 一种基于高斯混合模型和纹理分析的海天线检测方法 |
CN110517269B (zh) * | 2019-07-08 | 2023-03-10 | 西南交通大学 | 一种基于层次区域合并的多尺度图像分割方法 |
CN111340826B (zh) * | 2020-03-25 | 2023-07-18 | 南京林业大学 | 基于超像素与拓扑特征的航拍图像单株树冠分割算法 |
CN111415299B (zh) * | 2020-03-26 | 2023-03-28 | 浙江科技学院 | 一种高分辨率图像风格迁移方法 |
CN111784698A (zh) * | 2020-07-02 | 2020-10-16 | 广州信瑞医疗技术有限公司 | 一种图像的自适应分割方法、装置,电子设备及存储介质 |
CN113160252B (zh) * | 2021-05-24 | 2023-04-21 | 北京邮电大学 | 一种面向文化图案图像的层次分割方法 |
CN115239746B (zh) * | 2022-09-23 | 2022-12-06 | 成都国星宇航科技股份有限公司 | 一种面向对象的遥感图像分割方法、装置、设备及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564010A (zh) * | 2017-09-11 | 2018-01-09 | 新疆大学 | 一种结合贝叶斯分类与SLIC的Grabcut彩色图像分割方法 |
-
2018
- 2018-09-25 CN CN201811113242.6A patent/CN109272467B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107564010A (zh) * | 2017-09-11 | 2018-01-09 | 新疆大学 | 一种结合贝叶斯分类与SLIC的Grabcut彩色图像分割方法 |
Non-Patent Citations (2)
Title |
---|
"Hierarchical Image Segmentation Based on Multi-feature Fusion and Graph Cut Optimization";Anqi Hu等;《PCM 2018》;20180919;第596-606页 * |
"Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images";Yuri等;《International Conference on Computer Vision》;20010420;第105-112页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109272467A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109272467B (zh) | 一种基于多尺度边缘线索的层次化图像分割方法 | |
Wei et al. | Toward automatic building footprint delineation from aerial images using CNN and regularization | |
Qi et al. | SaliencyRank: Two-stage manifold ranking for salient object detection | |
CN111160407B (zh) | 一种深度学习目标检测方法及系统 | |
CN109712143B (zh) | 一种基于超像素多特征融合的快速图像分割方法 | |
CN108985298B (zh) | 一种基于语义一致性的人体衣物分割方法 | |
Kermad et al. | Automatic image segmentation system through iterative edge–region co-operation | |
Elmoataz et al. | Nonlocal PDEs on graphs: From tug-of-war games to unified interpolation on images and point clouds | |
CN115424017B (zh) | 一种建筑物内外轮廓分割方法、装置及存储介质 | |
Li et al. | Saliency transfer: An example-based method for salient object detection. | |
Chen et al. | A local tangent plane distance-based approach to 3D point cloud segmentation via clustering | |
Zhou et al. | An efficient two-stage region merging method for interactive image segmentation | |
Xie et al. | Integration of optical flow and Multi-Path-Viterbi algorithm for stereo vision | |
Ma et al. | Scribble-attention hierarchical network for weakly supervised salient object detection in optical remote sensing images | |
Wang et al. | A region-line primitive association framework for object-based remote sensing image analysis | |
Vu et al. | Graph cut segmentation of neuronal structures from transmission electron micrographs | |
Qian et al. | Spatial contextual noise removal for post classification smoothing of remotely sensed images | |
Takahashi et al. | Applying manifold learning to plotting approximate contour trees | |
Kustra et al. | Computing refined skeletal features from medial point clouds | |
Saglam et al. | An efficient object extraction with graph-based image segmentation | |
Shen et al. | Intelligent image segmentation model for remote sensing applications | |
Ersin Yumer et al. | Co-segmentation of textured 3D shapes with sparse annotations | |
Hassan et al. | Salient object detection based on CNN fusion of two types of saliency models | |
Wang et al. | Image object extraction based on semantic segmentation and label loss | |
Luo et al. | Object-level segmentation of indoor point clouds by the convexity of adjacent object regions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |