CN101339615B - 一种基于相似矩阵逼近的图像分割方法 - Google Patents
一种基于相似矩阵逼近的图像分割方法 Download PDFInfo
- Publication number
- CN101339615B CN101339615B CN200810118081XA CN200810118081A CN101339615B CN 101339615 B CN101339615 B CN 101339615B CN 200810118081X A CN200810118081X A CN 200810118081XA CN 200810118081 A CN200810118081 A CN 200810118081A CN 101339615 B CN101339615 B CN 101339615B
- Authority
- CN
- China
- Prior art keywords
- matrix
- similar
- similar matrix
- adjacency matrix
- similarity weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种基于相似矩阵逼近的图像分割方法,该方法包括以下步骤:从输入图像中提取相似矩阵;对相邻矩阵和相似性权重进行初始化;更新相邻矩阵;更新相似性权重;进行循环迭代;在迭代所得结果上寻找连通分支。根据本发明的基于相似矩阵逼近的图像分割方法,运算速度快、便于用户操作、具有良好的抗噪性。
Description
技术领域
本发明涉及一种数字图像的分割方法,特别是,本发明涉及基于相似矩阵逼近的图像分割方法。
本发明还可用于文本聚类、模式识别、数据分析、和异常值检测等。在本发明中,术语“相似性权重”是指相邻矩阵的权重因子。
背景技术
图像是人类从客观世界获取信息的重要来源和传递信息的重要媒介,而数字图像处理技术也随着计算机、互联网等技术的发展而在工业、医疗、军事、交通等行业中发挥出越来越大的作用。
为了有效提取和利用数字图像中所包含的信息,需要对图像进行分割。有效的数字图像分割技术将为进一步的图像检索、识别等技术奠定基础。
聚类是机器学习中的经典技术,也是图像分割中的常用方法,例如Inderiit S.Dhillon等人2007年在IEEE Transaction on PatternAnalysis and Machine Intelligence杂志上(见2007,29(11):1944-1957)发表了题为《Weighted Graph Cuts without Eigenvectors:A MultilevelApproach》的论文,公开了一种不需要计算特征值或特征向量的图像分割方法。
但是,在该方法中,需要用户预先给出一些其它的控制参数进行人工干预;另外,还需要借助于其它的聚类算法来输出最终的分割结果。因此,给当前的软硬件环境带来了压力,并且给用户的操作带来了不便。
发明内容
本发明的目的是提供一种基于相似矩阵逼近的图像分割方法,其运算速度快、便于用户操作。
本发明的进一步的目的是提供一种基于相似矩阵逼近的图像分割方法,其具有良好的抗噪性。
为了达到上述目的,本发明提供了一种基于相似矩阵逼近的图像分割方法,该方法包括提取相似矩阵的步骤,其接受用户输入的数字图像,并计算相似矩阵,其特征在于,该方法还包括:获取相邻矩阵的步骤,其根据相似性权重的收敛情况进行循环迭代,最终生成一个与上述相似矩阵最接近的相邻矩阵;以及寻找连通分支的步骤,其在所得的相邻矩阵上寻找连通分支,并输出对输入数据的最终分割结果。
优选地,所述获取相邻矩阵的步骤包括:运算过程初始化步骤,其根据相似矩阵对相邻矩阵和相似性权重进行初始化;相邻矩阵的更新步骤,其根据相似矩阵和相似性权重更新相邻矩阵;以及相似性权重的更新步骤,其根据相似矩阵和相邻矩阵更新相似性权重,其中,当两次迭代所得的相似性权重相等或算法超过最大迭代次数限制时迭代结束。
优选地,在相邻矩阵的更新步骤中,固定相似性权重,利用误差最小化的方法根据相似矩阵和相似性权重来对相邻矩阵进行调整,使得相似矩阵和相邻矩阵之间的误差进一步减小。
优选地,在相似性权重的更新步骤中,固定相邻矩阵,利用误差最小化的方法根据相似矩阵和相邻矩阵更新相似性权重。
优选地,如果所采用的相似矩阵不具有对称性,则对所有i,k选择e(i,k)和e(k,i)的较大者构成新的相邻矩阵,再在该矩阵上寻找连通分支,其中,e(i,k)表示相邻矩阵第i行第k列上的元素,e(k,i)表示相邻矩阵第k行第i列上的元素。
优选地,按照连通分支规模由大到小的顺序对分割结果进行输出,输出过程中如果分割块的数目超过预先估计的最大数目,则将剩余所有的连通分支合并为一个大的分割块。
优选地,所述相似性权重与一控制系数的乘积用于与相似矩阵的各元素进行比较,以进一步对相邻矩阵的各元素进行赋值,该控制系数在0.40~0.60之间。
优选地,所述控制系数在0.4 6~0.51之间。
与现有技术相比,本发明的优点在于:
1.根据本发明的基于相似矩阵逼近的图像分割方法,运行速度快,其时间复杂度为O(n+e),而在最坏情况下的时间复杂度为O(n2),其中,n为图像中像素点的数目,e为数据点所构成的无向图中边的数目。
2.根据本发明的基于相似矩阵逼近的图像分割方法,需要用户的人工干预少,因此容易掌握、操作方便。在输入图像给定后,最终的输出只依赖于用户所使用的相似度的计算方法。另外,与现有技术不同,本发明并不要求所采用的相似度具有对称性以及各个数据元素与其自身的相似度为0。当相似度的计算方法给定后,本发明不再需要用户设置额外的参数,并且能够自动输出划分的数目。
3.根据本发明的基于相似矩阵逼近的图像分割方法,对数据的性质以及划分的形状没有特别的要求,并且具有良好的抗噪性,所以,本发明用途广泛。
4.根据本发明的基于相似矩阵逼近的图像分割方法,流程简单,实现容易,并且其计算过程是收敛的和稳定的。
5.根据本发明的基于相似矩阵逼近的图像分割方法,由于计算速度的提升,降低了对计算机配置的要求,使得用户可减少硬件投资成本。
对附图的简要说明
图1是根据现有技术的工作流程示意图。
图2是根据本发明的基于相似矩阵逼近的图像分割方法的一个实施例的工作流程示意图。
具体实施方式
在如图1所示的现有技术中,首先在步骤100中提取出图像的相似矩阵,然后,如步骤200-700所示,后续的算法是继续对该相似矩阵本身进行进一步的处理。可以发现,该算法需要较多人工干预,特别是需要其他算法的辅助。
为了减少人工干预,便于用户掌握和操作,提高预算速度,本发明以数字图像作为输入,不再继续对相似矩阵自身进行后续处理,而是另外寻找一个与已知相似矩阵最接近的相邻矩阵,然后,根据该相邻矩阵进行后续的处理,进而输出最终对输入图像的分割结果。
下面参照附图,对本发明的具体实施方式进行说明。
根据本发明一个实施例的基本流程图如图1所示。步骤10用于从用户输入的图像中提取相似矩阵。
相似矩阵应该满足的条件为:
相似矩阵S=[s(i,k)]nxn为一个n阶方阵,
其中,n表示数据集中的元素个数,在此处即输入图像中像素点的个数;s(i,k)表示相似矩阵第i行第k列上的元素;
s(i,k)反映的是图像中第i个像素xi第k个像素xk之间的相似度,并且对于任意i,k有s(i,k)≥0。
当i≠k时,s(i,k)越接近于0说明xi和xk之间的相似度越低,而s(i,k)越大则说明xi和xk之间的相似度越高。
与现有技术不同,本发明并不要求相似矩阵为对称矩阵且对角元素为0,然而,当相似矩阵为对称矩阵或其对角元素为0时可以减少本发明的计算量。
在本实施方式中,我们按照
来计算相似度,其中
x(i)loc和x(i)col分别表示像素i的位置和颜色,σ1和σ2分别表示空间相 似度和颜色相似度的尺度参数,κ用于控制空间因素对整体相似度的影响。且本实施方式中分别设置κ和σ1为2和0.1,并且使用RGB颜色空间。
显然,按照此中方法计算所得的相似矩阵是稀疏矩阵。当然,相似度的计算并不仅限于这种方法,用户可以根据具体应用选择不同的方法来计算像素间的相似度,只要所得的相似矩阵满足上述基本条件即可。
图1中的步骤20用于对本方法进行初始化,其中需要完成的工作包括:
设置当前迭代次数为0;
初始化相邻矩阵E=[e(i,k)]nxn的每个元素e(i,k)=0,其中,n为输入图像中像素点的个数;
设置初始的相似性权重mu=maxi≠ks(i,k);若相似矩阵S=[s(i,k)]nxn的对角元素不为0则设置相似矩阵的对角元素为0。
图1中的步骤30用于根据相似矩阵和当前的相似性权重来更新相邻矩阵,即重新对相邻矩阵进行调整,使得相似矩阵与相邻矩阵的误差进一步减小。
所使用的方法为:对于相邻矩阵E=[e(i,k)]nxn的每个元素,如果s(i,k)≥a×mu则设置e(i,k)=1,否则设置e(i,k)=0。
其中,n为输入图像中像素点的个数,mu为当前的相似性权重,a为控制系数。发明人的研究表明,控制系数a直接影响迭代的速度,通常情况下,控制系数a在0.40~0.60之间,优选在0.46~0.51之间,可取得优异效果。
图1中的步骤40用于根据相似矩阵和当前的相邻矩阵来更新相似性权重,更新的方法依据最小化目标函数的不同而不同,例如可以采用平方误差(Square Error)或是绝对偏差(Absolute Deviation)的方法。在本实施方式中使用平方误差作为最优化的标准。
进行最优化的方法并不仅限于此,用户可以根据实际情况选择以上方法之一或是另外的最优化方法,但最优化的基本原理是使得相似矩阵与相邻矩阵之间误差尽可能的小。
图1中的步骤50、51、52用于对步骤3和步骤4进行循环迭代。首先,步骤50用于判断本次迭代所得的相似性权重是否和上次迭代所得的相似性权重相等,若相等则说明计算过程已收敛,可以直接转入步骤60,若不相等则需要转入步骤51。步骤51用于判断迭代次数是否超过最大限制,若已超过最大迭代次数则转入步骤52进行出错处理,否则转入步骤30继续进行处理。
图1中的步骤60用于在上个步骤所得的相邻矩阵上寻找连通分支。在本实施方式中,使用Tarjan的算法,即图的深度优先遍历算法来寻找连通分支,各个连通分支就代表对输入图像的各个分割块。按照连通分支规模由大到小的顺序对分割结果进行输出,输出过程中如果分割块的数目(例如:20)超过预先估计的最大数目(例如:10),则将剩余所有的连通分支(例如:10-20)合并为一个大的分割块(第10块)。
在其他的实施例中,当用户在步骤10中所使用的相似度不具有对称性,即相似矩阵S=[s(i,k)]n×n不是对称矩阵时,则对所有i,k选择e(i,k)和e(k,i)的较大者构成新的相邻矩阵,再在该矩阵上寻找连通分支。其中,e(i,k)表示相邻矩阵第i行第k列上的元素,e(k,i)表示相邻矩阵第k行第i列上的元素。
总之,根据本发明的上述实施例,基于相似矩阵逼近的图像分割方法包括以下步骤:
1.从输入图像中提取相似矩阵;
2.对相邻矩阵和相似性权重进行初始化;
3.根据相似矩阵和相似性权重更新相邻矩阵;
4.根据相似矩阵和相邻矩阵更新相似性权重;
5.根据相似性权重的收敛情况对步骤3和步骤4进行循环迭代;
6.在所得的相邻矩阵上寻找连通分支,并输出最终的分割结果。
为了便于理解本发明,下面再举一个简单的小例子。
假设数据集合只包含6个元素:x1、x2、x3、x4、x5、x6,首先提取出该数据集合的相似矩阵S如下:
第2步,初始化。设置相邻矩阵E的所有元素为0,即设置E为:
设置相似性权重mu为相似矩阵中的最大值,在本例中即设置mu=0.82。
第3步,更新相邻矩阵。经过第一次迭代后的相邻矩阵E如下:
第4步,更新相似性权重。本实施方式中使用平方误差的方法进行更新,更新后的mu=0.70。
第5步,循环迭代。由于上次迭代所得的相似性权重为0.82,本次迭代所得的相似性权重为0.70,所以还需要继续迭代。
第二轮迭代:第3步,更新相邻矩阵。更新后的相邻矩阵如下:
第4步,更新相似性权重。得mu=0.66。
第5步,循环迭代。由于上次迭代所得的相似性权重为0.70,本次迭代所得的相似性权重为0.66,所以还需要继续迭代。
第三轮迭代:第3步,更新相邻矩阵。更新后的相邻矩阵如下:
第4步,更新相似性权重。得mu=0.66。
第5步,循环迭代。由于上次迭代所得的相似性权重为0.66,本次迭代所得的相似性权重也为0.66,所以迭代结束。
第6步,寻找连通分支。按照图的深度优先遍历算法在本例中可得x1、x2、x3、x4属于一个连通分支,而x5、x6属于另一个连通分支,所以将x1、x2、x3、x4划到一个分割块中,而将x5、x6划到另一个分割块中。由于连通分支的个数为2,所以分割块的个数为2。
本发明并不局限于上述实施方式,在不脱离本发明的主要内容的范围内可以进行各种改变和修改,例如可以针对具体应用使用不同的相似度计算方法,或是采用不同的最优化方法等。而对于在相邻矩阵中寻找连通分支的方法也不仅限于使用Tarjan的算法,还可以使用图的广度优先遍历等不同的方法。另外,在本发明中使用的术语,例如相似矩阵、相似性权重、相邻矩阵等并不仅限于一种称呼方法,只要其物理意义与本发明中的概念相同即属于本发明的权利范畴。同样,本发明的流程也不局限于6个步骤,具体流程和步骤可以随着实际应用或实际环境不同而改变。
Claims (7)
1.一种基于相似矩阵逼近的图像分割方法,该方法包括提取相似矩阵的步骤,其接受用户输入的数字图像,并计算相似矩阵,其特征在于,该方法还包括:
获取相邻矩阵的步骤,其根据相似性权重的收敛情况进行循环迭代,最终生成一个与上述相似矩阵最接近的相邻矩阵;以及
寻找连通分支的步骤,其在所得的相邻矩阵上寻找连通分支,并输出对输入数据的最终分割结果,
所述获取相邻矩阵的步骤包括:
运算过程初始化步骤,其根据相似矩阵对相邻矩阵和相似性权重进行初始化;
相邻矩阵的更新步骤,其根据相似矩阵和相似性权重更新相邻矩阵;以及
相似性权重的更新步骤,其根据相似矩阵和相邻矩阵更新相似性权重,
其中,当两次迭代所得的相似性权重相等或算法超过最大迭代次数限制时迭代结束。
2.如权利要求1所述的基于相似矩阵逼近的图像分割方法,其特征在于:在相邻矩阵的更新步骤中,固定相似性权重,利用误差最小化的方法根据相似矩阵和相似性权重来对相邻矩阵进行调整,使得相似矩阵和相邻矩阵之间的误差进一步减小。
3.如权利要求1所述的基于相似矩阵逼近的图像分割方法,其特征在于:在相似性权重的更新步骤中,固定相邻矩阵,利用误差最小化的方法根据相似矩阵和相邻矩阵更新相似性权重。
4.如权利要求1所述的基于相似矩阵逼近的图像分割方法,其特征在于:
相似矩阵S=[s(i,k)]n×n为一个n阶方阵,其中,n表示输入图像中像素点的个数;s(i,k)表示相似矩阵第i行第k列上的元素;s(i,k)反映的是图像中第i个像素xi与第k个像素xk之间的相似度,并且对于任意i,k有s(i,k)≥0,
相邻矩阵E=[e(i,k)]n×n为一个n阶方阵,其中,n为输入图像中像素点的个数,
如果所采用的相似矩阵S=[s(i,k)]n×n不具有对称性,则对所有i,k选择e(i,k)和e(k,i)的较大者构成新的相邻矩阵,再在该矩阵上寻找连通分支,其中,e(i,k)表示相邻矩阵第i行第k列上的元素,e(k,i)表示相邻矩阵第k行第i列上的元素。
5.如权利要求1所述的基于相似矩阵逼近的图像分割方法,其特征在于:按照连通分支规模由大到小的顺序对分割结果进行输出。
6.如权利要求1所述的基于相似矩阵逼近的图像分割方法,其特征在于:所述相似性权重与一控制系数的乘积用于与相似矩阵的各元素进行比较,以进一步对相邻矩阵的各元素进行赋值,该控制系数在0.40~0.60之间。
7.如权利要求6所述的基于相似矩阵逼近的图像分割方法,其特征在于:所述控制系数在0.46~0.51之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810118081XA CN101339615B (zh) | 2008-08-11 | 2008-08-11 | 一种基于相似矩阵逼近的图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810118081XA CN101339615B (zh) | 2008-08-11 | 2008-08-11 | 一种基于相似矩阵逼近的图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101339615A CN101339615A (zh) | 2009-01-07 |
CN101339615B true CN101339615B (zh) | 2011-05-04 |
Family
ID=40213680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810118081XA Expired - Fee Related CN101339615B (zh) | 2008-08-11 | 2008-08-11 | 一种基于相似矩阵逼近的图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101339615B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400143B (zh) * | 2013-07-12 | 2017-03-01 | 中国科学院自动化研究所 | 一种基于多视角的数据子空间聚类方法 |
CN109214428B (zh) * | 2018-08-13 | 2023-12-26 | 平安科技(深圳)有限公司 | 图像分割方法、装置、计算机设备及计算机存储介质 |
CN111383231B (zh) * | 2018-12-28 | 2023-10-27 | 成都皓图智能科技有限责任公司 | 一种基于3d图像的图像分割方法、装置及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1477566A (zh) * | 2003-07-18 | 2004-02-25 | 北京大学计算机科学技术研究所 | 一种对镜头进行基于内容的视频检索的方法 |
CN101059870A (zh) * | 2007-05-23 | 2007-10-24 | 华中科技大学 | 一种基于属性直方图的图像分割方法 |
-
2008
- 2008-08-11 CN CN200810118081XA patent/CN101339615B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1477566A (zh) * | 2003-07-18 | 2004-02-25 | 北京大学计算机科学技术研究所 | 一种对镜头进行基于内容的视频检索的方法 |
CN101059870A (zh) * | 2007-05-23 | 2007-10-24 | 华中科技大学 | 一种基于属性直方图的图像分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101339615A (zh) | 2009-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109284406B (zh) | 基于差异循环神经网络的意图识别方法 | |
CN110175671A (zh) | 神经网络的构建方法、图像处理方法及装置 | |
CN107066555B (zh) | 面向专业领域的在线主题检测方法 | |
JP7417679B2 (ja) | 情報抽出方法、装置、電子機器及び記憶媒体 | |
CN108399268B (zh) | 一种基于博弈论的增量式异构图聚类方法 | |
Seng et al. | Big feature data analytics: Split and combine linear discriminant analysis (SC-LDA) for integration towards decision making analytics | |
CN110297888A (zh) | 一种基于前缀树与循环神经网络的领域分类方法 | |
CN113298009B (zh) | 一种基于熵正则化的自适应近邻人脸图像聚类方法 | |
CN111274422A (zh) | 模型训练方法、图像特征提取方法、装置及电子设备 | |
CN101339615B (zh) | 一种基于相似矩阵逼近的图像分割方法 | |
CN102722578A (zh) | 一种基于拉普拉斯正则化无监督的聚类特征选取方法 | |
CN113822419A (zh) | 一种基于结构信息的自监督图表示学习运行方法 | |
Luqman et al. | Subgraph spotting through explicit graph embedding: An application to content spotting in graphic document images | |
Xie et al. | Hierarchical forest based fast online loop closure for low-latency consistent visual-inertial SLAM | |
CN102289661A (zh) | 一种基于谱匹配的三维网格模型的匹配方法 | |
Li et al. | A distributed meta-learning system for Chinese entity relation extraction | |
CN114140657A (zh) | 一种基于多特征融合的图像检索方法 | |
CN116720519B (zh) | 一种苗医药命名实体识别方法 | |
WO2021059527A1 (ja) | 学習装置、学習方法、及び、記録媒体 | |
CN116628524A (zh) | 一种基于自适应图注意力编码器的社区发现方法 | |
CN111126467A (zh) | 一种基于多目标正余弦算法的遥感影像空谱聚类方法 | |
CN111104508A (zh) | 基于容错粗糙集的词袋模型文本表示方法、系统及介质 | |
CN102663040A (zh) | 基于正负对约束数据的kl距离训练得到属性列权重的方法 | |
Hinton et al. | Using pairs of data-points to define splits for decision trees | |
CN113627485A (zh) | 基于admm的不平衡大数据分布式分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110504 Termination date: 20130811 |