CN112734777B - 一种基于簇形状边界闭包聚类的图像分割方法及系统 - Google Patents

一种基于簇形状边界闭包聚类的图像分割方法及系统 Download PDF

Info

Publication number
CN112734777B
CN112734777B CN202110104475.5A CN202110104475A CN112734777B CN 112734777 B CN112734777 B CN 112734777B CN 202110104475 A CN202110104475 A CN 202110104475A CN 112734777 B CN112734777 B CN 112734777B
Authority
CN
China
Prior art keywords
boundary
point
points
cluster
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110104475.5A
Other languages
English (en)
Other versions
CN112734777A (zh
Inventor
谢海斌
李鹏
庄东晔
丁智勇
彭耀仟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110104475.5A priority Critical patent/CN112734777B/zh
Publication of CN112734777A publication Critical patent/CN112734777A/zh
Application granted granted Critical
Publication of CN112734777B publication Critical patent/CN112734777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于簇形状边界闭包聚类的图像分割方法及系统,该方法步骤包括:S1.输入待分割源图像的原始数据集并消除边缘噪点;S2.对消除边缘噪点后的数据集提取出簇的边界点;S3.根据提取出的簇的边界点使用边界点包围方法形成簇的边界闭包;S4.根据得到的簇的边界闭包的数量确定聚类数,对原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割。本发明具有实现方法简单、分割效率及精度高、分割效果好等优点。

Description

一种基于簇形状边界闭包聚类的图像分割方法及系统
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于簇形状边界闭包聚类的图像分割方法及系统。
背景技术
图像分割是利用图像的灰度、颜色、纹理、形状等特征,把图像分成若干个互不重叠的区域,并使这些特征在同一区域内呈现相似性,在不同的区域之间存在明显的差异性。图像分割技术已广泛应用在各个领域,例如:在机车检验领域,可以应用到轮毂裂纹图像的分割,及时发现裂纹,保证行车安全;在生物医学工程方面,对肝脏CT图像进行分割,可以为临床治疗和病理学研究提供帮助。
图像分割中关键技术即为聚类。针对图像分割,目前主要是采用基于划分法(如K-means算法)和基于密度法(如DBSCAN算法)的两类聚类方法实现聚类,但是该两类聚类方法会存在以下问题:
(1)基于划分法的聚类方法,如K-means算法,通常是使用最小化目标函数的方法确定聚类中心,然后由中心向外扩展实现聚类标签的传递。寻找簇中心在凸数据集中较为方便,而在非凸数据集中则往往很难找到聚类中心,这是由于最小化目标函数的方法通常只能适用于凸数据集。因而如K-means算法,会存在对簇数K敏感、对异常点敏感,且异常点对质心计算影响很大,以及对算法初始时随机选择的初始点敏感等问题。
(2)基于密度法的聚类方法,如DBSCAN算法,由于需要人为设置邻域半径Eps和邻域内样本数MinPts,因而设置该两个参数后相应的会限定样本簇的密度,因而该类聚类方法虽然能够发现具有复杂形状的簇,但对簇的密度较为敏感,如DBSCAN算法对参数MinPts和Eps特别敏感,因而对于密度分布不均的簇聚类效果较差。
综上,在图像分割中采用传统划分聚类方法以及基于密度法的聚类方法,通常都是从数据分布的局部特征出发,由中心向外延伸,这会忽略数据分布的整体特性,影响聚类效果;且传统聚类方法通常需要人为指定聚类簇数,而实际上预先难以知晓样本空间中确切的聚类簇数,这使得在图像分割的聚类过程中非常依赖于先验参数的设置,致使图像分割效果不佳。
发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种实现方法简单、分割效率及精度高、分割效果好的基于簇形状边界闭包聚类的图像分割方法及系统。
为解决上述技术问题,本发明提出的技术方案为:
一种基于簇形状边界闭包聚类的图像分割方法,步骤包括:
S1.边噪点消除:输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
S2.边界点提取:从所述消除边缘噪点后的数据集中提取簇的边界点;
S3.簇边界闭合:根据提取出的所述簇的边界点使用边界点包围方法寻找簇的边界闭包,所述边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
S4.延伸聚类:根据所述簇的边界闭包的数量确定聚类数,对所述原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割。
进一步的,所述边缘噪点的判定步骤为:若对于数据点eni,在以该数据点eni为中心、半径为Crad形成的球域内,除该数据点eni外落入的其他数据点数量小于Cnum,则判定该数据点eni为边缘噪点,其中Cnum为第一预设阈值,Crad为第二预设阈值。
进一步的,所述步骤S1中消除边缘噪点时还包括:获取原始数据集的数据分布图,根据所述数据分布图获取空间中最小簇的直径,根据获取的直径确定第一预设阈值Cnum的值,根据所述第一预设阈值Cnum的值调整第二预设阈值Crad的值。
进一步的,所述步骤S2中提取簇的边界点的步骤包括:
S21.从所述消除边缘噪点后的数据集中取一个数据点qi作为当前数据点,将当前数据点的邻域划分为2f个象限,f为当前数据点的特征数,并使用二值编码依次对应各象限,定义矩阵
Figure BDA0002916807570000021
的2f个位置以用于统计对应象限中包含邻域点的个数;
S22.将当前数据点依次与邻域点对应的特征维相减,得到所有邻域点的编码;
S23.根据步骤S22得到的编码与象限的对应关系统计每个象限包含的邻域点数,并修改所述矩阵S中对应位置的计数值;
S24.判断所述矩阵S中计数值的状态,如果所述矩阵S中存在计数值为0的情况,则将当前数据点判定为边界点;
S25.遍历当前数据集中所有数据点后,最终得到边界点集合。
进一步的,所述步骤S3中使用边界点包围方法寻找簇的边界闭包时,先在边界点集合中随机选取一个点作为起始点,以所述起始点开始在所述边界点集合中不断寻找与当前点距离最近的边界点作为过程点,直至寻找回到所述起始点,最终形成所述簇的边界闭包。
进一步的,所述使用边界点包围方法寻找簇的边界闭包的步骤包括:
S31.随机选取一个边界点作为起始点并进行标记;
S32.在所述边界点集合中寻找与所述起始点距离最近的边界点;
S33.将当前寻找到的边界点作为当前过程点,寻找下一个与当前过程点距离最近的边界点;
S34.判断寻找到的边界点是否为所述起始点,如果是则完成寻找所述簇的边界闭包,否则返回步骤S33。
进一步的,所述步骤S4中,对所述原始数据集中所有非边界点按照最近邻原则由边界向中心实现延伸聚类。
进一步的,所述步骤S3中寻找簇的边界闭包过程中为各边界点按照所属的簇设置对应的簇标记,所述步骤S4中按照最近邻原则由边界向中心实现延伸聚类的步骤包括:获取所述原始数据集中各非边界点与所有邻居点之间的距离并进行排序,得到最近邻表;对各非边界点所属的簇进行判别,判别时分别按照距离从小到大的排序依次获取所述最近邻表中各邻居点进行判断,如果存在目的邻居点具有簇标记,则对当前非边界点使用目的邻居点对应的簇标记进行标记,直至所有非边界点均具有簇标记,完成所述延伸聚类。
一种基于簇形状边界闭包聚类的图像分割系统,包括:
边噪点消除模块,用于输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
边界点提取模块,用于从所述消除边缘噪点后的数据集中提取簇的边界点;
簇边界闭合模块,用于根据提取出的所述簇的边界点使用边界点包围方法寻找簇的边界闭包,所述边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
延伸聚类模块,用于根据所述簇的边界闭包的数量确定聚类数,对所述原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割。
一种基于簇形状边界闭包聚类的图像分割系统,包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,所述处理器用于执行所述计算机程序,以执行上述方法。
与现有技术相比,本发明的优点在于:
1、本发明从数据分布的全局角度出发,通过先寻找出簇的边界点,使用边界点包围方法从起始点开始不断寻找过程点直至达到终端,对提取到的边界点进行闭合,得到边界闭包,进而根据边界闭包的数量确定簇的数量,由边界闭包向中心延伸的方法实现聚类,能够大大降低聚类过程中对于簇形状的依赖性,不仅能根据边界闭包数自动确定聚类簇数与分类判别边界,而且能够识别具有复杂形状的簇,对于密度分布不均的簇也能取得很好的聚类效果,从而可以实现更加合理的聚类,有效提高图像分割效果。
2、本发明通过寻找簇边界的方式实现聚类,不受原始数据集形状的限制,可以适应各种具有复杂形状的簇,解决了传统图像分割中聚类时仅适用于凸数据集的问题,在聚类过程中能够很好的根据像素间的相似度实施聚类,识别图像中有像素组成的非凸簇。
3、本发明在图像分割过程中,通过寻找簇边界可以把握图像数据集的全局特征,不存在对簇密度的敏感,可以解决传统图像分割中对密度分布不均的簇聚类效果较差的问题。
4、本发明确定边界闭包之后,就能根据边界闭包的数量确定簇的数量,因而无需设置聚类簇数,在图像分割的聚类过程中无需依赖于先验参数的设置。
附图说明
图1是本实施例基于簇形状边界闭包聚类的图像分割方法的实现流程示意图。
图2是形状边界的原理示意图。
图3是本实施采用的边界闭包形成原理示意图。
图4是本实施例中实现边界点包围的实现流程示意图。
图5是在具体应用实施例中得到的聚类结果示意图。
具体实施方式
以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。
本实施例在图像分割过程中,使用基于簇形状边界闭包的延伸聚类(ExtendedClustering Algorithm Based on Cluster Shape Boundary,ECBSB)方法实现聚类,主要思想是在图像分割过程中,通过寻找簇形状边界把握数据集中数据点的整体分布格局,将簇边界封闭区域内的样本聚为一类,而非基于样本密度或依距离远近进行聚类,从而可以实现更加合理的聚类,提高图像分割效果。
如图1所示,本实施例基于簇形状边界闭包聚类的图像分割方法的具体步骤包括:
S1.边噪点消除:输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
S2.边界点提取:从消除边缘噪点后的数据集中提取簇的边界点;
S3.簇边界闭合:根据提取出的簇的边界点使用边界点包围方法寻找簇的边界闭包,边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
S4.延伸聚类:根据簇的边界闭包的数量确定聚类数,对原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割。
本实施例从数据分布的全局角度出发,通过先寻找出簇的边界点,使用边界点包围方法从起始点开始不断寻找过程点直至达到终端,对提取到的边界点进行闭合,得到边界闭包,进而根据边界闭包的数量确定簇的数量,由边界闭包向中心延伸的方法实现聚类,能够大大降低聚类过程中对于簇形状的依赖性,不仅能根据边界闭包数自动确定聚类簇数与分类判别边界,而且能够识别具有复杂形状的簇,对于密度分布不均的簇也能取得很好的聚类效果,从而有效提高图像分割效果。
在图像分割中,各个像素的类别组成往往是非凸的,通过寻找簇中心来确定簇的传统方法仅适用于凸数据集。本实施例通过寻找簇边界的方式实现聚类,不受原始数据集形状的限制,可以适应各种具有复杂形状的簇,解决了传统图像分割中聚类时仅适用于凸数据集的问题,在聚类过程中能够很好的根据像素间的相似度实施聚类,识别图像中有像素组成的非凸簇。
本实施例首先分析数据点的整体分布格局对于聚类效果的影响:
例如对于图2,其中图2(a)为样本集,图2(b)为依全局分布特点将样本集。对图2(a)的样本集进行分类时,直观上会把那些从整体上看来聚合为一个连通形状的数据点分为一类,而不会根据局部区域内点的疏密、远近程度来决定聚类结果。进一步分析图2(b)中A、B、C三个点的聚类问题:若按照距离远近聚类,C点距离A点更近,所以C与A聚为一类;若按照疏密程度聚类,A点与C点均处于簇形状的边缘区域,仅依据密度还不能将A点与B点聚为一类。但点A和点B在样本集的整体分布上同属于形状区域Area_1中,因此聚为一类更为合理。虽然点C距离区域Area_1中A点的距离比B点到A点近,但由于点C在样本全局分布上位于形状区域Area_2中,因此不会根据局部分布特点把点C划分到区域Area_1中。
由上述分析可知,数据点的整体分布格局会直接影响聚类效果,传统仅从数据分布的局部特征出发极易产生不合理的聚类。本实施例在图像分割过程中,通过寻找簇形状边界把握数据集中数据点的整体分布格局,将簇边界封闭区域内的样本聚为一类,而非基于样本密度或依距离远近进行聚类,可以实现更加合理的聚类,提高图像分割效果。
本实施例在图像分割过程中,首先通过在原始数据集中确定并消去边缘噪点,凸出簇的形状边界,降低簇之间的互连性,在消去边缘噪点后的数据集中,找出簇的边界点;对边界点使用边界点包围方法,形成簇的边界闭包,根据闭包数自动确定聚类数;最后对原始数据集中非边界点使用最近邻原则进行聚类。
本实施例中先对原始数据集进行去除边缘噪点处理,边缘噪点判定方法为:在数据集中若对于数据点eni,在以该数据点eni为中心、半径为Crad形成的球域内,除该数据点eni外落入的其他数据点数量小于Cnum,则判定数据点eni为边缘噪点,Cnum为第一预设阈值,Crad为第二预设阈值,即边缘噪点eni为满足eni-num<Cnum的数据点,其中eni-num表示在数据点eni的邻域Nei(eni,Crad)中点dsk的个数。通过确定边缘噪点,在原始数据集中消去边缘噪点,消去后簇之间的互连性变低,可以凸出簇的形状边界,以便于更好的识别边界点。
在具体应用实施例中,边缘噪点定义为:
样本集中满足下列条件的点eni:(1)eni∈DS;(2)eni-num<Cnum,判定为边缘噪点并予以剔除,其中eni-num表示在邻域Nei(eni,Crad)中点dsk的个数,边缘噪点集合表示为C={en1,…,enc|eni∈DS,eni-num<Cnum,i=(1,…,c)},其中c为边缘噪点数。
上述引入参数Crad和Cnum是通过计数的方法确定并消去边缘噪点,但是不易于通过直接计算确定该两个参数。本实施例采用交互式方法确定上述Crad和Cnum的值,以及通过图形表示来调整该两个参数,具体步骤为:获取原始数据集的数据分布图,根据所述数据分布图获取空间中最小簇的直径,根据获取的直径确定第一预设阈值Cnum的值,根据所述第一预设阈值Cnum的值调整第二预设阈值Crad的值。只要确定的边缘噪点消去后能够降低簇之间的互连性并凸出簇的形状边界,即表明当前选取的参数即是合理的。在具体应用实施例中,可简单的观察空间中较小的簇的大致直径,Crad取该直径的1/4即可。
本实施例步骤S2中提取簇的边界点的步骤包括:
S21.从所述消除边缘噪点后的数据集中取一个数据点作为当前数据点,将当前数据点的邻域划分为2f个象限,f为当前数据点的特征数,并使用二值编码依次对应各象限,定义矩阵
Figure BDA0002916807570000061
的2f个位置以用于统计对应象限中包含邻域点的个数;
S22.将当前数据点依次与邻域点对应的特征维相减,得到所有邻域点的编码;
S23.根据步骤S22得到的编码与象限的对应关系统计每个象限包含的邻域点数,并修改矩阵S中对应位置的计数值;
S24.判断所述矩阵S中计数值的状态,如果矩阵S中存在计数值为0的情况,则将当前数据点判定为边界点;
S25.遍历当前数据集中所有数据点后,最终得到边界点集合。
在具体应用实施例中,提取边界点时,先将数据集DS-C中点qi的邻域Nei(qi,Crad)划分为2f个象限,对于点qi,若存在f个特征,则相应的可以以该点为中心划分为2f个象限;用二值编码
Figure BDA0002916807570000062
依次对应第1、2、…、2f象限(编码值中1代表qi与邻域点对应特征维的差值为正,0代表差值为负),用矩阵
Figure BDA0002916807570000063
的2f个位置统计对应象限中包含邻域点的个数;将qi依次与其邻域点对应的特征维相减,得到所有邻域点的编码;然后根据编码与象限的对应关系统计每个象限包含的邻域点数,并修改S中的计数值,如果样本点qi的S矩阵中存在计数值为0的情况,则将qi判定为边界点,得到边界点集合Q={q1,q2,q3...qn|qi∈DS-C},其中n为边界点个数。
以二维空间样本为例,将第1、2、3、4象限依次用编码00,01,10,11表示,其中第一象限编码00表示qi-qk的两个特征维度差值均为正,即当qk的编码为00时,将它归入qi的第一象限中,同时将qi对应S矩阵中第一个位置的计数值修改为1,变为S=[1,0,0,0]1×4
本实施例骤S3中使用边界点包围方法寻找簇的边界闭包时,先在边界点集合中随机选取一个点作为起始点,以起始点开始在所述边界点集合中不断寻找与当前点距离最近的边界点作为过程点,直至寻找回到所述起始点,最终形成所述簇的边界闭包。
在具体应用实施例中,在寻找簇的边界闭包过程中使用簇标记代表所属簇的类别,使用连接标记对边界包围过程中每个点进行标记。随机选取起始点后,起始点的簇标记为随机选取点对应的下标k,连接标记记为1。起始点是边界闭包的起点和终点。起点和终点之间连接的所有点均视为过程点。过程点的簇标记等于起始点的簇标记,连接标记为-1。
本实施例上述使用边界点包围方法寻找簇的边界闭包的具体步骤包括:
S31.随机选取一个边界点作为起始点并进行标记;
S32.在所述边界点集合中寻找与所述起始点距离最近的边界点;
S33.将当前寻找到的边界点作为当前过程点,寻找下一个与当前过程点距离最近的边界点;
S34.判断寻找到的边界点是否为所述起始点,如果是则完成寻找所述簇的边界闭包,否则返回步骤S33。
本实施例步骤S4中,对原始数据集中所有非边界点按照最近邻原则由边界向中心实现延伸聚类。本实施例在步骤S3中寻找簇的边界闭包过程中为各边界点按照所属的簇设置对应的簇标记,上述按照最近邻原则由边界向中心实现延伸聚类的步骤包括:获取原始数据集中各非边界点与所有邻居点之间的距离并进行排序,得到最近邻表;对各非边界点所属的簇进行判别,判别时分别按照距离从小到大的排序依次获取最近邻表中各邻居点进行判断,如果存在目的邻居点具有簇标记,则对当前非边界点使用目的邻居点对应的簇标记进行标记,直至所有非边界点均具有簇标记,完成延伸聚类。
在具体应用实施例中,对所有的边界点进行簇标记后,将所有带簇标记的边界点放回到原始数据集中,对所有非边界点依据最近邻原则由边界向中心实现延伸聚类,具体把非边界点距离其他点的距离进行排序,得到最近邻表,先检查非边界点的最近距离A(1)列邻居点的簇标记是否为0,如果不为0,则将对应行的非边界点的簇标记变为该邻居点的簇标记;然后依次判断后续A(2)、A(3)…A(N-1)列邻居点的簇标记,直到所有非边界点的簇标记均不为0。
本实施例上述方法,通过寻找簇形状边界闭包确定簇数,不用通过大量迭代优化找到簇的中心点,只需要根据相关方法找到边界点并将其连接为边界闭包即可,然后再根据簇边界形状闭包的数量确定簇的数量,不用人为设定聚类簇数,对样本集中的簇的密度分布不敏感,而且能够识别具有复杂形状的簇,同时由于是从样本集中样本分布的全局角度出发,用户可以采用交互式方法,通过图形表示来调整这两个参数,可以方便的进行参数调整。
以下以在具体应用实施例中使用本发明上述方法实现图像分割为例,对本发明进行进一步说明。
本实施例首先进行如下定义:
在样本空间D中,样本集DS由N个样本点组成,假设样本点具有f维特征,表示为dsi=(dsi1,dsi2,…,dsif)∈DS,(i=1,…,N)。定义点dsi的邻域Nei(dsi,M)={dist(dsi,dsk)≤M|dsk∈DS},其中dist(dsi,dsk)代表点dsi和点dsk之间的欧式距离,M为邻域半径。
定义1:边缘噪点。样本集中满足下列条件的点eni:(1)eni∈DS;(2)eni-num<Cnum,判定为边缘噪点并予以剔除,其中eni-num表示在邻域Nei(eni,Crad)中点dsk的个数,边缘噪点集合表示为C={en1,…,enc|eni∈DS,eni-num<Cnum,i=(1,…,c)},其中c为边缘噪点数。
定义2:边界点。将样本集DS-C中点qi的邻域Nei(qi,Crad)划分为2f个象限,用二值编码
Figure BDA0002916807570000081
依次对应第1、2、…、2f象限(编码值中1代表qi与邻域点对应特征维的差值为正,0代表差值为负),用矩阵
Figure BDA0002916807570000082
的2f个位置统计对应象限中包含邻域点的个数。将qi依次与其邻域点对应的特征维相减,得到所有邻域点的编码。然后根据编码与象限的对应关系统计每个象限包含的邻域点数,并修改S中的计数值。如果样本点qi的S矩阵中存在计数值为0的情况,则将qi判定为边界点。边界点集合表示为Q={q1,q2,q3...qn|qi∈DS-C},其中n为边界点个数。以二维空间样本为例,将第1、2、3、4象限依次用编码00,01,10,11表示,其中第一象限编码00表示qi-qk的两个特征维度差值均为正,即当qk的编码为00时,将它归入qi的第一象限中,同时将qi对应S矩阵中第一个位置的计数值修改为1,变为S=[1,0,0,0]1×4
定义3:标记。标记分为簇标记和连接标记,采用数组Label=[Cluster-label,Link-label]表示。簇标记代表所属簇的类别。连接标记是边界包围算法中对每个点的标记,该值为真表示已被连接,反之则表示未被连接。样本点Label的初始值均为[0,FALSE]。
定义4:起始点、过程点。起始点qk∈Q,(1<k<n)是在Label为[0,FALSE]的边界点中随机选取。起始点的簇标记为随机选取点对应的下标k,连接标记记为1。起始点是边界闭包的起点和终点。起点和终点之间连接的所有点均视为过程点。过程点的簇标记等于起始点的簇标记,连接标记为-1。
以图3为例,图中A、B、C、D均为边界点,初始时各点的标记均为[0,0]。随机选取A点为起始点,即A的标记变为[Order-A,1]。在边界点集合{A,B,C,D}中,标记为[0,0]且距离A点最近的是B点,所以B点的标记变为[Order-A,-1]。同理,C、D标记变为[Order-A,-1]。距离D点最近的是A点,但由于A的连接标记为1,A点作为终点形成边界闭包,簇标记为Order-A的点聚成一类。
本实施例使用如下ECBSB算法实现聚类。
Figure BDA0002916807570000091
本实施例实现图像分割的详细流程为:
步骤S1:确定并消去边缘噪点
根据定义1确定边缘噪点,然后在原始数据集中消去边缘噪点,消去后簇之间的互连性变低,以使得凸出簇的形状边界,更好的识别出边界点。其中对于引入的参数Crad和Cnum,采用交互式方法,通过图形表示来调整这两个参数,即首先通过原始数据分布图,观察空间中较小的簇的大致直径,Crad取该直径的1/4,然后再调整参数Cnum;若确定的边缘噪点消去后降低了簇之间的互连性并凸出了簇的形状边界,则表明当前选取的参数是合理的。
步骤S2:提取边界点
根据定义2确定边界点。
步骤S3:闭合簇边界
本实施例通过配置边界点包围算法以找到边界闭包数从而确定聚类数。边界点包围算法如下所示,即为从起始点开始寻找过程点,最终达到终点形成闭包的过程。
Figure BDA0002916807570000101
如图4所示,上述边界点包围算法具体是首先在边界点集合中随机选取标记为[0,0]的点作为起始点,然后通过递归函数Recursive寻找过程点,寻找的过程点即为与当前点距离最近的点,然后搜索下一个过程点,直至有达到起始点,最终形成簇的边界闭包;边界点根据自己所在闭包及闭包数量确定边界点的簇标记。
步骤S4:聚类
经过步骤S3后,所有的边界点都有了对应的簇标记,步骤S4则将所有带簇标记的边界点放回到原始数据集DS中,对所有非边界点(即DS-B集合中的点)依据最近邻原则由边界向中心实现延伸聚类。
首先把非边界点距离其他邻居点的距离进行排序,得到如表1的最近邻表,其中n为边界点数,N为原始数据集点数,N-n表示非边界点的个数。
表1:最近邻表
Figure BDA0002916807570000102
上述表中A(1)列代表距离非边界点最近的点,A(N-1)列为距离最远的点。
首先检查非边界点的A(1)列邻居点的簇标记是否为0,如果不为0,则将对应行的非边界点的簇标记变为该邻居点的簇标记。例如当A(1)列的点P2_1簇标记为k≠0,则将点Point2的簇标记变为k,然后依次判断A(2)、A(3)…A(N-1)列邻居点的簇标记,直到所有非边界点的簇标记均不为0,根据聚类结果实现对待分割源图像的分割。
上述步骤S1中在消除边缘噪点时采用邻域法,步骤S2中采用象限法确定边界点,可以理解的是还可以采用其他方法实现,例如向量法等。
为验证本发明上述方法的有效性,在具体应用实施例中采用上述方法在图像分割中进行聚类,得到的具体结果如图5所示,其中图5(a)为原始数据集,图5(b)中“*”标记的样本为步骤1中确定的边缘噪点,图5(c)为消去边缘噪点后的样本集,图5(d)为在消去边缘噪点的样本集中根据步骤2确定的边界点,其中标记为“o”的表示边界点,图5(e)为边界点连接算法形成簇标记形状闭包,图5(f)为最终聚类效果。从图中可以看出,采用本发明方法,能够在图像分割中实现合理、准确的聚类,而不受原始数据集形状的限制。
本实施例基于簇形状边界闭包聚类的图像分割系统,包括:
边噪点消除模块,用于输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
边界点提取模块,用于从所述消除边缘噪点后的数据集中提取簇的边界点;
簇边界闭合模块,用于根据提取出的所述簇的边界点使用边界点包围方法寻找簇的边界闭包,所述边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
延伸聚类模块,用于根据所述簇的边界闭包的数量确定聚类数,对所述原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割。
本实施例中,边界点提取模块包括:
第一单元,用于从消除边缘噪点后的数据集中取一个数据点qi作为当前数据点,将当前数据点的邻域划分为2f个象限,并使用二值编码依次对应各象限,定义矩阵
Figure BDA0002916807570000111
的2f个位置以用于统计对应象限中包含邻域点的个数;
第二单元,用于将当前数据点依次与邻域点对应的特征维相减,得到所有邻域点的编码;
第三单元,用于根据第二单元得到的编码与象限的对应关系统计每个象限包含的邻域点数,并修改所述矩阵S中对应位置的计数值;
第四单元,用于判断矩阵S中计数值的状态,如果所述矩阵S中存在计数值为0的情况,则将当前数据点判定为边界点;
第五单元,用于遍历当前数据集中所有数据点后,最终得到边界点集合。
本实施例中,簇边界闭合模块具体使用边界点包围方法寻找簇的边界闭包时,先在边界点集合中随机选取一个点作为起始点,以起始点开始在所述边界点集合中不断寻找与当前点距离最近的边界点作为过程点,直至寻找回到起始点,最终形成簇的边界闭包。
本实施例中,簇边界闭合模块包括:
选取单元,用于随机选取一个边界点作为起始点并进行标记;
第一寻找单元,用于在边界点集合中寻找与起始点距离最近的边界点;
第二寻找单元,用于将当前寻找到的边界点作为当前过程点,寻找下一个与当前过程点距离最近的边界点;
判断单元,用于判断寻找到的边界点是否为起始点,如果是则完成寻找所述簇的边界闭包,否则返回第二寻找单元。
本实施例中,延伸聚类模块中对原始数据集中所有非边界点按照最近邻原则由边界向中心实现延伸聚类。
本实施例基于簇形状边界闭包聚类的图像分割系统与上述基于簇形状边界闭包聚类的图像分割方法为一一对应,在此不再一一赘述。
在其他实施例中,本发明基于簇形状边界闭包聚类的图像分割系统还可以为:包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,所述处理器用于执行所述计算机程序,以执行上述基于簇形状边界闭包聚类的图像分割方法。
上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。

Claims (8)

1.一种基于簇形状边界闭包聚类的图像分割方法,其特征在于,步骤包括:
S1.边噪点消除:输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
S2.边界点提取:从所述消除边缘噪点后的数据集中提取簇的边界点;
S3.簇边界闭合:根据提取出的所述簇的边界点使用边界点包围方法寻找簇的边界闭包,所述边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
S4.延伸聚类:根据所述簇的边界闭包的数量确定聚类数,对所述原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割;
所述步骤S2中提取簇的边界点的步骤包括:
S21.从所述消除边缘噪点后的数据集中取一个数据点qi作为当前数据点,将当前数据点的邻域划分为2f个象限,f为当前数据点的特征数,并使用二值编码依次对应各象限,定义矩阵
Figure FDA0003763399710000011
的2f个位置以用于统计对应象限中包含邻域点的个数;
S22.将当前数据点依次与邻域点对应的特征维相减,得到所有邻域点的编码;
S23.根据步骤S22得到的编码与象限的对应关系统计每个象限包含的邻域点数,并修改所述矩阵S中对应位置的计数值;
S24.判断所述矩阵S中计数值的状态,如果所述矩阵S中存在计数值为0的情况,则将当前数据点判定为边界点;
S25.遍历当前数据集中所有数据点后,最终得到边界点集合;
所述步骤S3中使用边界点包围方法寻找簇的边界闭包时,先在边界点集合中随机选取一个点作为起始点,以所述起始点开始在所述边界点集合中不断寻找与当前点距离最近的边界点作为过程点,直至寻找回到所述起始点,最终形成所述簇的边界闭包。
2.根据权利要求1所述的基于簇形状边界闭包聚类的图像分割方法,其特征在于:所述边缘噪点的判定步骤为:若对于数据点eni,在以该数据点eni为中心、半径为Crad形成的球域内,除该数据点eni外落入的其他数据点数量小于Cnum,则判定该数据点eni为边缘噪点,其中Cnum为第一预设阈值,Crad为第二预设阈值。
3.根据权利要求2所述的基于簇形状边界闭包聚类的图像分割方法,其特征在于:所述步骤S1中消除边缘噪点时还包括:获取原始数据集的数据分布图,根据所述数据分布图获取空间中最小簇的直径,根据获取的直径确定第一预设阈值Cnum的值,根据所述第一预设阈值Cnum的值调整第二预设阈值Crad的值。
4.根据权利要求1所述的基于簇形状边界闭包聚类的图像分割方法,其特征在于,所述使用边界点包围方法寻找簇的边界闭包的步骤包括:
S31.随机选取一个边界点作为起始点并进行标记;
S32.在所述边界点集合中寻找与所述起始点距离最近的边界点;
S33.将当前寻找到的边界点作为当前过程点,寻找下一个与当前过程点距离最近的边界点;
S34.判断寻找到的边界点是否为所述起始点,如果是则完成寻找所述簇的边界闭包,否则返回步骤S33。
5.根据权利要求1~4中任意一项所述的基于簇形状边界闭包聚类的图像分割方法,其特征在于,所述步骤S4中,对所述原始数据集中所有非边界点按照最近邻原则由边界向中心实现延伸聚类。
6.根据权利要求5所述的基于簇形状边界闭包聚类的图像分割方法,其特征在于,所述步骤S3中寻找簇的边界闭包过程中为各边界点按照所属的簇设置对应的簇标记,所述步骤S4中按照最近邻原则由边界向中心实现延伸聚类的步骤包括:获取所述原始数据集中各非边界点与所有邻居点之间的距离并进行排序,得到最近邻表;对各非边界点所属的簇进行判别,判别时分别按照距离从小到大的排序依次获取所述最近邻表中各邻居点进行判断,如果存在目的邻居点具有簇标记,则对当前非边界点使用目的邻居点对应的簇标记进行标记,直至所有非边界点均具有簇标记,完成所述延伸聚类。
7.一种基于簇形状边界闭包聚类的图像分割系统,其特征在于,包括:
边噪点消除模块,用于输入待分割源图像的原始数据集并消除边缘噪点,得到消除边缘噪点后的数据集;
边界点提取模块,用于从所述消除边缘噪点后的数据集中提取簇的边界点;
簇边界闭合模块,用于根据提取出的所述簇的边界点使用边界点包围方法寻找簇的边界闭包,所述边界点包围方法通过从起始点开始寻找过程点,最终达到终点形成闭包;
延伸聚类模块,用于根据所述簇的边界闭包的数量确定聚类数,对所述原始数据集中非边界点由边界向中心进行延伸聚类,根据聚类结果实现对待分割源图像的分割;
所述边界点提取模块中提取簇的边界点包括:
第一单元,用于从所述消除边缘噪点后的数据集中取一个数据点qi作为当前数据点,将当前数据点的邻域划分为2f个象限,f为当前数据点的特征数,并使用二值编码依次对应各象限,定义矩阵
Figure FDA0003763399710000031
的2f个位置以用于统计对应象限中包含邻域点的个数;
第二单元,用于将当前数据点依次与邻域点对应的特征维相减,得到所有邻域点的编码;
第三单元,用于根据第二单元得到的编码与象限的对应关系统计每个象限包含的邻域点数,并修改所述矩阵S中对应位置的计数值;
第四单元,用于判断所述矩阵S中计数值的状态,如果所述矩阵S中存在计数值为0的情况,则将当前数据点判定为边界点;
第五单元,用于遍历当前数据集中所有数据点后,最终得到边界点集合;
所述簇边界闭合模块中使用边界点包围方法寻找簇的边界闭包时,先在边界点集合中随机选取一个点作为起始点,以所述起始点开始在所述边界点集合中不断寻找与当前点距离最近的边界点作为过程点,直至寻找回到所述起始点,最终形成所述簇的边界闭包。
8.一种基于簇形状边界闭包聚类的图像分割系统,包括处理器以及存储器,所述存储器用于存储计算机程序,其特征在于,所述处理器用于执行所述计算机程序,以实现如权利要求1~6中任意一项所述方法。
CN202110104475.5A 2021-01-26 2021-01-26 一种基于簇形状边界闭包聚类的图像分割方法及系统 Active CN112734777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110104475.5A CN112734777B (zh) 2021-01-26 2021-01-26 一种基于簇形状边界闭包聚类的图像分割方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110104475.5A CN112734777B (zh) 2021-01-26 2021-01-26 一种基于簇形状边界闭包聚类的图像分割方法及系统

Publications (2)

Publication Number Publication Date
CN112734777A CN112734777A (zh) 2021-04-30
CN112734777B true CN112734777B (zh) 2022-10-11

Family

ID=75593644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110104475.5A Active CN112734777B (zh) 2021-01-26 2021-01-26 一种基于簇形状边界闭包聚类的图像分割方法及系统

Country Status (1)

Country Link
CN (1) CN112734777B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447076A (zh) * 2008-12-02 2009-06-03 浙江大学 一种web图像中感兴趣区域的分割方法
CN106326923A (zh) * 2016-08-23 2017-01-11 福州大学 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN107302457A (zh) * 2017-06-22 2017-10-27 重庆邮电大学 一种基于矩形区域的仿真空间分割方法
CN108520023A (zh) * 2018-03-22 2018-09-11 合肥佳讯科技有限公司 一种基于混合聚类算法的雷暴核识别及追踪方法
CN110929758A (zh) * 2019-10-24 2020-03-27 河海大学 一种面向复杂数据的快速搜索和寻找密度峰值的聚类算法
WO2020154967A1 (en) * 2019-01-30 2020-08-06 Baidu.Com Times Technology (Beijing) Co., Ltd. Map partition system for autonomous vehicles
CN111507415A (zh) * 2020-04-21 2020-08-07 南京信息工程大学 一种基于分布密度的多源大气数据聚类方法
CN111598125A (zh) * 2020-04-08 2020-08-28 中科曙光国际信息产业有限公司 数据聚簇方法、装置和计算机设备
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010011785A1 (en) * 2008-07-23 2010-01-28 Indiana University Research & Technology Corporation System and method for a non-cooperative iris image acquisition system
CN105005997B (zh) * 2015-08-05 2017-11-14 哈尔滨工业大学 一种基于行列直线聚类的多类型bga芯片视觉识别方法
CN110210517A (zh) * 2019-05-08 2019-09-06 桂林理工大学 一种基于密度的多层分步聚类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447076A (zh) * 2008-12-02 2009-06-03 浙江大学 一种web图像中感兴趣区域的分割方法
CN106326923A (zh) * 2016-08-23 2017-01-11 福州大学 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN107302457A (zh) * 2017-06-22 2017-10-27 重庆邮电大学 一种基于矩形区域的仿真空间分割方法
CN108520023A (zh) * 2018-03-22 2018-09-11 合肥佳讯科技有限公司 一种基于混合聚类算法的雷暴核识别及追踪方法
WO2020154967A1 (en) * 2019-01-30 2020-08-06 Baidu.Com Times Technology (Beijing) Co., Ltd. Map partition system for autonomous vehicles
CN110929758A (zh) * 2019-10-24 2020-03-27 河海大学 一种面向复杂数据的快速搜索和寻找密度峰值的聚类算法
CN111598125A (zh) * 2020-04-08 2020-08-28 中科曙光国际信息产业有限公司 数据聚簇方法、装置和计算机设备
CN111507415A (zh) * 2020-04-21 2020-08-07 南京信息工程大学 一种基于分布密度的多源大气数据聚类方法
CN111950632A (zh) * 2020-08-12 2020-11-17 贝壳技术有限公司 用于实现聚类的方法、装置、介质以及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
【机器学习】(十九)聚类:k均值聚类、凝聚聚类、DBSCAN,算法评估;王亿亿;《https://blog.csdn.net/weixin_43931465/article/details/107598647》;20200726;全文 *
Fast approximate k-means via cluster closures;Jing Wang;《2012 IEEE Conference on Computer Vision and Pattern Recognition》;20120726;全文 *
一种改进的支持向量聚类算法的设计与实现;程丽;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20120831(第8期);全文 *

Also Published As

Publication number Publication date
CN112734777A (zh) 2021-04-30

Similar Documents

Publication Publication Date Title
CN107633226B (zh) 一种人体动作跟踪特征处理方法
CN107145829B (zh) 一种融合纹理特征和尺度不变特征的掌静脉识别方法
CN109977997B (zh) 基于卷积神经网络快速鲁棒的图像目标检测与分割方法
CN111310662B (zh) 一种基于集成深度网络的火焰检测识别方法及系统
CN107123130B (zh) 一种基于超像素和混合哈希的核相关滤波目标跟踪方法
CN104850822B (zh) 基于多特征融合的简单背景下的叶片识别方法
CN106874942B (zh) 一种基于正则表达式语义的目标模型快速构建方法
CN114492619B (zh) 一种基于统计和凹凸性的点云数据集构建方法及装置
CN113850281A (zh) 一种基于meanshift优化的数据处理方法和装置
CN112949454B (zh) 一种基于小样本学习的虹膜识别方法
CN110852388A (zh) 基于K-means改进的SMOTE算法
CN111753119A (zh) 一种图像搜索方法、装置、电子设备及存储介质
Du et al. Salient object detection via random forest
CN108537832B (zh) 基于局部不变灰度特征的图像配准方法、图像处理系统
CN114358166B (zh) 一种基于自适应k均值聚类的多目标定位方法
CN112991536A (zh) 一种专题地图地理面要素自动提取和矢量化方法
CN117495891B (zh) 点云边缘检测方法、装置和电子设备
Yin et al. A real-time memory updating strategy for unsupervised person re-identification
CN108846845B (zh) 基于缩略图与分层模糊聚类的sar图像分割方法
CN112926592B (zh) 一种基于改进Fast算法的商标检索方法及装置
CN107564008A (zh) 基于关键像素模糊聚类的快速sar图像分割方法
CN114359632A (zh) 一种基于改进PointNet++神经网络的点云目标分类方法
CN112381844B (zh) 基于图像分块的自适应orb特征提取方法
CN111814801B (zh) 一种机械图中标注串的提取方法
CN112734777B (zh) 一种基于簇形状边界闭包聚类的图像分割方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant