CN1313964C - 基于聚类学习器集成的数字图像分割方法 - Google Patents
基于聚类学习器集成的数字图像分割方法 Download PDFInfo
- Publication number
- CN1313964C CN1313964C CNB200410041172XA CN200410041172A CN1313964C CN 1313964 C CN1313964 C CN 1313964C CN B200410041172X A CNB200410041172X A CN B200410041172XA CN 200410041172 A CN200410041172 A CN 200410041172A CN 1313964 C CN1313964 C CN 1313964C
- Authority
- CN
- China
- Prior art keywords
- learning device
- clustering learning
- pixel
- clustering
- control variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 230000010354 integration Effects 0.000 title abstract 2
- 239000013598 vector Substances 0.000 claims abstract description 28
- 238000003709 image segmentation Methods 0.000 claims abstract description 4
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于聚类学习器集成的数字图像分割方法,该方法包括以下步骤:将图像转化为像素向量集合;利用像素向量集合训练出多个聚类学习器;将各聚类学习器的聚类结果进行结合以产生粗分割结果;去除粗分割结果中的孤立点;将像素数少的小区域并入其最大邻域;将RGB均值小的区域并入其最近邻域;结束。本发明的显著优点是利用多个聚类学习器提高了数字图像分割的精度,并辅助提高了数字图像处理装置在进行数字图像分割时的性能。
Description
一、技术领域
本发明涉及数字图像处理装置,特别涉及一种基于聚类学习器集成技术的数字图像分割方法。
二、背景技术
随着数字图像设备例如数码相机等的普及,数字图像已经在各行各业得到了广泛应用。为了有效提取和利用数字图像中包含的信息,需要对图像进行分割。图像分割是指将图像中具有不同语义的区域分割开,这些区域互不相交,每个区域都满足一致性。有效的数字图像分割技术将为进一步的数字图像检索、识别等奠定基础。聚类学习器是经典的机器学习技术,目前基于聚类学习器的数字图像分割技术都只利用了一个聚类学习器,分割效果有待进一步提高。
三、发明内容
本发明的目的是提供一种利用多个聚类学习器、提高分割精度的数字图像分割方法,以辅助提高数字图像处理装置在进行数字图像分割时的性能。
为实现本发明所述目的,本发明所述的基于聚类学习器集成的数字图像分割方法,包括以下步骤:1、将图像转化为像素向量集合;2、利用像素向量集合训练出多个聚类学习器,包括将各聚类学习器使用的聚类标记进行配准;3、将各聚类学习器的聚类结果进行结合以产生粗分割结果;4、去除粗分割结果中的孤立点;5、将像素数少的小区域并入其最大邻域;6、将RGB均值小的区域并入其最近邻域;7、结束。
本发明与现有技术相比,其显著优点是:利用多个聚类学习器提高了数字图像分割的精度,并辅助提高了数字图像处理装置在进行数字图像分割时的性能。
四、附图说明
图1是数字图像处理装置工作流程图。
图2是本发明方法的流程图。
图3是生成聚类学习器集成的流程图。
图4是产生粗分割结果的流程图。
五、具体实施方式
下面结合附图和实施例对本发明进行详细说明。
如图1所示,数字图像处理装置通过数字图像输入设备获取数字图像,然后进行平滑、去噪等预处理,然后进行图像分割,分割之后的图像可以继续进行检索、识别等处理。
本发明的方法如图2所示。步骤10是初始动作。步骤11从用户处获得欲分割出的区域数N(N是一个大于1的整数)。步骤12生成聚类学习器集成,该步骤将在后面的部分结合图3进行具体介绍。步骤14利用聚类学习器集成产生粗分割结果,该步骤将在后面的部分结合图4进行具体介绍。粗分割的结果中包含多个区域和若干个孤立的点,步骤16将这些孤立点去除,即将孤立点并入将其包围的区域中。步骤17计算出各区域所包含的像素数,将像素数最少的区域并入其最大邻域,直到剩下2N个区域。步骤18计算出各区域的RGB均值(即图像中红色、绿色、蓝色分量的平均值),找出RGB均值最小的区域,并将该区域并入与其RGB均值最接近的邻域,直到剩下N个区域,此时就得到了分割结果。步骤19是图2的结束状态。
图3详细说明了图2中的步骤12,其作用是生成聚类学习器集成。步骤120是初始动作。步骤121从用户处获得要使用的聚类学习器数M(M是一个大于1的整数),这里所使用的聚类学习器可以是任何类型的聚类学习器,只要能执行聚类任务即可,例如可以使用机器学习教科书中介绍的SOM神经网络。步骤122将图像中每个像素表示为一个5维像素向量[R,G,B,x,y],这里R、G、B分别代表该像素的红色、绿色、蓝色分量值,x和y分别代表该像素的横坐标和纵坐标。步骤123将控制参数i置为1。步骤124判断i是否不大于M,是则执行步骤125,否则转到步骤128。步骤125随机设置聚类学习器的参数,例如如果使用的是SOM神经网络,则随机设置其学习率和距离阈值。步骤126训练出一个聚类学习器,该聚类学习器将像素向量聚为k个类,这里k可以是任何比图2中的2N大的常整数,为叙述方便,假设这k个类分别为C1 (i),C2 (i),……,Ck (i),这里Cj (i)表示第i个聚类学习器聚出的第j个类。步骤127将控制变量i加1,然后转到步骤124。
由于各聚类学习器是分别训练的,其使用的聚类标记可能是不同的,例如第i个聚类学习器聚出的第l个类可能与第j个聚类学习器聚出的第l个类并不是同一个类,因此需要把各聚类学习器使用的聚类标记进行配准。图3的剩余部分即用于完成此任务。图3的步骤128将控制变量j置为2。步骤129判断j是否不大于M,是则执行步骤130,否则转到步骤138,即图3的结束状态。步骤130将Ω置为由第j个聚类学习器使用的聚类标记C1 (j),C2 (j),……,Ck (j)组成的集合。步骤131将控制变量l置为1。步骤132判断l是否不大于k,是则执行步骤133,否则执行步骤137,将控制变量j加1后转到步骤129。步骤133找出Ω中与第1个聚类学习器聚出的第l个类,即Cl (1),所包含的相同的像素向量最多的类Cu (j)。步骤134将Cu (j)置为Cl (1)。步骤135从Ω中去掉Cu (j)。步骤136将控制变量l加1后转到步骤132。从步骤132至136的操作实际上是将第j个聚类学习器使用的聚类标记向第1个聚类学习器使用的聚类标记配准。
图4详细说明了图2的步骤14,其作用是利用图3生成的聚类学习器集成来产生粗分割结果。步骤140是初始动作。步骤141将控制变量i置为1。步骤142判断i是否不大于图3中的M,即聚类学习器集成中的聚类学习器数,是则执行步骤143,否则转到步骤146。步骤143根据下式计算聚类学习器集成中第i个聚类学习器的平均互信息βi,βi的值越大,意味着第i个聚类学习器所没有被其他聚类学习器所包含的信息量就越少:
其中C(i)和C(j)为两个聚类学习器,其互信息ΦNMI(C(i),C(j))定义为下式:
其中k为图2的步骤126中聚类学习器将像素向量集合聚为的类别数,n为像素向量数,这些像素向量中有na个属于Ca (i),有nb个属于Cb (j),有nab个既属于Ca (i)又属于Cb (j)。
图4的步骤144利用步骤143计算出的平均互信息,根据下式计算聚类学习器集成中第i个聚类学习器的权重wi:
其中Z是规范化因子,使得:
图4的步骤145将控制变量i加1,转到步骤142。步骤146从像素向量集合中取出一个未处理的像素向量。步骤147为每个类别分别设置一个计数器,这些计数器用来记录有多少个聚类学习器给出的结果是该类别,这里的各类别分别对应了图3中第1个聚类学习器的聚类结果,即C1 (1),C2 (1),……,Ck (1)。步骤148将所有计数器清零。步骤149将控制变量j置为1。步骤150取得聚类学习器集成中第j个聚类学习器在当前像素向量上的结果,为叙述方便,称该结果为Cx (j)。步骤151将Cx (j)所对应的类别的计数器加wj,即步骤144计算出的第j个聚类学习器的权重。步骤152将控制变量j加1。步骤153判断j是否不大于M,即聚类学习器集成中聚类学习器的个数,是则转到步骤150,否则就执行步骤154。步骤154对所有计数器中的值进行比较,找出值最大的计数器,并将其对应的类别作为当前像素向量的结果类别;如果有多个计数器中的值均为最大值,则以这些计数器对应的类别中出现机会最大的类别作为当前像素向量的结果类别。步骤155判断是否还有未经步骤146至154处理的像素向量,有则转到步骤146,否则就进入步骤156。步骤156将图像中位置相邻且结果类别相同的像素归入同一区域。步骤157为图4的结束状态。
Claims (3)
1、一种基于聚类学习器集成的数字图像分割方法,包括将数字图像通过数字图像输入设备输入到数字图像处理装置进行预处理,然后进行图像分割处理,所述分割处理的方法包括以下步骤:
(1)将图像转化为像素向量集合;
(2)利用像素向量集合训练出多个聚类学习器;
(3)将各聚类学习器的聚类结果进行结合以产生粗分割结果;
(4)去除粗分割结果中的孤立点;
(5)将像素数少的小区域并入其最大邻域;
(6)将图像中红色、绿色、蓝色分量的平均值小的区域并入其最近邻域;
(7)结束;
其特征在于所说利用像素向量集合训练出多个聚类学习器的步骤是:
(1)从用户处获得要使用的聚类学习器数M,M是一个大于1的整数;
(2)将图像中每个像素表示为一个5维像素向量[R,G,B,x,y],其中R、G、B分别代表该像素的红色、绿色、蓝色分量值,x、y分别代表该像素的横坐标和纵坐标;
(3)将控制参数i置为1;
(4)判断i是否不大于M,是则执行步骤(5),否则转到步骤(8);
(5)随机设置聚类学习器的参数;
(6)训练出一个聚类学习器,该聚类学习器将像素向量聚为k个类,k是大于2N的整数,N是一个大于1的从用户处获得欲分割出的区域数;
(7)将控制变量i加1,然后转到步骤(4);
(8)将控制变量j置为2;
(9)判断j是否不大于M,是则执行步骤(10),否则结束;
(10)将Ω置为由第j个聚类学习器使用的聚类标记组成的集合;
(11)将控制变量l置为1;
(12)判断l是否不大于k,是则执行步骤(13),否则将控制变量j加1后转到步骤(9);
(13)找出Ω中与第1个聚类学习器聚出的第l个类,即Cl (l),所包含的相同的像素向量最多的类Cu (j);
(14)将Cu (j)置为Cl (l);
(15)从Ω中去掉Cu (j);
(16)将控制变量l加1后转到步骤(12)。
2、根据权利要求1所述的基于聚类学习器集成的数字图像分割方法,其特征在于所说产生粗分割结果的步骤是:
(1)将控制变量i置为1;
(2)判断i是否不大于聚类学习器数M,是则执行步骤(3),否则转到步骤(6);
(3)根据下式计算聚类学习器集成中第i个聚类学习器的平均互信息;
(4)利用步骤(3)得到的平均互信息,计算聚类学习器集成中第i个聚类学习器的权重wi:
(5)将控制变量i加1,转到步骤(2);
(6)从像素向量集合中取出一个未处理的像素向量;
(7)为每个类别分别设置一个计数器;
(8)将所有计数器清零;
(9)将控制变量j置为1;
(10)取得聚类学习器集成中第j个聚类学习器在当前像素向量上的结果;
(11)将上述结果所对应的类别的计数器加权重wj;
(12)将控制变量j加1;
(13)判断j是否不大于M,是则转到步骤(10),否则就执行步骤(14);
(14)对所有计数器中的值进行比较,找出值最大的计数器,并将其对应的类别作为当前像素向量的结果类别;
(15)判断是否还有未经步骤(6)至(14)处理的像素向量,有则转到步骤(6),否则就进入步骤(16);
(16)将图像中位置相邻且结果类别相同的像素归入同一区域;
(17)结束。
3、根据权利要求2所述的基于聚类学习器集成的数字图像分割方法,其特征在于在步骤(14)中,如果有多个计数器中的值均为最大值,则以这些计数器对应的类别中出现机会最大的类别作为当前像素向量的结果类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB200410041172XA CN1313964C (zh) | 2004-07-05 | 2004-07-05 | 基于聚类学习器集成的数字图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB200410041172XA CN1313964C (zh) | 2004-07-05 | 2004-07-05 | 基于聚类学习器集成的数字图像分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1595432A CN1595432A (zh) | 2005-03-16 |
CN1313964C true CN1313964C (zh) | 2007-05-02 |
Family
ID=34664945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB200410041172XA Expired - Fee Related CN1313964C (zh) | 2004-07-05 | 2004-07-05 | 基于聚类学习器集成的数字图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1313964C (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188018B (zh) * | 2007-12-06 | 2010-08-25 | 北大方正集团有限公司 | 一种在排版过程中进行自动退地的方法及装置 |
CN102737381B (zh) * | 2012-06-13 | 2014-10-29 | 西安电子科技大学 | 基于混合二分图聚类集成的图像分割方法 |
CN106296695B (zh) * | 2016-08-12 | 2019-05-24 | 西安理工大学 | 基于显著性的自适应阈值自然目标图像分割抽取算法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1367468A (zh) * | 2002-03-25 | 2002-09-04 | 北京工业大学 | 基于k-均值聚类及信息融合的角膜病灶图像分割方法 |
US20030095707A1 (en) * | 2001-11-19 | 2003-05-22 | Koninklijke Philips Electronics N.V. | Computer vision method and system for blob-based analysis using a probabilistic pramework |
-
2004
- 2004-07-05 CN CNB200410041172XA patent/CN1313964C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030095707A1 (en) * | 2001-11-19 | 2003-05-22 | Koninklijke Philips Electronics N.V. | Computer vision method and system for blob-based analysis using a probabilistic pramework |
CN1367468A (zh) * | 2002-03-25 | 2002-09-04 | 北京工业大学 | 基于k-均值聚类及信息融合的角膜病灶图像分割方法 |
Non-Patent Citations (1)
Title |
---|
基于视觉颜色聚类的彩色图像分割 王圆圆,丁志杰,万花林,北京理工大学学报,第23卷第6期 2003 * |
Also Published As
Publication number | Publication date |
---|---|
CN1595432A (zh) | 2005-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103886308B (zh) | 一种使用聚合通道特征和软级联分类器的行人检测方法 | |
CN104778481B (zh) | 一种大规模人脸模式分析样本库的构建方法和装置 | |
CN102014295B (zh) | 一种网络敏感视频检测方法 | |
CN108052946A (zh) | 一种基于卷积神经网络的高压机柜开关自动识别方法 | |
CN106650615B (zh) | 一种图像处理方法及终端 | |
CN102663400B (zh) | 一种结合预处理的lbp特征提取方法 | |
CN105118048A (zh) | 翻拍证件图片的识别方法及装置 | |
CN106354816A (zh) | 一种视频图像处理方法及装置 | |
CN107657257A (zh) | 一种基于多通道卷积神经网络的语义图像分割方法 | |
CN107392139A (zh) | 一种基于霍夫变换的车道线检测方法及终端设备 | |
CN106897739A (zh) | 一种基于卷积神经网络的电网设备分类方法 | |
CN102855492A (zh) | 基于矿物浮选泡沫图像的分类方法 | |
CN110706294A (zh) | 一种色纺织物颜色差异度检测方法 | |
CN107590491A (zh) | 一种图像处理方法及装置 | |
CN109685772B (zh) | 一种基于配准失真表示的无参照立体图像质量评估方法 | |
CN109544204A (zh) | 一种基于轻量化多任务卷积神经网络的导购行为分析方法 | |
CN112837344A (zh) | 一种基于条件对抗生成孪生网络的目标跟踪方法 | |
CN112926429B (zh) | 机审模型训练、视频机审方法、装置、设备及存储介质 | |
CN102306307B (zh) | 一种彩色显微图像序列中固点噪声的定位方法 | |
CN105354570B (zh) | 一种车牌左右边界精确定位的方法及系统 | |
CN108446964A (zh) | 一种基于移动流量dpi数据的用户推荐方法 | |
CN107680109A (zh) | 一种引用逆注意力与像素相似度学习的图像语义分割方法 | |
CN102779157A (zh) | 搜索图像的方法和装置 | |
CN110490262A (zh) | 图像处理模型生成方法、图像处理方法、装置及电子设备 | |
CN111339924A (zh) | 一种基于超像素和全卷积网络的极化sar图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070502 Termination date: 20100705 |