CN1313964C

CN1313964C - 基于聚类学习器集成的数字图像分割方法

Info

Publication number: CN1313964C
Application number: CNB200410041172XA
Authority: CN
Inventors: 姜�远; 周志华
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2004-07-05
Filing date: 2004-07-05
Publication date: 2007-05-02
Anticipated expiration: 2024-07-05
Also published as: CN1595432A

Abstract

本发明公开了一种基于聚类学习器集成的数字图像分割方法，该方法包括以下步骤：将图像转化为像素向量集合；利用像素向量集合训练出多个聚类学习器；将各聚类学习器的聚类结果进行结合以产生粗分割结果；去除粗分割结果中的孤立点；将像素数少的小区域并入其最大邻域；将RGB均值小的区域并入其最近邻域；结束。本发明的显著优点是利用多个聚类学习器提高了数字图像分割的精度，并辅助提高了数字图像处理装置在进行数字图像分割时的性能。

Description

基于聚类学习器集成的数字图像分割方法

一、技术领域

本发明涉及数字图像处理装置，特别涉及一种基于聚类学习器集成技术的数字图像分割方法。

二、背景技术

随着数字图像设备例如数码相机等的普及，数字图像已经在各行各业得到了广泛应用。为了有效提取和利用数字图像中包含的信息，需要对图像进行分割。图像分割是指将图像中具有不同语义的区域分割开，这些区域互不相交，每个区域都满足一致性。有效的数字图像分割技术将为进一步的数字图像检索、识别等奠定基础。聚类学习器是经典的机器学习技术，目前基于聚类学习器的数字图像分割技术都只利用了一个聚类学习器，分割效果有待进一步提高。

三、发明内容

本发明的目的是提供一种利用多个聚类学习器、提高分割精度的数字图像分割方法，以辅助提高数字图像处理装置在进行数字图像分割时的性能。

为实现本发明所述目的，本发明所述的基于聚类学习器集成的数字图像分割方法，包括以下步骤：1、将图像转化为像素向量集合；2、利用像素向量集合训练出多个聚类学习器，包括将各聚类学习器使用的聚类标记进行配准；3、将各聚类学习器的聚类结果进行结合以产生粗分割结果；4、去除粗分割结果中的孤立点；5、将像素数少的小区域并入其最大邻域；6、将RGB均值小的区域并入其最近邻域；7、结束。

本发明与现有技术相比，其显著优点是：利用多个聚类学习器提高了数字图像分割的精度，并辅助提高了数字图像处理装置在进行数字图像分割时的性能。

四、附图说明

图1是数字图像处理装置工作流程图。

图2是本发明方法的流程图。

图3是生成聚类学习器集成的流程图。

图4是产生粗分割结果的流程图。

五、具体实施方式

下面结合附图和实施例对本发明进行详细说明。

如图1所示，数字图像处理装置通过数字图像输入设备获取数字图像，然后进行平滑、去噪等预处理，然后进行图像分割，分割之后的图像可以继续进行检索、识别等处理。

本发明的方法如图2所示。步骤10是初始动作。步骤11从用户处获得欲分割出的区域数N(N是一个大于1的整数)。步骤12生成聚类学习器集成，该步骤将在后面的部分结合图3进行具体介绍。步骤14利用聚类学习器集成产生粗分割结果，该步骤将在后面的部分结合图4进行具体介绍。粗分割的结果中包含多个区域和若干个孤立的点，步骤16将这些孤立点去除，即将孤立点并入将其包围的区域中。步骤17计算出各区域所包含的像素数，将像素数最少的区域并入其最大邻域，直到剩下2N个区域。步骤18计算出各区域的RGB均值(即图像中红色、绿色、蓝色分量的平均值)，找出RGB均值最小的区域，并将该区域并入与其RGB均值最接近的邻域，直到剩下N个区域，此时就得到了分割结果。步骤19是图2的结束状态。

图3详细说明了图2中的步骤12，其作用是生成聚类学习器集成。步骤120是初始动作。步骤121从用户处获得要使用的聚类学习器数M(M是一个大于1的整数)，这里所使用的聚类学习器可以是任何类型的聚类学习器，只要能执行聚类任务即可，例如可以使用机器学习教科书中介绍的SOM神经网络。步骤122将图像中每个像素表示为一个5维像素向量[R，G，B，x，y]，这里R、G、B分别代表该像素的红色、绿色、蓝色分量值，x和y分别代表该像素的横坐标和纵坐标。步骤123将控制参数i置为1。步骤124判断i是否不大于M，是则执行步骤125，否则转到步骤128。步骤125随机设置聚类学习器的参数，例如如果使用的是SOM神经网络，则随机设置其学习率和距离阈值。步骤126训练出一个聚类学习器，该聚类学习器将像素向量聚为k个类，这里k可以是任何比图2中的2N大的常整数，为叙述方便，假设这k个类分别为C₁ ⁽ⁱ⁾，C₂ ⁽ⁱ⁾，……，C_k ⁽ⁱ⁾，这里C_j ⁽ⁱ⁾表示第i个聚类学习器聚出的第j个类。步骤127将控制变量i加1，然后转到步骤124。

由于各聚类学习器是分别训练的，其使用的聚类标记可能是不同的，例如第i个聚类学习器聚出的第l个类可能与第j个聚类学习器聚出的第l个类并不是同一个类，因此需要把各聚类学习器使用的聚类标记进行配准。图3的剩余部分即用于完成此任务。图3的步骤128将控制变量j置为2。步骤129判断j是否不大于M，是则执行步骤130，否则转到步骤138，即图3的结束状态。步骤130将Ω置为由第j个聚类学习器使用的聚类标记C₁ ^(j)，C₂ ^(j)，……，C_k ^(j)组成的集合。步骤131将控制变量l置为1。步骤132判断l是否不大于k，是则执行步骤133，否则执行步骤137，将控制变量j加1后转到步骤129。步骤133找出Ω中与第1个聚类学习器聚出的第l个类，即C_l ⁽¹⁾，所包含的相同的像素向量最多的类C_u ^(j)。步骤134将C_u ^(j)置为C_l ⁽¹⁾。步骤135从Ω中去掉C_u ^(j)。步骤136将控制变量l加1后转到步骤132。从步骤132至136的操作实际上是将第j个聚类学习器使用的聚类标记向第1个聚类学习器使用的聚类标记配准。

图4详细说明了图2的步骤14，其作用是利用图3生成的聚类学习器集成来产生粗分割结果。步骤140是初始动作。步骤141将控制变量i置为1。步骤142判断i是否不大于图3中的M，即聚类学习器集成中的聚类学习器数，是则执行步骤143，否则转到步骤146。步骤143根据下式计算聚类学习器集成中第i个聚类学习器的平均互信息β_i，β_i的值越大，意味着第i个聚类学习器所没有被其他聚类学习器所包含的信息量就越少：

β_{i} = \frac{1}{M - 1} Σ_{i = 1, i &NotEqual; j}^{M} Φ^{NMI} (C^{(i)}, C^{(j)})

其中C⁽ⁱ⁾和C^(j)为两个聚类学习器，其互信息Φ^NMI(C⁽ⁱ⁾，C^(j))定义为下式：

Φ^{NMI} (C^{(i)}, C^{(j)}) = \frac{2}{n} Σ_{a = 1}^{k} Σ_{b = 1}^{k} n^{ab} \log_{k^{2}} (\frac{n^{ab} n}{n_{a} n_{b}})

其中k为图2的步骤126中聚类学习器将像素向量集合聚为的类别数，n为像素向量数，这些像素向量中有n_a个属于C_a ⁽ⁱ⁾，有n_b个属于C_b ^(j)，有n^ab个既属于C_a ⁽ⁱ⁾又属于C_b ^(j)。

图4的步骤144利用步骤143计算出的平均互信息，根据下式计算聚类学习器集成中第i个聚类学习器的权重w_i：

w_{i} = \frac{1}{β_{i} Z}

其中Z是规范化因子，使得：

w_{i} > 0 (i = 1,2, . . ., M) and Σ_{i = 1}^{M} w_{i} = 1

图4的步骤145将控制变量i加1，转到步骤142。步骤146从像素向量集合中取出一个未处理的像素向量。步骤147为每个类别分别设置一个计数器，这些计数器用来记录有多少个聚类学习器给出的结果是该类别，这里的各类别分别对应了图3中第1个聚类学习器的聚类结果，即C₁ ⁽¹⁾，C₂ ⁽¹⁾，……，C_k ⁽¹⁾。步骤148将所有计数器清零。步骤149将控制变量j置为1。步骤150取得聚类学习器集成中第j个聚类学习器在当前像素向量上的结果，为叙述方便，称该结果为C_x ^(j)。步骤151将C_x ^(j)所对应的类别的计数器加w_j，即步骤144计算出的第j个聚类学习器的权重。步骤152将控制变量j加1。步骤153判断j是否不大于M，即聚类学习器集成中聚类学习器的个数，是则转到步骤150，否则就执行步骤154。步骤154对所有计数器中的值进行比较，找出值最大的计数器，并将其对应的类别作为当前像素向量的结果类别；如果有多个计数器中的值均为最大值，则以这些计数器对应的类别中出现机会最大的类别作为当前像素向量的结果类别。步骤155判断是否还有未经步骤146至154处理的像素向量，有则转到步骤146，否则就进入步骤156。步骤156将图像中位置相邻且结果类别相同的像素归入同一区域。步骤157为图4的结束状态。

Claims

1、一种基于聚类学习器集成的数字图像分割方法，包括将数字图像通过数字图像输入设备输入到数字图像处理装置进行预处理，然后进行图像分割处理，所述分割处理的方法包括以下步骤：

(1)将图像转化为像素向量集合；

(2)利用像素向量集合训练出多个聚类学习器；

(3)将各聚类学习器的聚类结果进行结合以产生粗分割结果；

(4)去除粗分割结果中的孤立点；

(5)将像素数少的小区域并入其最大邻域；

(6)将图像中红色、绿色、蓝色分量的平均值小的区域并入其最近邻域；

(7)结束；

其特征在于所说利用像素向量集合训练出多个聚类学习器的步骤是：

(1)从用户处获得要使用的聚类学习器数M，M是一个大于1的整数；

(2)将图像中每个像素表示为一个5维像素向量[R，G，B，x，y]，其中R、G、B分别代表该像素的红色、绿色、蓝色分量值，x、y分别代表该像素的横坐标和纵坐标；

(3)将控制参数i置为1；

(4)判断i是否不大于M，是则执行步骤(5)，否则转到步骤(8)；

(5)随机设置聚类学习器的参数；

(6)训练出一个聚类学习器，该聚类学习器将像素向量聚为k个类，k是大于2N的整数，N是一个大于1的从用户处获得欲分割出的区域数；

(7)将控制变量i加1，然后转到步骤(4)；

(8)将控制变量j置为2；

(9)判断j是否不大于M，是则执行步骤(10)，否则结束；

(10)将Ω置为由第j个聚类学习器使用的聚类标记组成的集合；

(11)将控制变量l置为1；

(12)判断l是否不大于k，是则执行步骤(13)，否则将控制变量j加1后转到步骤(9)；

(13)找出Ω中与第1个聚类学习器聚出的第l个类，即C_l ^(l)，所包含的相同的像素向量最多的类C_u ^(j)；

(14)将C_u ^(j)置为C_l ^(l)；

(15)从Ω中去掉C_u ^(j)；

(16)将控制变量l加1后转到步骤(12)。

2、根据权利要求1所述的基于聚类学习器集成的数字图像分割方法，其特征在于所说产生粗分割结果的步骤是：

(1)将控制变量i置为1；

(2)判断i是否不大于聚类学习器数M，是则执行步骤(3)，否则转到步骤(6)；

(3)根据下式计算聚类学习器集成中第i个聚类学习器的平均互信息；

(4)利用步骤(3)得到的平均互信息，计算聚类学习器集成中第i个聚类学习器的权重w_i：

(5)将控制变量i加1，转到步骤(2)；

(6)从像素向量集合中取出一个未处理的像素向量；

(7)为每个类别分别设置一个计数器；

(8)将所有计数器清零；

(9)将控制变量j置为1；

(10)取得聚类学习器集成中第j个聚类学习器在当前像素向量上的结果；

(11)将上述结果所对应的类别的计数器加权重w_j；

(12)将控制变量j加1；

(13)判断j是否不大于M，是则转到步骤(10)，否则就执行步骤(14)；

(14)对所有计数器中的值进行比较，找出值最大的计数器，并将其对应的类别作为当前像素向量的结果类别；

(15)判断是否还有未经步骤(6)至(14)处理的像素向量，有则转到步骤(6)，否则就进入步骤(16)；

(16)将图像中位置相邻且结果类别相同的像素归入同一区域；

(17)结束。

3、根据权利要求2所述的基于聚类学习器集成的数字图像分割方法，其特征在于在步骤(14)中，如果有多个计数器中的值均为最大值，则以这些计数器对应的类别中出现机会最大的类别作为当前像素向量的结果类别。