CN101625725A - 基于流形距离的人工免疫无监督图像分类方法 - Google Patents

基于流形距离的人工免疫无监督图像分类方法 Download PDF

Info

Publication number
CN101625725A
CN101625725A CN200810150307A CN200810150307A CN101625725A CN 101625725 A CN101625725 A CN 101625725A CN 200810150307 A CN200810150307 A CN 200810150307A CN 200810150307 A CN200810150307 A CN 200810150307A CN 101625725 A CN101625725 A CN 101625725A
Authority
CN
China
Prior art keywords
antibody
image
sample
generic
affinity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200810150307A
Other languages
English (en)
Inventor
公茂果
张立宁
马文萍
焦李成
刘芳
张向荣
侯彪
王爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN200810150307A priority Critical patent/CN101625725A/zh
Publication of CN101625725A publication Critical patent/CN101625725A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开一种基于流形距离的人工免疫无监督图像分类方法,它涉及图像处理技术领域,其具体过程为:(1)输入待分类图像,设置初始化参数,产生初始抗体群;(2)基于流行距离,对待分类图像样本点进行类属划分,计算抗体群的亲合度;(3)对抗体群进行克隆增殖操作;(4)对克隆增殖后的抗体群进行克隆变异操作;(5)根据克隆变异后的抗体群编码对待分类图像进行类属划分,计算抗体群亲合度;(6)根据抗体亲和度对抗体群进行克隆选择操作;(7)按照设置的最大迭代次数,对待分类图像的类属划分结果进行停止条件判断,并确定最终分类结果。本发明具有对图像数据结构敏感度低、无间督执行、分类效果好以及鲁棒性强的优点,可用于图像处理领域中的目标识别。

Description

基于流形距离的人工免疫无监督图像分类方法
技术领域
本发明属于图像处理技术领域,特别是涉及一种图像分类方法,该方法可用于图像处理中的目标识别。
背景技术
图像处理是一个跨学科的领域,随着计算机科学技术的不断发展,图像处理和分析逐渐形成了自己的科学体系。图像分类就是依据某种准则将图像分为若干区域的过程,要求同一区域内的像素具有某种一致性,不同区域的像素之间不存在这种一致性。图像分类方法一直是图像处理和分析中的一个研究热点,也是计算机视觉中的一个关键问题,特别是基于纹理特征的无监督图像分类方法是近年来的研究热点。
纹理特征是图像的重要属性,近三十年来研究学者提出了许多基于纹理特征的分类方法。这些方法主要分为四类:统计方法,结构方法,模型方法和信号处理方法。这些方法当中,Haralick等人提出来的灰度共生矩阵特征是被广泛应用的特征之一。以上几种方法在处理图像分类问题时均采用了有监督的方法,而在不同的图像中,同样的目标区域看起来往往会有很大的不同,即使在同一幅图像中也会有同样的问题。因此,采用有监督方法选择的训练样本往往不能包含图像中目标区域的所有类属特征。在这种情况下,无监督的分类方法,通常又叫做聚类方法,就会更加有效。无监督分类方法一般可以分为两类:层次聚类和划分聚类,其中划分聚类通过最小化特定准则将数据集划分到不同的类属中。因此这类方法可以看作是最优化问题,人工免疫系统作为一种新兴的人工智能方法可以很好地解决这一优化问题。
人工免疫系统所独有的免疫记忆、免疫识别、免疫调节等特性,具有很强的无监督学习能力和鲁棒性,在处理工程问题时比其它的进化算法表现出了更加优良的特性。很多学者提出了不同的针对无监督分类问题的个体编码方式,例如对聚类样本直接编码的方式以及Handl等人提出的基于点邻接方法。另外还有借鉴K均值方法的间接编码方式,即仅对聚类中心进行编码,将样本通过相似性度量准则进行类属划分。通常采用的相似性度量准则是欧氏距离,这种度量准则对具有高斯分布结构的数据样本具有很好的效果,但却不能反映复杂的图像数据样本的分布结构,因此基于欧氏距离的相似性度量准则具有对图像数据结构敏感度高、分类效果差以及鲁棒性不强等缺陷。
发明的内容
本发明的目的在于克服已有技术的不足,提出一种基于流行距离的人工免疫无监督图像分类方法,以降低对图像数据结构的敏感度,实现在无监督执行下提高对不同类型图像的分类效果。
本发明的技术方案是:基于流行距离测度,将纹理图像分类问题看作组合优化问题,用人工免疫系统中的克隆选择方法计算搜索使似然函数最大化的序列组合作为分类结果。利用克隆选择算法快速的全局收敛性,搜索问题的最优解,逼近最佳纹理图像分类的性能。具体实现步骤如下:
(1)输入待分类图像,按照人工免疫系统方法设置抗体群规模n、变异概率pm、克隆规模nc、类别数K,设定最大迭代次数kmax为停止条件,抗体编码采用从图像数据集中选择K个典型数据样本,用其序号来分别代表纹理图像的K个类别,同时随机生成初始抗体群B(k)={b1(k),b2(k),…,bn(k)},设置当代迭代次数标记k=0;
(2)依据所生成的初始抗体群B(k),对纹理图像中未分类的样本点依据其与典型样本点的流行距离测度进行类属划分,并根据划分的类属计算抗体群中抗体的亲和度f(C),其中,C表示抗体对应的类属划分集合;
(3)对抗体群B(k)=b1(k),b2(k),…,bn(k)}进行克隆增殖操作,即按照亲和度大小对抗体群进行克隆增殖操作Tc C,获得一组新的抗体群 Y ( k ) = T c C ( B ( k ) ) ;
(4)对克隆增殖后的抗体群Y(k)进行克隆变异操作,是指依据概率pm对抗体群进行基因值改变操作 Z ( k ) = T m C ( Y ( k ) ) ;
(5)根据克隆变异后的抗体群Z(k)重新对图像中的样本点进行类属划分,同时计算抗体群中抗体的亲合度;
(6)依据第(5)步获得的抗体群的亲和度,对克隆变异后的抗体群Z(k)进行克隆选择操作,即从抗体群Z(k)中按照亲和度大小选择n个亲和度最高的抗体组成下一代种群 B ( k + 1 ) = T s C ( Z ( k ) ∪ B ( k ) ) , 当代迭代次数标记k增加1代;
(7)判断迭代次数k是否等于设置的最大迭代次数kmax:如果满足该条件就将抗体群中亲和度最高的抗体对应的图像类属划分作为输出结果,否则返回过程(3),循环执行过程(3)~(7),直到满足停止条件。
本发明与现有技术相比具有如下优点:
1.对数据结构敏感度低
真实图像数据的分布往往具有复杂的结构,致使基于欧式距离的相似性度量不能反映图像数据样本的全局一致性,如图1所示。在图1中,按照欧式距离测度数据样本1和2要明显小于数据样本1和3的欧式距离,可见欧式距离无法反映图1所示数据样本的全局一致性。由于本发明在计算抗体亲和度时采用了基于流行距离测度的方法对图像中的样本点的相似性进行度量,因此它可以度量沿着流形上的最短路径,这就使得位于同一流形上的两点可以用许多较短的边连接,而位于不同流形上的两点要用较长的边相连接,从而放大了位于不同流形上的数据样本之间的距离,而缩短了位于同一流形上的数据样本之间的距离,反映了聚类数据的全局一致性,避免了现有技术对于数据结构敏感度高的缺陷。
2.图像分类效果好
本发明由于采用了人工免疫系统的克隆增值操作,克隆变异操作和克隆选择操作,因而具有比现有技术更好的图像分类效果。仿真实验表明,针对流行结构明显的图像数据集,本发明与GAC、DSKM和KM方法相比较,其分类结果的区域一致性,边缘准确性好,同时具有更低的分类错误率和更好的鲁棒性。
附图说明
图1是流行结构数据样本示意图;
图2是本发明的流程框图;
图3是用本发明方法对标准测试数据集的分类结果示意图;
图4是用本发明方法对人工纹理图像Image1的分类结果示意图;
图5是用本发明方法对人工纹理图像Image2的分类结果示意图;
图6是用本发明方法对人工纹理图像Image1的分类结果示意图;
图7是用本发明方法对X波段SAR图像的分类结果示意图;
图8是用本发明方法对Ku波段SAR图像的分类结果示意图;
图9是本发明方法与GAC、DSKM和KM方法的鲁棒性分析示意图。
具体实施方式
参照图2,本发明对图像分类的步骤如下:
步骤一,输入待分类图像,设置初始化参数,生成初始抗体群。
输入待分类的图像,按照人工免疫方法设置抗体规模n、变异概率pm、克隆比例nc、类别数K,同时给定本发明方法最大的迭代次数kmax,并在尺寸为CM K的解集空间中随机产生初始抗体群B(0)={b1(0),b2(0),…,bn(0)}∈In,其中初始抗体群的产生是依据抗体规模n,类别数K以及待分类图像中全部的样本点序号来随机生成的。其过程是先从待分类图像的全部样本点中随机选取K个典型样本,将其对应的序号作为抗体编码,获得单个抗体的基因编码;再用生成抗体基因编码的方法重复执行n次,获得抗体规模为n的抗体群,同时设置当代迭代次数标记k=0。
步骤二,依据初始抗体群,对待分类图像样本点进行类属划分。
依据步骤一所生成的规模为n的抗体群,对图像中的样本点进行类属划分。该划分采用流行距离测度,与空间中两点之间的欧氏距离相似,设空间两点xi与xj之间流形上的线段长度为 L ( x i , x j ) = ρ dist ( x i , x j ) - 1 , 其中,dist(xi,xj)为xi与xj之间的欧氏距离,ρ>1为伸缩因子。对图像进行分类时,将图像中的样本点看作一个加权无向图G=(V,E)的顶点V,边集合E表示每一对样本点间定义的流形上的线段长度。令p∈Vl表示图上一个长度为l=|p|-1的连接点p1与p|p|的路径,令Pi,j表示连接数据点xi与xj的所有路径的集合,流形距离测度 D ( x i , x j ) = min p ∈ P i , j Σ k = 1 | p | - 1 L ( p k , p k + 1 ) . 具体划分过程如下:
(1)根据抗体表示的K个典型样本,针对图像中的每一个样本点计算它与这K个典型样本之间的流行距离测度 D ( x i , x j ) = min p ∈ P i , j Σ k = 1 | p | - 1 ( ρ dist ( p k , p k + 1 ) - 1 ) , 其中xi,i=1,2,...,M表示图像中的M个样本点,xj,j=1,2,...,K表示对图像分类中的K个典型样本。
(2)计算待分类图像中所有样本点与K个典型样本之间流行距离,取K个流行距离中最小的那个典型样本对应的类别标签作为该样本点的类属。通过重复上述操作,获得图像中M个数据点的类属信息。
(3)重复步骤(1)~(2)操作,获得待分类图像中M个样本点的类属信息。
步骤三,计算对图像进行类属划分后的抗体群亲和度。
根据步骤二获得了图像M个样本点的类属信息,通过以下方式计算抗体群的亲合度:
{f(B(k))}={f(b1(k)),f(b2(k)),…,f(bn(k))},
式中 f ( b i ( k ) ) = 1 / ( 1 + Σ C k ∈ C Σ s ∈ C k D ( s , μ k ) ) , i=1,2,3,…,n,s表示图像中的样本点,b为抗体对应的典型样本序列,C为抗体b对应的类别划分,Ck为类别划分k,μk表示类别k的典型样本,D(s,μk)表示第s个样本与典型样本μk的流形距离测度。
步骤四,对抗体群进行克隆增殖操作。
对抗体群B(k)={b1(k),b2(k),…,bn(k)}进行克隆增殖操作Tc C,可以表示为如下形式:
Y ( k ) = T c C ( B ( k ) ) = [ T c C ( b 1 ( k ) ) T c C ( b 2 ( k ) ) , · · · , T c C ( b n ( k ) ) ] T
其中, Y i ( k ) = T c C ( b i ( k ) ) = I i × b i ( k ) , i=1,2,…,n,Ii为qi维单位行向量,称为抗体bi的qi克隆,其中i=1,2,…,n
qi(k)=g(nc,f(bi(k)))。
一般取
Figure S2008101503074D00054
克隆增殖过后,抗体群变为:
Y(k)={Y1(k),Y2(k),…,Yn(k)},
其中, Y i ( k ) = { Y ij ( k ) } = { Y i 1 ( k ) , Y i 2 ( k ) , · · · , Y i q i ( k ) } 且Yij(k)=bi(k),j=1,2,…,qi
本发明方法中的克隆增殖操作Tc C是人工免疫系统方法中的典型操作,其目的是通过增大抗体规模,增大搜索空间以便于更加迅速地寻找到最佳的图像类属划分。
步骤五,对抗体群进行克隆变异操作。
对克隆增殖后获得的抗体群Y(k)进行克隆变异操作Tc C,是对抗体某些位置上的基因值以一定的概率pm进行改变,即当抗体中的某个基因值变异时,将对应的基因值改变为新的类属的典型样本序号,而新的典型样本的序号的选择方式是随机的,只要保证与其余类属的典型样本的序号相异即可。克隆变异操作Tm C可用以下过程进行描述:
Z ( k ) = { Z 1 ( k ) , Z 2 ( k ) , · · · , Z n ( k ) }
= { { z 11 , z 12 , · · · , z 1 q 1 } , { z 21 , z 22 , · · · , z 2 q 2 } , · · · , { z n 1 , z n 2 , · · · , z n q n } } = T m C ( Y ( k ) )
= { T m C ( y 11 ) , T m C ( y 12 ) , · · · , T m C ( y 1 q 1 ) , T m C ( y 21 ) , T m C ( y 22 ) , · · · , T m C ( y 2 q 2 ) ,
· · · , T m C ( y n 1 ) , T m C ( y n 2 ) , · · · , T m C ( y n q n ) }
其中, z ij ( k ) = T m C ( y ij ( k ) ) , i=1,2,…,n,j=1,2,…,qi
通过上述克隆变异操作,对于克隆增殖操作后获得的抗体群Y(k)中的抗体代表的典型样本序号进行改变,以期望获得对于图像样本点类属划分更好的结果。
步骤六,依据生成的抗体群,重新对图像进行类属划分,计算抗体群亲和度。
对经过克隆变异操作后获得的抗体群Z(k)中的每一个抗体,仿照步骤二和步骤三,依据抗体基因所代表的典型样本对待分类的图像中样本点进行类属划分,并计算抗体群中每个抗体的亲合度,记为
{ f ( Z ( k ) ) } = { f ( z 11 ( k ) ) , f ( z 12 ( k ) ) , · · · , f ( z 1 q 1 ( k ) ) ,
f ( z 21 ( k ) ) , f ( z 22 ( k ) ) , · · · , f ( z 2 q 2 ( k ) ) , · · · , f ( z n 1 ( k ) ) , f ( z n 2 ( k ) ) , · · · , f ( z n q n ( k ) ) } ,
通过以上对每一个抗体亲和度
Figure S2008101503074D00071
的计算,就可获得经过克隆变异操作之后的抗体群对图像类属划分结果的亲和度f(Z(k))。
步骤七,对抗体群进行克隆选择操作。
根据步骤六获得的抗体群Z(k)的亲和度,对克隆变异操作后的抗体群进行克隆选择操作Ts C,克隆选择操作的目的是从变异生成的抗体群和初始抗体群中选择出适应度较高的抗体,这些抗体对应的待分类图像的分类结果要好于适应度低的抗体对应的分类结果,为了更清楚地表示克隆选择操作Ts C,将其表示为如下形式:
∀ i = 1,2 , · · · , n , z i * ( k ) = arg min z ij ( k ) ∈ Z i ( k ) { f ( z ij ( k ) ) } ,
b i ( k + 1 ) = T s C ( Z i ( k ) ∪ b i ( k ) ) = Δ z i * ( k ) iff ( z i * ( k ) ) > f ( b i ( k ) ) b ( k ) else
克隆选择后的新种群为:
B ( k + 1 ) = T s C ( Z ( k ) ∪ B ( k ) )
= { T s C ( Z 1 ( k ) ∪ b 1 ( k ) ) , T s C ( Z 2 ( k ) ∪ b 2 ( k ) ) , · · · , T s C ( Z n ( k ) ∪ b n ( k ) ) }
= { b 1 ( k + 1 ) , b 2 ( k + 1 ) , · · · , b n ( k + 1 ) }
通过执行克隆选择操作Tc C,使当代迭代次数标记k增加了1代,即将克隆变异生成的抗体群Z(k)与原始抗体群B(k)中适应度高的抗体选择出来重新组成下一代的抗体群B(k+1),k+1表示下一代迭代次数标记。
步骤8,输出图像类属划分结果的条件判断。
按照输出分类结果时最佳的抗体适应度至少连续迭代15次不变的原则,设置最大迭代次数kmax。
判断迭代次数k是否等于设置的最大迭代次数kmax:如果满足该条件就将抗体群中亲和度最高的抗体对应的图像类属划分作为输出结果,否则返回步骤(4),循环执行步骤(4)~(8),直到满足输出类属划分结果的条件为止。
通过上面八个步骤的操作,对于输入的待分类图像均可以输出一个最佳的分类结果。
本发明的效果可以通过以下仿真进一步说明:
1仿真内容:将本发明方法与传统的K均值聚类方法KM和基于流形距离的修正K均值聚类方法DSKM,以及基于欧氏距离的遗传聚类方法GAC分别针对标准聚类测试数据,人工纹理图像数据,X波段SAR图像数据,Ku波段SAR图像数据的分类性能进行了比较。
2仿真参数设置及评价标准:KM和DSKM方法均以指定预先精度1e-10为终止条件,AIC和GAC方法以最大迭代次数100为终止条件。AIC方法和GAC方法的种群规模为50个个体,变异概率pm=0.1,克隆比例为nc=5。
聚类性能采用Adjusted Rand Index和Clustering Error两个评价指标来衡量,对于有n个样本的数据集,Adjusted Rand Index按照以下公式计算:
R ( U , V ) = Σ lk n lk 2 - [ Σ l n l · 2 · Σ k n · k 2 ] / n 2 1 2 [ Σ l n l · 2 + Σ k n · k 2 ] - [ Σ l n l · 2 · Σ k n · k 2 ] / n 2
其中nlk为数据样本同时分配到类属l和类属k的数目,R(U,V)∈[0,1],且其数值越大分类划分的正确率越高。Clustering Error表示分类划分误差率,按以下公式计算:
CE ( Δ , Δ true ) = 1 N Σ i = 1 k true Σ j = 1 i ≠ j k Confusion ( i , j )
其中 Δ true = { C 1 true , C 2 true , · · · , C k true true } 表示数据真实的分类结果,Δ={C1,C2,…,Ck}表示分类方法生成的分类结果。 ∀ i ∈ [ 1 , · · · , k true ] , j∈[1,…,k],Confusion(i,j)表示真实的分类结果Ci true和生成的结果Cj之间相同的数据样本的数量,N表示数据集的大小。Clustering Error∈[0,1],并且它的值越小分类结果越好
3仿真实验结果:
(1)标准分类测试数据实验结果
为测试本发明方法的有效性,首先对七个标准测试数据,即Line-blobs,Long1,Size5,Spiral,Square4,Sticks和Three-circles进行了测试,七个标准分类测试数据的分布具有很大的差异。图3(a)~(g)给出了AIC方法对七个标准数据集的样本分类结果示意图。针对七个标准分类测试数据分别进行30次独立运行,AIC、GAC、DSKM和KM四种方法获得的平均结果如表1所示。
表1AIC,GAC,DSKM和KM方法对人工数据集的分类对比结果
Figure S2008101503074D00091
从表1中可以看出,针对七个标准分类测试数据样本,AIC方法对其中六个数据集获得了最优的分类特性。而GAC方法仅对其中Square4数据集的分类效果最好。同样DSKM获得了对Long1、Spiral和Sticks的真实分类结果。KM和GAC仅对两个球形数据集获得了较理想的分类结果,例如Size5和Square4数据集,这是由于其它的五组数据集均不满足凸分布的特性。而AIC和DSKM均能很好地识别这些复杂数据集,这表明流形距离测度可以很好地度量复杂数据集的结构。AIC和DSKM两种方法对数据集Long1、Spiral和Sticks,三十次独立实验均可以获得完全正确的分类结果,然而DSKM并不能很好地处理Line-blobs和Three-circles数据集。同样对于Size5和Square4数据集,AIC方法不论从Adjusted Rand index还是Clustering Error指标都要比DSKM方法更优。DSKM方法的主要缺陷就是K均值方法在类属划分完成后需要重新划分每一类的几何中心,这种操作降低了方法测试数据集全局一致性的能力。而AIC方法从组合优化的角度很好地弥补了DSKM方法的这一缺陷。为直观表示AIC方法的分类特性,AIC方法的典型分类结果如图3(a)~(g)所示。
(2)人工纹理图像分类的仿真结果
为进一步验证AIC方法的有效性,对三幅人工纹理图像进行了测试。Image1是一幅256×256的灰度图,取自Brodatz纹理图像库,它包含两类纹理特征,如图4(a)所示,图4(b)给出了Image1的真实分类结果。Image2同样包含两类纹理特征,图5(a)和图5(b)分别代表了Image2的原始图像和真实分类结果。Image3是一幅包含四类纹理特征的复杂合成图像,图6(a)和6(b)分别代表了Image3的原始图像和真实分类结果。针对每一个测试问题分别进行30次独立实验,三幅人工纹理图像分类结果的Cluster Error和AdjustedRand Index指标平均结果如表2所示。AIC,GAC,DSKM和KM四种算法针对三幅图像的典型分类结果如图4~图6所示。
表2AIC,GAC,DSKM和KM对三幅人工纹理图像的分类对比结果
Figure S2008101503074D00101
从表2中可以看出,AIC、GAC、DSKM和KM方法对Image1分类结果的Cluster Error均小于1%,因此四种方法均可以很好地对Image1进行分类。但是从Cluster Error和Adjusted Rand Index指标以及图4的结果均可以看出,AIC和DSKM方法获得结果要比GAC和KM方法更好,这是由于AIC和DSKM方法通过流形距离测度对数据样本进行分类,而GAC和KM则采用了欧氏距离。AIC和DSKM对Image1的分类结果相似。
针对Image2的分类结果,AIC方法获得的平均Cluster Error指标要远小于GAC、DSKM和KM方法,而AIC方法的Adjusted Rand Index指标的值要明显大于其它三种方法的指标,因此AIC方法针对Image2获得了最优结果。从图5中可以看出,对Image2问题AIC方法获得的结果要远好于GAC和KM的结果,并且AIC方法的结果要好于DSKM的结果。AIC方法对于两类纹理的分类结果要好于DSKM,这主要归功于AIC采用了克隆选择方法对两个典型样本进行搜索,而DSKM则需要在每次迭代后重新计算类属的几何中心,这将大大降低方法检验分类效果全局一致性的能力。
针对更加复杂的纹理图像Image3进行分类时,每种方法的Cluster Error均超过了12%,因此这四种基于灰度共生矩阵的分类方法均不能很好地对其进行分类,然而表2和图6的结果表明AIC方法均要比其余几种方法更优。
从表2及图4~图6对比结果可以明显看出,AIC对于三幅人工纹理图像的分类结果具有更低的分类误差率,杂点较少,纹理的一致性要明显优于其它三种方法,因此本发明方法对人工纹理图像具有更好的分类效果。
(3)遥感图像纹理分类的仿真结果
图7(a)是一幅瑞士湖边的X波段SAR图像,图像大小为140×155。图7(a)显示图像具有三个区域,分别为湖泊,城市和山区。第二幅如图8(a)所示,为一幅美国新墨西哥州中部Rio Grande River的Ku波段SAR图像,图像大小为256×256,图8(a)显示图像具有三个区域,分别为河流、植被和庄稼。图7(b)~(f)分别给出了AIC、GAC、DSKM和KM四种方法针对图7(a)的分类结果。图8(a)的分类结果则分别在图8(b)~(f)中给出。
从图7中可以看出,四种方法很容易对X波段的SAR图像进行分类。
图7(c)和(e)显示KM和GAC方法将左边许多山脉区域错误分为湖泊。图7(b)和(d)显示AIC方法可以很好地识别这些区域,DSKM方法可以明显地降低这种误识别概率。同时KM方法将SAR图像左上边的许多区域的山脉和城市进行了错分,而AIC方法则大大减少了这种错误。通常AIC方法的输出具有更好的划分效果。
从图8中可以看出基于流形相似性度量准则的AIC和DSKM方法产生的分类结果要好于GAC和KM方法。这种基于欧式距离的相异性度量准则很容易对庄稼和河流进行错分。然而,AIC和DSKM方法可以对河流区域进行很好的划分。在区分植被和庄稼时,GAC和KM方法在分类结果的连续性上远远不如AIC和DSKM方法。GAC和KM方法更易于将沿着河流的庄稼和植被错分,同时将庄稼区域进行了过分割。然而AIC和DSKM方法将左下边的庄稼错误识别为河流,这是由该区域的灰度特性导致。同样DSKM方法也将该区域的庄稼和植被以及图像左下角的区域进行了错分。一般来说,在对Ku波段SAR图像分类时,AIC方法的性能要优于DSKM方法,GAC方法优于KM方法,AIC和DSKM方法要优于GAC和KM方法
从图7和图8的分类结果中可以明显看出本发明方法对于X波段和Ku波段SAR图像,相比于其它方法具有更好的区域一致性,区域边缘划分准确,分类效果图中杂点明显少于其它几种方法。
(4)算法鲁棒性分析实验
为比较四种方法在解决分类问题时的鲁棒性,本仿真采用了如下准则来进行评价。具体地针对方法m对特定数据集的分类特性bm采用该方法m的平均Adjusted Rand Index值与对比方法中最高的Adjusted Rand Index的比值表示,即 b m = R m / max k R k . 针对特定测试集的最优的分类方法,其分类特性bm=1,所有其余分类方法的分类特性bm≤1,bm值越大表示分类方法的分类效果越好。因此分类方法对所有数据集的分类特性bm的总和可以反映出它的分类鲁棒性,其值越大,方法的鲁棒性越强。鲁棒性实验分析结果如图9所示。
图9给出了四种方法对十个测试问题bm的分布情况。针对每一种方法,十个bm值进行堆叠,bm堆叠结果总和在其上给出。从图9中可以看出AIC方法具有最大的bm总和值。事实上,由于AIC方法对所有测试问题的bm均等于1或接近于1,这反映出AIC方法对不同问题均具有很好的特性。因此,AIC方法与其他方法相比具有最佳的鲁棒性,对于图像的类型的敏感性并不高,可以处理各种不同类型的图像,并能获得较好的结果。
综上,本发明提出的基于流形距离的人工免疫无监督图像分类方法获得了很好的分类效果,比传统的K均值聚类方法和基于流形距离的修正K均值聚类方法,以及基于欧氏距离的遗传聚类方法相比具有对数据结构敏感度低,更高的分类正确率和更低的分类误差率,并且鲁棒性最好。

Claims (6)

1.一种基于流形距离的人工免疫无监督图像分类方法,包括以下过程:
(1)输入待分类图像,按照人工免疫系统方法设置抗体群规模n、变异概率pm、克隆规模nc、类别数K,设定最大迭代次数kmax为停止条件,抗体编码采用从图像数据集中选择K个典型数据样本,用其序号来分别代表纹理图像的K个类别,同时随机生成初始抗体群B(k)={b1(k),b2(k),…,bn(k)},设置当代迭代次数标记k=0;
(2)依据所生成的初始抗体群B(k),对纹理图像中未分类的样本点依据其与典型样本点的流行距离测度进行类属划分,并根据划分的类属计算抗体群中抗体的亲和度f(C),其中,C表示抗体对应的类属划分集合;
(3)对抗体群B(k)={b1(k),b2(k),…,bn(k)}进行克隆增殖操作,即按照亲和度大小对抗体群进行克隆增殖操作Tc C,获得一组新的抗体群 Y ( k ) = T c C ( B ( k ) ) ;
(4)对克隆增殖后的抗体群Y(k)进行克隆变异操作,是指依据概率pm对抗体群进行基因值改变操作 Z ( k ) = T m C ( Y ( k ) ) ;
(5)根据克隆变异后的抗体群Z(k)重新对图像中的样本点进行类属划分,同时计算抗体群中抗体的亲合度;
(6)依据第(5)步获得的抗体群的亲和度,对克隆变异后的抗体群Z(k)进行克隆选择操作,即从抗体群Z(k)中按照亲和度大小选择n个亲和度最高的抗体组成下一代种群 B ( k + 1 ) = T s C ( Z ( k ) ∪ B ( k ) ) , 当代迭代次数标记k增加1代;
(7)判断迭代次数k是否等于设置的最大迭代次数kmax:如果满足该条件就将抗体群中亲和度最高的抗体对应的图像类属划分作为输出结果,否则返回过程(3),循环执行过程(3)~(7),直到满足停止条件。
2.根据权利要求1所述的图像分类方法,其中过程(1)所说的随机生成初始抗体群B(k)={b1(k),b2(k),…,bn(k)},是依据抗体规模n,类别数K以及待分类图像中全部的样本点序号来随机生成,即根据图像类别数K,从待分类的图像中随机选取K个典型类别样本,将其对应的序号作为抗体编码,获得单个抗体的基因编码;再将该抗体基因编码的生成方式重复执行n次,获得抗体规模为n的抗体群。
3.根据权利要求1所述的图像分类方法,其中过程(2)所说的对图像样本点进行类属划分,具体步骤如下:
(2a)根据抗体表示的K个典型样本,针对图像中的每一个样本点计算它与这K个典型样本之间的流行距离测度 D ( x i , x j ) = min p ∈ P i , j Σ k = 1 | p | - 1 ( ρ dist ( p k , p k + 1 ) - 1 ) , 其中xi,i=1,2,...,M表示图像中的M个样本点,xj,j=1,2,...,K表示图像类属划分时的K个典型样本;
(2b)计算待分类图像中所有样本点与K个典型样本之间流行距离,取K个流行距离中最小的那个典型样本对应的类别标签作为该样本点的类属;
(2c)重复步骤(2a)~(2b)操作,获得待分类图像中M个数据点的类属信息。
4.根据权利要求1所述的图像分类方法,其中过程(2)所说的计算抗体亲和度,是根据抗体编码获得的图像中M个样本点的类属信息,通过以下方式计算抗体群的亲合度:
{f(B(k))}={f(b1(k)),f(b2(k)),…,f(bn(k))},
其中, f ( b i ( k ) ) = 1 / ( 1 + Σ C k ∈ C Σ s ∈ C k D ( s , μ k ) ) , i=1,2,3,…,n,s表示图像中的样本点,b为抗体对应的典型样本序列,C为抗体b对应的图像类属划分,Ck为类属划分k,μk表示类别k的典型样本,D(s,μk)表示图像中第s个样本与典型样本μk的流形距离测度。
5.根据权利要求1所述的图像分类方法,其中过程(4)所说的对克隆增殖后的抗体群进行克隆变异操作Tm C,是对抗体编码的基因值以一定的概率pm进行改变,将对应的基因值随机改变为新的类属的典型样本序号,即:
Z ( k ) = { Z 1 ( k ) , Z 2 ( k ) , . . . , Z n ( k ) }
= { { z 11 , z 12 , . . . , z 1 q 1 } , { z 21 , z 22 , . . . , z 2 q 2 } , . . . , { z n 1 , z n 2 , . . . , z nq n } } = T m C ( Y ( k ) ) ,
= { T m C ( y 11 ) , T m C ( y 12 ) , . . . , T m C ( y 1 q 1 ) , T m C ( y 21 ) , T m C ( y 22 ) , . . . , T m C ( y 2 q 2 ) ,
. . . , T m C ( y n 1 ) , T m C ( y n 2 ) , . . . , T m C ( y nq n ) }
其中, z ij ( k ) = T m C ( y ij ( k ) ) , i=1,2,…,n,j=1,2,…,qi
6.根据权利要求1所述的图像分类方法,其中过程(6)所说的对克隆变异后的抗体群进行克隆选择操作,具体步骤如下:
(6a)从抗体bi(k)和对应的抗体zi *(k)的中选择亲和度高的抗体构成新一代抗体bi(k+1),zi *(k)表示抗体群zij(k)中亲和度最高的抗体,即:
∀ i = 1,2 , . . . , n , z i * ( k ) = arg min z ij ( k ) ∈ Z i ( k ) { f ( z ij ( k ) ) } ,
b i ( k + 1 ) = T s C ( Z i ( k ) ∪ b i ( k ) ) = Δ z i * ( k ) iff ( z i * ( k ) ) > f ( b i ( k ) ) b ( k ) else
(6b)重复执行步骤(6a)n次,获得新的抗体群为
B ( k + 1 ) = T s C ( Z ( k ) ∪ B ( k ) )
= { T s C ( Z 1 ( k ) ∪ b 1 ( k ) ) , T s C ( Z 2 ( k ) ∪ b 2 ( k ) ) , . . . , T s C ( Z n ( k ) ∪ b n ( k ) ) }
= { b 1 ( k + 1 ) , b 2 ( k + 1 ) , . . . , b n ( k + 1 ) }
通过执行克隆选择操作Ts C,从原始抗体群B(k)和对应的克隆变异生成的抗体群Z(k)中,选择出适应度高的抗体,重新组成下一代的抗体群B(k+1)。
CN200810150307A 2008-07-11 2008-07-11 基于流形距离的人工免疫无监督图像分类方法 Pending CN101625725A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810150307A CN101625725A (zh) 2008-07-11 2008-07-11 基于流形距离的人工免疫无监督图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810150307A CN101625725A (zh) 2008-07-11 2008-07-11 基于流形距离的人工免疫无监督图像分类方法

Publications (1)

Publication Number Publication Date
CN101625725A true CN101625725A (zh) 2010-01-13

Family

ID=41521574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810150307A Pending CN101625725A (zh) 2008-07-11 2008-07-11 基于流形距离的人工免疫无监督图像分类方法

Country Status (1)

Country Link
CN (1) CN101625725A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887517A (zh) * 2010-06-13 2010-11-17 重庆理工大学 基于线性加权的免疫克隆手指静脉图像特征提取方法
CN102024262A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 利用流形谱聚类进行图像分割的方法
CN102158413A (zh) * 2011-04-11 2011-08-17 西安电子科技大学 基于邻域免疫克隆选择的多智能体组播路由方法
CN102663562A (zh) * 2012-04-20 2012-09-12 武汉大学 一种基于克隆选择算法的土地资源评价因子级别划分方法
CN103310224A (zh) * 2013-06-08 2013-09-18 上海电机学院 一种无监督的人工免疫分类方法
CN108710892A (zh) * 2018-04-04 2018-10-26 浙江工业大学 面向多种对抗图片攻击的协同免疫防御方法
CN110443809A (zh) * 2019-07-12 2019-11-12 太原科技大学 带边界约束的结构敏感性彩色图像分割超像素化方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887517A (zh) * 2010-06-13 2010-11-17 重庆理工大学 基于线性加权的免疫克隆手指静脉图像特征提取方法
CN101887517B (zh) * 2010-06-13 2012-09-26 重庆理工大学 基于线性加权的免疫克隆手指静脉图像特征提取方法
CN102024262A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 利用流形谱聚类进行图像分割的方法
CN102158413A (zh) * 2011-04-11 2011-08-17 西安电子科技大学 基于邻域免疫克隆选择的多智能体组播路由方法
CN102158413B (zh) * 2011-04-11 2013-09-25 西安电子科技大学 基于邻域免疫克隆选择的多智能体组播路由方法
CN102663562A (zh) * 2012-04-20 2012-09-12 武汉大学 一种基于克隆选择算法的土地资源评价因子级别划分方法
CN102663562B (zh) * 2012-04-20 2015-04-29 武汉大学 一种基于克隆选择算法的土地资源评价因子级别划分方法
CN103310224A (zh) * 2013-06-08 2013-09-18 上海电机学院 一种无监督的人工免疫分类方法
CN108710892A (zh) * 2018-04-04 2018-10-26 浙江工业大学 面向多种对抗图片攻击的协同免疫防御方法
CN108710892B (zh) * 2018-04-04 2020-09-01 浙江工业大学 面向多种对抗图片攻击的协同免疫防御方法
CN110443809A (zh) * 2019-07-12 2019-11-12 太原科技大学 带边界约束的结构敏感性彩色图像分割超像素化方法

Similar Documents

Publication Publication Date Title
CN101625725A (zh) 基于流形距离的人工免疫无监督图像分类方法
CN104931960B (zh) 动向报文与雷达目标态势信息全航迹段数据关联方法
CN105069093B (zh) 一种基于嵌入式索引的水文时间序列相似性搜索方法
CN110163258A (zh) 一种基于语义属性注意力重分配机制的零样本学习方法及系统
CN103473786B (zh) 基于多目标模糊聚类的灰度图像分割方法
CN102592134B (zh) 一种高光谱与红外数据多级决策融合分类方法
CN108846259A (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
CN102279929B (zh) 一种基于对象语义树模型的遥感人造地物目标识别方法
CN106780552B (zh) 基于局部区域联合跟踪检测学习的抗遮挡目标跟踪方法
CN110472572A (zh) 一种复杂环境下海上目标的快速识别和分类方法
CN101980250A (zh) 基于降维局部特征描述子和隐条件随机场的目标识别方法
CN104537647A (zh) 一种目标检测方法及装置
Yue et al. Robust loop closure detection based on bag of superpoints and graph verification
CN105260738A (zh) 基于主动学习的高分辨率遥感影像变化检测方法及系统
CN103810299A (zh) 基于多特征融合的图像检索方法
CN110675374B (zh) 一种基于生成对抗网络的二维图像污水流量检测方法
CN109902714A (zh) 一种基于多图正则化深度哈希的多模态医学图像检索方法
CN104008403B (zh) 一种svm(矢量机)模式的多目标识别判定方法
CN106485239A (zh) 一种利用单类支持向量机检测河流目标的方法
CN113032613B (zh) 一种基于交互注意力卷积神经网络的三维模型检索方法
CN103440508A (zh) 基于视觉词袋模型的遥感图像目标识别方法
CN107016377A (zh) 基于sgasen算法的人脸识别优化方法
CN104809471A (zh) 一种基于空间光谱信息的高光谱图像残差融合分类方法
CN102930291B (zh) 用于图形图像的k近邻局部搜索遗传自动聚类方法
CN114119966A (zh) 基于多视角学习与元学习的小样本目标检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100113