CN104091333A - 基于区域可信融合的多类无监督彩色纹理图像分割方法 - Google Patents
基于区域可信融合的多类无监督彩色纹理图像分割方法 Download PDFInfo
- Publication number
- CN104091333A CN104091333A CN201410308586.8A CN201410308586A CN104091333A CN 104091333 A CN104091333 A CN 104091333A CN 201410308586 A CN201410308586 A CN 201410308586A CN 104091333 A CN104091333 A CN 104091333A
- Authority
- CN
- China
- Prior art keywords
- alpha
- color texture
- sigma
- region
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种无监督彩色纹理图像分割方法,构建彩色纹理特征描述子;采用多变量混合学生t智能最大期望算法对上述的彩色纹理特征描述子进行概率密度分布描述与自适应类别数计算,得到多类彩色纹理图像能量函数;对构建的多类彩色纹理图像能量函数进行多层图割模型优化,得到多类标签图;通过计算多类标签图中的多类标签区域的任意两个区域区域间的可信融合度,并将可信度较小的区域进行融合。本发明能够无监督的计算彩色纹理图像的有效类别数;提高分割结果的整体性与视觉一致性,减少过分割与错误分割;能够对多类能量函数进行局部最优化求解;广泛的应用于实际应用环境,其涉及类型多样,应用领域宽泛。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于区域可信融合的多类无监督彩色纹理图像分割方法。
背景技术
目前,图像分割是计算机视觉领域的一项基本任务,它的目标是以最少的人为干涉或以无监督的方式将图像分割为有意义的目标或子区域,并将这些有意义的分割结果应用于高层的语言分析,如目标识别,场景分析,特效电影,目标检测,医学图像处理,工业检测,基于内容的图像检索等领域。由于彩色纹理图像中包含丰富的颜色信息与纹理信息,以及复杂多变的图像模式,传统的单单依靠颜色信息或纹理信息的方法进行自然图像分割,难以取得满意的分割效果。并且由于人类对人眼的视觉识别机理尚不了解,导致研究符合人眼视觉模式的高效可靠的自然图像分割方法,依然是一个开放的,具有挑战性的问题。而从心理物理学的角度出发,将多种图像特征进行有机结合的方式可以大大提高彩色纹理图像的分割效果。根据颜色特征与纹理特征的提取方式及结合方式,可将彩色纹理图像的分割方法分为三大类:第一类是隐含的颜色与纹理结合方法,它假设颜色信息与纹理信息是相互依赖的图像属性,从单个颜色通道或相关的多个颜色通道来提取特征向量,然后采用由粗到细的方式进行分割。第二类是连续的颜色与纹理结合方式,它的主要动机来源于直觉观察,它没有明显的规则,但是在分割的过程中能够完全自动的描述颜色与纹理之间的依赖关系,并且颜色特征与纹理特征的提取是一个序列的关系。第三类是对颜色特征与纹理特征分开提取,然后采用融合的方式进行彩色纹理图像分割,它在无关的通道上分别提取颜色与纹理特征,然后进行融合,它的优点在于假设颜色与纹理具有不同的模式,且在分割过程中颜色特征与纹理特征的权重可以自适应的计算。虽然这三类彩色纹理图像分割方法在某些应用方面比较有效,但是,在分割的过程中都存在如下几个问题:(1)初始的图像类别数难以确定,如果采用手动设置初始类别数,则可能大大超过实际图像的有效类别数,导致后续分割结果出现过分割以及错误分割现象,并且加大了分割过程的计算代价。(2)对于过分割以及错误分割的处理,采用简单的空间判别准则,它难以进行有效的区域融合与错误区域删除,影响最终分割结果的视觉整体性。
发明内容
为了解决上述问题,本发明的目的是提供基于区域可信融合的多类无监督彩色纹理图像分割方法。
本发明所采用的技术方案是,一种基于区域可信融合的多类无监督彩色纹理图像分割方法,具体按照以下步骤实施:
步骤1、利用压缩的多尺度结构张量纹理信息、尺度倒数信息、以及颜色信息构建彩色纹理特征描述子;
步骤2、采用智能最大期望多变量混合学生t算法,对步骤1得到的彩色纹理特征描述子进行概率密度分布描述与自适应类别数计算,得到多类彩色纹理图像能量函数;
步骤3、对构建的多类彩色纹理图像能量函数进行多层图割模型优化,得到多类标签图;
步骤4、对于步骤3分割后得到的多类标签图,计算多类标签区域的任意两个区域之间的可信融合度,并将可信度较小的区域进行融合。
本发明的特点还在于,
构建彩色纹理特征描述子具体按照以下步骤实施:
步骤1.1、利用多尺度张量理论与主成分分析,提取压缩的多尺度结构张量纹理信息;
步骤1.2、利用全变分流提取局部尺度倒数纹理信息;
步骤1.3、提取彩色纹理图像的颜色信息,并将步骤1.1和步骤1.2中提取的压缩多尺度纹理信息与尺度倒数纹理信息,以及颜色信息构建彩色纹理描述子。
利用多尺度张量理论与主成分分析,提取压缩的多尺度结构张量纹理信息具体按照以下步骤实施:
步骤1.1.1、对于给定的多通道图像I,在多通道图像I中位于(x,y)位置,尺度为s时的结构张量为Ts,则根据MSST描述方式,Ts利用s尺度时的梯度信息来计算得到:
s=0,1,…,S-1 (1)
其中,σ是冗余二进小波的基底,设σ=2,Ts为尺度s时的对称半正定矩阵;S表示多尺度分解的尺度总数,N表示图像I的通道总数,n表示的是在图像I的第n个通道计算梯度;用Γ={T0,T1,…,TS-1}表示一个像素位置对应的S个尺度的纹理特征信息,Γ是个矩阵集合;
步骤1.1.2、对构建的多尺度结构张量Γ={T0,T1,…,TS-1},在各个尺度下分别进行SVD奇异值分解,得到各个尺度对应的特征向量与特征值,将最大的特征值与特征向量相乘即得到主方向的纹理特征向量;具体按照以下步骤实施:
对各个尺度下的结构张量Ts进行纹理特征分解,对于尺度为s时的2x2的结构张量Ts,采用SVD的方式对结构张量Ts进行特征分解,
其中是结构张量Ts的特征值,满足与是分别对应于特征值的特征列向量,对于S个尺度的多尺度结构张量Γ,为了保留各个尺度下的主要纹理特征,取较大的特征值与特征向量来表示尺度为s时的纹理特征向量Vs:
步骤1.1.3、将S个纹理特征向量Vs联合,构建Γ的多尺度纹理特征向量χ=(V0 T,V1 T,…,Vs-1 T)T,χ是2*S维的多尺度纹理特征列向量,它保留了S个尺度下的主要纹理信息;对χ进行PCA降维,利用所有的彩色纹理特征χ,在保留95%的纹理信息的要求下,得到降维投影矩阵Q=(m1,…,mH)2S×H,其中H是χ降维后的维数,mi(i=1,…,H)对应于利用所有的彩色纹理特征向量χ,计算协方差矩阵得到的前H个最大特征值所对应的特征向量构成的投影矩阵,设降维压缩后的纹理特征信息为Yi,即Yi=(χi TQ)T。
利用全变分流提取局部尺度倒数纹理信息,具体按照以下步骤实施:
设自适应迭代的终止次数为TMax,利用相邻两次迭代图像的TV流值的变化来控制尺度倒数特征提取的终止过程,如下
TMax是TV流自适应迭代终止次数,其中表示彩色纹理图像I的第n个通道在t次迭代时的流值变化,δ是图像流值变化比例调和控制因子,对于局部尺度倒数特征值的大小,利用TV流的方式计算得到尺度倒数特征,
其中是稳定状态时的尺度倒数特征,τ是TV流扩散步长,τ的取值满足1≤τ≤5,其中为流值变化判别函数,它满足,如果x>0,否则为0;利用公式(4)与公式(5)自适应迭代计算尺度倒数特征归一化到[0,255]。
提取彩色纹理图像的颜色信息,并将步骤1.1和步骤1.2中提取的压缩多尺度纹理信息与尺度倒数纹理信息,以及颜色信息构成彩色纹理描述子,具体按照以下步骤实施:
将颜色信息,压缩的纹理信息,以及纹理的局部尺度倒数信息相结合,构建一个有效的彩色纹理描述子CΓ,
其中Y是压缩的多尺度纹理特征信息,它是H维的列向量,颜色信息使用图像的RGB信息,为尺度倒数特征,通过将三者结合来构建彩色纹理描述子CΓ,对于彩色纹理描述子CΓ,采用下面非线性扩散滤波的方式对CΓ进行平滑,
设滤波后的彩色纹理描述子为CΓ*,其为H+4维的列向量,需对CΓ*的每一维特征进行上面的非线性滤波;其中K(·)是扩散滤波系数函数,具体函数形式为其中ε是个正数,采用AOS加性分裂算子进行加速。
采用智能最大期望多变量混合学生t算法,对步骤1得到的彩色纹理特征描述子进行概率密度分布描述与自适应类别数计算,具体按照以下步骤实施:
步骤2.1、对于任意一幅彩色纹理图像I,假设其彩色纹理特征描述子为CΓ*,对于任意一个像素位置对应的彩色纹理特征,假设维数为D,其维数D=H+4,利用STMM对彩色纹理图像的特征进行PDF概率分布建模,其概率密度分布函数设为 即
这里,K是当前彩色纹理图像I的有效类数,Θ={ω1,Θ1,…,ωK,ΘK}是对应的K个混合多变量学生t概率分布统计参数集,单个多变量学生t分布,简称为STM,对于任意一个有效类,用一个STM来描述其PDF概率密度分布;则对于第k个有效类,用一个多变量学生t概率分布(STM)来对其进行描述,其中ωk是第k个类的混合权重,Θk是第k个STM的概率密度分布的统计参数,即Θk=(μk,∑k,νk),其中μk,∑k,νk是分别对应于第k个有效类的均值,协方差矩阵,以及自由度参数,而其PDF概率密度函数的具体形式如下,
Γ(·)是Gamma函数,它是一个积分函数,在输入变量为正整数时,是一个阶乘函数;是彩色纹理图像I中,对彩色纹理特征按行排列对应于第x个位置的彩色纹理特征,其中x∈{1,2,…,L},对于K个有效类的STM构成的混合概率分布STMM为
步骤2.2、对于STMM的统计参数集合Θ={ω1,Θ1,…,ωK,ΘK};利用彩色纹理图像I中的所有彩色纹理特征样本结合多变量混合学生-t概率分布STMM,利用最大似然(ML)与最小二乘法进行统计计算,在E步-M步中利用迭代的方式进行更新,在α次迭代时,
公式(9)是对应于E步计算得到的统计结果,其中为彩色纹理特征向量到STMM第k个混合部分STM的归一化概率,是中间变量,是第k个混合部分的权重,Z是每个混合部分的变量个数,即Z=D(D+1)/2+D+1,是迭代过程中有效的混合部分数,它们用于M步计算均值协方差矩阵自由度参数在其分别对应的统计参数的表达式如下,
对于自由参数vk的统计表达式,其满足下面等式:
步骤2.3、在智能自适应的CEM3ST算法过程中,STMM初始的混合部分数为K,对于STMM的初始混合部分数初始化均值与协方差矩阵利用提高的K-Means++[40]来初始化;自由度参数 权重 按下面迭代过程自适应的计算:
要求:K,κ,初始
输出:STMM的,以及KValid
α=0k=1,…,Kx=1,…,L;
初始的最大似然能量值:
DO α=α+1;
DO
E步:对于当前第k个有效STM部分,计算所有彩色纹理到其部分的归一化概率
利用公式(9)计算所有彩色纹理特征对第k个STM的权值贡献并归一化:
这里β是概率分布可控因子;
End if
else 进入M步:
利用最大似然ML更新当前第k个STM的统计参数:
重新计算彩色纹理特征样本到当前第k个STM部分概率,
End else
End DO
重新计算最大似然值:
在智能自适应CEM3ST算法中,κ是自适应能量变化的比例因子,设置κ=1.0e-5;根据彩色纹理图像的内容自适应的选择合适的初始有效类数KValid,对KValid类彩色纹理图像,构建对应的多类能量函数E=E1+λE2,它包含两项,一项是数据项E1,它描述了彩色纹理特征隶属于各个类的相似程度,另一项是区域项E2,它刻画了一定空间邻域内特征之间分配不同标签时的空间约束关系。具体的多类彩色纹理图像能量函数为
对构建的多类彩色纹理图像能量进行多层图割模型优化,得到多类标签图;具体按照以下步骤实施:
对于彩色纹理图像I,设它包含有K类不同的彩色纹理,每类纹理分别用一个STM来描述其彩色纹理特征的概率分布,则对于K类的彩色纹理图像I,构造K-1层的GraphCut图割模型,对于每个层图,设Pm包含图像大小的L个格点,m∈{1,2,…,K-1},则整个K-1层图包含(K-1)L个格点,在K=2时,对应的K-1层图就是普通的一层GraphCut图割模型;在构建K-1层的图割模型G=(V,U)的过程中,顶点集V与边集U,按下列方式定义:
边集U包含能量函数E的两种类型边,即数据项边集U1与区域项边集U2;其中U1描述了彩色纹理特征隶属于K类中任意一类的相似度,其对应于K-1层图中的t-link,在第m个层图Pm上,任意一点p∈Pm,它位于Pm中的xp位置,其对应的彩色纹理特征为它隶属于m+1类的相似度为且在U1中的对应的边为则在m层与m+1层之间,位于在xp位置处的彩色纹理特征对应的t-link边权重为K-1个层图的t-link边集表示为:
对于区域项边集U2,它描述了位于同一图层上Q邻域空间中(Q=4,8,16)彩色纹理特征之间的约束关系,当相邻的彩色纹理特征之间分配不同的类别标签时,利用它们特征之间的距离来计算惩罚项,即对于特征相似的纹理特征分配不同的类别标签时,则设置较大的惩罚权重;在第m个图层上,在Q邻域中位于xp,xq处的两个彩色纹理特征,当它们之间分配不同的类别标签时,其n-link权重设为表示为:
则K-1个图层上的区域项边集为U2:
其中Qp表示位于第m个图层Pk上位于xp处的Q邻域格点集,则用xp处的点与Q邻域中xq处的点,共同计算它们之间的彩色纹理特征差异,对于特征相似且分配不同标签的彩色纹理特征对进行较大的惩罚,尽量避免分割后的区域内部出现空洞,或出现较小离散的区域与噪声区域;通过上面K-1层的GraphCut图割模型的构建,利用Graph Cut最大流最小割的方法对其进行最优化分割。
对于步骤3分割后得到的多类标签图,通过多类标签区域的区域信息来计算区域可信融合度;具体按照以下步骤实施:
步骤4.1、假设GraphCut分割后的任意两个区域Ri与Rj,它们之间的可信融合度设为RCMDi,j,则利用标签区域的空间邻接关系,区域的大小,区域的公共边,以及区域的特征相似性来构建区域的可信融合度:
其中|Ri|与|Rj|分别代表区域Ri与区域Rj的大小,用于刻画当前的两个区域是否是较小的离散区域以及噪声区域,为了拉大两个区域之间的区域大小差异,采用|Ri|·|Rj|/(|Ri|+|Rj|)来计算两个区域之间的区域重要程度;
步骤4.2、引入ψ(·)函数来检测两个区域的空间邻接关系,对于非邻接的两个区域,设置较大的值,表示它们是不邻接的,即不存在公共的边集;
步骤4.3、计算两个区域之间的概率密度相似性,J(·)表示对区域Ri与区域Rj之间的特征相似度进行度量,对于区域Ri与区域Rj,用STM的方式对分割区域的PDF概率密度进行刻画,利用这两个区域各自的均值与协方差矩阵来计算两个区域之间的概率密度距离,用它来代替区域特征之间的相似度,采用对称的J散度距离来度量区域Ri与Rj的特征;在计算区域Ri与Rj之间的特征相似程度时,设置一定大小的区域阈值MinR,对较小区域之间的特征相似度进行适当的处理,
步骤4.4、计算区域间的公共边与原图像边界的匹配度,Ei,j表示区域Ri与区域Rj之间的公共边集,|Ei,j|表示公共边集中的边缘特征点个数,表示公共边集Ei,j中的第n个边缘特征点对应于源图像I中的位置坐标,φ(·)表示Ei,j中第n个公共边点与原图像经过非线性扩散滤波后,利用Canny边缘检测得到的位置的边缘点进行匹配计数,按下式计算得到:
其中LO表示利用上面处理过后Canny边缘检测的边界标记集合,Li,j为区域Ri与区域Rj之间的公共边边集Ei,j的标记集合;
步骤4.5、对K类的所有邻接区域可信融合度值进行归一化:
其中Sf表示GraphCut分割后第f类标签对应的空间离散区域集合,Sf,g表示与Sf中第g个离散区域所有具有邻接关系的区域集合,通过这些标签区域与它的邻接区域之间的关系,利用公式(14)来计算任意两个区域之间的可信融合度,对于所有可信融合度归一化后,进行合理的判别,对于较小的可信融合度值所对应的区域进行删除或融合;同时,对于可信融合度后的标签区域,进行有效的类别数KValid更新。
本发明的有益效果是:(1)能够无监督的计算彩色纹理图像的有效类别数。主要通过CEM3ST算法,在智能最大期望的过程中,通过一次计算一个有效混合部分的特征支持程度来判断当前混合部分是否有效,这种半隐性的判别方式,它能结合已经处理过的有效部分与尚未处理过的有效部分共同参入,加快迭代过程的收敛,且对于无效的混合部分,它的特征支持度在后续迭代的过程中分配给其它的有效部分,增强其它有效部分的生存能力。(2)提高分割结果的整体性与视觉一致性,减少过分割与错误分割。通过分割后区域间的空间临接关系、区域的大小、区域间的特征相似性、以及区域间的公共边信息对相似区域,过分割区域,错误分割区域,以及较小的离散区域进行可信度计算,将可信度较小的区域进行删除及融合。(3)能够对多类能量函数进行局部最优化求解,通过将多类能量函数的最小化问题转化为多层图的最小割问题,利用最大流/最小割理论求得全局近似最优解。
附图说明
图1是本发明多类无监督彩色纹理图像分割流程图;
图2是CEM2方式显性删除无效的类别/通道部分图;
图3是本发明CEM3ST方式半隐性删除无效的类别/通道部分图;
图4是本发明自然彩色纹理图像;
图5是本发明对应于图4自然纹理图像的多层图割模型图;
图6是本发明具有区域同质性的彩色纹理图像;
图7是本发明未进行区域融合得到的分割结果图;
图8是本发明区域可信融合后得到的分割结果图;
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明提供一种基于区域可信融合的多类无监督彩色纹理图像分割方法,具体按照以下步骤实施:
步骤1、利用压缩的多尺度结构张量纹理信息、尺度倒数信息、以及颜色信息构建彩色纹理特征描述子;具体按照以下步骤实施:
步骤1.1、利用多尺度张量理论与主成分分析,提取压缩的多尺度结构张量纹理信息;
步骤1.1.1、对于给定的多通道图像I,在多通道图像I中位于(x,y)位置,尺度为s时的结构张量为Ts,则根据多尺度结构张量(MSST)描述方式,Ts可以利用s尺度时的梯度信息来计算得到:
s=0,1,…,S-1 (1)
其中,σ是冗余二进小波的基底,为了方便计算与节省存储空间,设σ=2,Ts为尺度s时的对称半正定矩阵,它刻画了尺度为s时的纹理信息;S表示多尺度分解的尺度总数,它的大小决定了提取纹理信息的丰富程度,对于图像而言,其中目标的尺度有限,过大的尺度S值,将会导致提取的MSST纹理信息冗余,并可能出现较大尺度提取的结构张量Ts无意义,通过大量的实验分析,在本文中选择S=3比较合适(对于S的自适应确定,超出了本文的研究范围)。N表示图像I的通道总数,像RGB彩色图像N=3,n表示的是在图像I的第n个通道计算梯度;为了方便后续描述,我们用Γ={T0,T1,…,TS-1}表示一个像素位置对应的S个尺度的纹理特征信息,Γ是个矩阵集合。
步骤1.1.2、对构建的多尺度结构张量Γ={T0,T1,…,TS-1},在各个尺度下分别进行奇异值特征分解(SVD),得到各个尺度对应的特征向量与特征值,将最大的特征值与特征向量相乘即得到主方向的纹理特征向量;具体按照以下步骤实施:
由于向量结构的颜色特征与MSST矩阵结构的纹理特征,它们具有不同的特征结构,难以将颜色信息与纹理信息进行有机整体的结合,为了克服特征描述结构的差异性,我们需要对各个尺度下的结构张量Ts进行纹理特征分解,对于尺度为s时的2x2的结构张量Ts,可以采用SVD的方式对结构张量Ts进行特征分解,
其中是结构张量Ts的特征值,满足 与是分别对应于特征值的特征列向量,其维数为2x1。对于S个尺度的多尺度结构张量Γ,为了保留各个尺度下的主要纹理特征,我们取较大的特征值与特征向量来表示尺度为s时的纹理特征向量Vs:
步骤1.1.3、将S个纹理特征向量Vs联合,构建Γ的多尺度纹理特征向量χ=(V0 T,V1 T,…,VS-1 T)T,χ是2*S维的多尺度纹理特征列向量,它保留了S个尺度下的主要纹理信息。对于不同的纹理图像I而言,可能只有几个尺度或某个尺度下的纹理信息比较丰富,为了避免多尺度纹理特征向量的维数过高,减少多尺度纹理信息的冗余,以及后续无监督STMM的彩色纹理图像PDF概率分布建模的时间复杂度与空间复杂度,对χ进行主成分分析(PCA)降维,这样既能保留多尺度纹理特征向量的主要信息,同时又能对多尺度纹理信息进行压缩。我们利用所有的彩色纹理特征χ,在保留95%的纹理信息的要求下,得到降维投影矩阵Q=(m1,…,mH)2S×H,其中H是χ降维后的维数,mi(i=1,…,H)对应于利用所有的彩色纹理特征向量χ,计算协方差矩阵得到的前H个最大特征值所对应的特征向量构成的投影矩阵,设降维压缩后的纹理特征信息为Yi,即Yi=(χi TQ)T。
步骤1.2、由于压缩的纹理特征Yi,它虽然保留了压缩的多尺度纹理信息,但是对于尺度较大的纹理区域,Yi提供的纹理信息有限。而局部区域的尺度倒数信息,经研究发现,可以用于弥补压缩多尺度纹理特征的缺陷,提高纹理的特征描述能力。对于局部尺度倒数信息的提取,Brox采用手动设置全变分流(TV)的迭代终止次数,这可能大大降低了TV流提取较大尺度纹理特征信息的灵活性与有效性,为了提取合适的尺度倒数特征,我们提出了自适应迭代终止过程。通过采用下面的修改,它可以根据图像的内容自适应的提取尺度倒数纹理特征。假设自适应迭代的终止次数为TMax,可以利用相邻两次迭代图像的TV流值的变化来控制尺度倒数特征提取的终止过程,如下
TMax是TV流自适应迭代终止次数,它控制了整个局部尺度倒数特征的提取过程,并可在迭代过程中自适应计算。其中表示彩色纹理图像I的第n个通道在t次迭代时的流值变化,在t=0时,un(t=0)=un,N是图像总的通道数。δ是图像流值变化比例调和控制因子,实验训练设置δ=0.005,确保在相邻两次迭代过程中,图像的TV流值变化能够达到近似稳定的状态。对于局部尺度倒数特征值的大小,由于它与局部区域流值的变化大小成反比,可以利用TV流的方式计算得到尺度倒数特征,
其中是稳定状态时的尺度倒数特征,τ是TV流扩散步长,它控制图像的流值变化速率,为了提取稳定的尺度倒数特征,τ的取值满足1≤τ≤5,其中为流值变化判别函数,它满足,如果x>0,否则为0。利用公式(4)与公式(5)自适应迭代计算尺度倒数特征它提供了局部的尺度倒数信息,克服了Yi对较大尺度纹理描述的缺陷。为了合理构建彩色纹理描述子,我们将归一化到[0,255]。
步骤1.3、提取彩色纹理图像的颜色信息,并将步骤1.1和步骤1.2中提取的压缩多尺度纹理信息与尺度倒数纹理信息,以及颜色信息构建彩色纹理描述子,具体按照以下步骤实施:
为了提高彩色纹理图像的辨识能力,我们需要考虑将颜色信息,压缩的纹理信息,以及纹理的局部尺度倒数信息相结合,构建一个有效的彩色纹理描述子CΓ,
其中Y是压缩的多尺度纹理特征信息,它是H维的列向量,颜色信息我们使用图像的RGB信息,它更加适合人眼的颜色敏感特性,为尺度倒数特征,它提供了纹理的局部尺度信息。通过将三者结合来构建彩色纹理描述子CГ,它能有效的刻画具有颜色差异,纹理差异以及局部尺度差异的彩色纹理图像。对于彩色纹理描述子CГ,由于它可能包含噪声信息,这大大干扰了目标区域的整体一致性,为了减少噪声干扰,同时增强目标的边缘,我们采用下面非线性扩散滤波的方式对CГ进行平滑,保证构建的彩色纹理描述子具有较好的彩色纹理描述能力。
假设滤波后的彩色纹理描述子为CГ*,其为H+4维的列向量,需对CГ*的每一维特征进行上面的非线性滤波。其中K(·)是扩散滤波系数函数,它是个单调减函数,其用于计算扩散滤波的系数,控制扩散滤波过程中的噪声平滑与边缘增强,具体函数形式为其中ε是个正数,用来防止分母被除以0,ζ是扩散滤波调和参数,用来控制同质区域的平滑与边缘增强的程度。在我们的所有试验中,取值ζ=0.7较为合适。为了较快实现非线性扩散滤波过程,我们可以采用AOS加性分裂算子进行加速。
步骤2、采用智能最大期望多变量混合学生t(CEM3ST)算法,对步骤1得到的彩色纹理特征描述子进行概率密度分布(PDF)描述与自适应类别数计算,得到有效地类别数,以及各个有效类对应的相关统计参数,并最终得到多类彩色纹理图像能量函数;具体按照以下步骤实施:
步骤2.1、对于任意一幅彩色纹理图像I,假设其彩色纹理特征描述子为CГ*,对于任意一个像素位置对应的彩色纹理特征假设维数为D,其维数D=H+4,利用STMM对彩色纹理图像的特征进行PDF概率分布建模,其概率密度分布函数设为即
这里,K是当前彩色纹理图像I的有效类数,Θ={ω1,Θ1,…,ωK,ΘK}是对应的K个混合多变量学生t概率分布统计参数集,为了方便,对于单个多变量学生t分布,我们简称其为STM(Student-t model)。在本文的无监督的彩色纹理图像分割中,对于任意一个有效类,我们用一个STM来描述其PDF概率密度分布。则对于第k个有效类,我们可以用一个多变量学生t概率分布(STM)来对其进行描述,其中ωk是第k个类的混合权重,Θk是第k个STM的概率密度分布的统计参数,即Θk=(μk,∑k,vk),其中μk,∑k,vk是分别对应于第k个有效类的均值,协方差矩阵,以及自由度参数,而其PDF概率密度函数的具体形式如下,
Γ(·)是Gamma函数,它是一个积分函数,在输入变量为正整数时,是一个阶乘函数。是彩色纹理图像I中,对彩色纹理特征按行排列对应于第x个位置的彩色纹理特征,其中x∈{1,2,…,L},对于K个有效类的STM构成的混合概率分布STMM为为了便于后续的统计计算,我们简单介绍一下其STMM的各个混合部分STM的统计参数的计算与表达形式。
步骤2.2、对于STMM的统计参数集合Θ={ω1,Θ1,…,ωK,ΘK};可以利用彩色纹理图像I中的所有彩色纹理特征样本结合多变量混合学生-t概率分布STMM,利用最大似然(ML)与最小二乘法进行统计计算,由于各个统计量之间是半封闭的形式,需要在E步-M步中利用迭代的方式进行更新,在α次迭代时,
公式(9)是对应于E步计算得到的统计结果,其中为彩色纹理特征向量到STMM第k个混合部分STM的归一化概率,是中间变量,是第k个混合部分的权重,Z是每个混合部分的变量个数,即Z=D(D+1)/2+D+1,是迭代过程中有效的混合部分数,它们可以用于M步计算均值协方差矩阵自由度参数在其分别对应的统计参数的表达式如下,
对于自由参数vk的统计表达式,其满足下面等式:
由上面(9)(10)(11)的统计表达式可见,统计参数彼此之间是半封闭的关系,这不便于利用彩色纹理特征求STMM对应的各个混合部分STM的统计参数与开且对于STMM的有效混合部分数,即彩色纹理图像的初始的有效类数难以确定,为了进行统计参数的最优化以及确定图像的初始类别数,我们提出了智能自适应的多变量混合学生t概率分布建模算法(CEM3ST算法)。
步骤2.3、由于初始的有效类数KValid难以确定,一般情况下初始的有效类数KValid设置的都很大,如果在初始化迭代过程中不能根据图像的内容自适应的降低KValid值,这将大大增加迭代初始化STMM的KValid个混合部分的统计参数计算负担过大,并且在初始化后,利用较大的K值来构建多层Graph Cut图割模型时,会引起图层数过大,利用最大流最小割求解最优化分割比较慢,且导致最终分割的结果出现过分割与错误分割现象。
为了尽量减少这些问题的出现,我们需要在STMM初始化阶段,能够根据彩色纹理图像的内容自适应的选择一个近视最优的初始有效类数KValid,我们提出的智能自适应CEM3ST算法,它与传统STMM的CEM算法不同,其在迭代求解半封闭统计参数的过程中,不是每次迭代批处理所有K个STM混合部分,而是采用一次求解一个混合部分的方式,且在处理每个混合部分的过程中,其彩色纹理特征样本概率mk,x的归一化,采用已经处理过的所有混合部分的样本概率与尚未处理的混合部分的样本概率,共同参与当前混合部分特征样本的概率归一化,并进一步提高有效混合部分的存活率。同时,对于当前处理的混合部分,利用所有彩色纹理特征对其支持程度进行整体判别,决定当前处理的混合部分是否有效,如果其支持程度较小,则对其进行删除,并进一步将概率传递给其它已处理与尚未处理的混合部分,这样来增强其它混合部分的生命力。
在智能自适应的CEM3ST算法过程中,STMM初始的混合部分数为K,对于STMM的初始混合部分数初始化均值与协方差矩阵可以利用提高的K-Means++[40]来初始化。自由度参数 权重 可按下面迭代过程自适应的计算:
要求:K,κ,初始
输出:STMM的ωk,μk,Σk,以及KValid
α=0,k=1,…,K,x=1,…,L;
初始的最大似然能量值:
DO α=α+1;
DO
E步:对于当前第k个有效STM部分,计算所有彩色纹理到其部分的归一化概率
利用公式(9)计算所有彩色纹理特征对第k个STM的权值贡献并归一化:
这里β是概率分布可控因子;
End if
else 进入M步:
利用最大似然ML更新当前第k个STM的统计参数:
重新计算彩色纹理特征样本到当前第k个STM部分概率,
End else
End DO
重新计算最大似然值:
在智能自适应CEM3ST算法中,κ是自适应能量变化的比例因子,它的大小决定了上面算法的自适应收敛过程,在我们的算法中,为了保证有效混合部分的稳定相交,设置κ=1.0e-5。通过上面的CEM3ST智能自适应迭代算法,它可根据彩色纹理图像的内容自适应的选择合适的初始有效类数KValid。对KValid类彩色纹理图像,构建对应的多类能量函数E=E1+λE2,它包含两项,一项是数据项E1,它描述了彩色纹理特征隶属于各个类的相似程度,另一项是区域项E2,它刻画了一定空间邻域内特征之间分配不同标签时的空间约束关系。具体的多类彩色纹理图像能量函数为
步骤3、对步骤2构建的多类彩色纹理图像能量函数进行多层图割模型优化,得到多类标签图;具体按照以下步骤实施:
对于K类的彩色纹理图像能量函数E的最小化问题,可以通过构建K-1层的GraphCut图割模型,利用GraphCut最大流/最小割的方法进行求解。在构建K-1层图的过程中,我们要将能量函数的数据项转化为t-link,区域项转化为n-link,需要注意,对于K-1层的图割模型,它们具有相同的n-link权值。如图4所示,对于4×4的二维彩色纹理格图,在构建K-1层图的过程中,多层图G=(V,E),V是顶点的集合,E是边的集合,其中V包括两个特殊的端点,一个是源点S,另一个是汇点t,多层图的最大流是从源点S流向汇点t。假设源点代表的是J,G类型的彩色纹理,则在构建第一层图的过程中,我们可以看到边(S,J),(S,G)的边最粗,它表示J,G隶属于源点S对应纹理类的相似度较大,则有较大的概率被分配到S对应的纹理类。而E,F,C,H与源点S对应的纹理类,具有相似的颜色,但有不同的尺度,它们是相似的彩色纹理,则t-link边(S,F),(S,E),(S,C),(S,H)较粗,它们表示具有适当程度的相似度,而A,B,D,I,K,L,MN,O,P与源点S对应的t-link边最细,表示它们隶属于S点对应纹理类的相似度很小。而对于第1层的n-link,相同彩色纹理特征之间的边越粗,说明它们之间越相似,当分配到不同的类别标签时,其惩罚值越大,如(A,B),(C,H),(E,F),(G,J),(I,M),(K,O),(L,P),而其它的n-link边较细,说明它们之间的特征相似性较小,当分配到不同的类别标签时,其惩罚较小,这说明它们是属于不同的类。而对于其它的K-2层图,其构建过程具有与上述相同的特点。
对于彩色纹理图像I,假设它包含有K类不同的彩色纹理,每类纹理分别用一个STM来描述其彩色纹理特征的概率分布,则对于K类的彩色纹理图像I,我们可以利用上面图1的方式来构造K-1层的GraphCut图割模型,对于每个层图,假设Pm包含图像大小的L个格点,m∈{1,2,…,K-1},则整个K-1层图包含(K-1)L个格点。在K=2时,对应的K-1层图就是普通的一层GraphCut图割模型。在构建K-1层的图割模型G=(V,U)的过程中,顶点集V与边集U,可以按下列方式定义:
边集U包含能量函数E的两种类型边,即数据项边集U1与区域项边集U2。其中U1描述了彩色纹理特征隶属于K类中任意一类的相似度,其对应于K-1层图中的t-link,如图3中,在第m个层图Pm上,任意一点p∈Pm,它位于Pm中的xp位置,其对应的彩色纹理特征为它隶属于m+1类的相似度为且在U1中的对应的边为则在m层与m+1层之间,位于在xp位置处的彩色纹理特征对应的t-link边权重为因此,K-1个层图的t-link边集可以表示为:
对于区域项边集U2,它描述了位于同一图层上Q邻域空间中(Q=4,8,16)彩色纹理特征之间的约束关系,当相邻的彩色纹理特征之间分配不同的类别标签时,利用它们特征之间的距离来计算惩罚项,即对于特征相似的纹理特征分配不同的类别标签时,则设置较大的惩罚权重。如在第m个图层上,在Q邻域中位于xp,xq处的两个彩色纹理特征,当它们之间分配不同的类别标签时,其n-link权重设为它可以表示为:
则K-1个图层上的区域项边集为U2:
其中Qp表示位于第m个图层Pk上位于xp处的Q邻域格点集,则可用xp处的点与Q邻域中xq处的点,共同计算它们之间的彩色纹理特征差异,对于特征相似且分配不同标签的彩色纹理特征对进行较大的惩罚,尽量避免分割后的区域内部出现空洞,或出现较小离散的区域与噪声区域。通过上面K-1层的GraphCut图割模型的构建,如图5所示,利用Boykov提出的Graph Cut最大流最小割的方法对其进行最优化分割。
步骤4、对于步骤3分割后得到的多类标签图,通过对多类标签区域的任意两个区域之间,利用区域的空间邻接关系,区域大小,区域间特征相似性,以及区域间公共边,这4种信息来共同计算区域间的可信融合度,并将可信度较小的区域进行融合;具体按照以下步骤实施:
对于步骤3分割后的标签区域,如图7所示,存在过分割与错误分割现象,这严重影响了分割区域的整体性与视觉一致性。通过利用步骤3分割后任意两个邻接标签区域的:空间邻接关系,区域的大小,区域间的特征相似性,以及区域间的公共边,这4种信息来共同计算任意两个邻接区域间的可信融合度。然后将区域融合度较小的两个区域进行融合,得到如图8所示的分割结果。
步骤4.1、计算标签区域的空间邻接关系,对于多类分割的标签区域,每类标签在物理空间都可能对应多个区域,对于图像空间多类标签区域,可采用区域生长的方式对多类标签进行编码,同时统计各个区域之间的空间临接关系;
如图Fig.4所示的简单彩色纹理图像而言,它包含的同质纹理区域具有空间的约束关系,此外,邻接区域之间具有特征的差异性与相似性。对于非同质区域,它们之间存在明显的公共边,以及不同大小区域等信息。而这些分割后的相关区域信息可以用于判断分割后的区域是否可信,通过合理的区域可信度计算,可以有效减少过分割以及错误分割现象。如图7中的标签区域,它存在严重的过分割以及错误分割。对于图7中的标签1区域,可以利用空间约束关系将具有相同标签不相邻的区域分开。而对于图7中标签区域8和9,它们是具有空间邻接关系的标签区域,可以通过区域之间的特征相似性判别它们是否相似,对于特征相似度较大的区域可以将其融合。对于图7中标签区域6和7,它们是较小的离散区域或噪声区域,可能是视觉上无意义的,为了减少这种情况的出现,可以像MeanShift的方式,利用区域的大小来判别各个分割区域的有效性,对于较小的孤立区域,将其融合到其相似度最大的邻接区域,如分别融合到标签区域2和8。而对于右下标签区域1和5,它们是错误的分割,或者说是过分割,可以用于邻接区域的公共边信息,与原图像I提取的边进行匹配,如果这两个邻接区域之间的公共边在原图像中找不到对应的边,或者边匹配的响应值很小,则我们认为这两个邻接区域的分割是错误的,应该将它们融合为一体。如果是如图7所示的分割结果,为了避免过分割与错误分割,以及有效的减少彩色纹理图像后续迭代过程中的类别数K,我们可以利用标签区域的空间邻接关系,区域的大小,区域的公共边,以及区域的特征相似性这四种信息进行结合,通过构建合理的区域可信融合度,如图8所示,经过合理的判别,将错误的分割区域,过分割的区域,以及噪声区域进行有效的删除与融合,来提高图像分割结果的有机整体性与视觉一致性。
假设GraphCut分割后的任意两个区域Ri与Rj,它们之间的可信融合度设为RCMDi,j,则可以利用上面四种信息来构建区域的可信融合度:
其中|Ri|与|Rj|分别代表区域Ri与区域Rj的大小,它们可以用于刻画当前的两个区域是否是较小的离散区域以及噪声区域,为了拉大两个区域之间的区域大小差异,我们采用|Ri|·|Rj|/(|Ri|+|Rj|)来计算两个区域之间的区域重要程度。
步骤4.2、对于区域间的公共边,可先对多类标签区域进行差分变换,求得对应的多类标签区域间的公共边。同时,对于计算的公共边,需结合步骤4.1多标签区域的区域编码,按边界像素的空间延伸方式进行遍历,来共同标记各个边界片段属于哪两个邻接区域。
引入ψ(·)函数来检测两个区域的空间邻接关系。对于非邻接的两个区域,设置较大的值,表示它们是不邻接的,即不存在公共的边集。
步骤4.3、计算两个区域之间的概率密度相似性,J(·)表示对区域Ri与区域Rj之间的特征相似度进行度量,对于区域Ri与区域Rj,在本文中我们用STM的方式对分割区域的PDF概率密度进行刻画,可以利用这两个区域各自的均值与协方差矩阵来计算两个区域之间的概率密度距离,用它来代替区域特征之间的相似度,传统的方式可以利用Mahalanobis距离或KL距离来度量概率密度之间的距离,但是由于它们之间的概率密度距离是非交换的,导致为了克服这个缺陷,可以采用对称的J散度距离来度量区域Ri与Rj的特征。由于GraphCut分割后,可能存在较小的区域,并且这些较小的区域内部的特征可能极其相似,在计算其协方差矩阵时,导致逆协方差矩阵的元素较大,甚至出现其行列式为趋向无穷的情况,导致它们之间的概率密度距离度量无效,为了避免这种情况的发生,在计算区域Ri与Rj之间的特征相似程度时,需要设置一定大小的区域阈值MinR,对较小区域之间的特征相似度进行适当的处理,
步骤4.4、计算区域间的公共边与原图像边界的匹配度,Ei,j表示区域Ri与区域Rj之间的公共边集,|Ei,j|表示公共边集中的边缘特征点个数,表示公共边集Ei,j中的第n个边缘特征点对应于源图像I中的位置坐标,φ(·)表示Ei,j中第n个公共边点与原图像经过非线性扩散滤波后,利用Canny边缘检测得到的位置的边缘点进行匹配计数,可以按下式计算得到:
其中LO表示利用上面处理过后Canny边缘检测的边界标记集合,Li,j为区域Ri与区域Rj之间的公共边边集Ei,j的标记集合。
步骤4.5、为了便于邻接区域的融合比较,需要对K类的所有邻接区域可信融合度值进行归一化:
其中Sf表示GraphCut分割后第f类标签对应的空间离散区域集合,Sf,g表示与Sf中第g个离散区域所有具有邻接关系的区域集合,通过这些标签区域与它的邻接区域之间的关系,可以利用(14)来计算任意两个区域之间的可信融合度,对于所有可信融合度归一化后,可以进行合理的判别,对于较小的可信融合度值所对应的区域进行删除或融合。同时,对于可信融合度后的标签区域,进行有效的类别数KValid更新。
本文发明专利在BSD300自然图像库,人工合成的彩色纹理图像上进行了系统的验证与测试分析。通过大量图像分割的结果可见:(1)本发明提出的多类无监督彩色纹理图像分割方法,能够有效的分割出具有完整性与视觉一致性的区域结果。(2)在CEM3ST算法中,能够有效的减少无效的类别数。(3)且对于多层图割分割后的标签区域,能够通过区域间的空间临接关系、区域的大小、区域间的特征相似性、以及区域间的公共边信息减少过分割以及错误分割现象。(4)最终分割的量化统计结果高于其它彩色纹理图像分割方法。
本发明的优点主要包括以下几个方面:(1)能够无监督的计算彩色纹理图像的有效类别数。主要通过CEM3ST算法,在智能最大期望的过程中,通过一次计算一个有效混合部分的特征支持程度来判断当前混合部分是否有效,这种半隐性的判别方式,它能结合已经处理过的有效部分与尚未处理过的有效部分共同参入,加快迭代过程的收敛,且对于无效的混合部分,它的特征支持度在后续迭代的过程中分配给其它的有效部分,增强其它有效部分的生存能力。(2)提高分割结果的整体性与视觉一致性,减少过分割与错误分割。通过分割后区域间的空间临接关系、区域的大小、区域间的特征相似性、以及区域间的公共边信息对相似区域,过分割区域,错误分割区域,以及较小的离散区域进行可信度计算,将可信度较小的区域进行删除及融合。(3)能够对多类能量函数进行局部最优化求解,通过将多类能量函数的最小化问题转化为多层图的最小割问题,利用最大流/最小割理论求得全局近似最优解。
本发明专利提出的基于STMM概率分布建模与区域可信度融合的无监督彩色纹理图像分割方法,它可以广泛的应用于实际应用环境,其涉及类型多样,应用领域宽泛。例如:在医学领域,利用MRI(Magnetic Resonance Imaging)、CT(Computer Tomography)、CTA(Computer Tomography Augment)、DSA(Digital Subtraction Angiography)等各种成像技术进行超声、血管造影、核磁共振等医学影像,结合图像分割对肺、脑组织、血管、心脏、肌肉、骨骼等器官组织进行病灶区域分割,进而检测与定位疾病区域,为合理可靠地设计治疗方案提供重要的参考数据。在图像检索领域,利用底层特征分割得到的区域进行内容描述,并对内容进行标注建立与索引,提升图像或视频数据库中针对特定对象或特定片段内容的检索效果,为媒体和通讯运营商提供更为细致个性化的服务。在产品自动化检测领域,通过对产品的形状与结构进行分割与检测,减轻机械的人为视觉判断过程。在气象领域,通过对遥感云图中不同云系和背景分布的分割来辅助天气预报等。在数字娱乐方面,从图像和视频中分割出人脸或手等感兴趣目标区域,通过对区域的动作或行为进行分析,在显示器或虚拟屏幕上做出及时响应。因此,本发明具有较大的市场应用价值与理论研究价值。
Claims (8)
1.一种基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,具体按照以下步骤实施:
步骤1、利用压缩的多尺度结构张量纹理信息、尺度倒数信息、以及颜色信息构建彩色纹理特征描述子;
步骤2、采用智能最大期望多变量混合学生t算法,对步骤1得到的彩色纹理特征描述子进行概率密度分布描述与自适应类别数计算,得到多类彩色纹理图像能量函数;
步骤3、对构建的多类彩色纹理图像能量函数进行多层图割模型优化,得到多类标签图;
步骤4、对于步骤3分割后得到的多类标签图,计算多类标签区域的任意两个区域之间的可信融合度,并将可信度较小的区域进行融合。
2.根据权利要求1所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述构建彩色纹理特征描述子具体按照以下步骤实施:
步骤1.1、利用多尺度张量理论与主成分分析,提取压缩的多尺度结构张量纹理信息;
步骤1.2、利用全变分流提取局部尺度倒数纹理信息;
步骤1.3、提取彩色纹理图像的颜色信息,并将步骤1.1和步骤1.2中提取的压缩多尺度纹理信息与尺度倒数纹理信息,以及颜色信息构建彩色纹理描述子。
3.根据权利要求2所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述利用多尺度张量理论与主成分分析,提取压缩的多尺度结构张量纹理信息具体按照以下步骤实施:
步骤1.1.1、对于给定的多通道图像I,在多通道图像I中位于(x,y)位置,尺度为s时的结构张量为Ts,则根据MSST描述方式,Ts利用s尺度时的梯度信息来计算得到:
s=0,1,…,S-1 (1)
其中,σ是冗余二进小波的基底,设σ=2,Ts为尺度s时的对称半正定矩阵;S表示多尺度分解的尺度总数,N表示图像I的通道总数,n表示的是在图像I的第n个通道计算梯度;用Γ={T0,T1,…,TS-1}表示一个像素位置对应的S个尺度的纹理特征信息,Γ是个矩阵集合;
步骤1.1.2、对构建的多尺度结构张量Γ={T0,T1,…,TS-1},在各个尺度下分别进行SVD奇异值分解,得到各个尺度对应的特征向量与特征值,将最大的特征值与特征向量相乘即得到主方向的纹理特征向量;具体按照以下步骤实施:
对各个尺度下的结构张量Ts进行纹理特征分解,对于尺度为s时的2x2的结构张量Ts,采用SVD的方式对结构张量Ts进行特征分解,
其中是结构张量Ts的特征值,满足 与是分别对应于特征值的特征列向量,对于S个尺度的多尺度结构张量Γ,为了保留各个尺度下的主要纹理特征,取较大的特征值与特征向量来表示尺度为s时的纹理特征向量Vs:
步骤1.1.3、将S个纹理特征向量Vs联合,构建Γ的多尺度纹理特征向量χ=(V0 T,V1 T,…,VS-1 T)T,χ是2*S维的多尺度纹理特征列向量,它保留了S个尺度下的主要纹理信息;对χ进行PCA降维,利用所有的彩色纹理特征χ,在保留95%的纹理信息的要求下,得到降维投影矩阵Q=(m1,…,mH)2S×H,其中H是χ降维后的维数,mi(i=1,…,H)对应于利用所有的彩色纹理特征向量χ,计算协方差矩阵得到的前H个最大特征值所对应的特征向量构成的投影矩阵,设降维压缩后的纹理特征信息为Yi,即
4.根据权利要求3所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述利用全变分流提取局部尺度倒数纹理信息,具体按照以下步骤实施:
设自适应迭代的终止次数为TMax,利用相邻两次迭代图像的TV流值的变化来控制尺度倒数特征提取的终止过程,如下
TMax是Tv流自适应迭代终止次数,其中表示彩色纹理图像I的第n个通道在t次迭代时的流值变化,δ是图像流值变化比例调和控制因子,对于局部尺度倒数特征值的大小,利用TV流的方式计算得到尺度倒数特征,
其中是稳定状态时的尺度倒数特征,τ是TV流扩散步长,τ的取值满足1≤τ≤5,其中为流值变化判别函数,它满足,如果x>0,否则为0;利用公式(4)与公式(5)自适应迭代计算尺度倒数特征 归一化到[0,255]。
5.根据权利要求4所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述提取彩色纹理图像的颜色信息,并将步骤1.1和步骤1.2中提取的压缩多尺度纹理信息与尺度倒数纹理信息,以及颜色信息构成彩色纹理描述子,具体按照以下步骤实施:
将颜色信息,压缩的纹理信息,以及纹理的局部尺度倒数信息相结合,构建一个有效的彩色纹理描述子CΓ,
其中Y是压缩的多尺度纹理特征信息,它是H维的列向量,颜色信息使用图像的RGB信息,为尺度倒数特征,通过将三者结合来构建彩色纹理描述子CΓ,对于彩色纹理描述子CΓ,采用下面非线性扩散滤波的方式对CΓ进行平滑,
设滤波后的彩色纹理描述子为CΓ*,其为H+4维的列向量,需对CΓ*的每一维特征进行上面的非线性滤波;其中K(·)是扩散滤波系数函数,具体函数形式为其中ε是个正数,采用AOS加性分裂算子进行加速。
6.根据权利要求5所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述采用智能最大期望多变量混合学生t算法,对步骤1得到的彩色纹理特征描述子进行概率密度分布描述与自适应类别数计算,具体按照以下步骤实施:
步骤2.1、对于任意一幅彩色纹理图像I,假设其彩色纹理特征描述子为CΓ*,对于任意一个像素位置对应的彩色纹理特征假设维数为D,其维数D=H+4,利用STMM对彩色纹理图像的特征进行PDF概率分布建模,其概率密度分布函数设为即
这里,K是当前彩色纹理图像I的有效类数,Θ={ω1,Θ1,…,ωK,ΘK}是对应的K个混合多变量学生t概率分布统计参数集,单个多变量学生t分布,简称为STM,对于任意一个有效类,用一个STM来描述其PDF概率密度分布;则对于第k个有效类,用一个多变量学生t概率分布(STM)来对其进行描述,其中ωk是第k个类的混合权重,Θk是第k个STM的概率密度分布的统计参数,即Θk=(μk,∑k,νk),其中μk,∑k,νk是分别对应于第k个有效类的均值,协方差矩阵,以及自由度参数,而其PDF概率密度函数的具体形式如下,
Γ(·)是Gamma函数,它是一个积分函数,在输入变量为正整数时,是一个阶乘函数;是彩色纹理图像I中,对彩色纹理特征按行排列对应于第x个位置的彩色纹理特征,其中x∈{1,2,…,L},对于K个有效类的STM构成的混合概率分布STMM为
步骤2.2、对于STMM的统计参数集合Θ={ω1,Θ1,…,ωK,ΘK};利用彩色纹理图像I中的所有彩色纹理特征样本结合多变量混合学生-t概率分布STMM,利用最大似然(ML)与最小二乘法进行统计计算,在E步-M步中利用迭代的方式进行更新,在α次迭代时,
公式(9)是对应于E步计算得到的统计结果,其中为彩色纹理特征向量到STMM第k个混合部分STM的归一化概率,是中间变量,是第k个混合部分的权重,Z是每个混合部分的变量个数,即Z=D(D+1)/2+D+1,是迭代过程中有效的混合部分数,它们用于M步计算均值协方差矩阵自由度参数在其分别对应的统计参数的表达式如下,
对于自由参数vk的统计表达式,其满足下面等式:
步骤2.3、在智能自适应的CEM3ST算法过程中,STMM初始的混合部分数为K,对于STMM的初始混合部分数初始化均值 与协方差矩阵 利用提高的K-Means++[40]来初始化;自由度参数权重 按下面迭代过程自适应的计算:
要求:K,κ,初始
输出:STMM的ωk,μk,∑k,以及KValid
初始的最大似然能量值:
DO α=α+1;
DO
E步:对于当前第k个有效STM部分,计算所有彩色纹理到其部分的归一化概率
利用公式(9)计算所有彩色纹理特征对第k个STM的权值贡献并归一化:
这里β是概率分布可控因子;
End if
else进入M步:
利用最大似然ML更新当前第k个STM的统计参数:
重新计算彩色纹理特征样本到当前第k个STM部分概率,
End else
End DO
重新计算最大似然值:
在智能自适应CEM3ST算法中,κ是自适应能量变化的比例因子,设置κ=1.0e-5;根据彩色纹理图像的内容自适应的选择合适的初始有效类数KValid,对KValid类彩色纹理图像,构建对应的多类能量函数E=E1+λE2,它包含两项,一项是数据项E1,它描述了彩色纹理特征隶属于各个类的相似程度,另一项是区域项E2,它刻画了一定空间邻域内特征之间分配不同标签时的空间约束关系,具体的多类彩色纹理图像能量函数为
7.根据权利要求6所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述对构建的多类彩色纹理图像能量函数进行多层图割模型优化,得到多类标签图;具体按照以下步骤实施:
对于彩色纹理图像I,设它包含有K类不同的彩色纹理,每类纹理分别用一个STM来描述其彩色纹理特征的概率分布,则对于K类的彩色纹理图像I,构造K-1层的GraphCut图割模型,对于每个层图,设Pm包含图像大小的L个格点,m∈{1,2,…,K-1},则整个K-1层图包含(K-1)L个格点,在K=2时,对应的K-1层图就是普通的一层GraphCut图割模型;在构建K-1层的图割模型G=(V,U)的过程中,顶点集V与边集U,按下列方式定义:
边集U包含能量函数E的两种类型边,即数据项边集U1与区域项边集U2;其中U1描述了彩色纹理特征隶属于K类中任意一类的相似度,其对应于K-1层图中的t-link,在第m个层图Pm上,任意一点p∈Pm,它位于Pm中的xp位置,其对应的彩色纹理特征为它隶属于m+1类的相似度为且在U1中的对应的边为则在m层与m+1层之间,位于在xp位置处的彩色纹理特征对应的t-link边权重为K-1个层图的t-link边集表示为:
对于区域项边集U2,它描述了位于同一图层上Q邻域空间中(Q=4,8,16)彩色纹理特征之间的约束关系,当相邻的彩色纹理特征之间分配不同的类别标签时,利用它们特征之间的距离来计算惩罚项,即对于特征相似的纹理特征分配不同的类别标签时,则设置较大的惩罚权重;在第m个图层上,在Q邻域中位于xp,xq处的两个彩色纹理特征,当它们之间分配不同的类别标签时,其n-link权重设为 表示为:
则K-1个图层上的区域项边集为U2:
其中Qp表示位于第m个图层Pk上位于xp处的Q邻域格点集,则用xp处的点与Q邻域中xq处的点,共同计算它们之间的彩色纹理特征差异,对于特征相似且分配不同标签的彩色纹理特征对进行较大的惩罚,尽量避免分割后的区域内部出现空洞,或出现较小离散的区域与噪声区域;通过上面K-1层的GraphCut图割模型的构建,利用Graph Cut最大流最小割的方法对其进行最优化分割。
8.根据权利要求7所述的基于区域可信融合的多类无监督彩色纹理图像分割方法,其特征在于,所述对于步骤3分割后得到的多类标签图,计算多类标签区域的任意两个区域之间的可信融合度,并将可信度较小的区域进行融合;具体按照以下步骤实施:
步骤4.1、假设GraphCut分割后的任意两个区域Ri与Rj,它们之间的可信融合度设为RCMDi,j,则利用标签区域的空间邻接关系,区域的大小,区域的公共边,以及区域的特征相似性来构建区域的可信融合度:
其中|Ri|与|Rj|分别代表区域Ri与区域Rj的大小,用于刻画当前的两个区域是否是较小的离散区域以及噪声区域,为了拉大两个区域之间的区域大小差异,采用|Ri|·|Rj|/(|Ri|+|Rj|)来计算两个区域之间的区域重要程度;
步骤4.2、引入ψ(·)函数来检测两个区域的空间邻接关系,对于非邻接的两个区域,设置较大的值,表示它们是不邻接的,即不存在公共的边集;
步骤4.3、计算两个区域之间的概率密度相似性,J(·)表示对区域Ri与区域Rj之间的特征相似度进行度量,对于区域Ri与区域Rj,用STM的方式对分割区域的PDF概率密度进行刻画,利用这两个区域各自的均值与协方差矩阵来计算两个区域之间的概率密度距离,用它来代替区域特征之间的相似度,采用对称的J散度距离来度量区域Ri与Rj的特征;在计算区域Ri与Rj之间的特征相似程度时,设置一定大小的区域阈值MinR,对较小区域之间的特征相似度进行适当的处理,
步骤4.4、计算区域间的公共边与原图像边界的匹配度,Ei,j表示区域Ri与区域Rj之间的公共边集,|Ei,j|表示公共边集中的边缘特征点个数,表示公共边集Ei,j中的第n个边缘特征点对应于源图像I中的位置坐标,φ(·)表示Ei,j中第n个公共边点与原图像经过非线性扩散滤波后,利用Canny边缘检测得到的位置的边缘点进行匹配计数,按下式计算得到:
其中LO表示利用上面处理过后Canny边缘检测的边界标记集合,Li,j为区域Ri与区域Rj之间的公共边边集Ei,j的标记集合;
步骤4.5、对K类的所有邻接区域可信融合度值进行归一化:
其中Sf表示GraphCut分割后第f类标签对应的空间离散区域集合,Sf,g表示与Sf中第g个离散区域所有具有邻接关系的区域集合,通过这些标签区域与它的邻接区域之间的关系,利用公式(14)来计算任意两个区域之间的可信融合度,对于所有可信融合度归一化后,进行合理的判别,对于较小的可信融合度值所对应的区域进行删除或融合;同时,对于可信融合度后的标签区域,进行有效的类别数KValid更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308586.8A CN104091333A (zh) | 2014-07-01 | 2014-07-01 | 基于区域可信融合的多类无监督彩色纹理图像分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308586.8A CN104091333A (zh) | 2014-07-01 | 2014-07-01 | 基于区域可信融合的多类无监督彩色纹理图像分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104091333A true CN104091333A (zh) | 2014-10-08 |
Family
ID=51639048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410308586.8A Pending CN104091333A (zh) | 2014-07-01 | 2014-07-01 | 基于区域可信融合的多类无监督彩色纹理图像分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104091333A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389343A (zh) * | 2015-10-23 | 2016-03-09 | 北京工业大学 | 一种向量化降维方法 |
CN105528773A (zh) * | 2015-12-31 | 2016-04-27 | 深圳市一体医疗科技有限公司 | 基于标记法的多模态微波成像方法及系统 |
CN105678726A (zh) * | 2015-12-31 | 2016-06-15 | 深圳市一体医疗科技有限公司 | 基于标记法的多模态微波成像方法及系统 |
CN106529552A (zh) * | 2016-11-03 | 2017-03-22 | 中国海洋大学 | 一种扇贝贝壳生长纹路的分割与识别方法 |
CN107833225A (zh) * | 2017-10-18 | 2018-03-23 | 中南民族大学 | 基于特征驱动启发式四色标签的图像分割方法及系统 |
CN108182716A (zh) * | 2017-12-28 | 2018-06-19 | 厦门大学 | 一种面向3d打印的基于向量场的图像线刻画生成方法 |
CN108364276A (zh) * | 2018-03-13 | 2018-08-03 | 重庆大学 | 基于标签数据库的纹理图像合成方法 |
CN110837836A (zh) * | 2019-11-05 | 2020-02-25 | 中国科学技术大学 | 基于最大化置信度的半监督语义分割方法 |
CN112150478A (zh) * | 2020-08-31 | 2020-12-29 | 温州医科大学 | 一种构建半监督图像分割框架的方法及系统 |
CN112766395A (zh) * | 2021-01-27 | 2021-05-07 | 中国地质大学(北京) | 一种图像匹配方法、装置、电子设备及可读存储介质 |
CN113223098A (zh) * | 2021-06-07 | 2021-08-06 | 江南大学 | 图像颜色分类的预处理优化方法 |
WO2021249520A1 (zh) * | 2020-06-12 | 2021-12-16 | 华为技术有限公司 | 图像处理方法、装置及存储介质 |
CN117456416B (zh) * | 2023-11-03 | 2024-06-07 | 北京饼干科技有限公司 | 智能生成素材标签的方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001338290A (ja) * | 2000-05-26 | 2001-12-07 | Minolta Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
CN102903110A (zh) * | 2012-09-29 | 2013-01-30 | 宁波大学 | 对具有深度图像信息的图像的分割方法 |
-
2014
- 2014-07-01 CN CN201410308586.8A patent/CN104091333A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001338290A (ja) * | 2000-05-26 | 2001-12-07 | Minolta Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
CN102903110A (zh) * | 2012-09-29 | 2013-01-30 | 宁波大学 | 对具有深度图像信息的图像的分割方法 |
Non-Patent Citations (2)
Title |
---|
杨勇: "基于多尺度结构张量的无监督彩色纹理图像分割方法研究", 《万方学位论文数据库》 * |
杨勇等: "基于多尺度结构张量的多类无监督彩色纹理图像分割方法", 《计算机辅助设计与图形学学报》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389343A (zh) * | 2015-10-23 | 2016-03-09 | 北京工业大学 | 一种向量化降维方法 |
CN105389343B (zh) * | 2015-10-23 | 2019-08-16 | 北京工业大学 | 一种向量化降维方法 |
CN105528773A (zh) * | 2015-12-31 | 2016-04-27 | 深圳市一体医疗科技有限公司 | 基于标记法的多模态微波成像方法及系统 |
CN105678726A (zh) * | 2015-12-31 | 2016-06-15 | 深圳市一体医疗科技有限公司 | 基于标记法的多模态微波成像方法及系统 |
CN106529552B (zh) * | 2016-11-03 | 2019-11-08 | 中国海洋大学 | 一种扇贝贝壳生长纹路的分割与识别方法 |
CN106529552A (zh) * | 2016-11-03 | 2017-03-22 | 中国海洋大学 | 一种扇贝贝壳生长纹路的分割与识别方法 |
CN107833225A (zh) * | 2017-10-18 | 2018-03-23 | 中南民族大学 | 基于特征驱动启发式四色标签的图像分割方法及系统 |
CN107833225B (zh) * | 2017-10-18 | 2020-06-16 | 中南民族大学 | 基于特征驱动启发式四色标签的图像分割方法及系统 |
CN108182716A (zh) * | 2017-12-28 | 2018-06-19 | 厦门大学 | 一种面向3d打印的基于向量场的图像线刻画生成方法 |
CN108182716B (zh) * | 2017-12-28 | 2020-12-15 | 厦门大学 | 一种面向3d打印的基于向量场的图像线刻画生成方法 |
CN108364276A (zh) * | 2018-03-13 | 2018-08-03 | 重庆大学 | 基于标签数据库的纹理图像合成方法 |
CN108364276B (zh) * | 2018-03-13 | 2021-12-03 | 重庆大学 | 基于标签数据库的纹理图像合成方法 |
CN110837836A (zh) * | 2019-11-05 | 2020-02-25 | 中国科学技术大学 | 基于最大化置信度的半监督语义分割方法 |
WO2021249520A1 (zh) * | 2020-06-12 | 2021-12-16 | 华为技术有限公司 | 图像处理方法、装置及存储介质 |
CN112150478A (zh) * | 2020-08-31 | 2020-12-29 | 温州医科大学 | 一种构建半监督图像分割框架的方法及系统 |
CN112150478B (zh) * | 2020-08-31 | 2021-06-22 | 温州医科大学 | 一种构建半监督图像分割框架的方法及系统 |
CN112766395A (zh) * | 2021-01-27 | 2021-05-07 | 中国地质大学(北京) | 一种图像匹配方法、装置、电子设备及可读存储介质 |
CN112766395B (zh) * | 2021-01-27 | 2023-11-28 | 中国地质大学(北京) | 一种图像匹配方法、装置、电子设备及可读存储介质 |
CN113223098A (zh) * | 2021-06-07 | 2021-08-06 | 江南大学 | 图像颜色分类的预处理优化方法 |
CN117456416B (zh) * | 2023-11-03 | 2024-06-07 | 北京饼干科技有限公司 | 智能生成素材标签的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104091333A (zh) | 基于区域可信融合的多类无监督彩色纹理图像分割方法 | |
US11170502B2 (en) | Method based on deep neural network to extract appearance and geometry features for pulmonary textures classification | |
Bi et al. | Automatic liver lesion detection using cascaded deep residual networks | |
CN104408429B (zh) | 一种视频代表帧提取方法及装置 | |
Yu et al. | Context-based hierarchical unequal merging for SAR image segmentation | |
CN107122809A (zh) | 基于图像自编码的神经网络特征学习方法 | |
CN107977671A (zh) | 一种基于多任务卷积神经网络的舌象分类方法 | |
CN102651128B (zh) | 一种基于采样的图像集分割方法 | |
CN109902736A (zh) | 一种基于自动编码器构建特征表示的肺结节图像分类方法 | |
CN108734719A (zh) | 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法 | |
CN110084318A (zh) | 一种结合卷积神经网络和梯度提升树的图像识别方法 | |
CN107316294A (zh) | 一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法 | |
CN107145889A (zh) | 基于具有RoI池化的双CNN网络的目标识别方法 | |
CN102663757A (zh) | 基于核传递的半自动图像分割方法 | |
CN108875829A (zh) | 一种乳腺肿瘤图像的分类方法及系统 | |
CN109448015A (zh) | 基于显著图融合的图像协同分割方法 | |
Kanavati et al. | Supervoxel classification forests for estimating pairwise image correspondences | |
CN104408731B (zh) | 基于区域图和统计相似性编码的sar图像分割方法 | |
CN104318563A (zh) | 一种基于医学图像的器官骨架提取方法 | |
CN110428426A (zh) | 一种基于改进随机森林算法的mri图像自动分割方法 | |
CN106096612A (zh) | 实蝇图像识别系统及方法 | |
Yang et al. | Color texture segmentation based on image pixel classification | |
Tyagi et al. | Performance comparison and analysis of medical image segmentation techniques | |
Kaur et al. | Optimized multi threshold brain tumor image segmentation using two dimensional minimum cross entropy based on co-occurrence matrix | |
Banerjee et al. | A CADe system for gliomas in brain MRI using convolutional neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141008 |