CN105894523A - 一种基于结构张量与图割模型的图像分割方法 - Google Patents

一种基于结构张量与图割模型的图像分割方法 Download PDF

Info

Publication number
CN105894523A
CN105894523A CN201610281307.2A CN201610281307A CN105894523A CN 105894523 A CN105894523 A CN 105894523A CN 201610281307 A CN201610281307 A CN 201610281307A CN 105894523 A CN105894523 A CN 105894523A
Authority
CN
China
Prior art keywords
image
structure tensor
sigma
tensor
est
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610281307.2A
Other languages
English (en)
Inventor
袁家政
刘宏哲
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Union University
Original Assignee
Beijing Union University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Union University filed Critical Beijing Union University
Priority to CN201610281307.2A priority Critical patent/CN105894523A/zh
Publication of CN105894523A publication Critical patent/CN105894523A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于结构张量与图割模型的图像分割方法,属于数字图像处理领域。根据黎曼几何的观点,将图像看作三维欧式空间的一个超曲面,进而得到经典的结构张量ST。将得到的ST与图像的颜色信息相结合,得到扩展的结构张量EST。运用PCA对得到的EST进行降维得到紧缩的结构张量CST。运用PM方程的向量化形式对得到的CST进行非线性扩散。计算两个张量空间的KL距离。将得到的距离刻画带入到GrabCut模型中,完成图像的分割。本发明参数少、计算简单、处理速度快、图像分割效果好,适合于要分割的对象与背景有极高相似度的情况。

Description

一种基于结构张量与图割模型的图像分割方法
技术领域
本发明是基于结构张量和图割模型的图像分割方法,属于数字图像处理领域。
背景技术
图像分割是数字图像处理与计算机视觉领域的一项基本研究问题,通过将图像划分为若干互不重叠的子区域或光滑封闭的曲线,且每个子区域或封闭曲线具有特殊的含义,因此,它成为图像分析与视觉计算的研究基础。视觉活动作为人们在社会生产中认识和了解外界事物的一种主要途径,主要从物体的形状、颜色和纹理三方面来视觉感知的。然而,纹理作为广泛存在于自然界物体表面的一种基本属性,反映物体表面粗糙性、方向性和规则性等,是人们描述和识别不同物体的重要特征之一
近年来,随着计算机技术、电子技术的飞速发展,信息技术在人们生产、生活中的渗透,以及机器视觉系统在各个领域,如国防安全、农产品质量检测、交通管理、生成过程的应用,纹理图像分割技术正在成为机器视觉领域研究的热点课题之一。按照所使用的数学手段不同,纹理描述的方法可以分为:基于统计的方法、基于模型的方法、基于结构分析的方法、以及基于频谱的方法。基于统计的方法主要来源于早期的视觉感知实验,通过对相关统计特征,如利用熵、相关性、平稳性、能量、惯性矩等进行分析与计算来区分不同的纹理,它们不仅具有较好的纹理描述能力,而且计算简单,但都具有较高的计算复杂度。基于模型的方法主要是把纹理看作是某种数学描述的形式化模型,利用信号分析和数理统计等理论方法对纹理模型进行分解和分析来提取纹理特征,在常用的基于模型的方法是马尔科夫随机场模型,主要优点是提供了一种一般而自然的用来表达空间上相关随机变量之间的相互作用的模型。
由于大多数应用场合需要联合分布,而由条件分布推导联合分布通常比较困难。结构分析方法认为纹理是由纹理基元的类型和数目以及基元之间的“重复性”的空间组织结构和排列规则来描述,且纹理基元几乎具有规范的关系,假设纹理图像的基元可以分离出来,以基元特征和排列规则进行纹理分割。由于结构方法强调纹理的规律性,较适用于分析人造纹理,而真实世界的大量自然纹理通常是不规则的,且结构的变化是频繁的,因此对该类方法的应用受到很大程度的限制,相应的研究没有其他三个家族的方法那么广泛和深入。基于频谱的方法将图像的空域信息转化成频谱域表示,使得纹理特征在某些尺度和某些方向上具有较大的响应,进而将不同频率与不同尺度的纹理区域分开。Gabor变换与小波变换各自优势相结合的Gabor小波变换,在空间域与频谱域具有最优的联合分辨率,且具有方位选择性与频率选择性。虽然,Gabor小波具有诸多优势,但是,它的主要缺点在于计算量较大,需要通过手动设置中心频率、空间尺度数和方位数等重要参数,过大的参数设置,将导致提取的纹理特征具有较高的信息冗余度、复杂度、且维数较高。在1991年Bigun等人给出了一种方案:被誉为二阶矩矩阵结构张量ST被用来分割纹理,并分析了其基本特性:仅仅产生三个特征通道,且每个通道比Gabor滤波能提供更多非常显著的信息,而且从中提取出图像的边界、拐角、纹理等重要信息。
发明内容
本发明的目的在于针对传统纹理提取方法计算量大,参数设置复杂的问题,找到一种基于结构张量的纹理提取方法,并将其与颜色信息相结合,引入到GrabCut图割模型中,提出一种准确性和鲁棒性都较好的交互式图像分割算法,实现对彩色纹理图像的精确分割。具体包括如下步骤:
步骤一、根据黎曼几何的观点,将图像看作三维欧式空间的一个超曲面,进而得到经典的结构张量(Structural Tensor)ST。
步骤二、将得到的ST与图像的颜色信息相结合,得到扩展的结构张量(ExtendedStructural Tensor)EST。
步骤三、运用PCA对得到的EST进行降维得到紧缩的结构张量(CompactStructural Tensor)CST。
步骤四、运用PM方程的向量化形式对得到的CST进行非线性扩散。
步骤五、计算两个张量空间的KL距离(Kullback-Leibler Divergence)。
步骤六、将得到的距离刻画带入到GrabCut模型中,完成图像的分割。
本发明的有益效果:参数少,计算简单,处理速度快,图像分割效果好,适合于要分割的对象与背景有极高相似度的情况。
附图说明
图1是本发明的流程示意图
图2、迭代收敛示意图
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
S1、根据黎曼几何的观点,将灰度值图像I(x,y)看作三维欧式空间的一个以(x,y)为参数的(超)曲面S:(x,y,I(x,y)),得到一个弧长微元dI表达式为:
d I = ( ∂ I ∂ x d x + ∂ I ∂ y d y )
进而得到:
| d I | 2 = < d I , d I > = < &part; I &part; x d x + &part; I &part; y d y > 2 = E ( d x ) 2 + 2 F d x d y + G ( d y ) 2
其中其中<a,b>表示向量内积,上式也能够表示为如下二次型:
| d I | 2 = d x d y T A d x d y = d x d y T E F F G d x d y
与上式相同而矩阵即为经典的结构张量,上述描述也可推广到向量值图像,即m维图像I=(I(1),I(2),...,I(m)),对应的线性结构张量为:
A = &Sigma; i = 1 m ( &part; I ( i ) &part; x ) 2 &Sigma; i = 1 m ( &part; I ( i ) &part; x ) ( &part; I ( i ) &part; y ) &Sigma; i = 1 m ( &part; I ( i ) &part; x ) ( &part; I ( i ) &part; y ) &Sigma; i = 1 m ( &part; I ( i ) &part; y ) 2
早在1991年Bigun等人给出了一种迭代方案:被誉为二阶钜矩阵结构张量被用来分割纹理,并分析了其基本特性:仅仅产生三个特征通道,且每个通道比Gabor滤波能提供更多非常显著地信息,而且从中提取出图像的边界、拐角、纹理等重要信息。对于给定的一幅灰度值图像I,其对应的线性结构张量T为:
T = G R ( I x I y I x I y ) = G R ( I x I x I x I y I x I y I y I y ) = T x x T x y T x y T y y
其中GR为方差为R的高斯核函数。
S2、将颜色信息带入到提取的纹理信息中,得到扩展的结构张量。对于灰度图像I,在像素点P构造EST:
E ( p ) T = D P T I P T = I x I y I T
T E = G R ( EE T ) = G R ( I x I y I I x I y I ) = G R ( I x 2 I x I y I x I I y I x I y 2 I y I I x I I y I I 2 )
上式中GR为高斯核函数,Ix,Iy为像素点在x,y方向的偏导,I为像素点的像素值,对于彩色图像,每个像素点包含三个通道,R、G和B分别表示红绿蓝三种颜色通道;
Ip=[IR,IG,IB]T
得到:
F ( P ) T = D ( P ) T I ( P ) T = I x ^ I y ^ I R I G I B T ,
其中
I ^ = 1 3 ( I R + I G + I B ) .
S3、由于F有五个独立分量,所以得到的EST将有15个独立分量,具有很高的维度,而且有冗余度较高,为减少计算量和信息冗余度对EST进行PCA降维得到CST,对于得到的每一个向量F进行PCA降维操作得到F的子空间投影
F ^ = A ( F - F &OverBar; ) = F 1 ^ F 2 ^ T
其中A表示PCA的转换矩阵,表示所有向量F的平均量,表示F的两个主要成分。则最终得到的CST只具有三个独立分量与原始的ST是一样的。
T C = G R ( F ^ F ^ T ) = G R ( F 1 ^ F 1 ^ F 1 ^ F 2 ^ F 2 ^ F 1 ^ F 2 ^ F 2 ^ )
S4、经典的线性结构张量有一个致命的问题,就是在高斯核函数平滑过程中,会产生边界衰减,将导致不相连接的数据在其邻域内产生不精确的结果。解决此问题关键点是利用非线性扩散代替高斯平滑,具体方案是采用非线性扩散Perona-Malik方程的向量化版本:
&part; F i &part; t = d i v ( g ( &Sigma; k = 1 3 | &dtri; F k | 2 ) &dtri; F i ) , &ForAll; i = 1 , 2 , 3
其中F3=IxIy,而g(·)是边缘检测函数,一般表达式有如下两种:
g 1 ( r ) = e - ( K r 2 ) P 2 g 2 ( r ) = 1 1 + ( K &CenterDot; r 2 ) P 2
其中K为常数,P∈R且P≥1。这样,非线性结构张量即为:
J p ^ = F 1 ^ F 3 ^ F 3 ^ F 2 ^
其中是以为初始值的非线性眼花结果。将TC带入到非线性扩散框架中得到非线性紧缩的结构张量
S5、计算结构张量的KL距离,设m,n为图像上的两个像素点的张量KL距离为:
dis T ( T m , T n ) = ( 1 4 ( t r ( T m - 1 T n + T n - 1 T m ) - 4 ) )
其中tr(·)表示计算矩阵的迹。将上一步计算得到的非线性紧缩的结构张量带入到上式中得到KL距离。
S6、将上一步计算得到的KL距离带入到Grabut模型中,得到GMMs能量函数。
E T ( a ) = &Sigma; u &Element; U - log &Sigma; j = 1 k T { &pi; T ( a u , j ) 2 &pi;&sigma; T 2 ( a u , j ) exp ( - dis T 2 ( T u , M r &OverBar; ( a u , j ) ) 2 &sigma; T 2 ( a u , j ) ) } + &Sigma; ( m , n &Element; N ) &lsqb; a m &NotEqual; a n &rsqb; { &gamma; T dis - 1 ( m , n ) exp ( - &beta; T dis T 2 ( T m , T n ) ) }
&beta; T = ( 2 &Sigma; ( m , n &Element; N ) dis T 2 ( T m , T n ) | N | ) - 1
其中au=1时(au,j)表示前景GMM的第j个分量,当au=0时表示背景的第j个分量,U表示人工框选的区域,N表示设定的相邻像素点,τ表示去噪常数,其余的参数遵从原始GrabCut算法的设定。通过GrabCut算法的迭代取得最终的分割效果。

Claims (2)

1.一种基于结构张量与图割模型的图像分割方法,其特征在于:该方法具体包括如下步骤,
步骤一、根据黎曼几何的观点,将图像看作三维欧式空间的一个超曲面,进而得到经典的结构张量ST;
步骤二、将得到的ST与图像的颜色信息相结合,得到扩展的结构张量EST;
步骤三、运用PCA对得到的EST进行降维得到紧缩的结构张量CST;
步骤四、运用PM方程的向量化形式对得到的CST进行非线性扩散;
步骤五、计算两个张量空间的KL距离;
步骤六、将得到的距离刻画带入到GrabCut模型中,完成图像的分割。
2.根据权利要求1所述的一种基于结构张量与图割模型的图像分割方法,其特征在于:
S1、根据黎曼几何的观点,将灰度值图像I(x,y)看作三维欧式空间的一个以(x,y)为参数的(超)曲面S:(x,y,I(x,y)),得到一个弧长微元dI表达式为:
d I = ( &part; I &part; x d x + &part; I &part; y d y )
进而得到:
| d I | 2 = < d I , d I > = < &part; I &part; x d x + &part; I &part; y d y > 2 = E ( d x ) 2 + 2 F d x d y + G ( d y ) 2
其中其中<a,b>表示向量内积,上式也能够表示为如下二次型:
| d I | 2 = d x d y T A d x d y = d x d y T E F F G d x d y
与上式相同而矩阵即为经典的结构张量,上述描述也可推广到向量值图像,即m维图像I=(I(1),I(2),...,I(m)),对应的线性结构张量为:
A = &Sigma; i = 1 m ( &part; I ( i ) &part; x ) 2 &Sigma; i = 1 m ( &part; I ( i ) &part; x ) ( &part; I ( i ) &part; y ) &Sigma; i = 1 m ( &part; I ( i ) &part; x ) ( &part; I ( i ) &part; y ) &Sigma; i = 1 m ( &part; I ( i ) &part; y ) 2
仅仅产生三个特征通道,且每个通道比Gabor滤波能提供更多非常显著地信息,而且从中提取出图像的边界、拐角、纹理等重要信息;对于给定的一幅灰度值图像I,其对应的线性结构张量T为:
T = G R ( I x I y &lsqb; I x I y &rsqb; ) = G R ( I x I x I x I y I x I y I y I y ) = T x x T x y T x y T y y
其中GR为方差为R的高斯核函数;
S2、将颜色信息带入到提取的纹理信息中,得到扩展的结构张量;对于灰度图像I,在像素点P构造EST:
E ( p ) T = D P T I P T = I x I y I T
T E = G R ( EE T ) = G R ( I x I y I &lsqb; I x I y I &rsqb; ) = G R ( I x 2 I x I y I x I I y I x I y 2 I y I I x I I y I I 2 )
上式中GR为高斯核函数,Ix,Iy为像素点在x,y方向的偏导,I为像素点的像素值,对于彩色图像,每个像素点包含三个通道,R、G和B分别表示红绿蓝三种颜色通道;
Ip=[IR,IG,IB]T
得到:
F ( P ) T = D ( P ) T I ( P ) T = I x ^ I y ^ I R I G I B T ,
其中
I ^ = 1 3 ( I R + I G + I B ) .
S3、由于F有五个独立分量,所以得到的EST将有15个独立分量,具有很高的维度,而且有冗余度较高,为减少计算量和信息冗余度对EST进行PCA降维得到CST,对于得到的每一个向量F进行PCA降维操作得到F的子空间投影
其中A表示PCA的转换矩阵,表示所有向量F的平均量,表示F的两个主要成分;则最终得到的CST只具有三个独立分量与原始的ST是一样的;
S4、经典的线性结构张量有一个致命的问题,就是在高斯核函数平滑过程中,会产生边界衰减,将导致不相连接的数据在其邻域内产生不精确的结果;解决此问题关键点是利用非线性扩散代替高斯平滑,具体方案是采用非线性扩散Perona-Malik方程的向量化版本:
&part; F i &part; t = d i v ( g ( &Sigma; k = 1 3 | &dtri; F k | 2 ) &dtri; F i ) , &ForAll; i = 1 , 2 , 3
其中F3=IxIy,而g(·)是边缘检测函数,一般表达式有如下两种:
g 1 ( r ) = e - ( K r 2 ) P 2 g 2 ( r ) = 1 1 + ( K &CenterDot; r 2 ) P 2
其中K为常数,P∈R且P≥1;这样,非线性结构张量即为:
其中是以为初始值的非线性眼花结果;将TC带入到非线性扩散框架中得到非线性紧缩的结构张量
S5、计算结构张量的KL距离,设m,n为图像上的两个像素点的张量KL距离为:
dis T ( T m , T n ) = ( 1 4 ( t r ( T m - 1 T n + T n - 1 T m ) - 4 ) )
其中tr(·)表示计算矩阵的迹;将上一步计算得到的非线性紧缩的结构张量带入到上式中得到KL距离;
S6、将上一步计算得到的KL距离带入到Grabut模型中,得到GMMs能量函数;
E T ( a ) = &Sigma; u &Element; U - log &Sigma; j = 1 K T { &pi; T ( a u , j ) 2 &pi;&sigma; T 2 ( a u , j ) exp ( - dis T 2 ( T u , M r &OverBar; ( a u , j ) ) 2 &sigma; T 2 ( a u , j ) ) } + &Sigma; ( m , n &Element; N ) &lsqb; a m &NotEqual; a n &rsqb; { &gamma; T dis - 1 ( m , n ) exp ( - &beta; T dis T 2 ( T m , T n ) ) } &beta; T = ( 2 &Sigma; ( m , n &Element; N ) dis T 2 ( T m , T n ) | N | ) - 1
其中au=1时(au,j)表示前景GMM的第j个分量,当au=0时表示背景的第j个分量,U表示人工框选的区域,N表示设定的相邻像素点,τ表示去噪常数,其余的参数遵从原始GrabCut算法的设定;通过GrabCut算法的迭代取得最终的分割效果。
CN201610281307.2A 2016-04-28 2016-04-28 一种基于结构张量与图割模型的图像分割方法 Pending CN105894523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610281307.2A CN105894523A (zh) 2016-04-28 2016-04-28 一种基于结构张量与图割模型的图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610281307.2A CN105894523A (zh) 2016-04-28 2016-04-28 一种基于结构张量与图割模型的图像分割方法

Publications (1)

Publication Number Publication Date
CN105894523A true CN105894523A (zh) 2016-08-24

Family

ID=56703187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610281307.2A Pending CN105894523A (zh) 2016-04-28 2016-04-28 一种基于结构张量与图割模型的图像分割方法

Country Status (1)

Country Link
CN (1) CN105894523A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508489A (zh) * 2018-11-07 2019-03-22 山东大学 一种各向异性多孔结构的建模方法及系统
CN113268833A (zh) * 2021-06-07 2021-08-17 重庆大学 一种基于深度联合分布对齐的迁移故障诊断方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592268A (zh) * 2012-01-06 2012-07-18 清华大学深圳研究生院 一种分割前景图像的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592268A (zh) * 2012-01-06 2012-07-18 清华大学深圳研究生院 一种分割前景图像的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SHOUDONG HAN: "Image Segmentation Based on GrabCut Framework Integrating Multiscale Nonlinear Structure Tensor", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 *
XIAO-FENG WANG: "An efficient local Chan–Vese model for image segmentation", 《PATTERN RECOGNITION》 *
宋丽梅: "《模式识别》", 31 August 2015 *
赵在新: "结合半局部信息与结构张量的无监督纹理图像分割", 《中国图象图形学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109508489A (zh) * 2018-11-07 2019-03-22 山东大学 一种各向异性多孔结构的建模方法及系统
CN113268833A (zh) * 2021-06-07 2021-08-17 重庆大学 一种基于深度联合分布对齐的迁移故障诊断方法
CN113268833B (zh) * 2021-06-07 2023-07-04 重庆大学 一种基于深度联合分布对齐的迁移故障诊断方法

Similar Documents

Publication Publication Date Title
CN111080629B (zh) 一种图像拼接篡改的检测方法
CN103208001B (zh) 结合形状自适应邻域和纹理特征提取的遥感图像处理方法
CN111368691B (zh) 无监督高光谱遥感图像空谱特征提取方法
CN105139039A (zh) 视频序列中人脸微表情的识别方法
CN104268593A (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN103177446A (zh) 基于邻域和非邻域平滑先验的图像前景精准提取方法
CN110458192B (zh) 基于视觉显著性的高光谱遥感图像分类方法及系统
CN102750385A (zh) 基于标签检索的相关性—质量排序图像检索方法
CN113112416B (zh) 一种语义引导的人脸图像修复方法
CN106022355A (zh) 基于3dcnn的高光谱图像空谱联合分类方法
CN111563408B (zh) 多层次感知特征渐进自学习的高分辨率影像滑坡自动检测方法
CN112257741B (zh) 一种基于复数神经网络的生成性对抗虚假图片的检测方法
CN104167013A (zh) 一种用于突出显示体数据中目标区域的体绘制方法
CN106023098A (zh) 基于张量结构多字典学习与稀疏编码的图像修补方法
CN102867171B (zh) 一种基于标记传播与邻域嵌入保持的人脸表情识别方法
CN105513060A (zh) 一种视觉感知启发的高分辨率遥感图像分割方法
CN114782417A (zh) 基于边缘强化图像分割的风机数字孪生特征实时检测方法
CN111862027A (zh) 基于低秩稀疏矩阵分解的纺织品瑕疵检测方法
CN103413332B (zh) 基于两通道纹理分割主动轮廓模型的图像分割方法
CN103413351B (zh) 基于压缩感知理论的三维人脸快速重建方法
CN105894523A (zh) 一种基于结构张量与图割模型的图像分割方法
CN104463091A (zh) 一种基于图像lgbp特征子向量的人脸图像识别方法
CN103455798B (zh) 基于最大几何流向直方图的人体检测方法
CN114299382A (zh) 高光谱遥感图像分类方法及系统
CN106407975A (zh) 基于空间‑光谱结构约束的多尺度分层目标检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824