CN103065333A - 一种基于四元数的彩色snake图像分割方法 - Google Patents

一种基于四元数的彩色snake图像分割方法 Download PDF

Info

Publication number
CN103065333A
CN103065333A CN2012105336931A CN201210533693A CN103065333A CN 103065333 A CN103065333 A CN 103065333A CN 2012105336931 A CN2012105336931 A CN 2012105336931A CN 201210533693 A CN201210533693 A CN 201210533693A CN 103065333 A CN103065333 A CN 103065333A
Authority
CN
China
Prior art keywords
partiald
snake
curve
image
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105336931A
Other languages
English (en)
Other versions
CN103065333B (zh
Inventor
金良海
李向
刘宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201210533693.1A priority Critical patent/CN103065333B/zh
Publication of CN103065333A publication Critical patent/CN103065333A/zh
Application granted granted Critical
Publication of CN103065333B publication Critical patent/CN103065333B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明属于计算机图像处理领域,为一种基于四元数的彩色snake图像分割方法。①输入一幅待分割的RGB空间彩色图像,并将该图像表示到四元数空间;②计算①中得到的四元数空间下表示的彩色图像的梯度幅值;③在待分割的RGB空间彩色图像上勾勒出感兴趣物体的初始轮廓线;④利用②所得到的梯度幅值定义snake模型的外力,实时计算snake曲线的能量Em;将当前的snake曲线的能量Em与上一时刻的snake曲线的能量Em进行比较,当满足迭代参数时,所得到的snake曲线即为感兴趣物体的轮廓线。本发明依据得到的彩色图像梯度定义snake分割模型的图像外力,与传统的将彩色图像转为灰度图像处理或三通道分别处理的结果相比,能更快收敛到感兴趣物体的边缘,分割更准确。

Description

一种基于四元数的彩色snake图像分割方法
技术领域
本发明属于图像处理领域,涉及一种彩色图像分割方法,具体涉及一种基于四元数的彩色图像分割方法。
背景技术
随着近现代计算机和存储技术的飞速发展,各种电子数码照相设备得到普及,我们的日常生活都与各种电子数码影像技术相关,尤其是自然图像的处理得到越来越多的关注,而自然图像一般为彩色图像,彩色图像分割对于图像分析、理解和目标识别是至关重要的。
在传统的计算机视觉领域,严格各自独立的分层理论有着深远的影响,传统的理论认为底层的视觉任务只能依赖于由图像本身获得的信息来完成。1988年Kass等人首次提出主动轮廓模型(又被称作snake模型),他们认为在许多的图像理解任务中,底层事件的正确理解依赖于高层知识。被称为snake的主动轮廓模型是能量极小化的样条,内力约束其形状,外力控制其变形行为,图像力将其引导至显著性的图像特征,snake模型的曲线能量将在图像特征附近极小化。Snake模型的成功之处还在于它对一系列广泛的视觉问题给出了统一的解决办法,从该模型首次提出,在近20年的研究中,snake模型已被成功应用于计算机视觉的许多领域,如边缘提取、图像分割和运动跟踪等。
然而该模型一直局限于灰度图像的处理,很少见诸于彩色图像的snake模型,究其主要原因是一直没有好的方法用来计算彩色图像的梯度,进而定义snake模型的图像外力。
发明内容
本发明的目的在于提供一种基于四元数的彩色snake图像分割方法,该方法将一个彩色像素作为一个整体进行处理,并在处理过程中很好地体现彩色三通道间的光谱联系。
本发明提供的一种基于四元数的彩色snake图像分割方法,其特征在于,该方法包括下述步骤:
第1步输入一幅待分割的RGB空间彩色图像,并将该图像表示到四元数空间;
第2步计算第1步中得到的四元数空间下表示的彩色图像的梯度幅值;
第3步在输入的待分割的RGB空间彩色图像上勾勒出感兴趣物体的初始轮廓线;
第4步利用第2步所得到的梯度幅值定义snake模型的外力,实时计算snake曲线的能量Em;将当前的snake曲线的能量Em与上一时刻的snake曲线的能量Em进行比较,当满足迭代参数时,所得到的snake曲线即为感兴趣物体的轮廓线;
第2步中,按照下述过程计算得到梯度幅值:
用(R(x,y),G(x,y),B(x,y))表示待分割的RGB空间彩色图像,R(x,y),G(x,y),B(x,y)分别代表彩色图像的红绿蓝三通道,(x,y)代表像素坐标,则包含色度和亮度的彩色距离平方函数f(θ)写为:
f(θ)=Ecos2θ+2Fcosθsinθ+Hsin2θ
其中θ(θ∈[-π/2,π/2])为图像梯度向量的角度方向,E,F,H定义如下:
E = E 1 + E 2 F = F 1 + F 2 H = H 1 + H 2
E 1 = r x 2 + g x 2 + b x 2 F 1 = r x r y + g x g y + b x b y H 1 = r y 2 + g y 2 + b y 2
E 2 = ( w 1 ∂ R ( x , y ) ∂ x + w 2 ∂ G ( x , y ) ∂ x + w 3 ∂ B ( x , y ) ∂ x ) 2 F 2 = ( w 1 ∂ R ( x , y ) ∂ x + w 2 ∂ G ( x , y ) ∂ x + w 3 ∂ B ( x , y ) ∂ x ) ( w 1 ∂ R ( x , y ) ∂ y + w 2 ∂ G ( x , y ) ∂ y + w 3 ∂ B ( x , y ) ∂ y ) H 2 = ( w 1 ∂ R ( x , y ) ∂ y + w 2 ∂ G ( x , y ) ∂ y + w 3 ∂ B ( x , y ) ∂ y ) 2
r x = ∂ R ( x , y ) ∂ x - 1 3 ( ∂ R ( x , y ) ∂ x + ∂ G ( x , y ) ∂ x + ∂ B ( x , y ) ∂ x ) r y = ∂ R ( x , y ) ∂ y - 1 3 ( ∂ R ( x , y ) ∂ y + ∂ G ( x , y ) ∂ y + ∂ B ( x , y ) ∂ y ) g x = ∂ G ( x , y ) ∂ x - 1 3 ( ∂ R ( x , y ) ∂ x + ∂ G ( x , y ) ∂ x + ∂ B ( x , y ) ∂ x ) g y = ∂ G ( x , y ) ∂ y - 1 3 ( ∂ R ( x , y ) ∂ y + ∂ G ( x , y ) ∂ y + ∂ B ( x , y ) ∂ y ) b x = ∂ B ( x , y ) ∂ x - 1 3 ( ∂ R ( x , y ) ∂ x + ∂ G ( x , y ) ∂ x + ∂ B ( x , y ) ∂ x ) b y = ∂ B ( x , y ) ∂ y - 1 3 ( ∂ R ( x , y ) ∂ y + ∂ G ( x , y ) ∂ y + ∂ B ( x , y ) ∂ y )
其中E,F,H,E1,F1,H1,E2,F2,H2,rx,gx,bx,ry,gy,by为临时变量,其中E,E1,H1,E2,H2∈[0,∞);
则彩色距离平方函数f(θ)的最大值fmax和使得f(θ)取得最大值fmax的方向θmax为:
f max = 1 2 ( ( E + H ) + ( E - H ) 2 + ( 2 F ) 2 )
θ max = sgn ( F ) arcsin ( f max - E 2 f max - E - H ) 1 / 2 + nπ , ( E - H ) 2 + F 2 ≠ 0 Undefined , ( E - H ) 2 + F 2 = 0
式中n取整数,其中sgn(□)为符号函数:
sgn ( F ) = 1 , F &GreaterEqual; 0 - 1 , F < 0
同时θmax满足如下的约束关系:
&theta; max &Element; n&pi; + 0 , &pi; / 4 , F &GreaterEqual; 0 andE - H &GreaterEqual; 0 &pi; / 4 , &pi; / 2 , F &GreaterEqual; 0 andE - H < 0 - &pi; / 2 , - &pi; / 4 , F < 0 andE - H < 0 - &pi; / 4 , 0 , F < 0 andE - H &GreaterEqual; 0
fmax为所得的彩色图像梯度的幅值,θmax为所得的彩色图像梯度的角度。
作为上述技术方案的改进,第3步具体包括下述过程:
设待分割的RGB空间彩色图像的大小为row×col×3,以该RGB空间彩色图像的几何中心为中心,以(row-1)和(col-1)作为矩形两邻边,在该RGB空间彩色图像上勾勒出一个包含感兴趣物体的矩形轮廓即为初始snake轮廓线v(s)=(x(s),y(s)),其中(x,y)代表构成初始轮廓线v(s)的像素的坐标,s∈(0,1)是将曲线进行参数化表示时的归一化参数。
作为上述技术方案的进一步改进,第4步具体包括下述过程:
第4.1步设定给定snake模型的形变参数,包括弹性系数α、刚性系数β和阻尼系数γ的值,α,β,γ∈[0,∞),将v(s)视作s和时间t的函数,即将snake曲线v(s)视作一条动态曲线v(s,t),给定时间步长1,迭代次数上限M,M为整数,且M∈[100,1500],记初始勾勒snake曲线的时刻t=t0=0,此时snake曲线能量记为Esnake=E0,令时间步的序号为m,其初始值为0;
第4.2步令m=m+1,依据式一得到tm时刻的snake曲线,再依据式二计算tm时刻snake曲线的能量Em
x t m = ( A + &gamma;I ) - 1 ( &gamma;x t m - 1 - F x ( x t m - 1 , y t m - 1 ) ) y t m = ( A + &gamma;I ) - 1 ( &gamma;y t m - 1 - F y ( x t m - 1 , y t m - 1 ) ) 式一
E m = &Integral; 0 1 ( E int ( v ( s ) ) + E ext ( v ( s ) ) ) ds 式二
其中,Eint(v(s))表示snake曲线的内部能量,Eext(v(s))表示snake曲线的外部能量,令Eext(v(s))=-fmax
第4.3步将tm时刻的snake曲线的能量Em与tm-1时刻的snake曲线能量Em-1进行比较,若Em<Em-1,则用tm时刻的snake曲线更新替换tm-1时刻的snake曲线,再进入第4.4步,否则直接执行第4.4步;
第4.4步,判断m≤M是否成立,如果是,则返回第4.2步,否则输出第M次循环所得snake曲线即为算法所得感兴趣物体的轮廓线。
本发明提供一种基于四元数的彩色snake图像分割方法。该方法首先利用四元数来表示彩色图像,可以将彩色像素当作一个整体进行处理,能很好地体现彩色三通道间的光谱联系。再依据本发明提出的一种基于四元数的彩色图像梯度计算方法来计算彩色图像的梯度,并以该梯度来定义snake模型的图像力,引导snake形变收敛到感兴趣物体的边缘,以达到分割出感兴趣物体的目的。
附图说明
图1为本发明一种基于四元数的彩色snake图像分割方法流程图;
图2为本发明一种基于四元数的彩色snake图像分割方法应用于一幅常见的彩色图像分割的实例;
图2a为常见的图像分割数据库中的一幅彩色图像;
图2b为应用本发明提出的基于四元数的彩色图像梯度计算方法得到的图2a的梯度幅值图;
图2c中沿着图像边缘的矩形框是本发明中由计算机自动确定的初始snake轮廓线;
图2d为本发明迭代一种基于四元数的彩色snake图像分割方法迭代1000次后得到的轮廓线。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明提供的一种基于四元数的彩色snake图像分割方法,包括以下步骤:
第1步输入一幅待分割的RGB空间彩色图像R(x,y),G(x,y),B(x,y),记图像大小为row×col×3,并将该图像表示到四元数空间。
四元数最初由Hamilton于1843年发现,四元数其实是复数的扩展。一个四元数(q)包含一个实部(q0)和三个虚部(q1,q2,q3),经常被表示为如下形式:
q=q0+q1i+q2j+q3k            (1)
其中q0,q1,q2和q3都是实数,i,j和k是三个虚部单位,并满足如下的运算法则:
i 2 = j 2 = k 2 = ijk = - 1 ij = k , jk = i , ki = j ji = - k , kj = - i , ik = - j - - - ( 2 )
四元数的模和共轭定义如下:
| q | = q 0 2 + q 1 2 + q 2 2 + q 3 2 - - - ( 3 )
q*=q0-q1i-q2j-q3k           (4)
如果一个四元数的实部为0,我们称该四元数为纯虚四元数;如果一个四元数的模为1,我们称该四元数为单位四元数;如果一个纯虚四元数的模为1,我们称该四元数为单位纯虚四元数。
RGB空间的一个彩色像素[r,g,b]T在四元数空间可以用一个纯虚四元数表示:
q=ri+gj+bk                  (5)
其中r,g,b分别对应RGB彩色空间中一个彩色像素的红绿蓝三通道的颜色值。
第2步计算第1步中得到的四元数空间下表示的彩色图像的梯度。
本发明提出一种全新的基于四元数的彩色图像梯度计算方法。
我们定义一个单位纯虚四元数
Figure BDA00002566367000071
依据式(4)的定义,其共轭四元数为
Figure BDA00002566367000072
依据式(2)的四元数运算法则,则UqU*代表着在RGB三维颜色空间将一个彩色像素q围绕着灰度轴μ=i+j+k(因为μ所代表的彩色像素红绿蓝三通道的颜色值相同,都为1,所以可以用颜色向量μ=i+j+k代表灰度轴)旋转180度,这也就是说像素q和UqU*在彩色空间中是关于灰度轴μ对称的。因此,依据向量加法的平行四边形法则和颜色相消原理,像素q+UqU*应该落在灰度轴上。
我们现在假设有两个彩色像素分别用两个纯虚四元数表示为q1=r1i+g1j+b1k和q2=r2i+g2j+b2k,我们定义:
q3=q2+Uq1U*=r3i+g3j+b3k                   (6)
那么我们可以利用q3来定义如下的四元数用以表示两个像素q1和q2之间的色调差别:
Q ( q 1 , q 2 ) = ( r 3 - r 3 + g 3 + b 3 3 ) i + ( g 3 - r 3 + g 3 + b 3 3 ) j + ( b 3 - r 3 + g 3 + b 3 3 ) k - - - ( 7 )
通过简单的计算转换,上式可写为:
Q ( q 1 , q 2 ) = ( ( r 2 - r 1 ) - 1 3 ( ( r 2 - r 1 ) + ( g 2 - g 1 ) + ( b 2 - b 1 ) ) ) i +
( ( g 2 - g 1 ) - 1 3 ( ( r 2 - r 1 ) + ( g 2 - g 1 ) + ( b 2 - b 1 ) ) ) j + - - - ( 8 )
( ( b 2 - b 1 ) - 1 3 ( ( r 2 - r 1 ) + ( g 2 - g 1 ) + ( b 2 - b 1 ) ) ) k
我们再作如下定义:
CD(q1,q2)=|Q(q1,q2)|2+|I(q1,q2)|2        (9)
I(q1,q2)=w1(r2-r1)+w2(g2-g1)+w3(b2-b1)        (10)
式(9)中CD(q1,q2)表示两个彩色像素q1,q2之间的颜色距离,该颜色距离由两部分组成:色度距离|Q(q1,q2)|2和亮度距离|I(q1,q2)|2,其中色度距离|Q(q1,q2)|2为式(8)所得四元数的模的平方,亮度距离为式(10)的绝对值的平方。式(10)中wi(i=1,2,3),wi∈(0,1)分别代表着红、绿、蓝三通道对图像亮度的贡献权值,典型情况下,我们取w1=w2=w3=1/3,意味着彩色图像亮度值为三个通道的平均值;在YIQ、YUV和YCbCr颜色空间中其亮度通道的值是由红绿蓝三通道值按照w1=0.299,w2=0.587,w3=0.114的比例计算所得。
在上面分析的基础上进一步研究,本发明提出一个全新的基于四元数的彩色图像梯度计算方法:
我们用(R(x,y),G(x,y),B(x,y))代表RGB彩色空间中的一幅彩色图像,R(x,y),G(x,y),B(x,y)分别代表彩色图像的红绿蓝三通道,(x,y)代表像素坐标,则包含色度和亮度的彩色距离平方函数f(θ)可写为:
f(θ)=Ecos2θ+2Fcosθsinθ+Hsin2θ             (11)
其中θ(θ∈[-π/2,π/2])为图像梯度向量的角度方向,式(11)中E,F,H定义如下:
E = E 1 + E 2 F = F 1 + F 2 H = H 1 + H 2 - - - ( 12 )
E 1 = r x 2 + g x 2 + b x 2 F 1 = r x r y + g x g y + b x b y H 1 = r y 2 + g y 2 + b y 2 - - - ( 13 )
E 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; x + w 2 &PartialD; G ( x , y ) &PartialD; x + w 3 &PartialD; B ( x , y ) &PartialD; x ) 2 F 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; x + w 2 &PartialD; G ( x , y ) &PartialD; x + w 3 &PartialD; B ( x , y ) &PartialD; x ) ( w 1 &PartialD; R ( x , y ) &PartialD; y + w 2 &PartialD; G ( x , y ) &PartialD; y + w 3 &PartialD; B ( x , y ) &PartialD; y ) H 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; y + w 2 &PartialD; G ( x , y ) &PartialD; y + w 3 &PartialD; B ( x , y ) &PartialD; y ) 2 - - - ( 14 )
r x = &PartialD; R ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) r y = &PartialD; R ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y ) g x = &PartialD; G ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) g y = &PartialD; G ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y ) b x = &PartialD; B ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) b y = &PartialD; B ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y ) - - - ( 15 )
式(12)到(15)中E,F,H,E1,F1,H1,E2,F2,H2,rx,gx,bx,ry,gy,by为临时变量,其中E,E1,H1,E2,H2∈[0,∞)。
则彩色距离平方函数f(θ)的最大值fmax和使得f(θ)取得最大值fmax的方向θmax为:
f max = 1 2 ( ( E + H ) + ( E - H ) 2 + ( 2 F ) 2 ) - - - ( 16 )
&theta; max = sgn ( F ) arcsin ( f max - E 2 f max - E - H ) 1 / 2 + n&pi; , ( E - H ) 2 + F 2 &NotEqual; 0 Undefined , ( E - H ) 2 + F 2 = 0 - - - ( 17 )
sgn ( F ) = 1 , F &GreaterEqual; 0 - 1 , F < 0 - - - ( 18 )
同时θmax满足如下的约束关系:
&theta; max &Element; n&pi; + 0 , &pi; / 4 , F &GreaterEqual; 0 andE - H &GreaterEqual; 0 &pi; / 4 , &pi; / 2 , F &GreaterEqual; 0 andE - H < 0 - &pi; / 2 , - &pi; / 4 , F < 0 andE - H < 0 - &pi; / 4 , 0 , F < 0 andE - H &GreaterEqual; 0 - - - ( 19 )
式(17)和式(19)中,n取任一整数,其中sgn(□)为符号函数。
fmax即为本发明提出基于四元数的彩色梯度计算方法所得的彩色图像梯度的幅值,θmax即为本发明提出基于四元数的彩色图像梯度计算方法所得的彩色图像梯度的角度。
第3步第1步中输入的彩色图像的大小为row×col×3,以输入图像的几何中心为中心,以(row-1)和(col-1)作为矩形两邻边,在输入图像上勾勒出一个包含感兴趣物体的矩形轮廓即为初始snake轮廓线v(s)=(x(s),y(s)),其中(x,y)代表构成初始轮廓线v(s)的像素的坐标,s∈(0,1)是将曲线进行参数化表示时的归一化参数。给定snake模型的形变参数(包括弹性系数α、刚性系数β和阻尼系数γ)的值,α,β,γ∈[0,∞),将v(s)视作s和时间t的函数,即将snake曲线v(s)视作一条动态曲线v(s,t),给定时间步长1,迭代次数上限M(M∈[100,1500],M∈Z),记初始勾勒snake曲线的时刻t=t0=0,此时snake曲线能量记为Esnake=E0,令时间步的序号为m,其初始值为0。
第4步令m=m+1,依据式(32)得到tm时刻的snake曲线,再依据式(33)计算tm时刻snake曲线的能量Em
为了使式(33)中定义的曲线能量Esnake最小,由变分原理可知,曲线v(s)必须满足如下欧拉方程:
&alpha;v &prime; &prime; ( s ) - &beta; v &prime; &prime; &prime; &prime; ( s ) - &dtri; E ext = 0 - - - ( 20 )
从物理学角度对snake模型进行分析,可以把式(20)看成为如下的力平衡方程:
Fint(v)+Fext(v)=0                            (21)
其中内力项Fint(v)定义为:
Fint(v)=αv″(s)-βv″″(s)                  (22)
外力项Fext(v)定义为:
F ext ( v ) = - &dtri; E ext - - - ( 23 )
为求解式(20),我们将v(s)视作s和时间t的函数,即把曲线v(s)看作一个动态的曲线v(s,t),根据牛顿第二定律,使轮廓线v(s,t)动态变化必须满足:
m &PartialD; 2 v &PartialD; t 2 = F int ( v ) + F ext ( v ) + F damp ( v ) - - - ( 24 )
其中Fdamp(v)为阻尼力:
F damp ( v ) = - &gamma; &PartialD; v &PartialD; t - - - ( 25 )
m为质量单位,γ为阻尼系数。在图像分割中,为了防止惯性项
Figure BDA00002566367000114
驱动轮廓超越边界,一般将质量单位m取为0,这样将式(25)代入式(24)得到snake的动力学方程为:
&gamma; &PartialD; v &PartialD; t = F int ( v ) + F ext ( v ) - - - ( 26 )
该方程即为snake曲线随时间变化的力平衡方程,当曲线的内力和外力相等时,曲线处于平衡状态停止运动,也即snake曲线达到能量最小化状态。
利用有限差分对式(20)进行离散化,可得到相应的欧拉方程:
α(vi-vi-1)-α(vi+1-vi)+β(vi-2-2vi-1+vi)-2β(vi-1-2vi+vi+1)
+β(vi-2vi+1+vi+2)+(Fx(i)+Fy(i))=0            (27)
其中:
F x ( i ) = &PartialD; E ext &PartialD; x | x = x i , F y ( i ) = &PartialD; E ext &PartialD; y | y = y i , i=0,1...N-1                                      (28)
(注:snake曲线v(s)由N个像素点组成分别表示为vi,vi=v(xi(s),yi(s)),表示对梯度幅值图求x方向偏导数在vi点取得的值,即x=xi的时候梯度幅值图x方向偏导数的值)。
N为组成snake曲线的像素点个数。我们可以将式(27)以矩阵的形式表示为如下形式:
Ax + F x = 0 Ay + F y = 0 - - - ( 29 )
其中AN×N为系数α和β所确定的稀疏带状对角矩阵,记
a = 2 &alpha; + 6 &beta; b = - ( &alpha; + 4 &beta; ) c = &beta;
则AN×N可写为:
Figure BDA00002566367000123
根据无惯性动力学方程式(26)可得:
Ax t m + F x = - &gamma; ( x t m - 1 - x t m - 1 ) Ay t m + F y = - &gamma; ( y t m - 1 - y t m - 1 ) - - - ( 31 )
对式(31)做进一步的求解可得最终迭代解为:
x t m = ( A + &gamma;I ) - 1 ( &gamma;x t m - 1 - F x ( x t m - 1 , y t m - 1 ) ) y t m = ( A + &gamma;I ) - 1 ( &gamma;y t m - 1 - F y ( x t m - 1 , y t m - 1 ) ) - - - ( 32 )
其中γ为阻尼系数,t为时间变量,具体求解是为离散的迭代次数,Fx,Fy定义见式(28),A是由α和β系数所确定的稀疏带状对角矩阵,定义见式(30),I为实单位矩阵。
依据式(32)得到更新的snake曲线后,利用第2步中式(16)所得彩色图像梯度幅值来定义snake模型的外部能量来计算曲线的能量,snake曲线的能量函数为:
E m = E snake ( v ( s ) ) = &Integral; 0 1 E snake ( v ( s ) ) ds
= &Integral; 0 1 ( E int ( v ( s ) ) + E ext ( v ( s ) ) ) ds - - - ( 33 )
其中Eint(v(s))表示曲线的内部能量,Eext(v(s))表示曲线的外部能量。内部能量为snake曲线提供张力和刚力,来控制曲线的连续性和光滑性,其中内部能量Eint(v(s))定义如下:
E int ( v ( s ) ) = 1 2 [ &alpha; | v &prime; ( s ) | 2 + &beta; | v &prime; &prime; ( s ) | 2 ] - - - ( 34 )
其中:
v &prime; ( s ) = &PartialD; v ( s ) &PartialD; s , v &prime; &prime; ( s ) = &PartialD; 2 v ( s ) &PartialD; s 2
分别代表snake轮廓线对归一化参变量s的一阶导数和二阶导数。
式(34)中α为弹性系数,一阶导数项v′(s)表示弹性能量项;β为刚性系数,二阶导数项v″(s)表示刚性能量。弹性能量的作用是控制变形曲线的伸缩,保持曲线的连续性,类似弹力绳的特性,刚性能量的作用是控制曲线的弯曲,使曲线保持平滑。当权重系数α和β都不为0时,则轮廓曲线是一条光滑的曲线,若α为0曲线会出现间断;若β为0曲线会产生角点;若β取值较大,会使得snake曲线能量Esnake(v(s))取极小值时是一个闭合的圆或者一条直线段。
Snake曲线的外部能量函数是定义在整幅图像平面(R(x,y),G(x,y),B(x,y))上的标量函数,反应了图像的某些特性,如边缘等。对于一幅给定的图像(R(x,y),G(x,y),B(x,y)),snake的外部能量Eext(v(s))将主动地把轮廓线吸引到感兴趣物体的边界上,外部能量Eext(v(s))函数表达式如下:
Eext(v(s))=Eimage(v(s))+Econ(v(s))            (35)
式(35)中Eimage(v(s))称作由图像力产生的能量,它将驱动snake曲线向感兴趣物体的真实轮廓移动;Econ(v(s))是由人为施加的外部力产生的能量,其目的是使得曲线能更快更精确地收敛到真实边界,外部力一般作为可选项。当snake模型用于感兴趣物体的分割时,我们利用图像的梯度来定义图像力产生的能量,而不施加外部控制力,则
Eext(v(s))=Eimage(v(s))=-fmax                (36)
其中fmax为第2步中通过式(16)计算所得的彩色图像梯度幅值。
第5步将tm时刻的snake曲线的能量Em与tm-1时刻的snake曲线能量Em-1进行比较,若Em<Em-1,则用tm时刻的snake曲线更新替换tm-1时刻的snake曲线,再执行第6步;否则直接执行第6步;
第6步,判断m≤M是否成立,如果是,则返回第4步,否则输出第M次循环所得snake曲线即为算法所得感兴趣物体的轮廓线。
实例:
下面结合附图2的实例具体说明本发明一种基于四元数的彩色snake图像分割方法的步骤:
第1步输入一幅待分割的彩色图像,如附图2a,图2a的图像大小为481*321*3,我们用一个大小为481*321的四元数矩阵将其表示到四元数空间。
第2步利用本发明提出的基于四元数的彩色图像梯度计算方法计算图2a中图像的梯度,得到的梯度幅值图如图2b。
第3步程序自动地以输入图像的几何中心为中心做一个大小为480*320的线框作为初始snake轮廓线,初始化参数取α=0.65,β=0.001,γ=0.3并依据式(33)计算snake曲线的能量,迭代次数上限取M=1000。令时间步的序号为m,其初始值为0。
第4步令m=m+1,依据式(32)得到tm时刻的snake曲线,再依据式(33)计算tm时刻snake曲线的能量Em
第5步将tm时刻的snake曲线的能量Em与tm-1时刻的snake曲线能量Em-1进行比较,若Em<Em-1,则用tm时刻的snake曲线更新替换tm-1时刻的snake曲线,再执行第6步;否则直接执行第6步;
第6步,判断m≤M(在此实例中我们取M=1000)是否成立,如果是,则返回第4步,否则输出第M次循环所得snake曲线即为算法所得感兴趣物体的轮廓线,如图2d。
以上所述为本发明的较佳实施例而已,但本发明不应该局限于该实施例和附图所公开的内容。所以凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (3)

1.一种基于四元数的彩色snake图像分割方法,其特征在于,该方法包括下述步骤:
第1步输入一幅待分割的RGB空间彩色图像,并将该图像表示到四元数空间;
第2步计算第1步中得到的四元数空间下表示的彩色图像的梯度幅值;
第3步在输入的待分割的RGB空间彩色图像上勾勒出感兴趣物体的初始轮廓线;
第4步利用第2步所得到的梯度幅值定义snake模型的外力,实时计算snake曲线的能量Em;将当前的snake曲线的能量Em与上一时刻的snake曲线的能量Em进行比较,当满足迭代参数时,所得到的snake曲线即为感兴趣物体的轮廓线;
第2步中,按照下述过程计算得到梯度幅值:
用(R(x,y),G(x,y),B(x,y))表示待分割的RGB空间彩色图像,R(x,y),G(x,y),B(x,y)分别代表彩色图像的红绿蓝三通道,(x,y)代表像素坐标,则包含色度和亮度的彩色距离平方函数f(θ)写为:
f(θ)=Ecos2θ+2Fcosθsinθ+Hsin2θ
其中θ(θ∈[-π/2,π/2])为图像梯度向量的角度方向,E,F,H定义如下:
E = E 1 + E 2 F = F 1 + F 2 H = H 1 + H 2
E 1 = r x 2 + g x 2 + b x 2 F 1 = r x r y + g x g y + b x b y H 1 = r y 2 + g y 2 + b y 2
E 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; x + w 2 &PartialD; G ( x , y ) &PartialD; x + w 3 &PartialD; B ( x , y ) &PartialD; x ) 2 F 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; x + w 2 &PartialD; G ( x , y ) &PartialD; x + w 3 &PartialD; B ( x , y ) &PartialD; x ) ( w 1 &PartialD; R ( x , y ) &PartialD; y + w 2 &PartialD; G ( x , y ) &PartialD; y + w 3 &PartialD; B ( x , y ) &PartialD; y ) H 2 = ( w 1 &PartialD; R ( x , y ) &PartialD; y + w 2 &PartialD; G ( x , y ) &PartialD; y + w 3 &PartialD; B ( x , y ) &PartialD; y ) 2
r x = &PartialD; R ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) r y = &PartialD; R ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y ) g x = &PartialD; G ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) g y = &PartialD; G ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y ) b x = &PartialD; B ( x , y ) &PartialD; x - 1 3 ( &PartialD; R ( x , y ) &PartialD; x + &PartialD; G ( x , y ) &PartialD; x + &PartialD; B ( x , y ) &PartialD; x ) b y = &PartialD; B ( x , y ) &PartialD; y - 1 3 ( &PartialD; R ( x , y ) &PartialD; y + &PartialD; G ( x , y ) &PartialD; y + &PartialD; B ( x , y ) &PartialD; y )
其中E,F,H,E1,F1,H1,E2,F2,H2,rx,gx,bx,ry,gy,by为临时变量,其中E,E1,H1,E2,H2∈[0,∞);
则彩色距离平方函数f(θ)的最大值fmax和使得f(θ)取得最大值fmax的方向θmax为:
f max = 1 2 ( ( E + H ) + ( E - H ) 2 + ( 2 F ) 2 )
&theta; max = sgn ( F ) arcsin ( f max - E 2 f max - E - H ) 1 / 2 + n&pi; , ( E - H ) 2 + F 2 &NotEqual; 0 Undefined , ( E - H ) 2 + F 2 = 0
式中n取整数,其中sgn(□)为符号函数:
sgn ( F ) = 1 , F &GreaterEqual; 0 - 1 , F < 0
同时θmax满足如下的约束关系:
&theta; max &Element; n&pi; + 0 , &pi; / 4 , F &GreaterEqual; 0 andE - H &GreaterEqual; 0 &pi; / 4 , &pi; / 2 , F &GreaterEqual; 0 andE - H < 0 - &pi; / 2 , - &pi; / 4 , F < 0 andE - H < 0 - &pi; / 4 , 0 , F < 0 andE - H &GreaterEqual; 0
fmax为所得的彩色图像梯度的幅值,θmax为所得的彩色图像梯度的角度。
2.根据权利要求1所述的基于四元数的彩色snake图像分割方法,其特征在于,第3步具体包括下述过程:
设待分割的RGB空间彩色图像的大小为row×col×3,以该RGB空间彩色图像的几何中心为中心,以(row-1)和(col-1)作为矩形两邻边,在该RGB空间彩色图像上勾勒出一个包含感兴趣物体的矩形轮廓即为初始snake轮廓线v(s)=(x(s),y(s)),其中(x,y)代表构成初始轮廓线v(s)的像素的坐标,s∈(0,1)是将曲线进行参数化表示时的归一化参数。
3.根据权利要求2所述的基于四元数的彩色snake图像分割方法,其特征在于,第4步具体包括下述过程:
第4.1步设定snake模型的形变参数,包括弹性系数α、刚性系数β和阻尼系数γ的值,α,β,γ∈[0,∞),将v(s)视作s和时间t的函数,即将snake曲线v(s)视作一条动态曲线v(s,t),给定时间步长1,迭代次数上限M,M为整数,且M∈[100,1500],记初始勾勒snake曲线的时刻t=t0=0,此时snake曲线能量记为Esnake=E0,令时间步的序号为m,其初始值为0;
第4.2步令m=m+1,依据式一得到tm时刻的snake曲线,再依据式二计算tm时刻snake曲线的能量Em
x t m = ( A + &gamma;I ) - 1 ( &gamma;x t m - 1 - F x ( x t m - 1 , y t m - 1 ) ) y t m = ( A + &gamma;I ) - 1 ( &gamma;y t m - 1 - F y ( x t m - 1 , y t m - 1 ) ) 式一
E m = &Integral; 0 1 ( E int ( v ( s ) ) + E ext ( v ( s ) ) ) ds 式二
其中,Eint(v(s))表示snake曲线的内部能量,Eext(v(s))表示snake曲线的外部能量,令Eext(v(s))=-fmax
第4.3步将tm时刻的snake曲线的能量Em与tm-1时刻的snake曲线能量Em-1进行比较,若Em<Em-1,则用tm时刻的snake曲线更新替换tm-1时刻的snake曲线,再进入第4.4步,否则直接执行第4.4步;
第4.4步,判断m≤M是否成立,如果是,则返回第4.2步,否则输出第M次循环所得snake曲线即为算法所得感兴趣物体的轮廓线。
CN201210533693.1A 2012-12-11 2012-12-11 一种基于四元数的彩色snake图像分割方法 Expired - Fee Related CN103065333B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210533693.1A CN103065333B (zh) 2012-12-11 2012-12-11 一种基于四元数的彩色snake图像分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210533693.1A CN103065333B (zh) 2012-12-11 2012-12-11 一种基于四元数的彩色snake图像分割方法

Publications (2)

Publication Number Publication Date
CN103065333A true CN103065333A (zh) 2013-04-24
CN103065333B CN103065333B (zh) 2015-06-17

Family

ID=48107950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210533693.1A Expired - Fee Related CN103065333B (zh) 2012-12-11 2012-12-11 一种基于四元数的彩色snake图像分割方法

Country Status (1)

Country Link
CN (1) CN103065333B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971119A (zh) * 2014-03-26 2014-08-06 华南理工大学 一种在表面贴装设备中rgb矢量匹配快速识别方法
CN104123531A (zh) * 2013-04-28 2014-10-29 汉王科技股份有限公司 一种掌纹兴趣区域定位的方法和装置
WO2015043063A1 (zh) * 2013-09-26 2015-04-02 中国科学院深圳先进技术研究院 图像特征曲线提取方法及系统
CN106446917A (zh) * 2016-10-18 2017-02-22 电子科技大学中山学院 一种量体特征点提取方法及装置
CN108428235A (zh) * 2018-02-07 2018-08-21 西北大学 彩色地形图中线要素分割方法
CN109446924A (zh) * 2018-10-10 2019-03-08 南京信息工程大学 一种基于四元数广义判别分析的rgb-d目标识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050031168A1 (en) * 2003-08-04 2005-02-10 Osamu Katayama Road position detection
CN101673345A (zh) * 2009-07-01 2010-03-17 北京交通大学 基于形状先验的提取目标闭合轮廓的方法
CN102129691A (zh) * 2011-03-22 2011-07-20 北京航空航天大学 一种采用Snake轮廓模型的视频对象跟踪分割方法
CN102800089A (zh) * 2012-06-28 2012-11-28 华中科技大学 基于颈部超声图像的主颈动脉血管提取和厚度测量方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050031168A1 (en) * 2003-08-04 2005-02-10 Osamu Katayama Road position detection
CN101673345A (zh) * 2009-07-01 2010-03-17 北京交通大学 基于形状先验的提取目标闭合轮廓的方法
CN102129691A (zh) * 2011-03-22 2011-07-20 北京航空航天大学 一种采用Snake轮廓模型的视频对象跟踪分割方法
CN102800089A (zh) * 2012-06-28 2012-11-28 华中科技大学 基于颈部超声图像的主颈动脉血管提取和厚度测量方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123531A (zh) * 2013-04-28 2014-10-29 汉王科技股份有限公司 一种掌纹兴趣区域定位的方法和装置
CN104123531B (zh) * 2013-04-28 2018-05-22 汉王科技股份有限公司 一种掌纹兴趣区域定位的方法和装置
WO2015043063A1 (zh) * 2013-09-26 2015-04-02 中国科学院深圳先进技术研究院 图像特征曲线提取方法及系统
US9710725B2 (en) 2013-09-26 2017-07-18 Shenzhen Institutes Of Advanced Technology Chinese Academy Of Sciences Method and system for extracting image salient curve
CN103971119A (zh) * 2014-03-26 2014-08-06 华南理工大学 一种在表面贴装设备中rgb矢量匹配快速识别方法
CN106446917A (zh) * 2016-10-18 2017-02-22 电子科技大学中山学院 一种量体特征点提取方法及装置
CN106446917B (zh) * 2016-10-18 2019-08-16 电子科技大学中山学院 一种量体特征点提取方法及装置
CN108428235A (zh) * 2018-02-07 2018-08-21 西北大学 彩色地形图中线要素分割方法
CN108428235B (zh) * 2018-02-07 2021-08-27 西北大学 彩色地形图中线要素分割方法
CN109446924A (zh) * 2018-10-10 2019-03-08 南京信息工程大学 一种基于四元数广义判别分析的rgb-d目标识别方法
CN109446924B (zh) * 2018-10-10 2021-07-13 南京信息工程大学 一种基于四元数广义判别分析的rgb-d目标识别方法

Also Published As

Publication number Publication date
CN103065333B (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
CN103150713B (zh) 利用图像块分类稀疏表示与自适应聚合的图像超分辨方法
CN103065333B (zh) 一种基于四元数的彩色snake图像分割方法
CN113874883A (zh) 手部姿势估计
CN103745468B (zh) 一种基于图结构和边界先验的显著性物体检测方法
CN106650615B (zh) 一种图像处理方法及终端
CN109657612B (zh) 一种基于人脸图像特征的质量排序系统及其使用方法
CN103093444A (zh) 基于自相似性和结构信息约束的图像超分辨重建方法
CN109145766A (zh) 模型训练方法、装置、识别方法、电子设备及存储介质
CN106530265B (zh) 一种基于色度坐标的自适应图像融合方法
CN114821249B (zh) 一种基于分组聚合注意力和局部关系的车辆重识别方法
US10936938B2 (en) Method for visualizing neural network models
CN104574328A (zh) 一种基于直方图分割的彩色图像增强方法
CN113112416B (zh) 一种语义引导的人脸图像修复方法
CN116188999B (zh) 一种基于可见光和红外图像数据融合的小目标检测方法
CN107146219B (zh) 一种基于流形正则化支持向量机的图像显著性检测方法
CN111681177A (zh) 视频处理方法及装置、计算机可读存储介质、电子设备
CN101739670B (zh) 非局部均值空域时变图像滤波方法
CN109920018A (zh) 基于神经网络的黑白照片色彩恢复方法、装置及存储介质
KR20200036093A (ko) 비디오 영상 내의 행동 인식 방법 및 장치
CN111739037B (zh) 一种针对室内场景rgb-d图像的语义分割方法
Chiu et al. See the difference: Direct pre-image reconstruction and pose estimation by differentiating hog
CN103942788A (zh) 高光谱遥感图像特征提取方法及装置
CN107644393B (zh) 一种基于gpu的丰度估计算法的并行实现方法
US20210004934A1 (en) Super-resolution method using local binary pattern classification and linear mapping
CN117058606A (zh) 一种x射线图像违禁品检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150617

Termination date: 20201211