CN102129694B - 一种图像显著区域检测方法 - Google Patents

一种图像显著区域检测方法 Download PDF

Info

Publication number
CN102129694B
CN102129694B CN 201010034301 CN201010034301A CN102129694B CN 102129694 B CN102129694 B CN 102129694B CN 201010034301 CN201010034301 CN 201010034301 CN 201010034301 A CN201010034301 A CN 201010034301A CN 102129694 B CN102129694 B CN 102129694B
Authority
CN
China
Prior art keywords
omega
image
pass filter
frequency
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 201010034301
Other languages
English (en)
Other versions
CN102129694A (zh
Inventor
卿来云
苗军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Graduate School of CAS
University of Chinese Academy of Sciences
Original Assignee
University of Chinese Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Chinese Academy of Sciences filed Critical University of Chinese Academy of Sciences
Priority to CN 201010034301 priority Critical patent/CN102129694B/zh
Publication of CN102129694A publication Critical patent/CN102129694A/zh
Application granted granted Critical
Publication of CN102129694B publication Critical patent/CN102129694B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种图像显著区域检测方法,包括:步骤1)将图像进行中频带通滤波;步骤2)根据中频带通滤波后的图像获得显著性图。上述方法不仅对图像的信噪比等鲁棒,而且计算简单快速。

Description

一种图像显著区域检测方法
技术领域
本发明涉及图像处理领域,特别涉及图像中的区域分析。
背景技术
在人类所有的感觉中,至少有70%的外界信息是通过视觉系统获取的。生物视觉系统,包括人类视觉系统,能自动选择并注意场景中少数“相关”的位置。图1示出了用视点跟踪仪记录的人眼观察所示图像的视点轨迹。从图1中可以看出,人眼对长颈鹿的头部区域给予了较多关注,而对天空和草地等背景区域一扫而过。生物视觉系统这种在面对复杂场景时,能够迅速将注意力集中在少数几个显著的视觉对象上的过程被称为视觉注意选择。这种能力使得生物组织将其有限的感知认知资源集中于最相关的部分数据,使得他们能快速有效地处理大量的信号,在复杂变化的环境中生存。
如果能够将这种机制引入图像分析领域,将计算资源优先分配给那些容易引起观察者注意的显著区域,必将极大地提高现有图像分析方法的工作效率。显著区域检测正是在这种思想的基础上提出并发展起来的。
图像中的显著区域通常被定义成与邻域对比二者差异显著的区域。这种定义最常见的一种实现是中央—周边机制,即中央和周边差异大的区域是显著区域。这种差异可以是颜色差异、朝向差异和纹理差异等。最著名的Itti和Koch等提出的显著区域检测模型就是先对图像进行多尺度、多方向的Gabor卷积,提取图像的颜色、亮度和朝向等特征,然后用差分高斯近似中央—周边差。另外,Gao和Vasconcelos的工作也是对图像进行Gabor卷积提取相应特征,然后假设图像区域的Gabor特征幅值满足广义高斯分布,分别估计中央和周边的特征分布,用两个分布的相对熵表示中央和周边的差异,差异较大的区域为显著区域。图2是采用经典的Itti显著区域检测模型进行图像中显著区域检测的流程图。上述方法在大多数自然图像上都取得了较好的结果,因为Gabor小波被认为是能较好地模拟生物视觉系统的V1细胞的反映,而中央—周边机制也能解释大多数的显著性。但上述方法中所采用的多尺度、多方向的Gabor卷积计算复杂高,对大多数工程应用来说不够实用。
发明内容
本发明的目的是克服现有方法采用Gabor卷积提取特征计算复杂度高的缺陷,提供一种高效实用的图像显著区域检测方法。
为实现上述目的,根据本发明的一个方面,提供了一种图像显著区域检测方法,包括下列步骤:
步骤1)将图像进行中频带通滤波;
步骤2)根据中频带通滤波后的图像获得显著性图。
在上述方法中,所述步骤1)前包括:
步骤0)将图像进行缩放。
在上述方法中,所述步骤2)后还包括:
步骤3)将所述显著性图进行平滑。
在上述方法中,所述步骤3)采用高斯平滑算子实现。
在上述方法中,所述步骤1)进一步包括:
111)将所述图像用频域表示;
112)将所述图像的频域幅值谱进行中频带通滤波;
所述步骤2)进一步包括:
21)将所述中频带通滤波后的图像用空间域表示,获得显著性图。
在上述方法中,所述步骤111)采用傅里叶变换来实现,所述步骤21)采用反傅里叶变换来实现。
在上述方法中,所述傅里叶变换是快速傅里叶变换。
在上述方法中,所述步骤112)的所述中频带通滤波为高斯带通滤波:
H ( ω ) = exp ( - ω 2 / 2 σ 1 2 ) - exp ( - ω 2 / 2 σ 2 2 ) ,
其中,σ1和σ2为标准差,且σ1<σ2
在上述方法中,所述步骤1)进一步包括:
12)将所述图像进行标准差σ1和标准差σ2平滑,分别得到图像I1和I2,其中σ1<σ2
所述步骤2)进一步包括:
22)根据如下公式获得显著性图S″(x,y):
S′(x,y)=I1(x,y)-I2(x,y),其中(x,y)为像素的空间坐标。
本发明所涉及的参数很少,只有中频带通滤波器的参数,无需考虑例如Gabor变换中的尺度和方向参数,也无需考虑中央—周边区域的大小以及中央—周边区域差异的计算等,因而不仅对图像信噪比等鲁棒,而且计算简单快速。
附图说明
图1是采用视点跟踪仪记录的人眼观察所示图像的视点轨迹示意图;
图2是采用Itti显著区域检测模型进行图像显著区域检测的流程图;
图3是现有技术中对比敏感度函数示意图;
图4是根据本发明优选实施例的图像中显著区域的检测方法的流程图;
图5(a)是一幅输入的原始图像的示例;
图5(b)是根据本发明的一个实施例的中频带通滤波器;
图5(c)是采用图5(b)所示的中频带通滤波器对图5(a)所示的原始图像进行滤波后的幅值谱;
图5(d)是根据本发明的一个实施例的图5(a)所示的原始图像的显著性图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对根据本发明一个实施例的图像显著区域的检测方法进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
虽然自然图像中包含不同尺度的对象和视觉模式,人类视觉系统对不同尺度的视觉模式的感知是不同的。生理学上有实验证明人们对不同频率的视觉信息的感知阈值不同。人类视觉系统对不同频率视觉信号的感知阈值用“对比敏感度函数”(contrast-sensitivity function,CSF)表示。Blackmore和Campbell发表的一个CSF如图3所示,从中可以看出人们对中频信号最敏感,即3.5cycles/deg~14.0cycles/deg,而对其它低频信号和高频信号的敏感度低。
本发明根据人类视觉系统对图像中的中频成分更敏感的事实,提供了一种图像显著区域检测方法。图4示出了根据本发明优选实施例的图像中显著区域的检测方法的流程图,该方法具体包括下列步骤:
假设有一幅输入图像I,其长宽分别为W、H,优选地,为了大幅度提高方法的运算速度,首先将其按比例缩放到长为M=64,宽为
Figure G2010100343018D00041
这是因为人眼对高频分量不敏感,适当降低图像分辨率不会影响人眼的主要关注的显著区域的检测。
为了利用人类视觉系统对不同频率信号的敏感性来检测图像中的显著区域,将输入图像从空间域表示变成频域表示。例如:可以采用傅里叶变换、离散余弦变换等得到图像的频率表示。在本实施例中以傅里叶变换为例来进行说明。图像的二维傅里叶变换表示为:
F ( u , v ) = 1 MN Σ x = 0 M - 1 Σ y = 0 N - 1 I ( x , y ) e - j 2 π ( ux / M + vy / N ) , ( 1 )
其中I(x,y)为所输入的自然图像的灰度函数,(x,y)为像素点的空间坐标,u和v分别表示自然图像在水平和垂直方向上的空间频率坐标,u∈[0,M-1],v∈[0,N-1]。于是,各频带上的幅值(能量)表示为:
A ( u , v ) = | F ( u , v ) | = R e 2 ( u , v ) + I m 2 ( u , v ) , ( 2 )
相位信息表示为:
φ ( u , v ) = arctan [ Im ( u , v ) Re ( u , v ) ] , ( 3 )
其中Re(u,v)表示复数F(u,v)的实部,Im(u,v)表示复数F(u,v)的虚部。优选地,上述傅里叶变换可采用快速傅里叶变换(FFT)实现。
在得到输入图像I的幅值谱和相位谱后,对幅值谱进行中频带通滤波,增强图像中的中频部分而减小低频和高频部分。在此实施例中,所述的中频带通滤波器以高斯带通滤波器为例进行说明。但本领域普通技术人员可以理解也可以采用其他带通滤波器,例如利用两种不同带宽的其他低通滤波之差实现。高斯带通滤波器用两个高斯函数的差来表示,即高斯带通滤波器表示为:
H ( ω ) = exp ( - ω 2 / 2 σ 1 2 ) - exp ( - ω 2 / 2 σ 2 2 ) , ( 4 )
其中ω为频率,σ1,σ2分别为两个高斯核的标准差,根据本发明的优选实施例,上述标准差根据高斯带通滤波器的中心频率ω0和截止频率ω1和ω2来计算,具体计算过程如下:
σ 1 = ω 1 1 2 ln 2 , σ 2 = ω 2 1 2 ln 2 ,
其中, ω 1 = ω 0 - 1 2 Δω , ω 2 = ω 0 + 1 2 Δω .
根据人类视觉系统对不同空间频率视觉信号的感知能力,优选地,
Figure G2010100343018D00056
Figure G2010100343018D00057
其中ωmax为输入图像的最大频率,
Figure G2010100343018D00058
更优选地,所述中心频率ω0取输入图像的最大频率ωmax
Figure G2010100343018D00059
滤波器的带宽Δω取输入图像最大频率ωmax
Figure G2010100343018D000510
利用高斯带通滤波器得到图像各频率上的幅值加权,加权后各频率上的幅值B(u,v)可以表示为:
B(u,v)=A(u,v)·H(u,v),
其中H(u,v)=H(ω),
Figure G2010100343018D000511
图5(a)是一幅输入的原始图像的示例I(x,y);图5(b)示出了根据本发明的一个实施例的中频带通滤波器;图5(c)是采用图5(b)所示的中频带通滤波器对图5(a)所示的原始图像进行滤波后的幅值谱B(u,v)
在得到通过滤波器加权后的幅值谱B(u,v)后,结合输入图像的相位谱φ(u,v),利用傅里叶反变换可以在空间域得到图像的显著性图(saliencymap)。该显著性图表示为:
S ′ ( x , y ) = | Σ u = 0 M - 1 Σ v = 0 N - 1 F ′ ( u , v ) e j 2 π ( ux / M + vy / N ) | , F ′ ( u , v ) = B ( u , v ) · exp ( i · φ ( u , v ) ) .
上述显著性图更多的是在物体的边缘处有较大的响应。而在一些应用中,人类视觉系统更倾向于关注物体的中心。因此,根据本发明的优选实施例,对上述得到的显著性图S′(x,y)施加一个平滑,以得到与人类视觉系统更相似的结果,即最终的显著性图为:
S(x,y)=g(x,y)*S′(x,y),
其中g(x,y)为二维平滑算子。对于上述按比例缩放到长为M=64,宽为
Figure G2010100343018D00062
的图像,优选地,g(x,y)为标准差是8的高斯平滑算子,如果输入图像缩放到其他尺寸,则可以按比例调整此高斯平滑算子的标准差。本领域普通技术人员可以理解,该平滑步骤也可以采用另外的方法,例如中值滤波、其他权重的均值滤波等。图5(d)为图5(a)中所示的原始图像的显著性图。
优选地,在上述显著性图的基础上,还可以根据具体应用对所得到的显著性图做进一步处理,如进行二值化,从而更凸显图像中的显著区域。在真实数据上的实验表明,本发明所提供的方法可以有效地检测到图像中的显著区域。
上面结合图4的流程图,详细描述了根据本发明优选实施例的图像中显著区域的检测方法。为了计算效率更高,上述优选实施例中在频域中实现中频带通滤波,但本领域普通技术人员可以理解,也可以直接在空域中实现中频带通滤波。在空域中进行中频带通滤波的具体实现如下:
对输入图像I进行较小标准差σ1和较大标准差σ2平滑,得到图像I1和I2,其中σ1和σ2的含义与频域中的实现时的计算方法相同。优选地,图像I2的平滑可以直接在图像I1上进行,以加快平滑速度。则中频带通滤波后的图像,即显著性图为:
S′(x,y)=I1(x,y)-I2(x,y)
最后应当说明的是,尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.一种图像显著区域检测方法,包括:
步骤1)将图像进行中频带通滤波;包括:
111)将所述图像用频域表示;
112)将所述图像的频域幅值谱进行中频带通滤波;所述中频带通滤波为高斯带通滤波:
H ( ω ) = exp ( - ω 2 / 2 σ 1 2 ) - exp ( - ω 2 / 2 σ 2 2 ) ,
其中,H(ω)表示高斯带通滤波器,ω为频率,σ1和σ2分别为两个高斯核的标准差,且σ12
Figure FDA00003036090100012
Figure FDA00003036090100013
ω 1 = ω 0 - 1 2 Δω , ω 2 = ω 0 + 1 2 Δω , ω 0 ∈ [ 1 4 ω max , 5 12 ω max ] , Δω ∈ [ 1 16 ω max , 1 18 ω max ] ,
Figure FDA00003036090100017
ω0为高斯带通滤波器的中心频率,ω1和ω2为高斯带通滤波器的截止频率,ωmax为输入图像的最大频率,Δω为滤波器的带宽,M和N分别为所述图像的长和宽;
步骤2)根据中频带通滤波后的图像获得显著性图。
2.根据权利要求1所述的方法,其特征在于,所述步骤1)前包括:
步骤0)将图像进行缩放。
3.根据权利要求1或2所述的方法,其特征在于,所述步骤2)后还包括:
步骤3)将所述显著性图进行平滑。
4.根据权利要求3所述的方法,其特征在于,所述步骤3)采用高斯平滑算子实现。
5.根据权利要求1或2所述的方法,其特征在于,
所述步骤2)进一步包括:
21)将所述中频带通滤波后的图像用空间域表示,获得显著性图。
6.根据权利要求5所述的方法,其特征在于,所述步骤111)采用傅里叶变换来实现,所述步骤21)采用反傅里叶变换来实现。
7.根据权利要求6所述的方法,其特征在于,所述傅里叶变换是快速傅里叶变换。
CN 201010034301 2010-01-18 2010-01-18 一种图像显著区域检测方法 Expired - Fee Related CN102129694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010034301 CN102129694B (zh) 2010-01-18 2010-01-18 一种图像显著区域检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010034301 CN102129694B (zh) 2010-01-18 2010-01-18 一种图像显著区域检测方法

Publications (2)

Publication Number Publication Date
CN102129694A CN102129694A (zh) 2011-07-20
CN102129694B true CN102129694B (zh) 2013-10-23

Family

ID=44267769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010034301 Expired - Fee Related CN102129694B (zh) 2010-01-18 2010-01-18 一种图像显著区域检测方法

Country Status (1)

Country Link
CN (1) CN102129694B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102426704B (zh) * 2011-10-28 2013-08-07 清华大学深圳研究生院 一种显著性物体快速检测方法
CN102521592B (zh) * 2011-11-30 2013-06-12 苏州大学 基于非清晰区域抑制的多特征融合显著区域提取方法
CN103020657A (zh) * 2012-12-28 2013-04-03 沈阳聚德视频技术有限公司 一种车牌汉字识别方法
CN103955689A (zh) * 2014-04-14 2014-07-30 杭州电子科技大学 一种采用频率筛选的图像视觉感兴趣区域提取方法
CN103973976B (zh) * 2014-04-14 2017-06-06 杭州电子科技大学 一种利用光学成像的显著性提取装置及方法
CN104966285B (zh) * 2015-06-03 2018-01-19 北京工业大学 一种显著性区域的检测方法
CN109816652B (zh) * 2019-01-25 2022-08-12 湖州云通科技有限公司 一种基于灰度显著性的复杂铸件缺陷识别方法
CN109785323B (zh) * 2019-01-25 2024-01-30 淮阴师范学院 一种基于中频滤波的图像聚焦测度实现方法
CN110717909A (zh) * 2019-10-15 2020-01-21 江苏科技大学 一种金属表面划痕检测方法与装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744279A1 (en) * 2005-07-11 2007-01-17 Thomson Licensing Method and device for filtering an image using side information
CN101271525A (zh) * 2008-04-10 2008-09-24 复旦大学 一种快速的图像序列特征显著图获取方法
CN101299268A (zh) * 2008-07-01 2008-11-05 上海大学 适于低景深图像的语义对象分割方法
CN101587590A (zh) * 2009-06-17 2009-11-25 复旦大学 基于脉冲余弦变换的选择性视觉注意计算模型

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744279A1 (en) * 2005-07-11 2007-01-17 Thomson Licensing Method and device for filtering an image using side information
CN101271525A (zh) * 2008-04-10 2008-09-24 复旦大学 一种快速的图像序列特征显著图获取方法
CN101299268A (zh) * 2008-07-01 2008-11-05 上海大学 适于低景深图像的语义对象分割方法
CN101587590A (zh) * 2009-06-17 2009-11-25 复旦大学 基于脉冲余弦变换的选择性视觉注意计算模型

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Zhiguo Ma等.Advertisement evaluation using visual saliency based on foveated image.《Multimedia and Expo, 2009. ICME 2009. IEEE International Conference on》.2009,914 - 917.
Zhiguo Ma等.Advertisement evaluation using visual saliency based on foveated image.《Multimedia and Expo, 2009. ICME 2009. IEEE International Conference on》.2009,914- 917. *
余卫宇.几种图像结构语义模型和图像.《中国博士学位论文全文数据库》.2005, *
梁春迎.基于显著区域的图像检索技术研究.《中国优秀硕士学位论文全文数据库》.2009, *

Also Published As

Publication number Publication date
CN102129694A (zh) 2011-07-20

Similar Documents

Publication Publication Date Title
CN102129694B (zh) 一种图像显著区域检测方法
Nasiri et al. Infrared small target enhancement based on variance difference
CN103369209B (zh) 视频降噪装置及方法
Huang et al. An advanced single-image visibility restoration algorithm for real-world hazy scenes
CN103136766B (zh) 一种基于颜色对比和颜色分布的物体显著性检测方法
CN103279957B (zh) 一种基于多尺度特征融合的遥感图像感兴趣区域提取方法
CN110617973B (zh) 振动检测方法及相关装置
CN102842120B (zh) 基于超复数小波相位测量的图像模糊程度检测方法
CN104715474B (zh) 基于标记分水岭算法的高分辨率合成孔径雷达图像线性建筑物检测方法
CN103679694B (zh) 一种基于全景视觉的舰船小目标检测方法
CN101655910A (zh) 训练系统、训练方法及检测方法
CN110580705B (zh) 一种基于双域图信号滤波检测建筑物边缘点的方法
CN105469428A (zh) 一种基于形态学滤波和svd的弱小目标检测方法
CN101739670B (zh) 非局部均值空域时变图像滤波方法
CN103955934A (zh) 一种结合图像显著性区域分割的图像模糊检测算法
CN103177428B (zh) 基于非下采样方向波变换与融合的sar图像去噪方法
CN102819840B (zh) 一种纹理图像的分割方法
CN102521811A (zh) 基于各向异性扩散和互信息匀质性测度的sar图像降斑方法
CN106778822B (zh) 基于漏斗变换的图像直线检测方法
CN105303538A (zh) 一种基于nsct和pca的高斯噪声方差估计方法
CN111461999B (zh) 一种基于超像素相似性测量的sar图像相干斑抑制方法
CN106910178B (zh) 一种基于色调统计特性分类的多角度sar图像融合方法
CN101742088B (zh) 非局部均值空域时变视频滤波方法
Chethan et al. Analysis of image quality using sobel filter
Zhu et al. A novel change detection method based on high-resolution SAR images for river course

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131023

Termination date: 20140118