CN102222324A - 一种基于对称特性的图像显著区域检测方法 - Google Patents

一种基于对称特性的图像显著区域检测方法 Download PDF

Info

Publication number
CN102222324A
CN102222324A CN 201110163573 CN201110163573A CN102222324A CN 102222324 A CN102222324 A CN 102222324A CN 201110163573 CN201110163573 CN 201110163573 CN 201110163573 A CN201110163573 A CN 201110163573A CN 102222324 A CN102222324 A CN 102222324A
Authority
CN
China
Prior art keywords
image
frequency domain
images
different scale
marking area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201110163573
Other languages
English (en)
Other versions
CN102222324B (zh
Inventor
李永杰
陈丽霞
李朝义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201110163573A priority Critical patent/CN102222324B/zh
Publication of CN102222324A publication Critical patent/CN102222324A/zh
Application granted granted Critical
Publication of CN102222324B publication Critical patent/CN102222324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明属于计算机视觉技术领域,公开了一种基于对称特性的图像显著区域检测方法。针对现有的Itti模型检测显著区域存在的问题,本发明的方法首先对目标图像进行处理,得到不同尺度的图像,再分别提取不同尺度的图像的频域对称特征和时域对称特征,合并得到时频特征图像,进而得到最终显著图。本发明将图像的时域特征和频域特征结合了起来,共同完成图像显著区域的检测,本发明的检测方法利用了对称特征在人眼注视过程中所起的作用,可以比较完整的检测显著目标,检测到的图像显著区域更符合人眼注视的结果。

Description

一种基于对称特性的图像显著区域检测方法
技术领域
[0001] 本发明属于计算机视觉技术领域,特别涉及一种图像显著区域的检测方法。 背景技术
[0002] 人类视觉系统能够快速有效地处理来自外界的大量视觉信息。基于这样的一个特点,目前越来越多的研究者开始寄希望于模拟视觉选择性注意机制去完成各种图像处理任务,例如图像识别,目标跟踪以及场景分析等。到目前为止,已有很多基于视觉选择性注意机制提取显著区域的模型,其中,最典型的模型是1998年Itti和Koch等人提出的一种自底向上的选择性注意模型——Itti模型,具体可参见文献:L. Itti, C. Koch. Ε. Niebur. A model of saliency-based visual attention for rapid scene analysis. Pattern Analysis and Machine Intelligence, IEEE Transactions on,1998,20 (11) : 1254-1259. 这种方法充分利用了滤波器的思想并且模拟了视觉生理机制中的感受野的中央外周机制机返回抑制机制,形成了一个拟生理结构的计算模型。从整体来说,它基本完成了对初期视觉注意机制的建模,对于研究生理意义上的视觉选择性注意机制有重要的意义。但是用该模型得到的显著区域不太符合人眼注视的区域,得到的显著区域不能完整的覆盖目标,得到的区域仅仅是目标的部分内容,预测人眼注视区域的能力较差。
发明内容
[0003] 本发明的目的是为了解决现有的Itti模型检测显著区域存在的问题,提出了一种基于对称特性的图像显著区域检测方法。
[0004] 本发明的技术方案是:一种基于对称特性的图像显著区域检测方法,包括如下步骤:
[0005] Si.对目标图像建立多尺度图像;
[0006] S2.提取步骤Sl中得到的不同尺度图像的时域对称特征,得到不同尺度下的时域对称图,然后将不同尺度下的时域对称图合并得到时域特征图像;
[0007] S3.提取步骤Sl中得到的不同尺度图像的频域对称特征,得到不同尺度下的频域对称图,然后将不同尺度下的频域对称图合并得到频域特征图像;
[0008] S4.利用多特征图合并策略合并步骤S2、S3得到的时域特征图像和频域特征图像,得到时频特征图像,然后对时频特征图像进行阈值处理,得到最终显著图。
[0009] 本发明的有益效果:本发明首先对目标图像进行处理,得到不同尺度的图像,再分别提取不同尺度的图像的频域对称特征和时域对称特征,合并得到时频特征图像,进而得到最终显著图。本发明将图像的时域特征和频域特征结合了起来,共同完成图像显著区域的检测,本发明的检测方法利用了对称特征在人眼注视过程中所起的作用,可以比较完整的检测显著目标,检测到的图像显著区域更符合人眼注视的结果。
附图说明[0010] 图1是本发明基于对称特性的图像显著区域检测方法流程示意图。
[0011] 图2是实施例一中采用本发明方法对人造图像进行检测的显著图以及用其它两种对称方法检测所得的显著图。
[0012] 图3是实施例二中采用本发明方法对自然图像进行检测的显著图以及眼动注视图、背景技术中提到的Itti模型检测所得到的显著图。
具体实施方式
[0013] 下面结合附图和具体的实施例对本发明做进一步的阐述。
[0014] 本发明以现代生物学和生理学为基础,根据生理学研究结果:当人们注视外界环境时,很容易被具有对称特征的物体所吸引,并且沿着对称轴的方向转移。为此本发明首先根据图像的时频域特征,将图像分别转化为时域图像和频域图像,并分别提取了不同尺度图像的时域对称和频域对称特征,从而得到更加符合人眼注意的显著结果图。下面以实施例一和实施例二为例进行具体说明。
[0015] 实施例一:以一人造图像的对称图检测为例。
[0016] 如图2a所示,首先构造一幅包含内接正方形的圆的图像,作为目标图像,图像大小为181X181。具体检测方法的流程如图1所示,具体过程如下:
[0017] Si.对目标图像建立多尺度图像。这里利用高斯金字塔模型建立多尺度图像,提取图像不同尺度下的信息,即对目标图像进行逐级降采样,在每一次采样之后,对图像进行高斯平滑滤波,减小噪声干扰。这里共进行五次采样,得到五个不同尺度图像。具体的说,不同尺度下的高斯图像可由目标图像与高斯核卷积得到,高斯核中的尺度因子控制着图像被平滑的程度。
[0018] S2.提取步骤Sl中得到的不同尺度图像的时域对称特征,得到不同尺度下的时域对称图,然后将不同尺度下的时域对称图合并得到时域特征图像。
[0019] 即计算步骤Sl中得到的五个不同尺度图像的时域对称图,这里利用各向同性对称算子对每一尺度下的图像进行处理,各项同性对称算子的半径为10像素,然后将五个不同尺度下的时域对称图利用插值的方法归一到目标图像尺度,合并为一幅时域特征图像。 各项同性对称算子具体可参考文献:D. Reisfeld, H. ffolfson. Y. Yeshurun. Context-free attentional operators :the generalized symmetry transform. International Journal of Computer Vision,1995,14(2) :119-130.
[0020] S3.提取步骤Sl中得到的不同尺度图像的频域对称特征,得到不同尺度下的频域对称图,然后将不同尺度下的频域对称图合并得到频域特征图像。
[0021] 即计算步骤Sl中得到的五个不同尺度图像的频域对称图,首先对五个不同尺度图像进行傅里叶变换,再利用相位对称算子处理频域下每一尺度的图像,然后将不同尺度下的频域对称图利用插值的方法归一到目标图像尺度,合并为一幅频域特征图像。 相位对禾尔算子具体可参考文献:P. Kovesi,” Symmetry and Asymmetry From Local Phase, “ AI' 97,Tenth Australian Joint Conference on Artificial Intelligence. Proceedings-Poster Papers,1997,ppl85_190.
[0022] S4.显著图的提取,即利用多特征图合并策略合并步骤S2、S3得到的时域特征图像和频域特征图像,得到时频特征图像,然后对时频特征图像进行阈值处理,得到最终显著图。
[0023] 这里利用多特征图合并策略中的全局增强法对时域特征图像和频域特征图像进行合并,得到时频特征图像。多特征图合并策略和全局增强法具体可参考文献:罗四维.视觉感知系统信息处理理论.北京:电子工业出版社,2006,113-118。
[0024] 对该结果图进行阈值处理,保留最显著区域,得到最终显著图。所述的显著图是只保留整幅结果图的3%的显著区域。
[0025] 图2为采用本发明方法对人造图像进行检测的对称图及与另外两种对称算子所得对称图的一组对比图。其中:2a.人造图像,2b.采用各向同性对称算子所得的对称图, 2c.采用相位对称算子所得的对称图,2d.采用本发明方法检测所得的对称。从图中可以看出,单独使用各项同性对称算子时,不能有效检测到图像中边缘;而单独使用相位对称算子时,实验结果中的伪边缘效应非常严重;本实施方法不仅可以有效的提取出图像的边缘轮廓,同时还可以抑制出现在相位对称图中的伪边缘,这也证明了该方法在图像目标提取及显著区域检测中的可行性。
[0026] 实施例二:以一自然图像的显著区域检测为例。
[0027] 本图像以及眼动注视图均从Neil. D.B.Bruce等人提供的网上数据库中下载得到。图像大小均为681X511,其中眼动注视图是由20个被试自由观看图像得到的。具体检测方法的流程图如图1所示,具体过程如下与实施例一相同,只是在步骤S2中,各项同性对称算子的半径变为了8像素。
[0028] 图3为采用本发明方法对自然图像进行实际检测所得的显著图以及采用背景技术中的Itti模型所得显著图、眼动注视图的效果对比图组。其中:3a.原始图像,3b.人眼注视图,3c.本发明方法检测所得显著图,3d.采用背景技术中提到的Itti模型检测所得的显著图。从图中可以清楚的看出,采用本发明方法提取显著区域时,其结果更符合人眼注视的结果。
[0029] 本实施与利用其它特征提取显著区域进行定量比较:所得的性能评估指标ROC面积分别为:方向0. 6654,亮度0. 6788,颜色0. 7295,各向同性对称0. 7365 ;本实施中得到的性能评估指标ROC面积为0. 7480。性能评估指标ROC面积越大表明该模型预测人眼注视的能力越强,当达到1时,性能最好。
[0030] 本发明设计了一种模拟视觉选择性注意机制的显著性提取方法,利用了对称特征在人眼注视过程中所起的作用,结合了时域和频域对称特征,有效地提取了图像的显著区域。
[0031] 本发明首先提取目标图像的不同尺度信息,之后将图像转化为频域图像,并在不同尺度下的时域图像和频域图像上分别提取时域对称特征和频域对称特征。其中,时域对称特征是将各项同性对称算子应用在图像中所得到的,而频域对称特征是将相位对称算子应用在图像的频域表示中所得到的,后将不同尺度下的时域、频域对称图合并为时域特征图像和频域特征图像。最后,将两幅特征图像利用全局加强法归一化合并后最终得到图像的显著图。
[0032] 本发明的检测方法根据外界不同的输入来选择不同的对称半径,可有效完整的从复杂场景中提取图像的显著区域,从而预测人眼注视的区域。
[0033] 本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (8)

1. 一种基于对称特性的图像显著区域检测方法,其特征在于,包括如下步骤:51.对目标图像建立多尺度图像:52.提取步骤Sl中得到的不同尺度图像的时域对称特征,得到不同尺度下的时域对称图,然后将不同尺度下的时域对称图合并得到时域特征图像;53.提取步骤Sl中得到的不同尺度图像的频域对称特征,得到不同尺度下的频域对称图,然后将不同尺度下的频域对称图合并得到频域特征图像;54.利用多特征图合并策略合并步骤S2、S3得到的时域特征图像和频域特征图像,得到时频特征图像,然后对时频特征图像进行阈值处理,得到最终显著图。
2.根据权利要求1所述的图像显著区域检测方法,其特征在于,步骤Sl具体为利用高斯金字塔模型建立多尺度图像。
3.根据权利要求1或2所述的图像显著区域检测方法,其特征在于,步骤S2具体为利用各项同性对称算子提取时域对称特征。
4.根据权利要求3所述的图像显著区域检测方法,其特征在于,步骤S3具体为利用相位对称算子提取频域对称特征。
5.根据权利要求3所述的图像显著区域检测方法,其特征在于,步骤S4所述的多特征图合并策略为全局增强法。
6.根据权利要求3所述的图像显著区域检测方法,其特征在于,步骤S2所述的各项同性对称算子的半径为8-10像素。
7.根据权利要求3所述的图像显著区域检测方法,其特征在于,步骤S2所述的合并具体为将不同尺度下的时域对称图利用插值的方法归一到目标图像尺度,合并为一幅时域特征图像。
8.根据权利要求3所述的图像显著区域检测方法,其特征在于,步骤S3所述的合并具体为将不同尺度下的频域对称图利用插值的方法归一到目标图像尺度,合并为一幅频域特征图像。
CN201110163573A 2011-06-17 2011-06-17 一种基于对称特性的图像显著区域检测方法 Active CN102222324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110163573A CN102222324B (zh) 2011-06-17 2011-06-17 一种基于对称特性的图像显著区域检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110163573A CN102222324B (zh) 2011-06-17 2011-06-17 一种基于对称特性的图像显著区域检测方法

Publications (2)

Publication Number Publication Date
CN102222324A true CN102222324A (zh) 2011-10-19
CN102222324B CN102222324B (zh) 2012-08-29

Family

ID=44778869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110163573A Active CN102222324B (zh) 2011-06-17 2011-06-17 一种基于对称特性的图像显著区域检测方法

Country Status (1)

Country Link
CN (1) CN102222324B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065302A (zh) * 2012-12-25 2013-04-24 中国科学院自动化研究所 一种基于离群数据挖掘的图像显著性检测方法
CN107451595A (zh) * 2017-08-04 2017-12-08 河海大学 基于混合算法的红外图像显著性区域检测方法
CN110595811A (zh) * 2019-09-11 2019-12-20 浙江工业大学之江学院 机械设备健康状态特征图构建方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763641A (zh) * 2009-12-29 2010-06-30 电子科技大学 一种模拟视觉机制的图像目标物体轮廓检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763641A (zh) * 2009-12-29 2010-06-30 电子科技大学 一种模拟视觉机制的图像目标物体轮廓检测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 20040731 Gunther Heidemann Focus-of-Attention from Local Color Symmetries 全文 1-8 第26卷, 第7期 *
《International Journal of Computer Vision》 19951231 Daniel Reisfeld et al Context-Free Attentional Operators: The Generalized Symmetry Transform 全文 1-8 第14卷, *
《Optical Society of America》 20070731 Bruce C. Hansen et al Structural sparseness and spatial phase alignment in natural scenes 全文 1-8 第24卷, 第7期 *
《光学技术》 20090331 霍云 等 基于对称特征相似性的图像识别算法研究 全文 1-8 第35卷, 第2期 *
《计算机学报》 20051130 肖志涛 等 基于相位信息的对称性检测算法 全文 1-8 第28卷, 第11期 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103065302A (zh) * 2012-12-25 2013-04-24 中国科学院自动化研究所 一种基于离群数据挖掘的图像显著性检测方法
CN103065302B (zh) * 2012-12-25 2015-06-10 中国科学院自动化研究所 一种基于离群数据挖掘的图像显著性检测方法
CN107451595A (zh) * 2017-08-04 2017-12-08 河海大学 基于混合算法的红外图像显著性区域检测方法
CN110595811A (zh) * 2019-09-11 2019-12-20 浙江工业大学之江学院 机械设备健康状态特征图构建方法

Also Published As

Publication number Publication date
CN102222324B (zh) 2012-08-29

Similar Documents

Publication Publication Date Title
CN101551863B (zh) 基于非下采样轮廓波变换的遥感图像道路提取方法
Teng et al. Real-time lane detection by using multiple cues
CN101976330B (zh) 手势识别方法和系统
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN108009472B (zh) 一种基于卷积神经网络和贝叶斯分类器的指背关节纹识别方法
CN103413303A (zh) 基于联合显著性的红外目标分割方法
CN107729820B (zh) 一种基于多尺度hog的手指静脉识别方法
CN105225216A (zh) 基于空间距圆标记边缘检测的虹膜预处理算法
CN101923637A (zh) 一种移动终端及其人脸检测方法和装置
CN102222324B (zh) 一种基于对称特性的图像显著区域检测方法
Wang et al. An edge detection algorithm based on improved Canny operator
CN104424641A (zh) 一种关于图像模糊篡改检测的方法
CN101739667A (zh) 基于非下采样轮廓波变换的遥感图像道路增强方法
CN103914829B (zh) 一种含噪图像边缘检测方法
Johnson et al. Curvelet transform based retinal image analysis
CN106339709A (zh) 一种图像实时提取方法
CN105741317B (zh) 基于时空域显著性分析和稀疏表示的红外运动目标检测方法
Youmaran et al. Improved identification of iris and eyelash features
Zhang et al. Finger-vein recognition based on gradient distribution and self-adaptive recovery model
Tian et al. Pedestrian detection based on laplace operator image enhancement algorithm and faster R-CNN
CN101937511A (zh) 基于随机并行优化算法的快速图像匹配方法
Wang et al. A Preprocessing Algorithm for Touchless Fingerprint Images
CN102722895B (zh) 基于分数傅立叶变换的形状描述方法
Ying-Li et al. Edge detection algorithm based on the top-hat operator
Zhang et al. Digital image forensics of non-uniform deblurring

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant