CN102222324B

CN102222324B - 一种基于对称特性的图像显著区域检测方法

Info

Publication number: CN102222324B
Application number: CN201110163573A
Authority: CN
Inventors: 李永杰; 陈丽霞; 李朝义
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2011-06-17
Filing date: 2011-06-17
Publication date: 2012-08-29
Anticipated expiration: 2031-06-17
Also published as: CN102222324A

Abstract

本发明属于计算机视觉技术领域，公开了一种基于对称特性的图像显著区域检测方法。针对现有的Itti模型检测显著区域存在的问题，本发明的方法首先对目标图像进行处理，得到不同尺度的图像，再分别提取不同尺度的图像的频域对称特征和时域对称特征，合并得到时频特征图像，进而得到最终显著图。本发明将图像的时域特征和频域特征结合了起来，共同完成图像显著区域的检测，本发明的检测方法利用了对称特征在人眼注视过程中所起的作用，可以比较完整的检测显著目标，检测到的图像显著区域更符合人眼注视的结果。

Description

一种基于对称特性的图像显著区域检测方法

技术领域

本发明属于计算机视觉技术领域，特别涉及一种图像显著区域的检测方法。

背景技术

人类视觉系统能够快速有效地处理来自外界的大量视觉信息。基于这样的一个特点，目前越来越多的研究者开始寄希望于模拟视觉选择性注意机制去完成各种图像处理任务，例如图像识别，目标跟踪以及场景分析等。到目前为止，已有很多基于视觉选择性注意机制提取显著区域的模型，其中，最典型的模型是1998年Itti和Koch等人提出的一种自底向上的选择性注意模型——Itti模型，具体可参见文献：L.Itti，C.Koch.E.Niebur.A model of saliency-basedvisual attention for rapid scene analysis.Pattern Analysis and Machine Intelligence，IEEETransactions on，1998，20(11)：1254-1259.这种方法充分利用了滤波器的思想并且模拟了视觉生理机制中的感受野的中央外周机制机返回抑制机制，形成了一个拟生理结构的计算模型。从整体来说，它基本完成了对初期视觉注意机制的建模，对于研究生理意义上的视觉选择性注意机制有重要的意义。但是用该模型得到的显著区域不太符合人眼注视的区域，得到的显著区域不能完整的覆盖目标，得到的区域仅仅是目标的部分内容，预测人眼注视区域的能力较差。

发明内容

本发明的目的是为了解决现有的Itti模型检测显著区域存在的问题，提出了一种基于对称特性的图像显著区域检测方法。

本发明的技术方案是：一种基于对称特性的图像显著区域检测方法，包括如下步骤：

S1.对目标图像建立多尺度图像；

S2.提取步骤S1中得到的不同尺度图像的时域对称特征，得到不同尺度下的时域对称图，然后将不同尺度下的时域对称图合并得到时域特征图像；

S3.提取步骤S1中得到的不同尺度图像的频域对称特征，得到不同尺度下的频域对称图，然后将不同尺度下的频域对称图合并得到频域特征图像；

S4.利用多特征图合并策略合并步骤S2、S3得到的时域特征图像和频域特征图像，得到时频特征图像，然后对时频特征图像进行阈值处理，得到最终显著图。

本发明的有益效果：本发明首先对目标图像进行处理，得到不同尺度的图像，再分别提取不同尺度的图像的频域对称特征和时域对称特征，合并得到时频特征图像，进而得到最终显著图。本发明将图像的时域特征和频域特征结合了起来，共同完成图像显著区域的检测，本发明的检测方法利用了对称特征在人眼注视过程中所起的作用，可以比较完整的检测显著目标，检测到的图像显著区域更符合人眼注视的结果。

附图说明

图1是本发明基于对称特性的图像显著区域检测方法流程示意图。

图2是实施例一中采用本发明方法对人造图像进行检测的显著图以及用其它两种对称方法检测所得的显著图。

图3是实施例二中采用本发明方法对自然图像进行检测的显著图以及眼动注视图、背景技术中提到的Itti模型检测所得到的显著图。

具体实施方式

下面结合附图和具体的实施例对本发明做进一步的阐述。

本发明以现代生物学和生理学为基础，根据生理学研究结果：当人们注视外界环境时，很容易被具有对称特征的物体所吸引，并且沿着对称轴的方向转移。为此本发明首先根据图像的时频域特征，将图像分别转化为时域图像和频域图像，并分别提取了不同尺度图像的时域对称和频域对称特征，从而得到更加符合人眼注意的显著结果图。下面以实施例一和实施例二为例进行具体说明。

实施例一：以一人造图像的对称图检测为例。

如图2a所示，首先构造一幅包含内接正方形的圆的图像，作为目标图像，图像大小为181×181。具体检测方法的流程如图1所示，具体过程如下：

S1.对目标图像建立多尺度图像。这里利用高斯金字塔模型建立多尺度图像，提取图像不同尺度下的信息，即对目标图像进行逐级降采样，在每一次采样之后，对图像进行高斯平滑滤波，减小噪声干扰。这里共进行五次采样，得到五个不同尺度图像。具体的说，不同尺度下的高斯图像可由目标图像与高斯核卷积得到，高斯核中的尺度因子控制着图像被平滑的程度。

S2.提取步骤S1中得到的不同尺度图像的时域对称特征，得到不同尺度下的时域对称图，然后将不同尺度下的时域对称图合并得到时域特征图像。

即计算步骤S1中得到的五个不同尺度图像的时域对称图，这里利用各向同性对称算子对每一尺度下的图像进行处理，各项同性对称算子的半径为10像素，然后将五个不同尺度下的时域对称图利用插值的方法归一到目标图像尺度，合并为一幅时域特征图像。各项同性对称算子具体可参考文献：D.Reisfeld，H.Wolfson.Y.Yeshurun.Context-free attentionaloperators：the generalized symmetry transform.International Journal of Computer Vision，1995，14(2)：119-130.

S3.提取步骤S1中得到的不同尺度图像的频域对称特征，得到不同尺度下的频域对称图，然后将不同尺度下的频域对称图合并得到频域特征图像。

即计算步骤S1中得到的五个不同尺度图像的频域对称图，首先对五个不同尺度图像进行傅里叶变换，再利用相位对称算子处理频域下每一尺度的图像，然后将不同尺度下的频域对称图利用插值的方法归一到目标图像尺度，合并为一幅频域特征图像。相位对称算子具体可参考文献：P.Kovesi，″Symmetry and Asymmetry From Local Phase，″AI′97，TenthAustralian Joint Conference on Artificial Intelligence.Proceedings-Poster Papers，1997，pp185-190.

S4.显著图的提取，即利用多特征图合并策略合并步骤S2、S3得到的时域特征图像和频域特征图像，得到时频特征图像，然后对时频特征图像进行阈值处理，得到最终显著图。

这里利用多特征图合并策略中的全局增强法对时域特征图像和频域特征图像进行合并，得到时频特征图像。多特征图合并策略和全局增强法具体可参考文献：罗四维.视觉感知系统信息处理理论.北京：电子工业出版社，2006，113-118。

对该结果图进行阈值处理，保留最显著区域，得到最终显著图。所述的显著图是只保留整幅结果图的3％的显著区域。

图2为采用本发明方法对人造图像进行检测的对称图及与另外两种对称算子所得对称图的一组对比图。其中：2a.人造图像，2b.采用各向同性对称算子所得的对称图，2c.采用相位对称算子所得的对称图，2d.采用本发明方法检测所得的对称。从图中可以看出，单独使用各项同性对称算子时，不能有效检测到图像中边缘；而单独使用相位对称算子时，实验结果中的伪边缘效应非常严重；本实施方法不仅可以有效的提取出图像的边缘轮廓，同时还可以抑制出现在相位对称图中的伪边缘，这也证明了该方法在图像目标提取及显著区域检测中的可行性。

实施例二：以一自然图像的显著区域检测为例。

本图像以及眼动注视图均从Neil.D.B.Bruce等人提供的网上数据库中下载得到。图像大小均为681×511，其中眼动注视图是由20个被试自由观看图像得到的。具体检测方法的流程图如图1所示，具体过程如下与实施例一相同，只是在步骤S2中，各项同性对称算子的半径变为了8像素。

图3为采用本发明方法对自然图像进行实际检测所得的显著图以及采用背景技术中的Itti模型所得显著图、眼动注视图的效果对比图组。其中：3a.原始图像，3b.人眼注视图，3c.本发明方法检测所得显著图，3d.采用背景技术中提到的Itti模型检测所得的显著图。从图中可以清楚的看出，采用本发明方法提取显著区域时，其结果更符合人眼注视的结果。

本实施与利用其它特征提取显著区域进行定量比较：所得的性能评估指标ROC面积分别为：方向0.6654，亮度0.6788，颜色0.7295，各向同性对称0.7365；本实施中得到的性能评估指标ROC面积为0.7480。性能评估指标ROC面积越大表明该模型预测人眼注视的能力越强，当达到1时，性能最好。

本发明设计了一种模拟视觉选择性注意机制的显著性提取方法，利用了对称特征在人眼注视过程中所起的作用，结合了时域和频域对称特征，有效地提取了图像的显著区域。

本发明首先提取目标图像的不同尺度信息，之后将图像转化为频域图像，并在不同尺度下的时域图像和频域图像上分别提取时域对称特征和频域对称特征。其中，时域对称特征是将各项同性对称算子应用在图像中所得到的，而频域对称特征是将相位对称算子应用在图像的频域表示中所得到的，后将不同尺度下的时域、频域对称图合并为时域特征图像和频域特征图像。最后，将两幅特征图像利用全局加强法归一化合并后最终得到图像的显著图。

本发明的检测方法根据外界不同的输入来选择不同的对称半径，可有效完整的从复杂场景中提取图像的显著区域，从而预测人眼注视的区域。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种基于对称特性的图像显著区域检测方法，其特征在于，包括如下步骤：

S1.对目标图像建立多尺度图像：

S2.利用各向同性对称算子提取步骤S1中得到的不同尺度图像的时域对称特征，得到不同尺度下的时域对称图，然后将不同尺度下的时域对称图合并得到时域特征图像；

S3.利用相位对称算子提取步骤S1中得到的不同尺度图像的频域对称特征，得到不同尺度下的频域对称图，然后将不同尺度下的频域对称图合并得到频域特征图像；

2.根据权利要求1所述的图像显著区域检测方法，其特征在于，步骤S1具体为利用高斯金字塔模型建立多尺度图像。

3.根据权利要求2所述的图像显著区域检测方法，其特征在于，步骤S4所述的多特征图合并策略为全局增强法。

4.根据权利要求2所述的图像显著区域检测方法，其特征在于，步骤S2所述的各向同性对称算子的半径为8-10像素。

5.根据权利要求2所述的图像显著区域检测方法，其特征在于，步骤S2所述的合并具体为将不同尺度下的时域对称图利用插值的方法归一到目标图像尺度，合并为一幅时域特征图像。

6.根据权利要求2所述的图像显著区域检测方法，其特征在于，步骤S3所述的合并具体为将不同尺度下的频域对称图利用插值的方法归一到目标图像尺度，合并为一幅频域特征图像。