CN107665488A

CN107665488A - 一种立体图像视觉显著提取方法

Info

Publication number: CN107665488A
Application number: CN201710826355.XA
Authority: CN
Inventors: 周武杰; 蔡星宇; 岑岗; 邱薇薇; 周扬; 赵颖; 何成; 葛丁飞; 金国英; 陈寿法; 郑卫红; 李鑫; 吴洁雯; 王昕峰; 施祥
Original assignee: Zhejiang Lover Health Science and Technology Development Co Ltd
Current assignee: Shenzhen Lingkun Information Technology Co.,Ltd.
Priority date: 2017-09-14
Filing date: 2017-09-14
Publication date: 2018-02-06
Anticipated expiration: 2037-09-14
Also published as: CN107665488B

Abstract

本发明公开了一种立体图像视觉显著提取方法，其将测试立体图像的左视点图像转换到Lab颜色空间，并将三通道图像和左视差图像的归一化图像缩放到200×200像素尺寸；然后获取四幅图像各自的梯度幅值图，并进行对数计算；接着利用中心偏好图对四幅对数计算后的图像进行中心四周加强，再根据中心四周加强后的图像组成四元数矩阵，对四元数矩阵实施四元数傅里叶变换得到频域矩阵；之后利用频域滤波模板图对频域矩阵进行低通滤波，再对得到的低通特征图实施四元数傅里叶反变换；最后根据反变换得到的四元数矩阵获取初步视觉显著图，对初步视觉显著图归一化处理和缩放到W×H像素尺寸，得到最终视觉显著图；优点是具有较强的提取稳定性和较高的提取准确性。

Description

一种立体图像视觉显著提取方法

技术领域

本发明涉及一种图像信号的处理方法，尤其是涉及一种立体图像视觉显著提取方法。

背景技术

在人类视觉接收与信息处理中，由于大脑资源有限以及外界环境信息重要性区别，因此在处理过程中人脑对外界环境信息并不是一视同仁的，而是表现出选择特征。人们在观看图像或者视频片段时注意力并非均匀分布到图像的每个区域，而是对某些显著区域关注度更高。如何将视频中视觉注意度高的显著区域检测并提取出来是计算机视觉以及基于内容的视频检索领域的一个重要的研究内容。而随着立体视频显示技术和高质量立体视频内容获取技术的快速发展，针对立体图像/视频的显著区域检测及建模也是一个非常重要的研究内容。

然而，立体图像并不是平面图像的空间维度拓展，人眼感知物体时利用视差的方法与颜色大不相同，因此，用平面图像特征简单拓展得到立体图像特征不是特别的合适。然而，现有的立体图像显著图仍然停留在平面图像显著提取方法的简单拓展上。因此，要找到一种符合人类视觉系统的立体视觉显著性特征是立体图像显著性研究方向需要解决的必不可少的问题。

发明内容

本发明所要解决的技术问题是提供一种符合显著语义特征的立体图像视觉显著提取方法，其具有较强的提取稳定性和较高的提取准确性。

本发明解决上述技术问题所采用的技术方案为：一种立体图像视觉显著提取方法，其特征在于包括以下步骤：

①对于任意一幅测试立体图像S_test，将S_test的左视点图像记为{L_RGB(x,y)}，将S_test的左视差图像记为{D(x,y)}；其中，1≤x≤W，1≤y≤H，W表示S_test的宽度，H表示S_test的高度，L_RGB(x,y)表示{L_RGB(x,y)}中坐标位置为(x,y)的像素点的像素值，D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值；

②将{L_RGB(x,y)}从RGB颜色空间转换到Lab颜色空间，并将数据类型转换到实数类型，得到Lab颜色空间的左视点图像，记为{L_Lab(x,y)}；然后将{L_Lab(x,y)}的L通道图像记为{L_Lab,L(x,y)}，将{L_Lab(x,y)}的a通道图像记为{L_Lab,a(x,y)}，将{L_Lab(x,y)}的b通道图像记为{L_Lab,b(x,y)}；再将{L_Lab,L(x,y)}、{L_Lab,a(x,y)}和{L_Lab,b(x,y)}均缩放到200×200像素尺寸，将{L_Lab,L(x,y)}、{L_Lab,a(x,y)}和{L_Lab,b(x,y)}缩放后得到的图像对应记为{L_200,L(x₁,y₁)}、{L_200,a(x₁,y₁)}和{L_200,b(x₁,y₁)}；其中，L_Lab(x,y)表示{L_Lab(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,L(x,y)表示{L_Lab,L(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,a(x,y)表示{L_Lab,a(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,b(x,y)表示{L_Lab,b(x,y)}中坐标位置为(x,y)的像素点的像素值，1≤x₁≤200，1≤y₁≤200，L_200,L(x₁,y₁)表示{L_200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，L_200,a(x₁,y₁)表示{L_200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，L_200,b(x₁,y₁)表示{L_200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值；

对{D(x,y)}进行归一化处理，将归一化处理后得到的图像记为{D_0,1(x,y)}；然后将{D_0,1(x,y)}缩放到200×200像素尺寸，将缩放后得到的图像记为{D₂₀₀(x₁,y₁)}；其中，D_0,1(x,y)∈[0,1]，D_0,1(x,y)表示{D_0,1(x,y)}中坐标位置为(x,y)的像素点的像素值，D₂₀₀(x₁,y₁)表示{D₂₀₀(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值；

③对{D₂₀₀(x₁,y₁)}进行梯度提取，得到{D₂₀₀(x₁,y₁)}的梯度幅值图，记为{G_200,D(x₁,y₁)}；同样，对{L_200,L(x₁,y₁)}进行梯度提取，得到{L_200,L(x₁,y₁)}的梯度幅值图，记为{G_200,L(x₁,y₁)}；对{L_200,a(x₁,y₁)}进行梯度提取，得到{L_200,a(x₁,y₁)}的梯度幅值图，记为{G_200,a(x₁,y₁)}；对{L_200,b(x₁,y₁)}进行梯度提取，得到{L_200,b(x₁,y₁)}的梯度幅值图，记为{G_200,b(x₁,y₁)}；其中，G_200,D(x₁,y₁)表示{G_200,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,L(x₁,y₁)表示{G_200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,a(x₁,y₁)表示{G_200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,b(x₁,y₁)表示{G_200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值；

④对{G_200,D(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,D(x₁,y₁)}，将{G_Q200,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,D(x₁,y₁)，G_Q200,D(x₁,y₁)＝log₁₀(1+2000×G_200,D(x₁,y₁))；同样，对{G_200,L(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,L(x₁,y₁)}，将{G_Q200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,L(x₁,y₁)，G_Q200,L(x₁,y₁)＝log₁₀(1+100×G_200,L(x₁,y₁))；对{G_200,a(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,a(x₁,y₁)}，将{G_Q200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,a(x₁,y₁)，G_Q200,a(x₁,y₁)＝log₁₀(1+100×G_200,a(x₁,y₁))；对{G_200,b(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,b(x₁,y₁)}，将{G_Q200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,b(x₁,y₁)，G_Q200,b(x₁,y₁)＝log₁₀(1+100×G_200,b(x₁,y₁))；

⑤利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,D(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,D(x₁,y₁)}，将{G_Q200CS,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为D_Q200CS,D(x₁,y₁)，G_Q200CS,D(x₁,y₁)＝G_Q200,D(x₁,y₁)×C_saliency200(x₁,y₁)×0.5；同样，利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,L(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,L(x₁,y₁)}，将{G_Q200CS,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,L(x₁,y₁)，G_Q200CS,L(x₁,y₁)＝G_Q200,L(x₁,y₁)×C_saliency200(x₁,y₁)；利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,a(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,a(x₁,y₁)}，将{G_Q200CS,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,a(x₁,y₁)，G_Q200CS,a(x₁,y₁)＝G_Q200,a(x₁,y₁)×C_saliency200(x₁,y₁)；利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,b(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,b(x₁,y₁)}，将{G_Q200CS,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,b(x₁,y₁)，G_Q200CS,b(x₁,y₁)＝G_Q200,b(x₁,y₁)×C_saliency200(x₁,y₁)；其中，C_saliency200(x₁,y₁)表示{C_saliency200(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值；

⑥将{G_Q200CS,D(x₁,y₁)}的矩阵表示形式、{G_Q200CS,L(x₁,y₁)}的矩阵表示形式、{G_Q200CS,a(x₁,y₁)}的矩阵表示形式、{G_Q200CS,b(x₁,y₁)}的矩阵表示形式组成四元数矩阵，记为{Q_I200(x₁,y₁)}，将{Q_I200(x₁,y₁)}中坐标为(x₁,y₁)的元素的四元数值记为Q_I200(x₁,y₁)，Q_I200(x₁,y₁)＝G_Q200CS,D(x₁,y₁)+i×G_Q200CS,L(x₁,y₁)+j×G_Q200CS,a(x₁,y₁)+k×G_Q200CS,b(x₁,y₁)；然后对{Q_I200(x₁,y₁)}实施四元数傅里叶变换，得到{Q_I200(x₁,y₁)}的频域矩阵，记为{Q_f200(u₁,v₁)}；其中，i、j、k均为虚数单位，G_Q200CS,D(x₁,y₁)为Q_I200(x₁,y₁)的实部，G_Q200CS,L(x₁,y₁)为Q_I200(x₁,y₁)的i虚部，G_Q200CS,a(x₁,y₁)为Q_I200(x₁,y₁)的j虚部，G_Q200CS,b(x₁,y₁)为Q_I200(x₁,y₁)的k虚部，1≤u₁≤200，1≤v₁≤200，Q_f200(u₁,v₁)表示{Q_f200(u₁,v₁)}中坐标为(u₁,v₁)的元素的四元数值；

⑦利用200×200像素尺寸的频域滤波模板图{LG₂₀₀(u₁,v₁)}对{Q_f200(u₁,v₁)}进行Log-Gabor低通滤波，得到{Q_f200(u₁,v₁)}对应的低通特征图，记为{Q_log-Gabor200(u₁,v₁)}；然后对{Q_log-Gabor200(u₁,v₁)}的矩阵表示形式实施四元数傅里叶反变换，将四元数傅里叶反变换后得到的四元数矩阵记为{Q_o200(x₁,y₁)}，将{Q_o200(x₁,y₁)}中坐标为(x₁,y₁)的元素的四元数值记为Q_o200(x₁,y₁)，Q_o200(x₁,y₁)＝u₂₀₀(x₁,y₁)+i×u_200i(x₁,y₁)+j×u_200j(x₁,y₁)+k×u_200k(x₁,y₁)；其中，LG₂₀₀(u₁,v₁)表示{LG₂₀₀(u₁,v₁)}中坐标位置为(u₁,v₁)的像素点的像素值，Q_log-Gabor200(u₁,v₁)表示{Q_log-Gabor200(u₁,v₁)}中坐标位置为(u₁,v₁)的像素点的像素值，u₂₀₀(x₁,y₁)表示{Q_o200(x₁,y₁)}的实数矩阵{u₂₀₀(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200i(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数i矩阵{u_200i(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200j(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数j矩阵{u_200j(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200k(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数k矩阵{u_200k(x₁,y₁)}中坐标为(x₁,y₁)的元素的值；

⑧根据{u₂₀₀(x₁,y₁)}，{u_200i(x₁,y₁)}，{u_200j(x₁,y₁)}和{u_200k(x₁,y₁)}，获取S_test的初步视觉显著图，记为{S_QFT-LG200(x₁,y₁)}，将{S_QFT-LG200(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为S_QFT-LG200(x₁,y₁)，S_QFT-LG200(x₁,y₁)＝0.3×u₂₀₀(x₁,y₁)+u_200i(x₁,y₁)+u_200j(x₁,y₁)+u_200k(x₁,y₁)；然后对{S_QFT-LG200(x₁,y₁)}进行归一化处理，将归一化处理后得到的图像记为{S_QFT-F(x₁,y₁)}；再将{S_QFT-F(x₁,y₁)}缩放到W×H像素尺寸，将缩放后得到的图像作为S_test的最终视觉显著图，记为{S_F(x,y)}；其中，S_QFT-F(x₁,y₁)表示{S_QFT-F(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，S_F(x,y)表示{S_F(x,y)}中坐标位置为(x,y)的像素点的像素值。

所述的步骤②中，其中，min()为取最小值函数，max()为取最大值函数。

所述的步骤③中，G_200,D(x₁,y₁)＝abs(G_200x,D(x₁,y₁)+G_200y,D(x₁,y₁))，G_200,L(x₁,y₁)＝abs(G_200x,L(x_1,y₁)+G_200y,L(x_1,y₁))，G_200,a(x₁,y₁)＝abs(G_200x,a(x₁,y₁)+G_200y,a(x₁,y₁))，G_200,b(x₁,y₁)＝abs(G_200x,b(x₁,y₁)+G_200y,b(x₁,y₁))；其中，abs()表示取绝对值函数，G_200x,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

所述的步骤⑤中，其中，e为自然基数，x₀表示{C_saliency200(x₁,y₁)}的中心像素点的横坐标，y₀表示{C_saliency200(x₁,y₁)}的中心像素点的纵坐标，δ_D表示中心偏好参数。

所述的步骤⑦中，{LG₂₀₀(u₁,v₁)}利用Log-Gabor频域滤波器生成，生成{LG₂₀₀(u₁,v₁)}的过程中所需的4个输入参数的取值分别为：带宽控制参数σ_F的取值为0.3，滤波模板图宽度控制参数u₀的取值为100，滤波模板图高度控制参数v₀的取值为100，滤波器中心频率控制参数ω₀的取值为0.1667；所述的步骤⑦中，Q_log-Gabor200(u₁,v₁)＝LG₂₀₀(u₁,v₁)×Q_f200(u₁,v₁)。

所述的步骤⑧中，其中，max()表示取最大值函数。

与现有技术相比，本发明的优点在于：

1)本发明方法将视差信息的特征融合到左视点视觉显著图提取之中，提高了立体视觉显著值预测的准确性和稳定性。

2)本发明方法是基于四元数频域的频域分析得到的，有较强的鲁棒性，对不同场景类型的图像都有较好的显著值预测效果。

3)本发明方法的实现是通过一次性的四元数Log-Gabor滤波得到的，相对于其他预测准确率相近的现有算法计算速度更快。

4)本发明方法是在四元数频域进行滤波得到的，通过修改或者部分修改滤波器，可以容易的实现方法的拓展，和改动，如方向性选择以及滤波频率选择，可以针对各种应用的特殊性进行快速的修改。

附图说明

图1为本发明方法的总体实现框图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种立体图像视觉显著提取方法，其综合利用Lab数据和视差(disparity)数据，实现基于紧致性分析和多线索融合的立体视觉显著性检测，其总体实现框图如图1所示，其特征在于包括以下步骤：

①对于任意一幅测试立体图像S_test，将S_test的左视点图像记为{L_RGB(x,y)}，将{L_RGB(x,y)}的R通道图像记为{L_RGB,R(x,y)}，将{L_RGB(x,y)}的G通道图像记为{L_RGB,G(x,y)}，将{L_RGB(x,y)}的B通道图像记为{L_RGB,B(x,y)}，将S_test的左视差图像记为{D(x,y)}；其中，1≤x≤W，1≤y≤H，W表示S_test的宽度，H表示S_test的高度，L_RGB(x,y)表示{L_RGB(x,y)}中坐标位置为(x,y)的像素点的像素值，L_RGB,R(x,y)表示{L_RGB,R(x,y)}中坐标位置为(x,y)的像素点的像素值，L_RGB,G(x,y)表示{L_RGB,G(x,y)}中坐标位置为(x,y)的像素点的像素值，L_RGB,B(x,y)表示{L_RGB,B(x,y)}中坐标位置为(x,y)的像素点的像素值，D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值。

②将{L_RGB(x,y)}从RGB颜色空间转换到Lab颜色空间，并将数据类型转换到实数类型，得到Lab颜色空间的左视点图像，记为{L_Lab(x,y)}；然后将{L_Lab(x,y)}的L通道图像记为{L_Lab,L(x,y)}，将{L_Lab(x,y)}的a通道图像记为{L_Lab,a(x,y)}，将{L_Lab(x,y)}的b通道图像记为{L_Lab,b(x,y)}；再将{L_Lab,L(x,y)}、{L_Lab,a(x,y)}和{L_Lab,b(x,y)}均缩放到200×200像素尺寸，将{L_Lab,L(x,y)}、{L_Lab,a(x,y)}和{L_Lab,b(x,y)}缩放后得到的图像对应记为{L_200,L(x₁,y₁)}、{L_200,a(x₁,y₁)}和{L_200,b(x₁,y₁)}；其中，L_Lab(x,y)表示{L_Lab(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,L(x,y)表示{L_Lab,L(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,a(x,y)表示{L_Lab,a(x,y)}中坐标位置为(x,y)的像素点的像素值，L_Lab,b(x,y)表示{L_Lab,b(x,y)}中坐标位置为(x,y)的像素点的像素值，1≤x₁≤200，1≤y₁≤200。L_200,L(x₁,y₁)表示{L_200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，L_200,a(x₁,y₁)表示{L_200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，L_200,b(x₁,y₁)表示{L_200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

对{D(x,y)}进行归一化处理，将归一化处理后得到的图像记为{D_0,1(x,y)}；然后将{D_0,1(x,y)}缩放到200×200像素尺寸，将缩放后得到的图像记为{D₂₀₀(x₁,y₁)}；其中，D_0,1(x,y)∈[0,1]，D_0,1(x,y)表示{D_0,1(x,y)}中坐标位置为(x,y)的像素点的像素值，D₂₀₀(x₁,y₁)表示{D₂₀₀(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

在本实施例中，步骤②中，其中，min()为取最小值函数，max()为取最大值函数。

③对{D₂₀₀(x₁,y₁)}进行梯度提取，得到{D₂₀₀(x₁,y₁)}的梯度幅值图，记为{G_200,D(x₁,y₁)}；同样，对{L_200,L(x₁,y₁)}进行梯度提取，得到{L_200,L(x₁,y₁)}的梯度幅值图，记为{G_200,L(x₁,y₁)}；对{L_200,a(x₁,y₁)}进行梯度提取，得到{L_200,a(x₁,y₁)}的梯度幅值图，记为{G_200,a(x₁,y₁)}；对{L_200,b(x₁,y₁)}进行梯度提取，得到{L_200,b(x₁,y₁)}的梯度幅值图，记为{G_200,b(x₁,y₁)}；其中，G_200,D(x₁,y₁)表示{G_200,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,L(x₁,y₁)表示{G_200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,a(x₁,y₁)表示{G_200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200,b(x₁,y₁)表示{G_200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

在本实施例中，步骤③中，G_200,D(x₁,y₁)＝abs(G_200x,D(x₁,y₁)+G_200y,D(x₁,y₁))，G_200,L(x₁,y₁)＝abs(G_200x,L(x₁,y₁)+G_200y,L(x₁,y₁))_，G_200,a(x₁,y₁)＝abs(G_200x,a(x_1,y₁)+G_200y,a(x_1,y₁))_，G_200,b(x₁,y₁)＝abs(G_200x,b(x₁,y₁)+G_200y,b(x₁,y₁))；其中，abs()表示取绝对值函数，G_200x,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的水平方向进行现有的梯度提取得到的水平方向梯度图{G_200x,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的垂直方向进行现有的梯度提取得到的垂直方向梯度图{G_200y,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的水平方向进行现有的梯度提取得到的水平方向梯度图{G_200x,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的垂直方向进行现有的梯度提取得到的垂直方向梯度图{G_200y,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的水平方向进行现有的梯度提取得到的水平方向梯度图{G_200x,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的垂直方向进行现有的梯度提取得到的垂直方向梯度图{G_200y,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的水平方向进行现有的梯度提取得到的水平方向梯度图{G_200x,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的垂直方向进行现有的梯度提取得到的垂直方向梯度图{G_200y,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

④对{G_200,D(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,D(x₁,y₁)}，将{G_Q200,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,D(x₁,y₁)，G_Q200,D(x₁,y₁)＝log₁₀(1+2000×G_200,D(x₁,y₁))；同样，对{G_200,L(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,L(x₁,y₁)}，将{G_Q200,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,L(x₁,y₁)，G_Q200,L(x₁,y₁)＝log₁₀(1+100×G_200,L(x₁,y₁))；对{G_200,a(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,a(x₁,y₁)}，将{G_Q200,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,a(x₁,y₁)，G_Q200,a(x₁,y₁)＝log₁₀(1+100×G_200,a(x₁,y₁))；对{G_200,b(x₁,y₁)}中的每个像素点的像素值进行对数计算，将对数计算后得到的图像记为{G_Q200,b(x₁,y₁)}，将{G_Q200,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200,b(x₁,y₁)，G_Q200,b(x₁,y₁)＝log₁₀(1+100×G_200,b(x₁,y₁))。

⑤利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,D(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,D(x₁,y₁)}，将{G_Q200CS,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为D_Q200CS,D(x₁,y₁)，G_Q200CS,D(x₁,y₁)＝G_Q200,D(x₁,y₁)×C_saliency200(x₁,y₁)×0.5；同样，利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,L(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,L(x₁,y₁)}，将{G_Q200CS,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,L(x₁,y₁)，G_Q200CS,L(x₁,y₁)＝G_Q200,L(x₁,y₁)×C_saliency200(x₁,y₁)；利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,a(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,a(x₁,y₁)}，将{G_Q200CS,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,a(x₁,y₁)，G_Q200CS,a(x₁,y₁)＝G_Q200,a(x₁,y₁)×C_saliency200(x₁,y₁)；利用200×200像素尺寸的中心偏好图{C_saliency200(x₁,y₁)}对{G_Q200,b(x₁,y₁)}进行中心四周加强，将中心四周加强后得到的图像记为{G_Q200CS,b(x₁,y₁)}，将{G_Q200CS,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值记为G_Q200CS,b(x₁,y₁)，G_Q200CS,b(x₁,y₁)＝G_Q200,b(x₁,y₁)×C_saliency200(x₁,y₁)；其中，C_saliency200(x₁,y₁)表示{C_saliency200(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

在本实施例中，步骤⑤中，其中，e为自然基数，e＝2.7182818284…，x₀表示{C_saliency200(x₁,y₁)}的中心像素点的横坐标，y₀表示{C_saliency200(x₁,y₁)}的中心像素点的纵坐标，δ_D表示中心偏好参数，在本实施例中，取x₀＝100、y₀＝100、δ_D＝114。

⑥将{G_Q200CS,D(x₁,y₁)}的矩阵表示形式、{G_Q200CS,L(x₁,y₁)}的矩阵表示形式、{G_Q200CS,a(x₁,y₁)}的矩阵表示形式、{G_Q200CS,b(x₁,y₁)}的矩阵表示形式组成四元数矩阵，记为{Q_I200(x₁,y₁)}，将{Q_I200(x₁,y₁)}中坐标为(x₁,y₁)的元素的四元数值记为Q_I200(x₁,y₁)，Q_I200(x₁,y₁)＝G_Q200CS,D(x₁,y₁)+i×G_Q200CS,L(x₁,y₁)+j×G_Q200CS,a(x₁,y₁)+k×G_Q200CS,b(x₁,y₁)；然后对{Q_I200(x₁,y₁)}实施现有的四元数傅里叶变换，得到{Q_I200(x₁,y₁)}的频域矩阵，记为{Q_f200(u₁,v₁)}；其中，i、j、k均为虚数单位，G_Q200CS,D(x₁,y₁)为Q_I200(x₁,y₁)的实部，G_Q200CS,L(x₁,y₁)为Q_I200(x₁,y₁)的i虚部，G_Q200CS,a(x₁,y₁)为Q_I200(x₁,y₁)的j虚部，G_Q200CS,b(x₁,y₁)为Q_I200(x₁,y₁)的k虚部，1≤u₁≤200，1≤v₁≤200，Q_f200(u₁,v₁)表示{Q_f200(u₁,v₁)}中坐标为(u₁,v₁)的元素的四元数值。

⑦利用200×200像素尺寸的频域滤波模板图{LG₂₀₀(u₁,v₁)}对{Q_f200(u₁,v₁)}进行现有的Log-Gabor低通滤波，得到{Q_f200(u₁,v₁)}对应的低通特征图，记为{Q_log-Gabor200(u₁,v₁)}；然后对{Q_log-Gabor200(u₁,v₁)}的矩阵表示形式实施现有的四元数傅里叶反变换，将四元数傅里叶反变换后得到的四元数矩阵记为{Q_o200(x₁,y₁)}，将{Q_o200(x₁,y₁)}中坐标为(x₁,y₁)的元素的四元数值记为Q_o200(x₁,y₁)，Q_o200(x₁,y₁)＝u₂₀₀(x₁,y₁)+i×u_200i(x₁,y₁)+j×u_200j(x₁,y₁)+k×u_200k(x₁,y₁)；其中，LG₂₀₀(u₁,v₁)表示{LG₂₀₀(u₁,v₁)}中坐标位置为(u₁,v₁)的像素点的像素值，Q_log-Gabor200(u₁,v₁)表示{Q_log-Gabor200(u₁,v₁)}中坐标位置为(u₁,v₁)的像素点的像素值，u₂₀₀(x₁,y₁)表示{Q_o200(x₁,y₁)}的实数矩阵{u₂₀₀(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200i(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数i矩阵{u_200i(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200j(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数j矩阵{u_200j(x₁,y₁)}中坐标为(x₁,y₁)的元素的值，u_200k(x₁,y₁)表示{Q_o200(x₁,y₁)}的虚数k矩阵{u_200k(x₁,y₁)}中坐标为(x₁,y₁)的元素的值。

在本实施例中，步骤⑦中，{LG₂₀₀(u₁,v₁)}利用现有的Log-Gabor频域滤波器生成，生成{LG₂₀₀(u₁,v₁)}的过程中所需的4个输入参数的取值分别为：带宽控制参数σ_F的取值为0.3，滤波模板图宽度控制参数u₀的取值为100，滤波模板图高度控制参数v₀的取值为100，滤波器中心频率控制参数ω₀的取值为0.1667；所述的步骤⑦中，Q_log-Gabor200(u₁,v₁)＝LG₂₀₀(u₁,v₁)×Q_f200(u₁,v₁)。

在本实施例中，步骤⑧中，其中，max()表示取最大值函数。

为了验证本发明方法的可行性和有效性，进行实验。

在此，采用法国南特大学提供的三维人眼跟踪数据库(3Deye-trackingdatabase)来分析本发明方法的准确性和稳定性。这里，利用评估视觉显著提取方法的3个常用客观参量作为评价指标，即Pearson相关系数(Pearson linear correlationcoefficient，PLCC)、Kullback-Leibler散度系数(Kullback-Leibler divergence，KLD)、AUC参数(the Area Under the receiver operating characteristics Curve，AUC)。

利用本发明方法获取法国南特大学提供的三维人眼跟踪数据库中的每幅立体图像的最终视觉显著图，并与三维人眼跟踪数据库中的每幅立体图像的主观视觉显著图(三维人眼跟踪数据库中存在)进行比较，PLCC和AUC值越高、KLD值越低说明本发明方法提取的最终视觉显著图与主观视觉显著图的一致性越好。反映本发明方法的显著提取性能的PLCC、KLD和AUC相关指标如表1所列。从表1所列的数据可知，按本发明方法提取得到的最终视觉显著图与主观视觉显著图的准确性和稳定性是很好的，表明客观提取结果与人眼主观感知的结果较为一致，足以说明本发明方法的可行性和有效性。

表1利用本发明方法提取得到的最终视觉显著图与主观视觉显著图的准确性和稳

定性

Claims

1.一种立体图像视觉显著提取方法，其特征在于包括以下步骤：

2.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤②中，其中，min()为取最小值函数，max()为取最大值函数。

3.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤③中，G_200,D(x₁,y₁)＝abs(G_200x,D(x₁,y₁)+G_200y,D(x₁,y₁))，G_200,L(x₁,y₁)＝abs(G_200x,L(x₁,y₁)+G_200y,L(x₁,y₁))，G_200,a(x₁,y₁)＝abs(G_200x,a(x₁,y₁)+G_200y,a(x₁,y₁))，G_200,b(x₁,y₁)＝abs(G_200x,b(x₁,y₁)+G_200y,b(x₁,y₁))；其中，abs()表示取绝对值函数，G_200x,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,D(x₁,y₁)表示对{D₂₀₀(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,D(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,L(x₁,y₁)表示对{L_200,L(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,L(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,a(x₁,y₁)表示对{L_200,a(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,a(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200x,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的水平方向进行梯度提取得到的水平方向梯度图{G_200x,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值，G_200y,b(x₁,y₁)表示对{L_200,b(x₁,y₁)}的垂直方向进行梯度提取得到的垂直方向梯度图{G_200y,b(x₁,y₁)}中坐标位置为(x₁,y₁)的像素点的像素值。

4.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤⑤中，其中，e为自然基数，x₀表示{C_saliency200(x₁,y₁)}的中心像素点的横坐标，y₀表示{C_saliency200(x₁,y₁)}的中心像素点的纵坐标，δ_D表示中心偏好参数。

5.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤⑦中，{LG₂₀₀(u₁,v₁)}利用Log-Gabor频域滤波器生成，生成{LG₂₀₀(u₁,v₁)}的过程中所需的4个输入参数的取值分别为：带宽控制参数σ_F的取值为0.3，滤波模板图宽度控制参数u₀的取值为100，滤波模板图高度控制参数v₀的取值为100，滤波器中心频率控制参数ω₀的取值为0.1667；所述的步骤⑦中，Q_log-Gabor200(u₁,v₁)＝LG₂₀₀(u₁,v₁)×Q_f200(u₁,v₁)。

6.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤⑧中，其中，max()表示取最大值函数。