CN108596832B

CN108596832B - 视觉感知饱和策略的超像素参数自适应选择方法

Info

Publication number: CN108596832B
Application number: CN201810346540.3A
Authority: CN
Inventors: 郭娅茜; 叶家建; 徐靓云; 张纠; 潘晨
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-04-18
Filing date: 2018-04-18
Publication date: 2022-07-05
Anticipated expiration: 2038-04-18
Also published as: CN108596832A

Abstract

本发明公开了一种视觉感知饱和策略的超像素参数自适应选择方法，包括以下步骤：1)利用SLIC(简单线性迭代聚类)算法，采用不同超像素参数Ki，由原图像构造出多个超像素图SPi；2)将超像素表示为单个像素，则每个超像素图可表示为原图的一个缩小图像Ii；3)分别对Ii用显著点预测算法计算显著图Si，其中显著度值大于平均值的像素点作为注视点；4)用注视点做Kmeans聚类，生成多个聚类Class_j；5)每类注视点形成各自注视区域及质心，则该类注视点到质心的类内距离可作为微跳视幅度参数看待。6)对整个图像中各类的类内距离做归一化并累计，作为该尺度图像的微跳视幅度AOMi；7)比较AOMi，其最小值对应的超像素参数Ki就是最佳参数。

Description

视觉感知饱和策略的超像素参数自适应选择方法

技术领域

本发明涉及计算机视觉技术领域，具体地讲是一种视觉感知饱和策略的超像素参数自适应选择方法。

背景技术

随着微电子、互联网等技术快速发展，光学摄像头已成为一种标准信息感知单元；同时，摄像头的图像分辨率在不断提高，4K以上超高清设备越来越常见。图像分辨率的提高，使得像素数量几何倍数增加。面对海量视频图像数据，传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机系统硬件速度来减缓这种压力；另一方面，对传统图像处理算法做合理改进，使之更适应处理海量像素数据，是一种有效的解决问题思路。

人眼观察图像不是针对每个像素，而是某些具有同质属性的像素连通区域，称为超像素或者基元。颜色、纹理、边缘等特征都能用来描述这样的区域。图像的超像素化可以大大减少数据规模，降低干扰因素，有助于保持目标边缘，有利于提高算法性能。但是对不同类型的自然图像，如何进行合理的超像素预处理并没有可以遵循的一般准则。几乎所有文献都不涉及或者缺乏对这种预处理方式的相关实验和理论分析。超像素参数通常由人经验性地累试选择。然而实际不同类型图像可能对应各自不同的较佳超像素参数，且实验表明超像素参数选择与图像处理效果有直接关系。由于直接与图像尺度相关，超像素参数选择实际是一种图像尺度选择问题。目前图像处理算法中的尺度选择基本依赖于主观经验，缺乏兼容性，难以实现自适应地选择超像素参数。而现有技术为了克服超像素参数的敏感性，除了采用经验参数外，通常还采用多尺度图像同时并行处理方式，即同时生成多个不同参数超像素图，通过各个尺度图像处理结果做后处理(集成)，来获得最终图像处理结果。

发明内容

本发明要解决的技术问题是，提出一种将微跳视幅度作为一种感知指标，用于自动选择合理的图像尺度，利用人类视觉机制自动选择合适图像尺度，从而降低数据量、提高算法性能的视觉感知饱和策略的超像素参数自适应选择方法。

有鉴于此，本发明的解决解决方案是，提供一种利用视觉感知饱和策略的超像素参数选择方法，包括以下各步骤：

1)利用SLIC(Simple Linear Iterative Cluster)算法，采用不同超像素参数Ki，由原图像I构造出多个超像素图SPi；

2)将所述多个超像素图SPi中的超像素表示为单个像素，则每个超像素图可表示为原图I的一个缩小图像Ii；

3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si，将显著图Si中像素按显著度排序，选取大于均值的点作为注视点，形成注视点集合Fix_set；

4)利用注视点集合Fix_set做Kmeans聚类，生成多个聚类Class_j；

5)每个聚类注视点形成自身注视区域和类中心，则该聚类注视点到类中心的类内距离作为微跳视幅度参数。

作为改进，在步骤5)之后，对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理，作为该原图像I的微跳视幅度AOMi；比较AOMi，其最小值对应的超像素参数Ki就是最佳图像尺度。

作为改进，通过相位谱法对目标图像作注视点预测，可采用以下步骤：

对图像I(x,y)进行二维离散傅里叶变换，将图像由空间域转换到频域，得到相位P(u,v)信息：

式中F和F^-1表示二维离散傅里叶正、逆变换，

表示相位运算；将相位信息经傅里叶逆变换后，可以在空间域得到显著度图像Sa_Map；

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

根据显著度图，注视点的位置可用下列公式求出：

作为改进，对注视点先进行Kmeans聚类，划分注视点为不同的聚类；多个聚类意味着场景中有多个注视区域，通过注视点之间的离散程度，判断图中是否存在多个注视目标，以避免多个注视区域被作为单个注视区域时导致判断错误。

作为改进，第Ki个尺度下的微跳视幅度AOM_i计算如公式(4)；

其中:

表示第j类中的第i个点坐标(x,y)。cent^j(x,y)表示第j类中心坐标；

L表示图像对角线长度，nj为每类点数量，k为类别数量。

采用本发明方法，与现有技术相比，具有以下优点：本发明实现了超像素参数选择的自动化；算法结果匹配人类视觉感知；避免了多尺度并行处理图像；算法只注重少数高显著度像素数据，极大降低了计算量，具有低时间复杂度；由于显著点预测算法对光照变化和大范围纹理噪声等干扰不敏感，借助该方法能容忍一定程度(如设备不同、光照条件不同导致)的图像变化。

附图说明

图1为本发明视觉感知饱和策略的超像素参数自适应选择方法流程框图。

具体实施方式

下面就具体实施例对本发明作进一步说明，但本发明并不仅仅限于这些实施例。

本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解，在以下本发明优选实施例中详细说明了具体的细节，而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外，本发明之附图中为了示意的需要，并没有完全精确地按照实际比例绘制，在此予以说明。

本发明借鉴人类视觉的注视眼动行为和视觉感知饱和现象，通过预测不同超像素图像的视觉饱和状况，来选择最容易引起感知饱和的超像素参数作为最佳参数。

已知人眼在观察场景时存在频繁眼动(跳视和微跳视)。跳视幅度大，使得视网膜中央凹朝向需要注意的场景；微跳视幅度小，维持目标区域相对稳定于中央凹。精确注视时，微跳视的幅度会逐渐下降，而当微跳视幅度微小时将导致视知觉饱和；一方面输出当前视觉目标，另一方面导致感知衰退，引发新跳视和返回抑制(注视不返回先前注视点)。受上述感知饱和原理启发，对于同一场景的不同参数超像素图而言，若某图中注视区域的微跳视幅度相对最小，将最快产生目标感知，进而具有感知优势。

如图1所示，示意了本发明的处理流程，可知本发明的视觉感知饱和策略的超像素参数自适应选择方法，包括以下各步骤：

4)利用注视点集合Fix_set做Kmeans聚类，生成多个聚类Class_j；

在步骤5)之后，对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理，作为该原图像I的微跳视幅度AOMi；比较AOMi，其最小值对应的超像素参数Ki就是最佳图像尺度。

SLIC算法是基于颜色与坐标的像素聚类方法。通过指定kk个均匀分布的种子点，将离种子点最近的相似像素聚为一类。聚类后的超像素结果通常仍表示为原图尺度大小。与常规做法不同，本发明将每个超像素看作单个像素，则超像素图实际上可以表示为一种由原图缩小后的图像。如图1中缩小图所示。从人类视觉的角度，由于视网膜面积有限，人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦，效果与此类似。

为了模拟人类眼动行为，本发明利用注视预测模型产生注视点。现有注视预测模型中的许多算法，如谱残差法(SR)，相位谱法(PFT)，布尔图法(BMS)等，都可以用来产生合适的注视预测结果。例如，通过相位谱法对目标图像作注视点预测，可采用以下步骤：

式中F和F^-1表示二维离散傅里叶正、逆变换，

表示相位运算。将相位信息经傅里叶逆变换后，可以在空间域得到显著度图像Sa_Map。

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

根据显著度图，注视点的位置可用下列公式求出：

可对注视点先进行Kmeans聚类，粗略划分注视点为不同的聚类；多个聚类意味着场景中有多个注视区域。目的是通过注视点之间的离散程度，大致判断图中是否存在多个注视目标，以避免多个注视区域被作为单个注视区域时导致判断错误。

接着，针对各注视区域，计算该类中心到各注视点的类内距离，并利用图像对角线长度为分母，对其归一化。各类注视点到类中心的归一化距离累计，作为微跳视幅度度量值。

第Ki个尺度下的微跳视幅度AOM_i计算如公式(4)。

其中:

表示第j类中的第i个点，坐标(x,y)。cent^j(x,y)表示第j类中心坐标。L表示图像对角线长度，n_j为每类点数量，k为类别数量。

虽然以上将实施例分开说明和阐述，例如，方法和系统的两套发明，但涉及部分共通之技术，在本领域普通技术人员看来，可以在实施例之间进行替换和整合，涉及其中一个实施例未明确记载的内容，则可参考有记载的另一个实施例。

以上仅就本发明较佳的实施例作了说明，但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例，其具体结构允许有变化。总之，凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。