CN108573472B

CN108573472B - 利用最小熵判断视觉感知饱和的图像自适应缩小方法

Info

Publication number: CN108573472B
Application number: CN201810365927.3A
Authority: CN
Inventors: 潘晨; 徐文龙; 叶家建; 郭娅茜
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-04-18
Filing date: 2018-04-23
Publication date: 2022-05-24
Anticipated expiration: 2038-04-23
Also published as: CN109544452B; CN108573472A; CN109544452A

Abstract

本发明公开了一种利用最小熵判断视觉感知饱和的图像自适应缩小方法，包括以下步骤：1)利用不同缩小倍数Ki，通过对原图像下采样，构造出多个缩小图Ii；2)分别对Ii用显著点预测算法计算显著图Si，其中显著度值大于平均值的像素点作为注视点；3)注视点形成注视区域，求出该区域质心；统计距质心点不同距离范围的注视点频数；4)计算各缩小图像中，由注视点与质心距离生成的熵值Ei；5)比较不同缩小倍数Ki下的Ei，其最小值对应的Ki是最佳图像缩小倍数。本发明引入熵值并利用人类视觉机制自动选择合适的图像缩小尺度，从而降低数据量、提高算法性能。

Description

利用最小熵判断视觉感知饱和的图像自适应缩小方法

技术领域

本发明涉及计算机视觉技术领域，具体地讲是一种利用最小熵判断视觉感知饱和的图像自适应缩小方法。

背景技术

图像分辨率的提高，使得像素数量几何倍数增加。面对海量视频图像数据，传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机系统硬件速度来减缓这种压力；另一方面，对传统图像处理算法做合理改进，使之更适应处理海量像素数据，是一种有效的解决问题思路。

从人类视觉的角度而言，由于视网膜面积和光感受器数量有限，人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦。场景在视网膜上的投影是适当缩小的图像。缩小图像——利用下采样方式，缩小图像到一个合适尺度，能大大降低数据量。缺点是下采样过程中，过分的下采样往往会丢失小目标、模糊目标边缘。应用中的关键问题是图像缩小到多大尺度最合适？因此如何选择合理的缩小尺度是个亟待解决的问题。

现有技术通常是由人累试不同的图像缩小尺度，经验性地选择一个对大多数任务都合适的固定参数。对于变化的实际场景，这种做法有严重局限性。为了克服图像算法对于尺度的敏感性，通常还采用多尺度图像同时并行处理方式，即同时生成多个不同尺度的缩小图，通过各个尺度图像处理结果做后处理(集成)，来获得最终图像处理结果。缺点是此类方法有很高的时间复杂度。

发明内容

有鉴于此，本发明要解决的技术问题是，提供一种图像自动缩小方法，利用最小熵判断判断视觉感知饱和程度，选择可最容易引起感知饱和的图像尺度作为图像缩小的最佳依据。

本发明的技术解决方案是，提供以下步骤的利用最小熵判断视觉感知饱和的图像自适应缩小方法，包括以下各步骤：

1)利用不同缩小倍数Ki，通过对原图像I进行下采样，构造出多个缩小尺度图Ii。

2)分别对缩小尺度图Ii用显著点预测算法计算得到显著图Si，选择显著图Si中显著度值大于平均值的像素点作为注视点；

3)所述注视点形成注视区域，由各点位置信息计算注视区域的质心；对各注视点到质心的距离做归一化将各点到质心点距离作为变量来统计一定距离范围内的注视点频数，则各点到质心点的距离信息被转换为概率，进而表示为熵值；

4)计算各个缩小尺度图Ii中，由注视点与质心点的距离形成的熵值Ei；

5)比较熵值Ei，其最小值对应的缩小倍数Ki作为最佳图像尺度。

作为改进，注视时的微跳视幅度表示为一种信息熵，作为一种感知产生的指标，所述熵值最小时对应的缩小图像，最快产生感知饱和，优先输出视觉目标。

作为改进，对原图像I(x,y)进行二维离散傅里叶变换，将图像由空间域转换到频域，得到相位P(u,v)信息：

将相位信息经傅里叶逆变换后，可以在空间域得到显著度图像Sa_Map；

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

式中F和F^-1表示二维离散傅里叶正、逆变换，

表示相位运算；根据显著度图，注视点的位置可用下列公式求出：

p_i(x,y)＝Sa_Map(x,y)-mean(Sa_Map(x,y))＞0 (3)

上述注视点p_i(x,y)可形成一个注视区域。

作为改进，先计算出各注视点的均值位置，作为注视区域的质心cent(x,y)；再计算该质心到各注视点的距离，并利用图像对角线长度为分母，对其归一化，采用如下公式实现：

其中:p_i(x,y)表示第i个注视点,cent(x,y)表示质心点，(x,y)是点坐标，L表示图像对角线长度,n为注视点数量，Dist_i为质心到各注视点的距离。

作为改进，以各注视点到质心的归一化距离为变量，统计各注视点位于质心不同范围内出现的频数；将该频数归一化，即为注视点与质心距离的概率统计值，用于计算注视点与质心距离的熵值，所述熵值作为微跳视幅度的一种度量值。

采用本发明方法，与现有技术相比，具有以下优点：可以自动缩小图像到合适尺度；算法结果匹配人类视觉感知；避免了并行处理多尺度图像的耗时；算法只注重少数高显著度像素数据，极大降低了计算量，具有低时间复杂度；引入熵值Ei，无需对注视点做聚类估计，减少了算法参数；由于显著点预测算法对光照变化和大范围纹理噪声等干扰不敏感，借助该方法能容忍一定程度(如设备不同、光照条件不同导致)的图像变化，本发明利用人类视觉机制自动选择合适的图像缩小尺度，从而降低数据量、提高算法性能的方法。

附图说明

图1为本发明利用最小熵判断视觉感知饱和的图像自适应缩小方法流程框图。

图2以各点-质心距离为变量，计算各点与质心之间基于距离信息的频数来计算概率和熵的示意图。

具体实施方式

下面就具体实施例对本发明作进一步说明，但本发明并不仅仅限于这些实施例。

本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解，在以下本发明优选实施例中详细说明了具体的细节，而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外，本发明之附图中为了示意的需要，并没有完全精确地按照实际比例绘制，在此予以说明。

已知人眼在观察场景时存在频繁眼动(跳视和微跳视)。跳视幅度大，使得视网膜中央凹朝向需要注意的场景；微跳视幅度小，维持目标区域相对稳定于中央凹。当人眼凝视(注视)感兴趣区域时，微跳视的幅度会逐渐下降，而当微跳视幅度微小时将导致视知觉饱和；一方面神经系统输出当前视觉目标，另一方面导致感知衰退，引发新跳视和返回抑制(注视不返回先前点)。因此，人眼注视过程中的微跳视幅度，可以作为一种视觉感知饱和程度的指标，来衡量不同尺度的缩小图像对视觉感知的影响。

如图1所示，本发明的视觉感知饱和策略的图像自适应缩小方法，包括以下各步骤：

3)所述注视点形成注视区域，由各点位置信息计算注视区域的质心；对各注视点到质心的距离做归一化；若将各点到质心点距离作为变量来统计一定距离范围内的注视点频数，则各点到质心点的距离信息被转换为概率，进而表示为熵值；

本发明利用注视预测模型产生注视点，模拟人类注视。注视预测模型中的许多算法，如谱残差法(SR)，相位谱法(PFT)，布尔图法(BMS)等，都可以用来产生合适的注视预测结果。例如，通过相位谱法对目标图像作注视点预测，可采用以下步骤：

对原图像I(x,y)进行二维离散傅里叶变换，将图像由空间域转换到频域，得到相位P(u,v)信息：

将相位信息经傅里叶逆变换后，可以在空间域得到显著度图像Sa_Map。

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

式中F和F^-1表示二维离散傅里叶正、逆变换，

表示相位运算。根据显著度图，注视点的位置可用下列公式求出：

p_i(x,y)＝Sa_Map(x,y)-mean(Sa_Map(x,y))＞0 (3)

上述注视点p_i(x,y)可形成一个注视区域。为了衡量注视点之间的离散程度，可以先计算出各注视点的均值位置，作为注视区域的质心cent(x,y)。接着，计算该质心到各注视点的距离，并利用图像对角线长度为分母，对其归一化。

其中:p_i(x,y)表示第i个注视点,cent(x,y)表示质心点，(x,y)是点坐标。L表示图像对角线长度,n为注视点数量，Dist_i为质心到各注视点的距离。

以各注视点到质心的归一化距离为变量，可以统计各注视点位于质心不同范围内出现的频数。将该频数归一化，即为注视点与质心距离的概率值(公式7中的prop_j)，可用于计算注视点与质心距离的熵值，作为微跳视幅度的一种度量值。

其中，#{r_j-1＜Dist_i＜r_j}表示(r_j-1,r_j)距离范围内出现注视点的个数(频数)，n为注视点数量，prop_j表示某距离范围内注视点的概率。

第Ki个尺度下的微跳视幅度的熵值E_i计算如以下公式：

式中m表示距离范围，依远近程度将[0,1]区间划分为m个范围。

各注视点越密集，prop_j概率越大，熵值越小。各注视点位置越散乱，prop_j概率越小，但熵值越大。见图2示例。

上述分析表明，(表示距离的)熵值越小，视觉感知饱和的可能性越大。“熵最小”可用于衡量不同尺度图像对视觉感知饱和的贡献。

虽然以上将实施例分开说明和阐述，例如，方法和系统的两套发明，但涉及部分共通之技术，在本领域普通技术人员看来，可以在实施例之间进行替换和整合，涉及其中一个实施例未明确记载的内容，则可参考有记载的另一个实施例。

以上仅就本发明较佳的实施例作了说明，但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例，其具体结构允许有变化。总之，凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。

Claims

1.利用最小熵判断视觉感知饱和的图像自适应缩小方法，其特征在于：包括以下步骤：

1)利用不同缩小倍数Ki，通过对原图像I进行下采样，构造出多个缩小尺度图Ii；

5)比较熵值Ei，其最小值对应的缩小倍数Ki作为最佳图像尺度；

其中，步骤3)中形成注视区域具体过程为：

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

式中F和F^-1表示二维离散傅里叶正、逆变换，

p_i(x,y)＝Sa_Map(x,y)-mean(Sa_Map(x,y))＞0 (3)

上述注视点p_i(x,y)可形成一个注视区域；

其中，步骤3)中归一化具体过程为：

先计算出各注视点的均值位置，作为注视区域的质心cent(x,y)；再计算该质心到各注视点的距离，并利用图像对角线长度为分母，对其归一化，采用如下公式实现：

其中:p_i(x,y)表示第i个注视点,cent(x,y)表示质心点，(x,y)是点坐标，L表示图像对角线长度，n为注视点数量，Dist_i为质心到各注视点的距离。

2.根据权利要求1所述的利用最小熵判断视觉感知饱和的图像自适应缩小方法，其特征在于：注视时的微跳视幅度表示为一种信息熵，作为一种感知产生的指标，所述熵值最小时对应的缩小图像，最快产生感知饱和，优先输出视觉目标。

3.根据权利要求1所述的利用最小熵判断视觉感知饱和的图像自适应缩小方法，其特征在于：以各注视点到质心的归一化距离为变量，统计各注视点位于质心不同范围内出现的频数；将该频数归一化，即为注视点与质心距离的概率统计值，用于计算注视点与质心距离的熵值，所述熵值作为微跳视幅度的一种度量值。