CN108596832B - 视觉感知饱和策略的超像素参数自适应选择方法 - Google Patents

视觉感知饱和策略的超像素参数自适应选择方法 Download PDF

Info

Publication number
CN108596832B
CN108596832B CN201810346540.3A CN201810346540A CN108596832B CN 108596832 B CN108596832 B CN 108596832B CN 201810346540 A CN201810346540 A CN 201810346540A CN 108596832 B CN108596832 B CN 108596832B
Authority
CN
China
Prior art keywords
image
superpixel
fixation
class
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810346540.3A
Other languages
English (en)
Other versions
CN108596832A (zh
Inventor
郭娅茜
叶家建
徐靓云
张纠
潘晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201810346540.3A priority Critical patent/CN108596832B/zh
Publication of CN108596832A publication Critical patent/CN108596832A/zh
Application granted granted Critical
Publication of CN108596832B publication Critical patent/CN108596832B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种视觉感知饱和策略的超像素参数自适应选择方法,包括以下步骤:1)利用SLIC(简单线性迭代聚类)算法,采用不同超像素参数Ki,由原图像构造出多个超像素图SPi;2)将超像素表示为单个像素,则每个超像素图可表示为原图的一个缩小图像Ii;3)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;4)用注视点做Kmeans聚类,生成多个聚类Class_j;5)每类注视点形成各自注视区域及质心,则该类注视点到质心的类内距离可作为微跳视幅度参数看待。6)对整个图像中各类的类内距离做归一化并累计,作为该尺度图像的微跳视幅度AOMi;7)比较AOMi,其最小值对应的超像素参数Ki就是最佳参数。

Description

视觉感知饱和策略的超像素参数自适应选择方法
技术领域
本发明涉及计算机视觉技术领域,具体地讲是一种视觉感知饱和策略的超像素参数自适应选择方法。
背景技术
随着微电子、互联网等技术快速发展,光学摄像头已成为一种标准信息感知单元;同时,摄像头的图像分辨率在不断提高,4K以上超高清设备越来越常见。图像分辨率的提高,使得像素数量几何倍数增加。面对海量视频图像数据,传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机系统硬件速度来减缓这种压力;另一方面,对传统图像处理算法做合理改进,使之更适应处理海量像素数据,是一种有效的解决问题思路。
人眼观察图像不是针对每个像素,而是某些具有同质属性的像素连通区域,称为超像素或者基元。颜色、纹理、边缘等特征都能用来描述这样的区域。图像的超像素化可以大大减少数据规模,降低干扰因素,有助于保持目标边缘,有利于提高算法性能。但是对不同类型的自然图像,如何进行合理的超像素预处理并没有可以遵循的一般准则。几乎所有文献都不涉及或者缺乏对这种预处理方式的相关实验和理论分析。超像素参数通常由人经验性地累试选择。然而实际不同类型图像可能对应各自不同的较佳超像素参数,且实验表明超像素参数选择与图像处理效果有直接关系。由于直接与图像尺度相关,超像素参数选择实际是一种图像尺度选择问题。目前图像处理算法中的尺度选择基本依赖于主观经验,缺乏兼容性,难以实现自适应地选择超像素参数。而现有技术为了克服超像素参数的敏感性,除了采用经验参数外,通常还采用多尺度图像同时并行处理方式,即同时生成多个不同参数超像素图,通过各个尺度图像处理结果做后处理(集成),来获得最终图像处理结果。
发明内容
本发明要解决的技术问题是,提出一种将微跳视幅度作为一种感知指标,用于自动选择合理的图像尺度,利用人类视觉机制自动选择合适图像尺度,从而降低数据量、提高算法性能的视觉感知饱和策略的超像素参数自适应选择方法。
有鉴于此,本发明的解决解决方案是,提供一种利用视觉感知饱和策略的超像素参数选择方法,包括以下各步骤:
1)利用SLIC(Simple Linear Iterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数。
作为改进,在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度。
作为改进,通过相位谱法对目标图像作注视点预测,可采用以下步骤:
对图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
Figure BDA0001632083270000021
式中F和F-1表示二维离散傅里叶正、逆变换,
Figure BDA0001632083270000022
表示相位运算;将相位信息经傅里叶逆变换后,可以在空间域得到显著度图像Sa_Map;
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
根据显著度图,注视点的位置可用下列公式求出:
Figure BDA0001632083270000023
作为改进,对注视点先进行Kmeans聚类,划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域,通过注视点之间的离散程度,判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
作为改进,第Ki个尺度下的微跳视幅度AOMi计算如公式(4);
Figure BDA0001632083270000031
其中:
Figure BDA0001632083270000032
表示第j类中的第i个点坐标(x,y)。centj(x,y)表示第j类中心坐标;
L表示图像对角线长度,nj为每类点数量,k为类别数量。
采用本发明方法,与现有技术相比,具有以下优点:本发明实现了超像素参数选择的自动化;算法结果匹配人类视觉感知;避免了多尺度并行处理图像;算法只注重少数高显著度像素数据,极大降低了计算量,具有低时间复杂度;由于显著点预测算法对光照变化和大范围纹理噪声等干扰不敏感,借助该方法能容忍一定程度(如设备不同、光照条件不同导致)的图像变化。
附图说明
图1为本发明视觉感知饱和策略的超像素参数自适应选择方法流程框图。
具体实施方式
下面就具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外,本发明之附图中为了示意的需要,并没有完全精确地按照实际比例绘制,在此予以说明。
本发明借鉴人类视觉的注视眼动行为和视觉感知饱和现象,通过预测不同超像素图像的视觉饱和状况,来选择最容易引起感知饱和的超像素参数作为最佳参数。
已知人眼在观察场景时存在频繁眼动(跳视和微跳视)。跳视幅度大,使得视网膜中央凹朝向需要注意的场景;微跳视幅度小,维持目标区域相对稳定于中央凹。精确注视时,微跳视的幅度会逐渐下降,而当微跳视幅度微小时将导致视知觉饱和;一方面输出当前视觉目标,另一方面导致感知衰退,引发新跳视和返回抑制(注视不返回先前注视点)。受上述感知饱和原理启发,对于同一场景的不同参数超像素图而言,若某图中注视区域的微跳视幅度相对最小,将最快产生目标感知,进而具有感知优势。
如图1所示,示意了本发明的处理流程,可知本发明的视觉感知饱和策略的超像素参数自适应选择方法,包括以下各步骤:
1)利用SLIC(Simple Linear Iterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数。
在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度。
SLIC算法是基于颜色与坐标的像素聚类方法。通过指定kk个均匀分布的种子点,将离种子点最近的相似像素聚为一类。聚类后的超像素结果通常仍表示为原图尺度大小。与常规做法不同,本发明将每个超像素看作单个像素,则超像素图实际上可以表示为一种由原图缩小后的图像。如图1中缩小图所示。从人类视觉的角度,由于视网膜面积有限,人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦,效果与此类似。
为了模拟人类眼动行为,本发明利用注视预测模型产生注视点。现有注视预测模型中的许多算法,如谱残差法(SR),相位谱法(PFT),布尔图法(BMS)等,都可以用来产生合适的注视预测结果。例如,通过相位谱法对目标图像作注视点预测,可采用以下步骤:
对图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
Figure BDA0001632083270000041
式中F和F-1表示二维离散傅里叶正、逆变换,
Figure BDA0001632083270000042
表示相位运算。将相位信息经傅里叶逆变换后,可以在空间域得到显著度图像Sa_Map。
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
根据显著度图,注视点的位置可用下列公式求出:
Figure BDA0001632083270000043
可对注视点先进行Kmeans聚类,粗略划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域。目的是通过注视点之间的离散程度,大致判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
接着,针对各注视区域,计算该类中心到各注视点的类内距离,并利用图像对角线长度为分母,对其归一化。各类注视点到类中心的归一化距离累计,作为微跳视幅度度量值。
第Ki个尺度下的微跳视幅度AOMi计算如公式(4)。
Figure BDA0001632083270000051
其中:
Figure BDA0001632083270000052
表示第j类中的第i个点,坐标(x,y)。centj(x,y)表示第j类中心坐标。L表示图像对角线长度,nj为每类点数量,k为类别数量。
Figure BDA0001632083270000053
Figure BDA0001632083270000054
虽然以上将实施例分开说明和阐述,例如,方法和系统的两套发明,但涉及部分共通之技术,在本领域普通技术人员看来,可以在实施例之间进行替换和整合,涉及其中一个实施例未明确记载的内容,则可参考有记载的另一个实施例。
以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例,其具体结构允许有变化。总之,凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。

Claims (3)

1.一种视觉感知饱和策略的超像素参数自适应选择方法,其特征在于:包括以下步骤:
1)利用SLIC(SimpleLinearIterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数;
在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度;
第Ki个尺度下的微跳视幅度AOMi计算如公式(4);
Figure FDA0003531323390000011
其中:
Figure FDA0003531323390000012
表示第j类中的第i个点,坐标(x,y); centj(x,y)表示第j类中心坐标;L表示图像对角线长度,nj为每类点数量,k为类别数量。
2.根据权利要求1所述的视觉感知饱和策略的超像素参数自适应选择方法,其特征在于:通过相位谱法对目标图像作注视点预测,采用以下步骤:
对图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
Figure FDA0003531323390000013
式中F和F-1表示二维离散傅里叶正、逆变换,
Figure FDA0003531323390000014
表示相位运算;将相位信息经傅里叶逆变换后,在空间域得到显著度图像Sa_Map;
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
根据显著度图,注视点的位置可用下列公式求出:
Figure FDA0003531323390000021
3.根据权利要求2所述的视觉感知饱和策略的超像素参数自适应选择方法,其特征在于:对注视点先进行Kmeans聚类,划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域,通过注视点之间的离散程度,判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
CN201810346540.3A 2018-04-18 2018-04-18 视觉感知饱和策略的超像素参数自适应选择方法 Expired - Fee Related CN108596832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810346540.3A CN108596832B (zh) 2018-04-18 2018-04-18 视觉感知饱和策略的超像素参数自适应选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810346540.3A CN108596832B (zh) 2018-04-18 2018-04-18 视觉感知饱和策略的超像素参数自适应选择方法

Publications (2)

Publication Number Publication Date
CN108596832A CN108596832A (zh) 2018-09-28
CN108596832B true CN108596832B (zh) 2022-07-05

Family

ID=63613605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810346540.3A Expired - Fee Related CN108596832B (zh) 2018-04-18 2018-04-18 视觉感知饱和策略的超像素参数自适应选择方法

Country Status (1)

Country Link
CN (1) CN108596832B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114445275A (zh) * 2021-09-03 2022-05-06 中国计量大学 一种图像极限缩小导致视觉感知饱和现象的判断方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9042648B2 (en) * 2012-02-23 2015-05-26 Microsoft Technology Licensing, Llc Salient object segmentation
CN104992452B (zh) * 2015-06-25 2019-02-22 中国计量学院 基于热成像视频的飞行目标自动跟踪方法
CN105184772B (zh) * 2015-08-12 2018-08-24 陕西师范大学 一种基于超像素的自适应彩色图像分割方法
CN107169958B (zh) * 2017-05-08 2022-01-25 中国计量大学 机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法
CN107229917B (zh) * 2017-05-31 2019-10-15 北京师范大学 一种基于迭代聚类的多幅遥感影像共性显著目标检测方法

Also Published As

Publication number Publication date
CN108596832A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
Moorthy et al. Visual importance pooling for image quality assessment
Wang et al. Maximum differentiation (MAD) competition: A methodology for comparing computational models of perceptual quantities
JP6495457B2 (ja) 較正の改善、正確性の補償、及び注視定位平滑化を有する注視追跡システム
WO2018000752A1 (zh) 一种基于多尺度cnn和连续crf的单目图像深度估计方法
CN111353506B (zh) 自适应的视线估计方法和设备
US8774518B2 (en) Digital pathology system with low-latency analytics
US11688042B2 (en) Filtering render data using multiple iterations for a filter direction
CN108961206B (zh) 一种去雾效果的无参考客观评价方法
US11503998B1 (en) Method and a system for detection of eye gaze-pattern abnormalities and related neurological diseases
CN109147005A (zh) 一种用于红外图像的自适应染色方法、系统、存储介质、终端
CN110276764A (zh) 基于K值估计的K-Means水下图像背景分割改进算法
CN109448019B (zh) 一种变分光流模型平滑参数的自适应方法
Moorthy et al. Perceptually significant spatial pooling techniques for image quality assessment
CN109493319B (zh) 融合图像效果量化方法、装置、计算机设备和存储介质
CN113179421B (zh) 视频封面选择方法、装置、计算机设备和存储介质
CN108596832B (zh) 视觉感知饱和策略的超像素参数自适应选择方法
US20220181007A1 (en) Computerized systems for prediction of geographic atrophy progression using deep learning applied to clinical imaging
CN109816618A (zh) 一种基于自适应阈值的区域能量光子计数图像融合算法
CN108573472B (zh) 利用最小熵判断视觉感知饱和的图像自适应缩小方法
US20210327030A1 (en) Imaging system and method incorporating selective denoising
Ling et al. ASSP: An adaptive sample statistics-based pooling for full-reference image quality assessment
Liu et al. Phases measure of image sharpness based on quaternion wavelet
TWI448913B (zh) A shape generation method and a image retrieval system for image retrieval
Ramlan et al. Image Enhancement Methods for Anterior Segment Photographed Images
CN110111286A (zh) 图像优化方式的确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220705