CN108596832B - 视觉感知饱和策略的超像素参数自适应选择方法 - Google Patents
视觉感知饱和策略的超像素参数自适应选择方法 Download PDFInfo
- Publication number
- CN108596832B CN108596832B CN201810346540.3A CN201810346540A CN108596832B CN 108596832 B CN108596832 B CN 108596832B CN 201810346540 A CN201810346540 A CN 201810346540A CN 108596832 B CN108596832 B CN 108596832B
- Authority
- CN
- China
- Prior art keywords
- image
- superpixel
- fixation
- class
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000016776 visual perception Effects 0.000 title claims abstract description 14
- 238000010187 selection method Methods 0.000 title claims abstract description 7
- 230000004438 eyesight Effects 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 17
- 230000000007 visual effect Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 10
- 230000004459 microsaccades Effects 0.000 description 6
- 230000008447 perception Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000004424 eye movement Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 230000004434 saccadic eye movement Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 230000001711 saccadic effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种视觉感知饱和策略的超像素参数自适应选择方法,包括以下步骤:1)利用SLIC(简单线性迭代聚类)算法,采用不同超像素参数Ki,由原图像构造出多个超像素图SPi;2)将超像素表示为单个像素,则每个超像素图可表示为原图的一个缩小图像Ii;3)分别对Ii用显著点预测算法计算显著图Si,其中显著度值大于平均值的像素点作为注视点;4)用注视点做Kmeans聚类,生成多个聚类Class_j;5)每类注视点形成各自注视区域及质心,则该类注视点到质心的类内距离可作为微跳视幅度参数看待。6)对整个图像中各类的类内距离做归一化并累计,作为该尺度图像的微跳视幅度AOMi;7)比较AOMi,其最小值对应的超像素参数Ki就是最佳参数。
Description
技术领域
本发明涉及计算机视觉技术领域,具体地讲是一种视觉感知饱和策略的超像素参数自适应选择方法。
背景技术
随着微电子、互联网等技术快速发展,光学摄像头已成为一种标准信息感知单元;同时,摄像头的图像分辨率在不断提高,4K以上超高清设备越来越常见。图像分辨率的提高,使得像素数量几何倍数增加。面对海量视频图像数据,传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机系统硬件速度来减缓这种压力;另一方面,对传统图像处理算法做合理改进,使之更适应处理海量像素数据,是一种有效的解决问题思路。
人眼观察图像不是针对每个像素,而是某些具有同质属性的像素连通区域,称为超像素或者基元。颜色、纹理、边缘等特征都能用来描述这样的区域。图像的超像素化可以大大减少数据规模,降低干扰因素,有助于保持目标边缘,有利于提高算法性能。但是对不同类型的自然图像,如何进行合理的超像素预处理并没有可以遵循的一般准则。几乎所有文献都不涉及或者缺乏对这种预处理方式的相关实验和理论分析。超像素参数通常由人经验性地累试选择。然而实际不同类型图像可能对应各自不同的较佳超像素参数,且实验表明超像素参数选择与图像处理效果有直接关系。由于直接与图像尺度相关,超像素参数选择实际是一种图像尺度选择问题。目前图像处理算法中的尺度选择基本依赖于主观经验,缺乏兼容性,难以实现自适应地选择超像素参数。而现有技术为了克服超像素参数的敏感性,除了采用经验参数外,通常还采用多尺度图像同时并行处理方式,即同时生成多个不同参数超像素图,通过各个尺度图像处理结果做后处理(集成),来获得最终图像处理结果。
发明内容
本发明要解决的技术问题是,提出一种将微跳视幅度作为一种感知指标,用于自动选择合理的图像尺度,利用人类视觉机制自动选择合适图像尺度,从而降低数据量、提高算法性能的视觉感知饱和策略的超像素参数自适应选择方法。
有鉴于此,本发明的解决解决方案是,提供一种利用视觉感知饱和策略的超像素参数选择方法,包括以下各步骤:
1)利用SLIC(Simple Linear Iterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数。
作为改进,在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度。
作为改进,通过相位谱法对目标图像作注视点预测,可采用以下步骤:
对图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
根据显著度图,注视点的位置可用下列公式求出:
作为改进,对注视点先进行Kmeans聚类,划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域,通过注视点之间的离散程度,判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
作为改进,第Ki个尺度下的微跳视幅度AOMi计算如公式(4);
L表示图像对角线长度,nj为每类点数量,k为类别数量。
采用本发明方法,与现有技术相比,具有以下优点:本发明实现了超像素参数选择的自动化;算法结果匹配人类视觉感知;避免了多尺度并行处理图像;算法只注重少数高显著度像素数据,极大降低了计算量,具有低时间复杂度;由于显著点预测算法对光照变化和大范围纹理噪声等干扰不敏感,借助该方法能容忍一定程度(如设备不同、光照条件不同导致)的图像变化。
附图说明
图1为本发明视觉感知饱和策略的超像素参数自适应选择方法流程框图。
具体实施方式
下面就具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外,本发明之附图中为了示意的需要,并没有完全精确地按照实际比例绘制,在此予以说明。
本发明借鉴人类视觉的注视眼动行为和视觉感知饱和现象,通过预测不同超像素图像的视觉饱和状况,来选择最容易引起感知饱和的超像素参数作为最佳参数。
已知人眼在观察场景时存在频繁眼动(跳视和微跳视)。跳视幅度大,使得视网膜中央凹朝向需要注意的场景;微跳视幅度小,维持目标区域相对稳定于中央凹。精确注视时,微跳视的幅度会逐渐下降,而当微跳视幅度微小时将导致视知觉饱和;一方面输出当前视觉目标,另一方面导致感知衰退,引发新跳视和返回抑制(注视不返回先前注视点)。受上述感知饱和原理启发,对于同一场景的不同参数超像素图而言,若某图中注视区域的微跳视幅度相对最小,将最快产生目标感知,进而具有感知优势。
如图1所示,示意了本发明的处理流程,可知本发明的视觉感知饱和策略的超像素参数自适应选择方法,包括以下各步骤:
1)利用SLIC(Simple Linear Iterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数。
在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度。
SLIC算法是基于颜色与坐标的像素聚类方法。通过指定kk个均匀分布的种子点,将离种子点最近的相似像素聚为一类。聚类后的超像素结果通常仍表示为原图尺度大小。与常规做法不同,本发明将每个超像素看作单个像素,则超像素图实际上可以表示为一种由原图缩小后的图像。如图1中缩小图所示。从人类视觉的角度,由于视网膜面积有限,人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦,效果与此类似。
为了模拟人类眼动行为,本发明利用注视预测模型产生注视点。现有注视预测模型中的许多算法,如谱残差法(SR),相位谱法(PFT),布尔图法(BMS)等,都可以用来产生合适的注视预测结果。例如,通过相位谱法对目标图像作注视点预测,可采用以下步骤:
对图像I(x,y)进行二维离散傅里叶变换,将图像由空间域转换到频域,得到相位P(u,v)信息:
Sa_Map(x,y)=|F-1[exp{jP(u,v)}]|2 (2)
根据显著度图,注视点的位置可用下列公式求出:
可对注视点先进行Kmeans聚类,粗略划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域。目的是通过注视点之间的离散程度,大致判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
接着,针对各注视区域,计算该类中心到各注视点的类内距离,并利用图像对角线长度为分母,对其归一化。各类注视点到类中心的归一化距离累计,作为微跳视幅度度量值。
第Ki个尺度下的微跳视幅度AOMi计算如公式(4)。
虽然以上将实施例分开说明和阐述,例如,方法和系统的两套发明,但涉及部分共通之技术,在本领域普通技术人员看来,可以在实施例之间进行替换和整合,涉及其中一个实施例未明确记载的内容,则可参考有记载的另一个实施例。
以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例,其具体结构允许有变化。总之,凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。
Claims (3)
1.一种视觉感知饱和策略的超像素参数自适应选择方法,其特征在于:包括以下步骤:
1)利用SLIC(SimpleLinearIterative Cluster)算法,采用不同超像素参数Ki,由原图像I构造出多个超像素图SPi;
2)将所述多个超像素图SPi中的超像素表示为单个像素,则每个超像素图可表示为原图I的一个缩小图像Ii;
3)分别对缩小图像Ii用显著点预测算法计算得到显著图Si,将显著图Si中像素按显著度排序,选取大于均值的点作为注视点,形成注视点集合Fix_set;
4)利用注视点集合Fix_set做Kmeans聚类,生成多个聚类Class_j;
5)每个聚类注视点形成自身注视区域和类中心,则该聚类注视点到类中心的类内距离作为微跳视幅度参数;
在步骤5)之后,对基于整个原图像I所得到的各聚类的类内距离做累计和归一化处理,作为该原图像I的微跳视幅度AOMi;比较AOMi,其最小值对应的超像素参数Ki就是最佳图像尺度;
第Ki个尺度下的微跳视幅度AOMi计算如公式(4);
3.根据权利要求2所述的视觉感知饱和策略的超像素参数自适应选择方法,其特征在于:对注视点先进行Kmeans聚类,划分注视点为不同的聚类;多个聚类意味着场景中有多个注视区域,通过注视点之间的离散程度,判断图中是否存在多个注视目标,以避免多个注视区域被作为单个注视区域时导致判断错误。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810346540.3A CN108596832B (zh) | 2018-04-18 | 2018-04-18 | 视觉感知饱和策略的超像素参数自适应选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810346540.3A CN108596832B (zh) | 2018-04-18 | 2018-04-18 | 视觉感知饱和策略的超像素参数自适应选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108596832A CN108596832A (zh) | 2018-09-28 |
CN108596832B true CN108596832B (zh) | 2022-07-05 |
Family
ID=63613605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810346540.3A Expired - Fee Related CN108596832B (zh) | 2018-04-18 | 2018-04-18 | 视觉感知饱和策略的超像素参数自适应选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108596832B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114445275A (zh) * | 2021-09-03 | 2022-05-06 | 中国计量大学 | 一种图像极限缩小导致视觉感知饱和现象的判断方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9042648B2 (en) * | 2012-02-23 | 2015-05-26 | Microsoft Technology Licensing, Llc | Salient object segmentation |
CN104992452B (zh) * | 2015-06-25 | 2019-02-22 | 中国计量学院 | 基于热成像视频的飞行目标自动跟踪方法 |
CN105184772B (zh) * | 2015-08-12 | 2018-08-24 | 陕西师范大学 | 一种基于超像素的自适应彩色图像分割方法 |
CN107169958B (zh) * | 2017-05-08 | 2022-01-25 | 中国计量大学 | 机器学习、背景抑制与感知正反馈相结合的视觉显著性检测方法 |
CN107229917B (zh) * | 2017-05-31 | 2019-10-15 | 北京师范大学 | 一种基于迭代聚类的多幅遥感影像共性显著目标检测方法 |
-
2018
- 2018-04-18 CN CN201810346540.3A patent/CN108596832B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN108596832A (zh) | 2018-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Moorthy et al. | Visual importance pooling for image quality assessment | |
Wang et al. | Maximum differentiation (MAD) competition: A methodology for comparing computational models of perceptual quantities | |
JP6495457B2 (ja) | 較正の改善、正確性の補償、及び注視定位平滑化を有する注視追跡システム | |
WO2018000752A1 (zh) | 一种基于多尺度cnn和连续crf的单目图像深度估计方法 | |
CN111353506B (zh) | 自适应的视线估计方法和设备 | |
US8774518B2 (en) | Digital pathology system with low-latency analytics | |
US11688042B2 (en) | Filtering render data using multiple iterations for a filter direction | |
CN108961206B (zh) | 一种去雾效果的无参考客观评价方法 | |
US11503998B1 (en) | Method and a system for detection of eye gaze-pattern abnormalities and related neurological diseases | |
CN109147005A (zh) | 一种用于红外图像的自适应染色方法、系统、存储介质、终端 | |
CN110276764A (zh) | 基于K值估计的K-Means水下图像背景分割改进算法 | |
CN109448019B (zh) | 一种变分光流模型平滑参数的自适应方法 | |
Moorthy et al. | Perceptually significant spatial pooling techniques for image quality assessment | |
CN109493319B (zh) | 融合图像效果量化方法、装置、计算机设备和存储介质 | |
CN113179421B (zh) | 视频封面选择方法、装置、计算机设备和存储介质 | |
CN108596832B (zh) | 视觉感知饱和策略的超像素参数自适应选择方法 | |
US20220181007A1 (en) | Computerized systems for prediction of geographic atrophy progression using deep learning applied to clinical imaging | |
CN109816618A (zh) | 一种基于自适应阈值的区域能量光子计数图像融合算法 | |
CN108573472B (zh) | 利用最小熵判断视觉感知饱和的图像自适应缩小方法 | |
US20210327030A1 (en) | Imaging system and method incorporating selective denoising | |
Ling et al. | ASSP: An adaptive sample statistics-based pooling for full-reference image quality assessment | |
Liu et al. | Phases measure of image sharpness based on quaternion wavelet | |
TWI448913B (zh) | A shape generation method and a image retrieval system for image retrieval | |
Ramlan et al. | Image Enhancement Methods for Anterior Segment Photographed Images | |
CN110111286A (zh) | 图像优化方式的确定方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220705 |