CN111222518A - 一种基于分频视觉机制的轮廓特征提取方法 - Google Patents
一种基于分频视觉机制的轮廓特征提取方法 Download PDFInfo
- Publication number
- CN111222518A CN111222518A CN202010049312.7A CN202010049312A CN111222518A CN 111222518 A CN111222518 A CN 111222518A CN 202010049312 A CN202010049312 A CN 202010049312A CN 111222518 A CN111222518 A CN 111222518A
- Authority
- CN
- China
- Prior art keywords
- formula
- receptive field
- lgn
- classical receptive
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于分频视觉机制的轮廓特征提取方法。首先利用高斯函数模拟视通路中外侧膝状体经典感受野对视觉信息的分频作用;然后利用空间频率和朝向调谐之间的全局性抑制作用,并引入低对比度加强后的视觉特征,构建一种朝向敏感以及低对比度适应的感受野,通过外侧膝状体非经典感受野中心‑外周信息差异的检测,从而实现对外周纹理的选择性抑制;最后将纹理抑制后的轮廓信息并行传递至初级视皮层区,实现分频视觉信息流的快速融合编码,以达到轮廓特征提取的快速调节和完整性融合。
Description
技术领域
本发明属于生物视觉和图像处理领域,具体涉及一种基于分频视觉机制的轮廓特征提取方法。
背景技术
轮廓检测是从杂乱场景中快速地提取人类感兴趣区域的过程,如何在较低漏检率的情况下实现伪轮廓和纹理信息的去除,对于降低后续视通路特征提取的难度,并进一步提高轮廓检测性能具有重要意义。轮廓检测的难点主要体现在:(1)在不同光照或视角下,视觉信息加工机理存在差异;(2)在保留轮廓信息的前提下,尽可能多的去除背景纹理信息,通常是相互矛盾的。
随着生理实验手段的发展以及数据分析技术在神经科学中的运用,对于视觉信息处理机制的研究受到广泛的关注。有研究基于生物视觉的中心-周围相互作用特性,构建了各向同性和各向异性的抑制模型,利用二维Gabor函数来表征初级视皮层(V1)感受野轮廓方向的选择性,并引入高斯差(Difference of Gaussian,DoG)函数来模拟外周环绕的侧抑制作用;还有研究进一步提出了外侧膝状体(LGN)感受野组合模型,揭示简单细胞的定向抑制和对比度不变性;此外还有研究视通路中多个视觉特征提取和融合,例如朝向、亮度、对比度三个特征策略组合,实现选择性的纹理抑制,凸显主体轮廓;例如也有研究利用LGN细胞的频域敏感特性,提出了一种基于nCRF抑制和X-Y信息通道的生物学启发模型。需要指出的是,上述算法仅考虑到视通路中单一感受野的生理特性,忽略了视觉信息传递过程的分频处理机制,而越来越多的实验证明视通路上存在着不同功能的感受野,它们之间的电生理活动不仅采用串行关联,还采用分频并行处理的模式;此外目前的研究大都没有关注各个层次间感受野的视觉特征,尤其是LGN感受野的时空频率调谐特征对轮廓快速检测的作用。
发明内容
本发明为解决上述存在的问题,提出一种基于分频视觉机制的轮廓特征提取方法。该方法通过模拟LGN感受野的频域响应特性和V1区的分频视觉信息流融合机制来实现轮廓特征提取。首先模拟LGN经典感受野对视觉信息流的分频特性,引入视觉信息中若干个独立的空间频域调谐作用;然后利用LGN细胞的朝向与低对比度特征的选择性抑制机制,实现非经典感受野的全局调节特性;最后提出分频视觉信息流的融合模型,用于表征初级视皮层中的上下文整合机制,实现视觉信息流的并行处理以及关联性传递,最终达到快速响应和完整性融合的轮廓特征提取。本发明提出一种基于分频视觉机制的轮廓特征提取方法,包括如下步骤:
其中
利用高斯函数的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同。表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
式(3)中默认γ=0.5,*表示卷积运算。
针对步骤1所获得的激励响应在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取的最大值,从而获得初级轮廓响应E(x,y,σj),如式(4)所示。同时记录各尺度参数σj情况下最大值所对应的朝向角,记为θCRF(j)。
其中max表示取最大值函数,下同。
步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下最大值所对应的朝向角为θNCRF(j)。定义第j条空间频率调谐通道上LGN非经典感受野中心-外周的抑制强度如式(7)所示。
式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算。
首先分别计算朝向差异△θCRF-NCRF(j),如式(8)所示。
再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示。
其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同。
步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y)。
首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示。
然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示。
接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示。
其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示。
步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性,将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示。
再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示。
rj(x,y)=max(E(x,y;σj)-α·E_Inhj(x,y),0) (18)
式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3。
步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示。
其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置。
本发明具有的有益效果为:
①、提出了一种基于LGN经典感受野分频视觉机制的轮廓特征提取新方法。通过对视网膜和LGN细胞的频率响应特性建模,引入高斯函数模拟LGN经典感受野所具有的频域响应特性,实现初级主体轮廓的提取。
②、提出了一种基于LGN非经典感受野响应的侧抑制机制。针对空间频率、朝向调谐以及对比度对LGN经典感受野存在全局性抑制作用,构建多特征信息引导的外周抑制方法,实现背景信息的选择性抑制。
③、提出了一种V1区分频多通道视觉信息流的融合模型。改变了传统方法仅考虑串行的电生理特性,在初级视皮层内针对多个特定LGN细胞的输入信息,进行分频多通道并行处理以及关联性传递,可以有效的保留轮廓信息,得到最终轮廓响应。
附图说明
图1为本发明的图像轮廓检测流程图。
具体实施方式
为了使本发明的目的、技术方案和有益效果更加清楚,下面结合图1对本发明进行说明:
其中
利用高斯函数的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同。表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
式(3)中默认γ=0.5,*表示卷积运算。
针对步骤1所获得的激励响应在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取的最大值,从而获得初级轮廓响应E(x,y,σj),如式(4)所示。同时记录各尺度参数σj情况下最大值所对应的朝向角,记为θCRF(j)。
其中max表示取最大值函数,下同。
步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下最大值所对应的朝向角为θNCRF(j)。定义第j条空间频率调谐通道上LGN非经典感受野中心-外周的抑制强度如式(7)所示。
式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算。
首先分别计算朝向差异△θCRF-NCRF(j),如式(8)所示。
再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示。
其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同。
步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y)。
首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示。
然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示。
接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示。
其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示。
步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示。
再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示。
rj(x,y)=max(E(x,y;σj)-α·E_Inhj(x,y),0) (18)
式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3。
步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示。
其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置。
Claims (1)
1.一种基于分频视觉机制的轮廓特征提取方法,其特征在于,该方法具体包括以下步骤:
其中
利用高斯函数的尺度参数σj作为LGN经典感受野对视觉信息流的分频特性参数,从而获得f个空间频率调谐通道,默认f=3,σ1=1,σ2=2,σ3=4,下同;表示朝向角,上标j表示空间频率调谐通道的序号,j=1,2,…,f,下同;下标i表示朝向角的序号,i=1,2,…,Nθ,下同,Nθ默认设置为8;空间大小比率γ决定了LGN经典感受野的椭圆率;
式(3)中默认γ=0.5,*表示卷积运算;
针对步骤1所获得的激励响应在固定某个尺度参数σj情况下,使遍历Nθ个不同朝向角,采用最大值策略,选取的最大值,从而获得初级轮廓响应E(x,y,σj),如式(4)所示;同时记录各尺度参数σj情况下最大值所对应的朝向角,记为θCRF(j);
其中max表示取最大值函数,下同;
步骤3:采用如式(5)和(6)所示的双高斯差函数模拟LGN非经典感受野响应特性同时记录各尺度参数σj情况下最大值所对应的朝向角为θNCRF(j);定义第j条空间频率调谐通道上LGN非经典感受野中心-外周的抑制强度如式(7)所示;
式(6)中默认γ=1;ρ表示LGN非经典感受野外周与中心的半径比值,根据电生理实验发现非经典感受野的直径一般为经典感受野的2~5倍,默认ρ=4;式(7)中|| ||表示范数运算;
首先分别计算朝向差异△θCRF-NCRF(j),如式(8)所示;
再经幂指数归一化,得到朝向调制权重W1(j),如式(9)所示;
其中,δ表示抑制强度随视觉特征差异增大而衰减的调节参数,默认δ=0.2,下同;
步骤5:对LGN非经典感受野局部窗口内的输入图像对比度进行修正,得到低对比度加强后的Cc(x,y);
首先定义窗长为υ的LGN非经典感受野局部窗口Wxy,下标xy表示窗口的中心坐标为(x,y),υ通常设定为3~11之间的奇数;w(xi,yi)表示Wxy的空间权重函数,如式(11)所示;
然后对输入图像I(x,y)进行空间权重函数w(xi,yi)的加权计算,得到亮度L(x,y),如式(12)所示;
接着计算局部窗口Wxy内的输入图像对比度C(x,y),如式(13)所示;
其中,Lmax、Lmin分别表示局部窗口Wxy内,亮度L(x,y)的最大值和最小值;
最后采取阈值修正法,计算低对比度加强后的Cc(x,y),如式(14)所示;
步骤6:基于步骤2获得的初级轮廓响应E(x,y,σj),以及步骤3获得的LGN非经典感受野响应特性将两者融合后,按步骤5所获得的Cc(x,y)进行加权处理,得到低对比度差异指标△C(x,y,j),如式(15)所示;
再经幂指数归一化,得到低对比度调制权重W2(x,y,j),如式(16)所示;
rj(x,y)=max(E(x,y;σj)-α·E_Inhj(x,y),0) (18)
式中,α表示经典感受野与非经典感受野的神经元间连接强度,默认α=3;
步骤8:实现初级视皮层分频视觉信息流的快速融合编码,将步骤7获得的rj(x,y),并行传递至初级视皮层区进行权重融合加工处理,最终得到轮廓响应Total_r(x,y),如式(21)所示;
其中,βj为第f条空间频率调谐通道上轮廓响应的频段融合权重,取值范围为[0,1],通常可按式(22)进行设置;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010049312.7A CN111222518B (zh) | 2020-01-16 | 2020-01-16 | 一种基于分频视觉机制的轮廓特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010049312.7A CN111222518B (zh) | 2020-01-16 | 2020-01-16 | 一种基于分频视觉机制的轮廓特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222518A true CN111222518A (zh) | 2020-06-02 |
CN111222518B CN111222518B (zh) | 2023-02-03 |
Family
ID=70806743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010049312.7A Active CN111222518B (zh) | 2020-01-16 | 2020-01-16 | 一种基于分频视觉机制的轮廓特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222518B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613427A (zh) * | 2020-12-28 | 2021-04-06 | 杭州电子科技大学 | 基于视觉信息流分区投射编码模型的道路障碍物检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1987003398A1 (en) * | 1985-11-27 | 1987-06-04 | The Trustees Of Boston University | Neural networks for machine vision |
US20130011029A1 (en) * | 2010-01-11 | 2013-01-10 | Ramot At Tel-Aviv University Ltd. | Method and system for detecting contours in an image |
CN106228547A (zh) * | 2016-07-15 | 2016-12-14 | 华中科技大学 | 一种基于视觉颜色理论和同质抑制的轮廓与边界检测算法 |
-
2020
- 2020-01-16 CN CN202010049312.7A patent/CN111222518B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1987003398A1 (en) * | 1985-11-27 | 1987-06-04 | The Trustees Of Boston University | Neural networks for machine vision |
US20130011029A1 (en) * | 2010-01-11 | 2013-01-10 | Ramot At Tel-Aviv University Ltd. | Method and system for detecting contours in an image |
CN106228547A (zh) * | 2016-07-15 | 2016-12-14 | 华中科技大学 | 一种基于视觉颜色理论和同质抑制的轮廓与边界检测算法 |
Non-Patent Citations (3)
Title |
---|
MINGMING TAN ET AL.: "Image-Dehazing Method Based on the Fusion Coding of Contours and Colors", 《IEEE ACCESS》 * |
郎波等: "利用多层视觉网络模型进行图像局部特征表征的方法", 《计算机辅助设计与图形学学报》 * |
郭金朋等: "引入视通路视觉响应与融合模型的轮廓检测", 《中国图象图形学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613427A (zh) * | 2020-12-28 | 2021-04-06 | 杭州电子科技大学 | 基于视觉信息流分区投射编码模型的道路障碍物检测方法 |
CN112613427B (zh) * | 2020-12-28 | 2024-02-27 | 杭州电子科技大学 | 基于视觉信息流分区投射编码模型的道路障碍物检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111222518B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110399857B (zh) | 一种基于图卷积神经网络的脑电情感识别方法 | |
CN111127447B (zh) | 基于生成式对抗网络的血管分割网络及方法 | |
CN104408440B (zh) | 一种基于两步降维和并行特征融合的人脸表情识别方法 | |
CN113313657B (zh) | 一种用于低光照图像增强的非监督学习方法和系统 | |
CN107844755A (zh) | 一种结合dae和cnn的脑电信号特征提取与分类方法 | |
Zhou et al. | A refined equilibrium generative adversarial network for retinal vessel segmentation | |
CN107273845A (zh) | 一种基于置信区域和多特征加权融合的人脸表情识别方法 | |
CN113837974B (zh) | 一种基于改进beeps滤波算法的nsst域电力设备红外图像增强方法 | |
CN111091074A (zh) | 最优区域共空间模式的运动想象脑电信号分类方法 | |
Wang et al. | A 2D CNN-LSTM hybrid algorithm using time series segments of EEG data for motor imagery classification | |
CN116681679A (zh) | 基于双分支特征融合注意的医学图像小目标分割方法 | |
CN115439486A (zh) | 基于双重对抗网络的半监督器官组织图像分割方法及系统 | |
CN114708258B (zh) | 一种基于动态加权注意力机制的眼底图像检测方法及系统 | |
CN111222518B (zh) | 一种基于分频视觉机制的轮廓特征提取方法 | |
Guo et al. | Multifeature extracting CNN with concatenation for image denoising | |
Wang et al. | A gradient-based automatic optimization CNN framework for EEG state recognition | |
CN113269048B (zh) | 基于深度学习和混合噪声数据增强的运动想象脑电信号分类方法 | |
CN113762277B (zh) | 一种基于Cascade-GAN的多波段红外图像融合方法 | |
CN112712526B (zh) | 基于非对称卷积神经网络双通道的视网膜血管分割方法 | |
CN106504199A (zh) | 一种眼底图像增强方法及系统 | |
CN110619633A (zh) | 一种基于多路滤波策略的肝脏图像分割方法 | |
CN111127344A (zh) | 一种基于bp神经网络的自适应双边滤波的超声图像降噪的方法 | |
CN115797827A (zh) | 一种基于双流网络架构的ViT的人体行为识别方法 | |
Wang et al. | Improved brain–computer interface signal recognition algorithm based on few-channel motor imagery | |
CN114757967A (zh) | 基于手工特征融合的多尺度抗遮挡目标跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |