CN1881255A - 一种数字图像边缘信息提取方法 - Google Patents

一种数字图像边缘信息提取方法 Download PDF

Info

Publication number
CN1881255A
CN1881255A CN 200510077061 CN200510077061A CN1881255A CN 1881255 A CN1881255 A CN 1881255A CN 200510077061 CN200510077061 CN 200510077061 CN 200510077061 A CN200510077061 A CN 200510077061A CN 1881255 A CN1881255 A CN 1881255A
Authority
CN
China
Prior art keywords
image
pixel
space complexity
brightness
gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510077061
Other languages
English (en)
Other versions
CN100458847C (zh
Inventor
罗忠
杨付正
万帅
常义林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2005100770619A priority Critical patent/CN100458847C/zh
Publication of CN1881255A publication Critical patent/CN1881255A/zh
Application granted granted Critical
Publication of CN100458847C publication Critical patent/CN100458847C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种数字图像边缘信息提取方法,其核心为:确定数字图像的梯度图像,根据人类视觉感知特性对所述梯度图像进行掩盖处理,根据经所述掩盖处理后的梯度图像提取数字图像的边缘信息。本发明能够使数字图像的边缘提取结果和人类对于图像观察、理解中的边缘情况高度一致,使数字图像的边缘提取效果更符合人类的视觉感知特性,进而使本发明的边缘提取结果在后续应用中、尤其是在和人类视觉感知特性密切相关的后续应用中达到好的视觉效果;从而实现了提高视频通信中数字图像质量的目的。

Description

一种数字图像边缘信息提取方法
技术领域
本发明涉及视频技术领域,具体涉及一种数字图像边缘信息提取方法。
背景技术
最新的视觉心理学研究表明,人类对于图像的观察和理解,主要集中在整个图像信息的一小部分关键信息中,通过把握这些关键信息,就能够很好地理解图像。
由于边缘是图像最基本的特征之一,边缘包含了用于识别的图像信息,是人们描述、识别目标以及解释图像的重要特征参数,边缘广泛存在于图像中的物体与背景之间、物体与物体之间,HVS(Human Visual System人类的视觉系统)对于视频图像中的边缘信息最为敏感,所以,图像的边缘信息是上述关键信息中的一个非常重要的信息。
目前,多媒体视频通信在很多方面都涉及到视频序列中各帧数字图像的边缘信息提取和基于边缘信息的处理,如在图像编码前的处理过程和解码后的处理过程中采用边缘增强(edge enhancement)技术,通过在压缩编码时,对边缘多的地方多分配比特,而对边缘少的地方少分配比特,来提高视频数字图像的质量;如在基于目标(Object-based或者shape-based)图像/视频的压缩编码中,准确提取边缘信息是正确把目标从背景中分割出来的基本前提;再如在新兴的一类视频质量评估方法中,采用基于边缘信息的评估方法,来对比原始图像和压缩/传输后有损(impaired)图像之间的质量相关性,从而确定有损图像的质量。
由此可以说,数字图像边缘信息的提取(edge extraction),即边缘检测(edgedetection)是多媒体视频通信中的一项基础性技术,提高该技术的性能,将对于视频通信中的整体性能有所提高。
目前的边缘信息提取方法依赖于边缘提取算子(operator)。一般来说,边缘提取算子都是线性算子,即通过对数字图像进行线性离散卷积运算(lineardiscrete convolution)来获得原来数字图像的梯度图像,然后通过门限判别等方法,确定图像的边缘信息。
现有的基于边缘提取算子的边缘信息提取方法主要包括两种:基于经典算子的边缘信息提取方法和基于最优边缘提取算子的边缘信息提取方法。
被广泛使用的、基于经典算子的边缘信息提取方法的实现原理为:首先,计算图像的梯度,然后,根据各像素梯度值的大小确定图像的边缘信息。
其实,严格地说,梯度是对于连续图像存在的概念,因为根据多元函数的微积分理论,连续图像作为空间坐标(x,y)的二元函数f(x,y),其梯度是由图像灰度f(x,y)相对于x,y的一阶偏导数来定义的。对于离散图像,因为离散图像不存在偏导数,所以,梯度是一个近似概念,可以采用离散差分(discrete difference)来近似代替偏导数的方法来定义离散图像的“梯度”。数字图像是离散图像的特殊情况,数字图像不但其空间坐标离散成整数i,j,而且图像灰度f(x,y)也只能取离散的数值,因此,数字图像也适合用离散差分来求取其“梯度”。
在实际的应用中,像素的梯度值常用小区域算子如卷积模板与图像卷积来近似计算,不同的算子形成了多种经典的边缘检测算子,即梯度算子。经典的梯度算子包括:Sobel算子、Kirsch算子、Prewitt算子、Roberts算子、Laplacian算子、点算子、线算子等。
离散图像的像素坐标一般用整数i,j来表示,像素(i,j)处图像灰度f(i,j)的梯度
Figure A20051007706100081
为:
g → ( i , j ) = [ g x ( i , j ) , g y ( i , j ) ] T - - - ( 1 )
其中:分量gx(i,j),gy(i,j)分别表示像素f(i,j)在x方向和y方向上的离散差分。
不同的经典梯度算子的区别在于gx(i,j),gy(i,j)的具体形式不同。
下面以最常用的Sobel算子为例对基于经典算子的边缘信息提取方法进行详细描述。
在本方法中,首先应通过公式(2)获得gx(i,j),gy(i,j):
gx(i,j)=(f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1))
        -(f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1))
gy(i,j)=(f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1))                  (2)
        -(f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1))
由此可知,计算gx(i,j),gy(i,j)的梯度算子分别是:
G x = - 1 0 1 - 2 0 2 - 1 0 1 - - - ( 3 )
G y = 1 2 1 0 0 0 - 1 - 2 - 1
然后,用Gx,Gy分别和原始图像f(i,j)进行离散卷集,得到梯度图像。
在得到梯度图像后,可使用一个门限来判断梯度图像中的每一个像素灰度和这个门限之间的大小关系,如果像素的灰度
Figure A20051007706100095
高于门限值,则确定该像素为边缘像素,否则为非边缘像素。
其它经典算子和Sobel算子的边缘信息提取方法基本相同,其区别仅在于Gx,Gy矩阵不同。
在基于经典算子的边缘信息提取方法中,特定的算子只能检测出特定方向的边缘信息,并且对噪声比较敏感,因此,在对图像进行实际处理时,如果事先不知道图像的边缘分布方向,那么,在算子选择不合适时,边缘信息的提取效果就会比较差,从而使数字图像的质量差。而且,由于图像的各个部分的情况相差很大,通常无法统一地用一种门限来判断边缘信息,因此,依靠单一门限来判断某点是否为边缘点的方法,在实际应用中是非常有局限性的。另外,基于经典算子的边缘信息提取方法的结果在后续应用中,尤其是在和人类感知密切相关的后续应用中,视觉效果将会比较差。
最优边缘提取算子是基于某种最优准则(Optimal Criteria)设计出来的最优算子,Canny算子是其中非常有代表性的一种算法。下面以Canny算子为例对基于最优边缘提取算子的边缘信息提取方法进行详细描述。
相对于经典算子来说,Canny边缘检测算子具有更好的边缘检测性能。根据边缘检测的有效性和定位的可靠性,Canny算子所基于的三个最优准则是:
1、好的信噪比,即漏检边缘点和将非边缘点判为边缘点的概率要低。
2、好的定位,即检测出的边缘点要尽可能接近实际边缘的中心位置。
3、对单个边缘的唯一响应,即单个边缘产生多个响应的概率要低,并且虚假边缘响应要得到最大抑制。
基于Canny算子的边缘信息提取方法的具体步骤为:
步骤1、用二维高斯滤波器对图像进行平滑滤波,以降低噪声的影响,具体为:
H(i,i)=f(x,y)*G(i,j)                                     (4)
其中:f(i,j)为原始图像,H(i,j)为滤波后的图像,G(i,j)为高斯滤波器。
G(i,j)由对于连续高斯滤波器的冲激响应函数(Impulse response function)的离散化得到。该冲激响应函数如公式(5)所示:
G ( x , y ) = 1 2 π σ 2 exp ( - x 2 + y 2 2 σ 2 ) - - - ( 5 )
G(i,j)作为一个离散卷积算子,根据需要可以离散化成为3×3,5×5,7×7或者更大的矩阵,这里给出常用的5×5矩阵,如附图1所示。
步骤2、计算图像的梯度,得到梯度图像
Figure A20051007706100102
其中: g → ( i , j ) = [ g x ( i , j ) , g y ( i , j ) ] T ,
而且,
g x ( i , j ) ≈ ∂ f ( x , y ) ∂ x | y = jΔ x = iΔ = f ( i + 1 , j ) - f ( i - 1 , j ) - - - ( 6 )
g y ( i , j ) ≈ ∂ f ( x , y ) ∂ y | y = jΔ x = iΔ = f ( i , j + 1 ) - f ( i , j - 1 ) - - - ( 7 )
其中:Δ为连续图像离散化的采样间隔(sampling interval)。
根据公式(8)计算梯度图像的模(magnitude):
| g → ( i , j ) | = ( g x ( i , j ) ) 2 + ( g y ( i , j ) ) 2 - - - ( 8 )
根据公式(9)计算梯度图像的方向,即与水平方向的夹角。
步骤3、设定门限,依据图像的梯度值确定图像的边缘点。Canny算法设定高低两个门限,将图像的梯度值大于高门限的点确定为边缘点,舍弃图像中梯度值小于低门限的点,如果图像中梯度值在两个门限之间的像素点与其它边缘点连通,如按照8连通定义,即如果与该像素相邻的8个像素中存在边缘像素,则判定其为边缘点,否则舍弃。
相对于基于经典算子的边缘提取方法,基于最优边缘提取算子的边缘信息提取方法所依据的三个最优准则都是依据信号处理的思想建立的,虽然在边缘信息提取性能上有所改进,但是,该方法仍然采用的是梯度-门限的思想,因此,基于经典算子的边缘提取方法中存在的问题,本方法也都存在。
近年来,随着小波(wavelet)技术和模糊数学的发展,还发展出一种将小波变换用于信号奇异点检测的边缘信息提取方法以及基于模糊集合(fuzzy set)理论的边缘信息提取方法,还有基于数学形态学如非线性滤波等方法的边缘信息提取方法。这些方法,虽然相对于经典算子类的方法在某些方面有一定的改进,但是其存在的最大问题仍然是该方法的结果在后续应用中,尤其在和人类感知密切相关的后续应用中,视觉效果比较差。
发明内容
本发明的目的在于,提供一种数字图像边缘提取的方法,通过将视觉感知特性融入边缘提取过程,使本发明的边缘提取结果在后续应用中、尤其是在和人类感知特性密切相关的后续应用中时,达到好的视觉效果,从而,提高了视频通信中数字图像质量。
为达到上述目的,本发明提供的一种数字图像边缘提取的方法,包括:
a、确定数字图像的梯度图像;
b、根据人类视觉感知特性对所述梯度图像进行掩盖处理;
c、根据经所述掩盖处理后的梯度图像提取数字图像的边缘信息。
所述步骤a具体包括:
采用边缘提取算子确定数字图像的梯度图像。
所述步骤b中的人类视觉感知特性为:亮度掩盖效应和/或空间复杂度掩盖效应。
所述步骤b中的人类视觉感知特性为:亮度掩盖效应;
且所述步骤b具体包括:
根据亮度掩盖效应对所述梯度图像进行亮度掩盖处理后的梯度图像为:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + h ( b ( i , j ) , b 0 ) ;
其中:
Figure A20051007706100122
为亮度掩盖处理后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,h(b(i,j),b0)为亮度掩盖函数,且h(b(i,j),b0)满足如下条件:
如果b(i,j)=b0,则h(b(i,j),b0)=0,否则,h(b(i,j),b0)>0;同时,h(b(i,j),b0)是|b(i,j)-b0|的单调递增函数。
所述步骤b中的人类视觉感知特性为:亮度掩盖效应;
且所述步骤b具体包括:
根据亮度掩盖效应对所述梯度图像进行亮度掩盖处理后的梯度图像为:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + ( | b ( i , j ) - b 0 | b 0 ) γ 1 ;
其中:
Figure A20051007706100132
为亮度掩盖处理后像素点(i,j)的梯度值,
Figure A20051007706100133
为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,γ1为正数。
所述步骤b中的人类视觉感知特性为:亮度掩盖效应和空间复杂度掩盖效应;
且所述步骤b公式中的
Figure A20051007706100134
替换为:对所述步骤a中的梯度图象进行空间复杂度掩盖后像素点(i,j)的梯度值
Figure A20051007706100135
所述步骤b中的人类视觉感知特性为:空间复杂度掩盖效应;
且所述步骤b具体包括:
根据空间复杂度掩盖效应对所述梯度图像进行空间复杂度掩盖处理后的梯度图像为:
| g → m ( i , j ) | = g → ( i , j ) k ( m ( i , j ) m 0 ) ;
其中:
Figure A20051007706100137
为空间复杂度掩盖后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度,m0为原始图像的整帧图像的平均空间复杂度, 为空间复杂度掩盖函数,且该函数满足如下条件:
k(0)>0,且
Figure A20051007706100142
的递增函数。
所述步骤b中的人类视觉感知特性为:空间复杂度掩盖效应;
且所述步骤b具体包括:
根据空间复杂度掩盖效应对所述梯度图像进行空间复杂度掩盖处理后的梯度图像为:
| g → m ( i , j ) | = | g → ( i , j ) | a 0 + ( m ( i , j ) m 0 ) γ 2 ;
其中: 为经过亮度掩盖处理和空间复杂度掩盖处理后的梯度图像中像素点(i,j)的梯度值,
Figure A20051007706100145
为原始图像中像素点(i,j)的梯度值,m0为原始图像的整帧图像的平均空间复杂度,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度,γ2为正数。
所述步骤b中的人类视觉感知特性为:亮度掩盖效应和空间复杂度掩盖效应;
且所述步骤b中的 替换为:对所述步骤a中的梯度图象进行亮度掩盖处理后像素点(i,j)的梯度值
Figure A20051007706100147
所述步骤b中原始图像中像素点(i,j)所在的局部区域的空间复杂度m(i,j)的获取方法具体包括:
b1’、在原始图像的像素点(i,j)所在的局部区域中根据梯度方向和预定梯度模值确定像素点(i,j)所在边缘的两个边沿;
b2’、根据所述两个边沿将所述局部区域划分为一个边缘区域和两个非边缘区域R1、R2;
b3’、确定所述两个非边缘区域R1、R2的空间复杂度m1(i,j)和m2(i,j);
b4’、将所述两个非边缘区域的空间复杂度m1(i,j)和m2(i,j)的平均值确定为像素点(i,j)所在的局部区域的空间复杂度m(i,j)。
所述步骤b3’具体包括:
所述非边缘区域的空间复杂度mp(i,j)为:
m p ( i , j ) = ( 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | k ) 1 k ( p = 1,2 ) ;
其中:M为Rp内像素点的个数, 为Rp区域的亮度平均值。
所述步骤b3’具体包括:
所述非边缘区域的空间复杂度mp(i,j)为:
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | ( p = 1,2 ) ;
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p ( f ( s , t ) - f p ‾ ) 2 ( p = 1,2 ) ;
m p ( i , j ) = max ( s , t ) ∈ R | f ( s , t ) - f p ‾ | ( p = 1,2 ) ;
其中:M为Rp(p=1,2)内像素点的个数,
Figure A20051007706100156
为Rp区域的亮度平均值。
所述步骤c具体包括:
根据所述掩盖处理后的梯度图像、边缘提取算子确定所述数字图像的边缘信息。
所述边缘提取算子为:经典提取算子或基于最优边缘提取算子。
通过上述技术方案的描述可知,本发明通过在数字图像边缘提取过程中引入视觉感知特性,使数字图像的边缘提取结果和人类对于图像观察、理解中的边缘情况高度一致,从本发明的数字图像边缘提取效果更符合人类的视觉感知特性方面来说,本发明提高了边缘提取结果的准确性,进而使本发明的边缘提取结果在后续应用中、尤其是在和人类感知特性密切相关的后续应用中,能够达到好的视觉效果;本发明能够结合目前广泛应用的梯度-门限类等的各种方法,实现灵活;从而通过本发明提供的技术方案实现了提高视频通信中数字图像质量的目的。
附图说明
图1是5×5的离散二维高斯滤波器的冲激响应函数矩阵示意图;
图2是本发明的亮度掩盖示意图;
图3是本发明的复杂度掩盖示意图;
图4中的(a)为原始图像一;
图4中的(b)为基于Sobel算子的边缘信息提取的边缘图像示意图;
图4中的(c)为本发明结合Sobel算子的边缘信息提取的边缘图像示意图;
图5中的(a)为原始图像二;
图5中的(b)为基于Canny算子的边缘信息提取的边缘图像示意图;
图5中的(c)为本发明结合Canny算子的边缘信息提取的边缘图像示意图。
具体实施方式
由于数字图像边缘提取后的结果在后续应用中,和人类的视觉感知特性有非常密切的关系,所以,如果在数字图像边缘提取方法中充分考虑人类的感知特性,就能够使边缘提取结果在后续应用中,尤其是和人类视觉感知密切相关的后续应用中,极大程度的改善视频数字图像的视觉效果。
因此,本发明的核心是:确定数字图像的梯度图像,根据视觉感知特性对所述数字图像的梯度图像进行掩盖处理,根据所述掩盖处理后的梯度图像提取所述数字图像的边缘信息。
下面基于本发明的核心思想对本发明提供的技术方案做进一步的描述。
人类视觉对激励的反应主要依赖于相对光强,即对比度,而不是依赖于绝对的亮度信息。在视觉可感知的光强范围内,视觉对图像中亮度变化的感知能力与背景亮度成一种非线性的反比关系,这种视觉感知特性称为亮度掩盖效应。
数字图像的边缘的可见性不仅受区域平均亮度的影响,而且还与其所在区域的空间纹理复杂度有关,即对于边缘两侧较平滑的区域,边缘的视觉可见性强,反之,边缘两侧图像区域比较复杂,细节较多,则边缘的视觉可见性差。这种视觉感知特性称为空间复杂度掩盖效应。
本发明针对数字图像边缘提取的特点和需要,充分结合视觉感知特性中的亮度掩盖效应和空间复杂度掩盖效应,对梯度图像做掩盖处理,即对视频数字图像的梯度值进行亮度掩盖和空间复杂度掩盖,使亮度掩盖效应、复杂度掩盖效应在边缘信息提取过程中发挥重要的作用。从而,使本发明的边缘信息提取结果和人类对图像的视觉理解具有较高的一致性,使边缘信息提取准确性好。
本发明提供的技术方案能够结合目前广泛使用的梯度-门限类的各种方法,即本发明能够在常规的梯度-门限边缘提取类方法中,融合亮度掩盖处理和空间复杂度掩盖处理环节,使本发明的实现形式多种多样,应用范围广泛。
本发明的实现原理主要包括如下四个步骤:
步骤1、首先,按照目前某种常规的基于梯度-门限思想的边缘提取算法得到原始图像f(i,j)的梯度图像
Figure A20051007706100171
上述常规的基于梯度-门限思想的边缘提取算法可以为任何基于经典算子的边缘提取算法或者基于最优算子的边缘提取算法,也可以为任何中间结果包括梯度图像的边缘提取算法。
步骤2、根据人类视觉感知特性对步骤1中得到的梯度图像 进行亮度掩盖处理。
步骤3、根据人类视觉感知特性对步骤2中得到的亮度掩盖处理后的梯度图像进行空间复杂度掩盖处理。
步骤4、对步骤3中得到的经过空间复杂度掩盖处理后的梯度图像,根据步骤1中选择的边缘提取算法的边缘定位规则确定图像边缘。即如果在步骤1中选择的是基于经典算子的边缘提取算法,则需要根据全局统一门限来判断图像边缘;如果在步骤1中选择的是基于Canny算子的边缘提取算法,则需要根据Canny算子的思想,采用高低两个门限来判断图像边缘;同样,如果在步骤1中选择的是其他边缘提取算法,则需要结合该边缘提取算法的技术方案来判断图像的边缘。
当然,在上述实现原理中,可以没有步骤3,即仅对步骤1中的梯度图像进行亮度掩盖处理,这样,在步骤4中,对步骤2中得到的经过亮度掩盖处理后的梯度图像,根据步骤1中选择的边缘提取算法的边缘定位规则确定图像边缘;同样,上述实现原理中,也可以没有步骤2,即仅对步骤1中的梯度图像进行空间复杂度掩盖处理;另外,步骤3和步骤2的顺序也可以调换一下,即先对步骤1中的梯度图像进行空间复杂度掩盖处理,然后,再对经过空间复杂度掩盖处理后的梯度图像进行亮度掩盖处理,这样,在步骤4中,对先经过空间复杂度掩盖处理、后经过亮度掩盖处理的梯度图像,根据步骤1中选择的边缘提取算法的边缘定位规则确定图像边缘。
下面对本发明首先对原始图像f(i,j)的梯度图像 进行亮度掩盖处理,然后,再对亮度掩盖处理后的梯度图像进行空间复杂度掩盖处理的方法进行详细描述。
结合视觉系统对背景亮度的自适应能力,本发明对基于目前预定边缘提取算法获得的梯度图像进行亮度掩盖处理后的梯度图像中各像素(i,j)的梯度值可通过公式(10)获得:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + h ( b ( i , j ) , b 0 ) ; - - - ( 10 )
其中: 为亮度掩盖处理后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,h(b(i,j),b0)为亮度掩盖函数,且h(b(i,j),b0)满足如下条件:
函数h(b(i,j),b0)是一个关于|b(i,j)-b0|的递增函数,且:
h(b(i,j),b0)=0当b(i,j)=b0
h(b(i,j),b0)>0在其他任何情况。                   (11)
公式(10)的一个具体的实施例如公式(12)所示:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + ( | b ( i , j ) - b 0 | b 0 ) γ 1 - - - ( 12 )
其中: 为亮度掩盖处理后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,γ1为正数。
像素点(i,j)所在的局部区域如附图2所示。图2为以像素(i,j)为中心,大小为N×N的区域,其中,N为奇数。
图2中像素(i,j)所在区域的平均亮度b(i,j)可通过公式(13)获得:
b ( i , j ) = 1 N 2 Σ ( p , q ) ∈ B f ( p , q ) - - - ( 13 )
其中:p,q为N×N区域中的像素值。
当本发明的技术方案为先进行空间复杂度掩盖处理,再进行亮度掩盖处理时,上述公式(10)和公式(12)中的
Figure A20051007706100195
应替换为 即对原始图像f(i,j)的基于预定算子的梯度图像进行空间复杂度掩盖后像素点(i,j)的梯度值
Figure A20051007706100197
此时,公式(10)可变换为: | g → b ( i , j ) | = | g → m ( i , j ) | 1 + h ( b ( i , j ) , b 0 ) ; 公式(12)可变换为: | g → b ( i , j ) | = | g → m ( i , j ) | 1 + ( b ( i , j ) - b 0 b 0 ) γ 1 .
本发明在进行亮度掩盖处理后,还需要对亮度掩盖处理后的梯度图像进行空间复杂度掩盖处理。
本发明对亮度掩盖处理后的梯度图像进行空间复杂度掩盖处理后的梯度图像中各像素(i,j)的梯度值可通过公式(14)获得:
| g → m ( i , j ) | = | g → b ( i , j ) | k ( m ( i , j ) m 0 ) - - - ( 14 )
其中: 为经过亮度掩盖后像素点(i,j)的梯度值,m0为原始图像的整帧图像的平均空间复杂度,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度, 为空间复杂度掩盖函数,且该函数应该满足如下条件:
k(0)>0                                          (15)
的递增函数。
公式(14)的一个具体的实施例如公式(16)所示:
| g → m ( i , j ) | = | g → b ( i , j ) | a 0 + ( m ( i , j ) m 0 ) γ 2 - - - ( 16 )
其中:
Figure A20051007706100207
为经过亮度掩盖处理和空间复杂度掩盖处理后的梯度图像中像素点(i,j)的梯度值,
Figure A20051007706100208
为经过亮度掩盖后像素点(i,j)的梯度值,m0为原始图像的整帧图像的平均空间复杂度,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度,γ2为正数。
原始图像中像素点(i,j)所在的局部区域如附图3所示。图3为以像素(i,j)为中心,大小为N×N的区域,其中,N为奇数。
从图3中可以看出,以像素(i,j)为中心的N×N区域由三部分组成,即边缘、边缘两侧的子区域R1和R2。设定子区域R1和R2的空间复杂度分别为:m1(x,y)、m2(x,y),则图3中像素(i,j)所在的局部区域的空间复杂度m(i,j)可通过公式(17)获得:
m ( i , j ) = m 1 ( i , j ) + m 2 ( i , j ) 2 - - - ( 17 )
上述边缘两侧子区域的空间复杂度mi(i,j)可定义为该区域内原始图像灰度和该区域平均灰度的函数,其一般形式可通过公式(18)来体现:
m p ( i , j ) = ( 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | k ) 1 k ( p = 1,2 ) - - - ( 18 )
其中:M为Rp内像素点的个数, 为Rp区域的亮度平均值,f(s,t)为像素(s,t)处原始图像灰度。
获取边缘两侧子区域的空间复杂度mi(i,j)的三个具体的实施例如公式(19)、(20)、(21)所示:
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | ( p = 1,2 ) - - - ( 19 )
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p ( f ( s , t ) - f p ‾ ) 2 ( p = 1,2 ) - - - ( 20 )
m p ( i , j ) = max ( s , t ) ∈ R | f ( s , t ) - f p ‾ | ( p = 1,2 ) - - - ( 21 )
其中:M为Rp(p=1,2)内像素点的个数, 为Rp区域的亮度平均值。
确定边缘两侧子区域R1和R2的范围如下:
通常边缘有一定的宽度,因此,在进行空间复杂度掩盖之前,首先应该确定边缘的范围,即边缘的宽度,从而,也就确定了R1,R2的范围。
设定像素(i,j)距其所在边缘两边沿的距离分别为E1、E2,计算E1、E2的方法为:从像素(i,j)点出发,沿着梯度的方向搜索,当梯度的模值下降到λ·|gradb(i,j)|时,则认为到达了边缘的一个边沿,此时,就得到了E1;然后,从像素(i,j)点出发,沿着梯度的相反方向即与梯度成180°的方向搜索,当梯度值下降到λ·|gradb(i,j)|时,则认为到达了边缘的另一个边沿,此时,就得到了E2。E1和E2相加就确定了边缘的宽度。上述λ为水平控制因子。
因为N×N的区域是一个小范围邻域(neighbourhood),因此,可以粗略认为在该区域中,边缘的宽度是不变的。水平控制因子λ可以在具体的实现过程中进行调整,以达到更好的效果。
在本发明的技术方案为先进行空间复杂度掩盖处理,再进行亮度掩盖处理时,上述公式(14)和公式(16)中的
Figure A20051007706100221
替换为: 即先对原始图像f(i,j)的基于预定算子的梯度图像进行空间复杂度掩盖处理,此时,公式(14)可替换为: | g → m ( i , j ) | = | g → ( i , j ) | k ( m ( i , j ) m 0 ) γ 2 ; 公式(16)可替换为: | g → m ( i , j ) | = | g → ( i , j ) | a 0 + ( m ( i , j ) m 0 ) γ 2 .
通过上述技术方案的描述可知,本发明的边缘提取方法能够准确定位图象的边缘信息,这样,在视频通信过程中,通过对边缘信息进行增强处理,可以达到使图像的细节鲜明化,使得图像具有锐化(sharp)效果,从而,提高了视频通信产品的市场竞争力。
本发明还可以成为H.265等新兴视频编码技术和国际标准中,基于对象进行视频压缩编码前处理的基础技术。通过将本发明的技术方案应用于对象提取技术中,则能够提高国际标准在实际应用中的效果,从而,提高新兴视讯产品的竞争力。
采用本发明的边缘提取方法的具体实验效果如附图4和附图5所示。
图4中的(a)图为篮子的原始图像,图4中的(b)图为基于Sobel算子的边缘信息提取方法提取出的边缘图像,图4中的(c)为本发明结合Sobel算子的边缘信息提取方法提取出的边缘图像。
图5中的(a)图为篮子的原始图像,图5中的(b)图为基于Canny算子的边缘信息提取方法提取出的边缘图像,图5中的(c)图为本发明结合Canny算子的边缘信息提取方法提取出的边缘图像。
从图4和图5示出的实验结果可以看出,在现有技术处理结果中,有很多在人类理解中不应该是边缘的东西成了边缘,比如篮子周围的草地等,其实人类在观察该图像时关注的边缘应该是篮子上的纹理边缘,现有技术在进行边缘信息提取时漏掉了重要的边缘信息。本发明的处理结果中,更着重于篮子上的纹理边缘,不但准确的提取到大量的篮子上的纹理边缘信息,而且,大量减少了对图像中草地部分边缘信息的提取,从而,使提取到的边缘信息更加接近人类的视觉特性。
虽然通过实施例描绘了本发明,本领域普通技术人员知道,本发明有许多变形和变化而不脱离本发明的精神,本发明的申请文件的权利要求包括这些变形和变化。

Claims (14)

1、一种数字图像边缘信息提取方法,其特征在于,包括步骤:
a、确定数字图像的梯度图像;
b、根据人类视觉感知特性对所述梯度图像进行掩盖处理;
c、根据经所述掩盖处理后的梯度图像提取数字图像的边缘信息。
2、如权利要求1所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤a具体为:
采用边缘提取算子确定数字图像的梯度图像。
3、如权利要求1所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:亮度掩盖效应和/或空间复杂度掩盖效应。
4、如权利要求3所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:亮度掩盖效应;
且所述步骤b具体包括步骤:
根据亮度掩盖效应对所述梯度图像进行亮度掩盖处理后的梯度图像为:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + h ( b ( i , j ) , b 0 ) ;
其中: 为亮度掩盖处理后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,h(b(i,j),b0)为亮度掩盖函数,且h(b(i,j),b0)满足如下条件:
如果b(i,j)=b0,则h(b(i,j),b0)=0,否则,h(b(i,j),b0)>0;同时,h(b(i,j),b0)是|b(i,j)-b0|的单调递增函数。
5、如权利要求4所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:亮度掩盖效应;
且所述步骤b具体包括:
根据亮度掩盖效应对所述梯度图像进行亮度掩盖处理后的梯度图像为:
| g → b ( i , j ) | = | g → ( i , j ) | 1 + ( | b ( i , j ) - b 0 | b 0 ) γ 1 ;
其中: 为亮度掩盖处理后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,b(i,j)为原始图像中像素点(i,j)所在的局部区域的平均亮度,b0为原始图像的整帧图像的平均亮度,γ1为正数。
6、如权利要求4或5所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:亮度掩盖效应和空间复杂度掩盖效应;
且所述步骤b公式中的 替换为:对所述步骤a中的梯度图象进行空间复杂度掩盖后像素点(i,j)的梯度值
7、如权利要求3所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:空间复杂度掩盖效应;
且所述步骤b具体包括:
根据空间复杂度掩盖效应对所述梯度图像进行空间复杂度掩盖处理后的梯度图像为:
| g → m ( i , j ) | = g → ( i , j ) k ( m ( i , j ) m 0 ) ;
其中:
Figure A2005100770610003C7
为空间复杂度掩盖后像素点(i,j)的梯度值, 为原始图像中像素点(i,j)处图像灰度f(i,j)的梯度值,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度,m0为原始图像的整帧图像的平均空间复杂度, 为空间复杂度掩盖函数,且该函数满足如下条件:k(0)>0,且
Figure A2005100770610004C3
的递增函数。
8、如权利要求7所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:空间复杂度掩盖效应;
且所述步骤b具体包括:
根据空间复杂度掩盖效应对所述梯度图像进行空间复杂度掩盖处理后的梯度图像为:
| g → m ( i , j ) | = | g → ( i , j ) | a 0 + ( m ( i , j ) m 0 ) γ 2 ;
 其中: 为经过亮度掩盖处理和空间复杂度掩盖处理后的梯度图像中像素点(i,j)的梯度值,
Figure A2005100770610004C6
为原始图像中像素点(i,j)的梯度值,m0为原始图像的整帧图像的平均空间复杂度,m(i,j)为原始图像中像素点(i,j)所在的局部区域的空间复杂度,γ2为正数。
9、如权利要求7或8所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中的人类视觉感知特性为:亮度掩盖效应和空间复杂度掩盖效应;
且所述步骤b中的 替换为:对所述步骤a中的梯度图象进行亮度掩盖处理后像素点(i,j)的梯度值
Figure A2005100770610004C8
10、如权利要求7或8所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b中原始图像中像素点(i,j)所在的局部区域的空间复杂度m(i,j)的获取方法具体包括:
b1’、在原始图像的像素点(i,j)所在的局部区域中根据梯度方向和预定梯度模值确定像素点(i,j)所在边缘的两个边沿;
b2’、根据所述两个边沿将所述局部区域划分为一个边缘区域和两个非边缘区域R1、R2;
b3’、确定所述两个非边缘区域R1、R2的空间复杂度m1(i,j)和m2(i,j);
b4’、将所述两个非边缘区域的空间复杂度m1(i,j)和m2(i,j)的平均值确定为像素点(i,j)所在的局部区域的空间复杂度m(i,j)。
11、如权利要求10所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b3’具体包括:
所述非边缘区域的空间复杂度mp(i,j)为:
m p ( i , j ) = ( 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | k ) 1 k (p=1,2);
其中:M为Rp内像素点的个数,
Figure A2005100770610005C2
为Rp区域的亮度平均值。
12、如权利要求11所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤b3’具体包括:
所述非边缘区域的空间复杂度mp(i,j)为:
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p | f ( s , t ) - f p ‾ | (p=1,2);或
m p ( i , j ) = 1 M Σ ( s , t ) ∈ R p ( f ( s , t ) - f p ‾ ) 2 (p=1,2);或
m p ( i , j ) = max ( s , t ) ∈ R | f ( s , t ) - f p ‾ | (p=1,2);
其中:M为Rp(p=1,2)内像素点的个数, 为Rp区域的亮度平均值。
13、如权利要求3所述的一种数字图像边缘信息提取方法,其特征在于,所述步骤c具体为:
根据所述掩盖处理后的梯度图像、边缘提取算子确定所述数字图像的边缘信息。
14、如权利要求2或13所述的一种数字图像边缘信息提取方法,其特征在于,所述边缘提取算子为:经典提取算子或基于最优边缘提取算子。
CNB2005100770619A 2005-06-15 2005-06-15 一种数字图像边缘信息提取方法 Expired - Fee Related CN100458847C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100770619A CN100458847C (zh) 2005-06-15 2005-06-15 一种数字图像边缘信息提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100770619A CN100458847C (zh) 2005-06-15 2005-06-15 一种数字图像边缘信息提取方法

Publications (2)

Publication Number Publication Date
CN1881255A true CN1881255A (zh) 2006-12-20
CN100458847C CN100458847C (zh) 2009-02-04

Family

ID=37519450

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100770619A Expired - Fee Related CN100458847C (zh) 2005-06-15 2005-06-15 一种数字图像边缘信息提取方法

Country Status (1)

Country Link
CN (1) CN100458847C (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321289B (zh) * 2008-06-13 2010-10-20 北京大学 手机电视中视频图像的处理方法、系统及装置
CN102004919A (zh) * 2010-11-03 2011-04-06 天津工业大学 一种目标检测与定位方法
CN101640792B (zh) * 2008-08-01 2011-09-28 中国移动通信集团公司 卡通视频的压缩编解码方法、设备及系统
CN103035000A (zh) * 2012-12-06 2013-04-10 天津师范大学 一种基于cnn的彩色图像边缘提取方法
CN103279235A (zh) * 2013-05-28 2013-09-04 广州视睿电子科技有限公司 触摸点定位的方法和系统
CN103279234A (zh) * 2013-05-28 2013-09-04 广州视睿电子科技有限公司 触摸点定位的方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1372226A (zh) * 2001-02-21 2002-10-02 西北工业大学 一种检测图象边缘的独立边界自增强方法
JP2005100176A (ja) * 2003-09-25 2005-04-14 Sony Corp 画像処理装置およびその方法
CN1251145C (zh) * 2003-11-27 2006-04-12 上海交通大学 综合边缘和纹理信息的金字塔图像融合方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321289B (zh) * 2008-06-13 2010-10-20 北京大学 手机电视中视频图像的处理方法、系统及装置
CN101640792B (zh) * 2008-08-01 2011-09-28 中国移动通信集团公司 卡通视频的压缩编解码方法、设备及系统
CN102004919A (zh) * 2010-11-03 2011-04-06 天津工业大学 一种目标检测与定位方法
CN103035000A (zh) * 2012-12-06 2013-04-10 天津师范大学 一种基于cnn的彩色图像边缘提取方法
CN103279235A (zh) * 2013-05-28 2013-09-04 广州视睿电子科技有限公司 触摸点定位的方法和系统
CN103279234A (zh) * 2013-05-28 2013-09-04 广州视睿电子科技有限公司 触摸点定位的方法和系统
CN103279235B (zh) * 2013-05-28 2016-08-10 广州视睿电子科技有限公司 触摸点定位的方法和系统
CN103279234B (zh) * 2013-05-28 2016-12-28 广州视睿电子科技有限公司 触摸点定位的方法和系统

Also Published As

Publication number Publication date
CN100458847C (zh) 2009-02-04

Similar Documents

Publication Publication Date Title
CN100348046C (zh) 视频去块效应的方法和设备
CN100345160C (zh) 一种控制平均亮度的直方图均衡方法
CN1180627C (zh) 图像编码/解码方法,图像编码装置和图像解码装置
CN1870715A (zh) 手抖动校正装置
CN1311394C (zh) 用于二进制化图像的设备和方法
CN1917578A (zh) 数据处理设备、数据处理方法及程序
CN1252999C (zh) 用于隔行至渐进式变换的高级边缘自适应插值方法和系统
CN1881255A (zh) 一种数字图像边缘信息提取方法
CN1658227A (zh) 检测视频文本的方法和装置
CN1816149A (zh) 去除视频图像中块效应的滤波方法及环路滤波器
CN1599913A (zh) 虹膜识别系统和方法以及具有其程序的存储介质
CN1735135A (zh) 分辨率转换设备和方法
CN1695164A (zh) 生成用于评估图像或视频质量的质量导向重要性图的方法
CN1818927A (zh) 指纹识别方法与系统
CN1774030A (zh) 图像噪声去除方法
CN1910613A (zh) 图像中的人物候选区域抽取方法及人物候选区域抽取系统、人物候选区域抽取程序、以及人物像的上下判定方法、上下判定系统、上下判定程序
CN1542693A (zh) 图像处理方法、图像处理装置及图像处理程序
CN1708108A (zh) 用于消除齿状不自然的装置和方法
CN1857008A (zh) 图像处理方法
CN1477852A (zh) 图像处理设备、图像处理方法以及图像处理程序的存储介质
CN1308891C (zh) 用于图象处理中边缘增强的装置和方法
CN1812481A (zh) 图像处理装置及其方法
CN1288916C (zh) 图像死点和噪声的消除方法
CN1806449A (zh) 图像处理设备、图像处理方法和计算机程序
CN1757046A (zh) 图像处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090204

Termination date: 20160615

CF01 Termination of patent right due to non-payment of annual fee