CN104143198A - 一种图像描述方法和装置 - Google Patents
一种图像描述方法和装置 Download PDFInfo
- Publication number
- CN104143198A CN104143198A CN201310166191.4A CN201310166191A CN104143198A CN 104143198 A CN104143198 A CN 104143198A CN 201310166191 A CN201310166191 A CN 201310166191A CN 104143198 A CN104143198 A CN 104143198A
- Authority
- CN
- China
- Prior art keywords
- pixel
- color space
- gradient
- image
- crucial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
Abstract
本发明实施例涉及数字图像处理领域,特别涉及一种图像描述方法和装置,用以减小针对内容相同但颜色变化较大的图像的描述的误差。本发明实施例提供的图像描述方法包括:将图像从蓝绿红BGR颜色空间转换到高斯颜色空间,并将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。本发明实施例实现了减小针对内容相同但颜色变化较大的图像的描述的误差。
Description
技术领域
本发明涉及数字图像处理领域,特别涉及一种图像描述方法和装置。
背景技术
图像特征描述方法在图像检索、图像拼接、目标检测与识别、机器人场景定位和视频内容分析的领域均有广阔的应用,由于局部图像特征描述方法对复杂背景和存在遮挡的环境较为鲁棒(robust),并且无需进行目标分割,因此在图像特征描述方法中优势较为明显。
目前,尺度不变特征转换SIFT依然是该领域内公认的鲁棒性较强的特征描述算法,在其基础上,许多改进算法也相继出现,如主成分分析PCA-SIFT,彩色CSIFT,梯度位置和方向直方图GLOH和快速尺度不变特征变换SURF的算法均取得了不错的效果,经过对以上算法研究侧重点的分析发现许多学者把研究的重点放在提高算法的鲁棒性方面,具体包括几何不变性、颜色不变性和仿射不变性。
然而,由于以上改进算法均是基于SIFT算法的,因此在对图像颜色变化敏感的图像进行描述时存在缺陷:因为基于SIFT算法的改进方法是基于灰度图像实现的,因而颜色信息并未充分考虑在内,对于有些不同的目标,其灰度图像的某些局部特征却是接近的,因此以SIFT为代表的方法容易错误匹配这些点。
综上所述,由于目前基于SIFT算法的图像特征描述方法是基于灰度图像实现的,而图像颜色的变化对图像灰度值影响较大,因而对内容相同但颜色变化较大的图像的描述存在较大的误差。
发明内容
本发明实施例提供的一种图像描述方法和装置,用以减小针对内容相同但颜色变化较大的图像的描述的误差。
本发明实施例提供的一种图像描述方法,包括:
将图像从蓝绿红BGR颜色空间转换到高斯颜色空间Gaussian derivativecolor model;
将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;
其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。
本发明实施例提供的一种图像描述装置,包括:
第一转换单元,用于将图像从蓝绿红BGR颜色空间转换到高斯颜色空间Gaussian derivative color model;
第二转换单元,用于将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;
其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。
在本发明实施例中,由于将图像从蓝绿红BGR颜色空间转换到高斯颜色空间,并将所述图像从所述高斯颜色空间转换到光反射不变颜色空间,从而减小针对内容相同但颜色变化较大的图像的描述的误差,进而能够实现精确描述图像。
附图说明
图1为本发明实施例图像描述方法流程示意图;
图2为本发明实施例图像描述详细方法流程示意图;
图3为本发明实施例确定关键像素点对应的每个像素点的梯度方向和梯度幅值的方法示意图;
图4为本发明实施例未划分关键像素点对应的梯度描述范围时每个像素点的梯度方向和梯度幅值的示意图;
图5为本发明实施例用直方图的形式表示特征向量;
图6为本发明实施例划分关键像素点对应的梯度描述范围时每个像素点的梯度方向和梯度幅值的示意图;
图7为本发明实施例图像描述装置的结构示意图。
具体实施方式
本发明实施例将图像从蓝绿红BGR颜色空间转换到高斯颜色空间,并将所述图像从所述高斯颜色空间转换到光反射不变颜色空间,从而减小针对内容相同但颜色变化较大的图像的描述的误差,提高图像描述精度。
下面结合说明书附图对本发明实施例作进一步详细描述。
如图1所示,本发明实施例图像描述方法包括下列步骤:
步骤101、将图像从BGR(蓝绿红)颜色空间转换到Gaussian derivative colormodel(高斯颜色空间);
步骤102、将图像从高斯颜色空间转换到光反射不变颜色空间。
较佳地,在步骤102中,将图像从高斯颜色空间转换到光反射不变颜色空间的处理包括:
对于图像上的每个像素点,根据像素点在高斯颜色空间的第一系数和第二系数,确定该像素点在光反射不变颜色空间对应的颜色通道。
较佳地,根据下列公式确定像素点在光反射不变颜色空间对应的颜色通道:
其中,H*是所述光反射不变颜色空间对应的颜色通道,α是一个根据实际需要设定的常量,E1为像素点在高斯颜色空间的第一系数,E2为像素点在高斯颜色空间的第二系数。
较佳地,H*具有与角度、物体表面的方向、光流方向、亮度以及菲涅耳Fresnel反射系数无关的光反射特性;将具有颜色不变性的光反射系数H*作为光反射不变颜色通道,克服了由于颜色变化引起的图像的错误匹配。
较佳地,α的取值在[255,1024]之间。
较佳地,α还可以用来防止在C++编程中出现内存溢出的情况。
较佳地,第一系数E1包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值;第二系数E2包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值。
具体实施中,根据图像上的每个像素点在光反射不变颜色空间对应的颜色通道,可以将图像从高斯颜色空间转换到光反射不变颜色空间,即,将在高斯颜色空间中的图像的每个像素点对应的三个颜色通道的值均替换为该像素点对应的H*,由于每个像素点替换后的颜色通道的数值相等,因此可以将三通道图像变换为单通道图像,此时的图像具有良好的光反射不变特性,图像所在的颜色空间称之为光反射不变颜色空间。
下面以第一系数E1为黄蓝通道的值,以及第二系数E2为红绿通道的值为例,对本发明实施例将图像从高斯颜色空间转换到光反射不变颜色空间的实施方式进行详细介绍。
步骤S1、确定图像上的每个像素点在高斯颜色空间的中心波长等于第一设定值以及尺度等于第二设定值时的黄蓝通道的值和红绿通道的值;
步骤S2、根据确定的图像上的每个像素点在高斯颜色空间的黄蓝通道的值和红绿通道的值,确定光反射不变颜色空间对应的颜色通道;
步骤S3、根据光反射不变颜色空间对应的颜色通道,将输入图像从高斯颜色空间转换到光反射不变颜色空间。
较佳地,步骤S1中的黄蓝通道的值可以根据公式二确定,步骤S1中的红绿通道的值可以根据公式三确定。
其中,Eλλ是像素点在高斯颜色空间的红绿通道的值,Eλ是像素点在高斯颜色空间的黄蓝通道的值,表示材料的发射率,λ表示波长,表示亮度变化的大小。
较佳地,上述公式二和公式三是由下列推导过程得到:
库贝尔卡-孟克Kubelka-Munk理论的光反射模型为:
E(λ,x,y)=e(λ,x,y)(1-ρf(x,y))R∞(λ,x,y)+e(λ,x,y)ρf(x,y)
其中,λ表示波长,(x,y)表示图像中像素点的位置,e(λ,x,y)表示点光谱,ρf(x,y)表示(x,y)处的Fresnel反射系数,R∞(λ,x,y)表示材料发射率;对于不光滑、模糊的表面,Fresnel反射系数的影响可以忽略,即ρf(x,y)≈0。从而光反射模型可以简化为:
E(λ,x,y)=e(λ,x,y)R∞(λ,x,y)
简化后的光反射模型对λ求偏微分,可以得到公式二和公式三。
在实施中,第一设定值和第二设定值可以根据需要进行设定。然后将设定后的第一设定值和第二设定值分别带入到公式二和公式三中就可以得到图像上的像素点在高斯颜色空间的中心波长等于第一设定值以及尺度等于第二设定值时的黄蓝通道的值和红绿通道的值。
较佳地,当中心波长λ0=520nm,尺度σλ=55nm时,像素点在高斯颜色空间的三个通道,亮度通道、黄蓝通道和红绿通道与颜色空间CIE1964XYZ基相类似,更接近于人类的视觉系统。
而且当在中心波长λ0=520nm,尺度σλ=55nm时,像素点在高斯颜色空间中黄蓝通道的值和红绿通道的值除了可以采用上述方式确定,还可以根据下列方式确定:
高斯颜色空间可以由BGR颜色空间经过两次可逆的线性变换得到,具体如下列三个公式所示:
较佳地,当中心波长λ0=520nm与尺度σλ=55nm时,可以确定近似表示Eλ,近似表示Eλλ,即是像素点在高斯颜色空间的红绿通道的值,是像素点在高斯颜色空间的黄蓝通道的值。
较佳地,步骤S2中,可以根据公式四确定光反射不变颜色空间对应的颜色通道:
其中,Eλλ是像素点在高斯颜色空间的红绿通道的值,Eλ是像素点在高斯颜色空间的黄蓝通道的值。
较佳地,在步骤102之后,还包括:
步骤Q1、对光反射不变颜色空间中的图像构建LOG(拉普拉斯高斯)金字塔,并将LOG金字塔转换成DOG(Difference of Gaussian,高斯差分)金字塔;
步骤Q2、根据DOG金字塔,确定多个局部极值,其中,每个局部极值包括:在尺度方向上的第一局部极值、在X方向上的第二局部极值和在Y方向上的第三局部极值;
步骤Q3、对于每个局部极值,根据该局部极值的第一局部极值、第二局部极值和第三局部极值,确定关键像素点。
较佳地,在对光反射不变颜色空间构建LOG金字塔之前还需要对图像进行处理得到构建LOG金字塔的初始图像。
下面以LOG金字塔每组(octv)5幅图像为例进行说明,根据需要还可以设定每组的图像数量。
具体的,为了将图像大小扩大一倍,对图像进行三次线性插值,并将大小扩大一倍的图像作为第0幅图像;
对线性插值处理后的图像进行4次高斯滤波,分别得到地1、2、3和4幅图像;
对第0、1、2、3和4幅图像进行二分之一下采样,得到下一组5幅图像;
重复下采样的过程N次,得到N组octv对应的5幅图像,其中,
N=log(MIN(src->width,src->height))/log(a)-a;
其中,MIN表示取小操作,src->width和src->height分别表示对输入图像进行插值处理后的图像的宽度和高度,a为一个根据实际需要设定的常量。
较佳地,a为2。
较佳地,在步骤Q1中,对光反射不变颜色空间中的图像构建LOG金字塔包括:
将得到的(N+2)组5幅图像以金字塔的形式排列,其中每组图像构成LOG金字塔的一层。
较佳地,在步骤Q1中,将LOG金字塔转换成DOG金字塔包括:
对LOG金字塔每组的5幅图像进行差值运算,即对每组的五幅图像的相邻两幅图像进行差值运算,每组得到四幅图像,将得到的(N+2)组4幅图像以金字塔的形式排列,其中每组图像构成DOG金字塔的一层。
较佳地,在步骤Q2中,根据DOG金字塔,确定多个局部极值包括:
在DOG金字塔的同一组(octv)内,按照存储顺序,确定同一组(octv)内每一幅图像中的所有像素点,分别比较一幅图像中的每一个当前像素点与其周围邻域内像素点以及与该图像邻近的上下两幅图像中与该当前像素点对应的像素点的周围邻域内的像素点的大小;
由于DOG金字塔图像中像素点的值是一个-255到+255间的浮点数,如果该当前像素点的值大于0,在该当前像素点比周围邻域像素点和邻近上下两幅图像中对应的像素点的周围邻域内的像素点的值都大时,将该当前像素点的值确定为局部极大值;如果该当前像素点小于0,在该像素点比周围邻域像素点和邻近上下两幅图像中对应的像素点的周围邻域内的像素点的值都小时,将该当前像素点的值确定为局部极小值;同一组(octv)内的顶层图像和底层图像,由于不能同时具有上下的两幅邻近图像,因此在计算局部极值时不予考虑。
较佳地,在步骤Q3中,确定关键像素点包括:
将确定的DOG金字塔对应的局部极值标记为候选关键像素点,过滤掉幅值过小和处在边缘上的候选关键像素点,得到关键像素点。
较佳地,过滤掉幅值过小的候选关键像素点包括:
若候选关键像素点对应的特征向量的绝对值小于第一阈值(比如0.03),则过滤掉该候选关键像素点。
较佳地,过滤掉处在边缘上的候选关键像素点包括:
对候选关键像素点求取海森(Hessian)矩阵,若矩阵的迹与行列式的比值小于第二阈值(比如10),则确定该候选关键像素点具有较大的主曲率,过滤掉该候选关键像素点。
较佳地,在光反射不变颜色空间确定的关键像素点的数量更多,并且分布更均匀。
较佳地,在步骤Q3之后,还包括:
步骤B1、对于每个关键像素点,根据关键像素点的第一局部极值,确定关键像素点对应的梯度描述范围;
步骤B2、根据梯度描述范围,确定关键像素点对应的特征向量。
较佳地,在步骤B1中,针对一个关键像素点,该关键像素点对应的梯度描述范围为以该关键像素点为圆心的圆形区域。
较佳地,关键像素点对应的梯度描述范围以关键像素点为圆心的圆形区域,对于每个关键像素点,确定关键像素点对应的梯度描述范围的半径,包括:
根据下述公式确定所述关键像素点对应的梯度描述范围的半径:
R=α1σ×Y1/N+1/Y………公式五;
其中,R为所述关键像素点对应的梯度描述范围的半径,α1为一个根据实际需要设定的常量,σ为关键像素点的第一局部极值,N为DOG金字塔中关键像素点对应的分组中同尺寸图像的数目,Y为一个根据实际需要设定的常量。
较佳地,在步骤B2中,根据梯度描述范围,确定关键像素点对应的特征向量包括:
步骤C1、对于梯度描述范围内的每个像素点,根据像素点与关键像素点的相对位置,确定像素点对应的二维坐标轴;
比如以图3为例,O点为关键像素点,P点为像素点,根据像素点P点与关键像素点O点的相对位置OP,确定该像素点对应的二维坐标轴包括:以OP所在的直线为Y轴,以垂直于Y轴且过P点的直线为X轴;也可以以OP所在的直线为X轴,以垂直于X轴且过P点的直线为Y轴;其中X轴与Y轴的方向可以根据需要设定;在图3中,以OP所在的直线为Y轴,以垂直于Y轴且过P点的直线为X轴,以OP正向延长线的方向为Y轴的方向,以PP3正向延长线的方向为X轴的方向。
步骤C2、根据二维坐标轴,确定像素点对应的多个邻近像素点;
步骤C3、根据每个邻近像素点的像素值,确定像素点的梯度方向和梯度幅值;
步骤C4、根据关键像素点对应的每个像素点的梯度方向和梯度幅值,确定关键像素点的特征向量。
具体实施中,针对确定梯度描述范围内的像素点的实施,由于关键像素点对应的梯度描述范围为以该关键像素点为圆心的圆形区域,因而针对位于圆上的点,可以设定为梯度描述范围内的像素点,也可以设定为不是位于梯度描述范围内的像素点。
以图3为例,O点为关键像素点,O点对应的梯度描述范围为以O点为圆心r为半径的圆形区域范围,P点、Q点和R点为像素点,其中P点和R点位于以关键像素点O点为圆心r为半径的圆形区域内,Q点位于以关键像素点O点为圆心r为半径的圆上;P点和R点为梯度描述范围内的像素点,Q点可以看做梯度描述范围内的像素点,也可以看做不是梯度描述范围内的像素点。
较佳地,在步骤C2中,对于梯度描述范围内的每个像素点,该像素点对应的邻近像素点位于该像素点对应的二维坐标轴上,且邻近像素点与该像素点的距离不大于一个像素。
实施中,邻近像素点都必须位于坐标轴上,可以克服由于目标旋转而引起的方向变化对特征向量产生影响的问题。
以图3为例,像素点P点对应的邻近像素点P1、P2、P3和P4分别位于X轴的负方向、Y轴的正方向、X轴的正方向和Y轴的负方向且P1、P2、P3和P4与像素点P点的距离均为一个像素。
下面以图3为例,对步骤C3中的根据每个邻近像素点的像素值确定像素点的梯度方向和梯度幅值进行介绍。
在图3中,P1、P2、P3和P4为像素点P点对应的邻近像素点,f(P1)表示点P1的像素值,f(P2)表示点P2的像素值,f(P3)表示点P3的像素值,f(P4)表示点P4的像素值,atan2表示求反正切,可以根据下列两个公式确定像素点P的梯度方向和梯度幅值
θ(P)=atan2[f(P2)-f(P4),f(P3)-f(P1)]
其中,G(P)表示像素点P的梯度幅值,θ(P)表示像素点P的梯度方向。
需要说明的是,上述是以像素点对应的4个邻近像素点为例,对本发明实施例根据每个邻近像素点的像素值确定像素点的梯度方向和梯度幅值进行的介绍,具体实施中,针对像素点对应的邻近像素点为其他个数的实施情况与本发明实施例像素点对应的4个邻近像素点的实施情况类似。
较佳地,在步骤C4中,根据关键像素点对应的每个像素点的梯度方向和梯度幅值,确定关键像素点的特征向量包括:
对于梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;将梯度方向属于同一集合的像素点的梯度幅值进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定关键像素点的特征向量;或
对于梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;将梯度方向属于同一集合的像素点的数量进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定所述关键像素点的特征向量。
下面将以具体的实例对根据每个像素点对应的梯度方向,将所有像素点划分成多个集合进行介绍。
以图4为例,如图4所示,O为关键像素点,1、2、3和4为箭头标记,图中的一个箭头标记对应一个像素点,箭头方向代表像素点的梯度方向,箭头长度代表像素点的梯度幅值,在确定梯度描述范围含有8个bin(方向)后,确定可以将梯度描述范围内的所有像素点划分成8个集合,用360o除以8的值可以确定8个集合中每个集合可以容纳的角度范围,进而可以将梯度描述范围内的所有像素点按照像素点的梯度方向划分成8个集合;
具体地,确定梯度描述范围含有8个bin后,确定将梯度描述范围内的所有像素点划分的8个集合分别为:A、B、C、D、E、F、G和H;用360°除以8的值为45°,可以确定集合A可以容纳的角度范围为0~45°,集合B可以容纳的角度范围为45~90°,集合C可以容纳的角度范围为90~135°,集合D可以容纳的角度范围为135~180°,集合E可以容纳的角度范围为180~225°,集合F可以容纳的角度范围为225~270°,集合G可以容纳的角度范围为270~315°和集合H可以容纳的角度范围为315~360°;进而可以将圆形区域内的所有像素点按照像素点的梯度方向划分成8个集合,像素点1,即箭头1的梯度方向θ=0°,像素点2的梯度方向θ=22.5°,像素点3的梯度方向θ=112.5°,像素点4的梯度方向θ=135°,像素点1与像素点2的梯度方向在集合A可以容纳的角度范围内,像素点3与像素点4的梯度方向在集合C可以容纳的角度范围内,则将像素点1与像素点2划分在在集合A中,将像素点3与像素点4划分在在集合C中。
下面将以具体的实例分别对根据关键像素点对应的每个像素点的梯度方向和梯度幅值,确定关键像素点的特征向量的两种方法进行介绍。
方法一、将梯度方向属于同一集合的像素点的梯度幅值进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定关键像素点的特征向量。
较佳地,将梯度方向属于同一集合的像素点的梯度幅值进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定关键像素点的特征向量包括:
根据每个像素点对应的梯度方向,将所有像素点划分成N个集合;
对于N个集合,将每个集合内的所有像素的梯度幅值相加,相应地,将得到N个数量值,该N个数量值即为确定的关键像素点的特征向量,N为正整数。
较佳地,如图5所示,可以用直方图的形式表示得到的N个数量值,从而得到一个N维的方向直方图。
具体实施中,关键像素点以及关键像素点所在的梯度描述范围可以用这N个数值对应的特征向量来表示。
具体实施中,可以不对以关键像素点为圆心包含关键像素点对应的每个像素点的梯度描述范围划分子区域直接按照梯度描述范围含有的N个bin将梯度描述范围内的所有像素点划分成N个集合;也可以对梯度描述范围进行划分后再根据梯度描述范围含有的N个bin将梯度描述范围划分后的每个子区域内的像素点划分成N个集合,如图6所示,将梯度描述范围划分成2*2的子区域,即一共Ⅰ、Ⅱ、Ⅲ、Ⅳ四个子区域,每个子区域按梯度方向划分为8个集合,则每个子区域可以得到8个数量值,关键像素点以及关键像素点所在的梯度描述范围可以得到32个数值,因而关键像素点以及关键像素点所在的梯度描述范围可以用这32个数值对应的特征向量表示。
具体实施中,也可以将梯度描述范围划分成3*3的子区域,4*4的子区域或者5*5的子区域,具体如何划分可以根据需要而定。
方法二、将梯度方向属于同一集合的像素点的数量进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定所述关键像素点的特征向量。
具体实施中,方法二与方法一的区别在于,只需要确定像素点的梯度方向,无需确定梯度幅值,累加的是像素点的数量,而不是梯度幅值。
具体实施中,可以用直方图的形式表示得到的N个数量值,即,特征向量,从而得到一个N维的方向直方图,N为正整数。
如图2所示,本发明实施例图像描述详细方法包括下列步骤:
步骤201、给定图像,并将图像从BGR颜色空间转换到高斯颜色空间;
步骤202、将图像从高斯颜色空间转换到光反射不变颜色空间;
步骤203、对光反射不变颜色空间的图像构建LOG金字塔;
步骤204、将LOG金字塔转换成DOG金字塔;
步骤205、确定DOG金字塔的包括第一局部极值、第二局部极值和第三局部极值的局部极值,对于每个局部极值,根据该局部极值的第一局部极值、第二局部极值和第三局部极值,确定关键像素点;
步骤206、对于每个关键像素点,根据关键像素点的第一局部极值,确定关键像素点对应的梯度描述范围;
步骤207、对于所述梯度描述范围内的每个像素点,根据所述像素点与所述关键像素点的相对位置,确定所述像素点对应的二维坐标轴;
步骤208、根据所述二维坐标轴,确定所述像素点对应的多个邻近像素点;
步骤209、根据每个邻近像素点的像素值,确定所述像素点的梯度方向和梯度幅值;
步骤210、根据所述关键像素点对应的每个像素点的梯度方向和梯度幅值,确定关键像素点的特征向量。
步骤211、用关键像素点的特征向量对图像进行描述。
基于同一发明构思,本发明实施例中还提供了一种图像描述装置装置装置,由于该装置解决问题的原理与本发明实施例的方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图7为本发明实施例图像描述装置装置结构示意图,如图所示,本发明实施例图像描述装置装置包括:第一转换单元701和第二转换单元702,其中:
第一转换单元701,用于将图像从蓝绿红BGR颜色空间转换到高斯颜色空间Gaussian derivative color model;
第二转换单元702,用于将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;
其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。
较佳地,所述第一系数E1包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值;所述第二系数E2包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值。
较佳地,所述第二转换单元,具体用于根据公式一确定所述光反射不变颜色空间对应的颜色通道。
较佳地,本发明实施例图像描述装置还包括确定单元703,用于对光反射不变颜色空间中的图像构建拉普拉斯高斯LOG金字塔,将所述拉普拉斯高斯LOG金字塔转换成高斯差分DOG金字塔;根据所述高斯差分DOG金字塔,确定多个局部极值,其中,每个局部极值包括:在尺度方向上的第一局部极值、在X方向上的第二局部极值和在Y方向上的第三局部极值;对于每个局部极值,根据所述局部极值的第一局部极值、第二局部极值和第三局部极值,确定关键像素点。
较佳地,确定单元703,还用于对于每个关键像素点,根据所述关键像素点的第一局部极值,确定所述关键像素点对应的梯度描述范围;以及根据所述梯度描述范围,确定所述关键像素点对应的特征向量。
较佳地,关键像素点对应的梯度描述范围以关键像素点为圆心,确定单元703,具体用于根据公式五确定所述关键像素点对应的梯度描述范围的半径。
较佳地,确定单元703,具体用于对于所述梯度描述范围内的每个像素点,根据所述像素点与所述关键像素点的相对位置,确定所述像素点对应的二维坐标轴;根据所述二维坐标轴,确定所述像素点对应的多个邻近像素点;根据每个邻近像素点的像素值,确定所述像素点的梯度方向和梯度幅值;根据所述关键像素点对应的每个像素点的梯度方向和梯度幅值,确定所述关键像素点的特征向量。
较佳地,梯度描述范围内的每个像素点对应的邻近像素点位于所述像素点对应的二维坐标轴上,且所述邻近像素点与所述像素点的距离不大于一个像素。
较佳地,确定单元703,具体用于对于所述梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;将梯度方向属于同一集合的像素点的梯度幅值进行累加,得到该集合对应的数量值;以及根据每个集合对应的数量值,确定所述关键像素点的特征向量。
较佳地,确定单元703,具体用于对于所述梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;确定梯度方向属于同一集合的像素点的数量进行累加,得到该集合对应的数量值;根据每个集合对应的数量值,确定所述关键像素点的特征向量。
装置装置本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (11)
1.一种图像描述方法,其特征在于,包括:
将图像从蓝绿红BGR颜色空间转换到高斯颜色空间Gaussian derivativecolor model;
将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;
其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。
2.如权利要求1所述的方法,其特征在于,所述第一系数E1包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值;所述第二系数E2包括以下至少之一:黄蓝通道的值、红绿通道的值、强度的值。
3.如权利要求2所述的方法,其特征在于,根据下列公式确定所述光反射不变颜色空间对应的颜色通道:
其中,H*是所述光反射不变颜色空间对应的颜色通道,α是一个根据实际需要设定的常量。
4.如权利要求1至3中任一项所述的方法,其特征在于,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间之后,所述方法包括:
对光反射不变颜色空间中的图像构建拉普拉斯高斯LOG金字塔,并将所述拉普拉斯高斯LOG金字塔转换成高斯差分DOG金字塔;
根据所述高斯差分DOG金字塔,确定多个局部极值,其中,每个局部极值包括:在尺度方向上的第一局部极值、在X方向上的第二局部极值和在Y方向上的第三局部极值;
对于每个局部极值,根据所述局部极值的第一局部极值、第二局部极值和第三局部极值,确定关键像素点。
5.如权利要求4所述的方法,其特征在于,确定关键像素点之后,所述方法还包括:
对于每个关键像素点,根据所述关键像素点的第一局部极值,确定所述关键像素点对应的梯度描述范围;
根据所述梯度描述范围,确定所述关键像素点对应的特征向量。
6.如权利要求5所述的方法,其特征在于,关键像素点对应的梯度描述范围以关键像素点为圆心,根据下述公式确定所述关键像素点对应的梯度描述范围的半径:
R=α1σ×Y1/N+1/Y
其中,R为所述关键像素点对应的梯度描述范围的半径,α1为一个根据实际需要设定的常量,σ为关键像素点的第一局部极值,N为DOG金字塔中关键像素点对应的分组中同尺寸图像的数目,Y为一个根据实际需要设定的常量。
7.如权利要求5所述的方法,其特征在于,根据所述梯度描述范围,确定所述关键像素点对应的特征向量的处理包括:
对于所述梯度描述范围内的每个像素点,根据所述像素点与所述关键像素点的相对位置,确定所述像素点对应的二维坐标轴;
根据所述二维坐标轴,确定所述像素点对应的多个邻近像素点;
根据每个邻近像素点的像素值,确定所述像素点的梯度方向和梯度幅值;
根据所述关键像素点对应的每个像素点的梯度方向和梯度幅值,确定所述关键像素点的特征向量。
8.如权利要求7所述的方法,其特征在于,对于所述梯度描述范围内的每个像素点,所述像素点对应的邻近像素点位于所述像素点对应的二维坐标轴上,且所述邻近像素点与所述像素点的距离不大于一个像素。
9.如权利要求8所述的方法,其特征在于,根据所述关键像素点对应的每个像素点的梯度方向和梯度幅值,确定所述关键像素点的特征向量的处理包括:
对于所述梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;
将梯度方向属于同一集合的像素点的梯度幅值进行累加,得到该集合对应的数量值;
根据每个集合对应的数量值,确定所述关键像素点的特征向量。
10.如权利要求8所述的方法,其特征在于,根据所述关键像素点对应的每个像素点的梯度方向和梯度幅值,确定所述关键像素点的特征向量的处理包括:
对于所述梯度描述范围内的所有像素点,根据每个像素点对应的梯度方向,将所有像素点划分成多个集合;
确定梯度方向属于同一集合的像素点的数量进行累加,得到该集合对应的数量值;
根据每个集合对应的数量值,确定所述关键像素点的特征向量。
11.一种图像描述装置,其特征在于,包括:
第一转换单元,用于将图像从蓝绿红BGR颜色空间转换到高斯颜色空间Gaussian derivative color model;
第二转换单元,用于将所述图像从所述高斯颜色空间转换到光反射不变颜色空间;
其中,将所述图像从所述高斯颜色空间转换到光反射不变颜色空间的处理包括:对于所述图像上的每个像素点,根据所述像素点在高斯颜色空间的第一系数和第二系数,确定所述像素点在所述光反射不变颜色空间对应的颜色通道。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310166191.4A CN104143198A (zh) | 2013-05-08 | 2013-05-08 | 一种图像描述方法和装置 |
US14/092,621 US9208584B2 (en) | 2013-05-08 | 2013-11-27 | Method and apparatus for describing image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310166191.4A CN104143198A (zh) | 2013-05-08 | 2013-05-08 | 一种图像描述方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104143198A true CN104143198A (zh) | 2014-11-12 |
Family
ID=51852366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310166191.4A Pending CN104143198A (zh) | 2013-05-08 | 2013-05-08 | 一种图像描述方法和装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9208584B2 (zh) |
CN (1) | CN104143198A (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112200207B (zh) * | 2019-07-08 | 2024-02-20 | 浙江宇视科技有限公司 | 光源颜色的确定方法、装置、存储介质及电子设备 |
CN110880003B (zh) * | 2019-10-12 | 2023-01-17 | 中国第一汽车股份有限公司 | 一种图像匹配方法、装置、存储介质及汽车 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693426A (zh) * | 2012-05-21 | 2012-09-26 | 清华大学深圳研究生院 | 一种图像显著区域检测方法 |
CN102800094A (zh) * | 2012-07-13 | 2012-11-28 | 南京邮电大学 | 一种快速彩色图像分割方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6459809B1 (en) * | 1999-07-12 | 2002-10-01 | Novell, Inc. | Searching and filtering content streams using contour transformations |
CN102214410B (zh) * | 2002-11-05 | 2014-01-01 | 亚洲航测株式会社 | 倾斜红色化立体图像制作装置 |
JP3944738B2 (ja) * | 2003-03-18 | 2007-07-18 | ソニー株式会社 | 画像処理装置および方法、記録媒体、並びにプログラム |
-
2013
- 2013-05-08 CN CN201310166191.4A patent/CN104143198A/zh active Pending
- 2013-11-27 US US14/092,621 patent/US9208584B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693426A (zh) * | 2012-05-21 | 2012-09-26 | 清华大学深圳研究生院 | 一种图像显著区域检测方法 |
CN102800094A (zh) * | 2012-07-13 | 2012-11-28 | 南京邮电大学 | 一种快速彩色图像分割方法 |
Non-Patent Citations (1)
Title |
---|
刘岩 等: "尺度与颜色不变性图像特征描述", 《小型微型计算机系统》 * |
Also Published As
Publication number | Publication date |
---|---|
US9208584B2 (en) | 2015-12-08 |
US20140334727A1 (en) | 2014-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112348815B (zh) | 图像处理方法、图像处理装置以及非瞬时性存储介质 | |
US11080911B2 (en) | Mosaic oblique images and systems and methods of making and using same | |
Deng et al. | Automatic indoor construction process monitoring for tiles based on BIM and computer vision | |
US20200258301A1 (en) | Generating a customized three-dimensional mesh from a scanned object | |
CN100349185C (zh) | 地图生成设备、地图发送方法 | |
Xu et al. | Reconstruction of scaffolds from a photogrammetric point cloud of construction sites using a novel 3D local feature descriptor | |
CN106251353A (zh) | 弱纹理工件及其三维位姿的识别检测方法及系统 | |
CN110246168A (zh) | 一种移动巡检机器人双目图像拼接的特征匹配方法 | |
KR101638173B1 (ko) | 캘리브레이션을 위한 자동 피처 탐지용 기구물 및 그 탐지 방법 | |
US8666170B2 (en) | Computer system and method of matching for images and graphs | |
CN107610131A (zh) | 一种图像裁剪方法和图像裁剪装置 | |
CN107451982A (zh) | 一种基于无人机影像的高郁闭度林分树冠面积获取方法 | |
KR101349375B1 (ko) | 3차원 지리정보시스템용 건물의 자동 3차원 공간영상 자동도화방법 | |
CN101625760A (zh) | 一种证件图像倾斜校正的办法 | |
CN103743750B (zh) | 一种大口径光学元件表面损伤分布图的生成方法 | |
CN110415304A (zh) | 一种视觉标定方法及系统 | |
CN105068918A (zh) | 一种页面测试方法及装置 | |
CN114119753A (zh) | 面向机械臂抓取的透明物体6d姿态估计方法 | |
CN104143198A (zh) | 一种图像描述方法和装置 | |
CN108898679A (zh) | 一种零部件序号自动标注的方法 | |
CN105930813B (zh) | 一种在任意自然场景下检测行文本的方法 | |
CN109523594A (zh) | 一种视觉托盒特征点坐标定位方法及系统 | |
CN111260723B (zh) | 棒材的质心定位方法及终端设备 | |
CN104751177B (zh) | 一种用于标识数字图像中给定模糊数字直线段的方法 | |
CN104408437A (zh) | 一种基于合成孔径雷达的道路检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141112 |