具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
本发明提供了一种商标图像查询方法,如图1所示,该方法包括以下步骤:提取商标图像数据库中每一模型图像的特征信息,该特征信息包括边缘形状特征信息和其他特征信息;根据模型图像的边缘形状特征信息判断该模型图像的复杂度,并按照所述复杂度将所述模型图像分为一个以上的群组,群组中的每一模型图像具有其对应的特征信息;提取待查询图像的特征信息,该特征信息包括边缘形状特征信息和其他特征信息;根据所述待查询图像的边缘形状特征信息判断该待查询图像的复杂度,以确定该待查询图像所属的群组;以及根据所述待查询图像的特征信息,在该待查询图像所属的群组中进行相似度查询,获得相似度查询结果。
根据本发明的技术方案,为了方便特征比较,保证图像尺寸和格式的统一性以及清晰度,对商标图像数据库中的模型图像进行特征信息提取之前,需要对所述模型图像进行预处理,所述预处理包括图像的灰度化、归一化和滤波处理。
将彩色图像转化成灰度图像的过程称为图像的灰度化处理。彩色图像中每个像素的颜色由R、G、B三个分量决定,而每个分量有255中值可取,这样一个像素点可以有1600多万(255*255*255)的颜色的变化范围。而灰 度图像是R、G、B三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为255种,在数字图像处理中,通常先将各种格式的图像转变成灰度图像,以使后续图像的计算量变得少一些。灰度图像的描述与彩色图像一样,仍然反映了整幅图像的整体和局部的色度和亮度等级的分布和特征。图像灰度化处理的常用方法有分量法、最大值法及加权平均法等,其原理及计算过程为本领域技术人员所公知。
图像的归一化是通过一系列变换(即利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响),将待处理的原始图像转换成相应的唯一标准形式(该标准形式图像对平移、旋转、缩放等仿射变换具有不变特性)。由于商标图像数据库中的模型图像通常具有不同的格式和尺寸,为了方便特征比较,需要对其中的模型图像进行归一化处理。模型图像的格式转换可以采用格式化软件提前进行处理,并通过尺寸归一化将模型图像缩放为同一尺寸。根据本发明的技术方案,可以将商标图像数据库中的模型图像的高度和宽度设为256个像素点。
为了保证图像的清晰度,还需要对模型图像进行滤波处理。根据本发明的技术方案,可以采用中值滤波(一种非线性平滑技术,其基本原理是将数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近真实值,从而消除孤立的噪声点)对图像进行滤波处理。
根据本发明的技术方案,在对模型图像进行预处理之后,提取商标图像数据库中每一模型图像的特征信息,该特征信息包括边缘形状特征信息和其他特征信息。
其中,所述边缘形状特征信息的提取采用以下边缘检测算法中的一种实现:Sobel算子边缘检测、Roberts算子边缘检测、Prewitt算子边缘检测、Laplacian算子边缘检测、以及Canny算子边缘检测。
所谓边缘,是指其周围像素灰度急剧变化的那些象素的集合,边缘存在 于目标、背景和区域之间,是图像最基本的特征。
1、Sobel算子边缘检测
Sobel算子主要用于边缘检测,在技术上是以离散型的差分算子,用以运算图像亮度函数的梯度的近似值,Sobel算子是典型的基于一阶导数的边缘检测算子,由于该算子中引入了类似局部平均的运算,因此对噪声具有平滑作用,能很好的消除噪声的影响。
Sobel算子包含两组3x3的矩阵,分别为横向及纵向模板,将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分近似值。实际使用中,常用以下两个模板来检测图像边缘。
检测水平边沿横向模板:
检测垂直平边沿纵向模板:
图像的每一个像素的横向及纵向梯度近似值可用以下的公式结合,来计算梯度的大小。
然后可用以下公式计算梯度方向。
2、Roberts算子边缘检测
Roberts算子是一种简单的、利用局部差分算子寻找边缘的算子,采用对角线方向相邻两象素之差近似梯度幅值检测边缘。
Roberts边缘算子是一个2x2的模板,采用的是对角方向相邻的两个像 素之差。
3、Prewitt算子边缘检测
Prewitt算子是一种一阶微分算子的边缘检测,利用像素点上下、左右邻点的灰度差,在边缘处达到极值检测边缘,去掉部分伪边缘,对噪声具有平滑作用。其原理是在图像空间利用两个方向模板与图像进行邻域卷积来完成,所述两个方向模板一个检测水平边缘,而另一个检测垂直边缘。
举例来说,对于数字图像f(x,y),Prewitt算子定义如下:
G(i)=|[f(i-1,j-1)+f(i-1,j)+f(i-1,j+1)]-[f(i+1,j-1)+f(i+1,j)+f(i+1,j+1)]|
G(j)=|[f(i-1,j+1)+f(i,j+1)+f(i+1,j+1)]-[f(i-1,j-1)+f(i,j-1)+f(i+1,j-1)]|
则P(i,j)=max[G(i),G(j)]或P(i,j)=G(i)+G(j)
Prewitt梯度算子法是先求平均,再求差分来求梯度。水平和垂直梯度模板分别为:
检测水平边沿横向模板:
检测垂直平边沿纵向模板:
4、Laplacian算子边缘检测
Laplacian算子为基于二阶微分算子,该算子利用二阶微分过零点的原理提取边界点。在算法实现过程中,也是通过3x3卷积核运算,选取合适的阈值以提取边缘。Laplacian算子表示成模板的形式如下所示:
Laplacian算子模板:
其扩展模板:
5、Canny算子边缘检测
Canny算子是一个具有滤波、增强、检测的多阶段的优化算子,在进行处理前,Canny算子先利用高斯平滑滤波器来平滑图像以除去噪声,Canny分割算法采用一阶偏导的有限差分来计算梯度幅值和方向,在处理过程中,Canny算子还将经过一个非极大值抑制的过程,最后Canny算子还采用两个阈值来连接边缘。
根据本发明的技术方案,对模型图像进行特征信息提取,除了边缘形状特征信息之外,还包括对模型图像的其他特征信息进行提取,以用于后续的图像相似度查询,其中,所提取的其他特征信息包括颜色特征和/或纹理特征。
颜色特征是一种全局特征,用于描述图像或图像区域所对应的景物的表面性质。常用的颜色特征提取方法包括颜色直方图、颜色集、颜色矩、颜色聚合向量、颜色相关图等等,其原理及计算过程为本领域技术人员所公知。
纹理特征也是一种全局特征,用于描述图像或图像区域所对应景物的表面性质。常用的纹理特征提取方法包括灰度共生矩阵、自回归纹理模型、小波变换等等,其原理及计算过程为本领域技术人员所公知。
根据本发明的技术方案,优选地,所提取的其他特征信息还包括尺度不变特征转换(SIFT)特征或加速鲁棒性(SURF)特征。
SIFT(Scale Invariant Feature Transform,尺度不变特征转换)特征是采用SIFT算法提取的一种局部特征,对旋转、亮度变化、尺寸缩放具有不变 性。
SURF(Speeded Up Robust Features,加速鲁棒性)特征是采用SURF算法提取的一种局部特征,SURF算法是SIFT算法的加速版,它利用Haar小波来近似SIFT方法中的梯度操作,同时利用积分图技术进行快速计算。
SIFT特征和SURF特征的提取算法为本领域技术人员所公知,在此不再做进一步的说明和介绍。
根据本发明的技术方案,在完成模型图像的特征信息提取之后,根据模型图像的边缘形状特征信息判断该模型图像的复杂度,并按照所述复杂度将商标图像数据库中的模型图像分为一个以上的群组。根据本发明的技术方案,所述复杂度由所提取的模型图像的边缘形状特征信息中构成图像边缘的像素点的数量来决定。
举例来说,对于构图较为简单的模型图像,例如是简单的圆形、方形、或者几个简单的笔画勾勒出来的商标图像,构成图像边缘的像素点数量较少,而对于构图较为复杂的模型图像,例如以人像或者风景等等作为商标图像,相应地,构成图像边缘的像素点数量较多。在实践中,可以为商标图像数据库中模型图像的分组预先设置阈值区间,即以构成图像边缘的像素点的数量来设置阈值区间,在判断模型图像的复杂度时,根据构成该模型图像边缘的像素点的数量所处的阈值区间来判断其复杂度,以将其归入到相应的群组中。举例来说,可以只设定一个复杂度阈值,即可以采用该复杂度阈值来将商标图像数据库中的模型图像分为两个群组,对于模型图像,通过边缘特征提取算法,可以算出构成图像边缘的笔画总共的像素点的数量。如果该数量在预先设定的所述复杂度阈值之下,则确定该模型图像的复杂度较低,可以将其划分到复杂度阈值以下的群组。如果该数量在预先设定的所述复杂度阈值之上,则确定该模型图像的复杂度较高,可以将其划分到复杂度阈值以上的群组。需要说明的是,可以根据实际操作的需要通过预先设定多个阈值 区间来将商标图像数据库中的模型图像划分成两个以上的群组,本发明不对此进行任何限定。
由此,根据商标图像数据库中各个模型图像的复杂度,可以将所有的模型图像归入对应的群组,并且通过特征信息的提取,在这些群组中,每一模型图像均具有其对应的特征信息。
在商标图像查询过程中,对于待查询图像,首先按照与模型图像相同的方式,提取该待查询图像的特征信息,所述特征信息同样包括边缘形状特征信息和其他特征信息。其中所提取的其他特征信息包括颜色特征和/或纹理特征。优选地,所提取的其他特征信息还包括尺度不变特征转换(SIFT)特征或加速鲁棒性(SURF)特征。
同样地,为了保证图像尺寸和格式的一致以及保证图像的清晰度,在对待查询图像进行特征提取之前,需要对待查询图像进行预处理,所述预处理同样包括图像的灰度化、归一化和滤波处理。并且,为了保证图像比对的准确性,所述模型图像与所述待查询图像需要具有相同的像素值。
之后,按照与模型图像相同的方式,根据所提取的待查询图像的边缘形状特征信息,判断该待查询图像的复杂度,由此仍根据为图像的分组预先设置的阈值区间,根据该查询图像的复杂度(也即构成该待查询图像的边缘的像素点的数量)来确定该待查询图像所属的群组。
在确定待查询图像所述的群组之后,根据本发明的技术方案,根据所提取的该待查询图像的特征信息,在该待查询图像所述的群组中进行相似度查询,即根据该待查询图像的特征信息,将该待查询图像与所述群组中的每一模型图像进行特征匹配,根据所获得的匹配度作为相似度查询结果,由此用户可以根据所获得的相似度查询结果来判断该待查询图像与其所属群组中的模型图像是否相同或相近似。
采用本发明提供的商标图像查询方法,由于首先按照图像的复杂度对商 标图像数据库中的模型图像进行了分组,在商标图像查询过程中,根据待查询图像的复杂度,仅在待查询图像所属的群组中进行相似度查询,而无需在整个图像数据库中进行查询,缩短了查询时间,由此,在保证准确率的同时大大提高了图像检索效率。
优选地,本发明提供的商标图像查询方法还包括以下步骤:对相似度查询结果进行排序。根据本发明的技术方案,在将待查询图像与其所述群组中的每一模型图像进行特征匹配之后,可以对待查询图像与每一模型图像的匹配度进行排序,以方便用户的判断及后续操作。
由于商标图像可能存在构图相似但图像边缘存在区别,或者由于图像的清晰度而造成的图像边缘模糊以致像素计算不准确的问题,为了保证相似度查询的准确性,根据本发明的技术方案,优选地,可以根据用户对相似度查询结果的反馈,进行再次查询。
由此,本发明提供的商标图像查询方法还包括以下步骤:根据用户对所述相似度查询结果的反馈,判断是否进行再次查询;以及在确定进行再次查询的情况下,根据所述待查询图像的特征信息,在该待查询图像所属的群组之外的群组中进行相似度查询。
根据本发明的技术方案,用户根据所获得的相似度查询结果来判断待查询图像与其所属群组中的模型图像是否相同或相近似。如果用户对相似度查询结果的反馈为在待查询图像所属群组中未查询到与待查询图像相同或相近似的模型图像,则确定进行再次查询,并且根据待查询图像的特征信息,在待查询图像所属的群组之外的其他群组中进行相似度查询,由此能够更好地保证相似度查询的准确性。
优选地,为了提高查询效率,所述再次查询并非在待查询图像所述群组之外的其他群组进行随机查询,而是按照其他群组的排序进行依次查询。
采用本发明提供的商标图像查询方法,由于首先按照图像的复杂度对商 标图像数据库中的模型图像进行了分组,在商标图像查询过程中,根据待查询图像的复杂度,仅在待查询图像所属的群组中进行相似度查询,而无需在整个图像数据库中进行查询,缩短了查询时间,由此,在保证准确率的同时大大提高了图像检索效率。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。