CN106503143B - 一种图像检索方法及装置 - Google Patents

一种图像检索方法及装置 Download PDF

Info

Publication number
CN106503143B
CN106503143B CN201610918062.XA CN201610918062A CN106503143B CN 106503143 B CN106503143 B CN 106503143B CN 201610918062 A CN201610918062 A CN 201610918062A CN 106503143 B CN106503143 B CN 106503143B
Authority
CN
China
Prior art keywords
image
retrieved
edge points
edge
fourier transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610918062.XA
Other languages
English (en)
Other versions
CN106503143A (zh
Inventor
黎伟禧
凌永权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201610918062.XA priority Critical patent/CN106503143B/zh
Publication of CN106503143A publication Critical patent/CN106503143A/zh
Application granted granted Critical
Publication of CN106503143B publication Critical patent/CN106503143B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像检索方法及装置,通过获取待检索图像;对待检索图像进行预处理操作;采用离散分数阶傅里叶变换作为描述子,计算得到待检索图像的边缘特征;调用预先构建的字典,字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;利用预设分类器对待检索图像进行分类,得到检索结果。本发明所提供的图像检索方法及装置,通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征,对图像数据获得的边缘特征具有时域以及频域的描述性能,且离散分数阶傅里叶变换描述子具有不变形特征,同时训练能够融合两维的特征信息,提升了图像的检索效果。

Description

一种图像检索方法及装置
技术领域
本发明涉及图像检索技术领域,特别是涉及一种图像检索方法及装置。
背景技术
近三十年来,多媒体技术快速发展,许多图像数据库被建立,例如外观设计专利数据库、人脸识别数据库、虹膜识别数据库、指纹识别数据库、车辆登记号码数据库等。从这些数据库中寻找图像实际上就是一个图像检索问题,因此如何快速有效地从数据库中检索出图像一直是图像检索技术的研究热点。
为了提高图像检索的速度,寻找最能表达图像特征的描述子尤为重要。因为离散傅里叶变换描述子的不变性特征,对图像边缘的描述具有鲁棒性,所以人们广泛地使用基于离散傅里叶变换描述子的方法来寻找图像边缘特征,并获得不错的效果。然而离散傅里叶变换描述子也有缺陷。每幅图像的边缘特征都包含x坐标和y坐标,由于传统的离散傅里叶变换描述子只能应用单个方向的信息,为了有效地构建字典,这种方法需要更多的训练图片。然而像人脸识别这样的数据库,能用来作为训练的图像不多,因此往往不能满足实际训练的要求。除此以外,传统的离散傅里叶变换描述子只能反映图像的频域特征,能用于图像检索的信息十分有限。寻找一种具有传统离散傅里叶变换描述子优点的更广泛的特征描述子将成为近年来研究的重点。
发明内容
本发明的目的是提供一种图像检索方法及装置,目的在于解决现有表达图像特征的描述子特征信息不充分,表达能力不强,导致检索能力较低的问题。
为解决上述技术问题,本发明提供一种图像检索方法,包括:
获取待检索图像;
对所述待检索图像进行预处理操作;
采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
利用预设分类器对所述待检索图像进行分类,得到检索结果。
可选地,所述采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征包括:
采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;
采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
可选地,所述利用预设分类器对所述待检索图像进行分类的步骤包括:
利用1-NN分类器对所述待检索图像进行分类。
可选地,所述字典预先构建的步骤包括:
对每一幅训练图像提取边缘点;
每幅进行边缘点提取的步骤为:
采用离散余弦变换的方法对原始边缘点进行处理;
将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当前训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;
将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
本发明还提供了一种图像检索装置,包括:
获取模块,用于获取待检索图像;
预处理模块,用于对所述待检索图像进行预处理操作;
计算模块,用于采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
调用模块,用于调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
分类模块,用于利用预设分类器对所述待检索图像进行分类,得到检索结果。
可选地,所述计算模块具体用于:
采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
可选地,所述分类模块具体为:利用1-NN分类器对所述待检索图像进行分类的模块。
可选地,调用模块具体为:对每一幅训练图像提取边缘点;每幅进行边缘点提取的步骤为:采用离散余弦变换的方法对原始边缘点进行处理;将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
本发明所提供的图像检索方法及装置,通过获取待检索图像;对待检索图像进行预处理操作;采用离散分数阶傅里叶变换作为描述子,计算得到待检索图像的边缘特征;调用预先构建的字典,字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;利用预设分类器对待检索图像进行分类,得到检索结果。本发明所提供的图像检索方法及装置,通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征,对图像数据获得的边缘特征具有时域以及频域的描述性能,且离散分数阶傅里叶变换描述子具有不变形特征,同时训练能够融合两维的特征信息,提升了图像的检索效果。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的图像检索方法的一种具体实施方式的流程图;
图2为本发明实施例提供的图像检索装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提供的图像检索方法的一种具体实施方式的流程图如图1所示,该方法包括:
步骤S101:获取待检索图像;
步骤S102:对所述待检索图像进行预处理操作;
步骤S103:采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
步骤S104:调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
步骤S105:利用预设分类器对所述待检索图像进行分类,得到检索结果。
本发明所提供的图像检索方法,通过获取待检索图像;对待检索图像进行预处理操作;采用离散分数阶傅里叶变换作为描述子,计算得到待检索图像的边缘特征;调用预先构建的字典,字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;利用预设分类器对待检索图像进行分类,得到检索结果。本发明所提供的图像检索方法,通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征,对图像数据获得的边缘特征具有时域以及频域的描述性能,且离散分数阶傅里叶变换描述子具有不变形特征,同时训练能够融合两维的特征信息,提升了图像的检索效果。
在上述实施例的基础上,本发明所提供的图像检索方法中,所述采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征的步骤可以具体包括:
采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;
采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
所述利用预设分类器对所述待检索图像进行分类的步骤包括:
利用1-NN分类器对所述待检索图像进行分类。
进一步地,在上述任意实施例的基础上,本申请所提供的图像检索方法中,字典预先构建的步骤包括:
对每一幅训练图像提取边缘点;
每幅进行边缘点提取的步骤为:
采用离散余弦变换的方法对原始边缘点进行处理;
将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当前训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;
将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
下面对本发明所提供的图像检索方法的具体实施过程进行进一步详细阐述。
首先对每一幅训练图像提取边缘点。由于每幅图的边缘点个数不相同,为了统一边缘点个数,使用基于离散余弦变换(DCT)的方法对原始边缘点进行处理。将所有训练图像的边缘点个数的平均值作为目标个数,若当前训练图像的边缘点个数大于目标值,对边缘点进行DCT,保留低频所对应的DCT系数,去除多出的高频系数,若前训练图像的边缘点个数小于目标值,对边缘点进行DCT后在高频对应的系数位置补零。最后将所得到的DCT系数进行反离散余弦变换(IDCT)得到个数相同的边缘点。
为了运用离散分数阶傅里叶变换(DFrFTs)作为描述子,关键是确定描述子的最优旋转角度。对于图像检索问题,属于同一类的图像其在旋转时频域的特征应该是聚集在一起的,而不同类的图像会相隔很远。换句话说,描述子的类内间距要尽可能小,类外间距要尽可能大。为了综合这两个判据,一般的方法是费希尔(Fisher)判别法,即类内间距和类外间距比值要最小。本申请决定最优旋转角度的方法就是使Fisher判别最小。
假设有C种不同类型的图像,Nc表示c类图像的训练数目,其中c=0,…,C-1。N表示图像边缘点的数目。
Figure BDA0001135691070000062
是一个复值向量,
Figure BDA0001135691070000063
Figure BDA0001135691070000064
分别表示边缘点的x坐标和y坐标,其中nc=0,…,Nc-1,c=0,…,C-1。Re(z)和
Figure BDA0001135691070000065
分别表示向量z的实部和虚部。Ca×b表示a×b的复值矩阵。Fα∈CN×N是分数阶傅里叶变换矩阵,其中旋转角度α∈[-π,π)。让Jintra和Jinter分别表示DFrFTs描述子基于二范测度的类内间距和类外间距。
Figure BDA0001135691070000061
Figure BDA0001135691070000071
这里
Figure BDA0001135691070000072
表示第c类图像边缘点向量的平均值,即
值得注意的是,Fα是埃尔米特矩阵,Jintra和Jinter与Fα独立。因此Jintra和Jinter都不能用于决定DFrFTs的旋转角度。实际上,
Figure BDA0001135691070000079
包含有x坐标和y坐标的信息,为了不失去任何信息,
Figure BDA00011356910700000710
的实部和虚部都必须保留用于检索。因为用一范测度的目标函数可以将优化问题重新定义为一个线性约束的线性目标函数,其解很容易找到,所以我们将类内间距和类外间距分别重新定义为
Figure BDA0001135691070000074
Figure BDA0001135691070000075
其中
Figure BDA0001135691070000076
Figure BDA0001135691070000077
按照DFrFTs矩阵的定义,
Fα≡Ediag(e-jαβ)ET, (6)
其中E是与α无关的实值酉矩阵,diag(z)表示以z的元素为对角线的对角矩阵,
β≡[0 … N-1]T, (7)
Figure BDA0001135691070000078
对于
z≡[z0 … zN-1]T, (9)
上表T表示转置操作。定义
Figure BDA0001135691070000081
Figure BDA0001135691070000082
Figure BDA0001135691070000084
Figure BDA0001135691070000085
Figure BDA0001135691070000086
Figure BDA0001135691070000087
Figure BDA0001135691070000088
其中c=0,…,C-1,nc=0,…,Nc-1。
Figure BDA0001135691070000089
相似的可以定义
Figure BDA0001135691070000091
Figure BDA0001135691070000092
Figure BDA0001135691070000093
Figure BDA0001135691070000094
其中c=0,…,C-1,d=0,…,C-1。
让类内间距和类外间距的比值为
Figure BDA0001135691070000098
Figure BDA0001135691070000099
从上面的推导可以看出
Figure BDA00011356910700000910
和α有关。让α0表示最优的旋转角度。值得注意的是,因为
Figure BDA00011356910700000911
是个连续函数,所以在α0周围的小区域内的点具有近似的函数值。换句话说,我们也只能近似求得
Figure BDA00011356910700000912
的全局最优值。实际上,一般会要求有一系列不同的旋转角度能局部最小化
Figure BDA00011356910700000913
为了解决这个问题,可以注意到局部最小化
Figure BDA0001135691070000101
的值α不仅会落在目标函数的稳定点处,还有可能落在不可导点处。因为
Figure BDA0001135691070000102
包含不可导的一范数,所以字典的设计问题就变成寻找一系列旋转角度,使得
Figure BDA0001135691070000103
局部最小。用
Figure BDA0001135691070000104
表示一系列旋转角度,开始时
Figure BDA0001135691070000105
是一个空集,定义最优化问题P:
Figure BDA0001135691070000106
要求:
Figure BDA0001135691070000107
满足(17), (28b)
Figure BDA0001135691070000108
有可能是稳定的,有可能是不可导的,(28c)
同时
Figure BDA0001135691070000109
通过寻找问题P的局部解,将解加到
Figure BDA00011356910700001010
中,然后迭代L次,接着获得L个能局部最小化
Figure BDA00011356910700001011
的不同旋转角度。
寻找
Figure BDA00011356910700001012
的所有不可导点,让A和
Figure BDA00011356910700001013
的维数分别为M1×2N和M2×2N。这里
Figure BDA00011356910700001014
M2=2NC2。 (30)
定义A的第m1行和的第m2分别为
Figure BDA00011356910700001016
其中m1=1,…,M1 (31)
Figure BDA00011356910700001017
其中m2=1,…,M2, (32)
里面有
Figure BDA00011356910700001018
其中m1=1,…,M1, (33)
Figure BDA00011356910700001019
其中m1=1,…,M1, (34)
Figure BDA0001135691070000111
其中m2=1,…,M2, (35)
Figure BDA0001135691070000112
其中m2=1,…,M2。 (36)
Figure BDA0001135691070000113
表示DFrFTs的旋转角度,其中k=0,…,K1-1,于是有
Figure BDA0001135691070000114
对于m1=1,…,M1,或
Figure BDA0001135691070000115
对于m2=1,…,M2。这里K1是(37)或(38)的全部根的数目。因为绝对值函数|z|的不可导点值出现在z=0,所以
Figure BDA0001135691070000116
的不可导点只落在
Figure BDA0001135691070000117
其中k=0,…,K1-1。不是一般性,假设序列
Figure BDA0001135691070000118
以升序排列,即
Figure BDA0001135691070000119
其中k=0,…,K1-2。
为寻找
Figure BDA00011356910700001110
的稳定点,定义
Figure BDA00011356910700001111
其中m1=1,…,M1 (39)
其中m2=1,…,M2。 (40)
接着,
这里,
Figure BDA0001135691070000121
注意到
Figure BDA0001135691070000123
是可导的,其中k=0,…,K1-2。也有,
Figure BDA0001135691070000124
Figure BDA0001135691070000125
对于所有
Figure BDA0001135691070000126
其中k=0,…,K1-2。假设有Pk个稳定点在
Figure BDA0001135691070000127
让这些点表示为
Figure BDA0001135691070000128
其中p=0,…,Pk-1和k=0,…,K1-2。于是有,
Figure BDA0001135691070000129
其中p=0,…,Pk-1和k=0,…,K1-2。换句话,我们有
Figure BDA0001135691070000131
其中p=0,…,Pk-1和k=0,…,K1-2。
(43)和(44)暗示着
Figure BDA0001135691070000132
其中p=0,…,Pk-1和k=0,…,K1-2。
Figure BDA0001135691070000133
对于k=0,…,K1-2都是已知的。因此,(37),(38)和(47)是传统的三角等式。通过二倍角公式,可以将上述等式表示为多项式,这些等式的解将很容易找到。显然,获得的解就是
Figure BDA0001135691070000134
对应的不可导点和稳定点的解。
最后,通过在集合
Figure BDA0001135691070000135
识别出L个最小函数值,对应的DFrFTs角度就找到了。
定义
Figure BDA0001135691070000141
其中δ是变换矩阵的列数和行数的比值。如果δ去得很小,就会产生很少的描述子,也就是说还没有足够的信息去进行图像检索,否则δ过大,就会出现过拟合现象。
表示最优旋转角度,其中l=0,…,L-1。将作为列向量可以构成字典,其中c=0,…,C-1,nc=0,…,Nc-1,l=0,…,L-1。
假设有M个测试图像,让ym∈CN×1表示一个复值向量,其中m=0,…,M-1。Re(ym)和Im(ym)分别是测试图像边缘点的x坐标向量和y坐标向量。为了进行图像检索,需要使用1-NN分类规则。也就是找在旋转时频域中使ym距离最小的那个类。将目标类定义为对应最近的测试边缘特征向量为
Figure BDA0001135691070000146
使用一范数作为距离度量,将
Figure BDA0001135691070000147
作为目标函数,即测试图像所属的类由以下优化问题表达:
Figure BDA0001135691070000148
遍历查找得到该问题的解,即检索到同一类的图像。
下面对本发明实施例提供的图像检索装置进行介绍,下文描述的图像检索装置与上文描述的图像检索方法可相互对应参照。
图2为本发明实施例提供的图像检索装置的结构框图,参照图2图像检索装置可以包括:
获取模块100,用于获取待检索图像;
预处理模块200,用于对所述待检索图像进行预处理操作;
计算模块300,用于采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
调用模块400,用于调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
分类模块500,用于利用预设分类器对所述待检索图像进行分类,得到检索结果。
作为一种具体实施方式,本发明所提供的图像检索装置中,计算模块具体用于:
采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
作为一种具体实施方式,本发明所提供的图像检索装置中,分类模块具体为:利用1-NN分类器对所述待检索图像进行分类的模块。
在上述任一实施例的基础上,本发明所提供的图像检索装置中,调用模块具体为:对每一幅训练图像提取边缘点;每幅进行边缘点提取的步骤为:采用离散余弦变换的方法对原始边缘点进行处理;将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
本实施例的图像检索装置用于实现前述的图像检索方法,因此图像检索装置中的具体实施方式可见前文中的图像检索方法的实施例部分,例如,获取模块100,预处理模块200,计算模块300,调用模块400,分类模块500,分别用于实现上述图像检索方法中步骤S101,S102,S103,S104和S105,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本发明所提供的图像检索装置,通过获取待检索图像;对待检索图像进行预处理操作;采用离散分数阶傅里叶变换作为描述子,计算得到待检索图像的边缘特征;调用预先构建的字典,字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;利用预设分类器对待检索图像进行分类,得到检索结果。本发明所提供的图像检索装置,通过扩展传统离散傅里叶变换描述子为离散分数阶傅里叶变换描述子来表达图像的边缘特征,对图像数据获得的边缘特征具有时域以及频域的描述性能,且离散分数阶傅里叶变换描述子具有不变形特征,同时训练能够融合两维的特征信息,提升了图像的检索效果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的图像检索方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (6)

1.一种图像检索方法,其特征在于,包括:
获取待检索图像;
对所述待检索图像进行预处理操作;
采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
利用预设分类器对所述待检索图像进行分类,得到检索结果;
其中,所述采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征包括:采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
2.如权利要求1所述的图像检索方法,其特征在于,所述利用预设分类器对所述待检索图像进行分类的步骤包括:
利用1-NN分类器对所述待检索图像进行分类。
3.如权利要求1或2所述的图像检索方法,其特征在于,所述字典预先构建的步骤包括:
对每一幅训练图像提取边缘点;
每幅进行边缘点提取的步骤为:
采用离散余弦变换的方法对原始边缘点进行处理;
将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当前训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;
将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
4.一种图像检索装置,其特征在于,包括:
获取模块,用于获取待检索图像;
预处理模块,用于对所述待检索图像进行预处理操作;
计算模块,用于采用离散分数阶傅里叶变换作为描述子,计算得到所述待检索图像的边缘特征;
调用模块,用于调用预先构建的字典,所述字典中包括多幅采用离散分数阶傅里叶变换描述子进行边缘特征提取的训练图像;
分类模块,用于利用预设分类器对所述待检索图像进行分类,得到检索结果;
其中,所述计算模块具体用于:采用使费希尔判别最小的方法确定离散分数阶傅里叶变换描述子的最优旋转角度;采用一范数来定义目标函数,并分离不可导点和稳定点集,使用非凸优化技术来求解问题获得图像的边缘特征。
5.如权利要求4所述的图像检索装置,其特征在于,所述分类模块具体为:利用1-NN分类器对所述待检索图像进行分类的模块。
6.如权利要求4或5所述的图像检索装置,其特征在于,调用模块具体为:对每一幅训练图像提取边缘点;每幅进行边缘点提取的步骤为:采用离散余弦变换的方法对原始边缘点进行处理;将所有训练图像的边缘点个数的平均值作为目标值,若当前训练图像的边缘点个数大于所述目标值,则对边缘点进行离散余弦变换,保留低频所对应的离散余弦变换系数,去除高频系数,若当训练图像的边缘点个数小于所述目标值,则对边缘点进行离散余弦变换后在高频对应的系数位置补零;将所得到的离散余弦变换系数进行反离散余弦变换得到个数相同的边缘点。
CN201610918062.XA 2016-10-21 2016-10-21 一种图像检索方法及装置 Expired - Fee Related CN106503143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610918062.XA CN106503143B (zh) 2016-10-21 2016-10-21 一种图像检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610918062.XA CN106503143B (zh) 2016-10-21 2016-10-21 一种图像检索方法及装置

Publications (2)

Publication Number Publication Date
CN106503143A CN106503143A (zh) 2017-03-15
CN106503143B true CN106503143B (zh) 2020-02-07

Family

ID=58319307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610918062.XA Expired - Fee Related CN106503143B (zh) 2016-10-21 2016-10-21 一种图像检索方法及装置

Country Status (1)

Country Link
CN (1) CN106503143B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110335298B (zh) * 2019-07-11 2021-08-24 史彩成 一种基于无人机平台图像消旋方法
CN112182492B (zh) * 2020-09-23 2022-12-16 广东工业大学 基于离散四元数傅里叶变换的信号稀疏表示方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1527246A (zh) * 2003-03-07 2004-09-08 佳能株式会社 检测图像中对称图形的方法和装置
CN102045162A (zh) * 2009-10-16 2011-05-04 电子科技大学 一种三模态生物特征持证人身份鉴别系统及其控制方法
CN103336835A (zh) * 2013-07-12 2013-10-02 西安电子科技大学 基于权值color-sift特征字典的图像检索方法
CN105912739A (zh) * 2016-07-14 2016-08-31 湖南琴海数码股份有限公司 一种相似图片检索系统及其方法
CN105913082A (zh) * 2016-04-08 2016-08-31 北京邦焜威讯网络技术有限公司 一种对图像中目标进行分类的方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567048B (zh) * 2008-04-21 2012-06-06 夏普株式会社 图像辨别装置及图像检索装置
US8620065B2 (en) * 2010-04-09 2013-12-31 The Regents Of The University Of Colorado Methods and systems for three dimensional optical imaging, sensing, particle localization and manipulation
JP2013020335A (ja) * 2011-07-08 2013-01-31 Nikon Corp 画像分類方法
DE102012005325A1 (de) * 2012-03-19 2013-09-19 Ernst Pechtl Maschinelles Bilderkennungsverfahren basierend auf einem Kl-System
CN104616013A (zh) * 2014-04-30 2015-05-13 北京大学 获取低维局部特征描述子的方法
CN103955904B (zh) * 2014-05-12 2017-05-24 东南大学 一种基于离散分数阶傅里叶变换相位信息的信号重建方法
KR102010378B1 (ko) * 2014-09-24 2019-08-13 삼성전자주식회사 객체를 포함하는 영상의 특징을 추출하는 방법 및 장치
CN105930382A (zh) * 2016-04-14 2016-09-07 严进龙 一种用2d图片搜索3d模型的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1527246A (zh) * 2003-03-07 2004-09-08 佳能株式会社 检测图像中对称图形的方法和装置
CN102045162A (zh) * 2009-10-16 2011-05-04 电子科技大学 一种三模态生物特征持证人身份鉴别系统及其控制方法
CN103336835A (zh) * 2013-07-12 2013-10-02 西安电子科技大学 基于权值color-sift特征字典的图像检索方法
CN105913082A (zh) * 2016-04-08 2016-08-31 北京邦焜威讯网络技术有限公司 一种对图像中目标进行分类的方法及系统
CN105912739A (zh) * 2016-07-14 2016-08-31 湖南琴海数码股份有限公司 一种相似图片检索系统及其方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于视觉词袋模型的遥感图像分类方法;周宇谷 等;《重庆理工大学学报(自然科学)》;20150531;第75页第3段-第76页倒数第3段 *
应用分数阶傅里叶变换的形状描述方法研究;张婉婷 等;《计算机工程与应用》;20110720;第186页第3节 *

Also Published As

Publication number Publication date
CN106503143A (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
US20100080469A1 (en) Novel descriptor for image corresponding point matching
CN103927387A (zh) 图像检索系统及其相关方法和装置
WO2010083251A1 (en) Method and system for representing image patches
WO2011069023A2 (en) Fast subspace projection of descriptor patches for image recognition
US9767362B2 (en) Matching a feature of captured visual data
Tan et al. Image retargeting for preserving robust local feature: Application to mobile visual search
Hare et al. Content-based image retrieval using a mobile device as a novel interface
Lingadalli et al. Content based image retrieval using color, shape and texture
CN106503143B (zh) 一种图像检索方法及装置
Xu et al. Multi‐pyramid image spatial structure based on coarse‐to‐fine pyramid and scale space
US20120237134A1 (en) Image descriptor quantization
Arif et al. OBJECT CLASSIFICATION VIA GEOMETRICAL, ZERNIKE AND LEGENDRE MOMENTS.
Ye et al. A feature-matching method for side-scan sonar images based on nonlinear scale space
CN107423739B (zh) 图像特征提取方法及装置
CN110705569A (zh) 一种基于纹理特征的图像局部特征描述子提取方法
CN113315914B (zh) 全景视频数据处理方法及装置
Roy et al. Saliency detection in images using graph-based rarity, spatial compactness and background prior
García-Ordás et al. Evaluation of different metrics for shape based image retrieval using a new contour points descriptor
CN113627124A (zh) 一种针对字体迁移模型的处理方法、装置、电子设备
Longlong et al. Leaf classification using multiple feature analysis based on semi-supervised clustering
Yue et al. Sift-based image super-resolution
Mennesson et al. Elementary block extraction for mobile image search
CN111382287A (zh) 一种图片的搜索方法、装置、存储介质及电子设备
Yasmin et al. Content based image retrieval based on color: A survey
CN110321966B (zh) 一种加快图书相似性分析速度的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200207

Termination date: 20201021