CN113592030B - 基于复值奇异谱分析的图像检索方法和系统 - Google Patents

基于复值奇异谱分析的图像检索方法和系统 Download PDF

Info

Publication number
CN113592030B
CN113592030B CN202110944224.8A CN202110944224A CN113592030B CN 113592030 B CN113592030 B CN 113592030B CN 202110944224 A CN202110944224 A CN 202110944224A CN 113592030 B CN113592030 B CN 113592030B
Authority
CN
China
Prior art keywords
matrix
value
complex
time domain
singular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110944224.8A
Other languages
English (en)
Other versions
CN113592030A (zh
Inventor
李彩君
凌永权
李瑞麟
周雪玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202110944224.8A priority Critical patent/CN113592030B/zh
Publication of CN113592030A publication Critical patent/CN113592030A/zh
Application granted granted Critical
Publication of CN113592030B publication Critical patent/CN113592030B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于复值奇异谱分析的图像检索方法和系统,属于图像检索技术领域。本发明使用人工特征的方法,避免了深度卷积神经网络需要大量数据和计算量大的问题,现有的人工特征使用整张图片的特征值来代表图片特征不够全面,本技术方案首先在预处理步骤提取图像边缘信息,通过图像中图案边缘形状可以有效的辨识和区分图像中的物体,高效的进行图片表示,并且边缘信息作为图像特征大大减少了所需的存储空间,节约检索过程的运算资源;本技术方案在检索过程中融合奇异值特征和直方图特征,同时,奇异值的特征具有旋转不变性和移动不变性,能够进一步提高检索的准确性和鲁棒性。

Description

基于复值奇异谱分析的图像检索方法和系统
技术领域
本发明涉及图像检索技术领域,更具体地,涉及基于复值奇异谱分析的图像检索方法。
背景技术
在大量的图像中搜索出与输入图像最相近的图片,时效性和准确率都是需要考虑的指标。如今的研究方向可以分为两类,一类是特征工程,一类是特征学习。特征工程主要指的是人工特征,即用一种特定的描述符来描述图像,如尺度不变特征变换(SIFT)、方向梯度直方图(HOG),特征学习主要指深度学习,如深度卷积神经网络(DCNN)。
深度卷积神经网络近年来在计算机视觉中引起了广泛的关注,因为其准确率表现优异,但是它非常依赖训练数据,当训练数据改变时,训练结果会变得很差;而且训练需要大量的数据量,如此大量的数据必定需要大量的计算资源和计算时间。
一种有效的基于算法的图像检索方法有基于DFT描述符的边缘表示方法,先使用DFT对图像边缘信息进行描述,因为它是一个旋转不变的描述符号,所以具有很强的鲁棒性。此外还有改进的DFT方法,即DFrFT,通过旋转时频面,可以得到基于不同旋转角度的不同变换,由于每个训练图像可以使用多个旋转角度,因此可用的训练图像总数相比于传统的DFT方法的字典构造大大简化。由于可以从不同的旋转频域获得更多的信息,因此可以获得更好的图像检索性能。但它仅在频域内进行描述。因此,用于执行图像检索的信息非常有限。
另一种有效的基于算法的图像检索方法是奇异值分解。如一种基于离散小波变换和奇异值分解的特征提取的图像检索算法,该方法利用奇异值分解法从区域划分模型中提取每个区域的特征。
公开号为CN105469074A,公开日:2016-04-06,一种基于奇异值分解的人脸识别算法,该算法提高了基于奇异值分解的人脸识别算法的泛用性,但是该方法是对整个图像做奇异值分析,仅提取的是图像的纹理特征,检索准确度较低。
发明内容
本发明为克服上述技术问题,提供一种计算资源开销较小,且检索准确度较高的基于复值奇异谱分析的图像检索方法。
本发明技术方案如下:
基于复值奇异谱分析的图像检索方法,包括步骤:
S1:对所有训练样本图像进行预处理,提取边缘信息,得到归一化的时域序列
Figure BDA0003216062130000021
Figure BDA0003216062130000022
S2:对时域序列
Figure BDA0003216062130000023
和/>
Figure BDA0003216062130000024
通过复值的奇异谱分析进行特征提取,得到奇异值特征向量f1和直方图特征向量f2
S3:使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,调节分类器参数得到最优分类模型;
S4:使用最优分类模型对输入的图片进行分类,得到该图片的分类结果,并通过计算两张图片的欧氏距离来找出最相近的图片,运用公式:D(q,d)=||fq-fd||2,其中fq是要搜索的图片的特征向量,fd是这一类别数据集的其中一张图片的特征向量。设置距离D的范围,在这个小范围内的图片则是与搜索图片最相近图片。
本技术方案使用人工特征的方法,避免了深度卷积神经网络需要大量数据和计算量大的问题,现有的人工特征使用整张图片的特征值来代表图片特征不够全面,本技术方案首先在预处理步骤提取图像边缘信息,通过图像中图案边缘形状可以有效的辨识和区分图像中的物体,高效的进行图片表示,并且边缘信息作为图像特征大大减少了所需的存储空间,节约检索过程的运算资源;本技术方案在检索过程中融合奇异值特征和直方图特征,同时,奇异值的特征具有旋转不变性和移动不变性,能够进一步提高检索的准确性和鲁棒性。
进一步地,步骤S1所述预处理包括步骤:
S11:对图像进行灰度转化,得到灰度图;
S12:对灰度图提取图像边缘信息,得到边缘信息图;
S13:获取边缘信息图中边缘点的笛卡尔坐标x值和y值,将所有边缘点排列成时域序列xq和yq
S14:将时域序列xq和yq进行归一化处理,得到归一化时域序列
Figure BDA0003216062130000025
和/>
Figure BDA0003216062130000026
上述技术方案,对训练样本进行预处理,目的是使所有图片转换成统一的形式,避免因形式不同造成差异影响分类效果。
进一步地,步骤S14所述归一化处理包括主体位置归一化、像素点个数归一化、大小归一化,具体地,所述归一化处理方法为:
S141:进行主体位置归一化,将图像中物体的质心放在原点,对时域序列xq和yq进行质心归一化,得到质心归一化后的时域序列
Figure BDA0003216062130000031
和/>
Figure BDA0003216062130000032
S142:进行像素点个数归一化,使用以下公式对时域序列
Figure BDA0003216062130000033
和/>
Figure BDA0003216062130000034
分别进行余弦变换:/>
Figure BDA0003216062130000035
式中F(u)是第u个余弦变换的系数,u是广义频率变量,u=1,2,3…,N-1,f(x)是时域N点序列,x=0,1,…,N-1;由此将信号从时域转换到频域上,为了使所有边缘信息图中的边缘像素点数量相同,在得到的频域末尾补上零,使得总像素点数量为第一常数值;然后利用以下公式进行反离散余弦变换:
Figure BDA0003216062130000036
再将信号从频域变回时域,得到像素点归一化后的时域序列/>
Figure BDA0003216062130000037
和/>
Figure BDA0003216062130000038
S143:进行大小归一化,分别对时域序列
Figure BDA0003216062130000039
和/>
Figure BDA00032160621300000310
的每个点除以列向量/>
Figure BDA00032160621300000311
和列向量
Figure BDA00032160621300000312
的二范数,使用公式:/>
Figure BDA00032160621300000313
其中/>
Figure BDA00032160621300000314
Figure BDA00032160621300000315
是每个像素点的坐标的相对比例值,xi和yi分别表示第i个像素点的x轴和y轴坐标值,再乘以第二常数值,得到归一化时域序列/>
Figure BDA00032160621300000316
和/>
Figure BDA00032160621300000317
进一步地,步骤S2所述对时域序列
Figure BDA00032160621300000318
和/>
Figure BDA00032160621300000319
通过复值的奇异谱分析进行特征提取包括步骤:
S21:将时域序列
Figure BDA00032160621300000320
代入到复值x=a+bj的实部a,将时域序列/>
Figure BDA00032160621300000321
代入到复值x=a+bj的虚部b,构造出复值的时域序列xc,所述时域序列xc为复值一维时域信号;
S22:对时域序列xc按照固定长度进行截取,构建轨迹矩阵X;
S23:利用轨迹矩阵X和奇异值分解计算得出奇异值,并构造初等矩阵Xi
S24:将轨迹矩阵X表示为矩阵分量Xk相加的形式;
S25:将复值的二维矩阵分量Xk重构回一维的复值序列;
S26:特征提取,利用步骤S23所述的奇异值构建奇异值特征向量f1;利用步骤S25所述复值序列构建直方图特征向量f2
进一步地,步骤S22所述构建轨迹矩阵X的步骤包括:
S221:构建长度为L的滑动窗口,范围限定为2<L<N-1,N是时域序列长度,Xw=(xi,…,xi+L-1)T(1≤i≤K),其中K=N-L+1;
S222:通过滑动长度为L的窗口对原序列进行截取,可以得到轨迹矩阵X,X为一个L*K的复值的矩阵,
Figure BDA0003216062130000041
轨迹矩阵X的每一列都是通过长度为L的滑动窗口对原时间序列进行截取的部分序列片段,矩阵X的副对角元素都相等,轨迹矩阵X是一个复值的汉克尔矩阵。
进一步地,步骤S23所述构造初等矩阵Xi的步骤包括:
S231:构造矩阵S=XXT,其中XT是轨迹矩阵X的转置矩阵;
S232:对矩阵S进行特征值分解,则矩阵S可以表示为以下形式:S=XXT=UΛUT,其中U是由S的特征向量组成的酉矩阵,同时也是矩阵X的左酉矩阵,Λ是一个对角阵,对角线上的元素是S的特征向量对应的特征值,并对得到特征值进行降序排列得到λi(i=1,…,d;d=min{L,K}),同时得到矩阵X的右酉矩阵V的行向量
Figure BDA0003216062130000042
是矩阵X的奇异值,Ui是矩阵X的左酉矩阵U的列向量;
S233:将轨迹矩阵X表示为X=X1+…+Xd,其中
Figure BDA0003216062130000043
为构造出的初等矩阵。
进一步地,步骤S24所述将轨迹矩阵X表示为矩阵分量Xk相加的形式的步骤包括:
S241:将轨迹矩阵X表示为L个矩阵分量Xk
S242:对以上得到的L个矩阵分量Xk进行分组整合,把集合{1,2....,L}分为M个子集合,并将其称为{1},..,{M}。
进一步地,步骤S25所述重构回一维的复值序列的方法为:
通过对角平均对矩阵分量Xk进行反汉克尔化操作,进行信号重构;
重构的计算公式为:
Figure BDA0003216062130000051
其中
Figure BDA0003216062130000052
为第k个分量的第t个元素,矩阵分量Xk中的元素记为xa,b,其中a和b表示在矩阵Xk中的行和列,重构的具体计算为:
Figure BDA0003216062130000053
由此就将复值的二维矩阵分量Xk重构回一维的复值序列。
进一步地,步骤S26所述特征提取包括步骤:
S261:利用步骤S23得到降序排列的奇异值
Figure BDA0003216062130000054
所有的奇异值/>
Figure BDA0003216062130000055
组成奇异值向量/>
Figure BDA0003216062130000056
然后对奇异值/>
Figure BDA0003216062130000057
进行归一化,使用公式:/>
Figure BDA0003216062130000058
新的/>
Figure BDA0003216062130000059
组成归一化后的奇异值向量/>
Figure BDA00032160621300000510
为了使奇异值的元素变化趋势更明显,本文还对每个奇异值使用如下公式操作:
Figure BDA00032160621300000511
所有的f1,i组成奇异值特征向量f1
S262:利用步骤S25的重构方法,选取矩阵分量Xk中的第二个分量进行重构得到一个一维的第二分量复值时间序列,将实部的数值设为所述第二分量复值时间序列x轴的值,虚部的数值设为第二分量复值时间序列y轴的值,从而得到多个点的二维分布;然后使用双变量直方图来统计这些点的分布情况,x轴每个bin的长度设为0.04,y轴每个bin的长度设为0.04,可得上述所有点都落在一个十字交叉的三维直方图中,提取出这两条线上的点数分布个数,然后将这两条线上的分布横向拼接起来作为直方图特征向量f2
基于复值奇异谱分析的图像检索系统,所述系统包括:预处理模块、特征提取模块、模型训练模块、图像分类模块;
所述预处理模块对所有训练样本图像进行预处理,得到归一化的时域序列
Figure BDA0003216062130000061
Figure BDA0003216062130000062
所述特征提取模块对时域序列/>
Figure BDA0003216062130000063
和/>
Figure BDA0003216062130000064
进行特征提取,得到奇异值特征向量f1和直方图特征向量f2;所述模型训练模块使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,然后模型训练模块调节分类器参数得到最优分类模型;所述图像分类模块使用最优分类模型对输入的图片进行分类,得到该图片的分类结果,并检索出与之相近的图片。
与现有技术相比,本发明技术方案的有益效果是:本发明使用人工特征的方法,避免了深度卷积神经网络需要大量数据和计算量大的问题,现有的人工特征使用整张图片的特征值来代表图片特征不够全面,本技术方案首先在预处理步骤提取图像边缘信息,通过图像中图案边缘形状可以有效的辨识和区分图像中的物体,高效的进行图片表示,并且边缘信息作为图像特征大大减少了所需的存储空间,节约检索过程的运算资源;本技术方案在检索过程中融合奇异值特征和直方图特征,同时,奇异值的特征具有旋转不变性和移动不变性,能够进一步提高检索的准确性和鲁棒性。
附图说明
图1为基于复值奇异谱分析的图像检索方法的流程图;
图2为基于复值奇异谱分析的图像检索系统架构图。
具体实施方式
为清楚地说明本发明基于复值奇异谱分析的图像检索方法,结合实例和附图对本发明作进一步说明,但不应以此限制本发明的保护范围。
实施例1
基于复值奇异谱分析的图像检索方法,如图1所示,所述方法包括以下步骤:
S1:对所有训练样本图像进行预处理,提取边缘信息,得到归一化的时域序列
Figure BDA0003216062130000071
Figure BDA0003216062130000072
S2:对时域序列
Figure BDA0003216062130000073
和/>
Figure BDA0003216062130000074
通过复值的奇异谱分析进行特征提取,得到奇异值特征向量f1和直方图特征向量f2
S3:使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,调节分类器参数得到最优分类模型;
S4:使用最优分类模型对输入的图片进行分类,得到该图片的分类结果,并通过计算两张图片的欧氏距离来找出最相近的图片,运用公式:D(q,d)=||fq-fd||2,其中fq是要搜索的图片的特征向量,fd是这一类别数据集的其中一张图片的特征向量。设置距离D的范围,在这个小范围内的图片则是与搜索图片最相近图片。
本技术方案使用人工特征的方法,避免了深度卷积神经网络需要大量数据和计算量大的问题,现有的人工特征使用整张图片的特征值来代表图片特征不够全面,本技术方案首先在预处理步骤提取图像边缘信息,通过图像中图案边缘形状可以有效的辨识和区分图像中的物体,高效的进行图片表示,并且边缘信息作为图像特征大大减少了所需的存储空间,节约检索过程的运算资源;本技术方案在检索过程中融合奇异值特征和直方图特征,同时,奇异值的特征具有旋转不变性和移动不变性,能够进一步提高检索的准确性和鲁棒性。
实施例2
基于复值奇异谱分析的图像检索方法流程图如图1所示,包括以下步骤:
S1:对所有训练样本图像进行预处理,提取图像边缘信息,得到每一幅图像归一化的时域序列
Figure BDA0003216062130000075
和/>
Figure BDA0003216062130000076
具体包括步骤:
S11:对图像进行灰度转化,得到灰度图;
S12:对灰度图提取图像边缘信息,得到边缘信息图;本实施例采用Sobel边缘检测算法提取图像边缘信息。
S13:获取边缘信息图中边缘点的笛卡尔坐标x值和y值,将所有边缘点排列成时域序列xq和yq;具体方法是:
先找到x轴和y轴坐标值均最小的像素点作为初始点,然后向周围搜索距离最近的点,使用二范数来计算距离,使用公式为:
Figure BDA0003216062130000081
其中x0和y0上一个点的坐标,x和y是剩余点的坐标,通过计算查找出d最小时的x和y坐标,又将该x和y坐标作为新的初始点,向周围搜索距离最近的点,以此类推,将所有边缘点排列成两个时域序列xq和yq
S14:将时域序列xq和yq进行归一化处理,得到归一化时域序列
Figure BDA0003216062130000082
和/>
Figure BDA0003216062130000083
具体地,所述归一化处理方法具体为:
S141:进行主体位置归一化,将图像中物体的质心放在原点,对时域序列xq和yq进行质心归一化,得到质心归一化后的时域序列
Figure BDA0003216062130000084
和/>
Figure BDA0003216062130000085
S142:进行像素点个数归一化,使用以下公式对时域序列
Figure BDA0003216062130000086
和/>
Figure BDA0003216062130000087
分别进行余弦变换:/>
Figure BDA0003216062130000088
式中F(u)是第u个余弦变换的系数,u是广义频率变量,u=1,2,3…,N-1,f(x)是时域N点序列,x=0,1,…,N-1;由此将信号从时域转换到频域上,为了使所有边缘信息图中的边缘像素点数量相同,在得到的频域末尾补上零,使得总像素点数量为第一常数值;然后利用以下公式进行反离散余弦变换:
Figure BDA0003216062130000089
再将信号从频域变回时域,得到像素点归一化后的时域序列/>
Figure BDA00032160621300000810
和/>
Figure BDA00032160621300000811
本实施例中,所述第一常数值为1080;
S143:进行大小归一化,分别对时域序列
Figure BDA00032160621300000812
和/>
Figure BDA00032160621300000813
的每个点除以列向量/>
Figure BDA00032160621300000814
和列向量
Figure BDA00032160621300000815
的二范数,使用公式:/>
Figure BDA00032160621300000816
其中/>
Figure BDA00032160621300000817
是每个像素点的坐标的相对比例值,xi和yi分别表示第i个像素点的x轴和y轴坐标值,再乘以第二常数值,得到归一化时域序列/>
Figure BDA00032160621300000818
和/>
Figure BDA00032160621300000819
本实施例中,所述第二常数值为1000;
S2:对时域序列
Figure BDA00032160621300000820
和/>
Figure BDA00032160621300000821
通过复值的奇异谱分析进行特征提取,得到奇异值特征向量f1和直方图特征向量f2;具体为:
S21:将时域序列
Figure BDA00032160621300000822
代入到复值x=a+bj的实部a,将时域序列/>
Figure BDA00032160621300000823
代入到复值x=a+bj的虚部b,构造出复值的时域序列xc,所述时域序列xc为复值一维时域信号;
S22:对时域序列xc按照固定长度进行截取,构建轨迹矩阵X;具体为:
S221:构建长度为L的滑动窗口,范围限定为2<L<N-1,N是时域序列长度,Xw=(xi,…,xi+L-1)T(1≤i≤K),其中K=N-L+1;
S222:通过滑动长度为L的窗口对原序列进行截取,可以得到轨迹矩阵X,X为一个L*K的复值的矩阵,
Figure BDA0003216062130000091
轨迹矩阵X的每一列都是通过长度为L的滑动窗口对原时间序列进行截取的部分序列片段,矩阵X的副对角元素都相等,轨迹矩阵X是一个复值的汉克尔矩阵;
S23:利用轨迹矩阵X和奇异值分解计算得出奇异值,并构造初等矩阵Xi;具体为:
S231:构造矩阵S=XXT,其中XT是轨迹矩阵X的转置矩阵;
S232:对矩阵S进行特征值分解,则矩阵S可以表示为以下形式:S=XXT=UΛUT,其中U是由S的特征向量组成的酉矩阵,同时也是矩阵X的左酉矩阵,Λ是一个对角阵,对角线上的元素是S的特征向量对应的特征值,并对得到特征值进行降序排列得到λi(i=1,…,d;d=min{L,K}),同时得到矩阵X的右酉矩阵V的行向量
Figure BDA0003216062130000092
是矩阵X的奇异值,Ui是矩阵X的左酉矩阵U的列向量;
S233:将轨迹矩阵X表示为X=X1+…+Xd,其中
Figure BDA0003216062130000093
为构造出的初等矩阵。
S24:将轨迹矩阵X表示为矩阵分量Xk相加的形式;具体为:
S241:将轨迹矩阵X表示为L个矩阵分量Xk
S242:对以上得到的L个矩阵分量Xk进行分组整合,本实施例的分组数目和分组原则为:分为L组,每组为一个矩阵分量。分组后的每个矩阵分量记为Xk,把集合{1,2....,L}分为M个子集合,并将其称为{1},..,{M}。
S25:将复值的二维矩阵分量Xk重构回一维的复值序列;具体为:
通过对角平均对矩阵分量Xk进行反汉克尔化操作,进行信号重构;
重构的计算公式为:
Figure BDA0003216062130000101
其中
Figure BDA0003216062130000102
为第k个分量的第t个元素,矩阵分量Xk中的元素记为xa,b,其中a和b表示在矩阵Xk中的行和列,重构的具体计算为:
Figure BDA0003216062130000103
由此就将复值的二维矩阵分量Xk重构回一维的复值序列。
S26:特征提取,利用步骤S23所述的奇异值构建奇异值特征向量f1;利用步骤S25所述复值序列构建直方图特征向量f2;具体为:
S261:利用步骤S23得到降序排列的奇异值
Figure BDA0003216062130000104
所有的奇异值/>
Figure BDA0003216062130000105
组成奇异值向量/>
Figure BDA0003216062130000106
然后对奇异值/>
Figure BDA0003216062130000107
进行归一化,使用公式:/>
Figure BDA0003216062130000108
新的/>
Figure BDA0003216062130000109
组成归一化后的奇异值向量/>
Figure BDA00032160621300001010
为了使奇异值的元素变化趋势更明显,本文还对每个奇异值使用如下公式操作:
Figure BDA0003216062130000111
所有的f1,i组成奇异值特征向量f1
S262:利用步骤S25的重构方法,选取矩阵分量Xk中的第二个分量进行重构得到一个一维的第二分量复值时间序列,将实部的数值设为所述第二分量复值时间序列x轴的值,虚部的数值设为第二分量复值时间序列y轴的值,从而得到多个点的二维分布;然后使用双变量直方图来统计这些点的分布情况,x轴每个bin的长度设为0.04,y轴每个bin的长度设为0.04,可得上述所有点都落在一个十字交叉的三维直方图中,提取出这两条线上的点数分布个数,然后将这两条线上的分布横向拼接起来作为直方图特征向量f2,本实施例中,在得到奇异值特征向量f1和直方图特征向量f2后进行特征融合,融合方式为将奇异值特征向量f1和直方图特征向量f2按顺序拼接起来得到汇总特征值f。
S3:使用支持向量机分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,调节分类器参数得到最优分类模型;本实施例中,调节分类器参数的方法为十次交叉验证;
S4:将待查询图片输入最优分类模型,得到分类结果;
本实施例中,最优分类模型首先对待查询图片进行分类,得到该图片所属的类别;进一步在这个类别中进行检索,通过计算两张图片的距离来找出最相近的图片,运用公式:
D(q,d)=||fq-fd||2
其中fq是要搜索的图片的特征向量,fd是这一类别中数据集的特征向量。
设置距离D的范围,在这个小范围内的图片则是与搜索图片最相近图片。
实施例3
基于复值奇异谱分析的图像检索系统,系统架构图如图2所示,所述系统包括:预处理模块、特征提取模块、模型训练模块、图像分类模块;
所述预处理模块对所有训练样本图像进行预处理,得到归一化的时域序列
Figure BDA0003216062130000112
Figure BDA0003216062130000113
所述特征提取模块对时域序列/>
Figure BDA0003216062130000114
和/>
Figure BDA0003216062130000115
进行特征提取,得到奇异值特征向量f1和直方图特征向量f2;所述模型训练模块使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,然后模型训练模块调节分类器参数得到最优分类模型;所述图像分类模块使用最优分类模型对输入的图片进行分类,得到该图片的分类结果,并检索出与之相近的图片。

Claims (9)

1.基于复值奇异谱分析的图像检索方法,其特征在于,所述方法包括以下步骤:
S1:对所有训练样本图像进行预处理,提取边缘信息,得到归一化的时域序列
Figure QLYQS_1
和/>
Figure QLYQS_2
S2:对时域序列
Figure QLYQS_3
和/>
Figure QLYQS_4
通过复值的奇异谱分析进行特征提取,得到奇异值特征向量f1和直方图特征向量f2,包括:
S21:将时域序列
Figure QLYQS_5
代入到复值x=a+bj的实部a,将时域序列/>
Figure QLYQS_6
代入到复值x=a+bj的虚部b,构造出复值的时域序列xc,所述时域序列xc为复值一维时域信号;
S22:对时域序列xc按照固定长度进行截取,构建轨迹矩阵X;
S23:利用轨迹矩阵X和奇异值分解计算得出奇异值,并构造初等矩阵Xi
S24:将轨迹矩阵X表示为矩阵分量Xk相加的形式;
S25:将复值的二维矩阵分量Xk重构回一维的复值序列;
S26:特征提取,利用步骤S23所述的奇异值构建奇异值特征向量f1;利用步骤S25所述复值序列构建直方图特征向量f2
S3:使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,调节分类器参数得到最优分类模型;
S4:使用最优分类模型对输入的图片进行分类,得到该图片的分类结果,并通过计算两张图片的欧氏距离确定相似图片,设置距离D的范围,运用公式:D(q,d)=||fq-fd||2,其中fq是要搜索的图片的特征向量,fd是这一类别数据集的其中一张图片的特征向量。
2.根据权利要求1所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S1所述预处理包括步骤:
S11:对图像进行灰度转化,得到灰度图;
S12:对灰度图提取图像边缘信息,得到边缘信息图;
S13:获取边缘信息图中边缘点的笛卡尔坐标x值和y值,将所有边缘点排列成时域序列xq和yq
S14:将时域序列xq和yq进行归一化处理,得到归一化时域序列
Figure QLYQS_7
和/>
Figure QLYQS_8
3.根据权利要求2所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S14所述归一化处理包括主体位置归一化、像素点个数归一化、大小归一化,具体地,所述归一化处理方法为:
S141:进行主体位置归一化,将图像中物体的质心放在原点,对时域序列xq和yq进行质心归一化,得到质心归一化后的时域序列
Figure QLYQS_9
和/>
Figure QLYQS_10
S142:进行像素点个数归一化,使用以下公式对时域序列
Figure QLYQS_11
和/>
Figure QLYQS_12
分别进行余弦变换:
Figure QLYQS_13
式中F(u)是第u个余弦变换的系数,u是广义频率变量,u=1,2,3…,N-1,f(x)是时域N点序列,x=0,1,…,N-1;由此将信号从时域转换到频域上,为了使所有边缘信息图中的边缘像素点数量相同,在得到的频域末尾补上零,使得总像素点数量为第一常数值;然后利用以下公式进行反离散余弦变换:
Figure QLYQS_14
再将信号从频域变回时域,得到像素点归一化后的时域序列/>
Figure QLYQS_15
和/>
Figure QLYQS_16
S143:进行大小归一化,分别对时域序列
Figure QLYQS_19
和/>
Figure QLYQS_20
的每个点除以列向量/>
Figure QLYQS_22
和列向量/>
Figure QLYQS_18
的二范数,使用公式:/>
Figure QLYQS_21
其中/>
Figure QLYQS_23
是每个像素点的坐标的相对比例值,xi和yi分别表示第i个像素点的x轴和y轴坐标值,再乘以第二常数值,得到归一化时域序列/>
Figure QLYQS_24
和/>
Figure QLYQS_17
4.根据权利要求1所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S22所述构建轨迹矩阵X的步骤包括:
S221:构建长度为L的滑动窗口,范围限定为2<L<N-1,N是时域序列长度,Xw=(xi,…,xi+L-1)T(1≤i≤K),其中K=N-L+1;
S222:通过滑动长度为L的窗口对原序列进行截取,得到轨迹矩阵X,X为一个L*K的复值的矩阵,
Figure QLYQS_25
轨迹矩阵X的每一列都是通过长度为L的滑动窗口对原时间序列进行截取的部分序列片段,矩阵X的副对角元素都相等,轨迹矩阵X是一个复值的汉克尔矩阵。
5.根据权利要求4所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S23所述构造初等矩阵Xi的步骤包括:
S231:构造矩阵S=XXT,其中XT是轨迹矩阵X的转置矩阵;
S232:对矩阵S进行特征值分解,则矩阵S表示为以下形式:S=XXT=UΛUT,其中U是由S的特征向量组成的酉矩阵,同时也是矩阵X的左酉矩阵,Λ是一个对角阵,对角线上的元素是S的特征向量对应的特征值,并对得到特征值进行降序排列得到λi(i=1,…,d;d=min{L,K}),同时得到矩阵X的右酉矩阵V的行向量
Figure QLYQS_26
是矩阵X的奇异值,Ui是矩阵X的左酉矩阵U的列向量;
S233:将轨迹矩阵X表示为X=X1+…+Xd,其中
Figure QLYQS_27
为构造出的初等矩阵。
6.根据权利要求5所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S24所述将轨迹矩阵X表示为矩阵分量Xk相加的形式的步骤包括:
S241:将轨迹矩阵X表示为L个矩阵分量Xk
S242:对以上得到的L个矩阵分量Xk进行分组整合,把集合{1,2....,L}分为M个子集合,并将其称为{1},..,{M}。
7.根据权利要求6所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S25所述重构回一维的复值序列的方法为:
通过对角平均对矩阵分量Xk进行反汉克尔化操作,进行信号重构;
重构的计算公式为:
Figure QLYQS_28
其中
Figure QLYQS_29
为第k个分量的第t个元素,矩阵分量Xk中的元素记为xa,b,其中a和b表示在矩阵Xk中的行和列,重构的具体计算为:
Figure QLYQS_30
由此就将复值的二维矩阵分量Xk重构回一维的复值序列。
8.根据权利要求7所述的基于复值奇异谱分析的图像检索方法,其特征在于,步骤S26所述特征提取包括步骤:
S261:利用步骤S23得到降序排列的奇异值
Figure QLYQS_31
所有的奇异值/>
Figure QLYQS_32
组成奇异值向量/>
Figure QLYQS_33
然后对奇异值/>
Figure QLYQS_34
进行归一化,使用公式:/>
Figure QLYQS_35
新的/>
Figure QLYQS_36
组成归一化后的奇异值向量λ,为了使奇异值的元素变化趋势更明显,本文还对每个奇异值使用如下公式操作:
Figure QLYQS_37
所有的f1,i组成奇异值特征向量f1
S262:利用步骤S25的重构方法,选取矩阵分量Xk中的第二个分量进行重构得到一个一维的第二分量复值时间序列,将实部的数值设为所述第二分量复值时间序列x轴的值,虚部的数值设为第二分量复值时间序列y轴的值,从而得到多个点的二维分布;然后使用双变量直方图来统计这些点的分布情况,x轴每个bin的长度设为0.04,y轴每个bin的长度设为0.04,可得上述所有点都落在一个十字交叉的三维直方图中,提取出这两条线上的点数分布个数,然后将这两条线上的分布横向拼接起来作为直方图特征向量f2
9.基于复值奇异谱分析的图像检索系统,应用权利要求1-8任一项所述方法,其特征在于,所述系统包括:预处理模块、特征提取模块、模型训练模块、图像分类模块;
所述预处理模块对所有训练样本图像进行预处理,得到归一化的时域序列
Figure QLYQS_38
和/>
Figure QLYQS_39
所述特征提取模块对时域序列/>
Figure QLYQS_40
和/>
Figure QLYQS_41
进行特征提取,得到奇异值特征向量f1和直方图特征向量f2;所述模型训练模块使用分类器对奇异值特征向量f1和直方图特征向量f2进行模型训练,得到初步分类模型,然后模型训练模块调节分类器参数得到最优分类模型;所述图像分类模块使用最优分类模型对输入的图片进行分类,得到该图片的分类结果。/>
CN202110944224.8A 2021-08-17 2021-08-17 基于复值奇异谱分析的图像检索方法和系统 Active CN113592030B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110944224.8A CN113592030B (zh) 2021-08-17 2021-08-17 基于复值奇异谱分析的图像检索方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110944224.8A CN113592030B (zh) 2021-08-17 2021-08-17 基于复值奇异谱分析的图像检索方法和系统

Publications (2)

Publication Number Publication Date
CN113592030A CN113592030A (zh) 2021-11-02
CN113592030B true CN113592030B (zh) 2023-06-20

Family

ID=78258319

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110944224.8A Active CN113592030B (zh) 2021-08-17 2021-08-17 基于复值奇异谱分析的图像检索方法和系统

Country Status (1)

Country Link
CN (1) CN113592030B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115546323B (zh) * 2022-08-31 2023-06-09 广东工业大学 一种基于球坐标主成分分析的图像压缩重构方法
CN117290640B (zh) * 2023-11-27 2024-01-26 天津领语未来智能科技有限公司 用于非线性信号处理的奇异谱谐波分解方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271874A (zh) * 2018-08-23 2019-01-25 广东工业大学 一种融合空间和光谱信息的高光谱图像特征提取方法
CN111310711A (zh) * 2020-03-03 2020-06-19 广东工业大学 基于二维奇异谱分析融合emd的人脸图像识别方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI394086B (zh) * 2008-04-18 2013-04-21 Everspeed Technology Ltd An Analytical Method of Digital Data and Its Application
US8117183B2 (en) * 2008-05-28 2012-02-14 Xerox Corporation Accurate content-based indexing and retrieval system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271874A (zh) * 2018-08-23 2019-01-25 广东工业大学 一种融合空间和光谱信息的高光谱图像特征提取方法
CN111310711A (zh) * 2020-03-03 2020-06-19 广东工业大学 基于二维奇异谱分析融合emd的人脸图像识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于张量分解融合RGB-D图像的物体识别;余霆嵩 等;《计算机工程与应用》;第55卷(第2期);第174-178 *

Also Published As

Publication number Publication date
CN113592030A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
Emeršič et al. Evaluation and analysis of ear recognition models: performance, complexity and resource requirements
Ali et al. A hybrid geometric spatial image representation for scene classification
CN111738143B (zh) 一种基于期望最大化的行人重识别方法
Nanni et al. Bioimage classification with handcrafted and learned features
CN113592030B (zh) 基于复值奇异谱分析的图像检索方法和系统
CN105608478B (zh) 一种图像的特征提取与分类联合方法及系统
Cai et al. Superpixel contracted neighborhood contrastive subspace clustering network for hyperspectral images
CN111753119A (zh) 一种图像搜索方法、装置、电子设备及存储介质
Luevano et al. A study on the performance of unconstrained very low resolution face recognition: Analyzing current trends and new research directions
Das et al. Hybrid descriptor definition for content based image classification using fusion of handcrafted features to convolutional neural network features
Pandey et al. ASRA: Automatic singular value decomposition-based robust fingerprint image alignment
Khalaf et al. Robust partitioning and indexing for iris biometric database based on local features
CN108388869B (zh) 一种基于多重流形的手写数据分类方法及系统
Mehraj et al. Human recognition using ear based deep learning features
Zhang et al. Robust ear recognition via nonnegative sparse representation of Gabor orientation information
CN111582142B (zh) 一种影像匹配方法及装置
CN112001231A (zh) 加权多任务稀疏表示的三维人脸识别方法、系统及介质
CN111488811A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
Mohan et al. Fast and accurate content based image classification and retrieval using Gaussian Hermite moments applied to COIL 20 and COIL 100
Li et al. POLSAR Target Recognition Using a Feature Fusion Framework Based on Monogenic Signal and Complex-Valued Nonlocal Network
Hussain et al. Gender recognition from face images with dyadic wavelet transform and local binary pattern
Vieira et al. Improving the classification of rotated images by adding the signal and magnitude information to a local texture descriptor
Jammula Content based image retrieval system using integrated ML and DL-CNN
Lee et al. Performance enhancement of the branch length similarity entropy descriptor for shape recognition by introducing critical points
Lin et al. Bayesian information criterion based feature filtering for the fusion of multiple features in high-spatial-resolution satellite scene classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant