CN113850274A - 一种基于hog特征及dmd的图像分类方法 - Google Patents

一种基于hog特征及dmd的图像分类方法 Download PDF

Info

Publication number
CN113850274A
CN113850274A CN202111084915.1A CN202111084915A CN113850274A CN 113850274 A CN113850274 A CN 113850274A CN 202111084915 A CN202111084915 A CN 202111084915A CN 113850274 A CN113850274 A CN 113850274A
Authority
CN
China
Prior art keywords
image
data
classified
weight vector
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111084915.1A
Other languages
English (en)
Inventor
陈劭元
冯立辉
陈子健
卢继华
辛喆
武祎
聂振钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202111084915.1A priority Critical patent/CN113850274A/zh
Publication of CN113850274A publication Critical patent/CN113850274A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于HOG特征及DMD的图像分类方法,属于图像分类技术领域。所述图像分类方法,包括对图像进行基于颜色的动态模式分解得到的显著色彩矩阵提取HOG特征,得到提取特征后的同类图片,之后将同类图片进行模型训练,得到新的权重向量和分离距离,最后对于待分类的图片进行分类。所述方法对于小样本图像、单一样本图像的识别准确率高;对具有复杂背景的图像识别准确率高;算法时间复杂度和空间复杂度低;所述方法避免神经网络结果选择问题和局部最小值问题;算法对于高维、非线性分类问题具有很好的泛化性。

Description

一种基于HOG特征及DMD的图像分类方法
技术领域
本发明涉及一种基于HOG特征及DMD的图像分类方法,属于图像分类技术领域。
背景技术
方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。相比于其他特征提取方式,HOG特征具有良好的几何不变性和光学不变性而被广泛应用于图像识别领域。
动态模式分解(Dynamic mode decomposition,DMD)是一种由数据驱动的方法,其不需要将高度复杂的系统准确分解成各自相干的时空结构方程,而是使用随时间增长、衰减和振荡的相干结构来求解或近似系统。其中的相干结构也被称为DMD模态。DMD将系统转换成各个模态的叠加,每个模态的强度都由与之对应的特征值来表示。DMD的优势在于尽管DMD模态和特征值的数学过程是线性的,但其通过叠加表示或者近似表示的系统确可以是非线性的,因此大大降低了运算成本。
DMD最初由Schmid在2010发表的文章《Dynamic mode decomposition ofnumerical and experimental data》中提出,并被广泛应用于分析非线性系统动力学中。DMD还被用来预测系统未来状态、自然语言处理、显著区域检测等领域。DMD受到了Koopman-operator分析的启发,因为其能够提供流体动力学系统中的非线性的动态本质信息而在流体领域被广泛应用。
DMD被广泛用于处理实时的动态数据,但利用其强大的分析能力,使其处理静态图像成为可能。将静态图像灰度矩阵进行DMD,将其分解成各个模态并叠加,形成低秩矩阵和稀疏矩阵,并将稀疏矩阵进行后续的分类识别,达到图像分类的目标。其中低秩矩阵表示图像中待识别目标的干扰背景,稀疏矩阵表示待识别目标。通过DMD可以将图像中的待识别目标进行突显,并消除背景干扰。
支持向量机(support vector machines,SVM)是一种二分类模型,包括一类支持向量机和二类支持向量机。传统SVM模型为线性分类器且模型是定义在特征空间上的最大间隔线性分类器。SVM的学习策略为间隔最大化,本质为一个求解凸二次规划问题,也等价于正则化合页损失函数最小化问题。
相较于二类支持向量机,基于DMD及随机傅里叶特征变换的图像分类方法模型类似于一类支持向量机(one-class SVM)模型,该模型在训练时只需一种类型的数据,且将原点看做与提供的训练集不同的另一类数据。该模型进行训练不需要同时提供带有正标签(positive label,PL)的数据和带有负标签(negative label,NL)的数据。与二类支持向量机模型相比,一类支持向量机模型更适合应用于异常检测、单训练样本识别等实际问题。
对于处理非线性二分类问题,SVM应用核函数,通过一个非线性变换将输入空间(欧式或某离散空间)对应到一个特征空间(希尔伯特空间),从而使得输入空间中的超曲平面模型对应到特征空间中的超平面模型,这样将二分类的学习任务通过在特征空间中求取线性SVM来完成。然而,由于映射函数无法显示表示,导致特征空间的维度无法明确确定,从而使得特征空间的维度通常很高,甚至达到无穷维度。这样就大大加深了SVM算法的时间复杂度,导致基于映射函数(核函数)的SVM无法满足快速处理大量数据的需求。
针对于SVM处理非线性问题时产生的高维特征空间问题,基于DMD及随机傅里叶特征变换的图像分类方法采取随机傅里叶特征变换(Random Fourier FeaturesTransformation,RFFT)替换SVM中的核函数。通过找到一个新的映射函数近似映射函数,找到新的显示表达的,且维度可控的映射函数。因此在新的特征空间中训练线性学习器时,认为:控制特征空间维度,进而控制时间复杂度和计算复杂度,在大规模数据集上能有效提高计算效率。
在图像分类领域的分类方法主要有:最邻近算法(K-nearest Neighbour,KNN)、支持向量机(Support Vector Machine,SVM)、BP神经网络(Back Propagation NeuralNetwork,BPNN)以及卷积神经网络(Convolutional Neural Network,CNN)。其中,KNN算法需要存储所有训练数据在预测时进行计算,其训练时间很短,但预测时间较长。KNN分类器更适合低维度数据,在图像分类中,大多数图像都属于高维度数据,包含大量像素,因此KNN算法在图像分类中预测时间较长,分类准确度较低。SVM分类器相比于KNN分类器更适合处理高维度数据,但是由于其自身算法的局限性,导致其需要大量时间来处理大批量图像数据,且在核函数选择上也没有统一的标准,需要根据经验进行判断,从而导致了算法在准确度和时间复杂度上的不理想。BPNN算法具有较强的非线性映射能力且具有高度的自学习和自适应能力,CNN算法在处理高维数据上优势更大,二者的图像分类准确率都很高,但都存在训练时间较长,训练结果难以收敛于全局最小值而出现局部极小化问题等缺点,从而导致二者在图像分类领域的高时间复杂度和计算复杂度。
本发明的目的是致力于解决上述算法在时间复杂度和算法复杂度较高的技术缺陷,同时保证较高的分类准确率。在分类准确度方面,一种基于HOG特征及DMD的图像分类方法与SVM、BPNN、CNN的准确率相当;然而,在复杂度方面,一种基于HOG特征及DMD的图像分类方法的优势凸显:该方法具有极低的运算复杂度,进而导致算法时间延迟极低,这使得该方法更适合处理海量的图像或非图像数据,适用于样本数量有限或小样本情况下的分类与识别。在处理小样本图像时,尤其针对单一样本图像,一种基于HOG特征及DMD的图像分类方法在建立模型上相较于其他算法的数据量需求更低。因此,一种基于HOG特征及DMD的图像分类方法在图像分类领域具有十分显著的优势。
发明内容
本发明的目的在于常见分类算法对于小样本图像分类、单一样本图像分类准确率较低、时间复杂度较高的技术缺陷,提出了一种基于HOG特征及DMD的图像分类方法。
为达到上述目的,采取如下技术方案:
所述基于HOG特征及DMD的图像分类方法,包括如下步骤:
步骤1、对训练图像进行基于颜色的动态模式分解,得到训练图像显著矩阵;
步骤2、基于步骤1得到的显著色彩矩阵提取HOG特征,得到提取特征后的同类图像;
步骤3、将同类图像特征进行训练,得到训练好的分类模型参数;
其中,分类模型参数包括权重向量和分离间隔;且权重向量,记为wnew,表示特征空间分离面的单位法向量;分离距离,记为ρ,ρ为分离面和坐标原点的距离;
步骤3、具体为:
步骤3.1、对于图像的HOG特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合z;
其中,随机傅里叶特征变换计算公式为(1):
Figure BDA0003265220750000051
其中,z(xi)表示数据集合z中第i个数据,该数据由xi经公式(1)的随机傅里叶特征变换得到;xi为图像特征数据且其维度为1×d,表明每个图像特征数据包括d个种类的特征,i的变化范围为1到n且n为数据集合z中的数据个数,σ为核带宽,hu为随机生成的矩阵,矩阵中元素hu服从高斯分布,且hu的维度为d×1,下标u的取值范围为1到dRF/2;dRF为随机傅里叶特征变换的维度,T代表转置;
步骤3.2、从数据集合z中随机选择一个数据w0作为初始权重向量并赋值给权重向量w;
步骤3.3、基于权重向量w通过黄金分割线搜索计算分离距离ρ;
步骤3.4、对于wz-ρ小于0的数据点进行聚类,再求平均后得到平均权重向量;
其中,平均权重向量记为wm
步骤3.5、通过随机梯度下降法选择w和wm间新的权重向量wnew,并将wnew赋值给w;
步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的wnew,将此wnew记为最优权重向量w*
其中,S的取值范围为大于15且小于30;
步骤3.7、根据黄金分割线搜索计算出最优权重向量w*对应的最优分离间隔ρ*
其中,最优权重向量w*以及最优分离间隔ρ*为训练好的分类模型参数;
其中,S的取值范围为大于15且小于50,基本趋于稳定的条件为w的模差值小于K;
其中,K的取值范围为小于等于0.01;
步骤4、对于待分类图像进行分类,具体包括如下子步骤:
步骤4.1、对待分类图像进行预处理,得到预处理后的待分类图像;
步骤4.2、对预处理后的待分类图像进行特征提取,得到待分类图像的特征;
步骤4.3、基于待分类图像的特征进行随机傅里叶特征变换,得到特征测试集Z;
步骤4.4、根据步骤3得到的wnew、ρ和步骤4.3得到的随机傅里叶特征测试集Z计算wnew Z-ρ的值,记为P;
其中,P的维数为1×nt;nt为特征测试集Z中元素对应的待分类图像的数量;
步骤4.5、根据步骤4.4得到的P值进行判断;
其中,P值>0,待分类图像与训练图像是同类图像;P值<0,待分类图像与训练图像是异类图像;
步骤4.5、根据步骤4.4得到P的元素值进行判断,具体为:若P(v)≥0,则特征测试集Z中第v个元素对应的待分类图像与训练图像是同类图像;否则,若P(v)<0,则特征测试集Z中第v个元素对应的待分类图像与训练图像是异类图像;
其中,v的取值范围为1到nt
有益效果
本发明所述的一种基于HOG特征及DMD的图像分类方法,与现有技术相比,具有如下有益效果:
1.对于小样本图像、单一样本图像的识别准确率高;
2.对于具有复杂背景的图像识别准确率高;
3.算法时间复杂度和空间复杂度低;
4.算法避免神经网络结果选择问题和局部最小值问题;
5.算法对于高维、非线性分类问题具有很好的泛化性。
附图说明
图1是本发明一种基于HOG特征及DMD的图像分类方法的流程图;
图2是本发明一种基于HOG特征及DMD的图像分类方法及实施例1中Iris图像数据集的示意图;
图3是本发明一种基于HOG特征及DMD的图像分类方法及实施例4中鱼类图像数据集的示意图。
具体实施方式
下面结合附图和实施例对本发明所述的一种基于HOG特征及DMD的图像分类方法做进一步说明和详细描述。
实施例1
本实例详细阐述了发明一种基于HOG特征及DMD的图像分类方法在植物图像分类情况下的具体实施与分类结果。图1是基于HOG特征及DMD的图像分类方法的流程图。
本实例的数据集来源于UCI数据库中的Iris数据集,Iris数据集包括三类鸢尾花图像,每类数据量为50;图2为Iris数据集中的一幅图像。
该数据集中的数据,是已经提取特征的数据,得到Iris图像数据xi,n是数据量,为150;d是特征维度,为4;
应用本发明所述方法,则直接从步骤3开始实施,具体为:
步骤3.1、对于10个同类Iris图像(任选Iris图像中的一类数据集)特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合z;
其中,随机傅里叶特征变换计算公式为(2):
Figure BDA0003265220750000091
其中,z(xi)表示数据集合z中第i个数据,该数据由xi经公式(2)的随机傅里叶特征变换得到;xi为图像特征数据且其维度为1×d,表明每个图像特征数据包括d个种类的特征,i的变化范围为1到n且n为数据个数,σ为核带宽,本实例中σ的值为0.5;hu为随机生成的矩阵,矩阵中元素hu服从高斯分布,且hu的维度为d×1,下标u的取值范围为1到dRF/2;dRF为随机傅里叶特征变换的维度,本实例中dRF的值为2000;
此步骤将数据维度人为控制在2000维度,避免了传统机械学习中采用核函数从而导致维度过高并且无法控制的问题,大大降低了算法时间复杂度和空间复杂度。
步骤3.2、从数据集合z中随机选择一个数据w0作为初始权重向量并赋值给权重向量w;
步骤3.3、通过黄金分割线搜索计算分离距离ρ;
步骤3.4、对于wz-ρ小于0的数据点进行聚类,再求平均后得到平均权重向量;
其中,平均权重向量记为wm
步骤3.5、通过随机梯度下降法选择w和wm间新的权重向量wnew,并将wnew赋值给w;
步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的wnew
其中,S的取值范围为大于15且小于30;
步骤4、对剩余的140张Iris图像进行分类,具体包括如下子步骤:
步骤4.1、对剩余的140张Iris图像进行预处理,得到预处理后的待分类图像;
步骤4.2、对预处理后的图像进行特征提取,得到图像的特征;
步骤4.3、基于图像的特征进行随机傅里叶特征变换,得到随机傅里叶特征变换的结果Z;
步骤4.4、根据步骤3得到的wnew、ρ和步骤4.3得到的随机傅里叶特征变换结果Z计算wnew Z-ρ的值,记为P;
步骤4.5、根据步骤4.4得到的P值进行判断;
其中,P值>0,待分类图像与训练图像是同类图像;P值<0,待分类图像与训练图像是异类图像;
至此,经过步骤1到步骤4,就完成了对于图像的分类操作。
其中,三类Iris数据的同类分类准确率分别为90%、83%、90%,异类分类准确率为100%。相比于传统机械学习算法例如SVM,KNN等,准确率总体提升20%;相比于BP神经网络,卷积神经网络等神经网络算法,准确率总体提升5%,可以看出该算法对于小样本图像、单一样本图像、具有复杂背景图像的准确率高;同时避免了算法避免神经网络结果选择问题和局部最小值问题,对于高维、非线性分类问题具有很好的泛化性;
实施例2
本实例详细阐述了发明一种基于HOG特征及DMD的图像分类方法在声纳图像分类情况下具体实施时的分类方法与结果。
本实例的数据集来源于UCI数据库中的sonar数据集,sonar数据集包括两类声纳图像,从岩石表面返回的声纳图像为97个样本,从金属表面返回的声纳图像为111个样本;
该数据集中的数据,是已经提取完特征的数据,得到sonar图像数据xi,n是数据量,为208;d是特征维度,为60;
应用本发明所述方法,则直接从步骤3开始实施,具体为:
步骤3.1、对于40个同类sonar图像(任选sonar图像中的一类数据集)特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合z;
其中,随机傅里叶特征变换计算公式为(3):
Figure BDA0003265220750000121
其中,z(xi)表示数据集合z中第i个数据,该数据由xi经公式(3)的随机傅里叶特征变换得到;xi为图像特征数据且其维度为1×d,表明每个图像特征数据包括d个种类的特征,i的变化范围为1到n且n为数据个数,σ为核带宽,本实例中σ的值为0.5;hu为随机生成的矩阵,矩阵中元素hu服从高斯分布,且hu的维度为d×1,下标u的取值范围为1到dRF/2;dRF为随机傅里叶特征变换的维度,本实例中dRF的值为2000;
此步骤将数据维度人为控制在2000维度,避免了传统机械学习中采用核函数从而导致维度过高并且无法控制的问题,大大降低了算法时间复杂度和空间复杂度。
步骤3.2、从数据集合z中随机选择一个数据w0作为初始权重向量并赋值给权重向量w;
步骤3.3、通过黄金分割线搜索计算分离距离ρ;
步骤3.4、对于wz-ρ小于0的数据点进行聚类,再求平均后得到平均权重向量;
其中,平均权重向量记为wm
步骤3.5、通过随机梯度下降法选择w和wm间新的权重向量wnew,并将wnew赋值给w;
步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的wnew
其中,S的取值范围为大于15且小于30;
步骤4、对于待分类的sonar图像进行分类,具体包括如下子步骤:
步骤4.1、对待分类sonar图像进行预处理,得到预处理后的待分类sonar图像;
步骤4.2、对预处理后的待分类sonar图像进行特征提取,得到待分类sonar图像的特征;
步骤4.3、基于待分类sonar图像的特征进行随机傅里叶特征变换,得到随机傅里叶特征变换的结果Z;
步骤4.4、根据步骤3得到的wnew、ρ和步骤4.3得到的随机傅里叶特征变换结果Z计算wnew Z-ρ的值,记为P;
步骤4.5、根据步骤4.4得到的P值进行判断;
其中,P值>0,待分类图像与训练图像是同类图像;P值<0,待分类图像与训练图像是异类图像;
至此,经过步骤1到步骤4,就完成了对于图像的分类操作。
其中,整体分类准确率高于95%。相比于传统机械学习算法例如SVM,KNN等,准确率总体提升15%;相比于BP神经网络,卷积神经网络等神经网络算法,准确率总体提升5%,可以看出该算法对于小样本图像、单一样本图像、具有复杂背景图像的准确率高;同时避免了算法避免神经网络结果选择问题和局部最小值问题,对于高维、非线性分类问题具有很好的泛化性;
各算法准确率如表2所示:
表2各算法准确率统计表
算法 同类准确率 异类准确率
本发明方法 ≥95% ≥95%
SVM ≥82% ≥92%
KNN ≥80% ≥90%
BP神经网络 ≥92% ≥89%
卷积神经网络 ≥92% ≥90%
实施例3
本实例详细阐述了发明一种基于HOG特征及DMD的图像分类方法在海洋生物图像分类情况下具体实施时的分类方法与结果。
本实例的数据集为两种鱼类图片,每类图片包括100张样本,图3中的3a和3b为该数据集的示意图。
应用本发明所述方法,具体为:
步骤1、对该数据集的全部图像进行基于颜色的动态模式分解;
步骤1、具体为:
步骤1.1、将彩色图像在RGB色彩空间中分别转换成YUV色彩空间、CIELab色彩空间和YCbCr色彩空间,得到基于上述色彩空间的色度信息(a,b,U,V,Cb,Cr);
步骤1.2、对色度信息(a,b,U,V,Cb,Cr)进行矢量化,形成mn×1个向量,每个向量包含对应于每个色彩空间的像素数据;
其中,m×n为彩色图像的尺寸;
步骤1.3、将上述色彩空间进行结合,分别生成矩阵X1和矩阵X2
其中,矩阵X1=(a,U,Cb),矩阵X2=(b,V,Cr);
步骤1.4、基于上述矩阵X1和矩阵X2,构建色彩矩阵
Figure BDA0003265220750000151
和矩阵
Figure BDA0003265220750000152
其中,色彩矩阵
Figure BDA0003265220750000153
色彩矩阵
Figure BDA0003265220750000154
色彩矩阵
Figure BDA0003265220750000155
和矩阵
Figure BDA0003265220750000156
的维度为mn×4;
步骤1.5、基于步骤1.4中建立的色彩矩阵
Figure BDA0003265220750000157
Figure BDA0003265220750000158
建立关系矩阵A;
其中
Figure BDA0003265220750000159
Figure BDA00032652207500001510
为时序矩阵
Figure BDA00032652207500001511
的广义逆矩阵;
步骤1.6、对步骤1.4建立的时序矩阵
Figure BDA00032652207500001512
进行奇异值分解;
其中,时序矩阵
Figure BDA00032652207500001513
通过奇异值分解得到的U和V是酉矩阵,Σ是对角矩阵,
V*是矩阵V的伴随矩阵;
步骤1.7、基于步骤1.4中建立的时序矩阵
Figure BDA00032652207500001514
步骤1.5建立的关系矩阵A、步骤1.6中得到的U矩阵得到近似关系矩阵
Figure BDA00032652207500001515
其中
Figure BDA00032652207500001516
U*是矩阵U的伴随矩阵;
步骤1.8、基于步骤1.7得到的近似关系矩阵
Figure BDA00032652207500001517
进行特征分解,得到特征值λ和特征向量ω以及由特征向量组成的矩阵Q;
步骤1.9、基于步骤1.4中建立的时序矩阵
Figure BDA00032652207500001518
步骤1.6中得到的U矩阵和Σ矩阵和步骤1.8得到的矩阵Q建立动态模式分解的模态
Figure BDA00032652207500001519
其中DMD模态
Figure BDA00032652207500001520
其中
Figure BDA00032652207500001521
是矩阵Σ的广义逆矩阵;
步骤1.10、基于步骤1.9得到的DMD模态建立稀疏矩阵和低秩矩阵:
Figure BDA0003265220750000161
其中,r为使用到的模态
Figure BDA0003265220750000162
的个数,
Figure BDA0003265220750000163
为动态模式分解对应的模态;αj
Figure BDA0003265220750000164
对应的系数,ωj实部对应动态模式分解基函数的增长或衰减,虚部对应动态模式分解的震荡,p为低秩模式。
步骤1.11、基于步骤1.10得到的稀疏矩阵和低秩矩阵建立显著色彩矩阵
Figure BDA0003265220750000165
其中
Figure BDA0003265220750000166
w为稀疏矩阵的权重系数;
步骤2、基于步骤1.11得到的显著色彩矩阵提取HOG特征,得到提取特征后的同类图像;
步骤3、将同类图像进行模型训练,得到新的权重向量和分离距离;
其中,训练得到的权重向量,记为wnew,且wnew为特征空间的分离面的单位法向量;训练得到的分离距离,记为ρ,ρ为分离面和坐标原点的距离;
步骤3、具体为:
步骤3.1、对于80个同类鱼类图像(任选鱼类图像中的一类数据集)特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合z;
其中,随机傅里叶特征变换计算公式为(5):
Figure BDA0003265220750000171
其中,z(xi)表示数据集合z中第i个数据,该数据由xi经公式(4)的随机傅里叶特征变换得到;xi为图像特征数据且其维度为1×d,表明每个图像特征数据包括d个种类的特征,i的变化范围为1到n且n为数据个数,σ为核带宽,本实例中σ的值为0.5;hu为随机生成的矩阵,矩阵中元素hu服从高斯分布,且hu的维度为d×1,下标u的取值范围为1到dRF/2;dRF为随机傅里叶特征变换的维度,本实例中dRF的值为2000;
此步骤将数据维度人为控制在2000维度,避免了传统机械学习中采用核函数从而导致维度过高并且无法控制的问题,大大降低了算法时间复杂度和空间复杂度。
步骤3.2、从数据集合z中随机选择一个数据w0作为初始权重向量并赋值给权重向量w;
步骤3.3、通过黄金分割线搜索计算分离距离ρ;
步骤3.4、对于wz-ρ小于0的数据点进行聚类,再求平均后得到平均权重向量;
其中,平均权重向量记为wm
步骤3.5、通过随机梯度下降法选择w和wm间新的权重向量wnew,并将wnew赋值给w;
步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的wnew
其中,S的取值范围为大于15且小于30;
步骤4、对待分类的鱼类图像进行分类,具体包括如下子步骤:
步骤4.1、对待分类的鱼类图像进行预处理,得到预处理后的待分类图像;
步骤4.2、对预处理后的图像进行特征提取,得到图像的特征;
步骤4.3、基于图像的特征进行随机傅里叶特征变换,得到随机傅里叶特征变换的结果Z;
步骤4.4、根据步骤3得到的wnew、ρ和步骤4.3得到的随机傅里叶特征变换结果Z计算wnew Z-ρ的值,记为P;
步骤4.5、根据步骤4.4得到的P值进行判断;
其中,P值>0,待分类图像与训练图像是同类图像;P值<0,待分类图像与训练图像是异类图像;
至此,经过步骤1到步骤4,就完成了对于图像的分类操作。
其中,分类正确率整体高于93%。相比于传统机械学习算法例如SVM,KNN等,准确率总体提升23%;相比于BP神经网络,卷积神经网络等神经网络算法,准确率总体提升8%,可以看出该算法对于小样本图像、单一样本图像、复杂背景图像具有更高的准确率;同时避免了算法避免神经网络结果选择问题和局部最小值问题,对于高维、非线性分类问题具有很好的泛化性;
各算法准确率如表3所示:
表3各算法准确率统计表
算法 同类准确率 异类准确率
本发明方法 ≥93% ≥93%
SVM ≥72% ≥75%
KNN ≥70% ≥71%
BP神经网络 ≥83% ≥80%
卷积神经网络 ≥85% ≥87%
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (8)

1.一种基于HOG特征及DMD的图像分类方法,其特征在于:包括如下步骤:
步骤1、对训练图像进行基于颜色的动态模式分解,得到训练图像显著矩阵;
步骤2、基于步骤1得到的显著色彩矩阵提取HOG特征,得到提取特征后的同类图像;
步骤3、将同类图像特征进行训练,得到训练好的分类模型参数;
其中,分类模型参数包括权重向量和分离间隔;且权重向量,记为wnew,表示特征空间分离面的单位法向量;分离距离,记为ρ,ρ为分离面和坐标原点的距离;
步骤3、具体为:
步骤3.1、对于图像的HOG特征进行随机傅里叶特征变换,得到随机傅里叶特征变换后的数据集合z;
步骤3.2、从数据集合z中随机选择一个数据w0作为初始权重向量并赋值给权重向量w;
步骤3.3、基于权重向量w通过黄金分割线搜索计算分离距离ρ;
步骤3.4、对于wz-ρ小于0的数据点进行聚类,再求平均后得到平均权重向量;
其中,平均权重向量记为wm
步骤3.5、通过随机梯度下降法选择w和wm间新的权重向量wnew,并将wnew赋值给w;
步骤3.6、重复步骤3.3至步骤3.5,直至S次迭代后,得到趋于稳定的wnew,将此wnew记为最优权重向量w*
步骤3.7、根据黄金分割线搜索计算出最优权重向量w*对应的最优分离间隔ρ*
其中,最优权重向量w*以及最优分离间隔ρ*为训练好的分类模型参数;
步骤4、对于待分类图像进行分类,具体包括如下子步骤:
步骤4.1、对待分类图像进行预处理,得到预处理后的待分类图像;
步骤4.2、对预处理后的待分类图像进行特征提取,得到待分类图像的特征;
步骤4.3、基于待分类图像的特征进行随机傅里叶特征变换,得到特征测试集Z;
步骤4.4、根据步骤3得到的wnew、ρ和步骤4.3得到的随机傅里叶特征测试集Z计算wnewZ-ρ的值,记为P;
步骤4.5、根据步骤4.4得到的P值进行判断,具体为:根据步骤4.4得到P的元素值进行判断,具体为:若P(v)≥0,则特征测试集Z中第v个元素对应的待分类图像与训练图像是同类图像;否则,若P(v)<0,则特征测试集Z中第v个元素对应的待分类图像与训练图像是异类图像。
2.根据权利要求1所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤3.1中,随机傅里叶特征变换计算公式为(1):
Figure FDA0003265220740000021
其中,z(xi)表示数据集合z中第i个数据,该数据由xi经公式(1)的随机傅里叶特征变换得到;xi为图像特征数据且其维度为1×d,表明每个图像特征数据包括d个种类的特征,i的变化范围为1到n且n为数据集合z中的数据个数,σ为核带宽,hu为随机生成的矩阵,矩阵中元素hu服从高斯分布,且hu的维度为d×1,下标u的取值范围为1到dRF/2;dRF为随机傅里叶特征变换的维度,T代表转置。
3.根据权利要求2所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤3.6中,S的取值范围为大于15且小于30。
4.根据权利要求3所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤3.7中,S的取值范围为大于15且小于50。
5.根据权利要求4所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤3.7中,基本趋于稳定的条件为w的模差值小于K。
6.根据权利要求5所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤3.7中,K的取值范围为小于等于0.01。
7.根据权利要求6所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤4.4中,P的维数为1×nt;nt为特征测试集Z中元素对应的待分类图像的数量。
8.根据权利要求7所述的一种基于HOG特征及DMD的图像分类方法,其特征在于:步骤4.5中,v的取值范围为1到nt
CN202111084915.1A 2021-09-16 2021-09-16 一种基于hog特征及dmd的图像分类方法 Pending CN113850274A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111084915.1A CN113850274A (zh) 2021-09-16 2021-09-16 一种基于hog特征及dmd的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111084915.1A CN113850274A (zh) 2021-09-16 2021-09-16 一种基于hog特征及dmd的图像分类方法

Publications (1)

Publication Number Publication Date
CN113850274A true CN113850274A (zh) 2021-12-28

Family

ID=78974293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111084915.1A Pending CN113850274A (zh) 2021-09-16 2021-09-16 一种基于hog特征及dmd的图像分类方法

Country Status (1)

Country Link
CN (1) CN113850274A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022863A (zh) * 2022-07-15 2022-09-06 北京理工大学 一种基于AmBC的应急通信信道估计与检测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101631694B1 (ko) * 2015-08-24 2016-06-21 수원대학교산학협력단 HOG-PCA 특징과 RBFNNs 패턴분류기를 이용한 보행자 검출 방법
WO2018010434A1 (zh) * 2016-07-13 2018-01-18 华为技术有限公司 一种图像分类方法及装置
US20180041823A1 (en) * 2016-08-02 2018-02-08 Pindrop Security, Inc. Call classification through analysis of dtmf events
US20180101738A1 (en) * 2016-10-06 2018-04-12 Smr Patents S.A.R.L. Object detection and classification with fourier fans
CN107965828A (zh) * 2017-10-30 2018-04-27 珠海格力电器股份有限公司 抽油烟机的吸风状态控制方法和抽油烟机
CN110692006A (zh) * 2017-05-30 2020-01-14 卡尔蔡司显微镜有限责任公司 用于生成和分析概览对比度图像的方法
US20210019654A1 (en) * 2019-07-19 2021-01-21 Google Llc Sampled Softmax with Random Fourier Features

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101631694B1 (ko) * 2015-08-24 2016-06-21 수원대학교산학협력단 HOG-PCA 특징과 RBFNNs 패턴분류기를 이용한 보행자 검출 방법
WO2018010434A1 (zh) * 2016-07-13 2018-01-18 华为技术有限公司 一种图像分类方法及装置
US20180041823A1 (en) * 2016-08-02 2018-02-08 Pindrop Security, Inc. Call classification through analysis of dtmf events
US20180101738A1 (en) * 2016-10-06 2018-04-12 Smr Patents S.A.R.L. Object detection and classification with fourier fans
CN110692006A (zh) * 2017-05-30 2020-01-14 卡尔蔡司显微镜有限责任公司 用于生成和分析概览对比度图像的方法
CN107965828A (zh) * 2017-10-30 2018-04-27 珠海格力电器股份有限公司 抽油烟机的吸风状态控制方法和抽油烟机
US20210019654A1 (en) * 2019-07-19 2021-01-21 Google Llc Sampled Softmax with Random Fourier Features

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115022863A (zh) * 2022-07-15 2022-09-06 北京理工大学 一种基于AmBC的应急通信信道估计与检测方法
CN115022863B (zh) * 2022-07-15 2023-07-14 北京理工大学 一种基于AmBC的应急通信信道估计与检测方法

Similar Documents

Publication Publication Date Title
Zeng et al. Traffic sign recognition using kernel extreme learning machines with deep perceptual features
CN107679453B (zh) 基于支持向量机的天气雷达电磁干扰回波识别方法
CN109919241B (zh) 基于概率模型和深度学习的高光谱未知类别目标检测方法
CN112528928B (zh) 一种基于自注意力深度网络的商品识别方法
Tang et al. Traffic sign recognition using complementary features
CN109145964B (zh) 一种实现图像颜色聚类的方法和系统
Cevikalp et al. Face recognition based on videos by using convex hulls
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN110766016A (zh) 一种基于概率神经网络的喷码字符识别方法
CN115527072A (zh) 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法
Wang et al. Research on face recognition technology based on PCA and SVM
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
Juwita et al. Batik pattern identification using GLCM and artificial neural network backpropagation
Mei et al. A novel framework for container code-character recognition based on deep learning and template matching
CN113936148A (zh) 一种基于随机傅里叶特征变换的图像分类方法
Ghadhban et al. Segments interpolation extractor for finding the best fit line in Arabic offline handwriting recognition words
CN113850274A (zh) 一种基于hog特征及dmd的图像分类方法
Panigrahi et al. Evaluations of fractal geometry and invariant moments for shape classification of corn germplasm
CN109886160A (zh) 一种非限定条件下的人脸识别方法
Mohammed et al. Proposed approach for automatic underwater object classification
Feng et al. Rapid ship detection method on movable platform based on discriminative multi-size gradient features and multi-branch support vector machine
CN112270404A (zh) 一种基于ResNet64网络的紧固件产品鼓包缺陷的检测结构及其方法
CN117372332A (zh) 一种基于改进YOLOv7模型的织物瑕疵检测方法
Jubair et al. A simplified method for handwritten character recognition from document image
Promsuk et al. Numerical Reader System for Digital Measurement Instruments Embedded Industrial Internet of Things.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination