CN113627555A - 一种图像分类的实现方法、装置、设备和介质 - Google Patents

一种图像分类的实现方法、装置、设备和介质 Download PDF

Info

Publication number
CN113627555A
CN113627555A CN202110947689.9A CN202110947689A CN113627555A CN 113627555 A CN113627555 A CN 113627555A CN 202110947689 A CN202110947689 A CN 202110947689A CN 113627555 A CN113627555 A CN 113627555A
Authority
CN
China
Prior art keywords
classified
vector
image
image classification
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110947689.9A
Other languages
English (en)
Inventor
罗步升
林志超
黄笑辉
张作刚
陈方
陈振辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202110947689.9A priority Critical patent/CN113627555A/zh
Publication of CN113627555A publication Critical patent/CN113627555A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像分类的实现方法、装置、设备和介质。该方法包括:获取待分类图像的特征向量,作为待分类特征向量;将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。本发明实施例解决了传统分类算法不能调整图像表示稀疏程度的问题,提高了图像分类准确率。

Description

一种图像分类的实现方法、装置、设备和介质
技术领域
本发明实施例涉及图像分类处理技术,尤其涉及一种图像分类的实现方法、装置、设备和介质。
背景技术
近年来,基于向量表示的图像分类方法的应用,已经在人脸识别和对象分类等任务中得到了广泛的研究,有效的图像向量表示在构建高性能的分类算法中至关重要。
传统的基于向量表示的图像分类算法不能在复杂的优化解中明确地避免负编码系数,基于非负表示的分类算法由于将编码系数中的负值置零,从而减小训练样本在测试样本表示过程中起到的负作用,一定程度上实现了编码的稀疏性。但是,这种稀疏程度是无法控制和调整的,从而降低了图像分类的准确率。
发明内容
本发明实施例提供一种图像分类的实现方法、装置、设备和介质,以实现对图像的精准、高效分类。
第一方面,本发明实施例提供了一种图像分类的实现方法,包括:
获取待分类图像的特征向量,作为待分类特征向量;
将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
第二方面,本发明实施例还提供了一种图像分类的实现装置,该装置包括:
特征向量获取模块,用于获取待分类图像的特征向量,作为待分类特征向量;
图像类别确定模块,用于将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
第三方面,本发明实施例还提供了一种图像分类的实现设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的图像分类的实现方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的图像分类的实现方法。
本发明实施例通过在基于非负表示的分类算法的目标函数的基础上新加入稀疏约束项,解决了基于非负表示的分类算法图像表示的稀疏度低且不易控制的问题,从而使非负相关的训练特征向量更多地参与模型分类计算,负相关的训练特征向量更少地参与模型分类计算,保证了稀疏拟合效果,提高了图像分类的准确率。
附图说明
图1为本发明实施例一提供的一种图像分类的实现方法的流程图;
图2为本发明实施例二提供的一种图像分类的实现方法的流程图;
图3为本发明实施例三提供的一种图像分类的实现装置的结构框图;
图4为本发明实施例四提供的一种图像分类的实现设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种图像分类的实现方法的流程图,本实施例可适用于通过改善图像分类模型的目标函数对图像进行分类的情况,该方法可以由本发明实施例中的图像分类的实现装置来执行,该装置可以采用软件和/或硬件的方式来实现。该装置可配置于计算设备中,本实施例提供的图像分类的实现方法具体包括如下步骤:
S110、获取待分类图像的特征向量,作为待分类特征向量。
可选的是,所述待分类图像可以是图像识别领域的数据图像,例如手写数字图像,也可以是某一时间段内街道监控设备拍摄的照片图像等等,所述待分类图像的数量可以是一个或多个,需要说明的是,所述待分类图像为不带标定分类结果的图像,其中,所述分类结果是对待分类图像标注的分类结果,例如区分为风景和人物,或可以区分为体育、娱乐、新闻和政治等分类。
其中,所述待分类图像的特征向量可以是所述待分类图像的像素调整矩阵转换为的一维向量,或采用卷积神经网络对所述待分类图像进行处理,并从全连接层输出所述待分类特征向量,其中,所述像素调整矩阵可以是对所述待分类图像的像素坐标进行调整。将待分类图像转换为向量或采用神经网络的方法对待分类图像进行处理得到待分类图像的特征向量,有助于计算机可以识别与处理以及通过提取重要信息,去除冗余信息,提高图像分类模型的分类性能。
S120、将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。
可选的是,所述图像分类模型可以是稀疏表示模型或非负表示模型。其中,稀疏表示模型是将所有已知类别的训练特征向量的集合对所述待分类特征向量进行稀疏表示,并预测所述待分类图像属于重构误差最小的类别。非负表示模型是对图像常规稀疏表示项进行非负约束,利用所有已知类别的训练特征向量的集合稀疏表示所述待分类特征向量,使所述图像分类模型选择正相关且同类别的训练特征向量的集合,并预测所述待分类图像属于重构误差最小的类别。其中,重构误差可以是所述图像分类模型输出和原始输入之间的2-范数平方误差或均方误差。
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。其中,所述稀疏约束项具有稀疏调整参数,所述稀疏调整参数是由所述图像分类模型的分类识别率确定的,可选的是,所述稀疏调整参数在0和1数值之间。通过确定所述稀疏调整参数保证了所述图像分类模型稀疏拟合效果,完成对待分类图像的高准确率分类。
其中,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,优选的是,所述目标函数的公式如下:
Figure BDA0003217376070000051
其中,s.t.s是使得目标函数满足稀疏表示向量s大于等于0的条件,y为待分类特征向量,y∈RD×1,R代表矩阵,D表示待分类特征向量的特征维度,X为所有类别训练特征向量的集合,X∈RD×N,N表示所述训练样本的总数量,X=[X1,X2,...,XC]由C类训练特征向量组成,C表示所述训练样本的类别数量,Xi为属于i类的训练特征向量的按列拼接矩阵,i为类别序号,其中,s=[S1,S2,...,SC]T为所述待分类特征向量采用每类训练特征向量进行表示的稀疏表示向量;Si为采用i类训练特征向量Xi的稀疏表示,
Figure BDA0003217376070000052
为所述常规稀疏表示项,2α||s||1为所述稀疏约束项,α是调整所述稀疏表示向量稀疏性的稀疏调整参数,
Figure BDA0003217376070000053
为向量2-范数的平方,||.||1为向量1-范数。
在上述操作中,具体的,所述特征维度是图像中特征向量的数量,对维度不作限制,可以为768、1024和4096。其中,X是训练样本的特征向量,一共有N个训练样本,N可以为25和100,对N不作限制,X中共C个类别的训练样本,C可以为5和10,对C不作限制。其中,s为待分类特征向量采用每类训练特征向量进行表示的稀疏表示向量,一共包含C个类别的稀疏表示向量,第i类的稀疏表示向量是所述待分类特征用第i类训练特征向量的拼接矩阵Xi进行的稀疏表示向量,
Figure BDA0003217376070000061
为所述待分类特征向量与C个类共N个训练样本的训练特征向量集合之间的重构误差,
Figure BDA0003217376070000062
为是用X的特征向量线性组合去表示待分类的特征向量y,其中,使用1-范数最小化获得线性表示系数的稀疏性,即稀疏表示向量的稀疏性。同时,所述图像分类模型的目标函数需满足s大于等于0的条件,保证获得的稀疏表示向量为非负,使所述图像分类模型在分类计算时选择正相关且同类别的训练特征向量的集合。保证了目标函数的鲁棒性和判别性,同时提高了图像分类的准确率。
其中,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,具体的,将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法(ADMM),基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别,明显提升所述图像分类模型的计算效率和迭代速度。
具体的,将所述待分类特征向量输入图像分类模型之前,需要确定所述稀疏调整参数,可选的是,将多个验证样本的验证特征向量输入图像分类模型,以输出分类结果,将输出的分类结果与所述验证样本的标注分类结果进行比对,以确定所述图像分类模型的分类识别率,根据所述分类识别率调整所述稀疏调整参数。
其中,所述验证样本是待分类的验证样本图像,所述验证特征向量可以是所述待分类的验证样本图像将像素调整矩阵转换为一维的向量,或采用卷积神经网络对所述待分类的验证样本图像进行处理,并从全连接层输出所述验证特征向量。其中,所述验证样本的数量可以为一个或多个,其中,所述稀疏调整参数α是需要调整的参数,α的范围可以是0-1之间的数值,示例性的,当验证样本的数量为多个的时候,首先,将所述多个验证特征向量分别输入图像分类模型进行第一轮分类验证,此时α可以取值为0.5,图像分类模型输出所有验证样本的分类准确率,并求平均,将平均分类准确率作为图像分类模型进行第一轮分类验证的最终分类识别率,然后,α可以取值为0.4、0.3、0.2、0.1、0.05和0.025,图像分类模型可以进行七轮分类验证,取七轮分类验证中最终分类识别率最大值所对应的α作为最优稀疏调整参数,在保证了图像分类模型的分类识别率的同时得到最优稀疏调整参数。
本实施例的技术方案,通过在基于非负表示的分类算法的目标函数的基础上新加入稀疏约束项,解决了基于非负表示的分类算法图像表示的稀疏度低且不易控制的问题,从而使非负相关的训练特征向量更多地参与模型分类计算,负相关的训练特征向量更少地参与模型分类计算,保证了稀疏拟合效果,提高了图像分类准确率。
在上述实施例的方案中,优选是将各向量转换至高维的核空间,其中,核空间为利用核函数将原始图像特征向量映射到高维特征的空间,需要说明的是,所述核空间为任意核空间。
实施例二
图2是本发明实施例二提供的一种图像分类的实现方法的流程图,本实施例在上述实施例的基础上进一步优化了图像分类的实现方法,如图2所示,优化后的图像分类的实现方法,主要包括如下步骤:
S210、获取待分类图像的特征向量,作为待分类特征向量。
S220、将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。
在上述操作中,具体的,由多个验证样本根据所述分类识别率调整所述稀疏调整参数α,并得到α的值后,可以将所述待分类特征向量输入图像分类模型,利用交替方向乘子法算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。其中,交替方向乘子法是一种求解具有可分离的凸优化问题的计算机框架,其中,凸优化问题是指在定义域内具有全局最优解的问题。
可选的,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量包括:
将所述图像分类模型的目标函数记为公式(1):
Figure BDA0003217376070000081
对于公式(1),采用交替方向乘子法对其进行优化,将所述图像分类模型的目标函数的公式转化为公式(2),如下:
Figure BDA0003217376070000082
其中,所述稀疏约束项中的s=z,z为引入的辅助变量;
将所述公式(2)的增广拉格朗日函数记为公式(3),如下:
Figure BDA0003217376070000091
其中,L为拉格朗日量,ρ>0为惩罚参数,δ为增广拉格朗日乘子,其中,所述增广拉格朗日乘子为变量;
将所述公式(3)展开化简得到公式(4),如下:
Lρ,s,z,δ=sTXTXs+ρsTs-2yTXs+2δTs-2ρsTz+ρzTz-2δTz+2α||z||1 (4)
固定变量z和δ,根据公式(4)得到所述待分类特征向量的稀疏表示向量s的封闭解st+1如下:
st+1=(XTX+ρI)-1·(XTy+ρztt) (5)
其中,I为单位矩阵,t为迭代次数,t=0,1,2,...,s0、z0和δ0的初始向量为零向量;
固定变量s和δ,根据公式(4)得到z的解zt+1如下:
Figure BDA0003217376070000092
固定变量s和z,更新拉格朗日乘子δ:
δt+1=δt+ρ(st+1-zt+1) (7)
其中,将st+1作为所述待分类特征向量的稀疏表示向量。
其中,需要迭代s、z和δ的求解步骤,直到满足所述图像分类模型的收敛条件或迭代次数超过预设阈值,其中,收敛条件可以是同时满足||st-zt||2≤tol、||st+1-st||2≤tol和||zt+1-zt||2≤tol,其中,tol>0是一个较小的公差值,从而求得最优的稀疏表示向量s。例如,可以将所述待分类特征向量y和所述所有类别的训练特征向量的集合X输入图像分类模型,将所述图像分类模型的目标函数的公式中s0、z0和δ0向量初始化为零向量,当t=0时,首先,根据公式(5)可计算出s1,然后,将s1和δ0代入公式(6),可计算出z1,最后,根据公式(7)可计算出δ1,完成第一次迭代计算过程,并得到了s1、z1和δ1。将z1和δ1代入公式(5)可计算出s2,然后,将s2和δ1代入公式(6)可计算出z2,最后,将s2和z2代入根据公式(7)可计算出δ2,完成第二次迭代过程,并得到了s2、z2和δ2。依次迭代s、z和δ的求解步骤,直到满足所述图像分类模型的收敛条件或迭代次数超过预设阈值时停止迭代,最终计算出所述稀疏表示向量s。采用所述交替方向乘子法对所述图像分类模型的目标函数进行优化计算,使所述图像分类模型中的优化问题可以转化为一个具有两个变量s和z的线性等式约束问题,能够明显提升所述图像分类模型的计算效率和迭代速度。
其中,将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。可选的是,所述图像分类模型旨在寻找所述待分类特征向量和所述所有已知类别训练特征向量的集合之间的最小重构误差,从而判定所述待分类特征向量所属的类别。优选的是,根据所述稀疏表示向量,通过计算所述待分类特征向量和所述所有已知类别训练特征向量的集合之间的重构误差,所述重构误差公式如下:
Figure BDA0003217376070000101
其中,可以根据所述i类训练特征向量Xi及所述待分类特征向量用所述稀疏表示向量计算出的重构误差,确定输入的所述待分类特征向量的类别,公式为:
id(y)=argminc{ei} (9)
其中,id(y)为所述待分类特征向量y的预测类别,即所述待分类特征向量类别属于重构误差最小的类别。
其中,将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。其中,所述待分类特征向量和所有类别训练特征向量的集合可以是根据核函数的内积计算直接得到的非线性变换的高维特征向量,其中,核函数可以为线性核函数、多项式核函数、径向基核函数和Hellinger核函数,但不限于这些核函数。例如,所述待分类特征向量y和训练特征向量X的特征维度都为1000维,假设存在一个核函数κ(X,y),并在高维特征空间中存在10000维的特征向量φ(X)和φ(y),κ(X,y)与φ(X)和φ(y)满足κ(X,y)=<φ(X),φ(y)>=φT(X)φ(y),其中,<φ(X),φ(y)>为φ(X)与φ(y)的内积,可以确定φ(X)和φ(y)是X和y在高维空间中的特征向量表示,即根据核函数的内积计算,可以将X和y映射到10000维的特征空间,并可以得到用来表示X和y的高维特征向量φ(X)和φ(y)。
优选的是,根据核函数的内积计算,所述图像分类模型的目标函数转化为如下:
Figure BDA0003217376070000111
其中,φ(y)为所述待分类特征向量y根据核函数的内积计算得到的新的待分类特征向量,φ(y)∈RK×1(D<K),其中,K表示新的待分类特征向量的的特征维度。其中,φ(X)为所述所有类别训练特征向量的集合X根据核函数的内积计算得到的新的训练特征向量的集合,φ(X)=[φ(X1),φ(X2),...,φ(XC)]∈RK×N(D<K),φ(Xi)为属于i类的新的训练特征向量的按列拼接矩阵。其中,
Figure BDA0003217376070000112
为新的的常规稀疏表示项,Si为采用i类新的训练特征向量φ(Xi)的稀疏表示。
可选的是,采用交替方向乘子法对公式(10)进行优化,转化为公式(11),如下:
Figure BDA0003217376070000121
其中,所述稀疏约束项中的s=z,z为引入的辅助变量;
将所述公式(11)的增广拉格朗日函数记为公式(12),如下:
Figure BDA0003217376070000122
其中,L为拉格朗日量,ρ>0为惩罚参数,δ为增广拉格朗日乘子,其中,所述增广拉格朗日乘子为变量;
将所述公式(12)展开化简得到公式(13),如下:
Lρ,s,z,δ=sTφT(X)φ(X)s+ρsTs-2φT(y)φ(X)s+2δTs-2ρsTz+ρzTz-2δTz+2α||z||1(13)
固定变量z和δ,根据公式(13)得到所述待分类特征向量的稀疏表示向量s的封闭解st+1如下:
st+1=(φT(X)φ(X)+ρI)-1·(φT(X)φ(y)+ρztt) (14)
其中,I为单位矩阵,t为迭代次数,t=0,1,2,...,s0、z0和δ0的初始向量为零向量;
固定变量s和δ,根据公式(13)可以得到z的解zt+1如下:
Figure BDA0003217376070000123
固定变量s和z,更新拉格朗日乘子δ:
δt+1=δt+ρ(st+1-zt+1) (16)
将st+1作为所述待分类特征向量的稀疏表示向量。
其中,需要迭代s、z和δ的求解步骤,直到满足所述图像分类模型的收敛条件或迭代次数超过预设阈值,其中,收敛条件可以是同时满足||st-zt||2≤tol、||st+1-st||2≤tol和||zt+1-zt||2≤tol,其中,tol>0是一个较小的公差值,从而求得最优的稀疏表示向量s。可选的是,根据所述稀疏表示向量,通过计算φ(X)和φ(y)之间的重构误差,所述重构误差公式如下:
Figure BDA0003217376070000131
其中,可以根据所述i类训练特征向量φ(Xi)及所述待分类特征向量用所述稀疏表示向量计算出的重构误差,确定输入的所述待分类特征向量的类别,公式为:
id(φ(y))=argminc{ei} (17)
其中,id(φ(y))为所述待分类特征向量φ(y)的预测类别,即所述待分类特征向量类别属于重构误差最小的类别。
本实施例的技术方案,通过采用了交替方向乘子算法对图像分类模型的目标函数进行优化计算,得到了全局最优的图像稀疏表示向量,并将输入的特征向量利用核函数映射为更高维的特征向量,解决了传统图像分类模型使用低维空间向量表示图像样本造成分类准确率低的问题,将原始图像特征映射到高维特征空间,提高了图像分类速率及准确率。
实施例三
图3为本发明实施例三提供的一种图像分类的实现装置的结构框图。该装置包括:特征向量获取模块310和图像类别确定模块320。
其中,特征向量获取模块310,用于获取待分类图像的特征向量,作为待分类特征向量;
图像类别确定模块320,用于将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
本发明实施例三提供的一种图像分类的实现装置,通过将待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。通过在基于非负表示的分类算法的目标函数的基础上新加入稀疏约束项,解决了基于非负表示的分类算法图像表示的稀疏度低且不易控制的问题,从而使非负相关的训练样本更多地参与模型训练,负相关的训练样本更少地参与模型训练,保证了稀疏拟合效果,提高了图像分类准确率。
上述装置中,可选的是,所述稀疏约束项具有稀疏调整参数,所述稀疏调整参数是由所述图像分类模型的分类识别率确定的。
上述装置中,可选的是,所述装置还包括:参数调整模块,用于将多个验证样本的验证特征向量输入图像分类模型,以输出分类结果;将输出的分类结果与所述验证样本的标注分类结果进行比对,以确定所述图像分类模型的分类识别率;根据所述分类识别率调整所述稀疏调整参数。
上述装置中,可选的是,特征向量获取模块310具体用于:对所述待分类图像,将像素调整矩阵转换为一维向量,作为所述待分类特征向量;或采用卷积神经网络对所述待分类图像进行处理,并从全连接层输出所述待分类特征向量。
上述装置中,可选的是,所述目标函数的公式如下:
Figure BDA0003217376070000151
其中:
s.t.s是使得目标函数满足稀疏表示向量s大于等于0的条件;
y为待分类特征向量,y∈RD×1,R代表矩阵,D表示待分类特征向量的特征维度;
X为所有类别训练特征向量的集合,X∈RD×N,N表示所述训练样本的总数量,X=[X1,X2,...,XC]由C类训练特征向量组成,C表示所述训练样本的类别数量,Xi为属于i类的训练特征向量的按列拼接矩阵,i为类别序号;
s=[S1,S2,...,SC]T为所述待分类特征向量采用每类训练特征向量进行表示的稀疏表示向量;Si为采用i类训练特征向量Xi的稀疏表示;
Figure BDA0003217376070000152
为所述常规稀疏表示项;
2α||s||1为所述稀疏约束项;
α是调整所述稀疏表示向量稀疏性的稀疏调整参数;
Figure BDA0003217376070000153
为向量2-范数的平方,||.||1为向量1-范数。
上述装置中,可选的是,图像类别确定模块320具体用于:将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。
本发明实施例所提供的图像分类的实现装置可执行本发明任意实施例所提供的图像分类的实现方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种图像分类的实现设备的结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的图像分类的实现方法对应的程序指令/模块(例如,特征向量获取模块310和图像类别确定模块320)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行计算设备的各种功能应用以及数据处理,即实现上述的图像分类的实现方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与计算设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种图像分类的实现方法,该方法包括:
获取待分类图像的特征向量,作为待分类特征向量;
将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的图像分类的实现方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像分类的实现方法,其特征在于,包括:
获取待分类图像的特征向量,作为待分类特征向量;
将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
2.根据权利要求1所述的方法,其特征在于,所述稀疏约束项具有稀疏调整参数,所述稀疏调整参数是由所述图像分类模型的分类识别率确定的。
3.根据权利要求2所述的方法,其特征在于,将所述待分类特征向量输入图像分类模型之前,还包括:
将多个验证样本的验证特征向量输入图像分类模型,以输出分类结果;
将输出的分类结果与所述验证样本的标注分类结果进行比对,以确定所述图像分类模型的分类识别率;
根据所述分类识别率调整所述稀疏调整参数。
4.根据权利要求1所述的方法,其特征在于,获取待分类图像的特征向量包括:
对所述待分类图像,将像素调整矩阵转换为一维向量,作为所述待分类特征向量;或
采用卷积神经网络对所述待分类图像进行处理,并从全连接层输出所述待分类特征向量。
5.根据权利要求1-4任一所述的方法,其特征在于,所述目标函数的公式如下:
Figure FDA0003217376060000021
其中:
s.t.s是使得目标函数满足稀疏表示向量s大于等于0的条件;
y为待分类特征向量,y∈RD×1,R代表矩阵,D表示待分类特征向量的特征维度;
X为所有类别训练特征向量的集合,X∈RD×N,N表示所述训练样本的总数量,X=[X1,X2,...,XC]由C类训练特征向量组成,C表示所述训练样本的类别数量,Xi为属于i类的训练特征向量的按列拼接矩阵,i为类别序号;
s=[S1,S2,...,SC]T为所述待分类特征向量采用每类训练特征向量进行表示的稀疏表示向量;Si为采用i类训练特征向量Xi的稀疏表示;
Figure FDA0003217376060000022
为所述常规稀疏表示项;
2α||s||1为所述稀疏约束项;
α是调整所述稀疏表示向量稀疏性的稀疏调整参数;
Figure FDA0003217376060000023
为向量2-范数的平方,||·||1为向量1-范数。
6.根据权利要求1所述的方法,其特征在于,将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别包括:
将所述待分类特征向量输入图像分类模型,利用交替方向乘子算法,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别。
7.根据权利要求6所述的方法,其特征在于,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量包括:
将所述图像分类模型的目标函数记为公式(1):
Figure FDA0003217376060000031
对于公式(1),采用交替方向乘子法对其进行优化,将所述图像分类模型的目标函数的公式转化为公式(2),如下:
Figure FDA0003217376060000032
其中,所述稀疏约束项中的s=z,z为引入的辅助变量;
将所述公式(2)的增广拉格朗日函数记为公式(3),如下:
Figure FDA0003217376060000033
其中,L为拉格朗日量,ρ>0为惩罚参数,δ为增广拉格朗日乘子;
将所述公式(3)展开化简得到公式(4),如下:
Lρ,s,z,δ=sTXTXs+ρsTs-2yTXs+2δTs-2ρsTz+ρzTz-2δTz+2α||z||1 (4)
固定变量z和δ,根据公式(4)得到所述待分类特征向量的稀疏表示向量s的封闭解st+1如下:
st+1=(XTX+ρI)-1·(XTy+ρztt) (5)
其中,I为单位矩阵,t为迭代次数,t=0,1,2,...,s0、z0和δ0的初始向量为零向量;
固定变量s和δ,根据公式(4)得到z的解zt+1如下:
Figure FDA0003217376060000034
固定变量s和z,更新拉格朗日乘子δ:
δt+1=δt+ρ(st+1-zt+1) (7)
将st+1作为所述待分类特征向量的稀疏表示向量。
8.一种图像分类的实现装置,其特征在于,包括:
特征向量获取模块,用于获取待分类图像的特征向量,作为待分类特征向量;
图像类别确定模块,用于将所述待分类特征向量输入图像分类模型,基于所述图像分类模型的目标函数计算所述待分类特征向量的稀疏表示向量,且根据所述稀疏表示向量确定所述待分类图像的类别;
其中,所述目标函数包括常规稀疏表示项和稀疏约束项,所述常规稀疏表示项用于确定所述待分类特征向量与所述图像分类模型的所有训练样本的训练特征向量之间的重构误差,所述稀疏约束项用于确定各所述训练特征向量之间的分类关系。
9.一种图像分类的实现设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的图像分类的实现方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的图像分类的实现方法。
CN202110947689.9A 2021-08-18 2021-08-18 一种图像分类的实现方法、装置、设备和介质 Pending CN113627555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110947689.9A CN113627555A (zh) 2021-08-18 2021-08-18 一种图像分类的实现方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110947689.9A CN113627555A (zh) 2021-08-18 2021-08-18 一种图像分类的实现方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN113627555A true CN113627555A (zh) 2021-11-09

Family

ID=78386320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110947689.9A Pending CN113627555A (zh) 2021-08-18 2021-08-18 一种图像分类的实现方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN113627555A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564107A (zh) * 2018-03-21 2018-09-21 温州大学苍南研究院 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法
CN108734658A (zh) * 2018-05-16 2018-11-02 四川大学 一种高分辨率图像的重建方法及系统
CN109190645A (zh) * 2017-11-24 2019-01-11 中国科学院电子学研究所苏州研究院 一种高阶高维图像数据的表示与分类方法
CN112115961A (zh) * 2020-07-02 2020-12-22 河海大学 一种基于稀疏图正则化的高光谱遥感影像分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190645A (zh) * 2017-11-24 2019-01-11 中国科学院电子学研究所苏州研究院 一种高阶高维图像数据的表示与分类方法
CN108564107A (zh) * 2018-03-21 2018-09-21 温州大学苍南研究院 基于原子拉普拉斯图正则化的半监督字典学习的样本类别归类方法
CN108734658A (zh) * 2018-05-16 2018-11-02 四川大学 一种高分辨率图像的重建方法及系统
CN112115961A (zh) * 2020-07-02 2020-12-22 河海大学 一种基于稀疏图正则化的高光谱遥感影像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯鑫等: "《红外与可见光图像融合算法分析与研究》", 30 April 2020 *
姚刚等: "稀疏子空间聚类的惩罚参数自调整交替方向法", 《稀疏子空间聚类的惩罚参数自调整交替方向法 *

Similar Documents

Publication Publication Date Title
CN109359725B (zh) 卷积神经网络模型的训练方法、装置、设备及计算机可读存储介质
EP4163831A1 (en) Neural network distillation method and device
CN109284411B (zh) 一种基于有监督超图离散化图像二值编码方法
CN111339818A (zh) 一种人脸多属性识别系统
CN112529068B (zh) 一种多视图图像分类方法、系统、计算机设备和存储介质
CN109325530B (zh) 一种图像分类方法、存储装置和处理装置
CN111223128A (zh) 目标跟踪方法、装置、设备及存储介质
US20230342606A1 (en) Training method and apparatus for graph neural network
US20240135698A1 (en) Image classification method, model training method, device, storage medium, and computer program
CN114974421B (zh) 基于扩散-降噪的单细胞转录组测序数据补插方法及系统
CN111062428A (zh) 一种高光谱图像的聚类方法、系统及设备
CN113902010A (zh) 分类模型的训练方法和图像分类方法、装置、设备和介质
CN112614110A (zh) 评估图像质量的方法、装置及终端设备
CN110991247B (zh) 一种基于深度学习与nca融合的电子元器件识别方法
CN113516019B (zh) 高光谱图像解混方法、装置及电子设备
CN111814884A (zh) 一种基于可变形卷积的目标检测网络模型的升级方法
CN109460772B (zh) 一种基于信息熵和改进行列式点过程的光谱波段选择方法
Liu et al. Geometric weighting subspace clustering on nonlinear manifolds
CN113627555A (zh) 一种图像分类的实现方法、装置、设备和介质
CN115457638A (zh) 模型训练方法、数据检索方法、装置、设备及存储介质
CN114065913A (zh) 模型量化方法、装置及终端设备
CN114202694A (zh) 基于流形混合插值和对比学习的小样本遥感场景图像分类方法
CN113627556B (zh) 一种图像分类的实现方法、装置、电子设备和存储介质
CN112417234A (zh) 一种数据聚类方法和装置,及计算机可读存储介质
Gong et al. Research on mobile traffic data augmentation methods based on SA-ACGAN-GN

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211109

RJ01 Rejection of invention patent application after publication