CN115116105A - 一种图像分类方法、装置、设备及存储介质 - Google Patents
一种图像分类方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115116105A CN115116105A CN202110310508.1A CN202110310508A CN115116105A CN 115116105 A CN115116105 A CN 115116105A CN 202110310508 A CN202110310508 A CN 202110310508A CN 115116105 A CN115116105 A CN 115116105A
- Authority
- CN
- China
- Prior art keywords
- image
- feature extraction
- sample data
- local
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000000605 extraction Methods 0.000 claims abstract description 165
- 238000013145 classification model Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 142
- 239000006185 dispersion Substances 0.000 claims description 45
- 230000006870 function Effects 0.000 claims description 18
- 238000012562 intraclass correlation Methods 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 8
- 238000012549 training Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开一种图像分类方法、装置、设备及存储介质,该方法包括:预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;图像特征提取模型特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,及去除图像特征冗余信息;获取待分类图像集并输入到图像特征提取模型进行特征提取,将第一特征提取结果输入到图像分类模型进行图像分类,得到对应的分类结果。如此,在现有多视图不相关鉴别分析算法基础上增加局部判别典型相关算法,使得在特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,并去除图像特征冗余信息,使得提取的图像特征更加显著,提高后续图像分类效果。
Description
技术领域
本申请涉及模式识别技术,尤其涉及一种图像分类方法、装置、设备及存储介质。
背景技术
多视图学习由于从多个角度去学习,提高数据预测准确性,因此,多视图学习在计算机视觉领域得到了广泛运用,且成为机器学习中的一个热门研究方向。其中,多视图不相关鉴别分析(Multiview Uncorrelated Linear Discriminant Analysis,MULDA)可视为典型相关分析(Canonical Correlation Analysis,CCA)与不相关鉴别分析(UncorrelatedLinear Discriminant Analysis,ULDA)的结合,MULDA在每个视图中提取的特征向量在公共子空间中相互不相关,且有效去除视图间的冗余信息,同时使得每个视图的判别性和视图间的相关性最大化。
然而,由于CCA是一种无监督的学习方法,无法利用样本视图的类标信息,故利用CCA得到MULDA进行视图特征提取时不能保留足够的判别信息,导致视图分类性能降低。
申请内容
为解决上述技术问题,本申请提供一种图像识别方法、装置、设备及存储介质。
本申请的技术方案是这样实现的:
第一方面,提供了一种图像分类方法,该方法包括:
预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
将所述第一特征提取结果输入到图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
上述方案中,所述预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型,包括:基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;获取待识别的图像样本集;其中,所述图像样本集包含同类图像样本和不同类图像样本;将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第一特征提取结果;其中,每一类图像样本中包括多张图像;将所述至少两个第一特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果;基于所述至少两类图像样本的分类结果和类别标签,修正所述图像特征提取模型,得到训练完成的图像特征提取模型。
上述方案中,所述图像样本集包括第一样本集和第二样本集;其中,所述第二样本集是基于预设图像处理策略对所述第一样本集进行处理得到的;所述将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第一特征提取结果,包括:对所述第一样本集中的图像样本进行预处理,得到至少两类第一样本数据;对所述第二样本集中的图像样本进行预处理,得到至少两类第二样本数据;为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵;其中,相同类型的第一类样本数据和第二类样本数据的第一投影矩阵和第二投影矩阵组成一对投影矩阵;利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,实现对第一样本数据和第二样本数据的特征提取。
上述方案中,所述为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵,包括:基于每一类第一样本数据和第二样本数据、预先定义的第一局部类内相关矩阵和第一局部类间相关矩阵,构造每一类第一样本数据和第二样本数据对应的第二局部类内相关矩阵和第二局部类间相关矩阵;基于每一类第一样本数据和第二样本数据、预先定义的第一类间离散度矩阵、第一类内离散度矩阵和第一总离散度矩阵,构造每一类第一样本数据和第二样本数据的第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵;将所述第二局部类内相关矩阵、第二局部类间相关矩阵、第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵作为预设函数的输入参数;其中,所述预设函数是由所述多视图不相关鉴别分析算法和局部判别典型相关算法构造的;对所述预设函数进行求解,得到每一类第一样本数据对应的多个第一特征值,和第二样本数据对应的多个第二特征值;对所述多个第一特征值按照从所述多个第一特征值中按照由大到小顺序选取出前d个第一特征值,获取前d个第一特征值对应的d个第一特征向量;从所述多个第二特征值中按照由大到小顺序选取出前d个第二特征值,获取前d个第二特征值对应的d个第二特征向量;基于每一类第一样本数据的所述d个第一特征向量,构造每一类第一样本数据对应的第一投影矩阵;基于每一类第二样本数据的所述d个第二特征向量,构造每一类第二样本数据对应的第二投影矩阵。
上述方案中,所述利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,包括:通过所述第一投影矩阵将对应的第一样本数据投影到低维空间,得到新的第一样本数据;通过所述第二投影矩阵将对应的第二样本数据投影到低维空间,得到新的第二样本数据;基于并行融合策略,所述新的第一样本数据与所述新的第二样本数据进行相加,得到对应的第二特征提取结果;或者,基于串行融合策略,所述新的第一样本数据与所述新的第二样本数据进行数据拼接,得到对应的第二特征提取结果。
上述方案中,所述将所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果,包括:计算目标类样本图像的第二特征提取结果与标准特征库中的M个标准特征之间的距离,得到M个距离值;其中,所述目标类样本图像为所述至少两类图像样本中的任意一类;对所述M个距离值按照从小到大进行排序,获取前k个距离值;其中,所述M大于k,且M和k为正整数;取所述前k个距离值对应的k个标准特征的类别信息;基于所述k个标准特征的类别信息,确定所述目标类样本图像的分类结果。
上述方案中,所述将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,包括:对所述待分类的图像集进行预处理,得到所述待分类的图像集对应的数据集;将所述数据集输入到所述图像特征提取模型进行特征提取。
第二方面,提供了一种图像分类装置,该装置包括:图像特征提取模块和图像分类模块;
其中,所述图像特征提取模块包括创建单元、获取单元和提取单元;
所述创建单元,用于预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立所述图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
所述获取单元,用于获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
所述提取单元,用于将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
所述图像分类模块,用于将所述第一特征提取结果输入到所述图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
第三方面,提供了一种图像分类设备,包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器配置为运行所述计算机程序时,执行前述方法的步骤。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现前述方法的步骤。
采用上述技术方案,预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;获取待分类的图像集;其中,待分类的图像集包括同一待分类对象的不同图像;将待分类的图像集输入到图像特征提取模型进行特征提取,得到第一特征提取结果;将第一特征提取结果输入到图像分类模型进行图像分类,得到待分类的图像集的分类结果。如此,在现有多视图不相关鉴别分析算法基础上增加局部判别典型相关算法,使得在特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,并去除图像特征冗余信息,使得提取的图像特征更加显著,提高后续图像分类效果。
附图说明
图1为本申请实施例中图像分类方法的流程示意图;
图2为本申请实施例中图像分类过程示意图;
图3为本申请实施例中对图像特征提取模型的训练流程示意图;
图4为本申请实施例中在ORL人脸识别数据库上的识别率与近邻参数k的关系变化示意图;
图5为本申请实施例中在AR人脸识别数据库上的识别率与近邻参数k的关系变化示意图;
图6为本申请实施例中在ORL人脸识别数据库上各算法的识别率示意图;
图7为本申请实施例中在AR人脸识别数据库上各算法的识别率示意图;
图8为本申请实施例中图像分类装置组成的结构示意图;
图9为本申请实施例中图像分类设备组成的结构示意图。
具体实施方式
为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
本申请实施例提供了一种图像分类方法,图1为本申请实施例中图像分类方法的流程示意图,如图1所示,该图像分类方法具体可以包括:
步骤101:预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
需要说明的是,本申请为了避免现有的多视图不相关鉴别分析(MultiviewUncorrelated Linear Discriminant Analysis,MULDA)算法在进行图像特征提取时不能保留足够的判别信息,导致图像分类性能降低的问题,提出一种新的MULDA算法,通过新的MULDA算法对图像进行特征提取,使得在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息,进而提高图像分类性能。
具体的,在现有的MULDA算法基础上结合局部判别典型相关分析(LocalityDiscriminative CCA,LDCCA)算法,得到新的MULDA算法。其中,LDCCA算法用于增强同类图像之间的局部相关关系及减弱不同类图像之间的局部相关关系。
这里,图像特征提取模型为训练完成的图像特征提取模型,用于对图像进行特征提取。具体的训练过程在后面具体阐述。
图2为本申请实施例中图像分类过程示意图。如图2所示,一个完整的图像分类过程一般分为四个步骤,即数据采集201(即对应步骤102)、数据预处理202(即对应步骤103)、特征提取203(即对应步骤104)及识别与分类204(即对应步骤105)。
步骤102:获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
需要说明的是,待分类对象可以是人、动物或者物品等。
这里,通过拍摄方式获取待分类的图像集,或者,可从人脸识别数据库中获取待分类的图像集。其中,人脸识别数据库包括ORL、AR等。
这里,待分类的图像集可以是通过拍摄方式拍摄多个同一待分类对象的不同图像,或者,拍摄一部分图像,再对该部分图像进行预处理操作得到处理后的图像,将未处理和处理后的图像组成待分类的图像集。
或者,在人脸识别数据库中获取多个同一待分类对象的不同图像,或获取一部分图像,再对该部分图像进行预处理操作得到处理后的图像,将未处理和处理后的图像组成待分类的图像集。
步骤103:将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
需要说明的是,将待分类的图像集输入到图像特征提取模型之前,需要将待分类的图像集转化为计算机可以识别的图像数据。
在一些实施例中,该步骤具体包括:对所述待分类的图像集进行预处理,得到所述待分类的图像集对应的数据集;将所述数据集输入到所述图像特征提取模型进行特征提取。
需要说明的是,预处理过程是为了将图像转化为计算机可以识别的图像数据,另外,还可将影响到特征提取及识别分类步骤的因素进行一定去除,提供统一标准化数据,提高识别分类性能。
这里,预处理一般包括平滑、滤波、中心化、灰度处理及小波分解等。
由于图像拍摄会受到不同因素的影响,包括光照、拍摄角度等,这些在识别分类过程中产生或多或少的影响,上述提及的小波分解,能够同时提取图像的时域信息和频域信息,可以尽可能的消除这些干扰因素的影响,有利于后续的图像分类。其中,通过不同形式的小波分解提取原始图像的低频特征,再进行后续的特征提取及分类操作。
步骤104:将所述第一特征提取结果输入到图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
这里,图像分类模型用于对图像进行分类。其中,图像分类模型可以由KNN算法,或者SVM算法,或者CNN算法等建立。
这里,步骤101至步骤104的执行主体可以为图像分类装置的处理器。
如此,在现有多视图不相关鉴别分析算法基础上增加局部判别典型相关算法,使得在特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,并去除图像特征冗余信息,使得提取的图像特征更加显著,提高后续图像分类效果。
下面具体阐述对图像特征提取模型的训练过程,图3为本申请实施例中对图像特征提取模型的训练流程示意图,如图3所示,具体的,
步骤301:基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;
需要说明的是,图像特征提取模型是训练之前建立的模型。下面步骤具体对图像特征提取模型进行训练。
步骤302:获取待识别的图像样本集;其中,所述图像样本集包含同类图像样本和不同类图像样本;
需要说明的是,同类图像样本或不同类图像样本中均包括多个不同的图像。
步骤303:将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第一特征提取结果;其中,每一类图像样本中包括多张图像;
需要说明的是,寻找图像样本集的投影矩阵是特征提取的关键,通过投影矩阵对图像样本集对应的样本数据集进行投影的过程,即是对样本数据集进行特征提取。这里,通过图像特征提取模型构造投影矩阵。
在一些实施例中,所述图像样本集包括第一样本集和第二样本集;其中,所述第二样本集是基于预设图像处理策略对所述第一样本集进行处理得到的;该步骤具体包括:对所述第一样本集中的图像样本进行预处理,得到至少两类第一样本数据;对所述第二样本集中的图像样本进行预处理,得到至少两类第二样本数据;为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵;其中,相同类型的第一类样本数据和第二类样本数据的第一投影矩阵和第二投影矩阵组成一对投影矩阵;利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,实现对第一样本数据和第二样本数据的特征提取。
这里,图像样本集包括第一样本集和第二样本集,第一样本集中包括至少两类第一样本集,第二样本集中包括至少两类第二样本集,将预处理后的每一类第一样本数据和第二样本数据作为图像特征提取模型的输入,分别得到第一样本数据对应的多个投影向量及第二样本数据对应的多个投影向量,第一样本数据对应的多个投影向量组成第一投影矩阵,第二样本数据对应的多个投影向量组成第二投影矩阵。
在一些实施例中,所述为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵,包括:基于每一类第一样本数据和第二样本数据、预先定义的第一局部类内相关矩阵和第一局部类间相关矩阵,构造每一类第一样本数据和第二样本数据对应的第二局部类内相关矩阵和第二局部类间相关矩阵;基于每一类第一样本数据和第二样本数据、预先定义的第一类间离散度矩阵、第一类内离散度矩阵和第一总离散度矩阵,构造每一类第一样本数据和第二样本数据的第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵;将所述第二局部类内相关矩阵、第二局部类间相关矩阵、第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵作为预设函数的输入参数;其中,所述预设函数是由所述多视图不相关鉴别分析算法和局部判别典型相关算法构造的;对所述预设函数进行求解,得到每一类第一样本数据对应的多个第一特征值,和第二样本数据对应的多个第二特征值;对所述多个第一特征值按照从所述多个第一特征值中按照由大到小顺序选取出前d个第一特征值,获取前d个第一特征值对应的d个第一特征向量;从所述多个第二特征值中按照由大到小顺序选取出前d个第二特征值,获取前d个第二特征值对应的d个第二特征向量;基于每一类第一样本数据的所述d个第一特征向量,构造每一类第一样本数据对应的第一投影矩阵;基于每一类第二样本数据的所述d个第二特征向量,构造每一类第二样本数据对应的第二投影矩阵。
该实施例具体步骤结合对应的算法具体介绍如下:
这里,设X(即第一样本数据)和Y(即第二样本数据)为两个的中心化后样本集,X=[x1,x2,…,xn]=[X1,X2,…,Xc]∈Rp×n,其中xj∈Rp(1≤j≤n)表示单个样本,n表示样本的数量,p表示样本的维数,c表示样本的类别数,(1≤i≤c)表示第i类共有ni个样本。类似的有Y样本集Y=[y1,y2,…,yn]=[Y1,Y2,…,Yc]∈Rq×n,其中q表示样本的维数。
关于LDCCA算法,具体的,LDCCA的目标是寻找一对投影向量wx和wy,使得提取的同类k近邻样本特征之间相关最大化,不同类k近邻样本特征之间的相关最小化,从而有利于分类。其鉴别准则可表示如下:
其中和分别表示X和Y的协方差矩阵,当计算典型相关系数时,Cxx和Cyy中的系数可省略,ζ是用于平衡和的因子,和分别为局部类内相关矩阵(即第一局部类内相关矩阵)和局部类间相关矩阵(即第一局部类间相关矩阵),其定义如下:
上式中,NI(xi)表示xi的类内k近邻,也就是本类中与xi最相似点的集合;NE(xi)为xi的类间k近邻,表示其它类中与xi最相似点的集合。同理,NI(yi)NE(yi)含义类似,算法使用标准欧氏距离来测量数据点之间的相似性。
基于上述第一局部类内相关矩阵和第一局部类间相关矩阵,将每一类第一样本数据和第二样本数据输入,得到构造的第二局部类内相关矩阵和第二局部类间相关矩阵。
从CCA与LDA算法结合得到的MLDA算法中,可得到第一类间离散度矩阵和第一类内离散度矩阵和第一总离散度矩阵和这里不具体阐述。将每一类第一样本数据和第二样本数据输入,得到构造的第二类间离散度矩阵和第二类内离散度矩阵和第二总离散度矩阵和其中,
下面将第二局部类内相关矩阵、第二局部类间相关矩阵、第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵作为预设函数(即公式(4))的输入参数,并对预设函数求解,进而得到一对投影矩阵。
关于预设函数的求解步骤具体如下:
假设(wxj,wyj),(j=1,2,…,r-1)表示由MLDA算法获得的前j个最大特征值所对应的向量对,本申请多视图不相关鉴别分析和局部判别典型相关结合算法是要寻找第r个向量对(wxr,wyr),同时满足不相关约束,则本申请的优化模型如下:
η>0是一个微调参数,用于平衡LDCCA部分与MULDA部分之间的相对重要程度,如(1)式所定义。通过令将(4)式中的和的两个约束条件转化为一个约束条件则(4)式的优化问题构造相对应的拉格朗日函数如下式:
其中,λ、αj和βj为拉格朗日乘子,(5)式分别对wxr和wyr求偏导并使结果为0,可得:
(9)式转换为另一种形式如下:
由(11)式可得:
将变量e和Bx代入(6)式可得:
再将(12)式代入(14)式可得:
同理,将变量b和By代入(7)式后经过一系列变换可得:
求解该广义特征方程并取前d个最大特征值所对应的特征向量对,分别构造投影矩阵Wx=[wx1,wx2,…,wxd](即第一投影矩阵)和Wy=[wy1,wy2,…,wyd](即第二投影矩阵),其中,d满足条件1≤d≤min(p,q,c)。
在一些实施例中,所述利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,包括:通过所述第一投影矩阵将对应的第一样本数据投影到低维空间,得到新的第一样本数据;通过所述第二投影矩阵将对应的第二样本数据投影到低维空间,得到新的第二样本数据;基于并行融合策略,所述新的第一样本数据与所述新的第二样本数据进行相加,得到对应的第二特征提取结果;或者,基于串行融合策略,所述新的第一样本数据与所述新的第二样本数据进行数据拼接,得到对应的第二特征提取结果。
这里,对投影矩阵Wx和Wy通过并行融合策略(即FS1)进行特征提取,即对应公式(18),通过串行融合策略(即FS2)进行特征提取,即对应公式(19),
根据两种不同的特征融合策略,分别对至少两类第一样本数据和第二样本数据进行特征提取,得到至少两类第二特征提取结果。
步骤304:将所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果;
这里,图像分类模型用于对图像进行分类。其中,图像分类模型可以由KNN算法,或者SVM算法,或者CNN算法等建立。
在一些实施例中,该步骤具体包括:计算目标类样本图像的第一特征提取结果与标准特征库中的M个标准特征之间的距离,得到M个距离值;其中,所述目标类样本图像为所述至少两类图像样本中的任意一类;对所述M个距离值按照从小到大进行排序,获取前k个距离值;其中,所述M大于k,且M和k为正整数;获取所述前k个距离值对应的k个标准特征的类别信息;基于所述k个标准特征的类别信息,确定所述目标类样本图像的分类结果。
这里,为了研究本申请中涉及的局部类内相关矩阵和局部类间相关矩阵近邻参数k对实验识别性能的影响,分别在ORL和AR人脸识别数据库上进行实验,样本的近邻参数k取值从1到5,并用单独的LDCCA算法进行对比,同时均采用式(19)的串行特征融合策略提取特征。实验得到图4在ORL人脸识别数据库上的识别率与近邻参数k的关系变化示意图,及图5在AR人脸识别数据库上的识别率与近邻参数k的关系变化示意图。
从图4和图5可知,本申请中算法的识别率均高于LDCCA算法,且效果更稳定。由图4和5表明本申请算法识别率对k的取值不敏感。为更好地比较算法性能,本申请的类间和类内近邻数目k统一设定为训练样本减一。
步骤305:基于所述至少两类图像样本的分类结果和类别标签,修正所述图像特征提取模型,得到训练完成的图像特征提取模型。
基于上述步骤,为了验证本申请算法的有效性,分别在ORL、AR人脸识别数据库上进行人脸识别实验,并将结果与MLDA、LDCCA、Fisherfaces和CCA进行对比,也与MULDA算法及其改进算法(MULDA-m)进行比较,也与传统的CCA算法采用式(19)的特征融合策略提取特征进行实验。本申请算法的微调参数η和ξ通过交叉验证在[0.001,0.01,0.1,1,10]之间确定,参数λ取值为1,参数d满足条件1≤d≤min(p,q,c),d在ORL和AR人脸库上分别取值为40和45。上述提到的所有算法依次进行试验20次,最终采用最近邻分类器进行分类,最近邻分类器的近邻数取值为5,计算其平均识别率进行比较,比较结果由图6和图7得知,本申请中算法的识别率最高。其中,图6为本申请实施例中在ORL人脸识别数据库上各算法的识别率示意图。图7为本申请实施例中在AR人脸识别数据库上各算法的识别率示意图。
如此,在现有多视图不相关鉴别分析算法基础上增加局部判别典型相关算法,使得在特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,并去除图像特征冗余信息,使得提取的图像特征更加显著,提高后续图像分类效果。
本申请实施例中提供了一种图像分类装置,图8为本申请实施例中图像分类装置组成的结构示意图,如图8所示,该装置包括:所述装置包括:图像特征提取模块80和图像分类模块81;
其中,所述图像特征提取模块80包括创建单元801、获取单元802、提取单元803;
所述创建单元801,用于预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立所述图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
所述获取单元802,用于获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
所述提取单元803,用于将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
所述图像分类模块81,用于将所述第一特征提取结果输入到所述图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
在一些实施例中,所述预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型,包括:基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;获取待识别的图像样本集;其中,所述图像样本集包含同类图像样本和不同类图像样本;将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第一特征提取结果;其中,每一类图像样本中包括多张图像;所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果;基于所述至少两类图像样本的分类结果和类别标签,修正所述图像特征提取模型,得到训练完成的图像特征提取模型。
在一些实施例中,所述图像样本集包括第一样本集和第二样本集;其中,所述第二样本集是基于预设图像处理策略对所述第一样本集进行处理得到的;所述将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第一特征提取结果,包括:对所述第一样本集中的图像样本进行预处理,得到至少两类第一样本数据;对所述第二样本集中的图像样本进行预处理,得到至少两类第二样本数据;为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵;其中,相同类型的第一类样本数据和第二类样本数据的第一投影矩阵和第二投影矩阵组成一对投影矩阵;利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,实现对第一样本数据和第二样本数据的特征提取。
在一些实施例中,所述为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵,包括:基于每一类第一样本数据和第二样本数据、预先定义的第一局部类内相关矩阵和第一局部类间相关矩阵,构造每一类第一样本数据和第二样本数据对应的第二局部类内相关矩阵和第二局部类间相关矩阵;基于每一类第一样本数据和第二样本数据、预先定义的第一类间离散度矩阵、第一类内离散度矩阵和第一总离散度矩阵,构造每一类第一样本数据和第二样本数据的第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵;将所述第二局部类内相关矩阵、第二局部类间相关矩阵、第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵作为预设函数的输入参数;其中,所述预设函数是由所述多视图不相关鉴别分析算法和局部判别典型相关算法构造的;对所述预设函数进行求解,得到每一类第一样本数据对应的多个第一特征值,和第二样本数据对应的多个第二特征值;从所述多个第一特征值中按照由大到小顺序选取出前d个第一特征值,获取前d个第一特征值对应的d个第一特征向量;从所述多个第二特征值中按照由大到小顺序选取出前d个第二特征值,获取前d个第二特征值对应的d个第二特征向量;基于每一类第一样本数据的所述d个第一特征向量,构造每一类第一样本数据对应的第一投影矩阵;基于每一类第二样本数据的所述d个第二特征向量,构造每一类第二样本数据对应的第二投影矩阵。
在一些实施例中,所述利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,包括:通过所述第一投影矩阵将对应的第一样本数据投影到低维空间,得到新的第一样本数据;通过所述第二投影矩阵将对应的第二样本数据投影到低维空间,得到新的第二样本数据;基于并行融合策略,所述新的第一样本数据与所述新的第二样本数据进行相加,得到对应的第二特征提取结果;或者,基于串行融合策略,所述新的第一样本数据与所述新的第二样本数据进行数据拼接,得到对应的第二特征提取结果。
在一些实施例中,所述将所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果,包括:计算目标类样本图像的第二特征提取结果与标准特征库中的M个标准特征之间的距离,得到M个距离值;其中,所述目标类样本图像为所述至少两类图像样本中的任意一类;对所述M个距离值按照从小到大进行排序,获取前k个距离值;其中,所述M大于k,且M和k为正整数;获取所述前k个距离值对应的k个标准特征的类别信息;基于所述k个标准特征的类别信息,确定所述目标类样本图像的分类结果。
在一些实施例中,所述将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,包括:对所述待分类的图像集进行预处理,得到所述待分类的图像集对应的数据集;将所述数据集输入到所述图像特征提取模型进行特征提取。
如此,在现有多视图不相关鉴别分析算法基础上增加局部判别典型相关算法,使得在特征提取时增强同类图像间局部相关关系,减弱不同类图像间局部相关关系,并去除图像特征冗余信息,使得提取的图像特征更加显著,提高后续图像分类效果。
本申请实施例还提供了一种图像分类设备,图9为本申请实施例中图像分类设备的结构示意图,如图9所示,该图像分类设备包括:处理器901和配置为存储能够在处理器上运行的计算机程序的存储器902;
其中,处理器901配置为运行计算机程序时,执行前述实施例中的拍摄控制方法的步骤。
当然,实际应用时,如图9所示,该图像分类设备中的各个组件通过总线系统903耦合在一起。可理解,总线系统903用于实现这些组件之间的连接通信。总线系统903除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图9中将各种总线都标为总线系统903。
在实际应用中,上述处理器可以为特定用途集成电路(ASIC,ApplicationSpecific Integrated Circuit)、数字信号处理装置(DSPD,Digital Signal ProcessingDevice)、可编程逻辑装置(PLD,Programmable Logic Device)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
上述存储器可以是易失性存储器(volatile memory),例如随机存取存储器(RAM,Random-Access Memory);或者非易失性存储器(non-volatile memory),例如只读存储器(ROM,Read-Only Memory),快闪存储器(flash memory),硬盘(HDD,Hard Disk Drive)或固态硬盘(SSD,Solid-State Drive);或者上述种类的存储器的组合,并向处理器提供指令和数据。
本申请实施例还提供了一种计算机可读存储介质,用于存储计算机程序。
可选的,该计算机可读存储介质可应用于本申请实施例中的任意一种方法,并且该计算机程序使得计算机执行本申请实施例的各个方法中由处理器实现的相应流程,为了简洁,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种图像分类方法,其特征在于,所述方法包括:
预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
将所述第一特征提取结果输入到图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立图像特征提取模型,包括:
基于多视图不相关鉴别分析算法和局部判别典型相关算法初始化图像特征提取模型;
获取待识别的图像样本集;其中,所述图像样本集包含同类图像样本和不同类图像样本;
将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第二特征提取结果;其中,每一类图像样本中包括多张图像;
将所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果;
基于所述至少两类图像样本的分类结果和类别标签,修正所述图像特征提取模型,得到训练完成的图像特征提取模型。
3.根据权利要求2所述的方法,其特征在于,所述图像样本集包括第一样本集和第二样本集;其中,所述第二样本集是基于预设图像处理策略对所述第一样本集进行处理得到的;
所述将所述图像样本集中的至少两类图像样本输入到所述图像特征提取模型进行特征提取,得到至少两个第二特征提取结果,包括:
对所述第一样本集中的图像样本进行预处理,得到至少两类第一样本数据;
对所述第二样本集中的图像样本进行预处理,得到至少两类第二样本数据;
为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵;其中,相同类型的第一类样本数据和第二类样本数据的第一投影矩阵和第二投影矩阵组成一对投影矩阵;
利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,实现对第一样本数据和第二样本数据的特征提取。
4.根据权利要求3所述的方法,其特征在于,所述为每一类第一样本数据构造对应的第一投影矩阵,以及为每一类第二样本数据构造第二投影矩阵,包括:
基于每一类第一样本数据和第二样本数据、预先定义的第一局部类内相关矩阵和第一局部类间相关矩阵,构造每一类第一样本数据和第二样本数据对应的第二局部类内相关矩阵和第二局部类间相关矩阵;
基于每一类第一样本数据和第二样本数据、预先定义的第一类间离散度矩阵、第一类内离散度矩阵和第一总离散度矩阵,构造每一类第一样本数据和第二样本数据的第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵;
将所述第二局部类内相关矩阵、第二局部类间相关矩阵、第二类间离散度矩阵、第二类内离散度矩阵和第二总离散度矩阵作为预设函数的输入参数;其中,所述预设函数是由所述多视图不相关鉴别分析算法和局部判别典型相关算法构造的;
对所述预设函数进行求解,得到每一类第一样本数据对应的多个第一特征值,和第二样本数据对应的多个第二特征值;
从所述多个第一特征值中按照由大到小顺序选取出前d个第一特征值,获取前d个第一特征值对应的d个第一特征向量;
从所述多个第二特征值中按照由大到小顺序选取出前d个第二特征值,获取前d个第二特征值对应的d个第二特征向量;
基于每一类第一样本数据的所述d个第一特征向量,构造每一类第一样本数据对应的第一投影矩阵;基于每一类第二样本数据的所述d个第二特征向量,构造每一类第二样本数据对应的第二投影矩阵。
5.根据权利要求3所述的方法,其特征在于,所述利用相同类型的第一投影矩阵和第二投影矩阵分别将对应的第一样本数据和第二样本数据投影到低维空间,包括:
通过所述第一投影矩阵将对应的第一样本数据投影到低维空间,得到新的第一样本数据;
通过所述第二投影矩阵将对应的第二样本数据投影到低维空间,得到新的第二样本数据;
基于并行融合策略,所述新的第一样本数据与所述新的第二样本数据进行相加,得到对应的第二特征提取结果;
或者,基于串行融合策略,所述新的第一样本数据与所述新的第二样本数据进行数据拼接,得到对应的第二特征提取结果。
6.根据权利要求2所述的方法,其特征在于,所述将所述至少两个第二特征提取结果输入到图像分类模型进行图像分类,得到所述至少两类图像样本的分类结果,包括:
计算目标类样本图像的第二特征提取结果与标准特征库中的M个标准特征之间的距离,得到M个距离值;其中,所述目标类样本图像为所述至少两类图像样本中的任意一类;
对所述M个距离值按照从小到大进行排序,获取前k个距离值;其中,所述M大于k,且M和k为正整数;
获取所述前k个距离值对应的k个标准特征的类别信息;
基于所述k个标准特征的类别信息,确定所述目标类样本图像的分类结果。
7.根据权利要求1所述的方法,其特征在于,所述将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,包括:
对所述待分类的图像集进行预处理,得到所述待分类的图像集对应的数据集;
将所述数据集输入到所述图像特征提取模型进行特征提取。
8.一种图像分类装置,其特征在于,所述装置包括:图像特征提取模块和图像分类模块;
其中,所述图像特征提取模块包括创建单元、获取单元和提取单元;
所述创建单元,用于预先基于多视图不相关鉴别分析算法和局部判别典型相关算法建立所述图像特征提取模型;所述图像特征提取模型在特征提取时增强同类图像之间的局部相关关系,减弱不同类图像之间的局部相关关系,以及去除图像特征的冗余信息;
所述获取单元,用于获取待分类的图像集;其中,所述待分类的图像集包括同一待分类对象的不同图像;
所述提取单元,用于将所述待分类的图像集输入到所述图像特征提取模型进行特征提取,得到第一特征提取结果;
所述图像分类模块,用于将所述第一特征提取结果输入到所述图像分类模型进行图像分类,得到所述待分类的图像集的分类结果。
9.一种图像分类设备,其特征在于,所述图像分类设备包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器配置为运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110310508.1A CN115116105A (zh) | 2021-03-23 | 2021-03-23 | 一种图像分类方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110310508.1A CN115116105A (zh) | 2021-03-23 | 2021-03-23 | 一种图像分类方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115116105A true CN115116105A (zh) | 2022-09-27 |
Family
ID=83323782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110310508.1A Pending CN115116105A (zh) | 2021-03-23 | 2021-03-23 | 一种图像分类方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115116105A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115797709A (zh) * | 2023-01-19 | 2023-03-14 | 苏州浪潮智能科技有限公司 | 一种图像分类方法、装置、设备和计算机可读存储介质 |
-
2021
- 2021-03-23 CN CN202110310508.1A patent/CN115116105A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115797709A (zh) * | 2023-01-19 | 2023-03-14 | 苏州浪潮智能科技有限公司 | 一种图像分类方法、装置、设备和计算机可读存储介质 |
CN115797709B (zh) * | 2023-01-19 | 2023-04-25 | 苏州浪潮智能科技有限公司 | 一种图像分类方法、装置、设备和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sankaranarayanan et al. | Triplet probabilistic embedding for face verification and clustering | |
Huang et al. | Projection metric learning on Grassmann manifold with application to video based face recognition | |
Naikal et al. | Informative feature selection for object recognition via sparse PCA | |
CN109344731B (zh) | 基于神经网络的轻量级的人脸识别方法 | |
Cevikalp et al. | Semi-supervised dimensionality reduction using pairwise equivalence constraints | |
Kafai et al. | Reference face graph for face recognition | |
Moustafa et al. | Age-invariant face recognition based on deep features analysis | |
Bąk et al. | Person re-identification using deformable patch metric learning | |
Boubenna et al. | Feature selection for facial emotion recognition based on genetic algorithm | |
Agarwal et al. | An efficient back propagation neural network based face recognition system using haar wavelet transform and PCA | |
CN115116105A (zh) | 一种图像分类方法、装置、设备及存储介质 | |
CN109190505A (zh) | 基于视觉理解的图像识别方法 | |
Trokielewicz et al. | Post-mortem iris recognition resistant to biological eye decay processes | |
Chergui et al. | Kinship verification using BSIF and LBP | |
CN109165587B (zh) | 智能图像信息抽取方法 | |
Duan et al. | Local feature learning for face recognition under varying poses | |
CN109165586B (zh) | 用于ai芯片的智能图像处理方法 | |
Fernandes et al. | Directed adversarial attacks on fingerprints using attributions | |
CN113920573B (zh) | 基于对抗学习的人脸变化解耦的亲属关系验证方法 | |
Harandi et al. | Face recognition using reinforcement learning | |
Wu et al. | Sparse graph based deep learning networks for face recognition | |
Sun | Adaptation for multiple cue integration | |
CN114913610A (zh) | 一种基于指纹和指静脉的多模态识别方法 | |
Ashalatha et al. | Face recognition using local features by LPP approach | |
CN116030508A (zh) | 一种人脸识别方法、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |