CN113887661A - 一种基于表示学习重构残差分析的图像集分类方法及系统 - Google Patents

一种基于表示学习重构残差分析的图像集分类方法及系统 Download PDF

Info

Publication number
CN113887661A
CN113887661A CN202111243560.6A CN202111243560A CN113887661A CN 113887661 A CN113887661 A CN 113887661A CN 202111243560 A CN202111243560 A CN 202111243560A CN 113887661 A CN113887661 A CN 113887661A
Authority
CN
China
Prior art keywords
image
image set
data
projection matrix
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111243560.6A
Other languages
English (en)
Other versions
CN113887661B (zh
Inventor
高希占
冯泽明
牛四杰
董吉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Jinan
Original Assignee
University of Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Jinan filed Critical University of Jinan
Priority to CN202111243560.6A priority Critical patent/CN113887661B/zh
Publication of CN113887661A publication Critical patent/CN113887661A/zh
Application granted granted Critical
Publication of CN113887661B publication Critical patent/CN113887661B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于表示学习重构残差分析的图像集分类方法及系统,所述方法利用高斯核函数,将获取的图像集数据的低维特征映射到高维空间中,然后通过构建残差判别分析模型学习一个投影矩阵,使得投影后的图像集特征类内重建残差最小,类间重建残差最大。本发明通过输入来自于视频序列、影集或监控系统的图像集数据;对所述图像集进行数据预处理操作;将获取的图像数据输入到重构残差分析模型进行模型训练,得到最优投影矩阵;基于最优投影矩阵构建新的图像集分类器;将测试图像集输入到分类器中进行分类,得到对应的类别标签。

Description

一种基于表示学习重构残差分析的图像集分类方法及系统
技术领域
本发明涉及计算机视觉与机器学习技术领域,具体提供一种基于表示学习重构残差分析的图像集分类方法及系统。
背景技术
随着电子技术的不断发展,在手机、相机或者是在监控系统中存在大量的集合图像,因此,对图像集分类问题得到深入研究,并且以集合为单位的图像分类问题越来越受到研究人员们的广泛关注。与传统的基于单幅图像的分类任务不同,基于集合的图像分类任务即图像集分类可以为待分类客体提供更加丰富的特征,并可有效减少数据标注的工作量。然而图像集数据在提供丰富判别信息的同时,其内部也存在表情、动作、角度、目标大小等方面的差异,甚至有的图像存在模糊、退化、遮挡等异常,这为图像集分类带来了诸多挑战。
图像集内部提供了丰富的判别信息,如何有效利用这些信息进行建模表示成为图像集分类的挑战之一。一般情况下,图像集分类模型中采用的样本特征,都是简单处理的原始像素,存在信息冗余,异常值多等缺点,给分类带来了很大的困难。此外,在分类过程中,集合间的距离度量方式成为图像集分类的另一个挑战。一般来说,欧氏空间下的最小距离是图像集常用的度量方式,然而,如果模型不能够很好适应集合内变化复杂的状态,会导致学习到的特征判别能力不够,进而导致分类失败。因此,提取有效的判别特征,选择正确的集合度量方式或者改进现有的分类器是改善图像集分类性能的有效途径。目前,在图像集分类方面已经取得了很多成果,根据建模表示方法的不同,这些成果可以分为两类:参数表示模型和非参数表示模型:
(1)参数模型
基于参数模型的方法通常采用概率分布的方式来表示一个集合,然后测量两个分布之间的相似性。然而,参数模型的局限性在于其需要求解一个困难的参数估计问题,而且如果训练图像集与测试图像集之间的统计相关性较弱,其性能会受到较大的影响。
(2)非参数模型
与基于参数模型的方法不同,基于非参数模型的方法并不依赖训练数据与测试数据之间的统计相关性,而是假设图像集为某空间中的子空间,从而使得对图像集建模有了理论依据。非参数模型往往可以获得较高的准确率,因此受到了研究者的高度关注。但是,非参数模型依赖于数学模型,方法众多,比如线性回归方法,非线性流形方法,仿射子空间方法等等,选择不同的模型需要基于不同的空间进行建模,对模型的鲁棒性带来了极大的挑战。
具体来说,稀疏近似最近邻点方法是仿射子空间方法中有代表性的一种方法,其创造性的把凸包建模为无约束条件的模型,但却给优化带来了极大负担。
对偶线性回归分类方法基于线性回归方法对图像集分类进行了探索,具体来说,其定义了一个虚拟人脸空间用来模拟训练集与测试集之间的距离。然而,其忽略了不相关图像集以及大规模图像集给分类带来的影响。
流形判别分析给出了图像集在非线性流形方面的解决思路,即通过最大化流形之间的距离获取流形之间的判别信息,但是其线性映射函数是基于非线性流形学习到的,从而导致学习的结果是次优的。
非参数模型的方法彼此之间也可以相互借鉴,于是,出现了多模型或多空间融合方法,虽然这些方法在一定程度上适应了图像集复杂的内部结构,但是也相应的增加了模型的复杂度。
深度学习拥有强大的特征学习能力,提取的深度特征用于分类时表现出了超高的判别性。然而深度学习模型需要大量数据来进行模型训练,并且其属于黑匣子模型,可解释性较差。
目前关于深度学习的方法大多用于学习高维特征,然后基于简单的分类器进行分类,这样的方法过于依赖训练特征的参数,如果参数次优,以及分类模型性能差,就可能导致分类错误。
发明内容
本发明的技术任务是针对上述存在的问题,提供一种基于表示学习重构残差分析的图像集分类方法及系统,能够在大幅度减少样本特征维数的同时,增强图像集整体模型的判别性。
为实现上述目的,本发明一方面提供了如下技术方案:
基于表示学习重构残差分析的图像集分类方法,所述方法利用高斯核函数,把获取的图像集数据的低维特征映射到高维空间中,然后构建残差判别分析模型学习一个投影矩阵,使得投影后的图像集特征类内重建残差最小,类间重建残差最大。
所述方法通过提供投影矩阵与编码系数联合学习的优化策略,使学习到的投影矩阵具有更强的泛化性能;
所述优化策略分别基于稀疏表示残差分析方法以及协同表示残差分析方法进行优化;
最后基于学习到的投影矩阵,采用图像集分类方法,有效提取图像集中的判别特征,实现高精度的图像集分类。
所述方法的实现包括内容如下:
步骤1,获取可用于计算机识别与处理的视频帧序列,对其进行预处理后得到图像集数据;
步骤2,将所述图像集数据随机分成训练集与测试集,所述训练集中的数据再次随机平均分配为训练集1与验证集用于训练;
步骤3,在非线性空间中,构建目标损失函数模型,寻找最佳投影的方向,使得类间分散性最大,类内聚合度最小;
步骤4,通过协同表示残差分析与投影矩阵联合优化或者稀疏表示残差分析,与所述投影矩阵联合优化,学习到紧凑的有判别力的投影矩阵;
步骤5,根据所述有判别力的投影矩阵,将所述训练集和测试集数据投影到更具有鉴别力的特征空间;构建分类器模型,使用投影后的测试集验证算法更有效。
所述步骤1的实现步骤包括内容如下:
步骤1.1,对监控系统视频、手机、相机储存的集合图像进行目标检测,得到只包含目标区域的图像,并对目标区域进行对齐,裁剪等操作获取相同大小的目标图像;
步骤1.2,将步骤1.1获得的所述目标图像转为灰度图像,然后对其进行直方图均衡化处理,以减轻光照变化产生的影响,最后将每幅图像都拉伸为列向量;
步骤1.3,将步骤1.2获得的所述列向量进行归一化处理,初步减少异常值的影响。
所述步骤2的实现步骤包括内容如下:
步骤2.1,从所述步骤1获取的图像集数据的每个类中随机抽取若干个集合,用于构建训练集;
步骤2.2,把抽取的训练集中的每个图像集随机均分为新的训练集1和验证集,分别记作Gallery set和Validation set,并分别做如下描述:
对于训练集1(Gallery set),用
Figure BDA0003320069160000031
表示,其中:c是图像集类的个数,
Figure BDA0003320069160000032
是第i个图像集,其包含了
Figure BDA0003320069160000035
张图像
Figure BDA0003320069160000036
并且
Figure BDA0003320069160000033
表示在Galleryset中第i个图像集的第j张图像,m是图像的特征维度;
对于验证集(Validation set),用
Figure BDA0003320069160000034
表示,同样也包括c个不同的类,其中ny表示所有验证图像的数量;
步骤2.3,将所有类中剩余的图像集合,构成测试集,记作Probe Set,用于检验模型的性能;记录其中每个图像集合的类标签,记作Test Label。
所述步骤3的实现步骤包括内容如下:
步骤3.1,为了能够处理复杂的真实环境下获取的图像集样本,在本发明中,引入核映射,有关研究表明,经过核函数映射到高维空间的样本会比原始样本特征更具有区分度;首先引入非线性映射函数φ,用来映射数据到高维特征空间
Figure BDA0003320069160000041
这时,Xi可以表示为:
Figure BDA0003320069160000042
所述方法假设图像集位于由全体训练图像张成的仿射子空间中,通过使用凸包AH={φ(Xii|∑kαi,k=1}来对图像集进行建模表示,其中
Figure BDA0003320069160000043
重构残差分析的核心在于验证集合可以用来重构φ(Xi)的凸包,进而凸包之间的距离被称为重构残差。然而,这种重构残差是基于非线性映射后的数据进行学习的,其在特征空间中的样本维度过高,不易计算。一般来说,在高维空间中,更有判别性的特征往往存在于低维的特征空间中。因此,进行低维投影是一种可行的方式;
通过设置判别投影矩阵,将非线性数据投影到低维空间中,使得同类图像集之间的重构残差最小,不同类图像集之间的重构残差最大,其中:
所述同类的图像集重构残差表示为:
Figure BDA0003320069160000044
其中Yl是与Xl同类的验证集样本,αl,βl是第l类的编码系数;
所述不同类的图像集之间的重构残差表示为:
Figure BDA0003320069160000045
其中,M是所有不同类重构残差距离的数量;
将以上两个模型综合考虑,我们希望Sw的值尽可能地小,Sb地值尽可能地大,所以有:
Figure BDA0003320069160000046
其中λ是平衡参数,f1,f2都是正则化项,并且:
Figure BDA0003320069160000047
为了保证学习到一个正交的投影矩阵,加入约束PTP=I。
所述步骤4的实现步骤包括内容如下:
步骤4.1,为了求出上述公式中的P,α,β,分别在L1范数和L2范数的约束下交替更新非线性投影矩阵P以及α,β,求解过程分成以下两步;
第一步,固定α,β,更新P,得到如下新的优化问题:
Figure BDA0003320069160000051
将该模型采用迹优化策略进行处理,简化之后得如下优化问题:
Figure BDA0003320069160000052
其中
Figure BDA0003320069160000053
称为类内散度,
Figure BDA0003320069160000054
称为类间散度;
对上式进行求解,得到如下的特征值分解问题:
Figure BDA0003320069160000055
其中W=[W1,...,Wd],γ是对角矩阵;
第二步,固定P,对α,β更新,通过求解下面的等价模型来获得α,β:
Figure BDA0003320069160000056
Figure BDA0003320069160000057
其中:
Figure BDA0003320069160000058
是第i个类的样本的编码系数向量;
Figure BDA0003320069160000059
是所有验证集合中第i个类对应的编码系数向量;
更进一步,所述步骤4的实现步骤还包括内容如下:
步骤4.2,固定投影矩阵P,执行协同表示残差分析方法,求解如下问题:
Figure BDA00033200691600000510
其中Ai=PTφ(Xi),B=PTφ(Y);在这个公式中,等价的合并了限制条件,更加有利于编码系数的交替更新,使得计算速度加快;其中:z=[0;1],
Figure BDA0003320069160000061
这里的0和1都是向量;
所述协同表示残差分析采用如下的迭代策略进行求解:
如果αi是固定的,βi的更新:
Figure BDA0003320069160000062
其中
Figure BDA0003320069160000063
如果βi是固定的,αi的更新:
Figure BDA0003320069160000064
其中
Figure BDA0003320069160000065
通过W,α,β的交替更新,直到收敛,求得最优的投影矩阵P;
更进一步,所述步骤4的实现步骤还可以包括内容如下:
步骤4.2,除了协同表示残差分析之外,还可以构建稀疏表示残差分析方法,步骤如下:
首先定义PTφ(Xi)=Ai,PTφ(Y)=B,则稀疏表示残差分析方法被定义为:
Figure BDA0003320069160000066
Figure BDA0003320069160000067
目前已经存在很多成熟的算法可以对上述优化问题进行求解,在本发明中,选用ADMM算法来优化,上述模型分成以下两个子问题来迭代求解:
子问题:固定1α,更新β
Figure BDA0003320069160000068
子问题2:固定β,更新α
Figure BDA0003320069160000069
通过引入辅助变量ζ1,子问题1通过迭代计算下面的公式进行求解:
Figure BDA00033200691600000610
Figure BDA00033200691600000611
Figure BDA00033200691600000612
其中
Figure BDA0003320069160000071
是拉格朗日乘子;
同理,通过引入辅助变量ζ2,子问题2通过迭代计算下面的公式进行求解:
Figure BDA0003320069160000072
Figure BDA0003320069160000073
Figure BDA0003320069160000074
Figure BDA0003320069160000075
其中θ2,θ3都是拉格朗日乘子。
所述步骤5的实现步骤如下:
步骤5.1,为实现更精确的分类,提供一种图像集分类算法,记作RLbRRA-ISCRC,具体模型下:
Figure BDA0003320069160000076
Figure BDA0003320069160000077
其中X=[X1,...,Xk,...,Xc],β=[β1;β2;...;βk;...;βc],Q表示某测试图像集合;
步骤5.2,使用最小二乘法对所述模型进行求解,得到最优系数
Figure BDA00033200691600000711
Figure BDA0003320069160000078
进而计算测试图像集Q到每个训练图像集的距离ei,并得到测试集Q的类标签:
Figure BDA0003320069160000079
Figure BDA00033200691600000710
所述label为测试图像集合的预测类标签。
本发明另一方面,提供一种基于表示学习重构残差分析的图像集分类系统,所述系统包括:
图像集数据的获取和预处理模块:获取用于计算机识别与处理的集合图像数据,并对其进行预处理;
数据划分模块:把获取的图像集数据每类中所有样本平均分配,一半样本作为训练集,一半样本作为验证集;
模型构建模块:构建基于表示学习重构残差的图像集特征学习模型,包括投影矩阵与样本编码系数联合优化的协同表示残差分析模块或者稀疏表示残差分析模块;
模型训练模块:通过所述协同表示残差分析或者稀疏表示残差分析方法模块,学习获得紧凑的有判别力的投影矩阵P;
样本预测模块:根据已经训练好的投影矩阵P,对新的样本数据进行投影,然后基于图像集分类算法进行预测,输出它的类标签。
所述图像集分类算法模型下:
Figure BDA0003320069160000081
Figure BDA0003320069160000082
其中X=[X1,...,Xk,...,Xc],β=[β1;β2;...;βk;...;βc],Q表示某测试图像集合。
与现有技术相比,本发明基于表示学习重构残差分析的图像集分类方法及系统具有以下突出的有益效果:
本发明通过输入来自于视频序列、影集或监控系统的图像集数据;对所述图像集进行数据预处理操作;将获取的图像数据输入到重构残差分析模型进行模型训练,得到最优投影矩阵;基于最优投影矩阵构建新的图像集分类器;将测试图像集输入到分类器中进行分类,得到对应的类别标签。通过本发明的技术方案,能够有效提升图像集分类准确率。本发明可以准确计算出测试图像集的类标签,并且在多数情况下,本发明(即图中的SRbRRA和CRbRRA)都实现了最好的分类结果。
附图说明
图1是本发明所述方法实现的流程图;
图2是本发明所述系统的结构图;
图3是本发明模型训练的示意图;
图4是本发明分类流程图。
图5是根据各算法在公开数据库Honda/UCSD中进行实验的分类准确率的柱状图;
图6是在不同图像集合上学习到的虚拟重构图像,以及它们对应的欧氏距离的示意图。
具体实施方式
下面将结合附图和实施例,对本发明作进一步详细说明。
图1是本发明基于表示学习重构残差分析的图像集分类方法的流程图,包括以下步骤:
步骤1,获取可以用于计算机识别与处理的视频帧序列,对其进行预处理后得到图像集数据。
步骤2,将图像集数据随机分成训练集与测试集,训练集中的数据再次随机平均分配为训练集与验证集用于训练。
步骤3,在非线性空间中,构建目标损失函数模型,寻找最佳投影的方向,使得类间分散性最大,类内聚合度最小。
步骤4,通过协同表示残差分析与投影矩阵联合优化,或者稀疏表示残差分析与投影矩阵联合优化,学习到紧凑的有判别力的投影矩阵。
步骤5,根据投影矩阵,将训练集和测试集数据投影到更具有鉴别力的特征空间。构建分类器模型,使用投影后的测试集验证算法的有效性。
图2是本发明基于表示学习重构残差分析的图像集分类系统的结构图,包括:
图像集的获取和预处理模块:获取可以用于计算机识别与处理的集合图像数据,对其进行预处理。
数据划分模块:把获取的图像集数据每类中所有样本平均分配,一半样本作为训练集,一半样本作为验证集。
模型构建模块:构建基于表示学习重构残差的图像集特征学习模型,具体包括投影矩阵与样本编码系数联合优化的协同表示残差分析或者稀疏表示残差分析模块。
模型训练模块:通过协同表示残差分析以及稀疏表示残差分析方法,学习到紧凑的有判别力的投影矩阵P。
样本预测模块:根据已经训练好的投影矩阵P,对新的样本数据进行投影,然后基于新的分类方法RLbRRA-ISCRC进行预测,输出它的类标签。
所述的图像集的获取和预处理模块包括:
从手机,相机,或者监控系统等存在集合类数据的存储容器内获取原始样本,通过目标检测或者手工标注的方法从原始样本中裁剪出要分类的目标。同一目标的样本图像可以构成多个集合,每个集合由多幅图像构成。样本图像可以是人脸,物体,手势等。
对获取的目标样本进行预处理,一般步骤是调整图像大小,将图像拉伸为列向量,最后归一化或者其他处理。
作为本实施例的一种可能的实现方式,所述的数据划分模块包括:
通过图像集获取和预处理模块得到了可用于计算机识别和处理的数据,从这些数据中的每一类中随机选取多个集合,用于构建训练集,剩下的集合用来构建验证集合,两者结合用来训练紧凑有判别力的投影矩阵P。
其中:
所述的模型构建模块包括:
训练集数据以及验证集合中的原始特征作为重构残差分析模型的输入,使用验证集合来重构训练集的凸包,两者的之间的凸包距离成为重构残差,目标是同类图像集之间的重构残差距离最小,不同类图像集之间的重构残差距离最大。然后初步学习到的投影矩阵P,以及训练集数据和全体验证集数据作为协同表示残差分析模型或者稀疏表示残差分析模型的输入,使用全体验证集的非线性投影的特征数据重构某一训练集的低维凸包模型。输出为最优的非线性投影矩阵。
所述的模型训练模块包括:
协同表示残差分析或者稀疏表示残差分析模块:首先将训练集中的每个图像集合建模为凸包,然后使用验证集对其进行重构。对投影矩阵以及表示系数进行协同或者稀疏的联合优化,直到最终收敛。输出为最优的投影矩阵P。
所述的样本预测模块包括:
根据已经训练好的投影矩阵P,对新的集合样本数据进行投影,然后基于新的分类方法RLbRRA-ISCRC进行分类,输出测试图像集的类标签。
算例:
本发明以视频序列,影集,监控系统等获取的多幅图像构成的集合作为输入,采用本发明公开的一种基于表示学习重构残差分析的图像集分类方法进行图像集数据分类。
本算例的训练流程图如图3所示,输入数据是从视频序列,影集,监控系统等获取的多幅图像构成的集合。为了避免数据本身存在的问题对模型的性能和结果造成影响,第一步要对原始图像进行预处理。首先对图像序列进行归一化,有的图像集合在第一步也进行了直方图均衡化的处理,通过某种算法将其排列为一种图像集集合矩阵。第二步,将图像集随机拆分为训练集与验证集合,第三步,基于Fisher原则与线性判别分析的思想,构建一个目标模型,希望能够学习到一个可以将图像集样本映射到低维嵌入空间的投影矩阵,使得该空间中的图像集样本类内的重构距离最小,类间重构距离最大。第四步,通过协同表示残差分析方法或者稀疏表示残差分析方法进行联合优化,学习到紧凑的有判别力的投影矩阵。
本算例的测试流程图如图4所示,在训练完成后使用测试集合进行测试,即将测试集送入RLbRRA-ISCRC分类器中分类,计算测试集合到训练集合的欧氏距离,选择距离最小的目标作为测试集合的类标签。
训练并构建完成分类器后,使用测试集进行测试,得到最终的分类结果,结果如图5及图6所示:
图5展示了所提供的方法在Honda数据库上的分类准确率;
图6可视化了在测试图像集以及训练图像集上学习到的图像集最优的重构图像(即最优凸包),并计算了测试图像集到每个训练图像集的欧氏距离。
从实验结果可以看出,本发明可以准确计算出测试图像集的类标签,并且在多数情况下,本发明(即图中的SRbRRA和CRbRRA)都实现了最好的分类结果。
以上所述的实施例,只是本发明较优选的具体实施方式,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

Claims (10)

1.基于表示学习重构残差分析的图像集分类方法,其特征在于,所述方法利用高斯核函数,将获取的图像集数据的低维特征映射到高维空间中,然后通过构建残差判别分析模型学习一个投影矩阵,使得投影后的图像集特征类内重建残差最小,类间重建残差最大;
所述方法通过投影矩阵与编码系数联合学习的优化策略,使学习到的投影矩阵具有更强的泛化性能;
所述优化策略分别基于稀疏表示残差分析方法或协同表示残差分析方法进行优化;
最后基于学习到的投影矩阵,采用图像集分类方法,提取图像集中的判别特征,实现高精度的图像集分类。
2.根据权利要求1所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述方法的实现包括内容如下:
步骤1,获取可用于计算机识别与处理的视频帧序列,对其进行预处理后得到图像集数据;
步骤2,将所述图像集数据随机分成训练集与测试集,所述训练集中的数据再次随机平均分配为训练集1与验证集用于训练;
步骤3,在非线性空间中,构建目标损失函数模型,寻找最佳投影的方向,使得类间分散性最大,类内聚合度最小;
步骤4,通过协同表示残差分析与投影矩阵联合优化或者稀疏表示残差分析,与所述投影矩阵联合优化,学习得到紧凑的有判别力的投影矩阵;
步骤5,根据所述投影矩阵,将所述训练集和测试集数据投影到更具有鉴别力的特征空间;构建分类器模型,使用投影后的测试集验证算法更有效。
3.根据权利要求2所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤1的实现步骤包括内容如下:
步骤1.1,对监控系统视频、手机、相机储存的集合图像进行目标检测,得到只包含目标区域的图像,并对目标区域进行对齐,裁剪操作获取相同大小的目标图像;
步骤1.2,将步骤1.1获得的所述目标图像转为灰度图像,然后对其进行直方图均衡化处理,以减轻光照变化产生的影响,最后将每幅图像都拉伸为列向量;
步骤1.3,将步骤1.2获得的所述列向量进行归一化处理,初步减少异常值的影响。
4.根据权利要求2所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤2的实现步骤包括内容如下:
步骤2.1,从所述步骤1获取的图像集数据的每个类中随机抽取若干个集合,用于构建训练集;
步骤2.2,把抽取的训练集中的每个图像集随机均分为新的训练集1和验证集,分别做如下描述:
对于训练集1,用
Figure FDA0003320069150000021
表示,其中:c是图像集类的个数,
Figure FDA0003320069150000022
是第i个图像集,其包含了
Figure FDA0003320069150000023
张图像
Figure FDA0003320069150000024
并且
Figure FDA0003320069150000025
表示在Gallery set中第i个图像集的第j张图像,m是图像的特征维度;
对于验证集,用
Figure FDA0003320069150000026
表示,同样也包括c个不同的类,其中ny表示所有验证图像的数量;
步骤2.3,将所有类中剩余的图像集合,构成测试集,用于检验模型的性能;记录其中每个图像集合的类标签。
5.根据权利要求2所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤3的实现步骤包括内容如下:
步骤3.1,引入核映射,步骤如下:
首先引入非线性映射函数φ,用来映射数据到高维特征空间
Figure FDA0003320069150000027
其中,Xi表示为:
Figure FDA0003320069150000028
假设图像集位于由全体训练图像张成的仿射子空间中,通过使用凸包AH={φ(Xii|∑kαi,k=1}来对图像集进行建模表示,其中
Figure FDA0003320069150000029
通过设置判别投影矩阵,将非线性数据投影到低维空间中,使得同类图像集之间的重构残差最小,不同类图像集之间的重构残差最大,其中:
所述同类的图像集重构残差表示为:
Figure FDA00033200691500000210
其中Yl是与Xl同类的验证集样本,αl,βl是第l类的编码系数;
所述不同类的图像集之间的重构残差表示为:
Figure FDA00033200691500000211
其中,M是所有不同类重构残差距离的数量;
将以上两个模型综合考虑:
Figure FDA0003320069150000031
其中λ是平衡参数,f1,f2都是正则化项,并且:
Figure FDA0003320069150000032
加入约束PTP=I。
6.根据权利要求5所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤4的实现步骤包括内容如下:
步骤4.1,为了求出上述公式中的P,α,β,分别在L1范数和L2范数的约束下交替更新非线性投影矩阵P以及α,β,求解过程分成以下两步:
第一步,固定α,β,更新P,得到如下新的优化问题:
Figure FDA0003320069150000033
将该模型采用迹优化策略进行处理,简化之后得如下优化问题:
Figure FDA0003320069150000034
其中
Figure FDA0003320069150000035
称为类内散度,
Figure FDA0003320069150000036
称为类间散度;
对上式进行求解,得到如下的特征值分解问题:
Figure FDA0003320069150000037
其中W=[W1,...,Wd],γ是对角矩阵;
第二步,固定P,对α,β更新,通过求解下面的等价模型来获得α,β:
Figure FDA0003320069150000038
Figure FDA0003320069150000039
其中:
Figure FDA0003320069150000041
是第i个类的样本的编码系数向量;
Figure FDA0003320069150000042
是所有验证集合中第i个类对应的编码系数向量。
7.根据权利要求6所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤4的实现步骤还包括内容如下:
步骤4.2,固定投影矩阵,执行协同表示残差分析方法,求解如下问题:
Figure FDA0003320069150000043
其中Ai=PTφ(Xi),B=PTφ(Y);其中:
Figure FDA0003320069150000044
其中公式中的0和1都是向量;
所述协同表示残差分析采用如下的迭代策略进行求解:
如果αi是固定的,βi的更新:
Figure FDA0003320069150000045
其中
Figure FDA0003320069150000046
如果βi是固定的,αi的更新:
Figure FDA0003320069150000047
其中
Figure FDA0003320069150000048
通过W,α,β的交替更新,直到收敛,求得最优的投影矩阵。
8.根据权利要求6所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤4的实现步骤还包括内容如下:
步骤4.2,构建稀疏表示残差分析方法,步骤如下:
首先定义PTφ(Xi)=Ai,PTφ(Y)=B,则稀疏表示残差分析方法被定义为:
Figure FDA0003320069150000049
Figure FDA00033200691500000410
选用ADMM算法来优化,上述模型分成以下两个子问题来迭代求解:
子问题:固定1α,更新β
Figure FDA00033200691500000411
子问题2:固定β,更新α
Figure FDA0003320069150000051
通过引入辅助变量ζ1,子问题1通过迭代计算下面的公式进行求解:
Figure FDA0003320069150000052
Figure FDA0003320069150000053
Figure FDA0003320069150000054
其中
Figure FDA0003320069150000055
是拉格朗日乘子;
同理,通过引入辅助变量ζ2,子问题2通过迭代计算下面的公式进行求解:
Figure FDA0003320069150000056
Figure FDA0003320069150000057
Figure FDA0003320069150000058
Figure FDA0003320069150000059
其中θ2,θ3都是拉格朗日乘子。
9.根据权利要求2所述的基于表示学习重构残差分析的图像集分类方法,其特征在于,所述步骤5的实现步骤如下:
步骤5.1,提供一种图像集分类算法,具体模型下:
Figure FDA00033200691500000510
Figure FDA00033200691500000511
其中X=[X1,...,Xk,...,Xc],β=[β1;β2;...;βk;...;βc],Q表示某测试图像集合;
步骤5.2,使用最小二乘法对所述模型进行求解,得到最优系数
Figure FDA00033200691500000512
Figure FDA00033200691500000513
进而计算测试图像集Q到每个训练图像集的距离ei,并得到测试集Q的类标签:
Figure FDA00033200691500000514
Figure FDA0003320069150000061
所述label为测试图像集合的预测类标签。
10.根据上述任一权利要求的基于表示学习重构残差分析的图像集分类系统,其特征在于,所述系统包括:
图像集数据的获取和预处理模块:获取用于计算机识别与处理的集合图像数据,并对其进行预处理;
数据划分模块:把获取的图像集数据每类中所有样本平均分配,一半样本作为训练集,一半样本作为验证集;
模型构建模块:构建基于表示学习重构残差的图像集特征学习模型,包括投影矩阵与样本编码系数联合优化的协同表示残差分析模块或者稀疏表示残差分析模块;
模型训练模块:通过所述协同表示残差分析或者稀疏表示残差分析方法模块,学习获得紧凑的有判别力的投影矩阵P;
样本预测模块:根据已经训练好的投影矩阵P,对新的样本数据进行投影,然后基于图像集分类算法进行预测,输出它的类标签;
所述图像集分类算法模型下:
Figure FDA0003320069150000062
Figure FDA0003320069150000063
其中X=[X1,...,Xk,...,Xc],β=[β1;β2;...;βk;...;βc],Q表示某测试图像集合。
CN202111243560.6A 2021-10-25 2021-10-25 一种基于表示学习重构残差分析的图像集分类方法及系统 Expired - Fee Related CN113887661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111243560.6A CN113887661B (zh) 2021-10-25 2021-10-25 一种基于表示学习重构残差分析的图像集分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111243560.6A CN113887661B (zh) 2021-10-25 2021-10-25 一种基于表示学习重构残差分析的图像集分类方法及系统

Publications (2)

Publication Number Publication Date
CN113887661A true CN113887661A (zh) 2022-01-04
CN113887661B CN113887661B (zh) 2022-06-03

Family

ID=79014036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111243560.6A Expired - Fee Related CN113887661B (zh) 2021-10-25 2021-10-25 一种基于表示学习重构残差分析的图像集分类方法及系统

Country Status (1)

Country Link
CN (1) CN113887661B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861720A (zh) * 2023-02-28 2023-03-28 人工智能与数字经济广东省实验室(广州) 一种小样本亚类图像分类识别方法
CN115905974A (zh) * 2022-11-04 2023-04-04 北京科技大学 一种高炉异常炉况检测方法
CN116108613A (zh) * 2022-11-07 2023-05-12 中山大学 一种可解释的装备组合快速构建方法、系统、设备及介质
CN116347104A (zh) * 2023-05-22 2023-06-27 宁波康达凯能医疗科技有限公司 基于高效判别分析的帧内图像编码方法、装置及存储介质
CN116908808A (zh) * 2023-09-13 2023-10-20 南京国睿防务系统有限公司 一种基于rtn的高分辨一维像目标识别方法
CN117668611A (zh) * 2023-11-28 2024-03-08 鲁东大学 基于投影矩阵面积特征选择的左心室肥大识别方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916369A (zh) * 2010-08-20 2010-12-15 西安电子科技大学 基于核最近子空间的人脸识别方法
CN106095811A (zh) * 2016-05-31 2016-11-09 天津中科智能识别产业技术研究院有限公司 一种基于最优编码的监督离散哈希的图像检索方法
CN108805157A (zh) * 2018-04-11 2018-11-13 南京理工大学 基于部分随机监督离散式哈希的遥感图像分类方法
CN109615014A (zh) * 2018-12-17 2019-04-12 清华大学 一种基于kl散度优化的数据分类系统与方法
CN109978064A (zh) * 2019-03-29 2019-07-05 苏州大学 基于图像集的李群字典学习分类方法
CN111753713A (zh) * 2020-06-23 2020-10-09 菏泽学院 基于稀疏表示和深度级联的心电信号身份识别方法和系统
CN112257600A (zh) * 2020-10-22 2021-01-22 苏州天可智能科技有限公司 一种人脸识别方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916369A (zh) * 2010-08-20 2010-12-15 西安电子科技大学 基于核最近子空间的人脸识别方法
CN106095811A (zh) * 2016-05-31 2016-11-09 天津中科智能识别产业技术研究院有限公司 一种基于最优编码的监督离散哈希的图像检索方法
CN108805157A (zh) * 2018-04-11 2018-11-13 南京理工大学 基于部分随机监督离散式哈希的遥感图像分类方法
CN109615014A (zh) * 2018-12-17 2019-04-12 清华大学 一种基于kl散度优化的数据分类系统与方法
CN109978064A (zh) * 2019-03-29 2019-07-05 苏州大学 基于图像集的李群字典学习分类方法
CN111753713A (zh) * 2020-06-23 2020-10-09 菏泽学院 基于稀疏表示和深度级联的心电信号身份识别方法和系统
CN112257600A (zh) * 2020-10-22 2021-01-22 苏州天可智能科技有限公司 一种人脸识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIZHANGAO等: "Sparse and collaborative representation based kernel pairwise linear regression for image set classification", 《EXPERT SYSTEMS WITH APPLICATIONS》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905974A (zh) * 2022-11-04 2023-04-04 北京科技大学 一种高炉异常炉况检测方法
CN115905974B (zh) * 2022-11-04 2024-02-27 北京科技大学 一种高炉异常炉况检测方法
CN116108613A (zh) * 2022-11-07 2023-05-12 中山大学 一种可解释的装备组合快速构建方法、系统、设备及介质
CN116108613B (zh) * 2022-11-07 2023-12-01 中山大学 一种可解释的装备组合快速构建方法、系统、设备及介质
CN115861720A (zh) * 2023-02-28 2023-03-28 人工智能与数字经济广东省实验室(广州) 一种小样本亚类图像分类识别方法
CN116347104A (zh) * 2023-05-22 2023-06-27 宁波康达凯能医疗科技有限公司 基于高效判别分析的帧内图像编码方法、装置及存储介质
CN116347104B (zh) * 2023-05-22 2023-10-17 宁波康达凯能医疗科技有限公司 基于高效判别分析的帧内图像编码方法、装置及存储介质
CN116908808A (zh) * 2023-09-13 2023-10-20 南京国睿防务系统有限公司 一种基于rtn的高分辨一维像目标识别方法
CN116908808B (zh) * 2023-09-13 2023-12-01 南京国睿防务系统有限公司 一种基于rtn的高分辨一维像目标识别方法
CN117668611A (zh) * 2023-11-28 2024-03-08 鲁东大学 基于投影矩阵面积特征选择的左心室肥大识别方法及系统

Also Published As

Publication number Publication date
CN113887661B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN113887661B (zh) 一种基于表示学习重构残差分析的图像集分类方法及系统
Chen et al. A cascaded convolutional neural network for age estimation of unconstrained faces
CN105138973B (zh) 人脸认证的方法和装置
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN103150580B (zh) 一种高光谱图像半监督分类方法及装置
Wang et al. Learning 3d keypoint descriptors for non-rigid shape matching
CN112232374B (zh) 基于深度特征聚类和语义度量的不相关标签过滤方法
Dong Optimal Visual Representation Engineering and Learning for Computer Vision
CN109492610B (zh) 一种行人重识别方法、装置及可读存储介质
Wang et al. Advanced Multimodal Deep Learning Architecture for Image-Text Matching
CN110009017A (zh) 一种基于视角类属特征学习的多视角多标记分类方法
CN117690178B (zh) 一种基于计算机视觉的人脸图像识别方法与系统
CN110751005B (zh) 融合深度感知特征和核极限学习机的行人检测方法
Xu et al. Discriminative analysis for symmetric positive definite matrices on lie groups
Avola et al. Real-time deep learning method for automated detection and localization of structural defects in manufactured products
Wang et al. A novel multiface recognition method with short training time and lightweight based on ABASNet and H-softmax
CN112257600B (zh) 一种人脸识别方法及系统
CN114187506A (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法
Sun et al. Multiple-kernel, multiple-instance similarity features for efficient visual object detection
Dong et al. A supervised dictionary learning and discriminative weighting model for action recognition
CN116310416A (zh) 基于Radon变换的可变形物体相似度检测方法及电子设备
Lei et al. Student action recognition based on multiple features
Jun et al. Two-view correspondence learning via complex information extraction
Mao et al. A Transfer Learning Method with Multi-feature Calibration for Building Identification
CN115115898B (zh) 一种基于无监督特征重构的小样本目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220603