CN108021930B - 一种自适应的多视角图像分类方法及系统 - Google Patents

一种自适应的多视角图像分类方法及系统 Download PDF

Info

Publication number
CN108021930B
CN108021930B CN201711140976.9A CN201711140976A CN108021930B CN 108021930 B CN108021930 B CN 108021930B CN 201711140976 A CN201711140976 A CN 201711140976A CN 108021930 B CN108021930 B CN 108021930B
Authority
CN
China
Prior art keywords
label
view
adaptive
matrix
training set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711140976.9A
Other languages
English (en)
Other versions
CN108021930A (zh
Inventor
张召
贾磊
李凡长
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201711140976.9A priority Critical patent/CN108021930B/zh
Publication of CN108021930A publication Critical patent/CN108021930A/zh
Application granted granted Critical
Publication of CN108021930B publication Critical patent/CN108021930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种自适应的多视角图像分类方法及系统,将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。

Description

一种自适应的多视角图像分类方法及系统
技术领域
本发明涉及计算机视觉和图像识别技术领域,更具体的说,是涉及一种自适应的多视角图像分类方法及系统。
背景技术
由于标签传播在标签预测过程的有效性和效率,近来年,在模式识别和机器学习领域引起了人们的极大关注。标签传播是基于标记和未标记数据的几何结构,将标记数据的有监督标签信息传播到未标记样本的过程。一般来说,现有的基于图形的方法主要集中在从单个视角中预测标签,即单视角分类。但在现实生活中,许多数据集包含在多个视角中的不同表示或来自多个视角源,这激发了一个新的研究领域,即多视角学习。虽然给定数据的每个视角表示对于给定的学习任务可能是足够的,但是忽略不同视角的重要互补信息,即将每个视角分开学习。因此,多视角学习的主要挑战是开发算法来整合多个视角的补充信息,以增强表示和标签预测性能。
为了将实际应用领域从单视角扩展到多视角,并克服单视角标签传播的缺点,最近来,MLPP-CLP和AMGL将多视角学习的概念纳入到标签传播学习中。AMGL建议为各种视角中的所有子图学习一组加权因子,然后对每个视角预先计算的拉普拉斯矩阵执行半监督分类。而MLPP-CLP是通过查找预测来利用从多个数据表示获得的信息。显然,他们在将多视角重构过程从多视角标签传播过程中明确分离出来,因此不能保证来自各种视角的图权重对于随后的多视角标签估计是最佳的,并且都会在确定最佳邻域大小或内核宽度时遇到同样棘手的问题。此外,近邻的数量通常是人为的为每个视角固定相同的值,但是这种操作显然不能考虑各种实际数据的实际分布,也不考虑各种视角的不同分布。应该指出的是,上述几个遇到的问题可能导致分类性能下降。
因此,提供一种新的多视角标签传播框架,通过将多视角标签传播学习扩展到自适应学习场景,是本领域技术人员亟待解决的问题。
发明内容
本发明的发明目的是提供一种自适应的多视角图像分类方法及系统,以克服现有技术中仅限于单视角分类或者不能高效的结合多个视角对数据图像进行快速直接的分类,最大化分类精度的问题。
为达到上述发明目的,本发明采用的技术方案是:一种自适应的多视角图像分类方法,包括:
(1)、对原始多视角数据集进行随机划分,获得有标签训练集及无标签训练集,根据划分出来的所述有标签训练集和无标签训练集进行类别标签矩阵初始化;
(2)、联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性;
(3)、通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签。
优选地,所述联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性,包括:所述框架为
Figure BDA0001471464090000021
其中,
Figure BDA0001471464090000022
是软标签矩阵,c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0,α和β是该稀疏编码项的权衡参数,
Figure BDA0001471464090000023
为自适应权重系数矩阵;
对上述向量形式的框架进行转换,得到如下矩阵形式的框架:
Figure BDA0001471464090000024
其中,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
优选地,所述原始数据集为图像数据向量集合
Figure BDA0001471464090000025
其中dν是训练样本的维度,N是样本的数量),其中V代表数据集视角个数。
优选地,步骤(3)中所述通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签,包括:对所述框架最小化求解,最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应的位置即为无标签训练样本的归属类别标签,每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi)i,其中
Figure BDA0001471464090000026
(fi)i表示预测的软标签向量fi第i个元素位置。输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类结果。
本发明还公开了一种自适应的多视角图像分类系统,包括:
训练预处理模块,对原始多视角数据集进行随机划分,获得有标签训练集和无标签训练集,根据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化;
训练模块,联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,并对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块,对于迭代生成的所述软标签矩阵F,最后每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi),其中
Figure BDA0001471464090000031
(fi)i表示预测的软标签向量fi第i个元素位置。根据无标签训练集对应的最大值得到对应的标签预测类别。
本发明中,对于多视角表示和标签传播,旨在将自适应多图重建权重学习和多视角标签传播整合到一个统一的框架。利用标签传播方法对训练集中的有标签样本进行训练,并且同时得无标定数据的类别标签,输出分类结果;
基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。值得注意的是,重建权重学习和标签传播学习的联合制定可以确保学习的权重对于表示和分类都是最佳的。
利用基于每个单视角所求得的自适应重构权计算自适应关联矩阵,为下一步标签传播做好准备;
将计算得到的关联矩阵进行标签传播,输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类。
由于上述技术方案运用,本发明与现有技术相比具有下列优点:
本发明公开了一种自适应的多视角图像分类方法及系统,理论提出了一种新的自适应半监督多视角标签传播学习框架,并设计完成一个基于自适应多视角学习方法的图像分类系统。本发明方法将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。与传统单视角分类方法相比,多视角方法可充分挖掘多个视角之间的内在关系,显著增强了分类结果。
附图说明
图1为本发明实施例一中UMISTface特征识别数据结果对比图;
图2为本发明实施例一中GeorgiaTech face特征识别数据结果对比图;
图3为本发明实施例一中ORLface特征识别数据结果对比图;
图4为本发明实施例一中Reuters Multilingual数据集结果对比图;
图5为本发明实施例一中HandwrittenNumerals数据集结果对比图;
图6为本发明实施例公开的一种自适应的多视角图像分类方法流程图;
图7为本发明实施例公开的一种自适应的多视角图像分类系统结构图;
图8为本发明实施例公开的一种自适应的多视角图像分类方法的图像类别预测及分类过程示意图。
具体实施方式
下面结合附图及实施例对本发明作进一步描述:
实施例一:
参见图1至图5所示,本发明在五个图像数据的数据库进行了测试:UMIST face,Georgia Tech fac,ORLface,Reuters Multilingual和handwritten numerals。其中人脸数据集和Reuters Multilingual都包含五个视角,handwritten numerals包含了六个视角。这些数据库从多方面收集,因而测试结果具有普遍说明性。
请参阅附图6,为本发明实施例公开的一种自适应的多视角图像分类的方法流程图。本发明实施例公开的一种自适应的多视角图像分类的方法,具体实施步骤为:
步骤101:对多视角数据集进行随机划分,生产有标签训练集和无标签训练集,跟据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵Y初始化,同时对一些必要的参数初始化,具体为:
随机的从原始c类样本数据集中的每类选取一定量的样本作为有标签训练集,剩下的用作无标签训练集;初始化训练集的类别标签矩阵,Y=[y1,y2,…,yl+u],对于已标记样本xi,假定 xi属于第i类,则yi,j=1,反之,若xi未被标记,则yi,j=0;对于自适应权重Wν利用AdaptiveNP中的S初始化。
步骤102:联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1 范数正则化,提升整体预测准度和鲁棒性,即基于预处理后的数据,建立模型进行训练,具体为:
基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。
其中所述原始多视角数据集为图像数据向量集合
Figure BDA0001471464090000051
其中dν是训练样本的维度,N是样本的数量),其中V代表数据集视角个数,通过解决如下问题得到软标签矩阵F:
Figure BDA0001471464090000052
其中,
Figure BDA0001471464090000053
是软标签矩阵,其中c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0。α和β是该稀疏编码项的权衡参数。
Figure BDA0001471464090000054
为自适应权重系数矩阵;上述目标函数为向量形式,其矩阵定义为:
Figure BDA0001471464090000055
其中,对上述目标函数,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
步骤103:对目标函数利用迭代的优化方案进行求解,最终得到最优的软标签矩阵F, 取最大值对应位置的类别标号,即为类别归属,具体为:
由于上述目标函数同时包含两个未知变量,对上述框架进行最小化求解时,本发明采用迭代的优化思路。具体方法为:
首先利用AdaptiveNP中的自适应权重对本发明方法中各个视角的自适应权重进行初始化赋值,然后固定自适应权重对软标签F进行计算,具体可归纳为对如下公式进行优化:
首先提出对软标签矩阵F进行更新,可归纳为对如下公式进行优化:
Figure BDA0001471464090000061
利用Lagrange function对上述问题进行求解,可构造如下函数:
Figure BDA0001471464090000062
其中δ是拉格朗日乘子,ψ(δ,F)为约束项。对上式进行求F偏导数可得:
Figure BDA0001471464090000063
其中λν可被看做权重因子,用来权衡各个视角数据对于最小化重构误差的贡献度,可通过如下公式计算:
Figure BDA0001471464090000064
其中
Figure BDA0001471464090000065
是一个自适应的关联矩阵,I为维度为N的单位矩阵。λν是依靠变量F存在的,因此可以通过相互迭代来计算F和λν,并且λν中的各个值被初始化为1/V。综上所述,关于F的目标函数可以被重写为:
Figure BDA0001471464090000066
对上式进行求F偏导,并且取值为0,最终可得到F的更新公式:
Figure BDA0001471464090000067
利用上述方式求得软标签矩阵F值后,可固定F对自适应权重矩阵Wν进行求解更新,具体归纳为对如下公式进行优化:
Figure BDA0001471464090000068
其中α||Xν-XνWν||2,1+β||Wν||2,1为基于L2,1范数正则化稀疏编码的权重构造。上述公式可转化为对如下几个变量求解:
Figure BDA0001471464090000069
其中,
Figure BDA00014714640900000610
Figure BDA00014714640900000611
分别定义如下:
Figure BDA00014714640900000612
通过对自适应权重矩阵的目标函数进行求Wν偏导,且等式右边取值为0,可得:
Figure BDA0001471464090000071
上式即为Wν在第(t+1)次迭代的更新公式。
最后,因为Wν和λν都是关于F的函数,所以该方法通过对三个变量相互迭代使目标函数得到有效解决,最后得出软标签F和预测结果。
具体算法如下:
一种自适应的多视角图像分类算法
输入:原始数据集
Figure BDA0001471464090000072
初始标签集
Figure BDA0001471464090000073
控制参数α和β;
初始化:F=Y;λν=1/V;初始化Wν值为AdaptiveNP中的自适应重构权S;
当未收敛时:
1).固定
Figure BDA00014714640900000718
Figure BDA0001471464090000075
更新Ft+1:
Figure BDA0001471464090000076
2).固定W
Figure BDA00014714640900000719
和Ft,更新
Figure BDA0001471464090000078
Figure BDA0001471464090000079
3).固定Ft
Figure BDA00014714640900000710
更新自适应权重矩阵
Figure BDA00014714640900000711
Figure BDA00014714640900000712
4).固定
Figure BDA00014714640900000720
更新
Figure BDA00014714640900000714
Figure BDA00014714640900000715
Figure BDA00014714640900000716
检查是否收敛:
若sqrt(sum(tmp(:).2))<tol||iter>=maxIter则停止;
否则t=t+1
输出:软标签矩阵(F*←Ft+1)。
最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应位置即为无标签样本的归属类别标签,每个无标签样本的硬标签可以被归结为arg maxi≤c(fi)i,其中
Figure BDA00014714640900000717
(fi)i表示预测的软标签向量fi第i个元素位置。
本发明公开了一种自适应的多视角图像分类方法及系统,理论提出了一种新的自适应半监督多视角标签传播学习框架,并设计完成一个基于自适应多视角学习方法的图像分类系统。本发明方法将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,通过引入线性变换来获取不同视角空间的权重参数,进而结合每个视角构建最优的权重系数。由于在多视角数据权重学习方面采用了自适应方式,可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的近邻数量或高斯核参数选择难问题。模型主要通过在训练过程中最小化基于多视角数据的分类误差和其重构系数之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。与传统单视角分类方法相比,多视角方法可充分挖掘多个视角之间的内在关系,显著增强了分类结果。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的系统实现,因此本发明还公开了一种系统,下面给出具体的实施例进行详细说明。
请参阅附图7,为本发明实施例公开的一种自适应的多视角图像分类的系统结构图。本发明公开了一种自适应的多视角图像分类的系统,该系统具体包括:
训练预处理模块201对原始多视角数据集进行随机划分,生产有标签训练集和无标签训练集,跟据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化Y。同时对一些必要的参数初始化;
训练模块202联合多视角学习和标签传播构建统一型框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块203基于所述预测类别软标签矩阵确定待测样本对应的类别标签,即对于所述软标签矩阵F,最后每个无标签训练样本的硬标签可以被归结为arg maxi≤c(fi),其中
Figure BDA0001471464090000081
(fi)i表示预测的软标签向量fi第i个元素位置,根据无标签训练集对应的最大值得到对应的标签预测类别。
具体为:给定原始多视角数据集为图像数据向量集合
Figure BDA0001471464090000082
(其中,dν是某一视角训练样本的维度,N是样本的数量),其中包含有c个类别标签 (c>2),所述训练模型为:
Figure BDA0001471464090000091
其中,
Figure BDA0001471464090000092
是软标签矩阵,其中c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0。α和β是该稀疏编码项的权衡参数。
Figure BDA0001471464090000093
为自适应权重系数矩阵;上述目标函数为向量形式,其矩阵定义为:
Figure BDA0001471464090000094
其中,上述目标函数中的第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
由于上述目标函数同时包含两个未知变量,对上述框架进行最小化求解时,本发明采用迭代的优化思路。具体方法为:
首先利用AdaptiveNP中的自适应权重对本发明方法中各个视角的自适应权重进行初始化赋值,然后固定自适应权重对软标签F进行计算,具体可归纳为对如下公式进行优化:
首先提出对软标签矩阵F进行更新,可归纳为对如下公式进行优化:
Figure BDA0001471464090000095
利用Lagrange function对上述问题进行求解,可构造如下函数:
Figure BDA0001471464090000096
其中δ是拉格朗日乘子,ψ(δ,F)为约束项。对上式进行求F偏导数可得:
Figure BDA0001471464090000097
其中λν可被看做权重因子,用来权衡各个视角数据对于最小化重构误差的贡献度,可通过如下公式计算:
Figure BDA0001471464090000098
其中
Figure BDA0001471464090000099
是一个自适应的关联矩阵,I为维度为N的单位矩阵。λν是依靠变量F存在的,因此可以通过相互迭代来计算F和λν,并且λν中的各个值被初始化为1/V。综上所述,关于F的目标函数可以被重写为:
Figure BDA0001471464090000101
对上式进行求F偏导,并且取值为0,最终可得到F的更新公式:
Figure BDA0001471464090000102
利用上述方式求得软标签矩阵F值后,可固定F对自适应权重矩阵Wν进行求解更新,具体归纳为对如下公式进行优化:
Figure BDA0001471464090000103
其中α||Xν-XνWν||2,1+β||Wν||2,1为基于L2,1范数正则化稀疏编码的权重构造。上述公式可转化为对如下几个变量求解:
Figure BDA0001471464090000104
其中,
Figure BDA0001471464090000105
Figure BDA0001471464090000106
分别定义如下:
Figure BDA0001471464090000107
通过对自适应权重矩阵的目标函数进行求Wν偏导,且等式右边取值为0,可得:
Figure BDA0001471464090000108
上式即为Wν在第(t+1)次迭代的更新公式。
最后,因为Wν和λν都是关于F的函数,所以该方法通过对三个变量相互迭代使目标函数得到有效解决,最后得出软标签F和预测结果。其中向量fi中最大元素的位置就是xi的类别。
参阅图1~3,为本发明方法和LNP、SLP、LLGC、GFHF、CD-LNP、SIS-LP、 LapLDA、ProjLP、AdaptiveNP、SparseNP、和AMGL方法在三个数据集、一个Handwritten Numerals和一个Reuters Multilingual数据集的识别结果对比表,给出了各方法实验的精度。本例中,参与比较的LNP、SLP、LLGC、GFHF、CD-LNP、SIS-LP、LapLDA、ProjLP、 AdaptiveNP、SparseNP、和AMGL方法均采用各文献中算法使用的默认参数。
请参阅附图8,为本发明实施例公开的一种自适应的多视角图像分类方法的图像类别预测及分类过程示意图,其中包括自适应权重构造与标签传播两个过程。
综上所述:本发明公开了一种自适应的多视角图像分类方法及系统,与传统单视角分类方法不同的是利用多个视角增强分类结果。提出了一种新的自适应多视角标签传播框架。本发明将多视角标签传播和自适应多图权重学习整合到一个统一的框架中,充分探索各视角间的互补性,其中引入线性变换来形成不同视角空间的不同权重。因此,可以结合每个视角构建最优图形权重。由于在多视角中构造多个权重的自适应方式,本发明可以避免传统的单视角和多视角标签传播方法过程中遇到的复杂而棘手的邻域大小或内核宽度选择难问题。模型主要通过在训练过程中最小化分类误差和其稀疏编码之中的重构误差,最终输出样本的类别归属概率,取概率的最大值,用于图像类别的鉴定,得到最准确的分类结果。此外,使用迭代方案来解决所提出的模型,可快速实现样本数据的分类,有效提高图像分类的精准度。

Claims (5)

1.一种自适应的多视角图像分类方法,其特征在于,包括:
(1)、对原始多视角数据集进行随机划分,获得有标签训练集及无标签训练集,根据划分出来的所述有标签训练集和无标签训练集进行类别标签矩阵初始化;
(2)、联合自适应多图重建权重学习和多视角标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性;
(3)、通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签;
其中步骤(1)具体为:随机的从原始c类样本数据集中的每类选取一定量的样本作为有标签训练集,剩下的用作无标签训练集;初始化训练集的类别标签矩阵,Y=[y1,y2,…,yl+u],对于已标记样本xi,假定xi属于第i类,则yi,j=1,反之,若xi未被标记,则yi,j=0;对于自适应权重Wν利用AdaptiveNP中的S初始化;
步骤(2)具体为:基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。
2.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,所述联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,同时在稀疏编码系数和重构错误施加L2,1范数正则化,提升整体预测准度和鲁棒性,包括:所述框架为
Figure FDA0003391848170000011
其中,
Figure FDA0003391848170000012
是软标签矩阵,c表示类别标签个数,yi表示xi的初始类别信息,μi表示xi的调整参数,当训练集中xi的标签已知时,对应的μi=+∞,反之μi=0,α和β是该稀疏编码项的权衡参数,
Figure FDA0003391848170000013
为自适应权重系数矩阵;
对上述向量形式的框架进行转换,得到如下矩阵形式的框架:
Figure FDA0003391848170000014
其中,第一项为标签重构项;第二项为基于L2,1范数的稀疏编码,用于分别计算各个视角的自适应权重系数矩阵,并且在自适应权重矩阵上同时也施加了L2,1范数,以达到行稀疏的目的;第三项为标签拟合项,用于确保有标签样本在传播过程中,其所携带的标签信息不被改变。
3.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,所述原始多视角数据集为图像数据向量集合
Figure FDA0003391848170000021
其中dν是训练样本的维度,N是样本的数量,其中V代表数据集视角个数。
4.根据权利要求1所述的自适应的多视角图像分类方法,其特征在于,步骤(3)中所述通过迭代优化对所述框架求解最小化问题,得到预测类别软标签矩阵,基于所述预测类别软标签矩阵确定待测样本对应的类别标签,包括:对所述框架最小化求解,最终得到每个无标签训练样本的软标签向量fi,所得向量的最大元素对应的位置即为无标签训练样本的归属类别标签,每个无标签训练样本的硬标签可以被归结为argmaxi≤c(fi)i,其中
Figure FDA0003391848170000022
表示预测的软标签向量fi第i个元素位置,输出无标签样本的类别归属概率,取概率最大值,用于图像类别的鉴定,得到最准确的分类结果。
5.一种自适应的多视角图像分类系统,其特征在于,包括:
训练预处理模块,用于对原始多视角数据集进行随机划分,获得有标签训练集和无标签训练集,根据划分出来的有标签训练集和无标签训练集,进行类别标签矩阵初始化;
训练模块,用于联合多视角学习和标签传播构建统一的框架进行学习训练,实现稀疏重构误差和分类误差同时最小化,并对稀疏编码系数和重构错误进行L2,1范数正则化,利用L2,1范数正则化度量增强提升整体预测准度和鲁棒性,通过迭代优化最终得到无标签训练集的软标签矩阵F;
测试模块,用于基于所述软标签矩阵F确定待测样本对应的类别标签;
其中训练预处理模块具体为:随机的从原始c类样本数据集中的每类选取一定量的样本作为有标签训练集,剩下的用作无标签训练集;初始化训练集的类别标签矩阵,Y=[y1,y2,…,yl+u],对于已标记样本xi,假定xi属于第i类,则yi,j=1,反之,若xi未被标记,则yi,j=0;对于自适应权重Wν利用AdaptiveNP中的S初始化;
训练模块具体为:基于多视角训练集中的数据及标签信息,将原始多视角训练集中图像数据进行基于L2,1范数稀疏编码,利用每个单视角构建最佳自适应重构权重矩阵,分别得到各个视角的自适应权重,再通过多权重融合,以充分利用线性变换来进行视角间信息的互补。
CN201711140976.9A 2017-11-16 2017-11-16 一种自适应的多视角图像分类方法及系统 Active CN108021930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711140976.9A CN108021930B (zh) 2017-11-16 2017-11-16 一种自适应的多视角图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711140976.9A CN108021930B (zh) 2017-11-16 2017-11-16 一种自适应的多视角图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN108021930A CN108021930A (zh) 2018-05-11
CN108021930B true CN108021930B (zh) 2022-01-14

Family

ID=62079901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711140976.9A Active CN108021930B (zh) 2017-11-16 2017-11-16 一种自适应的多视角图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN108021930B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111008637A (zh) * 2018-10-08 2020-04-14 北京京东尚科信息技术有限公司 图像分类方法及系统
CN111382758B (zh) * 2018-12-28 2023-12-26 杭州海康威视数字技术股份有限公司 训练图像分类模型、图像分类方法、装置、设备及介质
CN110008365B (zh) * 2019-04-09 2023-02-07 广东工业大学 一种图像处理方法、装置、设备及可读存储介质
CN110222793B (zh) * 2019-06-20 2021-06-22 中国科学院自动化研究所 基于多视角主动学习的在线半监督分类方法及系统
CN110727833B (zh) * 2019-09-30 2023-03-31 广东工业大学 一种基于多视角学习的图数据检索结果优化方法
CN111680579B (zh) * 2020-05-22 2023-08-01 常州工业职业技术学院 一种自适应权重多视角度量学习的遥感图像分类方法
CN112884030B (zh) * 2021-02-04 2022-05-06 重庆邮电大学 一种基于交叉重建的多视角分类系统及方法
CN113985733B (zh) * 2021-10-26 2023-11-17 云南电网有限责任公司电力科学研究院 一种基于自适应概率学习的配电网故障辨识方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529604A (zh) * 2016-11-24 2017-03-22 苏州大学 一种自适应的图像标签鲁棒预测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529604A (zh) * 2016-11-24 2017-03-22 苏州大学 一种自适应的图像标签鲁棒预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Learning Flexible Graph-Based Semi-Supervised Embedding;Fadi Dornaika等;《 IEEE Transactions on Cybernetics》;20150226;第46卷(第1期);第206-218页 *

Also Published As

Publication number Publication date
CN108021930A (zh) 2018-05-11

Similar Documents

Publication Publication Date Title
CN108021930B (zh) 一种自适应的多视角图像分类方法及系统
JP7125544B2 (ja) 品質スコアの勾配を使用した反復的なタンパク質構造予測
CN111191514B (zh) 一种基于深度学习的高光谱图像波段选择方法
US6636862B2 (en) Method and system for the dynamic analysis of data
JP2021524099A (ja) 異なるデータモダリティの統計モデルを統合するためのシステムおよび方法
CN108171279B (zh) 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
CN105608478B (zh) 一种图像的特征提取与分类联合方法及系统
CN109214429A (zh) 基于矩阵引导正则化的局部缺失多视图聚类机器学习方法
CN108229551B (zh) 一种基于紧凑字典稀疏表示的高光谱遥感图像分类方法
KR20020030744A (ko) 멀티플 지지벡터장치를 사용하여 멀티플 데이터세트로부터의 지식발견 강화방법
Zellinger et al. Multi-source transfer learning of time series in cyclical manufacturing
CN110210625A (zh) 基于迁移学习的建模方法、装置、计算机设备和存储介质
CN111914728A (zh) 高光谱遥感影像半监督分类方法、装置及存储介质
Jia et al. Adaptive neighborhood propagation by joint L2, 1-norm regularized sparse coding for representation and classification
Xia et al. Incomplete multi-view clustering via kernelized graph learning
CN112529063B (zh) 一种适用于帕金森语音数据集的深度域适应分类方法
US20240126829A1 (en) Unsupervised feature selection method based on latent space learning and manifold constraints
CN110781970A (zh) 分类器的生成方法、装置、设备及存储介质
Chao et al. Supervised nonnegative matrix factorization to predict ICU mortality risk
Xue et al. Local linear embedding with adaptive neighbors
CN110348287A (zh) 一种基于字典和样本相似图的无监督特征选择方法和装置
CN109102021A (zh) 缺失条件下的核互补齐多核k-均值聚类机器学习方法
CN115496950A (zh) 邻域信息嵌入的半监督判别字典对学习的图像分类方法
CN111340106A (zh) 基于图学习和视图权重学习的无监督多视图特征选择方法
CN114898167A (zh) 基于视图间差异性检测的多视图子空间聚类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant