CN109934290A - 一种基于Lp+s范数的多视角鲁棒性图像识别方法 - Google Patents
一种基于Lp+s范数的多视角鲁棒性图像识别方法 Download PDFInfo
- Publication number
- CN109934290A CN109934290A CN201910185849.3A CN201910185849A CN109934290A CN 109934290 A CN109934290 A CN 109934290A CN 201910185849 A CN201910185849 A CN 201910185849A CN 109934290 A CN109934290 A CN 109934290A
- Authority
- CN
- China
- Prior art keywords
- norm
- view
- angle
- data set
- gepsvm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000000007 visual effect Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000012706 support-vector machine Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000005433 ionosphere Substances 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
一种基于Lp+s范数的多视角鲁棒性图像识别方法,该方法基于LP范数最小化和LS范数最大化的鲁棒多视图广义特征值近端支持向量机(Lp,s‑MvGEPSVM),结合多视图学习以及Lp+s范数度量,得到了较高的精度和良好的抗噪声能力。
Description
技术领域
本发明属于模式识别技术领域,涉及一种基于Lp+s范数的多视角鲁棒性图像识别方法。
背景技术
广义特征值近端支持向量机(GEPSVM)是一种有效的针对二分类问题的分类工具,和传统的支持向量机(SVM)不同的是,通过求解两个广义特征值问题得到两个非平行的超平面,其中每个超平面尽可能接近相关类,并且在最大程度上远离另一个类,在图像分类,手写体识别,生物信息等领域有着广泛的应用,基于GEPSVM强大的可扩展性,近年来许多研究者在GEPSVM的基础上提出了很多改进的方法。而多视图学习机制作为近年来研究的热点,通过训练多模态数据集来提高学习性能。因为实际数据的复杂性和异构性,同一个对象往往会有不同的特征描述形式,例如同一张图片可以用颜色和纹理来分别表示,一个人的身份也可以用人脸和指纹来确定,这些不同模态的特征集通常是由不同的特征提取方法得到的。受到多视图学习的启发,Sun等人将多视图学习融入到GEPSVM中,提出了多视图广义特征近端支持向量机(MvGSVM),通过引入多视图共正则项(co-regularization),降低视图间的差异性,使得不同视图的一致性尽可能最大,取得了良好的分类性能。
然而,该方法仍然是基于传统的L2范数平方距离度量。在存在噪声的情况下,平方运算容易夸大噪声的影响,使得该算法的鲁棒性得不到保证。基于现实世界中大部分数据都会存在噪声,为了解决L2范数对噪声敏感的问题,很多研究者用L1范数代替L2范数并且取得了比L2范数优越的抗噪表现,例如L1-GEPSVM、L1-TWSVM、L1-LDA、L1-PCA等等。尽管L1范数取得了比L2范数更好的抗噪效果,但是在处理较大规模的野值或噪声时,表现不尽如人意,为了解决此问题,Lp范数被应用到了目标函数中,例如Kwak通过引入Lp范数最大化提出了Lp-PCA,此外,Ye更进一步的将Lp范数和Ls范数应用到LDA中,提出了FLDA-Lsp。
在实际图像识别中饱受连续和非连续噪声的混合影响,因此,如何提供一种适应各种噪声干扰的鲁棒性图像识别方法,是目前本领域技术研究人员亟待解决的问题。
发明内容
为克服上述现有技术中的不足,本发明目的在于提供一种基于Lp+s范数的多视角鲁棒性图像识别方法,该方法基于LP范数最小化和LS范数最大化的鲁棒多视图广义特征值近端支持向量机(Lp,s-MvGEPSVM),结合多视图学习以及Lp+s范数度量,得到了较高的精度和良好的抗噪声能力。
为实现上述目的及其他相关目的,本发明提供一种基于Lp+s范数的多视角鲁棒性图像识别方法,包括以下步骤:
输入:原始数据矩阵A1,A2,B1,B2,其中分别表示第一个视角的正类和负类数据集,分别表示第二个视角的正类和负类数据集;初始化投影向量并且设置迭代次数值t=1,参数p∈{0.1,0.2,...,1,.s∈{1.1,1.2,...,1.9,2},δ∈{2i|i=-10,-9,...,9,10},ε∈{0.25,0.5,0.75,1};
步骤一:计算第t次迭代的目标函数值λ(t),φ(t);
步骤二:根据投影向量z求得对角矩阵D(t),V(t),U(t)以及列向量k(t),根据ξ求得对角矩阵F(t),Q(t),O(t)及列向量η(t),定义
步骤三:求解
以及
得到z,ξ并且设置t=t+1;
步骤四:重复步骤一、步骤二及步骤三直至收敛;
步骤五:确定最终的分类平面z,ξ。
与现有技术相比,本发明具有如下的有益效果:
本发明基于引入了多视图学习机制以及Lp+s范数度量,并且不仅将Lp+s应用到损失函数中,也将其应用到了正则化项,使得本发明方法模型相对于传统的GEPSVM以及MvGSVM都更加鲁棒并且更加复杂;本发明提出了一种有效的迭代求解的方法,来求解一个局部最优解。此外,对于多模态数据的预处理,针对某些本身没有第二个视图特征集的数据集来说,我们使用PCA降维后的数据最为第二个视角的正类和负类数据集,并保证降维后的主要特征保持在99%。
本发明相比于MvGSVM,新提出的基于Lp+s范数的鲁棒多视图GEPSVM方法不仅在分类精度上有所提高,并且表现出了良好的鲁棒性。我们分别在手写体数据集7个数字组合(1,7),(3,4),(3,5),(3,6),(3,9),(4,8),(6,9)以及7个UCI数据集spect、wpbc、housingdata,germ、heart、ionosphere、sonar上对比了新方法与GEPSVM,IGEPSVM,L1-GEPSVM,MvGSVM的分类性能,实验结果显示新方法在所有的14个数据集中,有11个是最高的,并且在加入噪声后,有13个数据集精度最高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明Lp,s-MvGEPSVM在手写体数字组合(3,4)数据集上的收敛性表现;
图2为本发明Lp,s-MvGEPSVM在wpbc数据集上的收敛性表现;
图3为本发明在手写体数据集上,GEPSVM、IGEPSVM和L1-GEPSVM的第一个视角与MvGSVM和Lp,s-MvGEPSVM的精度对比;
图4为本发明在手写体数据集上,GEPSVM、IGEPSVM和L1-GEPSVM的第二个视角与MvGSVM和Lp,s-MvGEPSVM的精度对比;
图5为本发明在UCI数据集上,GEPSVM、IGEPSVM和L1-GEPSVM的第一个视角与MvGSVM和Lp,s-MvGEPSVM的精度对比;
图6为本发明在UCI数据集上,GEPSVM、IGEPSVM和L1-GEPSVM的第二个视角与MvGSVM和Lp,s-MvGEPSVM的精度对比;
图7为本发明在UCI数据集上MvGSVM分别加入5%和10%噪声的精度变化;
图8为本发明在UCI数据集上Lp,s-MvGEPSVM分别加入5%和10%噪声的精度变化。
具体实施方式
以下结合附图,由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。
实施例:
一种基于Lp+s范数的多视角鲁棒性图像识别方法,包括以下步骤:
输入:原始数据矩阵A1,A2,B1,B2,其中分别表示第一个视角的正类和负类数据集,分别表示第二个视角的正类和负类数据集;初始化投影向量并且设置迭代次数值t=1,参数p∈{0.1,0.2,...,1,.s∈{1.1,1.2,...,1.9,2},δ∈{2i|i=-10,-9,...,9,10},ε∈{0.25,0.5,0.75,1};
步骤一:计算第t次迭代的目标函数值λ(t),φ(t);
步骤二:根据投影向量z求得对角矩阵D(t),V(t),U(t)以及列向量k(t),根据ξ求得对角矩阵F(t),Q(t),O(t)及列向量η(t),定义
步骤三:求解
以及
得到z,ξ并且设置t=t+1;
步骤四:重复步骤一、步骤二及步骤三直至收敛;
步骤五:确定最终的分类平面z,ξ。
为了直观地显示本发明方法具有快速收敛性,如图1和图2所示,图1和图2列举了Lp,s-MvGEPSVM在手写体数字组合(3,4)以及wpbc数据集上的收敛性表现。从图1和图2可以看出,新算法在经过5次左右的迭代之后程序快速收敛,说明Lp,s-MvGEPSVM在计算耗费上是可行的。
图3-图6显示了五种方法分别在手写体数据集以及其他7个UCI数据集上的精度,其中,图3显示在手写体数据集上GEPSVM,IGEPSVM和L1-GEPSVM的第一个视角与MvGSVM和Lp,s-MvGEPSVM的精度对比,图4则是前三个方法的第二个视角与多视角算法的比较,图5和图6分别是在UCI数据集上传统方法的两个视角和多视角方法的比较。从图3-图6结果可以看出,无论是分类精度还是稳定性方面,Lp,s-MvGEPSVM都优于其他方法。
图7和图8给出了在UCI数据集上MvGSVM以及Lp,s-MvGEPSVM分别加入5%和10%噪声的精度变化。相比而言,Lp,s-MvGEPSVM在加入噪声之后下降幅度更加平缓且精度依旧比其他方法高,证明了本发明方法具有良好的鲁棒性。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (1)
1.一种基于Lp+s范数的多视角鲁棒性图像识别方法,其特征在于:包括以下步骤:
输入:原始数据矩阵A1,A2,B1,B2,其中分别表示第一个视角的正类和负类数据集,分别表示第二个视角的正类和负类数据集;初始化投影向量并且设置迭代次数值t=1,参数p∈{0.1,0.2,...,1,.s∈{1.1,1.2,...,1.9,2},δ∈{2i|i=-10,-9,...,9,10},ε∈{0.25,0.5,0.75,1};
步骤一:计算第t次迭代的目标函数值λ(t),φ(t);
步骤二:根据投影向量z求得对角矩阵D(t),V(t),U(t)以及列向量k(t),根据ξ求得对角矩阵F(t),Q(t),O(t)及列向量η(t),定义
步骤三:求解
以及
得到z,ξ并且设置t=t+1;
步骤四:重复步骤一、步骤二及步骤三直至收敛;
步骤五:确定最终的分类平面z,ξ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185849.3A CN109934290A (zh) | 2019-03-12 | 2019-03-12 | 一种基于Lp+s范数的多视角鲁棒性图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910185849.3A CN109934290A (zh) | 2019-03-12 | 2019-03-12 | 一种基于Lp+s范数的多视角鲁棒性图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109934290A true CN109934290A (zh) | 2019-06-25 |
Family
ID=66987031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910185849.3A Pending CN109934290A (zh) | 2019-03-12 | 2019-03-12 | 一种基于Lp+s范数的多视角鲁棒性图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109934290A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898565A (zh) * | 2020-08-04 | 2020-11-06 | 南京林业大学 | 一种基于鲁棒多视角的森林烟火实时监测系统和方法 |
CN113705336A (zh) * | 2021-07-15 | 2021-11-26 | 南京林业大学 | 一种灵活切割烟雾鲁棒特征提取方法 |
-
2019
- 2019-03-12 CN CN201910185849.3A patent/CN109934290A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898565A (zh) * | 2020-08-04 | 2020-11-06 | 南京林业大学 | 一种基于鲁棒多视角的森林烟火实时监测系统和方法 |
CN111898565B (zh) * | 2020-08-04 | 2021-11-16 | 南京林业大学 | 一种基于鲁棒多视角的森林烟火实时监测系统和方法 |
CN113705336A (zh) * | 2021-07-15 | 2021-11-26 | 南京林业大学 | 一种灵活切割烟雾鲁棒特征提取方法 |
CN113705336B (zh) * | 2021-07-15 | 2024-03-19 | 南京林业大学 | 一种灵活切割烟雾鲁棒特征提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104361328B (zh) | 一种基于自适应多列深度模型的人脸图像正规化方法 | |
Wang et al. | Shape matching and classification using height functions | |
CN102592136B (zh) | 基于几何图像中中频信息的三维人脸识别方法 | |
Li et al. | A comprehensive survey on 3D face recognition methods | |
Wu et al. | MTCNN and FACENET based access control system for face detection and recognition | |
CN109829934A (zh) | 一种新型基于孪生卷积网络的图像跟踪算法 | |
Zhou et al. | Structure preserving non-negative feature self-representation for unsupervised feature selection | |
CN104392246A (zh) | 一种基于类间类内面部变化字典的单样本人脸识别方法 | |
Duan et al. | Expression of Concern: Ethnic Features extraction and recognition of human faces | |
Zhai et al. | Facial beauty prediction via local feature fusion and broad learning system | |
CN109934290A (zh) | 一种基于Lp+s范数的多视角鲁棒性图像识别方法 | |
CN110569724A (zh) | 一种基于残差沙漏网络的人脸对齐方法 | |
CN104268507A (zh) | 一种基于rgb-d图像的手语字母识别方法 | |
Zhao et al. | Aliked: A lighter keypoint and descriptor extraction network via deformable transformation | |
Zhu et al. | Tensor field graph-cut for image segmentation: A non-convex perspective | |
Wang et al. | Learning to detect 3D facial landmarks via heatmap regression with graph convolutional network | |
CN108090460B (zh) | 基于韦伯多方向描述子的人脸表情识别特征提取方法 | |
Xu et al. | Spectral-spatial subspace clustering for hyperspectral images via modulated low-rank representation | |
Liang et al. | Low-rank projection learning via graph embedding | |
Li et al. | Discriminative weighted sparse partial least squares for human detection | |
Wang et al. | Facial features extraction based on active shape model | |
Fang et al. | Hand pose estimation on hybrid CNN-AE model | |
Wu et al. | Active 3-D shape cosegmentation with graph convolutional networks | |
Lei et al. | Student action recognition based on multiple features | |
Pistilli et al. | Point cloud normal estimation with graph-convolutional neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |