CN103839084A - 一种应用于行人再识别的多核支持向量机多示例学习算法 - Google Patents

一种应用于行人再识别的多核支持向量机多示例学习算法 Download PDF

Info

Publication number
CN103839084A
CN103839084A CN201410091319.XA CN201410091319A CN103839084A CN 103839084 A CN103839084 A CN 103839084A CN 201410091319 A CN201410091319 A CN 201410091319A CN 103839084 A CN103839084 A CN 103839084A
Authority
CN
China
Prior art keywords
sigma
bag
kernel
forall
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410091319.XA
Other languages
English (en)
Other versions
CN103839084B (zh
Inventor
蒋云良
刘红海
侯向华
黄旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou University
Original Assignee
Huzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huzhou University filed Critical Huzhou University
Priority to CN201410091319.XA priority Critical patent/CN103839084B/zh
Publication of CN103839084A publication Critical patent/CN103839084A/zh
Application granted granted Critical
Publication of CN103839084B publication Critical patent/CN103839084B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种应用于行人再识别的多核支持向量机多示例学习算法,包括多特征描述和多核SVM模型多示例学习算法两个主要步骤。本发明通过提取了同一行人在A、B摄像机机下二张图片的HSV颜色特征和SIFT局部特征并构建词袋,用二种特征的差异矢量代表两摄像机下特征的转移关系作为二个示例样本,并封装为一个包;其次对多核支持向量机模型进行了优化,采用高斯核和多项式核线性融合对包进行训练,并用多示例学习获得最优的参数,具有较高的识别率。

Description

一种应用于行人再识别的多核支持向量机多示例学习算法
【技术领域】
本发明涉及行人再识别算法的技术领域,特别是应用于行人再识别的多核支持向量机多示例学习算法的技术领域。
【背景技术】
随着平安城市战略的启动,越来越多的监控摄像机被安装在了交通要塞,这些交通要塞距离较远,采用传统的单摄像机来进行跟踪难以满足需要。行人再识别是指在非重叠视域多摄像机监控下进行的行人匹配,即如何确认不同位置的摄像机在不同时刻发现的目标是否为同一人。由于摄像机的成像受参数、光照条件、角度、背景等因素的影响,导致不同摄像机拍摄的同一目标差异较大。
再识别方法可以分为两种:描述法和测度学习法。描述法先对目标进行特征提取,再求特征向量之间的距离(主要有欧式、马氏、巴氏等)来表示两者之间的相似度。Gheissari等人为了克服行人姿态的变化,把行人划分为三角状以提高相似度,但该方法只对视角相似的行人识别率较高。为克服直接采用颜色直方图进行匹配的不足,Wang等人将行人分割成区域块,提取不同区域的颜色特征来进行识别;Farenzena等人提取行人的多种特征来进行识别;Cheng等将行人分割成头、胸、腰、腿四个部位,并提取每个部位的颜色特征来进行识别。Gray等人提取行人的颜色和纹理特征,采用adaboost方法选择相关性,该方法速度较快,但识别率不高。测度学习法采用对提取的行人特征进行训练学习,在另外一个测度空间对特征进行比较。为提高SVM方法的识别率,Prosser等人提出了合成SVM排名算法,先对训练样本进行分类学习,得到N个弱分类器,再用boosting算法进行加权融合获得一个强分类器,该算法效果不错,但复杂度较高。Tamar等人对训练样本分类进行了改进,将同类样本和异类样本分别串接,再用SVM实现,虽提高了运算速度,但识别率和稳定性都不高。
描述法依赖于稳定的特征,且单一特征直接匹配识别率较低,只有多个特征进行融合才能保证识别效果。而目前测度学习法主要针对单一特征来进行学习和匹配,而不同摄像机拍到的同一人物外观可能存在巨大的变化,如VIPeR数据集中同一行人在A摄像机中是正面图像,B摄像机中可能是后背或侧面,差异较大,显然,单一特征来描述一个行人的正面、侧面、后面图像存在较大的局限。本文在测度学习法的基础上,结合描述性方法的多特征,将一个行人的单个特征作为一个示例,多个特征构成一个包,并采用多个核函数来对该包进行训练学习的算法,即多核多示例的行人再识别算法。该算法与多核SVM方法的最大区别在于前者中包有标签而示例没有标签,后者中所有样本都有标签。包标签为正的含义是A、B摄像机下的行人为同一个人,负表示不是同一个人。示例标签为正的含义是用该特征能很好表达A、B摄像机下行人的差异;负表示该特征不能表达差异。
【发明内容】
本发明的目的就是解决现有技术中的问题,提出一种应用于行人再识别的多核支持向量机多示例学习算法,将同一个人的多个特征描述构建差异矢量,作为示例样本封装成包,采用多核支持向量机对包进行训练,多示例算法学习获得最优解,本算法与单特征算法及经典的再识别算法相比,准确度有了较大的提高。
为实现上述目的,本发明提出了一种应用于行人再识别的多核支持向量机多示例学习算法,包括以下步骤:
a)多特征描述:
a1)颜色特征:颜色特征按照如下方法进行提取,先把行人图像划分为五个大小相等的区域,每个区域提取H、S、V三个分量的直方图,间隔取10,将提取的区域特征串联,最终构成特征为150维的列向量的全局特征,区域划分的目的是保留图像的局部信息,防止不同区域中的相同颜色产生的误匹配;
a2)SIFT特征提取及其词袋的构建:按照4×4模板进行提取SIFT特征,由于图像的SIFT特征只是局部特征描述,在采用SVM进行训练和学习前需要采用词袋模型对SIFT特征进行规则化,规则化的过程就是将数量不定的无序特征转变成有序的固定维数的向量;
a3)示例及包的构建:用
Figure BDA0000476150340000031
描述摄像机A所拍摄的目标m的第i幅图片特征,
Figure BDA0000476150340000032
描述摄像机B所拍摄的目标n的第j幅图片特征,
Figure BDA0000476150340000033
为差异矢量,用以描述A、B摄像机之间的特征转移关系,将同一行人的每个差异矢量作为一个示例,多种特征差异矢量构成的示例封装成一个样本包Oi={(s1,s2),y},y∈{1,-1},用以描述多种特征在不同摄像机间的转移关系,本算法中局部特征和全局特征属于不同的高维空间平面,没有交集,可以把包看成两个示例向量的切面,由同一个行人构成的包其标签号为正包,否则为负包;
b)多核SVM模型多示例学习算法:
b1)多示例问题描述:给定样本集C={(O1,Y1),(O2,Y2),...,(On,Yn)},含义是当Yj=1时,(Oj,Yj)表示正包
Figure BDA0000476150340000035
中至少存在一个示例
Figure BDA0000476150340000039
是正示例;当Yj=-1时,(Oj,Yj)的含义是负包
Figure BDA0000476150340000036
中所有示例sji是均是负示例;对样本包
Figure BDA0000476150340000037
只有包中所有的样本都是负时,才能被认定为负包,否则为正,其决策函数为:
Figure BDA0000476150340000038
b2)多核支持向量机模型:定义已知样本si,标号yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则si到决策超平面的函数间隔为:dis=<w,s>+b;对于上述定义可得到以下推论:(1)已知包OI={s1,s2,...,sn},对应的类别标号为Yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则包OI到决策超平面的函数间隔为:dis=YImax(<w,s>+b);(2)在多核框架下,已知包OI={s1,s2,...,sn},对应的标号为Yi∈{(1,-1)},i=1,2,...n,多核学习的决策超平面为
Figure BDA0000476150340000041
则包OI到决策超平面的函数间隔为 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) ; 对于公式 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) 建立多核学习的优化模型为:
Figure BDA0000476150340000044
多核学习的优化模型约束于: y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 , &ForAll; &xi; I &GreaterEqual; 0 , &ForAll; Y I = 1 , &ForAll; &xi; i &GreaterEqual; 0 , i &Element; I , &ForAll; Y I = - 1 其中
Figure BDA0000476150340000048
表示各个核函数的权重,C为惩罚系数,对公式 min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) 进行转换得到: min d J ( d ) , &Sigma; m d m = 1 , d m &GreaterEqual; 0 , &ForAll; m , 式中, J ( d ) = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) subjectto y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 &xi; I &GreaterEqual; 0 , 假设J(d)可微,则J(d)的拉格朗日函数为:
L = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) + &Sigma; i &alpha; i { 1 - ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) - y i [ &Sigma; m f m ( s i ) + b ] } - &Sigma; i &xi; i , 对于L,求
Figure BDA00004761503400000414
并令
Figure BDA00004761503400000415
利用拉格朗日对偶问题可以将最小值问题转换为最大值问题,可得: 1 d k f k ( &CenterDot; ) = &Sigma; i &alpha; i y i K k ( s i , s j ) , &ForAll; k , &Sigma; i &alpha; i y i = 0 , C - &alpha; i - v i = 0 , &ForAll; i ; 并利用梯度投影法,可得优化后的表达式:
Figure BDA0000476150340000052
采用凸优化技术改善了多核SVM的性能,用一个核对多个核函数进行了组合,获得样本的决策函数:
Figure BDA0000476150340000053
b3)多核多示例学习:采用模拟退火算法来求解
Figure BDA0000476150340000054
的最优值,在多核多示例学习中,主要是由两步循环嵌套实现:在外层循环中,权重d首先通过其邻域函数学习出来;在内层循环中,固定住权重d,1-norm SVM的参数α被学习出来。
作为优选,所述步骤a2)中的词袋是指将一组经过打包和封装数据,对图像建立词袋模型进行描述,主要是将图像中特征点进行聚类,形成多个词袋,并建立索引,以便更好地来描述图像,在本算法中,采用K-means算法对SIFT特征进行聚类,生成若干个类,并用编码的方法对每个特征点在所属类别中建立索,这样每个聚类被称为视觉关键字,用以描述图像中局部相似特征点的集合,所有的聚类称为视觉关键字词表,形成关键字词表后,图像就可以用视觉关键字词表的直方图表示出来,从而固定了维数。
本发明的有益效果:本发明通过提取了同一行人在A、B摄像机机下二张图片的HSV颜色特征和SIFT局部特征并构建词袋,用二种特征的差异矢量代表两摄像机下特征的转移关系作为二个示例样本,并封装为一个包;其次对多核支持向量机模型进行了优化,采用高斯核和多项式核线性融合对包进行训练,并用多示例学习获得最优的参数,具有较高的识别率。
【具体实施方式】
本发明一种应用于行人再识别的多核支持向量机多示例学习算法,包括以下步骤:
a)多特征描述:
a1)颜色特征:颜色特征按照如下方法进行提取,先把行人图像划分为五个大小相等的区域,每个区域提取H、S、V三个分量的直方图,间隔取10,将提取的区域特征串联,最终构成特征为150维的列向量的全局特征,区域划分的目的是保留图像的局部信息,防止不同区域中的相同颜色产生的误匹配;
a2)SIFT特征提取及其词袋的构建:按照4×4模板进行提取SIFT特征,由于图像的SIFT特征只是局部特征描述,在采用SVM进行训练和学习前需要采用词袋模型对SIFT特征进行规则化,规则化的过程就是将数量不定的无序特征转变成有序的固定维数的向量;
a3)示例及包的构建:用
Figure BDA0000476150340000061
描述摄像机A所拍摄的目标m的第i幅图片特征,
Figure BDA0000476150340000062
描述摄像机B所拍摄的目标n的第j幅图片特征,
Figure BDA0000476150340000063
Figure BDA0000476150340000064
为差异矢量,用以描述A、B摄像机之间的特征转移关系,将同一行人的每个差异矢量作为一个示例,多种特征差异矢量构成的示例封装成一个样本包Oi={(s1,s2),y},y∈{1,-1},用以描述多种特征在不同摄像机间的转移关系,本算法中局部特征和全局特征属于不同的高维空间平面,没有交集,可以把包看成两个示例向量的切面,由同一个行人构成的包其标签号为正包,否则为负包;
b)多核SVM模型多示例学习算法:
b1)多示例问题描述:给定样本集C={(O1,Y1),(O2,Y2),...,(On,Yn)},含义是当Yj=1时,(Oj,Yj)表示正包
Figure BDA0000476150340000065
中至少存在一个示例
Figure BDA0000476150340000066
是正示例;当Yj=-1时,(Oj,Yj)的含义是负包
Figure BDA0000476150340000067
中所有示例
Figure BDA00004761503400000610
是均是负示例;对样本包
Figure BDA0000476150340000068
只有包中所有的样本都是负时,才能被认定为负包,否则为正,其决策函数为:
Figure BDA0000476150340000069
b2)多核支持向量机模型:定义已知样本si,标号yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则si到决策超平面的函数间隔为:dis=<w,s>+b;对于上述定义可得到以下推论:(1)已知包OI={s1,s2,...,sn},对应的类别标号为Yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则包OI到决策超平面的函数间隔为:dis=YImax(<w,s>+b);(2)在多核框架下,已知包OI={s1,s2,...,sn},对应的标号为Yi∈{(1,-1)},i=1,2,...n,多核学习的决策超平面为则包OI到决策超平面的函数间隔为 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) ; 对于公式 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) 建立多核学习的优化模型为:
Figure BDA0000476150340000074
多核学习的优化模型约束于: y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 , &ForAll; &xi; I &GreaterEqual; 0 , &ForAll; Y I = 1 , &ForAll; &xi; i &GreaterEqual; 0 , i &Element; I , &ForAll; Y I = - 1 其中
Figure BDA0000476150340000078
表示各个核函数的权重,C为惩罚系数,对公式 min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) 进行转换得到: min d J ( d ) , &Sigma; m d m = 1 , d m &GreaterEqual; 0 , &ForAll; m , 式中, J ( d ) = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) subjectto y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 &xi; I &GreaterEqual; 0 , 假设J(d)可微,则J(d)的拉格朗日函数为:
L = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) + &Sigma; i &alpha; i { 1 - ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) - y i [ &Sigma; m f m ( s i ) + b ] } - &Sigma; i &xi; i , 对于L,求并令
Figure BDA00004761503400000715
利用拉格朗日对偶问题可以将最小值问题转换为最大值问题,可得: 1 d k f k ( &CenterDot; ) = &Sigma; i &alpha; i y i K k ( s i , s j ) , &ForAll; k , &Sigma; i &alpha; i y i = 0 , C - &alpha; i - v i = 0 , &ForAll; i ; 并利用梯度投影法,可得优化后的表达式:
Figure BDA0000476150340000082
采用凸优化技术改善了多核SVM的性能,用一个核对多个核函数进行了组合,获得样本的决策函数:
Figure BDA0000476150340000083
b3)多核多示例学习:采用模拟退火算法来求解
Figure BDA0000476150340000084
的最优值,在多核多示例学习中,主要是由两步循环嵌套实现:在外层循环中,权重d首先通过其邻域函数学习出来;在内层循环中,固定住权重d,1-norm SVM的参数α被学习出来。
所述步骤a2)中的词袋是指将一组经过打包和封装数据,对图像建立词袋模型进行描述,主要是将图像中特征点进行聚类,形成多个词袋,并建立索引,以便更好地来描述图像,在本算法中,采用K-means算法对SIFT特征进行聚类,生成若干个类,并用编码的方法对每个特征点在所属类别中建立索,这样每个聚类被称为视觉关键字,用以描述图像中局部相似特征点的集合,所有的聚类称为视觉关键字词表,形成关键字词表后,图像就可以用视觉关键字词表的直方图表示出来,从而固定了维数。
VIPeR数据集包含两组不同视角下的632个行人,每个人在每个摄像机下只有一幅图像,共计1264张图片。随机抽取316人在A、B摄像机下的行人图像共632张图片作为训练集,其余的316人中A摄像机下的图片作为测试样本,B摄像机中的图片作为候选样本,构建差异矢量作测试。采用本算法进行学习和预测,SVM选用binary SVM。因此需要利用多核构成的组合空间将特征进行映射,在核函数的选择上,由于高斯径向基核的学习能力较强和多项式核的推广能力较强,故选择这两种核函数。核函数的表达式如下:
多项式核:k1(x,x')=((x,x')+1)p,p为阶;
高斯径向基核: k ( x , x &prime; ) = exp ( - | | x - x &prime; | | 2 &sigma; 2 ) ;
根据再生核理论,合成核可以通过线性组合获得,但是权系数的协调对性能的发挥至关重要。若权系数设置得不好,多个核函数得不到有效地融合,合成核的性能反而低于单个核函数的性能。选择两种核的权重初值分别为0.5和0.5,采用多示例学习的方法获得权重最佳值。由于测试样本与候选样本进行分类时,并不只有一个包被判为正,因此需要排名,排名方法采用决策函数值f(s)值的大小来进行。实验结果用CMC(Cumulative Matching Characteristic)曲线表示,CMC曲线上的点表示在前r个匹配对中包含正确匹配结果的比率。本算法分别与基于HSV特征和SIFT的单特征算法及主流算法分别进行了识别率对比,实验结果表明本算法要比仅采用HSV颜色特征的SVM算法在识别率上高出10%左右,本算法与文献中的PRDC、ELF、SDALF等相比,识别率也明显提高。
上述实施例是对本发明的说明,不是对本发明的限定,任何对本发明简单变换后的方案均属于本发明的保护范围。

Claims (2)

1.一种应用于行人再识别的多核支持向量机多示例学习算法,包括以下步骤:
a)多特征描述:
a1)颜色特征:颜色特征按照如下方法进行提取,先把行人图像划分为五个大小相等的区域,每个区域提取H、S、V三个分量的直方图,间隔取10,将提取的区域特征串联,最终构成特征为150维的列向量的全局特征,区域划分的目的是保留图像的局部信息,防止不同区域中的相同颜色产生的误匹配;
a2)SIFT特征提取及其词袋的构建:按照4×4模板进行提取SIFT特征,由于图像的SIFT特征只是局部特征描述,在采用SVM进行训练和学习前需要采用词袋模型对SIFT特征进行规则化,规则化的过程就是将数量不定的无序特征转变成有序的固定维数的向量;
a3)示例及包的构建:用描述摄像机A所拍摄的目标m的第i幅图片特征,
Figure FDA0000476150330000012
描述摄像机B所拍摄的目标n的第j幅图片特征,
Figure FDA0000476150330000013
Figure FDA0000476150330000014
为差异矢量,用以描述A、B摄像机之间的特征转移关系,将同一行人的每个差异矢量作为一个示例,多种特征差异矢量构成的示例封装成一个样本包Oi={(s1,s2),y},y∈{1,-1},用以描述多种特征在不同摄像机间的转移关系,本算法中局部特征和全局特征属于不同的高维空间平面,没有交集,可以把包看成两个示例向量的切面,由同一个行人构成的包其标签号为正包,否则为负包;
b)多核SVM模型多示例学习算法:
b1)多示例问题描述:给定样本集C={(O1,Y1),(O2,Y2),...,(On,Yn)},含义是当Yj=1时,(Oj,Yj)表示正包
Figure FDA0000476150330000015
中至少存在一个示例
Figure FDA0000476150330000016
是正示例;当Yj=-1时,(Oj,Yj)的含义是负包中所有示例
Figure FDA0000476150330000018
是均是负示例;对样本包
Figure FDA0000476150330000021
只有包中所有的样本都是负时,才能被认定为负包,否则为正,其决策函数为:
Figure FDA0000476150330000022
b2)多核支持向量机模型:定义已知样本si,标号yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则si到决策超平面的函数间隔为:dis=<w,s>+b;对于上述定义可得到以下推论:(1)已知包OI={s1,s2,...,sn},对应的类别标号为Yi∈{(1,-1)},i=1,2,...n,决策超平面为<w,s>+b=0,则包OI到决策超平面的函数间隔为:dis=YImax(<w,s>+b);(2)在多核框架下,已知包OI={s1,s2,...,sn},对应的标号为Yi∈{(1,-1)},i=1,2,...n,多核学习的决策超平面为则包OI到决策超平面的函数间隔为 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) ; 对于公式 dis = Y I max i &Element; I ( &Sigma; m f m ( s i ) + b ) 建立多核学习的优化模型为:
Figure FDA0000476150330000026
多核学习的优化模型约束于: y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 , &ForAll; &xi; I &GreaterEqual; 0 , &ForAll; Y I = 1 , &ForAll; &xi; i &GreaterEqual; 0 , i &Element; I , &ForAll; Y I = - 1 其中
Figure FDA00004761503300000210
表示各个核函数的权重,C为惩罚系数,对公式 min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) 进行转换得到: min d J ( d ) , &Sigma; m d m = 1 , d m &GreaterEqual; 0 , &ForAll; m , 式中, J ( d ) = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) subjectto y i ( &Sigma; m f m ( s i ) + b ) &GreaterEqual; 1 - &xi; I , &ForAll; y i = Y I = - 1 &xi; I &GreaterEqual; 0 , 假设J(d)可微,则J(d)的拉格朗日函数为:
L = min { f m } , b , &xi; , d 1 2 &Sigma; m 1 d m | | f m | | 2 + C ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) + &Sigma; i &alpha; i { 1 - ( &Sigma; i &Element; I , Y I = 1 &xi; I + &Sigma; i &Element; I , Y I = - 1 &xi; i ) - y i [ &Sigma; m f m ( s i ) + b ] } - &Sigma; i &xi; i , 对于L,求并令
Figure FDA00004761503300000217
利用拉格朗日对偶问题可以将最小值问题转换为最大值问题,可得: 1 d k f k ( &CenterDot; ) = &Sigma; i &alpha; i y i K k ( s i , s j ) , &ForAll; k , &Sigma; i &alpha; i y i = 0 , C - &alpha; i - v i = 0 , &ForAll; i ; 并利用梯度投影法,可得优化后的表达式:
Figure FDA0000476150330000033
采用凸优化技术改善了多核SVM的性能,用一个核对多个核函数进行了组合,获得样本的决策函数:
b3)多核多示例学习:采用模拟退火算法来求解的最优值,在多核多示例学习中,主要是由两步循环嵌套实现:在外层循环中,权重d首先通过其邻域函数学习出来;在内层循环中,固定住权重d,1-norm SVM的参数α被学习出来。
2.如权利要求1所述的一种应用于行人再识别的多核支持向量机多示例学习算法,其特征在于:所述步骤a2)中的词袋是指将一组经过打包和封装数据,对图像建立词袋模型进行描述,主要是将图像中特征点进行聚类,形成多个词袋,并建立索引,以便更好地来描述图像,在本算法中,采用K-means算法对SIFT特征进行聚类,生成若干个类,并用编码的方法对每个特征点在所属类别中建立索,这样每个聚类被称为视觉关键字,用以描述图像中局部相似特征点的集合,所有的聚类称为视觉关键字词表,形成关键字词表后,图像就可以用视觉关键字词表的直方图表示出来,从而固定了维数。
CN201410091319.XA 2014-03-12 2014-03-12 一种应用于行人再识别的多核支持向量机多示例学习算法 Active CN103839084B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410091319.XA CN103839084B (zh) 2014-03-12 2014-03-12 一种应用于行人再识别的多核支持向量机多示例学习算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410091319.XA CN103839084B (zh) 2014-03-12 2014-03-12 一种应用于行人再识别的多核支持向量机多示例学习算法

Publications (2)

Publication Number Publication Date
CN103839084A true CN103839084A (zh) 2014-06-04
CN103839084B CN103839084B (zh) 2017-04-12

Family

ID=50802562

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410091319.XA Active CN103839084B (zh) 2014-03-12 2014-03-12 一种应用于行人再识别的多核支持向量机多示例学习算法

Country Status (1)

Country Link
CN (1) CN103839084B (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105005760A (zh) * 2015-06-11 2015-10-28 华中科技大学 一种基于有限混合模型的行人再识别方法
CN105046269A (zh) * 2015-06-19 2015-11-11 鲁东大学 一种基于多核融合的多示例多标签场景分类方法
CN106250909A (zh) * 2016-07-11 2016-12-21 南京邮电大学 一种基于改进视觉词袋模型的图像分类方法
CN106529484A (zh) * 2016-11-16 2017-03-22 哈尔滨工业大学 基于类指定多核学习的光谱和激光雷达数据联合分类方法
CN106874884A (zh) * 2017-03-03 2017-06-20 中国民航大学 基于部位分割的人体再识别方法
CN106874958A (zh) * 2017-02-28 2017-06-20 中南大学 一种基于多元多项式拟合的支持向量机模型近似方法及其应用
CN106897669A (zh) * 2017-01-19 2017-06-27 同济大学 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN106909895A (zh) * 2017-02-17 2017-06-30 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN106960182A (zh) * 2017-03-02 2017-07-18 云南大学 一种基于多特征集成的行人再识别方法
CN106980864A (zh) * 2017-03-31 2017-07-25 合肥工业大学 一种基于支持样本间接式的行人再识别方法
CN107408211A (zh) * 2015-04-03 2017-11-28 三菱电机株式会社 用于物体的再识别的方法
CN109389177A (zh) * 2018-10-25 2019-02-26 长安大学 一种基于协同级联森林的隧道车辆再识别方法
CN109447123A (zh) * 2018-09-28 2019-03-08 昆明理工大学 一种基于标签一致性约束与拉伸正则化字典学习的行人再识别方法
CN109447913A (zh) * 2018-10-18 2019-03-08 西南交通大学 一种应用于不完备数据成像的快速图像重建方法
CN110222553A (zh) * 2019-03-29 2019-09-10 宁波大学 一种基于稀疏表示的Multi-shot行人再识别方法
CN111723838A (zh) * 2020-04-21 2020-09-29 中国人民解放军火箭军工程大学 一种多核机器学习融合多尺度特征的高光谱地物分类方法
CN112016563A (zh) * 2020-10-17 2020-12-01 深圳神目信息技术有限公司 一种圆形印章的真伪识别方法
CN112766161A (zh) * 2021-01-20 2021-05-07 西安电子科技大学 基于集成约束多示例学习的高光谱目标检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
STUART ANDREWA,IOANNIS TSOCHANTARIDIS,THOMAS HOFMANN: "Support Vector Machines for Multiple-Instance Learning", 《ADVANCES IN NEURAL INFORMATION PRCOCESSING SYSTEMS》 *
曾明勇等: "多通道特征级联的人体目标再识别", 《军事通信技术》 *
王科平,杨艺,王新良: "包空间多示例图像自动分类", 《中国图象图形学报》 *
许允喜,齐赵毅: "基于非稀疏多核支持向量机的重现行人识别", 《光电工程》 *
金焕梅: "基于支持向量机的短语音说话人识别", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
陈凯: "单尺度词袋模型图像分类方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107408211A (zh) * 2015-04-03 2017-11-28 三菱电机株式会社 用于物体的再识别的方法
CN107408211B (zh) * 2015-04-03 2020-08-07 三菱电机株式会社 用于物体的再识别的方法
CN105005760A (zh) * 2015-06-11 2015-10-28 华中科技大学 一种基于有限混合模型的行人再识别方法
CN105005760B (zh) * 2015-06-11 2018-04-24 华中科技大学 一种基于有限混合模型的行人再识别方法
CN105046269A (zh) * 2015-06-19 2015-11-11 鲁东大学 一种基于多核融合的多示例多标签场景分类方法
CN105046269B (zh) * 2015-06-19 2019-02-22 鲁东大学 一种基于多核融合的多示例多标签场景分类方法
CN106250909A (zh) * 2016-07-11 2016-12-21 南京邮电大学 一种基于改进视觉词袋模型的图像分类方法
CN106529484A (zh) * 2016-11-16 2017-03-22 哈尔滨工业大学 基于类指定多核学习的光谱和激光雷达数据联合分类方法
CN106897669B (zh) * 2017-01-19 2019-12-27 同济大学 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN106897669A (zh) * 2017-01-19 2017-06-27 同济大学 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN106909895A (zh) * 2017-02-17 2017-06-30 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN106909895B (zh) * 2017-02-17 2020-09-22 华南理工大学 一种基于随机投影多核学习的手势识别方法
CN106874958A (zh) * 2017-02-28 2017-06-20 中南大学 一种基于多元多项式拟合的支持向量机模型近似方法及其应用
CN106960182B (zh) * 2017-03-02 2018-12-14 云南大学 一种基于多特征集成的行人再识别方法
CN106960182A (zh) * 2017-03-02 2017-07-18 云南大学 一种基于多特征集成的行人再识别方法
CN106874884B (zh) * 2017-03-03 2019-11-12 中国民航大学 基于部位分割的人体再识别方法
CN106874884A (zh) * 2017-03-03 2017-06-20 中国民航大学 基于部位分割的人体再识别方法
CN106980864A (zh) * 2017-03-31 2017-07-25 合肥工业大学 一种基于支持样本间接式的行人再识别方法
CN106980864B (zh) * 2017-03-31 2019-07-19 合肥工业大学 一种基于支持样本间接式的行人再识别方法
CN109447123A (zh) * 2018-09-28 2019-03-08 昆明理工大学 一种基于标签一致性约束与拉伸正则化字典学习的行人再识别方法
CN109447123B (zh) * 2018-09-28 2021-07-16 昆明理工大学 一种基于标签一致性约束与拉伸正则化字典学习的行人再识别方法
CN109447913A (zh) * 2018-10-18 2019-03-08 西南交通大学 一种应用于不完备数据成像的快速图像重建方法
CN109447913B (zh) * 2018-10-18 2021-10-08 西南交通大学 一种应用于不完备数据成像的快速图像重建方法
CN109389177A (zh) * 2018-10-25 2019-02-26 长安大学 一种基于协同级联森林的隧道车辆再识别方法
CN109389177B (zh) * 2018-10-25 2021-08-10 长安大学 一种基于协同级联森林的隧道车辆再识别方法
CN110222553A (zh) * 2019-03-29 2019-09-10 宁波大学 一种基于稀疏表示的Multi-shot行人再识别方法
CN111723838A (zh) * 2020-04-21 2020-09-29 中国人民解放军火箭军工程大学 一种多核机器学习融合多尺度特征的高光谱地物分类方法
CN112016563A (zh) * 2020-10-17 2020-12-01 深圳神目信息技术有限公司 一种圆形印章的真伪识别方法
CN112766161A (zh) * 2021-01-20 2021-05-07 西安电子科技大学 基于集成约束多示例学习的高光谱目标检测方法
CN112766161B (zh) * 2021-01-20 2022-12-02 西安电子科技大学 基于集成约束多示例学习的高光谱目标检测方法

Also Published As

Publication number Publication date
CN103839084B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
CN103839084A (zh) 一种应用于行人再识别的多核支持向量机多示例学习算法
Herzig et al. Spatio-temporal action graph networks
Choi et al. Multi-spectral pedestrian detection based on accumulated object proposal with fully convolutional networks
Bazzani et al. Self-taught object localization with deep networks
Kuruvayil et al. Emotion recognition from facial images with simultaneous occlusion, pose and illumination variations using meta-learning
Chen et al. Fast human detection using a novel boosted cascading structure with meta stages
Manzoor et al. Vehicle Make and Model classification system using bag of SIFT features
CN105809205B (zh) 一种高光谱图像的分类方法及其系统
CN103020986A (zh) 一种运动目标跟踪方法
CN104200228A (zh) 一种安全带识别方法与系统
Fleyeh Traffic and road sign recognition
Somasundaram et al. Classification and counting of composite objects in traffic scenes using global and local image analysis
Chen et al. Robust vehicle detection and viewpoint estimation with soft discriminative mixture model
CN104143091A (zh) 基于改进mLBP的单样本人脸识别方法
Nguyen et al. A robust triangular sigmoid pattern-based obstacle detection algorithm in resource-limited devices
Tafazzoli et al. Vehicle make and model recognition using local features and logo detection
CN103336974B (zh) 一种基于局部约束稀疏表征的花卉类别辨识方法
CN104008374A (zh) 一种矿井图像中基于条件随机场的矿工检测方法
CN103984965A (zh) 基于多分辨率特征关联的行人检测方法
CN105718858A (zh) 一种基于正负广义最大池化的行人识别方法
Zhang et al. Pedestrian detection in binocular stereo sequence based on appearance consistency
Cosma et al. Part-based pedestrian detection using HoG features and vertical symmetry
Lian et al. Fast pedestrian detection using a modified WLD detector in salient region
Sun et al. Latent model ensemble with auto-localization
Li et al. Pedestrian detection based on clustered poselet models and hierarchical and–or grammar

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant