CN107330463B - 基于cnn多特征联合和多核稀疏表示的车型识别方法 - Google Patents

基于cnn多特征联合和多核稀疏表示的车型识别方法 Download PDF

Info

Publication number
CN107330463B
CN107330463B CN201710518975.7A CN201710518975A CN107330463B CN 107330463 B CN107330463 B CN 107330463B CN 201710518975 A CN201710518975 A CN 201710518975A CN 107330463 B CN107330463 B CN 107330463B
Authority
CN
China
Prior art keywords
vehicle
matrix
kernel
feature
cnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710518975.7A
Other languages
English (en)
Other versions
CN107330463A (zh
Inventor
孙伟
杜宏吉
张小瑞
施顺顺
赵玉舟
杨翠芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201710518975.7A priority Critical patent/CN107330463B/zh
Publication of CN107330463A publication Critical patent/CN107330463A/zh
Application granted granted Critical
Publication of CN107330463B publication Critical patent/CN107330463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

基于CNN多特征联合和多核稀疏表示的车型识别方法,利用智能交通相机拍摄包括复杂场景下的车辆图像,首先对车辆图像进行预处理,然后基于CNN中AlexNet网络,设计5个卷积层与3个全连接层自动提取车辆的全局与局部特征,将第1,2,5池化层和第6,7全连接层的特征图按列拉伸后作为车辆特征分量分别输入到5个不同的单核函数中,并通过加权融合形成一个联合特征矩阵;然后基于多核学习和稀疏表示算法,求解每个核函数的权值和联合特征矩阵的投影矩阵,最后根据核稀疏最小重构误差实现对车辆类型的识别。本发明能够实时进行车型识别,提取出需要的交通流信息,解决交通拥堵问题,有利于公路网的总体规划及道路建设。

Description

基于CNN多特征联合和多核稀疏表示的车型识别方法
技术领域
本发明属于智能交通系统中的车型识别领域,具体涉及一种基于CNN多特征联合和多核稀疏表示的车型识别方法。
背景技术
卷积神经网络(CNN)当前已经成为图像识别领域的研究热点,由于其识别率高等优点,卷积神经网络也逐渐运用到车型识别中。但在一般情况下,都是使用卷积神经网络的深层提取的特征进行分类器训练,而这些特征可能并没有包含足够多的有用信息来实现图像的正确分类。研究表明,卷积神经网络的浅层抽取的是图像局部的特征,这些特征更精细且包含更多的细节信息,而深层抽取的是图像全局性的特征,这些特征具有显著的差异,有更加稳定的模式和结构。如果将卷积神经网络的浅层特征和深层特征联合起来,将会使图像特征更加丰富,会大幅提高图像识别率和鲁棒性。
核学习方法目前已经成功应用于图像处理领域,但大多数核学习方法是基于单核的方法,由于不同核函数的性能表现差异很大,且单核学习方法不能满足如数据异构、数据不规则、样本不平坦等情况下的应用需求,不能有效整合异质数据背后隐藏的信息。如果使用多核学习充分利用不同核函数的性能,能够有效解决多维数据不规则或数据在高维特征空间分布的不平坦等情况。
发明内容
本发明的针对现有技术中的不足,提供一种基于CNN多特征联合和多核稀疏表示的车型识别方法。
为实现上述目的,本发明采用以下技术方案:
1)采集车辆图像,将采集到的车辆图像分为训练样本和测试样本,对车辆图像进行预处理,调整图片像素,并对图片添加标签,标注图像的所属车型类别,其中,训练样本表示为V=[v1,v2,…,vn],n表示训练样本个数,测试样本表示为y;
2)基于CNN自动提取样本各层级的车辆图像特征,得到车辆特征向量;
3)对车辆特征向量进行基于多核的非线性映射,转换到高维的特征空间;
4)对高维的特征空间进行样本空间转换,减少核空间特征参数的维数;
5)优化约束函数,求解稀疏表示系数向量;
6)定义满足类间重构误差最大且类内重构误差最小的目标函数;
7)优化求解核函数权值和投影系数矩阵;
8)基于求得的核函数权值和投影系数矩阵,根据测试样本的核稀疏最小重构误差实现对车辆类型的识别。
为优化上述技术方案,采取的具体措施还包括:
步骤2)中:
基于CNN中AlexNet网络,设计5个卷积层与3个全连接层:层1-5是卷积层,提取车辆的局部特征,其中,层1、2、5在卷积滤波后有池化层;层6-7是全连接层,提取车辆的全局特征;
利用CNN网络对训练样本进行训练,从CNN网络提取第1、2、5池化层和第6、7全连接层每一层的特征分量Ft,t=1,2,3,4,5,F1,F2,F3,F4,F5分别对应第1、2、5、6、7层的特征分量,车辆特征分量经加权联合后得到车辆联合特征向量F=(F1,F2,…,F5)。
步骤3)中:
将车辆特征分量Ft分别输入到不同的基础单核函数κm中,核函数包括三个高斯核和两个线性核,κ123为高斯核,
Figure GDA0002574719980000021
Figure GDA0002574719980000022
σ表示函数的宽度参数;κ45为线性核,κ4(xi,xj)=xi Txj,κ5(xi,xj)=(1+xi Txj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n};
通过加权融合形成一个多核矩阵
Figure GDA0002574719980000023
m是整数,m∈{1,2,…,M},M=5,β表示加权融合过程中的核权重值;
基于多核矩阵对训练样本和测试样本进行非线性匹配,将原始特征空间转换到高维特征空间H0,在空间H0上训练样本矩阵表示为φ(X)=[φ(x1),φ(x2),…,φ(xn)],测试样本表示为φ(y)。
步骤4)中:
将转换到高维特征空间H0的特征参数乘以一个低维的投影矩阵P,减少核空间特征参数的维数,P=[P1,P2,…,Pd]∈Rm×d,d是投影空间的维数。
步骤5)中:
基于稀疏编码理论利用l-2范数约束优化求解,得到稀疏表示系数向量α,约束优化公式为:
Figure GDA0002574719980000031
其中,λ≥0,表示为了避免过拟合加入的正则项,通过交叉验证来选择大小;矩阵A是投影矩阵P的系数矩阵,
Figure GDA0002574719980000032
Km(i,y)=κm(xi,y);
Figure GDA0002574719980000033
Km(i,j)=κm(xi,xj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n}。
步骤6)中:
定义满足类间重构误差最大且类内重构误差最小的目标函数F(A,β):
Figure GDA0002574719980000034
其中,I为单位矩阵;Jb=tr(ATKβSbKβA),tr(·)表示矩阵的迹;
Sb为类间散度矩阵,
Figure GDA0002574719980000035
ei是第i个元素为1其他元素为0的n维单位向量,αi表示第i个训练样本的稀疏表示系数向量,δsi)是一个n维向量,它的非零元素由矩阵αi中跟除第
Figure GDA0002574719980000036
类以外关联的位置元素组成,而跟第
Figure GDA0002574719980000037
类关联的位置元素为0,
Figure GDA0002574719980000038
表示车辆的类别,c为训练样本的类别个数;
Jw=tr(AT(KβSwKβ+λI)A),Sw为类内散度矩阵
Figure GDA0002574719980000041
Figure GDA0002574719980000042
是一个n维向量,它的非零元素由矩阵αi中跟第
Figure GDA0002574719980000043
类关联的位置元素组成,除第
Figure GDA0002574719980000044
类以外的其他位置元素均为0。
步骤7)中:
优化求解核函数权值β和投影系数矩阵A,将目标函数转化为:
Figure GDA0002574719980000045
其中,ρ表示给定一个A和β后的极大值,
Figure GDA0002574719980000046
采用交替迭代的方法进行优化求解,重复迭代次数直到收敛,具体如下:
优化求解A:
固定β,则目标函数为:
Figure GDA0002574719980000047
使用最小角回归算法求得最优解A;
优化求解β:
固定A,则目标函数为:
Figure GDA0002574719980000048
定义一个关于β的函数h(β)=tr(AT(KβSbKβ-ρKβSwKβ-ρλI)A);
对其求偏导
Figure GDA0002574719980000049
通过解二次规划问题
Figure GDA00025747199800000410
其中z是β在
Figure GDA00025747199800000411
方向上的映射,优化求解β。
步骤8)中:
使用最小重构误差根据稀疏表示系数向量α分类样本y,重构误差表示为
Figure GDA00025747199800000412
根据公式
Figure GDA0002574719980000051
进行车型识别分类。
本发明的有益效果是:
1、采用基于计算机视觉技术的方法,安装维护方便,不影响路面寿命,不影响交通,而且所用设备少,具有成本低,鲁棒性好,安全性高等优点;
2、将多特征联合引入到基于核稀疏表示的车型识别中,使得在不同层所产生的特征分量的优势得到更充分和合理的利用;
3、多核学习较单核学习能够解决样本规模较大,多维数据不规则或数据在高维特征空间分布的不平坦的情况。
附图说明
图1是本发明的总体流程图。
图2是本发明AlexNet网络结构图。
图3是本发明联合车辆局部与全局特征流程图。
图4是本发明多核稀疏学习算法流程图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
如图1所示的基于CNN多特征联合和多核稀疏表示的车型识别方法,利用CNN网络提取车辆的全局与局部特征,并通过多核加权联合引入到基于稀疏表示的车型识别中,使浅层和深层网络的特征优势得到更充分和合理的利用,且多核学习使得不同核函数的性能表现更加突出,从而能够大大提高车型识别的准确率和鲁棒性,具体步骤如下。
步骤1:车辆图像采集与预处理
利用智能交通相机拍摄包括复杂场景下的大型客车、卡车、面包车和小轿车四种车型图像,总共采集3000张车辆图像,其中2000张为训练样本,1000张为测试样本。
首先对车辆图像进行预处理,图片大小统一调整为224×224像素,并对图像添加标签,标注该图像所属车型类别,有大型客车、卡车、面包车和小轿车四种类别。其中,训练样本表示为V=[v1,v2,…,vn],n表示训练样本个数,测试样本用y表示。
步骤2:CNN自动提取样本各层级的车辆图像特征
基于CNN中AlexNet网络,AlexNet网络结构图如图2所示,设计5个卷积层与3个全连接层,自动提取车辆的全局与局部特征。局部特征主要是浅层网络提取的一些边缘、角落等简单特征,全局特征主要是深层网络提取的具有显著差异的复杂特征。
Layer1-Layer5是卷积层,主要提取局部特征,其中Layer1、Layer2和Layer5三层卷积滤波后有池化层。Layer1中,卷积滤波后输出是96个55×55大小的图片,卷积滤波后,还接有池化层,池化后的图像大小为96×27×27;Layer2中,卷积滤波后图像大小为256×27×27,池化后的图像大小为256×13×13;Layer5中,池化后的图像大小为256×6×6。
Layer6和Layer7是全连接层,主要提取全局特征,相当于在卷积层的基础上再加上一个全连接神经网络分类器。
利用设计好的CNN网络对训练样本进行训练,从CNN网络提取第1、2、5池化层和第6、7全连接层每一层的特征分量Ft,t=1,2,3,4,5,车辆特征分量经加权联合后得到车辆联合特征向量F=(F1,F2,…,F5)。图3是提取车辆的局部和全局特征加权形成联合特征的流程图。
步骤3:基于多核的非线性映射
将第1、2、5池化层和第6、7全连接层的车辆特征分量Ft分别输入到不同的基础单核函数κm中,此处使用的核函数是三个高斯核和两个线性核,κ123为高斯核,
Figure GDA0002574719980000061
Figure GDA0002574719980000062
σ表示函数的宽度参数,其中
Figure GDA0002574719980000063
Figure GDA0002574719980000064
κ45为线性核,κ4(xi,xj)=xi Txj,κ5(xi,xj)=(1+xi Txj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n}。
然后通过加权融合形成一个多核矩阵
Figure GDA0002574719980000071
m是整数,m∈{1,2,…,M},M=5,β表示加权融合过程中的核权重值。
基于多核矩阵对样本进行非线性匹配,转换到高维的Hilbert空间,即将原始特征空间转换到高维特征空间H0,在空间H0上训练样本矩阵可以表示为φ(X)=[φ(x1),φ(x2),…,φ(xn)],测试样本表示为φ(y)。
步骤4:样本空间转换
为了减少分类器训练的难度,将转换到高维Hilbert空间的特征参数乘以一个低维的投影矩阵P,以减少核空间特征参数的维数,P=[P1,P2,…,Pd]∈Rm×d,d是投影空间的维数,d=128。
步骤5:优化约束函数,求解稀疏表示系数向量α
多核稀疏学习算法流程图如图4所示。
基于稀疏编码理论利用l-2范数约束优化求解,得到稀疏表示系数向量α,约束优化公式为:
Figure GDA0002574719980000072
其中,λ≥0,表示为了避免过拟合而加入的一个正则项,通过交叉验证来选择大小,本专利选取λ=0.01;矩阵A是投影矩阵P的系数矩阵,P=φ(X)A;
Figure GDA0002574719980000073
Km(i,y)=κm(xi,y);
Figure GDA0002574719980000074
Km(i,j)=κm(xi,xj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n};
步骤6:定义满足类间重构误差最大且类内重构误差最小的目标函数
定义满足类间重构误差最大且类内重构误差最小的目标函数F(A,β):
Figure GDA0002574719980000081
其中,I为单位矩阵;Jb=tr(ATKβSbKβA),tr(·)表示矩阵的迹;
Sb为类间散度矩阵,
Figure GDA0002574719980000082
ei是第i个元素为1其他元素为0的n维单位向量,αi表示第i个训练样本的稀疏表示系数向量,δsi)是一个n维向量,它的非零元素由矩阵αi中跟除第
Figure GDA0002574719980000083
类以外关联的位置元素组成,而跟第
Figure GDA0002574719980000084
类关联的那个位置的元素均为0,
Figure GDA0002574719980000085
表示车辆的类别,c为训练样本的类别个数。
Jw=tr(AT(KβSwKβ+λI)A),为了避免过拟合,此处在求解过程中引入一个正则项λ′I,以确保KβSwKβ+λ′I是满秩矩阵,λ′=0.01;Sw为类内散度矩阵
Figure GDA0002574719980000086
Figure GDA0002574719980000087
是一个n维向量,它的非零元素由矩阵αi中跟第
Figure GDA0002574719980000088
类关联的位置元素组成,除第
Figure GDA0002574719980000089
类以外的其他位置元素均为0。
步骤7:优化求解核函数权值β和投影系数矩阵A
目标函数(2)可转化为:
Figure GDA00025747199800000810
其中,ρ表示给定一个A和β后的极大值,
Figure GDA00025747199800000811
ρ=20。此处采用交替迭代的方法进行优化求解,即先固定β,优化A;然后固定A,再优化β。重复迭代次数直到达到收敛,收敛精度为0.0001或达到最大迭代次数10次。
1)优化求解A:固定β,则目标函数为:
Figure GDA00025747199800000812
然后使用最小角回归算法(Least Angle Regression,LARS)求得最优解A。
2)优化求解β:固定A,则目标函数为:
Figure GDA0002574719980000091
目标函数(5)不是一个凸优化问题,只能解得一个局部最优解,因此定义一个关于β的函数h(β)=tr(AT(KβSbKβ-ρKβSwKβ-ρλI)A)。
对其求偏导
Figure GDA0002574719980000092
所以优化求解β通过解二次规划问题
Figure GDA0002574719980000093
其中z是β在
Figure GDA0002574719980000094
方向上的映射。
步骤8:车型识别
基于求得的核函数权值和投影系数矩阵,根据测试样本的核稀疏最小重构误差实现对车辆类型的识别。
使用最小重构误差根据稀疏表示系数向量α分类样本y,重构误差表示为
Figure GDA0002574719980000095
c表示样本的类别个数,分别表示大型客车、卡车、面包车和小轿车四种车型。
最终根据公式
Figure GDA0002574719980000096
进行车型识别分类,若显示测试样本与大型客车那一类样本的重构误差
Figure GDA0002574719980000097
最小,则将测试图片中的车型认为是大型客车;若显示测试样本与卡车那一类样本的重构误差
Figure GDA0002574719980000098
最小,则将测试图片中的车型认为是卡车;若显示测试样本与面包车那一类样本的重构误差
Figure GDA0002574719980000099
最小,则将测试图片中的车型认为是面包车;若显示测试样本与轿车那一类样本的重构误差
Figure GDA00025747199800000910
最小,则将测试图片中的车型认为是轿车。到此,则完成了车型的识别。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

Claims (6)

1.一种基于CNN多特征联合和多核稀疏表示的车型识别方法,包括以下步骤:
1)采集车辆图像,将采集到的车辆图像分为训练样本和测试样本,对车辆图像进行预处理,调整图片像素,并对图片添加标签,标注图像的所属车型类别,其中,训练样本表示为V=[v1,v2,…,vn],n表示训练样本个数,测试样本表示为y;
2)基于CNN自动提取样本各层级的车辆图像特征,得到车辆特征分量;具体为:基于CNN中AlexNet网络,设计5个卷积层与3个全连接层:层1-5是卷积层,被用来提取车辆的局部特征,其中,层1、2、5在卷积滤波后有池化层;层6-7是全连接层,被用来提取车辆的全局特征;
利用CNN网络对训练样本进行训练,从CNN网络提取第1、2、5池化层和第6、7全连接层每一层的特征分量Ft,t=1,2,3,4,5,F1,F2,F3,F4,F5分别对应第1、2、5池化层和第6、7全连接层的特征分量;
3)对车辆特征分量进行基于多核的非线性映射,转换到高维的特征空间,车辆特征分量经加权联合后得到车辆联合特征向量F=(F1,F2,…,F5):
将车辆特征分量Ft分别输入到不同的基础单核函数κm中,核函数包括三个高斯核和两个线性核,κ123为高斯核,
Figure FDA0002574719970000011
Figure FDA0002574719970000012
σ表示函数的宽度参数;κ45为线性核,κ4(xi,xj)=xi Txj,κ5(xi,xj)=(1+xi Txj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n};
通过加权融合形成一个多核矩阵
Figure FDA0002574719970000013
m是整数,m∈{1,2,…,M},M=5,β表示加权融合过程中的核权重值;
基于多核矩阵对训练样本和测试样本进行非线性匹配,将原始特征空间转换到高维特征空间H0,在空间H0上训练样本矩阵表示为φ(X)=[φ(x1),φ(x2),…,φ(xn)],测试样本表示为φ(y);
4)对高维的特征空间进行样本空间转换,减少核空间特征参数的维数;
5)优化约束函数,求解稀疏表示系数向量;
6)定义满足类间重构误差最大且类内重构误差最小的目标函数;
7)优化求解核函数权值和投影系数矩阵;
8)基于求得的核函数权值和投影系数矩阵,根据测试样本的核稀疏最小重构误差实现对车辆类型的识别。
2.如权利要求1所述的一种基于CNN多特征联合和多核稀疏表示的车型识别方法,其特征在于:步骤4)中:
将转换到高维特征空间H0的特征参数乘以一个低维的投影矩阵P,减少核空间特征参数的维数,P=[P1,P2,…,Pd]∈Rm×d,d是投影空间的维数。
3.如权利要求2所述的一种基于CNN多特征联合和多核稀疏表示的车型识别方法,其特征在于:步骤5)中:
基于稀疏编码理论利用l-2范数约束优化求解,得到稀疏表示系数向量α,约束优化公式为:
Figure FDA0002574719970000021
其中,λ≥0,表示为了避免过拟合而加入的正则项,通过交叉验证来选择大小;矩阵A是投影矩阵P的系数矩阵,P=φ(X)A;
Figure FDA0002574719970000022
Km(i,y)=κm(xi,y);
Figure FDA0002574719970000023
Km(i,j)=κm(xi,xj),i和j均为整数,i∈{1,2,...,n},j∈{1,2,...,n}。
4.如权利要求3所述的一种基于CNN多特征联合和多核稀疏表示的车型识别方法,其特征在于:步骤6)中:
定义满足类间重构误差最大且类内重构误差最小的目标函数F(A,β):
Figure FDA0002574719970000031
其中,I为单位矩阵;Jb=tr(ATKβSbKβA),tr(·)表示矩阵的迹;
Sb为类间散度矩阵,
Figure FDA0002574719970000032
ei是第i个元素为1其他元素为0的n维单位向量,αi表示第i个训练样本的稀疏表示系数向量,δsi)是一个n维向量,它的非零元素由矩阵αi中跟除第
Figure FDA0002574719970000038
类以外关联的位置元素组成,而跟第
Figure FDA0002574719970000039
类关联的位置元素为0,
Figure FDA00025747199700000310
表示车辆的类别,c为训练样本的类别个数;
Jw=tr(AT(KβSwKβ+λI)A),Sw为类内散度矩阵
Figure FDA0002574719970000033
Figure FDA0002574719970000034
是一个n维向量,它的非零元素由矩阵αi中跟第
Figure FDA00025747199700000311
类关联的位置元素组成,除第
Figure FDA00025747199700000312
类以外的其他位置元素均为0。
5.如权利要求4所述的一种基于CNN多特征联合和多核稀疏表示的车型识别方法,其特征在于:步骤7)中:
优化求解核函数权值β和投影系数矩阵A,将目标函数转化为:
Figure FDA0002574719970000035
其中,ρ表示给定一个A和β后的极大值,
Figure FDA0002574719970000036
采用交替迭代的方法进行优化求解,重复迭代次数直到收敛,具体如下:
优化求解A:
固定β,则目标函数为:
Figure FDA0002574719970000037
使用最小角回归算法求得最优解A;
优化求解β:
固定A,则目标函数为:
Figure FDA0002574719970000041
定义一个关于β的函数h(β)=tr(AT(KβSbKβ-ρKβSwKβ-ρλI)A);
对其求偏导
Figure FDA0002574719970000042
通过解二次规划问题
Figure FDA0002574719970000043
其中z是β在
Figure FDA0002574719970000044
方向上的映射,优化求解β。
6.如权利要求5所述的一种基于CNN多特征联合和多核稀疏表示的车型识别方法,其特征在于:步骤8)中:
使用最小重构误差根据稀疏表示系数向量α分类样本y,重构误差表示为
Figure FDA0002574719970000045
根据公式
Figure FDA0002574719970000046
进行车型识别分类。
CN201710518975.7A 2017-06-29 2017-06-29 基于cnn多特征联合和多核稀疏表示的车型识别方法 Active CN107330463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710518975.7A CN107330463B (zh) 2017-06-29 2017-06-29 基于cnn多特征联合和多核稀疏表示的车型识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710518975.7A CN107330463B (zh) 2017-06-29 2017-06-29 基于cnn多特征联合和多核稀疏表示的车型识别方法

Publications (2)

Publication Number Publication Date
CN107330463A CN107330463A (zh) 2017-11-07
CN107330463B true CN107330463B (zh) 2020-12-08

Family

ID=60199126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710518975.7A Active CN107330463B (zh) 2017-06-29 2017-06-29 基于cnn多特征联合和多核稀疏表示的车型识别方法

Country Status (1)

Country Link
CN (1) CN107330463B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052861A (zh) * 2017-11-08 2018-05-18 北京卓视智通科技有限责任公司 一种神经网络系统及基于该神经网络系统的车型识别方法
CN107862340A (zh) * 2017-11-16 2018-03-30 深圳市华尊科技股份有限公司 一种车型识别方法及装置
US10740659B2 (en) 2017-12-14 2020-08-11 International Business Machines Corporation Fusing sparse kernels to approximate a full kernel of a convolutional neural network
CN108197538B (zh) * 2017-12-21 2020-10-16 浙江银江研究院有限公司 一种基于局部特征和深度学习的卡口车辆检索系统及方法
CN108491880B (zh) * 2018-03-23 2021-09-03 西安电子科技大学 基于神经网络的物体分类和位姿估计方法
CN108681707A (zh) * 2018-05-15 2018-10-19 桂林电子科技大学 基于全局和局部特征融合的大角度车型识别方法和系统
CN109359696B (zh) * 2018-10-29 2021-04-02 重庆中科云从科技有限公司 一种车款识别方法、系统及存储介质
CN109166317B (zh) * 2018-10-29 2020-07-24 东北林业大学 基于状态特征的城市交通路径通过时间确定方法
CN109598218B (zh) * 2018-11-23 2023-04-18 南通大学 一种车型的快速识别方法
CN109753887B (zh) * 2018-12-17 2022-09-23 南京师范大学 一种基于增强核稀疏表示的sar图像目标识别方法
CN109919242A (zh) * 2019-03-18 2019-06-21 长沙理工大学 一种基于深度特征和联合稀疏的图像目标识别方法
CN110287847A (zh) * 2019-06-19 2019-09-27 长安大学 基于Alexnet-CLbpSurf多特征融合的车辆分级检索方法
CN111062249A (zh) * 2019-11-11 2020-04-24 北京百度网讯科技有限公司 车辆信息获取方法、装置、电子设备及存储介质
CN111310864B (zh) * 2020-03-30 2023-04-18 安徽工业大学 一种基于分组稀疏的多核学习图像分类方法
CN112069958A (zh) * 2020-08-27 2020-12-11 广西柳工机械股份有限公司 物料识别方法、装置、设备及存储介质
CN113111879B (zh) * 2021-04-30 2023-11-10 上海睿钰生物科技有限公司 一种细胞检测的方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014152919A1 (en) * 2013-03-14 2014-09-25 Arizona Board Of Regents, A Body Corporate Of The State Of Arizona For And On Behalf Of Arizona State University Kernel sparse models for automated tumor segmentation
CN105046269B (zh) * 2015-06-19 2019-02-22 鲁东大学 一种基于多核融合的多示例多标签场景分类方法
CN105809121A (zh) * 2016-03-03 2016-07-27 电子科技大学 多特征协同的交通标志检测与识别方法
CN105760900B (zh) * 2016-04-08 2019-06-18 西安电子科技大学 基于近邻传播聚类和稀疏多核学习的高光谱图像分类方法
CN105844261A (zh) * 2016-04-21 2016-08-10 浙江科技学院 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法
CN105930812A (zh) * 2016-04-27 2016-09-07 东南大学 一种基于融合特征稀疏编码模型的车辆品牌类型识别方法
CN105956560B (zh) * 2016-05-06 2019-07-09 电子科技大学 一种基于池化多尺度深度卷积特征的车型识别方法
CN106845351A (zh) * 2016-05-13 2017-06-13 苏州大学 一种用于视频的基于双向长短时记忆单元的行为识别方法
CN106203318B (zh) * 2016-06-29 2019-06-11 浙江工商大学 基于多层次深度特征融合的摄像机网络行人识别方法
CN106384100A (zh) * 2016-09-28 2017-02-08 武汉大学 一种基于部件的精细车型识别方法
CN106886580B (zh) * 2017-01-23 2020-01-17 北京工业大学 一种基于深度学习的图片情感极性分析方法

Also Published As

Publication number Publication date
CN107330463A (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
CN107330463B (zh) 基于cnn多特征联合和多核稀疏表示的车型识别方法
US11450066B2 (en) 3D reconstruction method based on deep learning
CN110414377B (zh) 一种基于尺度注意力网络的遥感图像场景分类方法
CN112836672B (zh) 一种基于自适应近邻图嵌入的无监督数据降维方法
CN111612008B (zh) 基于卷积网络的图像分割方法
WO2018010434A1 (zh) 一种图像分类方法及装置
CN109029363A (zh) 一种基于深度学习的目标测距方法
CN107066559A (zh) 一种基于深度学习的三维模型检索方法
CN109840560A (zh) 基于胶囊网络中融入聚类的图像分类方法
CN114581560B (zh) 基于注意力机制的多尺度神经网络红外图像彩色化方法
CN105787516A (zh) 一种基于空谱局部性低秩超图学习的高光谱图像分类方法
CN108460400B (zh) 一种结合多种特征信息的高光谱图像分类方法
Zhou et al. ECA-mobilenetv3 (large)+ SegNet model for binary sugarcane classification of remotely sensed images
CN109657704B (zh) 一种基于稀疏融合的核化场景特征提取方法
CN109376787A (zh) 流形学习网络及基于其的计算机视觉图像集分类方法
CN111652273A (zh) 一种基于深度学习的rgb-d图像分类方法
Yun et al. In defense of knowledge distillation for task incremental learning and its application in 3D object detection
CN113344110A (zh) 一种基于超分辨率重建的模糊图像分类方法
CN118015356B (zh) 一种基于高斯混合的变分动态融合网络的高光谱分类方法
Saraswat et al. Plant Disease Identification Using Plant Images
CN113505831A (zh) 一种基于核范数约束的多视图聚类方法及系统
CN104933410A (zh) 一种高光谱图像光谱域与空间域联合分类方法
Rodrigues et al. HEp-2 cell image classification based on convolutional neural networks
CN112966735A (zh) 一种基于谱重建的监督多集相关特征融合方法
CN112232102B (zh) 一种基于深度神经网络和多任务学习的建筑物目标识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant