CN114022703A - 一种基于深度学习的高效车辆细粒度识别方法 - Google Patents

一种基于深度学习的高效车辆细粒度识别方法 Download PDF

Info

Publication number
CN114022703A
CN114022703A CN202111248733.3A CN202111248733A CN114022703A CN 114022703 A CN114022703 A CN 114022703A CN 202111248733 A CN202111248733 A CN 202111248733A CN 114022703 A CN114022703 A CN 114022703A
Authority
CN
China
Prior art keywords
feature
vehicle
feature map
channels
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111248733.3A
Other languages
English (en)
Inventor
杨非
叶娇娇
高飞
陆陈昊
鲍虎军
华炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Zhejiang Lab
Original Assignee
Zhejiang University of Technology ZJUT
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT, Zhejiang Lab filed Critical Zhejiang University of Technology ZJUT
Priority to CN202111248733.3A priority Critical patent/CN114022703A/zh
Publication of CN114022703A publication Critical patent/CN114022703A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于深度学习的高效车辆细粒度识别方法,它通过构建高效残差结构提取车辆图像特征,然后通过空间通道损失函数提高特征提取网络的细粒度分类能力,使网络更加专注于车辆图像的不同组件区域,保证特征通道的可区分性和可辨别性,并且不增加卷积神经网络推理的计算量。本发明通过深度学习自动提取特征,避免手工设计特征区域的局限性,更能克服车辆图片复杂环境噪音的干扰,并且能通过空间特征损失函数使特征通过关注更丰富的特征区域,提高车辆细粒度识别的准确率。

Description

一种基于深度学习的高效车辆细粒度识别方法
技术领域
本发明涉及智能交通技术领域,具体是一种基于深度学习的高效车辆细粒度识别方法,它是通过卷积神经网络实现车辆细粒度分类的方法。
背景技术
随着我国交通事业的迅速发展,道路摄像头所采集的车辆视频信息形成了海量的数据存储。基于图像处理的车辆细粒度分类技术是智能交通领域的重要技术,为视频监控和执法部门提供了重大的帮助。
现有车辆细粒度分类技术中,主要集中于识别车辆的类型,例如大众帕萨特2007款。车辆识别方法中需要保证车辆整体轮廓的清晰,另外现有的车辆识别技术多使用传统的提取方法,例如梯度方向直方图、局部二值模式纹理、支持向量机等。发明专利(申请号:CN201310416016.6,名称:基于图像的车辆品牌识别方法和系统)通过检测车牌在输入图像中的位置,根据车牌位置计算多个车辆部件的位置,从该多个部件位置每一个抽取特征向量以及对所抽取的特征向量进行分类并输出车辆的品牌信息。该方法通过分别提取不同组件的特征进行识别,检测准确率低识别速度慢;发明专利(申请号:CN202110514090.6,名称:一种基于通道分组注意力模型的细粒度车辆分类方法)采用通道分组与注意力模块结合的方式构建网络并进行训练,提高网络对判别区域的注意力。但是该方法无法保证网络关注车辆特征的全局信息,容易缺失部分组件特征。
发明内容
为克服现有技术的上述缺点,本发明的目的在于提供一种基于深度学习的高效车辆细粒度识别方法,通过损失函数提高特征提取网络的细粒度分类能力,使网络更加专注于车辆图像的不同组件区域,保证特征通道的可区分性和可辨别性,并且不增加卷积神经网络推理的计算量。
本发明的一种基于深度学习的高效车辆细粒度识别方法,通过损失函数提高特征提取网络的细粒度分类能力,使网络更加专注于车辆图像的不同组件区域,其特征在于包括如下步骤:
步骤1:将车辆图像的测试样本与训练样本归一化到224×224像素;
步骤2:利用训练样本进行卷积神经网络模型训练,提取车辆图像的深层特征信息;
步骤3:推理时只通过式(1)对特征向量进行归一化,得到不同类别的概率分布;
Figure BDA0003321698650000021
其中,xi表示上述步骤获取的不同车辆类别的特征向量,i表示车辆类别索引,C表示总的车辆类别个数,e表示自然数;
步骤4:根据上述步骤获取的不同车辆类别的概率列表,并输出最大概率的车辆类别。
进一步地,本发明还限定了步骤2中的利用训练样本进行卷积神经网络模型训练,提取车辆图像的深层特征信息,具体包括如下步骤:
步骤2.1:使用3×3卷积核在特征维度上进行随机和稀疏连接,融合图像空间位置信息到低尺度特征图,并从3通道增加特征通道深度到32通道;
步骤2.2:将不同深度特征信息通过ReLu进行激活和归一化操作;
步骤2.3:将上述步骤获得的特征图送入高效残差结构中,经过多次特征提取获得特征图F作为下层输入;
步骤2.4:通过空间通道损失函数计算特征图F的损失;
进一步地,本发明还限定了步骤2.3中建立高效残差结构,具体包括如下步骤:
步骤2.3.1通过1×1卷积核扩张通道深度,增大不同通道之间的空间相关性连接,获得具有丰富通道间信息的深度特征图通过ReLu进行激活和归一化操作;
步骤2.3.2将上述特征图进行3×3卷积核的组卷积操作,对组内通道特征进行随机稀疏连接,降低卷积操作的连接密度和参数复杂度,并通过ReLu进行激活和归一化操作;
步骤2.3.3再通过1×1卷积将通道数降低,复原特征信息的通道深度,避免提取的特征出现冗余;
步骤2.3.4同时将输入到步骤2.3.1的原始特征图再送入1×1卷积核的滤波器获取丰富空间相关信息的特征图,并归一化;
步骤2.3.5将步骤2.3.3获取的特征图进行级联操作,融合成包含丰富维度的深度特征信息;
步骤2.3.6将步骤2.3.4和步骤2.3.5得到的特征图进行混洗操作,调整深度特征图的通道排列顺序,增加通道间信息的交流,使组内特征信息得到丰富,增加空间相关性的表达能力;
进一步地,本发明还限定了步骤2.4中建立空间通道损失函数,具体包括如下步骤:
步骤2.4.1将特征通道进行分组,不同组的特征通道专注于提取不同区域类型的特征,每组特征通道对应于每个区域应该具有代表性,专注度损失Ldis通过以下公式计算:
Ldis(F)=Lce(y,f(g(F))) (2)
Figure BDA0003321698650000041
Figure BDA0003321698650000042
其中,Lce代表交叉熵损失函数,i代表车辆类型的索引,y代表真实标签,C代表类别数,F代表特征图,W代表特征图的宽度,H代表特征图的高度,η代表特征图的深度,j代表特征图每层特征的索引,max代表求集合的最大值;
步骤2.4.2将每个特征图的最大响应点作为当前特征图的响应中心点p,根据特征图响应度最高点的最小距离占全部距离平均数的比重通过公式(5)计算平均距离系数D(p),以此代表特征分组的差异性情况,响应点的平均距离系数越小则损失越大,分辨度损失Ldiv通过公式(6)计算:
Figure BDA0003321698650000043
Ldiv=Exp(-D(p)) (6)
其中,p代表特征响应中心点坐标向量pi,pj,dist代表欧式距离,min代表求集合的最小值,k代表特征响应中心点的数量;
步骤2.4.3根据计算所得的专注度损失Ldis和分辨度损失Ldiv相加作为总损失对网络进行训练。
通过采用上述技术,与现有技术相比,本发明的有益效果为:本发明通过深度学习自动提取特征,避免手工设计特征区域的局限性,更能克服车辆图片复杂环境噪音的干扰,并且能通过空间特征损失函数使特征通过关注更丰富的特征区域,提高车辆细粒度识别的准确率。
附图说明
图1为本发明的实施例选取的车辆图像。
具体实施方式
以下通过实施例对本发明作进一步的描述。通常,车辆样本的图像是由图像采集设备获取的,本申请实施例的技术方案适用于对车辆样本图像进行车辆类型识别的应用场景。采用本申请实施例的技术方案,通过损失函数提高特征提取网络的细粒度分类能力,使网络更加专注于车辆图像的不同组件区域,保证特征通道的可区分性和可辨别性,并且不增加卷积神经网络推理的计算量。
本发明的实施例选取的车辆图像由图像采集设备获取,如图1所示,本发明的基于深度学习的高效的车辆细粒度分类方法,具体包括以下步骤:
步骤1:将车辆图像的测试样本与训练样本归一化到224×224像素;
步骤2:利用训练样本进行卷积神经网络模型训练,提取车辆图像的深层特征信息,具体为:
步骤2.1:使用3×3卷积核在特征维度上进行随机和稀疏连接,融合图像空间位置信息到低尺度特征图,并从3通道增加特征通道深度到32通道;
步骤2.2:将不同深度特征信息通过ReLu进行激活和归一化操作,获得特征图;
步骤2.3:将步骤2.2获得的特征图送入高效残差结构中,经过多次特征提取获得特征图F作为下层输入,具体为:
步骤2.3.1:通过1×1卷积核扩张通道深度,增大不同通道之间的空间相关性连接,获得具有丰富通道间信息的深度特征图通过ReLu进行激活和归一化操作;
步骤2.3.2:将步骤2.3.1进行3×3卷积核的组卷积操作,对组内通道特征进行随机稀疏连接,降低卷积操作的连接密度和参数复杂度,通过ReLu进行激活和归一化操作;
步骤2.3.3:再通过1×1卷积将通道数降低,复原特征信息的通道深度,避免提取的特征出现冗余;
步骤2.3.4:同时将输入到步骤2.3.1的原始特征图再送入1×1卷积核的滤波器获取丰富空间相关信息的特征图,并归一化;
步骤2.3.5:将步骤2.3.3获取的特征图进行级联操作,融合成包含丰富维度的深度特征信息;
步骤2.3.6:将步骤2.3.4和步骤2.3.5得到的特征图进行混洗操作,调整深度特征图的通道排列顺序,增加通道间信息的交流,使组内特征信息得到丰富,增加空间相关性的表达能力;
步骤2.4:通过空间通道损失函数计算特征图F的损失,具体为:
步骤2.4.1将特征通道进行分组,不同组的特征通道专注于提取不同区域类型的特征,每组特征通道对应于每个区域应该具有代表性,专注度损失Ldis通过以下公式计算:
Ldis(F)=Lce(y,f(g(F))) (1)
Figure BDA0003321698650000061
Figure BDA0003321698650000062
其中,Lce代表交叉熵损失函数,i代表车辆类型的索引,y代表真实标签,C代表类别数,F代表特征图,W代表特征图的宽度,H代表特征图的高度,η代表特征图的深度,j代表特征图每层特征的索引,max代表求集合的最大值;
步骤2.4.2将每个特征图的最大响应点作为当前特征图的响应中心点p,根据特征图响应度最高点的最小距离占全部距离平均数的比重计算平均距离系数D(p),计算如公式(4)所示,以此代表特征分组的差异性情况,响应点的平均距离系数越小则损失越大,分辨度损失Ldiv通过公式(5)计算,具体为:
Figure BDA0003321698650000071
Ldiv=Exp(-D(p)) (5)
其中,p代表特征响应中心点坐标向量pi,pj,dist代表欧式距离,min代表求集合的最小值,k代表特征响应中心点的数量;
步骤2.4.3根据计算所得的专注度损失Ldis和分辨度损失Ldiv相加作为总损失对网络进行训练;
步骤3:推理时只通过公式(6)对特征向量进行归一化,得到不同类别的概率分布;
Figure BDA0003321698650000072
其中,xi表示上述步骤获取的不同车辆类别的特征向量,i表示车辆类别索引,C表示总的车辆类别个数,e表示自然数;
步骤4:根据上述步骤获取的不同车辆类别的概率列表,并输出最大概率的车辆类别。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (4)

1.一种基于深度学习的高效车辆细粒度识别方法,通过损失函数提高特征提取网络的细粒度分类能力,使网络更加专注于车辆图像的不同组件区域,其特征在于包括如下步骤:
步骤1:将车辆图像的测试样本与训练样本归一化到224×224像素;
步骤2:利用训练样本进行卷积神经网络模型训练,提取车辆图像的深层特征信息;
步骤3:推理时只通过式(1)对特征向量进行归一化,得到不同类别的概率分布;
Figure FDA0003321698640000011
其中,xi表示上述步骤获取的不同车辆类别的特征向量,i表示车辆类别索引,C表示总的车辆类别个数,e表示自然数;
步骤4:根据上述步骤获取的不同车辆类别的概率列表,并输出最大概率的车辆类别。
2.根据权利要求1所述的基于深度学习的高效车辆细粒度识别方法,其特征在于步骤2中的利用训练样本进行卷积神经网络模型训练,提取车辆图像的深层特征信息,具体包括如下步骤:
步骤2.1:使用3×3卷积核在特征维度上进行随机和稀疏连接,融合图像空间位置信息到低尺度特征图,并从3通道增加特征通道深度到32通道;
步骤2.2:将不同深度特征信息通过ReLu进行激活和归一化操作;
步骤2.3:将上述步骤获得的特征图送入高效残差结构中,经过多次特征提取获得特征图F作为下层输入;
步骤2.4:通过空间通道损失函数计算特征图F的损失。
3.根据权利要求2所述的基于深度学习的高效车辆细粒度识别方法,其特征在于步骤2.3中建立高效残差结构,具体包括如下步骤:
步骤2.3.1通过1×1卷积核扩张通道深度,增大不同通道之间的空间相关性连接,获得具有丰富通道间信息的深度特征图通过ReLu进行激活和归一化操作;
步骤2.3.2将上述特征图进行3×3卷积核的组卷积操作,对组内通道特征进行随机稀疏连接,降低卷积操作的连接密度和参数复杂度,并通过ReLu进行激活和归一化操作;
步骤2.3.3再通过1×1卷积将通道数降低,复原特征信息的通道深度,避免提取的特征出现冗余;
步骤2.3.4同时将输入到步骤2.3.1的原始特征图再送入1×1卷积核的滤波器获取丰富空间相关信息的特征图,并归一化;
步骤2.3.5将步骤2.3.3获取的特征图进行级联操作,融合成包含丰富维度的深度特征信息;
步骤2.3.6将步骤2.3.4和步骤2.3.5得到的特征图进行混洗操作,调整深度特征图的通道排列顺序,增加通道间信息的交流,使组内特征信息得到丰富,增加空间相关性的表达能力。
4.根据权利要求2所述的基于深度学习的高效车辆细粒度识别方法,其特征在于步骤2.4:建立空间通道损失函数,具体包括如下步骤:
步骤2.4.1将特征通道进行分组,不同组的特征通道专注于提取不同区域类型的特征,每组特征通道对应于每个区域应该具有代表性,专注度损失Ldis通过以下公式计算:
Ldis(F)=Lce(y,f(g(F))) (2)
Figure FDA0003321698640000031
Figure FDA0003321698640000032
其中,Lce代表交叉熵损失函数,i代表车辆类型的索引,y代表真实标签,C代表类别数,F代表特征图,W代表特征图的宽度,H代表特征图的高度,η代表特征图的深度,j代表特征图每层特征的索引,max代表求集合的最大值;
步骤2.4.2将每个特征图的最大响应点作为当前特征图的响应中心点p,根据特征图响应度最高点的最小距离占全部距离平均数的比重通过公式(5)计算平均距离系数D(p),以此代表特征分组的差异性情况,响应点的平均距离系数越小则损失越大,分辨度损失Ldiv通过公式(6)计算:
Figure FDA0003321698640000033
Ldiv=Exp(-D(p)) (6)
其中,p代表特征响应中心点坐标向量pi,pj,dist代表欧式距离,min代表求集合的最小值,k代表特征响应中心点的数量;
步骤2.4.3根据计算所得的专注度损失Ldis和分辨度损失Ldiv相加作为总损失对网络进行训练。
CN202111248733.3A 2021-10-26 2021-10-26 一种基于深度学习的高效车辆细粒度识别方法 Pending CN114022703A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111248733.3A CN114022703A (zh) 2021-10-26 2021-10-26 一种基于深度学习的高效车辆细粒度识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111248733.3A CN114022703A (zh) 2021-10-26 2021-10-26 一种基于深度学习的高效车辆细粒度识别方法

Publications (1)

Publication Number Publication Date
CN114022703A true CN114022703A (zh) 2022-02-08

Family

ID=80057672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111248733.3A Pending CN114022703A (zh) 2021-10-26 2021-10-26 一种基于深度学习的高效车辆细粒度识别方法

Country Status (1)

Country Link
CN (1) CN114022703A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114332544A (zh) * 2022-03-14 2022-04-12 之江实验室 一种基于图像块评分的细粒度图像分类方法和装置
CN116403171A (zh) * 2023-06-08 2023-07-07 松立控股集团股份有限公司 一种车辆重识别方法、系统及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114332544A (zh) * 2022-03-14 2022-04-12 之江实验室 一种基于图像块评分的细粒度图像分类方法和装置
CN114332544B (zh) * 2022-03-14 2022-06-07 之江实验室 一种基于图像块评分的细粒度图像分类方法和装置
CN116403171A (zh) * 2023-06-08 2023-07-07 松立控股集团股份有限公司 一种车辆重识别方法、系统及电子设备
CN116403171B (zh) * 2023-06-08 2023-09-01 松立控股集团股份有限公司 一种车辆重识别方法、系统及电子设备

Similar Documents

Publication Publication Date Title
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN109902806B (zh) 基于卷积神经网络的噪声图像目标边界框确定方法
CN111539370A (zh) 一种基于多注意力联合学习的图像行人重识别方法和系统
CN111652293B (zh) 一种多任务联合判别学习的车辆重识别方法
CN112084868A (zh) 一种基于注意力机制的遥感图像中目标计数方法
CN112163498B (zh) 前景引导和纹理聚焦的行人重识别模型建立方法及其应用
CN105488519B (zh) 一种基于视频尺度信息的视频分类方法
Wang et al. Traffic sign detection using a cascade method with fast feature extraction and saliency test
CN114022703A (zh) 一种基于深度学习的高效车辆细粒度识别方法
CN109635726B (zh) 一种基于对称式深度网络结合多尺度池化的滑坡识别方法
CN112541448B (zh) 一种行人重识别方法、装置、电子设备和存储介质
CN113034545A (zh) 一种基于CenterNet多目标跟踪算法的车辆跟踪方法
CN111709313B (zh) 基于局部和通道组合特征的行人重识别方法
CN115171165A (zh) 全局特征与阶梯型局部特征融合的行人重识别方法及装置
CN111639564A (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN115631513B (zh) 基于Transformer的多尺度行人重识别方法
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN110826415A (zh) 一种场景图像中车辆的重识别方法及设备
CN112580480A (zh) 一种高光谱遥感影像分类方法及装置
CN114913498A (zh) 一种基于关键点估计的并行多尺度特征聚合车道线检测方法
CN111079543B (zh) 一种基于深度学习的高效车辆颜色识别方法
Liu et al. CAFFNet: channel attention and feature fusion network for multi-target traffic sign detection
CN112766378A (zh) 一种专注细粒度识别的跨域小样本图像分类模型方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN116543269B (zh) 基于自监督的跨域小样本细粒度图像识别方法及其模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination