CN108629267A - 一种基于深度残差网络的车型识别方法 - Google Patents
一种基于深度残差网络的车型识别方法 Download PDFInfo
- Publication number
- CN108629267A CN108629267A CN201810170873.5A CN201810170873A CN108629267A CN 108629267 A CN108629267 A CN 108629267A CN 201810170873 A CN201810170873 A CN 201810170873A CN 108629267 A CN108629267 A CN 108629267A
- Authority
- CN
- China
- Prior art keywords
- training
- parameter
- affine
- layer
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度残差网络的车型识别方法,涉及计算机视觉领域,能够在不同背景下提取车辆特征,进行车型识别。本发明包括:对深度残差网络进行参数初始化;将训练数据载入深度残差网络,结合数据增强策略,训练得到训练好的深度残差网络;将车型图像载入训练好的深度残差网络,训练好的深度残差网络进行识别,并从网络输出端输出类别标签。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于深度残差网络的车型识别方法。
背景技术
近年来,汽车厂商推出的车型日益丰富,国内汽车保有总量逐年攀升,导致汽车增长量与道路承载能力之间的矛盾愈发突出,道路堵塞、交通事故等问题层出不穷,一些重要路段的交通压力也越来越大。
汽车车型识别已经成为了智能交通领域的一个重要的研究内容,可以为核心路段的交通监控、交通事故责任判定等方面提供有力的技术支持。在实际的道路环境下,车辆图像往往存在着多角度、遮挡、光照变化等影响因素,影响到了车型的识别。
综上,现有技术中缺乏能够适应于不同背景下提取车辆特征的车型识别方法。
发明内容
本发明提供一种基于深度残差网络的车型识别方法,能够在不同背景下提取车辆特征,进行车型识别。
为达到上述目的,本发明采用如下技术方案:
一种基于深度残差网络的车型识别方法,包括:
S1、对深度残差网络进行参数初始化;
S2、将训练数据载入深度残差网络,结合数据增强策略,训练得到训练好的深度残差网络;
S3、将车型图像载入训练好的深度残差网络,训练好的深度残差网络进行识别,并从网络输出端输出类别标签。
进一步的,所述深度残差网络包括五个残差单元、两个全连接层、分类损失、类别中心损失、输出层。五个残差单元共有34层,两个全连接层用于提取全局特征,输出层用于预测输入图像的类别,训练时作为类别损失项和中心化损失项的输入。
第一残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为128,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为256,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第二残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为256,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为512,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第三残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为512,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为1024,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第四残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为1024,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为2048,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第五残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为2048,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为1024,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第一全连接层的内部参数包括二维矩阵权重,尺寸分别是50176和4096,以及一维矩阵偏置,尺寸为4096,
第二全连接层的内部参数包括二维矩阵权重,尺寸分别是4096和1000,以及一维矩阵偏置,尺寸为1000,
多分类对率回归损失层无内部参数,输出为各个输入特征以自然数空间为基准相对于同样以自然数空间为基准的输入特征总和的比例,
中心损失层的内部参数只有二维矩阵中心距离,尺寸为196和1000,该参数在第一次训练时设置为全零矩阵,随后每经过一个训练批次就按照当前训练批次的特征所属的类别计算该类别下的特征的欧氏距离均值,然后乘以学习率得到更新值,最后对该类别下的中心距离进行更新。
进一步的,在所述S1中,所述参数初始化为基于高斯分布的方法初始化学习参数,其中高斯中心为0,高斯方差为训练时一个训练批次样本数的两倍倒数的平方根。
进一步的,在所述S2中,所述训练使用的数据增强方法包括图像水平翻转、图像随机尺寸剪切、图像随机噪声添加;所述训练采用随机梯度下降训练方法,一个训练批次的训练样本数为128个,总的迭代次数为80个训练周期,1个训练周期代表总的训练样本对1个训练周期的商,每经过1个训练周期就随机生成总的所述训练样本的训练次序,学习率参数采用阶梯下降策略,所述学习率的初始值设为0.01,经过30个训练周期和50个训练周期时分别下降一次,下降因子为0.1。权重衰减项为0.0005,动量项为0.9。
本发明的有益效果为:
本发明设计了基于残差学习单元的深度残差网络结构,在深度残差网络的基础上添加类别中心正则化的约束以强化同一类别内的特征的相似性及不同类别的特征的可区分性,进一步提高模型的分类性能;训练时使用了多种数据增强策略,充分利用预训练模型的优势,在不同背景下提高车型识别效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明的模型结构总图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合具体实施方式对本发明作进一步详细描述。
一种基于深度残差网络的车型识别方法,包括:
S1、设计一种深度残差网络,其结构如图1所示。
所述深度残差网络包括五个残差单元、两个全连接层、分类损失、类别中心损失、输出层。五个残差单元共有34层,两个全连接层用于提取全局特征,输出层用于预测输入图像的类别,训练时作为类别损失项和中心化损失项的输入。
S2、将训练数据载入所述深度残差网络,结合数据增强策略,训练得到训练好的深度残差网络。
训练主机的型号为泰坦 X(帕斯卡架构) 12GB + I7-6700K + 16GB 金士顿的内存 + 128GB 西部数据的固态硬盘,训练框架为Caffe(Convolution Architecture forFast Feature Embedding),采用C++语言。
训练采用随机梯度下降训练方法,训练样本数为128个,总的迭代次数为80个训练周期,1个训练周期代表总的训练样本对1个训练批量的商,每经过1个训练周期再次随机挑选总的所述训练样本,学习率参数采用阶梯下降策略,所述学习率的初始值设为0.01,经过30个训练周期和50个训练周期时分别下降一次,下降因子为0.1。权重衰减项为0.0005,动量项为0.9。
S3、将车型图像载入所述训练好的深度残差网络,所述训练好的深度残差网络进行识别,并从网络输出端输出类别标签。
车型图像存储在固态硬盘中,再以文本格式输入到网络模型中。深度残差网络识别时采用斯坦福车型数据集,数据集中的图像和标签转成LMDB(lightening-MemoryMapped Dataset)格式输入到深度残差网络中。
本发明的有益效果是:
本发明设计了基于残差学习单元的深度残差网络结构,在深度残差网络的基础上添加类别中心正则化的约束以强化同一类别内的特征的相似性及不同类别的特征的可区分性,进一步提高模型的分类性能;训练时使用了多种数据增强策略,充分利用预训练模型的优势,在不同背景下提高车型识别效率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (5)
1.一种基于深度残差网络的车型识别方法,其特征在于,包括:
S1、对深度残差网络进行参数初始化;
S2、将训练数据载入所述深度残差网络,结合数据增强策略,训练得到训练好的深度残差网络;
S3、将车型图像载入所述训练好的深度残差网络,所述训练好的深度残差网络进行识别,并从网络输出端输出类别标签。
2.根据权利要求1所述的方法,其特征在于,所述深度残差网络包括五个残差单元、两个全连接层、多分类对率回归损失层、中心损失层,
第一残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为128,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为256,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第二残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为256,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为512,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第三残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为512,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为1024,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第四残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为1024,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为2048,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第五残差单元的组成按照总体模型在输入样本进行预测时的数据流向依次为卷积层1,参数包括通道数为2048,卷积核尺寸为3和3,步长为2,补零项尺寸为1和1;批量正则化层1,参数包括动态更新值2,以及仿射比例和仿射偏置;线性激活层1;卷积层2,参数包括通道数为1024,卷积核尺寸为1和1,步长为1,补零项尺寸为0和0;批量正则化层2, 参数包括动态更新值2,以及仿射比例和仿射偏置;数值单元融合层,模式为相加操作;线性激活层2,
第一全连接层的内部参数包括二维矩阵权重,尺寸分别是50176和4096,以及一维矩阵偏置,尺寸为4096,
第二全连接层的内部参数包括二维矩阵权重,尺寸分别是4096和1000,以及一维矩阵偏置,尺寸为1000,
多分类对率回归损失层无内部参数,输出为各个输入特征以自然数空间为基准相对于同样以自然数空间为基准的输入特征总和的比例,
中心损失层的内部参数只有二维矩阵中心距离,尺寸为196和4096,该参数在第一次训练时设置为全零矩阵,随后每经过一个训练批次就按照当前训练批次的特征所属的类别计算该类别下的特征的欧氏距离均值,然后乘以学习率得到更新值,最后对该类别下的中心距离进行更新。
3.根据权利要求1所述的方法,在所述S1中,所述参数初始化为基于高斯分布的方法初始化学习参数,其中高斯中心为0,高斯方差为训练时一个训练批次样本数的两倍倒数的平方根。
4.根据权利要求1所述的方法,在所述S2中,所述训练使用的数据增强方法包括图像水平翻转、图像随机尺寸剪切、图像随机噪声添加;所述训练采用随机梯度下降训练方法,一个训练批次的训练样本数为128个,总的迭代次数为80个训练周期,1个训练周期代表总的训练样本对1个训练周期的商,每经过1个训练周期就随机生成总的所述训练样本的训练次序,学习率参数采用阶梯下降策略,所述学习率的初始值设为0.01,经过30个训练周期和50个训练周期时分别下降一次,下降因子为0.1。
5.权重衰减项为0.0005,动量项为0.9。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810170873.5A CN108629267B (zh) | 2018-03-01 | 2018-03-01 | 一种基于深度残差网络的车型识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810170873.5A CN108629267B (zh) | 2018-03-01 | 2018-03-01 | 一种基于深度残差网络的车型识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108629267A true CN108629267A (zh) | 2018-10-09 |
CN108629267B CN108629267B (zh) | 2021-05-25 |
Family
ID=63706145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810170873.5A Active CN108629267B (zh) | 2018-03-01 | 2018-03-01 | 一种基于深度残差网络的车型识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108629267B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359385A (zh) * | 2018-10-17 | 2019-02-19 | 网宿科技股份有限公司 | 一种服务质量评估模型的训练方法及装置 |
CN109902563A (zh) * | 2019-01-17 | 2019-06-18 | 桂林远望智能通信科技有限公司 | 一种多角度车型识别方法及系统 |
CN110135423A (zh) * | 2019-05-23 | 2019-08-16 | 北京阿丘机器人科技有限公司 | 文本识别网络的训练方法和光学字符识别方法 |
CN111192237A (zh) * | 2019-12-16 | 2020-05-22 | 重庆大学 | 一种基于深度学习的涂胶检测系统和方法 |
CN111523579A (zh) * | 2020-04-14 | 2020-08-11 | 燕山大学 | 一种基于改进深度学习的车型识别方法及系统 |
CN111857793A (zh) * | 2019-04-30 | 2020-10-30 | 杭州海康威视数字技术股份有限公司 | 网络模型的训练方法、装置、设备及存储介质 |
CN111695587B (zh) * | 2020-04-01 | 2024-04-16 | 新华三技术有限公司 | 一种车辆品牌型号识别方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170140273A1 (en) * | 2015-11-18 | 2017-05-18 | Video Inform Ltd | System and method for automatic selection of deep learning architecture |
CN106991386A (zh) * | 2017-02-27 | 2017-07-28 | 杭州电子科技大学 | 一种基于深度残差网络的手势识别方法 |
-
2018
- 2018-03-01 CN CN201810170873.5A patent/CN108629267B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170140273A1 (en) * | 2015-11-18 | 2017-05-18 | Video Inform Ltd | System and method for automatic selection of deep learning architecture |
CN106991386A (zh) * | 2017-02-27 | 2017-07-28 | 杭州电子科技大学 | 一种基于深度残差网络的手势识别方法 |
Non-Patent Citations (1)
Title |
---|
楚翔宇: "基于深度学习的交通视频检测及车型分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359385A (zh) * | 2018-10-17 | 2019-02-19 | 网宿科技股份有限公司 | 一种服务质量评估模型的训练方法及装置 |
CN109359385B (zh) * | 2018-10-17 | 2021-11-23 | 网宿科技股份有限公司 | 一种服务质量评估模型的训练方法及装置 |
CN109902563A (zh) * | 2019-01-17 | 2019-06-18 | 桂林远望智能通信科技有限公司 | 一种多角度车型识别方法及系统 |
CN111857793A (zh) * | 2019-04-30 | 2020-10-30 | 杭州海康威视数字技术股份有限公司 | 网络模型的训练方法、装置、设备及存储介质 |
CN111857793B (zh) * | 2019-04-30 | 2024-06-07 | 杭州海康威视数字技术股份有限公司 | 网络模型的训练方法、装置、设备及存储介质 |
CN110135423A (zh) * | 2019-05-23 | 2019-08-16 | 北京阿丘机器人科技有限公司 | 文本识别网络的训练方法和光学字符识别方法 |
CN111192237A (zh) * | 2019-12-16 | 2020-05-22 | 重庆大学 | 一种基于深度学习的涂胶检测系统和方法 |
CN111192237B (zh) * | 2019-12-16 | 2023-05-02 | 重庆大学 | 一种基于深度学习的涂胶检测系统和方法 |
CN111695587B (zh) * | 2020-04-01 | 2024-04-16 | 新华三技术有限公司 | 一种车辆品牌型号识别方法及装置 |
CN111523579A (zh) * | 2020-04-14 | 2020-08-11 | 燕山大学 | 一种基于改进深度学习的车型识别方法及系统 |
CN111523579B (zh) * | 2020-04-14 | 2022-05-03 | 燕山大学 | 一种基于改进深度学习的车型识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108629267B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629267A (zh) | 一种基于深度残差网络的车型识别方法 | |
CN105279554B (zh) | 基于哈希编码层的深度神经网络的训练方法及装置 | |
CN109800628B (zh) | 一种加强ssd小目标行人检测性能的网络结构及检测方法 | |
CN105512289B (zh) | 基于深度学习和哈希的图像检索方法 | |
CN104199832B (zh) | 基于信息熵的金融网络异常交易社区发现方法 | |
CN108921196A (zh) | 一种改进全卷积神经网络的语义分割方法 | |
CN107092661A (zh) | 一种基于深度卷积神经网络的图像检索方法 | |
CN108932314A (zh) | 一种基于深度哈希学习的菊花图像内容检索方法 | |
CN108292369A (zh) | 使用深度学习属性来进行视觉识别 | |
CN109101552A (zh) | 一种基于深度学习的钓鱼网站url检测方法 | |
CN109165743A (zh) | 一种基于深度压缩自编码器的半监督网络表示学习算法 | |
CN107544904A (zh) | 一种基于深度cg‑lstm神经网络的软件可靠性预测模型 | |
CN107832458A (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
CN107292886A (zh) | 基于网格划分及神经网络的目标物入侵检测方法及装置 | |
CN104008420A (zh) | 一种基于自动编码机的分布式离群点检测方法及系统 | |
CN108804516A (zh) | 相似用户查找装置、方法及计算机可读存储介质 | |
CN110309854A (zh) | 一种信号调制方式识别方法及装置 | |
CN107563407A (zh) | 一种面向网络空间多模态大数据的特征表示学习系统 | |
CN111860233A (zh) | 基于选择注意力网络的sar图像复杂建筑物提取方法及系统 | |
CN110119772A (zh) | 一种基于几何形状特征融合的三维模型分类方法 | |
CN108364073A (zh) | 一种多标记学习方法 | |
CN110459258A (zh) | 基于多目标聚类遗传算法的多存储器内建自测试的方法 | |
CN109740552A (zh) | 一种基于平行特征金字塔神经网络的目标跟踪方法 | |
CN105653670A (zh) | 一种基于流形学习聚类算法的智能用电数据挖掘方法 | |
CN106156846A (zh) | 卷积神经网络特征的处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |