CN111582213A - 一种基于Centernet的汽车识别方法 - Google Patents
一种基于Centernet的汽车识别方法 Download PDFInfo
- Publication number
- CN111582213A CN111582213A CN202010413014.1A CN202010413014A CN111582213A CN 111582213 A CN111582213 A CN 111582213A CN 202010413014 A CN202010413014 A CN 202010413014A CN 111582213 A CN111582213 A CN 111582213A
- Authority
- CN
- China
- Prior art keywords
- enhanced
- network structure
- training
- centernet
- test set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000012360 testing method Methods 0.000 claims abstract description 32
- 238000012795 verification Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims abstract description 7
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于Centernet的汽车识别方法,包括如下步骤:S1:采集并收集原始图像数据;S2:对原始图像进行分类,具体分为训练集、验证集、测试集;并对训练集、验证集、测试集分别进行增强处理得到增强后的训练集、增强后的验证集、增强后的测试集;S3:搭建基于Centernet的网络结构;S4:对Centernet网络结构,采用Group Normalization进行标准化,Radam优化器作为网络训练的优化方法,进行迭代训练,得到训练后的Centernet网络结构;S5:用增强后的验证集和增强后的测试集对训练后的Centernet网络结构进行验证和测试。本发明方法将在车辆类别和位置特征的基础上,尝试通过新型的卷积网络方法提取图像中更加底层的特征,从而在空间位置上,得到车辆轨迹更详尽的特征。
Description
技术领域
本发明属于自动驾驶中的图像识别技术,具体涉及一种基于Centernet的汽车识别方法。
背景技术
现有自动驾驶技术主要利用在汽车,火车等作为辅助驾驶,均采用基于深度学习的图像识别,决策规划等方法。相关技术主要分为三类:(1)基于激光传感器的SLAM方法,属于感知-规划-控制中的感知类方法;(2)基于2D摄像头传感器的视觉SLAM方法;(3)基于多传感器的融合方法。不同种类的传感器决定了相关方法的类型。
各自的优点缺陷:激光传感器能更加精确得到捕捉远处物体信息,但成本相对较高,且相关方法没有2D的成熟。2D摄像机需要间接获取障碍物距离,精确跟3D激光传感器相比略低。由于5G技术,电子信息,电动车产业的蓬勃发展,在可见的将来自动驾驶相关技术将得到广阔的发展和使用。
发明内容
本发明所要解决的技术问题是现有的图像识别方法仅仅在车辆分类、车牌识别、汽车位置等特征的识别上具有成熟的应用,对2D图像的信息不能充分挖掘,目的在于提供一种基于Centernet的汽车识别方法,解决上述问题。
本发明通过下述技术方案实现:
一种基于Centernet的汽车识别方法,包括如下步骤:
S1:采集并收集原始图像数据;
S2:对原始图像进行分类,具体分为训练集、验证集、测试集;并对训练集、验证集、测试集分别进行增强处理得到增强后的训练集、增强后的验证集、增强后的测试集;
S3:搭建基于Centernet的网络结构;
S4:对Centernet网络结构,采用Group Normalization进行标准化,Radam优化器作为网络训练的优化方法,进行迭代训练,得到训练后的Centernet网络结构;
S5:用增强后的验证集和增强后的测试集对训练后的Centernet网络结构进行验证和测试。
网络模型优化方式在显存足够的情况下采取Adam优化方式依然能取得不错的效果。
进一步地,一种基于Centernet的汽车识别方法,所述S2还包括对原始图像数据的长度和宽度进行调整,S2具体步骤如下:
S21:调整原始图像数据的长度和宽度得到调整后的图片;
S22:选用X张调整后的图片作为训练集;选用Y张调整后的图片作为验证集;选用Z张调整后的图片作为测试集;
S23:将训练集、验证集、测试集的图片分别进行数据增强处理得到增强后的训练集、增强后的验证集、增强后的测试集。
进一步地,一种基于Centernet的汽车识别方法,所述S21具体为:将原始图像数据的长度统一调整为2560像素,将原始图像数据的宽度统一调整为512像素。
进一步地,一种基于Centernet的汽车识别方法,所述S22具体为:X取值为4000,Y取值为256,Z取值为2000。
进一步地,一种基于Centernet的汽车识别方法,所述S23中增强处理具体是对训练集、验证集、测试集内的图片采用旋转和模糊高斯处理。
进一步地,一种基于Centernet的汽车识别方法,所述S3中搭建基于Centernet的网络结构,具体是Backbone采用hourglass或Efficientnet或Dla的网络结构。
进一步地,一种基于Centernet的汽车识别方法,所述S4具体包括如下步骤:
S41:将增强后的训练集送入Centernet网络结构进行训练得到第一特征数据集;训练过程依次为全部网络结构-部分结构-头部结构-全部网络结构;
S42:采用Group Normalization对Centernet网络结构中部分参数进行标准化。
现有的图像识别方法仅仅在车辆分类、车牌识别、汽车位置等特征的识别上具有成熟的应用,对2D图像的信息不能充分挖掘,本发明提供的Centernet识别方法应用于汽车图像识别领域,在车辆类别和位置特征的基础上,尝试通过新型的卷积网络方法提取图像中更加底层的特征,从而在空间位置上,得到车辆轨迹更详尽的特征。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明一种基于Centernet的汽车识别方法,为基于2D摄像头的自动驾驶中图像识别方法,以往的图像识别方法仅仅在车辆分类、车牌识别、汽车位置等特征的识别上具有成熟的应用,对2D图像的信息不能充分挖掘。本发明方法将在车辆类别和位置特征的基础上,尝试通过新型的卷积网络方法提取图像中跟更加底层的特征,例如车身位置和旋转角度的绝对姿态,从而在空间位置上,得到车辆轨迹更详尽的特征,并且更精准的识别信息也会有利于后续轨道规划的方法研究。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明方法流程图。
图2为Centernet结构流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
如图1所示,本发明通过下述技术方案实现:
一种基于Centernet的汽车识别方法,包括如下步骤:
S1:采集并收集原始图像数据;
S2:对原始图像进行分类,具体分为训练集、验证集、测试集;并对训练集、验证集、测试集分别进行增强处理得到增强后的训练集、增强后的验证集、增强后的测试集;
S3:搭建基于Centernet的网络结构;
S4:对Centernet网络结构,采用Group Normalization进行标准化,Radam优化器作为网络训练的优化方法,进行迭代训练,得到训练后的Centernet网络结构;
S5:用增强后的验证集和增强后的测试集对训练后的Centernet网络结构进行验证和测试。
进一步地,一种基于Centernet的汽车识别方法,所述S2还包括对原始图像数据的长度和宽度进行调整,S2具体步骤如下:
S21:调整原始图像数据的长度和宽度得到调整后的图片;
S22:选用X张调整后的图片作为训练集;选用Y张调整后的图片作为验证集;选用Z张调整后的图片作为测试集;
S23:将训练集、验证集、测试集的图片分别进行数据增强处理得到增强后的训练集、增强后的验证集、增强后的测试集。
进一步地,一种基于Centernet的汽车识别方法,所述S21具体为:将原始图像数据的长度统一调整为2560像素,将原始图像数据的宽度统一调整为512像素。
进一步地,一种基于Centernet的汽车识别方法,所述S22具体为:X取值为4000,Y取值为256,Z取值为2000。
进一步地,一种基于Centernet的汽车识别方法,所述S23中增强处理具体是对训练集、验证集、测试集内的图片采用旋转和模糊高斯处理。
进一步地,一种基于Centernet的汽车识别方法,所述S3中搭建基于Centernet的网络结构,具体是Backbone采用hourglass或Efficientnet或Dla的网络结构。
进一步地,一种基于Centernet的汽车识别方法,所述S4具体包括如下步骤:
S41:将增强后的训练集送入Centernet网络结构进行训练得到第一特征数据集;训练过程依次为全部网络结构-部分结构-头部结构-全部网络结构;
S42:采用Group Normalization对Centernet网络结构中部分参数进行标准化。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于Centernet的汽车识别方法,其特征在于,包括如下步骤:
S1:采集并收集原始图像数据;
S2:对原始图像进行分类,具体分为训练集、验证集、测试集;并对训练集、验证集、测试集分别进行增强处理得到增强后的训练集、增强后的验证集、增强后的测试集;
S3:搭建基于Centernet的网络结构;
S4:对Centernet网络结构,采用Group Normalization进行标准化,Radam优化器作为网络训练的优化方法,进行迭代训练,得到训练后的Centernet网络结构;
S5:用增强后的验证集和增强后的测试集对训练后的Centernet网络结构进行验证和测试。
2.根据权利要求1所述的一种基于Centernet的汽车识别方法,其特征在于,所述S2还包括对原始图像数据的长度和宽度进行调整,S2具体步骤如下:
S21:调整原始图像数据的长度和宽度得到调整后的图片;
S22:选用X张调整后的图片作为训练集;选用Y张调整后的图片作为验证集;选用Z张调整后的图片作为测试集;
S23:将训练集、验证集、测试集的图片分别进行数据增强处理得到增强后的训练集、增强后的验证集、增强后的测试集。
3.根据权利要求2所述的一种基于Centernet的汽车识别方法,其特征在于,所述S21具体为:将原始图像数据的长度统一调整为2560像素,将原始图像数据的宽度统一调整为512像素。
4.根据权利要求2所述的一种基于Centernet的汽车识别方法,其特征在于,所述S22具体为:X取值为4000,Y取值为256,Z取值为2000。
5.根据权利要求2所述的一种基于Centernet的汽车识别方法,其特征在于,所述S23中增强处理具体是对训练集、验证集、测试集内的图片采用旋转和模糊高斯处理。
6.根据权利要求1所述的一种基于Centernet的汽车识别方法,其特征在于,所述S3中搭建基于Centernet的网络结构,具体是Backbone采用hourglass或Efficientnet或Dla的网络结构。
7.根据权利要求1所述的一种基于Centernet的汽车识别方法,其特征在于,所述S4具体包括如下步骤:
S41:将增强后的训练集送入Centernet网络结构进行训练得到第一特征数据集;训练过程依次为全部网络结构-部分结构-头部结构-全部网络结构;
S42:采用Group Normalization对Centernet网络结构中部分参数进行标准化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010413014.1A CN111582213A (zh) | 2020-05-15 | 2020-05-15 | 一种基于Centernet的汽车识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010413014.1A CN111582213A (zh) | 2020-05-15 | 2020-05-15 | 一种基于Centernet的汽车识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111582213A true CN111582213A (zh) | 2020-08-25 |
Family
ID=72124982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010413014.1A Pending CN111582213A (zh) | 2020-05-15 | 2020-05-15 | 一种基于Centernet的汽车识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582213A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329776A (zh) * | 2020-12-03 | 2021-02-05 | 北京智芯原动科技有限公司 | 基于改进CenterNet网络的车牌检测方法及装置 |
CN112507845A (zh) * | 2020-12-02 | 2021-03-16 | 余姚市浙江大学机器人研究中心 | 基于CenterNet与深度关联矩阵的行人多目标跟踪方法 |
CN112784756A (zh) * | 2021-01-25 | 2021-05-11 | 南京邮电大学 | 人体识别跟踪方法 |
CN112861608A (zh) * | 2020-12-30 | 2021-05-28 | 浙江万里学院 | 一种分心驾驶行为的检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018102037A4 (en) * | 2018-12-09 | 2019-01-17 | Ge, Jiahao Mr | A method of recognition of vehicle type based on deep learning |
CN110543838A (zh) * | 2019-08-19 | 2019-12-06 | 上海光是信息科技有限公司 | 车辆信息检测的方法及装置 |
CN110992731A (zh) * | 2019-12-12 | 2020-04-10 | 苏州智加科技有限公司 | 基于激光雷达的3d车辆检测方法、装置及存储介质 |
-
2020
- 2020-05-15 CN CN202010413014.1A patent/CN111582213A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018102037A4 (en) * | 2018-12-09 | 2019-01-17 | Ge, Jiahao Mr | A method of recognition of vehicle type based on deep learning |
CN110543838A (zh) * | 2019-08-19 | 2019-12-06 | 上海光是信息科技有限公司 | 车辆信息检测的方法及装置 |
CN110992731A (zh) * | 2019-12-12 | 2020-04-10 | 苏州智加科技有限公司 | 基于激光雷达的3d车辆检测方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
KAIWEN DUAN等: "CenterNet: Keypoint Triplets for Object Detection" * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507845A (zh) * | 2020-12-02 | 2021-03-16 | 余姚市浙江大学机器人研究中心 | 基于CenterNet与深度关联矩阵的行人多目标跟踪方法 |
CN112329776A (zh) * | 2020-12-03 | 2021-02-05 | 北京智芯原动科技有限公司 | 基于改进CenterNet网络的车牌检测方法及装置 |
CN112329776B (zh) * | 2020-12-03 | 2023-10-27 | 北京智芯原动科技有限公司 | 基于改进CenterNet网络的车牌检测方法及装置 |
CN112861608A (zh) * | 2020-12-30 | 2021-05-28 | 浙江万里学院 | 一种分心驾驶行为的检测方法及系统 |
CN112784756A (zh) * | 2021-01-25 | 2021-05-11 | 南京邮电大学 | 人体识别跟踪方法 |
CN112784756B (zh) * | 2021-01-25 | 2022-08-26 | 南京邮电大学 | 人体识别跟踪方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582213A (zh) | 一种基于Centernet的汽车识别方法 | |
CN111368687B (zh) | 一种基于目标检测和语义分割的人行道车辆违停检测方法 | |
CN111079640B (zh) | 一种基于自动扩增样本的车型识别方法及系统 | |
CN101916383B (zh) | 基于多摄像机的车辆检测跟踪识别系统 | |
CN111860274B (zh) | 基于头部朝向与上半身骨架特征的交警指挥手势识别方法 | |
CN108875754B (zh) | 一种基于多深度特征融合网络的车辆再识别方法 | |
CN112084928B (zh) | 基于视觉注意力机制和ConvLSTM网络的道路交通事故检测方法 | |
CN110516633B (zh) | 一种基于深度学习的车道线检测方法及系统 | |
CN110298330B (zh) | 一种输电线路巡检机器人单目检测与定位方法 | |
CN113449632B (zh) | 一种基于融合感知的视觉与雷达感知算法优化方法、系统及汽车 | |
CN112287896A (zh) | 一种基于深度学习的无人机航拍图像目标检测方法及系统 | |
CN114627437B (zh) | 一种交通目标识别方法及系统 | |
CN104881661A (zh) | 基于结构相似度的车辆检测方法 | |
CN117152513A (zh) | 一种面向夜间场景的车辆边界定位方法 | |
CN111832410A (zh) | 一种基于视觉与激光雷达融合的前向列车检测方法 | |
CN114049541A (zh) | 基于结构化信息特征解耦与知识迁移的视觉场景识别方法 | |
CN115857040A (zh) | 一种机车车顶异物动态视觉检测装置及方法 | |
CN116168117A (zh) | 一种面向车险反欺诈的图像生成方法、系统、装置和介质 | |
CN117392629A (zh) | 基于相机与雷达融合的多模态描述符地点识别方法及系统 | |
CN113487878A (zh) | 一种机动车违章压线行驶检测方法及系统 | |
CN116597404B (zh) | 基于多源传感器融合的可持续道路异常检测方法与系统 | |
CN111652048A (zh) | 一种基于深度学习的1:n人脸比对方法 | |
WO2023071874A1 (zh) | 道路救援工作节点确定方法、装置及电子设备、存储介质 | |
CN116729042A (zh) | 一种改进的yolox-nano模型、以及基于此模型的汽车电控悬架控制方法 | |
CN114742975A (zh) | 一种车载图像铁轨曲线建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200825 |
|
RJ01 | Rejection of invention patent application after publication |