CN114283402A - 基于知识蒸馏训练与时空联合注意力的车牌检测方法 - Google Patents
基于知识蒸馏训练与时空联合注意力的车牌检测方法 Download PDFInfo
- Publication number
- CN114283402A CN114283402A CN202111418714.0A CN202111418714A CN114283402A CN 114283402 A CN114283402 A CN 114283402A CN 202111418714 A CN202111418714 A CN 202111418714A CN 114283402 A CN114283402 A CN 114283402A
- Authority
- CN
- China
- Prior art keywords
- network
- time
- license plate
- space
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 title claims abstract description 26
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 20
- 239000004576 sand Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 21
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供了一种基于知识蒸馏训练与时空联合注意力的车牌检测方法。首先,构建两个异构网络,并输入视频序列进行网络训练,其中,对学生网络进行知识蒸馏训练;然后,分别利用训练好的网络进行关键帧与非关键帧特征提取,并引入时序特征,与空间特征进行关联,获得时空关联特征,从而得到最终车牌检测结果。本发明针对运动场景,在检测任务中引入时空关联性,能够实现动态场景下的实时高效车牌检测。
Description
技术领域
本发明属计算机视觉、图形处理技术领域,具体涉及一种基于知识蒸馏训练与时空联合注意力的车牌检测方法。
背景技术
车牌是车辆的特殊身份标识,自动车牌检测是车辆交通统计分析的重要任务,也是车牌智能识别的前置任务。现有车牌检测方法通常针对静态或低速运动车辆,无法适应于交通违法跟踪、交通智能调度等复杂动态场景下的车牌检测任务。同时,受设备运算能力限制,高精度车牌检测算法无法满足实时性需求,轻量化车牌检测算法无法实现高精度检测,实时高效的动态场景车牌检测方法研究相对较少。现有车牌检测方法研究的流程大体如下:首先对车辆进行检测,在车辆检测的基础上对车牌进行检测。相关研究有:
Laroca等人在文献“R.Laroca,E.Severo,L.A.Zanlorensi,L.S.Oliveira,G.Gonc,alves,W.Schwartz,and D.Menotti,A robust real-time automatic licenseplate recognition based on the YOLO detector,In Proceedings of InternationalJoint Conference on Neural Networks,pp.1-10,2018.”中提出使用实时目标检测模型Fast-YOLO首先对车辆进行检测获得车辆图块,再在车辆图块上使用Fast-YOLO对车牌进行检测,获得车牌的矩形包围框。
Montazzolli与Jung在文献“S.Montazzolli and C.Jung,Real-time brazilianlicense plate detection and recognition using deep convolutional neuralnetworks,In Proceedings of SIBGRAPI Conference on Graphics,Patterns andImages,pp.55-62,2017.”中使用Fast-YOLO对汽车前视图进行处理,检测出车辆与车牌。
这些方法的问题在于:使用模型基本为YOLO及其变种,为追求检测的实时性损失一定检测精度;且检测过程分为多个阶段,造成模型复杂度提升,前置任务严重影响后置任务效果。同时,这些研究都仅针对图像数据,并不考虑动态场景下的时空关联性,与实际情况不符,实用性较差。
发明内容
为了克服现有技术对动态场景车牌检测的实时性与精度较差的不足,本发明提供一种基于知识蒸馏训练与时空联合注意力的车牌检测方法。首先,构建两个异构网络,并输入视频序列进行网络训练,其中,对学生网络进行知识蒸馏训练;然后,分别利用训练好的网络进行关键帧与非关键帧特征提取,并引入时序特征,与空间特征进行关联,获得时空关联特征,从而得到最终车牌检测结果。本发明针对运动场景,在检测任务中引入时空关联性,能够实现动态场景下的实时高效车牌检测。
一种基于知识蒸馏训练与时空联合注意力的车牌检测方法,其特征在于步骤如下:
步骤1:构建导师网络T与学生网络S,导师网络T采用ResNet-50作为骨干网络,学生网络S采用ResNet-18为骨干网络;
步骤2:输入视频序列X={x1,x2,...,xn},对所有视频帧xi进行归一化处理后分别输入导师网络T与学生网络S进行特征提取,导师网络获得特征Ft,学生网络获得特征Fs,i=1,2…,n,n表示视频帧总数;
步骤3:利用导师网络特征Ft进行车牌预测,计算类别预测损失与位置回归损失,通过最小化损失函数对导师网络参数进行更新,完成导师网络训练;
步骤4:固定训练好的导师网络,通过最小化学生网络特征Fs与导师网络特征Ft之间的距离更新学生网络参数,完成知识蒸馏训练;
步骤5:对输入视频序列进行关键帧与非关键帧划分,从起始视频帧开始每隔4帧选取一帧作为关键帧,其余为非关键帧;
步骤6:使用步骤3训练好的导师网络对关键帧图像进行特征提取,获得的特征记为记忆特征Fm;
步骤7:使用步骤4训练好的学生网络对非关键帧进行特征提取,获得特征Fs;
步骤8:构建Fs与Fm之间的时空关联注意力,包括为Fs与Fm添加时间维度,并沿时间维度对Fs与Fm进行拼接,获得拼接特征Fc,对拼接特征Fc的特征通道进行全局池化后再交换通道维度与时间维度,使用三维卷积对时空信息进行关联并使用Sigmoid函数激活,获得时空注意力图M,按下式计算得到加权特征Fw:
对加权特征Fw沿时间维度进行全局池化,获得同特征Fs维度相同的特征Fc′,将特征Fc′与Fs相加获得时空联合特征,使用卷积层从时空联合特征中回归出车牌在图像中的位置,完成车牌检测。
本发明的有益效果是:由于采用知识蒸馏训练提升轻量化学生网络的特征提取能力,并在动态场景下引入时序关联,建立时空联合注意力机制,使用关键帧特征辅助非关键帧的检测任务,一方面保持了算法运行的效率,另一方面提升了轻量化学生网络的检测精度,能够实现动态场景下的实时高效车牌检测,车牌识别率高。
附图说明
图1是本发明的基于知识蒸馏训练与时空联合注意力的车牌检测方法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
如图1所示,本发明提供了一种基于知识蒸馏训练与时空联合注意力的车牌检测方法,包括两大模块:知识蒸馏训练与时空联合注意力,具体实现过程如下:
1.知识蒸馏训练
步骤1:构建两个异构神经网络,网络规模大的神经网络称为导师网络T,网络规模小的神经网络称为学生网络S,导师网络T采用ResNet-50作为骨干网络,学生网络S采用ResNet-18为骨干网络。
步骤2:输入视频序列X={x1,x2,...,xn},对所有视频帧xi进行归一化处理后分别输入导师网络T与学生网络S进行特征提取,导师网络获得特征Ft,学生网络获得特征Fs,i=1,2…,n,n表示视频帧总数。
步骤3:利用导师网络特征Ft进行车牌预测,通过最小化损失函数对导师网络参数进行更新,完成导师网络训练。损失函数采用类别预测损失(交叉熵损失)与位置回归损失(GIoU损失)。
步骤4:固定训练好的导师网络,通过最小化学生网络特征Fs与导师网络特征Ft之间的距离(如L2距离)更新学生网络参数,完成知识蒸馏训练。
2.时空联合注意力
步骤5:对输入视频序列进行关键帧与非关键帧划分,从起始视频帧开始每隔4帧选取一帧作为关键帧,其余为非关键帧。
步骤6:使用步骤3训练好的导师网络对关键帧图像进行特征提取,获得的特征记为记忆特征Fm,用以辅助非关键帧的检测任务。
步骤7:使用步骤4训练好的学生网络对非关键帧进行特征提取,获得特征Fs。
步骤8:步骤8:构建Fs与Fm之间的时空关联注意力,包括为Fs与Fm添加时间维度,并沿时间维度对Fs与Fm进行拼接,获得拼接特征Fc,对拼接特征Fc的特征通道进行全局池化后再交换通道维度与时间维度,使用三维卷积对时空信息进行关联并使用Sigmoid函数激活,获得时空注意力图M,利用时空注意力图M加权拼接特征Fc:
其中,为矩阵的Hadamard积。得到加权特征Fw,而后对加权特征Fw沿时间维度进行全局池化,获得同Fs维度相同的特征Fc′,将Fc′与Fs相加获得时空联合特征。而后使用卷积层从时空联合特征中回归出车牌在图像中的位置,实现车牌检测。
本发明的效果可以通过以下仿真实验做进一步的说明。
1.仿真条件
在中央处理器为i7-6900K 3.4GHz CPU、内存64G、NVIDIA GTX1080TI GPU、Ubuntu 16.04操作系统上,运用Pytorch框架进行仿真。仿真中使用的数据为视频车牌检测数据集UFPR-ALPR,该数据集由Laroca等人在文献“R.Laroca,E.Severo,L.A.Zanlorensi,L.S.Oliveira,G.Gonc,alves,W.Schwartz,and D.Menotti,A robust real-timeautomatic license plate recognition based on the YOLO detector,In Proceedingsof International Joint Conference on Neural Networks,pp.1-10,2018.”中提出,包括150个视频,每个视频30帧,共4500张图像,其中训练集60个视频,验证集30个视频,测试集60个视频。
2.仿真内容
首先,使用训练集对导师网络与学生网络进行训练,使其具备目标检测能力,训练学生网络时引入本发明知识蒸馏训练的步骤,使用知识蒸馏方法对学生网络的车牌检测能力进行增强;然后,使用模型处理测试集视频序列,对测试集中出现的车牌进行定位,并计算定位平均精度,同时对算法实时性进行评估,统计图像处理速度与算法运行开销。
为了证明本发明的有效性,选择了常见目标检测方法YOLO-v3方法、RetinaNet方法、Faster-RCNN作为对比方法,YOLO-v3方法在文献“J.Redmon and A.Farhadi,Yolov3:Anincremental improvement,arXiv preprint,arXiv:abs/1804.02767,2018.”中有相应介绍;RetinaNet方法是文献“T.Lin,P.Goyal,R.Girshick,K.He,and P.Dollar,Focal lossfor dense object detection,In Proceedings of IEEE International Conference onComputer Vision,pp.2999-3007,2017.”提出的;Faster-RCNN方法是文献“S.Ren,K.He,R.Girshick,and J.Sun,Faster R-CNN:towards realtime object detection withregion proposal networks,In Proceedings of Advances in Neural InformationProcessing Systems,pp.91-99,2015.”提出的。目标检测精度如表1所示,算法运行效率如表2所示。
表1
表2
从表1可见,本发明方法的目标检测平均精度(94.98%)高于对比方法。本发明通过知识蒸馏训练能够提升非关键帧的检测精度与速度;同时,引入视频数据固有时序关联,通过时空联合注意力方法将关键帧获得的强表征信息传递给非关键帧,能够提升非关键帧的检测精度,进而提升方法总体目标检测精度。从表2可见,本发明方法的运行效率远高于对比方法,处理速度达到48.4FPS,GFLOPs为每秒10亿次的浮点运算数,本发明方法的浮点运算次数最少,为42.53GFLOPs,计算开销最小,运行效率最高,满足动态常见下实时车牌检测的需求。通过以上仿真实验可以验证本发明方法的有效性。
Claims (1)
1.一种基于知识蒸馏训练与时空联合注意力的车牌检测方法,其特征在于步骤如下:
步骤1:构建导师网络T与学生网络S,导师网络T采用ResNet-50作为骨干网络,学生网络S采用ResNet-18为骨干网络;
步骤2:输入视频序列X={x1,x2,...,xn},对所有视频帧xi进行归一化处理后分别输入导师网络T与学生网络S进行特征提取,导师网络获得特征Ft,学生网络获得特征Fs,i=1,2…,n,n表示视频帧总数;
步骤3:利用导师网络特征Ft进行车牌预测,计算类别预测损失与位置回归损失,通过最小化损失函数对导师网络参数进行更新,完成导师网络训练;
步骤4:固定训练好的导师网络,通过最小化学生网络特征Fs与导师网络特征Ft之间的距离更新学生网络参数,完成知识蒸馏训练;
步骤5:对输入视频序列进行关键帧与非关键帧划分,从起始视频帧开始每隔4帧选取一帧作为关键帧,其余为非关键帧;
步骤6:使用步骤3训练好的导师网络对关键帧图像进行特征提取,获得的特征记为记忆特征Fm;
步骤7:使用步骤4训练好的学生网络对非关键帧进行特征提取,获得特征Fs;
步骤8:构建Fs与Fm之间的时空关联注意力,包括为Fs与Fm添加时间维度,并沿时间维度对Fs与Fm进行拼接,获得拼接特征Fc,对拼接特征Fc的特征通道进行全局池化后再交换通道维度与时间维度,使用三维卷积对时空信息进行关联并使用Sigmoid函数激活,获得时空注意力图M,按下式计算得到加权特征Fw:
对加权特征Fw沿时间维度进行全局池化,获得同特征Fs维度相同的特征Fc′,将特征Fc′与Fs相加获得时空联合特征,使用卷积层从时空联合特征中回归出车牌在图像中的位置,完成车牌检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111418714.0A CN114283402B (zh) | 2021-11-24 | 2021-11-24 | 基于知识蒸馏训练与时空联合注意力的车牌检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111418714.0A CN114283402B (zh) | 2021-11-24 | 2021-11-24 | 基于知识蒸馏训练与时空联合注意力的车牌检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114283402A true CN114283402A (zh) | 2022-04-05 |
CN114283402B CN114283402B (zh) | 2024-03-05 |
Family
ID=80869950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111418714.0A Active CN114283402B (zh) | 2021-11-24 | 2021-11-24 | 基于知识蒸馏训练与时空联合注意力的车牌检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114283402B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722805A (zh) * | 2022-06-10 | 2022-07-08 | 苏州大学 | 基于大小导师知识蒸馏的少样本情感分类方法 |
CN115861997A (zh) * | 2023-02-27 | 2023-03-28 | 松立控股集团股份有限公司 | 一种关键前景特征引导知识蒸馏的车牌检测识别方法 |
CN116453105A (zh) * | 2023-06-20 | 2023-07-18 | 青岛国实科技集团有限公司 | 基于知识蒸馏深度神经网络的船牌号识别方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
US20180204111A1 (en) * | 2013-02-28 | 2018-07-19 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
US20180336465A1 (en) * | 2017-05-18 | 2018-11-22 | Samsung Electronics Co., Ltd. | Apparatus and method for student-teacher transfer learning network using knowledge bridge |
US10361802B1 (en) * | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
JP2020038343A (ja) * | 2018-08-30 | 2020-03-12 | 国立研究開発法人情報通信研究機構 | 言語識別モデルの訓練方法及び装置、並びにそのためのコンピュータプログラム |
US20200402497A1 (en) * | 2019-06-24 | 2020-12-24 | Replicant Solutions, Inc. | Systems and Methods for Speech Generation |
CN112766087A (zh) * | 2021-01-04 | 2021-05-07 | 武汉大学 | 一种基于知识蒸馏的光学遥感图像舰船检测方法 |
CN113065558A (zh) * | 2021-04-21 | 2021-07-02 | 浙江工业大学 | 一种结合注意力机制的轻量级小目标检测方法 |
-
2021
- 2021-11-24 CN CN202111418714.0A patent/CN114283402B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10361802B1 (en) * | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
US20180204111A1 (en) * | 2013-02-28 | 2018-07-19 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
US20180336465A1 (en) * | 2017-05-18 | 2018-11-22 | Samsung Electronics Co., Ltd. | Apparatus and method for student-teacher transfer learning network using knowledge bridge |
JP2020038343A (ja) * | 2018-08-30 | 2020-03-12 | 国立研究開発法人情報通信研究機構 | 言語識別モデルの訓練方法及び装置、並びにそのためのコンピュータプログラム |
US20200402497A1 (en) * | 2019-06-24 | 2020-12-24 | Replicant Solutions, Inc. | Systems and Methods for Speech Generation |
CN112766087A (zh) * | 2021-01-04 | 2021-05-07 | 武汉大学 | 一种基于知识蒸馏的光学遥感图像舰船检测方法 |
CN113065558A (zh) * | 2021-04-21 | 2021-07-02 | 浙江工业大学 | 一种结合注意力机制的轻量级小目标检测方法 |
Non-Patent Citations (1)
Title |
---|
童鸣;何楚;何博琨;王文伟;: "面向移动端的单阶段端到端目标检测压缩算法", 信号处理, no. 12, 25 December 2019 (2019-12-25) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722805A (zh) * | 2022-06-10 | 2022-07-08 | 苏州大学 | 基于大小导师知识蒸馏的少样本情感分类方法 |
CN115861997A (zh) * | 2023-02-27 | 2023-03-28 | 松立控股集团股份有限公司 | 一种关键前景特征引导知识蒸馏的车牌检测识别方法 |
CN116453105A (zh) * | 2023-06-20 | 2023-07-18 | 青岛国实科技集团有限公司 | 基于知识蒸馏深度神经网络的船牌号识别方法及系统 |
CN116453105B (zh) * | 2023-06-20 | 2023-08-18 | 青岛国实科技集团有限公司 | 基于知识蒸馏深度神经网络的船牌号识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114283402B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106446930B (zh) | 基于深层卷积神经网络的机器人工作场景识别方法 | |
CN114283402A (zh) | 基于知识蒸馏训练与时空联合注意力的车牌检测方法 | |
CN111709311B (zh) | 一种基于多尺度卷积特征融合的行人重识别方法 | |
CN104063712B (zh) | 一种车辆信息提取方法和系统 | |
CN104408405B (zh) | 人脸表示和相似度计算方法 | |
CN105787466B (zh) | 一种车辆类型的精细识别方法及系统 | |
CN105989369B (zh) | 基于度量学习的行人再识别方法 | |
CN105389562A (zh) | 一种时空约束的监控视频行人重识别结果的二次优化方法 | |
CN108520203A (zh) | 基于融合自适应多外围框与十字池化特征的多目标特征提取方法 | |
CN111507275B (zh) | 一种基于深度学习的视频数据时序信息提取方法及装置 | |
CN112507845B (zh) | 基于CenterNet与深度关联矩阵的行人多目标跟踪方法 | |
CN113762009B (zh) | 一种基于多尺度特征融合及双注意力机制的人群计数方法 | |
CN104778699B (zh) | 一种自适应对象特征的跟踪方法 | |
CN109934042A (zh) | 基于卷积神经网络的自适应视频对象行为轨迹分析方法 | |
CN110827312A (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN109472733A (zh) | 基于卷积神经网络的图像隐写分析方法 | |
CN111462173B (zh) | 基于孪生网络判别特征学习的视觉跟踪方法 | |
CN113963333B (zh) | 一种基于改进yolof模型的交通标志牌检测方法 | |
CN116052150A (zh) | 一种针对遮挡车牌的车脸识别方法 | |
CN110084834B (zh) | 一种基于快速张量奇异值分解特征降维的目标跟踪方法 | |
Zhou et al. | Seat belt detection using convolutional neural network bn-alexnet | |
CN113743251B (zh) | 一种基于弱监督场景的目标搜索方法及装置 | |
CN115311518A (zh) | 一种获取视觉属性信息的方法、装置、介质及电子设备 | |
CN112801020B (zh) | 基于背景灰度化的行人再识别方法及系统 | |
CN116863260A (zh) | 数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |