CN111274980A - 基于yolov3和非对称卷积的小尺寸交通标志识别方法 - Google Patents

基于yolov3和非对称卷积的小尺寸交通标志识别方法 Download PDF

Info

Publication number
CN111274980A
CN111274980A CN202010076303.7A CN202010076303A CN111274980A CN 111274980 A CN111274980 A CN 111274980A CN 202010076303 A CN202010076303 A CN 202010076303A CN 111274980 A CN111274980 A CN 111274980A
Authority
CN
China
Prior art keywords
convolution
module
asymmetric
network
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010076303.7A
Other languages
English (en)
Other versions
CN111274980B (zh
Inventor
吕卫
吴思翰
褚晶辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202010076303.7A priority Critical patent/CN111274980B/zh
Publication of CN111274980A publication Critical patent/CN111274980A/zh
Application granted granted Critical
Publication of CN111274980B publication Critical patent/CN111274980B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于YOLOV3和非对称卷积的小尺寸交通标志识别方法,包括下列步骤:准备包含不同种类交通标志的数据集并进行数据增强;搭建网络并训练:搭建加入了非对称卷积模块和空间池化金字塔模块的YOLOV3改进网络;将改进网络的参数保存为模型,该模型为未融合非对称卷积模块的模型;融合模型中的非对称卷积模块:读取未融合非对称卷积模块的模型中保存的参数,通过计算将模块中非对称卷积模块三个并行的3×3、3×1和1×3卷积核融合为一个3×3的卷积核;第四步,检测与识别交通标志。

Description

基于YOLOV3和非对称卷积的小尺寸交通标志识别方法
技术领域
本发明涉及智能驾驶技术领域,特别涉及交通标志检测与识别领域。
背景技术
随着经济的不断发展,汽车的出现大大增加了我们出行的便利性,但与此同时也带来了交通事故频发的问题。引起交通事故发生的主要原因有:违章驾驶、疲劳驾驶、道路建设不达标等。为了增加安全性,减少交通事故的发生,人们做了很多努力。早期的汽车安全倾向于车辆碰撞后对车内人员的保护,而现在的汽车更倾向于预防事故的发生,因此高级辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)逐渐发展起来,其中交通标志的检测与识别是ADAS中的一项十分重要的内容。交通标志传递了引导、限制、警示或者指示信息,在预示道路状况、减少交通事故方面起到了十分重要的作用。ADAS越早检测并识别出交通标志,就能越早做出相应的反应,从而减少事故的发生,因此实时且准确地识别交通标志成为了ADAS的重要目标之一。
为了解决交通标志检测与识别的问题,国内外学者对此进行了很多研究,现有的解决方案主要可分为三类:基于形状和颜色特征的传统交通标志检测与识别技术、基于机器学习方法的交通标志检测与识别技术和基于卷积神经网络的交通标志检测与识别技术。(CN201810034487.3)将交通标志的几何特征与视觉注意机制结合,进行交通标志检测,能够准确、高效地提取交通标志图像。(CN201810040243.6)根据交通标志的颜色特征,利用SVM分类器得到交通标志的真实感兴趣区域,再将真实感兴趣区域放入卷积神经网络中进行分类,该方法能对交通标志进行快速准确的识别和分类。(CN201910552184.5)采用了一种基于深度学习的实时交通标志检测方法,降低了对硬件设备的要求,并有效提升了实时性。
在现有方法中还存在以下问题:基于传统的方法和基于机器学习的方法鲁棒性较差,在实际中难以应用;基于深度学习方法鲁棒性较好,但其精度与速度难以平衡,精度高的方法复杂且计算量庞大,而计算速度快的方法精度低。在现有公开数据集GTSDB和GTSRB中,交通标志只分为四大类,显然不能满足实际智能驾驶中的需求;其次交通标志在每张图像中占比较大,对于检测高分辨率图像下小尺寸交通标志的问题来说,该数据集并不适用。
针对以上问题,本专利考虑采用精度与速度相对较高的目标检测网络YOLOV3进行改进,并使用以小尺寸交通标志为主的数据集TT100k,以提高对高分辨率图像下小尺寸交通标志的检测与识别精度。
发明内容
本发明提供一种高分辨率图像下小尺寸交通标志的检测与识别方法。本方法基于目标检测网络YOLOV3进行了改进,实现了高分辨率图像下对小尺寸交通标志的检测与识别功能,并且在网络中加入了非对称卷积模块使得网络在预测参数量不增加的情况下,提高了算法的检测与识别精度。技术方案如下:
一种基于YOLOV3和非对称卷积的小尺寸交通标志识别方法,包括下列步骤:
第一步,准备包含不同种类交通标志的数据集并进行数据增强;
第二步,搭建网络并训练
搭建加入了非对称卷积模块和空间池化金字塔模块的YOLOV3改进网络,其中,非对称卷积模块利用三个并行的分别为3×3、3×1和1×3卷积核替换原始YOLOV3网络中3×3的卷积核;空间池化金字塔模块使用三种不同的池化核对特征图分别池化,将得到的三个池化后的特征图与原始输入进行通道合并;
YOLOV3改进网络搭建完成后,对改进网络中的可训练参数进行初始化,将第一步经过数据增强后的数据集分批次输入到所搭建的改进网络中,根据改进网络预测值与训练集的真实标签值构建损失函数并计算损失,使用AdaBound优化算法进行反向传播更新改进网络的参数,直至损失不再减小,此时将改进网络的参数保存为模型,该模型为未融合非对称卷积模块的模型。
第三步,融合模型中的非对称卷积模块
读取未融合非对称卷积模块的模型中保存的参数,通过计算将模块中非对称卷积模块三个并行的3×3、3×1和1×3卷积核融合为一个3×3的卷积核,计算方式如下:
输入图像I通过三个并行的卷积及BN层之后相加的计算公式为
Figure BDA0002378579140000021
式中I表示输入图像,K表示3×3的卷积核,μ表示该3×3卷积核之后的BN层的平均值,σ表示标准差,γ表示缩放系数,β表示偏移量;
Figure BDA0002378579140000022
表示1×3的卷积核,
Figure BDA0002378579140000023
表示该卷积核之后的BN层的平均值,
Figure BDA0002378579140000024
表示标准差,
Figure BDA0002378579140000025
表示缩放系数,
Figure BDA0002378579140000026
表示偏移量,
Figure BDA0002378579140000027
表示3×1的卷积核,
Figure BDA0002378579140000028
表示该卷积核之后的BN层的平均值,
Figure BDA0002378579140000029
表示为标准差,
Figure BDA00023785791400000210
表示缩放系数,
Figure BDA00023785791400000211
表示偏移量,上式等价于:
Figure BDA00023785791400000212
即融合后的卷积核大小为
Figure BDA00023785791400000213
偏置值为
Figure BDA00023785791400000214
将所有的非对称卷积模块根据该公式融合之后,把所得的模型保存为最终模型;
第四步,检测与识别交通标志
加载最终模型,将摄像头拍摄的高分辨率的含有交通标志的图像输入最终模型中,进行交通标志的检测与识别。
与原始的YOLOV3网络相比,本发明的改进之处在于:
1、采用了空间池化金字塔模块,该模块中含有三个并行的池化层,在通道合并时该模块将不同尺度的特征图进行了融合,增强了YOLOV3对不同尺度目标的检测能力,但是该过程并不会增加网络的可训练参数。
2、在现有的网络中,训练过程和测试过程中网络的参数量是相同的,如果增加训练过程中网络的参数量,则网络的学习能力变得更强,训练的效果可能变得更好,这样训练得到的模型在测试时,参数量也会变大,测试过程也会相应变慢。而本专利采用了非对称卷积模块,在训练过程中增加了可训练参数,可提升模型的性能,而在测试时可以将非对称卷积模块融合,从而使测试的参数量不增加。
3、采用了AdaBound优化算法,该优化算法结合了Adam与SGD的优点,能够让损失函数快速准确地收敛。
附图说明
图1裁剪后数据集中的部分图像,左图和右图分别为两个剪裁后的图像
图2基于改进YOLOV3和非对称卷积的网络整体结构图
图3非对称卷积模块结构图
图4空间池化金字塔模块结构图
图5使用改进网络的识别结果,左图和右图分别为两个识别结果图
具体实施方式
为使本发明的技术方案更加清楚,下面结合附图对本发明做进一步阐述。
第一步,准备数据集并进行数据增强
(1)准备目标检测网络所需图像和标签数据。
采用TT100k(Tsinghua-Tencent 100K)公开数据集,使用其中的训练集和测试集进行操作,其中训练集共6103张图像,测试集共3067张图像,训练集和测试集的图像分辨率均为2048×2048。由于数据集中有些交通标志出现频次较少,网络在训练过程中难以学习到这些交通标志的特征,因此本专利使用在整个数据集中出现频次超过100次的交通标志,此类标志共45类。
该数据集的标签值为json格式,为了能够在本专利所用网络中使用该数据集,需要将数据集的标签数据转换成VOC格式。经过前期实验发现,若将2048×2048的图像直接送入网络进行训练,会导致训练过程中的参数量过多而无法进行训练,若将输入图像resize变小后送入网络进行训练会造成小尺寸的交通标志信息丢失,导致训练效果不佳。因此使用裁剪的方式对训练图像进行操作,根据交通标志所在位置对训练集中的图像进行裁剪,裁剪的尺寸为608×608,裁剪之后的标签数据也随之进行坐标变换。而对于测试图像则使用原测试集中2048×2048分辨率的图像。处理后训练集中的部分图像如图1所示。
(2)对训练集进行数据增强
对训练集中的图像进行平移变换、缩放变换和对比度变换,模拟图像在不同尺度、光照变化下的情况,以增强网络的泛化能力。平移变换之后图像的空白部分用训练集中的其他图像随机填充,缩放变换的范围是原始图像大小的(67%~150%),对比度变换则是对图像的色度、亮度和饱和度进行随机微调。
第二步,搭建网络并训练
(1)搭建改进网络
搭建加入了非对称卷积模块和空间池化金字塔模块的YOLOV3改进网络,其结构如图2(c)所示。图2(a)中的ABL模块由非对称卷积模块、BN和LeakyReLU构成,图2(b)中的res模块由1×1的卷积、BN、LeakyReLU和ABL模块构成,图中的“+”表示对两个特征图进行element-wise操作。非对称卷积模块利用了三个并行的3×3、3×1和1×3卷积核替换原始YOLOV3网络中3×3的卷积核,非对称卷积模块的结构如图3右图所示,在使用3×1的卷积核对输入特征图进行卷积时,要对输入特征图的高进行填充操作,填充的大小与使用3×3卷积核时设置的填充大小一致,保证输入特征图经过并行的三个卷积核处理后可以进行element-wise。同理使用1×3的卷积核时,要对输入特征图的宽进行填充操作。空间池化金字塔模块使用了三种不同大小的最大池化核对特征图分别进行池化,最大池化核的尺寸分别为5×5、9×9和13×13,对输入填充的大小padding为
padding=(kernel_size-1)/2
之后将池化得到的三个结果与原始输入进行通道合并。加入空间池化金字塔模块可以在不增加可训练参数的情况下加强网络对不同尺度目标的检测能力。空间池化金字塔模块的结构如图4所示,最终按照图2(c)的结构完成改进网络的搭建。
(2)初始化改进网络的可训练参数
使用YOLOV3网络在数据集ImageNet上进行训练,将训练好的网络参数保存为模型,称之为预训练模型。读取预训练模型中与改进网络中相同的网络层的参数,将这些参数加载到搭建好的改进网络中。改进网络中其余的参数采用默认的初始化方式。
(3)开始训练并保存模型
将第一步经过数据增强后的数据集分批次输入到搭建好的改进网络中,batch_size设为12,每迭代一次网络输出每个预测框的边框位置的4个值、边框位置的置信度以及45个类别的置信度,根据网络预测出的这些值与训练集的真实标签值构建损失函数并计算损失,使用AdaBound优化算法进行反向传播更新改进网络的参数,直至损失不再减小,此时将网络参数保存为模型,该模型为未融合非对称卷积模块的模型。
第三步,融合模型中的非对称卷积模块
读取未融合非对称卷积模块的模型中的参数,通过计算将模块中非对称卷积模块三个并行的3×3、3×1和1×3卷积核融合为一个3×3的卷积核,计算方式如下:
将输入图像表示为I,3×3的卷积核表示为K,将该卷积之后的BN层的平均值表示为μ,标准差表示为σ,缩放系数表示为γ,偏移量表示为β。1×3的卷积核表示为
Figure BDA0002378579140000041
将该卷积之后的BN层的平均值表示为
Figure BDA0002378579140000051
标准差表示为
Figure BDA0002378579140000052
缩放系数表示为
Figure BDA0002378579140000053
偏移量表示为
Figure BDA0002378579140000054
3×1的卷积核表示为
Figure BDA0002378579140000055
将该卷积之后的BN层的平均值表示为
Figure BDA0002378579140000056
标准差表示为
Figure BDA0002378579140000057
缩放系数表示为
Figure BDA0002378579140000058
偏移量表示为
Figure BDA0002378579140000059
在非对称卷积模块中,I通过三个不同的卷积及BN层之后相加的计算公式为
Figure BDA00023785791400000510
上式可化为
Figure BDA00023785791400000511
根据此式,即可将非对称卷积模块中三个卷积核合并为一个卷积核,合并后的卷积核大小为
Figure BDA00023785791400000512
Figure BDA00023785791400000513
偏置值为
Figure BDA00023785791400000514
将网络中的所有非对称卷积模块进行合并,最后将模型保存,称之为最终模型。在训练过程中使用非对称卷积模块,会增加网络中的可学习参数,使得学习性能提高。在训练结束后,将非对称卷积模块转换回一个卷积核进行测试,与最原始的网络相比,网络的参数量没有变化,但是性能有所提升。
第四步,检测与识别交通标志
加载最终模型,将测试集所有图像输入到该模型中进行测试。NMS阈值设为0.5,IoU阈值设为0.5,类别置信度阈值设为0.6时,最终模型的参数量约为62.81M,该网络在测试集上的mAP为87.9%,F1分数为89.7%,处理2048×2048分辨率的图像速度为4.62fps。测试的部分效果如图5所示。在实际场景中,即可将摄像头拍摄的高分辨率的含有交通标志的图像输入最终模型中进行交通标志的检测与识别。

Claims (1)

1.一种基于YOLOV3和非对称卷积的小尺寸交通标志识别方法,包括下列步骤:
第一步,准备包含不同种类交通标志的数据集并进行数据增强;
第二步,搭建网络并训练
搭建加入了非对称卷积模块和空间池化金字塔模块的YOLOV3改进网络,其中,非对称卷积模块利用三个并行的分别为3×3、3×1和1×3卷积核替换原始YOLOV3网络中3×3的卷积核;空间池化金字塔模块使用三种不同的池化核对特征图分别池化,将得到的三个池化后的特征图与原始输入进行通道合并;
YOLOV3改进网络搭建完成后,对改进网络中的可训练参数进行初始化,将第一步经过数据增强后的数据集分批次输入到所搭建的改进网络中,根据改进网络预测值与训练集的真实标签值构建损失函数并计算损失,使用AdaBound优化算法进行反向传播更新改进网络的参数,直至损失不再减小,此时将改进网络的参数保存为模型,该模型为未融合非对称卷积模块的模型。
第三步,融合模型中的非对称卷积模块
读取未融合非对称卷积模块的模型中保存的参数,通过计算将模块中非对称卷积模块三个并行的3×3、3×1和1×3卷积核融合为一个3×3的卷积核,计算方式如下:
输入图像I通过三个并行的卷积及BN层之后相加的计算公式为
Figure FDA0002378579130000011
式中I表示输入图像,K表示3×3的卷积核,μ表示该3×3卷积核之后的BN层的平均值,σ表示标准差,γ表示缩放系数,β表示偏移量;
Figure FDA0002378579130000019
表示1×3的卷积核,
Figure FDA00023785791300000110
表示该卷积核之后的BN层的平均值,
Figure FDA00023785791300000113
表示标准差,
Figure FDA0002378579130000016
表示缩放系数,
Figure FDA0002378579130000017
表示偏移量,
Figure FDA00023785791300000111
表示3×1的卷积核,
Figure FDA00023785791300000112
表示该卷积核之后的BN层的平均值,
Figure FDA00023785791300000114
表示为标准差,
Figure FDA0002378579130000015
表示缩放系数,
Figure FDA0002378579130000018
表示偏移量,上式等价于:
Figure FDA0002378579130000012
即融合后的卷积核大小为
Figure FDA0002378579130000013
偏置值为
Figure FDA0002378579130000014
将所有的非对称卷积模块根据该公式融合之后,把所得的模型保存为最终模型;
第四步,检测与识别交通标志
加载最终模型,将摄像头拍摄的高分辨率的含有交通标志的图像输入最终模型中,进行交通标志的检测与识别。
CN202010076303.7A 2020-01-23 2020-01-23 基于yolov3和非对称卷积的小尺寸交通标志识别方法 Active CN111274980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010076303.7A CN111274980B (zh) 2020-01-23 2020-01-23 基于yolov3和非对称卷积的小尺寸交通标志识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010076303.7A CN111274980B (zh) 2020-01-23 2020-01-23 基于yolov3和非对称卷积的小尺寸交通标志识别方法

Publications (2)

Publication Number Publication Date
CN111274980A true CN111274980A (zh) 2020-06-12
CN111274980B CN111274980B (zh) 2022-04-15

Family

ID=70996927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010076303.7A Active CN111274980B (zh) 2020-01-23 2020-01-23 基于yolov3和非对称卷积的小尺寸交通标志识别方法

Country Status (1)

Country Link
CN (1) CN111274980B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308019A (zh) * 2020-11-19 2021-02-02 中国人民解放军国防科技大学 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN112529005A (zh) * 2020-12-11 2021-03-19 西安电子科技大学 基于语义特征一致性监督金字塔网络的目标检测方法
CN112801169A (zh) * 2021-01-25 2021-05-14 中国人民解放军陆军工程大学 一种基于改进yolo算法的伪装目标检测方法
CN113468938A (zh) * 2020-07-31 2021-10-01 成都通甲优博科技有限责任公司 交通图像识别方法、装置、图像处理设备及可读存储介质
CN116486184A (zh) * 2023-06-25 2023-07-25 电子科技大学成都学院 一种乳腺病理图像识别分类方法、系统、设备及介质
CN116664873A (zh) * 2023-07-27 2023-08-29 腾讯科技(深圳)有限公司 图像信息处理方法、装置及存储介质
CN117019883A (zh) * 2023-08-25 2023-11-10 华北电力大学(保定) 一种基于深度学习的带材轧制过程板形预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850845A (zh) * 2015-05-30 2015-08-19 大连理工大学 一种基于非对称卷积神经网络的交通标志识别方法
CN107368787A (zh) * 2017-06-16 2017-11-21 长安大学 一种面向深度智驾应用的交通标志识别算法
CN109657584A (zh) * 2018-12-10 2019-04-19 长安大学 辅助驾驶的改进LeNet-5融合网络交通标志识别方法
CN109784149A (zh) * 2018-12-06 2019-05-21 北京飞搜科技有限公司 一种人体骨骼关键点的检测方法及系统
CN109858349A (zh) * 2018-12-25 2019-06-07 五邑大学 一种基于改进yolo模型的交通标志识别方法及其装置
CN109949297A (zh) * 2019-03-20 2019-06-28 天津工业大学 基于Reception和Faster R-CNN的肺结节检测方法
CN110647977A (zh) * 2019-08-26 2020-01-03 北京空间机电研究所 一种用于星上对舰船目标检测的Tiny-YOLO网络的优化方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850845A (zh) * 2015-05-30 2015-08-19 大连理工大学 一种基于非对称卷积神经网络的交通标志识别方法
CN107368787A (zh) * 2017-06-16 2017-11-21 长安大学 一种面向深度智驾应用的交通标志识别算法
CN109784149A (zh) * 2018-12-06 2019-05-21 北京飞搜科技有限公司 一种人体骨骼关键点的检测方法及系统
CN109657584A (zh) * 2018-12-10 2019-04-19 长安大学 辅助驾驶的改进LeNet-5融合网络交通标志识别方法
CN109858349A (zh) * 2018-12-25 2019-06-07 五邑大学 一种基于改进yolo模型的交通标志识别方法及其装置
CN109949297A (zh) * 2019-03-20 2019-06-28 天津工业大学 基于Reception和Faster R-CNN的肺结节检测方法
CN110647977A (zh) * 2019-08-26 2020-01-03 北京空间机电研究所 一种用于星上对舰船目标检测的Tiny-YOLO网络的优化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张博 等: "基于空间金字塔池化和深度卷积神经网络的作物害虫识别", 《农业工程学报》 *
李新征 等: "非对称卷积核YOLOV2网络的CT影像肺结节检测", 《中国生物医学工程学报》 *
贾军伟: "基于深度学习的细粒度图像识别算法研究及应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468938A (zh) * 2020-07-31 2021-10-01 成都通甲优博科技有限责任公司 交通图像识别方法、装置、图像处理设备及可读存储介质
CN112308019A (zh) * 2020-11-19 2021-02-02 中国人民解放军国防科技大学 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN112529005A (zh) * 2020-12-11 2021-03-19 西安电子科技大学 基于语义特征一致性监督金字塔网络的目标检测方法
CN112529005B (zh) * 2020-12-11 2022-12-06 西安电子科技大学 基于语义特征一致性监督金字塔网络的目标检测方法
CN112801169A (zh) * 2021-01-25 2021-05-14 中国人民解放军陆军工程大学 一种基于改进yolo算法的伪装目标检测方法
CN112801169B (zh) * 2021-01-25 2024-02-06 中国人民解放军陆军工程大学 一种基于改进yolo算法的伪装目标检测方法、系统、装置及存储介质
CN116486184A (zh) * 2023-06-25 2023-07-25 电子科技大学成都学院 一种乳腺病理图像识别分类方法、系统、设备及介质
CN116486184B (zh) * 2023-06-25 2023-08-18 电子科技大学成都学院 一种乳腺病理图像识别分类方法、系统、设备及介质
CN116664873A (zh) * 2023-07-27 2023-08-29 腾讯科技(深圳)有限公司 图像信息处理方法、装置及存储介质
CN116664873B (zh) * 2023-07-27 2024-04-26 腾讯科技(深圳)有限公司 图像信息处理方法、装置及存储介质
CN117019883A (zh) * 2023-08-25 2023-11-10 华北电力大学(保定) 一种基于深度学习的带材轧制过程板形预测方法
CN117019883B (zh) * 2023-08-25 2024-02-13 华北电力大学(保定) 一种基于深度学习的带材轧制过程板形预测方法

Also Published As

Publication number Publication date
CN111274980B (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN111274980B (zh) 基于yolov3和非对称卷积的小尺寸交通标志识别方法
CN111274976B (zh) 基于视觉与激光雷达多层次融合的车道检测方法及系统
CN110163187B (zh) 基于f-rcnn的远距离交通标志检测识别方法
CN107729801B (zh) 一种基于多任务深度卷积神经网络的车辆颜色识别系统
CN110517306B (zh) 一种基于深度学习的双目深度视觉估计的方法和系统
US20230076266A1 (en) Data processing system, object detection method, and apparatus thereof
CN111046781B (zh) 一种基于三元注意力机制的鲁棒三维目标检测方法
CN111461213B (zh) 一种目标检测模型的训练方法、目标快速检测方法
CN111582339A (zh) 一种基于深度学习的车辆检测与识别的方法
CN111882620A (zh) 一种基于多尺度信息道路可行驶区域分割方法
CN110852358A (zh) 一种基于深度学习的车辆类型判别方法
WO2024051296A1 (zh) 一种复杂天气下障碍物检测方法及装置
CN111222444A (zh) 一种考虑驾驶员情绪的增强现实抬头显示方法和系统
CN112949510A (zh) 基于Faster R-CNN热红外影像人物探测方法
CN117111055A (zh) 一种基于雷视融合的车辆状态感知方法
CN116935361A (zh) 一种基于深度学习的驾驶员分心行为检测方法
CN115273032A (zh) 交通标志识别方法、装置、设备及介质
CN114973199A (zh) 一种基于卷积神经网络的轨道交通列车障碍物检测方法
CN113052071B (zh) 危化品运输车驾驶员分心行为快速检测方法及系统
CN111797795A (zh) 一种基于YOLOv3与SSR的行人检测算法
CN111160282A (zh) 一种基于二值化Yolov3网络的红绿灯检测方法
CN108830248B (zh) 一种行人局部特征大数据混合提取方法
CN114898306B (zh) 一种检测目标朝向的方法、装置及电子设备
CN115909245A (zh) 一种基于深度学习的视觉多任务处理方法
Zhang et al. Infrastructure 3D Target detection based on multi-mode fusion for intelligent and connected vehicles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant