CN113516069A

CN113516069A - 基于尺寸鲁棒的道路标识实时检测方法及装置

Info

Publication number: CN113516069A
Application number: CN202110772543.5A
Authority: CN
Inventors: 刘炎; 贾若铖; 张孝博; 殷绪成; 杨春
Original assignee: Beijing Huachuang Smart Core Technology Co ltd
Current assignee: Beijing Huachuang Smart Core Technology Co ltd
Priority date: 2021-07-08
Filing date: 2021-07-08
Publication date: 2021-10-19

Abstract

本发明提供一种基于尺寸鲁棒的道路标识实时检测方法及装置，该方法，包括：获取道路标识图像并提取特征，得到图像金字塔特征；将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的预测结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于基于对道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别得到的。本发明通过对道路标识图像的特征提取，得到不同尺度的特征图构成图像金字塔特征，从而便于实现多尺度目标的检测；通过采用单阶段检测网络，检测与识别无需分步进行，有利于提高道路标志牌检测速度。

Description

基于尺寸鲁棒的道路标识实时检测方法及装置

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种基于尺寸鲁棒的道路标识实时检测方法及装置。

背景技术

随着科技的发展，传统的工业生产及人民的日常生活都在向无人化、智能化转型。无人驾驶技术或者辅助驾驶技术具有比人类更广阔的感知范围和灵敏的反应速度，可以为人们带来巨大的便捷和安全保障。识别车辆所处的交通场景和环境信息是车辆感知层的重要任务,主要通过摄像头、雷达、传感器对环境中的障碍物、路况、标示信息进行采集和分析，相当于代替驾驶员的眼睛以识别车辆所处交通场景和环境信息。由于交通标识含有丰富的信息，且其对车辆的行驶起到指示和限制作用，对在无人车技术实现智能化感知起到至关重要的作用。

目前，道路标志牌检测方法大多根据交通标识的显著特点人为地设计可区分的特征，再根据特征构建适合的分类器，比如支持向量机、神经网络等。

由于这种方法强烈依赖于相关人员的专业知识和技术水平，并且由于道路标志牌在尺度、光照、背景、方向等方面具有多样性，会导致大量的道路标志牌错检和漏检。此外，这种方法还需要使用滑动窗口或者图分割的方式选出道路标志牌可能存在的区域，这种方式计算量较大，导致运行时间较长。

发明内容

本发明提供一种基于尺寸鲁棒的道路标识实时检测方法及装置，用以解决现有技术中多尺度道路标识的实时检测误差较大的缺陷，提高道路标识检测的准确性，避免出现错检或漏检的情形。

本发明提供一种基于尺寸鲁棒的道路标识实时检测方法，包括：获取道路标识图像并提取特征，得到图像金字塔特征；将所述图像金字塔特征输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别结果；其中，所述道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；所述道路标识识别模型用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

根据本发明提供一种基于尺寸鲁棒的道路标识实时检测方法，所述道路标识识别模型，包括：空间金字塔池，基于输入的所述图像金字塔特征进行池化和填充，得到所述空间金字塔池输出的池化结果；其中，所述池化结果之间的尺度不同，所述池化结果内包含的各结果的大小尺寸一致；路径聚合层，将所述空间金字塔池输出的池化结果沿通道方向进行连接，得到所述路径聚合层输出的融合特征；标识识别层，基于所述融合特征进行目标检测和偏移，得到所述标识识别层输出的道路标识识别结果。

根据本发明提供的一种基于尺寸鲁棒的道路标识实时检测方法，所述基于所述融合特征进行目标检测和偏移，得到所述标识识别层输出的道路标识识别结果，包括：所述目标检测采用1×1的卷积核对所述融合特征进行卷积，得到目标检测结果；基于所述目标检测结果进行偏移，得到道路标识识别结果，所述道路标识识别结果表示为：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

其中，b_x,b_y表示为预测的目标框中心坐标，b_w表示为预测的目标框的宽度，b_h表示为预测的目标框的高度，t_x、t_y、t_w和t_h分别为网络的输出，c_x和c_y分别表示为单元格的左上角坐标，p_w和p_h表示为所述标识识别层最后输出特征图的尺寸。

根据本发明提供的一种基于尺寸鲁棒的道路标识实时检测方法，所述将所述图像金字塔特征输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别结果，包括：将所述图像金字塔特征输入至所述空间金字塔池，得到所述空间金字塔池输出的池化结果；将不同尺度的所述池化结果输入至所述路径聚合层，得到所述路径聚合层输出的融合特征；将所述融合特征输入至所述标识识别层，得到所述标识识别层输出的道路标识识别结果。

根据本发明提供的一种基于尺寸鲁棒的道路标识实时检测方法，所述获取道路标识图像并提取特征，得到图像金字塔特征，包括：获取道路标识图像；针对各所述道路标识图像，随机裁剪矩形区域，并以灰色背景填充；选取任意两个路标识图像按照预设不同比例压缩、相加，得到图像金字塔特征；其中，所述图像金字塔特征包含不同尺度的特征图以及对应所述特征图的标签，所述标签表示为所述矩形区域的置信度。

根据本发明提供的一种基于尺寸鲁棒的道路标识实时检测方法，在所述将所述图像金字塔特征输入至道路标识识别模型之前，方法还包括：基于交通标志实例图片构建训练集；从所述训练集中提取所述交通标志实例图片输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别训练结果；基于所述道路标识识别训练结果以及所述交通标志实例图片对应的图像标签计算损失函数，并基于所述损失函数收敛判断结束训练。

根据本发明提供的一种基于尺寸鲁棒的道路标识实时检测方法，在所述将所述图像金字塔特征输入至道路标识识别模型之前，方法：构建道路标识识别模型；动量参数设置为0.949，初始学习率设置为0.0001，权重衰减参数设置为5×10^-4，训练批量为16，基于优化策略训练6万轮，并分别在训练7.2万轮和8.1万轮后将学习率递减为原先的十分之一。

本发明还提供一种基于尺寸鲁棒的道路标识实时检测装置，包括：提取模块，获取道路标识并提取特征，得到图像金字塔特征；道路标识识别模块，基于输入的所述图像金字塔特征，得到所述道路标识识别模型输出的道路标识识别结果；其中，所述道路标识识别模块是基于交通标志实例图片及其对应的图像标签训练得到；所述道路标识识别模块用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于尺寸鲁棒的道路标识实时检测方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于尺寸鲁棒的道路标识实时检测方法的步骤。

本发明提供的基于尺寸鲁棒的道路标识实时检测方法及装置，通过对道路标识图像的特征提取，得到不同尺度的特征图构成图像金字塔特征，从而便于实现多尺度目标的检测；通过采用单阶段检测网络，检测与识别无需分步进行，有利于提高道路标志牌检测速度；另外，该道路标识识别模型可以对特征的进行反复提取，以较好的保存小目标的信息，使满足小型交通标志牌上的识别需求；且道路标识识别模型对硬件的要求低，只需使用1080Ti或2080TiGPU即可训练一个超级快速和准确的目标探测器。另外，仅需输入交通标识实例图片以及对应交通标识实例图片真实标注的真实边界框以及类别的图像标签进行训练，实现了端到端的训练，降低了训练复杂度和运行时间；通过融合特征与多尺度下采样以实现多尺度目标的检测。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于尺寸鲁棒的道路标识实时检测方法的流程示意图；

图2是本发明提供的道路标识识别模型的网络结构示意图；

图3是本发明提供的基于尺寸鲁棒的道路标识实时检测方法的框架示意图；

图4是本发明提供的基于尺寸鲁棒的道路标识实时检测方法与其他多方向道路标志牌检测方法对比的性能示意图；

图5是本发明提供的一种测试效果图；

图6是本发明提供的基于尺寸鲁棒的道路标识实时检测装置的结构示意图；

图7是本发明提供的电子设备的结构示意图；

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1示出了一种基于尺寸鲁棒的道路标识实时检测方法的流程示意图，该方法，包括：

S01，获取道路标识图像并提取特征，得到图像金字塔特征；

S02，将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

需要说明的是，本说明书中的S0N不代表基于尺寸鲁棒的道路标识实时检测方法的先后顺序，下面结合图2-图5具体描述本发明基于尺寸鲁棒的道路标识实时检测方法。

步骤S01，获取道路标识图像并提取特征，得到图像金字塔特征。

本实施例中，获取道路标识图像并提取特征，得到图像金字塔特征，包括：获取道路标识图像；针对各道路标识图像，随机裁剪矩形区域，并以灰色背景填充；选取任意两个路标识图像按照预设不同比例压缩、相加，得到图像金字塔特征；其中，图像金字塔特征包含不同尺度的特征图以及对应特征图的标签，标签表示为矩形区域的置信度。

需要说明的是，首先，在获取道路标识图像之后，需要先调整道路标识图像的大小，使其达到预期大小，比如输入2048×2048大小的道路标识图像，将其调整为608×608，从而便于后期进行特征提取。其次，针对608×608大小的道路标识图像，随机裁剪矩形区域，并以灰色背景填充。随后，将608×608大小的图像按照一定比例进行压缩，一定比例可以为8倍，16倍以及32倍下采样，以得到三种尺度的特征图，三种尺度分别为76×76、38×38、19×19，从而便于后续进行特征融合和目标检测识别。最后将压缩后的图像进行叠加，得到图像金字塔特征。

步骤S02，将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

在本实施例中，道路标识识别模型，包括：空间金字塔池，基于输入的图像金字塔特征进行池化和填充，得到空间金字塔池输出的池化结果；其中，池化结果之间的尺度不同，池化结果内包含的各结果的大小尺寸一致；路径聚合层，将空间金字塔池输出的池化结果沿通道方向进行连接，得到路径聚合层输出的融合特征；标识识别层，基于融合特征进行目标检测和偏移，得到标识识别层输出的道路标识识别结果。具体而言：

首先，基于空间金字塔池SPP进行池化和填充。本实施例中，通过SPP对输入的图像金字塔特征内的不同层进行不同尺度的池化，即针对不同尺度的特征图分别进行相应尺度的池化；再对池化后的特征图进行填充，使得池化输出特征层的大小尺寸保持一致，即使池化结果尺度一致，以便于后续将不同尺度的池化结果沿通道方向进行连接，便于后续检测目标。

其次，基于路径聚合层，将池化层输出的池化结果沿通道方向进行连接。本实施例中，路径聚合层可采用PANet，以缩短低层信息至高层需要经过的卷积层数，具体包括：从P₁到P₃，特征层每次做两倍下采样，N₁到N₃是池化结果自底而上特征融合后的结果，其中P₁和N₁完全相同。融合时，将高分辨率的N_i和低分辨率的P_i+1连接到一起得到N_i+1，如图2所示，连接方法说明如下：首先对上一层特征图N_i进行步长为2的3×3卷积完成下采样尺度对齐，然后将上一步得到的结果与特征图P_i+1做像素级别的相加，再对上一步结果进行3×3卷积，得到N_i+1层。

最后，标识识别层，基于所述融合特征进行目标检测和偏移，具体包括：

先采用1×1的卷积核对融合特征进行卷积，以实现目标检测，得到目标检测结果。

再基于目标检测结果进行偏移，得到道路标识识别结果。

在本实施例中，采用YOLOv4检测头，该检测头具有B×(5+C))个通道。其中B表示每个单元格预测的边界框的数量，B个边界框中的每一个都用于检测特定尺寸的对象。每个边界框都有5+C个属性，分别描述了边界框的中心坐标、尺寸、物体是否存在的得分和C个类别每一类的置信度。YOLOv4中会为每个单元格预测3个边界框。

另外，由于直接预测的边界框的宽度和高度会导致训练期间的梯度不稳定，不利于网络学习，因此需要对目标检测结果进行偏移，具体偏移过程表示为：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

其中，b_x,b_y表示为预测的目标框中心坐标，b_w表示为预测的目标框的宽度，b_h表示为预测的目标框的高度，t_x、t_y、t_w和t_h分别为网络的输出，c_x和c_y分别表示为单元格的左上角坐标，p_w和p_h表示为标识识别层最后输出特征图的尺寸。其中，道路标识识别结果包括道路标志牌的目标框坐标和道路标志牌类别与置信度。

应当注意，由于在一般情况下，YOLO网络不能预测边界框中心的绝对坐标，因此上述偏移过程通过Sigmoid函数来预测目标框中心坐标，以使输出值在0和1之间，从而预测相对于预测对象的网格单元格的左上角的偏移量。通过输出值的带下判断目标对象被包含在边界框中的概率，即目标分数，比如，对于红色和相邻矩形方框，其目标分数接近于1，对于角落的矩形方框，其目标分数接近于0。另外，对象得分表示为识别的目标对象为对应交通标识的概率，通过Sigmoid函数传递。类置信度表示被检测对象属于特定类(狗、猫、香蕉、汽车等)的概率。

在一个可选实施例中，将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果，包括：将图像金字塔特征输入至空间金字塔池，得到空间金字塔池输出的池化结果；将不同尺度的池化结果输入至路径聚合层，得到路径聚合层输出的融合特征；将融合特征输入至标识识别层，得到标识识别层输出的道路标识识别结果。

在一个可选实施例中，获取道路标识图像并提取特征，得到图像金字塔特征，包括：将图像金字塔特征输入至空间金字塔池，得到空间金字塔池输出的池化结果；将不同尺度的池化结果输入至路径聚合层，得到路径聚合层输出的融合特征；将融合特征输入至标识识别层，得到标识识别层输出的道路标识识别结果。

在一个可选实施例中，在将图像金字塔特征输入至道路标识识别模型之前，方法还包括：构建道路标识识别模型；动量参数设置为0.949，初始学习率设置为0.0001，权重衰减参数设置为5×10^-4，训练批量为16，利用darknet深度学习框架的Adam优化策略训练6万轮，并分别在7.2万轮和8.1万轮后将学习率递减为原先的十分之一。

在一个可选实施例中，在将图像金字塔特征输入至道路标识识别模型之前，方法还包括：

基于交通标志实例图片构建训练集；

从训练集中提取交通标志实例图片输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别训练结果；

基于道路标识识别训练结果以及交通标志实例图片对应的图像标签计算损失函数，并基于损失函数收敛判断结束训练。

本实施例中可采用YOLOV4网络模型作为道路标识识别模型，参考图3。

具体而言，首先，构建训练集。本实施例中，选用了TT100K(Tsinghua-Tencent100K)数据集，该数据集涵盖了约300个中国城市以及连接它们的道路网络。且其内原始全景图由6个单反相机拍摄，然后拼接在一起。从车辆和肩挂式设备上以大约10m的间隔捕获图像。TT100K从中国5个不同城市中选择了10个区域(包括每个城市的市区和郊区)，提供了100000张包含30000个交通标志实例的图片。这些图像涵盖了光照和天气条件的巨大变化。基准测试中的每个交通标志都用一个类标签、它的边框和像素掩码进行注释。

需要说明的是，在采用TT100K数据集分别训练和测试时，训练集和测试集的比例为3:1。由于在YOLOV4网络中，需要根据交并比选择真实框对应的矩形方框，即锚点框。具体地，按照与YOLOV4相同的策略，与每个真实框交并比最大的锚点框以及与真实框交并比大于0.5的锚点框为正样本，其余锚点框为负样本，并根据在线难例挖掘策略使得负样本与正样本锚点框的比例约为3:1，以避免负样本锚点框远远大于正样本锚点框的数量，其中正样本锚点框负责三个任务的学习，确保找到道路标志牌的大体位置和尺寸。

其次，从训练集中提取交通标志实例图片输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别训练结果。

在一个可选实施例中，基于采用的TT100K，将网络预测结果的类别数改为数量大于45张的交通标志牌类别数；将网络预测结果的类别名称改为45类交通标志的名称；将网络配置文件中处理批量的大小改为16，最大训练批次改为90000，学习率衰减为十分之一的批次分别改为72000和81000；将网络配置文件中YOLO检测头的通道数改为150，计算方式为(B×(5+C))，其中B表示每个单元格预测的边界框的数量，本实施例中设置为3；C为类别数，本实施例中设置为45。

最后，基于所述道路标识识别训练结果以及所述交通标志实例图片对应的图像标签计算损失函数，以判断是否结束训练。

loss损失函数表示为：

loss＝l_box+l_obj+l_cls

其中，l_box表示为道路标志牌边界框回归任务的损失函数；l_obj表示为道路标志牌类别任务损失函数；l_cls表示为检测框中道路标志牌前景背景类别置信度任务损失函数。

具体而言，l_box表示为：

其中，b表示为预测边界框的中心点，b^gt图像标签中对应的真实边界框的中心点，ρ代表的是计算两个中心点间的欧式距离，c代表的是能够同时包含预测边界框和真实边界框的最小闭包区域的对角线距离。

另外，IoU表示为交并比，表示为：

其中，A和B分别为目标的预测边界框与图像标签中对应的真实边界框。

α表示为权重系数，表示为：

v用来度量长宽比的相似性，表示为：

其中，w表示为表示预测边界框的宽，w^gt表示为真实边界框的宽，h表示预测边界框的搞，h^gt表示为真实边界框的高。

l_obj采用交叉熵损失函数表示，表示为：

其中，λ_obj和λ_noobj为前景背景平衡系数，S为网格宽高的等分数，B为每个网格预测候选边界框数目，c_i表示网络预测为前景或者背景的概率，

为0或1。

l_cls采用二值交叉熵损失函数，表示为：

其中，λ_class为类别损失平衡系数，S为网格宽高的等分数，B为每个网格预测候选框数目，c表示道路标志牌的类别，p_i为预测为该类别的概率。

需要说明的是，当loss损失函数收敛，训练结束。

在一个可选实施例中，训练结束之后，可以通过测试集内的交通标志实例图片及其对应的图像标签进行检验，以确保道路标识识别模型道路标识识别训练结果的有效性。需要说明的是，检验有效性可通过如下过程实现：

首先，计算查准率P，P表示检测出来的真实道路标志牌占检测出来的所有物体的比例，计算公式表示为：

其中，TP表示为实际为正样本的物体预测为正样本；FP表示为将实际为负样本的物体预测为正样本。

其次，计算查全率R，R表示检测出来的道路标志牌占所有标注道路标志牌的比例，计算公式表示为：

其中，FN表示为将实际为负样本的物体预测为负样本；TN表示为将实际为正样本的物体预测为负样本。

需要说明的是，P和R两个指标具有互逆的关系，采用Precision-Recall曲线可以更加直观地观察到各个方法的性能区别，其中Precision-Recall曲线下的面积越大表示性能越好，Speed为单张图片的推理时间，FPS为一秒钟可以推理的图片数量，GPU为训练测试时所使用的显卡，参考图4。

在一个可选实施例中，参考图5，表示为若干测试结果，由图5可知，方法可以检测多尺度道路标志牌，包括角度很大的道路标志牌。此外，本方法同样可以有效检测小尺寸道路标志牌。

综上所述，本发明实施例通过对道路标识图像的特征提取，得到不同尺度的特征图构成图像金字塔特征，从而便于实现多尺度目标的检测；通过采用单阶段检测网络，检测与识别无需分步进行，有利于提高道路标志牌检测速度；另外，该道路标识识别模型可以对特征的进行反复提取，以较好的保存小目标的信息，使满足小型交通标志牌上的识别需求；且道路标识识别模型对硬件的要求低，只需使用1080Ti或2080TiGPU即可训练一个超级快速和准确的目标探测器。另外，仅需输入交通标识实例图片以及对应交通标识实例图片真实标注的真实边界框以及类别的图像标签进行训练，实现了端到端的训练，降低了训练复杂度和运行时间；通过融合特征与多尺度下采样以实现多尺度目标的检测。

下面对本发明提供的基于尺寸鲁棒的道路标识实时检测装置进行描述，下文描述的基于尺寸鲁棒的道路标识实时检测装置与上文描述的基于尺寸鲁棒的路标识实时检测方法可相互对应参照。

图6示出了一种基于尺寸鲁棒的道路标识实时检测装置的结构示意图，该装置包括：

提取模块61，获取道路标识并提取特征，得到图像金字塔特征；

道路标识识别模块62，基于输入的图像金字塔特征，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模块62是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模块62用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

本实施例中，道路标识识别模块，包括：空间金字塔单元，基于输入的图像金字塔特征进行池化和填充，得到空间金字塔单元输出的池化结果；其中，池化结果之间的尺度不同，池化结果内包含的各结果的大小尺寸一致；路径聚合单元，将空间金字塔单元输出的池化结果沿通道方向进行连接，得到路径聚合层输出的融合特征；标识识别单元，基于融合特征进行目标检测和偏移，得到标识识别单元输出的道路标识识别结果。

具体而言，为了避免直接预测边界框的宽度和高度造成训练过程梯度不稳定的情况，标识识别单元需要对融合特征进行目标检测后的实测结果进行偏移。标识识别单元，包括：卷积子单元，基于融合特征采用1×1的卷积核进行卷积，得到实测结果；偏移子单元，基于所述实测结果进行偏移，得到道路标识识别结果。

图7示例了一种电子设备的实体结构示意图，如图7所示，该电子设备可以包括：处理器(processor)71、通信接口(Communications Interface)72、存储器(memory)73和通信总线74，其中，处理器71，通信接口72，存储器73通过通信总线74完成相互间的通信。处理器71可以调用存储器73中的逻辑指令，以执行基于尺寸鲁棒的道路标识实时检测方法，该方法包括：获取道路标识图像并提取特征，得到图像金字塔特征；将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于基于对道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别得到的。

此外，上述的存储器73中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的基于尺寸鲁棒的道路标识实时检测方法，该方法包括：获取道路标识图像并提取特征，得到图像金字塔特征；将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于基于对道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别得到的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的基于尺寸鲁棒的道路标识实时检测方法，该方法包括：获取道路标识图像并提取特征，得到图像金字塔特征；将图像金字塔特征输入至道路标识识别模型中，得到道路标识识别模型输出的道路标识识别结果；其中，道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；道路标识识别模型用于基于对道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别得到的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于尺寸鲁棒的道路标识实时检测方法，其特征在于，包括：

获取道路标识图像并提取特征，得到图像金字塔特征；

将所述图像金字塔特征输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别结果；

其中，所述道路标识识别模型是基于交通标志实例图片及其对应的图像标签训练得到；

所述道路标识识别模型用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

2.根据权利要求1所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，所述道路标识识别模型，包括：

空间金字塔池，基于输入的所述图像金字塔特征进行池化和填充，得到所述空间金字塔池输出的池化结果；其中，所述池化结果之间的尺度不同，所述池化结果内包含的各结果的大小尺寸一致；

路径聚合层，将所述空间金字塔池输出的池化结果沿通道方向进行连接，得到所述路径聚合层输出的融合特征；

标识识别层，基于所述融合特征进行目标检测和偏移，得到所述标识识别层输出的道路标识识别结果。

3.根据权利要求2所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，所述基于所述融合特征进行目标检测和偏移，得到所述标识识别层输出的道路标识识别结果，包括：

采用1×1的卷积核对所述融合特征进行卷积，以实现目标检测，得到目标检测结果；

基于所述目标检测结果进行偏移，得到道路标识识别结果，所述道路标识识别结果表示为：

b_x＝σ(t_x)+c_x

b_y＝σ(t_y)+c_y

4.根据权利要求2所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，所述将所述图像金字塔特征输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别结果，包括：

将所述图像金字塔特征输入至所述空间金字塔池，得到所述空间金字塔池输出的池化结果；

将不同尺度的所述池化结果输入至所述路径聚合层，得到所述路径聚合层输出的融合特征；

将所述融合特征输入至所述标识识别层，得到所述标识识别层输出的道路标识识别结果。

5.根据权利要求1所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，所述获取道路标识图像并提取特征，得到图像金字塔特征，包括：

获取道路标识图像；

针对各所述道路标识图像，随机裁剪矩形区域，并以灰色背景填充；

选取任意两个路标识图像按照预设不同比例压缩、相加，得到图像金字塔特征；其中，所述图像金字塔特征包含不同尺度的特征图以及对应所述特征图的标签，所述标签表示为所述矩形区域的置信度。

6.根据权利要求1所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，在所述将所述图像金字塔特征输入至道路标识识别模型之前，方法还包括：

基于交通标志实例图片构建训练集；

从所述训练集中提取所述交通标志实例图片输入至道路标识识别模型中，得到所述道路标识识别模型输出的道路标识识别训练结果；

基于所述道路标识识别训练结果以及所述交通标志实例图片对应的图像标签计算损失函数，并基于所述损失函数收敛判断结束训练。

7.根据权利要求1所述的基于尺寸鲁棒的道路标识实时检测方法，其特征在于，在所述将所述图像金字塔特征输入至道路标识识别模型之前，方法还包括：

构建道路标识识别模型；

动量参数设置为0.949，初始学习率设置为0.0001，权重衰减参数设置为5×10^-4，训练批量为16，基于优化策略训练6万轮，并分别在训练7.2万轮和8.1万轮后将学习率递减为原先的十分之一。

8.一种基于尺寸鲁棒的道路标识实时检测装置，其特征在于，包括：

提取模块，获取道路标识并提取特征，得到图像金字塔特征；

道路标识识别模块，基于输入的所述图像金字塔特征，得到所述道路标识识别模型输出的道路标识识别结果；

其中，所述道路标识识别模块是基于交通标志实例图片及其对应的图像标签训练得到；

所述道路标识识别模块用于对基于道路标识提取的图像金字塔特征进行特征融合，并对经特征融合后的结果进行识别。

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述基于尺寸鲁棒的道路标识实时检测方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于尺寸鲁棒的道路标识实时检测方法的步骤。