CN113033436B

CN113033436B - 障碍物识别模型训练方法及装置、电子设备、存储介质

Info

Publication number: CN113033436B
Application number: CN202110344770.8A
Authority: CN
Inventors: 刘浩
Original assignee: Jingdong Kunpeng Jiangsu Technology Co Ltd
Current assignee: Jingdong Kunpeng Jiangsu Technology Co Ltd
Priority date: 2021-03-29
Filing date: 2021-03-29
Publication date: 2024-04-16
Anticipated expiration: 2041-03-29
Also published as: CN113033436A

Abstract

本公开提供了一种障碍物识别模型训练方法及装置、电子设备、存储介质，涉及人工智能技术领域。该障碍物识别模型训练方法包括：获取新增样本道路图像，以及预训练的初始障碍物识别模型；初始障碍物识别模型包括用于检测第一类型障碍物的历史检测分支网络；确定新增样本道路图像对应的第二类型障碍物，并在初始障碍物识别模型中构建用于检测识别第二类型障碍物对应的目标检测分支网络；固定历史检测分支网络对应的网络权重信息，并根据新增样本道路图像对初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。本公开实施例的技术方案可以在训练增量障碍物识别模型过程中，避免重建整个障碍物识别模型和降低对旧类别障碍物的识别效率。

Description

障碍物识别模型训练方法及装置、电子设备、存储介质

技术领域

本公开涉及人工智能技术领域，具体而言，涉及一种障碍物识别模型训练方法、障碍物识别模型训练装置、增量障碍物识别模型、障碍物识别方法、电子设备以及计算机可读存储介质。

背景技术

随着自动驾驶领域研究的深入和人工智能技术的快速发展，自动驾驶成为研究的热点，且用于自动驾驶的目标检测算法也越来越多样化。

然而，在相关的目标检测算法中训练用于检测新类别障碍物的障碍物识别模型时，要么需要重新训练整个障碍物识别模型，要么需要训练障碍物识别模型中耗时较高且计算量较大的选择性搜索网络和分类网络，使得障碍物识别模型的训练过程较复杂，以及障碍物识别模型的迭代周期较长，且训练完成的障碍物识别模型对原始类别障碍物的识别效率较低。

因此，如何在训练用于检测新类别障碍物的障碍物识别模型的过程中，避免重新训练整个障碍物识别模型，以及避免对旧类别障碍物的识别效率较低的问题，成为自动检测算法的研究的方向。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开实施例的目的在于提供一种障碍物识别模型训练方法、障碍物识别模型训练装置、增量障碍物识别模型、障碍物识别方法、电子设备以及计算机可读存储介质，进而至少在一定程度上克服增量障碍物识别模型对旧类别障碍物识别效率较低，以及模型训练的周期较长的问题。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开实施例的第一方面，提供了一种障碍物识别模型训练方法，包括：获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中的第一类型障碍物；确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。

在本公开的一些示例实施例中，基于前述方案，所述初始障碍物识别模型包括动态检测分支网络结构，所述至少一个历史检测分支网络设置于所述动态检测分支网络结构中；所述确定所述新增样本道路图像对应的第二类型障碍物，并构建用于检测识别所述第二类型障碍物对应的目标检测分支网络包括：

在检测到所述新增样本道路图像中包含不同于所述第一类型障碍物的障碍物类型时，确定所述新增样本道路图像对应的第二类型障碍物；基于所述动态检测分支网络结构构建用于检测识别所述第二类型障碍物对应的目标检测分支网络。

在本公开的一些示例实施例中，基于前述方案，所述方法还包括：

获取原始样本道路图像，根据所述原始样本道路图像对包含所述历史检测分支网络的初始障碍物识别模型进行训练，得到训练完成的初始障碍物识别模型。

在本公开的一些示例实施例中，基于前述方案，所述初始障碍物识别模型包括通用特征提取网络以及障碍物区域提取网络；所述获取原始样本道路图像，根据所述原始样本道路图像对包含所述历史检测分支网络的初始障碍物识别模型进行训练，得到训练完成的初始障碍物识别模型，包括：

将所述原始样本道路图像输入到所述通用特征提取网络中生成所述原始样本道路图像对应的语义特征图；将所述语义特征图输入到所述障碍物区域提取网络中，提取得到所述原始样本道路图像中包含的各障碍物对应的障碍物区域图像；将所述障碍物区域图像输入到所述动态检测分支网络结构中，以使所述动态检测分支网络结构中的各所述历史检测分支网络识别并输出所述障碍物区域图像对应的障碍物类型。

在本公开的一些示例实施例中，基于前述方案，所述初始障碍物识别模型还包括障碍物区域特征映射网络；所述将所述语义特征图输入到所述障碍物区域提取网络中，提取得到所述原始样本道路图像中包含的各障碍物对应的障碍物区域图像，还包括：

将所述障碍物区域图像输入到障碍物区域特征映射网络中，输出目标特征向量，以通过所述目标特征向量表征所述原始样本道路图像对应的低层语义信息；将所述障碍物区域特征映射网络输出的所述目标特征向量输入到所述历史检测分支网络中，输出所述低层语义信息对应的高层语义信息以通过所述高层语义信息确定所述障碍物区域图像对应的障碍物类型。

在本公开的一些示例实施例中，基于前述方案，所述障碍物区域特征映射网络包括空间池化模块、共享权值编码模块、关注区域特征解码模块；所述将所述语义特征图输入到障碍物区域特征映射网络中，输出目标特征向量，包括：

将所述区域生成网络输出的所述障碍物区域图像输入到所述控件池化模块中，输出所述障碍物区域图像对应的标准特征向量；将所述标准特征向量输入到所述共享权值编码模块，输出目标特征向量；将所述共享权值编码模块输出的所述目标特征向量输入到所述关注区域特征解码模块中输出解码特征向量，并通过所述关注区域特征解码模块对所述解码特征向量进行迭代处理直到所述解码特征向量与所述标准特征向量相同以实现对所述区域生成网络和所述动态检测分支网络的解耦；其中，在所述关注区域特征解码模块检测到所述新增样本道路图像对应的第二类型障碍物时，将所述初始障碍物识别模型中的所述关注区域特征解码模块和所述历史检测分支网络设置为锁定状态。

根据本公开实施例的第二方面，提供了一种障碍物识别模型训练装置，包括：

获取模块，用于获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中第一类型障碍物；构建模块，用于确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；模型训练模块，用于固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的障碍物识别模型。

在本公开的一些示例实施例中，基于前述方案，所述构建模块还包括构建单元，所述构建单元，用于在检测到所述新增样本道路图像中包含不同于所述第一类型障碍物的障碍物类型时，确定所述新增样本道路图像对应的第二类型障碍物；基于所述动态检测分支网络结构构建用于检测识别所述第二类型障碍物对应的目标检测分支网络。

在本公开的一些示例实施例中，基于前述方案，所述获取模块还包括训练单元，所述训练单元，用于获取原始样本道路图像，根据所述原始样本道路图像对包含所述历史检测分支网络的初始障碍物识别模型进行训练，得到训练完成的初始障碍物识别模型。

在本公开的一些示例实施例中，基于前述方案，所述获取模块还包括识别单元，所述识别单元，用于将所述障碍物区域图像输入到障碍物区域特征映射网络中，输出目标特征向量，以通过所述目标特征向量表征所述原始样本道路图像对应的低层语义信息；将所述障碍物区域特征映射网络输出的所述目标特征向量输入到所述历史检测分支网络中，输出所述低层语义信息对应的高层语义信息以通过所述高层语义信息确定所述障碍物区域图像对应的障碍物类型。

在本公开的一些示例实施例中，基于前述方案，所述获取模块还包括迭代处理单元，所述迭代处理单元，用于将所述区域生成网络输出的所述障碍物区域图像输入到所述空间池化模块中，输出所述障碍物区域图像对应的标准特征向量；将所述标准特征向量输入到所述共享权值编码模块，输出目标特征向量；将所述共享权值编码模块输出的所述目标特征向量输入到所述关注区域特征解码模块中输出解码特征向量，并通过所述关注区域解码模块对所述解码特征向量进行迭代处理直到所述解码特征向量与所述标准特征向量相同以实现对所述区域生成网络和所述动态检测分支网络的解耦；其中，在所述关注区域特征解码模块检测到所述新增样本道路图像对应的第二类型障碍物时，将所述初始障碍物识别模型中的所述历史检测分支网络设置为锁定状态。

根据本公开实施例的第三方面，提供了一种增量障碍物识别模型，包括：通用特征提取网络，用于对输入的待检测道路图像进行第一特征提取，输出语义特征图；障碍物区域提取网络，用于对所述通用特征提取网络输出的语义特征图进行第二特征提取，输出障碍区域特征图像；障碍物区域特征映射网络，用于对所述障碍物区域提取网络输出的所述障碍区域特征图像进行第三特征提取，输出所述障碍区域特征图像对应的目标特征向量；动态检测分支网络，所述动态检测分支网络包括至少一个检测分支网络，用于在训练时，若检测到所述待检测道路图像中存在新类型障碍物，则构建用于检测所述新类型障碍物的目标检测分支网络，以及在检测所述障碍物区域图像时，通过所述至少一个检测分支网络和所述目标检测分支网络计算所述障碍物区域特征映射网络输出的目标特征向量对应的障碍区域图像的置信度；聚合网络，用于对所述动态检测分支网络输出的障碍区域图像的置信度进行聚合处理，以根据所述置信度确定所述障碍物区域图像对应的障碍物类型。

在本公开的一些示例实施例中，基于前述方案，所述障碍物识别模型还包括空间池化模块、共享权值编码模块、关注区域特征解码模块；所述空间池化模块，用于对输入的障碍区域图像进行池化处理，得到尺寸固定的标准特征向量；所述共享权值编码模块，用于对输入的所述标准特征向量进行特征提取，得到目标特征向量；所述关注区域特征解码模块，用于对输入的所述目标特征向量进行解码处理得到与所述标准特征向量相同的解码特征向量，以通过所述解码特征向量表征所述目标特征向量是低层语义信息。

根据本公开实施例的第四方面，提供了一种障碍物识别方法，包括：获取待检测道路图像，将所述待检测道路图像输入到增量障碍物识别模型中；所述增量障碍物识别模型包括通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络、聚合网络；通过所述通用特征提取网络获取所述待检测道路图像对应的语义特征图像，并将所述语义特征图像输入到所述障碍物区域提取网络确定所述语义特征图像对应的障碍物区域图像；将所述障碍物区域图像输入到所述障碍物区域特征映射网络中，并对所述障碍物区域图像进行特征提取得到目标特征向量；基于所述动态检测分支网络确定所述目标特征向量对应的障碍物区域图像的置信度，并通过所述聚合网络对所述目标特征向量对应的障碍物区域图像的置信度进行聚合处理，得到所述障碍物区域图像对应的障碍物类型实现对所述待检测道路图像的检测识别。

根据本公开实施例的第五方面，提供了一种电子设备，包括：处理器；以及存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现上述任意一项所述的障碍物识别模型训练方法或障碍物识别方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据上述任意一项所述的障碍物识别模型训练方法或障碍物识别方法方法。

本公开实施例提供的技术方案可以包括以下有益效果：

本公开的示例实施例中的障碍识别模型训练方法，获取新增样本道路图像，以及预训练的初始障碍物识别模型；其中，初始障碍物识别模型包括至少一个历史检测分支网络，历史检测分支网络用于检测识别新增样本道路图像中的第一类型障碍物；确定新增样本道路图像对应的第二类型障碍物，并构建用于检测识别第二类型障碍物对应的目标检测分支网络；固定历史检测分支网络对应的网络权重信息，并根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。一方面，可以通过初始障碍物识别模型中的历史检测分支网络检测识别新增样本道路图像中是否存在与第一类型障碍物不同的第二类型障碍物，在检测到新增样本道路图像中存在第二类型障碍物时，构建用于识别第二类型障碍物的目标检测分支网络，并在固定初始障碍物识别模型中历史检测分支网络的网络权重信息的基础上，根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练得到增量障碍物识别模型，避免了对整个障碍物识别模型重新进行训练，也减少了障碍物识别模型的迭代周期，进而提高了增量障碍物识别模型的训练效率；另一方面，通过固定初始障碍物识别模型中历史检测分支网络的网络权重信息，并根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练，避免了改变初始障碍物识别模型的各个神经网络的神经元权值，进而避免降低了对新增样本道路图像中第一类型障碍物的识别效率；再一方面，可以根据训练完成的增量障碍物识别模型中的历史检测分支网络和目标检测分支网络并行识别样本道路图像，提高了对样本道路图像的识别效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1示意性示出了根据本公开的一些实施例的一种障碍物识别模型训练方法流程的示意图；

图2示例性示出了根据本公开的一些实施例的一种识别原始样本道路图像的流程的示意图；

图3示例性示出了根据本公开的一些实施例的一种生成目标特征向量的流程的示意图；

图4示例性示出了根据本公开的一些实施例的一种初始障碍物识别模型对应的网络结构示意图；

图5示例性示出了根据本公开的一些实施例的一种障碍物识别流程的示意图；

图6示意性示出了根据本公开的一些实施例的一种障碍物识别模型训练装置的示意图；

图7示意性示出了根据本公开的一些实施例的一种增量障碍物识别模型的示意图；

图8示意性示出了根据本公开的一些实施例的电子设备的计算机系统的结构示意图；

图9示意性示出了根据本公开的一些实施例的计算机可读存储介质的示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

此外，附图仅为示意性图解，并非一定是按比例绘制。附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

在本示例实施例中，首先提供了一种障碍物识别模型训练方法，该障碍物识别模型训练方法可以应用于服务器，也可以应用于终端设备，例如电脑等电子设备。

下面以服务器执行该方法为例进行详细说明；图1示意性示出了根据本公开的一些实施例的一种障碍物识别模型训练方法流程的示意图。参考图1所示，该障碍物识别模型训练方法可以包括以下步骤：

步骤S110，获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中的第一类型障碍物；

步骤S120，确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；

步骤S130，固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。

根据本示例实施例中的一种障碍物识别模型训练方法，一方面，可以通过初始障碍物识别模型中的历史检测分支网络检测识别新增样本道路图像中是否存在与第一类型障碍物不同的第二类型障碍物，在检测到新增样本道路图像中存在第二类型障碍物时，构建用于识别第二类型障碍物的目标检测分支网络，并在固定初始障碍物识别模型中历史检测分支网络的网络权重信息的基础上，根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练得到增量障碍物识别模型，避免了对整个障碍物识别模型重新进行训练，也减少了障碍物识别模型的迭代周期，进而提高了增量障碍物识别模型的训练效率；另一方面，通过固定初始障碍物识别模型中历史检测分支网络的网络权重信息，并根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练，避免了改变初始障碍物识别模型的各个神经网络的神经元权值，进而避免降低了对新增样本道路图像中第一类型障碍物的识别效率；再一方面，可以根据训练完成的增量障碍物识别模型中的历史检测分支网络和目标检测分支网络并行识别样本道路图像，提高了对样本道路图像的识别效率。

下面，将对本示例实施例中的障碍物识别模型训练方法进行进一步的说明。

在步骤S110中，获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中的第一类型障碍物。

在本公开的一个示例实施例中，初始障碍物识别模型可以指用于识别新增样本道路图像中障碍物类别的模型，例如，初始障碍物识别模型可以是包含用于提取新增样本道路图像的纹理和颜色的卷积神经网络如VGG(Visual Geometry Group，计算机视觉组)的第四层卷积神经网络之前的卷积神经网络，初始障碍物识别模型也可以是包含提取新增样本道路图像中的障碍物的神经网络如RPN(Region Proposal Network，区域生成网络)，初始障碍物识别模型还可以是包含用于提取新增样本道路图像的其他特征的网络如用于实现区域生成网络的特征向量和新增样本道路图像的高层语义信息的映射的障碍物区域特征映射网络，当然，初始障碍物识别模型还可以是包含用于实现其他功能的网络，如用于实现区域神经网络和动态检测分支网络解耦的关注区域特征解码网络，本例实施例对此不作特殊限定。

第一类型障碍物可以指新增样本道路图像中通过初始障碍物识别模型可以识别的障碍物，例如，新增样本道路图像可以是包含卡车、公交车、小汽车和自行车的道路图像，初始障碍识别模型可以是可以识别新增样本道路图像的卡车、公交车、小汽车的障碍物识别模型，第一类型障碍物可以是新增样本道路图像的卡车、公交车、小汽车，当然，第一类型障碍物可以是新增样本道路图像中通过初始障碍物识别模型可以识别的其他障碍物，本例实施例对此不作特殊限定。

历史检测分支网络可以是用于检测新增样本道路图像中第一类型障碍物的检测分支网络，例如，历史检测分支网络可以是将障碍物区域特征映射网络输出的特征向量映射为具体的高层语义信息的检测分支网络，如将障碍物区域特征映射网络输出的特征向量映射为新增样本道路图像中第一类型障碍物的具体位置信息和障碍物的类型对应的概率或置信度，当然，历史检测分支网络还可以是将障碍物区域特征映射网络输出的特征向量映射为其他具体的高层语义信息的检测分支网络，本例实施例对此不作特殊限定。

优选的，可以获取预训练的初始障碍物识别模型，并将新增样本道路图像输入到初始障碍物识别模型中检测识别新增样本道路图像中的第一类型障碍物；当检测到新增样本道路图像中存在初始障碍物识别模型检测到新类型障碍物时，可以构建用于检测识别新类型障碍物的目标检测分支网络，进而根据新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练，得到增量障碍物识别模型，避免对整个初始障碍物识别模型进行重新训练，进而避免降低对新增样本道路图像中第一类型障碍物的识别效率。

在步骤S120中，确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络。

在本公开的一个示例实施例中，第二类型障碍物可以指新增样本道路图像中新类型障碍物，例如，新增样本道路图像可以是包含卡车、公交车、小汽车和自行车的道路图像，初始障碍识别模型可以是可以识别新增样本道路图像的卡车、公交车、小汽车的障碍物识别模型，第二类型障碍物可以是新增样本道路图像的自行车，当然，第二类型障碍物还可以指其他新增样本道路图像中新类型障碍物，本例实施例对此不作特殊限定。

目标检测分支网络可以指用于识别第二障碍物模型的类型对应的检测分支网络，例如，目标检测分支网络可以是将障碍物区域特征映射网络输出的特征向量映射为具体的高层语义信息的检测分支网络，如将障碍物区域特征映射网络输出的特征向量映射为新增样本道路图像中第二类型障碍物的具体位置信息和障碍物的类型对应的概率或置信度，当然，历史检测分支网络还可以是将障碍物区域特征映射网络输出的特征向量映射为其他具体的高层语义信息的检测分支网络，本例实施例对此不作特殊限定。

可选的，可以通过确定新增样本道路数据中第二类型障碍物，并基于初始障碍物识别模型中历史检测分支网络的结构构建用于检测识别第二类型障碍物的目标检测分支网络，并将目标检测分支网络添加到包含历史检测分支网络的初始障碍物识别模型中；进而，可以根据新增样本道路数据训练包含目标检测分支网络的初始障碍物识别模型以实现对样本道路图像中第二类型障碍物的检测识别。

在步骤S130中，固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。

在本公开的一个示例实施例中，网络权重信息可以指与历史检测分支网络对应的损失函数相关的权重信息，例如，历史检测分支网络中损失函数是softmax函数，网络权重信息可以softmax函数中分子、分母、求和符号对应的参数信息，当历史检测分支网络中损失函数是Smooth-L1函数，网络权重信息也可以是Smooth-L1函数中每个分段函数对应的参数信息，当然，网络权重信息还可以是其他与历史检测网络分支对应的损失函数相关的权重信息，本例实施例对此不作特殊限定。

增量障碍物识别模型可以指通过新增样本道路图像的第二类型障碍物图像对初始障碍物识别模型进行训练得到的障碍物识别模型，例如，增量障碍物识别模型可以是用于识别新增样本道理图像中第一类型障碍物和第二类型障碍物对应的障碍物识别模型，如增量障碍物识别模型可以是包含历史检测分支网络和目标检测分支网络的障碍物识别模型，如新增样本道路图像可以是包含卡车、公交车、小汽车和自行车的道路图像，初始障碍识别模型可以是可以识别新增样本道路图像的卡车、公交车、小汽车的障碍物识别模型，第二类型障碍物可以是新增样本道路图像的自行车，增量障碍物识别模型可以是根据历史检测分支网络检测识别卡车、公交车、小汽车，并根据目标检测分支网络检测识别自行车的障碍物识别模型，当然，增量障碍物识别模型还可以是用于识别其他新增样本道理图像中第一类型障碍物和第二类型障碍物对应的障碍物识别模型，本例实施例对此不作特殊限定。

优选的，可以基于二段式神经网络训练增量障碍物识别模型，在训练增量障碍物识别模型的过程中冻结识别旧类型障碍物对应的网络如不更新用于检测识别第一类型障碍物的网络权值信息，而对于检测识别新类型障碍物如第二类型障碍物时可以使用一个新的分支网络如目标检测分支网络，且目标检测分支网络具有独立的类别回归和预测框回归，最终再使用聚合模块对历史检测分支网络和目标检测分支网络输出的结果进行聚合以实现对新增样本道路图像中障碍物的检测识别，避免了对用于检测新增样本道路图像的所有神经网络进行重新训练，进而降低了障碍物识别模型的迭代周期，也避免了降低对新增样本道路图像中旧类别的障碍物的识别效率，从而提高了对新增样本道路图像中障碍物识别效率。

在本公开的一个示例实施例中，初始障碍物识别模型包括动态检测分支网络结构，且历史检测分支网络设置于动态检测分支网络结构中；在检测到新增样本道路图像中包含不同于第一类型障碍物的障碍物类型时，确定新增样本道路图像对应的第二类型障碍物，并基于动态检测分支网络结构构建用于检测识别第二类型障碍物对应的目标检测分支网络。

其中，动态检测分支网络结构可以指设置历史检测分支网络和目标检测分支网络的网络结构，例如，动态检测分支网络结构可以是将障碍物区域特征映射网络中共享权值编码模块输出的特征向量作为输入，并将输入的特征向量发送到历史检测分支网络或目标检测分支网络中以对输入特征向量对应的特征图进行分类和预测的网络结构，当然，动态检测分支网络结构还可以是其他用于对其他神经网络输出的特征图或特征向量进行分类和预测的网络结构，本例实施例对此不作特殊限定。

优选的，可以根据初始障碍物识别模型检测识别新增样本道路图像中的第一类型障碍物，当检测到新增样本道路图像中存在与第一类型障碍物不相同的第二类型障碍物时，可以基础动态检测分支网络结构构建用于识别第二类型障碍物的目标检测分支网络，并基于新增样本道路图像对包含目标检测分支网络的初始障碍物识别模型进行训练，得到增量障碍物识别模型，并不需要对初始障碍物识别模型中所有的神经网络进行重新训练，减少了障碍物识别模型的迭代周期。

在本公开的一个示例实施例中，可以通过获取原始样本道路图像，并根据原始样本道路图像对包含历史检测分支网络的初始障碍物识别模型进行训练，得到训练完成的初始障碍物识别模型。

其中，原始样本道路图像可以指包含第一类型障碍物的样本道路图像，例如，当第二类型障碍物可以是自行车，而第一类型障碍物是卡车、公交车、汽车，原始样本道路图像可以是包含卡车、公交车、汽车，但不包含自行车的样本道路图像，当然，原始样本道路图像还可以是包含其他第一类型障碍物的样本道路图像，本例实施例对此不作特殊限定。

优选的，可以通过获取原始样本道路图像，并确定原始样本道路图像中第一类型障碍物对应的类型标签；然后，将原始样本道路图像输入到包含用于检测识别第一类型障碍物对应的历史检测分支网络的初始障碍物识别模型中，进而将初始障碍物识别模型输出的预测标签与第一类型障碍物对应的真实类型标签进行比对，若初始障碍物识别模型输出的预测标签与第一类型障碍物对应的真实类型标签不相同，则可以计算初始障碍物识别模型的预测误差，并对预测误差进行反向传播，进而调节初始障碍物识别模型中各个神经网络对应的网络权重信息以提高初始障碍物识别模型的检测准确率，当检测到初始障碍物识别模型对应的检测准确率达到预设的阈值时，停止对包含历史检测分支网络的初始障碍物识别模型的训练，得到训练完成的初始障碍物识别模型。

图2示例性示出了根据本公开的一些实施例的一种识别原始样本道路图像的流程的示意图。参考图2所示，该识别原始样本道路图像的方法可以包括以下步骤：

步骤S210，将所述原始样本道路图像输入到所述通用特征提取网络中生成所述原始样本道路图像对应的语义特征图；

步骤S220，将所述语义特征图输入到所述障碍物区域提取网络中，提取得到所述原始样本道路图像中包含的各障碍物对应的障碍物区域图像；

步骤S230，将所述障碍物区域图像输入到所述动态检测分支网络结构中，以使所述动态检测分支网络结构中的各所述历史检测分支网络识别并输出所述障碍物区域图像对应的障碍物类型。

其中，通用特征提取网络可以指通过不同的卷积核对原始样本道路图像进行卷积以得到原始样本道路图像的多角度特征对应的网络，例如，通用特征提取网络可以是VGG中第一卷积层到第四层卷积层之间的卷积神经网络，通用特征提取网络也可以是Xception的middle flow之前的神经网络，当然，通用特征提取网络还可以是其他模型的中低层部分网络，本例实施例对此不作特殊限定。

语义特征图可以指通过通用特征提取网络对原始样本道路图像进行特征提取输出的特征图，例如，语义特征图可以是包含原始样本道理图像对应的纹理和样色的特征图，语义特征图也可以是包含原始样本道理图像对应的形状包络的特征图，当然，语义特征图还可以是通过通用特征提取网络提取的其他特征对应的特征图，本例实施例对此不作特殊限定。

障碍物区域提取网络可以指用于提取原始样本道路图像中障碍物区域的网络，例如，障碍物区域提取网络可以是包含用于提取原始样本道路图像中的前景框和背景框的RPN(Region Proposal Network，区域生成网络)网络，障碍物区域提取网络也可以是用于平衡正负样本数量差异而以二元焦距损失函数作为损失函数的网络，当然，障碍物区域提取网络还可以是包含其他用于提取原始样本道路图像中障碍物区域的网络，本例实施例对此不作特殊限定。

障碍物区域图像可以指对原始样本道路图像对应的语义特征图像进行特征提取得到的区域图像，例如，障碍物区域图像可以是原始样本道路图像的语义特征图像对应的背景图像，障碍物区域图像也可以是原始样本道路图像的语义特征图像对应的前景图像，当然，障碍物区域图像还可以是其他对原始样本道路图像对应的语义特征图像进行特征提取得到的区域图像如原始样本道路图像中正样本区域图像和负样本区域图像，本例实施例对此不作特殊限定。

优选的，可以获取原始样本道路图像，并将原始样本道路图像输入到通用特征提取网络中，得到包含原始样本道路图像对应的纹理、形状包络、颜色等的语义特征图；然后，将语义特征图输入到区域生成网络中，根据语义特征图预测原始样本道路图像中背景区域特征图和前景区域特征图，并确定预测的前景区域特征图在原始样本道路图像对应的候选框；进而，基于动态检测分支网络中的历史检测分支网络并行地对前景区域特征图中的障碍物进行检测识别，提高了对原始样本道路图像的检测效率。

在本公开的一个示例实施例中，初始障碍物识别模型还包括障碍物区域特征映射网络；可以通过将区域生成网络输出的障碍物区域图像输入到障碍物区域特征映射网络中，输出目标特征向量以通过目标特征向量表征原始道路样本图像对应的低层语义信息，并将障碍物区域特征映射网络输出的目标特征向量输入到历史检测分支网络中，输出低层语义信息对应的高层语义信息以通过高层语义信息确定障碍物区域图像对应的障碍物类型。

其中，障碍物区域特征映射网络可以指用于将障碍物区域图像映射为用于历史检测分支网络进行检测识别的特征向量的网络，例如，障碍物区域特征映射网络可以是包含SPP(Spatial Pyrimid Pooling，金字塔池化)模块、共享权值编码(Shared WeightEcoder)模块和关注区域特征解码(RoI Feature Decoder)模块的网络，当然，障碍物区域特征映射网络还可以是其他以障碍物区域图像作为输入并输出障碍物预期特征图像对应的特征向量的网络，本例实施例对此不作特殊限定。

目标特征向量可以指对障碍物区域图像进行特征提取得到的特征向量，例如，目标特征向量可以是通过SPP模块、共享权值编码模块、关注区域特征解码模块对障碍物区域图像进行多尺度特征提取、空间池化、多尺度拼接、权值编码、区域特征解码等操作得到的特征向量，当然，目标特征向量还可以是对障碍物区域图像进行其他特征提取得到的特征向量，本例实施例对此不作特殊限定。

低层语义信息可以指对原始样本道路图像在视觉层和对象层提取得到的语义信息，例如，原始样本道路图像可以是包含沙砾、蓝天、海水等，低层层语义信息可以是一块块的沙砾区域、蓝天区域、海水区域的视觉层区域特征图像，低层语义信息还可以是具体的沙砾区域特征图像、蓝天区域特征图像、海水区域特征图像的对象层区域特征图像，当然，低层语义信息还可以是其他原始样本道路图像对应的视觉层和对象层对应的区域特征图像的语义信息，本例实施例对此不作特殊限定。

高层语义信息可以指原始样本道路图像在概念层对应的语义信息，例如，高层语义信息可以是对原始样本道路图像对应的低层语义信息在概念层进行特征提取得到的语义信息，如原始样本道路图像可以是包含沙砾、蓝天、海水等，低层层语义信息可以是一块块的沙砾区域、蓝天区域、海水区域的视觉层区域特征图像，低层语义信息还可以是具体的沙砾区域特征图像、蓝天区域特征图像、海水区域特征图像的对象层区域特征图像，高层语义信息为沙滩，当然，高层语义信息还可以是对其他原始样本道路图像对应的低层语义信息在概念层进行特征提取得到的语义信息如置信度等，本例实施例对此不作特殊限定。

优选的，可以将障碍物区域提取网络输出的障碍物区域图像输入到障碍物区域特征映射网络中，通过障碍物区域特征映射网络中的SPP模块提取障碍物区域图像对应的多尺度信息得到多个特征图，并对各个特征图进行不同尺度的空间池化操作，并通过全连接操作得到一个固定尺寸的特征向量；然后，将固定尺寸的特征向量输入到共享权值编码模块，进一步提取障碍物区域图像的特征得到目标特征向量；接着，将目标特征向量输入到关注区域解码模块，对目标特征向量进行解码操作得到解码特征向量，并通过均方误差损失函数调节关注区域特征解码模块对应的网络权重信息以使关注区域特征解码模块输出的解码特征向量与SPP模块输出的固定尺寸的特征向量相同，从而实现障碍物区域提取网络和历史检测网络的解耦以避免在增量学习的过程中目标检测分支网络中神经元的权值受障碍物区域提取网络内具体的语义信息影响。最后，将共享权值编码模块输出的目标特征向量输入到历史检测分支网络中，通过历史检测分支网络实现对目标特征向量对应的障碍物区域图像中障碍物的识别。

图3示例性示出了根据本公开的一些实施例的一种生成目标特征向量的流程的示意图。参考图3所示，该生成目标特征向量的方法可以包括以下步骤：

在步骤S310中，将所述区域生成网络输出的所述障碍物区域图像输入到所述空间池化模块中，输出所述障碍物区域图像对应的标准特征向量；

在步骤S320中，将所述标准特征向量输入到所述共享权值编码模块，输出目标特征向量；

在步骤S330中，将所述共享权值编码模块输出的所述目标特征向量输入到所述关注区域特征解码模块中输出解码特征向量，并通过所述关注区域解码模块对所述解码特征向量进行迭代处理直到所述解码特征向量与所述标准特征向量相同以实现对所述区域生成网络和所述动态检测分支网络的解耦。

其中，空间池化模块可以指用于将障碍物区域图像转换为固定尺寸的特征向量的模块，例如，空间池化模块可以是通过不同尺度的池化窗口作用于障碍物特征图像得到多个维度不同的特征图像，并将多个维度不同的特征图像输入到全连接层将尺度不同的特征图像转化为维度相同的特征向量对应的模块，例如，卷积神经网络共有256个滤波器，可以将障碍物区域图像分别和1*1的池化窗口、2*2的池化窗口、4*4的池化窗口进行池化操作，可以得到1个256维的特征图、4个256维的特征图、16个256维的特征图，然后将这21个256维特征图连接起来并输入到全连接层，可以把大小不同的特征图像转换成相同维度的特征向量，当然，空间池化模块还可以是通过其他不同尺度的池化窗口作用于障碍物特征图像得到多个维度不同的特征图像，并将多个维度不同的特征图像输入到全连接层将尺度不同的特征图像转化为维度相同的特征向量对应的模块，本例实施例对此不作特殊限定。

标准特征向量可以指空间池化模块输出的特征向量，例如，标准特征向量可以是通过1*1的池化窗口、2*2的池化窗口、4*4的池化窗口进行池化操作，并将池化操作得到的不同尺寸的特征图输入到全连接层得到的21维的特征向量，当然，标准特征向量还可以是通过其他尺度不同的池化窗口进行池化操作，并将池化操作得到的不同尺寸的特征图输入到全连接层得到的固定尺寸的特征向量，本例实施例对此不作特殊限定。

共享权值编码模块可以指通过不同大小的卷积核对空间池化模块输出的标准特征向量进行特征提取的模块，例如，共享权值编码模块可以是通过3*3的卷积核扫描标准特征向量对应的特征图并进行特征提取的模块，共享权值编码模块也可以是通过5*5的卷积核扫描标准特征向量对应的特征图并进行特征提取的模块，当然，共享权值编码模块还可以是通过其他尺寸的卷积核如7*7的卷积核扫描标准特征向量对应的特征图并进行特征提取的模块，本例实施例对此不作特殊限定。目标特征向量可以指共享权值编码器输出的特征向量。

关注区域解码模块可以指对目标特征向量进行解码操作的模块，例如，关注区域解码模块可以是用于将共享权值编码模块输出的目标特征向量进行解码，并将解码得到的解码向量优化为与空间池化模块输出的标准特征向量相同的模块，其中，关注区域解码模块的损失函数可以是均值误差损失函数。

可以将障碍物区域提取网络输出的障碍物区域图像输入到障碍物区域特征映射网络中，通过障碍物区域特征映射网络中的SPP模块对障碍物区域图像进行池化操作、全连接操作得到固定尺寸大小的标准特征向量，并将SPP模块输出的标准特征向量输入到障碍物区域特征映射网络中的共享权值编码模块对标准特征向量对应的特征图进行特征提取得到目标特征向量；此外，通过将目标特征向量输入到障碍物区域特征映射网络中的关注区域特征解码模块中，以通过关注区域特征解码模块实现对障碍物区域提取网络和动态检测分支网络的解耦；其中，在关注区域特征解码模块检测到新增样本道路图像中存在与第一类型障碍物不相同的第二类型障碍物时，将初始障碍物识别模型中的关注区域特征解码模块设置为锁定状态。

优选的，可以将障碍物区域提取网络输出的多个尺寸的障碍物区域图像输入到障碍物区域特征映射网络中，通过SPP模块将任意尺度的障碍物区域图像转化成相同的维度，即通过SPP模块障碍物区域特征映射网络可以处理任意尺度的障碍物区域图像，避免了对障碍物区域图像进行裁剪或伸缩操作而导致障碍物区域图像的低层语义信息丢失。进而，将SPP模块输出的标准特征向量输入到障碍区域特征映射网络对应的共享权值编码模块对标准特征向量对应的特征图进行特征提取得到目标特征向量，在通过共享权值编码模块遍历标准特征向量对应的特征图过程中避免了对障碍物区域特征图进行全局连接，进而减少了障碍物区域特征映射网络对应的参数数量，加快了障碍物区域特征映射网络的学习速率，也在一定程度上降低了过拟合的可能性。此外，将共享权值编码模块输出的目标特征向量输入到关注区域特征解码模块，可以得到目标特征向量对应的解码特征向量，并通过关注区域特征解码器将解码特征向量进行迭代处理得到与标准特征向量相同的解码特征向量时，停止对障碍物区域特征映射网络的训练，得到训练完成的障碍物区域特征映射网络；在进行增量障碍物识别模型训练时，将关注区域解码模块设置为锁定状态以避免降低对第一类型障碍物的识别效率。

图4示例性示出了根据本公开的一些实施例的一种初始障碍物识别模型对应的网络结构示意图。参考图4所示，初始障碍物识别模型对应的网络结构400主要包括通用特征提取网络410、障碍物区域提取网络420、障碍物区域特征映射网络430、动态检测分支网络440、聚合网络450。

其中，通用特征提取网络410主要用于对输入初始障碍物识别模型中的原始样本道路图像进行特征提取得到包含原始样本道路图像的纹理、轮廓、形状、色彩的语义特征图像；障碍物区域提取网络420主要用于对通用特征提取网络输出的语义特征图像进行特征提取得到包含原始样本道路图像对应的背景特征图像和前景特征图像的障碍物区域图像；障碍物区域特征映射网络430主要用于对障碍物区域提取网络输出的障碍物区域图像进行特征提取得到包含障碍物区域图像在视觉层和对象层低层对应的低层语义信息的目标特征向量。

此外，障碍物区域特征映射网络还包括空间池化模块431、共享权值编码模块432、关注区域特征解码模块433；空间池化模块431主要用于对障碍物区域提取网络输出的障碍物区域特征图进行多尺度的池化操作和全连接操作以得到固定尺寸大小的标准特征向量；共享权值编码模块432主要用于通过相同的卷积核对空间池化模块输出的标准特征向量对应的特征图进行特征提取，以避免对障碍物区域特征图进行全局连接，进而减少障碍物区域特征映射网络对应的参数数量，进而加快障碍物区域特征映射网络的学习速率，也在一定程度上降低了过拟合的可能性；关注区域特征解码模块433主要用于将共享权值编码模块输出的目标特征向量对应的特征图逆转为与空间池化模块输出的标准特征向量以实现对障碍区域特征提取网络和动态检测分支网络的解耦。动态检测分支网络440主要用于将障碍物区域特征映射网络中共享权值编码模块输出的目标特征向量映射为具体的高层语义信息以实现对障碍物区域图像的分类。聚合网络450主要用于将动态检测分支网络中各历史检测分支网络和目标检测分支网络的输出进行汇总，通过非极大值抑制算法和障碍物区域的置信度进行障碍物区域的筛选，并输出障碍物区域图像的检测结果。

举例而言，可以使用两种类型的数据进行训练，即使用原始样本道路图像对应的数据进行预训练，使用新增样本道路图像进行增量学习的训练。同时，选定通用特征提取网络加载预训练模型，如可以将VGG对应的第四层之前的卷积神经网络作为通用特征提取网络，并加载VGG的ImageNet(可视化数据库)预训练模型，并初始化通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支结构中的历史检测分支网络、聚合网络；其中，可以通过二元焦距损失函数(binary focal loss)作为障碍物区域提取网络的损失函数，即障碍物区域提取网络的损失函数如公式(1)所示：

L＝-α_t(1-p_t)^γlog(p_t) (1)

其中，L为障碍物区域提取网络的损失函数，α_t为样本的比例参数，α正样本的本例参数；当样本的预测类别与真实类别相同时，α_t＝α，当样本的预测类别与真实类别不相同时，α_t＝1-α；p_t为将障碍物区域提取网络对样本预测正确的概率，γ为样本贡献度调节因子，y为样本真实类别。

优选的，在障碍物区域提取网络训练的前期，可以将α和γ对应的参数分别设置为0.5和1，即α＝0.5，γ＝1；随着样本的增加，可以将α和γ对应的参数分别设置为0.25和2，即α＝0.25，γ＝2。可以通过将多个原始样本道路图像输入到通用特征网络中提取得到包含原始样本道路图像对应的纹理、轮廓、形状、颜色等语义特征图像，并将通用特征提取网络输出的语义特征图像输入到障碍物区域提取网络中提取得到语义特征图像对应的包含前景区域特征图和背景区域特征图的障碍物区域特征图，进而不断调整优化障碍物区域提取网络的损失函数对应的参数，以使障碍物区域提取网络可以很容易的区分障碍物区域特征图中的正样本和负样本以及正确的提取出前景特征区域特征图对应的预测框。

在得到训练完成的障碍物区域提取网络之后，可以将障碍物区域提取网络输出的障碍物区域图像输入到已经初始化后的障碍物区域特征映射网络中，通过障碍物区域特征映射网络中的空间池化模块可以得到固定尺寸的标准特征向量，进而将空间池化模块输出的标准特征向量输入到共享权值编码模块可以得到对标准特征向量对应的特征图进行特征提取后的目标特征向量，再将共享权值编码模块输出的目标特征向量输入到关注区域特征解码模块，当关注区域特征解码器输出的解码特征向量与空间池化模块输出的标准特征向量时，停止对关注区域特征解码模块的训练，即可以得到训练完成的障碍物区域特征映射网络；其中，关注区域特征解码的损失函数可以如公式(3)所示：

其中，F_i ^D为关注区域特征解码器的输出，F_i ^S为SPP模块的输出，n是SPP模块的输出的标准特征向量的维度。

接着，在动态检测分支结构中添加检测分支网络，同时可以将障碍物区域映射网络中共享权值编码模块输出的目标特征向量以及障碍物区域提取网络输出的障碍物区域图像并行输入到动态检测分支网络中的检测分支网络中对检测分支网络进行训练；其中，检测分支网络可以使用Softmax或Smooth-L1作为损失函数，当检测分支网络对原始道路图像中的障碍物区域图像中障碍物的识别准确率达到预设阈值时，停止对动态检测分支结构中检测分支网络的训练，得到训练完成的动态检测分支网络。

最后，将由原始样本道路图像训练得到的初始障碍物识别模型中的通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络直接用于增量学习任务中，并将动态检测分支网络中的历史检测分支网络设定为锁定状态以避免在训练增量障碍物识别模型时，降低了对初始障碍物识别模型可以识别的障碍物类型的识别效率。其中，在根据新增样本道路图像训练增量障碍物识别模型时，具体的训练过程和初始障碍物识别模型的训练过程大致相同，只是在增量训练时不但需要锁定通用特征提取网络中的全部参数不进行误差反传，而且需要将障碍物区域特征映射网络中的关注区域特征解码模块，以及在动态检测分支网络结构中将历史检测分支网络设置为锁定状态，并在动态检测分支网络结构中添加用于检测新类型障碍物的目标检测分支网络，以及根据新增样本道路图像对包含目标检测分支网络的初始障碍物模型进行训练。

图5示例性示出了根据本公开的一些实施例的一种障碍物识别流程的示意图。参考图5所示，该障碍物识别包括以下步骤：

在步骤S510中，获取待检测道路图像和预训练的增量障碍物识别模型，将所述待检测道路图像输入到所述增量障碍物识别模型中；所述增量障碍物识别模型包括通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络、聚合网络；

在步骤S520中，通过所述通用特征提取网络获取所述待检测道路图像对应的语义特征图像，并将所述语义特征图像输入到所述障碍物区域提取网络确定所述语义特征图像对应的障碍物区域图像；

在步骤S530中，将所述障碍物区域图像输入到所述障碍物区域特征映射网络中，并对所述障碍物区域图像进行特征提取得到目标特征向量；

在步骤S540中，基于所述动态检测分支网络确定所述目标特征向量对应的障碍物区域图像的置信度，并通过所述聚合网络对所述目标特征向量对应的障碍物区域图像的置信度进行聚合处理，得到所述障碍物区域图像对应的障碍物类型实现对所述待检测道路图像的检测识别。

其中，检测分支网络中包含历史检测分支网络以及新增的目标检测分支网络；将待检测道路图像输入到增量障碍物识别模型中，可以通过历史检测分支网络和目标检测分支网络并行计算待检测道路图像中障碍物区域图像对应的障碍物类型的置信度。

优选的，可以获取待检测道路图像以及预训练的增量障碍物识别模型，并将待检测道路图像输入到增量障碍物识别模型中，通过增量障碍物识别模型中的通用特征提取网络可以提取得到包含待检测道路图像的纹理、颜色、轮廓、形状的语义特征图像，并将通用特征提取网络输出的语义特征图像输入到障碍物区域提取网络得到语义特征图对应的包含前景特征图像预测框的障碍物区域图像；然后，将障碍物区域图像输入到障碍物区域特征映射网络中对障碍物区域图像进一步进行特征提取，如将障碍物区域图像输入到障碍物区域特征映射网络中的控件池化模块得到障碍物区域图像对应的固定尺寸的标准特征向量，并将标准特征向量输入到共享权值编码模块，通过共享权值编码模块对标准特征向量对应的特征图像进一步进行特征提取得到目标特征向量；进而，将共享权值编码模块输出的目标特征向量和障碍物区域提取网络输出的障碍物区域图像输入到包含检测分支网络的动态检测分支网络结构中，通过历史检测分支网络和目标检测分支网络并行计算输入的障碍物区域图像和目标特征向量对应的障碍物类型的置信度。从而，通过聚合网络对历史检测分支网络和目标检测分支网络输出的障碍物类型的置信度进行聚合处理，得到障碍物区域图像中障碍物的类型以实现对待检测道路图像的检测识别。

举例而言，获取待检测道路图像以及预训练的增量障碍物识别模型，并将待检测道路图像输入到增量障碍物识别模型中，通过增量障碍物识别模型中的通用特征提取网络可以提取得到包含待检测道路图像的纹理、颜色、轮廓、形状的语义特征图像，并将通用特征提取网络输出的语义特征图像输入到障碍物区域提取网络得到语义特征图对应的包含前景特征图像预测框的障碍物区域图像，计算障碍物区域图像对应的预测框与障碍物真实框之间的重叠度和置信度，并根据非极大值抑制算法，选中重叠度最大的预测框，并计算重叠度最大的预测框与其他预测框之间的重叠度，将重叠度仅次于最大的预测框的重叠度的预测框进行删除，同时计算剩余预测框之间的重叠度，重复删除重叠度较大的预测框，最终只得到一个置信度较大的预测框，并将该预测框输入到动态检测分支网络中对预测框中的障碍物进行识别，得到与预测框对应的障碍物区域图像的障碍物类别。

需要说明的是，尽管在附图中以特定顺序描述了本公开中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

其次，在本示例实施例中，还提供了一种障碍物识别模型训练装置。参照图6所示，该障碍物识别模型训练装置600包括：获取模块610、构建模块620、模型训练模块630。其中：获取模块610用于获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中第一类型障碍物；构建模块620用于确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；模型训练模块630用于固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。

上述中障碍物识别模型训练装置各模块的具体细节已经在对应的障碍物识别模型训练方法中进行了详细的描述，因此此处不再赘述。

应当注意，尽管在上文详细描述中提及了障碍物识别模型训练装置的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

接着，在本公开的示例性实施例中，还提供了一种增量障碍物识别模型；参照图7所示，所述增量障碍物识别模型700主要包括通用特征提取网络710、障碍物区域提取网络720、障碍物区域特征映射网络730、动态检测分支网络740、聚合网络750。其中，通用特征提取网络710，用于对输入的待检测道路图像进行第一特征提取，输出语义特征图；障碍物区域提取网络720，用于对所述通用特征提取网络输出的语义特征图进行第二特征提取，输出障碍区域特征图像；障碍物区域特征映射网络730，用于对所述障碍物区域提取网络输出的所述障碍区域特征图像进行第三特征提取，输出所述障碍区域特征图像对应的目标特征向量；动态检测分支网络740，用于所述动态检测分支网络包括至少一个检测分支网络，用于在训练时，若检测到所述待检测道路图像中存在新型障碍物，则构建用于识别所述第二类型障碍物的目标检测分支网络，以及在检测所述障碍物区域图像时，通过所述至少一个检测分支网络和所述目标检测分支网络计算所述障碍物区域特征映射网络输出的目标特征向量对应的障碍区域图像的置信度；聚合网络750，用于对所述动态检测分支网络输出的障碍区域图像的置信度进行聚合处理，以根据所述置信度确定所述障碍物区域图像对应的障碍物类型。

其中，所述障碍物区域特征映射网络730包括空间池化模块、共享权值编码模块、关注区域解码模块；所述空间池化模块，用于对输入的障碍区域图像进行池化处理，得到尺寸固定的标准特征向量；所述共享权值编码模块，用于对输入的所述标准特征向量进行特征提取，得到目标特征向量；所述关注区域特征解码模块，用于对输入的所述目标特征向量进行解码处理得到与所述标准特征向量相同的解码特征向量，以通过所述解码特征向量表征所述目标特征向量是低层语义信息。

同时，在本公开的示例性实施例中，还提供了一种障碍物识别方法，该方法包括：获取待检测道路图像和预训练的增量障碍物识别模型，将所述待检测道路图像输入到所述增量障碍物识别模型中；所述增量障碍物识别模型包括通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络、聚合网络；通过所述通用特征提取网络获取所述待检测道路图像对应的语义特征图像，并将所述语义特征图像输入到所述障碍物区域提取网络确定所述语义特征图像对应的障碍物区域图像；将所述障碍物区域图像输入到所述障碍物区域特征映射网络中，并对所述障碍物区域图像进行特征提取得到目标特征向量；基于所述动态检测分支网络确定所述目标特征向量对应的障碍物区域图像的置信度，并通过所述聚合网络对所述目标特征向量对应的障碍物区域图像的置信度进行聚合处理，得到所述障碍物区域图像对应的障碍物类型实现对所述待检测道路图像的检测识别。

此外，在本公开的示例性实施例中，还提供了一种能够实现上述障碍物识别模型训练方法和障碍物识别方法的电子设备。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施例、完全的软件实施例(包括固件、微代码等)，或硬件和软件方面结合的实施例，这里可以统称为“电路”、“模块”或“系统”。

下面参照图8来描述根据本公开的这种实施例的电子设备800。图8所示的电子设备800仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示，电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于：上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830、显示单元840。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元810执行，使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。例如，所述处理单元810可以执行如图1中所示的步骤S110，获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中的第一类型障碍物；步骤S120，确定所述新增样本道路图像对应的第二类型障碍物，并构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；步骤S130，固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。所述处理单元810还可以执行如图5中所示的步骤S510，在步骤S510中，获取待检测道路图像和预训练的增量障碍物识别模型，将所述待检测道路图像输入到所述增量障碍物识别模型中；所述增量障碍物识别模型包括通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络、聚合网络；步骤S520，通过所述通用特征提取网络获取所述待检测道路图像对应的语义特征图像，并将所述语义特征图像输入到所述障碍物区域提取网络确定所述语义特征图像对应的障碍物区域图像；步骤S530，将所述障碍物区域图像输入到所述障碍物区域特征映射网络中，并对所述障碍物区域图像进行特征提取得到目标特征向量；步骤S540，基于所述动态检测分支网络确定所述目标特征向量对应的障碍物区域图像的置信度，并通过所述聚合网络对所述目标特征向量对应的障碍物区域图像的置信度进行聚合处理，得到所述障碍物区域图像对应的障碍物类型实现对所述待检测道路图像的检测识别。

存储单元820可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)821和/或高速缓存存储单元822，还可以进一步包括只读存储单元(ROM)823。

存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824，这样的程序模块825包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线830可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备800交互的设备通信，和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且，电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器860通过总线830与电子设备800的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备800使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。

在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中，本公开的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。

参考图9所示，描述了根据本公开的实施例的用于实现上述障碍物识别模型训练方法或障碍物识别方法的程序产品900，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

此外，上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

通过以上的实施例的描述，本领域的技术人员易于理解，这里描述的示例实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施例的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施例的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种障碍物识别模型训练方法，其特征在于，包括：

获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中的第一类型障碍物；

确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；

固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的增量障碍物识别模型。

2.根据权利要求1所述的障碍物识别模型训练方法，其特征在于，所述初始障碍物识别模型包括动态检测分支网络结构，所述至少一个历史检测分支网络设置于所述动态检测分支网络结构中；

所述确定所述新增样本道路图像对应的第二类型障碍物，并构建用于检测识别所述第二类型障碍物对应的目标检测分支网络包括：

在检测到所述新增样本道路图像中包含不同于所述第一类型障碍物的障碍物类型时，确定所述新增样本道路图像对应的第二类型障碍物；

基于所述动态检测分支网络结构构建用于检测识别所述第二类型障碍物对应的目标检测分支网络。

3.根据权利要求2所述的障碍物识别模型训练方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的障碍物识别模型训练方法，其特征在于，所述初始障碍物识别模型包括通用特征提取网络以及障碍物区域提取网络；

所述获取原始样本道路图像，根据所述原始样本道路图像对包含所述历史检测分支网络的初始障碍物识别模型进行训练，得到训练完成的初始障碍物识别模型，包括：

将所述原始样本道路图像输入到所述通用特征提取网络中生成所述原始样本道路图像对应的语义特征图；

将所述语义特征图输入到所述障碍物区域提取网络中，提取得到所述原始样本道路图像中包含的各障碍物对应的障碍物区域图像；

将所述障碍物区域图像输入到动态检测分支网络结构中，以使所述动态检测分支网络结构中的各所述历史检测分支网络识别并输出所述障碍物区域图像对应的障碍物类型。

5.根据权利要求4所述的障碍物识别模型训练方法，其特征在于，所述初始障碍物识别模型还包括障碍物区域特征映射网络；

所述将所述语义特征图输入到所述障碍物区域提取网络中，提取得到所述原始样本道路图像中包含的各障碍物对应的障碍物区域图像，还包括：

将所述障碍物区域图像输入到障碍物区域特征映射网络中，输出目标特征向量，以通过所述目标特征向量表征所述原始样本道路图像对应的低层语义信息；

将所述障碍物区域特征映射网络输出的所述目标特征向量输入到所述历史检测分支网络中，输出所述低层语义信息对应的高层语义信息以通过所述高层语义信息确定所述障碍物区域图像对应的障碍物类型。

6.根据权利要求5所述的障碍物识别模型训练方法，其特征在于，所述障碍物区域特征映射网络包括空间池化模块、共享权值编码模块、关注区域特征解码模块；

将所述障碍物区域图像输入到障碍物区域特征映射网络中，输出目标特征向量，包括：

将所述障碍物区域提取网络输出的所述障碍物区域图像输入到所述空间池化模块中，输出所述障碍物区域图像对应的标准特征向量；

将所述标准特征向量输入到所述共享权值编码模块，输出目标特征向量；

将所述共享权值编码模块输出的所述目标特征向量输入到所述关注区域特征解码模块中，输出解码特征向量，并通过所述关注区域特征解码模块对所述解码特征向量进行迭代处理直到所述解码特征向量与所述标准特征向量相同以实现对障碍物区域提取网络和所述动态检测分支网络结构的解耦；其中，在所述关注区域特征解码模块检测到所述新增样本道路图像对应的第二类型障碍物时，将所述初始障碍物识别模型中的所述关注区域特征解码模块和历史检测分支网络设置为锁定状态。

7.一种障碍物识别模型训练装置，其特征在于，包括：

获取模块，用于获取新增样本道路图像，以及预训练的初始障碍物识别模型，所述初始障碍物识别模型包括至少一个历史检测分支网络，所述历史检测分支网络用于检测识别所述新增样本道路图像中第一类型障碍物；

构建模块，用于确定所述新增样本道路图像对应的第二类型障碍物，并在所述初始障碍物识别模型中构建用于检测识别所述第二类型障碍物对应的目标检测分支网络；

模型训练模块，用于固定所述历史检测分支网络对应的网络权重信息，并根据所述新增样本道路图像对包含所述目标检测分支网络的所述初始障碍物识别模型进行训练，得到训练完成的障碍物识别模型。

8.一种增量障碍物识别模型，其特征在于，包括：

通用特征提取网络，用于对输入的待检测道路图像进行第一特征提取，输出语义特征图；

障碍物区域提取网络，用于对所述通用特征提取网络输出的语义特征图进行第二特征提取，输出障碍区域特征图像；

障碍物区域特征映射网络，用于对所述障碍物区域提取网络输出的所述障碍区域特征图像进行第三特征提取，输出所述障碍区域特征图像对应的目标特征向量；

动态检测分支网络，所述动态检测分支网络包括至少一个检测分支网络，用于在训练时，若检测到所述待检测道路图像中存在新类型障碍物，则构建用于识别所述新类型障碍物的目标检测分支网络，以及在检测所述障碍物区域图像时，通过所述至少一个检测分支网络和所述目标检测分支网络计算所述障碍物区域特征映射网络输出的目标特征向量对应的障碍区域图像的置信度；

聚合网络，用于对所述动态检测分支网络输出的障碍区域图像的置信度进行聚合处理，以根据所述置信度确定所述障碍物区域图像对应的障碍物类型。

9.根据权利要求8所述的增量障碍物识别模型，其特征在于，所述障碍物区域特征映射网络包括空间池化模块、共享权值编码模块、关注区域解码模块；

所述空间池化模块，用于对输入的障碍区域图像进行池化处理，得到尺寸固定的标准特征向量；

所述共享权值编码模块，用于对输入的所述标准特征向量进行特征提取，得到目标特征向量；

所述关注区域解码模块，用于对输入的所述目标特征向量进行解码处理得到与所述标准特征向量相同的解码特征向量，以通过所述解码特征向量表征所述目标特征向量是低层语义信息。

10.一种障碍物识别方法，其特征在于，包括：

获取待检测道路图像，将所述待检测道路图像输入到增量障碍物识别模型中；所述增量障碍物识别模型包括通用特征提取网络、障碍物区域提取网络、障碍物区域特征映射网络、动态检测分支网络、聚合网络；

通过所述通用特征提取网络获取所述待检测道路图像对应的语义特征图像，并将所述语义特征图像输入到所述障碍物区域提取网络确定所述语义特征图像对应的障碍物区域图像；

将所述障碍物区域图像输入到所述障碍物区域特征映射网络中，并对所述障碍物区域图像进行特征提取得到目标特征向量；

基于所述动态检测分支网络确定所述目标特征向量对应的障碍物区域图像的置信度，并通过所述聚合网络对所述障碍物区域图像的置信度进行聚合处理，得到所述障碍物区域图像对应的障碍物类型实现对所述待检测道路图像的检测识别。

11.一种电子设备，包括：

处理器；以及

存储器，所述存储器上存储有计算机可读指令，所述计算机可读指令被所述处理器执行时实现如权利要求1至6中任一项所述的障碍物识别模型训练方法，或者实现如权利要求10的障碍物识别方法。

12.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的障碍物识别模型训练方法，或者实现如权利要求10的障碍物识别方法。