CN110189337A

CN110189337A - 一种自动驾驶图像语义分割方法

Info

Publication number: CN110189337A
Application number: CN201910468973.0A
Authority: CN
Inventors: 黄国恒; 朱俊文
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-05-31
Filing date: 2019-05-31
Publication date: 2019-08-30

Abstract

本申请公开了一种自动驾驶图像语义分割方法，该方法包括获取目标待处理图像；通过ASPP模型对目标待处理图像进行处理，得到第一处理结果；确定第一处理结果中每个特征通道的通道权重值；将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果；基于第二处理结果确定目标待处理图像的图像语义分割结果。本申请提供的一种图像语义分割方法，在得到第一处理结果后，还需基于通道权重值对第一处理结果中的特征通道所代表的特征进行管控，可以提高图像语义分割结果的准确性。本申请提供的一种自动驾驶图像语义分割系统、设备及计算机可读存储介质也解决了相应技术问题。

Description

一种自动驾驶图像语义分割方法

技术领域

本申请涉及图像处理技术领域，更具体地说，涉及一种自动驾驶图像语义分割方法。

背景技术

在计算机视觉，如自动驾驶等应用场景中，有时需要对图像中的对象进行识别、区分，这时便需要对图像进行图像语义分割，假设一幅图像中有猫和狗两个目标对象，对该图像进行图像语义分割后，便可以得到只含有猫的图像区域和只含有狗的图像区域，从而可以准确的对图像中的对象进行识别、区分。

现有的一种图像语义分割方法是：通过ASPP(Atrous Spatial Pyramid Poolong，空洞卷积空间金字塔)模型对目标待处理图像进行处理，得到处理结果，并基于处理结果得到目标待处理图像的图像语义分割结果。

然而，现有的一种图像语义分割方法中，ASPP模型获得的特征中可能包含与图像语义分割结果不相符的特征，影响图像语义分割结果的准确性。

综上所述，如何提高图像语义分割方法的准确性是目前本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种自动驾驶图像语义分割方法，其能在一定程度上解决如何提高图像语义分割方法的准确性的技术问题。本申请还提供了一种自动驾驶图像语义分割系统、设备及计算机可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种自动驾驶图像语义分割方法，包括：

获取自动驾驶下的目标待处理图像；

通过ASPP模型对所述目标待处理图像进行处理，得到第一处理结果；

确定所述第一处理结果中每个特征通道的通道权重值；

将所述第一处理结果中的每个特征通道及对应的所述通道权重值进行乘法运算，得到第二处理结果；

基于所述第二处理结果确定所述目标待处理图像的图像语义分割结果。

优选的，所述确定所述第一处理结果中每个特征通道的通道权重值，包括：

通过SE-NET模型确定所述第一处理结果中每个特征通道的通道权重值。

优选的，所述通过SE-NET模型确定所述第一处理结果中每个特征通道的通道权重值，包括：

对所述第一处理结果进行全局平均池化操作，得到池化操作结果；

获取预先训练的降维矩阵及升维矩阵；

基于所述降维矩阵及所述升维矩阵对所述池化操作结果进行处理，得到所述通道权重值。

优选的，所述对所述第一处理结果进行全局平均池化操作，得到池化操作结果，包括：

通过全局平均池化公式对所述第一处理结果进行全局平均池化操作，得到所述池化操作结果；

所述全局平均池化公式包括：

其中，u_c表示所述第一处理结果中的第c个卷积层；z_c表示u_c对应的池化操作结果；W表示所述第一处理结果的卷积核的宽度；H表示所述第一处理结果的卷积核的高度。

优选的，z的维度为1×1×C，C表示所述第一处理结果的卷积核的特征通道数。

优选的，所述基于所述降维矩阵及所述升维矩阵对所述池化操作结果进行处理，得到所述通道权重值，包括：

通过第一运算公式，基于所述降维矩阵及所述升维矩阵对所述池化操作结果进行处理，得到所述通道权重值；

所述第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

其中，W₁表示所述降维矩阵；W₂表示所述升维矩阵；σ表示激活函数；δ表示激活函数；s表示所述通道权重值；z表示所述池化操作结果。

优选的，σ表示sigmoid激活函数；δ表示relu激活函数。

一种自动驾驶图像语义分割系统，包括：

第一获取模块，用于获取自动驾驶下的目标待处理图像；

第一处理模块，用于通过ASPP模型对所述目标待处理图像进行处理，得到第一处理结果；

第一确定模块，用于确定所述第一处理结果中每个特征通道的通道权重值；

第一运算模块，用于将所述第一处理结果中的每个特征通道及对应的所述通道权重值进行乘法运算，得到第二处理结果；

第二确定模块，用于基于所述第二处理结果确定所述目标待处理图像的图像语义分割结果。

一种自动驾驶图像语义分割设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一所述自动驾驶图像语义分割方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述自动驾驶图像语义分割方法的步骤。

本申请提供的一种自动驾驶图像语义分割方法，获取目标待处理图像；通过ASPP模型对目标待处理图像进行处理，得到第一处理结果；确定第一处理结果中每个特征通道的通道权重值；将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果；基于第二处理结果确定目标待处理图像的图像语义分割结果。本申请提供的一种自动驾驶图像语义分割方法，在得到第一处理结果后，还需确定第一处理结果中每个特征通道的通道权重值，并且基于通道权重值对第一处理结果进行乘法运算，得到第二处理结果，从而可以基于通道权重值对第一处理结果中的特征通道所代表的特征进行管控，与直接基于第一处理结果得到图像语义分割结果的现有技术相比，可以提高图像语义分割结果的准确性。本申请提供的一种自动驾驶图像语义分割系统、设备及计算机可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种自动驾驶图像语义分割方法的第一流程图；

图2为本申请实施例提供的一种自动驾驶图像语义分割方法的第二流程图；

图3为本申请提供的ASPP模型和SE-NET模型的连接示意图；

图4为本申请实施例提供的一种自动驾驶图像语义分割系统的结构示意图；

图5为本申请实施例提供的一种自动驾驶图像语义分割设备的结构示意图；

图6为本申请实施例提供的一种自动驾驶图像语义分割设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在计算机视觉，如自动驾驶等应用场景中，有时需要对图像中的对象进行识别、区分，这时便需要对图像进行图像语义分割，假设一幅图像中有猫和狗两个目标对象，对该图像进行图像语义分割后，便可以得到只含有猫的图像区域和只含有狗的图像区域，从而可以准确的对图像中的对象进行识别、区分。现有的一种图像语义分割方法是：通过ASPP(Atrous Spatial Pyramid Poolong，空洞卷积空间金字塔)模型对目标待处理图像进行处理，得到处理结果，并基于处理结果得到目标待处理图像的图像语义分割结果。然而，现有的一种图像语义分割方法中，ASPP模型获得的特征中可能包含与图像语义分割结果不相符的特征，影响图像语义分割结果的准确性。本申请提供的一种自动驾驶图像语义分割方法可以提高图像语义分割方法的准确性。

请参阅图1，图1为本申请实施例提供的一种自动驾驶图像语义分割方法的第一流程图。

本申请实施例提供的一种自动驾驶图像语义分割方法，可以包括以下步骤：

步骤S101：获取自动驾驶下的目标待处理图像。

实际应用中，可以先获取自动驾驶下的目标待处理图像，目标待处理图像的类型可以根据具体应用场景确定，比如目标待处理图像可以为机器人运行过程中拍摄的图像，汽车行驶过程中拍摄的图像等。

步骤S102：通过ASPP模型对目标待处理图像进行处理，得到第一处理结果。

实际应用中，在获取目标待处理图像后，便可以通过ASPP模型对目标待处理图像进行处理，得到第一处理结果。通过ASPP模型对目标待处理图像进行处理的过程可以为：对目标待处理图像进行卷积运算，得到含有目标待处理图像中的特征图像的特征图，通过预设数量的空洞卷积核分别对特征图进行处理，得到预设数量的中间处理结果；将预设数量的中间处理结果联结在一起即可得到第一处理结果。

步骤S103：确定第一处理结果中每个特征通道的通道权重值。

实际应用中，在得到第一处理结果后，还需确定第一处理结果中每个特征通道的通道权重值。具体应用场景中，可以基于特征通道所对应的特征与所需的图像语义分割结果的关联程度来确定通道权重值，也即通道权重值代表特征通道所对应的特征与图像语义分割结果的关联程度。

步骤S104：将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果。

实际应用中，在确定通道权重值之后，还需将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果。由于是将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，所以通道权重值会影响特征通道在第二处理结果中的比重，也即通过通道权重值可以对每个特征通道进行管控，相应的，也即对每个特征通道所对应的特征进行管控。

步骤S105：基于第二处理结果确定目标待处理图像的图像语义分割结果。

实际应用中，在得到第二处理结果后，便可以基于第二处理结果确定目标待处理图像的图像语义分割结果。具体的，在确定图像语义分割结果之后，还可以基于图像语义分割结果对目标待处理图像进行图像识别。

本申请提供的一种自动驾驶图像语义分割方法，获取目标待处理图像；通过ASPP模型对目标待处理图像进行处理，得到第一处理结果；确定第一处理结果中每个特征通道的通道权重值；将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果；基于第二处理结果确定目标待处理图像的图像语义分割结果。本申请提供的一种自动驾驶图像语义分割方法，在得到第一处理结果后，还需确定第一处理结果中每个特征通道的通道权重值，并且基于通道权重值对第一处理结果进行乘法运算，得到第二处理结果，从而可以基于通道权重值对第一处理结果中的特征通道所代表的特征进行管控，与直接基于第一处理结果得到图像语义分割结果的现有技术相比，可以提高图像语义分割结果的准确性。

请参阅图2和图3，图2为本申请实施例提供的一种自动驾驶图像语义分割方法的第二流程图；图3为本申请提供的ASPP模型和SE-NET模型的连接示意图，土3中，Fsq表示全局平均池化公式，Fex表示第一运算公式，Fscale表示得到第二处理结果的过程。

本申请实施例提供的一种自动驾驶图像语义分割方法具体可以包括以下步骤：

步骤S201：获取自动驾驶下的目标待处理图像。

步骤S202：通过ASPP模型对目标待处理图像进行处理，得到第一处理结果。

步骤S203：通过SE-NET模型确定第一处理结果中每个特征通道的通道权重值。

实际应用中，为了提高通道权重值的确定速率，可以借助SE-NET模型自动确定通道权重值，具体应用场景中，贼通过SE-NET模型确定第一处理结果中每个特征通道的通道权重值时，可以先对第一处理结果进行全局平均池化操作，得到池化操作结果；再获取预先训练的降维矩阵及升维矩阵；最后基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值。

具体应用场景中，对第一处理结果进行全局平均池化操作，得到池化操作结果时，可以通过全局平均池化公式对第一处理结果进行全局平均池化操作，得到池化操作结果；

全局平均池化公式包括：

其中，u_c表示第一处理结果中的第c个卷积层；z_c表示u_c对应的池化操作结果；W表示第一处理结果的卷积核的宽度；H表示第一处理结果的卷积核的高度。

具体应用场景中，为了降低对第一处理结果进行全局平均池化操作的复杂度，提高对第一处理结果进行全局平均池化操作的效率，全局平均池化公式中z的维度可以为1×1×C，C表示第一处理结果的卷积核的特征通道数。

具体应用场景中，在基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值时，可以通过第一运算公式，基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值；

第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

其中，W₁表示降维矩阵；W₂表示升维矩阵；σ表示激活函数；δ表示激活函数；s表示通道权重值；z表示池化操作结果。具体的，W₁、W₂的维度可以根据实际需要确定，比如W₁的维度可以为W₂的维度可以为且具体应用场景中，σ可以表示sigmoid激活函数；δ可以表示relu激活函数。

步骤S204：将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果。

步骤S205：基于第二处理结果确定目标待处理图像的图像语义分割结果。

本实施例中相关步骤的说明请参阅上述实施例，在此不再赘述。

本申请还提供了一种自动驾驶图像语义分割系统，其具有本申请实施例提供的一种自动驾驶图像语义分割方法具有的对应效果。请参阅图4，图4为本申请实施例提供的一种自动驾驶图像语义分割系统的结构示意图。

本申请实施例提供的一种自动驾驶图像语义分割系统，可以包括：

第一获取模块101，用于获取自动驾驶下的目标待处理图像；

第一处理模块102，用于通过ASPP模型对目标待处理图像进行处理，得到第一处理结果；

第一确定模块103，用于确定第一处理结果中每个特征通道的通道权重值；

第一运算模块104，用于将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果；

第二确定模块105，用于基于第二处理结果确定目标待处理图像的图像语义分割结果。

本申请实施例提供的一种自动驾驶图像语义分割系统中，第一确定模块可以包括：

第一确定子模块，用于通过SE-NET模型确定第一处理结果中每个特征通道的通道权重值。

本申请实施例提供的一种自动驾驶图像语义分割系统中，第一确定子模块可以包括：

第一池化子模块，用于对第一处理结果进行全局平均池化操作，得到池化操作结果；

第一获取子模块，用于获取预先训练的降维矩阵及升维矩阵；

第一处理子模块，用于基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值。

本申请实施例提供的一种自动驾驶图像语义分割系统，第一池化子模块可以包括：

第一池化单元，用于通过全局平均池化公式对第一处理结果进行全局平均池化操作，得到池化操作结果；

全局平均池化公式包括：

本申请实施例提供的一种自动驾驶图像语义分割系统中，z的维度可以为1×1×C，C表示第一处理结果的卷积核的特征通道数。

本申请实施例提供的一种自动驾驶图像语义分割系统中，第一处理子模块可以包括：

第一处理单元，用于通过第一运算公式，基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值；

第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

其中，W₁表示降维矩阵；W₂表示升维矩阵；σ表示激活函数；δ表示激活函数；s表示通道权重值；z表示池化操作结果。

本申请实施例提供的一种自动驾驶图像语义分割系统中，σ可以表示sigmoid激活函数；δ可以表示relu激活函数。

本申请还提供了一种自动驾驶图像语义分割设备及计算机可读存储介质，其均具有本申请实施例提供的一种自动驾驶图像语义分割方法具有的对应效果。请参阅图5，图5为本申请实施例提供的一种自动驾驶图像语义分割设备的结构示意图。

本申请实施例提供的一种自动驾驶图像语义分割设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时实现如下步骤：

获取自动驾驶下的目标待处理图像；

通过ASPP模型对目标待处理图像进行处理，得到第一处理结果；

确定第一处理结果中每个特征通道的通道权重值；

将第一处理结果中的每个特征通道及对应的通道权重值进行乘法运算，得到第二处理结果；

基于第二处理结果确定目标待处理图像的图像语义分割结果。

本申请实施例提供的一种自动驾驶图像语义分割设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时具体实现如下步骤：通过SE-NET模型确定第一处理结果中每个特征通道的通道权重值。

本申请实施例提供的一种自动驾驶图像语义分割设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时具体实现如下步骤：对第一处理结果进行全局平均池化操作，得到池化操作结果；获取预先训练的降维矩阵及升维矩阵；基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值。

本申请实施例提供的一种自动驾驶图像语义分割设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时具体实现如下步骤：通过全局平均池化公式对第一处理结果进行全局平均池化操作，得到池化操作结果；

全局平均池化公式包括：

本申请实施例提供的一种自动驾驶图像语义分割设备中，z的维度为1×1×C，C表示第一处理结果的卷积核的特征通道数。

本申请实施例提供的一种自动驾驶图像语义分割设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行存储器201中存储的计算机程序时具体实现如下步骤：通过第一运算公式，基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值；

第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

本申请实施例提供的一种自动驾驶图像语义分割设备中，σ表示sigmoid激活函数；δ表示relu激活函数。

请参阅图6，本申请实施例提供的另一种自动驾驶图像语义分割设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现自动驾驶图像语义分割设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接：无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：

获取自动驾驶下的目标待处理图像；

确定第一处理结果中每个特征通道的通道权重值；

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时具体实现如下步骤：通过SE-NET模型确定第一处理结果中每个特征通道的通道权重值。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时具体实现如下步骤：对第一处理结果进行全局平均池化操作，得到池化操作结果；获取预先训练的降维矩阵及升维矩阵；基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时具体实现如下步骤：通过全局平均池化公式对第一处理结果进行全局平均池化操作，得到池化操作结果；

全局平均池化公式包括：

本申请实施例提供的一种计算机可读存储介质中，z的维度为1×1×C，C表示第一处理结果的卷积核的特征通道数。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时具体实现如下步骤：通过第一运算公式，基于降维矩阵及升维矩阵对池化操作结果进行处理，得到通道权重值；

第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

本申请实施例提供的一种计算机可读存储介质中，σ表示sigmoid激活函数；δ表示relu激活函数。

本申请所涉及的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

本申请实施例提供的一种自动驾驶图像语义分割系统、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的一种自动驾驶图像语义分割方法中对应部分的详细说明，在此不再赘述。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种自动驾驶图像语义分割方法，其特征在于，包括：

获取自动驾驶下的目标待处理图像；

确定所述第一处理结果中每个特征通道的通道权重值；

2.根据权利要求1所述的方法，其特征在于，所述确定所述第一处理结果中每个特征通道的通道权重值，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过SE-NET模型确定所述第一处理结果中每个特征通道的通道权重值，包括：

获取预先训练的降维矩阵及升维矩阵；

4.根据权利要求3所述的方法，其特征在于，所述对所述第一处理结果进行全局平均池化操作，得到池化操作结果，包括：

所述全局平均池化公式包括：

5.根据权利要求4所述的方法，其特征在于，z的维度为1×1×C，C表示所述第一处理结果的卷积核的特征通道数。

6.根据权利要求5所述的方法，其特征在于，所述基于所述降维矩阵及所述升维矩阵对所述池化操作结果进行处理，得到所述通道权重值，包括：

所述第一运算公式包括：

s＝σ(W₂·δ(W₁·z))；

7.根据权利要求6所述的方法，其特征在于，σ表示sigmoid激活函数；δ表示relu激活函数。

8.一种自动驾驶图像语义分割系统，其特征在于，包括：

第一获取模块，用于获取自动驾驶下的目标待处理图像；

9.一种自动驾驶图像语义分割设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述自动驾驶图像语义分割方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述自动驾驶图像语义分割方法的步骤。