CN116977635A

CN116977635A - 类别增量语义分割学习方法及语义分割方法

Info

Publication number: CN116977635A
Application number: CN202310890134.4A
Authority: CN
Inventors: 张兆翔; 吴健幸; 樊峻菘; 王玉玺
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2023-07-19
Filing date: 2023-07-19
Publication date: 2023-10-31
Anticipated expiration: 2043-07-19
Also published as: CN116977635B

Abstract

本发明涉及计算机视觉技术领域，提供一种类别增量语义分割学习方法及语义分割方法，通过将当前阶段的图像样本输入至当前阶段的主网络模型，得到第一结果，通过图像样本中的类别标签与对第一结果进行划分得到的第三结果，采用二分类约束方法计算增量学习损失，通过将当前阶段的图像样本输入至前一阶段的语义分割模型，得到第二结果，并通过第二结果与对第一结果进行划分得到的第四结果计算知识蒸馏损失。通过采用二分类约束方法，可以对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦，从而使第三结果的有监督学习以及对第四结果的知识蒸馏这两个过程的独立进行，加强语义分割模型最终对所有已知类别的语义分割效果。

Description

类别增量语义分割学习方法及语义分割方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种类别增量语义分割学习方法及语义分割方法。

背景技术

语义分割致力于针对图像中的每一个像素进行识别并判断出一个具体的类别，是计算机视觉中的基础问题之一。该领域的研究成果已被广泛应用于自动驾驶、智能感知、机器人感知、虚拟世界等多种现实世界场景。

传统的语义分割框架要求在一次训练中使用所有可知类别的数据对语义分割模型进行训练，并不再要求所得的语义分割模型具有持续学习更多知识的迭代能力。该设定下的研究在限定的场景中已经能够得到良好的实验结果。然而，该类学习方式在应对需要不断获取和使用新数据进行学习的开放式场景时，将需要对语义分割模型不断地进行重新训练。这一过程不仅需要存储各个阶段获得的数据，还需要在每个学习阶段反复地使用同样的数据进行训练，这将造成存储与计算成本大幅度上升。

由此，类别增量语义分割学习方法应运而生，该方法的研究目的在于使语义分割模型在每次获取新的数据时能够只使用这一部分数据进行学习，从而不再需要对旧知识相关的数据进行保存，降低了数据的存储成本。另外，由于对语义分割模型进行增量学习时不需要使用旧知识相关的数据，语义分割模型训练的时间成本也将得以降低。

然而，现有的类别增量语义分割学习方法通常是利用掌握旧知识的模型学习新知识，其忽略了学习新知识与保持旧知识这两个增量学习目标之间的耦合性对语义分割效果的影响，导致语义分割效果不佳。

发明内容

本发明提供一种类别增量语义分割学习方法及语义分割方法，用以解决现有技术中由于学习新知识与保持旧知识这两个增量学习目标之间的耦合性，增量语义分割最终效果有限的缺陷，实现对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦，从而使第三结果的有监督学习以及对第四结果的知识蒸馏这两个过程的独立进行，由此新知识和旧知识可以更好地在当前阶段的语义分割模型中共存，加强语义分割模型最终对所有已知类别的语义分割效果。

本发明提供一种类别增量语义分割学习方法，包括：

将当前阶段的图像样本分别输入至当前阶段的主网络模型以及所述当前阶段的前一阶段的语义分割模型，得到所述主网络模型输出的第一结果以及所述前一阶段的语义分割模型输出的第二结果；

将所述第一结果划分为与所述主网络模型学习的类别对应的第三结果以及与所述当前阶段之前的已知类别对应的第四结果；

基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，基于所述第二结果以及所述第四结果，计算所述主网络模型的知识蒸馏损失，并基于所述增量学习损失以及所述知识蒸馏损失，确定目标损失；

基于所述目标损失，对所述主网络模型的结构参数进行迭代优化，得到所述当前阶段的语义分割模型。

根据本发明提供的一种类别增量语义分割学习方法，所述方法还包括：

确定所述主网络模型对应的分支解码器模块，所述分支解码器模块与所述主网络模型中的第一特征提取模块连接；

将所述当前阶段的图像样本输入至所述主网络模型，得到所述主网络模型中的第一解码器模块输出的所述第一结果以及所述分支解码器模块输出的第五结果；所述第五结果中的蒙版数量与所述当前阶段所述主网络模型学习的类别数量相同；

基于所述图像样本中的类别标签以及所述第五结果，计算所述分支解码器模块对应的BCE损失；

相应的，基于所述增量学习损失以及所述知识蒸馏损失，确定目标损失，包括：

基于所述增量学习损失、所述知识蒸馏损失以及所述BCE损失，确定所述目标损失。

根据本发明提供的一种类别增量语义分割学习方法，基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，包括：

基于所述类别标签以及所述第三结果，采用FocalLoss损失函数，计算第一增量学习损失；

基于所述类别标签以及所述第三结果，采用DiceLoss损失函数，计算第二增量学习损失。

根据本发明提供的一种类别增量语义分割学习方法，将所述当前阶段的图像样本输入至所述主网络模型，得到所述第一结果，包括：

将所述图像样本输入至所述第一特征提取模块，得到所述第一特征提取模块输出的第一特征映射图；

将所述第一特征映射图输入至所述第一解码器模块，得到所述第一解码器模块输出的所述第一结果。

根据本发明提供的一种类别增量语义分割学习方法，将所述当前阶段的图像样本输入至所述前一阶段的语义分割模型，得到所述第二结果，包括：

将所述图像样本输入至所述前一阶段的语义分割模型的第二特征提取模块，得到所述第二特征提取模块输出的第二特征映射图；

将所述第二特征映射图输入至所述前一阶段的语义分割模型的第二解码器模块，得到所述第二解码器模块输出的所述第二结果。

根据本发明提供的一种类别增量语义分割学习方法，所述第一结果中的蒙版数量与所述当前阶段及之前的所有类别数量相同；所述第二结果中的蒙版数量与所述当前阶段之前的已知类别数量相同。

本发明还提供一种语义分割方法，包括：

获取目标图像；

将所述目标图像输入至上述的类别增量语义分割学习方法中得到的当前阶段的语义分割模型，得到所述当前阶段的语义分割模型输出的分割结果。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任一种所述的类别增量语义分割学习方法，或语义分割方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述的类别增量语义分割学习方法，或语义分割方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述的类别增量语义分割学习方法，或语义分割方法。

本发明提供的类别增量语义分割学习方法及语义分割方法，类别增量语义分割学习方法通过将当前阶段的图像样本输入至当前阶段的主网络模型，可以得到第一结果，并通过图像样本中的类别标签与对第一结果进行划分得到的第三结果，采用二分类约束方法计算增量学习损失，通过将当前阶段的图像样本输入至前一阶段的语义分割模型，可以得到第二结果，并通过第二结果与对第一结果进行划分得到的第四结果计算知识蒸馏损失。通过采用二分类约束方法，可以对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦，从而使第三结果的有监督学习以及对第四结果的知识蒸馏这两个过程的独立进行，由此新知识和旧知识可以更好地在当前阶段的语义分割模型中共存，加强语义分割模型最终对所有已知类别的语义分割效果。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的类别增量语义分割学习方法的流程示意图之一；

图2是本发明提供的类别增量语义分割学习方法的流程示意图之二；

图3是本发明提供的类别增量语义分割学习方法的流程示意图之三；

图4是本发明提供的语义分割方法的流程示意图；

图5是本发明提供的类别增量语义分割学习装置的结构示意图；

图6是本发明提供的语义分割装置的结构示意图；

图7是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书中的术语“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

由于现有的类别增量语义分割学习方法通常是利用掌握旧知识的模型学习新知识，其忽略了学习新知识与保持旧知识这两个增量学习目标之间的耦合性对语义分割效果的影响，也未在对两个问题进行解耦上做出尝试，导致语义分割效果不佳。基于此，本发明实施例中提供了一种类别增量语义分割学习方法。

图1为本发明实施例中提供的一种类别增量语义分割学习方法的流程示意图，如图1所示，该方法包括：

S11，将当前阶段的图像样本分别输入至当前阶段的主网络模型以及所述当前阶段的前一阶段的语义分割模型，得到所述主网络模型中的第一解码器模块输出的第一结果以及所述前一阶段的语义分割模型输出的第二结果；

S12，将所述第一结果划分为与所述主网络模型学习的类别对应的第三结果以及与所述当前阶段之前的已知类别对应的第四结果；

S13，基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，基于所述第二结果以及所述第四结果，计算所述主网络模型的知识蒸馏损失，并基于所述增量学习损失以及所述知识蒸馏损失，确定目标损失；

S14，基于所述目标损失，对所述主网络模型的结构参数进行迭代优化，得到所述当前阶段的语义分割模型。

具体地，本发明实施例中提供的类别增量语义分割学习方法，其执行主体为类别增量语义分割学习装置，该装置可以配置于计算机内，该计算机可以为本地计算机或云计算机，本地计算机可以是电脑、平板等，此处不作具体限定。

首先执行步骤S11，确定当前阶段t需要训练的主网络模型M_t。

可以理解的是，该主网络模型用于学习当前阶段的图像样本中的类别C_t，使该主网络模型可以具有当前阶段及之前的所有类别的语义分割能力，即该主网络模型能够输出的类别数量与当前阶段及之前的所有类别C_0：t数量相同。此处，各阶段的图像样本可以是彩色图像，也可以是灰度图像，此处不作具体限定。各阶段的图像样本中的类别是指图像样本中包括的目标对象的类别，均可以包括树、人、动物、建筑物、车辆和道路等中的至少一项，也可以是树、人、动物、建筑物、车辆和道路等中的某一项的二级分类，例如松树、榆树、柏树等，还可以是生成出的不同产品的分类，此处不作具体限定。

将当前阶段的图像样本分别输入至主网络模型M_t以及当前阶段的前一阶段t-1的语义分割模型M_t-1，得到主网络模型M_t输出的第一结果O_t(trunk)以及前一阶段的语义分割模型输出的第二结果O_t-1。

该第一结果即为主网络模型输出的语义分割结果，该第二结果即为前一阶段的语义分割模型输出的语义分割结果。此处，前一阶段的语义分割模型是已经学习了当前阶段之前的已知类别C_0：t-1的语义分割模型。

然后执行步骤S12，由于主网络模型M_t能够输出的类别数量与当前阶段及之前的所有类别C_0：t数量相同，因此该第一结果O_t(trunk)中既包括了与主网络模型学习的类别C_t对应的第三结果O_t(new)，也包括了与当前阶段之前的已知类别C_0：t-1对应的第四结果O_t(old)。进而，可以将第一结果O_t(trunk)划分为第三结果O_t(new)和第四结果O_t(old)。该过程可以表示为：

O_t(old)＝{O_t(trunk)∈C_0：t-1}；

O_t(new)＝{O_t(trunk)∈C_t}。

此后执行步骤S13，利用当前阶段的图像样本中的类别标签GT_t以及第三结果O_t(new)，采用二分类约束方法计算所述主网络模型的增量学习损失。图像样本中的类别标签GT_t是指通过人工标注或软件标注等方式确定的图像样本中各目标对象的类别，当前阶段的图像样本中可以仅包含有主网络模型需要学习的类别，即增量类别。进而，借助于二分类约束方法，可以计算主网络模型的增量学习损失。该增量学习损失可以表征当前阶段的图像样本中的类别标签与第三结果之间的偏差。

利用第二结果O_t-1和第四结果O_t(old)，可以计算主网络模型的知识蒸馏损失。此处，该知识蒸馏损失可以通过KL散度进行计算，计算公式可以为：

其中，S_old为知识蒸馏损失，是第四结果O_t(old)中的第i类取值，/>是第二结果O_t-1中的第i类取值。

进而，利用增量学习损失以及知识蒸馏损失，可以确定出目标损失，该目标损失可以是总损失，可以通过将增量学习损失与知识蒸馏损失进行加权求和得到。特别地，增量学习损失与知识蒸馏损失的权重可以均为1。

最后，执行步骤S14，利用目标损失，对主网络模型的结构参数进行迭代优化，得到当前阶段的语义分割模型。此处，可以利用目标损失，进行反向传播，从而可以实现对主网络模型的结构参数进行优化调整，进而通过重复执行上述步骤S11至S13，实现对主网络模型的迭代优化，直至满足迭代结束条件，得到当前阶段的语义分割模型。

可以理解的是，迭代结束条件可以包括目标损失低于设定阈值或迭代优化过程达到设定次数。

本发明实施例中提供的类别增量语义分割学习方法，通过将当前阶段的图像样本输入至当前阶段的主网络模型，可以得到第一结果，并通过图像样本中的类别标签与对第一结果进行划分得到的第三结果，采用二分类约束方法计算增量学习损失，通过将当前阶段的图像样本输入至前一阶段的语义分割模型，可以得到第二结果，并通过第二结果与对第一结果进行划分得到的第四结果计算知识蒸馏损失。通过采用二分类约束方法，可以对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦，从而使第三结果的有监督学习以及对第四结果的知识蒸馏这两个过程的独立进行，由此新知识和旧知识可以更好地在当前阶段的语义分割模型中共存，加强语义分割模型最终对所有已知类别的语义分割效果。

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习方法，所述方法还包括：

具体地，本发明实施例中，主网络模型可以包括连接的第一特征提取模块和第一解码器模块，该第一特征提取模块用于进行图像特征提取，第一解码器模块用于对图像特征进行解码，输出语义分割结果。

因此，该方法还可以确定主网络模型对应的分支解码器模块，该分支解码器模块可以与主网络模型中的第一特征提取模块连接，用于辅助该主网络模型的学习过程，该分支解码器模块能够输出的类别数量与当前阶段主网络模型学习的类别C_t数量相同。

因此，在将当前阶段的图像样本输入至主网络模型之后，不仅可以得到第一解码器模块输出的第一结果，还可以得到分支解码器模块输出的第五结果O_t(branch)。由于分支解码器模块能够输出的类别数量与当前阶段主网络模型学习的类别数量相同，因此第五结果中的蒙版数量与当前阶段主网络模型学习的类别数量相同。

此后，利用图像样本中的类别标签以及第五结果，可以计算出分支解码器模块对应的BCE损失。此处，BCE损失是一种二分类约束，其计算公式可以表示为：

其中，S_branch为BCE损失，可以理解为分支损失，y_i为GT_t中的第i类取值，为真值，为第五结果O_t(branch)中第i类取值。

进而，目标损失可以通过将增量学习损失、知识蒸馏损失与BCE损失进行加权求和得到。

本发明实施例中，通过引入当前阶段的主网络模型对应的分支解码器模块，使其可以产生与主网络模型需要学习的类别数目一致的蒙版作为输出，并通过BCE损失对其进行约束，可以在特征层面加强新知识和旧知识在语义分割模型中的共存能力，从而进一步提高语义分割模型对所有已知类别的语义分割效果。

在上述实施例的基础上，基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，包括：

具体地，二分类约束方法采用的损失函数可以包括FocalLoss损失函数和DiceLoss损失函数，因此在计算增量学习损失时，可以利用当前阶段的图像样本的类别标签以及第三结果，分别采用FocalLoss损失函数和DiceLoss损失函数，计算第一增量学习损失和第二增量学习损失，第一增量学习损失和第二增量学习损失共同构成增量学习损失。

第一增量学习损失S_focal可以通过如下公式计算：

其中，i∈C_t；表示第三结果O_t(new)中的第i类取值。

第二增量学习损失S_dice可以通过如下公式计算：

其中，|·|表示对应类别的像素数量，即类别对应蒙板的前景面积。

本发明实施例中，通过FocalLoss损失函数和DiceLoss损失函数，共同计算增量学习损失，可以使增量学习过程更加准确，使当前阶段的语义分割模型的语义分割效果更好。

在上述实施例的基础上，目标损失S可以通过如下公式计算：

S＝α·S_branch+β·S_focal+γ·S_dice+δ·S_old；

其中，α、β、γ、δ分别表示不同损失所对应的超参系数。

在上述实施例的基础上，将所述当前阶段的图像样本输入至所述主网络模型，得到所述第一结果，包括：

具体地，由于主网络模型可以包括连接的包括第一特征提取模块和第一解码器模块，因此在得到第一结果时，可以先将当前阶段t的图像样本I_t输入至第一特征提取模块E_t，得到第一特征提取模块E_t输出的第一特征映射图f_t。该过程可以表示为：

f_t＝E_t(I_t)；

其中，E_t(·)代表第一特征提取模块的映射函数。

此后，将第一特征映射图f_t输入至第一解码器模块D_t(trunk)，得到第一解码器模块输出的第一结果O_t(trunk)。该过程可以表示为：

O_t(trunk)＝D_t(trunk)(f_t)；

其中，D_t(trunk)(·)代表第一解码器模块的映射函数；O_t(trunk)所包含的蒙板数量与已知所有类别C_0：t数量一致。

在上述实施例的基础上，将当前阶段t的图像样本I_t输入至主网络模型，还可以得到由分支解码器模块D_t(bran)输出的第五结果O_t(branch)。该过程可以表示为：

O_t(branch)＝D_t(branch)(f_t)；

其中，D_t(branch)(·)代表当前阶段t的模型分支解码器模块的映射函数；O_t(branch)所包含的蒙板数量与主网络模型需要学习的类别C_t数量一致。

在上述实施例的基础上，将所述当前阶段的图像样本输入至所述前一阶段的语义分割模型，得到所述第二结果，包括：

具体地，前一阶段的语义分割模型进可以包括连接的第二特征提取模块和第二解码器模块，该第二特征提取模块用于进行图像特征提取，第二解码器模块用于对图像特征进行解码，输出语义分割结果。

因此在得到第二结果时，可以先将当前阶段t的图像样本I_t输入至第二特征提取模块E_t-1，得到第二特征提取模块E_t-1输出的第二特征映射图f_t-1。该过程可以表示为：

f_t-1＝E_t-1(I_t)；

其中，E_t-1(·)代表第二特征提取模块的映射函数。

此后，将第二特征映射图f_t-1输入至第二解码器模块D_t-1，得到第二解码器模块输出的第二结果O_t-1。该过程可以表示为：

O_t-1＝D_t-1(f_t-1)；

其中，D_t-1(·)代表第二解码器模块的映射函数；O_t-1所包含的蒙板数量与当前阶段及之前的所有类别C_0：t数量一致。

如图2和图3所示，本发明实施例中提供的类别增量语义分割学习方法，包括如下完整步骤：

确定主网络模型对应的分支解码器模块；

将当前阶段的图像样本I_t输入分别输入至当前阶段的主网络模型以及前一阶段的语义分割模型，由主网络模型中的第一特征提取模块E_t输出第一特征映射图f_t，将第一特征映射图f_t输入至第一解码器模块D_t(trunk)，由第一解码器模块输出第一结果O_t(trunk)，将第一特征映射图f_t输入至分支解码器模块D_t(branch)，由分支解码器模块D_t(branc)输出第五结果O_t(bra)。

由前一阶段的语义分割模型中的第二特征提取模块E_t-1输出第二特征映射图f_t-1，将第二特征映射图f_t-1输入至第二解码器模块D_t-1，由第二解码器模块输出第二结果O_t-1。

将第一结果O_t(trunk)划分为与主网络模型学习的类别对应的第三结果O_t(new)以及与当前阶段之前的已知类别对应的第四结果O_t(old)；

基于图像样本中的类别标签以及第三结果O_t(new)，分别采用FocalLoss损失函数和DiceLoss损失函数计算主网络模型的第一增量学习损失和第二增量学习损失，基于第二结果O_t-1以及第四结果O_t(old)，采用KL散度计算主网络模型的知识蒸馏损失S_old，基于图像样本中的类别标签以及第五结果O_t(bran)，计算分支解码器模块对应的BCE损失，并通过对第一增量学习损失、第二增量学习损失知识蒸馏损失以及BCE损失的加权求和，确定目标损失S；

基于目标损失，对主网络模型的结构参数进行迭代优化，得到当前阶段的语义分割模型。

综上所述，本发明实施例中提供了一种面向类别增量的增量语义分割学习方法，解决了在开放环境下模型将不断获取新数据，需要具备对新类别图像的语义分割能力情况下，传统方法每次使用所有数据对模型进行重新训练，造成存储成本与计算成本高昂的问题。在增量学习过程中的每个阶段，模型仅需使用当前阶段所需学习类别对应的数据和相应标签，以及前一阶段训练所得到的语义分割模型作为指导模型进行训练即可在所有已知类别图像上进行语义分割。

实现本发明实施例中提供的面向类别增量的增量语义分割学习方法，其主要思路是：使用二分类约束对增量学习过程中保持前阶段所学习旧知识和学习现阶段新知识两个目标进行解耦，从而使对旧类相关输出在KL散度下进行的知识蒸馏和对新类相关输出在FocalLoss和DiceLoss约束下使用GT进行有监督学习这两个过程可以独立进行。同时给主网络模型添加分支解码器模块并使其产生与增量学习过程中的当前阶段所要学习的类别数目一致的蒙板作为输出，并使用BCE损失对其进行约束。通过以上方法实现新知识与旧知识在模型中更好地共存，从而最终在所有已知类别上获得更好的语义分割效果。

为了详细说明本发明的具体实施方式及验证发明的有效性，将本发明提供的面向类别增量的增量语义分割学习方法应用于公开语义分割数据集ADE。对于ADE中数据，根据0-100和101-150两个类别族对数据进行划分以模拟增量学习中不同阶段的学习过程。在每个学习阶段，另一阶段相关类别的标签将被预先处理为背景类的一部分。使用ADE的val数据集在所有0到150的类别上进行语义分割测试。如表1所示，为本发明提供的面向类别增量的增量语义分割学习方法在ADE数据集的语义分割结果，评价指标为推理结果与标签的平均交并比(mIoU)：

表1不同组实验下的评价指标取值

其中，mIoU的单位为百分号(％)。可见在增量语义分割学习过程中使用二分类约束可以使新知识和旧知识在语义分割模型中更好地共存，从而使语义分割模型最终在所有已知类上达到更好的语义分割效果。在不使用分支的情况下，二分类约束训练得到的语义分割模型取得的语义分割结果较多分类约束训练得到的语义分割模型取得的语义分割结果高1.6％。

通过对表1中第2组实验和第4组实验的结果比较可以发现，通过给主网络模型添加分支解码器模块可以在特征层面使新知识和旧知识更好地在模型中共存，从而使训练得到的语义分割模型最终在所有已知类上取得更好的分割结果。其中，使用分支解码器模块的语义分割模型取得的语义分割结果较无分支解码器模块的语义分割模型取得的语义分割结果高3.2％。

通过对表1中第3组实验和第4组实验的结果比较可以发现，在增量语义分割学习过程中使用二分类约束可以使新知识和旧知识在语义分割模型中更好地共存，从而使语义分割模型最终在所有已知类上达到更好的语义分割效果。在主网络模型都使用二分类约束的情况下，用二分类约束方法训练分支解码器模块得到的语义分割模型取得的语义分割结果较用多分类约束方法训练分支解码器模块得到的语义分割模型取得的语义分割结果高1.0％。

如图4所示，在上述实施例的基础上，本发明实施例中还提供了一种语义分割方法，包括：

S21，获取目标图像；

S22，将所述目标图像输入至上述各实施例中提供的类别增量语义分割学习方法中得到的当前阶段的语义分割模型，得到所述当前阶段的语义分割模型输出的分割结果。

具体地，本发明实施例中提供的语义分割方法，其执行主体为语义分割装置，该装置可以配置于计算机内，该计算机可以为本地计算机或云计算机，本地计算机可以是电脑、平板等，此处不作具体限定。

首先执行步骤S21，获取目标图像，该目标图像是指需要对其进行语义分割确定其中各像素点的类别的图像。该目标图像可以是彩色图像，也可以是灰度图像，此处不作具体限定。

然后执行步骤S22，将目标图像输入至上述各实施例中提供的类别增量语义分割学习方法中得到的当前阶段的语义分割模型，通过当前阶段的语义分割模型对目标图像进行语义分割，得到对应的分割结果。由于采用了上述各实施例中提供的当前阶段的语义分割模型，可以使最终得到的分割结果更加准确可靠。

如图5所示，在上述实施例的基础上，本发明实施例中还提供了一种类别增量语义分割学习装置，该装置包括：

初始分割模块51，由于将当前阶段的图像样本分别输入至当前阶段的主网络模型以及所述当前阶段的前一阶段的语义分割模型，得到所述主网络模型输出的第一结果以及所述前一阶段的语义分割模型输出的第二结果；

结果划分模块52，由于将所述第一结果划分为与所述主网络模型学习的类别对应的第三结果以及与所述当前阶段之前的已知类别对应的第四结果；

损失计算模块53，由于基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，基于所述第二结果以及所述第四结果，计算所述主网络模型的知识蒸馏损失，并基于所述增量学习损失以及所述知识蒸馏损失，确定目标损失；

迭代优化模块54，由于基于所述目标损失，对所述主网络模型的结构参数进行迭代优化，得到所述当前阶段的语义分割模型。

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习装置，还包括BCE损失计算模块，用于：

相应的，损失计算模块，具体用于：

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习装置，损失计算模块，还具体用于：

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习装置，语义分割模块，具体用于：

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习装置，语义分割模块，还具体用于：

在上述实施例的基础上，本发明实施例中提供的类别增量语义分割学习装置，所述第一结果中的蒙版数量与所述当前阶段及之前的所有类别数量相同；所述第二结果中的蒙版数量与所述当前阶段之前的已知类别数量相同。

具体地，本发明实施例中提供的类别增量语义分割学习装置中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的，实现的效果也是一致的，具体参见上述实施例，本发明实施例中对此不再赘述。

如图6所示，在上述实施例的基础上，本发明实施例中还提供了一种语义分割装置，包括：

图像获取模块61，用于获取目标图像；

语义分割模块62，用于将所述目标图像输入至上述各实施例中提供的类别增量语义分割学习方法中得到的当前阶段的语义分割模型，得到所述当前阶段的语义分割模型输出的分割结果。

具体地，本发明实施例中提供的语义分割装置中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的，实现的效果也是一致的，具体参见上述实施例，本发明实施例中对此不再赘述。

图7示例了一种电子设备的实体结构示意图，如图7所示，该电子设备可以包括：处理器(Processor)710、通信接口(Communications Interface)720、存储器(Memory)730和通信总线740，其中，处理器710，通信接口720，存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令，以执行上述各实施例中提供的类别增量语义分割学习方法，或语义分割方法。

此外，上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各实施例中提供的类别增量语义分割学习方法，或语义分割方法。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例中提供的类别增量语义分割学习方法，或语义分割方法。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种类别增量语义分割学习方法，其特征在于，包括：

2.根据权利要求1所述的类别增量语义分割学习方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的类别增量语义分割学习方法，其特征在于，基于所述图像样本中的类别标签以及所述第三结果，采用二分类约束方法计算所述主网络模型的增量学习损失，包括：

4.根据权利要求2所述的类别增量语义分割学习方法，其特征在于，将所述当前阶段的图像样本输入至所述主网络模型，得到所述第一结果，包括：

5.根据权利要求1-4中任一项所述的类别增量语义分割学习方法，其特征在于，将所述当前阶段的图像样本输入至所述前一阶段的语义分割模型，得到所述第二结果，包括：

6.根据权利要求1-4中任一项所述的类别增量语义分割学习方法，其特征在于，所述第一结果中的蒙版数量与所述当前阶段及之前的所有类别数量相同；所述第二结果中的蒙版数量与所述当前阶段之前的已知类别数量相同。

7.一种语义分割方法，其特征在于，包括：

获取目标图像；

将所述目标图像输入至如权利要求1-6中任一项所述的类别增量语义分割学习方法中得到的当前阶段的语义分割模型，得到所述当前阶段的语义分割模型输出的分割结果。

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的类别增量语义分割学习方法，或如权利要求7所述的语义分割方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的类别增量语义分割学习方法，或如权利要求7所述的语义分割方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的类别增量语义分割学习方法，或如权利要求7所述的语义分割方法。