WO2023273026A1

WO2023273026A1 - 语义分割方法、装置、电子设备和计算机可读存储介质

Info

Publication number: WO2023273026A1
Application number: PCT/CN2021/125073
Authority: WO
Inventors: 纪德益; 王浩然
Original assignee: 上海商汤智能科技有限公司
Priority date: 2021-06-29
Filing date: 2021-10-20
Publication date: 2023-01-05
Also published as: CN113470057A; CN113470057B

Abstract

本公开实施例提供了一种语义分割方法、装置、电子设备和计算机可读存储介质，所述方法包括：获取待处理图像；采用语义分割模型，对待处理图像进行语义分割处理，得到待处理图像的语义分割结果；其中，语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；第一中间特征和第二中间特征包括以下至少一组：第一纹理特征和第二纹理特征；第一语义特征和第二语义特征；第一变换特征和第二变换特征包括以下至少一组：第一轮廓特征和第二轮廓特征；第一增强特征和第二增强特征。

Description

语义分割方法、装置、电子设备和计算机可读存储介质

相关申请的交叉引用

本公开基于申请号为202110725811.8、申请日为2021年06月29日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本公开作为参考。

技术领域

本公开涉及图像处理技术，尤其涉及一种语义分割方法、装置、电子设备和计算机可读存储介质。

背景技术

随着语义分割技术的发展，知识蒸馏被引入语义分割技术；知识蒸馏可以将复杂模型学到的知识转移到简单模型中，从而在实际应用中，可以方便的采用简单模型进行语义分割；然而，在进行知识转移的过程中，通常采用复杂模型的语义分割的结果作为基于响应的知识来指导简单模型进行学习，如此，转移到简单模型的知识不够丰富，导致学习完成的简单模型的语义分割的精度低。

发明内容

本公开实施例提供一种语义分割方法、装置、电子设备和计算机可读存储介质，提高了语义分割的精度。

本公开的技术方案是这样实现的：

本公开实施例提供一种语义分割方法，包括：

获取待处理图像；

采用语义分割模型，对所述待处理图像进行语义分割处理，得到所述待处理图像的语义分割结果；其中，

所述语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；

所述第一中间特征和所述第二中间特征包括以下至少一组：

第一纹理特征和第二纹理特征；

第一语义特征和第二语义特征；

所述第一变换特征和所述第二变换特征包括以下至少一组：

第一轮廓特征和第二轮廓特征；

第一增强特征和第二增强特征。

上述方法中，所述参考语义模型为预先训练的语义分割网络；所述待训练的语义分割模型为与所述参考语义模型功能一致的网络；所述方法还包括：

采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征；

对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征；

至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定的出所述语义分割模型。

上述方法中，所述采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征，包括：采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到第一纹理特征和第二纹理特征；对所述第一纹理特征和第二纹理特征进行特征提取，得到第一语义特征和第二语义特征。

上述方法中，所述对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征，包括以下至少一个：

对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；

对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

上述方法中，所述至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型，包括：基于预设第一损失函数、所述第一轮廓特征和所述第二轮廓特征进行损失计算，确定第一损失；基于预设第二损失函数、所述第一增强特征和所述第二增强特征，确定第二损失；基于所述第一损失和所述第二损失中的至少一个对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

上述方法中，所述至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型，包括：对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征；基于预设第三损失函数、所述第一语义分割特征和所述第二语义分割特征进行损失计算，确定第三损失；基于所述第三损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失中的至少一个，以及所述第三损失，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

上述方法中，所述第一纹理特征包括：至少一个第一子纹理特征；所述第二纹理特征包括：至少一个第二子纹理特征；所述对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征之后，所述方法还包括：基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系；基于所述第二语义分割特征、第二语义特征、所述至少一个第二子纹理特征，确定第二图推理关系；基于预设第四损失函数、所述第一图推理关系和所述第二图推理关系进行损失计算，确定第四损失；基于所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失、第三损失中的至少一个，以及所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

上述方法中，所述基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系，包括：

基于输出顺序，确定所述第一语义分割特征、所述第一语义特征、所述至少一个第一子纹理特征之间的至少两个差异特征；

对所述至少两个差异特征，进行相关处理，得到差异特征之间的相关度；

基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系。

上述方法中，所述基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系，包括：

在所述差异特征之间的相关度中存在小于等于预设关联阈值的目标差异之间的关联特征情况下，基于所述目标差异之间的关联特征和所述至少两个差异特征，构成所述第一图推理关系。

上述方法中，所述对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征，包括：

基于隔行扫描因子，对所述第一纹理特征和所述第二纹理特征均进行滤波处理后，得到各自的高通子带和低通子带；

对所述高通子带进行方向滤波，得到方向子带；

分别对所述第一纹理特征和所述第二纹理特征对应的所述低通子带和所述方向子带进行融合，得到所述第一轮廓特征和所述第二轮廓特征，完成轮廓分解处理。

上述方法中，所述对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征，包括：

对所述第一语义特征和所述第二语义特征均进行至少两种转换，得到各自对应的至少两种语义变换特征；

对所述至少两种语义变换特征中不同的语义变换特征进行自增强处理，得到相关矩阵；

将所述相关矩阵与所述至少两种语义变换特征中的一个语义变换特征进行增强处理，得到自增强特征；

基于所述第一语义特征和所述第二语义特征各自对应的自增强矩阵，将各自的自增强特征确定为所述第一增强特征和所述第二增强特征；或者，将所述第一语义特征和所述第二语义特征，分别与各自的自增强特征进行融合，得到所述第一增强特征和所述第二增强特征。

本公开实施例提供一种语义分割装置，包括：

特征获取部分，被被配置为获取待处理图像；

语义分割部分，被配置为采用所述语义分割模型，对所述待处理图像进行语义分割处理，得到所述待处理图像的语义分割结果；所述语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；

所述第一中间特征和所述第二中间特征包括以下至少一组：

第一纹理特征和第二纹理特征；

第一语义特征和第二语义特征；

所述第一变换特征和所述第二变换特征包括以下至少一组：

第一轮廓特征和第二轮廓特征；

第一增强特征和第二增强特征。

在一些实施例中，语义分割装置还包括：

特征提取部分，被配置为采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征；所述参考语义模型为预先训练的语义分割网络；所述待训练的语义分割模型为与所述参考语义模型功能一致的网络；

特征处理部分，被配置为对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征；

训练部分，被配置为至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述特征提取部分，还被配置为采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到第一纹理特征和第二纹理特征；对所述第一纹理特征和第二纹理特征进行特征提取，得到第一语义特征和第二语义特征。

在一些实施例中，所述特征处理部分，还被配置为对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；或者，对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

在一些实施例中，所述特征处理部分，还被配置为对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；以及对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

在一些实施例中，所述训练部分，还被配置为基于预设第一损失函数、所述第一轮廓特征和所述第二轮廓特征进行损失计算，确定第一损失；基于预设第二损失函数、所述第一增强特征和所述第二增强特征，确定第二损失；基于所述第一损失和所述第二损失中的至少一个对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述训练部分，还被配置为对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征；基于预设第三损失函数、所述第一语义分割特征和所述第二语义分割特征进行损失计算，确定第三损失；基于所述第三损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失中的至少一个，以及所述第三损失，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述第一纹理特征包括：至少一个第一子纹理特征；所述第二纹理特征包括：至少一个第二子纹理特征；所述训练部分，还被配置为对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征之后，基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系；基于所述第二语义分割特征、第二语义特征、所述至少一个第二子纹理特征，确定第二图推理关系；基于预设第四损失函数、所述第一图推理关系和所述第二图推理关系进行损失计算，确定第四损失；基于所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失、第三损失中的至少一个，以及所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述训练部分，还被配置为基于输出顺序，确定所述第一语义分割特征、所述第一语义特征、所述至少一个第一子纹理特征之间的至少两个差异特征；对所述至少两个差异特征，进行相关处理，得到差异特征之间的相关度；基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系。

在一些实施例中，所述训练部分，还被配置为在所述差异特征之间的相关度中存在小于等于预设关联阈值的目标差异之间的关联特征情况下，基于所述目标差异之间的关联特征和所述至少两个差异特征，构成所述第一图推理关系。

在一些实施例中，所述特征处理部分，还被配置为基于隔行扫描因子，对所述第一纹理特征和所述第二纹理特征均进行滤波处理后，得到各自的高通子带和低通子带；对所述高通子带进行方向滤波，得到方向子带；分别对所述第一纹理特征和所述第二纹理特征对应的所述低通子带和所述方向子带进行融合，得到所述第一轮廓特征和所述第二轮廓特征，完成轮廓分解处理。

在一些实施例中，所述特征处理部分，还被配置为对所述第一语义特征和所述第二语义特征均进行至少两种转换，得到各自对应的至少两种语义变换特征；对所述至少两种语义变换特征中不同的语义变换特征进行自增强处理，得到相关矩阵；将所述相关矩阵与所述至少两种语义变换特征中的一个语义变换特征进行增强处理，得到自增强特征；基于所述第一语义特征和所述第二语义特征各自对应的自增强矩阵，将各自的自增强特征确定为所述第一增强特征和所述第二增强特征；或者，将所述第一语义特征和所述第二语义特征，分别与各自的自增强特征进行融合，得到所述第一增强特征和所述第二增强特征。

本公开实施例提供一种电子设备，包括：

存储器，被配置为存储计算机程序；

处理器，被配置为执行所述存储器中存储的计算机程序时，实现上述语义分割方法。

本公开实施例提供一种计算机可读存储介质，存储有计算机程序，被配置为被处理器执行时，实现上述语义分割方法。

本公开实施例提供一种计算机程序，所述计算机程序产品包括计算机程序或指令，在所述计算机程序或指令在计算机上运行的情况下，所述计算机执行上述语义分割方法。

本公开实施例具有以下有益效果：

本公开实施例提供了一种语义分割方法、装置、电子设备和计算机可读存储介质；语义分割装置可以将参考语义模型在进行语义分割的过程中得到的基于多个特征的知识迁移到语义分割模型中；使语义分割模型学习到更加丰富的知识，从而提高了在使用语义分割模型对待处理图像进行语义分割时的语义分割精度。

附图说明

图1a是本公开实施例提供的一种可选的语义分割方法流程示意图；

图1b是本公开实施例提供的一种可选的语义分割模型的训练流程示意图；

图2为本公开实施例提供的一种可选的语义分割过程示意图；

图3为本公开实施例提供的一种可选的轮廓分解的方法示意图；

图4为本公开实施例提供的一种可选的低通滤波的方法示意图；

图5a为本公开实施例提供的一种可选的增强处理示意图；

图5b为本公开实施例提供的一种可选的增强处理示意图；

图6为本公开实施例提供的一种可选的纹理知识学习的效果示意图；

图7为本公开实施例提供的一种语义分割方法示意图；

图8为本公开实施例提供的一种可选的学生网络的语义分割结果示意图；

图9为本公开实施例提供的一种语义分割装置的组成结构示意图；

图10为本公开实施例提供的一种电子设备的组成结构示意图。

具体实施方式

为了使本公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用于解释本公开，并不用于限定本公开。

以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处所提供的实施例仅仅用以解释本公开，并不用于限定本公开。另外，以下所提供的实施例是用于实施本公开的部分实施例，而非提供实施本公开的全部实施例，在不冲突的情况下，本公开实施例记载的技术方案可以任意组合的方式实施。

需要说明的是，在本公开实施例中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素，而且还包括没有明确列出的其他要素，或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元，例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，U和/或W，可以表示：单独存在U，同时存在U和W，单独存在W这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括U、W、V中的至少一种，可以表示包括从U、W和V构成的集合中选择的任意一个或多个元素。

例如，本公开实施例提供的展示方法包含了一系列的步骤，但是本公开实施例提供的展示方法不限于所记载的步骤，同样地，本公开实施例提供的展示装置包括了一系列部分，但是本公开实施例提供的展示装置不限于包括所明确记载的部分，还可以包括为获取相关信息、或基于信息进行处理时所需要设置的部分。

除非另有定义，本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的，不是旨在限制本公开。

对本公开实施例进行进一步详细说明之前，对本公开实施例中涉及的名词和术语进行说明，本公开实施例中涉及的名词和术语适用于如下的解释。

知识蒸馏：将复杂模型学习到的知识迁移到简单模型中去，从而使简单模型语义分割的精度趋近复杂模型；也就是说，将已训练好的复杂模型(例如参考语义模型)作为教师网络，简单模型(例如待训练的语义分割模型)作为学生网络，由教师网络指导学生网络学习知识，从而得到训练好的简单模型。其中，复杂模型结构庞大、精度高，而简单模型体量很小、精度与复杂模型存在差距。

需要说明的是，相关技术中的知识蒸馏，迁移到学生网络中的知识通常被视为基于响应的知识，通常被广泛的应用在目标检测、人体姿态估计等计算机视觉应用中。

本公开实施例提供一种语义分割方法、装置、电子设备和计算机可读存储介质，能够提高语义分割的精度。本公开实施例提供的语义分割方法应用于电子设备中，下面说明本公开实施例提供的电子设备的示例性应用。本公开实施例提供的电子设备可以实施为AR眼镜、笔记本电脑，平板电脑，台式计算机，机顶盒，移动设备(例如，移动电话，便携式音乐播放器，个人数字助理，专用消息设备，便携式游戏设备)等各种类型的用户终端，也可以实施为服务器，本公开实施例不作限制。

参见图1a，图1a是本公开实施例提供的语义分割方法的一个可选的流程示意图，将结合图1a示出的步骤进行说明。

S101、获取待处理图像；

S102、采用语义分割模型，对待处理图像进行语义分割处理，得到待处理图像的语义分割结果；其中，语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的。

第一中间特征和第二中间特征包括以下至少一组：第一纹理特征和第二纹理特征；第一语义特征和第二语义特征；第一变换特征和第二变换特征包括以下至少一组：第一轮廓特征和第二轮廓特征；第一增强特征和第二增强特征。

在本公开实施例中，语义分割装置对语义分割模型训练完成后，可以采用语义分割模型对获取的待处理图像进行语义分割，得到语义分割结果。其中，参考语义模型为预先训练的语义分割网络；待训练的语义分割模型为与参考语义模型功能一致的网络。

在本公开的一些实施例中，如图1b所示，在进行语义分割之前，需要先进行语义分割模型的确定。语义分割装置可以通过S01-S03实现训练过程，如下：

S01、采用参考语义模型和待训练的语义分割模型分别对图像样本进行特征提取，得到第一中间特征和第二中间特征；

S02、对第一中间特征和第二中间特征分别进行轮廓分解或增强处理，得到第一变换特征和第二变换特征；

S03、至少基于第一变换特征和第二变换特征，对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，参考语义模型和待训练的语义分割模型的功能一致，均用于语义分割；参考语义模型为训练成功的复杂模型，语义分割模型为简单模型，采用参考语义模型指导语义分割模型进行训练，将参考语义模型学习到的知识迁移到语义分割模型中。

在本公开实施例中，在对待训练的语义分割模型进行训练的过程中，语义分割装置采用参考语义模型和待训练的语义分割模型对图像样本分别进行特征提取，可以得到第一中间特征和第二中间特征。

需要说明的是，本公开实施例中涉及的特征可以通过特征图体现，其中，特征图可以用C×H×M的矩阵表示；H×M表示特征图的像素，C表示特征图的通道数，也就是说，特征图可以看作是C维的深层描述子。

在本公开实施例中，参考语义模型和待训练的语义分割模型均包括多个卷积层，其中，通过多个卷积层可以依次得到对应的多个中间特征；多个中间特征包括低层特征和高层特征；其中，低层特征包含纹理信息，可以作为纹理特征；高层特征包含语义信息，可以作为语义特征。

在本公开实施例中，第一中间特征可以包括：第一纹理特征和第一语义特征中的至少一种；第一纹理特征为参考语义模型提取出的低层特征，第一语义特征为参考语义模型提取出的高层特征。

在本公开实施例中，第二中间特征可以包括：第二纹理特征和第二语义特征中的至少一种；第二纹理特征为待训练的语义分割模型提取出的低层特征，第二语义特征为语义分割模型提取出的高层特征。

在本公开实施例中，在第一中间特征包括第一纹理特征的情况下，第二中间特征包括第二纹理特征；在第一中间特征包括第一语义特征的情况下，第二中间特征包括第二语义特征。

在本公开实施例中，参考语义模型和待训练的语义分割模型可以为：ResNet、ENet、ESPNet、BiSeNet、SegNet、ESPNet、RefineNet、ENet等，这里，参考语义模型和语义分割模型可以为相同的模型，也可以为不同的模型；对此，本公开实施例不作限制。

示例性的，参考图2，参考语义模型包括4个卷积层和一个解码器，通过参考语义模型对原始图像20进行语义分割，得到语义分割结果23。其中，前三个卷积层提取的特征为低层特征，如21所示，包含大量纹理信息，第4个卷积层提取的特征为高层特征，如22所示，包含语义信息。

在本公开实施例中，若第一中间特征包括第一纹理特征，第二中间特征包括第二纹理特征，则语义分割装置可以对第一中间特征进行轮廓分解，得到第一轮廓特征；以及对第二中间特征进行轮廓分解，得到第二轮廓特征；第一变换特征包括第一轮廓特征，第二变换特征包括第二轮廓特征。

在本公开实施例中，语义分割装置可以对第一纹理特征和第二纹理特征进行轮廓分解处理，将第一纹理特征分解为至少一个第一带通子带和第一低通子带，基于至少一个第一带通子带和第一低通子带，得到第一轮廓特征；以及将第二纹理特征分解为至少一个第二带通子带和第二低通子带，基于至少一个第二带通子带和第二低通子带，得到第二轮廓特征。

在本公开实施例中，语义分割装置可以对至少一个第一带通子带和第一低通子带进行融合处理，得到第一轮廓特征；语义分割装置可以对至少一个第二带通子带和第二低通子带进行融合处理，得到第二轮廓特征。

在本公开实施例中，语义分割装置可以包括低通滤波器和方向滤波器，通过低通滤波器和方向滤波器对第一纹理特征和第二纹理特征进行轮廓分解。

在本公开实施例中，语义分割装置可以通过拉普拉斯金字塔分解的方式对第一纹理特征和第二纹理特征进行至少一级分解。

在本公开实施例中，若第一中间特征包括第一语义特征，第二中间特征包括第二语义特征，则语义分割装置可以对第一中间特征进行增强处理，得到第一增强特征；以及，对第二中间特征进行增强处理，得到第二增强特征；第一变换特征包括第一增强特征，第二变换特征包括第二增强特征。

在本公开实施例中，语义分割装置可以对第一语义特征和第二语义特征进行增强处理，得到能够体现第一语义特征中像素的相关性的第一增强特征和能够体现第二语义特征中像素的相关性的第二增强特征。

在本公开的一些实施例中，语义分割装置可以预先训练一个注意力模型，通过注意力模型来实现增强处理；这里，注意力模型可以为共同注意力模型，也可以为多层次注意力模型，还可以为内在注意力模型等，对此，可以根据需要设置，本公开实施例不作限制。

在本公开的一些实施例中，语义分割装置也可以基于第一语义特征的特征矩阵，确定第一增强特征的特征矩阵；以及基于第二语义特征的特征矩阵，确定第二增强特征的特征矩阵。

在本公开实施例中，语义分割装置在得到第一中间特征和第二中间特征后，可以基于第一中间特征和第二中间特征对待训练的语义分割模型进行训练，训练成功后，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以确定第一中间特征和第二中间特征之间的特征损失；特征损失用于表征第一中间特征和第二中间特征之间的差异；语义分割装置可以根据特征损失，对待训练的语义分割模型进行训练，在特征损失小于特征损失阈值的情况下，停止训练，得到语义分割模型。

在本公开实施例中，在第一中间特征和第二中间特征包括第一轮廓特征和第二轮廓特征的情况下，特征损失包括第一损失；第一损失用于表征第一轮廓特征和第二轮廓特征之间的差异；在第一中间特征和第二中间特征包括第一语义特征和第二语义特征的情况下，特征损失包括第二损失；第二损失用于表征第一增强特征和第二增强特征之间的差异。

在本公开实施例中，特征之间的差异可以用向量距离来表征；这里，向量距离可以为余弦距离，也可以为欧式距离，对此，本公开实施例不作限制。

在本公开的一些实施例中，语义分割装置可以基于第三损失、第四损失、响应损失和训练损失中的至少一个，以及特征损失，对待训练的语义分割模型进行训练。其中，响应损失表征第一语义分割结果和第二语义分割结果之间的差异；第一语义分割结果和第二语义分割结果分别为参考语义模型和待训练的语义分割模型对图像样本进行语义分割得到的结果；第三损失表征第一语义分割特征和第二语义分割特征之间的差异；第一语义分割特征和第二语义分割特征分别为参考语义模型和待训练的语义分割模型的池化层提取的特征；池化层为在高层卷积层之后的特征提取层；第四损失用于表征第一关系特征和第二关系特征之间的损失，其中第一关系特征表征第一中间特征和第一语义分割特征中，多个特征的关系，第二关系特征表征第二中间特征和第二语义分割特征中，多个特征的关系；多个特征的关系可以通过向量相似度表征；训练损失表征第二语义分割结果与图像样本之间的差异。

在本公开的一些实施例中，语义分割装置可以分别设置响应损失阈值、第三损失阈值、第四损失阈值和训练损失阈值；如此，语义分割装置可以在第三损失、第四损失、响应损失和训练损失中的至少一个以及特征损失均小于对应的损失阈值的情况下，停止训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以对第三损失、第四损失、响应损失和训练损失中的至少一个，以及特征损失进行加权求和，得到语义损失；在语义损失小于语义损失阈值的情况下，停止训练，得到语义分割模型。

可以理解的是，语义分割装置可以提取参考语义模型的第一中间特征，以及语义分割模型的第二中间特征；对第一中间特征和第二中间特征进行轮廓分解或增强处理，得到第一变换特征和第二变换特征，第一变换特征和第二变换特征包括纹理知识和语义知识中的至少一种，如此，语义分割装置基于第一变换特征和第二变换特征对待训练的语义分割装置进行训练，得到的语义分割模型，可以学习到参考语义模型中的纹理知识和语义知识，从而提高了采用语义分割模型对待处理图像进行语义分割时的精度。

在本公开的一些实施例中，S01中采用参考语义模型和待训练的语义分割模型分别对图像样本进行特征提取，得到第一中间特征和第二中间特征的实现，可以包括：

S201、采用参考语义模型和待训练的语义分割模型分别对图像样本进行特征提取，得到第一纹理特征和第二纹理特征。

S202、对第一纹理特征和第二纹理特征进行特征提取，得到第一语义特征和第二语义特征。

在本公开实施例中，语义分割装置通过参考语义模型提取了第一纹理特征后，可以继续对第一纹理特征进行特征提取，得到第一语义特征；通过待训练的语义分割模型提取了第二纹理特征之后，可以继续对第二纹理特征进行特征提取，得到第二语义特征。

在本公开实施例中，参考语义模型和待训练的语义分割模型包括多层卷积层，多层卷积层可以得到多个中间特征，其中，第一层卷积层对图像样本进行特征提取得到第一层中间特征，第二层卷积层对第一层中间特征进行特征提取，得到第二层中间特征，以此类推，得到多个中间特征。

在本公开实施例中，多层卷积层可以包括至少一个低层卷积层和一个高层卷积层；通过至少一个低层卷积层得到的至少一个中间特征为低层特征，即第一纹理特征，通过一个高层卷积层得到的一个中间特征为高层特征，即第一语义特征。也就是说，语义分割模型在获取第一语义特征之前，需要先获取第一纹理特征。

可以理解的是，语义分割装置通过参考语义模型和待训练的语义分割模型中的多层卷积层，对图像样本进行特征提取，可以依次得到第一纹理特征和第一语义特征。

在本公开的一些实施例中，S02中对第一中间特征和第二中间特征分别进行轮廓分解或增强处理，得到第一变换特征和第二变换特征的实现，可以包括以下至少一个：对第一纹理特征和第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；对第一语义特征和第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

在本公开实施例中，在第一中间特征包括第一纹理特征的情况下，第二中间特征包括第二纹理特征；语义分割装置可以对第一纹理特征和第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征，将第一轮廓特征作为第一变换特征，第二轮廓特征作为第二变换特征；在第一中间特征包括第一语义特征的情况下，第二中间特征包括第二语义特征；语义分割装置可以对第一语义特征和第二语义特征分别进行增强处理，得到第一增强特征和第二增强特征；在第一中间特征包括第一纹理特征和第一语义特征的情况下，第二中间特征包括第二纹理特征和第二语义特征；语义分割装置可以对第一纹理特征和第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；以及对第一语义特征和第二语义特征分别进行增强处理，得到第一增强特征和第二增强特征。

在本公开实施例中，语义分割装置对第一纹理特征和第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征的实现可以包括：S301-S302。

S301、对第一纹理特征进行轮廓分解处理，得到第一轮廓特征。

在本公开实施例中，语义分割装置可以通过轮廓波分解部分(Contourlet Decomposition Module，CDM)对第一纹理特征进行轮廓分解，得到第一轮廓特征。

在本公开实施例中，轮廓波分解部分包括至少一组低通滤波器(Low-pass FIilter)和方向滤波器(Drectional Filter Bank，DFB)的组合；其中，低通滤波器用于对输入的特征进行滤波，将输入的特征分解为高通子带和低通子带；方向滤波器用于对高通子带进行方向滤波，得到方向子带；如此，每一组低通滤波器和方向滤波器的组合可以实现一次拉普拉斯金字塔分解。

在本公开的一些实施例中，基于隔行扫描因子，对第一纹理特征和第二纹理特征均进行滤波处理后，得到各自的高通子带和低通子带；对高通子带进行方向滤波，得到方向子带；分别对第一纹理特征和第二纹理特征对应的低通子带和方向子带进行融合，得到第一轮廓特征和第二轮廓特征，从而完成了轮廓分解处理。

需要说明的是，在本公开实施例中，每组LP和DFB可以进行一级轮廓分解，本公开实施例中不限制轮廓分解中的级别限制。

示例性的，在本公开实施例中，S301中对第一纹理特征进行轮廓分解处理，得到第一轮廓特征的实现，可以包括：S3011-S3012。

S3011、通过至少一级LP和DFB组合，对第一纹理特征进行至少一级轮廓分解，得到至少一个方向子带和一个低通子带。

在本公开实施例中，语义分割装置通过CDM对第一纹理特征进行至少一级分解后，可以得到至少一个方向子带和一个低通子带；其中，至少一个方向子带为对应的至少一级分解得到的方向子带，一个低通子带为最后一级分解得到的低通子带。CDM对第一纹理特征进行分解的方式，参见公式(1)。

其中，↓为采样运算符，p为隔行扫描因子；F _l,n表示第n级低通子带(特征)，即第n级分解得到的低通子带(特征)；n∈[1,m]，m为轮廓波分解部分中LP和DFB组合的组数。从公式(1)中可以看出，通过LP对下采样处理后的F _l,n进行分解，可以得到第n+1级低通子带特征F _l,n+1和第n+1级高通子带特征F _h,n+1；再通过DFB对第n+1级低通子带特征F _l,n+1进行方向滤波，可以得到第n+1级方向子带特征F _bds,n+1。

需要说明的是，第1次分解是对第一纹理特征通过LP进行分解，得到第1级低通子带特征F _l,1和第1级高通子带特征F _h,1。

在本公开实施例中，DFB包括k级二叉树，通过k级二叉树对输入的特征进行分解，得到的方向子带特征包括2 ^k个方向子带。例如，k＝3，则方向子带特征为8个：0，1，……7，其中，0-3为垂直方向特征和4-7为水平方向特征。

在本公开实施例中，第一纹理特征中的中间特征的数量和轮廓分解部分中CDM的数量相同；也就是说，第一纹理特征中的每个中间特征需要使用一个CDM。

示例性的，参考图3，CDM包括2组低通滤波器LP和方向滤波器DFB的组合，第1组包括LP ₁和DFB ₁，第2组包括LP ₂和DFB ₂；将纹理特征F输入CDM后，可以得到一个低通子带F _l,2，两个方向子带F _bds,1和F _bds,2。其中，通过LP ₁对纹理特征F进行低通滤波后，可以得到第1级高通子带F _h,1和第1级低通子带F _l,1；通过DFB ₁对第1级高通子带F _h,1进行方向滤波，得到第1级方向子带F _bds,1；按照(2,2)对第1级低通子带F _l,1进行下采样，得到下采样后的第1级低通子带F _l,1-J的长和宽均为第1级低通子带F _l,1的1/2。通过LP ₂对下采样后的第1级低通子带F _l,1-J进行低通滤波，得到第2级高通子带F _h,2和第2级低通子带F _l,2；通过DFB ₂对第2级高通子带F _h,2进行方向滤波，得到第2级方向子带F _bds,2。DFB ₁包括4级二叉树，F _bds,1包括16个方向子带；DFB ₂包括3级二叉树，F _bds,1包括8个方向子带。

需要说明的是，语义分割装置通过LP对第n级低通子带进行分解实现，可以包括：通过低通分析滤波器对第n级低通子带进行低通分析滤波，得到第n+1级低通结果；之后，对第n+1级低通结果进行下采样，得到第n+1级低通子带；再对第n+1级低通子带进行上采样，将上采样后的第n+1级低通子带通过合成滤波器，得到第n+1级低通结果，基于第n级低通子带和第n+1级低通结果，得到第n+1级高通子带。

在本公开的一些实施例中，语义分割装置可以利用第n级低通子带减去第n+1级低通结果，得到第n+1级高通子带。

在本公开实施例中，语义分割装置可以按照元素，对第n级低通子带和第n+1级低通结果求差值，得到第n+1级高通子带。

示例性的，参考图4，低通滤波器包括低通分析滤波器41、下采样部分42、上采样部分43、合成滤波器44和减法部分45；其中，将第n级低通子带F _l,n输入低通分析滤波器41，可以得到第n+1级低通结果F _l-n+1；通过下采样部分42对第n+1级低通结果进行下采样处理后，得到下采样后的第n+1级低通结果F _l,n+1，作为第n+1级低通子带；通过上采样部分43对下采样后的第n+1级低通结果进行上采样，得到第n+1级低通结果F _l-n+1；将第n+1级低通结果F _l-n+1输入到合成滤波器44中，得到合成滤波后的第n+1级低通结果F _l-n+1，最后，通过减法部分45，将第n级低通子带F _l,n减去合成滤波后的第n+1级低通结果F _l-n+1，可以得到第n+1级高通子带F _h,n+1。

S3012、将至少一个方向子带和一个低通子带进行特征融合，得到第一轮廓特征。

在本公开实施例中，语义分割装置对第一纹理特征进行至少一次分解后，可以得到至少一级方向子带和最后一级低通子带；其中，至少一级方向子带和最后一级低通子带的特征维度不同，需要语义分割装置通过池化层将至少一级方向子带和最后一级低通子带的维度变换一致，得到至少一个变换方向子带和最后一级变换低通子带，再对至少一个变换方向子带和最后一级变换低通子带进行第一融合处理，得到第一轮廓特征F ^te

这里，第一融合处理可以包括：对至少一个变换方向子带和最后一级变换低通子带进行相加，或者，对至少一个变换方向子带和最后一级变换低通子带进行拼接等，对此，本公开实施例不作限制。

需要说明的是，CDM分解的级数越大，提取的第一轮廓特征越丰富，训练后的学生网络达到的精度也越高，但计算量越高。这里，CDM分解的级数可以根据需要设置。

S302、对第二纹理特征进行轮廓分解处理，得到第二轮廓特征。

在本公开实施例中，语义分割装置对第二纹理特征进行轮廓分解处理的方式，与S301中对第一纹理特征进行轮廓波分解处理的方式相同，详见S301中的说明，在此，不再赘述。

在本公开实施例中，语义分割装置对第一语义特征和第二语义特征进行增强处理，得到第一增强特征和第二增强特征的方式，可以包括：S401-S402。

S401、对第一语义特征进行增强处理，得到第一增强特征。

在本公开实施例中，语义分割装置在得到第一语义特征之后，可以通过语义注意力部分(Semantic Attention Module，SAM)对第一语义特征进行增强处理，得到第一增强特征。

在本公开实施例中，对第一语义特征和第二语义特征进行增强处理，得到第一增强特征和第二增强特征的实现过程可以包括：对第一语义特征和第二语义特征均进行至少两种转换，得到各自对应的至少两种语义变换特征；对至少两种语义变换特征中不同的语义变换特征进行自增强处理，得到相关矩阵；将相关矩阵与至少两种语义变换特征中的一个语义变换特征进行增强处理，得到自增强特征；基于第一语义特征和第二语义特征各自对应的自增强矩阵，将各自的自增强特征确定为第一增强特征和第二增强特征；或者，将第一语义特征和第二语义特征，分别与各自的自增强特征进行融合，得到第一增强特征和第二增强特征。

示例性的，以至少两种语义变换特征为三种为例进行说明。在本公开实施例中，S401中对第一语义特征进行增强处理，得到第一增强特征的实现，可以包括：S4011-S4014。

S4011、将第一语义特征进行三种转换，得到第一语义变换特征、第二语义变换特征和第三语义变换特征。

在本公开实施例中，语义分割装置可以将第一语义特征分别进行第一变换、第二变换和第三变换，得到第一语义变换特征、第二语义变换特征、第三语义变换特征；其中，第一语义变换特征包括的向量的数目等于通道数C；第二语义变换特征包括的向量的数目等于像素数(H×M)。

在本公开的一些实施例中，第一语义变换特征和第二语义变换特征互为转置矩阵。

在本公开的一些实施例中，第一语义变换特征和第三语义变换特征是相同的矩阵特征。

S4012、将第一语义变换特征和第二语义变换特征进行矩阵相乘，得到相关特征；相关特征的矩阵中的元素用于表征像素的相关性系数。

在本公开实施例中，通过矩阵乘法对第一语义变换特征和第二语义变换矩特征相乘，得到的矩阵为相关特征；相关特征的矩阵中的元素可以表征像素之间的相关性；相关性越大，元素值越大；相关性越小，元素值越小。

S4013、将相关特征和第三语义变换特征相乘，得到自增强特征。

在本公开实施例中，相关特征和第三语义变换特征相乘后，得到的矩阵为自增强特征；即通过相关特征对第三语义变换特征进行增强，使自增强矩阵中包含像素的相关性。

S4014、基于自增强特征，确定第一增强特征。

在本公开实施例中，语义分割装置在得到自增强特征之后，可以根据自增强特征确定第一增强特征。

在本公开的一些实施例中，语义分割装置可以将自增强特征作为第一增强矩阵。

示例性的，基于图5a，第一语义特征矩阵为H×W×C矩阵MF，对第一语义特征矩阵进行3类变换后，可以得到C×(H×W)的第一语义变换矩阵MF1；(H×W)×C的第二语义变换矩阵MF2和第三语义变换矩阵MF3；如此，第一语义变换矩阵MF1和第二语义变换矩阵MF2相乘可以得到C×C的相关矩阵MFC，相关矩阵MFC与第三语义变换矩阵MF3相乘后，得到H×W×C的自增强矩阵MFp1；如此，自增强矩阵MFp1包含了元素之间相关关系，语义分割装置可以将MFp1作为第一增强特征矩阵。

在本公开的一些实施例中，语义分割装置可以将自增强特征和第一语义特征进行第二融合处理，得到第一增强特征。

在本公开实施例中，第二融合处理可以包括：对自增强特征和第一语义特征进行矩阵相加，或者，对自增强特征和第一语义特征进行加权相加；加权的权值可以根据需要设置，对此，本公开实施例不作限制。

示例性的，基于图5a，参考图5b，在得到H×W×C的自增强矩阵MFp1后，语义分割装置将自增强矩阵按照权值γ进行加权后，与第一语义特征矩阵MF按照元素相加进行处理，得到第一增强特征矩阵MFp2。

S402、对第二语义特征进行增强处理，得到第二增强特征。

在本公开实施例中，语义分割装置对第二语义特征进行增强处理的方式，与S401中对第一语义特征进行增强处理的方式和原理相同，详见S401中的说明，在此，不再赘述。

在本公开的一些实施例中，S03中至少基于第一变换特征和第二变换特征，对待训练的语义分割模型进行训练，确定出语义分割模型的实现，可以包括：S501-S503。

S501、基于预设第一损失函数、第一轮廓特征和第二轮廓特征进行损失计算，确定第一损失；

在本公开实施例中，预设第一损失函数可以为均方差均值函数，语义分割装置可以对第一轮廓特征和第二轮廓特征，计算第一方差均值，将第一方差均值作为第一损失；通过第一损失表征第一轮廓特征和第二轮廓特征的差异。参考公式(2)

其中，L _te(S)表示第一损失；F _i ^te；T表示第一轮廓特征中第i个元素的轮廓特征，F _i ^te；S表示第二轮廓特征中第i个像素对应的轮廓特征，i∈R＝H×W。

在本公开实施例中，语义分割装置可以对第一轮廓特征中第i个像素对应的轮廓特征与第二轮廓特征中的第i个像素对应的轮廓特征计算方差，得到R个第一方差；在对R个第一方差求和，得到第一方差和之后，将第一方差和除以像素总数，得到第一方差均值。

S502、基于预设第二损失函数、第一增强特征和第二增强特征，确定第二损失；

在本公开实施例中，预设第二损失函数可以为均方差函数，语义分割装置可以对第一增强特征和第二增强特征，计算第二方差均值，将第二方差均值作为第二损失；通过第二损失表征第一增强特征和第二增强特征的差异。参考公式(3)。

其中，L _se(S)表示第二损失；F _i ^se；T表示第一语义特征中第i个元素的语义特征，F _i ^se；S表示第二语义特征中第i个元素的语义特征，i∈R＝H×W。

在本公开实施例中，语义分割装置可以对第一语义特征中第i个像素对应的语义特征与第二语义特征中的第i个像素对应的语义特征计算方差，得到R个第二方差；在对R个第二方差求和，得到第二方差和之后，将第二方差和除以像素总数，得到第二方差均值。

S503、基于第一损失和第二损失中的至少一个，对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置在确定第一损失和第二损失后，可以根据第一损失和第二损失中的至少一个对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开的一些实施例中，语义分割装置可以根据第一损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置可以在第一损失小于第一损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以根据第二损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置可以在第二损失小于第二损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以根据第一损失和第二损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置可以在第一损失小于第一损失阈值，且第二损失小于第二损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；也可以对第一损失和第二损失进行加权求和，得到第一语义损失，在第一语义损失小于第一语义损失阈值的情况下，确定出语义分割模型。

参考图6，a为两张待处理图像，b为没有学习纹理知识的语义分割模型对两张待处理图像进行特征提取后，得到的特征图；c为学习了纹理知识的语义分割模型对两张待处理图像进行特征提取，得到的特征图。从图6中可以看出，语义分割模型在学习了纹理知识之后，特征图中包含丰富的纹理知识，轮廓更加清晰。

在本公开的一些实施例中，S03中至少基于第一变换特征和第二变换特征，对待训练的语义分割模型进行训练，确定出语义分割模型的实现，还可以包括：S601-S603。

S601、对第一增强特征和第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征；

在本公开实施例中，参考语义模型和待训练的语义分割模型中包括池化层，池化层在最后一层卷积层之后；参考语义模型在得到第一增强特征之后，可以通过池化层对第一增强特征进行语义分割预测，得到第一语义分割特征；待训练的语义分割模型在得到第二增强特征之后，可以对第二增强特征进行语义分割预测，得到第二语义分割特征。

S602、基于预设第三损失函数、第一语义分割特征和第二语义分割特征进行损失计算，确定第三损失；

在本公开实施例中，预设第三损失函数可以为均方差函数，语义分割装置可以对第一语义分割特征和第二语义分割特征，计算第三方差均值，将第三方差均值作为第三损失；通过第三损失表征第一语义分割特征和第二语义分割特征的差异。

示例性的，可以参考公式(4)。

其中，L _see(S)表示第三损失；F _i ^see；T表示第一语义分割特征中第i个像素对应的语义分割特征，F _i ^see；S表示第二语义分割特征中第i个像素对应的语义分割特征，i∈R＝H×W。

在本公开实施例中，语义分割装置可以对第一语义分割特征中第i个元素的语义特征与第二语义分割特征中的第i个像素对应的语义分割特征计算方差，得到R个第三方差；在对R个第三方差求和，得到第三方差和之后，将第三方差和除以像素总数，得到第三方差均值。

S603、基于第三损失对待训练的语义分割模型进行训练，确定出语义分割模型；或者，基于第一损失、第二损失中的至少一个，以及第三损失，对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开的一些实施例中，语义分割装置在确定第三损失后，可以根据第三损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置可以在第三损失小于第三损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开实施例中，语义分割装置可以在第一损失小于第一损失阈值，且第三损失小于第三损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；也可以对第一损失和第三损失进行加权求和，得到第二语义损失，在第二语义损失小于第二语义损失阈值的情况下，确定出语义分割模型。

在本公开实施例中，语义分割装置可以在第二损失小于第一损失阈值，且第三损失小于第三损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；也可以对第二损失和第三损失进行加权求和，得到第三语义损失，在第三语义损失小于第三语义损失阈值的情况下，确定出语义分割模型。

在本公开的一些实施例中，第一纹理特征包括：至少一个第一子纹理特征；第二纹理特征包括：至少一个第二子纹理特征；S601中对第一增强特征和第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征之后的实现，还可以包括：S701-S704。

S701、基于第一语义分割特征、第一语义特征、至少一个第一子纹理特征，确定第一图推理关系。

在本公开实施例中，语义分割装置得到第一语义分割特征、第一语义特征、和至少一个第一子纹理特征后，可以基于第一语义分割特征、第一语义特征、至少一个第一子纹理特征进行第一图推理，得到第一图推理关系。

在本公开的一些实施例中，基于第一语义分割特征、第一语义特征、至少一个第一子纹理特征，确定第一图推理关系，包括：基于输出顺序，确定第一语义分割特征、第一语义特征、至少一个第一子纹理特征之间的至少两个差异特征；对至少两个差异特征，进行相关处理，得到差异特征之间的相关度；基于至少两个差异特征和差异特征之间的相关度，构成第一图推理关系。

在本公开实施例中，至少一个第一子纹理特征对应参考语义模型中的至少一个低层卷积层得到的至少一个中间特征；语义分割装置可以将第一语义分割特征、第一语义特征、至少一个第一子纹理特征，按照卷积层和池化层从后到前的顺序(即特征的输出顺序，从后往前)，确定相邻两层之间的特征变化情况，得到多个第一关系特征(即至少两个差异特征)。

在本公开实施例中，语义分割装置在确定多个第一关系特征之后，可以将多个第一关系特征作为多个第一节点、按照多个第一关系特征之间的相关性(即相关度)，对多个第一节点进行连边，构造第一关系图G ^T，参考公式(5)；通过第一关系图表征第一图推理关系。

G ^T＝(ν ^T,ε ^T)＝(F _i ^va,T,A _ij ^T) 公式(5)

其中，G ^T表示第一关系图；ν ^T表示第一关系图中的节点，ε ^T表示第一关系图总中的连边；F _i ^va,T表示N个第一关系特征中的第i个，A _ij ^T表示F _i ^va,T和F _j ^va,T之间的连边；N表示第一关系特征的数量；i,j∈[1,N-1]，且，i≠j。

在本公开实施例中，F _i ^va,T可以通过参考语义模型中第i+1层特征

和第i层特征F _i ^T的之间的相似度表征，参考公式(6)。

在本公开的一些实施例中，基于至少两个差异特征和差异特征之间的相关度，构成第一图推理关系，在每个特征边都可以连边的情况下，示例性的，A _ij可以通过公式(7-1)得到：

其中，f _si表示向量之间的相似度。

在本公开的一些实施例中，在差异特征之间的相关度中存在小于等于预设关联阈值的目标差异之间的关联特征情况下，基于目标差异之间的关联特征和至少两个差异特征，构成第一图推理关系。也即是说，在满足条件的情况下，才会有部分特征的边可以连的情况下，示例性的，A _ij可以通过公式(7-2)得到：

其中，f _si表示向量之间的相似度，

为指示函数，μ为相似度阈值。

从公式(7)中可以看出，语义分割装置可以对相似度高的节点之间进行连边；在μ＝0的情况下，任意两个节点之间均可进行连边。

S702、基于第二语义分割特征、第二语义特征、至少一个第二子纹理特征，确定第二图推理关系。

在本公开实施例中，语义分割装置得到第二语义分割特征、第二语义特征、和至少一个第二子纹理特征后，可以基于第二语义分割特征、第二语义特征、至少一个第二子纹理特征进行第二图推理，得到第二图推理关系。

在本公开实施例中，至少一个第二子纹理特征对应待训练的语义分割模型中的至少一个低层卷积层得到的至少一个中间特征；语义分割装置可以将第二语义分割特征、第二语义特征、至少一个第二子纹理特征，按照卷积层和池化层从后到前的顺序，确定相邻两层之间的特征变化情况，得到多个第二关系特征。

在本公开实施例中，语义分割装置在确定多个第二关系特征之后，可以将多个第二关系特征作为多个第二节点、按照第一关系图中的连边方式进行连边，构造第二关系图G ^S，参考公式(5)；通过第二关系图表征第二图推理关系。

S703、基于预设第四损失函数、第一图推理关系和第二图推理关系进行损失计算，确定第四损失。

在本公开实施例中，第一图推理关系包括节点和连边；第二图推理关系也包括节点和连边；预设第四损失函数用于表征第一关系图和第二关系图之间的向量距离，作为第四损失，通过第四损失表征第一关系图和第二关系图之间的差异，参见公式(8)。

L _va(S)＝Dist(G ^T,G ^S) 公式(8)

其中，L _va(S)表示第四损失，G ^T表示第一关系图，G ^S表示第二关系图。Dist表示向量距离。

在本公开实施例中，第一关系图G ^T中包括第一节点ν ^T和第一连边ε ^T；第二关系图G ^S中包括第二节点ν ^S和第二连边ε ^S；如此，语义分割装置可以先确定第一节点ν ^T和第二节点ν ^S之间的节点向量距离，以及第一连边ε ^T和第二连边ε ^S之间的连边向量距离，再对节点向量距离和连边向量距离进行加权求和，得到第四损失，参考公式(9)。

L _va(S)＝Dist(ν ^T,ν ^S)+λDist(ε ^T,ε ^S) 公式(9)

其中，λ为加权的权值，可以根据需要设置，本公开实施例不作限制。

在本公开实施例中，公式(9)还可以表示为公式(10)：

S704、基于第四损失对待训练的语义分割模型进行训练，确定出语义分割模型；或者，基于第一损失、第二损失、第三损失中的至少一个，以及第四损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开实施例中，语义分割装置在确定第四损失后，可以根据第四损失对待训练的语义分割模型进行训练，确定出语义分割模型。

在本公开的一些实施例中，语义分割装置可以在第四损失小于第四损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以在第四损失小于第四损失阈值，且第一损失小于第一损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；或者，对第四损失和第一损失进行加权求和，得到第四语义损失，在第四语义损失小于第四语义损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以在第四损失小于第四损失阈值，且第二损失小于第二损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；或者，对第四损失和第二损失进行加权求和，得到第五语义损失，在第五语义损失小于第五语义损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以在第四损失小于第四损失阈值，且第三损失小于第三损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；或者，对第四损失和第三损失进行加权求和，得到第六语义损失，在第六语义损失小于第六语义损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置可以在第四损失小于第四损失阈值，第三损失小于第三损失阈值，且第二损失小于第二损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型；或者，对第四损失、第三损失、第二损失和第一损失进行加权求和，得到第七语义损失，在第七语义损失小于第七语义损失阈值的情况下，停止对待训练的语义分割模型的训练，得到语义分割模型。

在本公开的一些实施例中，语义分割装置基于第一语义分割结果和第二语义分割结果，可以确定响应损失；根据第一损失、第二损失、第三损失、第四损失和响应损失，对待训练的语义分割模型进行训练，得到语义分割模型。

在本公开实施例中，响应损失L _r(S)可以根据公式(11)得到：

其中，F _i ^r；T为第一语义分割结果中第i个像素对应的特征；F _i ^r；S为第二语义分割结果中第i个像素对应的特征。

在本公开的一些实施例中，语义分割装置基于第二语义分割结果和图像样本，可以确定训练损失；根据第一损失、第二损失、第三损失、第四损失、响应损失和训练损失，对待训练的语义分割模型进行训练，得到语义分割模型。

在本公开实施例中，响应损失L _sa(S)可以根据公式(12)得到：

其中，F _i ^sa为图像样本中第i个像素对应的特征。

示例性的，参考图7，本公开实施例提供一种知识蒸馏示意图，如图7所示，教师网络和学生网络均包括4个卷积层和一个池化层，池化层通过金字塔池化部分(Pyramid Pooling Module，PPM)实现。其中，前3个卷积层为低层卷积层，第4个卷积层为高层卷积层，高级卷积层连接一个SAM；教师网络通过4个卷积层和1个池化层，依次提取出3个子纹理特征、1个第一语义特征和1个第一语义分割特征；通过3个CDM对3个纹理特征进行轮廓分解，得到3个第一子轮廓特征，基于注意力机制，通过SAM对第一语义特征进行增强处理，得到1个第一增强特征，基于第一语义分割特征，得到第一语义分割结果；同理，学生网络通过4个卷积层、3个CDM和1个SAM，可以得到3个第二子纹理特征、3个第二子轮廓特征、1个第二语义特征、1个第二增强特征、1个第二语义分割特征和第二语义分割结果；如此，学生网络可以基于3个第一子轮廓特征，3个第二子轮廓特征，学习教师网络的纹理知识，基于1个第一增强特征、1个第二增强特征、1个第一语义分割特征和1个第二语义分割特征，学习教师网络的语义知识；纹理知识和语义知识作为特征知识；以及，基于3个第一子纹理特征、1个第一语义特征和1个第一语义分割特征之间的第一关系特征，以及，3个第二子纹理特征、1个第二语义特征和1个第二语义分割特征之间的第二关系特征，学习教师网络的关系知识；以及，基于第一语义分割结果和第二语义分割结果，学习教师网络的响应知识。如此，学生网络可以从教师网络学习到丰富的知识，提高了学生网络的语义分割精度。

参考图8，图8示出了学生网络的语义分割结果示意图，如图8所示，a为城市场景下的原始图像，b为相关技术中的学生网络的语义分割结果，c为本案的学生网络的语义分割结果，d为针对a中原始图像的语义分割的图像样本；可以看出，本案的学生网络的语义分割结果包含的信息更丰富，更接近图像样本。

示例性的，图7中的知识蒸馏方法应用于城市场景中，表1示出了城市场景下学生网络和教师网络的平均交并比的对比结果。如表1所示，学生网络本身平均交并比最低，采用了结构知识蒸馏(stucture Knowledge Distillation，SKD)后，平均交并比有改善，采用类特征变化蒸馏(Intra-class Feature Variation Distillation，IFKD)后，平均交并比进一步改善，而采用本案的方法的平均交并比最高。

表1

以学生网络为ResNet18为例说明，ResNet18本身采用val测试集的平均交并比为69.1，与教师网络相差9.46％，采用test测试集的平均交并比为67.6，与教师网络相差9.18％；本案的方法采用val测试集的平均交并比为75.82，相比ResNet18提高了6.72％，采用test测试集的平均交并比为73.78，相比ResNet18提高了6.18％，本案的方法最接近教师网络的平均交并比；其中，val是训练过程中使用的测试集,val用于根据训练结果及时判断学习状态。test是训练模型结束后，用于评价模型结果的测试集。从表1可以看出，采用本案的方法训练的学生网络的精度得到了显著提高，其精度最接近教师网络。

本公开实施例还提供一种语义分割装置，图9为本公开实施例提供的语义分割装置的一个可选的组成结构示意图，如9所示，该语义分割装置20包括：

特征获取部分2000，被配置为获取待处理图像；

语义分割部分2004，被配置为采用所述语义分割模型，对待处理图像进行语义分割处理，得到所述待处理图像的语义分割结果；所述语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；

所述第一中间特征和所述第二中间特征包括以下至少一组：

第一纹理特征和第二纹理特征；

第一语义特征和第二语义特征；

所述第一变换特征和所述第二变换特征包括以下至少一组：

第一轮廓特征和第二轮廓特征；

第一增强特征和第二增强特征。

在一些实施例中，所述语义分割装置20还包括：

特征提取部分2001，被配置为采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征；所述参考语义模型为预先训练的语义分割网络；所述待训练的语义分割模型为与所述参考语义模型功能一致的网络；

特征处理部分2002，被配置为对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征；

训练部分2003，被配置为至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述特征提取部分2001，还被配置为采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到第一纹理特征和第二纹理特征；对所述第一纹理特征和第二纹理特征进行特征提取，得到第一语义特征和第二语义特征。

在一些实施例中，所述特征处理部分2002，还被配置为对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；或者，对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

在一些实施例中，所述特征处理部分2002，还被配置为对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；以及对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。

在一些实施例中，所述训练部分2003，还被配置为基于预设第一损失函数、所述第一轮廓特征和所述第二轮廓特征进行损失计算，确定第一损失；基于预设第二损失函数、所述第一增强特征和所述第二增强特征，确定第二损失；基于所述第一损失和所述第二损失中的至少一个对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述训练部分2003，还被配置为对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征；基于预设第三损失函数、所述第一语义分割特征和所述第二语义分割特征进行损失计算，确定第三损失；基于所述第三损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失中的至少一个，以及所述第三损失，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述第一纹理特征包括：至少一个第一子纹理特征；所述第二纹理特征包括：至少一个第二子纹理特征；所述训练部分2003，还被配置为对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征之后，基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系；基于所述第二语义分割特征、第二语义特征、所述至少一个第二子纹理特征，确定第二图推理关系；基于预设第四损失函数、所述第一图推理关系和所述第二图推理关系进行损失计算，确定第四损失；基于所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失、第三损失中的至少一个，以及所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。

在一些实施例中，所述训练部分2003，还被配置为基于输出顺序，确定所述第一语义分割特征、所述第一语义特征、所述至少一个第一子纹理特征之间的至少两个差异特征；对所述至少两个差异特征，进行相关处理，得到差异特征之间的相关度；基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系。

在一些实施例中，所述训练部分2003，还被配置为在所述差异特征之间的相关度中存在小于等于预设关联阈值的目标差异之间的关联特征情况下，基于所述目标差异之间的关联特征和所述至少两个差异特征，构成所述第一图推理关系。

在一些实施例中，所述特征处理部分2002，还被配置为基于隔行扫描因子，对所述第一纹理特征和所述第二纹理特征均进行滤波处理后，得到各自的高通子带和低通子带；对所述高通子带进行方向滤波，得到方向子带；分别对所述第一纹理特征和所述第二纹理特征对应的所述低通子带和所述方向子带进行融合，得到所述第一轮廓特征和所述第二轮廓特征，完成轮廓分解处理。

在一些实施例中，所述特征处理部分2002，还被配置为对所述第一语义特征和所述第二语义特征均进行至少两种转换，得到各自对应的至少两种语义变换特征；对所述至少两种语义变换特征中不同的语义变换特征进行自增强处理，得到相关矩阵；将所述相关矩阵与所述至少两种语义变换特征中的一个语义变换特征进行增强处理，得到自增强特征；基于所述第一语义特征和所述第二语义特征各自对应的自增强矩阵，将各自的自增强特征确定为所述第一增强特征和所述第二增强特征；或者，将所述第一语义特征和所述第二语义特征，分别与各自的自增强特征进行融合，得到所述第一增强特征和所述第二增强特征。

在本申请实施例以及其他的实施例中，“部分”可以是部分电路、部分处理器、部分程序或软件等等，当然也可以是单元，还可以是模块也可以是非模块化的。

本公开实施例还提供一种电子设备，图10为本公开实施例提供的电子设备的一个可选的组成结构示意图，如图10所示，该电子设备21包括：处理器2101和存储器2102，存储器2102存储有可在处理器2101上运行的计算机程序，处理器2101执行所述计算机程序被执行时，实现本公开实施例的任意一种语义分割方法的步骤；处理器2101和存储器2102通过通信总线2103连接。

存储器2102被配置为存储由处理器2101计算机程序和应用，还可以缓存待处理器2101以及电子设备中各部分待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。

处理器2101执行程序时实现上述任一项语义分割方法的步骤。处理器2101通常控制电子设备21的总体操作。

上述处理器可以为特定用途集成电路(Application Specific Integrated Circuit，ASIC)、数字信号处理器(Digital Signal Processor，DSP)、数字信号处理装置(Digital Signal Processing Device，DSPD)、可编程逻辑装置(Programmable Logic Device，PLD)、现场可编程门阵列(Field Programmable Gate Array，FPGA)、中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地，实现上述处理器功能的电子器件还可以为其它，本公开实施例不作限制。

计算机可读取存储介质可以是保持和存储由指令执行设备使用的指令的有形设备，可为易失性存储介质或非易失性存储介质。计算机可读存储介质例如可以是——但不限于——电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：U盘、磁碟、光盘、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦拭可编程只读存储器(EPROM或闪存)、静态随机存储读取器(ROM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、记性编码设备、例如其上存储有指令的打孔卡或凹槽内凹起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电池波、通过波导或其他传媒介质传播的电池波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

上述存储器可以是只读存储器(Read Only Memory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory， EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory，FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory，CD-ROM)等存储器；也可以是包括上述存储器之一或任意组合的各种终端，如移动电话、计算机、平板设备、个人数字助理等。

其中，上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开存储介质和设备实施例中未披露的技术细节，请参照本公开方法实施例的描述而理解。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本公开的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本公开的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。上述本公开实施例序号仅仅为了描述，不代表实施例的优劣。

在本公开所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本公开实施例方案的目的。

另外，在本公开各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

或者，本公开上述集成的单元如果以软件功能部分的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得设备自动测试线执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

本公开所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本公开所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本公开的实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

工业实用性

本公开实施例提供了一种语义分割方法、装置、电子设备和计算机可读存储介质，所述方法包括：获取待处理图像；采用语义分割模型，对待处理图像进行语义分割处理，得到待处理图像的语义分割结果；其中，语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；第一中间特征和第二中间特征包括以下至少一组：第一纹理特征和第二纹理特征；第一语义特征和第二语义特征；第一变换特征和第二变换特征包括以下至少一组：第一轮廓特征和第二轮廓特征；第一增强特征和第二增强特征。通过本公开实施例，可以使语义分割模型学习到更加丰富的知识，从而提高了在使用语义分割模型对待处理图像进行语义分割时的语义分割精度。

Claims

一种语义分割方法，包括：

获取待处理图像；

采用语义分割模型，对所述待处理图像进行语义分割处理，得到所述待处理图像的语义分割结果；其中，

所述语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；

所述第一中间特征和所述第二中间特征包括以下至少一组：第一纹理特征和第二纹理特征；第一语义特征和第二语义特征；

所述第一变换特征和所述第二变换特征包括以下至少一组：第一轮廓特征和第二轮廓特征；第一增强特征和第二增强特征。
根据权利要求1所述的方法，其中，所述参考语义模型为预先训练的语义分割网络；所述待训练的语义分割模型为与所述参考语义模型功能一致的网络；所述方法还包括：

采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征；

对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征；

至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。
根据权利要求2所述的方法，其中，所述采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到所述第一中间特征和所述第二中间特征，包括：

采用所述参考语义模型和所述待训练的语义分割模型分别对图像样本进行特征提取，得到第一纹理特征和第二纹理特征；

对所述第一纹理特征和第二纹理特征进行特征提取，得到第一语义特征和第二语义特征。
根据权利要求2或3所述的方法，其中，所述对所述第一中间特征和所述第二中间特征分别进行轮廓分解或增强处理，得到所述第一变换特征和所述第二变换特征，包括以下至少一个：

对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征；

对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征。
根据权利要求2至4任一项所述的方法，其中，所述至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型，包括：

基于预设第一损失函数、所述第一轮廓特征和所述第二轮廓特征进行损失计算，确定第一损失；

基于预设第二损失函数、所述第一增强特征和所述第二增强特征，确定第二损失；

基于所述第一损失和所述第二损失中的至少一个，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。
根据权利要求2至5任一项所述的方法，其中，所述至少基于所述第一变换特征和所述第二变换特征，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型，包括：

对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征；

基于预设第三损失函数、所述第一语义分割特征和所述第二语义分割特征进行损失计算，确定第三损失；

基于所述第三损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失中的至少一个，以及所述第三损失，对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。
根据权利要求6所述的方法，其中，所述第一纹理特征包括：至少一个第一子纹理特征；所述第二纹理特征包括：至少一个第二子纹理特征；

所述对所述第一增强特征和所述第二增强特征分别进行语义分割预测，得到第一语义分割特征和第二语义分割特征之后，所述方法还包括：

基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系；

基于所述第二语义分割特征、第二语义特征、所述至少一个第二子纹理特征，确定第二图推理关系；

基于预设第四损失函数、所述第一图推理关系和所述第二图推理关系进行损失计算，确定第四损失；

基于所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型；或者，基于第一损失、第二损失、第三损失中的至少一个，以及所述第四损失对所述待训练的语义分割模型进行训练，确定出所述语义分割模型。
根据权利要求7所述的方法，其中，所述基于所述第一语义分割特征、第一语义特征、所述至少一个第一子纹理特征，确定第一图推理关系，包括：

基于输出顺序，确定所述第一语义分割特征、所述第一语义特征、所述至少一个第一子纹理特征之间的至少两个差异特征；

对所述至少两个差异特征，进行相关处理，得到差异特征之间的相关度；

基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系。
根据权利要求8所述的方法，其中，所述基于所述至少两个差异特征和所述差异特征之间的相关度，构成所述第一图推理关系，包括：

在所述差异特征之间的相关度中存在小于等于预设关联阈值的目标差异之间的相关关联特征情况下，基于所述目标差异之间的关联特征和所述至少两个差异特征，构成所述第一图推理关系。
根据权利要求4所述的方法，其中，所述对所述第一纹理特征和所述第二纹理特征分别进行轮廓分解处理，得到第一轮廓特征和第二轮廓特征，包括：

基于隔行扫描因子，对所述第一纹理特征和所述第二纹理特征均进行滤波处理后，得到各自的高通子带和低通子带；

对所述高通子带进行方向滤波，得到方向子带；

分别对所述第一纹理特征和所述第二纹理特征对应的所述低通子带和所述方向子带进行融合，得到所述第一轮廓特征和所述第二轮廓特征，完成轮廓分解处理。
根据权利要求4所述的方法，其中，所述对所述第一语义特征和所述第二语义特征进行增强处理，得到第一增强特征和第二增强特征，包括：

对所述第一语义特征和所述第二语义特征均进行至少两种转换，得到各自对应的至少两种语义变换特征；

对所述至少两种语义变换特征中不同的语义变换特征进行自增强处理，得到相关矩阵；

将所述相关矩阵与所述至少两种语义变换特征中的一个语义变换特征进行增强处理，得到自增强特征；

基于所述第一语义特征和所述第二语义特征各自对应的自增强矩阵，将各自的自增强特征确定为所述第一增强特征和所述第二增强特征；或者，将所述第一语义特征和所述第二语义特征，分别与各自的自增强特征进行融合，得到所述第一增强特征和所述第二增强特征。
一种语义分割装置，包括：

特征获取部分，被被配置为获取待处理图像；

语义分割部分，被配置为采用所述语义分割模型，对所述待处理图像进行语义分割处理，得到所述待处理图像的语义分割结果；所述语义分割模型是以参考语义模型输出的第一中间特征进行轮廓分解或增强处理的第一变换特征为参考，结合待训练的语义分割模型输出的第二中间特征进行轮廓分解或增强处理的第二变换特征训练得到的；

其中，所述第一中间特征和所述第二中间特征包括以下至少一组：第一纹理特征和第二纹理特征；第一语义特征和第二语义特征；所述第一变换特征和所述第二变换特征包括以下至少一组：第一轮廓特征和第二轮廓特征；第一增强特征和第二增强特征。
一种电子设备，包括：

存储器，被配置为存储计算机程序；

处理器，被配置为执行所述存储器中存储的计算机程序时，实现权利要求1至11任一项所述的方法。
一种计算机可读存储介质，存储有计算机程序，被配置为被处理器执行时，实现权利要求1至11任一项所述的方法。
一种计算机程序，所述计算机程序产品包括计算机程序或指令，在所述计算机程序或指令在计算机上运行的情况下，所述计算机执行权利要求1至11任一项所述的方法。