CN112465844A

CN112465844A - 一种用于图像语义分割的多类别损失函数及其设计方法

Info

Publication number: CN112465844A
Application number: CN202011585826.0A
Authority: CN
Inventors: 王孝伟; 毛昊; 李新利; 杨国田
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2021-03-09

Abstract

本发明公开了一种用于图像语义分割的多类别损失函数及其设计方法，该损失函数基于训练数据集中各类别像素点的出现频率，通过调节加权系数、聚焦系数和负类门控系数，动态调节各类别样本在损失函数中的权值，通过迭代的方式，在模型训练的同时进行超参数选取，以确定超参数的具体取值以及损失函数的具体形式，使小类别得到更充分训练，既能缓解类别不平衡现象，也能提高模型性能。

Description

一种用于图像语义分割的多类别损失函数及其设计方法

技术领域

本发明涉及计算机视觉与人工智能领域，特别是涉及一种用于图像语义分割的多类别损失函数及其设计方法，一种在图像语义分割任务中计算损失的方法。

背景技术

图像语义分割是计算机视觉中重要研究方向之一。重点是将图像中的区域分为具有语义信息的几个区域，以帮助机器人等识别现场设备及状态等语义信息，更好进行相关任务执行。传统的图像语义分割方法根据图像的颜色、纹理信息、空间结构等底层特征对图像进行分割，特别针对电力场景，目前只能对某一类别的目标进行语义分割，然而实际场景中通常包含多个类别目标，且存在较严重类别不平衡问题，当各类别目标出现频率差别较大时，会导致模型不能在所有类别上同时收敛，因此在各类别上的语义分割效果不一致，分割效果较差。针对图像语义分割任务中类别不平衡问题，目前主要有三种方法：第一种是对训练数据进行裁剪，第二种是在损失函数中对不同的类别进行加权，给出现频率较小的类别以更高的权重，第三种是使用对小类更友好的损失函数训练模型，这类损失函数能够在训练过程中动态地调整各类别的权值。但以上均基于二分类语义分割任务，而实际场景中通常是多类别语义分割任务，且通常存在严重类别不平衡问题。

因此，为了解决图像语义分割中的多类别不平衡问题，设计一个合适的损失函数，以达到图像语义分割更好的效果，显得尤为重要。

发明内容

本发明提出了一种用于图像语义分割的多类别损失函数，该损失函数可以在深度学习训练过程中根据训练效果动态调节各类别的权值，使小类别得到更充分的训练，缓解类别不平衡现象，提高模型性能。该损失函数的表达式如式(1)所示：

(1)

式中，

表示损失函数值，

表示第

类别上的损失函数值。

表示真实类别，

为负类门控系数，用于控制是否在损失函数中考虑错误类别。

模型在第

类的损失函数值

由

表示的损失函数中第

类的初始权值、

表示的模型在每个轮次结束之后对第

类权值的动态修正量和

为初始交叉熵损失函数值三部分组成，其中前两项的乘积是损失函数中第

类的真正权值。

的具体表达式如式(2)所示：

(2)

式中，加权系数

和聚焦系数

共同作用以调节损失函数中各类别的权重；

用于控制初始权值，

越大，出现频率较小的类的初始权值相对越大；

用于控制权重的动态修正量。

一种基于图像语义分割的多类别损失函数设计方法，该损失函数及各超参数的确立方式，具体包括以下步骤：

步骤1：选定加权系数

；

步骤2：根据第

类实例在数据集中的出现频率

计算获得第

类样本在损失函数中的初始权值

；

步骤3：选定聚焦系数

；

步骤4：调用基于深度学习的图像语义分割模型，计算在该像素点上对第

类的输出值

；

步骤5：计算获得每轮次结束对第

类权值的动态修正量

；

步骤6：计算获得初始交叉熵损失函数值

；

步骤7：根据式(2)，计算获得在该像素点上对第

类的损失函数值

；

步骤8：选定负类门控系数

；

步骤9：根据式(1)，计算获得该像素点对应的多类别损失函数值

。

步骤10：根据训练效果修改加权系数

、聚焦系数

和负类门控系数

的取值，重复步骤1~9，直到模型收敛。

附图说明

图1是损失函数各超参数选取方法流程图。

具体实施方式

以下结合附图1具体说明本发明的较佳实施例。

本发明提出了一种基于图像语义分割的多类别损失函数，其在深度学习训练过程中，具体包括以下步骤：

步骤1：选定加权系数

；

步骤2：根据第

类实例在数据集中的出现频率

计算获得第

类样本在损失函数中的初始权值

；

步骤3：选定聚焦系数

；

类的输出值

；

步骤5：计算获得每轮次结束对第

类权值的动态修正量

；

步骤6：计算获得初始交叉熵损失函数值

；

步骤7：计算获得在该像素点上对第

类的损失函数值

步骤8：选定负类门控系数

；

步骤9：计算获得该像素点对应的多类别损失函数值

步骤10：根据训练效果修改加权系数

、聚焦系数

和负类门控系数

的取值，重复步骤1~9，直到模型收敛。

尽管本发明的内容已经通过上述优选实施例作了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。