CN110992365B

CN110992365B - 一种基于图像语义分割的损失函数及其设计方法

Info

Publication number: CN110992365B
Application number: CN201911066221.8A
Authority: CN
Inventors: 颜成钢; 王廷宇; 孙垚棋; 张继勇; 张勇东; 沈韬
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2019-11-04
Filing date: 2019-11-04
Publication date: 2023-04-18
Anticipated expiration: 2039-11-04
Also published as: CN110992365A

Abstract

本发明公开了一种基于图像语义分割的损失函数及其设计方法。本发明步骤如下：1。参数w_i的确立。在网络训练过程中，从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s。在得到此两种标签信息后，将面积从大到小排列，并分别计算最大面积与各个面积之间的倍数，而后再将这些倍数关系归一化到[1,n]之间，即训练时每个损失函数计算时，不同类别对应的权重取值w_i。2.参数Υ的确立。首先确定Υ＞0,而后在网络训练过程中通过网格寻优的方式，对Υ的值进行进一步的确立。本发明设计损失带有权重的损失函数进行改进，以使训练的卷积神经网络得到更好的图像分割效果。

Description

一种基于图像语义分割的损失函数及其设计方法

技术领域

本发明涉及计算机视觉与人工智能领域，尤其涉及一种基于图像语义分割的损失函数及其设计方法，一种在图像语义分割任务中计算损失的方法。

背景技术

图像语义分割问题是计算机视觉任务中的一个长期未解决的问题，同时，也是现实中许多应用的组件之一，比如自动驾驶、地理信息系统、医疗影像分析、机器人等领域。语义分割的重点在于将图像中的区域划分为具有语义信息的几个区域，早期的方法采用人为设计的人工算子提取图像特征进行图像语义分割，近几年卷积神经网络采用自动提起特征的方式，使得图像语义分割问题取得了巨大的进步。

卷积神经网络的训练主要分为原始数据通过网络的前向传播和误差的反向传播更新网络的参数两个部分，这其中，损失函数的选择对误差的计算以及网络参数的更新起到关键性的作用，针对不同的任务，不同的误差函数，可以使得神经网络完成不同的任务。因此，设计一个合适的损失函数，使得图像语义分割任务能够达到更好的效果，显得尤为重要。

发明内容

本发明提出一种基于图像语义分割的损失函数，该损失函数可以在卷积神经网络训练过程中兼具难识别样本的强化训练和小目标样本的平等训练。

本发明的损失函数入下所示：

式中，y_i为像素点i的类别标签，

为像素点i的y_i的预测概率，当

越大，说明输出越接近于正确的预测，此时Loss越接近于0。在图像语义分割任务中，一次需要预测的像素点很多，在这其中，网络对每个像素点的预测能力不尽相同，为了使网络更加专注于难预测像素点的学习，在损失函数中，加入对每个像素点的计算权重

其中γ＞0。参数w_i为像素点i属于不同类别时，Loss计算过程中所应分配的权重，其大小由标签数据中，各个类别所占的面积决定，当图片中的某一语义类别在整幅图片中所占面积较小时，w_i的数值便会相应增加，以使得网络的学习能够更加关注于这一小的语义对象。

一种基于图像语义分割的损失函数的推导方法，该损失函数相关参数的确立方式包括以下步骤：

步骤1：参数w_i的确立。在网络训练过程中，通常的监督学习都会有每张图片对应的标签标注信息，可以从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s。在得到此两种标签信息后，将面积从大到小排列，并分别计算最大面积与各个面积之间的倍数，而后，再将这些倍数关系归一化到[1，n]之间，即为训练时，每个损失函数计算时，不同类别对应的权重取值w_i。

步骤2：参数γ的确立。首先可以确定γ＞0，而后在网络训练过程中，可以通过网格寻优的方式，对γ的值进行进一步的确立。

本发明的有益效果是：针对图像语义分割问题中存在的难预测样本和小面积语义对象训练不够充分的问题，设计损失带有权重的损失函数进行改进，以使训练的卷积神经网络得到更好的图像分割效果。

具体实施方式

本发明提出了一种基于图像语义分割的损失函数，其在卷积神经网络训练过程中，具体实施方式，如下所示：

步骤1：在损失函数计算过程中，根据每个像素点的标签信息，确定其属于的类别，从而确定其w_i。

步骤2：根据每个像素点的预测概率，计算它们的交叉熵损失

对于预测概率更接近于1的像素点，认为其已不需要进行过多训练，通过

对其交叉熵损失进行进一步缩小，而对于预测概率更小点像素点，其

的值相对于预测概率大的像素点便会偏大，从而使网络更加专注于这些像素点的学习。

步骤3：对所有像素点计算的损失秩进行加和平均，通过卷积神经网络中的反向传播机制，计算网络中，每个参数的梯度，并通过优化器更新参数值，达到网络训练的目的。

Claims

1.一种基于图像语义分割的损失计算方法，其特征在于该计算方法如下所示：

式中，y_i为像素点i的类别标签，

为像素点i的y_i的预测概率，当

越大，说明输出越接近于正确的预测，此时Loss越接近于0；在损失函数中，加入对每个像素点的计算权重

其中Υ>0；参数w_i为像素点i属于不同类别时，Loss计算过程中所应分配的权重，其大小由标签数据中，各个类别所占的面积决定，当图片中的某一语义类别在整幅图片中所占面积较小时，w_i的数值便会相应增加，以使得网络的学习能够更加关注于这一小的语义对象；

其中，参数w_i的确立如下；在网络训练过程中，通常的监督学习都会有每张图片对应的标签标注信息，可以从标签标注信息中提取此张图片中包含的语义类别个数n以及每个语义类别在图片中所占的面积s；在得到此两种标签信息后，将面积从大到小排列，并分别计算最大面积与各个面积之间的倍数，而后再将这些倍数关系归一化到[1,n]之间，即为训练时，每个损失函数计算时，不同类别对应的权重取值w_i；

其中，参数Υ的确立如下；首先确定Υ>0,而后在网络训练过程中，通过网格寻优的方式，对Υ的值进行进一步的确立。