CN114821184A

CN114821184A - 一种基于均衡互补熵的长尾图像分类方法及系统

Info

Publication number: CN114821184A
Application number: CN202210500992.9A
Authority: CN
Inventors: 杨钊; 胡陆宇; 李嘉壕; 罗名凯; 曹任龙
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2022-05-10
Filing date: 2022-05-10
Publication date: 2022-07-29
Anticipated expiration: 2042-05-10
Also published as: CN114821184B

Abstract

本发明公开了一种基于均衡互补熵的长尾图像分类方法及系统，其方法包括如下步骤：针对获取的长尾图像训练集，读取图像数据及标签；随机初始化卷积神经网络参数，采用mini‑batch的方式对提取的图像数据进行前向计算，得到全连接层输出，并计算Softmax预测概率；设计均衡互补熵损失函数，通过在归一化的互补熵损失函数中引入一个自适应权重系数，得到均衡互补熵损失函数，利用预测概率计算互补类的损失；联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练，引导网络模型参数更新，得到图像分类模型。本发明提出的均衡互补熵的训练算法能够解决长尾图像的分类问题，能够带来更好的分类效果，拥有更好的泛化能力。

Description

一种基于均衡互补熵的长尾图像分类方法及系统

技术领域

本发明涉及深度学习图像分类技术领域，具体涉及一种基于均衡互补熵的长尾图像分类方法及系统。

背景技术

近年来，基于深度学习的图像分类技术取得巨大的成功，但大多数性能优越的图像分类技术依赖类别平衡的数据集，导致在类别不平衡的数据集中无法发挥较好的分类性能。在现实场景下，类别不平衡的数据集更趋向于长尾分布，其中数量占优势的类别称为头类，不具优势的类别称为尾类。若直接将长尾分布的数据集用于模型训练，由于头类和尾类的样本数量差异较大，传统的图像分类技术模型容易偏向于训练样本较多的头类，忽视样本数量较少的尾类，进而造成分类性能下降。为了解决这一问题，目前较为常用的解决方法有重采样(re-sampling)技术和重加权(re-weighting)技术。最基本的重采样技术通过过采样(over-sampling)随机增加尾类的样本数量，或通过欠采样(under-sampling)随机减少头部类的样本数量，使得长尾数据集的分布变得相对均衡。重加权技术为损失函数设计一个权重因子，以平衡不同类别间的损失值。然而，这两种常用的技术也存在一定的弊端。例如，重采样技术容易造成模型的过拟合或者欠拟合现象，而重加权技术需要精心地设计一个权重因子才能有效地提高模型分类性能。

发明内容

针对上述问题，本发明提出一种基于均衡互补熵的长尾图像分类方法及系统，通过新的均衡互补熵的训练算法能够解决长尾图像的分类问题，带来更好的分类效果，拥有更好的泛化能力。

本发明采用如下技术方法来实现：

一种基于均衡互补熵的长尾图像分类方法，包括以下步骤：

步骤1、获取长尾图像训练集，针对长尾图像训练集，读取图像数据及标签；

步骤2、随机初始化卷积神经网络参数，采用mini-batch的方式对提取的图像数据进行前向计算，得到全连接层输出，并计算Softmax预测概率；

步骤3、设计均衡互补熵损失函数，通过在归一化的互补熵损失函数中引入一个自适应权重系数，得到均衡互补熵损失函数，然后利用Softmax预测概率计算互补类的损失；

步骤4、联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练，引导网络模型参数更新，得到图像分类模型。

一种基于均衡互补熵的长尾图像分类系统，其包括如下步骤：

数据集处理模块，用于获取长尾图像训练集，针对长尾图像训练集，读取图像数据及标签；

预测概率计算模块，用于随机初始化卷积神经网络参数，采用mini-batch的方式对提取的图像数据进行前向计算，得到全连接层输出，并计算Softmax预测概率；

均衡互补熵训练模块，用于设计均衡互补熵损失函数，通过在归一化的互补熵损失函数中引入一个自适应权重系数，得到均衡互补熵损失函数，然后利用Softmax预测概率计算互补类的损失；

分类模型获取模块，用于联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练，引导网络模型参数更新，得到图像分类模型。

本发明的提供的基于均衡互补熵的长尾图像分类方法及系统，其相比于现有的技术，具有如下优点：

1、本发明提供的基于均衡互补熵的长尾图像分类方法及系统，该方法在不改变原始数据分布的前提下，能够充分利用各类样本的特征信息。在本发明中，我们利用交叉熵损失函数对主要目标(即ground-truth类)进行分类训练。同时，利用互补熵对次要目标(即互补类)进行信息熵的运算以获取有用的特征信息。与只使用交叉熵损失进行训练的传统算法相比，这种针对互补类的训练能够有效地避免模型在训练的过程中，因One-Hot编码而导致大量的互补类样本信息被忽视的情况。

2、本发明通过在互补熵损失函数中设计一个简单但有效的权重系数，能够将互补类损失进行均衡化处理，减少互补类对真值类的抑制作用。通过实验证明，本发明提出的均衡互补熵的训练算法能够在现有的技术上进一步地解决长尾图像的分类问题，与传统的方法相比，能够带来更好的分类效果，且拥有更好的泛化能力。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明实施例提供的基于均衡互补熵的长尾图像分类方法流程示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是，对于这些实施方式的说明用于帮助理解本发明，但并不构成对本发明的限定。此外，下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例：

参见图1，本实施例提供的基于均衡互补熵的长尾图像分类方法，包括如下步骤：

S101、获取长尾图像训练集，针对长尾图像训练集，读取图像数据及标签。

读取输入图像的像素矩阵，用于后续的图像视觉特征处理。

S102、随机初始化卷积神经网络参数，采用mini-batch的方式对提取的图像数据进行前向计算，得到全连接层输出，并计算Softmax预测概率。

利用卷积神经网络模型提取S101中输入图像的像素矩阵，进行卷积层、激活函数层和池化层等处理，得到全连接层输入X；将全连接层输入X与分类器权重W进行矩阵相乘，得到全连接层输出

其中b_j为偏置；然后对全连接层输出进行Softmax计算，得到图像被分类为各个类别的预测概率，其中Softmax激活函数的输出结果为一个K×1的向量，且Softmax的预测概率总和为1，K为类别数；

S103、设计均衡互补熵损失函数，通过在归一化的互补熵损失函数中引入一个自适应权重系数，得到均衡互补熵损失函数，然后利用Softmax预测概率计算互补类的损失。

本实施例设计一个自适应的权重因子以平衡不同互补类的损失值。该自适应权重因子通过为样本数量较多的互补类赋予较小的权重，同时为样本数量较少的互补类赋予较大的权重，使得不同互补类的损失值达到相对平衡，从而提高尾类被正确分类的概率。

在本实施例中，所设计的自适应权重系数的表达式为：

其中，w_j表示互补类j的权重系数，n_j表示互补类j的样本数，n_sum表示全部样本数，α是一个超参数设置。

在本实施例中，引入自适应权重因子的均衡互补熵损失函数为：

其中，N表示全部样本数量；K表示类别数；

表示第s个样本被正确分类为ground-truth类i的概率；

表示第s个样本被错误地分类为互补类j的概率。

S104、联合交叉熵损失函数和均衡互补熵损失函数对分类模型进行训练，引导网络模型参数更新，得到图像分类模型。

在本实施例中，交叉熵损失函数的公式如下：

其中，p_si表示当前样本属于ground-truth类i的概率。

在本实施例中，最终的分类模型为：

其中，

是用于归一化的平衡因子，主要用于平衡交叉熵和互补熵之间的数值比例。

本发明通过在互补熵损失函数中引入一个自适应权重系数，设计一个均衡互补熵损失函数分类算法。然后利用交叉熵损失函数作为主要训练目标，学习来自ground-truth类的样本信息；同时，利用均衡互补熵损失函数作为次要训练目标，学习来自互补类的样本信息。最后联合交叉熵损失和均衡互补熵损失进行训练，引导网络模型的参数更新。本发明不仅有效地利用ground-truth类和互补类的样本进行训练，而且能够进一步地提高模型的分类性能。

一种基于均衡互补熵的长尾图像分类系统，包括如下模块：

本发明提出方法及系统，其采用的均衡互补熵的训练算法能够解决长尾图像的分类问题，能够带来更好的分类效果，拥有更好的泛化能力。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。