CN112580714B

CN112580714B - 一种以错因强化方式动态优化损失函数的物品识别方法

Info

Publication number: CN112580714B
Application number: CN202011477588.1A
Authority: CN
Inventors: 于效宇; 陈颖璐; 刘艳; 谈海平; 李富超
Original assignee: University of Electronic Science and Technology of China Zhongshan Institute
Current assignee: University of Electronic Science and Technology of China Zhongshan Institute
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2023-05-30
Anticipated expiration: 2040-12-15
Also published as: WO2022126809A1; CN112580714A

Abstract

本发明公开了一种以错因强化方式动态优化损失函数的物品识别方法，优化后的损失函数取名为ER‑Loss，在原来的交叉熵损失函数的基础上加入惩罚项实现,惩罚项包含以下四个模块:惩罚程度的放大因子A；惩罚程度调节系数A_prob，用于在训练过程中根据实际情况调节放大因子A对数据集各类别之间的相关性和相关类别的实际输出概率的影响，让放大因子A能够自动适应训练的不同阶段；在各网络下，数据集各类别之间的相关性组合X；相关类别的概率

根据模型的每一次训练情况动态调整，与现有技术相比，本发明通过惩罚程度调节系数A_prob动态调节放大因子A，识别更加灵活，同时引入各网络下，数据集各类别之间的相关性组合X，使得模型对于类别特征的判断更加全面，提高了模型对物品识别的精度，降低得到的结果与实际结果之间的偏差，能有效地提高深度学习网络模型的识别准确程度。

Description

一种以错因强化方式动态优化损失函数的物品识别方法

技术领域

本发明涉及一种优化损失函数的物品识别方法，特别是一种以错因强化方式动态优化损失函数的物品识别方法。

背景技术

申请号为“2020106691598”的专利文献公开了一种采用错因强化方式优化损失函数的方法，优化后的损失函数取名为corloss，在原来的交叉熵损失函数的基础上加入惩罚项实现,惩罚项包含以下三个模块:惩罚程度调节因子T，数据集各类别之间的相关性X_ijd，相关类别的概率

由于惩罚程度调节因子T为定值,惩罚程度调节因子T确定后就不能再更改识别结果,一旦惩罚程度调节因子T的数据错误,得到的结果将与实际的结果存在很大的偏差,造成识别错误。

发明内容

为了克服现有技术的不足，本发明提供一种识别准确率高的以错因强化方式动态优化损失函数的物品识别方法。

本发明解决其技术问题所采用的技术方案是：

一种以错因强化方式动态优化损失函数的物品识别方法，优化后的损失函数取名为ER-Loss，在原来的交叉熵损失函数的基础上加入惩罚项实现,惩罚项包含以下四个模块:

惩罚程度的放大因子A，用于放大相关类别对模型精度的影响，当A＝0时，惩罚项为0，对模型精度无影响，此时ER-Loss即为交叉熵损失函数，在模型训练时可根据相关性的实际情况设置A值；

惩罚程度调节系数A_prob，用于在训练过程中根据实际情况调节放大因子A对数据集各类别之间的相关性和相关类别的实际输出概率的影响，让放大因子A能够自动适应训练的不同阶段；

在各网络下，数据集各类别之间的相关性组合X，通过初步模型测试所有物品类别的输出，并使用信息熵公式计算后获得单个网络的相关性X_ijd，随后根据实际情况设定权重矩阵λ对各网络相关性进行线性组合得到X；

相关类别的概率

即在训练过程中将目标物品识别为与之相关的物品类别的概率，非定值，根据模型的每一次训练情况动态调整。

本发明包括以下步骤：

步骤S1、初步训练并获取各类别的相关性；

步骤S2、根据识别结果动态加入惩罚项；

步骤S3、构建新的损失函数；

步骤S4：设定溢出机制；

步骤S5：采用ER-Loss训练。

步骤S1的具体步骤如下：采用交叉熵损失的损失函数对模型进行初步训练，初步训练后的模型用于测试各类别的相关项以及各类别之间的相关性。

步骤S2包括以下具体步骤：根据识别结果动态加入惩罚项，监控每张图片的识别结果，对于相关项的输出,模型以概率分数的形式作为惩罚项的一部分加入损失函数的计算中，同时在训练过程中使用溢出机制保护损失函数继续计算，一旦溢出则使用原来的交叉熵损失函数。

步骤S3的具体步骤如下：以原来的交叉熵损失函数为基础,通过原来的交叉熵损失函数训练出初步模型后，测试所有类别的相关项,所有类别的相关项即分类错因，在正式训练时把这些分类错因引入到损失函数的计算中，构建新的损失函数，得到ER-Loss的具体公式如下：

其中，i是指正确分类的物品类别，j是指与i相关的具有物品类别，d是指相关物品类别的个数,n代表该数据集的分类总数；A为放大因子，用于放大相关类别对模型精度的影响；惩罚程度调节系数A_prob，用于在训练过程中根据实际情况调节放大因子A对数据集各类别之间的相关性和相关类别的实际输出概率的影响，让A能够自动适应训练的不同阶段；X为各网络模型下的错因值组合，即各网络下相近物品类别之间的相关性组合，用信息熵来表示，信息熵越大说明相关性越大，模型识别错误的几率越高；

为训练过程中相关类别的输出概率；

其中，A_prob的具体公式如下：

其中，d是指相关物品类别的个数，D是指在当次训练中，输出概率大于概率阈值T的类别个数。

其中，单个网络获得的相关性X_ijd的具体公式如下：

其中B_ij为类别i的相关类别j在类别i的图片中得到的输出平均值，将每个类别的图片输出值按位置相加，然后求平均值以保证输出是正常水平。

模型训练时可以根据实际情况设置d值，当d＝0时，其他物品类别不会对目标物品的类别识别产生影响，此时ER-Loss即为交叉熵损失函数。

步骤S3中，放大因子A的初始设定值：A是放大因子，用于放大类别间的相关性组合X以及模型实际犯错的概率

对损失函数的影响。其初始值根据以下公式进行设定：

/>

其中，C是一个根据实际情况设定的定值，aver_X是通过预训练网络获得的相关性的均值，通过均值的手段获取整个数据集的相关性。这里的均值是算术平均值、几何平均值、调和平均值、加权平均值、均方根平均值、指数平均值和中位数其中的一种。

步骤S3中，最后计算采用的相关性X＝∑_m(λ_mX_ijdm)的具体组合方式：X_ijdm是同一类别在不同网络下获得的相关性，通过初步模型测试获得，最后计算时通过将其线性组合获得最终的相关性公式，具体如下：

其中，m是获取类别间相关性的网络个数，λ_m是各相关性的系数，为一个常数，同一类别在不同网络下的相关性的权重系数，在训练中可以根据实际情况设定权重λ_m的值，灵活的应用各网络的相关性。

步骤S4的具体步骤如下：当

时，则使用优化后的损失函数ER-Loss，一旦溢出则使用原来的交叉熵损失函数计算(换种说法就是,当

时，则使用优化后的损失函数ER-Loss，否则使用原来的交叉熵损失函数计算)。

步骤S5包括以下训练方式：

A、第一种训练方式如下：共进行两次训练，第一次训练为初步训练，先使用原来的交叉熵损失函数训练初步模型，再使用初步模型测出数据集各类别之间的相关性，整理成相关性表格再进行正式训练，第二次训练则使用ER-Loss进行正式训练，在正式训练时以索引的方式把每个物品类别的相关项加入到ER-Loss中计算，针对初步模型对每个图片的识别情况，从相关性表格中搜索到对应的惩罚项加入到ER-Loss中计算；

B、第二种训练方式如下：只进行一次训练，共N个epoch，训练包括两个阶段，第一个阶段取epoch＝int[kN]时的模型作为初步模型，其中0＜k＜1，用初步模型测出数据集各类别之间的相关性，整理成相关性表格，第二个阶段则使用ER-Loss从epoch＝int[kN]+1处开始断点续训，其中0＜k＜1，在断点续训过程中，针对模型对每个图片的识别情况，从相关性表格中搜索到对应的惩罚项加入到损失函数中计算；

C、第三种训练方式如下：共进行两个阶段,并且多次训练,第一阶段为预训练，首先使用不同网络分别对数据集进行预训练，接着使用各初步模型分别测出各类别在不同网络下的相关项以及它们之间的相关性，整理成相关性表格，并根据实际情况设定相关性组合公式中的相关性权重矩阵λ，将各网络相关性和相关性权重矩阵λ相乘得到最终相关性X＝∑_m(λ_mX_ijdm),通过均值的手段计算放大因子A的初始值；第二阶段为正式训练，调用相关性表格及权重矩阵λ重构损失函数，并形成新的损失函数ER-Loss，使用ER-Loss进行正式训练，在正式训练时以索引的方式把每个物品类别的相关项及它们之间的相关性和模型实际犯错的概率加入到ER-Loss中计算，针对初步模型对每个图片的识别情况，从相关性表格中搜索到对应的惩罚项加入到ER-Loss中计算。

本发明的有益效果是：与现有技术相比，本发明通过惩罚程度调节系数A_prob动态调节放大因子A，识别更加灵活，提高了模型对物品识别的精度，降低得到的结果与实际结果之间的偏差，能有效地提高深度学习网络模型的识别准确程度。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明的步骤流程图；

图2是第一种训练方式的步骤流程图；

图3是第二种训练方式的步骤流程图；

图4是第三种训练方式的步骤流程图。

具体实施方式

参照图1至图4，一种以错因强化方式动态优化损失函数的物品识别方法，优化后的损失函数取名为ER-Loss，在原来的交叉熵损失函数的基础上加入惩罚项实现,惩罚项包含以下四个模块:

在各网络下，数据集各类别之间的相关性组合X，通过初步模型测试所有物品类别的输出，并使用信息熵公式计算后获得相关性X_ijd，随后根据实际情况设定权重矩阵λ对各网络相关性进行线性组合得到X；