CN111784595A

CN111784595A - 一种基于历史记录的动态标签平滑加权损失方法及装置

Info

Publication number: CN111784595A
Application number: CN202010525632.5A
Authority: CN
Inventors: 班晓娟; 白广栋; 姜淑芳; 马博渊; 王宇; 杨星
Original assignee: University of Science and Technology Beijing USTB; General Hospital of Chinese PLA Hainan Branch
Current assignee: University of Science and Technology Beijing USTB; General Hospital of Chinese PLA Hainan Branch
Priority date: 2020-06-10
Filing date: 2020-06-10
Publication date: 2020-10-16
Anticipated expiration: 2040-06-10
Also published as: CN111784595B

Abstract

本发明提供一种基于历史记录的动态标签平滑加权损失方法及装置，属于图像处理技术领域。所述方法包括：S1，为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；S2，在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；S3，在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代，直至训练完成。采用本发明，能够解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。

Description

一种基于历史记录的动态标签平滑加权损失方法及装置

技术领域

本发明涉及图像处理技术领域，特别涉及是指一种基于历史记录的动态标签平滑加权损失方法及装置。

背景技术

分类是数据挖掘中的一种常用的数据分析形式，通常适用于预测数据的类别(或类别的概率)，而不是连续的数值。在实际应用中，受限于对数据的理解或任务的要求，不同类别的数据之间存在相似性，从而影响数据挖掘模型的学习过程，致使模型输出错误的分类结果。

以细胞癌变图像数据分类应用场景为例，细胞的癌变是一个连续的过程，无法设定绝对的阈值以定量地区分当前细胞属于哪个阶段。比如宫颈异常细胞癌变过程中包含4个阶段(类别)，非典型鳞状细胞-意义不明确(ASC-US)，非典型鳞状细胞-不除外高度病变(ASC-H)，低度鳞状上皮内病变(LSIL)，高度鳞状上皮内病变(HSIL)。处于上述四个阶段的细胞在视觉特征较为相似，导致专家在部分过渡阶段的细胞标注过程中较易产生分歧。因此，手工标记的这些细胞是非常繁琐且高度主观的，对于部分细胞图像不能完全确定该图像是否属于某个类别。如果使用传统的交叉熵进行计算损失函数，会导致过拟合的问题，且在训练过程模型准确度变化不稳定。

对于这个问题，Xiang等提出利用label smoothing的损失函数，[Yao Xiang,Wanxin Sun et al.A Lovel Automation-Assisted Cervical Cancer Reading MethodBased on Convolutional Leural Letwork[J].arXiv:1912.06649,2019.]，通过直接对该图像数据标签的one-hot编码(一位有效编码)进行修改，将该图像所属的真实标签值降低0.1权重，并将该0.1权重平均增加到其他类别上，最后用这种平滑的标签组成新的权重，并结合交叉熵计算损失值。该方法平滑后的标签权重是固定不变的，存在两个问题，一是它表明该图属于本类别的权重固定在0.9，不符合实际应用情况；二是该图像属于其他类别的权重相同，不能体现和具体哪个类别更相似，从而无法驱使模型学习难分类别样本的特征。

发明内容

本发明实施例提供了基于历史记录的动态标签平滑加权损失方法及装置，能够解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题，所述技术方案如下：

一方面，提供了一种基于历史记录的动态标签平滑加权损失方法，该方法应用于电子设备，该方法包括：

S1，为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；

S2，在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；

S3，在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代，直至训练完成。

进一步地，所述在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型包括：

根据第一图像对应的历史队列，计算第一图像属于其他类别的权重wi，其中，第一图像为任一图像；

根据得到权重wi，计算第一图像属于真实类别的权重wt；

将权重wi、wt与交叉熵函数相结合计算损失Loss，以优化所述机器学习模型。

进一步地，权重wi表示为：

其中，L为第一图像对应的历史队列的长度；numi为第一图像对应的历史队列中属于类别i的个数，i取值范围为[1…k]，k为类别总数，i不等于t，t为真实类别；α为超参数并满足α<＝b，以保证第一图像属于其他类别的整体权重不高于b。

进一步地，权重wt表示为：

进一步地，损失Loss表示为：

其中，k为类别的总数；w_j为各个类别的权重，j取值范围为[1...k]；p_j为在本次迭代过程中，机器学习模型预测到的第一图像所属的类别。

进一步地，所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。

进一步地，所述利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列包括：

根据所述机器学习模型预测到的每个图像所属的类别，按照先入先出的顺序更新相应的历史队列，在更新过程中保持历史队列长度不变。

一方面，提供了一种基于历史记录的动态标签平滑加权损失装置，该装置应用于电子设备，该装置包括：

建立单元，用于为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；

确定单元，用于在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；

更新单元，用于在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回确定单元继续迭代，直至训练完成。

一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。

本发明实施例提供的技术方案带来的有益效果至少包括：

本发明实施例中，为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代，直至训练完成。这样，由于历史队列的标签类别在训练过程中实时的变化，使得计算各个类别的权重也能够实时变化，这种变化的权重实现了实时平滑标签，其能够体现图像所属的类别和属于其他类别的相似程度，从而降低预测结果与相似类别的惩罚，避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象，最终提高识别、分类的准确率，从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于历史记录的动态标签平滑加权损失方法的流程示意图；

图2为本发明实施例提供的ASC-US、ASC-H、LSIL、HSIL类别的宫颈异常细胞示意图；

图3为本发明实施例提供的在Restnet50基线模型下，对参数L和α取不同值时的实验结果示意图；

图4为本发明实施例提供的一个历史队列变化到相应权重的权重结果示意图；

图5为本发明实施例提供的在Restnet50基线模型下，不同损失函数在数据集训练过程中验证集准确度随训练周期数变化的对比示意图；

图6是本发明实施例提供的基于历史记录的动态标签平滑加权损失装置的结构示意图；

图7是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

如图1所示，本发明实施例提供了一种基于历史记录的动态标签平滑加权损失方法，该方法可以由电子设备实现，该电子设备可以是终端或服务器，该方法包括：

本发明实施例所述的基于历史记录的动态标签平滑加权损失方法，为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代，直至训练完成。这样，由于历史队列的标签类别在训练过程中实时的变化，使得计算各个类别的权重也能够实时变化。在模型训练过程中，抛弃绝对的权重(0或1)，而采用过渡的权重(0和1之间的浮点值)对损失函数进行加权称之为标签平滑，本发明在计算过程中实现了权重实时变化，进而实现了实时平滑标签，其能够体现图像所属的类别和属于其他类别的相似程度，从而降低预测结果与相似类别的惩罚，避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象，最终提高识别、分类的准确率，从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。

本实施例中，以对宫颈异常细胞的4种的类别(ASC-US、ASC-H、LSIL、HSIL)分类来更好地对本发明所述的基于历史记录的动态标签平滑加权损失方法进行说明，如图2所示的4种类别的图像示例，每种类别包括单个细胞和细胞群状态图像示例，从图2可以直接看出它们在视觉纹理上非常相似。

本实施例中，根据每个图像真实的标签类别，建立一个固定长度的历史队列；所述历史队列固定长度为L，历史队列中的初始值为该图像的真实标签类别。

本实施例中，以Restnet50(残差网络)模型为例，通过在Restnet50模型下对历史队列长度L进行实验，如图3(a)所示，当L取值为5，能获得最好效果。因此，本实施例中历史队列固定长度L取值为5。

本实施例中，每个图像的真实标签类别会对应一个数字，假设，ASC-US对应1，ASC-H对应2，LSIL对应3，HSIL对应4。如图4(a)所示为一个ASC-US类别的图像的初始历史队列示例图。

为了方便后续使用与更新历史队列，把所有图像名与它对应的历史队列统一放入一个字典中，键为图像名，值为历史队列。

本实施例中，所述在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型(S2)包括：

S21，根据第一图像对应的历史队列，计算第一图像属于其他类别的权重w_i，其中，第一图像为任一图像；

本实施例中，权重w_i表示为：

其中，L为第一图像对应的历史队列的长度；num_i为第一图像对应的历史队列中属于类别i的个数，i取值范围为[1...k]，k为类别总数，i不等于t，t为真实类别；α为超参数并满足α<＝b，以保证第一图像属于其他类别的整体权重不高于b。

本实施例中，通过在Restnet50模型下对超参数α进行实验，如图3(b)所示，b取值为0.5，能获得最好效果。还可以得出当α＝0.6时好于α＝0.2的结果，但是由于不符合实际意义，建议不要使用。因此，本实施例中，优选地，超参数b取值为0.5，即：α<＝0.5，表示保证第一图像属于其他类别的整体权重不高于0.5。

S22，根据得到权重w_i，计算第一图像属于真实类别的权重w_t；其中，权重w_t表示为：

这样，保证了第一图像属于某个类别整体权重和为1。由于α<＝0.5，也保证了该图像的属于真实的类别t权重不小于0.5。

本实施例中，最终得到第一图像属于各个类别权重[w₁,w₂,w₃,w₄]。如图4(c)是一个ASC-US类别图像训练一段时间后根据这时的历史队列图4(b)计算的权重结果，从结果中可以直接看出该类别与其他类别的相似程度。

S23，将权重w_i、w_t与交叉熵函数相结合计算损失Loss，以优化所述机器学习模型。

在传统的图像分类任务中交叉熵损失函数为：

其中，K为类别的总数；q_j为实际的标签，采用one-hot编码形式，one-hot编码是一个二进制向量，该实际标签位置被标记为1，其他位置都是0；p_j为在本次迭代过程中，所述机器学习模型预测该图像所属的类别。

本实施例中，新的损失Loss计算公式为：

本实施例中，所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。

本实施例中，根据所述损失值，可以使用梯度下降方法优化所述机器学习模型的参数，例如，优化卷积神经网络中的卷积核参数。

本实施例中，根据这种新的损失方法训练出的机器学习模型，其验证集上的准确度变化更稳定，结果更优越，可以从如图5得出。

本实施例中，优选地，在S3中，可以根据所述机器学习模型预测到的每个图像所属的类别，按照先入先出的顺序更新相应的历史队列，在更新过程中保持历史队列长度不变。

本实施例中，为充分证明本发明实施例提出的基于历史记录的动态标签平滑加权损失(Hrdlswce)方法的有效性，将其与交叉熵(Cross Entropy，CE),Focal Loss和标签平滑(LabelSmoothingLoss,LS)3种常用的损失函数在3种基线模型上进行对比。

本实施例中，本实施例采用3种常见的图像分类模型，分别是Restnet系列模型中的Restnet50,VGG系列模型中的VGG19,Inception系列模型中的Inception v3作为3种基线模型。

本实施例中，基线模型是指用于实验所选择的基本模型，可以为任一种分类模型，在本实施例中，选择多种基线模型是为了证明基于历史记录的动态标签平滑加权损失方法的泛用能力。

本实施例中，选择宫颈异常细胞图像作为数据集。数据集的图像是在20倍显微镜下扫描液基薄层细胞涂片得到的，再由两名医师共同标注出4种异常的细胞或细胞群位置，对于有异议的标注再由第三名医师确认。标注完成后，剪切出其标注位置，形成宫颈异常细胞图像数据集。

本实施例中，从数据集中选取70％的数据作为训练集，20％的数据作为测试集，10％的数据作为验证集。在训练过程中，保存在验证集上性能最好的模型参数，并在测试集上进行测试获得评估结果。

本实施例中采用的实验参数：本实施例所有实验均采用如下指标：50轮次(Epoch)，初始学习率为1e-3，学习率逐级衰减策略(StepLR)，SGD梯度下降法，Batch Size为96。

本实施例中采用的实验机器：本实施例所有实验均在装备4台Nvidia Tesla V100(32GB显存)的工作站上进行测试。

本实施例中采用的评价指标：本实施例选择准确率(Accuracy)作为评估指标，计算方式如下：

其中，TP指模型把正样本预测为正样本的数目，TN模型把负样本预测为负样本的数目，FP指模型把负样本预测为正样本的数目，FN指模型把正样本预测为负样本的数目。

实验结果：实验结果如表1所示。

表1 用不同损失函数在不同模型上的准确率(Accuracy)对比

由表1得，本实施例提出的方法的性能在该数据集上，在3种基线模型上均超过其他3种常见的损失函数，充分说明本实施例提出的方法特别在各类别间存在的相似性的分类任务中的分辨能力更高，分类效果更好。

本发明实施例与现有技术相比，具有以下特点及有益效果：

(1)稳定性：每个图像的历史队列平稳变化，进而根据历史队列形成的损失也处于稳定变化，不会出现大量的图像在上一轮迭代中分类正确而在本轮迭代中分类出错导致的强烈的抖动。

(2)可解释性：由于各类别间相似度较高，专家无法准确识别图像所属的类别，标签平滑权重通过给相似类别赋予附加的概率可较好的反映该现象，因而有着很好的解释性。

(3)优异性：由于历史队列实时变化，形成的平滑标签权重不是one-hot编码，因此不会让模型生硬地学习并优化参数，在学习过程中，标签平滑权重平稳地驱使机器学习模型获得正确的识别结果，提高了分类的准确率。

本发明还提供一种基于历史记录的动态标签平滑加权损失装置的具体实施方式，由于本发明提供的基于历史记录的动态标签平滑加权损失装置与前述基于历史记录的动态标签平滑加权损失方法的具体实施方式相对应，该基于历史记录的动态标签平滑加权损失装置可以通过执行上述方法具体实施方式中的流程步骤来实现本发明的目的，因此上述基于历史记录的动态标签平滑加权损失方法具体实施方式中的解释说明，也适用于本发明提供的基于历史记录的动态标签平滑加权损失装置的具体实施方式，在本发明以下的具体实施方式中将不再赘述。

如图6所示，本发明实施例还提供一种基于历史记录的动态标签平滑加权损失装置，该装置包括：

建立单元11，用于为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；

确定单元12，用于在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；

更新单元13，用于在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回确定单元继续迭代，直至训练完成。

本发明实施例所述的基于历史记录的动态标签平滑加权损失装置，为每个图像分别建立一个固定长度的历史队列，其中，历史队列中的初始值为相应图像真实的标签类别；在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型；在每次迭代训练完成后，利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代，直至训练完成。这样，由于历史队列的标签类别在训练过程中实时的变化，使得计算各个类别的权重也能够实时变化，这种变化的权重实现了实时平滑标签，其能够体现图像所属的类别和属于其他类别的相似程度，从而降低预测结果与相似类别的惩罚，避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象，最终提高识别、分类的准确率，从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。

图7是本发明实施例提供的一种电子设备600的结构示意图，该电子设备600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)601和一个或一个以上的存储器602，其中，所述存储器602中存储有至少一条指令，所述至少一条指令由所述处理器601加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成上述基于历史记录的动态标签平滑加权损失方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于历史记录的动态标签平滑加权损失方法，其特征在于，包括：

2.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，所述在机器学习模型每次迭代训练时，根据历史队列计算相应的图像属于真实类别和属于其他类别的权重，并将得到的权重与交叉熵函数相结合计算损失，以优化所述机器学习模型包括：

根据第一图像对应的历史队列，计算第一图像属于其他类别的权重w_i，其中，第一图像为任一图像；

根据得到权重w_i，计算第一图像属于真实类别的权重w_t；

将权重w_i、w_t与交叉熵函数相结合计算损失Loss，以优化所述机器学习模型。

3.根据权利要求2所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，权重w_i表示为：

4.根据权利要求3所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，权重w_t表示为：

5.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，损失Loss表示为：

6.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。

7.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法，其特征在于，所述利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列包括：

8.一种基于历史记录的动态标签平滑加权损失装置，其特征在于，包括：