CN111784595A - 一种基于历史记录的动态标签平滑加权损失方法及装置 - Google Patents

一种基于历史记录的动态标签平滑加权损失方法及装置 Download PDF

Info

Publication number
CN111784595A
CN111784595A CN202010525632.5A CN202010525632A CN111784595A CN 111784595 A CN111784595 A CN 111784595A CN 202010525632 A CN202010525632 A CN 202010525632A CN 111784595 A CN111784595 A CN 111784595A
Authority
CN
China
Prior art keywords
image
machine learning
learning model
history
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010525632.5A
Other languages
English (en)
Other versions
CN111784595B (zh
Inventor
班晓娟
白广栋
姜淑芳
马博渊
王宇
杨星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
General Hospital of Chinese PLA Hainan Branch
Original Assignee
University of Science and Technology Beijing USTB
General Hospital of Chinese PLA Hainan Branch
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB, General Hospital of Chinese PLA Hainan Branch filed Critical University of Science and Technology Beijing USTB
Priority to CN202010525632.5A priority Critical patent/CN111784595B/zh
Publication of CN111784595A publication Critical patent/CN111784595A/zh
Application granted granted Critical
Publication of CN111784595B publication Critical patent/CN111784595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于历史记录的动态标签平滑加权损失方法及装置,属于图像处理技术领域。所述方法包括:S1,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;S2,在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;S3,在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代,直至训练完成。采用本发明,能够解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。

Description

一种基于历史记录的动态标签平滑加权损失方法及装置
技术领域
本发明涉及图像处理技术领域,特别涉及是指一种基于历史记录的动态标签平滑加权损失方法及装置。
背景技术
分类是数据挖掘中的一种常用的数据分析形式,通常适用于预测数据的类别(或类别的概率),而不是连续的数值。在实际应用中,受限于对数据的理解或任务的要求,不同类别的数据之间存在相似性,从而影响数据挖掘模型的学习过程,致使模型输出错误的分类结果。
以细胞癌变图像数据分类应用场景为例,细胞的癌变是一个连续的过程,无法设定绝对的阈值以定量地区分当前细胞属于哪个阶段。比如宫颈异常细胞癌变过程中包含4个阶段(类别),非典型鳞状细胞-意义不明确(ASC-US),非典型鳞状细胞-不除外高度病变(ASC-H),低度鳞状上皮内病变(LSIL),高度鳞状上皮内病变(HSIL)。处于上述四个阶段的细胞在视觉特征较为相似,导致专家在部分过渡阶段的细胞标注过程中较易产生分歧。因此,手工标记的这些细胞是非常繁琐且高度主观的,对于部分细胞图像不能完全确定该图像是否属于某个类别。如果使用传统的交叉熵进行计算损失函数,会导致过拟合的问题,且在训练过程模型准确度变化不稳定。
对于这个问题,Xiang等提出利用label smoothing的损失函数,[Yao Xiang,Wanxin Sun et al.A Lovel Automation-Assisted Cervical Cancer Reading MethodBased on Convolutional Leural Letwork[J].arXiv:1912.06649,2019.],通过直接对该图像数据标签的one-hot编码(一位有效编码)进行修改,将该图像所属的真实标签值降低0.1权重,并将该0.1权重平均增加到其他类别上,最后用这种平滑的标签组成新的权重,并结合交叉熵计算损失值。该方法平滑后的标签权重是固定不变的,存在两个问题,一是它表明该图属于本类别的权重固定在0.9,不符合实际应用情况;二是该图像属于其他类别的权重相同,不能体现和具体哪个类别更相似,从而无法驱使模型学习难分类别样本的特征。
发明内容
本发明实施例提供了基于历史记录的动态标签平滑加权损失方法及装置,能够解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题,所述技术方案如下:
一方面,提供了一种基于历史记录的动态标签平滑加权损失方法,该方法应用于电子设备,该方法包括:
S1,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
S2,在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
S3,在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代,直至训练完成。
进一步地,所述在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型包括:
根据第一图像对应的历史队列,计算第一图像属于其他类别的权重wi,其中,第一图像为任一图像;
根据得到权重wi,计算第一图像属于真实类别的权重wt;
将权重wi、wt与交叉熵函数相结合计算损失Loss,以优化所述机器学习模型。
进一步地,权重wi表示为:
Figure BDA0002533686590000021
其中,L为第一图像对应的历史队列的长度;numi为第一图像对应的历史队列中属于类别i的个数,i取值范围为[1…k],k为类别总数,i不等于t,t为真实类别;α为超参数并满足α<=b,以保证第一图像属于其他类别的整体权重不高于b。
进一步地,权重wt表示为:
Figure BDA0002533686590000022
进一步地,损失Loss表示为:
Figure BDA0002533686590000031
其中,k为类别的总数;wj为各个类别的权重,j取值范围为[1...k];pj为在本次迭代过程中,机器学习模型预测到的第一图像所属的类别。
进一步地,所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。
进一步地,所述利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列包括:
根据所述机器学习模型预测到的每个图像所属的类别,按照先入先出的顺序更新相应的历史队列,在更新过程中保持历史队列长度不变。
一方面,提供了一种基于历史记录的动态标签平滑加权损失装置,该装置应用于电子设备,该装置包括:
建立单元,用于为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
确定单元,用于在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
更新单元,用于在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回确定单元继续迭代,直至训练完成。
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
本发明实施例中,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代,直至训练完成。这样,由于历史队列的标签类别在训练过程中实时的变化,使得计算各个类别的权重也能够实时变化,这种变化的权重实现了实时平滑标签,其能够体现图像所属的类别和属于其他类别的相似程度,从而降低预测结果与相似类别的惩罚,避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象,最终提高识别、分类的准确率,从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于历史记录的动态标签平滑加权损失方法的流程示意图;
图2为本发明实施例提供的ASC-US、ASC-H、LSIL、HSIL类别的宫颈异常细胞示意图;
图3为本发明实施例提供的在Restnet50基线模型下,对参数L和α取不同值时的实验结果示意图;
图4为本发明实施例提供的一个历史队列变化到相应权重的权重结果示意图;
图5为本发明实施例提供的在Restnet50基线模型下,不同损失函数在数据集训练过程中验证集准确度随训练周期数变化的对比示意图;
图6是本发明实施例提供的基于历史记录的动态标签平滑加权损失装置的结构示意图;
图7是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
如图1所示,本发明实施例提供了一种基于历史记录的动态标签平滑加权损失方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器,该方法包括:
S1,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
S2,在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
S3,在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代,直至训练完成。
本发明实施例所述的基于历史记录的动态标签平滑加权损失方法,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代,直至训练完成。这样,由于历史队列的标签类别在训练过程中实时的变化,使得计算各个类别的权重也能够实时变化。在模型训练过程中,抛弃绝对的权重(0或1),而采用过渡的权重(0和1之间的浮点值)对损失函数进行加权称之为标签平滑,本发明在计算过程中实现了权重实时变化,进而实现了实时平滑标签,其能够体现图像所属的类别和属于其他类别的相似程度,从而降低预测结果与相似类别的惩罚,避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象,最终提高识别、分类的准确率,从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。
本实施例中,以对宫颈异常细胞的4种的类别(ASC-US、ASC-H、LSIL、HSIL)分类来更好地对本发明所述的基于历史记录的动态标签平滑加权损失方法进行说明,如图2所示的4种类别的图像示例,每种类别包括单个细胞和细胞群状态图像示例,从图2可以直接看出它们在视觉纹理上非常相似。
本实施例中,根据每个图像真实的标签类别,建立一个固定长度的历史队列;所述历史队列固定长度为L,历史队列中的初始值为该图像的真实标签类别。
本实施例中,以Restnet50(残差网络)模型为例,通过在Restnet50模型下对历史队列长度L进行实验,如图3(a)所示,当L取值为5,能获得最好效果。因此,本实施例中历史队列固定长度L取值为5。
本实施例中,每个图像的真实标签类别会对应一个数字,假设,ASC-US对应1,ASC-H对应2,LSIL对应3,HSIL对应4。如图4(a)所示为一个ASC-US类别的图像的初始历史队列示例图。
为了方便后续使用与更新历史队列,把所有图像名与它对应的历史队列统一放入一个字典中,键为图像名,值为历史队列。
本实施例中,所述在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型(S2)包括:
S21,根据第一图像对应的历史队列,计算第一图像属于其他类别的权重wi,其中,第一图像为任一图像;
本实施例中,权重wi表示为:
Figure BDA0002533686590000061
其中,L为第一图像对应的历史队列的长度;numi为第一图像对应的历史队列中属于类别i的个数,i取值范围为[1...k],k为类别总数,i不等于t,t为真实类别;α为超参数并满足α<=b,以保证第一图像属于其他类别的整体权重不高于b。
本实施例中,通过在Restnet50模型下对超参数α进行实验,如图3(b)所示,b取值为0.5,能获得最好效果。还可以得出当α=0.6时好于α=0.2的结果,但是由于不符合实际意义,建议不要使用。因此,本实施例中,优选地,超参数b取值为0.5,即:α<=0.5,表示保证第一图像属于其他类别的整体权重不高于0.5。
S22,根据得到权重wi,计算第一图像属于真实类别的权重wt;其中,权重wt表示为:
Figure BDA0002533686590000062
这样,保证了第一图像属于某个类别整体权重和为1。由于α<=0.5,也保证了该图像的属于真实的类别t权重不小于0.5。
本实施例中,最终得到第一图像属于各个类别权重[w1,w2,w3,w4]。如图4(c)是一个ASC-US类别图像训练一段时间后根据这时的历史队列图4(b)计算的权重结果,从结果中可以直接看出该类别与其他类别的相似程度。
S23,将权重wi、wt与交叉熵函数相结合计算损失Loss,以优化所述机器学习模型。
在传统的图像分类任务中交叉熵损失函数为:
Figure BDA0002533686590000071
其中,K为类别的总数;qj为实际的标签,采用one-hot编码形式,one-hot编码是一个二进制向量,该实际标签位置被标记为1,其他位置都是0;pj为在本次迭代过程中,所述机器学习模型预测该图像所属的类别。
本实施例中,新的损失Loss计算公式为:
Figure BDA0002533686590000072
其中,k为类别的总数;wj为各个类别的权重,j取值范围为[1...k];pj为在本次迭代过程中,机器学习模型预测到的第一图像所属的类别。
本实施例中,所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。
本实施例中,根据所述损失值,可以使用梯度下降方法优化所述机器学习模型的参数,例如,优化卷积神经网络中的卷积核参数。
本实施例中,根据这种新的损失方法训练出的机器学习模型,其验证集上的准确度变化更稳定,结果更优越,可以从如图5得出。
本实施例中,优选地,在S3中,可以根据所述机器学习模型预测到的每个图像所属的类别,按照先入先出的顺序更新相应的历史队列,在更新过程中保持历史队列长度不变。
本实施例中,为充分证明本发明实施例提出的基于历史记录的动态标签平滑加权损失(Hrdlswce)方法的有效性,将其与交叉熵(Cross Entropy,CE),Focal Loss和标签平滑(LabelSmoothingLoss,LS)3种常用的损失函数在3种基线模型上进行对比。
本实施例中,本实施例采用3种常见的图像分类模型,分别是Restnet系列模型中的Restnet50,VGG系列模型中的VGG19,Inception系列模型中的Inception v3作为3种基线模型。
本实施例中,基线模型是指用于实验所选择的基本模型,可以为任一种分类模型,在本实施例中,选择多种基线模型是为了证明基于历史记录的动态标签平滑加权损失方法的泛用能力。
本实施例中,选择宫颈异常细胞图像作为数据集。数据集的图像是在20倍显微镜下扫描液基薄层细胞涂片得到的,再由两名医师共同标注出4种异常的细胞或细胞群位置,对于有异议的标注再由第三名医师确认。标注完成后,剪切出其标注位置,形成宫颈异常细胞图像数据集。
本实施例中,从数据集中选取70%的数据作为训练集,20%的数据作为测试集,10%的数据作为验证集。在训练过程中,保存在验证集上性能最好的模型参数,并在测试集上进行测试获得评估结果。
本实施例中采用的实验参数:本实施例所有实验均采用如下指标:50轮次(Epoch),初始学习率为1e-3,学习率逐级衰减策略(StepLR),SGD梯度下降法,Batch Size为96。
本实施例中采用的实验机器:本实施例所有实验均在装备4台Nvidia Tesla V100(32GB显存)的工作站上进行测试。
本实施例中采用的评价指标:本实施例选择准确率(Accuracy)作为评估指标,计算方式如下:
Figure BDA0002533686590000081
其中,TP指模型把正样本预测为正样本的数目,TN模型把负样本预测为负样本的数目,FP指模型把负样本预测为正样本的数目,FN指模型把正样本预测为负样本的数目。
实验结果:实验结果如表1所示。
表1 用不同损失函数在不同模型上的准确率(Accuracy)对比
Figure BDA0002533686590000082
由表1得,本实施例提出的方法的性能在该数据集上,在3种基线模型上均超过其他3种常见的损失函数,充分说明本实施例提出的方法特别在各类别间存在的相似性的分类任务中的分辨能力更高,分类效果更好。
本发明实施例与现有技术相比,具有以下特点及有益效果:
(1)稳定性:每个图像的历史队列平稳变化,进而根据历史队列形成的损失也处于稳定变化,不会出现大量的图像在上一轮迭代中分类正确而在本轮迭代中分类出错导致的强烈的抖动。
(2)可解释性:由于各类别间相似度较高,专家无法准确识别图像所属的类别,标签平滑权重通过给相似类别赋予附加的概率可较好的反映该现象,因而有着很好的解释性。
(3)优异性:由于历史队列实时变化,形成的平滑标签权重不是one-hot编码,因此不会让模型生硬地学习并优化参数,在学习过程中,标签平滑权重平稳地驱使机器学习模型获得正确的识别结果,提高了分类的准确率。
本发明还提供一种基于历史记录的动态标签平滑加权损失装置的具体实施方式,由于本发明提供的基于历史记录的动态标签平滑加权损失装置与前述基于历史记录的动态标签平滑加权损失方法的具体实施方式相对应,该基于历史记录的动态标签平滑加权损失装置可以通过执行上述方法具体实施方式中的流程步骤来实现本发明的目的,因此上述基于历史记录的动态标签平滑加权损失方法具体实施方式中的解释说明,也适用于本发明提供的基于历史记录的动态标签平滑加权损失装置的具体实施方式,在本发明以下的具体实施方式中将不再赘述。
如图6所示,本发明实施例还提供一种基于历史记录的动态标签平滑加权损失装置,该装置包括:
建立单元11,用于为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
确定单元12,用于在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
更新单元13,用于在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回确定单元继续迭代,直至训练完成。
本发明实施例所述的基于历史记录的动态标签平滑加权损失装置,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回继续执行下一次迭代,直至训练完成。这样,由于历史队列的标签类别在训练过程中实时的变化,使得计算各个类别的权重也能够实时变化,这种变化的权重实现了实时平滑标签,其能够体现图像所属的类别和属于其他类别的相似程度,从而降低预测结果与相似类别的惩罚,避免机器学习模型在学习过程中因完全偏向图像所属的实际类别而产生的过拟合现象,最终提高识别、分类的准确率,从而解决分类任务中因各类别间存在相似性而导致机器学习模型识别准确率低的问题。
图7是本发明实施例提供的一种电子设备600的结构示意图,该电子设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)601和一个或一个以上的存储器602,其中,所述存储器602中存储有至少一条指令,所述至少一条指令由所述处理器601加载并执行以实现上述基于历史记录的动态标签平滑加权损失方法。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述基于历史记录的动态标签平滑加权损失方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于历史记录的动态标签平滑加权损失方法,其特征在于,包括:
S1,为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
S2,在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
S3,在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回S2继续迭代,直至训练完成。
2.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,所述在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型包括:
根据第一图像对应的历史队列,计算第一图像属于其他类别的权重wi,其中,第一图像为任一图像;
根据得到权重wi,计算第一图像属于真实类别的权重wt
将权重wi、wt与交叉熵函数相结合计算损失Loss,以优化所述机器学习模型。
3.根据权利要求2所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,权重wi表示为:
Figure FDA0002533686580000011
其中,L为第一图像对应的历史队列的长度;numi为第一图像对应的历史队列中属于类别i的个数,i取值范围为[1...k],k为类别总数,i不等于t,t为真实类别;α为超参数并满足α<=b,以保证第一图像属于其他类别的整体权重不高于b。
4.根据权利要求3所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,权重wt表示为:
Figure FDA0002533686580000012
5.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,损失Loss表示为:
Figure FDA0002533686580000021
其中,k为类别的总数;wj为各个类别的权重,j取值范围为[1...k];pj为在本次迭代过程中,机器学习模型预测到的第一图像所属的类别。
6.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,所述机器学习模型为人工神经网络、卷积神经网络中的一种或多种的组合。
7.根据权利要求1所述的基于历史记录的动态标签平滑加权损失方法,其特征在于,所述利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列包括:
根据所述机器学习模型预测到的每个图像所属的类别,按照先入先出的顺序更新相应的历史队列,在更新过程中保持历史队列长度不变。
8.一种基于历史记录的动态标签平滑加权损失装置,其特征在于,包括:
建立单元,用于为每个图像分别建立一个固定长度的历史队列,其中,历史队列中的初始值为相应图像真实的标签类别;
确定单元,用于在机器学习模型每次迭代训练时,根据历史队列计算相应的图像属于真实类别和属于其他类别的权重,并将得到的权重与交叉熵函数相结合计算损失,以优化所述机器学习模型;
更新单元,用于在每次迭代训练完成后,利用所述机器学习模型预测到的每个图像所属的类别更新相应的历史队列并返回确定单元继续迭代,直至训练完成。
CN202010525632.5A 2020-06-10 2020-06-10 一种基于历史记录的动态标签平滑加权损失方法及装置 Active CN111784595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010525632.5A CN111784595B (zh) 2020-06-10 2020-06-10 一种基于历史记录的动态标签平滑加权损失方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010525632.5A CN111784595B (zh) 2020-06-10 2020-06-10 一种基于历史记录的动态标签平滑加权损失方法及装置

Publications (2)

Publication Number Publication Date
CN111784595A true CN111784595A (zh) 2020-10-16
CN111784595B CN111784595B (zh) 2023-08-29

Family

ID=72757394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010525632.5A Active CN111784595B (zh) 2020-06-10 2020-06-10 一种基于历史记录的动态标签平滑加权损失方法及装置

Country Status (1)

Country Link
CN (1) CN111784595B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418283A (zh) * 2020-11-13 2021-02-26 三六零智慧科技(天津)有限公司 用于目标检测的标签平滑方法、装置、设备及存储介质
CN113033219A (zh) * 2021-03-25 2021-06-25 北京百度网讯科技有限公司 模型训练方法、装置、电子设备及计算机可读存储介质
CN114418995A (zh) * 2022-01-19 2022-04-29 生态环境部长江流域生态环境监督管理局生态环境监测与科学研究中心 一种基于显微镜图像的级联藻类细胞统计方法
CN116994343A (zh) * 2023-09-27 2023-11-03 睿云联(厦门)网络通讯技术有限公司 基于标签平滑的扩散标签深度学习模型训练方法及介质
WO2024119901A1 (zh) * 2022-12-06 2024-06-13 成都云天励飞技术有限公司 识别模型训练方法、装置、计算机设备及存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529604A (zh) * 2016-11-24 2017-03-22 苏州大学 一种自适应的图像标签鲁棒预测方法及系统
CN107292330A (zh) * 2017-05-02 2017-10-24 南京航空航天大学 一种基于监督学习和半监督学习双重信息的迭代式标签噪声识别算法
CN108665002A (zh) * 2018-05-11 2018-10-16 中山大学 一种二分类任务标签噪声容忍分类器学习方法
CN109871885A (zh) * 2019-01-28 2019-06-11 南京林业大学 一种基于深度学习和植物分类学的植物识别方法
CN110110780A (zh) * 2019-04-30 2019-08-09 南开大学 一种基于对抗神经网络和海量噪声数据的图片分类方法
WO2019167883A1 (ja) * 2018-02-28 2019-09-06 富士フイルム株式会社 機械学習装置および方法
CN110334808A (zh) * 2019-06-12 2019-10-15 武汉大学 一种基于对抗样本训练的对抗攻击防御方法
CN110490239A (zh) * 2019-08-06 2019-11-22 腾讯医疗健康(深圳)有限公司 图像质控网络的训练方法、质量分类方法、装置及设备
CN110598728A (zh) * 2019-07-23 2019-12-20 杭州电子科技大学 基于图平衡正则化的半监督超限学机分类方法
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111199242A (zh) * 2019-12-18 2020-05-26 浙江工业大学 一种基于动态修正向量的图像增量学习方法
CN111222648A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 半监督机器学习优化方法、装置、设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529604A (zh) * 2016-11-24 2017-03-22 苏州大学 一种自适应的图像标签鲁棒预测方法及系统
CN107292330A (zh) * 2017-05-02 2017-10-24 南京航空航天大学 一种基于监督学习和半监督学习双重信息的迭代式标签噪声识别算法
WO2019167883A1 (ja) * 2018-02-28 2019-09-06 富士フイルム株式会社 機械学習装置および方法
CN108665002A (zh) * 2018-05-11 2018-10-16 中山大学 一种二分类任务标签噪声容忍分类器学习方法
CN109871885A (zh) * 2019-01-28 2019-06-11 南京林业大学 一种基于深度学习和植物分类学的植物识别方法
CN110110780A (zh) * 2019-04-30 2019-08-09 南开大学 一种基于对抗神经网络和海量噪声数据的图片分类方法
CN110334808A (zh) * 2019-06-12 2019-10-15 武汉大学 一种基于对抗样本训练的对抗攻击防御方法
CN110598728A (zh) * 2019-07-23 2019-12-20 杭州电子科技大学 基于图平衡正则化的半监督超限学机分类方法
CN110490239A (zh) * 2019-08-06 2019-11-22 腾讯医疗健康(深圳)有限公司 图像质控网络的训练方法、质量分类方法、装置及设备
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111199242A (zh) * 2019-12-18 2020-05-26 浙江工业大学 一种基于动态修正向量的图像增量学习方法
CN111222648A (zh) * 2020-01-15 2020-06-02 深圳前海微众银行股份有限公司 半监督机器学习优化方法、装置、设备及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
C. -B. ZHANG等: "Delving Deep Into Label Smoothing", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》, vol. 30, pages 5984 - 5996 *
DAIKI TANAKA等: "Joint Optimization Framework for Learning with Noisy Labels", 《ARXIV》, pages 1 - 11 *
XIANG, YAO等: "A novel automation-assisted cervical cancer reading method based on convolutional neural network", 《BIOCYBERNETICS AND BIOMEDICAL ENGINEERING》, vol. 40, no. 2, pages 611 - 623 *
倪旭: "基于标签平滑正则化的行人重识别研究", 《电脑知识与技术》, vol. 15, no. 8, pages 150 - 152 *
田勋: "基于半监督学习的图像分类算法研究与应用", 《中国优秀硕士学位论文全文数据库:工程科技Ⅱ辑》, no. 7, pages 1 - 75 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418283A (zh) * 2020-11-13 2021-02-26 三六零智慧科技(天津)有限公司 用于目标检测的标签平滑方法、装置、设备及存储介质
CN112418283B (zh) * 2020-11-13 2023-07-11 三六零智慧科技(天津)有限公司 用于目标检测的标签平滑方法、装置、设备及存储介质
CN113033219A (zh) * 2021-03-25 2021-06-25 北京百度网讯科技有限公司 模型训练方法、装置、电子设备及计算机可读存储介质
CN114418995A (zh) * 2022-01-19 2022-04-29 生态环境部长江流域生态环境监督管理局生态环境监测与科学研究中心 一种基于显微镜图像的级联藻类细胞统计方法
WO2024119901A1 (zh) * 2022-12-06 2024-06-13 成都云天励飞技术有限公司 识别模型训练方法、装置、计算机设备及存储介质
CN116994343A (zh) * 2023-09-27 2023-11-03 睿云联(厦门)网络通讯技术有限公司 基于标签平滑的扩散标签深度学习模型训练方法及介质
CN116994343B (zh) * 2023-09-27 2023-12-15 睿云联(厦门)网络通讯技术有限公司 基于标签平滑的扩散标签深度学习模型训练方法及介质

Also Published As

Publication number Publication date
CN111784595B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
Alibrahim et al. Hyperparameter optimization: Comparing genetic algorithm against grid search and bayesian optimization
CN111784595A (zh) 一种基于历史记录的动态标签平滑加权损失方法及装置
CN108563624A (zh) 一种基于深度学习的自然语言生成方法
CN108536784B (zh) 评论信息情感分析方法、装置、计算机存储介质和服务器
CN113128671B (zh) 一种基于多模态机器学习的服务需求动态预测方法及系统
CN111653275B (zh) 基于lstm-ctc尾部卷积的语音识别模型的构建方法及装置、语音识别方法
CN111127364A (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
CN110929640B (zh) 一种基于目标检测的宽幅遥感描述生成方法
CN113011532B (zh) 分类模型训练方法、装置、计算设备及存储介质
CN113128478A (zh) 模型训练方法、行人分析方法、装置、设备及存储介质
CN115511012B (zh) 一种最大熵约束的类别软标签识别训练方法
CN116894985B (zh) 半监督图像分类方法及半监督图像分类系统
CN114298290A (zh) 一种基于自监督学习的神经网络编码方法及编码器
KR20240034804A (ko) 자동 회귀 언어 모델 신경망을 사용하여 출력 시퀀스 평가
CN113822434A (zh) 用于知识蒸馏的模型选择学习
CN112488188A (zh) 一种基于深度强化学习的特征选择方法
CN116630694A (zh) 一种偏多标记图像的目标分类方法、系统及电子设备
CN111259673A (zh) 一种基于反馈序列多任务学习的法律判决预测方法及系统
CN110851600A (zh) 基于深度学习的文本数据处理方法及装置
CN113887653B (zh) 一种基于三元网络的紧耦合弱监督学习的定位方法及系统
CN115329863A (zh) 一种新的线性整流梯度平衡损失函数分类方法及系统
CN115116614A (zh) 一种健康状态评估方法、装置、设备及存储介质
CN114328923A (zh) 一种基于多任务双边分支网络的引文意图分类方法
CN113837220A (zh) 基于在线持续学习的机器人目标识别方法、系统及设备
CN113487453A (zh) 基于犯罪要素的法律判决预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant