CN116310542A - 一种基于改进交叉熵损失函数的图像分类方法 - Google Patents

一种基于改进交叉熵损失函数的图像分类方法 Download PDF

Info

Publication number
CN116310542A
CN116310542A CN202310240788.2A CN202310240788A CN116310542A CN 116310542 A CN116310542 A CN 116310542A CN 202310240788 A CN202310240788 A CN 202310240788A CN 116310542 A CN116310542 A CN 116310542A
Authority
CN
China
Prior art keywords
image
loss function
image classification
entropy loss
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310240788.2A
Other languages
English (en)
Inventor
杨若瑜
熊伟明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202310240788.2A priority Critical patent/CN116310542A/zh
Publication of CN116310542A publication Critical patent/CN116310542A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进交叉熵损失函数的图像分类方法,包括:步骤1,搭建图像分类模型;步骤2,获取图像训练集;步骤3,利用图像训练集对图像分类模型进行训练,采用改进交叉熵损失函数计算损失值,迭代优化获得训练好的图像分类模型;步骤4,将待分类图像输入到训练好的图像分类模型中,获得分类预测结果。本发明基于改进交叉熵损失函数实现,能充分利用图像样本标签的信息,不仅惩罚神经网络误分类的行为,它还会惩罚经网络虽然分类正确但是对于输出类别置信度不够高的行为;在没有增加仍和任何的神经网络推理时间开销的情况下提升神经网络的分类性能。

Description

一种基于改进交叉熵损失函数的图像分类方法
技术领域
本发明属于深度学习技术领域,尤其涉及一种基于改进交叉熵损失函数的图像分类方法。
背景技术
现有技术中的图像分类任务,通常采用交叉熵损失函数训练模型解决分类任务。多分类交叉熵损失函的工作原理就是将softmax函数的输出向量中表示标签类别的概率尽可能变大(靠近1),它忽略了softmax的输出向量中对应为非标签类别的概率,尽管softmax函数本身可以把所有的这些概率关联起来,但是其强调的还是softmax函数分子部分的标签类别的概率,并没有考虑非标签类别的概率。因此交叉熵损失函数本身的特征表达区分度不够,从而导致图像分类精度不够高。
性能与速度是卷积神经网络应用中的两个矛盾方面,部分模型虽然能够获得更好的分类性能,但并不适合实际场景的应用。为了提升模型的精度需要增加模型的复杂度,这需要更多的计算时间完成模型的推理步骤,在要求低延迟的应用场景中,比如自动驾驶系统通过图像分类技术进行行人、路标和其他障碍物等物体的实时识别,这些复杂的模型是难以达到要求的。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于改进交叉熵损失函数的图像分类方法。
为了解决上述技术问题,本发明公开了一种基于改进交叉熵损失函数的图像分类方法,包括以下步骤:
步骤1,搭建图像分类模型;
步骤2,获取图像训练集;
步骤3,利用图像训练集对图像分类模型进行训练,采用改进交叉熵损失函数计算损失值,迭代优化获得训练好的图像分类模型;
步骤4,将待分类图像输入到训练好的图像分类模型中,获得分类预测结果。
进一步地,步骤1中所述图像分类模型采用神经网络模型,所述神经网络模型采用卷积网络或者基于Transformer的自注意神经网络;将神经网络表示为f;步骤2中所述图像训练集表示为{(xi,yi)|i∈{1,...,N}},xi是图像训练集中的图像样本,yi是标签,yi∈{1,...,K},K表示分类任务数,K≥3,N是样本数,N≥1;将标签yi∈{1,...,K}转变成独热(one-hot)编码表示:yi=(0,...,1,...,0)∈RK
进一步地,步骤3包括:
步骤3.1,初始化图像分类模型的权重,设置图像分类模型的网络参数和训练超参数;
步骤3.2,加载图像训练集,对图像训练集中的训练图像进行预处理;
步骤3.3,对图像分类模型进行迭代训练,采用改进交叉熵损失函数计算损失值,使用反向传播技术计算梯度并使用梯度下降法更新图像分类模型权值,最终获得训练好的图像分类网络模型。
进一步地,步骤3.3中所述改进交叉熵损失函数利用图像样本标签的信息,增加训练时损失值对于图像分类模型的误差的惩罚;所述惩罚包括惩罚神经网络误分类的行为,以及惩罚经神经网络虽然分类正确但是对于输出类别置信度不够高的行为;通过在训练时计算神经网络模型的输出与实际标签的误差信号监督神经网络的训练过程。所述改进交叉熵损失函数不仅可以提升分类神经网络的效果,而且还没有增加仍和任何的神经网络推理时间开销。
进一步地,步骤3.3中所述神经网络f在训练时计算图像训练集中每个图像样本xi的对率:pi=Softmax(f(xi));
所述Softmax函数表示为
Figure BDA0004124012250000021
它使得向量f(xi)的各个维度之和为1;Softmax(·)函数的输出表示图像样本xi分别属于第k类的概率pik,1≤k≤K。
进一步地,步骤3中所述改进交叉熵损失函数表示为:
Figure BDA0004124012250000022
其中,yij表示独热编码yi的第j维,pij表示图像样本xi的对率pi的第j维,1≤j≤K。
进一步地,步骤3中使用反向传播技术计算梯度包括使用所述改进交叉熵损失函数计算导数用于反向传播,损失函数l关于f(xi)k,k∈1,2,...,K的导数是:
Figure BDA0004124012250000031
Figure BDA0004124012250000032
将损失函数l关于f(xi)k,k∈1,2,...,K的导数化简为
Figure BDA0004124012250000033
其中δk=-(yik-pik),最终得到了反向传播过程中训练模型的误差大小。
进一步地,步骤3中所述损失函数及其导数的表示存在log或分母为0的情况,因此增加一个因子∈用以增加算法训练过程中的稳定性:
Figure BDA0004124012250000034
其中,yij表示独热编码yi的第j维,pij表示图像样本xi的对率pi的第j维,1≤j≤K;∈为稳定因子,∈是一个极小的正数,∈∈{1e-4,1e-5,1e-6,1e-7,1e-8}。它保证了损失函数的数值稳定。yij log(pij)项可以不需要近似,因为它是标准交叉熵损失中的固有项,因此可以将其拆分出来单独求值和导数。损失函数l的导数为
Figure BDA0004124012250000035
其中,
Figure BDA0004124012250000036
避免分母为0的情形。
进一步地,步骤3中使用梯度下降法更新图像分类模型权值包括采用优化算法更新模型参数,所述优化算法采用随机梯度下降SGD(stochastic gradient descent)、Adam、Adagrad或RMSprop(Root Mean Square Propagation)。
进一步地,所述改进交叉熵损失函数结合标签平滑技术(Label Smoothing)一起使用,达到更佳的效果,当所述改进交叉熵损失函数与标签平滑技术一起使用时图像样本xi的标签yi变为
Figure BDA0004124012250000041
其中α∈[0,1);损失函数l形式不变,且损失函数l关于f(xi)k,k∈1,2,...,K的导数公式形式不变。
有益效果:本申请提出的图像分类方法充分利用图像样本的标签信息,增加训练时损失值对于神经网络模型的误差的惩罚,使得损失函数不仅惩罚神经网络误分类的行为,还惩罚经网络虽然分类正确但是对于输出类别置信度不够高的行为,即本申请的损失函数将softmax函数的分子分母统一,所有类别的概率对于损失函数产生同等的贡献,而不再是一种主要由标签类别贡献损失值的one-hot形式,从而达到更好的分类效果,同时也不影响神经网络的推断速度,即不增加模型计算复杂度,不增加推理时间开销,当神经网络完成训练后进行部署运行时,损失函数不会给它带来任何额外的计算复杂度;简单易用,效果显著。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本申请实施例提供的一种基于改进交叉熵损失函数的图像分类方法的流程示意图。
图2为本申请实施例提供的一种基于改进交叉熵损失函数的图像分类方法在Stanford Cars数据集上的效果对比图。
图3为本申请实施例提供的一种基于改进交叉熵损失函数的图像分类方法在Stanford Cars数据集上的效果可视化对比。
图4为本申请实施例提供的一种基于改进交叉熵损失函数的图像分类方法中的改进交叉熵损失函数应用在知识蒸馏任务中,在MNIST数据集上的效果对比图。
具体实施方式
下面将结合附图,对本发明的实施例进行描述。
本申请实施例公开一种基于改进交叉熵损失函数的图像分类方法,如图1所示,包括以下步骤:
步骤1,搭建图像分类模型;
所述图像分类模型采用神经网络模型,所述神经网络模型可以是卷积网络(如ResNet50)或者基于Transformer的自注意神经网络等等。将神经网络表示为f。
步骤2,获取图像训练集;本实施例采用Stanford Cars数据集。
所述图像训练集表示为{(xi,yi)|i∈{1,...,N}},xi是图像训练集中的图像样本,yi是标签,yi∈{1,...,K},K表示分类任务数,K≥3,N是样本数,N≥1;将标签yi∈{1,...,K}转变成独热编码表示:yi=(0,...,1,...,0)∈RK
步骤3,利用图像训练集对图像分类模型进行训练,采用改进交叉熵损失函数计算损失值,迭代优化获得训练好的图像分类模型,包括:
步骤3.1,使用KaimingNormal初始化图像分类模型的权重,设置图像分类模型的网络参数和训练超参数;
步骤3.2,加载图像训练集,对图像训练集中的训练图像进行预处理;所述预处理包括图像随机裁剪、随机旋转、加入噪声、改变亮度和对比度等数据增强方法以及最终转变为张量然后再归一化,最终作为输入;
步骤3.3,对图像分类模型进行迭代训练,采用改进交叉熵损失函数计算损失值,使用反向传播技术计算梯度并使用梯度下降法更新图像分类模型权值,最终获得训练好的图像分类网络模型。
所述改进交叉熵损失函数利用图像样本标签的信息,增加训练时损失值对于图像分类模型的误差的惩罚;所述惩罚包括惩罚神经网络误分类的行为,以及惩罚经神经网络虽然分类正确但是对于输出类别置信度不够高的行为;通过在训练时计算神经网络模型的输出与实际标签的误差信号监督神经网络的训练过程。
使用分类神经网络f计算出图像训练集中每个图像样本xi的对率:pi=Softmax(f(xi))。
其中
Figure BDA0004124012250000051
它使得向量f(xi)的各个维度之和为1。而Softmax(·)函数的输出表示图像样本xi分别属于第k类的概率pik。且所有的概率pik之和为1。损失函数在训练时的作用就是通过惩罚概率pik,1≤k≤K,从而使得神经网络f预测图像样本为真实标签对应的概率pik接近1,反之则pik接近0。
神经网络f使用改进交叉熵损失函数计算每一个图像样本损失值之和,该交叉熵损失函数损失函数可表示为:
Figure BDA0004124012250000061
其中,yij表示独热编码yi的第j维,pij表示图像样本xi的对率pi的第j维,1≤j≤K。该损失函数由Softmax函数以及BinaryCrossEntropyLoss函数组成,因此简称SBCELoss。
神经网络f计算损失函数的导数用于反向传播,更新神经网络f的模型参数。损失函数l关于f(xo)k,k∈1,2,...,K的导数是:
Figure BDA0004124012250000062
Figure BDA0004124012250000063
将损失函数l关于f(xi)k,k∈1,2,...,K的导数化简为
Figure BDA0004124012250000064
其中δk=-(yik-pik),最终得到了反向传播过程中训练模型的误差大小。
由于γk表示的各个多项式皆为分式,且分母可能为0导致计算结果不稳定,因此增加一个因子∈用以增加算法训练过程中的稳定性:
Figure BDA0004124012250000065
这里的∈为稳定因子,是一个极小的正数,它保证了损失函数的数值稳定,∈∈{1e-4,1e-5,1e-6,1e-7,1e-8}。yij log(pij)项可以不需要近似,因为他是标准交叉熵损失中的固有项,因此可以将其拆分出来单独求值和导数。这时损失函数l的导数为
Figure BDA0004124012250000071
Figure BDA0004124012250000072
所述图像分类任务完成反向传播过程,求得神经网络f的模型参数的梯度并采用优化算法以更新参数用以更新参数,重复迭代上述步骤,直至神经网络f的损失值稳定为止。
其中优化算法包括随机梯度下降SGD、Adam、Adagrad和RMSprop等。它的作用就是优化模型参数从而减小模型的损失值。SGD是最流行的优化算法,它沿着根据损失函数计算出的参数梯度的反方向更新模型参数。而基于SGD的Adam则采取自适应的策略更新模型参数。
反向传播过程的完成依赖于深度学习框架,包括Tensor Flow、PyTorch和Keras等等。这些框架提供了一系列的深度学习工具、数据集的加载与处理工具、常用的损失函数、常用的模型评估指标、预训练好的模型、加速算子和优化算法等。这使得分类算法的实现与训练和应用部署得到了简化。
图像分类任务使用SBCELoss时可结合标签平滑技术一起使用达到更佳的效果。当SBCELoss与标签平滑技术一起使用时,图像样本的标签yi变为
Figure BDA0004124012250000073
Figure BDA0004124012250000074
其中α∈[0,1)。损失函数l形式不变。且损失函数l关于f(xi)k,k∈1,2,...,K的导数公式形式依然不变。
步骤4,将待分类图像输入到训练好的图像分类模型中,获得分类预测结果。
获取待分类的图像,验证训练好的神经网络f的效果。对于验证集或测试集中的图像样本xi,使用训练好的神经网络f计算对应的对率pi,取pi中概率最大的维度对应的下标为最终的预测结果。
图2为本实施例在Stanford Cars数据集上进行图像分类的效果对比,SBCELoss在StanfordCars上的效果十分的明显,图2中SBCELoss准确率超过交叉熵损失函数0.4%~2.6%不等。图3为本实施例在Stanford Cars数据集上进行图像分类的效果可视化对比,图3从左到右三幅图像分别表示使用标准交叉熵损失函数的效果、使用标签平滑技术后的效果以及使用SBCELoss的效果。它表明了使用SBCELoss训练得到的图像分类模型在分类时能够看到图像中更多部分的信息,即对图像中更多位置的信息更敏感(偏红色的区域更大),而不是仅仅依赖于图像中少数部分位置的信息进行判断与决策输出。图中偏红色的区域大部分是汽车的车身,或者轮胎以及靠近车标分位置。因为这些地方包含了丰富的信息,比如不同汽车的车身颜色以及材质各有不同,而同一类车颜色相似或者材质相似。不同的汽车轮胎也有不同的材质以及外形,因此可以作为分类的重要特征。车标是最能区分一辆车的部分,然而由于其本身太小,所以难以被神经网络模型捕捉到信息。
本实施例的改进交叉熵损失函数适用于任何分类任务,图4为本实施例的改进交叉熵损失函数应用在知识蒸馏任务中,在MNIST数据集上的效果对比。图4中第1行是使用标准交叉熵损失函数训练模型,没有教师(teacher)监督的情况下得到的结果,后面3行皆为有教师监督下得到的结果。虽然标签平滑和标准交叉熵损失函数训练得到的教师在测试集上的精度差不多,分别为98.95%和98.92%,但是教出来的学生(student)还是有较大差别,准确率分别为98.70%和98.23%;而SBCELoss可以很好的适用于蒸馏任务,使用它训练得到的teacher和student都达到了更好的效果。
SBCELoss不仅在类别较多的分类任务上有亮眼的表现,在分割任务、检测任务以及其他可以通过将原问题“规约”转化为分类任务的任务上都会有不错的效果。
具体实现中,本申请提供计算机存储介质以及对应的数据处理单元,其中,该计算机存储介质能够存储计算机程序,所述计算机程序通过数据处理单元执行时可运行本发明提供的一种基于改进交叉熵损失函数的图像分类方法的发明内容以及各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术方案可借助计算机程序以及其对应的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机程序即软件产品的形式体现出来,该计算机程序软件产品可以存储在存储介质中,包括若干指令用以使得一台包含数据处理单元的设备(可以是个人计算机,服务器,单片机,MUU或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本发明提供了一种基于改进交叉熵损失函数的图像分类方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (10)

1.一种基于改进交叉熵损失函数的图像分类方法,其特征在于,包括以下步骤:
步骤1,搭建图像分类模型;
步骤2,获取图像训练集;
步骤3,利用图像训练集对图像分类模型进行训练,采用改进交叉熵损失函数计算损失值,迭代优化获得训练好的图像分类模型;
步骤4,将待分类图像输入到训练好的图像分类模型中,获得分类预测结果。
2.根据权利要求1所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤1中所述图像分类模型采用神经网络模型,所述神经网络模型采用卷积网络或者基于Transformer的自注意神经网络;将神经网络表示为f;步骤2中所述图像训练集表示为{(xi,yi)|i∈{1,…,N}},xi是图像训练集中的图像样本,yi是标签,yi∈{1,…,K},K表示分类任务数,K≥3,N是样本数,N≥1;将标签yi∈{1,…,K}转变成独热编码表示:yi=(0,...,1,...,0)∈RK
3.根据权利要求2所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3包括:
步骤3.1,初始化图像分类模型的权重,设置图像分类模型的网络参数和训练超参数;
步骤3.2,加载图像训练集,对图像训练集中的训练图像进行预处理;
步骤3.3,对图像分类模型进行迭代训练,采用改进交叉熵损失函数计算损失值,使用反向传播技术计算梯度并使用梯度下降法更新图像分类模型权值,最终获得训练好的图像分类网络模型。
4.根据权利要求3所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3.3中所述改进交叉熵损失函数利用图像样本标签的信息,增加训练时损失值对于图像分类模型的误差的惩罚;所述惩罚包括惩罚神经网络误分类的行为,以及惩罚经神经网络虽然分类正确但是对于输出类别置信度不够高的行为;通过在训练时计算神经网络模型的输出与实际标签的误差信号监督神经网络的训练过程。
5.根据权利要求4所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3.3中所述神经网络f在训练时计算图像训练集中每个图像样本xi的对率:pi=Softmax(f(xi));
所述Softmax函数表示为
Figure FDA0004124012240000021
它使得向量f(xi)的各个维度之和为1;Softmax(·)函数的输出表示图像样本xi分别属于第k类的概率pik,1≤k≤K。
6.根据权利要求5所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3中所述改进交叉熵损失函数表示为:
Figure FDA0004124012240000022
其中,yij表示独热编码yi的第j维,pij表示图像样本xi的对率pi的第j维,1≤j≤K。
7.根据权利要求6所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3中使用反向传播技术计算梯度包括使用所述改进交叉熵损失函数计算导数用于反向传播,损失函数l关于f(xi)k,k∈1,2,…,K的导数是:
Figure FDA0004124012240000023
其中
Figure FDA0004124012240000024
8.根据权利要求5所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3中所述改进交叉熵损失函数表示为:
Figure FDA0004124012240000025
其中,yij表示独热编码yi的第j维,pij表示图像样本xi的对率pi的第j维,1≤j≤K;∈为稳定因子,∈∈{1e-4,1e-5,1e-6,1e-7,1e-8};
损失函数l的导数为
Figure FDA0004124012240000026
Figure FDA0004124012240000027
9.根据权利要求6、7或8任一项所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,步骤3中使用梯度下降法更新图像分类模型权值包括采用优化算法更新模型参数,所述优化算法采用随机梯度下降SGD、Adam、Adagrad或RMSprop。
10.根据权利要求9所述的一种基于改进交叉熵损失函数的图像分类方法,其特征在于,所述改进交叉熵损失函数结合标签平滑技术一起使用,此时图像样本xi的标签yi变为
Figure FDA0004124012240000031
其中α∈[0,1);损失函数l形式不变,且损失函数l关于f(xi)k,k∈1,2,…,K的导数公式形式不变。
CN202310240788.2A 2023-03-14 2023-03-14 一种基于改进交叉熵损失函数的图像分类方法 Pending CN116310542A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310240788.2A CN116310542A (zh) 2023-03-14 2023-03-14 一种基于改进交叉熵损失函数的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310240788.2A CN116310542A (zh) 2023-03-14 2023-03-14 一种基于改进交叉熵损失函数的图像分类方法

Publications (1)

Publication Number Publication Date
CN116310542A true CN116310542A (zh) 2023-06-23

Family

ID=86818161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310240788.2A Pending CN116310542A (zh) 2023-03-14 2023-03-14 一种基于改进交叉熵损失函数的图像分类方法

Country Status (1)

Country Link
CN (1) CN116310542A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117173548A (zh) * 2023-08-10 2023-12-05 中国地质大学(武汉) 一种海底地貌智能分类模型构建方法、装置及分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117173548A (zh) * 2023-08-10 2023-12-05 中国地质大学(武汉) 一种海底地貌智能分类模型构建方法、装置及分类方法
CN117173548B (zh) * 2023-08-10 2024-04-02 中国自然资源航空物探遥感中心 一种海底地貌智能分类模型构建方法、装置及分类方法

Similar Documents

Publication Publication Date Title
CN112560432B (zh) 基于图注意力网络的文本情感分析方法
CN111127364B (zh) 图像数据增强策略选择方法及人脸识别图像数据增强方法
US20210125061A1 (en) Device and method for the generation of synthetic data in generative networks
CN112052933B (zh) 基于粒子群优化的深度学习模型的安全性测试方法和修复方法
US20220121949A1 (en) Personalized neural network pruning
US11695898B2 (en) Video processing using a spectral decomposition layer
CN112883991A (zh) 对象分类方法、对象分类电路、机动车辆
CN117611932B (zh) 基于双重伪标签细化和样本重加权的图像分类方法及系统
CN116310542A (zh) 一种基于改进交叉熵损失函数的图像分类方法
CN116303786B (zh) 一种基于多维数据融合算法的区块链金融大数据管理系统
CN108154186B (zh) 一种模式识别方法和装置
CN114003511B (zh) 针对模型解释工具的评测方法和装置
CN113221814A (zh) 一种道路交通标志识别方法、设备及存储介质
CN111639688B (zh) 一种基于线性核svm的物联网智能模型的局部解释方法
CN117574262A (zh) 一种面向小样本问题的水声信号分类方法、系统及介质
CN114495114B (zh) 基于ctc解码器的文本序列识别模型校准方法
CN114580715B (zh) 一种基于生成对抗网络和长短期记忆模型的行人轨迹预测方法
CN107229944B (zh) 基于认知信息粒子的半监督主动识别方法
CN116391193B (zh) 以基于能量的潜变量模型为基础的神经网络的方法和设备
CN118393368B (zh) 一种电池续航能力评估方法、装置、存储介质及设备
CN113688950B (zh) 用于图像分类的多目标特征选择方法、装置和存储介质
CN112052905B (zh) 一种基于循环神经网络的驾驶人多操作疲劳特征提取方法
US20220383117A1 (en) Bayesian personalization
Liu et al. Driving Style Identification Model based on XGBoost
Sheng et al. An approach to detecting abnormal vehicle events in complex factors over highway surveillance video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination