CN109522939B

CN109522939B - 图像分类方法、终端设备及计算机可读存储介质

Info

Publication number: CN109522939B
Application number: CN201811255779.6A
Authority: CN
Inventors: 金戈; 徐亮; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-10-26
Filing date: 2018-10-26
Publication date: 2024-05-07
Anticipated expiration: 2038-10-26
Also published as: WO2020082595A1; CN109522939A

Abstract

本发明适用于计算机技术领域，提供了一种图像分类方法、终端设备及计算机可读存储介质，其中方法，包括：获取待分类的目标图像；基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点；输出所述图像分类结果。本发明提出的图像分类方法图像分类模型能基于模型中的最优参数去对输入图像的图像特征进行分析，提高图像分类模型的分类准确性。

Description

图像分类方法、终端设备及计算机可读存储介质

技术领域

本发明属于计算机技术领域，尤其涉及一种图像分类方法、终端设备及计算机可读存储介质。

背景技术

基于深度学习或部分机器学习的图像分类模型，需要经过训练才能用于执行特定的图像分类功能，例如种族分类功能。对图像分类模型进行训练的过程，实际上是对图像分类模型中的参数进行优化的过程，即找到该图像分类模型的最优参数，在图像分类模型训练完成后，该图像分类模型就可以用于执行对应的图像分类功能。

在对模型中的参数进行优化时，一般可采用随机梯度下降算法等常见的动量优化算法来实现对图像分类模型中的参数进行更新以找到最优的参数。随机梯度下降算法具体需要通过图像分类模型中的损失函数是否达到全局极小值来确定模型是否找到最优参数，然而在使用随机梯度下降算法时，由于损失函数中存在着鞍点，导致损失函数可能会无法收敛至全局极值点，从而无法确定得到图像分类模型的最优参数。而图像分类模型需要基于模型中的最优参数去对输入图像的图像特征进行分析，对于无法确定最优参数的图像分类模型，其对应的图像分类模型的分类准确性降低。

发明内容

有鉴于此，本发明实施例提供了一种图像分类方法、终端设备及计算机可读存储介质，以解决现有技术中图像分类模型的分类准确性低的问题。

本发明实施例的第一方面提供了一种图像分类方法，包括：

获取待分类的目标图像；

基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点；

输出所述图像分类结果。

本发明实施例的第二方面提供了一种终端设备，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

获取待分类的目标图像；

输出所述图像分类结果。

本发明实施例的第三方面提供了一种终端设备，包括：

获取单元，用于获取待分类的目标图像；

执行单元，用于基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点；

输出单元，用于输出所述图像分类结果。

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述方法的步骤。

实施本发明实施例提供的一种图像分类方法、终端设备及计算机可读存储介质具有以下有益效果：

本发明实施例，终端设备获取待分类的目标图像；基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点，使得终端设备基于图像分类模型中的最优参数对目标图像进行特征提取得到图像特征时，能更准确的提取到目标图像所对应的图像特征；终端设备基于图像分类模型中的最优参数对图像特征进行分类预测处理得到图像分类结果时，进行预测的图像分类结果也会更加准确。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种图像分类方法的实现流程图；

图2是本发明第二实施例提供的一种图像分类方法的实现流程图；

图3是本发明第三实施例提供的一种终端设备的示意图；

图4是本发明第四实施例提供的一种终端设备的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参阅图1，图1为本发明第一实施例中的图像分类方法的实现流程图。本实施例中的图像分类方法的执行主体为终端设备。如图所述的图像分类方法可以包括如下步骤：

S101，获取待分类的目标图像。

在S101中，当用户需要通过终端设备对待分类的某个目标图像进行分类处理时，可以将待分类的目标图像输入至终端设备中，终端设备获取待分类的目标图像。其中，终端设备基于终端设备中预存的已经训练完成的图像分类模型对目标图像进行分类处理，图像分类模型具体可以为实现种族分类功能的分类模型，图像分类模型能预测的所有分类结果至少包括两种以上，当然并不限于此。

S102，基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点。

在S102中，当图像分类模型已经训练好了之后，终端设备基于图像分类模型中的最优参数对目标图像进行特征提取得到图像特征，并对图像特征进行分类预测处理得到图像分类结果，图像分类模型预测的分类一般仅为一种。其中，由于图像分类模型中的最优参数在图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点，以使得最优参数为图像分类模型在训练时收敛至全局极值点时所确定的模型参数，终端设备基于图像分类模型中的最优参数对目标图像进行特征提取得到图像特征时，能更准确的提取到目标图像所对应的图像特征；终端设备基于图像分类模型中的最优参数对图像特征进行分类预测处理得到图像分类结果时，进行预测的图像分类结果也会更加准确。具体的，图像分类模型可以包括卷积层和全连接层，模型参数具体可以为卷积层以及全连接层中的参数，终端设备基于图像分类模型中的卷积层所对应的参数目标图像进行卷积计算，提取得到目标图像所对应的图像特征；终端设备基于图像分类模型中的全连接层所对应的参数图像特征进行计算，预测得到图像特征所对应的图像分类结果。

S103中，输出所述图像分类结果。

在S103中，终端设备输出图像分类模型预测得到的图像分类结果，便于用户获取对应的图像分类结果。

以上可以看出，终端设备获取待分类的目标图像；基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点，使得终端设备基于图像分类模型中的最优参数对目标图像进行特征提取得到图像特征时，能更准确的提取到目标图像所对应的图像特征；终端设备基于图像分类模型中的最优参数对图像特征进行分类预测处理得到图像分类结果时，进行预测的图像分类结果也会更加准确。

参阅图2，图2是本发明第二实施例提供的图像分类方法的实现流程图。本实施例与第一实施例的区别在于，本实施例中在S201之后，S202之前还包括S2011～S2014。其中S201～S204与第一实施例中的S101～S104相同，具体请参阅第一实施例中S101～S104的相关描述，此处不赘述。S2011～S2014具体如下：

S2011，根据当前迭代中所训练的图像分类模型对应的第一损失函数值确定所述第一损失函数值对应的第一梯度，并根据所述第一梯度确定得到所述第一梯度对应的二范数。

对于图像分类模型需要进行训练才能用于执行图像分类功能，而对图像分类模型进行训练的过程即是对图像分类模型的模型参数进行迭代优化的过程，以使得图像分类模型的模型参数能进行优化。终端设备在对图像分类模型中的模型参数进行迭代优化时，根据图像分类模型在当前迭代优化次数下，图像分类模型对应的第一损失函数值确定第一损失函数值对应的第一梯度，并根据第一梯度确定得到第一梯度对应的二范数。其中，第一损失函数值为损失函数在当前迭代优化次数下计算得到的损失函数值，梯度用以表示损失函数在当前迭代优化时变化最快、变化率最大所对应的参数向量，第一梯度为根据第一损失函数值对应的梯度值，终端设备还将根据第一梯度确定得到第一梯度对应的二范数。

S2012，判断所述二范数是否小于第一预设值。

由于损失函数存在有鞍点，而鞍点为损失函数的局部极小值，现有技术中，终端设备无法区分损失函数是否为局部极小值或全局极小值，从而导致图像分类模型存在无法收敛至全局极值点的情况。在本实施例中，当处于鞍点时对应的损失函数对应的梯度向量为零，对应的梯度向量的二范数也为零，因此终端设备通过判断第一梯度对应的二范数是否小于第一预设值，来确定损失函数是否到达鞍点处，其中，第一预设值为预设的某个数值。

S2013，若所述二范数小于第一预设值，则添加所述预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开对应的鞍点。

当第一梯度对应的二范数小于第一预设值时，则说明损失函数到达鞍点处；当第一梯度对应的二范数大于或者第一预设值时，则说明损失函数没有到达鞍点处。当第一梯度对应的二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时带来扰动的效果，以使得所训练的图像分类模型确定的模型参数在进行迭代优化时能避开鞍点，预设的噪声值为对图像分类模型中的模型参数进行迭代优化时，在模型参数的样本库中进行随机采样所获到。添加噪声值至图像分类模型确定的模型参数中，可以使得在对图像分类模型进行迭代优化时避免停留至鞍点，从而避免使得终端设备将收敛至局部极小值时对应的模型参数直接作为图像分类模型的最优参数。

S2014，若当前迭代后的目标迭代中所训练的图像分类模型对应的第二损失函数值与当前迭代中所训练的图像分类模型对应的第一损失函数值之间的差值小于第二预设值，其中第二预设值一般为接近零的某个常数，则判定图像分类模型在训练时已收敛至全局极值点，并输出目标迭代中所确定的第二模型参数作为所训练的图像分类模型的最优参数，此时也将完成对图像分类模型的训练，对应的图像分类模型即可用于执行相应对应的图像分类功能。

若当前迭代后的某次目标迭代中，终端设备判断所训练的图像分类模型对应的第二损失函数值与当前迭代中所训练的图像分类模型对应的第一损失函数值之间的差值是否小于第二预设值，若当所训练的图像分类模型对应的第二损失函数值与当前迭代中所训练的图像分类模型对应的第一损失函数值之间的差值小于第二预设值则终端设备，则终端设备判定图像分类模型在训练时已收敛至全局极值点，并输出该目标迭代中确定的第二模型参数作为所训练的图像分类模型的最优参数。终端设备将图像分类模型收敛至全局极小值时对应的模型参数作为最优参数，使得终端设备基于图像分类模型中的最优参数对目标图像进行特征提取得到图像特征时，能更准确的提取到目标图像所对应的图像特征；终端设备基于图像分类模型中的最优参数对图像特征进行分类预测处理得到图像分类结果时，进行预测的图像分类结果也会更加准确。

可选地，在本实施例中，为了更加准确地确定得到第一预设值，以使得终端设备能准确地确定损失函数是否到达鞍点处，所述第一预设值的计算方法具体为，终端设备根据预设的计算公式以及/>计算得到第一预设值。其中，g为预设的第一预设值，d为所训练的图像分类模型中对应的模型参数的个数，c、δ以及∈为预设的常数，l为利普希茨连续常数，Δf为所训练的图像分类模型的损失函数对应的梯度函数。

可选地，所述若所述二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中之前，包括：

判断当前迭代之前所训练的图像分类模型确定的模型参数未添加预设的噪声值的迭代次数是否达到第三预设值。

所述若所述二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，包括：

若当前迭代之前所训练的图像分类模型确定的模型参数未添加预设的噪声值的迭代次数达到第三预设值，且所述二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中。

当在第一梯度对应的二范数小于第一预设值时，终端设备在添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数之前，终端设备还判断在当前迭代之前，所训练的图像分类模型确定的模型参数未添加预设的噪声值的迭代次数是否达到第三预设值，其中该第三预设值为正整数，若在当前迭代之前的第三预设值次数的迭代优化过程中，且对应的二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，使得终端设备能准确地确定损失函数是否到达鞍点。

优选地，所述第三预设值的计算方法，包括：

根据预设的计算公式以及/>计算得到第三预设值，其中k为第三预设值，d为所训练的图像分类模型中对应的模型参数的个数，c、ρ、δ以及∈为预设的常数，l为利普希茨连续常数，Δf为所训练的图像分类模型的损失函数对应的梯度函数。

终端设备具体根据预设的计算公式以及/>计算得到第三预设值，其中，k为第三预设值，d为所训练的图像分类模型中对应的模型参数的个数，c、ρ、δ以及∈为预设的常数，l为利普希茨连续常数，Δf为所训练的图像分类模型的损失函数对应的梯度函数。需要说明的是，当计算得到第三预设值k不是正整数时，终端设备将选取与该第三预设值k差值最小的正整数对第三预设值k进行取整处理。

参阅图3，图3是本发明第三实施例提供的一种终端设备的示意图。终端设备包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1各自对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。参见图1，终端设备包括：

获取单元101，用于获取待分类的目标图像。

执行单元102，用于基于图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征，并对所述图像特征进行分类预测处理得到图像分类结果，其中，所述最优参数在所述图像分类模型的损失函数的二范数小于第一预设值时基于预设的噪声值得到，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点。

输出单元103，用于输出所述图像分类结果。

可选地，所述终端设备还包括：

确定单元，用于根据当前迭代中所训练的图像分类模型对应的第一损失函数值确定所述第一损失函数值对应的第一梯度，并根据所述第一梯度确定得到所述第一梯度对应的二范数。

判断单元，用于判断所述二范数是否小于第一预设值。

添加单元，用于若所述二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点。

判定单元，用于若当前迭代后的目标迭代中所训练的图像分类模型对应的第二损失函数值与当前迭代中所训练的图像分类模型对应的第一损失函数值之间的差值小于第二预设值，则判定所述图像分类模型在训练时已收敛至全局极值点，并输出目标迭代中确定的第二模型参数作为所训练的图像分类模型的最优参数。

可选地，所述第一预设值的计算方法，包括：

根据预设的计算公式以及/>计算得到第一预设值，其中g为第一预设值，d为所训练的图像分类模型中对应的模型参数的个数，c、δ以及∈为预设的常数，l为利普希茨连续常数，Δf为所训练的图像分类模型的损失函数对应的梯度函数。

可选地，所述终端设备，还包括：

判断单元，用于判断当前迭代之前所训练的图像分类模型确定的模型参数未添加预设的噪声值的迭代次数是否达到第三预设值。

可选地，所述第三预设值的计算方法，包括：

参阅图4，图4是本发明第四实施例提供的一种终端设备的示意图。如图4所示，该实施例的终端设备4包括：处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42，例如终端设备的控制程序。所述处理器40执行所述计算机程序42时实现上述各个终端设备4的图像分类方法实施例中的步骤，例如图1所示的S101至S103。或者，所述处理器40执行所述计算机程序42时实现上述各装置实施例中各单元的功能，例如图3所示单元101至103功能。

示例性的，所述计算机程序42可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器41中，并由所述处理器40执行，以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。例如，所述计算机程序42可以被分割成获取单元、执行单元以及输出单元，各单元具体功能如上所述。

所述终端设备可包括，但不仅限于，处理器40、存储器41。本领域技术人员可以理解，图4仅仅是终端设备4的示例，并不构成对终端设备4的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备还可以包括输入输出终端设备、网络接入终端设备、总线等。

所称处理器40可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器41可以是所述终端设备4的内部存储单元，例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储终端设备，例如所述终端设备4上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储终端设备。所述存储器41用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种图像分类方法，其特征在于，包括：

获取待分类的目标图像；

输出所述图像分类结果；

其中，在所述获取待分类的目标图像之后，且在所述基于所述图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征之前，所述图像分类方法还包括：

根据当前迭代中所训练的图像分类模型对应的第一损失函数值确定所述第一损失函数值对应的第一梯度，并根据所述第一梯度确定得到所述第一梯度对应的二范数；

判断所述二范数是否小于第一预设值；

若所述二范数小于第一预设值，则添加所述预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点；

若当前迭代后的目标迭代中所训练的图像分类模型对应的第二损失函数值与当前迭代中所训练的图像分类模型对应的第一损失函数值之间的差值小于第二预设值，则判定所述图像分类模型在训练时已收敛至全局极值点，并输出目标迭代中确定的第二模型参数作为所训练的图像分类模型的最优参数。

2.根据权利要求1所述的图像分类方法，其特征在于，所述第一预设值的计算方法，包括：

3.根据权利要求1所述的图像分类方法，其特征在于，所述若所述二范数小于第一预设值，则添加预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中之前，包括：

判断当前迭代之前所训练的图像分类模型确定的模型参数未添加预设的噪声值的迭代次数是否达到第三预设值；

4.根据权利要求3所述的图像分类方法，其特征在于，所述第三预设值的计算方法，包括：

5.一种终端设备，其特征在于，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

获取待分类的目标图像；

输出所述图像分类结果；

其中，在所述获取待分类的目标图像之后，且在所述基于所述图像分类模型中的最优参数对所述目标图像进行特征提取得到图像特征之前，所述处理器执行所述计算机程序时还实现如下步骤：

判断所述二范数是否小于第一预设值；

6.根据权利要求5所述的终端设备，其特征在于，所述第一预设值的计算方法，包括：

7.一种终端设备，其特征在于，包括：

获取单元，用于获取待分类的目标图像；

输出单元，用于输出所述图像分类结果；

其中，所述终端设备还包括：

确定单元，用于在触发所述获取单元执行之后，且在触发所述执行单元执行之前，根据当前迭代中所训练的图像分类模型对应的第一损失函数值确定所述第一损失函数值对应的第一梯度，并根据所述第一梯度确定得到所述第一梯度对应的二范数；

判断单元，用于判断所述二范数是否小于第一预设值；

添加单元，用于若所述二范数小于第一预设值，则添加所述预设的噪声值至当前迭代中所训练的图像分类模型确定的第一模型参数中，所述预设的噪声值用于使得所训练的图像分类模型确定的模型参数在进行迭代优化时避开鞍点；

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任意一项所述方法的步骤。