CN110084271B

CN110084271B - 一种图片类别的识别方法和装置

Info

Publication number: CN110084271B
Application number: CN201910224197.XA
Authority: CN
Inventors: 阮晓虎
Original assignee: Tongdun Holdings Co Ltd
Current assignee: Tongdun Holdings Co Ltd
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2021-08-20
Anticipated expiration: 2039-03-22
Also published as: CN110084271A

Abstract

在本发明实施例提供一种图片类别识别的方法和装置，所述方法包括：将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练。在上述方法中，计算图像分类模型训练的损失值时，将正确样本对应的第一权重设置为小于错误样本的第二权重，使得在训练过程中能够更加关注比较难的样本，从而加快了损失值下降的速度，进而以较低的代价实现了模型收敛速度的加快。

Description

一种图片类别的识别方法和装置

技术领域

本发明涉及深度学习领域，尤其涉及一种图片类别的识别方法和装置。

背景技术

目前，深度学习是人工智能领域中研究重点，大量的学者和研究人员投身其中，推动着其迅速发展。尽管深度学习取得了极大的成就，但其依旧面临着很多难题。尤其在图像分类领域，大量的训练数据和多可能性的分类概率，使得训练过程中产生更多的中间数据，这意味着图像分类的模型训练需要更多的训练存储空间和时间；训练一个图像分类的模型往往需要数天乃至数个月的时间，因而加速训练过程，节约时间成本是当下的一个重要研究方向。

对于加速训练，现有技术中一般采用在硬件方面采用GPU加速和集群计算，在算法上采用数据并行和模型并行方案。现有方案虽然加快了深度网络的训练迭代速度，但需要更快处理速度的GPU实现加速，或采用多个GPU组成集群，并行计算，导致设备成本较高，所以现有方案还不能以较低的代价解决模型收敛较慢的问题。

发明内容

有鉴于此，本发明实施例提出一种图片类别的识别方法和装置，以高效的解决现有图像分类领域模型收敛较慢的问题。

本发明实施例提供一种图片类别的识别方法，所述方法包括：

将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；

根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本；

采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；

根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练；

将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。

可选地，所述采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率计算损失值的步骤，包括：

根据所述正确样本对应的预测概率、预设第一权重、标注类别，计算得到所述正确样本的加权损失值；

根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的加权损失值；

根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值；

可选地，所述根据所述正确样本对应的预测概率、预设第一权重、标注类别，计算得到所述正确样本的加权损失值的步骤，包括：

根据所述标注类别确定所述正确样本的期望预测概率；

计算所述预测概率和所述期望预测概率之间的交叉熵；

计算预设第一权重与所述交叉熵的乘积，得到第一数值；

获取所述正确样本对应的上次迭代预测概率；

计算1与所述上次迭代预测概率的差值，得到第一差值；

根据所述第一差值、所述第一数值计算所述正确样本的加权损失值；

所述根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的损失值的步骤，包括：

根据所述标注类别确定所述错误样本的期望输出概率；

计算所述预测概率和所述期望预测概率之间的交叉熵；

计算预设第二权重与所述交叉熵的乘积，得到第二数值；

获取所述错误样本对应的上次迭代预测概率；

计算1与所述上次迭代预测概率的差值，得到第二差值；

根据所述第二差值、所述第二数值计算所述错误样本的加权损失值。

可选地，所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤，包括：

以预设指数参数为指数，所述第一差值为底数，计算第一指数值；

计算所述第一指数值与所述第一数值的乘积，得到所述正确样本的加权损失值；

所述根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的加权损失值的步骤，包括：

以预设指数参数为指数，所述第二差值为底数，计算第二指数值；

计算所述第二指数值与所述第二数值的乘积，得到所述错误样本的加权损失值；

可选地，若所述样本图片中包含上次迭代中没有的新样本图片，则所述获取所述正确样本对应的上次迭代预测概率，包括：

获取所述新样本图片中的正确样本对应的上次迭代预测概率，其中，所述上次迭代预测概率为预设的默认值。

本发明实施例还提供一种图片类别的识别装置，所述装置包括：

初步预测模块，用于将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；

划分模块，用于根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本；

损失值计算模块，用于采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；

训练模块，用于根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练；

最终预测模块，用于将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。

可选地，所述损失值计算模块包括：

正确样本损失值计算子模块，用于根据所述正确样本对应的预测概率、预设第一权重、标注类别，计算得到所述正确样本的加权损失值；

错误样本损失值计算子模块，用于根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的加权损失值；

损失值计算子模块，用于根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值；

可选地，所述正确样本损失值计算子模块包括：

第一期望预测概率确定单元，用于根据所述标注类别确定所述正确样本的期望预测概率；

第一交叉熵计算单元，用于计算所述预测概率和所述期望预测概率之间的交叉熵；

第一数值计算单元，用于计算预设第一权重与所述交叉熵的乘积，得到第一数值；

第一上次预测概率获取单元，用于获取所述正确样本对应的上次迭代预测概率；

第一差值计算单元，用于计算1与所述上次迭代预测概率的差值，得到第一差值；

正确样本损失值计算单元，用于根据所述第一差值、所述第一数值计算所述正确样本的加权损失值；

所述错误样本损失值计算子模块包括：

第二期望预测概率确定单元，用于根据所述标注类别确定所述错误样本的期望预测概率；

第二交叉熵计算单元，计算所述预测概率和所述期望预测概率之间的交叉熵；

第二数值计算单元，用于计算预设第二权重与所述交叉熵的乘积，得到第二数值；

第二上次预测概率获取单元，用于获取所述错误样本对应的上次迭代预测概率；

第二差值计算单元，用于计算1与所述上次迭代预测概率的差值，得到第二差值；

错误样本损失值计算单元，用于根据所述第二差值、所述第二数值计算所述错误样本的加权损失值。

可选地，所述正确样本损失值计算单元包括：

第一指数值计算子单元，用于以预设指数参数为指数，所述第一差值为底数，计算第一指数值；

第一加权损失值计算子单元，用于计算所述第一指数值与所述第一数值的乘积，得到所述正确样本的加权损失值；

所述错误样本损失值计算单元包括：

第二指数值计算子单元，用于以预设指数参数为指数，所述第二差值为底数，计算第二指数值；

第二加权损失值计算子单元，用于计算所述第二指数值与所述第二数值的乘积，得到所述错误样本的加权损失值；

可选地，若所述样本图片中包含上次迭代中没有的新样本图片，则所述第一上次预测概率获取单元包括：

第一上次预测概率获取子单元，用于获取所述新样本图片中的正确样本对应的上次迭代预测概率，其中，所述上次迭代预测概率为预设的默认值。

本发明实施例包括以下优点：

在本发明实施例中，首先将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本；采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练；最终，将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。在上述方法中，计算图像分类模型训练的损失值时，将正确样本对应的第一权重设置为小于错误样本的第二权重，使得在训练过程中能够更加关注比较难的样本，从而加快了损失值下降的速度，进而以较低的代价实现了模型收敛速度的加快。

附图说明

图1示出了本发明实施例一中提供的图片类别的识别方法的流程图；

图2示出了本发明实施例二中提供的图片类别的识别装置的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

参照图1，示出了本发明实施例一中提供的图片类别的识别方法的流程图，具体可以包括如下步骤：

步骤101，将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率。

在本发明实施例中，对于选定的训练模型，采用公开数据集，或客户正式数据输入模型进行训练。具体地，该输入数据样本为图片样本，模型为分类训练模型，例如卷积神经网络模型、VGG模型(Visual Geometry Group Network，超分辨率测试序列)等。分类训练模型根据自身的算法，对输入的图片样本进行分类，输出每一张样本图片属于每一个预测类别的概率，将最大的输出概率作为该次模型训练的预测概率，预测概率对应的预测类别则为本次模型训练的预测类别。

例如，输入的样本图片为在网页上采集到的各种刀具的图片，预测类别为正常刀具类别和管制刀具类别，模型计算出每个图片样本属于正常刀具的预测概率和属于管制刀具的预测概率，再根据预测概率确定预测类别。具体地，将预测概率较大的类别确定为预测类别。例如，若模型预测出某图片样本属于正常刀具的预测概率为90％，属于管制刀具的预测概率为10％，则最终模型确定该图片样本的预测类别为正常刀具类别。

步骤102，根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本。

在本发明实施例中，标注类别为样本图片所属的真实类别，每个样本图片对应有一个标注类别。将模型输出的预测类别与该样本图片的标注类别进行对比，若两者一致，则样本图片被分类正确，将所述样本图片划分为正确样本；若两者不一致，则样本图片被分类错误，将所述样本图片划分为错误样本。

例如，在上述刀具图片样本的预测中，若图片样本为水果刀，标注类别为正常刀具。将该图片样本输入模型后，得出预测类别为正常刀具，则说明预测类别与标注类别一致，则可以将该水果刀的样本图片划分为正确样本；若该图片样本输入模型后，得出预测类别为管制刀具，则说明预测类别与标注类别不一致，则可以将该水果刀的样本图片划分为错误样本。

若输入的样本图片被划分为错误样本，则说明该样本图片的识别难度较大。

步骤103，采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重。

在本发明实施例中，损失值即模型在样本上的输出与真实值之间的误差，即模型本身的精准度，反映出算法的拟合能力。模型在不断的迭代训练过程中，损失值逐渐减小，模型的精度逐渐提高。将每一次模型训练时的输出值代入预设的损失函数，可以得到本次模型训练的损失值。

样本图片的期望预测概率，即该图片对于某个预测类别的被期望预测概率值。例如，对于水果刀这个样本图片，针对正常刀具这个预测类别的期望预测概率为100％，而针对管制刀具这个预测类别的期望预测概率为0％。

第一权重和第二权重分别针对于正确样本和错误样本，设置第一权重小于第二权重，可以在计算损失值时更侧重于增加错误样本的损失值所占比重，这样使得在训练过程中更加关注较难的样本图片。

本发明实施例将预设第一权重、预设第二权重，本次模型训练输出的预测概率和期望预测概率带入损失函数，即得到本次模型训练的损失值。

在本发明的一个可选实施例中，步骤103包括子步骤1031和子步骤1032：

子步骤1031，根据所述正确样本对应的预测概率、预设第一权重、标注类别，计算得到所述正确样本的加权损失值。

正确样本对应的预测概率，包括正确样本对应各个预测类别的预测概率，其为一个向量值，即包括多个值。多个图片样本的预测概率综合起来，可以得到一个多行多列的矩阵。例如，模型计算出水果刀这个图片样本属于正常刀具的预测概率为90％，属于管制刀具的预测概率为10％，则水果刀这个正确样本的预测概率为90％和10％，即该预测概率为两个值。

根据标注类别可以得到图片样本的期望输出概率，该期望输出概率为针对每一种预测类别的期望输出概率，其同样是一个向量值。

在正确样本中，根据每个样本对应的预测概率、预设的第一权重以及标注类别，计算正确样本的加权损失值。

在本发明实施例的一个可选实施例中，子步骤1031可以包括如下子步骤10311-10316：

子步骤10311，根据所述标注类别确定所述正确样本的期望预测概率；

子步骤10312，计算所述预测概率和所述期望预测概率之间的交叉熵；

在子步骤10311-10322中，每一个预测类别对应一个期望预测概率，在预测类别中，只有标注类别对应的期望预测概率为1，而其他预测类别对应的期望预测概率为0；分类训练模型根据自身的算法，对输入的图片样本进行分类，输出每一张样本图片属于每一个预测类别的概率，将最大的输出概率作为该次模型训练的预测概率；交叉熵(CrossEntropy)主要用于度量两个概率分布间的差异性信息。

在本发明实施例中的正确样本的交叉熵J₁计算公式为：

其中，i是正确样本中的样本序号，y_i是正确样本的期望预测概率，S_i是正确样本的模型输出的预测概率，T表示正确样本的样本总量。

子步骤10313，计算预设第一权重与所述交叉熵的乘积，得到第一数值；

在本步骤中，设预设第一权重为α，则第一数值为α乘以J₁。

子步骤10314，获取所述正确样本对应的上次迭代预测概率；

在本步骤中，设训练轮数，即迭代次数为K，则正确样本对应的上次迭代预测概率，即为该正确样本在上一轮训练中得到的预测概率，记为

对应的，可将本次模型输出的预测概率S_i记为

子步骤10315，计算1与所述上次迭代预测概率的差值，得到第一差值；

在本步骤中，第一差值C₁为：

子步骤10316，根据所述第一差值、所述第一数值计算所述正确样本的加权损失值。

在本步骤中，根据所述第一差值、所述第一数值得到所述正确样本的加权损失值La，用公式表示为：

在本发明的一个可选实施例中，所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤，包括以下子步骤A1和子步骤A2：

子步骤A1：以预设指数参数为指数，所述第一差值为底数，计算第一指数值；

子步骤A2：计算所述第一指数值与所述第一数值的乘积，得到所述正确样本的加权损失值；

在本发明实施例中，设预设指数为λ，则第一指数值Z₁为：

计算所述第一指数值与所述第一数值的乘积，得到所述正确样本的带指数的加权损失值为：

这里，第一指数值可以看作是正确样本的交叉熵的系数。

通过为交叉熵J₁设置第一指数值而得到加权损失值L₁，可以有效调节交叉熵的乘积系数，使得交叉熵可以根据样本数值得到适应性调整，更有利于损失值的收敛。

子步骤1032，根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的加权损失值。

与正确样本类似，错误样本对应的预测概率，包括错误样本对应各个预测类别的预测概率，其为一个向量值，即包括多个值。多个图片样本的预测概率综合起来，可以得到一个多行多列的矩阵。例如，模型计算出弹簧刀图片样本属于正常刀具的预测概率为80％，属于管制刀具的预测概率为20％，模型输出的预测类别为正常刀具，而该图片样本的标注类别为管制刀具，则该弹簧刀图片样本被划分为错误样本。弹簧刀这个错误样本的预测概率为80％和20％，该预测概率也为两个值。

相应地，若预测类别包含N(N≥2)个类别，则预测概率也为N个值。

在错误样本中，根据每个样本对应的预测概率、预设的第一权重以及标注类别，计算错误样本的加权损失值。

在本发明的一个可选实施例中，子步骤1032可以包括如下子步骤10321-10325：

子步骤10321，根据所述标注类别确定所述错误样本的期望输出概率；

子步骤10322，计算所述预测概率和所述期望预测概率之间的交叉熵；

子步骤10323，计算预设第二权重与所述交叉熵的乘积，得到第二数值；

子步骤10324，获取所述错误样本对应的上次迭代预测概率；

子步骤10325，用于根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。

在本发明实施例中，设错误样本的样本序号为j，预设第二权重为β，错误样本在上一轮训练中得到的预测概率为

错误样本在本轮训练中得到的预测概率为

则根据所述第二差值、所述第二数值计算所述错误样本的加权损失值L_b为：

子步骤10321-子步骤10325与正确样本的加权损失值的计算子步骤10311-子步骤10316类似，本发明实施例不再赘述。

在本发明的一个可能的实施例中，根据所述错误样本对应的预测概率、预设第二权重、标注类别，计算得到所述错误样本的加权损失值的步骤，包括以下子步骤：

子步骤A3，以预设指数参数为指数，所述错误样本的上次迭代预测概率为底数，计算第二指数值；

子步骤A4，计算所述第二指数值与所述第二数值的乘积，得到所述错误样本的加权损失值。

在本发明实施例中，与正确样本类似，得到错误样本的带指数的加权损失值为：

这里，第二指数值可以看作是错误样本的交叉熵的系数。

子步骤1033，根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值。

在本发明实施例中，根据子步骤1031计算得到的正确样本的加权损失值L₁和子步骤1032中计算得到的错误样本的加权损失值L₂，来计算整个样本的损失值L，其中，L＝L₁+L₂。

具体地，整个样本的损失值L计算公式为：

由于第一权重α小于第二权重β，且正确样本的交叉熵系数大于错误样本的交叉熵系数，所以整个样本的损失值更侧重于增加错误样本的损失值所占比重。

步骤104，根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练。

训练一个模型实际上就是寻找一组使得损失函数取值最小的模型参数，这需要进行完每一轮的模型训练后调整损失函数中的参数，使得损失值L随着训练轮数的增加而缓慢下降，然后趋于稳定。损失值稳定后，将一组样本图片的验证集数据输入模型，将得到的输出数据与预设的标注数据进行比较，计算验证集的损失，该损失值小于预设损失值阈值后，结束训练。

步骤105，将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。

模型训练完成后，将待分类的目标图片输入至模型中，根据对目标图片的预测类别得到该目标图片所属的类别。

在本发明的一个可能的实施例中，若所述样本图片中包含上次迭代中没有的新样本图片，则所述获取所述正确样本对应的上次迭代预测概率，包括：

在本发明实施例中，可以在模型训练的迭代过程中，自动化发布中间版本的训练模型，面向客户提供初步数据集接入服务。客户调用中间版本的训练模型，获得“一般效果”的服务；同时，服务器端将收集到的客户数据保存至数据存储池，并将预训练模型得到的结果，导入到数据标注及审核平台进行人工校验修正。经过一段时间的积累，客户数据达到一定规模，将经过人工校验和修正的数据集加入到预训练模型的数据集中一起参与下一个模型的训练。

在这个过程中，当前训练轮次的样本图片中会包含上次迭代中没有的新样本图片，那么在计算损失函数的损失值时，会缺失上次迭代的预测概率，此时，可以将上次迭代预测概率设置为预设的默认值。例如，可以将上次迭代预测概率设置为1或0，或任意1和0之间的值。

综上所述，在本发明实施例中，首先将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本；采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练；最终，将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。在上述方法中，计算图像分类模型训练的损失值时，将正确样本对应的第一权重设置为小于错误样本的第二权重，使得在训练过程中能够更加关注比较难的样本，从而加快了损失值下降的速度，进而以较低的代价实现了模型收敛速度的加快。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定都是本申请实施例所必须的。

实施例二

参照图2所示，为本发明实施例二提供的图片类别的识别装置200的结构框图，上述装置200具体可以包括：

初步预测模块201，用于将样本图片输入至预选模型中，预测得到所述样本图片的预测类别以及对应的预测概率；

划分模块202，用于根据所述样本图片的预测类别和标注类别，将所述样本图片划分为正确样本或错误样本；

损失值计算模块203，用于采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率和期望预测概率计算损失值，所述第一权重小于所述第二权重；

训练模块204，用于根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至所述总损失值小于预设损失值阈值，结束训练；

最终预测模块205，用于将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别。

可选地，所述损失值计算模块包括：

可选地，所述正确样本损失值计算子模块包括：

所述错误样本损失值计算子模块包括：

可选地，所述正确样本损失值计算单元包括：

所述错误样本损失值计算单元包括：

本发明实施例提供的图片类别的识别装置200能够实现图1的方法实施例中图片识别的方法实现的各个过程，为避免重复，这里不再赘述。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种图片识别的方法和装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种图片类别的识别方法，其特征在于，所述方法包括：

根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至总损失值小于预设损失值阈值，结束训练，所述总损失值为一组所述样本图片的验证集的损失；

将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别；

其中，所述采用针对正确样本的预设第一权重、针对错误样本的预设第二权重，根据所述样本图片的预测概率计算损失值的步骤，包括：

其中，所述根据所述正确样本对应的预测概率、预设第一权重、标注类别，计算得到所述正确样本的加权损失值的步骤，包括：

根据所述标注类别确定所述正确样本的期望预测概率；

计算所述预测概率和所述期望预测概率之间的交叉熵；

计算预设第一权重与所述交叉熵的乘积，得到第一数值；

获取所述正确样本对应的上次迭代预测概率；

计算1与所述上次迭代预测概率的差值，得到第一差值；

根据所述标注类别确定所述错误样本的期望输出概率；

计算所述预测概率和所述期望预测概率之间的交叉熵；

计算预设第二权重与所述交叉熵的乘积，得到第二数值；

获取所述错误样本对应的上次迭代预测概率；

根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤，包括：

以预设指数参数为指数，所述错误样本的上次迭代预测概率为底数，计算第二指数值；

计算所述第二指数值与所述第二数值的乘积，得到所述错误样本的加权损失值。

3.根据权利要求1所述的方法，其特征在于，若所述样本图片中包含上次迭代中没有的新样本图片，则所述获取所述正确样本对应的上次迭代预测概率，包括：

4.一种图片类别的识别装置，其特征在于，所述装置包括：

训练模块，用于根据所述损失值对所述预选模型的参数进行调整，以继续训练，直至总损失值小于预设损失值阈值，结束训练，所述总损失值为一组所述样本图片的验证集的损失；

最终预测模块，用于将目标图片输入至训练结束之后得到的预选模型，预测得到所述目标图片的类别；

其中，所述损失值计算模块包括：

其中，所述正确样本损失值计算子模块包括：

所述错误样本损失值计算子模块包括：

错误样本损失值计算单元，用于根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。

5.根据权利要求4所述的装置，其特征在于，所述正确样本损失值计算单元包括：

所述错误样本损失值计算单元包括：

第二指数值计算子单元，用于以预设指数参数为指数，所述错误样本的上次迭代预测概率为底数，计算第二指数值；

第二加权损失值计算子单元，用于计算所述第二指数值与所述第二数值的乘积，得到所述错误样本的加权损失值。

6.根据权利要求4所述的装置，其特征在于，若所述样本图片中包含上次迭代中没有的新样本图片，则所述第一上次预测概率获取单元包括：