CN110084271B - 一种图片类别的识别方法和装置 - Google Patents

一种图片类别的识别方法和装置 Download PDF

Info

Publication number
CN110084271B
CN110084271B CN201910224197.XA CN201910224197A CN110084271B CN 110084271 B CN110084271 B CN 110084271B CN 201910224197 A CN201910224197 A CN 201910224197A CN 110084271 B CN110084271 B CN 110084271B
Authority
CN
China
Prior art keywords
sample
prediction probability
value
calculating
loss value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910224197.XA
Other languages
English (en)
Other versions
CN110084271A (zh
Inventor
阮晓虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongdun Holdings Co Ltd
Original Assignee
Tongdun Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongdun Holdings Co Ltd filed Critical Tongdun Holdings Co Ltd
Priority to CN201910224197.XA priority Critical patent/CN110084271B/zh
Publication of CN110084271A publication Critical patent/CN110084271A/zh
Application granted granted Critical
Publication of CN110084271B publication Critical patent/CN110084271B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

在本发明实施例提供一种图片类别识别的方法和装置,所述方法包括:将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练。在上述方法中,计算图像分类模型训练的损失值时,将正确样本对应的第一权重设置为小于错误样本的第二权重,使得在训练过程中能够更加关注比较难的样本,从而加快了损失值下降的速度,进而以较低的代价实现了模型收敛速度的加快。

Description

一种图片类别的识别方法和装置
技术领域
本发明涉及深度学习领域,尤其涉及一种图片类别的识别方法和装置。
背景技术
目前,深度学习是人工智能领域中研究重点,大量的学者和研究人员投身其中,推动着其迅速发展。尽管深度学习取得了极大的成就,但其依旧面临着很多难题。尤其在图像分类领域,大量的训练数据和多可能性的分类概率,使得训练过程中产生更多的中间数据,这意味着图像分类的模型训练需要更多的训练存储空间和时间;训练一个图像分类的模型往往需要数天乃至数个月的时间,因而加速训练过程,节约时间成本是当下的一个重要研究方向。
对于加速训练,现有技术中一般采用在硬件方面采用GPU加速和集群计算,在算法上采用数据并行和模型并行方案。现有方案虽然加快了深度网络的训练迭代速度,但需要更快处理速度的GPU实现加速,或采用多个GPU组成集群,并行计算,导致设备成本较高,所以现有方案还不能以较低的代价解决模型收敛较慢的问题。
发明内容
有鉴于此,本发明实施例提出一种图片类别的识别方法和装置,以高效的解决现有图像分类领域模型收敛较慢的问题。
本发明实施例提供一种图片类别的识别方法,所述方法包括:
将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;
根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;
采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;
根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练;
将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。
可选地,所述采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率计算损失值的步骤,包括:
根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值;
根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值;
根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值;
可选地,所述根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值的步骤,包括:
根据所述标注类别确定所述正确样本的期望预测概率;
计算所述预测概率和所述期望预测概率之间的交叉熵;
计算预设第一权重与所述交叉熵的乘积,得到第一数值;
获取所述正确样本对应的上次迭代预测概率;
计算1与所述上次迭代预测概率的差值,得到第一差值;
根据所述第一差值、所述第一数值计算所述正确样本的加权损失值;
所述根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的损失值的步骤,包括:
根据所述标注类别确定所述错误样本的期望输出概率;
计算所述预测概率和所述期望预测概率之间的交叉熵;
计算预设第二权重与所述交叉熵的乘积,得到第二数值;
获取所述错误样本对应的上次迭代预测概率;
计算1与所述上次迭代预测概率的差值,得到第二差值;
根据所述第二差值、所述第二数值计算所述错误样本的加权损失值。
可选地,所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤,包括:
以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
所述根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值的步骤,包括:
以预设指数参数为指数,所述第二差值为底数,计算第二指数值;
计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值;
可选地,若所述样本图片中包含上次迭代中没有的新样本图片,则所述获取所述正确样本对应的上次迭代预测概率,包括:
获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
本发明实施例还提供一种图片类别的识别装置,所述装置包括:
初步预测模块,用于将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;
划分模块,用于根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;
损失值计算模块,用于采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;
训练模块,用于根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练;
最终预测模块,用于将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。
可选地,所述损失值计算模块包括:
正确样本损失值计算子模块,用于根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值;
错误样本损失值计算子模块,用于根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值;
损失值计算子模块,用于根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值;
可选地,所述正确样本损失值计算子模块包括:
第一期望预测概率确定单元,用于根据所述标注类别确定所述正确样本的期望预测概率;
第一交叉熵计算单元,用于计算所述预测概率和所述期望预测概率之间的交叉熵;
第一数值计算单元,用于计算预设第一权重与所述交叉熵的乘积,得到第一数值;
第一上次预测概率获取单元,用于获取所述正确样本对应的上次迭代预测概率;
第一差值计算单元,用于计算1与所述上次迭代预测概率的差值,得到第一差值;
正确样本损失值计算单元,用于根据所述第一差值、所述第一数值计算所述正确样本的加权损失值;
所述错误样本损失值计算子模块包括:
第二期望预测概率确定单元,用于根据所述标注类别确定所述错误样本的期望预测概率;
第二交叉熵计算单元,计算所述预测概率和所述期望预测概率之间的交叉熵;
第二数值计算单元,用于计算预设第二权重与所述交叉熵的乘积,得到第二数值;
第二上次预测概率获取单元,用于获取所述错误样本对应的上次迭代预测概率;
第二差值计算单元,用于计算1与所述上次迭代预测概率的差值,得到第二差值;
错误样本损失值计算单元,用于根据所述第二差值、所述第二数值计算所述错误样本的加权损失值。
可选地,所述正确样本损失值计算单元包括:
第一指数值计算子单元,用于以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
第一加权损失值计算子单元,用于计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
所述错误样本损失值计算单元包括:
第二指数值计算子单元,用于以预设指数参数为指数,所述第二差值为底数,计算第二指数值;
第二加权损失值计算子单元,用于计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值;
可选地,若所述样本图片中包含上次迭代中没有的新样本图片,则所述第一上次预测概率获取单元包括:
第一上次预测概率获取子单元,用于获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
本发明实施例包括以下优点:
在本发明实施例中,首先将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练;最终,将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。在上述方法中,计算图像分类模型训练的损失值时,将正确样本对应的第一权重设置为小于错误样本的第二权重,使得在训练过程中能够更加关注比较难的样本,从而加快了损失值下降的速度,进而以较低的代价实现了模型收敛速度的加快。
附图说明
图1示出了本发明实施例一中提供的图片类别的识别方法的流程图;
图2示出了本发明实施例二中提供的图片类别的识别装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参照图1,示出了本发明实施例一中提供的图片类别的识别方法的流程图,具体可以包括如下步骤:
步骤101,将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率。
在本发明实施例中,对于选定的训练模型,采用公开数据集,或客户正式数据输入模型进行训练。具体地,该输入数据样本为图片样本,模型为分类训练模型,例如卷积神经网络模型、VGG模型(Visual Geometry Group Network,超分辨率测试序列)等。分类训练模型根据自身的算法,对输入的图片样本进行分类,输出每一张样本图片属于每一个预测类别的概率,将最大的输出概率作为该次模型训练的预测概率,预测概率对应的预测类别则为本次模型训练的预测类别。
例如,输入的样本图片为在网页上采集到的各种刀具的图片,预测类别为正常刀具类别和管制刀具类别,模型计算出每个图片样本属于正常刀具的预测概率和属于管制刀具的预测概率,再根据预测概率确定预测类别。具体地,将预测概率较大的类别确定为预测类别。例如,若模型预测出某图片样本属于正常刀具的预测概率为90%,属于管制刀具的预测概率为10%,则最终模型确定该图片样本的预测类别为正常刀具类别。
步骤102,根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本。
在本发明实施例中,标注类别为样本图片所属的真实类别,每个样本图片对应有一个标注类别。将模型输出的预测类别与该样本图片的标注类别进行对比,若两者一致,则样本图片被分类正确,将所述样本图片划分为正确样本;若两者不一致,则样本图片被分类错误,将所述样本图片划分为错误样本。
例如,在上述刀具图片样本的预测中,若图片样本为水果刀,标注类别为正常刀具。将该图片样本输入模型后,得出预测类别为正常刀具,则说明预测类别与标注类别一致,则可以将该水果刀的样本图片划分为正确样本;若该图片样本输入模型后,得出预测类别为管制刀具,则说明预测类别与标注类别不一致,则可以将该水果刀的样本图片划分为错误样本。
若输入的样本图片被划分为错误样本,则说明该样本图片的识别难度较大。
步骤103,采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重。
在本发明实施例中,损失值即模型在样本上的输出与真实值之间的误差,即模型本身的精准度,反映出算法的拟合能力。模型在不断的迭代训练过程中,损失值逐渐减小,模型的精度逐渐提高。将每一次模型训练时的输出值代入预设的损失函数,可以得到本次模型训练的损失值。
样本图片的期望预测概率,即该图片对于某个预测类别的被期望预测概率值。例如,对于水果刀这个样本图片,针对正常刀具这个预测类别的期望预测概率为100%,而针对管制刀具这个预测类别的期望预测概率为0%。
第一权重和第二权重分别针对于正确样本和错误样本,设置第一权重小于第二权重,可以在计算损失值时更侧重于增加错误样本的损失值所占比重,这样使得在训练过程中更加关注较难的样本图片。
本发明实施例将预设第一权重、预设第二权重,本次模型训练输出的预测概率和期望预测概率带入损失函数,即得到本次模型训练的损失值。
在本发明的一个可选实施例中,步骤103包括子步骤1031和子步骤1032:
子步骤1031,根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值。
正确样本对应的预测概率,包括正确样本对应各个预测类别的预测概率,其为一个向量值,即包括多个值。多个图片样本的预测概率综合起来,可以得到一个多行多列的矩阵。例如,模型计算出水果刀这个图片样本属于正常刀具的预测概率为90%,属于管制刀具的预测概率为10%,则水果刀这个正确样本的预测概率为90%和10%,即该预测概率为两个值。
根据标注类别可以得到图片样本的期望输出概率,该期望输出概率为针对每一种预测类别的期望输出概率,其同样是一个向量值。
在正确样本中,根据每个样本对应的预测概率、预设的第一权重以及标注类别,计算正确样本的加权损失值。
在本发明实施例的一个可选实施例中,子步骤1031可以包括如下子步骤10311-10316:
子步骤10311,根据所述标注类别确定所述正确样本的期望预测概率;
子步骤10312,计算所述预测概率和所述期望预测概率之间的交叉熵;
在子步骤10311-10322中,每一个预测类别对应一个期望预测概率,在预测类别中,只有标注类别对应的期望预测概率为1,而其他预测类别对应的期望预测概率为0;分类训练模型根据自身的算法,对输入的图片样本进行分类,输出每一张样本图片属于每一个预测类别的概率,将最大的输出概率作为该次模型训练的预测概率;交叉熵(CrossEntropy)主要用于度量两个概率分布间的差异性信息。
在本发明实施例中的正确样本的交叉熵J1计算公式为:
Figure BDA0002004554570000081
其中,i是正确样本中的样本序号,yi是正确样本的期望预测概率,Si是正确样本的模型输出的预测概率,T表示正确样本的样本总量。
子步骤10313,计算预设第一权重与所述交叉熵的乘积,得到第一数值;
在本步骤中,设预设第一权重为α,则第一数值为α乘以J1
子步骤10314,获取所述正确样本对应的上次迭代预测概率;
在本步骤中,设训练轮数,即迭代次数为K,则正确样本对应的上次迭代预测概率,即为该正确样本在上一轮训练中得到的预测概率,记为
Figure BDA0002004554570000091
对应的,可将本次模型输出的预测概率Si记为
Figure BDA0002004554570000092
子步骤10315,计算1与所述上次迭代预测概率的差值,得到第一差值;
在本步骤中,第一差值C1为:
Figure BDA0002004554570000093
子步骤10316,根据所述第一差值、所述第一数值计算所述正确样本的加权损失值。
在本步骤中,根据所述第一差值、所述第一数值得到所述正确样本的加权损失值La,用公式表示为:
Figure BDA0002004554570000094
在本发明的一个可选实施例中,所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤,包括以下子步骤A1和子步骤A2:
子步骤A1:以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
子步骤A2:计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
在本发明实施例中,设预设指数为λ,则第一指数值Z1为:
Figure BDA0002004554570000095
计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的带指数的加权损失值为:
Figure BDA0002004554570000101
这里,第一指数值可以看作是正确样本的交叉熵的系数。
通过为交叉熵J1设置第一指数值而得到加权损失值L1,可以有效调节交叉熵的乘积系数,使得交叉熵可以根据样本数值得到适应性调整,更有利于损失值的收敛。
子步骤1032,根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值。
与正确样本类似,错误样本对应的预测概率,包括错误样本对应各个预测类别的预测概率,其为一个向量值,即包括多个值。多个图片样本的预测概率综合起来,可以得到一个多行多列的矩阵。例如,模型计算出弹簧刀图片样本属于正常刀具的预测概率为80%,属于管制刀具的预测概率为20%,模型输出的预测类别为正常刀具,而该图片样本的标注类别为管制刀具,则该弹簧刀图片样本被划分为错误样本。弹簧刀这个错误样本的预测概率为80%和20%,该预测概率也为两个值。
相应地,若预测类别包含N(N≥2)个类别,则预测概率也为N个值。
根据标注类别可以得到图片样本的期望输出概率,该期望输出概率为针对每一种预测类别的期望输出概率,其同样是一个向量值。
在错误样本中,根据每个样本对应的预测概率、预设的第一权重以及标注类别,计算错误样本的加权损失值。
在本发明的一个可选实施例中,子步骤1032可以包括如下子步骤10321-10325:
子步骤10321,根据所述标注类别确定所述错误样本的期望输出概率;
子步骤10322,计算所述预测概率和所述期望预测概率之间的交叉熵;
子步骤10323,计算预设第二权重与所述交叉熵的乘积,得到第二数值;
子步骤10324,获取所述错误样本对应的上次迭代预测概率;
子步骤10325,用于根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。
在本发明实施例中,设错误样本的样本序号为j,预设第二权重为β,错误样本在上一轮训练中得到的预测概率为
Figure BDA0002004554570000111
错误样本在本轮训练中得到的预测概率为
Figure BDA0002004554570000112
则根据所述第二差值、所述第二数值计算所述错误样本的加权损失值Lb为:
Figure BDA0002004554570000113
子步骤10321-子步骤10325与正确样本的加权损失值的计算子步骤10311-子步骤10316类似,本发明实施例不再赘述。
在本发明的一个可能的实施例中,根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值的步骤,包括以下子步骤:
子步骤A3,以预设指数参数为指数,所述错误样本的上次迭代预测概率为底数,计算第二指数值;
子步骤A4,计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值。
在本发明实施例中,与正确样本类似,得到错误样本的带指数的加权损失值为:
Figure BDA0002004554570000114
这里,第二指数值可以看作是错误样本的交叉熵的系数。
子步骤1033,根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值。
在本发明实施例中,根据子步骤1031计算得到的正确样本的加权损失值L1和子步骤1032中计算得到的错误样本的加权损失值L2,来计算整个样本的损失值L,其中,L=L1+L2
具体地,整个样本的损失值L计算公式为:
Figure BDA0002004554570000121
由于第一权重α小于第二权重β,且正确样本的交叉熵系数大于错误样本的交叉熵系数,所以整个样本的损失值更侧重于增加错误样本的损失值所占比重。
步骤104,根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练。
训练一个模型实际上就是寻找一组使得损失函数取值最小的模型参数,这需要进行完每一轮的模型训练后调整损失函数中的参数,使得损失值L随着训练轮数的增加而缓慢下降,然后趋于稳定。损失值稳定后,将一组样本图片的验证集数据输入模型,将得到的输出数据与预设的标注数据进行比较,计算验证集的损失,该损失值小于预设损失值阈值后,结束训练。
步骤105,将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。
模型训练完成后,将待分类的目标图片输入至模型中,根据对目标图片的预测类别得到该目标图片所属的类别。
在本发明的一个可能的实施例中,若所述样本图片中包含上次迭代中没有的新样本图片,则所述获取所述正确样本对应的上次迭代预测概率,包括:
获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
在本发明实施例中,可以在模型训练的迭代过程中,自动化发布中间版本的训练模型,面向客户提供初步数据集接入服务。客户调用中间版本的训练模型,获得“一般效果”的服务;同时,服务器端将收集到的客户数据保存至数据存储池,并将预训练模型得到的结果,导入到数据标注及审核平台进行人工校验修正。经过一段时间的积累,客户数据达到一定规模,将经过人工校验和修正的数据集加入到预训练模型的数据集中一起参与下一个模型的训练。
在这个过程中,当前训练轮次的样本图片中会包含上次迭代中没有的新样本图片,那么在计算损失函数的损失值时,会缺失上次迭代的预测概率,此时,可以将上次迭代预测概率设置为预设的默认值。例如,可以将上次迭代预测概率设置为1或0,或任意1和0之间的值。
综上所述,在本发明实施例中,首先将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练;最终,将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。在上述方法中,计算图像分类模型训练的损失值时,将正确样本对应的第一权重设置为小于错误样本的第二权重,使得在训练过程中能够更加关注比较难的样本,从而加快了损失值下降的速度,进而以较低的代价实现了模型收敛速度的加快。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定都是本申请实施例所必须的。
实施例二
参照图2所示,为本发明实施例二提供的图片类别的识别装置200的结构框图,上述装置200具体可以包括:
初步预测模块201,用于将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;
划分模块202,用于根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;
损失值计算模块203,用于采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;
训练模块204,用于根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至所述总损失值小于预设损失值阈值,结束训练;
最终预测模块205,用于将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别。
可选地,所述损失值计算模块包括:
正确样本损失值计算子模块,用于根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值;
错误样本损失值计算子模块,用于根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值;
损失值计算子模块,用于根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值;
可选地,所述正确样本损失值计算子模块包括:
第一期望预测概率确定单元,用于根据所述标注类别确定所述正确样本的期望预测概率;
第一交叉熵计算单元,用于计算所述预测概率和所述期望预测概率之间的交叉熵;
第一数值计算单元,用于计算预设第一权重与所述交叉熵的乘积,得到第一数值;
第一上次预测概率获取单元,用于获取所述正确样本对应的上次迭代预测概率;
第一差值计算单元,用于计算1与所述上次迭代预测概率的差值,得到第一差值;
正确样本损失值计算单元,用于根据所述第一差值、所述第一数值计算所述正确样本的加权损失值;
所述错误样本损失值计算子模块包括:
第二期望预测概率确定单元,用于根据所述标注类别确定所述错误样本的期望预测概率;
第二交叉熵计算单元,计算所述预测概率和所述期望预测概率之间的交叉熵;
第二数值计算单元,用于计算预设第二权重与所述交叉熵的乘积,得到第二数值;
第二上次预测概率获取单元,用于获取所述错误样本对应的上次迭代预测概率;
第二差值计算单元,用于计算1与所述上次迭代预测概率的差值,得到第二差值;
错误样本损失值计算单元,用于根据所述第二差值、所述第二数值计算所述错误样本的加权损失值。
可选地,所述正确样本损失值计算单元包括:
第一指数值计算子单元,用于以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
第一加权损失值计算子单元,用于计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
所述错误样本损失值计算单元包括:
第二指数值计算子单元,用于以预设指数参数为指数,所述第二差值为底数,计算第二指数值;
第二加权损失值计算子单元,用于计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值;
可选地,若所述样本图片中包含上次迭代中没有的新样本图片,则所述第一上次预测概率获取单元包括:
第一上次预测概率获取子单元,用于获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
本发明实施例提供的图片类别的识别装置200能够实现图1的方法实施例中图片识别的方法实现的各个过程,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种图片识别的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种图片类别的识别方法,其特征在于,所述方法包括:
将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;
根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;
采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;
根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至总损失值小于预设损失值阈值,结束训练,所述总损失值为一组所述样本图片的验证集的损失;
将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别;
其中,所述采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率计算损失值的步骤,包括:
根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值;
根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值;
根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值;
其中,所述根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值的步骤,包括:
根据所述标注类别确定所述正确样本的期望预测概率;
计算所述预测概率和所述期望预测概率之间的交叉熵;
计算预设第一权重与所述交叉熵的乘积,得到第一数值;
获取所述正确样本对应的上次迭代预测概率;
计算1与所述上次迭代预测概率的差值,得到第一差值;
根据所述第一差值、所述第一数值计算所述正确样本的加权损失值;
所述根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的损失值的步骤,包括:
根据所述标注类别确定所述错误样本的期望输出概率;
计算所述预测概率和所述期望预测概率之间的交叉熵;
计算预设第二权重与所述交叉熵的乘积,得到第二数值;
获取所述错误样本对应的上次迭代预测概率;
根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一差值、所述第一数值计算所述正确样本的加权损失值的步骤,包括:
以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
所述根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值的步骤,包括:
以预设指数参数为指数,所述错误样本的上次迭代预测概率为底数,计算第二指数值;
计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值。
3.根据权利要求1所述的方法,其特征在于,若所述样本图片中包含上次迭代中没有的新样本图片,则所述获取所述正确样本对应的上次迭代预测概率,包括:
获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
4.一种图片类别的识别装置,其特征在于,所述装置包括:
初步预测模块,用于将样本图片输入至预选模型中,预测得到所述样本图片的预测类别以及对应的预测概率;
划分模块,用于根据所述样本图片的预测类别和标注类别,将所述样本图片划分为正确样本或错误样本;
损失值计算模块,用于采用针对正确样本的预设第一权重、针对错误样本的预设第二权重,根据所述样本图片的预测概率和期望预测概率计算损失值,所述第一权重小于所述第二权重;
训练模块,用于根据所述损失值对所述预选模型的参数进行调整,以继续训练,直至总损失值小于预设损失值阈值,结束训练,所述总损失值为一组所述样本图片的验证集的损失;
最终预测模块,用于将目标图片输入至训练结束之后得到的预选模型,预测得到所述目标图片的类别;
其中,所述损失值计算模块包括:
正确样本损失值计算子模块,用于根据所述正确样本对应的预测概率、预设第一权重、标注类别,计算得到所述正确样本的加权损失值;
错误样本损失值计算子模块,用于根据所述错误样本对应的预测概率、预设第二权重、标注类别,计算得到所述错误样本的加权损失值;
损失值计算子模块,用于根据所述正确样本的加权损失值和错误样本的加权损失值计算损失值;
其中,所述正确样本损失值计算子模块包括:
第一期望预测概率确定单元,用于根据所述标注类别确定所述正确样本的期望预测概率;
第一交叉熵计算单元,用于计算所述预测概率和所述期望预测概率之间的交叉熵;
第一数值计算单元,用于计算预设第一权重与所述交叉熵的乘积,得到第一数值;
第一上次预测概率获取单元,用于获取所述正确样本对应的上次迭代预测概率;
第一差值计算单元,用于计算1与所述上次迭代预测概率的差值,得到第一差值;
正确样本损失值计算单元,用于根据所述第一差值、所述第一数值计算所述正确样本的加权损失值;
所述错误样本损失值计算子模块包括:
第二期望预测概率确定单元,用于根据所述标注类别确定所述错误样本的期望预测概率;
第二交叉熵计算单元,计算所述预测概率和所述期望预测概率之间的交叉熵;
第二数值计算单元,用于计算预设第二权重与所述交叉熵的乘积,得到第二数值;
第二上次预测概率获取单元,用于获取所述错误样本对应的上次迭代预测概率;
错误样本损失值计算单元,用于根据所述第二数值、所述上次迭代预测概率计算所述错误样本的加权损失值。
5.根据权利要求4所述的装置,其特征在于,所述正确样本损失值计算单元包括:
第一指数值计算子单元,用于以预设指数参数为指数,所述第一差值为底数,计算第一指数值;
第一加权损失值计算子单元,用于计算所述第一指数值与所述第一数值的乘积,得到所述正确样本的加权损失值;
所述错误样本损失值计算单元包括:
第二指数值计算子单元,用于以预设指数参数为指数,所述错误样本的上次迭代预测概率为底数,计算第二指数值;
第二加权损失值计算子单元,用于计算所述第二指数值与所述第二数值的乘积,得到所述错误样本的加权损失值。
6.根据权利要求4所述的装置,其特征在于,若所述样本图片中包含上次迭代中没有的新样本图片,则所述第一上次预测概率获取单元包括:
第一上次预测概率获取子单元,用于获取所述新样本图片中的正确样本对应的上次迭代预测概率,其中,所述上次迭代预测概率为预设的默认值。
CN201910224197.XA 2019-03-22 2019-03-22 一种图片类别的识别方法和装置 Active CN110084271B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910224197.XA CN110084271B (zh) 2019-03-22 2019-03-22 一种图片类别的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910224197.XA CN110084271B (zh) 2019-03-22 2019-03-22 一种图片类别的识别方法和装置

Publications (2)

Publication Number Publication Date
CN110084271A CN110084271A (zh) 2019-08-02
CN110084271B true CN110084271B (zh) 2021-08-20

Family

ID=67413464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910224197.XA Active CN110084271B (zh) 2019-03-22 2019-03-22 一种图片类别的识别方法和装置

Country Status (1)

Country Link
CN (1) CN110084271B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991496B (zh) * 2019-11-15 2023-05-30 北京三快在线科技有限公司 一种训练模型的方法及装置
CN111160411B (zh) * 2019-12-11 2023-09-29 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111310814A (zh) * 2020-02-07 2020-06-19 支付宝(杭州)信息技术有限公司 利用不平衡正负样本对业务预测模型训练的方法及装置
CN111368903B (zh) * 2020-02-28 2021-08-27 深圳前海微众银行股份有限公司 模型性能优化方法、装置、设备及存储介质
CN111046980B (zh) * 2020-03-16 2020-06-30 腾讯科技(深圳)有限公司 一种图像检测方法、装置、设备及计算机可读存储介质
CN111507989A (zh) * 2020-04-15 2020-08-07 上海眼控科技股份有限公司 语义分割模型的训练生成方法、车辆外观检测方法、装置
CN113537262A (zh) * 2020-04-20 2021-10-22 深信服科技股份有限公司 数据分析方法、装置、设备和可读存储介质
CN111522946A (zh) * 2020-04-22 2020-08-11 成都中科云集信息技术有限公司 一种基于注意力长短期记忆循环神经网络的论文质量测评方法
CN111539417B (zh) * 2020-04-28 2024-04-05 深源恒际科技有限公司 一种基于深度神经网络的文本识别训练优化方法
CN111428008B (zh) * 2020-06-11 2020-09-29 北京百度网讯科技有限公司 用于训练模型的方法、装置、设备以及存储介质
CN111814835A (zh) * 2020-06-12 2020-10-23 理光软件研究所(北京)有限公司 计算机视觉模型的训练方法、装置、电子设备和存储介质
CN114495291B (zh) * 2022-04-01 2022-07-12 杭州魔点科技有限公司 活体检测的方法、系统、电子装置和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141883B1 (en) * 2015-05-11 2015-09-22 StradVision, Inc. Method, hard negative proposer, and classifier for supporting to collect hard negative images using a similarity map
CN106372658A (zh) * 2016-08-30 2017-02-01 广东工业大学 车辆分类器的训练方法
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
CN106778820A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 识别模型确定方法及装置
CN107292887A (zh) * 2017-06-20 2017-10-24 电子科技大学 一种基于深度学习自适应权重的视网膜血管分割方法
CN108229555A (zh) * 2017-12-29 2018-06-29 深圳云天励飞技术有限公司 样本权重分配方法、模型训练方法、电子设备及存储介质
CN109272045A (zh) * 2018-09-25 2019-01-25 华南农业大学 一种基于神经网络和迁移学习的水果图像分类方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11164076B2 (en) * 2016-10-20 2021-11-02 Uber Technologies, Inc. Intelligent regularization of neural network architectures
US10318889B2 (en) * 2017-06-26 2019-06-11 Konica Minolta Laboratory U.S.A., Inc. Targeted data augmentation using neural style transfer
US10679075B2 (en) * 2017-08-31 2020-06-09 Nec Corporation Dense correspondence estimation with multi-level metric learning and hierarchical matching

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141883B1 (en) * 2015-05-11 2015-09-22 StradVision, Inc. Method, hard negative proposer, and classifier for supporting to collect hard negative images using a similarity map
CN106372658A (zh) * 2016-08-30 2017-02-01 广东工业大学 车辆分类器的训练方法
CN106548210A (zh) * 2016-10-31 2017-03-29 腾讯科技(深圳)有限公司 机器学习模型训练方法及装置
WO2018077285A1 (zh) * 2016-10-31 2018-05-03 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、服务器及存储介质
CN106778820A (zh) * 2016-11-25 2017-05-31 北京小米移动软件有限公司 识别模型确定方法及装置
CN107292887A (zh) * 2017-06-20 2017-10-24 电子科技大学 一种基于深度学习自适应权重的视网膜血管分割方法
CN108229555A (zh) * 2017-12-29 2018-06-29 深圳云天励飞技术有限公司 样本权重分配方法、模型训练方法、电子设备及存储介质
CN109272045A (zh) * 2018-09-25 2019-01-25 华南农业大学 一种基于神经网络和迁移学习的水果图像分类方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Weight Loss for Point Clouds Classification;FangYuan Huang 等;《Proceedings of 2019 3rd International Conference on Machine Vision and Information Technology (CMVIT 2019)》;20190222;第374-379页 *

Also Published As

Publication number Publication date
CN110084271A (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN110084271B (zh) 一种图片类别的识别方法和装置
US9129228B1 (en) Robust and fast model fitting by adaptive sampling
US20220092416A1 (en) Neural architecture search through a graph search space
CN110135505B (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
US20200372342A1 (en) Systems and methods for predictive early stopping in neural network training
CN108536784B (zh) 评论信息情感分析方法、装置、计算机存储介质和服务器
JP6807909B2 (ja) データ評価方法、装置、機器及び読み取り可能な記憶媒体
CN111625516A (zh) 检测数据状态的方法、装置、计算机设备和存储介质
CN111178537A (zh) 一种特征提取模型训练方法及设备
CN112084330A (zh) 一种基于课程规划元学习的增量关系抽取方法
CN112396211A (zh) 一种数据预测方法及装置、设备和计算机存储介质
CN115391561A (zh) 图网络数据集的处理方法、装置、电子设备、程序及介质
CN112119410A (zh) 用于用覆盖引导模糊测试调试神经网络的系统和方法
CN113902260A (zh) 信息预测方法、装置、电子设备和介质
CN113011532A (zh) 分类模型训练方法、装置、计算设备及存储介质
CN112836750A (zh) 一种系统资源分配方法、装置及设备
CN109460474B (zh) 用户偏好趋势挖掘方法
Ding et al. Dirichlet process mixture models with shrinkage prior
CN114154252B (zh) 新能源汽车动力电池系统失效模式的风险评估方法及装置
CN111048145A (zh) 蛋白质预测模型的生成方法、装置、设备和存储介质
CN111026661B (zh) 一种软件易用性全面测试方法及系统
CN114971375A (zh) 基于人工智能的考核数据处理方法、装置、设备及介质
CN110162629B (zh) 一种基于多基模型框架的文本分类方法
CN109801675B (zh) 一种确定蛋白质脂质功能的方法、装置和设备
CN113627513A (zh) 一种训练数据生成方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant