CN110751197A - 图片分类方法、图片模型训练方法及设备 - Google Patents

图片分类方法、图片模型训练方法及设备 Download PDF

Info

Publication number
CN110751197A
CN110751197A CN201910974983.1A CN201910974983A CN110751197A CN 110751197 A CN110751197 A CN 110751197A CN 201910974983 A CN201910974983 A CN 201910974983A CN 110751197 A CN110751197 A CN 110751197A
Authority
CN
China
Prior art keywords
picture
classification model
loss function
parameter
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910974983.1A
Other languages
English (en)
Inventor
周康明
戚风亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Eye Control Technology Co Ltd
Original Assignee
Shanghai Eye Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eye Control Technology Co Ltd filed Critical Shanghai Eye Control Technology Co Ltd
Priority to CN201910974983.1A priority Critical patent/CN110751197A/zh
Publication of CN110751197A publication Critical patent/CN110751197A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明的目的是提供一种图片分类方法、图片模型训练方法及设备,本发明通过图片分类模型包括待学习的参数w;确定损失函数,损失函数包括超参n,损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚,所述损失函数基于该超参n,可以根据不同场景进行自主的调节,基于损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行调节,所述待学习的参数w的值和超参n的值调节完成后,可用于加快图片分类模型的学习速度。

Description

图片分类方法、图片模型训练方法及设备
技术领域
本发明涉及计算机领域,尤其涉及一种图片分类方法、图片模型训练方法及设备。
背景技术
深度学习作为人工智能领域一个重要的分支,在图像和语音识别等领域已取得巨大的成功。其中,神经网络作为深度学习中的重要工具,已广泛应用于高校和企业中。
截止目前,神经网络主要包含两种:卷积神经网络和循环(递归)神经网络。前者主要应用于图像识别,后者主要应用于语音领域。
在图像识别领域,二分类作为一个基本问题,在很多场景中都有涉及。在这类问题中,一张图片只能属于2个类别中的1种,在后面的内容中,我们假设两个类别分别为1和0,这是一种常规的编码方式,同时一张图片只能属于1个类别。
卷积神经网络作为一种在图像领域广泛使用的模型,其包含大量可学习的参数,可应用于图像的二分类问题。在这类应用场景中,它以图片为输入(假设图片以字母x代替),以图片所属某一类别(假设图片所属的类别为y,其中y∈{-1,1})的概率为输出。
为了确定神经网络中待定的参数,我们需要为网络提供大量的训练样本,训练样本主要包括图片x本身以及它所对应的真实类别标签y。在训练过程中,我们需要为网络指定目标函数,该目标函数衡量了网络在训练集上的性能。一般情况下,我们定义目标函数为一种损失函数,当当前预测与真实目标存在偏差时,损失函数将对当前预测进行相应的惩罚,该损失函数越小,模型在训练集上的性能越好。
损失函数作为分类问题中的重要元素,对于网络的训练十分重要,一个合理的损失函数可以加快网络的学习速度。从直观上理解,假设图片x的类别y=1,模型需要预测x属于1的概率,即p(y=1)。在训练的过程中,如果p(y=1)的概率值距离1的值很近,那么相应的损失应该很小,反之,则更大。
现有分类问题普遍使用交叉熵损失函数,该损失函数虽然可以指导模型进行学习,但在满足上述预期方面,却并不合适。
发明内容
本发明的一个目的是提供一种图片分类方法、图片模型训练方法及设备。
根据本发明的一个方面,提供了一种图片分类方法,该方法包括:
建立图片分类模型,所述图片分类模型包括待学习的参数w;
确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,以得到图片分类模型;
基于所述目标图片分类模型对待分类的图片进行分类。
进一步的,上述方法中,基于所述损失函数、第一图片的第一类别判定输出及其所述第一图片的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,包括:
基于所述损失函数对第一图片的第一类别判定输出及所述第一图片对应的真实类别计算第一图片的类别判定的损失值;
选取第一图片的类别判定的损失值中的最低值;将所述第一图片的类别判定的损失值为所述最低值时对应的参数w的值,作为参数w的最终值。
进一步的,上述方法中,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,包括:
将第二图片的第二类别判定输出与所述第二图片对应的真实类别进行比较,得到第二图片的类别判定的准确度;
选取第二图片的类别判定的准确度中的最高值;将所述第二图片的类别判定的准确度为所述最高值时对应的超参n的值,作为超参n的最终值。
进一步的,上述方法中,所述损失函数的公式如下:
l=exp(-yf),
其中,,v表示某张第一图片x的第一特征向量,T表示转置,y表示所述某张第一图片的类别,p(y=1|x)表示某张第一图片x的类别y属于1的概率,p(y=-1|x)表示某张第一图片x的类别y属于-1的概率,以得到可靠的图片分类模型。
进一步的,上述方法中,建立图片分类模型之前,还包括:
获取训练集和验证集,其中,所述训练集包括多张第一图片,和每张第一图片对应的真实类别,所述验证集包括多张第二图片,和每张第二图片对应的真实类别;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,包括:
将训练集中的第一图片输入所述图片分类模型,通过所述图片分类模型将所述训练集中的每张第一图片分别映射为对应的第一特征向量,并基于第一特征向量以得到可靠的第一类别判定输出,以便后续训练得到可靠的图片分类模型;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,包括:
将验证集中的第二图片输入所述图片分类模型,通过所述图片分类模型将所述验证集中的每张第二图片分别映射为对应的第二特征向量,并基于所述第二特征向量得到可靠的第二类别判定输出,以便后续训练得到可靠的图片分类模型。
进一步的,上述方法中,通过所述图片分类模型将所述训练集中的每张第一图片分别映射为对应的第一特征向量,通过所述图片分类模型将所述验证集中的每张第二图片分别映射为对应的第二特征向量之前,还包括:
分别对每张第一图片和第二图片进行如下至少一项的预处理:
将第一图片和第二图片的大小调整到固定的尺寸图;
对第一图片和第二图片进行通道去均值处理,以便后续训练得到可靠的图片分类模型。
根据本发明的另一方面,还提供一种图片分类设备,其中,该设备包括:
模型建立装置,用于建立图片分类模型,所述图片分类模型包括待学习的参数w;
损失函数装置,用于确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
参数w调节装置,用于将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
超参n调节装置,用于将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型;
分类装置,用于基于所述目标图片分类模型对待分类的图片进行分类。
根据本发明的另一方面,还提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
根据本发明的另一方面,还提供一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行上述任一项所述的方法。
根据本发明的另一方面,还提供一种图片分类模型的训练方法,其中,该方法包括:
建立图片分类模型,所述图片分类模型包括待学习的参数w;
确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型。
与现有技术相比,本发明通过图片分类模型包括待学习的参数w;确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚,所述损失函数基于该超参n,可以根据不同场景进行自主的调节,基于所述损失函数、第一图片的第一类别判定输出及其对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,基于第二图片的第二类别判定输出及其对应的真实类别,对所述损失函数中的超参n的值进行调节,所述待学习的参数w的值和超参n的值调节完成后,可用于加快图片分类模型的学习速度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明一图片分类方法的流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如图1所示,本发明提供一种图片分类方法,所述方法包括:
步骤S3,建立图片分类模型,所述图片分类模型包括待学习的参数w;
步骤S4,确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
在此,分类过程将对映射后的特征向量vi进行分类,在二分类的问题中,本发明可以使用sigmoid分类器建立图片分类模型,该分类器中包含可学习参数w和分类神经网络中的超参n;
超参是根据实际场景进行调节设置的参数,该参数不需要在神经网络中进行学习;
图片分类模型所用的分类神经网络可以包括但不限于VGG,AlexNet,ResNet,GoogleNet等常规卷积神经网络;
神经网络是机器学习中的一种模型,通过模拟人体神经的运行机制,实现某种映射函数的近似;
步骤S5,将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
步骤S6,将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及其对应的真实类别,对所述损失函数中的超参n的值进行选择,以得到图片分类模型;
步骤S7,基于所述目标图片分类模型对待分类的图片进行分类。
在此,本发明通过图片分类模型包括待学习的参数w;确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚,所述损失函数基于该超参n,可以根据不同场景进行自主的调节,基于所述损失函数、第一图片的第一类别判定输出及其所述第一图片的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行调节,所述待学习的参数w的值和超参n的值调节完成后,可用于加快图片分类模型的学习速度。
本发明的图片分类方法一实施例中,步骤S5,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,包括:
基于所述损失函数对第一图片的第一类别判定输出及所述第一图片对应的真实类别计算第一图片的类别判定的损失值;
选取第一图片的类别判定的损失值中的最低值;将所述第一图片的类别判定的损失值为所述最低值时对应的参数w的值,作为参数w的最终值。
例如,参数w的值为w1、w2和w3,从参数w的值w1、w2和w3中选取所有第一图片的类别判定的损失值为最低时对应的参数w的值w3,将选取到的参数w的值w3作为最终的参数w的值。
本发明的图片分类方法一实施例中,步骤S6,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,包括:
将第二图片的第二类别判定输出与所述第二图片对应的真实类别进行比较,得到第二图片的类别判定的准确度;
选取第二图片的类别判定的准确度中的最高值;将所述第二图片的类别判定的准确度为所述最高值时对应的超参n的值,作为超参n的最终值。
例如,超参n的值为n1、n2、n3和n4,从超参n的值n1、n2、n3和n4中选取所有第二图片的类别判定的准确度为最高时对应超参n的值n2,将选取到的超参n的值n2作为超参n的值的最终值。
本领域技术人员可以理解,一个超参n对应于一个图片分类模型;比如设定了3个超参n,将这3个超参n分别应用于3个图片分类模型。在该例子中,第一个超参n应用于图片分类模型1;第二个超参n应用于图片分类模型2;第三个超参n应用于图片分类模型3;那么在得到这3个图片分类模型输出准确度后,将在这3个图片分类模型输出的准确度最高的超参n的值,作为超参n的最终值,后边只保留该超参n的最终值所应用的图片分类模型,该图片分类模型即目标图片分类模型。
在此,可以将各张第二图片及第二图片对应的真实类别输入图片分类模型,以得到每张第二图片对应的判定类别,然后将每张第二图片对应的判定类别与其真实类别进行比较,得到第二图片的类别判定的准确度,基于第二图片的类别判定的准确度反复调整超参n的值,直至所述图片分类模型中的超参n的值调节为所有第二图片的类别判定的准确度大于第二预设阈值时所对应的值。
本发明的图片分类方法一实施例中,所述损失函数的公式如下:
l=exp(-yf),
其中,,v表示某张第一图片x的第一特征向量,T表示转置,y表示所述某张第一图片的类别,p(y=1|x)表示某张第一图片x的类别y属于1的概率,p(y=-1|x)表示某张第一图片x的类别y属于-1的概率。
在此,可以定义一种用于神经网络二分类问题中的新型损失函数,形式为:
l=exp(-yf) (2)
在此,为简单起见,可以定义p(y=1x)=μ。在神经网络中,损失对样本的重视程度体现在反向传播的梯度中,基于式(2)进行相关梯度的求导:
Figure BDA0002233322070000102
Figure BDA0002233322070000103
两种情况下,产生的梯度值比例表征了在重视程度上的差异性,即:
Figure BDA0002233322070000104
上式衡量了一个样本在被分类好和被分类不好时的损失的梯度的比例,从直观上理解,相较于那些分类好的样本,我们更希望模型充分调整那些分类效果不好的样本,而这种重视程度的调整可以根据参数n进行自主调节。
举例来说,现在假设x的真实标签(真实类别)y=1,分类器预测出来的概率值p(y=1|x)=0.2。显然,这样的结果是不好的。在这种情况下,生成的梯度为
Figure BDA0002233322070000111
如果分类器预测出来的概率值p(y=1|x)=0.8,也就是说模型预测的结果比较好,此时产生的梯度值为
Figure BDA0002233322070000112
在这种情况下,两种梯度的比例为通过调整n值,可以控制模型在重视程度上的分配。
如图1所示,本发明的图片分类方法一实施例中,步骤S3,建立图片分类模型之前,还包括:
步骤S1,获取训练集和验证集,其中,所述训练集包括多张第一图片和每张第一图片对应的真实类别,所述验证集包括多张第二图片和每张第二图片对应的真实类别;
步骤S5中,将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,包括:
将训练集中的一张或多张第一图片输入所述图片分类模型,通过所述图片分类模型将所述训练集中的每张第一图片分别映射为对应的第一特征向量,并基于第一特征向量以得到第一类别判定输出;
步骤S6中,将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,包括:
将验证集中的一张或多张第二图片输入所述图片分类模型,通过所述图片分类模型将所述验证集中的每张第二图片分别映射为对应的第二特征向量,并基于所述第二特征向量得到第二类别判定输出。
在此,特征向量是图片在另一个空间中的一种表示,该特征向量表征了图片的某种抽象特征;
经过神经网络计算后的图像最终映射到一个特征向量(假设图片xi,映射到的向量为vi),该特征向量为图片在另一个空间的抽象表示,在该空间中,属于同一类的图片的特征向量具有更近的距离,属于不同类别的图片距离更远。
如图1所示,本发明的图片分类方法一实施例中,通过所述图片分类模型将所述训练集图片中的每张第一图片分别映射为对应的第一特征向量,通过所述图片分类模型将所述验证集图片中的每张第二图片分别映射为对应的第二特征向量之前,还包括:
分别对每张第一图片和第二图片进行如下至少一项的预处理:
将第一图片和第二图片的大小调整到固定的尺寸图;
对第一图片和第二图片的进行通道去均值处理。
在此,分别读取训练集图片和验证集图片中的各张图片(以下将以元组(xi,yi),表示第i张图片,其中x表示图片本身,y表示对应的真实类别)。在实际训练过程中,可以一次读取多个训练数据,这些数据共同组成一个批次。在将图片输入到网络之前,可以对图片进行预处理,包括但不限于:将图片大小调整到固定的尺寸,对图片进行通道去均值处理等等;
通过分别对每张第一图片和第二图片进行上述至少一项的预处理,可以保证后续分别映射为对应的第一特征向量或第二特征向量更准确。
根据本发明的另一方面,还提供一种图片分类设备,其中,该设备包括:
模型建立装置,用于建立图片分类模型,所述图片分类模型包括待学习的参数w;
损失函数装置,用于确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
参数w调节装置,用于将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及其对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
超参n调节装置,用于将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及其对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型;
分类装置,用于基于所述目标图片分类模型对待分类的图片进行分类。基于所述目标图片分类模型
根据本发明的另一方面,还提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述任一项所述的方法。
根据本发明的另一方面,还提供一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行上述任一项所述的方法。
根据本发明的另一方面,还提供一种图片分类模型的训练方法,其中,该方法包括:
建立图片分类模型,所述图片分类模型包括待学习的参数w;
确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型。
本发明的各设备和存储介质实施例的详细内容,具体可参见各方法实施例的对应部分,在此,不再赘述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (10)

1.一种图片分类方法,其中,该方法包括:
建立图片分类模型,所述图片分类模型包括待学习的参数w;
确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型;
基于所述目标图片分类模型对待分类的图片进行分类。
2.根据权利要求1所述的方法,其中,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节,包括:
基于所述损失函数对第一图片的第一类别判定输出及所述第一图片对应的真实类别,计算第一图片的类别判定的损失值;
选取第一图片的类别判定的损失值中的最低值;
将所述第一图片的类别判定的损失值为所述最低值时对应的参数w的值,作为参数w的最终值。
3.根据权利要求1所述的方法,其中,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,包括:
将第二图片的第二类别判定输出与所述第二图片的真实类别进行比较,得到第二图片的类别判定的准确度;
选取第二图片的类别判定的准确度中的最高值;
将所述第二图片的类别判定的准确度为所述最高值时对应的超参n的值,作为超参n的最终值。
4.根据权利要求1所述的方法,其中,所述损失函数的公式如下:
l=exp(-yf),
其中,
Figure FDA0002233322060000021
v表示某张第一图片x的第一特征向量,T表示转置,y表示所述某张第一图片x的类别,p(y=1|x)表示某张第一图片x的类别y属于1的概率,p(y=-1|x)表示某张第一图片x的类别y属于-1的概率。
5.根据权利要求1所述的方法,其中,建立图片分类模型之前,还包括:
获取训练集和验证集,其中,所述训练集包括多张第一图片,和每张第一图片对应的真实类别,所述验证集包括多张第二图片,和每张第二图片对应的真实类别;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,包括:
将训练集中的第一图片输入所述图片分类模型,通过所述图片分类模型将所述训练集中的每张第一图片分别映射为对应的第一特征向量,并基于第一特征向量以得到第一类别判定输出;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,包括:
将验证集中的第二图片输入所述图片分类模型,通过所述图片分类模型将所述验证集中的每张第二图片分别映射为对应的第二特征向量,并基于所述第二特征向量得到第二类别判定输出。
6.根据权利要求5所述的方法,其中,通过所述图片分类模型将所述训练集中的每张第一图片分别映射为对应的第一特征向量,通过所述图片分类模型将所述验证集中的每张第二图片分别映射为对应的第二特征向量之前,还包括:
分别对每张第一图片和第二图片进行如下至少一项的预处理:
将第一图片和第二图片的大小调整到固定的尺寸图;
对第一图片和第二图片进行通道去均值处理。
7.一种图片分类设备,其中,该设备包括:
模型建立装置,用于建立图片分类模型,所述图片分类模型包括待学习的参数w;
损失函数装置,用于确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
参数w调节装置,用于将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及其所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
超参n调节装置,用于将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及其所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型;
分类装置,用于基于所述目标图片分类模型对待分类的图片进行分类。
8.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至6中任一项所述的方法。
9.一种用于在网络设备端信息处理的设备,该设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该设备执行权利要求1至6中任一项所述的方法。
10.一种图片分类模型的训练方法,其中,该方法包括:
建立图片分类模型,所述图片分类模型包括待学习的参数w;
确定损失函数,所述损失函数包括超参n,所述损失函数用于弱化对已经分类正确的训练集中的第一图片的惩罚,加重对分类错误的训练集中的第一图片的惩罚;
将训练集中的第一图片输入所述图片分类模型,以得到第一类别判定输出,基于所述损失函数、第一图片的第一类别判定输出及所述第一图片对应的真实类别,对所述图片分类模型中的待学习的参数w的值进行调节;
将验证集中的第二图片输入所述图片分类模型,以得到第二类别判定输出,基于第二图片的第二类别判定输出及所述第二图片对应的真实类别,对所述损失函数中的超参n的值进行选择,得到目标图片分类模型。
CN201910974983.1A 2019-10-14 2019-10-14 图片分类方法、图片模型训练方法及设备 Pending CN110751197A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910974983.1A CN110751197A (zh) 2019-10-14 2019-10-14 图片分类方法、图片模型训练方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910974983.1A CN110751197A (zh) 2019-10-14 2019-10-14 图片分类方法、图片模型训练方法及设备

Publications (1)

Publication Number Publication Date
CN110751197A true CN110751197A (zh) 2020-02-04

Family

ID=69278333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910974983.1A Pending CN110751197A (zh) 2019-10-14 2019-10-14 图片分类方法、图片模型训练方法及设备

Country Status (1)

Country Link
CN (1) CN110751197A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633407A (zh) * 2020-12-31 2021-04-09 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447171A (zh) * 2018-11-05 2019-03-08 电子科技大学 一种基于深度学习的车辆姿态分类方法
CN109902722A (zh) * 2019-01-28 2019-06-18 北京奇艺世纪科技有限公司 分类器、神经网络模型训练方法、数据处理设备及介质
US20190197429A1 (en) * 2016-12-12 2019-06-27 Tencent Technology (Shenzhen) Company Limited Method and apparatus for training classification model, and method and apparatus for classifying data
CN110037682A (zh) * 2019-04-01 2019-07-23 上海数创医疗科技有限公司 基于改进卷积神经网络的识别心律类型的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190197429A1 (en) * 2016-12-12 2019-06-27 Tencent Technology (Shenzhen) Company Limited Method and apparatus for training classification model, and method and apparatus for classifying data
CN109447171A (zh) * 2018-11-05 2019-03-08 电子科技大学 一种基于深度学习的车辆姿态分类方法
CN109902722A (zh) * 2019-01-28 2019-06-18 北京奇艺世纪科技有限公司 分类器、神经网络模型训练方法、数据处理设备及介质
CN110037682A (zh) * 2019-04-01 2019-07-23 上海数创医疗科技有限公司 基于改进卷积神经网络的识别心律类型的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112633407A (zh) * 2020-12-31 2021-04-09 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质
CN112633407B (zh) * 2020-12-31 2023-10-13 深圳云天励飞技术股份有限公司 分类模型的训练方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109740670B (zh) 视频分类的方法及装置
US11893781B2 (en) Dual deep learning architecture for machine-learning systems
CN109117831B (zh) 物体检测网络的训练方法和装置
WO2020114378A1 (zh) 视频水印的识别方法、装置、设备及存储介质
CN111914908B (zh) 一种图像识别模型训练方法、图像识别方法及相关设备
CN111507406A (zh) 一种用于优化神经网络文本识别模型的方法与设备
KR20220114320A (ko) 약지도 학습 기반 시멘틱 영상 분할 학습 데이터 생성 장치 및 방법
CN114333013A (zh) 人脸识别模型的训练方法、装置、电子设备及存储介质
CN112597909A (zh) 一种用于人脸图片质量评价的方法与设备
CN117409419A (zh) 图像检测方法、设备及存储介质
CN116129224A (zh) 检测模型的训练方法、分类方法、装置及电子设备
CN110751197A (zh) 图片分类方法、图片模型训练方法及设备
CN116958809A (zh) 一种特征库迁移的遥感小样本目标检测方法
CN115810105A (zh) 一种全景分割方法、装置、设备及存储介质
CN114913588A (zh) 一种应用于复杂场景下的人脸图像修复及识别方法
CN110263196B (zh) 图像检索方法、装置、电子设备及存储介质
CN111914920A (zh) 一种基于稀疏编码的相似性图像检索方法及系统
CN112446428B (zh) 一种图像数据处理方法及装置
WO2024016945A1 (zh) 图像分类模型的训练方法、图像分类方法及相关设备
US20240144665A1 (en) Dual deep learning architecture for machine-learning systems
CN117437684B (zh) 一种基于修正注意力的图像识别方法和装置
CN115456100A (zh) 一种训练处理方法、装置、电子设备和可读存储介质
CN117132754A (zh) 边界框分布模型的训练、目标检测方法及装置
CN117523218A (zh) 标签生成、图像分类模型的训练、图像分类方法及装置
CN113850302A (zh) 一种增量学习方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200204

RJ01 Rejection of invention patent application after publication