CN105184313B - 分类模型构建方法及装置 - Google Patents

分类模型构建方法及装置 Download PDF

Info

Publication number
CN105184313B
CN105184313B CN201510524757.5A CN201510524757A CN105184313B CN 105184313 B CN105184313 B CN 105184313B CN 201510524757 A CN201510524757 A CN 201510524757A CN 105184313 B CN105184313 B CN 105184313B
Authority
CN
China
Prior art keywords
samples pictures
goods categories
disaggregated model
picture
full articulamentum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510524757.5A
Other languages
English (en)
Other versions
CN105184313A (zh
Inventor
张涛
龙飞
汪平仄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510524757.5A priority Critical patent/CN105184313B/zh
Publication of CN105184313A publication Critical patent/CN105184313A/zh
Application granted granted Critical
Publication of CN105184313B publication Critical patent/CN105184313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开是关于一种分类模型构建方法及装置,其中,方法包括:获取至少一种物品类别对应的至少一个样本图片集;根据预设训练协议和预设网络模型对至少一个样本图片集中的样本图片进行训练,得到至少一种物品类别对应的分类模型,分类模型用于确定待分类图片所对应的目标物品类别。通过该技术方案,可以根据用户需要自动对用户相册中的照片进行分类,如将所有照片中包含猫、狗的照片分到宠物相册,从而无需用户手动进行图片分类,提升用户的使用体验,同时由于根据物品类别的图片集训练后得到的分类模型更符合物品类别的需求,可以提高图片识别的准确率,即提高识别的召回率,减小识别的错误率。

Description

分类模型构建方法及装置
技术领域
本公开涉及分类模型构建技术领域,尤其涉及分类模型构建方法及装置。
背景技术
深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。
卷积神经网络可用于对图片的识别。而随着用户终端中照片数目的增多,就需要终端能自动根据照片内容对照片进行分类,比如将所有照片中包含宠物的照片分类至宠物相册。而相关技术中,虽然存在这种分类方法,但是对于宠物的召回率和错误率都存在较高的偏差。其中,召回率是指把A识别为A的比例,召回率越高越好。错误率是指把非A识别成A的比例,错误率越低越好。
发明内容
本公开实施例提供一种分类模型构建方法及装置,包括如下技术方案:
根据本公开实施例的第一方面,提供一种分类模型构建方法,包括:
获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别。
在一个实施例中,所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,包括:
保持所述预设网络模型的特征层的参数不变,对所述预设网络模型的中的全连接层进行降维和优化处理,所述全连接层包括第一全连接层和第二全连接层,所述第一全连接层的输出为所述第二全连接层的输入;
将所述第二全连接层的输出发送至所述预设网络模型的分类器层,对所述分类器层进行调整,得到所述至少一种物品类别对应的分类模型。
分类模型在一个实施例中,所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型之前,所述方法还包括:
将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
在一个实施例中,所述分类模型确定待分类图片所对应的目标物品类别的步骤包括:
将所述待分类图片的尺寸处理为预设尺寸;
根据所述分类模型从所述待分类图片中抽取特征向量;
根据所述特征向量和所述分类模型,计算所述待分类图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;
将概率值最大的物品类别确定为所述目标物品类别。
在一个实施例中,所述预设训练协议包括Alex训练协议,所述预设网络模型包括Alex网络模型。
在一个实施例中,所述方法还包括:
利用第一计算公式和第二计算公式对所述全连接层和所述分类器层进行处理,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将所述Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,μ为控制上次的更新步长的参数,所述全连接层中参数α的值小于所述分类器层中参数α的值。
在一个实施例中,所述方法还包括:
将所述待分类图片添加至所述目标物品类别对应的图片集中。
在一个实施例中,所述物品类别包括猫、狗。
根据本公开实施例的第二方面,提供一种分类模型构建装置,包括:
获取模块,用于获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
训练模块,用于根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别。
在一个实施例中,所述训练模块包括:
第一参数调整子模块,用于保持所述预设网络模型的特征层的参数不变,对所述预设网络模型的中的全连接层进行降维和优化处理,所述全连接层包括第一全连接层和第二全连接层,所述第一全连接层的输出为所述第二全连接层的输入;
第二参数调整子模块,用于将进行参数调整后的全连接层的输出数据发送至所述预设网络模型的分类器层,对所述分类器层进行调整,得到所述至少一种物品类别对应的分类模型。
分类模型在一个实施例中,所述装置还包括:
第一处理模块,用于将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
在一个实施例中,当使用所述分类模型确定待分类图片所对应的目标物品类别时,所述装置还包括:
第二处理模块,用于将所述待分类图片的尺寸处理为预设尺寸;
抽取模块,用户根据所述分类模型从所述待分类图片中抽取特征向量;
计算模块,用于根据所述特征向量和所述分类模型,计算所述待分类图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;
确定模块,用于将概率值最大的物品类别确定为所述目标物品类别。
在一个实施例中,所述预设训练协议包括Alex训练协议,所述预设网络模型包括Alex网络模型。
在一个实施例中,所述第一参数调整子模块、所述第二参数调整子模块用于:
利用第一计算公式和第二计算公式分别对所述全连接层和所述分类器层进行处理,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将所述Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,μ为控制上次的更新步长的参数,所述全连接层中参数α的值小于所述分类器层中参数α的值。
添加模块,用于将所述待分类图片添加至所述目标物品类别对应的图片集中。
在一个实施例中,所述物品类别包括猫、狗。
根据本公开实施例的第三方面,提供一种分类模型构建装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别。
本公开的实施例提供的技术方案可以包括以下有益效果:
上述技术方案,利用至少一个样本图片集中的样本图片和预设训练协议对预设网络模型中的参数进行调整,例如,保持预设网络模型的特征层的参数不变,对全连接层进行微调训练,对分类器层进行重新学习调参,从而得到至少一个物品类别对应的分类模型,如利用一些包含猫、狗等宠物的样本图片集和预设训练协议对预设网络模型中的参数进行调整,从而得到可以对猫、狗等宠物进行识别的分类模型,利用这个分类模型就可以对猫、狗等进行宠物识别和分类。这样,可以根据用户需要自动对用户相册中的照片进行分类,如将所有照片中包含猫、狗的照片分到宠物相册,从而无需用户手动进行图片分类,提升用户的使用体验,同时由于根据物品类别的图片集训练后得到的分类模型更符合物品类别的需求,可以提高图片识别的准确率,即提高识别的召回率,减小识别的错误率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1A是根据一示例性实施例示出的分类模型构建方法的流程图。
图1B是根据一示例性实施例示出的Alex网络模型的示意图。
图2是根据一示例性实施例示出的另一种分类模型构建方法的流程图。
图3是根据一示例性实施例示出的再一种分类模型构建方法的流程图。
图4是根据一示例性实施例示出的又一种分类模型构建方法的流程图。
图5A是根据一示例性实施例示出的又一种分类模型构建方法的流程图。
图5B是根据一示例性实施例示出的又一种分类模型构建方法的流程图。
图6是根据一示例性实施例示出的分类模型构建装置的框图。
图7是根据一示例性实施例示出的分类模型构建装置中训练模块的框图。
图8是根据一示例性实施例示出的另一种分类模型构建装置的框图。
图9是根据一示例性实施例示出的再一种分类模型构建装置的框图。
图10是根据一示例性实施例示出的又一种分类模型构建装置的框图。
图11是根据一示例性实施例示出的适用于分类模型构建装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供了一种分类模型构建方法,该方法可用于需要进行分类模型构建的设备中,如图1A所示,该方法包括步骤S101-S102:
在步骤S101中,获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品。物品类别包括猫、狗。例如,想对猫、狗和其它宠物等进行识别,那么就可以获取猫、狗和其它宠物对应的3个样本图片集,其中,猫对应一个猫的样本图片集,该样本图片集中的每个样本图片中均包括猫,狗对应一个狗的样本图片集,该样本图片集中的每个样本图片中均包括狗,其它宠物对应一个其它宠物的样本图片集,该样本图片集中的每个样本图片中均包括其它宠物。
在步骤S102中,根据预设训练协议和预设网络模型对至少一个样本图片集中的样本图片进行训练,得到至少一种物品类别对应的分类模型,分类模型用于确定待分类图片所对应的目标物品类别。
在该实施例中,利用至少一个样本图片集中的样本图片、预设训练协议和预设网络模型进行训练得到分类模型,如利用一些包含猫、狗等宠物的样本图片集、预设训练协议和预设网络模型进行训练,从而得到可以对猫、狗等宠物进行识别的分类模型,利用这个分类模型就可以对猫、狗等进行宠物识别和分类。这样,可以根据用户需要自动对用户相册中的照片进行分类,如将所有照片中包含猫、狗的照片分到宠物相册,从而无需用户手动进行图片分类,提升用户的使用体验。同时由于根据物品类别的图片集训练后得到的分类模型更符合物品类别的需求,可以提高图片识别的准确率,即提高识别的召回率,减小识别的错误率。
在一个实施例中,预设训练协议包括Alex训练协议,预设网络模型包括Alex网络模型。
如图1B所示,Alex网络模型包括由卷积层和pooling层组成的特征层111,以及两层全连接层112和分类器层113。
如图2所示,在一个实施例中,上述步骤S102包括步骤S201-S202:
在步骤S201中,保持预设网络模型的特征层111的参数不变,对预设网络模型中的全连接层112进行降维和优化处理,全连接层112包括第一全连接层和第二全连接层,第一全连接层的输出为第二全连接层的输入;
在步骤S202中,将第二全连接层的输出发送至预设网络模型的分类器层113,对分类器层进行调整,得到至少一种物品类别对应的分类模型。
在该实施例中,保持预设网络模型的特征层111的参数不变,对全连接层112进行微调训练,对分类器层113进行重新学习调参,从而得到至少一个物品类别对应的分类模型,这样,就可以对至少一个物品类别对应的图片进行分类,如利用一些包含猫、狗等宠物的样本图片集和预设训练协议对预设网络模型中的参数进行调整,从而得到可以对猫、狗等宠物进行识别的分类模型,利用这个分类模型就可以对猫、狗等进行宠物识别和分类。这样,可以根据用户需要自动对用户相册中的照片进行分类,如将所有照片中包含猫、狗的照片分到宠物相册,从而无需用户手动进行图片分类,提升用户的使用体验。同时由于根据物品类别的图片集训练后得到的分类模型更符合物品类别的需求,可以提高图片识别的准确率,即提高识别的召回率,减小识别的错误率。
在一实施例中,可以利用第一计算公式和第二计算公式对全连接层和分类器层进行处理。其中,第一计算公式为:第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,它和学习速率紧密相关,也决定收敛的速度,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,也是整个网络需要训练的模型参数,μ为控制上次的更新步长的参数,如果该值越大,对本次的更新步长起到的平滑作用也越大。全连接层中参数α的值小于分类器层中参数α的值,例如,全连接层中参数α的值可以分类器层中参数α的值的十分之一。在一实施例中,全连接层中参数α例如可以设置为0.01~0.2,分类器层中参数α例如可以设置为1~2,但本公开不以此为限。
其中,根据当前Wt的值进行梯度求导,也就是计算然后得到Vt+1,根据Vt+1得到Wt+1
根据上述第一计算公式和第二计算公式,以及所选取的参数初始值V0、W0、α等,能使得上述网络模型中的全连接层、分类器层收敛到较理想的值,从而得到至少一种物品类别对应的分类模型。
如图3所示,在一个实施例中,在步骤S102之前,方法还包括步骤S301:
在步骤S301中,将至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
在该实施例中,输入的图片的尺寸都是固定的,因此,需要将所有的样本图片的尺寸归一化处理为预设尺寸。
如图4所示,在一个实施例中,分类模型确定待分类图片所对应的目标物品类别的步骤包括步骤S401-S404:
在步骤S401中,将待分类图片的尺寸处理为预设尺寸;
在步骤S402中,根据分类模型从待分类图片中抽取特征向量;
在步骤S403中,根据特征向量和分类模型,计算待分类图片与至少一种物品类别中每个物品类别之间具有对应关系的概率值;
在步骤S404中,将概率值最大的物品类别确定为目标物品类别。
在该实施例中,对于一个待分类图片,可以先对其进行归一化处理,处理为预设尺寸,再抽取该图片的特征向量,根据其特征向量和分类模型计算其与每个物品类别(例如猫、狗)有对应关系的概率,并将概率值最大的物品类别确定为目标物品类别。例如,对于一张图片,计算出其与猫有对应关系的概率为0.7,与狗有对应关系的概率为0.3,则确定其属于猫的类别。
如图5A所示,在一个实施例中,方法还包括步骤S501:
在步骤S501中,将待分类图片添加至目标物品类别对应的图片集中。
在该实施例中,还可以将待分类图片添加至目标物品类别对应的图片集中。如将目标物品类别为猫和狗的图片添加至宠物图片集中,从而实现对待分类图片的分类,不需要用户手动进行分类,提升用户的使用体验。
下面以一个具体实施例详细说明本发明的技术方案。假设需要对用户终端的相册中的图片进行分类。
如图5B所示,根据本公开实施例的分类模型构建方法包括:
在步骤S511中,获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品。如包括:猫的图片50000张、狗的图片50000张、其他各种杂物图片10w张。
在步骤S512中,所有的样本图片进行尺寸归一化处理,例如处理到尺寸为224*224(像素*像素)。
在步骤S513中,利用Alex网络模型和协议,进行训练。训练如上面:卷积层和pooling层的参数不用学习,学习速率可以设置为0。通过选取合适的计算函数和设置合理的初始参数,对两层全连接层和分类器层进行训练。
在步骤S514中,利用训练得到的分类模型,可以得到一个3类分类器。3类分别是猫、狗、其他。
在步骤S515中,新进来一张图片,将它缩放到224*224(像素*像素),然后利用现在训练好的上述分类模型对缩放后的图片抽取特征向量feature,并且直接计算分类结果,取概率值最大的那个输出作为最终的标号结果。如果为猫或者狗,则判定为宠物。
在步骤S516中,对相册内的所有照片都进行步骤S515的操作,最终将判定为猫或者狗的照片都归为宠物相册。这样,通过该技术方案,可以根据用户需要自动对用户相册中的照片进行分类,如将所有照片中包含猫、狗的照片分到宠物相册,从而无需用户手动进行图片分类,提升用户的使用体验,同时由于根据物品类别的图片集训练后得到的分类模型更符合物品类别的需求,可以提高图片识别的准确率,即提高识别的召回率,减小识别的错误率。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图6是根据一示例性实施例示出的一种分类模型构建装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图6所示,该分类模型构建装置包括:
获取模块61,用于获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品。在一个实施例中,物品类别包括猫、狗、兔子、蛇等宠物。
训练模块62,用于根据预设训练协议和预设网络模型对至少一个样本图片集中的样本图片进行训练,得到至少一种物品类别对应的分类模型,分类模型用于确定待分类图片所对应的目标物品类别。在一个实施例中,预设训练协议包括Alex训练协议,预设网络模型包括Alex网络模型。
如图7所示,在一个实施例中,训练模块62包括:
第一参数调整子模块71,用于保持所述预设网络模型的特征层的参数不变,对所述预设网络模型的中的全连接层进行降维和优化处理,所述全连接层包括第一全连接层和第二全连接层,所述第一全连接层的输出为所述第二全连接层的输入;
第二参数调整子模块72,用于将进行参数调整后的全连接层的输出数据发送至所述预设网络模型的分类器层,对所述分类器层进行调整,得到所述至少一种物品类别对应的分类模型。
在一个实施例中,第一参数调整子模块71、第二参数调整子模块72用于:
利用第一计算公式和第二计算公式分别对所述全连接层和所述分类器层进行处理,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将所述Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,μ为控制上次的更新步长的参数,所述全连接层中参数α的值小于所述分类器层中参数α的值。
如图8所示,在一个实施例中,装置还包括:
第一处理模块81,用于将至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
如图9所示,在一个实施例中,当使用分类模型确定待分类图片所对应的目标物品类别时,装置还包括:
第二处理模块91,用于将待分类图片的尺寸处理为预设尺寸;
抽取模块92,用户根据分类模型从待分类图片中抽取特征向量;
计算模块93,用于根据特征向量和分类模型,计算待分类图片与至少一种物品类别中每个物品类别之间具有对应关系的概率值;
确定模块94,用于将概率值最大的物品类别确定为目标物品类别。
如图10所示,在一个实施例中,装置还包括:
添加模块101,用于将待分类图片添加至目标物品类别对应的图片集中。
根据本公开实施例的第三方面,提供一种分类模型构建装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别。
上述处理器还可被配置为:
所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,包括:
保持所述预设网络模型的特征层的参数不变,利用所述样本图片集中的样本图片和预设训练协议对所述预设网络模型的全连接层中的参数进行部分调整,对所述预设网络模型的分类器层中的参数进行全部调整,得到所述至少一种物品类别对应的分类模型。
上述处理器还可被配置为:
所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型之前,所述方法还包括:
将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
上述处理器还可被配置为:
所述分类模型确定待分类图片所对应的目标物品类别的步骤包括:
将所述待分类图片的尺寸处理为预设尺寸;
根据所述分类模型从所述待分类图片中抽取特征向量;
根据所述特征向量和所述分类模型,计算所述待分类图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;
将概率值最大的物品类别确定为所述目标物品类别。
上述处理器还可被配置为:
所述预设训练协议包括Alex训练协议,所述预设网络模型包括Alex网络模型。
上述处理器还可被配置为:
所述方法还包括:
将所述待分类图片添加至所述目标物品类别对应的图片集中。
上述处理器还可被配置为:
所述物品类别包括猫、狗。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11是根据一示例性实施例示出的一种用于分类模型构建装置的框图,该装置适用于终端设备。例如,装置1100可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
装置1100可以包括以下一个或多个组件:处理组件1102,存储器1104,电源组件1106,多媒体组件1108,音频组件1110,输入/输出(I/O)的接口1112,传感器组件1114,以及通信组件1116。
处理组件1102通常控制装置1100的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1102可以包括一个或多个模块,便于处理组件1102和其他组件之间的交互。例如,处理部件1102可以包括多媒体模块,以方便多媒体组件1108和处理组件1102之间的交互。
存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1106为装置1100的各种组件提供电力。电力组件1106可以包括电源管理系统,一个或多个电源,及其他与为装置1100生成、管理和分配电力相关联的组件。
多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1108包括一个前置摄像头和/或后置摄像头。当设备1100处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1110被配置为输出和/或输入音频信号。例如,音频组件1110包括一个麦克风(MIC),当装置1100处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中,音频组件1110还包括一个扬声器,用于输出音频信号。
I/O接口1112为处理组件1102和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1114包括一个或多个传感器,用于为装置1100提供各个方面的状态评估。例如,传感器组件1114可以检测到设备1100的打开/关闭状态,组件的相对定位,例如所述组件为装置1100的显示器和小键盘,传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变,用户与装置1100接触的存在或不存在,装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1114还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1116还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述分类模型构建方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1104,上述指令可由装置1100的处理器1120执行以完成上述分类模型构建方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置1100的处理器执行时,使得装置1100能够执行上述分类模型构建方法。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种分类模型构建方法,其特征在于,包括:
获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别;
所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,包括:
保持所述预设网络模型的特征层的参数不变,对所述预设网络模型中的全连接层进行降维和优化处理,所述全连接层包括第一全连接层和第二全连接层,所述第一全连接层的输出为所述第二全连接层的输入;
将所述第二全连接层的输出发送至所述预设网络模型的分类器层,对所述分类器层进行调整,得到所述至少一种物品类别对应的分类模型。
2.根据权利要求1所述的方法,其特征在于,所述根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型之前,所述方法还包括:
将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
3.根据权利要求1或2所述的方法,其特征在于,所述分类模型确定待分类图片所对应的目标物品类别的步骤包括:
将所述待分类图片的尺寸处理为预设尺寸;
根据所述分类模型从所述待分类图片中抽取特征向量;
根据所述特征向量和所述分类模型,计算所述待分类图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;
将概率值最大的物品类别确定为所述目标物品类别。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
利用第一计算公式和第二计算公式对所述全连接层和所述分类器层进行处理,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将所述Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,μ为控制上次的更新步长的参数,所述全连接层中参数α的值小于所述分类器层中参数α的值。
5.根据权利要求1或2所述的方法,其特征在于,所述预设训练协议包括Alex训练协议,所述预设网络模型包括Alex网络模型。
6.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
将所述待分类图片添加至所述目标物品类别对应的图片集中。
7.根据权利要求1或2所述的方法,其特征在于,所述物品类别包括猫、狗。
8.一种分类模型构建装置,其特征在于,包括:
获取模块,用于获取至少一种物品类别对应的至少一个样本图片集,其中,每个样本图片集对应一种物品类别,每个样本图片集中的每个样本图片中均包括该样本图片集所对应的物品类别下的物品;
训练模块,用于根据预设训练协议和预设网络模型对所述至少一个样本图片集中的样本图片进行训练,得到所述至少一种物品类别对应的分类模型,所述分类模型用于确定待分类图片所对应的目标物品类别;
所述训练模块包括:
第一参数调整子模块,用于保持所述预设网络模型的特征层的参数不变,对所述预设网络模型的中的全连接层进行降维和优化处理,所述全连接层包括第一全连接层和第二全连接层,所述第一全连接层的输出为所述第二全连接层的输入;
第二参数调整子模块,用于将进行参数调整后的全连接层的输出数据发送至所述预设网络模型的分类器层,对所述分类器层进行调整,得到所述至少一种物品类别对应的分类模型。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于将所述至少一个样本图片集中的样本图片的尺寸处理为预设尺寸。
10.根据权利要求8或9所述的装置,其特征在于,当使用所述分类模型确定待分类图片所对应的目标物品类别时,所述装置还包括:
第二处理模块,用于将所述待分类图片的尺寸处理为预设尺寸;
抽取模块,用户根据所述分类模型从所述待分类图片中抽取特征向量;
计算模块,用于根据所述特征向量和所述分类模型,计算所述待分类图片与所述至少一种物品类别中每个物品类别之间具有对应关系的概率值;
确定模块,用于将概率值最大的物品类别确定为所述目标物品类别。
11.根据权利要求8或9所述的装置,其特征在于,所述第一参数调整子模块、所述第二参数调整子模块用于:
利用第一计算公式和第二计算公式分别对所述全连接层和所述分类器层进行处理,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,所述第一计算公式为:所述第二计算公式为:Wt+1=Wt+Vt+1,其中,V0=0,W0的取值范围为0至1之间的随机数,μ为0.9,为将所述Wt进行梯度求导后得到的值,其中,Vt为每次的更新步长,α为学习速率,决定梯度下降搜索的步长,Wt为网络权值,μ为控制上次的更新步长的参数,所述全连接层中参数α的值小于所述分类器层中参数α的值。
12.根据权利要求8或9所述的装置,其特征在于,所述预设训练协议包括Alex训练协议,所述预设网络模型包括Alex网络模型。
13.根据权利要求8或9所述的装置,其特征在于,所述装置还包括:
添加模块,用于将所述待分类图片添加至所述目标物品类别对应的图片集中。
14.根据权利要求8或9所述的装置,其特征在于,所述物品类别包括猫、狗。
CN201510524757.5A 2015-08-24 2015-08-24 分类模型构建方法及装置 Active CN105184313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510524757.5A CN105184313B (zh) 2015-08-24 2015-08-24 分类模型构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510524757.5A CN105184313B (zh) 2015-08-24 2015-08-24 分类模型构建方法及装置

Publications (2)

Publication Number Publication Date
CN105184313A CN105184313A (zh) 2015-12-23
CN105184313B true CN105184313B (zh) 2019-04-19

Family

ID=54906377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510524757.5A Active CN105184313B (zh) 2015-08-24 2015-08-24 分类模型构建方法及装置

Country Status (1)

Country Link
CN (1) CN105184313B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107122785B (zh) * 2016-02-25 2022-09-27 中兴通讯股份有限公司 文本识别模型建立方法和装置
CN106250921A (zh) * 2016-07-26 2016-12-21 北京小米移动软件有限公司 图片处理方法及装置
CN108805279A (zh) * 2017-04-26 2018-11-13 北京邮电大学 一种利用照片快速生成视频的方法
CN107194419A (zh) * 2017-05-10 2017-09-22 百度在线网络技术(北京)有限公司 视频分类方法及装置、计算机设备与可读介质
CN108052944A (zh) * 2017-12-27 2018-05-18 深圳市大熊动漫文化有限公司 一种图像识别方法和装置
CN108491825A (zh) * 2018-03-30 2018-09-04 百度在线网络技术(北京)有限公司 信息生成方法和装置
CN108764046A (zh) * 2018-04-26 2018-11-06 平安科技(深圳)有限公司 车辆损伤分类模型的生成装置、方法及计算机可读存储介质
CN109155078B (zh) * 2018-08-01 2023-03-31 达闼机器人股份有限公司 样本图像的集合的生成方法、装置、电子设备和存储介质
CN109165688A (zh) * 2018-08-28 2019-01-08 暨南大学 一种安卓恶意软件家族分类器构建方法及其分类方法
CN109558674A (zh) * 2018-11-28 2019-04-02 北京超萌国际文化有限公司 销量预测及其模型训练方法、装置
CN109726763B (zh) * 2018-12-29 2021-05-28 绿盟科技集团股份有限公司 一种信息资产识别方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218610A (zh) * 2013-04-28 2013-07-24 宁波江丰生物信息技术有限公司 狗脸检测器的形成方法和狗脸检测方法
CN104102922A (zh) * 2014-07-15 2014-10-15 中国科学院合肥物质科学研究院 一种基于上下文感知字典学习的害虫图像分类方法
CN104102919A (zh) * 2014-07-14 2014-10-15 同济大学 一种有效防止卷积神经网络过拟合的图像分类方法
CN104573728A (zh) * 2015-01-19 2015-04-29 天津大学 一种基于极端学习机的纹理分类方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177226B2 (en) * 2013-03-15 2015-11-03 Google Inc. Object detection in images based on affinity determinations
US9230194B2 (en) * 2013-09-16 2016-01-05 Google Inc. Training image sampling

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218610A (zh) * 2013-04-28 2013-07-24 宁波江丰生物信息技术有限公司 狗脸检测器的形成方法和狗脸检测方法
CN104102919A (zh) * 2014-07-14 2014-10-15 同济大学 一种有效防止卷积神经网络过拟合的图像分类方法
CN104102922A (zh) * 2014-07-15 2014-10-15 中国科学院合肥物质科学研究院 一种基于上下文感知字典学习的害虫图像分类方法
CN104573728A (zh) * 2015-01-19 2015-04-29 天津大学 一种基于极端学习机的纹理分类方法

Also Published As

Publication number Publication date
CN105184313A (zh) 2015-12-23

Similar Documents

Publication Publication Date Title
CN105184313B (zh) 分类模型构建方法及装置
KR101906827B1 (ko) 연속 사진 촬영 장치 및 방법
CN104125396B (zh) 图像拍摄方法和装置
CN105528786B (zh) 图像处理方法及装置
CN105608425B (zh) 对照片进行分类存储的方法及装置
CN106250921A (zh) 图片处理方法及装置
CN105139033B (zh) 分类器构建方法及装置和图片处理方法及装置
CN104700353B (zh) 图像滤镜生成方法及装置
JP6263263B2 (ja) 関連ユーザー確定方法および装置
CN105488527A (zh) 图像分类方法及装置
CN104683691B (zh) 拍摄方法、装置及设备
CN107018333A (zh) 拍摄模板推荐方法、装置及拍摄设备
CN105302315A (zh) 图片处理方法及装置
CN108419016A (zh) 拍摄方法、装置及终端
CN105631403A (zh) 人脸识别方法及装置
CN106331504A (zh) 拍摄方法及装置
CN106600530B (zh) 照片合成方法及装置
CN106355549A (zh) 拍照方法及设备
CN108898591A (zh) 图像质量的评分方法及装置、电子设备、可读存储介质
CN109040605A (zh) 拍摄引导方法、装置及移动终端和存储介质
CN104580886A (zh) 拍摄控制方法及装置
CN105335714B (zh) 照片处理方法、装置和设备
CN107766820A (zh) 图像分类方法及装置
CN106228193B (zh) 图像分类方法及装置
CN109255128A (zh) 多层级标签的生成方法、装置和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant