CN108090508B - 一种分类训练方法、装置及存储介质 - Google Patents

一种分类训练方法、装置及存储介质 Download PDF

Info

Publication number
CN108090508B
CN108090508B CN201711322612.2A CN201711322612A CN108090508B CN 108090508 B CN108090508 B CN 108090508B CN 201711322612 A CN201711322612 A CN 201711322612A CN 108090508 B CN108090508 B CN 108090508B
Authority
CN
China
Prior art keywords
sketch
classification
model
real
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711322612.2A
Other languages
English (en)
Other versions
CN108090508A (zh
Inventor
黄飞
马林
刘威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910854110.7A priority Critical patent/CN110633745B/zh
Priority to CN201711322612.2A priority patent/CN108090508B/zh
Publication of CN108090508A publication Critical patent/CN108090508A/zh
Priority to EP18887500.9A priority patent/EP3726426A4/en
Priority to PCT/CN2018/117158 priority patent/WO2019114523A1/zh
Priority to US16/696,361 priority patent/US11017220B2/en
Application granted granted Critical
Publication of CN108090508B publication Critical patent/CN108090508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19167Active pattern learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了分类训练方法、装置及存储介质,应用于信息处理技术领域。分类训练装置会先选定训练集,并根据草图分类模型确定训练集中的草图的类别,得到第一类别处理结果,且可以根据第二特征分析模型对第一特征提取模型提取的草图特征进行分析,得到第二草图分析结果;然后根据第一类别处理结果和第二草图分析结果得到第一损失函数的函数值;最后根据第一损失函数的函数值对草图分类模型的第一固定参数值进行调整。这样,在对某一分类模型的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型在分类过程中的有用信息,从而使得调整后的草图分类模型的分类计算更准确。

Description

一种分类训练方法、装置及存储介质
技术领域
本发明涉及信息处理技术领域,特别涉及一种分类训练方法、装置及存储介质。
背景技术
草图识别可以应用于许多领域,比如应用于儿童早期教育中,可以基于手绘草图进行类型识别和同一类别的检索,对儿童的发散思维和图形理解能力的成长非常重要;也可以用于其它的图形检索系统中。
具体地,用户可以通过终端设备输入手绘草图并发送到后台服务器,由后台服务器根据预先训练好的分类器比如支持向量机(Support Vector Machine,SVM),或者预先训练好的分类网络,对接收的手绘草图进行类型识别。为了保证对手绘草图识别的准确性,就需要保证预先训练好的分类器或分类网络的精确性,因此,训练分类器或分类网络的过程就比较重要。
现有技术中,在训练分类器或分类网络时,主要是根据大量的预先标记好类别的草图的特征信息进行训练得到。但是,会由于草图的训练样本稀缺导致训练的分类器或分类网络或多或少地出现过拟合或者欠拟合的问题,进而影响到对手绘草图的类型识别的准确性。
发明内容
本发明实施例提供一种分类训练方法、装置及存储介质,实现了根据第一类别处理结果和第二草图特征分析结果,调整草图分类模型的第一固定参数值。
本发明实施例提供一种分类训练方法,包括:
确定草图分类模型,所述草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,所述第二特征提取模块属于真实图分类模型;
选定训练集,所述训练集包括多个类别的草图;
根据所述草图分类模型确定所述训练集中草图的类别得到第一类别处理结果;根据所述第二特征分析模型,对第一特征提取模块提取的所述草图的特征进行分析得到第二草图特征分析结果;
根据所述第一类别处理结果及第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值;
根据所述第一损失函数的函数值调整所述草图分类模型中的第一固定参数值。
本发明实施例提供一种分类训练装置,包括:
模型确定单元,用于确定草图分类模型,所述草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,所述第二特征提取模块属于真实图分类模型;
训练集单元,用于选定训练集,所述训练集包括多个类别的草图;
处理单元,用于根据所述草图分类模型确定所述训练集中草图的类别得到第一类别处理结果;根据所述第二特征分析模型,对第一特征提取模块提取的所述草图的特征进行分析得到第二草图特征分析结果;
函数值计算单元,用于根据所述第一类别处理结果及第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值;
调整单元,用于根据所述第一损失函数的函数值调整所述草图分类模型中的第一固定参数值。
本发明实施例提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如本发明实施例第一方面所述的分类训练方法。
本发明实施例提供一种服务器,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如本发明实施例所述的分类训练方法。
可见,在本实施例的方法中,分类训练装置会先选定训练集,并根据草图分类模型确定训练集中的草图的类别,得到第一类别处理结果,且可以根据第二特征分析模型对第一特征提取模型提取的草图特征进行分析,得到第二草图分析结果;然后根据第一类别处理结果和第二草图分析结果得到第一损失函数的函数值;最后根据第一损失函数的函数值对草图分类模型的第一固定参数值进行调整。这样,在对某一分类模型(比如草图分类模型)的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型(比如真实图分类模型)在分类过程中的有用信息,即对另一分类模型中特征提取模块提取的特征进行分析的特征分析模型(比如第二特征分析模型),从而使得调整后的草图分类模型的分类计算更准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种分类训练方法的流程图;
图2是本发明一个实施例中计算各个损失函数的函数值的示意图;
图3是本发明一个实施例中草图分类模型和真实图分类模型的示意图;
图4是本发明一个实施例提供的另一种分类训练方法的流程图;
图5是本发明应用实施例中草图分类模型和真实图分类模型进行分类的示意图;
图6是本发明应用实施例提供的一种分类训练方法的流程图;
图7是本发明实施例提供的一种分类训练装置的结构示意图;
图8是本发明实施例提供的另一种分类训练装置的结构示意图;
图9是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供一种分类训练方法,主要是根据已标记类别的草图和已标记类别的真实图,训练得到草图分类模型和真实图分类模型,具体地,本实施例中由分类训练装置通过如下方法进行训练:
确定草图分类模型,草图分类模型中包括第一特征提取模块和第一分类模块,及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,第二特征提取模块属于真实图分类模型;选定训练集,训练集包括多个类别的草图;根据草图分类模型确定训练集中草图的类别得到第一类别处理结果,根据第二特征分析模型,对第一特征提取模块提取的草图的特征进行分析得到第二草图特征分析结果;根据第一类别处理结果及第二草图特征分析结果,计算草图分类模型的第一损失函数的函数值;根据第一损失函数的函数值调整草图分类模型中的第一固定参数值。
进一步地,训练得到的草图分类模型和真实图分类模型可以应用于但不限于如下场景中:用户可以通过终端设备输入手绘草图并发送到后台服务器;由后台服务器通过预先训练好的草图分类模型,确定后台服务器接收的手绘草图所属的类别;且可以根据预先训练好的草图分类模型和真实图分类模型,检索到该手绘草图对应的真实图像。
这样,在对某一分类模型(比如草图分类模型)的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型(比如真实图分类模型)在分类过程中的有用信息,即对另一分类模型中特征提取模块提取的特征进行分析的特征分析模型(比如第二特征分析模型),从而使得调整后的草图分类模型和真实图分类模型的分类计算更准确。
本发明实施例提供一种分类训练方法,为分类训练装置所执行的方法,流程图如图1所示,示意图如图2所示,包括:
步骤101,确定草图分类模型,草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,这里第二特征提取模块属于真实图分类模型。
草图分类模型用于识别草图的类别,而草图是指用户通过电子设备绘制的图像,或者用户手动绘制的图像等。具体地,草图分类模型一般包括对草图进行特征提取的第一特征提取模块,和根据提取的草图特征进行分类的第一分类模块,比如基于卷积神经网络的分类模型,或SVM等分类模型。本实施例中,分类训练装置确定草图分类模型具体包括确定草图分类模型的结构和相应的固定参数值,其中,草图分类模型的结构具体包括第一特征提取模块和第一分类模块的结构,而相应的固定参数值具体包括第一特征提取模块和第一分类模块在计算过程中用到的固定参数的参数值。
真实图分类模型用于识别真实图的类别,真实图是指通过照相机或摄像头获取的实物图像。具体地,真实图分类模型一般包括对真实图进行特征提取的第二特征提取模块,和根据提取的真实图特征进行分类的第二分类模块。该第二分类模块如基于卷积神经网络的分类模型,或SVM等分类模型。第二特征分析模型用于在真实图分类模型识别真实图的类别的过程中,对第二特征提取模块提取的真实图的特征(即输出结果)进行分析,具体可以判别该真实图的特征属于真实图。分类训练装置确定第二特征分析模型具体包括确定第二特征分析模型的结构,及第二特征分析模型在计算过程中用到的固定参数的参数值。
本实施例中,草图分类模型和真实图分类模型的结构可以相同,也可以不同。如果草图分类模型和真实图分类模型的结构相同,则组成草图分类模型的各个计算子模块的固定计算参数的参数值,与组成真实图分类模型的各个计算子模块的固定计算参数的参数值(简称固定参数值)不同。这里固定计算参数是指在计算过程中所用到的不需要随时赋值的参数,比如权重,角度等参数。
例如图3所示,草图分类模型和真实图分类模型都是深度网络(Dense Net)模型,且包括相同数量的深度块(Dense Block)及预测模块,图2中以3个深度块为例说明,这些深度块之间通过过渡层(Transition Layers)串联。其中,深度块和过渡层属于特征提取模块,每个深度块进行卷积计算,并输出一定数量的特征地图(feature map),而与深度块连接的过渡层可以将对应深度块输出的特征地图的维度进行降维;预测模块主要是将通过多个深度块和多个过渡层之后,提取的特征映射到固定维度的类别概率分布,并预测出某一图像的类别,属于分类模块。但是,草图分类模型和真实图分类模型之间,深度块的固定计算参数,比如输出的特征地图的个数,卷积核大小等可以不同,且过渡层的固定计算参数比如降维倍数等,也可以不同。
可以理解,在一种情况下,分类训练装置在执行本步骤时,可以获取某些系统中已训练好的草图分类模型和真实图分类模型,并发起执行本实施例的步骤102到105。
另一种情况下,分类训练装置在执行本步骤时,可以根据已标记类别的草图训练得到草图分类模型,及根据已标记类别的真实图训练得到真实图分类模型,针对当前训练好的草图分类模型和真实图分类模型,发起执行本实施例的步骤102到105。
在这种情况下,分类训练装置在执行本步骤时,可以通过与各个分类的初始模型相关的损失函数,训练得到草图分类模型和真实图分类模型。具体地:
先确定草图分类的初始模型和真实图分类的初始模型,及确定已标记类别的草图和已标记类别的真实图。其中,确定草图分类的初始模型具体为确定草图分类的初始模型的结构和固定参数的初始值,确定真实图分类的初始模型具体为确定真实图分类的初始模型的结构和固定参数的初始值。
然后根据草图分类的初始模型确定已标记类别的草图的类别,根据真实图分类的初始模型确定已标记类别的真实图的类别,得到初始分类结果。在初始分类结果中可以包括已标记类别的草图的初始类别,及已标记类别的真实图的初始类别。
根据初始分类结果计算与草图分类的初始模型相关的第三损失函数的函数值,及与真实图分类的初始模型相关的第四损失函数的函数值;最后根据第三损失函数的函数值调整草图分类的初始模型,根据第四损失函数的函数值调整真实图分类的初始模型中的固定参数值,以得到草图分类模型和真实图分类模型。
步骤102,选定训练集,在训练集中不仅可以包括多个类别的草图,还可以包括每个类别的真实图。也就是说,训练集中可以包括多个类别的草图和真实图,而每个类别可以对应多个草图和多个真实图。在训练集中的每个图像都具体如下标记:草图的标记或真实图的标记,以及图像所对应类别的标记。
在选定训练集后,分类训练装置可以先对训练集中的各个图像进行预处理,然后再执行步骤103。其中,预处理过程可以包括:将各个图像进行缩放处理,或者裁剪处理,使得处理后的各个图像的尺寸大小相同,这样,可以使得在执行步骤103中确定各个图像的类别时的计算得到简化。
该预处理过程还可以包括:将各个图像进行主体图像的增强,使得各个图像中的主体图像较为清晰,不会模糊,这样,在执行步骤103时,消除了主体图像的不清晰对图像类别确定过程的影响,这里主体图像是指一个图像中的主要图像,而非背景图像,比如一个图像中包括的人物,实物等。还可以有其它预处理,只要是能消除对分类训练装置执行步骤103中图像类别确定过程的影响的预处理方法都属于本发明实施例的范围,在此不一一举例说明。
步骤103,根据上述步骤101确定的草图分类模型确定训练集中草图的类别得到第一类别处理结果。并在草图分类模型确定草图的类别的过程中,根据第二特征分析模型,对草图分类模型中第一特征提取模块提取的草图的特征进行分析得到第二草图特征分析结果。其中对草图的特征的分析可以包括判断该草图的特征是否属于草图,在其它实施例中,还可以包括其它分析处理,在此不进行一一举例。
这里,得到的第一类别处理结果具体可以包括草图分类模型确定的训练集中各个草图的类别,比如在上述步骤102中选定的训练集中包括n个草图,这些草图可以是“飞机”,“树木”等类别的草图,根据草图分类模型分别确定n个草图的类别,得到n个草图的类别C1,C2,……,Cn。
在第二草图特征分析结果具体可以包括第二特征分析模型判断第一特征提取模块提取的草图的特征是否属于草图的结果。
步骤104,根据上述步骤103得到的第一类别处理结果和第二草图特征分析结果,计算草图分类模型的第一损失函数的函数值。
其中,第一损失函数包括:与第一分类模块相关的损失函数,及第二特征分析模型对草图特征分析的损失函数。
其中,与第一分类模块相关的损失函数可以根据第一类别处理结果得到,具体可以为交叉熵损失函数,用于表示第一分类模块确定的类别与草图的实际类别之间的差别,即误差。
另一种情况下,如果第一分类模块确定草图类别的过程中使用相似特征排序的方法,则该与第一分类模块相关的损失函数也可以为排序损失函数,用于表示在相似特征排序过程中的损失函数。例如,第一分类模块在确定草图1的类别过程中,确定草图1与草图2之间的特征相似度,大于草图1与草图2之间的特征相似度,从而确定草图1与草图2的类别相同,则排序损失函数就可以表示在特征相似度排序过程中确定的排序,与实际特征相似度的排序之间的差别
第二特征分析模型对草图特征分析的损失函数是根据第二草图特征分析结果得到的,用于表示第二特征分析模型对第一特征提取模块提取的草图的特征进行分析得到的分析结果,与草图的实际特征之间的差别。
步骤105,根据第一损失函数的函数值调整草图分类模型中的第一固定参数值。
其中,第一固定参数值为草图分类模型所包括的第一特征提取模块和第一分类模块分别在计算过程中所用到的固定的,且不需要随时赋值的参数,比如权重,角度等参数的参数值。如果计算的第一损失函数的函数值较大,比如大于预置的值,则需要改变第一固定参数值,比如将某个权重的权重值增大,或将某个角度的角度值减小等,使得按照调整后的第一固定参数值计算的第一损失函数的函数值减小。
需要说明的是,上述步骤101和102之间并没有绝对的顺序关系,可以同时进行,也可以顺序进行,图1所示的是其中一种具体实现方式。
进一步地,参考图2所示,分类训练装置还可以调整第二特征分析模型中的固定参数值。具体地,分类训练装置会确定真实图分类模型,具体包括确定草图分类模型的结构和相应的固定参数值,真实图分类模型包括第二特征提取模块和第二分类模块;在真实图分类模型确定训练集中真实图的类别的过程中,根据第二特征分析模型,对第二特征提取模块提取的真实图的特征进行分析得到第一真实图特征分析结果;然后根据第一真实图特征分析结果和第二草图特征分析结果,计算第二特征分析模型的第二对抗损失函数的函数值,并根据第二对抗损失函数的函数值调整第二特征分析模型的固定参数值,使得按照调整后的第二特征分析模型的固定参数值计算的第二对抗损失函数的函数值减小。
其中,第一真实图特征分析结果具体可以包括第二特征分析模型判断第二特征提取模块提取的真实图的特征是否属于真实图的结果。而第二对抗损失函数可以包括:第二特征分析模型对真实图特征分析的损失函数,可以根据第一真实图特征分析结果得到;及第二特征分析模型对草图特征分析的损失函数,可以根据第二草图特征分析结果得到。其中,第二特征分析模型对真实图特征分析的损失函数,用于表示第二特征分析模型对第二特征提取模块提取的真实图的特征进行分析得到的分析结果,与真实图的实际特征之间的差别。
另外,需要说明的是,上述步骤103到105是针对上述步骤101确定的草图分类模型,分别对训练集中的各个草图进行处理后,由分类训练装置调整第一固定参数值的过程。而在实际应用中,需要通过不断地循环执行上述步骤103到105,直到对第一固定参数值的调整满足一定的停止条件为止。
因此,分类训练装置在执行了上述实施例步骤101到105之后,还需要判断当前对第一固定参数值的调整是否满足预置的停止条件,如果满足,则结束流程;如果不满足,则针对调整第一固定参数值后的草图分类模型,返回执行上述步骤103到105的步骤。即执行得到第一类别处理结果和第二草图特征分析结果,计算草图分类模型的第一损失函数的函数值及调整第一固定参数值的步骤。
其中,预置的停止条件包括但不限于如下条件中的任何一个:当前调整的第一固定参数值与上一次调整的第一固定参数值的第一差值小于第一阈值,即调整的第一固定参数值达到收敛;及对第一固定参数值的调整次数达到预置次数等。
进一步地,分类训练装置还可以通过如下步骤对真实图分类模型的第二固定参数值进行调整,流程图如图4所示,示意图如图2所示,包括:
步骤201,确定对第一特征提取模块的输出结果进行分析的第一特征分析模型。
第一特征分析模型用于在草图分类模型识别草图类别的过程中,对第一特征提取模块提取的草图的特征(即输出结果)进行分析,具体可以判别该草图的特征属于草图。
步骤202,根据真实图分类模型确定上述训练集中的真实图的类别得到第二类别处理结果;根据第一特征分析模型,对第二特征提取模块提取的真实图的特征进行分析得到第二真实图特征分析结果。
这里,得到的第二类别处理结果具体可以包括由真实图分类模型确定的训练集中各个真实图的类别。在第二真实图特征分析结果具体可以包括第一特征分析模型判断第二特征提取模块提取的真实图的特征是否属于真实图的结果。
步骤203,根据第二类别处理结果及第二真实图特征分析结果,计算真实图分类模型的第二损失函数的函数值,其中,第二损失函数中包括与第二分类模块相关的损失函数,及第一特征分析模型对真实图的特征分析的损失函数。
其中,与第二分类模块相关的损失函数可以根据第二类别处理结果得到。具体可以为交叉熵损失函数,用于表示第二分类模块确定的类别与真实图的实际类别之间的差别;如果第二分类模块确定真实图类别的过程中使用相似特征排序的方法,则该与第二分类模块相关的损失函数也可以为排序损失函数,用于表示在相似特征排序过程中的损失函数。
第一特征分析模型对真实图特征分析的损失函数可以根据第二真实图特征分析结果得到,用于表示第一特征分析模型对第二特征提取模块提取的真实图的特征进行分析得到的分析结果,与真实图的实际特征之间的差别。
步骤204,根据第二损失函数的函数值调整真实图分类模型中的第二固定参数值。
其中,第二固定参数值为真实图分类模型所包括的第二特征提取模块和第二分类模块分别在计算过程中所用到的固定的,且不需要随时赋值的参数,比如权重,角度等参数的参数值。如果计算的第二损失函数的函数值较大,比如大于预置的值,则需要改变第二固定参数值,比如将某个权重的权重值增加,或将某个角度的角度值减小等,使得按照调整后的第二固定参数值计算的第二损失函数的函数值减小。
进一步地,参考图2所示,分类训练装置还可以调整第一特征分析模型中的固定参数值。具体地,分类训练装置会根据第一特征分析模型,对第一特征提取模块提取的草图的特征进行分析得到第一草图特征分析结果;然后根据第一草图特征分析结果和第二真实图特征分析结果,计算第一特征分析模型的第一对抗损失函数的函数值,并根据第一对抗损失函数的函数值调整第一特征分析模型的固定参数值。
其中,第一草图特征分析结果具体可以包括第一特征分析模型判断第一特征提取模块提取的草图的特征是否属于草图的结果。而第一对抗损失函数可以包括:第一特征分析模型对真实图特征分析的损失函数,可以根据第二真实图特征分析结果得到;及第一特征分析模型对草图特征分析的损失函数,可以根据第一草图特征分析结果得到。其中,第一特征分析模型对草图特征分析的损失函数,用于表示第一特征分析模型对第一特征提取模块提取的草图的特征进行分析得到的分析结果,与草图的实际特征之间的差别。
另外,需要说明的是,上述步骤202到204是针对真实图分类模型,对训练集中真实图进行处理后,由分类训练装置调整第二固定参数值的过程。而在实际应用中,需要通过不断地循环执行上述步骤202到204,直到对第二固定参数值的调整满足一定的停止条件为止。
因此,分类训练装置在执行了上述步骤201到204之后,需要判断当前对第二固定参数值的调整是否满足预置的停止条件,如果满足,则结束流程;如果不满足,则针对调整第二固定参数值后的真实图分类模型,返回上述步骤202到204,即执行得到第二类别处理结果和第二真实图特征分析结果,计算真实图分类模型的第二损失函数的函数值及调整第二固定参数值的步骤。
其中,预置的停止条件包括但不限于如下条件中的任何一个:当前调整的第二固定参数值与上一次调整的第二固定参数值的第一差值小于第二阈值,即调整的第二固定参数值达到收敛;及对第二固定参数值的调整次数达到预置次数等。
且需要说明的是,上述步骤202到204,与步骤103到105可以交替进行,比如,在某一次调整过程中,可以调整草图分类模型的第一固定参数值及调整第二特征分析模型的固定参数值,即执行步骤103到105;在另一调整过程中,调整真实图分类模型的第二固定参数值及调整第一特征分析模型的固定参数值,即执行步骤202到204;而再次调整过程中,再调整草图分类模型的第一固定参数值及调整第二特征分析模型的固定参数值,即执行步骤103到105,这样以此类推。
进一步地,分类训练装置在通过上述实施例的方法,得到调整后的草图分类模型和真实图分类模型,在调整后的草图分类模型和真实图分类模型的实际应用中:一种情况下,分类训练装置可以先获取待分类草图(比如用户通过终端设备输入的待分类草图),然后根据调整后的草图分类模型对待分类草图进行分类,得到待分类草图的类别,从而实现了对草图的分类。
另一种情况下,分类训练装置可以先获取待分类草图(比如用户通过终端设备输入的待分类草图),及获取分类训练装置中储存的各个真实图;然后根据调整后的草图分类模型对待分类草图进行分类得到待分类草图的类别,根据调整后的真实图分类模型分别对储存的各个真实图进行分类得到各个真实图的类别;最后再选出类别与待分类草图的类别相同的真实图,以提供给用户的终端设备。从而实现了对草图的检索。
可见,在本实施例的方法中,分类训练装置会先选定训练集,并根据草图分类模型确定训练集中的草图的类别得到第一类别处理结果,且可以根据第二特征分析模型对第一特征提取模型提取的草图特征进行分析,第二草图分析结果;然后根据第一类别处理结果和第二草图分析结果得到第一损失函数的函数值;最后根据第一损失函数的函数值对草图分类模型的第一固定参数值进行调整。且分类训练装置还会根据真实图分类模型确定训练集中的真实图的类别,得到第二类别处理结果,且可以根据第一特征分析模型对第二特征提取模块提取的真实图特征进行分析,得到第二真实图分析结果;然后根据第二类别处理结果和第二真实图分析结果得到第二损失函数的函数值;最后根据第二损失函数的函数值对真实图分类模型的第二固定参数值进行调整。这样,在对某一分类模型(比如草图分类模型)的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型(比如真实图分类模型)在分类过程中的有用信息,即对另一分类模型中特征提取模块提取的特征进行分析的特征分析模型(比如第二特征分析模型),从而使得调整后的草图分类模型和真实图分类模型的分类计算更准确。
以下一个具体的应用实例来说明本实施例的方法,参考图5所示,在本实施例中,草图分类模型和真实图分类模型可以使用相同结构的基于卷积神经网络,分别记为CNN_1和CNN_2;草图分类模型中包括的第一特征提取模块和第一分类模块分别记为CNN11和CNN12,第一特征分析模型具体为草图鉴别器D_1;真实图分类模型中包括的第二特征提取模块和第二分类模块分别记为CNN21和CNN22,第二特征分析模型具体为真实图鉴别器D_2。则本实施例的分类训练方法可以通过如下步骤实现,流程图如图6所示,包括:
步骤301,确定草图分类模型CNN_1和真实图分类模型CNN_2,及草图鉴别器D_1和真实图鉴别器D_2,具体包括确定各个模型的结构及固定参数的初始值。
步骤302,选定训练集,在训练集中包括多个类别的图像对,每个类别的图像对中包括同一类别的草图和真实图,具体为
Figure BDA0001505065830000131
其中,Si为某一类别i的草图图像,Ii为该类别i的真实图图像。
步骤303,根据草图分类模型CNN_1确定训练集中草图的类别得到草图的类别,根据真实图分类模型CNN_2确定训练集中真实图的类别得到真实图的类别。
在这个过程中,通过草图鉴别器D_1对草图分类模型CNN_1中的草图特征提取模块CNN11提取的草图特征进行鉴别,得到草图特征鉴别结果11;通过草图鉴别器D_1对真实图分类模型CNN_2中的真实图特征提取模块CNN21提取的真实图特征进行鉴别,得到真实图特征鉴别结果12。
通过真实图鉴别器D_2对真实图分类模型CNN_2中的真实图特征提取模块CNN21提取的真实图特征进行鉴别,得到真实图特征鉴别结果21;通过真实图鉴别器D_2对草图分类模型CNN_1中的草图特征提取模块CNN11提取的草图特征进行鉴别,得到草图特征鉴别结果22。
步骤304,先固定草图分类模型CNN_1和真实图鉴别器D_2,对真实图分类模型CNN_2的固定参数值和草图鉴别器D_1的固定参数值进行调整,使得对真实图分类模型CNN_2的调整借鉴了草图分类模型CNN_1在分类过程中的有用信息。
具体地,分类训练装置会根据如下公式1,及上述步骤303中得到的草图特征鉴别结果11和真实图特征鉴别结果12,计算草图鉴别器D_1的对抗函数
Figure BDA0001505065830000132
的函数值,根据该函数值调整草图鉴别器D_1的固定参数值。
根据如下公式2,上述步骤303中真实图分类模型CNN_2确定的真实图的类别及真实图特征鉴别结果12,计算真实图分类模型CNN_2的损失函数的函数值,根据该函数值调整真实图分类模型CNN_2的固定参数值。具体可以包括:与真实图分类模型CNN_2中真实图分类模块CNN22相关的损失函数,比如交叉熵损失函数及草图鉴别器D_1对真实图特征判别的损失函数,可以根据真实图特征鉴别结果12得到。其中,相关的损失函数
Figure BDA0001505065830000143
可以通过如下公式3及上述步骤303中真实图分类模型CNN_2确定的真实图的类别得到。
Figure BDA0001505065830000144
Figure BDA0001505065830000145
其中,log(D_1(CNN_2(Ii)))可以表示草图鉴别器D_1对真实图特征判别的损失函数。
步骤305,再固定真实图分类模型CNN_2和草图鉴别器D_1,对草图分类模型CNN_1的固定参数值和真实图鉴别器D_2的固定参数值进行调整,使得对草图分类模型CNN_1的调整借鉴了真实图分类模型CNN_2在分类过程中的有用信息。
具体地,分类训练装置会根据如下公式4,及上述步骤303中得到的真实图特征鉴别结果21和草图特征鉴别结果22,计算真实图鉴别器D_2的对抗函数
Figure BDA0001505065830000146
的函数值,根据该函数值调整真实图鉴别器D_2的固定参数值。
Figure BDA0001505065830000151
根据如下公式5,上述步骤303中草图分类模型CNN_1确定的草图的类别和草图特征鉴别结果22,计算草图分类模型CNN_1的损失函数的函数值,根据该函数值调整草图分类模型CNN_1的固定参数值。具体可以包括:与草图分类模型CNN_1中草图分类模块CNN12相关的损失函数,比如交叉熵损失函数
Figure BDA0001505065830000152
及真实图鉴别器D_2对草图特征判别的损失函数,可以根据草图特征鉴别结果22得到。其中,相关的损失函数
Figure BDA0001505065830000153
可以通过如下公式6及草图的类别得到。
Figure BDA0001505065830000154
Figure BDA0001505065830000155
其中,log(D_2(CNN_1(Si)))可以表示真实图鉴别器D_2对草图特征判别的损失函数。
步骤306,执行完上述步骤301到305之后,判断对草图分类模型CNN_1和真实图分类模型CNN_2的固定参数值的调整是否满足预置条件,如果满足,则结束流程;如果不满足,则针对调整后的草图分类模型CNN_1和真实图分类模型CNN_2,及调整后的草图鉴别器D_1和真实图鉴别器D_2,返回执行上述步骤303到305。
本发明实施例还提供一种分类训练装置,其结构示意图如图7所示,具体可以包括:
模型确定单元10,用于确定草图分类模型,所述草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,所述第二特征提取模块属于真实图分类模型。
具体地,模型确定单元10,具体用于确定相同结构的草图分类的初始模型和真实图分类的初始模型,及确定已标记类别的草图和已标记类别的真实图;根据所述草图分类的初始模型确定所述已标记类别的草图的类别,根据真实图分类的初始模型确定已标记类别的真实图的类别,得到初始分类结果;根据所述初始分类结果计算与所述草图分类的初始模型相关的第三损失函数的函数值,及与所述真实图分类的初始模型相关的第四损失函数的函数值,并根据所述第三损失函数的函数值调整所述草图分类的初始模型中的固定参数值,根据第四损失函数的函数值调整真实图分类的初始模型中的固定参数值,以得到所述草图分类模型和真实图分类模型。
训练集单元11,用于选定训练集,所述训练集包括多个类别的草图。该训练集中还包括相应类别的真实图。
处理单元12,用于根据所述模型确定单元10确定的草图分类模型确定所述训练集单元11选定训练集中草图的类别得到第一类别处理结果;根据所述第二特征分析模型,对第一特征提取模块提取的所述草图的特征进行分析得到第二草图特征分析结果;
函数值计算单元13,用于根据所述处理单元12得到的第一类别处理结果及第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值,其中,所述第一损失函数中包括与所述第一分类模块相关的损失函数,及所述第二特征分析模型对所述草图的特征分析的损失函数。
调整单元14,用于根据所述函数值计算单元13计算的第一损失函数的函数值调整所述草图分类模型中的第一固定参数值。
进一步地,上述训练集单元11选定的训练集中还可以包括相应类别的真实图,所述模型确定单元10,还可以确定真实图分类模型,所述真实图分类模型包括第二特征提取模块和第二分类模块;处理单元12,还用于在所述真实图分类模型确定所述真实图的类别时,根据所述第二特征分析模型,对所述第二特征提取模块提取的所述真实图的特征进行分析得到第一真实图特征分析结果;函数值计算单元13,还用于根据所述第一真实图特征分析结果和第二草图特征分析结果,计算所述第二特征分析模型的第二对抗损失函数的函数值;调整单元14,还用于根据所述第二对抗损失函数的函数值调整所述第二特征分析模型的固定参数值。
进一步地,模型确定单元10,还用于确定对所述第一特征提取模块的输出结果进行分析的第一特征分析模型;处理单元12,还用于根据所述真实图分类模型确定所述训练集中的真实图的类别得到第二类别处理结果;根据所述第一特征分析模型,对第二特征提取模块提取的所述真实图的特征进行分析得到第二真实图特征分析结果;函数值计算单元13,还用于根据所述第二类别处理结果及第二真实图特征分析结果,计算所述真实图分类模型的第二损失函数的函数值,其中,所述第二损失函数中包括与所述第二分类模块相关的损失函数,及所述第一特征分析模型对所述真实图的特征分析的损失函数;调整单元14,还用于根据所述第二损失函数的函数值调整所述真实图分类模型中的第二固定参数值。
进一步地,处理单元12,还用于根据所述第一特征分析模型,对所述第一特征提取模块提取的所述草图的特征进行分析得到第一草图特征分析结果;函数值计算单元13,还用于根据所述第一草图特征分析结果和第二真实图特征分析结果,计算所述第一特征分析模型的第一对抗损失函数的函数值;调整单元14,还用于根据所述第一对抗损失函数的函数值调整所述第一特征分析模型的固定参数值。
可见,在本实施例的装置中,训练集单元11会选定训练集,处理单元12根据草图分类模型确定训练集中草图的类别,得到第一类别处理结果,且可以根据第二特征分析模型对第一特征提取模型提取的草图特征进行分析,得到第二草图分析结果;然后函数值计算单元13根据第一类别处理结果和第二草图分析结果得到第一损失函数的函数值;最后调整单元14根据第一损失函数的函数值对草图分类模型的第一固定参数值进行调整。且处理单元12还可以根真实图分类模型确定训练集中真实图的类别,得到第二类别处理结果,且可以根据第一特征分析模型对第二特征提取模块提取的真实图特征进行分析,得到第二真实图分析结果;然后函数值计算单元13根据第二类别处理结果和第二真实图分析结果得到第二损失函数的函数值;最后调整单元14根据第二损失函数的函数值对真实图分类模型的第二固定参数值进行调整。这样,在对某一分类模型(比如草图分类模型)的固定参数值进行调整时,不仅会参考该分类模型对相应图像进行分类的误差,还会借鉴另一分类模型(比如真实图分类模型)在分类过程中的有用信息,即对另一分类模型中特征提取模块提取的特征进行分析的特征分析模型(比如第二特征分析模型),从而使得调整后的草图分类模型和真实图分类模型的分类计算更准确。
参考图8所示,在一个具体的实施例中,分类训练装置除了可以包括如图7所示的结构外,还可以包括判断单元15和分类单元16,其中:
判断单元15,用于判断调整单元14对所述第一固定参数值的调整是否满足预置的停止条件,如果不满足,则通知所述处理单元12针对调整所述第一固定参数值后的草图分类模型,得到所述第一类别处理结果和第二草图特征分析结果。
其中,预置的停止条件可以包括但不限于如下条件中的任何一个:
所述当前调整的第一固定参数值与上一次调整的第一固定参数值的第一差值小于第一阈值;及对第一固定参数的调整次数达到预置次数等。
进一步地,判断单元15,用于判断调整单元14对所述第二固定参数值的调整是否满足预置的停止条件,如果不满足,则通知所述处理单元12针对调整所述第二固定参数值后的真实图分类模型,得到所述第二类别处理结果和第二真实图特征分析结果。这里预置的停止条件可以包括但不限于如下条件中的任何一个:所述当前调整的第二固定参数值与上一次调整的第二固定参数值的第一差值小于第一阈值;及对第二固定参数的调整次数达到预置次数等。
分类单元16,用于获取待分类草图,根据所述调整单元14调整后的草图分类模型对所述待分类草图进行分类,得到所述待分类草图的类别。
该分类单元16,还可以获取待分类草图,及获取分类训练装置中储存的各个真实图;然后根据调整单元14调整后的草图分类模型对待分类草图进行分类得到待分类草图的类别,根据调整后的真实图分类模型分别对储存的各个真实图进行分类得到各个真实图的类别;最后再选出类别与待分类草图的类别相同的真实图。
本发明实施例还提供一种服务器,其结构示意图如图9所示,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessing units,CPU)20(例如,一个或一个以上处理器)和存储器21,一个或一个以上存储应用程序221或数据222的存储介质22(例如一个或一个以上海量存储设备)。其中,存储器21和存储介质22可以是短暂存储或持久存储。存储在存储介质22的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器20可以设置为与存储介质22通信,在服务器上执行存储介质22中的一系列指令操作。
具体地,在存储介质22中储存的应用程序221包括分类训练应用程序,且该程序可以包括上述分类训练装置中的模型确定单元10,训练集单元11,处理单元12,函数值计算单元13,调整单元14,判断单元15和分类单元16,在此不进行赘述。更进一步地,中央处理器20可以设置为与存储介质22通信,在服务器上执行存储介质22中储存的分类训练应用程序对应的一系列操作。
服务器还可以包括一个或一个以上电源23,一个或一个以上有线或无线网络接口24,一个或一个以上输入输出接口25,和/或,一个或一个以上操作系统223,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述方法实施例中所述的由分类训练装置所执行的步骤可以基于该图9所示的服务器的结构。
本发明实施例还提供一种存储介质,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如上述分类训练装置所述的分类训练方法。
本发明实施例还提供一种服务器,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如上述分类训练装置所述的分类训练方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。
以上对本发明实施例所提供的分类训练方法、装置及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种分类训练方法,其特征在于,包括:
确定草图分类模型,所述草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,所述第二特征提取模块属于真实图分类模型;
选定训练集,所述训练集包括多个类别的草图;
根据所述草图分类模型确定所述训练集中草图的类别得到第一类别处理结果;根据所述第二特征分析模型,对第一特征提取模块提取的所述草图的特征进行分析得到第二草图特征分析结果;
根据所述第一类别处理结果及第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值;
根据所述第一损失函数的函数值调整所述草图分类模型中的第一固定参数值。
2.如权利要求1所述的方法,其特征在于,所述训练集中还包括相应类别的真实图,所述方法还包括:
确定真实图分类模型,所述真实图分类模型包括第二特征提取模块和第二分类模块;
在所述真实图分类模型确定所述真实图的类别时,根据所述第二特征分析模型,对所述第二特征提取模块提取的所述真实图的特征进行分析得到第一真实图特征分析结果;
根据所述第一真实图特征分析结果和第二草图特征分析结果,计算所述第二特征分析模型的第二对抗损失函数的函数值;
根据所述第二对抗损失函数的函数值调整所述第二特征分析模型的固定参数值。
3.如权利要求2所述的方法,其特征在于,所述确定草图分类模型和真实图分类模型,具体包括:
确定草图分类的初始模型和真实图分类的初始模型,及确定已标记类别的草图和已标记类别的真实图;
根据所述草图分类的初始模型确定所述已标记类别的草图的类别,根据所述真实图分类的初始模型确定所述已标记类别的真实图的类别,得到初始分类结果;
根据所述初始分类结果计算与所述草图分类的初始模型相关的第三损失函数的函数值,及与所述真实图分类的初始模型相关的第四损失函数的函数值,并根据所述第三损失函数的函数值调整所述草图分类的初始模型,根据所述第四损失函数的函数值调整所述真实图分类的初始模型中的固定参数值,以得到所述草图分类模型和真实图分类模型。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
确定对所述第一特征提取模块的输出结果进行分析的第一特征分析模型;
根据所述真实图分类模型确定所述训练集中的真实图的类别得到第二类别处理结果;根据所述第一特征分析模型,对第二特征提取模块提取的所述真实图的特征进行分析得到第二真实图特征分析结果;
根据所述第二类别处理结果及第二真实图特征分析结果,计算所述真实图分类模型的第二损失函数的函数值;
根据所述第二损失函数的函数值调整所述真实图分类模型中的第二固定参数值。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:
根据所述第一特征分析模型,对所述第一特征提取模块提取的所述草图的特征进行分析得到第一草图特征分析结果;
根据所述第一草图特征分析结果和第二真实图特征分析结果,计算所述第一特征分析模型的第一对抗损失函数的函数值;
根据所述第一对抗损失函数的函数值调整所述第一特征分析模型的固定参数值。
6.如权利要求2至5任一项所述的方法,其特征在于,所述方法还包括:
如果对所述第一固定参数值的调整不满足预置的停止条件时,针对调整所述第一固定参数值后的草图分类模型,执行得到所述第一类别处理结果和第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值及调整所述第一固定参数值的。
7.如权利要求6所述的方法,其特征在于,所述预置的停止条件包括如下条件中的任何一个:
当前调整的第一固定参数值与上一次调整的第一固定参数值的第一差值小于第一阈值;对所述第一固定参数值的调整次数达到预置次数。
8.如权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
获取待分类草图,根据所述调整后的草图分类模型对所述待分类草图进行分类,得到所述待分类草图的类别。
9.一种分类训练装置,其特征在于,包括:
模型确定单元,用于确定草图分类模型,所述草图分类模型中包括第一特征提取模块和第一分类模块;及确定对第二特征提取模块的输出结果进行分析的第二特征分析模型,所述第二特征提取模块属于真实图分类模型;
训练集单元,用于选定训练集,所述训练集包括多个类别的草图;
处理单元,用于根据所述草图分类模型确定所述训练集中草图的类别得到第一类别处理结果;根据所述第二特征分析模型,对第一特征提取模块提取的所述草图的特征进行分析得到第二草图特征分析结果;
函数值计算单元,用于根据所述第一类别处理结果及第二草图特征分析结果,计算所述草图分类模型的第一损失函数的函数值;
调整单元,用于根据所述第一损失函数的函数值调整所述草图分类模型中的第一固定参数值。
10.如权利要求9所述的装置,其特征在于,所述训练集中还包括相应类别的真实图;
模型确定单元,还用于确定真实图分类模型,所述真实图分类模型包括第二特征提取模块和第二分类模块,及确定对所述第一特征提取模块的输出结果进行分析的第一特征分析模型;
处理单元,还用于根据所述真实图分类模型确定所述训练集中的真实图的类别得到第二类别处理结果;根据所述第一特征分析模型,对第二特征提取模块提取的所述真实图的特征进行分析得到第二真实图特征分析结果;
函数值计算单元,还用于根据所述第二类别处理结果及第二真实图特征分析结果,计算所述真实图分类模型的第二损失函数的函数值,其中,所述第二损失函数中包括与所述第二分类模块相关的损失函数,及所述第一特征分析模型对所述真实图的特征分析的损失函数;
调整单元,还用于根据所述第二损失函数的函数值调整所述真实图分类模型中的第二固定参数值。
11.如权利要求9至10任一项所述的装置,其特征在于,还包括:
判断单元,用于调整单元对所述第一固定参数值的调整是否满足预置的停止条件,如果不满足,则通知所述处理单元针对所述调整单元调整后的草图分类模型,得到所述第一类别处理结果和第二草图特征分析结果。
12.如权利要求11所述的装置,其特征在于,所述预置的停止条件包括如下条件中的任何一个:
当前调整的第一固定参数值与上一次调整的第一固定参数值的第一差值小于第一阈值;对所述第一固定参数值的调整次数达到预置次数。
13.如权利要求9至10任一项所述的装置,其特征在于,
分类单元,用于获取待分类草图,根据所述调整后的草图分类模型对所述待分类草图进行分类,得到所述待分类草图的类别。
14.一种存储介质,其特征在于,所述存储介质储存多条指令,所述指令适于由处理器加载并执行如权利要求1至8任一项所述的分类训练方法。
15.一种服务器,其特征在于,包括处理器和存储介质,所述处理器,用于实现各个指令;
所述存储介质用于储存多条指令,所述指令用于由处理器加载并执行如权利要求1至8任一项所述的分类训练方法。
CN201711322612.2A 2017-12-12 2017-12-12 一种分类训练方法、装置及存储介质 Active CN108090508B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910854110.7A CN110633745B (zh) 2017-12-12 2017-12-12 一种基于人工智能的图像分类训练方法、装置及存储介质
CN201711322612.2A CN108090508B (zh) 2017-12-12 2017-12-12 一种分类训练方法、装置及存储介质
EP18887500.9A EP3726426A4 (en) 2017-12-12 2018-11-23 CLASSIFICATION TRAINING PROCEDURES, SERVER AND STORAGE MEDIUM
PCT/CN2018/117158 WO2019114523A1 (zh) 2017-12-12 2018-11-23 分类训练方法、服务器及存储介质
US16/696,361 US11017220B2 (en) 2017-12-12 2019-11-26 Classification model training method, server, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711322612.2A CN108090508B (zh) 2017-12-12 2017-12-12 一种分类训练方法、装置及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910854110.7A Division CN110633745B (zh) 2017-12-12 2017-12-12 一种基于人工智能的图像分类训练方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN108090508A CN108090508A (zh) 2018-05-29
CN108090508B true CN108090508B (zh) 2020-01-31

Family

ID=62175384

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910854110.7A Active CN110633745B (zh) 2017-12-12 2017-12-12 一种基于人工智能的图像分类训练方法、装置及存储介质
CN201711322612.2A Active CN108090508B (zh) 2017-12-12 2017-12-12 一种分类训练方法、装置及存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910854110.7A Active CN110633745B (zh) 2017-12-12 2017-12-12 一种基于人工智能的图像分类训练方法、装置及存储介质

Country Status (4)

Country Link
US (1) US11017220B2 (zh)
EP (1) EP3726426A4 (zh)
CN (2) CN110633745B (zh)
WO (1) WO2019114523A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633745B (zh) 2017-12-12 2022-11-29 腾讯科技(深圳)有限公司 一种基于人工智能的图像分类训练方法、装置及存储介质
WO2020059446A1 (ja) * 2018-09-20 2020-03-26 富士フイルム株式会社 学習装置及び学習方法
CN110163222B (zh) * 2018-10-08 2023-01-24 腾讯科技(深圳)有限公司 一种图像识别的方法、模型训练的方法以及服务器
CN109977262B (zh) * 2019-03-25 2021-11-16 北京旷视科技有限公司 从视频中获取候选片段的方法、装置及处理设备
US11048932B2 (en) * 2019-08-26 2021-06-29 Adobe Inc. Transformation of hand-drawn sketches to digital images
US11886514B2 (en) 2019-10-11 2024-01-30 Kinaxis Inc. Machine learning segmentation methods and systems
US11526899B2 (en) 2019-10-11 2022-12-13 Kinaxis Inc. Systems and methods for dynamic demand sensing
CN111159397B (zh) * 2019-12-04 2023-04-18 支付宝(杭州)信息技术有限公司 文本分类方法和装置、服务器
CN111143552B (zh) * 2019-12-05 2023-06-27 支付宝(杭州)信息技术有限公司 文本信息的类别预测方法和装置、服务器
CN111079813B (zh) * 2019-12-10 2023-07-07 北京百度网讯科技有限公司 基于模型并行的分类模型计算方法和装置
CN111461352B (zh) * 2020-04-17 2023-05-09 蚂蚁胜信(上海)信息技术有限公司 模型训练、业务节点识别方法、装置及电子设备
CN111951128B (zh) * 2020-08-31 2022-01-28 江苏工程职业技术学院 一种节能环保的建筑施工方法和装置
CN111931865B (zh) * 2020-09-17 2021-01-26 平安科技(深圳)有限公司 图像分类模型的训练方法、装置、计算机设备及存储介质
US20220091873A1 (en) * 2020-09-24 2022-03-24 Google Llc Systems and methods for cross media reporting by fast merging of data sources
CN112288098A (zh) * 2020-11-02 2021-01-29 平安数字信息科技(深圳)有限公司 预训练模型的获取方法、装置以及计算机设备
CN112529978B (zh) * 2020-12-07 2022-10-14 四川大学 一种人机交互式抽象画生成方法
CN112862110B (zh) * 2021-02-11 2024-01-30 脸萌有限公司 模型生成方法、装置和电子设备
CN113313022B (zh) * 2021-05-27 2023-11-10 北京百度网讯科技有限公司 文字识别模型的训练方法和识别图像中文字的方法
TWI815492B (zh) * 2022-06-06 2023-09-11 中國鋼鐵股份有限公司 鋼帶表面缺陷辨識方法與系統

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9064147B2 (en) * 2010-12-03 2015-06-23 Massachusetts Institute Of Technology Sketch recognition system
CN106126581A (zh) * 2016-06-20 2016-11-16 复旦大学 基于深度学习的手绘草图图像检索方法
CN107122396A (zh) * 2017-03-13 2017-09-01 西北大学 基于深度卷积神经网络的三维模型检索算法
CN107220277A (zh) * 2017-04-14 2017-09-29 西北大学 基于手绘草图的图像检索算法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140448B2 (en) * 2008-05-09 2012-03-20 International Business Machines Corporation System and method for classifying data streams with very large cardinality
US8289287B2 (en) * 2008-12-30 2012-10-16 Nokia Corporation Method, apparatus and computer program product for providing a personalizable user interface
CN102184395B (zh) * 2011-06-08 2012-12-19 天津大学 基于字符串核的草图识别方法
US20140270489A1 (en) * 2013-03-12 2014-09-18 Microsoft Corporation Learned mid-level representation for contour and object detection
CN104680120B (zh) * 2013-12-02 2018-10-19 华为技术有限公司 一种人脸检测的强分类器的生成方法及装置
WO2017168125A1 (en) * 2016-03-31 2017-10-05 Queen Mary University Of London Sketch based search methods
CN106250866A (zh) * 2016-08-12 2016-12-21 广州视源电子科技股份有限公司 基于神经网络的图像特征提取建模、图像识别方法及装置
CN106683048B (zh) * 2016-11-30 2020-09-01 浙江宇视科技有限公司 一种图像超分辨率方法及设备
CN110633745B (zh) * 2017-12-12 2022-11-29 腾讯科技(深圳)有限公司 一种基于人工智能的图像分类训练方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9064147B2 (en) * 2010-12-03 2015-06-23 Massachusetts Institute Of Technology Sketch recognition system
CN106126581A (zh) * 2016-06-20 2016-11-16 复旦大学 基于深度学习的手绘草图图像检索方法
CN107122396A (zh) * 2017-03-13 2017-09-01 西北大学 基于深度卷积神经网络的三维模型检索算法
CN107220277A (zh) * 2017-04-14 2017-09-29 西北大学 基于手绘草图的图像检索算法

Also Published As

Publication number Publication date
CN108090508A (zh) 2018-05-29
CN110633745A (zh) 2019-12-31
US20200097709A1 (en) 2020-03-26
CN110633745B (zh) 2022-11-29
EP3726426A4 (en) 2021-08-04
WO2019114523A1 (zh) 2019-06-20
US11017220B2 (en) 2021-05-25
EP3726426A1 (en) 2020-10-21

Similar Documents

Publication Publication Date Title
CN108090508B (zh) 一种分类训练方法、装置及存储介质
CN108491817B (zh) 一种事件检测模型训练方法、装置以及事件检测方法
CN110020592B (zh) 物体检测模型训练方法、装置、计算机设备及存储介质
EP3779774A1 (en) Training method for image semantic segmentation model and server
CN111126258A (zh) 图像识别方法及相关装置
CN106846362B (zh) 一种目标检测跟踪方法和装置
CN109376696B (zh) 视频动作分类的方法、装置、计算机设备和存储介质
CN108334910B (zh) 一种事件检测模型训练方法以及事件检测方法
JP6756406B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN107169503B (zh) 一种室内场景的分类方法及装置
CN109978058B (zh) 确定图像分类的方法、装置、终端及存储介质
CN114299363A (zh) 图像处理模型的训练方法、图像分类方法及装置
CN111144425B (zh) 检测拍屏图片的方法、装置、电子设备及存储介质
CN113487600A (zh) 一种特征增强尺度自适应感知船舶检测方法
KR102369413B1 (ko) 영상 처리 장치 및 방법
CN117409419A (zh) 图像检测方法、设备及存储介质
CN113870254B (zh) 目标对象的检测方法、装置、电子设备及存储介质
CN110490058B (zh) 行人检测模型的训练方法、装置、系统和计算机可读介质
CN111401343A (zh) 识别图像中人的属性的方法、识别模型的训练方法和装置
CN105678333B (zh) 一种拥挤区域的确定方法和装置
CN117115595B (zh) 姿态估计模型的训练方法、装置、电子设备及存储介质
CN111476059A (zh) 目标检测方法、装置、计算机设备及存储介质
CN114565092A (zh) 一种神经网络结构确定方法及其装置
Bouteldja et al. A comparative analysis of SVM, K-NN, and decision trees for high resolution satellite image scene classification
CN115984671A (zh) 模型在线更新方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant