CN112560971A - 一种主动学习自迭代的图像分类方法和系统 - Google Patents
一种主动学习自迭代的图像分类方法和系统 Download PDFInfo
- Publication number
- CN112560971A CN112560971A CN202011517586.0A CN202011517586A CN112560971A CN 112560971 A CN112560971 A CN 112560971A CN 202011517586 A CN202011517586 A CN 202011517586A CN 112560971 A CN112560971 A CN 112560971A
- Authority
- CN
- China
- Prior art keywords
- target detection
- model
- target
- sample
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提出一种主动学习自迭代的图像分类方法和系统,其方法技术方案包括模型训练步骤,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练;推理计算步骤,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。本发明解决了现有深度学习图像分类方法进行多类别分类时效果较差且需要大量标注成本的问题。
Description
技术领域
本发明属于深度学习领域,尤其涉及一种主动学习自迭代的图像分类方法和系统。
背景技术
基于深度学习分类的方法在随着目标类别过多时会出现召回率和精确率下降的情况,这是因为类别过多会给分类器造成一定的压力,分类器很难去拟合特别多的类别;同时如果数据的类内间距太大、类间间距太小,多目标检测的方法缺少类内约束,效果也较差;并且如果类别过多,也会更容易出现类别不均衡的问题,直接影响检测效果。目前,如果想要通过深度学习分类的方法解决多目标分类的问题就需要非常多且丰富的数据。
发明内容
本申请实施例提供了一种主动学习自迭代的图像分类方法和系统,以至少解决现有深度学习图像分类方法进行多类别分类时效果较差且需要大量标注成本的问题。
第一方面,本申请实施例提供了一种主动学习自迭代的图像分类方法,包括:模型训练步骤,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练;推理计算步骤,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
优选的,所述模型训练步骤包括:目标检测训练步骤,将所述训练样本的所述目标的类别设置为同一类别,并将所述训练样本输入至所述目标检测模型中,对所述目标检测模型进行训练;度量学习训练步骤,将所述训练样本的所述目标的图像单独截取,区分所述目标的类别,并将单独截取出的所述目标的图像输入至所述度量学习模型中,对所述度量学习模型进行训练。
优选的,所述推理计算步骤包括:素材库映射步骤,将单独截取出的所述训练样本的所述目标的图像作为素材库,使用训练好的所述度量学习模型对所述素材库进行度量空间的映射,生成素材embedding;目标检测步骤,使用训练好的所述目标检测模型对所述待检测图像中的所述目标进行定位识别;目标映射步骤,使用训练好的所述度量学习模型对已定位识别的所述目标进行度量空间的映射,生成目标embedding;相似度计算步骤,将所述目标embedding与所述素材embedding进行比较,计算相似度,并得到所述目标的类别。
优选的,所述方法还包括一主动学习步骤:使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。
优选的,所述预设条件为使用不确定指标筛选出的最不确定样本。
优选的,所述主动学习步骤包括:模型评分步骤,使用训练好的所述目标检测模型和所述度量学习模型,对所述待检测图像进行目标检测评分和度量评分;样本筛选步骤,根据所述目标检测评分和所述度量评分结果从所述待检测图像中筛选出再训练样本。
优选的,所述样本筛选步骤还包括:将所述目标检测评分低于一定阈值、所述度量评分高于一定阈值的所述待检测图像作为所述再训练样本,并将其直接再输入至所述目标检测模型和所述度量学习模型中进行再训练。
优选的,所述样本筛选步骤还包括:将所述目标检测评分高于一定阈值、所述度量评分低于一定阈值的所述待检测图像作为所述再训练样本,并对其进行再标注后,再输入至所述目标检测模型和所述度量学习模型中进行再训练。
第二方面,本申请实施例提供了一种主动学习自迭代的图像分类系统,适用于上述一种主动学习自迭代的图像分类方法,包括:模型训练单元,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练;推理计算单元,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
在其中一些实施例中,所述系统还包括一主动学习单元:使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。
相比于相关技术,本申请实施例提供的一种主动学习自迭代的图像分类方法可以在样本量较少的情况下,进行训练、识别,对各类别的样本数据量要求较低;此外,本方法可以解决大类别量的图像识别,类别数量大不会对识别效果产生影响。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明的主动学习自迭代的图像分类方法流程图;
图2为图1中步骤S1的分步骤流程图;
图3为图1中步骤S2的分步骤流程图;
图4为图1中步骤S3的分步骤流程图;
图5为本发明的主动学习自迭代的图像分类系统的框架图;
图6为本发明实施例提供的的一电子设备的框架图;
以上图中:
1、模型训练单元;2、推理计算单元;3、主动学习单元;11、目标检测训练模块;12、度量学习训练模块;21、素材库映射模块;22、目标检测模块;23、目标映射模块;24、相似度计算模块;31、模型评分模块;32、样本筛选模块;60、总线;61、处理器;62、存储器;63、通信接口。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例提供的主动学习自迭代的图像分类方法,适用于对图像中某一具体事物的辨别。
以下,结合附图详细介绍本发明的实施例:
图1为本发明的主动学习自迭代的图像分类方法流程图,请参见图1,本发明主动学习自迭代的图像分类方法包括如下步骤:
S1:在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练。
可选的,图2为图1中步骤S1的分步骤流程图,请参见图2:
S11:将所述训练样本的所述目标的类别设置为同一类别,并将所述训练样本输入至所述目标检测模型中,对所述目标检测模型进行训练。
在具体实施中,在某一应用场景中,将该应用场景中现有的部分图像作为训练样本,以人工的形式在这些训练样本中对所要识别的对象,即目标进行标注,标注的内容为该目标对象的类别。
在本申请实施例中,对于多类别的应用场景,先将该多种类别统一标注为一种类别;本步骤的目的在于,先将训练样本图像区分为背景和前景目标对象两部分,以首先训练目标检测模型。
在深度学习分类领域,目标检测的目的即为检测目标对象在该图像中所处的具体位置坐标,以进行下一步的具体分类识别。
在具体实施中,对已人工标注的训练样本输入至一深度学习目标检测模型中,对该目标检测模型进行训练。
请继续参见图2:
S12:将所述训练样本的所述目标的图像单独截取,区分所述目标的类别,并将单独截取出的所述目标的图像输入至所述度量学习模型中,对所述度量学习模型进行训练。
在具体实施中,对已进行人工标注的训练样本,将其中的目标对象的图像单独截取出来,并区分其中目标对象的具体类别,不再以一种类别的形式,即前景目标对象的类别进行标注;通过本步骤区分类别的标注,开始进行度量学习的训练。
在具体实施中,将单独截取出来的目标对象图像输入至一度量学习模型中,对度量学习模型进行训练;在本申请实施例中,该部分单独截取出来的目标对象图像将作为素材库内容,并以其为依据对待检测的图像进行相似度计算。
在图像领域的深度学习中,度量学习用于计算图像之间的相似度。
完成模型的训练后,利用训练好的模型对图像进行具体的分类,请继续参见图1:
S2:使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
可选的,图3为为图1中步骤S2的分步骤流程图,请参见图3:
S21:将单独截取出的所述训练样本的所述目标的图像作为素材库,使用训练好的所述度量学习模型对所述素材库进行度量空间的映射,生成素材embedding。
在具体实施中,将步骤S12中所单独截取出来的目标对象图像作为素材库,使用上述训练好的度量学习模型对该素材库进行度量空间的映射,将素材库中的图像降维表示,生成素材库的embedding,以便进行后续的相似度计算。
S22:使用训练好的所述目标检测模型对所述待检测图像中的所述目标进行定位识别。
在具体实施中,对于待检测分类的图像,首先使用训练好的目标检测模型对其进行目标检测,即确定待检测图像中前景目标图像的位置,将其与背景区分开。
S23:使用训练好的所述度量学习模型对已定位识别的所述目标进行度量空间的映射,生成目标embedding。
在具体实施中,步骤S22已经完成了前景目标图像的位置识别,再使用已训练好的度量学习模型,对该待检测图像中的前景目标图像进行度量空间的映射,生成目标图像的embedding,以便进行后续的相似度计算。
S24:将所述目标embedding与所述素材embedding进行比较,计算相似度,并得到所述目标的类别。
在具体实施中,步骤S21和步骤S23已分别得到了素材库的embedding和待检测图像中目标图像的embedding,以素材库的embedding为基准,将目标图像的embedding与素材库的embedding进行对比,计算相似度。
可选的,可在素材库中找到与目标图像最相似的前五个类别,进行投票,选出投票数最多的类别作为此目标图像的类别。
本申请实施例所提供的图像分类方法可进行主动学习自迭代,请继续参见图1:
S3:使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。
可选的,所述预设条件为使用不确定指标筛选出的最不确定样本。
在具体实施中,加入新的数据进行迭代的时候,使用主动学习筛选出最能提高模型性能的样本进行标注,在具体实施中,使用不确定指标筛选出最不确定样本作为标注对象。
可选的,图4为图1中步骤S3的分步骤流程图,请参见图4:
S31:使用训练好的所述目标检测模型和所述度量学习模型,对所述待检测图像进行目标检测评分和度量评分。
在具体实施中,当执行步骤S2时,可使用训练好的所述目标检测模型和所述度量学习模型,对待检测图像进行评分;其中,使用目标检测模型进行目标检测评分,使用度量学习模型进行度量评分。
S32:根据所述目标检测评分和所述度量评分结果从所述待检测图像中筛选出再训练样本。
可选的,将所述目标检测评分低于一定阈值、所述度量评分高于一定阈值的所述待检测图像作为所述再训练样本,并将其直接再输入至所述目标检测模型和所述度量学习模型中进行再训练。
在具体实施中,对于目标检测评分较低、度量评分较高的,符合不确定样本的范围,将其作为再训练样本;在这里,高度量评分很大程度上意味着目标对象为素材库中的一种类别,所以,在具体实施中,不需要进行人工检查,直接将这部分再训练样本作为目标检测模型的再训练数据。
在具体实施中,目标检测的评分比较低,度量的评分比较高,这部分往往是比较复杂的场景,所以目标检测模型的置信度比较低,度量学习模型能够帮助把这部分难样本挖掘出来,放入目标检测模型的训练样本中,从而增强目标检测模型的鲁棒性。
可选的,将所述目标检测评分高于一定阈值、所述度量评分低于一定阈值的所述待检测图像作为所述再训练样本,并对其进行再标注后,再输入至所述目标检测模型和所述度量学习模型中进行再训练。
在具体实施中,对于目标检测评分较高、度量评分较低的,符合不确定样本的范围,将其作为再训练样本;在这里,低度量评分意味着样本分类错误概率比较大,所以,在具体实施中,这里需要较多的人工检查,对这部分不确定样本再标注,之后再将这部分再训练样本作为目标检测模型的再训练数据。
在具体实施中,该种样本属于非常难的负样本,所以目标检测模型给予了比较高的置信度,但是度量评分比较低,这部分数据需要进行人工再标注,再放入度量学习模型的训练样本中,使得下次度量学习模型更好的排除负样本,鲁棒性也就更高。
通过不断的主动学习、不断地自迭代,本申请实施例提供的图像分类方法的识别效果会更好。
本申请提供一具体实施例对上述方法进行具体说明:
本具体实施例应用场景为商标的识别分类,现有的可作为样本的图像包括带有商标的图像。
首先进行人工标注,对图像中的商标进行标注,类别统一标注为“商标”,而不进行具体区分,随后进行目标检测模型的训练;可选的,将商标以外的区域标注为“背景”。
随后,将图像中的标注为商标的标注框单独截取出来,并区分商标的具体名称,得到分类别的只包含商标的图像,再进行度量学习模型的训练。
将单独截取出的只包含商标的图像作为素材库,使用训练好的所述度量学习模型对所述素材库进行度量空间的映射,生成素材embedding。
将待检测的图像输入至目标检测模型中,使用训练好的所述目标检测模型对所述待检测图像中的商标进行定位识别,识别是否包含商标、及商标所在的位置。
使用训练好的所述度量学习模型对已定位识别的商标进行度量空间的映射,生成目标embedding。
将所述目标embedding与所述素材embedding进行比较,计算相似度,并得到商标的类别,即商标的名称。
在主动学习自迭代中,使用训练好的所述目标检测模型和所述度量学习模型,对所述待检测图像进行目标检测评分和度量评分。
当素材库中的商标均为标准方向和标准角度时,若待检测的图像中包含素材库中的商标、但所包含的商标存在角度倾斜的情况,则评分出现目标检测分值较低、度量分值较高的情况,直接将这部分的样本加入到目标检测模型的训练数据中去。
当待检测的图像中包含的前景内容非素材库中的商标,但有一定相似度,且商标在图像中的位置、角度等与素材库中图像相似度较高,则评分会出现目标检测评分较高、度量评分较低的情况,对这部分不确定样本再标注,之后再将这部分再训练样本作为目标检测模型的再训练数据。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例提供了一种主动学习自迭代的图像分类系统,适用于上述的一种主动学习自迭代的图像分类方法。如以下所使用的,术语“单元”、“模块”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件、或者软件和硬件的组合的实现也是可能并被构想的。
图5为根据本发明的主动学习自迭代的图像分类系统的框架图,请参见图5,包括:
模型训练单元1,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练。
可选的,模型训练单元1还包括:
目标检测训练模块11,将所述训练样本的所述目标的类别设置为同一类别,并将所述训练样本输入至所述目标检测模型中,对所述目标检测模型进行训练;
度量学习训练模块12,将所述训练样本的所述目标的图像单独截取,区分所述目标的类别,并将单独截取出的所述目标的图像输入至所述度量学习模型中,对所述度量学习模型进行训练。
推理计算单元2,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
可选的,推理计算单元2还包括:
素材库映射模块21,将单独截取出的所述训练样本的所述目标的图像作为素材库,使用训练好的所述度量学习模型对所述素材库进行度量空间的映射,生成素材embedding;
目标检测模块22,使用训练好的所述目标检测模型对所述待检测图像中的所述目标进行定位识别;
目标映射模块23,使用训练好的所述度量学习模型对已定位识别的所述目标进行度量空间的映射,生成目标embedding;
相似度计算模块24,将所述目标embedding与所述素材embedding进行比较,计算相似度,并得到所述目标的类别。
主动学习单元3:使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。可选的,所述预设条件为使用不确定指标筛选出的最不确定样本。
可选的,所述主动学习单元3包括:
模型评分模块31,使用训练好的所述目标检测模型和所述度量学习模型,对所述待检测图像进行目标检测评分和度量评分;
样本筛选模块32,根据所述目标检测评分和所述度量评分结果从所述待检测图像中筛选出再训练样本。
可选的,所述样本筛选模块32还包括:将所述目标检测评分低于一定阈值、所述度量评分高于一定阈值的所述待检测图像作为所述再训练样本,并将其直接再输入至所述目标检测模型和所述度量学习模型中进行再训练。
可选的,所述样本筛选模块32还包括:将所述目标检测评分高于一定阈值、所述度量评分低于一定阈值的所述待检测图像作为所述再训练样本,并对其进行再标注后,再输入至所述目标检测模型和所述度量学习模型中进行再训练。
本系统所适用的上述的一种主动学习自迭代的图像分类方法,已在前文进行详细说明,此处不再赘述。
另外,结合图1、图2、图3、图4描述的一种主动学习自迭代的图像分类方法可以由电子设备来实现。图6为本发明实施例提供的的一电子设备的框架图。
电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。
具体地,上述处理器61可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器62可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器62可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器62可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器62可在数据处理装置的内部或外部。在特定实施例中,存储器62是非易失性(Non-Volatile)存储器。在特定实施例中,存储器62包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器61所执行的可能的计算机程序指令。
处理器61通过读取并执行存储器62中存储的计算机程序指令,以实现上述实施例中的任意一种主动学习自迭代的图像分类方法。
在其中一些实施例中,电子设备还可包括通信接口63和总线60。其中,如图6所示,处理器61、存储器62、通信接口63通过总线60连接并完成相互间的通信。
通信端口63可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线60包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线60包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线60可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线60可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的一种主动学习自迭代的图像分类方法。
另外,结合上述实施例中的一种主动学习自迭代的图像分类方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种主动学习自迭代的图像分类方法。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ReadOnly Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种主动学习自迭代的图像分类方法,其特征在于,包括:
模型训练步骤,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练;
推理计算步骤,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
2.如权利要求1所述的主动学习自迭代的图像分类方法,其特征在于,所述模型训练步骤包括:
目标检测训练步骤,将所述训练样本的所述目标的类别设置为同一类别,并将所述训练样本输入至所述目标检测模型中,对所述目标检测模型进行训练;
度量学习训练步骤,将所述训练样本的所述目标的图像单独截取,区分所述目标的类别,并将单独截取出的所述目标的图像输入至所述度量学习模型中,对所述度量学习模型进行训练。
3.如权利要求2所述的主动学习自迭代的图像分类方法,其特征在于,所述推理计算步骤包括:
素材库映射步骤,将单独截取出的所述训练样本的所述目标的图像作为素材库,使用训练好的所述度量学习模型对所述素材库进行度量空间的映射,生成素材embedding;
目标检测步骤,使用训练好的所述目标检测模型对所述待检测图像中的所述目标进行定位识别;
目标映射步骤,使用训练好的所述度量学习模型对已定位识别的所述目标进行度量空间的映射,生成目标embedding;
相似度计算步骤,将所述目标embedding与所述素材embedding进行比较,计算相似度,并得到所述目标的类别。
4.如权利要求1所述的主动学习自迭代的图像分类方法,其特征在于,所述方法还包括一主动学习步骤:
使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。
5.如权利要求4所述的主动学习自迭代的图像分类方法,其特征在于,所述预设条件为使用不确定指标筛选出的最不确定样本。
6.如权利要求5所述的主动学习自迭代的图像分类方法,其特征在于,所述主动学习步骤包括:
模型评分步骤,使用训练好的所述目标检测模型和所述度量学习模型,对所述待检测图像进行目标检测评分和度量评分;
样本筛选步骤,根据所述目标检测评分和所述度量评分结果从所述待检测图像中筛选出再训练样本。
7.如权利要求6所述的主动学习自迭代的图像分类方法,其特征在于,所述样本筛选步骤还包括:
将所述目标检测评分低于一定阈值、所述度量评分高于一定阈值的所述待检测图像作为所述再训练样本,并将其直接再输入至所述目标检测模型和所述度量学习模型中进行再训练。
8.如权利要求6所述的主动学习自迭代的图像分类方法,其特征在于,所述样本筛选步骤还包括:
将所述目标检测评分高于一定阈值、所述度量评分低于一定阈值的所述待检测图像作为所述再训练样本,并对其进行再标注后,再输入至所述目标检测模型和所述度量学习模型中进行再训练。
9.一种主动学习自迭代的图像分类系统,其特征在于,包括:
模型训练单元,在训练样本中对目标进行类别的人工标注,并将已进行人工标注的所述训练样本输入至一目标检测模型和一度量学习模型中,对所述目标检测模型和所述度量学习模型进行训练;
推理计算单元,使用训练好的所述目标检测模型和所述度量学习模型对一待检测图像中的所述目标进行识别分类。
10.如权利要求9所述的主动学习自迭代的图像分类系统,其特征在于,所述系统还包括一主动学习单元:
使用训练好的所述目标检测模型和所述度量学习模型,根据一预设条件从所述待检测图像中筛选出再训练样本,并将所述再训练样本再输入至所述目标检测模型和所述度量学习模型中,对所述目标检测模型和所述度量学习模型进行再训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011517586.0A CN112560971A (zh) | 2020-12-21 | 2020-12-21 | 一种主动学习自迭代的图像分类方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011517586.0A CN112560971A (zh) | 2020-12-21 | 2020-12-21 | 一种主动学习自迭代的图像分类方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560971A true CN112560971A (zh) | 2021-03-26 |
Family
ID=75031193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011517586.0A Pending CN112560971A (zh) | 2020-12-21 | 2020-12-21 | 一种主动学习自迭代的图像分类方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560971A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113221875A (zh) * | 2021-07-08 | 2021-08-06 | 北京文安智能技术股份有限公司 | 基于主动学习的目标检测模型训练方法 |
CN114155412A (zh) * | 2022-02-09 | 2022-03-08 | 北京阿丘科技有限公司 | 深度学习模型迭代方法、装置、设备及存储介质 |
CN114707015A (zh) * | 2022-03-14 | 2022-07-05 | 同盾科技有限公司 | 一种商标标注方法、装置、电子设备以及存储介质 |
TWI812946B (zh) * | 2021-05-04 | 2023-08-21 | 世界先進積體電路股份有限公司 | 影像辨識模型系統及維護方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680193A (zh) * | 2015-02-11 | 2015-06-03 | 上海交通大学 | 基于快速相似性网络融合算法的在线目标分类方法与系统 |
CN106203242A (zh) * | 2015-05-07 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种相似图像识别方法及设备 |
CN106326868A (zh) * | 2016-08-26 | 2017-01-11 | 江苏华通晟云科技有限公司 | 基于余弦相似度度量学习的人脸识别方法 |
CN110473130A (zh) * | 2019-07-30 | 2019-11-19 | 五邑大学 | 一种基于深度学习的垃圾分类评价方法、装置和存储介质 |
CN110879989A (zh) * | 2019-11-22 | 2020-03-13 | 四川九洲电器集团有限责任公司 | 基于小样本机器学习模型的ads-b信号目标识别方法 |
CN111582337A (zh) * | 2020-04-24 | 2020-08-25 | 东南大学 | 基于小样本细粒度图像分析的草莓畸形状态检测方法 |
CN111652219A (zh) * | 2020-06-03 | 2020-09-11 | 有米科技股份有限公司 | 一种图文标识检测识别方法、装置、服务器及存储介质 |
-
2020
- 2020-12-21 CN CN202011517586.0A patent/CN112560971A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104680193A (zh) * | 2015-02-11 | 2015-06-03 | 上海交通大学 | 基于快速相似性网络融合算法的在线目标分类方法与系统 |
CN106203242A (zh) * | 2015-05-07 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 一种相似图像识别方法及设备 |
CN106326868A (zh) * | 2016-08-26 | 2017-01-11 | 江苏华通晟云科技有限公司 | 基于余弦相似度度量学习的人脸识别方法 |
CN110473130A (zh) * | 2019-07-30 | 2019-11-19 | 五邑大学 | 一种基于深度学习的垃圾分类评价方法、装置和存储介质 |
CN110879989A (zh) * | 2019-11-22 | 2020-03-13 | 四川九洲电器集团有限责任公司 | 基于小样本机器学习模型的ads-b信号目标识别方法 |
CN111582337A (zh) * | 2020-04-24 | 2020-08-25 | 东南大学 | 基于小样本细粒度图像分析的草莓畸形状态检测方法 |
CN111652219A (zh) * | 2020-06-03 | 2020-09-11 | 有米科技股份有限公司 | 一种图文标识检测识别方法、装置、服务器及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI812946B (zh) * | 2021-05-04 | 2023-08-21 | 世界先進積體電路股份有限公司 | 影像辨識模型系統及維護方法 |
CN113221875A (zh) * | 2021-07-08 | 2021-08-06 | 北京文安智能技术股份有限公司 | 基于主动学习的目标检测模型训练方法 |
CN113221875B (zh) * | 2021-07-08 | 2021-09-21 | 北京文安智能技术股份有限公司 | 基于主动学习的目标检测模型训练方法 |
CN114155412A (zh) * | 2022-02-09 | 2022-03-08 | 北京阿丘科技有限公司 | 深度学习模型迭代方法、装置、设备及存储介质 |
CN114707015A (zh) * | 2022-03-14 | 2022-07-05 | 同盾科技有限公司 | 一种商标标注方法、装置、电子设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560971A (zh) | 一种主动学习自迭代的图像分类方法和系统 | |
CN106446816B (zh) | 人脸识别方法及装置 | |
CN111078908B (zh) | 一种数据标注的检测方法和装置 | |
CN107330027B (zh) | 一种弱监督的深度台标检测方法 | |
CN111753290B (zh) | 软件类型的检测方法及相关设备 | |
CN110909784B (zh) | 一种图像识别模型的训练方法、装置及电子设备 | |
WO2016015621A1 (zh) | 人脸图片人名识别方法和系统 | |
CN104881675A (zh) | 一种视频场景的识别方法和装置 | |
CN111583180B (zh) | 一种图像的篡改识别方法、装置、计算机设备及存储介质 | |
CN113221918B (zh) | 目标检测方法、目标检测模型的训练方法及装置 | |
CN111950566A (zh) | 一种旋转不变的hog红外图像电力设备识别方法 | |
CN111338692A (zh) | 基于漏洞代码的漏洞分类方法、装置及电子设备 | |
CN111258905B (zh) | 缺陷定位方法、装置和电子设备及计算机可读存储介质 | |
CN115631494A (zh) | 财务数据处理方法、系统、电子设备及存储介质 | |
CN114511857A (zh) | 一种ocr识别结果处理方法、装置、设备及存储介质 | |
CN111738173A (zh) | 视频片段检测方法、装置、电子设备及存储介质 | |
CN111507420A (zh) | 轮胎信息获取方法、装置、计算机设备和存储介质 | |
CN111738290A (zh) | 图像检测方法、模型构建和训练方法、装置、设备和介质 | |
CN113657378B (zh) | 车辆跟踪方法、车辆跟踪系统和计算设备 | |
CN115359302A (zh) | 硬币识别方法、系统及存储介质 | |
CN111539576B (zh) | 一种风险识别模型的优化方法及装置 | |
CN111754505B (zh) | 辅料检测方法、装置、电子设备及存储介质 | |
CN114743048A (zh) | 检测异常秸秆图片的方法和检测装置 | |
CN113139379B (zh) | 信息识别方法和系统 | |
CN114187625A (zh) | 一种基于视频源自动探测技术的视频检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |