CN113392887A - 图片识别方法、装置、电子设备及存储介质 - Google Patents
图片识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113392887A CN113392887A CN202110605499.9A CN202110605499A CN113392887A CN 113392887 A CN113392887 A CN 113392887A CN 202110605499 A CN202110605499 A CN 202110605499A CN 113392887 A CN113392887 A CN 113392887A
- Authority
- CN
- China
- Prior art keywords
- network
- recognition
- picture
- model
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 120
- 230000002159 abnormal effect Effects 0.000 claims abstract description 68
- 238000012549 training Methods 0.000 claims description 220
- 238000004590 computer program Methods 0.000 claims description 12
- 230000005856 abnormality Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 25
- 238000001514 detection method Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000002372 labelling Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本公开公开了一种图片识别方法、装置、电子设备及存储介质,方法包括:获取待识别图片;将待识别图片输入至图片识别模型的特征提取网络中,通过特征提取网络提取多尺度特征;将多尺度特征输入至全局识别网络中识别待识别图片的第一类型信息,和/或,将多尺度特征输入至局部识别网络中识别待识别图片的第二类型信息,第一类型信息用于指示待识别图片的全局图像是否异常,第二类型信息用于:指示待识别图片的局部图像是否异常;在第一类型信息指示异常和/或第二类型信息指示异常的情况下,确定待识别图片为异常图片。采用本公开提供的图片识别方法、装置、电子设备及存储介质,至少解决现有图片识别过程中存在效率低的问题。
Description
技术领域
本公开涉及图片识别技术领域,具体涉及一种图片识别方法、装置、电子设备及存储介质。
背景技术
随着互联网和无线通信技术的飞速发展,人们之间进行信息共享的方式越来越丰富。图片分享作为一种新兴的信息分享功能,可以实现用户通过图片(如照片或者拍摄的视频中的帧图片等)向他人展现自己生活的点点滴滴,提升用户分享信息的便捷性及趣味性。
目前,伴随着图片分享的迅速推广,人们传播的图片也越来越多,需要对每一图片的图片类型进行分类,以便于对图片的管理,例如,可以将存在违法、违背社会公德或者低俗等内容的图片归类为低俗图片,以便防止低俗图片的传播。但是,目前对于图片所属的图片类型的识别通常是由人工进行标注,工作强度大,从而导致图片识别的效率低下。可见,目前的图片识别过程中存在效率低的问题。
发明内容
本公开实施例的目的是提供一种图片识别方法、装置、电子设备及存储介质,以解决目前的图片识别过程中存在效率低的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图片识别方法,包括:
获取待识别图片;
将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
在其中一个实施例中,所述获取待识别图片,并将所述待识别图片输入至图片识别模型中之前,还包括:
获取训练样本集;
将所述训练样本集的图片样本输入至包括所述特征提取网络、所述全局识别网络和所述局部识别网络的待训练识别模型中,计算所述全局识别网络和所述局部识别网络的第一加权损失;
在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型,包括:
在所述待训练识别模型的特征提取网络的参数为固定状态的情况下,若所述第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新所述待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,其中,所述迭代次数为更新所述待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
在所述第一加权损失未满足所述预设条件且所述迭代次数达到所述预设次数的情况下,设置所述特征提取网络的参数为可更新状态,并更新所述待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述训练样本集包括至少一个第一图片样本以及至少一个第二图片样本,且所述第一图片样本与所述全局识别网络对应,所述第二图片样本与所述局部识别网络对应;
所述获取待识别图片,并将所述待识别图片输入至图片识别模型中之前,还包括:
在所述待训练识别模型中第一识别网络的参数为固定状态的情况下,将所述训练样本集中与第二识别网络对应的图片样本输入至所述第二识别网络中,计算得到所述第二识别网络的损失,其中,所述第一识别网络为所述全局识别网络和所述局部识别网络中的任一识别网络,所述第二识别网络为所述全局识别网络和所述局部识别网络中除所述第一识别网络之外的识别网络;
在所述第二识别网络的损失未达到预设条件的情况下,更新所述待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将所述训练样本集中与所述第二识别网络对应的图片样本输入至所述第二识别网络中;
在所述第二识别网络的损失达到所述预设条件的情况下,设置所述第一识别网络的参数为更新状态以及所述第二识别网络的参数为固定状态,并将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,计算得到所述第一识别网络的损失;
在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型,包括:
所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中;
在所述第一识别网络的损失满足所述预设条件的情况下,设置所述第二识别网络的参数为更新状态,并更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为所述待训练识别模型;
将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,计算得到所述第一识别网络和所述第二识别网络的第二加权损失;
在所述第二加权损失未满足所述预设条件的情况下,更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为所述待训练识别模型,重新执行将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,直至所述第二加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述获取训练样本集,包括:
获取第一样本集和第二样本集,其中,所述第一样本集包括标注的图片样本,所述第二样本集包括未标注的图片样本;
将所述第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,所述M为正整数;
将所述第二样本集中图片样本输入至所述第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至所述第一样本集中;
在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M-1个识别模型,并重新执行将所述第一样本集输入至第M-1个识别模型中;
在所述M个识别模型满足训练停止条件的情况下,将所述第一样本集作为所述训练样本集。
根据本公开实施例的第二方面,提供一种图片识别装置,包括:
图片获取模块,被配置为获取待识别图片;
多尺度特征提取模块,被配置为将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
识别模块,被配置为将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
异常图片确定模块,被配置为在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
在其中一个实施例中,所述装置,还包括:
训练集获取模块,被配置为获取训练样本集;
加权损失计算模块,被配置为将所述训练样本集的图片样本输入至包括所述特征提取网络、所述全局识别网络和所述局部识别网络的待训练识别模型中,计算所述全局识别网络和所述局部识别网络的第一加权损失;
第一训练模块,被配置为在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述第一训练模块,包括:
第一参数更新单元,被配置为在所述待训练识别模型的特征提取网络的参数为固定状态的情况下,若所述第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新所述待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,其中,所述迭代次数为更新所述待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
第二参数更新单元,被配置为在所述第一加权损失未满足所述预设条件且所述迭代次数达到所述预设次数的情况下,设置所述特征提取网络的参数为可更新状态,并更新所述待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述训练样本集包括至少一个第一图片样本以及至少一个第二图片样本,且所述第一图片样本与所述全局识别网络对应,所述第二图片样本与所述局部识别网络对应;
所述装置,还包括:
第一损失计算模块,被配置为在所述待训练识别模型中第一识别网络的参数为固定状态的情况下,将所述训练样本集中与第二识别网络对应的图片样本输入至所述第二识别网络中,计算得到所述第二识别网络的损失,其中,所述第一识别网络为所述全局识别网络和所述局部识别网络中的任一识别网络,所述第二识别网络为所述全局识别网络和所述局部识别网络中除所述第一识别网络之外的识别网络;
第一参数模块,被配置为在所述第二识别网络的损失未达到预设条件的情况下,更新所述待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将所述训练样本集中与所述第二识别网络对应的图片样本输入至所述第二识别网络中;
第二损失计算模块,被配置为在所述第二识别网络的损失达到所述预设条件的情况下,设置所述第一识别网络的参数为更新状态以及所述第二识别网络的参数为固定状态,并将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,计算得到所述第一识别网络的损失;
第二参数更新模块,被配置为在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述第二参数更新模块,包括:
第三参数更新单元,被配置为所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中;
第四参数更新单元,被配置为在所述第一识别网络的损失满足所述预设条件的情况下,设置所述第二识别网络的参数为更新状态,并更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为所述待训练识别模型;
加权损失计算单元,被配置为将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,计算得到所述第一识别网络和所述第二识别网络的第二加权损失;
第五参数更新单元,被配置为在所述第二加权损失未满足所述预设条件的情况下,更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为所述待训练识别模型,重新执行将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,直至所述第二加权损失满足所述预设条件,得到所述图片识别模型。
在其中一个实施例中,所述训练集获取模块,包括:
样本集获取单元,被配置为获取第一样本集和第二样本集,其中,所述第一样本集包括标注的图片样本,所述第二样本集包括未标注的图片样本;
训练单元,被配置为将所述第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,所述M为正整数;
标注单元单元,被配置为将所述第二样本集中图片样本输入至所述第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至所述第一样本集中;
训练重置单元,被配置为在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M-1个识别模型,并重新执行将所述第一样本集输入至第M-1个识别模型中;
样本集输出单元,被配置为在所述M个识别模型满足训练停止条件的情况下,将所述第一样本集作为所述训练样本集。
根据本公开实施例的第三方面,提供一种电子设备,该电子设备可以包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面的任一项实施例中所示的图片识别方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由图片识别装置或者电子设备的处理器执行时,以使图片识别装置或者电子设备实现以实现如第一方面的任一项实施例中所示的图片识别方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序或者指令,所述计算机程序或者指令被处理器执行时实现如第一方面的任一项实施例中所示的图片识别方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过将待识别图片输入至图片识别模型的特征提取网络提取多尺度特征,并将提取到的多尺度特征输入至图片识别模型的局识别网络和局部识别网络中的至少一个识别网络中,通过该至少一个识别网络分别实现待识别图片是否为异常图片。如此,通过本申请实施例的图片识别方法,在图片的识别过程中,可以在无需人工标注的情况下实现待识别图片的图片类型的识别,降低图片识别的工作量,从而提升图片识别的效率;另外,还可以实现分别从整体和局部上对待识别图片进行识别,使得图片识别更灵活且便捷。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限值本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图片识别方法的流程示意图;
图2是根据一示例性实施例示出的图片识别模型识别图片类型的示意图;
图3是根据一示例性实施例示出的训练图片识别模型的示意图;
图4是根据一示例性实施例示出的一种图片识别装置的结构框图;
图5是根据一示例性实施例示出的一种计算设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
请参见图1,是根据一示例性实施例示出的一种图片识别方法的流程示意图。该图片识别方法应用于电子设备,例如计算机终端、或电子设备,为方便理解,本方案以电子设备为例进行说明。如图1所示,上述图片识别方法包括如下步骤101-104。
步骤101、获取待识别图片。
本申请一实施例中,电子设备获取上述待识别图片,可以是电子设备中预先存储有上述待识别图片,电子设备从存储区中提取该待识别图片;或者,也可以是用户终端(User Equipment,UE)将上传图片至电子设备,电子设备接收到上传的图片并作为上述待识别图片。
需要说明的是,上述待识别图片可以是用户终端拍摄的照片,或者,也可以是拍摄的视频中的视频帧,在此并不进行限定。
步骤102、将待识别图片输入至图片识别模型的特征提取网络中,通过特征提取网络提取多尺度特征,其中,图片识别模型包括特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且全局识别网络用于基于图片的全局图像特征进行图片类型识别,局部识别网络用于基于图片的局部图像特征进行图片类型识别,多尺度特征包括待识别图片的全局图像特征以及局部图像特征。
本申请一实施例中,上述图片识别模型预先设置于电子设备中,该图片识别模型包括上述特征提取网络,且该特征提取网络其可以是任意的能够实现提取图片的多尺度特征的模型。例如,如图2所示,上述特征提取网络为共享骨干网络(Backbone),且该共享骨干网络可以采用大迁移(big transfer)网络、残差神经网络(resNet)以及卷积神经网络GoogLeNet等网络中的任意一个网络;或者,上述特征提取网络也可以是最优(State OfThe Art,SOTA)模型,等等。
其中,上述多尺度特征包括图像的全局图像特征和局部图像特征,该全局图像特征是指以图片的全部图像区域作为整体提取到的图像特征,而局部图像特征是指以图片的部分图像区域为整体提取得到的图像特征。
例如,在包括人物图像的图片中上局部图像特征可以是以人物图像中胸部、臀部或者三角区等人体部位所在的图像区域提取的特征;而上述全局图像特征是以上述人物图像的全部图像区域提取的特征。
本申请一实施例中,上述图片识别模型还包括全局识别网络和局部识别网络,上述全局识别网络用于基于上述特征提取网络提取到的多尺度特征中的全局图像特征进行图片类型识别,上述局部识别网络用于基于上述特征提取网络提取到的多尺度特征中的局部图像特征进行图片类型识别。
其中,上述全局识别网络可以是任意的能够基于图片的全局图像特征识别图片类型(即识别图片是否异常)的识别网络,该图片类型包括图片正常或者异常。例如,上述全局识别网络可以是如图2所示的分类分支网络,该分类分支网络可以包括设置有注意力(Attention)机制的深度神经网络(Deep Neural Networks,DNN),且该分类分支网络可以从图片的全局图像特征上识别图片为正常图片或者低俗图片(即异常的图片)。
另外,上述局部识别网络可以是任意的能够基于图片的局部图像特征识别图片类型(即识别图片是否异常),该图片类型包括局部图像特征所对应的局部图像是否异常。例如,上述局部识别网络可以是如图2所示的目标检测分支网络,该目标检测分支网络可以包括EfficientDet网络和基于单个神经网络的目标检测(You Only Look Once:Unified,Real-Time Object Detection,Yolo)系列网络等,且该目标检测分支网络可以从图片的局部图像上进行图片类型识别,具体地,可以是根据人物图片中的臀部的图像区域的图像识别臀部、胸部或者三角区的图像是否裸露(即裸露时为异常,而未裸露时为正常)。
本申请一实施例中,上述图片识别模型为预先设定于电子设备中的识别模型,具体地,可以是通过训练样本集对待训练识别模型进行训练,得到上述图片识别模型。
其中,上述通过训练样本集对待训练识别模型进行训练的过程可以为:
通过训练样本集训练得到用于识别图片的全局图像是否异常的全局图像识别模型,即将训练样本集中的图片样本输入至待训练的全局图像识别模型中,通过损失函数计算待训练的全局图像识别模型的输出结果与图片样本的标注结果之间的损失,并在损失未达到预设条件的情况下,更新待训练的全局图像识别模型的网络参数,并将更新参数后的模型作为上述待训练的全局图像识别模型,重新执行将训练样本集中的图片样本输入至待训练的全局图像识别模型,并执行训练过程,直至损失达到预设条件,该预设条件可以是小于或者等于预设损失等;
通过训练样本集训练得到用于识别图片的局部图像是否异常的局部图像识别模型,即将训练样本集中的图片样本输入至待训练的局部图像识别模型中,通过损失函数计算待训练的局部图像识别模型的输出结果与图片样本的标注结果之间的损失,并在损失未达到预设条件的情况下,更新待训练的局部图像识别模型的网络参数,并将更新参数后的模型作为上述待训练的局部图像识别模型,重新执行将训练样本集中的图片样本输入至待训练的局部图像识别模型,并执行训练过程,直至损失达到预设条件;
通过将训练样本集中图像样本的全局图像特征输入至全局图像识别模型和待训练识别模型中的全局识别网络中,计算全局图像识别模型的输出结果和全局识别网络的输出结果之间的第一损失;以及,将图像样本的局部图像特征输入至局部图像识别模型和待训练识别模型中的局部识别网络中,计算局部图像识别模型的输出结果和局部识别网络的输出结果之间的第二损失;在第一损失和第二损失的加权损失未满足预设条件(如加权损失小于或者等于预设损失等)时,更新特征提取网络、全局识别网络和局部识别网络的参数,直至加权损失满足预设条件,停止参数更新,得到上述图片识别模型。
或者,上述步骤102之前,还可以包括:
获取训练样本集;
将训练样本集的图片样本输入至包括特征提取网络、全局识别网络和局部识别网络的待训练识别模型中,计算全局识别网络和局部识别网络的第一加权损失;
在第一加权损失未满足预设条件的情况下,更新待训练识别模型中各网络的参数,并将网络参数更新后模型作为待训练识别模型,重新执行将训练样本集的图片样本输入至待训练识别模型,直至第一加权损失满足预设条件,得到图片识别模型。
基于此,通过训练样本集对包括特征提取网络、全局识别网络和局部识别网络的待训练识别模型进行训练,并在训练过程中通过全局识别网络和局部识别网络的加权损失更新待训练模型中各网络的参数,从而不仅可以提升在图片识别模型的识别精度,还可以降低模型训练的复杂度,进而加快模型训练的效率。
本申请一实施例中,上述训练样本集可以是包括标注有图片类型的标签的至少一个图片样本,且该至少一个图片样本中既包括标签为全局图像是否异常的图片样本,也包括标签为局部图像是否异常的图片样本。
其中,上述获取训练样本集,可以是获取历史中已标注图片类型的标签的图片作为训练样本集中的图片样本,同时为保证样本覆盖的全面性,训练样本集中所有图片所具有的图片类型的标签,可以包括全局图像是否异常的标签以及局部图像是否异常的标签。
例如,可以是根据历史审核记录或者用户投诉举报的记录,从视频和图片资源中抽取一批疑似低俗的图片或者视频帧,以及,从视频和图片资源中抽取一批正常的图片或者视频帧,通过抽取的图片和视频帧;再通过设定标注标准,对抽取出来的每一图片和视频帧进行标注,即为各图片和视频帧添加图片为正常或者异常的标签,以及框选异常的图片和视频帧的异常区域(如胸部、臀部以及三角区等敏感部位),即框选出异常区域并标注该异常区域异常的标签,如露胸、露臀或者露三角区等。
或者,上述获取训练样本集,可以包括:
获取第一样本集和第二样本集,其中,第一样本集包括标注的图片样本,第二样本集包括未标注的图片样本;
将第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,M为正整数;
将第二样本集中图片样本输入至第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至第一样本集中;
在M个识别模型不满足训练停止条件的情况下,将第M个识别模型作为第M-1个识别模型,并重新执行将第一样本集输入至第M-1个识别模型中;
在M个识别模型满足训练停止条件的情况下,将第一样本集作为训练样本集。
基于此,在对识别模型的训练过程中,通过包括标注的图片样本的第一样本集对待训练的识别模型进行训练,并通过训练得到的识别模型对未标注的图片样本进行标注,且将标注后的样本加入至第一样本集中,直至在训练得到的识别模型满足训练停止条件下,将第一样本集中作为上述训练样本集,实现以半监督的方式获取训练样本集,从而可以降低获取训练样本集的工作量,提升获取训练样本集的效率。
其中,上述第一样本集可以包括标注有图片类型(包括局部图像是否异常和全局图像是否异常)的标签的至少一个图片样本,上述第二样本集可以包括未标注有上述标签的至少一个图片样本。
另外,上述识别模型可以是任意的能够实现识别图片的图片类型的模型,且该识别模型的网结构与上述图片识别模型的网络结构可以不同;或者,该识别模型的网结构与上述图片识别模型的网络结构也可以相同,即上述识别模型可以是包括特征提取网络、全局识别网络和局部识别网络的模型,从而可以实现对第二样本集中的样本标注全局图像是否异常以及局部图像是否异常的标签,使更新后的第一样本集覆盖更全面。
本申请实施例中,上述将第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,可以是将第一样本集的图片样本输入至第M-1次训练中的待训练识别模型(即第M-1个识别模型)中,该待训练识别模型输出识别结果;通过预设的损失函数计算识别结果与图片样本中标签的标记结果之间的损失;判断计算得到的损失是否达到预设条件,若计算得到的损失未达到预设条件,则对识别模型中的网络参数进行更新,并得到第M个识别模型,且第M个识别模型不满足训练停止条件。
其中,上述判断计算得到的损失是否达到预设条件,可以是判断计算得到的损失与上一次训练中计算得到的损失的差值是否小于或者等于预设差值(如趋向于不变),或者,也可以是判断计算得到的损失是否小于或者等于预设损失,等等。
另外,上述对识别模型中的网络参数进行更新,可以是根据预设的网络参数更新方法对识别模型的网络参数进行调整,如梯度下降法等。
需要说明的是,在训练得到上述第M个识别模型之后,电子设备可以将第二样本集中未标注的样本输入至第M个识别模型中,得到通过机器标注的图片样本,并将标注的样本加入至第一样本集中,实现对第一样本集中图片样本的增加,如此,在训练停止之前,不断通过训练得到识别模型对未标注样本进行标注并更新第一样本集,直至上述训练满足停止条件,将更新得到的第一样本集作为训练样本集。
示例性地,如图3所示,通过半监督方式获取训练样本集的过程可以包括:
上述初始的识别模型包括上述目标检测分支网络和分类分支网络,电子设备通过由已标注的异常的图片或者视频帧以及正常的图片或者视频帧形成的训练样本集,将训练样本集输入初始的识别模型,并训练初始的识别模型,得到老师(teacher)模型;
通过teacher模型对未标注的数据进行标注,即通过分类分支网络进行类别标注以及通过目标检测分支网络标注敏感部位的并打框,将电子设备标注的数据和一部分具有噪声的数据加入至训练样本集中,更新训练样本集;
将更新扩充后的训练样本集的样本输入至teacher模型的分类分支网络和目标检测分支网络,判断teacher模型中分类分支网络和目标检测分支网络的加权损失是否达到预设条件(如加权损失是否小于或者等于预设损失等),若teacher模型的加权损失未达到预设条件,更新teacher模型的网络参数,得到student(学生)模型,并将student模型作为teacher模型,返回执行更新通过teacher模型对未标注的数据进行标注的步骤,直至teacher模型的加权损失达到预设条件,停止训练,并得到最终的训练样本集。
本申请一个实施例中,计算全局识别网络和局部识别网络的第一加权损失的过程为:图片识别模型中分别预先配置有全局识别网络和局部识别网络的权重,在训练过程中,待训练识别模型的全局识别网络输出全局识别结果以及局部识别网络输出局部识别结果,全局识别网络将其全局识别结果与图片样本标注的全局图像是否异常的标签进行比较,计算得到全局识别网络的全局损失;局部识别网络将其局部识别结果与图片样本标注的局部图像是否异常的标签进行比较,计算得到局部识别网络的局部损失,再将全局损失与相应的权重之积以及局部损失与相应的权重之积的和值作为上述第一加权损失。
本申请实施例中,在计算到上述第一加权损失之后,待训练识别模型可以根据第一加权损失对模型中各网络的参数进行迭代更新,训练得到上述图片识别模型,即在第一加权损失未满足预设条件的情况下,更新待训练识别模型中各网络的参数,并将网络参数更新后模型作为待训练识别模型,重新执行将训练样本集的图片样本输入至待训练识别模型,直至第一加权损失满足预设条件,得到图片识别模型。
其中,上述根据第一加权损失对模型中各网络的参数进行迭代更新,可以是待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数均处于可更新状态,如此,在第一加权损失未满足预设条件的情况下,对待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数均进行更新,直至在第一加权损失满足预设条件的情况下,得到图片识别模型。
或者,上述在第一加权损失未满足预设条件的情况下,更新待训练识别模型中各网络的参数,并将网络参数更新后模型作为待训练识别模型,重新执行将训练样本集的图片样本输入至待训练识别模型,直至第一加权损失满足预设条件,得到图片识别模型,可以包括:
在待训练识别模型的特征提取网络的参数为固定状态的情况下,若第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为待训练识别模型,重新执行将训练样本集的图片样本输入至待训练识别模型,其中,上述迭代次数为更新待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
在第一加权损失未满足预设条件且迭代次数达到预设次数的情况下,设置特征提取网络的参数为可更新状态,并更新待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为待训练识别模型,重新执行将训练样本集的图片样本输入至待训练识别模型,直至第一加权损失满足预设条件,得到图片识别模型。
基于此,通过先将特征提取网络的参数固定,通过上述第一加权损失对全局识别网络和局部识别网络的参数进行迭代更新,并在迭代预设次数后,放开特征提取网络的参数,使得在第一加权损失未满足预设条件下继续对特征提取网络、全局识别网络和局部识别网络的参数进行更新,通过多任务加权学习训练的方式对待训练识别模型进行更新,从而可以降低模型训练过程中的复杂度,提升模型训练的效率。
需要说明的是,上述判断第一加权损失是否满足预设条件,也可以是电子设备中判断第一加权损失是否小于或者等于预设损失,或者上述第一加权损失与上一次迭代中计算得到的加权损失的差值是否小于或者等于预设差值,若是,则确定第一加权损失满足预设条件;反之,则第一加权损失未满足预设条件。
示例性地,以如图2所示的包括共享backbone网络(即特征提取网络)、目标检测分支网络和分类分支网络的待训练识别模型为例进行说明,其中,对于该图片待训练识别网络的训练,具体可以包括如下步骤:
步骤S11、设定超参数,初始化分类分支网络和目标检测分支网络的损失权重。加载预训练的共享backbone网络权重(即特征提取网络的参数),同时输入标注的数据;
步骤S12、将共享backbone网络权重设置为固定状态,计算目标检测分支网络和分类分支网络的加权损失(即第一加权损失),采用预设的优化方法(如梯度下降法等)根据上述损失更新目标检测分支网络和分类分支网络的参数;
步骤S13、迭代部分轮次(即预设次数)后,将共享backbone网络权重设置为可更新状态,继续将标注的数据输入至待训练识别模型中,计算分类分支网络和目标检测分支网络的加权损失,并在加权损失未达到预设条件(如加权损失小于或者等于预设损失等)的情况下,同时更新backbone网络、目标检测分支网络和分类分支网络的参数。
步骤S14、分别迭代若干轮步骤S12和步骤S13后,直至计算得到的加权损失达到预设条件,取得最优模型(即训练得到图片识别模型)。
当然,上述对特征提取网络的参数、全局识别网络和局部识别网络的参数进行不断的迭代更新,直至到达训练停止条件,得到上述图片识别模型,还可以是采用交替训练的方式对图片识别模型进行参数更新。具体地,上述训练样本集包括至少一个第一图片样本以及至少一个第二图片样本,且第一图片样本与全局识别网络对应,第二图片样本与局部识别网络对应;
上述获取待识别图片,并将待识别图片输入至图片识别模型中之前,还可以包括:
在待训练识别模型中第一识别网络的参数为固定状态的情况下,将训练样本集中与第二识别网络对应的图片样本输入至第二识别网络中,计算得到第二识别网络的损失,其中,第一识别网络为全局识别网络和局部识别网络中的任一识别网络,第二识别网络为全局识别网络和局部识别网络中除第一识别网络之外的识别网络;
在第二识别网络的损失未达到预设条件的情况下,更新待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将训练样本集中与第二识别网络对应的图片样本输入至第二识别网络中;
在第二识别网络的损失达到预设条件的情况下,设置第一识别网络的参数为更新状态以及第二识别网络的参数为固定状态,并将训练样本集中与第一识别网络对应的图片样本输入至第一识别网络中,计算得到第一识别网络的损失;
在第一识别网络的损失未达到预设条件的情况下,更新待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将训练样本集中与第一识别网络对应的图片样本输入至第一识别网络中,直至第一识别网络的损失达到预设条件,得到图片识别模型。
基于此,可以通过交替训练的方式训练上述图片识别模型,从而使训练图片识别模型的方式更灵活多样,且提升训练得到的图片识别模型的准确度。
其中,上述第一图片样本与全局识别网络对应,可以理解为第一图片样本为标注有全局图像是否异常的图片样本;上述第二图片样本与局部识别网络对应,可以理解为第二图片样本为标注有局部图像是否异常的图片样本。
另外,上述训练样本集中与第一识别网络对应的图像样本以及与第二识别网络对应的图片样本可以包括:在第一识别网络为全局识别网络且第二识别网络为局部识别网络的情况下,与第一识别网络对应的图像样本为上述第一图像样本,且与第二识别网络对应的图片样本为上述第二图像样本;或者,在第一识别网络为局部识别网络且第二识别网络为全局识别网络的情况下,与第一识别网络对应的图像样本为上述第二图像样本,且与第二识别网络对应的图片样本为上述第一图像样本。
需要说明的是,上述训练样本集中与第一识别网络、第二识别网络对应的图片样本,可以是训练样本集中,全局图像和局部图像同时被标注的图像样本。
示例性地,以如图2所示的包括共享backbone网络(即特征提取网络)、分类分支网络和目标检测分支网络的待训练识别模型为例进行说明,其中,对于该待训练识别网络的训练,具体可以包括如下步骤:
步骤S21、将分类分支网络(此时第一识别网络为分类分支网络)的参数设置为固定状态,将第一数据集(即包括上述至少一个第二图片样本的数据集)的图像样本输入至目标检测网络(此时第二识别网络为目标检测分支网络)中,在目标检测网络的损失未达到预设条件(如目标检测网络的损失小于或者等于预设损失或者趋向于不变)的情况下,更新共享backbone网络的参数和目标检测分支网络的参数,并重新执行将第一数据集的图像样本输入至目标检测网络中,直至目标检测分支网络的损失达到预设条件,其中,该第一数据集的图像样本的局部图像被标注;
步骤S22、将目标检测分支网络的参数(此时第一识别网络为目标检测分支网络)设置为固定状态且分类分支网络(此时第二识别网络为分类分支网络)的参数设置为更新状态,将第二数据集(即包括上述至少一个第一图片样本的数据集)的图像样本输入至分类分支网络中,在分类分支网络的损失未达到预设条件的情况下,更新共享backbone网络的参数和分类分支网络的参数,并重新执行将第二数据集的图像样本输入至分类分支网络中,直至分类分支网络的损失达到预设条件停止,其中,该第二数据集的图像样本的全局图像被标注;
步骤S23、将分类分支网络的损失达到预设条件下得到的模型作为上述图片识别模型。
需要说明的是,上述训练迭代停止条件,可以是在全局识别网络和局部识别网络分别满足预设条件的情况下,停止对待训练识别模型中网络的参数更新,得到上述图片识别模型。
更进一步地,上述在第一识别网络的损失未达到预设条件的情况下,更新待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将训练样本集中与第一识别网络对应的图片样本输入至第一识别网络中,直至第一识别网络的损失达到预设条件,得到图片识别模型,可以包括:
在第一识别网络的损失未达到预设条件的情况下,更新待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将训练样本集中与第一识别网络对应的图片样本输入至第一识别网络中;
在第一识别网络的损失满足预设条件的情况下,设置第二识别网络的参数为更新状态,并更新待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为待训练识别模型;
将训练样本集中的任一图片样本输入至待训练识别模型中,计算得到第一识别网络和第二识别网络的第二加权损失;
在第二加权损失未满足预设条件的情况下,更新待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为待训练识别模型,重新执行将训练样本集中的任一图片样本输入至待训练识别模型中,直至第二加权损失满足预设条件,得到图片识别模型。
基于此,在全局识别网络和局部识别网络分别满足预设条件之后,还进一步判断全局识别网络和局部识别网络的加权损失是否达到预设条件,并在加权损失达到预设条件的情况下,得到最终的图片识别模型,进一步提升图片识别模型的预测精度。
示例性地,在上述步骤S22中分类分支网络的损失达到预设条件之后,还可以进一步执行S23:
步骤S23、设置分类分支网络和目标检测分支网络的参数均为更新状态,将第三数据集中的图片样本分别输入至分类分支网络和目标检测分支网络,若分类分支网络的损失和目标检测分支网络的损失的加权损失未达到预设条件,则更新共享backbone网络的参数、目标检测分支网络的参数和分类分支网络的参数,并重新执行将第三数据集(即包括与第一识别网络、第二识别网络对应的图片样本的数据集)中的图片样本分别输入至分类分支网络和目标检测分支网络,执行训练过程,直至分类分支网络的损失和目标检测分支网络的损失的加权损失达到预设条件,其中,该第三数据集的图像样本的全局图像和局部图像均被标注;
此时,上述步骤23可以包括:将在分类分支网络的损失和目标检测分支网络的损失的加权损失达到预设条件下得到的模型作为上述图片识别模型。
步骤103、将多尺度特征输入至全局识别网络中识别待识别图片的第一类型信息,和/或,将多尺度特征输入至局部识别网络中识别待识别图片的第二类型信息,其中,第一类型信息用于指示待识别图片的全局图像是否异常,第二类型信息用于:指示待识别图片的局部图像是否异常。
其中,上述第一类型信息和第二类型信息分别是由全局识别网络和局部识别网络输出的信息,且第一类型信息用于指示待识别图片的全局图像是否异常,第二类型信息用于指示待识别图片的局部图像是否异常。具体地,上述第一类型信息和第二信息可以分别是对应的识别网络的输出层的输出结果,如置信度等。
另外,上述图片识别模型中所采用的对待识别图片进行识别的至少一个识别网络,可以是根据预设的指令在全局识别网络和局部识别网络中确定,该预设的指令可以是由用户的操作触发,或者也可以是电子设备自动触发,在此并不进行限定。
例如,可以是在电子设备显示图片识别模型的配置界面的情况下,若用户输入选中该配置界面中显示的全局识别网络控件的操作,则在待识别图片输出至图片识别模型时,通过图片识别模型的全局识别网络对待识别图片进行识别;若用户输入选中该配置界面中显示的局部识别网络控件的操作,则在待识别图片输出至图片识别模型时,通过图片识别模型的局部识别网络对待识别图片进行识别。若用户输入选中该配置界面中显示的局部识别网络控件和全局识别网络控件的操作,则在待识别图片输出至图片识别模型时,通过图片识别模型的局部识别网络和全局识别网络控件对待识别图片进行识别。
步骤104、在第一类型信息指示异常和/或第二类型信息指示异常的情况下,确定待识别图片为异常图片。
其中,在得到上述第一类型信息和第二类型信息中的至少一项类型信息之后,图片识别模型可以将各类型信息与其对应的预设类型信息进行比对,并根据比对结果确定该类型信息指示正常或者异常。
例如,在第一类型信息为第一置信度的情况下,将第一置信度与预设的全局图像的置信区间进行比较,若第一置信度位于预设的与全局识别网络对应的置信区间内,则确定第一类型信息指示异常,反之,则正常;而在第二类型信息为第二置信度的情况下,将第二置信度与预设的与局部识别网络对应的至少一个置信区间进行比较,该至少一个置信区间中,不同置信区间可以是不同类型的局部图像对应的置信区间,如分别设置有与胸部、臀部以及三角区对应的置信区间,若第二置信度位于胸部对应的置信区间内,则第二类型信息指示因露胸导致的异常,等等。
另外,在上述第一类型信息和第二类型信息中的至少一项指示异常的情况下,电子设备确定待识别图片为异常图片。当然,在上述第一类型信息和第二类型信息均指示正常的情况下,电子设备可以确定待识别图片为正常图片。
需要说明的是,在确定上述待识别图片为异常图片或者正常图片的情况下,电子设备还可以为待识别图片标注异常图片或者正常图片的标签,且在异常图片存在局部图像异常的情况下,还可以标注该异常的局部图像,如在异常图像区域上打框。例如,在上述目标检测分支网络检测到人物图像中存在露胸的图像区域的情况下,目标检测网络可以对裸露的胸部所在的图像区域打框,并添加打框的图像区域的标签为露胸。
基于此,通过将待识别图片输入至图片识别模型的特征提取网络提取多尺度特征,并将提取到的多尺度特征输入至图片识别模型的局识别网络和局部识别网络中的至少一个识别网络中,通过该至少一个识别网络分别实现待识别图片是否为异常图片。如此,通过本申请实施例的图片识别方法,在图片的识别过程中,可以在无需人工标注的情况下实现待识别图片的图片类型的识别,降低图片识别的工作量,从而提升图片识别的效率;另外,还可以实现分别从整体和局部上对待识别图片进行识别,使得图片识别更灵活且便捷。
图4是根据一示例性实施例示出的一种图片识别装置的结构示意图。
如图4所示,该图片识别装置400具体可以包括:
图片获取模块401,被配置为获取待识别图片;
多尺度特征提取模块402,被配置为将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
识别模块403,被配置为将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
异常图片确定模块404,被配置为在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
基于此,通过将待识别图片输入至图片识别模型的特征提取网络提取多尺度特征,并将提取到的多尺度特征输入至图片识别模型的局识别网络和局部识别网络中的至少一个识别网络中,通过该至少一个识别网络分别实现待识别图片是否为异常图片。如此,通过本申请实施例的图片识别方法,在图片的识别过程中,可以在无需人工标注的情况下实现待识别图片的图片类型的识别,降低图片识别的工作量,从而提升图片识别的效率;另外,还可以实现分别从整体和局部上对待识别图片进行识别,使得图片识别更灵活且便捷。
在其中一个实施例中,所述装置400,还包括:
训练集获取模块,被配置为获取训练样本集;
加权损失计算模块,被配置为将所述训练样本集的图片样本输入至包括所述特征提取网络、所述全局识别网络和所述局部识别网络的待训练识别模型中,计算所述全局识别网络和所述局部识别网络的第一加权损失;
第一训练模块,被配置为在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
基于此,通过训练样本集对包括特征提取网络、全局识别网络和局部识别网络的待训练识别模型进行训练,并在训练过程中通过全局识别网络和所述局部识别网络的加权损失更新待训练模型中各网络的参数,从而不仅可以提升在图片识别模型的识别精度,还可以降低模型训练的复杂度,进而加快模型训练的效率。
在其中一个实施例中,所述第一训练模块,包括:
第一参数更新单元,被配置为在所述待训练识别模型的特征提取网络的参数为固定状态的情况下,若所述第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新所述待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,其中,所述迭代次数为更新所述待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
第二参数更新单元,被配置为在所述第一加权损失未满足所述预设条件且所述迭代次数达到所述预设次数的情况下,设置所述特征提取网络的参数为可更新状态,并更新所述待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
基于此,通过先将特征提取网络的参数固定,通过上述第一加权损失对全局识别网络和局部识别网络的参数进行迭代更新,并在迭代预设次数后,放开特征提取网络的参数,使得在第一加权损失未满足预设条件下继续对特征提取网络、全局识别网络和局部识别网络的参数进行更新,通过多任务加权学习训练的方式对待训练识别模型进行更新,从而可以降低模型训练过程中的复杂度,提升模型训练的效率。
在其中一个实施例中,所述训练样本集包括至少一个第一图片样本以及至少一个第二图片样本,且所述第一图片样本与所述全局识别网络对应,所述第二图片样本与所述局部识别网络对应;
所述装置400,还包括:
第一损失计算模块,被配置为在所述待训练识别模型中第一识别网络的参数为固定状态的情况下,将所述训练样本集中与第二识别网络对应的图片样本输入至所述第二识别网络中,计算得到所述第二识别网络的损失,其中,所述第一识别网络为所述全局识别网络和所述局部识别网络中的任一识别网络,所述第二识别网络为所述全局识别网络和所述局部识别网络中除所述第一识别网络之外的识别网络;
第一参数模块,被配置为在所述第二识别网络的损失未达到预设条件的情况下,更新所述待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将所述训练样本集中与所述第二识别网络对应的图片样本输入至所述第二识别网络中;
第二损失计算模块,被配置为在所述第二识别网络的损失达到所述预设条件的情况下,设置所述第一识别网络的参数为更新状态以及所述第二识别网络的参数为固定状态,并将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,计算得到所述第一识别网络的损失;
第二参数更新模块,被配置为在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型。
基于此,可以通过交替训练的方式训练上述图片识别模型,从而使训练图片识别模型的方式更灵活多样,且提升训练得到的图片识别模型的准确度。
在其中一个实施例中,所述第二参数更新模块,包括:
第三参数更新单元,被配置为所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中;
第四参数更新单元,被配置为在所述第一识别网络的损失满足所述预设条件的情况下,设置所述第二识别网络的参数为更新状态,并更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为所述待训练识别模型;
加权损失计算单元,被配置为将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,计算得到所述第一识别网络和所述第二识别网络的第二加权损失;
第五参数更新单元,被配置为在所述第二加权损失未满足所述预设条件的情况下,更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为所述待训练识别模型,重新执行将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,直至所述第二加权损失满足所述预设条件,得到所述图片识别模型。
基于此,在全局识别网络和局部识别网络分别满足预设条件之后,还进一步判断全局识别网络和局部识别网络的加权损失是否达到预设条件,并在加权损失达到预设条件的情况下,得到最终的图片识别模型,进一步提升图片识别模型的预测精度。
在其中一个实施例中,所述训练集获取模块,包括:
样本集获取单元,被配置为获取第一样本集和第二样本集,其中,所述第一样本集包括标注的图片样本,所述第二样本集包括未标注的图片样本;
训练单元,被配置为将所述第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,所述M为正整数;
标注单元单元,被配置为将所述第二样本集中图片样本输入至所述第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至所述第一样本集中;
训练重置单元,被配置为在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M-1个识别模型,并重新执行将所述第一样本集输入至第M-1个识别模型中;
样本集输出单元,被配置为在所述M个识别模型满足训练停止条件的情况下,将所述第一样本集作为所述训练样本集。
基于此,在对识别模型的训练过程中,通过包括标注的图片样本的第一样本集对待训练的识别模型进行训练,并通过训练得到的识别模型对未标注的图片样本进行标注,且将标注后的样本加入至第一样本集中,直至在训练得到的识别模型满足训练停止条件下,将第一样本集中作为上述训练样本集,实现以半监督的方式获取训练样本集,从而可以降低获取训练样本集的工作量,提升获取训练样本集的效率。
基于同一发明构思,本公开实施例还提供了一种计算设备,具体结合图5进行详细说明。
图5是根据一示例性实施例示出的一种计算设备的结构框图。
如图5所示,该计算设备500能够实现根据本公开实施例中的图片识别方法以及图片识别装置的计算设备的示例性硬件架构的结构图。该计算设备可以指代本公开实施例中的电子设备。
该计算设备500可以包括处理器501以及存储有计算机程序指令的存储器602。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(application specific integrated circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器502可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(hard disk drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。在特定实施例中,存储器502包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存,或者两个或及其以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以执行如下步骤:
处理器501,执行获取待识别图片;
将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
基于此,通过将待识别图片输入至图片识别模型的特征提取网络提取多尺度特征,并将提取到的多尺度特征输入至图片识别模型的局识别网络和局部识别网络中的至少一个识别网络中,通过该至少一个识别网络分别实现待识别图片是否为异常图片。如此,通过本申请实施例的图片识别方法,在图片的识别过程中,可以在无需人工标注的情况下实现待识别图片的图片类型的识别,降低图片识别的工作量,从而提升图片识别的效率;另外,还可以实现分别从整体和局部上对待识别图片进行识别,使得图片识别更灵活且便捷。
在其中一个实施例中,处理器501,执行获取训练样本集;
将所述训练样本集的图片样本输入至包括所述特征提取网络、所述全局识别网络和所述局部识别网络的待训练识别模型中,计算所述全局识别网络和所述局部识别网络的第一加权损失;
在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
基于此,通过训练样本集对包括特征提取网络、全局识别网络和局部识别网络的待训练识别模型进行训练,并在训练过程中通过全局识别网络和所述局部识别网络的加权损失更新待训练模型中各网络的参数,从而不仅可以提升在图片识别模型的识别精度,还可以降低模型训练的复杂度,进而加快模型训练的效率。
在其中一个实施例中,处理器501,执行在所述待训练识别模型的特征提取网络的参数为固定状态的情况下,若所述第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新所述待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,其中,所述迭代次数为更新所述待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
在所述第一加权损失未满足所述预设条件且所述迭代次数达到所述预设次数的情况下,设置所述特征提取网络的参数为可更新状态,并更新所述待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
基于此,通过先将特征提取网络的参数固定,通过上述第一加权损失对全局识别网络和局部识别网络的参数进行迭代更新,并在迭代预设次数后,放开特征提取网络的参数,使得在第一加权损失未满足预设条件下继续对特征提取网络、全局识别网络和局部识别网络的参数进行更新,通过多任务加权学习训练的方式对待训练识别模型进行更新,从而可以降低模型训练过程中的复杂度,提升模型训练的效率。
在其中一个实施例中,所述训练样本集包括至少一个第一图片样本以及至少一个第二图片样本,且所述第一图片样本与所述全局识别网络对应,所述第二图片样本与所述局部识别网络对应;
处理器501,执行在所述待训练识别模型中第一识别网络的参数为固定状态的情况下,将所述训练样本集中与第二识别网络对应的图片样本输入至所述第二识别网络中,计算得到所述第二识别网络的损失,其中,所述第一识别网络为所述全局识别网络和所述局部识别网络中的任一识别网络,所述第二识别网络为所述全局识别网络和所述局部识别网络中除所述第一识别网络之外的识别网络;
在所述第二识别网络的损失未达到预设条件的情况下,更新所述待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将所述训练样本集中与所述第二识别网络对应的图片样本输入至所述第二识别网络中;
在所述第二识别网络的损失达到所述预设条件的情况下,设置所述第一识别网络的参数为更新状态以及所述第二识别网络的参数为固定状态,并将所述训练样本集中与所述第一识别网络对应的图片样本输入至第一识别网络中,计算得到所述第一识别网络的损失;
在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型。
基于此,可以通过交替训练的方式训练上述图片识别模型,从而使训练图片识别模型的方式更灵活多样,且提升训练得到的图片识别模型的准确度。
在其中一个实施例中,处理器501,执行所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中;
在所述第一识别网络的损失满足所述预设条件的情况下,设置所述第二识别网络的参数为更新状态,并更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为所述待训练识别模型;
将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,计算得到所述第一识别网络和所述第二识别网络的第二加权损失;
在所述第二加权损失未满足所述预设条件的情况下,更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为所述待训练识别模型,重新执行将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,直至所述第二加权损失满足所述预设条件,得到所述图片识别模型。
基于此,在全局识别网络和局部识别网络分别满足预设条件之后,还进一步判断全局识别网络和局部识别网络的加权损失是否达到预设条件,并在加权损失达到预设条件的情况下,得到最终的图片识别模型,进一步提升图片识别模型的预测精度。
在其中一个实施例中,处理器501,执行获取第一样本集和第二样本集,其中,所述第一样本集包括标注的图片样本,所述第二样本集包括未标注的图片样本;
将所述第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,所述M为正整数;
将所述第二样本集中图片样本输入至所述第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至所述第一样本集中;
在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M-1个识别模型,并重新执行将所述第一样本集输入至第M-1个识别模型中;
在所述M个识别模型满足训练停止条件的情况下,将所述第一样本集作为所述训练样本集。
基于此,在对识别模型的训练过程中,通过包括标注的图片样本的第一样本集对待训练的识别模型进行训练,并通过训练得到的识别模型对未标注的图片样本进行标注,且将标注后的样本加入至第一样本集中,直至在训练得到的识别模型满足训练停止条件下,将第一样本集中作为上述训练样本集,实现以半监督的方式获取训练样本集,从而可以降低获取训练样本集的工作量,提升获取训练样本集的效率。
在一个示例中,该计算设备500还可包括收发器503和总线504。其中,如图5所示,处理器501、存储器502和收发器503通过总线504连接并完成相互间的通信。
总线504包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围控件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线504可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本公开实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令用于实现本公开实施例所记载的图片识别方法。
在一些可能的实施方式中,本公开提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的方法中的步骤,例如,所述计算机设备可以执行本公开实施例所记载的图片识别方法。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本公开是参照根据本公开的方法、设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程图像传输设备的处理器以产生一个机器,使得通过计算机或其他可编程图像传输设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程图像传输设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程图像传输设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
Claims (10)
1.一种图片识别方法,其特征在于,包括:
获取待识别图片;
将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别图片,并将所述待识别图片输入至图片识别模型中之前,还包括:
获取训练样本集;
将所述训练样本集的图片样本输入至包括所述特征提取网络、所述全局识别网络和所述局部识别网络的待训练识别模型中,计算所述全局识别网络和所述局部识别网络的第一加权损失;
在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
3.根据权利要求2所述的方法,其特征在于,所述在所述第一加权损失未满足预设条件的情况下,更新所述待训练识别模型中各网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型,包括:
在所述待训练识别模型的特征提取网络的参数为固定状态的情况下,若所述第一加权损失未满足预设条件且迭代次数未达到预设次数的情况下,更新所述待训练识别模型中的全局识别网络和局部识别网络的参数,并将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,其中,所述迭代次数为更新所述待训练识别模型中的全局识别网络和局部识别网络的参数的次数;
在所述第一加权损失未满足所述预设条件且所述迭代次数达到所述预设次数的情况下,设置所述特征提取网络的参数为可更新状态,并更新所述待训练识别模型中的特征提取网络、全局识别网络和局部识别网络的参数,将网络参数更新后模型作为所述待训练识别模型,重新执行将所述训练样本集的图片样本输入至所述待训练识别模型,直至所述第一加权损失满足所述预设条件,得到所述图片识别模型。
4.根据权利要求2所述的方法,其特征在于,所述获取待识别图片,并将所述待识别图片输入至图片识别模型中之前,还包括:
在所述待训练识别模型中第一识别网络的参数为固定状态的情况下,将所述训练样本集中与第二识别网络对应的图片样本输入至所述第二识别网络中,计算得到所述第二识别网络的损失,其中,所述第一识别网络为所述全局识别网络和所述局部识别网络中的任一识别网络,所述第二识别网络为所述全局识别网络和所述局部识别网络中除所述第一识别网络之外的识别网络;
在所述第二识别网络的损失未达到预设条件的情况下,更新所述待训练识别模型中特征提取网络和第二识别网络的参数,并重新执行将所述训练样本集中与所述第二识别网络对应的图片样本输入至所述第二识别网络中;
在所述第二识别网络的损失达到所述预设条件的情况下,设置所述第一识别网络的参数为更新状态以及所述第二识别网络的参数为固定状态,并将所述训练样本集中与第一识别网络对应的图片样本输入至所述第一识别网络中,计算得到所述第一识别网络的损失;
在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型。
5.根据权利要求4所述的方法,其特征在于,所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中,直至所述第一识别网络的损失达到所述预设条件,得到所述图片识别模型,包括:
所述在所述第一识别网络的损失未达到所述预设条件的情况下,更新所述待训练识别模型中特征提取网络和第一识别网络的参数,并重新执行将所述训练样本集中与所述第一识别网络对应的图片样本输入至所述第一识别网络中;
在所述第一识别网络的损失满足所述预设条件的情况下,设置所述第二识别网络的参数为更新状态,并更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并将参数更新后的模型作为所述待训练识别模型;
将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,计算得到所述第一识别网络和所述第二识别网络的第二加权损失;
在所述第二加权损失未满足所述预设条件的情况下,更新所述待训练识别模型中的特征提取网络、第一识别网络和第二识别网络的参数,并参数更新后的模型作为所述待训练识别模型,重新执行将所述训练样本集中与所述第一识别网络、所述第二识别网络对应的图片样本输入至所述待训练识别模型中,直至所述第二加权损失满足所述预设条件,得到所述图片识别模型。
6.根据权利要求2或4所述的方法,其特征在于,所述获取训练样本集,包括:
获取第一样本集和第二样本集,其中,所述第一样本集包括标注的图片样本,所述第二样本集包括未标注的图片样本;
将所述第一样本集输入至第M-1个识别模型中,训练得到第M个识别模型,其中,所述M为正整数;
将所述第二样本集中图片样本输入至所述第M个识别模型中,以对输入的图片样本进行标注,并将标注的图片样本加入至所述第一样本集中;
在所述M个识别模型不满足训练停止条件的情况下,将所述第M个识别模型作为所述第M-1个识别模型,并重新执行将所述第一样本集输入至第M-1个识别模型中;
在所述M个识别模型满足训练停止条件的情况下,将所述第一样本集作为所述训练样本集。
7.一种图片识别装置,其特征在于,包括:
图片获取模块,被配置为获取待识别图片;
多尺度特征提取模块,被配置为将所述待识别图片输入至图片识别模型的特征提取网络中,通过所述特征提取网络提取多尺度特征,其中,所述图片识别模型包括所述特征提取网络以及与所述特征提取网络连接的全局识别网络、局部识别网络,且所述全局识别网络用于基于图片的全局图像特征进行图片类型识别,所述局部识别网络用于基于图片的局部图像特征进行图片类型识别,所述多尺度特征包括所述待识别图片的全局图像特征以及局部图像特征;
识别模块,被配置为将所述多尺度特征输入至所述全局识别网络中识别所述待识别图片的第一类型信息,和/或,将所述多尺度特征输入至所述局部识别网络中识别所述待识别图片的第二类型信息,其中,所述第一类型信息用于指示所述待识别图片的全局图像是否异常,所述第二类型信息用于:指示所述待识别图片的局部图像是否异常;
异常图片确定模块,被配置为在所述第一类型信息指示异常和/或所述第二类型信息指示异常的情况下,确定所述待识别图片为异常图片。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的图片识别方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由图片识别装置或者电子设备的处理器执行时,以使所述图片识别装置或者所述电子设备实现如权利要求1至6中任一项所述的图片识别方法。
10.一种计算机程序产品,包括计算机程序或者指令,其特征在于,所述计算机程序或者指令被处理器执行时实现如权利要求1至6中任一项所述的图片识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605499.9A CN113392887A (zh) | 2021-05-31 | 2021-05-31 | 图片识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605499.9A CN113392887A (zh) | 2021-05-31 | 2021-05-31 | 图片识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113392887A true CN113392887A (zh) | 2021-09-14 |
Family
ID=77619681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110605499.9A Pending CN113392887A (zh) | 2021-05-31 | 2021-05-31 | 图片识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392887A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115439700A (zh) * | 2022-11-03 | 2022-12-06 | 深圳比特微电子科技有限公司 | 一种图像处理方法、装置和机器可读存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764281A (zh) * | 2018-04-18 | 2018-11-06 | 华南理工大学 | 一种基于半监督自步学习跨任务深度网络的图像分类方法 |
CN110610206A (zh) * | 2019-09-05 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片的低俗归因识别方法、装置及设备 |
CN110889428A (zh) * | 2019-10-21 | 2020-03-17 | 浙江大搜车软件技术有限公司 | 图像识别方法、装置、计算机设备与存储介质 |
CN111160268A (zh) * | 2019-12-30 | 2020-05-15 | 北京化工大学 | 一种基于多任务学习的多角度sar目标识别方法 |
CN111259823A (zh) * | 2020-01-19 | 2020-06-09 | 人民中科(山东)智能技术有限公司 | 一种基于卷积神经网络的色情图像识别方法 |
CN111523574A (zh) * | 2020-04-13 | 2020-08-11 | 云南大学 | 一种基于多模态数据的图像情感识别方法及系统 |
CN111666905A (zh) * | 2020-06-10 | 2020-09-15 | 重庆紫光华山智安科技有限公司 | 模型训练方法、行人属性识别方法和相关装置 |
-
2021
- 2021-05-31 CN CN202110605499.9A patent/CN113392887A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764281A (zh) * | 2018-04-18 | 2018-11-06 | 华南理工大学 | 一种基于半监督自步学习跨任务深度网络的图像分类方法 |
CN110610206A (zh) * | 2019-09-05 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片的低俗归因识别方法、装置及设备 |
CN110889428A (zh) * | 2019-10-21 | 2020-03-17 | 浙江大搜车软件技术有限公司 | 图像识别方法、装置、计算机设备与存储介质 |
CN111160268A (zh) * | 2019-12-30 | 2020-05-15 | 北京化工大学 | 一种基于多任务学习的多角度sar目标识别方法 |
CN111259823A (zh) * | 2020-01-19 | 2020-06-09 | 人民中科(山东)智能技术有限公司 | 一种基于卷积神经网络的色情图像识别方法 |
CN111523574A (zh) * | 2020-04-13 | 2020-08-11 | 云南大学 | 一种基于多模态数据的图像情感识别方法及系统 |
CN111666905A (zh) * | 2020-06-10 | 2020-09-15 | 重庆紫光华山智安科技有限公司 | 模型训练方法、行人属性识别方法和相关装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115439700A (zh) * | 2022-11-03 | 2022-12-06 | 深圳比特微电子科技有限公司 | 一种图像处理方法、装置和机器可读存储介质 |
CN115439700B (zh) * | 2022-11-03 | 2023-03-14 | 深圳比特微电子科技有限公司 | 一种图像处理方法、装置和机器可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112417439B (zh) | 账号检测方法、装置、服务器及存储介质 | |
CN110363220B (zh) | 行为类别检测方法、装置、电子设备和计算机可读介质 | |
CN110070029B (zh) | 一种步态识别方法及装置 | |
CN110096938B (zh) | 一种视频中的动作行为的处理方法和装置 | |
CN110175851B (zh) | 一种作弊行为检测方法及装置 | |
CN108197592B (zh) | 信息获取方法和装置 | |
CN112488218A (zh) | 图像分类方法、图像分类模型的训练方法和装置 | |
CN108550065B (zh) | 评论数据处理方法、装置及设备 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN110826525A (zh) | 一种人脸识别的方法及系统 | |
CN109087667B (zh) | 语音流利度识别方法、装置、计算机设备及可读存储介质 | |
CN105956469A (zh) | 文件安全性识别方法和装置 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
CN115082752A (zh) | 基于弱监督的目标检测模型训练方法、装置、设备及介质 | |
CN113392887A (zh) | 图片识别方法、装置、电子设备及存储介质 | |
CN113269307B (zh) | 神经网络训练方法以及目标重识别方法 | |
CN114140751B (zh) | 一种考场监控方法及系统 | |
CN113255766B (zh) | 一种图像分类方法、装置、设备和存储介质 | |
CN113392886A (zh) | 图片识别模型的获取方法、装置、电子设备及存储介质 | |
CN112668637B (zh) | 网络模型的训练方法、识别方法、装置及电子设备 | |
CN114399699A (zh) | 目标推荐对象确定方法、装置、电子设备及存储介质 | |
CN115587358A (zh) | 一种二进制代码相似性检测方法、装置及存储介质 | |
CN111881187A (zh) | 一种自动建立数据处理模型的方法及相关产品 | |
CN113343921B (zh) | 视频识别方法、装置、电子设备及存储介质 | |
CN113554048B (zh) | 数据识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |