CN110796034B - 一种目标对象识别方法、装置、设备及介质 - Google Patents

一种目标对象识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN110796034B
CN110796034B CN201910969015.1A CN201910969015A CN110796034B CN 110796034 B CN110796034 B CN 110796034B CN 201910969015 A CN201910969015 A CN 201910969015A CN 110796034 B CN110796034 B CN 110796034B
Authority
CN
China
Prior art keywords
detection
threshold
model
classification
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910969015.1A
Other languages
English (en)
Other versions
CN110796034A (zh
Inventor
申世伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910969015.1A priority Critical patent/CN110796034B/zh
Publication of CN110796034A publication Critical patent/CN110796034A/zh
Application granted granted Critical
Publication of CN110796034B publication Critical patent/CN110796034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开关于一种目标对象识别方法、装置、设备及介质,用以充分利用检测模型检测出的检测框,提高目标对象识别率。本公开的基于识别模型的目标对象识别方法,识别模型包括检测模型和分类模型,方法包括:将待识别图像输入检测模型,确定检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,第一概率为待识别图像包含对象的概率,其中,多个检测概率区间互不重叠;将检测模型输出的包含检测框的图像输入分类模型,在确定分类模型输出的第二概率大于预先确定的阈值组合中目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,第二概率为检测框包含目标对象的概率。

Description

一种目标对象识别方法、装置、设备及介质
技术领域
本公开涉及物体识别领域,尤其涉及一种基于识别模型的目标对象识别方法、装置、设备及介质。
背景技术
目前,针对图像中的物体识别,通常的识别策略是先用检测模型检出物体框,然后利用分类模型对检测出的物体框进行分类,识别出物体。
具体来说,通过设置检测模型的输出概率阈值和分类模型的预测概率阈值,将检测模型输出概率大于检测模型的输出概率阈值的检测框,输入分类模型中进行分类,并在分类模型预测概率大于分类模型的预测概率阈值时,确定识别出目标物体。
随着对物体识别的要求越来越高,在对物体中的目标物体进行识别时,需要识别出更多的目标物体,因此,亟需一种提高物体识别率的方法。
发明内容
本公开提供一种基于识别模型的目标对象识别方法、装置、设备及介质,用以充分利用检测模型检测出的检测框,提高目标对象识别率。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种基于识别模型的目标对象识别方法,包括:
将待识别图像输入检测模型,确定检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,第一概率为待识别图像包含对象的概率,其中,多个检测概率区间互不重叠;
将检测模型输出的包含检测框的图像输入分类模型,在确定分类模型输出的第二概率大于预先确定的阈值组合中目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,第二概率为检测框包含目标对象的概率。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别方法中,预先确定的阈值组合采用如下步骤确定:
针对识别模型设置多个阈值组合,每个阈值组合中包括检测模型的多个检测概率区间和分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别方法,在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合,包括:
对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,预处理为保留多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比;
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别方法,针对识别模型设置多个阈值组合,包括:
针对检测模型,设置多个检测概率区间;
针对分类模型,对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对初始分类阈值中的一个或多个进行调整,得到多组分类阈值,其中,分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,第一检测概率区间的左端点值小于第二检测概率区间的左端点值;
将多个检测概率区间与多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别方法中,多个检测概率区间的并集为区间[0,1]。
根据本公开实施例的第二方面,提供一种基于识别模型的目标对象识别装置,包括:
处理单元,被配置为执行将待识别图像输入检测模型,确定检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,第一概率为待识别图像包含对象的概率,其中,多个检测概率区间互不重叠;
确定单元,被配置为执行将检测模型输出的包含检测框的图像输入分类模型,在确定分类模型输出的第二概率大于预先确定的阈值组合中目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,第二概率为检测框包含目标对象的概率。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元被配置为执行如下步骤确定预先确定的阈值组合:
针对识别模型设置多个阈值组合,每个阈值组合中包括检测模型的多个检测概率区间和分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元具体被配置为执行:
对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,预处理为保留多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比;
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元具体被配置为执行:
针对检测模型,设置多个检测概率区间;
针对分类模型,对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对初始分类阈值中的一个或多个进行调整,得到多组分类阈值,其中,分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,第一检测概率区间的左端点值小于第二检测概率区间的左端点值;
将多个检测概率区间与多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,多个检测概率区间的并集为区间[0,1]。
根据本公开实施例的第三方面,提供一种基于识别模型的目标对象识别设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为执行指令以实现第一方面公开的基于识别模型的目标对象识别方法。
根据本公开实施例的第四方面,提供一种存储介质,当存储介质中的指令由基于识别模型的目标对象识别设备的处理器执行时,能够执行本公开实施例第一方面公开的对象的输入方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行实现本公开实施例上述第一方面以及第一方面涉及的任一可能涉及的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
将待识别图像输入检测模型,确定检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,将检测模型输出的包含检测框的图像输入分类模型,在确定分类模型输出的第二概率大于预先确定的阈值组合中目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,第二概率为检测框包含目标对象的概率。通过在检测模型中设置多个检测概率区间,使得所有检测模型检测出的检测框均能够输入到分类模型中进行分类识别,也即充分利用了检测模型检测出的检测框,提高了目标对象识别效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种基于识别模型的目标对象识别方法的示意流程图。
图2是根据一示例性实施例示出的一种基于识别模型的目标对象识别方法的具体流程的示意流程图。
图3是根据一示例性实施例示出的一种预先确定阈值组合的示意流程图。
图4是根据一示例性实施例示出的另一预先确定阈值组合的示意流程图。
图5是根据一示例性实施例示出的一种基于识别模型的目标对象识别装置的结构示意图。
图6是根据一示例性实施例示出的一种基于识别模型的目标对象识别设备示例框图。
图7是根据一示例性实施例示出的一种应用基于识别模型的目标对象识别方法的终端的结构框图。
具体实施方式
为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开一部份实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
下面对文中出现的一些词语进行解释:
1、本公开实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本公开实施例不仅适用于包含一个检测模型和一个分类模型的识别模型,还适用于包含多个(例如,M个)检测模型和多个(例如,K个)分类模型的识别模型,下述实施例中以包含一个是检测模型和一个分类模型的识别模型为例进行说明。
图1根据一示例性实施例示出的一种基于识别模型的目标对象识别方法的流程示意图,如图1所示,基于识别模型的目标对象识别方法,包括以下步骤:
步骤S101,将待识别图像输入检测模型,确定检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,第一概率为待识别图像包含对象的概率,其中,多个检测概率区间互不重叠。
具体实施时,检测模型可以检测出待识别图像中包含对象的检测框,各检测框中的对象可以相同,也可以不同,对象中可能包含目标对象,并且检测模型检测出待识别图像中包含对象的检测框时,也确定各检测框的第一概率,第一概率的含义为,在检测框中包含对象的概率。
预先设置的多个检测概率区间互不重叠,也即各检测概率区间没有交集,第一概率所属的检测概率区间为目标检测区间。
例如,多个检测概率区间为[0,0.24),[0.24,0.6],(0.6,1],第一概率为0.65时,第一概率的目标检测概率区间为(0.6,1]。
一种可能的实施方式中,多个检测概率区间的并集为区间[0,1]。
具体实施时,在设置多个检测区间时,可以在[0,1]的范围内设置多个检测区间,使得检测模型输出的第一概率较低的检测框,也可以输入分类模型中进行分类,使得所有检测模型输出的包含检测框的图像都输入分类模型。
步骤S102,将检测模型输出的包含检测框的图像输入分类模型,在确定分类模型输出的第二概率大于预先确定的阈值组合中目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,第二概率为检测框包含目标对象的概率。
具体实施时,将带有检测模型检出的检测框的图像输入分类模型中,分类模型对检测框中的对象进行分类,并输出检测框中的对象为目标对象的第二概率。
预先确定的阈值组合中包含多个检测概率区间的每个检测概率区间的分类阈值,第二概率与目标检测概率区间对应的分类阈值比较,第二概率大于目标检测概率区间对应的分类阈值时,确定待识别图像中包含目标对象,也可以确定第一概率所属检测框中包含目标对象。
具体实施时,预先确定的阈值组合采用如下步骤确定:
针对识别模型设置多个阈值组合,每个阈值组合中包括检测模型的多个检测概率区间和分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
具体实施时,利用识别模型识别目标对象时,将包含检测框的图像输入分类模型,输出的第二概率大于目标检测概率区间对应的分类阈值时,标记该检测框中包含目标对象,也即该检测框的标记为正向。
针对识别模型设置多个阈值组合,可以是根据经验值设置多个阈值组合,也可以根据所使用的检测模型和分类模型的特点进行设置,也可以根据本公开中下述实施例中的方法进行设置。
将每个阈值组合配置在识别模型中,对识别模型进行更新,并利用更新后的识别模型,对预先获取的样本数据进行识别,以确定每个阈值组合对应的识别准确率和正向检出百分比。其中,预先获取的样本数据,可以包括但不限于:样本图像、样本图像中是否包含目标对象、样本图像中目标对象所在检测框的位置、样本图像的正向标记(包含目标对象的标记为正向)。
确定每个阈值组合对应的识别准确率和正向检出百分比时,识别准确率为利用识别模型识别目标对象时检测框标记为正向,且预先获取的检测框标记为正向的检测框总个数与全部利用识别模型识别目标对象时检测框标记为正向的检测框总个数的比值,正向检出百分比为利用识别模型识别目标对象时检测框标记为正向,且预先获取的检测框标记为正向的检测框总个数与全部预先获取的检测框为正向的总个数的比值。
可以根据实际应用场景,或者实际使用的检测模型或分类模型,设置预设准确率阈值,例如80%,或设置预设检出百分比阈值,例如,85%,或者同时设置预设准确率阈值和预设检出百分比阈值。
将多个阈值组合对应的识别准确率,大于预设准确率阈值的识别准确率对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
或者,将多个阈值组合对应的正向检出百分比,大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
再或者,将多个阈值组合对应的识别准确率大于预设准确率阈值的识别准确率对应的阈值组合,并且对应的正向检出百分比,大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
本公开上述实施例中,预先确定的阈值组合的过程中,确定每个阈值组合识别准确率和正向检出百分比,并满足预设识别准确率阈值和/或预设检出百分比阈值的阈值组合确定为识别模型识别时使用的阈值组合,得以保证识别率,并可以根据不同的预设识别准确率阈值及预设识别检出百分比阈值,灵活地为识别模型确定识别时使用的阈值组合。
为便于确定为识别模型识别时所使用的阈值组合,可以对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,预处理为保留多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比。
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
具体实施时,对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,可以保留正向检出百分比小于识别准确率的阈值组合,可以对正向检出百分比大于等于识别准确率的阈值组合对应的识别准确率和正向检出百分比进行删除。
对多个阈值组合对应的识别准确率和正向检出百分比的预处理,也可在多个阈值组合对应的正向检出百分比相同时,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比,删除其他相同正向检出百分比的阈值组合对应的识别准确率和正向检出百分比。
本公开上述实施例中,保留识别准确率大于正向检出百分比的阈值组合,所保留的阈值组合在识别时可以保证对目标对象识别时的识别率,对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,使具有相同识别准确率的多个阈值组合中,只保留正向检出百分比最大的一组阈值组合,从而缩短确定识别模型识别时使用的阈值组合的时间,也可以说预处理的目的在于便于确定识别模型识别时所使用的阈值组合,同时保证对目标识别时的识别率。
图2是根据一示例性实施例示出的一种识别模型的目标对象识别方法的流程示意图,识别模型包括检测模型和分类模型,如图2所示,包括以下步骤:
步骤S201,将待识别图像输入检测模型,确定输出的检测框及第一概率。
具体实施时,检测模型可以检测出待识别图像中包含对象的检测框,各检测框中的对象可以相同,也可以不同,对象中可能包含目标对象,并且检测模型检测出待识别图像中包含对象的检测框时,也确定各检测框的第一概率,第一概率的含义为,在检测框中包含对象的概率。
例如,目标对象为“狗”,待识别图像中包含“狗”以及其他对象“猫”,检测模型检出的检测框中,包含全部对象,或者包含部分对象,再或者不包含对象,换句话说检测模型用于检测待识别图像中是否包含对象(“狗”和/或“猫”),并且每个检测框有第一概率,标识该检测框包含对象的概率,如检测框的第一概率为0.8,表明该检测框中包含对象(“狗”和/或“猫”)的概率是0.8。
步骤S202,确定第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间。
具体实施时,多个检测概率区间互补重叠,也即检测概率区间之间不存在交集,例如多个检测概率区间可以是(0,0.24),(0.24,0.6),(0.6,1),也可以是[0.2,0.3],[0.4,0.6],[0.65,1],还可以是[0,0.24),[0.24,0.6],(0.6,1]。
目标检测概率区间,为第一概率所属的检测概率区间,例如,多个检测概率区间为[0,0.24),[0.24,0.6],(0.6,1],第一概率为0.8时,第一概率的目标检测概率区间为(0.6,1]。
步骤S203,将检测模型输出的包含检测框的图像输入分类模型,确定分类模型输出的第二概率。
具体实施时,分类模型用于确定待识别图像的检测框中的对象是否为目标对象,并输出第二概率,表示待识别图像的检测框中的对象是目标对象的概率。例如,目标对象为“狗”,待识别图像中包含“狗”以及其他对象“猫”,分类模型识别待识别图像的检测框中的对象是否为目标对象“狗”,第二概率值表示检测框中的对象是目标对象“狗”的概率。
步骤S204,第二概率大于预先确定的阈值组合中目标检测概率区间的分类阈值时,确定待识别图像中包含目标对象。
具体实施时,为多个检测概率区间设置的分类阈值,为预先确定的阈值组合中的分类阈值,阈值组合的次序与检测概率区间的次序相对应,例如,预先确定的阈值组合为0.8,0.7,0.65,多个检测概率区间为[0,0.24),[0.24,0.6],(0.6,1]时,检测概率区间[0,0.24)的分类阈值为0.8。
预先确定的阈值组合中目标检测概率区间的分类阈值,为第一概率的检测概率区间的分类阈值。例如,多个检测概率区间为[0,0.24),[0.24,0.6],(0.6,1],预先确定的阈值组合为0.8,0.7,0.65,第一概率为0.8,第二概率为0.7时,第一概率的目标检测概率区间为(0.6,1],(0.6,1]的分类阈值为0.65,第二概率0.7>分类阈值0.65,确定待识别图像中包含目标对象,也可以确定第一概率所属的检测框中包含目标对象。
图3是根据一示例性实施例示出的一种预先确定阈值组合方法的流程示意图,预先确定的阈值组合,用于本公开实施例提供的识别模型中,如图3所示,包括以下步骤:
步骤S301,针对识别模型设置多个阈值组合,每个阈值组合中包括检测模型的多个检测概率区间和分类模型针对每个检测概率区间设定的分类阈值。
具体实施时,设置多个阈值组合中,分类阈值的次序与检测概率区间的次序相对应,例如阈值组合为0.8,0.7,0.65,0.4,检测概率区间为[0,0.24),[0.24,0.5),[0.5,0.6),(0.6,1]时,检测概率区间[0.5,0.6)的分类阈值为0.65,检测模型输出的第一概率属于检测概率区间[0.5,0.6)时,第一概率检测框输入分类模型输出的第二概率与分类阈值0.65比较。
为识别模型设置多个阈值组合时,可以对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对初始分类阈值中的一个或多个进行调整,得到多组分类阈值。其中,分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,第一检测概率区间的左端点值小于第二检测概率区间的左端点值,预设阈值可以根据实际应用场景进行设置,通常,预设阈值取值为1,当然,预设阈值也可以为小于1的其它数值,本公开实施例对此不做限定。
本公开上述实施例中,在设置多个阈值组合时,结合多个检测概率区间和分类阈值进行设置,不但多个检测概率区间遍历整个检测概率区间,而且概率区间中概率值较小的对应设置较大的分类阈值,以确保多个阈值区间设置的合理性。
将多个检测概率区间与多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
具体实施时,根据实际应用场景或业务需求,确定设置检测概率区间个数n,各检测概率区间的长度为1/n,例如,检测概率区间个数为4,所有的检测概率区间可以是[0,0.25),[0.25,0.5),[0.5,0.75),(0.75,1]。
对每个检测概率区间设置一个分类阈值,可以对第n个检测概率区间设置分类阈值为x,x为分类阈值变化量(x∈[0,1],且mx∈[0,1],m∈N,N为正整数),换句话说,多个x的整数倍也在[0,1]中,设置其他n-1个检测概率区间的分类阈值为0。
以预设变化规律对初始分类阈值中的一个或多个进行调整时,为便于表述,第n各检测概率区间的分类阈值记为tn,tn的值为属于区间[0,1]中多个x的整数倍中的任一个,tn-1的值为属于区间[tn,1]中的多个x的整数倍中的任一个,且tn≤tn-1,以此类推,t2的值为[t3,1]中的多个x的整数倍中的任一个,且t3≤t2,t1的值为[t2,1]中的多个x的整数倍中的任一个,且t2≤t1
例如,分类阈值变化量x为0.1时,tn为0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1中的任一个,假设tn为0.1,tn-1为0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1中的任一个,若tn-1为0.3,tn-2为0.3,0.4,0.5,0.6,0.7,0.8,0.9,1中的任一个,以此类推,可以确定tn分别0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1时的所有多个阈值组合。
需要说明的是,本实施例中分类阈值变化量x为0.1仅用于举例说明,x的值可以是[0,1]中,且多个x的整数倍也在[0,1]中的任一数值,例如x还可以是0.15、0.2、0.23等。
步骤S302,利用每个阈值组合更新识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比。
具体实施时,预先获取的样本数据,可以包括但不限于:样本图像、样本图像中是否包含目标对象、样本图像中目标对象所在检测框的位置、样本图像的正向标记(包含目标对象的标记为正向)。
利用识别模型识别目标对象时,将包含检测框的图像输入分类模型,输出的第二概率大于检测框的第一概率所属目标区间的分类阈值时,标记该检测框中包含目标对象,也即该检测框的标记为正向。
需要说明的是,检测框中包含目标对象的检测框被标记为正向,一个图像可以包含多个检测框,多个检测框中的全部或部分检测框可以包含目标对象,多个检测框中也可以全部不包含目标对象。
利用每个阈值组合更新识别模型,并利用更新后的识别模型,并确定待识别图像的检测框中包含目标对象时,并标记为正向,可以经过统计,确定每个阈值组合对应的识别准确率和正向检出百分比。
识别准确率为利用识别模型识别目标对象时检测框标记为正向,且预先获取的检测框标记为正向的检测框总个数与全部利用识别模型识别目标对象时检测框标记为正向的检测框总个数的比值。
正向检出百分比为利用识别模型识别目标对象时检测框标记为正向,且预先获取的检测框标记为正向的检测框总个数与全部预先获取的检测框为正向的总个数的比值。
可以通过数据库或者数据表,记录每个阈值组合以及对应的识别准确率和正向检出百分比。
实际应用时,便于确定识别模型在识别时使用的阈值组合,可以对多个阈值组合对应的识别准确率和正向检出百分比进行预处理:
对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,预处理为保留多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比。
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
具体实施时,对多个阈值组合对应的识别准确率和正向检出百分比进行预处理,可以保留正向检出百分比小于识别准确率的阈值组合,可以对正向检出百分比大于等于识别准确率的阈值组合对应的识别准确率和正向检出百分比进行删除。
对多个阈值组合对应的识别准确率和正向检出百分比的预处理,也可在多个阈值组合对应的正向检出百分比相同时,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比,删除其他相同正向检出百分比的阈值组合对应的识别准确率和正向检出百分比。
需要说明的是,可以分别或同时进行上述两种对多个阈值组合对应的识别准确率和正向检出百分比进行预处理的过程。
步骤S303,在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
具体实施时,可以根据实际应用场景,或者实际使用的检测模型或分类模型,设置预设准确率阈值,例如80%,或设置预设检出百分比阈值,例如,85%,或者同时设置预设准确率阈值和预设检出百分比阈值。
将多个阈值组合对应的识别准确率,大于预设准确率阈值的识别准确率对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
或者,将多个阈值组合对应的正向检出百分比,大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
再或者,将多个阈值组合对应的识别准确率大于预设准确率阈值的识别准确率对应的阈值组合,并且对应的正向检出百分比,大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为识别模型识别时所使用的阈值组合。
图4根据一示例性实施例示出的一种预先确定阈值组合方法的流程示意图,预先确定的阈值组合,应用于本公开实施例提供的识别模型中,如图4所示,包括以下步骤:
步骤S401,获取样本数据。样本数据,可以包括但不限于:样本图像、样本图像中是否包含目标对象、样本图像中目标对象所在检测框的位置、样本图像的正向标记(包含目标对象的标记为正向)。
步骤S402,根据实际应用场景,确定预设识别准确率和/或预设正向检出百分比。
具体实施时,可以根据实际应用场景,确定预设识别准确率,或者确定预设正向检出百分比,或确定预设识别准确率和预设正向检出百分比,用于选择阈值组合。
步骤S403,确定检测概率区间个数、概率变化量及确定阈值组合时的预设变化规则。
具体实施时,设置检测概率区间个数n,并为每个检测概率区间设置一个分类阈值,各检测概率区间的分类阈值为一个阈值组合,由于每个检测概率区间设置的分类阈值不同,会有多个阈值组合。
在确定阈值组合时,设置概率变化量x(0≤x≤1),并且多个x的整数倍也在[0,1]中,第n段区间的分类阈值为tn,确定阈值组合时的预设变化规则为,tn的值为[0,1]中多个x的整数倍中的任一个,tn-1的值为[tn,1]中的多个x的整数倍中的任一个,且tn≤tn-1,以此类推,t2的值为[t3,1]中的多个x的整数倍中的任一个,且t3≤t2,t1的值为[t2,1]中的多个x的整数倍中的任一个,且t2≤t1
步骤S404,将[t1,t2,…,tn]记为一个阈值组合,并确定全部阈值组合,选取全部阈值组合中的任一个阈值组合为目标阈值组合。
步骤S405,基于目标阈值组合,确定各检测框的检测概率值所属区间,并在该检测框的分类概率值大于其所属区间的分类阈值时,记录该检测框为正向。
步骤S406,确定正向检出百分比和识别准确率。
具体实施时,确定分类模型输出的分类概率值大于该检测框的检测概率值所属区间的分类阈值时,记录检测框标记为正向,正向检出百分比为全部记录为正向且为有正向标记的检测框总个数与全部带有正向标记检测框总个数的比值,识别准确率为全部记录为正向且带有正向标记的检测框总个数与全部记录为正向的检测框总个数的比值,并在正向检出百分比小于识别准确率时,记录阈值组合、正向检出百分比以及识别准确率。
例如,预先获取待识别图片中经过检测模型确定的检测框的个数为300,其中带有正向标记的检测框的个数为100,将预先获取的待识别图像输入经过目标阈值组合更新过的识别模型,经过检测模型和分类模型后,记录检测框标记为正向的检测框个数为40,其中预先获取各检测框带有正向标记的检测框个数为30,也即有10个检测框是被错误标记的,此时,正向检出百分比为30/100,识别准确率为30/40。
步骤S407,针对全部阈值组合中的每一个,遍历所有阈值组合,确定正向检出百分比和识别准确率,并在正向检出百分比小于识别准确率时,记录阈值组合、正向检出百分比及识别准确率,正向检出百分已存在记录中时,若待记录识别准确率大于已记录识别准确率,更新该正向检出百分所属记录中识别准确率为待记录识别准确率,并更新阈值组合为待记录阈值组合,否则不更新该正向检出百分比所属记录。
步骤S408,记录阈值组合、正向检出百分比及识别准确率时,若待记录识别准确率大于已记录识别准确率,更新该正向检出百分所属记录中识别准确率为待记录识别准确率,并更新阈值组合为待记录阈值组合,否则不更新该正向检出百分比所属记录。
步骤S409,确定正向检出百分比与识别准确率的变化曲线,横轴为正向检出百分比,纵轴为识别准确率,将每条记录中正向检出百分比及识别准确率在坐标系中确定位置,将相邻点连线,使坐标系中的所有散点连接。
步骤S410,根据预设正向检出百分比或预设识别准确率,确定正向检出百分比与识别准确率连线上的点,该点所属记录中的分类阈值组合,为最优目标分类阈值组合。
图5是根据一示例性实施例示出的一种基于识别模型的目标对象识别装置框图,如图5所示,该装置包括处理单元501和确定单元502。
该处理单元501,被配置为执行将待识别图像输入所述检测模型,确定所述检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,所述第一概率为所述待识别图像包含对象的概率,其中,所述多个检测概率区间互不重叠。
该确定单元502,被配置为执行将所述检测模型输出的包含检测框的图像输入所述分类模型,在确定所述分类模型输出的第二概率大于预先确定的阈值组合中所述目标检测概率区间对应的分类阈值时,确定所述待识别图像中包含目标对象,所述第二概率为所述检测框包含目标对象的概率。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元502被配置为执行如下步骤确定所述预先确定的阈值组合:
针对所述识别模型设置多个阈值组合,每个阈值组合中包括所述检测模型的多个检测概率区间和所述分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新所述识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元502具体被配置为执行:
对所述多个阈值组合对应的识别准确率和正向检出百分比进行预处理,所述预处理为保留所述多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比;
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,确定单元502具体被配置为执行:
针对所述检测模型,设置多个检测概率区间;
针对所述分类模型,对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对所述初始分类阈值中的一个或多个进行调整,得到多组分类阈值,其中,所述分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,所述第一检测概率区间的左端点值小于所述第二检测概率区间的左端点值;
将所述多个检测概率区间与所述多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
一种可能的实施方式中,本公开提供的基于识别模型的目标对象识别装置中,多个检测概率区间的并集为区间[0,1]。
基于上述本公开实施例相同构思,图6是根据一示例性实施例示出的基于识别模型的目标对象识别设备600的框图,如图6所示,本公开实施例示出的基于识别模型的目标对象识别设备600,包括:
处理器610;
用于存储处理器610可执行指令的存储器620;
其中,处理器610被配置为执行指令,以实现本公开实施例中基于识别模型的目标对象识别方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器620,上述指令可由基于识别模型的目标对象识别装置的处理器610执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开实施例中,如图7所示,本公开实施例给出一种应用本公开实施例提供的基于识别模型的目标对象识别方法的终端700,包括:射频(Radio Frequency,RF)电路710、电源720、处理器730、存储器740、输入单元750、显示单元760、摄像头770、通信接口780、以及无线保真(Wireless Fidelity,Wi-Fi)模块790等部件。本领域技术人员可以理解,图7中示出的终端的结构并不构成对终端的限定,本申请实施例提供的终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图7对终端700的各个构成部件进行具体的介绍:
RF电路710可用于通信或通话过程中,数据的接收和发送。特别地,RF电路710在接收到基站的下行数据后,发送给处理器730处理;另外,将待发送的上行数据发送给基站。通常,RF电路710包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(LowNoise Amplifier,LNA)、双工器等。
此外,RF电路710还可以通过无线通信与网络和其他终端通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobilecommunication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
Wi-Fi技术属于短距离无线传输技术,终端700通过Wi-Fi模块790可以连接接入点(Access Point,AP),从而实现数据网络的访问。Wi-Fi模块790可用于通信过程中,数据的接收和发送。
终端700可以通过通信接口780与其他终端实现物理连接。可选的,通信接口780与其他终端的通信接口通过电缆连接,实现终端700和其他终端之间的数据传输。
由于在本申请实施例中,终端700能够实现通信业务,向其他联系人发送信息,因此终端700需要具有数据传输功能,即终端700内部需要包含通信模块。虽然图7示出了RF电路710、Wi-Fi模块790、和通信接口780等通信模块,但是可以理解的是,终端700中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块),以进行数据传输。
例如,当终端700为手机时,终端700可以包含RF电路710,还可以包含Wi-Fi模块790;当终端700为计算机时,终端700可以包含通信接口780,还可以包含Wi-Fi模块790;当终端700为平板电脑时,终端700可以包含Wi-Fi模块。
存储器740可用于存储软件程序以及模块。处理器730通过运行存储在存储器740的软件程序以及模块,从而执行终端700的各种功能应用以及数据处理,并且当处理器730执行存储器740中的程序代码后,可以实现本公开实施例图1、图2、图3、图4中的部分或全部过程。
可选的,存储器740可以主要包括存储程序区和存储数据区。其中,存储程序区可存储操作系统、各种应用程序(比如通信应用)以及人脸识别模块等;存储数据区可存储根据终端的使用所创建的数据(比如各种图片、视频文件等多媒体文件,以及人脸信息模板)等。
此外,存储器740可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元750可用于接收用户输入的数字或字符信息,以及产生与终端700的用户设置以及功能控制有关的键信号输入。
可选的,输入单元750可包括触控面板751以及其他输入终端752。
其中,触控面板751,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板751上或在触控面板751附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板751可以包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器730,并能接收处理器730发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板751。
可选的,其他输入终端752可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元760可用于显示由用户输入的信息或提供给用户的信息以及终端700的各种菜单。显示单元760即为终端700的显示系统,用于呈现界面,实现人机交互。
显示单元760可以包括显示面板761。可选的,显示面板761可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
进一步的,触控面板751可覆盖显示面板761,当触控面板751检测到在其上或附近的触摸操作后,传送给处理器730以确定触摸事件的类型,随后处理器730根据触摸事件的类型在显示面板761上提供相应的视觉输出。
虽然在图7中,触控面板751与显示面板761是作为两个独立的部件来实现终端700的输入和输入功能,但是在某些实施例中,可以将触控面板751与显示面板761集成而实现终端700的输入和输出功能。
处理器730是终端700的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器740内的软件程序和/或模块,以及调用存储在存储器740内的数据,执行终端700的各种功能和处理数据,从而实现基于终端的多种业务。
可选的,处理器730可包括一个或多个处理单元。可选的,处理器730可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器730中。
摄像头770,用于实现终端700的拍摄功能,拍摄图片或视频。摄像头770还可以用于实现终端700的扫描功能,对扫描对象(二维码/条形码)进行扫描。
终端700还包括用于给各个部件供电的电源720(比如电池)。可选的,电源720可以通过电源管理系统与处理器730逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
需要说明的是,本公开实施例处理器730可以执行图6中处理器610的功能,存储器740存储处理器610中的内容。
另外,在示例性实施例中,本公开还提供了一种存储介质,当存储介质中的指令由上述基于识别模型的目标对象识别设备的处理器执行时,使得上述基于识别模型的目标对象识别设备能够实现本公开实施例中的基于识别模型的目标对象识别方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于识别模型的目标对象识别方法,其特征在于,所述识别模型包括检测模型和分类模型,所述方法包括:
将待识别图像输入所述检测模型,确定所述检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,所述第一概率为所述待识别图像包含对象的概率,其中,所述多个检测概率区间互不重叠;
将所述检测模型输出的包含检测框的图像输入所述分类模型,在确定所述分类模型输出的第二概率大于预先确定的阈值组合中所述目标检测概率区间对应的分类阈值时,确定所述待识别图像中包含目标对象,所述第二概率为所述检测框包含目标对象的概率;
其中,所述预先确定的阈值组合采用如下步骤确定:
针对所述识别模型设置多个阈值组合,每个阈值组合中包括所述检测模型的多个检测概率区间和所述分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新所述识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
2.根据权利要求1所述的方法,其特征在于,所述在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合,包括:
对所述多个阈值组合对应的识别准确率和正向检出百分比进行预处理,所述预处理为保留所述多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比;
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
3.根据权利要求1所述的方法,其特征在于,所述针对所述识别模型设置多个阈值组合,包括:
针对所述检测模型,设置多个检测概率区间;
针对所述分类模型,对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对所述初始分类阈值中的一个或多个进行调整,得到多组分类阈值,其中,所述分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,所述第一检测概率区间的左端点值小于所述第二检测概率区间的左端点值;
将所述多个检测概率区间与所述多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述多个检测概率区间的并集为区间[0,1]。
5.一种基于识别模型的目标对象识别装置,所述识别模型包括检测模型和分类模型,其特征在于,所述装置包括:
处理单元,被配置为执行将待识别图像输入所述检测模型,确定所述检测模型输出的第一概率在预先设置的多个检测概率区间中所属的目标检测概率区间,所述第一概率为所述待识别图像包含对象的概率,其中,所述多个检测概率区间互不重叠;
确定单元,被配置为执行将所述检测模型输出的包含检测框的图像输入所述分类模型,在确定所述分类模型输出的第二概率大于预先确定的阈值组合中所述目标检测概率区间对应的分类阈值时,确定所述待识别图像中包含目标对象,所述第二概率为所述检测框包含目标对象的概率;
其中,所述确定单元被配置为执行如下步骤确定所述预先确定的阈值组合:
针对所述识别模型设置多个阈值组合,每个阈值组合中包括所述检测模型的多个检测概率区间和所述分类模型针对每个检测概率区间设定的分类阈值;
利用每个阈值组合更新所述识别模型,并利用更新后的识别模型,对预先获取的样本数据进行识别,确定每个阈值组合对应的识别准确率和正向检出百分比;
在多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
6.根据权利要求5所述的装置,其特征在于,所述确定单元具体被配置为执行:
对所述多个阈值组合对应的识别准确率和正向检出百分比进行预处理,所述预处理为保留所述多个阈值组合对应的正向检出百分比小于识别准确率的阈值组合,和/或若确定两个及以上的阈值组合对应的正向检出百分比相同,保留识别准确率最大的阈值组合对应的识别准确率和正向检出百分比;
在预处理后的多个阈值组合对应的识别准确率和正向检出百分比中,将大于预设准确率阈值的识别准确率对应的阈值组合,和/或大于预设检出百分比阈值的正向检出百分比对应的阈值组合,确定为所述识别模型识别时所使用的阈值组合。
7.根据权利要求5所述的装置,其特征在于,所述确定单元具体被配置为执行:
针对所述检测模型,设置多个检测概率区间;
针对所述分类模型,对应于每个检测概率区间设置一个分类阈值,得到初始分类阈值,并以预设变化规律对所述初始分类阈值中的一个或多个进行调整,得到多组分类阈值,其中,所述分类阈值均小于预设阈值,且第一检测概率区间对应的分类阈值大于等于第二检测概率区间对应的分类阈值,所述第一检测概率区间的左端点值小于所述第二检测概率区间的左端点值;
将所述多个检测概率区间与所述多组分类阈值中每组分类阈值的组合确定为一组阈值组合,得到多组阈值组合。
8.根据权利要求5-7中任一项所述的装置,其特征在于,所述多个检测概率区间的并集为区间[0,1]。
9.一种基于识别模型的目标对象识别设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令以实现如权利要求1至4中任一项所述的基于识别模型的目标对象识别方法。
10.一种存储介质,其特征在于,当所述存储介质中的指令由基于识别模型的目标对象识别设备的处理器执行时,使得基于识别模型的目标对象识别设备能够执行如权利要求1至4中任意一项所述的基于识别模型的目标对象识别方法。
CN201910969015.1A 2019-10-12 2019-10-12 一种目标对象识别方法、装置、设备及介质 Active CN110796034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910969015.1A CN110796034B (zh) 2019-10-12 2019-10-12 一种目标对象识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910969015.1A CN110796034B (zh) 2019-10-12 2019-10-12 一种目标对象识别方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110796034A CN110796034A (zh) 2020-02-14
CN110796034B true CN110796034B (zh) 2022-04-22

Family

ID=69439040

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910969015.1A Active CN110796034B (zh) 2019-10-12 2019-10-12 一种目标对象识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110796034B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488927B (zh) * 2020-04-08 2023-07-21 中国医学科学院肿瘤医院 分类阈值确定方法、装置、电子设备及存储介质
CN113743445B (zh) * 2021-07-15 2024-06-04 上海朋熙半导体有限公司 目标对象识别方法、装置、计算机设备和存储介质
CN116071600B (zh) * 2023-02-17 2023-08-04 中国科学院地理科学与资源研究所 一种基于多分类概率的农作物遥感识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844283A (zh) * 2015-01-16 2016-08-10 阿里巴巴集团控股有限公司 用于识别图像类目归属的方法、图像搜索方法及装置
CN107045506A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 评估指标获取方法及装置
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN108363998A (zh) * 2018-03-21 2018-08-03 北京迈格威科技有限公司 一种对象的检测方法、装置、系统和电子设备
CN108921206A (zh) * 2018-06-15 2018-11-30 北京金山云网络技术有限公司 一种图像分类方法、装置、电子设备及存储介质
CN110135505A (zh) * 2019-05-20 2019-08-16 北京达佳互联信息技术有限公司 图像分类方法、装置、计算机设备及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12002545B2 (en) * 2011-08-03 2024-06-04 ExSano, Inc. Technique for identifying features

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844283A (zh) * 2015-01-16 2016-08-10 阿里巴巴集团控股有限公司 用于识别图像类目归属的方法、图像搜索方法及装置
CN107045506A (zh) * 2016-02-05 2017-08-15 阿里巴巴集团控股有限公司 评估指标获取方法及装置
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN108363998A (zh) * 2018-03-21 2018-08-03 北京迈格威科技有限公司 一种对象的检测方法、装置、系统和电子设备
CN108921206A (zh) * 2018-06-15 2018-11-30 北京金山云网络技术有限公司 一种图像分类方法、装置、电子设备及存储介质
CN110135505A (zh) * 2019-05-20 2019-08-16 北京达佳互联信息技术有限公司 图像分类方法、装置、计算机设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN110796034A (zh) 2020-02-14

Similar Documents

Publication Publication Date Title
CN111368934B (zh) 图像识别模型训练方法、图像识别方法以及相关装置
CN110796034B (zh) 一种目标对象识别方法、装置、设备及介质
CN111314721B (zh) 一种异常直播的确定方法、装置、设备及介质
CN108984064B (zh) 分屏显示方法、装置、存储介质和电子设备
CN105141496A (zh) 一种即时通信消息播放方法及装置
CN110753098B (zh) 下载请求执行方法及装置、服务器和存储介质
US11288439B2 (en) Method, equipment, and medium for displaying content
CN106203459B (zh) 图片处理方法及装置
US20170109756A1 (en) User Unsubscription Prediction Method and Apparatus
CN111144953B (zh) 一种资源分配方法、装置、设备及介质
CN107885448B (zh) 应用触摸操作的控制方法、移动终端及可读存储介质
CN105373534B (zh) 列表展示方法、装置及列表展示端
CN108011937B (zh) 消息推送方法、服务器、智能终端及计算机可读存储介质
CN110689479A (zh) 一种人脸上妆方法、装置、设备及介质
CN111259200A (zh) 视频类别划分方法、装置、电子设备及存储介质
CN111625690B (zh) 一种对象推荐方法、装置、设备及介质
CN110784672B (zh) 一种视频数据传输方法、装置、设备及存储介质
CN114693001A (zh) 一种泊车位预测方法、装置、电子设备及存储介质
CN113485899A (zh) 信息处理方法、终端设备及存储介质
CN109714483B (zh) 锁屏界面消息处理方法、装置、移动终端及存储介质
CN110597480B (zh) 一种自定义语音指令实现方法和终端
CN110572782A (zh) 一种短信回复的方法和设备
CN110096190B (zh) 一种显示二维码的方法和终端
CN114416254A (zh) 名片展示方法、智能终端及存储介质
CN111144845B (zh) 一种移动终端会议提醒方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant