CN111914879B - 分类参数值生成方法、图像分类方法、装置、设备及存储介质 - Google Patents

分类参数值生成方法、图像分类方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111914879B
CN111914879B CN202010550949.4A CN202010550949A CN111914879B CN 111914879 B CN111914879 B CN 111914879B CN 202010550949 A CN202010550949 A CN 202010550949A CN 111914879 B CN111914879 B CN 111914879B
Authority
CN
China
Prior art keywords
image
target
classification
sample image
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010550949.4A
Other languages
English (en)
Other versions
CN111914879A (zh
Inventor
魏秀参
崔权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN202010550949.4A priority Critical patent/CN111914879B/zh
Publication of CN111914879A publication Critical patent/CN111914879A/zh
Application granted granted Critical
Publication of CN111914879B publication Critical patent/CN111914879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种分类参数值生成方法、图像分类方法、装置、设备及存储介质,旨在解决当训练集中仅包括一张正样本图像时无法实现二分类的问题。所述分类参数值生成方法包括:获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;基于所述目标图像,确定所述目标类别的决策边界;根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。

Description

分类参数值生成方法、图像分类方法、装置、设备及存储介质
技术领域
本申请实施例涉及图像处理技术领域,具体而言,涉及一种分类参数值生成方法、图像分类方法、装置、设备及存储介质。
背景技术
在图像处理技术领域,图像的二分类技术是一个热门的技术主题。给定一张待分类图像后,可以利用图像二分类技术判断该待分类图像的类别是否属于目标类别。相关技术中,为了实现对图像类别的二分类,通常需要采集多张样本图像作为训练集,利用训练集对预设模型进行训练,从而获得能对图像类别进行二分类的二分类模型。其中,训练集中需要包括一定数量的正样本图像和一定数量的负样本图像。
为便于理解,以针对“车辆”这一目标类别进行二分类为例。首先获得多张样本图像作为训练集,训练集中需要包括一定数量的车辆图像和一定数量的非车辆图像,其中每张车辆图像作为一张正样本图像,每张非车辆图像作为一张负样本图像。然后基于训练集对预设模型进行训练,最终确定了预设模型中的各个模型参数。这些模型参数可作为分类参数值,用于判断待识别图像的类别是否属于“车辆”类别。
然而预设模型的训练成败(也即能否确定出分类参数值)很大程度地取决于训练集。相关技术中,为了确定出分类参数值以实现图像类别的二分类,需要确保训练集中的正样本图像数量和负样本图像数量之间相互平衡。然而由于采集样本图像的成本较高,在一般情况下,训练集中的正样本图像数量和负样本图像数量之间存在失衡的现象,例如训练集中绝大部分为正样本图像。甚至在一些极端情况下,训练集中可能仅包括一张正样本图像。在这种极端情况下,如何确定出分类参数值以实现图像类别的二分类,是一个亟待解决的问题。
发明内容
本申请实施例提供一种分类参数值生成方法、图像分类方法、装置、设备及存储介质,旨在解决当训练集中仅包括一张正样本图像时无法实现二分类的问题。
本申请实施例第一方面提供分类参数值生成方法,所述方法包括:
获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
基于所述目标图像,确定所述目标类别的决策边界;
根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;
其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。
本申请实施例第二方面提供一种图像分类方法,所述方法包括:
获得待分类图像,并提取所述待分类图像的图像特征;
根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的;
将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
本申请实施例第三方面提供一种分类参数值生成装置,所述装置包括:
目标图像获得模块,用于获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
决策边界确定模块,用于基于所述目标图像,确定所述目标类别的决策边界;
分类参考分数确定模块,用于根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;
其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。
本申请实施例第四方面提供一种图像分类装置,所述装置包括:
待分类图像获得模块,用于获得待分类图像,并提取所述待分类图像的图像特征;
分类分数确定模块,用于根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的;
图像类别确定模块,用于将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
本申请实施例第五方面提供一种可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现如本申请第一方面或第二方面所述的方法中的步骤。
本申请实施例第六方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本申请第一方面或第二方面所述的方法的步骤。
采用本申请提供的分类参数值生成方法,当训练集中仅包括一张属于目标类别的目标图像时,提取该目标图像的图像特征,并基于该目标图像,确定所述目标类别的决策边界。然后根据该目标图像的图像特征和目标类别的决策边界,确定所述目标类别的分类参考分数。其中,目标类别的决策边界和分类参考分数,可用于确定待分类图像是否属于所述目标类别。本申请中,仅基于训练集中的一张目标图像,即可以确定出目标类别的决策边界和分类参考分数等分类参数值,这些分类参数值可用于确定待分类图像是否属于所述目标类别,从而实现对待分类图像的二分类操作。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提出的分类参数值生成方法的流程图;
图2是本申请一实施例提出的分类参数值生成方法和二分类任务的示意图;
图3是本申请另一实施例提出的分类参数值生成方法和二分类任务的示意图;
图4是本申请一实施例提出的训练分类参数值生成模型的示意图;
图5是本申请一实施例提出的获得样本图像组的示意图;
图6是本申请另一实施例提出的获得样本图像组的示意图;
图7是本申请一实施例提出的图像分类方法的流程图;
图8是本申请一实施例提出的分类参数值生成装置的示意图;
图9是本申请一实施例提出的图像分类装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中,为了实现对图像类别的二分类,通常需要采集多张样本图像作为训练集,利用训练集对预设模型进行训练,从而获得能对图像类别进行二分类的二分类模型。其中,训练集中需要包括一定数量的正样本图像和一定数量的负样本图像。
然而预设模型的训练成败(也即能否确定出分类参数值)很大程度地取决于训练集。相关技术中,为了确定出分类参数值以实现图像类别的二分类,需要确保训练集中的正样本图像数量和负样本图像数量之间相互平衡。然而由于采集样本图像的成本较高,在一般情况下,训练集中的正样本图像数量和负样本图像数量之间存在失衡的现象,例如训练集中绝大部分为正样本图像。甚至在一些极端情况下,训练集中可能仅包括一张正样本图像。在这种极端情况下,如何确定出分类参数值以实现图像类别的二分类,是一个亟待解决的问题。
为此,参考图1和图2,图1是本申请一实施例提出的分类参数值生成方法的流程图,图2是本申请一实施例提出的分类参数值生成方法和二分类任务的示意图,旨在解决当训练集中仅包括一张正样本图像时无法实现二分类的问题。如图1所示,该方法包括以下步骤:
步骤S11:获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别。
其中,目标类别是指二分类任务中将待分类图像划分为两类时所依据的类别。为便于理解,如图2所示,假设二分类任务中需要从多个待分类图像中,将属于车辆类别的待分类图像划分为一类,将不属于车辆类别的待分类图像划分为另一类。在执行上述二分类任务(也即图像分类任务)之前,可以预先执行本申请提供的分类参数值生成方法,以生成用于执行上述二分类任务的分类参数值。在执行本申请提供的分类参数值生成方法的上述步骤S11时,获得的目标图像的类别应该为车辆类别。换言之,目标类别为车辆类别。
本申请在提取目标图像的图像特征时,可以采用多种提取方式。例如在一些实施例中,可以直接将目标图像整体表示为m×n的向量,将该向量作为目标图像的图像特征。其中m等于目标图像的宽度(即目标图像的像素点的列数),n等于目标图像的高度(即目标图像的像素点的行数),向量中的每个数值对应目标图像中一个像素的灰度值或RGB颜色值。
在另一些实施例中,可以对目标图像进行卷积操作,提取出目标图像的特征图feature map,作为目标图像的图像特征。
步骤S12:基于所述目标图像,确定所述目标类别的决策边界。
由于所述目标图像的类别为所述目标类别,因此本申请中可基于目标图像,确定目标类别的决策边界。
相关技术中,决策边界是用于对样本进行分类的边界。本申请中,决策边界是指将二分类任务中的待分类图像划分为目标类别和非目标类别的边界。为便于理解,沿用上述示例,如图2所示,假设二分类任务中需要从多个待分类图像中,将属于车辆类别的待分类图像划分为一类,将不属于车辆类别的待分类图像划分为另一类。则在执行本申请提供的分类参数值生成方法的上述步骤S12时,确定的决策边界ω是用于将二分类任务中的待分类图像划分为车辆图像和非车辆图像的边界。
本申请在基于目标图像确定目标类别的决策边界时,如图2所示,具体可以将目标图像输入预先训练的分类参数值生成模型,并将分类参数值生成模型所输出的边界确定为目标类别的决策边界ω。其中,关于分类参数值生成模型的训练方式,可参见后述实施例,本申请在此不赘述。
步骤S13:根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数。
本申请在确定目标类别的分类参考分数时,具体可以对决策边界与目标图像的图像特征做内积运算,并将运算结果作为目标类别的分类参考分数Sref,如图2所示。
通过执行上述步骤S11至步骤S13,得到所述目标类别的决策边界和所述目标类别的分类参考分数,这些数据作为所述目标类别对应的分类参数值,用于在二分类任务中确定所述待分类图像是否属于所述目标类别。如图2所示,在二分类任务中,目标类别的决策边界ω用于结合待分类图像的图像特征,确定待分类图像的分类分数。目标类别的分类参考分数Sref作为判断待分类图像是否属于目标类别的门限值,用于与待分类图像的分类分数进行比较,以确定待分类图像是否属于目标类别。具体地,待分类图像的分类分数表征待分类图像属于目标类别的可能性,如果待分类图像的分类分数大于或等于目标类别的分类参考分数Sref,则确定待分类图像属于目标类别。
采用本申请提供的分类参数值生成方法,如图2所示,当训练集中仅包括一张属于目标类别的目标图像时,提取该目标图像的图像特征,并基于该目标图像,确定所述目标类别的决策边界ω。然后根据该目标图像的图像特征和目标类别的决策边界,确定所述目标类别的分类参考分数Sref。其中,目标类别的决策边界ω和分类参考分数Sref,可用于确定待分类图像是否属于所述目标类别。本申请中,仅基于训练集中的一张目标图像,即可以确定出目标类别的决策边界ω和分类参考分数Sref等分类参数值,这些分类参数值可用于确定待分类图像是否属于所述目标类别,从而实现对待分类图像的二分类操作。
考虑到上述分类参考分数在二分类任务中作为门限值,用于与待分类图像的分类分数进行比较,以确定待分类图像是否属于目标类别。而上述分类参考分数是根据目标类别的决策边界和目标图像的图像特征而确定的,因此在利用上述分类参考分数进行二分类时,对于一些与目标图像相似的图像,更可能被确定为属于目标类别,而对于一些与目标图像不太相似的图像,通常被确定为不属于目标类别。
为便于理解,如图2所示,假设二分类任务中需要从多个待分类图像中,将属于车辆类别的待分类图像划分为一类,将不属于车辆类别的待分类图像划分为另一类。在二分类任务之前执行本申请提出的分类参数值生成方法时,选用的目标图像是一张轿车图像,该轿车图像的类别属于车辆类别。如图2所示,将执行上述步骤S11至步骤S13之后确定出的分类参考分数Sref作为门限值。在执行二分类任务期间,针对同样是轿车图像的待分类图像3,该待分类图像3的分类分数3高于分类参考分数Sref,从而可以被准确地确定为属于车辆图像。而针对是货车图像的待分类图像1,该待分类图像1的分类分数1低于分类参考分数Sref,从而被确定为不属于车辆图像。
可见,将上述步骤S11至步骤S13确定出的分类参考分数Sref作为门限值,其优点是可以更有效地避免将实际不属于车辆图像的待分类图像误判为车辆图像,使最终得到的车辆图像集合的纯净度高,车辆图像集合中不包括非车辆图像。其缺点是容易将一些实际属于车辆图像的待分类图像误判为不属于车辆图像。
为此,参考图3,图3是本申请另一实施例提出的分类参数值生成方法和二分类任务的示意图。如图3所示,本申请进一步提出:基于所述目标图像,确定所述目标类别的分类调整系数ξref;然后根据所述分类调整系数ξref,对所述分类参考分数Sref进行调整,得到调整后的分类参考分数S′ref。其中,调整后的分类参考分数S′ref和上述步骤S12所确定的决策边界ω,作为所述目标类别对应的分类参数值,用于在二分类任务中确定所述待分类图像是否属于所述目标类别。
如图3所示,在二分类任务中,目标类别的决策边界ω用于结合待分类图像的图像特征,确定待分类图像的分类分数。目标类别的调整后的分类参考分数S′ref作为判断待分类图像是否属于目标类别的门限值,用于与待分类图像的分类分数进行比较,以确定待分类图像是否属于目标类别。具体地,待分类图像的分类分数表征待分类图像属于目标类别的可能性,如果待分类图像的分类分数大于或等于目标类别的调整后的分类参考分数S′ref,则确定待分类图像属于目标类别。
本申请中,调整后的分类参考分数S′ref的数值低于调整前的分类参考分数Sref,相当于降低了二分类任务中的门限值,使得一些与目标图像不太相似但同属于目标类别的图像,能被确定为属于目标类别,从而提高二分类任务中对目标类别图像的检出率。
为便于理解,如图3所示,假设二分类任务中需要从多个待分类图像中,将属于车辆类别的待分类图像划分为一类,将不属于车辆类别的待分类图像划分为另一类。在二分类任务之前执行本申请提出的分类参数值生成方法时,选用的目标图像是一张轿车图像,该轿车图像的类别属于车辆类别。如图3所示,将调整后的分类参考分数S′ref作为门限值。在执行二分类任务期间,针对同样是轿车图像的待分类图像3,该待分类图像3的分类分数3高于调整后的分类参考分数S′ref,从而可以被准确地确定为属于车辆图像。针对是货车图像的待分类图像1,该待分类图像1的分类分数1也高于调整后的分类参考分数S′ref,从而也被确定为属于车辆图像。
本申请在根据分类调整系数ξref,对分类参考分数Sref进行调整时,可以采用多种调整方式。例如在一些实施例中,基于目标图像确定的分类调整系数ξref作为一种下调系数,利用分类调整系数ξref减分类参考分数Sref,调整后的分类参考分数S′ref等于Srefref。其中分类调整系数ξref为介于0到1的小数。
例如在另一些实施例中,基于目标图像确定的分类调整系数ξref作为一种折扣系数,利用分类调整系数ξref乘以分类参考分数Sref,调整后的分类参考分数S′ref等于Sref×ξref。其中分类调整系数ξref为介于0到1的小数。
本申请在基于目标图像确定目标类别的决策边界ω和分类调整系数ξref时,如图3所示,具体可以将目标图像输入预先训练的分类参数值生成模型,并将所述分类参数值生成模型输出的决策边界和系数,分别确定为所述目标类别的决策边界ω和所述目标类别的分类调整系数ξref
参考图4,图4是本申请一实施例提出的训练分类参数值生成模型的示意图。如图4所示,为了训练出分类参数值生成模型,可以获得多个样本图像组,每个样本图像组中包括一个目标样本图像、至少一个正样本图像和至少一个负样本图像,其中,正样本图像的类别与目标样本图像的类别相同,负样本图像的类别与目标样本图像的类别不同。
具体地,如图4所示,多个样本图像组中的每一横排为一个样本图像组,其中由虚线框所框示的图像为每个样本图像组中的目标样本图像,由实线框所框示的图像为每个样本图像组中的正样本图像和负样本图像。以第一个样本图像组为例,该样本图像组中的目标样本图像为飞机图像,该样本图像组中的正样本图像为实线框中的飞机图像,负样本图像为实线框中的非飞机图像(即其他图像)。
在获得样本图像组之后,针对每个样本图像组,将该样本图像组中的目标样本图像输入预设模型,得到所述预设模型输出的初始决策边界和初始分类调整系数;针对该样本图像组中的每个样本图像,根据该样本图像的图像特征和所述初始决策边界,确定该样本图像的初始分类分数;根据所述目标样本图像的初始分类分数,确定第一损失值;根据所述初始分类调整系数、所述目标样本图像的初始分类分数、该样本图像组中的每个正样本图像的初始分类分数、以及该样本图像组中的每个负样本图像的初始分类分数,确定第二损失值;基于所述第一损失值和第二损失值,更新所述预设模型。
具体实现时,如图4所示,以第一个样本图像组为例,首先针对该样本图像组中的每个样本图像,提取该样本图像的图像特征。其中,提取样本图像的图像特征的方式,可参考前述针对步骤S11的说明,本申请在此不赘述。然后可以将各个样本图像的图像特征进行分组,其中各个正样本图像的图像特征分为一组,均记为Spos;各个负样本图像的图像特征分为一组,均记为Sneg;目标样本图像的图像特征单独为一组,记为Xref
然后将目标样本图像的图像特征Xref输入预设模型M,预设模型M基于图像特征Xref输出初始决策边界ω和初始分类调整系数ξref
接着针对目标样本图像的图像特征Xref,对该图像特征Xref和初始决策边界ω做内积运算,得到该目标样本图像的初始分类分数Sref,该初始分类分数Sref用于表征该目标样本图像的类别属于飞机类别(飞机类别为目标样本图像实际所属的类别)的可能性。其中,在对图像特征Xref和初始决策边界ω做内积运算时,具体地,可以首先对初始决策边界ω进行L2规范化,得到规范化后的初始决策边界ω*,然后利用ω*的转置矩阵乘以图像特征Xref,即(ω*)TXref,得到目标样本图像的初始分类分数Sref(介于0到1之间的数)。如图4所示,目标样本图像的初始分类分数Sref为0.8。
同样地,针对每个正样本图像的图像特征Spos,对该图像特征Spos和初始决策边界ω做内积运算,得到该正样本图像的初始分类分数,该初始分类分数用于表征该正样本图像的类别属于飞机类别的可能性。如图4所示,多个正样本图像各自的初始分类分数分别为0.6、0.2和0.8,多个正样本图像各自的初始分类分数均即为Mpos
同样地,针对每个负样本图像的图像特征Sneg,对该图像特征Sneg和初始决策边界ω做内积运算,得到该负样本图像的初始分类分数,该初始分类分数用于表征该负样本图像的类别属于飞机类别的可能性。如图4所示,多个负样本图像各自的初始分类分数分别为0.9、0.8、0.3和0.5,多个负样本图像各自的初始分类分数均即为Mneg
如此,确定出第一个样本图像组中每个样本图像的初始分类分数。为了使图2或图3确定出的分类参数值在二分类任务期间,能非常置信地对与目标样本图像相同的待分类图像进行正确分类。该目标样本图像的初始分类分数Sref应该尽可能高,也即尽可能趋近于预设分数上限值Sref-MAX,如图4所示。为此,可以根据目标样本图像的初始分类分数Sref与预设分数上限值,确定第一损失值L1,其中,目标样本图像的初始分类分数Sref与预设分数上限值越接近,确定出的第一损失值L1越小。
示例地,第一损失值L1可以等于-ln(Sref)。以Sref等于0.8为例,第一损失值L1=-ln(0.8)=0.223。或者示例地,第一损失值L1也可以等于Relu(1-Sref),其中1为预设分数上限值,Relu函数是一种非线性函数。再或者示例地,第一损失值L1也可以等于1-Sref
此外,为了使图2或图3确定出的分类参数值在二分类期间,属于目标类别的待分类图像的分类分数大于调整后的初始分类分数S′ref,不属于目标类别的待分类图像的分类分数小于调整后的初始分类分数S′ref,如图4所示。为此,可以首先根据初始分类调整系数ξref,对所述目标样本图像的初始分类分数Sref进行调整,得到调整后的初始分类分数S′ref;然后根据每个正样本图像的初始分类分数Mpos与所述调整后的初始分类分数S′ref之间的大小关系,以及每个负样本图像的初始分类分数Mneg与所述调整后的初始分类分数S′ref之间的大小关系,确定第二损失值L2。
其中,根据初始分类调整系数ξref,对目标样本图像的初始分类分数Sref进行调整的调整方式,可参考上述实施例,本申请对此不赘述。
其中,在确定第二损失值L2时,示例地,可以通过如下公式计算第二损失值L2:
其中,S表示正样本图像总量和负样本图像总量的和值,y′i为正负调整系数,具体地,当Si为正样本图像的初始分类分数时,y′i等于1,当Si为负样本图像的初始分类分数时,y′i等于-1,S′ref表示目标样本图像的调整后的初始分类分数,Si表示正样本图像的初始分类分数或负样本图像的初始分类分数,C为预设的参数,ξref为初始分类调整系数。
在确定第一损失值和第二损失值之后,可以利用第一损失值和第二损失值对预设模型进行更新。通过利用多组样本图像组对预设模型进行多轮次的更新后,得到分类参数值生成模型。
需要说明的是,本申请中,多个样本图像组各自的目标样本图像所属的类别不全部相同。如图4所示,第一个样本图像组中目标样本图像的类别为飞机图像,第二个样本图像组中目标样本图像的类别为轮船图像,最后一个样本图像组中目标样本图像的类别为小鸟图像。由于多个样本图像组各自的目标样本图像所属的类别不全部相同,因此训练得到的分类参数值生成模型具有更广泛的适用性。
为便于理解,在通过图4所示的训练方式获得分类参数值生成模型之后,如果收到一个二分类任务,该二分类任务中需要从多个待分类图像中,将属于车辆类别的待分类图像划分为一类,将不属于车辆类别的待分类图像划分为另一类。则可以如前述步骤S11所述,获得一张目标图像,该目标图像的类别为车辆类别。然后将该目标图像输入训练得到的分类参数值生成模型,得到该模型输出的决策边界和系数,将模型输出的决策边界确定为车辆类别的决策边界,将模型输出的系数确定为车辆类别的分类调整系数。
如果又收到另一个二分类任务,该二分类任务中需要从多个待分类图像中,将属于小鸟类别的待分类图像划分为一类,将不属于小鸟类别的待分类图像划分为另一类。则可以如前述步骤S11所述,获得一张目标图像,该目标图像的类别为小鸟类别。然后将该目标图像输入训练得到的分类参数值生成模型,得到该模型输出的决策边界和系数,将模型输出的决策边界确定为小鸟类别的决策边界,将模型输出的系数确定为小鸟类别的分类调整系数。
需要说明的是,向分类参数值生成模型先后输入的图像不同,该模型先后输出的决策边界不相同,该模型先后输出的系数也不相同。
此外,如前所述,本申请在训练分类参数值生成模型期间,需要首先获得多个样本图像组。具体实现时,针对二分类目标的不同粒度,多个样本图像组的获得方式存在区别。
例如在另一些实施例中,二分类目标的粒度较细。例如二分类目标具体是:判断待分类图像的类别是否是轿车类别,或者判断待分类图像的类别是否是月季类别,再或者判断待分类图像的类别是否是哈士奇类别。针对这类细粒度的二分类目标,在获得多个样本图像组时,可以从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的子类别与该样本图像组中的目标样本图像的子类别相同,每个样本图像组中的负样本图像的子类别与该样本图像组中的目标样本图像的子类别不同,且负样本图像的父类别与目标样本图像的父类别相同。
为便于理解,参考图5,图5是本申请一实施例提出的获得样本图像组的示意图。如图5所示,预设图像库中的多张样本图像按照树状结构存储。其中,“狗”作为“哈士奇”、“柯基”、“拉布拉多”“斗牛犬”等子类别的父类别。假设二分类目标具体是:判断待分类图像的类别是否是哈士奇类别。则在训练分类参数值生成模型期间,首先从预设图像库中的“狗”这一父类中选择多张样本图像,组成多个样本图像组。如图5所示,其中一个样本图像组中的目标样本图像的类别为拉布拉多类别,由虚线框所框示的正样本图像均属于拉布拉多类别,由实线框所框示的负样本图像均属于狗类别,但不属于拉布拉多类别。其中另一个样本图像组中的目标样本图像的类别为哈士奇类别,由虚线框所框示的正样本图像均属于哈士奇类别,由实线框所框示的负样本图像均属于狗类别,但不属于哈士奇类别。
例如在一些实施例中,二分类目标的粒度较粗。例如二分类目标具体是:判断待分类图像的类别是否是车辆类别,或者判断待分类图像的类别是否是植物类别,再或者判断待分类图像的类别是否是小狗类别。针对这类粗粒度的二分类目标,在获得多个样本图像组时,可以从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的父类别与该样本图像组中的目标样本图像的父类别相同,每个样本图像组中的负样本图像的父类别与该样本图像组中的目标样本图像的父类别不同。
为便于理解,参考图6,图6是本申请另一实施例提出的获得样本图像组的示意图。如图6所示,预设图像库中的多张样本图像按照树状结构存储。其中,“狗”作为“哈士奇”、“柯基”、“拉布拉多”“斗牛犬”等子类别的父类别,“树”作为“柏树”、“棕榈树”、“榕树”等子类别的父类别。假设二分类目标具体是:判断待分类图像的类别是否是狗类别。则在训练分类参数值生成模型期间,首先从预设图像库中选择多张样本图像,组成多个样本图像组。如图6所示,其中一个样本图像组中的目标样本图像的类别为树类别,由虚线框所框示的正样本图像均属于树类别,由实线框所框示的负样本图像均不属于树类别。其中另一个样本图像组中的目标样本图像的类别为食物类别,由虚线框所框示的正样本图像均属于食物类别,由实线框所框示的负样本图像均不属于食物类别。
基于同一发明构思,本申请一实施例提供一种图像分类方法。参考图7,图7是本申请一实施例提出的图像分类方法的流程图。如图7所示,该方法包括以下步骤:
步骤S71:获得待分类图像,并提取所述待分类图像的图像特征。
其中,提取待分类图像的图像特征的具体方式,可参考前述实施例中对目标图像提取图像特征特征的方式,本申请在此不再赘述。
步骤S72:根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的。
其中,确定待分类图像的分类分数的具体方式,可以对待分类图像的图像特征和目标类别的决策边界进行内积运算,并将运算结果确定为待分类图像的分类分数。
具体实现时,可以首先对目标类别的决策边界ω进行L2规范化,得到规范化后的决策边界ω*,然后利用ω*的转置矩阵乘以待分类图像的图像特征X,即(ω*)TX,得到待分类图像的分类分数S(介于0到1之间的数)。
步骤S73:将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
具体实现时,在待分类图像的分类分数S大于或等于目标类别对应的分类参考分数的情况下,确定待分类图像属于目标类别。
如前所述,为了提高二分类任务中对目标类别图像的检出率,可以进一步引入分类调整系数,用于调整目标类别的分类参考分数。其中,利用分类调整系数对分类参考分数的具体调整方式,可参考上述实施例的说明,本申请对此不再赘述。其中,分类调整系数是基于所述目标图像而确定的,具体的确定方法可参考上述实施例的说明,本申请对此不再赘述。
如此,在执行上述步骤S73时,具体地,将所述分类分数与所述目标类别对应的调整后的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别。具体实现时,如果待分类图像的分类分数S大于或等于目标类别的调整后的分类参考分数,则确定待分类图像属于目标类别。如果待分类图像的分类分数S小于目标类别的调整后的分类参考分数,则确定待分类图像不属于目标类别。
此外,在进行上述图像分类(即步骤S71至步骤S73)之前,还可以预先获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;基于所述目标图像,确定所述目标类别的决策边界和所述目标类别的分类调整系数;根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数,并根据所述分类调整系数,对所述分类参考分数进行调整,得到调整后的分类参考分数。
基于同一发明构思,本申请一实施例提供一种分类参数值生成装置。参考图8,图8是本申请一实施例提出的分类参数值生成装置的示意图。如图8所示,该装置包括:
目标图像获得模块81,用于获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
决策边界确定模块82,用于基于所述目标图像,确定所述目标类别的决策边界;
分类参考分数确定模块83,用于根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;
其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。
可选地,所述装置还包括:
分类调整系数确定模块,用于基于所述目标图像,确定所述目标类别的分类调整系数;
分数调整模块,用于根据所述分类调整系数,对所述分类参考分数进行调整,得到调整后的分类参考分数;
其中,所述目标类别的决策边界和所述调整后的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。
可选地,所述决策边界确定模块和分类调整系数确定模块在基于所述目标图像,确定所述目标类别的决策边界和所述目标类别的分类调整系数时,具体用于将所述目标图像输入分类参数值生成模型,将所述分类参数值生成模型输出的决策边界和系数,分别确定为所述目标类别的决策边界和所述目标类别的分类调整系数。
可选地,所述装置还包括:
样本图像组获得模块,用于获得多个样本图像组,每个样本图像组中包括一个目标样本图像、至少一个正样本图像和至少一个负样本图像,其中,正样本图像的类别与目标样本图像的类别相同,负样本图像的类别与目标样本图像的类别不同;
模型训练模块,用于针对所述多个样本图像组中的每个样本图像组,执行以下步骤:
将该样本图像组中的目标样本图像输入预设模型,得到所述预设模型输出的初始决策边界和初始分类调整系数;
针对所述样本图像组中的每个样本图像,根据该样本图像的图像特征和所述初始决策边界,确定该样本图像的初始分类分数;
根据所述目标样本图像的初始分类分数,确定第一损失值;
根据所述初始分类调整系数、所述目标样本图像的初始分类分数、每个正样本图像的初始分类分数、以及每个负样本图像的初始分类分数,确定第二损失值;
基于所述第一损失值和第二损失值,更新所述预设模型。
可选地,所述模型训练模块在确定第一损失值时,具体用于根据所述初始分类分数与预设分数上限值,确定第一损失值,其中,所述初始分类分数与预设分数上限值越接近,所述第一损失值越小。
可选地,所述模型训练模块在确定第二损失值时,具体用于根据所述初始分类调整系数,对所述目标样本图像的初始分类分数进行调整,得到调整后的初始分类分数;
根据每个正样本图像的初始分类分数与所述调整后的初始分类分数之间的大小关系,以及每个负样本图像的初始分类分数与所述调整后的初始分类分数之间的大小关系,确定第二损失值。
可选地,所述样本图像组获得模块在获得多个样本图像组时,具体用于从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的父类别与该样本图像组中的目标样本图像的父类别相同,每个样本图像组中的负样本图像的父类别与该样本图像组中的目标样本图像的父类别不同;
或者,具体用于从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的子类别与该样本图像组中的目标样本图像的子类别相同,每个样本图像组中的负样本图像的子类别与该样本图像组中的目标样本图像的子类别不同,且负样本图像的父类别与目标样本图像的父类别相同。
基于同一发明构思,本申请一实施例提供一种图像分类装置。参考图9,图9是本申请一实施例提出的图像分类装置的示意图。如图9所示,该装置包括:
待分类图像获得模块91,用于获得待分类图像,并提取所述待分类图像的图像特征;
分类分数确定模块92,用于根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的;
图像类别确定模块93,用于将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
可选地,所述图像类别确定模块在将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别时,具体用于将所述分类分数与所述目标类别对应的调整后的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别;
其中,所述调整后的分类参考分数是根据分类调整系数对所述分类参考分数调整后得到的,所述分类调整系数是基于所述目标图像而确定的。
可选地,所述装置还包括:
目标图像获得模块,用于获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
决策边界和分类调整系数确定模块,用于基于所述目标图像,确定所述目标类别的决策边界和所述目标类别的分类调整系数;
分类参考分数确定模块,用于根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数,并根据所述分类调整系数,对所述分类参考分数进行调整,得到调整后的分类参考分数。
基于同一发明构思,本申请另一实施例提供一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请上述任一实施例所述的分类参数值生成方法或图像分类方法中的步骤。
基于同一发明构思,本申请另一实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行时实现本申请上述任一实施例所述的分类参数值生成方法或图像分类方法中的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种分类参数值生成方法、图像分类方法、装置、设备及存储介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种分类参数值生成方法,其特征在于,所述方法包括:
获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
基于所述目标图像,确定所述目标类别的决策边界;
根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;
其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定待分类图像是否属于所述目标类别;
其中,基于所述目标图像,确定所述目标类别的决策边界,包括:
将所述目标图像输入分类参数值生成模型,将所述分类参数值生成模型输出的决策边界确定为所述目标类别的决策边界;
所述分类参数值生成模型是通过以下步骤训练得到的:
获得多个样本图像组,每个样本图像组中包括一个目标样本图像、至少一个正样本图像和至少一个负样本图像,其中,正样本图像的类别与目标样本图像的类别相同,负样本图像的类别与目标样本图像的类别不同;
针对所述多个样本图像组中的每个样本图像组,执行以下步骤:
将该样本图像组中的目标样本图像输入预设模型,得到所述预设模型输出的初始决策边界和初始分类调整系数;
针对所述样本图像组中的每个样本图像,根据该样本图像的图像特征和所述初始决策边界,确定该样本图像的初始分类分数;
根据所述目标样本图像的初始分类分数,确定第一损失值;
根据所述初始分类调整系数、所述目标样本图像的初始分类分数、每个正样本图像的初始分类分数、以及每个负样本图像的初始分类分数,确定第二损失值;
基于所述第一损失值和第二损失值,更新所述预设模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述目标图像,确定所述目标类别的分类调整系数;
根据所述分类调整系数,对所述分类参考分数进行调整,得到调整后的分类参考分数;
其中,所述目标类别的决策边界和所述调整后的分类参考分数,用于确定所述待分类图像是否属于所述目标类别。
3.根据权利要求2所述的方法,其特征在于,基于所述目标图像,确定所述目标类别的分类调整系数,包括:
将所述目标图像输入分类参数值生成模型,将所述分类参数值生成模型输出的系数,确定为所述目标类别的分类调整系数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标样本图像的初始分类分数,确定第一损失值的步骤,包括:
根据所述初始分类分数与预设分数上限值,确定第一损失值,其中,所述初始分类分数与预设分数上限值越接近,所述第一损失值越小。
5.根据权利要求1所述的方法,其特征在于,所述根据所述初始分类调整系数、所述目标样本图像的初始分类分数、每个正样本图像的初始分类分数、以及每个负样本图像的初始分类分数,确定第二损失值的步骤,包括:
根据所述初始分类调整系数,对所述目标样本图像的初始分类分数进行调整,得到调整后的初始分类分数;
根据每个正样本图像的初始分类分数与所述调整后的初始分类分数之间的大小关系,以及每个负样本图像的初始分类分数与所述调整后的初始分类分数之间的大小关系,确定第二损失值。
6.根据权利要求1所述的方法,其特征在于,所述获得多个样本图像组的步骤,包括:
从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的父类别与该样本图像组中的目标样本图像的父类别相同,每个样本图像组中的负样本图像的父类别与该样本图像组中的目标样本图像的父类别不同;
或者,从预设图像库中选择多个样本图像,并将所述多个样本图像划分为多个样本图像组,其中,每个样本图像组中的正样本图像的子类别与该样本图像组中的目标样本图像的子类别相同,每个样本图像组中的负样本图像的子类别与该样本图像组中的目标样本图像的子类别不同,且负样本图像的父类别与目标样本图像的父类别相同。
7.一种基于权利要求1所述方法实现的图像分类方法,其特征在于,所述方法包括:
获得待分类图像,并提取所述待分类图像的图像特征;
根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的;
将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
8.根据权利要求7所述的图像分类方法,其特征在于,所述将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别的步骤,包括:
将所述分类分数与所述目标类别对应的调整后的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别;
其中,所述调整后的分类参考分数是根据分类调整系数对所述分类参考分数调整后得到的,所述分类调整系数是基于所述目标图像而确定的。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
基于所述目标图像,确定所述目标类别的决策边界和所述目标类别的分类调整系数;
根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数,并根据所述分类调整系数,对所述分类参考分数进行调整,得到调整后的分类参考分数。
10.一种分类参数值生成装置,其特征在于,所述装置包括:
目标图像获得模块,用于获得目标图像,并提取所述目标图像的图像特征,所述目标图像的类别为目标类别;
决策边界确定模块,用于基于所述目标图像,确定所述目标类别的决策边界;
分类参考分数确定模块,用于根据所述目标类别的决策边界和所述目标图像的图像特征,确定所述目标类别的分类参考分数;
其中,所述目标类别的决策边界和所述目标类别的分类参考分数,用于确定待分类图像是否属于所述目标类别;
其中,所述决策边界确定模块在基于所述目标图像,确定所述目标类别的决策边界时,用于将所述目标图像输入分类参数值生成模型,将所述分类参数值生成模型输出的决策边界,确定为所述目标类别的决策边界;
所述装置还包括:
样本图像组获得模块,用于获得多个样本图像组,每个样本图像组中包括一个目标样本图像、至少一个正样本图像和至少一个负样本图像,其中,正样本图像的类别与目标样本图像的类别相同,负样本图像的类别与目标样本图像的类别不同;
模型训练模块,用于针对所述多个样本图像组中的每个样本图像组,执行以下步骤:
将该样本图像组中的目标样本图像输入预设模型,得到所述预设模型输出的初始决策边界和初始分类调整系数;
针对所述样本图像组中的每个样本图像,根据该样本图像的图像特征和所述初始决策边界,确定该样本图像的初始分类分数;
根据所述目标样本图像的初始分类分数,确定第一损失值;
根据所述初始分类调整系数、所述目标样本图像的初始分类分数、每个正样本图像的初始分类分数、以及每个负样本图像的初始分类分数,确定第二损失值;
基于所述第一损失值和第二损失值,更新所述预设模型。
11.一种基于权利要求10所述装置实现的图像分类装置,其特征在于,所述装置包括:
待分类图像获得模块,用于获得待分类图像,并提取所述待分类图像的图像特征;
分类分数确定模块,用于根据所述待分类图像的图像特征和目标类别的决策边界,确定所述待分类图像的分类分数,其中,所述目标类别的决策边界是基于一张属于所述目标类别的目标图像而确定的;
图像类别确定模块,用于将所述分类分数与所述目标类别对应的分类参考分数相比较,以确定所述待分类图像是否属于所述目标类别,其中,所述分类参考分数是基于所述目标类别的决策边界和所述目标图像的图像特征而确定的。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1至6任一所述的方法中的步骤,或者实现如权利要求7至9任一所述的方法中的步骤。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如权利要求1至6任一所述的方法的步骤,或者实现如权利要求7至9任一所述的方法中的步骤。
CN202010550949.4A 2020-06-16 2020-06-16 分类参数值生成方法、图像分类方法、装置、设备及存储介质 Active CN111914879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010550949.4A CN111914879B (zh) 2020-06-16 2020-06-16 分类参数值生成方法、图像分类方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010550949.4A CN111914879B (zh) 2020-06-16 2020-06-16 分类参数值生成方法、图像分类方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111914879A CN111914879A (zh) 2020-11-10
CN111914879B true CN111914879B (zh) 2024-04-26

Family

ID=73237837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010550949.4A Active CN111914879B (zh) 2020-06-16 2020-06-16 分类参数值生成方法、图像分类方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111914879B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019154262A1 (zh) * 2018-02-07 2019-08-15 腾讯科技(深圳)有限公司 一种图像分类方法及服务器、用户终端、存储介质
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质
WO2020082748A1 (zh) * 2018-10-25 2020-04-30 腾讯科技(深圳)有限公司 一种检测模型的训练方法、装置及终端设备
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111260665A (zh) * 2020-01-17 2020-06-09 北京达佳互联信息技术有限公司 图像分割模型训练方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019154262A1 (zh) * 2018-02-07 2019-08-15 腾讯科技(深圳)有限公司 一种图像分类方法及服务器、用户终端、存储介质
WO2020082748A1 (zh) * 2018-10-25 2020-04-30 腾讯科技(深圳)有限公司 一种检测模型的训练方法、装置及终端设备
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质
CN111160411A (zh) * 2019-12-11 2020-05-15 东软集团股份有限公司 分类模型训练方法、图像处理方法、装置、介质及设备
CN111260665A (zh) * 2020-01-17 2020-06-09 北京达佳互联信息技术有限公司 图像分割模型训练方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种适用于情报图像处理的图像集分类算法;李大超;韩松;;航空电子技术(第03期);全文 *

Also Published As

Publication number Publication date
CN111914879A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN111031346B (zh) 一种增强视频画质的方法和装置
CN105786860B (zh) 一种数据建模中的数据处理方法及装置
CN104537359B (zh) 一种车辆目标检测方法及装置
CN111353505B (zh) 基于可联合实现语义分割和景深估计的网络模型的装置
CN110245747B (zh) 基于全卷积神经网络的图像处理方法及装置
CN110135505B (zh) 图像分类方法、装置、计算机设备及计算机可读存储介质
CN111723841A (zh) 文本检测方法、装置、电子设备及存储介质
CN111091147B (zh) 一种图像分类方法、装置及设备
CN112836820B (zh) 用于图像分类任务的深度卷积网络训练方法、装置及系统
CN111126278A (zh) 针对少类别场景的目标检测模型优化与加速的方法
CN109367543B (zh) 驾驶设备决策的预测方法和装置
CN111814820B (zh) 图像处理方法及装置
CN111881948A (zh) 神经网络模型的训练方法及装置、数据的分类方法及装置
CN112132130A (zh) 一种面向全场景的实时性车牌检测方法及系统
CN117765480B (zh) 一种道路沿线野生动物迁徙预警方法及系统
CN103870563B (zh) 确定给定文本的主题分布的方法和装置
CN111950579A (zh) 分类模型的训练方法和训练装置
CN114022416A (zh) 一种图像清晰度检测方法、装置、电子设备及存储介质
CN111914879B (zh) 分类参数值生成方法、图像分类方法、装置、设备及存储介质
CN111091140B (zh) 目标分类方法、装置及可读存储介质
CN110889316B (zh) 一种目标对象识别方法、装置及存储介质
CN113807541B (zh) 决策系统的公平性修复方法、系统、设备及存储介质
CN115661542A (zh) 一种基于特征关系迁移的小样本目标检测方法
JP2020035103A (ja) 学習プログラム、画像分類プログラム、学習方法、画像分類方法、学習装置および画像分類装置
CN108805190B (zh) 一种图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant