CN112149745A - 确定难例样本的方法、装置、设备及存储介质 - Google Patents

确定难例样本的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112149745A
CN112149745A CN202011032968.4A CN202011032968A CN112149745A CN 112149745 A CN112149745 A CN 112149745A CN 202011032968 A CN202011032968 A CN 202011032968A CN 112149745 A CN112149745 A CN 112149745A
Authority
CN
China
Prior art keywords
sample image
target sample
image
recognition
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011032968.4A
Other languages
English (en)
Other versions
CN112149745B (zh
Inventor
蔡晓蕙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Goldway Intelligent Transportation System Co Ltd
Original Assignee
Shanghai Goldway Intelligent Transportation System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Goldway Intelligent Transportation System Co Ltd filed Critical Shanghai Goldway Intelligent Transportation System Co Ltd
Priority to CN202011032968.4A priority Critical patent/CN112149745B/zh
Publication of CN112149745A publication Critical patent/CN112149745A/zh
Application granted granted Critical
Publication of CN112149745B publication Critical patent/CN112149745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种确定难例样本的方法、装置、设备及存储介质,属于机器学习技术领域。所述方法包括:按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;基于预设的图像识别模型,确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。采用本申请,可以提高挖掘难例样本图像的效率。

Description

确定难例样本的方法、装置、设备及存储介质
技术领域
本申请涉及机器学习技术领域,特别涉及一种确定难例样本的方法、装置、设备及存储介质。
背景技术
随着人工智能的发展,图像识别技术的成熟,图像识别技术可实现的功能越来越多。例如,识别图像的场景(如风景、室内等),识别图像中的字符,识别图像中包括物体的类别(如车辆、动物等)。
上述图像识别技术可实现的功能可以通过对应的图像识别模型实现。图像识别模型在使用之前,需要通过大量的标定结果的样本图像对模型进行训练。例如训练图像识别模型识别图像中的字符,可以将包括有字符的图像输入到图像识别模型中,由图像识别模型输出图像中包括的字符,然后根据图像识别模型输出的字符与对应的标定结果即图像中真实包括的字符,确定损失值,再根据损失值对图像识别模型进行训练。
在图像识别模型经过大量的训练之后,图像识别模型的准确度就会达到一个较高的水平,此时图像识别模型对样本图像的识别结果大概率与对应的标定结果一致。所以此时再用普通的样本图像对图像识别模型起不到较好的训练效果,无法再提升图像识别模型的准确度。这时需要用难例样本图像对图像识别模型进行训练。在相关技术中,难例样本图像的挖掘需要将设置标定结果的样本图像输入到图像识别模型中,然后确定图像识别模型的识别结果是否正确,如果不正确则该样本图像为难例样本图像。
在实现本申请的过程中,发明人发现相关技术至少存在以下问题:
用大量样本图像训练之后的图像识别模型已经具有较高的准确度,所以再将样本图像输入到图像识别模型中,挖掘到难例样本图像的概率比较小,而且还需要预先对大量的样本图像设置标定结果,从而导致挖掘难例样本图像的效率低下。
发明内容
本申请实施例提供了一种确定难例样本的方法、装置、设备及存储介质,能够提高挖掘难例样本图像的效率。所述技术方案如下:
一方面,提供了一种确定难例样本的方法,所述方法包括:
按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;
基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;
在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
可选的,所述按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像,包括:
将所述目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像;
将所述目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像;
将所述目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像;
将所述目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像;
将所述目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
可选的,所述基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果,包括:
将所述目标样本图像输入到图像识别模型中,得到所述目标样本图像的对应的第一识别结果,将所述至少一个调整后的目标样本图像输入到图像识别模型中,得到所述至少一个调整后的目标样本图像对应的第二识别结果;
所述如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像,包括:
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定所述多个识别结果中占比超出预设比值的第三识别结果,并确定所述多个识别结果中除所述第三识别结果之外的第四识别结果,将所述第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,所述调整后的目标样本图像。
可选的,所述将所述第四识别结果对应的样本图像确定为难例样本图像之后,所述方法还包括:
将所述第三识别结果确定为所述难例样本图像对应的标定结果。
可选的,所述方法还包括:
对所述图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;
将所述目标样本图像输入到所述图像识别模型以及调整之后的图像识别模型中,分别得到所述目标样本图像对应的识别结果;
如果所述图像识别模型和所述调整之后的图像识别模型对所述目标样本图像的识别结果不一致,则将所述目标样本图像确定为难例样本图像。
可选的,所述目标样本图像为未设置标定结果的样本图像。
另一方面,提供了一种确定难例样本的装置,所述装置包括:
调整模块,用于按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;
确定模块,用于基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
可选的,所述调整模块,用于:
将所述目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像;
将所述目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像;
将所述目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像;
将所述目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像;
将所述目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
可选的,
所述确定模块,用于:
将所述目标样本图像输入到图像识别模型中,得到所述目标样本图像的对应的第一识别结果,将所述至少一个调整后的目标样本图像输入到图像识别模型中,得到所述至少一个调整后的目标样本图像对应的第二识别结果;
所述确定模块,用于:
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定所述多个识别结果中占比超出预设比值的第三识别结果,并确定所述多个识别结果中除所述第三识别结果之外的第四识别结果,将所述第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,所述调整后的目标样本图像。
可选的,所述确定模块,还用于:
将所述第三识别结果确定为所述难例样本图像对应的标定结果。
可选的,所述确定模块,还用于:
对所述图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;
将所述目标样本图像输入到所述图像识别模型以及调整之后的图像识别模型中,分别得到所述目标样本图像对应的识别结果;
如果所述图像识别模型和所述调整之后的图像识别模型对所述目标样本图像的识别结果不一致,则将所述目标样本图像确定为难例样本图像。
再一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上所述的确定难例样本的方法所执行的操作。
再一方面,提供了一种计算机可读存储介质所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的确定难例样本的方法所执行的操作。
本申请实施例提供的技术方案带来的有益效果是:
通过对按照指定的图像调整方式对目标样本图像进行图像调整,可以得到至少一个调整后的目标样本图像,然后可以根据图像识别模型确定目标样本图像和调整后的目标样本图像的识别结果,再根据识别结果确定目标样本图像和调整后的目标样本图像中存在的难例样本图像。这样只根据一个目标样本图像就能得到多个用于挖掘难例样本图像的样本图像,又可以根据不同的图像调整方式增加挖掘到难例样本图像的概率,且无需对目标样本图像设置标定结果。显然,通过本申请实施例提供的确定难例样本的方法可以提高挖掘难例样本图像的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的确定难例样本的方法流程图;
图2是本申请实施例提供的确定难例样本的方法的示意图;
图3是本申请实施例提供的确定难例样本的方法的示意图;
图4是本申请实施例提供的确定难例样本的装置结构示意图;
图5是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供的确定难例样本的方法可以由终端实现,该终端可以具备有处理器和存储器等,其中存储器能够本申请实施例提供的存储确定难例样本的方法对应的执行程序,处理器能够根据存储器存储的执行程序对图像进行相应的处理。该终端可以是手机、平板电脑、台式机等智能设备。
随着人工智能的发展,图像识别技术的成熟,通过图像识别模型可实现的工功能越来越多,如人脸识别模型、文字识别模型、场景识别模型、类别识别模型等等。这些图像识别模型在使用之前都需要通过大量的设置标定结果的样本图像进行训练,在经过大量的样本图像训练之后,还需要通过难例样本图像对图像识别模型进行训练。其中,难例样本图像即为将样本图像输入到正在训练的图像识别模型中,得到的识别结果为错误的样本图像。在相关技术中,难例样本图像需要在大量的设置标定结果的样本图像中,根据正在训练的图像识别模型进行挖掘。而本申请实施例提供的确定难例样本的方法,无需对样本图像设置标定结果,且能够在大量的样本图像中快速确定难例样本图像,能够提高挖掘难例样本的效率。
图1是本申请实施例提供的一种确定难例样本的方法流程图。参见图1,该实施例包括:
步骤101、按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像。
其中,目标样本图像可以由技术人员根据图像识别模型所实现的功能预先获取的样本图像。例如,图像识别模型为识别图像中包括字符的文字识别模型,则目标样本图像可以是任一包括各种字符的图像。在本申请实施例提供的确定难例样本的方法流程中,目标样本图像为未设置标定结果的样本图像。
在实施中,在获取到目标样本图像之后,可以目标样本图像按照指定的图像调整方式进行调整,得到至少一个调整后的目标样本图像。其中,指定的图像调整方式可以由技术人员进行设置,例如可以对目标样本图像的边界、亮度、尺寸、旋转角度、对比度等进行调整,或者在目标样本图像中增加噪声,或者对目标样本图像进行模糊化处理、打码处理等。这样就可以根据一个目标样本图像,得到多个进行调整之后的目标样本图像,且由于进行调整之后目标样本图像,可能由于亮度变高或变低、旋转角度变大等,导致图像识别模型对对应调整之后目标样本图像输出错误的识别结果,因此调整之后目标样本图像成为难例样本图像的概率变大。
下面对目标样本图像的边界、亮度、尺寸、旋转角度、噪声的调整方式进行详细说明:
一、将目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像。
在实施中,对于同一图像,设置不同的边界可能会对图像识别模型的输出的结果产生影响,尤其是对检测框边缘敏感的图像识别模型。例如,文字识别模型,对于文字识别模型输入的图像为包含字符的图像,如果图像的边界不同,文字识别模型输出的图像中包含的字符可能不同。所以可以对目标样本图像的边界进行裁剪,将目标样本图像的边界还行外扩或内缩等。目标样本图像可以如图2中的图像a所示,可以为一个车牌对应的图像。该目标样本图像可以对应一个原始的样本图像,如图2中的图像b所示,目标样本图像可以是在该原始的样本图像中进行剪切得到的。如图2中的图像c-d所示,可以是对目标样本图像的边界还行外扩和内缩之后得到的进行边界剪切之后的目标样本图像。其中,需要说明的是对目标样本图像的边界进行剪切,不会剪切到目标样本图像中包括的待识别的图像,例如字符等。另外技术人员也可以设置进行外扩和内缩对应的比例系数,根据比例系数对目标样本图像的边界进行剪切,此处不再赘述。
二、将目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像。
在实施中,无论图像识别模型是文字识别模型、场景识别模型、类别识别模型等,光照是对图像识别模型输出的识别结果影响比较大的因素之一。所以可以对目标样本图像的亮度进行调节,以增加样本图像的个数,并增加得到难例样本图像的概率。其中对目标样本图像的亮度的调节可以包括,完全曝光、部分曝光、完全过暗、运动模糊等。可以通过调整目标样本图像中的参数一调整目标样本图像的亮度,例如调整目标样本图像中得到伽马校正系数、平滑算子系数等,得到多个进行亮度调整之后的目标样本图像。
三、将目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像。
在实施中,目标样本图像的尺寸发生变化之后可能也会对图像识别模型输出的识别结果产生影响。所以在得到目标样本图像之后,可以对目标样本图像的尺寸进行调整,例如目标样本图像的尺寸为1000*500,则可以将目标样本图像的尺寸为800*400、500*250等,得到多个进行尺寸调整之后的目标样本图像。其中,可以预先设置scale(缩放)系数范围,例如scale系数范围为[a,b],并设置调整间隔α,则根据预先设置scale系数范围对目标样本图像的尺寸进行调整,可以得到(b-a)/α个进行尺寸调整之后的目标样本图像。
四、将目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像。
在实施中,目标样本图像的旋转角度发生变化之后可能也会对图像识别模型输出的识别结果产生影响。其中旋转方式可以包括目标样本图像在二维平面上的旋转、仿射,以及目标样本图像在三维空间上的透视等。例如图3所示,图3为目标样本图像旋转、仿射后的图像。在对目标样本图像按照预设的旋转方式进行旋转之后,可以得到多个旋转之后的目标样本图像。
五、将目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
在实施中,图像在不同的成像方式下,会产生不同的图像,像素值会发生变化,可能也会对图像识别模型输出的识别结果产生影响。所以可以在目标样本图像的三通道上随机增加噪声扰动,生成多个添加噪声之后的目标样本图像。
另外,需要说明的是图像调整方式还可以包括对图像的对比度、色温、饱和度等等进行调节,以得到不同的调整后的目标样本图像,以上各种图像调整方式也可以进行随机组合,以得到更多的调整后的目标样本图像,此处不再一一赘述。
步骤102、基于预设的图像识别模型,确定目标样本图像的对应的第一识别结果,以及至少一个调整后的目标样本图像对应的第二识别结果。
其中,预设的图像识别模型为经过大量的样本图像训练之后的图像识别模型,可以具有较高的精准度,且可以是未完成的训练的图像识别模型。
在实施中,在得到至少一个调整后的目标样本图像之后,可以根据图像识别模型确定目标样本图像对应的第一识别结果,可以根据图像识别模型确定调整后的目标样本图像的第二识别结果,其中,可以通过以下两种方式确定第一识别结果和第二识别结果。
方式一:将目标样本图像输入到图像识别模型中,得到目标样本图像的对应的第一识别结果,将至少一个调整后的目标样本图像输入到图像识别模型中,得到至少一个调整后的目标样本图像对应的第二识别结果。
在实施中,在得到至少一个调整后的目标样本图像之后,可以将目标样本图像输入到图像识别模型由图像识别模型输出对目标样本图像的第一识别结果,可以将至少一个调整后的目标样本图像输入到图像识别模型,由图像识别模型分别输出至少一个调整后的目标样本图像对应的第二识别结果,其中,第二识别结果可以为多个,分别对应每个调整后的目标样本图像。
方式二:对图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;将目标样本图像输入到图像识别模型以及调整之后的图像识别模型中,分别得到目标样本图像对应的识别结果。
在实施中,技术人员图像识别模型可以根据不同的应用场景,将图像识别模型中的包括的系数(即参数)的类型进行调整。例如将图像识别模型中的包括的系数的类型设置为Float32、Float16、Int8、Int4等。由于图像识别模型中的包括的系数的类型不同,可能也会对图像识别模型输出的识别结果产生影响。例如,图像识别模型为类别识别模型,假设当类别识别模型中的系数的类型设置为Float32时对样本图像A的输出的属于A类别的概率为52.81%,当类别识别模型中的系数的类型设置为Int8时对样本图像A的输出的属于A类别的概率可能为48.00%,如果技术人员设置的属于A类的概率阈值为50%,则类别识别模型中的系数的类型不同时,对应的识别是否为A类的结果就不同。所以技术人员可以将图像识别模型分别的系数设置为不同的类型,得到多个调整之后的图像识别模型。然后可以将目标样本图像输入到图像识别模型以及调整之后的图像识别模型中,分别得到由图像识别模型和调整之后的图像识别模型输出的对目标样本图像的识别结果。
步骤103、如果在第一识别结果和第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于多个识别结果,在目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
在实施中,在得到目标样本图像对应的第一识别结果,以及至少一个调整后的目标样本图像对应的第二识别结果之后,可以根据第一识别结果和第二识别结果对应的多个识别结果,确定目标样本图像是否为难例样本图像。
对应上述步骤102中的方式一,确定目标样本图像或调整后的目标样本图像是否为难例样本图像的处理如下:如果在第一识别结果和第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定多个识别结果中占比超出预设比值的第三识别结果,并确定多个识别结果中除第三识别结果之外的第四识别结果,将第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,调整后的目标样本图像。
在实施中,如果图像识别模型对目标样本图像输出的第一识别结果,以及图像识别模型对该目标样本图像对应的调整后的目标样本图像输出的第二识别结果中,存在两种或两种以上的识别结果,即存在有不同的识别结果,则说明目标样本图像和调整后的目标样本图像中存在有至少一个难例样本。然后可以根据不同的识别结果在所有识别结果中的占比,确定目标样本图像以及调整后的目标样本图像对应的正确的识别结果。可以在多个识别结果中占比超出预设比值的第三识别结果,将第三识别结果作为目标样本图像对应的正确的识别结果。其中预设比值可以由技术人员进行设置,当对图像识别模型的准确度越高时,该预设比值可设置的越小。另外如果各个识别结果在多个识别结果中的占比,没有超出预设比值时,也可以人工确定对正确的识别结果,或将占比最高的识别结果作为正确的识别结果。然后可以将出第三识别结果,即目标样本图像以及调整后的目标样本图像对应的正确的识别结果之外的其他识别结果(即第四识别结果)对应的样本图像确定为难例样本图像。
可选的,将第三识别结果确定为难例样本图像对应的标定结果。由于在本申请实施例中,目标样本图像以及调整后的目标样本图像并没有设置标定结果,所以在确定难例样本图像之后,可以将第三识别结果作为难例样本图像的对应的标定结果。然后可以根据设置标定结果的难例样本对图像识别模型进行训练。
对应上述步骤102中的方式二,确定目标样本图像是否为难例样本图像的处理如下:如果图像识别模型和调整之后的图像识别模型对目标样本图像的识别结果不一致,则将目标样本图像确定为难例样本图像。
在实施中,在得到目标样本图像和调整之后的图像识别模型对同一样本图像(目标样本图像)的识别结果之后,如果图像识别模型以及调整之后的图像识别模型对同一个样本图像的输出的识别结果不一致,则可以将该样本图像作为难例样本图像。另外可以由技术人员确定将对应同一目标样本图像的样本图像的正确的识别结果。在确定正确的识别结果之后,可以将输出错误识别图像识别模型,作为待训练的图像识别模型,将待训练的模型输出为错误识别结果的样本图像作为难例样本图像,将对应的正确的识别结果作为标定结果,对待训练的图像识别模型进行训练。
本申请实施例,通过对按照指定的图像调整方式对目标样本图像进行图像调整,可以得到至少一个调整后的目标样本图像,然后可以根据图像识别模型确定目标样本图像和调整后的目标样本图像的识别结果,再根据识别结果确定目标样本图像和调整后的目标样本图像中存在的难例样本图像。这样只根据一个目标样本图像就能得到多个用于挖掘难例样本图像的样本图像,又可以根据不同的图像调整方式增加挖掘到难例样本图像的概率,且无需对目标样本图像设置标定结果。显然,通过本申请实施例提供的确定难例样本的方法可以提高挖掘难例样本图像的效率。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图4是本申请实施例提供的一种确定难例样本的装置,该装置可以是上述实施例中的终端,如图4所示,该装置包括:
调整模块410,用于按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;
确定模块420,用于基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
可选的,所述调整模块410,用于:
将所述目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像;
将所述目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像;
将所述目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像;
将所述目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像;
将所述目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
可选的,所述确定模块420,用于:
将所述目标样本图像输入到图像识别模型中,得到所述目标样本图像的对应的第一识别结果,将所述至少一个调整后的目标样本图像输入到图像识别模型中,得到所述至少一个调整后的目标样本图像对应的第二识别结果;
所述确定模块420,用于:
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定所述多个识别结果中占比超出预设比值的第三识别结果,并确定所述多个识别结果中除所述第三识别结果之外的第四识别结果,将所述第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,所述调整后的目标样本图像。
可选的,所述确定模块420,还用于:
将所述第三识别结果确定为所述难例样本图像对应的标定结果。
可选的,所述确定模块420,还用于:
对所述图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;
将所述目标样本图像输入到所述图像识别模型以及调整之后的图像识别模型中,分别得到所述目标样本图像对应的识别结果;
如果所述图像识别模型和所述调整之后的图像识别模型对所述目标样本图像的识别结果不一致,则将所述目标样本图像确定为难例样本图像。
需要说明的是:上述实施例提供的确定难例样本的装置在确定难例样本时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的确定难例样本的装置与确定难例样本的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5示出了本申请一个示例性实施例提供的计算机设备500的结构框图。该计算机设备500可以是上述实施例中的终端,例如可以是智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。计算机设备500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端500包括有:处理器501和存储器502。
处理器501可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器501可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器501也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器501可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器501还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器502可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器502还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器501所执行以实现本申请中方法实施例提供的确定难例样本的方法。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中确定难例样本的方法。该计算机可读存储介质可以是非暂态的。例如,所述计算机可读存储介质可以是ROM(Read-OnlyMemory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (13)

1.一种确定难例样本的方法,其特征在于,所述方法包括:
按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;
基于预设的图像识别模型,确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
2.根据权利要求1所述的方法,其特征在于,所述按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像,包括以下图像调整方式中的至少一种:
将所述目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像;
将所述目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像;
将所述目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像;
将所述目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像;
将所述目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
3.根据权利要求1所述的方法,其特征在于,所述基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果,包括:
将所述目标样本图像输入到图像识别模型中,得到所述目标样本图像的对应的第一识别结果,将所述至少一个调整后的目标样本图像输入到图像识别模型中,得到所述至少一个调整后的目标样本图像对应的第二识别结果;
所述如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像,包括:
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定所述多个识别结果中占比超出预设比值的第三识别结果,并确定所述多个识别结果中除所述第三识别结果之外的第四识别结果,将所述第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,所述调整后的目标样本图像。
4.根据权利要求3所述的方法,其特征在于,所述将所述第四识别结果对应的样本图像确定为难例样本图像之后,所述方法还包括:
将所述第三识别结果确定为所述难例样本图像对应的标定结果。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;
将所述目标样本图像输入到所述图像识别模型以及调整之后的图像识别模型中,分别得到所述目标样本图像对应的识别结果;
如果所述图像识别模型和所述调整之后的图像识别模型对所述目标样本图像的识别结果不一致,则将所述目标样本图像确定为难例样本图像。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述目标样本图像为未设置标定结果的样本图像。
7.一种确定难例样本的装置,其特征在于,所述装置包括:
调整模块,用于按照至少一个指定的图像调整方式对目标样本图像进行图像调整,得到至少一个调整后的目标样本图像;
确定模块,用于基于预设的图像识别模型,分别确定所述目标样本图像的对应的第一识别结果,以及所述至少一个调整后的目标样本图像对应的第二识别结果;如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则基于所述多个识别结果,在所述目标样本图像和所述至少一个调整后的目标样本图像中确定难例样本图像。
8.根据权利要求7所述的装置,其特征在于,所述调整模块,用于:
将所述目标样本图像的边界按照预设的边界剪切方式进行剪切,得到至少一个进行边界剪切之后的目标样本图像;
将所述目标样本图像的亮度按照预设的亮度调整方式进行调整,得到至少一个进行亮度调整之后的目标样本图像;
将所述目标样本图像的尺寸按照预设的尺寸调整方式进行调整,得到至少一个进行尺寸调整之后的目标样本图像;
将所述目标样本图像按照预设的旋转方式进行旋转,得到至少一个旋转之后的目标样本图像;
将所述目标样本图像中随机添加噪声,得到添加噪声之后的目标样本图像。
9.根据权利要求7所述的装置,其特征在于,所述确定模块,用于:
将所述目标样本图像输入到图像识别模型中,得到所述目标样本图像的对应的第一识别结果,将所述至少一个调整后的目标样本图像输入到图像识别模型中,得到所述至少一个调整后的目标样本图像对应的第二识别结果;
所述确定模块,用于:
如果在所述第一识别结果和所述第二识别结果组成的多个识别结果中存在两种或两种以上的识别结果,则确定所述多个识别结果中占比超出预设比值的第三识别结果,并确定所述多个识别结果中除所述第三识别结果之外的第四识别结果,将所述第四识别结果对应的样本图像确定为难例样本图像,其中所述样本图像为目标样本图像,和/或,所述调整后的目标样本图像。
10.根据权利要求9所述的装置,其特征在于,所述确定模块,还用于:
将所述第三识别结果确定为所述难例样本图像对应的标定结果。
11.根据权利要求7所述的装置,其特征在于,所述确定模块,还用于:
对所述图像识别模型中包括的参数的参数类型进行调整,得到调整之后的图像识别模型;
将所述目标样本图像输入到所述图像识别模型以及调整之后的图像识别模型中,分别得到所述目标样本图像对应的识别结果;
如果所述图像识别模型和所述调整之后的图像识别模型对所述目标样本图像的识别结果不一致,则将所述目标样本图像确定为难例样本图像。
12.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求6任一项所述的确定难例样本的方法所执行的操作。
13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求6任一项所述的确定难例样本的方法所执行的操作。
CN202011032968.4A 2020-09-27 2020-09-27 确定难例样本的方法、装置、设备及存储介质 Active CN112149745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011032968.4A CN112149745B (zh) 2020-09-27 2020-09-27 确定难例样本的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011032968.4A CN112149745B (zh) 2020-09-27 2020-09-27 确定难例样本的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112149745A true CN112149745A (zh) 2020-12-29
CN112149745B CN112149745B (zh) 2022-10-21

Family

ID=73895664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011032968.4A Active CN112149745B (zh) 2020-09-27 2020-09-27 确定难例样本的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112149745B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359308A (zh) * 2022-04-06 2022-11-18 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647577A (zh) * 2018-04-10 2018-10-12 华中科技大学 一种自适应难例挖掘的行人重识别模型、方法与系统
CN110807361A (zh) * 2019-09-19 2020-02-18 腾讯科技(深圳)有限公司 人体识别方法、装置、计算机设备及存储介质
CN111079841A (zh) * 2019-12-17 2020-04-28 深圳奇迹智慧网络有限公司 目标识别的训练方法、装置、计算机设备和存储介质
CN111091132A (zh) * 2020-03-19 2020-05-01 腾讯科技(深圳)有限公司 基于人工智能的图像识别方法、装置、计算机设备及介质
CN111209854A (zh) * 2020-01-06 2020-05-29 苏州科达科技股份有限公司 司乘人员未系安全带识别方法、装置及存储介质
CN111259968A (zh) * 2020-01-17 2020-06-09 腾讯科技(深圳)有限公司 非法图像识别方法、装置、设备和计算机可读存储介质
CN111368926A (zh) * 2020-03-06 2020-07-03 腾讯科技(深圳)有限公司 图像筛选方法、装置和计算机可读存储介质
CN111488798A (zh) * 2020-03-11 2020-08-04 北京迈格威科技有限公司 指纹识别方法、装置、电子设备及存储介质
CN111523621A (zh) * 2020-07-03 2020-08-11 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质
CN111582342A (zh) * 2020-04-29 2020-08-25 腾讯科技(深圳)有限公司 一种图像识别方法、装置、设备以及可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108647577A (zh) * 2018-04-10 2018-10-12 华中科技大学 一种自适应难例挖掘的行人重识别模型、方法与系统
CN110807361A (zh) * 2019-09-19 2020-02-18 腾讯科技(深圳)有限公司 人体识别方法、装置、计算机设备及存储介质
CN111079841A (zh) * 2019-12-17 2020-04-28 深圳奇迹智慧网络有限公司 目标识别的训练方法、装置、计算机设备和存储介质
CN111209854A (zh) * 2020-01-06 2020-05-29 苏州科达科技股份有限公司 司乘人员未系安全带识别方法、装置及存储介质
CN111259968A (zh) * 2020-01-17 2020-06-09 腾讯科技(深圳)有限公司 非法图像识别方法、装置、设备和计算机可读存储介质
CN111368926A (zh) * 2020-03-06 2020-07-03 腾讯科技(深圳)有限公司 图像筛选方法、装置和计算机可读存储介质
CN111488798A (zh) * 2020-03-11 2020-08-04 北京迈格威科技有限公司 指纹识别方法、装置、电子设备及存储介质
CN111091132A (zh) * 2020-03-19 2020-05-01 腾讯科技(深圳)有限公司 基于人工智能的图像识别方法、装置、计算机设备及介质
CN111582342A (zh) * 2020-04-29 2020-08-25 腾讯科技(深圳)有限公司 一种图像识别方法、装置、设备以及可读存储介质
CN111523621A (zh) * 2020-07-03 2020-08-11 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359308A (zh) * 2022-04-06 2022-11-18 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序
CN115359308B (zh) * 2022-04-06 2024-02-13 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序

Also Published As

Publication number Publication date
CN112149745B (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN109670558B (zh) 使用深度学习的数字图像完成
CN110163831B (zh) 三维虚拟沙盘的物体动态展示方法、装置及终端设备
CN111489322B (zh) 给静态图片加天空滤镜的方法及装置
CN110913205B (zh) 视频特效的校验方法及装置
CN111738321A (zh) 数据处理方法、装置、终端设备以及存储介质
CN110139149B (zh) 一种视频优化的方法、装置、电子设备
US11875486B2 (en) Image brightness statistical method and imaging device
CN111062854B (zh) 检测水印的方法、装置、终端及存储介质
CN110363837B (zh) 游戏中纹理图像的处理方法及装置、电子设备、存储介质
CN112149745B (zh) 确定难例样本的方法、装置、设备及存储介质
CN113516697B (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
EP4075381B1 (en) Image processing method and system
CN111090384A (zh) 软键盘的显示方法及装置
CN111597845A (zh) 一种二维码检测方法、装置、设备及可读存储介质
CN112614149A (zh) 基于实例分割的语义合成方法
CN115345895B (zh) 用于视觉检测的图像分割方法、装置、计算机设备及介质
CN116485944A (zh) 图像处理方法及装置、计算机可读存储介质和电子设备
CN113850238B (zh) 文档检测方法、装置、电子设备及存储介质
US9886767B2 (en) Method, apparatus and computer program product for segmentation of objects in images
CN113034449B (zh) 目标检测模型训练方法、装置及通信设备
CN113781491A (zh) 图像分割模型的训练、图像分割方法及装置
CN113379768A (zh) 一种图像处理方法、装置、存储介质和计算机设备
CN113391779A (zh) 类纸屏幕的参数调节方法、装置及设备
CN112766277A (zh) 卷积神经网络模型的通道调整方法、装置和设备
CN112966757A (zh) 训练样本的扩展方法、装置、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant