CN110147850A - 图像识别的方法、装置、设备及存储介质 - Google Patents

图像识别的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110147850A
CN110147850A CN201910447401.4A CN201910447401A CN110147850A CN 110147850 A CN110147850 A CN 110147850A CN 201910447401 A CN201910447401 A CN 201910447401A CN 110147850 A CN110147850 A CN 110147850A
Authority
CN
China
Prior art keywords
training data
data
target
training
complexity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910447401.4A
Other languages
English (en)
Other versions
CN110147850B (zh
Inventor
张志伟
卢亮
马彦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910447401.4A priority Critical patent/CN110147850B/zh
Publication of CN110147850A publication Critical patent/CN110147850A/zh
Application granted granted Critical
Publication of CN110147850B publication Critical patent/CN110147850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于一种图像识别的方法、装置、设备及存储介质,包括:获取目标识别物的初始识别模型,初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;获取目标识别物的第二数据复杂度的训练数据,第二数据复杂度大于第一数据复杂度;根据初始识别模型,对第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;根据识别结果,在第二数据复杂度的训练数据中获取目标训练数据;利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。解决了目标识别物的训练数据的类别单一的问题,使得识别模型的泛化能力提高,进而提高图像识别准确率。

Description

图像识别的方法、装置、设备及存储介质
技术领域
本公开涉及人工智能领域,尤其涉及一种图像识别的方法、装置、设备及存储介质。
背景技术
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以卷积神经网络(convolution neural network,CNN)为例,CNN因其超强的拟合能力以及端到端的全局优化能力,使得机器学习模型的识别准确率大幅提高。虽然使用CNN模型,机器学习模型的识别准确率得到了显著的提升,但一个满足泛化能力的机器学习模型需要依赖种类丰富的训练数据。
相关技术中,目标识别物的训练数据一般是通过搜索引擎搜索获取。但通过在搜索引擎输入目标识别物的搜索关键字搜索出的目标识别物大多是将目标识别物进行美化处理后上传的,经过美化处理后的目标识别物的清晰、显著。使得获取到的目标识别物的训练数据的类别单一,导致使用类别单一的目标识别物的训练数据训练得到的目标识别物的识别模型的泛化能力差、识别模型的图像识别准确率低。
发明内容
本公开提供一种图像识别的方法、装置、设备及存储介质,能够克服相关技术中获取到的目标识别物的训练数据的类别单一,导致使用类别单一的目标识别物的训练数据训练得到的目标识别物的识别模型的泛化能力差、识别模型的图像识别准确率低的问题。
根据本公开实施例的第一方面,提供一种图像识别的方法,包括:获取目标识别物的初始识别模型,所述初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;获取目标识别物的第二数据复杂度的训练数据,所述第二数据复杂度大于所述第一数据复杂度;根据所述初始识别模型,对所述第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据;利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
可选地,所述根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据,包括:根据所述识别结果,对所述第二数据复杂度的训练数据进行分组,得到多组训练数据;在每一组训练数据中,获取满足参考条件的训练数据;将得到的多组满足参考条件的训练数据作为目标训练数据。
可选地,所述在每一组训练数据中,获取满足参考条件的训练数据,包括:获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;将每一组训练数据中的每一个训练数据根据预测概率进行排序;根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
可选地,所述利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别之前,所述方法还包括:获取标注后的目标训练数据;利用所述标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型。
可选地,所述利用所述标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型,包括:当利用所述标注后的目标训练数据对机器学习模型进行训练,得到的所述目标识别物的识别模型包括多个时,获取验证数据;利用多个目标识别物的识别模型分别对所述验证数据进行识别;将识别准确率满足目标识别准确率的目标识别物的识别模型作为目标识别物的标准识别模型。
根据本公开实施例的第二方面,提供一种图像识别的装置,所述装置包括:第一获取模块,被配置为执行获取目标识别物的初始识别模型,所述初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;第二获取模块,被配置为执行获取目标识别物的第二数据复杂度的训练数据,所述第二数据复杂度大于所述第一数据复杂度;识别模块,被配置为执行根据所述初始识别模型,对所述第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;第三获取模块,被配置为执行根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据;图像识别模块,被配置为执行利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
可选地,所述第三获取模块,被配置为执行根据所述识别结果,对所述第二数据复杂度的训练数据进行分组,得到多组训练数据;在每一组训练数据中,获取满足参考条件的训练数据;将得到的多组满足参考条件的训练数据作为目标训练数据。
可选地,所述第三获取模块,被配置为执行获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;将每一组训练数据中的每一个训练数据根据预测概率进行排序;根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
可选地,所述图像识别模块,还被配置为执行获取标注后的目标训练数据;利用所述标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型。
可选地,所述图像识别模块,还配置为执行当利用所述标注后的目标训练数据对机器学习模型进行训练,得到的所述目标识别物的识别模型包括多个时,获取验证数据;利用多个目标识别物的识别模型分别对所述验证数据进行识别;将识别准确率满足目标识别准确率的目标识别物的识别模型作为目标识别物的标准识别模型。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,包括:当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第五方面,提供了一种计算机程序(产品),所述计算机程序(产品)包括:计算机程序代码,当所述计算机程序代码被计算机运行时,使得所述计算机执行上述各方面中的方法。
本公开的实施例提供的技术方案至少可以包括以下有益效果:
由于目标识别物的第二数据复杂度的训练数据的类别数大于第一数据复杂度训练数据的类别数,故使用第二数据复杂度的训练数据作为目标训练数据,可以解决获取到的目标识别物的训练数据的类别单一的问题,使得基于该目标训练数据训练得到的目标识别物的识别模型的泛化能力提高,进而提高识别模型的图像识别准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种图像识别的方法的应用场景示意图;
图2是根据一示例性实施例示出的一种图像识别的方法的应用场景示意图;
图3是根据一示例性实施例示出的一种图像识别的方法的应用场景示意图;
图4是根据一示例性实施例示出的一种图像识别的方法的流程图;
图5是根据一示例性实施例示出的一种图像识别的方法的流程图;
图6是根据一示例性实施例示出的一种图像识别的方法的流程图;
图7是根据一示例性实施例示出的一种图像识别的装置的框图;
图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完成地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
首先,对本申请实施例的应用背景进行介绍。泛化能力是指识别模型对新鲜数据的适应能力,可选地,新鲜数据可以是该模型之前未识别过的数据。识别模型对新鲜数据的适应能力越强,泛化能力就越好。因而为了提高目标识别物的识别模型的泛化能力,目标识别物的训练数据需要包含多个类别的目标识别物的训练数据。在获取目标识别物的识别模型的训练数据时,若得到的目标识别物的训练数据类别少,将会影响目标识别物的识别模型的泛化能力,进而影响图像识别准确率。
下面结合如图1、图2和图3对本申请实施例的目标识别物的训练数据的类别进行说明。
如图1所示,示出了获取到的目标识别物“加菲猫”训练数据,该“加菲猫”的训练数据中“加菲猫”位于图像的中间位置,画面清晰、画面背景简单,“加菲猫”的正面脸部特征明显,根据脸部特征明显的“加菲猫”的训练数据训练得到的“加菲猫”的识别模型可以准确分辨出目标识别物“加菲猫”。那么在利用如图1的训练数据对识别“加菲猫”的机器学习模型进行训练时,由于不包含“加菲猫”侧面的训练数据,也不包含“加菲猫”背面等其他方向视图的训练数据。导致用图1的训练数据得到的“加菲猫”的识别模型对某一待识别动物进行识别时,当待识别动物的脸部特征不明显的情况下,利用图1得到的识别“加菲猫”的识别模型的泛化能力不能准确地识别出该待识别动物是否为“加菲猫”,即“加菲猫”的识别模型的泛化能力差。
但是,对于待识别动物的脸部特征不明显的情况下,比如包含待识别动物的侧面特征,由于训练数据中不包含“加菲猫”的侧面训练数据,将导致仅仅通过“加菲猫”的正面训练数据得到的识别“加菲猫”的识别模型,由于泛化能力不足,不能准确地识别出待识别动物是否为“加菲猫”。这种情况下,若可以在“加菲猫”训练数据中添加一些“加菲猫”的背部方向上的训练数据,识别模型可能就会通过自身的泛化能力,准确识别出包含侧面特征的待识别动物是否为“加菲猫”。同时,若加入的训练数据中包含了“加菲猫”的侧面特征,那么既可以提高识别模型的泛化能力,也可以提高识别模型的识别准确率。
通过上述描述可以看出,本申请实施例中的目标识别物的训练数据的类别除了可以包括对目标识别物增加的识别物不同状态下的训练数据之外,也可以包括背景复杂的目标识别物的训练数据。由于图1中目标识别物的训练数据背景噪声小,但当待识别动物位于较复杂环境下,可能会由于背景画面的干扰,使用图1的训练数据得到的训练模型也不能准确的判断出待识别动物是否为“加菲猫”。
如图2和图3所示,图3背景就比图2的背景复杂。当添加背景复杂的目标识别物的训练数据同样可以提高目标识别物的识别模型的泛化能力。同理目标识别物的训练数据的类别也可以包括分辨率低的目标识别物的训练数据,即训练数据的画面不清晰的数据。若“加菲猫”的训练数据中不包含分辨率低的数据,同样影响识别模型对分辨率低的目标识别物的泛化能力。
上述本申请实施例对目标识别物的训练数据的类别的解释,不仅仅限于上述提到的类别。本领域技术人员可以增加其他类别的目标识别物的训练数据来提高目标识别物的识别模型的泛化能力。下述对本申请实施例方案的描述中,目标识别物以“加菲猫”为例进行说明。
图4是根据一示例性实施例示出的一种图像识别的方法的流程图,如图4所示,该图像识别的方法用于终端中,包括以下步骤:
S31,获取目标识别物的初始识别模型,初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数。
示例性地,目标识别物的训练数据为第一数据复杂度的训练数据可以是通过搜索引擎直接获取。比如在搜索引擎直接搜索关键字“加菲猫”,将搜索到的“加菲猫”图片作为训练数据训练“加菲猫”的识别模型。该初始识别模型可以是根据第一数据复杂度的训练数据预先训练好的。数据复杂度用于表征目标识别物的训练数据的类别数,类别数越多,数据复杂度越高。
S32,获取目标识别物的第二数据复杂度的训练数据,第二数据复杂度大于第一数据复杂度。
示例性地,该目标识别物的训练数据为第二数据复杂度的训练数据可以通过视频平台获取。视频平台上会接收到视频平台用户上传的各种类型的视频数据,故在视频平台上可以得到任意一个目标识别物的视频数据。通过对视频数据进行截屏等图像获取操作,可得到目标识别物不同角度、不同场景、不同分辨率下的图像,将得到的图像作为训练数据训练识别模型。
例如,当目标识别物为“加菲猫”时,同样可以得到各种“加菲猫”的图像作为训练识别“加菲猫”的机器学习模型的训练数据。
S33,根据初始识别模型,对第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果。
S34,根据识别结果,在第二数据复杂度的训练数据中获取目标训练数据。
示例性地,在第二数据复杂度的训练数据中获取的训练数据可以是第二数据复杂度下的所有训练数据。也可以使用第二数据复杂度中通过筛选得到的部分训练数据进行识别模型的训练。此时用于筛选的条件可以是识别结果对应的预测概率,选择预测概率满足一定概率标准的训练数据作为目标识别物的训练数据。也可以是随机选取一定数量的训练数据作为目标识别物的训练数据;也可以通过训练数据的类别,选取目标类别的训练数据作为目标识别物的训练数据。本领域技术人员可以根据实际训练使用需要,选用不同标准确定用于训练机器学习模型的训练数据。
当根据第二数据复杂度中的训练数据的识别结果对应的预测概率对训练数据进行筛选时,可以选用预测概率在一目标范围内的识别结果对应的数据作为训练数据。例如,使用初始识别模型对得到的第二数据复杂度的训练数据进行识别后,得到的识别结果的预测概率范围包括(60%,90%]、(30%,60%]、(0,30%]三个范围。其中预测概率较高,表明第二数据复杂度中包含训练数据与第一数据复杂度中包含的训练数据相似,故使用初始识别模型进行识别时,得到的识别结果的预测概率较高。以此类推,预测概率较小的范围,表征该范围内的数据与第一数据复杂度中的数据相差较大,使用初始识别模型识别后,得到的识别结果的预测概率较低。本领域技术人员可以根据实际训练使用需要,选择其中任意一个或多个范围中的数据用于训练。
由于预测概率相对较大的识别结果对应的训练数据,与第一数据复杂度中训练数据类型接近。使用第二数据复杂度中处于较大预测概率范围内的训练数据进行训练,得到的目标识别物的识别模型的泛化能力可能仍不足。预测概率相对较小的识别结果对应的训练数据,与第一数据复杂度中的数据类型相差较大。使用较小的预测概率的识别结果对应的训练数据进行训练,可能导致识别模型的精确度不足。故可以选择中间级别的预测概率对应的训练数据进行训练。既可以保证识别模型的泛化能力,也可以确保识别模型的准确率。本领域技术人员也可以在选择中间范围的训练数据后,在其他范围内的训练数据中根据其他标准再筛选一些训练数据进行合并,得到用于训练目标识别物的机器学习模型的目标训练数据。
S35,利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。
本申请实施例提供的图像识别的方法,通过利用目标识别物的第一数据复杂度的训练数据训练得到的目标识别物的初始识别模型,对第二数据复杂度的训练数据进行识别,得到第二数据复杂度的训练数据的识别结果,根据该识别结果,在第二数据复杂度的训练数据中获取目标识别物的目标训练数据,利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。由于第二数据复杂度的训练数据的类别数大于第一数据复杂度的训练数据的类别数,故使用第二数据复杂度的训练数据作为目标识别物的识别模型的目标训练数据。解决了目标识别物的训练数据的类别单一的问题,使得识别模型的泛化能力提高,进而提高图像识别准确率。
作为本申请一个可选实施方式,参见图5,该步骤S34,包括:
S341,根据识别结果,对第二数据复杂度的训练数据进行分组,得到多组训练数据。
示例性地,对第二数据复杂度的训练数据进行分组的方式可以是将在不同视频平台上得到的目标识别物训练数据作为分组标准。也可以是按照视频的上传时间对得到的第二数据复杂度的训练数据进行分组。本申请实施例通过将每一个第二数据复杂度的训练数据的识别结果作为对应的每一个第二数据复杂度的训练数据的标签。根据第二数据复杂度的训练数据的标签,对第二数据复杂度的训练数据进行分组。
示例性地,上述实施例中的得到的识别模型是针对只识别“加菲猫”的单一类别的识别模型。通过该识别“加菲猫”的识别模型,对第二数据复杂度的训练数据进行识别时,得到的标签种类可以有“加菲猫”和“其他”两种标签,则可以将第二数据复杂度的训练数据分为两组。但如果是针对可以识别多种动物的多类别识别模型,在使用上述实施例中的方法,同样在获取到第二数据复杂度的训练数据时,通过该多类别识别模型识别后得到的第二数据复杂度中的标签可以包含更多个。比如该多类别识别模型可以识别“猫”、“狗”“兔子”,则得到的标签可以是“猫”、“非猫”、“狗”、“其他”。本申请实施例对识别模型可以识别的种类数不作限定。根据得到的标签,对第二数据复杂度的训练数据进行分组。
S342,在每一组训练数据中,获取满足参考条件的训练数据。
示例性地,该参考条件可以是在每一组中获取目标数量的训练数据,也可以是根据训练数据的识别结果的预测概率,获取预测概率满足目标预测概率的训练数据。
作为本申请一个可选实施方式,步骤S342,包括:
首先,获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;
其次,将每一组训练数据中的每一个训练数据根据预测概率进行排序;
再次,根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
示例性地,将每一组训练数据识别结果对应的预测概率进行排序后,可以选取排序处于中间位置的数据。
比如若预测概率是按照从大到小的顺序进行排序,可以排除前30%的数据和后40%的数据后,选择每一组的中间30%的训练数据作为目标训练数据。
示例性地,也可以通过划分预测概率的范围的方式,在每一组训练数据中获取落入某一预测概率范围内的训练数据。
S343,将得到的多组满足参考条件的训练数据作为目标训练数据。
通过上述实施例中先对第二数据复杂度的训练数据进行分组,再获取满足参考条件的训练数据,可以在每一组中获取预测概率处于中间范围的训练数据。
基于上述分析可知,通过分组再获取每一组预测概率处于中间范围的训练数据作为目标识别物的目标训练数据,不仅可以提高目标识别物识别模型的泛化能力,还可以避免对整个第二数据复杂度的训练数据按照预测概率进行筛选的过程中,丢失某一类别的训练数据的问题。本申请实施例中对预测概率中间范围的取值可以根据实际训练需要确定,本申请实施例对此不作限定。
作为本申请一个可选实施方式,参见图6,步骤S35之前,该方法还包括:
S36,获取标注后的目标训练数据。
示例性地,对得到的目标训练数据可以再次进行标注。标注的方式可以是通过人工标注的方式获得,也可以是使用其他已经训练好的机器学习模型对目标训练数据进行识别后,将识别结果作为目标训练数据的标签。本申请实施例对标注的方式不作限定,本领域技术人员可以根据实际使用需要选用标注结果较准确的标注方式,对目标训练数据进行标注。
S37,利用标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型。
通过对目标训练数据再次进行标注,可以进一步提高目标训练数据标签的准确性,继而使用该目标训练数据进行训练后,提高了目标识别物的识别模型的准确率。
作为本申请一个可选实施方式,步骤S37包括:
S371,当目标识别物的识别模型包括多个时,获取验证数据。
示例性地,当使用目标训练数据对目标识别物的机器学习模型进行训练的过程中,通过在训练过程中设置多个检查点的方式,将获取到的每一个检查点处的模型参数确定目标识别物识别模型。也可以是使用目标训练数据对机器学习模型进行多轮迭代训练,将每一次迭代结果作为目标识别物的识别模型。
该验证数据可以是上述实施例中的每一组中前30%的训练数据合并后得到训练数据,也可以是上述实施例中每一组中后40%的训练合并后得到的训练数据。当然也可以是从其他图像或视频平台中获取到的目标识别物的数据作为验证数据。本申请实施例对验证数据的获取方式不作限定,本领域技术人员可以根据需要,选用其他数据作为验证数据。
S372,利用多个目标识别物的识别模型分别对验证数据进行识别。
例如,将验证数据输入目标识别物的识别模型,得到识别结果。基于识别结果来确定每个目标识别物的识别模型的识别准确率。
S373,将识别准确率满足目标识别准确率的目标识别物的识别模型作为目标识别物的目标识别模型。
示例性地,该目标识别准确率可以根据实际识别要求确定。比如目标识别物的识别模型准确率要求为大于95%。则该目标识别准确率可以设置为95%,将识别准确率大于95%的识别模型作为目标识别物的标准识别模型。
通过获取的验证数据得到识别准确率满足要求的识别模型作为目标识别物的标准识别模型,进一步提高了识别模型对目标识别物识别的准确率。
图7是根据一示例性实施例示出的一种图像识别的装置框图。参照图7,该装置包括第一获取模块71、第二获取模块72、识别模块73、第三获取模块74、图像识别模块75。
第一获取模块71,被配置为执行获取目标识别物的初始识别模型,初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;
第二获取模块72,被配置为执行获取目标识别物的第二数据复杂度的训练数据,第二数据复杂度大于第一数据复杂度;
识别模块73,被配置为执行根据初始识别模型,对第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;
第三获取模块74,被配置为执行根据识别结果,在第二数据复杂度的训练数据中获取目标训练数据;
图像识别模块75,被配置为执行利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。
本申请实施例提供的图像识别的装置,由于第二数据复杂度中的包含的目标识别物的训练数据的类别数大于第一数据复杂度中的目标识别物的训练数据的类别数,故使用第二数据复杂度中的目标识别物的训练数据作为目标识别物的识别模型的目标训练数据。解决了目标识别物的训练数据的类别单一的问题,使得识别模型的泛化能力提高,进而提高图像识别准确率。
作为本申请一个可选实施方式,第三获取模块74,被配置为执行根据识别结果,对第二数据复杂度的训练数据进行分组,得到多组训练数据;在每一组训练数据中,获取满足参考条件的训练数据;将得到的多组满足参考条件的训练数据作为目标训练数据。
作为本申请一个可选实施方式,第三获取模块74,被配置为执行获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;将每一组训练数据中的每一个训练数据根据预测概率进行排序;根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
作为本申请一个可选实施方式,图像识别模块75,还被配置为执行获取标注后的目标训练数据;利用标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型。
作为本申请一个可选实施方式,图像识别模块75,还被配置为执行当目标识别物的识别模型包括多个时,获取验证数据;利用多个目标识别物的识别模型分别对验证数据进行识别;将识别准确率满足目标识别准确率的目标识别物的识别模型作为目标识别物的标准识别模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于相同构思,本申请实施例还提供一种电子设备,如图8所示,所述设备包括:
处理器81;
用于存储所述处理器81可执行指令的存储器82;
其中,所述处理器被配置为执行上述实施例所述的图像识别的方法。处理器81和存储器82通过通信总线83连接。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,在一种可选的实施例中,上述存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data dateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。
本申请提供了一种计算机程序,当计算机程序被计算机执行时,可以使得处理器或计算机执行上述方法实施例中对应的各个步骤和/或流程。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种图像识别的方法,其特征在于,所述方法包括:
获取目标识别物的初始识别模型,所述初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;
获取目标识别物的第二数据复杂度的训练数据,所述第二数据复杂度大于所述第一数据复杂度;
根据所述初始识别模型,对所述第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;
根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据;
利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
2.根据权利要求1所述的图像识别的方法,其特征在于,所述根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据,包括:
根据所述识别结果,对所述第二数据复杂度的训练数据进行分组,得到多组训练数据;
在每一组训练数据中,获取满足参考条件的训练数据;
将得到的多组满足参考条件的训练数据作为目标训练数据。
3.根据权利要求2所述的图像识别的方法,其特征在于,所述在每一组训练数据中,获取满足参考条件的训练数据,包括:
获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;
将每一组训练数据中的每一个训练数据根据预测概率进行排序;
根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
4.根据权利要求1-3中任一项所述的图像识别的方法,其特征在于,所述利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别之前,所述方法还包括:
获取标注后的目标训练数据;
利用所述标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型。
5.根据权利要求4所述的图像识别的方法,其特征在于,所述利用所述标注后的目标训练数据对机器学习模型进行训练,得到目标识别物的识别模型,包括:
当利用所述标注后的目标训练数据对机器学习模型进行训练,得到的所述目标识别物的识别模型包括多个时,获取验证数据;
利用多个目标识别物的识别模型分别对所述验证数据进行识别;
将识别准确率满足目标识别准确率的目标识别物的识别模型作为目标识别物的标准识别模型。
6.一种图像识别的装置,其特征在于,所述装置包括:
第一获取模块,被配置为执行获取目标识别物的初始识别模型,所述初始识别模型根据目标识别物的第一数据复杂度的训练数据训练得到,数据复杂度用于表征目标识别物的训练数据的类别数;
第二获取模块,被配置为执行获取目标识别物的第二数据复杂度的训练数据,所述第二数据复杂度大于所述第一数据复杂度;
识别模块,被配置为执行根据所述初始识别模型,对所述第二数据复杂度的训练数据进行识别,得到每一个第二数据复杂度的训练数据的识别结果;
第三获取模块,被配置为执行根据所述识别结果,在所述第二数据复杂度的训练数据中获取目标训练数据;
图像识别模块,被配置为执行利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
7.根据权利要求6所述的图像识别的装置,其特征在于,所述第三获取模块,被配置为执行根据所述识别结果,对所述第二数据复杂度的训练数据进行分组,得到多组训练数据;在每一组训练数据中,获取满足参考条件的训练数据;将得到的多组满足参考条件的训练数据作为目标训练数据。
8.根据权利要求7所述的图像识别的装置,其特征在于,所述第三获取模块,被配置为执行获取每一组训练数据中每一个训练数据的识别结果对应的预测概率;将每一组训练数据中的每一个训练数据根据预测概率进行排序;根据排序结果,获取每一组训练数据中满足参考条件的训练数据。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5中任一项所述的图像识别的方法。
10.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行权利要求1-5中任一项所述的图像识别的方法。
CN201910447401.4A 2019-05-27 2019-05-27 图像识别的方法、装置、设备及存储介质 Active CN110147850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910447401.4A CN110147850B (zh) 2019-05-27 2019-05-27 图像识别的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910447401.4A CN110147850B (zh) 2019-05-27 2019-05-27 图像识别的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110147850A true CN110147850A (zh) 2019-08-20
CN110147850B CN110147850B (zh) 2021-12-07

Family

ID=67591990

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910447401.4A Active CN110147850B (zh) 2019-05-27 2019-05-27 图像识别的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110147850B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783869A (zh) * 2020-06-29 2020-10-16 杭州海康威视数字技术股份有限公司 训练数据筛选方法、装置、电子设备及存储介质
CN114359904A (zh) * 2022-01-06 2022-04-15 北京百度网讯科技有限公司 图像识别方法、装置、电子设备以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268532A (zh) * 2014-09-30 2015-01-07 郑州轻工业学院 网络环境下大规模图像与视频数据高效处理的方法
EP3171297A1 (en) * 2015-11-18 2017-05-24 CentraleSupélec Joint boundary detection image segmentation and object recognition using deep learning
CN108460343A (zh) * 2018-02-06 2018-08-28 北京达佳互联信息技术有限公司 图像处理方法、系统及服务器
CN108595497A (zh) * 2018-03-16 2018-09-28 北京达佳互联信息技术有限公司 数据筛选方法、装置及终端
CN108921011A (zh) * 2018-05-15 2018-11-30 合肥岚钊岚传媒有限公司 一种基于隐马尔可夫模型的动态手势识别系统及方法
US10157333B1 (en) * 2015-09-15 2018-12-18 Snap Inc. Systems and methods for content tagging
CN109359517A (zh) * 2018-08-31 2019-02-19 深圳市商汤科技有限公司 图像识别方法和装置、电子设备、存储介质、程序产品
CN109740689A (zh) * 2019-01-09 2019-05-10 贵州宽凳智云科技有限公司 一种图像语义分割的错误标注数据筛选方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268532A (zh) * 2014-09-30 2015-01-07 郑州轻工业学院 网络环境下大规模图像与视频数据高效处理的方法
US10157333B1 (en) * 2015-09-15 2018-12-18 Snap Inc. Systems and methods for content tagging
EP3171297A1 (en) * 2015-11-18 2017-05-24 CentraleSupélec Joint boundary detection image segmentation and object recognition using deep learning
CN108460343A (zh) * 2018-02-06 2018-08-28 北京达佳互联信息技术有限公司 图像处理方法、系统及服务器
CN108595497A (zh) * 2018-03-16 2018-09-28 北京达佳互联信息技术有限公司 数据筛选方法、装置及终端
CN108921011A (zh) * 2018-05-15 2018-11-30 合肥岚钊岚传媒有限公司 一种基于隐马尔可夫模型的动态手势识别系统及方法
CN109359517A (zh) * 2018-08-31 2019-02-19 深圳市商汤科技有限公司 图像识别方法和装置、电子设备、存储介质、程序产品
CN109740689A (zh) * 2019-01-09 2019-05-10 贵州宽凳智云科技有限公司 一种图像语义分割的错误标注数据筛选方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHARAFAT IBN MOLLAH MOSHARRAF 等: "Improving Query Execution Performance in Big Data using Cuckoo Filter", 《IEEE》 *
林源: "《新型农村合作医疗保险》", 31 August 2015, 西南交通大学出版社 *
韦泽鲲 等: "基于随机森林的流量多特征提取与分类研究", 《传感器与微系统》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111783869A (zh) * 2020-06-29 2020-10-16 杭州海康威视数字技术股份有限公司 训练数据筛选方法、装置、电子设备及存储介质
CN111783869B (zh) * 2020-06-29 2024-06-04 杭州海康威视数字技术股份有限公司 训练数据筛选方法、装置、电子设备及存储介质
CN114359904A (zh) * 2022-01-06 2022-04-15 北京百度网讯科技有限公司 图像识别方法、装置、电子设备以及存储介质
CN114359904B (zh) * 2022-01-06 2023-04-07 北京百度网讯科技有限公司 图像识别方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
CN110147850B (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
Srivastava et al. Comparative analysis of deep learning image detection algorithms
CN108351986B (zh) 学习系统及装置和方法、训练数据生成装置及生成方法
CN109741332B (zh) 一种人机协同的图像分割与标注方法
CN110136103A (zh) 医学影像解释方法、装置、计算机设备及存储介质
CN111985572B (zh) 基于特征比较的通道注意力机制的细粒度图像识别方法
CN109583325A (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
CN108875811A (zh) 动物种类的分类方法、装置、计算机设备和存储介质
CN108681746A (zh) 一种图像识别方法、装置、电子设备和计算机可读介质
US20140079314A1 (en) Method and Apparatus for Improved Training of Object Detecting System
CN110135231A (zh) 动物面部识别方法、装置、计算机设备和存储介质
CN109767261A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN110147878B (zh) 数据处理方法、装置及设备
CN105844283A (zh) 用于识别图像类目归属的方法、图像搜索方法及装置
CN109086652A (zh) 手写字模型训练方法、汉字识别方法、装置、设备及介质
CN109919304A (zh) 神经网络搜索方法、装置、可读存储介质和计算机设备
US10380459B2 (en) System and method for image classification
CN111382782B (zh) 训练分类器的方法和装置
CN108921031A (zh) 汉字模型训练方法、手写字识别方法、装置、设备及介质
CN107066548B (zh) 一种双维度分类提取网页链接的方法
KR102325259B1 (ko) 반려동물 생애 관리 시스템 및 그 방법
CN112446441B (zh) 模型训练数据筛选方法、装置、设备及存储介质
CN110147850A (zh) 图像识别的方法、装置、设备及存储介质
CN111291773A (zh) 特征识别的方法及装置
CN110728182B (zh) 基于ai面试系统的面试方法、装置和计算机设备
KR20200082490A (ko) 기계 학습 데이터 선택 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant