CN110163296B - 图像识别的方法、装置、设备及存储介质 - Google Patents

图像识别的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110163296B
CN110163296B CN201910459366.8A CN201910459366A CN110163296B CN 110163296 B CN110163296 B CN 110163296B CN 201910459366 A CN201910459366 A CN 201910459366A CN 110163296 B CN110163296 B CN 110163296B
Authority
CN
China
Prior art keywords
target
training data
subset
training
data subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910459366.8A
Other languages
English (en)
Other versions
CN110163296A (zh
Inventor
张志伟
李焱
赵伟阳
夏雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201910459366.8A priority Critical patent/CN110163296B/zh
Publication of CN110163296A publication Critical patent/CN110163296A/zh
Application granted granted Critical
Publication of CN110163296B publication Critical patent/CN110163296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于一种图像识别的方法、装置、设备及存储介质,方法包括:获取第一目标训练数据子集和第一目标更新数据子集,获取基于第一目标训练数据子集训练机器学习模型得到的识别模型;根据识别模型对第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;通过第一目标更新数据子集中的每一个训练数据的识别结果更新第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;将更新后的第一目标更新数据子集和第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据,利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别,提高了模型的训练效率和识别结果的准确性。

Description

图像识别的方法、装置、设备及存储介质
技术领域
本公开涉及人工智能领域,尤其涉及一种图像识别的方法、装置、设备及存储介质。
背景技术
深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以卷积神经网络(convolution neural network,CNN)为例,CNN因其超强的拟合能力以及端到端的全局优化能力,使得机器识别准确率大幅提高。虽然使用CNN模型,机器学习模型的识别准确率得到了显著的提升。但得到一个满足识别要求的机器学习模型需要依赖大量的、标注准确率满足要求的训练数据。
相关技术中,一般是通过人工对数据进行标注来获取训练数据。但一般训练数据的需求量庞大,标注大量数据不仅需要消耗巨大的人力,而且标注速率慢,严重影响机器学习模型的训练效率;且依靠人工标注的方式获取训练数据,易出现标注错误,影响基于训练数据得到的识别模型的识别结果的准确性。
发明内容
本公开提供一种图像识别的方法、装置、设备及存储介质,能够克服相关技术中通过人工标注获得训练数据的方式,影响机器学习模型训练效率以及得到的识别模型的识别结果的准确性的问题。
根据本公开实施例的第一方面,提供一种图像识别的方法,所述方法包括:获取第一目标训练数据子集和第一目标更新数据子集,所述第一目标训练数据子集和所述第一目标更新数据子集由训练数据划分得到;获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型;根据所述识别模型对所述第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据;利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
可选地,所述通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集,包括:当所述第一目标更新数据子集中的任一个训练数据的识别结果与所述任一训练数据的初始标签不相同时,通过所述任一训练数据的识别结果更新所述任一训练数据的初始标签,得到更新标签的训练数据;将所述第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
可选地,所述将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据之后,所述方法还包括:对所述目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,所述第二目标训练数据子集与所述第一目标数据训练数据子集不同,所述第二目标更新数据子集与所述第一目标更新数据子集不同;获取所述第二目标更新数据子集中的每一个训练数据的识别结果;获取所述第二目标更新数据子集中的每一个训练数据的识别结果与所述第二目标更新数据子集中对应的训练数据的标签不相同的数量;当所述数量不满足目标数量时,通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集;将所述更新后的第二目标更新数据子集和所述第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,所述更新后的目标训练数据用于训练机器学习模型。
可选地,所述通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,包括:当所述第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
可选地,所述将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据之后,还包括:对每一次得到的目标训练数据进行处理,直至所述数量满足所述目标数量时,停止对标签的更新操作;将前一次得到的更新后的目标训练数据作为训练所述机器学习模型的目标训练数据。
可选地,所述获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型之前,所述方法还包括:
将机器学习模型的损失函数设置为目标损失函数,所述目标损失函数如下式所示:
Figure GDA0002743774970000021
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure GDA0002743774970000031
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
根据本公开实施例的第二方面,提供一种图像识别的装置,所述装置包括:第一获取模块,被配置为执行获取第一目标训练数据子集和第一目标更新数据子集,所述第一目标训练数据子集和所述第一目标更新数据子集由训练数据划分得到;第二获取模块,被配置为执行获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型;识别模块,被配置为执行根据所述识别模型对所述第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;更新模块,被配置为执行通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;第三获取模块,被配置为执行将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据;图像识别模块,被配置为执行利用基于所述目标训练数据训练得到的目标识别物的识别模型进行图像识别。
可选地,所述更新模块,被配置为执行当所述第一目标更新数据子集中的任一个训练数据的识别结果与所述任一训练数据的初始标签不相同时,通过所述任一训练数据的识别结果更新所述任一训练数据的初始标签,得到更新标签的训练数据;将所述第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
可选地,所述第三获取模块,还被配置为执行对所述目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,所述第二目标训练数据子集与所述第一目标数据训练数据子集不同,所述第二目标更新数据子集与所述第一目标更新数据子集不同;获取所述第二目标更新数据子集中的每一个训练数据的识别结果;获取所述第二目标更新数据子集中的每一个训练数据的识别结果与所述第二目标更新数据子集中对应的训练数据的标签不相同的数量;当所述数量不满足目标数量时,通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集;将所述更新后的第二目标更新数据子集和所述第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,所述更新后的目标训练数据用于训练机器学习模型。
可选地,所述第三获取模块,还被配置为执行当所述第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
可选地,所述第三获取模块,还被配置为执行对每一次得到的目标训练数据进行处理,直至所述数量满足所述目标数量时,停止对标签的更新操作;将前一次得到的更新后的目标训练数据作为训练所述机器学习模型的目标训练数据。
可选地,所述第二获取模块,还被配置为执行将机器学习模型的损失函数设置为目标损失函数,所述目标损失函数如下式所示:
Figure GDA0002743774970000041
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure GDA0002743774970000042
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,包括:当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面或第一方面的任一种可能的实施方式中的方法。
根据本公开实施例的第五方面,提供了一种计算机程序(产品),所述计算机程序(产品)包括:计算机程序代码,当所述计算机程序代码被计算机运行时,使得所述计算机执行上述各方面中的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
由于识别模型的获取是通过用于训练机器学习模型的训练数据划分得到的目标训练数据子集训练得到的,通过识别模型对用于训练机器学习模型的训练集中未用于训练的目标更新训练数据子集中的训练数据进行识别,提高了对目标更新训练数据子集的训练数据的识别结果的准确性,得到满足标注准确率要求的训练数据,提高了基于训练数据得到的识别模型的识别结果的准确性。同时根据识别结果更新训练数据的初始标签,在不通过人工标注的情况下,实现了对用于训练机器学习模型的训练集中训练数据的标注,提高了获取用于训练机器学习模型的训练数据的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图像识别的方法的流程图;
图2是根据一示例性实施例示出的一种图像识别的方法的流程图;
图3是根据一示例性实施例示出的一种图像识别的装置的框图;
图4是根据一示例性实施例示出的一种电子设备的框图;
图5是根据一示例性实施例示出的一种终端的示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完成地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在对机器学习模型进行训练时,为了使得训练后的机器学习模型的识别准确率满足识别要求,需要依赖于大量的、标注准确率满足要求的训练数据。但相关技术中,一般是通过人工标注的方式获取训练数据。由于训练机器学习模型的需要大量的训练数据,通过人工标注方式对训练数据加标注,耗费人力、物力成本。且人工标注速率慢,影响了机器学习的训练效率的同时依靠人工标注的方式获取训练数据,易出现标注错误,影响基于训练数据得到的识别模型的识别结果的准确性。
图1是根据一示例性实施例示出的一种图像识别的方法的流程图,如图1所示,该图像识别的方法用于计算机设备中,如终端或服务器中,包括以下步骤。
S11,获取第一目标训练数据子集和第一目标更新数据子集,第一目标训练数据子集和第一目标更新数据子集由训练数据划分得到。
示例性地,举例说明用于训练机器学习模型的训练集划分成第一目标训练数据子集和第一目标更新数据子集的过程。比如用于训练机器学习模型的训练集中包含100个训练数据。可以将其中50个训练数据构成第一目标训练数据子集,另外50个构成第一目标更新数据子集。也可以将100个训练数据按照其他比例划分,本申请不作限定。本领域技术人员可以根据划分不同比例的情况下,使用得到的第一目标更新数据子集中的训练数据的识别结果的预测概率最大时,所对应的划分比例来划分用于训练机器学习模型的训练集。也可以将用于训练机器学习模型100个训练数据中50个训练数据用于构成第一目标训练数据子集,将剩余的训练数据中的30个构成第一目标更新数据子集。也可以将用于训练机器学习模型的100个训练数据中60个训练数据用于构成第一目标训练数据子集,同时在100个训练数据中选取60个构成第一目标更新数据子集。即第一目标训练数据子集和第一目标更新数据子集可以有重合的训练数据。本申请实施例对第一目标更新数据子集中包含的训练数据的数量和第一目标训练数据子集包含的训练数据的数量不作限定,本领域技术人员可以根据实际需要确定训练数据的数量。
S12,获取基于第一目标训练数据子集训练机器学习模型得到的识别模型。
S13,根据识别模型对第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果。
S14,通过第一目标更新数据子集中的每一个训练数据的识别结果更新第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集。
示例性地,第一目标更新数据子集中的训练数据的初始标签可以是预先通过其他训练好的机器学习模型。对用于机器学习模型的训练集中的训练数据进行初步识别后,将初步识别的结果作为训练集中的训练数据的初始标签。本申请对该初始标签的获取方法不作限定,本领域技术人员可以根据实际使用需要获取训练数据的初始标签。
作为本申请一个可选实施方式,步骤S14,包括:
S141,当第一目标更新数据子集中的任一个训练数据的识别结果与任一训练数据的初始标签不相同时,通过任一训练数据的识别结果更新任一训练数据的初始标签,得到更新标签的训练数据。当第一目标更新数据子集中的每一个训练数据的识别结果与该训练数据的初始标签相同,则停止对识别结果与初始标签相同的训练数据的更新操作。
S142,将第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
通过对训练数据的识别结果与对应的训练数据的初始标签进行比对,将比对结果不相同的训练数据的初始标签进行更新,提高了对训练数据更新标签的效率,继而也提高了获取更新后的用于训练机器学习模型的训练集的效率。
S15,将更新后的第一目标更新数据子集和第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据。
S16,利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。
本申请实施例提供的图像识别的方法,由于识别模型的获取是通过用于训练机器学习模型的训练数据划分得到的目标训练数据子集训练得到的,通过得到的识别模型对用于训练机器学习模型的训练集中未用于训练的目标更新训练数据子集中训练数据进行识别,提高了对目标更新训练数据子集的训练数据的识别结果的准确性,得到满足标注准确率要求的训练数据,提高了基于训练数据得到的识别模型的识别结果的准确性。同时根据识别结果更新训练数据的初始标签,在不通过人工标注的情况下,实现了对用于训练机器学习模型的训练集中训练数据的标注,提高了获取用于训练机器学习模型的训练数据的效率。
作为本申请一个可选实施方式,步骤S15之后,如图2所示,该方法还包括:
S21,对目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,第二目标训练数据子集与第一目标数据训练数据子集不同,第二目标更新数据子集与第一目标更新数据子集不同。
S22,获取第二目标更新数据子集中的每一个训练数据的识别结果。
示例性地,通过根据第一目标更新数据子集和第一目标训练数据子集得到更新后的用于训练机器学习模型的训练集的方法,对第二目标训练数据子集和第二目标更新数据子集进行处理,得到对第二目标更新数据子集中的训练数据的识别结果。
S23,获取第二目标更新数据子集中的训练数据的识别结果与第二目标更新数据子集中训练数据的标签不相同的数量。
示例性地,由于第二目标更新数据子集和第二目标训练数据子集是通过更新后的用于训练机器学习模型的训练集划分得到的,因而第二目标更新数据子集中的训练数据的标签可能不是该训练数据的初始标签,而是在获取更新后的用于训练机器学习模型的训练集时,已经被更新过。因而获取的是第二目标更新数据子集中训练数据的当前的标签。
S24,当数量不满足目标数量时,通过第二目标更新数据子集中的训练数据的识别结果更新第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集。
示例性地,该目标数量的确定可以根据对用于训练机器学习模型的训练集中训练数据标注的准确性要求确定。例如,当该标注的准确性要求为90%,表示对于包含100个训练数据的第二目标更新数据子集中,第二目标更新数据子集中的训练数据的识别结果与第二目标更新数据子集中训练数据的标签不相同的数量应该低于10个。同样是对包含100个训练数据的第二目标更新数据子集,当得到第二目标更新数据子集中的训练数据的识别结果与第二目标更新数据子集中训练数据的标签不相同的数量应该低于10个,表明此时用于训练机器学习模型的训练接中对训练数据的标注的准确性已经达到准确性的要求,此时可以停止对第二目标更新数据子集中训练数据的标签更新操作。当数量满足目标数量时,停止对标签的更新操作。
作为本申请一个可选实施方式,步骤S24,包括:当第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
由于第二目标更新数据子集是通过对已更新的用于训练机器学习模型的训练集随机划分得到的,因而第二目标更新数据子集中的训练数据的标签可能不是初始标签。通过停止对标签不是初始标签的训练数据进行标签更新的操作,可以提高获取目标训练数据的效率。
S25,将更新后的第二目标更新数据子集和第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,更新后的目标训练数据用于训练机器学习模型。
对已更新的用于训练机器学习模型的训练集再次进行划分,通过得到划分后的目标更新数据子集中包含的训练数据的识别结果与目标更新数据子集中训练数据的标签不相同的数量来确定是否对已更新的用于训练机器学习模型的训练集的再划分,保证了获取的训练数据集中具有准确标签的训练数据数量。
作为本申请一个可选实施方式,步骤S15之后,还包括:
首先,对每一次得到的目标训练数据进行处理,直至数量满足目标数量时,停止对标签的更新操作。
其次,将前一次得到的更新后的目标训练数据作为训练机器学习模型的目标训练数据。
对每一次得到的目标训练数据再次进行划分,通过得到划分后的目标更新数据子集中包含的训练数据的识别结果与目标更新数据子集中训练数据的标签不相同的数量来确定最终的目标训练数据,保证了获取的目标训练数据中具有准确标签的训练数据的数量。
作为本申请一个可选实施方式,步骤S12之前,该方法还包括:将机器学习模型的损失函数设置为目标损失函数,该目标损失函数如下式(1)所示:
Figure GDA0002743774970000091
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure GDA0002743774970000092
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
示例性地,由于用于划分成第一目标训练数据子集和第一目标更新数据子集的训练集中训练数据的标签的精度不高。在通过标签精度不高的训练数据进行训练获取识别模型时,为了避免精度不高的训练数据对识别模型产生影响,将机器学习模型的损失函数设置为sigmoid损失函数,且将该sigmoid损失函数中负样本均衡系数设置为0。例如,当训练集中的训练数据包含一“猫”的图像,该图像的标签是“猫”,但在训练集中又包含了一相同的图像,该图像的标签是“狗”。因而为了避免同一图像、不同标签的训练数据对训练结果的影响,将sigmoid损失函数中负样本均衡系数设置为0。即根据式(1),若负样本均衡系数为0,当训练数据包含的“猫”的图像与其标签一致,那么得到的损失函数的损失值为
Figure GDA0002743774970000093
当训练数据包含的“猫”的图像与其标签不一致,得到的损失函数的损失值为0。即只有标签和训练数据内容对应的情况下,才会产生损失值。而若不将负样本均衡系数设置为0,那么当训练数据包含的“猫”的图像与其标签不一致时,也会产生损失值
Figure GDA0002743774970000094
导致产生的损失值影响机器学习模型的梯度下降速度,继而影响得到识别模型迭代的效率。
在得到最终更新的用于训练机器学习模型的训练集之后,在使用该训练集中的训练数据训练机器学习模型时,可以将该sigmoid损失函数中负样本均衡系数设置为1,或者将机器学习模型的损失函数更新为softmax交叉熵损失函数,以提高得到的机器学习模型的泛化能力。
图3是根据一示例性实施例示出的一种图像识别的装置框图。参照图3,该装置包括第一获取模块31、第二获取模块32、识别模块33、更新模块34、第三获取模块35、图像识别模块36。
第一获取模块31,被配置为执行获取第一目标训练数据子集和第一目标更新数据子集,第一目标训练数据子集和第一目标更新数据子集由训练数据划分得到;
第二获取模块32,被配置为执行获取基于第一目标训练数据子集训练机器学习模型得到的识别模型;
识别模块33,被配置为执行根据识别模型对第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;
更新模块34,被配置为执行通过第一目标更新数据子集中的每一个训练数据的识别结果更新第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;
第三获取模块35,被配置为执行将更新后的第一目标更新数据子集和第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据;
图像识别模块36,被配置为执行利用基于目标训练数据训练得到的目标识别物的识别模型进行图像识别。
本申请实施例提供的图像识别的装置,由于识别模型的获取是通过用于训练机器学习模型的训练数据划分得到的目标训练数据子集训练得到的,通过得到的识别模型对用于训练机器学习模型的训练集中未用于训练的目标更新训练数据子集中训练数据进行识别,提高了对目标更新训练数据子集的训练数据的识别结果的准确性,得到满足标注准确率要求的训练数据,提高了基于训练数据得到的识别模型的识别结果的准确性。同时根据识别结果更新训练数据的初始标签,在不通过人工标注的情况下,实现了对用于训练机器学习模型的训练集中训练数据的标注,提高了获取用于训练机器学习模型的训练数据的效率
作为本申请一个可选实施方式,更新模块34,被配置为执行当第一目标更新数据子集中的任一个训练数据的识别结果与任一训练数据的初始标签不相同时,通过任一训练数据的识别结果更新任一训练数据的初始标签,得到更新标签的训练数据;将第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
作为本申请一个可选实施方式,第三获取模块35,还被配置为执行对目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,第二目标训练数据子集与第一目标数据训练数据子集不同,第二目标更新数据子集与第一目标更新数据子集不同;获取第二目标更新数据子集中的每一个训练数据的识别结果;获取第二目标更新数据子集中的每一个训练数据的识别结果与第二目标更新数据子集中对应的训练数据的标签不相同的数量;当数量不满足目标数量时,通过第二目标更新数据子集中的训练数据的识别结果更新第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集;将更新后的第二目标更新数据子集和第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,更新后的目标训练数据用于训练机器学习模型。
作为本申请一个可选实施方式,第三获取模块35,还被配置为执行当第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
作为本申请一个可选实施方式,第三获取模块35,还被配置为执行对每一次得到的目标训练数据进行处理,直至数量满足目标数量时,停止对标签的更新操作;将前一次得到的更新后的目标训练数据作为训练机器学习模型的目标训练数据。
作为本申请一个可选实施方式,第二获取模块32,还被配置为执行将机器学习模型的损失函数设置为目标损失函数,目标损失函数如下式所示:
Figure GDA0002743774970000111
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure GDA0002743774970000112
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于相同构思,本申请实施例还提供一种电子设备,如图4所示,所述设备包括:
处理器41;
用于存储所述处理器41可执行指令的存储器42;
其中,所述处理器被配置为执行所述命令,以实现如上述实施例所述的图像识别的方法。处理器41和存储器42通过通信总线43连接。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,在一种可选的实施例中,上述存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data dateSDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(directrambus RAM,DR RAM)。
图5是根据一示例性实施例示出的一种终端600的框图。该终端600可以是:智能手机、平板电脑、笔记本电脑或台式电脑。终端600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端600包括有:处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的图像识别的方法。
在一些实施例中,终端600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、显示屏605、摄像头606、音频电路607、定位组件608和电源609中的至少一种。
外围设备接口603可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置终端600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在终端600的不同表面或呈折叠设计;在再一些实施例中,显示屏605可以是柔性显示屏,设置在终端600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
定位组件608用于定位终端600的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件608可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于:加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。
加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号,控制触摸显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器612可以检测终端600的机体方向及转动角度,陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器613可以设置在终端600的侧边框和/或触摸显示屏605的下层。当压力传感器613设置在终端600的侧边框时,可以检测用户对终端600的握持信号,由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在触摸显示屏605的下层时,由处理器601根据用户对触摸显示屏605的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器614用于采集用户的指纹,由处理器601根据指纹传感器614采集到的指纹识别用户的身份,或者,由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器601授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时,指纹传感器614可以与物理按键或厂商Logo集成在一起。
光学传感器615用于采集环境光强度。在一个实施例中,处理器601可以根据光学传感器615采集的环境光强度,控制触摸显示屏605的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏605的显示亮度;当环境光强度较低时,调低触摸显示屏605的显示亮度。在另一个实施例中,处理器601还可以根据光学传感器615采集的环境光强度,动态调整摄像头组件606的拍摄参数。
接近传感器616,也称距离传感器,通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中,当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时,由处理器601控制触摸显示屏605从亮屏状态切换为息屏状态;当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时,由处理器601控制触摸显示屏605从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图5中示出的结构并不构成对终端600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
本申请提供了一种计算机程序,当计算机程序被计算机执行时,可以使得处理器或计算机执行上述方法实施例中对应的各个步骤和/或流程。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如,同轴电缆、光纤、数字用户线)或无线(例如,红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如,固态硬盘SolidState Disk)等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种图像识别的方法,其特征在于,所述方法包括:
获取第一目标训练数据子集和第一目标更新数据子集,所述第一目标训练数据子集和所述第一目标更新数据子集由训练数据划分得到;
获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型;
根据所述识别模型对所述第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;
通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;
将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到目标训练数据;
将所述目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,所述第二目标训练数据子集与所述第一目标据训练数据子集不同,所述第二目标更新数据子集与所述第一目标更新数据子集不同;获取所述第二目标更新数据子集中的每一个训练数据的识别结果;获取所述第二目标更新数据子集中的每一个训练数据的识别结果与所述第二目标更新数据子集中对应的训练数据的标签不相同的数量;当所述数量不满足目标数量时,通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集;将所述更新后的第二目标更新数据子集和所述第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,所述更新后的目标训练数据用于训练机器学习模型;
利用基于所述更新后的目标训练数据训练得到的目标识别物的识别模型进行图像识别。
2.根据权利要求1所述的图像识别的方法,其特征在于,所述通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集,包括:
当所述第一目标更新数据子集中的任一个训练数据的识别结果与所述任一训练数据的初始标签不相同时,通过所述任一训练数据的识别结果更新所述任一训练数据的初始标签,得到更新标签的训练数据;
将所述第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
3.根据权利要求1所述的图像识别的方法,其特征在于,所述通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,包括:
当所述第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
4.根据权利要求3所述的图像识别的方法,其特征在于,所述将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到用于训练机器学习模型的目标训练数据之后,还包括:
对每一次得到的目标训练数据进行处理,直至所述数量满足所述目标数量时,停止对标签的更新操作;
将前一次得到的更新后的目标训练数据作为训练所述机器学习模型的目标训练数据。
5.根据权利要求1-4中任一项所述的图像识别的方法,其特征在于,所述获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型之前,所述方法还包括:
将机器学习模型的损失函数设置为目标损失函数,所述目标损失函数如下式所示:
Figure FDA0002743774960000021
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure FDA0002743774960000022
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
6.一种图像识别的装置,其特征在于,所述装置包括:
第一获取模块,被配置为执行获取第一目标训练数据子集和第一目标更新数据子集,所述第一目标训练数据子集和所述第一目标更新数据子集由训练数据划分得到;
第二获取模块,被配置为执行获取基于所述第一目标训练数据子集训练机器学习模型得到的识别模型;
识别模块,被配置为执行根据所述识别模型对所述第一目标更新数据子集中的每一个训练数据进行识别,得到识别结果;
更新模块,被配置为执行通过所述第一目标更新数据子集中的每一个训练数据的识别结果更新所述第一目标更新数据子集中对应的训练数据的初始标签,得到更新后的第一目标更新数据子集;
第三获取模块,被配置为执行将所述更新后的第一目标更新数据子集和所述第一目标训练数据子集进行合并处理,得到目标训练数据;
所述第三获取模块,还被配置为执行将所述目标训练数据进行划分,得到第二目标训练数据子集和第二目标更新数据子集,所述第二目标训练数据子集与所述第一目标据训练数据子集不同,所述第二目标更新数据子集与所述第一目标更新数据子集不同;获取所述第二目标更新数据子集中的每一个训练数据的识别结果;获取所述第二目标更新数据子集中的每一个训练数据的识别结果与所述第二目标更新数据子集中对应的训练数据的标签不相同的数量;当所述数量不满足目标数量时,通过所述第二目标更新数据子集中的训练数据的识别结果更新所述第二目标更新数据子集中对应的训练数据的标签,得到更新后的第二目标更新数据子集;将所述更新后的第二目标更新数据子集和所述第二目标训练数据子集进行合并处理,得到更新后的目标训练数据,所述更新后的目标训练数据用于训练机器学习模型;
图像识别模块,被配置为执行利用基于所述更新后的目标训练数据训练得到的目标识别物的识别模型进行图像识别。
7.根据权利要求6所述的图像识别的装置,其特征在于,所述更新模块,被配置为执行当所述第一目标更新数据子集中的任一个训练数据的识别结果与所述任一训练数据的初始标签不相同时,通过所述任一训练数据的识别结果更新所述任一训练数据的初始标签,得到更新标签的训练数据;将所述第一目标更新数据子集中更新标签的训练数据与未更新标签的训练数据进行合并处理,得到更新后的第一目标更新数据子集。
8.根据权利要求6所述的图像识别的装置,其特征在于,所述第三获取模块,还被配置为执行当所述第二目标更新数据子集中的训练数据的标签不是初始标签时,停止对标签不是初始标签的训练数据进行标签更新操作。
9.根据权利要求6所述的图像识别的装置,其特征在于,所述第三获取模块,还被配置为执行对每一次得到的目标训练数据进行处理,直至所述数量满足所述目标数量时,停止对标签的更新操作;将前一次得到的更新后的目标训练数据作为训练所述机器学习模型的目标训练数据。
10.根据权利要求6-9中任一项所述的图像识别的装置,其特征在于,所述第二获取模块,还被配置为执行将机器学习模型的损失函数设置为目标损失函数,所述目标损失函数如下式所示:
Figure FDA0002743774960000041
式中:lossn为训练数据n的损失函数;pn∈{0,1},当pn为0,表征训练数据n的标签未真实反应训练数据的内容,当pn为1,表征训练数据n的标签真实反应训练数据的内容;
Figure FDA0002743774960000042
为使用机器学习模型得到训练数据n的标签的预测概率;α为负样本均衡系数,α取值为0。
11.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5中任一项所述的图像识别的方法。
12.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-5中任一项所述的图像识别的方法。
CN201910459366.8A 2019-05-29 2019-05-29 图像识别的方法、装置、设备及存储介质 Active CN110163296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910459366.8A CN110163296B (zh) 2019-05-29 2019-05-29 图像识别的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910459366.8A CN110163296B (zh) 2019-05-29 2019-05-29 图像识别的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110163296A CN110163296A (zh) 2019-08-23
CN110163296B true CN110163296B (zh) 2020-12-18

Family

ID=67630197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910459366.8A Active CN110163296B (zh) 2019-05-29 2019-05-29 图像识别的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110163296B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651414B (zh) * 2019-10-10 2023-06-27 马上消费金融股份有限公司 运动数据处理和模型训练方法、装置、设备及存储介质
CN112801296B (zh) * 2019-11-13 2024-05-31 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN112825143A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 深度卷积神经网络压缩方法、装置、存储介质及设备
CN110909887B (zh) * 2019-11-21 2023-06-09 广州极飞科技股份有限公司 模型优化方法及装置
CN112801116B (zh) * 2021-01-27 2024-05-21 商汤集团有限公司 图像的特征提取方法及装置、电子设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542014A (zh) * 2011-12-16 2012-07-04 华中科技大学 基于内容的图像检索反馈方法
CN102663435A (zh) * 2012-04-28 2012-09-12 南京邮电大学 基于半监督的垃圾图片过滤方法
CN108509969A (zh) * 2017-09-06 2018-09-07 腾讯科技(深圳)有限公司 数据标注方法及终端
CN108537269A (zh) * 2018-04-04 2018-09-14 中山大学 一种弱交互式的物体检测深度学习方法及其系统
CN108898595A (zh) * 2018-06-27 2018-11-27 慧影医疗科技(北京)有限公司 一种胸部疾病检测模型的构建方法及应用
CN108921051A (zh) * 2018-06-15 2018-11-30 清华大学 基于循环神经网络注意力模型的行人属性识别网络及技术
CN109359793A (zh) * 2018-08-03 2019-02-19 阿里巴巴集团控股有限公司 一种针对新场景的预测模型训练方法及装置
CN109543713A (zh) * 2018-10-16 2019-03-29 北京奇艺世纪科技有限公司 训练集的修正方法及装置
CN109783730A (zh) * 2019-01-03 2019-05-21 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697388A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 人脸识别方法和装置
CN107798390B (zh) * 2017-11-22 2023-03-21 创新先进技术有限公司 一种机器学习模型的训练方法、装置以及电子设备
US10943096B2 (en) * 2017-12-31 2021-03-09 Altumview Systems Inc. High-quality training data preparation for high-performance face recognition systems
CN109165541B (zh) * 2018-05-30 2023-05-02 北京飞鸿云际科技有限公司 用于智能识别轨道交通车辆图像中车辆零部件的编码方法
CN109784382A (zh) * 2018-12-27 2019-05-21 广州华多网络科技有限公司 标注信息处理方法、装置以及服务器

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542014A (zh) * 2011-12-16 2012-07-04 华中科技大学 基于内容的图像检索反馈方法
CN102663435A (zh) * 2012-04-28 2012-09-12 南京邮电大学 基于半监督的垃圾图片过滤方法
CN108509969A (zh) * 2017-09-06 2018-09-07 腾讯科技(深圳)有限公司 数据标注方法及终端
CN108537269A (zh) * 2018-04-04 2018-09-14 中山大学 一种弱交互式的物体检测深度学习方法及其系统
CN108921051A (zh) * 2018-06-15 2018-11-30 清华大学 基于循环神经网络注意力模型的行人属性识别网络及技术
CN108898595A (zh) * 2018-06-27 2018-11-27 慧影医疗科技(北京)有限公司 一种胸部疾病检测模型的构建方法及应用
CN109359793A (zh) * 2018-08-03 2019-02-19 阿里巴巴集团控股有限公司 一种针对新场景的预测模型训练方法及装置
CN109543713A (zh) * 2018-10-16 2019-03-29 北京奇艺世纪科技有限公司 训练集的修正方法及装置
CN109783730A (zh) * 2019-01-03 2019-05-21 深圳壹账通智能科技有限公司 产品推荐方法、装置、计算机设备和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Fine-Tuning Convolutional Neural Networks for Biomedical Image Analysis:Actively and Incrementally";Zhou Zongwei et al.;《CVPR》;20171231;全文 *
"Holistically-Nested Edge Detection";Saining Xie et al.;《2015 IEEE International Conference on Computer Vision》;20151231;全文 *
"类别非均衡遥感图像语义分割的全卷积网络方法";吴止锾 等;《光学学报》;20190430;第39卷(第4期);全文 *

Also Published As

Publication number Publication date
CN110163296A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN110121118B (zh) 视频片段定位方法、装置、计算机设备及存储介质
CN110163296B (zh) 图像识别的方法、装置、设备及存储介质
CN111127509B (zh) 目标跟踪方法、装置和计算机可读存储介质
CN110070143B (zh) 获取训练数据的方法、装置、设备及存储介质
CN111104980B (zh) 确定分类结果的方法、装置、设备及存储介质
CN110134744B (zh) 对地磁信息进行更新的方法、装置和系统
CN111192262A (zh) 基于人工智能的产品缺陷分类方法、装置、设备及介质
US20220245403A1 (en) Method and apparatus for upgrading intelligent model, electronic device and non-transitory computer readable storage medium
CN111354378B (zh) 语音端点检测方法、装置、设备及计算机存储介质
CN110991445A (zh) 竖排文字识别方法、装置、设备及介质
CN111261174B (zh) 音频的分类方法、装置、终端及计算机可读存储介质
CN111898535A (zh) 目标识别方法、装置及存储介质
CN110992954A (zh) 语音识别的方法、装置、设备及存储介质
CN110569064A (zh) 接口标识生成方法、装置、设备及存储介质
CN110414673B (zh) 多媒体识别方法、装置、设备及存储介质
CN111611414A (zh) 车辆检索方法、装置及存储介质
CN109816047B (zh) 提供标签的方法、装置、设备及可读存储介质
CN114360494A (zh) 韵律标注方法、装置、计算机设备及存储介质
CN110045999B (zh) 绘制组件的方法、装置、终端和存储介质
CN114283395A (zh) 车道线检测的方法、装置、设备及计算机可读存储介质
CN110096707B (zh) 生成自然语言的方法、装置、设备及可读存储介质
CN113051485A (zh) 群组搜索方法、装置、终端及存储介质
CN111652432A (zh) 用户属性信息的确定方法、装置、电子设备及存储介质
CN112163677A (zh) 应用机器学习模型的方法、装置及设备
CN112990424A (zh) 神经网络模型训练的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant