CN109034218A - 模型训练方法、装置、设备及存储介质 - Google Patents

模型训练方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109034218A
CN109034218A CN201810759307.8A CN201810759307A CN109034218A CN 109034218 A CN109034218 A CN 109034218A CN 201810759307 A CN201810759307 A CN 201810759307A CN 109034218 A CN109034218 A CN 109034218A
Authority
CN
China
Prior art keywords
image
data set
image data
weighted
incremental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810759307.8A
Other languages
English (en)
Other versions
CN109034218B (zh
Inventor
平安
王希
何光宇
张立东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201810759307.8A priority Critical patent/CN109034218B/zh
Publication of CN109034218A publication Critical patent/CN109034218A/zh
Application granted granted Critical
Publication of CN109034218B publication Critical patent/CN109034218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2136Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on sparsity criteria, e.g. with an overcomplete basis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种模型训练方法、装置、设备及存储介质,其中,该方法包括:获取第一图像数据集;对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;基于所述增量图像和所述第一图像数据集,训练获得第一模型。本发明实施例能够保证在图像特征清晰不变的情况下,大规模、有效的增量图像。

Description

模型训练方法、装置、设备及存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种模型训练方法、装置、设备及存储介质。
背景技术
随着深度神经网络的兴起,人工智能(简称AI)已经可以像人类一样识别并且认知图像属性,如斯坦福大学的研究者通过13万张皮肤疾病图像训练出一个诊断皮肤癌的AI算法,并且诊断结果达专家水平。
目前在深度神经网络的学习方面,除了要求具有大体量的训练数据以外,还有一个很重要的前提是需要有足够量的标注数据。以医学领域为例,在医学图像处理上面,图像数据集标注不只是诊断报告,还需要高质量的精细的标注,如图像层面及病灶类型和区域等标注,标注的准确性关乎结果的准确性。因为医学图像处理需要医学的专业知识,就是说医生对这些病比较熟悉他才能标注,一般人是很难标注的,而且标注的成本还很高。由此可见一般,目前在各个领域中有效标注的图像数据集都是很有限的,那么如何利用有限的图像数据集得到准确的深度神经网络模型就显得十分重要。
发明内容
本发明实施例提供一种模型训练方法、装置、设备及存储介质,用以在保证在图像特征清晰不变的情况下,大规模、有效的增量图像,从而基于增量图像得到准确的模型。
本发明实施例第一方面提供一种模型训练方法,包括:
获取第一图像数据集;
对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;
基于所述增量图像和所述第一图像数据集,训练获得第一模型。
在一种可能的设计中,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
对所述第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
在又一种可能的设计中,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中的图像只包括相同的标签;
针对每组图像样本,获取组内的图像进行加权求和处理得到增量图像。
在又一种可能的设计中,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像;
针对每组图像样本,从组内获取具有不同标签的图像进行加权求和,获得增量图像,其中所述增量图像的标签为加权求和时权重值最大的图像的标签。
在又一种可能的设计中,所述基于所述增量图像和所述第一图像数据集,训练获得第一模型之后,所述方法还包括:
获取第二图像数据集,其中所述第二图像数据集和所述第一图像数据集之间的相似度大于预设阈值;
基于所述第二图像数据集,对所述第一模型进行迁移学习处理,获得第二模型。
在又一种可能的设计中,所述基于所述第二图像数据集,对所述第一模型进行迁移学习处理,获得第二模型之后,所述方法还包括:
从所述第二模型中提取所述第二图像数据集的特征数据;
基于所述特征数据训练获得第三模型。
在又一种可能的设计中,所述基于所述特征数据训练获得第三模型,包括:
对所述特征数据进行字典学习处理和稀疏特征提取处理,获得所述特征数据对应的稀疏特征矩阵;
基于所述稀疏特征矩阵训练获得第三模型。
在又一种可能的设计中,所述方法还包括:
获取图像数据;
将所述图像数据输入所述第三模型,以基于所述第三模型对所述图像数据进行数据分类。
本发明实施例第二方面提供一种模型训练装置,包括:
第一获取模块,用于获取第一图像数据集;
第一处理模块,用于对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;
第一训练模块,用于基于所述增量图像和所述第一图像数据集,训练获得第一模型。
在一种可能的设计中,
所述第一处理模块,包括:
第一处理子模块,用于对所述第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
在又一种可能的设计中,
所述第一处理模块,包括:
第一获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中的图像只包括相同的标签;
第二处理子模块,用于针对每组图像样本,获取组内的图像进行加权求和处理得到增量图像。
在又一种可能的设计中,
所述第一处理模块,包括:
第二获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像;
第三处理子模块,用于针对每组图像样本,从组内获取具有不同标签的图像进行加权求和,获得增量图像,其中所述增量图像的标签为加权求和时权重值最大的图像的标签。
在又一种可能的设计中,所述装置还包括:
第二获取模块,用于获取第二图像数据集,其中所述第二图像数据集和所述第一图像数据集之间的相似度大于预设阈值;
第二处理模块,用于基于所述第二图像数据集,对所述第一模型进行迁移学习处理,获得第二模型。
在又一种可能的设计中,所述装置还包括:
提取模块,用于从所述第二模型中提取所述第二图像数据集的特征数据;
第二训练模块,用于基于所述特征数据训练获得第三模型。
在又一种可能的设计中,所述第二训练模块,具体用于:
对所述特征数据进行字典学习处理和稀疏特征提取处理,获得所述特征数据对应的稀疏特征矩阵;
基于所述稀疏特征矩阵训练获得第三模型。
在又一种可能的设计中,所述装置还包括:
第三获取模块,用于获取图像数据;
分类模块,用于将所述图像数据输入所述第三模型,以基于所述第三模型对所述图像数据进行数据分类。
本发明实施例第三方面提供一种计算机设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
当所述处理器执行所述可执行指令时,可以执行上述第一方面所述的方法。
本发明实施例第四方面提供一种计算机可读存储介质,包括指令,当所述指令在所述计算机上运行时,所述计算机可以执行上述第一方面所述的方法。
本发明实施例中,通过获取第一图像数据集,对第一图像数据集中的图像进行加权求和处理获得增量图像,基于增量图像和第一图像数据集来训练获得第一模型。由于本发明实施例中的增量图像是通过加权求和的方式得到的,并且加权求和的处理方式并不会导致图像特征丢失,因此本发明实施例得到的增量图像能够很好的保持原图像的特征,这样在获得足够的增量图像后,再基于增量图像和第一图像数据集就能训练获得较为准确的模型。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种模型训练方法的流程图;
图2是本发明实施例提供的一种模型训练方法的流程图;
图3是本发明实施例提供的模型训练方法的流程图;
图4是本发明实施例提供的一种模型训练装置的结构示意图;
图5是本发明实施例提供的一种模型训练装置的结构示意图;
图6是本发明实施例提供的一种模型训练装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤的过程或结构的装置不必限于清楚地列出的那些结构或步骤而是可包括没有清楚地列出的或对于这些过程或装置固有的其它步骤或结构。
在现有技术中,为了能够基于较少的样本数据得到较为精确的模型,一般会对样本数据进行增量处理,在样本数据足够丰富之后再进行模型训练。其中一般常用的增量处理方式包括:改变图像亮度、饱和度、对比度变化;采用随机图像差值方式,对图像进行裁剪、缩放,或者尺度和长宽比增强变换;水平/垂直翻转,平移变换,旋转/仿射变换;高斯噪声、模糊处理等等。这些增量处理方式都会产生一个问题,原始的图像经过上述增量处理后,本来很容易识别的特征,反而变得不容易识别了。尤其在医学图像上,往往图片很大,而病灶区域却很微小,或者比较模糊。若使用现有的增量处理方式,医学图像上的病灶特征将更加难以捕获。
针对现有技术存在的上述问题,本发明实施例提供了一种模型训练方法,该方法通过对图像数据集中的图像进行加权求和来获得增量图像,由于加权求和的处理方式并不会导致图像特征丢失,因此,基于加权求和的方式获得的增量图像能够很好的保持原始图像的特征,基于加权求和获得的增量图像和原始图像数据集能够训练获得较为准确的模型。从而本发明实施例能够在保证图像特征清晰不变的情况下,大规模、有效的增量图像,提高模型训练的准确性。
下面结合附图以及具体实施例对本发明的技术方案进行详细的描述:
图1是本发明实施例提供的一种模型训练方法的流程图,该方法可以由一种模型训练装置执行。如图1所示,本实施例提供的方法包括:
步骤101、获取第一图像数据集。
其中,本实施例中对于“第一图像数据集”的命名仅是用于将目标获得的图像数据集与其他图像数据集进行区分,而不具备其他含义。
针对第一图像数据集,本实施例不对其图片的领域和类型进行限定。为了方便理解,本实施例中可示例性的将第一图像数据集理解为包含医学领域图像的数据集,比如,在一种可能的场景中,第一图像数据集可以是包含有是否患有某种疾病的标签的图像数据集,当然这里仅为示例说明而不是对本发明的唯一限定。
步骤102、对所述第一图像数据集中的图像进行加权求和处理,获得增量图像。
其中,本实施例在进行加权求和时,可选的方法至少包括如下几种:
在一种可能的加权求和方式中,可以先从第一图像数据集中获取多组图像样本,使得同一组图像样本中只包括相同标签的图像,比如,在同一组图像样本中可能只包括患病标签的图像,或者可能只包括未患病标签的图像等,当然这里仅为示例说明而不是对本发明的唯一限定。进一步的,针对每组图像样本,从组内获取多张图像进行加权求和处理得到增量图像,获取的图像数量小于或等于组内的样本总数。并且,由于这种方式参与加权求和的图像的标签均相同,因此,得到的增量图像的标签也应与参与加权求和的图像的标签相同,即基于各组图像样本得到的增量图像的标签与该组图像样本对应的标签相同。
为了更加清楚的了解上述方式的执行方式,下面通过举例的方式来进行说明:
假设从相同标签的图像样本中随机抽取n个图像样本Mi(i=1,2,..,n),通过对图像的像素点数据加权求和,得到新样本图像M:
M=ω1M12M2+…+ωnMn
ω12+…+ωn=1
Mi为图像像素点数组;
ωi为随机抽取的第i个样本的权重。
在确定各样本的权重时,可能的方式可能有如下几种:
在一种方式中,相同标签的图像样本在进行加权求和处理时可以取等权重,即:n等于或大于2。若第一图像数据集中包括的相同标签的图像样本数为N,要抽取n个样本,依据组合计算,若采用等权重时,可以得到增量图像的个数为:
当n=0.5N时为最大。也就是说本实施例中,可以对第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
在另一种方式中,也可以采用随机权重:Wi为随机选取值。n个权重全排列,有:种方法。
可以得到增量图像的总数量M为:
当n=N-1时,M最大,M=N!。
在另一种可能的加权求和方式中,可以先从第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像,比如,在同一组图样样本中可能既包括患病标签的图像又包括未患病标签的图像,当然这里仅为示例说明而不是对本发明的唯一限定。进一步的,针对每组图像样本,需要从组内获取具有不同标签的图像进行加权求和,获得增量图像,并将参与加权求和的图像中对应加权值最大的图像的标签作为增量图像的标签。
同样的,下面将以举例的方式来这种加权求和方式进行详细说明:
举例来说,假设从标有患病标签的图像中选取一个样本Md,从标有未患病标签的图像中选取一个样本Mh,二者进行匹配组合,通过加权方式生成新的样本M,即:
M=ωdMdhMh
ωdh=1
新生成的增量图像标签为二者权重较大的图像的标签。这样就得到一个增量图像(即新生成的样本)。当然这里仅是以两个样本加权求和为例所进行的说明,实际上在这种加权求和方式中参与加权求和的样本是更多个,其具体执行方式与两个图像加权求和的情况类似,在这里不再赘述。另外,这种方式所能得到的增量图像的个数也可以基于前述排列组合的方式计算获得,在这里不再赘述。
在又一种可能的加权求和方式中,可以同时采用上述第一种和第二种方式获取增量图像。
步骤103、基于所述增量图像和所述第一图像数据集,训练获得第一模型。
本实施例,通过获取第一图像数据集,对第一图像数据集中的图像进行加权求和处理获得增量图像,基于增量图像和第一图像数据集来训练获得第一模型。由于本发明实施例中的增量图像是通过加权求和的方式得到的,并且加权求和的处理方式并不会导致图像特征丢失,因此本实施例得到的增量图像能够很好的保持原图像的特征,这样在获得足够的增量图像后,再基于增量图像和第一图像数据集就能训练获得较为准确的模型。
图2是本发明实施例提供的一种模型训练方法的流程图,如图2所示,在图1实施例的方法获得第一模型之后,本实施例提供的方法还可以包括如下步骤:
步骤201、获取第二图像数据集,其中所述第二图像数据集和所述第一图像数据集之间的相似度大于预设阈值。
步骤202、基于所述第二图像数据集,对所述第一模型进行迁移学习处理,获得第二模型。
其中,当第二图像数据集和第一图像数据集之间的相似度大于预设阈值时,第二图像数据集中的图像特征数据与第一图像数据集的图像特征数据相似,从而基于迁移学习的方法,就能够基于第二图像数据集对第一模型进行约束,得到能够准确识别第二图像数据集中图像特征的第二模型。
示例的,为了方便理解本实施例的技术方案,下面进行举例说明:
假设第一图像数据集中包括皮肤病A的病征图像,基于第一图像数据集训练获得的第一模型可以基于图像识别皮肤病A。假设第二图像数据集中包括皮肤病B的病征图像,由于第一图像数据集和第二图像数据集属于同一领域,皮肤病A的图像特征和皮肤病B的图像特征相似,基于迁移学习的原理,可以通过第二图像数据集对第一模型进行约束,就能够得到用于识别皮肤病B的第二模型。其中,本实施例中的迁移学习可以参见现有技术,在这里不再赘述。当然上述举例仅是为了便于理解所进行的示例说明,而不是对本发明的唯一限定。
本实施例,当第一图像数据集和第二图像数据集之间的相似度大于预设阈值的时,第一图像数据集中的特征数据与第二图像数据集中的特征数据相似,基于迁移学习的原理,第二图像数据集中的数据量不需要很大,只要很小的数据量就能够在第一模型的基础上对第一模型的高层网络上的特征进行约束,从而得到能够准确识别第二图像数据集中特征的第二模型,从而能够降低模型训练的成本,提高模型训练效率。
图3是本发明实施例提供的模型训练方法的流程图,如图3所示,在上述步骤202之后还可以包括如下方法:
步骤301、从所述第二模型中提取所述第二图像数据集的特征数据。
本实施例中,第二模型包括多层卷积神经网络和全连通神经网络,多层卷积神经网络实现图像特征的提取,全连通神经网络实现图像分类。多层卷积神经网络最后一层隐含的图像数据通常作为图像的特征,把该特征数据抽取出来即获得第二图像数据集的特征数据。
步骤302、基于所述特征数据训练获得第三模型。
其中,为了提高模型的训练效率,本实施例在训练第三模型时,可以先对前述获得的特征数据进行字典学习处理和稀疏特征提取处理,获得特征数据对应的稀疏特征矩阵,进一步的再基于稀疏特征矩阵训练获得第三模型。
假设用一个M*N的矩阵表示前述提取的特征数据的集合X,每一列代表一个样本,每一行代表样本的一个属性,一般而言,该矩阵是稠密的,即大多数元素不为0。稀疏表示的含义是,寻找一个稀疏矩阵A(K*N)以及一个字典矩阵B(M*K),使得B*A尽可能的还原数据集X,且A尽可能的稀疏。A便是数据集X的稀疏表示。
表达为优化问题的话,字典学习的最简单形式为:
通过优化学习,获取B、A矩阵。A矩阵即为数据集X的稀疏特征矩阵。
基于上述字典学习和稀疏特征提取的原理,本实施例可以提取出前述特征数据的稀疏特征矩阵。
示例的,假设本实施例中的第三模型用于预测疾病,则在基于稀疏特征矩阵训练第三模型时,首先建立训练样本集(Y,G)其中,Y为预测的疾病或者预测年限的数据集,G为前述获得的稀疏特征矩阵。进一步的,再通过SVM机器学习获得第三模型。
示例的,本实施例中的第三模型可以被具体为分类模型,在获取到图像数据后,可以将图像数据输入第三模型,通过第三模型对图像数据进行数据分类,比如,当第三模型具体为前述示例中的用于预测疾病的模型时,在图像数据输入第三模型之后,第三模型基于该图像数据输出图像中的生物是否有患病的可能。
当然上述仅为示例说明而不是对本发明的唯一限定。
本实施例中,由于第二模型包括多层卷积神经网络和全连通神经网络,多层卷积神经网络用于实现图像特征的提取,全连通神经网络用于实现图像分类。多层卷积神经网络最后一层隐含的图像数据为图像的特征数据,把该特征数据抽取出来即获得第二图像数据集的特征数据,进一步的,再基于该特征数据进行训练,就能够获得第三模型,从而本实施例在训练第三模型时,不需要使用数量庞大的预先标注好的数据,提高了模型的训练效率,降低了模型的训练成本。
图4是本发明实施例提供的一种模型训练装置的结构示意图,如图4所示,装置40包括:
第一获取模块41,用于获取第一图像数据集;
第一处理模块42,用于对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;
第一训练模块43,用于基于所述增量图像和所述第一图像数据集,训练获得第一模型。
在一种可能的设计中,所述第一处理模块42,包括:
第一处理子模块,用于对所述第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
在一种可能的设计中,所述第一处理模块42,包括:
第一获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中的图像只包括相同的标签;
第二处理子模块,用于针对每组图像样本,获取组内的图像进行加权求和处理得到增量图像。
在一种可能的设计中,所述第一处理模块,包括:
第二获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像;
第三处理子模块,用于针对每组图像样本,从组内获取具有不同标签的图像进行加权求和,获得增量图像,其中所述增量图像的标签为加权求和时权重值最大的图像的标签。
本实施例提供的装置能够用于执行图1实施例的方法,其执行方式和有益效果类似,在这里不在赘述。
图5是本发明实施例提供的一种模型训练装置的结构示意图,如图5所示,在图4实施例的基础上,装置40还可以包括:
第二获取模块44,用于获取第二图像数据集,其中所述第二图像数据集和所述第一图像数据集之间的相似度大于预设阈值;
第二处理模块45,用于基于所述第二图像数据集,对所述第一模型进行迁移学习处理,获得第二模型。
本实施例提供的装置能够用于执行图2实施例的方法,其执行方式和有益效果类似,在这里不在赘述。
图6是本发明实施例提供的一种模型训练装置的结构示意图,如图6所示,在图5实施例的基础上,装置40还可以包括:
提取模块46,用于从所述第二模型中提取所述第二图像数据集的特征数据;
第二训练模块47,用于基于所述特征数据训练获得第三模型。
在一种可能的设计中,所述第二训练模块47,具体用于:
对所述特征数据进行字典学习处理和稀疏特征提取处理,获得所述特征数据对应的稀疏特征矩阵;
基于所述稀疏特征矩阵训练获得第三模型。
在一种可能的设计中,所述装置还包括:
第三获取模块,用于获取图像数据;
分类模块,用于将所述图像数据输入所述第三模型,以基于所述第三模型对所述图像数据进行数据分类。
本实施例提供的装置能够用于执行图3实施例的方法,其执行方式和有益效果类似,在这里不在赘述。
本发明实施例还提供一种计算机设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
当所述处理器执行所述可执行指令时,可以用于实现上述实施例的技术方案。
本发明实施例还提供一种计算机可读存储介质,包括指令,当所述指令在所述计算机上运行时,所述计算机可以用于实现上述实施例的技术方案。
最后需要说明的是,本领域普通技术人员可以理解上述实施例方法中的全部或者部分流程,是可以通过计算机程序来指令相关的硬件完成,所述的程序可存储于一计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可以为磁盘、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
本发明实施例中的各个功能单元可以集成在一个处理模块中,也可以是各个单元单独的物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现,并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。上述提到的存储介质可以是只读存储器、磁盘或光盘等。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种模型训练方法,其特征在于,包括:
获取第一图像数据集;
对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;
基于所述增量图像和所述第一图像数据集,训练获得第一模型。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
对所述第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中的图像只包括相同的标签;
针对每组图像样本,获取组内的图像进行加权求和处理得到增量图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述第一图像数据集中的图像进行加权求和处理,获得增量图像,包括:
从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像;
针对每组图像样本,从组内获取具有不同标签的图像进行加权求和,获得增量图像,其中所述增量图像的标签为加权求和时权重值最大的图像的标签。
5.一种模型训练装置,其特征在于,包括:
第一获取模块,用于获取第一图像数据集;
第一处理模块,用于对所述第一图像数据集中的图像进行加权求和处理,获得增量图像;
第一训练模块,用于基于所述增量图像和所述第一图像数据集,训练获得第一模型。
6.根据权利要求5所述的装置,其特征在于,所述第一处理模块,包括:
第一处理子模块,用于对所述第一图像数据集中的图像采用相同的加权值进行加权求和处理,获得增量图像,并使得所有加权求和的图像的加权值之和为1。
7.根据权利要求5所述的装置,其特征在于,所述第一处理模块,包括:
第一获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中的图像只包括相同的标签;
第二处理子模块,用于针对每组图像样本,获取组内的图像进行加权求和处理得到增量图像。
8.根据权利要求5所述的装置,其特征在于,所述第一处理模块,包括:
第二获取子模块,用于从所述第一图像数据集中获取多组图像样本,使得同一组图像样本中至少包括两种标签的图像;
第三处理子模块,用于针对每组图像样本,从组内获取具有不同标签的图像进行加权求和,获得增量图像,其中所述增量图像的标签为加权求和时权重值最大的图像的标签。
9.一种计算机设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
当所述处理器执行所述可执行指令时,可以执行上述权利要求1-4中任一项所述的方法。
10.一种计算机可读存储介质,包括指令,当所述指令在所述计算机上运行时,所述计算机可以执行上述权利要求1-4中任一项所述的方法。
CN201810759307.8A 2018-07-11 2018-07-11 模型训练方法、装置、设备及存储介质 Active CN109034218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810759307.8A CN109034218B (zh) 2018-07-11 2018-07-11 模型训练方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810759307.8A CN109034218B (zh) 2018-07-11 2018-07-11 模型训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109034218A true CN109034218A (zh) 2018-12-18
CN109034218B CN109034218B (zh) 2021-02-02

Family

ID=64641769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810759307.8A Active CN109034218B (zh) 2018-07-11 2018-07-11 模型训练方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109034218B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669986A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于相似大数据深度学习的传染病协同预测方法和机器人
CN112686289A (zh) * 2020-12-24 2021-04-20 微梦创科网络科技(中国)有限公司 图片分类方法和装置
CN113361535A (zh) * 2021-06-30 2021-09-07 北京百度网讯科技有限公司 图像分割模型训练、图像分割方法及相关装置
WO2022156067A1 (zh) * 2021-01-21 2022-07-28 平安科技(深圳)有限公司 商标相似性检测方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120093375A1 (en) * 2006-12-01 2012-04-19 Google Inc. Identifying images using face recognition
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN107657279A (zh) * 2017-09-26 2018-02-02 中国科学院大学 一种基于少量样本的遥感目标检测方法
CN107832711A (zh) * 2017-11-13 2018-03-23 常州大学 一种基于迁移学习的行人重识别方法
CN108229589A (zh) * 2018-02-09 2018-06-29 天津师范大学 一种基于迁移学习的地基云图分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120093375A1 (en) * 2006-12-01 2012-04-19 Google Inc. Identifying images using face recognition
CN106934235A (zh) * 2017-03-09 2017-07-07 中国科学院软件研究所 一种基于迁移学习的疾病领域间病人相似性度量迁移系统
CN107657279A (zh) * 2017-09-26 2018-02-02 中国科学院大学 一种基于少量样本的遥感目标检测方法
CN107832711A (zh) * 2017-11-13 2018-03-23 常州大学 一种基于迁移学习的行人重识别方法
CN108229589A (zh) * 2018-02-09 2018-06-29 天津师范大学 一种基于迁移学习的地基云图分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高庆华: "人脸自动识别方法的研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686289A (zh) * 2020-12-24 2021-04-20 微梦创科网络科技(中国)有限公司 图片分类方法和装置
CN112669986A (zh) * 2020-12-30 2021-04-16 华南师范大学 基于相似大数据深度学习的传染病协同预测方法和机器人
WO2022156067A1 (zh) * 2021-01-21 2022-07-28 平安科技(深圳)有限公司 商标相似性检测方法、装置、电子设备和存储介质
CN113361535A (zh) * 2021-06-30 2021-09-07 北京百度网讯科技有限公司 图像分割模型训练、图像分割方法及相关装置
CN113361535B (zh) * 2021-06-30 2023-08-01 北京百度网讯科技有限公司 图像分割模型训练、图像分割方法及相关装置

Also Published As

Publication number Publication date
CN109034218B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
Karthik et al. Attention embedded residual CNN for disease detection in tomato leaves
Singh et al. Hybrid feature-based disease detection in plant leaf using convolutional neural network, bayesian optimized SVM, and random forest classifier
CN111291809B (zh) 一种处理装置、方法及存储介质
CN109034218A (zh) 模型训练方法、装置、设备及存储介质
CN109559300A (zh) 图像处理方法、电子设备及计算机可读存储介质
CN116563707B (zh) 一种基于图文多模态特征融合的枸杞虫害识别方法
Peyal et al. Detection of tomato leaf diseases using transfer learning architectures: A comparative analysis
Rezk et al. An efficient plant disease recognition system using hybrid convolutional neural networks (cnns) and conditional random fields (crfs) for smart iot applications in agriculture
Khatoon et al. Image-based automatic diagnostic system for tomato plants using deep learning
Gjertsson Segmentation in Skeletal Scintigraphy Images using Convolutional Neural Networks
Zhang et al. A precise apple leaf diseases detection using BCTNet under unconstrained environments
Rizvi et al. Revolutionizing Agriculture: Machine and Deep Learning Solutions for Enhanced Crop Quality and Weed Control
Hao et al. Rare animal image recognition based on convolutional neural networks
Dhanalakshmi et al. Tomato leaf disease identification by modified inception based sequential convolution neural networks
Silva-Rodríguez et al. Towards foundation models and few-shot parameter-efficient fine-tuning for volumetric organ segmentation
Venu et al. Disease Identification in Plant Leaf Using Deep Convolutional Neural Networks
Ahmed et al. Ontology-based classification method using statistical and symbolic approaches for plant diseases detection in agriculture
Wang et al. Dunhuang mural line drawing based on multi-scale feature fusion and sharp edge learning
Wang et al. SPCNet: scale position correlation network for end-to-end visual tracking
Milosavljević et al. Species identification for aquatic biomonitoring using deep residual cnn and transfer learning
Shrotriya et al. A light weight Deep Convolutional Neural network model for plant disease identification
Amaje Sweet Potato Leaf Disease Detection And Classification Using Convolutional Neural Network
Zahidi et al. Active learning for crop-weed discrimination by image classification from convolutional neural network’s feature pyramid levels
Brinthakumari et al. mCNN: An Approach for Plant Disease Detection Using Modified Convolutional Neural Network
Liu Paddy Disease Classification Based on the Lightweight MobileNet-V2

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant