CN112329896B - 模型训练方法及装置 - Google Patents

模型训练方法及装置 Download PDF

Info

Publication number
CN112329896B
CN112329896B CN202110008553.1A CN202110008553A CN112329896B CN 112329896 B CN112329896 B CN 112329896B CN 202110008553 A CN202110008553 A CN 202110008553A CN 112329896 B CN112329896 B CN 112329896B
Authority
CN
China
Prior art keywords
model
training
target picture
group
picture group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110008553.1A
Other languages
English (en)
Other versions
CN112329896A (zh
Inventor
李丁珂
郭世泽
陈春煦
王安妮
张胜森
郑增强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Jingce Electronic Group Co Ltd
Wuhan Jingli Electronic Technology Co Ltd
Original Assignee
Wuhan Jingce Electronic Group Co Ltd
Wuhan Jingli Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Jingce Electronic Group Co Ltd, Wuhan Jingli Electronic Technology Co Ltd filed Critical Wuhan Jingce Electronic Group Co Ltd
Priority to CN202110008553.1A priority Critical patent/CN112329896B/zh
Publication of CN112329896A publication Critical patent/CN112329896A/zh
Application granted granted Critical
Publication of CN112329896B publication Critical patent/CN112329896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种模型训练方法及装置。该方法包括:配置超参数集合,超参数包括自动模型训练中所需的所有参数,并基于超参数集合对预设模型进行配置,得到预训练模型;持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片;将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本发明,在模型训练过程中,对于用户而言,其仅需要完成标注工作即可,剩余的训练过程可自动进行。

Description

模型训练方法及装置
技术领域
本发明涉及深度学习技术领域,尤其涉及一种模型训练方法及装置。
背景技术
深度学习技术在工业检测领域应用广泛,是智能工厂,工业4.0等领域不可或缺的一部分。
深度学习技术是一种基于神经网络模型的机器学习技术,在利用深度学习技术进行模型训练的过程中,要进行大量的算法选择、比较、训练和参数调优,需要有经验的工程师和研究人员耗费大量时间去完成,如何实现模型的自动训练已经成为当前亟待解决的问题。
发明内容
为解决上述技术问题,本发明提供一种模型训练方法及装置。
第一方面,本发明提供一种模型训练方法,所述模型训练方法包括:
配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。
可选的,所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括:
当任一类型的经过标注的样本图片的数量大于或等于第二阈值时,将所述任一类型的经过标注的样本图片放入其缺陷类型对应的图片组。
可选的,所述基于目标图片组以及预训练模型开启训练的步骤包括:
通过目标图片组对预训练模型进行第一轮训练;
检测目标图片组的组别数量是否有新增;
当目标图片组的组别数量有新增时,执行所述通过目标图片组对预训练模型进行第一轮训练的步骤;
当目标图片组的组别数量未新增时,通过目标图片组对上一轮训练得到的模型进行训练,执行所述检测目标图片组的组别数量是否有新增的步骤。
可选的,所述基于目标图片组以及预训练模型开启训练的步骤包括:
通过目标图片组对预训练模型进行第一轮训练;
第一轮训练结束后,通过目标图片组对上一轮训练得到的模型进行训练,直至达到终止条件。
可选的,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;
当得到新的模型时,检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量;
若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量,则删除已保存的模型,并保存新的模型;
若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量,则计算已保存的模型的评估指标值以及新的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
可选的,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;
当得到新的模型时,检测新的模型的评估指标值是否大于已保存的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
可选的,所述模型训练方法还包括:
计算已保存的模型的评估指标值;
检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值;
若是,则以已保存的模型为最佳模型。
可选的,在所述以已保存的模型为最佳模型的步骤之后,还包括:
通过所述最佳模型对样本图片进行标注,得到带有伪标注信息的图片;
接收用户对所述带有伪标注信息的图片的标注操作,得到经过标注的样本图片。
可选的,所述终止条件为:
在目标图片组的组别数量不变的情况下,连续得到的N个模型中第二至第N个模型的评估指标值均小第一个模型的评估指标值,其中N为大于2的正整数。
第二方面,本发明还提供一种模型训练装置,所述模型训练装置包括:
配置模块,用于配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
接收模块,用于持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
监控模块,用于将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
训练模块,用于基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。
本发明中,配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本发明,在模型训练过程中,对于用户而言,其仅需要完成标注工作即可,剩余的训练过程可自动进行。
附图说明
图1为本发明实施例方案中涉及的模型训练设备的硬件结构示意图;
图2为本发明模型训练方法一实施例的流程示意图;
图3为本发明模型训练方法一实施例中的训练流程示意图;
图4为本发明模型训练方法另一实施例的流程示意图;
图5为本发明模型训练装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
第一方面,本发明实施例提供一种模型训练设备。
参照图1,图1为本发明实施例方案中涉及的模型训练设备的硬件结构示意图。本发明实施例中,模型训练设备可以包括处理器1001(例如中央处理器Central ProcessingUnit,CPU),通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard);网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity,WI-FI接口);存储器1005可以是高速随机存取存储器(random accessmemory,RAM),也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及模型训练程序。其中,处理器1001可以调用存储器1005中存储的模型训练程序,并执行本发明实施例提供的模型训练方法。
第二方面,本发明实施例提供了一种模型训练方法。
参照图2,图2为本发明模型训练方法一实施例的流程示意图。如图2所示,一实施例中,模型训练方法包括:
步骤S10,配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
本实施例中,预先配置预设模型对应的超参数集合,并通过超参数集合对预设模型进行配置,得到预训练模型。其中,超参数包括自动模型训练中所需的所有参数,包括但不限于:数据切分的算法、数据的增强算法、评估模型优劣性的评估指标(例如平均精度均值mAP)、模型的网络结构、网络结构在规定层数规定分类数目以及规定输入尺寸上需要消耗的GPU显存大小、提前停止条件、初始权重、学习率下降策略。
步骤S20,持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
本实施例中,对用户而言,其仅需处理标注工作即可,即对样本图片集中的每张样本图片进行缺陷位置和缺陷类型的标注,得到经过标注的样本图片,标注工作持续进行,本实施的执行主体便可持续接收经过标注的样本图片。
步骤S30,将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
本实施例中,在收到经过标注的样本图片后,便将其放入其缺陷类型对应的图片组。例如,收到经过标注的样本图片1,若根据其标注信息,确定其缺陷类型为缺陷类型1,则将经过标注的样本图片1放入缺陷类型1对应的图片组1;收到经过标注的样本图片2,若根据其标注信息,确定其缺陷类型为缺陷类型2,则将经过标注的样本图片2放入缺陷类型2对应的图片组2;收到经过标注的样本图片3,若根据其标注信息,确定其缺陷类型为缺陷类型1,则将经过标注的样本图片3放入缺陷类型1对应的图片组1,以此类推。并监控每个图片组包含的经过标注的样本图片的数量。
步骤S40,基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。
本实施例中,当至少一个图片组包含的经过标注的样本图片的数量大于或等于第一阈值时,将其作为目标图片组,并基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练。第一阈值根据实际需要进行设置,例如设置为1000,当监控到图片组1包含的经过标注的样本图片的数量和图片组2包含的经过标注的样本图片的数量均大于等于1000时,则以图片组1和图片组2作为目标图片组,并启动训练过程,直至达到终止条件时,停止训练。
本实施例中,配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本实施例,在模型训练过程中,对于用户而言,其仅需要完成标注工作即可,剩余的训练过程可自动进行。
进一步地,一实施例中,所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括:
当任一类型的经过标注的样本图片的数量大于或等于第二阈值时,将所述任一类型的经过标注的样本图片放入其缺陷类型对应的图片组。
本实施例中,每收到一张经过标注的样本图片,并不直接将其放入其缺陷类型对应的图片组,而是当收到任一类型的经过标注的样本图片的数量大于或等于第二阈值时,将该类型的经过标注的样本图片放入其缺陷类型对应的图片组。其中,第二阈值根据实际需要进行设置,例如设置为200。即在持续接收经过标注的样本图片的过程中,当某一缺陷类型的经过标注的样本图片的数量大于或等于200时,将这一缺陷类型的经过标注的样本图片放入其缺陷类型对应的图片组。
进一步地,一实施例中,所述基于目标图片组以及预训练模型开启训练的步骤包括:
步骤S401,通过目标图片组对预训练模型进行第一轮训练;
步骤S402,检测目标图片组的组别数量是否有新增;
步骤S403,当目标图片组的组别数量有新增时,返回执行步骤S401;
步骤S404,当目标图片组的组别数量未新增时,通过目标图片组对上一轮训练得到的模型进行训练,返回执行步骤S402。
本实施例中,参照图3,图3为本发明模型训练方法一实施例中的训练流程示意图。如图3所示,通过监控发现存在目标图片组时,通过目标图片组对预训练模型进行第一轮训练,第一轮训练完成后,检测目标图片组的组别数量是否有新增。
容易理解的是,接收经过标注的样本图片的动作是持续进行的,若首次监控到的目标图片组是图片组1,在第一轮训练完成后,此时监控到的目标图片组不只包括图片组1,例如还包括图片组2,即目标图片组的组别数量有新增,这种情况下,返回执行步骤S401,即通过当前的目标图片组(图片组1和图片组2)对预训练模型进行第一轮训练,然后再次检测目标图片组的组别数量是否有新增。
若首次监控到的目标图片组是图片组1,在第一轮训练完成后,此时监控到的目标图片组还是只有图片组1,即目标图片组的组别数量没有新增,这种情况下,继续通过图片组1(相较于第一轮训练所使用的图片组1可能包含更多的经过标注的样本图片)对上一轮训练得到的模型进行训练,然后再次检测目标图片组的组别数量是否有新增。
本实施例中,在训练过程中,训练所使用的经过标注的样本图片是持续增加的,容易导致训练过拟合。因为,使用新增的图片组进行训练前,模型将用于识别新增的图片组的特征的过滤器删除了。通过本实施例,可以避免训练过拟合的情况发生。
进一步地,一实施例中,所述基于目标图片组以及预训练模型开启训练的步骤包括:
通过目标图片组对预训练模型进行第一轮训练;
第一轮训练结束后,通过目标图片组对上一轮训练得到的模型进行训练,直至达到终止条件。
本实施例中,通过监控发现存在目标图片组时,通过目标图片组对预训练模型进行第一轮训练,第一轮训练完成后,通过当前的目标图片组对上一轮训练得到的模型进行第二轮训练,第二轮训练完成后,再通过当前的目标图片组对上一轮训练得到的模型进行第三轮训练,依次类推,直至达到终止条件。
进一步地,一实施例中,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;当得到新的模型时,检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量;若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量,则删除已保存的模型,并保存新的模型;若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量,则计算已保存的模型的评估指标值以及新的模型的评估指标值;若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
本实施例中,当首次得到模型时,将其保存;由于训练过程是持续进行的,当后续得到新的模型时,检测为了得到该新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量,若大于,则删除已保存的模型,并保存新的模型;若等于,则计算已保存的模型的评估指标值以及该新的模型的评估指标值,若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。其中,评估指标值可以为mAP值。
进一步地,一实施例中,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;当得到新的模型时,检测新的模型的评估指标值是否大于已保存的模型的评估指标值;若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
本实施例中,当首次得到模型时,将其保存;由于训练过程是持续进行的,当后续得到新的模型时,则计算已保存的模型的评估指标值以及该新的模型的评估指标值,若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。其中,评估指标值可以为mAP值。
进一步地,一实施例中,所述模型训练方法还包括:
计算已保存的模型的评估指标值;检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值;若是,则以已保存的模型为最佳模型。
本实施例中,计算已保存的模型的评估指标值,当检测到已保存的模型的评估指标值是否大于或等于预设评估指标值时,以已保存的模型为最佳模型。其中,评估指标值为mAP值,预设评估指标值的大小根据实际需要进行设置,在此不作限制。
进一步地,一实施例中,在所述以已保存的模型为最佳模型的步骤之后,还包括:
通过所述最佳模型对样本图片进行标注,得到带有伪标注信息的图片;接收用户对所述带有伪标注信息的图片的标注操作,得到经过标注的样本图片。
本实施例中,在存在最佳模型时,通过最佳模型对样本图片进行标注,得到带有伪标注信息的图片,伪标注信息包括缺陷位置以及缺陷类型。将带有伪标注信息的图片呈现给用户,若用户确定该带有伪标注信息的图片实际的缺陷位置以及缺陷类型与伪标注信息一致,则可直接根据伪标注信息对该带有伪标注信息的图片做一次标注操作,得到经过标注的样本图片,相当于给予用户提示,使得用户能更快速的完成标注工作。当然,若用户确定该带有伪标注信息的图片实际的缺陷位置以及缺陷类型与伪标注信息不一致,则可基于自身认知对该带有伪标注信息的图片进行标注操作,得到经过标注的样本图片。
进一步地,一实施例中,所述终止条件为:
在目标图片组的组别数量不变的情况下,连续得到的N个模型中第二至第N个模型的评估指标值均小第一个模型的评估指标值,其中N为大于2的正整数。
本实施例中,N根据实际需要进行设置,例如设置为10。若在目标图片组的组别数量不变的情况下,连续得到的10个模型中第二至第十个模型的评估指标值均小第一个模型的评估指标值,则达到终止条件,停止训练。
参照图4,图4为本发明模型训练方法另一实施例的流程示意图。如图4所示,用户持续进行图片标注工作,并将标注过的图片持续放入图片组,当图片组中存在目标图片组时,载入预训练模型训练一轮,然后检测目标图片组的组别数量是否有新增,若有,则以当前的目标图片组以及预训练模型训练一轮,并再次检测目标图片组的组别数量是否有新增;若没有,则以当前的目标图片组以及上一轮模型训练一轮,并再次检测目标图片组的组别数量是否有新增。且,保存首次训练得到的模型,并在后续得到新的模型时,判断是否需要以新的模型替换已保存的模型。且,检测已保存的模型是否为最佳模型,若是,则以最佳模型辅助用户进行标注工作。且,在达到提取终止条件时,提前终止。
第三方面,本发明实施例还提供一种模型训练装置。
参照图5,图5为本发明模型训练装置一实施例的功能模块示意图。如图5所示,所述模型训练装置包括:
配置模块10,用于配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
接收模块20,用于持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
监控模块30,用于将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
训练模块40,用于基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。
进一步地,一实施例中,监控模块30,用于:
当任一类型的经过标注的样本图片的数量大于或等于第二阈值时,将所述任一类型的经过标注的样本图片放入其缺陷类型对应的图片组。
进一步地,一实施例中,训练模块40,用于:
通过目标图片组对预训练模型进行第一轮训练;
检测目标图片组的组别数量是否有新增;
当目标图片组的组别数量有新增时,执行所述通过目标图片组对预训练模型进行第一轮训练的步骤;
当目标图片组的组别数量未新增时,通过目标图片组对上一轮训练得到的模型进行训练,执行所述检测目标图片组的组别数量是否有新增的步骤。
进一步地,一实施例中,训练模块40,用于:
通过目标图片组对预训练模型进行第一轮训练;
第一轮训练结束后,通过目标图片组对上一轮训练得到的模型进行训练,直至达到终止条件。
进一步地,一实施例中,模型训练装置还包括保存模块,用于:
保存首次得到的模型;
当得到新的模型时,检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量;
若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量,则删除已保存的模型,并保存新的模型;
若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量,则计算已保存的模型的评估指标值以及新的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
进一步地,一实施例中,保存模块,用于:
保存首次得到的模型;
当得到新的模型时,检测新的模型的评估指标值是否大于已保存的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
进一步地,一实施例中,模型训练装置还包括评估模块,用于:
计算已保存的模型的评估指标值;
检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值;
若是,则以已保存的模型为最佳模型。
进一步地,一实施例中,模型训练装置还包括辅助标注模块,用于:
通过所述最佳模型对样本图片进行标注,得到带有伪标注信息的图片;
接收用户对所述带有伪标注信息的图片的标注操作,得到经过标注的样本图片。
进一步地,一实施例中,所述终止条件为:
在目标图片组的组别数量不变的情况下,连续得到的N个模型中第二至第N个模型的评估指标值均小第一个模型的评估指标值,其中N为大于2的正整数。
其中,上述模型训练装置中各个模块的功能实现与上述模型训练方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
第四方面,本发明实施例还提供一种可读存储介质。
本发明可读存储介质上存储有模型训练程序,其中所述模型训练程序被处理器执行时,实现如上述的模型训练方法的步骤。
其中,模型训练程序被执行时所实现的方法可参照本发明模型训练方法的各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种模型训练方法,其特征在于,所述模型训练方法包括:
配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值;
所述基于目标图片组以及预训练模型开启训练的步骤包括:
通过目标图片组对预训练模型进行第一轮训练;
检测目标图片组的组别数量是否有新增;
当目标图片组的组别数量有新增时,执行所述通过目标图片组对预训练模型进行第一轮训练的步骤;
当目标图片组的组别数量未新增时,通过目标图片组对上一轮训练得到的模型进行训练,执行所述检测目标图片组的组别数量是否有新增的步骤。
2.如权利要求1所述的模型训练方法,其特征在于,所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括:
当任一类型的经过标注的样本图片的数量大于或等于第二阈值时,将所述任一类型的经过标注的样本图片放入其缺陷类型对应的图片组。
3.如权利要求1所述的模型训练方法,其特征在于,所述基于目标图片组以及预训练模型开启训练的步骤包括:
通过目标图片组对预训练模型进行第一轮训练;
第一轮训练结束后,通过目标图片组对上一轮训练得到的模型进行训练,直至达到终止条件。
4.如权利要求1或3所述的模型训练方法,其特征在于,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;
当得到新的模型时,检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量;
若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量,则删除已保存的模型,并保存新的模型;
若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量,则计算已保存的模型的评估指标值以及新的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
5.如权利要求1或3所述的模型训练方法,其特征在于,在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后,还包括:
保存首次得到的模型;
当得到新的模型时,检测新的模型的评估指标值是否大于已保存的模型的评估指标值;
若新的模型的评估指标值大于已保存的模型的评估指标值,则删除已保存的模型,并保存新的模型。
6.如权利要求4所述的模型训练方法,其特征在于,所述模型训练方法还包括:
计算已保存的模型的评估指标值;
检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值;
若是,则以已保存的模型为最佳模型。
7.如权利要求6所述的模型训练方法,其特征在于,在所述以已保存的模型为最佳模型的步骤之后,还包括:
通过所述最佳模型对样本图片进行标注,得到带有伪标注信息的图片;
接收用户对所述带有伪标注信息的图片的标注操作,得到经过标注的样本图片。
8.如权利要求1至3中任一项所述的模型训练方法,其特征在于,所述终止条件为:
在目标图片组的组别数量不变的情况下,连续得到的N个模型中第二至第N个模型的评估指标值均小第一个模型的评估指标值,其中N为大于2的正整数。
9.一种模型训练装置,其特征在于,所述模型训练装置包括:
配置模块,用于配置超参数集合,所述超参数包括自动模型训练中所需的所有参数,并基于所述超参数集合对预设模型进行配置,得到预训练模型;
接收模块,用于持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片,所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注;
监控模块,用于将经过标注的样本图片放入其缺陷类型对应的图片组,监控每个图片组包含的经过标注的样本图片的数量;
训练模块,用于基于目标图片组以及预训练模型开启训练,直至达到终止条件时,停止训练,所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值;
训练模块,用于:
通过目标图片组对预训练模型进行第一轮训练;
检测目标图片组的组别数量是否有新增;
当目标图片组的组别数量有新增时,执行所述通过目标图片组对预训练模型进行第一轮训练的步骤;
当目标图片组的组别数量未新增时,通过目标图片组对上一轮训练得到的模型进行训练,执行所述检测目标图片组的组别数量是否有新增的步骤。
CN202110008553.1A 2021-01-05 2021-01-05 模型训练方法及装置 Active CN112329896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110008553.1A CN112329896B (zh) 2021-01-05 2021-01-05 模型训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110008553.1A CN112329896B (zh) 2021-01-05 2021-01-05 模型训练方法及装置

Publications (2)

Publication Number Publication Date
CN112329896A CN112329896A (zh) 2021-02-05
CN112329896B true CN112329896B (zh) 2021-05-14

Family

ID=74302199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110008553.1A Active CN112329896B (zh) 2021-01-05 2021-01-05 模型训练方法及装置

Country Status (1)

Country Link
CN (1) CN112329896B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728313A (zh) * 2019-09-29 2020-01-24 北京声智科技有限公司 一种用于意图分类识别的分类模型训练方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9514391B2 (en) * 2015-04-20 2016-12-06 Xerox Corporation Fisher vectors meet neural networks: a hybrid visual classification architecture
US11210777B2 (en) * 2016-04-28 2021-12-28 Blancco Technology Group IP Oy System and method for detection of mobile device fault conditions
WO2018119684A1 (zh) * 2016-12-27 2018-07-05 深圳前海达闼云端智能科技有限公司 一种图像识别系统及图像识别方法
CN109118482B (zh) * 2018-08-07 2019-12-31 腾讯科技(深圳)有限公司 一种面板缺陷分析方法、装置及存储介质
CN110111331B (zh) * 2019-05-20 2023-06-06 中南大学 基于机器视觉的蜂窝纸芯缺陷检测方法
CN110473170B (zh) * 2019-07-10 2023-04-07 苏州卓融新能源科技有限公司 一种适用于pcb板真假缺陷判定的人工智能检测方法
CN110473173A (zh) * 2019-07-24 2019-11-19 熵智科技(深圳)有限公司 一种基于深度学习语义分割的缺陷检测方法
CN111080622B (zh) * 2019-12-13 2023-11-07 熵智科技(深圳)有限公司 神经网络训练方法、工件表面缺陷分类与检测方法及装置
CN112037222B (zh) * 2020-11-04 2021-02-09 武汉精测电子集团股份有限公司 一种神经网络模型的自动更新方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110728313A (zh) * 2019-09-29 2020-01-24 北京声智科技有限公司 一种用于意图分类识别的分类模型训练方法及装置

Also Published As

Publication number Publication date
CN112329896A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN111127457A (zh) 钢筋数目统计模型训练方法、统计方法、装置及设备
CN109901996B (zh) 辅助测试的方法、装置、电子设备及可读存储介质
CN111507958A (zh) 目标检测方法、检测模型的训练方法及电子设备
CN113593071A (zh) 巡检方法、装置、系统、计算机设备及存储介质
CN112078571B (zh) 自动泊车方法、设备、存储介质及装置
CN106776342B (zh) 一种对移动应用的内存对象进行分析的方法和装置
CN113254331A (zh) 模型测试方法、设备、存储介质及程序产品
CN113486785A (zh) 基于深度学习的视频换脸方法、装置、设备及存储介质
CN111039113A (zh) 电梯运行状态确定方法、装置、设备和介质
CN112329896B (zh) 模型训练方法及装置
CN112268696B (zh) 离合器检测方法、设备、存储介质及装置
CN112533060B (zh) 一种视频处理方法及装置
CN104809053A (zh) 一种针对控件样式的测试方法和装置
CN108959039A (zh) 一种虚拟机故障预测的方法及装置
CN117422905A (zh) 目标识别方法、装置、设备及存储介质
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和系统
CN113721582B (zh) 座舱系统响应效率测试方法、设备、存储介质及装置
CN112385199B (zh) 显示控制方法及相关产品
CN114791780B (zh) 显示屏触摸控制方法、装置、设备及存储介质
CN108805931B (zh) Ar产品的定位检测方法、装置及计算机可读存储介质
CN112004080B (zh) 汽车显示设备的故障检测方法、设备、存储介质及装置
CN113361811A (zh) 运行状态预测方法、系统、设备及计算机可读存储介质
CN111401824A (zh) 工时计算方法及装置
CN113569821B (zh) 手势识别方法、装置、设备与计算机可读存储介质
CN114155367B (zh) 印制电路板缺陷检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant