CN112329896B

CN112329896B - 模型训练方法及装置

Info

Publication number: CN112329896B
Application number: CN202110008553.1A
Authority: CN
Inventors: 李丁珂; 郭世泽; 陈春煦; 王安妮; 张胜森; 郑增强
Original assignee: Wuhan Jingce Electronic Group Co Ltd; Wuhan Jingli Electronic Technology Co Ltd
Current assignee: Wuhan Jingce Electronic Group Co Ltd; Wuhan Jingli Electronic Technology Co Ltd
Priority date: 2021-01-05
Filing date: 2021-01-05
Publication date: 2021-05-14
Anticipated expiration: 2041-01-05
Also published as: CN112329896A

Abstract

本发明提供一种模型训练方法及装置。该方法包括：配置超参数集合，超参数包括自动模型训练中所需的所有参数，并基于超参数集合对预设模型进行配置，得到预训练模型；持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片；将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本发明，在模型训练过程中，对于用户而言，其仅需要完成标注工作即可，剩余的训练过程可自动进行。

Description

模型训练方法及装置

技术领域

本发明涉及深度学习技术领域，尤其涉及一种模型训练方法及装置。

背景技术

深度学习技术在工业检测领域应用广泛，是智能工厂，工业4.0等领域不可或缺的一部分。

深度学习技术是一种基于神经网络模型的机器学习技术，在利用深度学习技术进行模型训练的过程中，要进行大量的算法选择、比较、训练和参数调优，需要有经验的工程师和研究人员耗费大量时间去完成，如何实现模型的自动训练已经成为当前亟待解决的问题。

发明内容

为解决上述技术问题，本发明提供一种模型训练方法及装置。

第一方面，本发明提供一种模型训练方法，所述模型训练方法包括：

配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；

持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；

将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；

基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。

可选的，所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括：

当任一类型的经过标注的样本图片的数量大于或等于第二阈值时，将所述任一类型的经过标注的样本图片放入其缺陷类型对应的图片组。

可选的，所述基于目标图片组以及预训练模型开启训练的步骤包括：

通过目标图片组对预训练模型进行第一轮训练；

检测目标图片组的组别数量是否有新增；

当目标图片组的组别数量有新增时，执行所述通过目标图片组对预训练模型进行第一轮训练的步骤；

当目标图片组的组别数量未新增时，通过目标图片组对上一轮训练得到的模型进行训练，执行所述检测目标图片组的组别数量是否有新增的步骤。

通过目标图片组对预训练模型进行第一轮训练；

第一轮训练结束后，通过目标图片组对上一轮训练得到的模型进行训练，直至达到终止条件。

可选的，在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后，还包括：

保存首次得到的模型；

当得到新的模型时，检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量；

若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量，则删除已保存的模型，并保存新的模型；

若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量，则计算已保存的模型的评估指标值以及新的模型的评估指标值；

若新的模型的评估指标值大于已保存的模型的评估指标值，则删除已保存的模型，并保存新的模型。

保存首次得到的模型；

当得到新的模型时，检测新的模型的评估指标值是否大于已保存的模型的评估指标值；

可选的，所述模型训练方法还包括：

计算已保存的模型的评估指标值；

检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值；

若是，则以已保存的模型为最佳模型。

可选的，在所述以已保存的模型为最佳模型的步骤之后，还包括：

通过所述最佳模型对样本图片进行标注，得到带有伪标注信息的图片；

接收用户对所述带有伪标注信息的图片的标注操作，得到经过标注的样本图片。

可选的，所述终止条件为：

在目标图片组的组别数量不变的情况下，连续得到的N个模型中第二至第N个模型的评估指标值均小第一个模型的评估指标值，其中N为大于2的正整数。

第二方面，本发明还提供一种模型训练装置，所述模型训练装置包括：

配置模块，用于配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；

接收模块，用于持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；

监控模块，用于将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；

训练模块，用于基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。

本发明中，配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本发明，在模型训练过程中，对于用户而言，其仅需要完成标注工作即可，剩余的训练过程可自动进行。

附图说明

图1为本发明实施例方案中涉及的模型训练设备的硬件结构示意图；

图2为本发明模型训练方法一实施例的流程示意图；

图3为本发明模型训练方法一实施例中的训练流程示意图；

图4为本发明模型训练方法另一实施例的流程示意图；

图5为本发明模型训练装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

第一方面，本发明实施例提供一种模型训练设备。

参照图1，图1为本发明实施例方案中涉及的模型训练设备的硬件结构示意图。本发明实施例中，模型训练设备可以包括处理器1001（例如中央处理器Central ProcessingUnit，CPU），通信总线1002，用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信；用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard）；网络接口1004可选的可以包括标准的有线接口、无线接口（如无线保真WIreless-FIdelity，WI-FI接口）；存储器1005可以是高速随机存取存储器（random accessmemory，RAM），也可以是稳定的存储器（non-volatile memory），例如磁盘存储器，存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解，图1中示出的硬件结构并不构成对本发明的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

继续参照图1，图1中作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及模型训练程序。其中，处理器1001可以调用存储器1005中存储的模型训练程序，并执行本发明实施例提供的模型训练方法。

第二方面，本发明实施例提供了一种模型训练方法。

参照图2，图2为本发明模型训练方法一实施例的流程示意图。如图2所示，一实施例中，模型训练方法包括：

步骤S10，配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；

本实施例中，预先配置预设模型对应的超参数集合，并通过超参数集合对预设模型进行配置，得到预训练模型。其中，超参数包括自动模型训练中所需的所有参数，包括但不限于：数据切分的算法、数据的增强算法、评估模型优劣性的评估指标（例如平均精度均值mAP）、模型的网络结构、网络结构在规定层数规定分类数目以及规定输入尺寸上需要消耗的GPU显存大小、提前停止条件、初始权重、学习率下降策略。

步骤S20，持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；

本实施例中，对用户而言，其仅需处理标注工作即可，即对样本图片集中的每张样本图片进行缺陷位置和缺陷类型的标注，得到经过标注的样本图片，标注工作持续进行，本实施的执行主体便可持续接收经过标注的样本图片。

步骤S30，将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；

本实施例中，在收到经过标注的样本图片后，便将其放入其缺陷类型对应的图片组。例如，收到经过标注的样本图片1，若根据其标注信息，确定其缺陷类型为缺陷类型1，则将经过标注的样本图片1放入缺陷类型1对应的图片组1；收到经过标注的样本图片2，若根据其标注信息，确定其缺陷类型为缺陷类型2，则将经过标注的样本图片2放入缺陷类型2对应的图片组2；收到经过标注的样本图片3，若根据其标注信息，确定其缺陷类型为缺陷类型1，则将经过标注的样本图片3放入缺陷类型1对应的图片组1，以此类推。并监控每个图片组包含的经过标注的样本图片的数量。

步骤S40，基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。

本实施例中，当至少一个图片组包含的经过标注的样本图片的数量大于或等于第一阈值时，将其作为目标图片组，并基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练。第一阈值根据实际需要进行设置，例如设置为1000，当监控到图片组1包含的经过标注的样本图片的数量和图片组2包含的经过标注的样本图片的数量均大于等于1000时，则以图片组1和图片组2作为目标图片组，并启动训练过程，直至达到终止条件时，停止训练。

本实施例中，配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。通过本实施例，在模型训练过程中，对于用户而言，其仅需要完成标注工作即可，剩余的训练过程可自动进行。

进一步地，一实施例中，所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括：

本实施例中，每收到一张经过标注的样本图片，并不直接将其放入其缺陷类型对应的图片组，而是当收到任一类型的经过标注的样本图片的数量大于或等于第二阈值时，将该类型的经过标注的样本图片放入其缺陷类型对应的图片组。其中，第二阈值根据实际需要进行设置，例如设置为200。即在持续接收经过标注的样本图片的过程中，当某一缺陷类型的经过标注的样本图片的数量大于或等于200时，将这一缺陷类型的经过标注的样本图片放入其缺陷类型对应的图片组。

进一步地，一实施例中，所述基于目标图片组以及预训练模型开启训练的步骤包括：

步骤S401，通过目标图片组对预训练模型进行第一轮训练；

步骤S402，检测目标图片组的组别数量是否有新增；

步骤S403，当目标图片组的组别数量有新增时，返回执行步骤S401；

步骤S404，当目标图片组的组别数量未新增时，通过目标图片组对上一轮训练得到的模型进行训练，返回执行步骤S402。

本实施例中，参照图3，图3为本发明模型训练方法一实施例中的训练流程示意图。如图3所示，通过监控发现存在目标图片组时，通过目标图片组对预训练模型进行第一轮训练，第一轮训练完成后，检测目标图片组的组别数量是否有新增。

容易理解的是，接收经过标注的样本图片的动作是持续进行的，若首次监控到的目标图片组是图片组1，在第一轮训练完成后，此时监控到的目标图片组不只包括图片组1，例如还包括图片组2，即目标图片组的组别数量有新增，这种情况下，返回执行步骤S401，即通过当前的目标图片组（图片组1和图片组2）对预训练模型进行第一轮训练，然后再次检测目标图片组的组别数量是否有新增。

若首次监控到的目标图片组是图片组1，在第一轮训练完成后，此时监控到的目标图片组还是只有图片组1，即目标图片组的组别数量没有新增，这种情况下，继续通过图片组1（相较于第一轮训练所使用的图片组1可能包含更多的经过标注的样本图片）对上一轮训练得到的模型进行训练，然后再次检测目标图片组的组别数量是否有新增。

本实施例中，在训练过程中，训练所使用的经过标注的样本图片是持续增加的，容易导致训练过拟合。因为，使用新增的图片组进行训练前，模型将用于识别新增的图片组的特征的过滤器删除了。通过本实施例，可以避免训练过拟合的情况发生。

通过目标图片组对预训练模型进行第一轮训练；

本实施例中，通过监控发现存在目标图片组时，通过目标图片组对预训练模型进行第一轮训练，第一轮训练完成后，通过当前的目标图片组对上一轮训练得到的模型进行第二轮训练，第二轮训练完成后，再通过当前的目标图片组对上一轮训练得到的模型进行第三轮训练，依次类推，直至达到终止条件。

进一步地，一实施例中，在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后，还包括：

保存首次得到的模型；当得到新的模型时，检测为了得到所述新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量；若为了得到所述新的模型所使用的目标图片组的组别数量大于为了得到已保存的模型所使用的目标图片组的组别数量，则删除已保存的模型，并保存新的模型；若为了得到所述新的模型所使用的目标图片组的组别数量等于为了得到已保存的模型所使用的目标图片组的组别数量，则计算已保存的模型的评估指标值以及新的模型的评估指标值；若新的模型的评估指标值大于已保存的模型的评估指标值，则删除已保存的模型，并保存新的模型。

本实施例中，当首次得到模型时，将其保存；由于训练过程是持续进行的，当后续得到新的模型时，检测为了得到该新的模型所使用的目标图片组的组别数量是否大于为了得到已保存的模型所使用的目标图片组的组别数量，若大于，则删除已保存的模型，并保存新的模型；若等于，则计算已保存的模型的评估指标值以及该新的模型的评估指标值，若新的模型的评估指标值大于已保存的模型的评估指标值，则删除已保存的模型，并保存新的模型。其中，评估指标值可以为mAP值。

保存首次得到的模型；当得到新的模型时，检测新的模型的评估指标值是否大于已保存的模型的评估指标值；若新的模型的评估指标值大于已保存的模型的评估指标值，则删除已保存的模型，并保存新的模型。

本实施例中，当首次得到模型时，将其保存；由于训练过程是持续进行的，当后续得到新的模型时，则计算已保存的模型的评估指标值以及该新的模型的评估指标值，若新的模型的评估指标值大于已保存的模型的评估指标值，则删除已保存的模型，并保存新的模型。其中，评估指标值可以为mAP值。

进一步地，一实施例中，所述模型训练方法还包括：

计算已保存的模型的评估指标值；检测所述已保存的模型的评估指标值是否大于或等于预设评估指标值；若是，则以已保存的模型为最佳模型。

本实施例中，计算已保存的模型的评估指标值，当检测到已保存的模型的评估指标值是否大于或等于预设评估指标值时，以已保存的模型为最佳模型。其中，评估指标值为mAP值，预设评估指标值的大小根据实际需要进行设置，在此不作限制。

进一步地，一实施例中，在所述以已保存的模型为最佳模型的步骤之后，还包括：

通过所述最佳模型对样本图片进行标注，得到带有伪标注信息的图片；接收用户对所述带有伪标注信息的图片的标注操作，得到经过标注的样本图片。

本实施例中，在存在最佳模型时，通过最佳模型对样本图片进行标注，得到带有伪标注信息的图片，伪标注信息包括缺陷位置以及缺陷类型。将带有伪标注信息的图片呈现给用户，若用户确定该带有伪标注信息的图片实际的缺陷位置以及缺陷类型与伪标注信息一致，则可直接根据伪标注信息对该带有伪标注信息的图片做一次标注操作，得到经过标注的样本图片，相当于给予用户提示，使得用户能更快速的完成标注工作。当然，若用户确定该带有伪标注信息的图片实际的缺陷位置以及缺陷类型与伪标注信息不一致，则可基于自身认知对该带有伪标注信息的图片进行标注操作，得到经过标注的样本图片。

进一步地，一实施例中，所述终止条件为：

本实施例中，N根据实际需要进行设置，例如设置为10。若在目标图片组的组别数量不变的情况下，连续得到的10个模型中第二至第十个模型的评估指标值均小第一个模型的评估指标值，则达到终止条件，停止训练。

参照图4，图4为本发明模型训练方法另一实施例的流程示意图。如图4所示，用户持续进行图片标注工作，并将标注过的图片持续放入图片组，当图片组中存在目标图片组时，载入预训练模型训练一轮，然后检测目标图片组的组别数量是否有新增，若有，则以当前的目标图片组以及预训练模型训练一轮，并再次检测目标图片组的组别数量是否有新增；若没有，则以当前的目标图片组以及上一轮模型训练一轮，并再次检测目标图片组的组别数量是否有新增。且，保存首次训练得到的模型，并在后续得到新的模型时，判断是否需要以新的模型替换已保存的模型。且，检测已保存的模型是否为最佳模型，若是，则以最佳模型辅助用户进行标注工作。且，在达到提取终止条件时，提前终止。

第三方面，本发明实施例还提供一种模型训练装置。

参照图5，图5为本发明模型训练装置一实施例的功能模块示意图。如图5所示，所述模型训练装置包括：

配置模块10，用于配置超参数集合，所述超参数包括自动模型训练中所需的所有参数，并基于所述超参数集合对预设模型进行配置，得到预训练模型；

接收模块20，用于持续接收基于用户对样本图片集中的样本图片进行标注得到的经过标注的样本图片，所述标注包括对每张样本图片进行缺陷位置和缺陷类型的标注；

监控模块30，用于将经过标注的样本图片放入其缺陷类型对应的图片组，监控每个图片组包含的经过标注的样本图片的数量；

训练模块40，用于基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值。

进一步地，一实施例中，监控模块30，用于：

进一步地，一实施例中，训练模块40，用于：

通过目标图片组对预训练模型进行第一轮训练；

检测目标图片组的组别数量是否有新增；

进一步地，一实施例中，训练模块40，用于：

通过目标图片组对预训练模型进行第一轮训练；

进一步地，一实施例中，模型训练装置还包括保存模块，用于：

保存首次得到的模型；

进一步地，一实施例中，保存模块，用于：

保存首次得到的模型；

进一步地，一实施例中，模型训练装置还包括评估模块，用于：

计算已保存的模型的评估指标值；

若是，则以已保存的模型为最佳模型。

进一步地，一实施例中，模型训练装置还包括辅助标注模块，用于：

进一步地，一实施例中，所述终止条件为：

其中，上述模型训练装置中各个模块的功能实现与上述模型训练方法实施例中各步骤相对应，其功能和实现过程在此处不再一一赘述。

第四方面，本发明实施例还提供一种可读存储介质。

本发明可读存储介质上存储有模型训练程序，其中所述模型训练程序被处理器执行时，实现如上述的模型训练方法的步骤。

其中，模型训练程序被执行时所实现的方法可参照本发明模型训练方法的各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种模型训练方法，其特征在于，所述模型训练方法包括：

基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值；

所述基于目标图片组以及预训练模型开启训练的步骤包括：

通过目标图片组对预训练模型进行第一轮训练；

检测目标图片组的组别数量是否有新增；

2.如权利要求1所述的模型训练方法，其特征在于，所述将经过标注的样本图片放入其缺陷类型对应的图片组的步骤包括：

3.如权利要求1所述的模型训练方法，其特征在于，所述基于目标图片组以及预训练模型开启训练的步骤包括：

通过目标图片组对预训练模型进行第一轮训练；

4.如权利要求1或3所述的模型训练方法，其特征在于，在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后，还包括：

保存首次得到的模型；

5.如权利要求1或3所述的模型训练方法，其特征在于，在所述通过目标图片组对预训练模型进行第一轮训练的步骤之后，还包括：

保存首次得到的模型；

6.如权利要求4所述的模型训练方法，其特征在于，所述模型训练方法还包括：

计算已保存的模型的评估指标值；

若是，则以已保存的模型为最佳模型。

7.如权利要求6所述的模型训练方法，其特征在于，在所述以已保存的模型为最佳模型的步骤之后，还包括：

8.如权利要求1至3中任一项所述的模型训练方法，其特征在于，所述终止条件为：

9.一种模型训练装置，其特征在于，所述模型训练装置包括：

训练模块，用于基于目标图片组以及预训练模型开启训练，直至达到终止条件时，停止训练，所述目标图片组包含的经过标注的样本图片的数量大于或等于第一阈值；

训练模块，用于：

通过目标图片组对预训练模型进行第一轮训练；

检测目标图片组的组别数量是否有新增；