CN116416424A

CN116416424A - 一种用于训练yolo算法模型的方法、芯片及系统

Info

Publication number: CN116416424A
Application number: CN202111578439.9A
Authority: CN
Inventors: 游思遐; 黄惠保; 周和文; 陈锦杰; 张子倩
Original assignee: Zhuhai Amicro Semiconductor Co Ltd
Current assignee: Zhuhai Amicro Semiconductor Co Ltd
Priority date: 2021-12-22
Filing date: 2021-12-22
Publication date: 2023-07-11

Abstract

本发明公开一种用于训练yolo算法模型的方法、芯片及系统，该方法具体包括如下步骤：步骤1：获取训练数据样本集，进入步骤2；步骤2：将训练数据样本集中的全部训练数据样本导入初始模型，根据yolo算法循环执行初始模型训练，直至初始模型的目标检测效果稳定时获取第一模型，进入步骤3；步骤3：根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，对本步骤重复执行第一预设次数后获取第二模型，进入步骤4；步骤4：将训练数据样本集中的全部训练数据样本导入第二模型中，对第二模型执行一次冻结训练流程，获取最终模型。本发明通过对yolo算法模型进行冻结训练流程实现对模型的分结构训练，有效提高训练yolo算法模型的准确度。

Description

一种用于训练yolo算法模型的方法、芯片及系统

技术领域

本发明涉及目标检测技术领域，具体涉及一种用于训练yolo算法模型的方法、芯片及系统。

背景技术

随着科技的飞速发展，目标检测技术也迅猛兴起，目标检测技术主要是用于正确识别图像中的指定物体，目标检测技术主要是基于神经网络模型，目前应用较广的一种算法模型是yolo（you only look once），其具备检测速度快和检测精度高的优点，目前训练yolo算法模型主要是通过向模型中导入大量训练样本数据进行模型整体结构的训练，这种训练方式存在准确度有限的问题。

发明内容

为解决上述问题，本发明提供了一种用于训练yolo算法模型的方法、芯片及系统，通过对yolo算法模型进行冻结训练流程实现对模型的分结构训练，有效提高训练yolo算法模型的准确度。本发明的具体技术方案如下：

一种用于训练yolo算法模型的方法，具体包括如下步骤：步骤1：获取训练数据样本集，进入步骤2；步骤2：将训练数据样本集中的全部训练数据样本导入初始模型，根据yolo算法循环执行初始模型训练，直至初始模型的目标检测效果稳定时获取第一模型，进入步骤3；步骤3：根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，对本步骤重复执行第一预设次数后获取第二模型，进入步骤4；步骤4：将训练数据样本集中的全部训练数据样本导入第二模型中，对第二模型执行一次冻结训练流程，获取最终模型。

进一步地，所述冻结训练流程具体包括骨干网络冻结训练流程和检测头冻结训练流程。

进一步地，所述骨干网络冻结训练流程是指将模型中的骨干网络结构进行冻结，根据导入模型的训练数据样本仅对模型中的检测头结构进行训练。

进一步地，所述检测头冻结训练流程是指将模型中的检测头结构进行冻结，根据导入模型的训练数据样本仅对模型中的骨干网络结构进行训练。

进一步地，所述冻结训练流程具体包括：先对模型执行一次检测头冻结训练流程，然后对模型循环执行第二预设次数的骨干网络冻结训练流程。

进一步地，所述初始模型的检测效果通过计算所述初始模型的平均精度均值进行描述；其中，所述初始模型的平均精度均值与所述初始模型的检测效果呈正相关。

进一步地，所述用于训练yolo算法模型的方法还包括：对所述第二模型执行一次冻结训练流程之前，将冻结训练流程的学习速率降低一个量级。

进一步地，所述根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，具体包括：从训练数据样本集中随机选取部分的训练数据样本并导入第一模型中，根据导入第一模型中的训练数据样本对第一模型执行冻结训练流程。

本发明公开一种芯片，芯片内存储有计算机程序，所述芯片内存储的计算机程序被处理器运行时执行如前所述的用于训练yolo算法模型的方法。

本发明还公开一种用于训练yolo算法模型的系统，所述用于训练yolo算法模型的系统包括机器人、处理器和芯片，所述芯片内存储的计算机程序被所述处理器运行时，实现如前所述的用于训练yolo算法模型的方法，所述处理器将训练后的最终模型传输至机器人，机器人根据训练后的最终模型进行目标检测。

本发明通过冻结训练流程实现对目标检测效果已稳定的yolo算法模型进行分结构训练，从而有效提升模型的目标检测效果，提高yolo算法模型的准确度。

附图说明

图1为本发明一种实施例所述用于训练yolo算法模型的方法的流程示意图。

图2为本发明一种实施例所述冻结训练流程的流程示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清晰，以下将结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用于解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另作定义，本申请所涉及的技术术语或科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”和“该”等类似词语并不表示数量限制，可以表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们的变形，意图在于覆盖不排他的包含，例如：包含了一系列步骤的过程、方法、系统、产品或设备没有限定于已列出的步骤，而是可以还包括没有列出的步骤或单元，或者可以还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

作为本发明的一种较优的实施例，本发明的第一实施例中提供一种用于训练yolo算法模型的方法，如图1所示，所述用于训练yolo算法模型的方法具体包括如下步骤：

获取训练数据样本集；具体地，所述训练数据样本集是根据用户对模型的目标检测对象的要求进行相关训练数据样本集的获取，获取训练数据样本集的方式可以是但不限于从训练数据库中获取符合用户对模型的目标检测对象要求的数据样本集，或者是用户将符合其对模型的目标检测对象的要求的数据样本集导入。

将训练数据样本集中的全部训练数据样本导入初始模型并根据yolo算法进行初始模型训练，循环执行初始模型训练，直至初始模型的目标检测效果稳定时，获取第一模型；具体地，所述初始模型是由用户对模型的目标检测对象的要求进行预先配置的，所述初始模型的整体结构主要由骨干网络结构和检测头结构组成；所述初始模型训练是指通过导入初始模型中的训练数据样本对初始模型进行训练，所述初始模型训练的目的是对初始模型的检测效果进行优化，所述初始模型训练实现其目的的方式是通过训练数据样本对初始模型的整体结构进行训练，从而实现对初始模型的检测效果的优化，一般地，初始模型训练的执行次数与初始模型的检测效果呈正相关，但是当初始模型训练的执行次数达到一定值，所述初始模型训练对初始模型的检测效果优化效果较弱，此后再对初始模型进行初始模型训练难以实现对初始模型的目标检测效果的再提升，因此，当初始模型的检测效果稳定时，则表示即使对初始模型再循环执行初始模型训练也较难对初始模型的目标检测效果有明显的提升，将此时的初始模型视作第一模型并获取第一模型。需要说明的是，所述模型的目标检测效果与所述模型的目标检测的准确度呈正相关，在一定范围内，当模型的目标检测效果越好则表示模型的目标检测的准确度越高。

根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，对本步骤循环执行第一预设次数后获取第二模型；具体地，所述根据训练数据样本集中的训练数据样本对第一模型进行第一预设次数的冻结训练流程具体可以是但不限于从训练数据样本集中选取全部或部分训练数据样本导入第一模型中，然后对已导入全部或部分训练数据样本的第一模型循环执行第一预设次数的冻结训练流程；需要说明的是，每一次执行冻结训练流程前，对第一模型中的训练数据样本进行重新导入。所述冻结训练流程是指一种对第一模型中的骨干网络结构和检测头结构进行分结构训练的流程。由于第一模型的目标检测效果已稳定，对第一模型继续循环执行初始模型训练已不能有明显的目标检测效果，在本步骤中对第一模型执行第一预设次数的冻结训练流程，通过对模型分结构训练的方式，实现对模型的目标检测效果的再提升。需要说明的是，所述第一预设次数是根据用户对模型的目标检测效果的要求和模型复杂程度等多种因素综合考量设定用于限定第一模型循环执行冻结训练流程的次数的数值。

将训练数据样本集中的全部训练数据样本导入第二模型中，对第二模型执行一次冻结训练流程，获取最终模型。本步骤针对第一模型执行第一预设次数的冻结训练流程后获取的第二模型导入训练数据样本集中的全部训练数据样本，单独再执行一次冻结训练流程，确保此次冻结训练流程的训练数据样本数量充分，进一步优化第二模型的目标检测效果。

基于上述第一实施例，作为本发明一种较优的实施例，本发明的第二实施例中所述冻结训练流程具体包括骨干冻结训练流程和检测头冻结训练流程。具体地，所述骨干冻结训练流程是指将模型中的骨干网络结构进行冻结，并根据导入模型的训练数据样本仅对模型中的检测头结构进行训练；相反地，所述检测头冻结训练流程是指将模型中检测头结构进行冻结，并根据导入模型的训练数据样本仅对模型中的骨干网络结构进行训练。需要说明的是，所述冻结可以理解为对模型中的指定结构进行锁定，仅对未锁定的结构进行训练优化。本实施例通过采用冻结训练流程实现对模型中的骨干网络结构和检测头结构的分结构区域训练，相较于现有技术中对模型整体结构的统一训练，能够有效提高模型的目标检测效果，从而达到提高模型准确度的目的。

基于上述实施例，作为本发明一种较优的实施例，如图2所示，本发明的第三实施例中所述冻结训练流程具备包括：根据导入模型中的训练样本数据先对模型执行一次检测头冻结训练流程，在对模型循环执行第二预设次数的骨干网络冻结训练流程。具体地，所述冻结训练路程中执行骨干网络冻结训练流程的次数多于执行检测头冻结训练流程的次数；所述第二预设次数根据用户对模型的目标检测效果的要求和模型复杂程度等多种因素综合考量设定用于限定冻结训练流程执行次数的数值。在本实施例中将骨干网络冻结训练流程的执行次数设置为多于检测头冻结训练流程的执行次数，这是由于在本发明人实际研究过程中发现对模型中检测头结构进行循环训练所能提高模型准确度效果更优。

优选地，所述冻结训练流程还可以是先循环执行第二预设次数的骨干网络冻结训练流程，再执行一次检测头冻结训练流程，或者是将检测头冻结训练流程与所述骨干网络冻结训练流程穿插执行。

基于上述实施例，作为本发明一种较优的实施例，本发明的第四实施例中所述初始模型的目标检测效果通过计算所述初始模型的平均精度均值（mPA，mean AveragePrecision）；其中，所述平均精度均值mPA是目标检测算法中的主要评估指标，所述平均精度均值mPA通过收集初始模型训练过程中对训练数据样本的精度和准度获得；其中，所述精度是指模型训练过程中对训练数据样本的目标检测的随机误差小，即方差小，用于描述实际检测过程中扰动情况；所述准度是指模型训练过程中对训练数据样本的目标检测的系统误差小，即偏差小，用于描述实际检测结果与真实结果的偏差；所述平均精度均值越高，则表示模型在给定的训练数据样本中的目标检测效果越好。本实施例通过评估平均精度均值的方式确定初始模型中目标检测效果，从而判定是否停止对初始模型执行初始模型优化以获取第一模型，进入下一阶段的冻结训练流程。

基于上述实施例，作为本发明一种较优的实施例，本发明的第五实施例中所述用于训练yolo算法模型的方法还包括：对所述第二模型执行一次冻结训练流程之前，将冻结训练流程的学习速率降低一个量级。具体地，所述将冻结训练流程的学习速率降低一个量级是相较于所述第一模型执行冻结训练流程的学习速率而言的降低；所述学习速率是指模型对训练样本数据的训练过程中积累信息的速度。本实施例通过在对第二模型执行一次冻结训练流程前，将学习速率降低一个量级，以实现在接近总体模型训练结束时抵抗随机波动，实现在最后一次冻结训练流程中达到对第二模型寻优优化的目的，从而大幅提高模型准确度。

优选地，所述用于训练yolo算法模型的方法还可以包括：对所述第二模型执行一次冻结训练流程之前，将冻结训练流程的学习速率降低至少一个量级。

基于上述实施例，作为本发明一种较优的实施例，本发明的第六实施例中，所述根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，具体包括：从训练数据样本集中随机选取部分的训练数据样本并导入第一模型中，根据导入第一模型中的训练数据样本对第一模型执行冻结训练流程。具体地，本实施例通过从训练数据样本集中随机选取部分训练数据样本并导入第一模型，避免每一次导入第一模型中的训练数据样本相同，导致第一模型在循环执行第一预设次数的冻结训练流程后出现模型过泛化的情况，通过控制每次导入第一模型的训练数据样本存在差异，确保第一模型的训练效果，有效提升yolo算法模型的准确度。

作为本发明一种较优的实施例，本发明的第七实施例中公开一种芯片，芯片内存储有计算机程序，所述芯片内存储的计算机程序被处理器运行时执行如前所述的用于训练yolo算法模型的方法。

作为本发明一种较优的实施例，本发明的第八实施例中公开一种用于训练yolo算法模型的系统，所述用于训练yolo算法模型的系统包括机器人、处理器和芯片，所述芯片内存储的计算机程序被所述处理器运行时，实现如前所述的用于训练yolo算法模型的方法，所述处理器将训练后的最终模型传输至机器人，机器人根据训练后的最终模型进行目标检测。

显然，上述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，各个实施例之间的技术方案可以相互结合。在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。在本发明所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。为了避免不必要的重复，本发明实施方式对各种可能的组合方式不再另行说明。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种用于训练yolo算法模型的方法，其特征在于，所述方法具体包括如下步骤：

步骤1：获取训练数据样本集，进入步骤2；

步骤2：将训练数据样本集中的全部训练数据样本导入初始模型，根据yolo算法循环执行初始模型训练，直至初始模型的目标检测效果稳定时获取第一模型，进入步骤3；

步骤3：根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，对本步骤重复执行第一预设次数后获取第二模型，进入步骤4；

步骤4：将训练数据样本集中的全部训练数据样本导入第二模型中，对第二模型执行一次冻结训练流程，获取最终模型。

2.根据权利要求1所述的用于训练yolo算法模型的方法，其特征在于，所述冻结训练流程具体包括骨干网络冻结训练流程和检测头冻结训练流程。

3.根据权利要求2所述的用于训练yolo算法模型的方法，其特征在于，所述骨干网络冻结训练流程是指将模型中的骨干网络结构进行冻结，根据导入模型的训练数据样本仅对模型中的检测头结构进行训练。

4.根据权利要求2所述的用于训练yolo算法模型的方法，其特征在于，所述检测头冻结训练流程是指将模型中的检测头结构进行冻结，根据导入模型的训练数据样本仅对模型中的骨干网络结构进行训练。

5.根据权利要求2所述的用于训练yolo算法模型的方法，其特征在于，所述冻结训练流程具体包括：先对模型执行一次检测头冻结训练流程，然后对模型循环执行第二预设次数的骨干网络冻结训练流程。

6.根据权利要求1所述的用于训练yolo算法模型的方法，其特征在于，所述初始模型的检测效果通过计算所述初始模型的平均精度均值进行描述；其中，所述初始模型的平均精度均值与所述初始模型的检测效果呈正相关。

7.根据权利要求1所述的用于训练yolo算法模型的方法，其特征在于，所述用于训练yolo算法模型的方法还包括：对所述第二模型执行一次冻结训练流程之前，将冻结训练流程的学习速率降低一个量级。

8.根据权利要求1所述的用于训练yolo算法模型的方法，其特征在于，所述根据训练数据样本集中的训练数据样本对第一模型进行冻结训练流程，具体包括：从训练数据样本集中随机选取部分的训练数据样本并导入第一模型中，根据导入第一模型中的训练数据样本对第一模型执行冻结训练流程。

9.一种芯片，芯片内存储有计算机程序，其特征在于，所述芯片内存储的计算机程序被处理器运行时执行如权利要求1至8任意一项所述的用于训练yolo算法模型的方法。

10.一种用于训练yolo算法模型的系统，其特征在于，所述用于训练yolo算法模型的系统包括机器人、处理器和如权利要求9所述的芯片，所述芯片内存储的计算机程序被所述处理器运行时，实现如权利要求1至8任意一项所述的用于训练yolo算法模型的方法，所述处理器将训练后的最终模型传输至机器人，机器人根据训练后的最终模型进行目标检测。