CN114743074A

CN114743074A - 一种基于强弱对抗训练的船舶检测模型训练方法及系统

Info

Publication number: CN114743074A
Application number: CN202210658893.3A
Authority: CN
Inventors: 吴显德; 叶海珍; 邹凡; 李玲飞; 张进虎
Original assignee: Zhejiang Whyis Technology Co ltd
Current assignee: Zhejiang Whyis Technology Co ltd
Priority date: 2022-06-13
Filing date: 2022-06-13
Publication date: 2022-07-12
Anticipated expiration: 2042-06-13
Also published as: CN114743074B

Abstract

本发明公开一种基于强弱对抗训练的船舶检测模型训练方法及系统。其中，该方法通过将训练集中全部图片根据对抗系数从小到大进行排序得到正序列；以及将训练集中全部图片根据对抗系数从大到小进行排序得到倒序列；每次迭代训练集分别从正序列和倒序列中取出预设数量张图片；这样可以减少船舶检测模型训练过程中受训练集复杂程度不一，导致损失值不稳定的问题，提高模型训练速度，又可以避免一次迭代数据复杂过大或过小对反向传播造成的不良反应。通过修改损失函数，即通过对抗系数计算损失权重，根据损失权重计算迭代训练集的损失值，加大对复杂样本的学习，降低对简单样本的学习，从而实现模型减少对简单样本的误检，提高复杂样本的检出率。

Description

一种基于强弱对抗训练的船舶检测模型训练方法及系统

技术领域

本发明涉及船舶检测技术领域，具体而言，涉及一种基于强弱对抗训练的船舶检测模型训练方法及系统。

背景技术

随着深度学习不断发展，深度学习算法在各个工业领域广泛的应用，其中利用深度学习算法实现船舶自动检测在近几年快速发展。基于深度学习算法实现的船舶目标检测其训练原理为船舶检测网络通过对训练集的图片特征提取，依据提取特征预测图片中船舶的位置，然后跟实际训练集图片中船舶的位置进行对比得到误差，船舶检测模型依据这个误差更新模型对船舶特征的认知，最终实现基于深度学习的船舶目标检测方法能够准确判断船舶的类型和位置。目前已存在的深度学习船舶目标检测方法是对船舶训练集随机采样，进行船舶检测模型学习，但训练集随机采样会出现以下问题：

1）训练集的每张图片船舶信息和背景信息各不相同。有些训练集的背景信息和船舶信息比较简单，船舶检测模型容易学习，有些训练集的背景信息和船舶信息较为复杂，采用随机采样，导致每次迭代的数据具有随机性，导致每一次迭代的训练集数据复杂不一，导致损失值波动偏大，模型难以收敛；

2）随机采样无法高效实现模型性能，随机采样船舶检测模型训练每次迭代训练集可能出现都为简单或都为复杂。每次迭代都为简单数据时，模型损失值很小趋近于0，反向传播得到偏导太小，船舶检测网络参数基本不变；都为复杂数据集时，模型损失值偏大，反向传播得到偏导太大，船舶检测网络参数更正过大，无法正常学习；

3）随机采样无法知道每次迭代的数据集是否为简单或复杂图片，导致船舶检测模型对所有训练集学习权重一样，极有可能出现船舶检测模型：①对简单数据集特征值过于敏感，导致假阳增加；②对复杂数据集特征不敏感，无法拟合，导致假阴增加。

针对现有技术中船舶检测模型对简单数据集过于敏感，对复杂数据集不敏感造成误检的问题，目前尚未提出有效的解决方案。发明内容

本发明实施例中提供一种基于强弱对抗训练的船舶检测模型训练方法及系统，以解决现有技术中船舶检测模型对简单数据集过于敏感，对复杂数据集不敏感造成误检的问题。

为达到上述目的，一方面，本发明提供了一种基于强弱对抗训练的船舶检测模型训练方法，该方法包括：步骤S101，将训练集中全部图片进行模型训练，得到当前轮船舶检测模型；通过所述当前轮船舶检测模型对测试集进行测试，得到当前轮测试集的准确率；判断所述准确率是否大于预设阈值，若是，进入步骤S102；步骤S102，计算训练集中每张图片在当前轮模型训练中的对抗系数；步骤S103，将训练集中全部图片根据所述对抗系数从小到大进行排序得到正序列；以及将训练集中全部图片根据所述对抗系数从大到小进行排序得到倒序列；步骤S104，从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集；根据所述当前轮船舶检测模型对所述当前迭代训练集进行模型训练，得到当前迭代船舶检测模型，以及得到所述当前迭代训练集的损失值；步骤S105，从所述正序列、倒序列中分别抽取没有进行模型训练的预设数量张图片作为下次迭代训练集，将所述下次迭代训练集作为所述当前迭代训练集，重复步骤S104直至将正序列、倒序列中的图片全部模型训练完，得到下一轮船舶检测模型；步骤S106，将所述下一轮船舶检测模型作为所述当前轮船舶检测模型，重复步骤S1012、步骤S103、步骤S104、步骤S105直至船舶检测模型的损失值在预设范围内波动，得到目标船舶检测模型。

可选的，在得到所述当前迭代训练集的损失值之后包括：根据所述损失值进行反向传播，更新所述当前迭代船舶检测模型。

可选的，所述对抗系数的计算公式为：

（1）

（2）

（3）

其中，T为训练集中当前张图片在当前轮模型训练中的对抗系数；

为训练集中当前张图片在当前轮模型训练中正检的对抗系数；

为超参，本申请中为0.8；

表示训练集中当前张图片在当前轮模型训练中生成的一个预测框正检的置信度；

表示训练集中当前张图片在当前轮模型训练中生成的一个预测框和标定框中心点的距离与所述预测框和标定框最远点距离的比值；n表示当前张图片预测框的数量；

表示训练集中当前张图片在当前轮模型训练中生成的一个预测框误检的置信度。

可选的，所述当前迭代训练集的损失值的计算公式为：

（4）

（5）

其中，

是当前迭代训练集的损失值，N表示当前迭代训练集中图片的个数；

是当前迭代训练集中当前张图片的损失权重；

是当前迭代训练集中当前张图片的损失值；

是当前迭代训练集中第k张图片的损失权重；

是当前迭代训练集中第k张图片的对抗系数；

是当前迭代训练集中所有图片的对抗系数总和；所述对抗系数是当前轮模型训练时计算得到的每张图片的对抗系数；所述

是下一轮模型训练时当前迭代训练集中第k张图片的损失权重。

可选的，所述从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集包括：从所述正序列中抽取预设数量张图片，得到第一训练集；从所述倒序列中抽取预设数量张图片，得到第二训练集；将所述第一训练集和所述第二训练集组合得到所述当前迭代训练集；其中，所述倒序列中抽取的图片与所述正序列中抽取的图片位置一一对应。

另一方面，本发明提供了一种基于强弱对抗训练的船舶检测模型训练系统，该系统包括：当前轮训练单元，用于将训练集中全部图片进行模型训练，得到当前轮船舶检测模型；通过所述当前轮船舶检测模型对测试集进行测试，得到当前轮测试集的准确率；判断所述准确率是否大于预设阈值，若是，进入计算单元；计算单元，用于计算训练集中每张图片在当前轮模型训练中的对抗系数；排序单元，用于将训练集中全部图片根据所述对抗系数从小到大进行排序得到正序列；以及将训练集中全部图片根据所述对抗系数从大到小进行排序得到倒序列；下一轮训练单元，用于从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集；根据所述当前轮船舶检测模型对所述当前迭代训练集进行模型训练，得到当前迭代船舶检测模型，以及得到所述当前迭代训练集的损失值；第一重复训练单元，用于从所述正序列、倒序列中分别抽取没有进行模型训练的预设数量张图片作为下次迭代训练集，将所述下次迭代训练集作为所述当前迭代训练集，重复所述下一轮训练单元直至将正序列、倒序列中的图片全部模型训练完，得到下一轮船舶检测模型；第二重复训练单元，用于将所述下一轮船舶检测模型作为所述当前轮船舶检测模型，重复所述计算单元、排序单元、下一轮训练单元、第一重复训练单元直至船舶检测模型的损失值在预设范围内波动，得到目标船舶检测模型。

可选的，所述对抗系数的计算公式为：

（1）

（2）

（3）

为超参，本申请中为0.8；

可选的，所述当前迭代训练集的损失值的计算公式为：

（4）

（5）

其中，

是当前迭代训练集中当前张图片的损失权重；

是当前迭代训练集中当前张图片的损失值；

是当前迭代训练集中第k张图片的损失权重；

是当前迭代训练集中第k张图片的对抗系数；

可选的，所述从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集包括：第一抽取子单元，用于从所述正序列中抽取预设数量张图片，得到第一训练集；第二抽取子单元，用于从所述倒序列中抽取预设数量张图片，得到第二训练集；组合子单元，用于将所述第一训练集和所述第二训练集组合得到所述当前迭代训练集；其中，所述倒序列中抽取的图片与所述正序列中抽取的图片位置一一对应。

本发明的有益效果：

本发明提供了一种基于强弱对抗训练的船舶检测模型训练方法及系统，通过对训练集中全部图片根据对抗系数从小到大进行排序得到正序列以及从大到小进行排序得到倒序列；每次迭代训练集依次从正序列和倒序列中取出，组合成一次迭代训练集；这样做可以减少船舶检测模型训练过程中受训练集复杂程度不一，导致损失值不稳定的问题，提高模型训练速度，又可以避免一次迭代数据复杂过大或过小对反向传播造成的不良反应。通过修改损失函数，即通过对抗系数计算损失权重，根据损失权重计算迭代训练集的损失值，加大对复杂样本的学习，降低对简单样本的学习，从而实现模型减少对简单样本的误检，提高复杂样本的检出率。

附图说明

图1是本发明实施例提供的一种基于强弱对抗训练的船舶检测模型训练方法的流程图；

图2是本发明实施例提供的一种基于强弱对抗训练的船舶检测模型训练系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

目前已存在的深度学习船舶目标检测方法是对船舶训练集随机采样，进行船舶检测模型训练，但训练集随机采样会出现以下问题：

因而，本发明提供了一种基于强弱对抗训练的船舶检测模型训练方法，图1是本发明实施例提供的一种基于强弱对抗训练的船舶检测模型训练方法的流程图，如图1所示，该方法包括：

步骤S101，将训练集中全部图片进行模型训练，得到当前轮船舶检测模型；通过所述当前轮船舶检测模型对测试集进行测试，得到当前轮测试集的准确率；判断所述准确率是否大于预设阈值，若是，进入步骤S102；

在一个可选的实施方式中，假设第一轮模型训练时，将训练集中全部图片进行模型训练，得到第一轮船舶检测模型；通过第一轮船舶检测模型对测试集进行测试，得到第一轮测试集的准确率，若第一轮测试集的准确率小于预设阈值（本申请为0.35），则进行第二轮模型训练，将训练集中全部图片进行模型训练，得到第二轮船舶检测模型；通过第二轮船舶检测模型对测试集进行测试，得到第二轮测试集的准确率，若第二轮测试集的准确率大于预设阈值（本申请为0.35），则进入步骤S102（即开启对抗训练方法）。

步骤S102，计算训练集中每张图片在当前轮模型训练中的对抗系数；

在一个可选的实施方式中，在对训练集中全部图片进行第二轮模型训练时，就会得到每张图片的对抗系数。

具体的，对抗系数的计算公式为：

（1）

（2）

（3）

为超参，本申请中为0.8；

需要说明的是，训练集中的当前张图片在当前轮模型训练时会生成多个预测框和标定框；例如：一张图片有4个目标，则一定有4个标定框，但是该张图片会生成的预测框的数量不确定，有可能为3个，4个、5个或者0个等等。

步骤S103，将训练集中全部图片根据所述对抗系数从小到大进行排序得到正序列；以及将训练集中全部图片根据所述对抗系数从大到小进行排序得到倒序列；

具体的，将第二轮模型训练时训练集中全部图片根据计算的对抗系数从小到大进行排序得到正序列；以及将第二轮模型训练时训练集中全部图片根据计算的对抗系数从大到小进行排序得到倒序列。

步骤S104，从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集；根据所述当前轮船舶检测模型对所述当前迭代训练集进行模型训练，得到当前迭代船舶检测模型，以及得到所述当前迭代训练集的损失值；

在一个可选的实施方式中，所述从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集包括：

从所述正序列中抽取预设数量张图片，得到第一训练集；从所述倒序列中抽取预设数量张图片，得到第二训练集；将所述第一训练集和所述第二训练集组合得到所述当前迭代训练集；其中，所述倒序列中抽取的图片与所述正序列中抽取的图片位置一一对应。

具体的，例如：将所述正序列中第一个位置的图片和第三个位置的图片抽取得到第一训练集，则对应的在所述倒序列中第一个位置的图片和第三个位置的图片抽取得到第二训练集；将第一训练集和第二训练集组合得到第三轮的当前迭代训练集；对当前迭代训练集进行模型训练，得到第三轮的当前迭代船舶检测模型，以及得到第三轮的当前迭代训练集的损失值；

所述当前迭代训练集的损失值的计算公式为：

（4）

（5）

其中，

是当前迭代训练集中当前张图片的损失权重；

是当前迭代训练集中当前张图片的损失值；

是当前迭代训练集中第k张图片的损失权重；

是当前迭代训练集中第k张图片的对抗系数；

需要说明的是，公式（5）中的对抗系数是第二轮模型训练时计算得到的每张图片的对抗系数，

是第三轮模型训练时当前迭代训练集的损失值，N表示第三轮模型训练时当前迭代训练集中图片的个数；

是第三轮模型训练时当前迭代训练集中当前张图片的损失权重；

是第三轮模型训练时当前迭代训练集中当前张图片的损失值；

是第三轮模型训练时当前迭代训练集中第k张图片的损失权重。

本申请中，通过

（当前迭代训练集中当前张图片的损失权重），可以加大模型对不敏感的数据进行学习，减少对对抗系数少的数据集的学习。

在一个可选的实施方式中，在得到所述当前迭代训练集的损失值之后包括：根据所述损失值进行反向传播，更新所述当前迭代船舶检测模型。

步骤S105，从所述正序列、倒序列中分别抽取没有进行模型训练的预设数量张图片作为下次迭代训练集，将所述下次迭代训练集作为所述当前迭代训练集，重复步骤S104直至将正序列、倒序列中的图片全部模型训练完，得到下一轮船舶检测模型；

具体的，例如：将所述正序列中（没有进行模型训练的）第二个位置的图片和第四个位置的图片抽取得到第一训练集，则对应的在所述倒序列中第二个位置的图片和第四个位置的图片抽取得到第二训练集；将第一训练集和第二训练集组合得到第三轮的下次迭代训练集；将所述下次迭代训练集作为所述当前迭代训练集，重复上述步骤S104直至将正序列、倒序列中的图片全部模型训练完，得到第三轮船舶检测模型。

步骤S106，将所述下一轮船舶检测模型作为所述当前轮船舶检测模型，重复步骤S102、步骤S103、步骤S104、步骤S105直至船舶检测模型的损失值在预设范围内波动，得到目标船舶检测模型。

在一个可选的实施方式中，本申请中，在将正序列和倒序列中的图片进行第三轮模型后，只需计算正序列中的每张图片的对抗系数即可，倒序列中的每张图片与正序列中的每张图片是相同的，当计算出正序列中的每张图片的对抗系数，自然也就得到了倒序列中的每张图片的对抗系数。因此，只需计算一个序列（正序列）中的每张图片的对抗系数即可。

进一步的，本申请需要在正序列和倒序列中的全部图片模型训练完后，计算出一个序列（正序列）中的每张图片的对抗系数，这样才能得到另一个序列（倒序列）中每张图片的对抗系数。

根据第三轮船舶检测模型得到的每张图片的对抗系数从小到大进行排序得到更新的正序列，以及根据第三轮船舶检测模型得到的每张图片的对抗系数从大到小进行排序得到更新的倒序列；根据所述更新的正序列和更新的倒序列重复步骤S104和步骤S105，得到第四轮船舶检测模型，当进行到第m轮船舶检测模型训练时，此时船舶检测模型的损失值在预设范围内（

）波动，不再进行模型训练，得到目标船舶检测模型。

本申请中，利用对抗采样方法（即从正序列和倒序列中分别抽取预设数量张图片）得到每次迭代训练集，降低每次迭代训练集损失值的差异，提高模型训练的稳定；利用对抗采样的方法不会使迭代训练集得到的损失值过大或过小，提高模型训练精度；每次迭代训练集的损失值的计算方法（即损失函数计算方法）使船舶监测模型依据对抗系数得到迭代训练集每张图片的损失权重，加大对抗系数大的数据集检出率，降低对抗系数低的数据集误检率。

图2是本发明实施例提供的一种基于强弱对抗训练的船舶检测模型训练系统的结构示意图，如图2所示，该系统包括：

当前轮训练单元201，用于将训练集中全部图片进行模型训练，得到当前轮船舶检测模型；通过所述当前轮船舶检测模型对测试集进行测试，得到当前轮测试集的准确率；判断所述准确率是否大于预设阈值，若是，进入计算单元；

在一个可选的实施方式中，假设第一轮模型训练时，将训练集中全部图片进行模型训练，得到第一轮船舶检测模型；通过第一轮船舶检测模型对测试集进行测试，得到第一轮测试集的准确率，若第一轮测试集的准确率小于预设阈值（本申请为0.35），则进行第二轮模型训练，将训练集中全部图片进行模型训练，得到第二轮船舶检测模型；通过第二轮船舶检测模型对测试集进行测试，得到第二轮测试集的准确率，若第二轮测试集的准确率大于预设阈值（本申请为0.35），则进入计算单元202（即开启对抗训练方法）。

计算单元202，用于计算训练集中每张图片在当前轮模型训练中的对抗系数；

具体的，对抗系数的计算公式为：

（1）

（2）

（3）

为超参，本申请中为0.8；

排序单元203，用于将训练集中全部图片根据所述对抗系数从小到大进行排序得到正序列；以及将训练集中全部图片根据所述对抗系数从大到小进行排序得到倒序列；

下一轮训练单元204，用于从所述正序列、倒序列中分别抽取预设数量张图片并组成当前迭代训练集；根据所述当前轮船舶检测模型对所述当前迭代训练集进行模型训练，得到当前迭代船舶检测模型，以及得到所述当前迭代训练集的损失值；

所述当前迭代训练集的损失值的计算公式为：

（4）

（5）

其中，

是当前迭代训练集中当前张图片的损失权重；

是当前迭代训练集中当前张图片的损失值；

是当前迭代训练集中第k张图片的损失权重；

是当前迭代训练集中第k张图片的对抗系数；

本申请中，通过

第一重复训练单元205，用于从所述正序列、倒序列中分别抽取没有进行模型训练的预设数量张图片作为下次迭代训练集，将所述下次迭代训练集作为所述当前迭代训练集，重复所述下一轮训练单元直至将正序列、倒序列中的图片全部模型训练完，得到下一轮船舶检测模型；

具体的，例如：将所述正序列中（没有进行模型训练的）第二个位置的图片和第四个位置的图片抽取得到第一训练集，则对应的在所述倒序列中第二个位置的图片和第四个位置的图片抽取得到第二训练集；将第一训练集和第二训练集组合得到第三轮的下次迭代训练集；将所述下次迭代训练集作为所述当前迭代训练集，重复上述下一轮训练单元204直至将正序列、倒序列中的图片全部模型训练完，得到第三轮船舶检测模型。

第二重复训练单元206，用于将所述下一轮船舶检测模型作为所述当前轮船舶检测模型，重复所述计算单元202、排序单元203、下一轮训练单元204、第一重复训练单元205直至船舶检测模型的损失值在预设范围内波动，得到目标船舶检测模型。

根据第三轮船舶检测模型得到的每张图片的对抗系数从小到大进行排序得到更新的正序列，以及根据第三轮船舶检测模型得到的每张图片的对抗系数从大到小进行排序得到更新的倒序列；根据所述更新的正序列和更新的倒序列重复下一轮训练单元204和第一重复训练单元205，得到第四轮船舶检测模型，当进行到第m轮船舶检测模型训练时，此时船舶检测模型的损失值在预设范围内（

）波动，不再进行模型训练，得到目标船舶检测模型。

本发明的有益效果：

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。