CN111598185A

CN111598185A - 一种基于深度学习的训练数据平衡方法、设备和系统

Info

Publication number: CN111598185A
Application number: CN202010461701.0A
Authority: CN
Inventors: 宋梦; 刘奔; 汪明润; 王华文
Original assignee: Shenzhen Teamway Electric Co ltd
Current assignee: Shenzhen Teamway Electric Co ltd
Priority date: 2020-05-27
Filing date: 2020-05-27
Publication date: 2020-08-28
Anticipated expiration: 2040-05-27
Also published as: CN111598185B

Abstract

本发明公开了一种基于深度学习的训练数据平衡方法、设备和系统，属于图像识别技术领域。本发明通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例，与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例，调整训练数据中目标类别的图片数量，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。

Description

一种基于深度学习的训练数据平衡方法、设备和系统

技术领域

本发明涉及图像识别技术领域，尤其是涉及一种基于深度学习的训练数据平衡方法、设备和系统。

背景技术

近年来，随着深度学习技术和目标检测的发展，为了提高深度学习和目标检测的效果，需要对训练数据进行平衡，从而提高深度学习和目标检测的可靠性。

现有技术提供了一种一种训练数据平衡方法，包括：首先取出数据集中多数类和少数类样本集合并计数，对多少样本类进行聚类和对少数类样本进行过采样，然后对多数和少数类样本集合进行相组合，并抽取其特征加入到类别平衡的新数据集中，然后对新特征进行训练。

但是现有技术存在如下问题：

在对训练数据平衡过程中，并未避免由少量样本类中的锚框个数不平衡所导致的可靠性降低的问题。

发明内容

为了解决现有技术的问题，本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统，包括：

一方面，提供了一种基于深度学习的训练数据平衡方法，所述方法包括：

获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例；

根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片；

根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量。

可选的，所述根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片之前，所述方法还包括：

若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值，则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片，否则，则调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。

可选的，所述根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片包括：

若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值，则删除所述框值最大的图片；

若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值，则增加所述框值最小的图片。

可选的，所述根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量之前，所述方法还包括：

若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值，则无需调整所述训练数据中所述目标类别的图片数量，否则，则调整所述训练数据中所述目标类别的图片数量。

可选的，所述根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量包括：

所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值，则减少所述目标类别的图片数量；

所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值，则增加所述目标类别的图片数量。

可选的，所述方法还包括：

根据调整后的训练数据进行训练，获取训练结果；

若所述训练结果不符合预期，则继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。

另一方面，提供了一种基于深度学习的训练数据平衡设备，所述设备包括：

获取模块，用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

所述获取模块还用于获取训练数据中所俗话目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例，以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例；

调整模块，用于根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片；

所述调整模块还用于根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量。

可选的，所述调整模块具体用于：

若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值，则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片；

可选的，所述调整模块还具体用于：

若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值，则无需调整所述训练数据中所述目标类别的图片数量；

可选的，所述设备还包括：

训练模块，所述训练模块具体用于根据调整后的训练数据进行训练，获取训练结果；

若所述训练结果不符合预期，则所述获取模块继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。

另一方面，提供了一种基于深度学习的训练数据平衡设备，所述设备包括处理器以及与所述处理器连接的存储器，所述存储器用于存储一组程序代码，所述处理器执行所述存储器所存储的程序代码用于执行以下操作：

可选的，所述处理器执行所述存储器所存储的程序代码还用于执行以下操作：

根据调整后的训练数据进行训练，获取训练结果；

另一方面，提供了一种基于深度学习的训练数据平衡系统，所述系统包括：

获取设备，用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

所述获取设备还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例，以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例；

调整设备，用于根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片；

所述调整设备还用于根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量。

可选的，所述调整设备具体用于：

可选的，所述调整设备还具体用于：

可选的，所述系统还包括：

训练设备，所述训练模块具体用于根据调整后的训练数据进行训练，获取训练结果；

本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统，包括：获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例；根据第一尺寸比例和第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片；根据锚框数量比例，调整训练数据中目标类别的图片数量。

本发明提供的技术方案所达到的有益效果是：

1、通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例，与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低；

2、通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例，调整训练数据中目标类别的图片数量，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图；

图2是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图；

图3是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图；

图4是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图；

图5是本发明实施例提供的一种基于深度学习的训练数据平衡系统示意图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

下面结合说明书附图对本发明实施例作进一步详细描述。

实施例一

本发明实施例提供了一种基于深度学习的训练数据平衡方法，参照图1所示，该方法包括：

101、获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例。

102、获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例。

103、判断第一尺寸比例和第二尺寸比例之间的差值绝对值是否小于尺寸比例阈值，若是，则执行步骤105或结束；否则，则执行步骤104。

104、根据第一尺寸比例和第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片。

具体的，若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值，则删除框值最大的图片；

若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值，则增加框值最小的图片。

105、判断锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值是否小于锚框数量阈值，若是，则执行步骤107或结束；否则，则执行步骤106。

106、根据锚框数量比例，调整训练数据中目标类别的图片数量。

具体的，锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值，则减少目标类别的图片数量；

其他目标类别的锚框数量比例与锚框数量比例之间的差值大于锚框数量阈值，则增加目标类别的图片数量。

107、根据调整后的训练数据进行训练，获取训练结果。

108、若训练结果不符合预期，则继续执行步骤101至步骤107，直至训练结果符合预期。

实施例二

本发明实施例提供了一种基于深度学习的训练数据平衡方法，参照图2所示，该方法包括：

201、获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例。

具体的，获取部分测试数据，为了方便说明，假设有两个类别确定标注类别classes=[a，b]，并根据该两个类别对该部分测试数据进行标注；则目标类别a的图像尺寸所占测试数据中所有待调整类别的图像总尺寸的第一尺寸比例α的获取公式为：

其中，

为该部分测试数据目标类别a的图像尺寸，

为该部分测试数据所有图像的图像尺寸，上述数值可以可以是通过统计得出的，本发明实施例对具体的统计方式加以限定；另外，在实际应用中，该尺寸可以为面积。

202、获取训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例。

具体的，目标类别a的锚框数量所占训练数据中待调整类别的锚框总数量的锚框数量比例

，以及目标类别b的锚框数量所占训练数据中待调整类别的锚框总数量的锚框数量比例

的获取公式可以为：

；

其中，

分别为a和b两个目标类别的锚框数量，

为训练数据中所有待调整类别的锚框总数量，上述数值可以可以是通过统计得出的，本发明实施例对具体的统计方式加以限定。

203、获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例。

具体的，并根据该两个类别对该部分训练数据进行标注；则目标类别的图像尺寸所占训练数据中所有待调整类别的图像总尺寸的第二尺寸比例

的获取公式为：

其中，

为该部分测试数据中目标类别的图像尺寸，

为该部分测试数据所有待调整类别的图像尺寸，上述数值可以可以是通过统计得出的，本发明实施例对具体的统计方式加以限定；另外，在实际应用中，该尺寸可以为面积。

其中，步骤201至步骤203可以是同时执行的，也可以是按照上述顺序执行的，还可以是按照其他顺序执行的，本发明实施例对具体的执行顺序不加以限定。

204、判断第一尺寸比例和第二尺寸比例之间的差值绝对值是否小于尺寸比例阈值，若是，则执行步骤207或结束；否则，则执行步骤205。

具体的，该判断方式具体为：

判断

是否成立，其中，

为尺寸比例阈值，在实际应用中，

的数值可以为范围为[0.2,0.4]。

205、若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值，则删除框值最大的图片。

具体的，该删除方式可以为是在训练过程中忽略该框值最大的锚框，本发明实施例对具体的删除方式不加以限定。

206、若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值，则增加框值最小的图片。

具体的，该增加方式可以为将训练样本中的图片复制后的图片增加至训练样本中。

值得注意的是，步骤205至步骤206是实现根据第一尺寸比例和第二尺寸比例，调整训练数据中框值最大的图片以及框值最小的图片的过程，除了上述步骤所述的方式之外，还可以通过其他方式实现该过程，本发明实施例对具体的方式不加以限定。

207、判断锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值是否小于锚框数量阈值，若是，则执行步骤210或结束；否则，则执行步骤208。

具体的，该判断方式为：

判断

是否成立，其中，

为锚框数量阈值，在实际应用中，

的数值范围为[0.1，0.45]。

208、锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值，则减少目标类别的图片数量。

具体的，该减少方式可以为在训练过程中忽略预设数量的图片，本发明实施例对具体的减少方式不加以限定。

209、若其他目标类别的锚框数量比例与锚框数量比例与之间的差值大于锚框数量阈值，则增加目标类别的图片数量。

具体的，该增加方式可以为在训练过程中增加预设数量的图片，本发明实施例对具体的增加方式不加以限定。

值得注意的是，步骤208至步骤209是实现根据锚框数量比例，调整训练数据中目标类别的图片数量的过程，除了上述步骤所述的方式之外，还可以通过其他方式实现该过程，本发明实施例对具体的方式不加以限定。

210、根据调整后的训练数据进行训练，获取训练结果。

具体的，将调整后的训练数据输入待训练的算法或者模型中，并输出训练结果。

211、若训练结果不符合预期，则继续执行步骤201至步骤210，直至训练结果符合预期。

需要说明的是，在本发明实施例中，类别a为目标类别，目标b为其他目标类别，本发明实施例是对目标类别a进行调整，本发明实施例所提供的方法同样的适用于以类别b为目标类别进行调整。另外，本发明实施例所述的类别数量仅仅是示例性的，在实际应用中，该类别数量可以为多个，同样适用于本发明实施例所述的方法。

实施例三

本发明实施例提供了一种基于深度学习的训练数据平衡设备3，参照图3所示，该设备包括：

获取模块31，用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

获取模块31还用于获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例；

调整模块32，用于根据第一尺寸比例和第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片；

调整模块32还用于根据锚框数量比例，调整训练数据中目标类别的图片数量。

可选的，调整模块32具体用于：

若第一尺寸比例和第二尺寸比例之间的差值绝对值小于尺寸比例阈值，则无需调整训练数据中目标类别的框值最大的图片以及框值最小的图片；

若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值，则删除框值最大的图片；

可选的，调整模块32还具体用于：

若锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值，则无需调整训练数据中目标类别的图片数量；

锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值，则减少目标类别的图片数量；

可选的，设备还包括：

训练模块33，训练模块具体用于根据调整后的训练数据进行训练，获取训练结果；

若训练结果不符合预期，则获取模块31继续执行获取第一尺寸比例以及锚框数量比例的步骤。

实施例四

本发明实施例提供了一种基于深度学习的训练数据平衡设备4，参照图4所示，该设备包括处理器41以及与处理器41连接的存储器42，存储器42用于存储一组程序代码，处理器41执行存储器42所存储的程序代码用于执行以下操作：

获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例；

根据第一尺寸比例和第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片；

根据锚框数量比例，调整训练数据中目标类别的图片数量。

可选的，处理器41执行存储器42所存储的程序代码用于执行以下操作：

若第一尺寸比例和第二尺寸比例之间的差值绝对值小于尺寸比例阈值，则无需调整训练数据中目标类别的框值最大的图片以及框值最小的图片，否则，则调整训练数据中目标类别的框值最大的图片以及框值最小的图片。

若锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值，则无需调整训练数据中目标类别的图片数量，否则，则调整训练数据中目标类别的图片数量。

根据调整后的训练数据进行训练，获取训练结果；

若训练结果不符合预期，则继续执行获取第一尺寸比例以及锚框数量比例的步骤。

实施例五

本发明实施例提供了一种基于深度学习的训练数据平衡系统，参照图5所示，该系统包括：

获取设备51，用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例；

获取设备51还用于获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例；

调整设备52，用于根据第一尺寸比例和第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片；

调整设备52还用于根据锚框数量比例，调整训练数据中目标类别的图片数量。

可选的，调整设备52具体用于：

可选的，调整设备52还具体用于：

可选的，系统还包括：

训练设备53，训练模块具体用于根据调整后的训练数据进行训练，获取训练结果；

若训练结果不符合预期，则获取设备51继续执行获取第一尺寸比例以及锚框数量比例的步骤。

本发明实施例提供了一种基于深度学习的训练数据平衡方法、设备和系统，通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例，与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例，调整训练数据中目标类别的框值最大的图片以及框值最小的图片，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例，调整训练数据中目标类别的图片数量，避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

需要说明的是：上述实施例提供的训练数据平衡设备和系统在执行训练数据平衡方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的训练数据平衡方法、设备和系统实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的训练数据平衡方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一尺寸比例和所述第二尺寸比例，调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片包括：

4.根据权利要求1或3所述的方法，其特征在于，所述根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量之前，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述锚框数量比例，调整所述训练数据中所述目标类别的图片数量包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

根据调整后的训练数据进行训练，获取训练结果；

7.一种训练数据平衡设备，其特征在于，所述设备包括：

所述获取模块还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例，以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例；

8.根据权利要求7所述的设备，其特征在于，所述调整模块具体用于：

9.根据权利要求7所述的设备，其特征在于，所述调整模块还具体用于：

10.一种训练数据平衡系统，其特征在于，所述系统包括：