CN111598185A - 一种基于深度学习的训练数据平衡方法、设备和系统 - Google Patents

一种基于深度学习的训练数据平衡方法、设备和系统 Download PDF

Info

Publication number
CN111598185A
CN111598185A CN202010461701.0A CN202010461701A CN111598185A CN 111598185 A CN111598185 A CN 111598185A CN 202010461701 A CN202010461701 A CN 202010461701A CN 111598185 A CN111598185 A CN 111598185A
Authority
CN
China
Prior art keywords
size
proportion
value
training data
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010461701.0A
Other languages
English (en)
Other versions
CN111598185B (zh
Inventor
宋梦
刘奔
汪明润
王华文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Teamway Electric Co ltd
Original Assignee
Shenzhen Teamway Electric Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Teamway Electric Co ltd filed Critical Shenzhen Teamway Electric Co ltd
Priority to CN202010461701.0A priority Critical patent/CN111598185B/zh
Publication of CN111598185A publication Critical patent/CN111598185A/zh
Application granted granted Critical
Publication of CN111598185B publication Critical patent/CN111598185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的训练数据平衡方法、设备和系统,属于图像识别技术领域。本发明通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例,调整训练数据中目标类别的图片数量,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。

Description

一种基于深度学习的训练数据平衡方法、设备和系统
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种基于深度学习的训练数据平衡方法、设备和系统。
背景技术
近年来,随着深度学习技术和目标检测的发展,为了提高深度学习和目标检测的效果,需要对训练数据进行平衡,从而提高深度学习和目标检测的可靠性。
现有技术提供了一种一种训练数据平衡方法,包括:首先取出数据集中多数类和少数类样本集合并计数,对多少样本类进行聚类和对少数类样本进行过采样,然后对多数和少数类样本集合进行相组合,并抽取其特征加入到类别平衡的新数据集中,然后对新特征进行训练。
但是现有技术存在如下问题:
在对训练数据平衡过程中,并未避免由少量样本类中的锚框个数不平衡所导致的可靠性降低的问题。
发明内容
为了解决现有技术的问题,本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统,包括:
一方面,提供了一种基于深度学习的训练数据平衡方法,所述方法包括:
获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片之前,所述方法还包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。
可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量之前,所述方法还包括:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据中所述目标类别的图片数量。
可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量包括:
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
可选的,所述方法还包括:
根据调整后的训练数据进行训练,获取训练结果;
若所述训练结果不符合预期,则继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。
另一方面,提供了一种基于深度学习的训练数据平衡设备,所述设备包括:
获取模块,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
所述获取模块还用于获取训练数据中所俗话目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
调整模块,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
所述调整模块还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
可选的,所述调整模块具体用于:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
可选的,所述调整模块还具体用于:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量;
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
可选的,所述设备还包括:
训练模块,所述训练模块具体用于根据调整后的训练数据进行训练,获取训练结果;
若所述训练结果不符合预期,则所述获取模块继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。
另一方面,提供了一种基于深度学习的训练数据平衡设备,所述设备包括处理器以及与所述处理器连接的存储器,所述存储器用于存储一组程序代码,所述处理器执行所述存储器所存储的程序代码用于执行以下操作:
获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。
可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作:
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据中所述目标类别的图片数量。
可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作:
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作:
根据调整后的训练数据进行训练,获取训练结果;
若所述训练结果不符合预期,则继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。
另一方面,提供了一种基于深度学习的训练数据平衡系统,所述系统包括:
获取设备,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
所述获取设备还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
调整设备,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
所述调整设备还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
可选的,所述调整设备具体用于:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
可选的,所述调整设备还具体用于:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量;
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
可选的,所述系统还包括:
训练设备,所述训练模块具体用于根据调整后的训练数据进行训练,获取训练结果;
若所述训练结果不符合预期,则所述获取模块继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。
本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统,包括:获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例;根据第一尺寸比例和第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片;根据锚框数量比例,调整训练数据中目标类别的图片数量。
本发明提供的技术方案所达到的有益效果是:
1、通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低;
2、通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例,调整训练数据中目标类别的图片数量,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图;
图2是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图;
图3是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图;
图4是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图;
图5是本发明实施例提供的一种基于深度学习的训练数据平衡系统示意图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
下面结合说明书附图对本发明实施例作进一步详细描述。
实施例一
本发明实施例提供了一种基于深度学习的训练数据平衡方法,参照图1所示,该方法包括:
101、获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例。
102、获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例。
103、判断第一尺寸比例和第二尺寸比例之间的差值绝对值是否小于尺寸比例阈值,若是,则执行步骤105或结束;否则,则执行步骤104。
104、根据第一尺寸比例和第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片。
具体的,若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值,则删除框值最大的图片;
若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值,则增加框值最小的图片。
105、判断锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值是否小于锚框数量阈值,若是,则执行步骤107或结束;否则,则执行步骤106。
106、根据锚框数量比例,调整训练数据中目标类别的图片数量。
具体的,锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值,则减少目标类别的图片数量;
其他目标类别的锚框数量比例与锚框数量比例之间的差值大于锚框数量阈值,则增加目标类别的图片数量。
107、根据调整后的训练数据进行训练,获取训练结果。
108、若训练结果不符合预期,则继续执行步骤101至步骤107,直至训练结果符合预期。
实施例二
本发明实施例提供了一种基于深度学习的训练数据平衡方法,参照图2所示,该方法包括:
201、获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例。
具体的,获取部分测试数据,为了方便说明,假设有两个类别确定标注类别classes=[a,b],并根据该两个类别对该部分测试数据进行标注;则目标类别a的图像尺寸所占测试数据中所有待调整类别的图像总尺寸的第一尺寸比例α的获取公式为:
Figure 749783DEST_PATH_IMAGE002
其中,
Figure 962196DEST_PATH_IMAGE004
为该部分测试数据目标类别a的图像尺寸,
Figure 538671DEST_PATH_IMAGE006
为该部分测试数据所有图像的图像尺寸,上述数值可以可以是通过统计得出的,本发明实施例对具体的统计方式加以限定;另外,在实际应用中,该尺寸可以为面积。
202、获取训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例。
具体的,目标类别a的锚框数量所占训练数据中待调整类别的锚框总数量的锚框数量比例
Figure 261776DEST_PATH_IMAGE008
,以及目标类别b的锚框数量所占训练数据中待调整类别的锚框总数量的锚框数量比例
Figure 138465DEST_PATH_IMAGE010
的获取公式可以为:
Figure 524710DEST_PATH_IMAGE012
Figure 854060DEST_PATH_IMAGE014
其中,
Figure 115277DEST_PATH_IMAGE016
分别为a和b两个目标类别的锚框数量,
Figure 580893DEST_PATH_IMAGE018
为训练数据中所有待调整类别的锚框总数量,上述数值可以可以是通过统计得出的,本发明实施例对具体的统计方式加以限定。
203、获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例。
具体的,并根据该两个类别对该部分训练数据进行标注;则目标类别的图像尺寸所占训练数据中所有待调整类别的图像总尺寸的第二尺寸比例
Figure 869530DEST_PATH_IMAGE020
的获取公式为:
Figure 155018DEST_PATH_IMAGE022
其中,
Figure 219926DEST_PATH_IMAGE024
为该部分测试数据中目标类别的图像尺寸,
Figure 540049DEST_PATH_IMAGE026
为该部分测试数据所有待调整类别的图像尺寸,上述数值可以可以是通过统计得出的,本发明实施例对具体的统计方式加以限定;另外,在实际应用中,该尺寸可以为面积。
其中,步骤201至步骤203可以是同时执行的,也可以是按照上述顺序执行的,还可以是按照其他顺序执行的,本发明实施例对具体的执行顺序不加以限定。
204、判断第一尺寸比例和第二尺寸比例之间的差值绝对值是否小于尺寸比例阈值,若是,则执行步骤207或结束;否则,则执行步骤205。
具体的,该判断方式具体为:
判断
Figure 766631DEST_PATH_IMAGE028
是否成立,其中,
Figure 306459DEST_PATH_IMAGE030
为尺寸比例阈值,在实际应用中,
Figure DEST_PATH_IMAGE031
的数值可以为范围为[0.2,0.4]。
205、若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值,则删除框值最大的图片。
具体的,该删除方式可以为是在训练过程中忽略该框值最大的锚框,本发明实施例对具体的删除方式不加以限定。
206、若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值,则增加框值最小的图片。
具体的,该增加方式可以为将训练样本中的图片复制后的图片增加至训练样本中。
值得注意的是,步骤205至步骤206是实现根据第一尺寸比例和第二尺寸比例,调整训练数据中框值最大的图片以及框值最小的图片的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
207、判断锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值是否小于锚框数量阈值,若是,则执行步骤210或结束;否则,则执行步骤208。
具体的,该判断方式为:
判断
Figure DEST_PATH_IMAGE033
是否成立,其中,
Figure DEST_PATH_IMAGE035
为锚框数量阈值,在实际应用中,
Figure DEST_PATH_IMAGE036
的数值范围为[0.1,0.45]。
208、锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值,则减少目标类别的图片数量。
具体的,该减少方式可以为在训练过程中忽略预设数量的图片,本发明实施例对具体的减少方式不加以限定。
209、若其他目标类别的锚框数量比例与锚框数量比例与之间的差值大于锚框数量阈值,则增加目标类别的图片数量。
具体的,该增加方式可以为在训练过程中增加预设数量的图片,本发明实施例对具体的增加方式不加以限定。
值得注意的是,步骤208至步骤209是实现根据锚框数量比例,调整训练数据中目标类别的图片数量的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
210、根据调整后的训练数据进行训练,获取训练结果。
具体的,将调整后的训练数据输入待训练的算法或者模型中,并输出训练结果。
211、若训练结果不符合预期,则继续执行步骤201至步骤210,直至训练结果符合预期。
需要说明的是,在本发明实施例中,类别a为目标类别,目标b为其他目标类别,本发明实施例是对目标类别a进行调整,本发明实施例所提供的方法同样的适用于以类别b为目标类别进行调整。另外,本发明实施例所述的类别数量仅仅是示例性的,在实际应用中,该类别数量可以为多个,同样适用于本发明实施例所述的方法。
实施例三
本发明实施例提供了一种基于深度学习的训练数据平衡设备3,参照图3所示,该设备包括:
获取模块31,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取模块31还用于获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例;
调整模块32,用于根据第一尺寸比例和第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片;
调整模块32还用于根据锚框数量比例,调整训练数据中目标类别的图片数量。
可选的,调整模块32具体用于:
若第一尺寸比例和第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整训练数据中目标类别的框值最大的图片以及框值最小的图片;
若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值,则删除框值最大的图片;
若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值,则增加框值最小的图片。
可选的,调整模块32还具体用于:
若锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整训练数据中目标类别的图片数量;
锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值,则减少目标类别的图片数量;
其他目标类别的锚框数量比例与锚框数量比例之间的差值大于锚框数量阈值,则增加目标类别的图片数量。
可选的,设备还包括:
训练模块33,训练模块具体用于根据调整后的训练数据进行训练,获取训练结果;
若训练结果不符合预期,则获取模块31继续执行获取第一尺寸比例以及锚框数量比例的步骤。
实施例四
本发明实施例提供了一种基于深度学习的训练数据平衡设备4,参照图4所示,该设备包括处理器41以及与处理器41连接的存储器42,存储器42用于存储一组程序代码,处理器41执行存储器42所存储的程序代码用于执行以下操作:
获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例;
根据第一尺寸比例和第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片;
根据锚框数量比例,调整训练数据中目标类别的图片数量。
可选的,处理器41执行存储器42所存储的程序代码用于执行以下操作:
若第一尺寸比例和第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整训练数据中目标类别的框值最大的图片以及框值最小的图片,否则,则调整训练数据中目标类别的框值最大的图片以及框值最小的图片。
可选的,处理器41执行存储器42所存储的程序代码用于执行以下操作:
若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值,则删除框值最大的图片;
若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值,则增加框值最小的图片。
可选的,处理器41执行存储器42所存储的程序代码用于执行以下操作:
若锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整训练数据中目标类别的图片数量,否则,则调整训练数据中目标类别的图片数量。
可选的,处理器41执行存储器42所存储的程序代码用于执行以下操作:
锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值,则减少目标类别的图片数量;
其他目标类别的锚框数量比例与锚框数量比例之间的差值大于锚框数量阈值,则增加目标类别的图片数量。
可选的,处理器41执行存储器42所存储的程序代码用于执行以下操作:
根据调整后的训练数据进行训练,获取训练结果;
若训练结果不符合预期,则继续执行获取第一尺寸比例以及锚框数量比例的步骤。
实施例五
本发明实施例提供了一种基于深度学习的训练数据平衡系统,参照图5所示,该系统包括:
获取设备51,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取设备51还用于获取训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例;
调整设备52,用于根据第一尺寸比例和第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片;
调整设备52还用于根据锚框数量比例,调整训练数据中目标类别的图片数量。
可选的,调整设备52具体用于:
若第一尺寸比例和第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整训练数据中目标类别的框值最大的图片以及框值最小的图片;
若第一尺寸比例和第二尺寸比例之间的差值大于尺寸比例阈值,则删除框值最大的图片;
若第二尺寸比例和第一尺寸比例之间的差值大于尺寸比例阈值,则增加框值最小的图片。
可选的,调整设备52还具体用于:
若锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整训练数据中目标类别的图片数量;
锚框数量比例与其他目标类别的锚框数量比例之间的差值大于锚框数量阈值,则减少目标类别的图片数量;
其他目标类别的锚框数量比例与锚框数量比例之间的差值大于锚框数量阈值,则增加目标类别的图片数量。
可选的,系统还包括:
训练设备53,训练模块具体用于根据调整后的训练数据进行训练,获取训练结果;
若训练结果不符合预期,则获取设备51继续执行获取第一尺寸比例以及锚框数量比例的步骤。
本发明实施例提供了一种基于深度学习的训练数据平衡方法、设备和系统,通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数量比例,调整训练数据中目标类别的图片数量,避免了少量样本类中的锚框个数不平衡所导致的可靠性降低。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的训练数据平衡设备和系统在执行训练数据平衡方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的训练数据平衡方法、设备和系统实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度学习的训练数据平衡方法,其特征在于,所述方法包括:
获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片之前,所述方法还包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片包括:
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
4.根据权利要求1或3所述的方法,其特征在于,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量之前,所述方法还包括:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据中所述目标类别的图片数量。
5.根据权利要求4所述的方法,其特征在于,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量包括:
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据调整后的训练数据进行训练,获取训练结果;
若所述训练结果不符合预期,则继续执行所述获取所述第一尺寸比例以及所述锚框数量比例的步骤。
7.一种训练数据平衡设备,其特征在于,所述设备包括:
获取模块,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
所述获取模块还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
调整模块,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
所述调整模块还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
8.根据权利要求7所述的设备,其特征在于,所述调整模块具体用于:
若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除所述框值最大的图片;
若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加所述框值最小的图片。
9.根据权利要求7所述的设备,其特征在于,所述调整模块还具体用于:
若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数量阈值,则无需调整所述训练数据中所述目标类别的图片数量;
所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数量阈值,则减少所述目标类别的图片数量;
所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数量阈值,则增加所述目标类别的图片数量。
10.一种训练数据平衡系统,其特征在于,所述系统包括:
获取设备,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;
所述获取设备还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数量比例;
调整设备,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片;
所述调整设备还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。
CN202010461701.0A 2020-05-27 2020-05-27 一种基于深度学习的训练数据平衡方法、设备和系统 Active CN111598185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010461701.0A CN111598185B (zh) 2020-05-27 2020-05-27 一种基于深度学习的训练数据平衡方法、设备和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010461701.0A CN111598185B (zh) 2020-05-27 2020-05-27 一种基于深度学习的训练数据平衡方法、设备和系统

Publications (2)

Publication Number Publication Date
CN111598185A true CN111598185A (zh) 2020-08-28
CN111598185B CN111598185B (zh) 2021-11-19

Family

ID=72188813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010461701.0A Active CN111598185B (zh) 2020-05-27 2020-05-27 一种基于深度学习的训练数据平衡方法、设备和系统

Country Status (1)

Country Link
CN (1) CN111598185B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013086490A2 (en) * 2011-12-09 2013-06-13 William Marsh Rice University Methods, apparatus, and sensors for tracing frac fluids in mineral formations, production waters, and the environment using magnetic particles
CN110334602A (zh) * 2019-06-06 2019-10-15 武汉市公安局视频侦查支队 一种基于卷积神经网络的人流量统计方法
CN110490177A (zh) * 2017-06-02 2019-11-22 腾讯科技(深圳)有限公司 一种人脸检测器训练方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013086490A2 (en) * 2011-12-09 2013-06-13 William Marsh Rice University Methods, apparatus, and sensors for tracing frac fluids in mineral formations, production waters, and the environment using magnetic particles
CN110490177A (zh) * 2017-06-02 2019-11-22 腾讯科技(深圳)有限公司 一种人脸检测器训练方法及装置
CN110334602A (zh) * 2019-06-06 2019-10-15 武汉市公安局视频侦查支队 一种基于卷积神经网络的人流量统计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
TSUNG-YI LIN等: "Focal Loss for Dense Object Detection", 《IEEE》 *
周雯等: "基于卷积神经网络的动车组行车安全图像缺陷检测与分割", 《铁道学报》 *

Also Published As

Publication number Publication date
CN111598185B (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN111950723B (zh) 神经网络模型训练方法、图像处理方法、装置及终端设备
CN110689136B (zh) 一种深度学习模型获得方法、装置、设备及存储介质
US11915058B2 (en) Video processing method and device, electronic equipment and storage medium
CN113076992A (zh) 一种生活垃圾检测方法及装置
CN112132279A (zh) 卷积神经网络模型压缩方法、装置、设备及存储介质
CN111753870B (zh) 目标检测模型的训练方法、装置和存储介质
CN109657711A (zh) 一种图像分类方法、装置、设备及可读存储介质
CN111368707B (zh) 基于特征金字塔与密集块的人脸检测方法、系统、设备及介质
CN110990617B (zh) 一种图片标记方法、装置、设备及存储介质
CN107844803B (zh) 一种图片比对的方法和装置
CN109086737B (zh) 基于卷积神经网络的航运货物监控视频识别方法及系统
CN113033373B (zh) 用于训练人脸识别模型及识别人脸的方法及相关装置
CN111598185B (zh) 一种基于深度学习的训练数据平衡方法、设备和系统
US11984021B2 (en) Infrared remote control code matching method and apparatus, computer device, and readable storage medium
WO2020056688A1 (zh) 提取图像关键点的方法及装置
CN111353976B (zh) 一种基于卷积神经网络的沙粒目标检测方法
CN114998172A (zh) 图像处理方法及相关系统
CN113947154A (zh) 一种目标检测方法、系统、电子设备及存储介质
CN108133210B (zh) 一种图像格式识别方法及装置
CN112819079A (zh) 模型的采样算法匹配方法、装置和电子设备
CN111291635A (zh) 人工智能检测方法及装置、终端和计算机可读存储介质
CN111179238A (zh) 面向子集指导一致性增强评价的子集置信比例动态选取方法
CN113762382A (zh) 模型的训练及场景识别方法、装置、设备及介质
CN115373920A (zh) 一种ui数据测试方法及装置
CN114783031A (zh) 人脸识别方法、识别装置、识别系统、计算机设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant