CN113313213A - 一种加速目标检测算法训练的数据集处理方法 - Google Patents

一种加速目标检测算法训练的数据集处理方法 Download PDF

Info

Publication number
CN113313213A
CN113313213A CN202110853633.7A CN202110853633A CN113313213A CN 113313213 A CN113313213 A CN 113313213A CN 202110853633 A CN202110853633 A CN 202110853633A CN 113313213 A CN113313213 A CN 113313213A
Authority
CN
China
Prior art keywords
training
data
data set
scale
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110853633.7A
Other languages
English (en)
Other versions
CN113313213B (zh
Inventor
王纵驰
王建兴
刘健
臧媛媛
王培�
于佳耕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Shenzhou Wisdom System Technology Co ltd
China Aviation Oil Group Co ltd
Institute of Software of CAS
Original Assignee
Aerospace Shenzhou Wisdom System Technology Co ltd
China Aviation Oil Group Co ltd
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Shenzhou Wisdom System Technology Co ltd, China Aviation Oil Group Co ltd, Institute of Software of CAS filed Critical Aerospace Shenzhou Wisdom System Technology Co ltd
Priority to CN202110853633.7A priority Critical patent/CN113313213B/zh
Publication of CN113313213A publication Critical patent/CN113313213A/zh
Application granted granted Critical
Publication of CN113313213B publication Critical patent/CN113313213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

一种加速目标检测算法训练的数据集处理方法,包括:(1)获取锚框类目标检测算法所需的训练用数据集;(2)数据集数据分析,提取数据集中所有标注框的特征作为待处理数据的划分依据;(3)数据集聚类,使用聚类算法,按照小、中、大三个尺度对特征进行聚类划分;(4)数据集划分;(5)模型训练,构成三阶训练体系,并按照先验知识对批处理数据簇进行分步训练;提高了深度学习数据集的训练效率,使用灵活方便,极大的加速了训练进度从而缩短训练时间。

Description

一种加速目标检测算法训练的数据集处理方法
技术领域
本发明属于计算机图像视觉深度学习技术数据集处理领域,具体涉及一种锚框类目标检测算法的数据集处理方法。
背景技术
现有加速目标检测算法训练方法目前主要有随机小批量数据加载训练法,即在训练过程中通过在数据集中随机采样生成批数据进行训练。此方法操作步骤少、使用简单,但训练所需时间长,同时由于采样过程的随机性会造成不同随机初始值训练出的算法模型精度波动大、不稳定。
发明内容
针对上述不足,本发明提供了一种加速目标检测算法训练的数据集处理方法,其特征在于,包括:
(1)获取锚框类目标检测算法所需的训练用数据集;
(2)数据集数据分析,提取数据集中所有标注框的特征作为待处理数据的划分依据。
(3)数据集聚类,将步骤(2)提取出的特征作为聚类算法的相似性距离计算依据;根据先验的目标检测网络多尺度目标通用处理规则,使用聚类算法,按照小、中、大三个尺度对特征进行聚类划分;
(4)数据集划分,以步骤(3)所得出的三个聚类中心为不同数据簇的中心对整个数据集进行划分,计算数据集中数据到三个聚类中心的距离并排序从而将数据集按照尺度变化划分为大、中、小三个数据簇;在三个数据簇内分别进行随机采样直至将数据集整理成三组批处理数据簇;
(5)模型训练,先使用容易训练的大尺度目标对整个模型网络进行有效训练,然后再使用小尺度目标进行多尺度识别推理和更高精度的区域框回归训练,并且模型训练递归执行,构成三阶训练体系,并按照先验知识对批处理数据簇进行分步训练。
本发明创造的优点:
与常规方法相比,实现了在相同数据规模下,该算法极大的缩减了深度学习模型训练过程所需的时间,同时保持了高精度性等优良特质。本发明提出的方法通过数据聚类技术利用先验知识对数据集进行划分从而生成相应批数据依次训练,优化了深度学习数据集训练策略,提高了深度学习数据集的训练效率,使用灵活方便,极大的加速了训练进度从而缩短训练时间,与此同时训练出的模型仍能保持高精度,可以很好地解决目前已有方法存在的问题。
附图说明
图1是训练流程示意图;
图2是聚类结果示意图。
具体实施方式
下面结合附图对本发明作进一步描述,应当理解,此处所描述的内容仅用于说明和解释本发明,并不用于限定本发明。
本申请的加速训练数据集处理方法,依照先验知识以及数据聚类技术对数据集处理从而生成训练用批数据。具体步骤如图1所示,如下:
(1)获取锚框类目标检测算法所需的训练用数据集,该数据集由指定识别任务类型确定;
(2)数据集数据分析。常见的目标检测任务数据集标注形式为将目标物体在一幅图像所处区域以矩形框形式标注,并以目标框的中心坐标以及框的高度、宽度作为数据存储,因此对于目前锚框类目标检测算法来说,其潜在特征为框的中心坐标,框的高、宽以及比例与面积。在本方法中,首先提取数据集中所有标注框的高度、宽度特征作为待处理数据的划分依据。对于目前深度学习算法来说,目标所处坐标位置变化对最终性能影响不大,而算法性能对目标框的比例以及面积尺度变化敏感,因此提取特征要构建尺度空间来模拟目标锚框的尺度变化。也就是说,对标注框特征的分析应将目标框的比例以及面积上的变化参数引入评价分析体系,以此表征在尺度空间中不同的目标锚框。经分析表明获取数据集内所有标注框的高
Figure 309996DEST_PATH_IMAGE001
、宽
Figure 364671DEST_PATH_IMAGE002
属性信息作为特征效果最佳。至此,预处理特征提取完毕;
(3)数据集聚类。将步骤(2)提取出的特征作为聚类算法的相似性距离计算依据。依据预处理特征,依次将目标锚框
Figure 702111DEST_PATH_IMAGE003
映射为二维特征平面上的唯一特征点
Figure 660096DEST_PATH_IMAGE004
,根据先验的目标检测网络多尺度目标通用处理规则,使用如下聚类算法,按照小、中、大三个尺度对特征进行聚类划分:
(3-1)选择初始化的随机三个特征样本点作为初始聚类中心
Figure 57580DEST_PATH_IMAGE005
(3-2)选取二维欧氏距离函数
Figure 599551DEST_PATH_IMAGE006
作为相似性度量函数,针对数据集中每个样本
Figure 475103DEST_PATH_IMAGE003
计算它到(3-1)中所选取的三个聚类中心的距离并将其分到距离最小的聚类中心所对应的类,使得每个样本
Figure 19085DEST_PATH_IMAGE003
归属为某一分类数据簇
Figure 853049DEST_PATH_IMAGE007
中;
(3-3)针对每个类别的聚类中心
Figure 616737DEST_PATH_IMAGE008
,在样本归类后重新计算
Figure 295980DEST_PATH_IMAGE009
,使得聚类中心
Figure 962978DEST_PATH_IMAGE008
为该分类数据簇的所有样本的质心;
(3-4)重复上面(3-2)、(3-3)两步操作,直到达到各个质心的位置坐标不再变化,至此依照先验知识所进行的数据聚类完成,如图2所示。
(4)数据集划分。以上一步骤(3)所得出的三个聚类中心
Figure 702264DEST_PATH_IMAGE005
为不同数据簇的中心对整个数据集进行划分,计算数据集中数据到三个聚类中心的距离并排序从而将数据集按照尺度变化划分为大、中、小三个数据簇。在三个数据簇内分别进行随机采样直至将数据集整理成三组批处理数据簇,至此数据集制作完成;
(5)模型训练。分析目前锚框类目标检测算法可知,其主要结构为数据提取器、多尺度处理器以及目标检测器的串行结构;对于通用的多尺度目标数据集,大尺度目标的输入数据可通过简单的训练获得较高精度。而目标尺度较小的输入数据则由于目标本身的小尺度造成训练与检测的困难。依照先验知识分析数据集可知,不同尺度的同类目标特征是相似的,因此提供容易训练的大尺度目标同样会对小尺度目标的识别提供帮助。为了兼顾性能和时间,避免随机采样训练等传统思路带来的巨大的时间开销,先使用容易训练的大尺度目标对整个模型网络进行有效训练,然后在使用小尺度目标进行多尺度识别推理和更高精度的区域框回归训练,并且让这一步递归执行,以此原则构成三阶训练体系按照先验知识对批处理数据簇进行分步训练:
(5-1)对训练模型初始化处理,提供大尺度批处理数据簇中的批数据进行训练;
(5-2)待(5-1)中模型的训练损失代价下降到小于经验训练损失终止值时,(本方法中此经验训练损失终止值为
Figure 936936DEST_PATH_IMAGE010
),此时可以认为大尺度数据的特征已经学习充分,逐步提供中尺度批数据并撤出训练完成的大尺度批数据;
(5-3)待(5-2)中模型的训练损失代价下降到小于经验训练损失终止值时,(本方法中此经验训练损失终止值为
Figure 170603DEST_PATH_IMAGE010
)。逐步提供小尺度批数据并撤出训练完成的中尺度批数据;
(5-4)在以上三个阶段的批数据训练完成后。使用此时得到的训练模型对各数据集进行评估划分,收集数据集中模型无法良好识别的数据作为难样本,按照上述流程重新制作训练数据并训练,直到模型在整个数据集上表现良好,至此训练结束。
本发明很好地解决了目前目标检测模型训练时间开销大问题,与此同时训练得出的模型精度并不会下降。通过使用若干通用数据集(例如WiderFace、COCO等)在常规目标检测模型(YOLO系列等)按照本发明上述方法进行操作得出结果,本发明无论是在检测正确率指标还是训练时间代价方面都明显优于现有训练方法。
最后应说明的是:以上所述仅为本发明的解释,并不用于限制本发明,尽管对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种加速目标检测算法训练的数据集处理方法,其特征在于,包括:
(1)获取锚框类目标检测算法所需的训练用数据集;
(2)数据集数据分析,提取数据集中所有标注框的特征作为待处理数据的划分依据;
(3)数据集聚类,将步骤(2)提取出的特征作为聚类算法的相似性距离计算依据;根据先验的目标检测网络多尺度目标通用处理规则,使用聚类算法,按照小、中、大三个尺度对特征进行聚类划分;
(4)数据集划分,以上一步骤(3)所得出的三个聚类中心为不同数据簇的中心对整个数据集进行划分,计算数据集中数据到三个聚类中心的距离并排序从而将数据集按照尺度变化划分为大、中、小三个数据簇;在三个数据簇内分别进行随机采样直至将数据集整理成三组批处理数据簇;
(5)模型训练,先使用容易训练的大尺度目标对整个模型网络进行有效训练,然后再使用小尺度目标进行多尺度识别推理和更高精度的区域框回归训练,并且模型训练过程递归执行,构成三阶训练体系,并按照先验知识对批处理数据簇进行分步训练。
2.根据权利要求1所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(1)中数据集由指定识别任务类型确定。
3.根据权利要求1所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(2)中提取特征要构建尺度空间来模拟目标锚框的尺度变化,以此表征在尺度空间中不同的目标锚框,获取数据集内所有标注框的高
Figure 710674DEST_PATH_IMAGE001
、宽
Figure 690132DEST_PATH_IMAGE002
属性信息作为特征。
4.根据权利要求3所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(3)中依次将目标锚框
Figure 266607DEST_PATH_IMAGE003
映射为二维特征平面上的唯一特征点
Figure 988049DEST_PATH_IMAGE004
聚类算法如下:
(3-1)选择初始化的随机三个特征样本点作为初始聚类中心
Figure 864738DEST_PATH_IMAGE005
(3-2)
选取二维欧氏距离函数
Figure 765829DEST_PATH_IMAGE006
作为相似性度量函数,针对数据集中每个样本
Figure 829600DEST_PATH_IMAGE003
计算它到(3-1)中所选取的三个聚类中心的距离并将其分到距离最小的聚类中心所对应的类,使得每个样本
Figure 340085DEST_PATH_IMAGE003
归属为某一分类数据簇
Figure 71280DEST_PATH_IMAGE007
中;
(3-3)针对每个类别的聚类中心
Figure 877693DEST_PATH_IMAGE008
,在样本归类后重新计算
Figure 694340DEST_PATH_IMAGE009
,使得聚类中心
Figure 277024DEST_PATH_IMAGE008
为该分类数据簇的所有样本的质心;
(3-4)重复上面(3-2)、(3-3)两步操作,直到各个质心不再变化,至此依照先验知识所进行的数据聚类完成。
5.根据权利要求1所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(5)中三阶训练包括如下三阶段:
(5-1)对训练模型初始化处理,提供大尺度批处理数据簇中的批数据进行训练;
(5-2)待(5-1)中模型的训练损失代价下降到训练损失小于经验训练损失终止值,此时认为大尺度数据的特征已经学习充分,逐步提供中尺度批数据并撤出训练完成的大尺度批数据;
(5-3)待(5-2)中模型的训练损失代价下降到训练损失小于经验训练损失终止值,逐步提供小尺度批数据并撤出训练完成的中尺度批数据。
6.根据权利要求5所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(5)中还包括,
(5-4)在以上三个阶段(5-1)、(5-2)、(5-3)的批数据训练完成后,使用此时得到的训练模型对数据集进行评估划分,收集数据集中模型无法良好识别的数据作为难样本,按照上述步骤(1)-(4)重新制作训练数据并训练,直到模型在整个数据集上表现良好,至此训练结束。
7.根据权利要求5所述的加速目标检测算法训练的数据集处理方法,其特征在于,步骤(5)中,本方法中经验训练损失终止值为
Figure 613459DEST_PATH_IMAGE010
CN202110853633.7A 2021-07-28 2021-07-28 一种加速目标检测算法训练的数据集处理方法 Active CN113313213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110853633.7A CN113313213B (zh) 2021-07-28 2021-07-28 一种加速目标检测算法训练的数据集处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110853633.7A CN113313213B (zh) 2021-07-28 2021-07-28 一种加速目标检测算法训练的数据集处理方法

Publications (2)

Publication Number Publication Date
CN113313213A true CN113313213A (zh) 2021-08-27
CN113313213B CN113313213B (zh) 2021-11-19

Family

ID=77382357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110853633.7A Active CN113313213B (zh) 2021-07-28 2021-07-28 一种加速目标检测算法训练的数据集处理方法

Country Status (1)

Country Link
CN (1) CN113313213B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100492A (zh) * 2022-08-26 2022-09-23 摩尔线程智能科技(北京)有限责任公司 Yolov3网络训练、pcb表面缺陷检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与系统
CN109299259A (zh) * 2018-09-26 2019-02-01 深圳壹账通智能科技有限公司 企业发票数据监测方法、装置、计算机设备和存储介质
US20200026953A1 (en) * 2018-07-23 2020-01-23 Wuhan University Method and system of extraction of impervious surface of remote sensing image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038448A (zh) * 2017-03-01 2017-08-11 中国科学院自动化研究所 目标检测模型构建方法
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与系统
US20200026953A1 (en) * 2018-07-23 2020-01-23 Wuhan University Method and system of extraction of impervious surface of remote sensing image
CN109299259A (zh) * 2018-09-26 2019-02-01 深圳壹账通智能科技有限公司 企业发票数据监测方法、装置、计算机设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100492A (zh) * 2022-08-26 2022-09-23 摩尔线程智能科技(北京)有限责任公司 Yolov3网络训练、pcb表面缺陷检测方法及装置

Also Published As

Publication number Publication date
CN113313213B (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
CN111062282B (zh) 基于改进yolov3模型的变电站指针式仪表识别方法
JP4556120B2 (ja) 情報処理装置および方法、並びにプログラム
CN105069457B (zh) 图像识别方法和装置
CN107169504A (zh) 一种基于扩展非线性核残差网络的手写字符识别方法
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN102663401B (zh) 一种图像特征提取和描述方法
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN107316053A (zh) 一种布料图像快速匹配检索方法
CN113344019A (zh) 一种决策值选取初始聚类中心改进的K-means算法
CN113344113B (zh) 一种基于改进k-means聚类的Yolov3锚框确定方法
CN111738367B (zh) 一种基于图像识别的零件分类方法
CN112116950B (zh) 基于深度度量学习的蛋白质折叠识别方法
CN113298184B (zh) 用于小样本图像识别的样本抽取、扩充方法及存储介质
CN110659682A (zh) 一种基于MCWD-KSMOTE-AdaBoost-DenseNet算法的数据分类方法
CN113313213B (zh) 一种加速目标检测算法训练的数据集处理方法
CN114359604B (zh) 一种基于多飞行器轨迹数据的队形识别模型构建方法
CN106203508A (zh) 一种基于Hadoop平台的图像分类方法
CN111863135B (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN110956177A (zh) 一种混合型验证码的识别方法及系统
CN105844299A (zh) 一种基于词袋模型的图像分类方法
Pereira et al. Assessing active learning strategies to improve the quality control of the soybean seed vigor
CN104778478A (zh) 一种手写数字识别方法
CN108090514B (zh) 基于两阶段密度聚类的红外图像识别方法
CN111383710A (zh) 基于粒子群优化双子支持向量机的基因剪接位点识别模型构建方法
CN115035409B (zh) 一种基于相似性对比学习的弱监督遥感图像目标检测算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant