CN112149742A - 一种基于目标检测网络的智能标注方法 - Google Patents

一种基于目标检测网络的智能标注方法 Download PDF

Info

Publication number
CN112149742A
CN112149742A CN202011024865.3A CN202011024865A CN112149742A CN 112149742 A CN112149742 A CN 112149742A CN 202011024865 A CN202011024865 A CN 202011024865A CN 112149742 A CN112149742 A CN 112149742A
Authority
CN
China
Prior art keywords
target detection
detection network
data
method based
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011024865.3A
Other languages
English (en)
Inventor
李雪
李锐
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Hi Tech Investment and Development Co Ltd
Original Assignee
Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Hi Tech Investment and Development Co Ltd filed Critical Jinan Inspur Hi Tech Investment and Development Co Ltd
Priority to CN202011024865.3A priority Critical patent/CN112149742A/zh
Publication of CN112149742A publication Critical patent/CN112149742A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于目标检测网络的智能标注方法,所述目标检测网络使用Depthwise与Pointwise组合卷积层替换原来的卷积层,本方法基于深度学习的智能标注方法可以代替人力实现对图像数据的自动检测及自动标注,只需要少量的人工标注数据及人工纠错,即可完成模型的迭代优化,极大的提高模型标注的准确率,从而提高数据标注的速度及准确率。

Description

一种基于目标检测网络的智能标注方法
技术领域
本发明涉及一种目标检测网络的智能标注方法,属于人工智能技术领域,具体是数据标注领域。
背景技术
目标检测任务是计算机视觉领域的最主要的问题之一,广泛用于安防监控、自动驾驶等领域。目标检测结合了定位与分类任务,通常完成一个满足需求的目标检测模型需要海量的标注数据。数据标注工作通常需要耗费非常多的人力和时间,且不可避免的存在误标注、漏标注等情况。
发明内容
本发明要解决的技术问题是提供一种基于目标检测网络的智能标注方法,提高数据标注的准确度和速度,解放人力,提高效率。
为了解决所述技术问题,本发明采用的技术方案是:一种基于目标检测网络的智能标注方法,包括以下步骤:
S01)、将目标检测网络的卷积层替换成Depthwise与Pointwise组合卷积层,目标检测网络的其他层保持不变;
S02)、人工标注训练集,将标注后的训练集输入目标检测网络并进行训练;
S03)、利用训练后的目标检测网络对另一批新的数据进行数据检测和标注,对目标检测网络输出的结果进行人工纠错和改正,然后利用纠错、改正后的数据对训练后的目标检测网络进行迭代优化;
S04)、基于新的待测数据,重复步骤S01至S03,逐步优化目标检测网络,直至检测准确率达到要求;
S05)、利用步骤S04优化的目标检测网络实现海量数据的自动标注。
进一步的,步骤S02中,按照样本类别标记训练集。
进一步的,Depthwise与Pointwise组合卷积层对输入数据先执行Depthwise卷积计算,然后再执行Pointwise卷积计算。
本发明的有益效果:本发明基于深度学习的智能标注方法可以代替人力实现对图像数据的自动检测及自动标注。只需要少量的人工标注数据及人工纠错,即可完成模型的迭代优化,极大的提高模型标注的准确率,从而提高数据标注的速度及准确率。
附图说明
图1为MOGO目标检测网络架构的原理框图;
图2为实施例1所述方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行示例性说明。本实施例以本发明技术方案为前提进行实施,给出了实施方式,但本发明的保护范围不仅限于下述的实施例。
实施例1
本实施例公开一种基于目标检测网络的智能标注方法,基于轻量级的目标检测网络进行小样本数据的训练集多次迭代优化完成数据的智能标注工作。
在工业领域,目标检测模型网络结构复杂且层数多,少量的数据并不足以训练一个符合要求的目标检测模型,从而陷入死循环。因此本实施例设计一种轻量级的目标检测网络MOGO进行小样本数据的训练及多次迭代优化完成数据的智能标注工作。
目标检测网络MOGO的主要架构如图1所示,其优势在于目标检测网络的卷积层替换成Depthwise与Pointwise组合卷积层,目标检测网络的其他层保持不变。这样设计可以极大的减少网络参数,从而实现短时间内小批量数据的训练。假设输入数据维度为
Figure 369427DEST_PATH_IMAGE001
,则正常卷积参数量为
Figure DEST_PATH_IMAGE002
,Depthwise+Pointwise的组合卷积参数量为
Figure DEST_PATH_IMAGE003
由上述可知,网络结构的改变可以帮助我们利用小批量数据训练达到目标检测需求,因此,对于海量数据的标注工作,我们人工标注少量的数据进行MOGO模型的训练,按照样本类别标记,保证各类别数据量均衡,减少模型训练误差。利用训练后的模型对另一批新的数据进行数据检测和标注,对检测后的结果进行人工纠错和改正,然后对模型进行二次训练迭代优化,提高准确率。对剩余数据分批,重复上述步骤,直至模型准确率达到要求。此时便可以利用该目标检测模型实现海量数据的自动标注。
如图2所示,本实施例所述方法通过以下步骤实施:
1)、确定待标数据的类别,每一类别的数据进行少量的人工标注(>20张);
2)、利用1)标注的小批量数据初步训练一个目标检测模型;
3)、整理第二批小批量数据,利用2)训练的模型对其检测标注;
4)、对检测出来的结果进行人为干预纠正;
5)、利用纠正后的数据迭代优化2)中的模型;
6)、利用5)优化后的模型新的待测数据进行检测;
7)、重复1)~6)步骤,逐步优化目标检测模型,直至模型检测标注误差达到要求;
8)、利用最终模型对剩余数据完成标注工作,可以大大减少人力,提高速度。
本发明基于深度学习的智能标注方法可以代替人力实现对图像数据的自动检测及自动标注。只需要少量的人工标注数据及人工纠错,即可完成模型的迭代优化,极大的提高模型标注的准确率,从而提高数据标注的速度及准确率。
以上描述的仅是本发明的基本原理和优选实施例,本领域技术人员根据本发明做出的改进和替换,属于本发明的保护范围。

Claims (3)

1.一种基于目标检测网络的智能标注方法,其特征在于:包括以下步骤:
S01)、将目标检测网络的卷积层替换成Depthwise与Pointwise组合卷积层,目标检测网络的其他层保持不变;
S02)、人工标注训练集,将标注后的训练集输入目标检测网络并进行训练;
S03)、利用训练后的目标检测网络对另一批新的数据进行数据检测和标注,对目标检测网络输出的结果进行人工纠错和改正,然后利用纠错、改正后的数据对训练后的目标检测网络进行迭代优化;
S04)、基于新的待测数据,重复步骤S01至S03,逐步优化目标检测网络,直至检测准确率达到要求;
S05)、利用步骤S04优化的目标检测网络实现海量数据的自动标注。
2.根据权利要求1所述的基于目标检测网络的智能标注方法,其特征在于:步骤S02中,按照样本类别标记训练集。
3.根据权利要求1所述的基于目标检测网络的智能标注方法,其特征在于:Depthwise与Pointwise组合卷积层对输入数据先执行Depthwise卷积计算,然后再执行Pointwise卷积计算。
CN202011024865.3A 2020-09-25 2020-09-25 一种基于目标检测网络的智能标注方法 Pending CN112149742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024865.3A CN112149742A (zh) 2020-09-25 2020-09-25 一种基于目标检测网络的智能标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024865.3A CN112149742A (zh) 2020-09-25 2020-09-25 一种基于目标检测网络的智能标注方法

Publications (1)

Publication Number Publication Date
CN112149742A true CN112149742A (zh) 2020-12-29

Family

ID=73897193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024865.3A Pending CN112149742A (zh) 2020-09-25 2020-09-25 一种基于目标检测网络的智能标注方法

Country Status (1)

Country Link
CN (1) CN112149742A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113380384A (zh) * 2021-05-01 2021-09-10 首都医科大学宣武医院 人机协同训练医学影像标注模型的方法、标注方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3514733A1 (en) * 2018-01-18 2019-07-24 Aptiv Technologies Limited A device and a method for image classification using a convolutional neural network
CN110751214A (zh) * 2019-10-21 2020-02-04 山东大学 一种基于轻量级可变形卷积的目标检测方法及系统
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111652102A (zh) * 2020-05-27 2020-09-11 国网山东省电力公司东营供电公司 一种输电通道目标物辨识方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3514733A1 (en) * 2018-01-18 2019-07-24 Aptiv Technologies Limited A device and a method for image classification using a convolutional neural network
CN110751214A (zh) * 2019-10-21 2020-02-04 山东大学 一种基于轻量级可变形卷积的目标检测方法及系统
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
CN111652102A (zh) * 2020-05-27 2020-09-11 国网山东省电力公司东营供电公司 一种输电通道目标物辨识方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毕娅: "《湖北省城乡食品冷链物流系统需求预测理论、实践与创新》", 31 March 2016 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113380384A (zh) * 2021-05-01 2021-09-10 首都医科大学宣武医院 人机协同训练医学影像标注模型的方法、标注方法及系统

Similar Documents

Publication Publication Date Title
CN110991435A (zh) 一种基于深度学习的快递运单关键信息定位方法和装置
CN111626279B (zh) 一种负样本标注训练方法及高度自动化的票据识别方法
CN112115993B (zh) 一种基于元学习的零样本和小样本证件照异常检测方法
CN110648310A (zh) 基于注意力机制的弱监督铸件缺陷识别方法
CN113379399B (zh) 一种基于状态转移概率模型的rpa组件推荐方法
CN116090360B (zh) 一种基于多模态实体对齐的rpa流程推荐方法
CN104616104A (zh) 船用柴油机零件快速编码管理系统及管理方法
CN112149742A (zh) 一种基于目标检测网络的智能标注方法
CN101424919A (zh) 半导体制造系统的重调度决策系统
CN109291657A (zh) 基于卷积神经网络航天结构件工业物联标识激光打码系统
CN112989881A (zh) 一种无监督可迁移的3d视觉物体抓取方法
CN111091534A (zh) 一种基于目标检测的pcb板缺陷检测与定位方法
CN117993282A (zh) 一种面向智能制造故障诊断的域适应性信息瓶颈联邦学习方法
CN111126173B (zh) 一种高精度人脸检测方法
CN112164040A (zh) 基于半监督深度学习算法的钢铁表面缺陷识别方法
CN110705650A (zh) 一种基于深度学习的钣金布局方法
CN116630624A (zh) 光伏板图像分割方法及其模型的训练方法、装置
CN114372181B (zh) 一种基于多模态数据的设备生产智能规划方法
CN116089812A (zh) 基于半监督对抗域泛化智能模型的故障诊断方法
CN112184691B (zh) 一种基于不良Map图的缺陷模式分析方法
CN109214414B (zh) 面向人脸识别的多任务正半定约束度量学习方法
CN111178425B (zh) 一种基于卷积神经网络的大型高速回转装备面型分类方法
CN115019084B (zh) 一种基于张量多属性特征迁移的分类方法
CN117892203B (zh) 一种缺陷齿轮分类方法、装置及计算机可读存储介质
CN116229063B (zh) 基于类别色彩化技术的语义分割网络模型及其训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201229