CN112800257A - 一种基于以图搜图快速添加样本训练数据的方法 - Google Patents

一种基于以图搜图快速添加样本训练数据的方法 Download PDF

Info

Publication number
CN112800257A
CN112800257A CN202110184877.0A CN202110184877A CN112800257A CN 112800257 A CN112800257 A CN 112800257A CN 202110184877 A CN202110184877 A CN 202110184877A CN 112800257 A CN112800257 A CN 112800257A
Authority
CN
China
Prior art keywords
model
target
training
graph
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110184877.0A
Other languages
English (en)
Inventor
周珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lingmou Intelligent Technology Co ltd
Original Assignee
Shanghai Lingmou Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lingmou Intelligent Technology Co ltd filed Critical Shanghai Lingmou Intelligent Technology Co ltd
Priority to CN202110184877.0A priority Critical patent/CN112800257A/zh
Publication of CN112800257A publication Critical patent/CN112800257A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于以图搜图快速添加样本训练数据的方法,涉及计算机视觉领域,通过训练得到目标检测模型和度量模型,目标检测模型可以快速提供大量的搜索源,度量模型可以输出类间差值较小的特征张量,最后通过欧式距离的数值得到相同类别的数据。本发明结合深度学习本身补充少样本的分类数据,只需要训练一个目标检测能力强的深度学习模型和可学习目标对象相似度并输出可量化结果的模型,就可以快速的获得搜索源并通过以图搜图的方式快速获取到少样本的训练数据。

Description

一种基于以图搜图快速添加样本训练数据的方法
技术领域
本发明涉及计算机视觉领域,尤其涉及一种基于以图搜图快速添加样本训练数据的方法。
背景技术
随着科技的进步,人工智能技术在日常生活中有着越来越广泛的应用,其中人工智能的实现又来源于深度学习算法在不断地创新及优化,而深度学习算法必然又离不开足够的训练数据集,因此很多训练数据生产的方法应运而生。
在图像识别模型的训练过程中,有不少采用先检出后分类的两段式实现,训练样本一般都是采用原图中得到的所有标注数据。这样得到的数据经常会存在样本不均衡的情况,这对分类模型训练的效果有很大的影响,这种情况对模型最好的解决办法就是补充样本少的训练数据。目前补充少样本数据方式首先就是补充包含该样本的原始图片,然后,基于原图片进行标注补充少样本的训练数据。但是,无论是补充包含少样本的原图,还是对原图的标注都会耗费大量的人力和物力。
因此,本领域的技术人员致力于开发一种基于以图搜图快速添加样本训练数据的方法。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何在大量数据中快速获取样本的训练数据类别。
为实现上述目的,本发明提供了一种基于以图搜图快速添加样本训练数据的方法,所述方法包括以下步骤:
步骤1、训练得到目标检测模型和度量模型;
步骤2、通过目标检测模型快速提供搜索源;
步骤3、通过度量模型输出特征张量;
步骤4、通过欧式距离的数值得到相同类别的数据。
进一步地,将原图通过目标检测算法预测得到目标对象切图作为待搜索源。
进一步地,所述方法的步骤1还包括:
步骤1.1、对原图进行目标对象标注,得到每个目标对象的外框,并标注其所属分类类别;
步骤1.2、将标绘的原图作为目标检测算法YOLOv3的训练数据,最终迭代训练得到一个目标检测模型;
步骤1.3、将标注数据的切图作为度量学习模型的训练数据,最终迭代训练得到一个可学习相似度的模型。
进一步地,取用所述目标的boundingbox信息作为所述目标检测算法YOLOv3的训练数据训练得到一个通用的目标检出器。
进一步地,根据所述标注目标在原始图像中的boundingbox信息,将其从原始图像中切出来,并结合标注类别对其进行分类,制作成分类数据集。
进一步地,将所述分类数据集作为度量学习网络的训练数据进行训练,利用验证集检验训练的模型效果,若效果达到预定需求,则停止模型训练,得到所述度量模型。
进一步地,所述方法的步骤3还包括:
步骤3.1、通过度量模型提取待搜索源中切图的特征;
步骤3.2、搜集提供待搜图的种子图;
步骤3.3、通过度量模型提取种子图特征。
进一步地,所述方法的步骤4还包括:
步骤4.1、将种子图特征与源特征进行一一计算欧式距离,并排序;
步骤4.2、将与种子图最近的1000张图片取出;
步骤4.3、挑出1000张图片中的杂质即可得到纯净的分类数据。
进一步地,所述目标检测算法为SDD系列。
进一步地,所述目标检测算法为Faster-RCNN。
技术效果:
结合深度学习本身补充少样本的分类数据,只需要训练一个目标检测能力强的深度学习模型和可学习目标对象相似度并输出可量化结果的模型,就可以快速的获得搜索源并通过以图搜图的方式快速获取到少样本的训练数据。
以下将对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
具体实施方式
以下介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
本发明通过以图搜图的方式快速获取目标识别模型需要的某个类别的训练数据,该发明主要应用到了目标检测和度量学习两种模型。
首先,要随机选取一批足够训练出两个模型的原始图片进行目标标注。然后,取用目标的boundingbox信息作为YOLOv3目标检测算法的训练数据训练得到一个通用的目标检出器。再根据标注目标在原始图像中的boundingbox信息,将其从原始图像中切出来,并结合标注类别对其进行分类,制作成分类数据集,将该数据作为度量学习网络的训练数据进行训练,利用验证集检验训练的模型效果,若效果达到预定需求,则停止模型训练,得到度量模型。
在图像目标识别模型的实际使用过程中,会发现有的类别的数据比较少,就可以把这些少样本的数据作为搜图的种子图片。想要快速补充这些少样本数据,首先用训练好的检出器将同源的一批原图将目标全部检出作为搜图的搜索源,并送入度量模型提取其特征。然后,通过以图搜图补充数据,将少样本种子图提取特征,并与搜索源特征一一进行欧式距离计算及排序,得到与其特征距离最近的一批数据,取出需要数量的前n张切图,最后将这批切图中的杂质清洗出去即可得到纯净的少样本数据。
本发明所使用的目标检测算法是YOLOv3,也可以采用其他目标检测算法进行替代,比如SSD系列、Faster-RCNN等目标检测网络。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于以图搜图快速添加样本训练数据的方法,其特征在于,所述方法包括以下步骤:
步骤1、训练得到目标检测模型和度量模型;
步骤2、通过目标检测模型快速提供搜索源;
步骤3、通过度量模型输出特征张量;
步骤4、通过欧式距离的数值得到相同类别的数据。
2.如权利要求1所述的方法,其特征在于,将原图通过目标检测算法预测得到目标对象切图作为待搜索源。
3.如权利要求1所述的方法,其特征在于,所述方法的步骤1还包括:
步骤1.1、对原图进行目标对象标注,得到每个目标对象的外框,并标注其所属分类类别;
步骤1.2、将标绘的原图作为目标检测算法YOLOv3的训练数据,最终迭代训练得到一个目标检测模型;
步骤1.3、将标注数据的切图作为度量学习模型的训练数据,最终迭代训练得到一个可学习相似度的模型。
4.如权利要求3所述的方法,其特征在于,取用所述目标的boundingbox信息作为所述目标检测算法YOLOv3的训练数据训练得到一个通用的目标检出器。
5.如权利要求3所述的方法,其特征在于,根据所述标注目标在原始图像中的boundingbox信息,将其从原始图像中切出来,并结合标注类别对其进行分类,制作成分类数据集。
6.如权利要求5所述的方法,其特征在于,将所述分类数据集作为度量学习网络的训练数据进行训练,利用验证集检验训练的模型效果,若效果达到预定需求,则停止模型训练,得到所述度量模型。
7.如权利要求1所述的方法,其特征在于,所述方法的步骤3还包括:
步骤3.1、通过度量模型提取待搜索源中切图的特征;
步骤3.2、搜集提供待搜图的种子图;
步骤3.3、通过度量模型提取种子图特征。
8.如权利要求1所述的方法,其特征在于,所述方法的步骤4还包括:
步骤4.1、将种子图特征与源特征进行一一计算欧式距离,并排序;
步骤4.2、将与种子图最近的1000张图片取出;
步骤4.3、挑出1000张图片中的杂质即可得到纯净的分类数据。
9.如权利要求3所述的方法,其特征在于,所述目标检测算法为SDD系列。
10.如权利要求3所述的方法,其特征在于,所述目标检测算法为Faster-RCNN。
CN202110184877.0A 2021-02-10 2021-02-10 一种基于以图搜图快速添加样本训练数据的方法 Pending CN112800257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110184877.0A CN112800257A (zh) 2021-02-10 2021-02-10 一种基于以图搜图快速添加样本训练数据的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110184877.0A CN112800257A (zh) 2021-02-10 2021-02-10 一种基于以图搜图快速添加样本训练数据的方法

Publications (1)

Publication Number Publication Date
CN112800257A true CN112800257A (zh) 2021-05-14

Family

ID=75815084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110184877.0A Pending CN112800257A (zh) 2021-02-10 2021-02-10 一种基于以图搜图快速添加样本训练数据的方法

Country Status (1)

Country Link
CN (1) CN112800257A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110135400A (zh) * 2019-05-30 2019-08-16 杭州视在科技有限公司 一种基于度量学习的餐饮场景违规识别方法
CN111191732A (zh) * 2020-01-03 2020-05-22 天津大学 一种基于全自动学习的目标检测方法
CN111476292A (zh) * 2020-04-03 2020-07-31 北京全景德康医学影像诊断中心有限公司 医学图像分类处理人工智能的小样本元学习训练方法
CN111652216A (zh) * 2020-06-03 2020-09-11 北京工商大学 基于度量学习的多尺度目标检测模型方法
CN111783590A (zh) * 2020-06-24 2020-10-16 西北工业大学 一种基于度量学习的多类别小目标检测方法
CN112115906A (zh) * 2020-09-25 2020-12-22 广州市派客朴食信息科技有限责任公司 基于深度学习目标检测和度量学习的开放性菜品识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110135400A (zh) * 2019-05-30 2019-08-16 杭州视在科技有限公司 一种基于度量学习的餐饮场景违规识别方法
CN111191732A (zh) * 2020-01-03 2020-05-22 天津大学 一种基于全自动学习的目标检测方法
CN111476292A (zh) * 2020-04-03 2020-07-31 北京全景德康医学影像诊断中心有限公司 医学图像分类处理人工智能的小样本元学习训练方法
CN111652216A (zh) * 2020-06-03 2020-09-11 北京工商大学 基于度量学习的多尺度目标检测模型方法
CN111783590A (zh) * 2020-06-24 2020-10-16 西北工业大学 一种基于度量学习的多类别小目标检测方法
CN112115906A (zh) * 2020-09-25 2020-12-22 广州市派客朴食信息科技有限责任公司 基于深度学习目标检测和度量学习的开放性菜品识别方法

Similar Documents

Publication Publication Date Title
Li et al. Localizing and quantifying damage in social media images
CN107133569B (zh) 基于泛化多标记学习的监控视频多粒度标注方法
US20200043171A1 (en) Counting objects in images based on approximate locations
CN110222582B (zh) 一种图像处理方法和相机
Gómez et al. Cutting Sayre's Knot: reading scene text without segmentation. application to utility meters
Rejeb Sfar et al. Vantage feature frames for fine-grained categorization
CN111090763A (zh) 一种图片自动标签方法及装置
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN111310826A (zh) 样本集的标注异常检测方法、装置及电子设备
CN116596875B (zh) 晶圆缺陷检测方法、装置、电子设备及存储介质
Yasmeen et al. Citrus diseases recognition using deep improved genetic algorithm
CN115115825B (zh) 图像中的对象检测方法、装置、计算机设备和存储介质
CN111985333A (zh) 一种基于图结构信息交互增强的行为检测方法及电子装置
Burkapalli et al. TRANSFER LEARNING: INCEPTION-V3 BASED CUSTOM CLASSIFICATION APPROACH FOR FOOD IMAGES.
Ghanmi et al. Table detection in handwritten chemistry documents using conditional random fields
Singhal et al. Image classification using bag of visual words model with FAST and FREAK
JP2023130409A (ja) 情報処理装置、情報処理方法及びプログラム
EP3716104A1 (en) Extracting named entities based using document structure
CN112800257A (zh) 一种基于以图搜图快速添加样本训练数据的方法
Liu Interfruit: deep learning network for classifying fruit images
CN110633466B (zh) 基于语义分析的短信犯罪识别方法、系统和可读存储介质
Sinkevicius et al. Organic Shapes Classification by Similarity to Basic Geometric Shapes
Bhanbhro et al. Symbol Detection in a Multi-class Dataset Based on Single Line Diagrams using Deep Learning Models
Manoj Detection of Plant Disease Using Deep Learning Techniques
Xia et al. Multiple instance learning for automatic image annotation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210514