CN110070548B - 一种深度学习训练样本优化方法 - Google Patents

一种深度学习训练样本优化方法 Download PDF

Info

Publication number
CN110070548B
CN110070548B CN201910324389.8A CN201910324389A CN110070548B CN 110070548 B CN110070548 B CN 110070548B CN 201910324389 A CN201910324389 A CN 201910324389A CN 110070548 B CN110070548 B CN 110070548B
Authority
CN
China
Prior art keywords
image
original
contour element
original sub
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910324389.8A
Other languages
English (en)
Other versions
CN110070548A (zh
Inventor
杨勇
黄淑英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201910324389.8A priority Critical patent/CN110070548B/zh
Publication of CN110070548A publication Critical patent/CN110070548A/zh
Application granted granted Critical
Publication of CN110070548B publication Critical patent/CN110070548B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20201Motion blur correction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种深度学习训练样本优化方法,包括以下步骤:绘制出原始图像的轮廓元素标注信息、将原始图像的轮廓元素标注信息进行剥离、生成单一轮廓元素原始子图像和重叠轮廓元素原始子图像、图像增强处理、边缘检测处理,得到边缘单一轮廓元素原始子图像和边缘重叠轮廓元素原始子图像以及池化处理和图像分割处理;本发明通过进行图像增强处理可以保证原始图像具有较高的图像质量,为后序优化处理提高稳定的基础,通过对图像增强处理后图像分别进行边缘检测处理,能消除深度学习训练样本的原始图像中的样本元素边界误差,可以提高图像质量以及训练样本的生成效率,有效缩短深度学习训练样本的训练时间。

Description

一种深度学习训练样本优化方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种深度学习训练样本优化方法。
背景技术
在很多应用场景中,为实现物体检测精准性,利用深度学习模型进行训练时,深度学习模型需要对大量且具有高质量的输入数据集进行学习训练,这个数据集一般足够大、具有代表性以及拥有相对清楚的标签,但是深度学习具有较强的学习能力或拟合能力,网络模型越复杂,其能力越强,也就需要更多的训练数据,否则容易产生过拟合的现象。
目前,深度学习训练样本优化方法中原始图像中的样本元素边界误差较大,导致深度学习训练样本的生成效率和质量都受到影响,同时用于深度学习训练样本的原始图像本身存在的一些缺陷会导致训练结果不够准确稳定,深度学习的训练样本训练结果也会随之不稳定,因此,本发明提出一种深度学习训练样本优化方法,以解决现有技术中的不足之处。
发明内容
针对上述问题,本发明通过进行图像增强处理可以保证原始图像具有较高的图像质量,为后序优化处理提高稳定的基础,通过对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,能消除深度学习训练样本的原始图像中的样本元素边界误差,可以提高图像质量以及训练样本的生成效率,有效缩短深度学习训练样本的训练时间。
本发明提出一种深度学习训练样本优化方法,包括以下步骤:
步骤一:获取两组相同的深度学习训练样本的原始图像,然后将其中一组深度学习训练样本的原始图像利用findContours函数寻找出原始图像中的轮廓,然后根据寻找出的原始图像中的轮廓,利用drawContours函数绘制出原始图像的轮廓元素标注信息;
步骤二:将原始图像的轮廓元素标注信息进行剥离,剥离出原始图像的单一轮廓元素标注信息和原始图像的重叠轮廓元素标注信息;
步骤三:根据训练样本的原始图像的单一轮廓元素标注信息和训练样本的原始图像的重叠轮廓元素标注信息,进行逆向处理,生成基于原始图像的轮廓元素标注信息的单一轮廓元素原始子图像和重叠轮廓元素原始子图像;
步骤四:对单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行图像增强处理;
步骤五:对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,标识出单一轮廓元素原始子图像和重叠轮廓元素原始子图像中亮度变化明显的像素点,分别得到边缘单一轮廓元素原始子图像和边缘重叠轮廓元素原始子图像;
步骤六:对边缘单一轮廓元素原始子图像进行池化处理,对边缘重叠轮廓元素原始子图像进行图像分割处理,分别得到优化后的边缘单一轮廓元素原始子图像和优化后的单一轮廓元素原始子图像边缘重叠轮廓元素原始子图像。
进一步改进在于:所述步骤一中利用findContours函数寻找出原始图像中的轮廓具体过程为:首先输入一组深度学习训练样本的原始图像,加载原始图像转化为二值化图像,再利用函数创建出二值图像,然后检测二值图像轮廓,然后输出二值图像轮廓的拓扑信息。
进一步改进在于:所述步骤四中图像增强处理包括对单一轮廓元素原始子图像和重叠轮廓元素原始子图像进行基于小波阈值的图像降噪处理、增广处理和锐化处理。
进一步改进在于:所述步骤四中基于小波阈值的图像降噪处理具体过程为:先将单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行分层处理,分为高频图层和低频图层,再分别对高频图层和低频图层基于小波变换的降噪处理,然后选择阈值以及进行阈值量化,最后利用多尺度二维小波重构高频图层和低频图层的图象信号。
进一步改进在于:所述步骤四中增广处理包括进行高斯模糊、改变亮度和对比度、仿射变换、透视变和动态模糊处理、图像变换、图像裁剪、色彩抖动以及噪声扰动处理。
进一步改进在于:所述步骤四中锐化处理时,分别对输入的单一轮廓元素原始子图像和重叠轮廓元素原始子图像的各个波段采用高通滤波的方式进行锐化。
进一步改进在于:所述步骤六中边缘单一轮廓元素原始子图像的池化处理时,首先定义池化窗口的大小,然后选边缘单一轮廓元素原始子图像区域中的最大值作为该区域池化后的值,然后对边缘单一轮廓元素原始子图像所有区域进行最大池化操作。
进一步改进在于:所述步骤六中重叠轮廓元素原始子图像进行图像分割处理时采用K均值聚类算法进行图像分割。
本发明的有益效果为:通过进行图像增强处理可以保证原始图像具有较高的图像质量,为后序优化处理提高稳定的基础,通过对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,可以标识出单一轮廓元素原始子图像和重叠轮廓元素原始子图像中亮度变化明显的像素点,能消除深度学习训练样本的原始图像中的样本元素边界误差,可以提高图像质量以及训练样本的生成效率,有效缩短深度学习训练样本的训练时间,通过池化处理和图像分割处理可以减少图像中的像素信息,只保留重要信息,消除无效像素对训练样本元素的遮挡影响,可以提高深度学习训练样本的质量。
附图说明
图1为本发明流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1所示,本实施例提出一种深度学习训练样本优化方法,其特征在于,包括以下步骤:
步骤一:获取两组相同的深度学习训练样本的原始图像,然后将其中一组深度学习训练样本的原始图像利用findContours函数寻找出原始图像中的轮廓,利用findContours函数寻找出原始图像中的轮廓具体过程为:首先输入一组深度学习训练样本的原始图像,加载原始图像转化为二值化图像,再利用函数创建出二值图像,然后检测二值图像轮廓,然后输出二值图像轮廓的拓扑信息,然后根据寻找出的原始图像中的轮廓,利用drawContours函数绘制出原始图像的轮廓元素标注信息;
步骤二:将原始图像的轮廓元素标注信息进行剥离,剥离出原始图像的单一轮廓元素标注信息和原始图像的重叠轮廓元素标注信息;
步骤三:根据训练样本的原始图像的单一轮廓元素标注信息和训练样本的原始图像的重叠轮廓元素标注信息,进行逆向处理,生成基于原始图像的轮廓元素标注信息的单一轮廓元素原始子图像和重叠轮廓元素原始子图像;
步骤四:对单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行图像增强处理,图像增强处理包括对单一轮廓元素原始子图像和重叠轮廓元素原始子图像进行基于小波阈值的图像降噪处理、增广处理和锐化处理,基于小波阈值的图像降噪处理具体过程为:先将单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行分层处理,分为高频图层和低频图层,再分别对高频图层和低频图层基于小波变换的降噪处理,然后选择阈值以及进行阈值量化,最后利用多尺度二维小波重构高频图层和低频图层的图象信号,增广处理包括进行高斯模糊、改变亮度和对比度、仿射变换、透视变和动态模糊处理、图像变换、图像裁剪、色彩抖动以及噪声扰动处理,锐化处理时,分别对输入的单一轮廓元素原始子图像和重叠轮廓元素原始子图像的各个波段采用高通滤波的方式进行锐化;
步骤五:对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,标识出单一轮廓元素原始子图像和重叠轮廓元素原始子图像中亮度变化明显的像素点,分别得到边缘单一轮廓元素原始子图像和边缘重叠轮廓元素原始子图像;
步骤六:对边缘单一轮廓元素原始子图像进行池化处理,边缘单一轮廓元素原始子图像的池化处理时,首先定义池化窗口的大小,然后选边缘单一轮廓元素原始子图像区域中的最大值作为该区域池化后的值,然后对边缘单一轮廓元素原始子图像所有区域进行最大池化操作,再对边缘重叠轮廓元素原始子图像进行图像分割处理,重叠轮廓元素原始子图像进行图像分割处理时采用K均值聚类算法进行图像分割,分别得到优化后的边缘单一轮廓元素原始子图像和优化后的单一轮廓元素原始子图像边缘重叠轮廓元素原始子图像。
通过进行图像增强处理可以保证原始图像具有较高的图像质量,为后序优化处理提高稳定的基础,通过对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,可以标识出单一轮廓元素原始子图像和重叠轮廓元素原始子图像中亮度变化明显的像素点,能消除深度学习训练样本的原始图像中的样本元素边界误差,可以提高图像质量以及训练样本的生成效率,有效缩短深度学习训练样本的训练时间,通过池化处理和图像分割处理可以减少图像中的像素信息,只保留重要信息,消除无效像素对训练样本元素的遮挡影响,可以提高深度学习训练样本的质量。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种深度学习训练样本优化方法,其特征在于,包括以下步骤:
步骤一:获取两组相同的深度学习训练样本的原始图像,然后将其中一组深度学习训练样本的原始图像利用findContours函数寻找出原始图像中的轮廓,然后根据寻找出的原始图像中的轮廓,利用drawContours函数绘制出原始图像的轮廓元素标注信息;
步骤二:将原始图像的轮廓元素标注信息进行剥离,剥离出原始图像的单一轮廓元素标注信息和原始图像的重叠轮廓元素标注信息;
步骤三:根据训练样本的原始图像的单一轮廓元素标注信息和训练样本的原始图像的重叠轮廓元素标注信息,进行逆向处理,生成基于原始图像的轮廓元素标注信息的单一轮廓元素原始子图像和重叠轮廓元素原始子图像;
步骤四:对单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行图像增强处理;
步骤五:对图像增强处理后的单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行边缘检测处理,标识出单一轮廓元素原始子图像和重叠轮廓元素原始子图像中亮度变化明显的像素点,分别得到边缘单一轮廓元素原始子图像和边缘重叠轮廓元素原始子图像;
步骤六:对边缘单一轮廓元素原始子图像进行池化处理,对边缘重叠轮廓元素原始子图像进行图像分割处理,分别得到优化后的边缘单一轮廓元素原始子图像和优化后的单一轮廓元素原始子图像边缘重叠轮廓元素原始子图像。
2.根据权利要求1所述的一种深度学习训练样本优化方法,其特征在于:所述步骤一中利用findContours函数寻找出原始图像中的轮廓具体过程为:首先输入一组深度学习训练样本的原始图像,加载原始图像转化为二值化图像,再利用findContours函数处理所述二值化图像,用于检测二值图像轮廓,然后输出二值图像轮廓的拓扑信息。
3.根据权利要求1所述的一种深度学习训练样本优化方法,其特征在于:所述步骤四中图像增强处理包括对单一轮廓元素原始子图像和重叠轮廓元素原始子图像进行基于小波阈值的图像降噪处理、增广处理和锐化处理。
4.根据权利要求3所述的一种深度学习训练样本优化方法,其特征在于:所述步骤四中基于小波阈值的图像降噪处理具体过程为:先将单一轮廓元素原始子图像和重叠轮廓元素原始子图像分别进行分层处理,分为高频图层和低频图层,再分别对高频图层和低频图层基于小波变换的降噪处理,然后选择阈值以及进行阈值量化,最后利用多尺度二维小波重构高频图层和低频图层的图像信号。
5.根据权利要求3所述的一种深度学习训练样本优化方法,其特征在于:所述步骤四中增广处理包括进行高斯模糊、改变亮度和对比度、仿射变换、透视变换和动态模糊处理、图像变换、图像裁剪、色彩抖动以及噪声扰动处理。
6.根据权利要求3所述的一种深度学习训练样本优化方法,其特征在于:所述步骤四中锐化处理时,分别对输入的单一轮廓元素原始子图像和重叠轮廓元素原始子图像的各个波段采用高通滤波的方式进行锐化。
7.根据权利要求1所述的一种深度学习训练样本优化方法,其特征在于:所述步骤六中边缘单一轮廓元素原始子图像的池化处理时,首先定义池化窗口的大小,然后选边缘单一轮廓元素原始子图像区域中的最大值作为该区域池化后的值,然后对边缘单一轮廓元素原始子图像所有区域进行最大池化操作。
8.根据权利要求1所述的一种深度学习训练样本优化方法,其特征在于:所述步骤六中重叠轮廓元素原始子图像进行图像分割处理时采用K均值聚类算法进行图像分割。
CN201910324389.8A 2019-04-22 2019-04-22 一种深度学习训练样本优化方法 Expired - Fee Related CN110070548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910324389.8A CN110070548B (zh) 2019-04-22 2019-04-22 一种深度学习训练样本优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910324389.8A CN110070548B (zh) 2019-04-22 2019-04-22 一种深度学习训练样本优化方法

Publications (2)

Publication Number Publication Date
CN110070548A CN110070548A (zh) 2019-07-30
CN110070548B true CN110070548B (zh) 2020-11-24

Family

ID=67368462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910324389.8A Expired - Fee Related CN110070548B (zh) 2019-04-22 2019-04-22 一种深度学习训练样本优化方法

Country Status (1)

Country Link
CN (1) CN110070548B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110390322B (zh) * 2019-08-28 2020-05-05 南京林业大学 一种用于深度学习的籽棉地膜高光谱可视化标签方法
CN111210421B (zh) * 2020-01-10 2023-12-01 苏州杰锐思智能科技股份有限公司 锂电池表面缺陷图像批量生成方法及系统
CN111259968A (zh) * 2020-01-17 2020-06-09 腾讯科技(深圳)有限公司 非法图像识别方法、装置、设备和计算机可读存储介质
CN112102338A (zh) * 2020-09-17 2020-12-18 西安泽塔云科技股份有限公司 基于深度学习的影像样本数据的获取方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9292933B2 (en) * 2011-01-10 2016-03-22 Anant Madabhushi Method and apparatus for shape based deformable segmentation of multiple overlapping objects
CN106227851B (zh) * 2016-07-29 2019-10-01 汤一平 基于深度卷积神经网络的分层深度搜索的图像检索方法
CN106682693A (zh) * 2016-12-23 2017-05-17 浙江大学 一种用于塑料瓶瓶身重叠图像的识别方法
US10204422B2 (en) * 2017-01-23 2019-02-12 Intel Corporation Generating three dimensional models using single two dimensional images
CN107038446B (zh) * 2017-03-23 2020-06-05 中国计量大学 一种主动照明下基于重叠边缘检测的夜间双果重叠番茄识别方法
CN107256406B (zh) * 2017-04-19 2020-05-01 深圳清华大学研究院 重叠纤维图像分割方法、装置、存储介质和计算机设备
CN107403436B (zh) * 2017-06-26 2021-03-23 中山大学 一种基于深度图像的人物轮廓快速检测与跟踪方法
CN108573495B (zh) * 2018-03-13 2020-06-12 上海交通大学 基于轮廓信息多尺度分析的稻穗粒无损计数方法与系统
CN108520524A (zh) * 2018-04-10 2018-09-11 深圳市唯特视科技有限公司 一种基于边缘聚类的图像迭代过度分割方法

Also Published As

Publication number Publication date
CN110070548A (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN110070548B (zh) 一种深度学习训练样本优化方法
CN111709420B (zh) 文本检测方法、电子设备及计算机可读介质
JP5521164B2 (ja) 連続して存在する英数字を識別するための画像処理システムおよびその方法
CN112614062B (zh) 菌落计数方法、装置及计算机存储介质
CN107516316B (zh) 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法
CN111652218A (zh) 文本检测方法、电子设备及计算机可读介质
CN111145209A (zh) 一种医学图像分割方法、装置、设备及存储介质
CN111310508B (zh) 一种二维码识别方法
CN110570440A (zh) 一种基于深度学习边缘检测的图像自动分割方法及装置
CN113888536B (zh) 一种基于计算机视觉的印刷品重影检测方法及系统
Chen et al. A blind CNN denoising model for random-valued impulse noise
Li et al. A salt & pepper noise filter based on local and global image information
CN111652233A (zh) 一种针对复杂背景的文本验证码自动识别方法
CN112991536B (zh) 一种专题地图地理面要素自动提取和矢量化方法
CN112149535A (zh) 一种结合SegNet和U-Net的车道线检测方法和装置
CN113159045A (zh) 一种结合图像预处理与卷积神经网络的验证码识别方法
CN111507337A (zh) 基于混合神经网络的车牌识别方法
CN115587966A (zh) 一种在光照不均匀条件下零件有无缺漏的检测方法及系统
CN113421210B (zh) 一种基于双目立体视觉的表面点云重建方法
CN104102911A (zh) 一种基于aoi的子弹表观缺陷检测系统的图像处理算法
CN109241865B (zh) 一种弱对比度交通场景下的车辆检测分割算法
Liang et al. Robust table recognition for printed document images
CN113450355A (zh) 一种基于多膜态ct图像和3dcnn网络提取图像特征的方法
CN111898531A (zh) 卫星通信信号识别方法、装置及电子设备
Soumya et al. Enhancement and segmentation of historical records

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201124

CF01 Termination of patent right due to non-payment of annual fee