CN113408575B - 一种基于判别性区域定位的图像数据增广方法 - Google Patents

一种基于判别性区域定位的图像数据增广方法 Download PDF

Info

Publication number
CN113408575B
CN113408575B CN202110517024.4A CN202110517024A CN113408575B CN 113408575 B CN113408575 B CN 113408575B CN 202110517024 A CN202110517024 A CN 202110517024A CN 113408575 B CN113408575 B CN 113408575B
Authority
CN
China
Prior art keywords
discriminant
area
original image
sample
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110517024.4A
Other languages
English (en)
Other versions
CN113408575A (zh
Inventor
徐智
宁文昌
李智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN202110517024.4A priority Critical patent/CN113408575B/zh
Publication of CN113408575A publication Critical patent/CN113408575A/zh
Application granted granted Critical
Publication of CN113408575B publication Critical patent/CN113408575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于判别性区域定位的图像数据增广方法,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;数据增广操作包括两种,其中区域裁剪是通过在判别性区域中随机采样一个正方形区域,并基于所述正方形区域对原始图像进行裁剪;区域混合是随机取两张不同类别的图片,分别求出两张图片的判别性区域掩膜,再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合;每轮迭代都由原始图像生成增广样本,并与下一轮迭代的原始图像一起组成下一轮迭代的训练样本,直至训练结束。本发明可以解决传统方法生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。

Description

一种基于判别性区域定位的图像数据增广方法
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种基于判别性区域定位的图像数据增广方法。
背景技术
在图像分类问题中,数据增广是一种常用的正则化方法。在图像数据增广方法中,区域裁剪和区域混合是两种常用的增广操作,但在传统的方法中,这两种操作都是按预定的概率随机地对原始数据做变换,并不考虑数据本身的分布以及模型对数据的偏好,没有充分利用数据中的有用信息,限制了数据增广对模型性能的提升作用。具体地说,传统的区域裁剪是随机地从原始图像中裁剪出部分区域,但可能裁剪的区域没有包含足够的有效信息,此时裁剪得到的新样本相当于噪声样本,对模型性能的提升几乎没有帮助;而传统的区域混合则以CutMix为代表,是随机地从两张图片中取出两个互补区域进行混合,混合后的图片的类别标签也是由两张原始图片的类别标签通过混合得到的。CutMix没有考虑从两张原始图片中取出的区域是否包含足够的判别性信息,生成的样本可能会由于没有包含足够多的判别性信息而成为噪声样本。
发明内容
本发明的目的在于提供一种基于判别性区域定位的图像数据增广方法,解决生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
为实现上述目的,本发明提供了一种基于判别性区域定位的图像数据增广方法,包括以下步骤:
采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;
在所述判别性区域内随机采样一个正方形区域,并基于所述正方形区域对所述原始图像进行裁剪和缩放;
基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜,并将两种类别的所述图片的判别性区域和非判别性区域进行混合;
每轮迭代开始时都从训练集中选出多张图像作为原始图像,每轮迭代结束时则由所述原始图像生成若干增广样本;其中,每轮迭代的训练样本由上一轮迭代生成的增广样本和本轮迭代的所述原始图像组成;如此反复迭代直至满足训练结束条件。
其中,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域,包括:
采用CAM方法计算出所述原始图像真实类别的类激活图;
将所述类激活图上采样至与所述原始图像相同大小,然后将所述类激活图中的所有像素值归一化至[0,1]之间。
基于设定的阈值,将归一化后的所述类激活图中像素值大于所述阈值的区域作为判别性区域。
其中,采用CAM方法计算出所述原始图像真实类别的类激活图之前,所述方法还包括:
对获取的原始图像进行全局平均池化处理,得到降维向量。
其中,在所述判别性区域内随机采样一个正方形区域,并基于所述正方形区域对所述原始图像进行裁剪和缩放,包括:
在所述判别性区域中通过设定像素阈值来确定正方形中心点的范围;
基于判别性区域外接矩形的位置和大小以及所述正方形中心点的位置来确定所述正方形的边长范围;
基于所述正方形中心和所述边长范围,采用随机采样的方式对当前图像进行裁剪和缩放,得到对应的增广样本。
其中,基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜,并将两种类别的所述图片的判别性区域和非判别性区域进行混合,包括:
随机获取两张不同类别的图片并计算出对应的所述判别性区域,并基于所述判别性区域计算出对应的两个判别性区域掩膜;
将两个所述判别性区域掩膜取并集,并基于生成的混合掩膜对两张不同类别的图片的判别性区域和非判别性区域进行混合。
本发明的一种基于判别性区域定位的图像数据增广方法,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;数据增广操作包括两种,分别为区域裁剪和区域混合,其中区域裁剪是通过在判别性区域中随机采样一个正方形区域,并基于所述正方形区域对原始图像进行裁剪;区域混合是随机取两张不同类别的图片,分别求出两张图片的判别性区域掩膜,再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合;每轮迭代都由原始图像生成增广样本,并与下一轮迭代的原始图像一起组成下一轮迭代的训练样本,直至训练结束。本发明可以解决传统方法生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于判别性区域定位的图像数据增广方法的步骤示意图。
图2是本发明提供的判别性区域定位方法。
图3是本发明提供的区域裁剪方法示意图。
图4是本发明提供的区域混合方法示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
请参阅图1,本发明提供一种基于判别性区域定位的图像数据增广方法,包括以下步骤:
S101、采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域。
具体的,对于当前训练批次中的图片样本,首先利用CAM方法输出图片样本的真实类别的类激活图,再将类激活图上采样至原图大小,然后将类激活图所有像素值归一化到[0,1]之间,再设置一个阈值θ1,θ1是一个超参数,并将类激活图中像素值大于θ1的区域作为图片样本的判别性区域S,如图2所示,详细流程如下:
在图2中,GAP代表全局平均池化,并假设当前样本属于第j个类别。假设CNN网络最后一个卷积层输出的特征图是F={F1,F2,...,FC},其中,Fi∈RH×W,i∈[1,C],C、H和W分别代表特征图的通道数、特征图的高和宽,则全局平均池化的定义如下所示:
Figure BDA0003061957010000041
s.t.k∈{1,2,...,C}
进行全局平均池化后,特征图降维成向量,降维后向量为f∈RC×1×1,然后可以根据CAM方法求出当前图像真实类别的类激活图。得到类激活图后上采样至原图大小并将所有像素值归一化到[0,1]之间,最后设定一个阈值θ1∈[0,1],类激活图中像素值大于θ1的区域认为是判别性区域,记为S。
S102、在所述判别性区域内随机采样一个正方形区域,并基于所述正方形区域对所述原始图像进行裁剪和缩放。
具体的,获得图片的判别性区域S后,为了增加样本的多样性,本申请在进行区域裁剪时并不是直接把整个判别性区域S裁剪出来,而是从判别性区域S中随机裁剪出部分区域。在本发明中,裁剪的部分区域都是正方形区域,记为B。而为了保证裁剪出来的正方形区域B能够包含足够的判别性信息,本申请在判别性区域S中再设置一个像素阈值θ2,求出S中像素值大于θ2的区域,记为S',并规定正方形B的中心只能落在区域S'中。同时本申请对正方形B的边长进行限制,正方形B的边长范围通过判别性区域S的正外接矩形来确定,B的边长最大值以不超出判别性区域S的正外接矩形为准,同时设置超参数φ∈[0,1],将φ乘以S的正外接矩形的短边长得到B的边长最小值。确定正方形B的中心点范围和边长范围后,每次通过随机采样得到B,然后就可以从原图中裁剪出相应的区域,并缩放至原图大小作为一个新样本,新样本与原始样本拥有相同的类别标签。
如图3所示,得到判别性区域S后,区域裁剪每次会从S中裁剪一个正方形区域作为新样本,将该正方形区域记为B,B的中心点为(bx,by),边长为a,且(bx,by)和a都为均匀采样的随机数。为了保证裁剪的区域包含足够多的判别性区域,(bx,by)和a需要有一个合适的采样范围。所以再设置一个阈值θ2
θ2=θ1+λ(max(S)-θ1)
其中,λ∈[0,1],max(S)代表判别性区域中的最大像素值。在区域S中,将像素值大于θ2的区域记为S',(bx,by)的采样范围限定在S'中。接下来确定正方形B的边长a的范围,本发明将根据判别性区域S的大小来确定裁剪区域B的大小。首先求出S的正外接矩形,该矩形的左上角坐标记为(sx,sy),长和宽分别记为sw和sh,假设B的边长范围为[amin,amax],其中:
amax=2×min(bx-sx,by-sy,sx+sw-bx,sy+sh-by)
amin=min(amax,φ(min(sw,sh)))
其中,φ是一个超参数,且φ∈[0,1],amax的计算是为了保证B的范围落在判别性区域S的正外接矩形内,amin的计算则是为了保证amin≤amax,且amin与判别性区域S的大小相关。确定(bx,by)和a的范围之后,每次通过随机采样的方式得到正方形区域B,并从原始图像中裁剪出对应的区域,缩放至原图大小并作为一个增广样本,区域裁剪得到的增广样本与原样本拥有相同的类别标签。
S103、基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜,并将两种类别的所述图片的判别性区域和非判别性区域进行混合。
具体的,如图4所示,在当前训练批次内,随机取两张不同类别的图片,记为x1和x2,再分别计算两张图片的判别性区域S1和S2,并计算判别性区域S1和S2对应的掩膜,两张图片的判别性区域掩膜分别记为M1和M2,将两张掩膜取并集,得到两张图片判别性区域的混合掩膜M:
Figure BDA0003061957010000051
其中,(i,j)是图片的位置索引,然后根据以下公式生成增广样本:
Figure BDA0003061957010000052
Figure BDA0003061957010000061
其中,x′1是x1的增广样本,拥有与x1相同的标签,x'2是x2的增广样本,拥有与x2相同的标签。
从图4可以看出,本发明的区域混合方法每次会同时生成两个增广样本,且每个增广样本中只存在一个原始样本的判别性区域,增广样本的标签与判别性区域所属的原样本的类别标签相同,避免了区域混合后出现类别混淆的情况。
S104、每轮迭代开始时都从训练集中选出多张图像作为原始图像,每轮迭代结束时则由所述原始图像生成若干增广样本;其中,每轮迭代的训练样本由上一轮迭代生成的增广样本和本轮迭代的所述原始图像组成;如此反复迭代直至满足训练结束条件。
具体的,在卷积神经网络训练过程中,每一轮迭代结束后,都会进行上述3个步骤,生成一批增广样本,并将增广样本与原始样本一起作为下一轮迭代的训练样本。另外需要注意的是,每一轮迭代的增广样本都仅由原始样本产生,不会从上一轮的增广样本产生本轮的增广样本,其中,训练集为获取的所有的图像。
有益效果
本发明主要解决了传统图像数据增广方法中,生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题,有益效果主要包括以下两点:
(1)通过对判别性区域进行区域裁剪,可以排除其他与分类无关的区域的干扰,使模型更专注于学习判别性区域的特征,提升模型的分类效果。
(2)通过将一张图片的判别性区域和另一张不同类别的图片的非判别性区域进行区域混合,可以保证生成的新样本中只包含一个类别的判别性信息,避免生成的新样本成为噪声样本,同时可以丰富每个类别的背景变化,提高模型在复杂多变的场景中的特征提取能力。
本发明的一种基于判别性区域定位的图像数据增广方法,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;数据增广操作包括两种,分别为区域裁剪和区域混合,其中区域裁剪是通过在判别性区域中随机采样一个正方形区域,并基于所采样的正方形区域对原始图像进行裁剪;区域混合是随机取两张不同类别的图片,分别求出两张图片的判别性区域掩膜,再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合;将基于所述原始图像得到的增广样本与下一个所述原始图像作为下一轮迭代的训练样本生成对应的下一个所述增广样本,直至训练结束,其中,若当前迭代为第一次迭代训练,则根据获取的所述原始图像生成对应的增广样本,若当前迭代为满足结束训练时的迭代训练,则将当前迭代产生的增广样本进行输出,结束训练,本发明的数据增广方法可以提高卷积神经网络的图像分类效果,同时解决传统数据增广方法中生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (3)

1.一种基于判别性区域定位的图像数据增广方法,其特征在于,包括以下步骤:
采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域;
在所述判别性区域内随机采样一个正方形区域,并基于所述正方形区域对所述原始图像进行裁剪和缩放;
基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜,并将两种类别的所述图片的判别性区域和非判别性区域进行混合;
每轮迭代开始时都从训练集中选出多张图像作为原始图像,每轮迭代结束时则由所述原始图像生成若干增广样本;其中,每轮迭代的训练样本由上一轮迭代生成的增广样本和本轮迭代的所述原始图像组成;如此反复迭代直至满足训练结束条件;
在所述判别性区域内随机采样一个正方形区域,并基于所述正方形区域对所述原始图像进行裁剪和缩放,包括:
在所述判别性区域中通过设定像素阈值来确定正方形中心点的范围;
基于判别性区域外接矩形的位置和大小以及所述正方形中心点的位置来确定所述正方形的边长范围;
基于所述正方形中心和所述边长范围,采用随机采样的方式对当前图像进行裁剪和缩放,得到对应的增广样本;
基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜,并将两种类别的所述图片的判别性区域和非判别性区域进行混合,包括:
随机获取两张不同类别的图片并计算出对应的所述判别性区域,并基于所述判别性区域计算出对应的两个判别性区域掩膜;
将两个所述判别性区域掩膜取并集,并基于生成的混合掩膜对两张不同类别的图片的判别性区域和非判别性区域进行混合。
2.如权利要求1所述的基于判别性区域定位的图像数据增广方法,其特征在于,采用CAM方法计算原始图像的类激活图,并通过将所述类激活图上采样和取阈值来定位判别性区域,包括:
采用CAM方法计算出所述原始图像真实类别的类激活图;
将所述类激活图上采样至与所述原始图像相同大小,然后将所述类激活图中的所有像素值归一化至[0,1]之间;
基于设定的阈值,将归一化后的所述类激活图中像素值大于所述阈值的区域作为判别性区域。
3.如权利要求2所述的基于判别性区域定位的图像数据增广方法,其特征在于,采用CAM方法计算出所述原始图像真实类别的类激活图之前,所述方法还包括:
对获取的原始图像进行全局平均池化处理,得到降维向量。
CN202110517024.4A 2021-05-12 2021-05-12 一种基于判别性区域定位的图像数据增广方法 Active CN113408575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110517024.4A CN113408575B (zh) 2021-05-12 2021-05-12 一种基于判别性区域定位的图像数据增广方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110517024.4A CN113408575B (zh) 2021-05-12 2021-05-12 一种基于判别性区域定位的图像数据增广方法

Publications (2)

Publication Number Publication Date
CN113408575A CN113408575A (zh) 2021-09-17
CN113408575B true CN113408575B (zh) 2022-08-19

Family

ID=77678325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110517024.4A Active CN113408575B (zh) 2021-05-12 2021-05-12 一种基于判别性区域定位的图像数据增广方法

Country Status (1)

Country Link
CN (1) CN113408575B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110579354A (zh) * 2019-10-16 2019-12-17 西安交通大学 一种基于卷积神经网络的轴承检测方法
CN111798535A (zh) * 2020-09-09 2020-10-20 南京安科医疗科技有限公司 Ct图像增强显示方法及计算机可读存储介质
CN111832615A (zh) * 2020-06-04 2020-10-27 中国科学院空天信息创新研究院 一种基于前景背景特征融合的样本扩充方法及系统
EP3772038A1 (en) * 2019-07-29 2021-02-03 Cal-Comp Big Data Inc Augmented reality display method of simulated lip makeup
CN112381148A (zh) * 2020-11-17 2021-02-19 华南理工大学 一种基于随机区域插值的半监督图像分类方法
CN112613575A (zh) * 2020-12-30 2021-04-06 清华大学 一种图像分类模型的数据集扩充方法、训练方法及装置
CN112633392A (zh) * 2020-12-29 2021-04-09 博微太赫兹信息科技有限公司 一种太赫兹人体安检图像目标检测模型训练数据增广方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10019655B2 (en) * 2016-08-31 2018-07-10 Adobe Systems Incorporated Deep-learning network architecture for object detection
CN109410204B (zh) * 2018-10-31 2022-04-15 电子科技大学 一种基于cam的皮质白内障图像处理及增强方法
CN110353675B (zh) * 2019-08-14 2022-06-28 东南大学 基于图片生成的脑电信号情感识别方法及装置
CN112712122A (zh) * 2020-12-31 2021-04-27 杭州电子科技大学 基于神经网络模型的角膜溃疡的分类检测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3772038A1 (en) * 2019-07-29 2021-02-03 Cal-Comp Big Data Inc Augmented reality display method of simulated lip makeup
CN110579354A (zh) * 2019-10-16 2019-12-17 西安交通大学 一种基于卷积神经网络的轴承检测方法
CN111832615A (zh) * 2020-06-04 2020-10-27 中国科学院空天信息创新研究院 一种基于前景背景特征融合的样本扩充方法及系统
CN111798535A (zh) * 2020-09-09 2020-10-20 南京安科医疗科技有限公司 Ct图像增强显示方法及计算机可读存储介质
CN112381148A (zh) * 2020-11-17 2021-02-19 华南理工大学 一种基于随机区域插值的半监督图像分类方法
CN112633392A (zh) * 2020-12-29 2021-04-09 博微太赫兹信息科技有限公司 一种太赫兹人体安检图像目标检测模型训练数据增广方法
CN112613575A (zh) * 2020-12-30 2021-04-06 清华大学 一种图像分类模型的数据集扩充方法、训练方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
AutoAugment:Learning Augmentation Strategies from Data;Ekin D. Cubuk 等;《 Computer Vision and Pattern Recognition》;20190411;1-14 *
Improved Mixed-Example Data Augmentation;Cecilia Summers 等;《Computer Vision and Pattern Recognition》;20190119;1-9 *
SmoothMix: a Simple Yet Effective Data Augmentation to Train Robust Classifiers;Jin-Ha Lee 等;《2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops》;20200728;1-11 *
机器视觉应用中的图像数据增广综述;林成创 等;《计算机科学与探索》;20210224;583-611 *
结合数据增强和轻量化模型的 YOLOv3 木梁柱缺陷检测;王宝刚 等;《电机与控制学报》;20210330;第25卷(第4期);123-132 *

Also Published As

Publication number Publication date
CN113408575A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
Jojic et al. Epitomic analysis of appearance and shape
US7440638B2 (en) Image retrieving system, image classifying system, image retrieving program, image classifying program, image retrieving method and image classifying method
CN112132058B (zh) 一种头部姿态估计方法及其实现系统、存储介质
CN104835114A (zh) 一种图像自适应显示方法
CN108665463A (zh) 一种基于对抗式生成网络的宫颈细胞图像分割方法
CN108305260B (zh) 一种图像中角点的检测方法、装置及设备
JP2002319024A (ja) 色と質感との組み合わせに基づく映像検索方法
CN109934843B (zh) 一种实时的轮廓精细化抠像方法及存储介质
CN111242074B (zh) 一种基于图像处理的证件照背景替换方法
CN115019274B (zh) 一种融合追踪与检索算法的路面病害识别方法
CN113011288A (zh) 一种基于Mask RCNN算法的遥感建筑物检测方法
CN110163055A (zh) 手势识别方法、装置和计算机设备
CN113850136A (zh) 基于yolov5与BCNN的车辆朝向识别方法及系统
Liu et al. Contour-maintaining-based image adaption for an efficient ambulance service in intelligent transportation systems
CN1975762A (zh) 一种皮肤检测方法
WO2022063321A1 (zh) 图像处理方法、装置、设备及存储介质
CN113408575B (zh) 一种基于判别性区域定位的图像数据增广方法
CN116932492B (zh) 用于版式文件识别数据存储优化方法
JP3923243B2 (ja) カラー文書画像からの文字抽出方法
CN114495171B (zh) 一种基于aam的耳像识别方法
CN106340024A (zh) 一种图像分割方法、应用和计算设备
CN113781372B (zh) 一种基于深度学习的戏曲脸谱生成方法及系统
CN111627033B (zh) 一种难样本实例分割方法、设备及计算机可读存储介质
CN114742760A (zh) 一种x光片桡骨远端骨折自动快速诊断方法
CN114187309A (zh) 一种基于卷积神经网络的头发分割方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210917

Assignee: Guilin ruiweisaide Technology Co.,Ltd.

Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY

Contract record no.: X2022450000213

Denomination of invention: A Method of Image Data Augmentation Based on Discriminant Region Location

Granted publication date: 20220819

License type: Common License

Record date: 20221206

EE01 Entry into force of recordation of patent licensing contract