CN109063748B - 基于数据增强的目标检测方法 - Google Patents

基于数据增强的目标检测方法 Download PDF

Info

Publication number
CN109063748B
CN109063748B CN201810777961.1A CN201810777961A CN109063748B CN 109063748 B CN109063748 B CN 109063748B CN 201810777961 A CN201810777961 A CN 201810777961A CN 109063748 B CN109063748 B CN 109063748B
Authority
CN
China
Prior art keywords
image
original image
perspective
perspective transformation
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810777961.1A
Other languages
English (en)
Other versions
CN109063748A (zh
Inventor
王珂
房斌
钱基业
杨粟
周鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201810777961.1A priority Critical patent/CN109063748B/zh
Publication of CN109063748A publication Critical patent/CN109063748A/zh
Application granted granted Critical
Publication of CN109063748B publication Critical patent/CN109063748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于数据增强的目标检测方法,其包括如下步骤:获取目标原始图像,在所述原始图像上添加标注框;对获得的原始图像进行透视变换,生成透视变换图像;进行标注对齐,将变换后的标注框变为可训练的矩形标注框;使用原始图像对透视变换后的图像进行黑边填充;进行目标检测。本发明针对有效样本稀缺的问题,利用透视变换对已有样本进行增强,自动生成新的高质量的标注图像,从而提高深度神经网络的效果。

Description

基于数据增强的目标检测方法
技术领域
本发明属于图像识别技术领域,具体涉及一种针对有效样本稀缺的情况下基于透视变换数据增强的目标检测方法,特别适用于输电线路目标检测。
背景技术
近几年中,深度神经网络在目标检测任务中取得了巨大成功。深度神经网络的性能在很大程度上依赖于海量的训练数据,然而在现实世界的应用中,大量有效的输电线路数据很难获得,这是因为它们涉及高昂的采集成本和标注成本。因此需要利用有效的数据通过数据增强获得更好的效果。文章“Imagenet classification with deepconvolutional neural networks.In Advances in neural information processingsystems”中使用水平反射和颜色扰动进行图像分类。文章“Effective training of aneural network character classifier for word recognition”提出了“笔画扭曲”技术来进行单词识别,这种技术在倾斜、旋转和缩放等方面增加了微小的变化。在文章“RandomErasing Data Augmentation”中,目标检测采用随机擦除,降低了过度拟合的风险。文章“Abayesian data augmentation approach for learning deep models.In Advances inNeural Information Processing Systems”使用贝叶斯DA算法,基于从注释训练集中得到的分布来生成数据。文章“Dataset augmentation in feature space”则不是在输入空间中进行转换,而是在学习的特征空间中进行转换。以上这些公开的技术,得到的图像与真实环境并不匹配。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于数据增强的目标检测方法。
为了实现本发明的上述目的,本发明提供了一种基于数据增强的目标检测方法,其包括如下步骤:
S1,获取目标原始图像,在所述原始图像上添加标注框;
S2,对步骤S1获得的原始图像进行透视变换,生成透视变换图像;
S3,进行标注对齐,将变换后的标注框变为可训练的矩形标注框;
S4,使用原始图像对透视变换后的图像进行黑边填充;
S5,基于Faster-RCNN检测器进行目标检测。
本发明将透视变换应用于数据增强,透视变换能够模拟不同拍摄角度下成像,提高了图像与真实环境的匹配度。
本发明针对有效样本稀缺的问题,利用透视变换对已有样本进行增强,自动生成新的高质量的标注图像,从而提高深度神经网络的效果。
在本发明的一种优选实施方式中,所述透视变换的方法为:
假设X0、X1分别为原始图像和透视变换后图像上的点,其齐次坐标分别为X0=[x0,y0,w0],X1=[x1,y1,w1],则透视变换表示为:
X1=X0P (1)
其中,
Figure BDA0001731849490000031
为透视矩阵,可以拆为四个部分,
Figure BDA0001731849490000032
表示线性变换,[p31 p32]用于平移,[p13 p23]T产生透视变换,X0和X1的笛卡尔坐标表示为X0=[x0/w0,y0/w0],X1=[x1/w1,y1/w1]。
在本发明的另一种优选实施方式中,所述生成透视变换图像的方法为:
选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点Aθ,Bθ,Cθ,Dθ来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点Aθ,Bθ,Cθ,Dθ,随机采样点
Aθ=(xtl,ytl),Bθ=(xbl,W-ybl),Cθ=(H-xbr,W-ybr),Dθ=(H-xtr,ytr) (2)
由透视因子θ控制,
xtl,xbl,xbr,xtr∈(0,H*(λθ)),ytl,ybl,ybr,ytr∈(0,W*(λθ)), (3)
其中λ为平衡参数,H,W分别表示原始图像的长和宽;
通过对应的4对点A,B,C,D、Aθ,Bθ,Cθ,Dθ,得到透视变换矩阵P,用求得的变换矩阵对原始图像中的所有像素点进行变换,从而得到新的图像;在生成的图像中,图像信息外的部分用黑色象素点填充。
本发明对于图像中较远和较小的目标(如防震锤、绝缘子等),它们在图像中以一种近似平面的状态呈现,透视变换可以模拟出这类目标在不同拍摄角度下的形状;对于较近且较大的目标(如杆塔),它们在图像中有着一定的立体状态,其它面的信息在该图像平面中没有呈现,所以这类目标的透视变换仅是增加了样本的多样性。
在本发明的另一种优选实施方式中,所述标注对齐的方法为:
原始图像中的矩形标注框用[xmin,ymin,xmax,ymax]表示,(xmin,ymin),(xmax,ymax)分别表示该矩形框左上角和右下角坐标,经过透视变换得到的非矩形标注框的四个顶点坐标变为a*=(x1,y1),b*=(x2,y2),c*=(x3,y3),d*=(x4,y4),
Figure BDA0001731849490000041
Figure BDA0001731849490000042
表示变换后标注框。
本发明可以自动生成新的标注样本,显著降低了昂贵的手动标注时间,并且可以轻松地应用于其他数据集和任务。
在本发明的另一种优选实施方式中,所述黑边填充的方法为:
假设原始图像I的大小为M×N,构造两个大小为3M×3N的图像IM和IB,IM为原始图像的镜像图,以原始图像I为中心,通过将其进行水平和垂直翻转,组合构成镜像图片IM;IB以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像IB,此时,在图像IB中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M).
然后,通过同一个变换矩阵P,对IM、IB进行同样的透视变换得到
Figure BDA0001731849490000043
Figure BDA0001731849490000044
中,A1,B1,C1,D1投影后的点
Figure BDA0001731849490000045
坐标可以通过公式(1)透视变换得到;由公式(2)得到
Figure BDA0001731849490000046
定义
Figure BDA0001731849490000047
则A0,B0,C0,D0构成四边形
Figure BDA0001731849490000048
的外接矩形;
在图像
Figure BDA0001731849490000049
中,根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像。进一步提高了生成样本的质量。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一种优选实施方式中不同θ取值下的透视变换效果图,其中,图1(a)为θ取0.3时的透视变换效果图,图1(b)为θ取0.9时的透视变换效果图;
图2是标注对齐时边界框的透视变换;
图3是黑边填充方法示意图;
图4是目标检测的检测结果示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
当人眼观看场景时,距离远的物体看起来比距离近的物体小,这通常被称为透视。摄像机工作原理与人类视觉工作原理相同。透视变换是一种特定的单应性变换,是将同一个三维物体分别投影到两个不同投影平面下的两幅图像联系起来。这意味着相机在不同位置和角度拍摄的图像可以通过透视变换来实现。
假设X0、X1分别为原始图像和透视变换后图像上的点,其齐次坐标分别为X0=[x0,y0,w0],X1=[x1,y1,w1],则透视变换可以简单表示为:
X1=X0P (1),
其中
Figure BDA0001731849490000061
为透视矩阵,可以拆为四个部分,
Figure BDA0001731849490000062
表示线性变换,如缩放、翻转,[p31 p32]用于平移,[p13 p23]T产生透视变换。X0和X1的笛卡尔坐标可以表示为X0=[x0/w0,y0/w0],X1=[x1/w1,y1/w1],具体透视矩阵内元素的取值可根据现有的透视矩阵求解方法获取。
由上可知,透视变换矩阵可以通过使用对应于透视变换的四对像素点齐次坐标来求得;另一方面,给定透视变换矩阵,可以完成图像中所有象素点的透视变换。
基于此,本发明提供了一种基于数据增强的目标检测方法,以下以输电线路为目标进行说明,其包括如下步骤:
S1,获取输电线路原始图像,在所述原始图像上添加标注框,在本实施方式中,输电线路原始图像通过无人机拍摄得到,使用标注软件LabeI Image手工标注13个类别:1)传输线目标:杆塔,导线,陶瓷绝缘子,玻璃绝缘子,复合绝缘子,FX绝缘子,DB绝缘子,FDZ绝缘子,FR绝缘子;2)外破场景:建筑,房屋,卡车,小汽车。
S2,对步骤S1获得的原始图像进行透视变换,生成透视变换图像;
S3,进行标注对齐,将变换后的标注框变为可训练的矩形标注框;
S4,使用原始图像对透视变换后的图像进行黑边填充;
S5,进行输电线路目标检测。
在本发明的一种优选实施方式中,具体步骤为
第一步,生成透视变换图像。
在数据增强中,要通过透视变换生成和原图大小相同的新图像。首先,选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点Aθ,Bθ,Cθ,Dθ来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点Aθ,Bθ,Cθ,Dθ。随机采样点Aθ=(xtl,ytl),Bθ=(xbl,W-ybl),Cθ=(H-xbr,W-ybr),Dθ=(H-xtr,ytr)由透视因子θ控制,xtl,xbl,xbr,xtr∈(0,H*(λθ)),ytl,ybl,ybr,ytr∈(0,W*(λθ)),其中λ为平衡参数,通常选取λ=0.3,H,W分别表示原始图像的长和宽。
在生成新的样本过程中,通过对应的4对点A,B,C,D、Aθ,Bθ,Cθ,Dθ,通过等式(1)得到透视变换矩阵P,之后用求得的变换矩阵便可对原始图像中的所有像素点进行变换,从而得到新的图像,如图1所示。在生成的图像中,图像信息外的部分用黑色象素点填充。
透视变换中,透视因子θ影响透视效果。不同的透视因子θ会产生不同的透视变换效果,图1表示了不同θ取值下的透视变换效果。可以看出,θ值越大,透视效果越明显。当透视因子θ值相同时,由于公式(3)中的整数是随机选取的,故也会产生不同的透视变换,如图1(a)中的上、下两个透视变换效果图所示。
透视变换是对平面的变换,对于图像中较远和较小的目标(如防震锤、绝缘子等),它们在图像中以一种近似平面的状态呈现,因此透视变换可以模拟出这类目标在不同拍摄角度下的形状;对于较近且较大的目标(如杆塔),它们在图像中有着一定的立体状态,其它面的信息在该图像平面中没有呈现,所以这类目标的透视变换仅是增加了样本的多样性。
第二步,标注对齐。
透视变换能够生成目标处于不同状态的新图像,但是,其用于数据增强存在一个问题。透视变换后,原始图像中的矩形标注框(如图中A所示)会被变换为任意四边形,如图中B所示,但深度神经网络无法训练非矩形标注框。因此,需要处理变换后的标注框,使其变为可训练的矩形标注框。
通常情况下,图像中的矩形标注框用[xmin,ymin,xmax,ymax]表示,(xmin,ymin),(xmax,ymax)分别表示该矩形框左上角和右下角坐标。假设通过公式(1)得到的非矩形标注框的四个顶点坐标变为a*=(x1,y1),b*=(x2,y2),c*=(x3,y3),d*=(x4,y4),
Figure BDA0001731849490000081
Figure BDA0001731849490000082
即可表示变换后标注框,如图中C所示。得到的矩形标注框可以超出实际图像的边界。第三步,填充黑边。
通过透视变换及标注对齐,已经能够自动生成新的标注图像。但是图像在透视变换后存在黑色边缘,为了进一步提高生成样本的质量,将使用原始图像对透视变换后的图像进行黑边填充。
假设原始图像I的大小为M×N。首先我们构造两个大小为3M×3N的图像IM和IB。IM为原始图像的镜像图,以原始图像I为中心,通过将其进行水平和垂直翻转,组合构成镜像图片IM;IB同样以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像IB。此时,在图像IB中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M).
然后,通过同一个变换矩阵P,对IM、IB进行同样的透视变换得到
Figure BDA0001731849490000091
Figure BDA0001731849490000092
中,A1,B1,C1,D1投影后的点
Figure BDA0001731849490000093
坐标可以通过公式(1)得到。然后由公式(2),能够找出
Figure BDA0001731849490000094
定义
Figure BDA0001731849490000097
则A0,B0,C0,D0构成四边形
Figure BDA0001731849490000095
的外接矩形。
最后,在图像
Figure BDA0001731849490000096
中,根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像。填充黑边过程如图3所示。
第四步,目标检测。本发明基于Faster-RCNN检测器进行输电线路目标检测,Faster RCNN兼顾了检测精度和效率,综合性能最优。
经过上述步骤,通过透视变换已经自动生成新的标注图像,然后基于Faster-RCNN检测器进行输电线路目标检测。该模型由ImageNet分类模型初始化,然后在增强的输电线路数据集上进行微调。使用VGG16架构并训练100K次。得到的检测结果如图4所示。
本发明针对有效样本稀缺的问题,利用透视变换对已有样本进行增强,自动生成新的高质量的标注图像,从而提高深度神经网络的效果。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (4)

1.一种基于数据增强的目标检测方法,其特征在于,包括如下步骤:
S1,获取目标原始图像,在所述原始图像上添加标注框;
S2,对步骤S1获得的原始图像进行透视变换,生成透视变换图像;
S3,进行标注对齐,将变换后的标注框变为可训练的矩形标注框;
S4,使用原始图像对透视变换后的图像进行黑边填充,所述黑边填充的方法为:
假设原始图像I的大小为M×N,构造两个大小为3M×3N的图像I0和I1,I0为原始图像的镜像图,以原始图像I为中心,通过将其进行水平和垂直翻转,组合构成镜像图片I0;I1以原始图像I为中心,四周以黑边填充,构成黑边环绕的图像I1,此时,在图像I1中原始图像I的四个顶点的坐标分别为:
A1=(N,M),B1=(2N,M),C1=(N,2M),D1=(2N,2M).
然后,通过同一个变换矩阵P,对I0、I1进行同样的透视变换得到
Figure FDA0003183362790000011
Figure FDA0003183362790000012
中,A1,B1,C1,D1投影后的点
Figure FDA0003183362790000013
坐标可以通过透视变换得到;经过标注对齐,得到
Figure FDA0003183362790000014
定义
Figure FDA0003183362790000015
则A0,B0,C0,D0构成四边形
Figure FDA0003183362790000016
的外接矩形,(xmin,ymin),(xmax,ymax)分别表示该矩形框左上角和右下角坐标;
在图像I0中,根据点A0,B0,C0,D0的坐标裁减出矩形,该矩形即为原图填充后的图像;
S5,进行目标检测。
2.根据权利要求1所述的基于数据增强的目标检测方法,其特征在于,所述透视变换的方法为:
假设X0、X1分别为原始图像和透视变换后图像上的点,其齐次坐标分别为X0=[x0,y0,w0],X1=[x1,y1,w1],则透视变换表示为:
X1=X0P (1)
其中,
Figure FDA0003183362790000021
为透视矩阵,可以拆为四个部分,
Figure FDA0003183362790000022
表示线性变换,[p31 p32]用于平移,[p13 p23]T产生透视变换,X0和X1的笛卡尔坐标表示为X0=[x0/w0,y0/w0],X1=[x1/w1,y1/w1],w0、w1表示坐标轴的远近参数。
3.根据权利要求1所述的基于数据增强的目标检测方法,其特征在于,所述生成透视变换图像的方法为:
选取原始图像的四个顶点A,B,C,D以及输出图像中的四个随机采样点Aθ,Bθ,Cθ,Dθ来生成透视变换矩阵,即将原始图像的四个顶点透视投影到新图像中的四个采样点Aθ,Bθ,Cθ,Dθ,随机采样点Aθ=(xtl,ytl),Bθ=(xbl,W-ybl),Cθ=(H-xbr,W-ybr),Dθ=(H-xtr,ytr)由透视因子θ控制,xtl,xbl,xbr,xtr∈(0,H*(λθ)),ytl,ybl,ybr,ytr∈(0,W*(λθ)),其中λ为平衡参数,H,W分别表示原始图像的长和宽;
通过对应的4对点A,B,C,D、Aθ,Bθ,Cθ,Dθ,得到透视变换矩阵P,用求得的变换矩阵对原始图像中的所有像素点进行变换,从而得到新的图像;在生成的图像中,图像信息外的部分用黑色象素点填充。
4.根据权利要求1所述的基于数据增强的目标检测方法,其特征在于,所述标注对齐的方法为:
原始图像中的矩形标注框用[xmin,ymin,xmax,ymax]表示,(xmin,ymin),(xmax,ymax)分别表示该矩形框左上角和右下角坐标,经过透视变换得到的非矩形标注框的四个顶点坐标变为a*=(x1,y1),b*=(x2,y2),c*=(x3,y3),d*=(x4,y4),
Figure FDA0003183362790000031
Figure FDA0003183362790000032
表示变换后标注框。
CN201810777961.1A 2018-07-16 2018-07-16 基于数据增强的目标检测方法 Active CN109063748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810777961.1A CN109063748B (zh) 2018-07-16 2018-07-16 基于数据增强的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810777961.1A CN109063748B (zh) 2018-07-16 2018-07-16 基于数据增强的目标检测方法

Publications (2)

Publication Number Publication Date
CN109063748A CN109063748A (zh) 2018-12-21
CN109063748B true CN109063748B (zh) 2021-11-16

Family

ID=64816674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810777961.1A Active CN109063748B (zh) 2018-07-16 2018-07-16 基于数据增强的目标检测方法

Country Status (1)

Country Link
CN (1) CN109063748B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175247B (zh) * 2019-03-13 2021-06-08 北京邮电大学 一种优化基于深度学习的异常检测模型的方法
CN111784588A (zh) * 2019-04-04 2020-10-16 长沙智能驾驶研究院有限公司 图像数据增强方法、装置、计算机设备和存储介质
CN112085042A (zh) * 2019-06-14 2020-12-15 顺丰科技有限公司 一种图像检测网络模型、装置、方法、及存储介质
CN110263794B (zh) * 2019-06-26 2021-07-02 国网山东省电力公司建设公司 基于数据增强的目标识别模型的训练方法
CN111383267B (zh) * 2020-03-03 2024-04-05 重庆金山医疗技术研究院有限公司 一种目标重定位方法、设备及存储介质
CN111652167A (zh) * 2020-06-09 2020-09-11 四川大学 一种染色体核型图像智能评价方法及系统
CN111881760B (zh) * 2020-06-30 2021-10-08 深圳金三立视频科技股份有限公司 输电线路防外破识别方法及终端
CN112396569B (zh) * 2020-12-02 2024-05-31 北京皮尔布莱尼软件有限公司 一种对图像进行数据增强的方法
CN112668672A (zh) * 2021-03-16 2021-04-16 深圳市安软科技股份有限公司 基于TensorRT的目标检测模型加速方法及装置
CN114266879A (zh) * 2021-12-24 2022-04-01 北京百度网讯科技有限公司 三维数据增强、模型训练检测方法、设备及自动驾驶车辆
CN115393997A (zh) * 2022-08-31 2022-11-25 深圳立欧实业有限公司 基于多维数据识别的汽车电子解锁方法、装置及电子设备
CN117274205A (zh) * 2023-09-27 2023-12-22 深圳市六六六国际旅行社有限公司 一种基于新型数据标注与数据增强的四边形检测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103695A (zh) * 2009-12-21 2011-06-22 北京中星微电子有限公司 一种图像样本生成方法及装置
CN106169076A (zh) * 2016-07-22 2016-11-30 中山大学 一种基于透视变换的角度车牌图像库搭建方法
CN106383912A (zh) * 2016-10-14 2017-02-08 上海谦问万答吧云计算科技有限公司 一种图片检索方法和装置
CN107123145A (zh) * 2017-05-04 2017-09-01 济南大学 基于人工标志和几何变换的电梯按钮定位和识别方法
CN107895173A (zh) * 2017-11-06 2018-04-10 国网重庆市电力公司电力科学研究院 标注图像目标的方法、装置、设备及可读存储介质
CN108230233A (zh) * 2017-05-16 2018-06-29 北京市商汤科技开发有限公司 数据增强、处理方法和装置、电子设备和计算机存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9977994B2 (en) * 2016-06-30 2018-05-22 Apple Inc. Configurable histogram-of-oriented gradients (HOG) processor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102103695A (zh) * 2009-12-21 2011-06-22 北京中星微电子有限公司 一种图像样本生成方法及装置
CN106169076A (zh) * 2016-07-22 2016-11-30 中山大学 一种基于透视变换的角度车牌图像库搭建方法
CN106383912A (zh) * 2016-10-14 2017-02-08 上海谦问万答吧云计算科技有限公司 一种图片检索方法和装置
CN107123145A (zh) * 2017-05-04 2017-09-01 济南大学 基于人工标志和几何变换的电梯按钮定位和识别方法
CN108230233A (zh) * 2017-05-16 2018-06-29 北京市商汤科技开发有限公司 数据增强、处理方法和装置、电子设备和计算机存储介质
CN107895173A (zh) * 2017-11-06 2018-04-10 国网重庆市电力公司电力科学研究院 标注图像目标的方法、装置、设备及可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Domain-Specific Data Augmentation for On-Road Object Detection Based on a Deep Neural Network;Hui Eun Kim et al.;《2017 IEEE Intelligent Vehicles Symposium》;20170731;第103-108页 *
Smart Augmentation Learning an Optimal Data Augmentation Strategy;JOSEPH LEMLEY et al.;《IEEE Access》;20170517;第5858-5869页 *
基于数据增强的卷积神经网络图像识别研究;高友文 等;《http://kns.cnki.net/kcms/detail/61.1450.TP.20180427.1626.006.html》;20180427;第1-7页 *

Also Published As

Publication number Publication date
CN109063748A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109063748B (zh) 基于数据增强的目标检测方法
CN110570429B (zh) 一种基于三维点云的轻量级实时语义分割方法
CN101883291B (zh) 感兴趣区域增强的视点绘制方法
WO2022165809A1 (zh) 一种训练深度学习模型的方法和装置
CN105719352B (zh) 人脸三维点云超分辨率融合方法及应用其的数据处理装置
CN111968121A (zh) 一种基于实例嵌入与语义融合的三维点云场景分割方法
US11790610B2 (en) Systems and methods for selective image compositing
CN107330964B (zh) 一种复杂三维物体的显示方法及系统
CN107679537A (zh) 一种基于轮廓点orb特征匹配的无纹理空间目标姿态估计算法
CN112954292B (zh) 一种基于增强现实的数字博物馆导览系统和方法
CN104103081A (zh) 一种虚拟的多摄像机目标跟踪视频素材产生方法
CN107452056B (zh) 一种增强现实的教学系统及其控制方法
Xu et al. Layout-guided novel view synthesis from a single indoor panorama
CN110648274A (zh) 鱼眼图像的生成方法及装置
Ding et al. Regional style and color transfer
CN112734914A (zh) 一种增强现实视觉的图像立体重建方法及装置
CN113723389B (zh) 一种支柱式绝缘子定位方法及装置
CN114332796A (zh) 一种多传感器融合体素特征图生成方法及系统
CN112258631B (zh) 一种基于深度神经网络的三维目标检测方法及系统
CN112581505B (zh) 一种简易的激光雷达点云与光学影像自动配准方法
CN115049935B (zh) 一种城市违章建筑分割检测方法
CN115731336B (zh) 图像渲染方法、图像渲染模型生成方法及相关装置
CN114972612B (zh) 一种基于三维简化模型的图像纹理生成方法及相关设备
CN111915672B (zh) 一种基于3d虚拟驾驶场景的目标标注方法及设备
CN113673567B (zh) 基于多角度子区域自适应的全景图情感识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant