CN113570534A - 一种用于深度学习的物品识别数据集扩充方法及系统 - Google Patents
一种用于深度学习的物品识别数据集扩充方法及系统 Download PDFInfo
- Publication number
- CN113570534A CN113570534A CN202110873498.2A CN202110873498A CN113570534A CN 113570534 A CN113570534 A CN 113570534A CN 202110873498 A CN202110873498 A CN 202110873498A CN 113570534 A CN113570534 A CN 113570534A
- Authority
- CN
- China
- Prior art keywords
- image
- background
- article
- changed
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000003190 augmentative effect Effects 0.000 claims abstract description 10
- 230000004927 fusion Effects 0.000 claims abstract description 8
- 238000002372 labelling Methods 0.000 claims description 24
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 6
- 230000003416 augmentation Effects 0.000 claims description 5
- 239000003086 colorant Substances 0.000 claims description 5
- 230000009193 crawling Effects 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
本公开公开的一种用于深度学习的物品识别数据集扩充方法及系统,包括:获取背景图像和物品图像;对物品图像进行标记,获取标注图像;对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;利用复杂背景标注图像对物品识别数据集进行扩充。通过该扩充后的数据集对用于物品识别的深度学习网络进行训练时,能够获得良好的训练效果。
Description
技术领域
本发明涉及机器人视觉应用技术领域,尤其涉及一种用于深度学习的物品识别数据集扩充方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着深度学习技术的不断深入的背景下,深度学习技术在实际场景中的应用也日益广泛,但是,由于深度学习技术的实际应用需要数量巨大且质量较高的人工标注数据,人工标记过程保证了数据质量,但是也耗费大量人力以及资金,同时也增加了时间成本。因此,单纯的依赖人工标记限制了深度学习技术的进一步实际部署,尤其在机器人应用领域。
常用的且已经公开的开源数据集,如ImageNet数据集,COCO数据集,VOC数据集等,这些数据集可以用于物品的识别,分割网络训练,但不能进行可供性分割网络训练,可供性指的是物品可以承受的机器人的动作,即机器人可以对物品的不同功能部分施加不同的动作,实现机器人对物品的认知操作。
故发明人认为,利用现有数据集对用于物品识别分割的深度学习网络进行训练时,首先无法获取大量的人工标注图像,从而使得对深度学习网络的训练效果有限,此次,现有的数据集对深度学习网络进行训练后可用于对物品进行识别分割,而不能进行物品的可供性分割。
发明内容
本公开为了解决上述问题,提出了一种用于深度学习的物品识别数据集扩充方法及系统,实现了对物品识别数据集的扩充,利用该扩充后的数据集进行深度学习网络训练时,保证了深度学习网络训练的效果。
为实现上述目的,本公开采用如下技术方案:
第一方面,提出了一种用于深度学习的物品识别数据集扩充方法,包括:
获取背景图像和物品图像;
对物品图像进行标记,获取标注图像;
对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
利用复杂背景标注图像对物品识别数据集进行扩充。
第二方面,提出了一种用于深度学习的物品识别数据集扩充系统,包括:
图像获取模块,用于获取背景图像和物品图像;
图像标记模块,用于对物品图像进行标记,获取标注图像;
背景更换后标注图像获取模块,用于对标注图像进行旋转,获取旋转后标注图像;利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
复杂背景标注图像获取模块,用于改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
数据集扩充模块,用于利用复杂背景标注图像对物品识别数据集进行扩充。
第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成一种用于深度学习的物品识别数据集扩充方法所述的步骤。
第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成一种用于深度学习的物品识别数据集扩充方法所述的步骤。
与现有技术相比,本公开的有益效果为:
1、本公开通过对标注图像进行旋转后更换背景,进而对背景更换后标注图像更改大小,并对任意两幅改变大小后的背景更换后标注图像进行融合,获得了复杂背景标注图像,通过该复杂背景标注图像对物品识别数据集进行扩充,利用该扩充后的数据集进行深度学习网络训练时,保证了深度学习网络训练的效果。
2、本公开对物品图像进行了可供性标签标记,从而利用该数据集对深度学习网络进行训练后,能够用于物品的可供性识别与切割。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本公开实施例1公开方法的流程图;
图2为本公开实施例1提及的8种可供性标签;
图3为本公开实施例1公开的在原始物品图像上利用LabelMe标记物品可供性和实例示意图;
图4为本公开实施例1公开的物品定位示意图;
图5为本公开实施例1公开的数据集扩充结果示意图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,只是为了便于叙述本公开各部件或元件结构关系而确定的关系词,并非特指本公开中任一部件或元件,不能理解为对本公开的限制。
本公开中,术语如“固接”、“相连”、“连接”等应做广义理解,表示可以是固定连接,也可以是一体地连接或可拆卸连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的相关科研或技术人员,可以根据具体情况确定上述术语在本公开中的具体含义,不能理解为对本公开的限制。
实施例1
在该实施例中,公开了一种用于深度学习的物品识别数据集扩充方法,包括:
获取背景图像和物品图像;
对物品图像进行标记,获取标注图像;
对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
利用复杂背景标注图像对物品识别数据集进行扩充。
进一步的,利用网络爬取技术获取背景图像。
进一步的,对物品图像进行可供性标签标记,获得标注图像。
进一步的,对物品图像进行可供性标签标记时,不同可供性标签采用不同颜色或箭头进行标记。
进一步的,对物品图像进行标记,获取标注图像时,还对物品图像中的物品进行矩形框标注和分割,获得矩形框位置。
进一步的,根据物品的类别和物品所处矩形框的位置,将复杂背景标注图像放入物品识别数据集。
进一步的,通过对背景更换后的标注图像进行扩大或放缩,改变背景更换后的标注图像的大小。
对本实施例公开的一种用于深度学习的物品识别数据集扩充方法进行详细说明。
由于现有的用于物品识别的深度学习网络进行训练时,需要大量的人工标注数据,耗费大量人力物力,且获取的人工标注数据有限,导致对深度学习网络的训练效果有限,且现在公开的可供性分割数据集UMD等只提供可供性分割,不能用于实例分割以及物品识别,限制了其应用,同时,该数据集相对物品单一,背景简单,导致其难以部署在机器人上进行实际应用。因此,针对特定的应用场景和多输出深度学习网络的训练,需要快速生成含有多标签的物品数据集。
为解决上述技术问题,本实施例公开了一种用于深度学习的物品识别数据集扩充方法,如图1所示,包括:
S1:获取所需识别、分割物品的原始的物品图像。
在具体实施时,利用RealSense相机采集背景简单且仅有一个物品的RGB图像,格式为JPG,大小为640×480(单位:像素),该图像即为所需的原始的物品图像。
S2:对物品图像进行标记,获取标注图像。
对物品图像进行可供性标签标记,获得标注图像,且对物品图像进行可供性标签标记时,不同可供性标签采用不同颜色或箭头进行标记。
在具体实施时,利用LabelMe软件对采集的物品图像进行标记,并定义如图2所示的8个可供性标签:contain,cut,grasp,wrap-grasp,scoop,open,pound,support。利用可供性标签标记物品图像的功能部位,如图3所示,杯子的杯口可以倒入液体,具有contain可供性;杯身可以大面积接触抓取,具有wrap-grasp可供性;杯把可以小面积接触抓取,可以进行grasp可供性。
在彩色图中用不同颜色表示不同的可供性标签,在本实施例中,利用箭头表示物品的各可供性标签。
此外,除对物品图像进行可供性标签标记外,还对物品图像中的物品通过矩形框进行分割,获得物品实例标签图像,用来进行不同图像中物品的区分。
对物品实例标签图像进行像素遍历,找出实例分割物品所在矩形范围的x轴上最大xmax,最小值xmin以及在y轴上的最大值ymax,最小值ymin,提取实例物品所在的矩形框(xmin,ymin,xmax,ymax),实现了对矩形框的位置定位。
根据物品的类别命名图像的名字,将物品的类别标签和物品所在的矩形框位置存入XML文件中,如图4所示。
S3:获取背景图像。
在具体实施时,利用网络爬虫方法,从因特网上爬取复杂的背景图像,并修改图像尺寸为640*480,组成复杂的背景图像数据集。
S4:对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像。
在具体实施时,获取旋转后标注图像后,同时对XML文件中的物品所在的矩形框的位置进行更改。
从背景图像数据集中随机选取背景图像,利用随机选取的背景图像通过公式(1)对旋转后标注图像的背景进行更换。
Ip×β+Im×(1-β)(1)
其中,Ip代表原始的物品图像,β代表物品实例标签图像,Im代表背景图像,在通过公式(1)融合原图像的同时,对应的可供性标签和物品实例标签,也进行相应的融合,并按对应位置再次改变XML文件中矩形框的位置。
该步骤中进行物品的随机旋转来扩大背景,进而把手工标注的少量标注图像扩充为背景复杂且数量较多的数据集图像和标签。
S6:改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像。
在具体实施时,通过对背景更换后的标注图像进行扩大或放缩,改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像。
从改变大小后的背景更换后标注图像中随机选择两幅图像通过公式(1)进行融合,获得复杂背景标注图像。此时,公式(1)中的Ip代表其中一幅改变大小后的背景更换后标注图像,β代表物品实例标签图像,Im代表另一副改变大小后的背景更换后标注图像。
在通过公式(1)融合两幅改变大小后的背景更换后标注图像的同时,对应的可供性标签和物品实例标签,也进行相应的融合,并按对应位置再次改变XML文件中矩形框的位置。
利用复杂背景标注图像对物品识别数据行扩充,获取如图5所示的数据集,利用该数据集对深度学习网络进行训练,可以获取良好的训练效果。
此外,由于本实施例对物品图像进行了可供性标签标记,当应用该扩充后的数据集对深度学习网络进行训练后,能够用于物品的可供性识别与切割。
本实施例公开的一种用于深度学习的物品识别分割数据集扩充方法,首先利用RealSense相机采集具有简单背景和含有一个物品的RGB物品图像,并用LabelMe软件根据可供性以及人类物品操作习惯,使用不同的颜色标记物品的功能区域,用于可供性分割,同时为了更好的区分实例物品,对物品进行实例分割,通过本公开的数据制作技术,对训练数据集进行扩充,从而可以将该数据集应用于网络训练,并应用到机器人实际操作。
实施例2
在该实施例中,公开了一种用于深度学习的物品识别数据集扩充系统,包括:
图像获取模块,用于获取背景图像和物品图像;
图像标记模块,用于对物品图像进行标记,获取标注图像;
背景更换后标注图像获取模块,用于对标注图像进行旋转,获取旋转后标注图像;利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
复杂背景标注图像获取模块,用于改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
数据集扩充模块,用于利用复杂背景标注图像对物品识别数据集进行扩充。
实施例3
在该实施例中,公开了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1公开的一种用于深度学习的物品识别数据集扩充方法所述的步骤。
实施例4
在该实施例中,公开了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1公开的一种用于深度学习的物品识别数据集扩充方法所述的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种用于深度学习的物品识别数据集扩充方法,其特征在于,包括:
获取背景图像和物品图像;
对物品图像进行标记,获取标注图像;
对标注图像进行旋转,获取旋转后标注图像,利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
利用复杂背景标注图像对物品识别数据集进行扩充。
2.如权利要求1所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,利用网络爬取技术获取背景图像。
3.如权利要求1所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,对物品图像进行可供性标签标记,获得标注图像。
4.如权利要求3所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,对物品图像进行可供性标签标记时,不同可供性标签采用不同颜色或箭头进行标记。
5.如权利要求1所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,对物品图像进行标记,获取标注图像时,还对物品图像中的物品进行矩形框标注和分割,获得矩形框位置。
6.如权利要求5所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,根据物品的类别和物品所处矩形框的位置,将复杂背景标注图像放入物品识别数据集。
7.如权利要求1所述的一种用于深度学习的物品识别数据集扩充方法,其特征在于,通过对背景更换后的标注图像进行扩大或放缩,改变背景更换后的标注图像的大小。
8.一种用于深度学习的物品识别数据集扩充系统,其特征在于,包括:
图像获取模块,用于获取背景图像和物品图像;
图像标记模块,用于对物品图像进行标记,获取标注图像;
背景更换后标注图像获取模块,用于对标注图像进行旋转,获取旋转后标注图像;利用背景图像对旋转后标注图像的背景进行更换,获得背景更换后标注图像;
复杂背景标注图像获取模块,用于改变背景更换后的标注图像的大小,获取改变大小后的背景更换后标注图像,从改变大小后的背景更换后标注图像中选取两幅图像进行融合,获得复杂背景标注图像;
数据集扩充模块,用于利用复杂背景标注图像对物品识别数据集进行扩充。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的一种用于深度学习的物品识别数据集扩充方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的一种用于深度学习的物品识别数据集扩充方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110873498.2A CN113570534A (zh) | 2021-07-30 | 2021-07-30 | 一种用于深度学习的物品识别数据集扩充方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110873498.2A CN113570534A (zh) | 2021-07-30 | 2021-07-30 | 一种用于深度学习的物品识别数据集扩充方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113570534A true CN113570534A (zh) | 2021-10-29 |
Family
ID=78169537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110873498.2A Pending CN113570534A (zh) | 2021-07-30 | 2021-07-30 | 一种用于深度学习的物品识别数据集扩充方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113570534A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809138A (zh) * | 2024-02-23 | 2024-04-02 | 中国电子科技集团公司第二十九研究所 | 一种多余物检测图像数据集增强方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614983A (zh) * | 2018-10-26 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 训练数据的生成方法、装置及系统 |
CN111191696A (zh) * | 2019-12-20 | 2020-05-22 | 山东大学 | 一种基于深度学习算法的钢筋分层方法及系统 |
CN111415293A (zh) * | 2020-03-12 | 2020-07-14 | 上海数川数据科技有限公司 | 基于图像目标-背景变换的数据集增强方法及系统 |
CN111553923A (zh) * | 2019-04-01 | 2020-08-18 | 上海卫莎网络科技有限公司 | 一种图像处理方法、电子设备及计算机可读存储介质 |
CN111754518A (zh) * | 2020-05-13 | 2020-10-09 | 北京迈格威科技有限公司 | 图像集合的扩充方法、装置及电子设备 |
CN111881720A (zh) * | 2020-06-09 | 2020-11-03 | 山东大学 | 用于深度学习的数据自动增强扩充方法、识别方法及系统 |
CN112085160A (zh) * | 2020-08-06 | 2020-12-15 | 珠海格力电器股份有限公司 | 一种图像样本扩充方法、装置及存储介质 |
CN112949501A (zh) * | 2021-03-03 | 2021-06-11 | 安徽省科亿信息科技有限公司 | 一种从示教视频学习物体的可供性方法 |
-
2021
- 2021-07-30 CN CN202110873498.2A patent/CN113570534A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109614983A (zh) * | 2018-10-26 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 训练数据的生成方法、装置及系统 |
CN111553923A (zh) * | 2019-04-01 | 2020-08-18 | 上海卫莎网络科技有限公司 | 一种图像处理方法、电子设备及计算机可读存储介质 |
CN111191696A (zh) * | 2019-12-20 | 2020-05-22 | 山东大学 | 一种基于深度学习算法的钢筋分层方法及系统 |
CN111415293A (zh) * | 2020-03-12 | 2020-07-14 | 上海数川数据科技有限公司 | 基于图像目标-背景变换的数据集增强方法及系统 |
CN111754518A (zh) * | 2020-05-13 | 2020-10-09 | 北京迈格威科技有限公司 | 图像集合的扩充方法、装置及电子设备 |
CN111881720A (zh) * | 2020-06-09 | 2020-11-03 | 山东大学 | 用于深度学习的数据自动增强扩充方法、识别方法及系统 |
CN112085160A (zh) * | 2020-08-06 | 2020-12-15 | 珠海格力电器股份有限公司 | 一种图像样本扩充方法、装置及存储介质 |
CN112949501A (zh) * | 2021-03-03 | 2021-06-11 | 安徽省科亿信息科技有限公司 | 一种从示教视频学习物体的可供性方法 |
Non-Patent Citations (1)
Title |
---|
JEVGENIJ GAMPER等: "PanNuke Dataset Extension, Insights and Baselines", 《ARXIV:2003.10778V7 [ EESS.IV]》, pages 1 - 12 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809138A (zh) * | 2024-02-23 | 2024-04-02 | 中国电子科技集团公司第二十九研究所 | 一种多余物检测图像数据集增强方法及系统 |
CN117809138B (zh) * | 2024-02-23 | 2024-05-14 | 中国电子科技集团公司第二十九研究所 | 一种多余物检测图像数据集增强方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455495B2 (en) | System and method for visual recognition using synthetic training data | |
US7272785B2 (en) | Data editing for improving readability of a display | |
CN111666954A (zh) | 一种显著区域的联合学习提取方法及系统 | |
CN110058756B (zh) | 一种图像样本的标注方法及装置 | |
KR20230030259A (ko) | 제품 결함 검출 학습을 위한 딥러닝 기반 데이터 증강 방법 | |
CN113570534A (zh) | 一种用于深度学习的物品识别数据集扩充方法及系统 | |
CN112381114A (zh) | 一种深度学习图像标注系统及方法 | |
CN115205727A (zh) | 一种基于无监督学习的实验智能评分方法和系统 | |
CN113010711A (zh) | 一种基于深度学习的影视海报自动生成方法与系统 | |
CN115294308A (zh) | 基于深度学习的增强现实辅助装配作业引导系统 | |
CN112052332A (zh) | 检索方法、装置、电子设备及可读存储介质 | |
CN109215047A (zh) | 基于深海视频的运动目标检测方法和装置 | |
CN111429512A (zh) | 图像处理方法和装置、存储介质及处理器 | |
CN111783881A (zh) | 基于预训练模型的场景适配学习方法及系统 | |
CN106446291A (zh) | 基于人工智能的图片内容页提供方法及装置 | |
CN116152606A (zh) | 样本生成方法、目标检测模型训练、目标检测方法及系统 | |
CN114240734A (zh) | 图像数据增广方法、装置、电子设备及存储介质 | |
CN115661155A (zh) | 缺陷检测模型的构建方法、装置、设备及存储介质 | |
CN109255807A (zh) | 一种图像信息处理方法及服务器、计算机存储介质 | |
CN114647361A (zh) | 一种基于人工智能的触摸屏物体定位方法及装置 | |
CN111191580B (zh) | 合成渲染方法、装置、电子设备及介质 | |
CN113191942A (zh) | 生成图像的方法、训练人物检测模型的方法、程序及装置 | |
CN113469984A (zh) | 一种基于yolo结构的显示面板外观检测方法 | |
CN110866487B (zh) | 大规模行人检测与重识别样本集构建方法及装置 | |
Fuchs et al. | Adaptive labeling for interactive mobile information systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211029 |