CN112464939A - 目标检测中的数据增广方法、装置及存储介质 - Google Patents
目标检测中的数据增广方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112464939A CN112464939A CN202110119247.5A CN202110119247A CN112464939A CN 112464939 A CN112464939 A CN 112464939A CN 202110119247 A CN202110119247 A CN 202110119247A CN 112464939 A CN112464939 A CN 112464939A
- Authority
- CN
- China
- Prior art keywords
- target
- sample image
- data
- foreground
- original data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标检测中的数据增广方法、装置及存储介质,属于计算机技术领域,该方法包括:获取多组原始数据,每组原始数据包括样本图像、语义标签和目标标签;从多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;根据N个候选数据的目标标签,获取每个候选数据对应的前景目标;按照预设的目标叠加策略和目标原始数据的语义标签,将前景目标叠加至目标原始数据中样本图像的目标区域,得到叠加后的样本图像;对叠加后的样本图像中前景目标进行标注;可以解决现有数据增广算法存在前景目标数量较少、叠加后的图像存在鬼影、正负样本不均衡的问题;可以增加前景目标的数量、不存在鬼影、减缓正负样本不均衡问题。
Description
技术领域
本申请涉及一种目标检测中的数据增广方法、装置及存储介质,属于计算机技术领域。
背景技术
目标检测是指找出图像中感兴趣的目标的技术。通常,目标检测基于神经网络实现,比如:基于YOLO算法、单激发多盒探测器(Single Shot MultiBox Detector,SSD)等神经网络进行目标检测。在用于进行目标检测的神经网络(即目标检测网络)使用之前,需要使用训练数据对该目标检测网络进行训练。其中,训练数据通常包括样本图像和该样本图像中的目标标签。
由于在实际训练时,训练数据的数量有限,使用数量较少的训练数据来训练目标检测网络会影响网络性能,降低目标检测的准确性。因此,需要对训练数据进行增广处理。
现有的对训练数据进行增广处理的方式包括:将一张图片进行镜像,旋转,缩放,和/或色彩变化等处理,得到增广后的图像;或者,将多张图片混叠生成一张图片,得到增广后的图像。比如:将两张图像按不同透明度叠加(即混合(MixUp)算法),得到增广后的图像。
然而,在目标检测过程中,对于一张图片,前景(物体)的占比往往远少于背景的占比,而镜像,旋转,缩放,和/或色彩变化等处理无法给图片中增加前景个数,会影响目标检测效果。而对于多张图片混叠生成一张图片的方式,虽然可以多张图像拼接生成一张图片,但是叠加后会出现类似鬼影的模糊。同时,现有的方法也会存在正负样本不均衡的问题。
发明内容
本申请提供了一种目标检测中的数据增广方法、装置及存储介质,可以解决现有的目标检测中的数据增广算法存在前景目标数量较少、叠加后的图像存在鬼影、且正负样本不均衡的问题。本申请提供如下技术方案:
第一方面,提供一种目标检测中的数据增广方法,所述方法包括:
获取多组原始数据,每组原始数据包括样本图像、所述样本图像的语义标签和所述样本图像的目标标签;
从所述多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;其中,所述其它原始数据是所述多组原始数据中与所述目标原始数据不同的原始数据,所述N为正整数;
根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标;
按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像;所述目标叠加策略用于指示图像语义与目标之间的映射关系,所述目标包括所述前景目标;
对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签,所述叠加后的样本图像和所述叠加目标标签用于对目标检测网络进行训练。
可选地,所述按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像,包括:
从所述目标叠加策略中确定所述前景目标对应的目标图像语义;
在所述语义标签中确定与所述目标图像语义相符的目标区域,并将所述目标区域映射至所述样本图像;
将所述前景目标叠加至所述样本图像的所述目标区域,得到叠加后的样本图像。
可选地,所述将所述前景目标叠加至所述样本图像的所述目标区域,得到叠加后的样本图像,包括:
从所述样本图像的所述目标区域中随机选择目标叠加位置;
将所述前景目标叠加至所述目标叠加位置,得到叠加后的样本图像。
可选地,所述根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标,包括:
对于每个候选数据中每个目标标签指示的前景目标,获取所述前景目标对应的掩码;
基于所述掩码从所述候选数据的样本图像中抠取出所述前景目标。
可选地,所述按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像之前,还包括:
根据目标检测任务设置所述目标叠加策略,所述目标叠加策略包括所述目标检测任务指示的待检测目标和所述待检测目标对应的图像语义。
可选地,所述目标检测任务指示的待检测目标包括人,所述目标叠加策略包括:人与图像语义为允许人移动的空间之间的映射关系;和/或,
所述目标检测任务指示的待检测目标包括车辆,所述目标叠加策略包括:车辆与图像语义为道路之间的映射关系。
可选地,所述对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签之后,还包括:
使用所述叠加后的样本图像、所述叠加后的样本图像对应的目标标签和叠加目标标签对目标检测网络进行训练,训练后的目标检测网络用于对输入图像进行目标检测。
第二方面,提供一种目标检测中的数据增广装置,所述装置包括:
数据获取模块,用于获取多组原始数据,每组原始数据包括样本图像、所述样本图像的语义标签和所述样本图像的目标标签;
数据确定模块,用于从所述多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;其中,所述其它原始数据是所述多组原始数据中与所述目标原始数据不同的原始数据,所述N为正整数;
前景提取模块,用于根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标;
前景叠加模块,用于按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像;所述目标叠加策略用于指示图像语义与目标之间的映射关系,所述目标包括所述前景目标;
数据标注模块,用于对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签,所述叠加后的样本图像和所述叠加目标标签用于对目标检测网络进行训练。
第三方面,提供一种目标检测中的数据增广装置,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现第一方面提供的目标检测中的数据增广方法。
第四方面,提供一种计算机可读存储介质,所述存储介质中存储有程序,所述程序被处理器执行时用于实现第一方面提供的目标检测中的数据增广方法。
本申请的有益效果至少包括:通过获取多组原始数据,每组原始数据包括样本图像、样本图像的语义标签和样本图像的目标标签;从多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;根据N个候选数据的目标标签,获取每个候选数据对应的前景目标;按照预设的目标叠加策略和目标原始数据的语义标签,将前景目标叠加至目标原始数据中样本图像的目标区域,得到叠加后的样本图像;对叠加后的样本图像中前景目标的目标信息进行标注,得到叠加后的样本图像的叠加目标标签;可以解决现有的目标检测中的数据增广算法存在前景目标数量较少、叠加后的图像存在鬼影、且正负样本不均衡的问题;由于通过语义标签提取出多个候选数据对应的前景目标,叠加到目标数据的样本图像中的合适区域(例如人只能在地面,不能叠加到天空中),从而起到数据增广的作用,同时,可以增加前景目标的数量、且不存在鬼影、同时减缓目标检测模型在训练时遇到的正负样本不均衡问题。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。
附图说明
图1是本申请一个实施例提供的目标检测中的数据增广方法的流程图;
图2是本申请一个实施例提供的样本图像和对应的语义标签的示意图;
图3是本申请一个实施例提供的候选数据中的样本图像、该样本图像的目标标签、目标标签对应的前景目标的示意图;
图4是本申请一个实施例提供的叠加后的样本图像的示意图;
图5是本申请一个实施例提供的目标检测中的数据增广装置的框图;
图6是本申请又一个实施例提供的目标检测中的数据增广装置的框图。
具体实施方式
下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
首先,对本申请涉及的若干名词进行介绍。
图像的掩码操作:根据掩码矩阵(也称作核)重新计算图像中每个像素的值。掩码矩阵中的值表示近邻像素值(包括该像素自身的值)对新像素值有多大影响。
图像前景:是指图像拍摄的主题,图像中除主题之外的内容为图像背景。比如:人物图像中,图像前景为人物,图像中的其它内容为图像背景。
图像语义分割(Semantic Segmentation):是指通过对每个像素进行密集的预测、推断标签来实现细粒度的推理,从而使每个像素都被标记为某个类别。
数据增广(Data Augmentation):是指用于增加训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。
可选地,本申请以各个实施例的执行主体为具有图像处理能力的电子设备为例进行说明,该电子设备可以为终端或服务器,该终端可以为手机、计算机、笔记本电脑、平板电脑、车载计算机等,本实施例不对终端的类型和电子设备的类型作限定。
图1是本申请一个实施例提供的目标检测中的数据增广方法的流程图。该方法至少包括以下几个步骤:
步骤101,获取多组原始数据,每组原始数据包括样本图像、样本图像的语义标签和样本图像的目标标签。
样本图像可以是对目标检测场景进行图像采集得到的,或者是从已有的开源数据集中获取到的。样本图像可以为视频流中的一帧图像,或者是单独的一张图像,本实施例不对样本图像的来源作限定。
样本图像的语义标签是对样本图像进行语义分割后得到的。语义标签包括多种分类的图像区域,每个分类的图像区域中的像素点对应同一种分类的语义。本实施例中,多种分类的图像区域包括至少一个封闭的图像区域。
电子设备获取到样本图像后,可以对该样本图像进行语义分割,得到该样本图像的语义标签;或者,电子设备获取其它设备发送的样本图像的语义标签,本实施例不对电子设备获取样本图像的语义标签的方式作限定。可选地,语义分割方式包括但不限于:基于区域的语义分割、全卷积网络语义分割、或者弱监督语义分割等,本实施例不对样本图像的语义分割方式作限定。
参考图2所示的样本图像21,该样本图像21为在路口监控场景中采集到的,该样本图像21对应的语义标签22,语义标签22包括多种分类、且封闭的图像区域,比如:道路区域、车辆区域、路牌区域、草坪区域、建筑物区域等。图2中的语义标签的分类方式仅以上述示例为例进行说明,在实际实现时,分类方式也可以为其它方式,比如:将道路区域进一步划分为机动车道路区域和人行道道路区域等,本实施例不对语义标签的分类方式作限定。
样本图像的目标标签用于指示样本图像中目标的位置,示意性地,目标的位置通过外接框(Bounding Box)表示。目标标签还可以指示样本图像中目标的分类,目标的分类基于目标检测任务确定。比如:对于车辆检测任务,目标的分类包括车辆和非车辆。又比如:对于人脸检测任务,目标的分类包括人脸和非人脸。上述示例中,目标的分类包括正样本和负样本,在实际实现时,目标的分类也可以仅包括对正样本的分类,本实施例不对目标的分类方式作限定。
其中,外接框是指把目标用最小外接矩形包围的矩形框。
电子设备获取到样本图像后,可以对该样本图像进行标注,得到该样本图像的目标标签;或者,电子设备获取其它设备发送的样本图像的目标标签,本实施例不对电子设备获取样本图像的目标标签的方式作限定。可选地,图像的标注方式包括但不限于:使用自动标注工具标注,或者人工标注,本实施例不对样本图像的目标标注方式作限定。
步骤102,从多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据。
其中,其它原始数据是多组原始数据中与目标原始数据不同的原始数据。N为正整数,N的值大于或等于1、且小于原始数据的总数。
可选地,从多组原始数据中确定一组目标原始数据的方式包括但不限于:从多组原始数据中随机确定一组目标原始数据;或者,按照多组原始数据的排列顺序从先至后依次选择一组目标原始数据。其中,排列顺序包括但不限于:按照存储地址的编号从小到大排列,或者按照存储时间从前至后的顺序排列;或者按照数据大小从小到大的顺序排列等,本实施例不对排列顺序的方式和选择目标原始数据的方式作限定。
候选数据是指待提取前景目标的数据。可选地,从其它原始数据中确定N个候选数据的方式包括但不限于:随机从其它原始数据中选择N个候选数据;或者,从其它原始数据中选择与目标原始数据相邻的N个候选数据,本实施例不对候选数据的选择方式作限定。
步骤103,根据N个候选数据的目标标签,获取每个候选数据对应的前景目标。
前景目标是目标标签指示的图像区域中的图像内容。
根据N个候选数据的目标标签,获取每个候选数据对应的前景目标,包括:对于每个候选数据中每个目标标签指示的前景目标,获取前景目标对应的掩码(Mask);基于掩码从候选数据的样本图像中抠取出前景目标。
比如:参考图3,候选数据中的样本图像为图31,样本图像31对应的目标标签参考图32;使用该目标标签的掩码与样本图像31进行与运算,得到前景目标33。
步骤104,按照预设的目标叠加策略和目标原始数据的语义标签,将前景目标叠加至目标原始数据中样本图像的目标区域,得到叠加后的样本图像;目标叠加策略用于指示图像语义与目标之间的映射关系,该目标包括前景目标。
目标叠加策略预存在电子设备中。可选地,目标叠加策略可以是其它设备发送的,或者是用户自行设置的。对于后一种实现方式,在本步骤之前,还包括:根据目标检测任务设置目标叠加策略,该目标叠加策略包括目标检测任务指示的待检测目标和该待检测目标对应的图像语义。
待检测目标可以为人、车辆和/或动物等,本实施例不对待检测目标的类型作限定。
在一个示例中,目标检测任务由用户输入,目标检测任务指示待检测目标;电子设备中存储有不同目标分类对应的图像语义,电子设备查找待检测目标对应的图像语义,得到目标叠加策略。
在另一个示例中,目标叠加策略由用户输入,即,目标叠加策略中的待检测目标和每个待检测目标对应的图像语义均由用户输入。
当然,目标叠加策略的获取方式也可以为其它方式,本实施例在此不再一一列举。
比如:目标检测任务指示的待检测目标包括人,目标叠加策略包括:人与图像语义为允许人移动的空间之间的映射关系;和/或,目标检测任务指示的待检测目标包括车辆,目标叠加策略包括:车辆与图像语义为道路之间的映射关系。
其中,允许人移动的空间包括但不限于:人行道、非机动车道等,本实施例不对允许人移动的空间作限定。
可选地,按照预设的目标叠加策略和目标原始数据的语义标签,将前景目标叠加至目标原始数据中样本图像的目标区域,得到叠加后的样本图像,包括:从目标叠加策略中确定前景目标对应的目标图像语义;在语义标签中确定与目标图像语义相符的目标区域,并将目标区域映射至样本图像;将前景目标叠加至样本图像的目标区域,得到叠加后的样本图像。
在一个示例中,将前景目标叠加至样本图像的目标区域,得到叠加后的样本图像,包括:从样本图像的目标区域中随机选择目标叠加位置;将前景目标叠加至目标叠加位置,得到叠加后的样本图像。
在其它示例中,目标叠加位置也可以为目标区域中的指定位置,本实施例不对目标叠加位置的确定方式作限定。
比如:参考图4,将图3中的前景目标33按照图2中22所示的图像语义叠加至图2中的样本图像21后,得到叠加后的样本图像41。
可选地,由于前景目标与目标原始数据中的样本图像之间可能存在视觉差异,因此,在得到叠加后的样本图像之后,还可以对叠加后的样本图像进行处理,以缩小该视觉差异。其中,处理方式包括但不限于:将叠加后的样本图像输入预先训练的神经网络中,得到处理后的图像。或者,对叠加后的样本图像进行平滑处理和/或滤波处理等,本实施例不对缩小视觉差异的方式作限定。
其中,预先训练的神经网络用于降低后续添加的前景目标与目标原始数据中的样本图像之间的视觉差异。该神经网络可以是使用训练数据训练得到的,训练数据包括样本输入图像和该样本输入图像对应的期望输出图像。在一个示例中,样本输入图像是对期望输出图像中的前景目标按照本步骤中的叠加方式进行叠加处理后得到的。
步骤105,对叠加后的样本图像中前景目标的目标信息进行标注,得到叠加后的样本图像的叠加目标标签,该叠加后的样本图像和叠加目标标签用于对目标检测网络进行训练。
由于叠加后的样本图像是基于原始的样本图像得到的,因此,叠加后的样本图像对应的目标标签包括:叠加目标标签和原始的样本图像对应的目标标签。
其中,对叠加后的样本图像中前景目标的目标信息进行标注,包括:对前景目标的位置以外接框的形式进行标注。当然,在标注时,还可以对前景目标的目标分类进行标注,本实施例不对目标信息的内容作限定。
可选地,对叠加后的样本图像中前景目标的目标信息进行标注,得到叠加后的样本图像的叠加目标标签之后,还包括:使用叠加后的样本图像、叠加后的样本图像对应的目标标签和叠加目标标签对目标检测网络进行训练,训练后的目标检测网络用于对输入图像进行目标检测。
综上所述,本实施例提供的目标检测中的数据增广方法,通过获取多组原始数据,每组原始数据包括样本图像、样本图像的语义标签和样本图像的目标标签;从多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;根据N个候选数据的目标标签,获取每个候选数据对应的前景目标;按照预设的目标叠加策略和目标原始数据的语义标签,将前景目标叠加至目标原始数据中样本图像的目标区域,得到叠加后的样本图像;对叠加后的样本图像中前景目标的目标信息进行标注,得到叠加后的样本图像的叠加目标标签;可以解决现有的目标检测中的数据增广算法存在前景目标数量较少、叠加后的图像存在鬼影、且正负样本不均衡的问题;由于通过语义标签提取出多个候选数据对应的前景目标,叠加到目标数据的样本图像中的合适区域(例如人只能在地面,不能叠加到天空中),从而起到数据增广的作用,同时,可以增加前景目标的数量、且不存在鬼影、同时减缓目标检测模型在训练时遇到的正负样本不均衡问题。
图5是本申请一个实施例提供的目标检测中的数据增广装置的框图。该装置至少包括以下几个模块:数据获取模块510、数据确定模块520、前景提取模块530、前景叠加模块540和数据标注模块550。
数据获取模块510,用于获取多组原始数据,每组原始数据包括样本图像、所述样本图像的语义标签和所述样本图像的目标标签;
数据确定模块520,用于从所述多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;其中,所述其它原始数据是所述多组原始数据中与所述目标原始数据不同的原始数据,所述N为正整数;
前景提取模块530,用于根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标;
前景叠加模块540,用于按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像;所述目标叠加策略用于指示图像语义与目标之间的映射关系,所述目标包括所述前景目标;
数据标注模块550,用于对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签,所述叠加后的样本图像和所述叠加目标标签用于对目标检测网络进行训练。
相关细节参考上述方法实施例。
需要说明的是:上述实施例中提供的目标检测中的数据增广装置在进行目标检测中的数据增广时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将目标检测中的数据增广装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的目标检测中的数据增广装置与目标检测中的数据增广方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图6是本申请一个实施例提供的目标检测中的数据增广装置的框图。该装置至少包括处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如:4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的目标检测中的数据增广方法。
在一些实施例中,目标检测中的数据增广装置还可选包括有:外围设备接口和至少一个外围设备。处理器601、存储器602和外围设备接口之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口相连。示意性地,外围设备包括但不限于:射频电路、触摸显示屏、音频电路、和电源等。
当然,目标检测中的数据增广装置还可以包括更少或更多的组件,本实施例对此不作限定。
可选地,本申请还提供有一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的目标检测中的数据增广方法。
可选地,本申请还提供有一种计算机产品,该计算机产品包括计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的目标检测中的数据增广方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标检测中的数据增广方法,其特征在于,所述方法包括:
获取多组原始数据,每组原始数据包括样本图像、所述样本图像的语义标签和所述样本图像的目标标签;
从所述多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;其中,所述其它原始数据是所述多组原始数据中与所述目标原始数据不同的原始数据,所述N为正整数;
根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标;
按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像;所述目标叠加策略用于指示图像语义与目标之间的映射关系,所述目标包括所述前景目标;
对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签,所述叠加后的样本图像和所述叠加目标标签用于对目标检测网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像,包括:
从所述目标叠加策略中确定所述前景目标对应的目标图像语义;
在所述语义标签中确定与所述目标图像语义相符的目标区域,并将所述目标区域映射至所述样本图像;
将所述前景目标叠加至所述样本图像的所述目标区域,得到叠加后的样本图像。
3.根据权利要求2所述的方法,其特征在于,所述将所述前景目标叠加至所述样本图像的所述目标区域,得到叠加后的样本图像,包括:
从所述样本图像的所述目标区域中随机选择目标叠加位置;
将所述前景目标叠加至所述目标叠加位置,得到叠加后的样本图像。
4.根据权利要求1所述的方法,其特征在于,所述根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标,包括:
对于每个候选数据中每个目标标签指示的前景目标,获取所述前景目标对应的掩码;
基于所述掩码从所述候选数据的样本图像中抠取出所述前景目标。
5.根据权利要求1所述的方法,其特征在于,所述按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像之前,还包括:
根据目标检测任务设置所述目标叠加策略,所述目标叠加策略包括所述目标检测任务指示的待检测目标和所述待检测目标对应的图像语义。
6.根据权利要求5所述的方法,其特征在于,
所述目标检测任务指示的待检测目标包括人,所述目标叠加策略包括:人与图像语义为允许人移动的空间之间的映射关系;和/或,
所述目标检测任务指示的待检测目标包括车辆,所述目标叠加策略包括:车辆与图像语义为道路之间的映射关系。
7.根据权利要求1所述的方法,其特征在于,所述对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签之后,还包括:
使用所述叠加后的样本图像、所述叠加后的样本图像对应的目标标签和叠加目标标签对目标检测网络进行训练,训练后的目标检测网络用于对输入图像进行目标检测。
8.一种目标检测中的数据增广装置,其特征在于,所述装置包括:
数据获取模块,用于获取多组原始数据,每组原始数据包括样本图像、所述样本图像的语义标签和所述样本图像的目标标签;
数据确定模块,用于从所述多组原始数据中确定一组目标原始数据,并从其它原始数据中确定N个候选数据;其中,所述其它原始数据是所述多组原始数据中与所述目标原始数据不同的原始数据,所述N为正整数;
前景提取模块,用于根据所述N个候选数据的目标标签,获取每个候选数据对应的前景目标;
前景叠加模块,用于按照预设的目标叠加策略和所述目标原始数据的语义标签,将所述前景目标叠加至所述目标原始数据中样本图像的目标区域,得到叠加后的样本图像;所述目标叠加策略用于指示图像语义与目标之间的映射关系,所述目标包括所述前景目标;
数据标注模块,用于对所述叠加后的样本图像中所述前景目标的目标信息进行标注,得到所述叠加后的样本图像的叠加目标标签,所述叠加后的样本图像和所述叠加目标标签用于对目标检测网络进行训练。
9.一种目标检测中的数据增广装置,其特征在于,所述装置包括处理器和存储器;所述存储器中存储有程序,所述程序由所述处理器加载并执行以实现如权利要求1至7任一项所述的目标检测中的数据增广方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有程序,所述程序被处理器执行时用于实现如权利要求1至7任一项所述的目标检测中的数据增广方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110119247.5A CN112464939A (zh) | 2021-01-28 | 2021-01-28 | 目标检测中的数据增广方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110119247.5A CN112464939A (zh) | 2021-01-28 | 2021-01-28 | 目标检测中的数据增广方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112464939A true CN112464939A (zh) | 2021-03-09 |
Family
ID=74802796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110119247.5A Pending CN112464939A (zh) | 2021-01-28 | 2021-01-28 | 目标检测中的数据增广方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112464939A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155177A (zh) * | 2021-11-18 | 2022-03-08 | 中汽创智科技有限公司 | 一种图像增广方法、装置、电子设备及存储介质 |
CN115205311A (zh) * | 2022-07-15 | 2022-10-18 | 小米汽车科技有限公司 | 图像处理方法、装置、车辆、介质及芯片 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325385A (zh) * | 2017-07-31 | 2019-02-12 | 株式会社理光 | 目标检测和区域分割方法、装置和计算机可读存储介质 |
CN110929786A (zh) * | 2019-11-22 | 2020-03-27 | 湃方科技(北京)有限责任公司 | 一种数据增广方法及电子设备 |
CN111783902A (zh) * | 2020-07-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 数据增广、业务处理方法、装置、计算机设备和存储介质 |
-
2021
- 2021-01-28 CN CN202110119247.5A patent/CN112464939A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325385A (zh) * | 2017-07-31 | 2019-02-12 | 株式会社理光 | 目标检测和区域分割方法、装置和计算机可读存储介质 |
CN110929786A (zh) * | 2019-11-22 | 2020-03-27 | 湃方科技(北京)有限责任公司 | 一种数据增广方法及电子设备 |
CN111783902A (zh) * | 2020-07-30 | 2020-10-16 | 腾讯科技(深圳)有限公司 | 数据增广、业务处理方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
ZHENGENG YANG 等: "Small Object Augmentation of Urban Scenes for Real-Time Semantic Segmentation", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155177A (zh) * | 2021-11-18 | 2022-03-08 | 中汽创智科技有限公司 | 一种图像增广方法、装置、电子设备及存储介质 |
CN114155177B (zh) * | 2021-11-18 | 2024-07-05 | 中汽创智科技有限公司 | 一种图像增广方法、装置、电子设备及存储介质 |
CN115205311A (zh) * | 2022-07-15 | 2022-10-18 | 小米汽车科技有限公司 | 图像处理方法、装置、车辆、介质及芯片 |
CN115205311B (zh) * | 2022-07-15 | 2024-04-05 | 小米汽车科技有限公司 | 图像处理方法、装置、车辆、介质及芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | DMA-Net: DeepLab with multi-scale attention for pavement crack segmentation | |
Hao et al. | An attention-based system for damage assessment using satellite imagery | |
CN110163831B (zh) | 三维虚拟沙盘的物体动态展示方法、装置及终端设备 | |
CN111951154B (zh) | 包含背景和介质的图片的生成方法及装置 | |
CN108021923A (zh) | 一种用于深度神经网络的图像特征提取方法 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
CN111127358B (zh) | 图像处理方法、装置及存储介质 | |
CN115512251A (zh) | 基于双分支渐进式特征增强的无人机低照度目标跟踪方法 | |
CN112464939A (zh) | 目标检测中的数据增广方法、装置及存储介质 | |
CN112200189B (zh) | 基于SPP-YOLOv3的车型识别方法、装置及计算机可读存储介质 | |
CN112668577A (zh) | 大尺度图像中目标物体的检测方法、终端及装置 | |
CN114241432A (zh) | 车牌识别方法、设备及存储介质 | |
CN113159200A (zh) | 对象分析方法、装置及存储介质 | |
CN114049488A (zh) | 一种多维信息融合的远距离弱小目标检测方法和终端 | |
CN117237755A (zh) | 目标检测模型训练方法及装置、图像检测方法及装置 | |
CN116543261A (zh) | 用于图像识别的模型训练方法、图像识别方法设备及介质 | |
CN112686314B (zh) | 基于远距离拍摄场景的目标检测方法、装置及存储介质 | |
CN114550175A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 | |
CN114359048A (zh) | 图像的数据增强方法、装置、终端设备及存储介质 | |
CN112258416A (zh) | 图像处理方法、装置、电子设备 | |
CN104809438B (zh) | 一种检测电子眼的方法和设备 | |
Liu et al. | WebAR Object Detection Method Based on Lightweight Multiscale Feature Fusion | |
CN116363365A (zh) | 基于半监督学习的图像分割方法及相关设备 | |
Pototzky et al. | Self-supervised learning for object detection in autonomous driving | |
Chopra et al. | Moving object detection using satellite navigation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210309 |