CN117315406A - 一种样本图像处理方法、装置及设备 - Google Patents
一种样本图像处理方法、装置及设备 Download PDFInfo
- Publication number
- CN117315406A CN117315406A CN202311597645.3A CN202311597645A CN117315406A CN 117315406 A CN117315406 A CN 117315406A CN 202311597645 A CN202311597645 A CN 202311597645A CN 117315406 A CN117315406 A CN 117315406A
- Authority
- CN
- China
- Prior art keywords
- image
- background
- mask
- edge
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 239000000463 material Substances 0.000 claims abstract description 128
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 30
- 239000002131 composite material Substances 0.000 claims description 14
- 230000007797 corrosion Effects 0.000 claims description 10
- 238000005260 corrosion Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 abstract description 27
- 238000004590 computer program Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 240000004282 Grewia occidentalis Species 0.000 description 7
- 230000007704 transition Effects 0.000 description 6
- 101100269850 Caenorhabditis elegans mask-1 gene Proteins 0.000 description 5
- 238000005530 etching Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种样本图像处理方法、装置及设备,该方法包括:获取第一素材图像和第二素材图像;其中,第一素材图像中包含至少一个第一对象,第二素材图像中包含至少一个区别于第一对象的第二对象;确定与第一对象所对应的边缘遮罩图;确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像;基于第一对象的关联信息、位置信息、边缘遮罩图以及背景图像,重构出样本图像。本申请可以高效低成本的扩增训练样本数据量,提高了训练样本的丰富度和平衡性。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种样本图像处理方法、装置及设备。
背景技术
自动驾驶场景对道路障碍物检测识别的准确性具有较高的要求,为了高效准确的进行障碍物检测识别,通常利用深度学习技术来实现,但是深度学习技术依靠障碍物完整、丰富的训练数据集完成模型训练,才可以高效准确的识别障碍物。
目前,自动驾驶领域内的训练数据集多为真实场景下的真实场景图片。然而,在某些特定场景中缺少特定种类障碍物的训练样本,例如,在高速公路上缺少公交车的训练样本。因此,存在训练数据集数据类别不平衡的问题。若想得到特定场景下特定种类障碍物的训练样本,需要现场采集,这样不仅需要大量的人力物力,而且获取到训练样本的数量是有限的,存在获取训练样本成本高的问题。
发明内容
本发明提供了一种样本图像处理方法、装置及设备,以高效低成本的扩增训练样本数据量,提高训练样本的丰富度和平衡性。
根据本发明的第一方面,提供了一种样本图像处理方法,该方法包括:
获取第一素材图像和第二素材图像;其中,所述第一素材图像中包含至少一个第一对象,所述第二素材图像中包含至少一个区别于所述第一对象的第二对象;
确定与所述第一对象所对应的边缘遮罩图;
确定所述第二对象在所述第二素材图像中的位置信息,并依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像;
基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像。
根据本发明的第二方面,提供了一种样本图像处理装置,该装置包括:
待处理图像获取模块,用于获取第一素材图像和第二素材图像;其中,所述第一素材图像中包含至少一个第一对象,所述第二素材图像中包含至少一个区别于所述第一对象的第二对象;
遮罩图确定模块,用于确定与所述第一对象所对应的边缘遮罩图;
背景图像处理模块,用于确定所述第二对象在所述第二素材图像中的位置信息,并依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像;
样本图像重构模块,用于基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像。
根据本发明的第三方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的样本图像处理方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的样本图像处理方法。
本发明实施例的技术方案,通过获取第一素材图像和第二素材图像,其中,第一素材图像中包含至少一个第一对象,所述第二素材图像中包含至少一个区别于所述第一对象的第二对象,进而确定与第一对象所对应的边缘遮罩图,进一步的,确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像,从而,基于第一对象的关联信息、位置信息、边缘遮罩图以及背景图像,重构出样本图像。本申请可以高效低成本的扩增训练样本数据量,提高了训练样本的丰富度和平衡性。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种样本图像处理方法的流程图;
图2是根据本发明实施例二提供的一种样本图像处理方法的流程图;
图3是根据本发明实施例三提供的一种样本图像处理装置的结构示意图;
图4是实现本发明实施例的样本图像处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是本发明实施例一提供的一种样本图像处理方法的流程图,本实施例可适用于基于训练样本库中的现有样本,扩充训练样本,增加稀有样本数据量的情况,该方法可以由样本图像处理装置来执行,该样本图像处理装置可以采用硬件和/或软件的形式实现,该样本图像处理装置可配置于终端和/或服务器中。如图1所示,该方法包括:
S110、获取第一素材图像和第二素材图像。
其中,第一素材图像中包含至少一个第一对象。第一素材图像可以为用于训练自动驾驶场景对道路障碍物检测识别任务的训练样本图像。第一对象为预先设定的交通工具类型,例如,公交车,大型客车,货车,被截断的汽车等。第一对象为预设对象类型的交通工具。例如,第一素材图像可以是开源数据库中的样本图像。第一素材图像中可以包含一个或者多个第一对象。
其中,第二素材图像为特定场景的图像,第二素材图像中包含至少一个第二对象,第二对象为区别于第一对象的对象。第二素材图像中还包含车道线。第二素材图像可以是在目标场景中拍摄的实景图像,在拍摄第二素材图像时,保证摄像装置所在的拍摄位点可以拍摄到车道线和第二对象。第二素材图像中可以包含一个或多个第二对象。
为了清楚的说明第一素材图像和第二素材图像,接下来以一个具体示例进行举例说明。对于自动驾驶车辆在高速路上可以精准地识别各种车辆的自动驾驶训练任务,若使最终所确定的自动驾驶车辆在高速公路上对各种车辆的识别准确率较为理想,需要基于大量高速公路上有各种类型车辆的样本图像对自动驾驶车辆进行训练。在具体应用中,可以统计现有素材库中各种类型对象的占比值,将占比值小于预设阈值的对象类型作为第一对象。例如,现有素材库样本图像中大多为高速公路上有小汽车的样本图像,缺少高速公路上有公交车,以及,高速公路上有卡车的样本图像。在这种情形下,需要增加高速路上有公交车的样本图像,以及,高速路上有卡车的样本图像,在这种情形下,第一对象为公交车或卡车,现有样本库中任意包含公交车或者卡车的样本图像均可以作为第一素材图像。第二素材图像可以是在高速公路上实景拍摄的真实图像,第二素材图像中包含车道线,第二素材图像中所包含的交通工具为第二对象。
在本实施例中,第一素材图像和第二素材图像都具有标注信息,标注信息保存于标注文件中。第一素材图像标注信息包括第一对象对应的矩形包围框的四角坐标信息,以及,第一对象对应的三维标注信息,三维标注信息为第一对象三维包围框各个顶点对应的坐标信息。第二素材图像标注信息包括第二对象对应的矩形包围框的四角坐标信息,第二对象对应的三维标注信息,以及车道线位置信息。在获取第一素材图像以及第二素材图像的同时,获取第一素材对应的标注文件,以及,第二素材图像对应的标注文件。
S120、确定与第一对象所对应的边缘遮罩图。
其中,边缘遮罩图为突出第一对象边缘轮廓的二值图像。在边缘遮罩图中,第一对象边缘部位的像素值为255,非边缘部位以及背景的像素值为0,即为边缘遮罩图中,第一对象的边缘部位为白色,非边缘部位以及背景为黑色。
可选的,确定与第一对象所对应的边缘遮罩图,具体包括以下内容:
(1)将第一素材图像输入至掩膜神经网络模型中,得到与第一对象所对应的对象掩膜图像mask1。
其中,掩膜神经网络模型为预先训练好的,用于根据第一素材图像生成第一对象对应的对象掩膜图像。本领域技术人员应当理解,可以先基于相应的训练集训练,并基于验证集对训练得到的掩膜神经网络模型进行验证,在验证通过时所得到的模型,作为最终可以使用的掩膜神经网络模型,其具体的训练过程在本实施例中不再赘述。
具体的,将第一素材图像输入至掩膜神经网络模型中,掩膜神经网络模型输出对象掩膜图像mask1。在mask1中,第一对象区域对应的像素点为白色,背景区域对应的像素点为黑色。
(2)对对象掩膜图像进行取反处理,得到背景掩膜图像mask2。
在本实施例中,在背景掩膜图像mask2中,第一对象区域对应的像素点为黑色,背景区域对应的像素点为白色。
(3)分别对对象掩膜图像mask1和背景掩膜图像mask2进行腐蚀处理,得到对象掩膜腐蚀图像和背景掩膜腐蚀图像。
在本实施例中,对对象掩膜图像mask1和背景掩膜图像mask2进行腐蚀处理,即为沿着黑白像素边沿白色像素变少,从而得到对象掩膜腐蚀图像和背景掩膜腐蚀图像。
(4)对对象掩膜腐蚀图像与背景掩膜腐蚀图像作差,得到边缘轮廓图像,并对边缘轮廓图像取反处理,得到与第一对象所对应的边缘遮罩图。
在本实施例中,对象掩膜腐蚀图像与背景掩膜腐蚀图像对应的像素位置上的像素值分别作差,得到的图像为边缘轮廓图像。进一步的,将边缘轮廓图像中的黑色像素转换为白色像素,将边缘轮廓图像中的白色像素转换为黑色像素,即可得到与第一对象所对应的边缘遮罩图。
S130、确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像。
其中,位置信息具体为在第二素材图像中,第二对象对应矩形包围框的四角坐标信息。背景图像可以理解为抹去第二素材图像中第二对象后的图像。
可选的,确定背景图像的方法具体为:确定第二素材图像中的第二对象所属区域和背景所属区域;基于背景所属区域的像素信息,对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像。
在本实施例中,基于第二对象在第二素材图像中的位置信息,可以确定第二对象所属区域和背景所属区域。在得到第二对象对应矩形包围框的四角坐标信息的基础上,即可确定第二对象的矩形包围框。以矩形包围框为界限,将矩形包围框内的图像区域确定为第二对象所属区域,将矩形包围框外的图像区域确定为背景所属区域。
进一步的,基于背景所属区域的像素信息,对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像具体包括:基于背景所属区域的像素信息以及预先训练好的图像修复模型,确定第二对象所属区域各像素点对应的待填充通道值;将待填充通道值填充至第二对象所属区域,得到不包括第二对象的背景图像。
其中,背景所属区域的像素信息为背景所属区域像素点对应的通道值。每个像素点均有R、G、B三个通道,每一个通道都有对应的通道值,在此既可以将R、G、B三个通道的均值作为像素点的通道值,也可以将R、G、B三个通道中任意一个通道的通道值作为采样点的通道值。待填充通道值为即将填充至第二对象所属区域内的通道值。图像修复模型为预先训练好的网络模型,例如,图像修复模型为Inpainting网络模型。
在本实施例中,将背景所属区域像素点对应的通道值输入至预先训练好的图像修复模型中,图像修复模型可以输出第二对象所属区域各像素点对应的待填充通道值。从而将待填充通道值填充至第二对象所属区域的像素点中,得到不包括第二对象的背景图像。
S140、基于第一对象的关联信息、位置信息、边缘遮罩图以及背景图像,重构出样本图像。
其中,第一对象的关联信息包括第一对象图像。第一对象图像为从第一素材图像中提取出来的第一对象对应的图像内容。可以理解的是,第一对象图像为第一素材图像的一部分。样本图像为最终构建出的图像。在上述示例性的基础上,样本图像可以是高速公路上有公交车的图像,或者,高速路上有卡车的图像。
具体的,根据第二对象在第二素材图像中的位置信息,将第一对象图像缩放至与第二对象大小一致,得到第一对象缩放图,随后将第一对象缩放图放置于背景图像第二对象所属区域上,此时便得到了背景图像与第一对象的组合图像,将此图像称之为目标合成图像。由于目标合成图像中,背景所属区域与第一对象之间的过渡区存在毛刺,为了得到过渡区更加平滑的合成图像,进一步的,基于边缘遮罩图对目标合成图中的过渡区进行平滑处理,最终确定的图像为重构的样本图像。
在本实施例中,将第一对象在样本图像中的位置信息称之为目标位置信息,将目标位置信息存储于预设存储单元中,作为样本图像的标注信息。
特别的,在得到最终的样本图像后,还需要进一步的判断车道线是否位于样本图像中第一对象所在的位置处,若是,则需要进一步调整车道线的位置坐标,从而保证样本图像中车道线的完整性。
本发明实施例的技术方案,通过获取第一素材图像和第二素材图像,其中,第一素材图像中包含至少一个第一对象,第二素材图像中包含至少一个区别于第一对象的第二对象,进而确定与第一对象所对应的边缘遮罩图,进一步的,确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像,从而,基于第一对象的关联信息、位置信息、边缘遮罩图以及背景图像,重构出样本图像。本申请可以高效低成本的扩增训练样本数据量,提高了训练样本的丰富度和平衡性。
实施例二
图2是本发明实施例二提供的一种样本图像处理方法的流程图,在前述实施例的基础上,对S140作了进一步细化。其中,与上述实施例相同或者相应的技术术语在此不再赘述。
如图2所示,该方法包括:
S210、获取第一素材图像和第二素材图像;其中,第一素材图像中包含至少一个第一对象,第二素材图像中包含至少一个区别于第一对象的第二对象。
S220、确定与第一对象所对应的边缘遮罩图。
S230、确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像。
S240、基于第一对象的关联信息和位置信息,确定与第二对象大小一致的第一对象缩放图。
其中,第一对象的关联信息包括第一对象图像和第一矩形包围框。第一矩形包围框为第一素材图像中第一对象对应的矩形包围框。第一对象缩放图为对第一对象进行缩小或者放大后的图像。
可选的,确定第一对象缩放图具体包括以下步骤:
S2401、基于位置信息,确定第二素材图像中第二对象对应的第二矩形包围框。
在本实施例中,由于位置信息为在第二素材图像中,第二对象对应的矩形包围框的四角坐标信息。可以理解的是,在得到第二素材图像中第二对象对应的四角坐标信息的基础上,可以自动生成第二矩形包围框。例如,若第二素材图像中第二对象对应的四角坐标信息分别为:左上角为(15,10),右上角为(65,10),左下角为(15,20),右下角为(65,20),则第二矩形包围框为50×10的矩形框。
S2402、基于第二矩形包围框以及第一对象的关联信息,对第一对象进行等比例缩放,得到与第二对象大小一致的第一对象缩放图。
具体的,基于第一矩形包围框的长度和第二矩形包围框的长度,确定第一对象的缩放比例;基于缩放比例,对第一对象图像进行缩放处理,得到与第二对象大小一致的第一对象缩放图。
在本实施例中,第一对象的关联信息中包含在第一素材图像中第一对象对应的第一矩形包围框,根据第一矩形包围框的长度和第二矩形包围框的长度,可以确定第一对象的缩放比例,从而将第一对象图像按照缩放比例进行长和宽的等比例缩放,从而得到图像内容为第一对象、图像大小与第二对象大小一致的第一对象缩放图。
S250、基于第一对象缩放图和背景图像,确定目标合成图像。
在本实施例中,将第一对象缩放图放置于背景图像第二对象所属区域上,此时便得到了背景图像与第一对象的组合图,将此图称之为目标合成图像。
S260、基于目标合成图像和边缘遮罩图,重构出样本图像。
在本实施例中,目标合成图像中,背景所属区域与第一对象之间的过渡区存在毛刺。基于边缘遮罩图对目标合成图像中的过渡区进行平滑处理。例如,将目标合成图像和边缘遮罩图输入至预先训练好的Inpainting网络中,Inpainting网络可以输出优化后的样本图像。
可选的,基于边缘遮罩图对目标合成图像中的过渡区进行平滑处理的方式具体为:基于边缘遮罩图,确定第一素材图像中的边缘像素点和非边缘像素点;基于非边缘像素点在第一素材图像中采样点对应的通道值,确定边缘像素点的待应用通道值;基于边缘像素点,确定所述目标合成图像的目标边缘像素点,并将目标边缘像素点的通道值赋值为待应用通道值,得到样本图像。
在本实施例中,边缘遮罩图为突出第一对象边缘轮廓的二值图像,因此基于边缘遮罩图的像素值可以确定第一素材图像中的边缘像素点和非边缘像素点。进一步的,由于边缘遮罩图与第一素材图像的大小是相等的,在确定边缘遮罩图中非边缘像素点位置的基础上,第一素材图像中的非边缘像素点对应的采样点与边缘遮罩图中非边缘像素点位置是相同的,从而可以确定非边缘像素点在第一素材图像中的采样点。进而,对每个边缘像素点周围的非边缘像素点的采样点通道值进行数值运算,例如,局部平均、取最大值、取最小值或插值运算等,得到每个边缘像素点的待应用通道值。
进一步的,目标合成图像中第一对象缩放图是将第一素材图像中第一对象放大或者缩小确定的。第一素材图像中的边缘像素点即为第一对象的边缘像素点,在确定第一素材图像中的边缘像素点的基础上,根据第一对象的缩放比例以及第一素材图像中的边缘像素点的具体位置,可以推算出目标合成图像的目标边缘像素点的位置。最后,将目标合成图像中每个目标边缘像素点的通道值赋值为待应用通道值,从而得到样本图像。
本发明实施例的技术方案,在重构出样本图像时,基于第一对象的关联信息和位置信息,确定与第二对象大小一致的第一对象缩放图,进而基于第一对象缩放图和背景图像确定的目标合成图像,由于调整了第一对象的大小,使得画面更加协调,提高了第一对象在背景图像中的真实性,且第一对象的位置姿态更加符合实际状态。进一步的,基于目标合成图像和边缘遮罩图,重构出样本图像,解决了目标合成图像边缘出现锯齿状或者弯曲,导致目标合成图像中的第一对象与背景割裂,引起融合效果不佳的技术问题,实现了图像边缘平稳过渡,进而提高图像的显示效果。
实施例三
图3是本发明实施例三提供的一种样本图像处理装置的结构示意图。如图3所示,该装置包括:待处理图像获取模块310、遮罩图确定模块320、背景图像处理模块330以及样本图像重构模块340。
其中,待处理图像获取模块310,用于获取第一素材图像和第二素材图像;其中,所述第一素材图像中包含第一对象,所述第一对象包括至少一个预设对象,所述第二素材图像中的第二对象为区别于所述至少一个预设对象的对象;
遮罩图确定模块320,用于确定与所述第一对象所对应的边缘遮罩图;
背景图像处理模块330,用于确定所述第二对象在所述第二素材图像中的位置信息,并依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像;
样本图像重构模块340,用于基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像。
本发明实施例的技术方案,通过获取第一素材图像和第二素材图像,其中,第一素材图像中包含至少一个第一对象,第二素材图像中包含至少一个区别于第一对象的第二对象,进而确定与第一对象所对应的边缘遮罩图,进一步的,确定第二对象在第二素材图像中的位置信息,并依据第二素材图像的像素信息对第二对象所属区域进行像素填充处理,得到不包括第二对象的背景图像,从而,基于第一对象的关联信息、位置信息、边缘遮罩图以及背景图像,重构出样本图像。本申请可以高效低成本的扩增训练样本数据量,提高了训练样本的丰富度和平衡性。
可选的,遮罩图确定模块320具体用于将所述第一素材图像输入至目标神经网络中,得到与所述第一对象所对应的边缘遮罩图。
可选的,背景图像处理模块330包括:
背景区域确定单元,用于确定所述第二素材图像中的第二对象所属区域和背景所属区域;
背景图像确定单元,用于基于所述背景所属区域的像素信息,对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像。
可选的,背景图像确定单元具体用于基于所述背景所属区域的像素信息以及预先训练好的图像修复模型,确定所述第二对象所属区域各像素点对应的待填充通道值;将所述待填充通道值填充至所述第二对象所属区域,得到不包括所述第二对象的背景图像。
可选的,样本图像重构模块340包括:
缩放图确定单元,用于基于所述第一对象的关联信息和所述位置信息,确定与所述第二对象大小一致的第一对象缩放图;
目标合成图像确定单元,用于基于所述第一对象缩放图和所述背景图像,确定目标合成图像;
样本图像确定单元,用于基于所述目标合成图像和所述边缘遮罩图,重构出样本图像。
在上述实施例的基础上,缩放图确定单元包括:
第二包围框确定子单元,用于基于所述位置信息,确定所述第二素材图像中第二对象对应的第二矩形包围框;
缩放图确定子单元,用于基于所述第二矩形包围框以及所述第一对象的关联信息,对所述第一对象进行等比例缩放,得到与所述第二对象大小一致的第一对象缩放图。
在上述实施例的基础上,缩放图确定子单元具体用于基于所述第一矩形包围框的长度和所述第二矩形包围框的长度,确定第一对象的缩放比例;基于所述缩放比例,对所述第一对象图像进行缩放处理,得到与所述第二对象大小一致的第一对象缩放图。
在上述实施例的基础上,样本图像确定单元包括:
像素点区分子单元,用于基于所述边缘遮罩图,确定所述第一素材图像中的边缘像素点和非边缘像素点;
通道值确定子单元,用于基于所述非边缘像素点在所述第一素材图像中采样点对应的通道值,确定所述边缘像素点的待应用通道值;
样本图像确定子单元,用于将所述目标合成图像边缘像素点的通道值赋值为待应用通道值,重构出样本图像。
本发明实施例所提供的样本图像处理装置可执行本发明任意实施例所提供的样本图像处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如样本图像处理方法。
在一些实施例中,样本图像处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的样本图像处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行样本图像处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种样本图像处理方法,其特征在于,包括:
获取第一素材图像和第二素材图像;其中,所述第一素材图像中包含至少一个第一对象,所述第二素材图像中包含至少一个区别于所述第一对象的第二对象;
确定与所述第一对象所对应的边缘遮罩图;
确定所述第二对象在所述第二素材图像中的位置信息,并依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像;
基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像。
2.根据权利要求1所述的方法,其特征在于,所述确定与所述第一对象所对应的边缘遮罩图,包括:
将所述第一素材图像输入至掩膜神经网络模型中,得到与所述第一对象对应的对象掩膜图像;
对所述对象掩膜图像进行取反处理,得到背景掩膜图像;
分别对所述对象掩膜图像和所述背景掩膜图像进行腐蚀处理,得到对象掩膜腐蚀图像和背景掩膜腐蚀图像;
对所述对象掩膜腐蚀图像与所述背景掩膜腐蚀图像作差,得到边缘轮廓图像,并对所述边缘轮廓图像取反处理,得到与所述第一对象所对应的边缘遮罩图。
3.根据权利要求1所述的方法,其特征在于,所述依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像,包括:
确定所述第二素材图像中的第二对象所属区域和背景所属区域;
基于所述背景所属区域的像素信息,对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像。
4.根据权利要求3所述的方法,其特征在于,所述基于所述背景所属区域的像素信息,对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像,包括:
基于所述背景所属区域的像素信息以及预先训练好的图像修复模型,确定所述第二对象所属区域各像素点对应的待填充通道值;
将所述待填充通道值填充至所述第二对象所属区域,得到不包括所述第二对象的背景图像。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像,包括:
基于所述第一对象的关联信息和所述位置信息,确定与所述第二对象大小一致的第一对象缩放图;
基于所述第一对象缩放图和所述背景图像,确定目标合成图像;
基于所述目标合成图像和所述边缘遮罩图,重构出样本图像。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一对象的关联信息和所述位置信息,确定与所述第二对象大小一致的第一对象缩放图,包括:
基于所述位置信息,确定所述第二素材图像中第二对象对应的第二矩形包围框;
基于所述第二矩形包围框以及所述第一对象的关联信息,对所述第一对象进行等比例缩放,得到与所述第二对象大小一致的第一对象缩放图。
7.根据权利要求6所述的方法,其特征在于,所述第一对象的关联信息包括第一对象图像和第一矩形包围框,所述基于所述第二矩形包围框以及所述第一对象的关联信息,对所述第一对象进行等比例缩放,得到与所述第二对象大小一致的第一对象缩放图,包括:
基于所述第一矩形包围框的长度和所述第二矩形包围框的长度,确定第一对象的缩放比例;
基于所述缩放比例,对所述第一对象图像进行缩放处理,得到与所述第二对象大小一致的第一对象缩放图。
8.根据权利要求5所述的方法,其特征在于,所述基于所述目标合成图像和所述边缘遮罩图,重构出样本图像,包括:
基于所述边缘遮罩图,确定所述第一素材图像中的边缘像素点和非边缘像素点;
基于所述非边缘像素点在所述第一素材图像中采样点对应的通道值,确定所述边缘像素点的待应用通道值;
基于所述边缘像素点,确定所述目标合成图像的目标边缘像素点,并将所述目标边缘像素点的通道值赋值为所述待应用通道值,得到样本图像。
9.一种样本图像处理装置,其特征在于,包括:
待处理图像获取模块,用于获取第一素材图像和第二素材图像;其中,所述第一素材图像中包含至少一个第一对象,所述第二素材图像中包含至少一个区别于所述第一对象的第二对象;
遮罩图确定模块,用于确定与所述第一对象所对应的边缘遮罩图;
背景图像处理模块,用于确定所述第二对象在所述第二素材图像中的位置信息,并依据所述第二素材图像的像素信息对所述第二对象所属区域进行像素填充处理,得到不包括所述第二对象的背景图像;
样本图像重构模块,用于基于所述第一对象的关联信息、所述位置信息、所述边缘遮罩图以及所述背景图像,重构出样本图像。
10.一种电子设备,其特征在于,电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如权利要求1-8任一项的样本图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311597645.3A CN117315406B (zh) | 2023-11-28 | 2023-11-28 | 一种样本图像处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311597645.3A CN117315406B (zh) | 2023-11-28 | 2023-11-28 | 一种样本图像处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117315406A true CN117315406A (zh) | 2023-12-29 |
CN117315406B CN117315406B (zh) | 2024-02-13 |
Family
ID=89288728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311597645.3A Active CN117315406B (zh) | 2023-11-28 | 2023-11-28 | 一种样本图像处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117315406B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117952820A (zh) * | 2024-03-26 | 2024-04-30 | 杭州食方科技有限公司 | 图像增广方法、装置、电子设备和计算机可读介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114170071A (zh) * | 2021-12-10 | 2022-03-11 | 北京字跳网络技术有限公司 | 一种图像处理方法、装置、设备及介质 |
CN115328137A (zh) * | 2022-08-19 | 2022-11-11 | 江苏旷世智慧网联科技有限公司 | 一种无人驾驶设备的控制方法及控制装置 |
CN115375797A (zh) * | 2022-08-03 | 2022-11-22 | 网易(杭州)网络有限公司 | 图层处理方法、装置、存储介质及电子装置 |
CN115880197A (zh) * | 2022-12-29 | 2023-03-31 | 广州光锥元信息科技有限公司 | 一种图像处理方法及装置 |
CN115937009A (zh) * | 2022-06-10 | 2023-04-07 | 脸萌有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN116071614A (zh) * | 2022-12-31 | 2023-05-05 | 北京瑞莱智慧科技有限公司 | 样本数据处理方法、相关设备及存储介质 |
CN116187475A (zh) * | 2023-03-16 | 2023-05-30 | 北京京东乾石科技有限公司 | 轨迹预测模型生成方法及装置、模型训练方法及装置 |
-
2023
- 2023-11-28 CN CN202311597645.3A patent/CN117315406B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114170071A (zh) * | 2021-12-10 | 2022-03-11 | 北京字跳网络技术有限公司 | 一种图像处理方法、装置、设备及介质 |
CN115937009A (zh) * | 2022-06-10 | 2023-04-07 | 脸萌有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN115375797A (zh) * | 2022-08-03 | 2022-11-22 | 网易(杭州)网络有限公司 | 图层处理方法、装置、存储介质及电子装置 |
CN115328137A (zh) * | 2022-08-19 | 2022-11-11 | 江苏旷世智慧网联科技有限公司 | 一种无人驾驶设备的控制方法及控制装置 |
CN115880197A (zh) * | 2022-12-29 | 2023-03-31 | 广州光锥元信息科技有限公司 | 一种图像处理方法及装置 |
CN116071614A (zh) * | 2022-12-31 | 2023-05-05 | 北京瑞莱智慧科技有限公司 | 样本数据处理方法、相关设备及存储介质 |
CN116187475A (zh) * | 2023-03-16 | 2023-05-30 | 北京京东乾石科技有限公司 | 轨迹预测模型生成方法及装置、模型训练方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117952820A (zh) * | 2024-03-26 | 2024-04-30 | 杭州食方科技有限公司 | 图像增广方法、装置、电子设备和计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117315406B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114550177B (zh) | 图像处理的方法、文本识别方法及装置 | |
CN110675407B (zh) | 一种图像实例分割方法、装置、电子设备及存储介质 | |
CN112132156A (zh) | 多深度特征融合的图像显著性目标检测方法及系统 | |
CN113139543B (zh) | 目标对象检测模型的训练方法、目标对象检测方法和设备 | |
CN117315406B (zh) | 一种样本图像处理方法、装置及设备 | |
CN112966599B (zh) | 关键点识别模型的训练方法、关键点识别方法及装置 | |
CN110942071A (zh) | 一种基于车牌分类和lstm的车牌识别方法 | |
CN113313083B (zh) | 文本检测方法及装置 | |
WO2019214321A1 (zh) | 车辆损伤识别的处理方法、处理设备、客户端及服务器 | |
CN114943936B (zh) | 目标行为识别方法、装置、电子设备及存储介质 | |
CN113299073B (zh) | 识别车辆违章停车的方法、装置、设备和存储介质 | |
CN110991310A (zh) | 人像检测方法、装置、电子设备及计算机可读介质 | |
CN113159026A (zh) | 图像处理方法、装置、电子设备和介质 | |
CN115115611B (zh) | 车辆损伤识别方法、装置、电子设备和存储介质 | |
CN111353957A (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN113378857A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN114429637B (zh) | 一种文档分类方法、装置、设备及存储介质 | |
CN115719356A (zh) | 图像处理方法、装置、设备和介质 | |
CN113658196B (zh) | 红外图像中船舶的检测方法、装置、电子设备和介质 | |
CN111598088A (zh) | 目标检测方法、装置、计算机设备及可读存储介质 | |
CN113269280B (zh) | 文本检测方法、装置、电子设备及计算机可读存储介质 | |
CN112036342B (zh) | 单证抓拍方法、设备及计算机存储介质 | |
CN113688839A (zh) | 视频处理方法及装置、电子设备、计算机可读存储介质 | |
CN117557777A (zh) | 一种样本图像确定方法、装置、电子设备以及存储介质 | |
CN111178192A (zh) | 一种图像中目标对象的位置识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |