CN117557777A - 一种样本图像确定方法、装置、电子设备以及存储介质 - Google Patents
一种样本图像确定方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN117557777A CN117557777A CN202311513234.1A CN202311513234A CN117557777A CN 117557777 A CN117557777 A CN 117557777A CN 202311513234 A CN202311513234 A CN 202311513234A CN 117557777 A CN117557777 A CN 117557777A
- Authority
- CN
- China
- Prior art keywords
- sample image
- image
- matting
- background
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012545 processing Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 abstract description 19
- 230000000007 visual effect Effects 0.000 abstract description 9
- 238000004590 computer program Methods 0.000 description 15
- 238000012549 training Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种样本图像确定方法、装置、电子设备以及存储介质,获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像;基于所述第一样本图像和所述第二样本图像,确定目标样本图像。本申请通过降低样本图像中感兴趣物体的视觉显著性,使得基于样本图像训练出来的图像识别模型更能区分物体与背景,从而提升模型的物体检测性能。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种样本图像确定方法、装置、电子设备以及存储介质。
背景技术
图像识别样本增广是一种常用的技术,它可以提高模型的性能和鲁棒性。目前,常见的图像识别样本增广方法有随机裁剪、随机旋转、随机翻转、颜色抖动等。然而,在图像识别任务中,一个常见挑战是待检测物体与背景具有相似的特征(例如,在变电站场景,刀闸和高压线具有相似的表观),而目前并没有针对这个问题的样本增强方法,这将导致较高的漏检率。
发明内容
本发明提供了一种样本图像确定方法、装置、电子设备以及存储介质,以通过降低样本图像中感兴趣物体的视觉显著性,使得基于样本图像训练出来的图像识别模型更能区分物体与背景,从而提升模型的物体检测性能。
根据本发明的第一方面,提供了一种样本图像确定方法,该方法包括:
获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;
抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;
依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像;
基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
根据本发明的第二方面,提供了一种样本图像确定装置,该装置包括:
图像获取模块,用于获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;
对象抠除模块,用于抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;
像素填充模块,用于依据所述第一样本图像的背景像素对所述抠图区域进行像素填充,得到第二样本图像;
目标样本确定模块,用于基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
根据本发明的第三方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的样本图像确定方法。
根据本发明的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的样本图像确定方法。
本发明实施例的技术方案,通过获取第一样本图像,其中,所述第一样本图像中包含至少一个目标对象,进而,抠除所述第一样本图像的所述目标对象,得到背景图像,其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应,进一步的,依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像,从而,基于所述第一样本图像和所述第二样本图像,确定目标样本图像。本申请通过降低样本图像中感兴趣物体的视觉显著性,使得基于样本图像训练出来的图像识别模型更能区分物体与背景,从而提升模型的物体检测性能。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种样本图像确定方法的流程图;
图2是根据本发明实施例一涉及的一种背景图像示意图;
图3是根据本发明实施例二提供的一种样本图像确定方法的流程图;
图4是根据本发明实施例三提供的一种样本图像确定方法的流程图;
图5是根据本发明实施例四提供的一种样本图像确定装置的结构示意图;
图6是实现本发明实施例的样本图像确定方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在介绍本方案之前,先对本方案的具体应用场景进行示例性说明。在图像识别任务中,如果待检测物体与背景具有相似的特征,使用常规物体识别图像数据集训练目标检测模型,存在物体识别率低的问题。例如,在变电站场景中,刀闸为待检测物体,背景中包含大量交错的高压线,刀闸在图像中通常表现为浅色线条状,高压线亦是如此,即刀闸和高压线具有相似的表观,经常出现将高压线错误的检测为刀闸的情形。
实施例一
图1是本发明实施例一提供的一种样本图像确定方法的流程图,本实施例可适于在图像识别任务中,识别待检测物体与背景具有相似特征的情形,该方法可以由样本图像确定装置来执行,该样本图像确定装置可以采用硬件和/或软件的形式实现,该样本图像确定装置可配置于终端和/或服务器中。如图1所示,该方法包括:
S110、获取第一样本图像。
其中,第一样本图像中包含至少一个目标对象。第一样本图像可以为用于训练目标检测模型的训练样本图像。目标对象为预先设定的待检测物体,例如,在识别刀闸的变电站场景中,目标对象为刀闸。可以理解的是,第一样本图像可以是开源数据库中的样本图像。也可以是根据实际应用场景的需求,基于具体应用场景中的实景图像构建自动义数据集。
具体的,若第一样本图像为实景图像,实景图像的获取途径包括但不限于以下三种:第一种是在具体应用场景中,基于预设拍摄位点上的摄像装置获取第一样本图像。第二种是基于无人机获取第一样本图像。例如,无人机在一定区域范围内拍摄现场图像,这些即为第一样本图像。第三种是人工拍摄的第一样本图像。
S120、抠除所述第一样本图像的所述目标对象,得到背景图像。
其中,背景图像中包括抠图区域,抠图区域与目标对象相对应。背景图像为将第一样本图像中的目标对象扣除掉的图像。
具体的,第一样本图像中包括一个或者多个目标对象,从第一样本图像中抠除目标对象的具体方式可以包括多种。例如,可以采用手工抠除的方式,也可以采用自动语义分割算法(如FCN、U-Net、DeepLab、PSPNet、HRNet等)实现。最终,得到与第一样本图像同样大小的背景图像。
S130、依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像。
在本实施例中,第一样本图像中未被抠除的图像内容可以称之为背景,这些背景对应的像素点即为背景像素。第二样本图像为对背景图像进行背景区域填充处理后的样本图像。第二样本图像与第一样本图像的大小一致。
具体的,第二样本图像中可以包括多个抠图区域,对每个抠图区域进行像素填充的方法是相同的。在此,以其中一个抠图区域为例进行说明。可以基于多种图像修补算法进行像素填充处理,例如,Deep Image Prior、Context Encoder、PatchMatch、Exemplar-Based Image Inpainting等算法。最终得到与第一样本图像以及背景图像大小一致的第二样本图像。
可选的,确定第二样本图像的方式具体包括:确定目标对象邻域范围内的邻近背景像素;基于所述邻近背景像素,对所述抠图区域进行像素填充,得到第二样本图像。
在本实施例中,可以基于多种运算方式,对抠图区域邻域范围的邻近背景像素进行计算确定待填充像素值,从而将待填充像素值填充至抠图区域,得到第二样本图像。
可选的,基于所述邻近背景像素,对所述抠图区域进行像素填充,得到第二样本图像,具体包括:基于所述邻近背景像素和图像填充模型,确定待填充像素值;将所述待填充像素值填充至所述抠图区域,得到第二样本图像。
本领域技术人员应当理解,图像填充模型可以是神经网络模型,可以先基于相应的训练集训练以及基于验证集对训练得到的图像填充模型进行验证,在验证通过时所得到的模型作为最终可以使用的图像填充模型,其具体的训练过程在本实施例中不再赘述。
示例性的,背景图像示意图参见图2,如图2所示,背景图像中包括多个抠图区域,分别为抠图区域1,抠图区域2和抠图区域3。A区域为抠图区域1对应的邻域范围,B区域为抠图区域2对应的邻域范围,C区域为抠图区域3对应的邻域范围。在具体应用中,可以将A区域内的像素确定为扣图区域1的邻近背景像素,将邻近背景像素对应的各像素值输入至预先训练好的图像填充模型中,图像填充模型输出扣图区域1对应的待填充像素值,进一步的,将待填充像素值填充至扣图区域1。基于相同的像素填充方法,分别填充抠图区域2和抠图区域3,从而得到第二样本图像。
S140、基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
在本实施例中,在得到第一样本图像和第二样本图像的基础上,可以基于图像融合的方式确定目标样本图像。
可选的,基于所述第一样本图像和所述第二样本图像,确定目标样本图像,可以是对第一样本图像和所述第二样本图像进行叠加处理,得到目标样本图像。
在本实施例中,叠加处理可以理解为第一样本图像和第二样本图像对应像素位置上的像素相加,得到目标样本图像。示例性的,I(x,y)表示第一样本图像,B(x,y)表示第一样本图像,则目标样本图像可以表示为F(x,y)=I(x,y)+B(x,y)。
可以理解的是,还可以是第一样本图像和第二样本图像对应像素位置上的像素进行加权求和,得到目标样本图像。
本发明实施例的技术方案,通过获取第一样本图像,其中,所述第一样本图像中包含至少一个目标对象,进而,抠除所述第一样本图像的所述目标对象,得到背景图像,其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应,进一步的,依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像,从而,基于所述第一样本图像和所述第二样本图像,确定目标样本图像。本申请通过降低样本图像中感兴趣物体的视觉显著性,使得基于样本图像训练出来的图像识别模型更能区分物体与背景,从而提升模型的物体检测性能。
实施例二
图3是本发明实施例二提供的一种样本图像确定方法的流程图,本发明实施例在上述实施例的基础上,对S120进一步细化,本发明实施例可以与上述一个或者多个实施例中各个可选方案结合。如图3所示,样本图像确定方法包括如下步骤:
如图3所示,该方法包括:
S210、获取第一样本图像。
S220、确定与所述第一样本图像对应的掩膜图像。
其中,掩膜图像为突出第一样本图像中各目标对象边缘轮廓的多值图像。可以理解的是,第一样本图像中包含多个目标对象。在掩膜图像中,各目标对象对应的目标对象区域,以及,背景区域分别赋予不同数的数值。示例性的,掩膜图像可以表示为M,M(x,y)=n代表第一样本图像中相应的像素I(x,y)属于第n种物体;M(x,y)=0代表第一样本图像中相应的像素I(x,y)属于背景。n具体取值对应的目标对象类别是后续的物体检测模型中预先确定的,例如,可以设定n=1代表汽车,n=2代表桌子,n=3代表行人等等。
可选的,确定与所述第一样本图像对应的掩膜图像,具体包括:对所述第一样本图像中各所述目标对象的边缘轮廓进行检测,确定多个边缘轮廓;对每个所述边缘轮廓内的像素点,以及,边缘轮廓外的像素点,分别进行赋值处理,与所述第一样本图像对应的掩膜图像。
在实际应用过程中,可以将第一样本图像输入至边缘轮廓检测模型中,来提取出各个目标对象的边缘轮廓图像;还可以是,采用相应的算法来确定第一样本图像中与目标对象相对应的边缘轮廓。例如,可以采用索贝尔算法对第一样本图像进行边缘检测,从而确定第一样本图像中与目标对象相对应的边缘轮廓。
本领域技术人员应当理解,边缘轮廓检测模型可以是神经网络模型,可以先基于相应的训练集训练以及基于验证集对训练得到的边缘轮廓检测模型进行验证,在验证通过时所得到的模型作为最终可以使用的边缘轮廓检测模型,其具体的训练过程在本实施例中不再赘述。
示例性的,将第一样本图像输入至边缘轮廓检测模型中,以对第一样本图像中各个目标对象进行边缘检测,从而得到各个目标对象的边缘轮廓,随后,对每个所述边缘轮廓内的像素点,以及,边缘轮廓外的像素点分别进行赋值处理。若第一样本图像包括3个目标对象,分别是第一目标对象、第二目标对象和第三目标对象,检测到第一目标对象对应的第一边缘轮廓、第二目标对象对应的第二边缘轮廓、第三目标对象对应的第三边缘轮廓,则将第一边缘轮廓内像素点的像素值赋值为56,第二边缘轮廓内像素点的像素值赋值为128,第三边缘轮廓内像素点的像素值赋值为201,边缘轮廓外的所有像素点的像素值统一赋值为0,从而得到第一样本图像对应的掩膜图像。
S230、基于所述掩膜图像,抠除所述第一样本图像的所述目标对象,得到背景图像。
在本实施例中,在得到掩膜图像的基础上,可以确定第一样本图像中的多个待抠除区域,从而将多个待抠除区域抠除,得到背景图像。
可选的,确定背景图像具体包括:基于所述掩膜图像,确定各所述目标对象对应的目标像素位置;对所述第一样本图像,将所述目标像素位置的像素点进行置零处理,得到背景图像。
在本实施例中,基于掩膜图像可以确定各个目标对象对应的目标像素位置。在上述示例性的基础上,对于第一目标对象而言,只要确定像素值为56像素点的坐标信息,便可以确定第一目标对象对应的目标像素位置。同理,可以确定第二目标对象和第三目标对象对应的目标像素位置。进一步的,对第一样本图像,将所有目标像素位置上对应的像素点均赋予零,即可得到背景图像。
S240、依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像。
S250、基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
本发明实施例的技术方案,确定背景图像的具体方式为:首先确定与所述第一样本图像对应的掩膜图像,进一步的,基于所述掩膜图像,抠除所述第一样本图像的所述目标对象,得到背景图像。本发明实施例,基于掩膜图像确定第一样本图像对应的背景图像,可以精确的确定背景区域,得到更加匹配第一样本图像的背景图像,从而提高目标样本图像的适配性。
实施例三
在本发明实施例中,以一个具体的实施方式介绍样本图像确定方法,图4为本发明实施例三提供的一种样本图像确定方法的结构示意图,该方法具体实现步骤包括:
(1)感兴趣物体分割。从第一样本图像I中把目标对象(即下来物体检测模型要检测的对象)分割出来。这一步可以采用多种方法可以实现。例如,可以采用手工标注,也可以采用自动的语义分割算法(如FCN、U-Net、DeepLab、PSPNet、HRNet等)实现。最终得到与第一样本图像I同样大小的多值掩膜图像M,其中M(x,y)=n代表第一样本图像I中相应的像素I(x,y)属于第n种目标对象;M(x,y)=0代表原图像中相应的像素I(x,y)属于背景区域。具体n对应的物体类别是后续的物体检测模型中约定的,例如,可以预先设定n=1代表汽车,n=2代表桌子,n=3代表行人等等。
(2)抠除第一样本图像中的感兴趣物体,并通过图像修补算法来填充抠除区域。即在第一样本图像I中,把M(x,y)不为零的位置对应的内容抠除掉,并通过图像修补算法来填充被抠除区域。这一步可以采用多种方法可以实现。例如,Deep Image Prior、ContextEncoder、PatchMatch、Exemplar-Based Image Inpainting等算法。最终得到跟第一样本图像一样大小的修补后的第二样本图像,其内容主要为第一样本图像中的背景。
(3)将修补填充后的第二样本图像叠加第一样本图像中,获得感兴趣物体视觉显著性降低的图像样本。即实施F(x,y)=I(x,y)+B(x,y),则F为对I进行感兴趣物体视觉显著性降低处理后的图像样本。
在实际图像检测模型训练中,对原始训练库中每个样本Ii,均采用上述方法获得相应的感兴趣物体视觉显著性降低处理后的图像样本Fi,将Ii和Fi均应用于训练图像检测模型,可以使得训练出来的图像检测模型更能区分物体与背景,显著提升模型的物体检测性能。
实施例四
图5是本发明实施例四提供的一种样本图像确定装置的结构示意图。如图5所示,该装置包括:图像获取模块410、对象抠除模块420、像素填充模块430和目标样本确定模块440。
其中,图像获取模块410,用于获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;
对象抠除模块420,用于抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;
像素填充模块430,用于依据所述第一样本图像的背景像素对所述抠图区域进行像素填充,得到第二样本图像;
目标样本确定模块440,用于基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
本发明实施例的技术方案,通过获取第一样本图像,其中,所述第一样本图像中包含至少一个目标对象,进而,抠除所述第一样本图像的所述目标对象,得到背景图像,其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应,进一步的,依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像,从而,基于所述第一样本图像和所述第二样本图像,确定目标样本图像。本申请通过降低样本图像中感兴趣物体的视觉显著性,使得基于样本图像训练出来的图像识别模型更能区分物体与背景,从而提升模型的物体检测性能。
可选的,对象抠除模块420,包括:
掩膜图像确定子模块,用于确定与所述第一样本图像对应的掩膜图像;
背景图像确定子模块,用于基于所述掩膜图像,抠除所述第一样本图像的所述目标对象,得到背景图像。
在上述实施例的基础上,掩膜图像确定子模块,包括:
边缘轮廓确定单元,用于对所述第一样本图像中各所述目标对象的边缘轮廓进行检测,确定多个边缘轮廓;
掩膜图像确定单元,用于对每个所述边缘轮廓内的像素点,以及,边缘轮廓外的像素点,分别进行赋值处理,与所述第一样本图像对应的掩膜图像。
在上述实施例的基础上,背景图像确定子模块,包括:
像素位置确定单元,用于基于所述掩膜图像,确定各所述目标对象对应的目标像素位置;
背景图像确定单元,用于对所述第一样本图像,将所述目标像素位置的像素点进行置零处理,得到背景图像。
可选的,像素填充模块430包括:
邻近背景像素确定子模块,用于确定目标对象邻域范围内的邻近背景像素;
像素填充子模块,用于基于所述邻近背景像素,对所述抠图区域进行像素填充,得到第二样本图像。
在上述实施例的基础上,像素填充子模块,包括:
待填充像素值确定单元,用于基于所述邻近背景像素和图像填充模型,确定待填充像素值;
第二样本图像确定单元,用于将所述待填充像素值填充至所述抠图区域,得到第二样本图像。
可选的,目标样本确定模块440具体用于对所述第一样本图像和所述第二样本图像进行叠加处理,得到目标样本图像。
本发明实施例所提供的样本图像确定装置可执行本发明任意实施例所提供的样本图像确定方法,具备执行方法相应的功能模块和有益效果。
实施例五
图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如样本图像确定方法。
在一些实施例中,样本图像确定方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的样本图像确定方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行样本图像确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程样本图像确定装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种样本图像确定方法,其特征在于,包括:
获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;
抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;
依据所述第一样本图像的背景像素对所述抠图区域进行像素填充进行像素填充,得到第二样本图像;
基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
2.根据权利要求1所述的方法,其特征在于,所述抠除所述第一样本图像的所述目标对象,得到背景图像,包括:
确定与所述第一样本图像对应的掩膜图像;
基于所述掩膜图像,抠除所述第一样本图像的所述目标对象,得到背景图像。
3.根据权利要求2所述的方法,其特征在于,所述第一样本图像中包含多个目标对象,所述确定与所述第一样本图像对应的掩膜图像,包括:
对所述第一样本图像中各所述目标对象的边缘轮廓进行检测,确定多个边缘轮廓;
对每个所述边缘轮廓内的像素点,以及,边缘轮廓外的像素点,分别进行赋值处理,与所述第一样本图像对应的掩膜图像。
4.根据权利要求3所述的方法,其特征在于,所述基于所述掩膜图像,抠除所述第一样本图像的所述目标对象,得到背景图像,包括:
基于所述掩膜图像,确定各所述目标对象对应的目标像素位置;
对所述第一样本图像,将所述目标像素位置的像素点进行置零处理,得到背景图像。
5.根据权利要求1所述的方法,其特征在于,所述依据所述第一样本图像的背景像素对所述抠图区域进行像素填充,得到第二样本图像,包括:
确定目标对象邻域范围内的邻近背景像素;
基于所述邻近背景像素,对所述抠图区域进行像素填充,得到第二样本图像。
6.根据权利要求5所述的方法,其特征在于,所述基于所述邻近背景像素,对所述抠图区域进行像素填充,得到第二样本图像,包括:
基于所述邻近背景像素和图像填充模型,确定待填充像素值;
将所述待填充像素值填充至所述抠图区域,得到第二样本图像。
7.根据权利要求1所述的方法,其特征在于,所述基于所述第一样本图像和所述第二样本图像,确定目标样本图像,包括:
对所述第一样本图像和所述第二样本图像进行叠加处理,得到目标样本图像。
8.一种样本图像确定装置,其特征在于,包括:
图像获取模块,用于获取第一样本图像;其中,所述第一样本图像中包含至少一个目标对象;
对象抠除模块,用于抠除所述第一样本图像的所述目标对象,得到背景图像;其中,所述背景图像中包括抠图区域,所述抠图区域与所述目标对象相对应;
像素填充模块,用于依据所述第一样本图像的背景像素对所述抠图区域进行像素填充,得到第二样本图像;
目标样本确定模块,用于基于所述第一样本图像和所述第二样本图像,确定目标样本图像。
9.一种电子设备,其特征在于,电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如权利要求1-7任一项的样本图像确定方法。
10.一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一项的样本图像确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311513234.1A CN117557777A (zh) | 2023-11-14 | 2023-11-14 | 一种样本图像确定方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311513234.1A CN117557777A (zh) | 2023-11-14 | 2023-11-14 | 一种样本图像确定方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117557777A true CN117557777A (zh) | 2024-02-13 |
Family
ID=89812164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311513234.1A Pending CN117557777A (zh) | 2023-11-14 | 2023-11-14 | 一种样本图像确定方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117557777A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118524258A (zh) * | 2024-07-25 | 2024-08-20 | 浙江嗨皮网络科技有限公司 | 离线视频背景处理方法、系统及可读存储介质 |
-
2023
- 2023-11-14 CN CN202311513234.1A patent/CN117557777A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118524258A (zh) * | 2024-07-25 | 2024-08-20 | 浙江嗨皮网络科技有限公司 | 离线视频背景处理方法、系统及可读存储介质 |
CN118524258B (zh) * | 2024-07-25 | 2024-10-18 | 浙江嗨皮网络科技有限公司 | 离线视频背景处理方法、系统及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110544258B (zh) | 图像分割的方法、装置、电子设备和存储介质 | |
CN112949767B (zh) | 样本图像增量、图像检测模型训练及图像检测方法 | |
CN113436100B (zh) | 用于修复视频的方法、装置、设备、介质和产品 | |
CN112560862B (zh) | 文本识别方法、装置及电子设备 | |
EP3734496A1 (en) | Image analysis method and apparatus, and electronic device and readable storage medium | |
CN113378969B (zh) | 一种目标检测结果的融合方法、装置、设备及介质 | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN117557777A (zh) | 一种样本图像确定方法、装置、电子设备以及存储介质 | |
CN118135381B (zh) | 一种图像的模糊检测方法、装置、设备及介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN115471476A (zh) | 一种部件缺陷检测方法、装置、设备及介质 | |
CN117315406B (zh) | 一种样本图像处理方法、装置及设备 | |
CN118015304A (zh) | 数据增强的方法、装置、设备及存储介质 | |
CN116703925B (zh) | 一种轴承缺陷检测方法、装置、电子设备及存储介质 | |
CN116385789B (zh) | 图像处理方法、训练方法、装置、电子设备及存储介质 | |
CN117274361A (zh) | 一种物料表面积测量方法、装置、电子设备以及介质 | |
CN114677566B (zh) | 深度学习模型的训练方法、对象识别方法和装置 | |
CN117078708A (zh) | 图像检测及模型的训练方法、装置、设备、介质和产品 | |
CN114511862B (zh) | 表格识别方法、装置及电子设备 | |
CN115376137A (zh) | 一种光学字符识别处理、文本识别模型训练方法及装置 | |
CN114612971A (zh) | 人脸检测方法、模型训练方法、电子设备及程序产品 | |
CN115019057A (zh) | 图像特征提取模型确定方法及装置、图像识别方法及装置 | |
CN114580631B (zh) | 模型的训练方法、烟火检测方法、装置、电子设备及介质 | |
CN115578797B (zh) | 模型训练方法、图像识别方法、装置及电子设备 | |
CN113591972B (zh) | 图像处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |