CN113887481A - 一种图像处理方法、装置、电子设备及介质 - Google Patents

一种图像处理方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN113887481A
CN113887481A CN202111214989.2A CN202111214989A CN113887481A CN 113887481 A CN113887481 A CN 113887481A CN 202111214989 A CN202111214989 A CN 202111214989A CN 113887481 A CN113887481 A CN 113887481A
Authority
CN
China
Prior art keywords
image
original
target
target image
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111214989.2A
Other languages
English (en)
Inventor
杨斯琦
吕颖
董小瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FAW Group Corp
Original Assignee
FAW Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FAW Group Corp filed Critical FAW Group Corp
Priority to CN202111214989.2A priority Critical patent/CN113887481A/zh
Publication of CN113887481A publication Critical patent/CN113887481A/zh
Priority to PCT/CN2022/125308 priority patent/WO2023066147A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例公开了一种图像处理方法、装置、电子设备及介质。该方法包括:从原始图像中提取目标对象的目标图像;根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;将所述目标图像插入至原始图像的背景区域中,得到合成图像。以上技术方案中克服了现有技术中随机插入图片的缺陷,通过在空白的背景区域中一边试探性的插入目标图像一边判断目标图像是否与其他物体的边界框重叠,为目标对象找到合适的插入位置,避免了目标图像被割裂以及背景区域中的物体被覆盖的问题,合成的图像完整且易于识别,为图像识别模型的训练提供了良好的数据支持。

Description

一种图像处理方法、装置、电子设备及介质
技术领域
本申请实施例涉及图像合成技术领域,尤其涉及一种图像处理方法、装置、电子设备及介质。
背景技术
在自动驾驶场景下通常需要通过模型对车身周围的物体进行识别,而为了提高识别准确度,需要建立模型并使用大量的图片数据对模型进行训练。但是由于获得的图片中存在的目标物可能较少,导致数据规模不够大。
图片合成是一种有效地扩大训练数据规模的方法,合成图片技术一般用于生成外观满足用户需求的特定图片或者专门用于深度神经网络的训练数据。现有的合成图片技术中,先从原始图中将目标物提取出来,并采用图片块的方式向背景图中插入目标物像素矩阵,插入的方式大多采用随机的方式,且没有考虑背景图中已有的对象,所以可能会导致目标物被割裂或者背景图中的物体被覆盖,合成的图片不完整或无法识别,不适于作为深度神经网络的训练数据。
发明内容
本申请实施例提供一种图像处理方法、装置、电子设备及介质,可以实现对图片中的特定对象进行增强。
第一方面,本申请实施例提供了一种图像处理方法,所述方法包括:
从原始图像中提取目标对象的目标图像;
根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
将所述目标图像插入至原始图像的背景区域中,得到合成图像。
第二方面,本申请实施例提供了一种图像处理装置,该装置包括:
图像提取模块,用于从原始图像中提取目标对象的目标图像;
背景区域确定模块,用于根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
图像合成模块,用于将所述目标图像插入至原始图像的背景区域中,得到合成图像。
第三方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的图像处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的图像处理方法。
本申请实施例提供了一种图像处理方法,该方法包括:从原始图像中提取目标对象的目标图像;根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;将所述目标图像插入至原始图像的背景区域中,得到合成图像。以上技术方案中克服了现有技术中随机插入图片的缺陷,通过在空白的背景区域中一边试探性的插入目标图像一边判断目标图像是否与其他物体的边界框重叠,为目标对象找到合适的插入位置,避免了目标图像被割裂或者背景区域中的物体被覆盖的问题,合成的图像完整且易于识别,为图像识别模型的训练提供了良好的数据支持。
附图说明
图1是本申请一种实施例提供的图像处理方法流程图;
图2是本申请另一种实施例提供的图像处理方法的流程图;
图3是本申请又一种实施例提供的图像合成方法流程图;
图4是本申请一种实施例提供的图像处理装置结构框图;
图5是本申请一种实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请在实施例中作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
图1是本申请一种实施例提供的图像处理方法流程图,本实施例可适用于对图片中的特定对象进行增强的场景中。该方法可以由本申请实施例所提供的图像处理装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。
如图1所示,本申请实施例中提供的图像处理方法可包括以下步骤:
S110、从原始图像中提取目标对象的目标图像。
其中,原始图像是通过摄像设备拍摄的并用于训练模型的图像。目标对象是指即将被提取的对象。原始图像中通常会包含多个物体,例如车辆以及行人等,每一个物体都可以被视为目标对象进行提取,其中,提取的方式可以是随机选择一个物体作为目标对象进行提取,也可以是先对各个物体进行分类,然后按类别进行提取。目标图像是指仅包含目标对象的图像。
进一步的,可以采用图片语义分割工具对目标对象进行提取。图片语义分割工具可以有多种选择,本申请实施例中选用基于微软COCO数据集训练得到的YOLACT语义分割工具来提取原始图像中的目标对象的目标图像。通过YOLACT提取到的内容包括目标对象掩码信息(由0、1数字组成的矩阵)、边界框信息以及类别名称。其中,边界框是指目标图像的边界框,边界框形状为矩形,边界框信息可以包括边界框的尺寸以及边界框四个角点像素在原始图像中的坐标信息等;类别名称可以是车、以及行人等,还可以对车以及行人等进行更细致的划分,以车为例,可以将车划分为电动车、公交车以及轿车等。本申请实施例中所使用的语义分割工具YOLACT在对目标对象进行提取前,会对原始图像中的所有物体进行识别,并对物体的类别进行标识。
S120、根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域。
其中,原始对象是指原始图像中存在的所有的物体。原始对象的位置信息可以是原始对象质心像素点所在的坐标信息,也可以是原始对象边界框四个角点像素的坐标信息。可以理解的,步骤S110中所述的目标对象是按照一定规则从原始对象中挑选出来的。
需要说明的是,本申请实施例中,在从原始图像中提取目标对象的目标图像之前,会先在原始图像中对原始对象设置边界框,然后再进行后续步骤。
根据原始图像中原始对象的位置信息,确定与原始对象不存在重叠的背景区域,在一个具体的例子中,原始图像中包含原始对象A,以原始图像左下角为原点建立坐标轴,原始对象A边界框左上角和右下角的横坐标分别为x1和x2,x1<x2,左上角和右下角的纵坐标分别为y1和y2,y1<y2,则由x<x1,x>x2,y>y2,y<y1构成的区域为与原始对象不存在重叠的背景区域。
S130、将所述目标图像插入至原始图像的背景区域中,得到合成图像。
由于本申请实施例中会事先在原始图像中对原始对象设置边界框,所以背景区域会被各个边界框隔成多个不规则形状的区域。在将目标图像插入至原始图像的背景区域中时,目标图像插入的位置不是随机选择的,而是在背景区域中试探,避免目标图像的边界框与其他原始对象的边界框发生重叠,以此找到合适的插入位置。
本申请实施例中,将所述目标图像插入至原始图像的背景区域中,得到合成图像之后,所述方法还包括:
确定所述目标图像与所述原始对象的候选图像的位置关系;
根据所述位置关系对所述目标图像在背景区域中的插入位置进行调整。
其中,候选图像是指仅包含原始对象的图像。目标图像与原始对象的候选图像的位置关系,可以是目标图像边界框的四条边与候选图像边界框的四条边之间的距离,距离可以根据目标图像边界框与候选图像边界框四个角点像素坐标信息计算得到。进一步的,可以根据目标图像边界框的四条边与候选图像边界框的四条边之间的距离,对目标图像在背景区域中的插入位置进行调整,使目标图像边界框的四条边与候选图像边界框的四条边保持一定的距离,避免目标图像覆盖候选图像的部分或全部区域。
本申请实施例中,根据所述位置关系对所述目标图像在背景区域中的插入位置进行调整,包括:
若所述目标图像的边界框与所述候选图像的边界框之间的最小距离值小于预设阈值,则按照预设单位距离,将所述目标图像向远离所述候选图像的方向移动。
其中,最小距离值是指目标图像边界框的四条边与候选图像边界框的四条边距离最近的两条边之间的距离。预设阈值可以根据实际情况进行设置,例如预设阈值可以是1mm,则当目标图像边界框的四条边与候选图像边界框的四条边距离最近的两条边之间的距离小于1mm时,将目标图像按照预设单位距离向远离所述候选图像的方向移动。预设单位距离也可以根据实际情况进行设置,例如预设单位可以是2mm,则此时目标图像向远离候选图像的方向移动2mm。
本申请实施例中,通过确定目标图像与候选图像的位置关系,并根据位置关系对目标图像在背景区域中的插入位置进行调整,使目标图像与候选图像保持一定的距离,可以避免插入的图像覆盖住原图中其他物体,合成的图片更完整和真实,易于识别,为图像识别模型的训练提供了良好的数据支持。
本申请实施例提供了一种图像处理方法,该方法包括:从原始图像中提取目标对象的目标图像;根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;将所述目标图像插入至原始图像的背景区域中,得到合成图像。以上技术方案中克服了现有技术中随机插入图片的缺陷,通过在空白的背景区域中一边试探性的插入目标图像一边判断目标图像是否与其他物体的边界框重叠,为目标对象找到合适的插入位置,避免了目标图像被割裂以及背景区域中的物体被覆盖的问题,合成的图像更完整且易于识别,为图像识别模型的训练提供了良好的数据支持。
图2是本申请另一种实施例提供的图像处理方法的流程图,本实施例以上述实施例为基础进行优化,具体优化为:从原始图像中提取目标对象的目标图像,包括:从所述原始图像中提取原始对象的候选图像;根据所述原始对象被识别为目标类别的置信度,从候选图像中确定目标图像。
如图2所示,本申请实施例中提供的图像处理方法可包括以下步骤:
S210、从所述原始图像中提取原始对象的候选图像。
其中,原始对象是指原始图像中存在的所有的物体,候选图像是指仅包含原始对象的图像。
S220、根据所述原始对象被识别为目标类别的置信度,从候选图像中确定目标图像。
本申请实施例中所使用的语义分割工具YOLACT在对目标对象进行提取前,会对原始图像中的所有原始对象进行识别,并对原始对象的类别进行标识。通过对原始对象的类别进行标识,一幅原始图像中的原始对象会被归为多个类别,此时可将多个类别中的任意类别作为目标类别,例如,一幅原始图像中的原始对象被归为电动车类、自行车类、轿车类以及公交车类,则可将轿车类作为目标类别。进一步的,语义分割工具YOLACT在对原始对象进行类别的识别的同时,会计算原始对象属于某一类别的置信度,置信度可以理解为原始对象属于某一类别的概率,例如,语义分割工具YOLACT将原始图像中的原始对象A识别为公交车类,且原始对象A属于公交车类的置信度为90%,即原始对象A属于公交车类的概率为90%。
可选的,本申请实施例中,在确定目标类别以及目标类别中原始对象的置信度后,可以根据原始对象的置信度高低,从高至低将原始对象的候选图像依次作为目标图像插入原始图像的背景区域中,得到合成图像。需要说明的是,本申请实施例中,将目标类别中置信度最高的候选图像作为目标图像插入原始图像的背景区域,得到合成图像1,然后将置信度次之的候选图像作为目标图像插入合成图像1的背景区域,得到合成图像2,以此类推,直至目标类别中的所有候选图像插入完毕。
在本申请实施例中,可选的,在确定目标类别以及目标类别中原始对象的置信度后,可设置一个置信度阈值,例如70%,将目标类别中置信度小于置信度阈值的原始对象剔除,将目标类别中置信度高于置信度阈值的原始对象的候选图像作为目标图像依次插入原始图像的背景区域中,得到合成图像。
S230、根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域。
本申请实施例中,根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域,包括:
确定所述原始对象的候选图像的边界框;
根据所述原始图像的区域和所述候选图像的边界框,确定与所述原始对象不存在重叠的背景区域。
本申请实施例中,可以通过语义分割工具YOLACT对原始对象的候选图像的边界框进行识别。
根据原始图像的区域和候选图像的边界框,确定与原始对象不存在重叠的背景区域,可以是根据候选图像的边界框四个角点像素的坐标信息以及原始图像的位置信息确定原始图像中的空白区域,即与原始对象不存在重叠的背景区域。
本申请实施例中通过确定原始图像中原始对象的边界框,确定原始图像中的空白区域,便于后续将目标图像插入到空白区域中,防止图像之间发生重叠,保证了合成图像的完整性和可识别性。
本申请实施例中,根据所述原始对象的图像区域和所述候选图像的边界框,确定与所述原始对象不存在重叠的背景区域,包括:
根据所述原始图像的区域的横坐标以及所述候选图像的边界框的横坐标建立横坐标不等式,并根据所述原始图像的区域的纵坐标以及所述候选图像的边界框的纵坐标建立纵坐标不等式;
对所述横坐标不等式和所述纵坐标不等式进行求解,根据求解结果确定与所述原始对象不存在重叠的背景区域。
在一个具体的场景中,原始图像中包含原始对象的候选图像A,以原始图像左下角为原点建立坐标轴,A的边界框左上角和右下角的横坐标分别为x1和x2,x1<x2,左上角和右下角的纵坐标分别为y1和y2,y1<y2,则由不等式x<x1,x>x2,y>y2,y<y1构成的区域为与原始对象不存在重叠的背景区域。
S240、将所述目标图像插入至原始图像的背景区域中,得到合成图像。
本申请实施例中,将所述目标图像插入至原始图像的背景区域中,得到合成图像,包括:
根据所述目标图像的边界框,确定所述目标图像的尺寸信息,并确定所述背景区域中各背景子区域的尺寸信息;
若根据背景子区域的尺寸信息和所述目标图像的尺寸信息,确定存在背景子区域的范围大于所述目标图像的范围,则将该背景子区域作为目标区域;
将所述目标图像插入至所述目标区域,得到合成图像。
其中,目标图像的尺寸信息可以包括目标图像的边界框内区域的面积以及边界框四条边的长度等。背景子区域是指在原始图像中被原始对象的候选图像所隔成的多个不规则区域,背景子区域的尺寸信息可以是背景子区域的面积。
本申请实施例中,在向背景区域中插入目标图像时,先判断是否有背景子区域的尺寸大于目标图像的尺寸,若有,则将该背景子区域作为目标区域,并将目标图像插入所述目标区域中,进行图像的合成。
本申请实施例中,通过将待插入的目标图像的尺寸与各个背景子区域的尺寸进行比较,可以为目标图像找到合适的插入位置,避免由于背景子区域尺寸小于目标图像的尺寸,导致图像覆盖的问题。
本申请实施例通过以下方法确定了待插入的目标图像:从所述原始图像中提取原始对象的候选图像;根据所述原始对象被识别为目标类别的置信度,从候选图像中确定目标图像。以上方法对待插入对象的图像进行了筛选,将识别较准确的对象的图像作为待插入图像,可以准确的将需要图像与原始图像进行合成,以此得到的图像数据满足了模型训练的需求。
图3是本申请又一种实施例提供的图像合成方法流程图。如图3所示:对于任意一张原始图片A,使用图片语义分割技术从中提取出一个对象集合O,此对象集合包含生活中常见的各类物体。分析原始图片A中的各个物体所在的位置,以边界框的形式作为记录。从对象集合O中筛选出合适的对象a作为插入原始图片A的待插入对象。遍历原始图片A中的所有边界框,将待插入对象a置于靠近原始图片边界框的某一侧,如果待插入对象的边界框不与其他任何边界框产生重叠,则生成一张增强了对象a的合成图片B。
上述单张图片的自我增强的图片合成技术中,使用了先进的图片语义分割工具提取合成图片的前景图,保证提取的前景图类别是一个可以在微软COCO数据集中找到的类别。提取的前景图信息包括前景图中对象的掩码信息(以0、1矩阵的形式存储),前景图的边界框信息(以四元组的格式存储,分别存储边界框左上角和右下角的像素坐标信息),以及前景图中对象的类别信息(以单个整数存储,代表微软COCO数据集的类别标号)。
本申请实施例中由所述的图像合成方法最终生成的合成图片是以原始图片作为背景,以原始图片上的对象作为前景,进而生成的对特定对象增强后的合成图片。最终的合成图片可以作为深度学习的训练工具。
图4是本申请一种实施例提供的图像处理装置结构框图,该装置可执行本申请任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。如图4所示,该装置可以包括:
图像提取模块310,用于从原始图像中提取目标对象的目标图像。
背景区域确定模块320,用于根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域。
图像合成模块330,用于将所述目标图像插入至原始图像的背景区域中,得到合成图像。
本申请实施例中,所述图像提取模块310,包括:
候选图像提取单元,用于从所述原始图像中提取原始对象的候选图像。
目标图像确定单元,用于根据所述原始对象被识别为目标类别的置信度,从候选图像中确定目标图像。
本申请实施例中,所述背景区域确定模块320,包括:
边界框确定单元,用于确定所述原始对象的候选图像的边界框。
区域确定单元,用于根据所述原始图像的区域和所述候选图像的边界框,确定与所述原始对象不存在重叠的背景区域。
本申请实施例中,所述区域确定单元,具体用于:
根据所述原始图像的区域的横坐标以及所述候选图像的边界框的横坐标建立横坐标不等式,并根据所述原始图像的区域的纵坐标以及所述候选图像的边界框的纵坐标建立纵坐标不等式;
对所述横坐标不等式和所述纵坐标不等式进行求解,根据求解结果确定与所述原始对象不存在重叠的背景区域。
本申请实施例中,所述图像合成模块330,包括:
尺寸信息确定单元,用于根据所述目标图像的边界框,确定所述目标图像的尺寸信息,并确定所述背景区域中各背景子区域的尺寸信息。
目标区域确定单元,用于若根据背景子区域的尺寸信息和所述目标图像的尺寸信息,确定存在背景子区域的范围大于所述目标图像的范围,则将该背景子区域作为目标区域。
合成单元,用于将所述目标图像插入至所述目标区域,得到合成图像。
本申请实施例中,所述装置,还包括:
位置关系确定模块,用于确定所述目标图像与所述原始对象的候选图像的位置关系。
位置调整模块,用于根据所述位置关系对所述目标图像在背景区域中的插入位置进行调整。
本申请实施例中,所述位置调整模块,具体用于:
若所述目标图像的边界框与所述候选图像的边界框之间的最小距离值小于预设阈值,则按照预设单位距离,将所述目标图像向远离所述候选图像的方向移动。
上述产品可执行本申请实施例所提供的图像显示方法,具备执行方法相应的功能模块和有益效果。
图5是本申请一种实施例提供的电子设备的结构示意图。图5示出了适于用来实现本申请实施例的示例性电子设备412的框图。图5显示的电子设备412仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,电子设备412可以包括:一个或多个处理器416;存储器428,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器416执行,使得所述一个或多个处理器416实现本申请实施例所提供的图像处理方法,包括:
从原始图像中提取目标对象的目标图像;
根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
将所述目标图像插入至原始图像的背景区域中,得到合成图像。
电子设备412的组件可以包括但不限于:一个或者多个处理器416,存储器428,连接不同设备组件(包括存储器428和处理器416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,处理型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备412典型地包括多种计算机设备可读存储介质。这些存储介质可以是任何能够被电子设备412访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
存储器428可以包括易失性存储器形式的计算机设备可读存储介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。电子设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机设备存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁存储介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作设备、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本申请所描述的实施例中的功能和/或方法。
电子设备412也可以与一个或多个外部设备414和/或显示器424等通信,还可与一个或者多个使得用户能与该电子设备412交互的设备通信,和/或与使得该电子设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,电子设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图5所示,网络适配器420通过总线418与电子设备412的其它模块通信。应当明白,尽管图5中未示出,可以结合电子设备412使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID设备、磁带驱动器以及数据备份存储设备等。
处理器416通过运行存储在存储器428中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的一种图像处理方法。
本申请一种实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行图像处理方法,包括:
从原始图像中提取目标对象的目标图像;
根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
将所述目标图像插入至原始图像的背景区域中,得到合成图像。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行设备、装置或者器件使用或者与其结合使用。
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行设备、装置或者器件使用或者与其结合使用的程序。
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种图像处理方法,其特征在于,所述方法包括:
从原始图像中提取目标对象的目标图像;
根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
将所述目标图像插入至原始图像的背景区域中,得到合成图像。
2.根据权利要求1所述的方法,其特征在于,从原始图像中提取目标对象的目标图像,包括:
从所述原始图像中提取原始对象的候选图像;
根据所述原始对象被识别为目标类别的置信度,从候选图像中确定目标图像。
3.根据权利要求1所述的方法,其特征在于,根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域,包括:
确定所述原始对象的候选图像的边界框;
根据所述原始图像的区域和所述候选图像的边界框,确定与所述原始对象不存在重叠的背景区域。
4.根据权利要求3所述的方法,其特征在于,根据所述原始对象的图像区域和所述候选图像的边界框,确定与所述原始对象不存在重叠的背景区域,包括:
根据所述原始图像的区域的横坐标以及所述候选图像的边界框的横坐标建立横坐标不等式,并根据所述原始图像的区域的纵坐标以及所述候选图像的边界框的纵坐标建立纵坐标不等式;
对所述横坐标不等式和所述纵坐标不等式进行求解,根据求解结果确定与所述原始对象不存在重叠的背景区域。
5.根据权利要求1所述的方法,其特征在于,将所述目标图像插入至原始图像的背景区域中,得到合成图像,包括:
根据所述目标图像的边界框,确定所述目标图像的尺寸信息,并确定所述背景区域中各背景子区域的尺寸信息;
若根据背景子区域的尺寸信息和所述目标图像的尺寸信息,确定存在背景子区域的范围大于所述目标图像的范围,则将该背景子区域作为目标区域;
将所述目标图像插入至所述目标区域,得到合成图像。
6.根据权利要求1所述的方法,其特征在于,将所述目标图像插入至原始图像的背景区域中,得到合成图像之后,所述方法还包括:
确定所述目标图像与所述原始对象的候选图像的位置关系;
根据所述位置关系对所述目标图像在背景区域中的插入位置进行调整。
7.根据权利要求6所述的方法,其特征在于,根据所述位置关系对所述目标图像在背景区域中的插入位置进行调整,包括:
若所述目标图像的边界框与所述候选图像的边界框之间的最小距离值小于预设阈值,则按照预设单位距离,将所述目标图像向远离所述候选图像的方向移动。
8.一种图像处理装置,其特征在于,所述装置包括:
图像提取模块,用于从原始图像中提取目标对象的目标图像;
背景区域确定模块,用于根据所述原始图像中原始对象的位置信息,确定与所述原始对象不存在重叠的背景区域;
图像合成模块,用于将所述目标图像插入至原始图像的背景区域中,得到合成图像。
9.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的图像处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的图像处理方法。
CN202111214989.2A 2021-10-19 2021-10-19 一种图像处理方法、装置、电子设备及介质 Pending CN113887481A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111214989.2A CN113887481A (zh) 2021-10-19 2021-10-19 一种图像处理方法、装置、电子设备及介质
PCT/CN2022/125308 WO2023066147A1 (zh) 2021-10-19 2022-10-14 图像处理方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111214989.2A CN113887481A (zh) 2021-10-19 2021-10-19 一种图像处理方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN113887481A true CN113887481A (zh) 2022-01-04

Family

ID=79003408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111214989.2A Pending CN113887481A (zh) 2021-10-19 2021-10-19 一种图像处理方法、装置、电子设备及介质

Country Status (2)

Country Link
CN (1) CN113887481A (zh)
WO (1) WO2023066147A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115908215A (zh) * 2022-11-17 2023-04-04 创新奇智(重庆)科技有限公司 数据获取方法、装置、电子设备及计算机可读存储介质
WO2023066147A1 (zh) * 2021-10-19 2023-04-27 中国第一汽车股份有限公司 图像处理方法、装置、电子设备及介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108717701B (zh) * 2018-05-24 2021-03-02 北京乐蜜科技有限责任公司 一种制作影片残影特效的方法、装置、电子设备及介质
CN111652796A (zh) * 2020-05-13 2020-09-11 上海连尚网络科技有限公司 图像处理方法、电子设备及计算机可读存储介质
CN111932447B (zh) * 2020-08-04 2024-03-22 中国建设银行股份有限公司 一种图片处理方法、装置、设备及存储介质
CN112085106A (zh) * 2020-09-10 2020-12-15 江苏提米智能科技有限公司 一种应用于多图像融合的图像识别方法、装置、电子设备及存储介质
CN112560698B (zh) * 2020-12-18 2024-01-16 北京百度网讯科技有限公司 图像处理方法、装置、设备和介质
CN113887481A (zh) * 2021-10-19 2022-01-04 中国第一汽车股份有限公司 一种图像处理方法、装置、电子设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023066147A1 (zh) * 2021-10-19 2023-04-27 中国第一汽车股份有限公司 图像处理方法、装置、电子设备及介质
CN115908215A (zh) * 2022-11-17 2023-04-04 创新奇智(重庆)科技有限公司 数据获取方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
WO2023066147A1 (zh) 2023-04-27

Similar Documents

Publication Publication Date Title
CN108009543B (zh) 一种车牌识别方法及装置
JP5713790B2 (ja) 画像処理装置、画像処理方法、及びプログラム
WO2023066147A1 (zh) 图像处理方法、装置、电子设备及介质
EP3806064A1 (en) Method and apparatus for detecting parking space usage condition, electronic device, and storage medium
CN110751682B (zh) 一种提取和标识图像的方法、装置、终端设备及存储介质
CN106971185B (zh) 一种基于全卷积网络的车牌定位方法及装置
CN111178357B (zh) 车牌识别方法、系统、设备和存储介质
CN113971727A (zh) 一种语义分割模型的训练方法、装置、设备和介质
CN110619656B (zh) 基于双目摄像头的人脸检测跟踪方法、装置及电子设备
CN110796669A (zh) 一种垂直边框定位方法及设备
CN112200142A (zh) 一种识别车道线的方法、装置、设备及存储介质
CN112712036A (zh) 交通标志识别方法、装置、电子设备及计算机存储介质
CN114820679B (zh) 图像标注方法、装置、电子设备和存储介质
CN114399512A (zh) 基于人工智能的实例分割模型训练方法、装置、存储介质
CN109300322B (zh) 引导线绘制方法、装置、设备和介质
CN111191482A (zh) 一种刹车灯识别方法、装置及电子设备
CN110874170A (zh) 一种图像区域修正方法、图像分割方法及装置
CN111062388B (zh) 基于深度学习的广告文字的识别方法、系统、介质及设备
CN112241963A (zh) 基于车载视频的车道线识别方法、系统和电子设备
CN112784675A (zh) 目标检测方法及装置、存储介质、终端
CN116433903A (zh) 实例分割模型构建方法、系统、电子设备及存储介质
WO2022247628A1 (zh) 一种数据标注方法及相关产品
CN116071557A (zh) 一种长尾目标检测方法、计算机可读存储介质及驾驶设备
CN115035530A (zh) 图像处理方法、图像文本获得方法、装置及电子设备
CN111950356A (zh) 印章文本定位方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination