CN111080656A - 一种图像处理的方法、图像合成的方法以及相关装置 - Google Patents

一种图像处理的方法、图像合成的方法以及相关装置 Download PDF

Info

Publication number
CN111080656A
CN111080656A CN201911261574.3A CN201911261574A CN111080656A CN 111080656 A CN111080656 A CN 111080656A CN 201911261574 A CN201911261574 A CN 201911261574A CN 111080656 A CN111080656 A CN 111080656A
Authority
CN
China
Prior art keywords
image
region
foreground
processed
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911261574.3A
Other languages
English (en)
Inventor
贺珂珂
曹赟
葛彦昊
邰颖
汪铖杰
李季檩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911261574.3A priority Critical patent/CN111080656A/zh
Publication of CN111080656A publication Critical patent/CN111080656A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/149Segmentation; Edge detection involving deformable models, e.g. active contour models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种图像处理的方法、图像合成的方法以及相关装置,用于提升图像处理的精确度。本申请方法包括:获取待处理图像;根据待处理图像获取第一图像以及第二图像;根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像;根据第一抠图图像中的第三前景图像以及第二抠图图像中的第四前景图像,生成目标抠图图像。本申请利用图像分割后得到的结果分别得到第一图像和第二图像,再利用抠图技术分别得到第一抠图图像和第二抠图图像,抠图图像相比于分割得到的图像而言,具有更精细的构造,从而提升图像处理的精确度。

Description

一种图像处理的方法、图像合成的方法以及相关装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像处理的方法、图像合成的方法以及相关装置。
背景技术
随着计算机技术的发展,图像处理越来越普遍。在图像和视频处理领域,抠图(Image Matting)与图像合成是一个重要的技术方向,基于图像的抠图指的是,将一幅图像中的人物或者其他指定前景物体,通过抠图技术提取出来。基于视频的抠图指的是将视频流中的人物或者其他指定前景物体,通过抠图技术逐帧提取出来。
目前,可以采用分割(segmentation)的方法对图像中的每一个像素点进行分类,从而得到图像中目标区域,比如头发类的区域,或者建筑类的区域等。
然而,基于分割的方法需要对每个像素点确定一个固定的分类,容易造成目标区域的边缘较为粗糙,当对于抠图的精确度要求较高时,往往难以满足要求,从而导致图像处理效果较差。
发明内容
本申请实施例提供了一种图像处理的方法、图像合成的方法以及相关装置,能够利用图像分割后得到的结果分别得到第一图像和第二图像,第一图像和第二图像均为三元图,再利用抠图技术分别得到第一抠图图像和第二抠图图像,第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,将两者进行叠加后就可以抠除待抠图对象,从而提升图像处理的精确度。
有鉴于此,本申请第一方面提供一种图像处理的方法,包括:
获取待处理图像,其中,待处理图像包括待抠图对象;
根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
根据第一抠图图像以及第二抠图图像生成目标抠图图像。
本申请第二方面提供一种图像合成的方法,包括:
获取待处理图像以及待合成图像,其中,待处理图像包括待抠图对象;
根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
根据第一抠图图像以及第二抠图图像生成目标抠图图像;
采用目标抠图图像从待处理图像中提取待抠图对象所对应的区域;
将待抠图对象所对应的区域与待合成图像进行合并处理,得到合成图像。
本申请第三方面提供一种图像处理装置,包括:
获取模块,用于获取待处理图像,其中,待处理图像包括待抠图对象;
获取模块,还用于根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
获取模块,还用于根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
生成模块,用于根据获取模块获取的第一抠图图像以及第二抠图图像生成目标抠图图像。
在一种可能的设计中,在本申请实施例的第三方面的第一种实现方式中,
获取模块,具体用于基于待处理图像,通过图像分割模型获取目标分割图像;
根据目标分割图像以及待抠图对象生成第一图像;
根据目标分割图像以及待抠图对象生成第二图像。
在一种可能的设计中,在本申请实施例的第三方面的第二种实现方式中,
获取模块,具体用于基于待处理图像,通过图像分割模型所包含的M个卷积层获取第一特征图,其中,M为大于或等于1的整数;
基于待处理图像,通过图像分割模型所包含的N个池化层获取第二特征图,其中,N为大于或等于1的整数;
基于第一特征图以及第二特征图,通过图像分割模型所包含的特征融合模块获取目标分割图像。
在一种可能的设计中,在本申请实施例的第三方面的第三种实现方式中,
获取模块,具体用于根据目标分割图像以及待抠图对象,确定第一待更新前景区域以及第一待更新背景区域,其中,第一待更新前景区域包括待抠图对象;
获取第一待更新前景区域所对应的第一轮廓线;
根据第一轮廓线,沿第一待更新前景区域向内扩展生成第一轮廓区域;
根据第一轮廓线,沿第一待更新背景区域向外扩展生成第二轮廓区域;
将第一轮廓区域与第二轮廓区域进行叠加处理,得到第一混合区域;
将第一待更新前景区域与第一轮廓区域进行抠除处理,得到第一前景区域;
将第一待更新背景区域与第二轮廓区域进行抠除处理,得到第一背景区域。
在一种可能的设计中,在本申请实施例的第三方面的第四种实现方式中,
获取模块,具体用于根据目标分割图像以及待抠图对象,确定第二待更新前景区域以及第二待更新背景区域,其中,第二待更新背景区域包括待抠图对象;
获取第二待更新前景区域所对应的第二轮廓线;
根据第二轮廓线,沿第二待更新前景区域向内扩展生成第三轮廓区域;
根据第二轮廓线,沿第二待更新背景区域向外扩展生成第四轮廓区域;
将第三轮廓区域与第四轮廓区域进行叠加处理,得到第二混合区域;
将第二待更新前景区域与第三轮廓区域进行抠除处理,得到第二前景区域;
将第二待更新背景区域与第四轮廓区域进行抠除处理,得到第二背景区域。
在一种可能的设计中,在本申请实施例的第三方面的第五种实现方式中,
获取模块,具体用于根据待处理图像以及第一图像所对应的第一混合区域,生成第一抠图图像;
根据待处理图像以及第二图像所对应的第二混合区域,生成第二抠图图像。
在一种可能的设计中,在本申请实施例的第三方面的第六种实现方式中,
获取模块,具体用于根据第一图像所对应的第一混合区域,从待处理图像中获取第一像素点的第一颜色空间坐标以及第一空间坐标,其中,第一颜色空间坐标包括第一像素点所对应的色调值、饱和度值以及亮度,第一空间坐标包括第一像素点在待处理图像所对应的横坐标和纵坐标;
根据第一图像所对应的第一混合区域,从待处理图像中获取第二像素点的第二颜色空间坐标以及第二空间坐标,其中,第二颜色空间坐标包括第二像素点所对应的色调值、饱和度值以及亮度,第二空间坐标包括第二像素点在待处理图像所对应的横坐标和纵坐标;
根据第一颜色空间坐标以及第一空间坐标,计算得到第一像素点所对应的第一特征向量;
根据第二颜色空间坐标以及第二空间坐标,计算得到第二像素点所对应的第二特征向量;
基于内核函数,根据第一特征向量、第二特征向量以及权值调节系数,计算得到第一相似矩阵;
根据第一相似矩阵计算得到第一对角矩阵;
根据第一相似矩阵与第一对角矩阵,计算得到第一拉普拉斯矩阵;
根据第一拉普拉斯矩阵,获取第一图像所对应的第一抠图图像。
在一种可能的设计中,在本申请实施例的第三方面的第七种实现方式中,
获取模块,具体用于根据第二图像的所对应的第二混合区域,从待处理图像中获取第三像素点的第三颜色空间坐标以及第三空间坐标,其中,第三颜色空间坐标包括第三像素点所对应的色调值、饱和度值以及亮度,第三空间坐标包括第三像素点在待处理图像所对应的横坐标和纵坐标;
根据第二图像的所对应的第二混合区域,从待处理图像中获取第二像素点的第四颜色空间坐标以及第四空间坐标,其中,第四颜色空间坐标包括第四像素点所对应的色调值、饱和度值以及亮度,第四空间坐标包括第四像素点在待处理图像所对应的横坐标和纵坐标;
根据第三颜色空间坐标以及第三空间坐标,计算得到第三像素点所对应的第三特征向量;
根据第四颜色空间坐标以及第四空间坐标,计算得到第四像素点所对应的第四特征向量;
基于内核函数,根据第三特征向量、第四特征向量以及权值调节系数,计算得到第二相似矩阵;
根据第二相似矩阵计算得到第二对角矩阵;
根据第二相似矩阵与第二对角矩阵,计算得到第二拉普拉斯矩阵;
根据第二拉普拉斯矩阵,获取第二图像所对应的第二抠图图像。
在一种可能的设计中,在本申请实施例的第三方面的第八种实现方式中,
生成模块,具体用于将第一抠图图像以及第二抠图图像进行抠除处理,得到抠图图像;
对抠图图像进行去噪处理,得到目标抠图图像。
在一种可能的设计中,在本申请实施例的第三方面的第九种实现方式中,
生成模块,具体用于根据抠图图像生成二值图像;
根据二值图像获取背景区域内的连通区域;
根据连通区域确定连通面积,其中,连通面积包括至少一个像素点;
若连通面积小于或等于连通面积阈值,则将连通面积中像素点所对应的像素值设置为背景区域中像素点所对应的像素值。
在一种可能的设计中,在本申请实施例的第三方面的第十种实现方式中,
本申请第四方面提供一种图像合成装置,包括:
获取模块,用于获取待处理图像以及待合成图像,其中,待处理图像包括待抠图对象;
获取模块,还用于根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
获取模块,还用于根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
生成模块,用于根据获取模块获取的第一抠图图像以及第二抠图图像生成目标抠图图像;
提取模块,用于采用生成模块生成的目标抠图图像从待处理图像中提取待抠图对象所对应的区域;
合成模块,用于将提取模块提取到的待抠图对象所对应的区域与待合成图像进行合并处理,得到合成图像。
本申请第五方面提供一种电子设备,包括:存储器、收发器、处理器以及总线系统;
其中,存储器用于存储程序;
处理器用于执行存储器中的程序,包括执行如上述第一方面中各种实现方式,或,执行如上述第二方面中各种实现方式;
总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。
本申请的第六方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,提供了一种图像处理的方法,首先获取包括待抠图对象的待处理图像,然后可以根据该待处理图像获取包括第一前景区域、第一背景区域以及第一混合区域的第一图像,以及包括第二前景区域、第二背景区域以及第二混合区域的第二图像,其中第一前景区域包括待抠图对象所对应的区域,第二背景区域包括待抠图对象所对应的区域,进一步地可以获取第一图像所对应的包括第三前景区域以及第三背景区域的第一抠图图像,以及第二图像所对应的包括第四前景区域以及第四背景区域的第二抠图图像,其中第三前景区域包括待抠图对象所对应的区域,第四背景区域包括待抠图对象所对应的区域,最后可以根据第一抠图图像以及第二抠图图像生成包括待抠图对象所对应的区域的目标抠图图像。通过上述方式,利用图像分割后得到的结果分别得到第一图像和第二图像,第一图像和第二图像均为三元图,再利用抠图技术分别得到第一抠图图像和第二抠图图像,第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,将两者进行叠加后就可以抠除待抠图对象,从而提升图像处理的精确度。
附图说明
图1为本申请实施例中图像处理的方法一个流程示意图;
图2为本申请实施例中图像处理的方法一个实施例示意图;
图3为本申请实施例中图像处理方法的一个示意图;
图4为本申请实施例中图像处理方法的另一个示意图;
图5为本申请实施例中图像处理方法的另一个示意图;
图6为本申请实施例中图像处理方法的另一个示意图;
图7为本申请实施例中双边分割网络BiSeNet结构的网络架构示意图;
图8为本申请实施例中获取第一图像的方法一个实施例示意图;
图9为本申请实施例中获取第二图像的方法一个实施例示意图;
图10为本申请实施例中图像处理方法的另一个示意图;
图11为本申请实施例中图像处理的方法另一个实施例示意图;
图12为本申请实施例中图像处理装置的一个实施例示意图;
图13为本申请实施例中图像合成装置的一个实施例示意图;
图14为本申请实施例中终端设备的一个结构示意图;
图15为本申请实施例中服务器的一个结构示意图。
具体实施方式
本申请实施例提供了一种图像处理的方法、图像合成的方法以及相关装置,用于利用图像分割后得到的结果分别得到第一图像和第二图像,第一图像和第二图像均为三元图,再利用抠图技术分别得到第一抠图图像和第二抠图图像,第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,将两者进行叠加后就可以抠除待抠图对象,从而提升图像处理的精确度。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本申请可以应用于图像处理的场景,图像作为人类感知世界的视觉基础,是人类获取信息、表达信息和传递信息的重要手段。图像处理技术可以包括但不限于图像变换、图像编码压缩、图像增强和复原、图像分割、图像描述、抠图技术以及图像分类。其中,图像分割是将图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程,图像分割可以将图像中有意义的特征部分提取出来,有意义的特征可以包括但不限于图像中的边缘或者区域,图像分割是进一步进行图像识别、分析以及理解的基础。并且图像分割可以应用于交通、医学、遥感、通信和工业自动多个领域。而抠图技术则是图像处理中最常做的操作之一,抠图技术可以把图像或者影像的某一部分从原始图像或影像中分离出来成为单独的图层,主要功能是为了后期的合成做准备。
图像处理的方法可以应用于医学领域的场景中。医学领域可以进行分割的医学图像包括但不限于脑图像、心脏图像、胸部图像以及细胞图像,而医学图像的形成会受到噪音、场偏移效应、局部体效应以及组织运动的影响,由于生物的个体与个体之间也具有差别,并且组织结构形状负载,因此医学图像与普通图像相比通常模糊度较高,且具有不均匀性。基于医学图像的特点,通过本申请图像处理的方法,可以将模糊度较高或者具有不均匀性的医学图像利用图像分割后得到的结果进行处理,得到均为三元图的第一图像和第二图像,而三元图是对医学图像的一种粗略划分,大致标记出前景,背景和前后景混和区域,三元图常作为作为抠图的输入。进而将第一图像和第二图像作为抠图的输入,利用抠图技术分别得到第一抠图图像和第二抠图图像,并且将两者进行叠加后就可以抠除待抠图对象,由于而第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,因此可以提升医学图像处理的精确度。
在另一示例中,图像处理还可以应用于遥感领域的场景中。由于信息技术、空间技术的飞速发展和卫星空间分辨率的不断提高,高分辨率遥感图像可以应用于海洋监测、土地覆盖监测、海洋污染以及海事救援中,而高分辨率遥感图像有着图像细节信息丰富、地物几何结构显著、以及目标结构复杂的特点,例如在高分辨率遥感图像中海岸线的物体阴影复杂、植被覆盖面积大或者明暗的人工设施分割不够明确,因此高分辨率遥感图像与普通图像相比通常细节更多并且更为复杂。基于高分辨率遥感图像的特点,通过本申请图像处理的方法,可以将高分辨率遥感图像利用图像分割后得到的结果进行处理,进而再利用抠图技术分别得到均为三元图的第一抠图图像和第二抠图图像,与前述类似,而第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,进而将两者进行叠加后就可以抠除待抠图对象,可以更精确的得到高分辨率遥感图像中的细节,从而提升高分辨率遥感图像处理的精确度。
可以理解的是,以上所示例的图像格式包含但不仅限于位图(bitmap,BMP)格式、标签图像文件格式(tag image file format,TIFF)、图形交换格式(graphicsinterchange format,GIF)、联合照片专家组(joint photographic expert group,JPEG)。
为了在上述各种场景中,实现对不同图像的图像处理,并且提升图像处理的精确度,本申请实施例提供了一种图像处理的方法,请参阅图1,图1为本申请实施例中图像处理的方法一个流程示意图,具体地:
步骤S1,获取待处理图像;
步骤S2、基于待处理图像,通过图像分割模型获取目标分割图像;
步骤S31、根据目标分割图像以及待抠图对象生成第一图像;
步骤S32、根据目标分割图像以及待抠图对象生成第二图像;
步骤S41、根据第一混合区域,获取第一图像所对应的第一抠图图像;
步骤S42、根据第二混合区域,获取第二图像所对应的第二抠图图像;
步骤S5、将第一抠图图像中的第三前景图像与第二抠图图像中的第四前景图像进行抠除处理,得到抠图图像;
S6、对抠图图像进行去噪处理,得到目标抠图图像。
其中,步骤S1可以获取到如图1中(A)所示包括待抠图对象的待处理图像,然后步骤S2可以基于图1中(A)所示待处理图像通过图像分割模型,获取到如图1中(B)所示目标分割图像,进一步地,步骤S31可以先确定第一图像中第一前景区域与第一背景区域之间的交叠区域为第一混合区域,然后根据目标分割图像以及待抠图对象生成如图1中(C)所示包括第一混合区域的第一图像,其次,步骤S32可以先确定第二图像中第二前景区域与第二背景区域之间的交叠区域为第二混合区域,然后根据目标分割图像以及待抠图对象生成如图1中(D)所示包括第二混合区域的第二图像,其中第一前景区域对应于第二前景区域以及待抠图对象所对应的区域,应理解,第一图像以及第二图像的生成没有时序限定,即第一图像以及第二图像同时生成,或者第一图像以及第二图像先后生成。步骤S41可以根据第一混合区域,获取第一图像所对应的如图1中(E)所示包括第三前景区域的第一抠图图像,而步骤S41可以根据第一混合区域,获取第一图像所对应的如图1中(F)所示包括第四前景区域的第一抠图图像,其中第三前景区域对应于第四前景区域以及待抠图对象所对应的区域。在进一步地,步骤S5可以将第一抠图图像中的第三前景图像与第二抠图图像中的第四前景图像进行抠除处理,得到如图1中(G)所示的抠图图像,最后步骤S6对如图1中(G)所示的抠图图像进行去噪处理,即可以得到如图1中(H)所示的目标抠图图像。
结合上述介绍,下面将对本申请中图像处理的方法进行介绍,请参阅图2,图2为本申请实施例中图像处理的方法一个实施例示意图,如图所示,本申请实施例中图像处理的方法一个实施例包括:
101、获取待处理图像,其中,待处理图像包括待抠图对象;
本实施例中,首先图像处理装置可以获取包括待抠图对象的待处理图像,待处理图像可以为图像处理装置通过有线网络接收到的图像,还可以为图像处理装置本身存储的图像。具体地,待处理图像可以包括但不限于风景图像,人物图像,医学图图像以及地理图像,以待处理图像为人物图像做示例,则待抠图对象可以为人物图像中的头发、嘴巴、耳朵、眉毛或者眼睛,而以待处理图像为风景图像做示例,则待抠图对象可以为风景图像中的树木、花草或者建筑,再以待处理图像为医学图像为做示例,则待抠图对象的可以为医学图像中的细胞、骨骼以及内脏。
需要说明的是,图像处理装置可以部署于服务器,也可以部署于终端设备,本申请以部署于终端设备为例进行介绍,然而,这不应理解为对本申请的限定。
102、根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
本实施例中,图像处理装置可以根据该待处理图像获取到第一前景区域、第一背景区域以及第一混合区域,且第一前景区域包括待抠图对象所对应的区域,第一前景区域、第一背景区域以及第一混合区域构成第一图像,还可以根据该待处理图像获取到第二前景区域、第二背景区域以及第二混合区域,且第二背景区域包括待抠图对象所对应的区域,第二前景区域、第二背景区域以及第二混合区域构成第二图像。
为了便于理解,请参阅图3,图3为本申请实施例中图像处理方法的一个示意图,如图3中(A)所示,待处理图像A1为一张人物图像,本实施例中以待抠图对象是待处理图像中人像的头发为示例进行说明,因此首先可以根据待处理图像A1获取如图3中(B)所示的第一图像A2,而第一图像A2中包括有第一前景区域A21、第一背景区域A22以及第一混合区域A23,并且第一前景区域A21包括有抠图对象头发所对应的区域。其次,还可以根据待处理图像A1获取如图3中(C)所示的第二图像A3,而第二图像A3中包括有第二前景区域A31、第二背景区域A32以及第二混合区域A33,并且第二背景区域A32包括有抠图对象头发所对应的区域。应理解,在实际应用中还可以以人物图像的其他部位作为抠图图像并且获取到对应的第一图像以及第二图像。
103、根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
本实施例中,图像处理装置可以获取到第一图像所对应的包括第三前景区域以及第三背景区域的第一抠图图像,并且第三前景区域包括待抠图对象所对应的区域。此外,还可以获取到第二图像所对应的第四前景区域以及第四背景区域的第二抠图图像,并且第四背景区域包括待抠图对象所对应的区域。在实际应用中,由于对背景以及前景进行分割时,可能有噪声点的产生,因此在第三背景区域以及第四前景区域内可能会出现一部分噪声点,并且第三背景区域以及第四前景区域可能包括小部分的头发部分。
为了便于理解,请参阅图4,图4为本申请实施例中图像处理方法的另一个示意图,如图4中(A)所示,第一抠图图像B1包括有第三前景区域B11以及第三背景区域B12,并且第三前景区域B11包括抠图对象头发所对应的区域,进一步地可以看到图4中(A)所示第三前景区域B11中所包括的头发区域,比图3中(B)所示的第一前景区域A21所包括的头发区域更为精细,接近于头发外轮廓本身具有的图像效果。类似地,如图4中(B)所示,第二抠图图像B2包括第四前景区域B21以及第四背景区域B22,并且第四背景区域B22包括抠图对象头发所对应的区域,也可以看到图4中(B)所示第四背景区域B22中所包括的头发区域,相比于图3中(C)所示的第二背景区域A32所包括的头发区域更为精细,接近于头发靠近脸部的内轮廓本身所需要的图像效果。
104、根据第一抠图图像中的第三前景图像以及第二抠图图像中的第四前景图像,生成目标抠图图像。
本实施例中,图像处理装置进一步地可以根据所获取的第一抠图图像以及第二抠图图像生成包括待抠图对象所对应的区域的目标抠图图像。
为了便于理解,请参阅图5,图5为本申请实施例中图像处理方法的另一个示意图,如图所示,根据图5中(A)所示第一抠图图像C1以及图5中(B)所示第二抠图图像C2即可以生成如图5中(C)所示的目标抠图图像C3,可以看到图目标抠图图像即为待处理图像中的头发部分所对应的区域。
本申请实施例中,提供了一种图像处理的方法,通过上述方式,利用图像分割后得到的结果分别得到第一图像和第二图像,第一图像和第二图像均为三元图,再利用抠图技术分别得到第一抠图图像和第二抠图图像,第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,将两者进行叠加后就可以抠除待抠图对象,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据待处理图像获取第一图像以及第二图像,可以包括:
基于图像分割模型,通过图像分割模型获取目标分割图像;
根据目标分割图像以及待抠图对象生成第一图像;
根据目标分割图像以及待抠图对象生成第二图像。
本实施例中,图像处理装置可以基于待处理图像,通过图像分割模型获取目标分割图像,然后可以根据目标分割图像以及待抠图对象生成第一图像,并且根据目标分割图像以及待抠图对象生成第二图像。
为了便于理解,请参阅图6,图6为本申请实施例中图像处理方法的另一个示意图,如图6中(B)所示,目标分割图像D2即为图6中(A)所示待处理图像D1通过图像分割模型所生成的图像,然后根据待抠图对象中头发以及人体为前景图像与目标分割图像D2生成第一图像,并且也可以根据待抠图对象中不包括头发的人体为前景图像与目标分割图像D2生成第二图像。
具体地,图像分割模型用于从待处理图像中分割出目标分割图像,图像分割模型可以为为语义图像分割(semantic image segmentation)模型,而语义图像分割可以标注出待处理图像中每个像素所属的对象类别,即为待处理图像中的每个像素指定语义标签,例如路、天空、人、狗或者其他物体,应理解,这里需要和实例分割区分开来,因为语义图像分割模型没有分离同一类的实例,语义图像分割模型是对待处理图像中每个像素的类别进行分割,如果待处理图像中有两个相同类别的对象,则语义图像分割模型难以将它们区分为单独的对象。
语义图像分割模型包括但不仅限于编码器-解码器(encoder-decoder)结构、空洞卷积的结构以及DeepLab-v3+。
具体地,在编码器-解码器结构中,编码器可以使用池化层逐渐缩减输入数据的空间维度,而解码器通过反卷积层或者其他网络层逐步恢复目标的细节和相应的空间维度,因此从编码器到解码器之间,通常存在直接的信息连接,进一步地可以帮助解码器更好地恢复目标细节。在编码器-解码器结构中,待处理图像作为输入,然后对输入的空间分辨率进行下采样,生成分辨率较低的特征映射,其中,特征映射可以对象类别进行分类的效率较高。上采样可以将待处理图像的特征还原为全分辨率分割图像,即目标分割图像。编码器-解码器结构可以增加感受野,同时提升远程信息的获取能力。
空洞卷积的结构则可以增加卷积核内相邻两个权重之间的距离,即卷积核中心像素的感受野增大。另外空洞卷积的结构还可以与编码器-解码器结构类似,通过设置输出步长实现对输出特征图分辨率的控制,也就是说空洞卷积的结构不但能够调整感受野(多尺度信息)还能控制分辨率。条件随机场(conditional random field,CRF)方法通常用于改进分割效果,该方法是一种基于底层图像像素强度进行“平滑”分割的图像模型。DeepLab-v3+是由DeepLab-v3扩充而来,在DeepLab-v3的基础上增加了解码器模组,解码器模组能够细化分割结果,并且还能够更精准的处理物体的边缘,进一步将深度卷积神经网络应用在空间金字塔池化(spatial pyramid pooling,SPP)和解码器上,提升处理物体大小以及不同长宽比例的能力,最后得到准确的语义分割编码解码器网络。
本申请实施例中,提供了一种获取第一图像以及第二图像的方法,通过上述方式,根据图像分割模型为待处理图像标注的每个像素所属的对象类别,并且通过所需的待抠图对象输出目标分割图像,从而提升目标分割图像的准确度,并且进一步通过准确度高的目标分割图像生成第一图像以及第二图像,因此还可以提升目标抠图图像的准确度,从而提升本申请实施例的实用性以及准确性。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,基于待处理图像,通过图像分割模型获取目标分割图像,可以包括:
基于待处理图像,通过图像分割模型获取目标分割图像,可以包括:
基于待处理图像,通过图像分割模型所包含的M个卷积层获取第一特征图,其中,M为大于或等于1的整数;
基于待处理图像,通过图像分割模型所包含的N个池化层获取第二特征图,其中,N为大于或等于1的整数;
基于第一特征图以及第二特征图,通过图像分割模型所包含的特征融合模块获取目标分割图像。
本实施例中,当图像分割模型为双边分割网络BiSeNet结构时,图像处理装置可以通过BiSeNet所包含的M个卷积层获取第一特征图像,还可以基于待处理图像,通过BiSeNet所包含的N个池化层获取第二特征图像,最后基于第一特征图像以及第二特征图像,通过BiSeNet所包含的特征融合模块获取目标分割图像。
具体地,双边分割网络BiSeNet结构的网络框架包含空间路径(spatial path,SP)以及和环境路径(context path,CP)。spatial path可以通过叠加三个卷积层以获得待处理图像1/8大小的特征图像,该特征图像保留着待处理图像中丰富的空间细节,能够获得待处理图像的细节信息。具体地,空间信息(spatial information)主要指的是图像的局部细节信息,尤其是对于边缘丰富的图像,而由于卷积网络规模大,一般要求输入图像尺寸较小,需要对待处理图像进行crop或者resize,这个过程会损失细节的空间信息,因此通过设置只包含3个网络的spacial path,可保留丰富的空间信息,进而将低维度的空间细节信息与高维度的信息整合。
context path则采用了Xception网络的结构,包含4层下采样层,最终会获得待处理图像1/32大小的特征图像,这样获取的每个特征图像上的点会有更大的感受野,能够获得待处理图像的整体信息。其中,待处理图像整体信息可以用于在一个全局的范围内确定待处理图像中每个部件的合理位置,待处理图像的细节信息则能帮助更细致地分割出每个部件的位置,因此本实施例通过双边分割网络BiSeNet结构对待处理进行图像分割,可以将需要分割的位置定位到头发所对应的位置,然后由spatial path的3个卷积层获取到第一特征图像,由context path的4个池化层获取到第二特征图像。应理解,本申请以最大池化为示例,最大池化可以提取待处理图像中最明显的特征,在实际应用中,还可以采用平均池化,平均池化可以将待处理图像中所有的像素值都相加然后再平均,顾及到待处理图像中的每一个像素。
在context path中,由于通过全局平均池化捕获全局语境,并且计算注意力向量,因此可以在context path输出后,还可以加入注意力优化模块,注意力优化模块可以优化context path中每一阶段的输出特征,以便于整合全局语境信息,由此还可以降低计算成本。
由于spatial path捕获的空间信息编码了绝大多数的丰富细节信息,即第一特征图像中编码了丰富的细节信息,而context path的输出特征则编码了编码语境信息,即第二特征图像中编码了语境信息,两路网络的特征并不相同,因此根据两路网络所生成的第一特征图像以及第二特征图像中所编码的信息也不相同,所以不能对第一特征图像以及第二特征图像中的信息进行简单地加权,这时就需要通过BiSeNet所包含的特征融合模块(feature fusion module,FFM)来融第一特征图像以及第二特征图像中的信息,以得到两个信息融合后的目标分割图像。应理解,本实施例以3个卷积层以及4个池化层为示例,在实际应用中只要卷积层以及池化层数量大于等于1即可,因此3个卷积层以及4个池化层不应理解为本申请的限定。
为了便于理解,请参阅图7,图7为本申请实施例中双边分割网络BiSeNet结构的网络架构示意图,如图所示,将待处理图像E1输入至spatial path E2,还可以将待处理图像E1输入至context path E3。在待处理图像E1完成输入后,spatial path E2中三个卷积层E21对待处理图像E1进行批归一化和线性整流函数(rectified linear unit,ReLU)处理,其中,每一个E21包含一个步幅(stride)为2的卷积,最后输出第一特征图像,第一特征图像保留着完整度较高的空间信息。而在待处理图像E1完成输入后,context path E3中的卷积层E31、卷积层E32、卷积层E33以及卷积层E34对待处理图像E1进行下采样,其中,E31对应的为第一下采样层,也就是E31对待处理图像E1进行1/4的采样,然后E32对应的为第二下采样层,也就是说E32在E31的所完成的1/4的采样下再进行对对待处理图像E1进行1/8的采样,依次类推,E33对待处理图像E1进行1/16的采样,最后,E32对待处理图像E1进行1/32的采样,从而得到待处理图像E1基础下1/32大小的第二特征图像,第二特征图像有着感受野大的特征,然后图中E4所对应的特征融合模块可以根据得到的第一特征图像以及第二特征图像进行融合处理,进而输出为目标分割图像E5。
本申请实施例中,提供了一种获取目标分割图像的方法,通过上述方式,由于单独采用BiSeNet中的spatial path保留空间信息获取第一特征图像,而context path可以直接用经典网络提取深层特征获取第二特征图像,并且使用特征融合模块对获取的第一特征图像以及第二特征图像进行融合获取目标分割图像,因此可以扩大感受野,并且保证空间信息的完整,从而使得目标分割图像的完整以及精确,提升本申请实施例的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据目标分割图像以及待抠图对象生成第一图像,可以包括:
根据目标分割图像以及待抠图对象,确定第一待更新前景区域以及第一待更新背景区域,其中,第一待更新前景区域包括待抠图对象;
获取第一待更新前景区域所对应的第一轮廓线;
根据第一轮廓线,沿第一待更新前景区域向内扩展生成第一轮廓区域;
根据第一轮廓线,沿第一待更新背景区域向外扩展生成第二轮廓区域;
将第一轮廓区域与第二轮廓区域进行叠加处理,得到第一混合区域;
将第一待更新前景区域与第一轮廓区域进行抠除处理,得到第一前景区域;
将第一待更新背景区域与第二轮廓区域进行抠除处理,得到第一背景区域。
本实施例中,图像处理装置首先可以根据目标分割图像以及待抠图对象确定第一待更新背景区域以及第一待更新前景区域,第一待更新前景区域是最初始的没有经过处理的前景区域,而第一待更新背景区域是最初始的没有经过处理的背景区域,然后可以获取到第一待更新前景区域所对应的第一轮廓线,根据第一轮廓线,沿第一待更新前景区域向内扩展生成第一轮廓区域,还可以根据第一轮廓线,沿第一待更新背景区域向外扩展生成第二轮廓区域。将第一轮廓区域与第二轮廓区域进行叠加处理,得到第一混合区域,将第一待更新前景区域与第一轮廓区域进行抠除处理,以得到第一前景区域,还可以将第一待更新背景区域与第二轮廓区域进行抠除处理,以得到第一背景区域。
具体地,根据目标分割图像以及待抠图对象可以自动化地产生三元图(Trimap),Trimap是对给定图像的一种粗略划分,大致标记出前景,背景和前后景混和区域,一般作为抠图的输入。而Trimap的生成是通过寻找待抠图对象的轮廓,然后在待抠图对象所对应的轮廓的附近区域作为前后景混和区域获得到的。也就是首先可以根据目标分割图像生成2元图,二元图有前景255和背景0两种,也就是前景为白色而背景为黑色,然后在本实施例中由于可以待抠图对象为头发,因此可以将脸部和头发部分标记为前景,其他为背景。然后利用opencv的find contours函数找前景部分的轮廓,找到了轮廓后,在轮廓上画线,然后将第一轮廓线标记为128(灰度)作为前后景混和区域,这样就可以获取到第一图像。而其中find contours函数主要包括单通道图像矩阵、第一向量、第二向量、索引编号、检索模式、近似方法以及偏移量。单通道图像矩阵可以但不限于灰度图以及二值图像,而二值图像通常为经过拉普拉斯等边缘检测算子处理过的二值图像。第一向量通常为一个双重向量,第一向量中对目标分割图像的每个元素保存了一组由连续的点构成的点的集合的向量,每一组点集就是一个轮廓,也就是说有多少轮廓,即第一向量中就包括多少元素。第二向量中对目标分割图像的每个元素保存了一个包含4个int整型的数组,第二向量内目标分割图像的元素和第一向量内的元素是一一对应的,并且向量的容量相同。索引编号通常可以但不限于为第i个轮廓的后一个轮廓、前一个轮廓、父轮廓、内嵌轮廓的索引编号,若如果当前轮廓没有对应的后一个轮廓、前一个轮廓、父轮廓或内嵌轮廓的话,则索引编号的相应位被设置为默认值-1。偏移量则是所有的轮廓信息相对于原始图像对应点的偏移量,相当于在每一个检测出的轮廓点上加上该偏移量。
可以理解的是,轮廓的检索模式则包括但不限于以下几种取值方式:
取值一:只检测最外围轮廓,包含在外围轮廓内的内围轮廓被忽略;
取值二:检测所有的轮廓,包括内围、外围轮廓,但是检测到的轮廓不建立等级关系,彼此之间独立,没有等级关系,这就意味着这个检索模式下不存在父轮廓或内嵌轮廓,所以第二向量内所有元素的第3、第4个分量都会被设置为默认值-1;
取值三:检测所有的轮廓,但所有轮廓只建立两个等级关系,外围为顶层,若外围内的内围轮廓还包含了其他的轮廓信息,则内围内的所有轮廓均归属于顶层;
取值四:检测所有轮廓,所有轮廓建立一个等级树结构。外层轮廓包含内层轮廓,内层轮廓还可以继续包含内嵌轮廓。
可以理解的是,轮廓的近似方法包括但不限于以下几种取值方法:
取值一:保存物体边界上所有连续的轮廓点到第一向量内;
取值二:仅保存轮廓的拐点信息,把所有轮廓拐点处的点保存入第一向量内,拐点与拐点之间直线段上的信息点不予保留。
为了便于理解,请参阅图8,图8为本申请实施例中获取第一图像的方法一个实施例示意图,如图8中(A)所示,F11为第一待更新背景区域,F12为第一待更新前景区域,F13而为第一轮廓线,根据第一轮廓线F13沿第一待更新前景区域F12向内扩展,即可以生成如图8中(B)所示第一轮廓区域F2,而根据第一轮廓线F13沿第一待更新背景区域F11向外扩展,即可以生成如图8中(C)所示第二轮廓区域F3,将第一轮廓区域F2与第二轮廓区域F3进行叠加处理,该叠加处理就是把第一轮廓区域F2与第二轮廓区域F3进行相加,然后可以得到如图8中(D)所示第一混合区域F41,例如,第一轮廓区域的面积为100个像素点,第二轮廓区域的面积为120个像素点,第一混合区域的面积为220个像素点(即第一轮廓区域的面积与第二轮廓区域的面积之和)。将第一待更新前景区域F12与第一轮廓区域F2进行抠除处理,该抠除处理就是把第一轮廓区域F2从第一待更新前景区域F12中抠除,然后得到不包括第一轮廓区域F2的第一前景区域F42,例如,第一轮廓区域的面积为100个像素点,第一待更新前景区域的面积为2000个像素点,第一前景区域的面积为1900个像素点(即第一待更新前景区域的面积与第一轮廓区域的面积之差)。类似地,第一待更新背景区域F11与第二轮廓区域F3进行抠除处理,该抠除处理就是把第二轮廓区域F3从第一待更新背景区域F11中抠除,然后可以得到不包括第二轮廓区域F3的第一背景区域F43,例如,第二轮廓区域的面积为120个像素点,第一待更新背景区域的面积为1500个像素点,第一背景区域的面积为1380个像素点(即第一待更新背景区域的面积与第二轮廓区域的面积之差)。最后经过前述处理所得到的第一混合区域F41、第一前景区域F42以及第一背景区域F43,则可以组成如图8中(D)所示第一图像F4。
本申请实施例中,提供了一种获取第一图像的方法,根据目标分割图像以及待抠图对象,确定包括待抠图对象的第一待更新前景区域以及第一待更新背景区域,其中,第一待更新前景区域包括待抠图对象,并由此获取第一轮廓线,根据第一轮廓线,沿第一待更新前景区域以及第一待更新背景区域向内或者向外扩展以生成第一轮廓区域以及第二轮廓区域,并且进一步地得到第一混合区域、第一前景区域以及第一背景区域,然后第一混合区域、第一前景区域以及第一背景区域构成第一图像。通过上述方式,可以提升第一图像的精确度,从而提升图像处理的精确度。而且整个流程自动化,不需要手工标注。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据目标分割图像以及待抠图对象生成第二图像,可以包括:
根据目标分割图像以及待抠图对象,确定第二待更新前景区域以及第二待更新背景区域,其中,第二待更新背景区域包括待抠图对象;
获取第二待更新前景区域所对应的第二轮廓线;
根据第二轮廓线,沿第二待更新前景区域向内扩展生成第三轮廓区域;
根据第二轮廓线,沿第二待更新背景区域向外扩展生成第四轮廓区域;
将第三轮廓区域与第四轮廓区域进行叠加处理,得到第二混合区域;
将第二待更新前景区域与第三轮廓区域进行抠除处理,得到第二前景区域;
将第二待更新背景区域与第四轮廓区域进行抠除处理,得到第二背景区域。
本实施例中,图像处理装置根据目标分割图像以及待抠图对象,确定第二待更新前景区域以及第二待更新背景区域的方式,与根据目标分割图像以及待抠图对象,确定第一待更新前景区域以及第一待更新背景区域的方式类似,此处不做赘述。
为了便于理解,请参阅图9,图9为本申请实施例中获取第二图像的方法一个实施例示意图,如图9中(A)所示,G11为第二待更新背景区域,G12为第二待更新前景区域,G13而为第二轮廓线,根据第二轮廓线G13沿第二待更新前景区域G12向内扩展,即可以生成如图9中(B)所示第三轮廓区域G2,而根据第二轮廓线G13沿第二待更新背景区域G11向外扩展,即可以生成如图9中(C)所示第四轮廓区域G3,将第三轮廓区域G2与第四轮廓区域G3进行叠加处理,该叠加处理把第三轮廓区域G2与第四轮廓区域G3进行相加,然后可以得到如图9中(D)所示第二混合区域G41,例如,第三轮廓区域的面积为300个像素点,第四轮廓区域的面积为400个像素点,第二混合区域的面积为700个像素点(即第三轮廓区域的面积与第四轮廓区域的面积之和)。将第二待更新前景区域G12与第三轮廓区域G2进行抠除处理,该抠除处理就是把第三轮廓区域G2从第二待更新前景区域G12中抠除,然后得到不包括第三轮廓区域G2的第二前景区域G42,例如,第三轮廓区域的面积为300个像素点,第二待更新前景区域的面积为2000个像素点,第二前景区域的面积为1700个像素点(即第二待更新前景区域的面积与第三轮廓区域的面积之差)。类似地,第二待更新背景区域G11与第四轮廓区域G3进行抠除处理,该抠除处理就是把第四轮廓区域G3从第二待更新背景区域G11中抠除,然后可以得到不包括第四轮廓区域G3的第二背景区域G43,例如,第四轮廓区域的面积为400个像素点,第二待更新背景区域的面积为1500个像素点,第二背景区域的面积为1100个像素点(即第二待更新背景区域的面积与第四轮廓区域的面积之差)。最后经过前述处理所得到的第一混合区域G41第二前景区域G42以及第二背景区域G43,则可以组成如图9中(D)所示第一图像G4。
本申请实施例中,提供了一种获取第二图像的方法,通过上述方式,可以提升第二图像的精确度,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,可以包括:
根据待处理图像以及第一图像所对应的第一混合区域,生成第一抠图图像;
根据待处理图像以及第二图像所对应的第二混合区域,生成第二抠图图像。
本实施例中,图像处理装置可以基于第一图像以及待处理图像,根据抠图技术获取第一抠图图像,也就是说抠图技术可以把第一图像以及待处理图像中一部分从其他部分分开出来,将第一图像以及待处理图像分为两层,被分出来那层成为前景图像,图像中的其他部分称为背景图像,也就是说通过抠图技术可以将待处理图像中的前景信息和背景信息分离。类似地,还可以基于第二图像以及待处理图像,根据抠图技术获取第二抠图图像。
具体地,采用K近邻(k-nearest neighbor,KNN)抠图算法生成第一抠图图像,还可以基于第二图像以及待处理图像,采用K近邻抠图算法生成第二抠图图像。应理解,生成第一抠图图像以及第二抠图图像没有时序限定,即可以第一抠图图像以及第二抠图图像同时生成,或者第一抠图图像以及第二抠图图像先后生成。应理解,本实施例采用的为K近邻抠图算法,然而在实际应用中,还可以采用其他的方法生成第一抠图图像以及第二抠图图像,例如贝叶斯抠图(Bayes matting)、封闭式抠图(closed formed matting)以及全局采样抠图。下面对其他几种抠图技术进行说明。
α通道是一种前景和背景颜色的线性混合表示方法,一张待处理图像应该包含有前景图像和背景图像,因此可以将该待处理图像看成是前景图像与背景图像的合成图,前景图像的α为1,背景图像的α为0,因此在待处理图像中α的取值可以介于0到1之间,以用来表示前后背景图的线性组合。在大多数自然图像中,像素点通常都属于绝对前景或者绝对背景。
贝叶斯抠图可以通过领域采样,从待定像素的领域像素中采样关联像素,利用图像像素点的颜色值特征,以定向高斯模型建立像素颜色模型,再用极大似然法估计α值。封闭式抠图则可以通过传播的方法来利用图像的颜色特征,即允许α值从已知区域传播到领域未知域。
封闭式抠图方法所提出的拉普拉斯矩阵(matting Laplacian matirx)被广泛地于其他抠图方法中。例如,本实施例所采用的K近邻抠图算法就是通过在特征空间取k个最邻近点计算得拉普拉斯矩阵计算α值,K近邻抠图算法这种非局部抠图的方法关注于可以处理更稀疏的trimap,并且不需要附加的约束条件输入,直接通过待处理图像自身的前景与背景属性的区别来进行分割。
贝叶斯抠图算法基于图像局部颜色一致性的假设前提,封闭式抠图预先假设了颜色线性模型,贝叶斯抠图算法以及封闭式抠图算法都预先假设了颜色分布模型,考虑到颜色分布不一定服从一个确定的模型,贝叶斯抠图和封闭式抠图采用的图像特征是颜色,而K近邻抠图算法采用的特征是HSV颜色和像素点坐标两种,并且K近邻抠图算法模型中还可以加入更多其他的图像特征,从而增加像素识别能力。
本申请实施例中,提供了另一种图像处理的方法,通过上述方式,通过K近邻抠图算法可以提升抠图图像的像素以及细化图像的细节,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据待处理图像以及第一图像所对应的第一混合区域,生成第一抠图图像,可以包括:
根据第一图像所对应的第一混合区域,从待处理图像中获取第一像素点的第一颜色空间坐标以及第一空间坐标,其中,第一颜色空间坐标包括第一像素点所对应的色调值、饱和度值以及亮度,第一空间坐标包括第一像素点在待处理图像所对应的横坐标和纵坐标;
根据第一图像所对应的第一混合区域,从待处理图像中获取第二像素点的第二颜色空间坐标以及第二空间坐标,其中,第二颜色空间坐标包括第二像素点所对应的色调值、饱和度值以及亮度,第二空间坐标包括第二像素点在待处理图像所对应的横坐标和纵坐标;
根据第一颜色空间坐标以及第一空间坐标,计算得到第一像素点所对应的第一特征向量;
根据第二颜色空间坐标以及第二空间坐标,计算得到第二像素点所对应的第二特征向量;
基于内核函数,根据第一特征向量、第二特征向量以及权值调节系数,计算得到第一相似矩阵;
根据第一相似矩阵计算得到第一对角矩阵;
根据第一相似矩阵与第一对角矩阵,计算得到第一拉普拉斯矩阵;
根据第一拉普拉斯矩阵,获取第一图像所对应的第一抠图图像。
本实施例中,图像处理装置可以根据第一图像所对应的第一混合区域,从待处理图像中获取第一颜色空间坐标以及第一空间坐标。根据第二图像的所对应的第二混合区域,从待处理图像中获取第二颜色空间坐标,以及包括第二像素点在待处理图像所对应的横坐标和纵坐标的第二空间坐标。再根据第一颜色空间坐标以及第一空间坐标,和第二颜色空间坐标以及第二空间坐标,分别计算得到第一像素点所对应的第一特征向量以及第二像素点所对应的第二特征向量。进一步地,可以基于内核函数,根据第一特征向量、第二特征向量以及权值调节系数,计算得到第一相似矩阵,并且根据第一相似矩阵计算得到第一对角矩阵,再根据第一相似矩阵与第一对角矩阵,计算得到第一拉普拉斯矩阵,最后根据计算得到的第一拉普拉斯矩阵,获取第一图像所对应的第一抠图图像。
具体地,本实施例描述的是根据K近邻抠图算法进行抠图的方法,抠图技术可以把第一图像以及待处理图像中一部分从其他部分分开出来,将第一图像以及待处理图像分为两层,被分出来那层成为前景图像,图像中的其他部分称为背景图像,而图像中每一像素点都是由前景颜色和背景颜色组合而成,其中前景颜色所占的比重称为alpha因子。因此可以根据精细Matting的公式求alpha因子,具体公式如下所示:
I=αF+(1-α)β;
其中,其中,I代表原始图像,F代表前景,β代表背景,α是透明度(也为该像素点的alpha值)。在这个公式中,这3个值都是未知的。对于这个公式的理解,可以把原始图像作为前景和背景按照一定权重(α透明度)叠加组成的。这个公式的目标是求解alpha值,表示其中前景颜色所占的比重。但根据上述公式,在仅知道I的情况下,求解F,β以及alpha值,这是约束不足问题。
因此,在很小的窗口中,例如选择一个白色区域,并且该白色区域为3*3的窗口,即在该白色区域的9个像素点内前景和背景都没有太大差异,因此可以将F和β假设在为恒定值,或者选择一个黑色区域,并且该黑色区域为2*2的窗口,即在该黑色区域的4个像素点内前景和背景都没有太大差异,因此可以将F和β假设在为恒定值。从而可以解决将该约束不足的问题,并且可以归结为下述公式,也就是通过下述公式在K近邻抠图算法中求解alpha值:
Figure BDA0002311738180000171
其中,S表示手工标记的区域,S(i)表示手工标记的区域中的像素值,L表示拉普拉斯矩阵,i表示第一图像中的第i个像素点。
K近邻抠图算法提出了基于KNN的拉普拉斯矩阵计算方法,步骤具体为计算特征向量、计算内核函数、求相似矩阵以及对角矩阵、通过拉普拉斯矩阵获取抠图图像,下面对每个步骤进行详细介绍:
对待处理图像中的像素点i的特征向量可以根据下述公式进行计算:
X(i)=(cos(h),sin(h),s,v,x,y);
其中,h表示HSV颜色空间坐标中的像素点i所对应的色调值(hue),s表示HSV颜色空间坐标中的像素点i所对应的饱和度值(saturation),v表示HSV颜色空间坐标中的像素点i所对应的亮度(value),(x,y)表示像素点i在待处理图像中的坐标,即x表示像素点i在待处理图像中的横坐标,y表示像素点i在待处理图像中的纵坐标。
具体地,本实施例可以根据第一图像所对应的第一混合区域,从待处理图像中获取到第一像素点i1的第一颜色空间坐标以及第一空间坐标,而第一颜色空间坐标包括第一像素点i1所对应的色调值h1、饱和度值s1以及亮度v1,第一空间坐标包括第一像素点i1在待处理图像中所对应的横坐标x1以及纵坐标y1。还可以根据第一图像所对应的第一混合区域,从待处理图像中获取到第二像素点j1的第二颜色空间坐标以及第二空间坐标,而第二颜色空间坐标包括第二像素点j1所对应的色调值h2、饱和度值s2以及亮度v2,第二空间坐标包括在待处理图像中所对应的横坐标x2以及纵坐标y2
第一像素点i1的第一特征向量表示为:
X(i1)=(cos(h1),sin(h1),s1,v1,x1,y1);
第二像素点j1的第二特征向量表示为:
X(j1)=(cos(h2),sin(h2),s2,v2,x2,y2);
在获取到第一特征向量以及第二特征向量后,需要计算内核函数,内核函数可以根据下述公式进行计算:
Figure BDA0002311738180000181
其中,C表示权值调节系数,权值调节系数可以保证k(i,j)∈[0,1],||X(i)-X(j)||是1范数,即两个特征向量差的绝对值之和。
对于第一特征向量以及第二特征向量而言,所对应的内核函数为:
Figure BDA0002311738180000182
其中,k(i1,j1)表示第一特征向量以及第二特征向量对应的内核函数。
相似矩阵与内核函数的关系如下式所示:
Aij=k(i,j);
其中,相似矩阵即为内核函数的另一种表现形式。根据第一特征向量以及第二特征向量对应的内核函数得到第一相似矩阵为:
Ai1j1=k(i1,j1);
对角矩阵与相似矩阵的关系如下式所示:
Figure BDA0002311738180000183
根据第一相似矩阵Ai1j1可以得到第一对角矩阵:
Figure BDA0002311738180000184
拉普拉斯矩阵与对角矩阵以及相似矩阵的关系如下式所示:
L=D-A;
根据第一相似矩阵与第一对角矩阵,计算得到第一拉普拉斯矩阵:
L1=Dj1j1-Ai1j1
最后即可根据第一拉普拉斯矩阵L1,获取第一图像所对应的第一抠图图像。
本申请实施例中,本申请实施例中,提供了一种第一抠图图像生成的方法,通过上述方式,K近邻抠图算法提供了一个简单而快速的算法来产生更高质量的抠一抠图图像,由此可以提升抠图图像的像素以及细化图像的细节,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据待处理图像以及第二图像所对应的第二混合区域,生成第二抠图图像,可以包括:
根据第二图像的所对应的第二混合区域,从待处理图像中获取第三像素点的第三颜色空间坐标以及第三空间坐标,其中,第三颜色空间坐标包括第三像素点所对应的色调值、饱和度值以及亮度,第三空间坐标包括第三像素点在待处理图像所对应的横坐标和纵坐标;
根据第二图像的所对应的第二混合区域,从待处理图像中获取第二像素点的第四颜色空间坐标以及第四空间坐标,其中,第四颜色空间坐标包括第四像素点所对应的色调值、饱和度值以及亮度,第四空间坐标包括第四像素点在待处理图像所对应的横坐标和纵坐标;
根据第三颜色空间坐标以及第三空间坐标,计算得到第三像素点所对应的第三特征向量;
根据第四颜色空间坐标以及第四空间坐标,计算得到第四像素点所对应的第四特征向量;
基于内核函数,根据第三特征向量、第四特征向量以及权值调节系数,计算得到第二相似矩阵;
根据第二相似矩阵计算得到第二对角矩阵;
根据第二相似矩阵与第二对角矩阵,计算得到第二拉普拉斯矩阵;
根据第二拉普拉斯矩阵,获取第二图像所对应的第二抠图图像。
本实施例中,图像处理装置基于第二图像以及待处理图像生成第二抠图图像的方式,与基于第一图像以及待处理图像生成第一抠图图像的方式类似,此处不做赘述。
具体地,本实施例可以根据第二图像所对应的第二混合区域,从待处理图像中获取到第三像素点i2的第三颜色空间坐标以及第三空间坐标,而第三颜色空间坐标包括第三像素点i2所对应的色调值h3、饱和度值s3以及亮度v3,第三空间坐标包括第三像素点i2在待处理图像中所对应的横坐标x3以及纵坐标y3。其次,还可以根据第二图像所对应的第二混合区域,从待处理图像中获取到第四像素点j2的第四颜色空间坐标以及第四空间坐标,而第四颜色空间坐标包括第四像素点j2所对应的色调值h4、饱和度值s4以及亮度v4,第四空间坐标包括在待处理图像中所对应的横坐标x4以及纵坐标y4
第三像素点i1的第三特征向量表示为:
X(i2)=(cos(h3),sin(h3),s3,v3,x3,y3);
第四像素点j1的第四特征向量表示为:
X(j2)=(cos(h4),sin(h4),s4,v4,x4,y4);
在获取到第三特征向量以及第四特征向量后,需要计算内核函数,内核函数可以根据下述公式进行计算:
Figure BDA0002311738180000191
其中,C表示权值调节系数,权值调节系数可以保证k(i,j)∈[0,1],||X(i)-X(j)||是1范数,即两个特征向量差的绝对值之和。
因此对于第三特征向量以及第四特征向量而言,所对应的内核函数为:
Figure BDA0002311738180000192
其中,k(i1,j1)表示第第三特征向量以及第四特征向量对应的内核函数。
而相似矩阵与内核函数的关系如下式所示:
Aij=k(i,j);
其中,相似矩阵即为内核函数的另一种表现形式。根据第三特征向量以及第四特征向量对应的内核函数得到第二相似矩阵为:
Ai2j2=k(i2,j2);
对角矩阵与相似矩阵的关系如下式所示:
Figure BDA0002311738180000201
根据第二相似矩阵Ai1j1可以得到第二对角矩阵:
Figure BDA0002311738180000202
拉普拉斯矩阵与对角矩阵以及相似矩阵的关系如下式所示:
L=D-A;
根据第二相似矩阵与第二对角矩阵,计算得到第二拉普拉斯矩阵:
L2=Dj2j2-Ai2j2
最后即可根据第二拉普拉斯矩阵L2,获取第二图像所对应的第二抠图图像。
本申请实施例中,本申请实施例中,提供了一种第二抠图图像生成的方法,K近邻抠图算法提供了一个简单而快速的算法来产生更高质量的抠一抠图图像,由此可以提升抠图图像的像素以及细化图像的细节,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,根据第一抠图图像中的第三前景图像以及第二抠图图像中的第四前景图像,生成目标抠图图像,可以包括:
将第一抠图图像中的第三前景图像与第二抠图图像中的第四前景图像进行抠除处理,得到抠图图像;
对抠图图像进行去噪处理,得到目标抠图图像。
本实施例中,图像处理装置在获取到第一抠图图像以及第二抠图图像之后,可以将第一抠图图像以及第二抠图图像进行抠除处理,得到抠图图像,然后对得到的抠图图像进行去噪处理,从而得到目标抠图图像。
为了便于理解,请参阅图10,图10为本申请实施例中图像处理方法的另一个示意图,如图所示,图10中(A)所示第一抠图图像H1的前景为人像前景,而图10中(B)所示第二抠图图像H2的前景为除去头发区域的人像前景,因此将10中(A)所示第一抠图图像H1与图10中(B)所示第二抠图图像H2进行抠除处理,该抠除处理就是把第一抠图图像H1的前景以及第二抠图图像H2的前景从图像中抠除之和相减,相减后能够保留头发区域,从而获取到如图10中(C)所示抠图图像H3,由于分割的时存在的噪声点,因此可以看到抠图图像H3中,头发Matting图上存在白色小点区域,因此需要对抠图图像H3进行去噪处理,从而可以得到无噪声的的如图10中(D)所示目标抠图图像H4。
本申请实施例中,本申请实施例中,提供了一种得到目标抠图图像的方法,通过上述方式,由于可以对抠图图像进行了去噪处理,提升所得到的目标抠图图像的准确度,从而提升图像处理的精确度。
可选地,在上述图2对应的各个实施例的基础上,本申请实施例提供的图像处理的方法一个可选实施例中,对抠图图像进行去噪处理,得到目标抠图图像,可以包括:
根据抠图图像生成二值图像;
根据二值图像获取背景区域内的连通区域;
根据连通区域确定连通面积,其中,连通面积包括至少一个像素点;
若连通面积小于或等于连通面积阈值,则将连通面积中像素点所对应的像素值设置为背景区域中像素点所对应的像素值。
本实施例中,由于分割的时存在的噪声点,因此抠图图像可能会存在噪声点,因此可以根据该抠图图像生成二值图像,然后根据二值图像获取背景区域内的连通区域,进一步地由连通区域确定包括至少一个像素点的连通面积,当连通面积小于或等于连通面积阈值时,则将连通面积中像素点所对应的像素值设置为背景区域中像素点所对应的像素值。最后即可得到目标抠图图像。
具体地,利用cv2.threshold将抠图图像转成二值图像,其中二值图像即为前景255和背景0的黑白图像。然后利用measure.label函数计算二值图像的连通区域,这时候可以得到多个连通区域,进一步地计算每个连通区域中包括至少一个像素点的连通面积,并且通过待处理图像预设一个阈值t,本实施例以阈值t是30为示例,如果连通面积小于30,那么连通面积小于30的区域中的所有的点标记成背景0,也就是处理为黑色,因为面积较小的区域往往是一些噪声点,因此通过上述步骤就可以去掉抠图图像中的噪声区域,然后即可得到去噪后的目标抠图图像。
本申请实施例中,提供了一种抠图图像去噪的方法,具体通过二值图像以及判断阈值的方法对抠图图像进行去噪处理,提升所得到的目标抠图图像的准确度,从而提升图像处理的精确度,其次还提升了本申请实施例的可行性。
结合上述介绍,下面将对本申请中图像合成的方法进行介绍,请参阅图11,图11为本申请实施例中图像合成的方法一个实施例示意图,如图所示,本申请实施例中图像合成的方法一个实施例包括:
201、获取待处理图像以及待合成图像,其中,待处理图像包括待抠图对象;
本实施例中,首先图像合成装置可以获取待合成图像以及待处理图像,需要说明的是,图像合成装置可以部署于服务器,也可以部署于终端设备,本申请以部署于终端设备为例进行介绍,然而,这不应理解为对本申请的限定。
具体地,待处理图像可以是人物A的照片,待合成图像可以是人物B的照片,待抠图对象可以是人物A的头发。
202、根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
本实施例中,图像合成装置可以根据该待处理图像获取到第一前景区域、第一背景区域以及第一混合区域,且第一前景区域包括待抠图对象所对应的区域,第一前景区域、第一背景区域以及第一混合区域构成第一图像,其次,还可以根据该待处理图像获取到第二前景区域、第二背景区域以及第二混合区域,且第二背景区域包括待抠图对象所对应的区域,第二前景区域、第二背景区域以及第二混合区域构成第二图像。具体可以参阅图3所描述的内容,此处不做赘述。
203、根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
本实施例中,图像合成装置可以获取到第一图像所对应的包括第三前景区域以及第三背景区域的第一抠图图像,并且第三前景区域包括待抠图对象所对应的区域。此外,还可以获取到第二图像所对应的第四前景区域以及第四背景区域的第二抠图图像,并且第四背景区域包括待抠图对象所对应的区域。应理解,在实际应用中,由于对背景以及前景进行分割时,可能有噪声点的产生,因此在第三背景区域以及第四前景区域内可能会出现一部分噪声点,并且第三背景区域以及第四前景区域可能包括小部分的头发部分。具体可以参阅图4所描述的内容,此处不做赘述。
204、根据第一抠图图像中的第三前景图像以及第二抠图图像中的第四前景图像,生成目标抠图图像;
本实施例中,图像合成装置进一步地可以根据所获取的第一抠图图像以及第二抠图图像生成包括待抠图对象所对应的区域的目标抠图图像。具体可以参阅图5所描述的内容,此处不做赘述。
205、采用目标抠图图像从待处理图像中提取待抠图对象所对应的区域;
本实施例中,图像合成装置利用目标抠图图像从待处理图像中抠出待抠图对象所对应的区域,例如,头发所对应的区域。
206、将待抠图对象所对应的区域与待合成图像进行合并处理,得到合成图像。
本实施例中,图像合成装置抠出待抠图对象所对应的区域,比如,头发所对应的区域,于是可以将待合成图像作为第一个图层,头发所对应的区域作为第二图层,将第二图层覆盖于第一图层之上,由此可以在人物A上展示人物B的头发。
本申请实施例中,提供了一种图像合成的方法,通过上述方式,利用图像分割后得到的结果分别得到第一图像和第二图像,第一图像和第二图像均为三元图,再利用抠图技术分别得到第一抠图图像和第二抠图图像,第一抠图图像和第二抠图图像相比于分割得到的图像而言,具有更精细的构造,将两者进行叠加后就可以抠除待抠图对象,利用目标抠图图像抠除的待抠图对象与待合成图像进行合并处理,能够更好地进行图像融合,提升图像合成的合成效果。
下面对本申请中的图像处理装置进行详细描述,请参阅图12,图12为本申请实施例中图像处理装置一个实施例示意图,图像处理装置30包括:
获取模块301,用于获取待处理图像,其中,待处理图像包括待抠图对象;
获取模块301,还用于根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
获取模块301,还用于根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
生成模块302,用于根据获取模块301获取的第一抠图图像以及第二抠图图像生成目标抠图图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体用于基于待处理图像,通过图像分割模型获取目标分割图像;
根据目标分割图像以及待抠图对象生成第一图像;
根据目标分割图像以及待抠图对象生成第二图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,图像分割模型为双边分割网络BiSeNet结构;
获取模块301,具体用于基于待处理图像,通过BiSeNet所包含的M个卷积层获取第一特征图,其中,M为大于或等于1的整数;
基于待处理图像,通过BiSeNet所包含的N个池化层获取第二特征图,其中,N为大于或等于1的整数;
基于第一特征图以及第二特征图,通过BiSeNet所包含的特征融合模块获取目标分割图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体用于根据目标分割图像以及待抠图对象,确定第一待更新前景区域以及第一待更新背景区域,其中,第一待更新前景区域包括待抠图对象;
获取第一待更新前景区域所对应的第一轮廓线;
根据第一轮廓线,沿第一待更新前景区域向内扩展生成第一轮廓区域;
根据第一轮廓线,沿第一待更新背景区域向外扩展生成第二轮廓区域;
将第一轮廓区域与第二轮廓区域进行叠加处理,得到第一混合区域;
将第一待更新前景区域与第一轮廓区域进行抠除处理,得到第一前景区域;
将第一待更新背景区域与第二轮廓区域进行抠除处理,得到第一背景区域。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体用于根据目标分割图像以及待抠图对象,确定第二待更新前景区域以及第二待更新背景区域,其中,第二待更新背景区域包括待抠图对象;
获取第二待更新前景区域所对应的第二轮廓线;
根据第二轮廓线,沿第二待更新前景区域向内扩展生成第三轮廓区域;
根据第二轮廓线,沿第二待更新背景区域向外扩展生成第四轮廓区域;
将第三轮廓区域与第四轮廓区域进行叠加处理,得到第二混合区域;
将第二待更新前景区域与第三轮廓区域进行抠除处理,得到第二前景区域;
将第二待更新背景区域与第四轮廓区域进行抠除处理,得到第二背景区域。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体根据待处理图像以及第一图像所对应的第一混合区域,生成第一抠图图像;
根据待处理图像以及第二图像所对应的第二混合区域,生成第二抠图图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体用于根据第一图像所对应的第一混合区域,从待处理图像中获取第一像素点的第一颜色空间坐标以及第一空间坐标,其中,第一颜色空间坐标包括第一像素点所对应的色调值、饱和度值以及亮度,第一空间坐标包括第一像素点在待处理图像所对应的横坐标和纵坐标;
根据第一图像所对应的第一混合区域,从待处理图像中获取第二像素点的第二颜色空间坐标以及第二空间坐标,其中,第二颜色空间坐标包括第二像素点所对应的色调值、饱和度值以及亮度,第二空间坐标包括第二像素点在待处理图像所对应的横坐标和纵坐标;
根据第一颜色空间坐标以及第一空间坐标,计算得到第一像素点所对应的第一特征向量;
根据第二颜色空间坐标以及第二空间坐标,计算得到第二像素点所对应的第二特征向量;
基于内核函数,根据第一特征向量、第二特征向量以及权值调节系数,计算得到第一相似矩阵;
根据第一相似矩阵计算得到第一对角矩阵;
根据第一相似矩阵与第一对角矩阵,计算得到第一拉普拉斯矩阵;
根据第一拉普拉斯矩阵,获取第一图像所对应的第一抠图图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
获取模块301,具体用于根据第二图像的所对应的第二混合区域,从待处理图像中获取第三像素点的第三颜色空间坐标以及第三空间坐标,其中,第三颜色空间坐标包括第三像素点所对应的色调值、饱和度值以及亮度,第三空间坐标包括第三像素点在待处理图像所对应的横坐标和纵坐标;
根据第二图像的所对应的第二混合区域,从待处理图像中获取第二像素点的第四颜色空间坐标以及第四空间坐标,其中,第四颜色空间坐标包括第四像素点所对应的色调值、饱和度值以及亮度,第四空间坐标包括第四像素点在待处理图像所对应的横坐标和纵坐标;
根据第三颜色空间坐标以及第三空间坐标,计算得到第三像素点所对应的第三特征向量;
根据第四颜色空间坐标以及第四空间坐标,计算得到第四像素点所对应的第四特征向量;
基于内核函数,根据第三特征向量、第四特征向量以及权值调节系数,计算得到第二相似矩阵;
根据第二相似矩阵计算得到第二对角矩阵;
根据第二相似矩阵与第二对角矩阵,计算得到第二拉普拉斯矩阵;
根据第二拉普拉斯矩阵,获取第二图像所对应的第二抠图图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
生成模块302,具体用于将第一抠图图像中的第三前景图像与第二抠图图像中的第四前景图像进行抠除处理,得到抠图图像;
对抠图图像进行去噪处理,得到目标抠图图像。
可选地,在上述图12所对应的实施例的基础上,本申请实施例提供的图像处理装置30的另一实施例中,
生成模块302,具体用于根据抠图图像生成二值图像;
根据二值图像获取背景区域内的连通区域;
根据连通区域确定连通面积,其中,连通面积包括至少一个像素点;
若连通面积小于或等于连通面积阈值,则将连通面积中像素点所对应的像素值设置为背景区域中像素点所对应的像素值。
下面对本申请中的图像合成装置进行详细描述,请参阅图13,图13为本申请实施例中图像合成装置一个实施例示意图,图像合成装置40包括:
获取模块401,用于获取待处理图像以及待合成图像,其中,待处理图像包括待抠图对象;
获取模块401,还用于根据待处理图像获取第一图像以及第二图像,其中,第一图像包括第一混合区域,第二图像包括第二混合区域,第一混合区域为第一图像中第一前景区域与第一背景区域之间的交叠区域,第二混合区域为第二图像中第二前景区域与第二背景区域之间的交叠区域,第一前景区域对应于第二前景区域以及待抠图对象所对应的区域;
获取模块401,还用于根据第一混合区域以及第二混合区域,确定第一图像所对应的第一抠图图像以及第二图像所对应的第二抠图图像,其中,第一抠图图像包括第三前景区域,第二抠图图像包括第四前景区域,第三前景区域对应于第四前景区域以及待抠图对象所对应的区域;
生成模块402,用于根据获取模块获取的第一抠图图像以及第二抠图图像生成目标抠图图像;
提取模块403,用于采用生成模块402生成的目标抠图图像从待处理图像中提取待抠图对象所对应的区域;
合成模块404,用于将提取模块403提取到的待抠图对象所对应的区域与待合成图像进行合并处理,得到合成图像。
本申请实施例还提供了另一种图像处理装置以及图像合成装置,图像处理装置以及图像合成装置可以部署于电子设备上,该电子设备可以是终端设备,如图14所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括手机、平板电脑、个人数字助理(personal digitalassistant,PDA)、销售终端设备(point of sales,POS)、车载电脑等任意终端设备,以终端设备为手机为例:
图14示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图14,手机包括:射频(radio frequency,RF)电路510、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(wireless fidelity,WiFi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解,图14中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。下面结合图14对手机的各个构成部件进行具体的介绍:
RF电路510可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器580处理;另外,将设计上行的数据发送给基站。通常,RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器520可用于存储软件程序以及模块,处理器580通过运行存储在存储器520的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元530可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元530可包括触控面板531以及其他输入设备532。触控面板531,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板531可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器580,并能接收处理器580发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531,输入单元530还可以包括其他输入设备532。具体地,其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541,可选的,可以采用液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板541。进一步的,触控面板531可覆盖显示面板541,当触控面板531检测到在其上或附近的触摸操作后,传送给处理器580以确定触摸事件的类型,随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图14中,触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器550,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板541的亮度,接近传感器可在手机移动到耳边时,关闭显示面板541和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路560、扬声器561,传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号,传输到扬声器561,由扬声器561转换为声音信号输出;另一方面,传声器562将收集的声音信号转换为电信号,由音频电路560接收后转换为音频数据,再将音频数据输出处理器580处理后,经RF电路510以发送给比如另一手机,或者将音频数据输出至存储器520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图14示出了WiFi模块570,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器580是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器520内的软件程序和/或模块,以及调用存储在存储器520内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器580可包括一个或多个处理单元;可选的,处理器580可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器580中。
手机还包括给各个部件供电的电源590(比如电池),可选的,电源可以通过电源管理系统与处理器580逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端设备所包括的处理器580用于执行如图2对应的各个实施例,或者执行如图11对应的各个实施例。
本申请实施例还提供了另一种图像处理装置以及图像合成装置,图像处理装置以及图像合成装置可以部署于电子设备上,该电子设备可以是服务器,图15是本申请实施例提供的一种服务器结构示意图,该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图15所示的服务器结构。
在本申请实施例中,该服务器所包括的CPU 622用于执行如图2对应的各个实施例,或者执行如图11对应的各个实施例。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (15)

1.一种图像处理的方法,其特征在于,包括:
获取待处理图像,其中,所述待处理图像包括待抠图对象;
根据所述待处理图像获取第一图像以及第二图像,其中,所述第一图像包括第一混合区域,所述第二图像包括第二混合区域,所述第一混合区域为所述第一图像中第一前景区域与第一背景区域之间的交叠区域,所述第二混合区域为所述第二图像中第二前景区域与所述第二背景区域之间的交叠区域,所述第一前景区域对应于所述第二前景区域以及所述待抠图对象所对应的区域;
根据所述第一混合区域以及所述第二混合区域,确定所述第一图像所对应的第一抠图图像以及所述第二图像所对应的第二抠图图像,其中,所述第一抠图图像包括第三前景区域,所述第二抠图图像包括第四前景区域,所述第三前景区域对应于所述第四前景区域以及所述待抠图对象所对应的区域;
根据所述第一抠图图像中的所述第三前景图像以及所述第二抠图图像中的所述第四前景图像,生成目标抠图图像。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待处理图像获取第一图像以及第二图像,包括:
基于所述待处理图像,通过图像分割模型获取目标分割图像;
根据所述目标分割图像以及所述待抠图对象生成所述第一图像;
根据所述目标分割图像以及所述待抠图对象生成所述第二图像。
3.根据权利要求2所述的方法,其特征在于,所述基于所述待处理图像,通过图像分割模型获取目标分割图像,包括:
所述基于所述待处理图像,通过图像分割模型获取目标分割图像,包括:
基于所述待处理图像,通过所述图像分割模型所包含的M个卷积层获取第一特征图,其中,所述M为大于或等于1的整数;
基于所述待处理图像,通过所述图像分割模型所包含的N个池化层获取第二特征图,其中,所述N为大于或等于1的整数;
基于所述第一特征图以及所述第二特征图,通过所述图像分割模型所包含的特征融合模块获取所述目标分割图像。
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标分割图像以及所述待抠图对象生成所述第一图像,包括:
根据所述目标分割图像以及所述待抠图对象,确定第一待更新前景区域以及第一待更新背景区域,其中,所述第一待更新前景区域包括所述待抠图对象;
获取所述第一待更新前景区域所对应的第一轮廓线;
根据所述第一轮廓线,沿所述第一待更新前景区域向内扩展生成第一轮廓区域;
根据所述第一轮廓线,沿所述第一待更新背景区域向外扩展生成第二轮廓区域;
将所述第一轮廓区域与所述第二轮廓区域进行叠加处理,得到所述第一混合区域;
将所述第一待更新前景区域与所述第一轮廓区域进行抠除处理,得到所述第一前景区域;
将所述第一待更新背景区域与所述第二轮廓区域进行抠除处理,得到所述第一背景区域。
5.根据权利要求2所述的方法,其特征在于,所述根据所述目标分割图像以及所述待抠图对象生成所述第二图像,包括:
根据所述目标分割图像以及所述待抠图对象,确定第二待更新前景区域以及第二待更新背景区域,其中,所述第二待更新背景区域包括所述待抠图对象;
获取所述第二待更新前景区域所对应的第二轮廓线;
根据所述第二轮廓线,沿所述第二待更新前景区域向内扩展生成第三轮廓区域;
根据所述第二轮廓线,沿所述第二待更新背景区域向外扩展生成第四轮廓区域;
将所述第三轮廓区域与所述第四轮廓区域进行叠加处理,得到所述第二混合区域;
将所述第二待更新前景区域与所述第三轮廓区域进行抠除处理,得到所述第二前景区域;
将所述第二待更新背景区域与所述第四轮廓区域进行抠除处理,得到所述第二背景区域。
6.根据权利要求1所述的方法,其特征在于,所述根据所述第一混合区域以及所述第二混合区域,确定所述第一图像所对应的第一抠图图像以及所述第二图像所对应的第二抠图图像,包括:
根据所述待处理图像以及所述第一图像所对应的所述第一混合区域,生成所述第一抠图图像;
根据所述待处理图像以及所述第二图像所对应的所述第二混合区域,生成所述第二抠图图像。
7.根据权利要求6所述的方法,其特征在于,所述根据所述待处理图像以及所述第一图像所对应的所述第一混合区域,生成所述第一抠图图像,包括:
根据所述第一图像所对应的第一混合区域,从所述待处理图像中获取第一像素点的第一颜色空间坐标以及第一空间坐标,其中,所述第一颜色空间坐标包括所述第一像素点所对应的色调值、饱和度值以及亮度,所述第一空间坐标包括所述第一像素点在所述待处理图像所对应的横坐标和纵坐标;
根据所述第一图像所对应的第一混合区域,从所述待处理图像中获取第二像素点的第二颜色空间坐标以及第二空间坐标,其中,所述第二颜色空间坐标包括所述第二像素点所对应的色调值、饱和度值以及亮度,所述第二空间坐标包括所述第二像素点在所述待处理图像所对应的横坐标和纵坐标;
根据所述第一颜色空间坐标以及所述第一空间坐标,计算得到所述第一像素点所对应的第一特征向量;
根据所述第二颜色空间坐标以及所述第二空间坐标,计算得到所述第二像素点所对应的第二特征向量;
基于内核函数,根据所述第一特征向量、所述第二特征向量以及权值调节系数,计算得到第一相似矩阵;
根据所述第一相似矩阵计算得到第一对角矩阵;
根据所述第一相似矩阵与所述第一对角矩阵,计算得到第一拉普拉斯矩阵;
根据所述第一拉普拉斯矩阵,获取所述第一图像所对应的所述第一抠图图像。
8.根据权利要求6所述的方法,其特征在于,所述根据所述待处理图像以及所述第二图像所对应的所述第二混合区域,生成所述第二抠图图像,包括:
根据所述第二图像的所对应的第二混合区域,从所述待处理图像中获取第三像素点的第三颜色空间坐标以及第三空间坐标,其中,所述第三颜色空间坐标包括所述第三像素点所对应的色调值、饱和度值以及亮度,所述第三空间坐标包括所述第三像素点在所述待处理图像所对应的横坐标和纵坐标;
根据所述第二图像的所对应的第二混合区域,从所述待处理图像中获取第二像素点的第四颜色空间坐标以及第四空间坐标,其中,所述第四颜色空间坐标包括所述第四像素点所对应的色调值、饱和度值以及亮度,所述第四空间坐标包括所述第四像素点在所述待处理图像所对应的横坐标和纵坐标;
根据所述第三颜色空间坐标以及所述第三空间坐标,计算得到所述第三像素点所对应的第三特征向量;
根据所述第四颜色空间坐标以及所述第四空间坐标,计算得到所述第四像素点所对应的第四特征向量;
基于内核函数,根据所述第三特征向量、所述第四特征向量以及权值调节系数,计算得到第二相似矩阵;
根据所述第二相似矩阵计算得到第二对角矩阵;
根据所述第二相似矩阵与所述第二对角矩阵,计算得到第二拉普拉斯矩阵;
根据所述第二拉普拉斯矩阵,获取所述第二图像所对应的所述第二抠图图像。
9.根据权利要求1至8中任一项所述的方法,其特征在于,所述根据所述第一抠图图像中的所述第三前景图像以及所述第二抠图图像中的所述第四前景图像,生成目标抠图图像,包括:
将所述第一抠图图像中的所述第三前景图像与所述第二抠图图像中的所述第四前景图像进行抠除处理,得到抠图图像;
对所述抠图图像进行去噪处理,得到所述目标抠图图像。
10.根据权利要求9所述的方法,其特征在于,所述对所述抠图图像进行去噪处理,得到所述目标抠图图像,包括:
根据所述抠图图像生成二值图像;
根据所述二值图像获取背景区域内的连通区域;
根据所述连通区域确定连通面积,其中,所述连通面积包括至少一个像素点;
若所述连通面积小于或等于连通面积阈值,则将所述连通面积中像素点所对应的像素值设置为所述背景区域中像素点所对应的像素值。
11.一种图像合成的方法,其特征在于,包括:
获取待处理图像以及待合成图像,其中,所述待处理图像包括待抠图对象;
根据所述待处理图像获取第一图像以及第二图像,其中,所述第一图像包括第一混合区域,所述第二图像包括第二混合区域,所述第一混合区域为所述第一图像中第一前景区域与所述第一背景区域之间的交叠区域,所述第二混合区域为所述第二图像中第二前景区域与所述第二背景区域之间的交叠区域,所述第一前景区域对应于所述第二前景区域以及所述待抠图对象所对应的区域;
根据所述第一混合区域以及所述第二混合区域,确定所述第一图像所对应的第一抠图图像以及所述第二图像所对应的第二抠图图像,其中,所述第一抠图图像包括第三前景区域,所述第二抠图图像包括第四前景区域,所述第三前景区域对应于所述第四前景区域以及所述待抠图对象所对应的区域;
根据所述第一抠图图像中的所述第三前景图像以及所述第二抠图图像中的所述第四前景图像,生成目标抠图图像;
采用所述目标抠图图像从所述待处理图像中提取所述待抠图对象所对应的区域;
将所述待抠图对象所对应的区域与所述待合成图像进行合并处理,得到合成图像。
12.一种图像处理装置,其特征在于,包括:
获取模块,用于获取待处理图像,其中,所述待处理图像包括待抠图对象;
所述获取模块,还用于根据所述待处理图像获取第一图像以及第二图像,其中,所述第一图像包括第一混合区域,所述第二图像包括第二混合区域,所述第一混合区域为所述第一图像中第一前景区域与所述第一背景区域之间的交叠区域,所述第二混合区域为所述第二图像中第二前景区域与所述第二背景区域之间的交叠区域,所述第一前景区域对应于所述第二前景区域以及所述待抠图对象所对应的区域;
所述获取模块,还用于根据所述第一混合区域以及所述第二混合区域,确定所述第一图像所对应的第一抠图图像以及所述第二图像所对应的第二抠图图像,其中,所述第一抠图图像包括第三前景区域,所述第二抠图图像包括第四前景区域,所述第三前景区域对应于所述第四前景区域以及所述待抠图对象所对应的区域;
生成模块,用于根据所述获取模块获取的所述第一抠图图像以及所述第二抠图图像生成目标抠图图像。
13.一种图像合成装置,其特征在于,包括:
获取模块,用于获取待处理图像以及待合成图像,其中,所述待处理图像包括待抠图对象;
所述获取模块,还用于根据所述待处理图像获取第一图像以及第二图像,其中,所述第一图像包括第一混合区域,所述第二图像包括第二混合区域,所述第一混合区域为所述第一图像中第一前景区域与所述第一背景区域之间的交叠区域,所述第二混合区域为所述第二图像中第二前景区域与所述第二背景区域之间的交叠区域,所述第一前景区域对应于所述第二前景区域以及所述待抠图对象所对应的区域;
所述获取模块,还用于根据所述第一混合区域以及所述第二混合区域,确定所述第一图像所对应的第一抠图图像以及所述第二图像所对应的第二抠图图像,其中,所述第一抠图图像包括第三前景区域,所述第二抠图图像包括第四前景区域,所述第三前景区域对应于所述第四前景区域以及所述待抠图对象所对应的区域;
生成模块,用于根据所述获取模块获取的所述第一抠图图像以及所述第二抠图图像生成目标抠图图像;
提取模块,用于采用所述生成模块生成的所述目标抠图图像从所述待处理图像中提取所述待抠图对象所对应的区域;
合成模块,用于将所述提取模块提取到的所述待抠图对象所对应的区域与所述待合成图像进行合并处理,得到合成图像。
14.一种电子设备,其特征在于,包括:存储器、收发器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,包括执行如上述权利要求1至10中任一项所述的方法,或,执行如上述权利要求11所述的方法;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
15.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至10中任一项所述的方法,或,执行如权利要求11所述的方法。
CN201911261574.3A 2019-12-10 2019-12-10 一种图像处理的方法、图像合成的方法以及相关装置 Pending CN111080656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911261574.3A CN111080656A (zh) 2019-12-10 2019-12-10 一种图像处理的方法、图像合成的方法以及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911261574.3A CN111080656A (zh) 2019-12-10 2019-12-10 一种图像处理的方法、图像合成的方法以及相关装置

Publications (1)

Publication Number Publication Date
CN111080656A true CN111080656A (zh) 2020-04-28

Family

ID=70313992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911261574.3A Pending CN111080656A (zh) 2019-12-10 2019-12-10 一种图像处理的方法、图像合成的方法以及相关装置

Country Status (1)

Country Link
CN (1) CN111080656A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681255A (zh) * 2020-08-17 2020-09-18 腾讯科技(深圳)有限公司 一种对象识别方法和相关装置
CN112184722A (zh) * 2020-09-15 2021-01-05 上海传英信息技术有限公司 图像处理方法、终端及计算机存储介质
CN112734780A (zh) * 2020-12-25 2021-04-30 哈尔滨市科佳通用机电股份有限公司 一种脱轨自动制动拉环装置拉环变形故障识别方法
CN112991377A (zh) * 2021-04-22 2021-06-18 辽宁向日葵教育科技有限公司 一种基于opencv和shader融合技术的抠像算法
CN112990331A (zh) * 2021-03-26 2021-06-18 共达地创新技术(深圳)有限公司 图像处理方法、电子设备和存储介质
CN113506306A (zh) * 2021-06-18 2021-10-15 广州方图科技有限公司 多人抠图方法、系统、装置和存储介质
CN113658197A (zh) * 2021-08-20 2021-11-16 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN114187317A (zh) * 2021-12-10 2022-03-15 北京百度网讯科技有限公司 图像抠图的方法、装置、电子设备以及存储介质
CN114820686A (zh) * 2022-05-16 2022-07-29 北京百度网讯科技有限公司 抠图的方法、装置、电子设备及存储介质
CN114998156A (zh) * 2022-06-30 2022-09-02 同济大学 一种基于多补丁多尺度网络的图像运动去模糊方法
CN115359088A (zh) * 2022-10-18 2022-11-18 腾讯科技(深圳)有限公司 一种图像处理方法及装置
CN116020122A (zh) * 2023-03-24 2023-04-28 深圳游禧科技有限公司 游戏攻略推荐方法、装置、设备及存储介质
WO2024040370A1 (zh) * 2022-08-22 2024-02-29 京东方科技集团股份有限公司 一种色分离抑制显示的方法及场序显示设备

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681255A (zh) * 2020-08-17 2020-09-18 腾讯科技(深圳)有限公司 一种对象识别方法和相关装置
CN112184722A (zh) * 2020-09-15 2021-01-05 上海传英信息技术有限公司 图像处理方法、终端及计算机存储介质
CN112184722B (zh) * 2020-09-15 2024-05-03 上海传英信息技术有限公司 图像处理方法、终端及计算机存储介质
CN112734780A (zh) * 2020-12-25 2021-04-30 哈尔滨市科佳通用机电股份有限公司 一种脱轨自动制动拉环装置拉环变形故障识别方法
CN112990331A (zh) * 2021-03-26 2021-06-18 共达地创新技术(深圳)有限公司 图像处理方法、电子设备和存储介质
CN112991377A (zh) * 2021-04-22 2021-06-18 辽宁向日葵教育科技有限公司 一种基于opencv和shader融合技术的抠像算法
CN113506306A (zh) * 2021-06-18 2021-10-15 广州方图科技有限公司 多人抠图方法、系统、装置和存储介质
CN113658197A (zh) * 2021-08-20 2021-11-16 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN113658197B (zh) * 2021-08-20 2023-09-05 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN114187317B (zh) * 2021-12-10 2023-01-31 北京百度网讯科技有限公司 图像抠图的方法、装置、电子设备以及存储介质
CN114187317A (zh) * 2021-12-10 2022-03-15 北京百度网讯科技有限公司 图像抠图的方法、装置、电子设备以及存储介质
CN114820686A (zh) * 2022-05-16 2022-07-29 北京百度网讯科技有限公司 抠图的方法、装置、电子设备及存储介质
CN114820686B (zh) * 2022-05-16 2022-12-16 北京百度网讯科技有限公司 抠图的方法、装置、电子设备及存储介质
CN114998156A (zh) * 2022-06-30 2022-09-02 同济大学 一种基于多补丁多尺度网络的图像运动去模糊方法
WO2024040370A1 (zh) * 2022-08-22 2024-02-29 京东方科技集团股份有限公司 一种色分离抑制显示的方法及场序显示设备
CN115359088B (zh) * 2022-10-18 2023-01-20 腾讯科技(深圳)有限公司 一种图像处理方法及装置
CN115359088A (zh) * 2022-10-18 2022-11-18 腾讯科技(深圳)有限公司 一种图像处理方法及装置
CN116020122A (zh) * 2023-03-24 2023-04-28 深圳游禧科技有限公司 游戏攻略推荐方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111080656A (zh) 一种图像处理的方法、图像合成的方法以及相关装置
CN109784424B (zh) 一种图像分类模型训练的方法、图像处理的方法及装置
EP3982290A1 (en) Artificial intelligence-based image recognition method and related device
CN111210443B (zh) 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN110084161B (zh) 一种人体骨骼关键点的快速检测方法及系统
CN110163806B (zh) 一种图像处理方法、装置以及存储介质
US20220351346A1 (en) Method for processing images and electronic device
CN108875594B (zh) 一种人脸图像的处理方法、装置以及存储介质
CN111325271B (zh) 图像分类方法及装置
CN111209423B (zh) 一种基于电子相册的图像管理方法、装置以及存储介质
CN110211086B (zh) 图像分割方法、装置及存储介质
CN106407978B (zh) 一种结合似物度的无约束视频中显著物体检测方法
CN114820633A (zh) 语义分割方法、语义分割模型的训练方法、装置及设备
CN112215861A (zh) 一种足球检测方法、装置、计算机可读存储介质及机器人
CN114037692A (zh) 图像处理方法、移动终端及存储介质
CN111709317A (zh) 一种基于显著性模型下多尺度特征的行人重识别方法
CN113052923B (zh) 色调映射方法、装置、电子设备和存储介质
CN113743300A (zh) 基于语义分割的高分遥感图像云检测方法和装置
CN110490953B (zh) 基于文本的图像生成方法、终端设备及介质
CN116630354A (zh) 一种视频抠图方法、电子设备、存储介质及程序产品
CN109359543B (zh) 一种基于骨骼化的人像检索方法及装置
CN114943976B (zh) 模型生成的方法、装置、电子设备和存储介质
CN115761223A (zh) 一种利用数据合成的遥感影像实例分割方法
CN114882226A (zh) 图像处理方法、智能终端及存储介质
CN117237386A (zh) 对目标对象进行结构化处理的方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021701

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination