CN110634147A - 基于双边引导上采样的图像抠图方法 - Google Patents

基于双边引导上采样的图像抠图方法 Download PDF

Info

Publication number
CN110634147A
CN110634147A CN201910886388.2A CN201910886388A CN110634147A CN 110634147 A CN110634147 A CN 110634147A CN 201910886388 A CN201910886388 A CN 201910886388A CN 110634147 A CN110634147 A CN 110634147A
Authority
CN
China
Prior art keywords
image
resolution
sampling
bilateral
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910886388.2A
Other languages
English (en)
Other versions
CN110634147B (zh
Inventor
翟东婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanfeng Visteon Electronic Technology Shanghai Co Ltd
Original Assignee
Yanfeng Visteon Electronic Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanfeng Visteon Electronic Technology Shanghai Co Ltd filed Critical Yanfeng Visteon Electronic Technology Shanghai Co Ltd
Priority to CN201910886388.2A priority Critical patent/CN110634147B/zh
Publication of CN110634147A publication Critical patent/CN110634147A/zh
Application granted granted Critical
Publication of CN110634147B publication Critical patent/CN110634147B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

一种基于双边引导上采样的图像抠图方法,对输入图像进行下采样,获得低分辨率图像;低分辨率图像通过闭合解抠图方法进行抠图,获得低分辨率输出图像,即低分辨率前景图像;将输入/输出图像对在空间域和亮度域进行采样,转换为3D双边网格;通过3D双边网格,求解每个位置的像素值,获得输入颜色映射到输出颜色的仿射矩阵;以原始高分辨输入图像为参考对低分辨率前景图像进行联合双边滤波上采样,恢复原始分辨率,通过仿射矩阵对输入图像进行仿射变换,计算获得高分辨率前景图像。该方法在减少计算量的同时达到令人满意的抠图效果,并能有效满足实时应用中快速抠图的需求。

Description

基于双边引导上采样的图像抠图方法
技术领域:
本发明涉及物理领域,尤其涉及数字图像处理技术,具体的是一种基于双边引导上采样的图像抠图方法。
背景技术:
图像抠图是指从图像或视频背景中精确地分离出前景,该技术能够将人们需要的区域提取出来,便于对图像关键信息进行后续操作。该技术广泛应用于图像处理、视频编辑和电影制作中,是计算机视觉领域的重要问题。近年来数字抠图技术获得广泛关注和研究,主要技术方法可分类为基于颜色采样的方法,基于像素相似性的方法,基于能量函数的方法,基于机器学习的方法。这些方法针对不同应用场景,取得了一定的进展,根据图像的特点获得不同的表现效果。但是大部分算法计算量大,耗时较长,在效率方面还有待提升。
发明内容:
本发明的目的在于克服现有技术存在的缺点,提供了基于双边引导上采样的图像抠图方法,结合了引导滤波和联合双边上采样方法的特点,采用双边引导上采样方法,将图像进行四分之一下采样后,对下采样后的图像进行抠图运算,然后再通过双边引导上采样方法恢复到原始图像大小,在减少计算量的同时达到令人满意的抠图效果,该抠图方法能有效满足实时应用中快速抠图的需求。
本发明的这种基于双边引导上采样的图像抠图方法,包括以下步骤:步骤一:对输入图像进行下采样,获得低分辨率图像;步骤二:所述低分辨率图像通过闭合解抠图方法进行抠图,获得低分辨率前景图像;步骤三:将所述输入/输出图像对在空间域和亮度域进行采样,转换为3D双边网格;步骤四:拟合双边空间仿射模型;步骤五:获取高分辨率前景图像输出结果。
进一步的,所述仿射矩阵中加入平滑项,防止伪边缘及噪声放大。
本发明的原理是:双边引导上采样结合引导滤波和联合双边上采样的特点,对下采样的低分辨率图像以原始图像为先验进行上采样。将原始图像转换到一个3D的双边网格之后,任何图像操作都可以作用在这个双边网格上。最后通过联合双边滤波上采样进行插值,获得高分辨抠图图像结果。
本发明和已有技术相比较,其效果是积极和明显的。本发明结合了引导滤波和联合双边上采样方法的特点,采用双边引导上采样方法,将图像进行四分之一下采样后,对下采样后的图像进行抠图运算,然后再通过双边引导上采样方法恢复到原始图像大小,在减少计算量的同时达到令人满意的抠图效果,该抠图方法能有效满足实时应用中快速抠图的需求。
附图说明:
图1是本发明的流程示意图。
图2是本发明的输入图像示意图。
图3是本发明的交互图像示意图。
图4是本发明的alpha透明度图像示意图。
图5是本发明的前景图像示意图。
图6是本发明的背景图像示意图。
具体实施方式:
实施例1:
如图1至图6所示,本发明的这种基于双边引导上采样的图像抠图方法,包括以下步骤:
步骤一:对输入图像进行下采样,获得低分辨率图像。图像分辨率是指图像中存储的信息量,即每英寸图像内有多少个像素点。图像分辨率也可以叫做图像大小、图像尺寸、像素尺寸等,可以表达为水平像素数×垂直像素数,在本发明中,将待处理的原始图像称为高分辨率图像,经图像下采样后得到的图像称为低分辨率图像。
图像下采样,又称降采样,指的是缩小图像的操作。对于一幅尺寸为M×N的图像,对其进行s倍下采样,即得到尺寸为(M/s)×(N/s)的低分辨率图像,也就是把原始图像s×s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值。
步骤二:低分辨率图像通过闭合解抠图方法进行抠图,获得低分辨率前景图像;
原始图像(输入图像)表示为I,经下采样操作,将原始高分辨率图像变换为原始图像1/4大小的低分辨率图像。利用闭合解抠图方法进行抠图,其过程如下所述:
闭合解抠图方法:将图像Ii作为输入,将图像看作前景和背景的组合。每个像素的颜色是对应前景颜色和背景颜色的组合,即
Ii=αiFi+(1-αi)Bi (1)
式中,αi是前景不透明度,Fi是前景颜色,Bi是背景颜色,i表示图像上所有像素点。
对于式(1),等式右边αi、Fi和Bi都是未知量,对于彩色图像每个像素有3个等式7个未知数,这是严重的欠约束问题,需用户交互添加约束才能获得良好的抠图效果。
抠图问题是严重的欠约束问题,因此需要对前景F、背景B及不透明度α进行假设。对于灰度图像,假设F和B是每个像素附近小窗口上的近似常量。将式(1)展开,如式(2)的形式
Figure BDA0002207424710000031
由式(2)可得
Figure BDA0002207424710000032
经上述过程,重写式(1),将α表示成图像的线性函数,即
Figure BDA0002207424710000033
式中,
Figure BDA0002207424710000034
w是图像上像素附近小窗口。
求解α、a和b,以最小化式(5)的代价函数,即
Figure BDA0002207424710000035
式中wj是像素j附近的图像窗口,J表示惩罚函数,ε是关于a的正则化项,增加这一项目的是保持数值稳定性。
对于三通道彩色图像,可以单独在每个通道中应用灰度代价函数,用一个4D线性模型代替式(4)的线性模型,即
Figure BDA0002207424710000036
式中,c表示图像通道。
其抠图代价函数为:
Figure BDA0002207424710000037
最小化代价函数,求解出图像前景后,获得输入/输出图像对。
步骤三:将所述输入/输出图像对在空间域和亮度域进行采样,转换为3D双边网格;
双边网格是在空间域和亮度域进行采样,划分成3D网格,经采样离散后每个点的像素坐标和亮度信息取整到对应的网格内。每个值域内的亮度值可由加权平均获得。通过在网格内进行滤波等处理,再由上采样插值处理操作得到原始图像大小的高分辨率图像。构建一个双边网格首先根据空域和值域信息,划分出网格结构,并初始化所有网格的节点(i,j,k)为0,即:
Γ(i,j,k)=(0,0) (8)
式中,(i,j,k)表示3D双边网格位置索引,3D双边网格是3维数组,i,j,k分别表示数组的行、列、面的位置索引。
对于高分辨率图像的坐标,分别除以空间采样间隔和亮度采样间隔并取整,在对应的节点处填入其原始的灰度值。考虑到取整函数会导致原图像的某一邻域内的像素点会下采样到同一个网格中,因此将灰度值写成齐次坐标的形式,即(I(x,y),1),并对该网格内的所有齐次值进行累加,该网格对应的最终强度是这些灰度值的平均值,即:
(I(x1,y1)+…+I(xn,yn))/n (9)
对于像素位置为(x,y)处的每个像素进行网格填充:
Γ([x/ss],[y/ss],[I(x,y)/sr])+=(I(x,y),1) (10)
式中,[·]是最接近整数运算符,使用符号Γ=c(I)来构建,ss和sr分别表示空间域和亮度域采样率。
步骤四:拟合双边空间仿射模型;
在抠图类的任务里,在输入图像中具有近似颜色的邻近像素,在输出图像中也具有近似颜色。否则会引入输入图像中没有的新边缘、光晕或噪声。步骤三所述的双边网格中的算子可以看成是输入/输出的近似曲线,也就是仿射模型,对于每个网格其存储了一个3×4的仿射变换矩阵。对于不同的网格,通过给定输入和期望输出去训练这个双边网格实现仿射模型的全局分段平滑。将抠图算法应用于低分辨率的输入,得到低分辨率输出图像后,需要拟合低分辨率的输入/输出对的双边空间仿射模型,然后将模型应用于高分辨率的输入,从而加快了成像算子的速度。
利用快速逼近法拟合双边空间仿射模型,将双边网格中的仿射矩阵作为一组较小的重叠线性最小二乘问题来求解。在每个网格单元,期望3×4的仿射变换矩阵M完美地将每个输入像素i的RGB值α=[α1i2i3i]Τ映射到相应输出像素RGB值β=[β1i2i3i]Τ,即Mα=β。
式中,α1i、α2i、α3i分别表示每个输入像素i的R、G、B颜色通道的值,β1i、β2i、β3i分别表示相应输出像素i的R、G、B颜色通道的值。
此时在每个网格单元上求解MααΤ=βαΤ来求解仿射矩阵。
进一步的,仿射矩阵中加入平滑项,防止伪边缘及噪声放大。
给定低分辨的输入/输出参考图像对,通过拟合将输入映射到输出的局部曲线来为图像算子建模,然后通过在全分辨率输入图像上估计这些低分辨率曲线,即可得到全分辨率输出图像。通过将输入提升到双边网格,然后求解每个位置像素值并能最优地将输入颜色映射到输出颜色的仿射矩阵3D数组。
步骤五:获取高分辨率输出结果。
依据前述图像抠图快速实现原理,首先对图像进行下采样,获取低分辨率图像,对低分辨率图像抠图之后,需要对抠图后得到的前景图像进行上采样,恢复到原始图像大小。
以输入图像为参考图对低分辨率前景图像进行双边引导上采样,以获得高分辨率输出图像。将原图像转化为3D双边网格后,可以通过上采样并进行插值,获得与原始图像尺寸相同的高分辨率图像。上采样时选择一个参考图,对其所有像素进行空域和值域采样,然后确定其在网格中的位置,经过插值上采样获得最终的结果。
双边滤波是一种非线性滤波方法,结合了图像的空间邻近度和像素强度相似度,同时考虑空域信息和灰度相似性,达到边缘保持和去噪的目的。对于某个位置p双边滤波表达式如下:
归一化项:
kp=∑q∈Ωf(||p-q||)g(||Ip-Iq||) (12)
其中I表示输入图像,Ω表示滤波窗口,p、q表示像素在图像中的坐标,Ip、Iq表示对应位置的像素值,f、g是权重分布函数,一般为高斯函数,kp表示归一化项,Jp表示输出。
如果在值域的权重计算过程中引入另外一幅引导图像,则称之为联合双边滤波,表达式如下:
Figure BDA0002207424710000061
归一化项:
kp=Σq∈Ωf(||p-q||)g(||I'p-I'q||) (14)
其中I'表示引导图像。
联合双边上采样是在不需要原图的情况下,选取图像(i,j)为中心,以距离中心采样间隔的整数倍距离进行采样。也就是对于低分辨率的图像S应用空间滤波器,如高斯滤波器,对于值域的权重计算在高分辨率图像I'上进行,即可获得上采样后的图像S'。
Figure BDA0002207424710000062
式中,p、q表示高分辨率图像I'上的整数像素坐标,p和q表示对应的低分辨图像S上的坐标。
双边引导上采样结合了引导滤波和联合双边上采样的特点,对下采样后的低分辨率图像以原始高分辨率图像为先验进行上采样。将图像变换到3D双边网格后,任何图像操作算子都可以作用在这个双边网格上,再通过上采样、插值等操作,恢复到原始图像尺寸的高分辨图像。双边引导上采样选取高分辨率原始图像为参考,对其所有空间像素进行空间域和值域进行采样,确定其在双边网格上的位置,利用三次线性插值方法计算未知区域内亮度值。由于网格是3×4的仿射变换,恢复的高分辨率图像也是3×4变换矩阵,使用仿射变换矩阵对原始输入图像进行仿射变换,即可获得高分辨率的结果图像。

Claims (2)

1.一种基于双边引导上采样的图像抠图方法,其特征在于,包括以下步骤:
步骤一:对输入图像进行下采样,获得低分辨率图像;
步骤二:所述低分辨率图像通过闭合解抠图方法进行抠图,获得低分辨率前景图像;
步骤三:将所述输入/输出图像对在空间域和亮度域进行采样,转换为3D双边网格;
步骤四:拟合双边空间仿射模型;
步骤五:获取高分辨率前景图像输出结果。
2.如权利要求1所述的基于双边引导上采样的图像抠图方法,其特征在于:所述仿射矩阵中加入平滑项,防止伪边缘及噪声放大。
CN201910886388.2A 2019-09-19 2019-09-19 基于双边引导上采样的图像抠图方法 Active CN110634147B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910886388.2A CN110634147B (zh) 2019-09-19 2019-09-19 基于双边引导上采样的图像抠图方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910886388.2A CN110634147B (zh) 2019-09-19 2019-09-19 基于双边引导上采样的图像抠图方法

Publications (2)

Publication Number Publication Date
CN110634147A true CN110634147A (zh) 2019-12-31
CN110634147B CN110634147B (zh) 2023-06-23

Family

ID=68971709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910886388.2A Active CN110634147B (zh) 2019-09-19 2019-09-19 基于双边引导上采样的图像抠图方法

Country Status (1)

Country Link
CN (1) CN110634147B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111787227A (zh) * 2020-07-22 2020-10-16 苏州臻迪智能科技有限公司 基于跟踪拍摄的风格迁移方法及装置
CN112541873A (zh) * 2020-12-11 2021-03-23 江苏大学 一种基于双边滤波器的图像处理方法
CN113053044A (zh) * 2020-11-17 2021-06-29 泰州芯源半导体科技有限公司 应用大数据服务的现场计价平台
CN113284156A (zh) * 2021-07-23 2021-08-20 杭州星犀科技有限公司 实时无绿幕抠图方法、电子设备和存储介质
CN113538211A (zh) * 2020-04-22 2021-10-22 华为技术有限公司 一种画质增强装置及相关方法
WO2022078413A1 (zh) * 2020-10-13 2022-04-21 影石创新科技股份有限公司 基于深度学习的图像调色方法、装置、电子设备及计算机可读存储介质
CN115908667A (zh) * 2021-09-30 2023-04-04 想象技术有限公司 渲染3d场景的图像
US20230308769A1 (en) * 2022-03-25 2023-09-28 Google Llc Methods and Systems for User Adjustable Region based Brightness Settings
US12026855B2 (en) 2021-09-30 2024-07-02 Imagination Technologies Limited Rendering an image of a 3-D scene

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267494A1 (en) * 2007-04-30 2008-10-30 Microsoft Corporation Joint bilateral upsampling
US20110243428A1 (en) * 2010-04-01 2011-10-06 Mithun Das Gupta Bi-Affinity Filter: A Bilateral Type Filter for Color Images
CN104820990A (zh) * 2015-05-15 2015-08-05 北京理工大学 一种交互式图像抠图系统
CN108062769A (zh) * 2017-12-22 2018-05-22 中山大学 一种用于三维重建的快速深度恢复方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267494A1 (en) * 2007-04-30 2008-10-30 Microsoft Corporation Joint bilateral upsampling
US20110243428A1 (en) * 2010-04-01 2011-10-06 Mithun Das Gupta Bi-Affinity Filter: A Bilateral Type Filter for Color Images
CN104820990A (zh) * 2015-05-15 2015-08-05 北京理工大学 一种交互式图像抠图系统
CN108062769A (zh) * 2017-12-22 2018-05-22 中山大学 一种用于三维重建的快速深度恢复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖春霞等: "基于联合双边滤波的纹理合成上采样算法", 《计算机学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538211A (zh) * 2020-04-22 2021-10-22 华为技术有限公司 一种画质增强装置及相关方法
CN111787227A (zh) * 2020-07-22 2020-10-16 苏州臻迪智能科技有限公司 基于跟踪拍摄的风格迁移方法及装置
WO2022078413A1 (zh) * 2020-10-13 2022-04-21 影石创新科技股份有限公司 基于深度学习的图像调色方法、装置、电子设备及计算机可读存储介质
CN113053044A (zh) * 2020-11-17 2021-06-29 泰州芯源半导体科技有限公司 应用大数据服务的现场计价平台
CN112541873A (zh) * 2020-12-11 2021-03-23 江苏大学 一种基于双边滤波器的图像处理方法
CN112541873B (zh) * 2020-12-11 2024-05-14 江苏大学 一种基于双边滤波器的图像处理方法
CN113284156A (zh) * 2021-07-23 2021-08-20 杭州星犀科技有限公司 实时无绿幕抠图方法、电子设备和存储介质
CN115908667A (zh) * 2021-09-30 2023-04-04 想象技术有限公司 渲染3d场景的图像
US12026855B2 (en) 2021-09-30 2024-07-02 Imagination Technologies Limited Rendering an image of a 3-D scene
US20230308769A1 (en) * 2022-03-25 2023-09-28 Google Llc Methods and Systems for User Adjustable Region based Brightness Settings

Also Published As

Publication number Publication date
CN110634147B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN110634147B (zh) 基于双边引导上采样的图像抠图方法
CN107123089B (zh) 基于深度卷积网络的遥感图像超分辨重建方法及系统
CN110443842B (zh) 基于视角融合的深度图预测方法
CN110119780B (zh) 基于生成对抗网络的高光谱图像超分辨重建方法
Engin et al. Cycle-dehaze: Enhanced cyclegan for single image dehazing
JP5645842B2 (ja) スケールスペースを使用した画像処理装置及び方法
CN106127688B (zh) 一种超分辨率图像重建方法及其系统
CN105046672B (zh) 一种图像超分辨率重建方法
CN103034973A (zh) 基于双三次插值的自适应图像缩放方法
Wang et al. Variational single nighttime image haze removal with a gray haze-line prior
Li et al. Underwater image high definition display using the multilayer perceptron and color feature-based SRCNN
CN106920214A (zh) 空间目标图像超分辨率重建方法
Guo et al. Single image dehazing based on fusion strategy
CN109389569B (zh) 基于改进DehazeNet的监控视频实时去雾方法
CN108280804A (zh) 一种多帧图像超分辨率重建方法
CN104660951A (zh) 一种高清转超高清视频图像的超分辨率放大方法
CN111696033A (zh) 基于角点引导级联沙漏网络结构学习的真实图像超分辨率模型及方法
CN112419150A (zh) 一种基于双边上采样网络的任意倍数图像超分辨率重建方法
CN108596992B (zh) 一种快速实时的唇彩化妆方法
CN114022809A (zh) 基于改进自编码网络的视频运动放大方法
CN103903239B (zh) 一种视频超分辨率重建方法及其系统
CN111010605B (zh) 一种视频画中画窗口的显示方法
CN104732491A (zh) 一种边缘先验引导的单帧遥感图像超分辨率处理方法
CN104463793B (zh) 一种视频超分辨率重建方法及其系统
CN114240785A (zh) 一种光线追踪渲染连续帧的去噪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant