CN103714540B

CN103714540B - 数字抠像处理中的基于svm的透明度估计方法

Info

Publication number: CN103714540B
Application number: CN201310714556.2A
Authority: CN
Inventors: 林生佑
Original assignee: Zhejiang University of Media and Communications
Current assignee: Zhejiang University of Media and Communications
Priority date: 2013-12-21
Filing date: 2013-12-21
Publication date: 2017-01-11
Anticipated expiration: 2033-12-21
Also published as: CN103714540A

Abstract

本发明公开了一种数字抠像处理中的基于SVM的透明度估计方法。1）把图像前景物体的边缘手工分割成几个有少量重叠区域的子区域，剩余部分为确定的前景和背景区域并指明；2）在分割出的图像子区域中标识出部分确定的前景和背景像素点；3）对图像子区域中的其他像素点进行基于SVM的前景背景分类概率估计，得到所有像素点属于前景区域的概率值和属于背景区域的概率值，其中，则每个像素点的概率值就是该像素点的透明度值；4）合并每个子区域以及确定的前景和背景区域，即可得到整张图像的透明度值。本发明具有速度快，自动化程度较高的特点，具有很好的实用价值。

Description

数字抠像处理中的基于SVM的透明度估计方法

技术领域

本发明涉及一种数字抠像处理中基于SVM的透明度估计方法。

背景技术

抠像就是把一张图像中的前景和背景分隔开来的技术。抠像问题可以定义为：对给定图像上任一点c，求c点的颜色I所含的前景色F和alpha值α。抠像方程如下所示：

I＝αF+(1-α)B （1）

抠像问题的困难在于对图像上的任一点I，它的F和α的解并不是唯一的，我们要从无数对的解中找出最合理的解。

抠像一般可以分为两个主要步骤：

1)区域划分。一般情况下以手工划分为主。由于具体图像的情况复杂多变，图像中前景和背景区域的颜色在颜色空间中的分布如果重合，那么称该图像前景背景非简单可分，否则简单可分。非简单可分的图像，其前景背景区域的划分靠现有技术自动实现几乎是不可能的。由于区域划分的精确程度对抠图效果有很大的影响，因此在做抠像处理的区域划分时，一定量的人工交互是必不可少的。

2)透明度估计。目前，抠像技术可以分成三大类：第一类是基于采样的抠像技术。这类技术在得到三分图后，通过采集待处理区域中的像素点p的周边确定的前景点和背景点，估算出p点的前景颜色F和背景颜色B，然后利用抠像方程估算出透明度值α。比如Knockout方法、Hillman方法、Mishima方法和Bayesian方法等。此类抠像技术首先需要通过采集合适的前景点和背景点来估算F和B，然后利用F和B来估算α。如果图像颜色变化比较剧烈，F和B往往出现估算不连续的情况，这样直接导致抠像结果很差。第二类是基于相似性假设的抠像技术。它假设待处理图像在小范围内前景和背景颜色平滑，通过对列出的未知像素点误差方程求最小值，可以求得最优的α。比如泊松抠像的最优方程但对于图像颜色变化剧烈，前景背景复杂的情况，该假设就不成立，其抠像效果也较差。比如泊松抠像、随机行走方法和测地线方法等；第三类是采样与相似性结合的抠像技术。此类方法需要计算每个待处理像素点的数据能量E_d以及待处理像素点之间的相似能量E_s，并通过最小化两者的和来求得所有待处理像素的α值，如鲁棒抠像、快捷抠像等，但理论上E_d强调单个像素自己的特性，而E_s则强调相邻像素点之间的平滑性，他们分别在不同条件下取得最优值，所以该类抠像方法一般需要根据不同图像给E_d和E_s不同的权值才能比较有效地计算出α值。

在上述三类抠像算法中，基于采样的抠像技术需要先估计像素点的前景色F和背景色B，然后再利用F和B估计α，其结果需要图像的前景物体边缘区域颜色变化平滑，其优点是算法简单，处理速度快。基于相似性假设的抠像技术需假定图像在小范围内前景和背景颜色比较平滑，这在复杂背景和前景的情况下效果较差。第三类采样与相似性结合的抠像技术，该技术从理论上看也存在较大的弊端，由于数据能量E_d和相似能量E_s分别在不同条件下取得最小值，当求其总和最小时，不可避免地需要人工交互，一定程度上影响了算法的鲁棒性。

发明内容

透明度估计是抠像处理中的重要一环，我们需要减少对图像中前景和背景颜色做出过多的假设，并寻求在理论上构建更完美的抠像模型，减少出现错误的可能，以增强抠像算法的鲁棒性。本发明提供了一种数字抠像处理中的基于SVM的透明度估计方法，该方法在所处理的图像子区域内不需要对颜色做过多假设，可以在较短的时间内，通过计算每个未知像素点属于前景和背景的概率p₁和p₀，而α＝p₁,从而得到较为准确的像素点透明度值。

数字抠像处理中的基于SVM（Support Vector Machine）的透明度估计方法，在数字抠像处理中，在每个前景物体边缘的子区域中，标识出部分确定的前景和背景区域，使用SVM透明度估计方法得到各子区域内各像素的透明度值并合并，然后得到整个图像区域各像素的透明度值，步骤为：

1）载入图像；

2）把图像沿前景物体的边缘区域划分为K个有部分重叠区域的子区域，K为自然数，并在剩余的区域中标识确定的前景区域各像素点透明度为1，和确定的背景区域透明度为0；对子区域进行透明度估计处理，标识出子区域中确定的前景和背景像素点，应使这两类像素点的个数保持均衡；

3）对子区域中的其他未确定的像素点进行基于SVM的前景背景二元分类概率估计，得到属于前景区域的概率值p₁和属于背景区域的概率值p₀，p₁+p₀＝1，基于SVM的透明度估计方法将概率值p₁作为该像素点的透明度值α；

4）相邻子区域的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值的平均值，把处理好的每个子区域合并为一个完整的透明度图像。

所述的步骤2）中，把图像沿前景物体的边缘区域划分为k个有部分重叠区域的子区域Ω₁,Ω₂,...,Ω_k，划分完子区域后，指明剩余的区域里为确定的各像素点透明度为1的前景区域和透明度为0的背景区域；子区域Ω₁,Ω₂,...,Ω_k内的像素点进行透明度估计处理。

所述的步骤2）中，应使这两类像素点的个数保持均衡，对于二维图像来说，直观上表现为所标识的前景和背景区域面积大致相等；如果不能平衡，则应赋予它们不同的权重C₁和C₀，若确定前景像素点个数为N₁，确定背景像素点个数为N₀，则C₁:C₀＝N₀:N₁，N₀、N₁为自然数，以使它们在计算分类概率中的影响力能保持平衡。

所述的步骤2）中，子区域中确定的前景和背景像素点为像素点样本，表示为六维向量{R,G,B,R/G,G/B,B/R}，其中R,G,B为该像素点的RGB颜色分量值，其余3个分量为RGB颜色分量的比值；根据SVM分类过程，把已知向量标准化并训练出一个分类模型，然后把未确定像素点按照该模型进行分类。

所述的步骤4）中，把做完透明度估计的每个子区域合并为一个完整的透明度图像，相邻的两个子区域Ω_i和Ω_i+1的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值α_i和α_i+1的平均值，以使得相邻子区域之间的透明度值能够自然过渡。

假设像素点样本数目为l，其中前景样本点为p个，背景样本点为q个，l＝p+q，SVM抠像分类超平面方程为f(x)＝wx+b，w为超平面的法向量，x为像素点，b为一待求实数（在直线方程中，b是截距），对于前景样本点x_i，有f(x_i)＝wx_i+b≥1，对于背景样本点x_j，有f(x_j)＝wx_j+b≤-1，如果对前景样本和背景样本分别引入松弛变量ζi和ζ_j，于是抠像分类问题就是以下的优化问题：

\min (\frac{1}{2} {| | w | |}^{2} + G_{1} Σ_{i = 1}^{p} ζ_{i} + C_{0} Σ_{j = p + 1}^{p + q} ζ_{j}), ζ_{j} &GreaterEqual; 0

根据y_i[(wx_i)+b]≥1-ζ_i(i＝1,2,...,l)(l是样本数）（2）

其中||w||为支持向量到分类超平面的距离的倒数。一个SVM分类器越好，样本点集合中的支持向量距离分类超平面的距离就越大，也即||w||越小。在实现当中，前景和背景样本的ζ均取0.1，C₁:C₀＝N₀:N₁＝q:p；

利用这些样本点训练出一个分类模型f(x)＝wx+b以后，然后用这个分类模型给未知区域的点分类，并可以算出所有像素点属于前景区域的概率值p₁和属于背景区域的概率值p₀，其中p₁+p₀＝1；

p_{1} = P (y = 1 | x) = P_{A, B} = \frac{1}{1 + \exp (Af + B)} - - - (3)

其中参数A和B由以下最大似然估计而来

\min_{z = (A, B)} F (z) = - Σ_{i = 1}^{l} (t_{i} \log (p_{i}) + (1 - t_{t}) \log (1 - p_{i})) - - - (4)

其中p_i＝P_A,B(f_i)，若样本点x_i是前景点，则t_i＝(N₁+1)/(N₁+2)，否则t_i＝1/(N₀+2)。

本发明的有益效果是，可以在较短时间内在较少的人工交互条件下比较准确地实现抠像算法中的透明度估计，不需要对待处理图像的前景和物体颜色做假设，鲁棒性较强。本发明的抠像理论比较完善，最终得到的抠像结果十分准确。抠像技术在图像处理，计算机视觉和模式识别中应用广泛，在图像处理软件photoshop中也有专门的抠像功能，它是不少其他图像处理操作的基础。因此，准确的抠像结果对于平面设计和图像高级处理将发挥十分重要的作用。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1a是实施例1的原图；

图1b是实施例1的子区域1中的确定前景和确定背景标识图；

图1c是实施例1的子区域1的透明度估计结果图；

图1d是实施例1的子区域1的透明度估计结果和子区域2中的确定前景和确定背景标识图；

图1e是实施例1的子区域1和2的透明度估计结果图；

图1f是实施例1的完整的透明度估计结果图；

图2a是实施例2的原图；

图2b是实施例2的子区域1中的确定前景和确定背景标识图；

图2c是实施例2的子区域1的透明度估计结果图；

图2d是实施例2的子区域1的透明度估计个结果和子区域2的确定前景和确定背景标识图；

图2e是实施例2的子区域2和2的透明度估计结果图；

图2f是实施例2的完整的透明度估计结果图；

图3a是实施例3的原图；

图3b是实施例3的透明度估计结果图；

图3c是实施例4的原图；

图3d是实施例4的透明度估计结果图；

图3e是实施例5的原图；

图3f是实施例5的透明度估计结果图；

图3g是实施例6的原图；

图3h是实施例6的透明度估计结果图。

具体实施方式

本发明中，图像中像素点的RGB颜色I是由该点的前景颜色F和背景颜色B按照一定的透明度值α融合而成。从统计学的角度来看，像素点颜色I也可以看成前景颜色F和背景颜色B按照不同的概率p₁和p₀合成而来。我们可以从公式（1）得到如下的公式：

I＝p₁F+p₀B （5）

由于对任一像素点，该点归属只有两种选择：要么前景像素点，要么背景像素点，因此有p₁+p₀＝1。重新整理上述方程，有

I＝p₁F+(1-p₁)B （6）

我们将其称为抠像概率方程。对比方程（5）和（6）可以看出，透明度α可以理解为该点的前景概率值p₁，也即α＝p₁。于是抠像问题可以转化为估计图像中每一像素点属于前景的概率值p₁。对于确定的前景点，其p₁值为1，对于确定的背景点，其p₁值为0，而处于前景物体边缘的像素点，其p₁的取值范围为0≤p₁≤1，而基于SVM的分类方法可以提供一种与以往不同的概率抠像思路。

实施例1

在图1a-f所示的一个实施例中，如图1a所示，图像中前景和背景简单可分，背景颜色除了在不同区域亮度有些区别以外，色度比较单一，前景颜色也不复杂。在子区域的前景和背景颜色标识中，标识出确定的前景和背景区域，如图1b的左边和图1d的右边矩形圈内，然后得到每个子区域的透明度估计结果，如图1c和图1e所示。最终得到的透明度估计结果如图1f所示。

实施例2

在图2a-f所示的一个实施例中，如图2a所示，图像中前景和背景颜色较为复杂，且前景的边缘毛发较多。在该图像中一定范围的局部区域内，前景背景图像可以是简单可分的，把图像沿前景物体边缘划分为若干个简单可分的子区域。在每个子区域内，如图2b和图2d中的矩形圈内所示，标识出确定的前景和背景区域，透明度估计结果如图2c和图2e所示。最终得到的透明度估计结果如图2f所示。

实施例3-6

在图3a-h所示的4个实施例中，如图3a、图3c、图3e和图3g所示，前景边缘的毛发均较多，但如图3b、图3d、图3f和图3h所示，本算法均能得到较好的透明度估计结果。

Claims

1.一种数字抠像处理中的基于SVM的透明度估计方法，其特征是，在数字抠像处理中，在每个前景物体边缘的子区域中，标识出部分确定的前景和背景区域，使用SVM透明度估计方法得到各子区域内各像素的透明度值并合并，然后得到整个图像区域各像素的透明度值，步骤为：

1)载入图像；

2)把图像沿前景物体的边缘区域划分为k个有部分重叠区域的子区域Ω₁,Ω₂,...,Ω_k，划分完子区域后，指明剩余的区域里为确定的各像素点透明度为1的前景区域和透明度为0的背景区域；子区域Ω₁,Ω₂,...,Ω_k内的像素点进行透明度估计处理，标识出子区域中确定的前景和背景像素点，应使这两类像素点的个数保持均衡；

3)对子区域中的其他未确定的像素点进行基于SVM的前景背景二元分类概率估计，得到属于前景区域的概率值p₁和属于背景区域的概率值p₀，p₁+p₀＝1，基于SVM的透明度估计方法将概率值p₁作为该像素点的透明度值α；

4)把做完透明度估计的每个子区域合并为一个完整的透明度图像，相邻的两个子区域Ω_i和Ω_i+1的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值α_i和α_i+1的平均值，以使得相邻子区域之间的透明度值能够自然过渡；

所述的步骤2)中，应使这两类像素点的个数保持均衡，对于二维图像来说，直观上表现为所标识的前景和背景区域面积大致相等；如果不能平衡，则应赋予它们不同的权重C₁和C₀，若确定前景像素点个数为N₁，确定背景像素点个数为N₀，则C₁:C₀＝N₀:N₁，N₀、N₁为自然数，以使它们在计算分类概率中的影响力能保持平衡；

所述的步骤2)中，子区域中确定的前景和背景像素点为像素点样本，表示为六维向量{R,G,B,R/G,G/B,B/R}，其中R,G,B为该像素点的RGB颜色分量值，其余3个分量为RGB颜色分量的比值；根据SVM分类过程，把已知向量标准化并训练出一个分类模型，然后把未确定像素点按照该模型进行分类。