CN103714540B - 数字抠像处理中的基于svm的透明度估计方法 - Google Patents

数字抠像处理中的基于svm的透明度估计方法 Download PDF

Info

Publication number
CN103714540B
CN103714540B CN201310714556.2A CN201310714556A CN103714540B CN 103714540 B CN103714540 B CN 103714540B CN 201310714556 A CN201310714556 A CN 201310714556A CN 103714540 B CN103714540 B CN 103714540B
Authority
CN
China
Prior art keywords
pixel
foreground
background
transparency
subregion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310714556.2A
Other languages
English (en)
Other versions
CN103714540A (zh
Inventor
林生佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Media and Communications
Original Assignee
Zhejiang University of Media and Communications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Media and Communications filed Critical Zhejiang University of Media and Communications
Priority to CN201310714556.2A priority Critical patent/CN103714540B/zh
Publication of CN103714540A publication Critical patent/CN103714540A/zh
Application granted granted Critical
Publication of CN103714540B publication Critical patent/CN103714540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种数字抠像处理中的基于SVM的透明度估计方法。1)把图像前景物体的边缘手工分割成几个有少量重叠区域的子区域,剩余部分为确定的前景和背景区域并指明;2)在分割出的图像子区域中标识出部分确定的前景和背景像素点;3)对图像子区域中的其他像素点进行基于SVM的前景背景分类概率估计,得到所有像素点属于前景区域的概率值和属于背景区域的概率值,其中,则每个像素点的概率值就是该像素点的透明度值;4)合并每个子区域以及确定的前景和背景区域,即可得到整张图像的透明度值。本发明具有速度快,自动化程度较高的特点,具有很好的实用价值。

Description

数字抠像处理中的基于SVM的透明度估计方法
技术领域
本发明涉及一种数字抠像处理中基于SVM的透明度估计方法。
背景技术
抠像就是把一张图像中的前景和背景分隔开来的技术。抠像问题可以定义为:对给定图像上任一点c,求c点的颜色I所含的前景色F和alpha值α。抠像方程如下所示:
I=αF+(1-α)B (1)
抠像问题的困难在于对图像上的任一点I,它的F和α的解并不是唯一的,我们要从无数对的解中找出最合理的解。
抠像一般可以分为两个主要步骤:
1)区域划分。一般情况下以手工划分为主。由于具体图像的情况复杂多变,图像中前景和背景区域的颜色在颜色空间中的分布如果重合,那么称该图像前景背景非简单可分,否则简单可分。非简单可分的图像,其前景背景区域的划分靠现有技术自动实现几乎是不可能的。由于区域划分的精确程度对抠图效果有很大的影响,因此在做抠像处理的区域划分时,一定量的人工交互是必不可少的。
2)透明度估计。目前,抠像技术可以分成三大类:第一类是基于采样的抠像技术。这类技术在得到三分图后,通过采集待处理区域中的像素点p的周边确定的前景点和背景点,估算出p点的前景颜色F和背景颜色B,然后利用抠像方程估算出透明度值α。比如Knockout方法、Hillman方法、Mishima方法和Bayesian方法等。此类抠像技术首先需要通过采集合适的前景点和背景点来估算F和B,然后利用F和B来估算α。如果图像颜色变化比较剧烈,F和B往往出现估算不连续的情况,这样直接导致抠像结果很差。第二类是基于相似性假设的抠像技术。它假设待处理图像在小范围内前景和背景颜色平滑,通过对列出的未知像素点误差方程求最小值,可以求得最优的α。比如泊松抠像的最优方程但对于图像颜色变化剧烈,前景背景复杂的情况,该假设就不成立,其抠像效果也较差。比如泊松抠像、随机行走方法和测地线方法等;第三类是采样与相似性结合的抠像技术。此类方法需要计算每个待处理像素点的数据能量Ed以及待处理像素点之间的相似能量Es,并通过最小化两者的和来求得所有待处理像素的α值,如鲁棒抠像、快捷抠像等,但理论上Ed强调单个像素自己的特性,而Es则强调相邻像素点之间的平滑性,他们分别在不同条件下取得最优值,所以该类抠像方法一般需要根据不同图像给Ed和Es不同的权值才能比较有效地计算出α值。
在上述三类抠像算法中,基于采样的抠像技术需要先估计像素点的前景色F和背景色B,然后再利用F和B估计α,其结果需要图像的前景物体边缘区域颜色变化平滑,其优点是算法简单,处理速度快。基于相似性假设的抠像技术需假定图像在小范围内前景和背景颜色比较平滑,这在复杂背景和前景的情况下效果较差。第三类采样与相似性结合的抠像技术,该技术从理论上看也存在较大的弊端,由于数据能量Ed和相似能量Es分别在不同条件下取得最小值,当求其总和最小时,不可避免地需要人工交互,一定程度上影响了算法的鲁棒性。
发明内容
透明度估计是抠像处理中的重要一环,我们需要减少对图像中前景和背景颜色做出过多的假设,并寻求在理论上构建更完美的抠像模型,减少出现错误的可能,以增强抠像算法的鲁棒性。本发明提供了一种数字抠像处理中的基于SVM的透明度估计方法,该方法在所处理的图像子区域内不需要对颜色做过多假设,可以在较短的时间内,通过计算每个未知像素点属于前景和背景的概率p1和p0,而α=p1,从而得到较为准确的像素点透明度值。
数字抠像处理中的基于SVM(Support Vector Machine)的透明度估计方法,在数字抠像处理中,在每个前景物体边缘的子区域中,标识出部分确定的前景和背景区域,使用SVM透明度估计方法得到各子区域内各像素的透明度值并合并,然后得到整个图像区域各像素的透明度值,步骤为:
1)载入图像;
2)把图像沿前景物体的边缘区域划分为K个有部分重叠区域的子区域,K为自然数,并在剩余的区域中标识确定的前景区域各像素点透明度为1,和确定的背景区域透明度为0;对子区域进行透明度估计处理,标识出子区域中确定的前景和背景像素点,应使这两类像素点的个数保持均衡;
3)对子区域中的其他未确定的像素点进行基于SVM的前景背景二元分类概率估计,得到属于前景区域的概率值p1和属于背景区域的概率值p0,p1+p0=1,基于SVM的透明度估计方法将概率值p1作为该像素点的透明度值α;
4)相邻子区域的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值的平均值,把处理好的每个子区域合并为一个完整的透明度图像。
所述的步骤2)中,把图像沿前景物体的边缘区域划分为k个有部分重叠区域的子区域Ω12,...,Ωk,划分完子区域后,指明剩余的区域里为确定的各像素点透明度为1的前景区域和透明度为0的背景区域;子区域Ω12,...,Ωk内的像素点进行透明度估计处理。
所述的步骤2)中,应使这两类像素点的个数保持均衡,对于二维图像来说,直观上表现为所标识的前景和背景区域面积大致相等;如果不能平衡,则应赋予它们不同的权重C1和C0,若确定前景像素点个数为N1,确定背景像素点个数为N0,则C1:C0=N0:N1,N0、N1为自然数,以使它们在计算分类概率中的影响力能保持平衡。
所述的步骤2)中,子区域中确定的前景和背景像素点为像素点样本,表示为六维向量{R,G,B,R/G,G/B,B/R},其中R,G,B为该像素点的RGB颜色分量值,其余3个分量为RGB颜色分量的比值;根据SVM分类过程,把已知向量标准化并训练出一个分类模型,然后把未确定像素点按照该模型进行分类。
所述的步骤4)中,把做完透明度估计的每个子区域合并为一个完整的透明度图像,相邻的两个子区域Ωi和Ωi+1的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值αi和αi+1的平均值,以使得相邻子区域之间的透明度值能够自然过渡。
假设像素点样本数目为l,其中前景样本点为p个,背景样本点为q个,l=p+q,SVM抠像分类超平面方程为f(x)=wx+b,w为超平面的法向量,x为像素点,b为一待求实数(在直线方程中,b是截距),对于前景样本点xi,有f(xi)=wxi+b≥1,对于背景样本点xj,有f(xj)=wxj+b≤-1,如果对前景样本和背景样本分别引入松弛变量ζi和ζj,于是抠像分类问题就是以下的优化问题:
min ( 1 2 | | w | | 2 + G 1 Σ i = 1 p ζ i + C 0 Σ j = p + 1 p + q ζ j ) , ζ j ≥ 0
根据yi[(wxi)+b]≥1-ζi(i=1,2,...,l)(l是样本数) (2)
其中||w||为支持向量到分类超平面的距离的倒数。一个SVM分类器越好,样本点集合中的支持向量距离分类超平面的距离就越大,也即||w||越小。在实现当中,前景和背景样本的ζ均取0.1,C1:C0=N0:N1=q:p;
利用这些样本点训练出一个分类模型f(x)=wx+b以后,然后用这个分类模型给未知区域的点分类,并可以算出所有像素点属于前景区域的概率值p1和属于背景区域的概率值p0,其中p1+p0=1;
给定样本x与其抠像分类结果y,如果y被划分为前景,则y取值为1,如果y被划分为背景,则y取值为0;定义两个概率p0=P(y=0|x),p1=P(y=1|x),对于抠像问题,p0+p1=1,要计算每一像素点x的α就是估计该样本点x属于前景的概率p1的值;有u01=P(y=0|y=0or1,x)=P(y=0|x)/P(y=0or1,x)=P(y=0|x)=p0,u10=P(y=1|y=0or1,x)=P(y=1|x)/P(y=0or1|x)=P(y=1|x)=p1;根据Platt方法,用神经元非线性作用函数来计算p1的值,
p 1 = P ( y = 1 | x ) = P A , B = 1 1 + exp ( Af + B ) - - - ( 3 )
其中参数A和B由以下最大似然估计而来
min z = ( A , B ) F ( z ) = - Σ i = 1 l ( t i log ( p i ) + ( 1 - t t ) log ( 1 - p i ) ) - - - ( 4 )
其中pi=PA,B(fi),若样本点xi是前景点,则ti=(N1+1)/(N1+2),否则ti=1/(N0+2)。
本发明的有益效果是,可以在较短时间内在较少的人工交互条件下比较准确地实现抠像算法中的透明度估计,不需要对待处理图像的前景和物体颜色做假设,鲁棒性较强。本发明的抠像理论比较完善,最终得到的抠像结果十分准确。抠像技术在图像处理,计算机视觉和模式识别中应用广泛,在图像处理软件photoshop中也有专门的抠像功能,它是不少其他图像处理操作的基础。因此,准确的抠像结果对于平面设计和图像高级处理将发挥十分重要的作用。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1a是实施例1的原图;
图1b是实施例1的子区域1中的确定前景和确定背景标识图;
图1c是实施例1的子区域1的透明度估计结果图;
图1d是实施例1的子区域1的透明度估计结果和子区域2中的确定前景和确定背景标识图;
图1e是实施例1的子区域1和2的透明度估计结果图;
图1f是实施例1的完整的透明度估计结果图;
图2a是实施例2的原图;
图2b是实施例2的子区域1中的确定前景和确定背景标识图;
图2c是实施例2的子区域1的透明度估计结果图;
图2d是实施例2的子区域1的透明度估计个结果和子区域2的确定前景和确定背景标识图;
图2e是实施例2的子区域2和2的透明度估计结果图;
图2f是实施例2的完整的透明度估计结果图;
图3a是实施例3的原图;
图3b是实施例3的透明度估计结果图;
图3c是实施例4的原图;
图3d是实施例4的透明度估计结果图;
图3e是实施例5的原图;
图3f是实施例5的透明度估计结果图;
图3g是实施例6的原图;
图3h是实施例6的透明度估计结果图。
具体实施方式
本发明中,图像中像素点的RGB颜色I是由该点的前景颜色F和背景颜色B按照一定的透明度值α融合而成。从统计学的角度来看,像素点颜色I也可以看成前景颜色F和背景颜色B按照不同的概率p1和p0合成而来。我们可以从公式(1)得到如下的公式:
I=p1F+p0B (5)
由于对任一像素点,该点归属只有两种选择:要么前景像素点,要么背景像素点,因此有p1+p0=1。重新整理上述方程,有
I=p1F+(1-p1)B (6)
我们将其称为抠像概率方程。对比方程(5)和(6)可以看出,透明度α可以理解为该点的前景概率值p1,也即α=p1。于是抠像问题可以转化为估计图像中每一像素点属于前景的概率值p1。对于确定的前景点,其p1值为1,对于确定的背景点,其p1值为0,而处于前景物体边缘的像素点,其p1的取值范围为0≤p1≤1,而基于SVM的分类方法可以提供一种与以往不同的概率抠像思路。
实施例1
在图1a-f所示的一个实施例中,如图1a所示,图像中前景和背景简单可分,背景颜色除了在不同区域亮度有些区别以外,色度比较单一,前景颜色也不复杂。在子区域的前景和背景颜色标识中,标识出确定的前景和背景区域,如图1b的左边和图1d的右边矩形圈内,然后得到每个子区域的透明度估计结果,如图1c和图1e所示。最终得到的透明度估计结果如图1f所示。
实施例2
在图2a-f所示的一个实施例中,如图2a所示,图像中前景和背景颜色较为复杂,且前景的边缘毛发较多。在该图像中一定范围的局部区域内,前景背景图像可以是简单可分的,把图像沿前景物体边缘划分为若干个简单可分的子区域。在每个子区域内,如图2b和图2d中的矩形圈内所示,标识出确定的前景和背景区域,透明度估计结果如图2c和图2e所示。最终得到的透明度估计结果如图2f所示。
实施例3-6
在图3a-h所示的4个实施例中,如图3a、图3c、图3e和图3g所示,前景边缘的毛发均较多,但如图3b、图3d、图3f和图3h所示,本算法均能得到较好的透明度估计结果。

Claims (1)

1.一种数字抠像处理中的基于SVM的透明度估计方法,其特征是,在数字抠像处理中,在每个前景物体边缘的子区域中,标识出部分确定的前景和背景区域,使用SVM透明度估计方法得到各子区域内各像素的透明度值并合并,然后得到整个图像区域各像素的透明度值,步骤为:
1)载入图像;
2)把图像沿前景物体的边缘区域划分为k个有部分重叠区域的子区域Ω12,...,Ωk,划分完子区域后,指明剩余的区域里为确定的各像素点透明度为1的前景区域和透明度为0的背景区域;子区域Ω12,...,Ωk内的像素点进行透明度估计处理,标识出子区域中确定的前景和背景像素点,应使这两类像素点的个数保持均衡;
3)对子区域中的其他未确定的像素点进行基于SVM的前景背景二元分类概率估计,得到属于前景区域的概率值p1和属于背景区域的概率值p0,p1+p0=1,基于SVM的透明度估计方法将概率值p1作为该像素点的透明度值α;
4)把做完透明度估计的每个子区域合并为一个完整的透明度图像,相邻的两个子区域Ωi和Ωi+1的重叠区域内像素点的透明度值α为在两个子区域内分别估计出来的透明度值αi和αi+1的平均值,以使得相邻子区域之间的透明度值能够自然过渡;
所述的步骤2)中,应使这两类像素点的个数保持均衡,对于二维图像来说,直观上表现为所标识的前景和背景区域面积大致相等;如果不能平衡,则应赋予它们不同的权重C1和C0,若确定前景像素点个数为N1,确定背景像素点个数为N0,则C1:C0=N0:N1,N0、N1为自然数,以使它们在计算分类概率中的影响力能保持平衡;
所述的步骤2)中,子区域中确定的前景和背景像素点为像素点样本,表示为六维向量{R,G,B,R/G,G/B,B/R},其中R,G,B为该像素点的RGB颜色分量值,其余3个分量为RGB颜色分量的比值;根据SVM分类过程,把已知向量标准化并训练出一个分类模型,然后把未确定像素点按照该模型进行分类。
CN201310714556.2A 2013-12-21 2013-12-21 数字抠像处理中的基于svm的透明度估计方法 Active CN103714540B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310714556.2A CN103714540B (zh) 2013-12-21 2013-12-21 数字抠像处理中的基于svm的透明度估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310714556.2A CN103714540B (zh) 2013-12-21 2013-12-21 数字抠像处理中的基于svm的透明度估计方法

Publications (2)

Publication Number Publication Date
CN103714540A CN103714540A (zh) 2014-04-09
CN103714540B true CN103714540B (zh) 2017-01-11

Family

ID=50407483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310714556.2A Active CN103714540B (zh) 2013-12-21 2013-12-21 数字抠像处理中的基于svm的透明度估计方法

Country Status (1)

Country Link
CN (1) CN103714540B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876804B (zh) * 2017-10-12 2021-07-09 北京旷视科技有限公司 抠像模型训练和图像抠像方法、装置和系统及存储介质
CN108305256B (zh) * 2017-11-28 2019-11-15 腾讯科技(深圳)有限公司 视频抠像处理方法、处理装置及计算机可读存储介质
CN110148102B (zh) * 2018-02-12 2022-07-15 腾讯科技(深圳)有限公司 图像合成方法、广告素材合成方法及装置
CN108961303B (zh) * 2018-07-23 2021-05-07 北京旷视科技有限公司 一种图像处理方法、装置、电子设备和计算机可读介质
CN109192054B (zh) * 2018-07-27 2020-04-28 阿里巴巴集团控股有限公司 一种地图区域合并的数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020971A (zh) * 2012-12-28 2013-04-03 青岛爱维互动信息技术有限公司 从图像中自动分割目标对象的方法
CN103177446A (zh) * 2013-03-13 2013-06-26 北京航空航天大学 基于邻域和非邻域平滑先验的图像前景精准提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020971A (zh) * 2012-12-28 2013-04-03 青岛爱维互动信息技术有限公司 从图像中自动分割目标对象的方法
CN103177446A (zh) * 2013-03-13 2013-06-26 北京航空航天大学 基于邻域和非邻域平滑先验的图像前景精准提取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Image matting based on local color discrimination by SVM;Tadaaki Hosaka et al.;《Pattern Recognition Letters》;20090704;第1254-1255页,第1258页 *
基于MRF的复杂图像抠图;林生佑 等;《中国图象图形学报》;20080331;第13卷(第3期);第499页,第503页 *
基于SVM的遥感图像半自动提取方法研究;周君 等;《计算机应用与软件》;20100331;第27卷(第3期);全文 *

Also Published As

Publication number Publication date
CN103714540A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
CN103714540B (zh) 数字抠像处理中的基于svm的透明度估计方法
CN104966085B (zh) 一种基于多显著特征融合的遥感图像感兴趣区域检测方法
CN106056155B (zh) 基于边界信息融合的超像素分割方法
CN107862698A (zh) 基于k均值聚类的光场前景分割方法及装置
CN104123529B (zh) 人手检测方法及系统
CN104156693B (zh) 一种基于多模态序列融合的动作识别方法
CN107220949A (zh) 公路监控视频中运动车辆阴影的自适应消除方法
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN106991686B (zh) 一种基于超像素光流场的水平集轮廓跟踪方法
CN103186904A (zh) 图片轮廓提取方法及装置
CN109285162A (zh) 一种基于局部区域条件随机场模型的图像语义分割方法
CN103839279A (zh) 一种目标检测中基于vibe的粘连目标分割方法
CN103955945B (zh) 基于双目视差和活动轮廓的自适应彩色图像分割方法
CN103942794A (zh) 一种基于置信度的图像协同抠图方法
CN104680546A (zh) 一种图像显著目标检测方法
CN102915544A (zh) 基于纹理检测和颜色分割的视频图像运动目标提取方法
CN104573742A (zh) 医学图像分类方法和系统
CN106548478B (zh) 基于局部拟合图像的活动轮廓图像分割方法
CN107330365A (zh) 基于最大稳定极值区域和svm的交通标志识别方法
CN104966047A (zh) 一种车牌识别的方法及装置
CN107886066A (zh) 一种基于改进hog‑sslbp的行人检测方法
CN106529548A (zh) 亚像素级的多尺度Harris角点检测算法
CN102930292A (zh) 一种基于p-SIFT特征的物体识别方法
Silva et al. Online weighted one-class ensemble for feature selection in background/foreground separation
CN103236056B (zh) 基于模板匹配的图像分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant