CN104036517B - 一种基于梯度采样的图像抠图方法 - Google Patents
一种基于梯度采样的图像抠图方法 Download PDFInfo
- Publication number
- CN104036517B CN104036517B CN201410308833.4A CN201410308833A CN104036517B CN 104036517 B CN104036517 B CN 104036517B CN 201410308833 A CN201410308833 A CN 201410308833A CN 104036517 B CN104036517 B CN 104036517B
- Authority
- CN
- China
- Prior art keywords
- image
- point
- gradient
- prospect
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明公开了一种基于梯度采样的图像抠图方法,包括如下步骤:步骤一、获取图像和对应的三元图;步骤二、根据图像的颜色分布对三元图进行扩展,进一步缩小未知区域;步骤三、计算图像梯度,根据图像梯度对图像进行采样,对未知区域每一个点得到一组前景、背景候选点集合;步骤四、从候选点集合中选择出一对前景、背景点,计算出一个四元组;步骤五、进一步优化采样得到的前景、背景点,计算出一个新的四元组;步骤六、对步骤五计算出的新的四元组进行平滑,从而最终得到图。与现有技术相比,本发明的积极效果是:可以快速高质量的抠取指定区域整个目标,可以用于任何图像采集设备,尤其适合手机拍照应用。
Description
技术领域
本发明涉及一种基于梯度采样的图像抠图方法。
背景技术
在计算机视觉领域中,图像抠图被广泛应用在图像编辑和视频编辑领域,包括背景替换,目标抽取等。随着手机等智能设备的普及,获取高质量图像变得越来越容易,很多照片处理软件都提供了图像编辑功能,图像抠图技术在智能设备上的应用也越来越迫切。抠图基于这样一个假设:图像当前像素点I与对应的前景f和背景b呈线性关系:I=α·f+(1-α)·b,I为图像像素点,f,b,α均未知。通过一系列技术可以求取这三个未知量,其中得到的每个像素对应的α值构成一幅alpha图,它直接反映出抠图结果。
发明内容
为了克服现有技术的上述缺点,本发明提供了一种基于梯度采样的图像抠图方法。
本发明解决其技术问题所采用的技术方案是:一种基于梯度采样的图像抠图方法,包括如下步骤:
步骤一、获取图像和对应的三元图;
步骤二、根据图像的颜色分布对三元图进行扩展,进一步缩小未知区域;
步骤三、计算图像梯度,根据图像梯度对图像进行采样,对未知区域每一个点得到一组前景、背景候选点集合;
步骤四、从候选点集合中选择出一对前景、背景点,计算出一个四元组;
步骤五、进一步优化采样得到的前景、背景点,计算出一个新的四元组;
步骤六、对步骤五计算出的新的四元组进行平滑,从而最终得到α图。
与现有技术相比,本发明的积极效果是:可以快速高质量地抠取指定区域整个目标,可以用于任何图像采集设备,尤其适合手机拍照应用。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明方法的流程图。
具体实施方式
一种基于梯度采样的图像抠图方法,包括如下步骤:
步骤一、获取图像和对应的三元图(Trimap):
三元图包含前景、背景、未知区域点的集合,未知区域即为待抠区域,它可以根据相应的前景、背景计算得出。
读取图像I,I为R,G,B三通道彩色图像及对应的三元图,其中三元图被标记为前景fi=0...F、背景bi=0...B、未知区域(即待抠区域)ui=0...U,其中F+B+U=H*W,H为图像高度,W为图像宽度。
步骤二、根据图像的颜色分布对三元图进行扩展,进一步缩小待抠区域:
依据一定规则扩展图像未知区域ui=0...U,具体方法为:
对三元图中未知区域每一个点ui,计算以其所在位置(x,y)为中心,半径为r(5<=r<=15,本文取10)的邻域Ωi内像素I(x',y')与点ui所处位置(x,y)像素I(x,y)颜色之间的距离,如果小于给定阈值(例如取该阈值为2),并且该像素点属于前景f(或背景b)。则将该像素点u扩展为前景f(或背景b)。经过此扩展操作,三元图进一步变为背景fi=0...F'、背景bi=0...B'、未知区域ui=0...U'。
颜色距离计算公式为:
步骤三、计算图像梯度,根据图像梯度对图像进行采样,对未知区域每一个点得到一组前景、背景候选点集合:
1、对每张图像Ii=0...H*W(R,G,B)按照下式提取出亮度通道:
L=0.299*R+0.587*G+0.114*B (2)
2、根据亮度图像计算出图像的梯度:
Gx(x,y)=L(x+1,y)-L(x,y) (3)
Gy(x,y)=L(x,y+1)-L(x,y) (4)
3、对未知区域内每一个像素ui按照其梯度方向和切线方向采样,一共四个方向,每个方向至少各采样一个前景点一个背景点,这样可以采样最多16个点作为前景、背景样本点集
四个采样方向分别为:
θ1=a tan 2(Gy(x,y),Gx(x,y)) (5)
θ2,θ3,θ4可以通过θ1来确定。一旦采样方向确定则可以按照以下规则进行采样,其中采样步长为:
stepSize=min(1/sin(θi),1/cos(θi)) (6)
坐标更新方法为:
y'=y+stepSize*sin(θi) (7)
x'=x+stepSize*cos(θi) (8)
步骤四、从候选点集合中选择出一对前景、背景点,计算出一个四元组:
对未知区域每一个点ui,从上一步中采样的前景、背景样本点集中选择最优的一对前景、背景点fi、bi,具体方法如下:
选择使得如下度量关系gi,j最小的一对
式(9)中各式的计算方法如下:
式中M表示采样的前景、背景点与当前像素的颜色扭曲程度,N则表示在其一定范围邻域内总共的扭曲程度。好的采样点,应该具备最小颜色扭曲。
在前面计算了颜色扭曲对采样点质量的影响,但仅仅考虑颜色信息是不够的,还必须将像素点的空间位置信息结合起来。式中E表示将图像梯度沿着当前点到采样点的线积分,如果积分路径上跨过边缘,则会得到较大的值,否则得到较小的值。通常采样的背景点大于前景点,PFi用于计算当前像素属于前景点的概率。是通过值校正PFi过后的度量当前像素点属于前景点的概率。
为未知点与前景点、背景点的颜色距离,可由(1)式计算得出,此二者加入式(9)中是因为好的采样点必须满足与当前点的空间距离应该很小。除了从候选采样点集中选出合适的fi,bi,还需要进一步计算未知点的局部方差σf 2,σb 2:
这样,对每一个未知点,可以得到一个四元组
步骤五、进一步优化采样得到的前景、背景点,计算出一个新的四元组:
从候选采样点中选择出合适的之后,还需要进一步对选出的优化,具体优化过程如下所述:
对每一个未知点,以该点为中心,选出其5×5邻域未知点中k(1<=k<=5本文取3)个具有最小Mi(fj,bj)值的四元组求出其平均值并且按照以下式子计算出新的四元组:其中置信值表示计算出的属于当前像素的信念。越大,表示计算得越准确,最终抠图效果越好。
步骤六、对步骤五计算出的新的四元组进行平滑:
计算出新的四元组(fi,bi,αi,confidencei)之后,还需要对四元组进行平滑,平滑的计算过程如下:
式(23)中G为高斯函数,其余计算均为简单的加权平均。
这里对计算出每个像素点的置信值进行光滑滤波。
式中:Tu表示待抠图区域,
从而最终得到alpha图。
通常,在完成本步骤的计算之后,就可以得到很好的抠图效果。但是对于纹理特别复杂的时候,会显得很有毛刺感,针对求得的α图,可以重新将其表达为一个优化问题,但会带来较大的时间开销,故本发明增加一个步骤,使用快速算法近似计算最优α值:
选择使用一种滤波的方式去近似求解该优化问题,使用导向滤波(guide filter)对图像进行滤波,得到最优α图的近似解。
Claims (3)
1.一种基于梯度采样的图像抠图方法,其特征在于:包括如下步骤:
步骤一、获取图像和对应的三元图,所述三元图被标记为前景fi=0...F、背景bi=0...B、未知区域ui=0...U,其中F+B+U=H*W,H为图像高度,W为图像宽度;
步骤二、根据图像的颜色分布对三元图进行扩展,进一步缩小未知区域;
步骤三、计算图像梯度,根据图像梯度对图像进行采样,对未知区域每一个点得到一组前景、背景候选点集合:
(1)对每张图像Ii=0...H*W(R,G,B)按照下式提取出亮度通道:
L=0.299*R+0.587*G+0.114*B
(2)根据亮度图像计算出图像的梯度:
Gx(x,y)=L(x+1,y)-L(x,y)
Gy(x,y)=L(x,y+1)-L(x,y)
(3)对未知区域内每一个像素ui按照其梯度方向和切线方向采样,一共四个方向,每个方向至少各采样一个前景点一个背景点,采样最多16个点作为前景、背景样本点集
步骤四、从候选点集合中选择出一对前景、背景点,计算出一个四元组:
首先,对未知区域每一个点ui,从上一步中采样的前景、背景样本点集 中选择最优的一对前景、背景点fi、bi,满足其中:gi,j为度量关系:
其中:
(1)
式中M表示采样的前景、背景点与当前像素的颜色扭曲程度,N则表示在其一定范围邻域内总共的扭曲程度;
(2)是通过值校正PFi过后的度量当前像素点属于前景点的概率:
E表示将图像梯度沿着当前点到采样点的线积分;
(3)分别表示未知点与前景点、背景点的颜色距离;
从候选采样点集中选出fi,bi后,再进一步计算未知点的局部方差σf 2,σb 2:
从而得到一个四元组
步骤五、进一步优化采样得到的前景、背景点,计算出一个新的四元组:
对每一个未知点,以该点为中心,选出其5×5邻域未知点中k个具有最小Mi(fj,bj)值的四元组求出其平均值其中:1≤k≤5;并且按照以下式子计算出新的四元组:其中:
置信值表示计算出的属于当前像素的信念;
步骤六、对步骤五计算出的新的四元组进行平滑,从而最终得到alpha图。
2.根据权利要求1所述的一种基于梯度采样的图像抠图方法,其特征在于:在步骤六得到alpha图后,使用导向滤波对图像进行滤波,得到最优alpha图的近似解。
3.根据权利要求1所述的一种基于梯度采样的图像抠图方法,其特征在于:步骤二所述根据图像的颜色分布对三元图进行扩展,进一步缩小未知区域的方法为:对三元图中未知区域每一个点,计算以其所在位置为中心,半径为r的邻域内像素与该点所处位置像素颜色之间的距离,如果距离小于给定阈值,并且该像素点属于前景或背景,则将该像素点扩展为前景或背景。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308833.4A CN104036517B (zh) | 2014-07-01 | 2014-07-01 | 一种基于梯度采样的图像抠图方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410308833.4A CN104036517B (zh) | 2014-07-01 | 2014-07-01 | 一种基于梯度采样的图像抠图方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104036517A CN104036517A (zh) | 2014-09-10 |
CN104036517B true CN104036517B (zh) | 2017-02-15 |
Family
ID=51467276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410308833.4A Active CN104036517B (zh) | 2014-07-01 | 2014-07-01 | 一种基于梯度采样的图像抠图方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104036517B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106952276A (zh) * | 2017-03-20 | 2017-07-14 | 成都通甲优博科技有限责任公司 | 一种图像抠图方法及装置 |
CN107452010B (zh) * | 2017-07-31 | 2021-01-05 | 中国科学院长春光学精密机械与物理研究所 | 一种自动抠图算法和装置 |
CN107516319B (zh) * | 2017-09-05 | 2020-03-10 | 中北大学 | 一种高精度简易交互式抠图方法、存储设备及终端 |
CN109697722B (zh) * | 2017-10-23 | 2021-10-15 | 北京京东尚科信息技术有限公司 | 用于生成三分图的方法及装置 |
CN109685822A (zh) * | 2019-01-11 | 2019-04-26 | 恒信东方文化股份有限公司 | 一种自动抠图方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4756436B2 (ja) * | 2001-07-03 | 2011-08-24 | 日本電気株式会社 | パターン認識装置とそのパターン認識方法、及びパターン認識プログラム |
CN102592268A (zh) * | 2012-01-06 | 2012-07-18 | 清华大学深圳研究生院 | 一种分割前景图像的方法 |
-
2014
- 2014-07-01 CN CN201410308833.4A patent/CN104036517B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4756436B2 (ja) * | 2001-07-03 | 2011-08-24 | 日本電気株式会社 | パターン認識装置とそのパターン認識方法、及びパターン認識プログラム |
CN102592268A (zh) * | 2012-01-06 | 2012-07-18 | 清华大学深圳研究生院 | 一种分割前景图像的方法 |
Non-Patent Citations (1)
Title |
---|
"一种改进的基于MRF的树木图像提取方法";王晓松等;《北京林业大学学报》;20120930;第34卷(第5期);论文第131页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104036517A (zh) | 2014-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287846B (zh) | 一种基于注意力机制的人脸关键点检测方法 | |
CN104036517B (zh) | 一种基于梯度采样的图像抠图方法 | |
CN109299274B (zh) | 一种基于全卷积神经网络的自然场景文本检测方法 | |
CN103985108B (zh) | 一种利用边界检测和多尺度形态学清晰度度量的多聚焦图像融合方法 | |
CN111583097A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN103440662B (zh) | Kinect深度图像获取方法与装置 | |
CN108154149B (zh) | 基于深度学习网络共享的车牌识别方法 | |
CN107862698A (zh) | 基于k均值聚类的光场前景分割方法及装置 | |
CN106203342A (zh) | 基于多角度局部特征匹配的目标识别方法 | |
CN104036479A (zh) | 一种基于非负矩阵分解的多聚焦图像融合方法 | |
CN104504745B (zh) | 一种基于图像分割和抠图的证件照生成方法 | |
CN102682428B (zh) | 一种基于方向场的指纹图像计算机自动化修补方法 | |
CN103337053B (zh) | 一种基于开关非局部全变分的椒盐噪声污染图像滤波方法 | |
CN107680053A (zh) | 一种基于深度学习分类的模糊核优化迭代初始值估计方法 | |
CN106934455B (zh) | 基于cnn的遥感影像光学适配结构选取方法及系统 | |
CN102254325B (zh) | 一种运动模糊场景的分割及前景提取方法和系统 | |
CN105913407A (zh) | 一种基于差值图对多聚焦度图像融合优化的方法 | |
CN103955949A (zh) | 基于Mean-shift算法的运动目标检测方法 | |
CN103886553A (zh) | 图像非局部均值去噪方法和系统 | |
CN103955888A (zh) | 一种基于sift的高清视频图像拼接方法及装置 | |
CN104966274B (zh) | 一种采用图像检测与区域提取的局部模糊复原方法 | |
CN109784297A (zh) | 一种基于深度学习的三维目标识别与最优抓取方法 | |
CN112446356A (zh) | 基于多重极坐标的自然场景下任意形状文本的检测方法 | |
CN107133964A (zh) | 一种基于Kinect的抠像方法 | |
CN108764230A (zh) | 一种基于卷积神经网络的银行卡号自动识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: 610041 China (Sichuan) free trade test zone, Chengdu high tech Zone, middle section of Tianfu Avenue, 13 floor, 1 Patentee after: Chengdu PinGuo Digital Entertainment Ltd. Address before: 610041 C12-16 software building, Tianfu Software Park, hi tech Zone, Sichuan, Chengdu Patentee before: Chengdu PinGuo Digital Entertainment Ltd. |