CN102622754A - 一种基于用户交互Trimap的快速前景提取方法 - Google Patents
一种基于用户交互Trimap的快速前景提取方法 Download PDFInfo
- Publication number
- CN102622754A CN102622754A CN2012100485997A CN201210048599A CN102622754A CN 102622754 A CN102622754 A CN 102622754A CN 2012100485997 A CN2012100485997 A CN 2012100485997A CN 201210048599 A CN201210048599 A CN 201210048599A CN 102622754 A CN102622754 A CN 102622754A
- Authority
- CN
- China
- Prior art keywords
- color
- trimap
- pixel
- user interactions
- prospect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种基于用户交互Trimap的前景提取方法,首先输入图片,建立彩色线性模型,把一个小窗口内像素的颜色值近似看作是线性排列的,之后得出评价函数,采用改进的用户交互方式来提供Trimap,之后只在前景和背景融合在一起的区域解最优化问题。本发明通过引入简单的Trimap,通过一定的用户交互输入,将病态问题转化为一个带约束的最优化问题,在原有的方法的基础上大大提高了计算效率,增加的用户交互并不多,同时还保持了用户交互的直观性和方便性。实验验证,比起已有的方法实现,发明的方法可以有2~10倍不等的加速效果。
Description
技术领域
本发明涉及计算机图像处理技术,具体是一种基于用户交互Trimap的快速前景提取方法。
背景技术
前景提取是计算机图像处理中非常重要的一个操作,目的是将图像中人类感兴趣的区域从复杂的背景中提取出来,以便进行后续的更换背景、改变透视效果、图片拼贴等操作。但是要确定一个像素是否属于前景其实是一个病态问题,通常难以从原图像中直接得到准确解,所以前景提取方法一般都需要一定的用户交互。
其中表示第i个像素中前景的不透明度。假设共有N个像素的话,一共有N个方程,3N个未知数。显然,这是一个病态问题,不存在一个确定解,通常难以从原图像中直接得到准确解,所以前景提取方法一般都需要一定得用户交互。Trimap是前景提取问题中常见的用户交互形式之一,所谓Trimap就是将图像中的像素划分为三部分:确定的前景、确定的背景和未知区域。通过Trimap我们可以将(1)所代表的病态问题转化为求解一个带约束的最优化过程。但基于Trimap的前景提取方法的一个缺点就是需要用户具有一定的经验,才能通过正确的交互得到比较好的前景提取结果,另外也比较难以处理具有很多洞的前景物体。
前景提取的研究已经进行了十多年,在这个领域先后提出过Blue Screen Matting、Bayesian Matting、Robust Matting、Soft Scissors等具有代表性的技术和方法。Robust Matting由Wang Jue和Michael F.Cohen在2007年提出,相对于之前的方法在效果和效率两方面都有很大的提高。在此方法中,对于每一个未知像素,利用临近已知像素中的前景颜色信息和背景颜色信息来作为自己的前景颜色和背景颜色的估计,这样在方程(1)中和就变成了已知量,从而可以求得。事实上,一个未知像素临近的已知像素是很多的,为此Robust Matting规定了一套如何从临近已知像素中选择前景颜色信息和背景颜色信息的标准,以便得到更加准确的。
Soft Scissors是Robust Matting的作者提出的一种改进方法,解决了如何标记Trimap的问题,这种方法在实时性和可交互性上都有很大突破。在此方法中,用户使用鼠标沿着物体边沿顺时针勾勒出物体轮廓,要求鼠标笔触覆盖的区域必须涵盖前景和背景融合在一起的区域。换言之方法会将鼠标笔触覆盖的区域作为未知区域,笔触方向左边的区域会被划分为前景,右边的区域会被划分为背景,在此基础上再运用Robust Matting计算笔触覆盖区域中未知像素的值。这样,用户在勾勒轮廓的同时就能得到未知区域的不透明度,从而达到了实时性的要求,能够运用到诸如Photoshop之类的商业软件中。但这种方法存在一个明显的缺点是要求交互过程的相当精确。
A Closed Form Solution to Natural Image Matting由Anat Levin等人在2008年提出,这种方法的特点是交互的过程比较简单,只要通过简单地在画面上指出部分前景和背景区域,就能得到比较好的前景提取效果。换言之,这种方法并不需要完整的Trimap信息,而是通过全局地进行评价函数的最优化来得到前景提取的结果。但这样带来的一个弊端就是时间花费很大,图像中有很多我们并不关心的区域都纳入了计算范围。
发明内容
本发明所要解决的技术问题是提供一种基于用户交互Trimap的快速前景提取方法,能够用比较简明的交互得到比较好的结果,同时也能将时间复杂度控制在一个合理范围内。
本发明所述的基于用户交互Trimap的快速前景提取方法,其包括以下步骤:
采用Trimap用户交互形式将图像中的像素划分为三部分:确定的前景、确定的背景和未知区域;
步骤2,建立彩色线性模型。为了计算评价函数,把一个小窗口内像素的颜色值近似看作是线性排列的,由此我们可以得到:
步骤3,得出评价函数。基于(2)式描述的彩色线性模型,我们提出如下的评价函数:
步骤4,解决用户交互与约束问题。只有(4)式中的评价函数是不够的,我们需要通过用户交互来提供Trimap,使得病态问题能够转化为一个可以求最优解的优化问题。为了减少计算上的时间花费,我们只在前景和背景融合在一起的区域解我们的最优化问题。在为此我们提出了一种改进的用户交互方式,使得原来在整幅图像上求解的问题转变为在用户指定小区域内求解的问题。
我们的用户交互方式图1所示,用户使用颜色线条和笔触进行交互式标记,最左边的图像是输入图像,中间的图像是用户交互后生成的图像,最右边的图像是输出地不透明度分布结果。通过中间的图像我们可以看到,颜色A的线条和图像固有的边界将图像分为很多个区域。其中如果区域中只存在颜色B的笔触,我们将其视为背景;如果只存在颜色C的笔触,我们将其视为前景;如果既有颜色B又有颜色C笔触,我们将其视为未知区域。颜色A笔触经过的部分也被视为未知区域。至此,通过用户交互我们就得到了一个完整的Trimap,我们对不透明度的计算只在未知区域进行。
步骤5,基于(4)式的评价函数,通过用户交互提供的约束来解一个最优化问题,就可以得到我们想要的整幅图像的不透明度分布。我们的最优化问题表示如下:
(7)
本发明的有益效果:
本发明通过改进A Closed Form Solution to Natural Image Matting得到的,原来的方法并不包括完整的Trimap以求简化用户交互,但是同时却增加时间上的开销,需要在考虑整张图片的每一个像素的基础上进行求解。本方法通过引入简单的Trimap,在能够比较简明地完成用户交互的同时,大大减小时间复杂度。
附图说明
图1,用户交互方式示意图。
图2,本发明的三组实验结果图。
具体实施方式
以下结合附图对本发明作详细描述。
第一步 建立彩色线性模型
为了确立评价函数,我们把一个小窗口内像素的颜色值近似看作是线性排列的,由此我们可以得到:
(2)
第二步 确立评价函数
基于(2)式描述的彩色线性模型,提出如下的评价函数:
(4)
第三步 用户交互提供Trimap
按照图1所示的用户交互方式,通过用户交互后得到中间的生成图像。在图像中,颜色A的线条和图像固有的边界将图像分为很多个区域。其中如果区域中只存在颜色B的笔触,我们将其视为背景;如果只存在颜色C的笔触,我们将其视为前景;如果既有颜色B又有颜色C笔触,我们将其视为未知区域。颜色A笔触经过的部分也被视为未知区域。
第四步 求解最优化问题输出结果
通过上一步的用户交互提供的约束,前景提取转化为一个最优化问题,就可以得到我们想要的整幅图像的不透明度分布。最优化问题表示如下:
通过计算的最优化问题实现的前景提取实验结果如图2所示。
Claims (2)
1.一种基于用户交互Trimap的快速前景提取方法,其特征在于包括以下步骤:
采用Trimap用户交互形式将图像中的像素划分为三部分:确定的前景、确定的背景和未知区域;
步骤2,建立彩色线性模型:为了计算评价函数,把一个小窗口内像素的颜色值近似看作是线性排列的,由此得到:
(2)
步骤3,得出评价函数:基于(2)式描述的彩色线性模型,提出如下的评价函数:
步骤4,采用改进的用户交互方式来提供Trimap,之后只在前景和背景融合在一起的区域解最优化问题,该改进的用户交互方式为:用户使用颜色线条和笔触进行交互式标记,其中使用颜色A的线条和图像固有的边界将图像分为很多个区域;其中如果区域中只存在颜色B的笔触,将其视为背景;如果只存在颜色C的笔触,将其视为前景;如果既有颜色B又有颜色C笔触,将其视为未知区域;颜色A笔触经过的部分也被视为未知区域;
通过提供Trimap,最优化问题表示如下:
2.根据权利要求1所述的基于用户交互Trimap的快速前景提取方法,其特征在于步骤3)的小窗口采用3×3格式,从而保证小窗口边沿部分是重叠的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100485997A CN102622754A (zh) | 2012-02-29 | 2012-02-29 | 一种基于用户交互Trimap的快速前景提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100485997A CN102622754A (zh) | 2012-02-29 | 2012-02-29 | 一种基于用户交互Trimap的快速前景提取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102622754A true CN102622754A (zh) | 2012-08-01 |
Family
ID=46562655
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100485997A Pending CN102622754A (zh) | 2012-02-29 | 2012-02-29 | 一种基于用户交互Trimap的快速前景提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102622754A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188760A (zh) * | 2019-04-01 | 2019-08-30 | 上海卫莎网络科技有限公司 | 一种图像处理模型训练方法、图像处理方法及电子设备 |
CN110298861A (zh) * | 2019-07-04 | 2019-10-01 | 大连理工大学 | 一种基于共享采样的快速三维图像分割方法 |
-
2012
- 2012-02-29 CN CN2012100485997A patent/CN102622754A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188760A (zh) * | 2019-04-01 | 2019-08-30 | 上海卫莎网络科技有限公司 | 一种图像处理模型训练方法、图像处理方法及电子设备 |
CN110298861A (zh) * | 2019-07-04 | 2019-10-01 | 大连理工大学 | 一种基于共享采样的快速三维图像分割方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101651772B (zh) | 一种基于视觉注意的视频感兴趣区域的提取方法 | |
US8908904B2 (en) | Method and system for make-up simulation on portable devices having digital cameras | |
CN101945223B (zh) | 视频一致性融合处理方法 | |
CN110827193B (zh) | 基于多通道特征的全景视频显著性检测方法 | |
CN108734120A (zh) | 标注图像的方法、装置、设备和计算机可读存储介质 | |
CN111696028A (zh) | 真实场景图像卡通化的处理方法、装置、计算机设备和存储介质 | |
CN106027851A (zh) | 基于图像梯度的图像滤波 | |
CN103248906B (zh) | 一种双目立体视频序列的深度图获取方法与系统 | |
CN105472434A (zh) | 植入内容到视频演示中的方法和系统 | |
CN105931180B (zh) | 利用显著信息引导的图像不规则马赛克拼接方法 | |
US10229340B2 (en) | System and method for coarse-to-fine video object segmentation and re-composition | |
CN105608722A (zh) | 一种基于人脸关键点的自动去眼袋方法及系统 | |
CN104915981A (zh) | 基于体感传感器的三维立体发型设计方法 | |
CN103168316A (zh) | 用户界面控制装置、用户界面控制方法、计算机程序以及集成电路 | |
CN102196292A (zh) | 基于人机交互生成视频深度图序列的方法及系统 | |
CN103761734A (zh) | 一种时域一致性保持的双目立体视频场景融合方法 | |
CN102034247A (zh) | 一种基于背景建模对双目视觉图像的运动捕捉方法 | |
KR20100091864A (ko) | 비디오 동영상의 움직이는 다중 객체 자동 분할 장치 및 방법 | |
CN102622754A (zh) | 一种基于用户交互Trimap的快速前景提取方法 | |
US10650488B2 (en) | Apparatus, method, and computer program code for producing composite image | |
CN108682021A (zh) | 快速手部跟踪方法、装置、终端及存储介质 | |
CN104091318B (zh) | 一种中国手语视频过渡帧的合成方法 | |
Lin et al. | Video stylization: painterly rendering and optimization with content extraction | |
Shen et al. | Re-texturing by intrinsic video | |
CN104050700A (zh) | 图像合成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120801 |