CN104156959A - 一种视频抠图方法及装置 - Google Patents

一种视频抠图方法及装置 Download PDF

Info

Publication number
CN104156959A
CN104156959A CN201410389234.XA CN201410389234A CN104156959A CN 104156959 A CN104156959 A CN 104156959A CN 201410389234 A CN201410389234 A CN 201410389234A CN 104156959 A CN104156959 A CN 104156959A
Authority
CN
China
Prior art keywords
pixel
probability
detected
area
contour area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410389234.XA
Other languages
English (en)
Inventor
阮春雷
王鼎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ThunderSoft Co Ltd
Original Assignee
ThunderSoft Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ThunderSoft Co Ltd filed Critical ThunderSoft Co Ltd
Priority to CN201410389234.XA priority Critical patent/CN104156959A/zh
Publication of CN104156959A publication Critical patent/CN104156959A/zh
Pending legal-status Critical Current

Links

Abstract

本申请提供了一种视频抠图方法及装置,以预设人体轮廓模型为依据,在视频流的当前帧图像中确定待检测轮廓区域,依据该区域中的各个像素点的像素值,以及各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程,并利用图分割算法求解该方程的最小解,从而获得该算法对应的图结构中每个结点的二值标记,依据各个结点的二值标记,实现对该轮廓区域的分割,进而提取出该当前帧图像中的人物区域。本发明利用轮廓模型确定出待检测轮廓区域,在该待检测区域检测分割线,避免对整幅图像的分割检测,提高了抠图效率;在构建能量方程时利用了当前帧图像与上一帧图像的亮度差值,即考虑了视频图像中人物区域的运动状态,从而提供了抠图准确率。

Description

一种视频抠图方法及装置
技术领域
本发明涉及图像处理技术领域,尤其是一种视频抠图方法及装置。
背景技术
视频抠图,是将感兴趣的目标物体从视频图像中提取出来。随着移动通信技术的发展,视频通话的应用已经越来越广泛。人们利用移动终端进行视频通话时,摄像头会拍摄包括人物在内的视频图像,该视频图像中不仅包括对话者本身,还包含有环境背景。目前,人们在视频通话中的一种需求是,自由设置视频图像中的环境背景图像,例如,设置为默认的统一背景,或者设置为海边环境背景等。从技术手段上来讲,实现上述功能,最重要的是要将人物区域从视频图像中抠取出来,即视频抠图。
目前,大多数的抠图技术是针对静态图像的,也即从单张的静态图片中抠取目标区域,然而,由于视频流中的人物区域极有可能是变化的,所述方法并不适用。因此,需要一种视频抠图方法来实现从视频流图像中抠取人物区域图像。
发明内容
有鉴于此,本申请提供了一种视频抠图方法,以实现从视频流图像中抠取人物区域。为实现所述发明目的,本发明提供的技术方案如下:
一种视频抠图方法,包括:
获取视频流的当前帧图像;
以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域;
依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程;
利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应;
依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
上述方法,优选地,所述以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域,包括:
获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM;
中的最大值确定为模型缩放系数;
依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
上述方法,优选地,所述依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程,包括:
依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率;
依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
由所述数据项、平滑项及运动项,构建能量方程。
上述方法,优选地,所述构建的能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据获得对应的Ed(li);其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项;(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0;
所述λ及η为预设系数。
上述方法,优选地,所述依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项,包括:
将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点;
利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型;
依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率;
依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
本申请还提供了一种视频抠图装置,包括:
帧图像获取单元,用于获取视频流的当前帧图像;
轮廓区域确定单元,用于以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域;
能量方程构建单元,用于依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程;
二值标记获得单元,用于利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应;
人物区域提取单元,用于依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
上述装置,优选地,所述轮廓区域确定单元包括:
间距值获取子单元,用于获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM;
缩放系数确定子单元,用于将中的最大值确定为模型缩放系数;
轮廓区域确定子单元,用于依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
上述装置,优选地,所述能量方程构建单元包括:
数据项确定子单元,用于依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率;
平滑项确定子单元,用于依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
运动项确定子单元,用于依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
方程构建子单元,用于由所述数据项、平滑项及运动项,构建能量方程。
上述装置,优选地,所述构建的能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据获得对应的Ed(li);其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项;(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0;
所述λ及η为预设系数。
上述装置,优选地,所述数据项确定子单元包括:
种子像素点确定子单元,用于将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点;
概率模型构建子单元,用于利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型;
所属区域概率获取子单元,用于依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率;
数据项获得子单元,用于依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
与现有技术相比,本发明具有如下有益效果:
本发明提供的视频抠图方法及装置,以预设人体轮廓模型为依据,在视频流的当前帧图像中确定出待检测轮廓区域,依据该区域中的各个像素点的像素值,以及各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程,并利用图分割算法求解该方程的最小解,从而获得该算法对应的图结构中每个结点的二值标记,该二值标记用以对该图结构中的各个结点进行分割,由于该图结构中的各个结点与该轮廓区域中各个像素点一一对应,从而可以依据所述各个结点的二值标记,实现对该轮廓区域的分割,进而提取出该当前帧图像中的人物区域。本发明利用轮廓模型确定出待检测轮廓区域,在该待检测区域检测分割线,避免对整幅图像的分割检测,提高了抠图效率;在构建能量方程时利用了当前帧图像与上一帧图像的亮度差值,即考虑了视频图像中人物区域的运动状态,从而提供了抠图准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的视频抠图方法的流程图;
图2为本发明实施例提供的人体轮廓模型的示例图;
图3为本发明实施例提供的待检测轮廓区域的示例图;
图4为本发明实施例提供的视频抠图方法中构建能量方程的流程图;
图5为本发明实施例提供的视频抠图装置的结构框图;
图6为本发明实施例提供的视频抠图装置中能量方程构建单元的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,其示出了本发明实施例提供的视频抠图方法的流程,具体包括以下步骤:
步骤S101:获取视频流的当前帧图像。
本发明实施例应用但不局限于移动终端进行视频通话的场景中,在进行通话过程中,摄像头会拍摄人物视频流图像,该视频流图像是由多帧图像构成,提取当前一帧图像。
步骤S102:以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域。
其中,人体轮廓模型是预先设置的能体现人体轮廓特征的模型图,例如图2所示的Ω模型,该模型是指两条轮廓线21及22包围的区域,利用该模型图在当前帧图像中适配出待检测轮廓区域,如图3所示,由边缘线31及边缘线32确定的区域。
步骤S103:依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程。
其中,由上述人体轮廓模型确定出的待检测轮廓区域包括内外两条边缘线,利用该两条边缘线像素点的像素值生成概率模型,该概率模型用于确定该待检测轮廓区域内部各个像素点属于前景的概率及属于背景的概率,同时,再加上利用该待检测区域各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程。需要说明的是,从应用数学范畴来讲,视频抠图属于对比类问题,而能量方程是此类问题进行建模后的数学表达式,通过该表达式将该类实际应用问题转化为数学表达式的求解过程。
本发明实施例,在构建能量方程过程中利用了像素点的颜色值及图像中人物区域的运动状态信息,考虑了多方面的影响因素,构建的能量方程更加精确。
步骤S104:利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应。
其中,图分割算法是现有技术中的一种图像分割算法,通过对像素进行标记实现图像分割。具体地,其依据参与分割的各个像素点生成图(一种数据结构),该图中的各个结点即为待分割图像中的各个像素点,结点四邻域相连。同时,该图具有两个顶点即源点与汇点,每个结点均与顶点相连。当该能量方程取得最小值时,该图的分割准确性最高,并且此时,该图中的各个结点分别属于不同的顶点,也即获得了每个结点的二值标记,进而实现将各个结点进行区分。
步骤S105:依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
其中,由于图分割算法对应的图结构是依据待检轮廓区域的各个像素点生成的,对该图中节点的二值标记可以实现对待分割检测区域的分割。具体地,将具有同一二值标记的像素点确定为一个区域,将具有另一二值标记的像素点即该待检测区域中的剩余像素点确定为另一区域,从而实现分割,如图3所示,曲线33将待检测轮廓区域划分为两部分区域,即区域A与区域B,可以知道的是,两个区域的二值标记是不同的,且属于同一区域中的二值标记是相同的,进而,将曲线33包围的内部区域提取为人物区域。
由以上技术方案可知,本发明实施例提供的视频抠图方法,首先利用预设人体轮廓模型确定出待检测轮廓区域,进而在该轮廓区域中进行分割检测,避免对整帧图像的处理,提供了抠图效率,实时性较好,可以更好地应用于移动终端中的视频通话场景中。而且,在现有技术中,一些抠图技术需要用户在图像进行区域划分,而本发明可以实现自动依据预设的模板对待检测区域的确定,减少了用户的参与;或者,某些抠图技术需要预先利用视频流中的前几帧图像进行训练,以确定待检测区域,本发明并不需要预先训练过程,抠图实时性更好。
同时,在对该待检测轮廓区域分割检测时,考虑了视频流图像的人物活动状态,由于人物活动会导致前后两帧图像中对应像素点的亮度值产生变化,因此体现在本方案中,即构建的能量方程中利用了当前帧图像中像素点与上一帧图像像素点的亮度值差值,从而使构建的能量方程更精确地体现视频图像中的人物区域特征,抠图更加精确。
可选地,上述方法实施例中的步骤S102可以通过以下方式实现:
获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM。
其中,参见图2所示的人体轮廓模型,利用该模型对应的左眼El、右眼Er及嘴巴M的坐标值,获得ElEr、ElM及ErM的值;参见图3所示的待检测轮廓区域,利用该区域对应的当前帧图像中的左眼E1、右眼E2及嘴巴M1的坐标值,获得E1E2、E1M1及E2M1的值。
中的最大值确定为模型缩放系数。
具体地,当该最大值为大于1的数值时,则该模型需要放大;反之,该模型需要缩小。
依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
其中,如图3所示,需要将该模型进行缩放后,对应覆盖在该当前帧图像中。具体的,模型图中包含预设人体轮廓模型Ω,该模型图为黑色,模型Ω为白色,则形成mask图,mask区域即为模型Ω。具体的对应方式是将模型图的嘴巴位置与该当前帧图像对应的嘴巴位置对齐,将模型Ω覆盖的区域确定为最终的待检测轮廓区域。
可选地,参见图4,上述方法实施例中的步骤S103可以通过以下方式实现:
步骤S201:依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率。
需要说明的是,本发明中前景可以认为是需要抠取的人物区域,图像中的剩余的区域为背景。具体地,构建数据项的方法可以为:
将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点。
利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型。
具体地,采用Kmeans++聚类算法对前景像素点进行聚类,设聚集为M类,获得每一聚类的均值μk与方差σk,且:
μk=∑xi/N;
其中:k∈[1,M],xi为第k类像素点的像素值,N为第k类的像素点个数。
进而,利用上述均值与方差获得前景概率模型,具体为:
P ( x ) = Σ k = 1 M w ( k ) * N ( x , μ k , σ k ) ; 其中:
w(k)为第k类在整个模型中权重系数,即第k类像素数占总像素数的比例,则 Σ k = 1 M w ( k ) = 1 , 并且: N ( x , μ k , σ k ) = 1 2 π σ k exp ( - 1 2 σ k ( x - μ k ) T ( x - μ k ) ) .
同理,依据上述原理,对背景像素点进行聚类,获得背景概率模型。
依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率。
依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
步骤S202:依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
步骤S203:依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
步骤S204:由所述数据项、平滑项及运动项,构建能量方程。
具体地,所述能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据下述式(1)获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据下述式(2)获得对应的Ed(li);
E d ( l i ) = d f ( x i ) d b ( x i ) + d f ( x i )       式(1);
E d ( l i ) = d b ( x i ) d b ( x i ) + d f ( x i )        式(2);
其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项,(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,可以用欧式距离算法计算获得,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0。
所述λ及η为预设系数。
需要说明的是,在上述能量方程中,数据项用于表示该待检测轮廓区域的各个像素点的前景概率及背景概率,其中,该待检测区域的各个像素点分为三个部分,外轮廓线上的像素点为背景像素点、内轮廓线上的像素点为前景像素点,该轮廓区域内的像素点为未知像素点,依据所述三个区域像素点的像素值的背景概率及前景概率获得该数据项。可见,该数据项考虑了像素点的颜色信息。
同时,平滑项体现了相邻像素点像素值之间的平滑性能量,平滑性能量与对应像素点的颜色差有关,相邻像素点的像素值越大,则平滑性能量越小,处于图像边缘的可能性越大,该项使分割的边界尽量与强图像边缘对齐。由于,前景与背景之间具有较强的图像边缘,因此,沿图像边缘分割,可以提高图像抠取的精准度。
另外,运动项是利用前后两帧图像中对应像素点的亮度差值获得,从而考虑了图像中人物的运动信息,进一步提供了抠图准确性。
下文对本发明实施例提供的视频抠图装置进行介绍,需要说明的是,有关视频抠图装置的说明可参照上文描述的视频抠图方法,不做赘述。
参见图5,其示出了本发明实施例提供的视频抠图装置的结构,具体包括:
帧图像获取单元100,用于获取视频流的当前帧图像;
轮廓区域确定单元200,用于以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域;
能量方程构建单元300,用于依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程;
二值标记获得单元400,用于利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应;
人物区域提取单元500,用于依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
由以上技术方案可知,本发明实施例提供的视频抠图装置,首先利用预设人体轮廓模型确定出待检测轮廓区域,进而在该轮廓区域中进行分割检测,避免对整帧图像的处理,提供了抠图效率,实时性较好,可以更好地应用于移动终端中的视频通话场景中。而且,在现有技术中,一些抠图技术需要用户在图像进行区域划分,而本发明可以实现自动依据预设的模板对待检测区域的确定,减少了用户的参与;或者,某些抠图技术需要预先利用视频流中的前几帧图像进行训练,以确定待检测区域,本发明并不需要预先训练过程,抠图实时性更好。
同时,在对该待检测轮廓区域分割检测时,考虑了视频流图像的人物活动状态,由于人物活动会导致前后两帧图像中对应像素点的亮度值产生变化,因此体现在本方案中,即构建的能量方程中利用了当前帧图像中像素点与上一帧图像像素点的亮度值差值,从而使构建的能量方程更精确地体现视频图像中的人物区域特征,抠图更加精确。
可选地,所述轮廓区域确定单元200包括:
间距值获取子单元,用于获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM;
缩放系数确定子单元,用于将中的最大值确定为模型缩放系数;
轮廓区域确定子单元,用于依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
可选地,参见图6,所述能量方程构建单元300包括:
数据项确定子单元301,用于依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率;
平滑项确定子单元302,用于依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
运动项确定子单元303,用于依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
方程构建子单元304,用于由所述数据项、平滑项及运动项,构建能量方程。
可选地,上述各个装置实施例中构建的所述能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据获得对应的Ed(li);其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项;(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0。
所述λ及η为预设系数。
可选地,所述数据项确定子单元包括:
种子像素点确定子单元,用于将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点;
概率模型构建子单元,用于利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型;
所属区域概率获取子单元,用于依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率;
数据项获得子单元,用于依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频抠图方法,其特征在于,包括:
获取视频流的当前帧图像;
以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域;
依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程;
利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应;
依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
2.根据权利要求1所述的方法,其特征在于,所述以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域,包括:
获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM;
中的最大值确定为模型缩放系数;
依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
3.根据权利要求1所述的方法,其特征在于,所述依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程,包括:
依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率;
依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
由所述数据项、平滑项及运动项,构建能量方程。
4.根据权利要求1或3所述的方法,其特征在于,所述构建的能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据获得对应的Ed(li);其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项;(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0;
所述λ及η为预设系数。
5.根据权利要求3所述的方法,其特征在于,所述依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项,包括:
将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点;
利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型;
依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率;
依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
6.一种视频抠图装置,其特征在于,包括:
帧图像获取单元,用于获取视频流的当前帧图像;
轮廓区域确定单元,用于以预设人体轮廓模型为依据,确定所述当前帧图像中的待检测轮廓区域;
能量方程构建单元,用于依据所述待检测轮廓区域的各个像素点的像素值,及所述各个像素点与上一帧图像对应像素点的亮度差值,构建能量方程;
二值标记获得单元,用于利用graph-cut(图分割)算法求解所述能量方程的最小值,以获得所述图分割算法对应的图结构中每个结点的二值标记;其中,所述图结构中各个结点与所述待检测轮廓区域中各个像素点一一对应;
人物区域提取单元,用于依据所述图结构中每个结点的二值标记,提取所述当前帧图像中的人物区域。
7.根据权利要求6所述的装置,其特征在于,所述轮廓区域确定单元包括:
间距值获取子单元,用于获取预设人体轮廓模型中左眼右眼间距值E1E2、左眼嘴巴间距值E1M1、右眼嘴巴间距值E2M1,并获取所述当前帧图像中左眼右眼间距值ElEr、左眼嘴巴间距值ElM、右眼嘴巴间距值ErM;
缩放系数确定子单元,用于将中的最大值确定为模型缩放系数;
轮廓区域确定子单元,用于依据所述模型缩放系数,对所述预设人体轮廓模型进行缩放,并将所述缩放后的预设人体轮廓模型在所述当前帧图像中的覆盖区域确定为待检测轮廓区域。
8.根据权利要求6所述的装置,其特征在于,所述能量方程构建单元包括:
数据项确定子单元,用于依据所述待检测轮廓区域内边缘线像素点的像素值及外边缘像素点的像素值,确定能量方程的数据项;其中,所述数据项表征待检测区域的各个像素点的所属区域概率;所述所属区域概率包括前景概率及背景概率;
平滑项确定子单元,用于依据所述待检测轮廓区域内每个像素点与各自相邻像素点的像素值之差,确定能量方程的平滑项;
运动项确定子单元,用于依据所述待检测轮廓区域内每个像素点与与上一帧图像对应像素点的亮度差值,确定能量方程的运动项;
方程构建子单元,用于由所述数据项、平滑项及运动项,构建能量方程。
9.根据权利要求6或8所述的装置,其特征在于,所述构建的能量方程为:
E ( Ω ) = Σ i E d ( l i ) + λ Σ ( i , j ) ∈ ϵ E s ( l i , l j ) + η Σ i E m ( l i ) ; 其中:
所述Ed(li)为数据项;li为待检测轮廓区域的像素点i的所属区域概率;待检测轮廓区域内边缘线像素点i的所属区域概率为前景概率时对应的Ed(li)为0;待检测轮廓区域内边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i为前景概率时对应的Ed(li)为∞;待检测轮廓区域外边缘线像素点i的所属区域概率为背景概率时对应的Ed(li)为0;待检测轮廓区域内部像素点i的所属区域概率li为前景概率时,依据获得对应的Ed(li);待检测轮廓区域内部像素点i的所属区域概率li为背景概率时,依据获得对应的Ed(li);其中:df(xi)=-ln(Pf(x)),Pf(x)为待检测轮廓区域内部像素点i的前景概率;db(x)=-ln(Pb(x)),Pb(x)为待检测轮廓区域内部像素点i的背景概率;
所述Es(li,lj)为平滑项;(i,j)∈ε表示像素点j为像素点i的相邻像素点,且平滑项依据 E s ( l i , l j ) = | l i - l j | × ϵ + e - β | | x i - x j | | 2 1 + ϵ 获得;其中,ε为预设常数,e为自然对数函数的底数,β为预设调整系数,||xi-xj||2为范数,表征像素点i与像素点j的相似度,xi为像素点i的像素值,xj为像素点j的像素值;
所述Em(li)为运动项;待检测轮廓区域像素点i的亮度值与上一帧亮度值之差超过预设阈值时对应的Em(li)为1,否则,Em(li)为0;
所述λ及η为预设系数。
10.根据权利要求8所述的装置,其特征在于,所述数据项确定子单元包括:
种子像素点确定子单元,用于将所述待检测轮廓区域内边缘线像素点确定为前景像素点,并将所述待检测轮廓区域外边缘线像素点确定为背景像素点;
概率模型构建子单元,用于利用高斯混合模型聚类算法,分别对所述前景像素点的像素值及所述背景像素点的像素值进行聚类,以构建各自对应的概率模型;
所属区域概率获取子单元,用于依据所述各自对应的概率模型,获取所述待检测轮廓区域内各个像素点的所属区域概率;其中,所述所属区域概率包括前景概率及背景概率;
数据项获得子单元,用于依据所述前景像素点的所属区域概率、背景像素点的所属区域概率及所述待检测轮廓区域内各个像素点的所属区域概率,确定能量方程的数据项。
CN201410389234.XA 2014-08-08 2014-08-08 一种视频抠图方法及装置 Pending CN104156959A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410389234.XA CN104156959A (zh) 2014-08-08 2014-08-08 一种视频抠图方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410389234.XA CN104156959A (zh) 2014-08-08 2014-08-08 一种视频抠图方法及装置

Publications (1)

Publication Number Publication Date
CN104156959A true CN104156959A (zh) 2014-11-19

Family

ID=51882449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410389234.XA Pending CN104156959A (zh) 2014-08-08 2014-08-08 一种视频抠图方法及装置

Country Status (1)

Country Link
CN (1) CN104156959A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017054651A1 (zh) * 2015-09-29 2017-04-06 阿里巴巴集团控股有限公司 一种确定融合系数的方法和装置
CN106846336A (zh) * 2017-02-06 2017-06-13 腾讯科技(上海)有限公司 提取前景图像、替换图像背景的方法及装置
CN108109161A (zh) * 2017-12-19 2018-06-01 北京奇虎科技有限公司 基于自适应阈值分割的视频数据实时处理方法及装置
CN109509195A (zh) * 2018-12-12 2019-03-22 北京达佳互联信息技术有限公司 前景处理方法、装置、电子设备及存储介质
CN111161289A (zh) * 2019-12-26 2020-05-15 杭州格像科技有限公司 图像中物体轮廓精度提升方法、装置和计算机程序产品
CN111462161A (zh) * 2020-03-31 2020-07-28 厦门亿联网络技术股份有限公司 一种实时视频人像提取的系统、方法、存储介质和设备
CN113610865A (zh) * 2021-07-27 2021-11-05 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7158656B2 (en) * 1999-03-08 2007-01-02 Vulcan Patents Llc Three dimensional object pose estimation which employs dense depth information
CN102932582A (zh) * 2012-10-26 2013-02-13 华为技术有限公司 实现运动检测的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7158656B2 (en) * 1999-03-08 2007-01-02 Vulcan Patents Llc Three dimensional object pose estimation which employs dense depth information
CN102932582A (zh) * 2012-10-26 2013-02-13 华为技术有限公司 实现运动检测的方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
D.M.GAVRILA等: "3-D model-based tracking of humans in action: a multi-view approach", 《IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
YIN LI等: "Video Object Cut and Paste", 《ACM TRANSACTIONS ON GRAPHICS》 *
张洪超等: "基于跨时空域相似邻接图的视频分割算法", 《图学学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017054651A1 (zh) * 2015-09-29 2017-04-06 阿里巴巴集团控股有限公司 一种确定融合系数的方法和装置
CN106846336A (zh) * 2017-02-06 2017-06-13 腾讯科技(上海)有限公司 提取前景图像、替换图像背景的方法及装置
CN106846336B (zh) * 2017-02-06 2022-07-15 腾讯科技(上海)有限公司 提取前景图像、替换图像背景的方法及装置
CN108109161A (zh) * 2017-12-19 2018-06-01 北京奇虎科技有限公司 基于自适应阈值分割的视频数据实时处理方法及装置
CN108109161B (zh) * 2017-12-19 2021-05-11 北京奇虎科技有限公司 基于自适应阈值分割的视频数据实时处理方法及装置
CN109509195A (zh) * 2018-12-12 2019-03-22 北京达佳互联信息技术有限公司 前景处理方法、装置、电子设备及存储介质
CN111161289A (zh) * 2019-12-26 2020-05-15 杭州格像科技有限公司 图像中物体轮廓精度提升方法、装置和计算机程序产品
CN111161289B (zh) * 2019-12-26 2023-08-08 杭州格像科技有限公司 图像中物体轮廓精度提升方法、装置
CN111462161A (zh) * 2020-03-31 2020-07-28 厦门亿联网络技术股份有限公司 一种实时视频人像提取的系统、方法、存储介质和设备
CN111462161B (zh) * 2020-03-31 2023-09-26 厦门亿联网络技术股份有限公司 一种实时视频人像提取的系统、方法、存储介质和设备
CN113610865A (zh) * 2021-07-27 2021-11-05 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN113610865B (zh) * 2021-07-27 2024-03-29 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN104156959A (zh) 一种视频抠图方法及装置
CN110598610B (zh) 一种基于神经选择注意的目标显著性检测方法
CN105261037B (zh) 一种自适应复杂场景的运动目标检测方法
CN101299268B (zh) 适于低景深图像的语义对象分割方法
CN103559719B (zh) 一种交互式图像分割方法
CN101587593B (zh) 一种基于真实图像素描风格化的方法
CN105631880A (zh) 车道线分割方法和装置
CN103544685B (zh) 一种基于主体调整的图像构图美化方法及系统
CN106157307A (zh) 一种基于多尺度cnn和连续crf的单目图像深度估计方法
EP2849425A1 (en) Color video processing system and method, and corresponding computer program
CN103914699A (zh) 一种基于色彩空间的自动唇彩的图像增强的方法
CN103793930A (zh) 铅笔画图像生成方法及装置
CN107146198A (zh) 一种照片智能裁剪方法及装置
CN105279787A (zh) 基于拍照的户型图识别生成三维房型的方法
CN104881642A (zh) 一种内容推送方法、装置及设备
CN102903128A (zh) 基于局部特征结构保持的视频图像内容编辑传播方法
CN109816784B (zh) 三维重构人体的方法和系统及介质
CN102831584B (zh) 一种数据驱动的物体图像修复系统及方法
CN109766828A (zh) 一种车辆目标分割方法、装置及通信设备
CN102509346A (zh) 基于边缘保持的对象光照迁移方法
CN104517095A (zh) 一种基于深度图像的人头分割方法
CN104036479A (zh) 一种基于非负矩阵分解的多聚焦图像融合方法
CN104021566A (zh) 基于GrabCut算法的舌诊图像自动分割方法
CN102592288A (zh) 一种光照环境变化情况下的行人目标匹配跟踪方法
CN109028226A (zh) 基于双区域图像采集进行油烟浓度判断的油烟机

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141119