CN105100771A

CN105100771A - 一种基于场景分类和几何标注的单视点视频深度获取方法

Info

Publication number: CN105100771A
Application number: CN201510413367.0A
Authority: CN
Inventors: 江铭炎; 徐慧慧
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2015-07-14
Filing date: 2015-07-14
Publication date: 2015-11-25

Abstract

本发明涉及一种基于场景分类和几何标注的单视点视频深度获取方法，具体步骤包括：(1)判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景；(2)判断是否需要估计当前帧图像的初始深度图；(3)求出当前帧图像的初始深度图；(4)对于相机静止物体运动场景，得到当前帧图像的运动深度图，与初始深度图融合。对于相机运动场景，进行全局运动补偿，利用光流法对全局运动补偿后相邻帧图像进行运动估计，判断是否存在运动物体，确定是否与初始深度图进行融合。本发明不依赖具体的场景，计算量适中，生成噪声小且更加符合实际的场景分布的深度图，合成效果较好的3D视频。

Description

一种基于场景分类和几何标注的单视点视频深度获取方法

技术领域

本发明涉及一种基于场景分类和几何标注的单视点视频深度获取方法，属于计算机图像处理技术领域。

背景技术

目前立体图像技术应用范围很广，分布在科研、军事、教育和医疗各个领域。相比于2D图像，立体图像带给我们更逼真更震撼的视觉享受。目前3D片源的获取主要有几种方式：深度摄像机、2D转3D技术。但是，深度摄像机非常昂贵，并且只能得到新拍摄视频的3D内容，在3DTV系统中不实用，解决这个问题的一种有效的途径就是2D转3D技术，因为目前存在大量的2D视频，2D转3D技术有非常好的发展前景。2D转3D技术是指将普通的2D图像，通过图像或图像之间的相关信息，获得3D左右眼的深度图像。原图像和深度图像通过基于深度图的虚拟绘制技术(DIBR)生成左视图图像和右视图图像，因为人眼存在的视差，当左视图和右视图分别进入到人的左右眼时，便生成了立体图像。

2D视频场景根据场景中目标和相机运动情况不同可分成四种情况：相机运动、物体静止，相机静止、物体运动，相机静止、物体静止，相机运动、物体运动。对于这些场景可以采用运动、聚焦、散焦、线性透视、大气透视、纹理信息等深度线索或深度线索的结合得到对应的深度图，但是，这些方法有的只是适用于某一种场景，当场景变换时，该方法便不再适用。

发明内容

针对现有技术的不足，本发明公开了一种基于场景分类和几何标注的单视点视频深度获取方法；

本发明针对相机静止物体运动、相机运动物体静止和相机运动物体运动这三种情况下的视频都能得到对应的深度图像，将现有的2D视频转换成立体视频。

本发明得到能适应多种场景变换，精度较高并且计算量适中的深度图像，从而进一步生成质量较好的3D视频。

本发明的技术方案为：

术语解释

1、光流法，是一种简单实用的图像运动的表达方式，通常定义为一个图像序列中的图像亮度模式的表观运动，即空间物体表面上的点的运动速度在视觉传感器的成像平面上的表达；

2、全局运动补偿，为了弥补由于摄像机移动造成的背景全局性的运动对图像中运动目标检测造成的影响，常采用基于全局运动补偿思想的检测方法。该方法的思路是先对由摄像机移动引起的背景运动进行运动补偿，使得补偿后的图像序列可以近似认为是静态背景图像序列，然后再利用静态背景中运动目标的检测方法进行检测。

3、深度图，场景中各点相对于摄像机的距离可以用深度图来表示，即深度图中每一个像素值表示场景中某一点到摄像机的距离。深度图中像素的值越大，场景中的物体离摄像机越近，像素值越小，场景中的物体离摄像机越远。

一种基于场景分类和几何标注的单视点视频深度获取方法，具体步骤包括：

(1)读取视频序列，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景，所述相机运动场景包括相机运动物体静止场景和相机运动物体运动场景；

(2)判断是否需要估计当前帧图像的初始深度图，如果需要，进入步骤(3)，否则，当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图，直接进入步骤(4)；

(3)根据当前帧图像的几何标注结果求出当前帧图像的初始深度图；

(4)如果当前帧图像属于相机静止物体运动场景，采用光流法得到当前帧图像的运动深度图，与当前帧图像的初始深度图融合；如果当前帧图像属于相机运动场景，首先进行全局运动补偿，然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计，得到运动估计量级图，根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物体，如果存在运动物体，将全局运动补偿后的运动估计量级图线性变换得到的运动深度图，运动深度图与初始深度图融合得到最终深度图，如果不存在运动物体，将全局运动补偿前的运动估计量图线性变换得到的运动深度图作为最终深度图。

根据本发明优选的，所述步骤(1)中，读取视频序列，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景；具体步骤包括：

a、读取视频序列，获取所有的图像，求相邻帧图像之间的光流运动矢量结果，然后将当前帧图像的前(N-1)帧图像的光流运动矢量结果聚集，在原像素(x,y)处当前帧图像的光流运动矢量结果MVS(x,y)的计算公式如式(Ⅰ)所示：原像素(x,y)在第(l-1)个光流运动后的坐标(x_l,y_l)的计算公式如式(Ⅱ)所示；

M V S (x, y) = Σ_{l = 1}^{N = 1} M V (x_{l}, y_{l}) - - - (I)

(x_{l}, y_{l}) = R o u n d {(x, y) + Σ_{q = 1}^{l - 1} M V (x_{q}, y_{q})} - - - (I I)

式(Ⅰ)中，MV()表示相邻帧图像之间的光流运动矢量结果，N表示连续的帧图像数，N帧图像共发生(N-1)次光流运动；l＝1,2,...,(N-1)，分别表示第1,2，...,(N-1)个光流运动，(x_l,y_l)表示的是原像素(x,y)在第(l-1)个光流运动后的坐标；

式(Ⅱ)中，Round{}算子是对光流运动矢量结果的所有元素取整,q＝1,2,...,(l-1)，分别表示的是第1,2，...,(l-1)个光流运动，(x_q,y_q)表示原像素(x,y)在第(q-1)个光流运动后的坐标；

b、根据步骤a求取的当前帧图像的光流运动矢量结果的水平运动分量MVS_u和垂直运动分量MVS_v计算出运动累积量级图M_{cum_motion}，计算公式如式(Ⅲ)所示：

M_{c u m_m o t i o n} = \sqrt{{MVS}_{u}^{2} + {MVS}_{v}^{2}} - - - (I I I)

设定阈值Th_weight，2≤Th_weight≤10，统计运动累积量级图中大于阈值Th_weight的像素的数目N'，N'在所有像素中所占的百分比作为当前帧图像运动区域的权值W_m，计算公式如式(Ⅳ)所示：

W_{m} = \frac{N^{'}}{H \times W} - - - (I V)

式(Ⅳ)中，H和W分别为当前帧图像的高和宽；

c、设定相机运动阈值Th_{camera_motion},0.6≤Th_{camera_motion}≤0.85,根据步骤b求取的当前帧图像运动区域的权值W_m与相机运动阈值Th_{camera_motion}的关系判断当前帧图像是局部运动还是全局运动，如果当前帧图像运动区域的权值W_m小于相机运动阈值Th_{camera_motion}，则当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，否则，当前帧图像是全局运动，即当前帧图像属于相机运动场景。

根据本发明优选的，所述阈值Th_weight＝5。

根据本发明优选的，所述相机运动阈值Th_{camera_motion}＝0.8。

根据本发明优选的，所述步骤(2)中，判断是否需要估计当前帧图像的初始深度图，具体步骤包括：如果当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，根据步骤(1)判断当前帧图像的前一帧图像是否为局部运动，如果当前帧图像的前一帧图像是局部运动，当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图，不需要估计当前帧图像的初始深度图；如果当前帧图像的前一帧图像不是局部运动，则需要求当前帧图像的初始深度图；如果当前帧图像是全局运动，则需要求出当前帧图像的初始深度图。

根据本发明优选的，步骤(3)中，根据当前帧图像的几何标注结果求出当前帧图像的初始深度图，所述几何标注结果包括天空、水平区域和垂直区域，所述水平区域是指具有水平属性的区域，例如陆地、草坪、海面；所述垂直区域是指具有垂直属性的区域，例如树、高楼、山；具体步骤包括：(i,j)为当前帧图像任一像素，如果(i,j)属于天空，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为零，如果(i,j)属于水平区域，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为如果(i,j)属于垂直区域，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为max(j)_ver表示垂直区域中第j列中最大的行值。

根据本发明优选的，步骤(4)中，如果当前帧图像属于相机静止物体运动场景，采用光流法得到当前帧图像的运动深度图，与当前帧图像的初始深度图融合；具体步骤包括：如果当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，根据光流法得到当前帧图像的光流运动量级图M_flow，(MV_u,MV_v)为当前帧图像的光流运动矢量结果，对当前帧图像的光流运动量级图M_flow进行线性变换得到当前帧图像的运动深度图D_{local_motion}，变换公式如式(Ⅴ)所示：

D_{l o c a l_m o t i o n} = \frac{255}{M_{f l o w \max} - M_{f l o w \min}} (M_{f l o w} - M_{f l o w \min}) - - - (V)

式(Ⅴ)中，M_flowmax、M_flowmin分别是指当前帧图像的光流运动量级图M_flow中像素值的最大值和最小值；

将当前帧图像的运动深度图D_{local_motion}与步骤(3)得到的初始深度图融合得到当前帧图像的最终深度图D_local，结合公式如式(Ⅵ)所示：

D_local＝w_local·D_{initial_scene}+(1-w_local)·D_{local_motion}(Ⅵ)

式(Ⅵ)中，w_local是深度图融合的权值，w_local＝0.5。

根据本发明优选的，所述步骤(4)中，如果当前帧图像属于相机运动场景，首先进行全局运动补偿，然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计，得到运动估计量级图，根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物体，如果存在运动物体，将全局运动补偿后的运动估计量级图线性变换得到的运动深度图，运动深度图与初始深度图融合得到最终深度图，如果不存在运动物体，将全局运动补偿前的运动估计量图线性变换得到的运动深度图作为最终深度图，具体步骤包括：

d、如果当前帧图像属于相机运动场景，进行全局运动补偿，校正相机的运动，对当前帧图像的后一帧图像进行校准后得到变形后的图像；

e、采用光流法计算当前帧图像及步骤d得到的变形后的图像的光流运动量级图M_{flow_warp}，统计光流运动量级图中所有的运动像素，得到非零像素的数目N_{flow_warp}，得到变形运动权值W_{motion_warp}，变形公式如式(Ⅶ)所示：

W_{m o t i o n_w a r p} = \frac{N_{f l o w_w a r p}}{H \times W} - - - (V I I)

式(Ⅶ)中，H、W分别是当前帧图像的高和宽；

设定阈值Th_scenetype，0.15≤Th_scenetype≤0.25，如果通过式(Ⅶ)求取的变形运动权值W_{motion_warp}权值小于阈值Th_scenetype，则场景中不存在运动物体，进入步骤f，结束；否则，场景中存在运动物体，进入步骤g；

f、对全局运动补偿前当前帧图像的光流运动量级图M_flow进行线性变换，得到当前帧图像的最终深度图D_global：

D_{g l o b a l} = D_{g l o b a l_s t a t i c} = \frac{255}{M_{f l o w_\max} - M_{f l o w_\min}} (M_{f l o w} - M_{f l o w_\min}) - - - (V I I I)

式(Ⅷ)中，M_{flow_max}、M_{flow_min}分别指的是光流运动量级图M_flow中像素值的最大值和最小值。

如果场景中不存在运动物体，那么相机运动引起的运动视差可以恢复出图像的密集深度图。

g、首先求出全局运动补偿后当前帧图像的运动深度图D_{global_dynamic}，当前帧图像的运动深度图与光流运动量级图M_{flow_warp}之间存在着线性映射关系，全局运动补偿后当前帧图像的运动深度图D_{global_dynamic}的计算公式如式(Ⅸ)所示：

D_{g l o b a l_d y n a m i c} = \frac{255}{M_{f l o w_w a r p \max} - M_{f l o w_w a r p \min}} (M_{f l o w_w a r p} - M_{f l o w_w a r p \min}) - - - (I X)

式(Ⅸ)中，M_{flow_warpmax}、M_{flow_warpmin}分别指的是全局运动补偿后的光流运动量级图M_{flow_warp}中像素值的最大值和最小值；

h、将步骤g得到的全局运动补偿后当前帧图像的运动深度图D_{global_static}与步骤(3)得到的当前帧图像的初始深度图融合，得到当前帧图像的最终深度图D_global：计算公式如式(Ⅹ)所示：

D_global＝w_global·D_{initial_scene}+(1-w_global)·D_{global_dynamic}(Ⅹ)。

式(Ⅹ)中，w_global指的是深度图融合的权值，w_global＝0.5。

根据本发明优选的，所述阈值Th_scenetype＝0.2。

本发明的有益效果为：

本发明提供了一种全面且有效的方法，能将现有的2D视频片源转换成立体视频，利用当前帧图像的运动属性进行场景的判断，不同的场景采用不同的深度估计方法，不依赖具体的场景，计算量适中，同时结合图像的几何标注生成场景深度，更加符合实际的场景分布，可以生成效果好噪声小的深度图，从而合成效果较好的3D视频。

附图说明

图1是本发明所述的基于场景分类和几何标注的单视点视频深度获取方法的流程图；

图2是本发明实施例2所述的highway视频的截图；

图3是图2对应的运动深度图；

图4是图2对应的最终深度图。

具体实施方法

下面结合说明书附图和实施例对本发明作进一步限定，但不限于此。

实施例1

实施例2

(1)读取ChangeDetection网站下载的highway视频，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断第8帧图像属于相机静止物体运动场景还是属于相机运动场景，所述相机运动场景包括相机运动物体静止场景和相机运动物体运动场景；具体步骤包括：

a、读取highway视频，图2为highway视频的截图。获取所有的图像，求相邻帧图像之间的光流运动矢量结果，然后将第8帧图像的前7帧图像的光流运动矢量结果聚集，在原像素(x,y)处第8帧图像的光流运动矢量结果MVS(x,y)的计算公式如式(Ⅰ)所示：原像素(x,y)在第l-1个光流运动后的坐标(x_l,y_l)的计算公式如式(Ⅱ)所示；

M V S (x, y) = Σ_{l = 1}^{N - 1} M V (x_{l}, y_{l}) - - - (I)

(x_{l}, y_{l}) = R o u n d {(x, y) + Σ_{q = 1}^{l = 1} M V (x_{q}, y_{q})} - - - (I I)

式(Ⅰ)中，MV()表示相邻帧图像之间的光流运动矢量结果，N表示连续的帧图像数，8帧图像共发生7次光流运动；l＝1,2,...,7，分别表示第1,2...,7个光流运动，(x_l,y_l)表示的是原像素(x,y)在第7个光流运动后的坐标；

式(Ⅱ)中，Round{}算子是对光流运动矢量结果的所有元素取整,q＝1,2,...,7，分别表示的是第1,2...,7个光流运动，(x_q,y_q)表示原像素(x,y)在第7个光流运动后的坐标；

b、根据步骤a求取的第8帧图像光流运动矢量结果的水平运动分量MVS_u和垂直运动分量MVS_v计算出运动累积量级图M_{cum_motion}，计算公式如式(Ⅲ)所示：

M_{c u m_m o t i o n} = \sqrt{{MVS}_{u}^{2} + {MVS}_{v}^{2}} - - - (I I I)

设定阈值Th_weight＝5，统计运动累积量级图中大于阈值Th_weight的像素的数目N'，N'在所有像素中所占的百分比作为第8帧图像运动区域的权值W_m，计算公式如式(Ⅳ)所示：

W_{m} = \frac{N^{'}}{H \times W} - - - (I V)

式(Ⅳ)中，H和W分别为第8帧图像的高和宽；

c、设定相机运动阈值Th_{camera_motion}＝0.8,根据步骤b求取的第8帧图像运动区域的权值W_m与相机运动阈值Th_{camera_motion}的关系判断第8帧图像是局部运动还是全局运动，第8帧图像运动区域的权值W_m小于相机运动阈值Th_{camera_motion}，则第8帧图像是局部运动，即第8帧图像属于相机静止物体运动场景。

(2)判断是否需要估计当前帧图像的初始深度图，如果需要，进入步骤(3)，否则，直接进入步骤(4)；是否需要估计第8帧图像的初始深度图，具体步骤包括：第8帧图像是局部运动，即第8帧图像属于相机静止物体运动场景，根据步骤(1)判断第8帧图像的前一帧图像不是局部运动，则需要求第8帧图像的初始深度图；

(3)根据第8帧图像的几何标注结果求出第8帧图像的初始深度图；所述几何标注结果包括天空、水平区域和垂直区域，所述水平区域是指具有水平属性的区域，例如陆地、草坪、海面；所述垂直区域是指具有垂直属性的区域，例如树、高楼、山；具体步骤包括：(i,j)为第8帧图像任一像素，如果(i,j)属于天空，则第8帧图像的像素(i,j)的初始深度图D_{initial_scene}值为零，如果(i,j)属于水平区域，则第8帧图像的像素(i,j)的初始深度图D_{initial_scene}值为如果(i,j)属于垂直区域，则第8帧图像的像素(i,j)的初始深度图D_{initial_scene}值为max(j)_ver表示垂直区域中第j列中最大的行值。

(4)当前帧图像属于相机静止物体运动场景，采用光流法得到第8帧图像的运动深度图，与步骤(3)得到的第8帧图像的初始深度图融合；具体步骤包括：第8帧图像是局部运动，即第8帧图像属于相机静止物体运动场景，根据光流法得到第8帧图像的光流运动量级图M_flow，(MV_u,MV_v)为第8帧图像的光流运动矢量结果，对第8帧图像的光流运动量级图M_flow进行线性变换得到第8帧图像的运动深度图D_{local_motion}，图3即图2对应的运动深度图；变换公式如式(Ⅴ)所示：

D_{l o c a l_m o t i o n} = \frac{255}{M_{f l o w \max} - M_{f l o w \min}} (M_{f l o w} - M_{f l o w \min}) - - - (V)

式(Ⅴ)中，M_flowmax、M_flowmin分别是指第8帧图像的光流运动量级图M_flow中像素值的最大值和最小值；

将第8帧图像的运动深度图D_{local_motion}与步骤(3)得到的初始深度图融合得到第8帧图像的最终深度图D_local，结合公式如式(Ⅵ)所示：

D_local＝w_local·D_{initial_scene}+(1-w_local)·D_{local_motion}(Ⅵ)

式(Ⅵ)中，w_local是深度图融合的权值，w_local＝0.5。

图4即为图2对应的最终深度图。

Claims

1.一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，具体步骤包括：

2.根据权利要求1所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述步骤(1)中，读取视频序列，采用光流法对视频序列中相邻帧图像进行运动估计，得到光流运动矢量结果，根据光流运动矢量结果判断当前帧图像属于相机静止物体运动场景还是属于相机运动场景；具体步骤包括：

M V S (x, y) = Σ_{l = 1}^{N - 1} M V (x_{l}, y_{l}) - - - (I)

(x_{l}, y_{l}) = R o u n d {(x, y) + Σ_{q = 1}^{l - 1} M V (x_{q}, y_{q})} - - - (I I)

M_{c u m_m o t i o n} = \sqrt{{MVS}_{u}^{2} + {MVS}_{v}^{2}} - - - (I I I)

W_{m} = \frac{N^{'}}{H \times W} - - - (I V)

式(Ⅳ)中，H和W分别为当前帧图像的高和宽；

3.根据权利要求2所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述阈值Th_weight＝5。

4.根据权利要求2所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述相机运动阈值Th_{camera_motion}＝0.8。

5.根据权利要求1所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述步骤(2)中，判断是否需要估计当前帧图像的初始深度图，具体步骤包括：如果当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，根据步骤(1)判断当前帧图像的前一帧图像是否为局部运动，如果当前帧图像的前一帧图像是局部运动，当前帧图像的初始深度图默认为当前帧图像的前一帧图像的初始深度图，不需要估计当前帧图像的初始深度图；如果当前帧图像的前一帧图像不是局部运动，则需要求当前帧图像的初始深度图；如果当前帧图像是全局运动，则需要求出当前帧图像的初始深度图。

6.根据权利要求1所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，步骤(3)中，根据当前帧图像的几何标注结果求出当前帧图像的初始深度图，所述几何标注结果包括天空、水平区域和垂直区域，所述水平区域是指具有水平属性的区域；所述垂直区域是指具有垂直属性的区域；具体步骤包括：(i,j)为当前帧图像任一像素，如果(i,j)属于天空，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为零，如果(i,j)属于水平区域，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为如果(i,j)属于垂直区域，则当前帧图像的像素(i,j)的初始深度图D_{initial_scene}值为max(j)_ver表示垂直区域中第j列中最大的行值。

7.根据权利要求1所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，步骤(4)中，如果当前帧图像属于相机静止物体运动场景，采用光流法得到当前帧图像的运动深度图，与当前帧图像的初始深度图融合；具体步骤包括：如果当前帧图像是局部运动，即当前帧图像属于相机静止物体运动场景，根据光流法得到当前帧图像的光流运动量级图M_flow，(MV_u,MV_v)为当前帧图像的光流运动矢量结果，对当前帧图像的光流运动量级图M_flow进行线性变换得到当前帧图像的运动深度图D_{local_motion}，变换公式如式(Ⅴ)所示：

D_{l o c a l_m o t i o n} = \frac{255}{M_{f l o w \max} - M_{f l o w \min}} (M_{f l o w} - M_{f l o w \min}) - - - (V)

D_local＝w_local·D_{initial_scene}+(1-w_local)·D_{local_motion}(Ⅵ)

式(Ⅵ)中，w_local是深度图融合的权值，w_local＝0.5。

8.根据权利要求1所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述步骤(4)中，如果当前帧图像属于相机运动场景，首先进行全局运动补偿，然后利用光流法对全局运动补偿后的相邻帧图像进行运动估计，得到运动估计量级图，根据运动估计量级图中非零像素所占的比例来判断场景中是否存在运动物体，如果存在运动物体，将全局运动补偿后的运动估计量级图线性变换得到的运动深度图，运动深度图与初始深度图融合得到最终深度图，如果不存在运动物体，将全局运动补偿前的运动估计量图线性变换得到的运动深度图作为最终深度图，具体步骤包括：

W_{m o t i o n_w a r p} = \frac{N_{f l o w_w a r p}}{H \times W} - - - (V I I)

式(Ⅶ)中，H、W分别是当前帧图像的高和宽；

D_{g l o b a l} = D_{g l o b a l_s t a t i c} = \frac{255}{M_{f l o w_\max} - M_{f l o w_\min}} (M_{f l o w} - M_{f l o w_\min}) - - - (V I I I)

式(Ⅷ)中，M_{flow_max}、M_{flow_min}分别指的是光流运动量级图M_flow中像素值的最大值和最小值；

D_{g l o b a l_d y n a m i c} = \frac{255}{M_{f l o w_w a r p \max} - M_{f l o w_w a r p \min}} (M_{f l o w_w a r p} - M_{f l o w_w a r p \min}) - - - (I X)

D_{g l o b a l} = w_{g l o b a l} \cdot D_{i n i t i a l_s c e n e} + (1 - w_{g l o b a l}) \cdot D_{g l o b a l_d y n a m i c} - - - (X)

式(Ⅹ)中，w_global指的是深度图融合的权值，w_global＝0.5。

9.根据权利要求8所述的一种基于场景分类和几何标注的单视点视频深度获取方法，其特征在于，所述阈值Th_scenetype＝0.2。