WO2017201751A1

WO2017201751A1 - 虚拟视点视频、图像的空洞填充方法、装置和终端

Info

Publication number: WO2017201751A1
Application number: PCT/CN2016/083746
Authority: WO
Inventors: 朱跃生; 罗桂波; 张立明
Original assignee: 北京大学深圳研究生院
Priority date: 2016-05-27
Filing date: 2016-05-27
Publication date: 2017-11-30

Abstract

一种虚拟视点视频、图像的空洞填充方法、装置和终端，该方法包括步骤：移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。该装置与上述方法对应。本发明实施例方案极大地提高了虚拟视点视频的质量。

Description

虚拟视点视频、图像的空洞填充方法、装置和终端

技术领域

本发明涉及3D视频领域，特别涉及一种虚拟视点视频、图像的空洞填充方法、装置和终端。

背景技术

虚拟视点视频是基于三维场景相机拍摄的相机视点视频经3D变换后合成的虚拟视点下的视频。由于的相机视点视频中前景的遮挡导致视频中各帧图像中缺失被遮挡部分的背景像素信息，变换视角生成虚拟视点视频时，这些缺失的背景像素信息需要在虚拟视点中显现，由于不能由相机视点视频中获取相应的信息，导致了虚拟视点视频中产生了背景空洞的缺陷。

传统的虚拟视点视频的空洞修复的方法一般是利用视频时域或空域间的关联性获取填充信息。例如在时域上，由于前景的运动，当前帧被前景遮挡的区域可能会在其它帧会变得可见，因此可以利用背景建模的方法恢复被遮挡区域的背景。针对传统的修复方法由于虚拟视点视频各帧图像包含有前景部分和背景部分，填充时由于区分不当很可能出现利用前景的像素点来填充背景处的空洞的问题，导致修复的图像失真、视频质量差。

发明内容

基于此，有必要针对虚拟视点视频空洞填充后的失真问题，提供一种虚拟视点视频、图像的空洞填充方法、装置和终端。

一种虚拟视点视频的空洞填充方法，包括步骤：

获取相机视点视频和所述相机视点视频对应的相机视点深度图；

移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；

以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；

使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。

一种虚拟视点图像的空洞填充方法，包括：

获取相机视点图像和所述相机视点图像对应的相机视点深度图；

移除所述相机视点图像和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景图像和中间背景深度图；

以背景的像素点集填充所述前景空洞，生成背景图像和所述背景图像对应的背景深度图；

使用所述背景图像和所述背景深度图填充相机视点图像合成的虚拟视点图像的空洞。

一种虚拟视点视频的空洞填充装置，包括：

拍摄模块，用于获取相机视点视频和所述相机视点视频对应的相机视点深度图；

前景移除模块，用于移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；

背景填充模块，用于以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；

空洞填充模块，用于使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。

一种虚拟视点图像的空洞填充装置，包括：

拍摄模块，用于获取相机视点图像和所述相机视点图像对应的相机视点深度图；

前景移除模块，用于移除所述相机视点图像和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景图像和中间背景深度图；

背景填充模块，用于以背景的像素点集填充所述前景空洞，生成背景图像和所述背景图像对应的背景深度图；

空洞填充模块，用于使用所述背景图像和所述背景深度图填充相机视点图像合成的虚拟视点图像的空洞。

一种终端，包括存储器和处理器，所述存储器中存储有指令，所述指令被所述处理器执行时，可使得所述处理器执行以下步骤：

上述虚拟视点视频的空洞填充方法和装置，通过构建干净的无前景瑕疵的背景视频和背景深度图，并通过构建的背景视频和背景深度图填充虚拟视点视频中的空洞。由于背景视频中不带有前景纹理，修补时不会出现以前景块填充背景空洞的现象，避免了虚拟视点视频由于修复带来的失真缺陷，提高了虚拟视点视频的视频质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是一个实施例中的虚拟视点视频的空洞填充方法的流程图；

图2是一个实施例中生成中间背景视频和中间背景深度图的流程图；

图3是一个实施例中提取深度图中前景像素点集的流程图；

图4是另一个实施例中提取深度图中前景像素点集的流程图；

图5是一个实施例中提取前景边界和背景边界的流程图；

图6是一个实施例中生成背景视频和背景深度图的流程图；

图7是一个实施例中利用背景视频填充虚拟视频空洞的流程图；

图8是一个实施例中拓展背景视频和背景深度图的流程图；

图9是一个实施例中相机视点视频中的其中一帧图像；

图10是图9中图像对应的深度图；

图11是图9中移除了前景像素点集后的图像；

图12是图10中移除了前景像素点集后的图像；

图13是以背景像素点集进行空洞填充后的背景视频图像；

图14是以背景像素点集进行空洞填充后的背景深度图像；

图15是未填充的虚拟视点视频的一帧图像；

图16是预处理后的深度图图像；

图17是构建前景边界的最小外接矩形的展示图；

图18是前景边界迭代图；

图19是获取初始化种子点的中间图；

图20和图21分别是前景概率图和背景概率图；

图22和图23分别为提取的前景图和提取的背景图；

图24是经过深度值预测修补前后的深度图；

图25是修补背景视频的原理图；

图26是背景视频和背景深度图拓展后区域图；

图27是拓展后的背景视频和背景深度图；

图28是一个实施例中虚拟视点视频的空洞填充装置的结构框图；

图29是一个实施例中前景移除模块的结构框图；

图30是一个实施例中一种提取深度图前景模块的结构框图；

图31是一个实施例中另一种提取深度图前景模块的结构框图；

图32是一个实施例中背景填充模块的结构框图；

图33是一个实施例中空洞填充模块的结构框图；

图34是一个实施例中的虚拟视点图像的空洞填充方法的流程图；

图35是一个实施例中的拓展背景视频和背景深度图的流程图；

图36是一个实施例中的终端的结构框图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

图1中给出了一个实施例中的一种虚拟视点视频的空洞填充的方法的流程示意图，如图1所示，该方法包括如下步骤：

步骤S100：获取相机视点视频和相机视点视频对应的相机视点深度图。

相机视点视频是基于单个摄像相机的对于事件的摄录视频。相机视点视频对应的相机视点深度图实质是相机视点视频中每帧图像对应的深度图，深度图中的像素点的值代表场景中该像素点对应的实物点与摄像相机之间的距离关系，即深度值，范围是0-255，最远的深度值是0，最近的深度值是255。

其中，单个摄像相机在进行摄录时，可以是单一视点下的静态摄录，也可以是通过移动或者扭转变换视点下的动态摄录。

在一个实施例中，相机视点视频可以由相机的摄像头获取，相机视点深度图可以由相机的传感系统获取。

步骤S200：移除相机视点视频和相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图。

相机视点视频和相机视点深度图中包含有由前景部分和背景部分。前景相对于背景更靠近摄像相机。在其中一个实施例中，前景为运动的前景，前景可以是一个对象，也可以是多个。举例来说，图9为相机视点视频中其中的一帧图像，图像中的女士和男士为前景，相机视点视频中两个前景对象是运动的，舞蹈室为背景，图10为图9中图像的深度图。

可根据前景与背景与相机之间的距离差异提取前景对应的像素点集，去除提取到的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图，图11为中间背景视频中一帧图像，图12为中间背景深度图中与图11中图像对应的深度图。

步骤S300：以背景的像素点集填充前景空洞，生成背景视频和背景视频对应的背景深度图。

前景部分被移除后，基于中间背景视频和中间背景深度图进行背景建模、图像修复等填充手段填充前景空洞，生成没有空洞的完整的背景视频和背景深度图，如图13为完整的背景视频中一帧图像，图14为完整背景深度图中与图13中图像对应的深度图。

本实施例中前景空洞区域的填充是在移除了前景的前提下进行的，前景的纹理不会带入到重新构建的背景中，修复出来的背景能够保持较好的质量，可以较好的避免背景视频失真的问题。

步骤S400：使用背景视频和背景深度图填充相机视点视频合成的虚拟视点视频的空洞。

相机视点视频在相机视点深度图的渲染下，经3D映射后能够生成虚拟视点下的虚拟视频，由于视点的变换被遮挡的背景在虚拟视点下将会暴露出来，而相机视点视频缺少被遮挡的背景部分的特征点，因此，虚拟视点视频中会出现背景空洞，如图15所示，为相机视点视频的一帧图像经3D映射后的虚拟视点视图，图中的白色区域即为背景空洞。

在其中一个实施例中，上述虚拟视点视频空洞填充方法还可以是：

获取相机视点视频和相机视点视频对应的相机视点深度图。根据相机视点视频和相机视点深度图合成虚拟视点视频，去除虚拟视点视频中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图。以背景的像素点集填充前景空洞，生成背景视频和背景视频对应的背景深度图。使用背景视频和背景深度图填充虚拟视点视频的空洞。

上述虚拟视点视频填充方法，先将相机视点视频转换成虚拟视点视频，在虚拟视点视频的基础上去除前景，填充背景，形成干净的虚拟视点下的背景视频，用该背景视频填充虚拟视点视频的空洞。

本实施例中，使用干净的无前景瑕疵的背景视频，填补虚拟视点视频中的背景空洞，该背景视频可以是基于原始相机视点视频形成的，也可以是基于虚拟视点视频形成的，只要是使用干净的背景视频去填充空洞即可克服传统技术直接对虚拟视点视频进行图像修复的视频失真的缺陷，有效避免了由于不能准确辨别前景和背景而误用前景部分的特征点来填充背景空洞导致的虚拟视频失真的问题，虚拟视频质量更好。

在其中一个实施例中，如图2所示，步骤S200包括：

步骤S210：提取相机视点深度图中的前景对应的像素点集。

步骤S220：确定相机视点视频中前景对应的像素点集。

通过相机视点深度图中的前景对应的像素点集的位置映射，可以确定出相机视点视频中前景对应的像素点集。

步骤S230：移除提取的相机视点深度图中的像素点集和相机视点视频中的像素点集。

移除步骤S210和步骤S220中获取到的像素点集，分别得到带有前景空洞的背景视频和带有前景空洞的深度图，定义带有前景空洞的背景视频为中间背景视频，带有前景空洞的深度图为中间背景深度图。

在深度图中，前景与背景的深度值存在较大的差异，本实施例通过先提取深度图中的前景，根据提取的深度图中的前景准确移除相机视点视频以及相机视点深度图中的前景像素点集，前景提取和移除更加准确、高效。

在其中一个实施例中，如图3所示，步骤S210包括：

步骤S212：提取相机视点深度图中的前景边界。

在其中一个实施例中，在步骤S212之前还包括步骤S211：滤波和腐蚀处理相机视点深度图。

在深度图中同一个物体的深度值应该是连续的，但由于噪声等因素的影响，可能会使深度图中同一物体深度值并不连续即出现不真实边缘的现象，这种不真实的边缘会对后续的前景提取造成干扰，影响前景提取的准确度。对相机视点深度图进行滤波处理可以消减甚至消除不真实的边缘。图16为滤波后的相机视点深度图。对比图10的未滤波的深度图，图16中同一物体具有平滑的效果，而边界得以保留。

由于前景目标的边界可能位于背景区域，在其中一个实施例中，对相机视点深度图进行形态学腐蚀运算，使前景腐蚀收缩以保证后续提取的边界位于前景内部。

相机视点深度图经上述滤波和腐蚀后，再进行前景边界提取，不仅能够避免不真实边界的干扰，而且经腐蚀运算后，能够确保提取的前景边界位于前景内部，提取的边界更加准确。

在其中一个实施例中，经滤波和腐蚀处理后，使用Canny边缘检测方法提取相机视点深度图中前景边界。

步骤S213：根据前景边界采用迭代的方法依次生成次生边界，次生边界与其原生边界相对应的点的深度值差值小于预设范围；

其中，前景边界和次生边界包含的像素点集构成了相机视点深度图中前景对应的像素点集。

由于同一个前景目标中，相邻间像素具有相近的深度值，基于步骤S212中提取的前景边界，查询与前景边界中包含的点的深度值差值小于预设范围且距离小于设定值的点，查询的点生成前景边界的次生边界，再以该次生边界为原生边界生成第二次生边界，以此类推，不断拓展边界直至获取整个前景为止。

在其中一个实施例中，根据原生边界生成次生边界之前，还包括：

构建原生边界的最小外接矩形，计算该最小外接矩形内所有点的最大类间方差法对应的阈值。

查询与前景边界中包含的点的深度值差值小于预设范围且距离小于设定值的点为查询最小外接矩形内的点的深度值，并将查询的深度值与最大类间方差法对应的阈值做对比，大于该阈值且与前景边界中对应点的距离小于预设值的点为次生边界的点。通过构建最小外接矩形可更加准确设定阈值，查询结果更加准确。减少了查找的范围、提高了查找的效率。

具体迭代原理如下：

上述前景边界和次生边界可表示为一个点集，这些边界可以生长成前景目标。假设T表示未分配的点集，该点集至少与一个前景目标相邻，点集T的特性如下公式所示：

其中N(x)表示直接与像素x相邻的点集，PMBR_i表示F_i的最小外接矩形(MBR)，获取的最小外接矩形如图17所示。

如果N(x)与其中一个前景目标F_j有重叠部分，那么x与它的交叠区域的距离定义为：

如果像素x满足以下条件，则将它新添到前景目标F_j中

δ(x)＜β，and Z(x)＞Otsu(PMBR_j)

其中β是一个小值，Otsu函数表示最大类间方差法对应的阈值，深度值大于该阈值作为判断该像素是前景目标的一个条件。这两个条件来自深度图的特性：同一个前景目标里的相邻像素具有相近的深度值，前景目标的深度值大于它所覆盖的背景的深度值。

新的前景目标作为下一次迭代过程的输入，直到

迭代过程才结束。迭代过程如图18所示。

在其中一个实施例中，如图4所示，步骤S210包括：

步骤S214：提取相机视点深度图中前景边界和背景边界，如图19所示，内侧的黑色边线为前景边界，外侧的白色边线为背景边界。

步骤S215：以前景边界和背景边界作为种子点计算相机视点深度图中前景/背景的概率分布，进而确定视点深度图中前景对应的像素点集。

在其中一个实施例中，采用随机游走分割算法对前景边界和背景边界种子点做随机游走分割，计算相机视点深度图中前景/背景的概率分布，进而确定前景对应的像素点集。对种子点进行处理的算法不仅限于随机游走分割算法，其他能够根据种子点计算得到前景/背景的概率分布的算法均可。

令前景边界种子点和背景边界种子点的标签集合为S＝{s₁，s₂}，其中s₁和s₂分别表示前景目标和背景的标签。有了初始化种子点，各个点为前景或背景概率分布图可通过如下求解公式获得：

L_Ux^s＝-B^Tm^s

其中：L_U是非种子节点对应的权重系数，B^T为转置矩阵，另外，令节点v_i首次游走到标签s的概率为

定义种子节点的标签函数为

其中s∈S，S＝{S₁，S₂}，为每个标签s定义|V_M|×1维向量m^s，其节点v_j∈V_M处的值为

如图20和图21分别为游走者到前景标签和背景标签的概率。灰度图中的值越高代表出现的概率越高，最高概率值的那个标签作为非种子节点的标签，前景和背景的分割结果如图22和图23所示。

在其中一个实施例中，如图5所示，在步骤S214包括：

步骤S2141：滤波处理相机视点深度图。该步骤的处理方法与步骤S211中的滤波处理方式相同。

步骤S2142：腐蚀处理相机视点深度图并提取前景边界。该步骤的处理方法与步骤S211中的腐蚀处理方式和步骤S212中的提取前景边界的方式相同。

步骤S2143：膨胀处理相机视点深度图并提取背景边界。使用形态学膨胀操作保证提取背景边界落在背景区域里，确保了背景边界的提取的准确度。

在其中一个实施例中，步骤S300为对步骤S200中的中间背景视频和中间背景深度图进行背景建模，通过中间背景视频和中间背景深度图中的图像之间背景像素点集的相互补充来填充前景空洞区域。

视频是基于多帧图像的时间函数，中间背景图像中包括不同时刻的多帧图像。在其中一个实施例中，前景是运动的前景，随着前景的运动，在一个时刻前景遮挡的背景区域可能在另一个时刻的图像中显现出来。背景建模即利用上述特性，通过图像之间背景像素点集的相互补充来填充前景空洞区域，生成干净的无前景瑕疵的背景视频和背景深度图。

本实施例的背景建模是基于移除了前景的中间背景视频和中间背景深度图进行的，不会出现误用前景的图像块填充空洞而造成生成的背景视频失真的现象。

在其中一个实施例中，如图6所示，相机视点视频为动态相机视点的视频。

在对中间背景视频和中间背景深度图进行背景建模的步骤之前，还包括：

步骤S310：获取相机视点视频中不同视点下的视频段的映射关系。

动态相机视点视频为相机在非静止状态下摄录的相机视点视频，相机视点为动态的。对于摄像机非静止的情形，如果映射的两个时刻对应不同的相机视点，则无法直接进行背景映射。为了适应相机的动态情形，本实施例的背景建模为带有运动补偿的改进的背景建模。

具体为：使用SURF检测和RANSAC算法获取相机视点视频中不同视点下的视频段的映射关系。使用SURF检测和描述当前帧和参考帧的特征点。为了提高鲁棒性，使用RANSAC算法优化特征点对的匹配。获取特征点对匹配后，便可得到单应矩阵，接着把其一时刻的模型参数通过投射变换映射到另一时刻上。

对中间背景视频和中间背景深度图进行背景建模，包括：

步骤320：当相互补充的两个图像为不同视点下的图像时，根据映射关系将两个图像对应的模型参数映射到同一视点下，映射后的两个图像中的背景像素点集相互补充以填充前景空洞区域。

具体的，第一图像和第二图像为可以相互补充的图像，当第一图像和第二图像分别对应不同视点下的视频段时，根据映射关系，将第一图像的对应的模型参数映射到第二图像视点下。以映射后的第一图像的背景像素点集补充第二图像的部分或者全部前景空洞区域。

在其中一个实施例中，背景建模的模型为高斯混合模型，具体为两个相邻时刻的背景建模，高斯分布组成为：

其中p(I_x，t)表示时刻t坐标x处像素点的概率密度，η为高斯函数，I_x，t表示时刻t坐标x处像素点的像素值，μ_x，i，t和

分别表示时刻t坐标x处像素点的均值和方差，w_x，i，t表示时刻t坐标x处像素点的第i个高斯分布权重，并满足

B(x_t)表示时刻t坐标x处像素点的背景掩膜，当模型为空时，B(x_t)＝0，当模型非空时，B(x_t)＝1。

背景模型的详细处理过程如下：

首先，在时刻t₀，对所有的高斯模型进行初始化，具体如下述公式：

其中σ₀是一个预设的大值，F(x_t)表示时刻t坐标x处像素点的前景掩膜，如果检测出像素x_t是前景像素，F(x_t)＝1，否则，F(x_t)＝0。

其次，对于下一帧视频，使用投射变换把所有t-1时刻上的背景模型参数映射到t时刻上。使用单应矩阵H_t：t-1，求出t时刻的坐标x_t对应到的t-1时刻坐标x′_t-1，相应的，t时刻坐标x_t处像素点的背景模型参数更新自t-1时刻坐标x′_t-1处像素点，具体如下述公式：

μ_x，i，t-1＝μ_{x′，i，t-1}

w_x，i，t-1＝w_{x′，i，t-1}

B(x_t-1)＝B(x′_t-1)

如果当前像素点不是前景像素点(F(x_t)＝0)，则更新背景模型，更新的过程如下：

当前像素点与K个高斯模型进行匹配，对于模型i，如果满足条件

则停止匹配过程。匹配上的高斯模型更新如下：

μ_x，i，t＝(1-ρ)μ_x，i，t-1+ρI_x，t

w_x，i，t＝(1-α)w_x，i，t-1+α

其它的高斯模型更新如下

μ_x，i，t＝μ_x，i，t-1

w_x，i，t＝(1-α)w_x，i，t-1

其中

α是学习率。

然而，当所有的高斯模型无法与当前像素点匹配上，则引入一个新的高斯模型σ_x，t＝σ₀，ω_x，t＝w₀，其中w₀是一个小的权值用以剔除那些ω/σ值小的高斯模型。其它高斯模型的均值和方差保持不变，K个高斯模型的权重进行归一化

剩余的视频帧同样使用上述方法来处理，最后K个高斯模型根据ω/σ值进行降序排序，时刻t背景像素点的值bp(x_t)可由以下公式获取：

bp(x_t)＝μ_x，1，t，如果B(x_t)＝1。

在其中一个实施例中，在步骤S310和步骤S320的以动态背景建模的方式对前景空洞区域进行填充后，还包括有如下优化步骤，用于填补经步骤S310和步骤S320处理后仍未被填充的空洞部分。

步骤S330：根据中间背景深度图中空洞周围的深度值预测空洞处的深度值，并根据预测深度值修补中间背景深度图中的空洞。

在深度图中，由于没有前景的干扰，可以认为深度图的空洞区域与周围背景同处一个平面，因此，可以认为修补空洞部分的深度值为与周围背景深度值一致或者与周围背景深度图线性变化。基于上述特性，对空洞处的深度值进行预测，具体预测方式如下：

由于预测的深度图可能存在误差或不够平滑的问题，在一个实施例中通过建立能量函数，并获取使能量函数最小的标签值f，如下述公式：

其中N是相互接邻的点对集合；V(f_p，f_q)是相邻像素的两个标签f_p和f_q之间的代价，表示的是不连续性的代价；D_p(f_p)是分配的标签f_p与像素p之间的代价，表示的是数据代价。这里V(f_p，f_q)和D_p(f_P)定义为

V(f_p，f_q)＝min((f_p-f_q)²，DISC_K)

D_p(f_p)＝λmin((Z_p-f_p)²，DATA_K)

其中λ是权重系数，DISC_K和DATA_K控制着代价惩罚何时停止。通过深度值预测修补深度图的效果对比如图24所示。

步骤S340：使用添加深度值限制的图像修复算法修补填充后的中间背景视频。

在其中一个实施例中，使用Criminisi算法(Criminisi等人提出的基于纹理特征和结构信息的图像修复算法)修复中间背景视频中的空洞。在Criminisi算法中添加深度值限制，通过深度值限制如果检测到待添加的图像块为前景块，则该待添加块将剔除，有效防止了前景可能会被用来填充空洞区域，导致修复的图像存在瑕疵。

具体修复方法如下：

如图25所示为Criminisi算法的原理：对于一张输入图像I，Ω是未知区域(空洞区域)，源区域Ф定义为：

Ф＝I-Ω

空洞区域Ω的边界标记为δΩ，在边界点p∈δΩ，以p为中心点的图像块Ψ_p的优先级计算如下

P(p)＝C(p)gD(p)

置信度项(confidence term)C(p)和数据项(data term)D(p)定义如下

其中|Ψ_p|是Ψ_p的面积，α是归一化系数(比如，对于典型的灰度图像α＝255)，n_p是在p点垂直于边界δΩ的元矢量，

表示图像结构的方向。C(p)表示图像块Ψ_p属于非空洞区域像素的百分比，初始化时，对于空洞区域像素C(q)＝0，其他区域C(q)＝1。当边界δΩ所有点的优先级确定后，找出优先级最高的点

对应的图像块为

然后找出与

最相似的图像块

填充，

的选择方式如下：

其中，图像块Ψ_a和Ψ_b的距离d(Ψ_a，Ψ_b)使用两个图像块已知部分像素差的平方和(Sum of Squared Differences，SSD)。

当图像块

被填充后，

里的C(p)更新方式如下

由于前景目标可能会被用来填充空洞区域，导致修复的图像存在瑕疵。因此，在上述Criminisi算法方法中，在搜索与

最相似的图像块

时，对搜索区域Ф′加入深度信息限制条件，排除与Ф′深度值偏差大的区域，只在深度值相近的区域内寻找最匹配图像块。搜索区域Ф′定义为Ф′＝Ф-Y。

其中在一个实施例中，Y是深度值小于

的区域，ξ₃是一个小于1 的缩放系数，在一个实施例中，ξ₃为0.85或者0.95或者0.85与0.95之间任一值。在一个实施例中Y的深度值大于

的区域，ξ₄是一个大于1的缩放系数，在一个实施例中，ξ₄为1.05或者1.15或者1.05与1.15之间任一值；

是图像块

深度值的平均值，由以下方式获得：

在搜索区域Ф′寻找与

最相似的图像块

其中

在其中一个实施例中，当ξ₃＝0.9，ξ₄＝1.1，得到如图13所示的背景视频。

在其中一个实施例中，对中间背景视频和中间背景深度图中前景空洞的填充可以单独由步骤S330和步骤S340来完成，不经过步骤S310和步骤S320中的背景建模。

在其中一个实施例中，如图7所示，步骤S400包括：

步骤S410：在背景深度图的渲染下以第一扭曲参数3D扭曲背景视频，生成虚拟背景视频。在其中一个实施例中，第一扭曲参数为扭曲的角度或者偏移的位移或者扭曲角度的同时偏移设定位移。

步骤S420：在相机视点深度图的渲染下以第一扭曲参数3D扭曲相机视点视频，生成虚拟视点视频。以与步骤S410相同扭曲参数3D扭曲相机视点视频，生成虚拟视点视频。

步骤S430：使用虚拟背景视频填充虚拟视点视频中的空洞。

经过相同的3D扭曲，虚拟背景视频每帧图像与虚拟视点视频的每帧图像一一对应，将虚拟背景视频的图像帧同步映射到虚拟视点视频中对应图像帧中，即可对虚拟视点视频中的空洞进行填充。使用干净无瑕疵的背景视频填充虚拟视点视频中的空洞，不会出现使用前景图像块填充空洞的现象，空洞填充效果更好，避免了视频失真的问题，另外，尤其在虚拟视点视频为对帧多视角视频时，利用背景视频对空洞进行填充，只需将背景视频图像帧一一映射即可，空洞填充效率高，解决了传统的直接修复虚拟视点视图中的需要重复填充的问题。

在其中一个实施例中，在步骤S400之前还包括步骤S500，步骤S500对步骤S300中的背景视频和背景深度图进行背景边缘拓展。

由于拍摄范围有限，3D扭转后新视角的虚拟视点视频中部分边界区域无法在依据相机视点视频得到的背景视频中找到对应的区域，在经过3D扭曲变化后，虚拟视点视图部分边界也会存在较大的空洞，如图15所示。本实施例中对背景视频和背景深度图进行背景边缘拓展。本实施例中的步骤S400为使用拓展后的背景视频和背景深度图填充相机视点视频合成的虚拟视点视频的空洞，有效填充了虚拟视点视频中边界空洞。

在其中一个实施例中，如图8所示，步骤S500包括：

步骤S510：将虚拟视点视频反向映射到相机视点下，得到拓展边界。具体为，首先把虚拟视点视频方向映射到全局坐标，然后在投影变换到相机视点下，也就是投影变换到背景视频视点下，进而得到拓展边界，如图26所示，上边缘和左侧边缘为拓展的区域。

步骤S520：根据拓展边界拓展背景视频和背景深度图。

拓展背景视频和背景深度图至其延伸至拓展边界。在其中一个实施例中，拓展背景视频的方法与步骤S340描述的方法一致，拓展背景深度图与步骤S330描述的方法一致，如图27所示，为拓展后的背景视频和背景深度图。

在一个实施例中，如图28所示，提出了一种虚拟视点视频的空洞填充的装置，包括：

拍摄模块610，用于获取相机视点视频和相机视点视频对应的相机视点深度图。

前景移除模块620，用于移除相机视点视频和相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图。

背景填充模块630，用于以背景的像素点集填充前景空洞，生成背景视频和背景视频对应的背景深度图。

空洞填充模块640，用于使用背景视频和背景深度图填充相机视点视频合成的虚拟视点视频的空洞。

在其中一个实施例中，如图29所示，前景移除模块620包括：

提取深度图前景模块621，用于提取相机视点深度图中的前景对应的像素点集。

提取视频前景模块622，用于确定相机视点视频中前景对应的像素点集。

移除模块623，用于移除提取相机视点深度图中的像素点集和相机视点视频中的像素点集。

在其中一个实施例中，如图30所示，提取深度图前景模块621包括：

提取前景边界模块6211，用于提取相机视点深度图中前景边界。

迭代模块6212，用于根据前景边界采用迭代的方法依次生成次生边界，次生边界与其原生边界相对应的点的深度值差值小于预设范围。

其中，前景边界和次生边界包括的像素点集构成了前景对应的像素点集。

在其中一个实施例中，如图31所示，提取深度图前景模块621包括：

前景边界和背景边界提取模块6213：用于提取相机视点深度图中的前景边界和背景边界。

概率计算模块6214，用于根据前景边界和背景边界作为种子点计算相机视点深度图中前景/背景的概率分布，进而确定前景对应的像素点集。

在其中一个实施例中，提取前景边界模块还用于滤波相机视点深度图以及腐蚀处理相机视点深度图。

在其中一个实施例中，前景边界和背景边界提取模块还用于滤波相机视点深度图；腐蚀处理相机视点深度图并提取前景边界；膨胀处理相机视点深度图并提取背景边界。

在其中一个实施例中，背景填充模块630包括：

背景建模模块，用于对中间背景视频和中间背景深度图进行背景建模，通过中间背景视频和中间背景深度图中的图像之间背景像素点集的相互补充来填充前景空洞区域。

在其中一个实施例中，相机视点视频为动态相机视点的视频。

如图32所示，背景填充模块还包括：

运动补偿模块631，用于获取相机视点视频中不同视点下的视频段的映射关系。

背景建模模块632，还用于当相互补充的两个图像为不同视点下的图像时，根据映射关系将两个图像对应的模型参数映射到同一视点下，映射后的两个图像中的背景像素点集相互补充以填充前景空洞区域。

在其中一个实施例中，背景填充模块，还包括：

背景深度图修复模块633，用于根据中间背景深度图中的像素点集预测空洞处深度值，并根据预测深度值修补填充后的中间背景深度图。

背景视频修复模块634，用于使用添加深度值限制的图像修复算法修补填充后的中间背景视频。

在其中一个实施例中，如图33所示，空洞填充模块640包括：

背景视频扭曲模块641，用于在背景深度图的渲染下以第一扭曲参数3D扭曲背景视频，生成虚拟背景视频。

相机视点视频扭曲模块642，用于在相机视点深度图的渲染下以第一扭曲参数3D扭曲相机视点视频，生成虚拟视点视频。

填充模块643，用于使用虚拟背景视频填充虚拟视点视频中的空洞。

在其中一个实施例中，空洞填充模块还包括：

背景拓展模块，用于将虚拟视点视频反向映射到相机视点下，得到拓展区域；根据拓展区域拓展背景视频和背景深度图。

填充模块，用于使用拓展的背景视频和拓展的背景深度图填充虚拟视点视频中的空洞。

在一个实施例中，如图34所示，还提供了一种虚拟视点图像的空洞填充方法，包括如下步骤：

步骤710：获取相机视点图像和所述相机视点图像对应的相机视点深度图。相机视点图像为相机拍摄的图像。如图9为相机视点图像，图像中的女士和男士为前景，图10为图9中图像的深度图。

步骤720：移除所述相机视点图像和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景图像和中间背景深度图。具体方法与步骤S200以及步骤S200的从属步骤中针对与视频中前景移除的方法相同。

在其中一个实施例中，还可以先将相机视点图像转换成虚拟视点图像，在虚拟视点图像的基础上去除前景，填充背景，形成干净的虚拟视点下的背景图像，用该背景图像填充虚拟视点图像的空洞。

步骤730：以背景的像素点集填充所述前景空洞，生成背景图像和所述背景图像对应的背景深度图。

在其中一个实施例中，根据中间背景深度图中的空洞周围的深度值预测空洞处的深度值，并根据预测深度值填充中间背景深度图中的前景空洞。具体深度值预测的方法与步骤S330中陈述的方法一致。使用添加深度值限制的图像修复算法填充中间背景图像中的前景空洞。其中，具体的添加深度值限制的图像修复算法与步骤S340中陈述的方法一致。

步骤740：使用所述背景图像和所述背景深度图填充相机视点图像合成的虚拟视点图像的空洞。

在背景深度图的渲染下以第一扭曲参数3D扭曲背景图像，生成虚拟背景图像。在相机视点深度图的渲染下以第一扭曲参数3D扭曲相机视点图像，生成虚拟视点图像。使用虚拟背景图像填充虚拟视点图像中的空洞。

在其中一个实施例中，如图35所示，在步骤S740之前还包括步骤S750，步骤S750对步骤S730中的背景图像和背景深度图进行背景边缘拓展。使用拓展后的背景图像和背景深度图填充相机视点图像合成的虚拟视点图像的空洞，有效填充了虚拟视点图像中边界空洞。

如图36所示，还提供了一种终端800，包括通过系统总线连接的处理器、图像处理单元、存储介质、内存、网络接口、显示屏幕和输入设备。其中，存储介质中存储有操作系统，还存储有计算机可读指令，该计算机可读指令被处理器执行时，可实现一种虚拟视频的空洞填充方法。该处理器用于提供计算和控制能力，支撑整个终端800运行。终端800中的图像处理单元用于进行图像压缩，增强和复原，匹配、描述和识别，还可以进行图像的运算的腐蚀和膨胀运算。内存用于为存储介质中的虚拟视点视频的空洞填充装置的运行提供环境。显示屏幕显示图像和视频。输入设备用于接收用户输入的命令或数据等。可以理解的是，图34中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的终端的限定，具体的终端可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性的计算机可读取存储介质中，如本发明实施例中，该程序可存储于计算机系统的存储介质中，并被该计算机系统中的至少一个处理器执行，以实现包括如上述各方法的实施例的流程。其中，的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

一种虚拟视点视频的空洞填充方法，包括：

获取相机视点视频和所述相机视点视频对应的相机视点深度图；

移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；

以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；

使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。
根据权利要求1所述的方法，其特征在于，所述移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集的步骤，包括：

提取所述相机视点深度图中前景对应的像素点集；

确定所述相机视点视频中前景对应的像素点集；

移除提取所述相机视点深度图中的所述像素点集和所述相机视点视频中的所述像素点集。
根据权利要求2所述的方法，其特征在于，所述提取所述相机视点深度图中的前景对应的像素点集的步骤，包括：

提取所述相机视点深度图中的前景边界；

根据所述前景边界采用迭代的方法依次生成次生边界，所述次生边界与其原生边界相对应的点的深度值差值小于预设范围；

其中，所述前景边界和所述次生边界包含的像素点集构成了前景对应的像素点集。
根据权利要求2所述的方法，其特征在于，所述提取所述相机视点深度图中的前景对应的像素点集的步骤，包括：

提取所述相机视点深度图中的前景边界和背景边界；

以所述前景边界和所述背景边界作为种子点计算相机视点深度图中前景/背景的概率分布，进而确定前景对应的像素点集。
根据权利要求1所述的方法，其特征在于，所述以背景的像素点集填充所述前景空洞区域的步骤，包括：

对所述中间背景视频和所述中间背景深度图进行背景建模，通过所述中间背景视频和所述中间背景深度图中的图像之间背景像素点集的相互补充来填充所述前景空洞区域。
根据权利要求5所述的方法，其特征在于，所述相机视点视频为动态相机视点的视频；

在所述对所述中间背景视频和所述中间背景深度图进行背景建模的步骤之前，还包括：

获取所述相机视点视频中不同视点下的视频段的映射关系；

所述对所述中间背景视频和所述中间背景深度图进行背景建模，还包括：

当相互补充的两个图像为不同视点下的图像时，根据所述映射关系将两个图像对应的模型参数映射到同一视点下，映射后的两个图像中的背景像素点集相互补充以填充所述前景空洞。
根据权利要求5所述的方法，其特征在于，在所述对所述中间背景视频和所述中间背景深度图进行背景建模步骤之后，还包括：

根据中间背景深度图中的空洞周围的深度值预测空洞处的深度值，并根据预测深度值修补填充后的所述中间背景深度图中的空洞；

使用添加深度值限制的图像修复算法修补填充后的所述中间背景视频。
根据权利要求1所述的方法，其特征在于，所述使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞的步骤，包括：

在所述背景深度图的渲染下以第一扭曲参数3D扭曲所述背景视频，生成虚拟背景视频；

在所述相机视点深度图的渲染下以第一扭转参数3D扭曲所述相机视点视频，生成所述虚拟视点视频；

使用所述虚拟背景视频填充所述虚拟视点视频中的空洞。
根据权利要求8所述的方法，其特征在于，在所述使用所述虚拟背景视频填充所述虚拟视点视频中的空洞的步骤之前，还包括：

将所述虚拟视点视频反向映射到相机视点下，得到拓展边界；

根据所述拓展边界拓展所述背景视频和所述背景深度图；

使用所述虚拟背景视频填充所述虚拟视点视频中的空洞的步骤为：使用拓展的所述背景视频和拓展的所述背景深度图填充所述虚拟视点视频中的空洞。
一种虚拟视点图像的空洞填充方法，包括：

获取相机视点图像和所述相机视点图像对应的相机视点深度图；

移除所述相机视点图像和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景图像和中间背景深度图；

以背景的像素点集填充所述前景空洞，生成背景图像和所述背景图像对应的背景深度图；

使用所述背景图像和所述背景深度图填充相机视点图像合成的虚拟视点图像的空洞。
一种虚拟视点视频的空洞填充的装置，其特征在于，包括：

拍摄模块，用于获取相机视点视频和所述相机视点视频对应的相机视点深度图；

前景移除模块，用于移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；

背景填充模块，用于以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；

空洞填充模块，用于使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。
根据权利要求11所述的装置，其特征在于，所述前景移除模块包括：

提取深度图前景模块，用于提取所述相机视点深度图中前景对应的像素点集；

提取视频前景模块，用于确定所述相机视点视频中前景对应的像素点集；

移除模块，用于移除提取所述相机视点深度图中的所述像素点集和所述相机视点视频中的所述像素点集。
根据权利要求12所述的装置，其特征在于，所述提取深度图前景模块包括：

提取前景边界模块，用于提取所述相机视点深度图中前景边界；

迭代模块，用于根据所述前景边界采用迭代的方法依次生成次生边界，所述次生边界与其原生边界相对应的点的深度值差值小于预设范围；

其中，所述前景边界和所述次生边界包括的像素点集构成了前景对应的像素点集。
根据权利要求12所述的装置，其特征在于，所述提取深度图前景模块包括：

前景边界和背景边界提取模块：用于提取所述相机视点深度图中的前景边界和背景边界；

概率计算模块，以根据所述前景边界和所述背景边界作为种子点计算相机视点深度图中前景/背景的概率分布，进而确定前景对应的像素点集。
根据权利要求11所述的装置，其特征在于，所述背景填充模块包括：

背景建模模块，用于对所述中间背景视频和所述中间背景深度图进行背景建模，通过所述中间背景视频和所述中间背景深度图中的图像之间背景像素点集的相互补充来填充所述前景空洞区域。
根据权利要求15所述的装置，其特征在于，所述相机视点视频为动态相机视点的视频；

所述背景填充模块还包括：

运动补偿模块，用于获取所述相机视点视频中不同视点下的视频段的映射关系；

所述背景建模模块，还用于当相互补充的两个图像为不同视点下的图像时，根据所述映射关系将两个图像对应的模型参数映射到同一视点下，映射后的两个图像中的背景像素点集相互补充以填充所述前景空洞区域。
根据权利要求15所述的装置，其特征在于，所述背景填充模块，还包括：

背景深度图修复模块，用于根据中间背景深度图中的空洞周围的深度值预测空洞处的深度值，并根据预测深度值修补填充后的所述中间背景深度图中的空洞；

背景视频修复模块，用于使用添加深度值限制的图像修复算法修补填充后的所述中间背景视频。
根据权利要求11所述的装置，其特征在于，所述空洞填充模块包括：

背景视频扭曲模块，用于在所述背景深度图的渲染下以第一扭曲参数3D扭曲所述背景视频，生成虚拟背景视频；

相机视点视频扭曲模块，用于在所述相机视点深度图的渲染下以第一扭曲参数3D扭曲所述相机视点视频，生成所述虚拟视点视频；

填充模块，用于使用所述虚拟背景视频填充所述虚拟视点视频中的空洞。
根据权利要求18所述的装置，其特征在于，所述空洞填充模块还包括：

背景拓展模块，用于将所述虚拟视点视频反向映射到相机视点下，得到拓展区域；根据所述拓展区域拓展所述背景视频和所述背景深度图；

所述填充模块，用于使用拓展的所述所述背景视频和拓展的所述背景深度图填充所述虚拟视点视频中的空洞。
一种虚拟视点图像的空洞填充装置，其特征在于，包括：

拍摄模块，用于获取相机视点图像和所述相机视点图像对应的相机视点深度图；

前景移除模块，用于移除所述相机视点图像和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景图像和中间背景深度图；

背景填充模块，用于以背景的像素点集填充所述前景空洞，生成背景图像和所述背景图像对应的背景深度图；

空洞填充模块，用于使用所述背景图像和所述背景深度图填充相机视点图像合成的虚拟视点图像的空洞。
一种终端，包括存储器和处理器，所述存储器中存储有指令，所述指令被所述处理器执行时，可使得所述处理器执行以下步骤：

获取相机视点视频和所述相机视点视频对应的相机视点深度图；

移除所述相机视点视频和所述相机视点深度图中的前景对应的像素点集，形成带有前景空洞的中间背景视频和中间背景深度图；

以背景的像素点集填充所述前景空洞，生成背景视频和所述背景视频对应的背景深度图；

使用所述背景视频和所述背景深度图填充相机视点视频合成的虚拟视点视频的空洞。