CN113393467B

CN113393467B - 一种基于混合显著性检测的点云视频自适应切分方法

Info

Publication number: CN113393467B
Application number: CN202110684433.3A
Authority: CN
Inventors: 黎洁; 张聪; 李奇越; 王枭; 韩玲; 王慧宇; 陈勇; 彭涛
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2021-06-21
Filing date: 2021-06-21
Publication date: 2022-10-28
Anticipated expiration: 2041-06-21
Also published as: CN113393467A

Abstract

本发明公开了一种基于显著性检测的点云视频自适应切分方法，其步骤包括：1、将点云视频在空间上进行3D均匀切分；2、将点云视频在时间上进行分组，每个帧组是切分的单位；3、对每个帧组的第一帧内的切块进行静态显著性检测，得到切块内部离散值和切块之间的块间差异值；4、对每个帧组的相邻帧内切块进行运动估计，得到帧间的切块变化性；5，整合帧组内所有帧内切块的静态显著性和切块变化性；6、采用自上而下的层次聚类将帧组内的切块聚类得到切块簇。本发明可以预测用户视角关注点云视频的显著性区域，进而通过聚类得到切块簇，通过调整切块簇的传输码率从而减小点云视频的传输数据量，提高用户观看点云视频的体验。

Description

一种基于混合显著性检测的点云视频自适应切分方法

技术领域

本发明涉及点云视频流媒体传输领域，具体来说是一种点云视频在传输过程中的数据量优化方法。

背景技术

点云是一种三维影像的表现形式，通过大量分布在三维空间中的点构成物体，它可以与虚拟现实或增强现实技术结合在一起，实现高自由度的沉浸式视频体验。然而由于点云存储了更多维度的信息，所以它的数据量比普通视频更高，因此点云视频的传输对带宽的要求十分大，这也是目前点云视频发展的瓶颈。因此如何尽可能降低点云视频传输过程中的数据量是目前研究的热点方向。

显著性检测是指过智能算法模拟人的视觉特点，提取图像中的显著区域(即人类感兴趣的区域)，它可将有限的计算资源分配给图像视频中更重要的信息，同时引入视觉显著性的结果更符合人的视觉认知需求。进而可以给例如目标识别，视频压缩等技术应用带来重要的帮助。

荷兰国家数学与计算机科学研究中心的Shishir等人设计并实现了一种以用户视角为中心的点云视频的低复杂度切分算法(MM'20:The 28th ACM InternationalConference on Multimedia，2020，“User Centered Adaptive Streaming of DynamicPoint Clouds with Low Complexity Tiling”)。作者首先收集了26个实验参与者在观看点云视频过程中的六自由度的运动轨迹，包括位置的变化和头部运动的变化，然后通过用户视角热点分布图进行切分成四个切块，在传输过程中根据网络环境和用户视角位置对不同切块进行码率调节，从而使得用户体验质量(Quality of Experience，QoE)最大化，实验结果表示相比基准方案，该切分方案能在提高传输的QoE同时降低数据量传输。但是此方案在切分时需要事先获得用户视角数据，这在直播等环境下显然不实际，而且方案并没有考虑视频内容本身对于切分的影响。

青岛大学的魏计鹏等人提出了一种基于深度图像增益的RGB-D显著性物体检测方法(计算机与现代化，2021，基于深度图像增益的RGB-D显著性物体检测方法)。作者通过在双分支网络结构的基础上增加一个增益子网，采用显著图作差的方法获得深度图片为显著性检测带来的增益，作为增益子网预训练的伪GT，获得图像的RGB特征、深度特征和深度增益信息，最终将三分支的特征进行融合得到最终的显著性物体检测的结果。结果显示在多个公开的数据集上，该方法与其他显著性物体检测方法相比，多个评价指标上处于领先地位。但是此显著性检测方法针对单帧图片而不是连续的视频，同时深度学习算法需要依赖大量数据集训练，无法满足点云视频流媒体实时传输的要求。

武汉大学的丁晓英等人提出了一种局部和全局融合的显著性检测算法(IEEETRANSACTIONS ON IMAGE PROCESSING，2019，Point Cloud Saliency Detection by Localand Global Feature Fusion)。作者首先通过与周围点的差异比较计算每个点的局部显著性，然后点云被分成许多个小类簇，计算每个类簇的全局稀有性性。最后通过提出了一个优化框架，以整合局部显著性和全局稀有性值，从而获得点云的最终显著性检测结果。通过对比实验表明，提出的方案相比其他显著性检测算法有明显的优势。但是本文的方法需要计算每个点的显著值，需要大量的计算量，并且没有考虑纹理信息诸如颜色等在显著性检测的作用。

发明内容

本发明是为避免上述现有技术所存在的不足之处，提供一种基于混合显著性检测的点云视频自适应切分方法，以期能够在点云视频传输过程中最大化减少数据量传输，从而提升传输系统的表现性能，使得用户拥有高质量的点云视频观看体验。

本发明为解决技术问题采用如下技术方案：

本发明一种基于混合显著性检测的点云视频自适应切分方法的特点是，所述点云视频自适应切分方法按如下步骤进行：

步骤一、将一个点云视频在时间上划分成T个帧组，每个帧组包含F帧点云图像，令帧组集合为{G₁,G₂,...,G_t,...,G_T}，其中，G_t表示点云视频中第t个帧组，1≤t≤T；T表示视频长度。

将第t个帧组G_t的每一帧在空间上均匀切分成数目为K＝L×L×L的切块并得到第t个帧组G_t的切块集合，记为{I_t,f,1,I_t,f,2,...,I_t,f,k,...,I_t,f,K}，其中，I_t,f,k表示第t个帧组G_t内第f帧中的第k个切块，L是每个切块的边长；1≤k≤K，1≤f≤F；

令第t个帧组G_t的切块集合中每个切块的空间坐标为{p_t,f,1,p_t,f,2,...,p_t,f,k,...,p_t,f,K}，其中，p_t,f,k表示第t个帧组G_t内第f帧中第k个切块I_t,f,k的中心点的三维坐标；

步骤二、计算帧组G_t内切块集合的内部离散值；

令切块集合中第k个切块I_t,f,k的点集合为{P_t,f,k,1,P_t,f,k,2,...,P_t,f,k,n,...,P_t,f,k,N}，其中，P_t,f,k,n表示第t个帧组G_t内第f帧中第k个切块I_t,f,k的第n个点，1≤n≤N；N表示第k个切块I_t,f,k内点个数；

令切块I_t,f,k内点集合的亮度大小为

其中，

表示帧组内第f帧的第k个切块中的第n个点的亮度大小；

计算切块I_t,f,k内点集合的亮度值的平均值，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的亮度值；

计算点集合的快速点特征直方图，记为

其中，

表示第t个帧组G_t内第f帧中第k个切块I_t,f,k的第n个点的FPFH特征向量；

计算切块I_t,f,k内点集合的FPFH的方差，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的内部离散值；

步骤三、计算第t个帧组G_t内所有切块的块间差异值；

步骤四、计算第t个帧组G_t内所有切块的帧间变化值；

步骤五、利用式(1)构造第t个帧组G_t的损失函数l_t：

式(1)中，x_t,k表示第t个帧组G_t内第k个切块I_t,f,k的显著值变量；x_t,j表示第t个帧组G_t内第j个切块I_t,f,j的显著值变量；S_t.z,k表示帧组内第k个切块I_t,f,k的第z个值，其中，z＝1表示第k个切块I_t,f,k的块内离散值

z＝2表示第k个切块I_t,f,k的块间差异值

z＝3表示第k个切块I_t,f,k的帧间变化值

R表示与第k个切块I_t,f,k的邻近的切块数目；W_t,k,j表示第k个切块I_t,f,k和第j个切块I_t,f,j的权重系数，并有：

式(2)中，σ是控制常量；p_t,f,j表示第t个帧组G_t内第f帧中第j个切块I_t,f,j的中心点的三维坐标；

步骤六、采用CPLEX求解器对损失函数l_t进行最优化求解，从而得到第t个帧组G_t内切块显著值集合{x_t,1,x_t,2,…,x_t,k,…,x_t,K}；

步骤七、根据第t个帧组G_t内切块集合的显著值，采用自上而下的层次聚类将第t个帧组G_t内的切块集合进行聚类，从而得到切块簇；将切块集合内属于相同切块簇的切块合成一个新的切块；

步骤八、按照步骤一到步骤七的过程对点云视频内所有帧组进行处理，从而得到点云视频的所有切块并作为自适应切分结果。

本发明所述的点云视频自适应切分方法的特点也在于，所述步骤三是按如下过程进行的：

步骤3.1、利用式(3)计算第k个切块I_t,f,k在第d维度上的FPFH特征向量

式(3)中，

表示第t个帧组G_t内第f帧中第k个切块I_t,f,k的第n个点在第d维度上的FPFH特征向量；1≤d≤D；D表示FPFH特征向量的维度；

步骤3.2、利用式(4)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的卡方距离χ²(I_t,f,k,I_t,f,j)；

式(4)中，

表示第t个帧组G_t内第j个切块I_t,f,j的FPFH特征向量；

步骤3.3、利用式(5)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的亮度距离γ²(I_t,f,k,I_t,f,j)：

式(5)中，

表示第t个帧组G_t内第j个切块I_t,f,j的亮度值；

步骤3.4利用式(6)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的特征距离ψ²(I_t,f,k,I_t,f,j)：

ψ²(I_t,f,k,I_t,f,j)＝χ²(I_t,f,k,I_t,f,j)+λ·γ²(I_t,f,k,I_t,f,j) (6)

式(6)中，λ是权重系数；

步骤3.5、利用式(7)计算块间差异值

式(7)中，R表示与切块I_t,f,k邻近的切块数目；p_t,f,j表示第t个帧组G_t内第j个切块I_t,f,j的空间位置；||p_t,f,k-p_t,f,j||表示第k个切块I_t,f,k和第j个切块I_t,f,j的空间距离。

所述步骤四是按如下过程进行的：

步骤4.1、令当前第k个切块I_t,f,k为目标切块，其所在的帧为目标帧；记目标帧的前一帧为参考帧；

步骤4.2、令在参考帧中与目标切块I_t,f,k相同空间位置的切块为参考切块，记为I_t,f-1,k；

步骤4.3、以参考切块I_t,f-1,k为中心，生成一个体积为S×S×S尺寸的搜索空间，其中，S为搜索空间的边长；

步骤4.4、在搜索空间内以C为间距，且C＜L，生成数目为

的待匹配切块集合，记为{I_t,f,k,1,I_t,f,k,2,...,I_t,f,k,m,...,I_t,f,k,M}，I_t,f,k,m表示第t个帧组G_t内第f帧中第k个切块I_t,f,k对应的搜索空间中第m个切块，1≤m≤M；

步骤4.5、计算目标切块I_t,f,k与待匹配切块集合内所有切块的特征距离，记为

其中，

表示目标切块I_t,f,k与待匹配切块I_t,f,k,m之间的特征距离；

步骤4.6、将集合

中的最小距离值所对应的匹配切块记为I_t,f-1,min，用于表示和目标切块I_t,f,k最相似的切块；

步骤4.7、利用式(8)计算目标切块I_t,f,k和匹配切块I_t,f-1,min的帧间变化值

式(8)中，P_t,f-1,min第t个帧组G_t内第f帧中第k个切块I_t,f,k对应的匹配切块I_t,f-1,min的空间位置；

步骤4.8、按照步骤步骤4.1到步骤4.7的过程对第t个帧组G_t内第2帧到第F帧中所有切块进行处理，从而得到每一帧的切块帧间变化值，记为

步骤4.9、将第2帧到第F帧中对应切块的帧间变化值相加得到第t个帧组G_t内第k个切块的帧间变化值

所述步骤七是按如下过程进行的：

步骤7.1、将切块显著值集合{x_t,1,x_t,2,…,x_t,k,…,x_t,K}中所有显著值分别作为一个独立的类簇；

步骤7.2、根据切块显著值计算两两类簇之间的特征距离，找到距离最小的两个类簇A_i和A_j；

步骤7.3、合并类簇A_i和A_j为一个类簇A_k；

步骤7.4、利用式(9)计算合并后的A_k的切块显著值：

式(9)中，x_t,i和x_t,j表示类簇A_i和A_j的切块显著值，当类簇内只有一个切块时，则类簇的切块显著值等于该切块的切块显著值；

步骤7.5、当合并后的类簇的数目达到阈值V时，表示完成第t个帧组G_t的聚类；否则，将合并后的聚类代入步骤7.2-步骤7.5的过程进行处理。

与现有技术相比，本发明的有益效果体现在：

1、本发明将点云显著性检测与切块相结合，通过检测切块的显著性来反映视频的显著性而不是每个点，从而大大减少了计算量。

2、本发明制定了点云视频显著性切分的流程框架，提取了切块的块内离散值，块间差异值和帧间变化值，将三者转化为优化损失函数的问题，通过CPLEX求解得到切块的显著值，提高了显著性检测的准确度和通用性。

3、本发明将点云视频切块可以运用在点云视频传输中，通过实时检测用户视角，判断当前需要传输的切块，从而减少了冗余切块的传输，大大降低了传输数据量，提高了点云视频传输的体验质量。

附图说明

图1为本发明中点云视频显著性检测的系统流程图。

具体实施方式

本实施例中，如图1所示，一种基于混合显著性检测的点云视频自适应切分方法是按如下步骤进行：

将第t个帧组G_t的每一帧在空间上均匀切分成数目为K＝L×L×L的切块并得到第t个帧组G_t的切块集合，记为{I_t,f,1,I_t,f,2,...,I_t,f,k,...,I_t,f,K}，其中，I_t,f,k表示第t个帧组G_t内第f帧中的第k个切块，L是每个切块的边长；1≤k≤K，1≤f≤F；切块空间是根据包围点云的最小长方体确定的。

令第t个帧组G_t的切块集合中每个切块的空间坐标为{p_t,f,1,p_t,f,2,...,p_t,f,k,...,p_t,f,K}，其中，p_t,f,k表示第t个帧组G_t内第f帧中第k个切块

的中心点的三维坐标；

步骤二、计算帧组G_t内切块集合的内部离散值；

令切块I_t,f,k内点集合的亮度大小为

其中，

表示帧组内第f帧的第k个切块中的第n个点的亮度大小；

计算切块I_t,f,k内点集合的亮度值的平均值，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的亮度值；其中亮度大小可以根据RGB转换公式得到；

计算点集合的快速点特征直方图，记为

其中，

表示第t个帧组G_t内第f帧中第k个切块I_t,f,k的第n个点的FPFH特征向量；一般来说，FPFH是一个33维的向量，可以衡量点云的点的特征，通过现有的点云库可以直接计算得到。

计算切块I_t,f,k内点集合的FPFH的方差，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的内部离散值；

步骤三、计算第t个帧组G_t内所有切块的块间差异值

步骤3.1、利用式(1)计算第k个切块I_t,f,k在第d维度上的FPFH特征向量

式(1)中，

步骤3.2、利用式(2)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的卡方距离χ²(I_t,f,k,I_t,f,j)；

式(2)中，

表示第t个帧组G_t内第j个切块I_t,f,j的FPFH特征向量；

步骤3.3、利用式(3)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的亮度距离γ²(I_t,f,k,I_t,f,j)：

式(3)中，

表示第t个帧组G_t内第j个切块I_t,f,j的亮度值；

步骤3.4利用式(4)计算第t个帧组G_t内第k个切块I_t,f,k和第j个切块I_t,f,j之间的特征距离：

ψ²(I_t,f,k,I_t,f,j)＝χ²(I_t,f,k,I_t,f,j)+λ·γ²(I_t,f,k,I_t,f,j) (4)

式(4)中，λ是权重系数；

步骤3.5、利用式(5)计算块间差异值

式(5)中，R表示与切块I_t,f,k邻近的切块数目，它是根据最近邻点算法得到的；p_t,f,j表示第t个帧组G_t内第j个切块I_t,f,j的空间位置；||p_t,f,k-p_t,f,j||表示第k个切块I_t,f,k和第j个切块I_t,f,j的空间距离；

步骤四、计算第t个帧组G_t内所有切块的帧间变化值；

步骤4.4、在搜索空间内以C为间距，C＜L，生成数目为

的待匹配切块集合，记为{I_t,f,k,1,I_t,f,k,2,...,I_t,f,k,m,...,I_t,f,k,M}，当M不是整数时，向下取整，I_t,f,k,m表示第t个帧组G_t内第f帧中第k个切块I_t,f,k对应的搜索空间中第m个切块，1≤m≤M；

其中，

表示目标切块I_t,f,k与待匹配切块I_t,f,k,m之间的特征距离；

步骤4.6、将集合

步骤4.7、利用式(6)计算目标切块I_t,f,k和匹配切块I_t,f-1,min的帧间变化值

式(6)中，P_t,f-1,min第t个帧组G_t内第f帧中第k个切块I_t,f,k对应的匹配切块I_t,f-1,min的空间位置；

步骤五、利用式(7)构造第t个帧组G_t的损失函数l_t：

式(7)中，x_t,k表示第t个帧组G_t内第k个切块I_t,f,k的显著值变量；x_t,j表示第t个帧组G_t内第j个切块I_t,f,j的显著值变量；S_t.z,k表示帧组内第k个切块I_t,f,k的第z个值，其中，z＝1表示第k个切块I_t,f,k的块内离散值

z＝2表示第k个切块I_t,f,k的块间差异值

z＝3表示第k个切块I_t,f,k的帧间变化值

式(8)中，σ是控制常量；p_t,f,j表示第t个帧组G_t内第f帧中第j个切块I_t,f,j的中心点的三维坐标；

步骤7.3、合并类簇A_i和A_j为一个类簇A_k；

步骤7.4、利用式(9)计算合并后的A_k的切块显著值：

Claims

1.一种基于混合显著性检测的点云视频自适应切分方法，其特征是，所述点云视频自适应切分方法按如下步骤进行：

步骤一、将一个点云视频在时间上划分成T个帧组，每个帧组包含F帧点云图像，令帧组集合为{G₁,G₂,...,G_t,...,G_T}，其中，G_t表示点云视频中第t个帧组，1≤t≤T；T表示视频长度；

步骤二、计算第t个帧组G_t内切块集合的内部离散值；

令切块I_t,f,k内点集合的亮度大小为

其中，

表示第t个帧组G_t内第f帧的第k个切块I_t,f,k中的第n个点的亮度大小；

计算第k个切块I_t,f,k内点集合的亮度值的平均值，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的亮度值；

计算点集合的快速点特征直方图，记为

其中，

计算第k个切块I_t,f,k内点集合的FPFH的方差，记为

并作为第t个帧组G_t内第k个切块I_t,f,k的内部离散值；

步骤三、计算第t个帧组G_t内所有切块的块间差异值；

式(3)中，

式(4)中，

表示第t个帧组G_t内第j个切块I_t,f,j的FPFH特征向量；

式(5)中，

表示第t个帧组G_t内第j个切块I_t,f,j的亮度值；

ψ²(I_t,f,k,I_t,f,j)＝χ²(I_t,f,k,I_t,f,j)+λ·γ²(I_t,f,k,I_t,f,j) (6)

式(6)中，λ是权重系数；

步骤3.5、利用式(7)计算块间差异值

式(7)中，R表示与第k个切块I_t,f,k邻近的切块数目；p_t,f,j表示第t个帧组G_t内第j个切块I_t,f,j的空间位置；||p_t,f,k-p_t,f,j||表示第k个切块I_t,f,k和第j个切块I_t,f,j的空间距离；

步骤四、计算第t个帧组G_t内所有切块的帧间变化值；

步骤4.4、在搜索空间内以C为间距，且C＜L，生成数目为

其中，

表示目标切块I_t,f,k与待匹配切块I_t,f,k,m之间的特征距离；

步骤4.6、将集合

步骤4.8、按照步骤4.1到步骤4.7的过程对第t个帧组G_t内第2帧到第F帧中所有切块进行处理，从而得到每一帧的切块帧间变化值，记为

步骤五、利用式(1)构造第t个帧组G_t的损失函数l_t：

z＝2表示第k个切块I_t,f,k的块间差异值

z＝3表示第k个切块I_t,f,k的帧间变化值

2.根据权利要求1所述的点云视频自适应切分方法，其特征是，所述步骤七是按如下过程进行的：

步骤7.3、合并类簇A_i和A_j为一个类簇A_k；

步骤7.4、利用式(9)计算合并后的A_k的切块显著值：