CN113259664B

CN113259664B - 一种基于图像二分标识的视频压缩方法

Info

Publication number: CN113259664B
Application number: CN202110801613.5A
Authority: CN
Inventors: 蒋先涛; 蔡佩华; 张纪庄
Original assignee: Kangda Intercontinental Medical Devices Co ltd
Current assignee: Kangda Intercontinental Medical Devices Co ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2021-11-16
Anticipated expiration: 2041-07-15
Also published as: CN113259664A

Abstract

本发明公开了一种基于图像二分标识的视频压缩方法，涉及视频压缩领域，其通过获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数；在当前编码单元所对应的预测模式为2乘方形矩阵模式时，通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值；并通过决策值与当前编码单元的编码标识值得到目标视频的尺寸压缩比，解决了仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，以及提升了视频压缩中编码复杂度和编码效率之间的平衡度。

Description

一种基于图像二分标识的视频压缩方法

技术领域

本发明涉及视频压缩领域，尤其涉及一种基于图像二分标识的视频压缩方法。

背景技术

H.265是ITU-TVCEG继H.264之后所制定的新的视频编码标准。H.265标准围绕着现有的视频编码标准H.264，保留原来的某些技术，同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系，达到最优化设置。具体改进后的效果包括：提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。H264由于算法优化，可以低于1Mbps的速度实现标清数字图像传送；H265则可以实现利用1~2Mbps的传输速度传送720P（分辨率1280*720）普通高清音视频传送。H.265旨在在有限带宽下传输更高质量的网络视频，仅需原先的一半带宽即可播放相同质量的视频。这也意味着，我们的智能手机、平板机等移动设备将能够直接在线播放1080p的全高清视频。H.265标准也同时支持4K(4096×2160)和8K(8192×4320)超高清视频。可以说，H.265标准让网络视频跟上了显示屏“高分辨率化”的脚步。

H.265/HEVC 的计算复杂度与H.264/AVC 标准相比，提高了十倍多，如何降低编码的计算复杂度是视频压缩编码的关键技术之一。H.265/HEVC 计算复杂度优化算法主要有：编码单元(CU)尺寸和深度快速决定算法, 预测单元(PU) 模式快速决定算法, 变换单元(TU)(大块的 TU 模式能够将能量更好的集中，小块的 TU 模式能够保存更多的图像细节)尺寸和深度快速决定算法。已有的算法主要利用视频图像的纹理复杂度，运动信息, 相邻CU 的相关信息, 编码的中间参数以及率失真代价模型来降低H.265/HEVC 的编码计算复杂度。然而这些方法不能在编码复杂度和编码效率之间达到很好的平衡。另外，在现有技术的视频压缩方法中编码单元尺寸较小时，编码单元分裂或者不分裂对应的率失真代价差别不大，仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，本专利提出了一种基于图像二分标识的视频压缩方法，通过对视频图像的纹理进行分析，引入率失真代价函数和编码块标识为分类的特征来获取视频最佳的尺寸压缩比解决了上述现有技术存在的问题。

发明内容

为了在视频压缩中使编码复杂度和编码效率之间达到很好的平衡以及解决仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，本专利提出了一种基于图像二分标识的视频压缩方法，包括步骤：

S01：根据当前编码单元的尺寸、在编码树单元中的深度值以及率失真代价利用非参数统计方法获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数；

S02：在当前编码单元所对应的预测模式为2乘方形矩阵模式时，通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值；

所述步骤S02中，预设划分决策函数的构建方法为：

获取编码单元决定分裂概率的第一概率密度函数；

根据第一概率密度函数以及编码单元的预设特征向量利用朴素贝叶斯公式获取编码单元的类别条件概率密度函数；

获取编码单元对应编码标识的先验概率函数；

根据编码单元分裂与不分裂时的均值与标准差构建编码单元率失真代价的先验概率模型；并通过先验概率模型获取编码单元中决定率失真代价先验概率的第二概率密度函数；

根据第一概率密度函数、类别条件概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数构建编码单元的后验概率函数；

根据编码单元的后验概率函数获取预设划分决策函数；

S03：获取当前编码单元的编码标识值，当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时，划分当前编码单元并进入步骤S04；当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时，确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束；所述编码标识值用来标示当前编码单元是否包含非零系数，当编码标识值为1时，表示在编码单元中有非零系数被编码，当编码标识值为0时，表示在编码单元中所有的传输系数为零；

S04：判断当前编码单元在编码树单元中的深度值是否为最大值，若是，输出当前编码单元的尺寸为目标视频的尺寸压缩比并结束，若否，深度值加1，并返回步骤S01对下一深度的编码单元进行处理。

进一步地，所述第一概率密度函数中包括分裂概率

和不分裂概率

两种情况，这两种情况概率之和为1。

进一步地，所述编码单元的类别条件概率密度函数的公式为：

；

式中，y表示编码单元分裂或者不分裂的随机变量，n为预设特征向量的个数；

为编码单元的预设特征向量集，其包含了每个编码单元的预设特征向量；m是初始值为1的常数；

为所有预设特征向量均出现时的概率；

为所有预设特征向量均出现时编码单元分裂或者不分裂的概率；

为编码单元预设特征向量出现时编码单元分裂或者不分裂的概率；

为编码单元决定分裂概率的第一概率密度函数，

为编码单元的类别条件概率密度。

进一步地，所述编码标识的先验概率函数服从离散的

分布，其中

为分布的概率；所述编码标识的先验概率函数中分裂与不分裂所对应的概率

之和为1。

进一步地，所述编码单元率失真代价的先验概率模型的公式为：

；

式中，

为编码单元的率失真代价，

为编码单元不分裂时的平均值，

为编码单元不分裂时的标准差，

为编码单元分裂时的平均值，

为编码单元分裂时的标准差，

为编码单元率失真代价的先验概率。

进一步地，所述通过先验概率模型获取的编码单元中决定率失真代价先验概率的第二概率密度函数的公式为：

；

式中，

为与圆周系数有关的常数，当

时，

为

，

为

，当

时，

为

，

为

；

为编码单元中决定率失真代价的先验概率。

进一步地，所述预设特征向量均出现时，类别条件概率密度函数此时为不依赖随机变量y的常量，因此后验概率函数的公式表示可表达为：

；

式中，j取值1或者2，当j取值为1时，

为编码单元的编码标识，

为编码标识的概率，

为编码标识的先验概率；当j取值为2时，

为编码单元的率失真代价，

为编码单元率失真代价的概率，

为编码单元中决定率失真代价的先验概率，

为编码单元的后验概率。

进一步地，所述根据编码单元的后验概率函数获取的预设划分决策函数的公式为：

；

式中，y表示编码单元分裂或者不分裂的随机变量，y取值0或者1,当y取值为0时，

表示不分裂的决策值，当y取值为1时，

表示分裂的决策值。

进一步地，所述编码单元中决定率失真代价先验概率的第二概率密度函数服从高斯分布；所述编码单元分裂与不分裂时的均值与标准差通过最大似然估计获取。

与现有技术相比，本发明至少含有以下有益效果：

（1）本发明将编码单元分裂与不分裂转换为二分类的问题，通过预设划分决策函数获取编码单元分裂与不分裂的决策值，大幅度的降低了视频压缩的复杂度；

（2）本发明通过编码单元的编码标识值与通过预设划分决策函数获取的编码单元分裂与不分裂的决策值结合判断出当前编码单元是否需要划分，提高了视频压缩中编码复杂度和编码效率之间的平衡度；

（3）本发明所述的一种基于图像二分标识的视频压缩方法，其通过朴素贝叶斯公式构建的预设划分决策函数获取不同深度下编码单元分裂与不分裂的决策值，同时结合编码标识值判断出当前编码单元是否需要划分，解决了在编码单元尺寸较小时，编码单元分裂或者不分裂对应的率失真代价差别不大，仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，保证了编码的准确性。

附图说明

图1为一种基于图像二分标识的视频压缩方法的方法流程图；

图2为一种基于图像二分标识的视频压缩方法的预设划分决策函数构建的方法步骤图。

具体实施方式

以下是本发明的具体实施例并结合附图，对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。

为了解决在编码单元尺寸较小时，编码单元分裂或者不分裂对应的率失真代价差别不大，仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，以及提升视频压缩中编码复杂度和编码效率之间的平衡度，如图1所示，本发明提出了一种基于图像二分标识的视频压缩方法，包括步骤：

本发明中，在当前编码单元所对应的预测模式为2乘方形矩阵模式（2N×2N 模式）时获取当前编码单元分裂与不分裂的决策值，保证了编码的准确性，且本发明将编码单元分裂与不分裂转换为二分类的问题，通过预设划分决策函数获取编码单元分裂与不分裂的决策值，大幅度的降低了视频压缩的复杂度。

本实施例中，编码标识用来标示当前编码单元是否包含非零系数，当编码标识的值为1时，它表示在编码单元中有非零系数被编码，相反，当编码标识的值为0时，在编码单元中所有的传输系数为零。编码标识在决定编码单元的分裂或不分裂中起着非常重要的作用，当编码标识为0时，编码图像的纹理趋向平滑，因此，编码单元趋向于不分裂。相反，当编码标识为1时，编码图像的纹理趋向复杂，编码单元趋向于分裂。本发明中，在获取当前编码单元的编码标识值后，判断编码单元对应的编码标识值，当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时，划分当前编码单元（即将当前的编码单元划分为4个子编码单元）并进入步骤S04；当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时，确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束。

需要说明的是，本发明还包括检查当前编码单元在编码树单元中所处深度下的模式划分，具体来说，当编码标识为0且当前编码单元分裂决策值大于编码单元不分裂决策值时，或者当编码标识为1且当前编码单元不分裂决策值大于编码单元分裂决策值时，则检查当前编码单元在编码树单元中所处深度下的模式划分，并在检查模式划分后进入步骤S4进行深度值的判断。

本发明通过编码单元的编码标识值与通过预设划分决策函数获取的编码单元分裂与不分裂的决策值结合判断出当前编码单元是否需要划分，提高了视频压缩中编码复杂度和编码效率之间的平衡度。

如图2所示，所述步骤S02中，预设划分决策函数的构建方法为：

获取编码单元决定分裂概率的第一概率密度函数；

所述第一概率密度函数中包括分裂概率

和不分裂概率

两种情况，这两种情况概率之和为1。

所述编码单元的类别条件概率密度函数的公式为：

；

为所有预设特征向量均出现时的概率；

为编码单元决定分裂概率的第一概率密度函数，

为编码单元的类别条件概率密度。

获取编码单元对应编码标识的先验概率函数；

所述编码标识的先验概率函数服从离散的

分布，其中

之和为1。

所述编码单元率失真代价的先验概率模型的公式为：

；

式中，

为编码单元的率失真代价，

为编码单元不分裂时的平均值，

为编码单元不分裂时的标准差，

为编码单元分裂时的平均值，

为编码单元分裂时的标准差，

为编码单元率失真代价的先验概率。

所述编码单元中决定率失真代价先验概率的第二概率密度函数服从高斯分布；所述编码单元分裂与不分裂时的均值与标准差通过最大似然估计获取。

所述通过先验概率模型获取的编码单元中决定率失真代价先验概率的第二概率密度函数的公式为：

；

式中，

为与圆周系数有关的常数，当

时，

为

，

为

，当

时，

为

，

为

；

为编码单元中决定率失真代价的先验概率。

需要说明的是，

取值为

。

所述预设特征向量均出现时，类别条件概率密度函数此时为不依赖随机变量y的常量，因此后验概率函数的公式表示可表达为：

；

式中，j取值1或者2，当j取值为1时，

为编码单元的编码标识，

为编码标识的概率，

为编码标识的先验概率；当j取值为2时，

为编码单元的率失真代价，

为编码单元率失真代价的概率，

为编码单元中决定率失真代价的先验概率，

为编码单元的后验概率。

根据编码单元的后验概率函数获取预设划分决策函数。

所述根据编码单元的后验概率函数获取的预设划分决策函数的公式为：

；

表示不分裂的决策值，当y取值为1时，

表示分裂的决策值。

本发明所述的一种基于图像二分标识的视频压缩方法，其通过朴素贝叶斯公式构建的预设划分决策函数获取不同深度下编码单元分裂与不分裂的决策值，同时结合编码标识值判断出当前编码单元是否需要划分，解决了在编码单元尺寸较小时，编码单元分裂或者不分裂对应的率失真代价差别不大，仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题，保证了编码的准确性。

需要说明，本发明实施例中所有方向性指示（诸如上、下、左、右、前、后……）仅用于解释在某一特定姿态（如附图所示）下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。另外，在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。在本发明中，除非另有明确的规定和限定，术语“连接”、“固定”等应做广义理解，例如，“固定”可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。另外，本发明各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，不在本发明要求的保护范围之内。