CN113259664B - 一种基于图像二分标识的视频压缩方法 - Google Patents

一种基于图像二分标识的视频压缩方法 Download PDF

Info

Publication number
CN113259664B
CN113259664B CN202110801613.5A CN202110801613A CN113259664B CN 113259664 B CN113259664 B CN 113259664B CN 202110801613 A CN202110801613 A CN 202110801613A CN 113259664 B CN113259664 B CN 113259664B
Authority
CN
China
Prior art keywords
coding unit
probability
coding
value
split
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110801613.5A
Other languages
English (en)
Other versions
CN113259664A (zh
Inventor
蒋先涛
蔡佩华
张纪庄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangda Intercontinental Medical Devices Co ltd
Original Assignee
Kangda Intercontinental Medical Devices Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangda Intercontinental Medical Devices Co ltd filed Critical Kangda Intercontinental Medical Devices Co ltd
Priority to CN202110801613.5A priority Critical patent/CN113259664B/zh
Publication of CN113259664A publication Critical patent/CN113259664A/zh
Application granted granted Critical
Publication of CN113259664B publication Critical patent/CN113259664B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于图像二分标识的视频压缩方法,涉及视频压缩领域,其通过获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数;在当前编码单元所对应的预测模式为2乘方形矩阵模式时,通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值;并通过决策值与当前编码单元的编码标识值得到目标视频的尺寸压缩比,解决了仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,以及提升了视频压缩中编码复杂度和编码效率之间的平衡度。

Description

一种基于图像二分标识的视频压缩方法
技术领域
本发明涉及视频压缩领域,尤其涉及一种基于图像二分标识的视频压缩方法。
背景技术
H.265是ITU-TVCEG继H.264之后所制定的新的视频编码标准。H.265标准围绕着现有的视频编码标准H.264,保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。具体改进后的效果包括:提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。H264由于算法优化,可以低于1Mbps的速度实现标清数字图像传送;H265则可以实现利用1~2Mbps的传输速度传送720P(分辨率1280*720)普通高清音视频传送。H.265旨在在有限带宽下传输更高质量的网络视频,仅需原先的一半带宽即可播放相同质量的视频。这也意味着,我们的智能手机、平板机等移动设备将能够直接在线播放1080p的全高清视频。H.265标准也同时支持4K(4096×2160)和8K(8192×4320)超高清视频。可以说,H.265标准让网络视频跟上了显示屏“高分辨率化”的脚步。
H.265/HEVC 的计算复杂度与H.264/AVC 标准相比,提高了十倍多,如何降低编码的计算复杂度是视频压缩编码的关键技术之一。H.265/HEVC 计算复杂度优化算法主要有:编码单元(CU)尺寸和深度快速决定算法, 预测单元(PU) 模式快速决定算法, 变换单元(TU)(大块的 TU 模式能够将能量更好的集中,小块的 TU 模式能够保存更多的图像细节)尺寸和深度快速决定算法。已有的算法主要利用视频图像的纹理复杂度,运动信息, 相邻CU 的相关信息, 编码的中间参数以及率失真代价模型来降低H.265/HEVC 的编码计算复杂度。然而这些方法不能在编码复杂度和编码效率之间达到很好的平衡。另外,在现有技术的视频压缩方法中编码单元尺寸较小时,编码单元分裂或者不分裂对应的率失真代价差别不大,仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,本专利提出了一种基于图像二分标识的视频压缩方法,通过对视频图像的纹理进行分析,引入率失真代价函数和编码块标识为分类的特征来获取视频最佳的尺寸压缩比解决了上述现有技术存在的问题。
发明内容
为了在视频压缩中使编码复杂度和编码效率之间达到很好的平衡以及解决仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,本专利提出了一种基于图像二分标识的视频压缩方法,包括步骤:
S01:根据当前编码单元的尺寸、在编码树单元中的深度值以及率失真代价利用非参数统计方法获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数;
S02:在当前编码单元所对应的预测模式为2乘方形矩阵模式时,通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值;
所述步骤S02中,预设划分决策函数的构建方法为:
获取编码单元决定分裂概率的第一概率密度函数;
根据第一概率密度函数以及编码单元的预设特征向量利用朴素贝叶斯公式获取编码单元的类别条件概率密度函数;
获取编码单元对应编码标识的先验概率函数;
根据编码单元分裂与不分裂时的均值与标准差构建编码单元率失真代价的先验概率模型;并通过先验概率模型获取编码单元中决定率失真代价先验概率的第二概率密度函数;
根据第一概率密度函数、类别条件概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数构建编码单元的后验概率函数;
根据编码单元的后验概率函数获取预设划分决策函数;
S03:获取当前编码单元的编码标识值,当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时,划分当前编码单元并进入步骤S04;当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时,确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束;所述编码标识值用来标示当前编码单元是否包含非零系数,当编码标识值为1时,表示在编码单元中有非零系数被编码,当编码标识值为0时,表示在编码单元中所有的传输系数为零;
S04:判断当前编码单元在编码树单元中的深度值是否为最大值,若是,输出当前编码单元的尺寸为目标视频的尺寸压缩比并结束,若否,深度值加1,并返回步骤S01对下一深度的编码单元进行处理。
进一步地,所述第一概率密度函数中包括分裂概率
Figure 457908DEST_PATH_IMAGE001
和不分裂概率
Figure 80650DEST_PATH_IMAGE002
两种情况,这两种情况概率之和为1。
进一步地,所述编码单元的类别条件概率密度函数的公式为:
Figure 930532DEST_PATH_IMAGE003
式中,y表示编码单元分裂或者不分裂的随机变量,n为预设特征向量的个数;
Figure 486278DEST_PATH_IMAGE004
为编码单元的预设特征向量集,其包含了每个编码单元的预设特征向量;m是初始值为1的常数;
Figure 897668DEST_PATH_IMAGE005
为所有预设特征向量均出现时的概率;
Figure 742127DEST_PATH_IMAGE006
为所有预设特征向量均出现时编码单元分裂或者不分裂的概率;
Figure 631586DEST_PATH_IMAGE007
为编码单元预设特征向量出现时编码单元分裂或者不分裂的概率;
Figure 71532DEST_PATH_IMAGE008
为编码单元决定分裂概率的第一概率密度函数,
Figure 388244DEST_PATH_IMAGE009
为编码单元的类别条件概率密度。
进一步地,所述编码标识的先验概率函数服从离散的
Figure 782316DEST_PATH_IMAGE010
分布,其中
Figure 741045DEST_PATH_IMAGE011
为分布的概率;所述编码标识的先验概率函数中分裂与不分裂所对应的概率
Figure 536963DEST_PATH_IMAGE011
之和为1。
进一步地,所述编码单元率失真代价的先验概率模型的公式为:
Figure 555734DEST_PATH_IMAGE012
式中,
Figure 437103DEST_PATH_IMAGE013
为编码单元的率失真代价,
Figure 199522DEST_PATH_IMAGE014
为编码单元不分裂时的平均值,
Figure 115526DEST_PATH_IMAGE015
为编码单元不分裂时的标准差,
Figure 39619DEST_PATH_IMAGE016
为编码单元分裂时的平均值,
Figure 673863DEST_PATH_IMAGE017
为编码单元分裂时的标准差,
Figure 974394DEST_PATH_IMAGE018
为编码单元率失真代价的先验概率。
进一步地,所述通过先验概率模型获取的编码单元中决定率失真代价先验概率的第二概率密度函数的公式为:
Figure 509019DEST_PATH_IMAGE019
式中,
Figure 604014DEST_PATH_IMAGE020
为与圆周系数有关的常数,当
Figure 725553DEST_PATH_IMAGE021
时,
Figure 829776DEST_PATH_IMAGE022
Figure 454792DEST_PATH_IMAGE023
Figure 986267DEST_PATH_IMAGE024
Figure 329524DEST_PATH_IMAGE025
,当
Figure 237437DEST_PATH_IMAGE026
时,
Figure 982539DEST_PATH_IMAGE027
Figure 684916DEST_PATH_IMAGE028
Figure 515469DEST_PATH_IMAGE029
Figure 961494DEST_PATH_IMAGE030
Figure 295523DEST_PATH_IMAGE031
为编码单元中决定率失真代价的先验概率。
进一步地,所述预设特征向量均出现时,类别条件概率密度函数此时为不依赖随机变量y的常量,因此后验概率函数的公式表示可表达为:
Figure 594972DEST_PATH_IMAGE033
式中,j取值1或者2,当j取值为1时,
Figure 579109DEST_PATH_IMAGE034
为编码单元的编码标识,
Figure 767645DEST_PATH_IMAGE035
为编码标识的概率,
Figure 811824DEST_PATH_IMAGE036
为编码标识的先验概率;当j取值为2时,
Figure 616969DEST_PATH_IMAGE034
为编码单元的率失真代价,
Figure 637752DEST_PATH_IMAGE037
为编码单元率失真代价的概率,
Figure 211953DEST_PATH_IMAGE038
为编码单元中决定率失真代价的先验概率,
Figure 427034DEST_PATH_IMAGE039
为编码单元的后验概率。
进一步地,所述根据编码单元的后验概率函数获取的预设划分决策函数的公式为:
Figure 453896DEST_PATH_IMAGE040
式中,y表示编码单元分裂或者不分裂的随机变量,y取值0或者1,当y取值为0时,
Figure 45414DEST_PATH_IMAGE041
表示不分裂的决策值,当y取值为1时,
Figure 208542DEST_PATH_IMAGE041
表示分裂的决策值。
进一步地,所述编码单元中决定率失真代价先验概率的第二概率密度函数服从高斯分布;所述编码单元分裂与不分裂时的均值与标准差通过最大似然估计获取。
与现有技术相比,本发明至少含有以下有益效果:
(1)本发明将编码单元分裂与不分裂转换为二分类的问题,通过预设划分决策函数获取编码单元分裂与不分裂的决策值,大幅度的降低了视频压缩的复杂度;
(2)本发明通过编码单元的编码标识值与通过预设划分决策函数获取的编码单元分裂与不分裂的决策值结合判断出当前编码单元是否需要划分,提高了视频压缩中编码复杂度和编码效率之间的平衡度;
(3)本发明所述的一种基于图像二分标识的视频压缩方法,其通过朴素贝叶斯公式构建的预设划分决策函数获取不同深度下编码单元分裂与不分裂的决策值,同时结合编码标识值判断出当前编码单元是否需要划分,解决了在编码单元尺寸较小时,编码单元分裂或者不分裂对应的率失真代价差别不大,仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,保证了编码的准确性。
附图说明
图1为一种基于图像二分标识的视频压缩方法的方法流程图;
图2为一种基于图像二分标识的视频压缩方法的预设划分决策函数构建的方法步骤图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
为了解决在编码单元尺寸较小时,编码单元分裂或者不分裂对应的率失真代价差别不大,仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,以及提升视频压缩中编码复杂度和编码效率之间的平衡度,如图1所示,本发明提出了一种基于图像二分标识的视频压缩方法,包括步骤:
S01:根据当前编码单元的尺寸、在编码树单元中的深度值以及率失真代价利用非参数统计方法获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数;
S02:在当前编码单元所对应的预测模式为2乘方形矩阵模式时,通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值;
本发明中,在当前编码单元所对应的预测模式为2乘方形矩阵模式(2N×2N 模式)时获取当前编码单元分裂与不分裂的决策值,保证了编码的准确性,且本发明将编码单元分裂与不分裂转换为二分类的问题,通过预设划分决策函数获取编码单元分裂与不分裂的决策值,大幅度的降低了视频压缩的复杂度。
S03:获取当前编码单元的编码标识值,当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时,划分当前编码单元并进入步骤S04;当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时,确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束;所述编码标识值用来标示当前编码单元是否包含非零系数,当编码标识值为1时,表示在编码单元中有非零系数被编码,当编码标识值为0时,表示在编码单元中所有的传输系数为零;
本实施例中,编码标识用来标示当前编码单元是否包含非零系数,当编码标识的值为1时,它表示在编码单元中有非零系数被编码,相反,当编码标识的值为0时,在编码单元中所有的传输系数为零。编码标识在决定编码单元的分裂或不分裂中起着非常重要的作用,当编码标识为0时,编码图像的纹理趋向平滑,因此,编码单元趋向于不分裂。相反,当编码标识为1时,编码图像的纹理趋向复杂,编码单元趋向于分裂。本发明中,在获取当前编码单元的编码标识值后,判断编码单元对应的编码标识值,当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时,划分当前编码单元(即将当前的编码单元划分为4个子编码单元)并进入步骤S04;当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时,确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束。
S04:判断当前编码单元在编码树单元中的深度值是否为最大值,若是,输出当前编码单元的尺寸为目标视频的尺寸压缩比并结束,若否,深度值加1,并返回步骤S01对下一深度的编码单元进行处理。
需要说明的是,本发明还包括检查当前编码单元在编码树单元中所处深度下的模式划分,具体来说,当编码标识为0且当前编码单元分裂决策值大于编码单元不分裂决策值时,或者当编码标识为1且当前编码单元不分裂决策值大于编码单元分裂决策值时,则检查当前编码单元在编码树单元中所处深度下的模式划分,并在检查模式划分后进入步骤S4进行深度值的判断。
本发明通过编码单元的编码标识值与通过预设划分决策函数获取的编码单元分裂与不分裂的决策值结合判断出当前编码单元是否需要划分,提高了视频压缩中编码复杂度和编码效率之间的平衡度。
如图2所示,所述步骤S02中,预设划分决策函数的构建方法为:
获取编码单元决定分裂概率的第一概率密度函数;
所述第一概率密度函数中包括分裂概率
Figure 594524DEST_PATH_IMAGE042
和不分裂概率
Figure 374261DEST_PATH_IMAGE043
两种情况,这两种情况概率之和为1。
根据第一概率密度函数以及编码单元的预设特征向量利用朴素贝叶斯公式获取编码单元的类别条件概率密度函数;
所述编码单元的类别条件概率密度函数的公式为:
Figure 972733DEST_PATH_IMAGE044
式中,y表示编码单元分裂或者不分裂的随机变量,n为预设特征向量的个数;
Figure 255947DEST_PATH_IMAGE004
为编码单元的预设特征向量集,其包含了每个编码单元的预设特征向量;m是初始值为1的常数;
Figure 78409DEST_PATH_IMAGE005
为所有预设特征向量均出现时的概率;
Figure 79863DEST_PATH_IMAGE006
为所有预设特征向量均出现时编码单元分裂或者不分裂的概率;
Figure 13184DEST_PATH_IMAGE007
为编码单元预设特征向量出现时编码单元分裂或者不分裂的概率;
Figure 649440DEST_PATH_IMAGE008
为编码单元决定分裂概率的第一概率密度函数,
Figure 642803DEST_PATH_IMAGE009
为编码单元的类别条件概率密度。
获取编码单元对应编码标识的先验概率函数;
所述编码标识的先验概率函数服从离散的
Figure 131553DEST_PATH_IMAGE045
分布,其中
Figure 602986DEST_PATH_IMAGE046
为分布的概率;所述编码标识的先验概率函数中分裂与不分裂所对应的概率
Figure 860792DEST_PATH_IMAGE046
之和为1。
根据编码单元分裂与不分裂时的均值与标准差构建编码单元率失真代价的先验概率模型;并通过先验概率模型获取编码单元中决定率失真代价先验概率的第二概率密度函数;
所述编码单元率失真代价的先验概率模型的公式为:
Figure 759478DEST_PATH_IMAGE047
式中,
Figure 469945DEST_PATH_IMAGE048
为编码单元的率失真代价,
Figure 745069DEST_PATH_IMAGE049
为编码单元不分裂时的平均值,
Figure 388539DEST_PATH_IMAGE050
为编码单元不分裂时的标准差,
Figure 192547DEST_PATH_IMAGE051
为编码单元分裂时的平均值,
Figure 655890DEST_PATH_IMAGE052
为编码单元分裂时的标准差,
Figure 469125DEST_PATH_IMAGE053
为编码单元率失真代价的先验概率。
所述编码单元中决定率失真代价先验概率的第二概率密度函数服从高斯分布;所述编码单元分裂与不分裂时的均值与标准差通过最大似然估计获取。
所述通过先验概率模型获取的编码单元中决定率失真代价先验概率的第二概率密度函数的公式为:
Figure 701523DEST_PATH_IMAGE054
式中,
Figure 942012DEST_PATH_IMAGE055
为与圆周系数有关的常数,当
Figure 892650DEST_PATH_IMAGE056
时,
Figure 8111DEST_PATH_IMAGE057
Figure 95016DEST_PATH_IMAGE058
Figure 771985DEST_PATH_IMAGE059
Figure 944341DEST_PATH_IMAGE060
,当
Figure 99378DEST_PATH_IMAGE061
时,
Figure 306369DEST_PATH_IMAGE062
Figure 888660DEST_PATH_IMAGE063
Figure 548311DEST_PATH_IMAGE064
Figure 507040DEST_PATH_IMAGE065
Figure 568537DEST_PATH_IMAGE066
为编码单元中决定率失真代价的先验概率。
需要说明的是,
Figure 587309DEST_PATH_IMAGE067
取值为
Figure 468677DEST_PATH_IMAGE068
根据第一概率密度函数、类别条件概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数构建编码单元的后验概率函数;
所述预设特征向量均出现时,类别条件概率密度函数此时为不依赖随机变量y的常量,因此后验概率函数的公式表示可表达为:
Figure 881521DEST_PATH_IMAGE069
式中,j取值1或者2,当j取值为1时,
Figure 71194DEST_PATH_IMAGE034
为编码单元的编码标识,
Figure 203972DEST_PATH_IMAGE035
为编码标识的概率,
Figure 504504DEST_PATH_IMAGE036
为编码标识的先验概率;当j取值为2时,
Figure 275014DEST_PATH_IMAGE034
为编码单元的率失真代价,
Figure 635588DEST_PATH_IMAGE037
为编码单元率失真代价的概率,
Figure 757128DEST_PATH_IMAGE038
为编码单元中决定率失真代价的先验概率,
Figure 595771DEST_PATH_IMAGE039
为编码单元的后验概率。
根据编码单元的后验概率函数获取预设划分决策函数。
所述根据编码单元的后验概率函数获取的预设划分决策函数的公式为:
Figure 486366DEST_PATH_IMAGE040
式中,y表示编码单元分裂或者不分裂的随机变量,y取值0或者1,当y取值为0时,
Figure 17842DEST_PATH_IMAGE041
表示不分裂的决策值,当y取值为1时,
Figure 361098DEST_PATH_IMAGE041
表示分裂的决策值。
本发明所述的一种基于图像二分标识的视频压缩方法,其通过朴素贝叶斯公式构建的预设划分决策函数获取不同深度下编码单元分裂与不分裂的决策值,同时结合编码标识值判断出当前编码单元是否需要划分,解决了在编码单元尺寸较小时,编码单元分裂或者不分裂对应的率失真代价差别不大,仅用率失真代价决定编码单元分裂或者不分裂易引起错误划分的问题,保证了编码的准确性。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。另外,在本发明中如涉及“第一”、“第二”、“一”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,不在本发明要求的保护范围之内。

Claims (9)

1.一种基于图像二分标识的视频压缩方法,其特征在于,包括步骤:
S01:根据当前编码单元的尺寸、在编码树单元中的深度值以及率失真代价利用非参数统计方法获取当前编码单元决定分裂概率的第一概率密度函数、编码单元对应编码标识的先验概率函数、以及编码单元中决定率失真代价先验概率的第二概率密度函数;
S02:在当前编码单元所对应的预测模式为2乘方形矩阵模式时,通过第一概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数利用预设划分决策函数获取当前编码单元分裂与不分裂的决策值;
所述步骤S02中,预设划分决策函数的构建方法为:
获取编码单元决定分裂概率的第一概率密度函数;
根据第一概率密度函数以及编码单元的预设特征向量利用朴素贝叶斯公式获取编码单元的类别条件概率密度函数;
获取编码单元对应编码标识的先验概率函数;
根据编码单元分裂与不分裂时的均值与标准差构建编码单元率失真代价的先验概率模型;并通过先验概率模型获取编码单元中决定率失真代价先验概率的第二概率密度函数;
根据第一概率密度函数、类别条件概率密度函数、编码单元对应编码标识的先验概率函数以及第二概率密度函数构建编码单元的后验概率函数;
根据编码单元的后验概率函数获取预设划分决策函数;
S03:获取当前编码单元的编码标识值,当编码标识值为1且当前编码单元分裂决策值大于编码单元不分裂决策值时,划分当前编码单元并进入步骤S04;当编码标识值为0且当前编码单元不分裂决策值大于编码单元分裂决策值时,确定当前编码单元的尺寸为目标视频的尺寸压缩比并结束;所述编码标识值用来标示当前编码单元是否包含非零系数,当编码标识值为1时,表示在编码单元中有非零系数被编码,当编码标识值为0时,表示在编码单元中所有的传输系数为零;
S04:判断当前编码单元在编码树单元中的深度值是否为最大值,若是,输出当前编码单元的尺寸为目标视频的尺寸压缩比并结束,若否,深度值加1,并返回步骤S01对下一深度的编码单元进行处理。
2.根据权利要求1所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述第一概率密度函数中包括分裂概率
Figure DEST_PATH_IMAGE001
和不分裂概率
Figure DEST_PATH_IMAGE002
两种情况,这两种情况概率之和为1。
3.根据权利要求2所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述编码单元的类别条件概率密度函数的公式为:
Figure DEST_PATH_IMAGE003
式中,y表示编码单元分裂或者不分裂的随机变量,n为预设特征向量的个数;
Figure DEST_PATH_IMAGE004
为编码单元的预设特征向量集,其包含了每个编码单元的预设特征向量;m是初始值为1的常数;
Figure DEST_PATH_IMAGE005
为所有预设特征向量均出现时的概率;
Figure DEST_PATH_IMAGE006
为所有预设特征向量均出现时编码单元分裂或者不分裂的概率;
Figure DEST_PATH_IMAGE007
为编码单元预设特征向量出现时编码单元分裂或者不分裂的概率;
Figure DEST_PATH_IMAGE008
为编码单元决定分裂概率的第一概率密度函数,
Figure DEST_PATH_IMAGE009
为编码单元的类别条件概率密度。
4.根据权利要求3所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述编码标识的先验概率函数服从离散的
Figure DEST_PATH_IMAGE010
分布,其中
Figure DEST_PATH_IMAGE011
为分布的概率;所述编码标识的先验概率函数中分裂与不分裂所对应的概率
Figure 516354DEST_PATH_IMAGE011
之和为1。
5.根据权利要求4所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述编码单元率失真代价的先验概率模型的公式为:
Figure DEST_PATH_IMAGE012
式中,
Figure DEST_PATH_IMAGE013
为编码单元的率失真代价,
Figure DEST_PATH_IMAGE014
为编码单元不分裂时的平均值,
Figure DEST_PATH_IMAGE015
为编码单元不分裂时的标准差,
Figure DEST_PATH_IMAGE016
为编码单元分裂时的平均值,
Figure DEST_PATH_IMAGE017
为编码单元分裂时的标准差,
Figure DEST_PATH_IMAGE018
为编码单元率失真代价的先验概率。
6.根据权利要求5所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述通过先验概率模型获取的编码单元中决定率失真代价先验概率的第二概率密度函数的公式为:
Figure DEST_PATH_IMAGE019
式中,
Figure DEST_PATH_IMAGE020
为与圆周系数有关的常数,当
Figure DEST_PATH_IMAGE021
时,
Figure DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
,当
Figure DEST_PATH_IMAGE026
时,
Figure DEST_PATH_IMAGE027
Figure DEST_PATH_IMAGE028
Figure DEST_PATH_IMAGE029
Figure DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
为编码单元中决定率失真代价的先验概率。
7.根据权利要求6所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述预设特征向量均出现时,类别条件概率密度函数此时为不依赖随机变量y的常量,因此后验概率函数的公式表示可表达为:
Figure DEST_PATH_IMAGE033
式中,j取值1或者2,当j取值为1时,
Figure DEST_PATH_IMAGE034
为编码单元的编码标识,
Figure DEST_PATH_IMAGE035
为编码标识的概率,
Figure DEST_PATH_IMAGE036
为编码标识的先验概率;当j取值为2时,
Figure 335624DEST_PATH_IMAGE034
为编码单元的率失真代价,
Figure DEST_PATH_IMAGE037
为编码单元率失真代价的概率,
Figure DEST_PATH_IMAGE038
为编码单元中决定率失真代价的先验概率,
Figure DEST_PATH_IMAGE039
为编码单元的后验概率。
8.根据权利要求7所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述根据编码单元的后验概率函数获取的预设划分决策函数的公式为:
Figure DEST_PATH_IMAGE040
式中,y表示编码单元分裂或者不分裂的随机变量,y取值0或者1,当y取值为0时,
Figure DEST_PATH_IMAGE041
表示不分裂的决策值,当y取值为1时,
Figure 944722DEST_PATH_IMAGE041
表示分裂的决策值。
9.根据权利要求6所述的一种基于图像二分标识的视频压缩方法,其特征在于,所述编码单元中决定率失真代价先验概率的第二概率密度函数服从高斯分布;所述编码单元分裂与不分裂时的均值与标准差通过最大似然估计获取。
CN202110801613.5A 2021-07-15 2021-07-15 一种基于图像二分标识的视频压缩方法 Active CN113259664B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110801613.5A CN113259664B (zh) 2021-07-15 2021-07-15 一种基于图像二分标识的视频压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110801613.5A CN113259664B (zh) 2021-07-15 2021-07-15 一种基于图像二分标识的视频压缩方法

Publications (2)

Publication Number Publication Date
CN113259664A CN113259664A (zh) 2021-08-13
CN113259664B true CN113259664B (zh) 2021-11-16

Family

ID=77180446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110801613.5A Active CN113259664B (zh) 2021-07-15 2021-07-15 一种基于图像二分标识的视频压缩方法

Country Status (1)

Country Link
CN (1) CN113259664B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113573058B (zh) * 2021-09-23 2021-11-30 康达洲际医疗器械有限公司 一种基于时空显著性融合的帧间图像编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140146884A1 (en) * 2012-11-26 2014-05-29 Electronics And Telecommunications Research Institute Fast prediction mode determination method in video encoder based on probability distribution of rate-distortion
CN109743575A (zh) * 2018-12-05 2019-05-10 四川大学 一种基于朴素贝叶斯的dvc-hevc视频转码方法
CN110581993A (zh) * 2019-08-16 2019-12-17 中南大学 一种基于多用途编码中帧内编码的编码单元快速划分方法
CN111031303A (zh) * 2019-11-21 2020-04-17 郑州轻工业大学 基于贝叶斯决策定理的3d-hevc快速深度编码方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140146884A1 (en) * 2012-11-26 2014-05-29 Electronics And Telecommunications Research Institute Fast prediction mode determination method in video encoder based on probability distribution of rate-distortion
CN109743575A (zh) * 2018-12-05 2019-05-10 四川大学 一种基于朴素贝叶斯的dvc-hevc视频转码方法
CN110581993A (zh) * 2019-08-16 2019-12-17 中南大学 一种基于多用途编码中帧内编码的编码单元快速划分方法
CN111031303A (zh) * 2019-11-21 2020-04-17 郑州轻工业大学 基于贝叶斯决策定理的3d-hevc快速深度编码方法

Also Published As

Publication number Publication date
CN113259664A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
US9510010B2 (en) Method for decoding images based upon partition information determinations and apparatus for decoding using same
TWI726579B (zh) 動態影像編碼裝置、動態影像編碼方法、動態影像解碼裝置、及動態影像解碼方法
US20240073453A1 (en) Method and device for coding the geometry of a point cloud
US11756234B2 (en) Method for encoding depth values of a set of 3D points once orthogonally projected into at least one image region of a projection plane
WO2019152138A1 (en) Compression of occupancy or indicator grids
CN105933711B (zh) 基于分割的邻域最优概率视频隐写分析方法及系统
US10080036B2 (en) Method and apparatus for depth video coding using endurable view synthesis distortion
CN113259664B (zh) 一种基于图像二分标识的视频压缩方法
US11394972B2 (en) Method and device for encoding/decoding video signal by using optimized conversion based on multiple graph-based model
JP6315133B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム
CN111031303B (zh) 基于贝叶斯决策定理的3d-hevc快速深度编码方法
CN116170596A (zh) 编解码方法及电子设备
CN117157981A (zh) 使用方位编解码模式对点云几何数据进行编码/解码的方法和装置
JP6315137B2 (ja) 動画像復号装置、動画像復号方法及び動画像復号プログラム
CN108184114B (zh) 一种基于支持向量机SVM的P帧中Intra预测模式快速判定方法
CN116248895B (zh) 虚拟现实全景漫游的视频云转码方法及系统
WO2022213569A1 (en) Method and apparatus of encoding/decoding point cloud geometry data captured by a spinning sensors head
WO2024027639A1 (zh) 图片组长度确定方法、装置、计算机设备及可读介质
US20240357111A1 (en) Non-separable primary transform-based image encoding/decoding method and device, and recording medium for storing bitstream
CN117409091A (zh) 编解码方法及电子设备
CN113727103A (zh) 视频编码、解码方法、装置、电子设备及存储介质
WO2013094217A1 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant