CN113225555A - 一种视频编解码中的几何划分模式预测方法及装置 - Google Patents

一种视频编解码中的几何划分模式预测方法及装置 Download PDF

Info

Publication number
CN113225555A
CN113225555A CN202110303899.4A CN202110303899A CN113225555A CN 113225555 A CN113225555 A CN 113225555A CN 202110303899 A CN202110303899 A CN 202110303899A CN 113225555 A CN113225555 A CN 113225555A
Authority
CN
China
Prior art keywords
motion vector
prediction
prediction unit
candidate
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110303899.4A
Other languages
English (en)
Other versions
CN113225555B (zh
Inventor
马思伟
孟学苇
王苫社
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202110303899.4A priority Critical patent/CN113225555B/zh
Publication of CN113225555A publication Critical patent/CN113225555A/zh
Application granted granted Critical
Publication of CN113225555B publication Critical patent/CN113225555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频编解码中的几何划分模式预测方法及装置,本发明充分考虑了编码块形状、几何划分模式与运动矢量之间不同的相关性,在编码端和解码端,根据不同运动矢量的选中概率为每个预测单元构建一个候选列表出来,在候选列表中由于选中概率高的运动矢量,对应的索引越小,可以用较少的比特数目表示,从而能够减少编码索引的比特数目开销,提升了压缩性能。

Description

一种视频编解码中的几何划分模式预测方法及装置
技术领域
本发明涉及视频编解码技术领域,具体涉及一种视频编解码中的几何划分模式预测方法及装置。
背景技术
视频编解码中所采用的帧间预测技术,对于一帧图像,在编码过程中不会直接对整帧图像进行处理,需要先划分成大的编码区域(Coding Tree Unit,CTU),例如64x64、128x128大小。每个CTU可以进一步划分成编码单元(Coding Unit,CU)。在过去的视频编码标准中,编码单元CU和预测单元(Prediction Unit,P U)都是方形或矩形的,但几何划分预测技术(Geometric Partition,GEO)则是采用特定的几何划分模式将一个CU划分成两个多边形的PU。
几何划分预测技术的运动信息从已编码区域的运动信息中得到,通过特定的获取规则,从已编码区域获取运动矢量候选,并构建运动矢量候选列表。在编码端进行运动矢量的决策,并将选中的运动矢量对应的索引写入码流。运动矢量索引的编码方式依赖于索引值的大小,即索引值越小,编码消耗比特数目越少。
然而,目前对于几何划分预测技术中的所有几何划分模式均采用同样的运动矢量候选列表构建方式,未能充分考虑块形状、几何划分模式与运动矢量之间不同的相关性,使得编码过程中选中运动矢量的索引消耗的比特数目大,严重影响编码性能。
发明内容
本发明的目的是针对上述现有技术的不足提出的一种视频编解码中的几何划分模式预测方法及装置,该目的是通过以下技术方案实现的。
本发明的第一方面提出了一种视频编解码中的几何划分模式预测方法,所述方法应用于编码端,所述方法包括:
为目标编码单元选择一种最优几何划分模式,并基于所述最优几何划分模式对目标编码单元进行划分,得到两个预测单元;
获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
从每个预测单元的第一候选列表中选择一个最优运动矢量;所述第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小;
将每个预测单元的最优运动矢量的索引和所述最优几何划分模式的索引写入码流。
本发明的第二方面提出了一种视频编解码中的几何划分模式预测方法,所述方法应用于解码端,所述方法包括:
对码流进行解析,当解析后码流中的编码单元使用几何划分预测GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引;
获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块;
根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
本发明的第三方面提出了一种视频编解码中的几何划分模式预测装置,所述装置应用于编码端,所述装置包括:
几何划分模块,用于为目标编码单元选择一种最优几何划分模式,并基于所述最优几何划分模式对目标编码单元进行划分,得到两个预测单元;
列表构建模块,用于获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动矢量选择模块,用于从每个预测单元的第一候选列表中选择一个最优运动矢量;所述第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小;
码流生成模块,用于将每个预测单元的最优运动矢量的索引和所述最优几何划分模式的索引写入码流。
本发明的第四方面提出了一种视频编解码中的几何划分模式预测装置,所述装置应用于解码端,所述装置包括:
码流解析模块,用于对码流进行解析,当解析后码流中的编码单元使用GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引;
列表构建模块,用于获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动补偿模块,用于从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块;
重构模块,用于根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
本发明的第五方面提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一项所述方法的步骤。
本发明的第六方面提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述方法的步骤。
基于上述给出的视频编解码中的几何划分模式预测方法,本发明具有如下有益效果:
本发明充分考虑了编码块形状、几何划分模式与运动矢量之间不同的相关性,在编码端和解码端,根据不同运动矢量的选中概率为每个预测单元构建一个候选列表出来,在候选列表中由于选中概率高的运动矢量,对应的索引越小,可以用较少的比特数目表示,从而能够减少编码索引的比特数目开销,提升了压缩性能。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明示出的4种帧间预测模式示意图;
图2为本发明示出的几何划分示意图;
图3至图5为本发明示出的不同几何划分模式区分示意图;
图6为本发明根据一示例性实施例示出的一种视频编解码中的几何划分模式预测方法的实施例流程图;
图7为本发明示出的一种空域、时域运动矢量候选示意图;
图8为本发明示出的一种编码单元的语法元素设计结构示意图;
图9为本发明根据一示例性实施例示出的另一种视频编解码中的几何划分模式预测方法的实施例流程图;
图10为本发明示出的一种几何划分模式下的运动补偿示意图;
图11为本发明示出的一种几何划分模式下的重构示意图;
图12为本发明根据一示例性实施例示出的一种电子设备的硬件结构图;
图13为本发明根据一示例性实施例示出的一种视频编解码中的几何划分模式预测装置的结构示意图;
图14为本发明根据一示例性实施例示出的另一种视频编解码中的几何划分模式预测装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
传统视频编码主要包括帧内预测、帧间预测、变换、量化、熵编码、环路滤波等几个部分。本发明主要针对帧间预测部分提出新的预测方法,帧间预测是利用视频相邻帧之间的时域相关性,使用先前已经编码的重构帧作为参考帧,通过运动估计和运动补偿的方法对当前帧(当前正在编码的帧)进行预测,从而去除视频的时间冗余信息。对于一帧图像,在编码过程中不会直接对整帧图像进行处理,需要先划分成大的编码单元(Coding TreeUnit,CTU),例如64x64、128x128大小。每个CTU可以进一步划分成方形或矩形的编码单元(Coding Unit,CU)。每个CU在参考帧中(一般为时域附近的已重构帧)寻找最相似块作为当前CU的预测块。当前块与相似块之间的相对位移为运动矢量(Motion Vector,MV)。运动估计(Motion Estimation,ME)就是将当前帧的当前编码块在参考帧中经过搜索、比较后得到运动矢量的过程。运动补偿(Motion Compensation,MC)就是利用运动矢量和参考帧得到预测帧的过程,此过程得到的预测帧可能和原始的当前帧有一定的差别,因此需要将预测帧和当前帧的差值(残差)经过变换、量化、熵编码等过程之后传递到解码端,除此之外还需要将MV和参考帧的信息传递到解码端。这样解码端通过MV、参考帧、残差就可以重构出当前帧。
如图1所示,帧间预测主要包括前向预测、后向预测、双向预测等。前向预测是利用前一重构帧(“历史帧”)对当前帧进行预测。后向预测是利用当前帧之后的帧(“将来帧”)对当前帧进行预测。双向预测是不仅利用“历史帧”也利用“将来帧”对当前帧进行预测。
在当前的视频编码标准中,编码单元CU和预测单元PU都是方形或矩形的形状,几何划分预测技术(Geometric Partition,GEO)则是将一个CU划分成两个多边形的PU,如图2所示,一个CTU包含的所有CU中,有三个CU采用的是几何划分预测,其中的斜线即为几何划分线。
如图3所示,几何划分线通过角度
Figure BDA0002987348400000081
和距离偏移ρj。也就是说,
Figure BDA0002987348400000082
和ρj可以有多种,以图4为例,将360度分为20份,
Figure BDA0002987348400000083
就有20种情况,以图5为例,ρj可以有4种情况。
然而,目前对于几何划分预测技术中的所有几何划分模式均采用同样的运动矢量候选列表构建方式,即针对当前CU,只构建一个运动矢量候选列表出来供划分出的两个PU从中选择,未能充分考虑块形状、几何划分模式与运动矢量之间不同的相关性,使得编码过程中选中运动矢量的索引消耗的比特数目大,严重影响编码性能。
为解决上述技术问题,本申请提出了一种改进的几何划分模式预测方法,即在构建运动矢量候选列表时,通过不同运动矢量的选中概率为当前CU划分出的每个PU构建出来一个候选列表,在候选列表中由于选中概率高的运动矢量,对应的索引越小,可以用较少的比特数目表示,从而能够减少编码索引的比特数目开销,提升了压缩性能。
下面分别在编码端和解码端两侧,以具体实施例对本申请提出的几何划分模式预测方法进行详细阐述。
实施例一
图6为本发明根据一示例性实施例示出的一种视频编解码中的几何划分模式预测方法的实施例流程图,所述几何划分模式预测方法应用在编码端,如图6所示,所述几何划分模式预测方法包括如下步骤:
步骤101:为目标编码单元选择一种最优几何划分模式,并基于最优几何划分模式对目标编码单元进行划分,得到两个预测单元。
其中,在几何划分预测技术中涉及多种几何划分模式,如上述图3所示,每种几何划分模式可以由角度
Figure BDA0002987348400000091
和距离偏移ρj表示。值得注意的是,本申请中所选择的最优几何划分模式为编码消耗比特数少、失真小的几何划分模式,针对具体几何划分模式的选择逻辑可以采用相关技术实现,本申请对此不进行具体限定。
进一步地,利用几何划分模式对一个编码单元CU进行划分,会得到两个多边形的预测单元PU。对于尺寸或宽高比相同的编码单元,如果采用的几何划分模式一样,那么每个编码单元得到的预测单元的形状、在编码单元中所处位置均相同。
步骤102:获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表。
其中,由于每个预测单元包含的像素数据不同,在编码时所选用的运动矢量类型也就不同,因此每个预测单元针对不同类型运动矢量的选中概率也不同,进而每个预测单元会对应有一组运动矢量的选中概率。
需要说明的是,在视频编解码中,运动矢量包括空域上的运动矢量候选、时域上的运动矢量候选、历史运动矢量候选(即HMVP,History-based Motion Vector Predictor)、平均运动矢量候选(即pairwise)、零运动矢量候选。具体介绍如下:
1)空域运动矢量候选,如图7所示,空域运动矢量候选是获取当前CU的空域临近CU的运动矢量。获取顺序依次为B0,A0,B1,A1和B2。
2)时域运动矢量候选,如图7所示,时域运动矢量候选是获取当前CU的参考帧上的同位CU的运动矢量,获取的位置为C0和C1。
3)HMVP,在传统的帧间预测候选列表构建过程中是在时域运动矢量候选之后加入,HMVP需要维护一个列表,列表中存储当前帧中已编码的CU的运动矢量,通过从列表中选出几个运动矢量作为当前CU的运动矢量候选,最多选5个HMVP。
4)Pairwise运动矢量候选,此运动矢量是通过对当前CU已有的前两个运动矢量候选进行平均得到的,如果当前CU已有的运动矢量不足2个,则不加入pairwise,并且最多有一个pairwise运动矢量候选。
5)零运动矢量候选是当前CU在x方向和y方向上的偏移都是0。
基于上述运动矢量介绍,运动矢量的类型可以包括B0,A0,B1,A1,B2,C0,C1,HMVP,pairwise,zero。B0,A0,B1,A1,B2指的是空域上临近CU的运动矢量类型,C0,C1指的是时域上同位CU的运动矢量类型,HMVP指的是已编码的CU的运动矢量的类型,Pairwise指的是当前CU已有的运动矢量的平均运动矢量的类型,zero指的是零运动矢量类型。
可以理解的是,上述给出的运动矢量的类型仅为一种示例,本申请还可以包括有其他类型。
进一步地,对于不同运动矢量的选中概率获取,可以采用离线统计方式预先获得,当然也可以采用实时统计方式获得。
对于实时统计方式,在一种可选的具体实施方式中,可以通过从已编码区域中,获取与目标编码单元尺寸或宽高比相同的至少一个历史编码单元,且所述历史编码单元采用的划分模式与为目标编码单元选择的最优几何划分模式一致,然后根据所述至少一个历史编码单元在编码时所选择的运动矢量类型,统计每个预测单元对应的各候选运动矢量的选中概率。
其中,各候选运动矢量即为上述给出的空域上的运动矢量候选、时域上的运动矢量候选、历史运动矢量候选、平均运动矢量候选、零运动矢量候选,以上述图3所示的几何划分模式得到的预测单元P0为例,如图7所示,假设在历史编码单元中,P0在编码时选择A0运动矢量5次、B0运动矢量7次、A1运动矢量2次、B1运动矢量3次、B2运动矢量7次、C0运动矢量1次、C1运动矢量1次、HMVP运动矢量0次、Pairwise运动矢量0次、零运动矢量0次,那么P0对应的A0运动矢量选中概率为5/(5+7+2+3+7+1+1+0+0+0)=0.19;B0运动矢量选中概率为7/(5+7+2+3+7+1+1+0+0+0)=0.27,A1运动矢量选中概率为2/(5+7+2+3+7+1+1+0+0+0)=0.08;B1运动矢量选中概率为3/(5+7+2+3+7+1+1+0+0+0)=0.12,以此类推,可以计算出各候选运动矢量的选中概率。
对于离线统计方式,在一种可选的具体实施方式中,可以预先收集所有已编码的历史编码单元编码时所选择的运动矢量类型进行离线统计,以获得包括不同尺寸或宽高比和不同划分模式对应的每个预测单元的各候选运动矢量的选中概率的概率集。基于此,可以通过获取所述目标编码单元的尺寸或宽高比,进而从预设的概率集中,查找与所述尺寸或宽高比、所述最优几何划分模式对应的选中概率。
在一实施例中,针对根据所述选中概率为每个预测单元构建运动矢量的第一候选列表的过程,可以对目标编码单元构建运动矢量第二候选列表,然后针对每个预测单元,根据该预测单元对应的各候选运动矢量的选中概率,确定第二候选列表中每个候选运动矢量的选中概率,进而按照选中概率从高到低的顺序,对所述第二候选列表中的候选运动矢量进行重新排列后作为该预测单元的第一候选列表。
其中,第二候选列表即为采用现有技术为目标编码单元构建的运动矢量候选列表,第二候选列表中候选运动矢量的数量提前设置好,通常固定为6个,如上述图7所示,在构建第二候选列表时,首先从空域运动矢量候选中获取,获取顺序依次为B0,A0,B1,A1和B2,最多有四个空域运动矢量候选,也就是说,只有在B0,A0,B1和A1至少一个不可得的情况下,才会加入B2;然后从时域运动矢量候选中获取,列表中最多有一个时域运动矢量候选,也就是说只有C0不可得的情况下,才会获取C1位置的时域运动矢量作为候选;其次再获取HMVP,在列表中最多有5个HMVP,最后为Pairwise运动矢量候选和零运动矢量候选。也就是说,按照上述顺序依次加入列表,一旦列表长度达到6个,则中止构建过程。
在视频编解码领域,由于候选列表中的候选运动矢量排列位置越靠前,其索引数值越小,需要的编码比特位越少,并且对于每个预测单元,不同运动矢量的选中概率不同,因此需要针对每个预测单元,按照选中概率从高到低的顺序,对第二候选列表进行重新排列,使得选中概率高的候选运动矢量排在靠前位置,索引数值小。
由此可见,每个预测单元的第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小。
在另一实施例中,针对根据所述选中概率为每个预测单元构建运动矢量的第一候选列表的过程,可以针对每个预测单元,按照选中概率从高到低的顺序,从该预测单元对应的各候选运动矢量中选择预设数量个候选运动矢量,并为选择出的每个候选运动矢量设置索引,由选择出的候选运动矢量和对应的索引组成该预设单元的第一候选列表。
也就是说,本实施例摒弃现有技术为目标编码单元构建运动矢量候选列表的过程,直接为每个预测单元构建新的候选列表。
同理,预设数量可以固定为6个。
步骤103:从每个预测单元的第一候选列表中选择一个最优运动矢量。
值得注意的是,本申请中所选择的最优运动矢量为编码消耗比特数少、失真小的几何划分模式,针对具体最优运动矢量的选择逻辑可以采用相关技术实现,本申请对此不进行具体限定。
步骤104:将每个预测单元的最优运动矢量的索引和最优几何划分模式的索引写入码流。
如图8所示,为某一编码单元的码流语法元素设计,GEO_ON表示目标编码单元是否使用了几何划分预测模式,如果使用了几何划分预测模式,需要传递GEOIdx表示具体使用的几何划分模式的索引,MergeCandIdx1和MergeCandIdx2分别表示两个PU使用的MV在候选列表中的索引。
至此,完成上述图6所示流程,在构建运动矢量候选列表时,通过不同运动矢量的选中概率为当前CU划分出的每个PU构建出来一个候选列表,在候选列表中由于选中概率高的运动矢量,对应的索引越小,可以用较少的比特数目表示,从而能够减少编码索引的比特数目开销,提升了压缩性能。
实施例二
图9为本发明根据一示例性实施例示出的另一种视频编解码中的几何划分模式预测方法的实施例流程图,所述几何划分模式预测方法应用在解码端,如图9所示,所述几何划分模式预测方法包括如下步骤:
步骤201:对码流进行解析,当解析后码流中的编码单元使用几何划分预测GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引。
如上述图8所示,当GEO_ON为1时,表示当前编码单元使用了GEO模式,具体使用的几何划分模式的索引为GEOIdx,两个PU的运动矢量的索引分别为MergeCandIdx1和MergeCandIdx2。
步骤202:获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表。
针对步骤202的具体实现,可以参见上述步骤102的相关描述,本申请在此不再一一详述。
步骤203:从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块。
如图10所示,假设编码单元PG几何划分得到PU0和PU1,为PU0获取的是运动矢量MV0,为PU1获取的是运动矢量MV1,使用MV0在后向参考帧中对编码单元PG进行运动补偿得到预测块P0,使用MV1在前向参考帧中进行运动补偿得到预测块P1,由于运动补偿过程需要对编码单元PG进行补偿,因此P0和P1的大小与编码单元PG相同。
步骤204:根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
具体地,根据预测块P0和预测块P1以及具体使用的几何划分模式GEOIdx进行如下操作,以得到最终的重构块。如图11所示,几何划分方式为图示的黑色线段,对于非边界区域,直接使用其对应的重构值,即左上区域使用P0,右下区域使用P1。对于划分线附近的像素点,为了避免边界的不连续性,使用P0和P1进行加权平均得到最终的重构值。
至此,完成上述图9所示流程,在构建运动矢量候选列表时,通过不同运动矢量的选中概率为当前CU划分出的每个PU构建出来一个候选列表,在候选列表中由于选中概率高的运动矢量,对应的索引越小,可以用较少的比特数目表示,从而能够减少编码索引的比特数目开销,提升了压缩性能。
图12为本发明根据一示例性实施例示出的一种电子设备的硬件结构图,该电子设备可以为编码端,也可以为解码端,包括:通信接口401、处理器402、机器可读存储介质403和总线404;其中,通信接口401、处理器402和机器可读存储介质403通过总线404完成相互间的通信。处理器402通过读取并执行机器可读存储介质403中与视频编解码中的几何划分模式预测方法的控制逻辑对应的机器可执行指令,可执行上文描述的视频编解码中的几何划分模式预测方法,该方法的具体内容参见上述实施例,此处不再累述。
本发明中提到的机器可读存储介质403可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:易失存储器、非易失性存储器或者类似的存储介质。具体地,机器可读存储介质403可以是RAM(Random Access Memory,随机存取存储器)、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、DVD等),或者类似的存储介质,或者它们的组合。
与前述视频编解码中的几何划分模式预测方法的实施例相对应,本发明还提供了视频编解码中的几何划分模式预测装置的实施例。
图13为本发明根据一示例性实施例示出的一种视频编解码中的几何划分模式预测装置的实施例流程图,所述装置应用于编码端,如图13所示,所述装置包括:
几何划分模块510,用于为目标编码单元选择一种最优几何划分模式,并基于所述最优几何划分模式对目标编码单元进行划分,得到两个预测单元;
列表构建模块520,用于获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动矢量选择模块530,用于从每个预测单元的第一候选列表中选择一个最优运动矢量;所述第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小;
码流生成模块540,用于将每个预测单元的最优运动矢量的索引和所述最优几何划分模式的索引写入码流。
图14为本发明根据一示例性实施例示出的另一种视频编解码中的几何划分模式预测装置的结构示意图,所述装置应用于解码端,如图14所示,所述装置包括:
码流解析模块610,用于对码流进行解析,当解析后码流中的编码单元使用GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引;
列表构建模块620,用于获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动补偿模块630,用于从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块;
重构模块640,用于根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种视频编解码中的几何划分模式预测方法,所述方法应用于编码端,其特征在于,所述方法包括:
为目标编码单元选择一种最优几何划分模式,并基于所述最优几何划分模式对目标编码单元进行划分,得到两个预测单元;
获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
从每个预测单元的第一候选列表中选择一个最优运动矢量;所述第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小;
将每个预测单元的最优运动矢量的索引和所述最优几何划分模式的索引写入码流。
2.根据权利要求1所述的方法,其特征在于,所述获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,包括:
从已编码区域中,获取与目标编码单元尺寸或宽高比相同的至少一个历史编码单元,且所述历史编码单元采用的划分模式与为目标编码单元选择的最优几何划分模式一致;
根据所述至少一个历史编码单元在编码时所选择的运动矢量类型,统计每个预测单元对应的各候选运动矢量的选中概率。
3.根据权利要求1所述的方法,其特征在于,所述获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,包括:
获取所述目标编码单元的尺寸或宽高比;
从预设的概率集中,查找与所述尺寸或宽高比、所述最优几何划分模式对应的选中概率;
其中,所述概率集包括不同尺寸或宽高比、以及不同划分模式对应的每个预测单元的各候选运动矢量的选中概率。
4.根据权利要求1所述的方法,其特征在于,所述根据所述选中概率为每个预测单元构建运动矢量的第一候选列表,包括:
对目标编码单元构建运动矢量第二候选列表;
针对每个预测单元,根据该预测单元对应的各候选运动矢量的选中概率,确定第二候选列表中每个候选运动矢量的选中概率;
按照选中概率从高到低的顺序,对所述第二候选列表中的候选运动矢量进行重新排列后作为该预测单元的第一候选列表。
5.根据权利要求1所述的方法,其特征在于,所述根据所述选中概率为每个预测单元构建运动矢量的第一候选列表,包括:
针对每个预测单元,按照选中概率从高到低的顺序,从该预测单元对应的各候选运动矢量中选择预设数量个候选运动矢量,并为选择出的每个候选运动矢量设置索引;
由选择出的候选运动矢量和对应的索引组成该预设单元的第一候选列表。
6.一种视频编解码中的几何划分模式预测方法,所述方法应用于解码端,其特征在于,所述方法包括:
对码流进行解析,当解析后码流中的编码单元使用几何划分预测GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引;
获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块;
根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
7.一种视频编解码中的几何划分模式预测装置,所述装置应用于编码端,其特征在于,所述装置包括:
几何划分模块,用于为目标编码单元选择一种最优几何划分模式,并基于所述最优几何划分模式对目标编码单元进行划分,得到两个预测单元;
列表构建模块,用于获取最优几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动矢量选择模块,用于从每个预测单元的第一候选列表中选择一个最优运动矢量;所述第一候选列表包括候选运动矢量与索引的对应关系,且候选运动矢量对应的选中概率越高,其对应的索引越小;
码流生成模块,用于将每个预测单元的最优运动矢量的索引和所述最优几何划分模式的索引写入码流。
8.一种视频编解码中的几何划分模式预测装置,所述装置应用于解码端,其特征在于,所述装置包括:
码流解析模块,用于对码流进行解析,当解析后码流中的编码单元使用几何划分预测GEO模式时,获取所述编码单元使用的几何划分模式的索引和两个预测单元的运动矢量的索引;
列表构建模块,用于获取所述几何划分模式下每个预测单元对应的各候选运动矢量的选中概率,根据所述选中概率为每个预测单元构建运动矢量的第一候选列表;
运动补偿模块,用于从每个预测单元的第一候选列表中获取索引对应的运动矢量,并利用为每个预测单元获取的运动矢量进行运动补偿,得到每个预测单元的预测块;
重构模块,用于根据每个预测单元的预测块进行重构,得到所述编码单元的重构块。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-5或权利要求6任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5或权利要求6任一项所述方法的步骤。
CN202110303899.4A 2021-03-22 2021-03-22 一种视频编解码中的几何划分模式预测方法及装置 Active CN113225555B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110303899.4A CN113225555B (zh) 2021-03-22 2021-03-22 一种视频编解码中的几何划分模式预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110303899.4A CN113225555B (zh) 2021-03-22 2021-03-22 一种视频编解码中的几何划分模式预测方法及装置

Publications (2)

Publication Number Publication Date
CN113225555A true CN113225555A (zh) 2021-08-06
CN113225555B CN113225555B (zh) 2023-02-07

Family

ID=77084227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110303899.4A Active CN113225555B (zh) 2021-03-22 2021-03-22 一种视频编解码中的几何划分模式预测方法及装置

Country Status (1)

Country Link
CN (1) CN113225555B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113453016A (zh) * 2021-08-30 2021-09-28 康达洲际医疗器械有限公司 一种用于图像流文件压缩的运动矢量自选择方法
CN113794882A (zh) * 2021-08-31 2021-12-14 绍兴市北大信息技术科创中心 一种帧内快速编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939758A (zh) * 2010-06-09 2013-02-20 索尼公司 图像解码装置、图像编码装置及其方法和程序
CN104025601A (zh) * 2011-12-30 2014-09-03 数码士有限公司 编码三维图像的方法和设备以及解码方法和设备
US20150281726A1 (en) * 2012-11-06 2015-10-01 Nec Corporation Video encoding method, video encoding device, and video encoding program
CN111246212A (zh) * 2020-02-21 2020-06-05 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102939758A (zh) * 2010-06-09 2013-02-20 索尼公司 图像解码装置、图像编码装置及其方法和程序
US20130070857A1 (en) * 2010-06-09 2013-03-21 Kenji Kondo Image decoding device, image encoding device and method thereof, and program
CN104025601A (zh) * 2011-12-30 2014-09-03 数码士有限公司 编码三维图像的方法和设备以及解码方法和设备
US20150281726A1 (en) * 2012-11-06 2015-10-01 Nec Corporation Video encoding method, video encoding device, and video encoding program
CN111246212A (zh) * 2020-02-21 2020-06-05 北京大学 一种基于编解码端的几何划分模式预测方法、装置、存储介质及终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAITAO YANG 等: "JVET-Q0794,BoG report of contributions on inter prediction and motion vector coding", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113453016A (zh) * 2021-08-30 2021-09-28 康达洲际医疗器械有限公司 一种用于图像流文件压缩的运动矢量自选择方法
CN113794882A (zh) * 2021-08-31 2021-12-14 绍兴市北大信息技术科创中心 一种帧内快速编码方法
CN113794882B (zh) * 2021-08-31 2023-12-29 绍兴市北大信息技术科创中心 一种帧内快速编码方法

Also Published As

Publication number Publication date
CN113225555B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN110809161B (zh) 运动信息候选者列表构建方法及装置
RU2608264C2 (ru) Способ и устройство для кодирования/декодирования вектора движения
US20170374379A1 (en) Picture prediction method and related apparatus
RU2699258C2 (ru) Способ прогнозирования изображения и устройство прогнозирования изображения
CN107770524B (zh) 一种视频编解码处理方法及装置
RU2659733C2 (ru) Способ и устройство для кодирования и декодирования вектора движения на основании сокращенных предсказателей-кандидатов вектора движения
TWI616089B (zh) 解碼器、編碼器、及相關聯方法和電腦程式
CN103748880B (zh) 图像序列的编码方法和装置及图像序列的解码方法和装置
CN115002478B (zh) 编码或解码视频数据的方法和装置
GB2519514A (en) Method and apparatus for displacement vector component prediction in video coding and decoding
CN113225555B (zh) 一种视频编解码中的几何划分模式预测方法及装置
CN110710212A (zh) 通过子像素运动矢量细化对视频数据进行编码或解码的方法和装置
US20220360814A1 (en) Enhanced motion vector prediction
CN114827623A (zh) 用于视频编解码的边界扩展
CN111901590B (zh) 一种用于帧间预测的细化运动矢量存储方法及装置
CN112261413B (zh) 视频编码方法、编码装置、电子设备和存储介质
CN110149512A (zh) 帧间预测加速方法、控制装置、电子装置、计算机存储介质及设备
CN109688411B (zh) 一种视频编码率失真代价估计方法和装置
CN114143536B (zh) 一种shvc空间可伸缩帧的视频编码方法
CN111510726A (zh) 一种编解码方法及其设备
CN110868611B (zh) 视频编码、解码方法及装置
WO2022236316A1 (en) Enhanced motion vector prediction
CN104104955A (zh) 一种图像块的编解码方法和装置
CN116266865A (zh) 一种H265格式的merge模式下运动补偿运算的硬件加速方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant