CN112005549A - 用于编码块标志(cbf)和预测模式的改进的上下文设计的方法和装置 - Google Patents

用于编码块标志(cbf)和预测模式的改进的上下文设计的方法和装置 Download PDF

Info

Publication number
CN112005549A
CN112005549A CN201980027147.0A CN201980027147A CN112005549A CN 112005549 A CN112005549 A CN 112005549A CN 201980027147 A CN201980027147 A CN 201980027147A CN 112005549 A CN112005549 A CN 112005549A
Authority
CN
China
Prior art keywords
prediction mode
intra
encoded
inter
current block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980027147.0A
Other languages
English (en)
Other versions
CN112005549B (zh
Inventor
赵欣
李翔
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent America LLC
Original Assignee
Tencent America LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent America LLC filed Critical Tencent America LLC
Priority to CN202211214870.XA priority Critical patent/CN115623202A/zh
Publication of CN112005549A publication Critical patent/CN112005549A/zh
Application granted granted Critical
Publication of CN112005549B publication Critical patent/CN112005549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

控制帧内‑帧间预测的方法由至少一个处理器执行,该方法用于视频序列解码或编码。该方法包括:确定当前块的相邻块是否通过帧内‑帧间预测模式被编码;以及基于相邻块被确定为通过帧内‑帧间预测模式被编码而进行下述操作:使用与帧内‑帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码,设置与相邻块相关联的预测模式标志,基于与相邻块相关联的预测模式标志得出上下文值,以及使用得出的上下文值执行对与当前块相关联的预测模式标志的熵编码,该与所述当前块相关联的预测模式标志指示当前块被帧内编码。

Description

用于编码块标志(CBF)和预测模式的改进的上下文设计的方 法和装置
相关申请的交叉引用
本申请要求美国专利和商标局中于2018年11月14日提交的美国临时专利申请第62/767,473号以及2019年6月27日在提交的美国申请第16/454,294号的优先权,上述申请的全部内容通过引用并入本文中。
背景技术
1.技术领域
符合实施方式的方法和装置涉及视频编码,更特别地,涉及关于对预测模式和编码块标志(CBF)进行熵编码的改进的上下文设计的方法和装置。
2.相关技术的描述
图1A中示出了在高效视频编码(High Efficiency Video Coding,HEVC)中使用的帧内预测模式。在HEVC中,共有35个帧内预测模式,在这些帧内预测模式中,模式10(101)是水平模式,模式26(102)是竖直模式,并且模式2(103)、模式18(104)和模式34(105)是对角模式。这些帧内预测模式由三个最可能模式(MPM)和32个其余模式用信号表示。
关于通用视频编码(versatile video coding,VVC),以下示出了部分编码单元语法表。在切片类型不是帧内并且未选择跳过模式的情况下用信号表示标志pred_mode_flag,并且仅使用一个上下文(例如,变量pred_mode_flag)来编码此标志。部分编码单元语法表如下:
7.3.4.5编码单元语法
Figure BDA0002733687330000021
参考图1B,在VVC中,共有87个帧内预测模式,在这些帧内预测莫使中,模式18(106)是水平模式,模式50(107)是竖直模式,并且模式2(108),模式34(109)和模式66(110)是对角模式。模式-1至模式-10(111)以及模式67至模式76(112)被称为广角帧内预测(Wide-Angle Intra Prediction,WAIP)模式。
对于帧内编码块的色度分量,编码器选择下述五个模式中的最佳色度预测模式,所述五个模式包括平面模式(模式索引0)、DC模式(模式索引1)、水平模式(模式索引18)、竖直模式(模式索引50)以及对角模式(模式索引66),并且选择所关联的亮度分量的帧内预测模式的直接复本,即DM模式。在下面的表1中示出了色度的帧内预测方向与帧内预测模式编号之间的映射:
表1-色度的帧内预测方向与帧内预测模式之间的映射
Figure BDA0002733687330000022
为了避免重复模式,根据所关联的亮度分量的帧内预测模式来分配除DM模式之外的四种模式。当色度分量的帧内预测模式编号是4时,使用亮度分量的帧内预测方向以用于色度分量的帧内预测样本生成。当色度分量的帧内预测模式编号不是4并且与亮度分量的帧内预测模式编号相同时,使用帧内预测方向66以用于色度分量的帧内预测样本生成。
多假设帧内-帧间预测将一个帧内预测和一个合并索引预测组合在一起,即,帧内-帧间预测模式。在合并编码单元(Coding unit,CU)中,针对合并模式用信号发送一个标志以用于在该标志为真时从帧内候选列表选择帧内模式。对于亮度分量,帧内候选列表从包括DC模式、平面模式、水平模式和竖直模式的4个帧内预测模式得出,并且取决于块形状,帧内候选列表的大小可以为3或4。当CU宽度大于CU高度的两倍时,从帧内候选列表去除水平模式,而当CU高度大于CU宽度的两倍时,从帧内候选列表去除竖直模式。使用加权平均将通过帧内模式索引选择的一个帧内预测模式与通过合并索引选择的一个合并索引预测组合在一起。对于色度分量,总是应用DM而无需额外的信令。
用于组合预测的权重如以下所述。在已选择DC模式或平面模式或者编码块(Coding Block,CB)宽度或高度小于4的情况下,应用相等的权重。对于CB宽度或高度大于或等于4的那些CB,在已选择水平/竖直模式的情况下,首先将一个CB竖直/水平地分割成四个等面积区域。将向每个区域应用对应的权重集,权重集被表示为(w_intrai,w_interi),其中i从1至4,并且(w_intra1,w_inter1)=(6,2),(w_intra2,w_inter2)=(5,3),(w_intra1,w_inter3)=(3,5),并且(w_intra4,w_inter4)=(2,6)。(w_intra1,w_inter1)针对最接近参考样本的区域,并且(w_intra4,w_inter4)针对最远离参考样本的区域。然后,可以通过将两个加权预测相加并右移3比特来计算组合预测。此外,可以保存预测器的帧内假设的帧内预测模式以用于在随后的相邻CB被帧内编码的情况下对这些CB进行帧内模式编码。
发明内容
根据实施方式,一种控制用于视频序列解码或编码的帧内-帧间预测的方法由至少一个处理器执行。该方法包括:确定当前块的相邻块是否通过帧内-帧间预测模式被编码;以及基于相邻块被确定为通过帧内-帧间预测模式被编码而执行下述操作:使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码,设置与相邻块相关联的预测模式标志,基于与所设置的相邻块相关联的预测模式标志得出上下文值,以及使用得出的上下文值执行对与当前块相关联的预测模式标志的熵编码,该预测模式标志指示当前块被帧内编码。
根据实施方式,一种用于控制用于视频序列解码或编码的帧内-帧间预测的装置包括:至少一个存储器,其被配置成存储计算机程序代码;以及至少一个处理器,其被配置成访问所述至少一个存储器,并且根据计算机程序代码进行操作。计算机程序代码包括:第一确定代码,其被配置成使至少一个处理器确定当前块的相邻块是否通过帧内-帧间预测模式被编码;执行代码,其被配置成使至少一个处理器基于相邻块被确定为通过帧内-帧间预测模式被编码而使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码;以及设置代码,其被配置成使至少一个处理器基于相邻块被确定为通过帧内-帧间预测模式被编码而进行以下操作:设置与相邻块相关联的预测模式标志,基于所设置的与相邻块相关联的预测模式标志得出上下文值,以及使用得出的上下文值执行对与当前块相关联的预测模式标志的熵编码,该预测模式标志指示当前块被帧内编码。
根据实施方式,一种存储有指令的非暂态计算机可读存储介质,该指令使至少一个处理器进行以下操作:确定当前块的相邻块是否通过帧内-帧间预测模式被编码;以及基于相邻块被确定为通过帧内-帧间预测模式被编码而进行以下操作:使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码;设置与相邻块相关联的预测模式标志;基于所设置的与相邻块相关联的预测模式标志得出上下文值;以及使用得出的上下文值执行对与当前块相关联的预测模式标志的熵编码,该预测模式标志指示当前块被帧内编码。
附图说明
图1A是HEVC中的帧内预测模式的图。
图1B是VVC中的帧内预测模式的图。
图2是根据实施方式的通信系统的简化框图。
图3是根据实施方式的在流式传输环境中视频编码器和视频解码器的布置的图。
图4是根据实施方式的视频解码器的功能框图。
图5是根据实施方式的视频编码器的功能框图。
图6是根据实施方式的当前块和当前块的相邻块的图。
图7是示出根据实施方式的控制用于视频序列解码或编码的帧内-帧间预测的方法的流程图。
图8是根据实施方式的用于控制用于视频序列解码或编码的帧内-帧间预测的装置的简化框图。
图9是适于实现实施方式的计算机系统的图。
具体实施方式
图2是根据实施方式的通信系统(200)的简化框图。通信系统(200)可以包括经由网络(250)互连的至少两个终端(210至220)。对于单向数据传输,第一终端(210)可以对本地位置处的视频数据进行编码,以经由网络(250)传输至另一终端(220)。第二终端(220)可以从网络(250)接收另一终端的已编码视频数据,对已编码数据进行解码,并且显示恢复的视频数据。单向数据传输在媒体服务应用等可能常见。
图2示出了第二对终端(230,240),其被提供以支持例如在视频会议期间可能发生的已编码视频的双向传输。对于双向数据传输,每个终端(230,240)可以对在本地位置处捕获的视频数据进行编码,以用于经由网络(250)传输至另一终端。每个终端(230,240)还可以接收由另一终端传输的已编码视频数据,可以对已编码数据进行解码并且可以在本地显示装置处显示恢复的视频数据。
在图2中,终端(210至240)可以被图示为服务器、个人计算机和智能电话,但是实施方式的原理不限于此。实施方式适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(250)表示在终端(210至240)之间传送已编码视频数据的任何数目的网络,包括例如有线和/或无线通信网络。通信网络(250)可以在电路交换和/或分组交换信道中交换数据。代表性网络包括电信网络、局域网、广域网和/或因特网。出于本论述的目的,除非在下文中有所说明,否则网络(250)的架构和拓扑对于实施方式的操作来说可以是不重要的。
图3是根据实施方式的在流式传输环境中视频编码器和视频解码器的布置的图。所公开的主题可以同等地适用于其他支持视频的应用,包括例如视频会议,数字TV,在包括CD、DVD、存储棒等的数字介质上存储压缩视频等。
流式传输系统可以包括捕获子系统(313),该捕获子系统可以包括视频源(301)(例如数码相机),该视频源创建例如未压缩的视频样本流(302)。相较于已编码的视频比特流,该样本流(302)被描绘为粗线以强调高数据量,该样本流(302)可以由耦接至摄像装置(301)的编码器(303)处理。编码器(303)可以包括硬件、软件或其组合,以实现或实施如下更详细地描述的所公开的主题的各方面。与样本流相比,已编码视频比特流(304)被描绘为细线以强调较低数据量,已编码视频比特流(304)可以存储在流式传输服务器(305)上以供将来使用。一个或更多个流式传输客户端(306,308)可以访问流式传输服务器(305)以检索已编码视频比特流(304)的副本(307,309)。客户端(306)可以包括视频解码器(310),其对已编码视频比特流的传入副本(307)进行解码,并且创建可以在显示器(312)或其他呈现设备(未描绘)上呈现的传出视频样本流(311)。在一些流式传输系统中,可以根据某些视频编解码/压缩标准对视频比特流(304,307,309)进行编码。这些标准的示例包括ITU-T H.265建议书。开发中的视频编码标准被非正式地称为VVC。所公开的主题可以用于VVC的上下文中。
图4是根据实施方式的视频解码器(310)的功能框图。
接收器(410)可以接收要由解码器(310)解码的一个或更多个编解码器视频序列;在同一实施方式或另一实施方式中,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其他已编码视频序列。可以从信道(412)接收已编码视频序列,该信道可以是去往存储已编码视频数据的存储设备的硬件/软件链路。接收器(410)可以接收已编码视频数据以及其他数据,例如,可以被转发至其各自的使用实体(未描绘)的已编码音频数据和/或辅助数据流。接收器(410)可以将已编码视频序列与其他数据分开。为了应对网络抖动,可以在接收器(410)与熵解码器/解析器(420)(此后称为“解析器”)之间耦接缓冲存储器(415)。在接收器(410)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据的情况下,可以不需要缓冲存储器(415),或者缓冲器(615)可以很小。为了尽可能地使用诸如因特网的分组网络,可能需要缓冲存储器(415),其可以相对较大并且可以有利地具有自适应大小。
视频解码器(310)可以包括解析器(420),以根据已熵编码的视频序列重建符号(421)。这些符号的类别包括用于管理解码器(310)的操作的信息,以及潜在地包括用以控制诸如显示器(312)的呈现设备的信息,该呈现设备不是解码器的组成部分但是可以耦接至解码器,如图4所示。用于呈现设备的控制信息可以是补充增强信息(SupplementalEnhancement Information,SEI消息)或视频可用性信息(Video Usability Information,VUI)参数集片段(未描绘)的形式。解析器(420)可以对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可以根据视频编码技术或标准进行,并且可以遵循本领域技术人员公知的原理,包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等。解析器(420)可以基于与群组对应的至少一个参数从已编码视频序列提取用于视频解码器中的像素子群组中的至少一个子群组的子群组参数集。子群组可以包括:图片群组(Group of Pictures,GOP)、图片、图块、切片、宏块、编码单元(CodingUnit,CU)、块、变换单元(Transform Unit,TU)、预测单元(Prediction Unit,PU)等。熵解码器/解析器还可以从已编码视频序列提取信息,例如变换系数、量化器参数(quantizerparameter,QP)值、运动矢量等。
解析器(420)可以对从缓冲存储器(415)接收的视频序列执行熵解码/解析操作,从而创建符号(421)。解析器(420)可以接收已编码数据,并且选择性地对特定符号(421)进行解码。此外,解析器(420)可以确定特定符号(421)是否将被提供到运动补偿预测单元(453)、缩放器/逆变换单元(451)、帧内预测单元(452)或环路滤波器(454)。
取决于已编码视频图片或已编码视频图片的部分的类型(诸如:帧间图片和帧内图片、帧间块和帧内块)以及其他因素,符号(421)的重建可以涉及多个不同单元。涉及哪些单元以及涉及方式可以由经解析器(420)从已编码视频序列解析的子群组控制信息来控制。为了简洁起见,未描述解析器(420)与以下多个单元之间的这种子群组控制信息流。
除了已经提及的功能块之外,解码器(310)可以在概念上细分为如下所述的多个功能单元。在商业约束下运行的实际实现方式中,这些单元中的许多单元彼此紧密交互并且可以至少部分地彼此集成。然而,出于描述所公开的主题的目的,在概念上细分为下面的功能单元是适当的。
第一单元是缩放器/逆变换单元(451)。缩放器/逆变换单元(451)从解析器(420)接收作为符号(421)的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。它可以输出包括可以输入到聚合器(455)中的样本值的块。
在一些情况下,缩放器/逆变换(451)的输出样本可以属于帧内编码块;即:不使用来自先前重建的图片的预测性信息、但可以使用来自当前图片的先前重建部分的预测性信息的块。这样的预测性信息可以由帧内预测单元(452)提供。在一些情况下,帧内图片预测单元(452)使用从当前(部分重建的)图片(456)取得的周围已重建信息来生成大小和形状与重建中的块相同的块。在一些情况下,聚合器(455)以每个样本为基础将帧内预测单元(452)已经生成的预测信息添加到由缩放器/逆变换单元(451)提供的输出样本信息。
在其他情况下,缩放器/逆变换单元(451)的输出样本可以属于帧间编码并且可能经运动补偿的块。在这种情况下,运动补偿预测单元(453)可以访问参考图片缓冲器(457)以取得用于预测的样本。在根据属于块的符号(421)对取得的样本进行运动补偿之后,这些样本可以由聚合器(455)添加到缩放器/逆变换单元的输出(在这种情况下被称为残差样本或残差信号),从而生成输出样本信息。运动补偿单元从中取得预测样本的参考图片存储器内的地址可以由运动矢量控制,运动矢量能够以符号(421)的形式供运动补偿单元使用,符号(621)可以具有例如X、Y和参考图片分量。运动补偿还可以包括在使用子样本精确运动矢量时,从参考图片存储器取得的样本值的内插、运动矢量预测机制等。
聚合器(455)的输出样本可以在环路滤波器单元(454)中经受各种环路滤波技术。视频压缩技术可以包括环路内滤波器技术,环路内滤波器技术受控于包括在已编码视频比特流中的参数并且所述参数作为来自解析器(420)的符号(421)可用于环路滤波器单元(454),然而视频压缩技术还可以响应于在对已编码图片或已编码视频序列的先前(按解码次序)部分进行解码期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
环路滤波器单元(454)的输出可以是样本流,该样本流可以输出到呈现设备(312)以及存储在参考图片缓冲器(456)中以在将来的图片间预测中使用。
某些已编码图片一旦完全重建就可以用作参考图片以用于将来预测。一旦已编码图片被完全重建,并且该已编码图片(通过例如解析器(420))被识别为参考图片,则当前参考图片(456)可以变为参考图片缓冲器(457)的一部分,并且可以在开始重建后续的已编码图片之前重新分配新的当前图片存储器。
视频解码器(310)可以根据可以记录在诸如ITU-T H.265建议书的标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循如在视频压缩技术文档或标准中且明确地在其配置文件中指定的视频压缩技术或标准的语法的意义上,已编码视频序列可以符合由所使用的视频压缩技术或标准指定的语法。对于合规性,还要求已编码视频序列的复杂度在由视频压缩技术或标准的层级限定的范围内。在一些情况下,层级限制最大图片大小、最大帧速率、最大重建样本速率(以例如每秒兆个样本为单位进行度量)、最大参考图片大小等。在一些情况下,由层级设置的限制可以通过假设参考解码器(HypotheticalReference Decoder,HRD)规范以及在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。
在实施方式中,接收器(410)可以随着已编码视频一起接收附加(冗余)数据。附加数据可以被包括为已编码视频序列的一部分。附加数据可以由视频解码器(310)使用以对数据进行适当解码和/或更准确地重建原始视频数据。附加数据可以是例如时间、空间或信噪比(SNR)增强层、冗余切片、冗余图片、前向纠错码等形式。
图5是根据实施方式的视频编码器(303)的功能框图。
编码器(303)可以从视频源(301)(其不是编码器的一部分)接收视频样本,该视频源可以捕获要由编码器(303)编码的视频图像。
视频源(301)可以提供要由编码器(303)编码的数字视频样本流形式的源视频序列,数字视频样本流可以具有任何合适的比特深度(例如:8比特、10比特、12比特等)、任何色彩空间(例如,BT.601Y CrCB、RGB等)和任何合适的采样结构(例如Y CrCb 4:2:0、Y CrCb4:4:4)。在媒体服务系统中,视频源(301)可以是存储先前准备的视频的存储设备。在视频会议系统中,视频源(301)可以是捕获本地图像信息作为视频序列的摄像装置。可以将视频数据提供为在按次序观看时被赋予运动的多个单独的图片。图片自身可以被组织为空间像素阵列,其中,取决于所使用的采样结构、色彩空间等,每个像素可以包括一个或更多个样本。本领域技术人员可以容易地理解像素与样本之间的关系。以下描述侧重于样本。
根据实施方式,编码器(303)可以实时地或者在应用所需的任何其他时间约束下将源视频序列的图片编码并压缩为已编码视频序列(543)。施行适当的编码速度是控制器(550)的一个功能。控制器控制如下所述的其他功能单元,并且在功能上耦接至这些单元。为简洁起见未描绘耦接。由控制器设置的参数可以包括:速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(GOP)布局、最大运动矢量搜索范围等。本领域技术人员可以容易地将控制器(550)的其他功能识别为其可以涉及针对特定系统设计而优化的视频编码器(303)。
一些视频编码器以本领域技术人员所容易了解的“编码环路”进行操作。作为过于简化的描述,编码环路可以包括:编码器(530)(此后称为“源编码器”)的编码部分(负责基于要编码的输入图片和参考图片创建符号),以及嵌入编码器(303)中的(本地)解码器(533),解码器(533)重建符号以创建(远程)解码器也将创建的样本数据(因为在所公开的主题中考虑的视频压缩技术中,符号与已编码视频比特流之间的任何压缩是无损的)。这个重建的样本流被输入至参考图片存储器(534)。由于符号流的解码得到与解码器位置(本地或远程)无关的比特精确结果,因此参考图片缓冲器内容在本地编码器与远程编码器之间也是位精确的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器在解码期间使用预测时将“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如由于信道误差而无法维持同步性的情况下产生的漂移)对于本领域技术人员来说是公知的。
“本地”解码器(533)的操作可以与已经在上文结合图4详细描述的“远程”解码器(310)的操作相同。然而,还简要地参照图4,当符号可用并且熵编码器(545)和解析器(420)能够无损地将符号编码/解码为已编码视频序列时,可以不需在解码器(533)中完全实现包括信道(412)、接收器(410)、缓冲存储器(415)和解析器(420)的解码器(310)的熵解码部分。
此时可以观察到,除了存在于解码器中的解析/熵解码之外的任何解码器技术也必然需要以基本相同的功能形式存在于对应的编码器中。由于编码器技术与已全面描述的解码器技术互逆,因此可以简化对编码器技术的描述。在下文中仅在某些地方需要并提供更详细的描述。
作为源编码器(530)的操作的一部分,源编码器(530)可以执行运动补偿预测编码,运动补偿预测编码参考来自视频序列中被指定为“参考帧”的一个或更多个先前编码的帧对输入帧进行预测性编码。以此方式,编码引擎(532)对输入帧的像素块与可以被选择为输入帧的预测参考的参考帧的像素块之间的差进行编码。
解码器(533)可以基于由源编码器(530)创建的符号对可以被指定为参考帧的帧的已编码视频数据进行解码。编码引擎(532)的操作可以有利地是有损处理。当已编码视频数据可以在视频解码器(图4中未示出)处被解码时,重建的视频序列通常可以是具有一些误差的源视频序列的复制品。解码器(533)复制可以由视频解码器对参考帧执行的解码处理,并且可以使重建的参考帧存储在参考图片缓存(534)中。以此方式,视频编码器(303)可以在本地存储重建的参考帧的副本,这些副本与将由远端视频解码器获得的重建的参考帧具有共同内容(不存在传输误差)。
预测器(535)可以针对编码引擎(532)执行预测搜索。即,对于要编码的新帧,预测器(535)可以在参考图片存储器(534)中搜索可以用作新图片的适当预测参考的样本数据(作为候选参考像素块)或特定元数据,例如参考图片运动矢量、块形状等。预测器(535)可以基于样本块逐像素块进行操作,以找到合适的预测参考。在一些情况下,根据由预测器(535)获得的搜索结果所确定的,输入图片可以具有从参考图片存储器(534)中存储的多个参考图片取得的预测参考。
控制器(550)可以管理源编码器(530)的编码操作,包括例如对用于对视频数据进行编码的参数和子群组参数的设置。
可以在熵编码器(545)中对所有上述功能单元的输出进行熵编码。熵编码器通过根据本领域技术人员已知的技术(例如霍夫曼编码、可变长度编码、算术编码等)对由各种功能单元生成的符号进行无损压缩来将这些符号转换成已编码视频序列。
传输器(540)可以缓冲由熵编码器(545)创建的已编码视频序列,从而为经由通信信道(560)进行传输做准备,该通信信道可以是通向可以存储已编码视频数据的存储设备的硬件/软件链路。传输器(540)可以将来自源编码器(530)的已编码视频数据与要传输的其他数据合并,所述其他数据例如已编码音频数据和/或辅助数据流(未示出源)。
控制器(550)可以管理编码器(303)的操作。在编码期间,控制器(550)可以为每个已编码图片分配特定的已编码图片类型,这可能影响可以应用于相应的图片的编码技术。例如,通常可以将图片分配为以下帧类型之一:
帧内图片(I图片),其可以是不将序列中的任何其他帧用作预测源就可以被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(Independent Decoder Refresh)图片。本领域技术人员了解I图片的这些变型及其相应的应用和特征。
预测性图片(P图片),其可以是可以使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
双向预测性图片(B图片),其可以是可以使用帧内预测或帧间预测进行编码和解码的图片,该帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多预测性图片可以使用多于两个参考图片和相关联的元数据以进行单个块的重建。
源图片通常可以在空间上细分为多个样本块(例如,分别具有4×4、8×8、4×8或16×16个样本的块)并且被逐块地编码。可以参考其他(已编码)块对这些块进行预测性编码,所述其他块根据通过对块的相应图片应用的编码分配来确定。例如,可以对I图片的块进行非预测性编码,或者可以参考同一图片的已编码块对其进行预测性编码(空间预测或帧内预测)。P图片的像素块可以参考一个先前编码的参考图片经由空间预测或经由时间预测进行非预测性编码。B图片的块可以参考一个或两个先前编码的参考图片经由空间预测或经由时间预测进行非预测性编码。
视频编码器(303)可以根据诸如ITU-T H.265建议书的预定的视频编码技术或标准来执行编码操作。在视频编码器(303)操作中,视频编码器(303)可以执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测性编码操作。因此,已编码视频数据可以符合由所使用的视频编码技术或标准指定的语法。
在实施方式中,传输器(540)可以随着已编码视频传输附加数据。源编码器(530)可以包括这样的数据作为已编码视频序列的一部分。附加数据可以包括时间/空间/SNR增强层、其他形式的冗余数据如冗余图片和切片、补充增强信息(SEI)消息、视觉可用性信息(VUI)参数集片段等。
在现有技术中,为了将指示块被帧内编码还是帧间编码的标志pred_mode_flag编码,仅使用一个上下文,而且不使用对相邻块应用的标志的值。此外,当相邻块通过帧内-帧间预测模式被编码时,使用帧内预测模式和帧间预测模式的混合来预测该相邻块,并且因此,对于用信号通知标志pred_mode_flag的上下文设计而言,考虑是否使用帧内-帧间预测模式对相邻块进行编码可能更有效。
本文描述的实施方式可以单独使用或以任何顺序组合使用。在下文中,标志pred_mode_flag指示当前块被帧内编码还是被帧间编码。
图6是根据实施方式的当前块和当前块的相邻块的图。
参照图6,示出了当前块(610)以及当前块(610)的顶部相邻块(620)和左侧相邻块(630)。顶部相邻块(620)和左侧相邻块(630)中的每个的宽度为4并且高度为4。
在实施方式中,使用关于相邻块(例如,顶部相邻块(620)和左侧相邻块(630))是通过帧内预测模式、帧间预测模式还是帧内-帧间预测模式被编码的信息得出用于对当前块(例如,当前块(610))的标志pred_mode_flag进行熵编码的上下文值。详细地说,当通过帧内-帧间预测模式对相邻块进行编码时,相关联的帧内预测模式被用于当前块的帧内模式编码和/或MPM推导,但是在推导用于对当前块的标志pred_mode_flag进行熵编码的上下文值时,尽管针对相邻块使用了帧内预测,但还是认为该相邻块是帧间编码块。
在一个示例中,帧内-帧间预测模式的相关联帧内预测模式始终为平面模式。
在另一示例中,帧内-帧间预测模式的相关联帧内预测模式始终为DC模式。
在又一示例中,相关联的帧内预测模式与在帧内-帧间预测模式中应用的帧内预测模式对准。
在实施方式中,在通过帧内-帧间预测模式对相邻块(例如,顶部相邻块(620)和左侧相邻块(630))编码的情况下,相关联的帧内预测模式被用于当前块(例如,当前块(610))的帧内模式编码和/或MPM推导,而在推导用于对当前块的标志pred_mode_flag进行熵编码的上下文值时,也认为相邻块是帧内编码块。
在一个示例中,帧内-帧间预测模式的相关联帧内预测模式始终为平面模式。
在另一示例中,帧内-帧间预测模式的相关联帧内预测模式始终为DC模式。
在又一示例中,相关联的帧内预测模式与在帧内-帧间预测模式中应用的帧内预测模式对准。
在一个实施方式中,在相邻块分别通过帧内预测模式、帧间预测模式和帧间-帧内预测模式被编码的情况下,上下文索引或值分别递增2、0和1。
在另一实施方式中,在相邻块分别通过帧内预测模式、帧间预测模式和帧间-帧内预测模式被编码的情况下,上下文索引或值分别递增1、0和0.5,并且最终的上下文索引被近似到最接近的整数。
在针对当前块的所有相邻块递增了上下文索引或值并且确定了最终上下文索引之后,可以基于所确定的最终上下文索引除以相邻块的数目并且近似到最接近的整数来确定平均上下文索引。基于所确定的平均上下文索引,可以将标志pred_mode_flag设置为指示当前块被帧内编码或者被帧间编码,并且执行算术编码以对当前块的pred_mode_flag进行编码。
在实施方式中,使用关于当前块(例如,当前块(610))是通过帧内预测模式、帧间预测模式还是帧间-帧内预测模式被编码的信息得出用于对当前块的CBF进行熵编码的一个或更多个上下文值。
在一个实施方式中,使用三个单独的上下文(例如,变量)以用于对CBF进行熵编码:一个上下文用于当前块通过帧内预测模式被编码的情况,一个上下文用于当前块通过帧间预测模式被编码的情况,以及一个上下文用于当前块通过帧内-帧间预测模式被编码的情况。这三个单独的上下文可以仅应用于对亮度CBF编码、仅应用于对色度CBF编码、或者仅应用于对亮度CBF和色度CBF两者编码。
在另一实施方式中,使用两个单独的上下文(例如,变量)以用于对CBF进行熵编码:一个上下文用于当前块通过帧内预测模式被编码的情况,一个上下文用于当前块通过帧间预测模式或帧内-帧间预测模式被编码的情况。这两个单独的上下文可以仅应用于对亮度CBF编码、仅应用于对色度CBF编码、或者仅应用于对亮度CBF和色度CBF两者编码。
在又一实施方式中,使用两个单独的上下文(例如,变量)以用于对CBF进行熵编码:一个上下文用于当前块通过帧内预测模式或帧内-帧间预测模式被编码的情况,一个上下文用于当前块通过帧间预测模式被编码的情况。这两个单独的上下文可以仅应用于对亮度CBF编码、仅应用于对色度CBF编码或者仅应用于对亮度和色度CBF两者编码。
图7是示出根据实施方式的控制用于视频序列解码或编码的帧内-帧间预测的方法(700)的流程图。在一些实现方式中,图7的一个或更多个处理块可以由解码器(310)执行。在一些实现方式中,图7的一个或更多个处理块可以由与解码器(310)分开或包括解码器(310)的另一设备或设备组(例如,编码器(303))执行。
参照图7,在第一块(710)中,方法(700)包括确定当前块的相邻块是否通过帧内-帧间预测模式被编码。基于相邻块被确定为不是通过帧内-帧间预测模式被编码(710-否),方法(700)结束。
基于相邻块被确定为通过帧内-帧间预测模式被编码(710-是),在第二块(720)中,方法(700)包括使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码。
在第三块(730)中,方法(700)包括设置与相邻块相关联的预测模式标志。
在第四块(740)中,方法(700)包括基于所设置的与相邻块相关联的预测模式标志得出上下文值。
在第五块(750)中,方法(700)包括使用得出的上下文值执行与当前块相关联的预测模式标志的熵编码,该预测模式标志指示当前块被帧内编码。
方法(700)还可以包括基于相邻块被确定为通过帧内-帧间预测模式被编码(710-是),使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的MPM推导。
与帧内-帧间预测模式相关联的帧内预测模式可以是平面模式、DC模式或在帧内-帧间预测模式中应用的帧内预测模式。
设置与相邻块相关联的预测模式标志可以包括设置与相邻块相关联的预测模式标志以指示该相邻块被帧内编码。
设置与相邻块相关联的预测模式标志可以包括设置与相邻块相关联的预测模式标志以指示该相邻块被帧间编码。
方法(700)还可以包括:确定相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码;基于相邻块被确定为通过帧内预测模式被编码,将与当前块相关联的预测模式标志的上下文索引递增2,基于相邻块被确定为通过帧间预测模式被编码,将上下文索引递增0,基于相邻块被确定为通过帧内-帧间预测模式被编码,将上下文索引递增1;基于递增后的上下文索引以及当前块的相邻块的数目,确定平均上下文索引;以及基于所确定的平均上下文索引设置与当前块相关联的预测模式标志。
方法还可以包括:确定相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码;基于相邻块被确定为通过帧内预测模式被编码,将与当前块相关联的预测模式标志的上下文索引递增1,基于相邻块被确定为通过帧间预测模式被编码,将上下文索引递增0,基于相邻块被确定为通过帧内-帧间预测模式被编码,将上下文索引递增0.5;基于递增后的上下文索引以及当前块的相邻块的数目,确定平均上下文索引;以及基于所确定的平均上下文索引设置与当前块相关联的预测模式标志。
尽管图7示出了方法(700)的示例块,但是在一些实现方式中,与图7中描绘的这些块相比,方法(700)可以包括附加的块、更少的块、不同的块或不同地布置的块。附加地或替选地,方法(700)的块中的两个或更多个块可以并行执行。
此外,所提出的方法可以由处理电路(例如,一个或更多个处理器或者一个或更多个集成电路)实现。在示例中,一个或更多个处理器执行存储在非暂态计算机可读介质中的用以进行所提出的方法中的一个或更多个方法的程序。
图8是根据实施方式的用于控制视频序列解码或编码的帧内-帧间预测的装置(800)的简化框图。
参照图8,装置(800)包括第一确定代码(810)、执行代码(820)以及设置代码(830)。装置(800)还可以包括递增代码(840)以及第二确定代码(850)。
第一确定代码(810)被配置成使至少一个处理器确定当前块的相邻块是否通过帧内-帧间预测模式被编码。
执行代码(820)被配置成使至少一个处理器基于相邻块被确定为通过帧内-帧间预测模式被编码而使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的帧内模式编码。
设置代码(830)被配置成使至少一个处理器基于相邻块被确定为通过帧内-帧间预测模式被编码而进行以下操作:设置与相邻块相关联的预测模式标志;基于所设置的与相邻块相关联的预测模式标志得出上下文值;以及使用得出的上下文值执行与当前块相关联的预测模式标志的熵编码,该预测模式标志指示当前块被帧内编码。
执行代码(820)还可以被配置成使至少一个处理器基于相邻块被确定为通过帧内-帧间预测模式被编码而使用与帧内-帧间预测模式相关联的帧内预测模式执行当前块的最可能模式(MPM)推导。
与帧内-帧间预测模式相关联的帧内预测模式可以是平面模式、DC模式或在帧内-帧间预测模式中应用的帧内预测模式。
设置代码(830)还可以被配置成使至少一个处理器设置与相邻块相关联的预测模式标志以指示该相邻块被帧内编码。
设置代码(830)还可以被配置成使至少一个处理器设置与相邻块相关联的预测模式标志以指示该相邻块被帧间编码。
第一确定代码(810)还可以被配置成使至少一个处理器确定相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码。递增代码(840)可以被配置成使至少一个处理器进行以下操作:基于相邻块被确定为通过帧内预测模式被编码,将与当前块相关联的预测模式标志的上下文索引递增2;基于相邻块被确定为通过帧间预测模式被编码,将上下文索引递增0;以及基于相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增1。第二确定代码(850)可以被配置成使至少一个处理器基于递增后的上下文索引以及当前块的相邻块的数目确定平均上下文索引。设置代码(830)还可以被配置成使至少一个处理器基于所确定的平均上下文索引设置与当前块相关联的预测模式标志。
第一确定代码(810)还可以被配置成使至少一个处理器确定相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码。递增代码(840)可以被配置成使至少一个处理器进行以下操作:基于相邻块被确定为通过帧内预测模式被编码,将与当前块相关联的预测模式标志的上下文索引递增1;基于相邻块被确定为通过帧间预测模式被编码,将上下文索引递增0;以及基于相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增0.5。第二确定代码(850)可以被配置成使至少一个处理器基于递增后的上下文索引以及当前块的相邻块的数目确定平均上下文索引。设置代码(830)还可以被配置成使至少一个处理器基于所确定的平均上下文索引设置与当前块相关联的预测模式标志。
可以利用计算机可读指令将上述技术实现为计算机软件,并且将其物理地存储在一个或更多个计算机可读介质中。
图9是适于实现实施方式的计算机系统(900)的图。
计算机软件可以使用任何合适的机器代码或计算机语言来编码,可以对机器代码或计算机语言进行汇编、编译、链接等机制以创建包括指令的代码,这些指令可以由计算机中央处理单元(CPU)、图形处理单元(GPU)等直接执行或者通过解译、微代码执行等来执行。
指令可以在各种类型的计算机或其部件上执行,包括例如个人计算机、平板计算机、服务器、智能电话、游戏设备、物联网设备等。
图9中示出的用于计算机系统(900)的部件本质上是示例性的,并且不旨在对实现各实施方式的计算机软件的使用范围或功能提出任何限制。部件的配置也不应被解释为具有与计算机系统(900)的示例性实施方式中示出的部件中的任何一个部件或部件的组合有关的任何依赖性或要求。
计算机系统900可以包括某些人机接口输入设备。这样的人机接口输入设备可以响应于由一个或更多个人类用户通过例如触觉输入(诸如:击键、滑动、数据手套移动)、音频输入(诸如:语音、拍打)、视觉输入(诸如:姿势)、嗅觉输入(未示出)的输入。人机接口设备还可以用于捕获不一定与人的有意识输入直接相关的某些介质,例如音频(诸如:语音、音乐、环境声音)、图像(诸如:扫描图像、从静态图像摄像装置获得的摄影图像)、视频(诸如二维视频、包括立体视频的三维视频)。
输入人机接口设备可以包括以下中的一种或更多种(仅描绘了每种中的一个):键盘(901)、鼠标(902)、触控板(903)、触摸屏(910)、数据手套(904)、操纵杆(905)、麦克风(906)、扫描仪(907)、摄像装置(908)。
计算机系统(900)还可以包括某些人机接口输出设备。这样的人机接口输出设备可以通过例如触觉输出、声音、光和气味/味道来刺激一个或更多个人类用户的感觉。这样的人机接口输出设备可以包括:触觉输出设备(例如,通过触摸屏(910)、数据手套(904)或操纵杆(905)的触觉反馈,但是也可以存在不充当输入设备的触觉反馈设备)、音频输出设备(诸如:扬声器(909)、头戴式耳机(未描绘))、视觉输出设备(诸如屏幕(910),包括阴极射线管(CRT)屏幕、液晶显示器(LCD)屏幕、等离子屏幕、有机发光二极管(OLED)屏幕,各自具有或不具有触摸屏输入能力,各自具有或不具有触觉反馈能力——其中一些屏幕可能能够通过诸如立体图形输出的方式输出二维视觉输出或多于三维输出;虚拟现实眼镜(未描绘)、全息显示器和烟箱(未描绘))、以及打印机(未描绘)。
计算机系统(900)还可以包括人类可访问的存储设备及其相关联的介质,诸如包括具有CD/DVD等介质(921)的CD/DVD ROM/RW(920)的光学介质、拇指驱动器(922)、可移动硬盘驱动器或固态驱动器(923)、诸如磁带和软盘的传统磁介质(未描绘)、基于专用ROM/ASIC/PLD的设备诸如安全软件狗(未描绘)等。
本领域技术人员还应当理解,结合当前公开的主题使用的术语“计算机可读介质”不包含传输介质、载波或其他瞬态信号。
计算机系统(900)还可以包括到一个或更多个通信网络的接口。网络可以是例如无线的、有线的、光学的。网络还可以是本地的、广域的、城市的、车载的和工业的、实时的、延迟容忍的等。网络的示例包括局域网,诸如以太网、无线LAN、蜂窝网络(包括全球移动通信系统(GSM)、第三代(3G)、第四代(4G)、第五代(5G)、长期演进(LTE)等)、电视有线或无线广域数字网络(包括有线电视、卫星电视和地面广播电视)、车载的和工业的(包括CANBus)等。某些网络通常需要附接至某些通用数据端口或外围总线(949)(诸如,例如计算机系统(900)的通用串行总线(USB)端口)的外部网络接口适配器;其他网络通常通过附接至如下所述的系统总线而集成到计算机系统(900)的核中(例如,集成到PC计算机系统的以太网接口或集成到智能电话计算机系统的蜂窝网络接口)。使用这些网络中的任何网络,计算机系统(900)可以与其他实体通信。这样的通信可以是单向的、仅接收的(例如,广播电视)、单向仅发送的(例如,到某些CANBus设备的CANBus)、或双向的(例如,使用局域数字网络或广域数字网络到其他计算机系统)。可以在如上所述的这些网络和网络接口中的每个网络和网络接口上使用某些协议和协议栈。
上述人机接口设备、人类可访问的存储设备和网络接口可以附接至计算机系统(900)的核(940)。
核(940)可以包括一个或更多个中央处理单元(CPU)(941)、图形处理单元(GPU)(942)、现场可编程门阵列(FPGA)(943)形式的专用可编程处理单元、用于某些任务的硬件加速器(944)等。这些设备,连同只读存储器(ROM)(945)、随机存取存储器(RAM)(946)、内部大容量存储装置(诸如内部非用户可访问型硬盘驱动器、固态驱动器(SSD)等)(947),可以通过系统总线(948)连接。在一些计算机系统中,可以以一个或更多个物理插头的形式访问系统总线(948),以使得能够通过附加的CPU、GPU等进行扩展。外围设备可以直接地或通过外围总线(949)附接至核的系统总线(948)。外围总线的架构包括外围部件互连(PCI)、USB等。
CPU(941)、GPU(942)、FPGA(943)和加速器(944)可以执行某些指令,这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在ROM(945)或RAM(946)中。过渡数据也可以存储在RAM(946)中,而永久数据可以存储在例如内部大容量存储装置(947)中。可以通过使用缓存存储器来实现针对存储设备中的任何存储设备的快速存储和检索,该缓存存储器可以与一个或更多个CPU(941)、GPU(942)、大容量存储装置(947)、ROM(945)、RAM(946)等紧密关联。
计算机可读介质上可以具有用于执行各种计算机实现的操作的计算机代码。介质和计算机代码可以是为实施方式的目的而专门设计和构造的介质和计算机代码,或者它们可以是计算机软件领域的技术人员公知且可获得的类型。
作为示例而非限制,具有架构的计算机系统(900)——并且特别是核(940)——可以由于处理器(包括CPU、GPU、FPGA、加速器等)执行体现在一个或更多个有形计算机可读介质中的软件而提供功能。这样的计算机可读介质可以是与如以上所介绍的用户可访问型大容量存储装置相关联的介质,以及具有非暂态性质的核(940)的某些存储装置,诸如核内大容量存储装置(947)或ROM(945)。实现各种实施方式的软件可以存储在这样的设备中并且由核(940)执行。根据特定需求,计算机可读介质可以包括一个或更多个存储器设备或芯片。软件可以使核(940)——特别是其中的处理器(包括CPU、GPU、FPGA等)——执行本文中描述的特定处理或特定处理的特定部分,包括限定存储在RAM(946)中的数据结构以及根据由软件限定的处理修改这些数据结构。另外地或作为替选,计算机系统可以由于硬连线或以其他方式体现在电路(例如:加速器(944))中的逻辑而提供功能,该逻辑可以代替软件或与软件一起操作以执行本文中描述的特定处理或特定处理的特定部分。在适当的情况下,提及软件可以包含逻辑,反之提及逻辑也可以包含软件。在适当的情况下,提及计算机可读介质可以包含存储用于执行的软件的电路(例如,集成电路(IC))、体现用于执行的逻辑的电路或上述两者。实施方式包含硬件和软件的任何合适的组合。
尽管本公开内容已经描述了若干示例性实施方式,但是存在落入本公开内容的范围内的改变、置换和各种替换等效物。因此将认识到,虽然本文中没有明确示出或描述,但是本领域技术人员能够设想体现本公开内容的原理并且因此在其精神和范围内的许多系统和方法。

Claims (20)

1.一种控制帧内-帧间预测的方法,所述方法用于视频序列解码或编码,所述方法由至少一个处理器执行,并且所述方法包括:
确定当前块的相邻块是否通过帧内-帧间预测模式被编码;以及
基于所述相邻块被确定为通过帧内-帧间预测模式被编码而执行下述操作:
使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的帧内模式编码;
设置与所述相邻块相关联的预测模式标志;
基于所述与所述相邻块相关联的预测模式标志得出上下文值;以及
使用得出的上下文值执行对与所述当前块相关联的预测模式标志的熵编码,所述与所述当前块相关联的预测模式标志指示所述当前块被帧内编码。
2.根据权利要求1所述的方法,还包括:基于所述相邻块被确定为通过帧内-帧间预测模式被编码,使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的最可能模式MPM推导。
3.根据权利要求1所述的方法,其中,与所述帧内-帧间预测模式相关联的帧内预测模式为平面模式。
4.根据权利要求1所述的方法,其中,与所述帧内-帧间预测模式相关联的帧内预测模式为直流DC模式。
5.根据权利要求1所述的方法,其中,与所述帧内-帧间预测模式相关联的帧内预测模式是在所述帧内-帧间预测模式中应用的帧内预测模式。
6.根据权利要求1所述的方法,其中,所述设置与所述相邻块相关联的预测模式标志包括:将与所述相邻块相关联的预测模式标志设置成指示所述相邻块被帧内编码。
7.根据权利要求1所述的方法,其中,所述设置与所述相邻块相关联的预测模式标志包括:将与所述相邻块相关联的预测模式标志设置成指示所述相邻块被帧间编码。
8.根据权利要求1所述的方法,还包括:
确定所述相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码;
基于所述相邻块被确定为通过帧内预测模式被编码,将与所述当前块相关联的预测模式标志的上下文索引递增2;
基于所述相邻块被确定为通过帧间预测模式被编码,将所述上下文索引递增0;
基于所述相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增1;
基于递增后的上下文索引以及所述当前块的相邻块的数目,确定平均上下文索引;以及
基于所述平均上下文索引设置与所述当前块相关联的预测模式标志。
9.根据权利要求1所述的方法,还包括:
确定所述相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码;
基于所述相邻块被确定为通过帧内预测模式被编码,将与所述当前块相关联的预测模式标志的上下文索引递增1;
基于所述相邻块被确定为通过帧间预测模式被编码,将所述上下文索引递增0;
基于所述相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增0.5;
基于递增后的上下文索引以及所述当前块的相邻块的数目,确定平均上下文索引;以及
基于所述平均上下文索引设置与所述当前块相关联的预测模式标志。
10.一种用于控制帧内-帧间预测的装置,所述装置用于视频序列解码或编码,所述装置包括:
至少一个存储器,其被配置成存储计算机程序代码;以及
至少一个处理器,其被配置成访问所述至少一个存储器并且根据所述计算机程序代码进行操作,所述计算机程序代码包括:
第一确定代码,其被配置成使所述至少一个处理器确定当前块的相邻块是否通过帧内-帧间预测模式被编码;
执行代码,其被配置成使所述至少一个处理器基于所述相邻块被确定为通过帧内-帧间预测模式被编码而使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的帧内模式编码;以及
设置代码,其被配置成使所述至少一个处理器基于所述相邻块被确定为通过帧内-帧间预测模式被编码而进行以下操作:
设置与所述相邻块相关联的预测模式标志;
基于所述与所述相邻块相关联的预测模式标志得出上下文值;以及
使用得出的上下文值执行对与所述当前块相关联的预测模式标志的熵编码,所述与所述当前块相关联的预测模式标志指示所述当前块被帧内编码。
11.根据权利要求10所述的装置,其中,所述执行代码还被配置成使所述至少一个处理器基于所述相邻块被确定为通过帧内-帧间预测模式被编码,使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的最可能模式MPM推导。
12.根据权利要求10所述的装置,其中,与所述帧内-帧间预测模式相关联的帧内预测模式为平面模式。
13.根据权利要求10所述的装置,其中,与所述帧内-帧间预测模式相关联的帧内预测模式为DC模式。
14.根据权利要求10所述的装置,其中,与所述帧内-帧间预测模式相关联的帧内预测模式是在所述帧内-帧间预测模式中应用的帧内预测模式。
15.根据权利要求10所述的装置,其中,所述设置代码还被配置成使所述至少一个处理器将与所述相邻块相关联的预测模式标志设置成指示所述相邻块被帧内编码。
16.根据权利要求10所述的装置,其中,所述设置代码还被配置成使所述至少一个处理器将与所述相邻块相关联的预测模式标志设置成指示所述相邻块被帧间编码。
17.根据权利要求10所述的装置,其中,所述第一确定代码还被配置成使所述至少一个处理器确定所述相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码,
其中,所述装置还包括:
递增代码,其被配置成使所述至少一个处理器进行以下操作:
基于所述相邻块被确定为通过帧内预测模式被编码,将与所述当前块相关联的预测模式标志的上下文索引递增2;
基于所述相邻块被确定为通过帧间预测模式被编码,将所述上下文索引递增0;以及
基于所述相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增1;以及
第二确定代码,其被配置成使所述至少一个处理器基于递增后的上下文索引以及所述当前块的相邻块的数目确定平均上下文索引,并且
其中,所述设置代码还被配置成使所述至少一个处理器基于所述平均上下文索引设置与所述当前块相关联的所述预测模式标志。
18.根据权利要求10所述的装置,其中,所述第一确定代码还被配置成使所述至少一个处理器确定所述相邻块是通过帧内预测模式、帧间预测模式、还是帧内-帧间预测模式被编码,
其中,所述装置还包括:
递增代码,其被配置成使所述至少一个处理器进行以下操作:
基于所述相邻块被确定为通过帧内预测模式被编码,将与所述当前块相关联的预测模式标志的上下文索引递增1;
基于所述相邻块被确定为通过帧间预测模式被编码,将所述上下文索引递增0;以及
基于所述相邻块被确定为通过帧内-帧间预测模式被编码,将所述上下文索引递增0.5;以及
第二确定代码,其被配置成使所述至少一个处理器基于递增后的上下文索引以及所述当前块的相邻块的数目确定平均上下文索引,并且
其中,所述设置代码还被配置成使所述至少一个处理器基于所述平均上下文索引设置与所述当前块相关联的所述预测模式标志。
19.一种存储有指令的非暂态计算机可读存储介质,所述指令使至少一个处理器进行以下操作:
确定当前块的相邻块是否通过帧内-帧间预测模式被编码;以及
基于所述相邻块被确定为通过帧内-帧间预测模式被编码而进行以下操作:
使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的帧内模式编码;
设置与所述相邻块相关联的预测模式标志;
基于所述与所述相邻块相关联的预测模式标志得出上下文值;以及
使用得出的上下文值执行对与所述当前块相关联的预测模式标志的熵编码,所述与所述当前块相关联的预测模式标志指示所述当前块被帧内编码。
20.根据权利要求19所述的非暂态计算机可读存储介质,其中,所述指令还使所述至少一个处理器进行以下操作:基于所述相邻块被确定为通过帧内-帧间预测模式被编码,使用与所述帧内-帧间预测模式相关联的帧内预测模式执行所述当前块的最可能模式MPM推导。
CN201980027147.0A 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质 Active CN112005549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211214870.XA CN115623202A (zh) 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862767473P 2018-11-14 2018-11-14
US62/767,473 2018-11-14
US16/454,294 US10848763B2 (en) 2018-11-14 2019-06-27 Method and apparatus for improved context design for prediction mode and coded block flag (CBF)
US16/454,294 2019-06-27
PCT/US2019/060889 WO2020102173A2 (en) 2018-11-14 2019-11-12 Method and apparatus for improved context design for prediction mode and coded block flag (cbf)

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211214870.XA Division CN115623202A (zh) 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112005549A true CN112005549A (zh) 2020-11-27
CN112005549B CN112005549B (zh) 2022-08-16

Family

ID=70551926

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211214870.XA Pending CN115623202A (zh) 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质
CN201980027147.0A Active CN112005549B (zh) 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211214870.XA Pending CN115623202A (zh) 2018-11-14 2019-11-12 一种帧内-帧间预测控制方法、装置、设备及存储介质

Country Status (6)

Country Link
US (4) US10848763B2 (zh)
EP (1) EP3881536A4 (zh)
JP (3) JP7011735B2 (zh)
KR (2) KR102637503B1 (zh)
CN (2) CN115623202A (zh)
WO (1) WO2020102173A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112021010286A2 (pt) * 2018-11-29 2021-08-17 Huawei Technologies Co., Ltd. codificador, decodificador e métodos correspondentes de construção de lista de modos mais prováveis para blocos com predição de múltiplas hipóteses
TW202101982A (zh) * 2018-12-14 2021-01-01 美商松下電器(美國)知識產權公司 編碼裝置、解碼裝置、編碼方法、及解碼方法
EP3932057A4 (en) * 2019-03-23 2022-05-11 Huawei Technologies Co., Ltd. ENCODER, DECODER AND RELATED INTRA PREDICTION METHODS
US20220400275A1 (en) * 2021-06-10 2022-12-15 Tencent America LLC Zero Residual Flag Coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103262533A (zh) * 2010-10-01 2013-08-21 高通股份有限公司 指示用于视频译码的帧内预测模式选择
CN103597832A (zh) * 2011-06-09 2014-02-19 高通股份有限公司 用于使用相邻模式的视频译码的增强的帧内预测模式信令
AU2013403224A1 (en) * 2013-10-14 2016-03-31 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
CN107736022A (zh) * 2015-06-18 2018-02-23 高通股份有限公司 帧内预测及帧内模式译码

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8085846B2 (en) * 2004-08-24 2011-12-27 Thomson Licensing Method and apparatus for decoding hybrid intra-inter coded blocks
ATE480104T1 (de) * 2006-01-09 2010-09-15 Matthias Narroschke Adaptive codierung eines prädiktionsfehlers bei der hybrid-videocodierung
CN105791860B (zh) * 2010-05-26 2018-10-16 Lg电子株式会社 用于处理视频信号的方法和设备
CA2806511C (en) * 2010-09-30 2018-09-04 Panasonic Corporation Decoding and encoding according to a prediction mode determined from multiple estimated prediction modes
KR20120070479A (ko) * 2010-12-21 2012-06-29 한국전자통신연구원 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치
US20130070855A1 (en) * 2011-09-17 2013-03-21 Qualcomm Incorporated Hybrid motion vector coding modes for video coding
CN110087089B (zh) * 2013-11-27 2023-03-10 寰发股份有限公司 用于颜色视频数据的视频编解码方法
JP6462693B2 (ja) * 2013-12-13 2019-01-30 クゥアルコム・インコーポレイテッドQualcomm Incorporated 3dビデオコーディングにおける深度イントラ予測モードおよび深度インター予測モードのための簡易深度コーディング(sdc)のシグナリング
KR20220133337A (ko) * 2014-03-16 2022-10-04 브이아이디 스케일, 인크. 무손실 비디오 코딩의 시그널링을 위한 방법 및 장치
US10666940B2 (en) * 2014-11-06 2020-05-26 Samsung Electronics Co., Ltd. Video encoding method and apparatus, and video decoding method and apparatus
CN108293139A (zh) * 2015-09-08 2018-07-17 三星电子株式会社 用于熵编码和熵解码的设备和方法
WO2017043816A1 (ko) * 2015-09-10 2017-03-16 엘지전자(주) 인터-인트라 병합 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US9807423B1 (en) * 2015-11-24 2017-10-31 Google Inc. Hybrid transform scheme for video coding
EP3363199B1 (en) * 2015-11-27 2021-05-19 MediaTek Inc. Method and apparatus of entropy coding and context modelling for video and image coding
FR3046321B1 (fr) * 2015-12-29 2018-01-26 B<>Com Procede de codage d'une image numerique, procede de decodage, dispositifs, terminal d'utilisateur et programmes d'ordinateurs associes
US11032550B2 (en) 2016-02-25 2021-06-08 Mediatek Inc. Method and apparatus of video coding
US10609414B2 (en) * 2017-05-08 2020-03-31 Qualcomm Incorporated Context modeling for transform coefficient coding
WO2018224004A1 (en) * 2017-06-07 2018-12-13 Mediatek Inc. Method and apparatus of intra-inter prediction mode for video coding
US11172203B2 (en) * 2017-08-08 2021-11-09 Mediatek Inc. Intra merge prediction
EP3857879A4 (en) * 2018-11-12 2022-03-16 Beijing Bytedance Network Technology Co., Ltd. SIMPLIFICATION OF COMBINED INTER-INTRA PREDICTION

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103262533A (zh) * 2010-10-01 2013-08-21 高通股份有限公司 指示用于视频译码的帧内预测模式选择
CN103597832A (zh) * 2011-06-09 2014-02-19 高通股份有限公司 用于使用相邻模式的视频译码的增强的帧内预测模式信令
AU2013403224A1 (en) * 2013-10-14 2016-03-31 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
CN107736022A (zh) * 2015-06-18 2018-02-23 高通股份有限公司 帧内预测及帧内模式译码

Also Published As

Publication number Publication date
JP7302044B2 (ja) 2023-07-03
EP3881536A4 (en) 2022-09-07
CN115623202A (zh) 2023-01-17
US20210044803A1 (en) 2021-02-11
US20220303540A1 (en) 2022-09-22
JP2022050621A (ja) 2022-03-30
JP2021520157A (ja) 2021-08-12
US10848763B2 (en) 2020-11-24
EP3881536A2 (en) 2021-09-22
KR102458813B1 (ko) 2022-10-26
KR102637503B1 (ko) 2024-02-19
JP2023120367A (ja) 2023-08-29
US20200154107A1 (en) 2020-05-14
WO2020102173A3 (en) 2020-06-18
US11388404B2 (en) 2022-07-12
CN112005549B (zh) 2022-08-16
JP7011735B2 (ja) 2022-01-27
US11909976B2 (en) 2024-02-20
KR20220150405A (ko) 2022-11-10
US20240146928A1 (en) 2024-05-02
WO2020102173A2 (en) 2020-05-22
KR20200142067A (ko) 2020-12-21

Similar Documents

Publication Publication Date Title
CN110248196B (zh) 用于调色板编解码的方法和设备
KR102542428B1 (ko) 인트라 모드 코딩을 위한 방법 및 장치
KR20230092030A (ko) 비디오 코딩을 위한 방법 및 장치
US11641480B2 (en) Signaling of adaptive picture size in video bitstream
CN113424546B (zh) 视频解码或编码的方法和装置
CN110708558B (zh) 变换类型的表示方法和设备
CN112005549B (zh) 一种帧内-帧间预测控制方法、装置、设备及存储介质
US20240098288A1 (en) Method for support of scalability with adaptive picture resolution
CN113574896A (zh) 改进的最可能模式列表生成方案
CN112715032A (zh) 帧内预测中的帧内模式选择
CN113508582A (zh) 多线帧内预测的模式列表生成
US11166038B2 (en) Method for support of scalability with adaptive picture resolution
CN112470475B (zh) 控制方法、控制设备、控制装置及可读介质
CN110636296B (zh) 视频解码方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant