CN112352434A - 用于帧内预测的基于宽高比滤波的方法和装置 - Google Patents

用于帧内预测的基于宽高比滤波的方法和装置 Download PDF

Info

Publication number
CN112352434A
CN112352434A CN201980043899.6A CN201980043899A CN112352434A CN 112352434 A CN112352434 A CN 112352434A CN 201980043899 A CN201980043899 A CN 201980043899A CN 112352434 A CN112352434 A CN 112352434A
Authority
CN
China
Prior art keywords
block
video
predicted
intra prediction
interpolation filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980043899.6A
Other languages
English (en)
Other versions
CN112352434B (zh
Inventor
阿列克谢·康斯坦丁诺维奇·菲利波夫
瓦西里·亚历斯维奇·拉夫特斯基
陈建乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN112352434A publication Critical patent/CN112352434A/zh
Application granted granted Critical
Publication of CN112352434B publication Critical patent/CN112352434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于帧内预测的基于宽高比滤波的方法,该方法包括根据待预测的块的宽高比为该块选择插值滤波器。

Description

用于帧内预测的基于宽高比滤波的方法和装置
相关申请的交叉引用
本申请要求于2018年7月11日提交的发明名称为“用于帧内预测的基于宽高比滤波”、申请号为62/696,709的美国临时专利申请的优先权,以及于2018年7月11日提交的发明名称为“用于帧内预测的基于宽高比滤波的方法和装置”、申请号为62/696,816的美国临时专利申请的优先权,其内容以引用的方式并入本文。
技术领域
本公开涉及图像和/或视频编解码技术领域,尤其涉及用于帧内预测的基于宽高比滤波的方法和装置。
背景技术
自从推出DVD光盘以来,数字视频得到了广泛的应用。在传输之前,对视频进行编码并使用传输介质发送。观看者接收视频并且使用观看设备来解码和显示视频。这些年来,例如因为分辨率、颜色深度、以及帧速率更高,所以视频质量有所提高。这使得现在通常通过互联网和移动通信网络来传输更大的数据流。
然而,因为高分辨率视频具有更多的信息,所以通常需要更多的带宽。为了降低带宽要求,引入了涉及视频压缩的视频编码标准。在视频被编码的情况下,带宽要求(或者在存储的情况下对应的存储器要求)有所降低。通常,这种降低以质量为代价。因此,视频编码标准试图在带宽要求和质量之间找到平衡。
高效视频编码(high efficiency video coding,HEVC)是本领域技术人员公知的视频编码标准的示例。在HEVC中,编码单元(coding unit,CU)可以分成预测单元(prediction unit,PU)或变换单元(transform unit,TU)。通用视频编码(versatilevideo coding,VVC)下一代标准是ITU-T视频编码专家组(video coding experts group,VCEG)和ISO/IEC运动图像专家组(moving picture experts group,MPEG)标准化组织在称为联合视频探索小组(joint video exploration team,JVET)的合作伙伴关系中共同开展的最新联合视频项目。VVC也称为ITU-T H.266/下一代视频编码(next generation videocoding,NGVC)标准。VVC取消了多个划分类型的概念,即,VVC取消了对CU概念、PU概念、以及TU概念的分离(除非其尺寸对于最大变换长度来说太大的CU需要),并且支持更灵活的CU划分形状。
这些编码单元(CU)(也称为块)的处理取决于其尺寸、空间位置、以及由编码器指定的编码模式。根据预测的类型,编码模式可以分为两组:帧内预测模式和帧间预测模式。帧内预测模式使用同一图片(也称为帧或图像)的样本来生成参考样本,以计算正被重构的块的样本的预测值。帧内预测也称为空间预测(spatial prediction)。帧间预测模式用于时间预测(temporal prediction),并且使用前一图片或下一图片的参考样本预测当前图片的块的样本。
插值滤波器(interpolation filter)的选择与主参考边的选择的决策相协调。这两个决策当前都依赖于帧内预测模式与对角线方向(45度)的比较。
发明内容
公开了一种用于帧内预测的装置和方法。上述装置和方法在插值滤波器的选择过程中使用替代方向(45度对角线方向的替代方向)来对帧内预测模式进行阈值化(thresholding)。具体地,该方向对应于待预测的块的主对角线的角度。
对帧内预测模式进行阈值化包括将当前块的帧内预测方向角度与阈值角度的值进行比较,并且选择块的宽度或高度来定义方向帧内预测(directional intra-prediction,也称为方向性帧内预测)中用于从参考样值获得预测样值的插值滤波器。特别地,在帧内预测方向角度大于阈值的情况下,当块的高度大于16时,使用高斯插值滤波器(Gaussian interpolation filter),或者当高度小于16时,使用三次插值滤波器(cubicinterpolation filter)。否则,在方向角度小于阈值的情况下,当块的宽度大于16时,使用高斯插值滤波器,或者当宽度小于16时,使用三次插值滤波器。
应理解,帧内预测模式编号或索引可以用来指示预测方向,并且方向之间的角度可以由对应的帧内预测模式的索引的差来表示。
本实施例提出了一种选择不同参考样本滤波器(插值滤波器)以便考虑块的定向的机制。具体地,分别检查块的宽度和高度,从而将不同的参考样本滤波器应用于位于待预测的块的不同边上的参考样本。
在权利要求和下面的描述中描述本公开的实施例。
保护范围由权利要求定义。
根据第一方面,提供了一种用于帧内预测的基于宽高比滤波的方法,该方法包括:根据待预测的块的宽高比为该块选择插值滤波器。该方法可以例如用于图片(例如静止的图片或视频的图片)的块的帧内预测。例如,根据宽高比,可以例如由直线将块分成两个区域,其中,对于第一区域,第一插值用于第一区域中的样本的帧内预测,并且其中,对于第二区域,第二插值用于第二区域中的样本的帧内预测。
根据第一方面的实施方式,上述选择插值滤波器取决于对待预测的块的帧内预测模式进行阈值化的方向。
根据第一方面的实施方式,上述方向对应于待预测的块的主对角线的角度。其中,如下计算上述方向的角度:
Figure BDA0002865221300000021
其中,W、H分别是待预测的块的宽度和高度。例如,相应地确定划分块的线(主对角线)的角度。
根据第一方面的实施方式,根据以下确定宽高比RA:
RA=log2(W)-log2(H),
其中,W、H分别是待预测的块的宽度和高度。
根据第一方面的实施方式,基于宽高比确定待预测的块的主对角线的角度。
根据第一方面的实施方式,基于待预测的块的主对角线的角度确定块的帧内预测模式的阈值。
根据第一方面的实施方式,上述选择插值滤波器取决于所用的参考样本所属的边。例如,如果参考样本属于块的上边并且用于预测块内的样本,则根据块的宽度选择插值滤波器用于样本预测。如果参考样本属于块的左边并且用于预测块内的样本,则根据块的高度选择插值滤波器用于样本预测。
根据第一方面的实施方式,具有与帧内方向对应的角度的直线将块分成两个区域。
根据第一方面的实施方式,使用不同的插值滤波器预测属于不同区域的参考样本。
根据第一方面的实施方式,上述滤波器包括三次插值滤波器或高斯插值滤波器。
根据第二方面,提供了一种设备,该设备用于实施根据第一方面或该方面的实施方式中任一项的方法。
根据第三方面,提供了一种设备,该设备包括处理器,其中,该处理器用于实施根据第一方面或提供的该方面的实施方式中任一项的方法。
根据第四方面,提供了一种计算机程序产品,该计算机程序产品包括程序代码,当在处理器上执行时,该程序代码用于执行根据第一方面或该方面的实施方式中任一项的方法。
根据第五方面,提供了一种设备,该设备包括一个或多个处理器和非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质耦合到一个或多个处理器并且存储用于由一个或多个处理器执行的程序,其中,当由一个或多个处理器执行时,该程序配置该设备执行根据第一方面或该方面的实施方式中任一项的方法。
附图说明
下面参考附图更详细地描述示例性实施例,在附图中:
图1示出了示出视频编码和解码系统100的示例的示意图。
图2示出了示出视频编码器200的示例的示意图。
图3示出了示出视频解码器300的示例的示意图。
图4示出了示出所提出的67个帧内预测模式的示意图。
图5示出了QTBT的示例。
图6a和图6b示出了矩形块的定向的示例。
图6c示出了基于边长的插值滤波器选择。
图7示出了用于在插值滤波器的选择过程中对帧内预测模式进行阈值化的替代方向的实施例。
图8示出了使用不同的插值滤波器的实施例,不同的插值滤波器取决于所用的参考样本所属的边。
图9是示出了装置的示例性结构的示意图。
具体实施方式
在下面的描述中参考了附图,这些附图构成本公开的一部分,并且在附图中通过图示的方式示出了可以应用实施例的具体方面。
例如,应理解,结合所描述的方法的公开也可以适用于配置为执行该方法的对应设备或系统,反之亦然。例如,如果描述了具体的方法步骤,则即使用于执行所描述的方法步骤的单元未在附图中明确地描述或示出,对应的设备也可以包括这种单元。此外,应理解,除非另有说明,否则本文所描述的各种示例性方面的特征可以彼此组合。
视频编码通常是指对形成视频或视频序列的图片序列的处理。在视频编码领域以及在本申请中可以同义地使用术语“图片”、“图像”、或“帧”。每个图片通常被划分为一组不重叠的块。图片的编码/解码通常在块级别执行,其中,例如使用帧间预测或帧内预测来生成预测块,以从当前块(当前处理/待处理的块)中减去预测块以获得残差块,该残差块被进一步变换和量化以减少待发送的数据量(压缩),而在解码器侧,对编码/压缩块应用逆处理以重构块(视频块)进行表现。
图1是示出了示例视频编码和解码系统100的框图,视频编码和解码系统100可以使用本公开中描述的技术(包括用于对边界划分(boundary partition)进行编码和解码的技术)。系统100不仅应用于视频编码和视频解码,还应用于图片编码和图片解码。如图1所示,系统100包括源设备102,源设备102生成待由目的地设备104后续解码的编码视频数据。如图2所示的视频编码器200是源设备102的视频编码器108的示例。如图3所示的视频解码器300是目的地设备104的视频解码器116的示例。源设备102和目的地设备104可以包括各种设备中的任何一个设备,这些设备包括台式机、笔记本(即膝上型)电脑、平板电脑、机顶盒、电话手机(例如所谓的“智能”手机)、所谓的“智能”平板、电视、照相机、显示设备、数字媒体播放器、视频游戏控制台、视频流设备等。在一些情况下,源设备102和目的地设备104可以配备用于无线通信。
目的地设备104可以经由链路112接收待解码的编码视频数据。链路112可以包括能够将编码视频数据从源设备102移动到目的地设备104的任何类型的介质或设备。在一个示例中,链路112可以包括通信介质,以使源设备102能够实时地将编码视频数据直接发送到目的地设备114。编码视频数据可以根据通信标准(例如无线通信协议)来调制,并且被发送到目的地设备104。通信介质可以包括任何无线通信介质或有线通信介质,例如射频(radio frequency,RF)频谱或一条或多条物理传输线。通信介质可以形成基于包的网络(例如局域网、广域网、或诸如互联网的全球网络)的一部分。通信介质可以包括路由器、交换机、基站、或可以用于促进从源设备102到目的地设备104的通信的任何其他设备。
或者,编码数据可以从输出接口110输出到存储设备(图1中未示出)。类似地,编码数据可以由输入接口114从存储设备获取。目的地设备104可以通过流式传输或下载从存储设备获取存储的视频数据。本公开的技术不限于无线应用或设置。上述技术可以应用于视频编码以支持各种多媒体应用中的任何一种应用,这些应用例如是空中电视广播、有线电视传输、卫星电视传输、例如经由互联网的流式视频传输、用于存储在数据存储介质上的数字视频的编码、存储在数据存储介质上的数字视频的解码、或其他应用。在一些示例中,系统100可以配置为支持单向视频传输或双向视频传输,以支持诸如视频流式传输、视频回放、视频广播、和/或视频电话的应用。
在图1的示例中,源设备102包括视频源106、视频编码器108、以及输出接口110。在一些情况中,输出接口110可以包括调制器/解调器(调制解调器)和/或发射器。在源设备102中,视频源106可以包括源(例如视频捕获设备(例如,摄像机)、包含先前捕获的视频的视频档案库、用于从视频内容提供商接收视频的视频馈送接口、和/或用于生成计算机图形数据作为源视频的计算机图形系统、或这种源的组合)。作为一个示例,如果视频源106是摄像机,则源设备102和目的地设备104可以形成所谓的摄像电话或视频电话。然而,本公开中描述的技术通常可以适用于视频编码,并且可以应用于无线应用和/或无线应用。
捕获的视频、预捕获的视频、或计算机生成的视频可以由视频编码器108编码。上述编码视频数据可以经由源设备102的输出接口110直接发送到目的地设备104。编码视频数据还可以(或可选地)存储在存储设备上以供目的地设备104或其他设备稍后获取用于解码和/或回放。
目的地设备104包括输入接口114、视频解码器116、以及显示设备118。在一些情况中,输入接口114可以包括接收器和/或调制解调器。目的地设备104的输入接口114通过链路112接收编码视频数据。通过链路112传输的编码视频数据或在存储设备上提供的编码视频数据可以包括由视频编码器108生成以供视频解码器(例如视频解码器116)在解码视频数据时使用的各种语法元素。在通信介质上传输、存储在存储介质上、或存储在文件服务器上的编码视频数据可以包括这样的语法元素。
显示设备118可以与目的地设备104集成或在目的地设备104外部。在一些示例中,目的地设备104可以包括集成的显示设备,并且还配置为与外部显示设备相接。在其他示例中,目的地设备104可以是显示设备。通常,显示设备118向用户显示解码视频数据,并且可以包括例如以下各种显示设备中任何一种设备:液晶显示器(liquid crystal display,LCD)、等离子体显示器、有机发光二极管(organic light emitting diode,OLED)显示器、或另一类型的显示设备。
视频编码器108和视频解码器116可以根据任何种类的视频压缩标准来操作,这些视频压缩标准包括但不限于MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4Part 10、高级视频编码(advanced video coding,AVC)、高效视频编码(HEVC)、ITU-T H.266/下一代视频编码(NGVC)标准。
源设备102的视频编码器108通常可以用于根据这些当前的或未来的标准中的任何标准来编码视频数据。类似地,通常认为目的地设备104的视频解码器116可以用于根据这些当前的或未来的标准中的任何标准来解码视频数据。
视频编码器108和视频解码器116中的每个可以实现为例如以下各种合适的编码器电路中任何一种编码器电路:一个或多个微处理器、数字信号处理器(digital signalprocessor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field programmable gate array,FPGA)、离散逻辑、软件、硬件、固件、或其任何组合。当上述技术部分地在软件中实现时,设备可以将软件的指令存储在合适的非暂时性计算机可读介质中,并且在硬件中使用一个或多个处理器执行指令以执行本公开的技术。视频编码器108和视频解码器116中的每个可以包括在一个或多个编码器或解码器中,编码器或解码器中的任何一个可以集成为相应设备中的组合编码器/解码器(combinedencoder/decoder,CODEC)的一部分。
在视频编码规范中,视频序列通常包括一系列图片。然而,应注意,本公开还适用于应用交织的情况下的场。视频编码器108可以输出比特流,该比特流包括形成编码图片和相关联的数据的表示的比特序列。视频解码器116可以接收由视频编码器106生成的比特流。此外,视频解码器116可以解析比特流以从比特流获得语法元素。视频解码器116可以至少部分地基于从比特流获得的语法元素来重构视频数据的图片。重构视频数据的处理通常可以与视频编码器108执行的处理互逆。
图2示出了示出视频编码器200的示例的示意图。视频编码器200不仅可以应用于视频编码,还可以应用于图片编码。视频编码器200包括用于接收视频流的帧或图片的输入块的输入端和用于生成编码视频比特流的输出端。视频编码器200适于将预测、变换、量化、以及熵编码应用于视频流。变换单元201、量化单元202、以及编码单元203分别执行变换、量化、以及熵编码,以便生成编码视频比特流作为输出。
视频流与多个帧对应,其中,每一帧被分为经过帧内编码或帧间编码的具有一定尺寸的块。使用帧内预测单元209对例如视频流的第一帧的块进行帧内编码。只使用同一帧内的信息对内帧进行编码,使得可以分别对该内帧进行解码,并且该内帧可以在比特流中提供用于随机访问的入口点。使用帧间预测单元210对视频流的其他帧的块进行帧间编码:来自编码帧(称为参考帧)的信息用于减少时间冗余,使得从参考帧中同一尺寸的块预测出帧间编码的帧的每个块。模式选择单元208适于选择是由帧内预测单元209处理帧的块还是由帧间预测单元210处理帧的块。
为了执行帧间预测,由逆量化单元204、逆变换单元205、滤波单元206(可选)处理编码的参考帧,以获得随后存储在帧缓冲器207中的参考帧。特别地,可以由这些单元处理参考帧的参考块以获得重构的参考块。然后,将重构的参考块重新组合在参考帧中。
帧间预测单元210包括待进行帧间编码的当前帧或图片以及来自帧缓冲器207的一个或多个参考帧或图片作为输入。由帧间预测单元210应用运动估计和运动补偿。运动估计用于根据特定的代价函数获得运动矢量和参考帧。然后,运动补偿根据参考帧的参考块到当前块的当前帧的变换来描述当前帧的当前块。帧间预测单元210输出用于当前块的预测块,其中,该预测块最小化待编码的当前块与其预测块之间的差,即最小化残差块。残差块的最小化基于例如率失真优化(rate-distortion optimization,RDO)过程。
然后,由变换单元201对当前块与其预测之间的差(即,残差块)进行变换。由量化单元202和编码单元203对变换系数进行量化和熵编码。编码视频比特流包括帧内编码块和帧间编码块。
图3示出了示出视频解码器300的示例的示意图。视频解码器300不仅可以应用于视频解码,还可以应用于图片解码。特别地,视频解码器300包括帧缓冲器307、帧间预测单元310。帧缓冲器307适于存储从编码视频比特流获得的至少一个参考帧。帧间预测单元310适于从当前帧的参考块生成当前帧的当前块的预测块。
解码器300适于对由视频编码器200生成的编码视频比特流进行解码,并且解码器300和编码器200生成相同的预测。帧缓冲器307和帧间预测单元310的特征与图2的帧缓冲器207和帧间预测单元210类似。
特别地,视频解码器300包括还存在于视频编码器200中的单元,例如,逆量化单元304、逆变换单元305、滤波单元306(可选)、以及帧内预测单元309,这些单元分别对应于视频编码器200的逆量化单元204、逆变换单元205、滤波单元206、以及帧内预测单元209。解码单元303适于对接收到的编码视频比特流进行解码,并相应地获得量化的残差变换系数。量化的残差变换系数被馈送到逆量化单元304和逆变换单元305以生成残差块。残差块被添加到预测块并且该添加被馈送到滤波单元306以获得解码视频。解码视频的帧可以存储在帧缓冲器307中并且用作帧间预测的参考帧。
视频编码器200可以在编码之前将输入视频帧分成块。本公开中的术语“块”用于任何类型的块或任何深度块,例如,术语“块”包括但不限于根块、块、子块、叶节点等。待编码的块不必具有同一尺寸。一个图片可以包括不同尺寸的块,并且视频序列的不同图片的块光栅(block raster)也可以不同。
根据HEVC/H.265标准,有35种帧内预测模式可用。如图4所示,该组帧内预测模式包括以下模式:平面模式(帧内预测模式索引为0)、DC模式(帧内预测模式索引为1)、以及图4中黑色箭头所示的覆盖180°范围并且帧内预测模式索引值范围为2至34的方向(角度)模式。为了捕获自然视频中存在的任意边缘方向,将方向帧内模式的数量从HEVC中使用的33个扩展到65个。附加的方向模式在图4中描绘为虚线箭头,并且平面模式和DC模式保持不变。值得注意的是,帧内预测模式所覆盖的范围可以大于180°。特别地,索引为3至64的62个方向模式可以覆盖大约230°的范围,即,若干对模式的方向性相反。在HEVC参考模型(HEVCreference mode,HM)和JEM平台的情况下,如图4所示,只有一对角度模式(即,模式2和模式66)方向性相反。为了构造预测器,传统的角度模式获取参考样本并且(如果需要的话)对参考样本进行滤波以得到样本预测器。构造预测器所需的参考样本的数量取决于用于插值的滤波器的长度(例如,双线性滤波器和三次滤波器的长度分别为2和4)。
在VVC中,使用了一种基于四叉树和二叉树的划分机制QTBT。如图5所示,QTBT不仅可以提供正方形块,还可以提供矩形块。当然,与HEVC/H.265标准中使用的传统的基于四叉树的划分相比,QTBT划分的代价是编码器侧的一些信令开销和计算复杂度的增加。然而,基于QTBT的划分方法具有更好的分割属性,因此呈现出比传统的四叉树划分更高的编码效率。
在本文中,术语“垂直定向块”(“块的垂直定向”)和“水平定向块”(“块的水平定向”)应用于由QTBT框架生成的矩形块。这些术语具有与图6a和图6b所示相同的含义。如图6a所示,具有水平定向的块包括或具有大于其高度(垂直方向)的宽度(水平方向)。如图6b所示,具有垂直定向的块包括或具有大于其宽度(水平方向)的高度(垂直方向)。
本发明提出了一种用于选择不同参考样本滤波器以便考虑块的定向的机制。具体地,分别检查块的宽度和高度,从而将不同的参考样本滤波器应用于位于待预测的块的不同边上的参考样本。
在现有技术的概述中描述了:插值滤波器的选择与主参考边的选择的决策相协调。这两个决策当前都依赖于帧内预测模式与对角线方向(45度)的比较。
然而,应注意,对于细长块,这种设计有一个严重的缺陷。从图6c可以看到,即使使用模式比较准则选择了短边作为主参考,大多数预测像素仍将从长边的参考样本(示为虚线区域)导出。
本发明提出了在插值滤波器的选择过程中使用替代方向对帧内预测模式进行阈值化。具体地,该方向对应于待预测的块的主对角线的角度。例如,如图7中所示,对于尺寸为32x4和4x32的块,定义了用于确定参考样本滤波器的阈值模式mT。
阈值帧内预测角度(与阈值模式mT对应)的特定值例如可以使用以下公式来计算:
Figure BDA0002865221300000071
其中,W、H分别是块的宽度和高度。
另一实施例根据正在使用的参考样本所属的边(或者换言之,根据所用的参考样本所属的边)来使用不同的插值滤波器。这种确定的示例在图8中示出。
具有与帧内方向m对应的角度的直线将预测块分成两个区域。使用不同的插值滤波器预测属于不同区域的样本。图8示出了实施例,其中,使用三次插值预测直线左侧或直线下方的第一区域的样本,并且使用高斯插值预测直线右侧或直线上方的第二区域的样本。
表1(左列包含宽高比RA)中给出了(BMS1.0中定义的一组帧内预测模式的)mT的示例值和对应的角度。角度α如图7所示。
表1:(BMS1.0中定义的一组帧内预测模式的)mT的示例值
Figure BDA0002865221300000072
Figure BDA0002865221300000081
使用不同的插值滤波器预测块内的样本,其中,根据块的形状、定向是水平定向还是垂直定向、以及帧内预测模式角度来选择插值滤波器用于预测样本。
实施例也可以应用于参考样本滤波阶段。具体地,可以使用与上述用于插值滤波器的选择过程的规则类似的规则确定参考样本平滑滤波器。
图9是可以用于实现各种实施例的装置1100的框图。装置1500可以是如图1所示的源设备102、或如图2所示的视频编码器200、或如图1所示的目的地设备104、或如图3所示的视频解码器300。另外,装置1500可以托管上述元件中的一个或多个元件。在一些实施例中,装置1500配备有一个或多个输入/输出设备,例如扬声器、麦克风、鼠标、触摸屏、小键盘、键盘、打印机、显示器等。装置1500可以包括连接到总线的一个或多个中央处理单元(centralprocessing unit,CPU)1510、存储器1520、大容量存储器1530、视频适配器1540、以及I/O接口1560。总线是包括存储器总线或存储器控制器、外围总线、视频总线等的任何类型的若干总线架构中的一个或多个。
CPU 1510可以具有任何类型的电子数据处理器。存储器1520可以具有(或是)任何类型的系统存储器,例如静态随机存取存储器(static random access memory,SRAM)、动态随机存取存储器(dynamic random access memory,DRAM)、同步DRAM(synchronousDRAM,SDRAM)、只读存储器(read-only memory,ROM)、或这些存储器的组合等。在实施例中,存储器1520可以包括在启动时使用的ROM和在执行程序时使用的用于存储程序和数据的DRAM。在实施例中,存储器1520是非暂时性的。大容量存储器1530包括存储数据、程序、以及其他信息并且使这些信息可以经由总线访问的任何类型的存储设备。大容量存储器1530包括例如以下中的一个或多个:固态驱动器、硬盘驱动器、磁盘驱动器、光盘驱动器等。
视频适配器1540和I/O接口1560提供接口以将外部的输入设备和输出设备耦合到装置1500。例如,装置1500可以向客户端提供SQL命令接口。如图所示,输入设备和输出设备的示例包括耦合到视频适配器1540的显示器1590和耦合到I/O接口1560的鼠标/键盘/打印机1570的任何组合。其他设备可以耦合到装置1500,并且可以使用更多或更少的接口卡。例如,可以使用串行接口卡(未示出)为打印机提供串行接口。
装置1500还包括一个或多个网络接口1550,该网络接口1550包括有线链路(例如以太网电缆等),和/或到接入节点或一个或多个网络1580的无线链路。网络接口1550允许装置1500经由网络1580与远程单元进行通信。例如,网络接口1550可以提供到数据库的通信。在实施例中,装置1500耦合到局域网或广域网以进行数据处理和与远程设备(例如其他处理单元、互联网、远程存储设施等)进行通信。
为了计算预测给定块内的像素所需的加权系数的值,引入了分段线性逼近(piecewise linear approximation)。一方面,与直接的加权系数计算相比,分段线性逼近显著地降低了距离加权预测机制的计算复杂度,并且另一方面,与现有技术的简化相比,分段线性逼近有助于实现加权系数值的高精度。
实施例可以应用于其他双向帧内预测技术和基于位置的帧内预测技术(例如,PDPC的不同修改),也可以应用于使用基于从一个像素到另一像素的距离的加权系数来混合图片的不同部分的机制。
在本公开中描述的主题和操作的实施方式可以在数字电子电路中实现,或者在计算机软件、固件、或硬件中实现,包括在本发明中公开的结构及其等价结构或这些结构中的一个或多个的组合。本公开描述的主题的实施方式可以实现为一个或多个计算机程序,即计算机程序指令的一个或多个模块,这些程序指令编码在计算机存储介质上,以便由数据处理装置执行或控制数据处理装置的操作。替代地或附加地,上述程序指令可以编码在人工生成的传播信号(例如,机器生成的电信号、光信号、或电磁信号)中,生成这些信号来编码信息以传输到合适的接收器装置,以便由数据处理装置执行。计算机存储介质(例如计算机可读介质)可以是计算机可读存储设备、计算机可读存储基板、随机或串行访问存储器阵列或设备、或这些设备的一个或多个组合,也可以包括在这些设备中。此外,虽然计算机存储介质不是传播信号,但计算机存储介质可以是编码在人工生成的传播信号中的计算机程序指令的源或目的地。计算机存储介质可以是一个或多个单独的物理和/或非暂时性组件或介质(例如,多个CD、磁盘、或其他存储设备),也可以包括在这些介质中。
在一些实施方式中,本公开中描述的操作可以实现为云计算网络中的服务器上提供的托管服务。例如,上述计算机可读存储介质可以在云计算网络内逻辑分组和访问。云计算网络中的服务器可以包括用于提供基于云的服务的云计算平台。“云”、“云计算”和“基于云”等术语可以适当地互换使用而不脱离本公开的范围。基于云的服务可以是由服务器提供并通过网络传送到客户端平台的托管服务,以增强、补充、或替换在客户端计算机上本地执行的应用。电路可以使用基于云的服务来快速接收软件升级、应用、以及其他资源,否则需要很长的时间才能将资源传送到电路。
计算机程序(也称为程序、软件、软件应用、脚本、或代码)可以以任何形式的编程语言(包括编译或解释语言、声明或程序语言)编写,并且可以以任何形式部署,包括部署为独立程序或部署为适合在计算环境中使用的模块、组件、子例程、对象、或其他单元。计算机程序可以(但不需要)对应于文件系统中的文件。程序可以存储在包含其他程序或数据(例如存储在标记语言文档中的一个或多个脚本)的文件的一部分中,可以存储在专用于该程序的单个文件中,或者存储在多个协调文件(例如存储一个或多个模块、子程序或、部分代码的文件)中。计算机程序可以部署为在位于一个站点的一台计算机或分布在多个站点并通过通信网络互连的多个计算机上执行。
本公开中描述的过程和逻辑流可以由一个或多个可编程处理器执行,上述一个或多个可编程处理器执行一个或多个计算机程序,以通过对输入数据进行操作并生成输出来执行动作。上述过程和逻辑流也可以由专用逻辑电路(例如现场可编程门阵列(FPGA)或专用集成电路(ASIC))执行,并且装置也可以实现为专用逻辑电路。
适合执行计算机程序的处理器包括例如通用微处理器、专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器和/或随机访问存储器接收指令和数据。计算机的基本元件是用于根据指令执行动作的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储器(例如,磁盘、磁光盘、或光盘),或者计算机将可操作地耦合到上述大容量存储器,以从这些大容量存储设备接收数据和/或向这些大容量存储设备发送数据。然而,计算机不需要具有这样的设备。此外,计算机可以嵌入到其他设备中,例如移动电话、个人数字助理(personal digital assistant,PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(global positioning system,GPS)接收器、或便携式存储设备(例如通用串行总线(universal serial bus,USB)闪存驱动器),这里仅举几个例子。适用于存储计算机程序指令和数据的设备包括所有形式的非易失性存储器、介质、以及存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM、以及闪存设备;磁盘,例如内部硬盘或可移动磁盘;磁光盘;CD-ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路。
虽然本公开包含许多具体的实施方式细节,但这些细节不应解释为对任何实施方式或可能要求保护的范围的限制,而应为特定于特定实施方式的特定特征的描述。在本公开中,在单独的实施方式的上下文中描述的某些特征也可以在单个实施方式中结合实现。相反地,在单个实施方式的上下文中描述的各种特征也可以在多个实施方式中单独实现,或者在任何合适的子组合中实现。此外,尽管可以将特征描述为在某些组合中起作用,甚至最初所要求保护的为这样,但在一些情况下,可以从组合中删除所要求保护的组合的一个或多个特征,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描述了操作,但这不应理解为要求以所示特定顺序或先后顺序执行这样的操作,也不应理解为要求执行所有所示的操作以实现期望的结果。在某些情景中,多任务处理和并行处理可能是有利的。此外,不应将上述实施方式中的各种系统组件的分离理解为在所有实施方式中都需要这样的分离,并且应理解,所描述的程序组件和系统通常可以共同集成在单个软件产品中,或者封装到多个软件产品中。
因此,已经描述了主题的特定实施方式。其他实施方式在所附权利要求的范围之内。在一些情况中,权利要求中提到的动作可以以不同的顺序执行,并且仍然实现期望的结果。此外,附图中描述的过程不一定需要所示的特定顺序或先后顺序来实现期望的结果。在某些实施方式中,多任务处理和并行处理可能是有利的。

Claims (15)

1.一种用于帧内预测的基于宽高比滤波的方法,所述方法包括:
根据待预测的块的宽高比为所述块选择插值滤波器。
2.根据权利要求1所述的方法,其中,所述选择所述插值滤波器取决于对所述待预测的块的帧内预测模式进行阈值化的方向。
3.根据权利要求2所述的方法,其中,所述方向对应于所述待预测的块的主对角线的角度。
4.根据权利要求2或3所述的方法,如下计算所述方向的角度:
Figure FDA0002865221290000011
其中,W、H分别是所述待预测的块的宽度和高度。
5.根据权利要求1至4中任一项所述的方法,其中,宽高比为
RA=log2(W)-log2(H),
其中,W、H分别是所述待预测的块的宽度和高度。
6.根据权利要求3所述的方法,其中,基于所述宽高比确定所述待预测的块的所述主对角线的所述角度。
7.根据权利要求6所述的方法,其中,基于所述待预测的块的所述主对角线的所述角度确定所述块的帧内预测模式的阈值。
8.根据权利要求1所述的方法,其中,所述选择所述插值滤波器用于样本预测取决于对应的参考样本所属的边。
9.根据权利要求8所述的方法,其中,具有与帧内方向对应的角度的直线将所述块分成两个区域。
10.根据权利要求8或9所述的方法,其中,使用不同的插值滤波器预测属于不同区域的所述参考样本。
11.根据权利要求1至10中任一项所述的方法,其中,所述滤波器包括三次插值滤波器或高斯插值滤波器。
12.一种设备,用于实施根据权利要求1至11中任一项所述的方法。
13.一种设备,包括处理器,所述处理器用于实施根据权利要求1至11中任一项所述的方法。
14.一种计算机程序产品,包括程序代码,所述程序代码用于执行根据权利要求1至11中任一项所述的方法。
15.一种设备,包括:
一个或多个处理器;以及
非暂时性计算机可读存储介质,耦合到所述一个或多个处理器并且存储用于由所述一个或多个处理器执行的程序,其中,当由所述一个或多个处理器执行时,所述程序配置所述设备执行根据权利要求1至11中任一项所述的方法。
CN201980043899.6A 2018-07-11 2019-07-11 用于帧内预测的基于宽高比滤波的方法和装置 Active CN112352434B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862696816P 2018-07-11 2018-07-11
US201862696709P 2018-07-11 2018-07-11
US62/696,816 2018-07-11
US62/696,709 2018-07-11
PCT/RU2019/050110 WO2020013735A1 (en) 2018-07-11 2019-07-11 Method and apparatus for aspect-ratio dependent filtering for intra-prediction

Publications (2)

Publication Number Publication Date
CN112352434A true CN112352434A (zh) 2021-02-09
CN112352434B CN112352434B (zh) 2022-06-07

Family

ID=69141804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980043899.6A Active CN112352434B (zh) 2018-07-11 2019-07-11 用于帧内预测的基于宽高比滤波的方法和装置

Country Status (6)

Country Link
US (1) US11323706B2 (zh)
EP (1) EP3804336A4 (zh)
KR (1) KR20210016601A (zh)
CN (1) CN112352434B (zh)
BR (1) BR112020027089A2 (zh)
WO (1) WO2020013735A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3841558A4 (en) * 2018-09-23 2021-10-27 Huawei Technologies Co., Ltd. INTRA REFERENCE SAMPLE INTERPOLATION FILTER SWITCHING METHOD AND APPARATUS
US20220182616A1 (en) * 2019-03-12 2022-06-09 Lg Electronics Inc. Method and apparatus for encoding/decoding video and method for transmitting bitstream

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198063A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 编解码方法及装置、分像素插值处理方法及装置
US20120082224A1 (en) * 2010-10-01 2012-04-05 Qualcomm Incorporated Intra smoothing filter for video coding
US20130044814A1 (en) * 2010-05-10 2013-02-21 Thomson Licensing Methods and apparatus for adaptive interpolative intra block encoding and decoding
US20130156096A1 (en) * 2011-12-19 2013-06-20 Broadcom Corporation Block size dependent filter selection for motion compensation
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
US20170374389A1 (en) * 2011-04-01 2017-12-28 Ibex Pt Holdings Co., Ltd. Method of decoding moving pictures in intra prediction
US20180027255A1 (en) * 2014-11-04 2018-01-25 Samsung Electronics Co., Ltd. Video encoding method and apparatus, and video decoding method and apparatus using interpolation filter on which image characteristic is reflected

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9258573B2 (en) * 2010-12-07 2016-02-09 Panasonic Intellectual Property Corporation Of America Pixel adaptive intra smoothing
US9602839B2 (en) * 2011-06-15 2017-03-21 Futurewei Technologies, Inc. Mode dependent intra smoothing filter table mapping methods for non-square prediction units
CA3142170C (en) * 2017-05-31 2023-07-04 Lg Electronics Inc. Method and device for performing image decoding on basis of intra prediction in image coding system
EP3496401A1 (en) * 2017-12-05 2019-06-12 Thomson Licensing Method and apparatus for video encoding and decoding based on block shape
US10778971B2 (en) * 2018-06-01 2020-09-15 Tencent America LLC Method and apparatus for video coding

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101198063A (zh) * 2006-12-05 2008-06-11 华为技术有限公司 编解码方法及装置、分像素插值处理方法及装置
US20130044814A1 (en) * 2010-05-10 2013-02-21 Thomson Licensing Methods and apparatus for adaptive interpolative intra block encoding and decoding
US20120082224A1 (en) * 2010-10-01 2012-04-05 Qualcomm Incorporated Intra smoothing filter for video coding
CN103141100A (zh) * 2010-10-01 2013-06-05 高通股份有限公司 用于视频译码的帧内平滑滤波器
US20170374389A1 (en) * 2011-04-01 2017-12-28 Ibex Pt Holdings Co., Ltd. Method of decoding moving pictures in intra prediction
US20130156096A1 (en) * 2011-12-19 2013-06-20 Broadcom Corporation Block size dependent filter selection for motion compensation
CN105379266A (zh) * 2013-07-19 2016-03-02 高通股份有限公司 停用帧内预测滤波
US20180027255A1 (en) * 2014-11-04 2018-01-25 Samsung Electronics Co., Ltd. Video encoding method and apparatus, and video decoding method and apparatus using interpolation filter on which image characteristic is reflected

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GEERT VAN DER AUWERA等: "CE3-related: On MDIS and intra interpolation filter switching", 《JVET-K0064》 *
MOONMO KOO等: "Description of SDR video coding technology proposal by LG Electronics", 《JVET-J0017》 *

Also Published As

Publication number Publication date
US11323706B2 (en) 2022-05-03
CN112352434B (zh) 2022-06-07
US20210160491A1 (en) 2021-05-27
KR20210016601A (ko) 2021-02-16
BR112020027089A2 (pt) 2021-03-30
EP3804336A1 (en) 2021-04-14
EP3804336A4 (en) 2021-08-11
WO2020013735A1 (en) 2020-01-16

Similar Documents

Publication Publication Date Title
TWI688262B (zh) 用於視訊寫碼之重疊運動補償
CN114205592B (zh) 视频序列的帧内预测方法及装置
US20230128206A1 (en) Method and apparatus for dc intra prediction
US11323706B2 (en) Method and apparatus for aspect-ratio dependent filtering for intra-prediction
CN111416977A (zh) 视频编码器、视频解码器及相应方法
KR102407912B1 (ko) 양방향 인트라 예측 시그널링
US11805250B2 (en) Performing intra-prediction using intra reference sample filter switching
JP2023100767A (ja) ビデオシーケンスのためのピクチャエンコーディング及びデコーディング方法及び装置
CN112136327A (zh) 用于边界分割的方法和装置
US11539953B2 (en) Apparatus and method for boundary partition
CN116760976B (zh) 仿射预测决策方法、装置、设备及存储介质
WO2020119742A1 (zh) 块划分方法、视频编解码方法、视频编解码器
KR20210046777A (ko) 인터 예측 방법 및 장치, 비디오 인코더 및 비디오 디코더

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant