CN113950832A - 基于矩阵的帧内预测装置和方法 - Google Patents

基于矩阵的帧内预测装置和方法 Download PDF

Info

Publication number
CN113950832A
CN113950832A CN202080041446.2A CN202080041446A CN113950832A CN 113950832 A CN113950832 A CN 113950832A CN 202080041446 A CN202080041446 A CN 202080041446A CN 113950832 A CN113950832 A CN 113950832A
Authority
CN
China
Prior art keywords
samples
mip
current block
prediction
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080041446.2A
Other languages
English (en)
Inventor
M·萨勒海法尔
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN113950832A publication Critical patent/CN113950832A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文档的图像解码方法可以包括以下步骤:接收指示是否相对于当前块使用基于矩阵的帧内预测(MIP)的标志信息;基于标志信息来接收基于矩阵的帧内预测(MIP)模式信息;基于MIP模式信息来生成当前块的帧内预测样本;以及基于帧内预测样本来生成当前块的恢复样本。

Description

基于矩阵的帧内预测装置和方法
技术领域
本公开涉及图像编码技术,并且更具体地,涉及针对基于矩阵的帧内预测设备和基于矩阵的帧内预测的图像编码技术。
背景技术
如今,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量,与传统图像数据相比,所发送的信息量或比特量增加。因此,当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时,其传输成本和存储成本增加。
另外,如今,对于诸如虚拟现实(VR)和人工现实(AR)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加,并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。
因此,需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。
发明内容
技术问题
本公开的一技术方面在于提供用于增加图像编码效率的方法和设备。
本公开的另一技术方面在于提供高效帧内预测方法和高效帧内预测设备。
本公开的又一技术方面在于提供用于基于矩阵的帧内预测的图像编码方法和图像编码设备。
本公开的又一技术方面在于提供用于编码关于基于矩阵的帧内预测的模式信息的图像编码方法和图像编码设备。
技术方案
根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。方法可以包括:接收指示基于矩阵的帧内预测(MIP)是否用于当前块的标志信息;基于标志信息接收基于矩阵的帧内预测(MIP)模式信息;基于MIP模式信息生成当前块的帧内预测样本;以及基于帧内预测样本生成当前块的重构样本。
MIP模式信息可以是指示应用于当前块的MIP模式的索引信息。
帧内预测样本的生成可以包括:通过对与当前块邻近的参考样本进行降采样来推导缩减边界样本;基于缩减边界样本与MIP矩阵的乘法运算来推导缩减预测样本;以及通过对缩减预测样本进行上采样来生成当前块的帧内预测样本。
可以通过对参考样本进行平均来对缩减边界样本进行降采样,并且可以通过对缩减预测样本进行线性插值(interpolation)来对帧内预测样本进行上采样。
可以基于当前块的大小和索引信息来推导MIP矩阵。
MIP矩阵可以从根据当前块的大小分类的三个矩阵集中的任何一个矩阵集中选择,并且三个矩阵集中的每一个可以包括多个MIP矩阵。
根据本公开的另一实施方式,提供了一种由编码设备执行的图像编码方法。方法可以包括:推导是否将基于矩阵的帧内预测MIP应用于当前块;当将MIP应用于当前块时,基于MIP推导当前块的帧内预测样本;基于帧内预测样本推导当前块的残差样本;以及对关于残差样本的信息和关于MIP的信息进行编码,其中,关于MIP的信息可以包括指示MIP是否应用于当前块的标志信息和基于矩阵的帧内预测(MIP)模式信息。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括根据由编码设备执行的图像编码方法生成的编码的图像信息和比特流的图像数据。
根据本公开的又一实施方式,可以提供一种数字存储介质,该数字存储介质存储包括编码的图像信息和比特流的图像数据以使解码设备执行图像解码方法。
技术效果
本公开可以具有各种效果。例如,根据本公开的实施方式,可以增加整体图像/视频压缩效率。此外,根据本公开的实施方式,可以通过高效帧内预测来降低实现复杂性并增强预测性能,由此提高整体编码效率。另外,根据本公开的实施方式,当执行基于矩阵的帧内预测时,可以高效地编码指示基于矩阵的帧内预测的索引信息,由此提高编码效率。
通过说明书中的详细示例可以获得的效果不限于上述效果。例如,可以存在相关领域的普通技术人员可以从说明书中理解或导出的各种技术效果。因此,说明书的详细效果不限于在说明书中明确描述的那些,并且可以包括可以从说明书的技术特征中理解或导出的各种效果。
附图说明
图1示意性地例示了可应用本公开的实施方式的视频/图像编码系统的示例。
图2示意性地例示了可应用本公开的实施方式的视频/图像编码设备的配置。
图3示意性地例示了可应用本公开的实施方式的视频/图像解码设备的配置。
图4示意性地例示了可应用本公开的实施方式的基于帧内预测的图像编码方法示例。
图5示意性地例示了编码设备中的帧内预测器。
图6示意性地例示了可应用本公开的实施方式的基于帧内预测的图像解码方法示例。
图7示意性地例示了解码设备中的帧内预测器。
图8例示了可应用本公开的实施方式的编码设备中的基于MPM的帧内预测方法的示例。
图9例示了可应用本公开的实施方式的解码设备中的基于MPM的帧内预测方法的示例。
图10例示了可应用本公开的实施方式的帧内预测模式的示例。
图11例示了根据示例的基于MIP的预测样本生成过程。
图12例示了4×4块的MIP过程。
图13例示了8×8块的MIP过程。
图14例示了8×4块的MIP过程。
图15例示了16×16块的MIP过程。
图16例示了MIP过程中的边界平均过程。
图17例示了MIP过程中的线性插值。
图18例示了根据本公开的实施方式的MIP技术。
图19是示意性地例示根据本公开的实施方式的可以由解码设备执行的解码方法的流程图。
图20是示意性地例示根据本公开的实施方式的可以由编码设备执行的编码方法的流程图。
图21例示了可应用本公开的实施方式的内容流传输系统的示例。
具体实施方式
本文档可以以各种方式修改,并且可以具有各种实施方式,并且将在附图中例示并详细描述特定实施方式。然而,这并不旨在将本文档限制于特定实施方式。在本说明书中常用的术语用于描述特定实施方式,而不用于限制本文档的技术精神。除非在上下文中另外明确表述,否则单数形式的表述包括复数表述。在本说明书中的诸如“包括”或“具有”之类的术语应当被理解为指示说明书中描述的特性、数量、步骤、操作、元件、部件或它们的组合的存在,而不排除一个或更多个其它特性、数量、步骤、操作、元件、部件或它们的组合的存在或者添加一个或更多个其它特性、数量、步骤、操作、元件、部件或它们的组合的可能性。
在本文档中描述的附图中的元件是为了便于与不同的特性功能相关的描述而独立地例示的。这并不意指每个元件被实现为单独的硬件或单独的软件。例如,元件中的至少两个可以被组合以形成单个元件,或者单个元件可以被划分成多个元件。其中元件被组合和/或分离的实施方式也被包括在本文档的权利范围内,除非它偏离本文档的本质。
在本文档中,术语“A或B”可以意指“仅A”、“仅B”或“A和B两者”。换句话说,在本文档中,术语“A或B”可以被解释为指示“A和/或B”。例如,在本文档中,术语“A、B或C”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。
在本文档中使用的斜线“/”或逗号可以意指“和/或”。例如,“A/B”可以意指“A和/或B”。因此,“A/B”可以意指“仅A”、“仅B”或“A和B两者”。例如,“A,B,C”可以表示“A、B或C”。
在本文档中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B两者”。此外,在本文档中,表述“A或B中的至少一个”或者“A和/或B中的至少一个”可以被解释为“A和B中的至少一个”。
此外,在本文档中,“A、B和C中的至少一个”可以意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。此外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
另外,本文档中使用的括号可以意指“例如”。具体地,在表达“预测(帧内预测)”的情况下,这可以指示“帧内预测”被提出为“预测”的示例。换句话说,本文档中的“预测”不限于“帧内预测”,并且这可以指示“帧内预测”被提出为“预测”的示例。另外,即使在表达“预测(即,帧内预测)”的情况下,这也可以指示“帧内预测”被提出为“预测”的示例。
在本文档中,在一个附图中单独说明的技术特征可以被单独地实现,或者可以被同时实现。
本文档涉及视频/图像编码。例如,本文档中公开的方法/实施方式可以应用于通用视频编码(VVC)、基本视频编码(EVC)标准、AOMedia视频1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267或H.268等)中公开的方法。
本文档呈现了视频/图像编码的各种实施方式,并且除非另有说明,否则实施方式可以彼此组合地执行。
在本文档中,视频可以指代随时间的一系列图像。图片通常指代表示特定时间区域中的一个图像的单元,而条带/贴片(slice/tile)是构成编码的图片的一部分的单元。条带/贴片可以包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。砖块(brick)可以表示图片中的贴片内的CTU行的矩形区域。可以将贴片分割成多个块,每个砖块由贴片内的一或更多个CTU行组成。未被分割成多个砖块的贴片也可以被称为砖块。砖块扫描是砖块中的分割贴片的CTU的特定顺序排序,在图片中以CTU栅格扫描连续地排序,并且图片中的贴片以图片的贴片的栅格扫描连续地排序。贴片是图片中的特定贴片列和特定贴片行内的CTU的矩形区域。贴片列是CTU的矩形区域,其高度等于图片的高度并且宽度由图片参数集中的语法元素指定。贴片行是CTU的矩形区域,其高度由图片参数集中的语法元素指定并且宽度等于图片的宽度。贴片扫描是贴片中的分割图片的CTU的特定顺序排序,在图片中以CTU栅格扫描连续地排序,而图片中的贴片以图片的贴片的栅格扫描连续地排序。条带包括可以排它性地包括在单个NAL单元中的图片的整数数量的砖块。条带可以由多个完整贴片构成或者仅由一个贴片的完整砖块的连续序列构成。贴片组和条带可以在本文档中可互换地使用。例如,在此文档中,贴片组/贴片组报头可以被称作条带/条带报头。
像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外,“样本”可以用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集(或阵列)。
在下文中,参照附图更具体地描述本文档的优选实施方式。在下文中,在附图中,相同的附图标记用于相同的元件,并且可以省略相同元件的冗余描述。
图1示意性地例示可以应用本公开的实施方式的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
图2是示意性地例示可应用本公开的视频/图像编码设备的配置的图。在下文中,所谓的视频编码设备可以包括图像编码设备。
参照图2,编码设备200可以包括图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234、逆变换器235。残差处理器230可以进一步包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,以上描述的图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器270可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器270。
图像划分器210可以将输入到编码设备200的输入图像(或图片或帧)划分为一个或更多个处理单元。作为一个示例,处理单元可以被称为编码单元(CU)。在这种情况下,从编码树单元(CTU)或最大编码单元(LCU)开始,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地划分编码单元。例如,基于四叉树结构、二叉树结构和/或三叉树结构,一个编码单元可以被划分为深度较深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,并且可以稍后应用二叉树结构和/或三叉树结构。另选地,可以首先应用二叉树结构。可以基于未进一步划分的最终编码单元来执行根据本公开的编码过程。在这种情况下,基于根据图像特性的编码效率,最大编码单元可以直接用作最终编码单元。另选地,可以根据需要将编码单元递归地划分为更深的深度的编码单元,由此可以将最佳大小的编码单元用作最终编码单元。这里,编码过程可以包括诸如预测、变换和重构之类的过程,其将在后面描述。作为另一示例,处理单元可以进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以与上述最终编码单元分开或划分开。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
根据情况,可以使用单元和诸如块、区域等之类的术语来代替彼此。在通常情况下,M×N块可以表示由M列和N行构成的样本或变换系数的集。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可以用作与一幅图片(或图像)的像素或图元(pel)相对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且将所生成残差信号发送到变换器232。在此情况下,如图所示,编码设备200中的用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器可以对要处理的块(下文称为当前块)执行预测,并且生成包括当前块的预测样本的预测块。预测器可以基于当前块或CU来确定是应用帧内预测还是应用帧间预测。如后面在每个预测模式的描述中所描述的,预测器可以生成诸如预测模式信息之类的与预测相关的各种信息,并且将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这仅仅是示例,并且根据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参照图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参照图片中存在的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参照图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示哪个候选被用于推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳变模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下,与合并模式不同,不能发送残差信号。在运动信息预测(运动向量预测、MVP)模式的情况下,邻近块的运动向量可以被用作运动向量预测器,并且可以通过发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于下面描述的各种预测方法生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测二者。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板(palette)模式进行块的预测。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如画面内容编码(SCC)。IBC基本上在当前图片中执行预测,但可以与帧间预测类似地执行,因为在当前图片中推导参考块。也就是说,IBC可以使用本文档中所描述的至少一种帧间预测技术。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过将变换技术应用于残差信号而生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图形的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。CNT指代基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换过程可以被应用于大小相同的正方形像素块,或者可以应用于大小可变的块而非正方形的块。
量化器233可以对变换系数进行量化并且将它们发送到熵编码器240,并且熵编码器240可以对量化后的信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描次序将块型的量化变换系数重新布置成一维向量,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于量化变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等的各种编码方法。熵编码器240可以对除了量化变换系数(例如,语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码的信息(例如,编码的视频/图像信息)可以以比特流的形式以网络抽象层(NAL)为单位进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)等的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。在本文档中,从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图片信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络发送比特流,或者将其存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储信号的存储单元(未示出)可以被包括为编码设备200的内部/外部元件,并且另选地,发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过于经由解量化器234和逆变换器235将解量化和逆变换应用于量化变换系数来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在任何残差,诸如应用跳过模式的情况,则可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一个块的帧内预测,并且可以通过下面描述的滤波而用于下一个图片的帧间预测。
此外,可以在图片编码和/或重构期间应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过对重构信号应用滤波来提高主观/客观图像质量。例如,滤波器260可以通过将各种滤波方法应用于重构图片而生成修改的重构图片并且将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可以包括(例如)去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波相关的各种信息,并且将所生成的信息发送到熵编码器240,如后面在每个滤波方法的描述中所描述的。与滤波相关的信息可以由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可以在帧间预测器221中用作参照图片。当通过编码设备应用帧间预测时,可以避免编码设备200和解码设备之间的预测失配,并且可以提高编码效率。
存储器270的DPB可以存储修改的重构图片以用作帧间预测器221中的参照图片。存储器270可以存储当前图片中的已推导(或编码)运动信息的块的运动信息和/或图片中的已经重构的块的运动信息。所存储的运动信息可以发送到帧间预测器221并用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送到帧内预测器222。
图3是例示可以应用本文档的实施方式的视频/图像解码设备的配置的示意图。
参照图3,视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如,解码设备300可以基于与从比特流获得的与块分割相关的信息来推导单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元推导一个或更多个变换单元。并且,可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流的形式从图2的编码设备输出的信号,并且可以通过熵解码器310解码所接收的信号。例如,熵解码器310可以对比特流进行解析,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备还可以基于关于参数集的信息和/或常规约束信息对图片进行解码。在本文档中后面描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如,熵解码器310基于诸如指数哥伦布编码、CAVLC、或CABAC之类的编码方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素和关于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收比特流中的与各语法元素对应的bin,使用在前一阶段解码的符号/bin的信息、解码目标语法元素信息或解码目标块的解码信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin的发生概率来对bin执行算术解码,并且生成与每个语法元素的值对应的符号。在此情况下,CABAC熵解码方法可以在确定上下文模型之后通过使用针对下一个符号/bin的上下文模型的解码的符号/bin的信息来更新上下文模型。在由熵解码器310解码的信息当中的与预测相关的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值,即,量化变换系数和相关的参数信息可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,在由熵解码器310解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可以被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文档的解码设备可以被称为视频/图像/图片解码设备,并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以通过对量化变换系数进行解量化来输出变换系数。解量化器321可以将量化变换系数重新布置为二维块的形式。在这种情况下,可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且具体地可以确定帧内/帧间预测模式。
预测器320可以基于下面描述的各种预测方法生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式进行块的预测。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如画面内容编码(SCC)。IBC基本上在当前图片中执行预测,但可以与帧间预测类似地执行,因为在当前图片中推导参考块。也就是说,IBC可以使用本文档中所描述的至少一种帧间预测技术。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的邻居中,或者可以隔开地定位。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于由参照图片上的运动向量指定的参考块(参考样本阵列)推导当前块的预测块。在此情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块与当前块之间的运动信息的相关性而以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块以及存在于参照图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来构造运动信息候选列表,并且基于所接收的候选选择信息推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式执行帧间预测,并且关于预测的信息可以包括指示用于当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在任何残差,诸如当应用跳过模式时,可以将预测块用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一个块的帧内预测,可以通过下面描述的滤波而输出,或者可以用于下一个图片的帧间预测。
此外,可以在图片解码过程期间应用具有色度缩放的亮度映射(LMCS)。
滤波器350可以通过对重构信号应用滤波来提高主观/客观图像质量。例如,滤波器350可以通过将各种滤波方法应用于重构图片而生成修改的重构图片并且将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可以包括(例如)去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可以用作帧间预测器332中的参照图片。存储器360可以存储当前图片中的已推导(或解码)运动信息的块的运动信息和/或图片中的已经重构的块的运动信息。所存储的运动信息可以发送到帧间预测器260,从而用作空间相邻块的运动信息或时间相邻块的运动信息。存储器360可以存储当前图片中的重构块的重构样本并将重构样本传送到帧内预测器331。
在本文档中,编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同,或者分别应用以对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。
如上所述,在执行视频编码时,执行预测以增强压缩效率。可以通过预测生成包括当前块(即,目标编码块)的预测样本的预测块。在此情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中被同等地推导。编码设备可以通过向解码设备发信号通知关于原始块和预测块之间的残差的信息(残差信息),而非原始块的原始样本值本身,来增强图像编码效率。解码设备可以基于残差信息推导包括残差样本的残差块,可以通过将残差块与预测块相加来生成包括重构样本的重构图片,并且可以生成包括重构块的重构图片。
可以通过变换和量化过程来生成残差信息。例如,编码设备可以推导原始块与预测块之间的残差块,可以通过对残差块中包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,可以通过对变换系数执行量化过程来推导量化变换系数,并且可以(通过比特流)将相关残差信息发信号通知给解码设备。在此情况下,残差信息可以包括诸如值信息、位置信息、变换方案、变换核和量化变换系数的量化参数之类的信息。解码设备可以基于残差信息执行解量化/逆变换过程,并且可以推导残差样本(或残差块)。解码设备可以基于预测块和残差块生成重构图片。此外,编码设备可以通过对用于后续图片的帧间预测的参考的量化变换系数进行解量化/逆变换来推导残差块,并且可以生成重构图片。
此外,如果执行帧内预测,则可以使用样本之间的相关性,并且可以获得原始块与预测块之间的差(即,残差)。可以将前述变换和量化应用于残差。因此,可以减少空间冗余。在下文中,具体描述了使用帧内预测的编码方法和解码方法。
帧内预测指代用于基于包括当前块的图片(以下称为当前图片)内的当前块外部的参考样本生成当前块的预测样本的预测。在此情况下,当前块外部的参考样本可以指代邻近当前块的样本。如果将帧内预测应用到当前块,则可以推导要用于当前块的帧内预测的相邻参考样本。
例如,当当前块的大小(宽度×高度)是nW×nH时,当前块的相邻参考样本可以包括与左边界相邻的样本和与当前块的左下相邻的总共2×nH个样本,与当前块的上边界相邻的样本和与当前块的右上相邻的总共2×nW个样本,以及与当前块的左上相邻的样本。另选地,当前块的相邻参考样本还可以包括多列上相邻样本和多行左相邻样本。此外,当前块的相邻参考样本还可以包括与具有nW×nH大小的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本和与当前块的右下相邻的一个样本。
在此情况下,当前块的相邻参考样本中的一些尚未被解码或可能不可用。在此情况下,解码设备可以通过用可用样本取代不可用样本来配置要用于预测的相邻参考样本。另选地,可以通过可用样本的插值来构造要用于预测的相邻参考样本。
如果推导相邻参考样本,则(i)可以基于当前块的相邻参考样本的平均或插值来推导预测样本,以及(ii)可以基于当前块的相邻参考样本当中的在针对预测样本的特定(预测)方向上存在的参考样本来推导预测样本。当帧内预测模式是非定向模式或非角度模式时,可以应用(i)。当帧内预测模式为定向模式或角度模式时,可以应用(ii)。
此外,还可以通过相邻参考样本当中的位于当前块的帧内预测模式的预测方向上的第一相邻样本与位于基于当前块的预测样本的预测方向的相反方向上的第二相邻样本之间的插值来生成预测样本。前述情况可以称为线性插值帧内预测(LIP)。此外,还可以使用线性模型基于亮度样本生成色度预测样本。这种情况可以称为LM模式。
此外,可以基于经滤波的相邻参考样本来推导当前块的临时预测样本,并且还可以通过对常规相邻参考样本(即,未经滤波的相邻参考样本)当中的根据帧内预测模式推导出的至少一个参考样本和临时预测样本进行加权求和来推导当前块的预测样本。前述情况可以被称作位置相关帧内预测(PDPC)。
此外,可以通过在当前块的相邻的多条参考样本线当中选择具有最高预测精度的参考样本线来使用定位在对应线中的预测方向上的参考样本来推导预测样本,并且可以通过用于向解码设备指示(发信号通知)此时使用的参考样本线的方法来执行帧内预测编码。前述情况可以称为多参考线(MRL)帧内预测或基于MRL的帧内预测。
此外,可以通过将当前块分离成垂直或水平子分区而基于相同帧内预测模式执行帧内预测,并且可以以子分区为单位来推导并使用相邻参考样本。也就是说,在此情况下,当前块的帧内预测模式同等地应用于子分区,并且可以以子分区为单位来推导并使用相邻参考样本,由此增强一些情况下的帧内预测性能。这种预测方法可以被称为帧内子分区(ISP)帧内预测或基于ISP的帧内预测。
前述帧内预测方法可以与帧内预测模式分开地称为帧内预测类型。帧内预测类型可以称为各种词语,诸如帧内预测技术或附加帧内预测模式。例如,帧内预测类型(或附加帧内预测模式等)可以包括前述LIP、PDPC、MRL和ISP中的至少一个。除了诸如LIP、PDPC、MRL和ISP之类的特定帧内预测类型之外的一般帧内预测方法可以被称作正常帧内预测类型。如果不应用特定帧内预测类型,那么通常可以应用正常帧内预测类型,并且可以基于前述帧内预测模式执行预测。此外,如果需要,则也可以执行用于推导的预测样本的后处理滤波。
除了上述帧内预测类型之外,基于矩阵的帧内预测(以下称为MIP)可以被用作用于帧内预测的方法。MIP可以被称为仿射线性加权帧内预测(ALWIP)或矩阵加权帧内预测(MWIP)。
当MIP应用于当前块时,用于当前块的预测样本可以通过以下来推导:i)使用已经经历平均过程的相邻参考样本;ii)执行矩阵-向量乘法过程;和(iii)如果需要,进一步执行水平/垂直插值过程。用于MIP的帧内预测模式可以与用于前述LIP、PDPC、MRL或ISP帧内预测中或用于正常帧内预测的帧内预测模式不同地配置。
MIP的帧内预测模式可以被称作仿射线性加权帧内预测模式或基于矩阵的帧内预测模式。例如,矩阵-向量乘法中使用的矩阵和偏移可以根据MIP的帧内预测模式而被不同地配置。此处,矩阵可以被称作(仿射)加权矩阵,并且偏移可以被称作(仿射)偏移向量或(仿射)偏置向量。在本公开中,MIP的帧内预测模式可以被称作MIP帧内预测模式、线性加权帧内预测模式、矩阵加权帧内预测模式或基于矩阵的帧内预测模式。后面将描述特定MIP方法。
下面的附图已经被准备以解释本文档的具体示例。由于在附图中描述的特定装置的名称或特定的词语或名称(例如,语法名称等)被示例性地呈现,所以本文档的技术特征不限于下面的附图中使用的特定名称。
图4示意性地例示了可应用本公开的实施方式的基于帧内预测的图像编码方法的示例,并且图5示意性地例示了编码设备中的帧内预测器。图5所示的编码设备中的帧内预测器也可以同等地或与其对应地应用到图2所示的编码设备200的帧内预测器222。
参照图4和图5,可以由编码设备的帧内预测器222执行S400,并且可以由编码设备的残差处理器230执行S410。具体地,S410可以由编码设备的减法器231执行。在S420中,预测信息可以由帧内预测器222推导,并且由熵编码器240编码。在S420中,残差信息可以由残差处理器230推导,并且由熵编码器240编码。残差信息指示关于残差样本的信息。残差信息可以包括关于残差样本的量化变换系数的信息。如上所述,可以根据通过编码设备的变换器232的变换系数推导残差样本,并且可以根据通过量化器233的量化变换系数推导变换系数。关于量化变换系数的信息可以由熵编码器240通过残差编码过程来编码。
编码设备对当前块执行帧内预测(S400)。编码设备可以推导当前块的帧内预测模式/类型,推导当前块的相邻参考样本,并且基于帧内预测模式/类型以及相邻参考样本来生成当前块中的预测样本。这里,还可以同时执行确定帧内预测模式/类型、推导相邻参考样本以及生成预测样本的过程,并且任何一个过程也可以比其它过程更早地执行。
例如,编码设备的帧内预测器222可以包括帧内预测模式/类型确定器222-1、参考样本推导器222-2和预测样本推导器222-3,其中帧内预测模式/类型确定器222-1可以确定当前块的帧内预测模式/类型,参考样本推导器222-2可以推导当前块的相邻参考样本,并且预测样本推导器222-3可以推导当前块的预测样本。此外,尽管未示出,但是如果执行预测样本滤波过程,则帧内预测器222也还可以包括预测样本滤波器(未示出)。编码设备可以确定多个帧内预测模式/类型当中的应用于当前块的模式/类型。编码设备可以比较帧内预测模式/类型的RD成本并且确定当前块的最佳帧内预测模式/类型。
如上所述,编码设备还可以执行预测样本滤波过程。预测样本滤波可以被称作后滤波。预测样本中的一些或全部可以通过预测样本滤波过程进行滤波。在一些情况下,可以省略预测样本滤波过程。
编码设备基于(经滤波的)预测样本生成当前块的残差样本(S410)。编码设备可以基于当前块的原始样本中的相位来比较预测样本,并且推导残差样本。
编码设备可以对包括关于帧内预测的信息(预测信息)和关于残差样本的残差信息的图像信息进行编码(S420)。预测信息可以包括帧内预测模式信息和帧内预测类型信息。残差信息可以包括残差编码语法。编码设备可以通过变换/量化残差样本来推导量化变换系数。残差信息可以包括关于量化变换系数的信息。
编码设备可以以比特流的形式输出编码图像信息。输出的比特流可以通过存储介质或网络递送到解码设备。
如上所述,编码设备可以生成重构图片(包括重构样本和重构块)。为此,编码设备可以通过再次解量化/逆变换量化变换系数来推导(修改的)残差样本。如上所述,变换/量化残差样本并然后再次解量化/逆变换它们的原因是推导与由解码设备推导的残差样本相同的残差样本,如上所述。编码设备可以基于预测样本和(修改的)残差样本生成包括当前块的重构样本的重构块。可以基于重构块生成当前图片的重构图片。如上所述,还可以将环路内滤波过程等应用于重构图片。
图6示意性地例示了可应用本公开的实施方式的基于帧内预测的图像解码方法示例,并且图7示意性地例示了解码设备中的帧内预测器。图7所示的解码设备中的帧内预测器也可以同等地或与其对应地应用到图3所示的解码设备300的帧内预测器331。
参照图6和图7,解码设备可以执行与由编码设备执行的前述操作相对应的操作。可以由解码设备的帧内预测器331来执行S600至S620,并且可以由解码设备的熵解码器310从比特流中获取S600中的预测信息和S630中的残差信息。解码设备的残差处理器320可以基于残差信息推导当前块的残差样本。具体地,残差处理器320的解量化器321可以通过在基于残差信息推导的量化变换系数的基础上执行解量化来推导变换系数,并且残差处理器的逆变换器322通过对变换系数进行逆变换来推导当前块的残差样本。S640可以由解码设备的加法器340或重构器执行。
解码设备可以基于所接收的预测信息(帧内预测模式/类型信息)推导当前块的帧内预测模式/类型(S600)。解码设备可以推导当前块的相邻参考样本(S610)。解码设备基于帧内预测模式/类型和相邻参考样本来生成当前块中的预测样本(S620)。在此情况下,解码设备可以执行预测样本滤波过程。预测样本滤波可以被称作后滤波。预测样本中的一些或全部可以由预测样本滤波过程滤波。在一些情况下,可以省略预测样本滤波过程。
解码设备基于所接收的残差信息生成当前块的残差样本(S630)。解码设备可以基于预测样本和残差样本生成当前块的重构样本,并且推导包括重构样本的重构块(S640)。可以基于重构块生成当前图片的重构图片。如上所述,还可以将环路内滤波过程等应用于重构图片。
这里,解码设备的帧内预测器331可以包括帧内预测模式/类型确定器331-1、参考样本推导器331-2和预测样本推导器331-3,其中帧内预测模式/类型确定器331-1可以基于由熵解码器310获取的帧内预测模式/类型信息来确定当前块的帧内预测模式/类型,参考样本推导器331-2可以推导当前块的相邻参考样本,并且预测样本推导器331-3可以推导当前块的预测样本。此外,尽管未示出,但是如果执行前述预测样本滤波过程,则帧内预测器331也还可以包括预测样本滤波器(未示出)。
帧内预测模式信息可以包括(例如)指示是否将最可能模式(MPM)应用于当前块或者是否将其余模式应用于其的标志信息(例如,intra_luma_mpm_flag)。此时,如果将MPM应用于当前块,则预测模式信息还可以包括指示帧内预测模式候选(MPM候选)中的一个的索引信息(例如,intra_luma_mpm_idx)。帧内预测模式候选(MPM候选)可以由MPM候选列表或MPM列表构成。此外,如果MPM不应用于当前块,则帧内预测模式信息还可以包括指示除帧内预测模式候选(MPM候选)之外的其余帧内预测模式中的一个的其余模式信息(例如,intra_luma_mpm_remainder)。解码设备可以基于帧内预测模式信息确定当前块的帧内预测模式。
此外,帧内预测类型信息可以以各种形式实现。作为示例,帧内预测类型信息可以包括指示帧内预测类型中的一个的帧内预测类型索引信息。作为另一示例,帧内预测类型信息可以包括以下中的至少一个:参考样本线信息(例如,intra_luma_ref_idx),其指示是否将MRL应用于当前块以及如果应用MRL则使用哪条参考样本线;ISP标志信息(例如,intra_subpartitions_mode_flag),其指示ISP是否应用于当前块;ISP类型信息(例如,intra_subpartitions_split_flag),其指示如果应用ISP则子分区的分割类型;指示是否应用PDCP的标志信息,其;或者指示是否应用LIP的标志信息。此外,帧内预测类型信息可以包括指示MIP是否应用于当前块的MIP标志。
上述帧内预测模式信息和/或帧内预测类型信息可以通过本文档中描述的编码方法进行编码/解码。例如,可以通过基于截断的(莱斯)二进制码的熵编码(例如,CABAC、CAVLC)来编码/解码前述帧内预测模式信息和/或帧内预测类型信息。
此外,在应用帧内预测的情况下,可以使用相邻块的帧内预测模式来确定应用于当前块的帧内预测模式。例如,解码设备可以基于所接收的mpm索引在基于当前块的相邻块(例如,左相邻块和/或上相邻块)的帧内预测模式以及附加候选模式推导出的最可能模式(mpm)列表中的mpm候选中选择一个mpm候选,或者可以基于其余帧内预测模式信息选择不包括于mpm候选(和平面模式)中的其余帧内预测模式中的一个。mpm列表可以被构造为包括或不包括平面模式作为候选。例如,如果mpm列表包括平面模式作为候选,则mpm列表可以具有6个候选,而如果mpm列表不包括平面模式作为候选,则mpm列表可以具有5个候选。如果mpm列表不包括平面模式作为候选,则可以发信号通知指示当前块的帧内预测模式是否为平面模式的非平面标志(例如,intra_luma_not_planar_flag)。例如,可以首先发信号通知mpm标志,并且当mpm标志的值等于1时可以发信号通知mpm索引和非平面标志。此外,当非平面标志的值等于1时,可以发信号通知mpm索引。这里,构造mpm列表以不包括平面模式作为候选是首先通过首先发信号通知标志(非平面标志)来标识帧内预测模式是否为平面模式,因为平面模式一直被视为mpm,而非平面模式不是mpm。
例如,可以基于mpm标志(例如,intra_luma_mpm_flag)指示应用于当前块的帧内预测模式是在mpm候选(和平面模式)中还是在其余模式中。mpm标志值1可以表示当前块的帧内预测模式在mpm候选(和平面模式)中,并且mpm标志值0可以表示当前块的帧内预测模式不在mpm候选(和平面模式)中。非平面标志(例如,intra_luma_not_planar_flag)值0可以表示当前块的帧内预测模式为平面模式,并且非平面标志值1可以表示当前块的帧内预测模式不是平面模式。mpm索引可以以mpm_idx或intra_luma_mpm_idx语法元素的形式发信号通知,并且其余帧内预测模式信息可以以rem_intra_luma_pred_mode或intra_luma_mpm_remainder语法元素的形式发信号通知。例如,其余帧内预测模式信息可以按其预测模式数量的次序对整个帧内预测模式当中的不包括于mpm候选(和平面模式)中的其余帧内预测模式进行索引,并且可以指示其中的一者。帧内预测模式可以为亮度分量(样本)的帧内预测模式。在下文中,帧内预测模式信息可以包括mpm标志(例如,intra_luma_mpm_flag)、非平面标志(例如,intra_luma_not_plane_flag)、mpm索引(例如,mpm_idx或intra_luma_mpm_idx)以及其余帧内预测模式信息(rem_intra_luma_pred_mode或intra_luma_mpm_remainder)中的至少一个。在本文档中,mpm列表可以被称作各种词语,诸如mpm候选列表、候选模式列表(candModeList)和候选帧内预测模式列表。
通常,当分割图像的块时,要编码的当前块和相邻块具有类似的图像属性。因此,当前块和相邻块更可能具有相同或相似的帧内预测模式。因此,编码器可以使用相邻块的帧内预测模式来编码当前块的帧内预测模式。例如,编码器/解码器可以构成当前块的最可能模式(MPM)列表。MPM列表还可以被称作MPM候选列表。这里,MPM可以意指用于在对帧内预测模式进行编码时考虑当前块与相邻块之间的相似性来提高编码效率的模式。
图8例示了可应用本公开的示例性实施方式的编码设备中的基于MPM的帧内预测方法的示例。
参照图8,编码设备构建当前块的MPM列表(S800)。MPM列表可以包括更可能应用于当前块的候选帧内预测模式(MPM候选)。MPM列表还可以包括相邻块的帧内预测模式,并且也还包括根据预定方法的特定帧内预测模式。后面将描述用于构造MPM列表的特定方法。
编码设备确定当前块的帧内预测模式(S810)。编码设备可以基于各种帧内预测模式执行预测,并且基于以上预测基于率失真优化(RDO)确定最佳帧内预测模式。在此情况下,编码设备还可以使用仅在MPM列表中配置的MPM候选和平面模式来确定最佳帧内预测模式,或者还使用其余帧内预测模式以及在MPM列表中配置的MPM候选和平面模式来确定最佳帧内预测模式。
具体地,例如,如果当前块的帧内预测类型为不同于正常帧内预测类型的特定类型(例如,LIP、MRL或ISP),则编码设备可以仅考虑MPM候选和平面模式作为当前块的帧内预测模式候选来确定最佳帧内预测模式。也就是说,在此情况下,可以仅在MPM候选和平面模式中确定当前块的帧内预测模式,并且在此情况下,可以不对mpm标志进行编码/信令。在此情况下,即使没有mpm标志的单独信令,解码设备也可以估计mpm标志为1。
一般来说,如果当前块的帧内预测模式不是平面模式且为MPM列表中的MPM候选中的一个,则编码设备生成指示MPM候选中的一个的mpm索引(mpm idx)。如果当前块的帧内预测模式甚至不存在于MPM列表中,则编码设备生成其余帧内预测模式信息,其指示未包括于MPM列表(和平面模式)中的其余帧内预测模式当中的模式作为当前块的帧内预测模式。
编码设备可以编码帧内预测模式信息以按比特流的形式输出帧内预测模式信息(S820)。帧内预测模式信息可以包括前述mpm标志、非平面标志、mpm索引和/或其余帧内预测模式信息。一般来说,mpm索引和其余帧内预测模式信息具有另选关系且在指示一个块的帧内预测模式时不同时发信号通知。也就是说,将mpm标志的值1以及非平面标志或mpm索引一起发信号通知,或者将mpm标志的值0以及其余帧内预测模式信息一起发信号通知。然而,如上所述,如果将特定帧内预测类型应用于当前块,则不发信号通知mpm标志且还可以仅发信号通知非平面标志和/或mpm索引。也就是说,在此情况下,帧内预测模式信息还可以仅包括非平面标志和/或mpm索引。
图9例示了可应用本公开的示例性实施方式的编码设备中的基于MPM的帧内预测方法的示例。图9所示的解码设备可以确定对应于由图8所示的编码设备确定和发信号通知的帧内预测模式信息的帧内预测模式。
参照图9,解码设备从比特流中获得帧内预测模式信息(S900)。如上所述,帧内预测模式信息可以包括mpm标志、非平面标志、mpm索引和其余帧内预测模式中的至少一个。
解码设备构建MPM列表(S910)。MPM列表由在编码设备中构造的相同MPM列表组成。也就是说,MPM列表也可以包括相邻块的帧内预测模式,并且也还包括根据预定方法的特定帧内预测模式。后面将描述用于构造MPM列表的特定方法。
尽管示出了S910比S900晚执行,但是它是例示性的,并且S910也可以比S900早执行,并且S900和S910也可以同时执行。
解码设备基于MPM列表和帧内预测模式信息确定当前块的帧内预测模式(S920)。
作为示例,如果mpm标志的值为1,则解码设备可以推导平面模式作为当前块的帧内预测模式,或推导MPM列表中的MPM候选当中的由mpm索引指示的候选(基于非平面标志)作为当前块的帧内预测模式。这里,MPM候选还可以指示仅包括于MPM列表中的候选,或还包括适用于mpm标志的值为1以及包括于MPM列表中的候选的平面模式。
作为另一示例,如果mpm标志的值为0,则解码设备可以推导其余帧内预测模式当中的由其余帧内预测模式信息指示的帧内预测模式作为当前块的帧内预测模式,其余帧内预测模式不包括于MPM列表和平面模式中。
作为又一示例,如果当前块的帧内预测类型为特定类型(例如,LIP、MRL或ISP),则即使没有mpm标志的确认,解码设备也可以推导MPM列表中的由mpm索引指示的候选或平面模式作为当前块的帧内预测模式。
在构造MPM列表时,在实施方式中,编码设备/解码设备可以推导作为当前块的左相邻块的候选帧内预测模式的左模式,并且可以推导作为当前块的上相邻块的候选帧内预测模式的上模式。这里,左相邻块可以表示位于邻近当前块左边的左相邻块当中的最下的相邻块,并且上相邻块可以表示位于邻近当前块的上部的上相邻块当中的最右的相邻块。例如,如果当前块的大小为W×H并且当前块的左上样本位置的x分量和y分量分别为xN和yN,则左相邻块可以为包括坐标(xN-1、yN+H-1)中的样本的块,并且上相邻块可以为包括坐标(xN+W-1、yN-1)中的样本的块。
例如,当左相邻块可用并且帧内预测应用于左相邻块时,编码设备/解码设备可以将左相邻块的帧内预测模式推导为左候选帧内预测模式(即,左模式)。当上相邻块可用、帧内预测应用于上相邻块并且上相邻块包括于当前CTU中时,解码设备可以将上相邻块的帧内预测模式推导为上候选帧内预测模式(即,上模式)。另选地,当左相邻块不可用或帧内预测未应用于左相邻块时,编码设备/解码设备可以推导平面模式作为左模式。当上相邻块不可用或帧内预测未应用于上相邻块或上相邻块不包括于当前CTU中时,解码设备可以推导平面模式作为上模式。
编码设备/解码设备可以通过基于从左相邻块推导的左模式和从上相邻块推导的上模式推导当前块的候选帧内预测模式来构造MPM列表。在此情况下,MPM列表可以包括左模式和上模式,并且还可以包括根据预定方法的特定帧内预测模式。
此外,在构造MPM列表时,可以应用正常帧内预测模式(正常帧内预测类型),或者可以应用特定帧内预测类型(例如,MRL或ISP)。本文档提出了一种用于在不仅应用正常帧内预测方法(正常帧内预测类型)而且应用特定帧内预测类型(例如,MRL或ISP)时构造MPM列表的反腐,并且这将在后面描述。
此外,帧内预测模式可以包括非定向(或非角度)帧内预测模式和定向(或角度)帧内预测模式。例如,在HEVC标准中,使用包括2个非定向预测模式和33个定向预测模式的帧内预测模式。非定向预测模式可以包括平面帧内预测模式(即,0号)以及DC帧内预测模式(即,1号)。定向预测模式可以包括2号至34号的帧内预测模式。平面模式帧内预测模式可以被称作平面模式,并且DC帧内预测模式可以被称作DC模式。
另选地,为了捕获在自然视频中提议的给定边缘方向,定向帧内预测模式可以从现有33个模式扩展到如在图10中的65个模式。在此情况下,帧内预测模式可以包括2个非定向帧内预测模式和65个定向帧内预测模式。非定向帧内预测模式可以包括平面帧内预测模式(即,0号)和DC帧内预测模式(即,1号)。定向帧内预测模式可以包括2号到66号的帧内预测模式。扩展的定向帧内预测模式可以应用于具有所有大小的块,并且可以应用于亮度分量和色度分量两者。然而,这是一个示例,并且本文档的实施方式可以应用于帧内预测模式的数量不同的情况。还可以使用根据情况的67帧内预测模式。67号帧内预测模式可以指示线性模型(LM)模式。
图10例示了可以应用本文档的实施方式的帧内预测模式的示例。
参照图10,可以基于具有左上对角线预测方向的第34号帧内预测模式来将模式划分成具有水平方向性的帧内预测模式以及具有垂直方向性的帧内预测模式。在图10中,H和V分别意指水平方向性和垂直方向性。数字-32到32中的每一个指示样本网格位置上的1/32单元的位移。第2至33号帧内预测模式具有水平方向性,并且第34至66号帧内预测模式具有垂直方向性。第18号帧内预测模式和第50号帧内预测模式分别指示水平帧内预测模式和垂直帧内预测模式。第2号帧内预测模式可以被称作左下对角线帧内预测模式,第34号帧内预测模式可以被称作左上对角线帧内预测模式,并且第66号帧内预测模式可以被称作右上对角线帧内预测模式。
用于MIP的帧内预测模式可以指示用于帧内预测的矩阵和偏移,而非现有的定向模式。也就是说,可以通过MIP的帧内模式推导用于帧内预测的矩阵和偏移。在此情况下,当推导用于一般帧内预测或用于生成上文所描述的MPM列表的帧内模式时,可以将由MIP预测的块的帧内预测模式设置为预设模式,例如,平面模式或DC模式。根据另一示例,MIP的帧内模式可以基于块大小而映射到平面模式、DC模式或定向帧内模式。
在下文中,描述了作为帧内预测方法的基于矩阵的帧内预测(MIP)。
如上所述,基于矩阵的帧内预测(下文中,MIP)可以被称作仿射线性加权帧内预测(ALWIP)或矩阵加权帧内预测(MWIP)。为了预测具有宽度(W)和高度(H)的矩形块的样本,MIP使用与块的左边界相邻的重构样本当中的一条H线以及与块的上边界相邻的重构样本当中的一条W线作为输入值。当没有重构样本可以用时,可以通过应用于一般帧内预测的插值方法来生成参考样本。
图11例示了根据示例的基于MIP的预测样本生成过程。如下参照图11描述MIP过程。
1.平均过程
在边界样本当中,通过平均过程提取针对W=H=4的情况的四个样本和针对任何其它情况的八个样本。
2.矩阵-向量乘法过程
使用平均样本作为输入来执行矩阵向量乘法,随后添加偏移。通过此操作,可以推导出原始块中的下采样的样本集的缩减预测样本。
3.(线性)插值过程
通过线性插值从下采样的样本集的预测样本中生成其余位置处的预测样本,线性插值在每个方向上为单步线性插值。
生成预测块或预测样本所需的矩阵和偏移向量可以选自矩阵的三个集S0、S1和S2
集S0可以包括16个矩阵A0 i,i∈{0,…,15},以及16个偏移向量b0 i,i∈{0,…,15},并且每个矩阵可以包括16个行、4个列。集S0的矩阵和偏移向量可以用于4×4块。在另一示例中,集S0可以包括18个矩阵。
集S1可以包括八个矩阵A1 i,i∈{0,…,7},以及八个偏移向量b1 i,i∈{0,…,7},并且每个矩阵可以包括16个行、8个列。在另一示例中,集S1可以包括六个矩阵。集S1的矩阵和偏移向量可以用于4×8、8×4和8×8块。另选地,集S1的矩阵和偏移向量可以用于4×H或W×4块。
最后,集S2可以包括六个矩阵A2 i,i∈{0,…,5},以及六个偏移向量b2 i,i∈{0,…,5},并且每个矩阵可以包括64个行、8个列。集S2的矩阵和偏移向量或者其中的一些可以用于具有集S0和集S1不应用的不同大小的任何块。例如,集S2的矩阵和偏移向量可以用于具有8或更大的高度和宽度的块的操作。
矩阵-向量乘法的计算所需的乘法的总数总是小于或等于4×W×H。也就是说,在MIP模式中,每个样本需要最多四次乘法。
在下文中,简要描述了整体MIP过程。下面未描述的其余块可以在所描述的四个情况中的任一者中处理。
图12至图15例示了根据块的大小的MIP过程,其中图12例示了用于4×4块的MIP过程,图13例示了用于8×8块的MIP过程,图14例示了用于8×4块的MIP过程,并且图15例示了用于16×16块的MIP过程。
如图12所示,给定4×4块,MIP根据边界的每个轴线对两个样本进行平均。结果,四个输入样本是矩阵-向量乘法的输入,并且矩阵取自集S0。添加偏移,由此生成16个最终预测样本。对于4×4块,不需要线性插值以生成预测样本。因此,每个样本可以执行的总共(4×16)/(4×4)=4次乘法。
如图13所示,给定8×8块,MIP根据边界的每个轴线对四个样本进行平均。结果,八个输入样本是矩阵-向量乘法的输入,并且矩阵取自集S1。通过矩阵-向量乘法在奇数位置处生成16个样本。
对于8×8块,每个样本执行总共(8×16)/(8×8)=2次乘法以生成预测样本。在添加偏移之后,使用缩减上边界样本来对样本进行垂直插值,并且使用原始左边界样本来对样本进行水平插值。在此情况下,由于在插值过程中不需要乘法运算,所以对于MIP需要每个样本总共两次乘法。
如图14所示,给定8×4块,MIP根据边界的水平轴线对四个样本进行平均,并且根据垂直轴线在左边界上使用四个样本值。结果,八个输入样本是矩阵-向量乘法的输入,并且矩阵取自集S1。通过矩阵向量乘法,在奇数水平位置和对应垂直位置处生成16个样本。
对于8×4块,每个样本执行总共(8×16)/(8×4)=4次乘法以生成预测样本。在添加偏移之后,使用原始左边界样本对样本进行水平插值。在此情况下,由于在插值过程中不需要乘法运算,所以对于MIP需要每个样本总共四次乘法。
如图15所示,给定16×16块,MIP根据每个轴线对四个样本进行平均。结果,八个输入样本是矩阵-向量乘法的输入,并且矩阵取自集S2。通过矩阵-向量乘法,在奇数位置处生成64个样本。对于16×16块,每个样本执行总共(8×64)/(16×16)=2次乘法以生成预测样本。在添加偏移之后,使用八个缩减上边界样本对样本进行垂直插值,并且使用原始左边界样本对样本进行水平插值。在此情况下,由于在插值过程中不需要乘法运算,所以对于MIP需要每个样本总共两次乘法运算。
对于更大的块,MIP过程与上述过程基本相同,并且可以容易地识别每个样本的乘法的数量小于4。
对于宽度大于8(W>8)的W×8块,由于在奇数水平位置和每个垂直位置处生成样本,所以仅需要水平插值。在这种情况下,每个样本执行(8×64)/(W×8)=64/W次乘法以用于缩减样本的预测操作。在W=16的情况下,对于线性插值不需要附加乘法,并且在W>16的情况下,线性插值所需的每个样本的附加乘法的数量小于2。也就是说,每个样本的乘法的总数小于或等于4。
对于宽度大于4(W>4)的W×4块,从省略对应于沿着降采样块的水平轴线的奇数条目的所有行而得到的矩阵被定义为Ak。因此,输出的大小为32,并且仅执行水平插值。对于缩减样本的预测操作,每个样本执行(8×32)/(W×4)=64/W次乘法。在W=16的情况下,不需要附加乘法,并且在W>16的情况下,线性插值所需的每个样本的附加乘法的数量小于2。也就是说,每个样本的乘法的总数小于或等于4。
当矩阵被转置时,可以相应地执行处理。
图16例示了MIP过程中的边界平均过程。参照图16详细描述平均过程。
根据平均过程,对每个边界(左边界或上边界)应用平均。边界指示与当前块的边界邻近的相邻参考样本,如图16所示。例如,左边界(bdryleft)指示与当前块的左边界邻近的左相邻参考样本,并且上边界(bdrytop)指示与上部邻近的上相邻参考样本。
当当前块为4×4块时,可以通过平均过程将每个边界的大小缩减到两个样本。当当前块不是4×4块时,可以通过平均过程将每个边界的大小缩减到四个样本。
平均过程的第一步是将输入的边界(bdryleft和bdrytop)缩减到更小的边界(
Figure BDA0003390920200000281
Figure BDA0003390920200000282
)。
Figure BDA0003390920200000283
Figure BDA0003390920200000284
包括用于4×4块的两个样本,并且针对任何其它情况包括四个样本。
对于4×4块,其中0≤i<2,
Figure BDA0003390920200000285
可以由下式表示,并且可以类似地定义
Figure BDA0003390920200000286
[式1]
Figure BDA0003390920200000287
当块的宽度是W=4×2k时,其中0≤i<4,
Figure BDA0003390920200000288
可以由下式表示,并且可以类似地定义
Figure BDA0003390920200000289
[式2]
Figure BDA00033909202000002810
由于两个缩减边界
Figure BDA00033909202000002811
Figure BDA00033909202000002812
被级联成缩减边界向量bdryred,因此bdryred在4×4块中具有4的大小,并且在任何其它块中具有8的大小。
当“模式(mode)”指示MIP模式时,可以根据下式基于块的大小和intra_mip_transposed_flag值来定义缩减边界向量bdryred和MIP模式的范围。
[式3]
Figure BDA00033909202000002813
在上式中,intra_mip_transposed_flag可以被称作MIP转置,并且此标志信息可以指示是否转置缩减预测样本。此语法元素的语义可以表示为“intra_mip_transposed_flag[x0][y0]指定用于亮度样本的基于矩阵的帧内预测模式的输入向量是否转置。
最后,对于下采样的预测样本的插值,对于大块需要平均边界的第二版本。也就是说,如果宽度和高度中的较小值大于8(min(W,H)>8)并且宽度等于或大于高度(W≥H),则W=8*2l,并且
Figure BDA0003390920200000291
可以通过下式定义,其中0≤i<8。如果宽度和高度种的较小值大于8(min(W,H)>8)并且高度大于宽度(H>W),则可以类似地定义
Figure BDA0003390920200000292
[式4]
Figure BDA0003390920200000293
接下来,描述了用于通过矩阵-向量乘法来生成缩减预测样本的过程。
缩减输入向量bdryred中的一个生成缩减预测样本predred。预测样本是用于具有宽度Wred和高度Hred的降采样块的信号。这里,Wred和Hred被定义如下。
[式5]
Figure BDA0003390920200000294
Figure BDA0003390920200000295
缩减预测样本predred可以通过执行矩阵-向量乘法并然后添加偏移来获得,并且可以通过下式推导。
[式6]
predred=A·bdryred+b
这里,A是包括Wred×Hred个行和四个列(其中W和H是4(W=H=4))或者八个列(在任何其它情况下)的矩阵,并且b是Wred×Hred向量。
矩阵A和向量b可以从S0、S1和S2进行如下选择,并且索引idx=idx(W,H)可以由式7或式8定义。
[式7]
Figure BDA0003390920200000301
[式8]
Figure BDA0003390920200000302
当idx为1或更小(idx≤1)时或当idx为2且W和H中的较小值大于4(min(W,H)>4)时,A设置为
Figure BDA0003390920200000303
并且b设置为
Figure BDA0003390920200000304
当idx为2、W和H中的较小值为4(min(W,H)=4)并且W为4时,A为通过移除
Figure BDA0003390920200000305
的对应于降采样块中的奇数x坐标的每行而生成的矩阵。另选地,当H为4时,A为通过移除
Figure BDA0003390920200000306
的对应于降采样块中的奇数y坐标的每列而生成的矩阵。
最后,在式9中,缩减预测样本可以由其转置代替。
[式9]
·W=H=4并且intra_mip_transposed_flag=1
·max(W,H)=8并且intra_mip_transposed_flag=1
·max(W,H)>8并且intra_mip_transposed_flag=1
当W=H=4时,由于A包括四个列和16个行,因此计算predred所需的乘法的数量是4。在任何其它情况下,由于A包括八个列和Wred×Hred个行,因此需要每样本最多四次乘法来计算predred
图17例示了MIP过程中的线性插值。参照图17将线性插值过程描述如下。
插值过程可以被称作线性插值过程或双线性插值过程。插值过程可以包括两个步骤,其为1)垂直插值和2)水平插值,如同所示。
如果W>=H,则可以首先应用垂直线性插值,随后是水平线性插值。如果W<H,则可以首先应用水平线性插值,随后是垂直线性插值。在4×4块中,可以省略插值过程。
在W×H块(其中max(W,H)≥8)中,预测样本是从Wred×Hred的缩减预测样本predred推导的。取决于块类型,线性插值可以垂直地、水平地或在两个方向上执行。当在两个方向上应用线性插值时,如果W<H,则首先在水平方向上应用线性插值,否则首先在垂直方向上应用线性插值。
对于W×H块((其中max(W,H)≥8)并且W>=H),可以认为不存在一般性损失。在此情况下,如下执行一维线性插值。当不存在一般性损失时,充分地解释垂直方向上的线性插值。
首先,缩减预测样本由边界信号向上扩展。当定义了垂直上采样系数Uver=H/Hred并且设置
Figure BDA0003390920200000311
时,可以通过下式来设置扩展的缩减预测样本。
[式10]
Figure BDA0003390920200000312
随后,可以通过下式从扩展的缩减预测样本生成垂直线性插值预测样本。
[式11]
Figure BDA0003390920200000313
这里,x可以是0≤x<Wred,y可以是0≤y<Hred,并且k可以是0≤k<Uver
在下文中,描述了一种用于最大化MIP技术的性能同时降低其复杂度的方法。以下要描述的实施方式可以独立地或组合地执行。
在现有的MIP模式中,类似于现有帧内预测模式推导方法,相对于非MPM和MPM单独地发送MPM标志,并且基于MPM或非MPM来编码用于当前块的MIP模式。
根据实施方式,对于应用MIP技术的块,可以提出用于在不分离MPM和非MPM的情况下直接对MIP模式进行编码的结构。此图像编码结构使得可以简化复杂语法结构。此外,由于实际上在MIP模式中发生的各个模式的频率相对均匀地分布,因而与现有的帧内模式中的频率显著不同,因此所提出的编码结构使得可以在编码和解码MIP模式信息时使效率最大化。
根据实施方式的针对MIP发送和接收的图像信息如下。以下语法可以包括在从前述编码设备发送到解码设备的视频/图像信息中,并且可以在编码设备中被配置/编码为以比特流的形式发信号通知给解码设备,并且解码设备可以根据语法中所公开的条件/次序来解析/解码所包括的信息(语法元素)。
[表1]
Figure BDA0003390920200000321
如表1所示,可以在关于编码单元的语法信息中包括并发信号通知当前块的MIP模式的语法intra_mip_flag和intra_mip_mode_idx,并且在用于当前块的语法intra_mip_flag及intra_mip_mode_idx。
intra_mip_flag的等于1的值指示亮度样本的帧内预测类型是基于矩阵的帧内预测,并且等于0的值指示亮度样本的帧内预测类型不是基于矩阵的帧内预测。
等于1的intra_mip_mode_idx指示亮度样本的基于矩阵的帧内预测模式。如上所述,该基于矩阵的帧内预测模式可以指示用于MIP的矩阵或者矩阵和偏移。
此外,根据示例,还可以通过编码单元的语法发信号通知指示基于矩阵的帧内预测的输入向量是否转置的标志信息(例如,intra_mip_transposed_flag)。等于1的intra_mip_transposed_flag指示输入向量被转置,并且可以通过此标志信息减少用于基于矩阵的帧内预测的矩阵的数量。
intra_mip_mode_idx可以通过如下表所示的截断的二值化方法来编码和解码。
[表2]
Figure BDA0003390920200000331
如表2所示,用固定长度码对intra_mip_flag进行二值化,而使用截断的二值化方法对intra_mip_mode_idx进行二值化,并且可以根据编码块的大小来设置最大二值化长度(cMax)。如果编码块的宽度和高度是4(cbWidth==4&&cbHeight==4),则可以将最大二值化长度设置为34,否则,可以根据编码块的宽度和高度是否为8或更小((cbWidth<=8&&cbHeight<=8)?)来将最大二值化长度设置为18或10。
intra_mip_mode_idx可以通过旁通(bypass)方法而非基于上下文模型的方法来编码。通过在旁通方法中编码,可以增加编码速度和效率。
根据另一示例,当通过截断的二值化方法对intra_mip_mode_idx进行二值化时,最大二值化长度可以如下表所示。
[表3]
Figure BDA0003390920200000332
如表3所示,如果编码块的宽度和高度是4((cbWidth==4&&cbHeight==4)),则intra_mip_mode_idx的最大二值化长度可以被设置为15;否则,如果编码块的宽度或高度是4((cbWidth==4||cbHeight==4)),或者如果编码块的宽度和高度是8(cbWidth==8&&cbHeight==8),则可以将最大二值化长度设置为7,并且如果编码块的宽度或高度是4((cbWidth==4||cbHeight==4))或者如果编码块的宽度和高度不为8(cbWidth==8&&cbHeight==8),则可以将最大二值化长度设置为5。
根据另一示例,可以用固定长度码对intra_mip_mode_idx进行编码。在这种情况下,为了增加编码效率,对于每个块大小,可用MIP模式的数量可以被限制为2的幂(例如,A=2K1-1,B=2K2-1,并且C=2K3-1,其中K1、K2和K3是正整数)。
以上描述在下表中示出。
[表4]
Figure BDA0003390920200000341
在表4中,当K1=5、K2=4且K3=3时,intra_mip_mode可以被二值化如下。
[表5]
Figure BDA0003390920200000342
另选地,根据示例,当K1设置为4且因此编码块的宽度和高度为4时,可以将块的intra_mip_mode的最大二值化长度设置为15。另外,当K2被设置为3且因此编码块的宽度或高度是4或者编码块的宽度和高度是8时,最大二值化长度可以被设置为7。
实施方式可以提出仅针对MIP技术能够被高效地应用到的特定块使用MIP的方法。当应用根据实施方式的方法时,可以减少MIP所需的矩阵向量的数量并且显著地减少存储矩阵向量所需的存储器(50%)。利用这些效果,编码效率保持几乎相同(小于0.1%)。
下表例示了根据实施方式的包括应用MIP技术的特定条件的语法。
[表6]
Figure BDA0003390920200000351
如表6所示,可以添加仅向大块(cbWidth>K1||cbHeight>K2)应用MIP的条件,并且可以基于预设值(K1和K2)来确定块的大小。MIP仅应用于大块的原因在于MIP的编码效率出现在相对较大的块中。
下表例示了其中表6中的K1和K2被预定义为8的示例。
[表7]
Figure BDA0003390920200000352
表6和表7中的intra_mip_flag和intra_mip_mode_idx的语义与表1所示的相同。
当intra_mip_mode_idx具有11个可能模式时,intra_mip_mode_idx可以通过截断的二值化(cMax=10)来编码如下。
[表8]
Figure BDA0003390920200000361
另选地,当可用MIP模式限于八个模式时,intra_mip_mode_idx[x0][y0]可以用固定长度码编码如下。
[表9]
Figure BDA0003390920200000362
在表8和表9中,intra_mip_mode_idx可以通过旁通方法进行编码。
实施方式可以提出用于将用于大块的加权矩阵(Ak)和偏移向量(Bk)应用于小块的MIP技术,以便在存储器节省方面高效地应用MIP技术。当应用根据实施方式的方法时,可以减少MIP所需的矩阵向量的数量,并且显著地减少存储矩阵向量所需的存储器(50%)。利用这些效果,编码效率保持几乎相同(小于0.1%)。
图18例示了根据本公开的实施方式的MIP技术。
如图所示,图18的(a)示出了用于大块索引i的矩阵和偏移向量的运算,并且图18的(b)示出了应用于小块的采样的矩阵的运算和偏移向量运算。
参照图18,可以通过考虑通过对用于大块的加权矩阵进行下采样获得的下采样加权矩阵(Sub(Ak))和通过将用于大块的偏移向量进行下采样获得的偏移向量(Sub(bk))分别作为用于小块的加权矩阵和偏移向量来应用现有MIP过程。
这里,下采样可以仅在水平方向和垂直方向中的一个方向上被应用,或者可以在两个方向上被应用。具体地,可以基于对应块的宽度和高度来设置下采样因子(例如,2取1或4取1)以及垂直采样方向或水平采样方向。
另外,可以基于当前块的大小而不同地设置应用此实施方式的MIP的帧内预测模式的数量。例如,i)当当前块(编码块或变换块)的高度和宽度两者为4时,35个帧内预测模式(即,帧内预测模式0至34)可以是可用的,ii)当当前块的高度和宽度两者为8或小于8时,19个帧内预测模式(即,帧内预测模式0至18)可以是可用的,并且iii)在其它情况下,11个帧内预测模式(即,帧内预测模式0至10)可以是可用的。
例如,当当前块的高度和宽度二者都是4的情况被定义为块大小类型0,当前块的高度和宽度二者都是8或更小的情况被定义为块大小类型1,并且其它情况被定义为块大小类型2时,MIP的帧内预测模式的数量可以如下表所示。
[表10]
Figure BDA0003390920200000371
为了将用于大块(例如,块大小类型=2)的加权矩阵和偏移向量应用于小块(例如,块大小=0或块大小=1),每个块大小可用的帧内预测模式的数量可以如下表所示同等地应用。
[表11]
Figure BDA0003390920200000372
另选地,如下表12所示,MIP可以仅应用于块大小类型1和2,并且可以对用于块大小类型2的加权矩阵和偏移向量进行下采样以用于块大小类型1。因此,可以高效地节省存储器(50%)。
[表12]
Figure BDA0003390920200000381
提供以下附图以描述本公开的具体示例。由于在附图中示出的装置的具体名称或特定信号/消息/字段的名称是为了例示而提供的,所以本公开的技术特征不限于在以下附图中使用的特定名称。
图19是示意性地例示根据本公开的实施方式的可以由解码设备执行的解码方法的流程图。
图19所示的方法可以由图3所示的解码设备300执行。具体地,图19的S1900至S1940可以由图3所示的熵解码器310和/或预测器330(具体地,帧内预测器331)来执行,并且图19的S1950可以由图3所示的加法器340来执行。此外,图19所示的方法可以包括在本公开的前述实施方式中。因此,在图19中,将省略或将简要进行与前述实施方式重叠的细节的具体描述。
参照图19,解码设备可以从比特流中接收(即,获得)指示基于矩阵的帧内预测(MIP)是否用当前块的标志信息(S1900)。
标志信息是诸如intra_mip_flag之类的语法,并且可以在编码单元语法信息中被包括且发信号通知。
解码设备可以基于所接收的标志信息接收基于矩阵的帧内预测(MIP)模式信息(S1910)。
MIP模式信息可以表示为intra_mip_mode_idx,并且可以在intra_mip_flag等于1时发信号通知,intra_mip_mode_idx可以为指示应用于当前块的MIP模式的索引信息,并且此索引信息可以用于推导在生成预测样本时的矩阵。
根据示例,还可以通过编码单元语法发信号通知指示基于矩阵的帧内预测的输入向量是否被转置的标志信息,例如,intra_mip_transposed_flag。
解码设备可以基于MIP信息生成当前块的帧内预测样本。解码设备可以从当前块的相邻参考样本中推导至少一个相邻参考样本以生成帧内预测样本,并且可以基于相邻参考样本生成预测样本。
当应用MIP时,解码设备可以通过对与当前块邻近的参考样本进行降采样来推导缩减边界样本(S1920)。
可以通过使用平均对参考样本进行降采样来推导缩减边界样本。
当当前块的宽度和高度为4时,可以推导出四个缩减边界样本,并且在其它情况下,可以推导出八个缩减边界样本。
用于降采样的平均过程可以应用于当前块的每个边界(例如,左边界或上边界),并且可以应用于与当前块的边界邻近的相邻参考样本。
根据示例,当当前块为4×4块时,可以通过平均过程将每个边界的大小减小到两个样本,并且当当前块不是4×4块时,可以通过平均过程将每个边界的大小减小到四个样本。
随后,解码设备可以基于在当前块的大小和索引信息的基础上推导出的MIP矩阵与缩减边界样本的乘法运算来推导缩减预测样本(S1930)。
可以基于当前块的大小和接收到的索引信息来推导MIP矩阵。
MIP矩阵可以从根据当前块的大小分类的三个矩阵集中的任何一个矩阵集中选择,并且三个矩阵集中的每一个可以包括多个MIP矩阵。
也就是说,可以设置MIP的三个矩阵集,并且每个矩阵集可以包括多个矩阵和多个偏移向量。可以根据当前块的大小分离地应用这些矩阵集。
例如,可以将包括包含16个行和四个列的18或16个矩阵以及18或16个偏移向量的矩阵集应用于4×4块。索引信息可以是指示包括在一个矩阵集中的多个矩阵中的任何一个的信息。
包括包含16个行和8个列的10或8个矩阵以及10或8个偏移向量的矩阵集可以应用于4×8、8×4和8×8块或者4×H或W×4块。
另外,包括包含64个行和八个列的六个矩阵以及六个偏移向量的矩阵集可以应用于除了前述块之外的块或者具有8或更大的高度和宽度的块。
基于在MIP矩阵与缩减边界样本的乘法运算之后添加偏移的运算来推导缩减预测样本(即,已应用MIP矩阵的预测样本)。
解码设备可以通过对缩减预测样本进行上采样而生成当前块的帧内预测样本(S1940)。
可以通过对缩减预测样本的线性插值来对帧内预测样本进行上采样。
插值过程可以被称作线性插值或双线性插值过程,并且可以包括两个步骤,其为1)垂直插值和2)水平插值。
如果W>=H,则可以首先应用垂直线性插值,随后是水平线性插值。如果W<H,则可以首先应用水平线性插值,随后是垂直线性插值。在4×4块中,可以省略插值过程。
解码设备可以基于预测样本生成当前块的重构样本(S1950)。
在实施方式中,解码设备可以根据预测模式直接使用预测样本作为重构样本,或可以通过将残差样本添加到预测样本来生成重构样本。
如果存在当前块的残差样本,则解码设备可以接收关于当前块的残差的信息。关于残差的信息可以包括残差样本的变换系数。解码设备可以基于残差信息推导当前块的残差样本(或残差样本阵列)。解码设备可以基于预测样本和残差样本生成重构样本,并且可以基于重构样本推导重构块或重构图片。此后,根据需要,为了增强主观/客观图片质量,解码设备可以将去块滤波和/或环路内滤波过程(诸如SAO过程)应用于重构图片,如上所述。
图20是示意性地例示根据本公开的实施方式的可以由编码设备执行的编码方法的流程图。
图20所示的方法可以由图2所示的编码设备200执行。具体地,图20的S2000至S2030可以由图2所示的预测器220(具体地,帧内预测器222)执行,图20的S2040可以由图2所示的减法器231执行,并且图20的S2050可以由图2所示的熵编码器240执行。此外,图20所示的方法可以包括在本公开的前述实施方式中。因此,在图20中,将省略或将简要进行与前述实施方式重叠的细节的具体描述。
参照图20,编码设备可以推导是否将基于矩阵的帧内预测(MIP)应用于当前块(S2000)。
编码设备可以应用各种预测技术以找到当前块的最佳预测模式,并且可以基于率失真优化(RDO)来确定最佳帧内预测模式。
当确定MIP应用于当前块时,编码设备可以通过对与当前块邻近的参考样本进行降采样来推导缩减边界样本(S2010)。
可以通过使用平均对参考样本进行降采样来推导缩减边界样本。
当当前块的宽度和高度为4时,可以推导出四个缩减边界样本,并且在其它情况下,可以推导出八个缩减边界样本。
用于降采样的平均过程可以应用于当前块的每个边界(例如,左边界或上边界),并且可以应用于与当前块的边界邻近的相邻参考样本。
根据示例,当当前块为4×4块时,可以通过平均过程将每个边界的大小减小到两个样本,并且当当前块不是4×4块时,可以通过平均过程将每个边界的大小减小到四个样本。
当推导缩减边界样本时,编码设备可以基于在当前块的大小的基础上选择的MIP矩阵与缩减边界样本的乘法运算来推导缩减预测样本(S2020)。
MIP矩阵可以从根据当前块的大小分类的三个矩阵集中的任何一个矩阵集中选择,并且三个矩阵集中的每一个可以包括多个MIP矩阵。
也就是说,可以设置MIP的三个矩阵集,并且每个矩阵集可以包括多个矩阵和多个偏移向量。可以根据当前块的大小分离地应用这些矩阵集。
例如,可以将包括包含16个行和四个列的18或16个矩阵以及18或16个偏移向量的矩阵集应用于4×4块。索引信息可以是指示包括在一个矩阵集中的多个矩阵中的任何一个的信息。
包括包含16个行和8个列的10或八个矩阵以及10或八个偏移向量的矩阵集可以应用于4×8、8×4和8×8块或者4×H或W×4块。
另外,包括包含64个行和八个列的六个矩阵以及六个偏移向量的矩阵集可以应用于除了前述块之外的块或者具有8或更大的高度和宽度的块。
基于在MIP矩阵与缩减边界样本的乘法运算之后添加偏移的运算来推导缩减预测样本(即,已应用MIP矩阵的预测样本)。
编码设备可以通过对缩减预测样本进行上采样来生成当前块的帧内预测样本(S2030)。
可以通过对缩减预测样本的线性插值来对帧内预测样本进行上采样。
插值过程可以被称作线性插值或双线性插值过程,并且可以包括两个步骤,其为1)垂直插值和2)水平插值。
如果W>=H,则可以首先应用垂直线性插值,随后是水平线性插值。如果W<H,则可以首先应用水平线性插值,随后是垂直线性插值。在4×4块中,可以省略插值过程。
编码设备可以基于当前块的预测样本和当前块的原始样本来推导当前块的残差样本(S2040)。
编码设备可以基于残差样本生成当前块的残差信息,并且可以编码残差信息以及包括指示MIP是否被应用的标志信息和MIP模式信息的图像信息(S2050)。
这里,残差信息可以包括与通过对残差样本进行变换和量化而推导出的量化变换系数相关的量化参数、值信息、位置信息、变换方案和变换核。
指示MIP是否被应用的标志信息是诸如intra_mip_flag之类的语法,并且可以被包括并编码在编码单元语法信息中。
MIP模式信息可以表示为intra_mip_mode_idx,并且可以在intra_mip_flag等于1时被编码,intra_mip_mode_idx可以为指示应用于当前块的MIP模式的索引信息,并且此索引信息可以用于推导在生成预测样本时的矩阵。索引信息可以指示包括在一个矩阵集中的多个矩阵中的任何一个。
根据示例,还可以通过编码单元语法发信号通知指示基于矩阵的帧内预测的输入向量是否被转置的标志信息,例如,intra_mip_transposed_flag。
也就是说,编码设备可以对包括关于当前块的MIP模式信息和/或残差信息的图像信息进行编码,并且可以将图像信息输出为比特流。
比特流可以通过网络或(数字)存储介质发送到解码设备。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD和SSD之类的各种存储介质。
生成当前块的预测样本的前述过程可以由图2所示的编码设备200的帧内预测器222执行,推导残差样本的过程可以由图2所示的编码设备200的减法器231执行,并且生成和编码残差信息的过程可以由图2所示的编码设备200的残差处理器230和熵编码器240执行。
在上述实施方式中,借助于一系列步骤或方框基于流程图解释了方法,但是本公开不限于步骤的顺序,并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤,或某一步骤与其它步骤并发地执行。此外,本领域普通技术人员可以理解,流程图中所示的步骤不是排它的,并且在不影响本公开的范围的情况下,可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。
根据本公开的上述方法可以被实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能电话、机顶盒和显示装置等之类的用于图像处理的设备中。
当本公开中的实施方式通过软件来实施时,上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以以各种众所周知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。也就是说,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如,每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。在此情况下,用于实现的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
此外,本文档所应用于的解码设备和编码设备可以包括在多媒体广播发送和接收装置、移动通信终端、家庭电影视频装置、数字电影视频装置、用于监视的相机、视频对话装置、诸如视频通信之类的实时通信装置、移动流传输装置、存储介质、便携式摄像机、视频点播(VOD)服务提供装置、过顶传输(OTT)视频装置、互联网流传输服务提供装置、三维(3D)视频装置、虚拟现实(VR)装置、增强现实(AR)装置、视频电话装置、运输装置终端(例如,车辆(包括自主车辆)终端、飞机终端和船舶终端)和医疗视频装置中,并且可以用于处理视频信号或数据信号。例如,过顶传输(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC和数字视频记录器(DVR)。
此外,本文档所应用的处理方法可以以由计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。具有根据本文档的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波形式实现的介质(例如,通过互联网的传输)。此外,使用编码方法生成的比特流可以存储在计算机可读记录介质中,或者可以通过有线和无线通信网络发送。
此外,本文档的实施方式可以被实现为使用程序代码的计算机程序产品。程序代码可以由根据本文档的实施方式的计算机执行。程序代码可以存储在计算机可读的载波上。
图21例示了可以应用本文档中公开的实施方式的内容流传输系统的示例。
参照图21,应用本文档的实施方式的内容流传输系统基本上可以包括编码服务器、流传输服务器、web服务器、媒体存储装置、用户装置和多媒体输入装置。
编码服务器将从诸如智能电话、相机、便携式摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且将比特流发送到流传输服务器。作为另一示例,当诸如智能电话、相机、便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用本文档的实施方式的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的过程中临时存储比特流。
流传输服务器基于用户的请求通过web服务器将多媒体数据发送到用户装置,并且web服务器用作用于向用户通知服务的介质。当用户从web服务器请求期望的服务时,web服务器将其传递到流传输服务器,并且流传输服务器向用户发送多媒体数据。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输系统中的装置之间的命令/响应。
流传输服务器可以从媒体存储装置和/或编码服务器接收内容。例如,当从编码服务器接收到内容时,可以实时接收内容。在这种情况下,为了提供平滑的流传输服务,流传输服务器可以将比特流存储预定时间。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航装置、板式PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜、头戴式显示器)、数字TV、台式计算机、数字标牌等。
内容流传输系统中的每个服务器可以被操作为分布式服务器,在这种情况下,可以分发从每个服务器接收的数据。
本说明书中的权利要求可以以各种方式组合。例如,本说明书的方法权利要求中的技术特征可以被组合以在设备中实现或执行,并且设备权利要求中的技术特征可以被组合以在方法中实现或执行。此外,方法权利要求和设备权利要求中的技术特征可以被组合以在设备中实现或执行。此外,方法权利要求和设备权利要求中的技术特征可以被组合以在方法中实现或执行。

Claims (13)

1.一种由解码设备执行的图像解码方法,所述图像解码方法包括以下步骤:
接收指示基于矩阵的帧内预测MIP是否用于当前块的标志信息;
基于所述标志信息来接收基于矩阵的帧内预测MIP模式信息;
基于所述MIP模式信息来生成所述当前块的帧内预测样本;以及
基于所述帧内预测样本来生成所述当前块的重构样本。
2.根据权利要求1所述的图像解码方法,其中,所述MIP模式信息是指示应用于所述当前块的MIP模式的索引信息。
3.根据权利要求2所述的图像解码方法,其中,生成所述帧内预测样本的步骤包括以下步骤:
通过对与所述当前块邻近的参考样本进行降采样来推导缩减边界样本;
基于所述缩减边界样本与MIP矩阵的乘法运算来推导缩减预测样本;以及
通过对所述缩减预测样本进行上采样来生成所述当前块的所述帧内预测样本。
4.根据权利要求3所述的图像解码方法,其中,所述MIP矩阵是基于所述当前块的大小和所述索引信息来推导的。
5.根据权利要求4所述的图像解码方法,其中,所述MIP矩阵是能从根据所述当前块的大小分类的三个矩阵集中的任何一个矩阵集中选择的,并且
其中,所述三个矩阵集中的每一个包括多个MIP矩阵。
6.根据权利要求3所述的图像解码方法,其中,通过对所述参考样本进行平均来对所述缩减边界样本进行降采样,并且
其中,通过所述缩减预测样本的线性插值来对所述帧内预测样本进行上采样。
7.一种由编码设备执行的图像编码方法,所述图像编码方法包括以下步骤:
推导是否将基于矩阵的帧内预测MIP应用于当前块;
当所述MIP应用于所述当前块时,基于所述MIP来推导所述当前块的帧内预测样本;
基于所述帧内预测样本来推导所述当前块的残差样本;以及
对关于所述残差样本的信息和关于所述MIP的信息进行编码,
其中,关于所述MIP的信息包括指示所述MIP是否应用于所述当前块的标志信息以及基于矩阵的帧内预测MIP模式信息。
8.根据权利要求7所述的图像编码方法,其中,所述MIP模式信息是指示应用于所述当前块的MIP模式的索引信息。
9.根据权利要求8所述的图像编码方法,其中,生成所述帧内预测样本的步骤包括以下步骤:
通过对与所述当前块邻近的参考样本进行降采样来推导缩减边界样本;
基于所述缩减边界样本与MIP矩阵的乘法运算来推导缩减预测样本;以及
通过对所述缩减预测样本进行上采样来生成所述当前块的所述帧内预测样本。
10.根据权利要求9所述的图像编码方法,其中,所述MIP矩阵是能从根据所述当前块的大小分类的三个矩阵集中的任何一个矩阵集中选择的,并且
其中,所述三个矩阵集中的每一个包括多个MIP矩阵。
11.根据权利要求10所述的图像编码方法,其中,所述索引信息指示包括在一个矩阵集中的多个MIP矩阵中的任何一个。
12.根据权利要求9所述的图像编码方法,其中,通过对所述参考样本进行平均来对所述缩减边界样本进行降采样,并且
其中,通过所述缩减预测样本的线性插值来对所述帧内预测样本进行上采样。
13.一种计算机可读数字存储介质,所述计算机可读数字存储介质存储编码的图像信息以使图像解码方法由解码设备执行,所述图像解码方法包括以下步骤:
接收指示基于矩阵的帧内预测MIP是否用于当前块的标志信息;
基于所述标志信息来接收基于矩阵的帧内预测MIP模式信息;
基于所述MIP模式信息来生成所述当前块的帧内预测样本;以及
基于所述预测样本来生成所述当前块的重构样本。
CN202080041446.2A 2019-06-03 2020-06-03 基于矩阵的帧内预测装置和方法 Pending CN113950832A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962856718P 2019-06-03 2019-06-03
US62/856,718 2019-06-03
PCT/KR2020/007215 WO2020246803A1 (ko) 2019-06-03 2020-06-03 매트릭스 기반 인트라 예측 장치 및 방법

Publications (1)

Publication Number Publication Date
CN113950832A true CN113950832A (zh) 2022-01-18

Family

ID=73652216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080041446.2A Pending CN113950832A (zh) 2019-06-03 2020-06-03 基于矩阵的帧内预测装置和方法

Country Status (5)

Country Link
US (3) US11457221B2 (zh)
KR (1) KR20210135623A (zh)
CN (1) CN113950832A (zh)
MX (1) MX2021014724A (zh)
WO (1) WO2020246803A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023193254A1 (zh) * 2022-04-08 2023-10-12 Oppo广东移动通信有限公司 解码方法、编码方法、解码器以及编码器

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114009044A (zh) 2019-06-14 2022-02-01 瑞典爱立信有限公司 用于基于矩阵的帧内预测的简化下采样
BR112021025153A2 (pt) * 2019-06-14 2022-01-25 Ericsson Telefon Ab L M Métodos de intraprevisão associado com um bloco atual, de codificação e de decodificação, aparelho de intraprevisão, codificador, decodificador, produto de programa de computador, e, mídia legível por computador
MX2021015954A (es) * 2019-06-28 2022-02-03 Hfi Innovation Inc Metodo y aparato de intra prediccion basada en matriz en procesamiento de imagen y video.
EP4074045A4 (en) * 2019-12-10 2022-10-19 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHODS OF ENCODING AND DECODING IMAGES AND RELATED DEVICE AND SYSTEMS
WO2023177098A1 (ko) * 2022-03-14 2023-09-21 현대자동차주식회사 초해상도 인루프 필터를 이용하는 비디오 코딩을 위한 방법 및 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130188691A1 (en) * 2012-01-20 2013-07-25 Sony Corporation Quantization matrix design for hevc standard
WO2016137166A1 (ko) * 2015-02-23 2016-09-01 엘지전자(주) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US20180255304A1 (en) * 2015-03-29 2018-09-06 Lg Electronics Inc. Method and device for encoding/decoding video signal
US20180332312A1 (en) * 2017-05-09 2018-11-15 Futurewei Technologies, Inc. Devices And Methods For Video Processing
CA3128919A1 (en) * 2019-04-27 2020-11-05 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of intra prediction
KR20220013939A (ko) * 2019-05-31 2022-02-04 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 행렬 기반 인트라 예측에서의 제한된 업샘플링 프로세스

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023193254A1 (zh) * 2022-04-08 2023-10-12 Oppo广东移动通信有限公司 解码方法、编码方法、解码器以及编码器

Also Published As

Publication number Publication date
MX2021014724A (es) 2022-01-18
US20220400267A1 (en) 2022-12-15
US20220078434A1 (en) 2022-03-10
KR20210135623A (ko) 2021-11-15
US20230345006A1 (en) 2023-10-26
WO2020246803A1 (ko) 2020-12-10
US11729393B2 (en) 2023-08-15
US11457221B2 (en) 2022-09-27

Similar Documents

Publication Publication Date Title
JP7379543B2 (ja) マトリックスに基づくイントラ予測装置及び方法
US11457221B2 (en) Matrix-based intra prediction device and method
JP7379541B2 (ja) マトリックスに基づくイントラ予測装置及び方法
CN113424529A (zh) 用于执行基于mrl的帧内预测的图像编译方法和装置
CN113574871A (zh) 基于mpm列表的帧内预测方法和装置
US20230362406A1 (en) Intra prediction device and method involving matrix-based intra prediction
KR20210090709A (ko) Mpm 리스트를 사용하는 인트라 예측 기반 영상 코딩 방법 및 장치
CN113475065A (zh) 使用统一mpm列表的基于帧内预测的图像编译方法和设备
KR20210092829A (ko) Mpm 리스트를 사용하는 인트라 예측 기반 영상 코딩 방법 및 장치
US20220182639A1 (en) Matrix intra prediction-based image coding apparatus and method
US20240163475A1 (en) Matrix-based intra prediction device and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination