CN114128269A - 内预测模式的编码 - Google Patents

内预测模式的编码 Download PDF

Info

Publication number
CN114128269A
CN114128269A CN202080050899.1A CN202080050899A CN114128269A CN 114128269 A CN114128269 A CN 114128269A CN 202080050899 A CN202080050899 A CN 202080050899A CN 114128269 A CN114128269 A CN 114128269A
Authority
CN
China
Prior art keywords
intra
prediction
predetermined
prediction modes
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080050899.1A
Other languages
English (en)
Inventor
乔纳森·普法夫
托比亚斯·辛兹
菲利普·海勒
菲利普·默克勒
比约恩·斯塔伦伯格
迈克尔·舍费尔
本杰明·布罗斯
马丁·温肯
米莎·西克曼
海科·施瓦尔茨
德特勒夫·马尔佩
托马斯·威甘德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN114128269A publication Critical patent/CN114128269A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开用于高效地对图像的块进行基于块的预测的技术,如用于使用内预测对图像(10)的预定块(18)进行解码的装置(3000),所述装置被配置为从数据流(12)导出指示是否将使用包括DC内预测模式(506)和角度预测模式(500)的内预测模式的第一集合(508)中的一个来预测预定块(18)的集合选择性语法元素(522)。如果集合选择性语法元素(522)指示将使用内预测模式的第一集合(508)中的一个来预测预定块(18),则所述装置被配置为基于用以预测与预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成最可能内预测模式的列表(528),从数据流(12)导出在最可能内预测模式的列表(528)中指向预定的内预测模式(3100)的MPM列表索引(534),以及使用预定的内预测模式(3100)对预定块(18)进行内预测。如果集合选择性语法元素(522)指示将不使用内预测模式的第一集合(508)中的一个来预测预定块(18),所述装置被配置为从数据流(12)导出指示来自基于矩阵的内预测模式(510)的第二集合(520)中的预定的基于矩阵的内预测模式(3200)的另外的索引(540;546),计算从预定块(18)的邻域中的参考样本(17)导出的向量(514,400,402)和与预定的基于矩阵的内预测模式(3200)相关联的预定的预测矩阵(516)之间的矩阵向量乘积(512)以便获得预测向量(518),以及基于预测向量(518)预测预定块(18)的样本。基于用以预测与预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成最可能内预测模式的列表(528),使得在通过角度内预测模式(500)中的任一个预测相邻块(525,526)的情况下,最可能内预测模式的列表(528)不含DC内预测模式(506)。

Description

内预测模式的编码
技术领域
本申请涉及内预测领域。实施例涉及用于产生最可能的模式列表的有利方式。
背景技术
现今,存在产生最可能的模式列表的不同方式。然而,出现最后使用的内预测模式并不在此列表内使得需要传输额外语法元素的情形的机率仍然较高。
因此,面临着优化最可能的模式列表的产生和/或改良编码效率的问题。
发明内容
此目的是通过本申请的独立权利要求的主题来达成。
根据本发明的其他实施例是由本申请的附属权利要求的主题界定。
根据本发明的第一方面,本申请的各发明人意识到,当形成最可能内预测模式列表时遇到的一个问题是不大可能的预测模式占据宝贵的列表位置,从而不利地影响编码效率并提高出现最后用于预测预定块的内预测模式并不在此列表内的情形的可能性。根据本申请的第一方面,通过基于与预定块相邻的已经预测的相邻块形成最可能内预测模式的列表而克服此困难。因此,可以省略不大可能的内预测模式。可以预期类似于相邻块的内预测模式的预定块的内预测模式的高机率。尤其,在通过任何角度内预测模式预测相邻块中的至少一个的情况下,所述列表不含DC内预测模式。这使得具有广泛各种角度内预测模式的最可能内预测模式的列表能够提高待用于预定块的内预测模式在列表中的可能性。此外,基于矩阵的内预测模式形成例如内预测模式的单独的第二集合,其未被视为最可能内预测模式的列表,且因此不会与内预测模式的第一集合中的内预测模式竞争最可能内预测模式的列表中的位置。
因此,根据本申请的第一方面,一种用于使用内预测对图像的预定块进行解码的装置被配置为从数据流导出指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个来预测预定块的集合选择性语法元素。可选地,除DC内预测模式之外或者替代DC内预测模式,内预测模式的第一集合可以包括平面内预测模式。如果所述集合选择性语法元素指示使用内预测模式的第一集合中的一个来预测预定块,则所述装置被配置为基于在预测与所述预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,从数据流导出在最可能内预测模式的列表中指向预定的内预测模式的MPM(亦即,最可能模式)列表索引,以及使用所述预定的内预测模式对所述预定块进行内预测。换言之,在此情况下,所述装置被配置为基于用于预测与所述预定块相邻的相邻块的内预测模式形成最可能内预测模式的列表。如果所述集合选择性语法元素指示将不使用内预测模式的第一集合中的一个来预测预定块,则所述装置被配置为通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量并基于所述预测向量预测预定块的样本而从数据流导出指示来自基于矩阵的内预测模式的第二集合(亦即包括基于矩阵的内预测模式,亦即基于块的内预测模式的内预测模式的第二集合)的预定的基于矩阵的内预测模式的另外的索引。在此情况下,举例而言,所述预测类似于或者等于相对于图5至图11的实施例所描述的ALWIP预测。所述装置被配置为执行基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。换言之,所述装置被配置为执行基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在专门通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。因此,DC内预测模式并不占据最可能内预测模式的列表中的位置,如果几率较小,则DC内预测模式被选择用于预定块。
通过此装置,引入用于确定用于预定块的内预测模式的有利且高效的方式。尤其,提出对预测与预定块相邻的相邻块以用于形成最可能内预测模式的列表的有利分析,其中所述相邻块已被预测。
根据一实施例,所述装置被配置为执行基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得仅在以下情况下以DC内预测模式填充最可能内预测模式的列表:对于相邻块中的每一个,将使用包括DC内预测模式的第一集合内的至少一个非角度内预测模式中的任一个预测或者使用基于块的内预测模式中的任一个(其借助于从基于块的内预测模式的第二集合至第一集合内的内预测模式的映射用于形成最可能内预测模式的列表)预测的相应相邻块映射到至少一个非角度内预测模式中的任一个。换言之,在使用内预测模式的第一集合中的至少一个非角度内预测模式中的任一个预测所有相邻块,例如两个相邻块的情况下,最可能内预测模式的列表包括DC内预测模式。替代地,在使用内预测模式的第二集合中的基于块的内预测模式中的任一个预测所有相邻块,例如两个相邻块的情况下,最可能内预测模式的列表包括DC内预测模式,其中所述基于块的内预测模式从基于块的内预测模式的第二集合映射到第一集合内的非角度内预测模式。根据一实施例,所述装置被配置为将DC内预测模式定位在最可能内预测模式的列表中的任一角度内预测模式之前。这是基于以下想法:在上文所描述的情况下,DC内预测模式是用于预定块的最可能模式,此定位由此提高编码效率。
根据一实施例,所述装置被配置为从数据流导出MPM语法元素并仅在所述MPM语法元素指示内预测模式的第一集合中的预定的内预测模式在最可能内预测模式的列表内的情况下形成最可能内预测模式的列表。通过此特征,提高编码效率,由于最可能内预测模式的列表仅在必需或者有利时形成。
如果使用内预测模式的第二集合中的一个预测预定块,则根据一实施例,所述装置被配置为形成最可能的基于块的内预测模式的列表。在此情况下,所述装置例如被配置为从数据流导出在最可能的基于块的内预测模式的列表中指向预定的基于矩阵的内预测模式,亦即预定的基于块的内预测模式的另外的MPM列表索引。可选地,仅在从数据流导出的另外的MPM语法元素指示预定的基于块的内预测模式在最可能的基于块的内预测模式的列表内的情况下形成最可能的基于块的内预测模式的此列表。
因此,举例而言,所述装置被配置为针对内预测模式的第一集合和内预测模式的第二集合形成不同MPM列表。最可能内预测模式的列表包括例如内预测模式的第一集合中的内预测模式且最可能的基于块的内预测模式的列表包括例如内预测模式的第二集合,亦即基于块的内预测模式的第二集合中的内预测模式。这使得基于块的内预测模式并不需要与内预测模式的第一集合中的内预测模式,例如DC内预测模式和角度预测模式竞争总MPM列表中的位置成为可能。通过此分离,用于预定块的内预测模式实际上较可能在相应MPM列表中。
实施例涉及一种用于使用内预测编码图像的预定块的装置,被配置为在数据流中用信号通知指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个来预测预定块的集合选择性语法元素。可选地,除DC内预测模式之外或者替代DC内预测模式,内预测模式的第一集合可以包括平面内预测模式。如果所述集合选择性语法元素指示使用内预测模式的第一集合中的一个预测预定块,则所述装置被配置为基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,在数据流中用信号通知在最可能内预测模式的列表中指向预定的内预测模式的MPM列表索引,以及使用所述预定的内预测模式对预定块进行内预测。换言之,在此情况下,所述装置被配置为基于用于预测与所述预定块相邻的相邻块的内预测模式形成最可能内预测模式的列表。如果所述集合选择性语法元素指示将不使用内预测模式的第一集合中的一个来预测预定块,则所述装置被配置为通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量并基于所述预测向量预测预定块的样本而在数据流中用信号通知指示来自基于矩阵的内预测模式的第二集合(亦即包括基于矩阵的内预测模式,亦即基于块的内预测模式的内预测模式的第二集合)的预定的基于矩阵的内预测模式的另外的索引。在此情况下,举例而言,所述预测类似于或者等于相对于图5至图11的实施例所描述的ALWIP预测。基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。换言之,基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在专门通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。
实施例涉及一种用于使用内预测对图像的预定块进行解码的方法,其包括从数据流导出指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个来预测预定块的集合选择性语法元素。如果所述集合选择性语法元素指示使用内预测模式的第一集合中的一个预测预定块,则所述方法包括基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,从数据流导出在最可能内预测模式的列表中指向预定的内预测模式的MPM列表索引,以及使用所述预定的内预测模式对预定块进行内预测。如果所述集合选择性语法元素指示将不使用内预测模式的第一集合中的一个预测预定块,则所述方法包括通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量并基于所述预测向量预测预定块的样本而从数据流导出指示来自基于矩阵的内预测模式的第二集合的预定的基于矩阵的内预测模式的另外的索引。基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。换言之,基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在专门通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。
实施例涉及一种用于使用内预测编码图像的预定块的方法,其包括在数据流中用信号通知指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个来预测预定块的集合选择性语法元素。如果所述集合选择性语法元素指示使用内预测模式的第一集合中的一个预测预定块,则所述方法包括基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,在数据流中用信号通知在最可能内预测模式的列表中指向预定的内预测模式的MPM列表索引,以及使用所述预定的内预测模式对预定块进行内预测。如果所述集合选择性语法元素指示将不使用内预测模式的第一集合中的一个预测预定块,则所述方法包括通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量并基于所述预测向量预测预定块的样本而在数据流中用信号通知指示来自基于矩阵的内预测模式的第二集合的预定的基于矩阵的内预测模式的另外的索引。基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。换言之,基于在预测与预定块相邻的相邻块时使用的内预测模式形成最可能内预测模式的列表,使得在专门通过角度内预测模式中的任一个预测相邻块的情况下,最可能内预测模式的列表不含DC内预测模式。
实施例涉及一种具有图像的数据流,所述图像使用本文所描述的用于编码的方法编码成所述数据流。
实施例涉及一种具有程序代码的计算机程序,所述程序代码在运行于计算机上时用于执行本文所描述的方法。
附图说明
附图未必按比例绘制,实际上重点一般放在说明本发明的原理上。在以下描述中,参考以下附图描述本发明的各种实施例,其中:
图1示出编码成数据流的实施例;
图2示出编码器的实施例;
图3示出图像的重构的实施例;
图4示出解码器的实施例;
图5示出根据一实施例的用于编码和/或解码的块的预测的示意图;
图6示出根据一实施例的用于编码和/或解码的块的预测的矩阵运算;
图7.1示出根据一实施例的具有经缩减样本值向量的块的预测;
图7.2示出根据一实施例的使用样本的内插的块的预测;
图7.3示出根据一实施例的具有经缩减样本值向量的块的预测,其中仅平均一些边界样本;
图7.4示出根据一实施例的具有经缩减样本值向量的块的预测,其中平均四个边界样本的群组;
图8示出根据一实施例的由装置执行的矩阵运算;
图9a至图9c示出根据一实施例的由装置执行的详细矩阵运算;
图10示出根据一实施例的由装置使用偏移和缩放参数执行的详细矩阵运算;
图11示出根据不同实施例的由装置使用偏移和缩放参数执行的详细矩阵运算;
图12示出根据一实施例的用于解码预定块的装置的示意图;
图13示出根据一实施例的关于解码和编码预定块的细节的示意图;
图14示出根据一实施例的用于编码预定块的装置的示意图;
图15示出根据一实施例的用于解码预定块的方法的方块图;且
图16示出根据一实施例的用于编码预定块的方法的方块图。
具体实施方式
即使具有相同或者等效功能性的相同或者等效的一个或多个组件出现于不同附图中,以下描述中仍通过相同或者等效参考数字来表示所述一个或多个组件。
在以下描述中,阐述多个细节以提供对本发明的实施例的更透彻解释。然而,熟习此项技术者将显而易见,可以在无这些特定细节的情况下实践本发明的实施例。在其他情况下,以方块图形式而非详细地示出已知结构和装置以免混淆本发明的实施例。此外,除非另外特定地指示,否则可以将下文中所描述的不同实施例的特征彼此组合。
1引言
在下文中,将描述不同的本发明示例、实施例和方面。这些示例、实施例和方面中的至少一些尤其指代用于视频编码和/或用于执行内预测(例如使用线性或者仿射变换以及相邻样本缩减)和/或用于优化视频传递(例如,广播、流式传输、文件回放等),例如用于视频应用和/或用于虚拟现实应用的方法和/或装置。
此外,示例、实施例和方面可以指代高效率视频编码(HEVC)或者后继者。并且,其他实施例、示例和方面将由所附权利要求界定。
应注意,如权利要求所界定的任何实施例、示例和方面可以由以下章节中所描述的细节(特征和功能性)中的任一个补充。
并且,以下章节中所描述的实施例、示例和方面可以相应地使用,且也可以由另一章节中的特征中的任一个或者由权利要求中所包括的任一特征补充。
并且,应注意,本文中所描述的个体、示例、实施例和方面可以相应地或者组合地使用。因此,细节可以添加至所述相应方面中的每一个而无需将细节添加至所述示例、实施例和方面中的另一个。
也应注意,本公开内容明确地或者隐含地描述解码和/或编码系统和/或方法的特征。
此外,本文中关于一种方法所公开的特征和功能性也可用于装置中。此外,本文中关于装置所公开的任何特征和功能性也可用于对应方法中。换言之,本文中所公开的方法可以通过关于装置所描述的特征和功能性中的任一个加以补充。
并且,本文中所描述的特征和功能性中的任一个可用硬件或者软件来实施,或者使用硬件与软件的组合来实施,如将在章节“实施替代方案”中所描述。
此外,在一些示例、实施例或者方面中,括号(“(…)”或者“[…]”)中所描述的特征中的任一个可以被视为可选的。
2编码器、解码器
在下文中,描述各种示例,其可以辅助在使用基于块的预测时实现更有效压缩。一些示例通过使用一组内预测模式来实现高压缩效率。后述内预测模式可以经添加至例如探索性设计的其他内预测模式,或者可以排他地提供。且甚至其他示例利用刚刚论述的二种特例。然而,作为这些实施例的变型,可以通过使用另一图像中的参考样本将内预测变为间预测。
为了易于理解本申请的以下示例,本说明书开始呈现适合其的可能编码器和解码器,可以在其中构建本申请的随后概述的示例。图1示出用于将图像10逐块编码成数据流12的装置。所述装置使用参考符号14指示且可以仍然为图像编码器或者视频编码器。换言之,当编码器14被配置为将包括图像10的视频16编码成数据流12或者编码器14可以专门将图像10编码成数据流12时,图像10可以为视频16当中的当前图像。
如所提及,编码器14以逐块方式或者基于块执行编码。为此,编码器14将图像10细分成块,编码器14以块为单位将图像10编码成数据流12。在下文更详细地阐述将图像10可能细分成块18的示例。通常,细分可能诸如通过使用分层多树细分而最终变成具有恒定大小的块18,诸如以行和列配置的块的数组,或者可能最终变成具有不同块大小的块18,其中多树细分起始于图像10的整个图像区域或者开始于将图像10预分割成树型块的数组,其中这些示例不应被视为排除将图像10细分成块18的其他可能方式。
此外,编码器14为被配置为将图像10预测性地编码成数据流12的预测性编码器。对于某一块18,这意味着编码器14确定用于块18的预测信号且将预测残差(亦即,预测信号偏离块18内的实际图像内容的预测误差)编码成数据流12。
编码器14可以支持不同预测模式,以便导出用于某一块18的预测信号。在以下示例中具有重要性的预测模式为内预测模式,根据所述内预测模式,从图像10的相邻的已编码样本在空间上预测块18的内部。将图像10编码成数据流12且因此对应的解码程序可以基于在块18当中定义的某一编码次序20。举例而言,编码次序20可以以光栅扫描次序(诸如从上而下逐行)遍历块18,其中例如从左至右遍历每一行。在基于分层多树的细分的情况下,光栅扫描排序可以应用在每一层级层次内,其中可以应用深度优先遍历次序,亦即,某一层级层次的块内的叶节点可以根据编码次序20在同一层级层次的具有相同父块的块之前。取决于编码次序20,块18的相邻已编码样本通常可以位于块18的一个或多个侧处。在本文中所呈现的示例的情况下,例如块18的相邻的已编码样本位于块18的顶部和左侧。
内预测模式可能并非编码器14支持的仅有预测模式。在编码器14为视频编码器的情况下,例如编码器14也可以支持间预测模式,根据所述间预测模式,块18暂时根据视频16的先前编码的图像来预测。此间预测模式可以为运动补偿预测模式,根据所述运动补偿预测模式,将移动向量用信号通知给此块18,从而指示块18的预测信号将从其导出作为复本的部分的相对空间偏移。另外或者替代地,其他非内预测模式也可以为可用的,诸如在编码器14为多视图编码器的情况下的间预测模式,或者非预测性模式,根据所述非预测性模式,块18的内部按原样(亦即无任何预测的情况下)被编码。
在开始将本申请的描述集中于内预测模式之前,关于图2描述可能的基于块的编码器(亦即,编码器14的可能实施)的更特定示例,接着分别呈现适合于图1和图2的解码器的两个对应示例。
图2示出图1的编码器14的可能实施,亦即其中编码器被配置为使用变换编码以用于编码预测残差的实施,但此近似示例且本申请并不限于该类别的预测残差编码。根据图2,编码器14包括减法器22,被配置为从入站信号(亦即图像10)或者在块基础上从当前块18减去对应的预测信号24以便获得预测残差信号26,所述预测残差信号接着由预测残差编码器28编码成数据流12。预测残差编码器28由有损编码级28a和无损编码级28b构成。所述有损级28a接收预测残差信号26且包括量化器30,所述量化器量化预测残差信号26的样本。如上文已提及,本发明示例使用预测残差信号26的变换编码,且因此有损编码级28a包括连接于减法器22与量化器30之间的变换级32,以便变换此经频谱分解的预测残差26,其中对呈现残差信号26的经变换是数进行量化器30的量化。所述变换可以为DCT、DST、FFT、阿达玛(Hadamard)变换等。经变换且经量化预测残差信号34接着通过无损编码级28b进行无损编码,所述无损编码级为将经量化预测残差信号34熵编码成数据流12的熵编码器。编码器14进一步包括预测残差信号重构级36,其连接至量化器30的输出以便以也可用在解码器处的方式从经变换且经量化预测残差信号34重构预测残差信号,亦即考虑编码损失为量化器30。为此,预测残差重构级36包括反量化器38,所述反量化器执行量化器30的量化的反操作,接着包括反变换器40,所述反变换器相对于由变换器32执行的变换而执行反变换,诸如频谱分解的反操作,诸如上文所提及的特定变换示例中的任一个的反操作。编码器14包括加法器42,其将由反变换器40输出的经重构预测残差信号与预测信号24相加以便输出经重构信号,亦即经重构样本。此输出经馈送至编码器14的预测器44中,所述预测器接着基于所述输出来确定预测信号24。预测器44支持上文已经关于图1所论述的所有预测模式。图2也说明在编码器14为视频编码器的情况下,编码器14也可以包括环路内滤波器46,其对经重构图像进行完全滤波,所述经重构图像在已经滤波之后关于经间预测块形成用于预测器44的参考图像。
如上文已提及,编码器14基于块操作。对于后续描述,所关注的块基础为将图像10细分成块的基础,针对所述块而从分别由预测器44或者编码器14支持的一组或者多个内预测模式当中选择内预测模式,且相应地执行所选择的内预测模式。然而,也可以存在将图像10细分成其他类别的块。举例而言,无论图像10经间编码抑或者经内编码,上文所提及的决策均可以以粒度或者以从块18偏离的块的单位来进行。举例而言,间/内模式决策可以以图像10细分成的编码块的级别来执行,且每一编码块均被细分成预测块。具有已决定使用内预测的编码块的预测块各自被细分为内预测模式决策。为此,对于这些预测块中的每一个,决定相应预测块应使用哪一经支持内预测模式。这些预测块将形成此处感兴趣的块18。与间预测相关联的编码块内的预测块将由预测器44以不同方式处理。所述预测块将通过确定运动向量和从参考图像中由运动向量所指向的位置复制用于此块的预测信号而从参考图像进行间预测。另一块细分涉及细分成变换块,变换器32和反变换器40以变换块为单位执行变换。经变换块可以例如为进一步细分编码块的结果。当然,本文中所阐述的示例不应被视为限制性的,且也存在其他示例。仅出于完整性起见,应注意,细分成编码块可以例如使用多树细分,且预测块和/或变换块也可以通过使用多树细分进一步细分编码块而获得。
图3中描绘适合图1的编码器14的用于逐块解码的解码器54或者装置。此解码器54与编码器14的行为相反,亦即其以逐块方式从数据流12解码图像10且为此目的支持多个内预测模式。举例而言,解码器54可以包括残差提供器156。上文关于图1所论述的所有其他可能性对于解码器54也有效。为此,解码器54可以为静止图像解码器或者视频解码器且所有预测模式和预测可能性也由解码器54支持。编码器14与解码器54之间的差异主要在于编码器14根据某一优化选择编码决策,例如以便最小化可以取决于编码速率和/或编码失真的某一成本函数的事实。这些编码选项或者编码参数中的一个可以涉及可用或者经支持内预测模式当中的待用于当前块18的一系列内预测模式。选定的内预测模式接着可以在数据流12内由编码器14用信号通知给当前块18,其中解码器54使用用于块18的数据流12中的此用信号通知重新进行选择。同样地,图像10细分成块18可以在编码器14内进行优化,且对应的细分信息可以在数据流12内传送,其中解码器54基于细分信息恢复将图像10细分成块18。综上所述,解码器54可以为在块基础上进行操作的预测性解码器,且除内预测模式之外,解码器54也可以支持其他预测模式,诸如在例如解码器54为视频解码器的情况下的间预测模式。在解码时,解码器54也可以使用关于图1所论述的编码次序20,且由于编码器14和解码器54处均遵从此编码次序20,因此相同的相邻样本在编码器14和解码器54处均可用于当前块18。因此,为了避免不必要的重复,就图像10细分成块而言,例如就预测而言和就预测残差的编码而言,编码器14的操作模式的描述也应适用于解码器54。差异在于以下事实:编码器14通过优化选择一些编码选项或者编码参数,且在数据流12内用信号通知编码参数或者将编码参数插入至数据流12中,所述编码参数接着通过解码器54从数据流12导出以便重新进行预测、细分等。
图4示出图3的解码器54的可能实施,亦即适合图1的编码器14的实施的实施,如图2中所示出。由于图4的编码器54的许多组件与图2的对应编码器中出现的那些组件相同,因此在图4中使用具备撇号的相同参考符号以便指示这些组件。详细来讲,加法器42'、可选的回路内滤波器46'和预测器44'以与其在图2的编码器中相同的方式连接至预测回路中。应用于加法器42'的经重构,亦即经反量化和经重变换预测残差信号通过以下各项的序列导出:熵解码器56,其反向转换熵编码器28b的熵编码;接着为残差信号重构级36',其由反量化器38'和反变换器40'构成,正好与编码侧的情况相同。解码器的输出为图像10的重构。图像10的重构可以直接在加法器42'的输出处或者替代地在回路内滤波器46'的输出处获得。一些后置滤波器可以配置在解码器的输出处以便使图像10的重构进行一定后置滤波,以便改良图像质量,但图4中并未描绘此选项。
同样,关于图4,上面关于图2提出的描述对于图4也应有效,除了仅编码器执行优化任务和关于编码选项的相关联决策之外。然而,关于块细分、预测、反量化和重变换的所有描述对于图4的解码器54也有效。
3仿射线性经加权内预测器(ALWIP)
特此论述关于ALWIP的一些非限制性示例,即使ALWIP并非一直必须体现此处论述的技术。
本申请尤其涉及用于逐块图像编码的经改良的基于块的预测模式概念,所述概念诸如可用在诸如HEVC或者HEVC的任何后续者的视频编解码器中。预测模式可以为内预测模式,但理论上本文中所描述的概念也可以传送至间预测模式上,其中参考样本为另一图像的一部分。
寻求基于块的预测概念,其允许诸如对硬件友好实施的高效实施。
此目的是通过本申请的独立权利要求的主题来达成。
内预测模式广泛地用于图像和视频编码中。在视频编码中,内预测模式与其他预测模式竞争,诸如间预测模式,诸如运动补偿预测模式。在内预测模式中,基于相邻样本预测当前块,所述相邻样本亦即就编码器侧而言已经编码且就解码器侧而言已经解码的样本。相邻样本值经外推至当前块中以便形成用于当前块的预测信号,其中预测残差在用于当前块的数据流中传输。预测信号愈佳,则预测残差愈低,且因此,编码预测残差所必需的位的数目愈少。
为了有效,应考虑若干方面以便在逐块图像编码环境中形成用于内预测的有效构架。举例而言,由编解码器支持的内预测模式的数目愈大,则将选择用信号通知给解码器的侧信息速率消耗愈大。另一方面,所支持的内预测模式的集合应能够提供良好的预测信号,亦即,产生低预测残差的预测信号。
在下文中,公开-作为比较实施例或者基础示例-用于从数据流逐块解码图像的装置(编码器或者解码器),所述装置支持至少一种内预测模式,根据所述内预测模式,通过将邻近当前块的样本的第一模板应用至仿射线性预测器上来确定用于图像的预定大小的块的内预测信号,所述仿射线性预测器在下文中应被称作仿射线性经加权内预测器(ALWIP)。
所述装置可以具有以下属性中的至少一个(其可以适用于例如实施于非暂时性存储单元中的方法或者另一技术,所述非暂时性存储单元存储在由处理器执行时使所述处理器实施所述方法和/或用作所述装置的指令):
3.1预测器可以与其他预测器互补
可以形成下文进一步描述的实施改良的主题的内预测模式可以与编解码器的其他内预测模式互补。因此,所述内预测模式可以与在HEVC编解码器中,相应地在JEM参考软件中定义的DC预测模式、平面预测模式和角度预测模式互补。内预测模式之后三种类型今后应被称作已知内预测模式。因此,对于内模式中的给定块,标志需要由解码器解析,从而指示是否将使用所述装置支持的内预测模式中的一个。
3.2多于一个所提议的预测模式
所述装置可以含有多于一个ALWIP模式。因此,在解码器已知将使用所述装置所支持的ALWIP模式中的一个的情况下,所述解码器需要解析额外信息,所述额外信息指示将使用所述装置所支持的ALWIP模式中的哪一ALWIP模式。
所支持模式的用信号通知可以具有如下属性:一些ALWIP模式的编码可能需要比其他ALWIP模式少的位子。这些模式中的哪些模式需要较少位子且哪些模式需要较多位子可以取决于可以从已解码的位流提取的信息,或者可以预先固定。
4一些方面
图2示出用于从数据流12解码图像的解码器54。解码器54可以被配置为对图像的预定块进行解码18。详细来讲,预测器44可以被配置为使用线性或者仿射线性变换[例如,ALWIP]将与预定块18相邻的P个相邻样本的集合映射到预定块的样本的Q个预测值的集合上。
如图5中所示出,预定块18包括待预测的Q个值(在操作结束时,其将为“预测值”)。如果块18具有M行和N列,则Q=M·N。块18的Q个值可以在空间域(例如,像素)中或者在变换域(例如,DCT,离散小波变换等)中。可以基于从大体上邻近于块18的相邻块17a至17c获取的P个值来预测块18的Q个值。相邻块17a至17c的P个值可以在最接近(例如,邻近)块18的位置中。相邻块17a至17c的P个值已被处理和预测。P个值指示为部分17'a至17'c中的值,以区分所述部分与其作为一部分(在一些示例中,不使用17'b)的块。
如图6中所示出,为了执行预测,有可能与具有P个项(每一项是与相邻部分17'a至17'c中的特定位置相关联)的第一向量17P、具有Q个项(每一项是与块18中的特定位置相关联)的第二向量18Q和映射矩阵17M(每一行是与块18中的特定位置相关联,每一列是与相邻部分17'a至17'c中的特定位置相关联)一起操作。因此,映射矩阵17M根据预定模式执行将相邻部分17'a至17'c的P个值预测成块18的值。映射矩阵17M中的项可以因此理解为加权因子。在以下段落中,将使用符号17a至17c代替17'a至17'c来指代边界的相邻部分。
在此项技术中,已知若干已知模式,诸如DC模式、平面模式和65个方向性预测模式。可能已知例如67种模式。
然而,已注意到,也有可能利用不同模式,其在此处被称作线性或者仿射线性变换。线性或者仿射线性变换包括P·Q个加权因子,在所述加权因子当中,至少1/4P·Q个加权因子是非零加权值,其针对Q个经预测值中的每一个,包括与相应经预测值有关的一系列P个加权因子。当在预定块的样本当中根据光栅扫描次序而一个接一个地配置时,所述系列形成全向非线性的包络。
有可能映射相邻值17'a至17'c(模板)的P个位置、相邻样本17'a至17'c的Q个位置,且在矩阵17M的P*Q个加权因子的值处进行映射。平面为用于DC变换的系列的包络的示例(其为用于DC变换的平面)。包络明显为平面的,且因此被线性或者仿射线性变换(ALWIP)的定义所排除。另一示例为产生角度模式的仿真的矩阵:包络将从ALWIP定义排除,且坦言的,将看起来像沿着P/Q平面中的方向从上而下倾斜的山丘。平面模式和65种方向性预测模式将具有不同包络,然而,其将在至少一个方向上为线性的,亦即例如用于经例示DC的所有方向和例如用于角度模式的山丘方向。
相反,线性或者仿射变换的包络将并非全向线性的。已理解,在一些情形中,此种变换对于执行块18的预测可以为最佳的。已注意,优选地,加权因子的至少1/4不同于零(亦即,P*Q个加权因子中的至少25%不同于0)。
根据任何常规的映射规则,所述加权因子可能彼此不相关。因此,矩阵17M可以使得其项的值不具有明显可以辨识的关系。举例而言,加权因子无法由任何分析或者差分函数描述。
在示例中,ALWIP变换使得有关于相应经预测值的第一系列加权因子与有关于除相应经预测值以外的经预测值的第二系列加权因子或者后一系列的反转版本-无论哪个导致较高最大值-之间的交叉相关的最大值的均值可以低于预定阈值(例如,0.2或者0.3或者0.35或者0.1,例如,在0.05与0.035之间的范围内的阈值)。举例而言,对于ALWIP矩阵17M的每一对行(i1,i2),可以通过将第i1行的P个值乘以第i2行的P个值来计算交叉相关。对于每一经获得交叉相关,可以获得最大值。因此,可以针对整个矩阵17M获得均值(平均值)(亦即,平均所有组合中的交叉相关的最大值)。此后,阈值可以为例如0.2或者0.3或者0.35或者0.1,例如,在0.05与0.035之间的范围内的阈值。
块17a至17c的P个相邻样本可以沿着一维路径定位,所述一维路径沿着预定块18的边界(例如,18c、18a)延伸。对于预定块18的Q个预测值中的每一个,可以按在预定方向(例如,从左向右,从上而下等)上遍历一维路径的方式对与相应预测值有关的一系列P个加权因子进行排序。
在示例中,ALWIP矩阵17M可以为非对角或者非块对角的。
用于从4个已预测的相邻样本来预测4×4块18的ALWIP矩阵17M的示例可以为:
{
{37,59,77,28},
{32,92,85,25},
{31,69,100,24},
{33,36,106,29},
{24,49,104,48},
{24,21,94,59},
{29,0,80,72},
{35,2,66,84},
{32,13,35,99},
{39,11,34,103},
{45,21,34,106},
{51,24,40,105},
{50,28,43,101},
{56,32,49,101},
{61,31,53,102},
{61,32,54,100}
}。
(此处,{37,59,77,28}为矩阵17M的第一行;{32,92,85,25}为第二行;且{61,32,54,100}为第16行。)矩阵17M具有尺寸16×4,且包括64个加权因子(由于16*4=64)。这是因为矩阵17M具有尺寸Q×P,其中Q=M*N,其为待预测的块18的样本数目(块18为4×4块),且P为已预测样本的样本数目。此处,M=4,N=4,Q=16(由于M*N=4*4=16),P=4。所述矩阵为非对角和非块对角的,且不由特定规则描述。
如可以看出,少于1/4的加权因子是0(在上文所示出的矩阵的情况下,六十四个当中的一个加权因子为零)。当根据光栅扫描次序一个接一个地配置时,由这些值形成的包络形成全向非线性的包络。
即使主要参考解码器(例如,解码器54)论述以上解释,但所述解释可以在编码器(例如,编码器14)处执行。
在一些示例中,对于各块大小(在块大小的集合中),用于相应块大小的内预测模式的第二集合内的内预测模式的ALWIP变换相互不同。另外或者替代地,用于块大小的集合中的块大小的内预测模式的第二集合的基数可以一致,但用于不同块大小的内预测模式的第二集合内的内预测模式的相关联的线性或者仿射线性变换不可以通过按比例调整来彼此转换。
在一些示例中,可以定义ALWIP变换,以此方式使得其与已知变换“无共享部分”(例如,ALWIP变换可能与对应已知变换“无”共享部分,即使所述变换已经由以上映射中的一个映射)。
在示例中,ALWIP模式用于亮度分量和色度分量二者,但在其他示例中,ALWIP模式用于亮度分量但不用于色度分量。
5具有编码器加速的仿射线性经加权内预测模式(例如,测试CE3-1.2.1)
5.1方法或者装置的描述
在CE3-1.2.1中测试的仿射线性经加权内预测(ALWIP)模式可以与在测试CE3-2.2.2下在JVET-L0199中提议的模式相同,除了以下改变以外:
·与多个参考线(MRL)内预测(尤其编码器估计和用信号通知)的协调,亦即MRL不与ALWIP组合且传输MRL索引被限于非ALWIP块。
·现在必须对所有W×H≥32×32的块进行次采样(以前对于32×32是可选的);因此,已删除了编码器处的发送次采样标志的额外测试。
·通过分别对32×N和N×32下采样并应用对应的ALWIP模式,已添加了用于64×N和N×64块(其中N≤32)的ALWIP。
此外,测试CE3-1.2.1包括用于ALWIP的以下编码器优化:
·经组合模式估计:已知和ALWIP模式使用用于完整RD估计的共享阿达玛候选者列表,亦即ALWIP模式候选者基于阿达玛成本添加至与已知(和MRL)模式候选者相同的列表。
·针对经组合模式列表支持EMT内快速和PB内快速,其中额外优化用于缩减完整RD检查的数目。
·按照与已知模式相同的方法,仅将可用的左侧和上方块的MPM添加至所述列表,以进行ALWIP的完整RD估计。
5.2复杂性评定
在测试CE3-1.2.1中,不包括调用离散余弦变换的计算,每一样本最多需要12次乘法才能产生预测信号。此外,总共需要136492个参数,每一参数16个位。此对应于0.273兆字节的内存。
5.3实验结果
根据共同测试条件JVET-J1010[3]对具有VTM软件3.0.1版本的仅内(AI)和随机存取(RA)配置执行测试评估。在具有Linux OS和GCC 7.2.1编译程序的Intel Xeon集群(E5-2697A v4,AVX2打开,英特尔睿频加速技术(turbo boost)关闭)上进行了对应的模拟。
表1.用于VTM AI配置的CE3-1.2.1的结果
Y U V 编码时间 解码时间
种类A1 -2,08% -1,68% -1,60% 155% 104%
种类A2 -1,18% -0,90% -0,84% 153% 103%
种类B -1,18% -0,84% -0,83% 155% 104%
种类C -0,94% -0,63% -0,76% 148% 106%
种类E -1,71% -1,28% -1,21% 154% 106%
总计 -1,36% -1,02% -1,01% 153% 105%
种类D -0,99% -0,61% -0,76% 145% 107%
种类F(可选的) -1,38% -1,23% -1,04% 147% 104%
表2.用于VTM RA配置的CE3-1.2.1的结果
Figure BDA0003467567470000161
Figure BDA0003467567470000171
5.4复杂性降低的仿射线性经加权内预测(例如测试CE3-1.2.2)
CE2中所测试的技术涉及JVET-L0199[1]中所描述的“仿射线性内预测”,但就内存要求和计算复杂度而言简化了所述技术:
·可以仅存在三组不同的预测矩阵(例如S0,S1,S2,也参见下文)和偏差向量(例如用于提供偏移值)覆盖所有块形状。因此,参数的数目缩减至14400个10位值,这比在128×128CTU中存储的内存要少。
·预测器的输入和输出大小经进一步缩减。此外,代替经由DCT变换边界,可以对边界样本执行平均或者下采样,并且预测信号的产生可以使用线性内插代替逆DCT。因此,为了产生预测信号,每一样本最多可以需要四次乘法。
6.示例
此处论述如何调用ALWIP预测执行一些预测(例如,如图6中所示出)。
原则上,参考图6,为了获得待预测的M×N块18的Q=M*N个值,应执行将Q×PALWIP预测矩阵17M的Q*P个样本乘以P×1相邻向量17P的P个样本。因此,一般而言,为了获得待预测的M×N块18的Q=M*N个值中的每一个,至少需要P=M+N次值乘法。
这些乘法具有极其不合需要的效应。一般而言,边界向量17P的尺寸P取决于与待预测的M×N块18相邻(例如,邻近)的边界样本(位子或者像素)17a、17c的数目M+N。这意味着,如果待预测的块18的大小较大,则边界像素(17a,17c)的数目M+N相应地较大,因此增大了P×1边界向量17P的尺寸P=M+N,和Q×P ALWIP预测矩阵17M的每一行的长度,以及相应地,也增加必需的乘法的数目(一般而言,Q=M*N=W*H,其中宽度(W)是N的另一符号且高度(H)是M的另一符号;在边界向量仅由一行和/或一列样本形成的情况下,P为P=M+N=H+W)。
一般而言,以下事实会加剧此问题:在基于微处理器的系统(或者其他数字处理系统)中,乘法通常为消耗功率的运算。可以想象,针对大量块的极大量样本进行的大量乘法会导致计算功率的浪费,此通常为不合需要的。
因此,优选地,缩减预测M×N块18所必需的乘法的数目Q*P。
已理解,有可能通过智能型地选择替代乘法并且更易于处理的运算,来在某种程度上缩减待预测的每一块18的每一内预测所必需的计算功率。
详细来讲,参考图7.1至图7.4,已理解,编码器或者解码器可以使用多个相邻样本(例如,17a、17c)通过以下操作预测图像的预定块(例如,18)
减少(例如,在步骤811处)(例如,通过平均或者下采样)多个相邻样本(例如,17a、17c)以获得在样本数目上低于所述多个相邻样本的经缩减样本值集合,
对经缩减样本值集合进行(例如在步骤812处)线性或者仿射线性变换,以获得预定块的预定样本的经预测值。
在一些情况下,解码器或者编码器也可以例如通过内插基于用于预定样本和多个相邻样本的经预测值导出用于预定块的其他样本的预测值。因此,可以获得上采样策略。
在示例中,有可能对边界17的样本执行(例如,在步骤811处)一些平均,以便获得具有经缩减样本数目的经缩减样本集合102(图7.1至图7.4)(经缩减样本数目102的样本中的至少一个可以为原始边界样本或者一系列原始边界样本中的两个样本的平均值)。举例而言,如果原始边界具有P=M+N个样本,则经缩减样本集合可以具有Pred=Mred+Nred,其中Mred<M和Nred<N中的至少一个,使得Pred<P。因此,将实际上用于预测(例如在步骤812b处)的边界向量17P将不具有P×1个项但具有Pred×1个项,其中Pred<P。类似地,针对预测所选择的ALWIP预测矩阵17M将不具有Q×P尺寸,但具有Q×Pred(或者Qred×Pred,参见下文),其具有矩阵的经缩减数目个元素,至少因为Pred<P(借助于Mred<M和Nred<N中的至少一个)。
在一些示例(例如,图7.2、图7.3)中,甚至有可能进一步减少乘法的数目,如果通过ALWIP获得的块(在步骤812处)为大小为M′red×N′red的经缩减块,其中M′red<M和/或N′red<N(亦即,直接通过ALWIP预测的样本相较于实际上待预测的块18的样本在数目上较少)。因此,设定Qred=M′red*N′red,这将通过使用Qred*Pred乘法而非Q*Pred乘法(其中Qred*Pred<Q*Pred<Q*P)获得ALWIP预测。此乘法将预测经缩减块,其尺寸为M′red×N′red。尽管如此,将有可能执行(例如,在后续步骤813处)从经缩减M′red×N′red预测块至最终的M×N预测块的上采样(例如,通过内插获得)。
这些技术可以是有利的,这是由于虽然矩阵乘法涉及经缩减的乘法数目(Qred*Pred或者Q*Pred),但初始缩减(例如,平均或者下采样)和最终变换(例如内插)二者均可以通过缩减(或者甚至避免)乘法来执行。举例而言,下采样、平均和/或内插可以通过采用计算上功率要求不高的二进制运算(诸如加法和移位)来执行(例如在步骤811和/或813处)。
并且,所述加法是极容易的运算,其无需大量的计算工作即可以容易地执行。
此移位运算可以例如用于平均两个边界样本和/或用于内插(或者从边界取得的)经缩减的经预测块的两个样本(支持值),以获得最终的经预测块。(对于内插,必须有两个样本值。在所述块内,一直具有两个预定值,但对于沿块的左边界和上方边界内插样本,仅具有一个预定值,如图7.2中,因此使用边界样本作为内插的支持值。)
可以使用二步骤程序,诸如:
首先对两个样本的值求和;
接着将总和的值减半(例如,通过向右移位)。
替代地,有可能:
首先将样本中的每一个减半(例如,通过向左移位);
接着对两个经减半样本的值求和。
当下采样(例如,在步骤811处)时,可以执行甚至更容易的运算,因为仅需要在样本的群组(例如,彼此邻近的样本)中选择一个样本。
因此,现在有可能界定用于缩减待执行的乘法的数目的技术。这些技术中的一些可以尤其基于以下原理中的至少一个:
即使实际上待预测的块18具有大小M×N,块也可以经缩减(在两个维度中的至少一个上)且可以应用具有缩减大小QredxPred的ALWIP矩阵(其中Qred=M′red*N′red、Pred=Nred+Mred,以及M′red<M和/或N′red<N和/或Mred<M和/或Nred<N)。因此,边界向量17P将具有大小Pred×1,仅意指Pred<P乘法(其中Pred=Mred+Nred且P=M+N)。
Pred×1边界向量17P可以从原始边界17容易地获得,例如:
通过下采样(例如通过仅选择边界的一些样本);和/或
通过平均边界的多个样本(所述边界可以通过加法和移位而不使用乘法的情况下容易地获得)。
另外或者替代地,替代通过乘法预测待预测的块18的所有Q=M*N值,有可能仅预测具有经缩减尺寸的经缩减块(例如,Qred=M′red*N′red,其中M′red<M和/或N′red<N)。将通过内插,例如使用Qred样本作为用于待预测的剩余的Q-Qred值的支持值来获得待预测的块18的剩余的样本。
根据图7.1中所说明的一示例,将预测4×4块18(M=4,N=4,Q=M*N=16),且已经在先前反复下预测样本17a(具有四个已经预测的样本的垂直行列)和17c(具有四个已经预测的样本的水平行)的邻域17(邻域17a和17c可以共同由17指示)。先验地,通过使用图6中所示出的等式,预测矩阵17M应为Q×P=16×8矩阵(借助于Q=M*N=4*4且P=M+N=4+4=8),且边界向量17P应具有8×1尺寸(借助于P=8)。然而,这将驱使对于待预测的4×4块18的16个样本中的每一个执行8次乘法的必要性,因此导致总共需要执行16*8=128次乘法的必要性。(应注意,每一样本的乘法的平均数目为对计算复杂度的良好评定。对于已知内预测,每一样本需要四次乘法,且这增加待涉及的计算工作。因此,可以使用此作为ALWIP的上限,将确保复杂性是合理的并且不超过已知内预测的复杂性。)
尽管如此,已理解,通过使用本发明技术,有可能在步骤811处将与待预测的块18相邻的样本17a和17c的数目从P缩减至Pred<P。详细来讲,已理解,有可能平均(例如在图7.1中的100处)彼此邻近的边界样本(17a,17c),以获得具有两个水平行和两个垂直列的经缩减边界102,因这将2×2块用作块18(经缩减边界是通过经平均值形成)。替代地,有可能执行下采样,因此选择用于行17c的两个样本和用于列17a的两个样本。因此,替代具有四个原始样本的水平行17c经处理为具有两个样本(例如经平均样本),而最初具有四个样本的垂直列17a经处理为具有两个样本(例如经平均样本)。也有可能理解,在细分每两个样本的群组110中的行17c和列17a之后,维持单个样本(例如,群组110的样本的平均值或者群组110的样本当中的简单选择)。因此,借助于仅具有四个样本的集合102而获得所谓的经缩减样本值集合102(Mred=2,Nred=2,Pred=Mred+Nred=4,其中Pred<P)。
已理解,有可能执行运算(诸如平均或者下采样100)而无需在处理器层级下实行太多的乘法:在步骤811执行的平均或者下采样100可以简单地通过直接的且计算上非功率消耗运算(诸如加法和移位)来获得。
已理解,此时,可以对经缩减样本值集合102进行线性或者仿射线性(ALWIP)变换19(例如,使用诸如图6的矩阵17M的预测矩阵)。在此情况下,ALWIP变换19直接将四个样本102映射到块18的样本值104上。在当前情况下,不需要内插。
在此情况下,ALWIP矩阵17M具有尺寸Q×Pred=16×4:此遵循以下事实:待预测的块18的所有Q=16个样本均通过ALWIP乘法直接获得(不需要内插)。
因此,在步骤812a处,选择具有尺寸Q×Pred的合适的ALWIP矩阵17M。所述选择可以至少部分地基于例如从数据流12的用信号通知。选定的ALWIP矩阵17M也可以调用Ak来指示,其中k可以理解为索引,其可以在数据流12中用信号通知(在一些情况下,所述矩阵也指示为
Figure BDA0003467567470000211
参见下文)。所述选择可以根据以下方案执行:对于每一尺寸(例如,待预测的块18的高度/宽度对),在例如矩阵的三个集合S0、S1、S2中的一个当中选择ALWIP矩阵17M(三个集合S0、S1、S2中的每一个可以对具有相同尺寸的多个ALWIP矩阵17M进行分组,且待针对预测选择的ALWIP矩阵将为其中的一个)。
在步骤812b处,执行选定的Q×Pred ALWIP矩阵17M(也指示为Ak)与Pred×1边界向量17P之间的乘法。
在步骤812c处,可以将偏移值(例如,bk)与例如通过ALWIP获得的向量18Q的所有经获得值104相加。偏移值(bk或者在一些情况下也调用
Figure BDA0003467567470000212
指示,参见下文)可以与特定的选定ALWIP矩阵(Ak)相关联,且可以基于索引(例如,其可以在数据流12中用信号通知)。
因此,此处恢复使用本发明技术与不使用本发明技术之间的比较:
在不具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=4,N=4;
待预测的Q=M*N=4*4=16个值;
P=M+N=4+4=8个边界样本
用于待预测的Q=16个值中的每一个的P=8次乘法
总数目P*Q=8*16=128次乘法;
在本发明技术的情况下,使得:
待预测的块18,所述块具有尺寸M=4,N=4;
待在结束时预测的Q=M*N=4*4=16个值;
边界向量的经缩减尺寸:Pred=Mred+Nred=2+2=4;
用于待通过ALWIP预测的Q=16个值中的每一个的Pred=4次乘法,
总数目Pred*Q=4*16=64次乘法(128的一半!)
乘法的数目与待获得的最终值的数目之间的比率为Pred*Q/Q=4,亦即用于每一待预测样本的P=8次乘法的不到一半!
如可以理解,通过依赖于诸如平均的直接且计算上功率要求不高的运算(且,在加法和/或移位和/或下采样的情况下),有可能在步骤812处获得适当的值。
参考图7.2,待预测的块18此处为64个样本的8×8块(M=8,N=8)。此处,先验地,预测矩阵17M应具有大小Q×P=64×16(Q=64,借助于Q=M*N=8*8=64,M=8且N=8并且借助于P=M+N=8+8=16)。因此,先验地,将需要用于待预测的8×8块18的Q=64个样本中的每一个的P=16次乘法,以得到用于整个8×8块18的64*16=1024次乘法!
然而,如图7.2中可以见,可以提供方法820,根据所述方法,代替使用边界的所有16个样本,仅使用8个值(例如,边界的原始样本之间的水平边界行17c中的4和垂直边界列17a中的4)。从边界行17c,可以使用4个样本而非8个样本(例如,4个样本可以为二乘二的平均值和/或从两个样本选择一个样本)。因此,边界向量并非P×1=16×1向量,而仅为Pred×1=8×1向量(Pred=Mred+Nred=4+4)。已理解,有可能选择或者平均(例如,二乘二)水平行17c的样本和垂直列17a的样本以仅具有Pred=8个边界值,而非原始的P=16个样本,从而形成经缩减样本值集合102。此经缩减集合102将准许获得块18的经缩减版本,经缩减版本具有Qred=Mred*Nred=4*4=16个样本(而非Q=M*N=8*8=64)。有可能应用ALWIP矩阵以用于预测具有大小Mred×Nred=4×4的块。块18的经缩减版本包括在图7.2的方案106中调用灰色指示的样本:调用灰色正方形指示的样本(包括样本118'和118”)形成4×4经缩减块,其具有在进行步骤812获得的Qred=16个值。通过在进行步骤812时应用线性变换19而获得4×4经缩减块。在获得4×4经缩减块的值之后,有可能例如通过内插获得剩余的样本(在方案106中调用白色样本指示的样本)的值。
关于图7.1的方法810,此方法820可以另外包括例如通过内插导出用于待预测的M×N=8×8块18的剩余的Q-Qred=64-16=48个样本(白色正方形)的预测值的步骤813。剩余的Q-Qred=64-16=48个样本可以通过内插从Qred=16个直接获得的样本获得(所述内插也可以利用例如边界样本的值)。如图7.2中可以见,虽然在步骤812处已经获得样本118'和118”(如由灰色正方形指示),但样本108'(在样本118'与118”中间且调用白色正方形指示)在步骤813处通过样本118'与118”之间的内插获得。已理解,内插也可以通过类似于用于平均的运算(诸如,移位和加法)来获得。因此,在图7.2中,通常可以将值108'确定为样本118'的值与样本118”的值之间的中间值(其可以为平均值)。
通过执行内插,在步骤813处,也有可能基于在104中指示的多个样本值而得到M×N=8×8块18的最终版本。
因此,使用本发明技术与不使用本发明技术之间的比较是:
在不具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=8,N=8,和待预测的块18中的Q=M*N=8*8=64个样本;
边界17中的P=M+N=8+8=16个样本;
用于待预测的Q=64个值中的每一个的P=16次乘法,
总数目P*Q=16*64=1028次乘法
乘法的数目与待获得的最终值的数目之间的比率是P*Q/Q=16
在具有本发明技术的情况下:
待预测的块18,其具有尺寸M=8,N=8
待在结束时预测的Q=M*N=8*8=64个值;
但将使用Qred×Pred ALWIP矩阵,其中Pred=Mred+Nred,Qred=Mred*Nred,Mred=4,Nred=4
边界中的Pred=Mred+Nred=4+4=8个样本,其中Pred<P
用于待预测的4×4经缩减块(在方案106中由灰色正方形形成)的Qred=16个值中的每一个的Pred=8次乘法,
总数目Pred*Qred=8*16=128次乘法(比1024小得多!)
乘法的数目与待获得的最终值的数目之间的比率是Pred*Qred/Q=128/64=2(比在不具有本发明技术的情况下获得的16小得多!)。
因此,特此呈现的技术对功率的需求比前一个技术小8倍。
图7.3示出另一示例(其可以基于方法820),其中待预测的块18为矩形4×8块(M=8,N=4),其具有待预测的Q=4*8=32个样本。边界17是通过具有N=8个样本的水平行17c和具有M=4个样本的垂直列17a形成。因此,先验地,边界向量17P将具有尺寸P×1=12×1,而预测ALWIP矩阵应为Q×P=32×12矩阵,因此使得需要Q*P=32*12=384次乘法。
然而,有可能例如平均或者下采样水平行17c的至少8个样本,以获得仅具有4个样本(例如,经平均样本)的经缩减水平行。在一些示例中,垂直列17a将保持原样(例如不进行平均)。总体上,经缩减边界将具有尺寸Pred=8,其中Pred<P。因此,边界向量17P将具有尺寸Pred×1=8×1。ALWIP预测矩阵17M将为具有尺寸M*Nred*Pred=4*4*8=64的矩阵。直接在进行步骤812时获得的4×4经缩减块(在方案107中通过灰色列形成)将具有大小Qred=M*Nred=4*4=16个样本(而非待预测的原始4×8块18的Q=4*8=32)。一旦通过ALWIP获得经缩减4×4块,则有可能在步骤813处添加偏移值bk(步骤812c)且执行内插。如可以在图7.3中的步骤813处看出,经缩减4×4块扩增至4×8块18,其中未在步骤812处获得的值108'通过内插在步骤812处获得的值118'和118”(灰色正方形)而在步骤813处获得。
因此,使用本发明技术与不使用本发明技术之间的比较是:
在不具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=4,N=8
待预测的Q=M*N=4*8=32个值;
边界中的P=M+N=4+8=12个样本;
用于待预测的Q=32个值中的每一个的P=12次乘法,
总数目P*Q=12*32=384次乘法
乘法的数目与待获得的最终值的数目之间的比率是P*Q/Q=12
在具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=4,N=8
待在结束时预测的Q=M*N=4*8=32个值;
但可以使用Qred×Pred=16×8ALWIP矩阵,其中M=4,Nred=4,Qred=M*Nred=16,Pred=M+Nred=4+4=8
边界中的Pred=M+Nred=4+4=8个样本,其中Pred<P
用于待预测的经缩减块的Qred=16个值中的每一个的Pred=8次乘法,
总数目Qred*Pred=16*8=128次乘法(少于384!)
乘法的数目与待获得的最终值的数目之间的比率是Pred*Qred/Q=128/32=4(比在不具有本发明技术的情况下获得的12小得多!)。
因此,在具有本发明技术的情况下,计算工作缩减至三分的一。
图7.4示出待预测的具有尺寸M×N=16×16且待在结束时预测的具有Q=M*N=16*16=256个值的块18的情况,所述块具有P=M+N=16+16=32个边界样本。这将产生具有尺寸Q×P=256×32的预测矩阵,其将暗示256*32=8192次乘法!
然而,通过应用方法820,有可能在步骤811处(例如通过平均或者下采样)将边界样本的数目例如从32缩减至8:例如,对于行17a的四个连续样本的每一群组120,仍存在单个样本(例如,选从四个样本,或者样本的平均值)。也对于列17c的四个连续样本的每一群组,仍存在单个样本(例如,选从四个样本,或者样本的平均值)。
此处,ALWIP矩阵17M为Qred×Pred=64×8矩阵:这是由于选择了Pred=8(通过使用来自边界的32个样本的8个经平均或者选定的样本)的事实和待在步骤812处预测的经缩减块为8×8块(在方案109中,灰色正方形是64)的事实。
因此,一旦在步骤812处获得经缩减8×8块的64个样本,则有可能在步骤813处导出待预测的块18的剩余的Q-Qred=256-64=192个值104。
在此情况下,为了执行内插,已经选择使用边界列17a的所有样本且仅替代边界行17c中的样本。可以进行其他选择。
在具有本发明方法时,乘法的数目与最终获得值的数目之间的比率是Qred*Pred/Q=8*64/256=2,其比在不具有本发明技术的情况下用于每一值的32次乘法小得多!
使用本发明技术与不使用本发明技术之间的比较是:
在不具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=16,N=16
待预测的Q=M*N=16*16=256个值;
边界中的P=M+N=16*16=32个样本;
用于待预测的Q=256个值中的每一个的P=32次乘法,
总数目P*Q=32*256=8192次乘法;
乘法的数目与待获得的最终值的数目之间的比率是P*Q/Q=32
在具有本发明技术的情况下:
待预测的块18,所述块具有尺寸M=16,N=16
待在结束时预测的Q=M*N=16*16=256个值;
但将使用Qred×Pred=64×8ALWIP矩阵,其中Mred=4,Nred=4,待通过ALWIP预测的Qred=8*8=64个样本,Pred=Mred+Nred=4+4=8
边界中的Pred=Mred+Nred=4+4=8个样本,其中Pred<P
用于待预测的经缩减块的Qred=64个值中的每一个的Pred=8次乘法,
总数目Qred*Pred=64*4=256次乘法(少于8192!)
乘法的数目与待获得的最终值的数目之间的比率是Pred*Qred/Q=8*64/256=2(比在不具有本发明技术的情况下获得的32小得多!)。
因此,本发明技术所需的计算功率比传统技术小16倍!
因此,有可能通过以下操作使用多个相邻样本(17)预测图像的预定块(18)
减少(100,813)多个相邻样本以获得在样本数目上少于多个相邻样本(17)的经缩减样本值集合(102),
使经缩减样本值集合(102)进行(812)线性或者仿射线性变换(19,17M)以获得用于预定块(18)的预定样本(104,118',188”)的经预测值。
详细来讲,有可能通过下采样多个相邻样本以获得在样本数目上少于多个相邻样本(17)的经缩减样本值集合(102)而执行减少(100,813)。
替代地,有可能通过平均多个相邻样本以获得在样本数目上少于多个相邻样本(17)的经缩减样本值集合(102)而执行减少(100,813)。
另外,有可能通过内插基于预定样本(104,118',118”)和多个相邻样本(17)的经预测值导出(813)预定块(18)的另一样本(108,108')的预测值。
多个相邻样本(17a,17c)可以沿着预定块(18)的二侧(例如,在图7.1至图7.4中朝右和朝下)一维延伸。预定样本(例如通过ALWIP在步骤812中获得的样本)也可以以行和列配置,且沿着行和列中的至少一个,预定样本可以定位于从预定样本112的毗邻预定块18的二侧的样本(112)开始的每一第n位置处。
基于多个相邻样本(17),有可能针对行和列中的至少一个中的每一个确定多个相邻位置中的一个位置(118)的支持值(118),其对准至行和列中的至少一个中的一相应者。也有可能通过内插基于预定样本(104,118',118”)的经预测值和对准至行和列中的至少一个的相邻样本(118)的支持值导出预定块(18)的其他样本(108,108')的预测值118。
预定样本(104)可以沿着行定位于从毗连预定块18的二侧的样本(112)开始的每一第n位置处,且预定样本沿着列定位于从(112)毗连预定块(18)的二侧的预定样本的样本(112)开始的每一第m位置处,其中n、m>1。在一些情况下,n=m(例如,在图7.2和图7.3中,其中直接通过ALWIP在812处获得且调用灰色正方形指示的样本104、118'、118”沿着行和列交替至随后在步骤813处获得的样本108、108')。
沿着行(17c)和列(17a)中的至少一个,有可能例如通过针对每一支持值下采样或者平均(122)包括相邻样本(118)的多个相邻样本内的相邻样本群组(120)而执行确定支持值,针对所述样本确定相应支持值。因此,在图7.4中,在步骤813处,有可能通过使用预定样本118”'(先前在步骤812处所获得)和相邻样本118的值作为支持值而获得样本119的值。
多个相邻样本可以沿着预定块(18)的二侧一维延伸。有可能通过将多个相邻样本(17)分组成一个或多个连续相邻样本的群组(110)且对具有两个或者更多个相邻样本的一个或多个相邻样本的群组(110)中的每一个执行下采样或者平均而执行减少(811)。
在示例中,线性或者仿射线性变换可以包括Pred*Qred或者Pred*Q加权因子,其中Pred是经缩减样本值集合内的样本值(102)的数目,且Qred或者Q为预定块(18)内的预定样本的数目。至少1/4Pred*Qred或者1/4Pred*Q加权因子为非零加权值。Pred*Qred或者Pred*Q加权因子可以针对Q或者Qred预定样本中的每一个包括关于相应预定样本的一系列Pred加权因子,其中所述系列在根据光栅扫描次序在预定块(18)的预定样本当中一个配置在另一个下方时形成全向非线性的包络。Pred*Q或者Pred*Qred加权因子可以经由任何常规映射规则而彼此不相关。关于相应预定样本的第一系列的加权因子与关于除相应预定样本之外的预定样本的第二系列的加权因子或者后一系列的反向版本之间的交叉相关的最大值(无论任何均产生较高最大值)的均值低于预定阈值。预定阈值可以为0.3[或者在一些情况下为0.2或者0.1]。Pred相邻样本(17)可以沿着一维路径(其沿着预定块(18)的二侧延伸)定位,且对于Q或者Qred预定样本中的每一个,关于相应预定样本的所述系列的Pred加权因子以在预定方向上遍历一维路径的方式排序。
6.1方法和装置的描述
为了预测具有宽度W(也由N指示)和高度H(也由M指示)的矩形块的样本,仿射线性加权内预测(ALWIP)可以将块左侧的一列H个重构的相邻边界样本和块上方的一列W个重构的相邻边界样本用作输入。如果经重构样本不可用,则可以如在已知内预测中进行来产生所述经重构样本。
产生预测信号(例如,用于完整的块18的值)可以基于以下三个步骤中的至少一些:
1.在边界样本17中,样本102(例如,在W=H=4的情况下的四个样本和/或在其他情况下的八个样本)可以通过平均或者下采样(例如,步骤811)而提取。
2.可以调用作为输入的经平均样本(或者从下采样剩余的样本)来实行矩阵向量乘法,之后为偏移的相加。结果可以为关于原始块中的经次采样样本集的经缩减预测信号(例如,步骤812)。
3.可以例如通过上采样从关于经次采样集合的预测信号,例如通过线性内插产生剩余位置处的预测信号(例如,步骤813)。
由于步骤1.(811)和/或3.(813),在计算矩阵向量乘积时所需的乘法的总数目可以使得所述数目始终小于或者等于4*W*H。此外,仅通过使用加法和位移位来实行对边界的平均运算和经缩减预测信号的线性内插。换言之,在示例中,对于ALWIP模式,每一样本至多需要四次乘法。
在一些示例中,产生预测信号所需的矩阵(例如,17M)和偏移向量(例如,bk)可以取自可以例如存储于解码器和编码器的存储单元中的矩阵的集合(例如,三个集合),例如S0、S1、S2
在一些示例中,集合S0可以包括n0(例如,n0=16或者n0=18或者另一数目)矩阵
Figure BDA0003467567470000281
(例如,由其组成),所述矩阵中的每一个可以具有16行和4列以及各自具有大小16的18个偏移向量
Figure BDA0003467567470000282
以根据图7.1执行所述技术。此集合的矩阵和偏移向量是用于具有大小4×4的块18。一旦边界向量已经缩减至Pred=4向量(对于图7.1的步骤811),则有可能将经缩减样本集合102的Pred=4样本直接映射到待预测的4×4块18的Q=16样本中。
在一些示例中,集合S1可以包括n1(例如,n1=8或者n1=18或者另一数目)矩阵
Figure BDA0003467567470000283
(例如,由其组成),所述矩阵中的每一个可以具有16行和8列以及各自具有大小16的18个偏移向量
Figure BDA0003467567470000284
以根据图7.2或者图7.3执行所述技术。此集合S1的矩阵和偏移向量可用于具有大小4×8、4×16、4×32、4×64、16×4、32×4、64×4、8×4和8×8的块。另外,其也可用于具有大小WxH的块(其中max(W,H)>4且min(W,H)=4),亦即用于具有大小4×16或者16×4、4×32或者32×4和4×64或者64×4的块。16×8矩阵是指块18(其为4×4块)的经缩减版本,如在图7.2和图7.3中所获得。
另外或者替代地,集合S2可以包括n2(例如,n2=6或者n2=18或者另一数目)矩阵
Figure BDA0003467567470000285
(例如,由其组成),所述矩阵中的每一个可以具有64行和8列以及具有大小64的18个偏移向量
Figure BDA0003467567470000286
64×8矩阵是指块18(其为8×8块)的经缩减版本,例如如在图7.4中获得。此集合的矩阵和偏移向量可用于具有大小8×16、8×32、8×64、16×8、16×16、16×32、16×64、32×8、32×16、32×32、32×64、64×8、64×16、64×32、64×64的块。
该集合的矩阵和偏移向量或者这些矩阵和偏移向量的部分可用于所有其他块形状。
6.2边界的平均或者下采样
此处,提供关于步骤811的特征。
如上文所解释,边界样本(17a,17c)可以经平均和/或下采样(例如,从P个样本至Pred<P个样本)。
在第一步骤中,输入边界bdrytop(例如17c)和bdryleft(例如17a)可以缩减成较小边界
Figure BDA0003467567470000287
Figure BDA0003467567470000288
以获得经缩减集合102。此处,
Figure BDA0003467567470000289
Figure BDA00034675674700002810
二者在4×4块情况下由2个样本组成且在其他情况下由4个样本组成。
在4×4块的情况下,有可能界定
Figure BDA0003467567470000291
Figure BDA0003467567470000292
并类似地界定
Figure BDA0003467567470000293
因此,
Figure BDA0003467567470000294
为例如使用位移位运算获得的平均值。
在所有其他情况下(例如,对于具有不同于4的宽度或者高度的块),如果块宽度W经给定为W=4*2k,则对于0≤i<4,界定
Figure BDA0003467567470000295
并类似地界定
Figure BDA0003467567470000296
在另外其他情况下,有可能下采样边界(例如,通过从边界样本的群组选择一个特定边界样本)以获得经缩减样本数目。举例而言,
Figure BDA0003467567470000297
可以选从bdrytop[0]和bdrytop[1]且
Figure BDA0003467567470000298
可以选从bdrytop[2]和bdrytop[3]。也有可能类似地界定
Figure BDA0003467567470000299
两个经缩减边界
Figure BDA00034675674700002910
Figure BDA00034675674700002911
可以级联至经缩减边界向量bdryred(与经缩减集合102相关联),也用17P指示。经缩减边界向量bdryred因此可以具有用于形状4×4的块的大小四(Pred=4)(图7.1的示例)和具有用于所有其他形状的块的大小八(Pred=8)(图7.2至图7.4的示例)。
在此,如果mode<18(或者矩阵集合中的矩阵的数目),则有可能界定
Figure BDA00034675674700002912
如果mode≥18,其对应于mode-17的经转置模式,则有可能界定
Figure BDA00034675674700002913
因此,根据特定状态(一种状态:mode<18;另一种状态:mode≥18),有可能沿着不同扫描次序(例如,一种扫描次序:
Figure BDA00034675674700002914
一種掃描次序:
Figure BDA00034675674700002915
)分配输出向量的经预测值。
可以实行其他策略。在其他示例中,模式索引“mode”不必在0至35的范围内(可以界定其他范围)。此外,不必三个集合S0、S1、S2中的每一个具有18个矩阵(因此,代替如mode≥18的表达式,mode≥n0、n1、n2是可能的,所述模式分别为每一矩阵集合S0、S1、S2的矩阵的数目)。此外,所述集合可以各自具有不同数目个矩阵(例如,S0可以具有16个矩阵、S1可以具有八个矩阵,且S2可以具有六个矩阵)。
模式和经转置信息未必作为一个经组合模式索引“mode”来存储和/或传输:在一些示例中,有可能作为经转置标志和矩阵索引(用于S0的0-15、用于S1的0-7和用于S2的0-5)明确地用信号通知。
在一些情况下,经转置标志和矩阵索引的组合可以被解释为索引集合。举例而言,可以存在作为经转置标志操作的一个位和指示矩阵索引的一些位,所述位共同经指示为“集合索引”。
6.3通过矩阵向量乘法产生经缩减预测信号
此处,提供关于步骤812的特征。
从经缩减输入向量bdryred(边界向量17P),可以产生经缩减预测信号predred。后一信号可以为具有宽度Wred和高度Hred的经下采样块上的信号。此处,Wred和Hred可以界定为:
Wred=4,Hred=4;如果max(W,H)≤8,
Wred=min(W,8),Hred=min(H,8);否則。
可以通过计算矩阵向量乘积并加上偏移来计算经缩减预测信号predred
predred=A·bdryred+b。
此处,A为矩阵(例如,预测矩阵17M),其可以具有Wred*Hred个行和在W=H=4时具有4个列且在所有其他情况下具有8个列,且b为可以具有大小Wred*Hred的向量。
如果W=H=4,则A可以具有4列和16行且因此在这种情况下可以需要每一样本4次乘法以计算predred。在所有其他情况下,A可以具有8列且可以验证在这些情况下,使得8*Wred*Hred≤4*W*H,亦即也在这些情况下,每一样本至多需要4次乘法来计算predred
矩阵A和向量b可以从如下集合S0、S1、S2中的一个取得。通过设定idx(W,H)=0界定索引idx=idx(W,H),如果W=H=4;界定索引idx(W,H)=1,如果max(W,H)=8;并在所有其他情况下界定索引idx(W,H)=2。此外,可以使得m=mode,如果mode<18,否则m=mode-17。接着,如果idx≤1或者idx=2且min(W,H)>4,可以使得
Figure BDA0003467567470000301
Figure BDA0003467567470000302
在idx=2且min(W,H)=4的情况下,使A为通过遗漏
Figure BDA0003467567470000303
的每一行而产生在矩阵,其在W=4的情况下对应于经下采样块中的奇数x坐标,或者在H=4的情况下对应于经下采样块中的奇数y坐标。如果mode≥18,则通过其经转置信号替代经缩减预测信号。在替代性示例中,可以实行不同策略。举例而言,代替缩减较大矩阵的大小(“遗漏”),使用较小矩阵S1(idx=1),其中Wred=4且Hred=4。亦即,现在将此类块指派给S1而非S2
可以实行其他策略。在其他示例中,模式索引“mode”不必在0至35的范围内(可以界定其他范围)。此外,不必三个集合S0、S1、S2中的每一个具有18个矩阵(因此,代替如mode<18的表达式,mode<n0,n1,n2是可能的,所述模式分别为每一矩阵集合S0、S1、S2的矩阵的数目)。此外,所述集合可以各自具有不同数目个矩阵(例如,S0可以具有16个矩阵、S1可以具有八个矩阵,且S2可以具有六个矩阵)。
6.4用以产生最终预测信号的线性内插
此处,提供关于步骤812的特征。
关于较大块的经次采样预测信号的内插,可能需要经平均边界的第二版本。亦即,如果min(W,H)>8且W≥H,则得出W=8*2l,且对于0≤i<8,界定
Figure BDA0003467567470000311
如果min(W,H)>8且H>W,则类似地界定
Figure BDA0003467567470000312
另外或者替代地,有可能“难以下采样”,其中
Figure BDA0003467567470000313
等于
Figure BDA0003467567470000314
并且,可以类似地界定
Figure BDA0003467567470000315
在产生predred时遗漏的样本位置处,最终预测信号可以通过线性内插从predred产生(例如,图7.2至图7.4的示例中的步骤813)。在一些示例中,如果W=H=4,则此线性内插可以为不必要的(例如,图7.1的示例)。
线性内插可以给定如下(尽管如此,其他示例是可能的)。假设W≥H。接着,如果H>Hred,则可以执行predred的垂直上采样。在这种情况下,predred可以如下扩展一列至顶部。如果W=8,则predred可以具有宽度Wred=4且可以通过经平均边界信号
Figure BDA0003467567470000316
扩展至顶部,例如如上文所界定。如果W>8,则predred具有宽度Wred=8且通过经平均边界信号
Figure BDA0003467567470000317
扩展至顶部,例如如上文所界定。对于predred的第一列,可以得出predred[x][-1]。接着,具有宽度Wred和高度2*Hred的块上的信号
Figure BDA0003467567470000321
可以给定为
Figure BDA0003467567470000322
Figure BDA0003467567470000323
其中0≤x<Wred且0≤y<Hred。后一过程可以实行k次,直至2k*Hred=H为止。因此,如果H=8或者H=16,则所述过程至多可以实行一次。如果H=32,则所述过程可以实行二次。如果H=64,则所述过程可以实行三次。接下来,水平上采样运算可以应用于垂直上采样的结果。后一上采样运算可以使用预测信号左边的完整边界。最终,如果H>W,则可以通过首先在水平方向上(必要时)且接着在垂直方向上上采样而类似地继续进行。
这是使用用于第一内插(水平地或者垂直地)的经缩减边界样本和用于第二内插(垂直地或者水平地)的原始边界样本进行内插的示例。取决于块大小,仅需要第二内插或者不需要内插。如果需要水平和垂直内插,则次序取决于块的宽度和高度。
然而,可以实施不同技术:例如,原始边界样本可用于第一和第二内插,且次序可以为固定的,例如首先水平接着垂直(在其他情况下,首先垂直接着水平)。
因此,经缩减/原始边界样本的内插次序(水平/垂直)和使用可以变化。
6.5整个ALWIP过程的示例的说明
针对图7.1至图7.4中的不同形状说明平均、矩阵向量乘法和线性内插的整个过程。应注意,剩余的形状被视为所描绘情况中的一个。
1.给定4×4块,ALWIP可以通过使用图7.1的技术而采用沿着边界的每一轴线的两个平均值。所得四个输入样本进入矩阵向量乘法。矩阵是取自集合S0。在加上偏移之后,此可以以产生16个最终预测样本。对于产生预测信号,并不需要线性内插。因此,每一样本执行总共(4*16)/(4*4)=4次乘法。参见例如图7.1。
2.给定8×8块,ALWIP可以采用沿着边界的每一轴线的四个平均值。所得八个输入样本通过使用图7.2的技术进入矩阵向量乘法。矩阵是取自集合S1。这会在预测块的奇数位置上产生16个样本。因此,每一样本执行总共(8*16)/(8*8)=2次乘法。在加上偏移之后,可以例如通过使用顶部边界垂直地和例如通过使用左边边界水平地内插这些样本。参见例如图7.2。
3.给定8×4块,ALWIP可以通过使用图7.3的技术而采用沿着边界的水平轴线的四个平均值和在左边边界上的四个原始边界值。所得八个输入样本进入矩阵向量乘法。矩阵是取自集合S1。这会在预测块的奇数水平位置和每一垂直位置上产生16个样本。因此,每一样本执行总共(8*16)/(8*4)=4次乘法。在加上偏移之后,例如通过使用左边边界水平地内插这些样本。参见例如图7.3。
相应地处理经转置情况。
4.给定16×16块,ALWIP可以采用沿着边界的每一轴线的四个平均值。所得八个输入样本通过使用图7.2的技术进入矩阵向量乘法。矩阵是取自集合S2。这会在预测块的奇数位置上产生64个样本。因此,每一样本执行总共(8*64)/(16*16)=2次乘法。在加上偏移之后,例如,通过使用顶部边界垂直地和通过使用左边边界水平地内插这些样本。参见例如图7.2。参见例如图7.4。
对于较大形状,所述程序可以基本上相同,且容易检查每一样本的乘法的数目小于二。
对于W×8块,仅水平内插是必需的,因为在奇数水平位置和每一垂直位置处给定样本。因此,在这些情况下每一样本至多执行(8*64)/(16*8)=4次乘法。
最终,对于W×4块(其中W>8),使Ak为通过遗漏对应于沿着经下采样块的水平轴线的奇数项的每一行而出现的矩阵。因此,所述输出大小可以为32并且同样,仅水平内插仍待执行。每一样本至多可以执行(8*32)/(16*4)=4次乘法。
可以相应地处理经转置情况。
6.6所需参数的数目和复杂性评定
针对所有可能的经提议内预测模式所需的参数可以由属集合S0、S1、S2的矩阵和偏移向量包括。所有矩阵是数和偏移向量可以存储为10位值。因此,根据以上描述,经提议方法可以需要总数目14400个参数,每一参数的精确度为10位。此对应于0,018兆字节的内存。指示,当前,标准4:2:0色度次采样中的具有大小128×128的CTU由24576个值组成,每一值为10位。因此,经提议内预测工具的内存要求不超过在上一次会议上采用的当前图像参考工具的内存要求。并且,指示,由于PDPC工具或者具有分数角度位置的角度预测模式的4抽头内插滤波器,已知内预测模式需要每一样本四次乘法。因此,就可以操作复杂性而言,经提议方法不超过已知内预测模式。
6.7经提议内预测模式的信号通知
对于明度块,例如提议35个ALWIP模式(可以使用其他数目个模式)。对于内模式中的每一编码单元(CU),在位流中发送指示是否在对应的预测单元(PU)上应用ALWIP模式的标志。后一索引的用信号通知可以以与第一CE测试相同的方式与MRL调和。如果应用ALWIP模式,则ALWIP模式的索引predmode可以使用具有3个MPM的MPM列表来用信号通知。
此处,可以如下使用上方和左边PU的内模式来执行MPM的导出。可以存在例如三个固定表格map_angular_to_alwipidx,idx∈{0,1,2}等表格,其可以将ALWIP模式指派给每一已知内预测模式predmodeAngular
predmodeALWIP=map_angular_to_alwipidx[predmodeAngular]。
对于具有宽度W和高度H的每一PU,界定并且索引
idx(PU)=idx(W,H)∈{0,1,2}
其指示从三个集合中的哪一个获取ALWIP参数,如以上章节4中所述。如果上述预测单元PUabove可用、与当前PU属于同一CTU且在内模式下,如果idx(PU)=idx(PUabove),且如果在ALWIP模式
Figure BDA0003467567470000341
下将ALWIP应用于PUabove,则使得
Figure BDA0003467567470000342
如果上述PU可用、与当前PU属于同一CTU且在内模式下,且如果将已知内预测模式
Figure BDA0003467567470000343
应用于上述PU,则使得
Figure BDA0003467567470000344
在所有其他情况下,使得
Figure BDA0003467567470000345
这意味着此模式不可用。以相同方式但在不限制左边PU需要与当前PU属于同一CTU的情况下,导出模式
Figure BDA0003467567470000346
最后,提供三个固定默认列表listidx,idx∈{0,1,2},其各含有三种不同ALWIP模式。在默认列表listidx(PU)和模式
Figure BDA0003467567470000347
Figure BDA0003467567470000348
当中,通过以默认值取代-1以及排除重复来建构三个不同MPM。
本文中所描述的实施例不受经提议内预测模式的上文所描述的用信号通知限制。根据替代性实施例,MPM和/或映射表不用于MIP(ALWIP)。
6.8用于传统明度和色度内预测模式的经适配MPM列表导出
经提议ALWIP模式可以如下与已知内预测模式的基于MPM的编码调和。用于已知内预测模式的明度和色度MPM列表导出过程可以使用固定表格map_lwip_to_angularidx,idx∈{0,1,2},将给定PU上的ALWIP模式predmodeLWIP映射到已知内预测模式中的一个
predmodeAngular=map_lwip_to_angularidx(PU)[predmodeLWIP]。
对于明度MPM列表导出,每当遇到使用ALWIP模式predmodeLWIP的相邻明度块时,此块可以被处理为仿佛正使用已知内预测模式predmodeAngular。对于色度MPM列表导出,每当当前明度块使用LWIP模式时,相同映射可用于将ALWIP模式转变为已知内预测模式。
清楚的是,也可以在不使用MPM和/或映射表的情况下将ALWIP模式与已知内预测模式调和。举例而言,对于色度块,每当当前明度块使用ALWIP模式时,ALWIP模式有可能映射到平面内预测模式。
7.实施高效实施例
简要地概述以上示例,因为其可能在下文形成用于进一步扩展本文中所描述的实施例的基础。
为了预测图像10的预定块18,在使用多个相邻样本的情况下,使用17a、17c。
已经进行通过平均的多个相邻样本的缩减100以获得在样本数目上少于多个相邻样本的经缩减样本值集合102。此缩减在本文中的实施例中是可选的,且会产生在下文中提及的所谓的样本值向量。经缩减样本值集合进行线性或者仿射线性变换19以获得用于预定块的预定样本104的经预测值。此变换以后使用矩阵A和偏移向量b指示并且应为高效地预先形成的实施,所述矩阵A和偏移向量b已经通过机器学习(ML)获得。
通过内插,基于用于预定样本和多个相邻样本的经预测值导出用于预定块的其他样本108的预测值。应所述说,理论上,仿射/线性变换的结果可以与块18的非全像素样本位置相关联,使得根据替代实施例,可以通过内插获得块18的所有样本。也根本不需要内插。
多个相邻样本可能沿着预定块的二侧在一维上延伸,预定样本以行和列且沿着行和列中的至少一个配置,其中预定样本可以定位于从预定样本的毗邻预定块的二侧的样本(112)开始的每一第n位置处。基于多个相邻样本,对于行和列中的至少一个中的每一个,可以确定用于多个相邻位置中的一个位置(118)的支持值,其对准至行和列中的至少一个中的一相应者,且通过内插,可以基于用于预定样本的经预测值和用于相邻样本的对准至行和列中的至少一个的支持值导出用于预定块的其他样本108的预测值。预定样本可以沿着行定位于从预定样本的毗连预定块的二侧的样本112开始的每一第n位置处,且预定样本可以沿着列定位于从预定样本的毗连预定块的二侧的样本112开始的每一第m位置处,其中n,m>1。可能n=m。沿着行和列中的至少一个,可以通过针对每一支持值对多个相邻样本内的相邻样本的群组120(其包括相邻样本118,用于其的相应支持值经确定)进行平均(122)而进行支持值的确定。多个相邻样本可以沿着预定块的二侧一维延伸且可以通过将多个相邻样本分组成一个或多个连续相邻样本的群组110并对具有多于两个相邻样本的一个或多个相邻样本的群组中的每一个执行平均而进行缩减。
对于预定块,可以在数据流中传输预测残差。预测残差可以从解码器处的数据流导出,且预定块可以使用用于预定样本的预测残差和经预测值来重构。在编码器处,预测残差编码而成编码器处的数据流。
所述图像可以细分成具有不同块大小的多个块,所述多个块包括预定块。接着,可能取决于预定块的宽度W和高度H选择用于块18的线性或者仿射线性变换,使得在第一组线性或者仿射线性变换当中选择针对预定块选择的线性或者仿射线性变换,只要预定块的宽度W和高度H是在第一组宽度/高度对和第二组线性或者仿射线性变换内,只要预定块的宽度W和高度H是在不与第一组宽度/高度对相交的第二组宽度/高度对内。再次,随后变得清楚的是,仿射/线性变换是借助于其他参数(亦即C的权重,且可选地,偏移和尺度参数)表示。
解码器和编码器可以被配置为:将图像细分成具有不同块大小的多个块,其包括预定块;和取决于预定块的宽度W和高度H选择线性或者仿射线性变换,使得在以下各项当中选择针对预定块选择的线性或者仿射线性变换
第一组线性或者仿射线性变换,只要预定块的宽度W和高度H是在第一组宽度/高度对内,
第二组线性或者仿射线性变换,只要预定块的宽度W和高度H是在不与第一组宽度/高度对相交的第二组宽度/高度对内,以及
第三组线性或者仿射线性变换,只要预定块的宽度W和高度H是在不与第一和第二组宽度/高度对相交的第三组一个或多个宽度/高度对内。
第三组一个或多个宽度/高度对仅仅包括一个宽度/高度对W'、H',且第一组线性或者仿射线性变换内的每一线性或者仿射线性变换是用于将N'样本值变换为用于W'×H'样本位置数组的W'*H'经预测值。
第一和第二组宽度/高度对中的每一个可以包括Wp不等于Hp的第一宽度/高度对Wp、Hp,和Hq=Wp且Wq=Hp的第二宽度/高度对Wq、Hq
第一和第二组宽度/高度对中的每一个可以另外包括Wp等于Hp且Hp>Hq的第三宽度/高度对Wp、Hp
对于预定块,经设定索引可以在数据流中传输,所述数据流指示针对块18在一组预定线性或者仿射线性变换当中选择哪一线性或者仿射线性变换。
多个相邻样本可以沿着预定块的二侧在一维上延伸,且可以通过针对毗连预定块的第一侧的多个相邻样本的第一子集将第一子集分组成一个或多个连续相邻样本的第一群组110和针对毗连预定块的第二侧的多个相邻样本的第二子集将第二子集分组成一个或多个连续相邻样本的第二群组110和对具有多于两个相邻样本的一个或多个相邻样本的第一和第二群组中的每一个执行平均而进行缩减,以便从第一群组获得第一样本值和获得用于第二群组的第二样本值。接着,可以取决于经设定索引而在一组预定线性或者仿射线性变换当中选择线性或者仿射线性变换,使得经设定索引的两个不同状态导致选择线性或者仿射线性变换的预定集合的线性或者仿射线性变换中的一个,在经设定索引采用呈第一向量的形式的两个不同状态中的第一状态的情况下,经缩减样本值集合可以进行预定线性或者仿射线性变换以产生经预测值的输出向量,并且沿着第一扫描次序将输出向量的经预测值分配至预定块的预定样本上,且在经设定索引采用呈第二向量的形式的两个不同状态中的第二状态的情况下,第一和第二向量不同,使得由第一向量中的第一样本值中的一个填充的分量是由第二向量中的第二样本值中的一个填充,并且由第一向量中的第二样本值中的一个填充的分量是由第二向量中的第一样本值中的一个填充,以便产生经预测值的输出向量,并且将沿着第二扫描次序将输出向量的经预测值分配至预定块的预定样本上,所述预定块相对于第一扫描次序转置。
第一组线性或者仿射线性变换内的每一线性或者仿射线性变换可用于针对样本位置的w1×h1数组将N1样本值变换为w1*h1经预测值,且第二组线性或者仿射线性变换内的每一线性或者仿射线性变换是用于针对样本位置的w2×h2数组将N2样本值变换为w2*h2经预测值,其中对于第一组宽度/高度对中的第一预定宽度/高度对,w1可以超过第一预定宽度/高度对的宽度或者h1可以超过第一预定宽度/高度对的高度,并且对于第一组宽度/高度对中的第二预定宽度/高度对,w1无法超过第二预定宽度/高度对的宽度,h1也无法超过第二预定宽度/高度对的高度。接着可以通过平均缩减(100)多个相邻样本以获得经缩减样本值集合(102),使得在预定块具有第一预定宽度/高度对的情况下且在预定块具有第二预定宽度/高度对的情况下经缩减样本值集合102具有N1个样本值,且在预定块具有第一预定宽度/高度对的情况下可以在w1超过一个宽度/高度对的宽度的情况下沿着宽度尺寸或者在h1超过一个宽度/高度对的高度的情况下沿着高度尺寸通过仅使用与样本位置的w1×h1数组的次采样有关的选定的线性或者仿射线性变换的第一子部分来使经缩减样本值集合进行选定的线性或者仿射线性变换,且在预定块具有第二预定宽度/高度对的情况下使经缩减样本值集合彻底地进行选定的线性或者仿射线性变换。
第一组线性或者仿射线性变换内的每一线性或者仿射线性变换可用于针对w1=h1的样本位置的w1×h1数组将N1个样本值变换为w1*h1个经预测值,且第二组线性或者仿射线性变换内的每一线性或者仿射线性变换是用于针对w2=h2的样本位置的w2×h2数组将N2个样本值变换为w2*h2个经预测值。
所有上文所描述的实施例仅仅为说明性的,因为其可以在下文形成用于本文中所描述的实施例的基础。亦即,以上概念和细节应用以理解以下实施例并且应在下文充当本文中所描述的实施例的可能扩展和修正的储库。详细来讲,许多上文所描述的细节是可选的,诸如相邻样本的平均、相邻样本用作参考样本的事实等等。
更一般而言,本文中所描述的实施例假设从已重构的样本产生关于矩形块的预测信号,诸如从块左边和上方的相邻的已经重构的样本产生关于矩形块的内预测信号。预测信号的产生是基于以下步骤。
1.在目前被称作边界样本的参考样本中,但不排除将描述转移至定位在别处的参考样本的可能性,可以通过平均来提采样本。此处,针对块左边和上方的边界样本或者仅针对二侧中的一个上的边界样本来实行平均。如果在一侧上不实行平均,则该侧上的样本保持不变。
2.实行矩阵向量乘法,可选地之后为添加偏移,其中矩阵向量乘法的输入向量为在仅在左侧应用平均的情况下的块左边的经平均边界样本与块上方的原始边界样本的级联,或者在仅在上述一侧上应用平均的情况下的块左边的原始边界样本与块上方的经平均边界样本的级联或者在仅在块的二侧上应用平均的情况下块左边的经平均边界样本与块上方的经平均边界样本的级联。同样,将存在替代方案,诸如完全不使用平均的替代方案。
3.矩阵向量乘法和可选的偏移加法的结果可以可选地为关于原始块中的经次采样样本集的经缩减预测信号。剩余的位置处的预测信号可以通过线性内插从关于经次采样集合的预测信号产生。
步骤2中的矩阵向量乘积的计算应优选地以整数算术来实行。因此,如果x=(x1,…,xn)表示用于矩阵向量乘积的输入,亦即x表示块左边和上方的(经平均)边界样本的级联,则在x当中,在步骤2中计算出的(经缩减)预测信号应仅使用位移位、将偏移向量相加,和与整数相乘来计算。理想地,步骤2中的预测信号将给定为Ax+b,其中b为可以为零的偏移向量且其中A通过某一基于机器学习的训练算法导出。然而,此训练算法通常仅产生以浮点精确度给定的矩阵A=Afloat。因此,面临着在前述意义上指定整数运算使得使用这些整数运算较佳近似表达式Afloatx的问题。此处,重要的是提及,不必选择这些整数运算使得其近似假设向量x的均匀分布的表达式Afloatx但通常考虑到表达式Afloatx将近似的输入向量x为来自从然视频信号的(经平均)边界样本,其中可以预期x的分量xi之间的一些相关性。
图8示出改良ALWIP预测。可以基于通过某一基于机器学习的训练算法导出的矩阵A1100与样本值向量400之间的第矩阵向量乘积来预测预定块的样本。可选地,可以添加偏移b 1110。为了实现此第矩阵向量乘积的整数近似或者定点近似,样本值向量可以进行可逆线性变换403以确定另外的向量402。另一矩阵B 1200与另外的向量402之间的第二矩阵向量乘积可以等于第矩阵向量乘积的结果。
由于另外的向量402的特征,第二矩阵向量乘积可以为通过预定的预测矩阵C 405与另外的向量402加上另一偏移408之间的矩阵向量乘积404近似的整数。另外的向量402和另一偏移408可以由整数或者定点值组成。举例而言,另一偏移的所有分量是相同的。预定的预测矩阵405可以为经量化矩阵或者待量化的矩阵。预定的预测矩阵405与另外的向量402之间的矩阵向量乘积404的结果可以理解为预测向量406。
在下文中,提供关于此整数近似的更多细节。
根据示例的可能解决方案I:减去和加上平均值
可用于以上情境中的表达式Afloatx的整数近似的一个可能并入为通过x的分量的平均值mean(x)(亦即预定值1400)来替换x(亦即样本值向量400)的第i0分量xi0,亦即预定分量1500和从所有其他分量减去此平均值。换言之,界定如图9a中所示出的可逆线性变换403使得另外的向量402的预定分量1500变成a,且另外的向量402的其他分量中的每一个(除了预定分量1500之外)等于样本值向量的对应分量减去a,其中a为预定值1400,其例如为样本值向量400的分量的平均值,诸如算术平均值或者经加权平均值。关于所述输入的此运算是通过可逆变换T403给定,所述可逆变换尤其在x的尺寸n为二的幂的情况下具有明显的整数实施。
由于Afloat=(AfloatT-1)T,如果对输入x进行此变换,则必须发现矩阵向量乘积By的整数近似,其中B=(AfloatT-1)且y=Tx。由于矩阵向量乘积Afloatx表示对矩形块,亦即预定块的预测,且由于x包括所述块的(例如,经平均)边界样本,应预期在x的所有样本值相等的情况下,亦即对于所有ixi=mean(x)的情况下,预测信号Afloatx中的每一样本值应接近于mean(x)或者完全等于mean(x)。这意味着应预期第i0列,亦即对应于B的预定分量的列非常接近或者等于仅由一组成的列。因此,如果M(i0),亦即整数矩阵1300为其第i0列由一组成且所有其他列全为零的矩阵,写为By=Cy+M(i0)y,其中C=B-M(i0),则应预期C的第i0列,亦即预定的预测矩阵405实际上具有较小项或者为零,如图9b中所示。此外,由于x的分量为相关的,可以预期对于每一i≠i0,y的第i分量yi=xi-mean(x)相较于x的第i分量常常具有小得多的绝对值。由于矩阵M(i0)为整数矩阵,因此在给定Cy的整数近似的情况下实现By的整数近似,且通过以上从变量,可以预期通过以合适方式量化C的每一项而产生的量化错误应回应于Afloatx而仅稍微影响By的所得量化的错误。
预定值1400不必为均值mean(x)。表达式Afloatx的本文所描述的整数近似也可以通过预定值1400的以下替代定义实现:
在表达式Afloatx的整数近似的另一可能并入中,x的第i0分量
Figure BDA0003467567470000401
保持不变且从所有其他分量减去同一值
Figure BDA0003467567470000402
亦即,
Figure BDA0003467567470000403
Figure BDA0003467567470000404
对于每一i≠i0。换言之,预定值1400可以为样本值向量400的对应于预定分量1500的分量。
替代地,预定值1400为默认值或者在图像编码而成的数据流中用信号通知的值。
预定值1400等于例如2bitdepth-1。在此情况下,另外的向量402可以由y0=2bitdepth-1和yi=xi-x0界定,其中i>0。
替代地,预定分量1500变为常数减去预定值1400。常数等于例如2bitdepth-1。根据一实施例,另外的向量y 402的预定分量
Figure BDA0003467567470000405
1500等于2bitdepth-1减去样本值向量400对应于预定分量1500的分量
Figure BDA0003467567470000406
且另外的向量402的所有其他分量等于样本值向量400的对应分量减去样本值向量400的对应于预定分量1500的分量。
举例而言,预定值1400与预定块的样本的预测值具有较小偏差是有利的。
根据一实施例,所述装置1000被配置为包括多个可逆线性变换403,所述可逆线性变换中的每一个是与另外的向量402的一个分量相关联。此外,所述装置例如被配置为从样本值向量400的分量当中选择预定分量1500并且使用多个可逆线性变换中的与预定分量1500相关联的可逆线性变换403作为预定的可逆线性变换。这是例如由于第i0行(亦即对应于预定分量的可逆线性变换403的行)的不同位置,此取决于另外的向量中的预定分量的位置。如果例如另外的向量402的第一分量,亦即y1是预定分量,则第io行将替代可逆线性变换的第一行。
如图9b中所示出,预定的预测矩阵405的列412(亦即第i0列)内的预测矩阵C 405的矩阵分量414(其对应于另外的向量402的预定分量1500)例如全为零。在此情况下,所述装置例如被配置为通过计算由预定的预测矩阵C 405舍弃列412产生的经缩减的预测矩阵C'405与由另外的向量402舍弃预定分量1500产生的又一向量410之间的矩阵向量乘积407执行乘法而计算矩阵向量乘积404,如图9c中所示。因此,可以通过较少次乘法计算预测向量406。
如图8、图9b和图9c中所示出,所述装置1000可以被配置为在基于预测向量406预测预定块的样本时针对预测向量406的每一分量计算相应分量与a(亦即预定值1400)的总和。此求和可以由预测向量406与向量409的总和表示,其中向量409的所有分量等于预定值1400,如图8和图9c中所示出。替代地,所述求和可以由预测向量406同整数矩阵M 1300与另外的向量402之间的矩阵向量乘积1310的总和表示,如图9b中所示出,其中整数矩阵1300的矩阵分量为整数矩阵1300的一列,亦即第i0列内的1,所述矩阵对应于另外的向量402的预定分量1500,且所有其他分量例如全为零。
预定的预测矩阵405与整数矩阵1300的求和的结果等于或者近似例如图8中所示出的另一矩阵1200。
换言之,产生于将预定的预测矩阵405的列412(亦即第i0列)内的预定的预测矩阵C 405的每一矩阵分量(其对应于另外的向量402的预定分量1500)与乘以可逆线性变换403的一(亦即矩阵B)求和的矩阵,亦即另一矩阵B 1200,对应于例如机器学习预测矩阵A 1100的经量化版本,如图8、图9a和图9b中所示出。第i0列412内的预定的预测矩阵C 405的每一矩阵分量与一的求和可以对应于预定的预测矩阵405与整数矩阵1300的求和,如图9b中所示出。如图8中所示出,机器学习预测矩阵A 1100可以等于另一矩阵1200乘以可逆线性变换403的结果。这是由于A·x=BT·yT-1。预定的预测矩阵405为例如经量化矩阵、整数矩阵和/或定点矩阵,由此可以实现机器学习预测矩阵A 1100的经量化版本。
仅使用整数运算的矩阵乘法
对于低复杂性实施(就加上和乘以纯量值的复杂性而言,以及就所涉及矩阵的项所需的存储而言),需要仅使用整数算术来执行矩阵乘法404。
为了计算z=Cy的近似,亦即
Figure BDA0003467567470000421
在仅使用整数运算的情况下,根据一实施例,实值Ci,j必须映射到整数值
Figure BDA0003467567470000422
此可以例如通过均一的纯量量化,或者通过考虑值yi之间的特定相关性来进行。整数值表示例如定点数,其可以各自以固定数目的位n_bit来存储,例如n_bit=8。
接着可以如同此伪程序代码中所示出来实行与具有大小m×n的矩阵(亦即预定的预测矩阵405)的矩阵向量乘积404,其中<<,>>是算术二进制左移位运算和右移位运算,且+、-和*仅对整数值进行运算。
(1)
final_offset=1<<(right_shift_result-1);
for i in 0…m-1
{
accumulator=0
for j in 0…n-1
{
accumulator:=accumulator+y[j]*C[i,j]
}
z[i]=(accumulator+final_offset)>>right_shift_result;
}
此处,数组C,亦即预定的预测矩阵405将定点数存储为例如整数。final_offset的最终相加和right_shift_result的右移位运算通过舍位降低精确度以获得输出处所需的定点格式。
为了允许可以由C中的整数表示的实值的增大范围,可以使用两个额外矩阵offseti,j和scalei,j,如图10和图11的实施例中所示,使得以下矩阵向量乘积中yj的每一是数bi,j
Figure BDA0003467567470000423
由下式给定
Figure BDA0003467567470000424
值offseti,j和scalei,j从身为整数值。举例而言,这些整数可以表示定点数,其可以各自以固定数目的位(例如8个位)或者以例如相同数目的位n_bit(其用于存储值
Figure BDA0003467567470000431
)来存储。
换言之,所述装置1000被配置为使用预测参数(例如整数值
Figure BDA0003467567470000432
以及值offseti,j和scalei,j)表示预定的预测矩阵405且通过对另外的向量402的分量以及产生于其的预测参数和中间结果执行乘法和求和而计算矩阵向量乘积404,其中预测参数的绝对值可以由n位定点数表示来表示,其中n等于或者低于14,或者替代地等于或者低于10,或者替代地等于或者低于8。举例而言,另外的向量402的分量乘以预测参数以产生作为中间结果的乘积,其又进行求和或者形成求和的加数。
根据一实施例,预测参数包括权重,其中的每一个是与预测矩阵的对应的矩阵分量相关联。换言之,预定的预测矩阵例如由预测参数替换或者表示。所述权重例如为整数和/或定点值。
根据一实施例,预测参数进一步包括一个或多个缩放因子,例如值scalei,j,所述一个或多个缩放因子中的每一个是与用于缩放权重(例如整数值
Figure BDA0003467567470000433
)的预定的预测矩阵405的一个或多个对应的矩阵分量相关联,所述权重与预定的预测矩阵405的一个或多个对应的矩阵分量相关联。另外或者替代地,预测参数包括一个或多个偏移量,例如值offseti,j,其中的每一个是与使权重(例如整数值
Figure BDA0003467567470000434
)偏移的预定的预测矩阵405的一个或多个对应的矩阵分量相关联,所述权重与预定的预测矩阵405的一个或多个对应的矩阵分量相关联。
为了缩减offseti,j和scalei,j必需的存储量,其值可以经选择成对于索引i、j的特定集合是恒定的。举例而言,其项对于每一列可以为恒定的,且其对于每一行可以为恒定的,或者其对于所有i、j可以为恒定的,如图10中所示出。
举例而言,在一个较佳实施例中,offseti,j和scalei,j对于一个预测模式的矩阵的所有值均为恒定的,如图11中所示。因此,当存在K个预测模式时,其中k=0K-1,仅需要单个值ok和单个值sk来计算用于模式k的预测。
根据一实施例,offseti,j和/或scalei,j对于所有基于矩阵的内预测模式均为恒定的,亦即相同的。另外或者替代地,offseti,j和/或scalei,j对于所有块大小有可能为恒定的,亦即相同的。
在偏移表示ok且缩放表示sk的情况下,(1)中的计算可以被修改成:
(2)
final_offset=0;
for i in 0…n-1
{
final_offset:=final_offset-y[i];
}
final_offset*=final_offset*offset*scale;
final_offset+=1<<(right_shift_result-1);
for i in 0…m-1
{
accumulator=0
for j in 0…n-1
{
accumulator:=accumulator+y[j]*C[i,j]
}
z[i]=(accumulator*scale+final_offset)>>right_shift_result;
}
由该解决方案产生的扩展实施例
以上解决方案意指以下实施例:
1.如第I部分中,第I部分的步骤2中的预测方法,进行以下运算以用于所涉及矩阵向量乘积的整数近似:在(经平均)边界样本x=(x1,…,xn)当中,对于固定i0(其中1≤i0≤n),计算向量y=(y1,…,yn),其中yi=xi-mean(x)(对于i≠i0)且其中
Figure BDA0003467567470000441
且其中mean(x)表示x的均值。向量y接着充当用于矩阵向量乘积Cy的输入(矩阵向量乘积的整数实现),使得来自第I部分的步骤2的(经下采样)预测信号pred给定为pred=Cy+meanpred(x)。在这些式中,meanpred(x)表示等于mean(x)的用于(经下采样)预测信号的域中的每一样本位置的信号。(参见例如图9b)
2.如第I部分中,第I部分的步骤2中的预测方法,进行以下运算以用于所涉及矩阵向量乘积的整数近似:在(经平均)边界样本x=(x1,…,xn)当中,对于固定i0(其中1≤i0≤n),计算向量y=(y1,…,yn-1),其中yi=xi-mean(x)(对于i<i0)且其中yi=xi+1-mean(x)(对于i≥i0)且其中mean(x)表示x的均值。向量y接着充当用于矩阵向量乘积Cy的输入(矩阵向量乘积的整数实现),使得来自第I部分的步骤2的(经下采样)预测信号pred给定为pred=Cy+meanpred(x)。在这些式中,meanpred(x)表示等于mean(x)的用于(经下采样)预测信号的域中的每一样本位置的信号。(参见例如图9c)
3.如第I部分中的预测方法,其中矩阵向量乘积Cy的整数实现通过使用矩阵向量乘积zi=∑jbi,j*yj中的是数
Figure BDA0003467567470000451
给定。(参见例如图10)
4.如第I部分中的预测方法,其中步骤2使用K个矩阵中的一个,使得可以计算出多个预测模式,其每一个使用不同矩阵
Figure BDA0003467567470000452
(其中k=0…K-1),其中矩阵向量乘积Cky的整数实现通过使用矩阵向量乘积zi=∑jbi,j*yj中的是数
Figure BDA0003467567470000453
给定。(参见例如图11)
亦即,根据本申请的实施例,编码器和解码器如下操作以便预测图像10的预定块18,参见图8。为了预测,使用多个参考样本。如上文所概述,本申请的实施例将不限于内编码并且因此,参考样本将不限于相邻样本,亦即图像10中与块18相邻的样本。详细来讲,参考样本将不限于沿着块18之外边缘配置的参考样本,诸如邻接于块之外边缘的样本。然而,此情形当然为本申请的一个实施例。
为了执行预测,从诸如参考样本17a和17c的参考样本形成样本值向量400。上文已经描述可能的形成。所述形成可以涉及平均,进而相较于促成形成的参考样本17缩减样本102的数目或者向量400的分量的数目。如上文所描述,所述形成也可以在某种程度上取决于块18的尺寸或者大小,诸如其宽度和高度。
此向量400应进行仿射或者线性变换以便获得块18的预测。上文已经使用不同命名法。使用最近的一种命名法,旨在通过在执行偏移向量b的求和内借助于矩阵向量乘积将向量400应用于矩阵A而执行预测。偏移向量b是可选的。A或者A和B确定的仿射或者线性变换可以由编码器和解码器确定,或者更确切而言,为基于块18的大小和尺寸的预测起见,来确定所述仿射或者线性变换,如上文已经描述。
然而,为了实现上文所概述的计算效率改良或者就实施而言使预测更有效,所述仿射或者线性变换已经量化,且编码器和解码器或者其预测器使用上文所提及的C和T以便表示和执行线性或者仿射变换,其中以上文所描述的方式应用的C和T表示仿射变换的经量化版本。详细来讲,代替将向量400直接应用于矩阵A,编码器和解码器中的预测器应用向量402,其借助于经由预定的可逆线性变换T将样本值向量400进行映射而产生于所述样本值向量。如此处所使用的变换T可能相同,只要向量400具有相同大小,亦即并不取决于块的尺寸,亦即宽度和高度,或者至少对于不同仿射/线性变换相同。在上文中,向量402已经表示为y。用以执行如通过机器学习所确定的仿射/线性变换的确切矩阵将为B。然而,代替确切地执行B,编码器和解码器中的预测是借助于其近似或者经量化版本来进行。详细来讲,所述表示是经由以上文所概述的方式适当地表示C而进行,其中C+M表示B的经量化版本。
因此,进一步通过计算向量402与以上文所描述的方式在编码器和解码器处适当地表示且存储的预定的预测矩阵C之间的矩阵向量乘积404来进行编码器和解码器中的预测。产生于此矩阵向量乘积的向量406接着用于预测块18的样本104。如上文所描述,为预测起见,向量406的每一分量可以与参数a进行求和,如在408处所指示,以便补偿C的对应的定义。基于向量406导出块18的预测中也可以涉及向量406与偏移向量b的可选的求和。如上文所描述,向量406的每一分量,和因此向量406、在408处所指示的所有a的向量和可选的向量b的求和的每一分量有可能直接对应于块18的样本104且因此指示样本的经预测值。也可以仅以该方式预测块的样本104的子集且通过内插导出块18的剩余样本,诸如108。
如上文所描述,存在用于设定a的不同实施例。举例而言,其可以为向量400的分量的算术平均值。对于该情况,参见图9。可逆线性变换T可以如图9中所指示。i0分别为样本值向量和向量402的预定分量,其由a替代。然而,也如上文指示,存在其他可能性。然而,就C的表示而言,上文也已指示C可以以不同方式体现。举例而言,矩阵向量乘积404可以在其实际计算中以具有较低维度的较小矩阵向量乘积的实际计算结束。详细来讲,如上文所指示,由于C的定义,C的整个第i0列412可以变为0,使得可以通过向量402的经缩减版本来进行乘积404的实际计算,所述经缩减版本通过省略分量
Figure BDA0003467567470000461
亦即通过将此经缩减向量410乘以经缩减矩阵C'而产生于向量402,所述经缩减矩阵通过遗漏第i0列412而产生于C。
C的权重或者C'的权重,亦即此矩阵的分量可以以定点数表示来表示和存储。然而,这些权重414可以又如上文所描述以与不同缩放和/或偏移相关的方式存储。缩放和偏移可以针对整个矩阵C界定,亦即对于矩阵C或者矩阵C'的所有权重414为相等的,或者可以以一方式界定使得对于矩阵C和矩阵C'的相同行的所有权重414或者相同列的所有权重414分别为恒定或者相等的。图10说明就此而言,矩阵向量乘积的计算(亦即乘积的结果)实际上可以稍微不同地执行,亦即例如通过将与缩放的乘法朝向向量402或者404移位,进而缩减必须进一步执行的乘法的数目。图11说明使用用于C或者C'的所有权重414的一个缩放和一个偏移的情况,诸如在以上计算(2)中进行。
根据一实施例,用于预测图像的预定块的本文中所描述的装置可以被配置为使用基于矩阵的内样本预测,其包括以下特征:
所述装置被配置为从多个参考样本17形成样本值向量pTemp[x]400。假设pTemp[x]为2*boundarySize,可以通过以下操作填充pTemp[x]-例如,通过直接复制位于预定块的顶部处的相邻样本(x=0…boundarySize-1的redT[x])之后为位于预定块左边的相邻样本(x=0…boundarySize-1的redL[x])(例如在isTransposed=0的情况下)(或者在经转置处理的情况下反之亦然(例如在isTransposed=1的情况下))或者对以上样本进行次采样或者合并。
导出x=0…inSize-1的输入值p[x],亦即所述装置被配置为从样本值向量pTemp[x]导出另外的向量p[x],样本值向量pTemp[x]通过预定的可逆线性变换(或者更具体来讲,预定可逆仿射线性变换)映射到所述另外的向量,如下:
-如果mipSizeId等于2,则以下适用:
p[x]=pTemp[x+1]-pTemp[0]
-否则(mipSizeId小于2),以下适用:
p[0]=(1<<(BitDepth-1))-pTemp[0]
p[x]=pTemp[x]-pTemp[0],其中x=1…inSize-1
此处,变数mipSizeId指示预定块的大小。亦即,根据本实施例,另外的向量从样本值向量导出所使用的可逆变换取决于预定块的大小。所述相依性可能根据以下给定
mipSizeId boundarySize predSize
0 2 4
1 4 4
2 4 8
其中predSize指示预定块内的经预测样本的数目,且根据inSize=(2*boundarySize)-(mipSizeId==2)?1:0,2*bondarySize指示样本值向量的大小且与inSize(亦即另外的向量的大小)有关。更精确而言,inSize指示实际上参与计算的另外的向量的那些分量的数目。inSize是与用于较小块大小的样本值向量的大小一样大,且一个分量对于较大块大小较小。在前一情况下,可以忽视一个分量,亦即将对应于另外的向量的预定分量的分量,如在随后计算的矩阵向量乘积中,对应的向量分量的贡献无论如何将产生零,且因此,实际上不需要计算。在替代实施例的情况下,可以忽略对块大小的相依性,其中仅不可以避免地使用两个替代方案中的一个,亦即不管块大小如何(对应于mipSizeId小于2的选项,或者对应于mipSizeId等于2的选项)。
换言之,例如,界定预定的可逆线性变换使得另外的向量p的预定分量变为a,而所有其他分量对应于样本值向量的分量减去a,其中例如a=pTemp[0]。在对应于mipSizeId等于2的第一选项的情况下,这是容易地可以见并且进一步考虑另外的向量的以差分方式形成的分量。亦即,在第一选项的情况下,另外的向量实际上为{p[0…inSize];pTemp[0]},其中pTemp[0]为a,且用以产生矩阵向量乘积的矩阵向量乘法的实际上经计算部分,亦即乘法的结果仅限于另外的向量的inSize分量和矩阵的对应列,因为矩阵具有不需要计算的零列。在对应于mipSizeId小于2的其他情况下,选择a=pTemp[0],作为除了p[0]之外的另外的向量的所有分量,亦即另外的向量p的除了预定分量p[0]之外的其他分量p[x](其中x=1inSize-1)中的每一个等于样本值向量pTemp[x]的对应分量减去a,但p[0]经选择为常数减去a。接着计算矩阵向量乘积。所述常数为可以表示值的均值,亦即2x-1(亦即1<<(BitDepth-1)),其中x表示所使用的计算表示的位深度。应注意,如果p[0]反而经选择为pTemp[0],则经计算乘积将仅与使用如上文所指示的p[0](p[0]=(1<<(BitDepth-1))-pTemp[0])计算的一个乘积偏离一常数向量,当基于所述乘积预测内部块时,可以考虑所述常数向量,亦即预测向量。因此,值a为预定值,例如,pTemp[0]。预定值pTemp[0]在此情况下例如为样本值向量pTemp的对应于预定分量p[0]的分量。其可以为预定块顶部或者预定块左边的最接近预定块的左上角的相邻样本。
对于根据predModeIntra的例如指定内预测模式的内样本预测过程,所述装置例如被配置为应用以下步骤,例如执行至少第一步骤:
1.基于矩阵的内预测样本predMip[x][y],其中x=0…predSize-1,y=0…predSize-1导出如下:
-变量modeId经设定成等于predModeIntra。
-x=0…inSize-1,y=0…predSize*predSize-1的权重矩阵mWeight[x][y]是通过使用mipSizeId和modeId调用MIP权重矩阵导出过程而导出以作为输入。
-基于矩阵的内预测样本predMip[x][y],其中x=0…predSize-1,y=0…predSize-1导出如下:
Figure BDA0003467567470000481
Figure BDA0003467567470000482
Figure BDA0003467567470000491
换言之,所述装置被配置为计算另外的向量p[i]或者在mipSizeId等于2的情况下为{p[i];pTemp[0]}与预定的预测矩阵mWeight或者在mipSizeId小于2的情况下为具有对应于p的经省略分量的额外零权重列的预测矩阵mWeight之间的矩阵向量乘积,以便获得预测向量,其在此处已经指派给分布于预定块的内部中的块位置{x,y}的数组以便产生数组predMip[x][y]。预测向量将分别对应于predMip[x][y]的行或者predMip[x][y]的列的级联。
根据一实施例,或者根据不同解释,仅分量
Figure BDA0003467567470000492
Figure BDA0003467567470000493
被理解为预测向量,且所述装置被配置为在基于预测向量预测预定块的样本时针对预测向量的每一分量计算相应分量与a(例如pTemp[0])的总和。
可选地,所述装置可以被配置为在基于预测向量,例如predMip或者
Figure BDA0003467567470000494
预测预定块的样本时另外执行以下步骤。
2.其中x=0…predSize-1、y=0…predSize-1的基于矩阵的内预测样本predMip[x][y]例如经剪裁如下:
predMip[x][y]=Clip1(predMip[x][y])
3.当isTransposed等于TRUE时,predSize×predSize数组predMip[x][y](其中x=0…predSize-1,y=0…predSize-1)例如经转置如下:
predTemp[y][x]=predMip[x][y]
predMip=predTemp
4.经预测样本predSamples[x][y](其中x=0…nTbW-1,y=0…nTbH-1)例如导出如下:
-如果指定变换块宽度的nTbW大于predSize或者指定变换块高度的nTbH大于predSize,则调用作为输入的输入块大小predSize、基于矩阵的内预测样本predMip[x][y](其中x=0…predSize-1,y=0…predSize-1)、变换块宽度nTbW、变换块高度nTbH、顶部参考样本refT[x](其中x=0…nTbW-1)和左边参考样本refL[y](其中y=0…nTbH-1)调用MIP预测上采样过程,且输出是经预测样本数组predSamples。
-否则,predSamples[x][y],其中x=0…nTbW-1,y=0…nTbH–1被设定成等于predMip[x][y]。
换言之,所述装置被配置为基于预测向量predMip来预测预定块的样本predSamples。
8.使用基于块的内预测模式以及其他内预测模式的实施例
所有上述描述均应被视为目前所描述的实施例的可选的实施细节。请注意,在下文中,术语基于块的内预测用于表示可以由上文ALWIP体现或者等于上文ALWIP所指示的那些内预测模式的内预测模式。
图12示出用于使用内预测解码图像10的预定块18的装置3000的实施例。装置3000被配置为从数据流12导出指示是否使用包括DC内预测模式506和角度预测模式500的内预测模式的第一集合508中的一个预测预定块18的集合选择性语法元素522。数据流12可以包括指示装置3000的功能的不同语法元素和/或索引。
如果集合选择性语法元素522指示使用内预测模式的第一集合508中的一个预测预定块18,则装置3000被配置为基于在预测与预定块18相邻的相邻块524、526时使用的内预测模式3050形成最可能内预测模式的列表528。换言之,基于用于预测相邻块524和526的内预测模式3050将内预测模式的第一集合508中的内预测模式506、500定位/配置于最可能内预测模式的列表528中。举例而言,装置3000被配置为保存用于已预测块的预测模式并从所保存预测模式当中获得用于相邻块524和526的预测模式3050或者分析相邻块524和526以获得用于相邻块524和526的预测模式3050。根据一实施例,装置3000被配置为搜寻与用于内预测模式的第一集合508中的相邻块524和526的预测模式3050相同或者类似的内预测模式并形成来自这些相同或者类似的内预测模式的最可能内预测模式的列表528。
形成最可能内预测模式的列表528,使得在专门通过角度内预测模式500中的任一个预测相邻块524和526的情况下,最可能内预测模式的列表528不含DC内预测模式506。因此,DC内预测模式506的可用性仅取决于预定块18的相邻块524和526而非图像10的其他块。如果使用角度内预测模式500预测至少一个相邻块524或者526,则DC内预测模式506例如不定位/配置于最可能内预测模式的列表528中。如果使用角度内预测模式500预测两个相邻块524和526,则最可能内预测模式的列表528也可以不含DC内预测模式506。
此外,所述装置被配置为从数据流导出MPM列表索引534,如果集合选择性语法元素522指示使用内预测模式的第一集合508中的一个预测预定块18。MPM列表索引534在最可能内预测模式的列表528中指向预定的内预测模式。装置3000被配置为使用预定的内预测模式3100对预定块18进行内预测。
如果集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18,则装置3000被配置为从数据流12导出指示来自基于矩阵的内预测模式,亦即基于块的内预测模式510的第二集合520的预定的基于矩阵的内预测模式,亦即预定的基于块的内预测模式3200的另外的索引540。换言之,基于另外的索引540在基于块的内预测模式的第二集合520当中选择预定的基于块的内预测模式3200以用于预测预定块18。如果集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18,则装置3000被配置为计算从预定块18的邻域中的参考样本17导出的向量514和与预定的基于矩阵的内预测模式3200相关联的预定的预测矩阵516之间的矩阵向量乘积512以便获得预测向量518,并基于预测向量518预测预定块18的样本。
数据流12基于集合选择性语法元素522包括MPM列表索引534或者另外的索引540。
装置3000可以包括如相对于图13所描述的特征和或者功能性。
由此,在下文中相对于图13所描述的实施例涉及支持内预测以用于解码/编码预定块18的解码器和编码器,其中支持不同内预测模式。使用与预定块18相邻的参考样本17所根据的角度内预测模式500用以填充预定块18以便获得用于预定块18的内预测信号。详细来讲,沿着预定块18的边界,诸如沿着预定块18的上部边缘和左侧边缘配置的参考样本17表示图像内容,其沿着预定方向502外插或者复制至预定块18的内部中。在外插或者复制之前,由相邻样本17表示的图像内容可以进行内插滤波或者换言之可以借助于内插滤波从相邻样本17导出。角度内预测模式500彼此不同的处在于内预测方向502。每一角度内预测模式500可以具有与其相关联的索引,其中索引与角度内预测模式500的相关性可以使得方向500在根据相关联模式索引排序角度内预测模式500时单调地顺时针或者逆时针旋转。
也可以存在例如非角度内预测模式504,图13说明可选地含于集合508中的平面内预测模式,根据所述平面内预测模式基于相邻样本17导出由水平斜率、垂直斜率和偏移界定的二维线性函数,通过此线性函数界定预定块18的预测样本值。基于相邻样本17导出水平斜率、垂直斜率和偏移。根据一实施例,内预测模式的第一集合508包括平面内预测模式504。
含于集合508中的特定非角度内预测模式、DC模式说明于506处。此处,基于相邻样本17导出一个值,准DC值且这一个DC值归因于预定块18的所有样本以便获得内预测信号。尽管示出非内预测模式的两个示例,但可以仅存在一个示例或者存在多于两个示例。
内预测模式500、504和506形成编码器和解码器支持的内预测模式的集合508,其中在速率/失真优化意义上与通常使用参考符号510指示的基于块的内预测模式(上文使用缩写ALWIP论述其示例)竞争。如上文所描述,根据这些基于块的内预测模式510,执行一方面从相邻样本17导出的向量514与另一方面预定的预测矩阵516之间的矩阵向量乘积520。乘法512的结果为用于预测预定块18的样本的预测向量518。基于块的内预测模式510彼此不同的处在于与相应模式相关联的预测矩阵516。
因此,简言的,根据本文所描述的实施例的编码器和解码器包括内预测模式的集合508,亦即内预测模式的第一集合和基于块的内预测模式的集合520,亦即基于矩阵的内预测模式的第二集合,且所述集合彼此竞争。
根据本申请的实施例,预定块18按以下方式使用内预测编码/解码。详细来讲,首先,集合选择使用内预测模式的集合508中的任一个抑或者基于块的内预测模式的集合520中的模式中的任一个预测预定块18的语法元素522。如果集合选定语法元素指示使用集合508,亦即内预测模式的第一集合中的任一模式预测预定块18,则基于已经预测与块18相邻的在524和526处例示性地指示的相邻块所使用的内预测模式在解码器和编码器处解释/形成来自集合508的最可能候选者的列表528。可以以预定方式,诸如通过确定与块18的某些相邻样本(诸如块18的左上样本顶部的样本)和含有刚刚提及的转角样本左侧的样本的块526重迭的那些相邻块相对于预定块18的位置确定相邻块524和526。从然地,此仅为示例。这同样适用于用于模式预测的相邻块的数目,其对于所有实施例并不限于两个。可以使用多于两个或者仅一个相邻块。如果这些块524和526中的任一个丢失,则默认内预测模式可以默认地用作丢失相邻块的内预测模式的取代物。如果块524和526中的任一个已经使用间预测模式,诸如通过经运动补偿的预测编码/解码,则这同样可以适用。
来自集合508的模式的列表,亦即最可能内预测模式的列表528的构造如下。列表528的列表长度,亦即其中的最可能模式的数目可以默认地固定。所述长度可以如图13中所说明为四个,或者可以与其不同,诸如五个或者六个。后一情况适用于下文中所描述的特定示例。稍后将描述的数据流中的索引可以指示来自待用于预定块18的列表528的一个模式。沿着列表次序或者顺位530执行编索引,其中例如长度可以变的列表索引经编码使得索引的长度沿着次序530单调递增。因此,首先,仅通过来自集合508的最可能模式填充列表528,且沿着次序530将较可能模式相对于适合于块18的机率较低的模式置放在上游为值得的。基于用于块524和526,亦即与预定块18相邻的相邻块的模式导出列表528的模式。如果块524和526中的任一个已经使用来自集合520的基于块的模式510进行内预测,则使用前文描述的从此类“ALWIP”或者基于块的模式510至集合508内的模式(比如非ALWIP模式)的映射。后一映射可以例如将基于块的模式510中的大多数(亦即,多于一半)映射到DC模式506(或者DC模式506或者平面模式504中的任一个)。
根据一实施例,以独立于在预测相邻块时使用的内预测模式的方式以平面内预测模式504填充最可能内预测模式的列表528。因此,举例而言,取决于用于相邻块524和526的预测的内预测模式,仅DC内预测模式506和角度内预测模式500填充在列表528中。举例而言,平面内预测模式504独立于在预测相邻块524和526时使用的内预测模式定位于最可能内预测模式的列表528中的第一位置处。
以下文中更详细地例示性地说明的方式,以一方式进行最可能内预测模式的列表528的列表构造,使得如果已经专门通过任一角度内预测模式500预测相邻块524和526,则列表528不含DC内预测模式506。如果通过任一角度内预测模式500预测一个相邻块524或者526和/或如果通过任一角度内预测模式500预测两个相邻块524和526,则DC内预测模式506并不在最可能内预测模式的列表528中。根据下文中阐明的实施例,仅在以下情形对于所有相邻块524和526均成立的情况下以DC模式506填充例如列表528:将已经使用非角度内预测模式504和506中的任一个编码或者已经使用任一基于块的内预测模式510(其借助于前文提及的从基于块的内预测模式510至集合508内的模式的映射)预测的块映射到非角度内预测模式504和506中的任一个。仅在所述情况下,DC内预测模式506定位在列表528中。在这种情况下,所述DC内预测模式可以按次序530被定位在任一角度内预测模式500之前,如从后续示例可以见。
换言之,举例而言,仅在以下情况下以DC内预测模式506填充最可能内预测模式的列表528:对于相邻块524和526中的每一个,将使用包括DC内预测模式506的第一集合508内的至少一个非角度内预测模式504和506中的任一个预测或者使用基于块的内预测模式510中的任一个(其借助于从基于块的内预测模式510的第二集合520至第一集合508内的内预测模式的映射用于最可能内预测模式的列表528的形成)预测的相应相邻块映射到至少一个非角度间预测模式500中的任一个。
因此,恢复关于预定块18如何被编码成数据流12的描述,如果集合选择性语法元素522指示通过来自第一集合508的任一模式编码预定块18,则数据流12可选地含有MPM语法元素532,其指示待用于预定块18的内预测模式是否在列表528内,且如果为是,则数据流12包括在列表528中通过沿着次序530对模式编索引而指示来自列表528的待用于预定块18的模式,亦即预定的内预测模式的MPM列表索引534。然而,如果来自集合508的模式如由MPM语法元素532所指示并不在列表528内,则数据流12针对块18包括另一语法元素536,其指示来自集合508的哪一模式(亦即预定的内预测模式)将用于块18。另一语法元素536可以以通过仅在来自集合508的那些模式(其并不含于列表528中)的间进行区分的方式指示所述模式。
换言之,举例而言,如果集合选择性语法元素522指示使用内预测模式的第一集合508中的一个预测预定块18,则装置3000被配置为从数据流导出指示内预测模式的第一集合508中的预定的内预测模式是否在最可能内预测模式的列表528内的MPM语法元素532。如果MPM语法元素532指示内预测模式的第一集合508中的预定的内预测模式在最可能内预测模式的列表528内,则装置3000例如被配置为基于在预测与预定块100相邻的相邻块524、526时使用的内预测模式执行最可能内预测模式的列表528的形成并执行指向最可能内预测模式的列表528中的预定的内预测模式的MPM列表索引534从数据流12的导出。如果来自数据流12的MPM语法元素532指示内预测模式的第一集合508中的预定的内预测模式并不在最可能内预测模式的列表528内,则装置3000被配置为从数据流导出指示来自内预测模式的第一集合的预定的内预测模式的另外的列表索引536。因此,基于MPM语法元素532,数据流12包括MPM列表索引534或者另外的列表索引536以用于预测预定块18。
通过移除列表528包括DC内预测模式506的情形,达成以下优点。详细来讲,本申请的各发明人发现,由用于编码/解码应使用集合508中的内预测模式中的任一个的预定块18的来自集合508的DC内预测模式506(如由语法元素522,亦即集合选择性语法元素指示)“占用”列表528的宝贵的列表位置将不利地影响编码效率,因为来自集合508的此DC内预测模式506无论如何均会与基于块的内预测模式510竞争。因此,由来自集合508的此DC内预测模式506“占用”列表528的列表位置将导致出现以下情形的可能性提高:最后将用于预定块18的内预测模式,亦即预定的内预测模式并不在列表528内,使得语法元素536,亦即另外的列表索引需要在数据流12中传输。
详细来讲,由于语法元素522已经针对块18指示应使用集合508内的模式中的任一个抑或者集合520中的基于块的模式510中的任一个预测所述块,似乎如果语法元素522指示集合508内的模式对于块18较佳,且因此基于块的模式510并不用于块18,则来自集合508的DC预测模式506可以适合于块18的可能性如此的低以致于DC预测模式在列表528中的出现应限于用于相邻块524和526的模式的群集,亦即上文阐明的群集的极其受限集合。
在另一情况下,亦即在集合选择性语法元素522指示使用基于块的内预测模式510中的任一个预测预定块18的情况下,将块18编码成数据流12和从其的解码可以以上文阐明的方式进行。为此目的,可以使用编索引以便为从来自集合520(亦即基于块的内预测模式的第二集合)的基于块的内预测模式510选定的一个内预测模式编索引或者指示关于将使用所述基于块的内预测模式中的哪一个。另外的MPM语法元素538可以指示是否通过索引540,亦即通过另外的MPM列表索引(其指示来自最可能的基于块的内预测模式510的列表542的待用于块18的基于块的内预测模式510,亦即通过沿着列表次序544编索引)进行编索引,或者待用于块18的基于块的内预测模式510是否由另一语法元素546,亦即由又一列表索引(其指示来自集合520的基于块的内预测模式510)指示,其中后一语法元素546可以例如仅区分集合520内列表542内尚未含有的那些模式510。可以基于已经预测块524和526所使用的模式进行列表542的列表构造。如果块524和526中的任一个由于在图像外部或者由于经间预测而不可用,则默认内预测模式,诸如来自集合508的一个内预测模式可以替代地使用。对于每一块524和526,在已使用来自集合508而非集合520的模式进行内预测的情况下,前文描述的从集合508中的模式至来自集合520的模式的映射用于获得用于相应块,亦即预定块18的内预测模式510,亦即预定的基于块的内预测模式,且基于针对块524和526产生的基于块的内预测模式,解释列表542。
根据一实施例,如果集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18,则装置3000被配置为从数据流12导出指示基于块的内预测模式510的第二集合520中的预定的基于块的内预测模式是否在最可能的基于块的内预测模式的列表542内的另外的MPM语法元素538。如果另外的MPM语法元素538指示基于块的内预测模式510的第二集合520中的预定的基于块的内预测模式在最可能的基于块的内预测模式的列表542内,则装置3000例如被配置为基于在预测与预定块18相邻的相邻块524、526时使用的内预测模式形成最可能的基于块的内预测模式的列表542,且从数据流12导出在最可能的基于块的内预测模式的列表542中指向预定的基于块的内预测模式的另外的MPM列表索引540。如果另外的MPM语法元素538指示基于块的内预测模式的第二集合520中的预定的基于块的内预测模式并不在最可能的基于块的内预测模式的列表542内,则装置3000被配置为从数据流12导出指示来自基于块的内预测模式的第二集合520的预定的基于块的内预测模式的又一列表索引546。因此,基于另外的MPM语法元素538,数据流12包括另外的MPM列表索引540或者又一列表索引546以用于预测预定块18。
尽管另外的MPM语法元素538、另外的MPM列表索引540和又一列表索引546在图13中在数据流12中表示为平行于MPM语法元素532、MPM列表索引534和另外的列表索引536,但显而易见,数据流12包括另外的MPM语法元素538和与另外的MPM语法元素538相关联的索引,例如另外的MPM列表索引540或者又一列表索引546或者MPM语法元素532和与MPM语法元素532相关联的索引,例如MPM列表索引534或者另外的列表索引536。数据流12包括这些语法元素和索引中的哪些例如取决于集合选择性语法元素522。
写入为伪程序代码的数据流12的语法元素部分的示例可以如下,其中参考符号指示关于哪些语法元素对应于之前所论述的语法元素。
Figure BDA0003467567470000561
Figure BDA0003467567470000571
Figure BDA0003467567470000581
Figure BDA0003467567470000591
Figure BDA0003467567470000601
Figure BDA0003467567470000611
Figure BDA0003467567470000621
Figure BDA0003467567470000631
Figure BDA0003467567470000641
Figure BDA0003467567470000651
列表528的列表构造可以定义如下:其中在对应块524或者526已经使用基于块的内预测模式510中的任一个进行内预测的情况下,candIntraPredModeA/B指示已预测块524和526中的任一个所使用的内预测模式,诸如A针对块524且B针对块526;或者指示集合508当中将内预测模式映射到哪一模式。INTRA_DC用于指示模式506,且角度模式500通过INTRA_ANGULAR#指示,其中编号(#)如上文例示性地指示对角度模式进行排序,亦即以此方式使得角度方向502随着数目增大单调递减或者单调递增。集合508内模式当中的排序可以如下表中所界定,其中INTRA_PLANAR指示模式504。
应注意,在上文示例中,索引534实际上分布于语法元素534'和534”上:语法元素534'按次序530特定针对列表528的第一位置,根据此示例,INTRA_PLANAR模式504不可以避免地定位于所述位置处。语法元素534”指向列表528之后续位置中的任一个,如所描述,DC模式506仅在所描述特殊情形下包括于所述位置处。
另外,在上文示例中,在语法元素522指示使用集合508内模式当中的任何模式的情况下,其他语法元素包括于数据流12中,所述其他语法元素在某种程度上参数化集合508内的内预测模式。例如,语法元素600参数化或者改变定位有参考样本17的区域,集合508中的模式基于所述区域诸如在朝向块18外圆周的距离方面对块18的内部进行内预测。另外或者替代地,语法元素602参数化或者改变集合508中的模式是否使用所述参考样本17来全局地或者在块内对块18的内部进行内预测,或者是否按块18被细分成的各段或者各部分进行内预测,所述段或者部分依序经内预测使得针对一个部分编码而成数据流12的预测残差可用于补充新参考样本以用于对后一部分进行内预测。受语法元素控制之后一编码选项仅在语法元素600具有对应于例如所述参考样本17所处的区域邻接于块18的预定状态时可用(且对应语法元素可以仅存在于数据流中)。所述部分可以通过沿着预定方向,诸如水平地(由此导致部分与块18一样高)或者垂直地(由此导致部分与块18一样宽)细分块而界定。如果分割经用信号通知为作用中,其控制关于使用哪一分裂方向,则语法元素604可以存在于数据流中。如可以看出,情况可以为列表528中为INTRA_PLANAR模式保留的位置仅在通过刚刚提及的参数化语法元素对模式进行特定参数化的情况下,诸如仅在语法元素600具有对应于例如所述参考样本17所处的区域邻接于块18的预定状态时和/或逐部分的内预测模式如语法元素602所用信号通知并不在作用中时才可用。
表中所示而上文未特定提及的所有语法元素均为可选的且在本文中未进一步论述。
-如果candIntraPredModeB等于candIntraPredModeA且candIntraPredModeA大于INTRA_DC,则如下推导出candModeList[x](其中x=04):
candModeList[0]=candIntraPredModeA
candModeList[1]=2+((candIntraPredModeA+61)%64)
candModeList[2]=2+((candIntraPredModeA-1)%64)
candModeList[3]=2+((candIntraPredModeA +60)%64)
candModeList[4]=2+(candIntraPredModeA%64)
-否则,如果candIntraPredModeB不等于candIntraPredModeA且candIntraPredModeA或者candIntraPredModeB大于INTRA_DC,则以下适用:
-如下推导出变量minAB和maxAB:
minAB=Min(candIntraPredModeA,candIntraPredModeB)
maxAB=Max(candIntraPredModeA,candIntraPredModeB)
-如果candIntraPredModeA和candIntraPredModeB均大于INTRA_DC,则如下推导出candModeList[x](其中x=04):
candModeList[0]=candIntraPredModeA
candModeList[1]=candIntraPredModeB
-如果maxAB-minAB等于1,则以下适用:
candModeList[2]=2+((minAB+61)%64)
candModeList[3]=2+((maxAB-1)%64)
candModeList[4]=2+((minAB+60)%64)
-否则,如果maxAB-minAB大于或者等于62,则以下适用:
candModeList[2]=2+((minAB-1)%64)
candModeList[3]=2+((maxAB+61)%64)
candModeList[4]=2+(minAB%64)
-否则,如果maxAB-minAB等于2,则以下适用:
candModeList[2]=2+((minAB-1)%64)
candModeList[3]=2+((minAB+61)%64)
candModeList[4]=2+((maxAB-1)%64)
-否则,以下适用:
candModeList[2]=2+((minAB+61)%64)
candModeList[3]=2+((minAB-1)%64)(8-36)
candModeList[4]=2+(((maxAB+61))%64)
-否则(candIntraPredModeA或者candIntraPredModeB大于INTRA_DC),如下推导出candModeList[x](其中x=04):
candModeList[0]=maxAB
candModeList[1]=2+((maxAB+61)%64)
candModeList[2]=2+((maxAB-1)%64)(8-41)
candModeList[3]=2+((maxAB+60)%64)
candModeList[4]=2+(maxAB%64)
-否则,以下适用:
candModeList[0]=INTRA_DC
candModeList[1]=INTRA_ANGULAR50(
candModeList[2]=INTRA_ANGULAR18
candModeList[3]=INTRA_ANGULAR46
candModeList[4]=INTRA_ANGULAR54
内预测模式 相关联的名称
0 INTRA_PLANAR
1 INTRA_DC
2…66 INTRA_ANGULAR2…INTRA_ANGULAR66
在集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18的情况下,用于解码预定块18的装置和/或用于编码预定块18的装置可以包括以下特征中的一个或多个。
根据一实施例,所述装置被配置为形成样本值向量,例如来自多个参考样本17的如相对于图6至图9的实施例中的一个所描述的样本值向量400,且从所述样本值向量导出向量514,使得所述样本值向量通过预定的可逆线性变换映射到向量514。在此情况下,向量514可以被理解为另外的向量。举例而言,如相对于图8至图11的实施例中的一个针对另外的向量402所描述而确定和/或界定向量514。
根据一实施例,所述装置被配置为通过针对样本值向量的每一分量采用多个参考样本中的一个参考样本作为所述样本值向量的相应分量和/或平均所述样本值向量的两个或者更多个分量以获得所述样本值向量的相应分量而从多个参考样本17形成样本值向量。
举例而言,多个参考样本17沿着预定块18之外边缘配置于图像内。
举例而言,可逆线性变换被限定以使得向量514,例如另外的向量的预定分量变为a,且除了所述预定分量之外,向量514的其他分量中的每一个等于样本值向量的对应分量减去a。举例而言,值a为预定值。
根据一实施例,预定值为样本值向量的分量的平均值(诸如算术平均值或者经加权平均值)、默认值、以图像编码而成的数据流用信号通知的值和样本值向量的对应于预定分量的分量中的一个。
举例而言,可逆线性变换被限定以使得向量514,例如另外的向量的预定分量变为a,且除了所述预定分量之外,向量514的其他分量中的每一个等于样本值向量的对应分量减去a,其中a为样本值向量的分量的算术平均值。
举例而言,可逆线性变换被限定以使得向量514,例如另外的向量的预定分量变为a,且除了所述预定分量之外,向量514的其他分量中的每一个等于样本值向量的对应分量减去a,其中a为样本值向量的对应于预定分量的分量。举例而言,所述装置被配置为包括多个可逆线性变换,其每一个与向量514的一个分量相关联;在样本值向量的分量当中选择预定分量;以及使用多个可逆线性变换当中与预定分量相关联的可逆线性变换作为预定的可逆线性变换。
根据一实施例,预测矩阵516中对应于向量514,例如另外的向量的预定分量的一列内预测矩阵516的矩阵分量全为零。所述装置被配置为通过计算由预测矩阵516通过舍弃所述列产生的经缩减的预测矩阵与由向量514通过舍弃所述预定分量产生的又一向量之间的矩阵向量乘积512执行乘法而计算矩阵向量乘积512。
根据一实施例,所述装置被配置为在基于预测向量518预测预定块18的样本时针对预测向量518的每一分量计算相应分量与a的总和。
由求和预测矩阵516中对应于向量514,例如另外的向量的预定分量的一列内预测矩阵516的每一矩阵分量与一产生的矩阵(亦即,图8中的矩阵B)乘以可逆线性变换对应于例如机器学习预测矩阵的经量化版本。
根据一实施例,所述装置被配置为使用定点算术运算计算矩阵向量乘积512。
根据一实施例,所述装置被配置为在不使用浮点算术运算的情况下计算矩阵向量乘积512。
根据一实施例,所述装置被配置为存储预测矩阵516的定点数表示。
根据一实施例,所述装置被配置为使用预测参数表示预测矩阵516且通过对向量514,例如另外的向量的分量和预测参数以及从其产生的中间结果执行乘法和求和而计算矩阵向量乘积512,其中预测参数的绝对值可以通过n位定点数表示来表示,其中n等于或者低于14,或者替代地等于或者低于10,或者替代地等于或者低于8。此可以类似地或者如图10或者图11中所描述而执行。
举例而言,预测参数包括权重,其每一个与预测矩阵516的对应矩阵分量相关联。
举例而言,预测参数进一步包括一个或多个缩放因子,其每一个与预测矩阵516的一个或多个对应矩阵分量相关联以用于缩放与预测矩阵516的所述一个或多个对应矩阵分量相关联的权重;和/或一个或多个偏移量,其每一个与预测矩阵516的一个或多个对应矩阵分量相关联以用于使与预测矩阵516的所述一个或多个对应矩阵分量相关联的权重偏移。
根据一实施例,所述装置被配置为在基于预测向量518预测预定块18的样本时使用内插以基于预测向量518来计算预定块18的至少一个样本位置,所述预测向量的每一分量是与预定块18内的对应位置相关联。
图14示出用于使用内预测编码图像10的预定块18的装置6000,被配置为用信号通知数据流12中指示是否使用包括DC内预测模式506和角度预测模式500的内预测模式的第一集合508中的一个来预测预定块18的集合选择性语法元素522。如果集合选择性语法元素522指示使用内预测模式的第一集合508中的一个预测预定块18,则装置6000被配置为基于预测与预定块18相邻的相邻块524、526使用的内预测模式形成最可能内预测模式的列表528;用信号通知数据流12中在最可能内预测模式的列表528中指向预定的内预测模式3100的MPM列表索引534;以及使用预定的内预测模式3100对预定块18进行内预测。如果集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18,则装置6000被配置为通过计算从预定块18的邻域中的参考样本17导出的向量514和与预定的基于矩阵的内预测模式3200相关联的预定的预测矩阵516之间的矩阵向量乘积512以便获得预测向量518并基于预测向量518预测预定块18的样本而用信号通知数据流12中指示来自基于矩阵的内预测模式510的第二集合520的预定的基于矩阵的内预测模式3200的另外的索引540。
基于预测与预定块18相邻的相邻块524、526使用的内预测模式形成最可能内预测模式的列表528,使得在通过角度内预测模式500中的任一个预测相邻块524、526中的至少一个的情况下,最可能内预测模式的列表不含DC内预测模式506。
举例而言,内预测模式的第一集合508进一步包括平面内预测模式504。
根据一实施例,装置6000可以包括如相对于图12和/或图13中的装置3000所描述的类似特征和或者功能性。同样,装置3000可以包括如相对于图14中的装置6000所描述的类似特征和或者功能性。
如果集合选择性语法元素522指示使用内预测模式的第一集合508中的一个预测预定块18,则装置6000例如被配置为用信号通知数据流12中指示内预测模式的第一集合508中的预定的内预测模式3100是否在最可能内预测模式的列表528内的MPM语法元素532。如果MPM语法元素532指示内预测模式的第一集合508中的预定的内预测模式在最可能内预测模式的列表528内,则装置6000例如被配置为基于预测与预定块18相邻的相邻块524、526所使用的内预测模式执行最可能内预测模式的列表528的形成并执行数据流12中指向最可能内预测模式的列表528中的预定的内预测模式3100的MPM列表索引534的用信号通知。如果数据流12中的MPM语法元素532指示内预测模式的第一集合508中的预定的内预测模式3100并不在最可能内预测模式的列表528内,则装置6000例如被配置为用信号通知数据流12中指示来自内预测模式的第一集合508的预定的内预测模式3100的另外的列表索引536。
如果集合选择性语法元素522指示将不使用内预测模式的第一集合508中的一个预测预定块18,则装置6000例如被配置为用信号通知数据流12中指示基于块的内预测模式的第二集合520中的预定的基于块的内预测模式3200是否在最可能的基于块的内预测模式的列表542(亦即最可能的基于块的内预测模式的第二列表,例如基于块的内预测模式的第二集合520中的最可能的基于块的内预测模式的列表542)内的另外的MPM语法元素538。如果另外的MPM语法元素538指示基于块的内预测模式的第二集合520中的预定的基于块的内预测模式3200在最可能的基于块的内预测模式的列表542内,则装置6000例如被配置为基于预测与预定块18相邻的相邻块524、526所使用的内预测模式3050形成最可能的基于块的内预测模式的列表542并用信号通知数据流12中在最可能的基于块的内预测模式的列表542中指向预定的基于块的内预测模式3200的另外的MPM列表索引540。如果另外的MPM语法元素538指示基于块的内预测模式的第二集合520中的预定的基于块的内预测模式3200并不在最可能的基于块的内预测模式的列表542内,则装置6000例如被配置为用信号通知数据流12中指示来自基于块的内预测模式的第二集合520的预定的基于块的内预测模式3200的又一列表索引546。
根据一实施例,装置6000被配置为执行最可能内预测模式的列表的形成,例如基于预测与预定块18相邻的相邻块524、526所使用的内预测模式形成内预测模式的第一集合508中的最可能内预测模式的列表528,使得仅在以下情况下以DC内预测模式506填充所述列表528:对于相邻块524和526中的每一个,将使用包括DC内预测模式506的第一集合508内的至少一个非角度内预测模式504和/或506中的任一个预测或者使用基于块的内预测模式510中的任一个(其借助于从基于块的内预测模式的第二集合520至第一集合508内的内预测模式的映射用于所述最可能内预测模式的列表528的形成)预测的相应相邻块映射到至少一个非角度内预测模式504和/或506中的任一个。
根据一实施例,装置6000被配置为执行基于预测与预定块18相邻的相邻块524、526所使用的内预测模式形成最可能内预测模式的列表528,使得如果对于相邻块524和526中的每一个,将使用包括DC内预测模式506的第一集合508内的至少一个非角度内预测模式504和/或506中的任一个预测或者使用基于块的内预测模式510中的任一个(其借助于从基于块的内预测模式的第二集合520至第一集合508内的内预测模式的映射用于所述最可能内预测模式的列表528的形成)预测的相应相邻块映射到至少一个非角度内预测模式504和/或506中的任一个。DC内预测模式506被定位在最可能内预测模式的列表528中的任一角度内预测模式500之前。
根据一实施例,装置6000被配置为执行基于预测与预定块18相邻的相邻块524、526所使用的内预测模式形成最可能内预测模式的列表528,使得以独立于预测相邻块524、526所使用的内预测模式的方式以平面内预测模式504填充所述列表528。
根据一实施例,装置6000被配置为执行基于预测与预定块18相邻的相邻块524、526所使用的内预测模式形成最可能内预测模式的列表528,使得平面内预测模式504独立于预测相邻块524、526所使用的内预测模式定位于所述最可能内预测模式的列表528中的第一位置处。
图15示出用于使用内预测对图像的预定块进行解码18的方法4000的方块图,所述方法包括从数据流导出指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个预测预定块的集合选择性语法元素(4100)。如果集合选择性语法元素指示使用内预测模式的第一集合中的一个预测预定块(4150),则方法4000包括基于预测与预定块相邻的相邻块所使用的内预测模式形成最可能内预测模式的列表(4200);从数据流导出在最可能内预测模式的列表中指向预定的内预测模式的MPM列表索引(4300);以及使用所述预定的内预测模式对预定块进行内预测(4400)。如果集合选择性语法元素指示将不使用内预测模式的第一集合中的一个预测预定块(4155),则方法4000包括通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量(4350)并基于所述预测向量预测预定块的样本(4450)而从数据流导出指示来自基于矩阵的内预测模式的第二集合的预定的基于矩阵的内预测模式的另外的索引(4250)。基于预测与预定块相邻的相邻块所使用的内预测模式形成最可能内预测模式的列表(4200),使得在通过角度内预测模式中的任一个预测相邻块中的至少一个的情况下,最可能内预测模式的列表不含DC内预测模式。
图16示出用于使用内预测编码图像的预定块的方法5000的方块图,所述方法包括在数据流中用信号通知指示是否使用包括DC内预测模式和角度预测模式的内预测模式的第一集合中的一个预测预定块的集合选择性语法元素(5100)。如果所述集合选择性语法元素指示使用内预测模式的第一集合中的一个预测预定块(5150),则方法5000包括基于预测与预定块相邻的相邻块所使用的内预测模式形成最可能内预测模式的列表(5200);在数据流中用信号通知在最可能内预测模式的列表中指向预定的内预测模式的MPM列表索引(5300);以及使用所述预定的内预测模式对预定块进行内预测(5400)。如果所述集合选择性语法元素指示将不使用内预测模式的第一集合中的一个预测预定块(5155),则方法5000包括通过计算从预定块的邻域中的参考样本导出的向量和与预定的基于矩阵的内预测模式相关联的预定的预测矩阵之间的矩阵向量乘积以便获得预测向量(5350)并基于所述预测向量预测预定块的样本(5450)而在数据流中用信号通知指示来自基于矩阵的内预测模式的第二集合的预定的基于矩阵的内预测模式的另外的索引(5250)。基于预测与预定块相邻的相邻块所使用的内预测模式形成最可能内预测模式的列表(5200),使得在通过角度内预测模式中的任一个预测相邻块中的至少一个的情况下,最可能内预测模式的列表不含DC内预测模式。
参考文献
[1]P.Helle et al.,“Non-linear weighted intra prediction”,JVET-L0199,Macao,China,October 2018.
[2]F.Bossen,J.Boyce,K.Suehring,X.Li,V.Seregin,“JVET common testconditions and software reference configurations for SDR video”,JVET-K1010,Ljubljana,SI,July 2018.
进一步的实施例和示例
通常,示例可以实施为具有程序指令的计算机程序产品,当计算机程序产品运行于计算机上时,程序指令操作性地用于执行所述方法中的一个。程序指令可以例如存储于机器可读介质上。
其他示例包括用于执行本文中所描述的方法中的一个、存储于机器可读载体上的计算机程序。
换言之,方法的示例因此为计算机程序,其具有用于在计算机程序于计算机上运行时执行本文中所描述的方法中的一个的程序指令。
方法的另一示例因此为数据载体介质(或者数字存储介质,或者计算机可读介质),其包括、上面记录有用于执行本文中所描述的方法中的一个的计算机程序。数据载体介质、数字存储介质或者记录介质为有形和/或非暂时性的,而非无形和暂时性的信号。
因此,方法的另一示例为表示用于执行本文中所描述的方法中的一个的计算机程序的数据流或者信号序列。所述数据流或者信号序列可以例如经由数据通信连接,例如经由因特网来传送。
另一示例包括处理构件,例如计算机或者可编程逻辑器件,其执行本文中所描述的方法中的一个。
另一示例包括计算机,所述计算机具有安装于其上的用于执行本文中所描述的方法中的一个的计算机程序。
另一示例包括将用于执行本文中所描述的方法中的一个的计算机程序传送(例如以电子方式或者以光学方式)至接收器的装置或者系统。举例而言,接收器可以为计算机、移动设备、存储设备等。装置或者系统可以例如包括用于传送计算机程序至接收器的文件服务器。
在一些示例中,可编程逻辑器件(例如,现场可编程门阵列)可用以执行本文中所描述的方法的功能性中的一些或者全部。在一些示例中,现场可编程门阵列可以与微处理器协作,以便执行本文中所描述的方法中的一个。通常,所述方法可以由任何适当的硬件设备执行。
上述示例仅说明上文所论述的原理。应理解,本文中所描述的配置和细节的修改和变化将为显而易见的。因此,其意欲由接下来的权利要求的范畴限制,而非由借助于本文中示例的描述和解释所呈现的特定细节限制。
即使具有相同或者等效功能性的相同或者等效的一个或多个组件出现于不同附图中,以下描述中仍通过相同或者等效参考数字来表示所述一个或多个组件。

Claims (54)

1.一种用于使用内预测对图像(10)的预定块(18)进行解码的装置(3000),被配置为
从所述数据流(12)导出集合选择性语法元素(522),所述集合选择性语法元素指示是否将使用包括DC内预测模式(506)和角度预测模式(500)的内预测模式的第一集合(508)中的一个来预测所述预定块(18),
如果所述集合选择性语法元素(522)指示将使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成最可能内预测模式的列表(528),
从所述数据流(12)导出MPM列表索引(534),所述MPM列表索引在所述最可能内预测模式的列表(528)中指向预定的内预测模式(3100),
使用所述预定的内预测模式(3100)对所述预定块(18)进行内预测,
如果所述集合选择性语法元素(522)指示将不使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
通过以下操作从所述数据流(12)导出另外的索引(540;546),所述另外的索引指示来自基于矩阵的内预测模式(510)的第二集合(520)中的预定的基于矩阵的内预测模式(3200):
计算从所述预定块(18)的邻域中的参考样本(17)导出的向量(514,400,402)和与所述预定的基于矩阵的内预测模式(3200)相关联的预定的预测矩阵(516)之间的矩阵向量乘积(512)以便获得预测向量(518),以及
基于所述预测向量(518)预测所述预定块(18)的样本,
其中基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成所述最可能内预测模式的列表(528),使得在通过所述角度内预测模式(500)中的任一个预测所述相邻块(524,526)的情况下,所述最可能内预测模式的列表(528)不含所述DC内预测模式(506)。
2.根据权利要求1所述的装置(3000),被配置为:
如果所述集合选择性语法元素(522)指示将使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
从所述数据流(12)导出MPM语法元素(532),所述MPM语法元素指示所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)是否在所述最可能内预测模式的列表(528)内,
如果所述MPM语法元素(532)指示所述内预测模式的第一集合(508)的所述预定的内预测模式(3100)在所述最可能内预测模式的列表(528)内,则执行
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成所述最可能内预测模式的列表(528),
从所述数据流(12)导出所述MPM列表索引(534),所述MPM列表索引指向所述最可能内预测模式的列表(528)中的预定的内预测模式(3100),如果来自所述数据流(12)的所述MPM语法元素(532)指示所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)不在所述最可能内预测模式的列表(528)内,则
从所述数据流(12)导出另外的列表索引(536),所述另外的列表索引指示来自所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)。
3.根据权利要求1或2所述的装置(3000),被配置为:
如果所述集合选择性语法元素(522)指示将不使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
从所述数据流(12)导出另外的MPM语法元素(538),所述另外的MPM语法元素指示所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)是否在最可能的基于块的内预测模式(510)的列表(542)内,
如果所述另外的MPM语法元素(538)指示所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)在最可能的基于块的内预测模式(510)的列表(542)内,则
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成所述最可能的基于块的内预测模式(510)的列表(542),
从所述数据流(12)导出另外的MPM列表索引(540),所述另外的MPM列表索引在所述最可能的基于块的内预测模式(510)的列表(542)中指向所述预定的基于块的内预测模式(3200),
如果所述另外的MPM语法元素(538)指示所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)不在最可能的基于块的内预测模式(510)的列表(542)内,则
从所述数据流(12)导出又一列表索引(546),所述又一列表索引指示来自所述基于块的内预测模式(510)的第二集合(520)的所述预定的基于块的内预测模式(3200)。
4.根据权利要求1至3中任一项所述的装置(3000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
仅在以下情况下以所述DC内预测模式(506)填充所述列表(528),所述情况是针对所述相邻块(524,526)中的每一个,使用包括所述DC内预测模式(506)的第一集合(508)内的至少一个非角度内预测模式(504,506)中的任一个预测的相应相邻块的情形,或者使用基于块的内预测模式(510)中的任一个预测的相应相邻块的情形,所述基于块的内预测模式(510)借助于从所述基于块的内预测模式(510)的第二集合(520)到用于形成所述最可能内预测模式的列表(528)的所述第一集合(508)内的内预测模式的映射,而被映射到所述至少一个非角度内预测模式(504,506)中的任一个上。
5.根据权利要求1至4中任一项所述的装置(3000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得在以下情况下,所述情况是针对所述相邻块(524,526)中的每一个,使用包括所述DC内预测模式(506)的第一集合(508)内的至少一个非角度内预测模式(504,506)中的任一个预测的相应相邻块的情形,或者使用基于块的内预测模式(510)中的任一个预测的相应相邻块的情形,所述基于块的内预测模式借助于从所述基于块的内预测模式(510)的第二集合(520)到用于形成所述最可能内预测模式的列表(528)的所述第一集合(508)内的内预测模式的映射,而被映射到所述至少一个非角度内预测模式(504,506)中的任一个上,
所述DC内预测模式(506)被定位在所述最可能内预测模式的列表(528)中的任一角度内预测模式(500)之前。
6.根据权利要求1至5中任一项所述的装置(3000),其中所述内预测模式的第一集合(508)进一步包括平面内预测模式(504)。
7.根据权利要求1至6中任一项所述的装置(3000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
以独立于用以预测所述相邻块(524,526)的所述内预测模式的方式以所述平面内预测模式(504)填充所述列表(528)。
8.根据权利要求7所述的装置(3000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
独立于用以预测所述相邻块(524,526)的所述内预测模式,将所述平面内预测模式(504)定位于所述最可能内预测模式的列表(528)中的第一位置处。
9.根据权利要求1至8中任一项所述的装置(3000),被配置为:
从多个参考样本(17)形成样本值向量(400),
从所述样本值向量(400)导出所述向量(514),使得通过预定的可逆线性变换(403)将所述样本值向量(400)映射到所述向量(514)上。
10.根据权利要求9所述的装置(3000),其中所述可逆线性变换(403)被限定以使得
所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是预定值。
11.根据权利要求10所述的装置(3000),其中所述预定值为以下中的一个:
所述样本值向量(400)的分量的平均值,诸如算术平均值或者加权平均值,
默认值,
在所述图像(10)编码而成的数据流(12)中用信号通知的值,以及
对应于所述预定分量的所述样本值向量(400)的分量。
12.根据权利要求9所述的装置(3000),其中所述可逆线性变换(403)被限定以使得
所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是所述样本值向量(400)的分量的算术平均值。
13.根据权利要求9所述的装置(3000),其中所述可逆线性变换(403)被限定以使得
所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是所述样本值向量(400)的对应于所述预定分量的分量,
其中所述装置(3000)被配置为
包括多个可逆线性变换(403),其每一个与所述另外的向量(514,402)的一个分量相关联,
从所述样本值向量(400)的所述分量中选择所述预定分量,以及
使用来自所述多个可逆线性变换(403)中的与所述预定分量相关联的可逆线性变换(403)作为所述预定的可逆线性变换(403)。
14.根据权利要求10至13中任一项所述的装置(3000),其中在所述预测矩阵(516)的与所述另外的向量(514,402)的所述预定分量对应的列内的所述预测矩阵(516)的矩阵分量全为零,且所述装置(3000)被配置为:
通过计算经缩减的预测矩阵与又一向量之间的矩阵向量乘积(512)来执行乘法,计算所述矩阵向量乘积(512),所述经缩减的预测矩阵是通过舍弃所述列而从预测矩阵(516)产生的,所述又一向量是通过舍弃所述预定分量而从所述另外的向量(514,402)产生的。
15.根据权利要求10至14中任一项所述的装置(3000),被配置为在基于所述预测向量(518)预测所述预定块的所述样本时,
针对所述预测向量(518)的每一分量计算相应分量与a的和。
16.根据权利要求10至15中任一项所述的装置(3000),其中将与所述另外的向量(514,402)的所述预定分量对应的所述预测矩阵(516)中的列内的所述预测矩阵(516)的每一矩阵分量与一进行求和而产生的矩阵,即矩阵B,乘以所述可逆线性变换(403),对应于机器学习预测矩阵的经量化版本。
17.根据权利要求9至16中任一项所述的装置(3000),被配置为:
通过针对所述样本值向量(400)的每一分量进行以下操作而从所述多个参考样本(17)形成(100)所述样本值向量(400):
采用所述多个参考样本(17)中的一个参考样本作为所述样本值向量(400)的所述相应分量,和/或
对所述样本值向量(400)的两个或者更多个分量进行平均以获得所述样本值向量(400)的所述相应分量。
18.根据权利要求1至17中任一项所述的装置(3000),其中所述多个参考样本(17)在所述图像(10)内沿着所述预定块(18)的外边缘布置。
19.根据权利要求1至18中任一项所述的装置(3000),被配置为使用定点算术运算计算所述矩阵向量乘积(512)。
20.根据权利要求1至19中任一项所述的装置(3000),被配置为在不进行浮点算术运算的情况下计算所述矩阵向量乘积(512)。
21.根据权利要求1至20中任一项所述的装置(3000),被配置为存储所述预测矩阵(516)的定点数表示。
22.根据权利要求10至21中任一项所述的装置(3000),被配置为使用预测参数表示所述预测矩阵(516),并且通过对所述另外的向量(514,402)的所述分量和所述预测参数以及从其产生的中间结果执行乘法和求和而计算所述矩阵向量乘积(512),其中所述预测参数的绝对值是通过n位定点数表示可表示的,其中n等于或者低于14,或者替代地等于或者低于10,或者替代地等于或者低于8。
23.根据权利要求22所述的装置(3000),其中所述预测参数包括
权重,其每一个与所述预测矩阵(516)的对应矩阵分量相关联。
24.根据权利要求23所述的装置(3000),其中所述预测参数进一步包括
一个或多个缩放因子,其每一个与所述预测矩阵(516)的一个或多个对应矩阵分量相关联以用于缩放与所述预测矩阵(516)的所述一个或多个对应矩阵分量相关联的权重,和/或
一个或多个偏移量,其每一个与所述预测矩阵(516)的一个或多个对应矩阵分量相关联以用于使与所述预测矩阵(516)的所述一个或多个对应矩阵分量相关联的权重偏移。
25.根据权利要求1至24中任一项所述的装置(3000),被配置为在基于所述预测向量(518)预测所述预定块(18)的所述样本时,
使用内插以基于所述预测向量(518)计算所述预定块(18)的至少一个样本位置,所述预测向量(518)的每一分量与所述预定块(18)内的对应位置相关联。
26.一种用于使用内预测对图像(10)的预定块(18)进行编码的装置(6000),被配置为
在数据流(12)中用信号通知集合选择性语法元素(522),所述集合选择性语法元素指示是否将使用包括DC内预测模式(506)和角度预测模式(500)的内预测模式的第一集合(508)中的一个来预测所述预定块(18),
如果所述集合选择性语法元素(522)指示将使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成最可能内预测模式的列表(528),
在所述数据流(12)中用信号通知MPM列表索引(534),所述MPM列表索引在所述最可能内预测模式的列表(528)中指向预定的内预测模式(3100),
使用所述预定的内预测模式(3100)对所述预定块(18)进行内预测,
如果所述集合选择性语法元素(522)指示将不使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
通过以下操作在所述数据流(12)中用信号通知另外的索引(540;546),所述另外的索引指示来自基于矩阵的内预测模式(510)的第二集合(520)中的预定的基于矩阵的内预测模式(3200)
计算从所述预定块(18)的邻域中的参考样本(17)导出的向量(514,400,402)和与所述预定的基于矩阵的内预测模式(3200)相关联的预定的预测矩阵(516)之间的矩阵向量乘积(512),以便获得预测向量(518),以及
基于所述预测向量(518)预测所述预定块(18)的样本,
其中基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成所述最可能内预测模式的列表(528),使得在通过所述角度内预测模式(500)中的任一个预测所述相邻块(524,526)的情况下,所述最可能内预测模式的列表(528)不含所述DC内预测模式(506)。
27.根据权利要求26所述的装置(6000),被配置为:
如果所述集合选择性语法元素(522)指示将使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
在所述数据流(12)中用信号通知MPM语法元素(532),所述MPM语法元素指示所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)是否在所述最可能内预测模式的列表(528)内,
如果所述MPM语法元素(532)指示所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)在所述最可能内预测模式的列表(528)内,则执行
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的形成,
在所述数据流(12)中用信号通知所述MPM列表索引(534),所述MPM列表索引指向所述最可能内预测模式的列表(528)中的预定的内预测模式(3100),
如果所述数据流(12)中的所述MPM语法元素(532)指示所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)并不在所述最可能内预测模式的列表(528)内,则
在所述数据流(12)中用信号通知另外的列表索引(536),所述另外的列表索引指示来自所述内预测模式的第一集合(508)中的所述预定的内预测模式(3100)。
28.根据权利要求26或27所述的装置(6000),被配置为:
如果所述集合选择性语法元素(522)指示将不使用所述内预测模式的第一集合(508)中的一个来预测所述预定块(18),则
在所述数据流(12)中用信号通知另外的MPM语法元素(538),所述另外的MPM语法元素指示所述基于块的内预测模式(510)的第二集合(520)中的预定的基于块的内预测模式(3200)是否在最可能的基于块的内预测模式(510)的列表(542)内,
如果所述另外的MPM语法元素(538)指示所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)在所述最可能的基于块的内预测模式(510)的列表(542)内,则
基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)形成所述最可能的基于块的内预测模式(510)的列表(542),
在所述数据流(12)中用信号通知另外的MPM列表索引(540),所述另外的MPM列表索引在所述最可能的基于块的内预测模式(510)的列表(542)中指向所述预定的基于块的内预测模式(3200),
如果所述另外的MPM语法元素(538)指示所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)并不在所述最可能的基于块的内预测模式(510)的列表(542)内,则
在所述数据流(12)中用信号通知又一列表索引(546),所述又一列表索引指示来自所述基于块的内预测模式(510)的第二集合(520)中的所述预定的基于块的内预测模式(3200)。
29.根据权利要求26至28中任一项所述的装置(6000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
仅在以下情况下以所述DC内预测模式(506)填充所述列表(528),所述情况是针对所述相邻块(524,526)中的每一个,使用包括所述DC内预测模式(506)的第一集合(508)内的至少一个非角度内预测模式(504,506)中的任一个预测的相应相邻块的情形,或者使用基于块的内预测模式(510)中的任一个预测的相应相邻块的情形,所述基于块的内预测模式借助于从所述基于块的内预测模式(510)的第二集合(520)到用于形成所述最可能内预测模式的列表(528)的所述第一集合(508)内的内预测模式的映射,而被映射到所述至少一个非角度内预测模式(504,506)中的任一个上。
30.根据权利要求26至29中任一项所述的装置(6000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得在以下情况下,所述情况是针对所述相邻块(524,526)中的每一个,使用包括所述DC内预测模式(506)的第一集合(508)内的至少一个非角度内预测模式(504,506)中的任一个预测的相应相邻块的情形,或者使用基于块的内预测模式(510)中的任一个预测的相应相邻块的情形,所述基于块的内预测模式借助于从所述基于块的内预测模式(510)的第二集合(520)到用于形成所述最可能内预测模式的列表(528)的所述第一集合(508)内的内预测模式的映射,而被映射到所述至少一个非角度内预测模式(504,506)中的任一个上,
所述DC内预测模式(506)被定位在所述最可能内预测模式的列表(528)中的任一角度内预测模式(500)之前。
31.根据权利要求26至30中任一项所述的装置(6000),其中所述内预测模式的第一集合(508)进一步包括平面内预测模式(504)。
32.根据权利要求26至31中任一项所述的装置(6000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
以独立于用以预测所述相邻块(524,526)的所述内预测模式的方式以所述平面内预测模式(504)填充所述列表(528)。
33.根据权利要求32所述的装置(6000),被配置为执行基于用以预测与所述预定块(18)相邻的相邻块(524,526)的内预测模式(3050)的所述最可能内预测模式的列表(528)的所述形成,使得
独立于用以预测所述相邻块(524,526)的所述内预测模式将所述平面内预测模式(504)定位于所述最可能内预测模式的列表(528)中的第一位置处。
34.根据权利要求26至33中任一项所述的装置(6000),被配置为:
从多个参考样本(17)形成样本值向量(400),
从所述样本值向量(400)导出所述向量(514),使得通过预定的可逆线性变换(403)将所述样本值向量(400)映射到所述向量(514)。
35.根据权利要求34所述的装置(6000),其中所述可逆线性变换(403)被限定以使得
所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是一预定值。
36.根据权利要求35所述的装置(6000),其中所述预定值是以下中的一个:
所述样本值向量(400)的分量的平均值,诸如算术平均值或者加权平均值,
默认值,
在所述图像(10)编码而成的数据流(12)中用信号通知的值,以及
所述样本值向量(400)的对应于所述预定分量的分量。
37.根据权利要求34所述的装置(6000),其中所述可逆线性变换(403)被限定以使得
所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是所述样本值向量(400)的分量的算术平均值。
38.根据权利要求34所述的装置(6000),其中所述可逆线性变换(403)被限定以使得所述另外的向量(514,402)的预定分量变为a,且
除了所述预定分量之外,所述另外的向量(514,402)的其他分量中的每一个等于所述样本值向量(400)的对应分量减去a,
其中a是所述样本值向量(400)的对应于所述预定分量的分量,
其中所述装置(6000)被配置为:
包括多个可逆线性变换(403),其每一个与所述另外的向量(514,402)的一个分量相关联,
从所述样本值向量(400)的所述分量中选择所述预定分量,以及
使用来自所述多个可逆线性变换(403)中的与所述预定分量相关联的可逆线性变换(403)作为所述预定的可逆线性变换(403)。
39.根据权利要求35至38中任一项所述的装置(6000),其中与所述另外的向量(514,402)的所述预定分量对应的所述预测矩阵(516)中的一列内的所述预测矩阵(516)的矩阵分量全为零,且所述装置(6000)被配置为:
通过计算经缩减的预测矩阵与又一向量之间的矩阵向量乘积(512)来执行乘法,计算所述矩阵向量乘积(512),所述经缩减的预测矩阵是通过舍弃所述列而从预测矩阵(516)产生的,所述又一向量是通过舍弃所述预定分量而从所述另外的向量(514,402)产生的。
40.根据权利要求35至39中任一项所述的装置(6000),被配置为在基于所述预测向量(518)预测所述预定块(18)的所述样本时,
针对所述预测向量(518))的每一分量计算相应分量与a的和。
41.根据权利要求35至40中任一项所述的装置(6000),其中将与所述另外的向量(514,402)的所述预定分量对应的所述预测矩阵(516)中的列内的所述预测矩阵(516)的每一矩阵分量与一进行求和而产生的矩阵,即矩阵B,乘以所述可逆线性变换(403),对应于机器学习预测矩阵的经量化版本。
42.根据权利要求34至41中任一项所述的装置(6000),被配置为:
通过针对所述样本值向量(400)的每一分量进行以下操作而从所述多个参考样本(17)形成(100)所述样本值向量(400),
采用所述多个参考样本(17)中的一个参考样本作为所述样本值向量(400)的所述相应分量,和/或
对所述样本值向量(400)的两个或者更多个分量进行平均以获得所述样本值向量(400)的所述相应分量。
43.根据权利要求26至42中任一项所述的装置(6000),其中所述多个参考样本(17)在所述图像(10)内沿着所述预定块(18)的外边缘布置。
44.根据权利要求26至43中任一项所述的装置(6000),被配置为使用定点算术运算计算所述矩阵向量乘积(512)。
45.根据权利要求26至44中任一项所述的装置(6000),被配置为在不进行浮点算术运算的情况下计算所述矩阵向量乘积(512)。
46.根据权利要求26至45中任一项所述的装置(6000),被配置为存储所述预测矩阵(516)的定点数表示。
47.根据权利要求26至46中任一项所述的装置(6000),被配置为使用预测参数表示所述预测矩阵(516),并且通过对所述另外的向量(514,402)的所述分量和所述预测参数以及从其产生的中间结果执行乘法和求和而计算所述矩阵向量乘积(512),其中所述预测参数的绝对值是通过n位定点数表示可表示的,其中n等于或者低于14,或者替代地等于或者低于10,或者替代地等于或者低于8。
48.根据权利要求47所述的装置(6000),其中所述预测参数包括
权重,其每一个与所述预测矩阵(516)的对应矩阵分量相关联。
49.根据权利要求48所述的装置(6000),其中所述预测参数进一步包括:
一个或多个缩放因子,其每一个与所述预测矩阵(516)的一个或多个对应矩阵分量相关联以用于缩放与所述预测矩阵(516)的所述一个或多个对应矩阵分量相关联的权重,和/或
一个或多个偏移量,其每一个与所述预测矩阵(516)的一个或多个对应矩阵分量相关联以用于使与所述预测矩阵(516)的所述一个或多个对应矩阵分量相关联的权重偏移。
50.根据权利要求26至49中任一项所述的装置(6000),被配置为在基于所述预测向量(518)预测所述预定块(18)的所述样本时,
使用内插以基于所述预测向量(518)计算所述预定块(18)的至少一个样本位置,所述预测向量(518)的每一分量与所述预定块(18)内的对应位置相关联。
51.一种用于使用内预测对图像的预定块(18)进行解码的方法(4000),包括:
从数据流导出(4100)集合选择性语法元素,所述集合选择性语法元素指示是否将使用包括DC内预测模式(506)和角度预测模式(500)的内预测模式的第一集合(508)中的一个来预测所述预定块,
如果所述集合选择性语法元素(522)指示(4150)将使用所述内预测模式的第一集合中的一个来预测所述预定块,则
基于用以预测与所述预定块相邻的相邻块(524,526)的内预测模式形成(4200)最可能内预测模式的列表(528),
从所述数据流导出(4300)MPM列表索引(534),所述MPM列表索引在所述最可能内预测模式的列表中指向预定的内预测模式,
使用所述预定的内预测模式对所述预定块进行内预测(4400),
如果所述集合选择性语法元素指示(4155)将不使用所述内预测模式的第一集合中的一个来预测所述预定块,则
通过以下操作从所述数据流导出(4250)另外的索引(540;546),所述另外的索引指示来自基于矩阵的内预测模式(510)的第二集合(520)中的预定的基于矩阵的内预测模式:
计算(4350)从所述预定块的邻域中的参考样本(17)导出的向量(514)和与所述预定的基于矩阵的内预测模式相关联的预定的预测矩阵(516)之间的矩阵向量乘积(512)以便获得预测向量(518),以及
基于所述预测向量预测(4450)所述预定块的样本,
其中基于用以预测与所述预定块相邻的相邻块的内预测模式形成所述最可能内预测模式的列表,使得在通过所述角度内预测模式中的任一个预测所述相邻块的情况下,所述最可能内预测模式的列表不含所述DC内预测模式(506)。
52.一种用于使用内预测对图像的预定块(18)进行编码的方法(5000),包括:
在数据流中用信号通知(5100)集合选择性语法元素,所述集合选择性语法元素指示是否将使用包括DC内预测模式(506)和角度预测模式(500)的内预测模式的第一集合(508)中的一个来预测所述预定块,
如果所述集合选择性语法元素(522)指示(5150)将使用所述内预测模式的第一集合中的一个来预测所述预定块,则
基于用以预测与所述预定块相邻的相邻块(524,526)的内预测模式形成(5200)最可能内预测模式的列表(528),
在所述数据流中用信号通知(5300)MPM列表索引(534),所述MPM列表索引在所述最可能内预测模式的列表中指向预定的内预测模式,
使用所述预定的内预测模式对所述预定块进行内预测(5400),
如果所述集合选择性语法元素指示(5155)将不使用所述内预测模式的第一集合中的一个来预测所述预定块,则
通过以下操作在所述数据流中用信号通知(5250)另外的索引(540;546),所述另外的索引指示来自基于矩阵的内预测模式(510)的第二集合(520)中的预定的基于矩阵的内预测模式
计算(5350)从所述预定块的邻域中的参考样本(17)导出的向量(514)和与所述预定的基于矩阵的内预测模式相关联的预定的预测矩阵(516)之间的矩阵向量乘积(512),以便获得预测向量(518),以及
基于所述预测向量预测(5450)所述预定块的样本,
其中基于用以预测与所述预定块(100)相邻的相邻块的内预测模式形成所述最可能内预测模式的列表,使得在通过所述角度内预测模式中的任一个预测所述相邻块的情况下,所述最可能内预测模式的列表不含所述DC内预测模式(506)。
53.一种具有图像的数据流(12),所述图像是使用根据权利要求52所述的方法(5000)编码成所述数据流(12)的。
54.一种具有程序代码的计算机程序,所述程序代码在运行于计算机上时用于执行根据权利要求52至53中任一项所述的方法。
CN202080050899.1A 2019-06-14 2020-06-10 内预测模式的编码 Pending CN114128269A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19180383.2 2019-06-14
EP19180383 2019-06-14
PCT/EP2020/066124 WO2020249633A1 (en) 2019-06-14 2020-06-10 Coding of intra-prediction modes

Publications (1)

Publication Number Publication Date
CN114128269A true CN114128269A (zh) 2022-03-01

Family

ID=66912587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080050899.1A Pending CN114128269A (zh) 2019-06-14 2020-06-10 内预测模式的编码

Country Status (9)

Country Link
US (1) US20220103813A1 (zh)
EP (2) EP3984217B1 (zh)
JP (1) JP7455869B2 (zh)
KR (1) KR20220020339A (zh)
CN (1) CN114128269A (zh)
BR (1) BR112021025335A2 (zh)
MX (1) MX2021015462A (zh)
TW (2) TWI833073B (zh)
WO (1) WO2020249633A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11589065B2 (en) * 2019-06-24 2023-02-21 Hyundai Motor Company Method and apparatus for intra-prediction coding of video data
BR112021006724A2 (pt) * 2019-06-25 2022-02-01 Guangdong Oppo Mobile Telecommunications Corp Ltd Método de conversão de figuração em código aplicado a um codificador, método de decodificação de figuração aplicado a um decodificador, decodificador, e mídia de armazenamento legível por computador
CN116389724A (zh) * 2019-07-10 2023-07-04 Oppo广东移动通信有限公司 图像分量预测方法、编码器、解码器以及存储介质
EP3843406A4 (en) 2019-09-24 2021-10-27 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHOD OF DETERMINING A PREDICTED VALUE, ENCODER, DECODER AND COMPUTER STORAGE MEDIUM

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9654785B2 (en) * 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
US20140064359A1 (en) * 2012-08-31 2014-03-06 Qualcomm Incorporated Intra prediction most probable mode order improvement for scalable video coding
CN113438477A (zh) * 2016-04-06 2021-09-24 株式会社Kt 对视频进行编码、解码的方法及存储压缩视频数据的设备
US10547854B2 (en) * 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
US20190089952A1 (en) * 2017-09-19 2019-03-21 Futurewei Technologies, Inc. Bidirectional Weighted Intra Prediction
US11509891B2 (en) * 2018-11-04 2022-11-22 Lg Electronics Inc. Intra prediction method and apparatus in image coding system
KR20230025036A (ko) * 2019-02-21 2023-02-21 엘지전자 주식회사 인트라 예측을 위한 비디오 신호의 처리 방법 및 장치
CN113475065A (zh) * 2019-02-26 2021-10-01 Lg 电子株式会社 使用统一mpm列表的基于帧内预测的图像编译方法和设备
CN114128270A (zh) 2019-06-13 2022-03-01 Lg 电子株式会社 利用简化mpm列表生成方法的图像编码/解码方法和设备,以及发送比特流的方法

Also Published As

Publication number Publication date
EP4376407A1 (en) 2024-05-29
US20220103813A1 (en) 2022-03-31
BR112021025335A2 (pt) 2022-02-01
TWI727826B (zh) 2021-05-11
EP3984217A1 (en) 2022-04-20
WO2020249633A1 (en) 2020-12-17
TW202143730A (zh) 2021-11-16
TW202107893A (zh) 2021-02-16
EP3984217B1 (en) 2023-12-27
JP7455869B2 (ja) 2024-03-26
KR20220020339A (ko) 2022-02-18
TWI833073B (zh) 2024-02-21
JP2022536181A (ja) 2022-08-12
MX2021015462A (es) 2022-03-11

Similar Documents

Publication Publication Date Title
TWI755665B (zh) 使用具有鄰近取樣縮減的線性或仿射變換的內預測
TWI771679B (zh) 以區塊為基礎之預測技術
JP7477538B2 (ja) 行列ベースのイントラ予測および二次変換を使用したコーディング
CN114128269A (zh) 内预测模式的编码
CN113875233A (zh) 使用上采样的基于矩阵的帧内预测
US20230188720A1 (en) MIP for All Channels in the Case of 4:4:4-Chroma Format and of Single Tree
JP2024069438A (ja) イントラ予測を用いた符号化

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40067197

Country of ref document: HK