CN116915991A - 对视频数据进行编码或解码的方法及存储比特流的方法 - Google Patents

对视频数据进行编码或解码的方法及存储比特流的方法 Download PDF

Info

Publication number
CN116915991A
CN116915991A CN202311054584.6A CN202311054584A CN116915991A CN 116915991 A CN116915991 A CN 116915991A CN 202311054584 A CN202311054584 A CN 202311054584A CN 116915991 A CN116915991 A CN 116915991A
Authority
CN
China
Prior art keywords
intra
mode
current block
mpm
mpms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311054584.6A
Other languages
English (en)
Inventor
林晶娟
李善英
孙世勋
申在燮
金炯德
李京泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SK Telecom Co Ltd
Original Assignee
SK Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170014634A external-priority patent/KR20180043149A/ko
Application filed by SK Telecom Co Ltd filed Critical SK Telecom Co Ltd
Publication of CN116915991A publication Critical patent/CN116915991A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

本发明涉及对视频数据进行编码或解码的方法及存储比特流的方法。本发明涉及在帧内预测编码时高效地用信号通知用于预测当前块的帧内预测模式。根据本发明的一方面,一种图像编码设备将许多帧内模式分成多个组并且选择待编码的当前块的实际帧内模式所属的组,并且所述图像编码设备用信号通知与该组对应的值。图像解码设备从比特流中获取关于当前块的实际帧内模式所属的组的信息,然后通过评估属于该组的帧内模式来选择最终帧内模式。

Description

对视频数据进行编码或解码的方法及存储比特流的方法
本申请是原案申请号为201780064067.3的发明专利申请(国际申请号:PCT/KR2017/011455,申请日:2017年10月17日,发明名称:用于对图像进行编码或解码的设备和方法)的分案申请。
技术领域
本发明涉及对视频进行高效编码或解码。更具体地,本发明涉及用于对在帧内预测中预测当前块的帧内预测模式进行编码和解码的方法和设备。
背景技术
该部分中的陈述仅仅提供了关于本公开的背景信息,并不一定构成现有技术。
存在使用当前图片中的像素信息来预测当前图片中所包括的像素值的帧内预测和编码的多种帧内预测模式。视频编码设备在多种帧内预测模式当中选择用于将被编码的当前块的一种最终模式,并且将关于所选择的模式的信息发送到视频解码设备。在该操作中,使用最可能模式(MPM)来高效地表示所选择的帧内模式。
图1是示出可用于标准HEVC中的帧内预测的帧内模式的图。在HEVC的情况下,总共有35种帧内模式,包括33种具有定向性的角度模式和两种非定向模式,如图1中所示。为了对这35种模式当中的待被编码的当前块的最终帧内模式进行编码,基于用于当前块周围的邻近块的帧内模式和据统计最频繁使用的帧内模式来选择用于当前块的三个MPM。
发送指示当前块的最终模式是否与MPM相同的1比特MPM标志,并且如果最终模式是MPM,则进一步发送MPM索引值。如果最终模式不是MPM,则发送剩余模式中的哪一种是最终模式的明确指示。
随着视频的分辨率逐渐增加,预测块的单元也逐渐变大,因此有可能要添加许多新的帧内模式。然而,如果预测的MPM仍然与最终模式不同,则在一些情况下可能需要将模式索引值作为固定长度代码发送。
另外,如果新添加了许多帧内模式并且待预测的MPM的数目随着视频大小的增加而相应增加,则能提高预测效率。然而,由于MPM索引值的表示以截断一元形式给出,因此MPM数目的增加很可能使压缩效率降低。
此外,通过根据对应地用于亮度和色度的树结构进行分割而以各种形状产生编码单元,当可以利用亮度编码时计算的各种帧内模式来表示平面模式、DC模式、垂直模式、水平模式、DM模式和LM模式时,典型模式(例如,直接模式)可以用标志表示并且被用于对色度的帧内模式进行压缩。
发明内容
技术问题
因此,已经考虑到以上问题而作出了本发明,并且本发明的一个目的是用信息高效通知用于在帧内预测编码时预测当前块的帧内预测模式。
技术方案
按照本发明的一方面,提供了一种对视频数据进行编码的方法,该方法包括以下步骤:确定用于预测所述视频数据的当前块的帧内模式;确定用于所述视频数据的所述当前块的最可能模式(MPM);以及对所述当前块的帧内模式数据进行编码。当所述MPM中的任一个与用于预测所述当前块的帧内模式不同时,对所述当前块的帧内模式数据进行编码的步骤包括以下步骤:对指示用于预测所述当前块的帧内模式不是MPM的MPM标志进行编码;通过在可能的帧内模式当中去除所述MPM来生成非MPM的列表,其中,所述非MPM的列表中的帧内模式被分成多个组;以及对指示所述当前块的帧内模式在所述非MPM的列表中所属的组的索引的数据进行编码。
按照本发明的另一方面,提供了一种对视频数据进行解码的方法,该方法包括以下步骤:确定用于所述视频数据的当前块的最可能模式(MPM);从比特流中对指示用于预测所述当前块的帧内模式是否是MPM的MPM标志进行解码;以及当所述MPM标志指示用于预测所述当前块的帧内模式不是MPM时,使用可能的帧内模式当中的除了所述MPM之外的非MPM来确定所述当前块的帧内模式。使用所述非MPM来确定用于预测所述当前块的帧内模式的步骤包括以下步骤:生成被分成多个非MPM组的所述非MPM的非MPM列表;从所述比特流中对指示用于预测所述当前块的帧内模式所属的非MPM组的索引的数据进行解码;以及评估属于由所述非MPM组的索引指示的组的所述非MPM来选择所述当前块的帧内模式。
按照本发明的又一方面,提供了一种用于对视频数据进行解码的设备,该设备包括:存储器;以及一个或更多个处理器,其中,所述一个或更多个处理器被配置为执行以下操作:确定用于所述视频数据的当前块的最可能模式(MPM);从比特流中对指示用于预测所述当前块的帧内模式是否是MPM的MPM标志进行解码;以及当所述MPM标志指示用于预测所述当前块的帧内模式不是MPM时,使用可能的帧内模式当中的除了所述MPM之外的非MPM来确定所述当前块的帧内模式。使用所述非MPM来确定用于预测所述当前块的帧内模式的步骤包括以下步骤:生成被分成多个非MPM组的所述非MPM的非MPM列表;从所述比特流中对指示用于预测所述当前块的帧内模式所属的非MPM组的索引的数据进行解码;以及评估属于由所述非MPM组的索引指示的组的所述非MPM来选择所述当前块的帧内模式。
附图说明
图1是示出可用于HEVC中的帧内预测的帧内模式的图。
图2是根据本发明的实施方式的视频编码设备的框图,
图3是使用QTBT结构的块分离的示例图。
图4示出了多种帧内预测模式的示例。
图5是当前块周围的邻近块的示例图。
图6例示了根据本发明的实施方式的视频解码设备。
图7是例示按照本发明的一个或更多个示例的对视频数据进行编码的示例性方法的流程图。
图8是例示按照本发明的一个或更多个示例的对视频数据进行编码的另一示例性方法的流程图。
图9是例示按照本发明的一个或更多个示例的对视频数据进行解码的示例性方法的流程图。
图10是例示按照本发明的一个或更多个示例的对视频数据进行解码的另一示例性方法的流程图。
图11是例示用于在帧内预测编码时生成预测块的参考像素的图。
具体实施方式
下文中,将参照附图详细地描述本发明的一些实施方式。应当注意,在将附图标记添加到相应附图中的组成元件时,相似的附图标记指定相似的元件,尽管这些元件是在不同附图中被示出的。另外,在对本发明的以下描述中,当对并入到本文中的已知功能和配置的详细描述会使本发明的主题相当不清楚时,将省略该详细描述。
图2是根据本发明的实施方式的视频编码设备的框图。
视频编码设备包括块分离器210、预测器220、减法器230、变换器240、量化器245、编码器250、逆量化器260、逆变换器265、加法器270、滤波器单元280和存储器290。视频编码设备的每个元件都可以被实现为硬件芯片,或者可以被实现为软件,并且微处理器可以被实现为执行与相应元件对应的软件的功能。
块分离器210将构成视频的每个图片分离成多个编码树单元(CTU),然后使用树结构来递归地分离CTU。树结构中的叶节点是编码单元(CU),CU是编码的基本单元。可以使用其中节点被分离成四个子节点的四叉树(QT)结构或者将QT结构与其中节点被分离成两个子节点的二叉树(BT)结构相结合的四叉树加二叉树(QTBT)结构作为树结构。
在四叉树加二叉树(QTBT)结构中,首先根据QT结构分离CTU。此后,可以按BT进一步分离QT的叶节点。由块分离器210通过按QTBT结构分割CTU而生成的分离信息由编码器250编码并被发送到视频解码设备。
在QT中,对指示是否分离对应节点的块的第一标志(QT_split_flag)进行编码。当第一标志为1时,节点的块被分离成相同大小的四个块。当第一标志为0时,不进一步按QT分离节点。
在BT中,对指示是否分离对应节点的块的第二标志(BT_split_flag)进行编码。BT可以具有多种分离类型。例如,可以存在将节点的块水平地分离成相同大小的两个块的类型以及将节点的块垂直地分离成相同大小的两个块的类型。另外,可以存在将节点的块不对称地分离成两个块的另一种类型。不对称分离类型可以包括将节点的块以1:3的比例分离成两个矩形块的类型或者按对角线分离节点的块的类型。在如上所述BT具有多种分离类型的情况下,对指示块被分离的第二标志进行编码,并且另外对指示块的分离类型的分离类型信息进行编码。
图3是使用QTBT结构的块分离的示例图。在图3中,(a)例示了按QTBT结构分离块并且(b)表示树结构中的分离。在图3中,实线表示按QT结构进行的分离,并且虚线表示按BT结构进行的分离。在图3的(b)中,关于层的符号,不带括号的层表达表示QT的层,并且括号中的层表达表示BT的层。在用虚线表示的BT结构中,数字是分离类型信息。
在图3中,作为QT的最上层的CTU被分离成层1的四个节点。因此,块分离器210生成指示CTU被分离的QT分离标志(QT_split_flag=1)。不再按QT对与层1的第一节点对应的块进行分离。因此,块分离器210生成QT_split_flag=0。
然后,与QT的层1的第一节点对应的块经受BT。在该实施方式中,假定BT具有两种分离类型:将节点的块水平地分离成相同大小的两个块的类型以及将节点的块垂直地分离成相同大小的两个块的类型。QT的层1的第一节点成为BT的“(层0)”的根节点。与BT的根节点对应的块被进一步分离成“(层1)”的块,因此块分离器210生成指示按BT分离块的BT_split_flag=1。此后,块分离器210生成指示块是被水平地分离还是被垂直地分离的分离类型信息。在图3中,由于与BT的根节点对应的块被垂直地分离,因此生成指示垂直分离的“1”作为分离类型信息。在从根节点分离出的“(层1)”的块当中,根据垂直分离类型进一步分离第一块,因此生成BT_split_flag=1和分离类型信息“1”。另一方面,从BT的根节点分离出的(层1)的第二块不再被分离,因此为此生成BT_split_flag=0。
为了将关于按QTBT结构进行块分离的信息高效地用信号通知给解码设备,可以进一步对以下信息进行编码。该信息可以被编码为图像的报头信息,例如,序列参数集(SPS)或图片参数集(PPS)。
-CTU size:QTBT的最上层(即,根节点)的块大小;
-MinQTSize:QT中允许的叶节点的最小块大小;
-MaxBTSize:BT中允许的叶节点的最大块大小;
-MaxBTDepth:BT中允许的最大深度;
-MinBTSize:BT中允许的叶节点的最小块大小。
在QT中,大小与MinQTSize相同的块没有被进一步分离,因此关于与该块对应的QT的分离信息(第一标志)没有被编码。另外,在QT中,大小比MaxBTSize大的块不具有BT。因此,关于与该块对应的BT的分离信息(第二标志、分离类型信息)没有被编码。另外,当BT的对应节点的深度达到MaxBTDepth时,节点的块没有被进一步分离,并且关于节点的BT的对应分离信息(第二标志、分离类型信息)没有被编码。另外,BT中的大小与MinBTSize相同的块没有被进一步分离,并且关于BT的对应分离信息(第二标志、分离类型信息)没有被编码。通过定义QT和BT的根节点或叶节点可以在诸如如上所述的序列参数集(SPS)或图片参数集(PPS)这样的高层中具有的最大块大小或最小块大小,能够减少指示CTU的分离状态和分离类型的信息的编码量。
在实施方式中,可以使用相同的QTBT结构来分离CTU的亮度分量和色度分量。然而,本发明不限于此。可以分别使用不同的QTBT结构来分离亮度分量和色度分量。举例来说,在帧内(I)切片(slice)的情况下,可以使用不同的QTBT结构来分离亮度分量和色度分量。
下文中,与待编码或解码的CU对应的块被称为“当前块”。
预测器220通过预测当前块来生成预测块。预测器220包括帧内预测器222和帧间预测器224。
帧内预测器222使用包括当前块的当前图片中的位于当前块周围的像素(参考样本)来预测当前块中的像素。根据预测方向存在多种帧内预测模式,并且根据每种预测模式不同地定义待使用的邻近像素和计算式。特别地,帧内预测器222可以确定将用于对当前块进行编码的帧内预测模式。在一些实施方式中,帧内预测器222可以尝试使用多种帧内预测模式对当前块进行编码,然后从经测试的模式当中选择要使用的适当帧内预测模式。例如,帧内预测器222可以使用多种经测试的帧内预测模式的速率-失真分析来计算速率-失真值,并且从经测试的模式当中选择具有最佳速率-失真特性的帧内预测模式。
图4是多种帧内预测模式的示例图。
如图4中所示,多种帧内预测模式可以包括两种非定向模式(平面模式和DC模式)和65种定向模式。
帧内预测器222从多种帧内预测模式当中选择一种帧内预测模式,并且使用重构的邻近样本(参考样本)和由被选择用于预测当前块的帧内预测模式确定的等式来生成预测块。关于所选择的帧内预测模式的信息由编码器250编码并被发送到视频解码设备。
为了对指示多种帧内预测模式中的哪一种被用作当前块的帧内预测模式的帧内预测模式信息进行高效编码,帧内预测器222可确定帧内预测模式中的一些,并且将这些模式视为最有可能被用作当前块的帧内预测模式的最可能模式(MPM)。然后,帧内预测器222生成指示是否从MPM列表中选择了当前块的帧内预测模式的模式信息,并且将模式信息发送到编码器250。通常,当从MPM列表中选择了当前块的帧内预测模式时,帧内预测器222向编码器250发送用于指示选择MPM模式中的哪一种模式作为当前块的帧内预测模式的第一帧内预测信息。另一方面,当未从MPM列表中选择当前块的帧内预测模式时,用于指示除了MPM之外的剩余模式(即,非MPM)中的哪一种被选定为当前块的帧内预测模式的第二帧内识别信息被发送到编码器250。另选地,根据本发明的一方面的帧内预测器222可以对MPM和/或非MPM进行分组,并且用信号通知预测当前块的帧内预测模式所属的组的索引,而不是显式地用信号通知MPM和/或非MPM中的哪一种被选定为预测当前块的帧内预测模式。
下文中,将描述生成MPM列表的方法。虽然描述了用六个MPM构造MPM列表,但是本发明不限于此。MPM列表中所包括的MPM的数目的范围可以是从3至10。
首先,使用当前块周围的邻近块的帧内预测模式来构造MPM列表。在一示例中,如图5中所示,邻近块可以包括例如当前块的左块L、上块A、左下块BL、右上块AR和左上块AL的部分或全部。这些邻近块的帧内预测模式被包括在MPM列表中。这里,只有可用块的帧内预测模式被按左块L、上块A、左下块BL、右上块AR和左上块AL的顺序包括在MPM列表中,然后通过另外添加平面模式和DC模式来构造MPM列表。另选地,可以按左块L和上块A的顺序在MPM列表中添加邻近块的帧内预测模式,添加平面模式和DC模式,然后在MPM列表中添加左块BL、右上块AR和左上块AL的帧内预测模式。
MPM列表中只包括不同的帧内预测模式。也就是说,当存在重复的模式时,MPM列表中只包括重复的模式中的一种。
当列表中的MPM的数目小于预定数目(例如,6)时,可以通过基于列表中的定向模式添加-1角度模式或+1角度模式来推导另外的MPM。另外,当列表中的MPM的数目小于预定数目时,按垂直模式、水平模式、对角线模式等的顺序在MPM列表中添加预定的默认模式。
帧间预测器224在比当前图片更早被编码和解码的参考图片中搜索与当前块最相似的块,并且使用搜索到的块来生成当前块的预测块。然后,帧间预测器224生成与当前图片中的当前块和参考图片中的预测块之间的位移对应的运动矢量。包括关于用于预测当前块的参考图片的信息和关于所述运动矢量的信息的运动信息由编码器250编码并被发送到视频解码设备。
减法器230从当前块中减去由帧内预测器222或帧间预测器224生成的预测块,以生成残余块。
变换器240将空间域中的具有像素值的残余块中的残余信号变换为频域中的变换系数。变换器240可以使用当前块的大小作为变换单元(TU)来变换残余块中的残余信号,另选地,可以将残余块分离成多个更小的子块,然后以与每个子块的大小对应的变换单元(TU)变换残余信号。可以存在将残余块分离成更小的子块的各种方法。例如,残余块可以被分离成相同预定义大小的子块,或者可以以将残余块作为根节点的四叉树(QT)的方式分离残余块。
量化器245量化从变换器240输出的变换系数并且将量化后的变换系数输出到编码器250。
编码器250使用诸如CABAC这样的编码方案对量化后的变换系数进行编码,以生成比特流。编码器250对与块分离关联的诸如CTU size、MinQTSize、MaxBTSize、MaxBTDepth、MinBTSize、QT分离标志、BT分离标志和分离类型这样的信息进行编码,使得视频解码设备以与视频编码设备相同的方式分离块。
编码器250对关于指示当前块是通过帧内预测还是帧间预测进行编码的预测类型的信息进行编码,并且根据预测类型对帧内预测信息或帧间预测信息进行编码。
逆量化器260对从量化器245输出的量化后的变换系数进行逆量化,以生成变换系数。逆变换器265将从逆量化器260输出的变换系数从频域变换到空间域并且恢复残余块。
加法器270将重构的残余块添加到由预测器220生成的预测块,以恢复当前块。重构的当前块中的像素被用作按顺序执行下一个块的帧内预测的参考像素。
滤波器单元280对重构的块之间的边界进行去块滤波以便去除由逐块编码/解码引起的块效应,并且将去块滤波后的块存储在存储器290中。当重构一个图片中的所有块时,重构的图片被用作对待编码的后续图片中的块进行帧间预测的参考图片。
下文中,将描述视频解码设备。
图6是根据本发明的实施方式的视频解码设备的框图,
视频解码设备包括解码器610、逆量化器620、逆变换器630、预测器640、加法器650、滤波器单元660和存储器670。如图2的视频编码设备的情况下一样,视频编码设备的每个元件都可以被实现为硬件芯片,或者可以被实现为软件,并且微处理器可以被实现为执行与相应元件对应的软件的功能。
解码器610对从视频编码设备接收的经压缩的比特流进行解码,提取与块分离相关的信息以确定待解码的当前块,并输出恢复当前块所必需的预测信息和关于残余信号的信息。
解码器610从序列参数集(SPS)或图片参数集(PPS)中提取关于CTU size的信息,确定CTU的大小,并且将图片分离成确定大小的CTU。然后,解码器610确定CTU是树结构的最上层(即,根节点),并提取关于CTU的分离信息,以使用树结构来分离CTU。例如,当使用QTBT结构来分离CTU时,首先提取与QT分离相关的第一标志(QT_split_flag),并且将每个节点分离成下层的四个节点。对于与QT的叶节点对应的节点,提取与BT分离相关的第二标志(BT_split_flag)和分离类型,以在BT结构中分离QT的叶节点。
在图3的块分离结构的示例中,提取与QTBT结构的最上层的节点对应的QT_split_flag。由于所提取的QT_split_flag的值为1,因此最上层的节点被分离成下层(QT的层1)的四个节点。然后,提取层1的第一节点的QT_split_flag。由于所提取的QT_split_flag的值为0,因此在QT结构中不进一步分离层1的第一节点。
由于QT的层1的第一节点是QT的叶节点,因此该操作是在采用QT的层1的第一节点作为BT的根节点的BT之前进行的。提取与BT的根节点即“(层0)”对应的BT_split_flag。由于BT_split_flag为1,因此BT的根节点被分离成“(层1)”的两个节点。由于BT的根节点被分离,因此提取指示与BT的根节点对应的块是被垂直分离还是被水平分离的分离类型信息。由于分离类型信息为1,因此与BT的根节点对应的块被垂直分离。然后,解码器610从BT的根节点提取被分离的“(层1)”的第一节点的BT_split_flag。由于BT_split_flag为1,因此提取关于“(层1)”的第一节点的块的分离类型信息。由于关于“(层1)”的第一节点的块的分离类型信息为1,因此“(层1)”的第一节点的块被垂直分离。然后,提取从BT的根节点分离出的“(层1)”的第二节点的BT_split_flag。由于BT_split_flag为0,因此节点没有按BT被进一步分离。
以这种方式,解码器610递归地提取QT_split_flag并在QT结构中分离CTU。解码器610提取QT的叶节点的BT_split_flag。当BT_split_flag指示分离时,提取分离类型信息。以这种方式,解码器610可以确认CTU被分离成如图3的(a)中所示的结构。
当在SPS或PPS中另外定义了诸如MinQTSize、MaxBTSize、MaxBTDepth和MinBTSize这样的信息时,解码器610提取附加信息并使用附加信息来提取关于QT和BT的分离信息。
例如,在QT中,大小与MinQTSize相同的块没有被进一步分裂。因此,解码器610不从比特流中提取与块的QT相关的分离信息(QT分离标志)(即,比特流中没有块的QT分离标志),并且将对应的值自动地设置成0。另外,在QT中,大小比MaxBTSize大的块不具有BT。因此,解码器610不在QT中提取具有比MaxBTSize大的块的叶节点的BT分离标志,并自动地将BT分离标志设置为0。另外,当BT的对应节点的深度达到MaxBTDepth时,节点的块没有被进一步分离。因此,不从比特流中提取节点的BT分离标志,并且将该BT分离标志的值自动地设置为0。另外,在BT中的大小与MinBTSize相同的块没有被进一步分离。因此,解码器610不从比特流中提取大小与MinBTSize相同的块的BT分离标志,并且将标志的值自动地设置为0。
在一实施方式中,当通过分离树结构来确定待解码的当前块时,解码器610提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。
当预测类型信息指示帧内预测时,解码器610解析关于当前块的帧内预测信息的语法元素(帧内预测模式)。首先,解码器610解析指示是否从MPM列表中选择了当前块的帧内预测模式的模式信息(即,MPM标志)。通常,当帧内模式编码信息指示从MPM列表中选择了当前块的帧内预测模式时,解码器610解析指示MPM的哪一种模式被选定为当前块的帧内预测模式的第一帧内识别信息。当帧内模式编码信息指示未从MPM列表中选择了当前块的帧内预测模式时,解码器610解析指示除了MPM之外的剩余模式(即,非MPM)中的哪一种被选定为当前块的帧内预测模式的第二帧内识别信息。另选地,根据本发明的一方面的解码器610解析指示用于预测当前块的帧内模式所属的MPM和/或非MPM的组的帧内识别信息(例如,组索引等),而非解析MPM和/或非MPM中的哪一种模式被选定为预测当前块的帧内预测模式的帧内识别信息。
在一实施方式中,解码器610提取关于当前块的量化变换系数的信息作为关于残余信号的信息。
逆量化器620对量化后的变换系数进行逆量化。逆变换器630将逆量化后的变换系数从频域逆变换到空间域,以重构残余信号,并由此生成当前块的残余块。
预测器640包括帧内预测器642和帧间预测器644。当当前块的预测类型是帧内预测时,帧内预测器642被启动,并且当当前块的预测类型是帧间预测时,帧间预测器644被启动。
帧内预测器642用从解码器610解析的帧内预测模式的语法元素确定多种帧内预测模式当中的当前块的帧内预测模式,并根据该帧内预测模式使用当前块周围的参考样本来预测当前块。
为了确定当前块的帧内预测模式,帧内预测器642用当前块周围的邻近块来构造包括预定数目的MPM的MPM列表。构造MPM列表的方法与针对图2的帧内预测器222的方法相同。
通常,当帧内预测模式信息(即,MPM标志)指示从MPM列表中选择了当前块的帧内预测模式时,帧内预测器642选择MPM列表中的MPM当中的由第一帧内识别信息所指示的MPM作为当前块的帧内预测模式。另一方面,当模式信息指示未从MPM中选择当前块的帧内预测模式时,帧内预测器使用第二帧内识别信息来从MPM列表中的除了MPM之外的帧内预测模式当中选择帧内预测模式作为当前块的帧内预测模式。
另选地,如上所述,根据本发明的一方面的视频编码设备的帧内预测器222可以对MPM和/或非MPM进行分组,并且可以用信号通知预测当前块的帧内模式所属的组的索引,而不是显式地用信号通知MPM和/或非MPM中的哪一种被选定为预测当前块的帧内预测模式。在这种情况下,视频解码设备的帧内预测器642可以通过评估属于索引所指示的组的帧内模式来确定最佳帧内模式(即,用于预测当前块的帧内模式)。例如,在一些实施方式中,帧内预测器642可以为属于该组的多种帧内模式生成重构的块,并且评估重构的块以确定最佳帧内模式。
帧间预测器644使用由解码器610提取的帧内预测模式的语法元素来确定关于当前块的运动信息,并且使用所确定的运动信息来预测当前块。
加法器650将从逆变换器630输出的残余块与从帧内预测器642或帧间预测器644输出的预测块相加,以恢复当前块。重构的当前块中的像素被用作用于对稍后待解码的块进行帧内预测的参考像素。
滤波器单元660对重构的块之间的边界进行去块滤波以便去除由逐块编码引起的块效应,并且将去块滤波后的块存储在存储器290中。当重构一个图片中的所有块时,重构的图片被用作对待解码的后续图片中的块进行帧间预测的参考图片。
下面描述的技术涉及帧内编码。可以由例如在图2和图6中示出的并且参照图2和图6描述的视频编码设备和视频解码设备执行本公开的技术。也就是说,在一个示例中,当在对视频数据的块进行编码期间执行帧内预测时,参照图2描述的帧内预测器222可以执行下面描述的一些技术。在另一个示例中,当在对视频数据的块进行解码期间执行帧内预测时,参照图6描述的帧内预测器642可以执行下面描述的一些技术。
本公开的技术旨在凭借对增加的帧内预测模式进行分组来改善压缩性能。在下面描述的示例性实施方式中,假定帧内预测模式的数目为67,包括65种定向模式和2种非定向模式,如图4中所示。为了简便起见,对于结合MPM参照的帧内模式的模式编号(或原始索引),如图1中所示采用支持35种帧内模式的标准HEVC中使用的模式编号。然而,应该理解,帧内模式的数目、MPM的数目、非MPM的数目、组的数目以及MPM的类型或设置方法仅仅是示例性的,并且其各种组合在本发明的范围内是可能的。
下文中,将参照表1来描述本发明的第一实施方式。
[表1]
在该实施方式中,使用三个MPM。因此,64种帧内模式仍然是非MPM。在这种情况下,可以使用标准HEVC中所使用的方法来确定属于MPM的帧内模式。例如,使用当前块周围的邻近块和/或在统计上最频繁使用的默认帧内模式来选择当前块的三个MPM。
当当前块的帧内模式与MPM中的一种相同时,视频编码设备用信号通知指示使用MPM对当前块进行编码的1比特MPM标志。另外,视频编码设备以显式地指示这三个MPM当中的帧内预测模式的方式执行信令。例如,根据一些实施方式,视频编码设备可以用信号通知识别MPM的索引。视频编码设备可以根据MPM的总数和确定MPM的顺序来分配用于识别各MPM的索引。例如,如果MPM的总数为3,则索引值“0”被指派给最先确定的当前块的左块L的帧内模式,并且索引值“1”被分派给接下来确定的当前块的上块A的帧内模式。索引值“2”被指派给最后确定的当前块的上左块AL的帧内模式。视频编码设备可使用例如可变长度表或诸如截断一元(TU)这样的其它二值化方法来用信号通知用于识别MPM的索引。
视频编码设备和视频解码设备从多种帧内模式当中去除MPM,并生成剩余模式(即,非MPM)的列表。视频编码设备和视频解码设备将非MPM分成多个组,并且将组索引号指派给所述多个组。组的数目可以根据非MPM的数目而变化。在该实施方式中,在表1中示例性地示出了当组的数目被设置为4、8和16时所需的比特数目。另外,帧内模式不必被等分为多组(如表1中例示的)。可以在视频编码设备和视频解码设备之间就组的数目达成一致,并且另选地,可以用信号通知(例如,由视频编码设备用信号通知的以便供视频解码设备使用的)从多个可能的组数目当中选择的数目。
在一些实施方式中,在扫描残余块的变换系数时使用相同扫描顺序的帧内模式可以被归类为同一组。在标准HEVC中,帧内模式#6至#14使用垂直扫描顺序,帧内模式#22至#30使用水平扫描顺序,而其它帧内模式使用对角线扫描顺序。考虑到这些扫描顺序,视频编码设备和视频解码设备可以执行分组,使得帧内模式被归类为具有相同扫描顺序的组。当然,使用相同扫描顺序的帧内模式不一定被归类为单个组,而是可以被归类为至少两个组。在一些其它实施方式中,可以根据帧内模式的模式编号以升序对非MPM的列表进行排序,并且按降序排序的帧内模式可以被分成多个组。在一些其它实施方式中,帧内模式可以按模式编号的整数倍进行分组。例如,在将模式分成两组时,具有奇数模式编号的模式可以被归类为第一组,而具有偶数编号的模式可以被分类为第二组。又如,在将模式分成四个组时,“模式#0、模式#4、模式#8、…”可以被归类为第一组,“模式#1、模式#5、模式#9、…”可以被归类为第二组,“模式#2、模式#6、模式#10、…”可以被归类为第三组,并且“模式#3、模式#7、模式#11、...”可以被归类为第四组。在一些其它实施方式中,视频编码设备可以具有按一些规则定义的分组,并且可以用信号通知(例如,由视频编码设备用信号通知以便供视频解码设备使用)这些规则。
如果当前块的帧内模式与MPM不同,则视频编码设备用信号通知指示未使用MPM对当前块进行编码的1比特MPM标志。另外,视频编码设备还用信号通知当前块的帧内模式所属的组的索引。
视频解码设备可以通过评估属于该组的帧内模式来确定最佳帧内模式。例如,在一些实施方式中,视频解码设备可以为属于该组的多种帧内模式生成当前块的重构块,并且评估重构块以确定最佳帧内模式。换句话说,视频解码设备可以针对每种帧内模式测量当前块的重构块的特定部分(例如,上部和最左上部)的像素的值与待解码的空间上邻近的块的重构像素的值之间的误差成本。视频解码设备可以选择误差成本最小的帧内模式作为待编码的当前块的最佳帧内模式。作为误差测量方法,可以使用绝对差之和(SAD)、平方差之和(SSD)、均方误差(MSE)等。
如表1中例示的,随着每组的模式的数目增加,指定当前块的帧内模式所属的组所需的比特的数目减少,而为了使视频解码设备评估属于该组的帧内模式而生成的预测块的数目增加。例如,当64个非MPM被分成四个组时,每组中包括16种帧内模式。需要用2比特来指定这四个非MPM组当中的当前块的帧内模式所属的组(的索引),因此,视频编码设备可以使用总共3个比特(1比特的MPM标志+用于指定该组的2比特)用信号通知作为非MPM的当前块的帧内预测模式。视频解码设备需要生成16个预测块,以便评估属于该组的16种帧内模式。当64个非MPM被分成8个组时,每组中包括8种帧内模式。需要用3比特来指定这8个非MPM组当中的当前块的帧内模式所属的组(的索引)。因此,视频编码设备可以使用总共4比特(1比特的MPM标记+用于指定该组的3比特)用信号通知作为非MPM的当前块的帧内预测模式。可以在考虑到用信号通知作为非MPM的当前块的帧内预测模式所需的比特数目以及视频解码设备的计算复杂度的情况下适当地设置组的数目。在该实施方式中,固定长度(FL)方法被用作表示组索引的方法。然而,这仅仅是示例。显而易见,也可以使用诸如TU(截断一元)这样的其它二值化方法。
下文中,将参照表2来描述本发明的第二实施方式。
[表2]
在该实施方式中,使用三个MPM。因此,64种帧内模式仍然是非MPM。这里,可以使用标准HEVC中所使用的方法来确定属于MPM的帧内模式。例如,使用当前块周围的邻近块和/或在统计上最频繁使用的默认帧内模式来选择当前块的三个MPM。
视频编码设备和视频解码设备可以将MPM分组为与非MPM的组区分开的组。当当前块的帧内模式与MPM中的一种相同时,视频编码设备用信号通知1比特MPM标志。也就是说,视频编码设备没有显式地用信号通知当前块的帧内模式,而是仅用信号通知指示使用MPM对当前块进行编码的1比特MPM标志。当基于MPM标志确定了当前块的帧内模式与MPM中的一种相同时,视频解码设备评估属于MPM的帧内模式,以确定最佳帧内模式。
用信号通知非MPM与和表1相关的第一实施方式相同。
下文中,将参照表3来描述本发明的第三实施方式。
[表3]
在该实施方式中,使用五个MPM。因此,62种帧内模式仍然是非MPM。在这种情况下,在统计上最频繁使用的模式(例如,平面模式、DC模式、垂直模式、水平模式、对角线模式(图1中的对角线模式34))可以被设置为MPM。
当当前块的帧内模式与MPM相同时,视频编码设备用信号通知指示使用MPM对当前块进行编码的1比特MPM标志。另外,视频编码设备以显式地指定这五个MPM当中的帧内预测模式的方式执行信令。
用信号通知非MPM与和表1相关的第一实施方式基本上相同。然而,可以不为所有组都指派相同数目的帧内模式。这是视频编码设备与视频解码设备之间的一致,并且没有引起任何问题。
下文中,将参照表4来描述本发明的第四实施方式。
[表4]
在该实施方式中,使用五个MPM。因此,62种帧内模式仍然是非MPM。在这种情况下,作为在统计上最频繁使用的模式的平面模式、DC模式、垂直模式、水平模式和对角线模式(图1中的对角线模式34)可以被设置为MPM。
视频编码设备和视频解码设备将这五个MPM归类为一组或两组。在一些实施方式中,MPM被归类为与非MPM的组区分开的一个组。当当前块的帧内模式与MPM相同时,视频编码设备用信号通知1比特MPM标志。也就是说,视频编码设备没有显式地用信号通知当前块的帧内模式,而是用信号通知指示使用MPM对当前块进行编码的1比特MPM标志。在基于MPM标志确定了当前块的帧内模式与MPM中的一种相同时,视频解码设备评估属于MPM的帧内模式,以确定最佳帧内模式。在一些其它实施方式中,MPM被分成两个组。当当前块的帧内模式与MPM相同时,视频编码设备用信号通知1比特MPM标志和当前块的帧内模式所属的组的索引。可以在视频编码设备和视频解码设备之间就MPM组的数目达成一致,并且可以用信号通知(例如,由视频编码设备用信号通知以便供视频解码设备使用)从多个可能的组数目当中选择的数目。
在一些实施方式中,在扫描残余块的变换系数时使用相同扫描顺序的MPM可以被归类为同一组。在一些其它实施方式中,视频编码设备和视频解码设备可以按确定MPM的顺序将MPM分成多个组。在一些其它实施方式中,可以根据帧内模式的模式编号以升序对非MPM的列表进行排序,并且按升序排序的帧内模式可以被分成多个组。在一些其它实施方式中,视频编码设备可以用信号通知分组方法。
用信号通知非MPM与和表1相关的第一实施方式基本上相同。然而,可以不为所有组都指派相同数目的帧内模式。这是视频编码设备与视频解码设备之间的一致,并且没有引起任何问题。
下文中,将参照表5来描述本发明的第五实施方式。
[表5]
在该实施方式中,使用六个MPM。因此,61种帧内模式仍然是非MPM。在这种情况下,在确定属于MPM的帧内模式时,可以使用以上参照图5描述的方法。
用信号通知MPM和用信号通知非MPM与和表1相关的第一实施方式基本上相同。
下文中,将参照表6来描述本发明的第六实施方式。
[表6]
在该实施方式中,使用六个MPM。因此,61种帧内模式仍然是非MPM。在这种情况下,在确定属于MPM的帧内模式时,可以使用以上参照图5描述的方法。
用信号通知MPM和用信号通知非MPM与和表4相关的第四实施方式基本上相同。
下文中,将参照表7来描述本发明的第七实施方式。
[表7]
在该实施方式中,使用七个MPM。因此,60种帧内模式仍然是非MPM。在这种情况下,MPM可以被设置为在统计上最频繁使用的平面模式、DC模式、垂直模式、水平模式和三种对角线模式(图1中的定向模式2、18和34)。
用信号通知MPM和用信号通知非MPM与和表1相关的第一实施方式中的基本上相同。
下文中,将参照表8来描述本发明的第八实施方式。
[表8]
在该实施方式中,使用七个MPM。因此,60种帧内模式仍然是非MPM。在这种情况下,MPM可以被设置为在统计上最频繁使用的平面模式、DC模式、垂直模式、水平模式和三种对角线模式(图1中的定向模式2、18和34)。
用信号通知MPM和用信号通知非MPM与和表4相关的第四实施方式基本上相同。
下文中,将参照表9来描述本发明的第九实施方式。
[表9]
在该实施方式中,使用七个MPM。因此,60种帧内模式仍然是非MPM。在这种情况下,MPM可以被设置为在统计上最频繁使用的平面模式、DC模式、垂直模式、水平模式和三种对角线模式(图1中的定向模式2、18和34)。
用信号通知MPM与和表8相关的第八实施方式中的基本上相同。然而,下面描述的用信号通知非MPM与先前的实施方式不同。
视频编码设备和视频解码设备将60个非MPM当中的四个在统计上频繁使用的定向模式(例如,图1中的定向模式6、14、22和30,即,接下来最可能模式)和其它(56种)帧内模式归类为不同的组。视频编码设备用信号通知指示当前块的帧内模式属于这两个组之中的哪一个组的1比特标志值。
当当前块的帧内模式在接下来最可能模式所属的组中时,视频编码设备还用信号通知2比特,以指定这四种帧内模式中的哪一种被用于当前块。
当当前块的帧内模式不在接下来最可能模式所属的组中时,视频编码设备将其它56种帧内模式分成多个组,然后用信号通知对应组的索引。这里,可以根据其它帧内模式的数目来改变组的数目。在该实施方式中,组的数目被设置为8,并且还用信号通知3比特以指定组。
下文中,将参照表10来描述本发明的第十实施方式。
[表10]
在该实施方式中,使用七个MPM。因此,60种帧内模式仍然是非MPM。在这种情况下,MPM可以被设置为作为在统计上最频繁使用的平面模式、DC模式、垂直模式、水平模式和三种对角线模式(图1中的定向模式2、18和34)。
用信号通知MPM与和表8相关的第八实施方式基本上相同。然而,下面描述的用信号通知非MPM与先前的实施方式不同。
视频编码设备和视频解码设备将这60个非MPM当中的四个最频繁使用的定向模式(例如,图1中的定向模式6、14、22和30,即,接下来最可能模式)和其它帧内模式归类为不同的组。视频编码设备用信号通知指示当前块的帧内模式属于这两个组之中的哪一个组的1比特标志值。
与和表9相关的第九实施方式相比,当当前块的帧内模式在接下来最可能模式所属的组中时,视频编码设备没有显式地用信息通知这四种帧内模式中的哪一种被用于当前块。在这种情况下,视频解码设备可以通过评估属于该组的四种(接下来最可能)定向模式来确定最佳帧内模式。
当当前块的帧内模式不在接下来最可能模式所属的组中时,视频编码设备将其它56种帧内模式分成多个组,然后用信号通知对应组的索引。这里,可以根据其它帧内模式的数目来改变组的数目。如表10中所示,在该实施方式中,组的数目被设置为8。
对于色度,除了平面模式、垂直模式、水平模式和DC模式之外,帧内预测模式还可以包括两种特殊模式,即直接模式(Intra_DM)和线性模式(Intra_LM)。在这些模式当中,频繁使用的模式可以被用标志定义或用截断一元表示的最小数字表示,并且其它模式可以如以上示例中一样被分组。例如,当最频繁使用的是直接模式时,可以根据截断一元方案用信号通知或用一个数字表示指示模式是否被用作开(on)/关(off)的标志。
如上所述,在参照表1至表10描述的各个实施方式中,视频编码设备可以用信号通知预测当前块的帧内模式所属的组的索引,而不是用信号通知MPM列表和/或非MPM列表中的与预测当前块的帧内模式对应的模式的索引。在这种情况下,视频解码设备可以通过评估属于该组的帧内模式来确定最佳帧内模式(即,用于预测当前块的帧内模式)。例如,在一些实施方式中,视频解码设备可以根据属于该组的多种帧内模式中的每一种生成相应的重构块,并且评估重构块以确定最佳帧内模式。
与显式地指定许多种帧内模式当中的一种模式的传统信令方法相比,通过指定多个组当中的一个组来减小开销。结果,压缩效率提高。与显式地指定当前块的帧内模式的传统方法相比,视频解码设备的计算量增加。然而,鉴于视频解码设备的系统性能不断提高的趋势,视频解码设备可以实时地评估几种帧内模式。
为了针对多种帧内模式中的每一种生成重构块,视频解码设备需要针对属于一组的多个帧内模式生成各自的预测块,并且用比特流信息生成残余块。
基于根据所应用的帧内模式确定的扫描顺序来生成当前块的残余块的变换系数。例如,在有35种帧内模式可用的标准HEVC中,帧内模式#6至#14遵循垂直扫描顺序,帧内模式#22至#30遵循水平扫描顺序,而其它模式遵循对角线扫描顺序。根据本发明,视频解码设备选择当前块的帧内模式,因此,在选择最终帧内模式之前,无法知道残余块的变换系数的扫描顺序。为了解决该问题,可以以每个组仅包括在扫描残余块的变换系数时使用相同扫描顺序的帧内模式的方式执行帧内模式分组。当MPM被分组时,使用相同扫描顺序的帧内模式可以被归类为一个组,或者共同应用于帧内模式的组中的最大数目的帧内模式的扫描顺序可以被选定为该组的代表性扫描顺序。另选地,可以使用一种特定的扫描顺序(例如,对角线扫描顺序)。
图7是例示按照本发明的以上示例中的一个或更多个的对视频数据进行编码的示例性方法的流程图。在图7的示例性方法中,视频编码设备确定预测视频数据的当前块的帧内模式。帧内模式可以是指许多空间压缩模式中的任一种。
视频编码设备确定用于预测视频数据的当前块的MPM并且生成MPM的列表(S710)。例如,可以识别先前编码的邻近块的帧内预测模式,并且在生成当前块的MPM列表时考虑这些帧内预测模式。另选地,可以基于与预测当前块的帧内模式一致的可能性相关的统计来预先确定MPM。
视频编码设备确定当前块的帧内模式是否与MPM列表中的任一种模式一致(S720)。
当MPM中的任一种与预测当前块的帧内模式不同时,视频编码设备对指示用于预测当前块的帧内模式不是MPM的1比特MPM标志进行编码(S730)。
视频编码设备去除帧内模式(例如,HEVC中的35种帧内模式)当中的MPM,以生成非MPM的列表。另外,视频编码设备将非MPM的列表中的帧内模式分组成多个组(S740)。在一些实施方式中,在扫描残余块的变换系数时使用相同扫描顺序的帧内模式可以被归类为同一组。在一些其它实施方式中,可以根据帧内模式的模式编号以升序对非MPM的列表进行排序,并且按升序排序的帧内模式可以被分成多个组。在一些其它实施方式中,帧内模式可以按模式数目的整数倍进行分组。在一些其它实施方式中,视频编码设备可以具有按一些规则定义的分组,并且可以用信号通知(例如,由视频编码设备用信号通知以便供视频解码设备使用)所述规则。
视频编码设备分配用于识别非MPM的列表中的每个组的组索引(S750)。视频编码设备对指示当前块的帧内模式在非MPM的列表中所属的组的索引的数据进行编码(S760)。
当MPM中的一种与预测当前块的帧内模式相同时,视频编码设备对指示用于预测当前块的帧内模式是MPM的1比特MPM标志进行编码(S731)。在一些实施方式中,视频编码设备可以对1比特MPM标志进行编码,然后对指示MPM的列表中的与当前块的帧内模式相同的MPM的索引的数据进行编码。例如,视频编码设备可以根据确定MPM的顺序来分配用于识别每个MPM的索引。在一些其它实施方式中,视频编码设备可以仅仅对1比特MPM标志进行解码,而没有对指示MPM列表中的与当前块的帧内模式相同的MPM的索引的数据进行编码。
图8是例示按照本发明的以上示例中的一个或更多个的对视频数据进行编码的另一示例性方法的流程图。
在图8的示例性方法中,S810、S820、S830、S840、S850和S860分别与图7的S710、S720、S730、S740、S750和S760相同。在图8的示例性方法中,当MPM中的一种与预测当前块的帧内模式相同时,视频编码设备对指示用于预测当前块的帧内模式是MPM的1比特MPM标志进行编码(S831)。
视频编码设备将MPM的列表中的帧内模式分组成多个组。在一些实施方式中,在扫描残余块的变换系数时使用相同扫描顺序的帧内模式可以被归类为同一组。在一些其它实施方式中,视频编码设备可以根据确定MPM的顺序对相应的MPM进行分组。在一些其它实施方式中,视频编码设备可以根据帧内模式的模式编号按升序对MPM的列表进行排序,并且将按升序排序的帧内模式分成多个组。在一些其它实施方式中,可以按一些规则定义分组,并且可以用信号通知(例如,由视频编码设备用信号通知以便供视频解码设备使用)所述规则。
视频编码设备分配用于识别MPM的列表中的每个组的组索引(S851)。视频编码设备对指示当前块的帧内模式在MPM的列表中所属的组的索引的数据进行编码(S861)。然而,当组的数目是1时,不对指示组的索引的数据进行编码。
图9是例示按照本发明的以上示例中的一个或更多个的对视频数据进行解码的示例性方法的流程图。在图9的示例性方法中,视频解码设备确定当前块的MPM并且生成MPM的列表(S910)。例如,视频解码设备可以生成MPM的列表并且将索引值分配给该列表中的各个MPM。例如,视频解码设备可以根据确定MPM的顺序来分配用于识别每个MPM的索引。
视频解码设备对指示用于预测当前块的帧内模式是否是MPM的MPM标志进行解码(S920)。
当MPM标志的值指示用于预测当前块的帧内模式不是MPM(图9中的MPM标志=1)时,如在视频编码设备的情况下一样,视频解码设备去除帧内模式当中的MPM以生成非MPM的列表,并且将非MPM的列表中的帧内模式分组成多个组(S930)。另外,视频解码设备可以分配用于识别非MPM的列表中的每个组的组索引。
视频解码设备从经编码的比特流中对指示当前块的帧内模式在非MPM的列表中所属的组的索引的数据进行解码(S940)。
视频解码设备使用经解码的组的索引来识别非MPM的列表中的属于与经解码的组的索引对应的组的帧内模式(S950)。
视频解码设备评估所识别的当前块的帧内模式,并且确定预测当前块的帧内模式(S960)。例如,在一些实施方式中,视频解码设备可以生成重构块并且针对属于一组的多种帧内模式评估重构块,以确定最佳帧内模式。
当MPM标志的值指示用于预测当前块的帧内模式是MPM(图9中的MPM标志=0)时,视频解码设备从经编码的比特流中对指示MPM的列表中的与当前块的帧内模式相同的MPM的索引的数据进行解码(S931)。视频解码设备使用与当前块的帧内模式相同的MPM的索引来识别MPM的列表中的用于预测当前块的帧内模式(S941)。视频解码设备可以以所识别的当前块的帧内模式对当前块进行解码。
图10是例示按照本发明的以上示例中的一个或更多个的对视频数据进行解码的另一示例性方法的流程图。
在图10的示例性方法中,S1010、S1020、S1030、S1040、S1050和S1060分别与图9的S910、S920、S930、S940、S950和S960相同。在图10的示例性方法中,当MPM标志的值指示用于预测当前块的帧内模式是MPM(图9中的MPM标志=0)时,如在视频编码设备的情况下一样,视频解码设备将MPM的列表中的帧内模式分组成多个组(S1031)。视频解码设备可以分配用于识别MPM的列表中的每个组的组索引。
视频解码设备从经编码的比特流中对指示当前块的帧内模式在MPM的列表中所属的组的索引的数据进行解码(S1041)。然而,当组的数目为1时,视频解码设备可以不对指示组的索引的数据进行解码,而是可以自动地将其值设置为0。
视频解码设备使用经解码的组的索引来识别MPM的列表中的属于与经解码的组的索引对应的组的帧内模式(S1051)。
视频解码设备评估所识别的当前块的帧内模式,并且确定预测当前块的帧内模式(S1061)。例如,在一些实施方式中,视频解码设备可以生成重构块并且针对属于一组的多种帧内模式评估重构块,以确定最佳帧内模式。
图11是例示用于在帧内预测编码时生成预测块的参考样本的图。
在上述实施方式中,对于用于预测当前块的参考样本,可以使用如图11的(b)中所示的与待编码的块1101紧邻的一行的重构像素值,或者可以使用如图11的(b)中所示的多行中的信息。
可以考虑使用多个行生成参考样本的三种方法。第一种方法是从n个预定行当中选择一个最佳行,使用所选择的行来生成参考样本的值,并且用信号通知关于这一行的位置信息。第二种方法是使用n个行的信息来生成参考样本的值。在这种情况下,不需要单独的信令信息。第三种方法是使用n个行中的m(m<n)行的信息来生成参考样本,并且需要用信号通知m行的信息。
当使用多个(n或m)行来生成参考样本时,可以简单地使用平均值来生成参考样本,或者可以通过向与待编码的块1102相邻的行指派更高的权重而估计平均值来生成参考样本。在这种情况下,这些操作应该由视频编码设备和视频解码设备以相同的方式执行。
虽然已经出于例示目的描述了示例性实施方式,但是本领域技术人员应该领会的是,能够在不脱离所述实施方式的构思和范围的情况下进行各种修改和改变。为了简明扼要,已经描述了示例性实施方式。因此,普通技术人员将理解,所述实施方式的范围不由以上明确描述的实施方式限制,而是包括在权利要求及其等同物中。
相关申请的交叉引用
本申请要求于2016年10月19日在韩国提交的专利申请No.10-2016-0136068以及于2017年2月1日在韩国提交的专利申请No.10-2017-0014634的在35U.S.C§119(a)下的优先权,这两个专利申请的全部内容以引用方式并入本文中。另外,以基于其全部内容特此以引用方式并入的所述韩国专利申请的相同的理由,该非临时申请要求除美国之外的国家中的优先权。

Claims (7)

1.一种用于对视频数据进行编码的方法,所述方法包括以下步骤:
对指示在与所述视频数据的当前块相邻的多个参考行当中选择的一个参考行的位置信息进行编码;
对指定用于预测所述当前块的所述当前块的帧内模式的帧内模式数据进行编码;
基于所述当前块的所述帧内模式使用由所述位置信息指示的所述参考行来预测所述当前块以生成预测块;
基于所述预测块来生成所述当前块的残余块;以及
对指定所述当前块的所述残余块的残余数据进行编码,
其中,对所述帧内模式数据进行编码的步骤包括以下步骤:
当所述当前块的所述帧内模式为最可能模式MPM时,对指定多个MPM当中的所述当前块的所述帧内模式的一个或更多个语法元素进行编码,
其中,所述多个MPM被分类为两个MPM组并且至少包括从与所述当前块相邻的重构的块推导的多个帧内模式和平面模式,并且
其中,所述一个或更多个语法元素包括以下各项中的至少一者:
第一语法元素,所述第一语法元素指示所述当前块的所述帧内模式属于所述两个MPM组中的哪一MPM组;以及
第二语法元素,所述第二语法元素指示属于由所述第一语法元素指示的MPM组的所述MPM中的一者。
2.根据权利要求1所述的方法,其中,对所述帧内模式数据进行编码的步骤还包括以下步骤:
当所述当前块的所述帧内模式不是MPM时,通过从可用帧内模式去除所述MPM来生成非MPM的列表;
根据所述帧内模式的模式值按升序对所述非MPM进行排序;
将按所述升序排序的所述帧内模式分成多个非MPM组;以及
对指示所述当前块的所述帧内模式所属的非MPM组的语法元素进行编码,而不对指示由所述语法元素指示的所述非MPM组内的与所述当前块的所述帧内模式相同的非MPM的索引的数据进行编码。
3.根据权利要求1所述的方法,其中,对所述帧内模式数据进行编码的步骤还包括以下步骤:
当所述当前块的所述帧内模式不是MPM时,通过从可用帧内模式去除所述MPM来生成非MPM的列表;
将所述非MPM分成多个非MPM组,使得属于同一非MPM组的帧内模式在扫描残余块的变换系数时使用相同扫描顺序;以及
对指示所述当前块的所述帧内模式所属的非MPM组的语法元素进行编码,而不对指示由所述语法元素指示的所述非MPM组内的与所述当前块的所述帧内模式相同的非MPM的索引的数据进行编码。
4.一种用于对视频数据进行解码的方法,所述方法包括以下步骤:
从比特流解码指示在与所述视频数据的当前块相邻的多个参考行当中选择的一个参考行的位置信息;
从所述比特流解码指定用于预测所述当前块的所述当前块的帧内模式的帧内模式数据;
基于所述当前块的所述帧内模式使用由所述位置信息指示的所述参考行来预测所述当前块以生成所述当前块的预测块;
从所述比特流解码所述当前块的残余块;以及
基于所述预测块和所述残余块来重构所述当前块,
其中,对所述帧内模式数据进行解码的步骤包括以下步骤:
当所述当前块的所述帧内模式为最可能模式MPM时,对指定多个MPM当中的所述当前块的所述帧内模式的一个或更多个语法元素进行解码,并且
其中,所述多个MPM被分类为两个MPM组并且至少包括从与所述当前块相邻的重构的块推导的多个帧内模式和平面模式,并且
其中,所述一个或更多个语法元素包含以下各项中的至少一者:
第一语法元素,所述第一语法元素指示所述当前块的所述帧内模式属于所述两个MPM组中的哪一MPM组;以及
第二语法元素,所述第二语法元素指示属于由所述第一语法元素指示的MPM组的所述MPM中的一者。
5.根据权利要求4所述的方法,其中,对所述帧内模式数据进行解码的步骤还包括以下步骤:
当所述当前块的所述帧内模式不是MPM时,通过从可用帧内模式去除所述MPM来生成非MPM的列表;
根据所述帧内模式的模式值按升序对所述非MPM进行排序;
将按所述升序排序的所述帧内模式分成多个非MPM组;以及
对指示所述当前块的所述帧内模式所属的非MPM组的语法元素进行解码,并且
其中,帧内预测器还被配置为评估属于所述语法元素所指示的所述非MPM组的所述非MPM,以确定所评估的非MPM当中的所述当前块的所述帧内模式。
6.根据权利要求4所述的方法,其中,对所述帧内模式数据进行解码的步骤还包括以下步骤:
当所述当前块的所述帧内模式不是MPM时,通过从可用帧内模式去除所述多个MPM来生成非MPM的列表;
将所述非MPM分成多个非MPM组,使得属于同一组的帧内模式在扫描残余块的变换系数时使用相同扫描顺序;以及
还对指示用于预测所述当前块的所述帧内模式所属的非MPM组的语法元素进行解码,并且
其中,帧内预测器还被配置为评估属于所述语法元素所指示的所述非MPM组的所述非MPM,以确定所评估的非MPM当中的所述当前块的所述帧内模式。
7.一种用于存储经编码的视频数据的比特流的方法,所述方法包括以下步骤:
接收待被编码的视频数据;
通过执行编码处理来将所述视频数据编码为比特流;以及
将所述比特流存储在存储装置中,
其中,所述编码处理包括以下步骤:
对指示在与所述视频数据的当前块相邻的多个参考行当中选择的一个参考行的位置信息进行编码;
对指定用于预测所述当前块的所述当前块的帧内模式的帧内模式数据进行编码;
基于所述当前块的所述帧内模式使用由所述位置信息指示的所述参考行来预测所述当前块以生成所述当前块的预测块;
基于所述预测块生成所述当前块的残余块;以及
对所述当前块的所述残余块进行编码,
其中,对所述帧内模式数据进行编码的步骤包括以下步骤:
当所述当前块的所述帧内模式为最可能模式MPM时,对指定多个MPM当中的所述当前块的所述帧内模式的一个或更多个语法元素进行编码,
其中,所述多个MPM被分类为两个MPM组并且至少包括从与所述当前块相邻的重构的块推导的多个帧内模式和平面模式,并且
其中,所述一个或更多个语法元素包括以下各项中的至少一者:
第一语法元素,所述第一语法元素指示所述当前块的所述帧内模式属于所述两个MPM组中的哪一MPM组;以及
第二语法元素,所述第二语法元素指示属于由所述第一语法元素指示的MPM组的所述MPM中的一者。
CN202311054584.6A 2016-10-19 2017-10-17 对视频数据进行编码或解码的方法及存储比特流的方法 Pending CN116915991A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR10-2016-0136068 2016-10-19
KR20160136068 2016-10-19
KR1020170014634A KR20180043149A (ko) 2016-10-19 2017-02-01 영상 부호화 또는 복호화하기 위한 장치 및 방법
KR10-2017-0014634 2017-02-01
CN201780064067.3A CN109863749B (zh) 2016-10-19 2017-10-17 用于对图像进行编码或解码的设备和方法
PCT/KR2017/011455 WO2018074812A1 (ko) 2016-10-19 2017-10-17 영상 부호화 또는 복호화하기 위한 장치 및 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780064067.3A Division CN109863749B (zh) 2016-10-19 2017-10-17 用于对图像进行编码或解码的设备和方法

Publications (1)

Publication Number Publication Date
CN116915991A true CN116915991A (zh) 2023-10-20

Family

ID=62019540

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202311054584.6A Pending CN116915991A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的方法及存储比特流的方法
CN202311051250.3A Pending CN116915989A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的设备及发送比特流的方法
CN202311054646.3A Pending CN116962683A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的方法及存储比特流的方法
CN202311055814.0A Pending CN116916001A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的设备及发送比特流的方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN202311051250.3A Pending CN116915989A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的设备及发送比特流的方法
CN202311054646.3A Pending CN116962683A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的方法及存储比特流的方法
CN202311055814.0A Pending CN116916001A (zh) 2016-10-19 2017-10-17 对视频数据进行编码或解码的设备及发送比特流的方法

Country Status (3)

Country Link
US (3) US11689717B2 (zh)
CN (4) CN116915991A (zh)
WO (1) WO2018074812A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112567740B (zh) * 2018-08-29 2023-03-10 华为技术有限公司 用于帧内预测的方法和装置
EP4277269A3 (en) * 2019-03-23 2024-03-06 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for intra prediction
WO2020221213A1 (en) * 2019-04-27 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Intra sub-block partitioning and multiple transform selection
CN114175635A (zh) * 2019-05-27 2022-03-11 Sk电信有限公司 用于推导帧内预测模式的方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8902978B2 (en) * 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
MX2013013523A (es) 2011-06-17 2014-02-27 Mediatek Inc Metodo y aparato para codificacion de modo de intra predicion.
KR20130027975A (ko) * 2011-09-08 2013-03-18 주식회사 케이티 인트라 예측 모드 부호화/복호화 방법 및 장치
US9036704B2 (en) 2011-10-24 2015-05-19 Infobridge Pte. Ltd. Image decoding method using intra prediction mode
US9154796B2 (en) * 2011-11-04 2015-10-06 Qualcomm Incorporated Intra-mode video coding
KR20130049522A (ko) 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법
KR101620619B1 (ko) * 2012-01-30 2016-05-12 한국전자통신연구원 인트라 예측 모드 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
US11689719B2 (en) 2023-06-27
CN116915989A (zh) 2023-10-20
WO2018074812A1 (ko) 2018-04-26
CN116916001A (zh) 2023-10-20
US20220256143A1 (en) 2022-08-11
CN116962683A (zh) 2023-10-27
US20220264089A1 (en) 2022-08-18
US11689717B2 (en) 2023-06-27
US20220256144A1 (en) 2022-08-11
US11689718B2 (en) 2023-06-27

Similar Documents

Publication Publication Date Title
CN109863749B (zh) 用于对图像进行编码或解码的设备和方法
CN109891883B (zh) 视频编码/解码方法和设备以及存储比特流的记录介质
CN110169065B (zh) 用于对图像进行编码或解码的设备和方法
CN110089113B (zh) 图像编码/解码方法、设备以及用于存储比特流的记录介质
CN111869219B (zh) 对图像进行编码或解码的方法和装置
US11689717B2 (en) Apparatus and method for video encoding or decoding
KR102488123B1 (ko) 인트라 예측을 이용한 영상의 부호화 및 복호화
KR20230010804A (ko) 인트라 예측을 이용한 영상의 부호화 및 복호화
CN111937386A (zh) 通过向分区块应用二次变换来处理视频信号的方法及设备
CN115002459A (zh) 视频解码设备、视频编码设备和非暂时性计算机可读介质
KR20190142717A (ko) 인터 예측 방법 및 이를 이용한 영상 복호화 장치
US20220353505A1 (en) Method for reconstructing residual blocks of chroma blocks, and video decoding apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination