CN113892268A - 基于预测模式估计的帧内预测装置和方法 - Google Patents

基于预测模式估计的帧内预测装置和方法 Download PDF

Info

Publication number
CN113892268A
CN113892268A CN202080037443.1A CN202080037443A CN113892268A CN 113892268 A CN113892268 A CN 113892268A CN 202080037443 A CN202080037443 A CN 202080037443A CN 113892268 A CN113892268 A CN 113892268A
Authority
CN
China
Prior art keywords
prediction mode
block
prediction
intra prediction
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080037443.1A
Other languages
English (en)
Inventor
沈东圭
朴时奈
李钟石
朴俊泽
林和平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Industry Academic Collaboration Foundation of Kwangwoon University
Kia Corp
Original Assignee
Hyundai Motor Co
Industry Academic Collaboration Foundation of Kwangwoon University
Kia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co, Industry Academic Collaboration Foundation of Kwangwoon University, Kia Corp filed Critical Hyundai Motor Co
Priority claimed from PCT/KR2020/003836 external-priority patent/WO2020190077A1/ko
Publication of CN113892268A publication Critical patent/CN113892268A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本实施方案提供了一种帧内预测方法,其由帧内预测装置使用,所述帧内预测方法包括以下步骤:从比特流中对指示使用预测模式块的预测估计模式的模式信息进行解码;以包括预测模式块中的一个或更多个像素的像素组为单位,根据预测模式块周围的多个预先重构的位置处的参考像素的帧内预测模式来估计相应像素组的帧内预测模式;通过利用相应像素组的帧内预测模式,对相应像素组中的像素进行帧内预测。

Description

基于预测模式估计的帧内预测装置和方法
技术领域
本发明涉及在影像编码和解码装置中使用的帧内预测方法,更具体地,本发明涉及这样一种帧内预测方法,其参考先前重构的相邻块的帧内预测模式来推导当前块的帧内预测模式。
背景技术
本部分中描述的内容仅提供关于本发明的背景技术信息,并不构成现有技术。
由于视频数据量大于语音数据量或静止影像数据量,因此在不进行压缩处理的情况下存储或传输视频数据需要大量的硬件资源,包括存储器。
相应地,在存储或传输视频数据时,通常利用编码器来压缩视频数据,以便于存储或传输视频数据。然后,解码器接收压缩后的视频数据,并解压和再现视频数据。用于这种视频的压缩技术包括H.264/AVC和高效率视频编码(High Efficiency Video Coding,HEVC),所述高效率视频编码(HEVC)比H.264/AVC的编码效率提高了大约40%。
然而,影像大小、分辨率和帧速率逐渐增加,并且相应地,要编码的数据量也在增多。因此,需要一种与现有压缩技术相比具有更好的编码效率和更高的影像质量的新压缩技术。
发明内容
技术问题
本发明旨在提供一种帧内预测装置和方法,其用于参考先前重构的相邻块的帧内预测模式来推导当前块的帧内预测模式,利用推导的帧内预测模式来执行帧内预测,并且生成当前块的预测的样本。
技术方案
根据本发明的一个方面,对于由帧内预测装置使用的帧内预测方法,提供了这样一种方法,所述方法包括:从比特流中对指示预测模式块的预测推导模式的使用的模式信息进行解码;对包括预测模式块中的一个或更多个像素的每个像素组,根据预测模式块附近的多个位置处的预先重构的参考像素的帧内预测模式来推导每个像素组的帧内预测模式;以及利用每个像素组的帧内预测模式,对每个像素组中的像素进行帧内预测。
根据本发明的另一方面,提供了一种帧内预测装置,其包括:熵解码单元,其配置为从比特流中对指示预测模式块的预测推导模式的使用的模式信息进行解码;预测模式推导单元,其配置为对包括预测模式块中的一个或更多个像素的每个像素组,根据预测模式块附近的多个位置处的预先重构的参考像素的帧内预测模式,推导每个像素组的帧内预测模式;以及预测样本生成单元,其配置为利用每个像素组的帧内预测模式对每个像素组中的像素执行帧内预测。
有益效果
如上所述,根据实施方案,通过提供这样一种帧内预测装置和方法,能够提高影像编码和解码装置的压缩性能,所述帧内预测装置和方法用于参考先前重构的相邻块的帧内预测模式来推导当前块的帧内预测模式,基于推导的帧内预测模式来执行帧内预测,以及生成当前块的预测的样本。
附图说明
图1是能够实现本发明的技术的影像编码装置的示例性框图。
图2是示出利用四叉树(Quad Tree)、二叉树(Binary Tree)和三叉树(TernaryTree)(QTBTTT)结构来对块进行分区的方法的示意图。
图3a和图3b示例性地示出包括宽角度帧内预测模式的多个帧内预测模式。
图4是能够实现本发明的技术的影像解码装置的示例性框图。
图5是根据本发明的实施方案的帧内预测装置的框图。
图6是示出根据本发明的实施方案的用于推导预测模式的参考位置的示例性图。
图7是示出根据本发明的实施方案的推导预测模式的示例性图。
图8是示出根据本发明的另一个实施方案的推导预测模式的示例性图。
图9是示出根据本发明的实施方案的用于生成帧内预测的样本的先前重构的参考样本的位置的示例性图。
图10是示出根据本发明另一个实施方案的用于生成帧内预测的样本的先前重构的参考样本的位置的示例性图。
图11是示出根据本发明的实施方案的色度块的帧内预测的示例性图。
图12是根据本发明的实施方案的帧内预测方法的流程图。
具体实施方式
在下文中,将参考所附附图对本发明的实施方案进行详细描述。应当注意,在将附图标记添加到各个附图中的组成元件时,尽管元件在不同的附图中示出,但是相同的附图标记也表示相同的元件。此外,在实施方案的以下描述中,将省略合并于本文中的已知功能和配置的详细描述,以避免模糊实施方案的主题。
图1是能够实现本发明的技术的视频编码装置的示例性框图。在下文中,将参考图1描述视频编码装置以及该装置的元件。
视频编码装置包括:图像分割器110、预测器120、减法器130、变换器140、量化器145、重排单元150、熵编码器155、逆量化器160、逆变换器165、加法器170、滤波单元180和存储器190。
视频编码装置的每个元件可以以硬件或软件、或者硬件和软件的组合来实现。各个元件的功能可以实现为软件,并且微处理器可以实现为执行对应于各个元件的软件功能。
一个视频包括多个图像。每个图像分割为多个区域,并且对每个区域执行编码。例如,一个图像分割为一个或更多个瓦片(tile)或/和切片(slice)。这里,一个或更多个瓦片可以被定义为瓦片组。每个瓦片或切片被分割为一个或更多个编码树单元(coding treeunit,CTU)。每个CTU通过树结构分割为一个或更多个编码单元(coding unit,CU)。应用于每个CU的信息被编码为CU的语法,并且共同应用于包括在一个CTU中的CU的信息被编码为CTU的语法。另外,共同应用于一个切片中的所有块的信息被编码为切片头的语法,而应用于构成一个图像的所有块的信息被编码在图像参数集(Picture Parameter Set,PPS)或图像头中。此外,由多个图像共同参考的信息被编码在序列参数集(Sequence ParameterSet,SPS)中。另外,由一个或更多个SPS共同参考的信息被编码在视频参数集(VideoParameter Set,VPS)中。共同应用于一个瓦片或瓦片组的信息可以被编码为瓦片头或瓦片组头的语法。
图像分割器110确定编码树单元(CTU)的大小。关于CTU的大小(CTU尺寸)的信息被编码为SPS或PPS的语法,并且被传输至视频解码装置。
图像分割器110将构成视频的每个图像分割为具有预定大小的多个CTU,然后利用树结构递归地分割CTU。在树结构中,叶节点用作编码单元(CU),所述编码单元(CU)是编码的基本单元。
树结构可以是四叉树(QuadTree,QT)、二叉树(BinaryTree,BT)、三叉树(TernaryTree,TT)、或由两个或更多个QT结构、BT结构和TT结构组合形成的结构,所述四叉树(QT)即节点(或父节点)被分割为相同大小的四个从节点(或子节点),所述二叉树(BT)即节点被分割为两个从节点,所述三叉树(TT)即节点以1:2:1的比率被分割为三个从节点。例如,可以使用四叉树加二叉树(QuadTree plus BinaryTree,QTBT)结构,或者可以使用四叉树加二叉树三叉树(QuadTree plus BinaryTree TernaryTree,QTBTTT)结构。这里,BTTT可以统称为多类型树(multiple-type tree,MTT)。
图2示例性地示出QTBTTT分割树结构。如图2所示,CTU可以首先分割为QT结构。可以重复QT分割,直到分割块的大小达到QT中允许的叶节点的最小块大小MinQTSize。由熵编码器155对指示QT结构的每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码,并将其用信号通知视频解码装置。当QT的叶节点不大于BT中允许的根节点的最大块大小(MaxBTSize)时,可以进一步将其分割为一个或更多个BT结构或TT结构。BT结构和/或TT结构可以具有多个分割方向。例如,可以存在两个方向,即,水平地分割节点的块的方向和竖直地分割块的方向。如图2所示,当MTT分割开始时,通过熵编码器155来对指示节点是否被分割的第二标志(mtt_split_flag)、指示分割情况下的分割方向(竖直或水平)的标志、和/或指示分割类型(二叉或三叉)的标志进行编码,并将其用信号通知视频解码装置。
替选地,在对指示每个节点是否被分割为下层的4个节点的第一标志(QT_split_flag)编码之前,可以对指示节点是否被分割的CU分割标志(split_cu_flag)进行编码。当CU分割标志(split_cu_flag)的值指示出没有执行分割时,节点的块成为分割树结构中的叶节点,并用作编码单元(CU),这是编码的基本单元。当CU分割标志(split_cu_flag)的值指示出执行分割时,视频编码装置开始以上述方式从第一标志起对标志进行编码。
当利用QTBT作为树结构的另一个示例时,可以存在两种分割类型,即将块水平地分割为相同大小的两个块的类型(即,对称水平分割)和将块竖直地分割为相同大小的两个块的类型(即,对称竖直分割)。由熵编码器155对指示BT结构的每个节点是否被分割为下层的块的分割标志(split_flag)和指示分割类型的分割类型信息进行编码,并将其传输至视频解码装置。可以存在将节点的块分割为两个非对称块的附加类型。非对称分割类型可以包括以1:3的大小比率将块分割为两个矩形块的类型,或者对角线地分割节点的块的类型。
CU可以根据CTU的QTBT或QTBTTT分割而具有各种大小。在下文中,与要编码或解码的CU(即,QTBTTT的叶节点)相对应的块被称为“当前块”。在采用QTBTTT分割时,当前块的形状可以是正方形或矩形。
预测器120对当前块进行预测以生成预测块。预测器120包括帧内预测器122和帧间预测器124。
通常,图像中的每个当前块可以被预测地编码。通常,利用帧内预测技术(其利用来自包括当前块的图像的数据)或帧间预测技术(其利用在包括当前块的图像之前编码的图像的数据)来执行当前块的预测。帧间预测包括单向预测和双向预测。
帧内预测器122利用位于包括当前块的当前图像中的当前块周围的像素(参考像素)来预测当前块中的像素。根据预测方向,存在多个帧内预测模式。例如,如图3a所示,多个帧内预测模式可以包括2种非方向模式和65种方向模式,所述2种非方向模式包括平面(planar)模式和DC模式。对每种预测模式不同地定义要使用的相邻像素和等式。下表列出了帧内预测模式编号及其名称。
为了对矩形形状的当前块进行有效的方向预测,可以额外地使用由图3b中的虚线箭头指示的方向模式(帧内预测模式67至80和-1至-14)。这些模式可以称为“宽角度帧内预测模式”。在图3b中,箭头指示用于预测的相应参考样本,而不指示预测方向。预测方向与由箭头指示的方向相反。宽角度帧内预测模式是在当前块为矩形形状时在与特定方向模式相反的方向上执行预测而无需额外的比特传输的模式。在这种情况下,在宽角度帧内预测模式中,可以基于矩形当前块的宽度与高度的比率来确定可用于当前块的一些宽角度帧内预测模式。例如,在当前块具有高度小于宽度的矩形形状时,可以使用角度小于45度的宽角度帧内预测模式(帧内预测模式67至80)。在当前块具有宽度大于高度的矩形形状时,可以使用角度大于-135度的宽角度帧内预测模式(帧内预测模式-1至-14)。
帧内预测器122可以确定对当前块编码时要使用的帧内预测模式。在一些示例中,帧内预测器122可以利用若干帧内预测模式来对当前块编码,并且从测试的模式中选择要使用的适当的帧内预测模式。例如,帧内预测器122可以利用若干测试的帧内预测模式的率失真(rate-distortion)分析来计算率失真值,并且可以在测试的模式中选择具有最佳率失真特性的帧内预测模式。
帧内预测器122从多个帧内预测模式中选择一个帧内预测模式,并且根据选择的帧内预测模式利用相邻像素(参考像素)和等式来预测当前块。由熵编码器155对关于选择的帧内预测模式的信息进行编码,并将其传输至视频解码装置。
帧间预测器124通过运动补偿来生成当前块的预测块。帧间预测器124在比当前图像更早已被编码和解码的参考图像中搜索与当前块最相似的块,并且利用搜索到的块来生成当前块的预测块。然后,帧间预测器生成与当前图像中的当前块和参考图像中的预测块之间的位移(displacement)相对应的运动矢量(motion vector)。通常,对亮度分量执行运动估计,并且基于亮度分量计算的运动矢量用于亮度分量和色度分量两者。由熵编码器155对包括关于参考图像的信息和关于用于预测当前块的运动矢量的信息的运动信息进行编码,并将其传输至视频解码装置。
减法器130将当前块减去由帧内预测器122或帧间预测器124生成的预测块来生成残差块。
变换器140将空域中具有像素值的残差块中的残差信号变换为频域中的变换系数。变换器140可以利用残差块的整个大小作为变换单元来变换残差块中的残差信号。替选地,可以将残差块分割为多个子块,并且利用子块作为变换单元来执行变换。替选地,可以通过将块划分为两个子块,即变换区域和非变换区域,并且仅利用变换区域子块作为变换单元来变换残差信号。这里,变换区域子块可以是基于水平轴线(或竖直轴线)的具有1:1的大小比率的两个矩形块的一个。在这种情况下,由熵编码单元155对指示仅变换了子块的标志(cu_sbt_flag)、方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或位置信息(cu_sbt_pos_flag)进行编码,并且用信号通知视频解码装置。另外,变换区域子块的大小基于水平轴线(或竖直轴线)可以具有1:3的大小比率。在这种情况下,由熵编码器155对区分相应分割的标志(cu_sbt_quad_flag)进行额外地编码,并且用信号通知视频解码装置。
变换器140可以在水平方向和竖直方向上单独地变换残差块。对于变换,可以利用各种类型的变换函数或变换矩阵。例如,用于水平变换和竖直变换的成对变换函数可以被定义为多变换集(multiple transform set,MTS)。变换器140可以选择MTS中具有最佳变换效率的一对变换函数,并且分别在水平方向和竖直方向上变换残差块。由熵编码器155对关于在MTS中选择的变换函数对的信息(mts_idx)编码,并将其用信号通知视频解码装置。应用MTS的变换块的大小可以限制在32×32以内。
量化器145对从变换器140输出的变换系数进行量化,并且将量化的变换系数输出到熵编码器155。
重排单元150可以对量化的残差值的系数值进行重组。
重排单元150可以通过系数扫描(coefficient scanning)来将2维系数阵列改变为1维系数序列。例如,重排单元150可以利用锯齿形扫描(zig-zag scan)或对角线扫描(diagonal scan)从DC系数向高频区域中的系数对系数进行扫描,以输出1维系数序列。根据变换单元的大小和帧内预测模式,可以利用竖直扫描(vertical scan)或水平扫描(horizontal scan)代替锯齿形扫描,所述竖直扫描即在列方向上扫描系数的二维阵列,所述水平扫描即在行方向上扫描二维块形状的系数。也就是说,可以根据变换单元的大小和帧内预测模式在锯齿形扫描、对角线扫描、竖直扫描和水平扫描中确定要使用的扫描模式。
熵编码器155利用诸如基于上下文的自适应二进制算术编码(Context-basedAdaptive Binary Arithmetic Code,CABAC)和指数哥伦布(exponential Golomb)的各种编码技术来对从重排单元150输出的一维量化的变换系数进行编码,以生成比特流。
熵编码器155对与块分割相关的信息(例如,CTU大小、CU分割标志、QT分割标志、MTT分割类型和MTT分割方向)进行编码,使得视频解码装置可以以与视频编码装置相同的方式来分割块。另外,熵编码器155对关于指示当前块是由帧内预测编码还是帧间预测编码的预测类型的信息进行编码,并且根据预测类型来对帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(关于参考图像索引和运动矢量的信息)进行编码。
逆量化器160对从量化器145输出的量化的变换系数进行逆量化,以生成变换系数。逆变换器165将从逆量化器160输出的变换系数从频域变换到空域,并且重构残差块。
加法器170将重构的残差块与由预测器120生成的预测块相加,以重构当前块。在执行后续块的帧内预测时,重构的当前块中的像素用作参考像素。
滤波单元180对重构的像素进行滤波,以减少由于基于块的预测和变换/量化而产生的块伪影(blocking artifacts)、振铃伪影(ringing artifacts)和模糊伪影(blurringartifacts)。滤波单元180可以包括去块滤波器182和像素自适应偏移(pixel adaptiveoffset,SAO)滤波器184。
去块滤波器180对重构的块之间的边界进行滤波,以去除由逐块编码/解码而引起的块伪影,并且SAO滤波器184对去块滤波的视频执行额外的滤波。SAO滤波器184是用于对由有损编码引起的重构的像素与原始的像素之间的差进行补偿的滤波器。
通过去块滤波器182和SAO滤波器184滤波的重构的块存储在存储器190中。一旦一个图像中的所有块被重构,重构的图像就可以用作后续要被编码的图像中的块的帧间预测的参考图像。
图4是能够实现本发明的技术的视频解码装置的示例性功能框图。在下文中,将参考图4描述视频解码装置和该装置的元件。
视频解码装置可以包括:熵解码器410、重排单元415、逆量化器420、逆变换器430、预测器440、加法器450、滤波单元460和存储器470。
类似于图1的视频编码装置,视频解码装置的每个元件可以用硬件、软件、或硬件和软件的组合来实现。此外,每个元件的功能可以实现为软件,并且微处理器可以实现为执行对应于每个元件的软件功能。
熵解码器410通过对由视频编码装置生成的比特流解码并提取与块分割相关的信息来确定要解码的当前块,并且提取用于重构当前块所需的预测信息和关于残差信号的信息等。
熵解码器410从序列参数集(SPS)或图像参数集(PPS)中提取关于CTU大小的信息,确定CTU的大小,并且将图像分割为确定大小的CTU。然后,解码器将CTU确定为树结构的最高层,也就是说,根节点,并且提取关于CTU的分割信息,以利用树结构来分割CTU。
例如,当利用QTBTTT结构来分割CTU时,提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为子层的四个节点。对于与QT的叶节点相对应的节点,提取与MTT的分割相关的第二标志(MTT_split_flag)以及关于分割方向(竖直/水平)和/或分割类型(二叉/三叉)的信息,从而以MTT结构来分割相应的叶节点。由此,以BT或TT结构来递归地分割QT的叶节点下方的每个节点。
作为另一示例,当利用QTBTTT结构来分割CTU时,可以提取指示是否分割CU的CU分割标志(split_cu_flag)。当分割相应块时,可以提取第一标志(QT_split_flag)。在分割操作中,在零个或多个递归QT分割之后,每个节点都可能发生零个或多个递归MTT分割。例如,CTU可以直接经历MTT分割而不经历QT分割,或者仅经历多次QT分割。
作为另一个示例,当利用QTBT结构来分割CTU时,提取与QT分割相关的第一标志(QT_split_flag),并且将每个节点分割为下层的四个节点。然后,提取指示是否以BT进一步分割与QT的叶节点相对应的节点的分割标志(split_flag)以及分割方向信息。
一旦通过树结构分割来确定要解码的当前块,熵解码器410就提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码器410提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码器410提取用于帧间预测信息(即,指示运动矢量和由运动矢量参考的参考图像的信息)的语法元素。
熵解码器410还提取关于量化的当前块的变换系数的信息作为关于残差信号的信息。
重排单元415可以以由视频编码装置执行的系数扫描的相反顺序,将由熵解码器410进行熵解码的一维量化的变换系数的序列改变为2维系数阵列(即,块)。
逆量化器420对量化的变换系数进行逆量化。逆变换器430将逆量化的变换系数从频域逆变换到空域,以重构残差信号,从而生成当前块的残差块。
另外,当逆变换器430仅对变换块的部分区域(子块)进行逆变换时,逆变换器430提取指示仅变换块的子块已进行变换的标志(cu_sbt_flag)、关于子块的方向性(竖直/水平)信息(cu_sbt_horizontal_flag)、和/或关于子块的位置信息(cu_sbt_pos_flag),并且将子块的变换系数从频域逆变换到空域。然后,重构残差信号,并且用“0”值填充没有逆变换的区域作为残差块,从而生成最终的当前块的残差块。
另外,当应用MTS时,逆变换器430利用从视频编码装置用信号通知的MTS信息(mts_idx)来确定要分别在水平方向和竖直方向上应用的变换函数或变换矩阵,并且利用确定的变换函数在水平方向和竖直方向上对变换块中的变换系数进行逆变换。
预测器440可以包括帧内预测器442和帧间预测器444。在当前块的预测类型是帧内预测时,激活帧内预测器442,而在当前块的预测类型是帧间预测时,激活帧间预测器444。
帧内预测器442基于从熵解码器410提取的帧内预测模式的语法元素,在多个帧内预测模式中确定当前块的帧内预测模式,并且根据帧内预测模式,利用当前块周围的参考像素来预测当前块。
帧间预测器444利用从熵解码器410提取的帧间预测模式的语法元素来确定当前块的运动矢量和由运动矢量参考的参考图像,并且基于运动矢量和参考图像来预测当前块。
加法器450通过将从逆变换器430输出的残差块与从帧间预测器444或帧内预测器442输出的预测块相加来重构当前块。在对后续要被解码的块进行帧内预测时,重构的当前块中的像素用作参考像素。
滤波单元460可以包括去块滤波器462和SAO滤波器464。去块滤波器462对重构的块之间的边界进行去块滤波,以去除由逐块解码引起的块伪影。SAO滤波器464在对相应偏移进行去块滤波之后对重构的块执行额外的滤波,以便补偿由有损编码引起的重构后的像素与原始的像素之间的差。通过去块滤波器462和SAO滤波器464滤波的重构的块存储在存储器470中。当一个图像中的所有块被重构时,重构的图像用作后续要被编码的图像中的块的帧间预测的参考图像。
本实施方案公开了一种新的帧内预测技术,该技术可以通过上面描述过的影像编码和解码装置来实现。更具体地,提供了一种帧内预测装置和方法,其用于参考先前重构的相邻块的帧内预测模式来推导当前块的帧内预测模式,并且利用推导的帧内预测模式来执行帧内预测。
图5是根据本发明的实施方案的帧内预测装置的框图。
在根据本发明的实施方案中,帧内预测装置500参考先前重构的相邻块的帧内预测模式,而不是预测模式的传输来推导预测模式,并且利用推导的预测模式来对当前块执行帧内预测。帧内预测装置500包括解码装置中包含的熵解码器410和帧内预测器442。
包括在编码装置中的帧内预测器122的操作类似于包括在解码装置中的帧内预测器442,因此下面的描述将专注于在解码装置中包括的帧内预测器442。
根据该实施方案的帧内预测装置500利用预测推导模式(在下文中称为推导模式)来提高帧内预测的效率。
熵解码器410对关于是否将推导模式应用于来自比特流的预测模式块的信息进行解码。这里,预测模式块是指块单元,包括推导模式的预测信息在所述块单元中传输。在下文中,为了便于描述,当前块指示预测模式块。
为了使用推导模式,编码装置可以通过利用比特流来传输关于是否使用推导模式的模式信息,并且解码装置可以利用相应的信息来确定是否应用推导模式。模式信息可以是指示是否使用预测推导模式的标志的形式的信息。替选地,模式信息可以是索引形式的信息,用于指示多个帧内预测模式的一个,所述多个帧内预测模式进一步包括作为新的帧内预测模式的推导模式。
当应用推导模式时,根据该实施方案的帧内预测器442参考先前重构的相邻块的帧内预测模式来推导预测模式块及其子分区结构的帧内预测模式。帧内预测器442可以包括参考位置设置单元502、预测模式推导单元504和预测的样本生成单元506的全部或一些。
图6是示出根据本发明的实施方案的用于推导预测模式的参考位置的示例性图。
如图6所示,参考位置设置单元502可以将相邻块(块B至G)的像素(像素a至j)用作参考像素,以便推导预测模式块A(M×N,M和N是自然数)的预测模式及其子分区结构。
参考位置设置单元502可以根据预测模式块附近的预先构造的块的分区结构来自适应地设置参考位置。例如,当预测模式块A的顶侧和左侧如图6所示被分区为块B至G时,可以将块B到G的预定位置的像素(例如,位于每个块的右下角的像素)设置为参考位置。也就是说,如图6所示,参考位置设置单元502可以将预定义的位置(例如,像素a、d、g,或者上行的中心处的附加像素c,或者左列的中心处的像素i或h)用作参考位置。
此外,参考位置设置单元502可以将参考位置组中的预定义的位置(例如,像素a、b和j的一个,像素d和e的一个,像素g和f的一个等)用作参考位置。例如,在参考位置组{a,b,j}的情况下,按照a、b、j的顺序来确定参考像素是否是有效参考像素,并且将第一有效位置设置为参考位置。这里,有效参考像素可以是指其中使用帧内预测并具有相应的帧内预测模式的像素。此外,在参考位置组{d,e}或{g,f}的情况下,可以以d和e的顺序或以g和f的顺序来设置参考位置。
参考位置设置单元502可以根据预测模式块的维度(水平像素的数量、竖直像素的数量、水平像素的数量与竖直像素的数量的乘积等)来自适应地设置参考位置。例如,在“水平像素的数量”>“竖直像素的数量”的情况下,可以在顶侧设置更多的参考位置,反之,可以在左侧设置更多的参考位置。可以根据如上所述的预定义的位置来确定预设数量的参考位置,并且可以在较长的一侧的中心处添加参考位置。
此外,参考位置设置单元502可以根据水平像素数量与竖直像素数量的乘积来设置参考位置的数量,并且可以将设定数量的预定义的位置用作如上所述的参考位置。
参考位置设置单元502可以根据编码装置与解码装置之间的约定将参考位置设置在预定位置处。
如上所述,参考位置设置单元502可以利用预测模式块的维度、根据编码装置与解码装置之间的约定而预定的位置、以及预测模式块附近的块的分区结构的至少一个来确定参考位置。
另一方面,替选地,可以从编码装置向解码装置传输关于可用的参考位置的信息。在这种情况下,参考位置设置单元502利用接收到的信息来确定参考位置。
当应用根据该实施方案的推导模式时,帧内预测器442可以将预测模式块分区为包括一个或更多个像素的像素组。包括多个像素的像素组被共同地表示为分区块或子块,并且可以以每个分区块为单位执行帧内预测。因此,在其中解码了推导模式的预测模式块不会具有与在其中执行了帧内预测的块相同的级别。
根据预测模式块的分区结构,像素组可以是诸如正方形、矩形或三角形的块的形式,或者是诸如M×1或1×N的线形单元的块形式。另一方面,通过分区获得的像素组可以具有相同的大小和形式。
在本发明的另一个实施方案中,像素组可以仅包括一个像素。在又一个实施方案中,像素组可以是预测模式块。也就是说,像素组可以包括预测模式块的所有像素。
在将预测模式块分区为像素组时,解码装置可以根据预测模式块和相邻块推导关于分区结构的信息,或者从编码装置接收信息。
解码装置可以根据预测模式块的维度(水平像素的数量、竖直像素的数量、水平像素的数量与竖直像素的数量的乘积等)来确定分区结构。例如,可以使用其中“水平像素的数量”>“竖直像素的数量”的水平分区结构,或者相反,可以使用竖直分区结构。此外,解码装置可以根据水平像素的数量与竖直像素的数量的乘积来设置像素组的数量。
解码装置可以根据编码装置与解码装置之间的约定来使用预定的分区信息。例如,可以总是水平地或竖直地将预测模式块分区为相同大小的多个子块。子块的数量可以根据预测模式块的维度来确定。替选地,可以总是将预测模式块分区为固定大小(例如,4×4)的子块。
解码装置可以使用预测模式块附近的块的分区结构。例如,当存在与预测模式块相同大小的相邻块时,可以不改变地使用或引用相邻块的分区结构。作为另一个示例,如图7的(a)所示,当多个块在预测模式块的左侧时,可以通过使块之间的水平边界线延伸来水平地对预测模式块分区。类似地,如果多个块在预测模式块的顶侧,则可以通过使多个块之间的竖直边界线延伸来竖直地对预测模式块分区。
如上所述,影像解码装置的帧内预测器442可以基于预测模式块的维度、根据编码装置和解码装置之间的约定的预定的分区结构以及预测模式块附近的块的分区结构的所有或一些的组合来确定预测模式块的分区结构。
在本发明的另一个实施方案中,可以从编码装置传输关于预测模式块的分区结构的信息。
在本发明的另一个实施方案中,可以生成预测模式块的分区结构的列表,并且可以从列表中选择分区结构。
图7是示出根据本发明的实施方案的预测模式推导的示例性图。
预测模式推导单元504利用以像素组为单位的相邻块的参考位置来推导当前块的预测模式。
在图7的示例中,由粗实线指示的矩形表示预测模式块,虚线表示在其中对预测模式块分区并在其中执行帧内预测的单元,即分区块(块形式的像素组)。图7的(a)示出其中将预测模式块水平地等分为两个部分的情况。图7的(b)示出其中将预测模式块竖直地等分为四个部分的情况。
预测模式推导单元504可以利用由至少两个参考位置指示的预测模式来推导预测模式块的预测模式。在图7的示例中,预测模式推导单元504使用三个相邻参考位置的预测模式以推导预测模式块的预测模式。
在图7的示例中,虚线箭头指示相邻块的预测模式,实线箭头指示根据相邻块的预测模式推导的每个分区块的预测模式。相邻参考位置的设置和预测模式的推导可以由编码装置和解码装置以相同的方式来执行。
预测模式推导单元504基于当前块中的每个分区块的位置,通过利用参考位置的至少一个来推导每个分区块的帧内预测模式。分区块的帧内预测模式很可能类似于附近参考位置的帧内预测模式。因此,相应分区块的预测模式必定会受到距离分区块较近处的参考位置的影响。例如,可以根据每个分区块与参考位置之间的距离来确定每个参考位置的权重。距离越近,可分配的权重就越大。这里,分区块的位置可以是分区块的中心像素的位置。
预测模式推导单元504可以基于每个参考位置的权重,通过对参考位置的预测方向进行加权求和来推导每个分区块的帧内预测方向。替选地,可以将所有帧内预测模式中最接近加权和的预测模式推导为相应分区块的预测模式。
在本发明的另一个实施方案中,当像素组包括一个像素时,可以以预测模式块中的每个像素为单位来推导帧内预测模式。
图8是示出根据本发明的另一个实施方案的预测模式推导的示例性图。
在图8的示例中,由细线指示的矩形是指执行帧内预测的当前块的一个像素。
在图8的(a)示例中,虚线箭头指示每个相邻像素的预测模式,而在图8的(b)示例中,包括三个虚线箭头的相邻像素是为参考而设置的参考位置。参考三个参考位置的预测模式,预测模式推导单元504可以确定当前块中的每个像素的帧内预测模式,如图8的(b)所示。
预测模式推导单元504基于当前块中的每个像素的位置,利用参考位置的至少一个来推导相应像素的帧内预测模式。相应像素的预测模式必定会受到距离分区块较近处的参考位置的影响。例如,可以根据每个像素与参考位置之间的距离来确定每个参考位置的权重。
预测模式推导单元504可以基于每个参考位置的权重,通过对参考位置的预测方向进行加权求和来推导相应像素的帧内预测模式。替选地,可以将所有帧内预测模式中最接近加权和的预测模式推导为相应像素的预测模式。
另一方面,当设置的参考位置的预测模式没有用时,预测模式推导单元504可以用预测模式块附近的新的位置来代替参考位置。此外,当所有参考位置的预测模式都没有用时,当前块的预测模式可以确定为在编码装置与解码装置之间预设的预测模式的一个。
根据上述本发明的实施方案,预测模式块的多个分区单元(例如一个像素、一行和分区块)可以具有不同的预测模式。不需要对每个分区单元单独地用信号通知关于帧内预测模式的信息。
另一方面,在另一个实施方案中,当像素组是整个预测模式块时,预测模式推导单元504可以根据多个参考位置的帧内预测模式推导预测模式块的一个帧内预测模式。例如,可以通过对多个参考位置的帧内预测模式(预测方向)进行平均来推导整个当前块的帧内预测模式。
根据实施方案的预测的样本生成单元506根据由预测模式推导单元504推导的帧内预测模式,通过以像素组为单位对预测模式块(当前块)进行预测来生成预测的样本。
图9是示出根据本发明的实施方案的用于生成帧内预测的样本的先前重构的参考样本的位置的示例性图。
在图9的示例中,由圆圈指示的部分是指包括在由当前块A引用的预先重构的块中的参考样本。可以根据对应于解码顺序的参考样本的有用性和帧内预测模式的范围来扩展参考样本的范围。此外,帧内预测器442可以根据作为当前块A的大小的M和N以及帧内预测模式的范围来确定预测范围M_r和N_r。
预测的样本生成单元506可以通过利用以像素组为单位推导的帧内预测模式,根据如图9所示的预测模式块附近的预先重构的参考样本的样本值生成预测的样本。
在其中针对通过对预测模式块分区而获得的每个分区块来推导帧内预测模式的实施方案的情况下,预测的样本生成单元506根据针对分区块推导的帧内预测模式来确定对应分区块中要预测的目标像素的参考样本。此外,利用确定的参考样本的样本值来预测目标像素。
在其中以预测模式块中的像素为单位推导帧内预测模式的另一个实施方案的情况下,预测的样本生成单元506利用针对相应像素推导的帧内预测模式来确定预先重构的参考样本,并且利用确定的参考样本的样本值来预测相应像素。
在其中针对预测模式块的整体推导一个帧内预测模式的另一个实施方案的情况下,预测的样本生成单元506利用预测模式块的帧内预测模式,针对预测模式块中要预测的目标像素来确定预先重构的参考样本。此外,利用确定的参考样本的样本值来预测目标像素。
图10是示出根据本发明另一个实施方案的用于生成帧内预测的样本的先前重构的参考样本的位置的示例性图。
在其中将预测模式块分区为K个(K是自然数)分区块(虚线矩形)的实施方案的情况下,预测的样本生成单元506利用参考样本的样本值来执行帧内预测,如图10所示。
在图10的示例中,由粗线指示的矩形是关于预测模式块的边界的参考样本的位置,而由细线指示的矩形是关于分区块A的边界的参考样本的位置。
当对预测模式块中的分区块A执行帧内预测时,预测的样本生成单元506可以利用在预测模式块的边界处的参考样本的样本值来生成预测的样本,或者可以将预先重构的分区块用作关于分区块A的边界的参考样本。要使用的参考样本可以通过编码装置与解码装置之间的约定来确定。替选地,指示要使用的参考样本的信息可以以块(例如,每个分区块和预测模式块)为单位用信号通知。
为了将预测模式块中的预先重构的分区块用作参考样本,需要顺序地重构预测模式块中的分区块。也就是说,以预定义的顺序(例如,光栅扫描顺序)来对预测模式块中的第一分区块进行预测,然后通过向预测的分区块添加相应的残差信号来重构第一分区块。重构的分区块中的样本用作参考样本,用于预测与重构的分区块相邻的后续分区块。例如,在图10的示例中,解码装置可以通过对应于块推导的预测模式来预测和重构左上方分区块(即,结合残差生成最终的重构样本),然后可以在重构右上方分区块时使用左上方分区块中的重构样本。
在另一个实施方案中,先前预测的分区块中的预测的样本可以用作用于预测后续分区块的参考样本。也就是说,预测的样本生成单元506以预定义的顺序(例如,光栅扫描顺序)来对预测模式块中的任意一个分区块进行预测。然后,利用预测的分区块(所述块不是通过预测的样本和残差信号的相加而生成的重构的块)中的预测的样本来预测后续分区块中的像素。
如上所述的帧内预测模式推导技术可以用于亮度块和色度块两者。替选地,可以利用帧内直接模式(direct mode,DM)通过亮度块的帧内预测模式来确定色度块的帧内预测模式。
图11是示出根据本发明的实施方案的色度块的帧内预测的示例性图。
如图11所示,可以将对于亮度块中的每个像素组推导的帧内预测模式设置为在色度块中的相应位置处的像素组的帧内预测模式。帧内预测器442利用对应于像素组的帧内预测模式来对色度块中的每个像素组执行帧内预测。
另一方面,当颜色分量具有不同分辨率时,帧内预测器442可以将根据特定采样方法采样的亮度块的帧内预测模式用作色度块的预测模式。
图12是根据本发明的实施方案的帧内预测方法的流程图。
根据该实施方案的帧内预测装置500从比特流中对指示预测模式块的预测推导模式的使用的模式信息进行解码(S1200)。这里,预测模式块是指传输其中包括预测推导模式(在下文中称为“推导模式”)的预测信息的块单元。在下文中,为了便于描述,当前块指示预测模式块。
为了使用推导模式,编码装置可以通过利用比特流来传输关于是否使用推导模式的模式信息,并且解码装置可以利用相应的信息来确定是否应用推导模式。模式信息可以是指示是否使用预测推导模式的标志的形式的信息。替选地,模式信息可以是索引形式的信息,用于指示多个帧内预测模式的一个,所述多个帧内预测模式进一步包括作为新的帧内预测模式的推导模式。
当应用根据该实施方案的推导模式时,帧内预测装置500可以将预测模式块分区为包括一个或更多个像素的像素组。包括多个像素的像素组被共同地表示为分区块或子块,并且可以以每个分区块为单位执行帧内预测。因此,其中对推导模式解码的预测模式块不会具有其中与执行帧内预测的块相同的级别。
根据预测模式块的分区结构,像素组可以是诸如正方形、矩形或三角形的块的形式,或者是诸如M×1或1×N的线形单元的块形式。另一方面,通过分区获得的像素组可以具有相同的大小和形式。
在本发明的另一个实施方案中,像素组可以仅包括一个像素。在又一个实施方案中,像素组可以是预测模式块。也就是说,像素组可以包括预测模式块的所有像素。
帧内预测装置500针对包括预测模式块中的一个或更多个像素的每个像素组,根据预测模式块附近的预先重构的块设置多个参考位置(S1202)。
帧内预测装置500可以利用预测模式块的维度、根据编码装置与解码装置之间的约定而预定的位置、以及预测模式块附近的块的分区结构的至少一个来确定参考位置。
另一方面,替选地,可以从编码装置向解码装置传输关于可用的参考位置的信息。在这种情况下,帧内预测装置500利用接收的信息来确定参考位置。
帧内预测装置500根据多个参考位置的帧内预测模式来导每个像素组的帧内预测模式(S1204)。
帧内预测装置500基于当前块中的每个分区块的位置,通过利用参考位置的至少一个来推导每个分区块的帧内预测模式。也就是说,相应分区块的预测模式必定会受到距离分区块较近处的参考位置的影响。例如,可以根据每个分区块与参考位置之间的距离来确定每个参考位置的权重。距离越近,可分配的权重就越大。
帧内预测装置500可以基于每个参考位置的权重,通过对参考位置的预测方向进行加权求和来推导每个分区块的帧内预测方向。替选地,可以推导所有帧内预测模式中最接近加权和的预测模式作为相应分区块的预测模式。
另一方面,当参考位置的预测模式没有用时,帧内预测装置500可以用预测模式块附近的新的位置来代替参考位置。此外,当所有参考位置的预测模式都没有用时,当前块的预测模式可以确定为在编码装置与解码装置之间预设的预测模式的一个。
相邻参考位置的设置和预测模式的推导可以由编码装置和解码装置以相同的方式来执行。
帧内预测装置500可以将当前块的帧内预测模式推导为与其相邻块的帧内预测模式相同。帧内预测装置500首先根据相邻块选择多个方向,然后选择其中一个方向的模式作为当前块的帧内预测模式,或者可以根据多个相邻块的预测模式计算当前块的帧内预测模式。
帧内预测装置500利用相应像素组的帧内预测模式对每个像素组中的像素执行帧内预测(S1206)。
帧内预测装置500可以利用以像素组为单位推导的帧内预测模式,根据预测模式块附近的预先重构的参考样本的样本值生成预测的样本。
在其中针对通过对预测模式块分区而获得的每个分区块来推导帧内预测模式的实施方案的情况下,预测的样本生成单元506根据针对分区块推导的帧内预测模式来确定对应分区块中要预测的目标像素的参考样本。此外,利用确定的参考样本的样本值来预测目标像素。
为了将预测模式块中的预先重构的分区块用作参考样本,需要顺序地重构预测模式块中的分区块。也就是说,以预定义的顺序(例如,光栅扫描顺序)来对预测模式块中的第一分区块进行预测,然后通过向预测的分区块添加相应的残差信号来重构第一分区块。重构的分区块中的样本可以用作参考样本,用于预测与重构的分区块相邻的后续分区块。
如上所述,根据该实施方案,通过提供这样一种帧内预测装置和方法,能够提高影像编码和解码装置的压缩性能,所述帧内预测装置和方法用于参考先前重构的相邻块的帧内预测模式来推导当前块的帧内预测模式,基于推导的帧内预测模式来执行帧内预测,并且生成当前块的预测的样本。
通常,当将自然影像分区为用于帧内预测的块时,一个块及其相邻块具有相似的影像特性。因此,帧内预测模式可以是相似的。考虑到这样的特征,存在利用最可能模式(Most Probable Mode,MPM)列表的帧内预测方法,所述最可能模式(MPM)列表是基于相对于当前块的左方和上方相邻块的预测模式而生成的。
首先,编码装置传输MPM标志,该MPM标志指示当前块的预测模式是否是从MPM列表中生成的。在当前块的预测模式包括在MPM列表中时,编码装置向解码装置传输MPM索引,该MPM索引指示MPM列表的帧内预测模式中的当前块的帧内预测模式。解码装置可以利用接收的索引从MPM列表中选择预测模式,并且可以对当前块执行帧内预测。另一方面,在当前块的预测模式不包括在MPM列表中时,编码装置可以向解码装置传输残差模式信息,该残差模式信息指示除MPM列表中包括的预测模式之外的残差预测模式中的当前块的预测模式。
在本发明的另一个实施方案中,公开了利用MPM确定预测模式块的帧内预测模式的方法。帧内预测器442基于预测模式块创建MPM列表。也就是说,帧内预测器442利用预测模式块附近的块(左方相邻块和上方相邻块)的帧内预测模式来生成MPM列表。
另一方面,帧内预测器442将预测模式块分区为多个子块。分区方法可以与上述预测推导模式的分区方法相同。此外,基于预测模式块创建的MPM列表与预测模式块中的所有子块共享。也就是说,针对多个子块使用相同的MPM列表。
作为示例,可以从MPM列表中确定预测模式块中的每个子块的帧内预测模式。在这种情况下,可以从编码装置向解码装置用信号通知每个子块的MPM索引。解码装置的帧内预测器442可以通过接收的MPM索引从共享的MPM列表中确定相应子块的帧内预测模式。在预测模式块中为先前预测的子块确定的帧内预测模式可以不用作后续子块的帧内预测模式。为此,可以从MPM列表中删除用于先前预测的子块的帧内预测模式。这样,可以减少用信号通知预测模式块中的所有子块的MPM索引所需的总比特数。
作为另一个示例,可以从编码装置向解码装置用信号关于预测模式块中的子块的帧内预测模式的信息(MPM标志和对应于MPM标志的MPM索引或残差模式信息)。解码装置的帧内预测器442利用接收的信息来确定子块的帧内预测模式。在这种情况下,用于确定在预测模式块中先前预测的子块的帧内预测模式不会用作后续子块的帧内预测模式。为此,可以从MPM列表中删除或可以从残差预测模式列表中删除用于确定先前预测的子块的帧内预测模式。从而,可以减少用信号通知预测模式块中的所有子块的MPM索引和残差模式信息所需的总比特数。
尽管已经描述了在根据实施方案的每个流程图中顺序地执行各个处理,但是本发明不限于此。换句话说,可以改变流程图的处理,或者可以并行执行一个或更多个处理,并且流程图不限于时间序列顺序。
另一方面,本发明中描述的各种方法或功能可以实现为存储在非易失性记录介质中的指令,所述指令可以由一个或更多个处理器读取和执行。例如,非易失性记录介质包括以计算机系统可读取的形式存储数据的任何类型的记录装置。例如,非易失性记录介质包括存储介质,例如可擦除可编程只读存储器(EPROM)、闪存驱动器,光盘驱动器、磁性硬盘驱动器和固态驱动器(SSD)。
尽管已经出于说明的目的描述了本发明的示例性实施方案,但是本领域的技术人员应当理解的是,在不脱离本发明思想和范围的情况下,各种修改和改变是可能的。为了简洁和清楚起见,已经描述了示例性实施方案。相应地,普通技术人员应当理解的是,实施方案的范围不受以上明确描述的实施方案限制,而是包括在权利要求及其等同形式内。
附图标记
120、440:预测器 130:减法器
170、450:加法器 180、460:滤波单元
442:帧内预测器
500:帧间预测装置 502:参考位置设置单元
504:预测模式推导单元
506:预测的样本生成单元。
相关申请的交叉引用
本申请根据35U.S.C§119(a)要求2019年3月20日在韩国提交的专利申请No.10-2019-0031727、2020年3月20日在韩国提交的专利申请No.10-2019-0034277的优先权,其全部内容通过引用合并于本文中。此外,由于与上述相同的原因,本专利申请要求在除美国以外的国家的优先权,并且其全部内容通过引用合并于本文中。

Claims (17)

1.一种帧内预测方法,其由帧内预测装置使用,所述方法包括:
从比特流中对指示预测模式块的预测推导模式的使用的模式信息进行解码;
对包括预测模式块中的一个或更多个像素的每个像素组,根据预测模式块附近的多个位置处的预先重构的参考像素的帧内预测模式来推导每个像素组的帧内预测模式;以及
利用每个像素组的帧内预测模式,对每个像素组中的像素进行帧内预测。
2.根据权利要求1所述的方法,进一步包括:
根据预测模式块附近的预先重构的块来设置每个像素组的参考像素的位置。
3.根据权利要求2所述的方法,其中,所述参考像素的位置基于以下方法的一些或全部来确定:利用预测模式块的维度来执行确定位置的方法、根据预定的约定来执行设置确定的位置的方法、以及利用预测模式块附近的块的分区结构来执行确定位置的方法。
4.根据权利要求1所述的方法,其中,所述模式信息是指示是否使用预测推导模式的标志,或者是指示包括预测推导模式的多个帧内预测模式中的预测推导模式的索引。
5.根据权利要求1所述的方法,其中,基于每个像素组在预测模式块中的相应位置,根据一个或更多个参考像素的帧内预测模式来推导每个像素组的帧内预测模式。
6.根据权利要求5所述的方法,其中,通过根据与参考像素的距离将权重分配给每个像素组的参考像素的帧内预测模式,并且对参考像素的帧内预测模式进行加权求和,推导每个像素组的帧内预测模式。
7.根据权利要求1所述的方法,其中,每个像素组包括一个像素。
8.根据权利要求1所述的方法,其中,通过在水平方向或竖直方向的至少一个上对预测模式块分区来获得每个像素组,并且每个像素组是包括多个像素的子块的一个。
9.根据权利要求8所述的方法,其中,所述子块被分区为彼此相同的形式和大小。
10.根据权利要求8所述的方法,其中,基于预测模式块的维度、根据预定的约定的预定义方案、以及预测模式块附近的块的分区形式的至少一个,将预测模式块分区为子块。
11.根据权利要求1所述的方法,进一步包括:
从比特流中对关于预测模式块的分区结构的信息进行解码,并且利用关于分区结构的信息来生成每个像素组。
12.根据权利要求1所述的方法,其中,所述帧内预测包括利用邻近预测模式块的预先构造的像素来生成每个像素组的像素的预测样本。
13.根据权利要求1所述的方法,其中,所述帧内预测包括顺序地重构包括在预测模式块中的每个像素组,以及
其中,所述预测模式块的预先重构的像素组中的预先重构的像素用于对与预先重构的像素组相邻的像素组执行帧内预测。
14.根据权利要求1所述的方法,其中,所述帧内预测包括对包括在预测模式块中的每个像素组顺序地执行帧内预测,以及
其中,所述预测模式块的预先预测的像素组中的预测的像素用于对与预先重构的像素组相邻的像素组执行帧内预测。
15.一种帧内预测装置,其包括:
熵解码单元,其配置为从比特流中对指示预测模式块的预测推导模式的使用的模式信息进行解码;
预测模式推导单元,其配置为对包括预测模式块中的一个或更多个像素的每个像素组,根据预测模式块附近的多个位置处的预先重构的参考像素的帧内预测模式,推导每个像素组的帧内预测模式;以及
预测的样本生成单元,其配置为利用每个像素组的帧内预测模式,对每个像素组中的像素执行帧内预测。
16.根据权利要求15所述的帧内预测装置,进一步包括参考位置设置单元,其配置为根据预测模式块附近的预先重构的块来设置每个像素组的参考像素的位置。
17.根据权利要求15所述的帧内预测装置,其中,用于将预测模式块分区为每个像素组的分区结构基于预测模式块的维度、根据预定的约定的预定义方案、以及预测模式块附近的块的分区结构的至少一个来确定,或者基于由熵解码单元从比特流解码的信息来确定。
CN202080037443.1A 2019-03-20 2020-03-20 基于预测模式估计的帧内预测装置和方法 Pending CN113892268A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20190031727 2019-03-20
KR10-2019-0031727 2019-03-20
PCT/KR2020/003836 WO2020190077A1 (ko) 2019-03-20 2020-03-20 예측모드 추정에 기반하는 인트라 예측장치 및 방법

Publications (1)

Publication Number Publication Date
CN113892268A true CN113892268A (zh) 2022-01-04

Family

ID=72826184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080037443.1A Pending CN113892268A (zh) 2019-03-20 2020-03-20 基于预测模式估计的帧内预测装置和方法

Country Status (2)

Country Link
KR (1) KR20200113173A (zh)
CN (1) CN113892268A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022260374A1 (ko) * 2021-06-07 2022-12-15 현대자동차주식회사 개선된 크로스 컴포넌트 선형 모델 예측을 이용하는 비디오 코딩방법 및 장치
WO2024071523A1 (ko) * 2022-09-26 2024-04-04 현대자동차주식회사 개선된 크로스 컴포넌트 선형 모델 예측을 이용하는 비디오 코딩을 위한 방법 및 장치

Also Published As

Publication number Publication date
KR20200113173A (ko) 2020-10-06

Similar Documents

Publication Publication Date Title
US20220191530A1 (en) Intra prediction method and device for predicting and dividing prediction unit into sub-units
US11973966B2 (en) Method and apparatus for efficiently coding residual blocks
JP2022539737A (ja) 動画データのイントラ予測コーディングのための方法及び装置
CN113892268A (zh) 基于预测模式估计的帧内预测装置和方法
US11706429B2 (en) Method and device for encoding and decoding image involving gradual refresh technique
KR20220071939A (ko) 비디오 부호화 및 복호화를 위한 장치 및 방법
KR20220071131A (ko) 서브블록단위 인트라 예측을 이용하는 영상 부호화 및 복호화 방법과 장치
CN113841403A (zh) 影像解码装置中使用的逆量化装置和方法
US20220150470A1 (en) Method and apparatus for intra predictionbased on deriving prediction mode
US20230179762A1 (en) Video encoding and decoding using arbitrary block partitioning
US20240007620A1 (en) Image encoding and decoding method using adaptive alternative mode
US20240007645A1 (en) Video encoding and decoding method using adaptive reference pixel selection
US20240137490A1 (en) Video encoding/decoding method and apparatus
US20240007623A1 (en) Block splitting structure for efficient prediction and transform, and method and appartus for video encoding and decoding using the same
KR20230059135A (ko) 다양한 블록 분할 구조를 이용하는 비디오 코딩방법 및 장치
KR20220071128A (ko) 적응적 대체 모드를 이용한 영상 부호화 및 복호화 방법
KR20220071129A (ko) 적응적 참조화소 선택을 이용한 영상 부호화 및 복호화 방법
KR20220118334A (ko) 서브블록 분할 기반 인트라 예측을 이용하는 비디오 코딩방법 및 장치
CN114762328A (zh) 利用差分调制的视频编码和解码
KR20220118351A (ko) 인트라 예측 신호와 인터 예측 신호의 가중 합을 이용한 예측 블록을 생성하는 방법 및 이를 이용한 장치
KR20220137549A (ko) 적응적 인트라 예측 정밀도를 이용하는 비디오 코딩방법 및 장치
KR20220125175A (ko) 인트라 예측모드 유도를 이용하는 비디오 코딩방법 및 장치
KR20220071931A (ko) 효율적인 예측 및 변환을 위한 블록 분할 구조 및 이를 이용한 비디오 부호화 및 복호화를 위한 방법 및 장치
KR20220126226A (ko) 나선스캔 순서를 이용하는 비디오 코딩방법 및 장치
JP2024511887A (ja) 適応的イントラ予測精度を用いるビデオコーディング方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination