CN117941345A - 图像解码装置、图像解码方法及程序 - Google Patents

图像解码装置、图像解码方法及程序 Download PDF

Info

Publication number
CN117941345A
CN117941345A CN202280060287.XA CN202280060287A CN117941345A CN 117941345 A CN117941345 A CN 117941345A CN 202280060287 A CN202280060287 A CN 202280060287A CN 117941345 A CN117941345 A CN 117941345A
Authority
CN
China
Prior art keywords
intra
prediction
prediction mode
mode
intra prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280060287.XA
Other languages
English (en)
Inventor
木谷佳隆
河村圭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Publication of CN117941345A publication Critical patent/CN117941345A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明所涉及的图像解码装置(200)具有:帧间预测部(241),其导出相对于GPM的运动信息并生成运动补偿像素;帧内预测部(242),其导出相对于GPM的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器(244),其保存或输出包含应用GPM的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,帧内预测部(242)根据与解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的帧内预测模式生成帧内预测像素。

Description

图像解码装置、图像解码方法及程序
技术领域
本发明涉及一种图像解码装置、图像解码方法及程序。
背景技术
在非专利文献1中,公开一种GPM(Geometric Partitioning Mode:几何划分模式)。
GPM将矩形块倾斜地一分为二,分别对其进行运动补偿。具体而言,在GPM中,分割而成的两个区域分别利用融合模式的运动矢量进行运动补偿,并通过加权平均进行合成。作为倾斜的分割图案,根据角度和位置而准备有64种图案。
现有技术文献
专利文献
非专利文献1:ITU-T H.266/VVC
非专利文献2:JVET-U0100、“Compression efficiency methods beyond VVC”
非专利文献3:JVET-W0024、“EE2:Summary Report on Enhanced Compressionbeyond VVC capability”
发明内容
发明要解决的课题
然而,在非专利文献1中公开的GPM限定为帧间预测,因此具有编码性能的改善余地的问题点。
因此,本发明是鉴于上述的课题而作出的,其目的在于,提供一种在对GPM追加帧内预测模式的情况下,能够改善帧间预测性能,提高编码性能的图像解码装置、图像解码方法及程序。
用于解决课题的手段
本发明的第一特征的主旨在于,具有:帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,所述帧内预测部构成为根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
本发明的第二特征是一种图像解码装置,其主旨在于,具有:帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,所述帧内预测部构成为根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出多个帧内预测模式,控制是否使用规定的索引,从由所导出的所述多个帧内预测模式构成的帧内预测模式候补列表中选择一个或多个帧内预测模式并生成所述帧内预测像素。
本发明的第三特征是一种图像解码装置,其主旨在于,具有:帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,所述帧内预测部构成为根据所述几何分割模式的分割形状或与所述解码目标块相邻的相邻参考像素或相邻参考块导出多个帧内预测模式,控制是否使用规定的索引,从由所导出的所述多个帧内预测模式构成的帧内预测模式候补列表中选择一个或多个帧内预测模式并生成所述帧内预测像素,在导出所述多个帧内预测模式时,将与所述几何分割模式的分割形状平行方向的帧内预测模式注册于所述帧内预测模式候补列表的开头。
本发明的第四特征是一种图像解码装置,其主旨在于,具有:解码部,其构成为对解码目标切片或解码目标块的控制数据进行解码,所述解码部构成为通过对所述解码目标切片或所述解码目标块的控制数据进行解码,在特定为所述解码目标块包含于I切片且为Dual Tree(双树)的情况下,即使判定为对所述解码目标块的亮度分量应用几何分割模式,也判定为不能应用相对于与所述解码目标块的亮度分量对应的色差分量块的几何分割模式,在除此以外的情况下,不判定为不能应用相对于所述色差分量块的几何分割模式。
本发明的第五特征是一种图像解码装置,其主旨在于,具有:帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,所述帧内预测部构成为在所述解码目标块不为Dual Tree且对所述解码目标块的亮度分量应用几何分割模式的情况下,对所述解码目标块的色差分量应用几何分割模式,而且,将对与解码目标块的色差分量对应的亮度分量的几何分割模式的各分割区域使用的帧内预测模式导出为相对于由所述色差分量的几何分割模式分割而成的各分割区域的帧内预测模式。
本发明的第六特征是一种图像解码方法,其主旨在于,具有:工序A,导出相对于几何分割模式的运动信息并生成运动补偿像素;工序B,导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及工序C,保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,在所述工序A中,根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
本发明的第七特征是一种程序,其主旨在于,其使计算机作为图像解码装置发挥功能,其中,所述图像解码装置具有:帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,所述帧内预测部构成为根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
发明效果
根据本发明,能够提供一种在对GPM追加帧内预测模式的情况下,能够改善帧间预测性能,提高编码性能的图像解码装置、图像解码方法及程序。
附图的简单说明
图1是表示一实施方式所涉及的图像处理系统1的结构的一例的图。
图2是表示一实施方式所涉及的图像编码装置100的功能块的一例的图。
图3是表示一实施方式所涉及的图像解码装置200的功能块的一例的图。
图4是表示通过非专利文献1所公开的几何分割模式,矩形的解码目标块由几何分割模式的分割线一分为二呈几何形状的分割区域A和分割区域B的情况的一例的图。
图5表示本实施方式所涉及的对GPM应用帧内预测模式的一例。
图6表示本实施方式所涉及的对GPM应用帧内预测模式的一例。
图7表示本实施方式所涉及的帧内预测模式候补列表的一例的图。
图8是表示非专利文献2所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法1的一例的图。
图9是表示在非专利文献2所公开的面向GPM的模板匹配这一技术中,用于根据GPM的分割线限制参考的样板(相邻参考像素)的区段的表格的图。
图10是表示非专利文献3所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法2的一例的图。
图11是表示非专利文献1和非专利文献2所涉及的根据相对于通常帧内预测的相邻参考块的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考块的帧内预测模式的导出方法的一例的图。
图12是表示非专利文献1所公开的融合候补列表的构建方法的图。
图13是表示非专利文献1和本实施方式所涉及的GPM的相对于各分割区域A/B的预测像素的权重系数w的值的一例的图。
图14是表示规定GPM的分割线的角度的angleIdx的一例的图。
图15是表示disLut的一例的图。
图16是表示按4×4像素子块特定非专利文献1所公开的被保存预测信息种类和本实施方式所涉及的被保存预测信息种类的例子的图。
图17是表示根据构成应用GPM块的子块的sType的值保存的非专利文献1所公开的运动信息和本实施方式所涉及的预测信息的一览表的图。
图18是表示相对于图4之类的由不同的两个帧间预测构成的GPM保存的预测信息的一例的图。
图19是表示相对于图5之类的由帧内预测和帧间预测构成的GPM保存的预测信息的一例的图。
图20是表示相对于图6之类的由不同的两个帧内预测构成的GPM保存的预测信息的一例的图。
图21是表示相对于图7之类的由不同的两个帧内预测构成的GPM保存的预测信息的一例的图。
符号说明
10:图像处理系统;100:图像编码装置;111、241:帧间预测部;112、242:帧内预测部;113、243:合成部;114、224:预测信息缓冲器;121:减法器;122、230:加法器;131:变换/量化部;132、220:反向变换/反向量化部;140:编码部;150、250:环路滤波处理部;160、260:帧缓冲器;200:图像解码装置;210:解码部。
具体实施方式
以下,一边参考附图一边说明本发明的实施方式。此外,以下的实施方式中的构成要素能够适当地与现有的构成要素等进行替换,并且能够进行包括与其他现有的构成要素的组合的各种变形。因此,不依据以下的实施方式的记载来限定权利要求书中记载的技术方案的内容。
<第一实施方式>
以下,参考图1~图21,对本发明的第一实施方式所涉及的图像处理系统10进行说明。图1是表示本实施方式所涉及的图像处理系统10的图。
(图像处理系统10)
如图1所示,本实施方式所涉及的图像处理系统10具有图像编码装置100和图像解码装置200。
图像编码装置100构成为通过对输入图像信号(画面)进行编码来生成编码数据。图像解码装置200构成为通过对编码数据进行解码来生成输出图像信号。
在此,所述编码数据可以从图像编码装置100经由传输路径发送到图像解码装置200。另外,编码数据也可以在被存储于存储介质后,从图像编码装置100提供给图像解码装置200。
(图像编码装置100)
以下,参考图2,对本实施方式所涉及的图像编码装置100进行说明。图2是表示本实施方式所涉及的图像编码装置100的功能块的一例的图。
如图2所示,图像编码装置100具有帧间预测部111、帧内预测部112、合成部113、预测信息缓冲器114、减法器121、加法器122、变换/量化部131、反向变换/反向量化部132、编码部140、环路滤波处理部150和帧缓冲器160。
帧间预测部111构成为通过帧间预测(inter-frame prediction)来生成帧间预测信号。
具体而言,帧间预测部111构成为通过对编码目标帧(目标帧)与存储于帧缓冲器160的参考帧进行比较来特定参考帧所含的参考块,并对特定的参考块确定运动矢量(MV:Motion Vector)。在此,参考帧是与目标帧不同的帧。
另外,帧间预测部111构成为根据参考块和运动矢量,按目标块生成编码目标块(以下,目标块)所含的帧间预测信号。
另外,帧间预测部111构成为将帧间预测信号输出到合成部113。
另外,虽然在图2中未图示,但帧间预测部111构成为将帧间预测的控制有关的信息(具体而言,帧间预测模式、运动矢量、参考帧列表、参考帧编号等信息)输出到编码部140。
帧内预测部112构成为通过帧内预测(intra-frame prediction)来生成帧内预测信号。
具体而言,帧内预测部112构成为特定目标帧所含的参考块,并根据所特定的参考块按目标块生成帧内预测信号。在此,参考块是参考目标块的块。例如,参考块是与目标块相邻的块。
另外,帧内预测部112构成为将帧内预测信号输出到合成部113。
另外,虽然在图2中未图示,但帧内预测部112构成为将帧内预测的控制有关的信息(具体而言,帧内预测模式等信息)输出到编码部140。
合成部113构成为将从帧间预测部111输入的帧间预测信号或/和从帧内预测部112输入的帧内预测信号使用预先设定的权重系数进行合成,并将所合成的预测信号(以下,统称为预测信号)输出到减法器121和加法器122。
预测信息缓冲器114构成为保存从帧间预测部111或帧内预测部112输入的预测信息或将所保存的预测信息输出到帧间预测部111或帧内预测部112或合成部113或环路滤波处理部150。在此,将在后面说明预测信息的细节。
在此,关于合成部113的帧间预测信号或/和帧内预测信号的合成处理,由于也能够在本实施方式中采用与非专利文献1相同的结构,因此省略说明。
减法器121构成为从输入图像信号减去预测信号,将预测残差信号输出到变换/量化部131。在此,减法器121构成为生成预测残差信号,其是由帧内预测或帧间预测生成的预测信号与输入图像信号的差。
加法器122构成为将从合成部113输出的预测信号与从反向变换/反向量化部132输出的预测残差信号相加来生成滤波处理前解码信号,并将所述滤波处理前解码信号输出到帧内预测部112和环路滤波处理部150。
在此,滤波处理前解码信号构成由帧内预测部112使用的参考块。
变换/量化部131构成为进行预测残差信号的变换处理并且取得系数层次值。而且,变换/量化部131也可以构成为进行系数层次值的量化。
在此,变换处理是将预测残差信号变换为频率分量信号的处理。作为所述变换处理,可以使用与离散余弦变换(Discrete Cosine Transform,以下记为DCT)对应的基底图案(变换矩阵),也可以使用与离散正弦变换(Discrete Sine Transform,以下记为DST)对应的基底图案(变换矩阵)。
另外,作为变换处理,也可以使用非专利文献1所公开的能够从多个变换基底按水平/垂直方向选择适于预测残差信号的系数的偏差的MTS(Multiple TransformSelection:多核变换选择)、通过使一次变换后的变换系数集中于频率更低区域来改善编码性能的LFNST(Low Frequecny Non-Separable Transform:低频不可分变换)。
反向变换/反向量化部132构成为进行从变换/量化部131输出的系数层次值的反向变换处理。在此,反向变换/反向量化部132也可以构成为在反向变换处理之前进行系数层次值的反向量化。
在此,反向变换处理和反向量化进行与由变换/量化部131进行的变换处理和量化相反的步骤。
编码部140构成为对从变换/量化部131输出的系数层次值进行编码,并输出编码数据。
在此,例如,编码是根据系数层次值的发生概率分配不同的长度的代码的熵编码。
另外,编码部140构成为除了系数层次值以外,还对由解码处理使用的控制数据进行编码。
在此,控制数据可以包含编码块尺寸、预测块尺寸、变换块尺寸等块尺寸有关的信息(标志或索引)。
另外,控制数据也可以包含后述的图像解码装置200中的反向变换/反向量化部220的反向变换/反向量化处理、帧间预测部241的帧间预测信号生成处理、帧内预测部242的帧内预测信号生成处理、合成部243的帧间预测信号或/和帧内预测信号的合成处理、环路滤波处理部250的滤波处理等控制所需的信息(标志或索引)。
此外,在非专利文献1中,这些控制数据被称为语法,其定义被称为语义。
另外,控制数据也可以包含后述的序列参数集(SPS:Sequence Parameter Set)、画面参数集(PPS:Picutre Parameter Set)、画面报头(PH:Picture Header)、切片报头(SH:Slice Header)等报头信息。
环路滤波处理部150构成为对从加法器122输出的滤波处理前解码信号进行滤波处理并且将滤波处理后解码信号输出到帧缓冲器160。
在此,例如,滤波处理是减少在块(编码块、预测块或变换块)的边界部分产生的失真的去块滤波器处理或根据从图像编码装置100传输的滤波系数、滤波选择信息、图像的图形的局部的性质等切换滤波的自适应循环滤波处理。
帧缓冲器160构成为累积由帧间预测部111使用的参考帧。
在此,滤波处理后解码信号构成由帧间预测部111使用的参考帧。
(图像解码装置200)
以下,参考图3对本实施方式所涉及的图像解码装置200进行说明。图3是表示本实施方式所涉及的图像解码装置200的功能块的一例的图。
如图3所示,图像解码装置200具有解码部210、反向变换/反向量化部220、加法器230、帧间预测部241、帧内预测部242、合成部243、预测信息缓冲器224、环路滤波处理部250和帧缓冲器260。
解码部210构成为对由图像编码装置100生成的编码数据进行解码,并对系数层次值进行解码。
在此,解码例如是步骤与由编码部140进行的熵编码的步骤相反的熵解码。
另外,解码部210也可以构成为通过编码数据的解码处理取得控制数据。
在此,控制数据可以包含上述的解码块(与上述的图像编码装置100中的编码目标块意思相同。以下,统称为目标块)的块尺寸有关的信息。
另外,控制数据也可以包含反向变换/反向量化部220的反向变换/反向量化处理、帧间预测部241或帧内预测部242的预测像素生成处理、环路滤波处理部250的滤波处理等控制所需的信息(标志或索引)。
另外,控制数据也可以包含上述的序列参数集(SPS:Sequence Parameter Set)、画面参数集(PPS:Picutre Parameter Set)、画面报头(PH:Picture Header)、切片报头(SH:Slice Header)等报头信息。
反向变换/反向量化部220构成为进行从解码部210输出的系数层次值的反向变换处理。在此,反向变换/反向量化部220也可以构成为在反向变换处理之前进行系数层次值的反向量化。
在此,反向变换处理和反向量化进行与由变换/量化部131进行的变换处理和量化相反的步骤。
与帧间预测部111同样地,帧间预测部241构成为通过帧间预测(inter-frameprediction)来生成帧间预测信号。
具体而言,帧间预测部241构成为根据从编码数据解码而成的运动矢量和参考帧所含的参考信号来生成帧间预测信号。帧间预测部241构成为将帧间预测信号输出到合成部243。
与帧内预测部112同样地,帧内预测部242构成为通过帧内预测(帧内预测)来生成帧内预测信号。
具体而言,帧内预测部242构成为特定目标帧所含的参考块,并根据所特定的参考块按预测块生成帧内预测信号。帧内预测部242构成为将帧内预测信号输出到合成部243。
与合成部113同样地,合成部243构成为将从帧间预测部241输入的帧间预测信号或/和从帧内预测部242输入的帧内预测信号使用预先设定的权重系数进行合成,并将所合成的预测信号(以下,统称为预测信号)输出到加法器230。
与预测信息缓冲器114同样地,预测信息缓冲器244构成为保存从帧间预测部221或帧内预测部222输入的预测信息或将所保存的预测信息输出到帧间预测部241或帧内预测部242或合成部243或环路滤波处理部250。在此,将在后面说明预测信息的细节。
加法器230构成为将从合成部243输出的预测信号与从反向变换/反向量化部220输出的预测残差信号相加来生成滤波处理前解码信号,并将所述滤波处理前解码信号输出到环路滤波处理部250。
在此,滤波处理前解码信号构成由帧内预测部242使用的参考块。
与环路滤波处理部150同样地,环路滤波处理部250构成为对从加法器230输出的滤波处理前解码信号进行滤波处理,并且将滤波处理后解码信号输出到帧缓冲器260。
在此,例如,滤波处理是减少在块(编码块、预测块、变换块或将这些分割而成的子块)的边界部分产生的失真的去块滤波器处理或根据从图像编码装置100传输的滤波系数、滤波选择信息、图像的图形的局部的性质等切换滤波的自适应循环滤波处理。
与帧缓冲器160同样地,帧缓冲器260构成为累积由帧间预测部241使用的参考帧。
在此,滤波处理后解码信号构成由帧间预测部241使用的参考帧。
(几何分割模式)
以下,使用图4,对解码部210、帧间预测部241和帧内预测部242所涉及的非专利文献1所公开的几何分割模式(GPM:Geometric Partitioning Mode)进行说明。
图4表示通过非专利文献1所公开的几何分割模式,矩形的解码目标块由几何分割模式的分割线L一分为二呈几何形状的分割区域A和分割区域B的情况的一例。
在此,非专利文献1所公开的几何分割模式的分割线L根据角度和位置而准备有64种图案。
另外,非专利文献1所涉及的GPM分别对分割区域A和分割区域B应用帧间预测,并生成帧间预测(运动补偿)像素。
具体而言,在所述GPM中,构建非专利文献1所公开的融合候补列表,根据所述融合候补列表和从图像编码装置100传输的相对于各分割区域A/B的两个融合索引(merge_gpm_idx0、merge_gpm_idx1),导出各分割区域A/B的运动矢量(mvA、mvB)和参考帧,生成参考块,即帧间预测(或运动补偿)块,最终各分割区域A/B的帧间预测像素通过预先设定的权重被加权平均来合成。
(对GPM应用帧内预测)
以下,使用图5和图6,说明对解码部210、帧间预测部241、帧内预测部242所涉及的非专利文献1所公开的几何分割模式(GPM:Geometric Partitioning Mode)和本实施方式所涉及的第一几何分割模式(GPM)进行的帧内预测模式的应用。
图5和图6表示对本实施方式所涉及的GPM应用帧内预测模式的一例。
具体而言,图5表示对各分割区域A/B应用帧内预测(modeX)和帧间预测的情况下的本实施方式所涉及的GPM的结构例。图6表示对各分割区域A/B应用不同的两个帧内预测(modeX、modeY)的情况下的本实施方式所涉及的GPM的结构例。
在此,在本实施方式所涉及的第一GPM中,能够相对于各分割区域A/B应用帧间预测或帧内预测模式中的任一种。而且,在帧内预测中应用的帧内预测模式的种类根据对目标块应用的GPM的分割形状(分割线)而限定。即,根据对目标块应用的GPM的分割形状(分割线)导出能够应用的帧内预测模式。
另外,在本实施方式所涉及的第二GPM中,规定能否应用对解码目标块的帧内预测模式进行了追加应用的GPM和应用GPM时的各分割区域A/B的预测模式种类的特定方法。
由此,通过追加应用了帧内预测模式的GPM被适当地应用于解码目标块,并且特定最优的预测模式,作为结果,能够实现编码性能的进一步改善余地。
此外,之后分别将图4之类的由不同的两个帧间预测构成的GPM、图5所示之类的由帧内预测和帧间预测构成的GPM、图6所示之类的由两个帧内预测构成的GPM称为Inter/Inter-GPM、Intra/Inter-GPM、Intra/Intra-GPM。
而且,在本实施方式中,对GPM追加应用的帧内预测,除了规定根据对上述的解码目标块应用的GPM的分割形状(分割线)的帧内预测模式的导出方法以外,还规定根据与解码目标块相邻的相邻参考像素或相邻参考块的帧内预测模式的导出方法。
在此,与解码目标块相邻的相邻参考像素或相邻参考块是与解码目标块相邻且在解码目标块的解码处理的开始时间点完成解码处理的参考像素或参考块。
通过对GPM的帧内预测应用的帧内预测模式能够根据相邻参考像素或相邻参考块导出,能够提高GPM的帧内预测性能,作为结果能够实现编码性能的进一步改善余地。
[帧内预测部242中的帧内预测模式导出方法和选择方法]
之后,针对帧内预测部242中的由本实施方式提出的对GPM应用帧内预测的图案中的、对Intra/Inter-GPM和Intra/Intra-GPM进行的帧内预测模式的导出方法和选择方法进行说明。
(帧内预测模式候补列表)
以下,使用图7,对本实施方式所涉及的帧内预测部242中面向GPM的帧内预测模式候补列表(之后,帧内预测模式候补列表)的构建方法进行说明。图7是表示本实施方式所涉及的帧内预测模式候补列表的一例的图。
在本实施方式中,所述帧内预测模式候补列表的列表尺寸可以为固定值。例如,列表尺寸可以为“3”、“4”及“5”或非专利文献1所公开的面向不应用GPM的帧内预测块的帧内预测模式候补列表的最大尺寸可以为“6”或非专利文献3所公开的面向不应用GPM的帧内预测块的帧内预测模式候补列表的最大尺寸可以为“22”。或者,列表尺寸可以为“7”到“21”之间的正数。
或者,所述帧内预测模式候补列表的列表尺寸可以为可变值。例如,通过使规定列表尺寸的最大值的索引包含于序列或画面或切片单元的控制数据,并由解码部210对其进行解码,从而能特定够序列或画面或切片单元的列表尺寸的最大值。
在所述帧内预测模式候补列表中,注册根据后述的GPM的分割形状或与解码目标块相邻的相邻参考像素、相邻参考块导出的多个帧内预测模式。将在后面说明这些帧内预测模式的导出方法的细节。
帧内预测部可以在上述帧内预测模式的导出(帧内预测模式候补列表的构建)完成后,根据由解码部210解码或推定出的分别相对于分割区域A/B的两个帧内预测模式索引(intra_gpm_idx0和intra_gpm_idx1)的值,分别对于分割区域A/B选择帧内预测模式候补列表内中的哪一个帧内预测模式用于帧内预测像素生成。
此外,对于Intra/Intra-GPM,在所述两个帧内预测模式索引为相同值的情况下,由于与不应用GPM的帧内预测相同,因此所述两个帧内预测模式索引构成为一定为不同的值。
另外,作为变更例,在相对于Intra/Intra-GPM的分割区域A/B的帧内预测模式的导出中,可以代替相对于上述的分割区域A/B共同利用的帧内预测模式候补列表,而构建相对于分割区域A/B不同的帧内预测模式候补列表,通过相对于分割区域A/B的各自的该帧内预测模式候补列表和各自的帧内预测模式索引导出相对于分割区域A/B的各自的帧内预测模式。
所述不同的两个帧内预测模式候补列表的构建方法可以根据GPM的分割形状进行控制。
例如,在后述的根据GPM的分割形状的帧内预测模式的导出方法中,当存在包含位于解码目标块的最左上的像素的分割区域和不包含位于最左上的像素的分割区域时,可以构成为能够在相对于前者的分割区域的帧内预测模式候补列表中注册相对于GPM的分割线的Angular预测或接近垂直方向的Angular预测或Plnar预测,但在相对于后者的分割区域的帧内预测模式候补列表中,不能注册相对于GPM的分割线的垂直方向的Angular预测或接近垂直方向的Angular预测或Plnar预测或DC预测。
此时,相对于在对前者的分割区域的帧内预测模式候补列表中注册的GPM的分割线的Angular预测或接近垂直方向的Angular预测或Plnar预测可以注册为该帧内预测模式候补列表的最小列表编号或其之后的列表编号。
或者,可以构成为在相对于前者的分割区域的帧内预测模式候补列表中,不能注册相对于GPM的分割线的平行方向的Angular预测,在相对于后者的分割区域的帧内预测模式候补列表中,可以注册相对于GPM的分割线的平行方向的Angular预测。
此时,相对于在对后者的分割区域的帧内预测模式候补列表中注册的GPM的分割线的平行方向的Angular预测可以注册为该帧内预测模式候补列表的最小列表编号。
根据以上的结构,能够避免后者的分割区域在横跨前者的分割区域的基础上预测与解码目标块相邻的相邻参考像素,即,相对于GPM的分割线的相对于GPM的分割线的垂直方向的Angular预测或接近垂直方向的Angular预测或Plnar预测或DC预测,并且后者的分割区域能够不横跨前者的分割区域地预测与解码目标块相邻的相邻参考像素,即,相对于GPM的分割线的平行方向的Angular预测,因此能够期待预测性能的提高效果。
另外,相对于该不同的两个帧内预测模式候补列表,可以对后述的根据与解码目标块相邻的相邻参考像素或相邻参考块的帧内预测模式的导出方法的一部分进行变更。
例如,根据GPM的分割形状,可以仅使用与各分割区域接近的相邻参考像素或相邻参考块,分别在帧内预测模式候补列表中注册所导出的帧内预测模式候补。
此外,解码部210可以根据构成GPM的帧内预测的总计应用数,判定是否需要对用于从所述帧内预测模式候补列表内选择用于帧内预测像素生成的帧内预测模式的帧内预测模式索引进行解码。
在此,作为上述的变更例,帧内预测部242可以根据上述的帧内预测模式索引的值,选择帧内预测模式候补列表内的多个帧内预测模式,生成帧内预测像素。
根据所述结构,在硬件安装的图像解码装置200中,帧内预测像素的生成所需的电路规模增大,但由于能够通过多个帧内预测模式生成帧内预测像素,因此帧内预测性能提高,作为结果能够期待编码性能的改善。
此外,在使用多个帧内预测模式生成(合成)帧内预测像素的情况下,可以平均合成帧内预测像素。
或者,可以以规定的权值进行加权平均来合成帧内预测像素。例如,作为所述规定的权值的设定方法,可以随着帧内预测模式候补列表的注册顺序越早(列表编号越小)的帧内预测模式,将权值设定得越大。相反,可以随着帧内预测模式候补列表的注册顺序越晚(列表编号越大)的帧内预测模式,将权值设定得越小。
由于帧内预测模式候补列表编号小的帧内预测模式的一方的对GPM应用的帧内预测性能的提高率高,因此根据这样设定,作为结果能够期待编码性能的改善效果。
(根据分割形状的帧内预测模式导出方法)
在本实施方式中,帧内预测部242根据GPM的分割形状(分割线)来导出帧内预测模式,将其注册于上述的帧内预测模式候补列表。
在此,导出的帧内预测模式可以构成为,例如非专利文献1所公开的面向不应用GPM的帧内预测(之后,通常帧内预测)准备的67种Angular预测中的与GPM的分割形状(分割线)平行的Angular预测。
或者,作为变更例,导出的帧内预测模式可以构成为,非专利文献1所公开的面向通常帧内预测准备的67种Angular预测中的与GPM的分割形状(分割线)垂直的Angular预测。
帧内预测部242可以将导出的Angular预测注册于上述的帧内预测模式候补列表的开头,也可以在后述的其他帧内预测模式的导出完成后进行注册。
根据GPM的分割形状导出的帧内预测模式可以在反映与GPM的分割形状对应的边缘等纹理的基础上生成帧内预测像素,因此能够期待帧内预测性能高的提高效果。因此,能够期待该帧内预测模式相对于GPM的帧内预测区域的选择率高,因此如果在帧内预测模式候补列表内与最小列表编号相关联,则也可以缩短所需的帧内预测模式索引的总代码长,作为结果能够期待编码性能的改善效果。
(根据相邻参考像素的帧内预测模式导出方法1)
以下,使用图8和图9,对非专利文献2所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法1进行说明。
图8是表示非专利文献2所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法1的一例的图。之后,将这些导出方法统称为“DIMD(Decoder-side Intra Mode Derivation:解码端帧内模式推导)”。
在非专利文献2中,对于所述DIMD而言,如图8所示,相对于与解码目标块相邻的相邻参考像素应用3×3像素的窗口尺寸的横及纵向的Sobel滤波器,计算面向通常帧内预测的相对于所有Angular预测模式的像素值的直方图。在此,针对应用Sobel滤波器用于与各Angular预测模式建立对应的相邻参考像素的角度和像素值的计算方法,由于在本实施方式中也可以采用与非专利文献2相同的结构,因此省略详细的说明。
在非专利文献2中,另外根据解码目标块的块尺寸,如图8所示那样控制用于直方图的计算的相邻参考像素区域。具体而言,在4×4像素块中,仅使用解码目标块的最上左端的像素的上及左的各自的3×3像素区域来计算直方图。
在非专利文献2中,使用计算出的直方图中的作为最高和其次的像素值的帧内预测模式和Planar模式来生成帧内预测像素,然后,使用规定的权值对所生成的帧内预测像素进行加权平均,生成最终的帧内预测像素。
在本实施方式中,帧内预测部242可以将上述的非专利文献2所公开的DIMD仅应用于GPM的帧内预测模式的导出。即,不进行使用所导出的多个帧内预测模式的帧内预测像素的合成/生成处理。
由此,对于GPM的帧内预测区域(Intra/Intra-GPM的情况下为两个帧内预测区域),由于能够通过一个帧内预测模式生成帧内预测像素,因此能够避免硬件安装的图像解码装置200中GPM的帧内预测像素的生成所需的电路规模的增大,并且通过解码目标块的相邻参考像素的直方图的解析,能够应用反映与GPM的分割形状相应的边缘等纹理的帧内预测,因此能提高够帧内预测性能,作为结果能够期待编码性能的改善。
此外,在本实施方式中,与非专利文献2同样地,解码部210可以构成为通过解码或推定对能否应用DIMD进行判定的标志,从而判定是否导出帧内预测模式。
另外,本实施方式所涉及的帧内预测部242可以构成为,在面向GPM的帧内预测模式候补列表中已经不包含相同的帧内预测模式的情况下,对通过所述DIMD导出的帧内预测模式进行注册,在面向GPM的帧内预测模式候补列表中已经包含相同的帧内预测模式的情况下,不对通过所述DIMD导出的帧内预测模式进行注册。
根据所述结构,能够避免在帧内预测模式候补列表内重复注册相同的帧内预测模式。
在此,在对所述帧内预测模式候补列表注册新的帧内预测模式时,与现有的帧内预测模式的一致性进行比较,之后将在两者一致的情况下进行剪枝的处理称为“帧内预测模式候补选定处理”。
另外,本实施方式所涉及的帧内预测部242可以将通过所述DIMD导出的帧内预测模式中的注册于帧内预测模式候补列表的帧内预测模式数限定为一个。在该情况下,帧内预测部242从直方图中导出作为最高像素值(亮度值)的Angular预测模式。
此外,在上述的帧内预测模式候补选定处理中,当对作为最高像素值(亮度值)的Angular预测模式(以下,1st Angular预测模式)进行剪枝时,可以依次从直方图的高侧起与现有的帧内预测模式进行比较,注册两者不一致的模式。
或者,在上述的帧内预测模式候补选定处理中,当对1st Angular预测模式进行剪枝时,可以结束DIMD的帧内预测模式的导出处理。
作为变更例,可以将通过DIMD导出的帧内预测模式中的注册于帧内预测模式候补列表的帧内预测模式数限定为两个。在所述情况下,帧内预测部242从直方图中导出1stAngular预测模式和作为最高像素值(亮度值)的之后的2nd Angular预测模式。
此外,在对1st Angular预测模式或2nd Angular预测模式进行剪枝的情况下,与上述的情况同样地,在这些之后从直方图的高侧起与现有的帧内预测模式进行比较,可以注册两者不一致的模式,也可以直接结束DIMD的帧内预测模式的导出处理。
另外,本实施方式所涉及的帧内预测部242可以根据GPM的分割形状(即,GPM分割线的角度),将用于上述的DIMD的直方图计算的相邻参考像素限制在规定区域。
图9是表示在非专利文献2所公开的面向GPM的模板匹配这一技术中,用于根据GPM的分割线的角度(具体而言,表示角度的索引、angleIdx)限制参考的样板(相邻参考像素)的区段的表格的图。
具体而言,图9所示的A和L分别表示解码目标块的上部和左部。
在本实施方式中,可以将该非专利文献2所公开的根据GPM的分割线规定的(限制的)相邻参考像素的表格应用于DIMD的直方图的计算。例如,在几何分割模式的分割形状(angleIdx)为“0”的情况下,分割区域A使用仅与解码目标块的上部相邻的相邻参考像素计算直方图,另一方面,分割区域B使用与解码目标块的上部及左部相邻的相邻参考像素计算直方图。根据该几何分割模式的分割形状,通过DIMD的直方图的计算中的相邻参考像素的参考位置的限制,能够避免将与解码目标块相邻的所有相邻参考像素用于计算,并且能够使用仅在GPM的分割线的方向上存在的相邻参考像素导出Angular预测,因此能够减轻相对于GPM的帧间预测的DIMD的帧内预测模式的导出处理负荷。
(根据相邻参考像素的帧内预测模式导出方法2)
以下,使用图9和图10,对非专利文献3所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法2进行说明。
图10是表示非专利文献3所涉及的根据相对于通常帧内预测的相邻参考像素的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考像素的帧内预测模式的导出方法2的一例的图。之后,将这些导出方法统称为“TIMD(Template-based Intra Mode Derivation:基于模板的帧内模式推导)”。
在非专利文献3中,对于TIMD而言,如图10所示,计算与解码目标块相邻的规定行的相邻参考像素(以下,样板)、面向所述样板的相邻参考像素和使用规定的帧内预测模式生成的面向样板的帧内预测像素(以下,面向样板的帧内预测像素)的SATD(Sum ofAbsolute Transformed Difference:哈达玛变换算法),在规定的帧内预测模式中将作为SATD最小及其次的帧内预测模式导出为TIMD的帧内预测模式,生成帧内预测像素。
在此,在上述的TIMD的SATD的计算中使用的帧内预测模式是面向通常帧内预测的帧内预测模式候补列表中所含的帧内预测模式。
在非专利文献3的TIMD中,当在面向通常帧内预测的帧内预测模式候补列表中不包含垂直预测模式、水平预测模式及DC预测模式时,以包含这些的状态计算SATD,导出帧内预测模式。
在本实施方式中,可以应用所述非专利文献3所公开的TIMD,由帧内预测部242导出帧内预测模式。即,帧内预测部242不进行使用所导出的多个帧内预测模式的帧内预测像素的合成/生成处理。
根据所述结构,对于GPM的帧内预测区域(Intra/Intra-GPM的情况下为两个帧内预测区域),由于能够通过一个帧内预测模式生成帧内预测像素,因此能够避免硬件安装的图像解码装置200中GPM的帧内预测像素的生成所需的电路规模的增大,并且通过解码目标块的相邻参考像素的直方图的解析,能够应用反映与GPM的分割形状相应的边缘等纹理的帧内预测,因此能够提高帧内预测性能,作为结果能够期待编码性能的改善。
此外,在本实施方式中,与非专利文献2同样地,解码部210可以构成为通过解码或推定对能否应用TIMD进行判定的标志,从而判定是否导出帧内预测模式。
另外,本实施方式所涉及的帧内预测部242可以构成为,在面向GPM的帧内预测模式候补列表中已经不包含相同的帧内预测模式的情况下,对通过TIMD导出的帧内预测模式进行注册,在面向GPM的帧内预测模式候补列表中已经包含相同的帧内预测模式的情况下,不对通过TIMD导出的帧内预测模式进行注册。
根据所述结构,能够避免在帧内预测模式候补列表内重复注册相同的帧内预测模式。
在此,在对所述帧内预测模式候补列表注册新的帧内预测模式时,与现有的帧内预测模式的一致性进行比较,之后将在两者一致的情况下进行剪枝的处理称为“帧内预测模式候补选定处理”。
另外,本实施方式所涉及的帧内预测部242可以将通过TIMD导出的帧内预测模式中的注册于帧内预测模式候补列表的帧内预测模式数限定为一个。在所述情况下,帧内预测部242从SATD的计算中导出作为最小的SATD成本的帧内预测模式(Angular预测)。
但是,在本实施方式中,对于所述TIMD处理的SATD的计算而言,与非专利文献3不同,可以将DC预测模式从SATD的计算中去除。
其原因在于,使用与解码目标块相邻的所有相邻参考像素生成帧内预测像素的DC预测有可能会生成帧内预测像素而无法适当地反映与GPM的分割形状对应的边缘等纹理,因此通过将DC预测从TIMD处理中的SATD的计算去除,能够避免由TIMD导出DC预测模式。
此外,在上述的帧内预测模式候补选定处理中,当对作为最小的SATD成本的Angular预测模式(以下,1st Angular预测模式)进行剪枝时,可以依次从SATD成本低侧起与现有的帧内预测模式进行比较,注册两者不一致的模式。或者,当对1st Angular预测模式进行剪枝时,可以结束TIMD的帧内预测模式的导出处理。
作为变更例,可以将通过TIMD导出的帧内预测模式中的注册于帧内预测模式候补列表的帧内预测模式数限定为两个。在所述情况下,帧内预测部242从SATD成本中导出1stAngular预测模式和作为最小的SATD成本的之后的2nd Angular预测模式。
此外,在对1st Angular预测模式或2nd Angular预测模式进行剪枝的情况下,与上述的情况同样地,在这些之后从SATD成本低侧起与现有的帧内预测模式进行比较,可以注册两者不一致的模式,也可以直接结束TIMD的帧内预测模式的导出处理。
另外,本实施方式所涉及的帧内预测部242可以根据GPM的分割形状(即,GPM分割线的角度),将用于上述的TIMD的SATD成本的计算的相邻参考像素限制在规定区域。
在本实施方式中,可以将图9所示的非专利文献2所公开的根据GPM的分割线规定的相邻参考像素区域的表格应用于TIMD处理的SATD成本的计算。例如,在几何分割模式的分割形状(angleIdx)为“0”的情况下,分割区域A仅使用仅与解码目标块的上部相邻的相邻参考像素和与该相邻参考像素的更上部相邻的相邻参考像素计算SATD成本,另一方面,分割区域B使用与解码目标块的上部及左部相邻的相邻参考像素及其这些相邻的相邻参考像素计算SATD成本。根据该几何分割模式的分割形状,通过TIMD处理的SATD成本的计算中的相邻参考像素的参考位置的限制,能够避免将与解码目标块相邻的所有相邻参考像素用于计算,并且能够使用仅在GPM的分割线的方向上存在的相邻参考像素导出Angular预测,因此能够减轻相对于GPM的帧间预测的TIMD的帧内预测模式的导出处理的负荷。
而且,本实施方式所涉及的帧内预测部242可以构成为,在与用于TIMD处理的SATD的计算的帧内预测模式相同的帧内预测模式已经注册于帧内预测模式候补列表的情况下,不对所述帧内预测模式的SATD的计算之后进行处理。
根据所述结构,能够避免在帧内预测模式中对已经注册的帧内预测模式,重复地经过TIMD处理来注册相同的帧内预测模式,因此能够减轻相对于GPM的帧间预测的TIMD处理的负荷。
(根据相邻参考块的帧内预测模式导出方法)
以下,使用图9和图11,对非专利文献1和非专利文献2所涉及的根据相对于通常帧内预测的相邻参考块的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考块的帧内预测模式的导出方法进行说明。
图11是表示非专利文献1和非专利文献2所涉及的根据相对于通常帧内预测的相邻参考块的帧内预测模式的导出方法和应用所述导出方法的本实施方式所涉及的根据相对于几何分割模式的相邻参考块的帧内预测模式的导出方法的一例的图。之后,将这些导出方法统称为“BIMD(Block-based Intra Mode Derivation:基于块的帧内模式推导)”。
在非专利文献3中,对于BIMD而言,如图11所示,将与解码目标块相邻的规定位置的相邻参考块具有的帧内预测模式导出为BIMD的帧内预测模式,生成帧内预测像素。
此外,在此导出的相邻参考块的帧内预测模式在相邻参考块为帧内预测块的情况下,直接参考该相邻参考块具有的帧内预测模式,但在相邻参考块为帧间预测块或为帧间预测块且应用帧内预测的应用GPM块的情况下,参考后述的由4×4子块像素单元保存的帧内预测模式。
在此,在非专利文献1和非专利文献2中,对于上述的BIMD而言,参考的相邻参考块如图11所示那样设定为解码目标块的左(A0)、左下(A1)、上(B0)、右上(B1)及左上(B2)。
在本实施方式中,可以应用非专利文献1和非专利文献2所公开的BIMD,由帧内预测部242导出帧内预测模式。即,帧内预测部242不进行使用所导出的多个帧内预测模式的帧内预测像素的合成/生成处理。
根据所述结构,对于GPM的帧内预测区域(Intra/Intra-GPM的情况下为两个帧内预测区域),由于能够从可以包含解码目标块的相邻参考块具有的帧内预测模式的帧内预测模式候补列表选择帧内预测模式来生成帧内预测像素,因此能够应用反映与GPM的分割形状相应的边缘等纹理的帧内预测,从而提高帧内预测性能,作为结果能够期待编码性能的改善。
另外,本实施方式所涉及的帧内预测部242可以构成为,在面向GPM的帧内预测模式候补列表中已经不包含相同的帧内预测模式的情况下,对通过BIMD导出的帧内预测模式进行注册,在面向GPM的帧内预测模式候补列表中已经包含相同的帧内预测模式的情况下,不对通过BIMD导出的帧内预测模式进行注册。
根据所述结构,能够避免在帧内预测模式候补列表内重复注册相同的帧内预测模式。
在此,在对帧内预测模式候补列表注册新的帧内预测模式时,与现有的帧内预测模式的一致性进行比较,之后将两者一致的情况下进行剪枝的处理称为“帧内预测模式候补选定处理”。
另外,本实施方式所涉及的帧内预测部242构成为,与非专利文献1及非专利文献2不同,在通过BIMD导出的帧内预测模式为DC预测模式的情况下,不在帧内预测模式候补列表中进行注册。
其原因在于,使用与解码目标块相邻的所有相邻参考像素生成帧内预测像素的DC预测有可能会生成帧内预测像素而无法适当地反映与GPM的分割形状对应的边缘等纹理,因此将DC预测从BIMD的帧内预测模式去除,能够避免DC预测模式被用于帧内预测像素的生成。
另外,本实施方式所涉及的帧内预测部242也可以在BIMD的帧内预测模式的导出中,与非专利文献1及非专利文献2同样地构成参考的图11所示的最大五个相邻参考块的顺序。此外,关于该参考顺序,由于在非专利文献1及非专利文献2中公开,因此在本实施方式中省略详细的说明。
作为变更例,在本实施方式中,可以将图9所示的非专利文献2所公开的根据GPM的分割线规定的(限制的)相邻参考像素区域的表格应用于BIMD的相邻参考块的参考。例如,在几何分割模式的分割形状(angleIdx)为“0”的情况下,分割区域A仅参考仅与解码目标块的上部相邻的相邻参考块(图11的B0、B1、B2)的帧内预测模式,另一方面,分割区域B参考与解码目标块的上部及左部相邻的相邻参考块(左部为A0、A1,上部为B0、B1、B2)的帧内预测模式。根据该几何分割模式的分割形状,通过BIMD的帧内预测模式的导出中的相邻参考块的参考位置的限制,能够避免参考与解码目标块相邻的所有相邻参考块的帧内预测模式,并且能够仅参考仅在GPM的分割线的方向上存在的相邻参考块具有的帧内预测模式(Angular预测)来导出帧内预测模式,因此能够减轻相对于GPM的帧间预测的BIMD的帧内预测模式的导出处理的负荷。
(各帧内预测模式导出顺序)
本实施方式所涉及的帧内预测部242可以构成为,对上述的根据GPM分割形状的帧内预测模式(以下,GIMD:GPM-angle-based Intra Mode Derivation:基于GPM角度的帧内模式推导)和根据相邻参考像素或相邻参考块的三种帧内预测模式的导出方法(DIMD、TIMD、BIMD)进行组合,导出帧内预测模式。以下,示出认为有效的结构例。
结构例1.GIMD→DIMD
结构例2.GIMD→TIMD
结构例3.GIMD→BIMD
结构例4.GIMD→DIMD→TIMD
结构例5.GIMD→DIMD→BIMD
结构例6.GIMD→TIMD→BIMD
7.GIMD→DIMD→TIMD→BIMD
首先,结构例1~3是对GIMD分别仅组合DIMD、TIMD及BIMD的方法。由GIMD导出的帧内预测模式有可能比由DIMD、TIMD及BIMD导出的帧内预测模式能够更直接地导出反映根据GPM的分割线的边缘等纹理的帧内预测模式,因此在DIMD、TIMD及BIMD之前导出。
接着,结构例4及5是将DIMD配置于TIMD或BIMD之前的结构例。
将DIMD配置于TIMD之前的理由在于,DIMD的帧内预测模式的导出处理比包含SATD的计算等比较繁琐的计算处理的TIMD的帧内预测模式的导出简单。
另一方面,将DIMD配置于BIMD之前的理由在于,虽然包含直方图的计算的DIMD的帧内预测模式的导出处理比BIMD的帧内预测模式的导出简单,但由DIMD导出的帧内预测模式有可能比由BIMD导出的帧内预测模式通过直方图的计算,更能够导出反映根据GPM的分割线的边缘等纹理的帧内预测模式,因此认为帧内预测性能的提高效果高。
在结构例6中,将TIMD配置于BIMD之前。配置理由与上述的将DIMD配置于BIMD之前的理由相同。
结构例7是将GIMD、DIMD、TIMD及BIMD的所有组合而成的结构例,根据上述的理由,在以该顺序导出帧内预测模式时,能够期待可以更高效地导出预测性能高的帧内预测模式。
(各帧内预测模式导出方法的开始限制)
本实施方式所涉及的帧内预测部242在相对于上述的几何块分割模式的帧内预测模式的各导出处理的开始时间点,当帧内预测模式候补列表所含的帧内预测模式的候补数未达到帧内预测模式候补列表尺寸的最大值时,开始各导出处理,在所述候补数达到帧内预测模式候补列表尺寸的最大值时,不开始各导出处理。
根据所述结构,能够避免无用的帧内预测模式的导出处理的执行,能够期待帧内预测部242整体的处理负荷的减轻。
(帧内预测模式导出完成后的帧内预测模式候补列表的注册方法)
本实施方式所涉及的帧内预测部242也可以构成为,在相对于上述的几何块分割模式的帧内预测模式的导出处理的完成时间点,当帧内预测模式候补列表所含的帧内预测模式的候补数未达到帧内预测模式候补列表尺寸的最大值时,在帧内预测模式候补列表中已经包含相同的预测模式的情况下,不注册规定的帧内预测模式。
例如,帧内预测部242在注册相对于GPM分割线平行方向的Angular预测模式的情况下,可以注册相对于GPM分割线垂直方向的Angular预测模式作为规定的帧内预测模式。
作为变更例,例如,帧内预测部242在注册相对于GPM分割线垂直方向的Angular预测模式的情况下,可以注册相对于GPM分割线平行方向的Angular预测模式。
另外,作为变更例,帧内预测部242可以在上述的Angular预测模式之后,注册Planar模式,之后注册帧内预测模式候补列表中开头注册的帧内预测模式的附近的帧内预测模式。
[帧间预测部241中的运动信息导出方法和选择方法]
之后,针对帧间预测部242中的由本实施方式提出的对GPM应用帧内预测的图案中的、对Intra/Inter-GPM和Inter/Inter-GPM进行的运动信息的导出方法和选择方法进行说明。
(能否对色差信号分量块应用GPM的控制方法和帧内预测模式的导出方法)
以下,对本实施方式中的帧内预测部242能否对色差信号分量块应用GPM的控制方法和帧内预测模式的导出方法进行说明。
在非专利文献1中,限为I切片(仅包含帧内预测块的切片),能够进行亮度信号分量和色差信号分量独立的块分割(Dual Tree)。解码目标块有无应用Dual Tree是由切片单元以解码部210解码的控制数据进行的特定。
在本实施方式中,在解码目标块为Dual Tree的情况下,解码部210判定为不能对解码目标块的色差分量应用GPM(Intra/Intra-GPM)。
此外,在对同一切片的与色差分量对应的亮度分量的相同位置(区域)应用GPM(Intra/Intra-GPM)的情况下,帧内预测部241将在对应的亮度分量的相同位置(区域)以4×4像素块单元保存的帧内预测模式导出为面向色差分量的帧内预测模式。在除此以外的情况下,将亮度分量的帧内预测块具有的帧内预测模式导出为面向色差分量的帧内预测模式。
另一方面,在解码目标块不为Dual Tree的情况下,解码部210不判定为不能对解码目标块的色差分量应用GPM(Intra/Intra-GPM)。
在此,解码部210通过是解码还是推定分别共同的解码目标块单元的控制数据,例如,gpm_intra_enabled_flag的值来判定有无对亮度分量和色差分量应用GPM(Intra/Intra-GPM)。
在判定为对解码目标块的亮度分量及色差分量应用GPM(Intra/Intra-GPM)的情况下,帧内预测部242可以将与色差分量块对应的亮度分量块在GPM各分割区域使用的帧内预测模式导出为该色差分量块在GPM各分割区域使用的帧内预测模式。
(融合候补列表)
在本实施方式中,帧间预测部241可以从非专利文献1所公开的面向GPM的融合候补列表导出运动信息。
在此,关于融合候补列表的构建方法,由于在本实施方式中也可以应用非专利文献1所公开的结构,因此省略详细的说明。
帧间预测部241可以在上述的运动信息的导出(融合候补列表的构建)的完成后,根据由解码部210解码或推定出的分别相对于分割区域A/B的两个融合索引(merge_gpm_idx0/merge_gpm_idx1)的值,选择融合候补列表内的哪一个运动信息用于帧间预测像素的生成。
此外,解码部210可以根据构成GPM的帧间预测的总计应用数,判定是否需要对用于从融合候补列表内选择用于帧间预测像素的生成的运动信息的融合索引进行解码。
在非专利文献1中,根据由解码部210解码或推定出的两个融合索引(merge_gpm_idx0/merge_gpm_idx1)的值和图12所示的面向GPM的融合候补列表(MergeCandList[m,n])导出相对于分割区域A/B的帧间预测的运动信息。
在此,为了使根据merge_gpm_idx0和merge_gpm_idx1导出的运动信息尽量不重复,如图12的X所示,在merge_gpm_idx0和merge_gpm_idx1中选择的运动信息的作为导出目标的列表编号按MergeCandList的偶数编号和奇数编号成为嵌套结构。
具体而言,根据merge_gpm_idx0和merge_gpm_idx1,计算以下的m和n。
m=merge_gpm_idx0[xCb][yCb]
n=merge_gpm_idx1[xCb][yCb]+
((merge_gpm_idx1[xCb][yCb]>=m)?1:0)
根据这样计算出的m的值,如以下这样导出构成分割区域A的运动信息的运动矢量、参考图像索引和预测列表标志。
首先,根据m&0x01(m的值是否为偶数的判定)和n&0x01(n的值是否为偶数的判定)计算出X的值。在此,在计算出的X为0的情况下,将X的值设为(1-X)。
最后,如以下这样分别导出分割区域A的运动矢量mvA、参考图像索引refIdxA、预测列表标志preListFlagA、分割区域B的运动矢量mvB、参考图像索引refIdxB、预测列表标志preListFlagB。
mvA=mvLXM
refIdxA=refIdxLXM
preListFlagA=X
mvB=mvLXN
refIdxB=refIdxLXN
preListFlagB=X
在此,M和N分别是融合候补列表中m和n所示的融合候补的编号,即,
M=MergeCandList[m]
N=MergeCandList[n]。
作为变更例,在本实施方式中,可以使用非专利文献2所公开的面向GPM的融合候补列表作为非专利文献1所公开的面向GPM的融合候补列表的替代。
具体而言,导入比非专利文献1所公开的上述的面向通常融合模式的融合候补列表中导入的剪枝处理(以下,面向通常融合模式的融合候补剪枝处理)更强的剪枝处理(以下,面向GPM的融合候补剪枝处理)。
另外,具体而言,与非专利文献1所公开的面向通常融合模式的剪枝处理不同,是否将运动信息作为剪枝目标的判定是与非专利文献1同样,根据运动信息具有的参考帧是否完全一致来进行的判定,但运动信息具有的运动矢量不是根据完全一致而是通过基于解码目标块的块尺寸的阈值进行判定。
具体而言,在解码目标块尺寸不足64像素的情况下,所述阈值设定为1/4像素,在解码目标块尺寸为64像素以上且不足256像素的情况下,所述阈值设定为1/2像素,在解码目标块尺寸为256像素以上的情况下,所述阈值设定为1像素。
在面向GPM的融合候补剪枝处理的具体的流程中,与面向通常融合模式的剪枝处理同样地,首先,比较参考帧是否完全一致,在完全一致的情况下,接着,判定运动矢量是否完全一致。
在参考帧不完全一致的情况下,即使运动矢量不足阈值,也不视为剪枝目标。在所述情况下,比较目标中不存在于融合候补列表的运动信息构成为作为新融合候补追加于融合候补列表。
接着,在参考帧完全一致且运动矢量不足阈值的情况下,视为剪枝目标。在除此以外的情况下,比较目标中不存在于融合候补列表的运动信息构成为作为新融合候补追加于融合候补列表。
根据所述结构,在面向通常融合模式的剪枝处理中不是剪枝目标的运动矢量相似的情况下的运动信息也包含在剪枝目标中,因此能够排除由GPM的两个融合索引导出的运动信息的相似性,能够期待编码性能的改善。
此外,在该非专利文献2所公开的面向GPM的融合候补剪枝处理中,在运动信息为双向预测的情况(即,L0和L1分别各具有一个运动矢量和参考帧的情况)下,当与比较目标的融合候补的L0和L1的参考帧分别完全一致时视为剪枝目标。
在本实施方式中,帧间预测部241可以将追加有面向GPM的融合候补剪枝处理的GPM的融合候补列表用作面向通常融合模式的替代来导出运动信息。
根据所述结构,能够从由相似度更低的运动信息构成的融合候补列表内导出运动信息,因此作为结果能够期待编码性能的改善。
作为进一步的变更例,帧间预测部241可以根据标志来切换使用面向通常融合模式的融合候补列表和面向GPM的融合候补列表中的哪一个来作为用于导出运动矢量的融合候补列表。
具体而言,解码部210进行解码,例如,以控制数据中包含1位的标志的方式构成,由此解码部210解码或推定该标志的值,并传递给帧间预测部241,从而能够实现该切换。
根据所述结构,帧间预测部241能够从方式更多的变形导出运动信息,因此提高预测性能,作为结果能够期待编码性能的改善。
(GPM的权重系数)
以下,使用图13~图15,对解码部210、帧间预测部241、帧内预测部242和合成部243所涉及的非专利文献1和本实施方式所涉及的GPM的权重系数w进行说明。
图13是表示非专利文献1和本实施方式所涉及的GPM的相对于各分割区域A/B的预测像素的权重系数w的值的一例的图。
由帧间预测部241或帧内预测部242生成的各分割区域A/B的预测像素在合成部243中通过权重系数w被合成(加权平均)。
在非专利文献1中,权重系数w的值使用0~8的值,在本实施方式中,也可以使用所述权重系数w的值。在此,权重系数w的值0、8表示非合成区域(非Blending区域),权重系数w的值1~7表示合成区域(Blending)。
此外,在本实施方式中,权重系数w的计算方法可以采用与非专利文献1相同的方法构成为根据由像素位置(xL、yL)和目标块尺寸计算出的偏移值(offsetX、offsetY)、图14所示的由规定几何分割模式(GPM)的分割线的角度的angleIdx计算出的位移(diplacementX、diplacementY)和图15所示的由diplacementX、diplacementY计算出的表格值disLut,按照以下这样的方式计算。
weightIdx=(((xL+offsetX)<<1)+1)xdisLut[diplacementX]+(((yL+offsetY)<<1)+1)xdisLut[diplacementY]
weightIdxL=partFlip?32+weightIdx:32-weightIdx
w=Clip3(0,8,(weightIdxL+4)>>3)
[帧间预测部241、帧内预测部242、预测信息缓冲器244的预测信息保存方法]
(被保存运动信息种类和被保存预测信息种类)
以下,使用图16,对解码部210、帧间预测部241、帧内预测部242和预测信息缓冲器244的非专利文献1所公开的被保存运动信息种类和本实施方式所涉及的被保存预测信息种类进行说明。
图16是表示按4x4像素子块特定非专利文献1所公开的被保存预测信息种类和本实施方式所涉及的被保存预测信息种类的例子的图。
两者的计算方法如下所示相同,但不同点在于,如图16所示,保存的信息在非专利文献1中为运动信息,相对于此,在本实施方式中为预测信息。
第一,与非专利文献1同样地,被保存运动信息种类的值和被保存预测信息种类的值(由于计算方法相同,因此之后为了方便,所有的值均定义为sType)根据4×4像素子块单元的索引(xSbIdx、ySbIdx)、与上述的权重系数w同样计算出的偏移值(offsetX、offsetY)、位移(diplacementX、diplacementY)和表格(disLut),按照以下这样的方式计算。
motionIdx=(((4×xSbIdx+offsetX)<<1)+5)×disLut[diplacementX]+(((4×ySbIdx+offsetY)<<1)+5)xdisLut[diplacementY]
sType=Abs(motionIdx)<32?2:(motionIdx<=0?(1-isFlip):isFlip)
在此,如图16所示,sType的值由0、1、2这三种值构成,根据各个值,保存于预测信息缓冲器244的运动信息和预测信息如以下这样由帧间预测部241和帧内预测部242控制。
在sType的值为0的情况下,在非专利文献1中保存分割区域A的运动信息,在本实施方式中保存分割区域A的预测信息。
在sType的值为1的情况下,在非专利文献1中保存分割区域B的运动信息,在本实施方式中保存分割区域B的预测信息。
在sType的值为2的情况下,在非专利文献1中保存分割区域A和分割区域B的运动信息或仅分割区域B的运动信息,在本实施方式中保存分割区域A和分割区域B的预测信息或仅分割区域B的预测信息。
在此,将在后面说明所保存的运动信息和预测信息。
此外,可以由上述的4x4像素子块单元按照设计者的想法变更上述的sType的计算单元和后述的运动信息或预测信息的保存单元。
具体而言,为了削减保存的信息量,可以将上述的sType的计算单元和后述的运动信息或预测信息的保存单元增大为8x8像素、16×16像素等。
或者,虽然增加保存的信息量,但为了提高从其他块、帧参考时的运动信息或预测信息的精度,也可以将上述的sType的计算单元和后述的运动信息或预测信息的保存单元减小为2×2像素等。
(保存于预测信息缓冲器244的运动信息和预测信息)
以下,使用图17,分别对从帧间预测部241保存于预测信息缓冲器244的非专利文献1所公开的运动信息和本实施方式所涉及的预测信息进行说明。
图17是表示根据构成应用GPM块的子块的sType的值保存的非专利文献1所公开的运动信息和本实施方式所涉及的预测信息的一览表的图。
第一,在非专利文献1所公开的GPM中被最终保存的运动信息由以下的参数构成。
·预测方向(predFlagL0、predFlagL1)
·L0和L1的运动矢量(mvL0mvL1
·L0和L1的参考图像索引(refIdxL0、refIdxL1)
·BcwIdx
此外,预测方向(predFlagL0、predFlagL1)是表示根据后述的sType保存的子块的预测方向的参数,基于predFlagL0的值和predFlagL1的值,被分类为L0单预测、L1单预测、L0/L1双向预测这三种。
在此,L0单预测是指,从L0列表导出的一个运动矢量的帧间预测,predFlagL0为1且predFlagL1为0的情况被分别保存为表示该条件的值。
另外,L1单预测是指,从L1列表导出的一个运动矢量的帧间预测,predFlagL0为0且predFlagL1为1的情况被分别保存为表示该条件的值。
另外,L0/L1双向预测是指,分别从L0列表和L1列表导出的两个运动矢量的帧间预测,predFlagL0为1且predFlagL1为1的情况被分别保存为表示该条件的值。
另外,L0和L1的运动矢量(mvL0、mvL1)是相对于上述的列表编号L0和L1的运动矢量。
另外,L0和L1的参考图像索引(refIdxL0、refIdxL1)分别是表示mvL0和mvL1参考的参考帧的索引。
另外,BcwIdx是特定非专利文献1所公开的BCW(Bi-prediction with CU-levelweights:CU级双向加权预测)的权重系数的值的索引。
相对于这些保存于非专利文献1所公开的预测信息缓冲器244的运动信息,作为在本实施方式中保存于预测信息缓冲器244的预测信息,如图17所示,追加为保存预测种类和帧内预测模式的参数。
在此,如图17所示,预测种类是表示帧间预测(Inter)和帧内预测(Intra)中的任一种的内部参数。
另外,作为本实施方式所涉及的预测信息,如图17所示,也可以追加hpeIfIdx、IBCFlag、LIC Flag。
在此,hpeIfIdx和IBC Flag分别是特定有无应用非专利文献1所公开的SIF(Switchable Interpolation Filter:可切换插值滤波器)和IBC(Intra Block Copy:帧内块复制)以及非专利文献2所公开的LIC(Local Illumination Compensation:局部光照补偿)的标志。
(根据被保存预测信息种类保存的预测信息的详细)
以下,使用图18~图21,对本实施方式所涉及的帧间预测部241或帧内预测部242根据被保存预测信息种类sType保存于预测信息缓冲器244的预测信息的细节进行说明。
图18是表示相对于图4之类的由不同的两个帧间预测构成的GPM保存的预测信息的一例的图。以下,对根据sType的值保存的各预测信息的细节进行说明。
第一,在所有的sType区域中,预测种类被保存为帧间预测(Inter)。
第二,predFlagL0、predFlagL1、mvL0、mvL1、refIdxL0和refIdxL1根据sType的值和表示融合候补列表的列表编号的predListFlagA及predListFlagB的值,与非专利文献1所公开的方法同样地,按以下的方式被保存,其中,所述融合候补列表的列表编号表示上述的分割区域A/B的运动矢量的导出目的地。
首先,在sType=0的情况下,按以下的方式计算。
predFlagL0=(predListFlagA==0)?1:0
predFlagL1=(predListFlagA==0)?0:1
refIdxL0=(predListFlagA==0)?refIdxA:-1
refIdxL1=(predListFlagA==0)?-1:refIdxA
mvL0=(predListFlagA==0)?mvA:0
mvL1=(predListFlagA==0)?0:mvA
接着,在sType=1的情况或sType=2且predListFlagA+predListFlagB≠1的情况下,按以下的方式计算。
predFlagL0=(predListFlagB==0)?1:0
predFlagL1=(predListFlagB==0)?0:1
refIdxL0=(predListFlagB==0)?refIdxB:-1
refIdxL1=(predListFlagB==0)?-1:refIdxB
mvL0=(predListFlagB==0)?mvB:0
mvL1=(predListFlagB==0)?0:mvB
在此,predListFlagA+predListFlagB≠1表示分割区域A/B的列表编号一致的情况。此时,为了避免运动矢量的重复,在sType=2的情况下也构成为仅保存分割区域B的运动矢量。
接着,在sType=2且predListFlagA+predListFlagB=1的情况下,按以下的方式计算。
predFlagL0=1
predFlagL1=1
refIdxL0=(predListFlagA==0)?refIdxA:refIdxB
refIdxL1=(predListFlagA==0)?refIdxB:refIdxA
mvL0=(predListFlagA==0)?mvA:mvB
mvL1=(predListFlagA==0)?mvB:mvA
在此,predListFlagA+predListFlagB=1表示分割区域A/B的列表编号不一致的情况。此时,构成为直接保存分割区域A/B的两个运动矢量。
此外,虽然在图18中未图示,但上述的mvL0和mvL1可以保存非专利文献2所公开的相对于GPM通过MMVD(Merge with Motion Vector Difference:运动矢量差分合并)或Inter TM(Template Matching:模板匹配)修正前的运动矢量。
或者,上述的mvL0和mvL1也可以为非专利文献2所公开的相对于GPM通过MMVD、Inter TM修正后的运动矢量。
在保存修正后的运动矢量的情况下,提高从该应用GPM块取得运动矢量并生成预测像素的预测块的预测精度。
另一方面,在保存修正前的运动矢量的情况下,不能期待提高从该GPM参考运动矢量的预测块的预测精度,但由于不等待相对于该GPM块进行的MMVD和Inter TM的处理的完成而能够开始该应用GPM块的参考基础块的运动矢量的导出处理,因此能够期待削减解码处理时间。
此外,对于后述的图18~图15,也同样能够选择保存修正前后的哪一方的运动矢量。
接着,帧内预测模式也可以不在所有的sType区域中保存。或者,也可以在所有的sType区域中保存表示帧内预测无效的值。这是因为在图18所示的结构中,由于所有的区域为帧间预测,因此不存在对目标块应用的帧内预测模式。
另一方面,作为保存于各sType区域的帧内预测模式,在保存于各sType区域的运动信息的参考目标为帧内预测块的情况下,可以将该参考块的帧内预测模式保存为该目标块的帧内预测模式。另外,在保存于各sType区域的运动信息的参考目标为帧间预测块的情况下,可以将该目标块的帧内预测模式保存为Planar模式,或者,也可以使用保存于该参考目标的帧间预测块的运动信息的参考目标,进一步递归地跟踪帧内预测模式。但是,由于跟踪范围存在限度,因此如果在达到跟踪上限的情况下无法发现帧内预测模式的参考目标,则可以将Planar模式保存为该目标块的帧内预测模式。由此,即使该目标块的规定区域的预测种类为帧间预测,在从该目标块的帧内的其他块(例如相邻块)参考的情况下,也可以参考帧内预测。
接着,BcwIdx、hpeIfIdx、IBC Flag、LIC Flag也可以在所有的sType区域中保存表示无效的值的值。这是因为BCW、SIF、IBC和LIC均为与GPM异或的编码工具,因此在应用GPM的目标块中,这些编码工具显然无效。
与此相关,虽然在图18和图20中未图示,但可以不保存在IBC中使用的运动矢量,可以保存零矢量。这些参数由于在后述的图19和图20中也可以采用相同的结构,因此之后省略图19和图20中的这些参数的详细的说明。
图19和图20是表示相对于图6之类的由帧内预测和帧间预测构成的GPM保存的预测信息的一例的图。以下,对根据sType的值保存的各预测信息的细节进行说明。
第一,在sTyper=1的情况下,对于在应用帧间预测的分割区域(Inter的分割区域)中保存的预测信息而言,在本实施方式中,在目标块不包含于B切片的情况(包含于P切片的情况)下,应用单预测,但在目标块包含于B切片的情况下,如上所述根据与融合索引对应的融合候补的运动信息,应用双向预测。以下,当这两个情况的sTyper=1时,表示在应用帧间预测的分割区域(Inter的分割区域)中保存的预测信息。
首先,图19是在目标块不包含于B切片时(包含于P切片时)应用单预测的情况下保存的预测信息的一例。如图19所示,保存的预测信息可以采用与在图18的sTyper=1的情况下应用帧间预测的分割区域(Inter的分割区域)中保存的预测信息的结构例相同的结构。
相对于图19,图20是在目标块包含于B切片时且应用双向预测的情况下保存的预测信息的一例。如图20所示,保存的预测信息与在图18的sTyper=1的情况下应用帧间预测的分割区域(Inter的分割区域)中保存的预测信息的结构例不同。具体而言,根据与相对于该区域的一个融合索引对应的融合候补具有的运动信息,保存L0及L1的各个运动矢量MVL0和MVL1和表示L0及L1的各个参考帧的索引RefIdxL0和RefIdxL1。
此外,在图20的情况中,保存的预测信息中的帧内预测模式也可以采用与图18的sTyper=1的情况下应用帧间预测的分割区域(Inter的分割区域)中保存的预测信息的结构例相同的结构。
第二,在sTyper=0的情况下,在应用帧内预测的分割区域(Intra的分割区域)中保存的预测信息如图19和图20所示那样,按以下的方式被保存。
预测种类=Intra
predFlag0=0
predFlag1=0
mvL0=0
mvL1=0
refIdxL0=-1
refIdxL1=-1
帧内预测模式=modeX
在此,在所述分割区域中,由于应用帧内预测,因此如上所述,保存Intra作为预测种类,保存modeX作为帧内预测模式。
此外,作为变更例,例如,如非专利文献1那样,在相邻的子块单元中仅包含只参考帧内预测种类而不参考帧内预测模式的编码工具的情况下,也可以采用保存Intra作为预测种类而不保存帧内预测模式的结构。
作为进一步的变更例,可以构成为,即使在对GPM应用帧内预测模式的情况下,也均不保存该应用的帧内预测模式。
另一方面,由于不具有运动信息,因此如上所述,可以保存0作为predFlag0和predFlagL1,保存0(表示零矢量)作为mvL0和mvL1,保存-1(表示不存在参考帧)作为refIdxL0和refIdxL1。
或者,作为变更例,为了避免预测信息缓冲器244的缓冲器区域的容量的用尽,也可以采用不保存这些运动信息的结构。
第三,在sTyper=2的情况下,在应用帧内预测和帧间预测的分割区域(Intra+Inter的分割区域)中保存的预测信息根据保存于所述的sTyper=1的预测信息的结构,如图19和图20所示那样不同。
图19所示的情况按以下的方式被保存。
预测种类=Inter
predFlag0=(predListFlagB==0)?1:0
predFlag1=(predListFlagB==0)?0:1
refIdxL0=(predListFlagB==0)?refIdxB:-1
refIdxL1=(predListFlagB==0)?-1:refIdxB
mvL0=(predListFlagB==0)?mvB:0
mvL1=(predListFlagB==0)?0:mvB
帧内预测模式=modeX
另一方面,图19所示的情况按以下的方式被保存。
预测种类=Inter
predFlag0=1
predFlag1=1
refIdxL0=RefIdxL0
refIdxL1=RefIdxL1
mvL0=MVL0
mvL1=MVL1
帧内预测模式=modeX
在此,在所述分割区域中,由于应用sType=1的帧内预测,因此作为预测信息中的预测种类和帧内预测模式,如上所述,保存的参数与在sType=1中保存的相同。在将来能够保存的帧内预测模式为两种的情况下,在所述分割区域中,可以追加保存sType=0的帧内预测模式。
另外,在所述分割区域中,由于应用sType=2的帧间预测,因此作为预测信息中的运动信息所涉及的参数,如上所述,保存的参数与在sType=2中保存的相同。
图21是表示相对于图7之类的由不同的两个帧内预测构成的GPM保存的预测信息的一例的图。以下,对sType的值保存的各预测信息的细节进行说明。
第一,在所有的sType区域中保存的预测信息中的除了帧内预测模式以外的参数由于能够采用与在图19中说明的在sType=0的情况下在Intra的分割区域中保存的参数相同的结构,因此省略说明。
第二,作为sType=0的区域和sType=1的区域的帧内预测模式,如图20所示,分别保存在各区域中应用的不同的两个帧内预测模式modeX和modeY。
第三,在sType=2的区域中,如图20所示,可以保存sType=0的区域和sType=1的区域的帧内预测模式的双方,也可以保存任一帧内预测模式。
对于前者而言,例如,两个帧内预测模式能否在图像编码装置100和图像解码装置200中使用的情况下,可以采用保存两个帧内预测模式的结构。
对于后者而言,例如,可以在硬编码中将sType=0的帧内预测模式选择为sType=2的帧内预测模式。
或者,例如可以通过将4×4像素子块进一步细分割而成的2×2像素子块单元计算例如4x4像素子块是从哪一个帧内预测模式主导生成的,将主导的帧内预测模式选择为sType=2的区域的帧内预测模式。
或者,可以将该子块具有的两个帧内预测模式所示的方向上存在的相邻的参考像素与该子块的距离小的一方选择为sType=2的帧内预测模式。
作为进一步的变更例,如图21所示,可以构成为即使在对两个GPM应用两个帧内预测模式的情况下,也均不保存该应用的两个帧内预测模式。
通过使用以上所说明的预测信息和预测信息的保存方法,能够从帧内或帧外适当地参考在对GPM追加帧内预测的情况下的预测信息,因此结果能够期待编码性能的提高。
此外,以上所说明的保存于预测信息缓冲器244的预测信息中的除了帧内预测模式以外的参数在不再从帧内或帧外参考的情况下,可以从预测信息缓冲器244删除。
另外,在将该参数量的保存区域确保于预测信息缓冲器244的情况下,可以进行初始化。在此,不再从帧外参考的时刻与从帧缓冲器260(帧缓冲器160)删除包含该应用GPM块的帧的时刻相同。
而且,保存于预测信息缓冲器244的预测信息中的帧内预测模式在不再从帧内参考的情况下,可以从预测信息缓冲器244删除。另外,在仅将该帧内预测模式量的保存区域确保于预测信息缓冲器244的情况下,也可以进行初始化。
此外,在上述中,参考通过GPM将矩形块一分为二呈几何形状的事例,说明了在该情况下相对于GPM应用帧内预测模式时的信令方法,但在通过GPM将矩形块分为三部分以上的几何形状的事例中,也能够以相同的概念应用本实施方式中说明的信令方法。
上述的图像编码装置100和图像解码装置200可以通过使计算机执行各功能(各工序)的程序来实现。
此外,在上述的各实施方式中,以将本发明应用于图像编码装置100和图像解码装置200为例进行了说明,但本发明并不仅限定于此,也可以同样应用于具有图像编码装置100和图像解码装置200的各功能的图像编码系统和图像解码系统。
此外,根据本实施方式,例如由于能够在动态图像通信中实现综合服务质量的提高,因此能够有助于联合国主导的可持续发展目标(SDGs)的目标9“建设具有适应力的基础设施,促进可持续的工业化,并且实现扩大创新”。

Claims (20)

1.一种图像解码装置,其特征在于,具有:
帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;
帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
所述帧内预测部构成为根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
2.一种图像解码装置,其特征在于,具有:
帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;
帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
所述帧内预测部构成为,
根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出多个帧内预测模式,
控制是否使用规定的索引,从由所导出的所述多个帧内预测模式构成的帧内预测模式候补列表中选择一个或多个帧内预测模式并生成所述帧内预测像素。
3.根据权利要求2所述的图像解码装置,其特征在于,
所述帧内预测部构成为进一步根据所述几何分割模式的分割形状来导出所述多个帧内预测模式。
4.一种图像解码装置,其特征在于,具有:
帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;
帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
所述帧内预测部构成为,
根据所述几何分割模式的分割形状或与所述解码目标块相邻的相邻参考像素或相邻参考块导出多个帧内预测模式,
控制是否使用规定的索引,从由所导出的所述多个帧内预测模式构成的帧内预测模式候补列表中选择一个或多个帧内预测模式并生成所述帧内预测像素,
在导出所述多个帧内预测模式时,将与所述几何分割模式的分割形状平行方向的帧内预测模式注册于所述帧内预测模式候补列表的开头。
5.根据权利要求1或2所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
计算相对于规定的Angular预测模式的相邻参考像素的直方图,
当在帧内预测模式候补列表中已经不包含相同的Angular预测模式时,注册在所述直方图中从最高像素值起的规定数的Angular预测模式,
当在所述帧内预测模式候补列表中已经包含相同的Angular预测模式时,不注册所述规定数的Angular预测模式。
6.根据权利要求5所述的图像解码装置,其特征在于,
所述帧内预测部构成为在计算所述直方图时,根据所述几何分割模式的分割形状来将所述相邻参考像素限制在规定区域。
7.根据权利要求1至3中任一项所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
对与所述解码目标块相邻的第一样板和帧内预测像素进行比较来计算成本,所述帧内预测像素由使用与所述第一样板相邻的相邻参考像素和面向不应用所述几何分割模式的通常的帧内预测构建的帧内预测模式候补列表中注册的帧内预测模式生成,
当在面向所述几何分割模式的帧内预测模式候补列表中已经不包含相同的预测模式时,注册所述成本中的成为最小成本的帧内预测模式,
当在面向所述几何分割模式的帧内预测模式候补列表中已经不包含相同的预测模式时,不注册成为所述最小成本的帧内预测模式。
8.根据权利要求7所述的图像解码装置,其特征在于,
所述帧内预测部构成为在计算所述成本时,将所述第一样板或与所述第一样板相邻的相邻参考像素限制在规定位置。
9.根据权利要求1至3中任一项所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
导出与所述解码目标块的规定位置相邻的参考块的帧内预测模式,
当在所述帧内预测模式候补列表中已经不包含相同的预测模式时,注册所导出的所述帧内预测模式,
当在所述帧内预测模式候补列表中已经包含相同的预测模式时,不注册所导出的所述帧内预测模式。
10.根据权利要求9所述的图像解码装置,其特征在于,
所述帧内预测部在根据所述几何分割模式的分割形状,导出与所述解码目标块的第一位置相邻的相邻参考块的帧内预测模式时,将所述相邻参考块限制在第二位置。
11.根据权利要求5或6所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
使用所述相邻参考像素计算所述直方图,
在根据计算出的所述直方图导出帧内预测模式后,根据使用所述相邻参考像素的成本计算导出所述帧内预测模式。
12.根据权利要求5或6所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
使用所述相邻参考像素计算所述直方图,
在根据计算出的所述直方图导出帧内预测模式后,根据所述解码目标块的相邻参考块导出所述帧内预测模式。
13.根据权利要求1或2所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
在根据使用所述相邻参考像素的成本计算导出帧内预测模式后,根据所述解码目标块的相邻参考块导出所述帧内预测模式。
14.根据权利要求5或6所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所述帧内预测模式时,
使用所述相邻参考像素计算所述直方图,在根据计算出的所述直方图导出帧内预测模式后,根据使用所述相邻参考像素的成本计算导出所述帧内预测模式,
在根据使用所述相邻参考像素的成本计算导出帧内预测模式后,根据所述解码目标块的相邻参考块导出所述帧内预测模式。
15.根据权利要求1至14中任一项所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
当在帧内预测模式候补列表中所含的帧内预测模式的候补数未达到所述帧内预测模式候补列表的尺寸的最大值时,开始所述帧内预测模式的导出处理,
当所述候补数达到所述最大值时,不开始所述帧内预测模式的导出处理。
16.根据权利要求1至14中任一项所述的图像解码装置,其特征在于,
所述帧内预测部构成为,
在导出所有的所述帧内预测模式后,
当在帧内预测模式候补列表中所含的帧内预测模式的候补数未达到所述帧内预测模式候补列表的尺寸的最大值时,并且所述帧内预测模式候补列表中已经不包含相同的预测模式时,在所述帧内预测模式候补列表中注册规定的帧内预测模式,
当所述候补数未达到所述最大值时,并且在所述帧内预测模式候补列表中已经包含相同的预测模式时,不在所述帧内预测模式候补列表中注册规定的帧内预测模式。
17.一种图像解码装置,其特征在于,具有:
解码部,其构成为对解码目标切片或解码目标块的控制数据进行解码,
所述解码部构成为通过对所述解码目标切片或所述解码目标块的控制数据进行解码,
在特定为所述解码目标块包含于I切片且为Dual Tree的情况下,即使判定为对所述解码目标块的亮度分量应用几何分割模式,也判定为不能应用相对于与所述解码目标块的亮度分量对应的色差分量块的几何分割模式,
在除此以外的情况下,不判定为不能应用相对于所述色差分量块的几何分割模式。
18.一种图像解码装置,其特征在于,具有:
帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
所述帧内预测部构成为,
在所述解码目标块不为Dual Tree且对所述解码目标块的亮度分量应用几何分割模式的情况下,对所述解码目标块的色差分量应用几何分割模式,而且,将对与解码目标块的色差分量对应的亮度分量的几何分割模式的各分割区域使用的帧内预测模式导出为相对于由所述色差分量的几何分割模式分割而成的各分割区域的帧内预测模式。
19.一种图像解码方法,其特征在于,具有:
工序A,导出相对于几何分割模式的运动信息并生成运动补偿像素;
工序B,导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
工序C,保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
在所述工序A中,根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
20.一种程序,其使计算机作为图像解码装置发挥功能,其特征在于,
所述图像解码装置具有:
帧间预测部,其构成为导出相对于几何分割模式的运动信息并生成运动补偿像素;
帧内预测部,其构成为导出相对于所述几何分割模式的帧内预测模式并生成帧内预测像素;以及
预测信息缓冲器,其构成为保存或输出包含应用所述几何分割模式的解码目标块的运动信息或帧内预测模式和能够判定应用帧间预测和帧内预测中的哪一方的预测种类的预测信息,
所述帧内预测部构成为根据与所述解码目标块相邻的相邻参考像素或相邻参考块导出帧内预测模式,使用所导出的所述帧内预测模式生成帧内预测像素。
CN202280060287.XA 2021-09-27 2022-08-05 图像解码装置、图像解码方法及程序 Pending CN117941345A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021157115A JP2023047920A (ja) 2021-09-27 2021-09-27 画像復号装置、画像復号方法及びプログラム
JP2021-157115 2021-09-27
PCT/JP2022/030194 WO2023047821A1 (ja) 2021-09-27 2022-08-05 画像復号装置、画像復号方法及びプログラム

Publications (1)

Publication Number Publication Date
CN117941345A true CN117941345A (zh) 2024-04-26

Family

ID=85719444

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280060287.XA Pending CN117941345A (zh) 2021-09-27 2022-08-05 图像解码装置、图像解码方法及程序

Country Status (4)

Country Link
US (1) US20240205391A1 (zh)
JP (1) JP2023047920A (zh)
CN (1) CN117941345A (zh)
WO (1) WO2023047821A1 (zh)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3120877A1 (en) * 2018-11-22 2020-05-28 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for inter prediction

Also Published As

Publication number Publication date
US20240205391A1 (en) 2024-06-20
WO2023047821A1 (ja) 2023-03-30
JP2023047920A (ja) 2023-04-06

Similar Documents

Publication Publication Date Title
JP6109712B2 (ja) ビデオ符号化処理のためにアダブティブなジオメトリック分割を行う方法および装置
RU2694018C2 (ru) Способ декодирования видеосигнала
UA126919C2 (uk) Уточнення вектора руху для мультиреференсного прогнозування
JP5875989B2 (ja) ビデオ・エンコードおよびデコードのための低複雑性テンプレート照合予測のための方法および装置
TW202017369A (zh) 擴充參考圖像內預測技術
TWI502966B (zh) 影像編碼方法、裝置、影像解碼方法、裝置及電腦程式
CN111010578B (zh) 一种帧内帧间联合预测的方法、装置以及存储介质
CN110832854B (zh) 利用插值进行帧内预测的方法和装置
CN113452997B (zh) 一种编解码方法、装置及其设备
AU2018236769A1 (en) Method for inducing a merge candidate block and device using same
CN112075078A (zh) 合成式预测及限制性合并
CN117941345A (zh) 图像解码装置、图像解码方法及程序
CN114424534A (zh) 视频编码的色度直接模式产生方法和装置
CN117795959A (zh) 图像解码装置、图像解码方法及程序
CN117917076A (zh) 图像解码装置、图像解码方法及程序
CN117941348A (zh) 图像解码装置、图像解码方法及程序
KR20200134302A (ko) 이미지 처리 장치 및 방법
CN117795955A (zh) 图像解码装置、图像解码方法及程序
JP2024003175A (ja) 画像復号装置、画像復号方法及びプログラム
CN117643057A (zh) 图像解码装置、图像解码方法及程序
CN117581546A (zh) 图像解码装置、图像解码方法及程序
CN111919449A (zh) 使用运动补偿的视频信号处理方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination