CN110839159A - 用于变换矩阵选择的隐式编码 - Google Patents

用于变换矩阵选择的隐式编码 Download PDF

Info

Publication number
CN110839159A
CN110839159A CN201910760776.6A CN201910760776A CN110839159A CN 110839159 A CN110839159 A CN 110839159A CN 201910760776 A CN201910760776 A CN 201910760776A CN 110839159 A CN110839159 A CN 110839159A
Authority
CN
China
Prior art keywords
transform
block
video
video block
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910760776.6A
Other languages
English (en)
Inventor
张莉
刘鸿彬
张凯
王悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of CN110839159A publication Critical patent/CN110839159A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/439Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Image Processing (AREA)

Abstract

一种涉及用于变换矩阵选择的隐式编码的视频处理方法,包括:解析视频的编码表示中的、用于第一确定将编码表示转换为视频块的第一变换的应用性的第一字段,其中在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及通过基于第一确定选择性地使用第一变换来执行转换。

Description

用于变换矩阵选择的隐式编码
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请是为了及时要求于2018年8月16日提交的国际专利申请No.PCT/CN2018/100795的优先权和利益。出于根据美国法律的所有目的,国际专利申请No.PCT/CN2018/100795的全部公开通过引用而并入本文,作为本申请的公开的一部分。
技术领域
本专利文档涉及视频编码和解码技术、设备以及系统。
背景技术
尽管视频压缩技术有所进步,但数字视频仍然占互联网和其他数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
描述了与数字视频编码和解码,特别是视频编码操作中的多重变换选择(Multiple Transform Selection,MTS)相关的设备、系统和方法。所描述的方法可以应用于现有视频编码标准(例如,高效视频编码(High Efficiency Video Coding,HEVC))和未来视频编码标准(例如,多功能视频编码(Versatile Video Coding,VVC))或编解码器。
在一个示例方面,公开了一种视频处理的方法。该方法包括:解析视频的编码表示中的、用于第一确定将编码表示转换为视频块的第一变换的应用性的第一字段,以及通过基于第一确定选择性地使用第一变换来执行转换。在转换期间,第一变换被应用于视频块的去量化残差系数值的结果。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的编码表示之间的转换,执行对用于当前视频块的编码模式为特定类型的确定;作为编码模式为特定类型的结果,执行对指示用于处理当前视频块的第一变换或第二变换的应用性的字段不存在于编码表示中的确定;在字段不存在的情况下解析编码表示;以及通过由于该确定而禁止将第一变换或第二变换用于变换当前视频块的去量化残差系数,来生成当前视频块。
在另一示例方面,公开了一种视频处理的方法。该方法包括:从相邻视频块继承关于视频块的编码表示和视频块之间的转换的第一变换的变换信息,其中在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及通过基于第一继承选择性地使用第一变换来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:基于当前视频块的编码条件来确定用于将编码表示转换为当前视频块的第一变换为默认变换,其中在转换期间,第一变换被应用于当前视频块的去量化残差系数值的结果;以及通过基于第一确定选择性地使用第一变换来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:解析包括视频的多个视频块的编码表示的比特流,其中对于当前视频块,比特流包括关于相邻块的变换信息是否被继承作为当前视频块的变换信息的第一指示符;以及基于从解析第一指示符获得的变换信息来对编码表示进行解码,以生成当前视频块,其中在转换期间,由变换信息标识的变换被应用于当前视频块的去量化残差系数值的结果。
在另一示例方面,公开了一种视频处理的方法。该方法包括:将第一字段包括在视频的编码表示中,该第一字段用于第一确定将编码表示转换为视频块的第一变换的应用性,其中在转换期间,第一变换将被应用于视频块的去量化残差系数值的结果;以及通过对视频块进行编码来生成编码表示。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的当前视频块和视频的编码表示之间的转换,执行对用于当前视频块的编码模式为特定类型的确定;作为编码模式为特定类型的结果,执行对指示用于处理当前视频块的第一变换或第二变换的应用性的字段将不被包括在编码表示中的确定;以及在不包括字段的情况下生成编码表示;其中,通过由于该确定而禁止将第一变换和/或第二变换用于变换当前视频块的去量化残差系数,可解码当前视频块。
在另一示例方面,公开了一种视频处理的方法。该方法包括:确定将从相邻视频块继承关于视频块的编码表示和视频块之间的转换的第一变换的变换信息,其中在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及基于该确定来生成编码表示。
在另一示例方面,公开了一种视频处理的方法。该方法包括:基于当前视频块的编码条件来确定将用于将编码表示转换为当前视频块的第一变换为默认变换,其中在转换期间,第一变换被应用于当前视频块的去量化残差系数值的结果;以及基于第一确定来生成当前视频块的编码表示。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于当前视频块,确定将关于相邻块的变换信息是否被继承作为当前视频块的变换信息的第一指示符包括在包括视频的多个视频块的编码表示的比特流中;以及基于变换信息来生成当前视频块的编码表示;其中在解码期间,由变换信息标识的变换将被应用于当前视频块的去量化残差系数值的结果。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于使用Merge模式编码的当前视频块,确定将指示将默认变换作为变换使用的第一指示的一比特字段包括在包括视频的多个视频块的编码表示的比特流中,并且使用标识变换的索引的第二指示被包括在编码表示中;以及生成其中由一比特字段标识变换的编码表示。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;以及基于该位置来执行对是否解析编码表示中的信令通知变换信息的语法元素的确定。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和至少一个其他编码准则满足条件,确定信令通知变换信息的语法元素存在并且被包括在编码表示中;以及使用由编码表示中的语法元素标识的变换信息来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和/或至少一个其他编码准则不满足条件,确定信令通知变换信息的语法元素被跳过而不被包括在编码表示中;以及使用没有在编码表示中显式标识的默认变换来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在将当前视频块转换为当前视频块的编码表示期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;以及基于该位置确定是否对编码表示中的信令通知变换信息的语法元素进行编码。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和至少一个其他编码准则满足条件,确定信令通知变换信息的语法元素将被包括在编码表示中;以及通过将标识变换信息的语法元素包括在编码表示中来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和/或至少一个其他编码准则不满足条件,确定信令通知变换信息的语法元素被跳过而不被包括在编码表示中;以及通过跳过语法元素来生成编码表示,从而隐式地信令通知使用默认变换。
在又一代表性方面,上述方法以处理器可运行代码的形式体现,并且存储在计算机可读程序介质中。
在又一代表性方面,公开了一种被配置为或可操作来执行上述方法的设备。该设备可以包括被编程为实施该方法的处理器。
在又一代表性方面,视频解码器装置可以实施如本文描述的方法。
在附图、说明书和权利要求中更详细地描述了所公开技术的上述以及其他方面和特征。
附图说明
图1示出了构造Merge候选列表的示例。
图2示出了空域候选的位置的示例。
图3示出了对其进行空域Merge候选的冗余检查的候选对的示例。
图4A和图4B示出了基于当前块的尺寸和形状的第二预测单元(Prediction Unit,PU)的位置的示例。
图5示出了时域Merge候选的运动矢量缩放的示例。
图6示出了时域Merge候选的候选位置的示例。
图7示出了生成组合的双向预测Merge候选的示例。
图8示出了构造运动矢量预测候选的示例。
图9示出了空域运动矢量候选的运动矢量缩放的示例。
图10示出了用于编码单元(Coding Unit,CU)的使用可选时域运动矢量预测(Alternative Temporal Motion Vector Prediction,ATMVP)算法的运动预测的示例。
图11示出了由空时运动矢量预测(Spatial-Temporal Motion VectorPrediction,STMVP)算法使用的具有子块和相邻块的编码单元(CU)的示例。
图12A和图12B示出了视频处理方法的示例的流程图。
图13A和图13B示出了视频处理方法的示例的流程图。
图14A和图14B示出了视频处理方法的示例的流程图。
图15A和图15B示出了视频处理方法的示例的流程图。
图16A和图16B示出了视频处理方法的示例的流程图。
图17A和图17B示出了视频处理方法的示例的流程图。
图18A和图18B示出了视频处理方法的示例的流程图。
图19A和图19B示出了视频处理方法的示例的流程图。
图20A和图20B示出了视频处理方法的示例的流程图。
图21A和图21B分别示出了使用不利用和利用快速算法的自适应多核变换(Adaptive Multiple core Transform,AMT,也已知为多重变换选择(MTS))的CU编码过程的示例性流程图。
图22示出了吉文斯旋转的图形表示的示例。
图23示出了16个元素的超立方体-吉文斯变换(Hypercube-Givens Transform,HyGT)的“蝴蝶”形流程图的示例。
图24示出了由R轮HyGT和可选的置换阶段(pass)组成的完全不可分二次变换的示例。
图25示出了根据目前公开的技术的用于视频编码的示例方法的流程图。
图26示出了根据目前公开的技术的用于视频编码的另一示例方法的流程图。
图27示出了根据目前公开的技术的用于视频编码的又一示例方法的流程图。
图28示出了根据目前公开的技术的用于视频编码的又一示例方法的流程图。
图29示出了根据目前公开的技术的用于视频编码的又一示例方法的流程图。
图30是用于实施本文档中描述的视觉媒体解码或视觉媒体编码技术的硬件平台的示例的框图。
图31示出了帧内预测模式到变换集之间的示例映射。
图32是可以在其中实施所公开技术的示例视频处理系统的框图。
具体实施方式
由于对更高分辨率视频的日益增长的需求,视频编码方法和技术在现代技术中无处不在。视频编解码器通常包括压缩或解压缩数字视频的电子电路或软件,并且不断被改进以提供更高的编码效率。视频编解码器将未压缩的视频转换为压缩格式,反之亦然。视频质量、用于表示视频的数据量(由比特率确定)、编码和解码算法的复杂性、对数据丢失和错误的敏感性、编辑的简易性、随机访问和端到端延迟(时延)之间存在复杂关系。压缩格式通常符合标准视频压缩规范,例如,高效视频编码(HEVC)标准(也已知为H.265或MPEG-H部分2)、要完成的多功能视频编码标准(VVC)、或其他当前和/或未来视频编码标准。
所公开技术的实施例可以应用于现有视频编码标准(例如,HEVC、H.265)和未来标准以改进压缩性能。在本文档中使用章节标题以提高描述的可读性,并且不以任何方式将讨论或实施例(和/或实施方式)仅限制于相应的章节。
1.HEVC/H.265中的帧间预测的示例
多年来,视频编码标准已经显著改进,并且现在部分地提供高编码效率和对更高分辨率的支持。诸如HEVC和H.265的最新标准基于利用时域预测加变换编码的混合视频编码结构。
1.1预测模式的示例
每个帧间预测的PU(预测单元)具有针对一个或两个参考图片列表的运动参数。在一些实施例中,运动参数包括运动矢量和参考图片索引。在其他实施例中,还可以使用inter_pred_idc信令通知两个参考图片列表中的一个的使用。在其他实施例中,运动矢量可以被显式地编码为相对于预测器的增量。
当用跳过模式对编码单元(CU)进行编码时,一个PU与CU相关联,并且不存在显著的残差系数、没有编码的运动矢量增量或参考图片索引。Merge模式指定为从相邻PU获得当前PU的运动参数,包括空域和时域候选。Merge模式可以应用于任何帧间预测的PU,不仅应用于跳过模式。Merge模式的替代方案是运动参数的显式传输,其中每个PU显式地信令通知运动矢量、每个参考图片列表的对应参考图片索引、以及参考图片列表使用。
当信令指示要使用两个参考图片列表中的一个时,从一个样本块产生PU。这被称为“单向预测”。单向预测可用于P条带和B条带两者。
当信令指示要使用参考图片列表中的两者时,从两个样本块产生PU。这被称为“双向预测”。双向预测仅可用于B条带。
1.1.1构造Merge模式的候选的实施例
当使用Merge模式预测PU时,从比特流解析指向Merge候选列表中的条目的索引并将其用于检索运动信息。可以根据以下序列步骤概述该列表的构造:
步骤1:初始候选推导
步骤1.1:空域候选推导
步骤1.2:空域候选的冗余检查
步骤1.3:时域候选推导
步骤2:附加候选插入
步骤2.1:创建双向预测候选
步骤2.2:插入零运动候选
图1示出了基于上面概述的序列步骤构造Merge候选列表的示例。对于空域Merge候选推导,在位于五个不同位置的候选当中选择最多四个Merge候选。对于时域Merge候选推导,在两个候选当中选择最多一个Merge候选。由于在解码器处假设每个PU的恒定数量的候选,因此当候选的数量未达到在条带标头中信令通知的Merge候选的最大数量(MaxNumMergeCand)时,生成附加候选。由于候选的数量是恒定的,因此使用截断的一元二值化(Unary Binarization,TU)来编码最佳Merge候选的索引。如果CU的尺寸等于8,则当前CU的所有PU共享单个Merge候选列表,其与2N×2N预测单元的Merge候选列表相同。
1.1.2构造空域Merge候选
在对空域Merge候选的推导中,在位于图2中描绘的位置的候选当中选择最多四个Merge候选。推导的顺序是A1、B1、B0、A0和B2。仅当位置A1、B1、B0、A0的任何PU不可用(例如,因为它属于另一个条带或片)或者是帧内编码时,才考虑位置B2。在添加位置A1处的候选之后,对剩余候选的添加进行冗余检查,其确保具有相同运动信息的候选被排除在列表之外,从而改进编码效率。
为了降低计算复杂性,在所提到的冗余检查中不考虑所有可能的候选对。相反,只考虑与图3中的箭头链接的对,并且如果用于冗余检查的对应候选没有相同的运动信息,则候选仅被添加到列表中。重复运动信息的另一个源是与不同于2N×2N的分割相关联的“第二PU”。作为示例,图4A和图4B分别描绘了N×2N和2N×N的情况下的第二PU。当当前PU被分割为N×2N时,位置A1处的候选不被考虑用于列表构造。在一些实施例中,添加该候选可能导致两个预测单元具有相同的运动信息,这对于在编码单元中只具有一个PU是冗余的。类似地,当当前PU被分割为2N×N时,不考虑位置B1
1.1.3构造时域Merge候选
在该步骤中,仅一个候选被添加到列表。具体地,在对该时域Merge候选的推导中,基于属于与给定参考图片列表内的当前图片具有最小POC差异的图片的共位的PU来推导缩放运动矢量。在条带标头中显式地信令通知要用于推导共位的PU的参考图片列表。
图5示出了对时域Merge候选的缩放运动矢量的推导的示例(如虚线),其使用POC距离tb和td从共位的PU的运动矢量缩放,其中tb被定义为当前图片的参考图片与当前图片之间的POC差异,并且td被定义为共位的图片的参考图片与共位的图片之间的POC差异。时域Merge候选的参考图片索引被设置为等于零。对于B条带,获得并组合两个运动矢量(一个用于参考图片列表0,另一个用于参考图片列表1),以产生双向预测Merge候选。
在属于参考帧的共位的PU(Y)中,在候选C0和C1之间选择时域候选的位置,如图6中所描绘的。如果位置C0处的PU不可用、是帧内编码的、或者在当前CTU外部,则使用位置C1。否则,位置C0用于时域Merge候选的推导中。
1.1.4构造附加类型的Merge候选
除了时空Merge候选之外,存在两种附加类型的Merge候选:组合的双向预测Merge候选和零Merge候选。通过利用时空Merge候选来生成组合的双向预测Merge候选。组合的双向预测Merge候选仅用于B条带。通过将初始候选的第一参考图片列表运动参数与另一候选的第二参考图片列表运动参数组合来生成组合的双向预测候选。如果这两个元组提供不同的运动假设,它们将形成新的双向预测候选。
图7示出了该过程的示例,其中具有mvL0和refIdxL0或mvL1和refIdxL1的原始列表(左侧的710)中的两个候选用于创建被添加到最终列表(右边的720)的组合的双向预测Merge候选。
插入零运动候选以填充Merge候选列表中的剩余条目,并因此达到MaxNumMergeCand容量。这些候选具有零空域位移和从零开始并且每当新的零运动候选被添加到列表时增加的参考图片索引。由这些候选使用的参考帧的数量对于单向预测和双向预测分别是一和二。在一些实施例中,不对这些候选执行冗余检查。
1.1.5用于并行处理的运动估计区域的示例
为了加速编码过程,可以并行执行运动估计,由此同时推导给定区域内部的所有预测单元的运动矢量。从空域邻域推导Merge候选可能干扰并行处理,因为一个预测单元在其相关联的运动估计被完成之前不能从邻近PU推导运动参数。为了缓和编码效率和处理时延之间的折衷,可以定义运动估计区域(Motion Estimation Region,MER)。可以使用“log2_parallel_merge_level_minus2”语法元素在图片参数集(Picture Parameter Set,PPS)中信令通知MER的尺寸。当定义MER时,落入相同区域的Merge候选被标记为不可用,并且因此在列表构造中不考虑。
1.2高级运动矢量预测(AMVP)的实施例
AMVP编码模式利用运动矢量与相邻PU的时空相关性,其用于运动参数的显式传输。它通过首先检查左侧、上侧时域相邻的PU位置的可用性,移除冗余候选并添加零矢量以使候选列表为恒定长度来构造运动矢量候选列表。然后,编码器可以从候选列表选择最佳预测值,并发送指示选择的候选的对应索引。与Merge索引信令类似,使用截断的一元来编码最佳运动矢量候选的索引。在这种情况下要编码的最大值为2(参见图8)。在以下章节中,提供了关于运动矢量预测候选的推导过程的细节。
1.2.1构造运动矢量预测候选的示例
图8概述了运动矢量预测候选的推导过程,并且可以针对以refidx作为输入的每个参考图片列表而实施。
在运动矢量预测中,考虑两种类型的运动矢量候选:空域运动矢量候选和时域运动矢量候选。对于空域运动矢量候选推导,最终基于位于如先前在图2中所示的五个不同位置的每个PU的运动矢量推导两个运动矢量候选。
对于时域运动矢量候选推导,从基于两个不同的共位的位置而推导的两个候选选择一个运动矢量候选。在产生第一时空候选列表之后,移除列表中的重复的运动矢量候选。如果潜在候选的数量大于二,则从列表移除相关联的参考图片列表内的其参考图片索引大于1的运动矢量候选。如果时空运动矢量候选的数量小于二,则将附加的零运动矢量候选添加到列表。
1.2.2构造空域运动矢量候选
在对空域运动矢量候选的推导中,在从位于如先前在图2中所示的位置的PU推导的五个潜在候选当中考虑最多两个候选,那些位置与运动Merge的位置相同。当前PU的左侧的推导顺序被定义为A0、A1、以及缩放A0、缩放A1。当前PU的上侧的推导顺序被定义为B0、B1、B2、缩放B0、缩放B1、缩放B2。对于每一侧,因此存在可用作运动矢量候选的四种情况,其中两种情况不需要使用空域缩放,两种情况使用空域缩放。四种不同的情况概述如下:
--没有空域缩放
(1)相同的参考图片列表,以及相同的参考图片索引(相同的POC)
(2)不同的参考图片列表,但是相同的参考图片(相同的POC)
--空域缩放
(3)相同的参考图片列表,但是不同的参考图片(不同的POC)
(4)不同的参考图片列表,以及不同的参考图片(不同的POC)
首先检查非空域缩放情况,然后是允许空域缩放的情况。当POC在相邻PU的参考图片与当前PU的参考图片之间不同时考虑空域缩放,而不管参考图片列表如何。如果左侧候选的所有PU都不可用或者是帧内编码的,则允许针对上侧运动矢量的缩放以帮助左侧和上侧MV候选的并行推导。否则,对上侧运动矢量不允许空域缩放。
如图9中的示例所示,对于空域缩放情况,以与时域缩放类似的方式缩放相邻PU的运动矢量。一个差异是参考图片列表和当前PU的索引作为输入给出;实际缩放过程与时域缩放的过程相同。
1.2.3构造时域运动矢量候选
除了参考图片索引推导外,对时域Merge候选的推导的所有过程与对空域运动矢量候选的推导的所有过程相同(如图6中的示例所示)。在一些实施例中,将参考图片索引信令通知到解码器。
2.联合探索模型(Joint Exploration Model,JEM)中的帧间预测方法的示例
在一些实施例中,使用已知为联合探索模型(JEM)的参考软件来探索未来视频编码技术。在JEM中,在若干编码工具中采用基于子块的预测,诸如仿射预测、可选时域运动矢量预测(ATMVP)、空时运动矢量预测(STMVP)、双向光流(Bi-directional Optical flow,BIO)、帧速率上转换(Frame-Rate Up Conversion,FRUC)、局部自适应运动矢量分辨率(Locally Adaptive Motion Vector Resolution,LAMVR)、重叠块运动补偿(OverlappedBlock Motion Compensation,OBMC)、局部光照补偿(Local Illumination Compensation,LIC)和解码器侧运动矢量细化(Decoder-side Motion Vector Refinement,DMVR)。
2.1基于子CU的运动矢量预测的示例
在具有四叉树加二叉树(QuadTrees plus Binary Trees,QTBT)的JEM中,每个CU可以在每个预测方向具有运动参数的至多一个集合。在一些实施例中,通过将大CU划分成子CU并且推导大CU的所有子CU的运动信息,在编码器中考虑两个子CU级别运动矢量预测方法。可选时域运动矢量预测(ATMVP)方法允许每个CU从比并置参考图片中的当前CU小的多个块提取运动信息的多个集合。在空时运动矢量预测(STMVP)方法中,通过使用时域运动矢量预测值和空域相邻运动矢量来递归地推导子CU的运动矢量。在一些实施例中,为了保留子CU运动预测的更准确的运动场,可以禁止参考帧的运动压缩。
2.1.1可选时域运动矢量预测(ATMVP)的示例
在ATMVP方法中,通过从比当前CU小的块提取运动信息(包括运动矢量和参考索引)的多个集合来修改时域运动矢量预测(TMVP)方法。
图10示出了当前图片1000中的CU的ATMVP运动预测过程的示例。ATMVP方法以两个步骤预测CU 1002内的子CU 1001的运动矢量。第一步骤是用时域矢量标识参考图片1050中的对应块1051。参考图片1050也称为运动源图片。第二步骤是将当前CU 1002划分成子CU1001,并从对应于每个子CU的块获得运动矢量以及每个子CU的参考索引。
在第一步骤中,参考图片1050和对应块由当前CU 1002的空域相邻块的运动信息确定。为了避免相邻块的重复扫描过程,使用当前CU 1002的Merge候选列表中的第一Merge候选。第一可用运动矢量以及其相关联的参考索引被设置为时域矢量和运动源图片的索引。这样,与TMVP相比,可以更准确地标识对应块,其中对应块(有时称为并置块)总是相对于当前CU处于右下或中心位置。
在第二步骤中,通过向当前CU的坐标添加时域矢量,通过运动源图片1050中的时域矢量标识子CU 1051的对应块。对于每个子CU,其对应块的运动信息(例如,覆盖中心样本的最小运动网格)用于推导子CU的运动信息。在标识对应的N×N块的运动信息之后,以与HEVC的TMVP相同的方式将其转换为当前子CU的运动矢量和参考索引,其中运动缩放和其他过程适用。例如,解码器检查是否满足低延迟条件(例如,当前图片的所有参考图片的POC小于当前图片的POC),并且可能使用运动矢量MVx(例如,对应于参考图片列表X的运动矢量)来预测每个子CU的运动矢量MVy(例如,其中X等于0或1,并且Y等于1-X)。
2.1.2时空运动矢量预测(STMVP)的示例
在STMVP方法中,按照光栅扫描顺序递归地推导子CU的运动矢量。图11示出了具有四个子块和相邻块的一个CU的示例。考虑包括四个4×4子CU A(1101)、子CU B(1102)、子CUC(1103)和子CU D(1104)的8×8CU1100。当前帧中的相邻4×4块标记为a(1111)、b(1112)、c(1113)和d(1114)。
子CU A的运动推导通过标识其两个空域邻域开始。第一邻域是子CU A 1101上侧的N×N块(块c 1113)。如果该块c(1113)不可用或是帧内编码的,则检查子CU A(1101)上侧的其他N×N块(在块c 1113处开始,从左到右)。第二邻域是子CU A 1101的左侧的块(块b1112)。如果块b(1112)不可用或是帧内编码的,则检查子CU A 1101的左侧的其他块(在块b1112处开始,从上到下)。从每个列表的相邻块获得的运动信息被缩放为给定列表的第一参考帧。接下来,通过按照与HEVC中指定的TMVP推导相同的过程来推导子块A 1101的时域运动矢量预测值(Temporal Motion Vector Predictor,TMVP)。提取并相应地缩放在块D1104处的并置块的运动信息。最后,在检索和缩放运动信息之后,针对每个参考列表单独平均所有可用运动矢量。平均的运动矢量被指定为当前子CU的运动矢量。
2.1.3子CU运动预测模式信令的示例
在一些实施例中,子CU模式被启用作为附加Merge候选,并且不需要附加语法元素来信令通知该模式。两个附加Merge候选被添加到每个CU的Merge候选列表以表示ATMVP模式和STMVP模式。在其他实施例中,如果序列参数集指示启用了ATMVP和STMVP,则可以使用多达七个Merge候选。附加Merge候选的编码逻辑与HM中的Merge候选的编码逻辑相同,这意味着,对于P条带或B条带中的每个CU,对于两个附加Merge候选可能还需要两次RD检查。在一些实施例中,例如JEM,通过CABAC(Context-based Adaptive Binary ArithmeticCoding,基于上下文的自适应二进制算术编码)对Merge索引的所有二进制位进行上下文编码。在其他实施例中,例如HEVC,仅对第一二进制位进行上下文编码,并且对剩余的二进制位进行上下文旁路编码。
2.2自适应运动矢量差分辨率的示例
在一些实施例中,当条带标头中的use_integer_mv_flag等于0时,以四分之一亮度样本为单位信令通知(在PU的运动矢量和预测运动矢量之间的)运动矢量差(MotionVector Difference,MVD)。在JEM中,引入了局部自适应运动矢量分辨率(LAMVR)。在JEM中,可以以四分之一亮度样本、整数亮度样本或四亮度样本为单位编码MVD。以编码单元(CU)级别控制MVD分辨率,并且对于具有至少一个非零MVD分量的每个CU,有条件地信令通知MVD分辨率标志。
对于具有至少一个非零MVD分量的CU,信令通知第一标志以指示在CU中是否使用四分之一亮度样本MV精度。当第一标志(等于1)指示不使用四分之一亮度样本MV精度时,信令通知另一个标志以指示使用整数亮度样本MV精度还是四亮度样本MV精度。
当CU的第一MVD分辨率标志为零或未针对CU编码(意味着CU中的所有MVD均为零)时,四分之一亮度样本MV分辨率用于CU。当CU使用整数亮度样本MV精度或四亮度样本MV精度时,CU的AMVP候选列表中的MVP被取整为对应精度。
在编码器中,CU级别RD检查用于确定哪个MVD分辨率将被用于CU。也就是说,对于每个MVD分辨率,执行三次CU级别RD检查。为了加快编码器速度,在JEM中应用以下编码方案:
--在具有正常四分之一亮度样本MVD分辨率的CU的RD检查期间,存储当前CU(整数亮度样本精度)的运动信息。存储的(取整之后的)运动信息被用作具有整数亮度样本和4亮度样本MVD分辨率的相同CU的RD检查期间的进一步小范围运动矢量细化的起始点,使得耗时的运动估计过程不会重复三次。
--有条件地调用具有4亮度样本MVD分辨率的CU的RD检查。对于CU,当整数亮度样本MVD分辨率的RD成本远大于四分之一亮度样本MVD分辨率的RD成本时,跳过对于CU的4亮度样本MVD分辨率的RD检查。
2.3更高运动矢量存储精度的示例
在HEVC中,运动矢量精度是四分之一像素(对于4:2:0视频,四分之一亮度样本和八分之一色度样本)。在JEM中,内部运动矢量存储和Merge候选的精度增加到1/16像素。更高运动矢量精度(1/16像素)用于以跳过/Merge模式编码的CU的运动补偿帧间预测。对于以正常AMVP模式编码的CU,使用整数像素或四分之一像素运动。
具有与HEVC运动补偿插值滤波器相同的滤波器长度和归一化因子的SHVC上采样插值滤波器被用作附加分数像素位置的运动补偿插值滤波器。色度分量运动矢量精度在JEM中为1/32样本,1/32像素分数位置的附加插值滤波器通过使用两个相邻的1/16像素分数位置的滤波器的平均来推导。
3.JEM中的变换设计的示例
JEM中有两种不同种类的变换;一种称为自适应多核变换(AMT,也已知为多重变换选择(MTS)),其也被看作主变换,另一种称为不可分二次变换(Non-Separable SecondaryTransform,NSST,也已知为低频不可分变换)。
3.1自适应多核变换(AMT)的示例
除了在HEVC中已经采用的(离散余弦变换)DCT-II和4×4(离散正弦变换)DST-VII之外,自适应多重(核)变换方案(AMT)被用于帧间编码的块和帧内编码的块两者的残差编码。它使用来自DCT/DST家族的多个选择的变换,而不是HEVC中的当前变换。新引入的变换矩阵为DST-VII、DCT-VIII、DST-I和DCT-V。表1显示了选择的DST/DCT的基本函数。
表1:N点输入的DCT-II/V/VIII和DST-I/VII的变换基本函数
Figure BDA0002170181850000151
为了保持变换矩阵的正交性,比HEVC中的变换矩阵更精确地量化变换矩阵。为了将变换系数的中间值保持在16比特的范围内,在水平和垂直变换之后,与当前HEVC变换中使用的右移相比,所有系数都右移了2比特以上。
AMT适用于宽度和高度均小于或等于64的CU,并且AMT是否适用由CU级别标志控制。当CU级别标志(即,AMT标志)等于0时,在CU中应用DCT-II来编码残差。对于启用AMT的CU内的亮度编码块,信令通知两个附加标志(例如,AMT索引)以标识要使用的水平和垂直变换。如在HEVC中,可以在JEM中以变换跳过模式编码块的残差。为了避免语法编码的冗余,当CU级别AMT标志不等于零时,不信令通知变换跳过标志。
对于帧内残差编码,由于不同帧内预测模式的不同残差统计,使用模式相关的变换候选选择过程。如表2所示已经定义了三个变换子集,并且基于帧内预测模式来选择变换子集,如表3所指定的。
表2:三个预定义的变换候选集
变换集 变换候选
0 DST-VII,DCT-VIII
1 DST-VII,DST-I
2 DST-VII,DCT-VIII
利用子集概念,首先使用CU级别AMT标志等于1的CU的帧内预测模式来基于表2标识变换子集。此后,对于水平和垂直变换中的每一个,基于用标志显式地信令通知来选择根据表3的标识的变换子集中的两个变换候选中的一个。
表3:每个帧内预测模式的选择的水平(H)和垂直(V)变换集
帧内模式 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
V 2 1 0 1 0 1 0 1 0 1 0 1 0 1 0 0 0 0
H 2 1 0 1 0 1 0 1 0 1 0 1 0 1 2 2 2 2
帧内模式 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
V 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 1 0
H 2 2 2 2 2 1 0 1 0 1 0 1 0 1 0 1 0
帧内模式 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
V 1 0 1 0 1 0 1 0 1 0 1 22 2 2 2 2 2
H 1 0 1 0 1 0 1 0 1 0 1 0 0 0 0 0 0 0
帧内模式 53 54 55 56 57 58 59 60 61 62 63 64 65 66
V 2 2 1 0 1 0 1 0 1 0 1 0 1 0
H 0 0 1 0 1 0 1 0 1 0 1 0 1 0
然而,对于帧间预测残差,只有由DST-VII和DCT-VIII组成的一个变换集用于所有帧间模式以及水平和垂直变换两者。
AMT的复杂性在编码器侧相对高,因为当使用蛮力(brute-force)搜索时,需要用每个残差块的速率失真成本来评估总共五个不同的变换候选(DCT-II和四个多重变换候选)。为了减轻编码器处的该复杂性问题,在JEM中针对算法加速设计了几种优化方法。
在编码器处,对于每个CU级编码模式,应用两阶段编码。如图21A所示,第一阶段检查对CU仅应用DCT-II的R-D成本(CU级别标志为0),而第二阶段还检查对CU应用多个变换的R-D成本(CU级别标志为1)。此外,观察到无论实际应用哪一阶段,CU级别编码模式是相对一致的。因此,当检查CU的多重变换阶段时,仅应用DCT-II的统计被收集,并且用于跳过第二多重变换阶段中的不必要的R-D计算。如图21B所示,当具有AMT CU级别标志0的特定CU编码模式的R-D成本超过特定阈值的最小R-D成本时,如图21B中突出显示的条件所指示的,跳过第二阶段,即,用具有AMT CU级别标志1的当前CU编码模式编码CU。
3.2模式相关的不可分二次变换(NSST)
在JEM中,在正向核变换和量化(在编码器处)之间以及去量化和反向核变换(在解码器处)之间应用模式相关的不可分二次变换(Mode-Dependent Non-SeparableSecondary Transform,MDNSST)。为了保持低复杂性,MDNSST仅应用于主变换之后的低频系数。如果变换系数块的宽度(W)和高度(H)都大于或等于8,则8×8不可分二次变换被应用于变换系数块的左上8×8区域。否则,如果变换系数块的W或H等于4,则应用4×4不可分二次变换,并且在变换系数块的左上min(8,W)×min(8,W)区域上执行4×4不可分变换。以上变换选择规则适用于亮度和色度分量两者。
不可分变换的矩阵乘法实施方式使用4×4输入块作为示例如下描述。为了应用不可分变换,4×4输入块X
Figure BDA0002170181850000171
被表示为矢量
Figure BDA0002170181850000172
Figure BDA0002170181850000173
不可分变换被计算为
Figure BDA0002170181850000176
其中
Figure BDA0002170181850000175
指示变换系数矢量,T是16×16变换矩阵。随后使用该块的扫描顺序(水平、垂直或对角)将16×1系数矢量重新组织为4×4块。具有更小索引的系数将以更小的扫描索引放置在4×4系数块中。在JEM中,用具有蝴蝶实施方式的超立方体-吉文斯变换(HyGT)代替矩阵乘法来降低不可分变换的复杂性。
3.2.1模式相关的变换核选择
对于4×4和8×8块尺寸,总共有35×3个不可分二次变换,其中35是由帧内预测模式指定的表示为集合的变换集的数量,3是每个帧内预测模式的NSST候选的数量。从帧内预测模式到变换集的映射在图31中示出的表4中定义。根据表4,应用于亮度/色度变换系数的变换集由对应的亮度/色度帧内预测模式指定。对于大于34的帧内预测模式(对角预测方向),变换系数块在编码器/解码器处的二次变换之前/之后被转置。
对于每个变换集,选择的不可分二次变换候选进一步由显示地信令通知的CU级别MDNSST索引指定。在使用变换系数和截断的一元二值化之后,在比特流中每帧内CU信令通知一次索引。在平面或DC模式的情况下,截断的值为2,对于角度帧内预测模式,截断的值为3。仅当CU中存在多于一个的非零系数时,才信令通知该MDNSST索引。当没有信令通知时,默认值为零。该语法元素的零值指示二次变换不应用于当前CU,值1-3指示应该应用集合中的哪个二次变换。
在JEM中,MDNSST不应用于以变换跳过模式编码的块。当针对CU信令通知MDNSST索引并且MDNSST索引不等于零时,MDNSST不用于在CU中以变换跳过模式编码的分量的块。当以变换跳过模式编码具有所有分量的块的CU或者非变换跳过模式CB的非零系数的数量小于2时,不针对CU信令通知MDNSST索引。
在JEM中,MDNSST还对当生成帧内预测时如何应用模式相关的参考样本帧内平滑(Mode Dependent reference samples Intra Smoothing,MDIS)产生影响。当块的MDNSST索引为零时,针对块禁用MDIS(即,没有参考样本平滑)。当块的MDNSST索引不等于零时,针对块应用HEVC风格的MDIS。该规则应用于所有帧内预测模式,除了其中应用PDPC过程的平面模式。在JEM中,应用于HEVC中的32×32帧内块尺寸的强帧内平滑被禁用。
在编码器侧,CU级别RD检查用于选择CU的NSST索引。也就是说,对于帧内编码的CU,通过使用NSST索引值作为循环索引,CU级别RD检查被循环四次。为了加快编码器速度,使用了以下快速方法:
-应用循环的早期停止。当对于具有更小值的NSST索引,当前CU中没有非零变换系数时,跳过具有更大值的NSST索引的RD检查。
·-参考软件中的每个NSST索引的帧内模式决策包括粗略模式决策(Rough ModeDecision,RMD)阶段和RDO阶段。在RMD阶段中,基于SATD成本选择67个帧内预测模式中的3个。该过程应用两次(一次用于NSST索引等于零,一次用于NSST索引不等于零),而不是四次。对于所有非零NSST索引,帧内预测模式的不同NSST索引的SATD成本应该相同。因此,RMD过程只需要对所有非零NSST索引应用一次(因为NSST索引=1),并且结果被重新用于其他非零NSST索引。
3.2.2基于HyGT的不可分变换
超立方体-吉文斯变换(HyGT)用于对不可分二次变换的计算。该正交变换的基本元素是吉文斯旋转,其由正交矩阵G(m,n,θ)定义,该正交矩阵具有如下定义的元素:
Figure BDA0002170181850000191
这些变换可以如图22所示用图形表示。
HyGT通过在超立方体排列中组合吉文斯旋转集合来实施。图23示出了16个元素(4×4不可分变换)的HyGT的“蝴蝶”形流程图。假设N是二的幂,HyGT轮(round)被定义为一系列log2(N)阶段,其中在每个阶段中,矢量m和n中的索引由维度为log2(N)的超立方体的边在每个方向上顺序地定义。
为了获得良好的压缩,使用多于一个HyGT轮。如图24所示,完全不可分二次变换由R轮HyGT组成,并且可以包括可选的置换阶段,以根据变换系数的方差对变换系数进行排序。在JEM中,2轮HyGT应用于4×4二次变换,4轮HyGT应用于8×8二次变换。
4.VVC测试模型(VVC Test Model,VTM)中的AMT的示例
在包括VTM版本2.0的一些实施例中,AMT的简化版本可以包括以下特征:
·帧内和帧间均启用AMT,每个由SPS标志控制
·无长度为64的DST-VII和DST-VIII(当任一维度大于32时,不发送AMT语法)
·无长度为128的DCT-II
·仅DCT-II、DST-VII和DCT-VIII
·所有变换都具有10比特系数
·以非零系数的数量大于二为条件
ο两个方向上的DCT2的标志;如果不是,那么
水平的标志为DST-VII对DCT-VIII
垂直的标志为DST-VII对DCT-VIII
5.现有实施方式中的缺点的示例
在一个现有的AMT实施方式中,帧间AMT可以以171%的编码时间提供附加的约1%的增益。在另一实施方式中,仅Merge的AMT(仅针对Merge模式启用AMT)可以以150%的编码时间提供约0.5%的增益,并且仅AMVP的AMT(仅针对AMVP模式启用AMT)可以以110%的编码时间提供约0.5%的增益。这些实施方式指示仅Merge的AMT的复杂性和编码性能之间的折衷可能无法满足未来视频编码要求。
6.用于变换矩阵选择的隐式编码的示例方法
目前公开的技术的实施例克服了现有实施方式的缺点,从而提供了编码效率更高但计算复杂性更低的视频编码。基于所公开的技术,用于变换矩阵选择的隐式编码可以增强现有视频编码标准和未来视频编码标准,在针对各种实施方式描述的以下示例中阐述。下面提供的所公开技术的示例解释了一般概念,并且不意味着被解释为限制。在示例中,MTS不限于JEM或VVC中的多重变换选择的设计,而是可以指允许从其选择的变换集合用于编码/解码块的任何其他编码技术。在示例中,NSST不限于JEM或VVC中的不可分二次变换的设计,而是可以指在应用主变换之后允许从其选择的二次变换的集合用于编码/解码块的任何其他编码技术。在示例中,除非明确相反指示,否则这些示例中描述的各种特征可以被组合。
示例1.在一个示例中,为了指示MTS(或NSST)的使用,可以在图片参数集/条带标头/图片标头等中信令通知一个或多个标志。
(a)在一个示例中,可以信令通知特定编码模式的标志,以指示是否针对该模式启用MTS(或NSST)。
(b)在一个示例中,可以信令通知一个标志,以指示是否针对帧内编码的块启用MTS(或NSST)。
(c)在一个示例中,可以信令通知一个标志,以指示是否针对帧间编码的块启用MTS(或NSST)。
(d)在一个示例中,可以信令通知一个标志,以指示是否针对AMVP编码的块(其可以包括或排除仿射帧间模式)启用MTS(或NSST)。
(e)在一个示例中,可以信令通知一个标志,以指示是否针对Merge编码的块(其可以包括或排除仿射Merge模式)启用MTS(或NSST)。
(f)在一个示例中,可以信令通知一个标志,以指示是否针对诸如仿射模式或ATMVP模式的基于子块的预测启用MTS(或NSST)。
示例2.在一个示例中,可以针对特定模式始终禁用MTS(或NSST),而无需信令通知。
(a)在一个示例中,针对AMVP编码的块(其可以包括或排除仿射帧间模式)禁用MTS。
(b)在一个示例中,针对诸如仿射模式或ATMVP模式的基于子块的预测禁用MTS。
示例3.在一个示例中,可以在CU组/CTU/CTB/条带标头/图片标头中信令通知启用/禁用NSST或MTS。
示例4.在一个示例中,变换矩阵信息可以从当前块的相邻块继承。
(a)在一个示例中,相邻块可以被定义为邻近空域相邻块、非邻近相邻块或时域相邻块。
(b)在一个示例中,变换矩阵信息可以包括主变换是非DCT-II变换标志(例如,AMTCU标志)和/或主矩阵索引。
(c)在一个示例中,变换矩阵信息可以包括二次变换矩阵索引。
(d)在一个示例中,变换矩阵信息可以与运动信息一起存储。在一个示例中,对于要由后续图片参考的每个图片,需要存储变换矩阵信息。
(e)在一个示例中,此外,Merge/AMVP候选之间的修剪可以进一步取决于相关联的变换矩阵信息是否相同。如果两个候选的变换矩阵信息不同,则这样的两个候选都可以被添加到最终候选列表。
(f)在一个示例中,只有N个Merge/AMVP候选从相邻块继承变换矩阵信息,而其他Merge/AMVP候选使用默认变换,其中N是正整数。
(g)在一个示例中,即使块以跳过模式编码,变换信息也可能需要从其继承运动信息的邻域继承。
(h)在一个示例中,这样的方法可以应用于Merge模式和/或AMVP模式、和/或基于子块的编码模式。
(i)可替换地,相邻块的变换矩阵信息可以用作当前块的变换矩阵信息的预测。
示例5.在一个示例中,默认变换可以被分配给特定模式/特定类型的AMVP/Merge/仿射运动候选或者CU/PU/TU内的特定数量的非零系数。
(a)对于组合的双向Merge候选,可以使用默认变换,而无需信令通知。
(b)对于零Merge候选,可以使用默认变换,而无需信令通知。
(c)对于涉及来自时域块的运动信息的Merge候选(例如,TMVP、ATMVP、STMVP),可以使用默认变换,而无需信令通知。
(d)对于子块Merge候选(例如,ATMVP、STMVP、平面运动模式),可以使用默认变换,而无需信令通知。
(e)当块用所有零系数编码时(即,非零系数的数量等于0),为该块分配默认变换索引。
(f)可替换地,当块用所有零系数编码(即,非零系数的数量等于0)并且该块以AMVP模式编码时,为该块分配默认变换索引。
(g)对于诸如仿射模式或ATMVP模式的基于子块的预测,可以使用默认变换,而无需信令通知。
示例6.在一个示例中,代替对块内有多少非零系数进行计数,(以正向扫描顺序)检查最后一个非零系数的位置,以确定是否跳过AMT CU标志。用相对于块的左上角位置的坐标(LastX,LastY)表示位置。左上角位置的坐标被定义为(0,0)。
(a)当LastX<=Th0且LastY<=Th1时,不信令通知AMT CU标志。
(b)当LastX<=Th0或LastY<=Th1时,不信令通知AMT CU标志。
(c)变量Th0和/或Th1可以被预定义或者在SPS、PPS、条带标头、图片标头、CU组、CTU、CTB等中信令通知。
(d)变量Th0和/或Th1可以进一步取决于块形状或尺寸。
(e)Th0和Th1可以取决于量化参数(Quantization Parameter,QP)
(f)Th0和Th1可以取决于编码模式
(g)Th0=Th1
(h)如果W=H,则Th0=Th1;如果W>H,则TH0>Th1,如果W<H,则TH<TH1,其中W和H分别为当前块的宽度和高度。
(i)Th0和Th1都被设置为1或0。
(j)类似地,上述方法也可以应用于NSST索引信令,也就是说,对于一些情况,跳过NSST索引信令。
示例7.在一个示例中,信令通知变换矩阵信息(例如,AMT CU标志和/或AMT索引)可以通过以下方式修改:
(a)首先信令通知用以指示变换索引是否从其继承运动信息的相邻块继承的一个标志。如果不继承,则可以进一步信令通知AMT CU标志和/或AMT索引。
(b)对于Merge模式,可以首先信令通知AMT CU标志。如果CU标志被设置为0,则利用默认变换。否则(如果CU标志等于1),可以继承AMT索引。
示例8.在一个示例中,变换信息可以取决于运动矢量、和/或运动矢量差、和/或参考图片和当前图片的图片顺序计数(Picture-Order-Count,POC)距离。
(a)在一个示例中,变换信息可以取决于abs(MVx)+abs(MVy)或(MVx)*(MVx)+(MVy)*(MVy)。
(b)在一个示例中,变换信息可以取决于abs(MVDx)+abs(MVDy)或(MVDx)*(MVDx)+(MVDy)*(MVDy)。
上述示例可以并入下面描述的方法的上下文中,例如可以在视频解码器处实施的方法2500、2600、2700、2800和2900。
图25示出了用于视频编码的示例性方法的流程图。方法2500包括,在步骤2510处,接收视频数据的当前块的比特流表示。
方法2500包括,在步骤2520处,基于比特流表示推导信令信息。
方法2500包括,在步骤2530处,基于信令信息启用至少一个变换矩阵。在一些实施例中,启用至少一个变换矩阵是基于指示当前块的编码模式的标志。在其他实施例中,启用至少一个变换矩阵是基于当前块被帧内编码。在其他实施例中,启用至少一个变换矩阵是基于当前块被帧间编码。在其他实施例中,启用至少一个变换矩阵是基于当前块是高级运动矢量预测(AMVP)编码的块。
方法2500包括,在步骤2540处,使用至少一个变换矩阵(如果启用的话)处理比特流表示,以生成当前块。
在一些实施例中,生成当前块包括解压缩或生成当前块的未压缩版本。在其他实施例中,生成当前块包括重构该块。
在一些实施例中,启用至少一个变换矩阵是基于指示当前块的编码模式的标志。
在一些实施例中,启用至少一个变换矩阵是基于当前块被帧内编码。
在一些实施例中,启用至少一个变换矩阵是基于当前块被帧间编码。
在一些实施例中,启用至少一个变换矩阵是基于当前块是高级运动矢量预测(AMVP)编码的块。
图26示出了用于视频编码的另一示例性方法的流程图。该示例包括类似于图25中示出的上述特征和/或步骤的一些特征和/或步骤。在本章节中可能不会单独描述这些特征和/或组件中的至少一些。方法2600包括,在步骤2610处,接收视频数据的当前块的比特流表示。
方法2600包括,在步骤2620处,基于相邻块的变换矩阵信息选择当前块的变换矩阵信息。在一些实施例中,相邻块是邻近空域相邻块、非邻近相邻块或时域相邻块。
方法2600包括,在步骤2630处,使用当前块的变换矩阵信息处理比特流表示,以生成当前块。
在一些实施例中,变换矩阵信息包括非离散余弦变换(DCT)-II标志或主矩阵索引。在其他实施例中,变换矩阵信息包括二次变换矩阵索引。
在一些实施例中,相邻块的变换矩阵信息可以用作当前块的变换矩阵信息的预测值
在一些实施例中,修剪Merge候选列表中的两个Merge候选可以基于这两个Merge候选的变换矩阵信息。
图27示出了用于视频编码的又一示例性方法的流程图。该示例包括类似于图25和图26中示出的上述特征和/或步骤的一些特征和/或步骤。在本章节中可能不会单独描述这些特征和/或组件中的至少一些。方法2700包括,在步骤2710处,接收视频数据的当前块的比特流表示。在一些实施例中,当前块用所有零系数编码。
方法2700包括,在步骤2720处,基于比特流表示推导信令信息。
方法2700包括,在步骤2730处,选择默认变换矩阵,其中信令信息中不存在选择的指示。
方法2700包括,在步骤2740处,使用默认变换矩阵处理比特流表示,以生成当前块。在一些实施例中,该处理是基于组合的双向Merge候选或零候选。
图28示出了用于视频编码的又一示例性方法的流程图。该示例包括类似于图25-图27中示出的上述特征和/或步骤的一些特征和/或步骤。在本章节中可能不会单独描述这些特征和/或组件中的至少一些。方法2800包括,在步骤2810处,接收视频数据的当前块的比特流表示。
方法2800包括,在步骤2820处,基于比特流表示推导信令信息。
方法2800包括,在步骤2830处,基于系数块的最后非零系数的位置,确定信令信息是否包括与变换矩阵信息相对应的索引,其中系数块与当前块相关联。
在一些实施例中,系数块中的最后非零系数的位置为(Xlast,Ylast),其中Xlast≤τ1(第一阈值)且Ylast≤τ2(第二阈值),并且其中信令信息不包括索引。在示例中,在序列参数集(Sequence Parameter Set,SPS)、图片参数集(PPS)、条带标头、图片标头、编码树单元(Coding Tree Unit,CTU)、编码单元(CU)或编码树块(Coding Tree Block,CTB)中信令通知第一阈值或第二阈值。在另一示例中,第一阈值或第二阈值是基于当前块的大小。在又一示例中,第一阈值或第二阈值是基于当前块的编码模式。在又一示例中,第一阈值或第二阈值是基于量化参数(QP)。
方法2800包括,在步骤2840处,使用变换矩阵信息处理比特流表示,以生成当前块。在一些实施例中,当信令信息不包括索引时,该处理使用默认变换矩阵。
图29示出了用于视频编码的又一示例性方法的流程图。该示例包括类似于图25-图28中示出的上述特征和/或步骤的一些特征和/或步骤。在本章节中可能不会单独描述这些特征和/或组件中的至少一些。方法2900包括,在步骤2910处,接收视频数据的当前块的比特流表示。
方法2900包括,在步骤2920处,基于与视频数据的当前块相对应的运动信息或图片顺序计数(POC)距离来选择变换矩阵。
方法2900包括,在步骤2930处,使用变换矩阵处理比特流表示,以生成当前块。
在一些实施例中,POC距离对应于与当前块相关联的参考图片。在其他实施例中,运动信息包括运动矢量或运动矢量差。
在一些实施例中,以下技术解决方案的列表可能是优选的实施方式。
1.一种视频处理的方法(例如,图12A中示出的方法1200),包括:解析(1202)视频的编码表示中的、用于第一确定将编码表示转换为视频块的第一变换的应用性的第一字段。在转换期间,第一变换被应用于视频块的去量化残差系数值的结果。方法1200还包括通过基于第一确定选择性地使用第一变换来执行(1204)转换。
2.根据解决方案1所述的方法,还包括:解析视频的编码表示中的、用于第二确定转换的第二变换的应用性的第二字段,其中第二变换在转换期间与第一变换级联应用,并且其中执行转换还包括基于第二确定选择性地使用第二变换。
3.根据解决方案2所述的方法,其中,第一变换用于将去量化残差系数值变换为第一变换表示,第二变换用于将第一变换表示的至少一部分变换为第二变换表示。
4.根据解决方案3所述的方法,其中,第一变换是自适应多核变换(AMT)。
5.根据解决方案3-4中任一项所述的方法,其中,第二变换是二次变换。
6.根据解决方案1-3中任一项所述的方法,其中,第一字段与编码表示中的图片参数集级别处的标志相对应。
7.根据解决方案1-3中任一项所述的方法,其中,第一字段与编码表示中的处于条带标头级别的标志相对应。
8.根据解决方案1-3中任一项所述的方法,其中,第一字段与编码表示中的处于图片级别的标志相对应。
9.根据解决方案1-3和6-8中任一项所述的方法,其中,第一确定或第二确定进一步基于编码表示中的、用于表示视频块的编码模式。
10.根据解决方案1-3中任一项所述的方法,其中,第一字段被包括在处于视频区域级别的编码表示中,其中视频区域至少包括视频块,并且其中第一字段指示当成功确定视频块的编码模式是特定编码模式时将在转换期间应用第一变换。
11.根据解决方案10所述的方法,其中,特定编码模式是帧内编码模式。
12.根据解决方案10所述的方法,其中,特定编码模式是帧间编码模式。
13.根据解决方案10所述的方法,其中,特定编码模式是高级运动矢量预测编码模式。
14.根据解决方案10所述的方法,其中,特定编码模式是包括仿射编码的Merge编码模式。
15.根据解决方案10所述的方法,其中,特定编码模式是排除仿射编码的Merge编码模式。
16.根据解决方案10所述的方法,其中,特定编码模式是基于子块的编码模式。
17.根据解决方案1-16中任一项所述的方法,其中,字段处于编码单元组级别、或编码树单元级别、或编码树块级别、或条带标头级别、或图片标头级别。
18.根据解决方案6至17中任一项所述的方法,其中,第一变换是自适应多核变换(AMT)。
19.根据解决方案6至17中任一项所述的方法,其中,第二变换是二次变换。
20.一种视频处理的方法(例如,图13A中示出的方法1300),包括:对于视频的当前视频块和视频的编码表示之间的转换,执行(1302)对用于当前视频块的编码模式为特定类型的确定;作为编码模式为特定类型的结果,执行(1304)对指示用于处理当前视频块的第一变换或第二变换的应用性的字段不存在于编码表示中的确定;在字段不存在的情况下解析(1306)编码表示;以及通过由于该确定而禁止将第一变换或第二变换用于变换当前视频块的去量化残差系数,生成(1308)当前视频块。
21.根据解决方案20所述的方法,其中,特定类型包括高级运动矢量预测编码模式。
22.根据解决方案20所述的方法,其中,特定类型包括基于子块的预测模式。
23.根据解决方案22所述的方法,其中,基于子块的预测模式包括可选时域运动矢量预测模式。
24.根据解决方案20-23中任一项所述的方法,其中,第一变换包括自适应多核变换(AMT)。
25.根据解决方案20-23中任一项所述的方法,其中,第一变换包括二次变换。
前一章节提供了上述解决方案的附加特征(例如,第1项和第3项)。
26.一种视频处理的方法(例如,图14A中示出的方法1400),包括:从相邻视频块继承(1402)关于视频块的编码表示和视频块之间的转换的第一变换的变换信息,其中在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及通过基于第一继承选择性地使用第一变换来执行(1404)转换。
27.根据解决方案26所述的方法,其中,相邻块是空域邻近的块。
28.根据解决方案26所述的方法,其中,相邻块是包括视频块的视频图片中的空域非邻近的块。
29.根据解决方案26所述的方法,其中,相邻块是时域相邻的块。
30.根据解决方案26-29中任一项所述的方法,其中,关于第一变换的变换信息包括对第一变换是否为离散余弦变换的第一指示或第一变换的主矩阵索引的第二指示。
31.根据解决方案26-30中任一项所述的方法,其中,去量化残差系数值的结果通过对去量化残差系数值应用另一变换而计算。
32.根据解决方案31所述的方法,其中,关于第一变换的变换信息还包括标识另一变换的索引。
33.根据解决方案26-30中任一项所述的方法,其中,第一变换用于变换去量化残差系数值的变换表示的至少一部分。
34.根据解决方案26-33中任一项所述的方法,其中,该继承包括继承与相邻视频块的运动信息一起存储的变换信息。
35.根据解决方案34所述的方法,其中,关于第一变换的变换信息以视频图片级别存储。
36.根据解决方案15所述的方法,其中,关于第一变换的变换信息由于图片为参考图片而以图片级别存储。
37.根据解决方案26至36中任一项所述的方法,其中,该转换包括使用修剪操作来生成候选列表,该修剪操作取决于关于与被修剪的候选相关联的第一变换的变换信息。
38.根据解决方案26-37中任一项所述的方法,其中,该继承由于视频块从相邻视频块继承前N个候选中的一个而被执行。
39.根据解决方案38所述的方法,其中,前N个候选中的一个包括Merge候选。
40.根据解决方案39所述的方法,其中,前N个候选中的一个包括高级运动矢量预测候选。
41.根据解决方案26-37中任一项所述的方法,还包括:确定第一视频块被编码为跳过块(skipped block),并且其中继承关于第一变换的变换信息包括从其继承运动信息的相邻视频块继承关于第一变换的变换信息。
42.根据解决方案26至41中任一项所述的方法,其中,第一视频块是使用Merge模式解码的。
43.根据解决方案26至33中任一项所述的方法,其中,第一视频块是使用高级运动矢量预测模式解码的。
44.根据解决方案26至43中任一项所述的方法,其中,该继承包括基于关于相邻视频块的变换信息来预测性地确定关于用于当前视频块的第一变换的变换信息。
前一章节提供了上述解决方案的附加特征(例如,第4项)。
45.一种视频处理的方法(例如,图15A中描绘的方法1500),包括:基于当前视频块的编码条件来确定(1502)用于将编码表示转换为当前视频块的第一变换为默认变换,其中在转换期间,第一变换被应用于当前视频块的去量化残差系数值的结果;以及通过基于第一确定选择性地使用第一变换来执行(1504)转换。
46.根据解决方案45所述的方法,其中,当前视频块的编码条件包括第一视频块的编码模式。
47.根据解决方案45所述的方法,其中,编码条件包括在与当前视频块相关联的编码单元、或预测单元、或变换单元中编码的非零系数的计数。
48.根据解决方案45-46中任一项所述的方法,其中,编码条件包括对于当前视频块使用组合的Merge候选,并且其中默认变换在编码表示中没有任何信令的情况下被使用。
49.根据解决方案45-46中任一项所述的方法,其中,编码条件包括对于当前视频块使用零Merge候选,并且其中默认变换在编码表示中没有任何信令的情况下被使用。
50.根据解决方案45-46中任一项所述的方法,其中,编码条件包括使用当前视频块的时域相邻的块的运动信息,并且其中默认变换在编码表示中没有任何信令的情况下被使用。
51.根据解决方案50所述的方法,其中,时域相邻的块用于时域运动矢量预测。
52.根据解决方案50所述的方法,其中,时域相邻的块用于可选时域运动矢量预测。
53.根据解决方案50所述的方法,其中,时域相邻的块用于时空运动矢量预测。
54.根据解决方案45-46中任一项所述的方法,其中,编码条件包括对于当前视频块的转换使用子块Merge候选。
55.根据解决方案54所述的方法,其中,子块Merge候选包括高级时域运动矢量预测值。
56.根据解决方案54所述的方法,其中,子块Merge候选包括时空运动矢量预测值。
57.根据解决方案54所述的方法,其中,子块Merge候选包括平面运动模式预测值。
58.根据解决方案45所述的方法,其中,编码条件与已经用所有零系数编码的当前视频块相对应,并且确定包括确定默认变换索引被用于该转换。
59.根据解决方案45-46中任一项所述的方法,其中,编码条件包括对于当前视频块使用基于子块的预测,并且其中确定变换信息,而无需在编码表示中信令通知。
60.根据解决方案59所述的方法,其中,基于子块的预测包括仿射预测,并且其中确定变换信息,而无需编码表示中的信令。
61.根据解决方案59所述的方法,其中,基于子块的预测包括高级时域运动矢量预测,并且其中确定变换信息,而无需编码表示的信令。
62.根据解决方案45所述的方法,其中,编码条件包括当前视频块的运动矢量值的函数。
63.根据解决方案63所述的方法,其中,运动矢量值的函数包括abs(MVx)+abs(MVy)或(MVx)*(MVx)+(MVy)*(MVy),其中MVx和MVy是运动矢量值,abs()表示绝对值函数。
64.根据解决方案45所述的方法,其中,编码条件包括当前视频块的运动矢量差值的函数。
65.根据解决方案64所述的方法,其中,运动矢量差值的函数包括abs(MVDx)+abs(MVDy)或(MVDx)*(MVDx)+(MVDy)*(MVDy),其中MVDx和MVDy是运动矢量差值,abs()表示绝对值函数。
前一章节提供了上述解决方案的附加特征(例如,第5项和第8项)。
66.一种视频处理的方法(例如,图16A中描绘的方法1600),包括:解析(1602)包括视频的多个视频块的编码表示的比特流,其中对于当前视频块,比特流包括关于相邻块的变换信息是否被继承作为当前视频块的变换信息的第一指示符,以及基于从解析第一指示符获得的变换信息来对编码表示进行解码(1604),以生成当前视频块,其中在转换期间,由变换信息标识的变换被应用于当前视频块的去量化残差系数值的结果。
67.根据解决方案66所述的方法,包括:由于第一指示符指示变换信息不是从相邻块继承的,解析标识在转换期间使用的变换信息的第二指示符。
68.根据解决方案66所述的方法,其中,该变换包括自适应多核变换(AMT)。
69.根据解决方案66-67中任一项所述的方法,其中,第二指示符包括比特流中处于编码单元级别的标志。
70.根据解决方案66-67中任一项所述的方法,其中,第二指示符包括该变换的索引。
71.一种视频处理的方法(例如,图17A中描绘的方法1700),包括:解析(1702)包括视频的多个视频块的编码表示的比特流,其中对于使用Merge模式编码的当前视频块,比特流包括指示将默认变换作为变换使用的第一指示的一比特字段,并且从相邻块继承变换信息的第二指示被包括在编码表示中;基于一比特字段标识(1704)变换;以及执行(1706)编码表示和当前视频块之间的转换;其中在转换期间,该变换被应用于当前视频块的去量化残差系数值的结果。
72.根据解决方案71所述的方法,其中,第一指示包括作为1比特字段的“0”比特,并且第二指示包括作为1比特字段的“1”比特。
73.根据解决方案71所述的方法,其中,第一指示包括作为1比特字段的“1”比特,并且第二指示包括作为1比特字段的“0”比特。
74.根据解决方案71-73中任一项所述的方法,其中,该变换包括自适应多核变换(AMT)。
75.根据解决方案66至74中任一项所述的方法,包括:相邻块与当前视频块邻近。
76.根据解决方案66至74中任一项所述的方法,包括:相邻块与当前视频块不邻近。
前一章节提供了上述解决方案的附加特征(例如,第7项)。
77.一种视频处理的方法(例如,图12B中描绘的方法1250),包括:将第一确定将编码表示转换为视频块的第一变换的应用性的第一字段包括(1252)在视频的编码表示中,其中在转换期间,第一变换将被应用于视频块的去量化残差系数值的结果;以及通过对视频块进行编码来生成(1254)编码表示。
78.根据解决方案77所述的方法,还包括:将第二确定转换的第二变换的应用性的第二字段包括在视频的编码表示中,其中第二变换将在转换期间与第一变换级联应用,并且其中执行转换还包括基于第二确定选择性地使用第二变换。
79.根据解决方案78所述的方法,其中,第一变换用于将去量化残差系数值变换为第一变换表示,第二变换用于将第一变换表示的至少一部分变换为第二变换表示。
80.根据解决方案79所述的方法,其中,第一变换是自适应多核变换(AMT)。
81.根据解决方案79-80中任一项所述的方法,其中,第二变换是二次变换。
82.根据解决方案77-79中任一项所述的方法,其中,第一字段与编码表示中处于图片参数集级别的标志相对应。
83.根据解决方案77-79中任一项所述的方法,其中,第一字段与编码表示中处于条带标头级别的标志相对应。
84.根据解决方案77-79中任一项所述的方法,其中,第一字段与编码表示中处于图片级别的标志相对应。
85.根据解决方案77-79和82-84中任一项所述的方法,其中,第一确定或第二确定还基于编码表示中的用于表示视频块的编码模式。
86.根据解决方案77-79中任一项所述的方法,其中,第一字段被包括在视频区域级别处的编码表示中,其中视频区域至少包括视频块,并且其中第一字段指示当成功确定视频块的编码模式是特定编码模式时将在转换期间应用第一变换。
87.根据解决方案86所述的方法,其中,特定编码模式是帧内编码模式。
88.根据解决方案86所述的方法,其中,特定编码模式是帧间编码模式。
89.根据解决方案86所述的方法,其中,特定编码模式是高级运动矢量预测编码模式。
90.根据解决方案86所述的方法,其中,特定编码模式是包括仿射编码的Merge编码模式。
91.根据解决方案86所述的方法,其中,特定编码模式是排除仿射编码的Merge编码模式。
92.根据解决方案86所述的方法,其中,特定编码模式是基于子块的编码模式。
93.根据解决方案77-92中任一项所述的方法,其中,字段处于编码单元组级别、或编码树单元级别、或编码树块级别、或条带标头级别、或图片标头级别。
94.根据解决方案82-93中任一项所述的方法,其中,第一变换是自适应多核变换(AMT)。
95.根据解决方案82至93中任一项所述的方法,其中,第二变换是二次变换。
前一章节提供了上述解决方案的附加特征(例如,第1项和第3项)。
96.一种视频处理的方法(例如,图13B中描绘的方法1350),包括:对于视频的当前视频块和视频的编码表示之间的转换,执行(1352)对用于当前视频块的编码模式为特定类型的确定;作为编码模式为特定类型的结果,执行(1354)对指示用于处理当前视频块的第一变换或第二变换的应用性的字段将不被包括在编码表示中的确定;以及在不包括字段的情况下生成(1356)编码表示;其中,通过由于该确定而禁止将第一变换和/或第二变换用于变换当前视频块的去量化残差系数,可解码当前视频块。
97.根据解决方案96所述的方法,其中,特定类型包括高级运动矢量预测编码模式。
98.根据解决方案96所述的方法,其中,特定类型包括基于子块的预测模式。
99.根据解决方案98所述的方法,其中,基于子块的预测模式包括可选时域运动矢量预测模式。
100.根据解决方案96-99中任一项所述的方法,其中,第一变换包括自适应多核变换(AMT)。
101.根据解决方案96至99中任一项所述的方法,其中,第一变换包括二次变换。
前一章节提供了上述解决方案的附加特征(例如,第2项)。
102.一种视频处理的方法(例如,图14B中描绘的方法1450),包括:确定(1452)将从相邻视频块继承关于视频块的编码表示和视频块之间的转换的第一变换的变换信息,其中在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及基于该确定来生成(1454)编码表示。
103.根据解决方案102所述的方法,其中,相邻块是空域邻近的块。
104.根据解决方案102所述的方法,其中,相邻块是包括视频块的视频图片中的空域非邻近的块。
105.根据解决方案102所述的方法,其中,相邻块是时域相邻的块。
106.根据解决方案102-105中任一项所述的方法,其中,关于第一变换的变换信息包括第一变换是否为离散余弦变换的第一指示或第一变换的主矩阵索引的第二指示。
107.根据解决方案102-106中任一项所述的方法,其中,去量化残差系数值的结果通过对去量化残差系数值应用另一变换而计算。
108.根据解决方案107所述的方法,其中,关于第一变换的变换信息还包括标识另一变换的索引。
109.根据解决方案102-106中任一项所述的方法,其中,第一变换用于变换去量化残差系数值的变换表示的至少一部分。
110.根据解决方案102-109中任一项所述的方法,其中,该继承包括继承与相邻视频块的运动信息一起存储的变换信息。
111.根据解决方案110所述的方法,其中,关于第一变换的变换信息以视频图片级别存储。
112.根据解决方案111所述的方法,其中,关于第一变换的变换信息由于图片为参考图片而以图片级别存储。
113.根据解决方案102至112中任一项所述的方法,其中,该转换包括使用修剪操作来生成候选列表,该修剪操作取决于关于与被修剪的候选相关联的第一变换的变换信息。
114.根据解决方案102-113中任一项所述的方法,其中,该继承由于视频块从相邻视频块继承前N个候选中的一个而被执行。
115.根据解决方案114所述的方法,其中,前N个候选中的一个包括Merge候选。
116.根据解决方案114所述的方法,其中,前N个候选中的一个包括高级运动矢量预测候选。
117.根据解决方案102-113中任一项所述的方法,还包括:确定第一视频块将被编码为跳过块,并且其中继承关于第一变换的变换信息包括从其继承运动信息的相邻视频块继承关于第一变换的变换信息。
118.根据解决方案1至117中任一项所述的方法,其中,第一视频块是使用Merge模式编码的。
119.根据解决方案102至108中任一项的方法,其中,第一视频块是使用高级运动矢量预测模式编码的。
120.根据解决方案102至119中任一项所述的方法,其中,该继承包括基于关于相邻视频块的变换信息来预测性地确定关于用于当前视频块的第一变换的变换信息。
前一章节提供了上述解决方案的附加特征(例如,第4项)。
121.一种视频处理的方法(例如,图15B中描绘的方法1550),包括:基于当前视频块的编码条件来确定(1552)将用于将编码表示转换为当前视频块的第一变换为默认变换,其中在转换期间,第一变换被应用于当前视频块的去量化残差系数值的结果;以及基于第一确定来生成(1554)当前视频块的编码表示。
122.根据解决方案121所述的方法,其中,当前视频块的编码条件包括第一视频块的编码模式。
123.根据解决方案121所述的方法,其中,编码条件包括在与当前视频块相关联的编码单元、或预测单元、或变换单元中编码的非零系数的计数。
124.根据解决方案121-122中任一项所述的方法,其中,编码条件包括对于当前视频块使用组合的Merge候选,并且其中将使用默认变换,而无需编码表示中的任何信令。
125.根据解决方案121-122中任一项所述的方法,其中,编码条件包括对于当前视频块使用零Merge候选,并且其中在编码表示中隐式地信令通知默认变换。
126.根据解决方案121-122中任一项所述的方法,其中,编码条件包括使用当前视频块的时域相邻的块的运动信息,并且其中在编码表示中隐式地信令通知默认变换。
127.根据解决方案126所述的方法,其中,时域相邻的块用于时域运动矢量预测。
128.根据解决方案126所述的方法,其中,时域相邻的块用于可选时域运动矢量预测。
129.根据解决方案126所述的方法,其中,时域相邻的块用于时空运动矢量预测。
130.根据解决方案121-122中任一项所述的方法,其中,编码条件包括对于当前视频块的转换使用子块Merge候选。
131.根据解决方案130所述的方法,其中,子块Merge候选包括高级时域运动矢量预测值。
132.根据解决方案130所述的方法,其中,子块Merge候选包括时空运动矢量预测值。
133.根据解决方案130所述的方法,其中,子块Merge候选包括平面运动模式预测值。
134.根据解决方案121所述的方法,其中,编码条件与已经用所有零系数编码的当前视频块相对应,并且确定包括确定默认变换索引将被用于转换。
135.根据解决方案121-122中任一项所述的方法,其中,编码条件包括对于当前视频块使用基于子块的预测,并且其中在编码表示中隐式地信令通知变换信息。
136.根据解决方案135所述的方法,其中,基于子块的预测包括仿射预测,并且其中在编码表示中隐式地信令通知变换信息。
137.根据解决方案135所述的方法,其中,基于子块的预测包括高级时域运动矢量预测,并且其中在编码表示中隐式地信令通知变换信息。
138.根据解决方案121所述的方法,其中,编码条件包括当前视频块的运动矢量值的函数。
139.根据解决方案138所述的方法,其中,运动矢量值的函数包括abs(MVx)+abs(MVy)或(MVx)*(MVx)+(MVy)*(MVy),其中MVx和MVy是运动矢量值,abs()表示绝对值函数。
140.根据解决方案121所述的方法,其中,编码条件包括当前视频块的运动矢量差值的函数。
141.根据解决方案140所述的方法,其中,运动矢量差值的函数包括abs(MVDx)+abs(MVDy)或(MVDx)*(MVDx)+(MVDy)*(MVDy),其中MVDx和MVDy是运动矢量差值,abs()表示绝对值函数。
前一章节提供了上述解决方案的附加特征(例如,第5项和第8项)。
142.一种视频处理的方法(例如,图16B中描绘的方法1650),包括:对于当前视频块,确定(1652)将关于相邻块的变换信息是否被继承作为当前视频块的变换信息的第一指示符包括在包括视频的多个视频块的编码表示的比特流中;以及基于变换信息来生成(1654)当前视频块的编码表示;其中在解码期间,由变换信息标识的变换将被应用于当前视频块的去量化残差系数值的结果。
143.根据解决方案142所述的方法,还包括,或者在不存在第一指示符的情况下,标识在编码表示和当前视频块之间的转换期间使用的变换信息的第二指示符。
144.根据解决方案142所述的方法,其中,该变换包括自适应多核变换(AMT)。
145.根据解决方案142-143中任一项所述的方法,其中,第二指示符包括比特流中处于编码单元级别的标志。
146.根据解决方案142-143中任一项所述的方法,其中,第二指示符包括变换的索引。
147.一种视频处理的方法(例如,图17B中描绘的方法1750),包括:对于使用Merge模式编码的当前视频块,确定(1752)将编码表示中的、指示将默认变换作为变换使用的第一指示和使用标识变换的索引的第二指示的一比特字段包括在包括视频的多个视频块的编码表示的比特流中;以及生成(1754)其中由一比特字段标识变换的编码表示。
148.根据解决方案147所述的方法,其中,第一指示包括作为1比特字段的“0”比特,第二指示包括作为1比特字段的“1”比特。
149.根据解决方案147所述的方法,其中,第一指示包括作为1比特字段的“1”比特,第二指示包括作为1比特字段的“0”比特。
150.根据解决方案147-149中任一项所述的方法,其中,该变换包括自适应多核变换(AMT)。
前一章节提供了上述解决方案的附加特征(例如,第7项)。
151.根据解决方案1-150中任一项所述的方法,其中,所述变换包括正变换与逆变换的至少一者。
152.一种包括处理器的视频编码器装置,被配置为实施根据解决方案1至151中的一个或多个所述的方法。
153.一种其上存储有代码的计算机程序产品,该代码在执行时使得处理器实施根据解决方案1至151中的一个或多个所述的方法。
154.一种本文档中描述的方法、装置或系统。
以下条款列出了可以在解码、编码或转码侧实施的解决方案的附加示例。
1.一种视频处理的方法(例如,图18A中示出的方法1800),包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查(1802)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;以及基于该位置来执行(1804)对是否解析编码表示中的信令通知变换信息的语法元素的确定。
2.根据条款1所述的方法,包括:通过根据该确定解析编码表示来执行转换。
3.一种视频处理的方法(例如,图19A中示出的方法1900),包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查(1902)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和至少一个其他编码准则满足条件,确定(1904)信令通知变换信息的语法元素存在并且被包括在编码表示中;以及使用由编码表示中的语法元素标识的变换信息来执行(1906)转换。
4.一种视频处理的方法(例如,图20A中示出的方法2000),包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查(2002)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和/或至少一个其他编码准则不满足条件,确定(2004)信令通知变换信息的语法元素被跳过而不被包括在编码表示中;以及使用没有在编码表示中显式标识的默认变换来执行(2006)转换。
5.根据条款2至4中任一项所述的方法,其中,该转换包括将根据语法元素的变换应用于当前视频块的去量化残差系数值的结果。
6.根据条款1所述的方法,其中,该位置由坐标(LastX,LastY)表示,其中由于LastX<=Th0且LastY<=Th1,编码表示没有信令通知变换信息的语法元素,其中Th0和Th1是数字。
7.根据条款1所述的方法,其中,由于LasTx<=Th0或LasTy<=Th1,编码表示没有信令通知变换信息的语法元素,其中Th0和Th1是数字。
8.根据条款6-7中任一项所述的方法,其中,Th0和Th1是预定义的并且不在编码表示中信令通知。
9.根据条款6-7中任一项所述的方法,其中,Th0和Th1是在编码表示中信令通知的。
10.根据条款6所述的方法,其中,Th0和Th1是以序列参数集级别、或图片参数集级别、或条带标头级别、或图片标头级别、或编码单元组级别、或编码树单元级别、或编码树块级别信令通知的。
11.根据条款6-7中任一项所述的方法,其中,Th0和Th1取决于当前视频块的形状或尺寸。
12.根据条款6-7中任一项所述的方法,其中,Th0和Th1取决于用于当前视频块的量化参数。
13.根据条款6-7中任一项所述的方法,其中,Th0和Th1取决于用于当前视频块的编码模式。
14.根据条款6-13中任一项所述的方法,其中,Th0和Th1相等。
15.根据条款13所述的方法,其中,Th0=Th1=1。
16.根据条款13所述的方法,其中,Th0=Th1=0。
17.根据条款6-7中任一项所述的方法,其中,如果当前视频块是方形块,则Th0和Th1被确定为相等,如果当前视频块的宽度大于当前视频块的高度,则确定为Th0>Th1,否则Th0小于Th1。
18.根据条款1至16中任一项所述的方法,其中,变换信息指示二次变换。
19.根据条款1至16中任一项所述的方法,其中,变换信息指示不可分二次变换。
20.根据条款1至19中任一项所述的方法,其中,当没有在编码表示中信令通知变换信息时,该转换包括在不使用二次变换的情况下执行转换。
21.根据条款1至17中任一项所述的方法,其中,变换信息指示主变换信息。
22.根据条款6至19中任一项所述的方法,其中,由于lastX<=Th0且LastY<=Th1,其中编码表示没有信令通知在转换期间应用离散余弦变换(DCT-II)的语法元素。
23.根据条款6至19中任一项所述的方法,其中由于lastX<=Th0或LastY<=Th1,其中编码表示没有信令通知在转换期间应用离散余弦变换(DCT-II)的语法元素。
24.根据条款18-20中任一项所述的方法,其中,该转换包括,在没有信令通知主变换信息的情况下,将离散余弦变换(DCT-II)应用于当前视频块的去量化系数。
25.一种视频处理的方法(例如,图18B中示出的方法1850),包括:在将当前视频块转换为当前视频块的编码表示期间,以正向扫描顺序检查(1852)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;以及基于该位置确定(1854)是否对编码表示中的信令通知变换信息的语法元素进行编码。
26.一种视频处理的方法(例如,图19B中示出的方法1950),包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查(1952)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和至少一个其他编码准则满足条件,确定(1954)信令通知变换信息的语法元素将被包括在编码表示中;以及通过将标识变换信息的语法元素包括在编码表示中来执行(1956)转换。
27.一种视频处理的方法(例如,图20B中示出的方法2050),包括:在从当前视频块的编码表示到当前视频块的转换期间,以正向扫描顺序检查(2052)当前视频块的最后非零系数的位置,其中该位置相对于当前视频块的左上角位置;由于位置和/或至少一个其他编码准则不满足条件,确定(2054)信令通知变换信息的语法元素被跳过而不被包括在编码表示中;以及通过跳过语法元素来生成(2056)编码表示,从而隐式地信令通知使用默认变换。
28.根据条款25至27中任一项所述的方法,其中,在转换期间,在量化产生变换残差系数值之前,将由变换信息指示的变换应用于残差系数值。
29.根据条款25所述的方法,其中,该位置由坐标(LastX,LastY)表示,其中由于LastX<=Th0且LastY<=Th1,编码表示没有信令通知变换信息的语法元素,其中Th0和Th1是数字。
30.根据条款25所述的方法,其中,由于LasTx<=Th0或LasTy<=Th1,编码表示没有信令通知变换信息的语法元素,其中Th0和Th1是数字。
31.根据条款29-30中任一项所述的方法,其中,Th0和Th1是预定义的并且不在编码表示中信令通知。
32.根据条款29-30中任一项所述的方法,其中,Th0和Th1是在编码表示中信令通知的。
33.根据条款32所述的方法,其中,Th0和Th1是以序列参数集级别、或图片参数集级别、或条带标头级别、或图片标头级别、或编码单元组级别、或编码树单元级别、或编码树块级别信令通知的。
34.根据条款29-30中任一项所述的方法,其中,Th0和Th1取决于当前视频块的形状或尺寸。
35.根据条款29-30中任一项所述的方法,其中,Th0和Th1取决于用于当前视频块的量化参数。
36.根据条款29-30中任一项所述的方法,其中,Th0和Th1取决于用于当前视频块的编码模式。
37.根据条款29-36中任一项所述的方法,其中,Th0和Th1相等。
38.根据条款37所述的方法,其中,Th0=Th1=1。
39.根据条款37所述的方法,其中,Th0=Th1=0。
40.根据条款29-30中任一项所述的方法,其中,如果当前视频块是方形块,则Th0和Th1被确定为相等,如果当前视频块的宽度大于当前视频块的高度,则确定为Th0>Th1,否则Th0小于Th1。
41.根据条款25至40中任一项所述的方法,其中,变换信息指示二次变换。
42.根据条款25至40中任一项所述的方法,其中,变换信息指示可分二次变换。
43.根据条款25至40中任一项所述的方法,其中,变换信息指示不可分二次变换。
44.根据条款25至43中任一项所述的方法,其中,当没有在编码表示中信令通知变换信息时,该转换包括在不使用二次变换的情况下执行转换。
45.根据条款25至44中任一项所述的方法,其中,变换信息指示主变换信息。
46.根据条款25至44中任一项所述的方法,其中,变换信息指示主变换信息。正向扫描顺序可以是例如VVC规范中定义的。
前一章节提供了上述解决方案的附加特征(例如,第6项)。
47.根据条款1至46中任一项所述的方法,其中,所述变换包括正变换与逆变换的至少一者。
48.一种包括处理器的视频编码器装置,被配置为实施根据条款1至47中的一个或多个所述的方法。
49.一种包括处理器的视频解码器装置,被配置为实施根据上述条款中的一个或多个所述的方法。
50.一种其上存储有代码的计算机程序产品,该代码在执行时使得处理器实施根据条款1至47中的一个或多个所述的方法。
51.一种本文档中描述的方法、装置或系统。
7.所公开技术的示例实施方式
图30是视频处理装置3000的框图。装置3000可以用于实施本文描述的方法中的一种或多种。装置3000可以体现在智能手机、平板电脑、计算机、物联网(Internet ofThings,IoT)接收器等中。装置3000可以包括一个或多个处理器3002、一个或多个存储器3004、以及视频处理硬件3006。(多个)处理器3002可以被配置为实施本文档中描述的一种或多种方法(包括但不限于本文描述的各种方法)。存储器(多个存储器)3004可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件3006可以用于在硬件电路中实施本文档中描述的一些技术。
在一些实施例中,视频编码方法可以使用如参考图30描述的在硬件平台上实施的装置而实施。
图32是示出可以在其中实施本文公开的各种技术的示例视频处理系统3200的框图。各种实施方式可以包括系统3200的一些或所有组件。系统3200可以包括用于接收视频内容的输入端3202。视频内容可以以原始或未压缩格式(例如,8或10比特多分量像素值)而接收,或者可以是压缩或编码格式。输入端3202可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(Passive Optical Network,PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统3200可以包括可以实施本文档中描述的各种编码或编码方法的编码组件3204。编码组件3204可以将来自输入端3202的视频的平均比特率减小到编码组件3204的输出,以产生视频的编码表示。编码技术因此有时被称为视频压缩或视频转码技术。编码组件3204的输出可以存储,或者经由如由组件3206表示的连接的通信而发送。在输入端3202处接收的视频的存储或通信传送的比特流(或编码)表示可以由组件3208用于生成像素值或被发送到显示接口3210的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然特定视频处理操作被称为“编码”操作或工具,但是应当理解,编码工具或操作在编码器处被使用,并且反转编码结果的对应解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(Universal SerialBus,USB)、或高清多媒体接口(High Definition Multimedia Interface,HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(serial advanced technologyattachment,串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备的各种电子设备中。
根据前述内容,可以理解本文已经出于说明的目的描述了本公开技术的具体实施方案,但是在不脱离本发明范围的情况下可以进行各种修改。因此,本公开技术不受除了所附权利要求之外的限制。
本专利文档中描述的主题和功能操作的实施方式可以在各种系统、数字电子电路或计算机软件、固件或硬件(包括本说明书中公开的结构及其结构等同物、或者它们中的一个或多个的组合)中实施。本说明书中描述的主题的实施方式可以实施为一个或多个计算机程序产品,即编码在有形和非暂时性计算机可读介质上的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置运行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理单元”或“数据处理装置”包括用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建运行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署以在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上运行。
本说明书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以实施为专用逻辑电路,例如,FPGA(FieldProgrammable Gate Array,现场可编程门阵列)或ASIC(Application SpecificIntegrated Circuit,专用集成电路)。
适合于运行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
说明书与附图一起旨在被视为是示例性的,其中示例性意味着示例。如本文所使用的,除非上下文另有清楚说明,否则单数形式“一”、“一个”和“该”旨在也包括复数形式。另外,除非上下文另有清楚说明,否则使用“或”旨在包括“和/或”。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何发明或可能要求保护的范围的限制,而是作为特定于特定发明的特定实施例的特征的描述。在单独的实施例的上下文中在本专利文档中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以分别在多个实施例中或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为要求以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims (76)

1.一种视频处理方法,包括:
解析视频的编码表示中的、用于第一确定将编码表示转换为视频块的第一变换的应用性的第一字段,
其中,在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及
通过基于第一确定选择性地使用第一变换来执行转换。
2.根据权利要求1所述的方法,还包括:
解析视频的编码表示中的、用于第二确定转换的第二变换的应用性的第二字段,
其中第二变换在转换期间与第一变换级联应用,并且
其中执行转换还包括基于第二确定选择性地使用第二变换。
3.根据权利要求2所述的方法,其中,第一变换用于将去量化残差系数值变换为第一变换表示,并且第二变换用于将第一变换表示的至少一部分变换为第二变换表示。
4.根据权利要求1-3中任一项所述的方法,其中,第一字段与编码表示中处于图片参数集级别、条带级别或图片级别的标志相对应。
5.根据权利要求1-4中任一项所述的方法,其中,第一确定或第二确定还基于编码表示中的用于表示视频块的编码模式。
6.根据权利要求1-3中任一项所述的方法,其中,第一字段被包括在视频区域级别处的编码表示中,其中视频区域至少包括视频块,并且其中第一字段指示当成功确定视频块的编码模式是特定编码模式时将在转换期间应用第一变换。
7.根据权利要求6所述的方法,其中,特定编码模式是帧内编码模式。
8.根据权利要求1-7中任一项所述的方法,其中,字段处于编码单元组级别、或编码树单元级别、或编码树块级别、或条带标头级别、或图片标头级别。
9.根据权利要求1至8中任一项所述的方法,其中,第一变换是自适应多核变换(AMT)。
10.根据权利要求1至8中任一项所述的方法,其中,第二变换是二次变换。
11.一种视频处理的方法,包括:
对于视频的当前视频块和视频的编码表示之间的转换,执行对用于当前视频块的编码模式为特定类型的确定;
作为编码模式为特定类型的结果,执行对指示用于处理当前视频块的第一变换或第二变换的应用性的字段不存在于编码表示中的确定;
在字段不存在的情况下解析编码表示;以及
通过由于所述确定而禁止将第一变换或第二变换用于变换当前视频块的去量化残差系数,来生成当前视频块。
12.根据权利要求11所述的方法,其中,特定类型包括高级运动矢量预测编码模式。
13.根据权利要求11所述的方法,其中,特定类型包括基于子块的预测模式。
14.根据权利要求13所述的方法,其中,基于子块的预测模式包括可选时域运动矢量预测模式或仿射编码模式。
15.根据权利要求11-13中任一项所述的方法,其中,第一变换包括自适应多核变换(AMT)。
16.根据权利要求11-13中任一项所述的方法,其中,第一变换包括二次变换。
17.一种视频处理的方法,包括:
从相邻视频块继承关于视频块的编码表示和视频块之间的转换的第一变换的变换信息,
其中,在转换期间,第一变换被应用于视频块的去量化残差系数值的结果;以及
通过基于第一继承选择性地使用第一变换来执行转换。
18.根据权利要求17所述的方法,其中,相邻块是空域邻近的块。
19.根据权利要求17-18中任一项所述的方法,其中,关于第一变换的变换信息包括第一变换是否为离散余弦变换的第一指示和/或第一变换的主矩阵索引的第二指示。
20.根据权利要求17-19中任一项所述的方法,其中,去量化残差系数值的结果通过对去量化残差系数值应用另一变换而计算。
21.根据权利要求17所述的方法,其中,关于第一变换的变换信息还包括标识另一变换的索引。
22.根据权利要求17-21中任一项所述的方法,其中,所述继承包括继承与相邻视频块的运动信息一起存储的变换信息。
23.根据权利要求22所述的方法,其中,关于第一变换的变换信息以视频图片级别存储。
24.根据权利要求23所述的方法,其中,关于第一变换的变换信息由于图片为参考图片而以视频图片级别存储。
25.根据权利要求17-24中任一项所述的方法,其中,所述转换包括使用修剪操作来生成候选列表,所述修剪操作取决于关于与被修剪的候选相关联的第一变换的变换信息。
26.根据权利要求17-25中任一项所述的方法,其中,所述继承由于视频块从相邻视频块继承前N个候选中的一个而剩余候选使用默认变换而被执行。
27.根据权利要求26所述的方法,其中,前N个候选中的一个包括Merge候选或AMVP候选。
28.根据权利要求17-27中任一项所述的方法,还包括:
确定第一视频块被编码为跳过块,并且其中继承关于第一变换的变换信息包括从其继承运动信息的相邻视频块继承关于第一变换的变换信息。
29.根据权利要求17至28中任一项所述的方法,其中,第一视频块是使用Merge模式解码的。
30.根据权利要求17至29中任一项所述的方法,其中,所述继承包括基于关于相邻视频块的变换信息来预测性地确定关于用于当前视频块的第一变换的变换信息。
31.一种视频处理的方法,包括:
基于当前视频块的编码条件来确定用于将编码表示转换为当前视频块的第一变换为默认变换,
其中,在转换期间,第一变换被应用于当前视频块的去量化残差系数值的结果;以及
通过基于第一确定选择性地使用第一变换来执行转换。
32.根据权利要求31所述的方法,其中,当前视频块的编码条件包括第一视频块的编码模式。
33.根据权利要求31所述的方法,其中,编码条件包括在与当前视频块相关联的编码单元、或预测单元、或变换单元中编码的非零系数的计数。
34.根据权利要求31-32中任一项所述的方法,其中,编码条件包括对于当前视频块使用组合的Merge候选、或零Merge候选、或Merge候选、或子块Merge候选、或基于子块的预测,并且其中默认变换在编码表示中没有任何信令的情况下被使用。
35.根据权利要求31所述的方法,其中,编码条件对应于当前视频块编码为全零系数,并且确定包括确定默认变换索引被用于所述转换。
36.根据权利要求31所述的方法,其中,编码条件包括当前视频块的运动矢量值的函数。
37.根据权利要求36所述的方法,其中,运动矢量值的函数包括abs(MVx)+abs(MVy)或(MVx)*(MVx)+(MVy)*(MVy),其中MVx和MVy是运动矢量值,abs()表示绝对值函数。
38.根据权利要求31所述的方法,其中,编码条件包括当前视频块的运动矢量差值的函数。
39.根据权利要求38所述的方法,其中,运动矢量差值的函数包括abs(MVDx)+abs(MVDy)或(MVDx)*(MVDx)+(MVDy)*(MVDy),其中MVDx和MVDy是运动矢量差值,并且abs()表示绝对值函数。
40.一种视频处理的方法,包括:
解析包括视频的多个视频块的编码表示的比特流,其中对于当前视频块,比特流包括关于相邻块的变换信息是否被继承作为当前视频块的变换信息的第一指示符;以及
基于从解析第一指示符获得的变换信息来对编码表示进行解码,以生成当前视频块;
其中在转换期间,由变换信息标识的变换被应用于当前视频块的去量化残差系数值的结果。
41.根据权利要求40所述的方法,包括:由于第一指示符指示变换信息不是从相邻块继承的,解析标识在转换期间使用的变换信息的第二指示符。
42.根据权利要求40所述的方法,其中,所述变换包括自适应多核变换(AMT)。
43.根据权利要求40-41中任一项所述的方法,其中,第二指示符包括比特流中处于编码单元级别的标志。
44.根据权利要求40-41中任一项所述的方法,其中,第二指示符包括所述变换的索引。
45.一种视频处理的方法,包括:
解析包括视频的多个视频块的编码表示的比特流,其中对于使用Merge模式编码的当前视频块,比特流包括指示将默认变换作为变换使用的第一指示的一比特字段,并且从相邻块继承变换信息的第二指示被包括在编码表示中;
基于一比特字段标识所述变换;以及
执行编码表示和当前视频块之间的转换;
其中,在转换期间,所述变换被应用于当前视频块的去量化残差系数值的结果。
46.根据权利要求45所述的方法,其中,所述变换包括自适应多核变换(AMT)。
47.根据权利要求45至46中任一项所述的方法,包括:相邻块与当前视频块邻近。
48.一种视频处理的方法,包括:
将用于第一确定将编码表示转换为视频块的第一变换的应用性的第一字段包括在视频的编码表示中,
其中,在转换期间,第一变换将被应用于视频块的去量化残差系数值的结果;以及
通过对视频块进行编码来生成编码表示。
49.根据权利要求48所述的方法,还包括:
将第二确定转换的第二变换的应用性的第二字段包括在视频的编码表示中,
其中第二变换将在转换期间与第一变换级联应用,并且
其中执行转换还包括基于第二确定选择性地使用第二变换。
50.根据权利要求49所述的方法,其中,第一变换用于将去量化残差系数值变换为第一变换表示,第二变换用于将第一变换表示的至少一部分变换为第二变换表示。
51.根据权利要求50所述的方法,其中,第一变换是自适应多核变换(AMT)。
52.根据权利要求50-51中任一项所述的方法,其中,第二变换是二次变换(NSST)。
53.根据权利要求48-51中任一项所述的方法,其中,第一字段与编码表示中处于图片参数集级别的标志相对应。
54.根据权利要求48-51中任一项所述的方法,其中,第一字段与编码表示中条带标头级别处的标志相对应。
55.根据权利要求48-51中任一项所述的方法,其中,第一字段与编码表示中图片级别处的标志相对应。
56.根据权利要求48-51和53-55中任一项所述的方法,其中,第一确定或第二确定还基于编码表示中的用于表示视频块的编码模式。
57.根据权利要求48-51中任一项所述的方法,其中,第一字段被包括在视频区域级别处的编码表示中,其中视频区域至少包括视频块,并且其中第一字段指示当成功确定视频块的编码模式是特定编码模式时将在转换期间应用第一变换。
58.根据权利要求57所述的方法,其中,特定编码模式是帧内编码模式。
59.根据权利要求57所述的方法,其中,特定编码模式是帧间编码模式。
60.根据权利要求57所述的方法,其中,特定编码模式是高级运动矢量预测编码模式。
61.根据权利要求57所述的方法,其中,特定编码模式是包括仿射编码的Merge编码模式。
62.根据权利要求57所述的方法,其中,特定编码模式是排除仿射编码的Merge编码模式。
63.根据权利要求57所述的方法,其中,特定编码模式是基于子块的编码模式。
64.根据权利要求48-63中任一项所述的方法,其中,字段处于编码单元组级别、或编码树单元级别、或编码树块级别、或条带标头级别、或图片标头级别。
65.根据权利要求57-64中任一项所述的方法,其中,第一变换是自适应多核变换(AMT)。
66.根据权利要求57-64中任一项所述的方法,其中,第二变换是二次变换(NSST)。
67.一种视频处理的方法,包括:
对于视频的当前视频块和视频的编码表示之间的转换,执行对用于当前视频块的编码模式为特定类型的确定;
作为编码模式为特定类型的结果,执行对指示用于处理当前视频块的第一变换或第二变换的应用性的字段将不被包括在编码表示中的确定;以及
在不包括字段的情况下生成编码表示;
其中,通过由于所述确定而禁止将第一变换和/或第二变换用于变换当前视频块的去量化残差系数,可解码当前视频块。
68.根据权利要求67所述的方法,其中,特定类型包括高级运动矢量预测编码模式。
69.根据权利要求67所述的方法,其中,特定类型包括基于子块的预测模式。
70.根据权利要求69所述的方法,其中,基于子块的预测模式包括可选时域运动矢量预测模式。
71.根据权利要求67-70中任一项所述的方法,其中,第一变换包括自适应多核变换(AMT)。
72.根据权利要求67-70中任一项所述的方法,其中,第一变换包括二次变换。
73.根据权利要求1-72中任一项所述的方法,其中,所述变换包括正变换和逆变换的至少一个。
74.一种包括处理器的视频编码器装置,被配置为实施根据权利要求1至73中一项或多项所述的方法。
75.一种其上存储有代码的计算机程序产品,所述代码在运行时使得处理器实施根据权利要求1至73中一项或多项所述的方法。
76.一种本文档中描述的方法、装置或系统。
CN201910760776.6A 2018-08-16 2019-08-16 用于变换矩阵选择的隐式编码 Pending CN110839159A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018100795 2018-08-16
CNPCT/CN2018/100795 2018-08-16

Publications (1)

Publication Number Publication Date
CN110839159A true CN110839159A (zh) 2020-02-25

Family

ID=68109388

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910760271.XA Active CN110839158B (zh) 2018-08-16 2019-08-16 变换矩阵选择的系数相关的编解码
CN201910760776.6A Pending CN110839159A (zh) 2018-08-16 2019-08-16 用于变换矩阵选择的隐式编码

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910760271.XA Active CN110839158B (zh) 2018-08-16 2019-08-16 变换矩阵选择的系数相关的编解码

Country Status (7)

Country Link
US (3) US11082693B2 (zh)
EP (1) EP3815363A1 (zh)
JP (2) JP7313427B2 (zh)
KR (1) KR102636267B1 (zh)
CN (2) CN110839158B (zh)
TW (2) TWI814889B (zh)
WO (2) WO2020035827A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355955A (zh) * 2020-03-06 2020-06-30 中南大学 基于预选层的多变换核快速跳过算法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110839158B (zh) 2018-08-16 2023-03-10 北京字节跳动网络技术有限公司 变换矩阵选择的系数相关的编解码
CN109788286B (zh) * 2019-02-01 2021-06-18 北京大学深圳研究生院 一种编码、解码变换方法、系统、设备及计算机可读介质
CN113841401B (zh) 2019-05-10 2022-11-25 北京字节跳动网络技术有限公司 用于视频处理的二次变换矩阵的选择
WO2020244656A1 (en) 2019-06-07 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Conditional signaling of reduced secondary transform in video bitstreams
BR112021025591A2 (pt) 2019-06-19 2022-02-01 Lg Electronics Inc Codificação de informação sobre conjunto de núcleo de transformada
JP7422858B2 (ja) 2019-08-03 2024-01-26 北京字節跳動網絡技術有限公司 ビデオ処理方法、装置、記憶媒体及び記憶方法
WO2021032045A1 (en) 2019-08-17 2021-02-25 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
AU2019275553B2 (en) * 2019-12-03 2022-10-06 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a coding tree unit
WO2021173539A1 (en) 2020-02-24 2021-09-02 Bytedance Inc. Partition calculation based on subpicture level
JP7479492B2 (ja) 2020-03-03 2024-05-08 バイトダンス インコーポレイテッド ビデオ・コーディングにおける低周波ノン・セパラブル変換シグナリング
CN111541896B (zh) * 2020-04-27 2022-03-29 中南大学 一种基于vvc的帧内预测模式的优化方法及系统
US11310529B2 (en) * 2020-05-27 2022-04-19 Tencent America LLC Mode-dependent joint component transform
WO2022159115A1 (en) * 2021-01-25 2022-07-28 Google Llc Chroma transform type determination
WO2023060913A1 (en) * 2021-10-15 2023-04-20 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011254536A (ja) * 2011-08-15 2011-12-15 Mitsubishi Electric Corp 動画像復号方法
WO2017195555A1 (ja) * 2016-05-13 2017-11-16 シャープ株式会社 画像復号装置および画像符号化装置
WO2018061837A1 (ja) * 2016-09-30 2018-04-05 ソニー株式会社 画像処理装置および方法
CA3041856A1 (en) * 2016-12-28 2018-07-05 Sony Corporation Image processing apparatus and method
CN108322760A (zh) * 2017-01-13 2018-07-24 联发科技股份有限公司 一种视频编解码的方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102045560B (zh) 2009-10-23 2013-08-07 华为技术有限公司 一种视频编解码方法及设备
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
US10390046B2 (en) 2011-11-07 2019-08-20 Qualcomm Incorporated Coding significant coefficient information in transform skip mode
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US11233998B2 (en) * 2015-05-29 2022-01-25 Qualcomm Incorporated Coding data using an enhanced context-adaptive binary arithmetic coding (CABAC) design
US10560718B2 (en) 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
US10972733B2 (en) * 2016-07-15 2021-04-06 Qualcomm Incorporated Look-up table for enhanced multiple transform
US11095893B2 (en) 2016-10-12 2021-08-17 Qualcomm Incorporated Primary transform and secondary transform in video coding
WO2018143670A1 (ko) * 2017-01-31 2018-08-09 세종대학교 산학협력단 영상의 부호화/복호화 방법 및 장치
JP7334730B2 (ja) 2018-03-30 2023-08-29 ソニーグループ株式会社 画像処理装置および方法
HUE063982T2 (hu) 2018-04-01 2024-02-28 Lg Electronics Inc Videojel feldolgozás csökkentett másodlagos transzformáció használatával
CN115379216A (zh) * 2018-06-03 2022-11-22 Lg电子株式会社 视频信号的解码、编码和发送设备及存储视频信号的介质
CN110839158B (zh) 2018-08-16 2023-03-10 北京字节跳动网络技术有限公司 变换矩阵选择的系数相关的编解码

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011254536A (ja) * 2011-08-15 2011-12-15 Mitsubishi Electric Corp 動画像復号方法
WO2017195555A1 (ja) * 2016-05-13 2017-11-16 シャープ株式会社 画像復号装置および画像符号化装置
WO2018061837A1 (ja) * 2016-09-30 2018-04-05 ソニー株式会社 画像処理装置および方法
CA3041856A1 (en) * 2016-12-28 2018-07-05 Sony Corporation Image processing apparatus and method
CN108322760A (zh) * 2017-01-13 2018-07-24 联发科技股份有限公司 一种视频编解码的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YONGBING LIN等: "Simplified multiple-core transform for intra residual coding", 《JOINT VIDEO EXPLORATION TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111355955A (zh) * 2020-03-06 2020-06-30 中南大学 基于预选层的多变换核快速跳过算法
CN111355955B (zh) * 2020-03-06 2022-07-29 中南大学 基于预选层的多变换核快速跳过方法

Also Published As

Publication number Publication date
JP2021536169A (ja) 2021-12-23
US20210076043A1 (en) 2021-03-11
KR102636267B1 (ko) 2024-02-14
JP2023104947A (ja) 2023-07-28
US20210329242A1 (en) 2021-10-21
CN110839158B (zh) 2023-03-10
WO2020035829A1 (en) 2020-02-20
JP7481538B2 (ja) 2024-05-10
WO2020035827A1 (en) 2020-02-20
TWI814889B (zh) 2023-09-11
KR20210045387A (ko) 2021-04-26
TW202034698A (zh) 2020-09-16
US11082693B2 (en) 2021-08-03
US20210076038A1 (en) 2021-03-11
US11558612B2 (en) 2023-01-17
TWI816858B (zh) 2023-10-01
EP3815363A1 (en) 2021-05-05
JP7313427B2 (ja) 2023-07-24
CN110839158A (zh) 2020-02-25
TW202021351A (zh) 2020-06-01

Similar Documents

Publication Publication Date Title
CN110839158B (zh) 变换矩阵选择的系数相关的编解码
US10555006B2 (en) Deriving bilateral filter information based on a prediction mode in video coding
CN113261293B (zh) 用于帧内块复制的基于历史的运动候选列表构建
CN110858904B (zh) 基于多运动模型的视频编码和解码
US10595017B2 (en) Modeling-based image decoding method and device in image coding system
US20180184127A1 (en) Determining neighboring samples for bilateral filtering in video coding
CN113170170A (zh) 用于具有几何分割的帧间预测的混合方法
CN110933411A (zh) 用于帧内编码的邻近的相邻块的选择
CN113261290A (zh) 基于修改历史的运动预测
CN113711597B (zh) 上下文建模和多重变换矩阵的选择
TWI822838B (zh) 使用空間鄰居的重疊塊運動補償
CN115104309A (zh) 对merge模式的改进
JPWO2020035829A5 (zh)
TWI840400B (zh) 基於多運動模型的視頻編碼和解碼
CN117296323A (zh) 基于特征的变换选择
CN110944198A (zh) 色度模式帧内编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination