CN111050171B - 视频解码方法、装置、设备及存储介质 - Google Patents

视频解码方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111050171B
CN111050171B CN201911309768.6A CN201911309768A CN111050171B CN 111050171 B CN111050171 B CN 111050171B CN 201911309768 A CN201911309768 A CN 201911309768A CN 111050171 B CN111050171 B CN 111050171B
Authority
CN
China
Prior art keywords
size
effective
luminance
syntax element
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911309768.6A
Other languages
English (en)
Other versions
CN111050171A (zh
Inventor
张洪彬
李翔
李贵春
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211386430.2A priority Critical patent/CN115720265B/zh
Priority to CN201911309768.6A priority patent/CN111050171B/zh
Publication of CN111050171A publication Critical patent/CN111050171A/zh
Priority to EP20902574.1A priority patent/EP3975558A4/en
Priority to PCT/CN2020/134581 priority patent/WO2021121080A1/zh
Priority to KR1020247026780A priority patent/KR20240127485A/ko
Priority to JP2022515567A priority patent/JP2022548354A/ja
Priority to KR1020227008146A priority patent/KR102695010B1/ko
Priority to US17/506,784 priority patent/US12034950B2/en
Application granted granted Critical
Publication of CN111050171B publication Critical patent/CN111050171B/zh
Priority to US18/663,766 priority patent/US20240305804A1/en
Priority to JP2024119640A priority patent/JP2024138096A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供了一种视频解码方法、装置、设备及存储介质,涉及视频编解码处理技术领域。所述解码方法包括:获取待解码视频帧对应的第一参数集;根据第一参数集中包含的语法元素,确定有效QM,该有效QM是指待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM;对有效QM进行解码。采用本申请技术方案,解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。

Description

视频解码方法、装置、设备及存储介质
技术领域
本申请实施例涉及视频编解码技术领域,特别涉及一种量化矩阵(QuantizationMatrix,QM)的解码方法、装置、设备及存储介质。
背景技术
H.266是在H.265/HEVC(High Efficient Video Coding,高效率视频压缩编码)基础上改进的新一代视频编码技术,已正式定名为VVC(Versatile Video Coding,通用视频编码),由JVET(Joint Video Experts Team,联合视频专家组)组织引导不断更新完善中。
在第14次JVET会议上决定,VVC中可以使用如下两种形式的量化矩阵:默认量化矩阵和用户定义的量化矩阵,以支持频率相关缩放。在启用量化矩阵的情况下,可以根据该量化矩阵中包含的量化系数(即整数加权值)对TB(Transform Block,变换块)中的变换系数进行单独量化。
目前VVC采用的量化矩阵的解码方法,解码器端的计算复杂度较高。
发明内容
本申请实施例提供了一种视频解码方法、装置、设备及存储介质,可降低解码器端的计算复杂度。所述技术方案如下:
一方面,本申请实施例提供一种视频解码方法,所述方法包括:
获取待解码视频帧对应的第一参数集,所述第一参数集包括用于定义QM相关的语法元素(syntax element)的参数集;
根据所述第一参数集中包含的语法元素,确定有效QM,所述有效QM是指所述待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM;
对所述有效QM进行解码。
另一方面,本申请实施例提供一种视频编码方法,所述方法包括:
确定待编码视频帧对应的有效QM,所述有效QM是指所述待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM;
对用于确定所述有效QM的语法元素和所述有效QM进行编码,生成第一参数集对应的码流;其中,所述第一参数集包括用于定义QM相关的语法元素的参数集。
再一方面,本申请实施例提供一种视频解码装置,所述装置包括:
参数获取模块,用于获取待解码视频帧对应的第一参数集,所述第一参数集包括用于定义QM相关的语法元素的参数集;
QM确定模块,用于根据所述第一参数集中包含的语法元素,确定有效QM,所述有效QM是指所述待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM;
QM解码模块,用于对所述有效QM进行解码。
再一方面,本申请实施例提供一种视频编码装置,所述装置包括:
QM确定模块,用于确定待编码视频帧对应的有效QM,所述有效QM是指所述待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM;
QM编码模块,用于对用于确定所述有效QM的语法元素和所述有效QM进行编码,生成第一参数集对应的码流;其中,所述第一参数集包括用于定义QM相关的语法元素的参数集。
还一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述视频解码方法,或者实现上述视频编码方法。
还一方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述视频解码方法,或者实现上述视频编码方法。
还一方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述视频解码方法,或者实现上述视频编码方法。
本申请实施例提供的技术方案可以包括如下有益效果:
通过获取待解码视频帧对应的第一参数集,根据该第一参数集中包含的语法元素确定有效QM,该有效QM是指在编码生成该待解码视频帧的过程中针对变换系数进行量化时实际使用到的QM,然后对该有效QM进行解码。这样,解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
附图说明
图1是本申请示例性示出的一种视频编码的示意图;
图2是本申请一个实施例提供的通信系统的简化框图;
图3是本申请示例性示出的视频编码器和视频解码器在流式传输环境中的放置方式的示意图;
图4是本申请一个实施例提供的帧间预测模式下的编码示意图;
图5是本申请一个实施例提供的帧内预测模式下的编码示意图;
图6是本申请一个实施例提供的视频编码器的功能模块的示意图;
图7是本申请一个实施例提供的视频解码器的功能模块的示意图;
图8是本申请一个实施例提供的通过下采样复制生成QM的示意图;
图9是本申请一个实施例提供的对角扫描顺序的示意图;
图10是本申请一个实施例提供的视频解码方法的流程图;
图11是本申请一个实施例提供的视频编码方法的流程图;
图12是本申请一个实施例提供的视频解码装置的框图;
图13是本申请另一个实施例提供的视频解码装置的框图;
图14是本申请一个实施例提供的视频编码装置的框图;
图15是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图1,当前块101包括在运动搜索过程期间已由编码器发现的样本,根据已产生空间偏移的相同大小的先前块,可预测所述样本。另外,可从一个或多个参考图片相关联的元数据中导出所述MV(Motion Vector,运动矢量),而非对MV直接编码。例如,使用关联于A0、A1和B0、B1、B2(分别对应102到106)五个周围样本中的任一样本的MV,(按解码次序)从最近的参考图片的元数据中导出所述MV。
如图2所示,其示出了本申请一个实施例提供的通信系统的简化框图。通信系统200包括多个设备,所述设备可通过例如网络250彼此通信。举例来说,通信系统200包括通过网络250互连的第一设备210和第二设备220。在图2的实施例中,第一设备210和第二设备220执行单向数据传输。举例来说,第一设备210可对视频数据例如由第一设备210采集的视频图片流进行编码以通过网络250传输到第二设备220。已编码的视频数据以一个或多个已编码视频码流形式传输。第二设备220可从网络250接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。单向数据传输在媒体服务等应用中是较常见的。
在另一实施例中,通信系统200包括执行已编码视频数据的双向传输的第三设备230和第四设备240,所述双向传输可例如在视频会议期间发生。对于双向数据传输,第三设备230和第四设备240中的每个设备可对视频数据(例如由设备采集的视频图片流)进行编码,以通过网络250传输到第三设备230和第四设备240中的另一设备。第三设备230和第四设备240中的每个设备还可接收由第三设备230和第四设备240中的另一设备传输的已编码视频数据,且可对所述已编码视频数据进行解码以恢复视频数据,且可根据恢复的视频数据在可访问的显示装置上显示视频图片。
在图2的实施例中,第一设备210、第二设备220、第三设备230和第四设备240可为服务器、个人计算机和智能电话等计算机设备,但本申请公开的原理可不限于此。本申请实施例适用于PC(Personal Computer,个人计算机)、手机、平板电脑、媒体播放器和/或专用视频会议设备。网络250表示在第一设备210、第二设备220、第三设备230和第四设备240之间传送已编码视频数据的任何数目的网络,包括例如有线连线的和/或无线通信网络。通信网络250可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的,除非在下文中有所解释,否则网络250的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。
作为实施例,图3示出视频编码器和视频解码器在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV(电视)、在包括CD(Compact Disc,光盘)、DVD(Digital Versatile Disc,数字通用光盘)、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统313,所述采集子系统可包括数码相机等视频源301,所述视频源创建未压缩的视频图片流302。在实施例中,视频图片流302包括由数码相机拍摄的样本。相较于已编码的视频数据304(或已编码的视频码流),视频图片流302被描绘为粗线以强调高数据量的视频图片流,视频图片流302可由电子装置320处理,所述电子装置320包括耦接到视频源301的视频编码器303。视频编码器303可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流302,已编码的视频数据304(或已编码的视频码流304)被描绘为细线以强调较低数据量的已编码的视频数据304(或已编码的视频码流304),其可存储在流式传输服务器305上以供将来使用。一个或多个流式传输客户端子系统,例如图3中的客户端子系统306和客户端子系统308,可访问流式传输服务器305以检索已编码的视频数据304的副本307和副本309。客户端子系统306可包括例如电子装置330中的视频解码器310。视频解码器310对已编码的视频数据的传入副本307进行解码,且产生可在显示器312(例如显示屏)或另一呈现装置(未描绘)上呈现的输出视频图片流311。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据304、视频数据307和视频数据309(例如视频码流)进行编码。
应注意,电子装置320和电子装置330可包括其它组件(未示出)。举例来说,电子装置320可包括视频解码器(未示出),且电子装置330还可包括视频编码器(未示出)。其中,视频解码器用于对接收到的已编码视频数据进行解码;视频编码器用于对视频数据进行编码。
当对视频帧中的图像块进行编码时,可以使用帧间预测模式或帧内预测模式,在一个或多个已编码参考块的基础上,生成一个预测块。预测块可以是原始块的预估版本。可通过从预测块中减去该原始块来生成残差块,反之亦然,该残差块可用于表示预测残差(或称为预测误差)。由于需要用于表示预测残差的数据量,通常可能少于需要用于表示原始块的数据量,因此可以对残差块进行编码以实现较高的压缩比。例如,如图4所示,对于帧间预测模式,已编码参考块41和待编码块42位于两个不同的视频帧。如图5所示,对于帧内预测模式,已编码参考块51和待编码块52位于同一个视频帧。
接着,空间域中残差块的残差值可以转换成频域中的变换系数。该转换可以通过如类似离散余弦变化(Discrete Cosine Transform,DCT)等二维变换来实现。在变换矩阵中,低索引变换系数(如,位于左上区域)可对应于大空间特征并具有相对较大的量值;而高索引变换系数(如,位于右下区域中)可对应于小空间特征并具有相对较小的量值。进一步地,包括量化系数的量化矩阵可应用于变换矩阵,从而量化所有变换系数以成为量化的变换系数。量化的结果是,变换系数的标度或量值可能会降低。一些高索引变换系数可降为零,随后可能在后续扫描和编码步骤中被跳过。
图6示出了包括变换模块62、量化模块64以及熵编码模块66的示例性的视频编码器60的部分。尽管图6中未示出,应了解,视频编码器60中也可以包括如预测模块、去量化模块、重构模块等其他模块。在操作中,视频编码器60可以获取视频帧,视频帧可以包括多个图像块。为了简明起见,对一个图像块进行编码在这里可视为一个示例。为了对图像块进行编码,可以先生成预测块作为该图像块的估计。结合上文,预测块可以由预测模块通过帧间预测或帧内预测模式生成。接着,可以计算该图像块和预测块之间的差值以生成残差块。残差块可由变换模块62变换成变换系数。在变换期间,空间域中的残差值包括大特征和小特征,被转换成频域中的变换系数,该频域包括高频带和低频带。然后,量化模块64可使用QM来量化该变换系数,从而生成量化的变换系数。进一步地,该量化的变换系数可由熵编码模块46进行编码,最后作为比特流的一部分从视频编码器60发送。
图7示出了包括熵解码模块72、反量化(逆量化)模块74以及逆变换模块76的示例性的视频解码器70的部分。尽管图5中未示出,应了解,视频解码器70中也可以包括如预测模块、变换模块、量化模块等其他模块。在操作中,视频解码器70可以接收从视频编码器60输出的比特流,按照帧间预测或帧内预测模式来对比特流执行解码,并输出重构的视频帧。其中,熵解码模块72可通过对输入比特流执行熵解码,来生成量化的变换系数。反量化模块74可以基于QM对量化的变换系数进行反量化,得到经过反量化的变换系数。逆变换模块76对经过反量化的变换系数进行逆变换,生成重构的残差块。然后,根据重构的残差块和预测块,生成重构的图像块。
从上文可以看出,QM是视频编解码过程中必不可少的一部分。QM的配置可确定保留或滤出多少变换系数的信息,因而QM可影响编码性能以及编码质量。实际上,编码器和解码器中都需要QM。具体来说,为了正确解码图像,需要在编码器中对QM中关于量化系数的信息进行编码并将该信息从编码器中发送到解码器。在视频编解码技术和标准中,QM可能有时称为缩放矩阵或权重矩阵。因此,本文使用的术语“QM”可以是涵盖量化矩阵、缩放矩阵、权重矩阵,以及其他等效术语的通用术语。
下面,对本申请实施例中涉及的一些基本概念进行介绍说明。
1、量化矩阵
VTM(VVC Test Model,VVC测试模型)的最新版本(即VTM7)中,不仅允许正方形TB,也允许非正方形TB,导致QM数量较多。为了减少QM信令的位数和内存需求,VVC对于非正方形TB和大型正方形TB,采用了上采样和复制设计。
非正方形QM不存在于VVC比特流中,它们是通过在解码器侧复制相应的正方形QM而获得的。更具体地说,32×4QM是通过复制32×32QM的第0、8、16和24行获得的。如图8所示,通过对32×32QM进行降采样获得32×4QM,以斜线填充的行0、8、16和24从32×32QM复制到32×4QM。
当正方形TB的尺寸大于8×8时,在VTM7中相应的QM尺寸被约束为8×8。对这些8×8QM采用上采样方法以创建16×16、32×32和64×64QM。更具体地说,为了创建16×16尺寸的QM,其对应的8×8尺寸的QM中的每个元素被上采样并复制到2×2区域中;为了创建32×32尺寸的QM,其对应的8×8尺寸的QM中的每个元素被上采样并复制到4×4区域中。
需要在VTM7中编码多达28个QM。表1根据分别在表2和表3中指定的变量sizeId和matrixId确定QM的标识符变量(id)。其中,sizeId表示量化矩阵的尺寸,matrixId是根据预测模式(predMode)和颜色分量(cIdx)的QM类型标识符。
表1-根据sizeId和matrixId确定QM的id
Figure BDA0002324195760000071
Figure BDA0002324195760000081
表2-sizeId的定义规范
Figure BDA0002324195760000082
表3-matrixId的定义规范
Figure BDA0002324195760000083
在表2中,当sizeId大于3时,具有DC(Direct Current,直流)系数,DC系数是QM中(0,0)位置的元素值。在VVC中,当DC值为0时,该QM会使用默认的QM,但是该QM依然会被传输,主要原因在于未编码的QM可能需要参考该QM。当DC值不为0时,该QM会使用用户定义的QM,并采用下文介绍的编码方式进行编码后传输。
在表3中,MODE_INTRA表示帧内预测模式,MODE_INTER表示帧间预测模式,MODE_IBC表示IBC(Intra Block Copy,帧内块复制)预测模式。Y表示亮度,Cb和Cr表示色度。
2、量化矩阵编码方式
为了减少比特开销,VTM7采用帧内和帧间预测编码对28个QM进行编码。
在帧内预测模式中,DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)编码以对角扫描顺序应用于QM。DPCM帧内残差也需要在比特流中传输。示例性地,如图9所示,以4×4尺寸的QM为例,对角扫描顺序依次为(0,0),(1,0),(0,1),(2,0),(1,1),…,(2,3),(3,3)。
有2种帧间预测模式,即复制模式和预测模式。在复制模式中,要编码的当前QM与被称为参考QM的一个解码可用QM完全相同。这也意味着复制模式具有零帧间残差,当然不需要发信号通知残差。编码器应该在当前QM和其参考之间传输增量ID,使得解码器可以通过直接复制参考QM来重构当前QM。预测模式类似于复制模式,但具有额外的帧间残差。DPCM编码以对角扫描顺序应用于帧间残差,编码器需要在比特流中传输DPCM帧间残差。
如上文所述,当QM的sizeId大于3时,应用上采样算法将QM中的每个元素复制到大的正方形区域中。由于(0,0)位置的DC系数对于重构视频最重要,因此VTM7直接对其进行编码,而不是从其它QM的对应元素复制。对于每个QM,使用模式判决来计算该QM的3个候选模式(也即帧间预测模式的复制模式、帧间预测模式的预测模式和帧内预测模式)的比特成本,并且选择具有最小比特成本的一个作为最终的最优模式。然后,采用该最优模式对该QM进行编码。
3、量化矩阵信令
通过使用QM,VVC支持变换块的频率相关量化。假设QM为W,W[x][y]表示TB中位置(x,y)处的变换系数的QM权重。对于变换系数coeff[x][y],采用如下公式1计算量化的变换系数:level[x][y]:
Figure BDA0002324195760000091
其中,QP是量化参数(也可称为量化步长),offset为偏移值。W[x][y]=16表示在位置(x,y)处没有对变换系数进行加权。此外,当QM中的所有元素的值都等于16时,与不使用QM的效果相同。
SPS(Sequence Parameter Set,序列参数集)语法元素sps_scaling_list_enable_flag用于表明对于其图像报头(Picture Header,PH)已经引用该SPS的那些图像是否启用QM。当启用该标志(flag)时,也即当启用sps_scaling_list_enable_flag时,PH中的附加标志用于控制是使用所有元素都等于16的默认QM还是使用用户定义的QM。在VTM7中,用户定义的QM在APS(Adaptive Parameter Set,自适应参数集)中通知。如果在SPS和PH中启用用户定义的QM,则可以在PH中发送1个APS索引,以用于指定已引用此PH的图像的QM集。
在一个APS中,应该通知多达28组QM编码模式、Δid(增量id)、AC和DC系数。在每个APS中,28组QM按id的递增顺序进行编解码。
在VVC草案7中,QM编码模式、Δid(增量id)、AC和DC系数的语法(syntaxes)和语义(semantics)定义如下表4所示:
表4
Figure BDA0002324195760000101
scaling_list_copy_mode_flag[id]等于1表示当前QM与其参考QM的元素值相同。参考QM由scaling_list_pred_id_delta[id]表示。scaling_list_copy_mode_flag[id]等于0表示存在scaling_list_pred_mode_flag。
scaling_list_pred_mode_flag[id]等于1表示可以从参考QM预测当前QM。参考QM由scaling_list_pred_id_delta[id]表示。scaling_list_pred_mode_flag[id]等于0表示显式地发信号通知当前QM的元素值。当不存在时,scaling_list_pred_mode_flag[id]的值被推断为等于0。
scaling_list_pred_id_delta[id]表示用于推断预测QM即ScalingMatrixPred[id]的参考QM。当不存在时,scaling_list_pred_id_delta[id]的值被推断为等于0。scaling_list_pred_id_delta[id]的值应在0到maxIdDelta的范围内,maxIdDelta根据id推断,如下公式2所示:
maxIdDelta=id<2?id((id<8)?(id-2):(id-8)) 公式2
即,如果id<2,则maxIdDelta=id;如果id≥2且<8,则maxIdDelta=id-2;如果id≥8,则maxIdDelta=id-8。
变量refId和matrixSize采用如下公式计算:
refId=id-scaling_list_pred_id_delta[id] 公式3
matrixSize=(id<2)?2:((id<8)?4:8) 公式4
即,如果id<2,则matrixSize=2;如果id≥2且<8,则matrixSize=4;如果id≥8,则matrixSize=8。
matrixSize×matrixSize的QM预测矩阵表示为ScalingMatrixPred[x][y],其中,x∈[0,matrixSize-1],y∈[0,matrixSize-1],且变量ScalingMatrixDCPred表示为DC的预测值,它们具体计算如下:
当scaling_list_copy_mode_flag[id]和scaling_list_pred_mode_flag[id]都等于0时,ScalingMatrixPred的所有元素都设置为等于8,ScalingMatrixDCPred的值设置为等于8。
否则,当scaling_list_pred_id_delta[id]等于0时,将ScalingMatrixPred的所有元素都设置为等于16,并且将ScalingMatrixDCPred的值设置为等于16。
否则,当scaling_list_copy_mode_flag[id]或scaling_list_pred_mode_flag[id]等于1,且scaling_list_pred_id_delta[id]大于0时,ScalingMatrixPred设置为等于ScalingMatrixPred[refId],且ScalingMatrixDCPred的值计算如下:如果refId大于13,则ScalingMatrixDCPred的值设置为等于ScalingMatrixDCRec[refId-14];否则(即refId小于或等于13),则ScalingMatrixDCPred的值设置为等于ScalingMatrixPred[0][0]。
scaling_list_dc_coef[id-14]用在id大于13时计算变量ScalingMatrixDC[id-14]的值,如下公式5所示:
ScalingMatrixDCRec[id-14]=(ScalingMatrixDCPred+scaling_list_dc_coef[id-14]+256)%256) 公式5其中,%表示求余数。
当不存在时,scaling_list_dc_coef[id-14]的值被推断为等于0。scaling_list_dc_coef[id-14]的值应在-128到127这一范围内(包括-128和127)。ScalingMatrixDCRec[id-14]的值应该大于0。
scaling_list_delta_coef[id][i]表示当scaling_list_copy_mode_flag[id]等于0时,当前矩阵系数ScalingList[id][i]与前一个矩阵系数ScalingList[id][i-1]之间的差值。scaling_list_delta_coef[id][i]的值应在-128到127这一范围内(包括-128和127)。当scaling_list_copy_mode_flag[id]等于1时,ScalingList[id]的所有元素都设置为等于0。
matrixSize×matrixSize的QM的ScalingMatrixRec[id]可采用如下公式6计算:
ScalingMatrixRec[id][x][y]=(ScalingMatrixPred[x][y]+ScalingList[id][k]+256)%256) 公式6
其中,%表示求余数,k∈[0,(matrixSize×matrixSize-1)]。
x=DiagScanOrder[Log2(matrixSize)][Log2(matrixSize)][k][0],且
y=DiagScanOrder[Log2(matrixSize)][Log2(matrixSize)][k][1]。
ScalingMatrixRec[id][x][y]的值应大于0。
考虑一个QM的解码过程,即根据上述语法元素解码获得ScalingMatrixRec[id][x][y]和ScalingMatrixDCRec的过程。
4、通过SPS限制TB大小
在VVC草案7中,与TB大小约束相关的SPS语法和语义定义如下表5所示:
表5
Figure BDA0002324195760000121
Figure BDA0002324195760000131
sps_max_luma_transform_size_64_flag等于1表示亮度采样中的最大变换块大小等于64。sps_max_luma_transform_size_64_flag等于0表示亮度采样中的最大变换块大小等于32。
chroma_format_idc表示亮度采样对应的色度采样,如表6所示:
表6
Figure BDA0002324195760000132
在上述表6中,SubWidthC和SubHeightC分别表示色度分量对应的CTU(CodingTree Unit,编码树单元)的宽和高,Monochrome表示没有色度分量。
separate_colour_plane_flag等于1表示4:4:4色度格式的三个颜色分量分别编码。separate_colour_plane_flag等于0表示不单独编码颜色分量。当separate_colour_plane_flag不存在时,其值被推断为等于0。
当separate_colour_plane_flag等于1时,编码图像由三个单独的分量组成,每个分量由一个颜色平面(Y,Cb或Cr)的编码样本组成,并使用单色编码语法。在这种情况下,每个颜色平面都与特定的colour_plane_id值相关联。
colour_plane_id指定与PH关联的切片相关联的颜色平面,当separate_colour_plane_flag等于1时,colour_plane_id的值应在0到2的范围内(包括0和2)。colour_plane_id的值0、1和2分别对应于Y、Cb和Cr平面。需要注意的是,具有不同colour_plane_id值的图像的解码过程之间没有依赖性。
sps_log2_ctu_size_minus5加5表示每个CTU的亮度编码树块大小。sps_log2_ctu_size_minus5的值小于或等于2是比特流一致性的要求。
基于sps_log2_ctu_size_minus5可以计算出最大的亮度编码块尺寸:
CtbLog2SizeY=sps_log2_ctu_size_minus5+5
CtbSizeY=1<<CtbLog2SizeY
其中,CtbSizeY表示最大的亮度编码块尺寸,CtbLog2SizeY表示以2为底的CtbSizeY的对数,<<为左移运算符。
log2_min_luma_coding_block_size_minus2加2表示最小的亮度编码块尺寸。log2_min_luma_coding_block_size_minus2的取值范围应在0到sps_log2_ctu_size_minus5+3的范围内,包括0和sps_log2_ctu_size_minus5+3。
变量MinCbLog2SizeY、MinCbSizeY和VSize的计算过程如下:
MinCbLog2SizeY=log2_min_luma_coding_block_size_minus2+2 公式7
MinCbSizeY=1<<MinCbLog2SizeY 公式8
VSize=Min(64,CtbSizeY) 公式9
其中,MinCbSizeY表示最小的亮度编码块尺寸,MinCbLog2SizeY表示以2为底MinCbSizeY的对数,VSize表示最大的亮度编码块尺寸,<<为左移运算符。MinCbSizeY的值应小于或等于VSize。
每个色度CTB(Coding Tree Block,树形编码块)的宽和高,即变量CtbWidthC和CtbHeightC采用如下方式确定:
如果chroma_format_idc等于0(单色)或Separate_color_Plane_flag等于1,则CtbWidthC和CtbHeightC都等于0。
否则,CtbWidthC和CtbHeightC采用如下公式计算:
CtbWidthC=CtbSizeY/SubWidthC 公式10
CtbHeightC=CtbSizeY/SubHeightC 公式11
其中,CtbSizeY表示亮度CTB的尺寸。
目前VVC采用的针对量化矩阵的编码方法,全部的28个QM都会被编码并在APS中传输,这就导致QM信令需要占用较多的码字,比特开销大,而且会增加解码器端的计算复杂度。在本申请实施例提供的技术方案中,通过获取待解码视频帧对应的第一参数集,根据该第一参数集中包含的语法元素确定有效QM,该有效QM是指在编码生成该待解码视频帧的过程中针对变换系数进行量化时实际使用到的QM,然后对该有效QM进行解码。这样,编码器端仅对有效QM进行编码传输,从而有助于节省QM信令需要占用的码字,降低比特开销,且解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
需要说明的一点是,本申请实施例提供的技术方案可以应用于H.266/VCC标准或者下一代视频编解码标准中,本申请实施例对此不作限定。
还需要说明的一点是,本申请实施例提供的视频解码方法,各步骤的执行主体为解码端设备,本申请实施例提供的视频编码方法的各步骤的执行主体为编码端设备,解码端设备和编码端设备均可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备,如PC、手机、平板电脑、媒体播放器、专用视频会议设备、服务器等等。
另外,本申请所提供的方法可以单独使用或以任意顺序与其他方法合并使用。基于本申请所提供方法的编码器和解码器,可以由1个或多个处理器或是1个或多个集成电路来实现。下面,通过几个实施例对本申请技术方案进行介绍说明。
请参考图10,其示出了本申请一个实施例提供的视频解码方法的流程图。在本实施例中,主要以该方法应用于上文介绍的解码端设备中来举例说明。该方法可以包括如下几个步骤(1001~1003):
步骤1001,获取待解码视频帧对应的第一参数集。
待解码视频帧可以是待解码视频中的任意一个待解码的视频帧(或称为图像帧)。第一参数集包括用于定义QM相关的语法元素的参数集,例如,解码端设备根据该第一参数集中的语法元素,可以解码获得QM。
可选地,第一参数集为APS。当然,在一些其它实施例中,第一参数集也可以不是APS,还可以是SPS等,本申请实施例对此不作限定。
步骤1002,根据第一参数集中包含的语法元素,确定有效QM,该有效QM是指待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM。
假设针对量化的变换系数进行反量化时可能使用到的QM的数量为n,那么该有效QM的数量有可能小于n,也有可能等于n,n为正整数。例如,当针对量化的变换系数进行反量化时实际使用到全部n个QM,则有效QM的数量即为n;当针对量化的变换系数进行反量化时实际使用到全部n个QM中的部分QM(如m个QM,m为小于n的正整数),则有效QM的数量即为m。
通过在第一参数集中定义用于确定有效QM的语法元素,解码端设备通过读取该语法元素可以确定出哪些是有效QM,哪些不是有效QM。对于不是有效QM的QM(可称为无效QM),也即编码生成待解码视频帧的过程中针对变换系数进行量化时实际未使用到的QM,解码端设备可以无需对其进行解码。
可选地,对于不属于有效QM的其它QM,预定义其所有元素为默认值。可选地,该默认值为16,结合公式1,此时由于TB中所有的变换系数的伸缩量化系数都为1,所以与不使用QM的效果相同。
步骤1003,对有效QM进行解码。
在确定出有效QM之后,由于有效QM的数量有可能是一个,也有可能是多个,因此解码端设备需要分别对每个有效QM进行解码。以任意一个有效QM为例,在对该有效QM进行解码时,可以确定该有效QM对应的编码模式,然后根据该编码模式来解码该有效QM。
例如,结合上述表1,针对变换系数进行量化时可能使用到的QM的数量为28个,假设确定出其中12个为有效QM,那么解码端设备仅需对该12个有效QM进行解码即可,而无需对其余的16个无效QM进行解码。
综上所述,本申请实施例提供的技术方案中,通过获取待解码视频帧对应的第一参数集,根据该第一参数集中包含的语法元素确定有效QM,该有效QM是指在编码生成该待解码视频帧的过程中针对变换系数进行量化时实际使用到的QM,然后对该有效QM进行解码。这样,解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
在示例性实施例中,上述根据第一参数集中包含的语法元素,确定有效QM,包括如下几个子步骤:
1、根据第一参数集中包含的语法元素,确定QM的有效尺寸范围;
QM的有效尺寸范围定义了在解码过程中针对量化的变换系数进行反量化时实际使用到的QM的最小尺寸和最大尺寸。另外,QM尺寸的取值为2的指数幂,如2、4、8、16、32和64等。
2、将属于该有效尺寸范围内的QM,确定为有效QM。
例如,当QM的有效尺寸范围为[4,32]时,有效QM包括4×4尺寸的QM、8×8尺寸的QM、16×16尺寸的QM和32×32尺寸的QM。又例如,当QM的有效尺寸范围为[8,16]时,有效QM包括8×8尺寸的QM和16×16尺寸的QM。
例如,假设确定出QM的有效尺寸范围为[8,16],结合上述表1和表2,8×8尺寸的QM对应的sizeId是3,16×16尺寸的QM对应的sizeId是4,解码端设备确定id为8~19的共12个QM为有效QM,其余的id为0~7和20~27的16个QM为无效QM。
在一个示例中,采用如下方式,根据第一参数集中包含的语法元素确定QM的有效尺寸范围:
1.1、根据第一参数集中包含的语法元素,确定最小的亮度编码块尺寸、亮度编码树的块尺寸和最大的亮度TB尺寸;
可选地,在第一参数集中定义第一语法元素,该第一语法元素用于指示最小的亮度编码块尺寸;在第一参数集中定义第二语法元素,该第二语法元素用于指示亮度编码树的块尺寸;在第一参数集中定义第三语法元素,该第三语法元素用于指示最大的亮度TB尺寸。解码端设备从第一参数集中读取上述第一语法元素、第二语法元素和第三语法元素,确定最小的亮度编码块尺寸、亮度编码树的块尺寸和最大的亮度TB尺寸。
1.2、根据最小的亮度编码块尺寸、亮度编码树的块尺寸和最大的亮度TB尺寸,确定亮度QM的有效尺寸范围;其中,亮度QM的有效尺寸范围包括亮度QM的最小尺寸和最大尺寸;
可选地,解码端设备根据最小的亮度编码块尺寸,确定亮度QM的最小尺寸。例如,该最小的亮度编码块尺寸即被确定为亮度QM的最小尺寸。解码端设备将亮度编码树的块尺寸和最大的亮度TB尺寸中的较大值,确定为亮度QM的最大尺寸。例如,当亮度编码树的块尺寸大于最大的亮度TB尺寸时,该亮度编码树的块尺寸即被确定为亮度QM的最大尺寸;当亮度编码树的块尺寸小于最大的亮度TB尺寸时,该最大的亮度TB尺寸即被确定为亮度QM的最大尺寸;当亮度编码树的块尺寸等于最大的亮度TB尺寸时,由于两者相等,因此将亮度编码树的块尺寸确定为亮度QM的最大尺寸,或者将最大的亮度TB尺寸确定为亮度QM的最大尺寸,结果相同。
1.3、根据亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,色度QM的有效尺寸范围包括色度QM的最小尺寸和最大尺寸。
可选地,在第一参数集中定义第四语法元素,该第四语法元素用于指示色度分量相对于亮度分量的采样率。
可选地,解码端设备根据亮度QM的最小尺寸和色度分量相对于亮度分量的采样率,计算色度QM的最小尺寸;根据亮度QM的最大尺寸和色度分量相对于亮度分量的采样率,计算色度QM的最大尺寸。
在示例性实施例中,以第一参数集为APS为例,APS中包含的语法元素和语法结构表如下表7所示:
表7
Figure BDA0002324195760000181
Figure BDA0002324195760000191
aps_qm_size_info_present_flag表示与QM尺寸相关的语法元素是否存在于比特流中。其值为1表示QM尺寸相关的语法元素将出现在比特流中,并可以据此确定出QM的有效尺寸范围,以此来决定哪种尺寸的QM需要解码。其值为0表示QM尺寸相关的语法元素将不存在于比特流中,所有尺寸的QM都需要解码。
aps_log2_ctu_size_minus5其值加5指明亮度编码树的块尺寸。规定其值与语法元素sps_log2_ctu_size_minus5取值相同。
aps_log2_min_luma_coding_block_size_minus2其值加2指明最小的亮度编码块尺寸。规定其值与语法元素sps_log2_min_luma_coding_block_size_minus2的取值相同。
aps_max_luma_transform_size_64_flag其值为1,表示最大的亮度TB尺寸为64;其值为0,表示最大的亮度TB尺寸为32。规定其值与语法元素sps_max_luma_transform_size_64_flag的取值相同。
aps_chroma_format_idc指明色度分量相对于亮度分量的采样率,具体如表6所示。规定其值与语法元素chroma_format_idc的取值相同。
基于上述语法元素,变量minQMSizeY(表示亮度QM的最小尺寸)和maxQMSizeY(表示亮度QM的最大尺寸)的推导过程如下:
当语法元素aps_qm_size_info_present_flag的值为1时,
minQMSizeY=1<<(aps_log2_min_luma_coding_block_size_minus2+2) 公式12
maxQMSizeY=max(1<<(aps_log2_ctu_size_minus5+5),aps_max_luma_transform_size_64_flag?64:32) 公式13
其中,<<为左移运算符,?:为三目条件运算符。
当语法元素aps_qm_size_info_present_flag的值为0时,
minQMSizeY=4;
maxQMSizeY=64。
变量minQMSizeUV(表示色度QM的最小尺寸)和maxQMSizeUV(表示色度QM的最大尺寸)的推导过程如下:
当语法元素aps_qm_size_info_present_flag的值为1时,
minQMSizeUV=(!aps_chroma_format_idc)?0:minQMSizeY/SubWidthC 公式14
maxQMSizeUV=(!aps_chroma_format_idc)?0:maxQMSizeY/SubHeightC 公式15
其中,!表示逻辑非运算,?:为三目条件运算符。
上述公式14和公式15释义如下:
如果不存在aps_chroma_format_idc,则minQMSizeUV=0;反之,minQMSizeUV=minQMSizeY/SubWidthC;
如果不存在aps_chroma_format_idc,则maxQMSizeUV=0;反之,maxQMSizeUV=maxQMSizeY/SubHeightC。
当语法元素aps_qm_size_info_present_flag的值为0时,
minQMSizeUV=2;
maxQMSizeUV=32。
在表7所示的语法结构表中,变量cIdx表示当前QM对应的色彩分量。对于亮度分量Y,其值为0;对于色度Cb,其值为1;对于色度Cr,其值为2。变量matrixSize表示当前QM的实际编码尺寸,由表2第3列指明。变量matrixQMSize表示与当前QM相对应的TB尺寸,由表1和表2指明。
在表7所示的语法结构表中,解码端设备先对本申请提出的2个条件进行判断,然后决定是否对当前QM进行解码。以确定第一QM是否为有效QM为例(该第一QM可以是任意一个可用的QM,即上述全部28个QM中的任意一个),若第一QM满足第一条件和第二条件其中之一,则确定该第一QM为有效QM。
其中,第一条件为(cIdx==0&&(matrixQMSize>=minQMSizeY&&matrixQMSize<=maxQMSizeY),该第一条件表示第一QM属于亮度分量,其用于亮度TB的量化过程;且第一QM在亮度QM的有效尺寸范围[MinQMSizeY,MaxQMSizeY]内,MinQMSizeY表示亮度QM的最小尺寸,MaxQMSizeY表示亮度QM的最大尺寸。第二条件为(cIdx!=0&&(matrixQMSize>=minQMSizeUV&&matrixQMSize<=maxQMSizeUV),第二条件表示第一QM属于色度分量,其用于色度TB的量化过程;且第一QM在色度QM的有效尺寸范围[MinQMSizeUV,MaxQMSizeUV]内,MinQMSizeUV表示色度QM的最小尺寸,MaxQMSizeUV表示色度QM的最大尺寸。
在上述示例中,解码端设备需要基于第一参数集中包含的语法元素,计算出QM的有效尺寸范围,然后根据该有效尺寸范围确定出有效QM。在下文介绍的示例中,也可以直接在第一参数集中定义亮度QM的有效尺寸范围的语法元素,解码端设备读取该语法元素后即可直接获得亮度QM的有效尺寸范围,然后根据该亮度QM的有效尺寸范围结合色度格式,确定出色度QM的有效尺寸范围。具体如下:
在另一个示例中,采用如下方式,根据第一参数集中包含的语法元素确定QM的有效尺寸范围:
1.1、根据第一参数集中包含的语法元素,确定亮度QM的有效尺寸范围;其中,亮度QM的有效尺寸范围包括亮度QM的最小尺寸和最大尺寸;
可选地,在第一参数集中定义第五语法元素,该第五语法元素用于指示亮度QM的最小尺寸;在APS中定义第六语法元素,该第五语法元素用于指示亮度QM的最大尺寸。解码端设备从第一参数集中读取上述第五语法元素和第六语法元素,确定亮度QM的最小尺寸和最大尺寸。
1.2、根据亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,色度QM的有效尺寸范围包括色度QM的最小尺寸和最大尺寸。
可选地,在第一参数集中定义第四语法元素,该第四语法元素用于指示色度分量相对于亮度分量的采样率。
可选地,解码端设备根据亮度QM的最小尺寸和色度分量相对于亮度分量的采样率,计算色度QM的最小尺寸;根据亮度QM的最大尺寸和色度分量相对于亮度分量的采样率,计算色度QM的最大尺寸。
在示例性实施例中,以第一参数集为APS为例,APS中包含的语法元素和语法结构表如下表8所示:
表8
Figure BDA0002324195760000221
aps_qm_size_info_present_flag表示与QM尺寸相关的语法元素是否存在于比特流中。其值为1表示QM尺寸相关的语法元素将出现在比特流中,并可以据此确定出QM的有效尺寸范围,以此来决定哪种尺寸的QM需要解码。其值为0表示QM尺寸相关的语法元素将不存在于比特流中,所有尺寸的QM都需要解码。
aps_log2_min_luma_qm_size_minus2其值加2指明亮度QM的最小尺寸。
aps_log2_max_luma_qm_size_minus5其值加5指明亮度QM的最大尺寸。
基于上述语法元素,变量minQMSizeY(表示亮度QM的最小尺寸)和maxQMSizeY(表示亮度QM的最大尺寸)的推导过程如下:
当语法元素aps_qm_size_info_present_flag的值为1时,
minQMSizeY=1<<(aps_log2_min_luma_qm_size_minus2+2) 公式16
maxQMSizeY=1<<(aps_log2_max_luma_qm_size_minus5+5) 公式17
其中,<<为左移运算符。
当aps_qm_size_info_present_flag的值为1时,规定minQMSizeY和maxQMSizeY分别与通过SPS语法元素计算得到TB尺寸变量MinCbSizeY和VSize取值相同。
当语法元素aps_qm_size_info_present_flag的值为0时,
minQMSizeY=4;
maxQMSizeY=64。
aps_chroma_format_idc指明色度分量相对于亮度分量的采样率,具体如表6所示。规定其值与语法元素chroma_format_idc的取值相同。
变量minQMSizeUV(表示色度QM的最小尺寸)和maxQMSizeUV(表示色度QM的最大尺寸)的推导过程如下:
当语法元素aps_qm_size_info_present_flag的值为1时,
minQMSizeUV=(!aps_chroma_format_idc)?0:minQMSizeY/SubWidthC 公式18
maxQMSizeUV=(!aps_chroma_format_idc)?0:maxQMSizeY/SubHeightC 公式19
其中,!表示逻辑非运算,?:为三目条件运算符。
当语法元素aps_qm_size_info_present_flag的值为0时,
minQMSizeUV=2;
maxQMSizeUV=32。
在一些其它示例中,解码端设备也可以根据SPS中包含的语法元素,确定有效QM。具体地,解码端设备可以根据SPS中包含的语法元素,计算亮度QM的有效尺寸范围[MinQMSizeY,MaxQMSizeY]和色度QM的有效尺寸范围[MinQMSizeUV,MaxQMSizeUV]。其中,变量MinQMSizeY表示亮度QM的最小尺寸,变量MaxQMSizeY表示亮度QM的最大尺寸,变量MinQMSizeUV表示色度QM的最小尺寸,变量MaxQMSizeUV表示色度QM的最大尺寸。
结合参考上述表5示出的SPS语法结构表,上述变量可以通过如下公式计算得到:
MinQMSizeY=1<<(log2_min_luma_coding_block_size_minus2+2) 公式20
MaxQMSizeY=max(1<<(sps_log2_ctu_size_minus5+5),sps_max_luma_transform_size_64_flag?64:32) 公式21
MinQMSizeUV=(!chroma_format_idc)?0:MinQMSizeY/SubWidthC 公式22
MaxQMSizeUV=(!chroma_format_idc)?0:MaxQMSizeY/SubHeightC 公式23
其中,<<为左移运算符,!表示逻辑非运算,?:为三目条件运算符。
相比于根据SPS中包含的语法元素来确定有效QM,通过在APS中定义相关的语法元素,根据该APS中定义的相关语法元素来确定有效QM,可以消除APS和SPS码流之间的分析依赖性(parsing dependency),使得APS的解码不需要依赖SPS的语法元素。
在示例性实施例中,上述根据第一参数集中包含的语法元素,确定有效QM,包括如下几个子步骤:
1、从第一参数集中读取第一QM对应的标志语法元素的值;
2、若第一QM对应的标志语法元素的值为第一数值,则确定第一QM属于有效QM;
3、若第一QM对应的标志语法元素的值为第二数值,则确定第一QM不属于有效QM。
在本实施例中,通过在APS中定义一个标志语法元素,通过该标志语法元素来指示QM是否属于有效QM。该标志语法元素的描述符可以是u(1),表示1位无符号整数。例如,该标志语法元素的值为1,表示QM属于有效QM,需要对其进行解码;该标志语法元素的值为0,表示QM不属于有效QM,不需要对其进行解码。对于没有进行解码的QM,预定义其所有元素为默认值。可选地,该默认值为16,结合公式1,此时由于TB中所有的变换系数的伸缩量化系数都为1,所以与不使用QM的效果相同。
另外,第一QM可以是任意一个可用的QM,即上述全部28个QM中的任意一个。
可选地,第一参数集为APS。当然,在一些其它实施例中,第一参数集也可以不是APS,本申请实施例对此不作限定。
在示例性实施例中,以第一参数集为APS为例,APS中包含的语法元素和语法结构表如下表9所示:
表9
Figure BDA0002324195760000251
可选地,上述标志语法元素为scaling_matrix_present_flag。scaling_matrix_present_flag[id]其值为1,表示当前QM需要解码;其值为0,表示当前QM不需要解码,解码端设备可以推测出该QM的所有元素为16。
可选地,亮度QM对应1个标志语法元素,表示该亮度QM是否需要解码。对于具有相同预测模式和相同尺寸的第一色度QM(即Cb对应的QM)和第二色度QM(即Cr对应的QM),共用同一个标志语法元素,表示该第一色度QM和第二色度QM是否需要解码。也即第一色度QM和第二色度QM不需要各自分别单独使用1个标志语法元素,这有助于进一步节省QM编码信令的比特开销。
在示例性实施例中,以第一参数集为APS为例,APS中包含的语法元素和语法结构表如下表10所示:
表10
Figure BDA0002324195760000261
scaling_matrix_present_flag[predMode!=MODE_INTRA][cIdx!=0][sizeId]的值为1时,当解码为亮度QM时,表示在APS中编码该亮度QM;当解码为色度QM时,表示在APS中编码预测模式为predMode且尺寸相同的色度Cb和Cr对应的QM。此语法元素的值为0时,表示亮度QM或两个色度QM不需要解码,解码端设备可以推测出它们的元素都为16。
需要说明的一点是,对于编码端设备来说,在设定各个QM对应的标志语法元素的值时,也即在确定哪些QM需要编码,哪些QM不需要编码时,可以依据QM的尺寸,也可以依据QM对应的编码预测模式,还可以依据QM对应的YUV颜色分量,或者结合QM的尺寸、编码预测模式和YUV颜色分量中的多种因素进行综合考虑,本申请实施例对此不作限定。
在本实施例中,通过在第一参数集中定义一个标志语法元素,通过该标志语法元素来指示QM是否属于有效QM,从而可以更加灵活地指示各个QM是否需要进行解码。
请参考图11,其示出了本申请一个实施例提供的视频编码方法的流程图。在本实施例中,主要以该方法应用于上文介绍的编码端设备中来举例说明。该方法可以包括如下几个步骤(1101~1102):
步骤1101,确定待编码视频帧对应的有效QM,该有效QM是指待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM。
待编码视频帧可以是待编码视频中的任意一个待编码的视频帧(或称为图像帧)。
假设针对变换系数进行量化时可能使用到的QM的数量为n,那么该有效QM的数量有可能小于n,也有可能等于n,n为正整数。例如,当针对变换系数进行量化时实际使用到全部n个QM,则有效QM的数量即为n;当针对变换系数进行量化时实际使用到全部n个QM中的部分QM(如m个QM,m为小于n的正整数),则有效QM的数量即为m。
可选地,对于不属于有效QM的其它QM,预定义其所有元素为默认值。可选地,该默认值为16,结合公式1,此时由于TB中所有的变换系数的伸缩量化系数都为1,所以与不使用QM的效果相同。
步骤1102,对用于确定该有效QM的语法元素和有效QM进行编码,生成第一参数集对应的码流;其中,第一参数集包括用于定义QM相关的语法元素的参数集。
在确定出有效QM之后,由于有效QM的数量有可能是一个,也有可能是多个,因此编码端设备需要分别对每个有效QM进行编码。以任意一个有效QM为例,在对该有效QM进行编码时,可以确定该有效QM对应的最优模式,然后根据该最优模式来编码该有效QM;其中,最优模式可以是从上文介绍的帧间预测模式的复制模型、帧间预测模式的预测模式和帧内预测模式这3种候选模式中选取的比特成本最小的模式。
例如,结合上述表1,针对变换系数进行量化时可能使用到的QM的数量为28个,假设确定出其中12个为有效QM,那么编码端设备仅需对该12个有效QM进行编码即可,而无需对其余的16个无效QM进行编码。
另外,编码端设备除了需要对有效QM进行编码之外,还需要对用于确定有效QM的语法元素进行编码,以便解码端设备根据该语法元素确定出有效QM。编码端设备对用于确定有效QM的语法元素和有效QM进行编码,生成第一参数集对应的码流,该第一参数集可以是APS,也可以是其它用于定义QM相关的语法元素的参数集,本申请实施例对此不作限定。
综上所述,本申请实施例提供的技术方案中,通过确定待编码视频帧对应的有效QM,该有效QM是指该待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM,然后对用于确定该有效QM的语法元素和有效QM进行编码,生成第一参数集对应的码流。这样,编码器端仅对有效QM进行编码传输,从而有助于节省QM信令需要占用的码字,降低比特开销,且解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
另外,编码端设备的编码过程与解码端设备的解码过程相对应,对于编码过程中未详细说明的细节,可参见上文关于解码过程实施例中的介绍说明,此处不再赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图12,其示出了本申请一个实施例提供的视频解码装置的框图。该装置具有实现上述视频解码方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的解码端设备,也可以设置在解码端设备上。该装置1200可以包括:参数获取模块1210、QM确定模块1220和QM解码模块1230。
参数获取模块1210,用于获取待解码视频帧对应的第一参数集,所述第一参数集是用于定义QM相关的语法元素的参数集。
QM确定模块1220,用于根据所述第一参数集中包含的语法元素,确定有效QM,所述有效QM是指所述待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM。
QM解码模块1230,用于对所述有效QM进行解码。
在示例性实施例中,如图13所示,所述QM确定模块1220,包括:范围确定单元1221和QM确定单元1222。
范围确定单元1221,用于根据所述第一参数集中包含的语法元素,确定QM的有效尺寸范围。
QM确定单元1222,用于将属于所述有效尺寸范围内的QM,确定为所述有效QM。
在示例性实施例中,所述范围确定单元1221,用于:
根据所述第一参数集中包含的语法元素,确定最小的亮度编码块尺寸、亮度编码树的块尺寸和最大的亮度TB尺寸;
根据所述最小的亮度编码块尺寸、所述亮度编码树的块尺寸和所述最大的亮度TB尺寸,确定亮度QM的有效尺寸范围;其中,所述亮度QM的有效尺寸范围包括所述亮度QM的最小尺寸和最大尺寸;
根据所述亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,所述色度QM的有效尺寸范围包括所述色度QM的最小尺寸和最大尺寸。
在示例性实施例中,所述范围确定单元1221,用于:
根据所述最小的亮度编码块尺寸,确定所述亮度QM的最小尺寸;
将所述亮度编码树的块尺寸和所述最大的亮度TB尺寸中的较大值,确定为所述亮度QM的最大尺寸。
在示例性实施例中,所述范围确定单元1221,用于:
根据所述第一参数集中包含的语法元素,确定亮度QM的有效尺寸范围;其中,所述亮度QM的有效尺寸范围包括所述亮度QM的最小尺寸和最大尺寸;
根据所述亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,所述色度QM的有效尺寸范围包括所述色度QM的最小尺寸和最大尺寸。
在示例性实施例中,所述范围确定单元1221,用于:
根据所述亮度QM的最小尺寸和所述色度分量相对于亮度分量的采样率,计算所述色度QM的最小尺寸;
根据所述亮度QM的最大尺寸和所述色度分量相对于亮度分量的采样率,计算所述色度QM的最大尺寸。
在示例性实施例中,所述QM确定单元1222,用于:
若第一QM满足第一条件和第二条件其中之一,则确定所述第一QM为所述有效QM;
其中,所述第一条件为(cIdx==0&&(matrixQMSize>=minQMSizeY&&matrixQMSize<=maxQMSizeY),所述第一条件表示所述第一QM属于亮度分量,其用于亮度TB的量化过程;且所述第一QM在所述亮度QM的有效尺寸范围[MinQMSizeY,MaxQMSizeY]内,所述MinQMSizeY表示所述亮度QM的最小尺寸,所述MaxQMSizeY表示所述亮度QM的最大尺寸;
所述第二条件为(cIdx!=0&&(matrixQMSize>=minQMSizeUV&&matrixQMSize<=maxQMSizeUV),所述第二条件表示所述第一QM属于色度分量,其用于色度TB的量化过程;且所述第一QM在所述色度QM的有效尺寸范围[MinQMSizeUV,MaxQMSizeUV]内,所述MinQMSizeUV表示所述色度QM的最小尺寸,所述MaxQMSizeUV表示所述色度QM的最大尺寸。
在示例性实施例中,如图13所示,所述QM确定模块1220,包括:元素读取单元1223和QM判定单元1224。
元素读取单元1223,用于从所述第一参数集中读取第一QM对应的标志语法元素的值。
QM判定单元1224,用于若所述第一QM对应的标志语法元素的值为第一数值,则确定所述第一QM属于所述有效QM;若所述第一QM对应的标志语法元素的值为第二数值,则确定所述第一QM不属于所述有效QM。
在示例性实施例中,具有相同预测模式和相同尺寸的第一色度QM和第二色度QM,共用同一个标志语法元素。
在示例性实施例中,所述标志语法元素为scaling_matrix_present_flag。
在示例性实施例中,所述第一参数集为APS。
在示例性实施例中,对于不属于所述有效QM的其它QM,预定义其所有元素为默认值。
在示例性实施例中,所述默认值为16。
综上所述,本申请实施例提供的技术方案中,通过获取待解码视频帧对应的第一参数集,根据该第一参数集中包含的语法元素确定有效QM,该有效QM是指在编码生成该待解码视频帧的过程中针对变换系数进行量化时实际使用到的QM,然后对该有效QM进行解码。这样,解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
请参考图14,其示出了本申请一个实施例提供的视频编码装置的框图。该装置具有实现上述视频编码方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的编码端设备,也可以设置在编码端设备上。该装置1400可以包括:QM确定模块1410和QM编码模块1420。
QM确定模块1410,用于确定待编码视频帧对应的有效QM,所述有效QM是指所述待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM。
QM编码模块1420,用于对用于确定所述有效QM的语法元素和所述有效QM进行编码,生成第一参数集对应的码流;其中,所述第一参数集是用于定义QM相关的语法元素的参数集。
综上所述,本申请实施例提供的技术方案中,通过确定待编码视频帧对应的有效QM,该有效QM是指该待编码视频帧的编码过程中针对变换系数进行量化时实际使用到的QM,然后对用于确定该有效QM的语法元素和有效QM进行编码,生成第一参数集对应的码流。这样,编码器端仅对有效QM进行编码传输,从而有助于节省QM信令需要占用的码字,降低比特开销,且解码器端仅需对有效QM进行解码,从而降低解码器端的计算复杂度。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图15,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以是上文介绍的编码端设备,也可以是上文介绍的解码端设备。该计算机设备150可以包括:处理器151、存储器152、通信接口153、编码器/解码器154和总线155。
处理器151包括一个或者一个以上处理核心,处理器151通过运行软件程序以及模块,从而执行各种功能应用以及信息处理。
存储器152可用于存储计算机程序,处理器151用于执行该计算机程序,以实现上述视频编码方法,或者实现上述视频解码方法。
通信接口153可用于与其它设备进行通信,如收发音视频数据。
编码器/解码器154可用于实现编码和解码功能,如对音视频数据进行编码和解码。
存储器152通过总线155与处理器151相连。
此外,存储器152可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘或光盘,EEPROM(ElectricallyErasable Programmable Read-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read-Only Memory,可擦除可编程只读存储器),SRAM(StaticRandom-Access Memory,静态随时存取存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,PROM(Programmable read-only memory,可编程只读存储器)。
本领域技术人员可以理解,图15中示出的结构并不构成对计算机设备150的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时实现上述视频解码方法,或者实现上述视频编码方法。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被处理器执行时,其用于实现上述视频解码方法,或者实现上述视频编码方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种视频解码方法,其特征在于,所述方法包括:
获取待解码视频帧对应的第一参数集,所述第一参数集包括用于定义量化矩阵QM相关的语法元素的参数集;
根据所述第一参数集中包含的第一标志语法元素,确定有效QM;所述第一标志语法元素用于表示色度QM是否需要解码,所述有效QM是指所述待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM;
对所述有效QM进行解码,包括:根据色度分量相对于亮度分量的采样率,确定所述第一标志语法元素的取值;当所述色度分量相对于亮度分量的采样率为4:0:0时,所述第一标志语法元素的值为0,表示所述色度QM不需要解码,且推测所述色度QM的元素都为16。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述第一参数集中包含的语法元素,确定QM的有效尺寸范围;
将属于所述有效尺寸范围内的QM,确定为所述有效QM。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一参数集中包含的语法元素,确定QM的有效尺寸范围,包括:
根据所述第一参数集中包含的语法元素,确定最小的亮度编码块尺寸、亮度编码树的块尺寸和最大的亮度变换块尺寸;
根据所述最小的亮度编码块尺寸、所述亮度编码树的块尺寸和所述最大的亮度变换块尺寸,确定亮度QM的有效尺寸范围;其中,所述亮度QM的有效尺寸范围包括所述亮度QM的最小尺寸和最大尺寸;
根据所述亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,所述色度QM的有效尺寸范围包括所述色度QM的最小尺寸和最大尺寸。
4.根据权利要求3所述的方法,其特征在于,所述根据所述最小的亮度编码块尺寸、所述亮度编码树的块尺寸和所述最大的亮度变换块尺寸,确定亮度QM 的有效尺寸范围,包括:
根据所述最小的亮度编码块尺寸,确定所述亮度QM的最小尺寸;
将所述亮度编码树的块尺寸和所述最大的亮度变换块尺寸中的较大值,确定为所述亮度QM的最大尺寸。
5.根据权利要求2所述的方法,其特征在于,所述根据所述第一参数集中包含的语法元素,确定QM的有效尺寸范围,包括:
根据所述第一参数集中包含的语法元素,确定亮度QM的有效尺寸范围;其中,所述亮度QM的有效尺寸范围包括所述亮度QM的最小尺寸和最大尺寸;
根据所述亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围;其中,所述色度QM的有效尺寸范围包括所述色度QM的最小尺寸和最大尺寸。
6.根据权利要求3或5所述的方法,其特征在于,所述根据所述亮度QM的有效尺寸范围和色度分量相对于亮度分量的采样率,确定色度QM的有效尺寸范围,包括:
根据所述亮度QM的最小尺寸和所述色度分量相对于亮度分量的采样率,计算所述色度QM的最小尺寸;
根据所述亮度QM的最大尺寸和所述色度分量相对于亮度分量的采样率,计算所述色度QM的最大尺寸。
7.根据权利要求3或5所述的方法,其特征在于,所述方法还包括:
若第一QM满足第一条件和第二条件其中之一,则确定所述第一QM为所述有效QM;
其中,所述第一条件为cIdx==0&&(matrixQMSize>=minQMSizeY&&matrixQMSize<=maxQMSizeY),所述第一条件表示所述第一QM属于亮度分量,其用于亮度变换块的量化过程;且所述第一QM在所述亮度QM的有效尺寸范围[MinQMSizeY,MaxQMSizeY]内,所述MinQMSizeY表示所述亮度QM的最小尺寸,所述MaxQMSizeY表示所述亮度QM的最大尺寸;
所述第二条件为cIdx!=0&&(matrixQMSize>=minQMSizeUV&& matrixQMSize<=maxQMSizeUV),所述第二条件表示所述第一QM属于色度分量,其用于色度变换块的量化过程;且所述第一QM在所述色度QM的有效尺寸范围[MinQMSizeUV,MaxQMSizeUV]内,所述MinQMSizeUV表示所述色度QM的最小尺寸,所述MaxQMSizeUV表示所述色度QM的最大尺寸。
8.根据权利要求1所述的方法,其特征在于,所述根据所述方法还包括:
从所述第一参数集中读取第一QM对应的标志语法元素的值;
若所述第一QM对应的标志语法元素的值为第一数值,则确定所述第一QM属于所述有效QM;
若所述第一QM对应的标志语法元素的值为第二数值,则确定所述第一QM不属于所述有效QM。
9.根据权利要求1-5和8中任一项所述的方法,其特征在于,所述第一标志语法元素为scaling_matrix_present_flag,具有相同预测模式和相同尺寸的第一色度QM和第二色度QM,共用所述第一标志语法元素,表示该所述第一色度QM和第二色度QM是否需要解码。
10.根据权利要求1-5和8中任一项所述的方法,其特征在于,所述第一参数集为自适应参数集APS。
11.根据权利要求1-5和8中任一项所述的方法,其特征在于,对于不属于所述有效QM的其它QM,预定义其所有元素为默认值。
12.根据权利要求11所述的方法,其特征在于,所述默认值为16。
13.一种视频解码装置,其特征在于,所述装置包括:
参数获取模块,用于获取待解码视频帧对应的第一参数集,所述第一参数集包括用于定义量化矩阵QM相关的语法元素的参数集;
QM确定模块,用于根据所述第一参数集中包含的第一标志语法元素,确定有效QM;所述第一标志语法元素用于表示色度QM是否需要解码,所述有效QM是指所述待解码视频帧的解码过程中针对量化的变换系数进行反量化时实际使用到的QM;
QM解码模块,用于对所述有效QM进行解码,包括:根据色度分量相对于亮度分量的采样率,确定所述第一标志语法元素的取值;当所述色度分量相对于亮度分量的采样率为4:0:0时,所述第一标志语法元素的值为0,表示所述色度QM不需要解码,且推测所述色度QM的元素都为16。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至12任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至12任一项所述的方法。
CN201911309768.6A 2019-12-18 2019-12-18 视频解码方法、装置、设备及存储介质 Active CN111050171B (zh)

Priority Applications (10)

Application Number Priority Date Filing Date Title
CN202211386430.2A CN115720265B (zh) 2019-12-18 2019-12-18 视频编解码方法、装置、设备及存储介质
CN201911309768.6A CN111050171B (zh) 2019-12-18 2019-12-18 视频解码方法、装置、设备及存储介质
EP20902574.1A EP3975558A4 (en) 2019-12-18 2020-12-08 VIDEO DECODING METHOD, VIDEO ENCODING METHOD, DEVICE AND FACILITIES, AND STORAGE MEDIA
PCT/CN2020/134581 WO2021121080A1 (zh) 2019-12-18 2020-12-08 视频解码方法、视频编码方法、装置、设备及存储介质
KR1020247026780A KR20240127485A (ko) 2019-12-18 2020-12-08 비디오 디코딩 방법, 비디오 코딩 방법, 디바이스 및 장치, 저장 매체
JP2022515567A JP2022548354A (ja) 2019-12-18 2020-12-08 ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体
KR1020227008146A KR102695010B1 (ko) 2019-12-18 2020-12-08 비디오 디코딩 방법, 비디오 코딩 방법, 디바이스 및 장치, 저장 매체
US17/506,784 US12034950B2 (en) 2019-12-18 2021-10-21 Video decoding method and apparatus, video encoding method and apparatus, device, and storage medium
US18/663,766 US20240305804A1 (en) 2019-12-18 2024-05-14 Video decoding method and apparatus, video encoding method and apparatus, device, and storage medium
JP2024119640A JP2024138096A (ja) 2019-12-18 2024-07-25 ビデオ復号方法、ビデオ符号化方法、装置、機器及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911309768.6A CN111050171B (zh) 2019-12-18 2019-12-18 视频解码方法、装置、设备及存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211386430.2A Division CN115720265B (zh) 2019-12-18 2019-12-18 视频编解码方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111050171A CN111050171A (zh) 2020-04-21
CN111050171B true CN111050171B (zh) 2022-10-11

Family

ID=70237824

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211386430.2A Active CN115720265B (zh) 2019-12-18 2019-12-18 视频编解码方法、装置、设备及存储介质
CN201911309768.6A Active CN111050171B (zh) 2019-12-18 2019-12-18 视频解码方法、装置、设备及存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211386430.2A Active CN115720265B (zh) 2019-12-18 2019-12-18 视频编解码方法、装置、设备及存储介质

Country Status (6)

Country Link
US (2) US12034950B2 (zh)
EP (1) EP3975558A4 (zh)
JP (2) JP2022548354A (zh)
KR (2) KR20240127485A (zh)
CN (2) CN115720265B (zh)
WO (1) WO2021121080A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115720265B (zh) * 2019-12-18 2024-08-09 腾讯科技(深圳)有限公司 视频编解码方法、装置、设备及存储介质
CN111147858B (zh) 2019-12-31 2024-02-27 腾讯科技(深圳)有限公司 视频解码方法、装置、设备及存储介质
CN115552900A (zh) * 2020-02-21 2022-12-30 阿里巴巴集团控股有限公司 用信号通知最大变换大小和残差编码的方法
AU2020203330B2 (en) * 2020-05-21 2022-12-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a block of video samples

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8588295B2 (en) * 2009-03-09 2013-11-19 Mediatek Inc. Methods and electronic devices for quantization and de-quantization
JP2010288166A (ja) * 2009-06-15 2010-12-24 Panasonic Corp 動画像符号化装置、放送波記録装置及び、プログラム
EP2495973B1 (en) * 2009-10-30 2019-02-27 Sun Patent Trust Decoding method, decoder apparatus, encoding method, and encoder apparatus
KR20190069613A (ko) * 2011-02-10 2019-06-19 벨로스 미디어 인터내셔널 리미티드 화상 처리 장치 및 화상 처리 방법
WO2012134046A2 (ko) * 2011-04-01 2012-10-04 주식회사 아이벡스피티홀딩스 동영상의 부호화 방법
CA2836161C (en) * 2011-08-23 2017-12-19 Mediatek Singapore Pte. Ltd. Method and system of transform block processing according to quantization matrix in video coding
CN108924571B (zh) * 2012-01-20 2021-09-07 韩国电子通信研究院 使用量化矩阵的视频编解码方法
WO2013154028A1 (ja) * 2012-04-13 2013-10-17 ソニー株式会社 画像処理装置および方法
WO2013158669A1 (en) * 2012-04-16 2013-10-24 Huawei Technologies Co., Ltd. Method and apparatus of quantization matrix coding
JP6210368B2 (ja) * 2012-09-18 2017-10-11 サン パテント トラスト 画像復号方法および画像復号装置
US10827173B2 (en) * 2017-11-13 2020-11-03 Electronics And Telecommunications Research Institute Method and apparatus for quantization
CA3094608A1 (en) * 2018-03-28 2019-10-03 Sony Corporation Image processing device and image processing method
CN110536133B (zh) 2018-05-24 2021-11-19 华为技术有限公司 视频数据解码方法及装置
CN115720265B (zh) * 2019-12-18 2024-08-09 腾讯科技(深圳)有限公司 视频编解码方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP2022548354A (ja) 2022-11-18
KR20240127485A (ko) 2024-08-22
US20220046260A1 (en) 2022-02-10
EP3975558A4 (en) 2023-04-19
WO2021121080A1 (zh) 2021-06-24
KR20220044352A (ko) 2022-04-07
US20240305804A1 (en) 2024-09-12
US12034950B2 (en) 2024-07-09
JP2024138096A (ja) 2024-10-07
CN111050171A (zh) 2020-04-21
CN115720265A (zh) 2023-02-28
KR102695010B1 (ko) 2024-08-12
EP3975558A1 (en) 2022-03-30
CN115720265B (zh) 2024-08-09

Similar Documents

Publication Publication Date Title
CN111050171B (zh) 视频解码方法、装置、设备及存储介质
US7373009B2 (en) Method and apparatus for efficient transmission and decoding of quantization matrices
CN113545091B (zh) 对视频序列执行最大变换大小控制的解码方法和装置
TW201711470A (zh) 用於高動態範圍及廣色域視訊寫碼之自適應常數照度方法
CN118433413A (zh) 视频解码方法、计算机系统和电子设备
US20220201278A1 (en) Image or video coding based on palette coding
CN118540503A (zh) 图像解码设备、图像编码设备和发送设备
US20220046253A1 (en) Video encoding and decoding methods and apparatuses, device, and storage medium
JP2024102338A (ja) ピクチャヘッダを含む映像情報をコーディングする映像デコーディング方法及びその装置
EP4040792A1 (en) Image or video coding based on signaling of transform skip- and palette coding-related information
US11968366B2 (en) Video encoding method and apparatus, video decoding method and apparatus, device, and storage medium
US20220353506A1 (en) Image or video coding based on transform skip- and palette coding-related advanced syntax element
JP2023529854A (ja) ビデオビットストリームの各レイヤ表現のための値の導出
KR20220110840A (ko) 적응적 루프 필터링 기반 영상 코딩 장치 및 방법
US20220321887A1 (en) Image or video coding on basis of transform skip - and palette coding-related data
US11575937B2 (en) Methods for efficient application of LGT
RU2814221C2 (ru) Кодирование изображения или видео на основе режима палитры
KR20240089011A (ko) 선택 가능한 뉴럴 네트워크 기반 코딩 도구를 사용하는 비디오 코딩
CN118511532A (zh) 传输视频编码的通用约束信息
KR20240051256A (ko) 비디오 처리를 위한 방법, 장치 및 매체
WO2023132991A1 (en) Signaling general constraints information for video coding
CN116248901A (zh) 用于图像编解码方法的编解码设备和发送图像数据的设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021740

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant