CN112533000A - 视频解码方法、装置、计算机可读介质及电子设备 - Google Patents

视频解码方法、装置、计算机可读介质及电子设备 Download PDF

Info

Publication number
CN112533000A
CN112533000A CN202011112822.0A CN202011112822A CN112533000A CN 112533000 A CN112533000 A CN 112533000A CN 202011112822 A CN202011112822 A CN 202011112822A CN 112533000 A CN112533000 A CN 112533000A
Authority
CN
China
Prior art keywords
index
transform
coding
block
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011112822.0A
Other languages
English (en)
Other versions
CN112533000B (zh
Inventor
王力强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011112822.0A priority Critical patent/CN112533000B/zh
Publication of CN112533000A publication Critical patent/CN112533000A/zh
Priority to PCT/CN2021/119492 priority patent/WO2022078163A1/zh
Priority to EP21879209.1A priority patent/EP4113997A4/en
Application granted granted Critical
Publication of CN112533000B publication Critical patent/CN112533000B/zh
Priority to US17/958,200 priority patent/US20230024834A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请的实施例提供了一种视频解码方法、装置、计算机可读介质及电子设备。该视频解码方法包括:对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;统计所述量化系数块中的量化系数,得到隐含导出索引值;根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。本申请实施例的技术方案可以有效提高视频编码效率。

Description

视频解码方法、装置、计算机可读介质及电子设备
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及一种视频解码方法、装置、计算机可读介质及电子设备。
背景技术
在视频编码过程中,编码端通常需要对原始视频数据与预测视频数据之间的残差数据进行变换、量化及熵编码处理之后发送给解码端。并且也有部分残差的相关性较弱,进而可能会跳过变换过程。由于残差数据的多样性,单一的DCT(Discrete CosineTransform,离散余弦变换)变换核无法适应所有的残差特性,因此对于一个残差块可能需要选择多个DCT变换核或DST(Discrete Sine Transform,离散正弦变换)变换核作为变换矩阵组合,在这种情况下,虽然提升了变换矩阵组合对残差块的适应性,但是却增加了变换模式索引的编码量,导致编码效率较低。
发明内容
本申请的实施例提供了一种视频解码方法、装置、计算机可读介质及电子设备,进而至少在一定程度上可以有效提高视频编码效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种视频解码方法,包括:对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;统计所述量化系数块中的量化系数,得到隐含导出索引值;根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。
根据本申请实施例的一个方面,提供了一种视频解码装置,包括:解码单元,配置为对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;第一处理单元,配置为统计所述量化系数块中的量化系数,得到隐含导出索引值;选择单元,配置为根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;第二处理单元,配置为基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。
在本申请的一些实施例中,基于前述方案,所述视频解码装置还包括:确定单元,配置为通过以下方式中的至少一种确定所述编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式:视频图像帧序列对应的编码数据的序列头中包含的索引标识、视频图像帧对应的编码数据的图像头中包含的索引标识、所述编码块的尺寸大小。
在本申请的一些实施例中,基于前述方案,所述序列头中包含的索引标识的值用于指示所述视频图像帧序列对应的编码数据中的所有编码块、或采用帧内编码模式的编码块、或采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
在本申请的一些实施例中,基于前述方案,所述序列头中包含的第一索引标识的值和第二索引标识的值分别用于指示所述视频图像帧序列对应的编码数据中采用帧内编码模式的编码块和采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
在本申请的一些实施例中,基于前述方案,所述第一处理单元配置为:对所述量化系数块中指定区域内的量化系数进行统计,获得量化系数的统计结果;根据所述统计结果的奇偶性确定所述隐含导出索引值。
在本申请的一些实施例中,基于前述方案,所述第一处理单元配置为:对所述量化系数块中指定区域内的量化系数进行统计,得到量化系数的统计结果;计算所述统计结果针对设定值的余数;根据所述余数确定所述隐含导出索引值。
在本申请的一些实施例中,基于前述方案,所述第一处理单元配置为:统计所述量化系数块中指定区域内的非零系数、偶数系数、非零偶数系数或者奇数系数的数量,将所述数量作为所述量化系数的统计结果。
在本申请的一些实施例中,基于前述方案,所述指定区域包括所述量化系数块中的全部区域或者所述量化系数块中的SRCC(Scan Region Coefficient Coding,扫描区域系数编码)区域。
在本申请的一些实施例中,基于前述方案,所述选择单元配置为:根据设定的排列组合方式对所述隐含导出索引值及所述索引标识的取值进行组合,生成组合索引;根据索引值与变换模式之间的对应关系,选择与所述组合索引相对应的变换模式作为所述编码块的变换模式。
在本申请的一些实施例中,基于前述方案,所述索引值与变换模式之间的对应关系是根据组合索引的取值,以及设定的变换模式进行预先设定的。
在本申请的一些实施例中,基于前述方案,所述设定的变换模式包括以下至少一种:用于进行水平变换和竖直变换的变换矩阵组合、子块变换SBT模式、变换跳过模式。
在本申请的一些实施例中,基于前述方案,所述变换矩阵组合中用于水平变换的变换核和用于竖直变换的变换核从以下变换核中进行选择:DCT2变换核、DCT5变换核、DCT8变换核、DST1变换核、DST7变换核。
在本申请的一些实施例中,基于前述方案,所述编码块中包含有至少一个所述索引标识。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的视频解码方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的视频解码方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的视频解码方法。
在本申请的一些实施例所提供的技术方案中,通过统计量化系数块中的量化系数,得到隐含导出索引值,根据隐含导出索引值及编码块中包含的索引标识的取值,确定编码块的变换模式,使得能够基于隐含导出索引值和编码块中包含的显式索引标识来指示相应的变换模式,进而可以在指示更多变换模式的基础上,降低索引标识的编码量,有利于提高视频编码效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示出视频编码装置和视频解码装置在流式传输系统中的放置方式示意图;
图3示出了一个视频编码器的基本流程图;
图4示出了通过SRCC技术标记出的扫描区域;
图5示出了对标记出的扫描区域进行扫描的顺序示意图;
图6示出了子块变换技术中的变换组合示意图;
图7示出了根据本申请的一个实施例的视频解码方法的流程图;
图8示出了根据本申请的一个实施例的视频解码装置的框图;
图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图。
如图1所示,系统架构100包括多个终端装置,所述终端装置可通过例如网络150彼此通信。举例来说,系统架构100可以包括通过网络150互连的第一终端装置110和第二终端装置120。在图1的实施例中,第一终端装置110和第二终端装置120执行单向数据传输。
举例来说,第一终端装置110可对视频数据(例如由终端装置110采集的视频图片流)进行编码以通过网络150传输到第二终端装置120,已编码的视频数据以一个或多个已编码视频码流形式传输,第二终端装置120可从网络150接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。
在本申请的一个实施例中,系统架构100可以包括执行已编码视频数据的双向传输的第三终端装置130和第四终端装置140,所述双向传输比如可以发生在视频会议期间。对于双向数据传输,第三终端装置130和第四终端装置140中的每个终端装置可对视频数据(例如由终端装置采集的视频图片流)进行编码,以通过网络150传输到第三终端装置130和第四终端装置140中的另一终端装置。第三终端装置130和第四终端装置140中的每个终端装置还可接收由第三终端装置130和第四终端装置140中的另一终端装置传输的已编码视频数据,且可对已编码视频数据进行解码以恢复视频数据,并可根据恢复的视频数据在可访问的显示装置上显示视频图片。
在图1的实施例中,第一终端装置110、第二终端装置120、第三终端装置130和第四终端装置140可为服务器、个人计算机和智能电话,但本申请公开的原理可不限于此。本申请公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络150表示在第一终端装置110、第二终端装置120、第三终端装置130和第四终端装置140之间传送已编码视频数据的任何数目的网络,包括例如有线和/或无线通信网络。通信网络150可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的,除非在下文中有所解释,否则网络150的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。
在本申请的一个实施例中,图2示出视频编码装置和视频解码装置在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV(television,电视机)、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统213,采集子系统213可包括数码相机等视频源201,视频源创建未压缩的视频图片流202。在实施例中,视频图片流202包括由数码相机拍摄的样本。相较于已编码的视频数据204(或已编码的视频码流204),视频图片流202被描绘为粗线以强调高数据量的视频图片流,视频图片流202可由电子装置220处理,电子装置220包括耦接到视频源201的视频编码装置203。视频编码装置203可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流202,已编码的视频数据204(或已编码的视频码流204)被描绘为细线以强调较低数据量的已编码的视频数据204(或已编码的视频码流204),其可存储在流式传输服务器205上以供将来使用。一个或多个流式传输客户端子系统,例如图2中的客户端子系统206和客户端子系统208,可访问流式传输服务器205以检索已编码的视频数据204的副本207和副本209。客户端子系统206可包括例如电子装置230中的视频解码装置210。视频解码装置210对已编码的视频数据的传入副本207进行解码,且产生可在显示器212(例如显示屏)或另一呈现装置上呈现的输出视频图片流211。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据204、视频数据207和视频数据209(例如视频码流)进行编码。该些标准的实施例包括ITU-T H.265。在实施例中,正在开发的视频编码标准非正式地称为下一代视频编码(Versatile Video Coding,VVC),本申请可用于VVC标准的上下文中。
应注意,电子装置220和电子装置230可包括图中未示出的其它组件。举例来说,电子装置220可包括视频解码装置,且电子装置230还可包括视频编码装置。
在本申请的一个实施例中,以国际视频编码标准HEVC(High Efficiency VideoCoding,高效率视频编码)、VVC(Versatile Video Coding,多功能视频编码),以及中国国家视频编码标准AVS(Audio Video coding Standard,信源编码标准)为例,当输入一个视频帧图像之后,会根据一个块大小,将视频帧图像划分成若干个不重叠的处理单元,每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding Tree Unit,编码树单元),或者称之为LCU。CTU再往下可以继续进行更加精细的划分,得到一个或多个基本的编码单元CU,CU是一个编码环节中最基本的元素。以下介绍对CU进行编码时的一些概念:
预测编码(Predictive Coding):预测编码包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。编码端需要为当前CU决定选择哪一种预测编码模式,并告知解码端。其中,帧内预测是指预测的信号来自于同一图像内已经编码重建过的区域;帧间预测是指预测的信号来自已经编码过的、不同于当前图像的其它图像(称之为参考图像)。
变换及量化(Transform&Quantization):残差视频信号经过DFT(DiscreteFourier Transform,离散傅里叶变换)、DCT等变换操作后,将信号转换到变换域中,称之为变换系数。变换系数进一步进行有损的量化操作,丢失掉一定的信息,使得量化后的信号有利于压缩表达。在一些视频编码标准中,可能有多于一种变换方式可以选择,因此编码端也需要为当前CU选择其中的一种变换方式,并告知解码端。量化的精细程度通常由量化参数(Quantization Parameter,简称QP)来决定,QP取值较大,表示更大取值范围的系数将被量化为同一个输出,因此通常会带来更大的失真及较低的码率;相反,QP取值较小,表示较小取值范围的系数将被量化为同一个输出,因此通常会带来较小的失真,同时对应较高的码率。
熵编码(Entropy Coding)或统计编码:量化后的变换域信号将根据各个值出现的频率进行统计压缩编码,最后输出二值化(0或者1)的压缩码流。同时,编码产生其他信息,例如选择的编码模式、运动矢量数据等,也需要进行熵编码以降低码率。统计编码是一种无损的编码方式,可以有效的降低表达同样信号所需要的码率,常见的统计编码方式有变长编码(Variable Length Coding,简称VLC)或者基于上下文的二值化算术编码(ContentAdaptive Binary Arithmetic Coding,简称CABAC)。
环路滤波(Loop Filtering):经过变化及量化的信号会通过反量化、反变换及预测补偿的操作获得重建图像。重建图像与原始图像相比由于存在量化的影响,部分信息与原始图像有所不同,即重建图像会产生失真(Distortion)。因此,可以对重建图像进行滤波操作,例如去块效应滤波(Deblocking filter,简称DB)、SAO(Sample Adaptive Offset,自适应像素补偿)或者ALF(Adaptive Loop Filter,自适应环路滤波)等滤波器,可以有效降低量化所产生的失真程度。由于这些经过滤波后的重建图像将作为后续编码图像的参考来对将来的图像信号进行预测,因此上述的滤波操作也被称为环路滤波,即在编码环路内的滤波操作。
在本申请的一个实施例中,图3示出了一个视频编码器的基本流程图,在该流程中以帧内预测为例进行说明。其中,原始图像信号sk[x,y]与预测图像信号
Figure BDA0002729151290000091
做差值运算,得到残差信号uk[x,y],残差信号uk[x,y]经过变换及量化处理之后得到量化系数,量化系数一方面通过熵编码得到编码后的比特流,另一方面通过反量化及反变换处理得到重构残差信号u'k[x,y],预测图像信号
Figure BDA0002729151290000093
与重构残差信号u'k[x,y]叠加生成图像信号
Figure BDA0002729151290000094
图像信号
Figure BDA0002729151290000095
一方面输入至帧内模式决策模块和帧内预测模块进行帧内预测处理,另一方面通过环路滤波输出重建图像信号s'k[x,y],重建图像信号s'k[x,y]可以作为下一帧的参考图像进行运动估计及运动补偿预测。然后基于运动补偿预测的结果s'r[x+mx,y+my]和帧内预测结果
Figure BDA0002729151290000096
得到下一帧的预测图像信号
Figure BDA0002729151290000092
并继续重复上述过程,直至编码完成。
此外,由于残差信号在经过变换和量化处理后的量化系数块中非零系数较大概率会集中在块的左边和上方区域,而块的右边和下方区域往往为0,因此引入了SRCC技术中,通过SRCC技术可以标记出每个量化系数块(尺寸为W×H)中包含的非零系数的左上区域的大小SRx×SRy,其中SRx是量化系数块中最右面的非零系数的横坐标,SRy是量化系数块中最下面的非零系数的纵坐标,且1≤SRx≤W,1≤SRy≤H,而该区域外的系数均为0。SRCC技术利用(SRx,SRy)来确定一个量化系数块中需要扫描的量化系数区域,如图4所示,只有(SRx,SRy)标记的扫描区域内的量化系数需要编码,编码的扫描顺序如图5所示,可以是从右下角到左上角的反向Z字型扫描。
基于上述的编码过程,在解码端针对每一个CU,在获取到压缩码流(即比特流)之后,进行熵解码获得各种模式信息及量化系数。然后量化系数经过反量化及反变换处理得到残差信号。另一方面,根据已知的编码模式信息,可获得该CU对应的预测信号,然后将残差信号与预测信号相加之后即可得到重建信号,重建信号再经过环路滤波等操作,产生最终的输出信号。
在上述的编解码过程中,对残差信号的变换处理使得残差信号的能量集中在较少的低频系数,也就是多数系数值较小。然后经过后续的量化模块后,较小系数值将变为零值,极大降低了编码残差信号的代价。但是,由于残差分布的多样性,单一的DCT变换无法适应所有的残差特性,因此,DST7和DCT8这样的变换核被引入到变换处理过程中,并且对残差信号进行的水平变换和竖直变换可以采用不同的变换核。以AMT(Adaptive multiple coretransform,自适应多核变换)技术为例,对于一个残差信号进行变换处理可能选择的变换组合如下所示:(DCT2,DCT2)、(DCT8,DCT8)、(DCT8,DST7)、(DST7,DCT8)和(DST7,DST7)。
同时,对于帧间编码模式,AVS3中也提到了子块变换(Sub-Block Transform,简称SBT)技术。其中,SBT存在8种子块划分结果,并且只对子块中的灰色部分(非0残差子块)进行变换编码,而对于白色部分(0残差子块)则强行清零。关于子块的变换组合选择,当非0残差子块的宽或高为64时,该非0残差子块的水平和竖直变换均为DCT-2;其它情况下,水平和竖直变换的选择如图6所示。在图6中,会对子块中的灰色部分按照所标识的变换模式进行水平变换和竖直变换编码,而对于白色部分则强行清零,图6中的w1可以是w(宽度)的1/2,或者可以是w的1/4;h1可以是h(高度)的1/2,或者可以是h的1/4。
此外,也有方案提出在灰色部分的残差编码的过程中跳过变换,直接进行量化和系数编码。
对于残差信号具体选择哪种变换组合,需要在编码端使用RDO(Rate–DistortionOptimization,率失真优化)进行决策,并且也有部分残差的相关性较弱,进而可能会跳过变换过程。由于残差数据的多样性,单一的DCT变换核无法适应所有的残差特性,因此对于一个残差块可能需要选择多个DCT变换核或DST变换核作为变换矩阵组合,在这种情况下,虽然提升了变换矩阵组合对残差块的适应性,但是却增加了变换模式索引的编码量,导致编码效率较低。
针对上述问题,本申请的实施例提出了基于隐含导出索引值和编码块中包含的显式索引标识来指示相应的变换模式,进而可以在指示更多变换模式的基础上,降低索引标识的编码量,有利于提高视频编码效率。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图7示出了根据本申请的一个实施例的视频解码方法的流程图,该视频解码方法可以由具有计算处理功能的设备来执行,比如可以由终端设备或服务器来执行。参照图7所示,该视频解码方法至少包括步骤S710至步骤S740,详细介绍如下:
在步骤S710中,对视频图像帧的编码块进行熵解码处理,获得编码块对应的残差数据的量化系数块。
在本申请的一个实施例中,视频图像帧序列包括了一系列图像,每张图像可以被进一步划分为条带(Slice),条带又可以划分为一系列的LCU(或CTU),LCU包含有若干CU。视频图像帧在编码时是以块为单位进行编码处理,在一些新的视频编码标准中,比如在H.264标准中有宏块(macroblock,MB),宏块可进一步划分成多个可用于预测编码的预测块(prediction)。在HEVC标准中,采用编码单元CU、预测单元(prediction unit,PU)和变换单元(transform unit,TU)等基本概念,从功能上划分了多种块单元,并采用全新的基于树的结构进行描述。比如CU可以按照四叉树划分为更小的CU,而更小的CU还可以继续划分,从而形成一种四叉树结构。本申请实施例中的编码块可以是CU,或者是比CU更小的块,如对CU进行划分得到的更小的块。
在步骤S720中,统计量化系数块中的量化系数,得到隐含导出索引值。
在本申请的一个实施例中,可以对量化系数块中指定区域内的量化系数进行统计,获得量化系数的统计结果,然后根据统计结果的奇偶性确定隐含导出索引值。该实施例的技术方案是基于统计结果的奇偶性来确定隐含导出索引值,比如若统计结果为奇数,则隐含导出索引值可以为1;若统计结果为偶数,则隐含导出索引值可以为0。当然,若统计结果为奇数,则隐含导出索引值也可以为0,那么若统计结果为偶数,则隐含导出索引值可以为1。
在本申请的一个实施例中,可以对量化系数块中指定区域内的量化系数进行统计,得到量化系数的统计结果,然后计算统计结果针对设定值的余数,然后根据余数确定隐含导出索引值。该实施例的技术方案是基于统计结果针对设定值的余数来确定隐含导出索引值,这种方案使得隐含导出索引值的可能取值会多于两个,比如设定值可以为3,在这种情况下,统计结果针对3的余数取值可以是0、1、2,每个余数会对应一个隐含导出索引值,比如可以将余数直接作为隐含导出索引值。
在本申请的一个实施例中,前述实施例中对量化系数块中指定区域内的量化系数进行统计可以是统计量化系数块中指定区域内的非零系数、偶数系数、非零偶数系数或者奇数系数的数量,然后将该数量作为量化系数的统计结果。该指定区域可以是量化系数块中的全部区域,也可以是量化系数块中的部分区域(如量化系数块中指定的一个位置或多个位置、量化系数块中指定的至少一行、量化系数块中指定的至少一列、量化系数块中指定的至少一行和指定的至少一列、量化系数块中处于至少一条斜线上的位置等),还可以是量化系数块中的SRCC区域,如全部的SRCC区域或者部分SRCC区域。可选地,部分SRCC区域可以是SRCC区域中指定的一个位置或多个位置、SRCC区域中指定的至少一行、SRCC区域中指定的至少一列、SRCC区域中指定的至少一行和指定的至少一列、SRCC区域中处于至少一条斜线上的位置等。
继续参照图7所示,在步骤S730中,根据隐含导出索引值及编码块中包含的索引标识的取值,确定编码块的变换模式。
在本申请的一个实施例中,编码块中包含的索引标识属于显式的索引标识,该索引标识的取值可以为1,也可以为0。可选地,一个编码块中可以包含有一个或者多个索引标识,即一个编码块中可以包含有一个或者多个指示位,每个指示位用于表示一个索引标识。
在本申请的一个实施例中,在根据隐含导出索引值及编码块中包含的索引标识的取值确定编码块的变换模式时,可以根据设定的排列组合方式对隐含导出索引值及索引标识的取值进行组合,生成组合索引,然后根据索引值与变换模式之间的对应关系,选择与组合索引相对应的变换模式作为编码块的变换模式。
在本申请的一个实施例中,若编码块中包含有1个索引标识(为便于区分,以下称之为显式索引),那么设定的排列组合方式既可以是显式索引在前、隐含导出索引在后,也可以是隐含导出索引在前、显式索引在后。即组合索引可以是“显式索引+隐含导出索引”的方式,也可以是“隐含导出索引+显式索引”的方式。
在本申请的一个实施例中,若编码块中包含有2个索引标识(以下称之为显式索引1和显式索引2),那么设定的排列组合方式既可以是两个显式索引在前、隐含导出索引在后,也可以是隐含导出索引在前、两个显式索引在后,还可以是隐含导出索引位于两个显式索引之间。即组合索引可以是“显式索引1+显式索引2+隐含导出索引”的方式,也可以是“隐含导出索引+显式索引1+显式索引2”的方式,还可以是“显式索引1+隐含导出索引+显式索引2”的方式。
类似的,若编码块中包含有更多数量的索引标识,那么可以根据设定的排列组合方式来将这些索引标识与隐含导出索引进行组合。
在本申请的一个实施例中,前述实施例中的索引值与变换模式之间的对应关系是根据组合索引的取值,以及设定的变换模式进行预先设定的。可选地,设定的变换模式包括以下至少一种:用于进行水平变换和竖直变换的变换矩阵组合、SBT模式、变换跳过模式。
在本申请的一个实施例中,变换矩阵组合中用于水平变换的变换核和用于竖直变换的变换核可以从以下变换核中进行选择:DCT2变换核、DCT5变换核、DCT8变换核、DST1变换核、DST7变换核。比如,变换矩阵组合可以是(DCT2,DCT2)、(DCT8,DCT8)、(DCT8,DST7)、(DST7,DCT8)、(DST7,DST7)等。需要说明的是:变换矩阵组合中的第一个变换核表示用于水平变换的变换核,第二个变换核表示用于竖直变换的变换核,如变换矩阵组合(DCT8,DST7)表示通过DCT8进行水平变换,通过DST7进行竖直变换。
基于前述实施例的技术方案,在本申请的一个示例中,若编码块中包含有1个显式索引,那么前述实施例中的索引值与变换模式之间的对应关系可以如表1所示:
Figure BDA0002729151290000131
表1
在表1中,设定的排列组合方式是显式索引在前、隐含导出索引在后。表1中显式索引为“0”,隐含导出索引为“-”的情况表示:显式索引取0值时,不管隐含导出索引取何值,变换模式都是(DCT2,DCT2),在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。需要说明的是,表1中显式索引和隐含导出索引的取值,以及对应的变换模式仅为示例,在本申请的其它实施例中,也可以有其它的方式,如表2和表3所示:
Figure BDA0002729151290000141
表2
表2中显式索引为“0”,隐含导出索引为“-”的情况表示:显式索引取0值时,不管隐含导出索引取何值,变换模式都是SBT,在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。
Figure BDA0002729151290000142
表3
表3中显式索引为“0”,隐含导出索引为“-”的情况表示:显式索引取0值时,不管隐含导出索引取何值,变换模式都是SBT,在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。表3中的“TS”表示变换跳过模式,即编码时跳过了变换过程,解码时需要跳过反变换过程。
在本申请的一个示例中,若编码块中包含有1个显式索引,那么前述实施例中的索引值与变换模式之间的对应关系还可以如表4所示:
Figure BDA0002729151290000151
表4
在表4中,设定的排列组合方式是隐含导出索引在前、显式索引在后。表4中隐含导出索引为“1”,显式索引为“-”的情况表示:隐含索引取1值时,不管显式索引取何值,变换模式都是(DCT2,DCT2),在这种情况下,编码端可以不用在编码块中编码显式索引,解码端也无需进行显式索引的解码过程。
在本申请的一个示例中,若编码块中包含有2个显式索引,那么前述实施例中的索引值与变换模式之间的对应关系可以如表5所示:
Figure BDA0002729151290000152
表5
在表5中,设定的排列组合方式是2个显式索引在前、隐含导出索引在后。表5中显式索引1为“1”、显式索引2为“0”、隐含导出索引为“-”的情况表示:显式索引1取1值、显式索引2取0时,不管隐含导出索引取何值,变换模式都是SBT,在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。
表5中显式索引1为“0”、显式索引2为“-”、隐含导出索引为“-”的情况表示:显式索引1取0值时,不管显式索引2和隐含导出索引取何值,变换模式都是(DCT2,DCT2),在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,并且编码端也不用在编码块中编码显式索引2,解码端也无需进行隐含导出索引的过程,并且解码端也无需进行显式索引2的解码过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。需要说明的是,表5中显式索引1、显式索引2和隐含导出索引的取值,以及对应的变换模式仅为示例,在本申请的其它实施例中,也可以有其它的方式,如表6所示:
Figure BDA0002729151290000161
表6
表6中显式索引1为“1”、显式索引2为“-”、隐含导出索引为“-”的情况表示:显式索引1取1值时,不管显式索引2和隐含导出索引取何值,变换模式都是SBT,在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,并且编码端也不用在编码块中编码显式索引2,解码端也无需进行隐含导出索引的过程,并且解码端也无需进行显式索引2的解码过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。
表6中显式索引1为“0”、显式索引2为“0”、隐含导出索引为“-”的情况表示:显式索引1取0值、显式索引2取0值时,不管隐含导出索引取何值,变换模式都是(DCT2,DCT2),在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。
在本申请的一个示例中,若编码块中包含有2个显式索引,那么前述实施例中的索引值与变换模式之间的对应关系还可以如表7所示:
Figure BDA0002729151290000171
表7
在表7中,设定的排列组合方式是隐含导出索引在2个显式索引之间。表7中显式索引1为“1”、隐含导出索引为“0”、显式索引2为“-”表示:显式索引1取1值、隐含导出索引取0值时,不管显式索引2取何值,变换模式都是(DST7,DST7),在这种情况下,编码端可以不用在编码块中编码显式索引2,解码端也无需进行显式索引2的解码过程。
表7中显式索引1为“0”、隐含导出索引为“-”、显式索引2为“-”表示:显式索引1取0值时,不管隐含导出索引和显式索引2取何值,变换模式都是(DCT2,DCT2),在这种情况下,编码端可以不用调整量化系数块来进行隐含指示,并且编码端也不用在编码块中编码显式索引2,解码端也无需进行隐含导出索引的过程,并且解码端也无需进行显式索引2的解码过程(另外,即便编码端调整了量化系数块来进行隐含指示,解码端也无需进行隐含导出索引的过程)。
需要说明的是:表1至表7所示的对应关系仅为示例,在本申请的其它实施例中,可以根据实际需要,基于组合索引的取值,以及设定的变换模式进行预先设定。
在本申请的一个实施例中,可以通过以下方式中的至少一种确定是否需要根据前述实施例中提出的基于隐含导出索引与显式索引来共同确定编码块对应的变换模式:视频图像帧序列对应的编码数据的序列头中包含的索引标识、视频图像帧对应的编码数据的图像头中包含的索引标识、编码块的尺寸大小。
在本申请的一个实施例中,前述的序列头中包含的索引标识的值用于指示视频图像帧序列对应的编码数据中的所有编码块、或采用帧内编码模式的编码块、或采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。即在该实施例中,序列头中包含的索引标识要么指示视频图像帧序列对应的编码数据中的所有编码块需要根据隐含导出索引与显式索引来共同确定编码块对应的变换模式,要么指示视频图像帧序列对应的编码数据中采用帧内编码模式的编码块需要根据隐含导出索引与显式索引来共同确定编码块对应的变换模式,要么指示视频图像帧序列对应的编码数据中采用帧间编码模式的编码块需要根据隐含导出索引与显式索引来共同确定编码块对应的变换模式。
在本申请的一个实施例中,前述的序列头中包含有两个索引标识,其中的第一索引标识的值和第二索引标识的值分别用于指示视频图像帧序列对应的编码数据中采用帧内编码模式的编码块和采用帧间编码模式的编码块是否需要根据隐含导出索引值与显式索引来共同确定编码块对应的变换模式。即在该实施例中,序列头中包含有分别对应于采用帧内编码模式的编码块和采用帧间编码模式的编码块的索引标识,以分别指示这两种编码块是否需要根据隐含导出索引值与显式索引来共同确定编码块对应的变换模式。
比如,若序列头中包含的索引标识的值用于指示视频图像帧序列对应的编码数据中的所有编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式,且通过序列头和编码块的尺寸大小来进行指示,那么具体的指示方式可以是:
若视频图像帧序列对应的编码数据的序列头中的索引标识为1(数值仅为示例),那么若视频图像帧序列对应的编码数据中的某个编码块的尺寸小于设定值,就说明该编码块需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
反之,若视频图像帧序列对应的编码数据的序列头中的索引标识为1,那么若视频图像帧序列对应的编码数据中的某个编码块的尺寸大于设定值,则说明该编码块不需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
或者,若视频图像帧序列对应的编码数据的序列头中的索引标识为0(数值仅为示例),则说明该视频图像帧序列对应的编码数据中的所有编码块不需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
继续参照图7所示,在步骤S740中,基于编码块对应的变换模式对量化系数块的反量化结果进行反变换处理。该过程可以参照前述实施例中的相关描述,不再赘述。
本申请上述实施例的技术方案使得能够基于隐含导出索引值和编码块中包含的显式索引标识来指示相应的变换模式,进而可以在指示更多变换模式的基础上,降低索引标识的编码量,有利于提高视频编码效率。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的视频解码方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的视频解码方法的实施例。
图8示出了根据本申请的一个实施例的视频解码装置的框图,该视频解码装置可以设置在具有计算处理功能的设备内,比如可以设置在终端设备或服务器内。
参照图8所示,根据本申请的一个实施例的视频解码装置800,包括:解码单元802、第一处理单元804、选择单元806和第二处理单元808。
其中,解码单元802配置为对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;第一处理单元804配置为统计所述量化系数块中的量化系数,得到隐含导出索引值;选择单元806配置为根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;第二处理单元808配置为基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。
在本申请的一些实施例中,基于前述方案,所述视频解码装置800还包括:确定单元,配置为通过以下方式中的至少一种确定所述编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式:视频图像帧序列对应的编码数据的序列头中包含的索引标识、视频图像帧对应的编码数据的图像头中包含的索引标识、所述编码块的尺寸大小。
在本申请的一些实施例中,基于前述方案,所述序列头中包含的索引标识的值用于指示所述视频图像帧序列对应的编码数据中的所有编码块、或采用帧内编码模式的编码块、或采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
在本申请的一些实施例中,基于前述方案,所述序列头中包含的第一索引标识的值和第二索引标识的值分别用于指示所述视频图像帧序列对应的编码数据中采用帧内编码模式的编码块和采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
在本申请的一些实施例中,基于前述方案,第一处理单元804配置为:对所述量化系数块中指定区域内的量化系数进行统计,获得量化系数的统计结果;根据所述统计结果的奇偶性确定所述隐含导出索引值。
在本申请的一些实施例中,基于前述方案,第一处理单元804配置为:对所述量化系数块中指定区域内的量化系数进行统计,得到量化系数的统计结果;计算所述统计结果针对设定值的余数;根据所述余数确定所述隐含导出索引值。
在本申请的一些实施例中,基于前述方案,第一处理单元804配置为:统计所述量化系数块中指定区域内的非零系数、偶数系数、非零偶数系数或者奇数系数的数量,将所述数量作为所述量化系数的统计结果。
在本申请的一些实施例中,基于前述方案,所述指定区域包括所述量化系数块中的全部区域或者所述量化系数块中的SRCC区域。
在本申请的一些实施例中,基于前述方案,选择单元806配置为:根据设定的排列组合方式对所述隐含导出索引值及所述索引标识的取值进行组合,生成组合索引;根据索引值与变换模式之间的对应关系,选择与所述组合索引相对应的变换模式作为所述编码块的变换模式。
在本申请的一些实施例中,基于前述方案,所述索引值与变换模式之间的对应关系是根据组合索引的取值,以及设定的变换模式进行预先设定的。
在本申请的一些实施例中,基于前述方案,所述设定的变换模式包括以下至少一种:用于进行水平变换和竖直变换的变换矩阵组合、子块变换SBT模式、变换跳过模式。
在本申请的一些实施例中,基于前述方案,所述变换矩阵组合中用于水平变换的变换核和用于竖直变换的变换核从以下变换核中进行选择:DCT2变换核、DCT5变换核、DCT8变换核、DST1变换核、DST7变换核。
在本申请的一些实施例中,基于前述方案,所述编码块中包含有至少一个所述索引标识。
图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图9示出的电子设备的计算机系统900仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(Central Processing Unit,CPU)901,其可以根据存储在只读存储器(Read-Only Memory,ROM)902中的程序或者从存储部分908加载到随机访问存储器(Random Access Memory,RAM)903中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 903中,还存储有系统操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(Input/Output,I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (15)

1.一种视频解码方法,其特征在于,包括:
对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;
统计所述量化系数块中的量化系数,得到隐含导出索引值;
根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;
基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。
2.根据权利要求1所述的视频解码方法,其特征在于,所述视频解码方法还包括:
通过以下方式中的至少一种确定所述编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式:
视频图像帧序列对应的编码数据的序列头中包含的索引标识、视频图像帧对应的编码数据的图像头中包含的索引标识、所述编码块的尺寸大小。
3.根据权利要求2所述的视频解码方法,其特征在于,
所述序列头中包含的索引标识的值用于指示所述视频图像帧序列对应的编码数据中的所有编码块、或采用帧内编码模式的编码块、或采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式;或者
所述序列头中包含的第一索引标识的值和第二索引标识的值分别用于指示所述视频图像帧序列对应的编码数据中采用帧内编码模式的编码块和采用帧间编码模式的编码块是否需要根据隐含导出索引值与编码块中包含的索引标识来共同确定编码块对应的变换模式。
4.根据权利要求1所述的视频解码方法,其特征在于,统计所述量化系数块中的量化系数,得到隐含导出索引值,包括:
对所述量化系数块中指定区域内的量化系数进行统计,获得量化系数的统计结果;
根据所述统计结果的奇偶性确定所述隐含导出索引值。
5.根据权利要求1所述的视频解码方法,其特征在于,统计所述量化系数块中的量化系数,得到隐含导出索引值,包括:
对所述量化系数块中指定区域内的量化系数进行统计,得到量化系数的统计结果;
计算所述统计结果针对设定值的余数;
根据所述余数确定所述隐含导出索引值。
6.根据权利要求4或5所述的视频解码方法,其特征在于,对所述量化系数块中指定区域内的量化系数进行统计,包括:
统计所述量化系数块中指定区域内的非零系数、偶数系数、非零偶数系数或者奇数系数的数量,将所述数量作为所述量化系数的统计结果。
7.根据权利要求4或5所述的视频解码方法,其特征在于,所述指定区域包括所述量化系数块中的全部区域或者所述量化系数块中的扫描区域系数编码SRCC区域。
8.根据权利要求1所述的视频解码方法,其特征在于,根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式,包括:
根据设定的排列组合方式对所述隐含导出索引值及所述索引标识的取值进行组合,生成组合索引;
根据索引值与变换模式之间的对应关系,选择与所述组合索引相对应的变换模式作为所述编码块的变换模式。
9.根据权利要求8所述的视频解码方法,其特征在于,所述索引值与变换模式之间的对应关系是根据组合索引的取值,以及设定的变换模式进行预先设定的。
10.根据权利要求9所述的视频解码方法,其特征在于,所述设定的变换模式包括以下至少一种:
用于进行水平变换和竖直变换的变换矩阵组合、子块变换SBT模式、变换跳过模式。
11.根据权利要求10所述的视频解码方法,其特征在于,所述变换矩阵组合中用于水平变换的变换核和用于竖直变换的变换核从以下变换核中进行选择:离散余弦变换DCT2变换核、DCT5变换核、DCT8变换核、离散正弦变换DST1变换核、DST7变换核。
12.根据权利要求1至5、8至11中任一项所述的视频解码方法,其特征在于,所述编码块中包含有至少一个所述索引标识。
13.一种视频解码装置,其特征在于,包括:
解码单元,配置为对视频图像帧的编码块进行熵解码处理,获得所述编码块对应的残差数据的量化系数块;
第一处理单元,配置为统计所述量化系数块中的量化系数,得到隐含导出索引值;
选择单元,配置为根据所述隐含导出索引值及所述编码块中包含的索引标识的取值,确定所述编码块的变换模式;
第二处理单元,配置为基于所述编码块对应的变换模式对所述量化系数块的反量化结果进行反变换处理。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的视频解码方法。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至12中任一项所述的视频解码方法。
CN202011112822.0A 2020-10-16 2020-10-16 视频解码方法、装置、计算机可读介质及电子设备 Active CN112533000B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202011112822.0A CN112533000B (zh) 2020-10-16 2020-10-16 视频解码方法、装置、计算机可读介质及电子设备
PCT/CN2021/119492 WO2022078163A1 (zh) 2020-10-16 2021-09-22 视频解码方法、视频编码方法及相关装置
EP21879209.1A EP4113997A4 (en) 2020-10-16 2021-09-22 VIDEO CODING METHOD, VIDEO CODING METHOD AND ASSOCIATED APPARATUS
US17/958,200 US20230024834A1 (en) 2020-10-16 2022-09-30 Video decoding method, video encoding method, and related apparatuses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011112822.0A CN112533000B (zh) 2020-10-16 2020-10-16 视频解码方法、装置、计算机可读介质及电子设备

Publications (2)

Publication Number Publication Date
CN112533000A true CN112533000A (zh) 2021-03-19
CN112533000B CN112533000B (zh) 2022-08-05

Family

ID=74980569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011112822.0A Active CN112533000B (zh) 2020-10-16 2020-10-16 视频解码方法、装置、计算机可读介质及电子设备

Country Status (4)

Country Link
US (1) US20230024834A1 (zh)
EP (1) EP4113997A4 (zh)
CN (1) CN112533000B (zh)
WO (1) WO2022078163A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022037478A1 (zh) * 2020-08-21 2022-02-24 腾讯科技(深圳)有限公司 视频解码方法、视频编码方法、装置、介质及电子设备
WO2022062880A1 (zh) * 2020-09-27 2022-03-31 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备
WO2022078163A1 (zh) * 2020-10-16 2022-04-21 腾讯科技(深圳)有限公司 视频解码方法、视频编码方法及相关装置
CN114449345A (zh) * 2022-02-08 2022-05-06 腾讯科技(深圳)有限公司 视频处理方法、装置、设备及存储介质
CN117354529A (zh) * 2023-11-28 2024-01-05 广东匠芯创科技有限公司 基于视频编码系统的图像处理方法、电子设备及介质
US11938439B2 (en) 2020-12-09 2024-03-26 Suzhou Jingtian Airen Environmental Technology Co. Ltd. Apparatus for separating and removing dust from exhaust gas

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020018597A1 (en) * 2000-06-07 2002-02-14 Hiroshi Kajiwara Image processing system, image processing apparatus, image input apparatus, image output apparatus and method, and storage medium
CN104469384A (zh) * 2013-09-19 2015-03-25 黑莓有限公司 基于帧内预测模式对变换系数块进行转置
EP3107294A1 (en) * 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
US20170064335A1 (en) * 2015-08-31 2017-03-02 Samsung Electronics Co., Ltd. Method and apparatus for image transformation, and method and apparatus for image inverse-transformation based on scanning sequence
US20170223351A1 (en) * 2014-10-17 2017-08-03 Huawei Technologies Co., Ltd. Video processing method, encoding device, and decoding device
CN109691101A (zh) * 2016-07-15 2019-04-26 高通股份有限公司 用于增强型多变换的查找表
CN110324619A (zh) * 2018-03-29 2019-10-11 腾讯美国有限责任公司 变换信息预测
CN110519601A (zh) * 2019-09-02 2019-11-29 北京百度网讯科技有限公司 数字视频的编码方法和装置
WO2020050651A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치
CN111669580A (zh) * 2019-03-09 2020-09-15 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和系统
CN112565751A (zh) * 2020-09-27 2021-03-26 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2682838C1 (ru) * 2015-12-23 2019-03-21 Хуавей Текнолоджиз Ко., Лтд. Способ и устройство для кодирования с преобразованием с выбором преобразования блокового уровня и неявной сигнализацией в рамках иерархического разбиения
KR20210046002A (ko) * 2018-09-07 2021-04-27 주식회사 윌러스표준기술연구소 다중 변환 커널을 사용하는 비디오 신호 처리 방법 및 장치
EP3687172A1 (en) * 2019-01-22 2020-07-29 InterDigital VC Holdings, Inc. Multiple transforms selection signalling
CN111225206B (zh) * 2018-11-23 2021-10-26 华为技术有限公司 视频解码方法和视频解码器
CN111385584B (zh) * 2018-12-28 2022-09-06 杭州海康威视数字技术股份有限公司 进行编码、解码的方法、装置和系统
CN115315944A (zh) * 2020-03-07 2022-11-08 抖音视界有限公司 视频编解码中的隐式多变换集信令通知
CN112533000B (zh) * 2020-10-16 2022-08-05 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020018597A1 (en) * 2000-06-07 2002-02-14 Hiroshi Kajiwara Image processing system, image processing apparatus, image input apparatus, image output apparatus and method, and storage medium
EP3107294A1 (en) * 2007-03-20 2016-12-21 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
CN104469384A (zh) * 2013-09-19 2015-03-25 黑莓有限公司 基于帧内预测模式对变换系数块进行转置
US20170223351A1 (en) * 2014-10-17 2017-08-03 Huawei Technologies Co., Ltd. Video processing method, encoding device, and decoding device
US20170064335A1 (en) * 2015-08-31 2017-03-02 Samsung Electronics Co., Ltd. Method and apparatus for image transformation, and method and apparatus for image inverse-transformation based on scanning sequence
CN109691101A (zh) * 2016-07-15 2019-04-26 高通股份有限公司 用于增强型多变换的查找表
CN110324619A (zh) * 2018-03-29 2019-10-11 腾讯美国有限责任公司 变换信息预测
WO2020050651A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 다중 변환 선택에 기반한 영상 코딩 방법 및 그 장치
CN111669580A (zh) * 2019-03-09 2020-09-15 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和系统
CN110519601A (zh) * 2019-09-02 2019-11-29 北京百度网讯科技有限公司 数字视频的编码方法和装置
CN112565751A (zh) * 2020-09-27 2021-03-26 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沈燕飞: "高效视频编码", 《计算机学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022037478A1 (zh) * 2020-08-21 2022-02-24 腾讯科技(深圳)有限公司 视频解码方法、视频编码方法、装置、介质及电子设备
WO2022062880A1 (zh) * 2020-09-27 2022-03-31 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备
WO2022078163A1 (zh) * 2020-10-16 2022-04-21 腾讯科技(深圳)有限公司 视频解码方法、视频编码方法及相关装置
US11938439B2 (en) 2020-12-09 2024-03-26 Suzhou Jingtian Airen Environmental Technology Co. Ltd. Apparatus for separating and removing dust from exhaust gas
CN114449345A (zh) * 2022-02-08 2022-05-06 腾讯科技(深圳)有限公司 视频处理方法、装置、设备及存储介质
CN114449345B (zh) * 2022-02-08 2023-06-23 腾讯科技(深圳)有限公司 视频处理方法、装置、设备及存储介质
CN117354529A (zh) * 2023-11-28 2024-01-05 广东匠芯创科技有限公司 基于视频编码系统的图像处理方法、电子设备及介质
CN117354529B (zh) * 2023-11-28 2024-03-12 广东匠芯创科技有限公司 基于视频编码系统的图像处理方法、电子设备及介质

Also Published As

Publication number Publication date
CN112533000B (zh) 2022-08-05
EP4113997A1 (en) 2023-01-04
EP4113997A4 (en) 2023-09-13
US20230024834A1 (en) 2023-01-26
WO2022078163A1 (zh) 2022-04-21

Similar Documents

Publication Publication Date Title
CN112533000B (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN112565751B (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN112543338B (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN112543337B (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN113207002B (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN112995671B (zh) 视频编解码方法、装置、计算机可读介质及电子设备
US20230053118A1 (en) Video decoding method, video coding method, and related apparatus
CN114079773B (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN114079772B (zh) 视频解码方法、装置、计算机可读介质及电子设备
WO2022116854A1 (zh) 视频解码方法、装置、可读介质、电子设备及程序产品
WO2022174637A1 (zh) 视频编解码方法、装置、计算机可读介质及电子设备
WO2022174638A1 (zh) 视频编解码方法、装置、计算机可读介质及电子设备
WO2022174701A1 (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN115209146A (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN114979656A (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN115209141A (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN116456086A (zh) 环路滤波方法、视频编解码方法、装置、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040658

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant