WO2023246514A1

WO2023246514A1 - 一种视频解码方法、装置、设备及存储介质

Info

Publication number: WO2023246514A1
Application number: PCT/CN2023/098928
Authority: WO
Inventors: 张凯明
Original assignee: 广州市百果园信息技术有限公司
Priority date: 2022-06-22
Filing date: 2023-06-07
Publication date: 2023-12-28
Also published as: CN115334313A

Abstract

本申请实施例提供了一种视频解码方法、装置、设备及存储介质。本申请实施例提供的技术方案通过按照根据操作系统位数确定的设定码字长度从待解码视频帧码流中获取待解码码字，并将待解码码字提交给熵解码引擎进行熵解码得到熵解码结果，并对熵解码结果进行重建处理得到重建帧，读取的待解码码字的长度与操作系统位数对齐，后续每次读取待解码码字时，内存寻址向操作系统位数对齐，有效减少单次读取时间以及内存读取的次数，并且通过多旁路解码对多个待解码码字进行熵解码处理，减少熵解码处理的计算量与耗时，在无需单独设计硬件电路，且无需开启多个解码线程的情况下，有效提升了视频解码速度。

Description

一种视频解码方法、装置、设备及存储介质

本申请要求在2022年06月22日提交中国专利局，申请号为202210720358.6的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及视频解码技术领域，尤其涉及一种视频解码方法、装置、设备及存储介质。

背景技术

在从PC互联网到移动互联网的发展过程中，信息的表现形式由最初的文字为主到图像逐减增多，再到现在的视频信息占据流量主体，使得视频解码技术由最初的广播电视系统逐渐拓展至移动端产品中。视频解码技术是指通过硬件解码器或者软件解码器，将从网络上下载到的二进制码流依照特定的语法，进行二进制解析与像素重建，进而拼凑成整帧提供给上层应用实现视频播放的过程。

视频解码主要包括熵解码和重建两大模块，其中重建模块多为规整型的数值计算与处理，优化程度相对较深；而对于熵解码模块，以HEVC(高效率视频编码国际标准)标准中采用的CABAC(基于上下文模型的二进制算术编码)熵解码为例，视频码流的解析是典型的串行模式，难以实现并行加速，成为解码器部署的速度瓶颈，尤其在算力受限的移动端，熵解码模块造成的解码速度较慢问题尤其突出。目前一般通过硬件电路单元设计或软件多线程并行的方式提高视频解码的效率，但是硬件电路单元设计的方式需要依赖于专门的电路结构，并且不同终端的实现方案也存在较大差异，在移动终端领域中受到较大限制；而软件多线程并行的方式会导致终端功耗的增加，容易造成终端耗电过快且发热明显，软件多线程并行在移动终端领域中也容易受到较大限制。

发明内容

本申请实施例提供一种视频解码方法、装置、设备及存储介质，以解决相关技术中视频解码加速方案在移动终端中效果较差的技术问题，在无需单独设计硬件电路，且无需开启多个解码线程的情况下，有效提升了视频解码速度。

在第一方面，本申请实施例提供了一种视频解码方法，包括：

按照设定码字长度从待解码视频帧码流中获取待解码码字，所述设定码字长度根据操作系统位数进行设定；

将所述待解码码字添加到熵解码引擎中，由所述熵解码引擎对所述待解码码字进行熵解码得到熵解码结果，所述熵解码的解码方式包括常规熵解码和多旁路熵解码，所述常规熵解码和所述多旁路熵解码分别基于不同编码语法进行配置得到；

对所述熵解码结果进行重建处理得到重建帧。

在第二方面，本申请实施例提供了一种视频解码装置，包括码字提取模块、熵解码模块和重建处理模块，其中：

所述码字提取模块，配置为按照设定码字长度从待解码视频帧码流中获取待解码码字，所述设定码字长度根据操作系统位数进行设定；

所述熵解码模块，配置为将所述待解码码字添加到熵解码引擎中，由所述熵解码引擎对所述待解码码字进行熵解码得到熵解码结果，所述熵解码的解码方式包括常规熵解码和多旁路熵解码，所述常规熵解码和所述多旁路熵解码分别基于不同编码语法进行配置得到；

所述重建处理模块，配置为对所述熵解码结果进行重建处理得到重建帧。

在第三方面，本申请实施例提供了一种视频解码设备，包括：存储器以及一个或多个处理器；

所述存储器，配置为存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的视频解码方法。

在第四方面，本申请实施例提供了一种存储计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时配置为执行如第一方面所述的视频解码方法。

在第五方面，本申请实施例提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中，设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序，使得设备执行如第一方面所述的视频解码方法。

本申请实施例通过按照根据操作系统位数确定的设定码字长度从待解码视频帧码流中获取待解码码字，并将待解码码字提交给熵解码引擎进行熵解码得到熵解码结果，并对熵解码结果进行重建处理得到重建帧，读取的待解码码字的长度与操作系统位数对齐，后续每次读取待解码码字时，内存寻址向操作系统位数对齐，有效减少单次读取时间以及内存读取的次数，并且通过多旁路解码对多个待解码码字进行熵解码处理，减少熵解码处理的计算量与耗时，在无需单独设计硬件电路，且无需开启多个解码线程的情况下，有效提升了视频解码速度。

附图说明

图1是本申请实施例提供的一种视频解码方法的流程图；

图2是本申请实施例提供的一种对待解码码字进行熵解码的流程示意图；

图3是相关技术中的常规解码流程示意图；

图4是本申请实施例提供的一种常规解码流程示意图；

图5是本申请实施例提供的一种视频解码装置的结构示意图；

图6是本申请实施例提供的一种视频解码设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时上述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。上述处理可以对应于方法、函数、规程、子例程、子程序等等。

图1给出了本申请实施例提供的一种视频解码方法的流程图，本申请实施例提供的视频解码方法可以由视频解码装置来执行，该视频解码装置可以通过硬件和/或软件的方式实现，并集成在视频解码设备(例如手机、平板)中。

下述以视频解码装置执行视频解码方法为例进行描述。参考图1，该视频解码方法包括：

S110：按照设定码字长度从待解码视频帧码流中获取待解码码字，设定码字长度根据操作系统位数进行设定。

本方案提供的待解码视频帧码流通过对二进制码流进行拆包组帧处理得到，以例如在视频解码设备中的视频相关应用接收到互联网服务端发送的二进制码流(例如视频解码设备中的视频相关应用根据具体需求，例如进行观看直播、点播、视频会议等操作时，视频解码设备中的应用层向服务端发出视频获取请求并拉取特定的二进制码流，并将获取的二进制码流缓存至本地内存中)后，将二进制码流进行拆包与组帧，并将拆分封装位于不同传输包中的二进制码流去除封装信息，组合成完整的待解码视频帧码流，等待进行解码处理(包括基于HEVC标准采用的CABAC熵解码与重建处理)。

示例性的，在获取待解码视频帧码流后，按照设定码字长度从待解码视频帧码流中提取待解码码字。其中，本方案提供的设定码字长度根据操作系统位数进行设定，例如在视频解码设备的操作系统为64位或32位的操作系统时，设定码字长度为64位或32位，即采用64位或32位地址进行内存寻址，每次从本地内存的待解码视频帧码流中获取长度为64bit或32bit的待解码码字，只需要保证码流缓存的首地址是64位或32位对齐的，后续每次读取待解码码字时寻址都是向64位或32位对齐的，对内存寻址和缓存预取更为友好。相比传统解码器每次读取32bit或16bit(位数少于操作系统位数)的方式，在保证解码视频质量的前提下，能够显著减少内存读取的次数以及单次读取时间，提升视频解码效率。

在一个可能的实施例中，在二进制码流的编码方式对应的数据存放方式与操作系统的存放方式不一致时，可对待解码码字的存放方式进行转换，以适应操作系统。基于此，本方案在按照设定码字长度从待解码视频帧码流中获取待解码码字之后，还包括：将待解码码字的存放方式从大端序转换为小端序。

示例性的，以基于HEVC标准采用的CABAC编码，本方案提供的视频解码设备以x86或arm体系架构搭建为例，由于HEVC编码码流的存放方式属于大端序，而x86和arm体系架构均默认采用小端序，需要将取出的64bit或32bit的待解码码字码字由大端序转换为小端序，以保证正确解析码流。

S120：将待解码码字添加到熵解码引擎中，由熵解码引擎对待解码码字进行熵解码得到熵解码结果，熵解码的解码方式包括常规熵解码和多旁路熵解码，常规熵解码和多旁路熵解码分别基于不同编码语法进行配置得到。

示例性的，在从待解码视频帧码流中提取出待解码码字后，将待解码码字添加到熵解码引擎中，由熵解码引擎对待解码码字进行熵解码并得到熵解码结果。

本方案提供的熵解码引擎对待解码码字进行熵解码的解码方式包括常规熵解码(Normal bin熵解码)和多旁路熵解码(Bypass多bins解码)，并且常规熵解码和多旁路熵解码分别基于不同编码语法进行配置得到。其中常规熵解码单次可解析出一个熵解码结果，多旁路解码单次可解析出一个或多个熵解码结果。不同编码语法在二进制码流中的排列顺序以及编解码类型可由国际视频编码标准HEVC/H265规定好，熵解码引擎可按照国际视频编码标准规定的解码顺序进行设计，并在不同的解码阶段调用不同的解码方式进行熵解码。例如在熵解码变换块时，依次要解析的语法是块划分标志、cbf标志、量化系数绝对值和量化系数正负号，熵解码引擎对解码方式的调用顺序依次为常规熵解码、常规熵解码、常规熵解码和多旁路熵解码。

在一个可能的实施例中，如图2提供的一种对待解码码字进行熵解码的流程示意图所示，本方案提供的熵解码引擎对待解码码字进行熵解码得到熵解码结果时，包括步骤S1021-S1022：

S121：依次从待解码码字中获取待解码比特，并根据待解码比特所属编码语法确定解码方式。

S122：基于确定的解码方式对待解码比特进行解码得到熵解码结果。

示例性的，在待解码码字中包括一个或多个基于不同编码语法生成的待解码比特(bit)，熵解码引擎在获取到待解码码字后，依次从待解码码字中获取待解码比特，并确定这些待解码比特所属编码语法，并确定这些编码语法对应的解码方式。在确定这些待解码比特对应的解码方式后，基于对应的解码方式对这些待解码比特进行解码得到熵解码结果。在得到每个待解码比特对应的熵解码结果后，可基于多个待解码比特的熵解码结果得到待解码码字对应的熵解码结果。在完成当前待解码码字的熵解码后，可继续按照设定码字长度从待解码视频帧码流中提取下一段待解码码字进行熵解码，而熵解码得到的熵解码结果可进行下一步的重建处理。

在一个可能的实施例中，本方案提供的视频解码方法在每次进行一个待解码画面帧(每个画面帧包括多个待解码码字)的解码时，先对熵解码引擎进行初始化，例如根据设定码字长度初始化熵解码引擎的区间偏移值和编码区间，以完成熵解码引擎的初始化。

其中，熵解码引擎主要基于编码区间(range)和区间偏移值(offset)两个元素进行熵解码，HEVC标准下的编码区间在熵解码过程中不断递归划分，每次划分都将编码区间划分为大概率符号区间(rmps)和小概率符号区间(rlps)，通过观察区间偏移值落入大概率符号区间还是小概率符号区间，以决策出熵解码结果对应的解码值(bin＝0或bin＝1)。每确定一个熵解码结果后，判断编码区间是否小于设定精度阈值，例如将设定精度阈值设置为256，若更新后的编码区间小于256，则需要对编码区间进行归一化操作，扩大编码区间以保证下一个熵解码结果的解析精度。其中，对编码区间的归一化操作类似重新对编码区间初始化，即将编码区间重新扩展至与操作系统位数对齐的精度(例如将编码区间重新扩展至9bit)，并更新区间偏移值与缓存码字，其包含大量的移位操作和码流读取过程，本方案通过增加编码区间与区间偏移值的初始位数，显著增加编码区间的递归划分次数，降低编码区间小于256的概率，减少归一化次数，减少熵解码处理耗时。基于此，本方案在HEVC标准的基础上进行了针对性优化，HEVC标准采用510也即9个bit长度作为编码区间，区间偏移值初始化为码字的前9个bit所代表的数值，本方案为了降低归一化计算的次数，同时为了将内存操作和变量操作向操作系统位数(以64位操作系统为例)对齐，采用对编码区间进行偏移的方式，由9bit扩展至64bit长度，即编码区间初始值变为510<<55，同时区间偏移值初始偏移值对应变更为码字的前64bit所代表的数值，使得支持的区间递归划分次数增多，从而有效减少归一化的次数。另外，由于区间偏移值的初始化需要最少64bit长度的码字，需要将待解码码字的缓存单位变更为64bit，即每次从二进制码流中取出64bit的待解码码字备用。

在一个可能的实施例中，熵解码引擎根据待解码比特所属编码语法确定对待解码比特的解码方式，基于此，本方案提供的熵解码引擎在基于确定的解码方式对待解码比特进行解码得到熵解码结果时，包括：

S1221：基于待解码比特的解码方式为常规熵解码，对待解码比特进行编码区间量化，根据量化后的编码区间确定对应的概率符号区间，并根据概率符号区间与区间偏移值的比较结果确定待解码比特的熵解码结果。

S1222：基于待解码比特的解码方式为多旁路熵解码，根据需要解析的熵解码结果数量对待解码比特进行多旁路熵解码得到熵解码结果。

示例性的，在确定对待解码比特的解码方式为常规熵解码时，对待解码比特进行编码区间量化，根据预先设定的概率状态转移表确定量化后的编码区间对应的概率符号区间(概率符号区间包括大概率符号区间或小概率符号区间)。将对应的概率符号区间与区间偏移值进行比较，根据概率符号区间与区间偏移值的比较结果确定当前待解码比特的熵解码结果，即根据概率符号区间与区间偏移值的比较结果确定区间偏移值是落入大概率符号区间还是小概率符号区间，并在偏移值落入大概率符号区间时，将大概率符号值作为熵解码结果对应的解码值(即解码值bin＝val_mps)，而在偏移值落入小概率符号区间时，将小概率符号值作为熵解码结果对应的解码值(即解码值bin＝val_lps)。其中，大概率符号值val_mps是一个与概率状态、量化系数相关的动态变化值，其随概率状态变化而不断更新，并且与小概率符号值val_lps值相反，即当val_mps＝0时，val_lps＝1，当val_mps＝1时，val_lps＝0。

在一个可能的实施例中，在基于确定的解码方式对待解码比特进行解码得到熵解码结果之后，可根据量化后的编码区间对应的概率符号区间对编码区间和区间偏移值进行更新，在偏移值落入大概率符号区间时，利用大概率符号区间更新编码区间，而在偏移值落入小概率符号区间时，利用小概率符号区间更新编码区间，并利用大概率符号区间更新区间偏移值。例如对待解码比特进行编码区间量化后，根据结合当前的概率状态索引state，通过查找概率状态转移表得出小概率符号区间(根据编码区间与小概率符号区间的差可确定大概率符号区间)，并将区间偏移值与大概率符号区间进行比较。在区间偏移值大于等于大概率符号区间时，将小概率符号值作为熵解码结果对应的解码值，并将区间偏移值和大概率符号区间的差值作为更新后的区间偏移值，以及将小概率符号区间作为更新后的区间偏移值；而在区间偏移值小于大概率符号区间时，将大概率符号值作为熵解码结果对应的解码值，并将大概率符号区间作为更新后的区间偏移值。

基于此，本方案提供的熵解码引擎在根据概率符号区间与区间偏移值的比较结果确定待解码比特的熵解码结果时，包括：

S12211：响应于区间偏移值大于等于大概率符号区间的比较结果，将待解码比特的熵解码结果设置为小概率符号值，并通过区间偏移值和大概率符号区间的差值更新区间偏移值，以及通过小概率符号区间更新编码区间。

S12212：响应于区间偏移值小于大概率符号区间的比较结果，将待解码比特的熵解码结果设置为大概率符号值，并通过大概率符号区间更新编码区间。

示例性的，在对待解码比特进行编码区间量化，并根据量化后的编码区间确定对应的概率符号区间后，将概率符号区间中的大概率符号区间与区间偏移值进行比较。

在区间偏移值大于等于大概率符号区间时，认为偏移值落入小概率符号区间，则将小概率符号值作为待解码比特的熵解码结果(即熵解码结果bin＝val_lps)，并通过区间偏移值和大概率符号区间的差值更新区间偏移值(即offset-＝offset-rmps)，完成区间偏移值的更新，以及通过小概率符号区间更新区间偏移值(即range＝rlps)，完成编码区间的更新。

而在区间偏移值小于大概率符号区间时，认为偏移值落入大概率符号区间，则将大概率符号值作为待解码比特的熵解码结果(即熵解码结果bin＝val_mps)，并通过大概率符号区间更新区间偏移值(即range＝rmps)，完成编码区间的更新。

在一个可能的实施例中，本方案提供的熵解码引擎在基于确定的解码方式对待解码比特进行解码得到熵解码结果之后，还包括：响应于编码区间小于设定精度阈值，对区间偏移值和编码区间进行归一化操作。

示例性的，在每次解析待解码比特得到熵解码结果并更新编码区间之后，将更新后的编码区间与设定精度阈值(例如256)进行比较，在编码区间小于设定精度阈值时，表示当前编码区间已经过小，不能满足下一个熵解码结果的解析精度，需要对区间偏移值和编码区间进行归一化操作，即将区间偏移值和编码区间重新扩展至64bit，同时从二进制码流中读取新的64bit的待解码码字，保证解析出的熵解码结果的解析精度。

在相关技术中，如图3提供的相关技术中的常规解码流程示意图所示，国际视频编码标准HEVC规定初始编码区间为510，其采用9个bit表示，通过9个bit表示0-512的区间范围，区间偏移值根据码字的前9bit进行赋值，编码区间的区间量化过程基于qnt_range＝(range>>6)&3进行，相当于以2⁶为单位对编码区间进行量化，并取前缀1之后的2位结果作为区间量化值，结合当前的概率状态索引state，查找概率状态转移表得出小概率符号区间(rlps＝table[state][qnt_range])，与区间范围做减法可得大概率符号区间(rmps)，依据区间偏移值offset与大概率符号区间rmps比较结果，判断出结果落入大概率符号区间还是小概率符号区间，然后采取不同的区间范围更新策略，将大概率符号区间或小概率符号区间值设为新的区间范围(命中大概率符号区间值则将大概率符号区间值当作新的区间范围，命中小概率符号区间值则将小概率符号区间值当作新的区间范围)；当区间范围小于256时，代表区间范围精度需要提升，会执行一次归一化操作(re-normalization)，输出已经解析出的熵解码结果bin，并将区间范围重新归一化至510。

图4为本申请实施例提供的一种常规解码流程示意图，如图4所示，本方案换编码区间、区间偏移值和概率符号区间扩展到与操作系统位数相同的位数(如64位)上进行计算与比较，即每次获取的待解码码字的长度为64bit，编码区间赋值扩展至64bit，区间偏移值根据待解码码字前64bit进行赋值。本方案将编码区间由原来的9bit扩展至64bit，以初始值510<<55开始递归划分，在划分过程中，编码区间不断变小出现无用的前缀0，此时编码区间包括前缀0、9bit有效位、后缀0三部分，根据9bit首位非0原则，通过CLZ指令可以得出前缀0的位数clz，并且后缀0个数为64-9-clz＝55-clz，则编码区间量化过程变为(range>>(55-clz)>>6)&3＝(range>>(61-clz))&3。

然后，根据编码区间量化值与概率状态值查找概率状态转移表可得小概率符号区间(rlps＝table[state][qnt_range]<<(55-clz))，此时查概率状态转移表得到的rlps仍为9bit范围值，需要对齐到编码区间64bit中的有效9bit位置，实际为小概率符号区间rlps添加上相同的后缀0即可，即rlps<<(55-clz)。大概率符号区间rmps的计算公式不变，依旧为range-rlps。比较区间偏移值offset与大概率符号区间rmps，若offset≥rmps，代表以该offset偏移会落入小概率符号区间rlps，熵解码结果bin＝val_lps，并使用小概率符号区间rlps更新编码区间range。若offset<rmps，代表以该offset偏移会落入大概率符号区间，熵解码结果bin＝val_mps，并使用大概率符号区间rmps更新range。同时每次解析完一个熵解码结果后，检查编码区间是否小于256，编码区间小于256，则认为当前编码区间已经过小，不能满足下一个熵解码结果的解析精度，需要执行归一化操作(re-normalization)，将编码区间和区间偏移值重新扩展至64bit，同时从二进制码流中读取新的64bit的待解码码字。

可以理解的是，目前市场中主流的移动端设备均为64bit设计，移动端设备处理器的高速缓存cache，缓存单位一般为64bit，因此本方案通过对齐操作系统位数可利于内存的读写与数据处理。另外，以64bit长度对编码区间进行递归划分相比相关技术中以9bit对编码区间进行递归划分，本方案可支持的划分次数更多，能够大幅降低编码区间小于256的概率，有效减少归一化的次数以及绝对计算量，并且进入归一化分支的可能性降低，分支预测更加准确，减少分支预测失误造成的耗时。

在确定对待解码比特的解码方式为多旁路熵解码时，则根据在前解码得到的熵解码结果(在开始多旁路熵解码之前，会先根据已经解出来的熵解码结果判断多旁路解码应该解析多少的待解码比特，对待解码比特的解码结果即为熵解码结果)确定当前需要解析的熵解码结果数量，并根据需要解析的熵解码结果数量对待解码比特进行多旁路熵解码得到熵解码结果。

在对待解码比特进行多旁路熵解码时，可根据需要解析的熵解码结果数量，将对单个待解码比特进行熵解码需要的计算与赋值过程进行合并，重复计算与赋值等计算过程可直接采用单条指令一次性完成，替换掉了原来对多个待解码比特进行熵解码的多次重复的计算与赋值过程。

在一个可能的实施例中，本方案提供的熵解码引擎在根据需要解析的熵解码结果数量对待解码比特进行多旁路熵解码得到熵解码结果时，包括：

S12221：响应于需要解析的熵解码结果数量为第一预设值，对区间偏移值进行移位操作，将移位操作后的区间偏移值和待解码比特的或运算结果赋值给区间偏移值，并根据赋值得到的区间偏移值与编码区间的比较运算结果确定待解码比特的熵解码结果。

S12222：响应于需要解析的熵解码结果数量大于第一预设值，对区间偏移值进行与熵解码结果数量对应的移位操作，将移位操作后的区间偏移值和与熵解码结果数量对应的待解码比特的或运算结果赋值给区间偏移值，并根据赋值得到的区间偏移值与编码区间的除法运算结果确定与熵解码结果数量对应的待解码比特的熵解码结果。

示例性的，在对待解码比特进行多旁路熵解码时，确定需要解析的熵解码结果数量，并在需要解析的熵解码结果数量为第一预设值(例如第一预设值为1，即当前多旁路熵解码只需要对一个待解码比特进行熵解码)时，对区间偏移值进行移位操作(将区间偏移值向左移位一次，即offset＝offset<<1)。

在一个实施例中，将移位操作后的区间偏移值和待解码比特的进行或运算，并将区间偏移值和待解码比特的或运算结果赋值给区间偏移值(即offset|＝read_bits)。将根据赋值得到的区间偏移值与编码区间进行比较，根据区间偏移值与编码区间的比较运算结果确定待解码比特的熵解码结果，例如在区间偏移值大于编码区间时，确定熵解码结果为第二预设值(例如bin＝1)，而在区间偏移值小于或等于编码区间时，确定熵解码结果为第三预设值(例如bin＝0)。

在一个可能的实施例中，本方案提供的熵解码引擎在根据赋值得到的区间偏移值与编码区间的比较运算结果确定待解码比特的熵解码结果时，包括：响应于赋值得到的区间偏移值大于编码区间的比较运算结果，将待解码比特的熵解码结果设置为第二预设值，并通过区间偏移值和大概率符号区间的差值更新区间偏移值；响应于赋值得到的区间偏移值小于等于编码区间的比较运算结果，将待解码比特的熵解码结果设置为第三预设值。

示例性的，在赋值得到的区间偏移值大于编码区间时，将待解码比特的熵解码结果设置为第二预设值(例如将待解码比特的熵解码结果设置为1)，并通过区间偏移值和大概率符号区间的差值更新区间偏移值(即offset-＝range)。而在赋值得到的区间偏移值小于等于编码区间时，则将待解码比特的熵解码结果设置为第三预设值(例如将待解码比特的熵解码结果设置为0)。其中，在多旁路解码流程中，概率符号区间对应的符号概率始终等于0.5，大概率符号区间和小概率符号区间相等，编码区间的大小是固定的，也不需要对编码区间进行更新。

示例性的，在需要解析的熵解码结果数量大于第一预设值时，则对区间偏移值进行与熵解码结果数量对应的移位操作(将区间偏移值向左移位与需要解析的熵解码结果数量相同的次数)，将移位操作后的区间偏移值和与需要解析的熵解码结果数量对应的待解码比特进行或运算(将区间偏移值同时和多个待解码比特进行或运算)，并将或运算结果赋值给区间偏移值，并根据赋值得到的区间偏移值与编码区间的除法运算结果确定与熵解码结果数量对应的待解码比特的熵解码结果。其中，区间偏移值与编码区间比较得到熵解码结果的过程则与除法类似，对区间偏移值与编码区间做除法运算(即offset/range)的结果等同于多次(与熵解码结果数量一致)比较区间偏移值与编码区间后的熵解码结果。

需要进行解释的是，多旁路解码存在解析一熵解码结果和解析连续多个熵解码结果两种情况。解析一个熵解码结果的熵解码流程包含一次区间偏移值向左移位、一次区间偏移值和待解码码字中的单个待解码比特的或运算、一次区间偏移值、编码区间的比较运算以及熵解码结果的赋值等过程。而解析连续多个熵解码结果与解析一个熵解码结果过程类似，属于上述过程的重复循环，这为运算合并、一次性解析多个熵解码结果提供了可能。其中重复的移位、或运算可直接采用单条指令一次性完成。假设待解析的熵解码结果个数为5，则执行5次offset<<1、offset|＝read_bits(1)，上述运算可以合并为offset<<5、offset|＝read_bits(5)。区间偏移值与编码区间比较得到熵解码结果的过程则与除法类似，offset/range的结果等同于5次比较区间偏移值与编码区间后的熵解码结果。另外，多旁路解码只有在熵解码结果为第二预设值(即bin＝1)时才会执行区间偏移值更新操作(即offset-＝range)，因此，在最后使用除法得到5个熵解码结果总值后，使用基于公式offset＝offset-bins*range即可一次性得到更新后最终的区间偏移值。本方案在对多个待解码比特进行多旁路解码时，采用一次移位、一次或运算、一次除法、一次乘法，替换掉了原来的多次移位、多次或运算、多次比较与赋值过程，可显著降低解码时间，提升解码速度。

S130：对熵解码结果进行重建处理得到重建帧。

示例性的，在得到熵解码处理结果后，可对熵解码结果进行重建处理得到重建帧。其中，熵解码是基于二进制解析规则，把二进制码流(待解码码字)解析成各种类型、长度的数值，熵解码引擎依照国际视频编码标准HEVC规定的语法顺序，将这些解析出来的数值赋以实际含义，如视频的宽高尺寸、量化步长、参考帧号以及残差系数等各种信息，这些信息可作为完成下一步的视频重建的数据。

例如，对熵解码结果进行的重建处理包含反变换、反量化、预测解码、后处理滤波等流程，负责完成一帧像素值的重建。其中，反变换负责将解析出的变换系数(熵解码引擎会根据待解码码字解析出大量的语法信息，在这些语法信息中占比最高的是变换系数，变换系数是每一视频帧的所有像素残差值在变换域的映射)从变换域映射到像素域得到像素残差系数，反量化负责根据量化步长进一步将像素残差系数补偿成尽可能连续的残差值，预测解码负责通过帧内/帧间预测得到预测块，并与像素残差系数叠加完成初步重建，后处理滤波根据滤波参数确定采用去块滤波和样点自适应补偿，以去除重建帧的块效应与振铃效应，完成一帧的重建得到重建帧。

在一个可能的实施例中，在对熵解码结果进行重建处理得到重建帧后，可将解码成功的信号以及重建帧的内存地址发送给应用层，由应用层基于重建帧进行视频画面的显示。应用层在接收到解码器(包括熵解码引擎和重建模块)返回的解码成功的信号，从解码器提供的内存地址拷贝出解码完成的视频帧，再经过渲染、缩放、美颜等一系列图像处理后即可进行显示。

上述，通过按照根据操作系统位数确定的设定码字长度从待解码视频帧码流中获取待解码码字，并将待解码码字提交给熵解码引擎进行熵解码得到熵解码结果，并对熵解码结果进行重建处理得到重建帧，读取的待解码码字的长度与操作系统位数对齐，后续每次读取待解码码字时，内存寻址向操作系统位数对齐，有效减少单次读取时间以及内存读取的次数，并且通过多旁路解码对多个待解码码字进行熵解码处理，减少熵解码处理的计算量与耗时，在无需单独设计硬件电路，且无需开启多个解码线程的情况下，有效提升了视频解码速度。并显著降低移动终端解码HEVC视频的耗时，解决了由于CABAC熵解码造成的解码速度瓶颈问题，并通过调整熵解码引擎架构，使架构与移动终端相适配，减少了归一化计算的次数，并从内存、缓存读取以及分支预测的角度，提升解码速度。同时，通过多旁路解码的解码方式一次解析出多个熵解码结果，减少对多个待解码比特进行熵解码的绝对计算量，降低解码耗时。并减少对特殊硬件电路单元的依赖，在终端处理器上即可运行，易于部署，同时无需开启多个解码线程，以功耗增加为代价换取解码速度，实用性更高，视频播放流畅更高，并延长视频解码设备的电池可支撑播放时长，提供更加流畅且持久的观看体验。

图5是本申请实施例提供的一种视频解码装置的结构示意图。参考图5，该视频解码装置包括码字提取模块51、熵解码模块52和重建处理模块53。

其中，码字提取模块51配置为按照设定码字长度从待解码视频帧码流中获取待解码码字，设定码字长度根据操作系统位数进行设定；熵解码模块52配置为将待解码码字添加到熵解码引擎中，由熵解码引擎对待解码码字进行熵解码得到熵解码结果，熵解码的解码方式包括常规熵解码和多旁路熵解码，常规熵解码和多旁路熵解码分别基于不同编码语法进行配置得到；重建处理模块53配置为对熵解码结果进行重建处理得到重建帧。

上述，通过按照根据操作系统位数确定的设定码字长度从待解码视频帧码流中获取待解码码字，并将待解码码字提交给熵解码引擎进行熵解码得到熵解码结果，并对熵解码结果进行重建处理得到重建帧，读取的待解码码字的长度与操作系统位数对齐，后续每次读取待解码码字时，内存寻址向操作系统位数对齐，有效减少单次读取时间以及内存读取的次数，并且通过多旁路解码对多个待解码码字进行熵解码处理，减少熵解码处理的计算量与耗时，在无需单独设计硬件电路，且无需开启多个解码线程的情况下，有效提升了视频解码速度。

在一个可能的实施例中，熵解码引擎对待解码码字进行熵解码得到熵解码结果时，配置为：

依次从待解码码字中获取待解码比特，并根据待解码比特所属编码语法确定解码方式；

基于确定的解码方式对待解码比特进行解码得到熵解码结果。

在一个可能的实施例中，熵解码引擎基于确定的解码方式对待解码比特进行解码得到熵解码结果时，配置为：

基于待解码比特的解码方式为常规熵解码，对待解码比特进行编码区间量化，根据量化后的编码区间确定对应的概率符号区间，并根据概率符号区间与区间偏移值的比较结果确定待解码比特的熵解码结果；

基于待解码比特的解码方式为多旁路熵解码，根据需要解析的熵解码结果数量对待解码比特进行多旁路熵解码得到熵解码结果。

在一个可能的实施例中，概率符号区间包括大概率符号区间和小概率符号区间，熵解码引擎根据概率符号区间与区间偏移值的比较结果确定待解码比特的熵解码结果，配置为：

响应于区间偏移值大于等于大概率符号区间的比较结果，将待解码比特的熵解码结果设置为小概率符号值，并通过区间偏移值和大概率符号区间的差值更新区间偏移值，以及通过小概率符号区间更新编码区间；

响应于区间偏移值小于大概率符号区间的比较结果，将待解码比特的熵解码结果设置为大概率符号值，并通过大概率符号区间更新编码区间。

在一个可能的实施例中，熵解码引擎根据需要解析的熵解码结果数量对待解码比特进行多旁路熵解码得到熵解码结果时，配置为：

响应于需要解析的熵解码结果数量为第一预设值，对区间偏移值进行移位操作，将移位操作后的区间偏移值和待解码比特的或运算结果赋值给区间偏移值，并根据赋值得到的区间偏移值与编码区间的比较运算结果确定待解码比特的熵解码结果；

响应于需要解析的熵解码结果数量大于第一预设值，对区间偏移值进行与熵解码结果数量对应的移位操作，将移位操作后的区间偏移值和与熵解码结果数量对应的待解码比特的或运算结果赋值给区间偏移值，并根据赋值得到的区间偏移值与编码区间的除法运算结果确定与熵解码结果数量对应的待解码比特的熵解码结果。

在一个可能的实施例中，熵解码引擎根据赋值得到的区间偏移值与编码区间的比较运算结果确定待解码比特的熵解码结果时，配置为：

响应于赋值得到的区间偏移值大于编码区间的比较运算结果，将待解码比特的熵解码结果设置为第二预设值，并通过区间偏移值和大概率符号区间的差值更新区间偏移值；

响应于赋值得到的区间偏移值小于等于编码区间的比较运算结果，将待解码比特的熵解码结果设置为第三预设值。

在一个可能的实施例中，熵解码引擎配置为基于确定的解码方式对待解码比特进行解码得到熵解码结果之后，响应于编码区间小于设定精度阈值，对区间偏移值和编码区间进行归一化操作。

在一个可能的实施例中，视频解码装置还包括引擎初始化模块，引擎初始化模块配置为根据设定码字长度初始化熵解码引擎的区间偏移值和编码区间

在一个可能的实施例中，熵解码引擎配置为按照设定码字长度从待解码视频帧码流中获取待解码码字之后，将待解码码字的存放方式从大端序转换为小端序。

值得注意的是，上述视频解码装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本申请实施例的保护范围。

本申请实施例还提供了一种视频解码设备，该视频解码设备可集成本申请实施例提供的视频解码装置。图6是本申请实施例提供的一种视频解码设备的结构示意图。参考图6，该视频解码设备包括：输入装置63、输出装置64、存储器62以及一个或多个处理器61；存储器62，配置为存储一个或多个程序；当一个或多个程序被一个或多个处理器61执行，使得一个或多个处理器61实现如上述实施例提供的视频解码方法。上述提供的视频解码装置、设备和计算机可配置为执行上述任意实施例提供的视频解码方法，具备相应的功能和有益效果。

本申请实施例还提供一种存储计算机可执行指令的存储介质，计算机可执行指令在由计算机处理器执行时配置为执行如上述实施例提供的视频解码方法。当然，本申请实施例所提供的一种存储计算机可执行指令的存储介质，其计算机可执行指令不限于如上提供的视频解码方法，还可以执行本申请任意实施例所提供的视频解码方法中的相关操作。上述实施例中提供的视频解码装置、设备及存储介质可执行本申请任意实施例所提供的视频解码方法，未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的视频解码方法。

在一些可能的实施方式中，本公开提供的方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当上述程序产品在计算机设备上运行时，程序代码配置为使上述计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的方法中的步骤，例如，计算机设备可以执行本公开实施例所记载的视频解码方法。其中，程序产品可以采用一个或多个可读介质的任意组合。

Claims

一种视频解码方法，其中，包括：

按照设定码字长度从待解码视频帧码流中获取待解码码字，所述设定码字长度根据操作系统位数进行设定；

将所述待解码码字添加到熵解码引擎中，由所述熵解码引擎对所述待解码码字进行熵解码得到熵解码结果，所述熵解码的解码方式包括常规熵解码和多旁路熵解码，所述常规熵解码和所述多旁路熵解码分别基于不同编码语法进行配置得到；

对所述熵解码结果进行重建处理得到重建帧。
根据权利要求1所述的视频解码方法，其中，所述熵解码引擎对所述待解码码字进行熵解码得到熵解码结果时，包括：

依次从所述待解码码字中获取待解码比特，并根据所述待解码比特所属编码语法确定解码方式；

基于确定的解码方式对所述待解码比特进行解码得到熵解码结果。
根据权利要求2所述的视频解码方法，其中，所述基于确定的解码方式对所述待解码比特进行解码得到熵解码结果，包括：

基于所述待解码比特的解码方式为常规熵解码，对所述待解码比特进行编码区间量化，根据量化后的所述编码区间确定对应的概率符号区间，并根据所述概率符号区间与区间偏移值的比较结果确定所述待解码比特的熵解码结果；

基于所述待解码比特的解码方式为多旁路熵解码，根据需要解析的熵解码结果数量对所述待解码比特进行多旁路熵解码得到熵解码结果。
根据权利要求3所述的视频解码方法，其中，所述概率符号区间包括大概率符号区间和小概率符号区间，所述根据所述概率符号区间与区间偏移值的比较结果确定所述待解码比特的熵解码结果，包括：

响应于区间偏移值大于等于大概率符号区间的比较结果，将所述待解码比特的熵解码结果设置为小概率符号值，并通过所述区间偏移值和大概率符号区间的差值更新所述区间偏移值，以及通过小概率符号区间更新所述编码区间；

响应于区间偏移值小于大概率符号区间的比较结果，将所述待解码比特的熵解码结果设置为大概率符号值，并通过大概率符号区间更新所述编码区间。
根据权利要求3所述的视频解码方法，其中，所述根据需要解析的熵解码结果数量对所述待解码比特进行多旁路熵解码得到熵解码结果，包括：

响应于需要解析的熵解码结果数量为第一预设值，对区间偏移值进行移位操作，将移位操作后的所述区间偏移值和所述待解码比特的或运算结果赋值给所述区间偏移值，并根据赋值得到的所述区间偏移值与编码区间的比较运算结果确定所述待解码比特的熵解码结果；

响应于需要解析的熵解码结果数量大于所述第一预设值，对区间偏移值进行与所述熵解码结果数量对应的移位操作，将移位操作后的所述区间偏移值和与所述熵解码结果数量对应的待解码比特的或运算结果赋值给所述区间偏移值，并根据赋值得到的所述区间偏移值与编码区间的除法运算结果确定与所述熵解码结果数量对应的待解码比特的熵解码结果。
根据权利要求5所述的视频解码方法，其中，所述根据赋值得到的所述区间偏移值与编码区间的比较运算结果确定所述待解码比特的熵解码结果，包括：

响应于赋值得到的所述区间偏移值大于编码区间的比较运算结果，将所述待解码比特的熵解码结果设置为第二预设值，并通过所述区间偏移值和大概率符号区间的差值更新所述区间偏移值；

响应于赋值得到的所述区间偏移值小于等于编码区间的比较运算结果，将所述待解码比特的熵解码结果设置为第三预设值。
根据权利要求3所述的视频解码方法，其中，所述基于确定的解码方式对所述待解码比特进行解码得到熵解码结果之后，还包括：

响应于所述编码区间小于设定精度阈值，对所述区间偏移值和所述编码区间进行归一化操作。
根据权利要求3所述的视频解码方法，其中，所述视频解码方法还包括：

根据设定码字长度初始化熵解码引擎的区间偏移值和编码区间。
根据权利要求1-8任一项所述的视频解码方法，其中，所述按照设定码字长度从待解码视频帧码流中获取待解码码字之后，还包括：

将所述待解码码字的存放方式从大端序转换为小端序。
一种视频解码装置，其中，包括码字提取模块、熵解码模块和重建处理模块，其中：

所述码字提取模块，配置为按照设定码字长度从待解码视频帧码流中获取待解码码字，所述设定码字长度根据操作系统位数进行设定；

所述熵解码模块，配置为将所述待解码码字添加到熵解码引擎中，由所述熵解码引擎对所述待解码码字进行熵解码得到熵解码结果，所述熵解码的解码方式包括常规熵解码和多旁路熵解码，所述常规熵解码和所述多旁路熵解码分别基于不同编码语法进行配置得到；

所述重建处理模块，配置为对所述熵解码结果进行重建处理得到重建帧。
一种视频解码设备，其中，包括：存储器以及一个或多个处理器；

所述存储器，配置为存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9任一项所述的视频解码方法。
一种存储计算机可执行指令的存储介质，其中，所述计算机可执行指令在由计算机处理器执行时配置为执行如权利要求1-9任一项所述的视频解码方法。
一种计算机程序产品，包括计算机程序，其中，所述计算机程序被处理器执行时实现权利要求1-9任一项所述的视频解码方法。