CN111083475A

CN111083475A - 量化变换系数管理装置及适用于hevc标准的编码器

Info

Publication number: CN111083475A
Application number: CN201911417923.6A
Authority: CN
Inventors: 诸悦; 陈晓春; 刘易华; 潘柳含; 肖君寿
Original assignee: Shanghai Fullhan Microelectronics Co ltd
Current assignee: Shanghai Fullhan Microelectronics Co ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-04-28
Anticipated expiration: 2039-12-31
Also published as: CN111083475B

Abstract

本发明提供一种量化变换系数管理装置，包括：第一管理模块，所述第一管理模块包括：第一存储单元和第一处理单元。通过所述第一存储单元和所述第一处理单元，所述第一管理模块能够快速存取和管理所述第一管理单元输出的部分量化变换系数和第一编码单元的量化变换系数，仅使用一个存储单元实现了不同尺寸的编码单元的量化变换系数的数据共享，避免了不同尺寸的编码单元都需要独立的存储单元的情况，从而避免了多个存储单元中的量化变换系数被不停地被选择、搬移或丢弃的情况，降低了所述第一存储单元的压缩容量，从而减少了硬件开销，同时也降低了所述第一存储单元的运行功耗，提高了所述量化变换系数管理装置的工作效率。

Description

量化变换系数管理装置及适用于HEVC标准的编码器

技术领域

本发明涉及数字视频处理技术领域，特别涉及一种量化变换系数管理装置及适用于HEVC标准的编码器。

背景技术

为了支持高清视频应用，联合视频编码组(Joint Collaborative Team on VideoCoding,JVT-VC)提出了高效视频编码(High Efficiency Video Coding，HEVC)作为通用视频编码标准。

四叉树分解技术是HEVC的一项重要编码工具，一帧图像被分割为多个树形编码单元(coding tree unit，CTU)，一个CTU可以根据所述四叉树分解技术被分割为多个编码单元(coding unit，CU)，所述CU的尺寸通常包括：4×4、8×8、16×16、32×32和64×64。

参考图1，图1是现有技术中适用于HEVC标准的编码器示意图，量化变换系数管理模块从一个或多个量化模块接收若干量化变换系数，所述量化变换系数构成不同尺寸的CU，不同尺寸的CU对应所述量化变换系数管理模块内部的不同的存储单元，所以量化变换系数存储在多个独立的存储单元中，后续量化变换系数管理模块通过模式判决给一个或多个反量化模块和熵编码模块提供局部或全局最优的量化变换系数。

在模式判决前，每一个尺寸的CU需要存储一个帧间模式，一个融合模式以及一个帧内模式所对应的量化变换系数才能保证一旦选中任何一种模式时都可以立刻得到量化变换系数用于重构图像操作或者用于生成HEVC码流。以量化变换系数管理模块接收并管理8x8/16x16/32x32/64x64这4个尺寸的CU为例，这意味着所述量化变换系数管理模块一共需要存储24480个量化变换系数，再考虑到所述熵编码模块通常在流水线上滞后一个CTU以利于硬件实现，因此所述量化变换系数管理模块中还需要为前一个CTU所选择的全局最优模式的量化变换系数保留空间，合计30624个量化变换系数，以最大可能的系数值16bit来计算，共计需要489984bit的存储开销。

在模式判决时，所述量化变换系数管理模块根据外部的模式判决模块的RDO模式判决信息对所述量化变换系数进行模式判决以将存储着的局部或全局最优模式的量化变换系数提供给一个或多个反量化模块用于重构图像操作，同时也将所述全局最优模式的量化变换系数发送至熵编码模块用于生成HEVC码流。目前为了满足对应四叉树上不同深度搜索路径的并行搜索，不同尺寸的CU均对应有独立的管理模块和存储单元，所以所述量化变换系数管理模块接受来自模式判决模块的所述RDO模式判决信息进行模式判决时，所述量化变换系数管理模块内部不同的存储单元中选择、搬移或丢弃所述量化变换系数，反复的数据搬移不仅浪费了所述量化变换系数管理模块的带宽，还浪费了功耗。

由此可见，模式判决前，所述量化变换系数管理模块需要存储大量的量化变换系数，存储开销大；模式判决时，所述量化变换系数管理模块需要在内部不同的存储单元中选择、搬移或丢弃所述量化变换系数，处理时间长，从而使得量化变换系数管理模块的硬件复杂度变得很高。

发明内容

本发明的目的在于提供一种量化变换系数管理装置及适用于HEVC标准的编码器，以解决量化变换系数管理装置在管理量化变换系数时存取的功耗较大的问题。

为解决上述技术问题，本发明提供一种量化变换系数管理装置，包括：

第一管理模块，用于管理外部的量化模块输出的第一编码单元的量化变换系数，所述第一管理模块包括：第一存储单元和第一处理单元，所述第一存储单元用于存放所述第一编码单元的量化变换系数；所述第一处理单元用于存储所述第一编码单元的量化变换系数的管理信息，以及用于控制所述第一存储单元内的所述量化变换系数向外部的所述反量化模块和外部的熵编码模块输出；其中，所述第一编码单元的尺寸包括4×4、8×8、16×16、32×32和64×64。

可选的，在所述量化变换系数管理装置中，所述量化变换系数管理装置还包括：第二管理模块，用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块包括：第二存储单元和第二处理单元，所述第二存储单元用于存放所述第二编码单元的量化变换系数；所述第二处理单元用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元内的所述量化变换系数向外部的反量化模块和所述第一管理模块输出；其中，所述第二编码单元的尺寸包括4×4和8×8。

可选的，在所述量化变换系数管理装置中，所述第一管理模块还用于管理所述第二管理模块输出的量化变换系数；所述第一存储单元还用于存放所述第二管理模块输出的量化变换系数；所述第一处理单元还用于存储所述第二管理模块输出的量化变换系数的管理信息。

可选的，在所述量化变换系数管理装置中，根据外部的模式判决模块的局部RDO模式判决信息，所述第二处理单元在所述第二编码单元的量化变换系数中选出局部最优模式的量化变换系数，并将所述局部最优模式的量化变换系数向外部的反量化模块和所述第一管理模块输出。

可选的，在所述量化变换系数管理装置中，根据外部的模式判决模块的局部RDO模式判决信息和全局RDO模式判决信息，所述第一处理单元在所述局部最优模式的量化变换系数和所述第一编码单元的量化变换系数中选出局部最优模式的量化变换系数，并将所述局部最优模式的量化变换系数向外部的所述反量化模块输出，同时，所述第一处理单元在所述局部最优模式的量化变换系数和所述第一编码单元的量化变换系数中选出全局最优模式的量化变换系数，并将所述全局最优模式的量化变换系数向外部的熵编码模块输出。

可选的，在所述量化变换系数管理装置中，在所述第一管理模块中，采用嵌入压缩算法对所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数进行压缩以使所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数呈压缩的状态存放于所述第一存储单元中。

可选的，在所述量化变换系数管理装置中，所述第一处理单元对存放于所述第一存储单元内的量化变换系数和所述局部最优模式的量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块接收解压缩后的所述局部最优模式的量化变换系数，以及以使外部的所述熵编码模块接收解压缩后的所述全局最优模式的量化变换系数。

可选的，在所述量化变换系数管理装置中，在所述第二管理模块中，采用嵌入压缩算法对所述第二编码单元的量化变换系数进行压缩以使所述第二编码单元的量化变换系数呈压缩的状态存放于所述第二存储单元中。

可选的，在所述量化变换系数管理装置中，所述第二处理单元对存放于所述第二存储单元内的所述量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块和所述第一管理模块接收解压缩后的所述局部最优模式的量化变换系数。

可选的，在所述量化变换系数管理装置中，所述第一存储单元采用按页分配、回收以及单链表管理方式存放所述第一编码单元的量化变换系数和所述第二管理模块输出的量化变换系数。

可选的，在所述量化变换系数管理装置中，所述第二存储单元采用按页分配、回收以及单链表管理方式存放所述第二编码单元的量化变换系数。

可选的，在所述量化变换系数管理装置中，所述量化变换系数管理装置还包括：仲裁器，所述仲裁器用于协调所述第二处理单元对所述第二存储单元内的所述量化变换系数的读/写访问，以及用于协调所述第一处理单元对所述第一存储单元内的所述量化变换系数的读/写访问。

基于同一发明构思，本发明还提供一种适用于HEVC标准的编码器，包括：

量化变换系数管理装置，所述量化变换系数管理装置包括第一管理模块，所述第一管理模块用于管理外部输入的第一编码单元的量化变换系数，所述第一管理模块包括：第一存储单元和第一处理单元，所述第一存储单元用于存放所述第一编码单元的量化变换系数；所述第一处理单元用于存储所述第一编码单元的量化变换系数的管理信息，以及用于控制所述第一存储单元内的所述量化变换系数向外部的所述反量化模块和外部的熵编码模块输出；其中，所述第一编码单元的尺寸包括4×4、8×8、16×16、32×32和64×64。

量化模块，用于给所述量化变换系数管理装置的第一管理模块提供第一编码单元的量化变换系数；

反量化模块，用于接收所述量化变换系数管理装置的第一管理模块输出的量化变换系数；以及，

熵编码模块，用于接收所述量化变换系数管理装置的第一管理模块输出的量化变换系数。

模式判决模块，用于给所述量化变换系数管理装置的第一处理单元提供所述局部RDO模式判决信息以及所述全局RDO模式判决信息。

可选的，在所述适用于HEVC标准的编码器中，所述量化变换系数管理装置还包括：第二管理模块，用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块包括：第二存储单元和第二处理单元，所述第二存储单元用于存放所述第二编码单元的量化变换系数；所述第二处理单元用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元内的所述量化变换系数向外部的反量化模块和所述第一管理模块输出；其中，所述第二编码单元的尺寸包括4×4和8×8。

可选的，在所述适用于HEVC标准的编码器中，所述量化模块还用于给所述量化变换系数管理装置的第二管理模块提供第二编码单元的量化变换系数。

可选的，在所述适用于HEVC标准的编码器中，所述反量化模块还用于接收所述量化变换系数管理装置的第二管理模块输出的量化变换系数。

可选的，在所述适用于HEVC标准的编码器中，所述模式判决模块还用于给所述量化变换系数管理装置的第二处理单元提供局部RDO模式判决信息。

综上，本发明提供了一种量化变换系数管理装置，包括：第一管理模块，所述第一管理模块包括：第一存储单元和第一处理单元。通过所述第一存储单元和所述第一处理单元，所述第一管理模块能够快速存取和管理所述第一管理单元输出的部分量化变换系数和第一编码单元的量化变换系数，仅使用一个存储单元实现了不同尺寸的编码单元的量化变换系数的数据共享，避免了不同尺寸的编码单元都需要独立的存储单元的情况，从而避免了多个存储单元中的量化变换系数被不停地被选择、搬移或丢弃的情况，降低了所述第一存储单元的压缩容量，从而减少了硬件开销，同时也降低了所述第一存储单元的运行功耗，提高了所述量化变换系数管理装置的工作效率。进一步的，本发明还提供了一种适用于HEVC标准的编码器，包括：量化变换系数管理装置、量化模块、反量化模块、熵编码模块和模式判决模块，利用所述量化变换系数管理装置，所述反量化模块和熵编码模块能够快速接收到优化的量化变换系数以快速进行下一步处理，提高了该编码器的工作效率。

附图说明

图1是现有技术中适用于HEVC标准的编码器示意图；

图2是本发明实施例的量化变换系数管理装置结构框图；

图3是本发明实施例的适用于HEVC标准的编码器示意图；

图4是本发明实施例的第一存储单元工作示意图；

其中，100-量化变换系数管理装置，20-第一管理模块，21-全局最优模式的量化变换系数，10-第二管理模块，11-局部最优模式的量化变换系数，30-仲裁器，110-第二存储单元，120-第二处理单元，210-第一存储单元，220-第一处理单元。

具体实施方式

以下结合附图和具体实施例对本发明提出的量化变换系数管理装置及适用于HEVC标准的编码器作进一步详细说明。根据下面说明，本发明的优点和特征将更清楚。需说明的是，附图均采用非常简化的形式且均使用非精准的比例，仅用以方便、明晰地辅助说明本发明实施例的目的。此外，附图所展示的结构往往是实际结构的一部分。特别的，各附图需要展示的侧重点不同，有时会采用不同的比例。

本发明提供一种量化变换系数管理装置，参考图2和图3，图2是本发明实施例的量化变换系数管理装置结构框图，图3是本发明实施例的适用于HEVC标准的编码器示意图，所述量化变换系数管理装置100包括：第一管理模块20。所述第一管理模块20用于管理外部的量化模块输出的第一编码单元的量化变换系数。所述第一管理模块20包括：第一存储单元210和第一处理单元220，所述第一存储单元210用于存放所述第一编码单元的量化变换系数；所述第一处理单元220用于存储所述第一编码单元的量化变换系数的管理信息，以及用于控制所述第一存储单元210内的所述量化变换系数向外部的所述反量化模块和外部的熵编码模块输出；其中，所述第一编码单元的尺寸包括4×4、8×8、16×16、32×32和64×64，也就是说，所述第一管理模块20管理所有尺寸的CU(4×4、8×8、16×16、32×32和64×64)的量化变换系数的存取。本发明中，可以仅使用一个存储单元实现了不同尺寸的编码单元的量化变换系数的数据共享，避免了不同尺寸的编码单元都需要独立的存储单元的情况，从而避免了多个存储单元中的量化变换系数被不停地被选择、搬移或丢弃的情况，降低了所述第一存储单元的压缩容量，从而减少了硬件开销，同时也降低了所述第一存储单元的运行功耗，提高了所述量化变换系数管理装置的工作效率。

进一步的，如图2和图3所示，所述量化变换系数管理装置还可以包括：第二管理模块10，所述第二管理模块10用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块10包括：第二存储单元110和第二处理单元120，所述第二存储单元110用于存放所述第二编码单元的量化变换系数；所述第二处理单元120主要用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元110内的所述量化变换系数向外部的反量化模块和所述第一管理模块20输出；其中，所述第二编码单元的尺寸包括4×4和8×8，也就是说，所述第二管理模块10管理小尺寸CU(8×8和4×4)的量化变换系数的存取。本发明中，所述第二管理模块10进一步优化所述量化变换系数管理装置，在增加所述第二管理模块10的基础上，可以仅使用两个存储单元(所述第二存储单元110和所述第一存储单元210)实现了不同尺寸的编码单元的量化变换系数的数据共享，避免了不同尺寸的编码单元都需要独立的存储单元的情况，从而避免了多个存储单元中的量化变换系数被不停地被选择、搬移或丢弃的情况，从而降低了所述第二存储单元和所述第一存储单元的运行功耗，提高了所述量化变换系数管理装置的工作效率。

在本实施例中，所述第一管理模块20还用于管理所述第二管理模块输出的量化变换系数；所述第一存储单元210还用于存放所述第二管理模块10输出的量化变换系数；所述第一处理单元220还用于存储所述第二管理模块10输出的量化变换系数的管理信息。

在本实施例中，根据外部的模式判决模块的局部RDO模式判决信息，所述第二处理单元120在所述第二编码单元的量化变换系数中选出局部最优模式的量化变换系数11，并将所述局部最优模式的量化变换系数11向外部的反量化模块和所述第一管理模块20输出。输出所述局部最优模式的量化变换系数11时，将所述第二存储单元110内与所述局部最优模式的量化变换系数11相同的量化变换系数释放。例如，一个8x8的CU的帧间模式被选为局部最优模式的量化变换系数11，就将局部最优模式的量化变换系数11(包括亮度系数及色度系数)发送至外部的所述反量化模块以及所述第一管理模块20，同时释放所述第二存储单元110内与所述局部最优模式的CU相同的CU以及该CU所包含的量化变换系数及所有下层CU所包含的量化变换系数。

进一步的，根据外部的模式判决模块的局部RDO模式判决信息和全局RDO模式判决信息，所述第一处理单元220在所述局部最优模式的量化变换系数11和所述第一编码单元的量化变换系数中选出局部最优模式的量化变换系数11，并将所述局部最优模式的量化变换系数11向外部的所述反量化模块输出，同时，所述第一处理单元220在所述局部最优模式的量化变换系数和所述第一编码单元的量化变换系数中选出全局最优模式的量化变换系数21，并将所述全局最优模式的量化变换系数21向外部的熵编码模块输出。

较佳的，在所述第一管理模块中，采用嵌入压缩算法对所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数11进行压缩以使所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数11呈压缩的状态存放于所述第一存储单元210中。同样的，在所述第二管理模块10中，采用嵌入压缩算法对所述第二编码单元的量化变换系数进行压缩以使所述第二编码单元的量化变换系数呈压缩的状态存放于所述第二存储单元110中。此外，所述第二存储单元110按照16系数即256bit为单位管理，也可以不使用所述嵌入压缩算法，所述第二管理模块10可以使用直接映射表管理所述第二存储单元110的空间，即当量化变换系数输入时即从所述第二存储单元110中分配一个16系数的空间存放数据。本发明对所述第二管理模块是否采用嵌入压缩算法不做任何限定。具体的，本实施例以基本单位为4x4的CU为例，具体介绍所述嵌入压缩算法，本发明中使用双模式的嵌入压缩算法，4x4的CU一共有16个量化变换系数，记为c_i。每个量化变换系数为16bit，其中c₀为直流量化变换系数。压缩前16个c_i总长度为256bit。首先所述量化变换系数c_i需要经过变换以得到c_i′，具体的变换公式如下：

然后，计算c_i′的有效位宽，计算c_i′的有效位宽的公式如下：

其中，

接着，将c₀′截位到位宽bw+1；将c_i′,i∈[0,15]截位到位宽bw。参考表1，在Mode＝＝0中，截位后的c_i′依次存放在coeff字段内，c_i的符号则依次保存在sign字段内，各字段连续存放。其中，标志CBF表示当前块是否全0，如果CBF＝＝1则跳过剩下所有的字段。进一步的，参考表2，在Mode＝＝1中，SCF(16bit)表示c_i中不等于0的所有i的位置，而coeff及sign字段内不再保存所有等于0的c_i所对应的符号与c_i′，剩下的sign及coeff信息连续存放。

Mode＝＝0的量化变换系数压缩存储数据结构表1

CBF

Mode

bw

sign

coeff

Mode＝＝1的量化变换系数压缩存储数据结构表2

CBF

Mode

bw

SCF

sign

coeff

发明人测试发现，模式1对于接近全零的块效率优势很大，但由于SCF占用额外的空间所以在非零量化变换系数较多时优势不明显。因此本发明中在压缩时会尝试上述两种模式，并选择容量较小的一个模式最为最终选择的压缩模式。最终选择的压缩模式则作为Mode字段紧接着CBF之后保存。

在本实施例中，所述第二处理单元120对存放于所述第二存储单元110内的所述量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块和所述第一管理模块接收解压缩后的所述局部最优模式的量化变换系数11；同理，所述第一处理单元220对存放于所述第一存储单元内的量化变换系数和所述局部最优模式的量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块接收解压缩后的所述局部最优模式的量化变换系数11，以及进行解压缩以使外部的所述熵编码模块接收解压缩后的所述全局最优模式的量化变换系数21。具体的，解压缩过程为压缩的逆过程，由于压缩后的长度可以由bw推算，因此并不需要额外的保存长度信息或使用分隔符分割多个系数块。测试表明，所述嵌入压缩算法在典型应用场景下能获得良好的效果，且单周期内可以完成两个16系数块的编解码工作，能够满足高吞吐率应用。利用所述嵌入压缩算法将第二编码单元的量化变换系数压缩在所述第二存储单元110内，以及将第一编码单元的量化变换系数和所述局部最优模式的量化变换系数11压缩在所述第一存储单元210内，极大程度地降低了所述第一管理模块20的压缩存储容量，从而降低了所述量化变换系数管理模块100的存储开销，从而降低了系统的硬件开销。

进一步的，所述第一存储单元210包括多个单口RAM，例如使用4个384x128bit的单口RAM存储总计不超过192Kibit的量化变换系数。RAM空间均分为768个节点，每节点256byte，交织存放在4个RAM内以提供512bit每周期的峰值访问带宽。由于所述嵌入压缩算法的应用，所以足以满足多路同时访问的带宽需求。访问管理使用链表将各个模式(融合模式、帧间模式和帧内模式)的逻辑地址映射至物理地址，所述第一处理单元220中包括至少一个双口RAM，所述双口RAM用于暂时存储用于管理所述第一编码单元的量化变换系数的管理信息，其中，768x10bit的链表指针存储在所述双口RAM内，每一个CU的每一个模式有各自独立的链表头尾指针管理链表。

较佳的，所述第二存储单元110采用按页分配、回收以及单链表管理方式存放所述第二编码单元的量化变换系数；所述第一存储单元210采用按页分配、回收以及单链表管理方式存放所述第一编码单元的量化变换系数和所述第二管理模块10输出的量化变换系数。在本实施例中，所述第二存储单元110包括多个单口RAM，所述第二存储单元110能够存放8×8的CU和4×4的CU中尚未完成模式判决的量化变换系数，可见占用所述第二存储单元110的容量非常小。所述第二存储单元110使用256bit位宽的单口RAM，因为读取很少，所以不会造成明显的读写冲突问题。

其中，除了接收所述第二管理模块10的局部最优模式的量化变换系数11以外，所述第一管理模块20按照外部的所述量化模块输出量化变换系数的顺序以16个系数为单位压缩输入的所有量化变换系数并保存在内部的所述第一存储单元220中，在本发明中外部的所述量化模块输出量化变换系数的顺序为转置光栅扫描顺序，使用转置光栅顺序而不是4x4块压缩会略微降低压缩效率但节省了量化变换系数进出外部的整数变换模块和外部的整数反变换的转换操作。本实施例利用所述第一存储单元210进行连续存放在逻辑上属于连续的码流，在物理上数据使用单链表管理，在单链表的单个节点存放不下时，后续量化变换系数会继续存放在链接的后继节点，因而其在单口RAM中的物理地址并不一定连续。每一个CU的各个非划分模式均在RAM内独立分配地址并保存，而组成划分模式的各个CU即四叉树的子树也各自独立分配地址并保存。本发明有一个特例，16x16的CU分割后所包含的各个4x4的CU或8x8的CU的量化变换系数连续存放。由于解压缩时可以算出每16个系数占用的存储容量，因此并不需要加入分割符。本发明的嵌入压缩算法使用的是变长编码，因此向所述第一存储单元210写入前需要先将其对齐到128bit字长，为此不同尺寸的CU各自都有一个128bit的拼接寄存器用于暂存尚未写入的量化变换系数。

参考图4，图4是本发明实施例的第一存储单元工作示意图，来自第二管理模块10的16x16的局部最优模式的量化变换系数以及来自外部的量化模块的量化变换系数输入第一存储单元210时，输入的量化变换系数a以16个系数为单位被压缩成A，并与模式对应的128bit拼接寄存器内存留的量化变换系数D拼接后成为新的数据D'。此时所述第一存储单元210执行以下步骤：第一步骤：如果len(D')≥128或者a是CU内最后的16个系数，则执行第二步骤，否则在当前位置等待后一次16个系数输入；其中，len()为取长度操作；第二步骤：(1)检查a对应的模式所对应的链表，如果链表是空的，则申请一个空闲节点并将其加入链表；(2)当c是CU内最后的16个系数时，则将D'全部写入所述第一存储单元210并清空所在的拼接寄存器，否则将D'的前

写入链表的尾节点并将剩余bit留在拼接寄存器内。其中，

为向下取整操作。如果写入过程中链表尾节点的容量满，则申请一个空闲节点并将其加入链表尾，并将剩余的数据写入新加入的空闲节点内。

进一步的，当利用外部的所述模式判决模块对所述第一管理模块20内的某一尺寸的CU完成RDO模式判决，从一个划分模式与3个非划分模式中选出全局最优模式(例如帧间模式)的量化变换系数21时，所述第一管理模块执行以下步骤：释放同一CU剩余的其他模式(例如融合模式和帧内模式)所占据的存储空间，即将其依次连接在空闲链尾，并将其链表设置为空链。其中，如果所述全局最优模式是一个非划分模式时，则从该模式CU的链表头开始逐项读取各个节点的内容，并依次压缩并将解压缩获得的量化变换系数送至所述反量化模块以进行重构操作；如果当前模式不是CTU的根节点，则将全局最优模式CU的链表添加至上一层CU的分割模式的链尾，否则等待“前CTU全局最优模式”链表为空并将其指向当前CU式链表。当“前CTU的全局最优模式”链表不为空时时，执行步骤(1)：读取首节点的数据，解压缩并将其发送至所述熵编码模块以进行熵编码。从“前CTU的全局最优模式”链上删除首节点，并将首节点放回空闲链；步骤(2)：重复步骤(1)直至“前CTU的全局最优模式”链表空为止。

进一步的，当申请一个空闲节点时，执行步骤(1)：如果空闲链表为空时，则删除一个待选的非分割模式对应的链，并将其添加至在空闲链表上，所述选择一个待选的非分割模式对应的链可以根据SATD(变换差绝对和)等快速模式判决的方案选出一个最不可能被RDO模式判决选中的模式，也可以任选一个，测试表明在合理的参数下没有可以察觉的性能差异，本发明不做限定。后续操作可以有两个方案：可以设定RDO算法禁止选择被删除的链对应的模式，或者如果RDO选中了这一个模式则重新生成量化变换系数。前者会略为损失编码性能，后者会略为损失吞吐率。但实际测试结果表明空闲链表在合理的参数下对于实际场景几乎不可能出现空的情况，因此对于实际的场景而言这两种方案的损失都可以忽略不计，因此两者并没有本质区别；步骤(2)从空闲链表上删除首节点，并返回所述首节点作为申请返回的结果。

本实施例中，在所述第一管理模块20中，各个CU的三种非划分模式在RDO模式判决前会根据各个模式的SATD(变换差绝对和)从大到小排序，当RAM在申请一个空闲节点时并且该空闲节点满时，则按照CU的尺寸从大到小、SATD从大到小的顺序依次丢弃各个模式直到RAM出现空闲，被丢弃的模式也会在RDO模式判决中被放弃以防出错，但划分模式不会由于容量不足被丢弃。测试结果表明所述第一存储单元210的存储开销被降低到了标准设计的40％，本发明中，利用所述第一存储单元210存取量化变换系数，所述第一存储单元210避免了多次选择、搬移或丢弃所述量化变换系数的情况，缩短了读取时间，从而降低了所述量化变换系数管理装置的功耗。

进一步的，所述量化变换系数管理装置100还包括：仲裁器30，所述仲裁器30用于协调所述第一处理单元220对所述第一存储单元210内的所述量化变换系数的读/写访问，以及用于协调所述第二处理单元120对所述第二存储单元110内的所述量化变换系数的读/写访问。

基于同一发明构思，本发明还提供一种适用于HEVC标准的编码器，参考图3，图3是本发明实施例的适用于HEVC标准的编码器示意图，所述适用于HEVC标准的编码器包括：量化变换系数管理装置100、量化模块、反量化模块、熵编码模块和模式判决模块，所述量化变换系数管理装置100包括第一管理模块20，所述第一管理模块20用于管理外部输入的第一编码单元的量化变换系数，所述第一管理模块20包括：第一存储单元210和第一处理单元220，所述第一存储单元210用于存放所述第一编码单元的量化变换系数；所述第一处理单元220用于存储所述第一编码单元的量化变换系数的管理信息，以及用于控制所述第一存储单元210内的所述量化变换系数向外部的所述反量化模块和外部的熵编码模块输出；所述模式判决模块用于给所述量化变换系数管理装置的第一处理单元220提供所述局部RDO模式判决信息以及所述全局RDO模式判决信息；其中，所述第一编码单元的尺寸包括4×4、8×8、16×16、32×32和64×64。

进一步的，所述量化模块用于给所述量化变换系数管理装置的第一管理模块提供第一编码单元的量化变换系数；所述反量化模块用于接收所述量化变换系数管理装置的第一管理模块输出的量化变换系数；所述熵编码模块用于接收所述量化变换系数管理装置的第一管理模块输出的量化变换系数。

在本实施例中，所述量化变换系数管理装置100还包括：第二管理模块10，用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块10包括：第二存储单元110和第二处理单元120，所述第二存储单元110用于存放所述第二编码单元的量化变换系数；所述第二处理单元120用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元110内的所述量化变换系数向外部的反量化模块和所述第一管理模块20输出；其中，所述第二编码单元的尺寸包括4×4和8×8。此外，所述量化模块还用于给所述量化变换系数管理装置的第二管理模块10提供第二编码单元的量化变换系数；所述反量化模块还用于接收所述量化变换系数管理装置的第二管理模块输出的量化变换系数。

进一步的，所述模式判决模块还用于分别给所述量化变换系数管理装置100的第二处理单元120提供局部RDO模式判决信息。一方面，根据外部的模式判决模块的局部RDO模式判决信息，所述第二处理单元120在所述第二编码单元的量化变换系数中选出局部最优模式的量化变换系数11，并将所述局部最优模式的量化变换系数11向外部的反量化模块和所述第一管理模块20输出。另一方面，根据外部的模式判决模块的局部RDO模式判决信息和全局RDO模式判决信息，所述第一处理单元220在所述局部最优模式的量化变换系数11和所述第一编码单元的量化变换系数中选出局部最优模式的量化变换系数11，并将所述全局最优模式的量化变换系数21向外部的所述反量化模块输出；同时，所述第一处理单元220在所述局部最优模式的量化变换系数11和所述第一编码单元的量化变换系数中选出全局最优模式的量化变换系数21，并将所述全局最优模式的量化变换系数21向外部的熵编码模块输出全局最优模式的量化变换系数21。在本发明中，利用所述量化变换系数管理装置100，所述反量化模块能够快速接收到局部最优模式的量化变换系数11以进行重构图像操作从而提高了所述反量化模块的工作效率，以及，所述熵编码模块能够快速接收到全局最优模式的量化变换系数21以快速生成HEVC码流从而提高了所述熵编码模块的工作效率，从而提高了该编码器的工作效率。

上述描述仅是对本发明较佳实施例的描述，并非对本发明范围的任何限定，本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰，均属于权利要求书的保护范围。

Claims

1.一种量化变换系数管理装置，其特征在于，包括：

2.根据权利要求1所述的量化变换系数管理装置，其特征在于，所述量化变换系数管理装置还包括：第二管理模块，用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块包括：第二存储单元和第二处理单元，所述第二存储单元用于存放所述第二编码单元的量化变换系数；所述第二处理单元用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元内的所述量化变换系数向外部的反量化模块和所述第一管理模块输出；其中，所述第二编码单元的尺寸包括4×4和8×8。

3.根据权利要求2所述的量化变换系数管理装置，其特征在于，所述第一管理模块还用于管理所述第二管理模块输出的量化变换系数；所述第一存储单元还用于存放所述第二管理模块输出的量化变换系数；所述第一处理单元还用于存储所述第二管理模块输出的量化变换系数的管理信息。

4.根据权利要求3所述的量化变换系数管理装置，其特征在于，根据外部的模式判决模块的局部RDO模式判决信息，所述第二处理单元在所述第二编码单元的量化变换系数中选出局部最优模式的量化变换系数，并将所述局部最优模式的量化变换系数向外部的反量化模块和所述第一管理模块输出。

5.根据权利要求4所述的量化变换系数管理装置，其特征在于，根据外部的模式判决模块的局部RDO模式判决信息和全局RDO模式判决信息，所述第一处理单元在所述局部最优模式的量化变换系数和所述第一编码单元的量化变换系数中选出局部最优模式的量化变换系数，并将所述局部最优模式的量化变换系数向外部的所述反量化模块输出，同时，所述第一处理单元在所述局部最优模式的量化变换系数和所述第一编码单元的量化变换系数中选出全局最优模式的量化变换系数，并将所述全局最优模式的量化变换系数向外部的熵编码模块输出。

6.根据权利要求5所述的量化变换系数管理装置，其特征在于，在所述第一管理模块中，采用嵌入压缩算法对所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数进行压缩以使所述第一编码单元的量化变换系数和所述局部最优模式的量化变换系数呈压缩的状态存放于所述第一存储单元中。

7.根据权利要求6所述的量化变换系数管理装置，其特征在于，所述第一处理单元对存放于所述第一存储单元内的量化变换系数和所述局部最优模式的量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块接收解压缩后的所述局部最优模式的量化变换系数，以及以使外部的所述熵编码模块接收解压缩后的所述全局最优模式的量化变换系数。

8.根据权利要求5所述的量化变换系数管理装置，其特征在于，在所述第二管理模块中，采用嵌入压缩算法对所述第二编码单元的量化变换系数进行压缩以使所述第二编码单元的量化变换系数呈压缩的状态存放于所述第二存储单元中。

9.根据权利要求8所述的量化变换系数管理装置，其特征在于，所述第二处理单元对存放于所述第二存储单元内的所述量化变换系数进行读取，并进行解压缩以使外部的所述反量化模块和所述第一管理模块接收解压缩后的所述局部最优模式的量化变换系数。

10.根据权利要求3所述的量化变换系数管理装置，其特征在于，所述第一存储单元采用按页分配、回收以及单链表管理方式存放所述第一编码单元的量化变换系数和所述第二管理模块输出的量化变换系数。

11.根据权利要求3所述的量化变换系数管理装置，其特征在于，所述第二存储单元采用按页分配、回收以及单链表管理方式存放所述第二编码单元的量化变换系数。

12.根据权利要求3所述的量化变换系数管理装置，其特征在于，所述量化变换系数管理装置还包括：仲裁器，所述仲裁器用于协调所述第二处理单元对所述第二存储单元内的所述量化变换系数的读/写访问，以及用于协调所述第一处理单元对所述第一存储单元内的所述量化变换系数的读/写访问。

13.一种适用于HEVC标准的编码器，其特征在于，包括：

14.根据权利要求13所述的适用于HEVC标准的编码器，其特征在于，所述量化变换系数管理装置还包括：第二管理模块，用于管理外部的量化模块输出的第二编码单元的量化变换系数，所述第二管理模块包括：第二存储单元和第二处理单元，所述第二存储单元用于存放所述第二编码单元的量化变换系数；所述第二处理单元用于存储所述第二编码单元的量化变换系数的管理信息，以及用于控制所述第二存储单元内的所述量化变换系数向外部的反量化模块和所述第一管理模块输出；其中，所述第二编码单元的尺寸包括4×4和8×8。

15.根据权利要求14所述的适用于HEVC标准的编码器，其特征在于，所述量化模块还用于给所述量化变换系数管理装置的第二管理模块提供第二编码单元的量化变换系数。

16.根据权利要求14所述的适用于HEVC标准的编码器，其特征在于，所述反量化模块还用于接收所述量化变换系数管理装置的第二管理模块输出的量化变换系数。

17.根据权利要求14所述的适用于HEVC标准的编码器，其特征在于，所述模式判决模块还用于给所述量化变换系数管理装置的第二处理单元提供局部RDO模式判决信息。