CN108600750A

CN108600750A - 基于ksvd的多描述编码、解码方法及系统

Info

Publication number: CN108600750A
Application number: CN201810316084.8A
Authority: CN
Inventors: 孟丽丽; 孙桂娜; 刘丽; 谭艳艳; 张佳; 张化祥
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2018-04-10
Filing date: 2018-04-10
Publication date: 2018-09-28

Abstract

本发明公开了基于KSVD的多描述编码、解码方法及系统，其中多描述编码方法包括获取图像信息，将图像信息分为两个子集，分别作为第一子集和第二子集，同时生成第一描述和第二描述，所述两个描述均同时包括第一子集和第二子集；对第一描述，基于多描述方法，采用第一子集预测第二子集，并根据第一子集与第二子集的预测值进行熵编码，输出第一多描述码流；对第二描述，基于多描述方法，采用第二子集预测第一子集，并根据第二子集与第一子集的预测值进行熵编码，输出第二多描述码流；所述多描述方法包括依次对所述两个子集进行基于时间域的重叠变换、KSVD变换和量化处理。

Description

基于KSVD的多描述编码、解码方法及系统

技术领域

本发明涉及通信技术领域，具体是一种基于KSVD的多描述编码、解码方法及系统。KSVD(K singular value decomposition)是一种基于奇异值分解的字典训练方法，利用构造的冗余字典自适应的对图像进行稀疏表示，使获得的变换系数具有较高的稀疏度，可以更有效的表示图像的结构特征。

背景技术

随着通信技术的发展，信息在网络上的实时传输业务越来越多的被应用在生活中，但目前的互联网和无线通信环境经常会使传输的信息出现误码、丢包或延迟的问题，为提高网络传输的可靠性，人们通常对传输信息进行压缩编码、纠错编码、错误隐藏等传输预处理。其中，信源编码端的差错控制技术中的多描述编码在信道条件比较恶劣的环境中的应用较多，它将信号分解为多个独立的比特流分别通过不同的信道进行传输，可在较高压缩效率下增强信号的稳健性，能够很好地对抗突发干扰，在实现错误隐藏和错误复原方面性能优良。这些独立的比特流称为描述，他们具有相同的权重，如果只接收到一个描述也可以恢复出粗糙但可接受的图像效果，能接收到的描述越多，恢复的图像质量越好。

多描述的思想是在20世纪70年代为了在不使用备用线路的前提下提高语言线路传输的可靠度而由Miller和Boyle提出的，当时该问题被Bell实验室称为信道分离(ChalmelSPhtting)问题。在1993年由Vaishampayan等人提出了第一个实用的多描述编码方案MDSQ(Multiple Deseription Scalar Quantization)。之后，Batllo和Vaishampayan尝试将多描述和变换编码相结合，把MDSQ应用到块变换来分析多描述标量量化和正交变换之间的并行关系和联合优化。后来对多描述编码的研究中成为最成熟的便是基于相关变换的方法，尤其是Wang在1997年提出的PCT(Pairwise Correlating Transform)，它将经过DCT(Discrete Cosine Transform)变换得到的系数划分为两组，然后通过2×2整数——整数之间的线性变换在每组中引入相关，以便在一组丢失后另一组通过相关性来估计出丢失的组的系数。

假设在信源和信宿之间存在着很多信道，所有信道同时出错的概率非常低，多描述编码是在这个假设的基础上提出来的。将多描述编码应用到网络传输时用于传输不同描述的信道应该是不同的物理途径，如果信源与信宿之间只存在一个物理途径，那么该路径可以用时间交织、频分复用等划分成多个虚拟信道。传输的各个描述之间有关联，每个描述既包含自身的重要信息也包含部分重构其他描述的冗余信息。在接收端使用不同的解码器，如果能收到全部的描述，则通过中心解码器解码来重建高质量的图像；如果只接收到部分描述，则使用边解码器解码，利用接收到的描述中带有的冗余信息来恢复丢失的描述，从而重构图像。

多描述编码可以从预测、量化、DCT变换、熵编码、信道编码等方面进行。音频、图像的多描述编码通常是从量化、DCT变换着手。DCT变换主要应用于图像数据的压缩编码，将图像从空间域转换到变换域，从而减弱或去除图像数据的空间相关性。DCT变换并不是对整幅图像一次编码，而是首先将图像划分成相同尺寸的块(例如8×8,16×16或32×32的块)，然后针对每一块进行变换。由于其压缩特性好且执行相对简单，这种基于块的离散余弦变换(DCT)成为目前最流行的图像处理变换技术之一，但它存在一个缺点，即DCT变换编码在低比特率下存在一定的方块效应，会造成严重的视觉降质。

发明内容

针对现有技术中存在的不足，本发明提出了一种基于KSVD的多描述编码、解码方法及系统，利用稀疏表示模型来优化多描述编码方法，对编码资源进行更好的分配，从而在保证解决丢包问题的前提下提高编码效率，获得良好的图像重构效果。

基于KSVD的多描述编码方法，包括：

获取图像信息，将图像信息分为两个子集，分别作为第一子集和第二子集，同时生成第一描述和第二描述，所述两个描述均同时包括第一子集和第二子集；

对第一描述，基于多描述方法采用第一子集预测第二子集，并根据第一子集与第二子集的预测值进行熵编码，输出第一多描述码流；

对第二描述，基于多描述方法采用第二子集预测第一子集，并根据第二子集与第一子集的预测值进行熵编码，输出第二多描述码流；

所述多描述方法包括依次对所述两个子集进行基于时间域的重叠变换、KSVD变换和量化处理。

进一步的，所述KSVD变换为：

X＝D^-1Y

其中，D是训练得到的最佳冗余字典，Y是待稀疏表示的图像，X是稀疏系数矩阵。

进一步的，基于KSVD的稀疏表示模型是利用当前字典求样本的稀疏表示和利用稀疏系数更新字典两个过程交替迭代，在更好地适应数据的同时加速收敛。

首先，将给定的训练图像按8*8分块得到训练数据集找到让X最大程度稀疏的最佳冗余字典D∈R^m×K(K＞＞m)，目标函数是：

T₀是稀疏系数矩阵X的非零数目，即稀疏度。

然后，循环稀疏编码阶段和字典更新阶段直到收敛为止：

(1)稀疏编码阶段：

假设D是固定的，用追踪算法得到Y的稀疏表示的系数矩阵X，目标函数中的约束项写成：

因此，每个样例y_i的表示向量x_i：

其中,i＝1,2,…,N。

(2)字典更新阶段：

在满足稀疏度的条件下逐列更新优化D，每次更新一列，固定D中除了d_k的所有列(d_k表示D的第k列)，寻找一个新的d_k列和相应的能最有效减少均方误差(MSE)的系数，计算整体的表示误差矩阵E_k：

其中，表示X的第j行

目标函数中的约束项变为：

其中，表示X的第k行；

得到当前误差矩阵E_k后，只需要调整d_k和使其乘积与E_k的误差小于设定阈值。此时，将变量DX分解成D中每列与X中对应每行乘积的和,进行逐列优化，即：

最后，通过训练得到的最佳冗余字典D对采用基于时间域重叠变换后的图像进行稀疏分解得到变换系数X。

进一步的，输出第一多描述码流的方法包括：对第一描述，采用基于时间域的重叠变换对第一子集、第二子集分别进行前向滤波对应得到第一子集的前向滤波值、第二子集的前向滤波值，对第一子集的前向滤波值依次进行KSVD变换和量化处理；其中，对第一子集的前向滤波值进行KSVD变换得到变换系数；

根据第一子集的前向滤波值通过KSVD变换得到的变换系数预测第二子集的前向滤波值，

根据第二子集前向滤波值与第二子集的预测前向滤波值之间的冗余，得到第二子集的前向滤波预测冗余；

对第二子集的前向滤波预测冗余依次进行KSVD变换和量化处理；

对所述第一子集的量化值和第二子集前向滤波预测冗余的量化值进行熵编码，输出第一多描述码流。

进一步的，输出第二多描述码流的方法包括：对第二描述，采用基于时间域的重叠变换对第一子集、第二子集分别进行前向滤波对应得到第一子集的前向滤波值、第二子集的前向滤波值，对第二子集的前向滤波值依次进行KSVD变换和量化处理，其中，对第二子集的前向滤波值依次进行KSVD变换得到变换系数；

根据第二子集通过KSVD变换得到的变换系数预测第一子集的前向滤波值，

根据时间域的重叠变换得到的第一子集前向滤波值与第一子集的预测前向滤波值之间的冗余得到第一子集的前向滤波预测冗余；

对第一子集的前向滤波预测冗余依次进行KSVD变换和量化处理；

对所述第二子集的量化值和第一子集前向滤波预测冗余的量化值进行熵编码，输出第二多描述码流。

进一步的，所述前向滤波采用前向滤波器P：P＝W diag{I,V}W，其中I是的单位矩阵，V是的可逆矩阵，W是蝶形矩阵：

其中J是的反单位矩阵。

进一步的，在第一描述中的量化处理阶段，第一子集的量化步长小于第二子集前向滤波预测冗余的量化步长；在第二描述中的量化处理阶段，第二子集的量化步长大于第一子集前向滤波预测冗余的量化步长。

根据KSVD算法进行字典训练，利用构造的冗余字典自适应的对图像进行稀疏表示，从而获得具有较高的稀疏度的变换系数。

本发明还提供了一种基于KSVD的多描述解码方法，包括：

接收所述第一多描述码流并进行熵解码，基于多描述反变换方法，输出第一重构的图像信息；

接收所述第二多描述码流并进行熵解码，基于多描述反变换方法，输出第二重构的图像信息；

所述多描述反变换方法包括依次对两个子集进行反量化处理、逆KSVD(IKSVD)变换和基于时间域的反重叠变换。

进一步的，所述逆KSVD变换计算如下：

Y＝DX

通过之前训练得到的最优冗余字典D和反量化后得到的用于稀疏表示前向滤波后的图像的变换系数X来重构要进行基于时间域反重叠变换的图像Y。

进一步的，所述输出第一重构的图像信息的方法包括：

根据第一多描述码流的熵解码结果，分别对第一子集的量化值和第二子集前向滤波预测冗余的量化值依次进行反量化和IKSVD变换，根据第一子集的IKSVD变换值预测第二子集的IKSVD变换值，并将第二子集的IKSVD变换值的预测值与第二子集的前向滤波预测冗余的IKSVD变换结果相加，得到第二子集的KSVD变换系数重建值；将所述第一子集的IKSVD变换值和第二子集的KSVD变换系数重建值进行基于时间域重叠变换的后向滤波处理，输出第一重构的图像信息。

进一步的，所述输出第二重构的图像信息的方法包括：

根据第二多描述码流的熵解码结果，分别对第二子集的量化值和第一子集前向滤波预测冗余的量化值依次进行反量化和IKSVD变换，根据第二子集的IKSVD变换值预测第一子集的IKSVD变换值，并将第一子集的IKSVD变换值的预测值与第一子集的前向滤波预测冗余的IKSVD变换结果相加，得到第一子集的KSVD变换系数重建值；将所述第二子集的IKSVD变换值和第一子集的KSVD变换系数重建值进行基于时间域重叠变换的后向滤波处理，输出第二重构的图像信息。

进一步的，所述后向滤波采用后向滤波器T：T＝P^-1＝W diag{I,V^-1}W。其中I是的单位矩阵，V是的可逆矩阵，W是蝶形矩阵：

其中J是的反单位矩阵。

进一步的，在第一描述中的反量化处理阶段，第一子集的反量化步长小于第二子集预测冗余的反量化步长；在第二描述中的反量化处理阶段，第二子集的反量化步长大于第一子集预测冗余的反量化步长。

本发明还提供了一种基于KSVD的多描述编码、解码的系统，包括：

编码器，获取图像信息，将图像信息分为两个子集，分别作为第一子集和第二子集，同时生成第一描述和第二描述，所述两个描述均同时包括第一子集和第二子集；基于多描述方法，对第一描述采用第一子集预测第二子集，并根据第一子集与第二子集的预测值进行熵编码，输出第一多描述码流；对第二描述，采用第二子集预测第一子集，并根据第二子集与第一子集的预测值进行熵编码，输出第二多描述码流；

传输网络，用于对所述多描述码流进行传输，从编码器传输给解码器；

解码器，接收所述第一多描述码流和第二个描述码流并进行熵解码，基于多描述反变换方法，输出第一重构的图像信息和第二重构的图像信息；

所述多描述反变换方法包括依次对所述两个子集进行反量化处理、IKSVD变换和基于时间域的反重叠变换。

本发明的有益效果：本发明能够在保证解决图像传输丢包问题的基础上提高编码效率，采用可基于时间域的重叠变换，能够根据不同的应用来优化前向滤波器和后向滤波器，去除了方块效应，基于KSVD的稀疏表示模型，增加了变换系数的稀疏性，从而提高了编码效率。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1为本发明的方法原理图；

图2为本发明基于时间域的重叠变换基本框图；

图3为本发明两描述的预测框图；

具体实施方式

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

本发明的一种典型实施例是一种基于KSVD的多描述编码方法，包括：

如图1所示，获取图像信息，将图像信息分为两个子集(S0、S1)，同时生成描述0和描述1，两个描述均同时包括子集S0和子集S1；

对第一描述，基于多描述方法，采用第一子集预测第二子集，并根据第一子集与第二子集的预测值进行熵编码，输出第一多描述码流；

对第二描述，基于多描述方法，采用第二子集预测第一子集，并根据第二子集与第一子集的预测值进行熵编码，输出第二多描述码流；

本实施例中首先对其中一个描述(假设描述0)的技术方案进行清楚、完整地介绍。

步骤一：读取图像并将图像划分为两个子集(S0、S1)

步骤二：对子集S0和子集S1进行基于时间域的重叠变换，即前向滤波(P)，去除方块效应；

步骤三：前向滤波之后进行KSVD变换，从而使图像能量在空间域的分散分布转换为变换域的相对集中分布；

步骤四：对其中一个子集(S0)以较小的量化(q0)步长进行量化(Q)；

步骤五：以该子集(S0)的KSVD变换系数值预测另一个子集(S1)的前向滤波值，并对预测冗余进行KSVD变换、量化，对预测冗余进行的量化步长(q1)取较大值；

步骤六：熵编码，输出描述0的多描述码流。

对描述1的处理同上，不一样的地方在于，从步骤四开始，是对其中另一个子集(S1)以较小的量化(q0)步长进行量化(Q)；以该子集(S1)的KSVD变换系数值预测另一个子集(S0)的前向滤波值，并对预测冗余进行KSVD变换、量化，对预测冗余进行的量化步长(q1)取较大值；最后再进行熵编码，输出描述1的多描述码流。

本发明的再一实施例是一种基于KSVD的多描述解码方法，在上述实施例的基础上，

步骤七：对描述0的多描述码流进行熵解码，

步骤八：根据描述0的熵解码结果，分别对子集S0、子集S1的前向滤波预测冗余进行反量化(IQ)；

步骤九：反KSVD变换(IKSVD)；

步骤十：根据子集S0的IKSVD变换值预测子集S1的IKSVD变换值，并将该预测值与所述子集S1的前向滤波预测冗余的IKSVD变换结果相加，得到子集S1的KSVD变换系数重建值；将所述子集S0的IKSVD变换值和子集S1的KSVD变换系数重建值进行基于时间域重叠变换的后向滤波处理，输出描述0的图像信息。

对描述1的处理同上，不一样的地方在于，从步骤十开始，根据子集S1的IKSVD变换值预测子集S0的IKSVD变换值，并将该预测值与所述子集S0的前向滤波预测冗余的IKSVD变换结果相加，得到子集S0的KSVD变换系数重建值；将所述子集S1的IKSVD变换值和子集S0的KSVD变换系数重建值进行基于时间域重叠变换的后向滤波处理，输出描述1的图像信息。

其中基于时间域的重叠变换如图2所示，其优点是能够根据不同的应用来优化前向滤波器(步骤二)和后向滤波器(步骤十)。在编码端，KSVD变换和前向滤波器应用在边界，边界处首先利用一个L×L的前向预滤波器P，然后对每一块进行KSVD变换。TDLT的基本函数包含两块，并且相邻块的连接处重叠为一块。在解码端，KSVD反变换和后向滤波器T被应用到块边界。P和T为：P＝W diag{I,V}WT＝P^-1＝W diag{I,V^-1}W。其中I是的单位矩阵，V是的可逆矩阵，W是蝶形矩阵：

其中J是的反单位矩阵。

KSVD变换，是利用冗余字典中原子信号的线性组合来实现对信号的表示的一种基于稀疏表示模型的变换，可使图像能量在空间域的分散分布转换为变换域的相对集中分布，以达到去除空间冗余的目的。

图像编码主要使用KSVD：

X＝D^-1Y

其中，D是训练得到的最佳冗余字典,Y是待稀疏表示的图像。

KSVD逆变换(IKSVD)计算如下：

Y＝DX

本实施例中采用8×8像素块，通过KSVD算法对训练图像按8×8分块得到训练数据集并进行训练以获得自适应冗余字典D∈R^m×K(K＞＞m)，目标函数是：

T₀是稀疏系数矩阵X的非零数目，即稀疏度。

然后，循环下面两个阶段直到收敛为止：

①稀疏编码阶段：

假设D是固定的，用MP、OMP、BP等任何追踪算法，可以得到Y的稀疏表示的系数矩阵X，目标函数中的约束项可以写成：

因此，每个样例y_i的表示向量x_i：

其中,i＝1,2,…,N。

②字典更新阶段：

在满足稀疏度的条件下逐列更新优化D，每次更新一列，固定D中除了d_k的所有列(d_k表示D的第k列，表示X的第k行)，寻找一个新的d_k列和相应的能最有效减少均方误差(MSE)的系数，计算整体的表示误差矩阵：

目标函数中的约束项变为：

得到当前误差矩阵E_k后，我们只需要调整d_k和使其乘积与E_k的误差尽可能的小。此时，将DX分解成D中每列与X中对应每行乘积的和,进行逐列优化，即：

最后，通过训练得到的最优化字典D对采用基于时间域重叠变换后的图像进行稀疏分解得到变换系数X。

本实施例中的预测部分如图3所示。在描述0中，子集S0以较小的量化步长量化，其反量化反KSVD变换系数值用来预测子集S1，然后对子集S1的预测冗余进行KSVD变换与量化处理，此时的量化步长取较大值。在描述1中，子集S1以较小的量化步长量化，其反量化反KSVD变换系数值用来预测子集S0，然后对子集S0的预测冗余进行KSVD与量化处理，此时的量化步长取较大值。预测部分用反KSVD变换系数值进行预测，也就是说，此处的预测部分是在像素域进行的。

本发明的另一种实施例是一种基于KSVD的时间域重叠变换多描述编码、解码的系统，在上述实施例的基础上包括：

编码器，获取图像信息，将图像信息分为两个子集，分别作为子集S0和子集S1，同时生成描述0和描述1，所述两个描述均同时包括子集S0和子集S1；基于多描述方法，对描述0采用子集S0预测子集S1，并根据子集S0与子集S1的预测值进行熵编码，输出描述0码流；对描述1，采用子集S1预测子集S0，并根据子集S1与子集S0的预测值进行熵编码，输出描述1码流；

传输网络，用于对所述多描述码流进行传输；

解码器，接收所述描述0码流和描述1码流并进行熵解码，基于多描述反变换方法，输出描述0的重构图像信息和描述1的重构图像信息；

其中的传输网络可以是有限网络或无线网络。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.基于KSVD的多描述编码方法，其特征是，包括：

2.如权利要求1所述的方法，其特征是，输出第一多描述码流的方法包括：对第一描述，采用基于时间域的重叠变换对第一子集、第二子集分别进行前向滤波对应得到第一子集的前向滤波值、第二子集的前向滤波值，对第一子集的前向滤波值依次进行KSVD变换和量化处理；其中，对第一子集的前向滤波值进行KSVD变换得到变换系数；根据第一子集的前向滤波值通过KSVD变换得到的变换系数预测第二子集的前向滤波值，根据第二子集前向滤波值与第二子集的预测前向滤波值之间的冗余，得到第二子集的前向滤波预测冗余；对第二子集的前向滤波预测冗余依次进行KSVD变换和量化处理；对所述第一子集的量化值和第二子集前向滤波预测冗余的量化值进行熵编码，输出第一多描述码流。

3.如权利要求1所述的方法，其特征是，输出第二多描述码流的方法包括：对第二描述，采用基于时间域的重叠变换对第一子集、第二子集分别进行前向滤波对应得到第一子集的前向滤波值、第二子集的前向滤波值，对第二子集的前向滤波值依次进行KSVD变换和量化处理，其中，对第二子集的前向滤波值依次进行KSVD变换得到变换系数；根据第二子集通过KSVD变换得到的变换系数预测第一子集的前向滤波值，根据时间域的重叠变换得到的第一子集前向滤波值与第一子集的预测前向滤波值之间的冗余得到第一子集的前向滤波预测冗余；

对第一子集的前向滤波预测冗余依次进行KSVD变换和量化处理；对所述第二子集的量化值和第一子集前向滤波预测冗余的量化值进行熵编码，输出第二多描述码流。

4.如权利要求1所述的方法，其特征是，

在第一描述中的量化处理阶段，第一子集的量化步长小于第二子集前向滤波预测冗余的量化步长；在第二描述中的量化处理阶段，第二子集的量化步长大于第一子集前向滤波预测冗余的量化步长。

5.根据权利要求1所述的方法，其特征在于，根据KSVD算法进行字典训练，利用构造的冗余字典自适应的对图像进行稀疏表示，从而获得具有较高的稀疏度的变换系数。

6.如权利要求1所述编码方法的解码方法，其特征是，包括：

所述多描述反变换方法包括依次对两个子集进行反量化处理、逆KSVD变换和基于时间域的反重叠变换。

7.如权利要求6所述的一种基于KSVD的多描述解码方法，其特征是，所述输出第一重构的图像信息的方法包括：

8.如权利要求6所述的一种基于KSVD的多描述解码方法，其特征是，所述输出第二重构的图像信息的方法包括：

9.如权利要求6所述的一种基于KSVD的多描述解码方法，其特征是，在第一描述中的反量化处理阶段，第一子集的反量化步长小于第二子集预测冗余的反量化步长；在第二描述中的反量化处理阶段，第二子集的反量化步长大于第一子集预测冗余的反量化步长。

10.基于KSVD的多描述编码、解码的系统，其特征是，包括：

所述多描述方法包括依次对所述两个子集进行基于时间域的重叠变换、KSVD变换和量化处理；