CN117939158A

CN117939158A - 自适应频域滤波辅助空间转换的分布式信源编码方法

Info

Publication number: CN117939158A
Application number: CN202410117893.1A
Authority: CN
Inventors: 徐浩; 胡蝶; 吴俊�
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2024-01-29
Filing date: 2024-01-29
Publication date: 2024-04-26

Abstract

本发明属于分布式信源编码技术领域，具体为一种自适应频域滤波辅助空间转换的分布式信源编码方法。本发明包括：在编码端，将输入图像转换至频域，利用神经网络根据幅度谱和相位谱生成滤波器，并进行滤波；对通过滤波的频域成分采用自编码器进行编码；采用可训练的墒编码器对特征编码；在译码端，利用输入图像与边信息中相同频域成分计算仿射系数，对边信息仿射以消除图像间由于视差带来的畸变，实现对齐；结合对齐后的边信息重建输入图像。与现有技术相比，本发明将设计重点转移到编码端，通过主动的自适应频域滤波有效的筛选出各个压缩率下最重要的频域成分，提高了压缩效率，在译码端利用仿射变换提高边信息的匹配度，提高了重建效果。

Description

自适应频域滤波辅助空间转换的分布式信源编码方法

技术领域

本发明属于分布式信源编码技术领域，具体涉及自适应频域滤波辅助空间转换的分布式信源编码方法。

背景技术

在数字通信不断发展的背景下，编码技术在数据高效传输和存储中扮演着关键角色。在这些技术中，分布式源编码能独立编码多个相关源，且允许这些相关信源被联合解码。

分布式信源编码适用于多个信源间相关性强但源间通信受限或成本高昂的情景，例如无线传感器网络以及多摄像头视频系统等。尽管有Slepian-Wolf定理和Wyner-Ziv理论的支撑，分布式信源编码的实际应用依然面临着重大挑战，主要是由于很难在解码器端准确的捕捉和利用信源间的相关性，同时还需保持编码器端独立的分布式操作。本发明关注分布式信源编码中的一个特殊场景，当译码端存在相关图像作为边信息的情况下，去压缩传输输入图像。

近年来深度学习的新进展推动了该领域的创新。当前方法主要分为两类：一是利用神经网络在图像级别进行块匹配来处理空间冗余和挖掘图像间相似性；二是在特征级别利用边信息。这些方法通过优化边信息的使用显著提高了重建效果。然而，这些进展主要通过译码端的设计来反向优化编码端，没有针对编码端进行设计，一般都采用自编码器实现编码。此外，在利用边信息时没有消除两个视角下图像间的畸变，没有准确的利用边信息。

发明内容

本发明的目的是克服现有技术中的技术缺陷，提出一种自适应频域滤波辅助空间转换的分布式信源编码方法。

本发明提供的自适应频域滤波辅助空间转换的分布式信源编码方法，包括：在编码端，进行主动优化，具体通过添加一个自适应、自学习的频域滤波模块来主动筛选需要编码的频域成分，提高编码效率，实现高效压缩；在译码端，利用输入图像与边信息相同的频域成分学习仿射系数然后通过仿射变换消除不同视角引起的畸变，从而更加准确的利用边信息，实现高质量的重建。具体步骤为：

(1)在编码端，输入二维图像，利用快速傅立叶变换生成其频域表示，并计算幅度谱和相位谱，利用滤波器生成模块根据幅度谱和相位谱生成滤波器；该滤波器生成模块包含两个卷积层和两个残差层；最后添加sigmoid激活函数作为正则项，来保证生成的滤波器有物理意义，参见图2所示；

(2)利用生成的滤波器对输入图像进行滤波，滤波后通过逆快速傅立叶变换，将图像返回空域；

(3)利用自编码器对滤波后的图像进行特征提取和压缩，该编码器包含四层卷积结构，每两个卷积层间添加一个广义除法归一化(GDN)激活函数来做归一化；当然，其他结构的自编码器也可以用作编码；

(4)采用可训练的墒编码模块对压缩后的特征进行墒编码；添加墒编码模块是便于估计压缩率；

(5)在译码端，通过墒解码得到输入图像的压缩特征；

(6)译码端对边信息依次进行步骤(2)、(3)操作，得到滤波且编码后的边信息特征；

(7)将步骤(5)得到的输入图像的特征和步骤(6)中得到的边信息特征拼接，将特征维度变换成一维向量，采用线性层降维后送入仿射系数学习模块，学习仿射系数；该仿射系数计算模块具体采用转换器(Transformer)结构实现，输出采用线性层进行降维，最后得到一个的仿射矩阵；

(8)根据步骤(7)中得到的仿射系数对边信息进行仿射变换(具体包含旋转、平移，缩放，侧切等运算)，在不损失信息量的前提下实现边信息对齐；

(9)将步骤8)中对齐后的边信息送入神经网络自编码器提取公共特征，该编码器与步骤(3)中的编码器结构一致，但参数独立；

(10)将步骤(5)中得到的输入图像的压缩特征和步骤(9)中得到的边信息中的公共特征进行拼接，送入译码器得到重建结果；

(11)在训练阶段，将输入图像送入步骤(9)中的自编码器提取公共特征作为仿射变换标签，与步骤(9)中从边信息中得到的公共特征计算仿射损失来约束仿射过程，该损失在MSE度量下进行计算；

(12)在训练阶段，将输入图像作为标签，计算标签与重建结果间的损失作为重建损失，将重建损失与步骤(11)中的仿射损失组成整个网络的损失函数，迭代训练神经网络。

步骤(1)中，利用幅度谱和相位谱自适应的学习滤波器。

步骤(10)中，通过仿射结果的特征与输入图像的特征来计算仿射损失。

在步骤(11)中，利用仿射变换后提取的边信息特征来辅助重建。

与现有技术相比，本发明将设计的重点转移到编码端，通过主动的自适应频域滤波有效的筛选出各个压缩率下最重要的频域成分，提高压缩效率；在译码端利用仿射变换提高边信息的匹配度，提高重建效果。

附图说明

图1为本发明的总体框架图示。

图2左为本发明的滤波器生成模块，图2右为滤波器生成模块中的残差模块。

图3为本发明的频域滤波过程。

具体实施方式

下面通过实施例结合附图进一步介绍本发明。

参见图1，自适应频域滤波辅助空间转换的分布式信源编码方法。首先将输入图片转换至频域，计算幅度谱和相位谱并据此生成滤波器，对输入图像进行滤波后利用神经网络进行压缩，随后进行墒编码，发送至译码端。译码端首先进行墒解码得到输入图像的特征。随后对译码端的相关图像进行与输入图像相同的滤波和压缩得到特征，利用两幅图像的相似特征学习仿射系数，并对相关图像进行仿射变换以消除不同视角带来的畸变。从仿射变换后的相关图像中提取特征辅助输入图像的重建。

现以KITTI Stereo数据集为例来介绍本发明，该数据集包含1576对立体图像作为训练集，另外790对作为测试集。将图像尺寸为375×1242的原始数据进行中心裁剪，得到370×740的局部图，然后将其下采样至128×256。

(1)将输入图像进行快速傅立叶变换(FFT)，得到频域表示计算幅度谱A相位谱φ。

φ＝arctan2(Im(X_f),Re(X_f))

(2)将A和φ在第一个维度进行拼接，输入滤波器生成模块生成滤波器该模块包含两个卷积层和两个残差层，结构如附图2所示。随后对X_f进行滤波，即将频谱图与滤波器进行点乘，生成/>滤波过程如附图3所示。

(3)将利用逆快速傅立叶变换(IFFT)转换回空域，利用编码器E_x进行编码，得到编码特征/>该编码器包含四层卷积结构，每两个卷积层间添加了广义除法归一化(GDN)激活函数来做归一化。这里的编码器结构不唯一，其他结构的下采样模块也可以作为这里的编码器；输出特征的通道数不唯一，可以降低或增加。

(4)将编码特征进行量化后进行墒编码。由于量化的不可微分性影响网络训练中的梯度反传，在训练阶段将量化过程转化为叠加均匀采样的随机噪声来模拟量化带来的损失，叠加的噪声的范围为区间[-0.5,0.5)内。在测试阶段，直接对编码特征进行取整操作来实现量化。

(5)采用形如LDPC的信道码保护量化比特安全的通过信道，其余信道码也可以用作此处的信道编码，译码端通过墒解码得到编码特征x_enc。

(6)采用两幅图片相似的成分能更加准确的找到二者的关联从而得到更加准确的仿射系数，因此我们对相关图像y_t依次进行与输入图像相同的处理，首先利用FFT将y_t转换到频域，然后利用步骤(2)中得到的滤波器对其进行滤波，利用IFFT将其转换回空域后，利用步骤(3)中的编码器对其进行编码，得到压缩特征

(7)将步骤(5)中得到的x_enc和步骤(6)中得到的y_xenc在第一个维度进行拼接，拉成一维向量后，利用线性层将其降为256个维度，送入仿射系数计算模块，该模块采用Transformer结构来实现，将Transformer的输出通过线性层降维成6维，输出一个的向量，将输出进行维度变换，得到仿射系数矩阵/>

(8)利用仿射矩阵对相关图像y_t进行仿射变换，得到

(9)利用神经网络编码器E_y提取仿射变化后y_affine的特征来辅助输入图像进行重建。该编码器与步骤(3)中编码器的结构一致，参数独立。

(10)利用神经网络编码器E_y提取输入图像x_t的特征，得到并与(9)中得到的y_enc计算均方差损失，得到仿射损失/>

(11)将步骤(5)中得到的x_enc与步骤(9)中得到的y_enc在第一个维度进行拼接，利用解码器D_x进行译码，得到重建结果计算x与/>间的均方差损失，得到重建损失。该解码器D_x由四层反卷积层构成，每两层反卷积间添加了逆广义除法归一化(GDN)激活函数。此处的解码器也可选用其他上采样结构。

(12)计算网络的整体损失：

其中，R为x_enc的码率，用bpp来计算，利用该损失迭代优化网络。

Claims

1.一种自适应频域滤波辅助空间转换的分布式信源编码方法，其特征，包括：在编码端，进行主动优化，具体通过添加一个自适应、自学习的频域滤波模块来主动筛选需要编码的频域成分，提高编码效率，实现高效压缩；在译码端，利用输入图像与边信息相同的频域成分学习仿射系数，然后通过仿射变换消除不同视角引起的畸变，从而更加准确的利用边信息，实现高质量的重建；具体步骤为：

(1)在编码端，输入二维图像，利用快速傅立叶变换生成其频域表示，并计算幅度谱和相位谱，利用滤波器生成模块根据幅度谱和相位谱生成滤波器；该滤波器生成模块包含两个卷积层和两个残差层；

(3)利用自编码器对滤波后的图像进行特征提取和压缩；

(4)采用可训练的墒编码模块对压缩后的特征进行墒编码；

(5)在译码端，通过墒解码得到输入图像的压缩特征；

(7)利用仿射系数计算模块，根据步骤(5)得到的输入图像的特征和步骤(6)中得到的边信息特征，学习仿射系数；该仿射系数计算模块具体采用转换器结构实现；

(8)根据步骤(7)中得到的仿射系数对边信息进行仿射变换，实现边信息对齐；

(9)利用神经网络编码器，提取步骤(8)中对齐后边信息的特征；

(10)利用步骤(9)中的神经网络编码器提取输入图像的特征，与步骤(9)得到的边信息特征计算仿射损失；

(11)将步骤(5)和(9)中得到的特征进行拼接，送入译码器得到重建结果；

(12)计算图像重建损失和仿射变换损失，构建损失函数，迭代训练神经网络。

2.如权利要求1所述的自适应频域滤波辅助空间转换的分布式信源编码方法，其特征在于，在步骤(1)中，利用幅度谱和相位谱自适应的学习滤波器。

3.如权利要求1所述的自适应频域滤波辅助空间转换的分布式信源编码方法，其特征在于，在步骤10)中，通过仿射结果的特征与输入图像的特征来计算仿射损失。

4.如权利要求1所述的自适应频域滤波辅助空间转换的分布式信源编码方法，其特征在于，在步骤(11)中，利用仿射变换后提取的边信息特征来辅助重建。