CN113642709B

CN113642709B - 一种基于自编码器的数据重建方法

Info

Publication number: CN113642709B
Application number: CN202110934815.7A
Authority: CN
Inventors: 李宏贵
Original assignee: Yangzhou University
Current assignee: Yangzhou University
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2023-11-10
Anticipated expiration: 2041-08-16
Also published as: CN113642709A

Abstract

本发明公开了一种基于自编码器的数据重建方法，在自编码器中引入级联的解码单元，结合残差学习和对抗学习，以数据重建为研究目标，独立评估数据重建能力，改善数据重建质量，逐步向无损数据重建逼近，为基于自编码器的数据压缩和信号压缩感知提供坚实的理论和应用基础。

Description

一种基于自编码器的数据重建方法

技术领域

本发明涉及一种基于自编码器的数据重建方法。

背景技术

自编码器(Autoencoders，AE)是一种经典的深度神经网络架构，它首先按照一定的规则将高维数据映射到低维隐变量空间，然后从隐空间变量重建原始数据并使恢复误差最小化。自编码器拥有稀疏、卷积、变分、对抗、Wasserstein、图结构、极限学习、集成学习、可逆函数、递归/循环、双重/对偶、去噪、生成、模糊、非负、二元、量子、线性、盲、群和核自编码器等多种理论模型，在数据分类、识别、编码、感知和处理等领域获得了广泛的研究与应用。因为深度自编码器由编码和解码单元组成，所以具有实现高性能数据压缩和信号压缩感知的潜在能力。但目前自编码器还是主要用于特征表示领域，鲜有用于数据重建的研究和应用，其原因之一在于自编码器还难以实现无损数据重建。

发明内容

发明目的：针对上述现有技术，提出一种基于自编码器的数据重建方法，提高自编码器用于数据重建的性能。

技术方案：一种基于自编码器的数据重建方法，所述自编码器包括编码单元以及级联的解码单元；发送方采用所述编码单元对原始数据进行数据编码，接收方采用所述级联的解码单元进行数据解码，实现数据重构。

有益效果：本发明将传统自编码器中单一的解码单元改进为级联的解码单元，以提高其数据重建质量。在公开的MNIST、EMNIST、FMNIST和MMNIST数据集上，本发明相对于传统自编码器(AE)的结构相似性增益(ΔSSIM)最高可达0.1。

附图说明

图1为基于级联解码单元的自编码器；

图2为基于残差级联解码单元的自编码器；

图3为残差级联解码单元；

图4为基于对抗级联单元的自编码器；

图5为基于残差对抗解码单元的自编码器；

图6为残差对抗解码单元；

图7为编码单元组成；

图8为解码单元组成；

图9为鉴别单元组成。

具体实施方式

下面结合附图对本发明做更进一步的解释。

实施例1：

一种基于自编码器的数据重建方法，自编码器包括编码单元以及级联的解码单元；发送方采用编码单元对原始数据进行数据编码，接收方采用级联的解码单元进行数据解码，实现数据重构。

基于级联解码单元(Cascade-Decoders)的自编码器包括：编码单元(Encoder)，解码单元1(Decoder 1)，解码单元2(Decoder 2)，……，解码单元N(Decoder N)。自编码器中级联N个解码单元。

如图1所示，采用通用解码单元时，自编码器表示为：

其中，E表示编码单元；D_n表示第n个解码单元；x为自编码器输入数据；z为编码单元输出的数据，为潜在空间中的低维表示；N为解码单元个数；y_n-1为各级解码单元输出；y为自编码器输出数据。

自编码器的网络参数通过公式(2)描述的优化问题求解：

其中，θ为自编码器的网络参数，C_z为隐变量的约束，为y_n的约束；

采用逐步和串行训练自编码器，将等式(2)中的最小化问题分为以下子最小化问题：

其中，θ₁是编码器和解码器1的网络参数；θ₂,…,θ_N是解码器2到N的网络参数。

本发明将传统自编码器中单一的解码单元改进为级联的解码单元，以提高其数据重建质量。其中，如图7、图8所示，编码单元和解码单元具体可由输入层(Input Layer)，输出层(Output Layer)，隐含层(Hidden Layer)，全连接层(Fully-Connected Layer)，泄漏矫正线性单元(Leaky Rectified LinearUnit)，双曲正切单元(Hyperbolic TangentUnit,TanhUnit)和Sigmoid单元组成，还可以引入卷积层。

因为级联解码单元的输出可以逐步和渐进地逼近输入数据，所以数据重建性能优于基于单个解码单元的传统自编码器。在公开的MNIST、EMNIST、FMNIST和MMNIST数据集上，本方法相对于传统自编码器(AE)的结构相似性增益(ΔSSIM)最高可达0.11930，可以用于数据压缩和信号压缩感知。

实施例2：

基于级联解码单元(Cascade-Decoders)的自编码器包括：编码单元(Encoder)，解码单元1(Decoder 1)，解码单元2(Decoder 2)，……，解码单元N(DecoderN)。自编码器中级联N个解码单元。

如图2所示，自编码器采用基于残差级联解码单元时，自编码器表示为：

其中，E表示编码单元；D_n表示第n个解码单元；x为自编码器输入数据；z为编码单元输出的数据，为潜在空间中的低维表示；N为解码单元个数；y_n-1为各级解码单元输出；y₀是零样本；y为自编码器输出数据；r_n是x和y_n之间的残差样本。

图中，深灰色信号流用于训练阶段，浅灰色信号流用于训练和测试两个阶段。每个解码器都是一个残差模块。自编码器的网络参数通过公式(5)描述的优化问题求解：

其中，θ为自编码器的网络参数；C_z为隐变量的约束，例如，z满足给定的分布；；为y_n的约束，例如，y满足稀疏先验；自动编码器要求y最大程度地重构x；也可以利用其他约束，例如高维重建数据的稀疏性和低秩属性。

采用逐步和串行训练自编码器，将等式(5)中的最小化问题划分为以下子最小化问题：

各级残差数据是输入数据与重建数据的误差，其均值和方差远小于输入数据和重建数据，因此深度神经网络重建各级残差数据的性能优于直接重建输入数据。在公开的MNIST、EMNIST、FMNIST和MMNIST数据集上，本方法相对于传统自编码器(AE)的结构相似性增益(ΔSSIM)最高可达0.08607，可以用于数据压缩和信号压缩感知。

此外，如图3所示，如果只使用级联解码单元，则不需区分训练和测试通道，可以进一步提高数据重建性能，以用于CT和MR图像重建以及图像增强、去噪、修复和补全等应用。

实施例3：

如图4所示，自编码器采用基于对抗级联解码单元时，自编码器表示为：

图中，深灰色信号流用于训练阶段，浅灰色信号流用于训练和测试两个阶段。自编码器的网络参数通过公式(8)描述的优化问题求解：

其中，θ为自编码器的网络参数；为y_n的约束；DC_n是第n个鉴别器；α_n是训练参数，为一个常数；β_n是一个常数；ε是[0,1]内的一个正常数；M是均值算子。图9为鉴别单元组成。

采用逐步和串行训练所述自编码器，将等式(8)中的最小化问题划分为以下子最小化问题：

因为级联对抗解码单元的输出可以逐步和渐进地逼近输入数据，所以数据重建性能优于基于单个解码单元的传统自编码器。在公开的MNIST、EMNIST、FMNIST和MMNIST数据集上，本方法相对于传统自编码器(AE)的结构相似性增益(ΔSSIM)最高可达0.11480，可以用于数据压缩和信号压缩感知。

实施例4：

如图5所示，自编码器采用基于残差对抗级联解码单元时，自编码器表示为：

图中，深灰色信号流用于训练阶段，浅灰色信号流用于训练和测试两个阶段。自编码器的网络参数通过公式(11)描述的优化问题求解：

其中，θ为自编码器的网络参数；为y_n的约束；DC_n是第n个鉴别器；α_n是一个常数；β_n是一个常数；ε是[0,1]内的一个正常数；M是均值算子。

采用逐步和串行训练所述自编码器，将等式(11)中的最小化问题划分为以下子最小化问题：

因为各级解码单元结合了残差学习和对抗学习，所以数据重建性能优于基于单个解码单元的传统自编码器。在公开的MNIST、EMNIST、FMNIST和MMNIST数据集上，本方法相对于传统自编码器(AE)的结构相似性增益(ΔSSIM)最高可达0.08702，可以用于数据压缩和信号压缩感知。

此外，如图6所示，如果只使用级联解码单元，则不需区分训练和测试通道，可以进一步提高数据重建性能，以用于CT和MR图像重建以及图像增强、去噪、修复和补全等应用。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于自编码器的数据重建方法，其特征在于，所述自编码器包括编码单元以及级联的解码单元；发送方采用所述编码单元对原始数据进行数据编码，接收方采用所述级联的解码单元进行数据解码，实现数据重构；

级联N个解码单元，所述自编码器表示为：

其中，E表示编码单元；D_n表示第n个解码单元；x为自编码器输入数据；z为编码单元输出的数据，为潜在空间中的低维表示；N为解码单元个数；y_n-1为各级解码单元输出；y为自编码器输出数据；

所述自编码器的网络参数通过公式(2)描述的优化问题求解：

其中，θ为自编码器的网络参数，C_z为隐变量的约束，C_yn为y_n的约束；

采用逐步和串行训练所述自编码器，将等式(2)中的最小化问题分为以下子最小化问题：

2.一种基于自编码器的数据重建方法，其特征在于，所述自编码器包括编码单元以及级联的解码单元；发送方采用所述编码单元对原始数据进行数据编码，接收方采用所述级联的解码单元进行数据解码，实现数据重构；

所述自编码器采用基于残差级联解码单元，则自编码器表示为：

其中，E表示编码单元；D_n表示第n个解码单元；x为自编码器输入数据；z为编码单元输出的数据，为潜在空间中的低维表示；N为解码单元个数；y_n-1为各级解码单元输出；y₀是零样本；y为自编码器输出数据；r_n是x和y_n之间的残差样本；

所述自编码器的网络参数通过公式(5)描述的优化问题求解：

采用逐步和串行训练所述自编码器，将等式(5)中的最小化问题划分为以下子最小化问题：

3.一种基于自编码器的数据重建方法，其特征在于，所述自编码器包括编码单元以及级联的解码单元；发送方采用所述编码单元对原始数据进行数据编码，接收方采用所述级联的解码单元进行数据解码，实现数据重构；

所述自编码器采用基于对抗级联解码单元，则自编码器表示为：

所述自编码器的网络参数通过公式(8)描述的优化问题求解：

其中，θ为自编码器的网络参数；为y_n的约束；DC_n是第n个鉴别器；α_n是一个常数；β_n是一个常数；ε是一个小的正常数；M是均值算子；

4.一种基于自编码器的数据重建方法，其特征在于，所述自编码器包括编码单元以及级联的解码单元；发送方采用所述编码单元对原始数据进行数据编码，接收方采用所述级联的解码单元进行数据解码，实现数据重构；

所述自编码器采用基于残差对抗级联解码单元，则自编码器表示为：

所述自编码器的网络参数通过公式(11)描述的优化问题求解：

其中，θ为自编码器的网络参数；C_yn为y_n的约束；DC_n是第n个鉴别器；α_n是一个常数；β_n是一个常数；ε是一个小的正常数；M是均值算子；