CN113869503B

CN113869503B - 一种基于深度矩阵分解补全的数据处理方法及存储介质

Info

Publication number: CN113869503B
Application number: CN202111454575.7A
Authority: CN
Inventors: 马晓轩; 李志文; 刘超; 张翰韬
Original assignee: Beijing University of Civil Engineering and Architecture
Current assignee: Zhonggong Shitong (Beijing) Technology Co.,Ltd.
Priority date: 2021-12-02
Filing date: 2021-12-02
Publication date: 2022-03-01
Anticipated expiration: 2041-12-02
Also published as: CN113869503A

Abstract

本发明提供一种基于深度矩阵分解补全的数据处理方法及存储介质，包括：S1构建深度矩阵分解补全模型，所述模型的核心结构是恢复模块；S2在进行观测矩阵的奇异值分解前，对观测矩阵的缺失位置进行预填充；S3基于Frobenius范数构建所述恢复模块的损失函数；S4采用VOC数据集对深度矩阵分解补全模型进行训练。与传统算法相比，本发明基于深度学习与非线性的深度矩阵分解补全网络能够在更短的时间内获得更好的处理性能，端到端的深度矩阵分解补全网络是基于矩阵的全局信息对整个数据文件进行修复，不管是时间上还是修复效果上都能有明显的提升。与线性和非线性矩阵补全方法进行比较。深度矩阵分解补全网络能够使用更短的时间提供更高的矩阵补全精度。

Description

一种基于深度矩阵分解补全的数据处理方法及存储介质

技术领域

本发明涉及数据处理领域，尤其涉及基于深度矩阵分解补全的数据处理领域。

背景技术

矩阵补全是从一个欠采样或不完整数据中恢复出一个完整矩阵，它已被广泛应用于协同过滤、图像修复、图像去噪与图像分类等研究领域中。矩阵补全方法试图从部分观测数据(或欠采样数据)中恢复出原始完整矩阵。在原始完全矩阵是低秩的假设下，求解矩阵补全的两种常用方法为基于核范数和矩阵分解的方法。

虽然矩阵补全在数据处理领域中已有广泛的应用前景，但同时也存在挑战。传统的矩阵补全方法一般都是基于浅层的线性模型，并假设得到的不完全矩阵是来自于低秩矩阵。当原始矩阵很大但获得的观测数据很少时，便容易导致过拟合，性能也随之显著下降。近期，研究人员尝试将深度学习与非线性技术应用到矩阵补全中，但由于矩阵尺寸的限制，大部分的基于深度学习的矩阵补全算法都是将矩阵的每一行（或每一列）作为网络的输入，通过优化训练对其进行恢复，但并没有考虑到矩阵数据的整体结构关系，丢失了矩阵的全局结构信息。尤其将其应用于图像修复时，由于图像具有很强的结构性，如果在对图像修复时抛弃其整体结构性而仅仅对其每一列（每一行）信息进行独立修复并不能得到理想的结果。

发明内容

为了解决现有技术中存在的上述问题，本发明提供：

一种基于深度矩阵分解补全的数据处理方法，包括以下步骤：

S1 构建深度矩阵分解补全网络模型，模型的核心结构是恢复模块；

S2 在进行观测矩阵的奇异值分解前，对观测矩阵的缺失位置进行预填充；

S3 基于Frobenius范数构建恢复模块的损失函数；

S4 采用VOC数据集对深度矩阵分解补全模型进行训练；

其中，恢复模块包括块变量U更新模块、块变量V更新模块和块变量X更新模块，采用深度学习算法，将变量映射到固定深度的神经网络来实现恢复模块的变量更新。

作为一个实施例，S1构建深度矩阵分解补全网络模型具体包括以下步骤：

S1.1 构建使用低秩矩阵分解的图像矩阵补全模型；

S1.2 使用矩阵分解代替传统的核范数最小化；

S1.3 基于交替方向乘子法，每次迭代求解时只优化块变量U, 块变量V,拉格朗日乘子S和块变量X中一个变量，同时将其他的变量固定在它们的最新值，以此获得迭代模型，并将该模型映射到神经网络中进行求解。

作为一个实施例，S1.1构建使用低秩矩阵分解的图像矩阵补全模型包括：

使用低秩矩阵分解的图像矩阵补全模型的通用优化目标用下列公式表示：

（1）

其中，

是观测矩阵；

是想从欠采样矩阵Y中恢复出来的矩阵，

为正则项系数；

是矩阵X的核范数；

表示Y的观测项的重构误差，其中

表示哈达玛积（Hadamard product），

，若Y在(i,j)位置处缺失数据，则

值为0，否则为1。

作为一个实施例，使用矩阵分解代替传统的核范数最小化的模型用下列公式表示：

（2）

其中，

，

；

对应于公式(2)的增广拉格朗日函数为：

(3)

其中，

是惩罚参数，

是与约束

相对应的拉格朗日乘子。

作为一个实施例，S1.3具体包括以下步骤：

S1.3.1 构建块变量U更新模块和块变量V更新模块；

S1.3.2 构建块变量X更新模块。

作为一个实施例，S1.3.1 构建块变量U更新模块和块变量V更新模块具体包括：

块变量U更新模块和块变量V更新模块的更新公式如下：

其中，

表示卷积神经网络。

作为一个实施例，S1.3.2 构建块变量X更新模块具体包括：

通过块变量U更新模块和块变量V更新模块得到

和

后，拉格朗日乘数

可以通过如下公式更新：

然后，将它们输入到块变量X更新模块，通过以下公式得到

：

最后，块变量X更新模块中的自动编码器的输出

与原始欠采样矩阵进行加权平均运算，如下公式所示：

其中，

为初始欠采样矩阵，

为正则项系数；当图像中某点的像素值缺失，便将网络输出

的对应位置的值直接赋给

；若该点未被破坏，则将网络的输出与图像对应位置的像素值通过加权平均获得最终该位置的重建后的像素值；

是该恢复模块获得的最终结果。

作为一个实施例，S2对观测矩阵的缺失位置进行预填充具体包括：

通过神经网络算法实现预填充，和/或，通过改进的最近邻均值填充算法实现预填充。

作为一个实施例，深度矩阵分解补全网络模型包括恢复模块，恢复模块的损失函数用下列公式表示：

其中，

为修复模块的网络参数，B为输入网络的样本个数，

和

是正则项系数；

表示第b个样本对应的恢复模块的输出

，

为第b个样本对应的自动编码器的输入

；

和

为第b个样本输出的

和

，

为第b个样本对应的完整图像。

本发明还提供一种存储介质，其存储有计算机程序；当计算机程序被计算机设备中的处理器执行时，计算机设备执行如上述任一项所述的方法。

本发明结合深度学习与传统矩阵补全算法提出了用于数据处理的深度矩阵分解补全网络模型。将传统矩阵补全算法模型中的变量迭代更新映射到固定深度的神经网络中，通过端到端的可训练方式学习观测到的矩阵数据之间的潜在关系，从而形成高性能且易于部署的非线性矩阵补全解决方案。与传统算法相比，基于深度学习与非线性的深度矩阵分解补全网络能够在更短的时间内获得更好的恢复性能，而比起目前流行的基于深度学习的矩阵补全算法，端到端的深度矩阵分解补全网络是基于数据矩阵的全局信息对整个数据文件进行修复，不管是时间上还是修复效果上都能有明显的提升。在数据处理任务中，将深度矩阵分解补全网络与最先进的线性和非线性矩阵补全方法进行了比较。实验结果表明，深度矩阵分解补全网络能够使用更短的时间提供比现有方法更高的矩阵补全精度。

附图说明

为了更清楚地说明发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1-1 本发明的网络架构图

图1-2 本发明恢复模块的结构示意图

图1-3 本发明块变量U更新模块和块变量V更新模块的模型示意图

图2 本发明的方法流程图

图3 本发明改进的最近邻均值填充算法示意图

图4 本发明的不同填充算法在训练期间的损失收敛情况和测试数据的重构结果图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

实施例一

为解决现有技术存在的问题，本实施例提供一种基于深度矩阵分解补全的数据处理方法，其流程图如图2所示，主要包括以下步骤：

S1 构建深度矩阵分解补全（深度矩阵分解补全网络）模型，模型的核心结构是恢复模块。

具体的，S1构建深度矩阵分解补全（深度矩阵分解补全网络）模型包括以下步骤：

S1.1 构建使用低秩矩阵分解的图像矩阵补全模型。

具体的，其通用优化目标用下列公式表示：

(1)

其中，

是观测矩阵，其缺失信息被预定义常数代替。

是想从欠采样矩阵Y中恢复出来的矩阵，

为正则项系数。

是矩阵X的核范数，用于限制X的秩。

表示Y的观测项的重构误差，其中

表示哈达玛积（Hadamardproduct），

，若Y在(i,j)位置处缺失数据，则

值为0，否则为1。

S1.2 使用矩阵分解代替传统的核范数最小化。

具体的，其模型具体可描述为：

(2)

其中，

，

。

对应于(2)的增广拉格朗日函数为：

(3)

其中，

是惩罚参数，

是与约束

相对应的拉格朗日乘子。本发明通过使用矩阵分解代替传统的核范数最小化，可以避免频繁使用奇异值分解。

具体的，本发明遵循如下框架：

(4)

其中，

是步长参数。

由于直接用传统算法求解会有很多局限性，本发明提出的深度矩阵分解补全网络算法采用深度学习的方法来解决上述优化问题。深度矩阵分解补全网络的具体思想是通过将变量映射到固定深度的神经网络来更新变量。同时，由于深度学习和神经网络的优越性，本发明期望变量只需更新一次就能得到满意的结果。

在图1-1所示的基础上构建了一个网络结构，深度矩阵分解补全网络的核心结构是恢复模块，它包含三个更新模块，如图1-2所示。完整的恢复模块包括用于更新矩阵U和V的块变量U更新模块和块变量V更新模块，以及用于恢复欠采样图像的块变量X更新模块。

具体的，S1.3包括以下步骤：

S1.3.1 构建块变量U更新模块和块变量V更新模块。

如图1-3所示，当欠采样图像被输入到恢复模块时，将首先被输入到块变量U更新模块，然后被输入到块变量V更新模块。块变量U和V的第一次迭代的更新公式如下所示：

(5)

如(5)所示，U的更新公式中涉及变量

和

，因此本发明选择将它们添加到块变量U更新模块的输入中。此外，为了学习最大卷积特征，还添加了

作为块变量U更新模块的输入。另外，(5)中的辅助矩阵变量

通常被初始化为零矩阵，因此在块变量U更新模块和块变量V更新模块中可以省略它。因此在(5)的基础上，对于块变量U更新模块，本发明将变量

、

和

在通道维度上进行拼接作为输入，并使用固定深度的卷积神经网络来映射变量的更新。

对于V矩阵的更新，本发明也采取了类似的更新步骤，此时我们得到更新后的

，然后在通道维度上将

、

和

连接起来作为输入，得到

。因此，U和V矩阵的更新公式如下：

（6）

其中，

表示卷积神经网络。

此外，U和V的初始化将影响恢复结果，为了获得更好的初始化值，需要首先对欠采样图像进行奇异值分解(SVD)，记为：

（7）

其中，

是对角线矩阵，

。对角线上为

，其他地方都为零。

是矩阵

的奇异值。

和

分别为左奇异向量和右奇异向量。则通过如下所示的初始化操作可以获得

和

。

（8）

其中

为U的前r列，

为V的前r列，

为

的前r行和前r列，其中m=n。

为了保持最大信息量，网络中采用密集卷积结构，并加入残差结构来使得在较深网络中任然训练稳定。网络中采用步长为1并且进行padding的卷积运算使其卷积前后尺寸不变，由于Mish函数在曲线几乎所有点上的平滑度，能够允许更好的信息流入神经网络，本文选择其作为激活函数，同时卷积之间加入了批归一化操作（BN）来加快收敛速度。

S1.3.2 构建块变量X更新模块。

通过U、块变量V更新模块得到

和

后，拉格朗日乘数

可以通过如下公式更新：

（9）

然后，将它们输入到块变量X更新模块，通过以下公式得到

：

（10）

为了提高重建性能，我们将

输入到由卷积层构成的自动编码器中。如图1-3所示，网络包含四个卷积运算，前两个卷积是正常卷积，后两个卷积是反卷积。除最后一层的激活函数使用TANH外，其余层均包含卷积运算后的批归一化运算和MISH激活函数。在实验中，发明人发现如果简单地将预测值填充到图像的缺失像素中，而不修改观测像素值，则输出图像不平滑，网络训练更加困难。因此，块变量X更新模块中的自动编码器的输出

与原始欠采样矩阵进行加权平均运算，如下所示：

（11）

其中，

为初始欠采样矩阵，

为正则项系数。当图像中某点的像素值缺失，便将网络输出

的对应位置的值直接赋给

。若该点未被破坏，则将网络的输出与图像对应位置的像素值通过加权平均获得最终该位置的重建后的像素值。

是该恢复模块获得的最终结果。

S2在进行观测矩阵的奇异值分解前，对观测矩阵的缺失位置进行预填充。

具体的，本发明提供两种预填充算法--深度矩阵分解补全网络-1算法和深度矩阵分解补全网络-2算法的网络架构图如图1-1所示。

深度矩阵分解补全网络-1算法，通过神经网络实现预填充，具体包括：

首先用预定义常数（如255）替代观测矩阵的缺失值获得

。接着对

进行奇异值分解操作得到

和

并将其输入到修复模块中进行初步修复获得

，将修复模块的输出矩阵

与

进行如下所示的填充操作得到

：

（12）

公式（12）便是通过神经网络初步推测图像矩阵缺失的值。将预测值填充到观测矩阵的缺失位置，然后将填充后得到的X作为第二个修复模块的输入再次进行修复。由于第二个修复模块中的

和

是通过新的

进行奇异值分解得到的，能够很大程度消除使用随机常数填充带来的负面影响，所以通过第二个修复模块能够获得更好的修复结果。

深度矩阵分解补全网络-2算法，基于最近邻均值填充（Nearest Neighbor MeanFilling，NNMF）算法实现填充，具体包括：

具体的，本发明基于改进的最近邻均值填充算法，通过动态规划可以有效地计算所有缺失数据位置处的填充值。如图3所示，首先按顺时针方向填充边缘缺失像素，然后在四个方向上生成四个矩阵，最后将生成的四个矩阵加和求均值即可得到填充后的矩阵。使用NNMF算法对观测矩阵进行预填充操作得到的矩阵作为恢复模块的输入。

本发明提出的NNMF计算方法不同于传统最近邻均值填充需遍历每一个缺失位置然后依次寻找缺失位置的上下左右四个值的计算方式，可以有效减少计算时间。

在训练过程中，只需对卷积网络U、V和自动编码器中的参数进行优化。

S3 基于Frobenius范数构建恢复模块的损失函数。

具体的，本发明使用Frobenius范数来限制网络中的变量，由此可得出一个恢复模块的损失函数：

（13）

其中，

为修复模块的网络参数，B为输入网络的样本个数，

和

是正则项系数。

表示第b个样本对应的恢复模块的输出

，

为第b个样本对应的自动编码器的输入

。

和

为第b个样本输出的

和

，

为第b个样本对应的完整图像。

本发明除了在损失函数中加入了修复模块最终输出的X来对其每个模块的输出都加以限制，还对模块中的中间变量进行限制，基于迭代模型搭建的可解释性网络中的每个变量都是具有实际意义的，相比于一般的卷积神经网络只能通过约束网络最后的输出来对整个网络权值进行全局优化，本发明的训练更加稳定且高效。

S4 采用VOC数据集对深度矩阵分解补全模型进行训练。

基于VOC数据集的多样性，为了适应更加复杂的图片的恢复，本发明选择该数据集作为训练样本。首先将图像转换成尺寸为256×256的灰度图，然后将图像中部分随机像素值用255代替。训练中超参数的设置如下，初始化U、V矩阵时设置的奇异值个数为前50个奇异值。训练网络时选择Adam作为优化器，逐步训练每个迭代模型时学习率设为

，趋于稳定后学习率降为

，全局微调时学习率设为

。块变量X更新模块中

设置为

，

设置为10。损失函数正则项系数

和

分别设置为0.1和0.01。块变量X更新模块中的自动编码器总共包含三个隐藏层，尺寸分别为

、

和

。

为了使其能够对缺失图像更有针对性的进行恢复，本发明为深度矩阵分解补全网络-1和深度矩阵分解补全网络-2网络各训练了两个模型。第一个模型使用的数据集为含有30%到50%缺失率的图像，所以该模型主要用于对缺失率为50%及以下的图像进行恢复。第二个模型使用的数据集为含有50%到70%缺失率的图像，这个模型则用于对缺失率达到50%至70%的图像进行恢复。其中训练深度矩阵分解补全网络-1时以一个修复模块作为训练单元采用逐步训练的策略进行训练，即先训练第一个修复模块，训练完成后冻结第一个修复模块的权重，接着训练新增的第二个修复模块，第二个修复模块训练完成后解冻第一个修复模块的权重进行全局微调。图4所示为两个模型训练期间损失收敛情况与测试数据的重建效果。

相比于CelebFaces Attributes DataSet(CelebA)数据集，在实现复杂图像的恢复时，本发明采用的VOC数据集训练的网络的丢失和重建性能更优，更具有针对性。

本发明结合深度学习与传统矩阵补全算法提出了用于数据处理的深度矩阵分解补全网络。将传统矩阵补全算法模型中的变量迭代更新映射到固定深度的神经网络中，通过端到端的可训练方式学习观测到的矩阵数据之间的潜在关系，从而形成高性能且易于部署的非线性矩阵补全解决方案。与传统算法相比，基于深度学习与非线性的深度矩阵分解补全网络能够在更短的时间内获得更好的恢复性能，而比起目前流行的基于深度学习的矩阵补全算法，端到端的深度矩阵分解补全网络是基于数据矩阵的全局信息对整个数据文件进行修复，不管是时间上还是修复效果上都能有明显的提升。在数据处理任务中，将深度矩阵分解补全网络与最先进的线性和非线性矩阵补全方法进行了比较。实验结果表明，深度矩阵分解补全网络能够使用更短的时间提供比现有方法更高的矩阵补全精度。

实施例二

本实施例提供一种存储介质，其存储有计算机程序；当所述计算机程序被计算机设备中的处理器执行时，计算机设备执行如上述任一项所述的方法。

本发明结合深度学习与传统矩阵补全算法提出了用于数据处理的深度矩阵分解补全网络（深度矩阵分解补全网络）。将传统矩阵补全算法模型中的变量迭代更新映射到固定深度的神经网络中，通过端到端的可训练方式学习观测到的矩阵数据之间的潜在关系，从而形成高性能且易于部署的非线性矩阵补全解决方案。与传统算法相比，基于深度学习与非线性的深度矩阵分解补全网络能够在更短的时间内获得更好的恢复性能，而比起目前流行的基于深度学习的矩阵补全算法，端到端的深度矩阵分解补全网络是基于数据矩阵的全局信息对整个数据文件进行修复，不管是时间上还是修复效果上都能有明显的提升。在数据处理任务中，将深度矩阵分解补全网络与最先进的线性和非线性矩阵补全方法进行了比较。实验结果表明，深度矩阵分解补全网络能够使用更短的时间提供比现有方法更高的矩阵补全精度。

为了说明的目的，前述描述使用具体命名以提供对所述实施方案的透彻理解。然而，对于本领域的技术人员而言将显而易见的是，不需要具体细节即可实践所述实施方案。因此，出于例示和描述的目的，呈现了对本文所述的具体实施方案的前述描述。这些描述并非旨在是穷举性的或将实施方案限制到所公开的精确形式。对于本领域的普通技术人员而言将显而易见的是，鉴于上面的教导内容，许多修改和变型是可行的。另外，当在本文中用于指部件的位置时，上文和下文的术语或它们的同义词不一定指相对于外部参照的绝对位置，而是指部件的参考附图的相对位置。

此外，前述附图和描述包括许多概念和特征，其可以多种方式组合以实现多种有益效果和优点。因此，可组合来自各种不同附图的特征，部件，元件和/或概念，以产生未必在本说明书中示出或描述的实施方案或实施方式。此外，在任何特定实施方案和/或实施方式中，不一定需要具体附图或说明中所示的所有特征，部件，元件和/或概念。应当理解，此类实施方案和/或实施方式落入本说明书的范围。