CN115146226A

CN115146226A - 基于张量压缩方法的流数据处理方法、装置及设备

Info

Publication number: CN115146226A
Application number: CN202211056894.7A
Authority: CN
Inventors: 杨超; 刘翠玉; 肖传福; 丁明朔
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2022-08-31
Filing date: 2022-08-31
Publication date: 2022-10-04
Anticipated expiration: 2042-08-31
Also published as: CN115146226B

Abstract

本公开的实施例提供了一种基于张量压缩方法的流数据处理方法、装置及设备，涉及数据处理领域。所述方法包括对流数据的数据矩阵进行采样，提取多个矩阵；对采样得到的矩阵进行张量化处理，得到三阶张量；对所述三阶张量进行Tucker分解，得到压缩矩阵；利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。以此方式，得到的压缩矩阵提取了流数据的主要特征，保证高精度的同时提高了效率。

Description

基于张量压缩方法的流数据处理方法、装置及设备

技术领域

本公开涉及数据处理领域，尤其提供一种基于张量压缩方法的流数据处理方法、装置及设备。

背景技术

流数据是指由一个或几个分布连续生成的数据，其包括多种数据如信号流、视频流、高光谱图像等。在实际应用中，通常需要对这些数据进行批处理或实时处理，而大多数数据处理可转化为在矩阵上的基本运算。例如视频流的压缩、去噪和特征提取任务等同于求解矩阵低秩逼近问题。为满足流数据的批处理或实时处理需求，则需要根据流数据的结构设计快速有效的算法。

流数据低秩逼近问题是对一系列由某个或几个分布连续生成的矩阵做低秩逼近。直接的方法是依次计算这些矩阵的奇异值分解，Eckart-Young定理保证了该方法能够得到最佳低秩逼近，但该方法的计算成本很高，不足以满足如流数据的实时处理需求。

为降低计算成本，随机奇异值分解算法常用于近似求解这些矩阵的低秩逼近，例如经典随机奇异值分解算法-SCW算法，其伪代码如下所示：Input:Matrix A∈R^m×n,truncation r<min{m,n},sketch matrix S∈R^k×m；1:Q,~←QR decomposition of A^TS^T；2:[AQ]_r←truncated rank-r SVD of AQ；3:

←[AQ]_rQ^T；Output；Low-rank approximationof A:

。SCW算法的计算精度和效率依赖于输入的压缩矩阵S，理想的压缩矩阵应该包含输入矩阵A的左主奇异子空间。

构造压缩矩阵S的经典方法是通过某个分布随机生成如Gaussian、Cauchy和Rademacher分布等，根据这些分布生成的矩阵在一定程度上保留了输入矩阵A的距离信息。虽然随机生成的方案在构造压缩矩阵方面的时间成本基本可以忽略，但其得到的压缩矩阵没有充分利用流数据的局部连续性特点，所以导致SCW算法的计算精度往往较低。

Learning-based的方法则是通过从流数据中预先选定的训练样本中学习得到一个稀疏压缩矩阵，该方法因为考虑了流数据的局部连续性特点，所以提高了SCW算法的计算精度。但由于该方法是通过随机梯度下降法求解一个优化问题得到压缩矩阵的，而该优化问题的目标函数中含有奇异值分解算子，因此在迭代过程中需要计算奇异值分解算子的梯度。尽管通过幂迭代过程可实现对奇异值分解算子的梯度计算，但其不仅极大地增加了构造压缩矩阵的时间成本，而且在迭代过程中面临梯度消失或爆炸问题，其导致计算过程不稳定。另外，数值实验表明Learning-based的方法容易产生过拟合现象，其构造的压缩矩阵在用于推断时仍然使得SCW算法的计算精度不高。

发明内容

本公开提供了一种基于张量压缩方法的流数据处理方法、装置及设备。

根据本公开的第一方面，提供了一种基于张量压缩方法的流数据处理方法。该方法包括：对流数据的数据矩阵进行采样，提取多个矩阵；对采样得到的矩阵进行张量化处理，得到三阶张量；对所述三阶张量进行Tucker分解，得到压缩矩阵；利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

根据本公开的第二方面，提供了一种基于张量压缩方法的流数据处理装置。该装置包括：采样模块，用于对流数据的数据矩阵进行采样，提取多个矩阵；张量化处理模块，用于对采样得到的矩阵进行张量化处理，得到三阶张量；分解模块，用于对所述三阶张量进行Tucker分解，得到压缩矩阵；低秩逼近模块，用于利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

根据本公开的第三方面，提供了一种电子设备。该电子设备包括：存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

应当理解，发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案，不构成对本公开的限定。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：

图1示出了根据本公开实施例的基于张量压缩方法的流数据处理的示意图；

图2示出了根据本公开实施例的基于张量压缩方法的流数据处理方法的流程图；

图3示出了根据本公开实施例的基于张量压缩方法的流数据处理装置的框图；

图4示出了根据本公开实施例的不同sketching算法的效率测试的示意图；

图5示出了根据本公开实施例的不同sketching算法的精度测试的示意图；

图6示出了能够实施本公开实施例的示例性电子设备的方框图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本公开保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本公开中，如附图图1所示，基于张量压缩方法进行流数据处理，使用基于张量技术的sketching方法解决流数据低秩逼近问题，得到好的压缩矩阵。本发明从子空间的角度出发，充分考虑了流数据的局部连续性特征，将复杂的优化问题转化为Tucker分解的问题，基于Tucker分解的高效算法计算得到压缩矩阵。本公开的方案的计算成本等价于求解三阶张量的Tucker分解，得到的压缩矩阵提取了流数据的主要特征，保证高精度的同时提高了效率。

图2示出了根据本公开实施例的基于张量压缩方法的流数据处理方法200的流程图。

在框210，对流数据的数据矩阵进行采样，提取多个矩阵。

在一些实施例中，所述采样可以是均匀随机采样、重要性采样等采样方式。流数据通常由大量连续变化的矩阵组成，存在局部连续型特征，例如图像中各图像块之间；因此，采样规模较小时，例如采样比1%的情形下，就能取得较好的效果。

绝大部分情形下，对所有算法而言，增大采样比能达到提升精度的效果，但相对来说，本公开实施例的方案的精度对采样比更不敏感，在采样比1%的情形下，就能达到不错的精度，继续提升采样比精度提升并不显著，而Learning-based算法在小样本下（采样比为1%），精度表现并不理想，在中样本（采样比为20%）和大样本（采样比为80%）上精度提升较大，但与本方案的表现相比仍有不小的差距。

在框220，对采样得到的矩阵进行张量化处理，得到三阶张量。

在一些实施例中，从子空间的角度出发，将流数据中的多个矩阵项整体看成三阶张量。考虑流数据的时间维度，将采样得到的多个矩阵排成一个三阶张量。具体的，记排成的三阶张量为A，张量A的第一、二个维度对应流数据矩阵的行与列，第三个维度代表时间维度，例如A[:, :, t]表示时间t的流数据矩阵。

在一些实施例中，所述三阶张量中，所述多个矩阵的排列顺序可以任意选定。

在框230，对所述三阶张量进行Tucker分解，得到压缩矩阵。

在一些实施例中，基于张量分解的sketching方法，对所述三阶张量进行Tucker分解。

在一些实施例中，根据对精度和效率的需求，对所述三阶张量进行Tucker分解包括单边情形和双边情形。其中，应用Tucker分解技术对所述三阶张量进行分解得到压缩矩阵，不仅考虑使用压缩矩阵S对流数据中矩阵A的行空间进行压缩，还增加考虑使用压缩矩阵W对矩阵A的列空间进行压缩，以及同时使用压缩矩阵S、压缩矩阵W对矩阵的行空间和列空间进行压缩，其中使用单个压缩矩阵（S或W）对矩阵A的行空间或列空间进行压缩的方案称为单边情形，同时使用两个压缩矩阵（S和W）对矩阵A的行空间和列空间进行压缩的方案称为双边情形。

基于张量压缩方法的流数据低秩逼近技术的主要思想是将SCW算法的误差函数进行两次松弛操作，从而将较难处理的优化问题进行简化，而简化后的优化问题和三阶张量的Tucker分解问题等价，因此为了得到好的压缩矩阵，利用Tucker分解的技术进行处理。其中，单边情形对应压缩流数据中矩阵的行空间，需要计算压缩矩阵S，而S的求解等价于求解所述三阶张量的Tucker1分解，求解算法是张量矩阵化的截断SVD；双边情形对应同时压缩流数据矩阵的行空间和列空间，需要计算压缩矩阵S和W，此时等价于求解所述三阶张量的Tucker2分解，可选择Tucker分解的经典算法进行求解，如t-HOSVD, st-HOSVD, HOOI等，本公开实施例中求解算法是以随机矩阵初始化的HOOI (Higher-Order OrthogonalIteration)。

单边情形比双边情形的精度更高，双边情形由于同时对矩阵的行列空间进行压缩，损失了部分精度，但计算低秩逼近时需要应用SVD的矩阵规模更小，因此实际应用中效率更高。单边情形和双边情形的具体选择取决于对精度和效率的需求。

在框240，利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

在一些实施例中，应用SCW算法计算对应的矩阵低秩逼近。SCW算法的主要思想是在通过压缩矩阵压缩后的矩阵行空间或列空间中求解矩阵的低秩逼近，具体来说，压缩矩阵左乘或右乘数据矩阵得到规模更小的矩阵，将该规模更小的矩阵进行QR分解得到行空间或列空间的一组正交基，最后计算数据矩阵在行或列空间投影的秩r逼近即可。将流数据的数据矩阵以及所述压缩矩阵作为SCW算法的输入，得到对应的流数据的数据矩阵低秩逼近。其中，流数据的数据矩阵逼近为两个小规模矩阵，作为所述流数据的数据矩阵的压缩格式。通过所述压缩格式的矩阵低秩逼近，可以减小流数据的存储量，后续只需将两个小规模矩阵相乘即可进行数据恢复，得到原始的流数据的数据矩阵。

在一些实施例中，所述方法还包括：

根据所述矩阵低秩逼近对所述流数据进行数据恢复。为计算误差，将数据恢复后的矩阵与原数据矩阵比较，根据两个矩阵差的F范数度量低秩逼近的精度。

将所述矩阵低秩逼近，即两个小规模矩阵相乘，所得到的矩阵即可作为原始的流数据的数据矩阵。

根据本公开的实施例，实现了以下技术效果：

第一，时间成本低，同等实验设置下，相比于已有的Learning-based方法，生成压缩矩阵的效率提升了1,000至100,000倍；

第二，精确度高，相比随机生成压缩矩阵和Learning-based 压缩矩阵，在计算流数据低秩逼近的精度上提升了10至100倍；

第三，扩展性好，生成的压缩矩阵是为提取流数据中矩阵的主要特征，因此对不在训练集范围的数据，得到的低秩逼近也能达到不错的精度，不会像Learning-based方法出现过拟合的现象；

第四，压缩矩阵正交性，由于生成压缩矩阵是通过HOOI方法得到，因而是行正交的，从而可以使用one-pass的算法计算低秩逼近。

通过对比实现了不同方法在三个数据集上的表现，包括HSI, Logo和MRI，包括精度和效率测试，实验设置低秩逼近的截断r为10。在所有数据集上，本公开实施例的方案精度相比其他方案提升了10至100倍，在运行效率上比Learning-based方法提升了1,000至100,000倍。

本公开探索了不同算法的精度和效率如何随压缩矩阵规模（S或W的行数k）变化，如图4和图5所示，其中横坐标是压缩矩阵的行的数目k。从图4和图5可以看出随着k的增长，本公开实施例的方案的误差下降幅度最大，时间成本提升幅度最小，这意味着可以适当设置更大规模的压缩矩阵，花费稍高的时间成本但是能获得精度的大幅提升，而对于Learning-based算法，增大压缩矩阵的规模增加的时间成本是巨大的，虽然本公开实施例的方案相比随机生成压缩矩阵时间成本更高，但是在精度上的提升是尤为显著的。

此外，针对不同的采样数在不同数据集上进行测试，压缩矩阵的行数设置为20，采样方式都是随机均匀采样。

表1

，HSI，Logo和MRI数据集中不同样本比例下各种算法的测试误差（×10^-2）。

从表1可以看出，在所有采样比设置下，本公开实施例的方案的精度都显著高于其他方案，其中对数据集Logo且在采样比为1%的情形下，使用Learning-based算法的测试误差高达0.0638，而本公开实施例的方案的误差仅有0.0036和0.0205（分别对应单边和双边）。绝大部分情形下，对所有方案而言，增大采样比能达到提升精度的效果，但相对来说，本公开实施例的方案的精度对采样比更不敏感，在采样比1%的情形下，本方案就能达到不错的精度，继续提升采样比精度提升并不显著，而Learning-based算法在小样本下（采样比为1%），精度表现并不理想，在中样本（采样比为20%）和大样本（采样比为80%）上精度提升较大，但与本公开实施例的方案的表现相比仍有不小的差距。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。

以上是关于方法实施例的介绍，以下通过装置实施例，对本公开所述方案进行进一步说明。

图3示出了根据本公开的实施例的基于张量压缩方法的流数据处理装置300的方框图。如图3所示，装置300包括：

采样模块310，用于对流数据的数据矩阵进行采样，提取多个矩阵；

张量化处理模块320，用于对采样得到的矩阵进行张量化处理，得到三阶张量；

分解模块330，用于对所述三阶张量进行Tucker分解，得到压缩矩阵；

低秩逼近模块340，用于利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图6示出了可以用来实施本公开的实施例的电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

设备600包括计算单元601，其可以根据存储在只读存储器（ROM）602中的计算机程序或者从存储单元608加载到随机访问存储器（RAM）603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还有可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出（I/O）接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元（CPU）、图形处理单元（GPU）、各种专用的人工智能（AI）计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器（DSP）、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如方法200。例如，在一些实施例中，方法200可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM603并由计算单元601执行时，可以执行上文描述的方法200的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式（例如，借助于固件）而被配置为执行方法200。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列（FPGA）、专用集成电路（ASIC）、专用标准产品（ASSP）、芯片上系统的系统（SOC）、负载可编程逻辑设备（CPLD）、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦除可编程只读存储器（EPROM或快闪存储器）、光纤、便捷式紧凑盘只读存储器（CD-ROM）、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置（例如，CRT（阴极射线管）或者LCD（液晶显示器）监视器）；以及键盘和指向装置（例如，鼠标或者轨迹球），用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈（例如，视觉反馈、听觉反馈、或者触觉反馈）；并且可以用任何形式（包括声输入、语音输入或者、触觉输入）来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统（例如，作为数据服务器）、或者包括中间件部件的计算系统（例如，应用服务器）、或者包括前端部件的计算系统（例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互）、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信（例如，通信网络）来将系统的部件相互连接。通信网络的示例包括：局域网（LAN）、广域网（WAN）和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种基于张量压缩方法的流数据处理方法，其特征在于，包括：

对流数据的数据矩阵进行采样，提取多个矩阵；

对采样得到的矩阵进行张量化处理，得到三阶张量；

对所述三阶张量进行Tucker分解，得到压缩矩阵；

利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

2.根据权利要求1所述的方法，其特征在于，所述对采样得到的矩阵进行张量化处理包括：

将采样得到的多个矩阵排成一个三阶张量。

3.根据权利要求2所述的方法，其特征在于，对所述三阶张量进行Tucker分解包括：

使用单个压缩矩阵S或W对矩阵A的行空间或列空间进行压缩的单边情形；和/或，

同时使用两个压缩矩阵S和W对矩阵A的行空间和列空间进行压缩的双边情形。

4.根据权利要求3所述的方法，其特征在于，所述单边情形对应Tucker1分解，求解算法是张量矩阵化的截断SVD。

5.根据权利要求3所述的方法，其特征在于，所述双边情形对应Tucker2分解，求解算法是以随机矩阵初始化的HOOI。

6.根据权利要求3所述的方法，其特征在于，利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解包括：

将所述压缩矩阵作为SCW算法的输入，得到对应的流数据的数据矩阵低秩逼近。

7.一种基于张量压缩方法的流数据处理装置，其特征在于，包括：

采样模块，用于对流数据的数据矩阵进行采样，提取多个矩阵；

张量化处理模块，用于对采样得到的矩阵进行张量化处理，得到三阶张量；

分解模块，用于对所述三阶张量进行Tucker分解，得到压缩矩阵；

低秩逼近模块，利用所述压缩矩阵对流数据的数据矩阵进行低秩逼近求解。

8.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其特征在于，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。