WO2023231571A1

WO2023231571A1 - 数据压缩方法及装置

Info

Publication number: WO2023231571A1
Application number: PCT/CN2023/087178
Authority: WO
Inventors: 张剑; 张希舟; 曹文龙; 全绍晖
Original assignee: 华为技术有限公司
Priority date: 2022-06-02
Filing date: 2023-04-08
Publication date: 2023-12-07

Abstract

公开了一种数据压缩方法及装置，涉及数据存储领域，解决了硬件压缩算法对不适配的其他数据类型的压缩效率较低，压缩系统的数据压缩效率受到影响的问题。在源数据的数据类型与硬件压缩算法不匹配时，压缩设备在对源数据进行预处理获取第一数据后，才将数据类型和设定的硬件压缩算法相匹配的第一数据进行压缩，使得设定的硬件压缩算法可适配更多类型的数据，压缩设备对源数据的预处理操作提高了硬件压缩算法的适用性。而且，压缩算法或模型不是以软件单元的形式存在于处理器中，而以硬件压缩算法的形式卸载在压缩设备中，该第一数据由压缩设备基于硬件压缩算法来进行压缩，提高了压缩设备对源数据进行压缩的效率。

Description

数据压缩方法及装置

技术领域

本申请涉及数据存储领域，尤其涉及一种数据压缩方法及装置。

背景技术

随着大数据(big data)、人工智能(artificial intelligence，AI)、云计算技术的发展，大量的数据不断产生。为了降低数据存储成本，处理器可以采用数据压缩算法压缩原始数据，即将原始数据按照特定方法重构，从而降低数据冗余度，缩减原始数据占用的存储容量。针对于不同类型的数据，不同的压缩算法的压缩效率不同。压缩系统通常会设置一个硬件加速卡，该硬件加速卡中部署有一种压缩算法，以对该压缩算法适配的数据类型进行压缩，但该硬件加速卡对不适配的其他数据类型的压缩效率较低，压缩系统的数据压缩效率受到影响。因此，如何提供一种更有效的数据压缩方法成为目前亟需解决的问题。

发明内容

本申请提供了数据压缩方法及装置，解决了硬件压缩算法对不适配的其他数据类型的压缩效率较低，压缩系统的数据压缩效率受到影响的问题。

第一方面，提供了一种数据压缩方法，该数据压缩方法由压缩设备执行。示例性的，该压缩设备可包括一个或多个处理器，其中一个处理器中部署有设定的硬件压缩算法。该数据压缩方法包括：压缩设备预处理源数据得到第一数据，该第一数据的类型与硬件压缩算法匹配；进而，压缩设备根据硬件压缩算法对第一数据进行压缩。

在源数据的数据类型与硬件压缩算法不匹配时，压缩设备在对源数据进行预处理获取第一数据后，才将数据类型和设定的硬件压缩算法相匹配的第一数据进行压缩，使得设定的硬件压缩算法可适配更多类型的数据，压缩设备对源数据的预处理操作提高了硬件压缩算法的适用性。而且，压缩算法或模型不是以软件单元的形式存在于处理器中，而以硬件压缩算法的形式卸载在压缩设备中，该第一数据由压缩设备基于硬件压缩算法来进行压缩，提高了压缩设备对源数据进行压缩的效率。

在一些示例中，硬件压缩算法包括：伦佩尔-齐夫(Lempel-Ziv，Lz)77压缩算法。

一种可选的实现方式中，压缩设备预处理源数据得到第一数据，包括：压缩设备根据硬件压缩算法的数据滑窗，从源数据中确定预处理数据；该数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围，且预处理数据在数据滑窗内存在冗余数据。进而，压缩设备从预处理数据中选择前述的第一数据。

在一些示例中，数据滑窗指示的数据范围也可称为：查询数据段、查询数据宽度等。

由于硬件压缩算法在部署到压缩设备中后，该硬件压缩算法具有固定的数据滑窗，硬件压缩算法对数据滑窗指示的数据范围内未存在冗余数据的第二数据的数据压缩效率较低，因此，在压缩设备从源数据中筛选出数据滑窗内存在冗余数据的预处理数据，并在预处理数据中选择第一数据，从而压缩设备基于硬件压缩算法对该第一数据进行压缩，避免了压缩第二数据占用硬件压缩算法的算力，提升了硬件压缩算法的对源数据的压缩效率。

一种可选的实现方式中，压缩设备预处理源数据得到第一数据，还包括：首先，压缩设备根据硬件压缩算法的数据滑窗，从源数据中确定第二数据；该第二数据在数据滑窗内不存在冗余数据。其次，压缩设备根据第二数据的数据类型，选择第一数据压缩模型。最后，压缩设备根据选择出的第一数据压缩模型对第二数据进行压缩。

在本实施例中，压缩设备将第二数据进行软件压缩，软件压缩所用的压缩算法可以是设定的多种数据压缩模型包含的一个或多个，这里以第一数据压缩模型为例进行说明，针对于待压缩的源数据而言，一部分数据(第一数据)可基于硬件压缩算法进行压缩，该部分数据的压缩效率较高；还有一部分数据(第二数据)可基于第二数据的数据类型选择出的第一数据压缩模型进行压缩，避免了第二数据与硬件压缩算法不适配(数据滑窗内不存在冗余数据)导致的压缩效率较低的问题，进一步提升了压缩设备对源数据的压缩效率。

一种可选的实现方式中，源数据包括多个数据块。压缩设备预处理源数据得到第一数据，包括：压缩设备从所述多个数据块中确定符合设定条件的第三数据块，该设定条件为：利用硬件压缩算法压缩数据块的预测数据量大于或等于数据块的数据量；以及，压缩设备从多个数据块中除第三数据块外的其他数据块中确定第一数据。可以理解的，数据块的预测数据量大于或等于数据块在压缩前的数据量的数据压缩过程可以称为一个无效的压缩过程，因此，对于第三数据块而言，该第三数据块由硬件压缩算法进行压缩会占用硬件压缩算法的处理带宽(单位时间内压缩的数据量)，会降低硬件压缩算法的压缩效率，因此，压缩设备从源数据中除该第三数据外的其他数据中确定第一数据，并基于硬件压缩算法对第一数据进行压缩，避免了第三数据块的压缩过程占用硬件压缩算法的处理带宽，提高了压缩设备对源数据的压缩效率。

一种可选的实现方式中，本实施例提供的数据压缩方法还包括：压缩设备输出第三数据块。在本实施例中，由于该第三数据块的预测数据量大于或等于第三数据块在压缩前的数据量，因此，压缩设备不对该第三数据块进行压缩，直接输出该第三数据块，避免了第三数据块的压缩过程占用硬件压缩算法的处理带宽或者占用数据压缩模型的处理带宽，提高了压缩设备对源数据进行压缩的速度，减少了数据压缩的时延。

一种可选的实现方式中，压缩设备预处理源数据得到第一数据，包括：压缩设备对源数据进行空间变换(position transform)，获取第一数据和变换信息；该变换信息用于指示源数据和第一数据之间的数据映射关系。在一些情形中，源数据的数据类型与硬件压缩算法不一定匹配，但是压缩设备对该源数据进行位置变换或空间变换等数据映射操作后，映射后数据的数据类型与硬件压缩算法相匹配，且由硬件压缩算法对映射后数据(如第一数据)进行压缩的效率较高，提升了硬件压缩算法的适用性，解决了源数据的数据类型与硬件压缩算法不适配导致的压缩效率降低的问题。

一种可选的实现方式中，本实施例提供的数据压缩方法还包括：压缩设备获取第一数据对应的第一压缩数据，并输出该第一压缩数据和前述的变换信息。值得注意的是，压缩设备将压缩后的第一压缩数据和前述的变换信息进行输出，解压缩设备(或称：解压设备)依据变换信息对第一压缩数据进行解压，从而获取前述的源数据，避免了源数据的数据类型与硬件压缩算法不适配导致的压缩效率降低的问题，提高了硬件压缩算法对源数据的压缩效率。

一种可选的实现方式中，压缩设备预处理源数据得到第一数据，包括：压缩设备识别源数据中符合设定的数据模式的第四数据，并从源数据包括的除第四数据外的其他数据中确定第一数据。其中，该设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种。示例性的，由于满足设定的数据模式的第四数据由硬件压缩算法进行压缩的效率较低，因此，压缩设备对源数据中满足一定的数据模式的数据进行提取后，再从源数据中除第四数据外的其他数据中确定待压缩的第一数据，避免了硬件压缩算法对第四数据进行压缩，降低了第四数据与硬件压缩算法不匹配导致压缩效率受到影响的问题，提高了压缩设备对源数据的压缩效率。

一种可选的实现方式中，本实施例提供的数据压缩方法还包括：压缩设备根据第四数据的数据模式，选择第二数据压缩模型，并根据第四数据对应的第二数据压缩模型对第四数据进行压缩。示例性的，若第四数据均为0或者均为1，则压缩设备可选择字典压缩算法对第四数据进行压缩，从而快速完成压缩设备对第四数据的压缩，避免第四数据由硬件压缩算法进行压缩占用硬件压缩算法的处理带宽，提高了硬件压缩算法对第一数据的压缩效率。

第二方面，提供了一种数据压缩装置，该数据压缩装置可应用于压缩设备，数据压缩装置包括：预处理单元和硬件压缩单元。预处理单元，用于预处理源数据得到第一数据，第一数据的类型适配硬件压缩算法；硬件压缩单元，用于根据硬件压缩算法对第一数据进行压缩。

一种可选的实现方式中，预处理单元，具体用于：根据硬件压缩算法的数据滑窗，从源数据中确定预处理数据；数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围，预处理数据在数据滑窗内存在冗余数据。预处理单元，还具体用于：从预处理数据中选择第一数据。

一种可选的实现方式中，预处理单元，还具体用于：根据硬件压缩算法的数据滑窗，从源数据中确定第二数据；第二数据在数据滑窗内不存在冗余数据。预处理单元，还具体用于：根据第二数据的数据类型，选择第一数据压缩模型；以及，根据第一数据压缩模型对第二数据进行压缩。

一种可选的实现方式中，源数据包括多个数据块；预处理单元，具体用于：从多个数据块中确定符合设定条件的第三数据块；设定条件为：利用硬件压缩算法压缩数据块的预测数据量大于或等于数据块的数据量。预处理单元，还具体用于：从多个数据块中除第三数据块外的其他数据块中确定第一数据。

一种可选的实现方式中，本实施例提供的数据压缩装置还包括：通信单元。例如，该通信单元用于：输出第三数据块。

一种可选的实现方式中，预处理单元，具体用于：对源数据进行空间变换，获取第一数据和变换信息；变换信息用于指示源数据和第一数据之间的数据映射关系。

一种可选的实现方式中，通信单元还用于：获取第一数据对应的第一压缩数据；以及，输出变换信息和第一压缩数据。

一种可选的实现方式中，预处理单元，具体用于：识别源数据中符合设定的数据模式的第四数据；设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种。预处理单元，还具体用于：从源数据包括的除第四数据外的其他数据中确定第一数据。

一种可选的实现方式中，预处理单元，还具体用于：根据第四数据的数据模式，选择第二数据压缩模型；以及，根据第二数据压缩模型对第四数据进行压缩。

一种可选的实现方式中，硬件压缩算法包括：Lz77压缩算法。

第三方面，提供了一种芯片，包括：处理器和供电电路。供电电路用于为处理器供电；处理器用于执行第一方面中任一种实现方式所述的方法的操作步骤。

第四方面，提供了一种接口卡，包括：第三方面所提供的芯片和接口；接口用于接收来自接口卡之外的其他装置的信号并发送至芯片；或用于将来自芯片的信号发送给接口卡之外的其他装置。例如，该接口卡是指智能网卡等。

第五方面，提供了一种压缩设备，包括：如第四方面提供的接口卡。

在一些情形中，该压缩设备包括至少一个处理器和存储器，存储器用于存储一组计算机指令；当处理器作为第一方面或第一方面任一种可能实现方式中的执行设备执行所述一组计算机指令时，执行第一方面或第一方面任一种可能实现方式中的数据迁移方法的操作步骤。

第六方面，提供了一种压缩系统，包括：第一处理器和第二处理器。其中，第二处理器中部署有硬件压缩算法。第一处理器，用于获取待压缩的源数据；以及预处理源数据，获取数据类型与硬件压缩算法相匹配的第一数据。第二处理器，用于根据硬件压缩算法对第一数据进行压缩。

应理解，该压缩系统可用于执行第一方面中任一种实现方式所述的方法的操作步骤。

第七方面，提供了一种计算机可读存储介质，存储介质中存储有计算机程序或指令，当计算机程序或指令被压缩设备执行时，执行第一方面中任一种实现方式所述的方法的操作步骤。

第八方面，提供了一种计算机程序产品，计算机程序产品在计算机上运行时，使得计算机执行第一方面中任一种实现方式所述的方法的操作步骤。示例性的，该计算机可以是指压缩设备、压缩加速卡、芯片等。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

图1为本申请提供的一种压缩系统的架构示意图；

图2为本申请提供的一种芯片的结构示意图；

图3为本申请提供的数据压缩方法的流程示意图一；

图4为本申请提供的数据压缩方法的流程示意图二；

图5为本申请提供的数据压缩方法的流程示意图三；

图6为本申请提供的数据压缩算法的流程示意图四；

图7为本申请提供的数据压缩装置的结构示意图。

具体实施方式

本申请提供了一种数据压缩方法，包括：首先，压缩设备获取待压缩的源数据。其次，压缩设备预处理源数据，获取数据类型与设定的硬件压缩算法相匹配的第一数据。最后，压缩设备根据硬件压缩算法对第一数据进行压缩。在源数据的数据类型与硬件压缩算法不匹配时，压缩设备在对源数据进行预处理获取第一数据后，才将数据类型和设定的硬件压缩算法相匹配的第一数据进行压缩，使得设定的硬件压缩算法可适配更多类型的数据，压缩设备对源数据的预处理操作提高了硬件压缩算法的适用性。而且，压缩算法或模型不是以软件单元的形式存在于处理器中，而以硬件压缩算法的形式卸载在压缩设备中，该第一数据由压缩设备基于硬件压缩算法来进行压缩，提高了压缩设备对源数据进行压缩的效率。

为了下述各实施例的描述清楚简洁，首先给出相关技术的简要介绍。

图1为本申请提供的一种压缩系统的架构示意图。压缩系统包括压缩设备110、加速装置115和客户设备120。压缩设备110是一个常见的计算机设备。用户可通过客户设备120向压缩设备110输入源数据，由压缩设备110对该源数据进行压缩，压缩设备110还将压缩源数据获取的目标数据输出至客户设备120。客户设备120是一种终端设备，包括但不限于个人电脑、服务器、手机、平板电脑或者智能车等。

压缩设备110包括输入输出(input/output，I/O)接口114、处理器111、存储器112。I/O接口114用于与位于压缩设备110外部的设备通信。例如，客户设备120通过I/O接口114向压缩设备110输入数据以及发送压缩任务，压缩设备110对输入的数据进行处理(如压缩或者解压缩)之后，再通过I/O接口114向客户设备120发送对该数据处理后的输出结果。

处理器111是压缩设备110的运算核心和控制核心，它可以包括：中央处理器(central processing unit，CPU)、特定的集成电路，其他通用处理器、数字信号处理器(digital signal processing，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。实际应用中，压缩设备110也可以包括多个处理器。处理器111中可以包括一个或多个处理器核(core)。在处理器111中安装有操作系统和其他软件程序，从而处理器111能够实现对存储器112及各种外围器件互联(Peripheral Component Interconnect express，PCIe)设备的访问。

处理器111通过双倍速率(double data rate，DDR)总线或者其他类型的总线和存储器112相连。存储器112是压缩设备110的主存(main memory)。存储器112通常用来存放操作系统中各种正在运行的软件、从客户设备120接收的输入数据以及将来发送给客户设备120的输出结果等。为了提高处理器111的访问速度，存储器112需要具备访问速度快的优点。在传统的计算机设备中，通常采用动态随机存取存储器(dynamic random access memory，DRAM)作为存储器112。除了DRAM之外，存储器112还可以是其他随机存取存储器，例如静态随机存取存储器(static random access memory，SRAM)等。另外，存储器112也可以是只读存储器(read only memory，ROM)。而对于只读存储器，举例来说，可以是可编程只读存储器(programmable read only memory，PROM)、可抹除可编程只读存储器(erasable programmable read only memory，EPROM)等。本实施例不对存储器112的数量和类型进行限定。

可选的，为了对数据进行持久化存储，压缩系统中还设置有数据存储系统113，数据存储系统113可位于压缩设备110的外部(如图1所示)，通过网络与压缩设备110交换数据。可选的，数据存储系统113也可以位于主机的内部，如数据存储系统113通过PCIe总线116与处理器111交换数据。此时，数据存储系统113表现为硬盘。

加速装置115用于执行压缩任务或者解压缩任务。处理器111将接收的AI任务以及输入数据发送给加速装置115，加速装置115根据输入数据完成所述AI任务之后将处理结果发送给处理器111。如图1所示，加速装置115可以直接插在压缩设备110的主板上的卡槽中，通过PCIe总线116与处理器111交换数据。需注意的是，图1中的PCIe总线116也可以替换成计算快速互联(compute express link，CXL)、通用串行总线(universal serial bus，USB)协议或其他协议的总线加速装置115进行数据传输。

另外，上述的加速装置115也可以不是直接插在压缩设备110的主板上的卡槽中，而是位于加速设备中的。如该加速设备是一个独立于压缩设备110的设备，如加速卡。此时，压缩设备110可以通过网线等有线网络与加速装置115进行连接，也可以通过无线热点或者蓝牙(bluetooth)等无线网络与加速装置115进行连接。如加速装置115用于处理压缩任务，例如对待压缩的源数据进行压缩等，加速装置可以由一个或多个芯片来实现。如该芯片包括CPU、图形处理器(graphics processing unit，GPU)、神经网络处理器(neural-network processing units，NPU)、张量处理单元(tensor processing unit，TPU)、FPGA、ASIC中的任意一种。其中，GPU又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。NPU在电路层模拟人类神经元和突触，并且用深度学习指令集直接处理大规模的神经元和突触，一条指令完成一组神经元的处理。ASIC适合于某一单一用途的集成电路产品。

上述的压缩任务可以是指对客户设备120获取的源数据进行压缩，解压缩任务可以是指将客户设备120发送的压缩数据进行解压。

示例性的，图1中的处理器111可通过芯片来实现，如图2所示，图2为本申请提供的一种芯片的结构示意图，示例的，该芯片200包括核心(core)201、CPU 202、系统缓冲区203和DDR 206。

其中，CPU 202用于接受AI任务(如压缩任务、解压缩任务、神经网络运算任务等)，并调用核心201执行该任务。在芯片200有多个核心201的情况下，CPU 202还用于承担调度的任务。例如，CPU 202可由ARM处理器实现，体积小、低功耗，采用32位精简指令集，寻址简单灵活。当然，在一些实施方式中，CPU 202也可以由其他处理器实现。

核心201用于提供压缩和解压缩任务中所需的运算能力。在一种可选的情形中，核心201包括加载/存储单元(load/store unit，LSU)、立方体(cube)计算单元、标量(scalar)计算单元、向量(vector)计算单元以及缓冲区(buffer)。其中，LSU用于加载待处理的数据以及存储处理后的数据，还可以用于核心中内部数据在不同缓冲区之间的读写管理，以及完成一些格式转换的操作。立方体计算单元用于提供矩阵乘的核心算力。标量计算单元是一种单指令流单数据流(single instruction single data，SISD)的处理器，该类型处理器在同一时间内只处理一条数据(通常为整数或浮点数)。向量计算单元又称数组处理器，是可以实现直接操作一组数组或向量进行计算的处理器。缓冲区的数量可能是一个或多个，如该缓冲区主要指一级缓存(level 1 buffer，L1 buffer)，缓冲区用来暂存核心201需要反复使用的一些数据从而减少从总线读写，另外，某些数据格式转换功能的实现，也要求源数据位于缓冲区中。在本实施例中，由于缓冲区位于核心，拉近了核心中的立方体计算单元和数据所在的存储区域之间的距离，减少立方体计算单元对DDR 206的访问，从而降低了数据的访问时延，以及核心的数据处理时延。

系统缓冲区203，主要指二级缓存(level 2 buffer，L1 buffer或L2 cache)，它用于临时存储经过所述芯片的输入数据、中间结果或者最终结果。

DDR 206是一个片外存储器，它也可以替换为或者高带宽存储器(high bandwidth memory，HBM)或者其他片外存储器。DDR 206位于芯片与外部存储器之间，克服了计算资源共享存储器读写时的访问速度限制。

芯片200所包含的输入/输出(Input/Output，I/O)设备205是指进行数据传输的硬件，也可以理解为与I/O接口对接的设备。常见的I/O设备有网卡、打印机、键盘、鼠标等。所有的外存也可以作为I/O设备，如硬盘、软盘、光盘等。

在一些应用场景中需要对数据进行编码或解码处理，因此芯片200还可能包括编/解码器204和I/O设备205，编/解码器204用于对于数据进行编码或者解码。应理解，在一些可选的情形中，编/解码器204也可以被设计为编/解码单元(软件模组)后集成在核心201中。

核心201、CPU 202、系统缓冲区203、编/解码器204、I/O设备205、DDR 206通过总线相连。总线可以包括一通路，用于在上述组件(如CPU 202、系统缓冲区203)之间传送信息。总线除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，总线可以是PCIe总线，或扩展工业标准结构(extended industry standard architecture，EISA)总线、统一总线(unified bus，Ubus或UB)、计算机快速链接(compute express link，CXL)、缓存一致互联协议(cache coherent interconnect for accelerators，CCIX)等。例如，核心201可以通过PCIe总线访问这些I/O设备205。核心201通过DDR总线和系统缓冲区203相连。这里，不同的系统缓冲区203可能采用不同的数据总线与核心201通信，因此，DDR总线也可以替换为其他类型的数据总线，本申请实施例不对总线类型进行限定。

举例来说，当CPU 202将AI任务所要处理的数据(如待压缩的源数据)加载到DDR 206中后，核心201中的LSU从DDR 206读取(load)该数据，并对该待压缩的源数据进行压缩后获取目标数据。当得出处理结果后，LSU再将该处理结果加载(store)到DDR 206中，由网络接口卡将推理结果发送给客户设备120，或者发送到数据存储系统113进行持久化存储。

值得注意的是，图1所示出的加速装置115也可以通过图2所示出的芯片200实现，本申请对此不予限定。

下面将结合附图对本实施例提供的数据压缩方法的具体实现方式进行详细描述。

如图3所示，图3为本申请提供的数据压缩方法的流程示意图一，该数据压缩方法可以应用于图1所示出的压缩系统，该数据压缩方法可由压缩设备300执行，该压缩设备300可以是图1所示出的压缩设备110或者加速装置115，或者图2所示出的芯片等。压缩设备300包括多个处理器，其中一个处理器中部署有硬件压缩算法(如图2中的核心201)，另一个处理器用于对待压缩的源数据进行预处理(如图2中的CPU 202)。应理解，部署有硬件压缩算法的处理器也可以称为压缩设备300的硬件压缩层(简称：硬件层)，用于预处理以及利用软件压缩算法对数据进行压缩的处理器也可以称为压缩设备300的软件压缩层(简称：软件层)。

示例性的，核心201中部署有硬件压缩算法，如以下任意一种或多种的组合：Lz77压缩算法，霍夫曼(Huffman)编码算法，循环冗余码校验(cyclic redundancy check，CRC)算法，有限状态熵编码(finite state entropy，FSE)算法，以及压缩状态维护。在一种可能的具体示例中，CRC算法可以是指CRC32算法，CRC32算法是指生成一个4字节(32位)的校验值，并以8位十六进制数，如FA 12 CD 45等来进行数据校验等。CRC算法的优点在于简便、速度快。也就是说，压缩设备可以包括支持实现无损压缩方式的一种或多种细粒度的压缩算法，使得一个处理器可以将多种细粒度的压缩算法进行组合，从而实现多种无损压缩方式，并对数据进行压缩。

请参照图3，本实施例提供的数据压缩方法包括以下步骤S310至S340。

S310，压缩设备获取待压缩的源数据。

如图1所示，该源数据可以是由压缩设备110从客户设备120中获取的待存储数据。

又如，该源数据是客户设备120采集的待存储数据，在该待存储数据将被存储至数据存储系统113的过程中，由压缩设备110对该待存储数据进行压缩，从而减少数据存储系统113中存储空间的占用量。

S320，压缩设备预处理该源数据，获取数据类型与设定的硬件压缩算法相匹配的第一数据。

在识别源数据的数据类型前，可以利用机器学习或人工神经网络(Artificial Neural Networks，ANNs)对大量的样本数据进行训练，得到数据类型识别模型。或者，数据类型识别模型也可以由芯片200对样本数据进行训练。该数据类型识别模型用于指示源数据与源数据的数据类型的映射关系。进而，CPU 202可以利用数据类型识别模型来识别源数据的数据类型。

数据类型识别模型包括但不限于：朴素贝叶斯(Bayes，NB)、极限梯度提升决策树(Extreme Gradient Boosting Tree，XGBoost)、多层感知机(Multilayer Perceptron，MLP)和上述这些模型的组合等模型。

样本数据可以来源于数据块或文件片段。样本数据包括但不限于：文本数据、图片数据、视频数据、基因数据、可执行程序、虚拟硬盘数据和数据库数据等。对应的，样本数据的数据类型包括但不限于：文本类型、图片类型、视频类型、基因类型、可执行程序类型、虚拟硬盘类型和数据库类型等。

可选的，压缩设备(或其他用于训练数据类型识别模型的处理设备，如加速装置115)可以从数据库中获取样本数据。或者，样本数据可以是开源数据或测试数据。

在一些实施例中，可以根据已知的数据类型为样本数据设置标识，将样本数据和样本数据的标识输入至人工神经网络进行训练，得到数据类型识别模型。例如，样本数据为文本数据，可以依据文件后缀名来为文本数据设置标识，将文本数据和文本的标识输入至人工神经网络进行训练，得到文本数据与文本类型的映射关系。

示例的，压缩设备将源数据输入至数据类型识别模型，可以识别出文本类型、图片类型、视频类型、基因类型、可执行程序类型、虚拟硬盘类型、数据库类型和其他类型。其他类型可以是指通用类型。

在本申请实施例中，数据类型识别模型可以是由其他设备预先训练得到，再将数据类型识别模型导入到压缩设备包括的处理器，以便处理器利用数据类型识别模型识别源数据的数据类型。

S330，压缩设备根据硬件压缩算法对第一数据进行压缩，获取第一压缩数据。

示例性的，若硬件压缩算法是Lz77压缩算法，在该Lz77压缩算法被卸载到压缩设备包括的硬件(如图2所示出的核心201)后，压缩设备提供软件层的预处理操作(如前述的S320)，对待压缩的源数据进行预处理获取到第一数据后，压缩设备利用硬件压缩算法对第一数据进行压缩，从而获得第一压缩数据。其中，该第一压缩数据可包括描述数据，该描述数据可以是指用于描述压缩第一数据后的元数据组(tuple)，该元数据组包括一个或多个元数据(metadata)，元数据可以是以数据指针、数据标识等形式存储在第一压缩数据包括的任意位置。

应理解，在源数据的数据类型与硬件压缩算法不匹配时，压缩设备在对源数据进行预处理获取第一数据后，才将数据类型和设定的硬件压缩算法相匹配的第一数据进行压缩，使得设定的硬件压缩算法可适配更多类型的数据，压缩设备对源数据的预处理操作提高了硬件压缩算法的适用性。而且，压缩算法或模型不是以软件单元的形式存在于处理器中，而以硬件压缩算法的形式卸载在压缩设备中，该第一数据由压缩设备基于硬件压缩算法来进行压缩，提高了压缩设备对源数据进行压缩的效率。

请继续参照图3，本实施例提供的数据压缩方法还包括以下步骤S340。

S340，压缩设备输出源数据对应的目标数据。

该目标数据包括S330对应的第一压缩数据，以及可能的其他数据。可选的，该其他数据可以是源数据中除第一数据外的剩余数据，也可以是将该剩余数据进行压缩后的其他压缩数据。

示例性的，假设源数据包括多个数据块(block)。在压缩设备获取数据类型与设定的硬件压缩算法相匹配的第一数据的过程中，压缩设备可从多个数据块中识别符合设定条件(如该设定条件为利用硬件压缩算法压缩数据块的预测数据量大于或等于数据块的数据量)的第三数据块(剩余数据)，并从源数据包括的多个数据块中除第三数据块外的其他数据中确定第一数据。其中，预测数据量是指压缩设备对第三数据块进行压缩后，该第三数据块所对应的压缩数据所占用的存储空间大小。

可以理解的，数据块的预测数据量大于或等于数据块未压缩的数据量(压缩前数据量)的数据压缩过程可以称为一个无效的压缩过程，因此，对于第三数据块而言，该第三数据块由硬件压缩算法进行压缩会占用硬件压缩算法的处理带宽(单位时间内压缩的数据量)，会降低硬件压缩算法的压缩效率，因此，压缩设备从源数据中除该第三数据外的其他数据中确定第一数据，并基于硬件压缩算法对第一数据进行压缩，避免了第三数据块的压缩过程占用硬件压缩算法的处理带宽，提高了压缩设备对源数据的压缩效率。

应理解，在本实施例中，压缩设备以数据块(block)为考察粒度对数据压缩前后的数据量进行比对，从而不将该第三数据块发送给硬件压缩算法进行处理，避免了该第三数据块占用硬件压缩算法的处理带宽，提高了源数据的压缩效率。但在一些可选的实现方式中，压缩设备也可以采用其他的数据粒度对源数据进行预测数据量和压缩前数据量的比对，从而将预测数据量大于或等于压缩前数据量的数据进行筛选，降低硬件压缩算法被无效压缩过程所占用的带宽，提高源数据的压缩效率，如数据段(segment)、数据页面(page)、一段持久化内存(persistent memory，PMem或PM)所存储的数据、或者一段支持追加写的持久化存储空间(persistent layer LOG，Plog)等，本申请对此不予限定。

当压缩设备在源数据中确定预测数据量大于或等于压缩前数据量的第三数据块后，结合S340所示出的内容，压缩设备可在第一压缩数据的输出过程中，将该第三数据块进行输出。由于该第三数据块的预测数据量大于或等于压缩前数据量，因此，压缩设备不对该第三数据块进行压缩，直接输出该第三数据块，避免了第三数据块的压缩过程占用硬件压缩算法的处理带宽或者占用数据压缩模型的处理带宽，提高了压缩设备对源数据进行压缩的速度，减少了数据压缩的时延。

为了对待压缩的源数据进行预处理，使得预处理后的第一数据适配压缩设备中卸载的硬件压缩算法，本申请提供以下几种可能的实现方式，下面在图3所示出的数据压缩方法的基础上，结合图4至图6对压缩设备预处理待压缩的源数据的过程进行说明。

在第一种可能的实现方式中，请参见图4，图4为本申请提供的数据压缩方法的流程示意图二，在本实施例提供的数据压缩方法中，前述的S320可包括以下步骤S320A至S320D。

S320A，压缩设备确定硬件压缩算法的数据滑窗。

该数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围。可选的，该数据范围也可称为压缩设备从当前数据向前查询当前数据所对应的冗余数据的数据宽度、数据段或者历史滑窗等等，本申请对此不予限定。

例如，该数据滑窗的大小为8千字节(kilo byte，KB)、32KB等。

S320B，压缩设备判断源数据包括的多个数据中在数据滑窗指示的数据范围内是否存在冗余数据。

冗余数据是指源数据中多次重复出现的数据。若数据滑窗指示的数据范围内存在冗余数据，则压缩设备执行S320C；若数据滑窗指示的数据范围内不存在冗余数据，则压缩设备执行下述的S331。

S320C，压缩设备根据硬件压缩算法的数据滑窗，识别源数据包括的预处理数据。

该预处理数据在数据滑窗指示的数据范围内存在冗余数据。例如，若源数据包括的数据1相邻两次出现的数据间隔为4KB，数据滑窗为32KB，则将该数据1作为预处理数据。

S320D，压缩设备从预处理数据中获取数据类型与设定的硬件压缩算法相匹配的第一数据。

结合图3所示出的数据压缩方法对图4所包括的S331至S333进行说明，如图4所示，在压缩设备识别到预处理数据后，针对于源数据中除预处理数据之外的其他数据，压缩设备还可执行以下步骤S331至S333。

S331，压缩设备根据数据滑窗识别源数据包括的第二数据。

该第二数据在数据滑窗指示的数据范围内不存在冗余数据。

S332，压缩设备根据第二数据的数据类型，选择第一数据压缩模型。

通常，针对不同的数据类型可以设计不同的数据压缩模型，因此，可以针对不同的数据类型预先对数据压缩模型分类。可以预先定义数据类型与数据压缩模型之间的对应关系。在一些实施例中，如图1所示，利用存储器112预先存储数据类型与数据压缩模型之间的对应关系。在处理器111确定数据类型后，可以先从存储器112中调取数据类型与数据压缩模型之间的对应关系，然后根据待压缩数据的数据类型从数据类型与数据压缩模型之间的对应关系中获取一个或多个数据压缩模型。数据类型与数据压缩模型之间的对应关系包含待压缩数据的数据类型与一个或多个数据压缩模型之间的对应关系。

关于所述数据压缩模型的来源。本实施例至少提供了一种可能的实施方式：从传统技术中所有的数据压缩模型中筛选出常用的数据压缩模型，或者，常用的数据压缩模型叠加生成的其他数据压缩模型作为所述数据压缩模型。所谓由常用的数据压缩模型叠加生成的其他数据压缩模型主要是指通过低阶数据压缩模型叠加生成高阶数据压缩模型。

这些常用的数据压缩模型包括但不限于：嵌套模型(nest model)、上下文模型(context model)、间接模型(indirect model)、文本模型(text model)、稀疏模型(sparse model)、可扩展标记语言模型(xml model)、匹配模型(match model)、距离模型(distance model)、可执行程序模型(exe model)、词模型(word model)、记录模型(record model)、图像模型(pic model)、部分匹配预测模型(prediction by partial matching model，PPMD model)、动态马尔可夫压缩模型(dynamic markov compression model，DMCM)、字节模型(byte model)、线性预测模型(linear predicition model)、自适应预测模型(adaptive predicition model)、声源模型(wav model)和通用模型(common model)。其中，嵌套模型是根据待预测字节中出现的嵌套符号(比如[])的信息预测后续字节的模型。上下文模型是根据待预测字节之前出现的连续字节上下文来预测后续字节的模型。间接模型是通过待预测字节前1-2个字节的比特的历史信息以及上下文来预测后续字节的模型。文本模型是通过词语、句子和段落等信息来预测后续字节的模型。通常，用于预测文本类数据。稀疏模型是通过查找待预测字节之前不连续的字节作为上下文预测后续字节的模型。比如，待预测字节之前的1个字节和3个字节预测后续字节的模型。可扩展标记语言模型是通过待预测字节包含的标签等特征信息预测后续字节的模型。匹配模型是通过查找待预测字节之前上下文中是否有匹配的信息，并根据匹配信息来预测后续字节的模型。距离模型是利用当前待预测字节和某些特殊字节预测后续字节的模型。比如，特殊字节为空格字符的距离。可执行程序模型是利用特定的指令集和操作码预测后续字节的模型。词模型就是根据出现的词语信息预测后续字节的上下文模型。记录模型是通过查找文件中的行列信息预测后续字节的上下文。在表格中一行称为一条记录，多用于数据库和表格中。图像模型是利用图片的特征预测后续字节的上下文模型。比如，利用图片的灰度或像素点预测后续字节的上下文模型。部分匹配预测模型是根据待预测字节之前连续出现的多个字节，在待预测字节中进行查找匹配，如果没有找到则减少多个字节中的部分字节，再根据减少后的自己查找匹配，直到找到或者记录为新的字节，以此来预测的模型。动态马尔可夫压缩模型是使用可变长度的比特级上下文历史表预测下一个比特的模型。字节模型是根据比特的历史信息预测后续比特的模型。线性预测模型是根据线性回归分析来预测后续字节的上下文模型。自适应模型是根据其他模型计算出的概率和已知的上下文，来调整计算出的概率的模型。声源模型是通过音频文件中的特征信息预测后续字节的上下文模型。通用模型是对新的数据类型的数据或者未识别的数据类型的数据进行概率预测的模型。该通用模型可以由多个其他模型叠加生成。由于数据压缩模型集合是经过筛选的数据压缩模型，其数量远小于原来使用的数据压缩模型的数量，因此占用的存储空间较低，可以将数据压缩模型集合存储在处理器111上，由处理器111完成压缩第二数据的操作。

在一些实施例中，数据类型与数据压缩模型之间的对应关系可以以表格的形式呈现。但需要说明的是，以表格的形式示意数据类型与数据压缩模型之间的对应关系只是在存储设备中的存储形式之一，并不是对数据类型与数据压缩模型之间的对应关系在存储设备中的存储形式的限定，当然，数据类型与数据压缩模型之间的对应关系在存储设备中的存储形式还可以以其他的形式存储，本申请实施例对此不做限定。

可选的，可以通过软件方式将数据压缩模型集合存储在处理器111上。例如，将所述数据压缩模型集合所包含的数据压缩模型存储在与处理器111内置或者相耦合的存储器中。可选的，也可以通过硬件方式在处理器111上实现存储所述数据压缩模型集合。例如，以设计处理器111的电路结构的形式将所述数据压缩模型集合烧制在处理器111上。

随着科学技术的发展，如果产生了新的数据类型，进而对上述数据压缩模型集合进行升级。例如，将新的数据类型对应的数据压缩模型存储在处理器111上。新的数据类型包括基因数据的数据类型和大数据的数据类型，也可以淘汰已有的数据压缩模型中使用频率较低的模型，还可以对已有的某一种或多种数据压缩模型进行修改。

在一些实施例中，可以利用现有的数据压缩模型组合生成新的数据压缩模型，通过软件升级方式对存储在处理器111上的数据压缩模型集合进行更新。例如，高阶数据压缩模型可以通过低阶数据压缩模型实现。从而，无需重新改变硬件电路，极大地降低了处理器111的升级成本。

示例的，假设待压缩的第二数据的数据类型为文本类型。处理器111根据文本类型确定文本类型对应的数据压缩模型包括文本模型(TextModel)、词模型(WordModel)和嵌套模型(NestModel)。

请继续参照图4，本实施例提供的数据压缩方法还包括以下步骤S333。

S333，压缩设备根据选择出的第一数据压缩模型对第二数据进行压缩，获取第二压缩数据。

进而，在压缩设备输出源数据对应的目标数据时，压缩设备将第一数据对应的第一压缩数据、第二数据对应的第二压缩数据合并到一起进行输出。

作为一种可能的具体示例，压缩设备中软件层使用Lz77_out_win对源数据进行预处理，并将数据滑窗(既定窗口)之外的第二数据(如该第二数据为已匹配结果tuples_0)发送到FSE模块进行熵编码；将数据滑窗之内的第一数据(如该第一数据为未匹配字串literals_0)输入到硬件层包括的硬件压缩算法(如Lz77_in_win)，压缩设备中硬件层的Lz77对输入数据在数据滑窗指示的数据范围内进行重复字串匹配查找，获得匹配结果tuples_1和非匹配字串literals_1，该匹配结果tuples_1和非匹配字串literals_1进入HUF模块进行霍夫曼编码，获得第一压缩数据，第一压缩数据所包括的描述数据是根据匹配结果tuples_1确定的。最后，压缩设备将熵编码第二数据获得的tuples_0、将第一压缩数据进行汇总获得目标数据，并输出该目标数据。

在通常技术中，比如在数据库(data base，DB)场景，数据冗余大多处于8KB的页面范围内，使用8KB数据滑窗的Lz77压缩算法，可以达到预期压缩效果。但是在采用了相似分组的虚拟服务器接口/虚拟桌面基础架构(Virtual service Interface/Virtual Desktop Infrastructure，VSI/VDI)数据场景中，冗余数据大都处于64KB数据分组中，同样的Lz77压缩算法需要至少32KB的数据滑窗才能达到较好压缩效果。

相比之下，本实施例提供的数据压缩方法，压缩设备将第二数据进行软件压缩，软件压缩所用的压缩算法可以是设定的多种数据压缩模型包含的一个或多个。因此，针对于待压缩的源数据而言，一部分数据(第一数据)可基于硬件压缩算法进行压缩，该部分数据的压缩效率较高。还有一部分数据(第二数据)可基于第二数据的数据类型选择的第一数据压缩模型进行压缩，避免了第二数据与硬件压缩算法不适配(数据滑窗内不存在冗余数据)导致的压缩效率较低的问题，进一步提升了压缩设备对源数据的压缩效率。

在第二种可能的实现方式中，请参见图5，图5为本申请提供的数据压缩方法的流程示意图三，在本实施例提供的数据压缩方法中，前述的预处理操作可包括空间变换(position transform)前述的S320可包括以下步骤S320E。

S320E，压缩设备对源数据进行空间变换，获取第一数据和变换信息。

其中，该变换信息用于指示源数据和第一数据之间的数据映射关系。

进而，在S340中，压缩设备将该第一数据对应的第一压缩数据、变换信息进行汇总后输出。

应理解，在一些情形中，源数据的数据类型与硬件压缩算法不一定匹配，但是压缩设备对该源数据进行位置变换或空间变换等数据映射操作后，映射后数据的数据类型与硬件压缩算法相匹配，且由硬件压缩算法对映射后数据(如第一数据)进行压缩的效率较高，提升了硬件压缩算法的适用性，解决了源数据的数据类型与硬件压缩算法不适配导致的压缩效率降低的问题。

例如，压缩设备中软件层将支持实现Snappy无损压缩方式的哈希(Hash)匹配算法的源数据进行空间变换，获得支持Lz77压缩算法的第一数据。

作为一种可能的具体实施例，压缩设备基于软件层的预处理操作，对源数据执行空间变换操作，将源数据中相似的数据块在空间上靠近，让硬件层的Lz77压缩算法可以在有限的数据滑窗内发现更多的数据冗余。其中空间变换的信息(trans_info)打包到最终压缩结果(目标数据)中。在压缩设备的硬件层，Lz77压缩算法对完成变换的第一数据在数据滑窗内进行冗余字串处理，其中匹配结果tuples_1和非匹配字串literals_1进入HUF模块进行霍夫曼编码，获得第一压缩数据。最后，压缩设备将第一压缩数据和前述的变换信息进行汇总后输出目标数据。

值得注意的是，压缩设备将压缩后的第一压缩数据和前述的变换信息进行输出，解压缩设备(或称：解压设备)依据变换信息对第一压缩数据进行解压，从而获取前述的源数据，避免了源数据的数据类型与硬件压缩算法不适配导致的压缩效率降低的问题，提高了硬件压缩算法对源数据的压缩效率。

在第三种可能的实现方式中，如图6所示，图6为本申请提供的数据压缩算法的流程示意图四，在本实施例提供的数据压缩方法中，前述的预处理操作可包括对符合设定的数据模式的数据或字串进行处理(包括但不限于剔除、数据重删等)，如前述的S320可包括S320F 和S320G。

S320F，压缩设备识别源数据中符合设定的数据模式的第四数据。

设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种。示例性的，字串之间的变化规律可以是按照升序、降序进行等间距分布，如1、2、3、4、5等，又如5、4、3、2、1等。

S320G，压缩设备从源数据包括的除第四数据外的其他数据中确定第一数据。

由于满足设定的数据模式的第四数据由硬件压缩算法进行压缩的效率较低，因此，压缩设备对源数据中满足一定的数据模式的数据进行提取后，再从源数据中除第四数据外的其他数据中确定待压缩的第一数据，避免了硬件压缩算法对第四数据进行压缩，降低了第四数据与硬件压缩算法不匹配导致压缩效率受到影响的问题，提高了压缩设备对源数据的压缩效率。

请继续参照图6，本实施例提供的数据压缩方法还包括以下步骤S334。

S334，压缩设备基于第四数据的数据模式，利用该第四数据的数据模式对应的第二数据压缩模型，对第四数据进行压缩，获取第三压缩数据。

示例性的，若第四数据均为0或者均为1，则压缩设备可选择字典压缩算法(如S334的第二数据压缩模型)对第四数据进行压缩，从而快速完成压缩设备对第四数据的压缩，避免第四数据由硬件压缩算法进行压缩占用硬件压缩算法的处理带宽，提高了硬件压缩算法对第一数据的压缩效率。

另外，若第四数据为全0字串或者全1字串，则压缩设备还可以将这些数据执行剔除(pattern_removal)操作，从而缩小源数据的数据规模，使得硬件层的Lz77压缩算法可以在有限的数据滑窗中发现更多的数据冗余。其中pattern_removal包括但不限于剔除全0字串、全1字串、或者符合预置pattern的字串等。进而，压缩设备中硬件层的Lz77压缩算法对完成变换的数据在数据滑窗指示的数据范围内进行冗余字串处理，匹配结果tuples_1和非匹配字串literals_1进入HUF模块进行霍夫曼编码。最后，压缩设备将第一数据对应的第一压缩数据和第四数据对应的第三压缩数据进行汇总后输出目标数据。

结合前述实施例对本申请提供的数据压缩方法的内容，本申请提供的数据压缩方法，压缩设备在在软件层实现对硬件层中硬件压缩算法(如Lz77压缩算法)的预处理操作，且软件层中的预处理支持灵活的算法配置，在源数据的数据类型与硬件压缩算法不匹配时，压缩设备在对源数据进行预处理获取第一数据后，才将数据类型和设定的硬件压缩算法相匹配的第一数据进行压缩，使得设定的硬件压缩算法可适配更多类型的数据，压缩设备对源数据的预处理操作提高了硬件压缩算法的适用性。而且，压缩算法或模型不是以软件单元的形式存在于处理器中，而以硬件压缩算法的形式卸载在压缩设备中，该第一数据由压缩设备基于硬件压缩算法来进行压缩，硬件层中的Lz77压缩算法卸载能显著提升压缩性能，提高了压缩设备对源数据进行压缩的效率。

可以理解的是，为了实现上述实施例中的功能，压缩设备包括了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本申请中所公开的实施例描述的各示例的单元及方法步骤，本申请能够以硬件或硬件和计算机软件相结合的形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用场景和设计约束条件。

上文中结合图1至图6，详细描述了根据本实施例所提供的数据压缩方法，下面将结合图7，描述根据本实施例所提供的数据压缩装置。

图7为本申请提供的数据压缩装置的结构示意图，该数据压缩装置700可以用于实现上述方法实施例中压缩设备的功能，因此也能实现上述方法实施例所具备的有益效果。在本实施例中，该数据压缩可以是如图1所示的压缩设备110，还可以是图2所示出的芯片200，或者应用于压缩设备或芯片的模块(如处理器)等。

如图7所示，数据压缩装置700包括：通信单元710、预处理单元720和硬件压缩单元730。数据压缩装置700用于实现上述图3至图6中所示的方法实施例中压缩设备的功能。

通信单元710，用于获取待压缩的源数据。

预处理单元720，用于预处理源数据，获取数据类型与设定的硬件压缩算法相匹配的第一数据。

硬件压缩单元730，用于根据硬件压缩算法对第一数据进行压缩。

一种可选的实现方式中，预处理单元720，具体用于：根据硬件压缩算法的数据滑窗，从源数据中确定预处理数据；数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围，预处理数据在数据滑窗内存在冗余数据。预处理单元720，还具体用于：从预处理数据中选择第一数据。

一种可选的实现方式中，预处理单元720，还具体用于：根据硬件压缩算法的数据滑窗，从源数据中确定第二数据；第二数据在数据滑窗内不存在冗余数据。预处理单元720，还具体用于：根据第二数据的数据类型，选择第一数据压缩模型；以及，根据第一数据压缩模型对第二数据进行压缩。

一种可选的实现方式中，源数据包括多个数据块；预处理单元720，具体用于：从多个数据块中确定符合设定条件的第三数据块；设定条件为：利用硬件压缩算法压缩数据块的预测数据量大于或等于该数据块的数据量。预处理单元720，还具体用于：从多个数据块中除第三数据块外的其他数据块中确定第一数据。

一种可选的实现方式中，通信单元710，还用于：输出第三数据块。

一种可选的实现方式中，预处理单元720，具体用于：对源数据进行空间变换，获取第一数据和变换信息。该变换信息用于指示源数据和第一数据之间的数据映射关系。

一种可选的实现方式中，通信单元710，还用于：获取第一数据对应的第一压缩数据。以及，输出变换信息和第一压缩数据。

一种可选的实现方式中，预处理单元720，具体用于：识别源数据中符合设定的数据模式的第四数据；该设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种。预处理单元720，还具体用于：从源数据包括的除第四数据外的其他数据中确定第一数据。

一种可选的实现方式中，预处理单元720，还具体用于：根据第四数据的数据模式，选择第二数据压缩模型。以及，根据第四数据对应的第二数据压缩模型对第四数据进行压缩。

一种可选的实现方式中，硬件压缩算法包括：Lz77压缩算法。

应理解的是，本申请实施例的数据压缩装置700可以通过芯片来实现，根据本申请实施例的数据压缩装置700可对应于执行本申请实施例中描述的方法，并且数据压缩装置700中的各个单元的上述和其它操作和/或功能分别为了实现图3至图6中的各个方法的相应流程，为了简洁，在此不再赘述。

数据压缩装置通过软件实现前述附图中任一所示的数据压缩方法时，数据压缩装置及其各个单元也可以为软件模块。通过处理器调用该软件模块实现上述的数据压缩方法。该处理器可以是CPU，ASIC实现，或可编程逻辑器件(programmable logic device，PLD)，上述PLD可以是复杂程序逻辑器件(complex programmable logical device，CPLD)、FPGA、通用阵列逻辑(generic array logic，GAL)或其任意组合等。

有关上述数据压缩装置更详细的描述可以参考前述附图所示的实施例中相关描述，这里不加赘述。可以理解的，前述附图所示出的数据压缩装置仅为本实施例提供的示例，根据数据访问过程或者业务的不同数据压缩装置可包括更多或更少的单元，本申请对此不予限定。

当数据压缩装置通过硬件实现时，该硬件可以通过处理器或芯片实现。芯片包括接口电路和控制电路。接口电路用于接收来自处理器之外的其它设备的数据并传输至控制电路，或将来自控制电路的数据发送给处理器之外的其它设备。

控制电路通过逻辑电路或执行代码指令用于实现上述实施例中任一种可能实现方式的方法。有益效果可以参见上述实施例中任一方面的描述，此处不再赘述。

或者，芯片包括处理器和供电电路，供电电路用于为处理器供电，处理器可用于实现前述实施例中的数据压缩方法。示例性的，该供电电路可以与处理器位于同一个芯片内，或位于处理器所在的芯片之外的另一个芯片内。该供电电路可以包括但不限于如下至少一个：供电子系统、电管管理芯片、功耗管理处理器或功耗管理控制电路等。

可以理解的是，本申请的实施例中的处理器可以是CPU、NPU或GPU，还可以是其它通用处理器、DSP、ASIC、FPGA或者其它可编程逻辑器件、晶体管逻辑器件，硬件部件或者其任意组合。通用处理器可以是微处理器，也可以是任何常规的处理器。

当数据压缩装置通过硬件实现时，该硬件还可以是接口卡，该接口卡可包括芯片和接口，接口用于接收来自接口卡之外的其他装置的信号并发送至芯片；或用于将来自芯片的信号发送给接口卡之外的其他装置。芯片可根据接口卡收发的信号执行前述实施例中数据压缩方法的操作步骤。例如，该接口卡可以是指智能网卡等。

本实施例中的方法步骤可以通过硬件的方式来实现，也可以由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于随机存取存储器(random access memory，RAM)、闪存、ROM、PROM、EPROM、EEPROM、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于计算设备中。当然，处理器和存储介质也可以作为分立组件存在于计算设备、存储设备中。

本申请还提供一种芯片系统，该芯片系统包括处理器，用于实现上述方法中压缩设备的功能。在一种可能的设计中，所述芯片系统还包括存储器，用于保存程序指令和/或数据。该芯片系统，可以由芯片构成，也可以包括芯片和其他分立器件。

示例性的，当本申请提供的数据压缩方法被集成在算力芯片硬件(如加速卡)上时，该硬件可以安装至存储系统，如该存储系统是分布式存储系统、集中式存储系统，以赋予存储系统以自适应对源数据进行数据压缩的能力。示例性的，分布式存储系统可包括：存储、计算一体的分布式存储系统，或者，存储、计算分离的分布式存储系统；集中式存储系统可包括：盘框一体的存储系统，或者，盘框分离的存储系统等。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时，全部或部分地执行本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、网络设备、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机程序或指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，例如，软盘、硬盘、磁带；也可以是光介质，例如，数字视频光盘(digital video disc，DVD)；还可以是半导体介质，例如，固态硬盘(solid state drive，SSD)。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种数据压缩方法，其特征在于，所述方法包括：

预处理源数据得到第一数据，所述第一数据的类型适配硬件压缩算法；

根据所述硬件压缩算法对所述第一数据进行压缩。
根据权利要求1所述的方法，其特征在于，所述预处理源数据得到第一数据，包括：

根据所述硬件压缩算法的数据滑窗，从所述源数据中确定预处理数据；所述数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围，所述预处理数据在所述数据滑窗内存在冗余数据；

从所述预处理数据中选择所述第一数据。
根据权利要求2所述的方法，其特征在于，所述预处理源数据得到第一数据，还包括：

根据所述硬件压缩算法的数据滑窗，从所述源数据中确定第二数据；所述第二数据在所述数据滑窗内不存在冗余数据；

根据所述第二数据的数据类型，选择第一数据压缩模型；

根据所述第一数据压缩模型对所述第二数据进行压缩。
根据权利要求1所述的方法，其特征在于，所述源数据包括多个数据块；

所述预处理源数据得到第一数据，包括：

从所述多个数据块中确定符合设定条件的第三数据块，所述设定条件为：利用所述硬件压缩算法压缩数据块的预测数据量大于或等于所述数据块的数据量；

从所述多个数据块中除所述第三数据块外的其他数据块中确定所述第一数据。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

输出所述第三数据块。
根据权利要求1所述的方法，其特征在于，所述预处理源数据得到第一数据，包括：

对所述源数据进行空间变换，获取所述第一数据和变换信息；所述变换信息用于指示所述源数据和所述第一数据之间的数据映射关系。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

获取所述第一数据对应的第一压缩数据；

输出所述变换信息和所述第一压缩数据。
根据权利要求1所述的方法，其特征在于，所述预处理源数据得到第一数据，包括：

识别所述源数据中符合设定的数据模式的第四数据；所述设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种；

从所述源数据包括的除所述第四数据外的其他数据中确定所述第一数据。
根据权利要求8所述的方法，其特征在于，所述方法还包括：

根据所述第四数据的数据模式，选择第二数据压缩模型；

根据所述第二数据压缩模型对所述第四数据进行压缩。
根据权利要求1至9中任一项所述的方法，其特征在于，所述硬件压缩算法包括伦佩尔-齐夫Lz77压缩算法。
一种数据压缩装置，其特征在于，所述装置应用于压缩设备，所述装置包括：

预处理单元，用于预处理源数据得到第一数据，所述第一数据的类型适配硬件压缩算法；

硬件压缩单元，用于根据所述硬件压缩算法对所述第一数据进行压缩。
根据权利要求11所述的装置，其特征在于，所述预处理单元，具体用于：根据所述硬件压缩算法的数据滑窗，从所述源数据中确定预处理数据；所述数据滑窗用于指示数据压缩过程中查询冗余数据的数据范围，所述预处理数据在所述数据滑窗内存在冗余数据；

所述预处理单元，还具体用于：从所述预处理数据中选择所述第一数据。
根据权利要求12所述的装置，其特征在于，所述预处理单元，还具体用于：根据所述硬件压缩算法的数据滑窗，从所述源数据中确定第二数据；所述第二数据在所述数据滑窗内不存在冗余数据；

所述预处理单元，还具体用于：根据所述第二数据的数据类型，选择第一数据压缩模型；以及，根据所述第一数据压缩模型对所述第二数据进行压缩。
根据权利要求11所述的装置，其特征在于，所述源数据包括多个数据块；

所述预处理单元，具体用于：从所述多个数据块中确定符合设定条件的第三数据块；所述设定条件为：利用所述硬件压缩算法压缩数据块的预测数据量大于或等于所述数据块的数据量；

所述预处理单元，还具体用于：从所述多个数据块中除所述第三数据块外的其他数据块中确定所述第一数据。
根据权利要求14所述的装置，其特征在于，所述装置还包括：通信单元，用于：输出所述第三数据块。
根据权利要求11所述的装置，其特征在于，所述预处理单元，具体用于：对所述源数据进行空间变换，获取所述第一数据和变换信息；所述变换信息用于指示所述源数据和所述第一数据之间的数据映射关系。
根据权利要求16所述的装置，其特征在于，所述装置还包括：通信单元，用于：获取所述第一数据对应的第一压缩数据；以及，输出所述变换信息和所述第一压缩数据。
根据权利要求11所述的装置，其特征在于，所述预处理单元，具体用于：识别所述源数据中符合设定的数据模式的第四数据；所述设定的数据模式包括：数据为全0字串，数据为全1字串，或者字串之间的变化规律符合设置的规律中至少一种；

所述预处理单元，还具体用于：从所述源数据包括的除所述第四数据外的其他数据中确定所述第一数据。
根据权利要求18所述的装置，其特征在于，所述预处理单元，还具体用于：根据所述第四数据的数据模式，选择第二数据压缩模型；以及，根据所述第二数据压缩模型对所述第四数据进行压缩。
根据权利要求11至19中任一项所述的装置，其特征在于，所述硬件压缩算法包括伦佩尔-齐夫Lz77压缩算法。
一种芯片，其特征在于，包括：处理器和供电电路；

所述供电电路用于为所述处理器供电；

所述处理器用于执行权利要求1至权利要求10中任一所述的方法。
一种接口卡，其特征在于，包括：权利要求21所述的芯片和接口；

所述接口用于接收来自所述接口卡之外的其他装置的信号并发送至所述芯片；或用于将来自所述芯片的信号发送给所述接口卡之外的其他装置。
一种压缩设备，其特征在于，包括：如权利要求22所述的接口卡。
一种压缩系统，其特征在于，包括：第一处理器和第二处理器；

所述第二处理器中部署有硬件压缩算法；

所述第一处理器，用于获取源数据得到第一数据，所述第一数据的类型适配所述硬件压缩算法；

所述第二处理器，用于根据所述硬件压缩算法对所述第一数据进行压缩。
一种计算机可读存储介质，所述存储介质中存储有计算机程序或指令，当所述计算机程序或指令被压缩设备执行时，实现权利要求1至10中任一项所述的方法。
一种计算机程序产品，所述计算机程序产品在计算机上运行时，使得所述计算机执行权利要求1至10中任一项所述的方法。