CN103248369A

CN103248369A - 基于fpga的压缩系统及其方法

Info

Publication number: CN103248369A
Application number: CN2013101970320A
Authority: CN
Inventors: 姬磊; 唐敏; 陶泽文; 刘文天
Original assignee: NANJING CHANGYANG TECHNOLOGY Co Ltd
Current assignee: NANJING CHANGYANG TECHNOLOGY Co Ltd
Priority date: 2013-05-21
Filing date: 2013-05-21
Publication date: 2013-08-14

Abstract

本发明公开了一种基于FPGA的压缩系统及其方法，其包括将外部数据进行压缩的FPGA模块、向FPGA模块提供外部数据的数据模块、接收经FPGA模块压缩后的数据的外部存储模块。其中FPGA模块将GZIP压缩算法嵌入到FPGA硬件中，用于对FPGA中的目标文件先进行LZ77算法，再进行哈夫曼编码，从而实现高效压缩目的。

Description

基于FPGA的压缩系统及其方法

技术领域

本发明涉及数据的压缩技术，尤其是一种基于FPGA的压缩系统及其方法。

背景技术

在嵌入式开发系统中，对数据进行压缩和解压缩是非常重要的手段之一，其可以大幅度的提高磁盘的有效容量，提高读写操作时输入输出的有效带宽，提高应用层程序的执行速度。当前，数据的压缩和解压缩一般采用GZIP算法，并通过软件的方式进行数据处理，然而GZIP算法里面有大量的串行的操作，使用软件算法进行处理的效率较低。而且GZIP解压缩的算法均采用软件来实现，它采用多级查表的方式完成哈夫曼解码，也就是说接触一个码可能需要查表多次，该方法的优点是内存的使用量较少，对应大部分查表只需要一次查表即可完成，效率较高，所以在软件里面广泛应用，但该算法的并行度较低，在大规模的数据处理中会占用大量的CPU资源，不合适硬件实现。因此在大规模的数据处理中，待压缩的数据流巨大；其使用CPU进行压缩解压缩时必然要占用大量的CPU资源，在进行数据解压时CPU资源占用的问题更为明显。

因此，如何提高压缩处理效率成为现有GZIP解压缩技术亟待解决的技术问题，尤其是能否针对现有GZIP解压算法提供相应的解决方案。

发明内容

本发明要解决的一个技术问题是提供一个压缩方法和硬件系统，来提高磁盘的有效容量，同时也有效的提高原有GZIP压缩算法的处理效率。

本发明的一个方面提供了一种基于FPGA的压缩系统，其包括：将外部数据进行压缩的FPGA模块、向FPGA模块提供外部数据的数据模块、接收经FPGA模块压缩后的数据的外部存储模块，其中FPGA模块包括与数据模块相连的输入接口单元、与接口单元相连的存储单元、压缩文件格式单元、对由存储单元而来的数据按照压缩文件格式单元的文件格式进行压缩的压缩算法单元、以及将压缩算法单元所压缩的数据输出至外部存储模块的输出接口单元。

优选地，所述存储单元为内存，而外部存储模块为硬盘。

优选地，所述文件格式具有头部、数据部、和用于校验的尾部，其中所述头部包括ID1、ID2、CM、FLG、MTIME、XFL、OS、以及额外的头字段，而所述数据部为DEFLATE数据格式。

优选地，所述压缩算法单元包括LZ77算法、哈夫曼编码。

优选地，所述ID1与ID2各占1字节，且为固定值，所述CM、FLG、XFL、OS均占1字节，而所述MTIME占4字节。

本发明的另一个方面提供了一种基于FPGA的压缩方法，其包括：由输入接口单元接收外部数据；存储所接收的外部数据；对所存储的外部数据按照文件格式进行压缩，其中压缩算法至少包括LZ77算法、哈夫曼编码；通过输出接口单元将压缩数据输出到外部存储模块。

优选地，所述文件格式具有头部、数据部、和用于校验的尾部三部分，其中所述头部包括ID1、ID2、CM、FLG、MTIME、XFL、OS、以及额外的头字段，而所述数据部为DEFLATE数据格式。

优选地，所述的LZ77算法的变种是指如果文件中有两块内容相同的话，那么只要知道前一块的位置和大小，就可以确定后一块的内容，所以可以用（两者之间的距离，相同内容的长度）这样一对信息，来替换后一块内容，而由于（两者之间的距离，相同内容的长度）这一对信息的大小，小于被替换内容的大小，所以文件得到了压缩。

优选地，所述的LZ77算法，使用"滑动窗口"的方法，来寻找文件中的相同部分，也就是匹配串，先对这里的串做一个说明，它是指一个任意字节的序列，而不仅仅是可以在文本文件中显示出来的那些字节的序列。这里的串强调的是它在文件中的位置，它的长度随着匹配的情况而变化。LZ77从文件的开始处开始，一个字节一个字节的向后进行处理。一个固定大小的窗口（在当前处理字节之前，并且紧挨着当前处理字节），随着处理的字节不断的向后滑动，就象在阳光下，飞机的影子滑过大地一样。对于文件中的每个字节，用当前处理字节开始的串，和窗口中的每个串进行匹配，寻找最长的匹配串。窗口中的每个串指，窗口中每个字节开始的串。如果当前处理字节开始的串在窗口中有匹配串，就用(之间的距离，匹配长度)这样一对信息，来替换当前串，然后从刚才处理完的串之后的下一个字节，继续处理。如果当前处理字节开始的串在窗口中没有匹配串，就不做改动的输出当前处理字节。处理文件中第一个字节的时候，窗口在当前处理字节之前，也就是还没有滑到文件上，这时窗口中没有任何内容，被处理的字节就会不做改动的输出。随着处理的不断向后，窗口越来越多的滑入文件，最后整个窗口滑入文件，然后整个窗口在文件上向后滑动，直到整个文件结束。

优选地，所述的哈夫曼编码是对于出现次数非常多的，则用较少的位来表示，对于出现次数非常少的，则用较多的位来表示，这样一来，文件的一些部分位数变少了，一些部分位数变多了，由于变小的部分比变大的部分多，所以整个文件的大小还是会减小，所以文件得到了压缩。

优选地，所述的压缩算法，是指先对数据进行LZ77算法，再进行哈夫曼编码，从而实现高效压缩目的。

本发明通过四路数据并行接入，利用硬件系统，解决GZIP算法里面有大量的串行的操作且使用软件算法进行处理的效率低的问题，提高压缩处理效率。

附图说明

下面结合附图及实施例对本发明作进一步描述：

图1是本发明的结构框图。

图2是本发明中文件格式的结构框图。

图3是本发明中GZIP压缩算法的流程图。

图4是本发明中LZ77压缩算法的流程图。

图5是本发明中DEFLATE算法的流程图。

具体实施方式

实施例：下面参照附图用本发明的示例，对本发明进行更详细的描述和说明。如图1所示，本发明提供一种基于FPGA的压缩系统的具体实施例，其包括：将外部数据进行压缩的FPGA模块1、向FPGA模块1提供外部数据的数据模块2、接收经FPGA模块1压缩后的数据的外部存储模块3，其中FPGA模块1包括与数据模块2相连的输入接口单元10、与接口单元10相连的存储单元12、压缩文件格式单元14、对由存储单元12而来的数据按照压缩文件格式单元14的文件格式进行压缩的压缩算法单元16、以及将压缩算法单元16所压缩的数据输出至外部存储模块3的输出接口单元18。本实施例中输入接口单元10为并行接口，存储单元12优选为内存，而外部存储模块3优选为硬盘。

其中，如图2所示，压缩文件格式单元14的文件格式为GZIP压缩文件格式，其为标准化压缩文件格式并用于打包压缩数据，所述文件格式具有头部、数据部、和用于校验的尾部三部分，其中头部用于设置压缩方法、压缩格式、系统等；数据部用于承载获得的数据；尾部用于对数据进行CRC32校验，以判断解压缩的正确性，其包括CRC32：4字节，保存原始数据的32位校验和。ISIZE：4字节，用来保存原始数据长度的低32位，同时头部包括ID1、ID2、CM、FLG、MTIME、XFL、OS、以及额外的头字段，而所述数据部为DEFLATE数据格式。

其中，如图3所示，GZIP压缩算法包括两个部分：LZ77算法和哈夫曼编码。

其中如图4所示，其为LZ77算法压缩流程，并做以下具体描述：

如图4中所述寻找匹配可以做以下表述：GZIP算法对遇到的每一个串，首先会把它插入到一个“字典”中。这样当以后有和它可以匹配的串，都可以直接从“字典”中查出这个串。在插入的时候，使用这个插入串的前三个字节，计算出插入的“字典”位置，然后把插入串的开始位置保存在这个“字典”位置中。查出的时候，使用查出串的前三个字节，计算出“字典”位置，由于插入和查出使用的是同一种计算方法，所以如果两个串的前三个字节相同的话，计算出的“字典”位置肯定是相同的，所以就可以直接在该“字典”位置中，取出以前插入时，保存进去的那个串的开始位置。于是查出串，就找到了一个串，而这个串的前三个字节和自己的一样，所以就找到了一个匹配串。但是会有多个串，他们的前三个字节都相同，那么他们在“字典”里的位置相同，他们将由一条链相连，放在对应的“字典”计算的位置的链上。所以，查到了一个相应在“字典”位置，也就查到了对应的一个链。所有和它前三个字节相同的串，都在这个链上。所以要找最长的匹配，就要遍历这个链上的每一个串，比较看和哪个串的匹配长度能获得最大值。

上述技术方案中涉及到的插入head[ins_h]表述为：当前字节用strstart标记。利用第strstart,strstart+1,strstart+2,这三个字节的值，使用一个哈希函数算出ins_h（在head[]表中的插入位置）。然后将当前字节的位置，即strstart，填到在head[ins_h]中。

如图4所述的是否可以匹配是指：当使用哈希函数算出ins_h，查到head[ins_h]中的值不为空的话，那么head[ins_h]中的值，便是之前保存在这里的一个串的位置，（这个串的前三个字节算出的ins_h，和当前串的前三个字节算出的ins_h相同）也就是说有可能有匹配。如果head[ins_h]的值为空的话，那么，肯定不存在匹配。

关于GZIP所使用的哈希函数的说明：当GZIP发现head[ins_h]不空后，也就是说有可能有匹配串的话，会对链上的每一个串进行真正的串的比较。所以一个链上的串，只是前三个字节用哈希函数算出的值相同，而并不一定前三个字节都是相同的。但是这样已经很大的缩小了需要进行串比较的范围。不同的三个字节有可能得到同一个结果的原因是，三个字节，一共24位，有2^24种可能值。而三个字节的哈希函数的计算结果为15位，有2^15种可能值。也就是说2^24种值，与2^15种值进行对应，必然是多对一的，也就是说，必然是有多种三个字节的值，用这个哈希函数计算出的值都是相同的。可以这样使用哈希函数的理由是，只是在一个窗口大小的范围内寻找匹配串，这样能出现的三个字节的值组合情况也是很有限的，将远远小于2^24，所以使用一个比较合适的哈希函数是非常高效的。

如图4所述的建立prev[]链：在每次处理当前串的时候，首先计算出插入的位置，然后，把当前的串的位置，保存到head[ins_h]中，如果head[ins_h]中（不空的话）为前一个串的开始位置。那么进行以下的操作：prev[strstart]=head[ins_h];head[ins_h]=strstart;一次次的进行不断的插入操作，prev[]链就形成了。

其中prev[]链的作用：head[ins_h]中的值，它本身就是一个前三个字节计算结果为ins_h的串的位置。同时，它是一个在prev[]数组中的索引，利用这个索引在prev[]中，可以找到前一个前三个字节计算结果为ins_h的串的位置。即prev[head[ins_h]]的值（当不为空时）是前一个前三个字节计算结果为ins_h的串的位置。可以不断向上直到prev[]为空，表示链结束。在prev[]链中ins_h的所有的串被链在了一起，head[ins_h]为链头，prev[]数组中放着的更早的串的位置。

prev[]链的特点：顺着prev[]链不断向前，则它与当前处理strstart位置之间的距离越来越远。

如图4所述lazy match，其算法的使用：在当前串寻找到了最长匹配之后，GZIP并不立即就决定使用这个串进行替换。而是看下一个字节开始的串是否也有匹配串，如果比现在这个匹配串有更长的匹配串的话，将不使用现在的这个匹配。如果比现在这个短的话，将确定使用现在的这个匹配。GZIP在满足lazy match的前提条件下，一次lazy match发现了更长的匹配串之后，仍会再进行lazy match，如果这次lazy match，发现了比上次更长的匹配串，那么上一次的懒匹配找到的匹配串就不用了。lazy match可以增加压缩的效果，同时，也会付出不小的时间代价。所以有必要对其使用加以限制。只有当当前匹配串的匹配长度，GZIP也就是当前匹配长度小于max_lazy_match（max_lazy_match在固定的压缩级别下，有固定的值）时，才会进行lazy match。

本发明的LZ77算法对大于64KB的文件，用关于滑动窗口实现：当前串（当前处理字标记strstart开始的串）只是在它之前的一个滑动窗口中寻找匹配串的，也就是说只是在它之前的一定大小的范围内寻找匹配串的。GZIP的这个滑动窗口的大小为WSIZE，32KB。在内存中将建一个window[]的缓冲区，大小为2个窗口的大小，64KB。需要被压缩的文件的内容将被读到这个window[]中，再在window[]缓冲区上进行LZ77算法的处理，得到结果将放在其他缓冲区中。GZIP对window[]中的内容，从开始处开始，一个字节一个字节的向后处理。当当前处理字节开始的串没有合适的匹配时，不做任何改动的输出当前处理字节，strstart向后移动一个字节。当当前处理字节开始的串找到了合适的匹配时，输出（匹配长度，相隔距离）对，strstart向后移动匹配长度个字节。从strstart到window[]结束的这部分内容，叫做lookahead buffer（超前查看缓冲区）。变量lookahead，保存着超前查看缓冲区所剩的字节数。lookahead，最开始被初始化为整个读入内容的大小，随着处理的进行，strstart不断后移，超前查看缓冲区不断减小，相应的lookahead的值也不断的减小。如果匹配串出了一个窗口的限制，则不与匹配。当当前串计算ins_h，发现head[ins_h]值不为空时（head[ins_h]为一个串的开始位置），说明当前串有可能有匹配串，把这个值保存在hash_head中。这时就要做一个限制范围的判断，strstart-hash_head<=窗口大小，strstart-hash_head是当前串和最近的匹配串之间的距离，如果是在一个窗口的范围之内的话，还需要在链上寻找最长的匹配串，在和每个串进行比较的时候，也需要判断当前串和该串的距离是否超过一个窗口的范围，超过的话，就不能进行匹配。实际中，GZIP为了使代码简单点，距离限制要比一个窗口的大小还要小一点。

本发明中的LZ77算法对于小于64KB的文件处理过程：初始化的时候整个文件都被读入到window[]中。在window[]上进行LZ77算法的处理，从开始直到文件结束。

本发明对于大于64KB的文件处理过程：压缩开始之前的初始化，会从文件中读入64KB的内容到window[]中，窗口大小为32KB，也就是读入2窗的内容到window[]中。压缩不断进行，直到lookahead＜MIN_LOOKAHEAD，也就是处理到了64KB内容的接近结束部分，也就是如果再处理，超前查看缓冲区中的内容就可能不够了。由于lookahead＜MIN_LOOKAHEAD，将执行fill_window()。fill_window()判断是否压缩已经进行到了2窗内容快用完了，该把新的内容放进来了。如果是的话，fill_window()把第二窗的内容，复制到第一窗中，这样第一窗中的内容就被覆盖掉了。然后更新匹配链的链头数组，head[]，更新prev[]数组，从头到尾过一遍，如果这个头中保存的串的位置，在窗口二中，就对这个串的位置做修正。如果这个头中保存的串的位置，在窗口一中，就不要了，否则就超过了32k的限制。，如果某项的内容，在窗口二中，就做修正。最后fill_window()从文件中再读出一窗内容，也就是读出32KB的内容，复制到第二个窗中，注意第二个窗口中原来的内容，已经被复制到了第一个窗口中。就这样，一窗窗的不断的处理，直到整个文件结束。

如图4中所述分块输出：LZ77压缩的结果放在l_buf[]，d_buf[]，flag_buf[]中。对于LZ77的压缩结果，可能使用一块输出或者分成多块输出（LZ77压缩一定的部分之后，就进行一次块输出，输出一块）。块的大小不是固定的。输出的时候，会对LZ77算法处理的压缩结果，进行Huffman编码，最终把Huffman编码的结果输出到outbuf[]缓冲区中。在flush_block()中进行Huffman编码，并输出的工作。在ct_tally()中进行判断，如果满足一些条件的话，当从ct_tally()中返回之后，就会对现有的LZ77的结果，进行Huffman编码，输出到一个块中。在整个文件处理结束，deflate()函数要结束的时候，会把LZ77的结果，进行Huffman编码，输出到一个块中。而当l_buf[]满了的时候，或者d_buf[]满了的时候，将肯定对现有的LZ77压缩的结果，进行Huffman编码，输出到一个块中。决定输出一块的话，建立Huffman树，会只针对这一块的内容。这一块内容将会被进行Huffman编码压缩，并被输出到outbuf[]中。如果是动态Huffman编码，树的信息也被输出到outbuf[]中。输出之后，会调用init_block()，初始化一个新块，重新初始化一些变量，包括动态树的结点被置0，也就是说，将为新块将来的Huffman树重新开始统计信息。每个块最开始的2位，用来指明本块使用的是哪种编码方式，00表示直接存储，01表示静态Huffman编码，10表示动态Huffman编码。接下来的1位，指明本块是否是最后一块，0表示不是，1表示是最后一块。

上述技术方案所述的Huffman编码与动态Huffman编码：静态Huffman编码就是使用GZIP自己预先定义好了一套编码进行压缩，解压缩的时候也使用这套编码，这样不需要传递用来生成树的信息。动态Huffman编码就是使用统计好的各个符号的出现次数，建立Huffman树，产生各个符号的Huffman编码，用这产生的Huffman编码进行压缩，这样需要传递生成树的信息。GZIP在为一块进行Huffman编码之前，会同时建立静态Huffman树，和动态Huffman树，计算使用静态Huffman树编码，生成的块的大小，以及计算使用动态Huffman树编码，生成块的大小。最后再进行比较，使用生成块较小的方法进行最终的Huffman编码。当文件比较小时，往往使用静态树能产生比较好的压缩效果，因为动态树需要传递生成树的那部分信息。

如图5所示，DEFLATE算法流程图的文字说明如下：

Strstart：当前串首字符的位置；

所说的“字典”，是用数组head[]表示的；

所说的“字典”位置，放在一个叫做ins_h的变量中，而该位置，用哈希函数根据串的前三个字节算出；

所说的链，是在一个叫做prev[]的数组中；

字符：文件具体内容；

串：多个字符组成串，在GZIP算法中；

对：（串长，与之前匹配串的距离）；

字典：存放串，供寻找匹配串用；

插入位置：串在字典中的位置；

读串：系统得到要压缩的文件，读入字符串到缓冲区。Gzip算法对遇到的每一个串，首先会把它插入到一个“字典”中。这样当以后有和它可以匹配的串，都可以直接从“字典”中查出这个串。用变量strstart指向串的首字符。

Strstart->NULL?：判断ststart指向是否为空；

哈希表查找插入位置insh：哈希表查找，效率较高

链表是否存在该串：链表，是由，不同串组成，但是，每个链上，串的前三个字节相同，这样可以提高查找效率。

找链表prev【】中最长匹配：所谓最长匹配，是指匹配长度最长。

MAX_LAZY_MATCH：在当前串寻找到了最长匹配之后，gzip并不立即就决定使用这个串进行替换。而是看下一个字节开始的串是否也有匹配串，如果比现在这个匹配串有更长的匹配串的话，将不使用现在的这个匹配。如果比现在这个短的话，将确定使用现在的这个匹配。

GZIP在满足lazy match的前提条件下，一次lazy match发现了更长的匹配串之后，仍会再进行lazy match，如果这次lazy match，发现了比上次更长的匹配串，那么上一次的懒匹配找到的匹配串就不用了。

lazy match可以增加压缩的效果，同时，也会付出不小的时间代价。所以有必要对其使用加以限制。只有当当前匹配串的匹配长度，gzi也就是当前匹配长度小于max_lazy_match（max_lazy_match在固定的压缩级别下，有固定的值）时，才会进行lazy match。

分配缓冲区window【】：在内存中将建一个window[]的缓冲区，大小为2个窗口的大小，64KB。需要被压缩的文件的内容将被读到这个window[]中，在window[]缓冲区上进行LZ77算法的处理，得到结果将放在其他缓冲区中。

当然上述实施例只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明主要技术方案的精神实质所做的等效变换或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于FPGA的压缩系统，其特征在于其包括：将外部数据进行压缩的FPGA模块（1）、向FPGA模块（1）提供外部数据的数据模块（2）、接收经FPGA模块（1）压缩后的数据的外部存储模块（3），其中FPGA模块（1）包括与数据模块（2）相连的输入接口单元（10）、与接口单元（10）相连的存储单元（12）、压缩文件格式单元（14）、对由存储单元（12）而来的数据按照压缩文件格式单元（14）的文件格式进行压缩的压缩算法单元（16）、以及将压缩算法单元（16）所压缩的数据输出至外部存储模块（3）的输出接口单元（18）。

2.根据权利要求1所述的压缩系统，其特征在于：所述存储单元（12）为内存，而外部存储模块（3）为硬盘。

3.根据权利要求1或2所述的压缩系统，其特征在于：所述文件格式具有头部、数据部、和用于校验的尾部，其中所述头部包括ID1、ID2、CM、FLG、MTIME、XFL、OS、以及额外的头字段，而所述数据部为DEFLATE数据格式。

4.根据权利要求3所述的压缩系统，其特征在于：所述压缩算法单元（16）包括LZ77算法、哈夫曼编码。

5.根据权利要求3所述的压缩系统，其特征在于：所述ID1与ID2各占1字节，且为固定值，所述CM、FLG、XFL、OS均占1字节，而所述MTIME占4字节。

6.一种基于FPGA的压缩方法，其特征在于其包括：

由输入接口单元（10）接收外部数据；

存储所接收的外部数据；

对所存储的外部数据按照文件格式进行压缩，其中压缩算法至少包括LZ77算法、哈夫曼编码；

通过输出接口单元（18）将压缩数据输出到外部存储模块（3）。

7.根据权利要求6所述的压缩方法，其特征在于：所述文件格式具有头部、数据部、和用于校验的尾部三部分，其中所述头部包括ID1、ID2、CM、FLG、MTIME、XFL、OS、以及额外的头字段，而所述数据部为DEFLATE数据格式。

8.根据权利要求7所述的压缩方法，其特征在于：所述ID1与ID2各占1字节，且为固定值，所述CM、FLG、XFL、OS均占1字节，而所述MTIME占4字节。