JPH05244015A - Data compression system - Google Patents

Data compression system

Info

Publication number
JPH05244015A
JPH05244015A JP2938692A JP2938692A JPH05244015A JP H05244015 A JPH05244015 A JP H05244015A JP 2938692 A JP2938692 A JP 2938692A JP 2938692 A JP2938692 A JP 2938692A JP H05244015 A JPH05244015 A JP H05244015A
Authority
JP
Japan
Prior art keywords
data
code
dictionary
compression
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2938692A
Other languages
Japanese (ja)
Inventor
Fumio Tanabe
文雄 田邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2938692A priority Critical patent/JPH05244015A/en
Publication of JPH05244015A publication Critical patent/JPH05244015A/en
Withdrawn legal-status Critical Current

Links

Abstract

PURPOSE:To utilize a communication medium efficiently in data transfer between a data generating system and a data processing system. CONSTITUTION:A data generating system 1 is provided with a dictionary retrieval compression code generating means 12 to obtain a compression code and a Huffman code generating means 13 applies Huffman code compression to compress the data. A data processing system 3 decodes the compressed data obtained through a communication medium 2 through inverse operation and the resulting decoded data is processed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明はデータの圧縮方式、特に
データ生成システムとデータ処理システムとの間の汎用
データの転送で、通信媒体の効率的な利用を実現するた
めのデータの圧縮方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data compression method, and more particularly to a data compression method for realizing efficient use of a communication medium in the transfer of general-purpose data between a data generation system and a data processing system. ..

【0002】[0002]

【従来の技術】従来のデータの辞書探索圧縮方式では、
データ列の参照位置の変位と参照する長さとをそのまま
圧縮コードとしている。
2. Description of the Related Art In the conventional dictionary search compression method for data,
The displacement of the reference position of the data string and the reference length are used as the compression code as they are.

【0003】[0003]

【発明が解決しようとする課題】上述した従来の辞書探
索圧縮方式では、参照位置変位および参照長が如何なる
値であっても、それぞれ最大参照位置変位、最大参照長
の表現に要するビット数を用いて表現されている。この
ため、参照位置変位や参照長が小さい場合は、それを表
現するのに必要なビット数は少ないはずであるが、最大
の参照位置変位や参照長の表現に必要なビット数で圧縮
コードを生成しているという問題点がある。
In the above-mentioned conventional dictionary search compression method, the number of bits required for expressing the maximum reference position displacement and the maximum reference length is used regardless of the values of the reference position displacement and the reference length, respectively. Is expressed. For this reason, if the reference position displacement or reference length is small, the number of bits required to represent it should be small, but the compression code must have the number of bits required to represent the maximum reference position displacement or reference length. There is a problem that it is generated.

【0004】[0004]

【課題を解決するための手段】本発明のデータの圧縮方
式は、データ生成システムが出力するデータを圧縮し、
通信媒体を介してデータ処理システムに転送し、データ
処理システムが通信媒体からのデータを復元する場合の
データの圧縮方式において、データ生成システムにおい
ては、データを生成するデータ生成手段と、既に入力済
みのデータ列を辞書として、辞書中に存在する入力デー
タ列に等しいデータ列の辞書中の位置を変位と長さとを
圧縮コードとして生成する辞書探索圧縮コード生成手段
と、この辞書探索圧縮コード生成手段で圧縮コードとし
て生成された変位と長さとを動的にハフマンコード化し
て更に圧縮したハフマンコード列を生成するハフマンコ
ード生成手段と、このハフマンコード生成手段で生成し
たデータを通信媒体に出力する圧縮コード出力手段とを
有し、データ処理システムにおいては、データ生成シス
テムから出力された圧縮データを通信媒体を介して入力
する圧縮コード入力手段と、この圧縮コード入力手段が
入力した圧縮データのハフマンコードから辞書探索圧縮
における辞書中の位置と長さとを復元するハフマンコー
ド伸長手段と、このハフマンコード伸長手段で復元され
た位置と長さとを基に辞書からデータ列を復元する辞書
探索圧縮コード伸長手段と、この辞書探索圧縮コード伸
長手段で復元されたデータを処理するデータ処理手段と
を有することにより構成される。
The data compression method of the present invention compresses data output from a data generation system,
In a data compression method in which data is transferred to a data processing system via a communication medium and the data processing system restores data from the communication medium, in the data generation system, data generation means for generating data and already input As a dictionary, a dictionary search compression code generation means for generating as a compression code a displacement and a length of a position in the dictionary of a data sequence that is equal to an input data sequence existing in the dictionary, and this dictionary search compression code generation means. Huffman code generating means for dynamically converting the displacement and length generated as compressed codes by Huffman code to generate a further compressed Huffman code sequence, and compression for outputting the data generated by the Huffman code generating means to a communication medium. In the data processing system, the code is output from the data generation system. Compressed code input means for inputting compressed data via a communication medium, and Huffman code decompression means for restoring the position and length in the dictionary in dictionary search compression from the Huffman code of the compressed data input by this compressed code input means, A dictionary search compression code decompression means for decompressing a data string from a dictionary based on the position and length decompressed by the Huffman code decompression means, and a data processing means for processing the data decompressed by the dictionary search compression code decompression means. It is constituted by having.

【0005】[0005]

【実施例】次に、本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.

【0006】図1は本発明の一実施例の構成図である。
図1の実施例はデータ生成システム1,通信媒体2,お
よびデータ処理システム3から構成され、データ生成シ
ステム1はデータ生成手段11,辞書探索圧縮コード生
成手段12,ハフマンコード生成手段13,および圧縮
コード出力手段14を有し、データ処理システム3は圧
縮コード入力手段31,ハフマンコード伸長手段32,
辞書探索圧縮コード伸長手段33,およびデータ処理手
段34を有している。
FIG. 1 is a block diagram of an embodiment of the present invention.
The embodiment of FIG. 1 comprises a data generation system 1, a communication medium 2, and a data processing system 3. The data generation system 1 includes a data generation means 11, a dictionary search compression code generation means 12, a Huffman code generation means 13, and compression. The data processing system 3 includes a code output unit 14, a compressed code input unit 31, a Huffman code decompression unit 32,
It has a dictionary search compression code expansion means 33 and a data processing means 34.

【0007】以上の構成において、データ生成システム
1では、データ生成手段11により、オクテット単位の
データを生成する。辞書探索圧縮コード生成手段12は
データ生成手段11から出力されるオクテットデータを
内部に有する数キロオクテットの辞書を用いてコード化
し、コードをハフマンコード生成手段13へ出力する。
コードは、辞書中の次に辞書に書込む位置から参照する
オクテットデータ列の位置までの変位と、参照オクテッ
トデータ列の長さとから構成される。参照するオクテッ
トデータ列がない場合は参照長を0とし、ハフマンコー
ド生成手段13には入力オクテットデータをそのまま出
力する。コードを出力後、圧縮の済んだ入力オクテット
データ列を辞書に書込み、書込み位置をその分ずらして
おく。書込み位置が辞書の終端にきたら、先頭に移すよ
うにして、辞書を環状に用いる。ハフマンコード生成手
段13は、辞書探索圧縮コード生成手段12から出力さ
れた参照位置変位と参照長とをそれぞれ数種類に分け、
それぞれの出現頻度を基にした一般的に使用されている
ハフマン木に従ってハフマンコードを生成し、圧縮コー
ド出力手段14に出力する。この際、ハフマンコードを
圧縮コード出力手段14に出力する前に、上記の種類分
けに対して、どの種類にどのハフマンコードが割当てら
れたかを示すハフマンコード情報を出力する必要があ
る。圧縮コード出力手段14は、ハフマンコード生成手
段13から出力されるビット列のコードをバイト単位に
通信媒体2に出力する。なお、通信媒体2は通常の記憶
媒体でもよい。
In the above configuration, in the data generation system 1, the data generation means 11 generates data in units of octets. The dictionary search compression code generation means 12 encodes the octet data output from the data generation means 11 using a dictionary of several kilo octets inside and outputs the code to the Huffman code generation means 13.
The code is composed of the displacement from the position to be written next in the dictionary to the position of the octet data string to be referenced, and the length of the reference octet data string. When there is no octet data string to refer to, the reference length is set to 0 and the input octet data is output to the Huffman code generation means 13 as it is. After outputting the code, the compressed input octet data string is written in the dictionary, and the write position is shifted by that amount. When the writing position reaches the end of the dictionary, it is moved to the beginning so that the dictionary is used in a ring. The Huffman code generation unit 13 divides the reference position displacement and the reference length output from the dictionary search compression code generation unit 12 into several types,
A Huffman code is generated according to a generally used Huffman tree based on the respective appearance frequencies, and output to the compressed code output means 14. At this time, before outputting the Huffman code to the compressed code output means 14, it is necessary to output Huffman code information indicating which Huffman code is assigned to which type for the above classification. The compressed code output means 14 outputs the code of the bit string output from the Huffman code generation means 13 to the communication medium 2 in byte units. The communication medium 2 may be an ordinary storage medium.

【0008】次に、データ処理システム3では、圧縮コ
ード入力手段31により、通信媒体2からバイト単位の
データを入力し、ビット単位にしてハフマンコード伸長
手段32に出力する。ハフマンコード伸長手段32は、
ハフマンコード生成手段13の付加したハフマンコード
情報を基に固定数個のハフマンコードを伸長し、復元し
た辞書探索圧縮の参照位置変位と参照長とを随時辞書探
索圧縮コード伸長手段33に出力する。辞書探索圧縮コ
ード伸長手段33は、この二つの情報からなるコードを
伸長し、内部に持つ辞書を基にデータを復元する。復元
したデータは辞書およびデータ処理手段34へ出力す
る。
Next, in the data processing system 3, the compressed code input means 31 inputs data in byte units from the communication medium 2 and outputs the data in bit units to the Huffman code decompression means 32. The Huffman code expansion means 32 is
A fixed number of Huffman codes are expanded on the basis of the Huffman code information added by the Huffman code generation unit 13, and the restored reference position displacement and reference length of the dictionary search compression are output to the dictionary search compression code expansion unit 33 as needed. The dictionary search compression code decompression means 33 decompresses the code consisting of these two pieces of information, and restores the data based on the internal dictionary. The restored data is output to the dictionary and data processing means 34.

【0009】図2はデータ生成システム1の処理の具体
例を示す図である。以下、図2を参照してデータ生成シ
ステム1の処理を説明する。なお辞書探索圧縮コード生
成手段12が内部に有する辞書のサイズを4096オク
テットとし、ハフマンコード生成手段13での参照長お
よび参照位置変位のクラス分けをそれぞれ表1および表
2のとおりとする。また3オクテットに満たないデータ
列は圧縮の対象としない。
FIG. 2 is a diagram showing a specific example of the processing of the data generation system 1. Hereinafter, the processing of the data generation system 1 will be described with reference to FIG. The size of the dictionary contained in the dictionary search compression code generation means 12 is 4096 octets, and the reference length and the reference position displacement in the Huffman code generation means 13 are classified into Table 1 and Table 2, respectively. In addition, a data string less than 3 octets is not subject to compression.

【0010】[0010]

【表1】 [Table 1]

【0011】[0011]

【表2】 [Table 2]

【0012】まずデータ生成手段11が図2に示すよう
な20オクテットのデータを生成したとする。辞書探索
圧縮コード生成手段12は、このデータを次々と入力す
るが、始めのオクテットデータ6個までは、辞書中に3
オクテットまたはそれを越えるサイズの参照すべきオク
テットデータ列がないため、それぞれ、参照長0および
そのオクテットデータをハフマンコード生成手段13に
出力する。この際、辞書の先頭6オクテットには、入力
オクテットデータが格納され次に書込む位置は、先頭か
ら7オクテット目となる。次から入力される3オクテッ
ト列は、辞書の先頭から3オクテットと同じ内容になる
ので、参照長3および参照位置変位6(=7−1)が出
力される。同様の辞書探索を続けてゆくと全体として図
2の辞書探索圧縮コードに示す内容がハフマンコード生
成手段13に出力される。従来の圧縮方式ではここまで
の処理で圧縮を終了としていた。参照長を4ビット、参
照位置変位を12ビットとして計算すると、この例では
計120ビットの出力となる。ハフマンコード生成手段
13では、これらの出力を表1および表2の内容に従っ
てクラス分けし、頻度を調べ、ハフマン木を生成するこ
とにより、図2の最終的な圧縮コードの上段にあるハフ
マンコードを生成する。そして、入力データとして得た
参照長および参照位置変位をそのハフマンコードと入換
え、通信媒体2に出力する。圧縮コードのサイズは計8
9ビットとなる。
First, it is assumed that the data generating means 11 has generated 20-octet data as shown in FIG. The dictionary search compression code generation means 12 inputs this data one after another, but up to the first 6 octet data is 3 in the dictionary.
Since there is no octet data string to be referenced having a size of octet or more, the reference length 0 and the octet data are output to the Huffman code generation means 13, respectively. At this time, input octet data is stored in the first 6 octets of the dictionary, and the position to be written next is the 7th octet from the first. The 3 octet string input next has the same content as the 3 octets from the beginning of the dictionary, so the reference length 3 and the reference position displacement 6 (= 7-1) are output. When similar dictionary searches are continued, the contents shown in the dictionary search compression code of FIG. 2 are output to the Huffman code generation means 13 as a whole. In the conventional compression method, the compression is completed by the processing up to this point. If the reference length is 4 bits and the reference position displacement is 12 bits, a total of 120 bits are output in this example. The Huffman code generation means 13 classifies these outputs according to the contents of Tables 1 and 2, checks the frequency, and generates a Huffman tree to generate the Huffman code in the upper stage of the final compression code in FIG. To generate. Then, the reference length and the reference position displacement obtained as the input data are replaced with the Huffman code and output to the communication medium 2. The total size of compressed code is 8
It is 9 bits.

【0013】[0013]

【発明の効果】以上説明したように本発明は、辞書探索
圧縮コードにハフマンコード圧縮を施すことにより、よ
り高効率のデータの圧縮を行なったデータ伝送ができる
という効果がある。
As described above, the present invention has the effect that the Huffman code compression is applied to the dictionary search compression code to enable more efficient data transmission.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成図である。FIG. 1 is a configuration diagram of an embodiment of the present invention.

【図2】図1のデータ生成システムの処理の具体例を示
す図である。
FIG. 2 is a diagram showing a specific example of processing of the data generation system of FIG.

【符号の説明】[Explanation of symbols]

1 データ生成システム 2 通信媒体 3 データ処理システム 11 データ生成手段 12 辞書探索圧縮コード生成手段 13 ハフマンコード生成手段 14 圧縮コード出力手段 31 圧縮コード入力手段 32 ハフマンコード伸長手段 33 辞書探索圧縮コード伸長手段 34 データ処理手段 DESCRIPTION OF SYMBOLS 1 data generation system 2 communication medium 3 data processing system 11 data generation means 12 dictionary search compression code generation means 13 Huffman code generation means 14 compression code output means 31 compression code input means 32 Huffman code expansion means 33 dictionary search compression code expansion means 34 Data processing means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 データ生成システムが出力するデータを
圧縮し、通信媒体を介してデータ処理システムに転送
し、データ処理システムが通信媒体からのデータを復元
する場合のデータの圧縮方式において、データ生成シス
テムにおいては、データを生成するデータ生成手段と、
既に入力済みのデータ列を辞書として、辞書中に存在す
る入力データ列に等しいデータ列の辞書中の位置を変位
と長さとを圧縮コードとして生成する辞書探索圧縮コー
ド生成手段と、この辞書探索圧縮コード生成手段で圧縮
コードとして生成された変位と長さとを動的にハフマン
コード化して更に圧縮したハフマンコード列を生成する
ハフマンコード生成手段と、このハフマンコード生成手
段で生成したデータを通信媒体に出力する圧縮コード出
力手段とを有し、データ処理システムにおいては、デー
タ生成システムから出力された圧縮データを通信媒体を
介して入力する圧縮コード入力手段と、この圧縮コード
入力手段が入力した圧縮データのハフマンコードから辞
書探索圧縮における辞書中の位置と長さとを復元するハ
フマンコード伸長手段と、このハフマンコード伸長手段
で復元された位置と長さとを基に辞書からデータ列を復
元する辞書探索圧縮コード伸長手段と、この辞書探索圧
縮コード伸長手段で復元されたデータを処理するデータ
処理手段とを有することを特徴とするデータの圧縮方
式。
1. A data compression method in which data output from a data generation system is compressed, transferred to a data processing system via a communication medium, and the data processing system restores data from the communication medium. In the system, data generating means for generating data,
A dictionary search compression code generation unit that generates a data string that has already been input as a dictionary, and a position of the data string that is equal to the input data string existing in the dictionary as a compression code of the displacement and length, and the dictionary search compression code. Huffman code generation means for dynamically converting the displacement and the length generated as a compressed code by the code generation means into a Huffman code sequence and further compressing the Huffman code sequence, and the data generated by this Huffman code generation means as a communication medium. In the data processing system, the compressed code output means for outputting the compressed code output means for inputting the compressed data output from the data generation system via the communication medium, and the compressed data input by the compressed code input means. Huffman code decompression that restores the position and length in the dictionary in dictionary search compression from the Huffman code Stage, a dictionary search compression code expansion means for recovering a data string from the dictionary based on the position and length restored by this Huffman code expansion means, and data for processing the data restored by this dictionary search compression code expansion means A data compression method comprising: a processing unit.
JP2938692A 1992-02-17 1992-02-17 Data compression system Withdrawn JPH05244015A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2938692A JPH05244015A (en) 1992-02-17 1992-02-17 Data compression system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2938692A JPH05244015A (en) 1992-02-17 1992-02-17 Data compression system

Publications (1)

Publication Number Publication Date
JPH05244015A true JPH05244015A (en) 1993-09-21

Family

ID=12274702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2938692A Withdrawn JPH05244015A (en) 1992-02-17 1992-02-17 Data compression system

Country Status (1)

Country Link
JP (1) JPH05244015A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015534770A (en) * 2012-09-26 2015-12-03 クアルコム,インコーポレイテッド Method and apparatus for memory-based packet compression encoding
JP2017073615A (en) * 2015-10-05 2017-04-13 富士通株式会社 Encoding program, encoding method, encoder, decoding program, decoding method and decoder

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015534770A (en) * 2012-09-26 2015-12-03 クアルコム,インコーポレイテッド Method and apparatus for memory-based packet compression encoding
JP2017073615A (en) * 2015-10-05 2017-04-13 富士通株式会社 Encoding program, encoding method, encoder, decoding program, decoding method and decoder

Similar Documents

Publication Publication Date Title
JP3009727B2 (en) Improved data compression device
US5870036A (en) Adaptive multiple dictionary data compression
JP3025301B2 (en) Data precompression device, data precompression system, and data compression ratio improving method
JP4905562B2 (en) Data compression apparatus and data restoration apparatus
US5673042A (en) Method of and an apparatus for compressing/decompressing data
JPH11168390A (en) Data compression device, data restoration device, data compression method, data restoration method, preparation device for dictionary for data compression/ restoration and computer readable medium recording data compression program or data restoration program
JP2006211621A (en) Data compression device and data decompression device
CA2131823A1 (en) Method for data compression having an improved encoding algorithm which utilizes a token stacking technique
JPS59231683A (en) Data compression system
US7447263B2 (en) Processing digital data prior to compression
Rathore et al. A brief study of data compression algorithms
JP2536422B2 (en) Data compression device and data decompression device
JPH05244015A (en) Data compression system
JP2940948B2 (en) Data compression method
US20080001790A1 (en) Method and system for enhancing data compression
KR20200121760A (en) Conditional transcoding for encoded data
Rani et al. A survey on lossless text data compression techniques
Anand et al. Compression And Decompression Of Files Without Loss Of Quality
Kaur et al. Lossless text data compression using modified Huffman Coding-A review
Reif et al. REAL-TIME DYNAMIC COMPRESSION OF VIDEO ON A GRID-CONNECTED PAR-ALLEL COMPUTER
Rincy et al. Preprocessed text compression method for Malayalam text files
US11967975B1 (en) Method and apparatus for recursive data compression using seed bits
Moronfolu et al. An enhanced LZW text compression algorithm
JPH0621827A (en) Data compressor and its method
Das et al. Design an Algorithm for Data Compression using Pentaoctagesimal SNS

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990518