JP3001519B1 - Data compression method and data compression method - Google Patents

Data compression method and data compression method

Info

Publication number
JP3001519B1
JP3001519B1 JP23552098A JP23552098A JP3001519B1 JP 3001519 B1 JP3001519 B1 JP 3001519B1 JP 23552098 A JP23552098 A JP 23552098A JP 23552098 A JP23552098 A JP 23552098A JP 3001519 B1 JP3001519 B1 JP 3001519B1
Authority
JP
Japan
Prior art keywords
dictionary
data
compressed
encoding
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23552098A
Other languages
Japanese (ja)
Other versions
JP2000068857A (en
Inventor
久幸 山中
Original Assignee
日本電気アイシーマイコンシステム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気アイシーマイコンシステム株式会社 filed Critical 日本電気アイシーマイコンシステム株式会社
Priority to JP23552098A priority Critical patent/JP3001519B1/en
Application granted granted Critical
Publication of JP3001519B1 publication Critical patent/JP3001519B1/en
Publication of JP2000068857A publication Critical patent/JP2000068857A/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【要約】 【課題】 LZW符号化方式によるデータ圧縮方式であ
って、従来の方法で行っていた全ての被圧縮データなら
びに全ての専用辞書による符号化処理を削減し、符号化
処理の高速化を図ることができるデータ圧縮方式を提供
する。 【解決手段】 LZW符号化方式によるデータ圧縮方式
において、学習用辞書(12−1)と1つまたはそれ以
上の専門辞書(12−2〜12−4)とを設けるととも
に、符号化される被圧縮データの一部分を前記辞書の全
てを用いて圧縮学習した後、その被圧縮データ内容から
最も近い分野の前記専用辞書を選択、固定し、この選
択、固定した専用辞書により残された被圧縮データの圧
縮を行う。
A data compression method based on the LZW encoding method, which reduces the encoding processing by all the data to be compressed and all the dedicated dictionaries performed by the conventional method, and speeds up the encoding processing. Provide a data compression scheme that can be achieved. SOLUTION: In a data compression system based on an LZW encoding system, a learning dictionary (12-1) and one or more specialized dictionaries (12-2 to 12-4) are provided, and a data dictionary to be encoded is provided. After performing compression learning on a part of the compressed data using all of the dictionaries, the dedicated dictionary in the field closest to the compressed data content is selected and fixed, and the compressed data left by the selected and fixed dedicated dictionary Compression.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ユニバーサル符号
化方式の1つであるLZW符号化によるデータ圧縮方法
およびデータ圧縮方式に関するものである。
BACKGROUND OF THE INVENTION The present invention relates to a data compression method according to the LZW coding is one of the universal coding scheme
And a data compression method.

【0002】[0002]

【従来の技術】ユニバーサル符号化方式の1つである増
分分解型のLZW符号化におけるデータ圧縮方法、特に
圧縮時における符号化方法において、従来方式の符号化
処理は、学習用辞書ならびに数種の専用辞書を設け、圧
縮対象となる全ての被圧縮データに対し全ての学習用辞
書ならびに専用辞書において符号化および辞書学習を行
っていた。そして、その内の最も圧縮率の高い値を示し
た専用辞書により符号化された圧縮データに、復号器で
該圧縮データがどの専用辞書で符号化されたかを判断で
きる辞書選択データを付与し復号器に送るなどして、符
号復号化処理の削減を図っていた(図21参照)。
Data compression method definitive in LZW coding incremental decomposition type which is one of the Related Art Universal coding method, in particular encoding method at the time of compression encoding process of the conventional method, the learning dictionary and several And the encoding and dictionary learning are performed in all learning dictionaries and dedicated dictionaries for all compressed data to be compressed. Then, to the compressed data encoded by the dedicated dictionary having the highest value of the compression ratio among them, dictionary selection data that allows the decoder to determine in which dedicated dictionary the compressed data was encoded is added and decoded. For example, the code decoding process is reduced by sending the data to a device (see FIG. 21).

【0003】しかしながら、従来の方法は、全ての被圧
縮データと全ての辞書を用いて符号化し、符号化動作を
完了した時点で使用した数種の辞書の圧縮率を求めると
いう方法のため、辞書選択までの時間に無駄があった。
However, conventional methods are encoded using all of the compressed data and all dictionary, for the method of determining the compression ratio of several dictionaries used upon completion of the coding operation, Dictionary There was a waste of time before the selection.

【0004】[0004]

【発明が解決しようとする課題】そこで、本発明は、L
ZW符号化によるデータ圧縮方法およびデータ圧縮方式
であって、従来の方法で行っていた全ての被圧縮データ
ならびに全ての専用辞書による符号化処理を削減し、符
号化処理の高速化を図ることができるデータ圧縮方法お
よびデータ圧縮方式を提供することを目的とする。
Therefore, the present invention relates to
A data compression method and data compression method according to the ZW coding to reduce coding processing by all of the compressed data as well as all special dictionary has been performed in a conventional manner, to increase the speed of the encoding process Data compression methods
And a data compression method.

【0005】本発明者は、前記目的を達成するために鋭
意検討を行った結果、ユニバーサル符号化方式の1つで
あるLZW符号化において、本来の学習用辞書と1つま
たはそれ以上の専門辞書を設け、符号化効率を高めると
ともに、ある一定量の被圧縮データを全ての辞書を用い
て圧縮学習することにより、符号化される被圧縮データ
の一部分から被圧縮データの傾向を掴み、その傾向に特
化した専門辞書を選択し、それによる符号化を行うこと
で、符号化処理時間の削減を図ることができることに想
到し、本発明をなすに至った。
[0005] The present inventor has conducted extensive studies to achieve the above object, Oite the LZW coding is one of the universal coding scheme, dictionary and one or more for the original training By providing a specialized dictionary and improving the encoding efficiency, by learning compression of a certain amount of compressed data using all dictionaries, grasping the tendency of compressed data from a part of the compressed data to be encoded, The present inventors have conceived that it is possible to reduce the encoding processing time by selecting a specialized dictionary specializing in such a tendency and performing encoding based on the selected dictionary, and have accomplished the present invention.

【0006】したがって、本発明は、LZW符号化に
るデータ圧縮方法において、学習用辞書と1つまたはそ
れ以上の専門辞書とを設けるとともに、符号化される被
圧縮データの一部分を前記辞書の全てを用いて圧縮学習
した後、その被圧縮データ内容から最も近い分野の前記
専用辞書を選択、固定し、この選択、固定した専用辞書
により残された被圧縮データの圧縮を行うことを特徴と
するデータ圧縮方法を提供する。
Accordingly, the present invention provides a data compression method based on LZW encoding , wherein a learning dictionary and one or more specialized dictionaries are provided, and a part of the compressed data to be encoded is provided. After performing compression learning using all of the dictionaries, the dedicated dictionary in the field closest to the compressed data content is selected and fixed, and the selected and fixed compressed dictionaries remaining are compressed. A data compression method is provided.

【0007】ユニバーサル符号化方式の1つである増分
分解型のLZW(ジフ・レンペルと称す。以降LZWと
呼ぶ)符号化におけるデータ圧縮方法の特に圧縮時にお
ける符号化方法において、従来方法の符号化処理は、前
述したように学習用辞書ならびに数種の専用辞書を設
け、圧縮対象となる全ての被圧縮データに対し全ての学
習用辞書ならびに専用辞書において符号化および辞書学
習を行った後、その内の最も圧縮率の高い値を示した専
用辞書により符号化された圧縮データに、復号器で該圧
縮データがどの専用辞書で符号化されたかを示す辞書選
択データを付与し復号器に送るなどして、符号復号化処
理の削減を図っていた。
[0007] which is one of the incremental decomposition type LZW universal coding scheme (referred to as Ziff Lempel. Hereinafter referred to as LZW) In particular encoding method at the time of compression of the data compression method definitive in coding, the sign of the conventional method As described above, the learning process is performed by providing a learning dictionary and several types of dedicated dictionaries, performing encoding and dictionary learning on all learning dictionaries and dedicated dictionaries for all compressed data to be compressed, The decoder assigns dictionary selection data indicating which dedicated dictionary the compressed data was encoded to to the compressed data encoded by the exclusive dictionary showing the highest compression rate, and sends it to the decoder. For example, the code decoding process is reduced.

【0008】本発明は、辞書形態は同様であるが、従来
が全ての被圧縮データと全ての辞書を用い符号化してい
たのに対し、ある一定量の被圧縮データを全ての辞書を
用いて圧縮学習した後、その被圧縮データ内容から最も
近い分野の専用辞書を選択、固定し、残された該被圧縮
データの圧縮を行うことにより、従来の方法で行ってい
た全ての被圧縮データならびに全ての専用辞書による符
号化処理を削減し、符号化処理の高速化を図ったもので
ある。
In the present invention, although the dictionary form is the same, the conventional method encodes all the data to be compressed and all the dictionaries. After the compression learning, the dedicated dictionary of the field closest to the compressed data content is selected and fixed, and by compressing the remaining compressed data, all the compressed data and the compressed data that have been performed by the conventional method are obtained. The encoding processing by all dedicated dictionaries is reduced, and the encoding processing is speeded up.

【0009】[0009]

【発明の実施の形態】本発明の構成を図1本発明のLZ
W符号器および図2本発明のLZW復号器を用いて説明
する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG.
A description will be given using a W encoder and the LZW decoder of the present invention in FIG.

【0010】本発明の第1の構成は、図4第1の実施例
の被圧縮データフレームの被圧縮データ42を蓄える文
字列入力バッファ10と、学習用辞書12−1、通信分
野に適した通信専用辞書12−2、音声分野に適した音
声専用辞書12−3および画像分野に適した画像専用辞
書12−4を備えた符号化辞書12と、前記各辞書に対
応した学習用辞書符号列出力バッファ14、通信専用辞
書符号列出力バッファ15、音声専用辞書符号列出力バ
ッファ16および画像専用辞書符号列出力バッファ17
と、辞書選択器13と、前記各辞書を使用してLZW法
により入力バッファ10からの被圧縮データ42の符号
化を行い、該符号化データを前記出力バッファへ出力す
る機能、および、前記各専用辞書において学習した登録
文字と該登録文字が被圧縮データにどれだけ出現したか
を示すデータを蓄積する前記学習用辞書と専用辞書とか
ら被圧縮データの符号化を行う際に最も適した辞書を選
択し、辞書選択器13へ選択信号18を出力する機能を
有するLZW符号化部11とからなるデータ圧縮方式で
ある。
The first configuration of the present invention is a character string input buffer 10 for storing the compressed data 42 of the compressed data frame of the first embodiment of FIG. 4, a learning dictionary 12-1, and suitable for the communication field. A coding dictionary 12 including a communication dictionary 12-2, a voice dictionary 12-3 suitable for the voice field, and an image dictionary 12-4 suitable for the image field, and a learning dictionary code string corresponding to each dictionary Output buffer 14, communication-dedicated dictionary code string output buffer 15, audio-only dictionary code string output buffer 16, and image-only dictionary code string output buffer 17
A function of encoding the compressed data 42 from the input buffer 10 by the LZW method using the dictionary selector 13 and the respective dictionaries, and outputting the encoded data to the output buffer; A dictionary most suitable for encoding compressed data from the learning dictionary and the dedicated dictionary, which stores registered characters learned in the dedicated dictionary and data indicating how much the registered characters appear in the compressed data. And a LZW encoding unit 11 having a function of outputting a selection signal 18 to the dictionary selector 13.

【0011】本発明の第2の構成は、前記第1の構成に
おいて、図6第2の実施例の被圧縮データフレームに示
すように、予めどの分野の被圧縮データかを示す辞書選
択フラグがつけられた該被圧縮データ43を符号化する
機能を有するLZW符号化部11を含むデータ圧縮方式
である。
A second aspect of the present invention, in the first configuration, as shown in the compressed data frame of FIG. 6 a second embodiment, the dictionary selection flag indicating whether the data to be compressed in advance which areas This is a data compression method including the LZW encoding unit 11 having a function of encoding the attached compressed data 43.

【0012】一般にユニバーサル符号化方式では、図7
に示す辞書構成により辞書作成が行われる。通常、LZ
W法の場合、辞書には基本となる英数字(基本登録文字
92)と若干の制御語が登録される。なお、本発明の請
求範囲は圧縮動作に限定されるため、LZW方式での例
外処理の説明についてはここでは割愛する。したがっ
て、制御語についての説明は行わない。
Generally, in the universal coding method, FIG.
A dictionary is created according to the dictionary configuration shown in FIG. Usually LZ
In the case of the W method, basic alphanumeric characters (basic registration characters 92) and some control words are registered in the dictionary. Since the scope of the present invention is limited to the compression operation, the description of the exception processing in the LZW method is omitted here. Therefore, description of the control word will not be given.

【0013】最初に、図1を用いて第1の実施例である
LZW符号器の動作を符号器の学習用辞書を用いて説明
する。LZW符号化部11は図15の符号化手順に従い
被圧縮データ42の符号化を行う。以下この手順に従っ
て動作を説明する。
First, the operation of the LZW encoder according to the first embodiment will be described with reference to FIG. 1 using a learning dictionary for the encoder. The LZW encoding unit 11 encodes the compressed data 42 according to the encoding procedure of FIG. The operation will be described below according to this procedure.

【0014】まず、LZW符号化部11は図7の学習用
辞書に示すような259(0〜258)個の基本登録文
字(a,b,c,d,…・0,1,2,…・・)92の
登録を行う(ステップ100)。
First, the LZW encoding unit 11 has 259 (0 to 258) basic registered characters (a, b, c, d,... 0, 1, 2,...) As shown in the learning dictionary of FIG. ..) 92 are registered (step 100).

【0015】ここで、LZW符号器の文字列入力バッフ
ァ10には被圧縮データ42として被圧縮データフレー
ム(abcabcabcaabbcc……)が保持され
ているものとする。次に、該フレームの最初の一文字a
を読み込み(ステップ101)、学習用辞書12−1に
登録されているどうか検索する(ステップ102)。こ
の場合、aは基本登録文字92として登録されているの
で検索が一致するため、次の文字bをポイントする(ス
テップ103)。次のポイントされた被圧縮文字bを読
み込み、学習用辞書12−1にabが登録されているか
どうかを検索する(ステップ101〜102)。検索文
字列abは登録されていないため、新規登録文字93と
して学習用辞書12−1に登録され、次の接点番号25
9が付与される(ステップ104)。
Here, it is assumed that the character string input buffer 10 of the LZW encoder holds compressed data frames (abcabcabcaabbcc...) As compressed data 42. Next, the first character a of the frame
Is read (step 101), and it is searched whether or not it is registered in the learning dictionary 12-1 (step 102). In this case, since a is registered as the basic registration character 92 and the search matches, the next character b is pointed (step 103). The next pointed compressed character b is read, and it is searched whether ab is registered in the learning dictionary 12-1 (steps 101 to 102). Since the search character string ab is not registered, it is registered in the learning dictionary 12-1 as a newly registered character 93, and the next contact number 25
9 is given (step 104).

【0016】次に、前回の検索で一致した文字aを図1
2のLZW復号器の通信専用辞書に示す符号語(000
000000)に変換し、学習用辞書符号列出力バッフ
ァ14へ出力する(ステップ105)。次に、被圧縮文
字列が終わりでないので(ステップ106)、被圧縮文
字列の読み込み(ステップ101)に戻り、前回読み込
んだ文字bの文字検索を行う。この場合、文字bは基本
登録文字92として登録されているので何も出力せず、
次の文字cをポイントしbcが学習用辞書12―1に登
録されているか検索を行う。文字bcは登録されていな
いので、新規登録文字93として登録され、次の接点番
号260が付与される。この場合も文字bの符号語(0
00000001)が符号列出力バッファ14に出力さ
れる。
Next, the character a matched in the previous search is shown in FIG.
2 codeword (000) shown in the communication dictionary of the LZW decoder 2
000000) and outputs it to the learning dictionary code string output buffer 14 (step 105). Next, since the compressed character string is not at the end (step 106), the process returns to the reading of the compressed character string (step 101), and the character search of the character b previously read is performed. In this case, since the character b is registered as the basic registered character 92, nothing is output,
A search is performed by pointing to the next character c to determine whether bc is registered in the learning dictionary 12-1. Since the character bc is not registered, it is registered as a newly registered character 93, and the next contact number 260 is assigned. Also in this case, the code word (0
00000001) is output to the code string output buffer 14.

【0017】以下同様に続く被圧縮文字列の増分分解型
の符号化が行われ、図7に示すような学習用辞書の作成
が行われるとともに、符号語列(000000000、
000000001,000000010、10000
0011、…・・)が該符号列出力バッファより対向す
る復号器へ出力される(ステップ101〜106)。ま
た、上記符号化動作は通信専用辞書12−2、音声専用
辞書12−3(図10)および画像専用辞書12−4
(図11)についても辞書選択がなされるまで同様に行
われる。
In the same manner as described above, encoding of the subsequent compressed character string is performed in an incrementally decomposing type, a learning dictionary as shown in FIG. 7 is created, and a code word string (000000000,
000000001000000000010, 10000
0011,...) Are output from the code string output buffer to the opposite decoder (steps 101 to 106). The encoding operation is performed by the communication dictionary 12-2, the audio dictionary 12-3 (FIG. 10), and the image dictionary 12-4.
The same applies to FIG. 11 until a dictionary is selected.

【0018】次に、図2本発明のLZW復号器により、
復号化について符号化と同様に復号器の学習用辞書22
−1を用いて説明する。LZW復号化部21は図16の
復号化手順に従い圧縮データの復号化を行う。以下この
手順に従って動作を説明する。
Next, FIG. 2 shows the LZW decoder of the present invention.
For decoding, the learning dictionary 22 of the decoder is used in the same manner as the encoding.
Explanation is made using -1. The LZW decoding unit 21 decodes the compressed data according to the decoding procedure in FIG. The operation will be described below according to this procedure.

【0019】最初に、LZW復号化部21は符号化と同
様に図12の通信専用辞書に示すような259(0〜2
58)個の基本登録文字(a,b,c,d,…・0,
1,2,…・・)83の登録を行う(ステップ20
0)。この場合、符号化辞書と異なるところは、これか
ら復号しようとする符号語80に対応した接点番号列8
1と該接点番号に対応した文字および文字列82が割り
当てられていることである。
First, the LZW decoding unit 21 259 (0 to 2) as shown in the communication-dedicated dictionary in FIG.
58) basic registration characters (a, b, c, d,... 0,
, 83) are registered (step 20).
0). In this case, the difference from the coding dictionary is that the contact number sequence 8 corresponding to the code word 80 to be decoded is
1 and a character and a character string 82 corresponding to the contact number.

【0020】ここで、上記符号化の動作説明で符号化さ
れ出力された符号列(000000000、00000
0001,000000010、100000011、
…・・)が符号列入力バッファ20に蓄えられているも
のとする。
Here, the code string (000000000, 00000) encoded and output in the explanation of the encoding operation is output.
0001,00000000010, 100000011,
...) Are stored in the code string input buffer 20.

【0021】まず、符号列入力バッファ20から符号語
(000000000)を読み込む(ステップ20
1)。読み込まれた符号語(000000000)を接
点番号(0)に変換し(ステップ202)、学習用辞書
22−1(図8)に登録されているか検索を行う(ステ
ップ203)。この場合、接点番号(0)は登録されて
いるので一致した接点番号(0)に対応した文字aを音
声用辞書文字列出力バッファ24へ出力する(ステップ
204)。
First, a code word (000000000) is read from the code string input buffer 20 (step 20).
1). The read codeword (000000000) is converted into a contact number (0) (step 202), and a search is performed to determine whether the codeword is registered in the learning dictionary 22-1 (FIG. 8) (step 203). In this case, since the contact number (0) is registered, the character a corresponding to the coincident contact number (0) is output to the voice dictionary character string output buffer 24 (step 204).

【0022】続いて、文字aが新規文字であるかどうか
検索する(ステップ205)。文字aは基本登録文字9
8であるので新規文字登録をスキップし、次の符号語を
ポイントする(206、207)。ポイントされた次の
符号語(000000001)を読み込み、前回と同様
に辞書検索を行う。符号語(000000001)は接
点番号(1)に対応しており、基本登録文字bと一致す
るので、学習用辞書文字列出力バッファ24へ文字bを
出力する(ステップ201〜204)。ここでLZW復
号化部21は、これまでの復号文字列abはこの場合辞
書に登録されていないので、文字列abに符号語(10
0000011)、接点番号(259)を付与し、新規
文字列99として辞書に登録する(ステップ205、2
06)。
Subsequently, it is searched whether the character a is a new character (step 205). Character a is the basic registered character 9
Since it is 8, registration of a new character is skipped and the next code word is pointed (206, 207). The next code word (000000001) pointed to is read, and a dictionary search is performed in the same manner as the previous time. Since the code word (00000000001) corresponds to the contact number (1) and matches the basic registered character b, the character b is output to the learning dictionary character string output buffer 24 (steps 201 to 204). Here, the LZW decoding unit 21 adds the code word (10) to the character string ab since the decoded character string ab so far is not registered in the dictionary in this case.
0000011), a contact number (259) is assigned, and registered in the dictionary as a new character string 99 (steps 205 and 2).
06).

【0023】次にポイントされた符号語(000000
010)は接点番号(2)で文字cに、続く符号語(1
00000011)は接点番号(259)のabに対応
しているので、学習用辞書文字列出力バッファ24へそ
れぞれ出力する。ここで、文字cと次に続く文字列ab
のaからなる文字列caは辞書に登録されていないの
で、符号語(100000100)、接点番号260が
付与され、新規文字列99として辞書に登録される(ス
テップ201〜207)。この様にして符号語の復号
(abcabcabcaabbcc…・・)と復号化学
習用辞書22−1の作成が圧縮ファイルの終わりまで行
われる。
The next pointed code word (000000)
010) is the contact number (2), followed by the character c, followed by the code word (1)
000000011) corresponds to the ab of the contact number (259), and is output to the learning dictionary character string output buffer 24, respectively. Here, the character c and the following character string ab
Is not registered in the dictionary, the code word (10000000) and the contact number 260 are assigned, and the character string ca is registered as a new character string 99 in the dictionary (steps 201 to 207). In this manner, the decoding of the codeword (abcabcabcaabbcc...) And the creation of the decoding learning dictionary 22-1 are performed until the end of the compressed file.

【0024】また、上記復号化動作は符号化の動作説明
と同様にLZW復号器の通信専用辞書22−2、音声専
用辞書22―3および画像専用辞書22―4についても
辞書選択がなされるまで同様に行われる。なお、符号語
が復号辞書に登録されていない場合は例外処理(ステッ
プ203、209)が行われるが本特許請求範囲ではな
いのでここでは説明を割愛する。以上のようにしてLZ
W法による文字列の符号化と復号化が行われる。
The decoding operation is performed until the dictionary is selected for the communication dictionary 22-2, the audio dictionary 22-3, and the image dictionary 22-4 of the LZW decoder in the same manner as the description of the encoding operation. The same is done. If the code word is not registered in the decoding dictionary, an exception process (steps 203 and 209) is performed, but the description is omitted here because it is not within the scope of the present invention. As described above, LZ
Encoding and decoding of a character string by the W method are performed.

【0025】次に、専用辞書を使った場合の本発明の符
号化および復号化動作を説明する。まず、符号化動作を
図17専用辞書による符号化手順のフローチャートに従
って通信専用辞書を用いて説明する。図9は通信分野の
用語が予め通信専用辞書12―2に登録されている内容
を示しており、接点番号50、登録文字列51、出現カ
ウンタ52で構成されている。
Next, the encoding and decoding operations of the present invention when a dedicated dictionary is used will be described. First, the encoding operation will be described using the communication-dedicated dictionary according to the flowchart of the encoding procedure using the dedicated dictionary in FIG. FIG. 9 shows contents in which terms in the communication field are registered in the communication dictionary 12-2 in advance, and includes a contact number 50, a registered character string 51, and an appearance counter 52.

【0026】まず、LZW符号化部11は、符号化処理
に先立ち辞書検索カウンタ、出現カウンタ、文字ポイン
タの初期化(ここでは0クリア)を行う(ステップ30
1)。次に、基本登録文字53および各分野に対応した
専用登録文字54の登録を行う(ステップ302)。こ
こで、LZW符号器11の文字列入力バッファ10には
図3に示した一連の被圧縮データが第1ブロック〜第N
+2ブロックに区切られ蓄積されている。該ブロックご
との被圧縮データサイズは任意であるが、ここでは10
Kバイト分とする。また、第1ブロックには、前記学習
用辞書12―1による符号化の説明と同様に、被圧縮デ
ータとして図4に示す被圧縮データフレーム(abca
bcabcaabbcc……)42が保持されているも
のとする。
First, the LZW encoding unit 11 initializes (here, clears to 0) a dictionary search counter, an appearance counter, and a character pointer prior to the encoding process (step 30).
1). Next, the basic registration character 53 and the special registration character 54 corresponding to each field are registered (step 302). Here, the series of compressed data shown in FIG. 3 is stored in the character string input buffer 10 of the LZW encoder 11 from the first block to the Nth block.
+2 blocks are stored. The size of the data to be compressed for each block is arbitrary.
It is assumed to be K bytes. In the first block, the compressed data frame (abca) shown in FIG. 4 is stored as the compressed data in the same manner as in the description of the encoding using the learning dictionary 12-1.
bcabcaabbcc...) 42 are held.

【0027】続いて、どの専用辞書を用いて符号化を行
うかを決定する専用辞書選択値を求める符号化範囲を決
定する辞書検索カウント値(ここでは1Kバイト分・T
0)を調べる(ステップ303)が、初期化後であるの
で該被圧縮データフレーム42から最初の文字aの読み
込みに入る(ステップ304)。次に、文字aが通信専
用辞書12―2に登録されているかどうか検索する(ス
テップ305)。文字aは基本登録文字53として登録
されているので出現カウンタをカウントアップ(+1)
し(ステップ306)、次の文字をポイントする(ステ
ップ307)。ポイントされた次の文字bを読み込む。
文字列abが通信専用辞書22―2に登録されているか
どうか検索する。通信専用辞書では文字列abは通信分
野の専用文字列として登録されているため、文字列ab
の出現カウンタをカウントアップし、次の文字をポイン
トする(ステップ304〜307)。次にポイントされ
た文字cを読み込む。文字列abcが通信専用辞書12
―2に登録されているかどうか検索する。文字abcは
登録されているので文字列abcの出現カウンタをカウ
ントアップし、さらに次の文字をポイントする(ステッ
プ304〜307)。ポイントされた文字cを読み込み
文字列abcaが通信専用辞書12−2に登録されてい
るかどうか検索する。この場合、文字列abcaは辞書
に登録されていないので、接点番号(266)が付与さ
れ通信専用辞書12−2に登録される(ステップ304
〜308)。次に、1つ前の一致した文字列abcの符
号語を通信専用符号列出力バッファ15へ出力する(ス
テップ309)。
Subsequently, a dictionary search count value for determining a coding range for obtaining a dedicated dictionary selection value for determining which dedicated dictionary is to be used for encoding (here, 1 Kbyte · T
0) is checked (step 303), but since the initialization has been completed, the first character a is read from the compressed data frame 42 (step 304). Next, it is searched whether the character a is registered in the communication dictionary 12-2 (step 305). Since the character a is registered as the basic registered character 53, the appearance counter is counted up (+1).
(Step 306), and point to the next character (step 307). Read the next character b pointed to.
A search is made to determine whether the character string ab is registered in the communication dictionary 22-2. Since the character string ab is registered as a dedicated character string in the communication field in the communication-dedicated dictionary, the character string ab
Is counted up, and the next character is pointed (steps 304 to 307). Next, the pointed character c is read. Character string abc is communication dictionary 12
-Search whether it is registered in 2. Since the character abc is registered, the occurrence counter of the character string abc is counted up, and the next character is pointed (steps 304 to 307). The pointed character c is read, and it is searched whether the character string abca is registered in the communication dictionary 12-2. In this case, since the character string abca is not registered in the dictionary, a contact number (266) is assigned and registered in the communication dictionary 12-2 (step 304).
308). Next, the code word of the previous matching character string abc is output to the communication-specific code string output buffer 15 (step 309).

【0028】上述した一連の文字列の符号化(ステップ
304〜309)は、学習用辞書12−1による符号化
と同様に行われ、辞書検索カウント値が1Kバイトにな
るまで続けられる(ステップ303)。また、辞書検索
カウント値が1Kバイト分T0になるまでは学習用辞書
12−1、通信専用辞書12−2、音声専用辞書12−
3および画像専用辞書12−4のすべての辞書も新規の
文字列を同じように登録して行くとともに、該辞書それ
ぞれに登録された文字に対する被圧縮データの出現カウ
ント数が出現カウンタ52に記録される。辞書検索カウ
ント値が1Kバイトに達する(ステップ303)と、L
ZW符号化部11は通信専用辞書ヒット率演算を行う
(ステップ311)。この演算は図14本発明の実施例
における辞書選択値と閾値に示されているように、通信
専用辞書ヒット率=専用登録文字出現カウント数の総和
÷専用辞書接点数で計算される。図9符号化通信専用辞
書では、専用登録文字出現カウント数の総和=2+3+
6+8+7+5+4=35、専用辞書接点数=7である
ので、通信専用辞書ヒット率=5.0となる。同様に音
声専用辞書12−3および画像専用辞書12―4につい
て求めたものが図14に示されており、音声専用辞書1
2―3が0.0、画像専用辞書12−4が1.7となっ
ている。
The above-described encoding of a series of character strings (steps 304 to 309) is performed in the same manner as the encoding by the learning dictionary 12-1, and is continued until the dictionary search count value reaches 1 Kbyte (step 303). ). Until the dictionary search count value reaches 1 KB T0, the learning dictionary 12-1, the communication dictionary 12-2, and the voice dictionary 12-
3 and all the image-dedicated dictionaries 12-4, new character strings are registered in the same manner, and the number of appearances of compressed data corresponding to the characters registered in each of the dictionaries is recorded in the appearance counter 52. You. When the dictionary search count value reaches 1 Kbyte (step 303), L
The ZW encoding unit 11 performs a communication dictionary hit rate calculation (step 311). As shown in the dictionary selection value and the threshold value in the embodiment of the present invention in FIG. 14, this calculation is calculated by: communication dictionary hit rate = sum of dedicated registered character appearance counts / dedicated dictionary contact number. FIG. 9 In the coded communication-dedicated dictionary, the sum total of the special registered character appearance count = 2 + 3 +
Since 6 + 8 + 7 + 5 + 4 = 35 and the number of dedicated dictionary contacts = 7, the communication dictionary hit rate = 5.0. Similarly, FIG. 14 shows the results obtained for the voice-only dictionary 12-3 and the image-only dictionary 12-4.
2-3 is 0.0, and the image-dedicated dictionary 12-4 is 1.7.

【0029】続いて、該通信専用辞書ヒット率から、符
号化している被圧縮データがどの分野に最も適している
かを決定する。この場合、辞書選択閾値≧3.0で一番
高いヒット率を示しているのは通信専用辞書であるの
で、LZW符号化部11は残る9Kバイトの被圧縮デー
タの符号化に通信専用辞書12―2を選択する選択信号
18を辞書選択器13に出力するとともに、図13辞書
選択データとその対応辞書テーブルに示したように、通
信専用辞書12−2に対応した符号語(1000000
00)も通信専用符号列出力バッファ15へ出力する。
該選択信号18を受けた辞書選択器13は、現ブロック
の符号化が終わるまで符号化辞書として通信専用辞書1
2−2を固定し、他の専用辞書には変えない(ステップ
314)。次に、符号化する第1ブロックが終了する
と、次のブロックでの通信専用辞書ヒット率を求める準
備として、それぞれの専用辞書の出現カウンタと辞書検
索ポインタとを初期化するとともに、辞書選択器13へ
の選択信号18をリセットし終了する(ステップ31
5、316)。
Subsequently, it is determined from the communication-specific dictionary hit rate which field the compressed data to be encoded is most suitable for. In this case, since the dictionary with the highest hit rate when the dictionary selection threshold ≥ 3.0 is the communication dictionary, the LZW encoding unit 11 performs the encoding of the remaining 9 Kbytes of compressed data using the communication dictionary 12. In addition to the output of the selection signal 18 for selecting −2 to the dictionary selector 13, as shown in the dictionary selection data and the corresponding dictionary table in FIG.
00) is also output to the communication-specific code string output buffer 15.
The dictionary selector 13 receiving the selection signal 18 makes the communication dictionary 1 as an encoding dictionary until the encoding of the current block is completed.
2-2 is fixed, and is not changed to another dedicated dictionary (step 314). Next, when the first block to be encoded ends, in preparation for obtaining the communication dictionary hit rate in the next block, the appearance counter and dictionary search pointer of each dedicated dictionary are initialized, and the dictionary selector 13 is initialized. Is reset and the selection signal 18 is terminated (step 31).
5, 316).

【0030】以上のように、第1ブロックの被圧縮デー
タは専用辞書内に予め登録された専用登録文字により、
通常のLZW法による符号化よりも高い圧縮率で符号化
され、図5の圧縮データフレームに組み立てられ、通信
辞書符号化列出力バッファ15から対向する復号器へ出
力される。なお、閾値3.0に満たない場合は、どの専
用辞書による圧縮もその効果が得られないものとし、学
習用辞書12―1によ
As described above, the data to be compressed in the first block is obtained by the special registered characters registered in the special dictionary in advance.
The encoded data is encoded at a higher compression ratio than the ordinary LZW encoding, is assembled into the compressed data frame shown in FIG. 5, and is output from the communication dictionary encoded sequence output buffer 15 to the opposite decoder. If the value is less than the threshold value 3.0, it is assumed that the compression by any of the dedicated dictionaries does not provide the effect, and the learning dictionary 12-1 does not.

【0031】次に、本発明の復号化動作を図18専用辞
書による復号化手順に従って通信専用辞書を用いて説明
する。図12は通信分野の用語が予め登録された通信専
用辞書内容で符号語80、接点番号81および登録文字
列82で構成されている。
Next, the decoding operation of the present invention will be described using a communication-dedicated dictionary according to the decoding procedure using the dedicated dictionary in FIG. FIG. 12 is a communication-dedicated dictionary content in which terms in the communication field are registered in advance, and includes a code word 80, a contact number 81, and a registered character string 82.

【0032】LZW復号化部21は、辞書選択器23へ
の辞書選択信号28リセットと接点番号カウンタをクリ
アする(ステップ400)。次に、基本登録文字83お
よび通信分野に対応した専用登録文字84の登録を行う
(ステップ401)。辞書選択データ40は1Kバイト
分の被圧縮データが圧縮されるまで送られてこないの
で、復号化辞書の選択はここでは行われない(ステップ
402、403)。辞書選択データ40がLZW符号器
から送られてくるまでは、学習用辞書22−1、通信専
用辞書22−2、音声専用辞書22−3および画像専用
辞書22−4の全ての辞書により復号化が行われ、復号
文字列はそれぞれ学習用辞書文字列出力バッファ24と
通信用辞書文字列出力バッファ25と音声用辞書文字列
出力バッファ26と画像用辞書文字列出力バッファ28
とに蓄えられる。
The LZW decoding unit 21 resets the dictionary selection signal 28 to the dictionary selector 23 and clears the contact number counter (Step 400). Next, the basic registration character 83 and the special registration character 84 corresponding to the communication field are registered (step 401). Since the dictionary selection data 40 is not sent until the compressed data of 1 Kbyte is compressed, the selection of the decoding dictionary is not performed here (steps 402 and 403). Until the dictionary selection data 40 is sent from the LZW encoder, decoding is performed by all of the learning dictionary 22-1, the communication dictionary 22-2, the audio dictionary 22-3, and the image dictionary 22-4. The decoded character strings are sent to the learning dictionary character string output buffer 24, the communication dictionary character string output buffer 25, the audio dictionary character string output buffer 26, and the image dictionary character string output buffer 28, respectively.
It is stored in.

【0033】辞書選択データ40が来ると、LZW復号
化部21は図13に示した辞書選択データとその対応辞
書テーブルから該辞書選択データ40以降の圧縮データ
がどの符号化辞書により符号化されているかを判断し
(ステップ402)、復号化辞書を設定するために辞書
選択信号28をLZW復号器の辞書選択器23に出力す
る。辞書選択器23は、復号化辞書の中から通知を受け
た専用辞書を選択する(ステップ403)。この場合、
符号語(100000000)を受けているので通信専
用辞書22−2が選択され、次に辞書選択データ40が
来るまで固定する。
When the dictionary selection data 40 arrives, the LZW decoding unit 21 encodes the compressed data after the dictionary selection data 40 by the coding dictionary from the dictionary selection data and the corresponding dictionary table shown in FIG. Is determined (step 402), and a dictionary selection signal 28 is output to the dictionary selector 23 of the LZW decoder to set a decoding dictionary. The dictionary selector 23 selects the dedicated dictionary notified from the decrypted dictionaries (step 403). in this case,
Since it has received the code word (10000000), the communication-dedicated dictionary 22-2 is selected and fixed until the next dictionary selection data 40 comes.

【0034】辞書選択データ40に続く圧縮データが読
み込まれる(ステップ404)と、それに対応する接点
番号に変換され(ステップ405)、該接点番号に対応
した文字列が通信専用辞書22―2で検索される(ステ
ップ406)。ここで、辞書選択データ40に続く符号
語(…・・100001000、000000100、
…・・)が来たとすると、まず符号語(1000010
00)が読み込まれ、接点番号(264)が通信専用辞
書22―2に登録されているかどうか検索する。接点番
号264に対応した文字列abccは通信専用辞書に登
録されているので、この文字列を文字列出力バッファに
出力する(ステップ404〜407)とともに、辞書選
択データの1つ前で復号された文字(ここではfと仮定
する)との組み合わせfabccが通信用辞書22―2
に登録されているかどうか検索する(ステップ40
8)。もし登録されてなければ、新規登録文字85とし
て符号語(100101011)、接点番号(299)
を付与して通信専用辞書22―2に登録する(ステップ
408、409)。登録されていれば何もしない。次に
ポイントされる符号語(000000100)を読み込
み、同様に接点番号(4)に対応した文字eを検索す
る。これは基本登録語として登録されているので、文字
eを通信用辞書文字列出力バッファ25へ出力し、1つ
前の復号文字との組み合わせであるabcceが通信専
用辞書22−2に登録されているかどうか検索する。登
録されていなければ新規登録文字85として同じく通信
専用辞書22―1に登録する。以降同様にして続く符号
語の復号動作(402〜409)が行われ、圧縮データ
ファイルが終わりになったら復号化処理を終了する(ス
テップ411)。なお、符号語が復号辞書に登録されて
いない場合は例外処理(ステップ406、412)が行
われるが、本特許請求範囲ではないのでここでは説明を
割愛する。
When the compressed data following the dictionary selection data 40 is read (step 404), it is converted into a contact number corresponding thereto (step 405), and a character string corresponding to the contact number is searched in the communication dictionary 22-2. (Step 406). Here, the codewords following the dictionary selection data 40 (... 10,0000000, 0000000000,
… ..), the code word (1000010)
00) is read, and it is searched whether or not the contact number (264) is registered in the communication dictionary 22-2. Since the character string abcc corresponding to the contact number 264 is registered in the communication dictionary, this character string is output to the character string output buffer (steps 404 to 407), and is decoded just before the dictionary selection data. The combination fabcc with a character (here, f is assumed) is the communication dictionary 22-2.
(Step 40)
8). If not registered, the code word (100101011) and the contact number (299) are newly registered characters 85.
And registers it in the communication dictionary 22-2 (steps 408 and 409). Do nothing if registered. Next, the code word (0000000000) to be pointed is read, and a character e corresponding to the contact number (4) is similarly searched. Since this is registered as a basic registered word, the character e is output to the communication dictionary character string output buffer 25, and abcse, which is a combination with the immediately preceding decoded character, is registered in the communication dictionary 22-2. Search for If it is not registered, it is registered as a newly registered character 85 in the communication dictionary 22-1. Thereafter, decoding operations of the subsequent code words (402 to 409) are performed in the same manner, and when the compressed data file ends, the decoding process ends (step 411). If the codeword is not registered in the decoding dictionary, exception processing (steps 406 and 412) is performed, but the description is omitted here because it is not the scope of the present invention.

【0035】本発明の第2の実施例を図19第2の実施
例専用辞書の符号化手順に従って説明する。ここで、第
2の実施例の符号復号器の構成は第1の実施例のものと
同じである。図9は通信分野の用語が予め通信専用辞書
12―2に登録されている内容を示しており、接点番号
50、登録文字列51、出現カウンタ52で構成されて
いる。
A second embodiment of the present invention will be described with reference to FIG. Here, the configuration of the code decoder of the second embodiment is the same as that of the first embodiment. FIG. 9 shows contents in which terms in the communication field are registered in the communication dictionary 12-2 in advance, and includes a contact number 50, a registered character string 51, and an appearance counter 52.

【0036】まず、LZW符号化部11は符号化処理に
先立ち、辞書検索カウンタ、出現カウンタ、文字ポイン
タの初期化(ここでは0クリア)を行う(ステップ50
0)。次に、基本登録文字53および各分野に対応した
専用登録文字54の登録を行う(ステップ501)。こ
こで、LZW符号器11の文字列入力バッファ10に
は、図6に示した一連の被圧縮データが蓄積されてい
る。また、前記学習用辞書12―1による符号化の説明
と同様に、被圧縮データとして図4に示す被圧縮データ
フレーム(abcabcabcaabbcc……)42
が保持されているものとする。
First, the LZW encoding unit 11 initializes (here, clears to 0) a dictionary search counter, an appearance counter, and a character pointer prior to the encoding process (step 50).
0). Next, the basic registration character 53 and the special registration character 54 corresponding to each field are registered (step 501). Here, a series of compressed data shown in FIG. 6 is stored in the character string input buffer 10 of the LZW encoder 11. Similarly to the description of the encoding using the learning dictionary 12-1, the compressed data frame (abcabcabcaabbcc...) 42 shown in FIG.
Is held.

【0037】続いて、該被圧縮データフレームに辞書選
択フラグが付与または既に辞書選択モードに設定されて
いるかどうか調べる(ステップ502)。この場合、辞
書選択フラグが付与されているので、辞書選択フラグモ
ードの設定を行うとともに、辞書選択を図20辞書選択
でフラグとその対応辞書に示す図から辞書選択を行う。
ここでは、通信専用辞書12―2を選択する辞書選択フ
ラグ(00)が指定されてきたとする。なお、辞書選択
フラグも辞書選択フラグモードも設定されていない場合
は、どの専用辞書を用いて符号化を行うかを決定する専
用辞書選択値を求める符号化範囲を決定する辞書検索カ
ウント値(ここでは1Kバイト分・T0)を調べる(ス
テップ504)が、この場合の符号化処理は第1の実施
例と同様であるのでここでの説明は割愛する。
Subsequently, it is checked whether a dictionary selection flag has been added to the compressed data frame or the dictionary selection mode has already been set (step 502). In this case, since the dictionary selection flag is given, the dictionary selection flag mode is set, and the dictionary is selected from the dictionary and the corresponding dictionary shown in FIG.
Here, it is assumed that a dictionary selection flag (00) for selecting the communication dictionary 12-2 has been designated. When neither the dictionary selection flag nor the dictionary selection flag mode is set, a dictionary search count value (here, a dictionary search count value for determining a coding range for obtaining a dedicated dictionary selection value for determining which dedicated dictionary to use for coding). In this case, 1K bytes (T0) is checked (step 504), but the encoding process in this case is the same as in the first embodiment, and the description is omitted here.

【0038】辞書選択フラグモードに入ると、被圧縮デ
ータフレーム42から最初の文字aの読み込みに入る
(ステップ505)。次に、文字aが通信専用辞書12
―2に登録されているかどうか検索する(ステップ50
6)。文字aは基本登録文字53として登録されている
ので、出現カウンタをカウントアップ(+1)し(ステ
ップ507)、次の文字をポイントする(ステップ50
8)。ポイントされた次の文字bを読み込む。文字列a
bが通信専用辞書22―2に登録されているかどうか検
索する。通信専用辞書では文字列abは通信分野の専用
文字列として登録されているため、文字列abの出現カ
ウンタをカウントアップし、次の文字をポイントする
(ステップ505〜508)。次にポイントされた文字
cを読み込む。文字列abcが通信専用辞書12―2に
登録されているかどうか検索する。文字abcは登録さ
れているので、文字列abcの出現カウンタをカウント
アップし、さらに次の文字をポイントする(ステップ5
05〜508)。ポイントされた文字cを読み込み、文
字列abcaが通信専用辞書12−2に登録されている
かどうか検索する。この場合、文字列abcaは辞書に
登録されていないので、接点番号(266)が付与さ
れ、通信専用辞書12−2に登録される(ステップ50
5〜509)。次に、1つ前の一致した文字列abcの
符号語を通信専用符号列出力バッファ15へ出力する
(ステップ510)。なお、本発明の第2の実施例にお
ける復号動作は前記第1の実施例の専用辞書を使用した
復号動作と同じであるので、ここでの説明は割愛する。
In the dictionary selection flag mode, the first character a is read from the compressed data frame 42 (step 505). Next, the character a is entered in the communication dictionary 12
-2 to search whether it is registered in (Step 50
6). Since the character a is registered as the basic registered character 53, the appearance counter is counted up (+1) (step 507), and the next character is pointed (step 50).
8). Read the next character b pointed to. Character string a
A search is made to determine whether or not b is registered in the communication dictionary 22-2. Since the character string ab is registered in the communication-dedicated dictionary as a character string dedicated to the communication field, the occurrence counter of the character string ab is counted up and the next character is pointed (steps 505 to 508). Next, the pointed character c is read. A search is performed to determine whether the character string abc is registered in the communication dictionary 12-2. Since the character abc is registered, the appearance counter of the character string abc is counted up, and the character abc is further pointed to (step 5).
05-508). The pointed character c is read, and it is searched whether the character string abca is registered in the communication dictionary 12-2. In this case, since the character string abca is not registered in the dictionary, a contact number (266) is assigned and registered in the communication-dedicated dictionary 12-2 (step 50).
5-509). Next, the code word of the previous matched character string abc is output to the communication-specific code string output buffer 15 (step 510). The decoding operation according to the second embodiment of the present invention is the same as the decoding operation using the dedicated dictionary according to the first embodiment, and the description is omitted here.

【0039】以上のように、予め符号化する被圧縮デー
タに、符号化する際に使用する専用辞書選択情報である
辞書選択フラグを付与することにより、被圧縮データに
適した専用辞書を演算、選択する処理が不要となり、専
用辞書を使用する場合の符号化処理が軽減される。
As described above, by assigning a dictionary selection flag, which is dedicated dictionary selection information used for encoding, to the data to be encoded in advance, a dedicated dictionary suitable for the data to be compressed is calculated. The selection process is not required, and the encoding process when using the dedicated dictionary is reduced.

【0040】[0040]

【発明の効果】以上説明したように、本発明のLZW符
号化方法は、図3辞書選択データの符号化範囲に示した
ように辞書形態は従来と同様であるが、従来が全ての被
圧縮データと全ての辞書を用い符号化していたのに対
し、本発明ではある一定量の被圧縮データを全ての辞書
を用いて圧縮学習した後、その被圧縮データ内容から最
も近い分野の専用辞書を選択、固定し、残された該被圧
縮データの圧縮を行うことにより、従来の方法で行って
いた全ての被圧縮データならびに全ての専用辞書による
符号化処理を削減し、符号化処理の高速化を図ることが
出来る。符号化削減時間は図3において従来方法による
符号化時間をTa、本発明において一連のブロック番号
iを0、1、2、3、……n+2とし各ブロックの符号
化時間をTiで表すと、下記式のようになる。
As described above, in the LZW encoding method of the present invention, the dictionary form is the same as the conventional one as shown in the encoding range of the dictionary selection data in FIG. In contrast to encoding using data and all dictionaries, in the present invention, after a certain amount of compressed data is subjected to compression learning using all dictionaries, a dedicated dictionary in the field closest to the content of the compressed data is obtained. By selecting, fixing and compressing the remaining compressed data, the encoding processing by the conventional method with all the compressed data and all the dedicated dictionaries is reduced, and the encoding processing is accelerated. Can be achieved. Coding reduces time between the time of encoding according to the conventional method in FIG. 3 Ta, the set of block number i in the present invention 0,1,2,3, and ...... n + 2 and to represent the encoding time of each block of Ti And the following equation.

【数1】 (Equation 1)

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のLZW符号器の一例を示すブロック図
である。
FIG. 1 is a block diagram illustrating an example of an LZW encoder according to the present invention.

【図2】本発明のLZW復号器の一例を示すブロック図
である。
FIG. 2 is a block diagram illustrating an example of an LZW decoder according to the present invention.

【図3】辞書選択データの符号化範囲を示す図である。FIG. 3 is a diagram showing an encoding range of dictionary selection data.

【図4】第1の実施例の被圧縮データフレームを示す図
である。
FIG. 4 is a diagram illustrating a compressed data frame according to the first embodiment.

【図5】圧縮データフレームを示す図である。FIG. 5 is a diagram showing a compressed data frame.

【図6】第2の実施例の被圧縮データフレームを示す図
である。
FIG. 6 is a diagram illustrating a compressed data frame according to a second embodiment.

【図7】符号化学習用辞書を示す図である。FIG. 7 is a diagram showing an encoding learning dictionary.

【図8】復号化学習用辞書を示す図である。FIG. 8 is a diagram showing a decoding learning dictionary.

【図9】符号化通信専用辞書を示す図である。FIG. 9 is a diagram showing a dictionary dedicated to encoded communication.

【図10】符号化音声専用辞書を示す図である。FIG. 10 is a diagram showing a coded voice-only dictionary.

【図11】符号化画像専用辞書を示す図である。FIG. 11 is a diagram showing a dictionary dedicated to encoded images.

【図12】LZW復号器の通信専用辞書を示す図であ
る。
FIG. 12 is a diagram showing a communication-dedicated dictionary of the LZW decoder.

【図13】辞書選択データとその対応辞書を示す表であ
る。
FIG. 13 is a table showing dictionary selection data and its corresponding dictionary.

【図14】本発明の実施例における辞書選択値と閾値を
示す式および表である。
FIG. 14 is an expression and a table showing a dictionary selection value and a threshold value in the embodiment of the present invention.

【図15】学習用辞書による符号化手順を示すフローチ
ャートである。
FIG. 15 is a flowchart showing an encoding procedure using a learning dictionary.

【図16】学習用辞書による復号化手順を示すフローチ
ャートである。
FIG. 16 is a flowchart showing a decoding procedure using a learning dictionary.

【図17】専用辞書による符号化手順を示すフローチャ
ートである。
FIG. 17 is a flowchart showing an encoding procedure using a dedicated dictionary.

【図18】専用辞書による復号化手順を示すフローチャ
ートである。
FIG. 18 is a flowchart showing a decoding procedure using a dedicated dictionary.

【図19】第2の実施例専用辞書の符号化手順を示すフ
ローチャートである。
FIG. 19 is a flowchart showing a procedure for encoding a dictionary dedicated to the second embodiment.

【図20】第2の実施例辞書選択でフラグとその対応辞
書を示す表である。
FIG. 20 is a table showing flags and corresponding dictionaries in dictionary selection according to the second embodiment.

【図21】従来の符号化システムのブロック図である。FIG. 21 is a block diagram of a conventional encoding system.

【符号の説明】[Explanation of symbols]

10 文字列入力バッファ 11 LZW符号化部 12 符号化辞書 12−1 学習用辞書 12−2 通信専用辞書 12−3 音声専用辞書 12−4 画像専用辞書 13 辞書選択器 14 学習用辞書符号列出力バッファ 15 通信専用辞書符号列出力バッファ 16 音声専用辞書符号列出力バッファ 17 画像専用辞書符号列出力バッファ 18 選択信号 20 符号列入力バッファ 21 LZW復号化部 22 復号化辞書 22−1 学習用辞書 22−2 通信専用辞書 22−3 音声専用辞書 22−4 画像専用辞書 23 辞書選択器 24 学習用辞書文字列出力バッファ 25 通信専用辞書文字列出力バッファ 26 音声専用辞書文字列出力バッファ 27 画像専用辞書文字列出力バッファ 28 選択信号 DESCRIPTION OF SYMBOLS 10 Character string input buffer 11 LZW encoding part 12 Encoding dictionary 12-1 Learning dictionary 12-2 Communication dictionary 12-3 Audio dictionary 12-4 Image dictionary 13 Dictionary selector 14 Learning dictionary code string output buffer 15 Communication-dedicated dictionary code string output buffer 16 Audio-only dictionary code string output buffer 17 Image-dedicated dictionary code string output buffer 18 Selection signal 20 Code string input buffer 21 LZW decoding unit 22 Decoding dictionary 22-1 Learning dictionary 22-2 Communication-only dictionary 22-3 Voice-only dictionary 22-4 Image-only dictionary 23 Dictionary selector 24 Learning dictionary character-string output buffer 25 Communication-only dictionary character-string output buffer 26 Audio-only dictionary character-string output buffer 27 Image-only dictionary character-string output Buffer 28 selection signal

フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/40 - 7/42 Continuation of front page (58) Field surveyed (Int.Cl. 7 , DB name) H03M 7/ 40-7/42

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 LZW符号化によるデータ圧縮方法にお
いて、学習用辞書と1つまたはそれ以上の専門辞書とを
設けるとともに、符号化される被圧縮データの一部分を
前記辞書の全てを用いて圧縮学習した後、その被圧縮デ
ータ内容から最も近い分野の前記専用辞書を選択、固定
し、この選択、固定した専用辞書により残された被圧縮
データの圧縮を行うことを特徴とするデータ圧縮方法
We claim: 1. have you <br/> the data compression method according to the LZW coding, provided with a learning dictionary and one or more specialized dictionary, said dictionary a portion of the compressed data to be encoded After performing compression learning using all of the compressed data, selecting and fixing the dedicated dictionary in the field closest to the compressed data content, and compressing the selected compressed data left by the fixed dedicated dictionary. Data compression method .
【請求項2】 被圧縮データを蓄える文字列入力バッフ
ァと、学習用辞書と1つまたはそれ以上の専門辞書とを
備えた符号化辞書と、前記各辞書に対応した符号列出力
バッファと、辞書選択器と、前記各辞書を使用して入力
バッファからの被圧縮データの符号化を行い、該符号化
データを前記出力バッファへ出力する機能、および、前
記各辞書において学習した登録文字と該登録文字が被圧
縮データにどれだけ出現したかを示すデータを蓄積する
前記学習用辞書と専用辞書とから被圧縮データの符号化
を行う際に最も適した辞書を選択し、辞書選択器へ選択
信号を出力する機能を有するLZW符号化部とからなる
請求項1に記載のデータ圧縮方法
2. A character string input buffer for storing data to be compressed, an encoding dictionary including a learning dictionary and one or more specialized dictionaries, a code string output buffer corresponding to each dictionary, and a dictionary A function of encoding the data to be compressed from the input buffer using the selector and each of the dictionaries, and outputting the encoded data to the output buffer; The most suitable dictionary when encoding the compressed data is selected from the learning dictionary and the dedicated dictionary that stores data indicating how many characters appear in the compressed data, and a selection signal is sent to the dictionary selector. 2. The data compression method according to claim 1, further comprising an LZW encoding unit having a function of outputting the data.
【請求項3】 LZW符号化部が、予めどの分野の被圧
縮データかを示す辞書選択フラグがつけられた該被圧縮
データを符号化する機能を有する請求項2に記載のデー
タ圧縮方法
3. LZW coding unit, the data compression method of claim 2 having a function to encode該被compressed data dictionary selected flagged to indicate whether data to be compressed in advance which areas.
【請求項4】 圧縮データを蓄える符号列入力バッファ
と、学習用辞書と1つまたはそれ以上の専門辞書とを備
えた復号化辞書と、前記各辞書に対応した文字列出力バ
ッファと、辞書選択器と、前記各辞書を使用して入力バ
ッファからの圧縮データの復号化を行い、該復号化デー
タを前記出力バッファへ出力する機能、および、前記各
辞書において学習した登録文字と該登録文字が圧縮デー
タにどれだけ出現したかを示すデータを蓄積する前記学
習用辞書と専用辞書とから圧縮データの復号化を行う際
に最も適した辞書を選択し、辞書選択器へ選択信号を出
力する機能を有するLZW復号化部とからなる請求項1
に記載のデータ圧縮方法
4. A code string input buffer for storing compressed data, a decoding dictionary including a learning dictionary and one or more specialized dictionaries, a character string output buffer corresponding to each dictionary, and a dictionary selection buffer. And a function of decoding the compressed data from the input buffer using the respective dictionaries and outputting the decoded data to the output buffer. The registered characters and the registered characters learned in the respective dictionaries are A function of selecting a dictionary most suitable for decoding compressed data from the learning dictionary and the dedicated dictionary that stores data indicating how many times the compressed data appears, and outputting a selection signal to the dictionary selector. 2. An LZW decoding unit having:
2. The data compression method according to 1 .
【請求項5】(5) 被圧縮データを蓄える文字列入力バッフCharacter string input buffer that stores compressed data
ァと、学習用辞書、通信分野に適した通信専用辞書、音And learning dictionary, communication-specific dictionary suitable for the communication field, sound
声分野に適した音声専用辞書および画像分野Voice-only dictionary and image field suitable for voice field に適した画Picture suitable for
像専用辞書を備えた符号化辞書と、前記各辞書に対応しAn encoding dictionary with a dedicated image dictionary, and
た学習用辞書符号列出力バッファ、通信専用辞書符号列Learning dictionary code string output buffer, communication-specific dictionary code string
出力バッファ、音声専用辞書符号列出力バッファおよびOutput buffer, voice-only dictionary code string output buffer and
画像専用辞書符号列出力バッファと、辞書選択器と、前Image-only dictionary code string output buffer, dictionary selector, and
記各辞書を使用してLZW法により入力バッファからのFrom the input buffer by the LZW method using each dictionary
被圧縮データの符号化を行い、該符号化データを前記出The data to be compressed is encoded, and the encoded data is output as described above.
力バッファへ出力する機能、および、前記各専用辞書にFunction to output to the output buffer
おいて学習した登録文字と該登録文字が被圧縮データにThe registered characters and the registered characters learned in
どれだけ出現したかを示すデータを蓄積する前記学習用For learning, which stores data indicating how many times it has appeared
辞書と専用辞書とから被圧縮データの符号化を行う際にWhen encoding data to be compressed from a dictionary and a dedicated dictionary
最も適した辞書を選択し、辞書選択器へ選択信号を出力Select the most suitable dictionary and output a selection signal to the dictionary selector
する機能を有するLZW符号化部とからなるデータ圧縮Data compression comprising an LZW encoder having a function of performing
方式。method.
【請求項6】6. 予めどの分野の被圧縮データかを示す辞Prefix indicating whether the data to be compressed in advance which areas
書選択フラグがつけられた該被圧縮データを符号化するEncodes the data to be compressed with a document selection flag
機能を有するLZW符号化部を含む請求項5に記載のデThe data according to claim 5, further comprising an LZW encoding unit having a function.
ータ圧縮方式。Data compression method.
JP23552098A 1998-08-21 1998-08-21 Data compression method and data compression method Expired - Fee Related JP3001519B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23552098A JP3001519B1 (en) 1998-08-21 1998-08-21 Data compression method and data compression method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23552098A JP3001519B1 (en) 1998-08-21 1998-08-21 Data compression method and data compression method

Publications (2)

Publication Number Publication Date
JP3001519B1 true JP3001519B1 (en) 2000-01-24
JP2000068857A JP2000068857A (en) 2000-03-03

Family

ID=16987203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23552098A Expired - Fee Related JP3001519B1 (en) 1998-08-21 1998-08-21 Data compression method and data compression method

Country Status (1)

Country Link
JP (1) JP3001519B1 (en)

Also Published As

Publication number Publication date
JP2000068857A (en) 2000-03-03

Similar Documents

Publication Publication Date Title
Salomon A concise introduction to data compression
CA2438309C (en) Method and apparatus for adaptive data compression
US6633242B2 (en) Entropy coding using adaptable prefix codes
JP3231663B2 (en) Data compression method
US5877711A (en) Method and apparatus for performing adaptive data compression
JPH07502632A (en) Circuit for Huffman code decoding
US5594435A (en) Permutation-based data compression
EP0127815B1 (en) Data compression method
US6225922B1 (en) System and method for compressing data using adaptive field encoding
JPWO2009095956A1 (en) Data compression / decompression method and compression / decompression program
JPH1079672A (en) Method and device for compressing and decompressing message
JPH07226846A (en) Processing method of input data stream and generation method of compressed format
JP2003524983A (en) Method and apparatus for optimized lossless compression using multiple coders
KR100906041B1 (en) Font compression and retrieval
JP3960629B2 (en) Transmission system using variable length encoder
JPH07170196A (en) Coding decoding circuit for binary symbol
JP3080149B2 (en) Pattern encoding method and decoding method, and encoding apparatus and decoding apparatus using the method
JP3001519B1 (en) Data compression method and data compression method
JP3256121B2 (en) Data encoding device and data decoding device and method therefor
JP4093193B2 (en) Data compression method and program, and data restoration method and apparatus
JP2005286371A (en) Data compression method and program, and data restoring method and device
JPS6352812B2 (en)
JPS62209948A (en) Data compressing and transmitting method
JPH1155226A (en) Data transmitting device
JP3098046B2 (en) Image data compression apparatus and method

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees