JP2746228B2

JP2746228B2 - データ圧縮方法

Info

Publication number: JP2746228B2
Application number: JP7276651A
Authority: JP
Inventors: 高夫岸
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1995-09-29
Filing date: 1995-09-29
Publication date: 1998-05-06
Anticipated expiration: 2015-09-29
Also published as: JPH0997163A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力データ列を圧
縮するデータ圧縮方法に関し、特に、Ｌｅｍｐｅｌ−Ｚ
ｉｖ方式の静的辞書法によるデータ圧縮方法に関する。

【０００２】

【従来の技術】入力データ列を圧縮するデータ圧縮方法
としては、従来から種々のものが提案されており、その
中の１つにＬｅｍｐｅｌ−Ｚｉｖが提案したＬＺ７８
（静的辞書法）がある。

【０００３】この方法は、入力データ列に対し、辞書に
登録済みのデータ列が存在するか否かをチェックし、登
録済みのデータ列が存在しない場合には、入力データ列
自身と非圧縮を示す１ビットの識別子とを圧縮データと
して出力する。一方、辞書中に登録済みのデータ列が存
在する場合には、一致が検出されたデータ列については
それに対応する辞書のエントリ番号と圧縮を示す１ビッ
トの識別子とを圧縮データとして出力する。そして、上
記した圧縮のステップ完了後に、辞書登録のステップを
実行し、圧縮の対象となった入力データ列と次の１バイ
トとからなるデータ列を辞書のデータエントリ部に登録
する。辞書に登録されるデータ列は、一回の圧縮動作実
行の度に１バイトずつ長くなっていく。

【０００４】図１４，図１５は上記したＬＺ７８（静的
辞書法）による圧縮動作及び辞書登録動作の一例を示し
た図である。この例は、入力データ列を“ｐｅｒｆｏｒ
ｍａｎｃｅｐｅｒｆｏｒｍａｎｃｅ”とし、辞書には既
に“ｐｅｒ”，“ｆｏｒ”，“ｍａｎ”，“ｃｅ”の４
つのデータ列が登録されているとしている。

【０００５】図１４は“ｐｅｒ”というデータ列が処理
された後、次に“ｆｏｒ”というデータ列が、辞書に登
録済みのデータ列“ｆｏｒ”と一致することが検出され
たときを説明したものである。図１４に示すように、圧
縮のステップに於いて入力データ中の“ｆｏｒ”という
データ列と、辞書のエントリ番号１０１のエントリに登
録されているデータ列“ｆｏｒ”との一致を検出する
と、圧縮データとして“１・１０１”を出力する。最初
の“１”は、圧縮が行われたことを示す１ビットの識別
子であり、それに続く“１０１”は辞書のエントリ番号
である。

【０００６】その後、辞書への新規データ列の登録を行
う。圧縮したデータ列“ｆｏｒ”に、その隣の１バイト
データ“ｍ”を結合して辞書登録データ“ｆｏｒｍ”を
作成し、作成した辞書登録データ“ｆｏｒｍ”を辞書に
登録する。図１４の例では、辞書登録データ“ｆｏｒ
ｍ”は、辞書のエントリ番号１０５のエントリに登録さ
れている。ここで登録されたデータ列“ｆｏｒｍ”は、
引き続き実行される圧縮のステップで使用される。勿
論、以後、“ｆｏｒｍ”というデータ列が出現しなけれ
ば、圧縮動作には使用されず、辞書に登録されたままと
なる。このような動作を繰り返して入力データ列“ｐｅ
ｒｆｏｒｍａｎｃｅｐｅｒｆｏｒｍａｎｃｅ”を圧縮す
ると共に、辞書に新たなデータ列を登録する。入力デー
タ列“ｐｅｒｆｏｒｍａｎｃｅｐｅｒｆｏｒｍａｎｃ
ｅ”に対する圧縮動作，辞書登録動作が終了した時点に
於ける圧縮データ，辞書の内容は、図１５に示すものと
なる。

【０００７】また、辞書を使用してデータ圧縮を行う方
法としては、米国特許第４８１４７４６号明細書に記載
されているものも知られている。

【０００８】この方法の場合、圧縮動作に関しては、上
記したＬＺ７８（静的辞書法）と同じで、入力データ列
に対し、辞書に登録済みのデータ列が存在するか否かを
チェックし、登録済みのデータ列が存在しない場合に
は、入力データ列を非圧縮を示す識別子と共に出力す
る。一方、登録済みのデータが存在する場合には、一致
が検出された辞書のエントリ番号と圧縮を示す識別子と
を圧縮データとして出力する。そして、上記した圧縮の
ステップ後に行う辞書へのデータ列の登録動作に於いて
は、前回の圧縮対象のデータ列と今回の圧縮対象のデー
タ列とを結合することにより辞書登録データを作成し、
作成した辞書登録データを辞書に登録する。この方法に
よれば、頻出するデータ列自身の登録を早期に行うこと
ができる。

【０００９】図１６，図１７は上記米国特許第４８１４
７４６号明細書に記載されている方法に従った圧縮動作
及び辞書登録動作の一例を示した図である。この例は、
入力データ列を“ｐｅｒｆｏｒｍａｎｃｅｐｅｒｆｏｒ
ｍａｎｃｅ”とし、辞書には既に“ｐｅｒ”，“ｆｏ
ｒ”，“ｍａｎ”，“ｃｅ”の４つのデータ列が登録さ
れているとしている。

【００１０】図１６は“ｐｅｒ”というデータ列が処理
された後、次に“ｆｏｒ”というデータ列が、辞書に登
録済みのデータ列“ｆｏｒ”と一致することが検出され
たときを説明したものである。図１６に示すように、圧
縮のステップに於いて入力データ中の“ｆｏｒ”という
データ列と、辞書のエントリ番号１０１のエントリに登
録されているデータ列“ｆｏｒ”との一致を検出する
と、圧縮データとして“１・１０１”を出力する。最初
の“１”は、圧縮が行われたことを示す１ビットの識別
子であり、それに続く“１０１”は辞書のエントリ番号
である。

【００１１】その後、辞書への新規データ列の登録を行
う。圧縮したデータ列“ｆｏｒ”の左端に、その１回前
に圧縮処理の対象としたデータ列“ｐｅｒ”を結合して
辞書登録データ“ｐｅｒｆｏｒ”を作成し、作成した辞
書登録データ“ｐｅｒｆｏｒ”を辞書に登録する。図１
６の例では、辞書登録データ“ｐｅｒｆｏｒ”は、辞書
のエントリ番号１０５のエントリに登録されている。こ
こで登録されたデータ列“ｐｅｒｆｏｒ”は、引き続き
実行される圧縮のステップで使用される。勿論、以後、
“ｐｅｒｆｏｒ”というデータ列が出現しなければ、圧
縮動作には使用されず、辞書に登録されたままとなる。
このような動作を繰り返して、入力データ列“ｐｅｒｆ
ｏｒｍａｎｃｅｐｅｒｆｏｒｍａｎｃｅ”を圧縮すると
共に、辞書に新たなデータ列を登録する。入力データ列
“ｐｅｒｆｏｒｍａｎｃｅｐｅｒｆｏｒｍａｎｃｅ”に
対する圧縮動作，辞書登録動作が終了した時点に於ける
圧縮データ，辞書の内容は、図１７に示すものとなる。

【００１２】

【発明が解決しようとする課題】上述した従来の技術
は、入力データ列と辞書に登録されているデータ列とを
比較し、最も一致長が長いデータ列が登録されている辞
書中のエントリの番号を圧縮データとして取得した後、
入力データ列中の今回圧縮対象としたデータ列にその次
の１バイト分のデータを結合することにより、或いは今
回圧縮対象としたデータ列の左端に前回圧縮対象とした
データ列を結合することにより、辞書登録データ列を作
成し、作成した辞書登録データを辞書に登録するように
しているため、一度も圧縮処理に使用されないデータ列
が辞書に登録される可能性がある。このような圧縮処理
に使用されない無駄なデータ列が辞書に登録されると、
辞書が早期に満杯となり、圧縮に有効になるデータ列を
辞書に登録できなくなってしまうという事態が発生しや
すくなってしまう。

【００１３】また、辞書登録データを、（前回の圧縮対
象データ列）＋（今回の圧縮対象データ列）、或いは
（今回の圧縮対象データ列）＋（１バイトデータ）とし
ているため、辞書作成初期段階では、辞書には長いデー
タ列が登録されず、好ましい圧縮率（＝圧縮データ長／
入力データ列長）を得らないという問題が生じる。

【００１４】そこで、本発明の目的は、圧縮処理に１回
も使用されないデータが辞書に登録されないようにする
ことができ、且つ、辞書作成初期段階に於いて長いデー
タ列を登録することにより、圧縮率を高めることができ
るデータ圧縮方法を提供することにある。

【００１５】

【課題を解決するための手段】本発明は、圧縮処理に１
回も使用されないデータが辞書に登録されないようにす
るため、入力データ列中の前回辞書に登録したデータ列
の次のデータをスタートポジションとするデータ列の
内、前記辞書に登録済みのデータ列との一致部分の長さ
が最も長い最長一致データ列をサーチし、サーチした最
長一致データ列とそれに続く予め定められた規則によっ
て定められるデータとを結合したデータ列を辞書登録デ
ータとする辞書登録データ作成処理を行い、前記辞書登
録データ作成処理によって辞書登録データが作成された
後、その作成された辞書登録データを前記辞書に登録す
る登録処理を行い、前記登録処理によって辞書登録デー
タが前記辞書に登録された後、その辞書登録データを作
成する際のスタートポジションとなった前記入力データ
列中のデータをスタートポジションにして前記辞書を使
用した圧縮処理を行う、という一連の処理を入力データ
列の先頭部分から末尾部分に向かって行う。

【００１６】また、本発明は、辞書の成長速度を速く
し、データの圧縮率を向上させるため、前記辞書登録デ
ータ作成処理に於いて辞書登録データを作成する際、前
記最長一致データ列の長さが所定の長さ未満の場合は、
前記スタートポジションとしたデータから前記所定の長
さ分のデータを辞書登録データとし、前記最長一致デー
タ列の長さが前記所定の長さと等しい場合は、前記最長
一致データ列と次の１バイト分のデータとを結合したデ
ータを辞書登録データとし、前記最長一致データ列の長
さが前記所定の長さよりも長い場合は、前記最長一致デ
ータ列と、その後に連続して存在する、前記辞書に登録
済みのデータ列との一致長が前記所定の長さよりも長い
全てのデータ列と、その直後に存在する所定長のデータ
とを結合したデータを辞書登録データとする。

【００１７】

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。

【００１８】図１は本発明のデータ圧縮方法を実施する
データ圧縮装置１の構成例を示すブロック図である。

【００１９】データ圧縮装置１は、辞書登録データ作成
手段１０と、登録手段２０と、圧縮手段３０と、辞書４
０と、制御手段５０と、予測停止フラグ６０と、辞書入
力スタック７０と、圧縮データファイル８０とを備えて
いる。

【００２０】辞書登録データ作成手段１０は、辞書４０
に登録する辞書登録データを作成する機能を有するもの
であり、予測スタートポインタ１１と、予測エンドポイ
ンタ１２と、第１登録候補データレジスタ１３と、第２
登録候補データレジスタ１４と、予測継続フラグ１５
と、予測ヒットカウンタ１６と、予測フラグ１７と、処
理部１８とから構成されている。

【００２１】登録手段２０は、辞書登録データ作成手段
１０が作成した辞書登録データを辞書４０に登録する機
能を有し、辞書登録用エントリ番号レジスタ２１と、処
理部２２とから構成されている。

【００２２】圧縮手段３０は、入力データ列９０を圧縮
した圧縮データを作成する機能を有し、圧縮スタートポ
インタ３１と、圧縮エンドポインタ３２と、辞書ヒット
フラグ３３と、辞書エントリ番号レジスタ３４と、処理
部３５とから構成されている。

【００２３】辞書４０は、エントリ番号部４１と、デー
タエントリ部４２とから構成されている。

【００２４】制御手段５０は、辞書登録データ作成手段
１０，登録手段２０，圧縮手段３０の動作を制御する機
能を有する。

【００２５】次に、本実施例の動作について簡単に説明
する。

【００２６】圧縮対象とする入力データ列９０が入力さ
れると、制御手段５０が辞書登録データ作成手段１０を
起動する。

【００２７】これにより、辞書登録データ作成手段１０
は、入力データ列９０中の前回辞書４０に登録したデー
タ列の次のデータをスタートポジションとするデータ列
の内、辞書４０に登録済みのデータ列との一致部分が最
も長い最長一致データ列をサーチする。尚、最初の起動
時には、辞書登録データ作成手段１０は、入力データ列
９０中の最初のデータをスタートポジションとする。

【００２８】そして、サーチした最長一致データ列の長
さが２バイト未満の場合は、スタートポジションにした
データから２バイト分のデータを辞書登録データとして
辞書入力スタック７０に格納し、その後、制御手段５０
に対して終了通知を行う。

【００２９】また、サーチした最長一致データ列の長さ
が２バイトの場合は、最長一致データ列とその次の１バ
イト分のデータとを結合したデータを辞書登録データと
して辞書入力スタック７０に格納し、その後、制御手段
５０に対して終了通知を行う。

【００３０】また、サーチした最長一致データ列の長さ
が３バイト以上の場合は、サーチした最長一致データ列
と、その後に連続して存在する、辞書４０に登録済みの
データ列との一致長が３バイト以上の全てのデータ列
と、その直後に存在する２バイト或いは３バイト分のデ
ータとを結合したデータを辞書登録データとして辞書入
力スタック７０に格納し、その後、制御手段５０に対し
て終了通知を行う。但し、一致長が３バイト以上のデー
タ列の数が、予め設定された数以上になる場合は、最長
一致データ列と、その後に連続して存在する一致長が３
バイト以上のデータ列とを結合したデータを辞書登録デ
ータとする。

【００３１】制御手段５０は、辞書登録データ作成手段
１０から終了通知を受けると、登録手段２０を起動す
る。

【００３２】これにより、登録手段２０は、辞書入力ス
タック７０に格納されている辞書登録データを辞書４０
に登録し、その後、制御手段５０に対して終了通知を行
う。

【００３３】制御手段５０は、登録手段２０から終了通
知を受けると、圧縮手段３０を起動する。

【００３４】これにより、圧縮手段３０は、辞書登録デ
ータ作成手段１０がスタートポジションとした入力デー
タ列中のデータをスタートポジションにして辞書４０を
使用した圧縮処理を行い、その後、制御手段５０に終了
通知を行う。

【００３５】終了通知を受けると、制御手段５０は、辞
書登録データ作成手段１０を再度起動する。以下、入力
データ列９０に未処理のデータがなくなるまで、前述し
たと同様の処理が繰り返し行われる。

【００３６】今、例えば、辞書４０にデータが全く登録
されていない状態に於いて、圧縮処理の対象とする入力
データ列９０として図２に示す“ｐｅｒｆｏｒｍａｎｃ
ｅ□ｐｅｒｆｏｒｍａｎｃｅ□ｐｅｒｆｏｒｍａｎｃｅ
□ｐｅｒｆｏｒｍａｎｃｅ□ｐｅｒｆｏｒｍａｎｃｅ
□”が入力されたとする。尚、□は、空白を示してい
る。

【００３７】入力データ列９０が入力されると、制御手
段５０が、辞書登録データ作成手段１０を起動する。

【００３８】これにより、辞書登録データ作成手段１０
は、入力データ列９０中の最初のデータ“ｐ”をスター
トポジションとするデータ列の内、辞書４０に登録済み
のデータ列との一致部分が最も長い最長一致データ列を
サーチする。

【００３９】この例の場合、辞書４０には、データが全
く登録されていないので、辞書登録データ作成手段１０
は、スタートポジション「ｐ」から２バイト分のデータ
“ｐｅ”を辞書登録データとして辞書入力スタック７０
に格納し、制御手段５０に対して終了通知を行う。

【００４０】辞書登録データ作成手段１０からの終了通
知を受けると、制御手段５０は、登録手段２０を起動す
る。これにより、登録手段２０は、辞書入力スタック７
０に格納されている辞書登録データ“ｐｅ”を図３に示
すように、辞書４０のエントリ番号０のエントリに登録
し、その後、制御手段５０に終了通知を行う。

【００４１】登録手段２０からの終了通知を受けると、
制御手段５０は、圧縮手段３０を起動する。これによ
り、圧縮手段３０は、辞書４０をサーチして、入力デー
タ列９０中のデータ“ｐ”をスタートポジションとする
データ列と最も一致部分が長い登録データを探し出し、
探し出した登録データが格納されているエントリ番号及
び圧縮データであることを示す識別子“１”から構成さ
れる圧縮データを圧縮データファイル８０に格納する。
この例の場合は、一致部分が最も長い登録データとし
て、エントリ番号０のエントリに登録されているデータ
列“ｐｅ”が探し出されるので、図２に示すように、デ
ータ列“ｐｅ”が圧縮データ“１・０”に変換される。

【００４２】“ｐｅｒｆｏｒｍａｎｃｅ”の第１回目の
出現時には、前述したと同様の処理が繰り返し行われ、
図３に示すように、辞書４０のエントリ番号「０」〜
「５」のエントリに、“ｐｅ”，“ｒｆ”，“ｏｒ”，
“ｍａ”，“ｎｃ”，“ｅ□”が登録され、図２に示す
ように、圧縮データ“１・０”，“１・１”，“１・
２”，“１・３”，“１・４”，“１・５”が出力され
る。

【００４３】“ｐｅｒｆｏｒｍａｎｃｅ”の第２回目の
出現時には、辞書登録データ作成手段１０は、辞書４０
に登録済みのデータ列との一致部分が最も長い最長一致
データ列として“ｐｅ”を探し出し、探し出した最長一
致データ列“ｐｅ”とその次の１バイト分のデータ
“ｒ”とを結合したデータ“ｐｅｒ”を辞書登録データ
として辞書入力スタック７０に格納する。

【００４４】登録手段２０は、辞書登録データ作成手段
１０が辞書入力スタック７０に格納した辞書登録データ
“ｐｅｒ”を、図３に示すように、辞書４０のエントリ
番号「６」のエントリに格納し、圧縮手段３０は、図２
に示すように、入力データ列９０中の“ｐｅｒ”を圧縮
データ“１・６”に変換して圧縮データファイル８０に
出力する。“ｐｅｒｆｏｒｍａｎｃｅ”の第２回目，第
３回目の出力時には、前述したと同様の処理が行われ、
図３に示すように、辞書４０のエントリ番号「６」〜
「１５」のエントリに、“ｐｅｒ”〜“ｃｅ□”が登録
され、図２に示すように、圧縮データ“１・６”〜“１
・１５”が出力される。

【００４５】“ｐｅｒｆｏｒｍａｎｃｅ”の第４回目の
出現時には、辞書登録データ作成手段１０は、辞書４０
に登録済みのデータ列との一致部分が最も長い最長一致
データ列として“ｐｅｒ”を探し出す。この場合、探し
出した最長一致データ列“ｐｅｒ”の長さが３バイト以
上であるので、辞書登録データ作成手段１０は探し出し
た最長一致データ列“ｐｅｒ”と、その後に連続して存
在する、辞書４０に登録済みのデータ列との一致長が３
バイト以上の予め定められた個数までのデータ列“ｆｏ
ｒ”，“ｍａｎ”，“ｃｅ□”とを結合したデータ“ｐ
ｅｒｆｏｒｍａｎｃｅ□”を辞書登録データとして辞書
入力スタック７０に格納する。

【００４６】登録手段２０は、図３に示すように、辞書
入力スタック７０に格納された辞書登録データ“ｐｅｒ
ｆｏｒｍａｎｃｅ□”を辞書４０のエントリ番号１６の
エントリに格納し、圧縮手段３０は、図３に示すよう
に、“ｐｅｒｆｏｒｍａｎｃｅ□”を圧縮データ“１・
１６”に変換して圧縮手段３０に格納する。

【００４７】制御手段５０は、入力データ列９０に対す
る圧縮処理が完了すると、圧縮データファイル８０の内
容及び辞書４０の内容を受信側に転送する。

【００４８】次に、本発明の実施例の動作を詳細に説明
する。実施例の詳細な動作を理解するためには、データ
圧縮装置１内に設けられているフラグ，ポインタ，レジ
スタ類の機能を理解することが必要になるので、先ず、
フラグ，ポインタ，レジスタ類について説明する。

【００４９】予測スタートポインタ１１：辞書４０への
データ列登録に関し、入力データ列のスタートポジショ
ンを指定する。尚、初期値は「０」であり、長さは、入
力データ列のバイト長を表示可能なビット数である。

【００５０】予測エンドポインタ１２：辞書４０へのデ
ータ列登録に関し、入力データ列のエンドポジションを
指定する。尚、初期値は「０」であり、長さは、入力デ
ータ列のバイト長を表示可能なビット数である。

【００５１】第１登録候補データレジスタ１３：予測ス
タートポインタ１１と予測エンドポインタ１２とで指定
されるデータ列を一時的に保持しておく。予測フラグ１
７がＯＦＦにセットされ、且つ予測継続フラグ１５がＯ
ＦＦにセットされると、第１登録候補データレジスタ１
３の内容が辞書入力スタック７０に格納される。

【００５２】第２登録候補データレジスタ１４：予測フ
ラグ１７がＯＮになった時、第１登録候補データレジス
タ１３の内容が格納される。予測フラグ１７がＯＦＦに
セットされ、且つ予測継続フラグ１５がＯＮにセットさ
れた時、第２登録候補データレジスタ１４の内容が辞書
入力スタック７０へ格納される。

【００５３】予測フラグ１７：辞書４０をサーチするこ
とにより、予測スタートポインタ１１と予測エンドポイ
ンタ１２とによって指定されるデータ列と一致するデー
タ列が辞書４０中に存在することが検出された場合はＯ
Ｎにセットされ、検出できなかった場合はＯＦＦにセッ
トされる。

【００５４】予測継続フラグ１５：予測フラグ１７がＯ
Ｎの状態の時に、辞書４０をサーチすることにより、予
測スタートポインタ１１と予測エンドポインタ１２とに
よって指定されるデータ列と一致するデータ列が辞書４
０中に存在することが検出された場合はＯＮにセットさ
れ、検出できなかった場合はＯＦＦにセットされる。

【００５５】予測ヒットカウンタ１６：初期値が「０」
で、予測フラグ１７がＯＦＦの時に予測継続フラグ１５
がＯＮになった時、“＋１”され、辞書登録データ作成
手段１０の終了時、再び「０」にリセットされる。予測
ヒットカウンタ１６の値が或る一定値を越えると、辞書
登録データ作成手段１０は、終了する。

【００５６】辞書入力スタック７０：第１登録候補デー
タレジスタ１３または第２登録候補データレジスタ１４
の内容がロードされ、辞書入力スタック７０の内容が辞
書４０に登録される。予測継続フラグ１５がＯＮにセッ
トされていると、第２登録候補データレジスタ１４から
のデータを蓄積し続ける。

【００５７】辞書登録用エントリ番号レジスタ２１：辞
書４０にデータ列を登録する際のエントリ番号を示す。

【００５８】圧縮スタートポインタ３１：圧縮手段３０
の動作時、入力データ列のスタートポジションを指定す
る。尚、初期値は「０」である。

【００５９】圧縮エンドポインタ３２：圧縮手段３０の
動作時、入力データ列のエンドポジションを指定する。
尚、初期値は「０」である。

【００６０】予測停止フラグ６０：初期状態はＯＦＦ
で、辞書４０に未使用のデータエントリ部４２が存在し
なくなった時、ＯＮにセットされる。

【００６１】辞書ヒットフラグ３３：辞書４０をサーチ
することにより、圧縮スタートポインタ３１と圧縮エン
ドポインタ３２とによって指定されるデータ列と同一の
データ列が辞書４０中に存在することが検出された場合
はＯＮにセットされ、検出できなかった場合はＯＦＦに
セットされる。

【００６２】辞書エントリ番号レジスタ３４：圧縮スタ
ートポインタ３１と圧縮エンドポインタ３２とによって
指定されたデータ列と一致するデータ列が登録されてい
る辞書４０のエントリ番号がセットされる。

【００６３】図４は制御手段５０の処理例を示す流れ
図、図５は辞書登録データ作成手段１０内の処理部１８
の処理例を示す流れ図、図６は登録手段２０内の処理部
２２の処理例を示す流れ図、図７は圧縮手段３０内の処
理部３５の処理例を示す流れ図であり、以下各図を参照
して実施例の詳細な動作を説明する。

【００６４】制御手段５０は、入力データ列９０が入力
されると、予測スタートポインタ１１，予測エンドポイ
ンタ１２，予測ヒットカウンタ１６，圧縮スタートポイ
ンタ３１，圧縮エンドポインタ３２に「０」をセット
し、予測継続フラグ１５，予測フラグ１７，辞書ヒット
フラグ３３，予測停止フラグ６０をＯＦＦにする（Ｓ
１）。

【００６５】その後、制御手段５０は、辞書登録データ
作成手段１０を起動する（Ｓ３）。

【００６６】辞書登録データ作成手段１０は、起動され
ると、先ず、図５のＳ２１〜Ｓ２３から構成される最短
一致長検出のステップＡを実行する。

【００６７】最短一致長検出のステップＡでは、入力デ
ータ列９０中の予測スタートポインタ１１と予測エンド
ポインタ１２によって指定される２バイト分のデータ列
を第１登録候補データレジスタ１３に格納し（Ｓ２
１）、次いで、辞書４０をサーチすることにより上記２
バイト分のデータ列と一致するデータ列が辞書４０に登
録済みであるか否かを調べ（Ｓ２２）、登録済みである
場合は、予測フラグ１７をＯＮとし、登録されていない
場合は予測フラグ１７をＯＦＦにする（Ｓ２３）。

【００６８】その後、予測フラグ１７に基づいて上記し
た２バイト分のデータ列が辞書４０に登録されていない
と判断した場合（Ｓ２４がＮＯ）は、Ｓ２５〜Ｓ２７か
ら構成される予測終了のステップＢを実行し、登録され
ていると判断した場合（Ｓ２４がＹＥＳ）は、Ｓ２９〜
Ｓ３２から構成される最長一致長検出のステップＣを実
行する。

【００６９】予測終了のステップＢでは、先ず、第１登
録候補データレジスタ１３に格納されている２バイト分
のデータ列を辞書入力スタック７０に格納し（Ｓ２
５）、次いで、予測スタートポインタ１１の内容を、今
回のエンドポジションとしたデータの次のデータを示す
ものにすると共に、予測エンドポインタ１２の内容を圧
縮エンドポインタ３２にロードする（Ｓ２６）。その
後、予測継続フラグ１５をＯＦＦ、予測ヒットカウンタ
１６を「０」にし（Ｓ２７）、更に、制御手段５０に対
して終了通知を行う（Ｓ２８）。

【００７０】また、最長一致長検出のステップＣでは、
先ず、第１登録候補データレジスタ１３に格納されてい
るデータ列を第２登録候補データレジスタ１４に格納し
（Ｓ２９）、次いで、最短一致長検出のステップＡで一
致を検出した２バイトのデータ列に、その次の１バイト
分のデータを結合した３バイト分のデータを第１登録候
補データレジスタ１３に格納する（Ｓ３０）。その後、
辞書４０をサーチすることにより、上記した３バイト分
のデータ列と一致するデータ列が既に辞書４０に登録済
みであるか否かを調べ（Ｓ３１）、登録済みである場合
は、予測フラグ１７をＯＮとし、登録されていない場合
は予測フラグ１７をＯＦＦにする（Ｓ３２）。

【００７１】その後、予測フラグ１７に基づいて上記し
た３バイト分のデータ列が辞書４０に登録されていない
と判断した場合は（Ｓ３３がＮＯ）、前述した予測終了
のステップＢを実行し、登録されていると判断した場合
は（Ｓ３３がＹＥＳ）は、Ｓ３５を含む最長一致長検出
繰り返しのステップＤを実行する。

【００７２】最長一致長検出繰り返しのステップＤで
は、予測継続フラグ１５をＯＮにした後（Ｓ３５）、前
記した最長一致長検出のステップＣを実行することによ
り、上記した３バイトのデータ列とその次の１バイト分
のデータとを結合した４バイト分のデータ列が既に辞書
４０に登録されているか否かを調べる。このように、一
致が検出されなくなるまで、１バイトずつ入力データ列
が追加，サーチされ、辞書４０に登録済みのデータ列の
中で最も一致長が長い最長一致データ列が検出される。

【００７３】最長一致長検出繰り返しのステップＤで最
長一致データ列を検出すると（Ｓ３３がＮＯ，Ｓ３４が
ＹＥＳ）、Ｓ３６〜Ｓ４０を含む予測継続のステップＥ
を実行する。

【００７４】予測継続のステップＥでは、第２登録候補
データレジスタ１４に格納されている最長一致データ列
を辞書入力スタック７０に格納し（Ｓ３６）、次いで最
長一致長検出繰り返しのステップＤで検出された最長一
致データ列の次のデータをスタートポジションとし（Ｓ
３８）、更に、予測継続フラグ１５をＯＦＦ，予測ヒッ
トカウンタ１６の内容を＋１する（Ｓ３９，Ｓ４０）。
その後、最長一致長検出繰り返しのステップＤで検出さ
れた最長一致データ列の次の２バイト分のデータ列に対
して最短一致長検出のステップＡを実行し、一致が検出
された場合は先と同様に最長一致長検出のステップＣを
実行する。

【００７５】そして、最短一致長検出のステップＡ或い
は最長一致長検出のステップＣのサーチ処理Ｓ２２，Ｓ
２３に於いて、処理対象とするデータ列と一致するデー
タ列を検出できなかった場合は、予測継続のステップＥ
は終了し、前述した予測終了のステップＢが実行され
る。また、予測継続のステップＥのＳ３７に於いて、予
測ヒットカウンタ１６のカウント値がＮ（本実施例では
Ｎ＝３とする）の場合は、Ｓ４１，Ｓ４２から構成され
る予測強制終了のステップＦが実行される。

【００７６】予測強制終了のステップＦでは、予測エン
ドポインタ１２の内容を予測スタートポインタ１１にロ
ードし（Ｓ４１）、予測継続フラグ１５，予測ヒットカ
ウンタ１６にそれぞれ「ＯＦＦ」，「０」をセットする
（Ｓ４２）。予測強制終了のステップＦの終了後、Ｓ２
８の処理が行われる。

【００７７】制御手段５０は、辞書登録データ作成手段
１０からの終了通知を受け取ると（図４，Ｓ４）、登録
手段２０を起動する（Ｓ５）。

【００７８】登録手段２０は起動されると、図６の流れ
図に示すように、辞書入力スタック７０に格納されてい
る辞書登録データが既に辞書４０に登録されているかを
サーチし（Ｓ５１）、登録されている場合（Ｓ５２がＹ
ＥＳ）は、制御手段５０に対して終了通知を行う（Ｓ５
７）。また、登録されていない場合（Ｓ５２がＮＯ）
は、辞書入力スタック７０に格納されている辞書登録デ
ータを、辞書登録用エントリ番号レジスタ２１の内容に
よって示される辞書４０中のエントリに登録する（Ｓ５
３）。その後、辞書登録用エントリ番号レジスタ２１の
内容を＋１し（Ｓ５４）、辞書登録用エントリ番号レジ
スタ２１の内容が辞書４０の最大エントリ数を越えてい
るか否かを調べる（Ｓ５５）。そして、越えていない場
合は制御手段５０に対して終了通知を行い（Ｓ５７）、
越えている場合は予測停止フラグ６０をＯＮにした後
（Ｓ５６）、制御手段５０に対して終了通知を行う（Ｓ
５７）。

【００７９】制御手段５０は、登録手段２０からの終了
通知を受け取ると（図４，Ｓ６）、圧縮手段３０を起動
する（Ｓ７）。

【００８０】圧縮手段３０は、制御手段５０から起動さ
れると、図７の流れ図に示すように、予測停止フラグ６
０がＯＮになっているか否かを調べる（Ｓ６１）。

【００８１】そして、予測停止フラグ６０がＯＦＦにな
っている場合は、Ｓ６２〜Ｓ６６から構成される辞書登
録を伴う圧縮のステップＧを実行する。

【００８２】辞書登録を伴う圧縮のステップＧに於いて
は、先ず、圧縮スタートポインタ３１と圧縮エンドポイ
ンタ３２とによって示される入力データ列９０中のデー
タ列と一致するデータ列が格納されている辞書４０のエ
ントリを求め、そのエントリのエントリ番号を辞書エン
トリ番号レジスタ３４にセットする（Ｓ６２〜Ｓ６
４）。ここで、予測停止フラグ６０がＯＦＦの場合は、
辞書登録データ作成手段１０，登録手段２０の処理が実
行されているので、圧縮スタートポインタ３１と圧縮エ
ンドポインタ３２とによって示される入力データ列９０
中のデータ列は、必ず、辞書４０に登録されている。従
って、圧縮スタートポインタ３１と圧縮エンドポインタ
３２とによって指定されているデータ列が格納されてい
るエントリを求めるだけで良く、最長一致データ列を検
出する場合と比較して処理が簡単なものになる。

【００８３】その後、圧縮手段３０は、圧縮データであ
ることを示す１ビットの識別子“１”と辞書エントリ番
号レジスタ３４にセットされているエントリ番号とから
構成される圧縮データを作成して圧縮データファイル８
０に格納し（Ｓ６５）、更に、入力データ列９０中の圧
縮処理のスタートポジションを示す圧縮スタートポイン
タ３１の内容を、圧縮エンドポインタ３２の内容に
「１」を加えたものにする（Ｓ６６）。辞書登録を伴う
圧縮のステップＧの処理が終了すると、圧縮手段３０
は、制御手段５０に対して終了通知を行う（Ｓ６７）。
尚、制御手段５０に対して終了通知を行う際、入力デー
タ列９０中に未処理のデータが存在しない場合は、その
ことも制御手段５０に対して通知する。

【００８４】また、予測停止フラグ６０がＯＮになって
いる場合（Ｓ６１がＹＥＳ）は、Ｓ６８〜Ｓ７１から構
成される登録完了済み辞書使用による圧縮のステップＨ
を実行する。

【００８５】登録完了済み辞書使用による圧縮のステッ
プＨに於いては、圧縮手段３０は、圧縮エンドポインタ
３２の内容を“＋２”した後（Ｓ６８）、辞書４０をサ
ーチし、圧縮スタートポインタ３１と圧縮エンドポイン
タ３２とによって示される入力データ列９０中のデータ
列と一致するデータ列が辞書４０に登録されているか否
かを調べる（Ｓ６９，Ｓ７０）。そして、登録されてい
る場合は、辞書ヒットフラグ３３をＯＮとすると共に一
致の検出された辞書４０のエントリ番号を辞書エントリ
番号レジスタ３４にセットし、登録されていない場合は
辞書ヒットフラグ３３をＯＦＦにする（Ｓ７１）。

【００８６】その後、圧縮手段３０は、圧縮スタートポ
インタ３１と圧縮エンドポインタ３２によって示される
データ列と一致するデータが辞書４０に登録されている
場合（Ｓ７２がＹＥＳ）は、Ｓ７３〜Ｓ７７から構成さ
れる登録完了済み辞書使用による圧縮率向上のステップ
Ｉ及びＳ７３〜Ｓ８０から構成される登録完了済み辞書
使用による圧縮のステップＪを実行し、登録されていな
い場合（Ｓ７２がＮＯ）は、Ｓ８１〜Ｓ８３から構成さ
れる非圧縮のステップＫを実行する。

【００８７】非圧縮のステップＫに於いては、圧縮エン
ドポインタ３２の内容を“−１”した後（Ｓ８１）、圧
縮スタートポインタ３１と圧縮エンドポインタ３２とに
よって指定される入力データ列９０中のデータ列の左端
に非圧縮を示す１バイトの識別子“０”を付加した圧縮
データを作成し、作成した圧縮データを圧縮データファ
イル８０に格納する（Ｓ８２）。その後、圧縮手段３０
は、圧縮スタートポインタ３１の内容を圧縮エンドポイ
ンタ３２の内容とし（Ｓ８３）、Ｓ６７の処理を行う。

【００８８】また、登録完了済み辞書使用による圧縮率
向上のステップＩ，登録完了済み辞書使用による圧縮の
ステップＪに於いては、圧縮スタートポインタ３１と圧
縮エンドポインタ３２とによって指定される入力データ
列９０中のデータ列に対し、辞書４０に登録されている
データ列の中で最も一致長の長いデータ列が登録されて
いるエントリを検出し（Ｓ７３〜Ｓ７８）、そのエント
リのエントリ番号の左端に圧縮を示す１ビットの識別子
“１”を接合した圧縮データを圧縮データファイル８０
に格納する（Ｓ７９）。

【００８９】制御手段５０は、圧縮手段３０からの終了
通知を受けると（図４，Ｓ８でＹＥＳ）、再び予測停止
フラグ６０がＯＮになっているか否かを調べ（図４，Ｓ
２）、ＯＦＦになっている場合、即ち辞書４０に空きエ
ントリが存在する場合は辞書登録データ作成手段１０を
起動し、ＯＮになっている場合、即ち辞書４０に空きエ
ントリが存在しない場合は、圧縮手段３０を起動する。
また、制御手段５０は、圧縮手段３０からの終了通知を
受けた時に未処理のデータ列が残っていない場合は（Ｓ
９でＹＥＳ）、圧縮データファイル８０中に格納された
圧縮データ及び辞書４０の内容を受信側に送信する（Ｓ
１０）。

【００９０】次に、以上説明した実施例をより理解しや
すくするために、先に説明した図２に示す入力データ列
の場合について各図を用いてより詳細に説明する。

【００９１】辞書登録データ作成手段１０は、制御手段
５０から起動されると、入力データ列９０の最初の２バ
イト“ｐｅ”を第１登録候補データレジスタ１３に格納
した後、上記２バイト“ｐｅ”が辞書４０に既に登録さ
れているか否かを調べる（図５，Ｓ２１，Ｓ２２）。

【００９２】この例の場合、辞書４０にはデータが全く
登録されていないので、辞書登録データ作成手段１０
は、第１登録候補データレジスタ１３に格納されている
“ｐｅ”を辞書入力スタック７０に格納する（Ｓ２
５）。

【００９３】その後、制御手段５０によって登録手段２
０が起動されると、辞書入力スタック７０に格納されて
いる辞書登録データ“ｐｅ”が図３に示すように、辞書
４０のエントリ番号「０」のエントリに登録される（Ｓ
５１）。

【００９４】その後、制御手段５０によって圧縮手段３
０が起動されると、入力データ列９０の最初の２バイト
のデータが、図２に示すように、圧縮データ“１・０”
に変換され、圧縮データファイル８０に登録される（図
７，Ｓ６２〜Ｓ６５）。

【００９５】“ｐｅｒｆｏｒｍａｎｃｅ”の１回目の出
現時には、前述したと同様の処理が繰り返し行われ、図
３に示すように、辞書４０のエントリ番号「０」〜
「５」のエントリに、“ｐｅ”，“ｒｆ”，“ｏｒ”，
“ｍａ”，“ｎｃ”，“ｅ□”が登録され、図２に示す
ように、圧縮データ“１・０”，“１・１”，“１・
２”，“１・３”，“１・４”，“１・５”が出力され
る。

【００９６】“ｐｅｒｆｏｒｍａｎｃｅ”の第２回目の
出現時には、辞書登録データ作成手段１０は、前回辞書
４０に登録したデータ列“ｅ□”の次の２バイト分のデ
ータ列“ｐｅ”を第１登録候補データレジスタ１３に格
納した後、上記２データ列“ｐｅ”が辞書４０に登録さ
れているかを調べる（図５，Ｓ２１，Ｓ２２）。

【００９７】この例の場合、データ列“ｐｅ”は、辞書
４０のエントリ番号「０」のエントリに登録されている
ので、辞書登録データ作成手段１０は、第１登録候補デ
ータレジスタ１３に格納されているデータ列“ｐｅ”を
第２登録候補データレジスタ１４に格納した後、上記デ
ータ列“ｐｅ”に次の１バイト“ｒ”を結合した３バイ
ト分のデータ列“ｐｅｒ”を第１登録候補データレジス
タ１３に格納し、更に、上記３バイト分のデータ列“ｐ
ｅｒ”が辞書４０に登録されているか否かを調べる（Ｓ
２９〜Ｓ３１）。

【００９８】この例の場合、データ列“ｐｅｒ”は、辞
書４０に登録されていないので、辞書登録データ作成手
段１０は、第１登録候補データレジスタ１３に格納され
ている３バイト分のデータ列“ｐｅｒ”を辞書入力スタ
ック７０に格納する（Ｓ２５）。

【００９９】その後、登録手段２０が制御手段５０によ
って起動されると、辞書入力スタック７０に格納されて
いる３バイト分のデータ列“ｐｅｒ”が、図３に示すよ
うに、辞書４０のエントリ番号「６」のエントリに登録
される（図６，Ｓ５１）。

【０１００】その後、制御手段５０によって圧縮手段３
０が起動されると、図２に示すように、データ列“ｐｅ
ｒ”が圧縮データ“１・６”に変換されて、圧縮データ
ファイル８０に出力される（図７，Ｓ６２〜Ｓ６６）。

【０１０１】“ｐｅｒｆｏｒｍａｎｃｅ”の第２回目，
第３回目の出現時には、前述したと同様の処理が繰り返
し行われ、図３に示すように、辞書４０のエントリ番号
「６」〜「１５」のエントリに“ｐｅｒ”〜“ｃｅ□”
が登録され、図２に示すように、圧縮データ“１・６”
〜“１・１５”が出力される。

【０１０２】“ｐｅｒｆｏｒｍａｎｃｅ”の第４回目の
出現時には、辞書登録データ作成手段１０は、辞書４０
に前回登録したデータ列“ｃｅ□”の次の２バイト分の
データ列“ｐｅ”を第１登録候補データレジスタ１３に
格納した後、上記２バイト分のデータ列“ｐｅ”が辞書
４０に登録されているか否かを調べる（図５，Ｓ２１，
Ｓ２２）。

【０１０３】この例の場合、上記したデータ列“ｐｅ”
は、辞書４０のエントリ番号「０」のエントリに登録さ
れているので、辞書登録データ作成手段１０は、第１登
録候補データレジスタ１３に格納されているデータ列
“ｐｅ”を第２登録候補データレジスタ１４に格納した
後、上記データ列“ｐｅ”に次の１バイト“ｒ”を結合
した３バイト分のデータ列“ｐｅｒ”を第１登録候補デ
ータレジスタ１３に格納し、更に、上記３バイト分のデ
ータ列“ｐｅｒ”が辞書４０に登録されているか否かを
調べる（Ｓ２９〜Ｓ３１）。

【０１０４】この例の場合、データ列“ｐｅｒ”は、辞
書４０のエントリ番号「６」のエントリに登録されてい
るので、辞書登録データ作成手段１０は、予測継続フラ
グをＯＮにする（Ｓ３２，Ｓ３３，Ｓ３５）。その後、
第１登録候補データレジスタ１３に格納されているデー
タ列“ｐｅｒ”を第２登録候補データレジスタ１４に格
納した後、上記データ列“ｐｅｒ”に次の１バイト
“ｆ”を結合した４バイト分のデータ列“ｐｅｒｆ”を
第１登録候補データレジスタ１３に格納し、更に、上記
４バイト分のデータ列“ｐｅｒｆ”が辞書４０に登録さ
れているか否かを調べる（Ｓ２９〜Ｓ３１）。

【０１０５】この例の場合、上記したデータ列“ｐｅｒ
ｆ”は、辞書４０に登録されておらず予測継続フラグは
ＯＮになっているので、辞書登録データ作成手段１０
は、第２登録候補データレジスタ１４に格納されている
データ列“ｐｅｒ”を辞書入力スタック７０に格納し
（Ｓ３６）、その後、上記データ列“ｐｅｒ”の次の２
バイト分のデータ列“ｆｏ”を第１登録候補データレジ
スタ１３に格納し、更に、上記データ列“ｆｏ”が辞書
４０に登録されているか否かを調べる（Ｓ２１，Ｓ２
２）。

【０１０６】この例の場合、データ列“ｆｏ”は、辞書
４０のエントリ番号「７」のエントリに登録されている
ので、辞書登録データ作成手段１０は、前述したと同様
に、第１登録候補データレジスタ１３に格納されている
データ列“ｆｏ”を第２登録候補データレジスタ１４に
格納した後、上記データ列“ｆｏ”に次の１バイト分の
データ“ｒ”を付加した３バイト分のデータ列“ｆｏ
ｒ”を第１登録候補データレジスタ１３に登録し、更
に、上記３バイト分のデータ列“ｆｏｒ”が辞書４０に
登録されているか否かを調べる（Ｓ２９〜Ｓ３１）。

【０１０７】この例の場合、データ列“ｆｏｒ”は、辞
書４０のエントリ番号１３のエントリに登録されている
ので、辞書登録データ作成手段１０は、データ列“ｆｏ
ｒ”に次の１バイト“ｍ”を付加した４バイト分のデー
タ“ｆｏｒｍ”に対して前述したと同様の処理を行う。
この例の場合、“ｆｏｒｍ”は、辞書４０に登録されて
いないので、辞書登録データ作成手段１０は、第２登録
候補データレジスタ１４に登録されているデータ列“ｆ
ｏｒ”を辞書入力スタック７０に格納する（Ｓ３６）。
この時点に於ける辞書入力スタック７０の内容は、前回
格納したデータ列“ｐｅｒ”に今回格納した“ｆｏｒ”
を追加したもの、即ち“ｐｅｒｆｏｒ”となる。

【０１０８】以下、予測ヒットカウンタ１６の値が
「３」となり、Ｓ３７がＮＯとなるまで、前述したと同
様の処理が行われ、辞書入力スタック７０に“ｐｅｒｆ
ｏｒｍａｎｃｅ□”が格納される。

【０１０９】その後、制御手段５０によって登録手段２
０が起動されると、図３に示すように、辞書４０のエン
トリ番号「１６」のエントリに、データ列“ｐｅｒｆｏ
ｒｍａｎｃｅ□”が登録される。

【０１１０】更に、その後、制御手段５０によって圧縮
手段３０が起動されると、図２に示すように、入力デー
タ列９０中のデータ列“ｐｅｒｆｏｒｍａｎｃｅ□”が
圧縮データ“１・１６”に変換されて、圧縮データファ
イル８０に出力される。

【０１１１】このように、本実施例では、辞書４０への
最小登録単位を２バイトとし、既に辞書４０に登録済み
のデータ列を組み合わせることにより、より長く、ヒッ
ト率の高いデータ列を辞書４０に登録するようにしてい
る。本実施例のようにすると、ヒット率が高くなるとい
うのは、本実施例に於ける圧縮動作，辞書内容を示す図
２，図３と、従来の技術（米国特許第４８１４７４６号
明細書に記載されている技術）の圧縮動作，辞書内容を
示す図８，図９とを比較することにより明らかである。

【０１１２】図２，図３及び図８，図９はデータ圧縮開
始直後の状態を想定している。入力データ列“ｐｅｒｆ
ｏｒｍａｎｃｅ□ｐｅｒｆｏｒｍａｎｃｅ□ｐｅｒｆｏ
ｒｍａｎｃｅ□ｐｅｒｆｏｒｍａｎｃｅ□ｐｅｒｆｏｒ
ｍａｎｃｅ□”が入力された場合、データ圧縮開始直後
であるので、辞書にはデータ列がほとんど登録されてい
ない。

【０１１３】図８，図９に示す従来の技術の場合は、図
９に示すように、“ｐｅｒｆｏｒｍａｎｃｅ”という入
力データ列が登録されるまでに、２１個の辞書のデータ
エントリ部が必要になる。一方、本実施例の場合は、図
３に示すように、１６個の辞書のデータエントリ部で
“ｐｅｒｆｏｒｍａｎｃｅ”という入力データ列を登録
できる。また、従来の技術に於いて辞書に登録された
“ｒｆｏｒ”，“ｍａｎｃｅ”，“ｏｒｍａｎｃｅ”等
のデータ列は、“ｐｅｒｆｏｒｍａｎｃｅ”というデー
タ列とは異なる別の入力データ列に対するデータ圧縮時
には、ほとんど使用されないと予想される。このよう
に、本実施例によれば、辞書のエントリを無駄に使用す
ることが少なくなる。

【０１１４】更に、この“ｐｅｒｆｏｒｍａｎｃｅ”と
いうデータ列のみに限って圧縮率を概算すると、従来の
技術では次のようになる。長さが１２バイトの“ｐｅｒ
ｆｏｒｍａｎｃｅ□”というデータ列が４回出現した時
の非圧縮データのビット数は、１２×４×８＝３８４ビ
ットとなり、これに対する圧縮データのビット数は、図
８に示すように、圧縮データの個数が２３個で、各圧縮
データは圧縮，非圧縮を示す１ビットの識別子と１バイ
ト分のデータとから構成されるので、２３ビット＋２３
バイト＝２３ビット＋８×２３ビット＝２０７ビットと
なる。従って、圧縮率は、２０７÷３８４≒０．５４と
なる。

【０１１５】これに対して、実施例の場合は、圧縮デー
タのビット数は、図２に示すように、圧縮データの個数
が１７個で、各非圧縮データは圧縮，非圧縮を示す１ビ
ットの識別子と１バイト分のデータとから構成されるの
で、１７ビット＋１７バイト＝１７ビット＋８×１７＝
１５３となる。従って、圧縮率は、１５３÷３８４≒
０．４０となる。このように、本実施例によれば、圧縮
率を従来の技術に比較して優れたものにすることができ
る。

【０１１６】図１０及び図１１は、従来の技術に於いて
データ圧縮が開始されてからある程度時間が経過した時
の辞書内容及び圧縮データを示した図であり、図１２及
び図１３は、実施例に於いてデータ圧縮が開始されてか
らある程度時間が経過した時の辞書内容及び圧縮データ
を示した図である。図１０，図１２に示すように、辞書
には、既に、“ｐｅｒｆｏｒｍａｎｃｅ□”というデー
タ列の部分列である“ｐｅｒ”，“ｆｏｒ”，“ｍａ
ｎ”，“ｃｅ□”が登録されているとする。

【０１１７】従来の技術に於いては、図１０に示すよう
に、“ｐｅｒｆｏｒｍａｎｃｅ□”という入力データ列
を含めて、更に辞書のデータエントリ部が６エントリ必
要になり、“ｐｅｒｆｏｒｍａｎｃｅ□”というデータ
列が２回出現しないと、辞書のデータエントリ部に“ｐ
ｅｒｆｏｒｍａｎｃｅ□”というデータ列が登録されな
い。この場合にも、“ｆｏｒｍａｎ”という使用頻度が
低いと思われるデータ列が辞書のデータエントリ部に余
分に登録されてしまう欠点がみられる。

【０１１８】これに対して、本実施例では、図５に示し
た予測継続のステップＥにより、辞書に登録済みの“ｐ
ｅｒ”，“ｆｏｒ”，“ｍａｎ”，“ｃｅ□”という４
個のデータ列を組み合わせて辞書登録データを作成する
ので、辞書のデータエントリ部に追加されるデータ列
は、“ｐｅｒｆｏｒｍａｎｃｅ□”の１個のみである。
このように、本実施例によれば、辞書のエントリを無駄
に使用することが少なくなる。

【０１１９】更に、この“ｐｅｒｆｏｒｍａｎｃｅ□”
というデータ列のみに限って圧縮率を概算すると、従来
の技術では次のようになる。長さが１２バイトの“ｐｅ
ｒｆｏｒｍａｎｃｅ□”というデータ列が２回出現した
時の非圧縮データのビット数は、１２×２×８＝１９２
ビットとなり、これに対する圧縮データのビット数は、
図１１に示すように、圧縮データの個数が６個で、各圧
縮データは各圧縮データは圧縮，非圧縮を示す１ビット
の識別子と１バイト分のデータとから構成されるので、
６ビット＋８×６ビット＝５４ビットとなる。従って、
圧縮率は、５４÷１９２≒０．２８となる。

【０１２０】これに対して、実施例の場合は、圧縮デー
タのビット数は、図１３に示すように、圧縮データの個
数が２個で、各非圧縮データは圧縮，非圧縮を示す１ビ
ットの識別子と１バイト分のデータとから構成されるの
で、２ビット＋８×２ビット＝１８ビットとなる。従っ
て、圧縮率は、１８÷１９２≒０．０９となる。このよ
うに、本実施例によれば、圧縮率を従来の技術に比較し
て優れたものにすることができる。

【０１２１】

【発明の効果】以上説明したように本発明は、入力デー
タ列中の前回辞書に登録したデータ列の次のデータをス
タートポイントにした辞書登録データ作成処理を行い、
次いで、作成した辞書登録データを辞書に登録する登録
処理を行い、その後、辞書登録データを作成する際のス
タートポイントとなった入力データ列中のデータをスタ
ートポイントにして辞書を使用した圧縮処理を行うもの
であり、入力データ列に対する圧縮処理を実行する前
に、必ず、圧縮対象となるデータ列が辞書に登録される
ので、１回も圧縮処理に使用されない無駄なデータが辞
書に登録されることはない。従って、本発明によれば、
限られたサイズの辞書に、圧縮処理に使用されるデータ
列を数多く登録することが可能になるので、入力データ
列の圧縮効率を高いものにすることができる。

【０１２２】また、本発明は、辞書登録データ作成処理
に於いて、最長一致データ列の長さが予め定められてい
る長さ以上の場合は、その最長一致データ列の後に連続
して存在する辞書に登録済みのデータとの一致長が所定
長以上のデータ列と、その直後に存在する所定長のデー
タとしたので、辞書作成初期段階に於いても比較的長い
データ列を辞書に登録することが可能になるので、圧縮
初期の段階に於いても高い圧縮効率を得ることができ
る。

【図面の簡単な説明】

【図１】本発明のデータ圧縮方法を実施する装置の構成
例を示すブロック図である。

【図２】実施例に於ける圧縮データを示した図である。

【図３】実施例に於ける辞書内容を示した図である。

【図４】制御手段５０の処理例を示す流れ図である。

【図５】辞書登録データ作成手段１０内の処理部１８の
処理例を示す流れ図である。

【図６】登録手段２０内の処理部２２の処理例を示す流
れ図である。

【図７】圧縮手段３０内の処理部３５の処理例を示す流
れ図である。

【図８】従来の技術に於ける圧縮データを示した図であ
る。

【図９】従来の技術に於ける辞書内容を示した図であ
る。

【図１０】従来の技術に於ける圧縮データを示した図で
ある。

【図１１】従来の技術に於ける辞書内容を示した図であ
る。

【図１２】実施例に於ける圧縮データを示した図であ
る。

【図１３】実施例に於ける辞書内容を示した図である。

【図１４】従来の技術に於ける辞書登録動作，圧縮動作
を説明するための図である。

【図１５】従来の技術に於ける辞書登録動作，圧縮動作
を説明するための図である。

【図１６】他の従来の技術に於ける辞書登録動作，圧縮
動作を説明するための図である。

【図１７】上記した他の従来の技術に於ける辞書登録動
作，圧縮動作を説明するための図である。

【符号の説明】

１…データ圧縮装置１０…辞書登録データ作成手段１１…予測スタートポインタ１２…予測エンドポインタ１３…第１登録候補データレジスタ１４…第２登録候補データレジスタ１５…予測継続フラグ１６…予測ヒットカウンタ１７…予測フラグ１８…処理部２０…登録手段２１…辞書登録用エントリ番号レジスタ２２…処理部３０…圧縮手段３１…圧縮スタートポインタ３２…圧縮エンドポインタ３３…辞書ヒットフラグ３４…辞書エントリ番号レジスタ３５…処理部４０…辞書４１…エントリ番号部４２…データエントリ部５０…制御手段６０…予測停止フラグ７０…辞書入力スタック８０…圧縮データファイル

Claims

(57)【特許請求の範囲】

【請求項１】入力データ列中の前回辞書に登録したデ
ータ列の次のデータをスタートポジションとするデータ
列の内、前記辞書に登録済みのデータ列との一致部分の
長さが最も長い最長一致データ列をサーチし、サーチし
た最長一致データ列とそれに続く予め定められた規則に
よって定められるデータとを結合したデータ列を辞書登
録データとする辞書登録データ作成処理を行い、前記辞書登録データ作成処理によって辞書登録データが
作成された後、その作成された辞書登録データを前記辞
書に登録する登録処理を行い、前記登録処理によって辞書登録データが前記辞書に登録
された後、その辞書登録データを作成する際のスタート
ポジションとなった前記入力データ列中のデータをスタ
ートポジションにして前記辞書を使用した圧縮処理を行
う、という一連の処理を入力データ列の先頭部分から末
尾部分に向かって行うことを特徴とするデータ圧縮方
法。
【請求項２】前記辞書登録データ作成処理に於いて辞
書登録データを作成する際、前記最長一致データ列の長さが所定の長さ未満の場合
は、前記スタートポジションとしたデータから前記所定
の長さ分のデータを辞書登録データとし、前記最長一致データ列の長さが前記所定の長さと等しい
場合は、前記最長一致データ列と次の１バイト分のデー
タとを結合したデータを辞書登録データとし、前記最長一致データ列の長さが前記所定の長さよりも長
い場合は、前記最長一致データ列と、その後に連続して
存在する、前記辞書に登録済みのデータ列との一致長が
前記所定の長さよりも長い全てのデータ列と、その直後
に存在する所定長のデータとを結合したデータを辞書登
録データとすることを特徴とする請求項１記載のデータ
圧縮方法。
【請求項３】前記所定の長さは２バイトであることを
特徴とする請求項２記載のデータ圧縮方法。
【請求項４】前記辞書が満杯になった後は、前記辞書登録データ作成処理及び前記登録処理は行わ
ず、前記圧縮処理に於いては、前回圧縮対象としたデータ列
の次のデータをスタートポジションにした圧縮処理を行
うことを特徴とする請求項３記載のデータ圧縮方法。