JP2003521140A

JP2003521140A - データの圧縮に必要な時間を短縮するための方法および装置

Info

Publication number: JP2003521140A
Application number: JP2001513821A
Authority: JP
Inventors: リンゼイヨークケネス; リンゼイヨークセイアー
Original assignee: ユニシスコーポレーション
Priority date: 1999-07-30
Filing date: 2000-07-19
Publication date: 2003-07-08
Anticipated expiration: 2020-07-19
Also published as: WO2001010037A1; DE60002340T2; US6320523B1; EP1201036B1; EP1201036A1; DE60002340D1; JP3611319B2

Abstract

(57)【要約】本発明により、コード化されたデータを圧縮するための最大システム速度性能を得るための新規な方法およびシステムが提供される。使用される新規ポインタアドレスは、ディクショナリ内で見出される最新整合ストリングを表すストリングコード部分、および該ストリングコード部分に付加される、入力データストリームから得られる次の文字を表す拡張文字コード部分からなっている。固有メモリロケーションを可能なすべてのポインタアドレスに提供するために、ディクショナリの構成は十分に大きくなっている。入力データストリーム中のデータストリングを表す固有ポインタアドレスは、メモリにアクセスするためのアドレスポインタとして使用される。メモリのアドレスポインタ部分にデータが存在しない場合、データストリングは未観察であり、新しい固有圧縮コード化データが、そのデータストリングのためのメモリのポインタアドレス中にストアされ、次の同一ポインタアドレスが、ディクショナリからデータストリングのためのコードを読み出すことができる。

Description

【発明の詳細な説明】

【０００１】（発明の背景）１．発明の分野本発明は、データ圧縮システムに関する。より詳細には、本発明は、無損失デ
ータ圧縮、およびストリングコード（ｓｔｒｉｎｇｃｏｄｅ）をストアするた
めのディクショナリを使用したシステムにおいてデータのストリームを圧縮する
速度を速めるための方法および手段に関する。

【０００２】２．従来技術の説明従来、無損失データ圧縮アルゴリズムが知られていた。最も良く知られている
データ圧縮システムおよび方法の中には、ＬｅｍｐｅｌＺｉｖＯｎｅ（ＬＺ
−１）、ＬｅｍｐｅｌＺｉｖＴｗｏ（ＬＺ−２）、およびＬｅｍｐｅｌＺ
ｉｖＷｅｌｃｈ（ＬＺＷ）と呼ばれているものがある。これらの適応無損失デ
ータ圧縮システムはすべて、入力データストリーム中で遭遇するデータストリン
グ、記号ストリングまたは文字列を表すストリングコードをストアするためのデ
ィクショナリを使用している。一旦ストリングが識別されると、識別されたデー
タストリングよりビット数の少ないコードとしてストアされ、それにより、デー
タストリーム中に同一のストリングが続いて発生した場合に、すでにストアされ
ているストリングコードと置き換えられる。上に挙げた３つのデータ圧縮システ
ムはすべて、調査中のストリングに対して、ストリングコードがすでにストアさ
れているか否かを決定するために、ディクショナリ中の複数のロケーションを探
索しなければならない。そのためには、入力データ文字列と、ディクショナリロ
ケーション中にすでにコード化されている同一文字列とを突き合せなければなら
ない。

【０００３】ディクショナリ中の複数のロケーションの探索に要する時間を最短にするため
に、ハッシングアルゴリズムを使用して上記マッチング機能を実行することが提
案されている。ハッシュ探索は、探索するデータに基づいてテーブル中の索引を
計算する。ハッシュ表探索の効率は、テーブルの構成および複数の項目を、競合
することなくテーブルの同一領域にハッシュすることができるか否かによって決
まる。ハッシングシステムは実施費用が高く、計算が複雑であり、そのため、オ
ーバヘッドが性能を低下させる。あるＬＺＷハッシング法が、米国特許第４，５
５８，３０２号に記載されており、参照により本明細書に組み込まれている。

【０００４】また、メモリおよびメモリの一部を分割し、整合または整合がないことが見出
されるまで逐次探索する二分探索法の使用も提案されている。定義によれば二分
探索法では、ディクショナリ内を複数回探索しなければならず、また、テーブル
を並べ換える必要もあるが、ハッシングに関連する複雑な計算が負うべきオーバ
ヘッドが低減されるという利点を有している。

【０００５】連想記憶装置（ＣＡＭ）すなわち連想メモリを使用することにより、ディクシ
ョナリ中に位置付けされている複数のストリングの内容を比較する回数を少なく
することが提案されている。このシステムは効率的ではあるが、複雑であり、極
めて費用のかかるシステムである。この方法の一例が、米国特許第５，８３８，
２６４号に記載されており、参照により本明細書に組み込まれている。

【０００６】ストリングディクショナリを使用したデータ圧縮システムにおいて、複数探索
を完全に回避する方法および装置が提供されることは望ましいことであろう。ま
た、既存の圧縮解除器／デコーダが、いかなる変更もなく、圧縮データを受け取
り、かつ、復号化することができるように、新しいデータ圧縮システムからの出
力を、ＬＺＷなどの既存のデータ圧縮システムと互換性を持たせるべくフォーマ
ット可能にすることができることがさらに望ましい。

【０００７】（発明の概要）本発明の本質的な目的は、ストリングディクショナリを使用して実施されるデ
ータ圧縮の速度を最適化することである。

【０００８】本発明の他の本質的な目的は、データ圧縮器のストリングディクショナリ内の
複数アドレスロケーションを探索する必要性を除去することである。

【０００９】本発明の他の本質的な目的は、ディクショナリ内の探索を不要にするために、
可能なすべての新規ストリングコードのための唯一の固有アドレスを有するルッ
クアップテーブルとして配ストリングされたＬＺＷストリングディクショナリを
提供することである。

【００１０】本発明の他の本質的な目的は、効率的にフォーマット化し、それにより、スト
リングディクショナリ内を広範囲に渡って探索するペナルティを課すことなく、
漢字、日本語、およびその他の複雑な文字コードを圧縮することができる新規デ
ータ圧縮システムを提供することである。

【００１１】本発明の他の本質的な目的は、計算機システムに負担をかけることなく、低コ
ストのランダムアクセスメモリ（ＲＡＭ）を使用して実施することができるデー
タ圧縮システムを提供することである。

【００１２】本発明の他の本質的な目的は、これまでに可能であった速度より速い速度でＬ
ＺＷデータ圧縮を実行する新規方法を提供し、それにより、標準化されている、
あるいはＬＺＷなどのストリングデータ圧縮を使用している高速ネットワークの
ための実時間スループットを増加させることである。

【００１３】本発明の他の目的は、データストリームを圧縮するプロセスを高速化する、新
しい改良型ＬＺＷデータ圧縮実行方法を提供し、かつ、既存の回線およびリンク
上での伝送速度をより速くするための手段を提供することである。

【００１４】本発明の本質的な目的は、圧縮すべきデータストリーム中で遭遇するデータス
トリングのための新規拡張ポインタアドレスコードを提供することである。

【００１５】本発明の本質的な目的は、アクセス可能アドレスの数が、全ディクショナリ内
に使用されている最大ストリングコード数より多い、新規ストリングディクショ
ナリを提供することである。

【００１６】本発明の本質的な目的は、ビット数の少ない固有単一のストリングコード値を
、ビット数の多い固有ポインタアドレスコード中に含まれている文字列を表すデ
ィクショナリ中にストアすることである。

【００１７】本発明の本質的な目的は、ストリングディクショナリ内の複数のアドレスロケ
ーションの探索を必要とすることなく、ＬＺＷフォーマットで圧縮データストリ
ームを生成することである。

【００１８】本発明の本質的な目的は、ストリングコードを有する拡張文字をＬＺＷディク
ショナリ中にストアする必要を無くすことである。

【００１９】本発明の一般的な目的は、ディクショナリが満杯の場合に、停止し、かつ、内
容をクリアする必要なく、同一ＬＺＷストリングディクショナリを複数回使用す
ることである。

【００２０】本発明の一般的な目的は、すべてのメモリロケーションの内容にわたって読み
出すことなく、ストリングディクショナリのすべてまたは選択部分を、パージす
なわちクリアすることである。

【００２１】本発明の一般的な目的は、コードデータがストアされているアドレスロケーシ
ョンのみを重ね書きすることによってクリアすることができるように、ストリン
グコードのアドレスロケーションを補助ルックアップテーブル中にストアするこ
とである。

【００２２】本発明のこれらおよびその他の目的によれば、ストリングコード部分および拡
張コード部分からなる固有ポインタアドレスの生成を含む、ストリングディクシ
ョナリを用いたデータ圧縮の最適高速性能のための方法および装置が提供される
。新規ポインタアドレスは、ディクショナリ内で見出された最新ストリング整合
を表すストリングコード部分、および上記ストリングコード部分に付加された、
データストリーム中の未知の次の文字を表す拡張文字コード部分からなっている
。ストリングコード部分が１２ビット以下で規定され、かつ、拡張文字コード部
分が８ビットで規定される場合、可能なポインタアドレスは、わずかに２²⁰でし
かない。対応する２²⁰のディクショナリアドレスが提供されるため、ポインタア
ドレスを表すストリングがすでに観察済みであり、かつ、ディクショナリ内のポ
インタアドレス中においてストアされているストリングコードと置き換えられて
いるか否かを決定するために、ディクショナリ内のわずか１つのアドレスにアク
セスするだけで良い。

【００２３】（好ましい実施形態の詳細な説明）図１および好ましい実施形態のデータ圧縮システムを参照する前に、ほとんど
のデータ圧縮システムに合った単一の形式は存在しないことを理解されたい。し
たがって、コンプレッサ／トランスミッタとレシーバ／デコーダはともに、１）
使用する文字セット、２）最大コード値または最大コードフィールドを定義する
のに使用する最大ビット数、３）停止、リセット、コードクリアなどの特別コー
ド、および４）使用するコード化データパッキング−分離スキームを知る必要が
ある。データコンプレッサおよびデコーダが、使用するプロトコルを既に確立し
ており、かつ前述した項目が分かっている場合、データ圧縮を開始する前にプリ
アンブル内またはヘッダ内でそのような情報を送信する必要はない。トランスミ
ッタおよびレシーバがプロトコル項目を知っている本発明の好ましい実施形態で
は、文字セットを使用する初期化なしに新規のストリングディクショナリ１１を
含む圧縮システム１０を開始することが可能である。ただし、従来のＬＺＷデー
タ圧縮で使用されるとおりディクショナリを文字セットで初期化することも可能
である。データ圧縮システム１０は、入力データストリームのための入力ライン
１２を含み、この入力データストリームは、データストリームバッファ１３内に
入れられ、このデータストリームバッファ１３には、次の文字を取り出し、それ
をライン１５上に出力する抽出器１４が付加され、このライン１５上で、この次
の文字は、ポインタアドレスレジスタ１６の拡張文字コード部分１７内に入れら
れる。アドレスポインタレジスタ１６内には、ＬＺＷストリングコード部分１８
内のＬＺＷストリングコードが既に存在しており、このＬＺＷストリングコード
部分は、ライン１２上のデータストリーム内で見られる最後の一致したストリン
グに対するコードを含む。説明のため、ＬＺＷコード部分は１２ビットを含み、
また拡張文字部分１７は８ビットを含み、したがって、ライン１９上のディクシ
ョナリポインタアドレスは２０ビットを含むことになるものと想定する。新規デ
ィクショナリ１１は、少なくとも２²⁰の固有メモリロケーションまたはメモリア
ドレスを備え、したがって、可能なすべてのディクショナリポインタアドレスが
、メモリロケーションを有することになる。ディクショナリが初期化されるとき
、例外なくすべての文字列には、それと一致するものが見つかることになり、こ
れにより、２つの文字列の圧縮が開始される。

【００２４】ライン１９上のディクショナリポインタアドレスは、ディクショナリ１１内で
読取り動作を生じさせ、また、そのポインタアドレスにある内容がライン２１上
に現れて、ＨＩＴ／ＮＯＨＩＴバッファ２２内にストアされる。ストリングコ
ードがそのポインタアドレスに存在しており、このことは、現在、検査されてい
るストリングが以前に見られたものであり、そのストリングがディクショナリ１
１内でコードで置き換えられていることをバッファ２２内の論理に認識させるも
のと想定する。したがって、ＨＩＴがライン２３上で観察され、このことは、Ｈ
ＩＴ論理２４に論理２５内で次のポインタアドレスを生成させる。

【００２５】ポインタ論理２５により、バッファ２２は、ポインタアドレスレジスタ１６の
ストリングコード部分１８内に書き込まれた最後のＨＩＴコードをライン２７上
に生成することができる。同時に、このポインタ論理は、イネーブル信号をライ
ン２９上に生成し、この信号は、ポインタアドレスレジスタ１６の拡張文字部分
１７内に書き込まれるライン１５上の次の文字コードを文字抽出器１４に生成さ
せる。この時点で、ポインタアドレスレジスタ１６は、ディクショナリ１１から
読み取られた最後のＨＩＴコード、およびデータストリームから取り出された拡
張文字または次の文字を含む。ライン１９上の新しいポインタアドレスが、その
新しいポインタアドレスにあるディクショナリの内容を再び読み取り、読み取っ
た内容をＨＩＴ／ＮＯＨＩＴバッファレジスタ２２内に入れる。このプロセス
は、ディクショナリ１１から読み取られるＨＩＴコードが存在しなくなり、バッ
ファレジスタ２２内の論理が、ＮＯＨＩＴ論理３１へのライン２８上に信号を
生成するまで続く。ＮＯＨＩＴ論理３１は、ライン３０を介して、ライン３２
上およびトランスミッタ内またはレシーバ３３内に、バッファレジスタ２２から
の最後に一致したコードを読み込む。これは、ブロック３３によって示されてい
るが、遠隔のレシーバに対して送信するためのラインであることも可能である。
ＮＯＨＩＴ論理３１は、ライン６２を介して、ＮＯＨＩＴポインタアドレス
でレジスタ１１内に次の逐次コードをコードジェネレータ５９が書き込むように
させる。また、ＮＯＨＩＴ論理３１は、論理ブロック３４で、ライン２９を介
してシステム１０に新しいポインタアドレスを生成するように信号を送る。新し
いポインタを生成するため、論理３４は、２つの逐次動作を行う。ブロック３５
で示す第１の動作は、レジスタ１６のブロック１７内の拡張文字を、部分１７に
接続されたライン３６で示されるとおり、レジスタ１６のブロック１８内に移動
させることである。次の逐次動作は、ライン１５を介して、データストリーム内
の次の文字を拡張文字部分１７内にロードすることである。ブロック３７で示す
とおり、この論理は、ライン３８上にイネーブル信号を生成する。最後の文字が
読み取られたことを文字抽出ブロック１４が感知した場合には、ブロック１４が
、ブロック１４で最後の文字が読み取られていることをコンピュータコントロー
ラ論理にブロック３９で知らせ、これにより、探索論理の終りが完了する。

【００２６】図１のデータ圧縮システム１０の動作を要約すると、入力データストリームが
、抽出器１４からのデータストリーム内の次の文字または最後の文字をブロック
２２で読み取られた最後の一致からのストリングコード部分１８上に、常に付加
することが認められよう。アドレスポインタは、ライン１９上の２つの部分１７
および１８によって生成され、このことは、その固有ポインタアドレスでディク
ショナリ１１の内容をシステムが読み取るようにさせる。この実施形態において
アドレスポインタ位置に内容が存在する場合、その位置は、アドレスポインタに
よって示されるストリングに関する一致に対するコードを含む。ストリングが前
の一致を有する場合には、そのストリングを１つの文字によって拡張しなければ
ならず、より長い一致を見つける試行をしなければならない。これを行うため、
ディクショナリ１１から読み取られたばかりのコードがバッファ２２を通り、コ
ード部分１８内にロードされ、データストリームからの次の文字コードまたは拡
張文字が部分１７にロードされ、新しいポインタが生成される。この一連の動作
は、ディクショナリ１１から読み取られるコードが全く存在しなくなるまで続く
。コードが全く存在しなくなることは、ＭＩＳＳまたはＮＯＨＩＴで示される
。これが生じたとき、ＭＩＳＳに対する新しいコードがポインタアドレスにおい
てディクショナリ１１内にストアされ、新しいストリングは、この時点で部分１
７内にある最後の文字から開始しなければならない。新しいストリングを開始す
る前に、前の一致コードまたは最後の一致コードを、論理ブロック３３として示
すとおり、レシーバに送信しなければならない。次に、ＮＯＨＩＴ論理３１が
、ポインタ論理３４に２つのことを行わせる。第１に、拡張文字部分１７内の最
後の文字をコード部分１８内に移動し、次の文字を抽出器１４から取り出し、拡
張文字部分１４内にロードし、これにより、２つの１文字列を有する新しいスト
リングを開始する。これら２つの新しい１文字列は、既に観察された複数文字列
を構成することも、しないことも可能であるポインタアドレスを含むが、これは
、ディクショナリの内容をポインタアドレスに読み取らせ、前述したとおり、Ｈ
ＩＴまたはＮＯＨＩＴが起きたかどうかを判定することによって判定すること
になる。

【００２７】ディクショナリ１１を使用する文字コードセットで初期化するとき、複数文字
列の圧縮を開始するには、データストリーム内の最初の２文字を部分１８および
１７にロードするだけでよい。単一文字に対するポインタアドレスを使用する必
要はなく、また単一文字のためのコードは、好ましくは、特殊制御文字に続くよ
り下位のアドレス内に配置する。２５６文字ＡＳＣＩＩコードセットを使用する
場合、２文字列に対するコードは、３つの特殊コードコードを使用し、かつゼロ
アドレスを全く使用しない場合には、２５９で開始することになる。

【００２８】ディクショナリ１１を初期化せず、レシーバが文字コードセットおよびプロト
コルを知っているとき、コードセット内の単一文字コードのためのアドレスは、
前述したとおり、より下位のアドレスとして予約することができる。ただし、単
一文字コードの内容は、レジスタ１６によってアドレス指定可能ではないため、
２文字アドレスがＭＩＳＳまたはＮＯＨＩＴを生じさせたとき、レジスタ２２
内に最後の一致コードが全く存在しないことになる。これが起きた場合、単一文
字コードは、ストリングコード部分１８内で入手可能であり、コントローラ３９
によって読み取られることが可能である。ＭＩＳＳが生じたときに単一文字コー
ドを生成する別の仕方は、レジスタ１８内の単一文字コードが、コントローラ３
９内で以前に見られたかどうかを判定することであり、見られていない場合、そ
れがＭＩＳＳが生じたときの最後の一致であることになる。

【００２９】次に、テーブルレベル機能がそこで使用される、図１のデータ圧縮システムを
変形した実施形態の概略ブロック図を示す図２を参照する。データ圧縮システム
５０は、同様のまたは拡張したディクショナリ１１、および以下に説明するとお
り、ディクショナリの一部分であることが可能な、１１Ａで示したテーブルレベ
ルを使用する。この説明では、ライン１２上、バッファ１３内、および抽出器１
４内のデータストリームは、本明細書で前に説明したのと同じであると想定する
。したがって、次の文字は、拡張文字部分１７にとって、必要なときにはいつで
もライン１５上で手に入る。同様に、バッファ２２内の最後の一致コードは、ポ
インタレジスタ１６Ａのコード部分１８にとって、ライン２７上で手に入る。変
形した実施形態では、ポインタレジスタ１６Ａは、テーブルカウンタ５２によっ
て索引付けされているテーブルレベルブロック５１を含むものとして示され、こ
のカウンタは、リセット入力およびセット入力、ならびにオーバーフロー出力４
０を有するものとして示されている。ライン１９上のポインタアドレスでディク
ショナリ１１にアクセスすることに加え、ディクショナリポインタアドレスと同
じポインタアドレスで、テーブル１１Ａ内にテーブルレベル値も提供されている
。例えば、１１Ａ内のテーブルレベルが、ディクショナリ１１の内容と同時に読
み取られ、テーブルレベルブロック５３内にストアされる場合、このレベルは、
論理ブロック５４で、ブロック５１内の現行のテーブルレベルと比較することが
できる。それらのテーブルレベルを比較する場合、ＨＩＴが存在し、そうでない
場合、ＭＩＳＳまたはＮＯＨＩＴが存在する。ＨＩＴが生じたとき、ライン５
５上の信号が、ブロック５６でＨＩＴ論理を開始し、システム５０に新しいポイ
ンタアドレスを生成させる。新しいポインタアドレスの生成は、図１に関連して
説明したのと同じであり、バッファ２２内の最後の一致コードが、アドレスポイ
ンタレジスタ１６Ａのストリングコード部分１８内に入れられ、入力ストリーム
内の拡張文字または次の文字が、抽出器１４からアドレスポインタレジスタ１６
Ａの次の文字の部分１７または拡張文字部分１７に供給される。

【００３０】ただし、対応が存在している可能性があっても、つまりディクショナリ１１内
にコードが存在している可能性があっても、テーブルレベル論理内でＭＩＳＳが
生じた場合、ＭＩＳＳが存在し、システム５０は、ライン５７によって示される
とおり、ＭＩＳＳ論理を実行する。ＭＩＳＳ論理５８は、次のストリングコード
をコードジェネレータ５９が書き込むようにさせ、ブロック５１で現行のテーブ
ルレベルをポインタアドレスでディクショナリ１１内およびテーブルレベル１１
Ａ内にテーブル論理６１が書き込むようにさせる。

【００３１】ディクショナリ１１内に書き込まれる新しいストリングコードは、論理ブロッ
ク５９によってステップされ、コードは、アドレスポインタ位置で書き込まれる
ようにディクショナリ１１にとって入手可能である。同様に、テーブル論理６１
は、ブロック５１と同様の現行のテーブルレベルを提供し、ライン６２上の書込
みイネーブル信号によってそのテーブルレベルで同じロケーションに書き込まれ
る。

【００３２】この場合、ポインタアドレスでディクショナリ１１内にデータが存在してはい
ても、テーブルレベル１１Ａが、ブロック５１内の現行のテーブルレベルと符合
し、それに等しくなるまで、一致またはＨＩＴは存在しないことが理解されよう
。ディクショナリ１１を拡張することの目的は、割り当てられたストリングコー
ドのすべてが使用されるまで、ストリングコードでディクショナリを完全に埋め
るのを可能にすることである。ストリングコードのすべてが使用されてはいても
、ディクショナリ１１内のすべてのアドレス位置は使用されてない。例えば、デ
ィクショナリが２²⁰のアクセス可能なアドレス位置を有する場合、およそ１００
万の可能なアドレスが存在する。ただし、ＬＺＷコードが、２¹²ビットを使用し
てコードを生成するだけである場合には、コードジェネレータ５９によって生成
されるコードの数は、およそ４０９６のコードを有し、ディクショナリは、４０
９６のコードが使い果たされたとき、満杯になっている。ディクショナリ１１に
テーブルレベル追加を加えることにより、ディクショナリが満杯のとき、テーブ
ルレベルを変更し、４０９６のストリングコードがその中に書き込まれているデ
ィクショナリのアドレスを除去またはクリアする必要なしに、コードジェネレー
タ５９が生成する完全に新しいシーケンスの同じストリングコードを開始するこ
とができる。言い換えれば、最大数のストリングコードでディクショナリ１１が
満杯になるたびに毎回、テーブルレベル１１Ａを実施し、テーブルレベル５１が
ポインタアドレスのテーブルレベルに対応しない限り、ＨＩＴが生じないように
する。ＨＩＴが生じたとき、図１に関連して説明したのと同じ仕方で新しいポイ
ンタアドレスを生成し、ライン２７上の最後の一致コードをレジスタ１６Ａのス
トリングコード部分１８内に入れ、データストリームからの次の文字をレジスタ
１６Ａの次の文字部分１７内に入れる。ディクショナリ１１が満杯になったとき
、コードジェネレータ５９をリセットし、再び、同じシーケンスのストリングコ
ードを開始するが、これらのコードは、この時点では、異なるテーブルレベルと
関連している。というのは、テーブルレベル論理が、テーブルカウンタ５２およ
び現行のテーブルレベルブロック５１により、次の高いレベルに設定しているか
らである。使用するメモリチップによっては、数百ものテーブルレベルを利用す
ることができ、ディクショナリ１１をリセットする必要がない。

【００３３】次に、データ圧縮ディクショナリ１１内の単一アドレス位置にディクショナリ
探索を制限するのに使用する一連の動作の簡略図を示す図３を参照する。ブロッ
ク６６が、ブロック６７で以下により詳細に説明するディクショナリの初期化お
よび／またはディクショナリのクリアで始まる開始動作を示す。次の動作は、ブ
ロック６８で示すとおり、ポインタアドレスおよびシステム１０のその他の部分
を初期化および／またはクリアすることである。これらの動作はブロック６９で
始まり、そこで、「Ｘ」ビットストリングコードが、ポインタアドレスレジスタ
１６のストリングコード部分１８内に設定される。ただし、第１の文字がデータ
ストリームから読み取られるとき、ストリングコードは全く存在しない。ブロッ
ク７１で、「Ｙ」ビット文字コードが拡張文字部分１７内に設定される。このコ
ードは、開始時のデータストリーム内の第２の文字、または第２の読取り動作に
関するデータストリーム内の第２の文字を含む。アドレスポインタレジスタ内の
２つのコードセットを使用する固有ポインタアドレスを使用してブロック７２に
示す２^x+yビットを有する固有ポインタアドレスが生成される。ブロック７３で
、ディクショナリ１１の内容が、そのポインタアドレスで読み取られる。ブロッ
ク７４で、ディクショナリ１１のストリングコード内容が、ブロック７４に示す
とおり、出力バッファ２２内に読み込まれる。ただし、内容が全く存在しない場
合には、まず、内容不在コードと等価のものが、バッファ２２内に読み込まれる
。ブロック７５で、ディクショナリから読み取られたストリングコードが、以前
にストアされたコードであるか否か、または情報の不在であるか否かの論理判定
が行われる。ストリングコードが読み取られた場合には、ＨＩＴが存在し、ブロ
ック７６に示すとおり、ＨＩＴ論理に進む。ＨＩＴが生じない場合、ブロック７
７に示されるとおり、ＭＩＳＳ論理に進む。

【００３４】図３に関する説明は、図１上におよび図２上に直接に読まれる。ディクショナ
リ１１を開始することを所望しない場合、図３Ａに示すとおり、準備ステップが
行われるという条件で、やはり同じ一連の動作を使用することが可能である。

【００３５】同じ開始ブロック６６を示す図３Ａを参照する。ブロック６７Ａは、ディクシ
ョナリ１１およびシステムがクリアされ、したがって、ディクショナリ１１内に
以前に記録されているコード情報が全く存在しないことを示している。ただし、
圧縮システム１０とデコーディングシステムの両方によって知られている数字に
よって文字セットに対するコード値が予約されている。

【００３６】ブロック７８で、システム１０を開始するため、データストリーム内の第１の
文字が、レジスタ１６のストリングコード部分１８内にロードされる。

【００３７】ブロック７９で、データストリーム内の第２の文字または次の文字が、レジス
タ１６の拡張文字コード部分１７内にロードされる。

【００３８】ブロック８０で、ストリングコード部分１８内の文字が、単一文字列であり、
かつデータストリーム内で以前に生じていないかどうかが判定される。生じてい
ない場合、部分１８内の文字は、最後に一致したコードとしてバッファレジスタ
２２内にロードされる。この手続きは、ディクショナリ１１を初期化せずにデー
タ圧縮システム１０を開始する唯一の仕方であるだけでなく、ブロック８０で判
定が行われた後、ブロック７２ないし７７に関連して説明したとおり初期化され
たときと同様に動作するシステム１０を提供する。単一文字コードは、ディクシ
ョナリ１１内に記録されていることが可能であるが、ライン１９上のアドレスポ
インタは、それらのコードにアクセスしないことになる。

【００３９】ブロック７８で、最初、図１に示すシステムを介して、データストリーム内の
第１の文字が、レジスタ２２内にロードされ、またアドレスレジスタ１６のスト
リングコード部分１８内にもロードされる。次に、データストリーム内の拡張文
字または第２の文字が、ブロック７９で示されるとおり、アドレスレジスタの文
字コード部分１７内に設定される。システムがこのように開始のために始められ
ると、２つの別個の独立した文字が、ポインタアドレスレジスタ１６内に設定さ
れ、またデータストリーム内の第１の文字を示す最後の一致文字が、バッファ２
２内に設定されることが理解されよう。図３のこの変形形態は、本明細書で前述
したものと同一であるその他のブロック７２〜７７を使用するので、さらなる説
明を必要としない。

【００４０】次に、アクセスされる単一のディクショナリアドレスが、ＨＩＴをもたらすス
トリングコードを含むときに使用される一連の動作を有する簡略化した流れ図を
示す図４を参照する。ブロック８１は、ディクショナリ１１から読み取られたス
トリングコードがＨＩＴを示すことを示す。ブロック８２は、より長いストリン
グのための新しいポインタを生成するのが望ましいことを示す。ブロック８３は
、ディクショナリ１１から読み取られたストリングコードが、部分１８でアドレ
スレジスタ１６内にストアされることを示し、またブロック８４は、入力データ
ストリーム内の次の文字に対するコードが、ポインタアドレスレジスタ１６の拡
張文字部分１７内にストアされることを示す。ブロック８５は、ポインタアドレ
スレジスタ１６内の２つのコードを使用して新しいポインタアドレスが生成され
ることを示す。ブロック８６は、そのポインタアドレスでディクショナリ１１の
新しいストリングコード内容が読み取られることを示す。ブロック８７は、ディ
クショナリのコード内容がバッファレジスタ２２内にストアされることを示す。
ブロック８８は、ディクショナリ１１から読み取られた情報コードが以前にスト
アされたコードを含むかどうかについての論理判定を示す。ディクショナリから
コードが読み取られる場合、ライン８９上でＨＩＴが存在し、ブロック８２ない
し８８に示す一連の動作が繰り返される。ＨＩＴが存在しない場合、ＭＩＳＳが
存在し、一連の動作は、次に、ブロック９１に示すとおり、ＭＩＳＳ論理に進む
。

【００４１】アクセスされる単一のディクショナリアドレスが、ブロック９１Ａに示すとお
り、ＭＩＳＳをもたらすストリングコードを全く含まないときに使用される、簡
略化した流れ図および一連の動作を示す図５を参照する。図５のブロック９１Ａ
は、ＭＩＳＳが生じたとき、この論理に従う。情報として、ＭＩＳＳが生じると
き、文字列は、ストリングに追加された最後の追加文字によって新しいストリン
グがあまりにも長くなったため、それがディクショナリ内でもはや見られないと
ころまで拡張されていることを想起されたい。これが起きたとき、前のＨＩＴが
、ディクショナリ内で見られる最長の一致である。ブロック９２は、この最後に
一致したＨＩＴコードが、レシーバまたはデコーダに送信されることを示す。最
後の一致はレジスタ２２内に保持され、それをライン３２上でレシーバまたはデ
コーダ３３に出力することができる。ブロック９３は、ポインタアドレスでディ
クショナリ１１内に、コードジェネレータ５９によって生成された次の逐次コー
ドを書き込むまたはストアする動作を示す。レジスタ１８内の同じコードと最後
に一致したバッファ２２内のコードは、同一であることを留意されたい。ただし
、これは、ポインタアドレスでディクショナリ内に書き込まれているコードでは
ない。ブロック９３は、次の逐次コードがディクショナリ１１内に書き込まれる
ことを示す。ブロック９４および９５に示し、説明する論理を使用して新しいポ
インタアドレスを生成することが必要であり、この論理では、アドレスレジスタ
部分１７内に最後に入力された拡張文字コードのためのコードが、アドレスポイ
ンタレジスタ１６のストリングコード部分１８内に移動または転送される。新し
い文字または次の拡張文字が、ブロック９４および９５によってそれぞれ示され
るとおり、レジスタ部分１７内にストアされる。ブロック９６は、次に、レジス
タ１６内の情報が使用され、ブロック９４および９５に示されるとおり、レジス
タ１６内にロードされた２つのコード部分を使用して新しいポインタアドレスが
生成されることを示す。ブロック９７は、ディクショナリ１１のストリングコー
ド内容が、その新しいポインタアドレスでディクショナリから読み取られること
を示し、またブロック９８は、ディクショナリ１１のストリングコード内容が出
力コードバッファ２２内にストアされることを示す。ブロック９９は、ディクシ
ョナリ１１から読み取られた情報が以前にストアされたコードを含むかどうかに
ついての論理判定を示し、ストアされている場合、この論理は、論理ＨＩＴを示
すブロック１０１に行き、またストアされていない場合、この論理は、論理ＭＩ
ＳＳを示すブロック１０２に進む。ＨＩＴ論理およびＭＩＳＳ論理は、図４およ
び５にそれぞれ示し、またブロック１０１および１０２にそれぞれ示している。

【００４２】次に、ディクショナリ１１として使用することができるメモリブロックまたは
メモリモジュールの概略を示す図６を参照する。メモリのモジュール１０３は、
深さ２²⁰行、幅１６ビットのであるものとして示している。１６ビットは、１２
データ圧縮コードビット、およびディクショナリ１１内に組み込まれるテーブル
レベルのために予約した最後の４ビットとして使用することができる。したがっ
て、およそ深さ１００万のビットまたは行、幅１６ビットを有する２つの標準の
メモリブロックは、実際には、およそ２．００ドルで購入することができる２メ
ガバイトのモジュールを含む。これは、モジュールが８ビットバイトの形態をと
り、共に接続されたとき、１つの幅１６ビットのアドレス指定可能な行を構成す
ることを想定している。以下に説明するとおり、この２メガバイトのモジュール
は、変更することなく、本発明におけるディクショナリとして使用すること、あ
るいはテーブルを広げるため、さらなる４ビットバイトまたは８ビットバイトを
追加することによって変更することが可能である。ＬＺＷデータ圧縮を行うとき
、ＬＺＷコード内で９ビットないし１２ビットを使用することが通常である。１
３ビットを超えてコードビットを拡張する正当な理由はめったにないが、正当な
理由がある場合、ディクショナリを拡大することによってより多くのコードビッ
トをディクショナリ内に収容することができる。

【００４３】次に、深さ２²¹ビットで幅は８ビットだけ、つまり幅１バイトであるブロック
またはモジュールとしての同じ量のメモリを示す図７を参照する。この構成では
、図６に示すとおり、２つの８ビットバイトが直接に接続され、等価のメモリス
トレージをもたらす形で２つの行を使用することが可能である。各メモリモジュ
ールは、異なる仕方で接続されてはいるものの、２メガバイトを備え、その費用
は同じである。

【００４４】次に、それぞれ２メガバイトのメモリを備え、それらが図６に示したのと同じ
タイプであることを示すために１０３Ａ、１０３Ｂ、１０３Ｃと番号を付けた、
図６および７に示した型の３つのメモリブロックまたはメモリモジュールの概略
を示す図８を参照する。３つの同じモジュール１０３Ａないし１０３Ｃを使用し
てディクショナリを構成するとき、使用中（ビジー）モジュールである１つのモ
ジュール内で動作を行い、フラッシュまたはリセットした１つの完全に空のモジ
ュールを有し、許容される最大数のストリングコードまでちょうど満たし、まだ
フラッシュしていない別のモジュールを有することが可能である。

【００４５】図６〜８の説明では、圧縮コードのために使用するビット数は、１２ビットと
して示した。１２ビットを使用すると、４０９６の固有ストリングコードを生成
することだけが可能である。図１および２に関連して説明したとおり、およそ１
００万のアドレスが存在してはいるものの、４０９６の固有圧縮コードが割り当
てられると、ディクショナリは満杯になる。ディクショナリをリセットするテー
ブルレベル１１Ａシステムを回避するとき、圧縮コードのために、最高でモジュ
ールの１６ビットすべてを使用することが可能である。例えば、図６では、図２
の番号１１Ａを参照して説明したテーブルレベル動作のために、１６ビットのう
ち４ビットが予約されている。したがって、圧縮コードを形成するのに１２ビッ
トだけしか残されていない。しかし、テーブルレベル１１Ａを完全に無くすと、
１６ビットすべてを圧縮コードのために利用することができ、この場合、およそ
６５０００の別々の圧縮コードを生成することが可能であり、これにより、シス
テムは、それが所望される場合、より長いストリングを生成することができる。
可能な２²⁴のアドレスのうち６５０００だけが埋まっているので、この場合、図
８に示す型のディクショナリを構成し、９から１６の間にコード圧縮ビット数を
最適化することが可能である。一旦選択したコードビット数によって許容される
最大数のコードでディクショナリが埋まると、データ圧縮システムは、リセット
コードをデコーダまたはレシーバに送信し、圧縮コードで埋められたモジュール
をリフレッシュまたはフラッシュするのを待つ必要なしに、即時に、次のモジュ
ール１０３Ｂ内で先行して新しいコードを生成し、新しいストリングを送信する
。この動作を代替の仕方で行い、２つのモジュールだけを使用することも可能で
あろうが、３つのモジュールが提供された場合、アクティブなモジュールが満杯
になる前に、第３のモジュール内でリフレッシュ動作またはフラッシュ動作を前
に完了できることが分かっていれば、あるモジュールが使用中のとき、別のモジ
ュールが常に空であることが保証される。

【００４６】本適用例に記載する型のディクショナリ１１を実現するために、市販のメモリ
を配置することの簡略化したバージョンを説明したので、３２メガバイトのメモ
リの費用が、およそ２０．００ドルで購入することができ、本明細書に記載する
型のメモリは、コンピュータ動作時間を短縮することにより、非常に短い期間で
元が取れることが理解されよう。これは、大きなコンピュータまたはメインフレ
ームコンピュータでは、特にそうである。

【００４７】次に、図８に示したものと同様の多数のセクション、ブロック、またはモジュ
ールを有する概略図を示す図９を参照する。単一のモジュールをリフレッシュま
たはフラッシュすることが所望されるとき、ブロック１０５に示すとおり、２メ
ガバイトのアドレス生成容量を有するクリアアドレスカウンタを使用することが
できる。これらのアドレスのそれぞれ、および番号１０６で示すモジュールＳ１
ないしＳ１６のそれぞれに、すべてゼロを書き込むことが好ましい。他のセクシ
ョンを除いてクリアされるべきセクション内のアドレスをポイントするための手
段として、選択入力１０８を有するマルチプレクサ１０７を使用することができ
る。したがって、ディクショナリの他のセクションがデータ圧縮システムのため
に使用されている最中に、セクションを１つずつ選択し、アドレス位置のそれぞ
れにゼロを書き込むことができる。

【００４８】次に、ディクショナリ１１の概略、およびディクショナリ内の可能なすべての
アドレスに上書きすることを必要としない、ディクショナリの内容をクリアする
ための関連する構造を示す図１０を参照する。ライン１９上のアドレスポインタ
が、ディクショナリ１１内のアドレスにアクセスするとき、補助メモリ１１０内
に同じアドレスを書き込むことが可能である。ＡＮＤゲートまたはそれに類する
デバイス１１１が、ブロッキングデバイスとして動作しているものとして示して
いる。というのは、ＭＩＳＳが生じたときにだけ、そのアドレスを記録すればよ
いからである。したがって、ＭＩＳＳが生じるたびに毎回、アドレスカウンタ１
１２のカウントが、メモリ１１０内でステップされ、データ圧縮動作中に情報が
その中にストアされる４０９６のアドレスが、結果として、なんらかの順序でメ
モリ１１０内にストアされることになる。この場合、これらのアドレスを使用し
、クリアアドレスカウンタとともにアドレスポインタを生成し、情報がそこにス
トアされていることが分かっているアドレスだけをクリアするように、すべてゼ
ロを生成することが可能である。

【００４９】この場合、４０９６のアドレスのためのコードストーレッジを実装するのに必
要なメモリをディクショナリ１１として使用するのと同じメモリモジュールで実
現してもよいことが認められよう。

【００５０】ディクショナリを探索する必要なしに、データ圧縮を行うことの基本原理を説
明したので、このシステムを実施する多くの仕方が存在することが理解されよう
。例えば、メモリは、現在、とても安価で、さらに安価になっているので、ほと
んどの適用例において専用メモリが見合うものとなる可能性があり、さらなる速
度が必要とされる場合、示したステップおよび動作のいくつかは、図１〜５に示
すアルゴリズムおよびステップを実現する安価な専用ハードウェア実装形態によ
って実行することができる。

【００５１】安価なメモリで置き換えることにより、テーブルまたはテーブルレベル１１Ａ
を無しで済ますのが可能なことを説明したので、システム全体がソフトウェアで
実行されるとき、テーブルレベル実装形態を使用するのが望ましい可能性がある
。

【００５２】マルチプロセッシングシステムを使用して大きいファイルに対するデータ圧縮
を行うことが望ましい場合、本発明を使用し、またそのメモリが満杯になるまで
、複数のプロセッサの１つを使用してデータ圧縮を行い、次に、そのデータ圧縮
システム内の第２のプロセッサにそのデータストリームを切り替え、データ圧縮
を行いつづけ、その一方で第１のプロセッサはそのディクショナリをフラッシュ
して、データ圧縮の速度を最適化することが可能である。

【００５３】中央プロセッシングシステムに売上げおよび在庫を送信する大手の製造業者は
、自らのデータをリアルタイムで圧縮し、十分な帯域幅を有するリンクを介して
そのデータをより高速に送信することができる。通信リンクが、データ圧縮シス
テムよりも遅い場合、圧縮データは、バッファシステム内に迅速にストアし、デ
ータ圧縮を行うコンピュータシステムを不利にすることなく、リンクが提供する
最大限の速度で送信することができる。

【００５４】探索するストリングに対してディクショナリ内にコードまたは値がストアされ
ているか否かを単一回の読取り動作で判定するための、好ましい実施形態として
のディクショナリおよびアドレスポインタを説明したので、本発明をコンピュー
タ内のソフトウェアで実行するのが可能である、またはハードウェアおよびソフ
トウェアを使用して実施するのが可能であることが理解されよう。文字のコード
セットを使用してディクショナリを初期化することの利点、およびトランスミッ
タおよびレシーバがともに使用されているコードセットを知っているとき、ディ
クショナリを初期化しないことの利点が存在する。少しでも疑念がある場合、圧
縮データに先立ってコードセットおよびプロトコルを送信することができる。デ
ィクショナリをコードセットで初期化しない場合、コンプレッサが初期にその欠
如を補い、単一文字コードをディクショナリ内にストアさせる。ただし、ディク
ショナリ内に複数文字列コードがストアされていると、新規のアドレスポインタ
は、同じ新規のＨＩＴ結果またはＭＩＳＳ結果を生成することになる。テーブル
レベルの変形実施形態では、異なるテーブルレベル内の異なるアドレスに同じ複
数ストリングコードを書き込むことが可能である。ディクショナリ内に新しいシ
ーケンスのストリングコード値が書き込まれるデータ圧縮動作中、１つのテーブ
ルレベルだけが有効であるので、ＨＩＴが生じたとき、正しい最後に一致したコ
ードがわかり、レジスタ１８内に書き込むためにその正しい最後に一致したコー
ドがバッファ２２に読み込まれる限り、競合は存在しない。言い換えれば、ＨＩ
ＴまたはＭＩＳＳが生じたかを判定するのに、そのポインタアドレスのテーブル
レベルだけを使用することができる。すべてのＨＩＴに続き、次のポインタアド
レスを構成するために最後に一致したコードを利用することができる。ＭＩＳＳ
に続き、次のポインタアドレスは、ディクショナリの外で利用可能な２つの単一
文字コードを含み、したがって、ＨＩＴが生じたとき、テーブルレベルを使用し
てＨＩＴまたはＭＩＳＳを判定するのに、最後に一致したコードを有するだけで
よい。

【図面の簡単な説明】

【図１】データストリーム中に見出される英数字または記号のストリングを表すコード
を生成するためのデータ圧縮システムの好ましい実施形態の概略ブロック図であ
る。

【図２】ディクショナリ上またはディクショナリ中に付加されるテーブルレベル機能を
示す、図１に示すデータ圧縮システムの変形実施形態の概略構成図である。

【図３】ディクショナリ探索を、データ圧縮システムにおける単一のディクショナリポ
インタアドレスに制限するために使用される動作シーケンスを示す簡易流れ図で
ある。

【図３Ａ】ディクショナリが初期化されない場合における、図３に示す流れ図を変形した
動作シーケンスの簡易流れ図である。

【図４】アクセスされる単一のディクショナリポインタアドレスが、ＨＩＴの結果をも
たらすストリングコードを含む場合に使用される動作シーケンスを示す簡易流れ
図である。

【図５】アクセスされる単一のディクショナリポインタアドレスが、ＭＩＳＳの結果を
もたらすストリングコードを含まない場合に使用される動作シーケンスを示す簡
易流れ図である。

【図６】本発明におけるディクショナリのために使用されるメモリのブロックすなわち
モジュールの概略図である。

【図７】図６に示す構成とは異なるメモリの他のブロックすなわちモジュールの概略図
である。

【図８】図６および７に示すタイプのメモリの３つのブロックすなわちモジュールの概
略図である。

【図９】メモリが満杯になり、動作不能の場合にブロックをクリアするための構造を示
す、複数のブロックすなわちモジュールを有し、常時そのうちの１つしか動作す
ることができない大型ディクショナリの概略図である。

【図１０】ディクショナリと、ディクショナリを直ちにリセットすることが望ましい場合
に、ディクショナリの内容をフラッシングすなわちクリアするための構造を示す
概略図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者セイアーリンゼイヨークアメリカ合衆国 19006 ペンシルベニア州ハンチントンバレーカントリークラブドライブ 2130 Ｆターム(参考） 5B075 ND02 NK48 UU40 5J064 AA02 AA03 BA11 BB05 BC01 BC03 BC04 BC05 BC14 BC29 BD04

Claims

【特許請求の範囲】

【請求項１】データストリーム中ですでに観察済みの、既知のストリング
のための代替ストリングコード値を含む直列データストリームを圧縮するための
方法であって、前記ストリングコード値を受け取るためのディクショナリを準備するステップ
と、前記データストリーム中で最初に観察された時点で、ストリングのための固有
コード値を前記ディクショナリ中にストアするステップと、探索される同一のストリングが、前記ディクショナリ中にストアされているス
トリングコードを有しているかどうかを決定するために使用すべき固有ポインタ
アドレスであって、既知のストリングのためのコードに対応するストリングコー
ド部分および前記データストリーム中における次の文字のためのコードに対応す
る拡張文字部分からなる固有ポインタアドレスを生成するステップと、前記固有ポインタアドレスにおいて前記ディクショナリの内容を読み出すステ
ップと、単一のポインタアドレスにおいて読み出された内容から、探索されるストリン
グのためのコード値が前記ディクショナリ中に存在するか否かを決定するステッ
プとを含むことを特徴とする方法。
【請求項２】前記決定ステップが、前記ディクショナリ中の内容がストリングコードを含むことを決定するステッ
プと、前記ディクショナリから読み出されるストリングコードと同一のストリングコ
ードを用いる新しい固有ポインタアドレスを生成するステップと、探索すべき次のストリングのための新しいポインタアドレスを形成するために
、前記データストリーム中の次の文字のためのコードを、読み出されたストリン
グコードに付加するステップとを含むことを特徴とする、請求項１に記載の方法
。
【請求項３】前記決定ステップが、前記固有ポインタアドレスにおいて前記ディクショナリの内容が、探索するス
トリングのためのストリングコードを含んでいないことを決定するステップを含
み、その前のポインタアドレスにおいて見出された最新の整合ストリングコードを
、レシーバに伝送するステップと、次の固有ストリングコードを、該ディクショナリの現在のポイントアドレス中
にストアするステップとをさらに含むことを特徴とする、請求項１に記載の方法
。
【請求項４】その前のアクセスの間に、該データストリームから読み出さ
れた最新の文字コードを含む、新しい固有ポインタアドレスを生成するステップ
と、前記新しい固有ポインタアドレスを形成するために、前記データストリーム中
の次の文字のためのコードを付加するステップとをさらに含むことを特徴とする
、請求項３に記載の方法。
【請求項５】次の固有ストリングコードを、該ディクショナリ中にストア
する前記ステップが、次の固有ストリングコードを提供するために、コードカウ
ンタをインクリメントするステップを含むことを特徴とする、請求項３に記載の
方法。
【請求項６】前記ディクショナリから読み出された前記ストリングコード
が、前記ディクショナリが満杯であることを示すために使用すべき最高の番号が
振られたストリングコードであるか否かを決定するステップをさらに含むことを
特徴とする、請求項５に記載の方法。
【請求項７】前記ディクショナリの各ポイントアドレスにおける内容に関
連するテーブルレベルメモリを提供するステップと、新しい固有ストリングコードが前記ディクショナリ中にストアされる毎に、前
記テーブルレベルメモリにレベル値を設定するステップと、前記ディクショナリが満杯であることが決定された場合に、前記テーブルレベ
ルメモリに、より高いレベル値を設定するステップとをさらに含み、前記単一のポインタアドレスから読み出される内容から決定する該ステップが
、固有ポインタアドレスにおけるテーブルレベル値が、探索されるストリングの
ためのコードが前記ディクショナリ中に存在することを示す所定のテーブルレベ
ル値に対応することを決定するステップをさらに含むことを特徴とする、請求項
１に記載の方法。
【請求項８】入力データストリーム中で遭遇するデータ文字列のためのコ
ードをストアし、かつ、ストリングコードで既知のストリングを表すディクショ
ナリを利用したデータを圧縮する方法であって、既知のデータストリングを表す前記ディクショナリに固有ストリングコードを
ストアさせるステップと、前記入力データストリーム中のデータ文字列を示すポインタアドレスを生成す
るステップと、先行するストリングの最後の文字のためのコード、および前記コードに付加さ
れる、該入力データストリームからの次の文字からなり、２つの文字コードスト
リングアドレスを形成する、前記ポインタアドレスを形成するステップと、前記ディクショナリから前記ポインタアドレスにおけるストリングコードを読
み出すステップと、前記ディクショナリから読み出されるストリングコード、および該ストリング
コードに付加される、該入力データストリームから得られる次の文字のためのコ
ードからなる、新しいポインタアドレスを生成するステップとを含むことを特徴
とする方法。
【請求項９】前記ディクショナリから前記ポインタアドレスにおいて読み
出されるストリングコードが、すでに発生済みのストリングを表し、新しいポインタアドレスの生成を継続するステップと、前記ディクショナリから新しいポインタアドレスにおいて、すでにストアされ
ているストリングコードの読出しを継続するステップと、先行するストリングが見出される毎に、前記アドレスポインタによって表され
るストリングの長さを拡張するステップとを含むことを特徴とする、請求項８に
記載の方法。
【請求項１０】前記新しいポインタアドレスにおいて読み出されるコード
が、未発生のストリングを表し、すでにストアされているストリングから得られる最後の文字のためのコード、
およびそれに付加される、該入力データストリームからの次の文字からなる、新
しいポインタアドレスを生成するステップを含むことを特徴とする、請求項８に
記載の方法。
【請求項１１】最新の整合ストリングコードをレシーバまたはデコーダに
伝送するステップと、新しい固有ストリングコード値を、該ディクショナリの前記ポインタアドレス
中にストアするステップとをさらに含み、前記新しい固有ストリングコード値が、コード生成器によって生成される逐次
値を含むことを特徴とする、請求項１０に記載の方法。
【請求項１２】入力データストリーム中の既知の文字列をコードに置き換
えることにより直列データストリームを圧縮するデータ圧縮システムであって、既知のストリングコード部分、および固有ポインタアドレスを形成するために
、文字コードとして該ストリングコード部分に付加される、該入力データストリ
ームから得られる次の文字の文字コード部分からなる、前記データストリーム中
のデータストリングを表すコードを探索するためのポインタアドレス手段と、前記入力データストリーム中に観察される複数の文字列のための固有ストリン
グコード値を含む、各可能固有ポインタアドレスの少なくとも１つでアクセス可
能な複数のメモリロケーションを有するストリングコードディクショナリと、前記ストリングコードディクショナリから前記固有ポインタアドレスにおける
前記固有ストリングコード値を読み出す手段と、前記ストリングコードディクショナリから読み出した内容から、前記ディクシ
ョナリ中に存在しているストリングコードが、前記入力データストリーム中の文
字列を表し、かつ、前記ポインタアドレスによって示されているか否かを決定す
るための手段とを備えることを特徴とするデータ圧縮システム。
【請求項１３】前記決定手段が、前記ディクショナリから読み出された、
前記入力データストリーム中ですでに発生済みの複数の文字列を示すストリング
コード値を受け取り、かつ、ストアするためのバッファレジスタ手段と、前記入力データストリーム中に見出された最長整合文字列に対するストリング
コードをレシーバに伝送するための手段とを備えることを特徴とする、請求項１
２に記載のデータ圧縮システム。
【請求項１４】前記決定手段が、前記ディクショナリから読み出された、
前記ディクショナリの前記ポインタアドレスにおいてストリングコードが存在し
ないことを示すコード値を受け取るためのバッファレジスタ手段と、前記ポインタアドレスによって示される、前記入力データストリーム中の前記
文字列と置き換えるべき固有ストリングコード値を、前記ディクショナリに書き
込むためのストリングコード生成手段とを備えることを特徴とする、請求項１２
に記載のデータ圧縮システム。
【請求項１５】前記ポインタアドレス手段が、長さが２ⁿビットに等しい
ポインタアドレスをストアするためのレジスタを備えることを特徴とする、請求
項１４に記載のデータ圧縮システム。
【請求項１６】前記コードディクショナリが、２ⁿの最小ポインタアドレ
スを有するメモリを備えることを特徴とする、請求項１５に記載のデータ圧縮シ
ステム。
【請求項１７】前記ストリングコード生成手段が、可能ポインタアドレス
の数がコード値の数を超える、異なるポインタアドレスにおいて可変幅固有スト
リングコード値を生成するための手段を備えることを特徴とする、請求項１６に
記載のデータ圧縮システム。
【請求項１８】前記ストリングコードディクショナリが、幅が可変の前記
ストリングコード値に使用されるビット数より多いビット数を有するメモリロケ
ーションを備えることを特徴とする、請求項１２に記載のデータ圧縮システム。
【請求項１９】前記メモリロケーションの一部が、未使用ビット中にテー
ブル値をストアするためのテーブルを含むことを特徴とする、請求項１８に記載
のデータ圧縮システム。
【請求項２０】前記ストリングコードディクショナリが、関連するテーブ
ルレベル値メモリと、前記ディクショナリがより下位のテーブルレベルのストリングコード値で満杯
の場合、前記テーブルレベル値をより高いテーブルレベルにリセットするための
手段とをさらに備えることを特徴とする、請求項１２に記載のデータ圧縮システ
ム。