JPH04500571A

JPH04500571A - 圧縮された状態におけるデータをエンコードし、デコードし、伝送する方法と装置

Info

Publication number: JPH04500571A
Application number: JP1508289A
Authority: JP
Inventors: クラーク、アラン・ダグラス
Original assignee: ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー
Priority date: 1988-07-05
Filing date: 1989-07-04
Publication date: 1992-01-30
Anticipated expiration: 2015-02-07
Also published as: EP0350281B1; JP3006766B2; DE68907812D1; GB8815978D0; DE68907812T2; HK130194A; WO1990000837A1; ES2041997T3; EP0350281A1; CA1330838C; AU4037089A; US5153591A; AU626317B2; ATE92224T1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】（技術分野）本発明はデータを圧縮する方法および装置、圧縮されたデータをデコードする方法および装置、データを送信する方法、および圧縮されたデータを利用するデータ処理装置に関する。

上記方法および装置はサーチツリー（検索水）を有するディクシッナリを必要とする適応ストリングエンコード技術とこのサーチツリーを維持するための手段をすべて利用する。本発明は特殊だが専用的ではないＺｉｖ−Ｌｅｍｐｅｌアルゴリズムを利用する適応ストリングエンコードに適用できる。このアルゴリズムの基本的な手法はＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ’ＪＴ−２８，３ｒｄ　Ｍａｙ１９７７　ｐｐＢ９７−３４８°Ａ　Ｕｎｉｖｅｒｓａｌ　Ａｌｇｏｒｉｔｈｍ　ｆｏｒ　５ｅｑｕｅｎｔｉａ！Ｄａｔａ　Ｃｏｍｐｒｅｓｓｉｏｎ　”　 −Ｊ、　Ｚｌｖ　ａｎｄ　Ａ、　Ｌｅ＋ｍｐｅｌに記載されている。

（背景技術）基本的なＺｉｖ−Ｌｅｍｐｅｌエンコーダは各エントリ（登Ｂ）が関連するインデックス番号を持つディクシ５ナリを有する。初め、ディクシッナリはソースである基本的なアルファベットのみを含む。エンコード処理中、新しいディクショナリエントリは単独のシンボルを存在するエントリに追加することによって作られる。ディクシ５ナリはソースアルファベットの接続されたシンボルのサーチツリー構造であると考えられるだろう。ツリーにおけるノード（８点）はツリーの根で始まるシンボルの特別のシーケンスに対応し、データはツリーにおけるノードに対応する圧縮されていない入力データのシンポルのストリングを認識し、適合したノードに対応するメモリ位置のインデックスを送信することによって圧縮される。

対応するサーチツリーは圧縮されたデータを表すインデックスを受信するデコーダに供給され、圧縮されたデータをそれ本来の構成に復元するために逆処理がデコーダによって行われる。エンコーダのサーチツリーは、さらにシンボルのストリングが入力データにおいて識別されるエンコード処理中に徐々に成長し、圧縮されたデータをデコードするためのデコーダをイネーブルにするために、そのサーチツリーはエンコーダのサーチツリーに対応するように更新しなければならない。

Ｚｌｖ−Ｌｅｍｐｅｌアルゴリズムはサーチツリーをその基本的な構成で記憶するために無限に大きなメモリを必要とするので、Ｚｌｖ−Ｌｅ■ｐｅｌアルゴリズムを実際に実行するのが困難であることがわかってきた。しかしながら、Ｓｕｓｓｅｎｇｕｔｈ　（ＡＣＭ　ＳｏｒｔＳｙｍｐｏｓｉｕｍ　１９Ｂ２　）によって開示されている−　ｔｒｉｅ　”構造のようなデータ構造の使用によって、テキストストリングに関連した記憶効率やサーチ時間が大きく向上できる。ＥＰＡ１２７８１５（Ｍｉｌｌｅｒ＆Ｖｅｇｓａｎ　）やＥＰＡ１２９４３９　（Ｖｅｌｃｈ　）には、ｔｒｉｅ構造の使用を基にしたｚ１シーＬｅｌｐｅｌアルゴリズムと同じ手法が開示されている。

ＥＰＡ１２７．８１５　（Ｍｉｌｌｅｒ　＆　Ｖｅｇａａｎ　）では、メモリ効率を高め、エンコード処理をスピードアップするＺｉｖ−Ｌｅ■ｐａ＋アルゴリズムについての改良手法が記載されている。ディクシッナリは、単独のキャラクタを含む各ノードとプレフィックスストリングを表す親ノードに対するポインタと共に、ツリーの構造で保持される。ハッシニテーブルは、適合したサブストリングと次の入力キャラクタが与えられた場合、拡張されたサブストリングがディクシッナリにあるかどうかを判定するために用いられる。しかしながら、ハッシニテーブルには、ディクシッナリをエンコードするのに用いられる基本的なツリー構造の記憶に対して必要なメモリに加えて、十分な容量のメモリや処理時間が必要である。

ＥＰＡ１２９．４８９　（Ｖｅｌｃｈ　）では、入力メツセージにおけるシンボルのストリングが認識および記憶される高速データ圧縮伸張装置および方法が開示されている。ストリングはストリングテーブルに入力され、ストリングテーブルにおいて、Ｎ個（典型的にはＮは１から４）のハッシニテーブルアドレスのセットを与えるために先のフード信号と拡張キャラクタを含むハッシニキーを利用するハッシニ機能によってサーチされる。Ｎ個のＲＡＭ位置はシーケンシャルにサーチされ、もしアイテムがＮ個の位置にない場合、そのアイテムはテーブルにないとみなされる。この手順は圧縮効率を減少するといわれるが、実質的に実行が簡単であるといわれる。

ＵＳ　４，８１２．５３２　（Ｂａｃｏｎ　ｅｔ　ａｌ　）では、Ｚｊｖ−Ｌｅｓｐｅｌアルゴリズムを基にせず、キャラクタが発生する頻度の順序で、各キャラクタが通常続くキャラクタのｆｏｌｌｏｗ　ｓｅｔ”テーブルに関連したキャラクタの流れの動的エンコードのためのシステムが開示されている。それらのテーブルは予め決められた長さを有し、それゆえ、ツリーの枝分れの度合は必らず制限される。

米国公報（ＵＳ４，４６４．６５０）は、ＺＬｖ−Ｌｅｍｐｅｌアルゴリズムに基づいて、入力データを圧縮する方法について開示している。この方法は、メモリを備えたプロセッサにデータの連続記号を送り込み、入力データの記号ストリング（列）から、記号ストリングを表現するバス（ｐａｔｈ）を有するメモリに、記号の探索木の形式でディクシ日ナリを発生し、以前に探索木に格納されたバスを有する入力データに記号ストリングを整合し、さらに格納されたバスから入力データに応じた圧縮出力データを発生する各ステップからなる。しかしながら、回路群に利用されるデータ構造は高度に複雑であり、さらにハツシング（ｈ　ａ　ｓ　ｈ　ｉ　ｎ　ｇ）機能が要求されている。

説明される型のエンコーダの実現に固有の特殊な問題は、探索木が利用可能なメモリ空間の限界まで成長したときに発生する。新たなストリングを記憶するためのメモリ空間の確保のために、探索木のサイズを引き下げる（即ち、刈り取る）ことが必要である。このような機能を実現するいくつかの周知の方法がある。例えばコンビ二−タ・アーキテクチャと並列処理という書籍（ＨｗａｎｇとＢｒ１ｇｇ５著、ＭｃＧｒａｗ　Ｈｉｌｌ　１９８５年）に掲載されている。通常使用される技術として、ＭｉｌｌｅｒとＷｅｇｍａｎ　（ＥＰＡＩ２７８１５に記載）Ｉ；よりＺｉｖ−Ｌｅｍｐｅｌアルゴリズムを適用したＬＲＵ法（Ｌｅａｓｔ　Ｒｅｃｅｎｔｌｙ　Ｕｓｅｄ）がある。さらに、ＭａｙｎｅとＪ　ａｍｅ　ｓ　（Ｃｏｍｐｕｔｅｒ　Ｊｏｕｒｎａｌ　１９７５年１８．２１５７〜１６０ページに記載されているＩｎｆｏｒｍａｔｉｏｎＣｏｍｐｒｅｓｓｉｏｎ　ｂｙ　ＦａｃｔｏｒｉｓｉｎｇＣｏｍｍｏｎ　Ｓｔｒｉｎｇｓ）により同類のストリング・エンコーディング９アルゴリズムを適用したＬＦＵ法（Ｌｅａｓｔ　Ｆｒｅｑｕｅｎｔｌｙ　Ｕｓｅｄ）、ＦＩＦＯ（Ｆｉｒｓｔ　Ｉｎ　Ｆｉｒｓｔ　０ｕｔ）、ＬＩＦＯ（Ｌａｓｔ　Ｉｎ　Ｆｔｒｓｔ　０ｕｔ）、ＣＬＯＣＫアルゴリズムおよびランダム置換え法がある。後半の４つの技術は、Ｚｉｖ−Ｌｅｍｐｅｌアルゴリズムを適用しない内容である。圧縮効果に不利益をもたらす初期状態に戻すときに、探索木をリセットすることが知られている。また、メモリ容量が不足したときに、データ交換特性に悪影響を及ぼすため、新たなストリングの追加を中止することが知られている。

本発明の目的は、これらの先行技術に関する改善を提供することにある。このような目的を達成するために、本発明は以下のような構成を有する方法を提供することにある。この方法は、索引記憶領域を有するメモリを備えたプロセッサによりデータの連続記号を読出し、入力データの記号ストリング（列）から、記号ストリングを表現するバス（ｐａｔｈ）を有するメモリに記号の探索木の形式でディクシッナリを発生し、以前に探索木に格納されたバスを有する入力データに記号ストリングを整合し、さらに格納されたバスから入力データに応じた圧縮出力データを発生する各ステップからなる。

探索木に格納された記号群は、２つの異なるタイプのリンクしているポインタによりパスの構成にリンクされている。格納された記号群間の第１のタイプのポインタは、これらの記号群が入力された記号順に位置を与えられた記号の中から二者択一が可能であることを指示している。さらに、格納された記号群間の第２のタイプのポインタは、これらの記号群の両者が必要に応じて、記号順に発生することが可能であることを指示している。このような構成において、メモリが満杯のとき、探索木の一連の索引記憶領域が探索木のノードを含むならば、テストされて削除される。この探索木は、他のノードを指示する第２のタイプのリンクしているポインタを備えておらず、さらに新たなディクショナリ・エントリ（辞書エンド１ハ辞書登録）のために利用可能な自由記憶領域も備戴されていない木により表現されているストリングの幾つかまたは全部の削除に応じて、探索木の索引記憶領域のテストおよび削除を行なう。この特徴は制限されたサイズのメモリに高度に複雑な探索木を格納することを可能し、前記の米国公報（ＵＳ４，４６４，６５０）とＥＰＡ１２７８１５の両者の構成と比較すれば、有用な簡単化を実現することができる。

また、米国公報（ＵＳ４，４６４，６５０）は、対応する圧縮データをデコードする方法について開示している。この方法は、メモリを備えたプロセッサにデータの連続記号を送り込み、記号の探索木の形式でディクショナリをメモリに格納し、さらに圧縮データをデコードデータに変換するための探索木を利用する各ステップからなる。

他の見地として、本発明は前記の方法により圧縮された圧縮データをデコードする方法を提供する。この方法は、メモリを備えたプロセッサが圧縮データの連続文字列を読出し、圧縮データから組み立てられた記号群の探索木の形式でディクシ■ナリをメモリに格納し、さらに圧縮データをデコードデータに変換するための探索木を利用する各ステップからなる。探索木に格納された記号群は、２つの異なるタイプのリンクしているポインタによりパスの構成にリンクされている。

格納された記号群間の第１のタイプのポインタは、これらの記号群が同一記号数と同一の接頭語を有する記号群のデコードされた異種のストリングを関連付け、そのような異種のストリングの各最後の記号であることを指示している。さらに、格納された記号群間の第２のタイプのポインタは、これらの探索木は前記のような本発明の一方の見地に基づいて定義された方法により処理されることが特徴である。

また、ＵＳ　４．４６番、６５０には、入力データの連続した受信シンボルを受信可能なブロッセッサと、メモリと、入力データにおけるシンボルのストリングを表すパスを有するシンボルのサーチツリーをメモリに格納する手段と、入力データにおけるシンボルストリングとサーチツリー内の予め格納されたパスとの整合をとり、入力データに対応する圧縮された出力データを格納されたパスから発生する手段とを具備する入力データ圧縮のためのエンコーダも開示している。

この発明の別の見地によれば、入力データを圧縮するエンコーダであって、入力データの連続したシンボルを受信可能なブロッセッサと、指標付きメモリロケーションを有するメモリと、入力データにおけるシンボルのストリングを表すパスを存するシンボルのサーチツリーをメモリに格納する手段と、入力データのシンボルストリングとサーチツリー内の予め格納されたパスとの整合をとり、入力データに対応する圧縮された出力データを格納されたパスから発生する手段とを具備し、サーチツリー内の格納されたシンボルは２つの別個のタイプの連結ポインタによって前記パスを形成するように連結されており、格納されたシンボル間における第１タイプのポインタは、これら格納されたシンボルが入力シンポルシーケンスの所定の位置において択一可能なシンボルであることを示し、格納されたシンボル間におけるｊｉ２タイプのポインタは、これら格納されたシンボルが入力シンポルシーケンスにおいて順番に双方とも発生することを示すエンコーダにおいて、使用時において、プロセッサが、メモリが満たされた時、サーチツリーのシーケンシャルな指標付きロケーションを検査し、別のノードを示す第２タイプの連結ポインタを有しないサーチツリーのノードを含むメモリロケーションを削除して、新規辞書エントリ可能な空きメモリロケーションを結果として得ることを決定するように構成されることを特徴とするエンコーダが提供される。

また、Ｕ　Ｓ　４．４８４．６５０は、圧縮データの連続したシンボルを受信可能なプロセッサと、メモリと、辞書をシンボルのサーチツリーの形式でメモリに格納する手段とを具備し、プロセッサが、サーチツリーを利用して圧縮データをデコードされたデータに変換するように構成されている圧縮データのデコードのためのデコーダを開示している。

この発明の他のもう一つの見地によれば、圧縮データをデコードするデコーダであって、圧縮データの連続したシンボルを受信可能なプロセッサと、指標付きメモリロケーションを有するメモリと、辞書をシンボルのサーチツリーの形式でメモリに格納する手段とを具備し、プロセッサが、圧縮データからサーチツリを構築し、サーチツリーを利用して圧縮データをデコードされたデータに変換するように構成され、サーチツリーにおける格納されたシンボルが２つの別個のタイプの連結ポインタによって連結され、格納されたシンボル間の第１タイプのポインタは、これらシンボルが異なったデコードされたシンボルのストリングに関係し、その異なったデコードされたストリングが同一数のシンボルを有しており、これらシンボルがこのような異なったストリングのそれぞれの最終シンボルあり、格納されたシンボル間の第２タイプのポインタは、これらシンボルがデコードされた出力シンボルのストリングにおける連続したシンボルであることを示すデコーダにおいて、使用時に、プロセッサが、メモリが満たされた時、サーチツリーのシーケンシャルな指標付きロケーションを検査し、別のノードを示す第２タイプの連結ポインタを有しないサーチツリーのノードを含むメモリロケーションを削除して、新規辞書エントリ可能な空きメモリロケーションを結果として得ることを決定するように構成されることを特徴とするデコーダが提供される。

さらに、この発明の特徴は従属クレームに記載されている。

この発明に利用できる他の特徴は、コンピュータ、１９８４．６月、第８乃至１９頁の論文’Ａ　Ｔｅｃｈｎｆｑｕｅ　ｆｏｒ　Ｈｌｇｈ−Ｐｅｒｆｏｒｍａｎｃｅ　Ｄａｔａ　Ｃｏｍｐｒｅｓｓｊｏｎ　’にＷｅｌｃｈによって記載されている。この論文は、参考文献として本願に添付されており、この論文は、Ｚｉｖ −Ｌｅ■ｐｅｌアルゴリズムの初期性能の改良方法を記載している。最初の段階では、辞書はほとんど空であり、入力データのシンボルストリングのエンコードには少ない数のビットで十分である。辞書が成長すると、コードワードサイズは予め決められた最大値まで増大する。これは、１万個から２万個までシンボルのエンコーどの処理性能を改善できるが、処理の複雑さの増大はいなめない。

この発明の実施例を以下図１乃至図１３を参照して説明する。

図１はこの発明において用いられるサーチ−ツリー（ｓｅａｒｃｈ　ｔｒｅｅ）を示す図、図２はこの発明において用いられる他のサーチ・ツリーを示す図、図３はこの発明にしたがうデータ・コンブレシラン・プロセスにおけるサーチ・ツリーの展開を示す図、図４はこの発明に用いられるエンコード用アルゴリズムの基本的なフロー・ダイアグラム、図５はこの発明に用いられるデコード用アルゴリズムの基本的なフロー・ダイアグラム、図６はこの発明にしたがうデータ・コンブレシラン−プロセスにおけるサーチ・ツリーの“リーフ（ｌｅａｆ）”の挿入を示すダイアグラム、図７はこの発明の辞書を更新するためのアルゴリズムを示すフロー・ダイアグラム、図８は図３（ａ）のサーチ・ツリーの示す図、図９はこの発明の辞書のアルゴリズムのフロー・ダイアグラム、図１０はこの発明にしたがうエンコーダを用いるデータ処理システムの概略的なダイアグラム、図１１は二の発明にしたがうデコーダを用いるデータ処理システムの概略的なダイアグラム、図１２はこの発明にしたがうエンコーダおよびデコーダを組込んでいる通信システム部の概略的なダイアグラム、図１３はメモリの指定されたメモリ・ロケーション・アレジメントを示すダイアグラムである。

図１を参照すると、簡素化されたサーチ・ツリーが示されており、シンボルＳ１には他の三つの異なるシンボルＳ２、Ｓ３、Ｓ４のいずれか一つが従属している。−例とし、シンボルＳ１、Ｓ２、Ｓ３、Ｓ４にはそれぞれ、“ｃ“、ａ゛、“ ｅ”、°ｈ”が割り当てられ、それによりこのサーチ・ツリーは４本のストリング′ｃ２、”ｃ　ａ’、’ｃ　ｅ”、“Ｃｈ”を示している。したがうて、シンボルｓ１は上記したような゛第２のタイプの２リンク用ポインタ、すなわちダウン・ポインタＤによってシンボルＳ２にリンクしている。シンボルＳ２、Ｓ３およびＳ４は、シンボルｓ１の後の入力データにおけるストリングで生じる異なるシンボルであるので、それらシンボルは上記したような“第１のタイプの′、すなわち右側ポインタＲおよび左側ポインタＬによってリンクしている。同様の技術がバイナリ・ツリー（例えば、デー・クナス（Ｄ、Ｋｎｕｔｈ）著“コンピュータ・プログラミング技術”、第１巻および第３巻）の表示に用いられている。

しかしながら、このデータ構造はｍ−ａｊ）’サーチ・ツリーを示すのに用いられている。

リンク用ポインタＤおよびＲを用いることによってシンボルＳ１からシンボルＳ２、Ｓ３．Ｓ４のいずれかにサーチ・ツリーを介してサーチすることも可能である。また、左側ポインタＬにしたがうことによってシンボルＳ４の左側にサーチすることも可能である。図１（ｂ）においては、二つのシンボル位置がポインタによってリンクされて示されており、これらはフリー・メモリ・ロケーションのリストを形成している。このリストはサーチ・ツリーからは分離されているけれども、メモリ・ロケーションはフリー・リストとサーチ・ツリーとの間に移送される。入力データのシンボル用総記憶容量はサーチかツリーのメモリーロケーションおよびフリー・リストにおけるメモリ・ロケーションを含んでいる。シンボルＳ１乃至Ｓ４の一つを特定するためにはシンボルの“親１、すなわち直接先行するダウンポインタＤに接続されたシンボルを知ることが必要である。これは各場合において、例えば親インジケータＰによって指示され、文字１ｃ＃がシンボルＳ１として格納された場合には、それはシンボルｓ２、Ｓ３、Ｓ４の親となり、親インジケータＰはＣ”のメモリ・ロケーションを指示する。図１の実施例においては、親インジケータＰはデコーダのサーチ・ツリーにおいてのみ要求され、エンコーダのサーチ・ツリーには要求されていない。そうでない場合には、エンコーダのサーチ拳ツリーとデコーダのサーチ・ツリーとは同じである。

そのノードＳが親であるサーチ・ツリー内のノードは、Ｓの従属ノード、あるいはＳの従属体と呼称される。Ｓの従属ノードはＳで示されるストリングに単一文字を付加することによって形成されたそのストリングを示す。アルファベットを構成するシンボルのようにいくつかのノードについては、多数の従属ノードが存在することができる。

因２はより好ましい実施例が示されており、左側ポインタＬは除外されており、親ポインタＰはエンコーダおよびデコーダのサーチ・ツリー内に生じる。そうでない場合には、サーチ・ツリー構造は、図１に示されるそれと同じになる。再びくり返して言うと、シンボル・ロケーションのフリー・リストは１２　（ｂ）に示すメモリ内に保持される。

辞書あるいはサーチ・ツリーは、通常、根源となるシンボルの基本セット、あるいはそれから派生した基本長に二つ以上のシンボルのストリングを示すエントリ（登録）、あるいはノードのみを含んでいる。多くの適用例においては、通常のアルファベットの他に付加的なシンボルを提供するのが望ましい。そのためには、例えば文字の繰返し発生をエンコード（ラン争レングス（ｒｕｎ　ｌｅｎｇｔｈ）　・エンコード）するための、あるいはストリング・マツチング・プロセス（図１３参照）の異常終了を指示するための手段を必要とすシーケンスａｂｃａｂａｂｃａｂｃの符号化は符号化処理中における検索ツリーの評価を示す第３図及びこのｊｉ３図に示される検索ツリー（木）を表す辞書の実際の内容を示すテーブルｌを参照して以下に説明する。以下に示されるように検索ツリーは辞書エントリ１〜ＭのポインタＤＲ及びＰをメモリに使用できる最大値に設定することによって延ばされる。

テーブルＩ　（ａ）表されたインデックス　シンボル　ＤＲＰ　ストリングｌ　ａ　（２）　ａ２　ｂ　（３）　ｂ３　ｃ　ｃテーブルＩ　（ａ）及び第３（ａ）図に示されるように辞書は最初、辞書エントリ１．２及び３にそれぞれ記憶されているシンボルａ、ｂ及びＣだけを含んでいる。これらは所定の順序で記憶されても良く、従って、辞書エントリ１は辞書エントリ１に位置する右側リンクポインタ２によって辞書エントリ２にリンクされる。好適な方法は各シンボルの通常の値をテーブルのその位置に一致することである。故に、Ｎシンボルのセットは範囲０〜Ｎ−１または１〜Ｎ内の通常の値を割り当てられる。この割当はシンボルを数として表す二値パターンに単に関連することを含んでも良い。メモリのこれらの内容は第３（ａ）図に示されるような構成を含んでいる。

多くの応用において、これらの構成の最初のものが好ましい場合、可能なシンボルのいくつかだけが発生する。可能なシンボルのほとんどが発生する応用において、第２の方法が初期文字の検索時間を減少させる。従って、この第２の方法を以下に説明する。

シーケンスの最初のシンボル、この例では、“ａｌがエンコーダに入力される。

このシンボルはストリングの最初の文字を表すので、エンコーダは文字の通常の値、この例では、１を使用し、この文字に対応する検索ツリー内のノードを直接にアクセスする。このノードはエンコーダに知られ、文字で始まる全てのストリングを表すツリーの根を形成する。

シーケンスの次のシンボルがエンコーダによって受け入れられ、現ノードのＤポインタが従属ノードのリストを捜し出すために使用される。エンコーダは一般的に次のシンボルを従属ノードに含まれるシンボルの１つに整合しようとする。

この試みはノード１がある従属性を有していないのでこの例のように失敗すると、現ノード／辞書エントリのインデックスを表すコードワード、この例では、数字１を表すものが送信される。不整合のシンボルが新しいストリングの最初を形成するために使用される。

エンコーダはストリングが再度発生したときにこのストリングがもっと効果的に符号化されるように検索ツリーにストリングａｂを加えることができる。これはこの例において検素ツリー（辞書）に新しいノード（エントリ）ナンバー４を作ることによって達成される。テーブルＩ　（ｂ）及び第３（ｂ）図に示されるようにノードが文字“ｂｏを有し、従属ノードに対するＤポインタは最初ゼロに設定され、ノードの親に従属するリストの他のノードに対するＲポインタはこの例ではゼロに設定され、親に対するポインタはこの例では１に設定される。

テーブルＩ　（ｂ）表されたインデックス　シンボル　ＤＲＰ　ストリングこの処理は“ｂゝが新しいストリングの最初の文字として使用される状態で繰り返される。シーケンスの次のシンボルが“Ｃｏであり、それゆえ、上述した処理を用いて、エンコーダはツリーの中のストリングｂｃ”を見つけようとする。

このシーケンスはエンコーダには知られていない。故に、ストリングｂ”を表すノードのインデックスがデコーダと交信され、ストリングｂｅ’が検索ツリーに加えられる。文字“Ｃ”が新しいストリングの最初を形成するために使用される。更新辞書はテーブルＩ　（ｃ）及び第３（ｃ）図の対応する検索ツリーに示される。

表１　（Ｃ）インデックス　記号　Ｄ　Ｒ，Ｐ　表されたストリング１　ａ４　ａ２　ｂ５　ｂ３　ｃ　ｃ４　ｄ　１　ｍｂ５　ｅ　２　ｂｃ次の記号ａ１この例ではシーケンスの中の第４番目の記号が読み出され、検索ストリングに付加される。エンコーダはその辞書の中でストリングＣａの位置を捜し出すことを試みる。このストリングは未だ存在しないので、Ｃに対応する辞書へのエントリの指標は、デコーダに通信され、指標／文字対（３，ａ）とも見なされるストリングＣａが辞書（検索ツリー）に加えられる。これにより、表１　（ｄ）に示す辞書と、第３（ｄ）図に示す検索ツリーが発生される。整合がとれなかった文字ａは新しい検索ストリングを開始するために使われる。

表１（ｄ）インデックス　記号　ＤＲＰ　表されたストリング次の記号すが読み出され、検索ストリングに付加され、ストリングａｂが形成さりる。記号ａに対応するＤポインタはａの従属変数のリストの位置を捜し出すために使われる。エンコーダはＲポインタを用いて従属変数のリストの中から検察ストリングの最後の文字を検索する。この例では、指標４で調べられた第１の辞書へのエントリは文字すを含むので、エンコーダは検索ストリングを辞書エントリと整合する。

入力シーケンス中の第６番目の文字である次の記号ａがエンコーダにより読まれ、検索ストリングに付加され、ストリングａｂａが形成される。エンコーダは最後に整合された辞書エントリのＤポインタ、ここでは４、を用いてストリングａｂの従属変数のリストの位置を捜し出す。辞書には従属変数が既知ではないので、表１（ｅ）、第３（ｅ）図に示すように、新ストリングａｂａ、または（４，ａ）が辞書に加えられる。指標４がデコーダに通信され、整合されなかった文字ａが新検索ストリングを開始させるために使われる。

表１　（ｅ）インデックス　記号　ＤＲＰ　表されたストリング表Ｉ　（ｅ）は第３（ｅ）図に対応する。　。

エンコーダは次の記号を読出し、検索ストリングに付加し、新袴索ストリングａｂを形成する。エンコーダは上述した手続を用いてこの新検索ストリングを辞書中で検索し、辞書エントリ４と整合させる。次の記号Ｃを読出し、検索ストリングに付加し、新検索ストリングａｂｃを形成する。エンコーダはａｂの従属変数のリストを検索することにより、この新検索ストリングの位置を捜し出そうと試みるが、ａｂｃを発見することに失敗する。ａｂの指揮、すなわち４はデコーダに通信され、表１（ｆ）、第３（ｆ）図に示すように、新ストリング（４，ｃ）がエントリ番号８として辞書に加えられる。

表１　（ｆ）インデックス　記号　ＤＲＰ　表されたストリング７　ａ　８　４　ａｂａ８　ｃ　４　ａｂａ次のストリング−エンコーディング争サイクルの間に、エンコーダは、ストリング”ｃａ＝を辞書中のエントリー６と整合させ、６をデコーダーに送り、ｃａｂ又は（６，ｂ）を辞書に加える。以降のサイクルの間に、エンコーダは、ストリング”ｂｅ−を辞書中のエントリー５と整合させ、（５゜Ｘ）を辞書に加え得る。Ｘは示されたシーケンスの最後に続く文字である。

コノヨうニジ−ケンス−ａｂｃａｂａｂｃａｂｃ−は、インデックス値１２３４４６５のリストを使用してエンコードされ得、それは程度の小さい圧縮を与える。もし、エンコーダより同じシーケンスに再び出くわすようなことがあると、エンコーダはそれをａｂｃ−（辞書エントリ８）として、”ａｂａ−Ｃ辞書エントリ７）として、−ｂｅ−（辞書エントリ５）として、−ａｂｃ−（辞書エントリ８）としてエンコードするだろうし、結果的には、シーケンス８７５８を伝送することになる。もし記号シーケンスが少なくとも１２回あったとすると、エンコーダは、一つの単一指標値によってそれを代表し、そのため程度の大きい圧縮を与える。

エンコーディングアルゴリズムは第４図により詳しく示される。ステップｉにて変数は初期化され、そのとき、繰返して、入力メツセージ中の文字に係る最長可能シーケンスは、ステップｉｆの検索ツリーストリング上で位置合わせ（ｍａｐ）される。例えば、入力メツセージの端にあるシーケンスｂｃは、第３（ｆ）図中のストリング整合上で位置合わせ（ｍａｐ）される。ステップｉｉｉでは、整合されたストリング（例えばｂｃ）又は複数のエンコードした表現に対応する終了ノード指標が与えられと、検索ストリングはそれ以降の文字入力メツセージをセットする（ステップｊｖ）。

追加した次の文字ストリングが辞書に無い場合、ストリング整合処理は、通常は終了する。しかし、他の場合にあっては、例えば、（１）ソースから文字を受取らないことが、最後の文字の受取りから幾つかある特定時間インターバル内に起きた場合、　（２）ストリング長さが幾つかある最大値の中でバッファリミットを超えるものに達した場合、（３）　Ｉ！ｉつかある特定時間インターバルが、エンコーダがストリングをエンコード開始してから生じた場合、はストリング整合は例外的に終了する。これらの例のうちの第２例では、デコーダは例外的な終了が有ることを推察できるであろう。第１及び第３の例では、エンコーダは終了したストリングを示す指標（インデックス）の送信に続いて指示を送信する。この指示はソースアルファベットのオリジナルの値以外の付加的制御記号で、これが単一コードワードとしてエンコードされ得る。

整合ストリングの指標及び次の整合がとれなかった文字は辞書に加えられなければならない。これらが直ちに辞書に加えられると、エンコーダは、デコーダが辞書エントリと等しい構造を与えるに十分な情報を受取る前に、新しいエントリの使用を開始する。こうして以前の指標／文字対はストアされ（Ｖ）、そして提示された指標／文字対もストアされる（ｖｉ）。辞書が一杯になったら、幾つかの格納スペースを確保するための処理が行われる。新しい辞書エントリを加える処理及び格納スペース確保する処理を以下に説明する。更新（アップディト）処理で使用される前に、ストアされた指標／文字対により参照される辞書エントリが削除されないようにするために、辞書エントリは以下に説明する手続きを経てｎ　ｅ　ｗ−がマークされる。

第５図は対応するデコーディングアルゴリズムを示している。ステップｉにて変数は初期化される。受は取られたコードワードは、伝送された指標Ｊを回復するためのステップｉｉ中で初めデコードされる。なお、指標Ｊはエンコードされたストリングを示す。Ｊの値は、デコーダに対し該デコーダがエンコーディグストリングに対応する辞書エントリデーコーダを直接にアクセスすることを可能とする。前記ツリーはエントリＪからストリングの根（頭）に向って再トレースし見直され、そして当該ストリングはステップｉｉｉにて読み出される。例えば、値８が第３（ｆ）図の検索ツリーを持つデコーダにより受取られたならば、辞書エントリー８のツリーのリーフ（ｌｅａｆ：字）において記号Ｃが見出だされ、モしてｐポインタ７及び４を根のａに向けて再トレースし、このシーケンスＣｂａを読み出す。このシーケンスは、そのときオリジナルシーケンスａｂｃを再度発生するべく次のステップｉｖ中で逆転され、それがステップＶ中では制御文字により抑制されないならば、デコーダアルゴリズムは辞書は最新する処理を行う。

更新化された検索ツリーの一例は第６図に示され、そして対応するメモリの内容は表■で示される。

テーブル■ インデックス　記号　ＤＲＰ　新エントリ　表されたストリング１　ａ４　０　ａ２　ｂ５　０　ｂ３　ｃ６　０　Ｃ４ｂ　７　１　０　ａｂ５　Ｃ２０ｂｅ６　ａ　３　０　ｃａ８　ｃ　４　０　ａｂｃｎ　ｂ　８４１　ａｂｂテーブル■がテーブルＩ　（ｆ）に対応し、さらに、辞書エントリｎにシーケンスａｂｂが付加されていることが理解できる。このシーケンスをサーチツリーに追加するために、ノード７とノード８のリンクが切断され、テーブル…と第６図に示されるように、新しいノードがこれらの間に接続される。

値ｎと値８を有する新しい右向きのリンクポインタ（リンキングポインタ）Ｒは第６図に下線を付して示され、新しい符号すも下線を付して示される。第６図に概念的に示されるサーチツリーの変更は、テーブルＤの辞書エントリー７のＲポインタの値を８からｎに変更すること、及び辞書エントリｎに新しいＲポインタ８とＰポインタ４を追加することにより行われる。

更新アルゴリズムが第７図のフローダイアグラムに正式に示される。このアルゴリズムはエンコーダーとデコーダーの両方に適用される。第１に、辞書が満杯状態か否かがステップ１で検出される。辞書が満杯の場合、サーチツリーは削られなければならず、この処理手続は第９図を参照して以下に説明される。しかし、ここでは、このような事態が発生していないと仮定する。この場合、空白メモリスロットがフリースロット（第２ｂ図に示される）からステップＨにおいて取得される。ステップ１１１で、新しいシンボル（テーブルＨの場合はｂ）がメモリスロット（テーブル■の場合はｎ）に書き込まれ、必要なポインタ（テーブル■ の場合は辞書エントリーのＲ）が再セットされる。ステップ１ｖにおいて、新しいエントリの親ノードが現存する従属関係を有するか否かがチェックされる。現存する従属関係を有する場合、ステップＶにおいて、上述の例のような従属関係リスト内に新しいエントリが挿入される。現存する従属関係を有しない場合、ステップｖ１において、新しいエントリが親ノードに接続され、親のＤポインタが新しいエントリのメモリ参照番号にセットされ、新しいエントリのＰポインタが親ノードのメモリレファレンスにセットされる。

第８■を参照して、第８（ａ）図はテーブル■と第６図に図示される更新処理手続に続くサーチツリーの状態を示す。

これらのサーチツリーのシンボルは、もしこれらの点においてサーチツリーが成長していない場合には、有用ではないと考えられる。ここで、前記サーチツリーはそれから下方向に延びるＤリンキングポインタを有しない（そして、該サーチツリーはマツチされたシンボルシーケンスの終端で発生する）（枯葉）は破線で第８（ａ）図に示される。そして、第６図に示される更新処理手続において追加された新しいエントリｂは、そこからの新たなサーチツリーの成長を期待できる゛ニニーリーフ”　（若葉）であることを示すためにそのようにマークされる。

従って、それは刈り込み（削除）から保護される。以前の最近の繰り返しにおいて追加されたツリーの他の葉も保護されることも考察される。

第８（ａ）図に破線で示されるサーチツリーのシンボルは刈り込まれ、その結果、第８（ｂ）図の新しいサーチツリーと４つの刈り込まれたシンボルのフリーリストとなる。新しいエントリｂは保存される。確認のため、サーチツリーの種々のシンボルに対応する実際のシンボルの流れは第８図に示され、第６図の更新処理手続において付加されたシンボルシーケンスａｂｂが保存される点から考えると、シンボルの流れｂｃ、ｃａ、ａｂａとａｂｃは削除される。

刈込み手順は、正式に第９図に示されている。ステップｉにおいて、辞書は、充分で且つ簡潔にする準備が整っているか否かをチェックされ、もし、整っていればメモリのポインターは、列の最初に続く辞書エントリ、即ちテーブル■のシンボルｂと第８（ａ）図に従うエントリ４にセットされる。

ステップ１１１において、このエントリは、そこから延長しているダウンポインターを有しているかどうか決められ、第８（ａ）図の場合は、シンボルｂがダウンポインター７を有していることがわかる。従って、このエントリはエンドノードではなく、アルゴリズムはポインターをステップｖｉ　（又、どの新たなフラッグをもクリアにする）において、次のエントリに進ませ、それによって、ステップｖ１１を介して次のエントリに進みシーケンスａｂａのシンボルａは、エントンノードとなる。従って、アルゴリズムは、次いで、新たなエントリフラッグによって、刈込み（削除）手順に対して保護されているかどうかをチェックし、そうでないので、ステップＶでエントリを抹消し、対応するメモリ位置をフリーリストに加え、ポインターをリセットする。前記ポインターのリセット動作は簡単にテーブル■と第６図から類推してｊｉ８図から推し、計ることができる。

この手順は、偶発的に、新たなエントリフラッグによって、保護されている以外の“エンドノード°　（即ち、これらから他のシンボルに延長されているダウンポインターＤを有していない）の全てを抹消する結果をもたらす。このことは、辞書の更新を完了し、アルゴリズムは、次いで、エンコーデングアルゴリズムの場合に、第４図のステップｖ１と、デコーダできる。辞書の更新と、簡潔にする手順は、エンコーダとデコーダの両者のサーチツリに同様に行なわれる。この簡潔にする手順は単一の手順で辞書の全てのメモリ個所をテストするという事実から見ると、簡潔にする手順は、いろいろな方法、即ちステージ毎の多くのメモリ個所、ステージ毎の多くのフリーのメモリ個所で決められるステージで行なわれる。

メモリと手順を増やすことで、簡潔にするアルゴリズムのパフォーマンスを改良することのできる追加の手順として、エンコーダからのコードワード出力は、これら出力が用いられる周波数のある態様に依存する長さが割り当てられる。このために、二つの方法が以下のように述べられ、これは伝達される辞書インデクスを表すコードワードを発生する第４図Ｃ１１１）に示さにれるエレメントに適応される。

第１の方法は、以下の先行技術文献に記載され公知されている。“ミニマムリダンダンシーコードの構成方法”ディニーホフマン著、会報ＩＲＥ４０．９．巻１９５２（Ａ　Ｍｅｔｈｏｄ　ｆｏｒ　ｔｈｅ　Ｃｏｎ５ｔｒｕｃｔｉｏｎ　ｏｒ　Ｍｉｎｉｍｕｍ　Ｒｅｄｕｎｄａｎｃｙ、ｂｙ　Ｄ＾）１ｕｒｆｍａｎ、ｐｒｏｃ　１ＲＥＶｏｌ　４０．　９．　１９５２）、“マキシマティカルセオリーオブコミニニケシラーン′シーイーシャノンン著、ベルシステムテクニカルジャーナル、２７巻、１９４８　（Ａ　Ｍｅｔｈｍａｔｌｃａｌ　Ｔｈｅｏｒｙ　ｏｒ　Ｃｏ５ｕｎｌｅａｔ１ｏｎ、ｂｙ　ＣＥＳｈａｎｎｏｎ、Ｂｅ１ｌ　Ｓｙｓｔｅｍ　Ｔｅｃｈｎｉｃａｌ　Ｊｏｕｒｎａｌ、ｖｏｌ　２７．　１９４８）、及び“算数コーディングの入門°、ジーラントン著、アイビーエムジャーナルオブリサーチアンドデベロップメント、２８．２．　巻１９８４　（Ａｎ　Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　Ａｒ１ｔｈｓｅｔｉｅ　Ｃｏｃｌｉｎｇ’　ｂｙ　Ｇ　ｈａｎｇｄｏｎ、ＩＢＭ　Ｊｏｕｒｎａｌ　ｏｆ　Ｒｅ５ｅａｒｃｈ　ａｎｄ　Ｄｅｖｅｒｏｐｇ＋ｅｎｔ、ｖｏｌ、　２８．　２．　１９８４）周波数のカウントは各辞書エントリと関連付けられていて、エントリが使用される毎に増加する。この周波数は、辞書エントリによって表わされた一連の発生の可能性と先行文献において限定されている手順に従って割り当てられたコードワードを計算するために用いられる。一連の可能性に関連するコードワード長ｈｓは、一１ｏｇ２　（Ｐｓ）＜ｈｓ＜１−１−１ｏ　（Ｐｓ）で表わされる。

第２の方法は第１の方法より、一般的に効果は少ないが、手段としては簡単である。

追加のＵポインターは各辞書エントリと関係していて、サーチツリーの構成には関係なく辞書エントリのＬＦＵ（ｌｅａｎｔ　ｆｒｅｑｕｅｎｃｙ　ｕｓｅｄ）リストを形成するために、使用される。

このリストは、一連の周波数順序を、傭た形で決めるために使用される。又、長さインデクスは各辞書エントリに関連している。

辞書エントリが使用されると、辞書エントリをカレントエントリの上に位置させるためにＵポインタを用い、Ｕポインタと二つのエントリの長さインデクスを交換することによって、ＬＦＵリストは、繰り上げられる。このようにして、より、しばしば用いられたエントリはＬＦＵリストの開始点に向って移動される。長さインデクスはリストの要素の順序と関連付けられ、即ち、最も頻繁に使用された辞書エントリは、長さエントリ１を有する。コードは固定または動的ベースに基づいて、及び、長さインデクスに基づいて割り当てられたコードワード及び、低いインデクスを伴う辞書エントリに割り当てられているより短いコードワード上に発生する。この第２の方法は、同様なリストを挙げているようにＥＰＡ１２７．８１５のミラー及びベグマン（Ｍｉｌｌｅｒ　ａｎｄ　Ｗｅｇｗａｎ　）によって述べられている簡潔アルゴリズムに適応するのが好ましい。しかしながら、長さインデクスをそれらのデータ構成に加えることが必要である。広く用いられている辞書エントリをリンクされたリストにおけるその真上のエントリと交換するための、Ｕポインターの使用に代えて、交互の手順は、リンクされたリストにおけるトップの位置に、広く用いられている辞書エントリを動かすことであり、以前にトップの位置にあるエントリは第２の位置等に移動される。リンクされたリストは、略、最近使用されたファンクションを表わしていて、それによって、ある時刻に使用されなかったエントリはリストの下に押し下げられ、そして頻繁に使用されたエントリはリストのトップの位置に置かれることになる。

追加の手順は、追加の開始時刻を使用することでエンコーダのパフォーマンスを改良することができるので、辞書は初めに、例えばｔｈ＝、−ｔｈａ−，−ｔｈｅ−，”Ｔｈ″。

＝Ｔｈｅ″、・・・を規則正しく、生ずるよう通常、知られている一連の文字を含ませることができる。

追加の手順が行えるものとして、もし辞書が記憶されるメモリが、通常のケースとして、大記憶装置が存在するとき、又はメモリが不揮発性である時に、連続するメツセージの伝達間に情報を保持することができるならば、辞書は前のメツセージをエンコーデングしたり、デコーディングしたりする間、記憶された一連のセットを最初に含ませることができる。

例えば、伝達装置は前の伝達装置と通じた第２の伝達装置と呼ぶことができる。

各々のエンコーダとデコーダの対は、公知の原則に従って、ある単純なチェックサムを発生することによって及び前記チェックサムを比較することによってそれらの辞書を比較することができる。

もし、辞書が同等でない場合には、ある知られている最初の状態にリセットされる。

エンコーダとデコーダとの間のリンクにエラーがある場合のアルゴリズムの信頼性を向上させるための他の方法として、デコーダはエラーを表わすエンプティ又はフルの状態のデイクシッナリーの入力に対応して受け取ったコードワードに関連させて動作させ、エンコーダにはそのディクショナリーをリセット又は再初期化するように要求を出す。これらの方法は、オートマチイックリピートリクエストのようなエラー検出方法が通常用いられることから、普通には用いられない。

他の方法として、エンコーダによってチェックサムが周期的に算出され、これがデコーダへ送られ、デコーダ側で同様にして算出された値と比較するようにした方法がある。

第１０図は大容量記憶装置、例えばディスク装置１に記憶された非圧縮データを対応する圧縮データに変換するためのデータ処理回路を示す。これによって大容量記憶装置からメモリを取り出すことができる。マイクロプロセッサμＰを有するエンコーダ２がメモリ３と結合され、このメモリ３には上述のアルゴリズムによるサーチツリーが記憶される。遅延回路４は、新しいシンボルが大容量記憶装置から受入れられる以前にディクショナリーが必らず更新されるようにするためのものである。

第１１図は大容量記憶装置１中の圧縮データを非圧縮データに変換するためのデコーダ回路を示す。このデコーダ回路はメモリ３に接続されたデコーダ５を有し、メモリ３中には上述のアルゴリズムによって更新されるサーチツリーが記憶される。

第１２図はターミナル６とこれに関連したインターフェース７とを示す。このインターフェース７は、メモリ３と遅延装置４とに接続されたエンコーダ２、およびメモリ３に接続されたデコーダ５とによって通信リンクとの間でデータの送受を行なうために設けられている。このエンコーダとデコーダとに接続されたメモリ３には、上述のアルゴリズムによってディクシεチリ−が記憶される。図１２の回路によって、通信リンクの反対側に接続された対応する装置（図示せず）との間で通信が可能である。

ソースエンコーダを設計する場合には、エンコーダの入力がソースアルファベットからの独立したシンボルであると仮定することが多い。従ってこのシンボルのサイズは既知である。最近の多くの通信システムでは同期伝送方式が用いられ、ここではデータは独立した文字としてではなく連続したビット列として取り扱われる。

非２道形のシンボルを２造形で出力する同期ソースのためのソースエンコーダを設計する場合には、種々の方法が考えられる。シンボルサイズが一定で未知の場合には、最適ソースコード形式が得られる文字長をサーチによって見付けることができる。例えば、データのサンプルを取得でき、仮定された文字サイズが１から最大ビット数へ変換され、各々の場合について情報内容が見積られ、この情報内容と文字サイズとの比が最大の圧縮比を達成するために設定される。

各シンボルｊの発生の確率Ｐｊが予測され、シーケンスｎ当りのビット数はシンボルの情報内容、ｎを増加させるために変更される。

直列エンコーディング法を用いれば他の方法も可能である。

この場合、シンボルサイズは自由に選定される。これは、ソースシンボルの各列はこれらが異なる長さのビット列に変換されたときにも、その独自性を失わないという仮定に基づいている。セグメントサイズ（セグメントは仮定シンボルを示す）を選択するのには多くの考えるべき点がある。

長さＣのセグメントに対して、セグメントおよびシンボルのソースビット列中の位置相互間には同期関係がないので、各シンボル列はセグメント中のＣビット位置と一致する。このことは、いかなるシンボル列に対しても少なくともＣＦＪＯ列変化が可能であり、従って、短かいセグメントは、デ、ｆクシッナリー空間のより経済的な使用を可能とする。

コード化されたバイナリストリング長はセグメントサイズに比例するが、コードワード長は既知のストリング数の対数に比例するので、短いセグメントは長いセグメントよりもディクシッナリ空間をより有効に使用できない。これは、ジブ・ランペル・アルゴリズム（Ｚｉｖ−Ｌａｓｐｅｌ　ａｌｇｏｒｉｔｈｍ）に特に関連していて、そのジブ・ランペルーアルゴリズムでは、メモリ空間の大きな部分がシンボルストレージよりもむしろポインターに向けられている。

従って、入力データがキャラクタを表わすバイナリピットのストリームからなり、サーチツリーに蓄積されたシンボルがバイナリビットのシーケンスから構成される本発明に基づく好ましい実施例では、シーケンス当りのビット数はプロセッサによって選択され（プロセッサはユーザからの外部コマンド信号に応答してもよい）、入力データのシンボル当りのビット数は未知か或いはプロセッサにより選択されたシーケンス当りのビット数とは異なっている。

この方法の変形例では、シーケンス当りのビット数は初期に変化させられ、入力データと出力データ間の結果として得られる圧縮比は、サーチツリーの蓄積されたシンボルに対するシケンス当りのビット数を選択する前にモニタされる。

こうして、圧縮比を最大にするためにプロセッサによって選択されるシケンス当りのビット数を最適化できる。しかしながら、メモリ容量や処理速度のような他の要因がプロセッサによって選択されるべきシーケンス当りの最適ビット数に影響を与えるかもしれない。

上述の実施例は、圧縮の効率の点ではわずかに次善であるが、メモリの利用や実行速度の点では遥かに効率がよい削除法を使用している。その実施例は、ディクシッナリを作るために使用される２つのデータ構造と、ストリングを表現するために使用されるシステマティックなサーチツリー構造と、Ｓｕｓｓｅｎｇｕｔｈにより議論されたような、サーチツリーの素子を蓄積するために使用されるディクショナリのシステマティックな表表現とから形成されている。ところで、サーチツリーの素子が蓄積される順番は完全にランダムである。この方法は、削除されるべきサーチツリ一部分の選択がツリー内の選択された部分の順序に依存しないという意味から、ランダム削除戦略に近い。しかし、削除のために候補を選択するアルゴリズムがディクショナリの表表現を介するステッピングを含んでいるので、本当はランダムではない。これはクロック（ＣＬＯＣＫ）近似に幾らか似ているが、表表現の位置に基づいてなされる削除のための候補要素の選択が、サーチツリー内で要素の位置によって評価される点で異なっている。

国際調査報告　、２−１゜２６゜２．−２−１＋１１．、Ｉｌ工＋、１１１ｔ＋１ｌＬｕ　’＋ｊ　ｐ７７　、７Ｈミテ　−二一一二国際調査報告ｊ１

Claims

【特許請求の範囲】

１．インデックスされたメモリロケーションを有するメモリ（３）が設けられたプロセッサ（μＰ）でデータの連続するシンボル（ａ，ｂ，ｃ）を続むステップと、入力データのシンボルストリングからシンボルのサーチツリー（サーチツリーは前記ストリングを表わすパスを有する）の形式でディクショナリ（第１ないし３図、第６図、第８図）をメモリに発生させるステップと、入力データのシンボルストリングをサーチツリーに以前蓄積されたパスとマッチさせて入力データに対応する圧縮された出力データを蓄積されたパスから形成するステップとからなり、前記サーチツリーに蓄積されたシンボルはリンクされて、２つの異なるタイプのリンクしたポインタによって前記パスを形成し、蓄積されたシンボル間の第１のタイプのポインタ（Ｒ）は、それら蓄積されたシンボルが入力シンボルシーケンスの所定の位置で交換可能なシンボルであることを示し、蓄積されたシンボル間の第２のタイプのポインタ（Ｄ）は、それら蓄積されたシンボルの両者が、順番に可能な入力シンボルシーケンスで起こる入力データを圧縮する方法において、前記メモリが−杯のときには、前記サーチツリー（第１ないし第３図、第６図、第８図）の−連のインデックスされたメモリロケーションは、もしもそのメモリロケーションが他のノード（第９図）に向いている前記第２のタイプ（Ｄ）のリンクしているポインタを有しないサーチツリーのノード（第８（ａ）図のｃ，ａ）を含む場合には、テストされ削除され、結果として自由にされたメモリロケーションは新しいディクショナリのエントリーが可能となることを特徴とする入力データを圧縮する方法。
２．上記辞書を形成する全てのインデックスメモリロケーションは記憶されるべく次のシンボルがフリーメモリロケーションに記憶される以前にテストされる請求項１に記載の方法。
３．上記サーチツリーの最近生成されたノード（ｂ（新規登録）；第８図（ａ））は削除部分に保護されることによって限定される請求項１若しくは２に記載の方法。
４．上記インデックスメモリロケーションは、フリーリスト（第１図（ｂ）、第２図（ｂ））にポインタによって連結される前記サーチツリーのノードと、除去されるノードにバイバスするためにポインタをリセットすると共に上記フリーリストにそれらを接続することによって除去される上記サーチツリーのノードを含まず、それによって上記サーチツリーは全体が接続されて維持される請求項１乃至３の何れかに記載の方法。
５．上記サーチツリーの各々のノードは関連したノードが使用される各々の時間インクリメントされるそれぞれのカウンタに関連されるもので、上記圧縮された出力データは最も短いコードワードが頻繁に使用されるノードを表すような上記カウンタの内容に関連される長さのコードワードから成る請求項１乃至４の何れか１に記載の方法。
６．上記サーチツリーのノードは上記メモリに順序付けて記憶されるもので、上記ノードが記憶される順序はノードが使用された後にその序数の値を上げることによって再配置され、これにより滅多に使用しないノードは低い序数を得て、除去される請求項１乃至４の何れか１に記載の方法。
７．上記使用されるノードの序数の値は１上昇され、上記使用されるノードのすぐ上の上記ノードの序数の値は１減少され、これにより２つのノードは序数の値を交換する請求項６に記載の方法。
８．上記使用されるノードの序数の値は最大値に上昇され、上記使用されるノードの全ての上のノードの序数の値は１減少される請求項６に記載の方法。
９．上記サーチツリーの各々のノードは関連した長さのインデックスを有し、上記圧縮された出力データは上記最も短いコードワードが最も高い序数の値のノードを表すような長さのインデックスに関連される長さのコードワードから成る請求項６乃至８の何れか１に記載の上記。
１０．上記入力データは一連のシンボルの間のスペースを含み、上記サーチツリーの新しく記憶されたバスを発生するプロセスはこのようなスペースが除去されるとき終了される請求項１乃至９の何れか１に記載の方法。
１１．上記入力データは文字を表しているバイナリーデジット（ビット）の流れから成り、上記サーチツリーに記憶される上記シンボル（Ｓ）は各々一連のバイナリーデジット（ビット）で構成されるもので、上記一連のビットの番号は上記プロセッサ（μＰ）で選択され、上記入力データの文字によるビットの番号は上記プロセッサによって選択される一連のビットの番号から異なるかまたは未知数の何れかである請求項１乃至１０の何れか１に記載の方法。
１２．上記プロセッサ（μＰ）は使用者からの外部コマンド信号に応じた選択を実行するために配置される請求項１１に記載の方法。
１３．上記一連のビット番号は最初に変化されるもので、上記入力データと上記出力データの結果として得られる圧縮比が測定され、上記サーチツリーの記憶されたシンボルのための一連のビット番号が上記測定された圧縮比の基に選択される請求項１１若しくは１２の何れかに記載の方法。
１４．上記サーチツリーの代替記憶シンボルの順序付けられたリスト（Ｓ２、Ｓ３、Ｓ４）の第１の記憶シンボル及び前記順序付けられたリストの連続的な記憶シンボルに指示する第２のタイプの各連結ポインタ（Ｄ）は、前記リストに各々連続する記憶シンボルに指示する上記第１のタイプの連結ポインタ（Ｒ）によって接続される請求項１乃至１３の何れかに記載の方法。
１５．上記第２タイプの各連結ポインタ（Ｄ）は上記サーチツリーの代替記憶シンボルのリストの内の何れか一つのシンボルを指示し、前記リストに於ける記憶シンボルは、一方向を指示する上記第１タイプのポインタ（Ｒ）によって、及び反対方向を指示する上記第１タイプのポインタ（Ｌ）によってもまた、互いに接続され、それにより上記リスト中の何れの記憶シンボルにもアクセス可能とする請求項１乃至１３の何れかに記載の方法。
１６．上記第１タイプの連結ポインタ（Ｒ）は上記代替記憶シンボルのリストをサーチするために使用され、それにより最も最近読み込まれた入力シンボルとのマッチングをとり、マッチングする場合には、もしあれば、上記第２タイプのポインタ（Ｄ）を得る請求項１４又は１５の何れかに記載の方法。
１７．入力データが処理される前に、上記入力データ中に現われそうな一連のシンボルにそれぞれ対応するシンボル（ａ，ｂ，ｃ）を記憶したメモリが最初に提供され、前記最初に提供された記憶シンポルは、上記サーチツリ−中のノードとして記憶されている請求項１乃至１６の何れかに記載の方法。
１８．上記辞書は、使用に於いて、関連デコーダから受けたコマンド信号に応答して再び初期化される請求項１乃至７の何れかに記載の方法。
１９．使用に於いて、辞書のチェックサムが定期的に算出され、対応する出力信号が発生される請求項１乃至１７の何れかに記載の方法。
２０．上記辞書がさらなる使用のために維持され、そのようなさらなる使用の何れにも先だって上記辞書のチェックサム算出を行なうことと、他のそのような辞書から対応するチェックサムを受け取ることと、それらのチェックサムを比較することと、それらのチェックサムが一致しない場合に上記辞書を再び初期化することとを含む請求項１乃至１７の何れかに記載の方法。
２１．請求項１乃至１７の何れかに記載されたような方法によりデータを圧縮することと、この圧縮データを大容量記憶媒体（１）に記憶するニととを具備するデータの記憶方法。
２２．メモリ（３）を有して提供されたプロセッサ（μＰ）で上記圧縮データの連続キャラクタを続み込むことと、上記圧縮データから作られるシンボルのサーチツリー（第１図乃至第３図，第６図，第８図）の形をとる辞書を上記メモリに記憶することと、このサーチツリーを利用して上記圧縮データを復号化データに変換することとを具備し、上記サーチツリー中の記憶シンボル（Ｓ）は２つの別個なタイプの連結ポインタによりリンクされ、記憶シンボル間の第１タイプのポインタ（Ｒ）は、それらのシンボルが同数のシンボル及び同じ接頭辞を有するシンボルの異なった復号化ストリングと関連され且つそのような異なったストリングのそれぞれ最後のシンボルであるということを示し、記憶シンボル間の第２タイプのポインタ（Ｄ）は、それらのシンボルが復号化出力シンボルのストリングに於ける連続シンボルであるということを示す圧縮データの復号化方法に於いて、上記サーチツリーが請求項１乃至９の何れかに定義されたような方法により処理されることを特徴とする請求項１乃至２０の何れかに定義されたような方法により圧縮されている圧縮データを復号化する方法。
２３．上記サーチツリーが請求項１４又は請求項１５に定義されたようなものである請求項２２に記載の方法。
２４．圧縮データを受けた時に、その圧縮データがエンプティ−又はフリーメモリロケーションに相当するかを検出することと、対応する出力信号を発生することとを具備する請求項２２又は２３の何れかに記載の方法。
２５．上記辞書がさらなる使用のために維持され、そのようなさらなる使用の何れにも先だって上記辞書のチェックサム算出を行なうことと、他のそのような辞書から対応するチェックサムを受け取ることと、それらのチェックサムを比較することと、それらのチェックサムが一致しない場合に上記辞書を再び初期化することとを含む請求項２２又は２３の何れかに記載の方法。
２６．請求項１乃至２０の何れかに記載されたような方法によりデータを符号化することと、その結果の圧縮データを遠隔位置に送信することと、請求項２２又は請求項２３に記載されたような対応する方法により上記圧縮データを復号化することとを具備するデータの送信方法。
２７．入力データの連続したシンボル（ａ，ｂ，ｃ）を受信できるプロセサ（μ Ｐ）と、インデックスメモリロケーションを持つメモリ（３）と、前記入力データ内のシンボルのストリンクを示すパスを持ったシンボルの検索ツリ−（図１− ３，６，８）を記憶する手段と、前記入力データ内のシンボルストリングと前記検索ツリー内に先に記憶されたパスとを突き合わせて、ニの記憶されたパスから前記入力データに対応する圧縮された出力データを発生する手段とを備え、２つの異なる形式のポインタをリンクするニとにより前記検索ツリ−（図１−３，６，８）内に記憶されたシンボル（ｓ）をリンクして前記パスを形成するものであって、前記記憶されたシンボル間の第１タイプ（Ｒ）ポインタは、　これらの記憶シンボルが入力シンボルシーケンス内の所定位置における交替可能シンボルであることを示すものであり、前記記憶されたシンボル間の第２タイプ（Ｄ）ポインタは、これらの記憶シンボルがともに、可能な入力シンボルシーケンス内で順に生じることを示すものであるときに、使用時において、前記メモリ（３）が満杯であるかどうかを決定し、前記検索ツリーの連続したインデックスメモリロケーションをテストし、もしそれが、他のノードを指す前記第２タイプ（Ｄ）のリンクポインタを持たない前記検索ツリーのノード（図８（ａ）のｃ，ａ）を含むならばメモリロケーションを削除し、その結果得られたフリーメモリロケーションを新たな辞書登録に利用できるように、前記プロセサ（μＰ）を構成することを特徴とする入力データを圧縮するエンコーダ。
２８．前記プロセサが、請求項２ないし１３のいずれかに記載の方法により前記検索ツリーを作動させるように構成されることを特徴とする請求項２７に記載のエンコーダ。
２９．前記第２タイプ（Ｄ）のリンクポインタおのおのが、前記検索ツリーの交替可能な記憶されたシンボルの順番リスド（Ｓ２，Ｓ３，Ｓ４）を指し、この順番リスト内の連続記憶シンボルが、これらのシンボルおのおのを指す前記第１タイプ（Ｒ）のリンクポインタにより接続されることを特徴とする請求項２７または２８に記載のエンコーダ。
３０．前記第２タイプ（Ｄ）のリンクポインタおのおのが、前記検索ツリーの交替可能な記憶されたシンボルのリストのいずれか１つを指し、このリスト内の記憶シンボルのどれにてもアクセスできるように、このリスト内の記憶シンボルが、一方向を指す前記第１タイプ（Ｒ）のリンクポインタと反対方向を指す前記第１タイプのポインタとにより互いに接続されることを特徴とする請求項２７または２８に記載のエンコーダ。
３１．使用時において、前記プロセサが、併用するデコーダからのコマンド信号に応答して、自身の辞書を再度初期化することを特徴とする請求項２７ないし３０のいずれかに記載のエンコーダ。
３２．使用時において、前記プロセサが、前記辞書のチェツクサムを周期的に計算して対応する出力信号を発生することを特徴とする請求項２７ないし３０のいずれかに記載のエンコーダ。
３３．前記辞書は別途使用のためとっておき、前記プロセサが、前記辞書のチェックサム計算をその使用に先だって行い対応する出力信号を発生し、使用時において、このチェックサムと、併用するデコーダから受信した対応チェックサムとを比較し、比較したチエックサムが一致しなければ前期辞書を初期状態に再度初期化するように構成きれることを特徴とする請求項２７ないし３０のいずれかに記載のエンコーダ。
３４．連続する記号からなる圧縮データを受信可能なプロセッサ（μＰ）と、索引付きのメモリ位置を有するメモリと、記号からなる探索ツリ−（第１、２、３、６、８図）構造の辞書を前記メモリに記憶する手段とを具備し、前記プロセッサは前記圧縮データから前記探索ツリーを組み立てて、前記圧縮データをデコードデータに翻訳すべく探索ツリーを使用するように構成されており、前記探索ツリーに記録された記号（Ｓ）は記号間の第１及び第２の２つの異なる種類のポインタ（Ｒ）、（Ｄ）によって連結されており、第１のポインタ（Ｒ）はこれらの記号が同数の記号を有する異なるデコード記号列に関連していることと、このような異なる記号列のそれぞれの最後の記号であることを示し、第２のポインタ（Ｄ）はこれらの記号がデコード出力符号列の連続する符号であることを示し、使用時においては、前記プロセッサ（μＰ）は前記メモリ（３）がフルになるときを決定し、前記探索ツリーの連続するインデックス付きメモリ位置をテストし、他のノードを指示する第２の連結ポインタ（Ｄ）を有しない前記探索ツリーのノード（第８（８）図、ｃ、ａ）を含むときはメモリ位置を削除し、結果的なフリー状態のメモリ位置を新辞書に入力可能にすべく構成されていることを特徴とする圧縮データをデコードするデコーダ。
３５．使用時において、前記第２の連結ポインタ（Ｄ）が前記探索ツリーの代替記憶記号のオーダリスト（Ｓ２、Ｓ３、Ｓ４）の第１の記憶記号を指示し、前記オーダリストの連続する記憶記号が前記オーダリストのそれぞれの連続する記憶記号を指示する前記第１の連結ポインタ（Ｒ）によって連結されている請求項３４記載のデコーダ。
３６．使用時において、前記第２の連結ポインタ（Ｄ）のそれぞれが前記探索ツリーの代替記憶記号リストの１つを指示し、前記リストの所望の記号にアクセスすべく前記リストの記憶記号が１方向を指示している前記第１のポインタ（Ｒ）と反対方向（Ｌ）を指示している前記第１のポインタ（Ｒ）とによって互いに連結されている請求項３４記載のデコーダ。
３７．前記プロセッサがさらに、請求項２乃至９のいずれかに規定された方法によって前記探索ツリーに関して動作すべく構成された請求項３４、３５、３６のいずれかに記載のデコーダ。
３８．使用時においτ、前記プロセッサが受信した圧縮データがいつ受信圧縮データがエンプティまたはフリーメモリ位置に関連するかを検出して関連するエンコーダに送信すべく関連する出力信号を発生する請求項３４乃至３７項に記載のデコーダ。
３９．前記辞書がさらに使用すべく維持され、かつ、前記プロセッサが使用に先立って前記辞書に関してチェックサム計算を実行して関連するエンコーダに伝送すべく関連する出力信号を発生し、このチェックサムを使用時に前記エンコーダから受信した関連するチェックサムと比較してチェックサムが一致しながったときは前記辞書を初期化すべく構成されている請求項３４乃至３８記載のいずれかに記載のデコード。
４０．請求項２２乃至２５のいずれかに規定されたエンコーダ（２）と、請求項２６乃至２９のいずれかに規定された関連するデコーダ（５）と、前記エンコーダと前記デコーダとの間に圧縮データを伝送するデータリンクとを具備するデータ処理装置。
４１．請求項２７乃至３０のいずれかに規定されたエンコーダ（２）と、請求項３４乃至３７のいずれかに規定された関連するデコーダ（５）と、前記エンコーダとデコーダによってアクセス可能な大容量記憶媒体（１）とを具備するデータ処理装置。