JP2000516058A - 頻度の高いキャラクタの組み合わせ、ワード及び/又はフレーズでプレフィルした辞書を用いるLempel―Zivデータ圧縮技術 - Google Patents
頻度の高いキャラクタの組み合わせ、ワード及び/又はフレーズでプレフィルした辞書を用いるLempel―Zivデータ圧縮技術Info
- Publication number
- JP2000516058A JP2000516058A JP10508147A JP50814798A JP2000516058A JP 2000516058 A JP2000516058 A JP 2000516058A JP 10508147 A JP10508147 A JP 10508147A JP 50814798 A JP50814798 A JP 50814798A JP 2000516058 A JP2000516058 A JP 2000516058A
- Authority
- JP
- Japan
- Prior art keywords
- character
- dictionary
- data
- data compression
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3088—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/005—Statistical coding, e.g. Huffman, run length coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3086—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing a sliding window, e.g. LZ77
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/93—Run-length coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1.キャラクタシーケンスを包含するテキストを圧縮するためのデータ圧縮方 法であって、以下のステップを含むデータ圧縮方法、 (a)前記キャラクタシーケンス中に多発しそうな、所定のキャラクタの組合 せを包含するプレフィルデータ圧縮辞書を選択するステップ、 (b)圧縮のため、前記キャラクタシーケンス中の最初のキャラクタにポイン タを初期設定するステップ、 (c)前記ポインタからスタートするキャラクタと前記プレフィルデータ圧縮 辞書中に格納されたキャラクタシーケンスとを比較し、前記ポインタから始まる キャラクタと前記プレフィルデータ圧縮辞書中に格納されたキャラクタシーケン スとの最長一致を決定するステップ、 (d)前記最長一致を呈する前記キャラクタの圧縮された表現として、辞書ポ インタを、メモリ中の前記プレフィルデータ圧縮辞書中の前記最長一致に格納す るステップ、 (e)前記最長一致に続く前記キャラクタシーケンス中のキャラクタに前記ポ インタを移動するステップ、及び (f)圧縮されるべき前記キャラクタシーケンス中の全てのキャラクタについ てステップc〜eを繰り返すステップ。 2.請求項1に記載のデータ圧縮方法であって、更に、以下のステップを実行 することにより、前記プレフィルデータ圧縮辞書を生成するステップを含むデー タ圧縮方法、 少なくとも1つのキャラクタサンプルシーケンス中のキャラクタシーケンスの 発生頻度を決定するために、圧縮されるべきキャラクタシーケンスの表現である 前記少なくとも1つのサンプルキャラク タシーケンス中の前記キャラクタシーケンスを解析するステップ、及び 前記所定の組合せとして、前記少なくとも1つのキャラクタサンプルシーケン ス中に最も多発する、前記少なくとも1つのキャラクタサンプルシーケンス中の これらのキャラクタシーケンスを選択するステップ。 3.請求項2に記載のデータ圧縮方法であって、前記解析するステップは、前 記少なくとも1つのキャラクタサンプルシーケンス中の前記キャラクタシーケン スの各々の発生数を決定するステップ、及び、各キャラクタシーケンスについて 、前記各キャラクタシーケンスの発生数と、前記各キャラクタシーケンスのビッ ト長と前記辞書ポインタのビット長の差との積を演算するステップを含むデータ 圧縮方法。 4.請求項3に記載のデータ圧縮方法であって、前記所定の組合せを選択する ステップは、前記命令データ圧縮辞書へ格納するために、前記積を演算するステ ップ中で決定された最大積を有するこれらのデータシーケンスを選択するステッ プを含むデータ圧縮方法。 5.請求項4に記載のデータ圧縮方法であって、更に、完全なキャラクタセッ トが前記プレフィルデータ圧縮辞書中に存在するか否かを決定するステップ、及 び、前記完全なキャラクタセット中の全てのキャラクタが、前記プレフィルデー タ圧縮辞書中に存在しないという場合において、新たな辞書エントリとして、前 記プレフィルデータ圧縮辞書に存在しない前記キャラクタセットのこれらのキャ ラクタを、前記積を演算するステップで決定された最小の積を有する辞書のエン トリに代えて、前記プレフィルデータ圧縮辞書中に挿入するステップを含むデー タ圧縮方法。 6.請求項1に記載のデータ圧縮方法であって、前記プレフィル データ圧縮辞書を選択するステップは、複数の異なるプレフィルデータ圧縮辞書 の内のどの1つが前記キャラクタサブセットに対して最大の圧縮をもたらすかを 決定するため、前記複数の異なるプレフィルデータ圧縮辞書に対して、圧縮され るべき前記データキャラクタシーケンスのサブセットキャラクタについてステッ プb〜eを実行するステップ、及び、前記キャラクタシーケンスの圧縮に使用す るため、前記プレフィルデータ圧縮辞書として、前記1つのプレフィルデータ圧 縮辞書を選択するステップを含むデータ圧縮方法。 7.請求項6に記載のデータ圧縮方法であって、前記1つのプレフィルデータ 圧縮辞書を選択する前記のステップは、圧縮されるべき前記データキャラクタシ ーケンスの前記キャラクタサブセットについてステップb〜eを実行する間に、 空のデータ圧縮辞書によるスタートが前記データキャラクタシーケンスの最大の 圧縮を許可することが決定されるイベントにおいて、空のデータ圧縮辞書を選択 するステップを含むデータ圧縮方法。 8.請求項1に記載のデータ圧縮方法であって、更に、(g)前記最長一致を 呈する前記キャラクタの前記圧縮された表現として、受け側に前記辞書ポインタ を送出するステップを含むデータ圧縮方法。 9.請求項8に記載のデータ圧縮方法であって、前記プレフィルデータ圧縮辞 書を選択する前記ステップは、前記プレフィルデータ圧縮辞書がステップgの送 出されたデータの受け側に有効であるか否かに基づいて、複数のプレフィルデー タ圧縮辞書から1つのプレフィルデータ圧縮辞書を選択するステップを更に含む データ圧縮方法。 10.請求項1に記載のデータ圧縮方法であって、前記プレフィルデータ圧縮 辞書を選択するステップは、圧縮されるべき前記キャ ラクタシーケンスの圧縮の間に使用するための複合的なプレフィルデータ圧縮辞 書を選択するステップを含むデータ圧縮方法。 11.請求項1に記載のデータ圧縮方法であって、更に、前記辞書ポインタが より少ないアドレスビットを使用して表現されるように、前記辞書ポインタを符 号化するステップを含むデータ圧縮方法。 12.請求項1に記載のデータ圧縮方法であって、更に、前記最長一致を呈す る前記キャラクタの圧縮された表現と共に、伸長処理の間に使用されるべきプレ フィルデータ圧縮辞書へ、リファレンスを格納するステップを含むデータ圧縮方 法。 13.請求項1に記載のデータ圧縮方法であって、更に、テキストデータの異 なるジャンルを包含する複数のプレフィルデータ圧縮辞書を格納するステップを 含み、前記プレフィルデータ圧縮辞書を選択するステップは、前記複数のプレフ ィルデータ圧縮辞書から前記プレフィルデータ圧縮辞書を選択するステップを含 み、それにより、選択されたプレフィルデータ圧縮辞書が、前記圧縮されるべき 前記キャラクタシーケンスに最も類似するジャンルからデータを包含するデータ 圧縮方法。 14.請求項13に記載のデータ圧縮方法であって、前記複数のプレフィルデ ータ圧縮辞書を格納する前記ステップは、対応するプレフィルデータ圧縮辞書内 に包含されたテキストデータのジャンルにより、前記複数のプレフィルデータ圧 縮辞書を階層的に配列するステップを含むデータ圧縮方法。 15.請求項13に記載のデータ圧縮方法であって、前記複数のプレフィルデ ータ圧縮辞書を格納するステップは、記憶メディア上に一度だけ前記複数のプレ フィルデータ圧縮辞書の共通のエントリを格納するステップを含み、前記複数の プレフィルデータ圧縮辞書 により、前記共通のエントリが割当てられるデータ圧縮方法。 16.キャラクタシーケンスを有するテキストを圧縮するためのデータ圧縮方 法であって、以下のステップを含むデータ圧縮方法、 (a)前記キャラクタシーケンス中に多発しそうな、所定のキャラクタの組合 せを包含する命令データ圧縮辞書を選択するステップ、 (b)データ特定データ圧縮辞書を初期設定するステップ、 (c)圧縮のため、前記キャラクタシーケンス中の最初のキャラクタにポイン タを初期設定するステップ、 (d)前記ポインタからスタートするキャラクタと前記プレフィルデータ圧縮 辞書及び前記データ特定データ圧縮辞書中に格納されたキャラクタシーケンスと を比較し、前記プレフィルデータ圧縮辞書及び前記データ特定データ圧縮辞書中 に格納された前記キャラクタシーケンスにより、前記ポインタからスタートする 前記キャラクタの最長一致の辞書エントリ数を決定するステップ、 (e)前記最長一致及び前記イクステンションキャラクタを作る前記キャラク タの圧縮された表現として、前記辞書エントリ数とイクステンションキャラクタ をメモリに格納するステップであって、前記イクステンションキャラクタは、前 記最長一致が前記ポインタからスタートした後に発生する圧縮されるべき前記キ ャラクタシーケンス中のキャラクタであるステップ、 (f)新たな辞書エントリとして、前記最長一致及び前記イクステンションキ ャラクタを呈する前記キャラクタを、前記データ特定データ圧縮辞書に選択的に 格納するステップ、 (g)前記イクステンションキャラクタに続く前記キャラクタシーケンスのキ ャラクタに前記ポインタを移動するステップ、及び (h)圧縮されるべき前記キャラクタシーケンス中の全てのキャ ラクタについてステップd〜gを繰り返すステップ。 17.請求項16に記載のデータ圧縮方法であって、更に、前記キャラクタシ ーケンスの圧縮の間に、前記プレフィルデータ圧縮辞書及び前記データ特定デー タ圧縮辞書の圧縮の実行をモニタするステップ、そして、前記キャラクタシーケ ンスの圧縮の間に前記データ特定データ圧縮辞書が満杯となった時、より少ない データ圧縮の実行をもたらすように、前記モニタするステップの間に決定された データ圧縮辞書をリセットし、圧縮されるべき前記キャラクタシーケンス中のサ ブシーケントキャラクタの圧縮のための前記プレフィルデータ圧縮辞書として、 より大きなデータ圧縮の実行をもたらすべき前記モニタするステップの間に決定 されたデータ圧縮辞書を使用するステップを含むデータ圧縮方法。 18.前記請求項16に記載のデータ圧縮方法は、更に、異なるキャラクタシ ーケンスの圧縮に使用するプレフィルデータ圧縮辞書の少なくとも一部として、 前記キャラクタシーケンスの圧縮の間に、前記データ特定データ圧縮辞書を、そ れに格納された新たな辞書エントリを格納するステップを含むデータ圧縮方法。 19.請求項16に記載のデータ圧縮方法であって、更に、前記最長一致及び 前記イクステンションキャラクタを呈する前記キャラクタの前記圧縮された表現 を、少なくとも、(1)前記圧縮された表現を形成するために使用されるプレフ ィルデータ圧縮辞書の表示、(2)辞書アドレス空間が前記データ特定データ圧 縮辞書と前記プレフィルデータ圧縮辞書の間でどのように割り当てられるかの表 示、(3)前記キャラクタの前記圧縮された表現を伸長するために使用される、 Lempel-Zivアルゴリズムの変形版の表示、及び(4)前記データ特定データ圧縮 辞書が満杯となったときに続く技術の表示、の内の1つに格納するステップを含 むデータ圧縮方法。 20.請求項16に記載されたデータ圧縮方法であって、前記プレフィルデー タ圧縮辞書を選択するステップは、テキストデータの異なるジャンルを包含する 複数のプレフィルデータ圧縮辞書から前記プレフィルデータ圧縮辞書を選択する ステップを含み、選択されたプレフィルデータ圧縮辞書は、圧縮されるべき前記 キャラクタシーケンスに最も類似したジャンルからのデータを包含するデータ圧 縮方法。 21.請求項20に記載のデータ圧縮方法であって、更に、異なるテキストの 圧縮のためのプレフィルデータ圧縮辞書として、前記テキストの圧縮の間に形成 されたデータ特定データ圧縮辞書を使用する前記テキストとして、同様のジャン ルからの前記異なるテキストについてステップb〜gを繰り返すステップを含む データ圧縮方法。 22.請求項21に記載のデータ圧縮方法であって、前記プレフィルデータ圧 縮辞書を選択するステップは、プレフィルデータ圧縮辞書が他のテキストの圧縮 の間に形成されたか否かを特定するステップを含むデータ圧縮方法。 23.キャラクタシーケンスを有するテキストを圧縮するためのデータ圧縮方 法であって、以下のステップを含むデータ圧縮方法、 (a)所定数のキャラクタを有するキャラクタウインドウを初期設定するステ ップ、 (b)前記キャラクタウインドウへ、前記キャラクタシーケンス中に多発しそ うな所定のキャラクタの組合せを有するプレフィルデータ圧縮辞書を付加するス テップ、 (c)圧縮のため、前記キャラクタシーケンス中の最初のキャラクタにポイン タを初期設定するステップ、 (d)それに付加された前記プレフィルデータ圧縮辞書により、 前記ポインタから始まるキャラクタと、前記キャラクタウインドウ中のキャラク タシーケンスとを比較し、それに付加された前記プレフィルデータ圧縮辞書によ り、前記キャラクタウインドウ中の前記キャラクタシーケンスの、ウインドウポ インタ及び前記ポインタからスタートする前記キャラクタの最長一致の長さを決 定するステップ、 (e)前記最長一致を呈する前記キャラクタの圧縮された表現として、前記ウ インドウポインタと前記最長一致の長さをメモリに格納するステップ、 (f)前記最長一致を作るキャラクタを含めるため前記キャラクタウインドウ を更新するステップ、 (g)前記最長一致に続く前記キャラクタシーケンス中のキャラクタに前記ポ インタを移動するステップ、及び (h)圧縮されるべき前記キャラクタシーケンス中の全てのキャラクタについ てステップd〜gを繰り返すステップ。 24.請求項23に記載のデータ圧縮方法であって、更に、前記ポインタによ り指示されたキャラクタシーケンスが、ステップdでそれに付加された前記プレ フィルデータ圧縮辞書により、前記キャラクタウインドウ中に前記ポインタが見 いだせないとき、前記ポインタにより指示された文字キャラクタを前記メモリに 格納するステップを含むデータ圧縮方法。 25.請求項23に記載のデータ圧縮方法であって、更に、前記最長一致を作 る前記キャラクタの前記圧縮された表現として、受け側に前記ウインドウポイン タ及び前記最長一致の前記長さを送出するステップを含むデータ圧縮方法。 26.キャラクタシーケンスを有するテキストを圧縮するためのデータ圧縮方 法であって、以下のステップを含むデータ圧縮方法、 (a)前記キャラクタシーケンス中に多発しそうな、所定のキャラクタの組合 せを包含するプレフィルデータ圧縮辞書を選択するステップ、 (b)所定数のキャラクタを有するキャラクタウインドウを初期設定するステ ップ、 (c)圧縮のため、前記キャラクタシーケンス中の最初のキャラクタにポイン タを初期設定するステップ、 (d)前記ポインタから始まるキャラクタと、それに付加された前記プレフィ ルデータ圧縮辞書中に格納されたキャラクタ及び前記キャラクタウインドウ中の キャラクタシーケンスとを比較し、前記プレフィルデータ圧縮辞書に格納された 前記キャラクタシーケンス及び前記キャラクタウインドウ中のキャラクタシーケ ンスにより前記ポインタからスタートする前記キャラクタの最長一致を決定する ステップ、 (e)前記プレフィルデータ圧縮辞書中に格納された前記キャラクタシーケン スにより前記ポインタからスタートする前記キャラクタの最長一致の辞書エント リ数として、前記ポインタからスタートする前記キャラクタを表現することによ り、又は、前記キャラクタウインドウ中の前記キャラクタシーケンスについて示 す前記ポインタからスタートする前記キャラクタの最長一致の長さとして、前記 ポインタからスタートする前記キャラクタを表現することにより、より大きな圧 縮が得られるか否かを決定するステップ、 (f)前記キャラクタウインドウ中の前記キャラクタシーケンスにより前記ウ インドウポインタからスタートする前記キャラクタの最長一致の前記ウインドウ ポインタ及び前記長さとして、前記ポインタからスタートする前記キャラクタを 表現することにより得られるであろうより大きな圧縮がステップeで決定された とき、前記最 長一致を呈する前記キャラクタの圧縮された表現として、前記ウインドウポイン タ及び前記メモリ中の前記最長一致の前記長さを格納し、さもなければ、前記プ レフィルデータ圧縮辞書中に格納された前記キャラクタシーケンスを前記ポイン タからスタートする前記キャラクタの前記最長一致の前記辞書エントリ数に格納 するステップ、 (g)前記最長一致を作るキャラクタを含むための前記キャラクタウインドウ を更新するステップ、 (h)前記最長一致に続く前記キャラクタシーケンス中のキャラクタに前記ポ インタを移動するステップ、及び (i)圧縮されるべき前記キャラクタシーケンス中の全てのキャラクタについ てステップd〜hを繰り返すステップ。 27.請求項26に記載のデータ圧縮方法であって、更に、ステップeで、前 記キャラクタウインドウ中の前記キャラクタシーケンスについて、前記ウインド ウポインタ及び前記ウインドウポインタからスタートする前記キャラクタの前記 最長一致の前記長さとして、前記ポインタからスタートする前記キャラクタを表 現することにより、より大きな圧縮が得られるであろうとき、受け側に、前記ウ インドウポインタ及び前記最長一致の前記長さを送出し、さもなければ、前記受 け側に前記プレフィルデータ圧縮辞書中に格納された前記キャラクタシーケンス により前記ポインタからスタートする前記キャラクタの前記最長一致の前記辞書 エントリ数を送出するステップステップを含むデータ圧縮方法。 28.キャラクタシーケンスの圧縮された表現を伸長する方法であって、前記 圧縮された表現は、ポインタからスタートし、プレフィルデータ圧縮辞書中に格 納されたキャラクタシーケンスにより前記キャラクタシーケンス中の特定のキャ ラクタまでのキャラクタシ ーケンスのそれぞれの最長一致に対する辞書ポインタを具備し、前記プレフィル データ圧縮辞書は、前記キャラクタシーケンス中に多発しそうな所定のキャラク タの組合せを収納し、以下のステップを含む伸長方法、 (a)前記キャラクタの前記圧縮された表現中の第1の辞書ポインタへポイン タを移動するステップ、 (b)前記ポインタにより示される前記辞書ポインタを使用して前記プレフィ ルデータ圧縮辞書から辞書エントリを検索するステップ、 (c)前記最長一致を呈するキャラクタの伸長された表現として、前記辞書エ ントリを格納するステップ、 (d)前記キャラクタの前記圧縮された表現中の次の辞書ポインタに前記ポイ ンタを移動するステップ、及び (f)前記キャラクタシーケンス中の全ての圧縮されたキャラクタが伸長され るまで、前記キャラクタの前記圧縮された表現中の全ての辞書ポインタについて ステップb〜dを繰り返すステップ。 29.請求項28に記載のデータ圧縮方法であって、更に、前記キャラクタの 前記圧縮された表現から、少なくとも、(1)伸長の間に使用するためのプレフ ィルデータ圧縮辞書の特定、(2)前記キャラクタの前記圧縮された表現を伸長 するために使用されるLempel-Zivアルゴリズム変形版の表示を抽出するステップ を含むデータ圧縮方法。 30.キャラクタシーケンスの圧縮された表現を伸長するデータ圧縮方法であ って、前記圧縮された表現は、プレフィルデータ圧縮辞書及びデータ特定データ 圧縮辞書に格納されたキャラクタシーケンスの、イクステンションキャラクタ及 び、ポインタからスタートして前記キャラクタシーケンス中の特定のキャラクタ までの、キャ ラクタシーケンスのそれぞれの最長一致の辞書エントリ数を具備し、前記イクス テンションキャラクタは、前記ポインタからスタートする最長一致の後に発生す るキャラクタシーケンス中のキャラクタであり、前記プレフィルデータ圧縮辞書 は、前記キャラクタシーケンス中に多発しそうな所定のキャラクタの組合せを収 納し、以下のステップを含む伸長方法、 (a)データ特定データ伸長辞書を初期設定するステップ、 (b)前記キャラクタの前記圧縮された表現中の第1の辞書エントリ数にポイ ンタを初期設定するステップ、 (c)前記プレフィルデータ圧縮辞書の1つから、辞書エントリ及びイクステ ンションキャラクタを検索し、前記データ特定データ伸長辞書は前記ポインタに より示された辞書エントリ数を使用するステップ、 (d)前記最長一致を作る前記キャラクタ及び前記イクステンションキャラク タを前記データ特定データ伸長辞書に選択的に格納するステップ (e)前記キャラクタの前記圧縮された表現中の次の辞書エントリ数に前記ポ インタを移動するステップ、 (f)前記キャラクタシーケンス中の全ての圧縮されたキャラクタが伸長され るまで、前記キャラクタの前記圧縮された表現中の全ての辞書エントリ数及びイ クステンションキャラクタに対してステップc〜eを繰り返すステップ。 31.請求項30に記載のデータ圧縮方法であって、更に、前記キャラクタの 前記圧縮された表現から、少なくとも、(1)伸長の間に使用するプレフィルデ ータ圧縮辞書の表示、(2)前記データ特定データ圧縮辞書及び前記プレフィル データ圧縮辞書の間にいかに辞書アドレス空間を分配するかの表示、(3)前記 キャラクタの 前記圧縮された表現を伸長するために使用されるべきLempel-Zivアルゴリズム変 形版の表示、及び(4)前記データ特定データ圧縮辞書が満杯になったときに続 く技術の表示を抽出するステップを含むデータ圧縮方法。 32.キャラクタシーケンスの圧縮された表現を伸長する方法であって、前記 圧縮された表現は、それに付加されたプレフィルデータ圧縮辞書と共に所定サイ ズのキャラクタウインドウ中のキャラクタシーケンスの、ウインドウポインタ及 びポインタからスタートし、前記キャラクタシーケンス中の特定のキャラクタま で、キャラクタシーケンスのそれぞれの最長一致のウインドウポインタ及び長さ を具備し、前記プレフィルデータ圧縮辞書は、前記キャラクタシーケンス中で多 発しそうな所定のキャラクタの組合せを包含し、以下のステップを含む伸長方法 、 (a)前記キャラクタの前記圧縮された表現中の第1のcポインタ及び長さに ポインタを初期設定するステップ、 (b)前記ポインタにより示されるウインドウポインタにより示される現在の キャラクタウインドウ内のキャラクタからスタートする前記長さにより決定され るキャラクタの数を検索するステップ、 (c)前記最長一致を呈するキャラクタの伸長された表現として、前記検索さ れたキャラクタを格納するステップ (d)前記キャラクタの前記圧縮された表現中の次のウインドウポインタ及び 長さに前記ポインタを移動するステップ、及び (e)前記キャラクタシーケンス中の全ての圧縮されたキャラクタが伸長され るまで、前記キャラクタの前記圧縮された表現中の全てのウインドウポインタと 長さについて、ステップb〜dを繰り返すステップ。 33.請求項32に記載された伸長方法であって、更に、前記キ ャラクタの圧縮された表現から、少なくとも、(1)伸長の間に使用するプレフ ィルデータ圧縮辞書の特定、(2)前記キャラクタの前記圧縮された表現を伸長 するために使用されるLempel-Zivアルゴリズム変形版の表示の内の1つを抽出す るステップ。 34.キャラクタのシーケンスの圧縮された表現を伸長する方法であって、該 圧縮された表現は、(1)ウィンドウポインタ及び前記キャラクタのシーケンス 内での特定のキャラクタへのポインタでスタートするキャラクタのシーケンスの 、所定のサイズのキャラクタウィンドウ内のキャラクタのシーケンスとのそれぞ れの最長一致の長さ、及び(2)プレフィルデータ伸長辞書内の特定のキャラク タへの前記ポインタでスタートするキャラクタのシーケンスのそれぞれの最長一 致の辞書エントリ番号をそなえ、前記プレフィルデータ圧縮辞書は前記キャラク タのシーケンス内で多発しそうなキャラクタの所定の組合せを包含しており、前 記伸長方法は、 (a)前記キャラクタの前記圧縮された表現内での第1のエントリへポインタ を初期設定し、 (b)該ポインタによって指示された前記キャラクタの前記圧縮された表現内 での現エントリが、(1)ウィンドウポインタ及び長さであるか(2)辞書エン トリ番号であるかを決定し、 (c)前記現エントリがウィンドウポインタ及び長さであれば、前記ウィンド ウポインタによって指示された現キャラクタウィンドウ内のキャラクタでスター トする前記長さによって決定されるキャラクタの数を検索し、 (d)前記現エントリが辞書エントリ番号であれば、該辞書エントリ番号によ って特定された前記プレフィルデータ伸長辞書内の辞書エントリにおいてキャラ クタを検索し、 (e)各ステップc又はdにおいて検索されたキャラクタを、現 エントリについての最長一致を呈するキャラクタの伸長された表現として格納し 、 (f)前記ポインタを前記キャラクタの前記圧縮された表現内での次のエント リまで移動させ、 (g)前記キャラクタのシーケンス内でのすべての圧縮されたキャラクタが伸 長されるまで、前記キャラクタの前記圧縮された表現内でのすべてのエントリに ついて各ステップb〜fを繰返す、 各ステップをそなえている方法。 35.(1)伸長している間使用するためのプレフィルデータ圧縮辞書の一致 性、及び(2)前記キャラクタの前記圧縮された表現を伸長するために使用され るべきLempel−Zivアルゴリズム変形版の表示、のうちの少なくとも1 つを、前記キャラクタの前記圧縮された表現から抽出する更なるステップをそな えている、請求項34に記載の方法。 36.キャラクタのシーケンスを含むテキストを圧縮するためのデータ圧縮シ ステムであって、 前記キャラクタのシーケンス内で多発しそうなキャラクタの所定の組合せを包 含するプレフィルデータ圧縮辞書、 前記テキストが圧縮された後該テキストを格納するメモリ、及び (a)圧縮のための前記キャラクタのシーケンス内での第1のキャラクタにポ インタを初期設定し、(b)前記ポインタでスタートするキャラクタを前記プレ フィルデータ圧縮辞書に格納されたキャラクタのシーケンスと比較して、前記ポ インタでスタートする前記キャラクタの、前記プレフィルデータ圧縮辞書に格納 された前記キャラクタのシーケンスとの最長一致を決定し、(c)前記プレフィ ルデータ圧縮辞書内の前記最長一致への辞書ポインタを、前記最長一致を呈する 前記キャラクタの圧縮された表現として前記メモリ内 に格納し、(d)前記最長一致に続く前記キャラクタのシーケンス内のキャラク タに前記ポインタを移動させ、(e)圧縮されるべき前記キャラクタのシーケン ス内のすべてのキャラクタについて各ステップb〜dを繰返す、各ステップを実 行する圧縮手段、 をそなえているデータ圧縮システム。 37.前記プレフィルデータ圧縮辞書を生成する手段であって、前記プレフィ ルデータ圧縮辞書は、該プレフィルデータ圧縮辞書に、圧縮されるべきキャラク タのシーケンスを代表する少なくとも1つのキャラクタのサンプルシーケンス内 で最も多発するキャラクタの組合せを挿入する手段を生成するもの、を更にそな えている、請求項36に記載のシステム。 38.前記プレフィルデータ圧縮辞書生成手段は、前記プレフィルデータ圧縮 辞書に、圧縮されるべきキャラクタのシーケンスを代表する少なくとも1つのキ ャラクタのサンプルシーケンス内でのキャラクタの組合せを挿入するものであり 、該圧縮されるべきキャラクタのシーケンスは、(a)前記少なくとも1つのキ ャラクタのサンプルシーケンスにおけるキャクラタの前記組合せの各々の発生数 と、(b)各前記キャラクタの組合せのビット長及び前記辞書ポインタのビット 長の差、との最大の積を有する、請求項37に記載のシステム。 39.前記プレフィルデータ圧縮辞書生成手段は、圧縮されるべき前記キャラ クタのシーケンスの全キャラクタの集合が前記プレフィルデータ圧縮辞書内に存 在するかどうかを決定し、前記全キャラクタの集合内でのすべてのキャラクタが 圧縮されるべき前記キャラクタのシーケンス内に存在しない場合には、前記プレ フィルデータ圧縮辞書から欠けている前記キャラクタの集合内の各キャラクタを 、前記プレフィルデータ圧縮辞書内に、前記プレフィルデータ圧縮 辞書生成手段によって決定される最小の積を有する辞書エントリの代りに新しい 辞書エントリとして挿入する、請求項38に記載のシステム。 40.前記プレフィルデータ圧縮辞書は多数のプレフィルデータ圧縮辞書の1 つであり、該1つのプレフィルデータ圧縮辞書は、前記多数のプレフィルデータ 圧縮辞書の残りの各々によって前記データキャラクタのシーケンスのうちの各キ ャラクタのサブセットに提供される圧縮より、圧縮されるべき前記データキャラ クタのシーケンスのうちの各キャラクタのサブセットについてより多くの圧縮を 提供する各キャラクタの組合せを包含する、請求項36に記載のシステム。 41.前記メモリは前記圧縮手段から離れた位置にあり、前記辞書ポインタを 、前記最長一致を呈する前記キャラクタの前記圧縮された表現として、前記圧縮 手段から前記メモリまで伝送する手段を更にそなえている、請求項36に記載の システム。 42.前記プレフィルデータ圧縮辞書は、前記離れた位置でも利用しうる多数 のプレフィルデータ圧縮辞書のうちの1つである、請求項41に記載のシステム 。 43.前記圧縮手段は、前記辞書ポインタがより少ないアドレスビットを用い て表現されうるように前記辞書ポインタを符号化する手段をそなえている、請求 項36に記載のシステム。 44.前記圧縮手段は、前記最長一致を呈する前記キャラクタの前記圧縮され た表現を用いて、前記メモリ内に、伸長処理中に使用されるべきプレフィルデー タ圧縮辞書へのリファレンスを格納する、請求項36に記載のシステム。 45.前記メモリは、ハードディスク、RAM,CD ROM、フロッピーデ ィスク、及び光ディスクのうちの少なくとも1つをそ なえている、請求項36に記載のシステム。 46.テキストデータの異なる形式を含む複数のプレフィルデータ圧縮辞書を 格納する辞書メモリを更にそなえ、それによって前記テキストを圧縮するために 使用されるプレフィルデータ圧縮辞書は、最も類似した形式から圧縮されるべき 前記キャラクタのシーケンスまでのデータを包含する、請求項36に記載のシス テム。 47.前記複数のプレフィルデータ圧縮辞書は、それぞれのプレフィルデータ 圧縮辞書内に含まれるテキストデータの形式によって階層的に前記辞書メモリ内 に配列されている、請求項46に記載のシステム。 48.前記複数のプレフィルデータ圧縮辞書は、前記複数のプレフィルデータ 圧縮辞書内の共通エントリが前記辞書メモリ内に1度だけ格納されて前記複数の プレフィルデータ圧縮辞書によって共用されるように、前記辞書メモリ内に格納 されている、請求項46に記載のシステム。 49.キャラクタのシーケンスを含むテキストを圧縮するためのデータ圧縮シ ステムであって、 前記キャラクタのシーケンスにおいて多発しそうなキャラクタの所定の組合せ を含むプレフィルデータ圧縮辞書、 データ特定用データ圧縮辞書、 テキストが圧縮された後該テキストを格納するメモリ、及び (a)圧縮のための前記キャラクタのシーケンス内での第1のキャラクタにポ インタを初期設定し、(b)前記ポインタでスタートするキャラクタを前記プレ フィルデータ圧縮辞書及び前記データ特定用データ圧縮辞書内に格納されたキャ ラクタのシーケンスと比較して、前記プレフィルデータ圧縮辞書及び前記データ 特定用データ圧縮辞書内に格納された前記キャラクタのシーケンスとの、前記ポ インタでスタートする前記キャラクタの最長一致の辞書エントリ番号を決定し、 (c)前記辞書エントリ番号及びイクステンションキャラクタを、前記最長一致 を呈する前記キャラクタ及び前記イクステンションキャラクタの圧縮された表現 として前記メモリ内に格納し、前記イクステンションキャラクタは前記ポインタ でスタートする前記最長一致の後に発生する、圧縮されるべき前記キャラクタの シーケンス内でのキャラクタであり、(d)前記最長一致を呈する前記キャラク タ及び前記イクステンションキャラクタを新しい辞書エントリとして前記データ 特定用データ圧縮辞書内に選択的に格納し、(e)前記イクステンションキャラ クタに続く前記キャラクタのシーケンス内のキャラクタに前記ポインタを移動さ せ、(f)圧縮されるべき前記キャラクタのシーケンス内のすべてのキャラクタ について各ステップb〜eを繰返す、各ステップを実行する圧縮手段、 をそなているデータ圧縮システム。 50.前記圧縮手段は、前記キャラクタのシーケンスを圧縮する間前記プレフ ィルデータ圧縮辞書及び前記データ特定データ圧縮辞書の圧縮能力をモニタする 手段、前記キャラクタのシーケンスを圧縮する間に前記データ特定データ圧縮辞 書が満杯になった時前記モニタ手段によって決定されたデータ圧縮辞書をより小 さいデータ圧縮能力を提供するようにリセットする手段、及び前記モニタ手段に よって決定されたデータ圧縮辞書をより大きいデータ圧縮能力を提供するように 、圧縮されるべき前記キャラクタのシーケンス内の後続するキャラクタの圧縮の ための前記プレフィルデータ圧縮辞書に置き換える手段を更にそなえている、請 求項49に記載のシステム。 51.前記プレフィルデータ圧縮辞書及び前記データ特定データ 圧縮辞書は共通メモリを共有し、前記データ特定データ圧縮辞書は前記キャラク タのシーケンスを圧縮する間そこに格納された新しい辞書エントリとともに、異 なるテキストの異なるキャラクタのシーケンスの圧縮に使用するためのプレフィ ルデータ圧縮辞書の少なくとも一部として前記共通メモリに格納される、請求項 49に記載のシステム。 52.前記圧縮手段は前記最長一致を呈する前記キャラクタの前記圧縮された 表現及び前記イクステンションキャラクタとともに、(1)前記圧縮された表現 を形成するためにどのプレフィルデータ圧縮辞書が用いられたかについての表示 、(2)前記データ特定データ圧縮辞書及び前記プレフィルデータ圧縮辞書の間 にどのようにして辞書アドレススペースが割当てられるかについての表示、(3 )前記キャラクタの前記圧縮された表示を伸長するために使用されるべきLem pel−Zivアルゴリズム変形版の表示、及び(4)前記データ特定データ圧 縮辞書が満杯になった時どのような手法が後続するかについての表示、のうちの 少なくとも1つを前記メモリに格納する、請求項49に記載のシステム。 53.テキストデータの異なる形式を含む複数のプレフィルデータ圧縮辞書を 格納する辞書メモリを更にそなえ、それによって前記テキストを圧縮するために 使用されるプレフィルデータ圧縮辞書が、最も類似した形式から圧縮されるべき 前記キャラクタのシーケンスまでのデータを包含する、請求項49に記載のシス テム。 54.前記圧縮手段が、前記テキストを圧縮する間に格納されたデータ特定デ ータ圧縮辞書エントリを前記異なるテキストを圧縮するためのプレフィルデータ 圧縮辞書として用いて、前記テキストと同じ形式とは異なるテキストについて各 ステップb〜eを繰返す、請求項53に記載のシステム。 55.前記プレフィルデータ圧縮辞書が、他のテキストを圧縮する間に該プレ フィルデータ圧縮辞書が形成されるかどうかを表示する手段を包含する、請求項 54に記載のシステム。 56.キャラクタのシーケンスを含むテキストを圧縮するためのデータ圧縮シ ステムであって、 所定数のキャラクタ及び前記キャラクタのシーケンス内で多発しそうなキャラ クタの所定の組合せを含むプレフィルデータ圧縮辞書を包含するキャラクタウィ ンドウを格納する辞書メモリ、 テキストが圧縮された後該テキストを格納する圧縮されたデータメモリ、及び (a)圧縮のための前記キャラクタのシーケンス内の第1のキャラクタにポイ ンタを初期設定し、(b)前記ポインタでスタートするキャラクタを前記辞書メ モリ内のキャラクタのシーケンスと比較して、前記プレフィルデータ圧縮辞書及 び前記キャラクタウィンドウ内の前記キャラクタのシーケンスとの、前記ポイン タでスタートする前記キャラクタの最長一致の長さ及びウィンドウポインタを決 定し、(c)前記最長一致を呈する前記キャラクタの圧縮された表現として前記 圧縮されたデータメモリ内の前記最長一致の前記長さ及び前記ウィンドウポイン タを格納し、(d)前記最長一致を呈するキャラクタを含ませるために前記キャ ラクタウィンドウを更新し、(e)前記最長一致に続く前記キャラクタのシーケ ンス内のキャラクタに前記ポインタを移動させ、(f)圧縮されるべき前記キャ ラクタのシーケンス内のすべてのキャラクタについて各ステップb〜eを繰返す 、各ステップを実行する圧縮手段、 をそなえているデータ圧縮システム。 57.前記圧縮手段は、前記ポインタによって指示されたキャラクタのシーケ ンスがステップbにおいて前記キャラクタウィンドウ 又は前記プレフィルデータ圧縮辞書内に見出されない時、前記ポインタによって 指示された文字キャラクタをステップcにおいて前記圧縮されたデータメモリ内 に格納する、請求項56に記載のシステム。 58.前記圧縮されたデータメモリは前記圧縮手段から離れた位置にあり、前 記ウィンドウポインタ及び前記最長一致の前記長さを前記最長一致を呈する前記 キャラクタの前記圧縮された表現として前記圧縮手段から前記圧縮されたデータ メモリまで伝送する手段を更にそなえている、請求項56に記載のシステム。 59.キャラクタのシーケンスを含むテキストを圧縮するためのデータ圧縮シ ステムであって、 前記キャラクタのシーケンス内で多発しそうなキャラクタの所定の組合せを包 含するプレフィルデータ圧縮辞書、 所定数のキャラクタを含むキャラクタウィンドウ、 テキストが圧縮された後該テキストを格納する圧縮されたデータメモリ、及び (a)圧縮のための前記キャラクタのシーケンス内の第1のキャラクタにポイ ンタを初期設定し、(b)前記ポインタでスタートするキャラクタを前記プレフ ィルデータ圧縮辞書及び前記キャラクタウィンドウ内のキャラクタのシーケンス と比較して、前記プレフィルデータ圧縮辞書内に格納された前記キャラクタのシ ーケンス及び前記キャラクタウィンドウ内のキャラクタのシーケンスとの、前記 ポインタでスタートする前記キャラクタの最長一致を決定し、(c)前記ポイン タでスタートする前記キャラクタを前記プレフィルデータ圧縮辞書内に格納され た前記キャラクタのシーケンスとの、前記ポインタでスタートする前記キャラク タの最長一致の辞書エントリ番号として表現することによって、又は前記キャラ クタウィンド ウ内の前記キャラクタのシーケンスとの、前記ポインタでスタートする前記キャ ラクタの最長一致の長さ及びウィンドウポインタとして前記ポインタでスタート する前記キャラクタを表現することによって、より大きい圧縮がえられるかどう かを決定し、(d)ステップcにおいてより大きい圧縮が、前記キャラクタウィ ンドウ内の前記キャラクタのシーケンスとの、前記ウィンドウポインタでスター トする前記キャラクタの前記最長一致の前記長さ及び前記ウィンドウポインタと して前記ポインタでスタートする前記キャラクタを表現することによってえられ ることが決定される時、前記最長一致を呈する前記キャラクタの圧縮された表現 として前記圧縮されたデータメモリ内に前記最長一致の前記長さ及び前記ウィン ドウポインタを格納し、さもなければ前記プレフィルデータ圧縮辞書内に格納さ れた前記キャラクタのシーケンスとの、前記ポインタでスタートする前記キャラ クタの前記最長一致の前記辞書エントリ番号を格納し、(e)前記最長一致を呈 するキャラクタを含ませるために前記キャラクタウィンドウを更新し、(f)前 記最長一致に続く前記キャラクタのシーケンス内のキャラクタまで前記ポインタ を移動させ、(g)圧縮されるべき前記キャラクタのシーケンス内のすべてのキ ャラクタについて各ステップb〜fを繰返す、各ステップを実行する圧縮手段、 をそなえているデータ圧縮システム。 60.前記圧縮されたデータメモリは前記圧縮手段から離れた位置にあり、前 記キャラクタウィンドウ内の前記キャラクタのシーケンスとの、前記ウィンドウ ポインタでスタートする前記キャラクタの前記最長一致の前記長さ及び前記ウィ ンドウポインタとして前記ポインタでスタートする前記キャラクタを表現するこ とによってより大きい圧縮がえられることがステップcにおいて前記圧縮手段に よって決定される時、前記最長一致の前記長さ及び前記ウィンドウポインタを前 記圧縮されたデータメモリに伝送する手段を更にそなえ、さもなければ前記プレ フィルデータ圧縮辞書内に格納された前記キャラクタのシーケンスとの、前記ポ インタでスタートする前記キャラクタの前記最長一致の前記辞書エントリ番号を 前記圧縮されたデータメモリに伝送する、請求項59に記載のシステム。 61.キャラクタのシーケンスの圧縮された表現を伸長するデータ伸長システ ムであって、前記圧縮された表現はプレフィルデータ圧縮辞書内に格納されたキ ャラクタのシーケンスとの、前記キャラクタのシーケンス内での特定のキャラク タへのポインタでスタートするキャラクタのシーケンスのそれぞれの最長一致へ の辞書ポインタをそなえ、前記プレフィルデータ圧縮辞書は前記キャラクタのシ ーケンス内で多発しそうなキャラクタの所定の組合せを包含しており、前記伸長 システムは、 前記キャラクタのシーケンスの前記圧縮された表現を格納する圧縮されたデー タメモリ、 伸長後前記キャラクタのシーケンスを格納する伸長されたデータメモリ、及び (a)前記圧縮されたデータメモリ内の前記キャラクタの前記圧縮された表現 内の第1の辞書ポインタへポインタを初期設定し、(b)前記ポインタによって 指示された前記辞書ポインタを用いて前記プレフィルデータ圧縮辞書から辞書エ ントリを検索し、(c)前記辞書エントリを前記最長一致を呈するキャラクタの 伸長された表現として前記伸長されたデータメモリ内に格納し、(d)前記キャ ラクタの前記圧縮された表現内での次の辞書ポインタへ前記ポインタを移動させ 、(e)前記キャラクタのシーケンス内のすべての圧縮されたキャラクタが伸長 されるまで前記圧縮されたデータメモリ 内での前記キャラクタの前記圧縮された表現内のすべての辞書ポインタについて 各ステップb〜dを繰返す、各ステップを実行する伸長手段、 をそなえているデータ伸長システム。 62.前記伸長手段は、前記圧縮されたデータメモリ内の前記キャラクタの前 記圧縮された表現から、(1)前記伸長手段による伸長の間使用するためのプレ フィルデータ圧縮辞書の一致性、及び(2)前記圧縮されたデータメモリ内の前 記キャラクタの前記圧縮された表現を伸長するために使用されるべきLempe l−Zivアルゴリズム変形版の表示、のうちの少なくとも1つを抽出する手段 をそなえている、請求項61に記載のシステム。 63.キャラクタのシーケンスの圧縮された表現を伸長するデータ伸長システ ムであって、前記圧縮された表現は、プレフィルデータ圧縮辞書及びデータ特定 データ圧縮辞書内に格納されたキャラクタのシーケンスとの、前記キャラクタの シーケンス内の特定のキャラクタへのポインタでスタートするキャラクタのシー ケンスのそれぞれの最長一致の辞書エントリ番号及びイクステンションキャラク タをそなえ、前記イクステンションキャラクタは前記ポインタでスタートする最 長一致の後に発生するキャラクタのシーケンス内のキャラクタであり、前記プレ フィルデータ圧縮辞書は前記キャラクタのシーケンス内で多発しそうなキャラク タの所定の組合せを包含しており、前記データ伸長システムは、 前記キャラクタのシーケンスの前記圧縮された表現を格納する圧縮されたデー タメモリ、 伸長後の前記キャラクタのシーケンスを格納する伸長されたデータメモリ、及 び (a)データ特定データ伸長辞書を初期設定し、(b)前記圧縮 されたデータメモリ内での前記キャラクタの前記圧縮された表現内の第1の辞書 エントリ番号へポインタを初期設定し、(c)前記ポインタによって指示された 辞書エントリ番号を用いて前記プレフィルデータ圧縮辞書及び前記データ特定デ ータ伸長辞書のうちの1つから辞書エントリ及びイクステンションキャラクタを 検索し、(d)前記伸長されたデータメモリ内に前記辞書エントリを前記最長一 致を呈するキャラクタの伸長された表現として格納し、(e)前記最長一致を呈 する前記キャラクタ及び前記イクステンションキャラクタを前記データ特定デー タ伸長辞書に選択的に格納し、(f)前記圧縮されたデータメモリ内での前記キ ャラクタの前記圧縮された表現内の次の辞書エントリ番号へ前記ポインタを移動 させ、(g)前記キャラクタのシーケンス内のすべての圧縮されたキャラクタが 伸長されるまで前記キャラクタの前記圧縮された表現内のすべての辞書エントリ 番号及びイクステンションキャラクタについて各ステップc〜fを繰返す、各ス テップを実行する伸長手段、 をそなえているデータ伸長システム。 64.前記伸長手段は、前記圧縮されたデータメモリ内の前記キャラクタの前 記圧縮された表現から、(1)伸長する間使用するためのプレフィルデータ圧縮 辞書の表示、(2)前記データ特定データ圧縮辞書及び前記プレフィルデータ圧 縮辞書の間にどのようにして辞書アドレススペースが割当てられるかについての 表示、(3)前記キャラクタの前記圧縮された表現を伸長するために使用される べきLempel−Zivアルゴリズム変形版の表示、及び(4)前記データ特 定データ圧縮辞書が満杯になった時どのような手法が後続するかについての表示 、のうちの少なくとも1つを抽出する手段を更にそなえている、請求項63に記 載のシステム。 65.キャラクタのシーケンスの圧縮された表現を伸長するデー タ伸長システムであって、前記圧縮された表現は圧縮されるべきキャラクタのシ ーケンスとの、そこに追加されるプレフィルデータ圧縮辞書を有するキャラクタ ウィンドウ内のキャラクタのシーケンスのそれぞれの最長一致の長さ及びウィン ドウポインタをそなえ、前記プレフィルデータ圧縮辞書は前記キャラクタのシー ケンス内で多発しそうなキャラクタの所定の組合せを包含しており、前記データ 伸長システムは、 前記キャラクタのシーケンスの前記圧縮された表現を格納するための圧縮され たデータメモリ、 伸長後前記キャラクタのシーケンスを格納するための伸長されたデータメモリ 、及び (a)前記圧縮されたデータメモリ内での前記キャラクタの前記圧縮された表 現内の長さ及び第1のウィンドウポインタへポインタを初期設定し、(b)前記 ポインタによって指示されるウィンドウポインタによって指示される現キャラク タウィンドウ内のキャラクタでスタートする前記長さによって決定される多数の キャラクタを検索し、(c)前記検索されたキャラクタを前記最長一致を呈する キャラクタの伸長された表現として前記伸長されたデータメモリに格納し、(d )前記圧縮されたデータメモリ内での前記キャラクタの前記圧縮された表現内の 長さ及び次のウィンドウポインタへ前記ポインタを移動させ、(e)前記キャラ クタのシーケンス内のすベての圧縮されたキャラクタが伸長されるまで前記キャ ラクタの前記圧縮された表現内のすべての長さ及びウィンドウポインタについて 各ステップb〜dを繰返す、各ステップを実行する伸長手段、 をそなえているデータ伸長システム。 66.前記伸長手段は、前記圧縮されたデータメモリ内の前記キャラクタの前 記圧縮された表現から、(1)伸長する間使用するた めのプレフィルデータ圧縮辞書の一致性、及び(2)前記キャラクタの前記圧縮 された表現を伸長するために使用されるべきLempel−Zivアルゴリズム 変形版の表示、のうちの少なくとも1つを抽出する手段を更にそなえている、請 求項65に記載のシステム。 67.キャラクタのシーケンスの圧縮された表現を伸長するデータ伸長システ ムであって、前記圧縮された表現は、(1)所定のサイズのキャラクタウィンド ウ内のキャラクタのシーケンスとの、前記キャラクタのシーケンス内の特定のキ ャラクタへのポインタでスタートするキャラクタのシーケンスのそれぞれの最長 一致の長さ及びウィンドウポインタ、及び(2)プレフィルデータ伸長辞書内の 特定のキャラクタへの前記ポインタでスタートするキャラクタのシーケンスのそ れぞれの最長一致の辞書エントリ番号であって、前記プレフィルデータ圧縮辞書 は前記キャラクタのシーケンス内で多発しそうなキャラクタの所定の組合せを包 含しており、前記データ伸長システムは、 前記キャラクタのシーケンスの前記圧縮された表現を格納するための圧縮され たデータメモリ、 伸長後前記キャラクタのシーケンスを格納するための伸長されたデータメモリ 、及び (a)前記圧縮されたデータメモリ内での前記キャラクタの前記圧縮された表 現内の第1のエントリへポインタを初期設定し、(b)前記ポインタによって指 示された前記キャラクタの前記圧縮された表現内の現エントリが、(1)ウィン ドウポインタ及び長さであるか、又は(2)辞書エントリ番号であるかを決定し 、(c)前記圧縮された表現内の前記現エントリがウィンドウポインタ及び長さ であれば、前記ウィンドウポインタによって指示された現キャラク タウィンドウ内のキャラクタでスタートする前記長さによって決定される多数の キャラクタを検索し、(d)前記圧縮された表現内の前記現エントリが辞書エン トリ番号であれば、前記辞書エントリ番号によって特定される前記プレフィルデ ータ伸長辞書内の辞書エントリでキャラクタを検索し、(e)現エントリについ ての最長一致を呈するキャラクタの伸長された表現として前記伸長されたデータ メモリに各ステップc又はdにおいて検索されたキャラクタを格納し、(f)前 記圧縮されたデータメモリ内での前記キャラクタの前記圧縮された表現内の次の エントリへ前記ポインタを移動させ、(g)前記キャラクタのシーケンス内のす べての圧縮されたキャラクタが伸長されるまで前記キャラクタの前記圧縮された 表現内のすべてのエントリについて各ステップb〜fを繰返す、各ステップを実 行するための伸長手段、 をそなえているデータ伸長システム。 68.前記伸長手段は、前記圧縮されたデータメモリ内の前記キャラクタの前 記圧縮された表現から、(1)伸長する間使用するためのプレフィルデータ圧縮 辞書の一致性、及び(2)前記キャラクタの前記圧縮された表現を伸長するため に使用されるべきLempel−Zivアルゴリズム変形版の表示、のうちの少 なくとも1つを抽出する手段を更にそなえている、請求項67に記載のシステム 。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/692,474 | 1996-08-06 | ||
US08/692,474 US5951623A (en) | 1996-08-06 | 1996-08-06 | Lempel- Ziv data compression technique utilizing a dictionary pre-filled with frequent letter combinations, words and/or phrases |
PCT/US1997/013681 WO1998006028A1 (en) | 1996-08-06 | 1997-08-04 | A lempel-ziv data compression technique utilizing a dicionary pre-filled with fequent letter combinations, words and/or phrases |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000516058A true JP2000516058A (ja) | 2000-11-28 |
JP3935952B2 JP3935952B2 (ja) | 2007-06-27 |
Family
ID=24780736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50814798A Expired - Fee Related JP3935952B2 (ja) | 1996-08-06 | 1997-08-04 | 頻度の高いキャラクタの組み合わせ、ワード及び/又はフレーズでプレフィルした辞書を用いるLempel―Zivデータ圧縮技術 |
Country Status (9)
Country | Link |
---|---|
US (2) | US5951623A (ja) |
EP (1) | EP0970419B1 (ja) |
JP (1) | JP3935952B2 (ja) |
AT (1) | ATE366435T1 (ja) |
AU (1) | AU721734B2 (ja) |
CA (1) | CA2263453C (ja) |
DE (1) | DE69737892T2 (ja) |
ES (1) | ES2289762T3 (ja) |
WO (1) | WO1998006028A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219882A (ja) * | 2006-02-17 | 2007-08-30 | Makoto Goto | ファイル格納装置 |
JP2011530234A (ja) * | 2008-07-31 | 2011-12-15 | マイクロソフト コーポレーション | 大規模なデータストレージのための効率的な列ベースデータの符号化 |
US8902087B1 (en) | 2013-08-27 | 2014-12-02 | International Business Machines Corporation | Data decompression utilizing pre-expanded dictionaries during decompression |
CN115801902A (zh) * | 2023-02-09 | 2023-03-14 | 北京特立信电子技术股份有限公司 | 一种网络访问请求数据的压缩方法 |
Families Citing this family (160)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5758257A (en) | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
JPH11143877A (ja) * | 1997-10-22 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム |
KR100448289B1 (ko) * | 1997-12-20 | 2004-11-16 | 주식회사 대우일렉트로닉스 | 스트링매칭모듈을갖는데이터압축시스템 |
US6055526A (en) * | 1998-04-02 | 2000-04-25 | Sun Microsystems, Inc. | Data indexing technique |
US6100824A (en) * | 1998-04-06 | 2000-08-08 | National Dispatch Center, Inc. | System and method for data compression |
US6216175B1 (en) * | 1998-06-08 | 2001-04-10 | Microsoft Corporation | Method for upgrading copies of an original file with same update data after normalizing differences between copies created during respective original installations |
JP4242970B2 (ja) * | 1998-07-09 | 2009-03-25 | 富士通株式会社 | データ圧縮方法及びデータ圧縮装置 |
US6393149B2 (en) | 1998-09-17 | 2002-05-21 | Navigation Technologies Corp. | Method and system for compressing data and a geographic database formed therewith and methods for use thereof in a navigation application program |
CH693729A5 (de) * | 1998-10-28 | 2003-12-31 | Andrei Vertel | Verfahren und Anlage zur Verarbeitung oder Uebertragung von Text. |
US6304878B1 (en) | 1998-11-23 | 2001-10-16 | Microsoft Corporation | Method and system for improved enumeration of tries |
US6298321B1 (en) * | 1998-11-23 | 2001-10-02 | Microsoft Corporation | Trie compression using substates and utilizing pointers to replace or merge identical, reordered states |
US6456209B1 (en) * | 1998-12-01 | 2002-09-24 | Lucent Technologies Inc. | Method and apparatus for deriving a plurally parsable data compression dictionary |
US6604106B1 (en) * | 1998-12-10 | 2003-08-05 | International Business Machines Corporation | Compression and delivery of web server content |
US6624761B2 (en) | 1998-12-11 | 2003-09-23 | Realtime Data, Llc | Content independent data compression method and system |
US6604158B1 (en) | 1999-03-11 | 2003-08-05 | Realtime Data, Llc | System and methods for accelerated data storage and retrieval |
US6601104B1 (en) | 1999-03-11 | 2003-07-29 | Realtime Data Llc | System and methods for accelerated data storage and retrieval |
US6347383B1 (en) * | 1999-03-31 | 2002-02-12 | International Business Machines Corporation | Method and system for address trace compression through loop detection and reduction |
AU771959B2 (en) * | 1999-08-13 | 2004-04-08 | Fujitsu Limited | File processing method, data processing device and storage medium |
US6675169B1 (en) | 1999-09-07 | 2004-01-06 | Microsoft Corporation | Method and system for attaching information to words of a trie |
US6535886B1 (en) * | 1999-10-18 | 2003-03-18 | Sony Corporation | Method to compress linguistic structures |
US7181608B2 (en) | 2000-02-03 | 2007-02-20 | Realtime Data Llc | Systems and methods for accelerated loading of operating systems and application programs |
US6856651B2 (en) * | 2000-07-25 | 2005-02-15 | Peribit Networks, Inc. | System and method for incremental and continuous data compression |
EP1330720B1 (en) * | 2000-07-25 | 2008-05-28 | Juniper Networks, Inc. | Network architecture and methods for transparent on-line cross-sessional encoding and transport of network communications data |
DE10196513T1 (de) * | 2000-08-15 | 2003-11-13 | Seagate Technology Llc | Dualmodus-Datenkompression für einen Betriebscode |
US6898605B2 (en) * | 2000-09-11 | 2005-05-24 | Snap-On Incorporated | Textual data storage system and method |
US20030217025A1 (en) * | 2000-09-11 | 2003-11-20 | David Costantino | Textual data storage system and method |
US7417568B2 (en) | 2000-10-03 | 2008-08-26 | Realtime Data Llc | System and method for data feed acceleration and encryption |
US8692695B2 (en) | 2000-10-03 | 2014-04-08 | Realtime Data, Llc | Methods for encoding and decoding data |
US9143546B2 (en) | 2000-10-03 | 2015-09-22 | Realtime Data Llc | System and method for data feed acceleration and encryption |
US6359548B1 (en) | 2000-10-16 | 2002-03-19 | Unisys Corporation | Data compression and decompression method and apparatus with embedded filtering of infrequently encountered strings |
US6735339B1 (en) * | 2000-10-27 | 2004-05-11 | Dolby Laboratories Licensing Corporation | Multi-stage encoding of signal components that are classified according to component value |
US6985965B2 (en) * | 2000-11-16 | 2006-01-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Static information knowledge used with binary compression methods |
KR100382649B1 (ko) * | 2000-12-29 | 2003-05-09 | 삼성전자주식회사 | 하드 카피 장치용 데이타 압축 및 복원 방법들 및 장치들 |
US20020085764A1 (en) * | 2000-12-29 | 2002-07-04 | Brady Thomas S. | Enhanced data compression technique |
US7386046B2 (en) | 2001-02-13 | 2008-06-10 | Realtime Data Llc | Bandwidth sensitive data compression and decompression |
US6392568B1 (en) * | 2001-03-07 | 2002-05-21 | Unisys Corporation | Data compression and decompression method and apparatus with embedded filtering of dynamically variable infrequently encountered strings |
US7155173B2 (en) * | 2001-03-14 | 2006-12-26 | Nokia Corporation | Method and system for providing a context for message compression |
US7500017B2 (en) * | 2001-04-19 | 2009-03-03 | Microsoft Corporation | Method and system for providing an XML binary format |
US6400286B1 (en) * | 2001-06-20 | 2002-06-04 | Unisys Corporation | Data compression method and apparatus implemented with limited length character tables |
US20030153338A1 (en) | 2001-07-24 | 2003-08-14 | Herz Frederick S. M. | Autoband |
US6961011B2 (en) * | 2001-08-27 | 2005-11-01 | Freescale Semiconductor, Inc. | Data compression system |
AU2002358953A1 (en) | 2001-12-10 | 2003-06-23 | Virtual Locality Ltd. | Apparatus and method for optimized and secured reflection of network services to remote locations |
US6624762B1 (en) * | 2002-04-11 | 2003-09-23 | Unisys Corporation | Hardware-based, LZW data compression co-processor |
US20030231184A1 (en) * | 2002-04-22 | 2003-12-18 | Gurney Darin V. | Directory listings white space reduction method, apparatus, and system |
US7071854B1 (en) * | 2002-05-13 | 2006-07-04 | Unisys Corporation | Hardware-implemented LZW data decompression |
US7269548B2 (en) * | 2002-07-03 | 2007-09-11 | Research In Motion Ltd | System and method of creating and using compact linguistic data |
US6608570B1 (en) * | 2002-07-15 | 2003-08-19 | Unisys Corporation | Matrix implemented data compression apparatus and method |
US6798362B2 (en) | 2002-10-30 | 2004-09-28 | International Business Machines Corporation | Polynomial-time, sequential, adaptive system and method for lossy data compression |
CA2511952A1 (en) * | 2002-12-27 | 2004-07-15 | Nokia Corporation | Predictive text entry and data compression method for a mobile communication terminal |
US20040139298A1 (en) * | 2003-01-09 | 2004-07-15 | International Business Machines Corporation | Method and apparatus for instruction compression and decompression in a cache memory |
US6674374B1 (en) * | 2003-01-25 | 2004-01-06 | Unisys Corporation | Data compressor utilizing switched input coincidence elements |
US6847315B2 (en) * | 2003-04-17 | 2005-01-25 | International Business Machines Corporation | Nonuniform compression span |
US6756923B1 (en) * | 2003-05-30 | 2004-06-29 | Unisys Corporation | Data compressor utilizing switched input coincidence elements arranged in virtual levels |
GB2403033A (en) * | 2003-06-18 | 2004-12-22 | Research In Motion Ltd | PDA software compression |
US20070162957A1 (en) * | 2003-07-01 | 2007-07-12 | Andrew Bartels | Methods, systems and devices for securing supervisory control and data acquisition (SCADA) communications |
US9614772B1 (en) | 2003-10-20 | 2017-04-04 | F5 Networks, Inc. | System and method for directing network traffic in tunneling applications |
US7039394B2 (en) * | 2003-11-25 | 2006-05-02 | Good Technology, Inc. | Communication system and method for compressing information sent by a communication device to a target portable communication device |
US7079054B2 (en) * | 2004-06-04 | 2006-07-18 | Broadcom Corporation | V.42bis standalone hardware accelerator and architecture of construction |
US8954400B2 (en) * | 2004-09-13 | 2015-02-10 | International Business Machines Corporation | Method, system and program product for managing structured data |
US8024483B1 (en) | 2004-10-01 | 2011-09-20 | F5 Networks, Inc. | Selective compression for network connections |
US20060106870A1 (en) * | 2004-11-16 | 2006-05-18 | International Business Machines Corporation | Data compression using a nested hierarchy of fixed phrase length dictionaries |
US8511558B2 (en) * | 2005-04-12 | 2013-08-20 | Sandisk Il Ltd. | Smartcard power management |
US7102552B1 (en) * | 2005-06-07 | 2006-09-05 | Windspring, Inc. | Data compression with edit-in-place capability for compressed data |
US7783781B1 (en) | 2005-08-05 | 2010-08-24 | F5 Networks, Inc. | Adaptive compression |
US8533308B1 (en) | 2005-08-12 | 2013-09-10 | F5 Networks, Inc. | Network traffic management through protocol-configurable transaction processing |
US7739586B2 (en) * | 2005-08-19 | 2010-06-15 | Microsoft Corporation | Encoding of markup language data |
US8745140B2 (en) * | 2005-10-14 | 2014-06-03 | Blackberry Limited | System and method of handling messages for forwarding |
SE530081C2 (sv) | 2005-10-24 | 2008-02-26 | Algotrim Ab | Metod och system för datakomprimering |
US20070124306A1 (en) * | 2005-11-09 | 2007-05-31 | Honda Motor Co., Ltd. | Method and system for transmitting data to vehicles over limited data links |
US7307552B2 (en) * | 2005-11-16 | 2007-12-11 | Cisco Technology, Inc. | Method and apparatus for efficient hardware based deflate |
US8275909B1 (en) | 2005-12-07 | 2012-09-25 | F5 Networks, Inc. | Adaptive compression |
US7882084B1 (en) * | 2005-12-30 | 2011-02-01 | F5 Networks, Inc. | Compression of data transmitted over a network |
US7873065B1 (en) | 2006-02-01 | 2011-01-18 | F5 Networks, Inc. | Selectively enabling network packet concatenation based on metrics |
US8565088B1 (en) | 2006-02-01 | 2013-10-22 | F5 Networks, Inc. | Selectively enabling packet concatenation based on a transaction boundary |
US7552363B2 (en) * | 2006-03-23 | 2009-06-23 | Arm Limited | Generation of trace elements within a data processing apparatus |
US9772981B2 (en) * | 2006-03-29 | 2017-09-26 | EMC IP Holding Company LLC | Combined content indexing and data reduction |
US20070255570A1 (en) * | 2006-04-26 | 2007-11-01 | Annaz Fawaz Y | Multi-platform visual pronunciation dictionary |
US8626726B2 (en) | 2006-05-31 | 2014-01-07 | International Business Machines Corporation | Method and system for transformation of logical data objects for storage |
US8769311B2 (en) | 2006-05-31 | 2014-07-01 | International Business Machines Corporation | Systems and methods for transformation of logical data objects for storage |
US9356824B1 (en) | 2006-09-29 | 2016-05-31 | F5 Networks, Inc. | Transparently cached network resources |
US20080120315A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Signal message decompressor |
US8417833B1 (en) | 2006-11-29 | 2013-04-09 | F5 Networks, Inc. | Metacodec for optimizing network data compression based on comparison of write and read rates |
US7817630B2 (en) | 2006-12-18 | 2010-10-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Method, communications node, and memory for dynamic dictionary updating and optimization for compression and decompression of messages |
US9106606B1 (en) | 2007-02-05 | 2015-08-11 | F5 Networks, Inc. | Method, intermediate device and computer program code for maintaining persistency |
US7439887B2 (en) * | 2007-02-13 | 2008-10-21 | Seiko Epson Corporation | Method and apparatus for GIF decompression using fixed-size codeword table |
US7439882B1 (en) * | 2007-04-05 | 2008-10-21 | Novell, Inc. | Optimized decompression using annotated back buffer |
US8819288B2 (en) * | 2007-09-14 | 2014-08-26 | Microsoft Corporation | Optimized data stream compression using data-dependent chunking |
US8078454B2 (en) * | 2007-09-28 | 2011-12-13 | Microsoft Corporation | Two-pass hash extraction of text strings |
FR2926378B1 (fr) * | 2008-01-14 | 2013-07-05 | Canon Kk | Procede et dispositif de traitement pour l'encodage d'un document de donnees hierarchisees |
US7688233B2 (en) * | 2008-02-07 | 2010-03-30 | Red Hat, Inc. | Compression for deflate algorithm |
US8572287B2 (en) * | 2008-02-14 | 2013-10-29 | Blackberry Limited | Method and apparatus for communicating compression state information for interactive compression |
US8166249B2 (en) * | 2008-03-10 | 2012-04-24 | International Business Machines Corporation | Performing a least recently used (LRU) algorithm for a co-processor |
US8688654B2 (en) * | 2009-10-06 | 2014-04-01 | International Business Machines Corporation | Data compression algorithm selection and tiering |
US7953881B1 (en) * | 2008-06-12 | 2011-05-31 | Juniper Networks, Inc. | Network characteristic-based compression of network traffic |
FR2933793B1 (fr) * | 2008-07-11 | 2013-07-05 | Canon Kk | Procedes de codage et de decodage, par referencement, de valeurs dans un document structure, et systemes associes. |
US7696906B2 (en) * | 2008-08-13 | 2010-04-13 | International Business Machines Corporation | LZW data compression algorithm |
US7764202B2 (en) * | 2008-11-26 | 2010-07-27 | Red Hat, Inc. | Lossless data compression with separated index values and literal values in output stream |
US7764201B2 (en) * | 2008-11-26 | 2010-07-27 | Red Hat, Inc. | Table management for LZW with fixed-size tables |
US7750826B2 (en) * | 2008-11-26 | 2010-07-06 | Red Hat, Inc. | Data structure management for lossless data compression |
US8918374B1 (en) * | 2009-02-13 | 2014-12-23 | At&T Intellectual Property I, L.P. | Compression of relational table data files |
US8874529B2 (en) * | 2009-03-16 | 2014-10-28 | Bert A. Silich | User-determinable method and system for manipulating and displaying textual and graphical information |
US9160611B2 (en) * | 2009-04-22 | 2015-10-13 | Webroot Inc. | System and method for performing longest common prefix strings searches |
US8355585B2 (en) * | 2009-05-12 | 2013-01-15 | Red Hat Israel, Ltd. | Data compression of images using a shared dictionary |
US9438413B2 (en) * | 2010-01-08 | 2016-09-06 | Novell, Inc. | Generating and merging keys for grouping and differentiating volumes of files |
US9298722B2 (en) * | 2009-07-16 | 2016-03-29 | Novell, Inc. | Optimal sequential (de)compression of digital data |
KR101049699B1 (ko) * | 2009-07-17 | 2011-07-15 | (주)이스트소프트 | 데이터의 압축방법 |
US7982636B2 (en) * | 2009-08-20 | 2011-07-19 | International Business Machines Corporation | Data compression using a nested hierachy of fixed phrase length static and dynamic dictionaries |
US8832103B2 (en) | 2010-04-13 | 2014-09-09 | Novell, Inc. | Relevancy filter for new data based on underlying files |
DE112011104633B4 (de) * | 2010-12-28 | 2016-11-10 | International Business Machines Corporation | Einheit zum Ermitteln des Ausgangspunkts für eine Suche |
JPWO2012150637A1 (ja) * | 2011-05-02 | 2014-07-28 | 富士通株式会社 | 抽出方法、情報処理方法、抽出プログラム、情報処理プログラム、抽出装置、および情報処理装置 |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
US20130018932A1 (en) | 2011-07-12 | 2013-01-17 | Hughes Network Systems, Llc | System and method for long range and short range data compression |
US9479383B2 (en) | 2011-07-12 | 2016-10-25 | Hughes Network Systems, Llc | Data compression for priority based data traffic, on an aggregate traffic level, in a multi stream communications system |
GB2496385B (en) | 2011-11-08 | 2014-03-05 | Canon Kk | Methods and network devices for communicating data packets |
US8610604B2 (en) | 2011-11-24 | 2013-12-17 | International Business Machines Corporation | Compression algorithm incorporating a feedback loop for dynamic selection of a predefined Huffman dictionary |
US8610606B2 (en) | 2011-11-24 | 2013-12-17 | International Business Machines Corporation | Compression algorithm incorporating dynamic selection of a predefined huffman dictionary |
US8542135B2 (en) | 2011-11-24 | 2013-09-24 | International Business Machines Corporation | Compression algorithm incorporating automatic generation of a bank of predefined huffman dictionaries |
US9251143B2 (en) | 2012-01-13 | 2016-02-02 | International Business Machines Corporation | Converting data into natural language form |
US8593308B1 (en) | 2012-05-31 | 2013-11-26 | International Business Machines Corporation | Method of accelerating dynamic Huffman decompaction within the inflate algorithm |
US8674856B2 (en) | 2012-08-16 | 2014-03-18 | International Business Machines Corporation | Data compression utilizing longest common subsequence template |
US8791843B2 (en) | 2012-10-15 | 2014-07-29 | Lsi Corporation | Optimized bitstream encoding for compression |
US9035809B2 (en) | 2012-10-15 | 2015-05-19 | Seagate Technology Llc | Optimizing compression engine throughput via run pre-processing |
US9231615B2 (en) | 2012-10-24 | 2016-01-05 | Seagate Technology Llc | Method to shorten hash chains in Lempel-Ziv compression of data with repetitive symbols |
US20140149605A1 (en) * | 2012-11-26 | 2014-05-29 | Saravana Annamalaisami | Systems and methods for dictionary based compression |
US9087070B2 (en) * | 2013-01-31 | 2015-07-21 | Yahoo! Inc. | System and method for applying an efficient data compression scheme to URL parameters |
US9998140B2 (en) | 2013-04-22 | 2018-06-12 | International Business Machines Corporation | Matching pattern combinations via fast array comparison |
US8804814B1 (en) * | 2013-06-04 | 2014-08-12 | Centri Technology, Inc. | Seeding of a workspace to optimize codec operations |
US8933829B2 (en) * | 2013-09-23 | 2015-01-13 | International Business Machines Corporation | Data compression using dictionary encoding |
JP6319740B2 (ja) * | 2014-03-25 | 2018-05-09 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | データ圧縮を高速化する方法、並びに、データ圧縮を高速化するためのコンピュータ、及びそのコンピュータ・プログラム |
US9450607B1 (en) * | 2014-07-10 | 2016-09-20 | Google Inc. | Encoding or decoding characters as word in corpus |
US9805099B2 (en) | 2014-10-30 | 2017-10-31 | The Johns Hopkins University | Apparatus and method for efficient identification of code similarity |
US9413386B1 (en) * | 2015-02-19 | 2016-08-09 | Qualcomm Incorporated | System, apparatus, and method for decompressing data |
US10102215B2 (en) * | 2015-03-27 | 2018-10-16 | Intel Corporation | Apparatus for hardware implementation of lossless data compression |
US9971704B2 (en) | 2015-03-27 | 2018-05-15 | International Business Machines Corporation | Data compression accelerator methods, apparatus and design structure with improved resource utilization |
US9736081B2 (en) | 2015-06-04 | 2017-08-15 | At&T Intellectual Property I, L.P. | Apparatus and method to improve compression and storage data |
JP6536243B2 (ja) * | 2015-07-16 | 2019-07-03 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、照合プログラム、照合装置および照合方法 |
US9953058B1 (en) | 2015-07-29 | 2018-04-24 | Levyx, Inc. | Systems and methods for searching large data sets |
US10339121B2 (en) * | 2015-08-06 | 2019-07-02 | Sap Se | Data compression |
US9584155B1 (en) * | 2015-09-24 | 2017-02-28 | Intel Corporation | Look-ahead hash chain matching for data compression |
US10303759B2 (en) | 2015-12-03 | 2019-05-28 | International Business Machines Corporation | Memory preserving parse tree based compression with entropy coding |
US9513813B1 (en) | 2015-12-18 | 2016-12-06 | International Business Machines Corporation | Determining prefix codes for pseudo-dynamic data compression utilizing clusters formed based on compression ratio |
US10509580B2 (en) * | 2016-04-01 | 2019-12-17 | Intel Corporation | Memory controller and methods for memory compression utilizing a hardware compression engine and a dictionary to indicate a zero value, full match, partial match, or no match |
JP6648620B2 (ja) * | 2016-04-19 | 2020-02-14 | 富士通株式会社 | 符号化プログラム、符号化装置および符号化方法 |
US10303402B2 (en) | 2016-08-02 | 2019-05-28 | Seagate Technology Llc | Data compression using partial statistics |
US20220107919A1 (en) * | 2017-05-19 | 2022-04-07 | Takashi Suzuki | Computerized systems and methods of data compression |
US10956440B2 (en) | 2017-10-16 | 2021-03-23 | International Business Machines Corporation | Compressing a plurality of documents |
US10224957B1 (en) * | 2017-11-27 | 2019-03-05 | Intel Corporation | Hash-based data matching enhanced with backward matching for data compression |
US10097201B1 (en) * | 2017-11-30 | 2018-10-09 | Intel Corporation | LZ77 compression of data with data runs |
US10128868B1 (en) * | 2017-12-29 | 2018-11-13 | Intel Corporation | Efficient dictionary for lossless compression |
US10735025B2 (en) * | 2018-03-02 | 2020-08-04 | Microsoft Technology Licensing, Llc | Use of data prefixes to increase compression ratios |
US20190348999A1 (en) * | 2018-05-12 | 2019-11-14 | Redpine Signals, Inc. | Method and apparatus for compression and decompression of a numerical file |
US10897270B2 (en) * | 2018-06-06 | 2021-01-19 | Yingquan Wu | Dynamic dictionary-based data symbol encoding |
US11387844B2 (en) * | 2019-04-19 | 2022-07-12 | Preferred Networks, Inc. | Data compression method, data compression apparatus, data decompression method, data decompression apparatus and data storage system |
US11122095B2 (en) | 2019-09-23 | 2021-09-14 | Netapp, Inc. | Methods for dictionary-based compression and devices thereof |
US11803693B2 (en) | 2021-06-18 | 2023-10-31 | Microsoft Technology Licensing, Llc | Text compression with predicted continuations |
US20230281164A1 (en) * | 2022-03-03 | 2023-09-07 | Fotonation Limited | Data decompression apparatus |
CN115988569B (zh) * | 2023-03-21 | 2023-06-30 | 浙江省疾病预防控制中心 | 一种蓝牙设备数据快速传输方法 |
CN116683916B (zh) * | 2023-08-03 | 2023-10-10 | 山东五棵松电气科技有限公司 | 一种数据中心容灾系统 |
CN117113383B (zh) * | 2023-10-19 | 2024-01-26 | 山东万世机械科技有限公司 | 一种设备本地生产数据隐私保护方法及系统 |
CN117171118B (zh) * | 2023-11-02 | 2024-02-20 | 山东天晴生物科技股份有限公司 | 一种乡村营销数据智能管理系统 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US545576A (en) * | 1895-09-03 | Hame-tug | ||
US4386416A (en) * | 1980-06-02 | 1983-05-31 | Mostek Corporation | Data compression, encryption, and in-line transmission system |
US4464650A (en) * | 1981-08-10 | 1984-08-07 | Sperry Corporation | Apparatus and method for compressing data signals and restoring the compressed data signals |
US4814746A (en) * | 1983-06-01 | 1989-03-21 | International Business Machines Corporation | Data compression method |
US4558302A (en) * | 1983-06-20 | 1985-12-10 | Sperry Corporation | High speed data compression and decompression apparatus and method |
US4672679A (en) * | 1983-08-16 | 1987-06-09 | Wang Laboratories, Inc. | Context redundancy text compression |
GB2172127B (en) * | 1985-03-06 | 1988-10-12 | Ferranti Plc | Data compression system |
US4843389A (en) * | 1986-12-04 | 1989-06-27 | International Business Machines Corp. | Text compression and expansion method and apparatus |
US4876541A (en) * | 1987-10-15 | 1989-10-24 | Data Compression Corporation | Stem for dynamically compressing and decompressing electronic data |
US4881075A (en) * | 1987-10-15 | 1989-11-14 | Digital Equipment Corporation | Method and apparatus for adaptive data compression |
US4847619A (en) * | 1987-10-19 | 1989-07-11 | Hewlett-Packard Company | Performance-based reset of data compression dictionary |
US4906991A (en) * | 1988-04-29 | 1990-03-06 | Xerox Corporation | Textual substitution data compression with finite length search windows |
GB8815978D0 (en) * | 1988-07-05 | 1988-08-10 | British Telecomm | Method & apparatus for encoding decoding & transmitting data in compressed form |
US5003307A (en) * | 1989-01-13 | 1991-03-26 | Stac, Inc. | Data compression apparatus with shift register search means |
US5016009A (en) * | 1989-01-13 | 1991-05-14 | Stac, Inc. | Data compression apparatus and method |
US5126739A (en) * | 1989-01-13 | 1992-06-30 | Stac Electronics | Data compression apparatus and method |
DE3921646A1 (de) * | 1989-06-30 | 1991-01-03 | Siemens Ag | Verfahren zu einer codierung einer elementfolge und einrichtung zur durchfuehrung des verfahrens |
US5058137A (en) * | 1989-07-31 | 1991-10-15 | North American Philips Corporation | Lempel-Ziv decoder |
US4988998A (en) * | 1989-09-05 | 1991-01-29 | Storage Technology Corporation | Data compression system for successively applying at least two data compression methods to an input data stream |
US5001478A (en) * | 1989-12-28 | 1991-03-19 | International Business Machines Corporation | Method of encoding compressed data |
US5023610A (en) * | 1990-06-13 | 1991-06-11 | Cordell Manufacturing, Inc. | Data compression method using textual substitution |
US5049881A (en) * | 1990-06-18 | 1991-09-17 | Intersecting Concepts, Inc. | Apparatus and method for very high data rate-compression incorporating lossless data compression and expansion utilizing a hashing technique |
US5087913A (en) * | 1990-08-27 | 1992-02-11 | Unisys Corporation | Short-record data compression and decompression system |
US5179378A (en) * | 1991-07-30 | 1993-01-12 | University Of South Florida | Method and apparatus for the compression and decompression of data using Lempel-Ziv based techniques |
US5140321A (en) * | 1991-09-04 | 1992-08-18 | Prime Computer, Inc. | Data compression/decompression method and apparatus |
US5155484A (en) * | 1991-09-13 | 1992-10-13 | Salient Software, Inc. | Fast data compressor with direct lookup table indexing into history buffer |
US5373290A (en) * | 1991-09-25 | 1994-12-13 | Hewlett-Packard Corporation | Apparatus and method for managing multiple dictionaries in content addressable memory based data compression |
US5243341A (en) * | 1992-06-01 | 1993-09-07 | Hewlett Packard Company | Lempel-Ziv compression scheme with enhanced adapation |
JP3241788B2 (ja) | 1992-02-28 | 2001-12-25 | 富士通株式会社 | データ圧縮方式 |
JPH05241775A (ja) | 1992-02-28 | 1993-09-21 | Fujitsu Ltd | データ圧縮方式 |
US5590317A (en) * | 1992-05-27 | 1996-12-31 | Hitachi, Ltd. | Document information compression and retrieval system and document information registration and retrieval method |
US5485526A (en) * | 1992-06-02 | 1996-01-16 | Hewlett-Packard Corporation | Memory circuit for lossless data compression/decompression dictionary storage |
JPH0628149A (ja) | 1992-07-10 | 1994-02-04 | Fujitsu Ltd | 複数種類データのデータ圧縮方法 |
JPH06161705A (ja) | 1992-11-19 | 1994-06-10 | Fujitsu Ltd | データ符号化方式及びデータ復元方式 |
US5455576A (en) * | 1992-12-23 | 1995-10-03 | Hewlett Packard Corporation | Apparatus and methods for Lempel Ziv data compression with improved management of multiple dictionaries in content addressable memory |
DE4244272A1 (de) | 1992-12-28 | 1994-06-30 | Daimler Benz Ag | Feldeffektgesteuertes Halbleiterbauelement |
JP2536422B2 (ja) | 1993-08-31 | 1996-09-18 | 日本電気株式会社 | デ―タ圧縮装置及びデ―タ復元装置 |
JP3346626B2 (ja) | 1993-11-30 | 2002-11-18 | 京セラ株式会社 | データ圧縮装置 |
US5572206A (en) | 1994-07-06 | 1996-11-05 | Microsoft Corporation | Data compression method and system |
US5561421A (en) * | 1994-07-28 | 1996-10-01 | International Business Machines Corporation | Access method data compression with system-built generic dictionaries |
JPH08162874A (ja) | 1994-11-30 | 1996-06-21 | Kinseki Ltd | 水晶振動子の製造方法 |
JP3277792B2 (ja) * | 1996-01-31 | 2002-04-22 | 株式会社日立製作所 | データ圧縮方法および装置 |
-
1996
- 1996-08-06 US US08/692,474 patent/US5951623A/en not_active Ceased
-
1997
- 1997-08-04 CA CA002263453A patent/CA2263453C/en not_active Expired - Fee Related
- 1997-08-04 AT AT97938108T patent/ATE366435T1/de active
- 1997-08-04 WO PCT/US1997/013681 patent/WO1998006028A1/en active IP Right Grant
- 1997-08-04 ES ES97938108T patent/ES2289762T3/es not_active Expired - Lifetime
- 1997-08-04 JP JP50814798A patent/JP3935952B2/ja not_active Expired - Fee Related
- 1997-08-04 AU AU40512/97A patent/AU721734B2/en not_active Ceased
- 1997-08-04 DE DE69737892T patent/DE69737892T2/de not_active Expired - Lifetime
- 1997-08-04 EP EP97938108A patent/EP0970419B1/en not_active Expired - Lifetime
-
2001
- 2001-09-14 US US09/952,602 patent/USRE41152E1/en not_active Expired - Lifetime
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007219882A (ja) * | 2006-02-17 | 2007-08-30 | Makoto Goto | ファイル格納装置 |
US9262426B2 (en) | 2006-02-17 | 2016-02-16 | Makoto Goto | File storage apparatus |
JP2011530234A (ja) * | 2008-07-31 | 2011-12-15 | マイクロソフト コーポレーション | 大規模なデータストレージのための効率的な列ベースデータの符号化 |
US8902087B1 (en) | 2013-08-27 | 2014-12-02 | International Business Machines Corporation | Data decompression utilizing pre-expanded dictionaries during decompression |
WO2015029329A1 (en) * | 2013-08-27 | 2015-03-05 | International Business Machines Corporation | Data decompression utilizing pre-expanded dictionaries during decompression |
JP2016533046A (ja) * | 2013-08-27 | 2016-10-20 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 復元中に予備拡張辞書を利用するデータ復元 |
CN115801902A (zh) * | 2023-02-09 | 2023-03-14 | 北京特立信电子技术股份有限公司 | 一种网络访问请求数据的压缩方法 |
CN115801902B (zh) * | 2023-02-09 | 2023-04-11 | 北京特立信电子技术股份有限公司 | 一种网络访问请求数据的压缩方法 |
Also Published As
Publication number | Publication date |
---|---|
ATE366435T1 (de) | 2007-07-15 |
US5951623A (en) | 1999-09-14 |
DE69737892T2 (de) | 2008-04-03 |
EP0970419B1 (en) | 2007-07-04 |
EP0970419A4 (en) | 2000-05-10 |
EP0970419A1 (en) | 2000-01-12 |
CA2263453A1 (en) | 1998-02-12 |
AU4051297A (en) | 1998-02-25 |
USRE41152E1 (en) | 2010-02-23 |
WO1998006028A1 (en) | 1998-02-12 |
ES2289762T3 (es) | 2008-02-01 |
DE69737892D1 (de) | 2007-08-16 |
CA2263453C (en) | 2004-10-05 |
AU721734B2 (en) | 2000-07-13 |
JP3935952B2 (ja) | 2007-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000516058A (ja) | 頻度の高いキャラクタの組み合わせ、ワード及び/又はフレーズでプレフィルした辞書を用いるLempel―Zivデータ圧縮技術 | |
WO1998006028A9 (en) | A lempel-ziv data compression technique utilizing a dicionary pre-filled with fequent letter combinations, words and/or phrases | |
Zobel et al. | Adding compression to a full‐text retrieval system | |
US5229768A (en) | Adaptive data compression system | |
Nevill-Manning et al. | Compression and explanation using hierarchical grammars | |
Roth et al. | Database compression | |
US4814746A (en) | Data compression method | |
US4988998A (en) | Data compression system for successively applying at least two data compression methods to an input data stream | |
US5999949A (en) | Text file compression system utilizing word terminators | |
JP2986319B2 (ja) | 準静的データを圧縮し展開する方法 | |
JP2979106B2 (ja) | データ圧縮 | |
JPH0682370B2 (ja) | 文字処理装置 | |
JP2531508B2 (ja) | デ―タ列圧縮の方法 | |
EP0127815B1 (en) | Data compression method | |
US5815096A (en) | Method for compressing sequential data into compression symbols using double-indirect indexing into a dictionary data structure | |
JP2729416B2 (ja) | テキストデータの復元方法 | |
Cannane et al. | A compression scheme for large databases | |
Zia et al. | Two-level dictionary-based text compression scheme | |
Vines et al. | Compression techniques for Chinese text | |
Ong et al. | A data compression scheme for Chinese text files using Huffman coding and a two-level dictionary | |
JPH08149016A (ja) | 文字列の符号化方法 | |
Wirth | Symbol-driven compression of Burrows Wheeler transformed text | |
Bookstein et al. | An overhead reduction technique for mega-state compression schemes | |
Choi | Comparison of Methods for Text Compression | |
Kotze et al. | An evaluation of the Lempel-Ziv-Welch data compression algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060516 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060815 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061002 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070322 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140330 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |