JP2581903B2

JP2581903B2 - バイト整列式データ圧縮方法及び装置

Info

Publication number: JP2581903B2
Application number: JP6256356A
Authority: JP
Inventors: アントシェンコフジェナディー
Original assignee: Digital Equipment Corp
Current assignee: Digital Equipment Corp
Priority date: 1993-10-25
Filing date: 1994-10-21
Publication date: 1997-02-19
Anticipated expiration: 2012-02-19
Also published as: JPH07160473A; DE69413347D1; US5363098A; EP0650264A1; EP0650264B1; DE69413347T2

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は一般にコンピュータシス
テムに係り、より詳細には、コンピュータシステムのメ
モリに記憶されるデータを圧縮する方法及び装置に係
る。

【０００２】

【従来の技術】コンピュータシステムにおいては、デー
タをよりコンパクトなフォーマットに圧縮することによ
り、データを記憶するのに必要な物理的なスペースの量
を減少できることが知られている。更に、付加的な利点
として、圧縮されたデータは、圧縮されないデータより
も一般に短い時間で処理できる。例えば、圧縮されたデ
ータがあるコンピュータシステムから別のコンピュータ
システムへ通信されるときには、より少ないビットが処
理される。大きなデータベースや、グラフィック像や、
全テキスト反転ファイルに対してはしばしばデータ圧縮
が使用される。

【０００３】整数ベクトルに対して時々使用される１つ
の形式の圧縮は、「ビットマップ」エンコードである。
このビットマップエンコードでは、ベクトルの各整数が
ビットマップにおいて単一のビットで表される。ビット
マップのビット位置における論理「１」は、整数の存在
を表し、そして論理「０」は、整数の不存在を表す。こ
れは、スペースを相当に減少するだけでなく、処理中の
時間も節約する。というのは、ビットマップの代表的な
ビットを直接アクセスしそして操作することができるか
らである。

【０００４】ビットマップは、密ベクトルの圧縮につい
ては、スペース及び時間利用効率が比較的高い。密ベク
トルとは、比較的多数の整数が集まったベクトルであ
る。しかしながら、ビットマップは、疎ベクトル又は密
度がスキューしたベクトルについては、スペース及び時
間のロスを被る。疎ベクトルを表すビットマップにおい
ては、論理０以外の何ももたないビットシーケンスにお
いてビットマップスペースの大部分が浪費される。

【０００５】いかなる形式の系統的なビット分布も欠乏
しているベクトルについては、「ビット方式(bit-wis
e)」圧縮が時々使用される。このビット方式圧縮は、非
常に大きなベクトルの場合はベクトルにおける連続する
整数間の差が通常は小さいことからスペースの減少を引
き出す。従って、連続する整数間の差における有効ビッ
トの数を、整数自体よりもコンパクトにエンコードする
ことができる。各々の差は、「プレフィックス」ビット
ストリング及びそれに続く「サフィックス」ビットスト
リングとしてエンコードされる。プレフィックスビット
ストリングは、サフィックスにおけるビットの数をエン
コードし、そしてサフィックスビットストリングは、差
の全ての有効ビットをエンコードする。次々の差をエン
コードするビット方式圧縮は、デルタ圧縮としても知ら
れている。

【０００６】ビット方式圧縮は、圧縮データのいかなる
形式の分布についても理論的限界の近くまで圧縮を行
う。しかしながら、ビット方式で圧縮されたデータは、
データの圧縮表示を、ＡＮＤ、ＯＲ及びＸＯＲ（排他的
オア）等の論理演算子によって一般的に直接操作するこ
とができないので、問題がある。それ故、ビット方式圧
縮は、一般に、論理演算を行うために時間のかかるエン
コード及びデコード動作を必要とし、これは、ビット方
式圧縮を、論理的に操作されるデータに対してあまり適
当でないものにする。

【０００７】更に、ビット方式圧縮は、ビットストリン
グを操作するのに用いられる論理回路及びデータ路に常
に適合するものでない種々のサイズのビットストリング
を使用する。例えば、デジタルコンピュータは、一般
に、固定サイズのバイトに編成されたビットに基づいて
動作するように設計される。従って、ビット方式の圧縮
は、操作容易なバイト境界に沿ってプレフィックス及び
サフィックスストリングを整列状態に保持するためにス
ペースを浪費しなければならないか、又はプレフィック
ス及びサフィックスの可変ビット長さを操作可能なバイ
トへ分解するために時間が浪費されるかのいずれかであ
る。

【０００８】

【発明が解決しようとする課題】以上のことを考慮する
と、データの内容に係わりなくデータを圧縮する圧縮技
術が要望されていることは明らかである。更に、圧縮さ
れたデータに基づく論理演算を、データを完全に圧縮解
除しなくても行えることも要望される。

【０００９】

【課題を解決するための手段】本発明は、データ記憶の
必要性を低減し且つ処理性能を向上するようにして高い
エンコード及びデコード効率を得るように任意のビット
マップで表されたソースデータを圧縮する方法及び装置
を提供する。本発明は、大きなデータベースを処理する
コンピュータシステムであって、データベースに基づく
多数のアクセス及び論理演算が頻繁に生じるようなコン
ピュータシステムに特に適用できる。

【００１０】広い意味において、本発明は、コンピュー
タシステムのハードウェア特徴と、ソースデータに存在
する空間的関係の利点を取り入れたデータ構造を提供す
る。更に、本発明は、コンピュータシステムの特徴及び
ソースデータの関係に対して最適化されたエンコード及
びデコード技術を使用する。

【００１１】本発明の１つの特徴において、圧縮データ
をエンコードし、デコードしそして操作するための量子
は、均一サイズのバイトである。即ち、ビットマップの
ビットは、コンピュータシステムのハードウェア特徴に
便利なそしてそれに適合する境界に整列されたバイトサ
イズ部分へと編成される。例えば、ビットマップの各バ
イトサイズ部分は、８個のビットを含む。

【００１２】ソース又は入力ビットマップをバイトの出
力圧縮原子（アトム）シーケンスへとエンコードするた
めに、次のような一般的な原理が遵守される。編成され
たバイト各々は、１つのバイトの全てのビットが同じ論
理値を記憶する場合には「ギャップバイト」（ＧＢＹＴ
Ｅ）として分類され、さもなくば、バイトは、非ギャッ
プ即ち「マップバイト」（ＭＢＹＴＥ）として分類され
る。更に、ギャップバイトは、全て０を記憶するか又は
全て１を記憶するかのいずれかとして分類できる。マッ
プバイトは、更に、１つを除く全てのビットがその手前
の隣接するギャップバイトと同じ値を記憶する場合は
「オフセット」バイトとして分類できる。即ち、オフセ
ットバイトは、その直前のギャップバイトのビットとは
厳密に１ビット異なる。

【００１３】同じクラスの隣接して分類されたバイトは
グループ編成にされ、そして各グループのビット数がカ
ウントされる。次いで、バイトの行き先即ち出力原子
（アトム）シーケンスにおいて、分類されグループ編成
にされた入力ビットマップのバイトは、次のようにエン
コードされる。ギャップバイトの各グループに対して、
原子シーケンスにおける各グループ内のビット数を表す
第１ビットシーケンスを記憶する。又、そのグループが
０を記憶するか１を記憶するかを指示するためのフラグ
も記憶する。

【００１４】マップバイトの各グループに対しては、出
力原子シーケンスにおいて、そのグループにおけるビッ
ト数を表す第２ビットシーケンスを記憶すると共に、マ
ップバイトのグループを記憶する。分類されたバイトが
オフセットバイトである場合には、オフセットバイト内
の１つの異なるビットの位置を指示する第３ビットシー
ケンスを原子シーケンスにおいて記憶する。

【００１５】第１、第２及び第３ビットシーケンスは、
次のように構成された原子へと編成される。エンコード
の各原子は、制御バイト（ＣＢＹＴＥ）と、おそらくこ
れに続く１つ以上の「ＧＢＹＴＥ」及びおそらく１つ以
上の「ＭＢＹＴＥ」とを備えている。制御バイトは、
「ＴＦＩＥＬＤ」、「ＦＦＩＥＬＤ」及び「ＤＦＩＥＬ
Ｄ」を含む。第１ビットシーケンスは、そのグループに
おけるギャップバイトの数が第１のスレッシュホール
ド、例えば、４より小さい場合に、制御バイトのＴＦＩ
ＥＬＤに記憶される。さもなくば、第１ビットシーケン
スは、ギャップバイトに記憶される。フラグはＦＦＩＥ
ＬＤに記憶され、そして第２又は第３のビットシーケン
スは、ギャップバイトの直後にマップバイトが続くかオ
フセットバイトが続くかに基づいてＤＦＩＥＬＤに記憶
される。マップバイトに関連した長さは、制御バイトの
ＤＦＩＥＬＤに記憶され、そしてマップバイトは制御バ
イトに続く。

【００１６】本発明の別の特徴においては、ビットマッ
プは、これをビットごとに走査しそして上記の一般的な
原理に基づいてバイトを分類することにより原子構造体
へとエンコードされる。制御バイト、ギャップバイト及
びマップバイトは、ビットを個々に検査するときにオン
ザフライで（進行中に）発生される。この方法は、各異
なるビットマップに対する原子構造体の独特のシーケン
スを保証し、ビットマップ識別の決定を容易にする。更
に、この方法は、最もコンパクトな原子シーケンスを発
生するように保証される。

【００１７】本発明の更に別の特徴においては、原子シ
ーケンスは、ビットマップを回復するようにデコードさ
れる。圧縮解除方法は、制御バイトを用いて原子シーケ
ンスを走査し、種々のエンコードされたビットシーケン
スをデコードして、ビットマップを発生する。

【００１８】本発明の更に別の特徴においては、多数の
圧縮されたビットマップがＡＮＤやＯＲのような論理演
算を用いることにより合体（マージ）される。この合体
方法は、合体されるべきビットマップを表す原子シーケ
ンスを部分的にデコードし、分解されたバイトに基づい
て必要な論理演算を実行して、合体されたビットマップ
を表す新たな原子シーケンスを発生する。この方法は、
圧縮されたビットマップの論理的操作を、デルタ圧縮で
可能な時間より短い時間で行えるようにする。本発明の
構造及び方法は、像、データベース、又は任意のビット
分布を有する全テキスト反転ファイルを表すビットマッ
プに対して特に適している。

【００１９】

【実施例】図１は、本発明を使用できるコンピュータシ
ステム１を示している。このコンピュータシステム１
は、中央処理ユニット（ＣＰＵ）２と、バス４を経て互
いに通信する記憶装置、例えば、メモリ３とを備えるこ
とができる。ＣＰＵ２は、いかなる形式の従来のデータ
プロセッサでもよく、例えば、メインフレーム、ワーク
ステーション、マイクロプロセッサ、パーソナルコンピ
ュータ等でよい。メモリ３は、データを記憶することの
できる何らかの形式のメモリであり、例えば、半導体揮
発性ランダムアクセスメモリ、レジスタ又は永久ディス
ク記憶装置である。データを記憶するためのスペース及
びデータを処理するための時間は、以下に述べるように
データをよりコンパクトなフォーマットにエンコードす
ることにより減少することができる。

【００２０】図２を参照し、おそらく０ないし４５５の
範囲の整数を有する上昇順ベクトルを一例として使用し
て本発明の圧縮を説明する。ベクトルの特定の表現は、
整数８、１１、１９、１７４、１８１、１８９、１９
１、４５０、４５１、４５３及び４５５を含む。１１個
の整数ベクトルが３２ビット整数として２進形態でメモ
リ３に記憶される場合には、ベクトルは、３５２（１１
ｘ３２）ビットを消費する。

【００２１】或いは、図２に示すように、整数ベクトル
は、ベクトルの個々の整数を表すために複数のビット２
１を有するビットマップ２０として記憶することができ
る。ビット位置の論理「０」は、整数の不存在を表し、
そして論理「１」は、整数の存在を表す。利点として、
ビットマップ２０のサイズは、０ないし４５５の範囲の
付加的な整数がベクトルに追加されても増加しない。ビ
ットマップ２０は、整数ベクトル以外のデータシーケン
スを表すことができ、例えば、ビットマップ２０は、像
の「オン」及び「オフ」状態のピクセルを表すこともで
きるし、データベースに対する指示を表すこともでき
る。

【００２２】ビットマップ２０のビット２１は、右から
左へと示されている。最も右のビットは整数「０」を表
し、次に左のビットは整数「１」を表し、等々となる。
最も左のビットは整数「４５５」を表す。ビットマップ
２０の１６進（ｈｅｘ）等価表示は、２Ｃ−０−Ａ０２
０４−０−８０９００と書き表される。

【００２３】表示「−０−」は、ビットマップ２０にお
ける「ギャップ」を示すのに使用される。ギャップは、
全て同じ論理値、例えば、全て０を記憶する一連のビッ
ト２１として定められる。或いは、全て１のギャップは
「−１−」として表すことができる。

【００２４】図２に示したようなビットマップをメモリ
３において物理的なスペースをあまりとらないものに圧
縮するための方法及び構造について説明する。更に、こ
の縮小サイズのデータ構造体は、ＣＰＵ２により、非圧
縮データに対して考えられる時間より短い時間で論理的
に処理することができる。

【００２５】本発明は、その一部分において、コンピュ
ータシステム１の基礎的なハードウェア構造、例えば、
ＣＰＵ２の論理回路、メモリ３の記憶セル、及びバス４
のデータ経路の巾を考慮して、ビットマップ２０を最適
にエンコードすることによりスペース及び時間効率を得
るものである。それ故、ビットマップ２０をエンコード
し、デコードしそして処理するための量子は、均一サイ
ズのバイト２２である。これらのバイト２２は、コンピ
ュータシステム１のハードウェア特徴に対して便利で且
つそれに適合する境界において整列される。例えば、各
バイト２２は、８個のビット２１を含む。本発明は、他
のバイトサイズを有するコンピュータシステムにも容易
に適用できることを理解されたい。

【００２６】ビットマップ２０は、ビットマップ２０の
ビット２１を、次の一般的な原理に基づいてバイト整列
された原子（アトム）シーケンスへとエンコードするこ
とにより圧縮される。

【００２７】ビットマップの各バイトは、ギャップバイ
ト又は非ギャップバイトとして分類される。ギャップバ
イトは全て同じビットを有し、非ギャップバイトは全て
同じビットをもたない。以下、非ギャップバイトを「マ
ップバイト」とも称する。

【００２８】同じクラスの隣接バイトはグループ分けさ
れ、各分類されたグループに含まれるビットの数が決定
される。

【００２９】グループ分けされたギャップバイトに対し
て、ビットのセンス、即ち０であるか１であるかが決定
される。異なるセンスのビットを有するギャップバイト
は、個別にグループ編成される。グループ分けされたマ
ップバイトに対し、そのグループの第１バイトがその手
前のギャップのセンスと１ビットしか異ならないかどう
かが判断される。このようなバイトは「オフセットバイ
ト」と分類される。

【００３０】ギャップバイトのグループに対し、グルー
プの長さ及びグループのセンス（０か１か）が原子シー
ケンスに記憶される。マップのグループに対し、グルー
プの長さ及びグループ自体が原子シーケンスに記憶され
る。オフセットバイトは、手前のギャップバイトの長さ
をエンコードする制御バイトへとエンコードされる。一
貫性を得るために、ビットマップ２０の前に、例えば、
ゼロ長さゼロ充填のギャップがあると仮定する。

【００３１】図３は、これらの原理に基づいて構成され
たバイト整列原子３０の一般的構造を示している。原子
３０の多数の異なる構成が考えられる。原子３０の異な
る構成は、ビットマップ２０のビット２１に記憶された
論理０及び１の予想できない種々の分布をコンパクトに
圧縮するように最適に取り扱われる。

【００３２】各エンコードされた原子３０は、少なくと
も１つの制御バイト（ＣＢＹＴＥ）４０を含む。以下で
詳細に述べるように、各制御バイト４０の後に、１つ以
上のエンコードされたギャップバイト（ＧＢＹＴＥ）５
０及び／又は１つ以上のエンコードされたビットマップ
バイト（ＭＢＹＴＥ）６０が続く。

【００３３】特定の原子３０の特定形式の構成が制御バ
イト４０にエンコードされる。それ故、各制御バイト４
０は、タイプフィールド（ＴＦＩＥＬＤ）４１及びデー
タフィールド（ＤＦＩＥＬＤ）４５を含む。ここに示す
実施例では、タイプフィールド４１は、３ビットを含
み、ＤＦＩＥＬＤ４５は、４ビットを含む。本発明は、
制御バイト４０が異なるビット数のフィールドへと編成
された場合にも機能し得ることが明らかであろう。

【００３４】又、制御バイト４０は、ギャップのエンコ
ードされたビットが全て０と感知されるか全て１と感知
されるかを指示するための任意の充填フィールド（ＦＦ
ＩＥＬＤ）４４を含むことができる。ＦＦＩＥＬＤ４４
が論理「０」のときは、エンコードされたギャップのバ
イトが全て０であり、そしてＦＦＩＥＬＤ４４が論理
「１」のときには、エンコードされたギャップバイトに
全て１が充填される。０又は１の一種類のギャップのみ
をエンコードするように本発明が使用されたときには、
ＦＦＩＥＬＤ４４は必要とされず、ＤＦＩＥＬＤ４５
を、例えば、５つのビットを含むように拡張することが
できる。

【００３５】タイプフィールド４１は、原子３０の種々
の構造を指示するように０ないし７の範囲の値をもつこ
とができる。ＤＦＩＥＬＤ４５は、０ないし１５の範囲
の値をもつことができる。任意のＦＦＩＥＬＤ４４は、
０又は１のいずれかの値をもつことができる。

【００３６】ギャップバイト５０は、原子３０に現れる
ときには、連続的にエンコードされるギャップバイトの
数を記憶するのに用いられる１ないし８バイトのシーケ
ンスである。ギャップバイトは、既に述べたように、全
て同じ論理値を記憶するビットを有するバイトのグルー
プである。原子３０の対応する制御バイト４０のＦＦＩ
ＥＬＤ４４は、エンコードされたギャップバイト５０が
０を記憶するバイトを有するか１を記憶するバイトを有
するかを指示するのに用いられる。

【００３７】ギャップバイトシーケンスにおけるバイト
の数は、ギャップバイト５０のＧＦＩＥＬＤ５１に記憶
され、例えば、第１ギャップバイト５０の下位３ビット
に記憶される。第１ＧＢＹＴＥ５０の残りのビットは、
２進「０」で拡張され、その後のギャップバイト５０
は、ビットで測定したギャップサイズを表し、常に、８
の倍数として表現される。換言すれば、ギャップバイト
５０は、バイト整列されたビットギャップのみをエンコ
ードする。ギャップサイズの有効ビットをもつバイトの
みがギャップバイト５０によって表され、全て０の先導
バイトのギャップサイズは破棄される。

【００３８】マップバイト６０は、原子３０に存在する
ときには、全て同じビットをもたないビットマップ２０
の１ないし１５バイトのシーケンスである。マップバイ
トシーケンスにおけるバイトの数は、制御バイト４０の
ＤＦＩＥＬＤ４５に記憶される。換言すれば、マップバ
イトは、ビットマップ２０のバイト整列されたビットで
ある。

【００３９】ビットマップ２０を圧縮するのに使用され
る原子３０の種々の構造について詳細に説明する。原子
３０の説明に続いて、この構造体をエンコードし、デコ
ードしそして論理的に操作するのに使用される方法につ
いて説明する。この説明において、制御バイト４０の８
つのビットは、例えば、〔ＴＦＩＥＬＤ｜ＦＦＩＥＬＤ
｜ＤＦＩＥＬＤ〕のように書かれる。垂直のバー「｜」
は、フィールドセパレータとして使用され、スラッシュ
「／」は、「又は」を指示し、そしてダッシュ「−」
は、包含範囲を示す。

【００４０】以下のテーブル１は、原子３０がとり得る
種々の形態の概要である。テーブル１ − 原子の一般的形態ケース TFIELD FFIELD DFIELD GBYTE MBYTE １ 0-3 0 又は1 1-15 ノーイエス２ 4 0 又は1 1-15 イエスイエス３ 5 0-3 0-7 ノーノー４ 6 0 又は1 0-7 イエスノー５ 7 0-3 0-7 ノーノー

【００４１】原子３０の第１ケースは、次の一般式を有
する。ＣＢＹＴＥ＝〔０−３｜０／１｜１−１５〕タイプフィールド４１が０ないし３の範囲の値を記憶す
るときに、タイプフィールド４１は、エンコードされる
ギャップのサイズを直接指示する。換言すれば、０ない
し３の範囲のタイプフィールド４１を有する原子３０の
場合には、制御バイト４０の後に、いかなるギャップバ
イト５０も続かない。むしろ、ギャップのサイズは、制
御バイト４０のタイプフィールド４１に直接エンコード
される。このケースは、頻繁に生じる小さなサイズのギ
ャップをコンパクトに圧縮するのに有用である。ギャッ
プが全て０を含むか１を含むかは、ＦＦＩＥＬＤ４４に
よって指示される。ギャップに続くビットマップ２０の
バイトの数は、上記したように、ＤＦＩＥＬＤ４５に記
憶される。

【００４２】原子３０の第２ケースは、次の一般式を有
する。ＣＢＹＴＥ＝〔４｜０／１｜１−１５〕このケースにおいて、制御バイト４０の直後には１つ以
上のギャップバイト５０が続き、このギャップバイト５
０は、上記したようにエンコードされる。ギャップバイ
ト５０の後には、複数のマップバイト６０が続き、この
マップバイト６０の数は、制御バイト４０のＤＦＩＥＬ
Ｄ４５に指示される。

【００４３】図４に示すように、タイプフィールド４１
が５ないし７の範囲に入る次の３つのケースについて
は、制御バイト４０は、３ビットのタイプフィールド４
１、２ビットのＦＦＩＥＬＤ４４及び３ビットのＤＦＩ
ＥＬＤ４５に仕切られる。これらケースにおいては、Ｄ
ＦＩＥＬＤ４５は、１つを除く全てのビットが同じであ
るビットマップ２０のバイトをエンコードするのに使用
される。例えば、ビットマップ２０のエンコードされた
バイト２２は、１つが１で残りが全て０であるか又は１
つが０ビットで残りのビットが１にセットされるかのい
ずれかである。

【００４４】バイト２２において残りのビットと異なる
１つのビットの位置は、ＤＦＩＥＬＤ４５のオフセット
として指示される。このオフセットは、０ないし７の範
囲の数であり、各数は、バイト２２における異なるビッ
トに対する８個の考えられる位置の１つを表す。以下、
このクラスのバイトを「オフセット」バイトと称するこ
とにする。

【００４５】オフセットバイトは、ギャップの直後に、
そのギャップのビットのセンスとは１ビットだけ異なる
バイトが続くような形式の頻繁に観察されるビット分布
をコンパクトに圧縮するのに有用である。

【００４６】原子３０の第３ケースは、次の一般式を有
する。ＣＢＹＴＥ＝〔５｜０−３｜０−７〕このケースにおいて、制御バイト４０は、ギャップ及び
それに続くオフセットバイトをエンコードする。ギャッ
プのサイズは、ＦＦＩＥＬＤ４４に指示される。ＴＦＩ
ＥＬＤが値５を有する場合には、ギャップ及びオフセッ
トバイトのビットは、１つの「１」ビットを除いて全て
０であり、そのオフセット位置はＤＦＩＥＬＤ４５に指
示される。

【００４７】原子３０の第４ケースは、次の一般式を有
する。ＣＢＹＴＥ＝〔６｜０／１｜０−７〕このケースにおいて、制御バイト４０の直後に１つ以上
のギャップバイト５０が続き、このギャップバイト５０
は、上記したようにエンコードされる。対応するビット
マップにおいては、このようにエンコードされたギャッ
プの直後に、オフセットバイトが続く。ＦＦＩＥＬＤ４
４が０である場合には、ギャップ及びオフセットバイト
が、オフセットビットを除いて「０」である。或いは
又、ＦＦＩＥＬＤ４４が１である場合には、ギャップ及
びオフセットバイトに「１」が満たされそしてオフセッ
トビットは０である。

【００４８】原子３０の第５ケースは、次の一般式を有
する。ＣＢＹＴＥ＝〔７｜０−３｜０−７〕このケースは、ビットのセンスが反転された以外は、上
記の第３ケース（ＴＦＩＥＬＤ＝５）と同様である。即
ち、ギャップ及びオフセットバイトは、１つの異なるビ
ットを除くと、全て１である。以上に、ビットマップ２
０を圧縮するのに使用される種々の形式の原子３０のデ
ータ構造体の一般的な形式を説明した。

【００４９】これらの一般的な形態に加えて、原子３０
のある特殊な構造について更に定義し、これをテーブル
２に要約する。テーブル２ − 原子の特殊な形態ケース TFIELD FFIELD DFIELD GBYTE MBYTE １ 0 0 0 ノーイエス２ 1-3 0 又は1 0 ノーノー３ 4 0-3 0 イエスノー

【００５０】第１に、全てのビットが論理０にセットさ
れた制御バイト４０の特殊なケースにおいては、原子が
次の形態である。ＣＢＹＴＥ＝〔０｜０｜０〕この原子は、ビットマップ２０を圧縮するのに使用され
る原子３０のシーケンスの終止符として使用される。こ
の終止符は、圧縮された原子シーケンスを操作する手順
に対する信号として使用できる。

【００５１】第２に、タイプフィールド４１が１ないし
３の範囲でありそしてＤＦＩＥＬＤ＝０であるような特
殊なケースにおいては、例えば、マップビット５０が指
示されない。この特殊なケースの一般式は、次のような
原子を有する。ＣＢＹＴＥ＝〔１−３｜０／１｜０〕この形式の制御バイト４０は、圧縮されたギャップのビ
ットとセンスは異なるが全て同じビットを有するバイト
が直後に続くようなギャップを圧縮するのに使用され
る。例えば、１６進表示では、「ＦＦＦＦ００」のビッ
トマップシーケンスは、制御バイト＝〔２｜１｜０〕よ
り成る単一バイト原子によってエンコードされる。ＴＦ
ＩＥＬＤ＝２であり、そしてＦＦＩＥＬＤ＝１であって
２つの「１」充填バイトを指示し、その後に「０」充填
バイトが続く。これとは逆に、ビットマップシーケンス
「００００００ＦＦ」は、制御バイト＝〔３｜０｜０〕
としてエンコードすることができる。

【００５２】第３に、タイプフィールド４１が４であり
そしてＤＦＩＥＬＤ４５が０であるような特殊なケース
においては、原子は、次のような一般式を有する。ＣＢＹＴＥ＝〔４｜０／１｜０〕この形式の制御バイト４０は、第２のケースと同様であ
るが、圧縮されたギャップのサイズはギャップバイト５
０によりエンコードされる。例えば、１６進表示では、
「ＦＦＦＦＦＦＦＦ００」のビットマップシーケンス
は、制御バイト〔４｜１｜０〕と、これに続いて１６進
値「２０」を記憶する単一ギャップバイトとで構成され
た２つのバイトに圧縮される。

【００５３】ここで、これらの圧縮構造を図２の元のビ
ットマップ２０に適用すると、次のような原子バイトシ
ーケンスが生じる。原子１：ＣＢＹＴＥ＝〔４｜０｜２〕（０充填の１バイトギャップ、ＭＢＹＴＥ＝ｈｅｘ０８０９（２つのマップバイトが続く。原子２：ＣＢＹＴＥ＝〔６｜０｜６〕（ビット６オフセットバイト及びＧＢＹＴＥ＝ｈｅｘ９０（９０ｈｅｘ、０充填ビット。原子３：ＣＢＹＴＥ＝〔５｜０｜５〕（ビット６オフセットバイトギャップなし。原子４：ＣＢＹＴＥ＝〔０｜０｜１〕（ギャップサイズ＝０、その後にＭＢＹＴＥ＝ｈｅｘＡ０（１つのマップバイト。原子５：ＣＢＹＴＥ＝〔４｜０｜１〕（ギャップバイト及びｍバイトＧＢＹＴＥ＝ｈｅｘ１０１（１００ｈｅｘ、０充填ビットＭＢＹＴＥ＝ｈｅｘＡＣ（１つのマップバイトが続く。

【００５４】従って、本発明の構造を使用することによ
り、整数ベクトルは、全部で１２の８ビットバイトに対
する５つの原子、即ち元のサイズの一部分に圧縮され
る。

【００５５】ビットマップエンコード動作入力ビットマップを、上記構造を用いて出力原子シーケ
ンスに圧縮するための例示的な方法を詳細に述べる前
に、次の説明をする。入力ビットマップは、そのシーケ
ンスにおけるビットを第１ビットから最終ビットへ即ち
図２を参照すれば右から左へ個々に検査することにより
圧縮される。この処理中に、ビットは、ビットが存在す
る整列されたバイトの文脈において検査される。

【００５６】現在バイトの現在ビットは、現在原子にエ
ンコードされるべき次のビットである。手前のビット
は、手前の制御バイトを有する手前に原子に既にエンコ
ードされている。エンコードプロセス中には、次のよう
な一般的原理が適用される。

【００５７】手前のビットと現在ビットとの間のギャッ
プが、全て同じビットを有する１つ以上のバイトを含む
が、手前のビット及び現在ビットとはセンスが異なる場
合には、このような全ての介在バイトがギャップとして
エンコードされる。ギャップが４つ以上のバイトを含む
場合には、そのギャップはギャップバイトとしてエンコ
ードされ、さもなくば、ギャップは制御バイトにおいて
エンコードされる。原子構造体は完全に対称的であるか
ら、このルールは、０及び１充填ギャップの両方に等し
く適用される。

【００５８】現在ビットがオフセットバイトのビットで
あり、そして手前のビットがギャップ、オフセットバイ
ト、又は考えられる最上位の（１５番目の）マップバイ
トとしてエンコードされた場合には、現在バイトをオフ
セットバイトとしてエンコードする。さもなくば、現在
バイトを既にエンコードされたマップバイトシーケンス
に加え、そして既にエンコードされた制御バイトのＤＦ
ＩＥＬＤにおけるマップバイトカウントを増加する。

【００５９】現在ビットがギャップバイトのビットでも
ないしオフセットバイトのビットでもない場合には、現
在ビットを既にエンコードされたマップバイトシーケン
スに添付するか、又はここに示す実施例では１５である
マップバイト限界に達したときに、マップバイトシーケ
ンスを有する新たな原子を形成する。

【００６０】これらのルールは、最小数のバイトを有す
る圧縮された原子シーケンスを保証する。これらのルー
ルに基づいて形成されたエンコードされた構造体は、一
般に次のように説明することができる。

【００６１】全てのビットが同じである全てのバイト
は、ギャップとしてエンコードされ、そしてマップバイ
トシーケンスの部分にはなり得ない。

【００６２】各ギャップの直後に、オフセットバイト又
はマップバイトシーケンスが続くか或いは制御バイト＝
〔１−４｜０／１｜１〕の特殊な場合のように逆のセン
スのギャップバイトが続く。

【００６３】全マップバイトシーケンスの後には、常
に、ギャップ、オフセットバイト又は別のマップバイト
シーケンスのいずれかが続く。

【００６４】原子構造体をエンコードするのに用いる方
法の詳細な説明においては、次の変数及び用語を定義す
る。

【００６５】圧縮されるべき入力ビットマップのビット
は、次のように表すことができる。ｂ（０）、・・・ｂ（Ｉ）、・・・ｂ（Ｋ）、・・・ｂ
（Ｎ）但し、ｂ（０）は、ビットマップの第１ビットであり、
ｂ（Ｉ）は、現在ビットであり、ｂ（Ｋ）は、最初は、
次のバイトの第１ビットであり、そしてｂ（Ｎ）は、ビ
ットマップの最終ビットである。

【００６６】出力原子シーケンスのバイトは、次のよう
に表すことができる。Ｂ（０）、・・・Ｂ（ＰＰ）、・・・Ｂ（Ｐ）、・・・
Ｂ（Ｔ）但し、Ｂ（０）は、第１原子の制御バイトであり、Ｂ
（ＰＰ）は、手前の原子の制御バイトであり、Ｂ（Ｐ）
は、現在原子の制御バイトであり、そしてＢ（Ｔ）は、
原子シーケンスの終止符である。

【００６７】さて、図５を参照し、上記の一般的なルー
ルに基づいてビットマップをエンコードするための例示
的な方法５００を説明する。ビットマップの処理は、ビ
ットマップの走査を初期化しそして第１の原子を「手
前」の原子としてエンコードするための第１段階を含
む。この第１段階の後に、全てのビットが圧縮されるま
でビットマップの残りのビットを圧縮するためのループ
が続く。

【００６８】ステップ５０５において、変数Ｉ、Ｋ、
Ｎ、ＰＰ及びＰを初期化する。次いで、ステップ５１０
において、入力ビットマップが空であるかどうかを決定
する。もしこれが真であれば、ステップ５１５におい
て、終止符原子Ｂ（Ｔ）、例えばＢ（ＰＰ）＝０を発生
する。さもなくば、それが偽であれば、ステップ５２０
において、ｂ（０）から始めて、手前のビットとはセン
スが異なる第１のｂ（Ｉ）を位置決めする。

【００６９】ステップ５２５において、Ｂ（ＰＰ）をオ
フセットバイトとして発生する。又、第１原子の制御バ
イトＢ（ＰＰ）にもしあれば第１ギャップのサイズをエ
ンコードするか、又はギャップのサイズが２４ビット即
ち３バイトより大きければ、ギャップバイトとしてエン
コードする。

【００７０】ステップ５３０において、ｂ（Ｋ）を次の
整列バイトの第１ビットにセットしそしてＢ（Ｐ）をセ
ットする。

【００７１】次いで、ステップ５３５へ続き、ビットマ
ップの全てのビットが検査されたかどうか判断する。も
しそれが真であれば、ステップ５１５に続く。さもなく
ば、それが偽であれば、ステップ５４０において、Ｉを
増加することにより次のバイトを検査する準備をする。

【００７２】ステップ５４５において、Ｉ＜Ｋであるか
どうかを決定する。即ち、現在ビットｂ（Ｉ）が既にエ
ンコードされたビットと同じバイト内に配置されている
かどうかを決定する。もしそれが真であれば、ステップ
５５０に続いて、現在ビットを、制御バイトＢ（ＰＰ）
をもつ現在原子に組み込む。さもなくば、それが偽であ
れば、ステップ５７０へ続く。

【００７３】ステップ５５０では、現在原子がオフセッ
トバイトをエンコードするかどうか決定する。もしそれ
が偽であれば、ステップ５６０へ続く。さもなくば、も
し真であれば、ステップ５５５において、現在原子を、
ビットをマップバイトとしてエンコードする形態へと変
換し、ステップ５６０へ続く。

【００７４】ステップ５６０では、現在ビットを現在原
子のマップバイトに加え、ステップ５３５へ続く。

【００７５】ステップ５７０では、現在ビットｂ（Ｉ）
が、まだエンコードされていない整列ビットマップバイ
トに配置されているかどうか（Ｉ≧Ｋ）決定される。即
ち、ギャップ（Ｉ≧Ｋ＋８）があるか、又は現在制御バ
イトがオフセットバイトであるかどうか、或いはマップ
バイトカウントがバイト限界１５に達したかどうかの判
断がなされる。

【００７６】これらのいずれかが真であれば、ステップ
５７５において、現在ビットをオフセットバイトとして
Ｂ（Ｐ）へとエンコードすることにより新たな原子を発
生する。又、制御バイトＢ（ＰＰ）にもしあれば第１バ
イトのサイズをエンコードするか、又はこのギャップの
サイズが２４ビット即ち３バイトより大きい場合にはギ
ャップバイトとしてエンコードする。次いで、ステップ
５９０へ続く。

【００７７】さもなくば、ステップ５８０において、付
加的なマップバイトを現在原子に添付し、そこに現在ビ
ットを挿入し、ステップ５９０へ続く。

【００７８】ステップ５９０において、Ｋを次のバイト
の第１ビットに対して調整し、そしてＰＰ及びＰを必要
に応じて調整して、全てのビットが検査されるまでステ
ップ５３５へ続く。変数Ｋは、変数Ｉの下位３ビットを
クリアして８を加えることにより次のバイトの第１ビッ
トをインデックスするように調整できる。

【００７９】ビットマップをここに定める構造へと圧縮
するための多数の他の方法も考えられるが、一度に１ビ
ットを処理する好ましい方法は、各異なるビットマップ
に対して原子構造体の独特のシーケンスを与える。それ
故、原子シーケンスは、ビットマップの特定の表現に対
して独特であるから、圧縮されたビットマップ全部を容
易に比較して、単一バイトストリング命令により、例え
ば、ビットマップ識別を決定することができる。

【００８０】更に、ビットマップを本発明により定めら
れた構造へとエンコードするための方法のこの実施例
は、メモリ３の記憶スペースの消費を最も節約できるよ
う保証される。

【００８１】又、ビットは一度に１つづつエンコードさ
れるので、エンコード手順は、例えば、ビットマップ全
体にわたるビットの０及び１の値の総分布に一般的に不
感なソフトウェアプログラムや、限定された数の時間の
かかる判断実行段階しか必要としないソフトウェアプロ
グラムによって効率的に実施することができる。

【００８２】又、この手順は、ハードウェアとして実施
することもできる。例えば、ハードウェアの実施は、シ
リアルな入力ビット流を、圧縮された出力バイト流に変
換して、通信ネットワークを経て送信するのに特に適し
ている。又、好ましい方法のビットごとの処理は、低コ
ストの固定布線ロジック回路、ラッチ及びゲートに良く
適している。

【００８３】ビットマップのビットが処理されるとき
に、エンコード方法は、制御バイト、ギャップバイト、
マップバイトを与え、そしてオフセットバイトを変換す
る。オフセットバイトの変換を含むこれら全ての動作
は、発生されるコードの直交特性により、高速で且つ取
るに足らないものである。

【００８４】例えば、大きなギャップの構造は、原子構
造体の残り部分によって影響されることなくギャップバ
イト内で独立してエンコードされる。ギャップバイトシ
ーケンスの長さ（単位はバイト）は、バイト当たりのビ
ット数と同じベース（８）でエンコードされることに特
に注意されたい。オフセットバイト（１６０未満の制御
バイト）をエンコードする原子と、そうでない原子とが
容易に区別されることに注意されたい。同様に、オフセ
ットバイト及びギャップバイトの二重のセンス（１又は
０）は全く対称的であり、それ故、単にＦＦＩＥＬＤ４
４をオフにキーイングしそしてギャップ及びオフセット
バイトのビットを相補的に処理するだけで、同じコード
によって処理できる。テーブル１及び２に要約した構造
体の優雅さ及び簡単さは、例えば、縮小命令セットアー
キテクチャを用いた近代的な高性能プロセッサによる処
理に特に良く適している。

【００８５】本発明による圧縮速度を、上記のデルタ圧
縮と比較した。圧縮速度は、圧縮されたバイトの数を、
各整数を４バイトで表すようにして元の整数ベクトルを
表すのに用いたバイトの数で除算したものとして測定し
た。整数ベクトルは、例えば、１、２、３、１１、２
１、５１、２０１、１０００１及び１００００１のよう
に、種々のサイズ範囲にわたってランダムに選んだ連続
する整数間に差を有するものであった。

【００８６】デルタ圧縮は、疎ベクトルに対して若干優
れており、本発明による圧縮は、密ベクトルに対して優
れていた。百万のランダムに発生した整数を有する上昇
整数ベクトルの場合に、本発明は、デルタ圧縮よりも約
２倍の速度でエンコードしそして約４倍の速度でデコー
ドした。

【００８７】ビットマップデコード動作入力原子シーケンスを出力ビットマップに圧縮解除する
実施例を説明する。この方法は、一般に、終止符Ｂ
（Ｔ）に遭遇するまで第１原子Ｂ（０）から原子シーケ
ンスを走査する。ここに述べる方法は、テーブル１及び
２に要約したデータ構造に適合するように、考えられる
最短の原子シーケンス及び必ずしも最短でない他の原子
シーケンスを形成するための上記のエンコードルールに
従うことにより、発生された原子シーケンスをデコード
する。

【００８８】デコード中に、この方法は、各原子を順次
に検査し、制御バイト４１をパーズ（解析）し、ギャッ
プ、マップバイト及びオフセットバイトを解読する。

【００８９】この方法の実施例を示す図６を特に参照す
れば、ステップ６１０において、変数Ｉ及びＰＰが初期
化される。変数Ｉは、ビットマップに対して発生された
現在ビットを指示し、そしてＰＰは、現在原子Ｂ（Ｐ
Ｐ）のバイトを指示する。

【００９０】ステップ６２０において、現在原子Ｂ（Ｐ
Ｐ）の制御バイトを検査し、それが終止符原子Ｂ（Ｔ）
であるかどうかを決定する。この場合に、原子シーケン
スのデコードが完了すると、ステップ６２５から退出と
なる。

【００９１】さもなくば、ステップ６３０において、現
在原子がオフセットバイトをエンコードするかどうか決
定する。もしそれが真であれば、ステップ６４０におい
て、手前のギャップのサイズを、もしこれがあれば、制
御バイト又はギャップバイトから計算する。ＦＦＩＥＬ
Ｄ４４の指示されたセンスに基づいてギャップの必要な
ビットを発生し、そしてデコードされたオフセットバイ
トを発生する。ステップ６６０へと続く。

【００９２】さもなくば、もし偽であれば、現在原子Ｂ
（ＰＰ）はマップビットをエンコードし、そしてステッ
プ６５０において、ギャップのビットをもしあれば発生
し、マップバイトのビットを回復する。ステップ６６０
へ続く。

【００９３】ステップ６６０において、変数Ｉ、ＰＰを
調整し、全ての原子がデコードされるまでステップ６１
０へ続く。

【００９４】バイト整列された原子構造の優雅さは、例
えば、デルタエンコードされたビットマップと比較し
て、圧縮されたビットマップのデコードを相当に高速な
ものとすることが明らかであろう。

【００９５】ビットマップの合体更に、エンコードされたビットマップを論理的に合体
（マージ）する方法について説明する。エンコードされ
たビットマップは、例えば、ＡＮＤ、ＯＲ、ＮＡＮＤ、
ＮＯＲ、ＸＯＲ等の論理演算子を、合体されるべきビッ
トマップの対応するエンコードされたバイトに適用する
ことにより合体される。この説明から明らかなように、
これらの演算子は、ビットマップの論理的な交差、結合
及び相違を与えることができる。

【００９６】本発明のここに示す方法により２つの原子
シーケンスを合体することは、次の一般的な定義及びル
ールに基づいて行われる。これらのルールは、ＡＮＤ及
びＯＲ演算子と、「０」充填ギャップとを参照して説明
するが、他の論理演算子及び「１」充填ギャップに使用
するようにこれらルール及び手順を拡張することは、自
明であろう。

【００９７】合体されるべき２つの入力ビットマップ
を、各々左及び右のビットを有する左ビットマップ及び
右ビットマップと定義する。２つのビットマップをエン
コードする圧縮構造体を各々左及び右の原子を有する左
及び右の原子シーケンスと定義する。左及び右の原子シ
ーケンスを合体した後の結果を出力原子シーケンスと定
義する。

【００９８】左及び右の原子シーケンスからの原子を各
々左及び右のバイトへと部分的にデコードする。左及び
右のバイトをギャップバイト又は非ギャップバイトと分
類する。バイトの特定対が同じクラスのものか異なるク
ラスのものかを判断し、ルールＩ又はルールＩＩのいず
れかを適用して、出力原子シーケンスに組み込むべき出
力バイトを発生する。

【００９９】ルールＩ − バイトが異なるクラスの場
合左又は右のいずれかのビットマップのギャップバイトが
他のビットマップの非ギャップバイトに対応する場合
に、ＡＮＤ演算子については、非ギャップバイトをスキ
ップし、そしてギャップバイトを出力バイトへと複製
し、出力原子シーケンスへと組み込む。ＯＲ演算子の場
合には、ギャップバイトをスキップし、非ギャップバイ
トを出力バイトへと複製する。

【０１００】同様に、圧縮された原子は対称的であるか
ら、スキップ及び複製段階を相補的な仕方で適用するこ
とにより、１充填ギャップが処理される。即ち、１充填
ギャップについては、ＡＮＤ演算子の場合に非ギャップ
バイトを複製しそしてギャップバイトをスキップし、Ｏ
Ｒ演算子の場合には、ギャップバイトを複製しそして非
ギャップバイトを複製する。

【０１０１】ルールＩＩ − バイトが同じクラスの場
合左及び右のバイトがギャップバイトであるか又は両方の
バイトが非ギャップバイトである場合には、例えば、Ａ
ＮＤのような論理演算を行って、合体出力バイトを発生
し、出力原子シーケンスに組み込む。

【０１０２】図７を参照し、例示的な方法７００の段階
を説明する。ステップ７１０では、次の左バイト及びそ
れに対応する次の右バイトが合体のために左及び右の原
子シーケンスから抽出される。左右のバイトは、各左右
の原子シーケンスを終わりから始めて一般的に非同期で
部分的にデコードすることにより形成される。

【０１０３】左及び右のシーケンスの原子は、２つの圧
縮されたビットマップがビットごとに同じでない限りそ
して更に２つのビットマップが両方とも同じ方法によっ
てエンコードされない限り、必ずしもビットマップのバ
イトを並列にエンコードしないことにことが明らかであ
る。同期したデコードを行う最適な方法を以下に説明す
る。

【０１０４】ステップ７１０は、右及び左のバイトを形
成するために、例えば、図６について上記したデコード
方法の後に、デコードされるべき左及び右の原子シーケ
ンスに対する１組の変数を個別に維持するようにモデリ
ングすることができる。

【０１０５】ステップ７３０において、ルールＩを適用
する必要があるかルールＩＩを適用する必要があるかを
決定する。次いで、ステップ７４０及び７５０において
適当なルールを適用する。次いで、終了までステップ７
１０を続ける。

【０１０６】左及び右の原子シーケンスがオーバーラッ
プしない場合には、「欠落」ビットに対応するバイト
を、論理演算子に対して指示されるように、スキップ、
複製、及び合体することができる。

【０１０７】ルールＩ及びルールＩＩをサポートする際
に、以下のテーブル３に要約するように、ビットマップ
の合体速度を向上するために２つのスキップフラグ及び
３つのバイトマスクが示唆される。これらフラグ及びマ
スクを使用することにより、ルールＩ及びルールＩＩの
中心部は、例えば、時間のかかる判断型の命令を必要と
せずに単一の効率的なインライン式の一般的な命令シー
ケンスによって実施することができる。

【０１０８】テーブル３において、記号「＆、｜、／、
及び＼」は、左（Ａ）及び右（Ｂ）のビットマップＡに
おける次の論理演算を指示するのに用いられる。＆：交差、即ち、ＡＡＮＤＢ、｜：結合、即ち、ＡＯＲＢ、／：差、即ち、ＡＡＮＤ（ＮＯＴＢ）＼：差、即ち、（ＮＯＴＡ）ＡＮＤＢテーブル３ − スキップフラグ及び合体演算子演算子スキップ１スキップ２ｏｐ１ｏｐ２ｏｐ３＆１１００００００｜００ＦＦＦＦＦＦ／１０ＦＦ００００＼０１００ＦＦ００

【０１０９】スキップフラグは、左右のバイトを特定の
論理演算子に対してスキップすべきか複製すべきか指示
する。バイトマスクは、次の計算式を使用することによ
り、リストされた論理演算子のいすれかに対し、左バイ
ト（ｌｂｙｔｅ）及び右バイト（ｒｂｙｔｅ）から出力
バイト（ｏｂｙｔｅ）を形成するのに使用される。ｏｂｙｔｅ＝（（ｌｂｙｔｅＸＯＲｏｐ１）ＡＮＤ
（ｒｂｙｔｅＸＯＲｏｐ２）ＸＯＲｏｐ３）

【０１１０】

【発明の効果】本発明の効果として、デジタル像又はデ
ータベース表示を表わしているビットマップは、ビット
マップをバイト的に処理することにより効率的に圧縮及
び合体される。更に、左右の原子が同じである合体され
たビットマップの部分については、非常に多数のビット
をデコードせずに直接処理することができる。例えば、
ここに示すように圧縮されたビットマップを合体するこ
とは、従来のビット方式の又はデルタ圧縮されたデータ
での合体よりも、典型的に、約１０ないし３０倍も高速
である。別の望ましい効果として、圧縮された形態での
任意のビットの順序付けは、原子バイト整列のシーケン
スにも保持され、本発明の圧縮技術を、順序に敏感なビ
ットマップに対して特に有用なものとする。

【０１１１】本発明を好ましい実施例について説明した
が、多数の他の変更や修正がなされ得ることが明らかで
あろう。従って、それらの等価な構成は本発明の特許請
求の範囲の精神及び範囲内に包含されるものとする。

【図面の簡単な説明】

【図１】本発明を使用することのできるコンピュータシ
ステムのブロック図である。

【図２】本発明の原理を用いて圧縮できるビットマップ
のブロック図である。

【図３】本発明によるバイト整列され圧縮された原子の
ブロック図である。

【図４】バイト整列され圧縮された原子の別の形態を示
すブロック図である。

【図５】図２のビットマップを図３及び４の原子シーケ
ンスにエンコードするための手順を示すブロック図であ
る。

【図６】原子シーケンスをビットマップにデコードする
手順のブロック図である。

【図７】原子シーケンスを論理的に操作する手順を示す
ブロック図である。

【符号の説明】

１コンピュータシステム２中央処理ユニット（ＣＰＵ）３メモリ４バス２０ビットマップ２１ビット２２バイト３０バイト整列された原子４０制御バイト（ＣＢＹＴＥ）４１タイプフィールド（ＴＦＩＥＬＤ）４４充填フィールド（ＦＦＩＥＬＤ）４５データフィールド（ＤＦＩＥＬＤ）５０ギャップバイト（ＧＢＹＴＥ）６０ビットマップバイト（ＭＢＹＴＥ）

Claims

(57)【特許請求の範囲】

【請求項１】コンピュータシステムにおいて、データ
を圧縮する方法が、データをコンピュータシステムのメモリの第１組のバイ
トに記憶し、該バイトの組の各バイトは、論理値を記憶
するための同じ数のビットを含み、上記第１組のバイトの１つのバイトをそのバイトの各ビ
ットが同じ論理値を記憶する場合にギャップバイトとし
て分類し、さもなくば、上記バイトをマップバイトとし
て分類し、隣接する同じ分類のバイトをグループに編成し、各グループのギャップバイトに対し、そのグループのギ
ャップバイトにおけるビットの数を表す第１ビットシー
ケンスを上記メモリの第２組の順序付けされたバイトに
記憶し、各グループのマップバイトに対し、そのグループのマッ
プバイトにおけるビットの数を表す第２ビットシーケン
スを上記第２の順序付けされた組のバイトに記憶し、上
記第２組のバイトは、上記第１組のバイトに対応する順
序を有するものであることを特徴とする方法。
【請求項２】特定グループのギャップバイトの上記ビ
ットが全て０か又は全て１を記憶する場合を感知し、上記特定グループのギャップバイトに対応する特定の第
１ビットシーケンスに関連したフラグを記憶し、このフ
ラグは、上記特定グループのギャップバイトの上記ビッ
トの感知を表すものである請求項１に記載の方法。
【請求項３】マップバイトのグループの第１バイトが
その直前のギャップバイトのグループと厳密に１ビット
異なる場合を感知し、そして上記感知に応答して、上記
第１バイトを上記第２組のバイトにビットオフセットと
して記憶し、このビットオフセットは、上記手前のギャ
ップバイトのグループを表す対応する第１ビットシーケ
ンスに関連され、このビットオフセットは、上記第１バ
イトにおける上記１つの異なるビットの位置を表す請求
項２に記載の方法。
【請求項４】上記第２組のバイトを複数のアトムとし
て編成し、これらアトムの各々は、上記第１ビットシー
ケンス、上記第２ビットシーケンス及び上記フラグを記
憶するための制御バイトを含む請求項３に記載の方法。
【請求項５】上記ギャップバイトのグループにおける
ビットの数が所定数よりも大きい場合に上記制御バイト
に続くバイトに上記第１ビットシーケンスを記憶する請
求項４に記載の方法。
【請求項６】データを記憶するための第１組のバイト
を有するメモリを備え、各バイトは、データを表す論理
値を記憶するための複数のビットを含み、これら論理値
は、１又は０のいずれかであり、更に、上記第１組のバイトの１つのバイトを、そのバイ
トの上記複数のビットが全部同じ論理値を記憶する場合
はギャップバイトとして分類し、さもなくば、上記バイ
トをマップバイトとして分類するための手段と、同じ分類を有する隣接バイトにおけるビットの数をカウ
ントする手段と、隣接するギャップバイトの各グループに対し、上記カウ
ントされたビット数を表す第１ビットシーケンスを上記
メモリの第２組のバイトに記憶するための手段と、隣接するマップバイトの各グループに対し、上記カウン
トされたビット数を表す第２ビットシーケンスを上記第
２組のバイトに記憶するための手段と、上記隣接するマップバイトのグループを上記第２組のバ
イトに記憶するための手段とを備え、上記第１及び第２
組のバイトの順序は互いに対応することを特徴とするデ
ータ圧縮装置。
【請求項７】ギャップバイトの特定グループが全て０
か又は全て１を記憶する場合を感知する手段と、特定の第１ビットシーケンスに関連したフラグであっ
て、上記ギャップバイトの特定グループのビットの感知
を表すフラグを記憶するための手段とを更に備えた請求
項６に記載の装置。
【請求項８】マップバイトのグループの第１バイトが
その直前のギャップバイトのグループとは厳密に１ビッ
ト異なる場合を感知する手段と、上記感知手段に応答して、上記第１バイトを上記第２組
のバイトにビットオフセットとして記憶するための手段
とを更に備え、上記ビットオフセットは、上記手前のギ
ャップバイトのグループを表す対応する第１ビットシー
ケンスに関連され、上記ビットオフセットは、上記第１
バイトにおける上記１つの異なるバイトの位置を表すも
のである請求項７に記載の装置。
【請求項９】データを記憶装置のソースバイトセット
に記憶し、各ソースバイトは複数のビットを有し、各ビ
ットは論理０か又は論理１を記憶するものであり、上記ソースバイトセットの特定バイトの上記複数のビッ
トが全部同じ論理値を記憶する場合を決定し、真の決定に応答して、上記特定バイトをギャップバイト
として分類し、さもなくば、上記特定バイトをマップバ
イトとして分類し、上記のソースバイトセットのうちの隣接する同じ分類の
バイトをグループ編成し、上記隣接する同じ分類のバイトの各グループにおける上
記ビットの数をカウントし、上記分類されたギャップバイトの各グループに対し、上
記ギャップバイトのグループの上記カウントされたビッ
トの数を表すギャップビットシーケンスを上記記憶装置
の行き先バイトセットに記憶し、上記分類されたマップバイトの各グループに対し、上記
マップバイトのグループの上記カウントされたビットの
数を表すマップビットシーケンスを上記記憶装置の上記
行き先バイトセットに記憶し、上記分類されたマップバイトの各グループを上記記憶装
置の上記行き先バイトセットに記憶し、上記ソース及び
行き先バイトセットの順序は互いに対応することを特徴
とするデータ圧縮方法。