JPH11136135A

JPH11136135A - データ圧縮方法、その装置、データ復元方法、及びその装置、記録媒体

Info

Publication number: JPH11136135A
Application number: JP7873898A
Authority: JP
Inventors: Fujio Ikegami; 冨士雄池上
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-08-25
Filing date: 1998-03-26
Publication date: 1999-05-21

Abstract

(57)【要約】【課題】データ量に依存しないデータ圧縮方法及び装
置を提供する。【解決手段】記号列からなる入力データ２０列を圧縮
する場合には、入力データ２０の記号列の中に出てくる
各記号に対し、記号列の中での配列位置に対応するビッ
トを“１”とし、その他の位置に対応するビットを
“０”とするビットマップとして表現する。また、復元
するときに、圧縮データ２５内での配列順序に従って、
記号が順番に復元されることを利用して、先に復元され
る記号の位置をビットマップから省略することにより、
ビットマップを短くして、より圧縮率を高める。このた
めビットマップは可変となるので、復元する際、可変長
のビットマップから正しく符号を復元するための情報と
して、ビットマップに含まれる（“１”のビット数−
２）をオンカウントとして圧縮データ２５に加える。ま
た、ビットマップを有するデータとビットマップを有し
ないデータとを区別するため、ビットマップの存否を示
すフラグを圧縮データ２５に含める。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データの圧縮方法
及びその装置に関する。

【０００２】

【従来の技術】今日、コンピュータが一般に普及し、通
信分野でもマルチメディアと関連してデータ通信が関心
を呼んでいる。しかしながら、このようにコンピュータ
が一般に普及すると、コンピュータが扱うデータやコン
ピュータ上で動作するアプリケーション・ソフト等に対
する要求が多くなり、扱われるデータの量も増大する傾
向にある。

【０００３】例えば、インターネット等においては遠隔
地のサーバから個人のコンピュータにアプリケーション
・ソフトが格納されているファイルをダウンロードし、
インストールして使用するようなアプリケーション・ソ
フトの流布形態も多くなっている。このような場合、ユ
ーザはアプリケーション・ソフトをダウンロードするた
めに、例えば電話回線などを接続したままにしておかな
ければならない。一方、アプリケーション・ソフトの備
える機能の増大によってアプリケーション・ソフトが格
納されているファイルの容量が非常に大きくなってお
り、ダウンロードに何時間もかかることも珍しくない。
このような場合、通信コストが高く付いてしまう。

【０００４】また、上記のようなファイルのダウンロー
ドに限らず、コンピュータを使って処理するデータの増
大に伴って、フロッピーディスクやハードディスク等の
記録媒体等に記録させておくデータの量も増大の傾向に
ある。

【０００５】以上のような、コンピュータが取り扱うデ
ータ量の増大に伴って、これを記録する記録媒体資源の
有効利用やデータの転送時間の短縮等が問題となってく
る。従来から、このような問題を解決するためにデータ
を特別な方法で圧縮して転送及び保管し、このデータを
使用する場合には、データの圧縮方法に対応した所定の
復元方法を用いてデータを元の形に戻して使用する方法
が取られている。

【０００６】データの圧縮方法には何種類かあるが代表
的なデータ圧縮方法として、ハフマン符号化法と、レン
ペル・ジブ（Lempel-Ziv）法がある。いずれの方法もデ
ータファイルを記号の集合と見て、この記号を効率よく
表現し直すということを目指したものである。すなわ
ち、“０”と“１”の２値データからなるデータファイ
ルは、例えば、１バイトごとに１つの文字記号に対応さ
せることにより、これら文字記号の並びとして表現する
ことができる。

【０００７】ハフマン符号化法は、最初に入力データを
全て読み、該入力データ内での各記号の出現確率を求め
る。次に、求められた各記号の出現確率から各記号の出
現確率を示す出現確率表を作る。続いて、この出現確率
表を基にハフマンツリー等の予め定められた方法により
各記号にその記号を特定するための符号を与える。すな
わち、出現確率の大きい記号にはビット長の短い符号を
割り振り、出現確率の小さい記号にはビット長の長い符
号を割り振る。そして、再度、入力されたデータを読
み、上記出現確率表から上記予め定められた方法（例え
ば、ハフマンツリー法）に基づいて、入力データ内の各
記号を上記割り振られた符号に置き換えていく。ハフマ
ン符号化法によって圧縮されたデータの先頭には各記号
がどの位の頻度で出現したかを示す出現確率表が出力さ
れる。従って、復元する場合には、圧縮データの先頭に
付加された出現確率表を参照しながら、圧縮時に使用さ
れた方法と同じ方法を用いて各符号を記号に置き換え
る。

【０００８】通常のデータでは、１つの記号は固定され
たビット数で表されるため、入力データの量は、（記号
を表すビット数）×（データに含まれる記号の数）とな
る。ハフマン符号化法によれば、出現確率の大きい記号
ほど少ないビット数の符号が割り振られるので、その分
データの量を圧縮することができる。

【０００９】レンペル・ジブ法は、入力データ中に出て
くる記号列を辞書に登録し、その記号列を辞書のインデ
ックスで置き換えるというものである。辞書は、入力デ
ータを読み込みながら作成され、新しい文字列が出てき
たら辞書に登録してインデックスに置き換えるようにす
る。辞書の作成方法によってＬＺ７７法とＬＺ７８法と
がある。

【００１０】ＬＺ７７法は、現在読み込んでいる入力デ
ータの内、過去、所定Ｋｂｉｔ（キロビット）の範囲に
出てきた記号を辞書に登録してやり、辞書への登録イン
デックスで入力データの記号を置き換えてやるものであ
る。読み込んだ入力データ内の記号が辞書に登録されて
いなかった場合には、辞書に登録されていなかったこと
を表す記号をつけて、そのまま出力する。

【００１１】一方、ＬＺ７８は、現在読み込んでいる入
力データの内、過去に出てきた全ての記号あるいは記号
列を辞書に登録し、入力データの記号あるいは記号列を
辞書のインデックスと置き換えてやるものである。

【００１２】

【発明が解決しようとする課題】ハフマン符号化法では
圧縮データ内の符号を元の記号に復元するための出現確
率表を先頭に出力する必要があるので、データ量が少な
い場合にはデータの圧縮効果を打ち消してしまう。

【００１３】レンペル・ジブ法では、辞書にある程度記
号列が登録されてからでないと圧縮効果が現れない。す
なわち、いずれの圧縮方法でもデータ量が少ないと圧縮
効果が無く、逆にデータ長が伸長することになる。

【００１４】本発明の課題は、データ量に依存しないデ
ータ圧縮方法及び装置を提供することである。

【００１５】

【課題を解決するための手段】本発明のデータ圧縮方法
は、圧縮すべきデータを読み込むステップと、読み込ん
だデータに含まれる記号を取得するステップと、該取得
した記号の該読み込んだデータ内での存在位置を表すビ
ットマップを生成するステップと、前記取得した記号と
前記ビットマップとを組み合わせて、圧縮データとして
出力するステップを備えることを特徴とする。

【００１６】また、本発明のデータ圧縮装置は、圧縮す
べきデータを読み込み、読み込んだデータに含まれる記
号を取得する入力データ取得手段と、前記取得した記号
の読み込んだデータ内での存在位置を表すビットマップ
を生成するビットマップ生成手段と、前記取得した記号
と前記ビットマップとを組み合わせて、圧縮データとし
て出力する出力手段とを備えることを特徴とする。

【００１７】本発明のデータ復元方法は、圧縮されたデ
ータを読み込むステップと、読み込んだデータに含まれ
る記号を取得するステップと、該取得した記号の該読み
込んだデータ内での存在位置を表すビットマップを生成
するステップと、前記取得した記号と前記ビットマップ
とを組み合わせて、圧縮データとして出力するステップ
を備えるデータ圧縮方法によって生成された圧縮データ
を読み込み、前記圧縮されたデータから前記記号と前記
記号に対応する前記ビットマップを読み取るステップ
と、前記ビットマップで指定される位置に前記記号を出
力するステップを備える。

【００１８】本発明のデータ復元装置は、圧縮されたデ
ータを読み込み、読み込んだデータに含まれる記号を取
得する入力データ取得手段と、前記取得した記号の読み
込んだデータ内での存在位置を表すビットマップを生成
するビットマップ生成手段と、前記取得した記号と前記
ビットマップとを組み合わせて、圧縮データとして出力
する出力手段とを備えるデータ圧縮装置によって生成さ
れた圧縮データを読み込む読み込み手段と、前記圧縮デ
ータから前記記号と前記記号に対応する前記ビットマッ
プを読み取り、前記ビットマップで指定される位置に前
記記号を出力する復元データ出力手段を備える。

【００１９】このようにビットマップを使用して元のデ
ータを圧縮することにより、圧縮データの先頭に出現確
率表を出力する必要が無く、また、辞書を使用する場合
のようにある程度データ量が多くならないと圧縮方法が
有効にならないということも無いので、データ量の大小
に関係なく有効なデータ圧縮ができる。

【００２０】また、本発明のデータ復元方法あるいは復
元装置を用いれば、圧縮データに記録されている記号と
該記号に対応するビットマップを読み込んで、該ビット
マップで示される位置に該記号を配置し、これを圧縮デ
ータに含まれるデータ（記号と該記号に対応するビット
マップ）全てについて行うことによって、本発明のデー
タ圧縮方法あるいはデータ圧縮装置によって圧縮された
データを元通りに復元することができる。

【００２１】また、データ圧縮において、ビットマップ
を前記取得した記号の存在位置が前記読み込んだデータ
の先頭から後尾に向かう順番で表される様に構成し、該
ビットマップの内、前記取得した記号が存在することを
示す最後尾のビットから該ビットマップの最後尾まで連
続する前記取得した記号が存在しないことを示すビット
を該ビットマップから削除し、該削除により得られたビ
ットマップを圧縮データとして出力する方法も冗長なビ
ットを削除することができるのでデータ圧縮の際に有効
である。このとき、“０”と“１”のビットから構成さ
れるビットマップが可変長となるので、該ビットマップ
のビット数を表すカウンタ値を、該ビットマップと組み
合わせて圧縮データとして出力するようにする。

【００２２】また、読み込んだデータの先頭から出現順
に各記号の圧縮処理を順次行うことによって、読み込ん
だデータを圧縮する際に、先立って圧縮処理された記号
が前記読み込んだデータ内に占める位置を示すビット
を、後に圧縮処理される記号に対応するビットマップか
ら削除することが可能である。このようにすれば、復元
に不必要なビットをビットマップから削除することが出
来るのでデータ圧縮に有効である。この場合には、ビッ
トマップの先頭のビットが必ず記号が存在することを示
すビットとなるので該ビットマップから、これを省略す
ることが出来る。

【００２３】また、同一の記号が元のデータ内で離れて
存在してる場合には、該記号に対応するビットマップ上
で上記２つの記号が存在することを示す２つのビット間
に、上記記号が存在しないことを示すビットが多く並ぶ
ことになる。この場合には、同じ記号であっても互いに
異なる記号として処理することにより、全体としてビッ
トマップのビット長を短くすることができる。

【００２４】以上のように、ビットマップを短くしてく
ると、中にはビットマップもカウンタ値も必要なくなる
記号が出現する。従って、記号に対応してビットマップ
やカウンタ値が存在するか否かを示すフラグを圧縮デー
タの中に設けることによって、必要のないビットマップ
やカウンタ値を圧縮データの中から省略することが出
来、実際のデータを圧縮する際に効果的である。

【００２５】

【発明の実施の形態】図１は、本発明の原理構成図であ
る。本発明においては、入力データを受け取り、入力デ
ータ中に含まれる記号６を取得する入力データ取得手段
３と、取得した記号６が入力データ中に存在する位置を
表すビットマップ７を生成するビットマップ生成手段４
と、上記入力データ取得手段によって取得された記号６
とビットマップ生成手段によって生成されたビットマッ
プ７とを組み合わせて出力する出力手段５とからなる。

【００２６】入力データは、一般に“０”と“１”とか
らなる記号列で表されるが、例えば、１バイト（８ビッ
ト）を１つの記号に対応させることによって、アルファ
ベット等の記号列として捉えることが出来る。入力デー
タ取得手段３は、入力データを読み込むとともに、入力
データに含まれる記号６（図１の場合は「ａ」あるいは
「ｂ」、「ｃ」・・・となっている）を取得する。

【００２７】次に、ビットマップ生成手段４が、入力デ
ータ中の記号６のある位置を表すビットマップ７を生成
する。図１に示されているビットマップ７は、記号
「ａ」の入力データ中の位置を表している。すなわち、
記号「ａ」に対するビットマップ７は、“１１００１０
０１００００００００００００００１００”となってい
るが、これは、記号「ａ」が入力データ中の先頭から
１、２、５、８、２３番目に現れることを示している。
すなわち、ビットマップ７中の“１”が立っている位置
が該当する記号が入力データの中で配置されている位置
を示している。

【００２８】このようにして、入力データ中に現れる記
号６（すなわち、「ａ」、「ｂ」、「ｃ」・・・・）全
てについて、記号６とビットマップ７とを組にして出力
することにより、入力データを圧縮することが可能とな
る。更に、ビットマップ７の冗長なビットを削除するこ
とによって、ビットマップの短縮化を図れば、入力デー
タに対する出力データの圧縮率を高めることができる。
この冗長なビットを削除する具体的な方法は後述する。

【００２９】図２は、本発明の一実施形態のデータ圧縮
／復元処理を行うためのコンピュータ１のハードウェア
構成の一例を示す図である。図２に示すコンピュータ１
は、本発明の一実施形態のデータ圧縮／復元処理方法を
プログラム（データ圧縮・復元処理プログラム）を実行
することによって実現するＣＰＵ１２と、上記プログラ
ムが、ＣＰＵ１２が実行可能な状態でロードされるＲＡ
Ｍ１０を備えている。これらは、バス１８を介してデー
タの授受等を行い、上記方法によるデータ圧縮及び復元
処理を実現する。ＲＯＭ１１には、入出力装置１３、記
録媒体読み取り装置１４、及び通信インタフェース１６
の動作を制御するための基本的な処理を行うシステムプ
ログラム（例えば、ＯＳやデバイスドライバ等のシステ
ム・ソフトやＢＩＯＳ等）が記憶され、コンピュータ１
の装置本体に電源が入れられると、該システムプログラ
ムはＣＰＵ１２によってＲＯＭ１１からＲＡＭ１０上に
読み出され、ＣＰＵ１２により実行される。尚、ＲＯＭ
１１に、上記本実施形態のデータ圧縮・復元処理プログ
ラムを予め記憶させておき、これをＲＯＭ１１からＲＡ
Ｍ１０上にロードしてＣＰＵ１２に実行させるようにし
てもよい。

【００３０】入出力装置１３は、ディスプレイ装置、キ
ーボード、マウス、スピーカ等を含み、ユーザとコンピ
ュータ１とのインタフェースを実現するものである。入
出力装置１３は、圧縮すべき、あるいは復元すべきデー
タファイルをコマンド入力により指定するキーボード
と、コマンドの入力やデータファイルの圧縮・復元状況
を表示するディスプレイ装置とを少なくとも含む。尚、
圧縮または復元すべきデータファイルの指定は、ＧＵＩ
画面上でそれらのファイルのアイコンをマウスによりク
リックすることにより行うようにしてもよい。

【００３１】記録媒体１５はコンピュータ１が読み取り
可能な形式でプログラムあるいはデータを記録しておく
ものである。記録媒体１５に本実施形態のデータ圧縮・
復元処理プログラムを記録させておき、このプログラム
を記録媒体読み取り装置１４によって記憶媒体１５から
読み込むことによって、ＣＰＵ１２にこのプログラムを
実行させることが可能である。ＣＰＵ１２の制御によっ
て、記録媒体読取装置１４によって記憶媒体１５から読
み込まれた上記データ圧縮・復元処理プログラムはＲＡ
Ｍ１０上にロードされ、実行可能状態とされてＣＰＵ１
２によって実行される。また、圧縮・復元されるべきデ
ータファイルを記録媒体１５に記録しておき、これを読
み込んで圧縮・復元してもよい。記録媒体１５は、例え
ば、フロッピーディスクやＣＤ−ＲＯＭ等の可搬記録媒
体であり、コンピュータ１が読み取り可能な形式で上記
データ圧縮・復元処理プログラムを記録するものであ
る。

【００３２】更に、バス１８には上記の構成要素のほか
に通信インタフェース１６が設けられており、他のコン
ピュータとデータの授受を行うことができるように構成
されている。例えば、通信インタフェース１６及びそれ
に接続された不図示のモデム等のＤＣＥ（ＤａｔａＣ
ｉｒｃｕｉｔｔｅｒｍｉｎａｔｉｎｇＥｑｕｉｐｍ
ｅｎｔ）により、ネットワーク１９を介してプログラム
提供者が提供するデータベース１７にアクセスし、該デ
ータベース１７に格納されている本実施形態のデータ圧
縮・復元処理プログラムをコンピュータ１にダウンロー
ドして、このプログラムをＣＰＵ１２で実行するように
してもよい。

【００３３】通信インタフェース１６はこの他に、上記
ＤＣＥにより、圧縮したデータを他のコンピュータに対
してネットワーク１９を介して送信したり、他のコンピ
ュータから圧縮されたデータをネットワーク１９を介し
て受信する。これにより該受信した圧縮データを、本実
施形態のデータ圧縮・復元プログラムにより復元して、
該復元データをコンピュータ１で利用することも可能で
ある。

【００３４】尚、上記データ圧縮・復元プログラムは、
イントラネット等のＬＡＮで、アプリケーションサーバ
からコンピュータ１にダウンロードする利用形態も可能
である。

【００３５】次に、本実施形態のデータ圧縮方法を説明
する。図３（ａ）は、本実施形態のデータ圧縮方法の基
本となる考え方を説明する図である。

【００３６】図３（ａ）の記号列は圧縮しようとするデ
ータであって、アルファベットの記号列として表されて
いる。本実施形態では、この記号列に含まれる１つの種
類の記号に対し、記号列の中の位置をビットマップとし
て表す。例えば、記号列の先頭に「ａ」という記号が来
ているが、これは記号列の中では、１、２、５、８、２
３番目に出てきている。これに対応して、記号「ａ」の
ビットマップには、１、２、５、８、２３番目のビット
に“１”を立て、その他のビットは“０”とする。この
ようにすることによって、記号「ａ」が記号列のどの場
所にあるかを示すことが出来る。

【００３７】その他の記号に対しても同様であって、記
号「ｂ」は記号列の３、９、１３番目に出てきているの
で、第３、９、１３のビットに“１”を立て、その他の
ビットは“０”となるようにビットマップを作る。この
ようにして、記号列内に出てくる記号「ａ」から「ｆ」
までに対して同様のビットマップを生成し、元の記号列
と置き換えてやる。このとき、各ビットマップがどの記
号のビットマップかを示すため、ビットマップの先頭に
は記号（「ａ」や「ｂ」等）を出力するようにする。

【００３８】ここで、上記方法の圧縮率を求める。圧縮
率には様々な定義の仕方があるが、以下のような圧縮率
の定義を用いる。圧縮率＝（Σ（記号の表現に必要なビット数＋ビットマップ、その他の長さの合計））／（記号の表現に必要なビット数×入力記号列の長さ）・・・・（１）ここで、分子の和は元のデータの記号列に含まれる全て
の記号の種類に対して行う。

【００３９】コンピュータ処理においては、通常、アル
ファベットは８ビットで表現されるので、上記方法の圧
縮率を求める際には、記号の表現に必要なビット数を８
ビットとする。

【００４０】図３（ａ）の上段に記載されている元の記
号列は各文字が８ビットで、該記号列に含まれる記号の
数が２５個であるので、元の記号列全体のビットの長さ
は、８×２５＝２００ビットとなる。これが式（１）の
分母にあたる。一方、本実施形態の方法によって圧縮さ
れたデータのビット長は図３の右に記載されているよう
に、各記号に対しては、記号を表現する８ビットとビッ
トマップの長さ２５ビットとを足しあわせた３３ビット
となる。そして、記号が「ａ」から「ｆ」までの６種類
あるので、全体のビット数は６×３３ビットで、１９８
ビットとなる。これが式（１）の分子である。従って、
圧縮率＝１９８／２００＝０．９９となる。ここで、圧
縮の効果があるためには圧縮率＜１である必要がある
が、そのためには上記方法の場合記号の種別が８よりも
小さい必要がある（ただし、これは圧縮すべきデータ長
が非常に長い場合を想定している）。このような制限
は、上記本実施形態の基本的考え方のみを適用した場合
に導かれるものであるが、更に、以下に述べるようにビ
ットマップ表現を効率化することにより、上記制限が無
くても有効な圧縮を行う方法を提供することができる。

【００４１】図３（ｂ）は、図３（ａ）の本実施形態の
ビットマップ表現を更に効率化したものである。図３
（ａ）のビットマップ表現を見ると、ビットマップの右
側に“０”が多く並んだ部分があることが分かる。これ
は、記号列の後ろの方に対応する記号が存在しないこと
を示している。従って、記号列を先頭から復元していく
ことを考えたときビットマップの後ろの方にある“０”
の連続した部分は記号列の復元には必要ないことにな
る。すなわち、“０”の連続の後に“１”がある場合に
は“０”の連続は次の“１”が出てくるまで対応する記
号が出てこないことを意味するので、ビットマップに記
録しておくべきである。しかし、ビットマップの最後ま
で続く“０”は必要ないので、ビットマップから消去す
ることができる。

【００４２】ただし、図３（ａ）の場合には、全てのビ
ットマップの長さが２５ビットと固定長になっているの
で、復元するときビットマップの終わりを認識すること
ができるが、図３（ｂ）のようにビットマップ長を可変
にすることによりビットマップの終わりがどこになるか
認識できなくなる。

【００４３】そこで、対応するビットマップによって復
元されるべき（記号の数−１）を示す値をビットマップ
の長さを示す指標として、ビットマップの先頭に出力す
るようにする。そして、これをオンカウントと定義す
る。図３（ｂ）の場合にはオンカウントを３ビットで表
すこととしている。これにより、ビットマップ長を可変
とすることができるので、図３（ａ）と比べて更に圧縮
率を高めることが出来る。図３（ｂ）の右側にはデータ
長が記載されている。それぞれの記号に対するデータ長
は、記号を表す８ビットとオンカウントの３ビットに加
え、可変となったビットマップのビット長を加えたもの
となる。これらを記号「ａ」から「ｆ」まで加えること
により、全データ長が得られる。図３（ｂ）の場合に
は、１８２ビットとなる。これを、元の記号列のビット
長である２００ビットで割ることにより、圧縮率が得ら
れ、０．９１となる。

【００４４】このように、図３（ｂ）の場合には、可変
長ビットマップの導入のためにオンカウントの分ビット
長は増えるが、ビットマップで後半の最後まで連続する
“０”のビット列が省かれるので全体としてはデータ量
は減る。

【００４５】図４（ａ）は、図３（ｂ）のビットマップ
に含まれる不要な“０”のビットを削除して、更に、圧
縮率を高める方法を説明する図である。図３（ｂ）にお
いて、２番目の記号「ｂ」に着目するとビットマップは
“００１”で始まっているが、記号「ａ」のビットマッ
プを見ると、「ｂ」のビットマップの最初の“００”は
記号「ａ」が占める位置である。圧縮したデータを復元
する時に、元の記号列での出現順序に従って、記号
「ａ」、「ｂ」・・・「ｆ」の順に復元していくとする
と、先に復元された記号に重ねて次の記号を配置するこ
とはない。従って、後から復元する記号に対しては先頭
から連続している“０”や、“１”と“１”との間にあ
る“０”であって、先に復元される記号が配置される位
置に対応する“０”は省略することができる。

【００４６】図４（ａ）は、上記で説明した方法によ
り、図３（ｂ）のビットマップから不要な“０”を省略
した結果、得られる圧縮データを示す図である。この場
合、元の記号列での出現順序に従って、記号「ａ」から
「ｆ」に向かって順に記号が復元されることとしてい
る。図３（ｂ）と図４（ａ）とを比較すると、余分な
“０”のビットが省略されたため、ビットマップのビッ
ト長が短くなり更に圧縮率が向上していることが分か
る。実際に、圧縮率を計算してみると、圧縮データのデ
ータ長の合計は１２１ビットであり、元のデータのデー
タ長は２００ビットであるので、０．６１となる。

【００４７】なお、図４（ａ）の場合、元の記号列での
出現順序に従って、記号「ａ」から「ｆ」の順に復元す
ることを念頭にしたが、復元する記号の順番は特には限
定されない。すなわち、記号「ｆ」から「ａ」に向かっ
て復元するように構成してもよいし、「ａ」から「ｆ」
の記号をランダムに復元するようにしてもよい。ただ
し、その場合には、ビットマップは復元される記号の順
番にあったビットマップを作成するようにする。

【００４８】図４（ａ）を見ると最初に復元される記号
「ａ」のビットマップのみが非常に長くなっている。次
に、更にビットマップのビット長を短くする方法を説明
する。

【００４９】図４（ｂ）は、記号「ａ」のビットマップ
を分割する方法を説明する図である。この場合には、記
号「ａ」から「ｆ」の順番で復元する、すなわち、元の
記号列に現れる出現順に記号を圧縮し、復元する場合を
想定する。

【００５０】図４（ｂ）の記号「ａ」のビットマップ
は、図４（ａ）のビットマップにおける左から４番目の
“１”のビットの後に長く続く“０”のビット列があ
り、この“０”の列の後にある記号「ａ」を別の記号と
して扱ったものである。すなわち、上記記号「ａ」を記
号「ｅ」の後に先頭の記号「ａ」とは別記号のように配
置するようにしている。

【００５１】このようにした場合でも、元の記号列に現
れる出現順に各記号のビットマップを作っておく。逆に
復元する場合に先頭の記号「ａ」から順番に復元してい
くことにより、下の方にある記号「ａ」も正しい位置に
復元することができる。このとき、下の方にある記号
「ａ」の位置はビットマップを上から復元していったと
きに元の記号列の構成における、正しい位置に復元され
るような記号の後に挿入されるように配置する。

【００５２】図４（ｂ）の方法では、右側に記載されて
いるデータ長の合計が１１８ビットで元の記号列のビッ
ト長が２００ビットであるので、圧縮率は０．５９とな
り、圧縮率が更に向上している。

【００５３】なお、図３（ｂ）や図４（ａ）、（ｂ）で
は、オンカウントのビット長を３ビットとしている。こ
の場合、１つのビットマップに登録することの出来る
“１”のビット数は８個である。したがって、３ビット
長のオンカウントでは元の記号列に８個以上現れる記号
に対しては対応できない。しかし、図４（ｂ）のよう
に、長いビットマップを有する記号を分割して、圧縮デ
ータを作成することにより、元の記号列において予め決
められたビット長のオンカウントの最大値よりも多く出
現する記号が含まれる場合にも対応することができる。
もちろん、図３（ｂ）や図４（ａ）、（ｂ）においてオ
ンカウントのビット長を長くすることにより対応するこ
とも可能である。

【００５４】図５（ａ）は、図４（ｂ）のビットマップ
においてビットマップの先頭の“１”を省略したもので
ある。すなわち、図４（ｂ）においては、全ての記号の
ビットマップの先頭が“１”となっている。これは、対
応する記号が最初に現れる位置を示しているが、記号が
出力されている限り、その出力される記号は元の記号列
の中に必ず１つ存在することになるので、図４（ｂ）の
各記号のビットマップから先頭の“１”を省略しても問
題は生じない。従って、図５（ａ）では、これらの
“１”を省略している。なお、先頭の“１”を削除した
が、オンカウント値は変更していない。

【００５５】図５（ａ）場合には、図４（ｂ）に比べて
各記号のビットマップのビット長がそれぞれ１づつ減っ
て、トータルのビット長は１１１ビットになる。一方、
元の記号列のビット長は２００ビットであるので、圧縮
率は０．５６となる。

【００５６】図５（ｂ）は、オンカウントに加え、ビッ
トマップがあることを示すフラグを設けた方法を説明す
る図である。図５（ａ）では、下の方の「ａ」のビット
マップがなくなっている。従って、実際復元する場合に
は、下の方の「ａ」にはオンカウントも必要なく、記号
「ａ」だけがあればよい。また、元の記号列の中に点在
する記号が多いと分割により、上記図５（ａ）の下の方
の「ａ」のような、ビットマップを有しない記号が多く
発生することになる。

【００５７】図５（ａ）の場合、記号８ビットとオンカ
ウントの３ビットを合わせて、１つの記号を表すのに最
低１１ビット必要となっている。従って、下の方の
「ａ」のような場合を考えれば、データの伸長となって
いる。そこで、図５（ｂ）に表すように、記号に対応す
るオンカウント及びビットマップの存在を表すフラグを
設けるようにする。そして、例えば、記号に対応するオ
ンカウントとビットマップがある場合には、上記フラグ
を“１”とし、下の方の「ａ」のように、オンカウント
及びビットマップが存在しない場合には、フラグを
“０”に設定する。

【００５８】フラグを設けることにより、不要なオンカ
ウントとビットマップを省略することができる。図５
（ｂ）の場合、データ長の合計は１１４ビットで、元の
記号列のビット長が２００ビットであるので、圧縮率は
０．５７となる。図５（ｂ）の例ではオンカウント及び
ビットマップの存否を区別するフラグを導入したことで
圧縮率は図５（ａ）の場合に比べて若干低下したが、実
際のデータでは効果は大きい。

【００５９】なお、図５（ｂ）でオンカウントの値は、
図４（ｂ）のビットマップにおける先頭の１ビットを省
略したことにより、図５（ａ）のときより１小さい値に
している。これは、同じビット数のオンカウントでもで
きるだけ多くの記号数を表現できるようにすることを考
慮したものである。

【００６０】なお、図３から図５に説明した方法におい
ては、最後の記号である「ｆ」のオンカウント及びビッ
トマップも出力するようにしているが、記号をビットマ
ップに従って順番に復元していく場合には、最後の記号
に対するビットマップは不要である。すなわち、最後の
記号は、オンカウントの情報のみを用いて、それまでに
復元された記号列の空いたところ、または復元済記号列
の後方に配置すればよいからである。

【００６１】また、最後の記号が記号列の後尾に存在し
ないか、存在したとしても１個のみであればオンカウン
トも不要となる。図６は、本発明の一実施形態のデータ
圧縮／復元処理の概念を説明する図である。

【００６２】上記説明では、圧縮すべきデータ全てを読
み込んでから処理することを前提にしていたが、実際に
は圧縮すべきデータは非常に長くなることが考えられ現
実的ではない。そこで、入力データ２０から所定数の記
号列を読み込むことの出来る記号バッファ２１と、（記
号バッファ長）／（記号を表現するビット数）のビット
長を有する共通マップ２２及び出力マップ２３を用意
し、記号バッファ２１を移動窓として入力データ２０に
沿って移動しながら圧縮を行う。

【００６３】記号バッファ２１に読み込まれた記号列の
中から記号２４が取り出されて、圧縮データ２５として
出力される他、共通マップ２２には既に圧縮処理を行っ
た記号が記号バッファ２１の中のどの位置にあるかを示
すビットが記録される。出力マップ２３には、共通マッ
プ２２を参照して既に圧縮処理された記号が配置されて
いる位置を除いた、圧縮処理をしている記号の記号バッ
ファ２１内の位置を示すビットマップが作成されてい
く。出力マップ２３内で完成された各記号のビットマッ
プは“１”のビット数が２個以上の場合のときのみ、先
頭の“１”のビットを除いて、圧縮データ２５における
該記号のビットマップとして出力される。

【００６４】圧縮データ２５を復元する場合には、圧縮
データ２５から記号２６を読み込むと共に、不図示のフ
ラグの値を参照してビットマップがある場合にはビット
マップ読み込み変数２７にビットマップを１ビットずつ
読み込む。ビットマップ読み込み変数２７に読み込まれ
たビットマップの各ビットが“１”の場合、共通マップ
２８に記号２６が配置されるべき位置を登録する。読み
込んだ記号２６の配置されるべき位置の共通マップ２８
への登録が終わると、共通マップ２８で示される記号バ
ッファ２９内の位置に読み込んだ記号２６を配置する。
そして、共通マップ２８を参照して、記号バッファ２９
内に配置された記号列が先頭位置から順に復元データ３
０として出力される。

【００６５】以下の説明においては、記号を表現するビ
ット数を８ビットとする。図７〜図９は、ＣＰＵ１２が
前記データ圧縮・復元処理プログラムを実行することに
より実現される本実施形態のデータ圧縮方法を説明する
処理のフローチャートである。

【００６６】図７〜図９のデータ圧縮処理を図１０の入
力データ２０の例を用いて説明をする。なお、図７〜図
９のデータ圧縮方法は図５（ｂ）の方法を行うことに対
応する。

【００６７】ステップＳ１で、圧縮すべきデータファイ
ルから記号バッファ２１の長さだけ入力データ２０を記
号バッファ２１へ読み込む。ステップＳ２で、記号バッ
ファ２１へ読み込んだ記号数を変数ｌｅｎに設定する。
ステップＳ３で共通マップ２２をクリアする。そして、
ステップＳ４で上記圧縮すべきデータファイルの終わり
を示す変数ｅｏｆを０に設定する。これは、最初、該デ
ータファイルの終わりに来ていないことを設定するもの
である。データファイルの終わりの位置は、該データフ
ァイルからのデータ読み出し命令実行後に、本発明のデ
ータ圧縮プログラム、あるいは後に説明するデータ復元
プログラムが動作するＯＳのファイル管理システムから
返されるステイタス情報を元に取得される。次に、オン
カウントのビット幅を出力する（ステップＳ５）。

【００６８】ステップＳ６で、出力マップ２３をクリア
し、その先頭ビットを“１”にする。次に、ビットマッ
プを作るべき記号を保持する変数（記号（変数））に記
号バッファ２１の０番目の記号を設定し、変数ｉ、ｊ、
ｏｎｃｎｔをそれぞれ“０”に設定する（ステップＳ
７）。

【００６９】今、ステップＳ１で記号バッファ２１に読
み込まれた入力データ２０が図１０に示す入力データ２
０「ＡＡＡＢＣＡＤ」であるとする。ステップＳ８で、
共通マップ２２のｉ番目は既に１か否かが判断される。
ここでは、ステップＳ３で共通マップ２２がクリアさ
れ、ステップＳ７でｉが“０”に設定されているので、
“１”になっていないことになる。従って、ステップＳ
９へ進み、記号（変数）に保持されている記号と記号バ
ッファ２１のｉ番目の記号が等しいか否かが判断され
る。ここで、記号（変数）に保持されている記号はステ
ップＳ７で記号バッファ２１の０番目の記号であり、ｉ
が０であるので、ステップＳ９でＹＥＳとなり、図８の
ステップＳ１１に進む。

【００７０】ステップＳ１１で、出力マップ２３上のｉ
−ｊ番目の位置のビットに“１”を立て、共通マップ２
２上のｉ番目の位置のビットに“１”を立て、ｏｎｃｎ
ｔ＝ｏｎｃｎｔ＋１とする。今の場合、出力マップ２３
の０番目の位置と共通マップ２２の０番目の位置のビッ
トに“１”が立てられる。また、ｏｎｃｎｔは“１”と
なる。ステップＳ１２でｉを“１”インクリメントし
（ｉ＝１）、ステップＳ１３でｉがｌｅｎ以上か否か
（記号バッファ２１内を最後まで調べたか否か）を判断
する。

【００７１】今の場合、ステップＳ１３の判断はＮＯと
なるので、ステップＳ１４でｏｎｃｎｔの値がｏｎｃｎ
ｔの最大値より小さいか否かを判断する。ｏｎｃｎｔの
最大値は、ステップＳ５で出力されたオンカウントのビ
ット幅から得られる。ここでは、オンカウント数より多
い記号が含まれていた場合に、別文字としてビットマッ
プを分割するための判断をしている。

【００７２】ｏｎｃｎｔはまだ“１”なのでステップＳ
８に戻る。ステップＳ８では、共通マップ２２のｉ（こ
の場合、ｉ＝１）番目が“１”となっているかどうか判
断する。まだ、共通バッファの０番目のビットに“１”
を立てただけなので、“１”とはなっていない。従っ
て、ステップＳ９で記号（変数）の記号と記号バッファ
２１の１番目の記号が等しいか否か判断する。ステップ
Ｓ９での判断がＹＥＳとなるので、ステップＳ１１で、
出力マップ２３上の１番目のビットと、共通マップ２２
上の１番目のビットとに“１”を立て、さらにｏｎｃｎ
ｔを１つインクリメントし（ｏｎｃｎｔ＝２）、ステッ
プＳ１２でｉをインクリメント（＋１）する（ｉ＝
２）。ステップＳ１３でｉがｌｅｎ以上かが判断される
（記号バッファ２１内の全ての記号を調べたかが判断さ
れる）。まだ、記号バッファ２１内の全ての記号を調べ
ていないのでステップＳ１４へ進む。ステップＳ１４
で、ｏｎｃｎｔがｏｎｃｎｔの最大値より小さいか否か
が判断され、まだ、２つの記号しか処理していないので
ステップＳ８に戻る。

【００７３】ステップＳ８では、共通マップ２２のｉ
（＝２）番目が既に“１”か否か判断されるが、“１”
ではないので、ステップＳ９で記号（変数）の内容（記
号「Ａ」）と記号バッファ２１のｉ（＝２）番目の記号
は等しいか否かが判断され、記号バッファ２１の３番目
（ｉ＝２の位置）も「Ａ」なので、ステップＳ１１へ進
み、出力マップ２３のｉ−ｊ番目（２番目）の位置のビ
ットに“１”を立てる。また、共通マップ２２上のｉ番
目（２番目）の位置のビットに“１”を立てる。そし
て、ｏｎｃｎｔを１だけインクリメントし（ｏｎｃｎｔ
＝３）、ステップＳ１２へ進む。ステップＳ１２でｉを
１つインクリメントし（ｉ＝３）、ステップＳ１３でｉ
がｌｅｎ以上であるか否かが判断される。まだ、記号バ
ッファ２１に読み込んだ記号数“７”よりも小さいの
で、ステップＳ１４に進んで、ｏｎｃｎｔがｏｎｃｎｔ
の最大値（＝７）より小さいか否かが判断され、ｏｎｃ
ｎｔが“３”なので、ステップＳ８へ戻る。

【００７４】ステップＳ８で、共通マップ２２のｉ（＝
３）番目は既に“１”か否かが判断され、“１”ではな
いので、ステップＳ９に進む。ステップＳ９では、記号
（変数）の記号（「Ａ」）と記号バッファ２１のｉ（＝
３）番目の記号（「Ｂ」）が等しいか判断される。この
場合、ＮＯとなるので、ステップＳ１２でｉが１つイン
クリメントされ（ｉ＝４）、ステップＳ１３でｉ（＝
４）がｌｅｎ（＝７）以上かが判断される。ステップＳ
１３ではＮＯであるので、ステップＳ１４でｏｎｃｎｔ
（＝３）がｏｎｃｎｔの最大値（＝７）より小さいか否
かが判断される。ステップＳ１４での判断の結果はＹＥ
Ｓなので、ステップＳ８に戻る。

【００７５】ステップＳ８で、共通マップ２２のｉ（＝
４）番目が既に“１”か否かが判断され、結果はＮＯで
ある。ステップＳ９に進んで、記号（変数）の記号
（「Ａ」）と記号バッファ２１のｉ（＝４）番目の記号
（「Ｃ」）が等しいか否かが判断されるが、等しくない
ので、ステップＳ１２でｉを１つインクリメントし（ｉ
＝５）、ステップＳ１３でｉがｌｅｎ（＝７）以上か判
断される。ステップＳ１３での判断の結果は、ＮＯであ
るので、ステップＳ１４でｏｎｃｎｔがｏｎｃｎｔの最
大値より小さいか否かが判断されるが、ｏｎｃｎｔの値
は“３”なので、ＹＥＳとなり、ステップＳ８へ戻る。

【００７６】ステップＳ８では、共通マップ２２のｉ
（＝５）番目が既に“１”か否かが判断されるが、判断
はＮＯとなる。ステップＳ９では、記号（変数）の記号
（「Ａ」）と記号バッファ２１のｉ（＝５）番目の記号
（「Ａ」）が等しいか否かが判断され、等しいので、ス
テップＳ１１へ進む。ステップＳ１１で出力マップ２３
上のｉ−ｊ番目（５番目）の位置のビットに“１”を立
てる。また、共通マップ２２上のｉ（＝５）番目の位置
のビットに“１”を立てる。そして、ｏｎｃｎｔを１つ
インクリメントする（ｏｎｃｎｔ＝４）。ステップＳ１
２に進み、ｉを１つインクリメントする（ｉ＝６）。ス
テップＳ１３でｉがｌｅｎ（＝７）以上か否かが判断さ
れ、ＮＯなので、ステップＳ１４でｏｎｃｎｔがｏｎｃ
ｎｔの最大値（＝７）より小さいか否かが判断される。
ステップＳ１４では、まだＮＯなのでステップＳ８へ進
む。

【００７７】ステップＳ８で共通マップ２２のｉ（＝
６）番目が既に“１”か否かが判断され、ＮＯとなる。
ステップＳ９で記号（変数）の記号（「Ａ」）と記号バ
ッファ２１のｉ（＝６）番目の記号（「Ｄ」）が等しい
か否かが判断される。今の場合、等しくないので、ステ
ップＳ１２でｉを１つインクリメントし（ｉ＝７）、ス
テップＳ１３でｉがｌｅｎ（＝７）以上か否かが判断さ
れる。この場合には、記号バッファ２１内の全ての記号
について処理をしたので、ｉはｌｅｎ以上となってお
り、ステップＳ１５に進む。

【００７８】ステップＳ１５では、ｏｎｃｎｔが“０”
か否かを判断する。記号「Ａ」の場合には、ｏｎｃｎｔ
が“０”でないので、ステップＳ１６で記号（変数）内
の記号「Ａ」を出力し、ステップＳ１７で、ｏｎｃｎｔ
が“１”か否かを判断する。記号「Ａ」の場合には、こ
れに該当しないので、ステップＳ１８でフラグを“１”
で出力し、更に、（ｏｎｃｎｔ−２）の値（＝２）をオ
ンカウントの値として出力する（この時点での共通マッ
プ２２、及び出力マップ２３は図１０の第１記号（Ａ）
の行に記載されているものとなる）。

【００７９】ステップＳ１９でｌｅｎが“１”か否かを
判断し、ｌｅｎは“７”であるので、次に、ステップＳ
２４で出力マップ２３の先頭ビットを除き、最後に
“１”が立っている場所まで出力マップ２３を出力する
（ビットマップは“１１００１”となる）。以上の処理
により、図１０に示す入力データ「ＡＡＡＢＣＡＤ」内
の記号「Ａ」については、図１０に示すように記号
「Ａ」、「１」のフラグ、“０１０”のオンカウント、
及び“１１００１”のビットマップに圧縮されて出力さ
れる。ステップＳ２５で、共通マップ２２を１ビット左
へシフトし、最後のビットに“０”を設定し、記号バッ
ファ２１の内容を１記号分だけ左へシフトして、次に処
理すべき記号の準備をする。

【００８０】ステップＳ２６で、フラグｅｏｆが“１”
か否かを判断し、フラグｅｏｆが“１”でなければ、ス
テップＳ２７でデータファイルの次の記号を１個読む。
次に、ステップＳ２８でデータファイルの終わりか否か
をＯＳからのステイタス情報を元に判断し、データファ
イルの終わりでない場合には、ステップＳ２９で読み込
んだ記号を記号バッファ２１の最終位置へ格納し、ステ
ップＳ６に戻って処理を繰り返す。

【００８１】図１０の場合、入力データ２０はこれだけ
なので、ステップＳ２８でデータファイルの終わりと判
断される。そこで、ステップＳ３０に進み、ｅｏｆを
“１”に設定し、ステップＳ３１でｌｅｎの値を１つ減
らす（ｌｅｎ＝６）。

【００８２】そして、ステップＳ６に戻り、図１０の入
力データ２０を左に１記号分シフトしたものに対し処理
を行うために、出力マップ２３をクリアし、その先頭ビ
ットを“１”にする。ステップＳ７で記号（変数）に記
号バッファ２１の０番目（「Ａ」）を設定し、変数ｉ、
ｊ、ｏｎｃｎｔをそれぞれ“０”にする。

【００８３】ステップＳ８で、上記ステップＳ２５で左
にシフトされた後の共通マップ２２の０番目が既に
“１”であるのでステップＳ１０に進む。ステップＳ１
０でｊを１つインクリメントし、ステップＳ１２でｉを
１つインクリメントし（ｉ＝１）、ステップＳ１３でｉ
（＝１）がｌｅｎ（＝６）以上か否かが判断される。判
断はＮＯとなるので、ステップＳ１４でｏｎｃｎｔ（＝
０）がｏｎｃｎｔの最大値（＝７）より小さいか否かを
判断する。

【００８４】再び、ステップＳ８で共通マップ２２のｉ
（＝１）番目が既に“１”であることが判断されるの
で、上記と同じ処理を行い、次のステップＳ８で共通マ
ップ２２のｉ（＝２）番目が既に“１”か否かを判断
し、“１”ではないので、ステップＳ９の処理を行う。
ステップＳ９で記号（変数）の記号（「Ａ」）と記号バ
ッファ２１のｉ（＝２）番目の記号（「Ｂ」）が等しい
か否かを判断し、等しくないので、ステップＳ１２へ飛
ぶ。ステップＳ１２でｉを１つインクリメントし（ｉ＝
３）、ステップＳ１３、１４を行う。この処理を繰り返
すことにより、記号バッファ２１の先頭の記号「Ａ」に
対しては、ステップＳ１１の処理が行われないので、ス
テップＳ１５でｏｎｃｎｔが“０”と判断され、ステッ
プＳ２５、Ｓ２６、Ｓ３１と進み、何も出力されずに次
の記号に行く（この時の上記ステップＳ２５直前までの
共通マップ２２、及び出力マップ２３は図１０の第２記
号（Ａ）の行に示されたようになる）。

【００８５】次の記号も「Ａ」であるので、同様の処理
により、何も出力されない（この時のステップＳ２５直
前までの共通マップ２２、及び出力マップ２３は図１０
の第３記号（Ａ）の行に示されたようになる）。

【００８６】上記ステップＳ２５で、図１０の入力デー
タ２０の「Ｂ」が記号バッファ２１の先頭位置に来て、
共通マップ２２が“００１００００”になると、ステッ
プＳ２６、Ｓ２７、Ｓ３１を経て、ｌｅｎに「４」を設
定した後、ステップＳ６で出力マップ２３をクリアし、
その先頭ビットを“１”とする。ステップＳ７で記号
（変数）に「Ｂ」が設定される。ステップＳ８で共通マ
ップ２２のｉ（＝０）番目が既に“１”か否か判断され
る。判断はＮＯとなるので、ステップＳ９で記号（変
数）の記号（「Ｂ」）と記号バッファ２１のｉ（＝０）
番目の記号（「Ｂ」）が等しいか否かが判断される。判
断はＹＥＳなので、ステップＳ１１で出力マップ２３上
のｉ−ｊ番目（０番目）の位置のビットに“１”を立て
ると共に、共通マップ２２のｉ（＝０）番目のビットに
“１”を立て、ｏｎｃｎｔを「１」に設定する。この結
果、共通マップ２２は“１０１００００”、出力マップ
２３は“１００００００”となる。ステップＳ１２でｉ
を１つインクリメントし（ｉ＝１）、ステップＳ１３で
ｉ（＝１）がｌｅｎ（＝４）以上か否かが判断される。
判断はＮＯなのでステップＳ１４でｏｎｃｎｔがｏｎｃ
ｎｔの最大値より小さいか否かを判断する。今、ｏｎｃ
ｎｔは“１”なので、ステップＳ８に戻る。

【００８７】ステップＳ８では、共通マップ２２のｉ
（＝１）番目が既に“１”か否かの判断がされ、判断が
ＮＯとなってステップＳ９に進む。ステップＳ９では、
記号（変数）の記号（「Ｂ」）と記号バッファ２１のｉ
（＝１）番目の記号（「Ｃ」）とが比較される。判断は
ＮＯなのでステップＳ１２でｉを１つインクリメントし
（ｉ＝２）、ステップＳ１３でｉがｌｅｎ（＝４）以上
か否かが判断される。判断はＮＯとなり、ｏｎｃｎｔ
（＝１）がｏｎｃｎｔの最大値よりも小さいか否かが判
断される。判断はＹＥＳとなり、ステップＳ８に戻る。

【００８８】ステップＳ８で共通マップ２２のｉ（＝
２）番目には既に“１”が立っているか否かが判断され
るが、記号バッファ２１のｉ（＝２）番目は「Ａ」なの
で、既に共通マップ２２に“１”が立てられている。従
ってステップＳ１０でｊが１つインクリメントされ（ｊ
＝１）、ステップＳ１２でｉが１つインクリメントされ
（ｉ＝３）、ステップＳ１３でｉ（＝３）がｌｅｎ（＝
４）以上か否か判断される。判断はＮＯなので、ステッ
プＳ１４でｏｎｃｎｔ（＝１）がｏｎｃｎｔの最大値
（＝７）より小さいか判断される。判断はＹＥＳでステ
ップＳ８に戻る。

【００８９】ステップＳ８で共通マップ２２のｉ（＝
３）番目が既に“１”か判断されるが、判断の結果はＮ
Ｏとなる。ステップＳ９で記号（変数）の記号である
「Ｂ」と記号バッファ２１のｉ（＝３）番目の記号
（「Ｄ」）とが同じか否か判断され、判断はＮＯとな
る。ステップＳ１２でｉが１つインクリメントされ（ｉ
＝４）、ステップＳ１３でｉがｌｅｎ（＝４）以上とな
り、ステップＳ１５でｏｎｃｎｔが“０”か否かを判断
する。図１０の入力データ２０の中には「Ｂ」という記
号は１つしかないので、上述したように記号「Ｂ」に対
してはステップＳ１１の処理は１回のみ行われ、ｏｎｃ
ｎｔが１となっており、ステップＳ１５の判断はＮＯと
なる。そこで、記号「Ｂ」がステップＳ１６で出力され
る。

【００９０】次に、ステップＳ１７でｏｎｃｎｔが
“１”か否かを判断するが、今の場合、これに相当する
のでステップＳ２０以降の処理が行われる。従って、ス
テップＳ２０でフラグを“０”で出力する。ステップＳ
２１では、今処理した記号がデータファイル内の最後の
記号か否か（ｌｅｎが１か否か）が判断されるが、記号
「Ｂ」の処理の時点では最後の記号ではないので（ｌｅ
ｎ＝４であるので）、ステップＳ２５、Ｓ２６、Ｓ３１
の処理を順次行い、ステップＳ６に戻って次の記号を処
理する（上記ステップＳ２５直前の共通マップ２２、及
び出力マップ２３は図１０の第４記号（Ｂ）の行に示さ
れたようになる）。また、上記ステップＳ２５により、
共通マップ２２は“０１０００００”となり、記号バッ
ファ２１の先頭には「Ｃ」が来る。

【００９１】このように、図１０に示す入力データの場
合、記号「Ｂ」については図１０に示すように、記号
「Ｂ」と「０」のフラグのみが出力される。ステップＳ
６で出力マップ２３をクリアし、先頭ビットを“１”に
する。ステップＳ７で記号（変数）に記号バッファ２１
の０番目を設定し（今の場合、記号「Ｃ」）、変数ｉ、
ｊ、ｏｎｃｎｔをそれぞれ“０”に設定する。記号
「Ｃ」の場合には、上記ステップＳ３０でｌｅｎの値が
“３”になり、上記の記号「Ｂ」と同様に共通マップ２
２上で“１”が立てられるビットがｉ（＝０）番目のビ
ットとなる（この時の共通マップ２２、及び出力マップ
２３は図１０の第５記号（Ｃ）の行に記載されたように
なる）。そして、ステップＳ６に戻って次の記号の処理
をする。この結果、ステップＳ１６で記号「Ｃ」が出力
され、ステップＳ２０で“０”のフラグが出力される。
従って、図１０に示す入力データ２０の場合、記号
「Ｃ」については、図１０に示すように、上記記号
「Ｂ」と同様に、記号「Ｃ」と「０」のフラグのみが出
力される。

【００９２】ステップＳ６で、出力マップ２３をクリア
し、その先頭ビットを“１”にする。そして、ステップ
Ｓ７で記号（変数）の記号に記号バッファ２１の０番目
の記号（今度の場合には記号「Ａ」）が設定され、変数
ｉ、ｊ、ｏｎｃｎｔそれぞれを“０”に設定する。

【００９３】今度の記号「Ａ」の場合には、既に、前述
したようにビットマップの作成が行われており、上記ス
テップＳ６の前のステップＳ２５で、出力マップ２３が
“１００００００”に設定され、ステップＳ３１でｌｅ
ｎに“２”が設定される。このように、共通マップ２２
のｉ（＝０）番目が既に“１”に設定されているので、
ステップＳ８で判断がＹＥＳとなる。そして、ステップ
Ｓ１２で、ｉが１つインクリメントされ（ｉ＝１）、ス
テップＳ１３でｉ（＝１）がｌｅｎ（＝２）以上か否か
が判断される。判断はＮＯとなり、ｏｎｃｎｔ（＝０）
がｏｎｃｎｔの最大値より小さいか否かが判断されて、
ステップＳ８に戻る。ステップＳ８ではｉ（＝１）番目
が既に“１”か否かが判断されるが、判断はＮＯとな
り、ステップＳ９へ進む。記号（変数）の記号
（「Ａ」）と記号バッファ２１のｉ（＝１）番目の記号
（「Ｄ」）とが等しいか判断され、判断はＮＯとなる。
ステップＳ１２でｉが１つインクリメントされ（ｉ＝
２）、ステップＳ１３でｌｅｎ（＝２）以上か判断され
る。ステップＳ１３で記号（変数）の記号（「Ａ」）に
ついて記号バッファ２１内の記号を調べおわった（ｉが
ｌｅｎ以上）ことが判断されると、ステップＳ１５へ進
み、ｏｎｃｎｔが“０”のままなのでステップＳ１５で
判断がＹＥＳとなる。そして、以下のステップＳ２５、
Ｓ２６、Ｓ３１の処理を行い、何も出力しないでステッ
プＳ６へ進み、次の記号である「Ｄ」の処理へと進む
（上記ステップＳ２５直前の共通マップ２２、及び出力
マップ２３は図１０の第６記号（Ａ）の行に示されたよ
うになる）。

【００９４】ステップＳ６で出力マップ２３をクリア
し、先頭のビットを“１”とする。ステップＳ７で記号
（変数）の記号として記号バッファ２１の０番目の記号
「Ｄ」が設定され、変数ｉ、ｊ、ｏｎｃｎｔがそれぞれ
“０”に設定される。ステップＳ８で共通マップ２２の
ｉ（＝０）番目が既に“１”か否か判断されるが、この
時点で、共通マップ２２は“０００００００”となって
おり、“１”ではないのでステップＳ９に進む。記号
（変数）の記号（「Ｄ」）と記号バッファ２１のｉ（＝
０）番目の記号（「Ｄ」）が等しいか否か判断される
が、等しいのでステップＳ１１に進む。ステップＳ１１
では、出力マップ２３上にｉ−ｊ番目（０番目）の位置
へビットを立て、共通マップ２２上のｉ（＝０）番目の
位置へビットを立てる。そして、ｏｎｃｎｔを１つイン
クリメントし（ｏｎｃｎｔ＝１）、ステップＳ１２でｉ
を１つインクリメントし（ｉ＝１）、ステップＳ１３に
進む。この場合には、入力データ２０の最後の記号であ
るので、ｌｅｎは１となっており、ｉも“１”なので、
ステップＳ１５へ進む。以下、ステップＳ１６、Ｓ１
７、Ｓ２０、Ｓ２１と進む（この時の共通マップ２２、
及び出力マップ２３は図１０の第７記号（Ｄ）の行に示
されたようになる）。この結果、ステップＳ１６で、記
号「Ｄ」が出力され、ステップＳ２０で“０”のフラグ
が出力される。そして、ステップＳ２１で、ｌｅｎが
“１”なので、入力データ２０の圧縮処理が終了したも
のと判断して、データ圧縮処理を終了する。

【００９５】また、ステップＳ１７でｏｎｃｎｔが
“１”でない場合にも、ステップＳ１９でｌｅｎが１の
場合には、入力データ２０の圧縮処理が終了したことを
示すので、処理は終了となる。

【００９６】図１０には、入力データ２０の第１記号か
ら第７記号までの各記号を処理している時の共通マップ
２２と出力マップ２３及び、圧縮データ２５のそれぞれ
の最終結果がどのようになるかが示されている。このよ
うに、共通マップ２２で既に処理された記号の入力デー
タ２０内での位置を保持しておき、出力マップ２３内で
圧縮データとしてのビットマップを生成して、ｏｎｃｎ
ｔの値に応じて、｛記号、フラグ、オンカウント、ビッ
トマップ｝（ｏｎｃｎｔ≧２の場合）、または｛記号、
フラグ｝（ｏｎｃｎｔ＝１の場合）を出力することによ
り、記号列からなる入力データ２０の圧縮を行うことが
出来る。図１０では、共通マップ２２は第１記号から次
第に処理が進むにつれて、左にシフトしていくと共に、
記号バッファ２１内の処理した記号が存在する位置に対
応する位置のビットに“１”が立てられている。出力マ
ップ２３は各記号のビットマップを作成するための作業
バッファであり、共通マップ２２で既に“１”が立って
いる部分のビットを省略するために、共通マップ２２を
参照して作成される。すなわち、第２、３記号の「Ａ」
に対しては、第２、３記号がある位置に既に、共通マッ
プ２２内で“１”が立っているので、これら第２、３記
号については出力マップ２３内にビットマップが作成さ
れていない（全てのビットが“０”になっている）。

【００９７】なお、図１０の圧縮データ例には、オンカ
ウントのビット数（ビット幅）を示すデータが記載され
ていないが、実際には圧縮データ２５の先頭に３ビット
のビット幅を示すデータが出力される。図１１及び図１
２は、図７〜図９の方法で圧縮されたデータを復元する
処理のフローチャートである。

【００９８】図１３は、図１０の入力データ２０の圧縮
データ２５を復元する際の共通マップ２８等の様子を示
す図である。以下、図１１、１２のフローチャートを図
１３を参照しながら説明する。なお、図１３の圧縮デー
タ２５の例においては、オンカウントビット幅を示すデ
ータが省略されているが、実際には、圧縮データ２５の
先頭にオンカウントのビット幅が３ビットであることを
示すデータがある。

【００９９】復元処理を始めるとステップＳ４０で、圧
縮データ２５ファイルから圧縮データ２５の先頭にある
オンカウントのビット幅を取得し（３ビット）、フラグ
ｅｏｆを“０”に設定し、共通マップ２８をクリアす
る。ステップＳ４１で圧縮データ２５ファイルから圧縮
データ２５内の記号（今の場合、先頭の記号）を読み、
ステップＳ４２で圧縮データファイルの終わりか否かが
判断される。今の場合は圧縮データファイルの終わりで
はないので、ステップＳ４３に進む。ステップＳ４３で
は、変数ｉ、ｊを０に、ｂを“１”に設定し、記号の次
にあるフラグを読む。ここで、ｉは共通マップ２８のビ
ット位置を表し、ｊは出力された記号数を計数するため
のカウンタであり、ｂは圧縮データ２５内のビットマッ
プの各ビットの値が設定されるものである。

【０１００】なお、ｂを“１”に初期設定するのは、圧
縮データ２５におけるビットマップが、元のビットマッ
プの先頭の“１”のビットが削除されたものであるから
であり、この削除された“１”のビットい対応する記号
は、後述するステップＳ４８で復元され、その後、後述
するステップＳ５３で圧縮データ２５の各記号のビット
マップを先頭から順次１ビットづつ読み出す処理が開始
される。この事により、後述するステップＳ４５で設定
されるｏｎｃｎｔの値に等しい個数だけ、各記号が復元
される。

【０１０１】ステップＳ４４で上記フラグが“０”か否
かを判断し（すなわち、オンカウントとビットマップが
後ろに続いているかを判断し）、フラグが“０”の場合
には、ステップＳ４６でｏｎｃｎｔを“１”に設定し、
フラグが“０”でない場合には、ステップＳ４５でｏｎ
ｃｎｔを（オンカウント値＋２）とする。記号「Ａ」の
場合には、図１３の記号「Ａ」とフラグの後ろの３ビッ
トのオンカウント値が“０１０”であるので、ｏｎｃｎ
ｔは“４”となる。

【０１０２】ステップＳ４７で、ｂが“０”か否かが判
断される。今の場合、ステップＳ４３でｂ＝“１”とさ
れているので、判断はＮＯとなる。ステップＳ４８で、
共通マップ２８のｉ番目（今の場合、０番目）のビット
以降で最初の“０”のビット位置にｉの値を変える。現
在では共通マップ２８はクリアされたばかりなので、ｉ
は“０”に設定される（図１３の第１記号（Ａ）の上段
の共通マップ２８“０００００００”を参照）。更に、
共通マップ２８のｉ番目（今の場合、０番目）のビット
に“１”を設定し、記号バッファ２９のｉ記号目に先に
読み込んだ記号を格納する。そして、ｊを１だけインク
リメントする。これにより、記号バッファ２９の０番目
に「Ａ」という記号が格納される。

【０１０３】次に、ステップＳ５０で、ｉを１つインク
リメントし（ｉ＝１）、ステップＳ５１でｊ（＝１）が
ｏｎｃｎｔ（＝４）の値に等しいか否かを判断する。図
１３の圧縮データ２５の内、記号「Ａ」に関しては、ｏ
ｎｃｎｔが“４”であるのでステップＳ５１においては
判断は、ＮＯとなる。続いて、ステップＳ５２でｅｏｆ
が“１”か否かを判断するが、現在の場合はｅｏｆは
“０”に設定された状態なので判断はＮＯとなる。

【０１０４】次に、ステップＳ５３で、圧縮データファ
イルからビットマップの１ビットを読み込み、ステップ
Ｓ５４でＯＳから返されるステイタス情報により、圧縮
データファイルの終わりか否かを判断する。圧縮データ
ファイルの終わりでない場合には、ｂに、上記読んだビ
ットマップの１ビットの値を設定する。このとき読み込
まれるビットマップのビットは図１３の記号「Ａ」のビ
ットマップの１番目（最初のビット）であるので、
“１”である。

【０１０５】そして、ステップＳ４７に戻って、ｂが
“０”か否かを判断する。記号「Ａ」の場合、ビットマ
ップには先頭から２個の“１”が並んでいるので、ｂは
“０”ではない。従って、ステップＳ４８で、共通マッ
プ２８のｉ（＝１）番目以降のビットで最初の“０”の
ビット位置（ｉ＝１の位置）にｉの値を変える。ここで
は、ｉは“１”のままである。次に、共通マップ２８の
ｉ（＝１）番目のビットに“１”を立てる。そして、記
号バッファ２９のｉ（＝１）記号目に先に読んだ記号
（「Ａ」）を格納する。そして、ｊを１つインクリメン
トし（ｊ＝２）、ステップＳ５０に進む。ステップＳ５
０では、ｉを１つインクリメントし（ｉ＝２）、ステッ
プＳ５１でｊ（＝２）がｏｎｃｎｔ（＝４）に等しいか
否か判断される。判断はＮＯであるので、ステップＳ５
２で、ｅｏｆが“１”か否かが判断され、判断はＮＯと
なる。ステップＳ５３で、上記ビットマップの次の１ビ
ットを読み込み、ステップＳ５４でＯＳから返されるス
テイタス情報により、ファイルの終わりか否かを判断す
る。まだ、ファイルの終わりではないので、ステップＳ
５５で読んだビットマップの１ビットをｂに設定し、ス
テップＳ４７に戻る。このときステップＳ５３で読み込
まれるビットマップのビットは、図１３の記号「Ａ」の
ビットマップの２番目のビットであるので“１”であ
る。

【０１０６】すると、ステップＳ４７でｂが“０”であ
るか否かを判断するが、ｂ＝１であるので、判断はＮＯ
となる。ステップＳ４８で、共通マップ２８のｉ（＝
２）番目以降のビットで最初の“０”のビット位置（ｉ
＝２の位置）にｉの値を変える。そして、共通マップ２
８のｉ（＝２）番目の位置のビットに“１”を設定す
る。また、記号バッファ２９のｉ（＝２）記号目に先に
読み込んだ記号（「Ａ」）を格納し、ｊを１つインクリ
メントする（ｊ＝３）。次にステップＳ５０でｉを１つ
インクリメントし（ｉ＝３）、ステップＳ５１でｊ（＝
３）がｏｎｃｎｔ（＝４）に等しいか否か判断する。判
断はＮＯであるので、ステップＳ５２でｅｏｆが“１”
か否か判断する。ｅｏｆは“１”でないので、ステップ
Ｓ５３で圧縮データファイルから上記ビットマップの次
の１ビットを読む。ステップＳ５４で、ＯＳから返され
るステイタス情報により、圧縮データファイルの終わり
か判断されるが、圧縮データファイルの終わりではない
ので、ステップＳ５５に進んで、上記読んだビットマッ
プの１ビットをｂに設定する。この時、読み込まれるビ
ットは図１３の記号「Ａ」のビットマップの第３番目の
ビットであるので、ｂ＝０となる。そして、ステップＳ
４７に戻る。

【０１０７】ステップＳ４７でｂが“０”か否か判断さ
れるが、ｂ＝０であるので、ステップＳ４９に進む。ス
テップＳ４９で、共通マップ２８のｉ（＝３）番目以降
のビットで最初の“０”のビット位置にｉの値を変える
（ｉ＝３）。ステップＳ５１でｉが１つインクリメント
され（ｉ＝４）、ｊ（＝３）とｏｎｃｎｔ（＝４）とが
等しいか判断される（ステップＳ４９）。ｊとｏｎｃｎ
ｔは等しくないので、ステップＳ５２でｅｏｆが“１”
か否かを判断し、ｅｏｆ＝０なのでステップＳ５３に進
む。ステップＳ５３で圧縮データファイルから上記ビッ
トマップの次の１ビット（図１３の記号「Ａ」のビット
マップの４番目のビット）を読む。ステップＳ５４で、
ＯＳから返されるステイタス情報により、圧縮データフ
ァイルの終わりか否かが判断され、終わりでないので、
上記読み込んだビットマップの１ビット（“０”）がｂ
に設定され、ステップＳ４７に戻る。

【０１０８】ステップＳ４７でｂ＝０が判断されるの
で、ステップＳ４９で共通マップ２８のｉ（＝４）番目
以降のビットで最初の“０”のビット位置（４番目の位
置）にｉの値を変える（ｉ＝４）。ステップＳ５０でｉ
が１つインクリメントされ（ｉ＝５）、ステップＳ５１
でｊ（＝３）とｏｎｃｎｔ（＝４）とが等しいかが判断
される。判断はＮＯなので、ステップＳ５２でｅｏｆが
“１”か否かが判断される。判断はＮＯなので、圧縮デ
ータファイルから上記ビットマップの次の１ビットを読
み込む。図１３では、記号「Ａ」のビットマップの５番
目のビットを読み込む。ステップＳ５４で圧縮データフ
ァイルの終わりでないので、ステップＳ５５で、上記読
み込んだビットマップの１ビットをｂに設定する（ｂ＝
１）。そして、ステップＳ４７に戻る。

【０１０９】ステップＳ４７でｂは“０”でないことが
分かるので、ステップＳ４８に進む。ステップＳ４８で
は、共通マップ２８のｉ（＝５）番目以降のビットで最
初の“０”のビット位置にｉの値を変える（今の場合、
ｉ＝５）。また、共通マップ２８のｉ（＝５）番目の位
置のビットに“１”を立てる。更に、記号バッファ２９
のｉ（＝５）記号目に先に読み込んだ記号（「Ａ」）を
格納し、ｊを１つインクリメントする（ｊ＝４）。ステ
ップＳ５０でｉを１つインクリメントし（ｉ＝６）、ス
テップＳ５１でｊ（＝４）とｏｎｃｎｔ（＝４）とが等
しいか判断される。今度の場合には、互いに等しいので
判断はＹＥＳとなり、ステップＳ５８に進む。ステップ
Ｓ５８で、共通マップ２８の先頭から連続して“１”が
立っているビットの個数をｎ（今の場合３）として、記
号バッファ２９の先頭から記号（＝「Ａ」）をｎ個（３
個）出力する（図１３の第１記号（Ａ）の共通マップ２
８の中段“１１１００１０”を参照）。また、共通マッ
プ２８を左へｎ（＝３）ビットシフトし、右端のｎ（＝
３）ビットを“０”にする（図１３の第１記号の共通マ
ップ２８の下段“００１００００”を参照）。更に、記
号バッファ２９をｎ（＝３）記号分左へシフトする。ス
テップＳ５９で、ｅｏｆは“１”か否か判断されるが、
ｅｏｆは“１”ではないのでステップＳ４１に戻る。

【０１１０】ステップＳ４１では、圧縮データファイル
から次の記号を読み（図１３の圧縮データ２５の記号
「Ｂ」）、ステップＳ４２で、ＯＳから返されるステイ
タス情報により、圧縮データファイルの終わりか否かが
判断されるが、圧縮データファイルの終わりではないの
でステップＳ４３に進む。ステップＳ４３では、変数
ｉ、ｊをそれぞれ“０”とし、ｂを“１”とする。そし
て、圧縮データファイルからフラグを読み込む。この場
合、フラグは“０”である。従って、ステップＳ４６に
進み、ｏｎｃｎｔに“１”が設定される。ステップＳ４
７でｂが“０”か否か判断されるが、ステップＳ４３で
ｂ＝“１”とされているので、判断はＮＯとなる。次
に、ステップＳ４８に進んで、共通マップ２８のｉ（＝
０）番目以降のビットで、最初の“０”のビット位置に
ｉの値を変える。共通マップ２８は前述のステップＳ５
８でｎ（＝３）ビットシフトされているので、ｉ（＝
０）番目以降のビットで、最初の“０”のビット位置は
０番目で、ｉは“０”となる（図１３の第２記号（Ｂ）
の共通マップ２８の上段“００１００００”を参照）。
そして、共通マップ２８のｉ（＝０）番目のビットに
“１”が設定され（図１３の第２記号の共通マップ２８
の中段“１０１００００”を参照）、記号バッファ２９
のｉ（＝０）記号目に先に読み込んだ記号（「Ｂ」）を
格納し、ｊを１つインクリメントする（ｊ＝１）。ステ
ップＳ５０でｉを１つインクリメントし（ｉ＝１）、ス
テップＳ５１でｊ（＝１）がｏｎｃｎｔ（＝１）に等し
いか否かが判断される。ｊとｏｎｃｎｔが等しいので、
ステップＳ５８に進み、共通マップ２８の先頭から連続
して“１”が立っているビットの個数をｎ（＝１）とし
たとき、記号バッファ２９の先頭から記号（＝「Ｂ」）
をｎ（＝１）個出力する。また、共通マップ２８を左へ
ｎ（＝１）ビットシフトし、右端ｎ（＝１）ビットは
“０”とする（図１３の第２記号の下段の共通マップ２
８“０１０００００”を参照）。更に、記号バッファ２
９をｎ（＝１）記号分左へシフトする。そして、ステッ
プＳ５９に進む。ステップＳ５９では、ｅｏｆが“１”
か否かが判断され、“１”ではないので、ステップＳ４
１に戻る。

【０１１１】ステップＳ４１では、圧縮データファイル
から図１３の圧縮データ２５の次の記号「Ｃ」が読み込
まれる。ステップＳ４２で、ＯＳから返されるステイタ
ス情報により、圧縮データファイルの終わりか否かが判
断されるが、まだ終わりではないのでステップＳ４３に
進む。ステップＳ４３で変数ｉ、ｊを“０”に設定し、
ｂ＝“１”として、圧縮データファイルから次のフラグ
を読む。該フラグは図１３に示されているように“０”
である。ステップＳ４４でフラグの値が“０”か否かが
判断され、今の場合ＹＥＳなのでステップＳ４６でｏｎ
ｃｎｔを“１”に設定する。ステップＳ４７でｂ＝０か
否かが判断されるが、ｂ＝１であるので、ステップＳ４
８に進む。ステップＳ４８で、共通マップ２８のｉ（＝
０）番目以降のビットで最初の“０”のビット位置にｉ
の値を変える（ｉ＝０；図１３の第３記号（Ｃ）の上段
の共通マップ２８“０１０００００”を参照）。共通マ
ップ２８のｉ（＝０）番目に“１”が設定され（図１３
の第３記号の中段の共通マップ２８“１１０００００”
を参照）、記号バッファ２９のｉ（＝０）記号目に先に
読んだ記号（「Ｃ」）を格納する。そして、ｊを１つイ
ンクリメントする（ｊ＝１）。ステップＳ５０で、ｉを
１つインクリメントし（ｉ＝１）、ステップＳ５１でｊ
（＝１）とｏｎｃｎｔ（＝１）とが等しいか否かが判断
され、等しいのでステップＳ５８に進む。ステップＳ５
８で、共通マップ２８の先頭から連続して“１”が立っ
ているビットの個数をｎとしたとき、記号バッファ２９
の先頭から記号をｎ個出力する。今の場合、図１３の第
３記号の中段の共通マップ２８に示されているように、
“１”が２個続いている。これは、記号バッファ２９内
で記号「Ｃ」と第１記号である記号「Ａ」とが隣り合っ
て配列されていることを示している。従って、ｎは
“２”となり、記号バッファ２９の先頭から記号を２個
（記号「Ｃ」と記号「Ａ」）出力する（図１３の第３記
号の中段の共通マップ２８“１１０００００”を参
照）。また、共通マップ２８の左へｎ（＝２）ビットシ
フトし、右端ｎ（＝２）ビットを“０”にする（図１３
の第３文字の下段の共通マップ２８“０００００００”
を参照）。更に、記号バッファ２９をｎ（＝２）記号分
左へシフトする。ステップＳ５９に進み、ｅｏｆが
“１”か否か判断されるが、ｅｏｆは“０”なのでステ
ップＳ４１に戻る。

【０１１２】ステップＳ４１で、圧縮データファイルか
ら次の記号（図１３では「Ｄ」）を読み込み、ステップ
Ｓ４２で、ＯＳから返されるステイタス情報より、圧縮
データファイルの終わりか否かが判断される。圧縮デー
タファイルの終わりではないので、ステップＳ４３で、
ｉ＝０、ｊ＝０、ｂ＝“１”とし、圧縮データファイル
からフラグ（図１３の記号「Ｄ」の場合、“０”）を読
む。ステップＳ４４で、上記フラグの値が“０”である
か否かが判断されるが、上記フラグの値は“０”である
ので、ステップＳ４６に進む。ステップＳ４６ではｏｎ
ｃｎｔが“１”に設定され、ステップＳ４７でｂが
“０”か否かが判断される。ｂ＝“１”なので、ステッ
プＳ４８で共通マップ２８のｉ（＝０）番目以降で最初
の“０”の位置にｉの値を変える（ｉ＝０；図１３の第
４記号（Ｄ）の上段の共通マップ２８“００００００
０”を参照）。共通マップ２８のｉ（＝０）番目に
“１”を立て（図１３の第４記号の下段の共通マップ２
８“１００００００”を参照）、記号バッファ２９のｉ
（＝０）記号目に先に読んだ記号（「Ｄ」）を格納す
る。更にｊを１つインクリメントする（ｊ＝１）。ステ
ップＳ５０でｉを１つインクリメントし（ｉ＝１）、ス
テップＳ５１でｊ（＝１）とｏｎｃｎｔ（＝１）とが等
しいか否かが判断されて、ステップＳ５８に進む。ステ
ップＳ５８で共通マップ２８の先頭から連続して“１”
が立っているビットの個数をｎとしたとき（図１３の第
４記号の下段の共通マップ２８“１００００００”を参
照）、記号バッファ２９の先頭から記号をｎ（今の場
合、ｎ＝１）個出力する（記号「Ｄ」が出力される）。
共通マップ２８を左へｎ（＝１）ビットシフトし、右端
ｎ（＝１）ビットを“０”にする。更に、記号バッファ
２９をｎ（＝１）記号分左へシフトする。図１３で言え
ば、第４記号の下段の共通マップ２８に従って、記号
「Ｄ」が１個が出力されることになる。次に、ステップ
Ｓ５９に進み、ｅｏｆが“１”か否かが判断され、
“１”ではないので、ステップＳ４１に戻る。

【０１１３】ステップＳ４１で圧縮データファイルから
次の記号が読まれるが、次の記号は無いので、ステップ
Ｓ４２でファイルの終わりであることが判断され処理は
終了する。

【０１１４】図１３の場合には、圧縮データ２５の最後
がビットマップを有しない記号であったが、ビットマッ
プを有する記号であった場合には、ステップＳ５４で、
ＯＳから返されるステイタス情報より、圧縮データファ
イルの終わりか否かを判断し、終わりであれば、ステッ
プＳ５６でｅｏｆを“１”に設定すると共に、ステップ
Ｓ５７でｂに“１”を設定する。ここで、ｂに“１”を
設定するのは、図５（ｂ）のデータ圧縮方法において圧
縮率の向上のために削除された元のビットマップ（図４
参照）の“１”のビットを復元するためである。そし
て、ステップＳ４７、Ｓ４８、Ｓ５０、Ｓ５１、及びＳ
５８を経て、ステップＳ５９に処理が至ったときに、処
理を終了する。

【０１１５】図１３の共通マップ２８は、第１、２、３
記号に対応するものは、上段が最初のステップＳ４８の
前の状態、中段がステップＳ５８の前の状態、下段がス
テップＳ５８の後の状態である。また、第４記号「Ｄ」
に対応するものは、上段がステップＳ４８の前の状態、
下段がステップＳ４８の後の状態である。

【０１１６】このように、共通マップ２８という作業バ
ッファを設け、先に配置された記号の位置を記録してお
くことにより、順次圧縮データ２５を読んで記号バッフ
ァ２９内の共通マップ２８内の“１”が立っていないビ
ットに対応する部分に、後から読み込んだ記号を配置す
るように処理することにより、ビットマップ形式で圧縮
されたデータを復元することができる。

【０１１７】上記の説明においては、特定の実施形態を
例に説明したが、本発明はこれら具体的な実施の形態に
のみ限定されるべきではなく、本発明の要旨から離れる
ことの無い範囲で当業者により変形その他による実施が
可能であるが、これらの変形例も本発明の範囲と考えら
れるべきである。

【０１１８】

【発明の効果】本発明によれば、圧縮すべきデータの量
が少なくても効果的なデータ圧縮方法を提供することが
出来る。

【０１１９】また、本発明のデータ圧縮方法によれば、
如何なるデータ量のデータファイルも効果的に圧縮でき
るので、データを記録する記録媒体の記憶領域を有効に
使用することができる。

【０１２０】更に、データ通信を行う場合においても、
データを効率的に圧縮して送受信することができるの
で、通信コストを下げることができる。

【図面の簡単な説明】

【図１】本発明の原理構成図である。

【図２】本発明のデータ圧縮処理を行うための装置構成
の一例である。

【図３】本発明のデータ圧縮方法を説明する図（その
１）である。

【図４】本発明のデータ圧縮方法を説明する図（その
２）である。

【図５】本発明のデータ圧縮方法を説明する図（その
３）である。

【図６】本発明の一実施形態のデータ圧縮／復元処理の
概念を説明する図である。

【図７】本発明の一実施形態であるデータ圧縮処理を説
明するフローチャートの一例（その１）である。

【図８】本発明の一実施形態であるデータ圧縮処理を説
明するフローチャートの一例（その２）である。

【図９】本発明の一実施形態であるデータ圧縮処理を説
明するフローチャートの一例（その３）である。

【図１０】本発明の一実施形態であるデータ圧縮処理を
説明するためのデータのサンプルを示す図である。

【図１１】本発明の一実施形態であるデータ復元処理を
説明するフローチャートの一例（その１）である。

【図１２】本発明の一実施形態であるデータ復元処理を
説明するフローチャートの一例（その２）である。

【図１３】本発明の一実施形態であるデータ復元処理を
説明するためのデータのサンプルを示す図である。

【符号の説明】

３入力データ取得手段４ビットマップ生成手段５出力手段１０ＲＡＭ１１ＲＯＭ１２ＣＰＵ１３入出力装置１４記録媒体読み取り装置１５記録媒体１６通信インタフェース１７データベース（記録媒体；プログラム提供
者）１８バス１９ネットワーク２０入力データ２１記号バッファ２２共通マップ２３出力マップ２４記号２５圧縮データ２６記号２７ビットマップ読み込み変数２８共通マップ２９記号バッファ３０復元データ

Claims

【特許請求の範囲】

【請求項１】（ａ）圧縮すべきデータを読み込むステッ
プと、（ｂ）読み込んだデータに含まれる記号を取得するステ
ップと、（ｃ）該取得した記号の該読み込んだデータ内での存在
する位置を表すビットマップを生成するステップと、（ｄ）前記取得した記号と前記ビットマップとを組み合
わせて、圧縮データとして出力するステップを、備えることを特徴とするデータ圧縮方法。
【請求項２】前記ステップ（ｃ）において、前記ビット
マップは前記取得した記号の前記存在位置を前記読み込
んだデータの先頭から後尾に向かう順番で表すことを特
徴とする請求項１に記載のデータ圧縮方法。
【請求項３】前記ステップ（ｃ）に続いて実行される
（ｅ）前記ビットマップの内、前記取得した記号が存在
することを示す最後尾のビットから前記ビットマップの
最後尾まで連続する前記取得した記号が存在しないこと
を示すビットを前記ビットマップから削除するステップ
と、（ｆ）前記削除により得られた新たなビットマップのビ
ット長を表すカウンタ値を算出するステップを更に備
え、前記ステップ（ｄ）においては、前記取得した記号と、
前記ステップ（ｆ）において作成されたビットマップ
と、前記カウント値とを組み合わせて、圧縮データとし
て出力することを特徴とする請求項２に記載のデータ圧
縮方法。
【請求項４】前記読み込んだデータの先頭から出現順に
各記号を取得し、該各記号に対して、前記ステップ
（ｃ）、（ｅ）、（ｆ）、（ｄ）からなる圧縮処理を順
に実行することによって読み込んだデータを圧縮するこ
とを特徴とする請求項３に記載のデータ圧縮方法。
【請求項５】前記ステップ（ｅ）、前記ステップ（ｆ）
の間で実行される（ｇ）先立って圧縮処理された記号が
前記読み込んだデータ内に占める位置を、後に圧縮処理
される記号に対応するビットマップから削除するステッ
プを更に備えることを特徴とする請求項４に記載のデー
タ圧縮方法。
【請求項６】前記ステップ（ｇ）と前記ステップ（ｆ）
の間で実行される（ｈ）前記ビットマップの先頭に存在
する、該ビットマップに対応する記号が存在することを
示すビットを削除するステップを更に備えることを特徴
とする請求項５に記載のデータ圧縮方法。
【請求項７】前記取得した同一の記号が前記読み込んだ
データ内で離れて配置されている場合に、前記同一の記
号それぞれに対し別個に圧縮処理を行うことを特徴とす
る請求項６に記載のデータ圧縮方法。
【請求項８】（ｉ）ある記号に対応する前記カウンタ値
と前記ビットマップとが圧縮データとして記録されてい
るか否かを示すフラグを、該記号と組み合わせて圧縮デ
ータとして出力するステップを更に備えることを特徴と
する請求項７に記載のデータ圧縮方法。
【請求項９】所定の数の記号を格納する記号バッファに
圧縮すべきデータの一部を読み込み、前記記号バッファ
内に前記圧縮すべきデータをスライド入力させることに
よって、順次圧縮すべきデータに対し圧縮処理を行うこ
とを特徴とする請求項１〜８のいずれか１つに記載のデ
ータ圧縮方法。
【請求項１０】前記カウンタ値は、前記ビットマップに
よって復元されるべき前記取得した記号の数を表すこと
を特徴とする請求項３〜９のいずれか１つに記載のデー
タ圧縮方法。
【請求項１１】圧縮すべきデータを読み込み、読み込ん
だデータに含まれる記号を取得する入力データ取得手段
と、前記取得した記号の読み込んだデータ内での存在位置を
表すビットマップを生成するビットマップ生成手段と、前記取得した記号と前記ビットマップとを組み合わせ
て、圧縮データとして出力する出力手段とを備えること
を特徴とするデータ圧縮装置。
【請求項１２】前記ビットマップは前記取得した記号の
前記存在位置を前記読み込んだデータの先頭から後尾に
向かう順番で表すことを特徴とする請求項１１に記載の
データ圧縮装置。
【請求項１３】前記ビットマップの内、前記取得した記
号が存在することを示す最後尾のビットから前記ビット
マップの最後尾まで連続する前記取得した記号が存在し
ないことを示すビットを前記ビットマップから削除する
削除手段と、該削除によって得られた新たなビットマップのビット長
を表すカウンタ値を算出するカウンタ値算出手段を更に
備え、前記出力手段は、前記取得した記号と前記カウン
タ値と前記削除手段によって得られたビットマップとを
組み合わせて、圧縮データとして出力することを特徴と
する請求項１２に記載のデータ圧縮装置。
【請求項１４】前記カウンタ値は、前記ビットマップに
おける前記取得した記号が存在することを示すビットの
数から２を引いた数を表すことを特徴とする請求項１３
に記載のデータ圧縮装置。
【請求項１５】前記読み込んだデータの先頭から出現順
に各記号を取得し、該各記号に対して、前記ビットマッ
プ生成手段と、前記出力手段と、前記削除手段と、カウ
ンタ値算出手段とによって実行される圧縮処理を順に実
行することによって読み込んだデータを圧縮することを
特徴とする請求項１３に記載のデータ圧縮装置。
【請求項１６】先立って圧縮処理された記号が前記読み
込んだデータ内に占める位置を、後に圧縮処理される記
号に対応するビットマップから削除する冗長ビット削除
手段を更に備え、前記出力手段は、該冗長ビット削除手段によって得られ
たビットマップを圧縮データとして出力することを特徴
とする請求項１５に記載のデータ圧縮装置。
【請求項１７】前記ビットマップの先頭に存在する、該
ビットマップに対応する記号が存在することを示すビッ
トを削除する先頭ビット削除手段を更に備え、前記出力手段は、該先頭ビット削除手段によって得られ
たビットマップを圧縮データとして出力することを特徴
とする請求項１６に記載のデータ圧縮装置。
【請求項１８】前記取得した同一記号が前記読み込んだ
データ内で離れて配置されている場合に、前記同一記号
それぞれに対し別個に圧縮処理を行うことを特徴とする
請求項１７に記載のデータ圧縮装置。
【請求項１９】ある記号に対応して前記カウンタ値と前
記ビットマップとが圧縮データとして記録されているか
否かを示すフラグを、該記号と組み合わせて圧縮データ
として出力するフラグ出力手段を更に備えることを特徴
とする請求項１８に記載のデータ圧縮装置。
【請求項２０】コンピュータに所定の機能を実現させる
ためのプログラムを記録したコンピュータ読み取り可能
な記録媒体であって、コンピュータに、圧縮すべきデータを読み込ませる機能と、読み込んだデータに含まれる記号を取得させる機能と、該取得した記号の読み込んだデータ内に存在する位置を
ビットマップで表させる機能と、取得した記号と前記ビットマップとを組み合わせて、圧
縮データとして出力させる機能を実現させるためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒
体。
【請求項２１】前記ビットマップの生成機能が、前記取
得した記号の前記存在位置を前記読み込んだデータの先
頭から後尾に向かう順番で表すビットマップを生成させ
る機能であるプログラムを記録した請求項２０に記載の
コンピュータ読み取り可能な記録媒体。
【請求項２２】前記コンピュータに、前記ビットマップ
の内、前記取得した記号が存在することを示す最後尾の
ビットから前記ビットマップの最後尾まで連続する前記
取得した記号が存在しないことを示すビットをビットマ
ップから削除させる機能と、前記削除機能によって得られたビットマップのビット長
を表すカウンタ値を作成する機能と、前記カウンタ値を前記取得した記号と組み合わせて圧縮
データとして出力させる機能を更に実現させるためのプ
ログラムを記録した請求項２１に記載のコンピュータ読
み取り可能な記録媒体。
【請求項２３】前記カウンタ値の作成機能が、前記削除
機能によって得られたビットマップにおける前記取得し
た記号が存在することを示すビットの数から１を引いた
数を表すカウンタ値を作成させる機能であるプログラム
を記録する請求項２２に記載のコンピュータ読み取り可
能な記録媒体。
【請求項２４】前記コンピュータに、前記読み込んだデ
ータの先頭から出現順に記号を取得させる機能と、該取得順に、前記各記号に対して、上記各機能から成る
圧縮処理を施すことによって前記読み込んだデータを圧
縮させる機能を更に実現させるためのプログラムを記録
した請求項２２に記載のコンピュータ読み取り可能な記
録媒体。
【請求項２５】前記コンピュータに、先立って圧縮処理
された記号が前記読み込んだデータ内に占める位置を、
後に圧縮処理される記号に対応するビットマップから削
除させる機能を更に実現させるためのプログラムを記録
した請求項２４に記載のコンピュータ読み取り可能な記
録媒体。
【請求項２６】前記コンピュータに、前記ビットマップ
の先頭に存在する、該ビットマップに対応する記号が存
在することを示すビットを削除させる機能を更に実現さ
せるためのプログラムを記録した請求項２５に記載のコ
ンピュータ読み取り可能な記録媒体。
【請求項２７】前記コンピュータに、前記取得した同一
記号が前記読み込んだデータ内で離れて配置されている
場合に、前記同一記号それぞれに対し別個に圧縮処理を
行わせる機能を更に実現させるためのプログラムを記録
する請求項２６に記載のコンピュータ読み取り可能な記
録媒体。
【請求項２８】前記コンピュータに、ある記号に対応す
る前記カウンタ値と前記ビットマップとが圧縮データと
して記録されているか否かを示すフラグを前記取得した
記号と組み合わせて圧縮データとして出力させる機能を
更に実現させるためのプログラムを記録する請求項２７
に記載のコンピュータ読み取り可能な記録媒体。
【請求項２９】（ａ）圧縮すべきデータを読み込むステ
ップと、（ｂ）読み込んだデータに含まれる記号を取得
するステップと、（ｃ）該取得した記号の該読み込んだ
データ内での存在位置を表すビットマップを生成するス
テップと、（ｄ）前記取得した記号と前記ビットマップ
とを組み合わせて、圧縮データとして出力するステップ
を備えるデータ圧縮方法によって生成された圧縮データ
を読み込むステップと、前記圧縮データから前記記号と前記記号に対応する前記
ビットマップを読み取るステップと、前記ビットマップ
で指定される位置に前記記号を出力するステップを備え
るデータ復元方法。
【請求項３０】圧縮すべきデータを読み込み、読み込ん
だデータに含まれる記号を取得する入力データ取得手段
と、前記取得した記号の読み込んだデータ内での存在位
置を表すビットマップを生成するビットマップ生成手段
と、前記取得した記号と前記ビットマップとを組み合わ
せて、圧縮データとして出力する出力手段とを備えるデ
ータ圧縮装置によって生成された圧縮データを読み込む
読み込み手段と、前記圧縮データから前記記号と前記記号に対応する前記
ビットマップを読み取り、前記ビットマップで指定され
る位置に前記記号を出力する復元データ出力手段を備え
ることを特徴とするデータ復元装置。
【請求項３１】コンピュータに所定の機能を実行させる
ためのプログラムを記録したコンピュータ読み取り可能
な記録媒体であって、該コンピュータに、圧縮すべきデータを読み込ませる機能と、読み込んだデ
ータに含まれる記号を取得させる機能と、該取得した記
号の読み込んだデータ内での存在位置を表すビットマッ
プを生成させる機能と、前記取得した記号と前記ビット
マップとを組み合わせて、圧縮データとして出力させる
機能を備えるプログラムによって生成された圧縮データ
を読み込ませる機能と、前記圧縮データから前記記号と前記記号に対応する前記
ビットマップを読み取らせ、前記ビットマップで指定さ
れる位置に前記記号を出力させることによって前記圧縮
データを復元させる機能を実現させるためのプログラム
を記録したコンピュータ読み取り可能な記録媒体。