JPH06290020A

JPH06290020A - データ圧縮方法

Info

Publication number: JPH06290020A
Application number: JP5072675A
Authority: JP
Inventors: Takeshi Ito; 健伊藤; Akitoshi Yamamoto; 彰利山本
Original assignee: Fujitsu Social Science Labs Ltd
Current assignee: Fujitsu Social Science Labs Ltd
Priority date: 1993-03-31
Filing date: 1993-03-31
Publication date: 1994-10-18
Anticipated expiration: 2011-12-18
Also published as: JP2564749B2

Abstract

(57)【要約】【目的】本発明は、データを圧縮するデータ圧縮方法
に関し、データを区切って繰り返しが存在したときに辞
書データとこの辞書データの辞書番号および連続回数で
表現し、一方、繰り返しが存在しないときに実データで
表現し、繰り返しデータが部分的に存在するデータを効
率的かつ高速に圧縮／展開を行なうことを目的とする。【構成】圧縮対象の元データ１を所定ドット毎に区切
ったデータと同一データが連続して繰り返すと検出され
たときに、当該データを本辞書８に１つ登録すると共に
本辞書８の辞書番号および連続回数を本テーブル９に登
録し、一方、同一データが繰り返さなかった検出された
ときに、当該データを本テーブル９に登録するように構
成する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データを圧縮するデー
タ圧縮方法に関するものである。ある種の特性を持つデ
ータを高速可逆展開を必要とするシステムがある。この
システムは、ある種の特性として幾何学的なパターンの
中に複雑なパターン（写真データなど）が入り込んだよ
うなデータを圧縮して展開するものであって、写真デー
タなどの繰り返しのないデータは圧縮することなくその
ままとし、圧縮し易い部分のみ効率的に圧縮するという
要望がある。

【０００２】

【従来の技術】従来、圧縮技法として、辞書登録法およ
び連長圧縮法というものが存在する。辞書登録法は、同
じパターンが現れるデータを辞書として登録し、その辞
書の番号などを実データの代わりに持つ方法である。こ
れは、圧縮率が高いため、通信におけるデータ転送やデ
ータのバックアップなどに使用している。

【０００３】連長圧縮法は、同じパターンが続くデータ
の場合に、そのデータが何回続くかをデータとして持つ
方法である。これは、データ構造が簡単で、展開が非常
に速いため、リアルタイムで高速に展開する必要がある
場合に良く用いられる。

【０００４】

【発明が解決しようとする課題】上述した従来の辞書登
録法によれば、圧縮率は良いが、圧縮／展開の速度が非
常に遅いので、リアルタイムに展開を行いたいアプリケ
ーションなどでは殆ど使用できないという問題がある。

【０００５】連長圧縮法は、速度が非常に速いが、その
性質上、同じデータが連なって入ってこなければ圧縮で
きず、横にデータが連なっていない場合には逆効果とな
ってしまう問題がある。また、ある種の特性、例えば１
６ドット毎に同じパターンが続く可能性が高く圧縮し易
い部分と、し難い部分とが交互にあるなどが判明してい
る場合でも、この特性を利用して圧縮することができな
いという問題もあった。

【０００６】本発明は、これらの問題を解決するため、
データを区切って繰り返しが存在したときに辞書データ
とこの辞書データの辞書番号および連続回数で表現し、
一方、繰り返しが存在しないときに実データで表現し、
繰り返しデータが部分的に存在するデータを効率的かつ
高速に圧縮／展開を行なうことを目的としている。

【０００７】

【課題を解決するための手段】図１は、本発明の原理構
成図を示す。図１において、仮辞書５は、圧縮対象の元
データ１を所定ドット毎に区切ったデータおよび連長回
数を登録するものである。

【０００８】仮テーブル６は、データのハッシュ値およ
びオフセット値を登録するものである。本辞書８は、デ
ータを登録するものである。

【０００９】本テーブル９は、連長回数が１回のデー
タ、および連長回数が２回以上のデータの辞書番号を登
録するものである。

【００１０】

【作用】本発明は、図１に示すように、圧縮対象の元デ
ータ１を所定ドット毎に区切ったデータについて同一デ
ータが連続して繰り返すと検出されたときに、当該デー
タ１を本辞書８に登録すると共に本辞書８の辞書番号お
よび連長回数を本テーブル９に登録し、一方、同一デー
タが繰り返さない検出されたときに、当該データを本テ
ーブル９に登録するようにしている。

【００１１】また、圧縮対象の元データ１を所定ドット
毎に区切ったデータについて、ハッシュ値を算出して同
一データが連続して存在すると検出されたときに当該デ
ータの連長回数を＋１し、一方、連続して存在しないと
検出されたときにデータを登録および連長回数を１にし
て仮辞書５に登録すると共に、圧縮対象のデータの順に
ハッシュ値とオフセット値を順次仮テーブル６に登録
し、この仮テーブル６から順次取り出したハッシュ値と
オフセット値をもとに、仮辞書５を参照して連続回数が
２以上のときにデータを本辞書８に登録およびこの本辞
書８の辞書番号および連長回数を本テーブル９に登録
し、一方、連長回数が１のときにデータを本テーブル９
に登録するようにしている。

【００１２】この際、ハッシュ値の算出として、データ
から所定ドット毎のドット位置の値を加算して所定数
（ハッシュテーブルの大きさ）で割算してその余りをハ
ッシュ値とし、周期的なパターンが同じハッシュ値とな
らないようにしている。

【００１３】また、本テーブル９から取り出したデータ
に複数の連長回数が設定されていたときに、本辞書８か
ら該当するデータを取り出してバッファにその連長回数
分だけ展開し、一方、連長回数が設定されていなかった
ときにデータをそのままバッファに展開し、データ展開
を行なうようにしている。

【００１４】従って、データを区切って繰り返しが存在
したときにデータとこのデータの辞書番号および連長回
数で表現し、一方、繰り返しが存在しないときに実デー
タで表現することにより、繰り返しデータが部分的に存
在するデータを効率的かつ高速に圧縮／展開することが
可能となる。

【００１５】

【実施例】次に、図１から図９を用いて本発明の実施例
の構成および動作を順次詳細に説明する。

【００１６】図１は、本発明の原理構成図を示す。図１
において、元データ１は、圧縮対象のデータであって、
例えば画像データである。

【００１７】メモリ２は、作業用一時データ３および圧
縮後データ７などを格納するメモリである。作業用一時
データ３は、元データ１を圧縮するために、一時的に生
成するデータであって、ハッシュテーブル４、仮辞書
５、および仮テーブル６から構成されるものである。

【００１８】ハッシュテーブル４は、高速に検索するた
めのテーブルであって、ここでは、元データ１を１６ド
ット毎に区切ったデータからハッシュ値を求めて、当該
ハッシュテーブル４のハッシュ値からリンクして格納
し、高速に検索し得るようにするためのものである。

【００１９】仮辞書５は、元データを区切ったデータに
ついて、ハッシュテーブル４からリンクして格納したも
のである。仮テーブル６は、圧縮対象の元データ１を所
定ドット毎に区切ったデータに対する、仮辞書５に格納
したハッシュ値とオフセット値を格納するものである。

【００２０】圧縮後データ７は、圧縮した後のデータで
あって、ここでは、本辞書８および本テーブル９から構
成されるものである。本辞書８は、元データ１を所定ド
ット毎に区切ったデータについて、連続した繰り返しが
あった場合に、当該データを登録するものである。

【００２１】本テーブル９は、元データ１を所定ドット
毎に区切ったデータについて、連続した繰り返しがなか
った場合には当該データをそのまま格納し、一方、連続
した繰り返しがあった場合には本辞書８に登録したデー
タの辞書番号、連長回数を格納するものである。

【００２２】圧縮主制御部１１は、元データ１を圧縮し
て本辞書８および本テーブル９にデータや、辞書番号、
連長回数などの登録を制御するものであって、仮テーブ
ル作成部１２、仮辞書登録部１３、ハッシュリスト作成
部１４、ハッシュ値計算部１５、本辞書登録部１６、お
よび本テーブル作成部１７などを統括制御するものであ
る。

【００２３】仮テーブル作成部１２は、仮テーブル６を
作成するものであって、元データ１を所定ドット毎に区
切ったデータについて、仮辞書５に登録した当該データ
のハッシュ値およびオフセット値を登録して仮テーブル
６を作成するものである。

【００２４】仮辞書登録部１３は、元データ１を所定ド
ット毎に区切ったデータを仮辞書５に登録するものであ
る。ハッシュリスト作成部１４は、ハッシュリストを作
成するものである。

【００２５】ハッシュ値計算部１５は、元データ１を所
定ドット毎に区切ったデータのハッシュ値を計算するも
のである。ハッシュ値は、後述する図９に示すように、
例えば１６ドット（１６バイト）を４ドット毎に区切っ
て１ドット目、６ドット目、１１ドット目、１６ドット
目のデータ（１バイトデータ）を取り出し、これらデー
タを加算して所定の値（ここでは１２８）で除算してそ
の余りをハッシュ値として計算する。

【００２６】本辞書登録部１６は、仮辞書５および仮テ
ーブル６から取り出したデータについて、繰り返しがな
い場合に当該データを本辞書８に登録するものである。
本テーブル作成部１７は、本テーブル９を作成するもの
である（図５参照）。

【００２７】展開制御部１８は、圧縮したデータ（本辞
書８、本テーブル９）について、展開して元のデータを
得るものである。展開部１９は、圧縮されているデータ
を展開してバッファに格納するものである（図７参
照）。

【００２８】バッファ２０は、データを一時的に格納す
るものである。ディスプレイ２１は、バッファ２０に格
納された展開後のデータをディスプレイ上に表示するも
のである。

【００２９】以下順次詳細に説明する。図２は、本発明
の動作説明フローチャート（圧縮）を示す。図２におい
て、Ｓ１は、圧縮対象データ（元データ１）の取り出し
を行なう。

【００３０】Ｓ２は、１６ドット分毎に区切る。これ
は、Ｓ１で取り出しを行った圧縮対象データ（元データ
１）について、使用システムの中で割り切れるデータが
多いドット数としてここでは１６ドットを選び、区切っ
たものである。各ドットが１バイトの階調（あるいは色
調など）で表現されているため、データとしては、１６
バイト分毎に区切ることとなる。

【００３１】Ｓ３は、ハッシュ値を計算する（０〜
ｎ）。これは、Ｓ２で区切った１６バイトのデータにつ
いて、後述する図９に示すように、４バイト毎に合計４
バイトを取り出し、これらをもとにハッシュ値を計算、
例えばこれら４バイトの合計値をハッシュテーブルのサ
イズで除算してその余りをハッシュ値とする。

【００３２】Ｓ４は、仮辞書５に同データが存在するか
判別する。これは、Ｓ３で計算したハッシュ値をもと
に、図３の（ａ）のハッシュテーブル４からリンクする
テーブル（仮辞書５）を検索して同データが存在するか
判別する。ＹＥＳの場合には、同データが存在したの
で、Ｓ８に進む。一方、ＮＯの場合には、同データが存
在しないと判明したので、Ｓ５に進む。

【００３３】Ｓ５は、新規登録できる余裕があるか判別
する。ＹＥＳの場合には、テーブル（仮辞書５）に新規
登録できる余裕があると判明したので、Ｓ７に進む。一
方、ＮＯの場合には、Ｓ６に進む。

【００３４】Ｓ６は、ｈａｓｈテーブル（ハッシュテー
ブル）に追加する（同じサイズ分作る）。これは、図３
の（ａ）に示すように、テーブルに新規登録する余裕が
なかったので、新規に次のブロック（仮辞書５）を作成
してリンクする。

【００３５】Ｓ７は、仮辞書５に辞書データ新規登録す
る。これは、Ｓ６で新規に作成した仮辞書５あるいは空
の仮辞書５にデータを新規登録する。Ｓ８は、仮テーブ
ル６にハッシュ値とオフセット番号を登録する。これ
は、データを仮辞書５に登録したので、この登録したデ
ータのハッシュ値およびオフセット番号を、仮テーブル
６に登録する。

【００３６】Ｓ９は、仮辞書参照回数をカウントＵＰす
る。これは、仮辞書５中のデータについて、参照された
回数（新規登録のときは１、同一データが現れる都度＋
１）にして登録する。これにより、同一データが現れた
ときに仮辞書５の同データの参照回数がその回数にカウ
ントＵＰされることとなる。

【００３７】Ｓ１０は、データがまだ存在するか判別す
る。ＹＥＳの場合には、次のデータについてＳ１以降を
繰り返す。一方、ＮＯの場合には、圧縮対象のデータに
ついて終了したので、Ｓ１１に進む。

【００３８】Ｓ１１は、２度以上参照される辞書の本辞
書登録を行なう。これは、後述するように、Ｓ１からＳ
１０のＹＥＳによって作成した仮テーブル６の順序で、
仮辞書５中で２度以上の参照の辞書（データ）を、本辞
書８に登録する（図５を用いて詳述する）。

【００３９】Ｓ１２は、本辞書番号使用の本テーブル作
成、同時に辞書番号羅列データの連長圧縮を行なう。こ
れは、仮テーブル６の順序で、仮辞書５を参照しつつ、
参照回数が１回のデータはそのまま本テーブル９に登録
し、２回以上のデータは本辞書８に登録してその辞書番
号を本テーブル９に登録するかのいずれかを順次繰り返
し、同時に連長圧縮を行なう（図５を用いて詳述す
る）。

【００４０】以上によって、圧縮対象のデータについ
て、ここでは、１６ドット分毎に区切り、ハッシュ値を
計算してハッシュテーブルからリンクする仮辞書５に登
録およびそのハッシュ値とオフセット番号を仮テーブル
６に登録する。次にこの登録し仮テーブル６の順序で仮
辞書５を参照しつつ、参照回数が１回のデータはそのま
ま本テーブル９に登録し、一方、２回以上のデータを本
辞書８に登録すると共にその辞書番号を本テーブル９に
登録するかのいずれかを繰り返し、圧縮した結果であ
る、本テーブル９および参照回数が２回以上のデータを
登録した本辞書８を作成したこととなる。これにより、
参照回数が１回のデータはそのまま本テーブル９に登録
し、参照回数が２回以上のデータは連長圧縮して本テー
ブル９に登録することとなり、効率的な圧縮を行なうこ
とが可能となる。

【００４１】図３は、本発明の仮辞書例を示す。これ
は、検索を高速に行なうために、ハッシュテーブル４の
ハッシュ値にリンクしてデータを登録し、仮辞書５を作
成したものである。

【００４２】図３の（ａ）は、仮辞書例を示す。この仮
辞書５は、図示のように、ハッシュテーブル４のハッシ
ュ値（ここでは０から１２７）からリンクして、２５６
個のエントリをそれぞれ登録できるようにしてある。２
５６個のエントリが一杯になった場合には、更に２５６
個のエントリからなるブロックを図示のようにリンクす
る。

【００４３】図３の（ｂ）は、ｄｉｃ構造体の内容例を
示す。このｄｉｃ構造体は、図３の（ａ）の仮辞書５の
各エントリの構造体であって、・参照回数［２バイト］・辞書データ（圧縮対象のデータ）［１６ドット分］を登録する。ここで、参照回数は、圧縮対象のデータ
（元データ１）を１６ドット分毎に区切ったときに、同
一データが現れたときの回数である。この参照回数の欄
を設けて、同一データが現れたとき（図２のＳ４のＹＥ
Ｓのとき）、データを登録することなくこの参照回数を
＋１してその連続する回数を記憶することができる。

【００４４】図４は、本発明の仮テーブル例を示す。こ
れは、圧縮対象データを１６ドット分毎に区切ったデー
タについて、図３の仮辞書５に登録あるいは参照回数が
２回以上のときは参照回数のみを＋１し、そのときのハ
ッシュ値およびオフセット番号（ハッシュテーブル４の
ハッシュ値からリンクしたエントリの順番）を仮テーブ
ル６に順次登録したものである（図２のＳ８参照）。

【００４５】図５は、本発明の動作説明フローチャート
（本辞書／本テーブル登録）を示す。これは、図３の仮
辞書５および図４の仮テーブル６をもとに、本辞書８お
よび本テーブル９を作成するときの手順である。

【００４６】図５において、Ｓ２１は、仮テーブル６か
ら１つ取り出す。これは、図２のＳ１からＳ１０のＹＥ
Ｓによって作成した仮テーブル６の先頭から１つデータ
を取り出す。

【００４７】Ｓ２２は、参照回数が１か判別する。これ
は、仮テーブル６の先頭から順次取り出したデータ（ハ
ッシュ値、オフセット番号）によって仮辞書５に登録さ
れているデータ（図３の（ｂ）の辞書データ、１６ドッ
トの実データ）の参照回数が１か判別する。ＹＥＳの場
合には、同じ内容の１６ドットのデータがないので、Ｓ
２３で本テーブル９にそのまま１６ドット分のデータを
登録し、Ｓ２４に進む。一方、ＮＯの場合には、参照回
数が２回以上であるので、Ｓ２５からＳ２７の処理を行
なう。

【００４８】Ｓ２５は、前の辞書番号と同じか判別す
る。これは、本テーブル９に登録した前回の辞書番号
と、今回のデータの辞書番号とが同じか判別する。ＹＥ
Ｓの場合には、今回のデータの辞書番号と前回のデータ
の辞書番号が同じであったので、Ｓ２７で本テーブル９
の連続回数を＋１し、Ｓ２４に進む。これにより、１６
ドット分のデータが連続する場合、本辞書８に１６ドッ
ト分のデータを登録することなく、前回の１６ドット分
のデータの連続回数を＋１するのみでよく、いわゆる連
長圧縮を行なう。一方、Ｓ２５でＮＯの場合には、今回
のデータの辞書番号と前回のデータの辞書番号が同じで
なかったので、Ｓ２６で本辞書８に１６ドット分のデー
タを登録し、本テーブル９に辞書番号と連続回数１を登
録する。これにより、１６ドット分のデータが新規の場
合、本辞書８に１６ドット分のデータを登録、および本
テーブル９に辞書番号および連続回数１を登録する。

【００４９】以上によって、仮テーブル６および仮辞書
５をもとに、連続回数が１のデータはそのまま本テーブ
ル９に登録し、連続回数が２以上のデータはデータを本
辞書８に登録し、本テーブル９にはその辞書番号および
連続回数を登録する。これにより、１６ドット分のデー
タに繰り返しがないときはそのまま本テーブル９に登録
し、繰り返しがある場合は連長圧縮を行い、効率的かつ
迅速に圧縮した本辞書８および本テーブル９を作成する
ことが可能となる。

【００５０】図６は、本発明の本辞書／本テーブル例を
示す。ここで、圧縮後のデータは、図示のように、・本辞書８・本テーブル９から構成されている。

【００５１】本辞書８は、図示のように・データ：［１６ドット］と登録する。

【００５２】本テーブル９は、図示のように、実データタイプの場合（１６ドット分のデータの繰り
返しがないタイプの場合）：ＭＳＢ（１バイト）を０に
設定し、１６ドット分のデータを登録する。

【００５３】辞書データタイプの場合（１６ドット分
のデータの繰り返しがあるタイプの場合）：ＭＳＢ（１
バイト）に連長回数を設定、および辞書番号（２バイ
ト）を登録する。

【００５４】具体的に説明すると、（１）１６ドット分のデータに繰り返しがない場合：
１６ドット分のデータを本テーブル９に登録する。

【００５５】（２）１６ドット分のデータに繰り返し
がある場合：１６ドット分のデータを本辞書８に１つの
み登録、および本テーブル９に本辞書８中の辞書番号お
よび連続回数を登録する（連長圧縮する）。

【００５６】図７は、本発明のデータ展開フローチャー
トを示す。これは、データを１６ドット分に区切って圧
縮したデータ（本テーブル９および本辞書８）をもと
に、展開して元のデータに復元するときの手順である。

【００５７】図７において、Ｓ３１は、本テーブル９を
参照し、１データ取り出しを行なう。これは、図６の本
テーブル１から実データタイプあるいは辞書データ
タイプのいずれかのデータを取り出す。

【００５８】Ｓ３２は、実データ（タイプ０、ＭＳＢ＝
０）か判別する。ＹＥＳの場合には、実データタイプ
と判明したので、Ｓ３４で当該本テーブル９のデータを
そのままバッファに書き込み、Ｓ３５に進む。一方、Ｎ
Ｏの場合には、辞書データタイプと判明したので、Ｓ
３３で本辞書８の連長データを参照し展開データを得、
Ｓ３４でバッファに書き込む。即ち、図６の本テーブル
８の辞書データタイプ（ＭＳＢ≠０）の辞書番号をも
とに本辞書８から１６ドット分のデータを取り出すおよ
び本テーブル８の連長回数を取り出し、Ｓ３４でこの取
り出したデータを、取り出した連長回数分繰り返しバッ
ファに展開し、Ｓ３５に進む。

【００５９】Ｓ３５は、データがまだあるか判別する。
ＹＥＳの場合には、本テーブル９にまだデータがあるの
で、次のデータについてＳ３１以降を繰り返す。一方、
ＮＯの場合には、終了する（ＥＮＤ）。

【００６０】以上によって、データ圧縮した本テーブル
９および本辞書８から、元のデータをバッファに展開す
ることが可能となる。図８は、本発明のシステム構成図
を示す。

【００６１】図８の（ａ）は、ＨＤ（ハードディスク装
置）にデータを格納する場合のシステム構成図を示す。
図８の（ａ）において、ディスプレイ２１は、画像を表
示するものであって、圧縮データを展開したデータなど
を表示するものである。

【００６２】ＨＤ２２は、ハードディスク装置であっ
て、圧縮前の素材データ（元データ１）を格納するもの
である。コンピュータシステム（ＯＳ）２３は、素材デ
ータを圧縮して圧縮データを作成したり、圧縮データを
展開して元のデータに復元してディスプレイ２１上に表
示したりなどするものである。

【００６３】ＨＤ２４は、圧縮データを保存するもので
ある。次に動作を説明する。既述したように、素材デー
タを例えば１６ドット分毎に区切ったデータを仮辞書５
に登録および辞書番号とオフセット値を仮テーブル６に
登録する。続いて仮テーブル６および仮辞書５をもとに
圧縮した本テーブル９および本辞書８を作成する。圧縮
データである本テーブル９および本辞書８をもとに、展
開して元のデータに復元し、ディスプレイ２１上に表示
する。これにより、少ない容量のＨＤ２４に素材データ
を蓄えておくことが可能となる。

【００６４】図８の（ｂ）は、ＣＤ−ＲＯＭの媒体に圧
縮したデータを記録した例を示す。図８の（ｂ）におい
て、コンピュータシステム２５は、素材データを圧縮し
て圧縮データを作成するものである。この場合には、既
述したように、素材データを区切ったデータを仮辞書５
に登録および辞書番号とオフセット値を仮テーブル６に
登録する。続いて仮テーブル６および仮辞書５をもとに
圧縮した本テーブル９および本辞書８を作成する。圧縮
データである本テーブル９および本辞書８の内容をＣＤ
−ＲＯＭに成形する。

【００６５】コンピュータシステム２６は、ＣＤ−ＲＯ
Ｍに格納されている圧縮データ（本テーブル９および本
辞書８）をもとに展開して元のデータに復元し、ディス
プレイ２１上に表示する図９は、本発明のハッシュ値の
算出説明図を示す。ここでは、元データ１から１６ドッ
ト分のデータを図示のように切り出す。そして、斜線の
部分のドット１、６、１１、１６の４つを取り出し、こ
れらのドットの値（１バイトの輝度、色相などの値）の
総和を求め、ハッシュテーブルのサイズ、ここでは、１
２８で除算してその余りをハッシュ値とする。ここで、
４つのドットのデータを取り出してハッシュ値を算出し
ているため、全てのデータの和を求めて１２８で除算し
た場合には比し、計算時間を短縮できると共に、繰り返
して同じ位置となる割り切れるドット（ドット１、６、
１１、１６）毎（ここでは５つ毎）のデータのハッシュ
値を異ならせ、局所的にハッシュ値が集まって仮辞書５
の検索が遅くなることを回避できる。

【００６６】

【発明の効果】以上説明したように、本発明によれば、
データを区切って繰り返しが存在したときにデータとこ
のデータの辞書番号および連長回数で表現し、一方、繰
り返しが存在しないときに実データで表現する構成を採
用しているため、繰り返しデータが部分的に存在するデ
ータを効率的かつ高速に圧縮／展開することができる。
これらにより、パソコン上などの電子カタログなどの画
像を高速に圧縮して圧縮データ（本テーブル９および本
辞書８）を作成したり、圧縮データ（本テーブル９およ
び本辞書８）を展開して元のデータを迅速に表示するこ
とができる。

【図面の簡単な説明】

【図１】本発明の原理構成図である。

【図２】本発明の動作説明フローチャート（圧縮）であ
る。

【図３】本発明の仮辞書例である。

【図４】本発明の仮テーブル例である。

【図５】本発明の動作説明フローチャート（本辞書／本
テーブル登録）である。

【図６】本発明の本辞書／本テーブル例である。

【図７】本発明のデータ展開フローチャートである。

【図８】本発明のシステム構成図である。

【図９】本発明のハッシュ値の算出説明図である。

【符号の説明】

１：元データ２：メモリ３：作業用一時データ４：ハッシュテーブル５：仮辞書６：仮テーブル７：圧縮後データ８：本辞書９：本テーブル１１：圧縮主制御部１２：仮テーブル作成部１３：仮辞書登録部１４：ハッシュリスト作成部１５：ハッシュ値計算部１６：本辞書登録部１７：本テーブル作成部１８：展開制御部１９：展開部２０：バッファ２１：ディスプレイ２２、２４：ＨＤ２３、２５、２６：コンピュータシステム

Claims

【特許請求の範囲】

【請求項１】データを圧縮するデータ圧縮方法におい
て、圧縮対象の元データ（１）を所定ドット毎に区切ったデ
ータと同一データが連続して繰り返すと検出されたとき
に、当該データを本辞書（８）に１つ登録すると共に本
辞書（８）の辞書番号および連続回数を本テーブル
（９）に登録し、一方、同一データが繰り返さないと検
出されたときに、当該データを本テーブル（９）に登録
するように構成したことを特徴とするデータ圧縮方法。
【請求項２】データを圧縮するデータ圧縮方法におい
て、圧縮対象の元データ（１）を所定ドット毎に区切ったデ
ータについて、ハッシュ値を算出して同一データが連続
して存在すると検出されたときに当該データの参照回数
を＋１し、一方、存在しないと検出されたときに当該デ
ータを登録および参照回数の初期値を登録する仮辞書
（５）と、上記データのハッシュ値およびオフセット値を順次登録
する仮テーブル（６）とを備え、この仮テーブル（６）から順次取り出したハッシュ値お
よびオフセット値をもとに、上記仮辞書（５）を参照し
て連長回数が２以上のときにデータを本辞書（８）に登
録およびこの本辞書（８）の辞書番号および連長回数を
本テーブル（９）に登録し、一方、連長回数が１のとき
にデータを本テーブル（９）に登録することを繰り返す
ように構成したことを特徴とするデータ圧縮方法。
【請求項３】上記ハッシュ値の算出として、上記区切っ
たデータから所定ドット毎のドット位置の値を加算して
所定数（ハッシュテーブルの大きさ）で割算してその余
りをハッシュ値とし、周期的なパターンが同じハッシュ
値とならないようにしたことを特徴とする請求項１記載
および請求項２記載のデータ圧縮方法。
【請求項４】上記本テーブル（９）から取り出したデー
タに複数の連長回数が設定されていたときに、上記本辞
書（８）から該当するデータを取り出してバッファにそ
の連長回数分だけ展開し、一方、連長回数が設定されて
いなかったときにデータをそのままバッファに展開する
ことを繰り返し、データ展開を行なうように構成したこ
とを特徴とするデータ圧縮方法。