JPH04286084A

JPH04286084A - データ圧縮および復元方式

Info

Publication number: JPH04286084A
Application number: JP5133991A
Authority: JP
Inventors: Yoshiyuki Okada; 佳之岡田; Shigeru Yoshida; 茂吉田; Yasuhiko Nakano; 泰彦中野; Hirotaka Chiba; 広隆千葉
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1991-03-15
Filing date: 1991-03-15
Publication date: 1992-10-12

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は，コンピュータ，ファク
シミリ等におけるデータ圧縮および復元方式に関する。コンピュータ，ファクシミリ等の普及にともない，文書
等を大量の白黒の画像情報として伝送したり，磁気記憶
媒体に記憶させることが必要となっている。もともと，
画像データは情報量が多く効率的にデータ圧縮し，デー
タ量を減らすことにより遠方に伝送したり，記憶媒体に
蓄積することが必要とされていたが，最近では，画像品
位の向上から画像データ量が増加しいるため，一層のデ
ータ圧縮の効率化が望まれる。　　本発明は，白黒等の
二値画像データを二次元的なデータとして捉え，二次元
データに変換された画像データを，ＬＺＷ符号等のユニ
バーサル符号により効率的に圧縮および復元するデータ
圧縮および復元方式を提供することを目的とする。

【０００２】

【従来の技術】従来の二値画像データのＬＺＷ符号化を
説明する前に，図３１〜図３４によりＬＺＷ符号化につ
いて説明する。図３１はＬＺＷ符号の説明図である。図
（ａ）　は入力データと出力符号の例，（ｂ）　は辞書
構成の例を示す。

【０００３】図は，情報源の文字がａ，ｂ，ｃの３通り
だけの場合である。辞書には，あらかじめ，初期値とし
て，文字ａを登録番号１，文字ｂを登録番号２，文字ｃ
を登録番号３で登録しておく。まづ，入力データ（入力
文字列）は左から右に順次読み込む。最初の文字ａを入
力したとき，辞書にはａの他に一致する文字部分列がな
いので，出力符号１を符号語として出力する。そして，
次の文字ｂとにより拡張した文字部分列ａｂに参照番号
ａｂをつけて登録する。実際の登録は文字部分列１ｂと
して登録する（以後，特に必要な場合を除き，文字部分
列は単に文字列と称する）。続いて２番目のｂを文字列
の先頭とする。辞書には，ｂの他に一致する文字列はな
いので，登録番号２を符号語として出力し，次の文字（
第３番目のａ）とによる拡張した文字列ｂａを登録番号
５で登録する（実際には，２ａの形式で登録する）。

【０００４】次に，３番目のａが次の文字列の先頭にな
る。以下同様にして，出現する文字列について，辞書を
参照し，登録された文字列のうちの最大一致文字列（最
長文字部分列）の登録番号により出現した文字列を符号
語により出力し，最大一致文字列と次の一文字とによる
拡張した文字列を辞書に登録する。

【０００５】図３２はＬＺＷ符号復号化の説明図である
。辞書には，予め文字ａを１，文字ｂを２，文字ｃを３
として初期化しておく。図３１における入力データを復
号する場合を示す。まず，入力文字は１であり，登録番
号１はａであるので，文字ａを出力する。次の符号２も
同様に文字ｂに置き換えて出力する。このとき，前回復
号した文字ａと今回復号した文字ｂとを組み合わせた１
ｂ（＝ａｂ）を辞書に登録番号４で登録する。

【０００６】３番目の符号４は辞書の検索により１ｂか
らａｂと置き換えて文字列ａｂを出力する。同時に，前
回処理した符号２と今回復号した文字列の１番目の文字
ａとの組合せ２ａ（＝ｂａ）を新たに登録番号５で登録
する。以下同様の処理を繰り返して，入力データを復号
する。

【０００７】ＬＺＷ符号の復号においては，入力符号を
復号し，復号された入力符号に基づいて辞書を復元する
ものであるが，例外的に入力符号が辞書に登録されてい
ない場合を生じる。この例外処理は，図における場合で
は第６番目の入力符号８の復元において生じる。符号８
は，復号時に辞書に登録されておらず，復号できない。この場合には，前回処理した符号５に，前回復号した文
字列ｂａの最初の一文字かｂを加えた文字列５ｂを求め
，それを２ａｂ，ｂａｂと置き換えて出力する。そして
，文字列５ｂ（＝ｂａｂ）に登録番号（参照番号）８を
付加して辞書に登録する。

【０００８】図３３は，ＬＺＷ符号化フローである。フ
ローのステップ（Ｓ１，Ｓ２等）に従って説明する。Ｓ１　　予め，全文字につき一文字からなる文字列を初
期値として登録する（文字数Ｍ）。辞書の先頭アドレス
（登録番号）ＮをＭとする。Ｓ２　　入力した最初の文字Ｋを辞書における登録番号
（参照番号）ωとして，これを語頭文字列（ｐｒｅｆｉ
ｘ　ｓｔｒｉｎｇ　）とする。Ｓ３　　入力データの次の文字Ｋを読み込む。Ｓ４　　Ｓ２で求めた語頭文字列ωにＳ３で読み込んだ
文字Ｋを加えた（ωＫ）が現在の辞書にあるか検索する
。

【０００９】Ｓ５　　Ｓ４で文字列（ωＫ）が辞書にあ
れば，文字列（ωＫ）を参照番号ωに置き換え，Ｓ６に
進む。Ｓ７　　Ｓ４で文字列（ωＫ）が辞書になければ，Ｓ２
で求めた文字Ｋの参照番号ωを符号語ｃｏｄｅ（ω）と
して出力し，また文字列（ωＫ）を新たな参照番号（登
録番号）を付加して辞書に登録する。さらに，Ｓ２の入
力文字Ｋを参照番号ωに置き換えるとともに，辞書アド
レス（登録番号）Ｎを１インクリメントして，Ｓ６に進
む。Ｓ６　　データが全て終了していなければ，Ｓ３に戻り
，文字列（ωＫ）が辞書から探せなくなるまで，最大一
致長の文字列を求める検索を続ける。Ｓ８　　ｃｏｄｅ（ω）を出力する。

【００１０】図３４はＬＺＷ符号復号化のフローを示す
。図のフローにおいて，ＣＯＤＥ，ＯＬＤｃｏｄｅ，Ｎ
ＥＷｃｏｄｅ，ｃｈａｒはそれぞれレジスタであって、
ＣＯＤＥは入力符号を格納するもの，ＯＬＤｃｏｄｅは
直前文字列の符号を格納するもの，ＮＥＷｃｏｄｅは今
回処理する符号を格納するもの，ｃｈａｒは例外処理の
ため復号した文字を格納しておくものである。以下の説
明においては，それそれのレジスタに格納された値は上
記のレジスタの名称により表すものとする。

【００１１】復号化では，符号化した場合と同様に，予
め文字ａ，ｂ，ｃ等の一文字を初期値として辞書に登録
しておく。ステップの順に従ってフローを説明する。Ｓ１　　全一文字をを初期値として辞書に登録する（文
字数Ｍ）辞書の先頭アドレスＮ（登録番号（参照番号）
）をＭとする。Ｓ２　　最初の符号を読み取りＣＯＤＥに格納する。現
在のＣＯＤＥをＯＬＤｃｏｄｅにセットする。最初の符
号は既に辞書に登録された一文字のいずれかであるので
，入力符号に一致する文字ｃｏｄｅ（Ｋ）を探し出し，
文字Ｋを出力する。なお，出力した文字（Ｋ）は後の例
外処理のため，ｃｈａｒにセットしておく。Ｓ３　　次の符号を読み込んで，ＣＯＤＥとし，ＮＥＷ
ｃｏｄｅにセットする。Ｓ４　　Ｓ３で入力された符号（ＣＯＤＥ）が辞書に登
録されているかチェックする。通常は，入力した符号語
が前回までの処理で登録されているのでＳ５に進む。

【００１２】Ｓ５　　符号（ＣＯＤＥ）に対応する文字
列ｃｏｄｅ（ωＫ）を辞書から読み出し，Ｓ６で文字列
Ｋを一時的にスタックし，参照番号ｃｏｄｅ（ω）を新
たなＣＯＤＥとして再度Ｓ５に戻し，Ｓ５，Ｓ６の手順
を再帰的に参照番号ωが一文字にいたるまで繰り返す。Ｓ７　　Ｓ５において，参照番号がなくなると，Ｓ６で
スタックした文字をＬＩＬＯ（Ｌａｓｔ　　ｉｎ　　Ｆ
ａｓｔ　　Ｏｕｔ）形式でポップアップして出力する。同時に，前回使った符号ωと今回復元した文字列の最初
の一文字Ｋを組（ω，Ｋ）と表した文字列に，新たな参
照番号を付加して辞書に登録する。なお，Ｓ４において
，登録されていない符号を参照する場合（前述の例外処
理）には，Ｓ９で，ＯＬＤｃｏｄｅをＣＯＤＥに，ｃｏ
ｄｅ（ＯＬＤｃｏｄｅ，ｃｈａｒ）をＮＥＷｃｏｄｅに
戻した後にＳ５へ進むようにする。Ｓ８　　全ての符号を処理したか判定する。

【００１３】図３５〜図３８により，二値画像データの
ＬＺＷ符号化の例を具体的に示す。図３５は画像の例を
示す。図において，Ａ，Ｂはそれぞれ黒画素のパターン
である。Ｈ１−ＲＬ１，Ｈ２−ＲＬ２はそれぞれ第１ラ
インにおける画像Ａの白黒の境界，Ｖ１−ＺＬ２１，Ｖ
２−ＺＬ２２はそれぞれ第２ラインにおける画像Ａの白
黒の境界，Ｖ１−ＺＬ３１，Ｖ２−ＺＬ３２はそれぞれ
第３ラインにおける画像Ａの白黒の境界，Ｖ１−ＺＬ４
１，Ｖ２−ＺＬ４２はそれぞれ第４ラインにおける画像
Ａの白黒の境界を示す。

【００１４】Ｈ３−ＲＬ３，Ｈ３−ＲＬ４はそれぞれ第
３ラインにおける画像Ｂの白黒の境界，Ｖ３−ＺＬ４３
，Ｖ４−ＺＬ４４はそれぞれ第４ラインにおける画像Ｂ
の白黒の境界，Ｖ３−ＺＬ５３，Ｖ４−ＺＬ５４はそれ
ぞれ第５ラインにおける画像Ｂの白黒の境界，Ｖ３−Ｚ
Ｌ６３，Ｖ４−ＺＬ６４はそれぞれ第６ラインにおける
画像Ｂの白黒の境界を示す。数字はそれぞれの区間の画
素数を示す（例えば，第１ラインにおける左端２から境
界Ｈ１−ＲＬ１までの間には白画素が１２８あることを
示す）。図における括弧付の番号は境界線で区切られる
区間を示すものである（括弧付の番号は後述の実施例の
説明において参照される）。

【００１５】図３６，図３７は２次元ランレングスデー
タの例であって，図３５の画像の２次元ランレングスデ
ータである（図３７は図３６の続き）。図において，入
力シンボルは図２７の画像Ａ，画像Ｂの２次元ランレン
グスデータである。１０進符号表現は入力シンボルを１
０進数で符号化したものである。出力符号は入力シンボ
ルの１０進表現を符号として出力するものである。辞書
への登録は出力符号を辞書に登録する登録番号を示す（
以下図３６，図３７の説明においては必要に応じて図３
５を参照する）。

【００１６】第１ラインにおける第１の入力シンボルＨ
は水平方向のランレングスの始点を示すものある（ＭＭ
Ｒ方式の規格では，始点は水平モードＨ＋ランレングス
ＲＬで表す）。第２番目と第３番目のそれぞれ８ビット
のデータにより２バイトで白が１２８画素連続している
ことを示す。第２番目の１バイトデータは第３番目のデ
ータが１２７＋１であることを示す。第３番目のデータ
は第２番目のデータに従って１２８（１２７＋１＝１２
８）であることを示す。従って，第２番目と第３番目の
データとにより白のランレングスが１２８（ＲＬＷ１２
８）であることを読み取ることができる。

【００１７】第１ラインの第４番目のデータのＨはラン
レングスの始点を表す。次の第５番目のデータと第６番
目のデータは，２バイトデータであり，黒のランレング
スが２００であることを示す。第２ライン以降は，第１
ラインからの垂直方向のズレにより画像を表すようにす
る。

【００１８】第２ラインのデータにおける第１番目のデ
ータＺＬ０は第１ラインの白黒の境界Ｈ１−ＲＬ１と第
２ラインの白黒の境界Ｖ１−ＺＬ２１との間に垂直方向
のズレがないことを表す（以後，白黒の境界はＨ１−Ｒ
Ｌ１等符号のみで表す）。第２ラインの第２番目，第３
番目のデータとによりＨ２−ＲＬ２とＶ２−ＺＬ２２の
間のずれが６５画素あることを表す（ＭＭＲ方式の規格
により，垂直方向のずれはずれの大きさが０〜６２のと
きと６３以上の場合を区別して表現し，６３以上ある場
合は６３からの差により表す。図の第２ラインの第２番
目のデータは垂直方向のズレが６３以上あることを表し
，続く第３番目のデータ２は第２番目のデータに従って
垂直方向のズレが６３に２加えた６５あることを示す）
。

【００１９】第３ラインの第３番目のＨおよび続く第４
番目のＲＬＷ６４とによりＶ２−ＺＬ３２とＨ３−ＲＬ
３との間に白のランレングスが６４あることを示す。第
３ラインの第５番目のＨと続く第６番目のＲＬＢ８は画
像ＢのＨ３−ＲＬ３とＨ４−ＲＬ４との間に黒画素が８
続くことを示す。第５ラインの第１番目および第２番目
のＰは，それぞれＶ１−ＺＬ４１，Ｖ２−ＺＬ４２に対
して垂直方向に画像は存在しないことを表す。

【００２０】以下のように，水平方向，垂直方向の二次
元データにより画像Ａ，画像Ｂのランレングスデータを
得る。そこで，入力シンボルの１０進表現を出力符号と
し，文字列を辞書に登録する。１バイトのデータよりな
る文字グループ（例えば，入力シンボル「１０００００
００」の出力符号１２８等）を１文字とする。先ず，第
１の文字１２８を出力符号１２８で出力し，第１の文字
（入力シンボル）１２８と続く第２の文字（入力シンボ
ル）１２８よりなる文字列「１２８＋１２８」を登録番
号２５６で登録する。次に第２の文字１２８を出力符号
１２８で出力し，１２８と次の文字１よりなる文字列「
１２８＋１」を登録番号２５７で登録する。次いで，第
３番目の文字１を出力し，第３番目の文字１と次の第４
番目の文字１２８よりなる文字列「１＋１２８」を登録
番号２５８で登録する。次に第４番目の文字１２８と第
５番目の文字１２８は参照番号（登録番号）２５６を出
力符号として出力し，登録番号２５６の文字列と続く文
字７２よりなる文字列「１２８＋１２８＋７２」を辞書
に登録番号２５９で登録する（但し，辞書には２５６＋
７２」の形式で登録される）。

【００２１】以下，同様に，入力文字を，辞書で参照し
，登録されている文字列のうちの最大一致文字列の登録
番号により出力符号とし，続く文字列よりなる文字列に
登録番号を付して登録する。図３０は，図２７の画像の
ランレングスデータの配列の例を示す。ライン番号毎に
水平方向および垂直方向のデータを配列する。

【００２２】

【発明が解決しようとする課題】上記のようなＬＺＷ符
号化においては，辞書に登録する文字列は未登録の文字
列が出現する毎に無条件で登録していた。しかし，実際
の画像データは先行する文字列と後続の文字列との間に
相関のある記憶情報源とみなされ，上記のような無条件
に文字列を登録することは，無駄を伴うものであった。例えば，図２８における登録番号２６０，２６８のよう
に画像の水平方向のデータに続く垂直方向のデータのよ
うに，登録しても利用されることのないような相関の小
さいデータも無条件に登録されていた。本発明は，画像
データを二次元的に変換したデータによる文字列につい
て，文字列間の相関を考慮し，無駄な登録を省くことに
より，効率的にデータ圧縮するようにすることを目的と
する。

【００２３】

【課題を解決するための手段】本発明においては，画像
データにおける白から黒へ変化する点もしくは黒から白
へのデータの変化する点をデータの区切りとして認識し
，データの区切りにおいて，データの連続性を判定し，
辞書に登録された場合にそれ以降の処理おいて利用され
ることのないようなデータは辞書に登録しないようにし
た。

【００２４】図１に本発明の基本構成を示すが，図１を
説明する前に，本発明の原理を図２により説明する。図
２は本発明の原理説明図である。図（ａ）　は画像デー
タの切れ目と本発明における文字列の登録条件を示す。図（ｂ）　は画像データの切れ目と登録処理の内容を示
す。

【００２５】図（ａ）　において，Ｃ１，Ｃ２は，デー
タの切れ目（文字列の切れ目）を示し，Ｃ１とＣ２の間
の画像データにより表される文字列が，登録するかしな
いかの判定の対象となる文字列である。条件■は，現文
字列と直前文字列との間で連続性があり，現文字列と後
続文字列の間にも連続性がある場合である。条件■は，
直前文字列と現文字列の間に連続性があるが，現文字列
と後続文字列との間に，連続性がない場合である。条件
■は，現文字列と直前文字列との間に連続性はないが，
現文字列と後続文字列との間には連続性がある場合であ
る。条件■は，現文字列と直前文字列との間に連続性は
なく，現文字列と後続文字列との間にも連続性がない場
合である。本発明は，以上のような条件を画像の性質に
基づく文字列間の条件をＬＺＷ符号等のユニバーサル符
号化において考慮し，登録しても利用されないような文
字列は登録しないようにした。

【００２６】例えば，条件■は，同じデータ郡の中であ
ると考えられるので，この場合には同系列内のデータと
見なし，登録するようにする。条件■は，現在の文字列
と現在以降の文字列とのつながりが薄いと考えられるの
で，登録しないようにする。条件■は，現在の文字列と
後続文字列との関係が深いものと考えられるので，登録
することとする。条件■は，網点画像のような場合には
，白のパターンレングスと黒のパターンレングスには相
関があるので，網点画像等の場合を考慮して，登録する
ものとする。

【００２７】図（ｂ）　は，以上の場合について，処理
内容を表にまとめたものである。Ｃ１，Ｃ２において，
０は連続性，１は連続性なしを表す。条件■は，Ｃ１＝
０，Ｃ２＝０は，Ｃ２が，例えば黒から黒への連続（同
種の連続性）により登録することを表す。条件■は，Ｃ
１＝０，Ｃ２＝１で，例えば，Ｃ１が黒から黒の連続で
あり，Ｃ２が黒から白への断続（同種の断続）により登
録しないこととする。条件■は，Ｃ１＝１，Ｃ２＝０で
，Ｃ２おいて，例えば，黒から黒連続（同種の連続より
登録することとする。条件■は，Ｃ１＝１，Ｃ２＝１で
，Ｃ２＝１であっても，Ｃ１＝１であるので，Ｃ２にお
いて，例えば，黒から白の変化はあっても，連続性があ
る（異種の連続）として登録するようにする。

【００２８】本発明の基本構成を図１に示す。図におい
て，１は画像データ入力部，２は二次元データ変換部で
あって，画像データをランレングス，輪郭線データ等の
二次元データに変換するもの，３は符号作成部であって
，二次元データをユニバーサル符号化するもの，４は符
号出力部，５は二次元データ変換部より一文字づつ文字
列を入力する文字列入力部，６は入力される文字列につ
いて辞書参照し，最大一致文字列（最長文字部分列）を
検索する検索部，７は文字列を登録する辞書，８は文字
部分列を辞書に登録する処理を行う登録部，９は符号語
作成部であって，検索された文字列の参照番号に基づい
て符号語を作成するもの，１０は登録部８における登録
条件判定部，１１は文字部分列を辞書に登録する登録処
理部，１１’は文字部分列を登録しない処理，１２は登
録部条件判定部における直前文字部分列と現文字部分列
の連続性を判定するもの，１３と登録部条件判定部にお
ける現前文字部分列と後続文字部分列の連続性を判定す
る判定部である。図において，Ｃ１は現文字文字列と直
前続文字列との連続性を表し，Ｃ２は現文字列と後続文
字列との連続性を表す。いずれも，０は連続，１は断続
を表す。

【００２９】

【作用】図１の構成の動作を説明する。例えば，二値の
画像データが画像データ入力部１に入力される。入力さ
れた画像データは二次元画像データ変換部２に入力され
る。そして，例えば，ＭＭＲ法等により，ランレングス
データとライン間の垂直方向の関係を表す二次元データ
もしくは，輪郭線データ等の二次元データに変換される
。二次元データ変換部２で得られたデータは文字列とし
て符号作成部３に入力され，ユニバーサル符号化される
。符号作成部３で作成されたユニバーサル符号は，符号
出力部４に入力され，出力される。

【００３０】符号作成部３においては，文字列入力部３
が二次元データ変換部２から出力される二次元データを
文字列毎にに順次入力する。そして，検索部６は入力さ
れた文字列について同じ文字列が辞書６に登録されてい
るか検索する。そこで，検索部６は辞書７において参照
された最大一致文字列を検索すると，その参照番号（登
録番号）を符号語作成部９に送る。符号語作成部９は，
参照番号（登録番号）に基づいて符号語を作成する。符
号語作成部９において作成された符号語は符号出力部４
により出力される。

【００３１】一方，登録部８においては，　　登録条件
判定部１０は文字部分列（最大一致文字列＋次の一文字
）について，直前文字列との連続性および後続文字列（
最大一致文字列の次の一文字）との連続性を判定する。即ち，判定部１２においてＣ１＝１であれば，登録部８
は，文字列を辞書に登録する。Ｃ１＝でない場合には，
判定部１３においてＣ２＝０であるかどうか判定される
。その結果Ｃ２＝０であれは，登録部８は文字列を辞書
６に登録する。Ｃ２＝０でなければ，登録部８は文字列
を登録しない。そして，最大一致文字列についての以上
の処理が済むと，文字列入力部５は次の文字列を入力し
，以上の処理を繰り返す。そして，二次元変換データの
入力がなくなるまで繰り返す。

【００３２】図３は，本発明における復号化フローの原
理を示す。ステップに従ってフローを説明する。Ｓ１　　入力されたデーター（符号）の切れ目を認識す
る。Ｓ２　　データの連続性（後続データとの連続性）につ
いて判断する。Ｓ３　　データに連続性がなければ，Ｃ２を１とする。Ｓ４　　データに連続性があれば，Ｃ２を０とする。Ｓ５　　Ｃ１が１であるかどうかにより，直前文字列と
の連続性を判定する。Ｃ１＝１で直前データ（文字列）
に連続性がなければ，Ｓ７に進む。Ｃ１＝０で直前デー
タとの連続性があればＳ６に進む。Ｓ６　　データの連続性がなくＣ２＝０であれば，Ｓ７
に進む。Ｃ２＝１でデータの連続性があればＳ８に進む
。Ｓ７　　データを登録する。Ｓ８　　データを登録しない。

【００３３】上記のように，本発明によれば，データの
切れ目（文字列）を認識しながら，辞書に登録しても利
用されることのすくない文字列は登録されず，意味のあ
るデータ系列（文字列）だけが登録されるので，インデ
ックスの増加を防ぐことができ，効果的なデータ圧縮を
行うことができる。なお，上記文字列の登録条件として
，Ｃ１＝０，Ｃ２＝１の場合について登録しないようす
る場合について説明したが，画像の性質等により，この
条件は変更され得るものである。

【００３４】

【実施例】本発明の画像データの文字列の登録方法とは
別の意味で，従来のＬＺＷ符号においては，新たに出現
する文字列について，登録済の文字列との相関を考慮せ
ず無条件に，出現する順番に登録番号を付して登録して
いたので，登録文字列の構成に無駄が多かった。本発明
の実施例を説明する前に，画像データについて文字列の
符号化でない場合も含めた従来のＬＺＷ符号を改良する
ことについて図４〜１１により説明する。

【００３５】図４は従来のＬＺＷ符号化の登録方法の説
明図である。図（ａ）　は辞書の探索木を示し，図（ｂ
）　は符号とデータ（文字列）との関係を示す。１３１
は先頭文字列（例えば１文字）であり，登録番号０〜２
５５まである場合を示す。従来は，新たな文字列が出現
する毎に新しい登録番号２５７，２５８，・・・を付し
，現在符号化中のの文字列は以前の文字列とは独立に出
現するものとして符号化するようにしていた。即ち，図
（ｂ）　に示すように，インデックスＩ２　の文字列の
先頭文字と先行する文字列インデックスＩ１　との相関
は考えられていなかった。このことは，図（ａ）　のよ
うに，辞書の探索木の根は空であり，現在符号化中の文
字列に対して以前に出現した文字列の履歴は考慮されて
いなかったこと意味する。

【００３６】このことは，無記憶情報現においては差し
支えないのであるが，実際の文章等は，出現した文字列
と後続の文字列との間には出現性についての相関のある
記憶情報源とみなされ，無条件に出現する文字列を登録
する場合には，登録された文字列について，頻繁に参照
されるものと余り参照されないようなものを生じる。従
って，無条件に文字列が出現する順番に登録番号を付し
て登録することは，余り参照されることのない文字列で
ありながら小さい登録番号を持つなどの辞書の構成に無
駄を生じるものであった。そこで，ＬＺＷ符号において
，文字列の出現の相関を考慮することにより一層のデー
タの圧縮率の向上を計ることが可能になる（この点つい
ては，本出願人により特願平２−７０３７９号として出
願されている）。

【００３７】図５により，文字列の相関を考慮して改良
されたＬＺＷ符号化について説明する。図（ａ）　は改
良されたＬＺＷ符号の探索木，図（ｂ）　は符号とデー
タ（文字列）との関係，図（ｃ）　はインデックス（登
録番号）のモード１，図（ｄ）　はインデックス（登録
番号）のモード２を示す。図（ａ）　において，１４０
は直前文字列の最終文字を示し，（０）〜（２５５）ま
で２５６個ある場合である。それぞれは，インデックス
（登録番号）として０（０），０（１），・・・・，０
（２５５）を持つ。１４１は先頭の文字であり，図示の
ようにそれぞれのインデックスを持つ。

【００３８】図（ｂ）　は符号とデータの関係を示し，
例えば，二番目の文字列（インデックスＩ１　（Ｐ０）
）を登録するときは，直前文字列の最終文字がＰ０であ
るので，直前文字列の最終文字がＰ０を根とする木のイ
ンデックスで登録する。図（ｃ）　は，モード１であっ
て，各木の根に直接繋がる文字じ新たに出現したときは
各木のインデックスの個数＋１のビット数をインデック
スとし，生データを付して符号として出力する（例えば
，図（ａ）　において，直前の最終文字０（１）の木の
インデックス１，２，３等の文字列）。

【００３９】図（ｄ）　は，モード２であって，モード
１以外の文字又は文字列が出現したときのインデックス
の表し方を示す。モード１では各木のインイデックスの
個数＋１のビット数で各木の中のその文字列のインデッ
クスとする。図６に，改良されたＬＺＷ符号の具体例を
示す。図は情報源が０，ａ，ｂ，ｃの４文字よりなる場
合を示す。ＤＰは個別辞書の木における登録された文字
列の深さを表す。例えば，文字列「ａｂａｂｃｂａ・・
・」を符号化する場合を考える。図示のように，第１文
字ａの直前には直前文字列０があったとして，直前文字
０に続く文字列０ａは，直前の文字列の最終文字の木の
根０に繋がる木の深さＤＰ０にインデックス１で登録す
る。そしてモード１に従って符号１ａを出力する。次に
文字列ａに続いて第２番目の文字列ｂが出現したら，文
字列ａｂを直前最終文字列の最終文字の木の根ａの深さ
ＤＰ０にインデックス１で登録する。そしてモード１に
より符号１ｂを出力する。次に第３番目の文字列ａが出
現したら文字列の最終文字の木の根ｂの深さＤＰ０に文
字列ｂａをインデックス１で登録する。そして，符号１
ａを出力する。次に第４番目の文字列ｂが出現したら，
文字列ａｂは登録済であるので，次の第５番目の文字列
ｃまで文字列を延ばす。そして，現文字列ａｂをインデ
ックス１で出力し，文字列ａｂｃを直前文字列の最終文
字の木の根ａ（直前文字ａに対する新たな文字列ｂｃ）
に深さＤＰ１，インデックス２で登録する。次に文字列
ｃを先頭文字とする。次の第６番目の文字列ｂとによる
文字列を直全の文字列の最終文字の木の根ｃの木の深さ
ＤＰ０ちインデックス１で登録する。そして，符号１ｃ
を出力する。以下同様に，符号化と登録を進める。

【００４０】図７〜８に，改良されたＬＺＷ符号化のフ
ローを示す。図９〜１１に改良されたＬＺＷ符号の復号
化のフローを示す。図９〜１１の符号化のフローにおい
は，辞書を従来のＬＺＷ符号化における場合と同様に文
字列する順に登録する全体辞書Ｄ（ｎ）と直前の文字列
の最終文字列毎に分割した辞書を用意し，登録する文字
の直前の文字列の最終文字の辞書に，その辞書のインデ
ックスで登録するようにする。そして，分割辞書におけ
る出現毎に，Ｓ５において登録文字列が参照される毎に
深さＤＰを１づつ深くしてゆき，直前文字列との深さの
関係において分割辞書のインデックスを設定し，符号化
するようにした点で図３３のフローと異なるのみである
。また，図９〜１１の復号化のフローは，直前文字列の
最終文字列毎に個別辞書を分割し，出現文字列の個別辞
書における深さを考慮して符号と辞書を復元するように
した点で，図３４の復号化のフローと異なるのみである
（なお，上記のフローについては，前掲の特願平２−７
０３７９号において詳述されている）。また，本発明の
画像データの文字列の符号化に適応した場合により後述
するので，フローの説明は省略する。

【００４１】本発明は，二次元変換された画像データを
ユニバーサル符号化し，文字列の連続性の条件を判定し
，文字列の間の相関の薄い文字列については登録しない
ようにしたものであるが，ユニバーサル符号化において
は，従来のＬＺＷ符号，改良されたＬＺＷ符号いづれを
も利用し得るものである。先ず，本発明を改良されたＬ
ＺＷ符号に適用する場合の実施例について説明する。

【００４２】図１２〜図３０により本発明の実施例を説
明する。必要に応じて図３５を参照する。図１２は本発
明の実施例（１）を示す。図３５の画像Ａ，画像Ｂをラ
ンレングス符号により表し，文字列を改良ＬＺＷ符号符
号により辞書に登録したものである。図において，入力
シンボルは図３５の図Ａ，図Ｂのランレングスデータで
あり，１０進表現は入力シンボルを１０進数で表したも
のである。出力符号は１０進表現を改良ＬＺＷ符号符号
により，符号化したものであり，「辞書への登録」は辞
書の登録番号を表すものである。図のランレングスデー
タ（入力シンボル）は，図３５の画像データを縦方向の
ランレングスデータとしたもので，図の括弧付の番号は
，図３５における括弧付の番号に対応するものである。

【００４３】図における「パターン」により，縦方向の
白黒の並びのパターンを表し，続くデータにより同じパ
ターンの横方向の並びの数を表す。例えば，図３５の（
１）の区間では，縦方向に白画素が８個ならんでいるも
のが，横方向に１２７画素ある。そこで，図１２におけ
る入力シンボルの第１番目の「００００００００」によ
り縦方向に白画素が８個並んでいることを表す。そして
，続く第２番目のデータは，その縦方向の並びが横方向
に１２７画素続くことを表す。

【００４４】同様に，区間（２）では，縦方向に「白白
黒黒白白白白」と並び，その縦方向の並びが横方向に１
画素あるので，入力シンボルの第３番目のパターン「０
０１１００００」により縦方向の並びを表し，続く第４
番目の入力シンボルによりそれが横方向に１画素並ぶこ
とを表す。以下同様に図３５の区間（３）〜（１１）に
ついて，図示のように入力シンボルを作成する。

【００４５】次に，図のランレグスデータを符号として
出力し，文字列を辞書に登録する方法について説明する
。図においては，登録番号０〜２５７までは初期値とし
て辞書に登録されていて新しい登録番号は２５６から始
まるものとする。そして，０〜２５６までの登録文字を
辞書の探索木の直前文字列の根とする。即ち，０〜２５
６までの辞書が存在し，直前文字列の最終文字を根とす
る探索木の辞書に新たに出現した文字列にインデックス
を付して登録する。

【００４６】先ず，第１番目のデータ０を入力し，符号
０（０）を出力する。そして，第１番目のデータ０と第
２番目のデータ１２７よりなる文字列「０＋１２７」を
直前文字列０を根とする探索木（以後，直前文字列ｎを
根とする探索木を辞書ｎと称する）にインデックス２５
６で登録する（２５６（０））。そして，符号１２７（
０）を先頭文字列とし，符号１２７（０）を出力する。第２番目のデータ３２を入力する。第２番目のデータに
ついてみると，第１番目のデータと第２番目のデータの
間は，同種の連続であり，第２番目のデータ１２７と第
３番目のデータ３２との間は白パターンから黒を含むパ
ターンに変化する断続点である（パターンを表すデータ
により判定できる）。そして，登録条件を満たしていな
いので，文字列「１２７＋３２」は登録しない。次に，
文字列３２を先頭文字列とし，３２（０）を出力符号と
して出力する。そして，「３２＋１」を辞書０に登録番
号２５７で登録する。次に第４番目の文字列１を先頭文
字列とし，（３２）を符号として出力する。そして，「
１＋２４０」を辞書３２に登録番号２５６で登録する（
第４番目の文字列１の直前文字列は３２であることによ
る）。以下同様に，直前文字列および後続文字列との連
続性により，登録条件を満たしている場合には，直前文
字列の値の辞書に，順次インデックスを付して登録する
。そして，登録条件を満たさない場合には登録しないよ
うにする。

【００４７】例えば，図において，区間（５）と区間（
６）の間，区間（６）と区間（７）の間はデータが断続
し，登録条件を満たさないのでその間に跨がる文字列の
登録は行わない。図１３，図１４は本発明の実施例（２
）である（図１４は図１３の続き）。各図は，図３５の
画像Ａ，画像Ｂの輪郭線データである。ライン番号，輪
郭線番号，輪郭線の開始座標，輪郭線の垂直方向データ
により輪郭線データとする。但し，偶数番目のラインデ
ータは省略される。また輪郭線番号０は画像の左エッジ
を表す。

【００４８】第１番目のデータは第１ラインを表す。第
２番目のデータは輪郭線０，第３番目，第４番目，第５
番目のデータにより輪郭線１の開始座標を表す。即ち，
第３番目のＨは水平方向のランレングスを表す。第４番
目と第５番目の２バイトにより白が１２８続くことを表
す（輪郭線１は第１ラインの左端から１２８番目の画素
の点から開始される）。

【００４９】第６番目〜第８番目は輪郭線１の垂直方向
のズレを表す。だい６番目のデータは，第２ラインの輪
郭線１（Ｖ１−ＺＬ２１）と第１ラインの輪郭線１（Ｈ
１−ＲＬ１）との間にはズレがないことを表す。第７番
目のデータは第３ラインの輪郭線（Ｖ１−ＺＬ３１）は
第２ラインの輪郭線１（Ｖ１−ＺＬ２１）より左に１画
素ずれていることを表す。第８番目のデータは第４ライ
ン輪郭線１（Ｖ１−ＺＬ４１）と第３ラインの輪郭線１
（Ｖ１−ＺＬ３１）との間にズレがないことを表す。第
９番目データＰは第５ライン以降垂直方向に輪郭線が存
在しないことを表す。第９番目〜第１６番目は輪郭線２
（Ｈ２−ＲＬ２，Ｖ２−ＺＬ２２，Ｖ２−ＺＬ３２，Ｖ
２−ＺＬ４２）のデータを表す。

【００５０】同様に，図１４は輪郭線３（Ｈ３−ＲＬ３
，Ｖ３−ＺＬ４３，Ｖ３−ＺＬ５３，Ｖ３−ＺＬ６３）
，および輪郭線４（Ｈ４−ＲＬ４，Ｖ３−ＺＬ４４，Ｖ
３−ＺＬ５４，Ｖ３−ＺＬ６４）を表す。輪郭線データ
の場合にも，入力シンボルを図１５におけるランレング
スデータの場合と同じアルゴリズムにより符号化および
辞書への登録を行う。

【００５１】図１３の例においては，第１番目のデータ
１は辞書の初期値の登録番号により符号１を出力する。第２番目のデータ０も同様符号０を出力する。そこで，
第２１２の第３番目の間はデータの連続性がなく，登録
条件を満たさないので，文字列「０＋１２８」は登録し
ない。第３番目のデータ１２８は符号１２８（０）を出
力し，文字列「１２８＋１２８」を辞書０に登録する。

【００５２】以後第４番目以降のデータも同様に符号化
を進めるが，第９番目のデータと第１０番目のデータの
間，さらに図１４における第２番目のデータと第３番目
のデータの間，第８番目のデータと第９番目のデータの
間はデータが断続しているので，それぞれの間に跨がる
文字列の登録は行わない。

【００５３】図１５，図１６は本発明の実施例（３）を
示す。図１４，図１５は図１３，図１４の輪郭線データ
例（１）のデータの配列を変更したものである。水平方
向のランレングスの開始座標を示すためのデータＨおよ
び垂直方向に輪郭線が存在しないことを示すデータＰは
０が多数並び似たような二値データのパターンをもつの
で，それらをランレングスを表す数値，垂直方向のズレ
を表す数値のデータの前にまとめるようにした。そして
，データＨとでＰの間に，ランレングスを表す数値，垂
直方向のズレを表す数値のデータの数だけのデータＶ（
「００００００００」を配列するようにした。そのよう
にすることにより似たパターの文字列が連続して現れる
ようになり，辞書への登録文字列数を減らすることがで
きる。

【００５４】図１５における第２番目のデータと第３番
目のデータの間，第７番目のデータと第８番目のデータ
の間，第１２番目のデータと第１３番目のデータの間，
第１７番目のデータと第１８番目のデータの間，および
図１６の第２番目のデータと第３番目のデータの間，第
７番目のデータと第８番目のデータの間，第１１番目の
データと第１２番目のデータの間，第１６番目のデータ
と第１７番目のデータの間はデータが断続し，登録条件
を満たしていないので，その間に跨がる文字列の登録は
行わない。

【００５５】図１７〜図１９により，本発明の符号化の
アルゴリズム（１）を示す。図は二次元変換された画像
データをＬＺＷ符号により符号化する場合のフローの実
施例である。図のフローは前述の図７〜図８にデータの
切れ目の判定処理（図１８のＳ４，図１９のＳ１２，Ｓ
１３）を加えたものである。

【００５６】図のフローにおいて，全体辞書は，従来の
ＬＺＷ符号におけると同様に，文字列を出現する順に全
て登録する辞書である。個別辞書は，登録しようとする
文字列の直前の文字列毎の辞書であり，登録する文字列
は，直前の文字列に対応する個別辞書に，その辞書のイ
ンデックスにより登録する。

【００５７】Ｓ１　　初期設定として，出現する文字の
総数Ｍに対して，従来のＬＺＷ符号化と同様に全体辞書
の木の節点（インデックス）をＮで管理し，全体辞書の
先頭アドレスＮをＭに設定する。また，分割辞書の個数
をＡとして，直前の文字列の最終文字で選択するＡ個の
分割辞書の各木ｉについて節点（インデックス）の個数
をｉｎｄｃ（ｉ）で管理する。まず，初期化としてＡ個
のｉｎｄｃ（ｉ）を０にクリアする。最初，直前文字列
はないので，直前文字列の最終文字列の最終文字を示す
ＰＫは０にセットするとともに最初のインデックス（語
頭文字列）ωを０にセットしておく。最初の木の深さＤ
Ｐも同じく０にセットし，前回のデータの切れ目情報Ｃ
１を切れ目として１にセットする。Ｓ２　　次の文字Ｋを入力する。Ｓ３　　データの切れ目を認識し，Ｓ４で直前文字列の
最終文字ＰＫと次の文字Ｋの間がデータの切れ目かどう
か判断する。切れ目ならばＳ５にて現在の切れ目を示す
Ｃ２を１に，切れ目でないならばＳ６にて現在の切れ目
を示すＣ２をセットしてＳ７に進む。

【００５８】Ｓ７　　従来のＬＺＷ符号化と同様に，全
体辞書にωＫが登録されているかどうか検索する。ωＫ
の文字列が登録されているならばＳ８にて全体辞書の登
録されているアドレスωＫを新たなωとして置き換え，
文字列の深さＤＰを１つ増やし，入力文字列Ｋを最終文
字列の最終文字ＰＫ１とし，Ｓ１８のデータの終了確認
を経由した後，Ｓ２に戻り，次の文字を入力して，辞書
に登録してあるかどうかの検索操作を繰り返し，入力デ
ータに一致する辞書の登録済の最長文字を検索する。

【００５９】Ｓ７にてωＫの文字列が登録されてなけれ
ば，辞書内に存在する最長文字列が見つかったものとし
て，Ｓ９以降の符号化および辞書登録を行う。本実施例
においては，符号語は二つのモードに分けて出力する。即ち，Ｓ９にて，探索木の深さＤＰが０ならば，探索木
の各根に付く葉を登録するものとして，Ｓ１０で生デー
タを符号化する（モード１：求めた木の〔最大インデッ
クス＋１〕に続けて入力した文字Ｋを生データとして出
力する）。また，深さＤＰが０でないならば，前記以外
の葉としてＳ１１にて文字列ωをそのイッデックスで符
号化する（モード２：全体辞書のインデックスωを分割
辞書のインデックスｉに変換した後，出力する）。

【００６０】Ｓ１２およびＳ１３　　前回の切れ目情報
Ｃ１と今回の切れ目情報Ｃ２から，条件に従って文字列
の登録，登録しないを判定する。この場合，Ｃ１＝１，
またはＣ１＝０でかつＣ２＝０ならばＳ１４にて登録す
る。Ｃ１＝０かつＣ２＝１ならば登録を行わずＳ１５へ
進む。Ｓ１４　　符号化済インデックスωと次の文字Ｋの組を
全体辞書Ｄの新しいアドレスＮに登録すると共に，分割
辞書ＩのアドレスＮに直前の文字列の各最終文字ＰＫか
ら始まる辞書のＫ毎の新たなインデックスｉｎｄｃ（Ｐ
Ｋ）を登録した後，Ｎとｉｎｄｃ（ＰＫ）をインクリメ
ントする。この分割辞書を作成しておくことで，ＬＺＷ
符号と同様の手順で全体辞書のインデックスωを見つけ
た後，分割辞書のＩ（ω）を参照することで，インデッ
クスωを直前の文字列の最終文字から始まるイッデック
スｉに変換することができる。

【００６１】Ｓ１５　　Ｓ９と同じく，探索木の深さＤ
Ｐが０ならば，探索木の各根に直接付く葉として，Ｓ１
６に進み，直前文字列の最終文字ＰＫを入力文字Ｋに置
換し，全体辞書のインデックスωを同じく入力文字Ｋに
置換すると。さらに，探索木の深さＤＰを０にしてＳ１
８に進む。Ｓ１５にて探索木の深さＤＰが０でないなら
ば，前記以外の葉としてＳ１７に進み，直前文字列の最
終文字ＰＫを登録文字列の最終文字Ｋ１に置換し，全体
辞書のインデックスωを同じＫ１に置換する。さらに，
探索木の深さＤＰを０にしてＳ３に戻る。

【００６２】図２０〜図２４は，本発明の復号化のアル
ゴリズム（１）を示す。図のフローは図１７〜図１９に
おける符号化の場合と同様に，各分割辞書に対して最初
に出現する文字を初期登録しない場合のフローである。復号化は，符号化の逆の操作をするものであるが，従来
のＬＺＷ符号の復号化と同様に，辞書への新たな文字列
の登録が符号化のときより１テンポ遅れるものである。即ち，符号化では，注目文字列の符号化を終了した時点
で一文字延ばした文字列を〔注目文字列，次の文字列〕
の組を辞書に登録できる。これに対して，復号化では，
注目文字列を一文字延ばすときは，次の文字列の先頭文
字と合わせて辞書に登録するため，次の文字列の復元が
終了した時点で登録を行う。

【００６３】ステップに従って，フローを説明する。Ｓ１　　まず，符号化のとき（図１７）と同じように初
期設定を行う。さらに，復号化では，直前々の文字列の
最終文字ＰＫ１を０，直前の符号ＯＬＤｃｏｄｅを０と
する。Ｓ２　　次の符号を読み，それをＮＥＷｃｏｄｅとする
。Ｓ３　　現符号ＣＯＤＥが定義されているかチァックす
る。本発明では，前述のように符号語を二つのモードに
分けている。モード２においては符号がＣＯＤＥに定義されているの
で，Ｓ４以降の次の文字を復元した時点で辞書に登録す
る動作に移行する。またモード１では，符号はＣＯＤＥ
に定義されていないので，Ｓ１２以降の注目文字列の復
元が終了した時点で辞書に登録する動作に移行する。

【００６４】Ｓ４　　モード２の符号として分割辞書の
インデックスＣＯＤＥを入力しているので，本発明では
，分割辞書のインデックスＣＯＤＥと直前文字列の最終
文字ＰＫの組合せから，全体辞書のインデックスを逆引
きする辞書Ｑを持ち，分割辞書のイッデックスから全体
辞書のインデックスを求め，それをＮＥＷｃｏｄｅとし
て，また，全体辞書のインデックスＣＯＤＥに置き換え
る。Ｓ５　　全体の辞書のインデックスＣＯＤＥに対応する
文字列ｃｏｄｅ（ωＫ）を辞書から読み出し，Ｓ６で文
字Ｋを一時的にスタックし，参照番号ｃｏｄｅ（ω）を
新たなＣＯＤＥとして再度，Ｓ５に戻し，このＳ５，Ｓ
６の手順を再帰的に参照番号ωが一文字にいたるまで繰
り返し，最後にＳ７に進んでＳ６でスタックした文字を
ＬＩＬＯ（Ｌａｓｔ　Ｉｎ　Ｆａｓｔ　Ｏｕｔ）形式で
ポップアップして出力する。

【００６５】Ｓ８　　直前の文字列が辞書に未登録かど
うか判断し，未登録ならｘ９に進み，登録されているな
らばＳ１１に進む。Ｓ９　　データの切れ目情報から，登録する，登録しな
いの判定を行う。登録するならばＳ１０で登録処理を行
い，登録しないならＳ１１に進む。この際の登録する，
登録しないの判断は，符号化の場合と同じ条件に従って
行う。Ｓ１０　　直前の符号ＯＬＤｃｏｄｅと直前文字の最終
文字ＰＫとの組合せをアドレスＮの全体辞書Ｄに登録し
，逆引き辞書Ｑの直前々の最終文字ＰＫ１，分割辞書の
インデックスｉｎｄｃ（ＰＫ１）の組合せアドレスにＮ
を代入するとともに，分割辞書のｉｎｄｃ（ＰＫ１）の
値をＮに置き換え，Ｎをインクリメントする。

【００６６】Ｓ１１では，ＰＫをＰＫ１に，復元文字列
の最終文字をＰＫに，復元文字列の第１文字をｃｈａｒ
に，ＮＥＷｃｏｄｅをＯＬＤｃｏｄｅに，Ｃ２をＣ１に
代入し，Ｓ３に戻る。Ｓ１２では，モード１の符号を解読するため，まず，入
力ＣＯＤＥがモード１の第１番目の符号（分割辞書の最
大インデックスｉｎｄｃ（ＰＫ）＋１かどうかチェック
する。第１番目のモード符号ならば，Ｓ１３にて，直前
の文字列の第１文字ｃｈａｒを出力し，ＯＬＤｃｏｄｅ
をＣＯＤＥに，ＯＬＤｃｏｄｅとｃｈａｒの組の登録さ
れているインデックスをＮＥＷｃｏｄｅに代入した後，
Ｓ５に進む。Ｓ１２にて入力ＣＯＤＥが第２番目の符号
と判断された場合，Ｓ１４にて符号ＣＯＤＥを生データ
Ｋとして出力し，Ｓ１５に進む。

【００６７】Ｓ１５からＳ１７は，Ｓ８からＳ１０の動
作と全く同じで，直前の文字列の登録処理を行う，行わ
ないの判断をし，登録する場合には登録を行い，登録し
ない場合には，Ｓ１８で切れ目情報Ｃ２をＣ１に代入し
，Ｓ１９に進む。Ｓ１９では，Ｓ８，Ｓ１５と同じデータの切れ目による
登録の判断を行い，登録すると判断した場合はＳ２０に
進み，注目文字列の登録を行う。また，Ｓ１９にて，登
録しないと判断した場合にはＳ２１で切れ目情報Ｃ２を
Ｃ１に代入した後Ｓ２２に進む。

【００６８】図２５〜図２６は，本発明の符号化のアル
ゴリズム（２）を示す。図のフローは，各分割辞書に対
して，出現する文字（一文字）を全て初期値として登録
しておく場合のものである。まず，Ｓ１において，初期
設定として，出現する文字の総数Ｍ，分割辞書の個数Ａ
に対して，Ａ個の分割辞書Ｄｉ　にＭ個の文字を初期登
録する。次に，　直前の文字列の最終文字で選択するＡ
個の分割辞書の各木ｉについて節点（　インデックス）
　の個数ｉｎｄｃ（ｉ）で管理する。まず，初期化とし
てＡ個のｉｎｄｃ（ｉ）をＭ＋１にセットする。まず，
最初のＫを入力し，それを，インデックス（語頭文字列
）ωとすると共に，直前文字列の最終文字Ｋ１にも代入
する。直前文字列の最終文字からの履歴ＰＫを定義し，
それを０にセットする。そして，直前文字列の最終文字
Ｋ１から使用すべき辞書番号に対応づけるテーブルＬＵ
Ｔを設置する。また，前回の切れ目情報Ｃ１をセットす
る。

【００６９】Ｓ２　　次の文字Ｋを入力する。Ｓ３　　データの切れ目を認識する。Ｓ４〜Ｓ６　　（図１８におけるＳ４〜Ｓ６と同じであ
る）。Ｓ７　　ωＫが分割辞書Ｄｐｋに存在するかどうかをチ
ェックする。存在する場合にはＳ８に進み，　ωＫを新
たなωに置き換える。Ｓ１３を経てＳ２に戻り，一致す
る最長文字列を検索する。

【００７０】Ｓ７において，ωＫが分割辞書Ｄｐｋに存
在せず，最長文字列の検索を終了した場合，Ｓ９とＳ１
０のデータの切れ情報の判断に従って，登録する場合は
Ｓ１１に進み，登録しない場合はＳ１２に進む。判断条
件は，前述した通りである。Ｓ１１では，分割辞書のｃｏｄｅ（ω）を出力するとと
もに，アドレスｉｎｄｃ（ＰＫ）の分割辞書Ｄｐｋにω
き登録した後，Ｋをωに代入し，ｉｎｄｃ（ＰＫ）をイ
ンクリメントする。そして，履歴ＰＫをＬＵＴ（Ｋ１）
としてＳ１３に進む。また，Ｓ１２では，分割辞書のｃ
ｏｄｅ（ω）を出力し，登録を行わずにＫをωに代入し
，履歴ＰＫをＬＵＴ（Ｋ１）としてＳ１３に進む。

【００７１】次に，図２８〜図３０により，本発明の復
号化のアルゴリズム（２）を示す。復号化においても，
符号化の場合と同様に各分割辞書に対して，最初に出現
する文字列を全て初期登録しておく。Ｓ１　　符号化の初期設定と同じに初期設定する。Ｓ２　　最初の符号を読み取り，ＯＬＤｃｏｄｅとする
。ＣＯＤＥに対応する分割辞書のＤｐｋから文字Ｋ復元し
，出力するとともに，文字Ｋをｃｈａｒに，ＰＫをＰＫ
１に，ＬＵＴ（Ｋ）をＰＫに代入する。Ｓ３　　次の符号を読み，ＮＥＷｃｏｄｅとする。Ｓ４〜Ｓ８までは，分割辞書Ｄｐｋで行う点以外は図２
１のＳ４〜Ｓ７と同じである。

【００７２】Ｓ９　　データの切れ目をによる登録する
かしないかの判定を行う。登録しない場合はＳ１１に進
む。また登録する場合はＳ１０において，直前の符号Ｏ
ＬＤｃｏｄｅと直前文字列の最終文字Ｋとの組合せをア
ドレスｉｎｄｃ（ＰＫ１）の分割辞書Ｄｐｋに登録する
。次に，インデックスｉｎｄｃ（ＰＫ１）の値をインクリ
メントし，Ｓ１１に進む。Ｓ１１　　復元文字列の第１文字をｃｈａｒに，復元文
字列の最終文字をＫ１に，履歴ＰＫをＰＫ１に，ＬＵＴ
（Ｋ１）をＰＫに，Ｃ２をＣ１に，ＮＥＷｃｏｄｅをＯ
ＬＤｃｏｄｅに各々代入し，Ｓ２２を経てＳ３に戻る。

【００７３】

【発明の効果】本発明によれば，画像データにおけるデ
ータの連続性を認識しながら，分割辞書への登録をする
かしないかを判断するようにしたので，相関の弱いデー
タ系列は登録されないことになり，インデックスの増加
を防ぐことができる。また，網点画像の網点相関のよう
に相関の強いデータ系列は，登録してゆく過程において
学習され，意味のあるデータ系列だけが残るので，無駄
な登録が少なくなり効果的に圧縮できるようになる。

【図面の簡単な説明】

【図１】本発明の基本構成を示す図である。

【図２】本発明の原理説明図である。

【図３】本発明の復号化のフローの原理を示す図である
。

【図４】ＬＺＷ符号の登録方法を示す図である。

【図５】改良されたＬＺＷ符号の説明図である。

【図６】改良されたＬＺＷ符号の具体例を示す図である
。

【図７】改良されたＬＺＷ符号化のフローを示す図であ
る。

【図８】改良されたＬＺＷ符号化のフローを示す図であ
る（図７の続き）。

【図９】改良されたＬＺＷ符号の復号フローを示す図で
ある。

【図１０】改良されたＬＺＷ符号の復号フローを示す図
である（図９の続き）。

【図１１】改良されたＬＺＷ符号の復号フローを示す図
である（図１０の続き）。

【図１２】本発明の実施例（１）を示す図である。

【図１３】本発明の実施例（２）を示す図である。

【図１４】本発明の実施例（２）を示す図である（図１
３の続き）。

【図１５】本発明の実施例（３）を示す図である。

【図１６】本発明の実施例（３）を示す図である（図１
５の続き）。

【図１７】本発明の符号化アルゴリズム（１）を示す図
である。

【図１８】本発明の符号化アルゴリズム（１）を示す図
である（図１７の続き）。

【図１９】本発明の符号化アルゴリズム（１）を示す図
である（図１８の続き）。

【図２０】本発明の復号化のアルゴリズム（１）を示す
図である。

【図２１】本発明の復号化のアルゴリズム（１）を示す
図である（図２０の続き）。

【図２２】本発明の復号化のアルゴリズム（１）を示す
図である（図２１の続き）。

【図２３】本発明の復号化のアルゴリズム（１）を示す
図である（図２２の続き）。

【図２４】本発明の復号化のアルゴリズム（１）を示す
図である（図２３の続き）。

【図２５】本発明の符号化のアルゴリズム（２）を示す
図である。

【図２６】本発明の符号化のアルゴリズム（２）を示す
図である（図２５の続き）。

【図２７】本発明の符号化のアルゴリズム（２）を示す
図である（図２６の続き）。

【図２８】本発明の復号化のアルゴリズム（２）を示す
図である。

【図２９】本発明の復号化のアルゴリズム（２）を示す
図である（図２８の続き）。

【図３０】本発明の符号化のアルゴリズム（２）を示す
図である（図２９の続き）。

【図３１】ＬＺＷ符号化説明図である。

【図３２】ＬＺＷ符号復号化説明図である。

【図３３】ＬＺＷ符号化フローを示す図である。

【図３４】ＬＺＷ復号化のフローを示す図である。

【図３５】画像の例を示す図である。

【図３６】ランレングスデータの例を示す図である。

【図３７】ランレングスデータの例を示す図である（図
３６の続き）。

【図３８】データの配列を示す図である。

【符号の説明】

１　　　　画像データ入力部２　　　　二次元データ変換部３　　　　符号作成部４　　　　符号出力部５　　　　文字列入力部６　　　　検索部７　　　　辞書８　　　　登録部９　　　　符号語作成部１０　　登録条件判定部１１　　登録することの処理１１’登録しないことの処理１２　　判定部１３　　判定部

Claims

【特許請求の範囲】

【請求項１】　　画像データを文字列として表す圧縮お
よび復元する方式において，画像データを水平方向と垂
直方向の二次元データに変換する二次元データ変換部（
２）　と，二次元データ変換部（２）　のデータを文字
列として入力し，符号化する符号化部（３）　とを備え
，符号化部（３）　は，入力される文字列を出現する異
なる文字部分列毎に辞書（７）に登録し，文字列を辞書
に登録された最長文字部分列の登録番号に基づいて符号
化するものであって，順次入力される文字列において，
画像の連続性について判定し，出現した文字部分列を登
録するかしないかを画像の連続性に基づいて判定する登
録条件判定部（１０）を備え，出現する文字部分列につ
いて登録条件を満たしている場合には辞書に登録し，登
録条件を満たしていない場合には辞書に登録しないよう
にするとともに，入力文字列を，辞書に登録された最長
文字部分列の登録番号に基づいて符号化することを特徴
とするデータ圧縮方式。
【請求項２】　　請求項１において，出現する文字部分
列の最終文字もしくは最終文字によるグループ毎に辞書
（７）　を作成し，文字部分列の登録は，登録する文字
部分列の直前の文字部分列の最終文字または文字グルー
プの辞書に登録することを特徴とするデータ圧縮方式。
【請求項３】　　請求項１および２において，符号化部
はＬＺＷ符号により入力文字列を符号化するものである
ことを特徴とするデータ圧縮方式。
【請求項４】　　請求項１，２もしくは３に記載のデー
タ圧縮方式により符号化した圧縮データを入力し，復元
する方式において，入力された符号に基づいて辞書を復
元し，復元された辞書における文字部分列と登録番号に
より符号を文字部分列に復元することを特徴とするデー
タ復元方式。