JPH08149016A

JPH08149016A - 文字列の符号化方法

Info

Publication number: JPH08149016A
Application number: JP28384694A
Authority: JP
Inventors: Junichiro Hagiwara; 淳一郎萩原
Original assignee: Nippon Telegraph and Telephone Corp; NTT Mobile Communications Networks Inc
Current assignee: NTT Docomo Inc; Nippon Telegraph and Telephone Corp
Priority date: 1994-11-17
Filing date: 1994-11-17
Publication date: 1996-06-07

Abstract

(57)【要約】【目的】最近出現した文字列の出現頻度が高くなると
いう情報源の性質を考慮し、圧縮率の高い符号化方法を
実現する。【構成】文字列ａ〜ｚおよびズペースを辞書番号（例
えば「１」〜「２７」）に対応付ける辞書を使用し、動
的辞書法により情報源文字列を辞書番号に順次変換し、
該辞書番号を該文字列に対応した符号として伝送する方
法において、情報源文字列として既に辞書内に定義され
たものが出現した場合には該当する辞書番号を上記符号
として出力する一方、情報源文字列として新規な文字列
が出現した場合には、この新規な文字列に対し、所定の
最小値「１」を辞書番号として割り当て、その時点にお
いて辞書に既に定義済み各文字列の辞書番号を最小値
「１」と重複しないように１つずつずらすようにし、最
近出現した文字列ほど小さな値の辞書番号が割り当てら
れるようにした。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は動的辞書法を使用した
文字列の符号化方法に関する。

【０００２】

【従来の技術】

Ａ．増分分解型動的辞書法ユニバーサル情報源符号化法の１つとして増分分解型動
的辞書法がある。この増分分解型動的辞書法において
は、順次与えられる情報源の文字列を符号化してゆく
際、最近出会った情報源の文字列を辞書に登録してお
き、辞書内に定義された文字列の中から情報源の文字列
に一致する文字列（最長一致系列）が見つかるとその中
から最長の文字列の辞書番号を出力して符号化する。そ
して、復号の際には符号化と同様に辞書を構成して辞書
番号から元の情報源の文字列を再生する。なお、この増
分分解型動的辞書法の詳細な手順については、後に具体
例を挙げて詳述する。

【０００３】Ｂ．増分分解型動的辞書法の諸形態以上が増分分解型動的辞書法の基本的な手順であるが、
この動的辞書法は、（１）辞書の初期設定（２）文字列を辞書に追加する方法（３）辞書が一杯になる前の辞書動作（４）辞書が一杯になった後の辞書動作（５）辞書番号の２進数表現等により、種々な亜種がある。以下に各々の項目におい
て、既に提案されている方法を説明する。

【０００４】（１）辞書の初期設定に関する各種の技術ａ．空の状態から辞書構成を開始する方法すなわち、全く辞書項目がない状態から辞書構成を開始
する方法である。

【０００５】ｂ．辞書を情報源アルファベット一文字で
初期化した状態から辞書構成を開始する方法例えば、アルファベット小文字ａ〜ｚおよびスペースか
らなる２７文字を初期の文字列（各文字列は長さが１文
字）とし、各文字列に１〜２７番までの辞書番号を与
え、この初期状態から辞書構成を開始する。

【０００６】ｃ．何らかの先見情報に基づいて辞書に特
殊な初期化を施してから辞書構成を開始する方法例えば、一般に出現頻度の高い文字（英文字ならばｔｈ
ｅ等）に優先的に番号を与える方法などが相当する。

【０００７】（２）文字列を辞書に追加する方法ａ．前回の最長一致文字列と今回の最長一致文字列の先
頭の一文字とを結合させた文字列を辞書に追加登録する
方法例えば、前回の最長一致文字列が「ｔｈｅ」、今回の最
長一致文字列が「ｃａｔ」とした場合、「ｔｈｅ − ｃ」を辞書に追加登録する。

【０００８】ｂ．前回の最長一致文字列と今回の最長一
致文字列とを結合させた文字列を辞書に追加登録する方
法例えば、前回の最長一致文字列が「ｔｈｅ」、今回の最
長一致文字列が「ｃａｔ」とした場合、「ｔｈｅ − ｃａｔ」を辞書に追加登録する。

【０００９】ｃ．前回の最長一致文字列と今回の最長一
致文字列の全てのプレフィックスパターンとの結合を辞
書に追加登録する方法例えば、前回の最長一致文字列が「ｔｈｅ」、今回の最
長一致文字列が「ｃａｔ」とした場合、「ｔｈｅ − ｃ」「ｔｈｅ − ｃａ」「ｔｈｅ − ｃａｔ」のすべてを辞書に追加登録する。

【００１０】（３）辞書が一杯になる前の辞書動作ａ．新規追加文字列にシーケンシャルに番号を与える。
例えば図２に示すような辞書があり、１番“ａ”の後に
“ｔ”、その後に“ｈ“、その後に“ｅ”を追加する場
合を考える。この場合、“ａｔ”は２８番、“ａｔｈ”
は２９番、“ａｔｈｅ”は３０番になる。

【００１１】（４）辞書が一杯になった後の動作ａ．辞書を全てクリアする。ｂ．最長時間未使用文字列を１つ削除する（ＬＲＵアル
ゴリズムを用いる）。ｃ．最も使われなかった文字列を１つ削除する（辞書の
全項目について一致回数をチェックしてその結果を利用
する）。ｄ．辞書を複数用意して別の辞書に切り換える。

【００１２】（５）辞書番号の２進数表示ａ．最大辞書サイズにあわせた固定長符号を辞書番号と
して使用する。この方法においては、辞書番号の最大値
を表現可能な符号長の固定長符号により辞書番号を表現
する。例えば辞書番号の最大値が４０９６＝２＊＊１２
（ただし、＊＊はべき乗を表わす。以下において同
じ。）の場合には、１２ビットの自然２進数表記を用い
る。

【００１３】ｂ．各時点での辞書サイズにあわせた可変
長符号を辞書番号として使用する。この方法において
は、辞書番号が規定最大値になる前ならば、その時点で
の最大値を表現できる長さで符号化を行う。例えば辞書
番号が９＝２＊＊３＋１以上であり、かつ、１６＝２＊
＊４以下の場合に、４ビットの自然２進表記を用いる。
辞書が一杯になった後は、辞書番号の最大値を表現可能
なサイズに符号長を固定する。

【００１４】ｃ．統計的符号（ハフマン符号、算術符号
等）を辞書番号として使用する。この方法においては、
ハフマン符号、算術符号等の統計的符号を用いる。この
ため辞書番号を２進表記した符号の平均符号長は、ａ〜
ｃの３方法のなかで最小となる。従って統計的符号を用
いる場合、圧縮率は方法ａ，ｂに比べ高くなる。しか
し、動的辞書法の辞書構成の他に統計的符号自身の符号
化処理を行わなければならないため、処理速度は方法
ａ，ｂに比べ低下する。統計的符号の特徴は次の通りで
ある。

【００１５】＜静的な統計的符号の特徴＞動的辞書法の中間出力がある程度蓄積してから最終出
力を出す。復号テーブルが必要である。ある程度の文字をまとめ、同一の符号条件により符号
化を行うため処理速度が速い。

【００１６】＜動的な統計的符号の特徴＞動的辞書法の中間出力を１つずつに対し、符号条件を
動的に更新して最終出力を出す。復号テーブルが不要である。１文字づつ符号条件を更新していくため処理速度が遅
い。

【００１７】Ｃ．増分分解型動的辞書法の例以上、増分分解型動的辞書法の基本的手順およびその諸
形態について説明したが、ここでさらに理解を容易にす
るため、実例を挙げて増分分解型動的辞書法の具体的な
実行方法について説明する。なお、以下説明する例に上
記分類を適用すると次のようになる。

【００１８】（１）辞書の初期設定；方法ｂを適用（２）文字列を辞書に追加する方法；方法ａを適用（３）辞書が一杯になる前の辞書動作；方法ａを適用（４）辞書が一杯になった後の辞書動作；方法ａを適用（５）辞書番号の２進数表現；方法ａを適用

【００１９】さて、この例では、情報源シンボルは英ア
ルファベットの小文字２６種およびスペースの計２７種
とする。そして情報源文字列“ａｂａｂｃｂａｂａｂａ
ａａａａａａ”を符号化および復号する場合を考える。

【００２０】まず、図３〜図５を参照し、文字列の符号
化を行う手順について説明する。周知の通り、動的符号
化においては、辞書を参照することにより、１文字また
は複数文字からなる文字列を単位として符号への変換を
行う。このような変換の単位を、以下、便宜上、系列と
呼ぶ。符号化に先立ち、文字列を符号列に変換するのに
使用する系列が辞書内になければならない。まず、この
ための辞書の初期化を行う。この初期化によって得られ
た辞書の内容を図６（ａ）に示す。この例ではアルファ
ベットにより構成された文字列の符号化を行う。従っ
て、ａ〜ｚの英小文字およびスペースの２７種類の文字
を当初の変換対象として想定し、ａ〜ｚおよびスペース
の２７系列により辞書を構成する。また、ａ〜ｚおよび
スペースの各系列には「１」〜「２７」での辞書番号を
割り当てる（以上、図６（ａ）参照）。

【００２１】次に情報源文字列“ａｂａｂｃｂａｂａｂ
ａａａａａａａ”の第１文字目を符号化開始位置として
設定し、辞書を構成する各系列と情報源文字列の符号化
開始位置以降の部分とを対比する。そして、情報源文字
列“ａｂａｂｃｂａｂａｂａａａａａａａ”における符
号化開始位置から始まる連続した各文字列の中からいず
れかに一致するものを上記各系列の中から求め、このよ
うにして求めた系列のうち最長のものを選択する。この
ようにして得られる系列が上述した最長一致系列であ
る。また、この最長一致系列に対応した情報源文字列側
の部分を、以下では最長一致文字列という。

【００２２】この場合、辞書内の各系列はすべて長さが
１であるため、文字列“ａｂａｂｃｂａｂａｂａａａａ
ａａａ”の第１文字“ａ”に対応した系列“ａ”が最長
一致系列として得られ、この系列“ａ”に対応した辞書
番号「１」が得られる。

【００２３】このようにして第１文字目までの変換が終
了すると、情報源文字列のうち次回の最長一致文字列の
先頭の１文字、すなわち、この場合には第１文字目まで
の変換が終了しているので第２文字目の“ｂ”を求め
る。そして、第１文字目の変換に使用した最長一致系列
“ａ”に対してこの“ｂ”を連結した系列“ａｂ”を辞
書に加え、この“ａｂ”に辞書番号「２８」を割り当て
る（以上、図３（ｂ）参照）。

【００２４】次に、第２文字目を符号化開始位置として
設定する。そして、上記と同様に、情報源文字列“ａｂ
ａｂｃｂａｂａｂａａａａａａａ”における符号化開始
位置から始まる連続した各文字列のいずれかに一致する
ものを辞書を構成する各要素の中から求め、そのうち最
長の系列を選択する。この結果、文字列“ａｂａｂｃｂ
ａｂａｂａａａａａａａ”の第２文字に対応した系列
“ｂ”が最長一致系列として得られ、この系列“ｂ”に
対応した辞書番号「２」が得られる。このようにして第
２文字目までの変換が終了すると、変換対象たる文字列
のうち次回の最長一致文字列の先頭の１文字である
“ａ”を求める。そして、第２文字目の変換に使用した
最長一致系列“ｂ”に対してこの“ａ”を連結した系列
“ｂａ”を辞書に加え、この“ｂａ”に辞書番号「２
９」を割り当てる（以上、図３（ｃ）参照）。

【００２５】そして、第２文字目までの変換が終了する
ことにより、符号化開始位置を第３文字目として符号へ
の変換を行う。この場合、辞書内の各系列のうち系列
“ａｂ”が、文字列“ａｂａｂｃｂａｂａｂａａａａａ
ａａ”の第３文字目から始まる文字列“ａｂ”と一致す
る。このようにして系列“ａｂ”および文字列系列“ａ
ｂ”が最長一致系列および最長文字系列として求めら
れ、この系列“ａｂ”に対応した符号「２８」が得られ
る。このようにして変換対象文字列の第３および第４文
字が符号「２８」に変換され、第４文字目までの変換が
終了することとなる。

【００２６】そして、変換対象たる文字列のうち次回の
最長一致文字列の先頭の１文字、すなわち、この場合に
は第４文字目までの変換が終了しているので第５文字目
の“ｃ”を求める。そして、第３および第４文字の変換
に使用した最長一致系列“ａｂ”に対してこの“ｃ”を
連結した長さが３の系列“ａｂｃ”を辞書に加え、この
“ａｂｃ”に辞書番号「３０」を割り当てる（以上、図
３（ｄ）参照）。

【００２７】以下、同様に、辞書内の系列と文字列にお
ける符号化開始位置以降の部分とが一致する都度、当該
系列に最長一致文字列の次の１文字を加えた新たな系列
を辞書に追加しつつ、文字列の後方へ向けて符号化が進
められる（図４、図５参照）。

【００２８】以上の処理により、情報源文字列“ａｂａ
ｂｃｂａｂａｂａａａａａａａ”に対応し、上記各辞書
番号からなる符号列「１，２，２８，３，２９，３２，
１，３４，３５」が得られ、この符号列が復号側に送ら
れる。

【００２９】復号側においては、この符号列から情報源
文字列の復号が行われる。以下、図６〜図８を参照し、
この復号処理について説明する。

【００３０】まず、辞書の初期化を行い、辞書の内容を
符号化の際に使用した初期化時点のものにする（図６
（ａ）参照）。次に最初の符号「１」を取り出し、辞書
を構成する各系列の中から符号「１」が割り当てられた
系列“ａ”を求め、復号結果たる第１文字“ａ”を出力
する。そして、辞書を構成する各系列の中から最初の符
号「１」の次の符号「２」に対応した系列“ｂ”を求
め、最初の符号に対応した系列“ａ”にこの系列“ｂ”
を連結した系列“ａｂ”を辞書に追加し、この系列“ａ
ｂ”に符号「２８」を割り当てる（以上、図６（ｂ）参
照）。

【００３１】次に第２番目の符号「２」を取り出し、辞
書を構成する各系列の中から符号「２」が割り当てられ
た系列“ｂ”を求め、復号結果たる第２文字“ｂ”を出
力する。そして、辞書を構成する各系列の中から符号
「２」の次の符号「２８」に対応した系列“ａｂ”を求
め、系列“ｂ”にこの系列“ａｂ”の第１文字目を連結
した系列“ｂａ”を辞書に追加し、この系列“ｂａ”に
符号「２９」を割り当てる（以上、図６（ｃ）参照）。

【００３２】次に第３番目を符号「３」を取り出し、同
様の復号処理を行うことにより、図６（ｄ）に示す結果
となる。以下、同様に、符号化の際と全く同一の手順で
辞書を更新しつつ復号処理が進められ、元の情報源文字
列“ａｂａｂｃｂａｂａｂａａａａａａａ”が復元され
る（図７、図８参照）。

【００３３】

【発明が解決しようとする課題】さて、上述した従来の
動的辞書法では次のような問題点がある。まず、通常情
報源に含まれる冗長性は同じ文字列を近い場所で繰り返
し多用するという形で現れる。従って最近辞書に追加し
た文字列ほど良く参照され、次に最長一致文字列の候補
となる可能性が高い。従って、よく参照され出力される
辞書番号に短い符号を与えると、圧縮率が一層高まるこ
ととなる。

【００３４】ところで、従来の技術の項において（３）
として説明したように、従来の動的辞書法における辞書
が一杯になる前の辞書の動作においては、新規追加文字
列にシーケンシャルに辞書番号を与えている。このよう
な方法では最近追加した文字列ほど大きな辞書番号が与
えられる。

【００３５】また、従来の技術の項において（５）とし
て説明したように、辞書番号の表現方法としては上記
ａ，ｂ，ｃの３方法があったが、いずれの方法をとった
としても、最近追加した文字列に付与する辞書番号に対
しビット数の大きな可変長符号を使用することとなって
しまう。このように従来の技術は、使用頻度の高い最近
出現した文字列ほど辞書番号が大きくなってしまうた
め、圧縮率が良くならないという欠点があった。

【００３６】この発明は以上説明した問題点を考慮し
た、圧縮性に優れた文字列の符号化方法を提供すること
を目的としている。

【００３７】

【課題を解決するための手段】請求項１に係る発明は、
文字列を辞書番号に対応付ける辞書を使用し、情報源文
字列を辞書番号に順次変換する文字列の符号化方法にお
いて、前記情報源文字列として既に前記辞書内に定義さ
れたものが出現した場合には該当する辞書番号を該文字
列に対応した符号として出力する一方、前記情報源文字
列として新規な文字列が出現した場合には、ａ．この新規な文字列に対し、所定の最小値を辞書番号
として割り当て、ｂ．その時点において前記辞書により既に定義されてい
る各文字列に対応した辞書番号を前記最小値と重複しな
いように一定の更新規則に従って更新し、ｃ．前記新規な文字列を前記最小値に対応付ける情報を
前記辞書に追加することを特徴とする文字列の符号化方
法を要旨とする。

【００３８】請求項２に係る発明は、文字列を辞書番号
に対応付ける辞書を使用し、情報源文字列を辞書番号に
順次変換する文字列の符号化方法において、前記情報源
文字列として既に前記辞書内に定義されたものが出現し
た場合には該当する辞書番号のプレフィックス符号を該
文字列に対応した符号として出力する一方、前記情報源
文字列として新規な文字列が出現した場合には、この新
規な文字列に対し、新規な辞書番号を割り当て、該文字
列を該辞書番号に対応付ける情報を前記辞書に追加する
ことを特徴とする文字列の符号化方法を要旨とする。

【００３９】請求項３に係る発明は、文字列を辞書番号
に対応付ける辞書を使用し、情報源文字列を辞書番号に
順次変換する文字列の符号化方法において、前記情報源
文字列として既に前記辞書内に定義されたものが出現し
た場合には該当する辞書番号のプレフィックス符号を該
文字列に対応した符号として出力する一方、前記情報源
文字列として新規な文字列が出現した場合には、ａ．この新規な文字列に対し、所定の最小値を辞書番号
として割り当て、ｂ．その時点において前記辞書により既に定義されてい
る各文字列に対応した辞書番号を前記最小値と重複しな
いように一定の更新規則に従って更新し、ｃ．前記新規な文字列を前記最小値に対応付ける情報を
前記辞書に追加することを特徴とする文字列の符号化方
法を要旨とする。

【００４０】

【作用】請求項１に係る発明によれば、最近追加された
文字列ほど小さな辞書番号（短い符号）が与えられるこ
とになり、圧縮率が向上する。

【００４１】さて、上述した従来の方法（５）におい
て、方法ｂは処理量が小さいが、可変長符号の使用の可
否が辞書サイズにより左右される。一方、方法ｃは、処
理が大きいが、辞書サイズに拘わらず可変長符号を使用
することができる。このように両方法には一長一短があ
る。請求項２に係る発明によれば、プレフィックス符号
を使用するので、上記ｂおよびｃの中間の処理量で、辞
書サイズに拘わらず可変長符号を使用することができる
という利点がある。

【００４２】また、請求項３に係る発明によれば、最近
出会った文字列に対して小さな値の符号が発生されるこ
とにより圧縮率が向上し、符号としてプレフィックス符
号が使用されることにより圧縮率がさらに向上する。

【００４３】

【実施例】以下、図面を参照し本発明の実施例について
説明する。＜第１実施例＞本実施例による文字列の符号化方法にお
いては、辞書が一杯になる前の辞書動作において、新規
追加文字列の番号付与方法に先頭移動法（Ｍove Ｔo Ｆ
ront；ＭＴＦ）を使用する。

【００４４】図１は本実施例による符号化方法を実施す
る手順を、文字列“ａｔｈｅ”の符号化をする場合を例
に示している。以下、この図を参照し、本実施例の具体
的な実施の態様について説明する。

【００４５】まず、前掲図３（ａ）に示す内容に辞書を
初期化する。そして、基本的には前掲図３〜図５を参照
して説明した動的辞書法により文字列の符号化を進め
る。しかし、本実施例は、新規な文字列を辞書に追加登
録する場合の動作が従来の方法と異なっている。

【００４６】すなわち、辞書番号「１」の文字“ａ”の
後に“ｔ”を追加した文字列“ａｔ”を辞書に追加登録
する場合、この新規な文字列“ａｔ”に対して最小の辞
書番号「１」を割り当て、今まで辞書番号「１」〜「２
７」が割り当てられていた各文字列の辞書番号を１つず
らして「２」〜「２８」にする。次に“ａｔ”の後に
“ｈ“を加えた文字列“ａｔｈ”を辞書に追加登録する
場合には、この新規な文字列“ａｔｈ”に辞書番号
「１」を割り当て、今まで辞書番号「１」〜「２８」が
割り当てられていた各文字列の辞書番号を１つずらして
「２」〜「２９」にする。同様に、次に“ａｔｈ”の行
にｅを加える場合、“ａｔｈｅ”の辞書番号を「１」に
し、今まで「１」〜「２９」だった辞書番号を１つずら
して「２」〜「３０」にする。

【００４７】このような操作を行うと、最近出会った文
字列に小さな番号が割り当てられ易くなる。従って、圧
縮率が向上することとなる。

【００４８】＜第２実施例＞本実施例においては、「辞
書番号の２進数表示」の方法として、プレフィックス符
号を用いる方法を提案する。プレフィックス符号可変長
符号の一種であり、符号の先頭にその符号を一意に識別
することのできる表現を伴っている。このため特別なテ
ーブル等を使用しなくても一意に復号が可能であり、高
速な符復号が可能である。しかし、プレフィックス分の
冗長性のため、通常の可変長自然２進表記よりは符号長
が長くなる。また一般に小さい整数ほど短い符号が割り
当てられている。

【００４９】プレフィックス符号の一例としてＷｉｌｌ
ｅｍ符号を説明する。ここでは、Ｉ＜上限値２＊＊Ｌ＋
１を満足する整数Ｉを符号化する場合を考える。ここ
で、Ｉの符号は、ＬＴ（ｌｏｇＩ）の自然２進表記
（長さＧＴ（ｌｏｇ（Ｌ＋１））ビット）と、１−２
＊＊ＬＴ（ｌｏｇＩ）の自然２進表記（長さＬＴ（ｌ
ｏｇＩ）ビット）を並記した値になる（ここでＧＴ
（Ｊ）はＪ以上の最小の整数、ＬＴ（Ｊ）はＪ以下の最
大の整数を表現する記号である）。本実施例において
は、既に述べた動的辞書法により文字列に対応した辞書
番号を得た後、以上の手順に従って辞書番号をプレフィ
ックス符号に変換し、復号側に送信する。

【００５０】復号側では符号側から送られてくるプレフ
ィックス符号の復号を次のように行う。まず、ＧＴ（ｌ
ｏｇ（Ｌ＋１））ビットを読んでα＝ＬＴ（ｌｏｇ
Ｉ）を得る。続いて更にα＝ＬＴ（ｌｏｇＩ）ビット
を読んでβを得る。最後にβ＋２＊＊αからＩを得る。
そして、このようにして得られた辞書番号Ｉから文字列
を再現する。

【００５１】次にＷｉｌｌｅｍ符号の一例を説明する。
例えば整数Ｉ（＝１０＜上限値２＊＊（３＋１））を符
号化する場合を考える。Ｉ＝１０の符号は、ＬＴ（ｌｏ
ｇ１０）＝３の自然２進表記（長さＧＴ（ｌｏｇ（３
＋１））＝２ビット）と、１０−２＊＊ＬＴ（ｌｏｇ
１０）＝１０−２＊＊３＝１０−８＝２の自然２進表記
（長さＬＴ（ｌｏｇ１０）＝３ビット）を並記した値
になる。つまり１１０１０が符号になる。復号は次の様
に行う。まず、１１０１０からＧＴ（ｌｏｇ（３＋
１））＝２ビット読むと、１１すなわちα＝３を得る。
続いて更にα＝３ビットを読むと、０１０すなわちβ＝
２を得る。最後にβ＋２＊＊α＝２＋２＊＊３＝２＋８
＝１０からＩ＝１０を得る。

【００５２】以上、本発明の典型的な実施例について述
べたが、本発明は上記実施例に限定されるものではな
い。例えば上記第１および第２の実施例を組合せたも
の、すなわち、動的辞書法において新規追加文字列に辞
書番号を付与する方法として先頭移動法を使用し、さら
に動的辞書法において得られた辞書番号を送信する際に
オプレフィックス符号への変換を行ってもよい。

【００５３】

【発明の効果】以上説明したように、請求項１または３
に係る発明によれば、最近出現した文字列の出現頻度が
高くなるという情報源の性質に対する考慮がなされた、
圧縮率の高い符号化方法が実現される。また、請求項２
または３に係る発明によれば、文字列に対応した辞書番
号を送信する際にプレフィックス符号への変換を行って
送信するので、さらに圧縮率を向上させることができる
という効果がある。

【図面の簡単な説明】

【図１】この発明の第１実施例による文字列の符号化
方法における新規文字列に対する辞書番号の割り当て方
法を説明する図である。

【図２】従来の文字列の符号化方法における新規文字
列に対する辞書番号の割り当て方法を説明する図であ
る。

【図３】一般的な動的辞書法による文字列の符号化方
法を示す図である。

【図４】一般的な動的辞書法による文字列の符号化方
法を示す図である。

【図５】一般的な動的辞書法による文字列の符号化方
法を示す図である。

【図６】一般的な動的辞書法による文字列の復号方法
を示す図である。

【図７】一般的な動的辞書法による文字列の復号方法
を示す図である。

【図８】一般的な動的辞書法による文字列の復号方法
を示す図である。

【符号の説明】

１〜３０……辞書番号、ａ〜ｚ，“ ”……文字列。

Claims

【特許請求の範囲】

【請求項１】文字列を辞書番号に対応付ける辞書を使
用し、情報源文字列を辞書番号に順次変換する文字列の
符号化方法において、前記情報源文字列として既に前記辞書内に定義されたも
のが出現した場合には該当する辞書番号を該文字列に対
応した符号として出力する一方、前記情報源文字列とし
て新規な文字列が出現した場合には、ａ．この新規な文字列に対し、所定の最小値を辞書番号
として割り当て、ｂ．その時点において前記辞書により既に定義されてい
る各文字列に対応した辞書番号を前記最小値と重複しな
いように一定の更新規則に従って更新し、ｃ．前記新規な文字列を前記最小値に対応付ける情報を
前記辞書に追加することを特徴とする文字列の符号化方
法。
【請求項２】文字列を辞書番号に対応付ける辞書を使
用し、情報源文字列を辞書番号に順次変換する文字列の
符号化方法において、前記情報源文字列として既に前記辞書内に定義されたも
のが出現した場合には該当する辞書番号のプレフィック
ス符号を該文字列に対応した符号として出力する一方、
前記情報源文字列として新規な文字列が出現した場合に
は、この新規な文字列に対し、新規な辞書番号を割り当
て、該文字列を該辞書番号に対応付ける情報を前記辞書
に追加することを特徴とする文字列の符号化方法。
【請求項３】文字列を辞書番号に対応付ける辞書を使
用し、情報源文字列を辞書番号に順次変換する文字列の
符号化方法において、前記情報源文字列として既に前記辞書内に定義されたも
のが出現した場合には該当する辞書番号のプレフィック
ス符号を該文字列に対応した符号として出力する一方、
前記情報源文字列として新規な文字列が出現した場合に
は、ａ．この新規な文字列に対し、所定の最小値を辞書番号
として割り当て、ｂ．その時点において前記辞書により既に定義されてい
る各文字列に対応した辞書番号を前記最小値と重複しな
いように一定の更新規則に従って更新し、ｃ．前記新規な文字列を前記最小値に対応付ける情報を
前記辞書に追加することを特徴とする文字列の符号化方
法。