JP2000151419A

JP2000151419A - データ圧縮方法およびデータ圧縮装置

Info

Publication number: JP2000151419A
Application number: JP10315116A
Authority: JP
Inventors: Yasukazu Mizushima; 靖和水嶋; Satoshi Koyaizu; 聡小柳津; Masashi Usami; 正志宇佐美
Original assignee: Asahi Chemical Industry Co Ltd
Current assignee: Asahi Chemical Industry Co Ltd
Priority date: 1998-11-05
Filing date: 1998-11-05
Publication date: 2000-05-30

Abstract

(57)【要約】【課題】辞書に新たな情報を上書きする際に、その位
置を迅速に検索でき、かつ辞書用メモリの消費電力の節
減が図れるデータ圧縮装置の提供【解決手段】データ圧縮の際の辞書を構築する辞書用
メモリ４Ｂを、独立に動作する４つのメモリ４１〜４３
により構成した。ＣＰＵ２が、例えばメモリ４２に格納
する文字データが最大登録数に達したことを判定する
と、新たな文字データを上書きするために、子ノードア
ドレスが格納されるメモリ４２のみを動作させる。これ
により、検索回路６は、子ノードアドレスが書き込まれ
ていないアドレスを、その動作中のメモリ４２の先頭ア
ドレスから順次検索し、かつ、そのアドレスの２回目以
降の検索は、前回に検出されたアドレスの次のアドレス
から開始するようにした。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、テキスト文書やフ
ァイルの圧縮、またはデータ通信の際のデータの圧縮な
どに適用されるデータ圧縮方法およびデータ圧縮装置に
関する。

【０００２】

【従来の技術】従来、この種のデータ圧縮方法として
は、例えば、ＬＺＷ（Ｌｅｍｐｅｌ−Ｚｉｖ−Ｗｅｌｃ
ｈ）圧縮といわれる可逆的なデータの圧縮法が知られて
いる。このＬＺＷ圧縮は、Ｖ．４２ｂｉｓモデム標準な
どで採用されている。

【０００３】このＬＺＷ圧縮は、入力した現在の文字列
と過去に処理して辞書に登録されている文字列とを比較
し、両者が一致しないときにはその文字列を辞書に逐次
登録する一方、両者が一致するときにはその入力した文
字列に対応する圧縮コードを出力していくものである。

【０００４】このようなＬＺＷ圧縮により辞書に登録さ
れる文字列は、例えば図１１に示すように、ノード（黒
丸）と、このノード同士を線で結ぶ木構造で表される。
図１１中、上位にあるものを親ノードといい、下位にあ
るものを子ノードと呼んでいる。ここでは、同一の親ノ
ードに接続する子ノードを兄弟ノードと呼び、兄弟ノー
ド中の最も左にあるものを末っ子ノード、その最も右に
あるものを長兄ノードと呼んでいる。

【０００５】この木構造では、親ノードと線で結ばれる
のは子ノードのうちの長兄と末っ子のみで、他の子ノー
ドは兄弟ノードに接続されている。そして、各ノードに
は、文字を表すデータ、子ノードのアドレス、兄弟ノー
ドのアドレスなどが情報として付与されている。

【０００６】また、この木構造では、親ノードの参照は
末っ子ノードを経由して行い、子ノードの参照は自身が
持つ子ノードのアドレスを使用し、その後は兄弟ノード
の参照を続けることにより行う。このような木構造はメ
モリ上で構築され、子ノードのメモリへの配置は、メモ
リの先頭のアドレスから書き込むことにより行う。ま
た、新規な文字の更新は新規な子ノードの更新という形
で、ある親ノードに接続される。その更新は以下のよう
な方法で行われる。

【０００７】ノード数が、メモリの最大登録可能数に達
していない場合には、文字を表すデータ、子ノードのア
ドレス、兄弟ノードのアドレスなどのノード情報を、メ
モリの先頭のアドレスから書き込んでいく。一方、ノー
ド数が最大登録可能数を超えた場合には、子ノードを持
たない親ノードの登録が順次抹消され、これは以下の手
順で行う。すなわち、メモリの先頭から子ノードを持た
ないアドレスを検索する。そして、その検索したアドレ
スに新たなノード情報を上書きする。

【０００８】

【発明が解決しようとする課題】上記のようなデータ圧
縮方法では、ノード数が最大登録可能数を超えた場合
に、メモリの先頭から子ノードを持たないアドレスを検
索し、その検索したアドレスに新たなノード情報を上書
きするようにしている。

【０００９】その際に、ノード情報を更新するに際し、
１つ上の兄ノードがもつ兄弟ノード情報の変更を行う
が、その１つ上の兄ノードの検索は一旦、末っ子ノード
に達した後に、親ノード、長兄ノードを経由して行って
いる。また、圧縮された文字列を展開する場合、親ノー
ドを検索するが、その場合にも一旦、末っ子ノードに到
達した後に、親ノードを探索している。

【００１０】このような検索では、たびたび多くのメモ
リ走査を行うので（多くのノードを渡り歩くので）、そ
の検索に多量の処理時間を要すという不都合がある。ま
た、各処理で参照される子ノードのアドレスや兄弟ノー
ドのアドレスなどの情報は、メモリに記憶されるノード
上の全ての情報ではなくその一部である。しかし、これ
らのノード上の情報は、一般に、単一のメモリの同一ア
ドレスに格納されているので、その一部の情報が必要の
場合であっても、そのメモリの全体を動作させる必要が
ある。この結果、メモリは必要以上に電力を消費し、メ
モリの消費電力の削減が望まれていた。

【００１１】そこで、本発明は、上記の点に鑑み、辞書
に新たな情報を上書きする際に、その上書きが可能な位
置を迅速に検索できる上に、末っ子ノードなどのノード
の位置を迅速に検索できるようにし、もって、リアルタ
イム処理を可能にするとともに、辞書を構成するメモリ
の消費電力の節減が図れるようにしたデータ圧縮方法お
よびデータ圧縮装置を提供することを目的とする。

【００１２】

【課題を解決するための手段】上記課題を解決し、本発
明の目的を達成するために、請求項１に記載の発明は、
入力した現在の文字列と過去に処理して辞書に登録され
ている文字列とを比較し、両者が一致しないときにはそ
の文字列を辞書に逐次登録する一方、両者が一致すると
きにはその入力した文字列に対応する圧縮コードを出力
するデータ圧縮方法であって、前記辞書に登録される文
字列は、この文字列を構成する各文字をノードとする木
からなり、この木の各ノードには、各文字を表す文字デ
ータと、各ノードが参照する子ノードアドレスおよび兄
弟ノードアドレスのうちの少なくとも１つのアドレスと
が付されるものとし、前記文字データと、前記子ノード
アドレス、前記兄弟ノードアドレス及び文字の属するノ
ードが末っ子ノードであることを示すフラグ情報のうち
の少なくとも１つと、からなるデータを前記辞書に順次
登録していき、新たな文字データを前記辞書に上書きす
る際には、専用の検索手段を使用して前記子ノードアド
レスが書き込まれていない辞書のアドレスを所定のアド
レスから順次検索し、そのアドレスの２回目以降の検索
は、前回に検索されたアドレスの次のアドレスから順次
検索を開始するようにしたものである。

【００１３】請求項２に記載の発明は、請求項１に記載
のデータ圧縮方法において、前記文字データの上書きに
応じて他のノードが持つ情報を変更する際には、前記検
索手段で、前記末っ子ノードを検索するために、前記フ
ラグ情報が書き込まれている辞書のアドレスを順次検索
し、その後、１つ上の兄のノードを検索する際には、こ
の検索対象の兄弟ノードが書き込まれている辞書のアド
レスを順次検索するようにしたものである。

【００１４】請求項３に記載の発明は、入力した現在の
文字列と過去に処理して辞書に登録されている文字列と
を比較し、両者が一致しないときにはその文字列を辞書
に逐次登録する一方、両者が一致するときにはその入力
した文字列に対応する圧縮コードを出力するデータ圧縮
方法であって、前記辞書に登録される文字列は、この文
字列を構成する各文字をノードとする木からなり、この
木の各ノードには、各文字を表す文字データと、各ノー
ドが参照する子ノードアドレスおよび兄弟ノードアドレ
スのうちの少なくとも１つのアドレスとが付されるもの
とし、前記辞書として、独立に動作する少なくとも２つ
のメモリを準備しておき、前記各メモリの同一のアドレ
スには、前記文字データと、前記子ノードアドレスと、
前記兄弟ノードアドレスと、文字の属するノードが末っ
子ノードであることを示すフラグ情報とをそれぞれ分割
して格納していき、新たな文字データを前記辞書に上書
きする際には、前記子ノードアドレスが格納されるメモ
リのみを動作させ、前記子ノードアドレスが書き込まれ
ていないアドレスを、その動作中のメモリの所定のアド
レスから順次検索するようにしたものである。

【００１５】請求項４に記載の発明は、請求項３に記載
のデータ圧縮方法において、さらに、前記文字データが
格納されるメモリが最大登録数に達したときには、前記
子ノードアドレスが格納されるメモリの検索の他に、前
記兄弟ノードアドレスが格納されるメモリ、および前記
フラグ情報が格納されるメモリのうちの少なくとも１つ
を必要に応じて動作させ、所定の条件を満たすアドレス
を、その動作中のメモリの所定のアドレスから順次検索
するようにしたものである。

【００１６】請求項５に記載の発明は、請求項３または
請求項４に記載のデータ圧縮方法において、前記アドレ
スの２回目以降の検索は、前回に検索されたアドレスの
次のアドレスから開始するようにしたものである。請求
項６に記載の発明は、入力した現在の文字列と過去に処
理して辞書に登録されている文字列とを比較し、両者が
一致しないときにはその文字列を辞書に逐次登録する一
方、両者が一致するときにはその入力した文字列に対応
する圧縮コードを出力するデータ圧縮装置であって、前
記辞書に登録される文字列は、この文字列を構成する各
文字をノードとする木からなり、この木の各ノードに
は、各文字を表す文字データと、各ノードが参照する子
ノードアドレスおよび兄弟ノードアドレスのうちの少な
くとも１つのアドレスが付されるものとし、前記文字デ
ータと、前記子ノードアドレス、前記兄弟ノードアドレ
ス及び文字の属するノードが末っ子ノードであることを
示すフラグ情報のうちの少なくとも１つと、からなるデ
ータを格納する辞書用メモリと、新たな文字データを前
記辞書に上書きする際に、前記子ノードアドレスが書き
込まれていない辞書用メモリのアドレスを所定のアドレ
スから順次検索するようにし、そのアドレスの２回目以
降の検索は、前回に検索されたアドレスの次のアドレス
から開始する検索手段と、を備えたものである。

【００１７】請求項７に記載の発明は、請求項６に記載
のデータ圧縮装置において、前記検索手段は、前記子ノ
ードアドレスの検索の他に、前記末っ子ノードを検索す
る場合には前記フラグ情報が書き込まれている前記辞書
用メモリのアドレス、および前記兄弟ノードを検索する
場合には検索対象の兄弟アドレスが書き込まれている辞
書用メモリのアドレスのうちの少なくとも１つを、所定
のアドレスから順次検索するようにしたものである。

【００１８】請求項８に記載の発明は、入力した現在の
文字列と過去に処理して辞書に登録されている文字列と
を比較し、両者が一致しないときにはその文字列を辞書
に逐次登録する一方、両者が一致するときにはその入力
した文字列に対応する圧縮コードを出力するデータ圧縮
装置であって、前記辞書に登録される文字列は、この文
字列を構成する各文字をノードとする木からなり、この
木の各ノードには、各文字を表す文字データと、各ノー
ドが参照する子ノードアドレスおよび兄弟ノードアドレ
スのうちの少なくとも１つのアドレスが付されるものと
し、前記各文字データと、前記子ノードアドレスと、前
記兄弟ノードアドレスと、文字の属するノードが末っ子
ノードであることを示すフラグ情報とをそれぞれ分割し
て格納する、独立して動作する少なくとも２つのメモリ
からなる辞書用メモリを備えたものである。

【００１９】請求項９に記載の発明は、請求項８に記載
のデータ圧縮装置において、さらに、前記文字データが
格納されるメモリが最大登録数に達したか否かを判定す
る判定手段と、この判定手段が最大登録数に達したと判
定したときには、新たな文字データを上書きするため
に、前記子ノードアドレスが格納されているメモリのみ
を動作させ、前記子ノードアドレスが書き込まれていな
いアドレスを、その動作中のメモリの所定のアドレスか
ら順次検索する検索手段とを備えるようにしたものであ
る。

【００２０】請求項１０に記載の発明は、請求項９に記
載のデータ圧縮装置において、前記検索手段は、前記子
ノードアドレスの検索の他に、必要に応じて末っ子ノー
ドを検出する場合にはフラグ情報と兄弟ノードが格納さ
れているメモリのみ動作させ、兄弟ノードを検索する場
合には前記兄弟ノードのみが格納されているメモリのみ
を動作させ、所定のアドレスから順次検索するようにし
たものである。

【００２１】請求項１１に記載の発明は、請求項９また
は請求項１０に記載のデータ圧縮装置において、前記検
索手段は、２回目以降のアドレスの検索を行う場合に
は、前回に検索されたアドレスの次のアドレスから開始
するようにしたことを特徴とするものである。

【００２２】

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しつつ説明する。図１は、本発明のデー
タ圧縮装置の実施形態の構成を示すブロック図である。
図２は、図１に示す記憶装置の構成を示す図である。図
３は、そのデータ圧縮装置のデータ圧縮処理の概要を示
すフローチャートである。

【００２３】本発明にかかるデータ圧縮装置は、図１に
示すように、入力部１と、ＣＰＵ２と、ＲＯＭ３と、記
憶装置４と、出力部５と、検索回路６とを備えている。
入力部１は、例えばデータ圧縮の対象となる文字列を入
力バッファ（図示せず）で受け取り、この受け取った文
字列をＣＰＵ２に出力するように構成されている。

【００２４】ＣＰＵ２は、ＲＯＭ３に予め記憶されてい
るプログラムにしたがって、各種のの動作を行う。この
各種の動作としては、各部の動作の制御や、図３を参照
して後述するデータ圧縮処理などがある。ＲＯＭ３は、
不揮発性のメモリからなり、ＣＰＵ２の動作プログラム
や後述のデータ圧縮の手順などがあらかじめ記憶されて
いる。

【００２５】記憶装置４は、読み書き可能なメモリから
なり、各種の処理を行うために使用するワークメモリ４
Ａと、データ圧縮の際に後述のように作成される辞書を
構築する辞書用メモリ４Ｂとを少なくとも備えている。
出力部５は、データ圧縮時にＣＰＵ２から圧縮コードを
出力バッファ（図示せず）で受け取り、この受け取った
圧縮コードを外部に出力するように構成されている。

【００２６】検索回路６は、ＣＰＵ２からの指示される
条件に基づいて後述の子ノード参照用メモリ４２、兄弟
ノード参照用メモリ４３、フラグ用メモリ４４を独立に
動作させ、指定された検索位置から順次検索し、指定さ
れた条件を満たすアドレスをＣＰＵ２に通知するように
構成されている。

【００２７】次に、辞書用メモリ４Ｂの詳細な構成の一
例について、図２を参照して説明する。この辞書用メモ
リ４Ｂは、図２に示すように、文字を表す文字データを
格納する文字データメモリ４１と、このメモリ４１に格
納される文字データに関連する子ノードのアドレスを格
納する子ノード参照用メモリ４２と、メモリ４１に格納
される文字データに関連する兄弟ノードのアドレスを格
納する兄弟ノード参照用メモリ４３と、メモリ４１に格
納される文字の属するノードが末っ子ノードか否かを示
すフラグを格納するフラグ用メモリ４４とから構成され
ている。

【００２８】これらのメモリ４１〜４４は、独立に電力
が供給されて独立に動作するように構成されるが、子ノ
ード参照メモリ４２と、他のメモリ４１、４３、４４と
が独立に電力が供給されて独立に動作するように構成し
ても良い。また、各メモリ４１〜４４への電力の供給量
を、後述のようにＣＰＵ２が制御できるように構成され
ている。

【００２９】なお、フラグ用メモリ４４は、上記のよう
に独立して設ける必要はなく、例えば兄弟ノード参照用
メモリ４３のビット幅を１ビットだけ増やし、そこにフ
ラグを埋め込み、それ全体を兄弟ノードとして使用する
ようにしても良い。このようにすると、圧縮処理が効率
良く行える。また、フラグに相当するデータを兄弟ノー
ドの先頭（ＭＳＢ）に置くと、兄弟ノードの正負を見る
だけで簡単にフラグが立っているか否かが分かると同時
に兄弟ノードの情報も獲得できる。

【００３０】次に、このように構成されるデータ圧縮装
置によるデータ圧縮処理の概要について、図３のフロー
チャートを参照して説明する。まず、データが存在する
か否かが判定され（ステップＳ１）、この判定の結果、
データが存在する場合には、データ圧縮の対象となるデ
ータとして文字が入力される（ステップＳ２）。

【００３１】次に、この入力した文字を含む文字列が、
過去に入力されて辞書用メモリ４Ｂに格納されている文
字列と一致するか否かが判定され（ステップＳ３）、両
者が一致する場合には、ステップＳ２に戻り次の文字が
入力される。一方、上記の判定の結果、両者が一致しな
い場合には、文字データを格納する辞書用メモリ４Ｂの
格納位置を示すための変数Ｃ１が示す格納位置に、その
文字データを書き込む（ステップＳ４）。

【００３２】次いで、ステップＳ５では、その書き込ん
だ文字データに関連する親／兄弟ノードの情報を変更す
る。この変更の一例を示すと、図４に示すようになる。
図４の上側は、文字列「ＡＢ」、「ＡＣ」を表す木に文
字「Ｄ」が追加され、新たな文字列「ＡＤ」が追加され
る状況を示している。また、図４の下側は、上記の更新
に対応する辞書用メモリ４Ｂ内のコンテキストの変化を
示している。すなわち、文字「Ｄ」が追加されると、文
字「Ｃ」にかかる親／兄弟ノードのインデックスは、図
４に示すように「＆Ａ」から「＆Ｄ」に変更されるとと
もに末端のノードであることを示すフラグの「１」がな
くなる。文字「Ｄ」は、図４に示すように文字「Ｃ」が
格納される次のアドレスに格納されるとともに、文字
「Ｄ」には、親／兄弟ノードのインデックスとして「＆
Ａ」が付加されるとともに、末端のノードであることを
示すフラグ「１」が付加される。ここで、「＆Ａ」は文
字「Ａ」の格納されているメモリアドレスを表し、「＆
Ｄ」は文字「Ｄ」の格納されているメモリアドレスを表
す。

【００３３】次に、次に入力されるデータを格納する辞
書用メモリ４Ｂの格納位置（Ｃ１）を決定する（ステッ
プＳ６）。次いで、現在入力された文字の１つ前までに
マッチした文字列に相当する圧縮コードを出力する（ス
テップＳ７）。次に、この実施形態にかかるデータ圧縮
装置のデータ圧縮処理の具体例について、図５〜図９を
参照して説明する。

【００３４】ここでは、「ＡＢＡＣＡＢＤ」という文字
列が入力されて、データ圧縮処理される場合について説
明する。データ圧縮処理の開始時には、文字「Ａ」、
「Ｂ」、「Ｃ」を含む文字列の先頭の文字は予約語とし
て文字データメモリ４１に予め格納されており、この説
明に関連する文字「Ａ」〜「Ｃ」は、図６の（１）に示
すように、例えばアドレス「６８」〜「７０」に図５に
示すような親ノードとしてそれぞれ予め格納されてい
る。

【００３５】いま、図５に示すように、１番目の文字
「Ａ」が入力された場合には、今回の文字「Ａ」は最初
の文字であって文字列は作成されず、圧縮コードは出力
されない。ここで、図５に示すように、この説明に関連
し親ノードにかかる文字「Ａ」、「Ｂ」、「Ｃ」に続く
括弧中の数字は、圧縮コードを意味し、同時に、格納位
置（アドレス）を意味する。

【００３６】次に、図５に示すように、２番目の文字
「Ｂ」が入力されると、前回に入力された文字「Ａ」に
今回の文字「Ｂ」が接続されている。このため、図５に
示すように、文字「Ａ」が付されたノードと新たな文字
「Ｂ」が付されたノードとを線分で結んで新たな木を作
り、「ＡＢ」という文字列を作成する。

【００３７】この文字列「ＡＢ」を辞書用メモリ４Ｂに
実現するために、図６の（１）に示すように、今回入力
された文字「Ｂ」を文字データメモリ４１の２５９番地
に格納する。また、その文字「Ｂ」と接続する文字
「Ａ」の格納位置を示す「６８」を子ノード参照用メモ
リ４２の２５９番地に格納する。ここで、文字「Ｂ」に
かかるノードは、図５に示すように、末端のノードであ
るので、その旨を示すフラグ「１」をメモリ４４の２５
９番地に格納する。さらに、子ノード参照用メモリ４２
の６８番地に「２５９」を格納する。

【００３８】このように２番目の文字「Ｂ」が入力され
たときには、前回に入力された文字「Ａ」を示す「６
８」という圧縮コードが出力される（図９参照）。次
に、図５に示すように、３番目の文字「Ａ」が入力され
ると、前回に入力された文字「Ｂ」に、今回に入力され
た文字「Ａ」が接続する「ＢＡ」という文字列は今まで
になかったので、新たに辞書を作成する。すなわち、図
５に示すように、文字「Ｂ」が付されたノードと今回の
文字「Ａ」が付されたノードとを線分で結んで新たな木
を作り、「ＢＡ」という文字列を作成する。

【００３９】この文字列「ＢＡ」を辞書用メモリ４Ｂに
実現するために、図７の（３）に示すように、今回入力
された文字「Ａ」を文字データメモリ４１の２６０番地
に格納する。また、その文字「Ａ」と接続する文字
「Ｂ」の格納位置を示す「６９」をメモリ４３の２６０
番地に格納する。ここで、文字「Ａ」にかかるノード
は、図５に示すように、末端のノードであるので、その
旨を示すフラグ「１」をフラグ用メモリ４４の２６０番
地に格納する。さらに、子ノード参照用メモリ４２の６
９番地に「２６０」を格納する。

【００４０】このように３番目の文字「Ａ」が入力され
たときには、前回に入力された文字「Ｂ」を示す「６
９」という圧縮コードを出力する（図９参照）。次に、
４番目の文字「Ｃ」が入力されると、前回入力された文
字「Ａ」で、今回に入力された文字が「Ｃ」である。従
って、新たに「ＡＣ」という文字列を入力したことにな
る。なお、ノード構成として「Ｃ」は「Ｂ」に接続され
る。

【００４１】これを辞書用メモリ４Ｂに実現するため
に、図７の（４）に示すように、今回入力された文字
「Ｃ」を文字データメモリ４１の２６１番地に格納す
る。また、文字「Ｃ」と接続する文字「Ａ」の格納位置
を示す「６８」を兄弟ノード参照用メモリ４３の２６１
番地に格納するとともに、兄弟ノード参照用メモリ４３
の２５９番地の格納内容を「２６１」の書き換える。こ
こで、文字「Ｃ」にかかるノードは、図５に示すよう
に、末端のノードであるので、その旨を示すフラグ
「１」をフラグ用メモリ４４の２６１番地に格納する。

【００４２】このように４番目の文字「Ｃ」が入力され
たときには、前回に入力された文字「Ａ」を示す「６
８」という圧縮コードを出力する（図９参照）。次に、
図５に示すように、５番目の文字「Ａ」が入力される
と、前回に入力された文字「Ｃ」に、今回入力された文
字「Ａ」が接続する「ＣＡ」という文字列は今までに無
かったので、新たに辞書を作成する。すなわち、図５に
示すように、文字「Ｃ」が付されたノードと今回の文字
「Ａ」が付されたノードとを線分で結んで新たな木を作
り、「ＣＡ」という文字列を作成する。

【００４３】この文字列「ＣＡ」を辞書用メモリ４Ｂに
実現するために、図８の（５）に示すように、今回入力
された文字「Ａ」を文字データメモリ４１の２６２番地
に格納する。また、その文字「Ａ」と接続する文字
「Ｃ」の格納位置を示す「７０」を兄弟ノード参照用メ
モリ４３の２６２番地に格納する。ここで、文字「Ａ」
にかかるノードは、図５に示すように、末端のノードで
あるので、その旨を示すフラグ「１」をフラグ用メモリ
４４の２６２番地に格納する。さらに、子ノード参照用
メモリ４２の７０番地に「２６２」を格納する。

【００４４】このように５番目の文字「Ａ」が入力され
たときには、前回に入力された文字「Ｃ」を示す「７
０」という圧縮コードを出力する（図９参照）。次に、
図５に示すように、６番目の文字「Ｂ」が入力される
と、前回に入力された文字「Ａ」に、今回に入力された
文字「Ａ」が接続する「ＡＢ」という文字列を得るが、
この文字列「ＡＢ」は既に辞書用メモリ４Ｂに登録され
ている。このため、辞書用メモリ４Ｂの更新は行われな
いとともに、圧縮コードの出力も行われない。従って、
辞書用メモリ４Ｂの内容は変更されずに図８の（５）の
ままとなる。

【００４５】次に、図５に示すように、７番目の文字
「Ｄ」が入力されると、この文字「Ｄ」を含む文字列
「ＡＢＤ」は、辞書中に存在しないので、新たに辞書を
作成する。すなわち、図５に示すように、文字「Ｂ」が
付されたノードと今回の文字「Ｄ」が付されたノードと
を線分で結んで新たな木を作り、「ＡＢＤ」という文字
列を作成する。

【００４６】この文字列「ＡＢＤ」を辞書用メモリ４Ｂ
に実現するために、図８の（６）に示すように、今回入
力された文字「Ｄ」を文字データメモリ４１の２６３番
地に格納する。また、その文字「Ｄ」と接続する文字
「Ｂ」の格納位置を示す「２５９」をメモリ４３の２６
３番地に格納する。さらに、メモリ４２の２５９番地を
「２６３」に書き換える。ここで、文字「Ｄ」にかかる
ノードは、図５に示すように、末端のノードであるの
で、その旨を示すフラグ「１」をフラグ用メモリ４４の
２６３番地に格納する。

【００４７】このように７番目の文字「Ｄ」が入力され
たときには、それまで一致していた文字列「ＡＢ」を表
す圧縮コードを出力する（図９参照）。このように「２
５９」という圧縮コードを出力することにより、「Ａ
Ｂ」という２文字が１文字用のコードとなっているの
で、データ圧縮されたことになる。

【００４８】このように、文字列「ＡＢＡＣＡＢＤ」が
入力された場合のデータの圧縮動作をまとめると、図９
に示すようになる。このようなデータ圧縮処理が行われ
ている期間中には、検索回路６は、ＣＰＵ２からの指示
条件に基づいて子ノード参照用メモリ４２、兄弟ノード
参照用メモリ４３、フラグ用メモリ４４を独立に動作さ
せ、指定された検索開始位置から順次検索し、指定され
た条件を満たすアドレスをＣＰＵ２に通知するので、以
下にその動作の一例について説明する。

【００４９】例えば、判定手段としてのＣＰＵ２は、辞
書用メモリ４Ｂのうちの文字データメモリ４１に格納さ
れるべき文字データがその最大登録数に達したか否かを
判定する。この判定は、所定のタイミング毎に行う。そ
して、ＣＰＵ２が最大登録数に達したと判定すると、Ｃ
ＰＵ２はその旨を検索回路６に通知する。

【００５０】この通知を受けた検索回路６は、新たな文
字データを文字データメモリ４１に上書きするために、
その上書きが可能なアドレスの検索を行う。この検索回
路６による検索は、ＣＰＵ２の制御により辞書メモリ４
Ｂのうちの子ノード参照用メモリ４２のみを動作させて
行う。

【００５１】すなわち、検索回路６は、子ノード参照用
メモリ４２の先頭のアドレス（この例では、２５９番
地）から順次検索することにより、子ノードのアドレス
が格納されていない空きのアドレスを検索する。そし
て、その空きのアドレスが検索されると、検索回路６
は、その検索した空きのアドレスをＣＰＵ２に通知す
る。

【００５２】なお、上記の検索期間中には、辞書メモリ
４Ｂのうちの他のメモリ４１、４３、４４は動作させず
に、格納内容が消去されない程度に電力を供給するよう
にし、この制御はＣＰＵ２が行う。ＣＰＵ２は、入力さ
れた文字により上述のように必要に応じて辞書を更新す
るが、この場合には、その検索されたアドレスに基づ
き、文字データメモリ４１のアドレスのうちその検索さ
れたアドレスと同一のアドレスに、上記のようにその文
字データを書き込む。

【００５３】さらに、その文字データの上書きに応じて
他のノードが持つ情報を変更する場合には、検索回路６
は、ＣＰＵ２からの指示に基づいて以下の述べるような
動作を行う。すなわち、検索回路６は、末っ子ノードを
検索するために、フラグ用メモリ４４と兄弟ノード参照
用メモリ４３を動作させてフラグ情報の「１」が書き込
まれているフラグ用メモリ４４のアドレスを順次検索す
る。その後、１つ上の兄弟ノードを検索する際には、兄
弟ノード参照用メモリ４３のみを動作させてこの検索対
象の兄弟ノードアドレスが書き込まれている兄弟ノード
参照用メモリ４３のアドレスを順次検索する。

【００５４】なお、上記の検索期間中には、辞書メモリ
４Ｂのうちの検索に不要なメモリは動作させずに、格納
内容が消去されない程度に電力を供給するようにし、こ
の制御はＣＰＵ２が行う。その後、ＣＰＵ２の指示によ
り、検索回路６は、再び上書きが可能なアドレスの検索
を子ノード参照用メモリ４２のみを動作させて行う。し
かし、検索回路６による２回目以降のアドレスの検索
は、子ノード参照用メモリ４２の先頭のアドレスからで
はなく、前回に検索されたアドレスの次のアドレスから
開始する。

【００５５】さらに、検索回路６は、上述のように上書
きに応じて他のノードが持つ情報を変更する場合に再び
検索を行うが、この検索は上書きするノードのアドレス
を基に開始する。次に、このように圧縮されたデータを
解凍する場合の動作について、図１０を参照して簡単に
説明する。

【００５６】解凍の場合には、圧縮の場合と同様に辞書
の作成から開始される。従って、予めメモリには予約語
が格納されており、圧縮コードが入力されると、この入
力された圧縮コードに基づいて以下のように辞書を更新
／作成していく。ここでは、上記の圧縮によって出力さ
れた圧縮コードは、「６８」「６９」「６８」「７０」
「２５９」（Ａ、Ｂ、Ａ、Ｃ、ＡＢ）であり、この圧縮
コードが入力された場合について説明する。

【００５７】いま、１番目の圧縮コード「６８」が入力
されると、図１０に示すように、文字列を示す木は、文
字「Ａ」が付与された親ノードと、文字「Ｂ」が付与さ
れた親ノードと、文字「Ｃ」が付与された親ノードとか
らなる。このように圧縮コード「６８」が入力されとき
には、圧縮コード「６８」が文字「Ａ」に展開される。

【００５８】次に、２番目の圧縮コード「６９」が入力
されると、前回に入力された文字「Ａ」に接続する形で
辞書を更新する。このときには、「６９」という圧縮コ
ードが文字「Ｂ」に展開される。次いで、３番目の圧縮
コード「６８」が入力されると、前回に入力された文字
「Ｂ」に接続する形で辞書を更新する。このときには、
「６８」という圧縮コードが文字「Ａ」に展開される。

【００５９】引き続き、４番目の圧縮コード「７０」が
入力されると、前回に入力された文字「Ｂ」に接続する
形で辞書を更新する。このときには、「７０」という圧
縮コードが文字「Ｃ」に展開される。次に、５番目の圧
縮コード「２５９」が入力されると、今まで作成した辞
書の内部を覗くと、それが文字列「ＡＢ」を示すことが
わかるので、受信した「２５９」というコードを文字列
「ＡＢ」に展開する。この部分が圧縮コードの実際の解
凍になる。

【００６０】ここで、上述のように圧縮コードを文字に
展開する場合には、検索回路６は、親ノード／末っ子ノ
ードを展開するために、フラグ情報の「１」が書き込ま
れているフラグ用メモリ４４のアドレスを順次検索して
いく。以上説明したように、この実施形態では、辞書用
メモリ４Ｂを、独立に動作する４つのメモリ４１〜４３
により構成するとともに、例えば、文字データが格納さ
れるメモリ４１が最大登録数に達したときには、新たな
文字データを上書きするために、子ノードアドレスが格
納されるメモリ４２のみを動作させ、子ノードアドレス
が書き込まれていないアドレスを、その動作中のメモリ
４２の先頭アドレスから順次検索するようにし、かつ、
そのアドレスの２回目以降の検索は、前回に検出された
アドレスの次のアドレスから開始するようにした。

【００６１】また、この実施形態では、その上書きに応
じて他のノードが持つ情報を変更する場合には、末っ子
ノードを検索するために、フラグ用メモリ４４と兄弟ノ
ード参照用メモリ４３を動作させてフラグ情報の「１」
が書き込まれているフラグ用メモリ４４のアドレスを順
次検索し、その後、１つ上の兄のノードを検索する際
に、兄弟ノード参照用メモリ４３のみを動作させてこの
検索対象の兄弟ノードアドレスが書き込まれている兄弟
ノード参照用メモリ４３のアドレスを順次検索するよう
にした。

【００６２】このため、辞書メモリ４Ｂに新たな情報の
上書きが必要な際に、その上書きが可能な位置などを迅
速に検索してリアルタイム処理が可能になって入力部１
などに必要なバッファの容量を削減できる上に、辞書用
メモリ４Ｂの消費電力の節減を図ることができる。

【００６３】さらに、この実施形態では、文字データな
どを辞書メモリ４Ｂに順次記憶させていくようにしたの
で、例えばハッシュ法により文字データなどをランダム
に記憶する場合に比べて辞書メモリ４Ｂの記憶容量を削
減できる。

【００６４】

【発明の効果】以上説明したように、請求項１および請
求項６にかかる発明では、辞書に文字データなどを順次
格納するとともに、文字データを上書きするときには、
その上書き可能な位置を専用の検索手段で検索するよう
にした。このため、例えばハッシュ法により辞書に文字
データなどを記憶する場合に比べて辞書の容量を削減で
きる上に、辞書に新たな情報を上書きする際に、その上
書きが可能な位置を迅速に検索してリアルタイム処理が
可能になる。

【００６５】また、請求項２および請求項７にかかる発
明では、上記の効果に加えて、上書きに応じて他のノー
ドが持つ情報を変更する際には、その必要な情報を迅速
に検索できる。さらに、請求項８にかかる発明では、辞
書を独立に動作する少なくとも２つのメモリから構成す
るようにし、各メモリに文字データや子ノードアドレス
を格納するようにしたので、文字データの上書きに際し
て辞書を検索する場合に、そのうちの必要なメモリのみ
が使用可能となり、もって、辞書を構成するメモリの消
費電力の節減を図ることが可能となる。

【００６６】また、請求項３および請求項９にかかる発
明では、辞書を独立に動作する少なくとも２つのメモリ
とし、文字データを上書きするときに、必要なメモリの
みを動作させてその上書きが可能な位置を検索するよう
にしたので、辞書を構成するメモリの消費電力の節減を
図ることができる。

【００６７】さらに、請求項４および請求項１０にかか
る発明では、上記の効果に加えて、上書きに応じて他の
ノードが持つ情報を変更する際には、その必要な情報を
迅速に検索できる。また、請求項５および請求項１１に
かかる発明では、上書きの位置などを検索する際に、２
回目以降の検索は、前回に検索されたアドレスの次のア
ドレスから開始するようにしたので、メモリに新たな情
報など上書きする際に、その可能な位置を迅速に検索し
てリアルタイム処理が可能になる上に、メモリの消費電
力の節減を図ることができる。

【図面の簡単な説明】

【図１】本発明のデータ圧縮装置の実施形態の構成を示
すブロック図である。

【図２】図１に示す記憶装置の構成の詳細を示す図であ
る。

【図３】図のデータ圧縮装置のデータ圧縮処理の概要を
示すフローチャートである。

【図４】文字列の更新状況を説明する図である。

【図５】入力文字と、この入力文字に応じた文字列の変
遷を示す図である。

【図６】図５に対応する辞書用メモリの内容に変遷を示
す図である。

【図７】同じく辞書用メモリの内容の変遷を示す図であ
る。

【図８】同じく辞書用メモリの内容の変遷を示す図であ
る。

【図９】データ圧縮動作の説明をまとめた図である。

【図１０】解凍動作を説明する図である。

【図１１】従来技術を説明する図である。

【符号の説明】

１入力部２ＣＰＵ３ＲＯＭ４記憶装置４Ｂ辞書用メモリ５出力部６検索回路４１文字データメモリ４２子ノード参照用メモリ４３兄弟ノード参照用メモリ４４フラグ用メモリ

フロントページの続き (72)発明者宇佐美正志神奈川県厚木市棚沢221番地旭化成工業株式会社内Ｆターム(参考） 5B009 ME06 SA08 VC01 5J064 AA03 BA11 BC01 BC14 BC29 BD03

Claims

【特許請求の範囲】

【請求項１】入力した現在の文字列と過去に処理して
辞書に登録されている文字列とを比較し、両者が一致し
ないときにはその文字列を辞書に逐次登録する一方、両
者が一致するときにはその入力した文字列に対応する圧
縮コードを出力するデータ圧縮方法であって、前記辞書に登録される文字列は、この文字列を構成する
各文字をノードとする木からなり、この木の各ノードに
は、各文字を表す文字データと、各ノードが参照する子
ノードアドレスおよび兄弟ノードアドレスのうちの少な
くとも１つのアドレスとが付されるものとし、前記文字データと、前記子ノードアドレス、前記兄弟ノ
ードアドレス及び文字の属するノードが末っ子ノードで
あることを示すフラグ情報のうちの少なくとも１つと、
からなるデータを前記辞書に順次登録していき、新たな文字データを前記辞書に上書きする際には、専用
の検索手段を使用して前記子ノードアドレスが書き込ま
れていない辞書のアドレスを所定のアドレスから順次検
索し、そのアドレスの２回目以降の検索は、前回に検索された
アドレスの次のアドレスから順次検索を開始するように
したことを特徴とするデータ圧縮方法。
【請求項２】前記文字データの上書きに応じて他のノ
ードが持つ情報を変更する際には、前記検索手段で、前
記末っ子ノードを検索するために、前記フラグ情報が書
き込まれている辞書のアドレスを順次検索し、その後、
１つ上の兄のノードを検索する際には、この検索対象の
兄弟ノードが書き込まれている辞書のアドレスを順次検
索するようにしたことを特徴とする請求項１に記載のデ
ータ圧縮方法。
【請求項３】入力した現在の文字列と過去に処理して
辞書に登録されている文字列とを比較し、両者が一致し
ないときにはその文字列を辞書に逐次登録する一方、両
者が一致するときにはその入力した文字列に対応する圧
縮コードを出力するデータ圧縮方法であって、前記辞書に登録される文字列は、この文字列を構成する
各文字をノードとする木からなり、この木の各ノードに
は、各文字を表す文字データと、各ノードが参照する子
ノードアドレスおよび兄弟ノードアドレスのうちの少な
くとも１つのアドレスとが付されるものとし、前記辞書として、独立に動作する少なくとも２つのメモ
リを準備しておき、前記各メモリの同一のアドレスには、前記文字データ
と、前記子ノードアドレスと、前記兄弟ノードアドレス
と、文字の属するノードが末っ子ノードであることを示
すフラグ情報とをそれぞれ分割して格納していき、新たな文字データを前記辞書に上書きする際には、前記
子ノードアドレスが格納されるメモリのみを動作させ、
前記子ノードアドレスが書き込まれていないアドレス
を、その動作中のメモリの所定のアドレスから順次検索
するようにしたことを特徴とするデータ圧縮方法。
【請求項４】さらに、前記文字データが格納されるメ
モリが最大登録数に達したときには、前記子ノードアド
レスが格納されるメモリの検索の他に、前記兄弟ノード
アドレスが格納されるメモリ、および前記フラグ情報が
格納されるメモリのうちの少なくとも１つを必要に応じ
て動作させ、所定の条件を満たすアドレスを、その動作
中のメモリの所定のアドレスから順次検索するようにし
たことを特徴とする請求項３に記載のデータ圧縮方法。
【請求項５】前記アドレスの２回目以降の検索は、前
回に検索されたアドレスの次のアドレスから開始するよ
うにしたことを特徴とする請求項３または請求項４に記
載のデータ圧縮方法。
【請求項６】入力した現在の文字列と過去に処理して
辞書に登録されている文字列とを比較し、両者が一致し
ないときにはその文字列を辞書に逐次登録する一方、両
者が一致するときにはその入力した文字列に対応する圧
縮コードを出力するデータ圧縮装置であって、前記辞書に登録される文字列は、この文字列を構成する
各文字をノードとする木からなり、この木の各ノードに
は、各文字を表す文字データと、各ノードが参照する子
ノードアドレスおよび兄弟ノードアドレスのうちの少な
くとも１つのアドレスが付されるものとし、前記文字データと、前記子ノードアドレス、前記兄弟ノ
ードアドレス及び文字の属するノードが末っ子ノードで
あることを示すフラグ情報のうちの少なくとも１つと、
からなるデータを格納する辞書用メモリと、新たな文字データを前記辞書に上書きする際に、前記子
ノードアドレスが書き込まれていない辞書用メモリのア
ドレスを所定のアドレスから順次検索するようにし、そ
のアドレスの２回目以降の検索は、前回に検索されたア
ドレスの次のアドレスから開始する検索手段と、を備えたことを特徴とするデータ圧縮装置。
【請求項７】前記検索手段は、前記子ノードアドレス
の検索の他に、前記末っ子ノードを検索する場合には前
記フラグ情報が書き込まれている前記辞書用メモリのア
ドレス、および前記兄弟ノードを検索する場合には検索
対象の兄弟アドレスが書き込まれている辞書用メモリの
アドレスのうちの少なくとも１つを、所定のアドレスか
ら順次検索することを特徴とする請求項６に記載のデー
タ圧縮装置。
【請求項８】入力した現在の文字列と過去に処理して
辞書に登録されている文字列とを比較し、両者が一致し
ないときにはその文字列を辞書に逐次登録する一方、両
者が一致するときにはその入力した文字列に対応する圧
縮コードを出力するデータ圧縮装置であって、前記辞書に登録される文字列は、この文字列を構成する
各文字をノードとする木からなり、この木の各ノードに
は、各文字を表す文字データと、各ノードが参照する子
ノードアドレスおよび兄弟ノードアドレスのうちの少な
くとも１つのアドレスが付されるものとし、前記各文字データと、前記子ノードアドレスと、前記兄
弟ノードアドレスと、文字の属するノードが末っ子ノー
ドであることを示すフラグ情報とをそれぞれ分割して格
納する、独立して動作する少なくとも２つのメモリから
なる辞書用メモリを備えたことを特徴とするデータ圧縮
装置。
【請求項９】さらに、前記文字データが格納されるメ
モリが最大登録数に達したか否かを判定する判定手段
と、この判定手段が最大登録数に達したと判定したときに
は、新たな文字データを上書きするために、前記子ノー
ドアドレスが格納されているメモリのみを動作させ、前
記子ノードアドレスが書き込まれていないアドレスを、
その動作中のメモリの所定のアドレスから順次検索する
検索手段と、を備えたことを特徴とする請求項８に記載のデータ圧縮
装置。
【請求項１０】前記検索手段は、前記子ノードアドレ
スの検索の他に、必要に応じて末っ子ノードを検出する
場合にはフラグ情報と兄弟ノードが格納されているメモ
リのみ動作させ、兄弟ノードを検索する場合には前記兄
弟ノードのみが格納されているメモリのみを動作させ、
所定のアドレスから順次検索することを特徴とする請求
項９に記載のデータ圧縮装置。
【請求項１１】前記検索手段は、２回目以降のアドレ
スの検索を行う場合には、前回に検索されたアドレスの
次のアドレスから開始するようにしたことを特徴とする
請求項９または請求項１０に記載のデータ圧縮装置。