JPH0566920A - デ−タ圧縮装置 - Google Patents

デ−タ圧縮装置

Info

Publication number
JPH0566920A
JPH0566920A JP3254541A JP25454191A JPH0566920A JP H0566920 A JPH0566920 A JP H0566920A JP 3254541 A JP3254541 A JP 3254541A JP 25454191 A JP25454191 A JP 25454191A JP H0566920 A JPH0566920 A JP H0566920A
Authority
JP
Japan
Prior art keywords
data
character
search
compression
search data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3254541A
Other languages
English (en)
Inventor
Masataka Hosono
正敬 細野
Ryutaro Tamura
隆太郎 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alps Alpine Co Ltd
Original Assignee
Alps Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alps Electric Co Ltd filed Critical Alps Electric Co Ltd
Priority to JP3254541A priority Critical patent/JPH0566920A/ja
Publication of JPH0566920A publication Critical patent/JPH0566920A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 高いデータ圧縮効率を維持できるとともにメ
モリを有効に利用できるデータ圧縮装置を提供する。 【構成】 入力データと検索データとが最大長で一致す
るまで1文字単位またはビット単位でデータ圧縮用テー
ブル10を検索し、一致した最大長の検索データと対応
した圧縮符号語を入力データ列にかえて送出し、不一致
とされた入力データ長の内容の検索データ及び対応する
圧縮符号語をデータ圧縮用テーブル10に生成する。ま
た、最小可変ビット数で表現される圧縮符号語がビット
表現できる最大数を超えたときにデータ圧縮用テーブル
10を更新する。 【効果】 圧縮符号語がデータ圧縮用テーブルに生成さ
れていくので、あらかじめ固定のデータ圧縮テーブルを
用意する必要がない。したがって、各種テキストデータ
に対しても、データ圧縮効率を維持することが可能にな
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、キャラクタデータを圧
縮する装置に関し、特にテキストデータを記録、伝送す
るときに用いられる装置に関する。
【0002】
【従来の技術】テキストデータを記録、伝送する場合に
は、テキストデータを圧縮してより少ないデータとして
記録、伝送することがメモリ効率上及び伝送効率上望ま
しい。このため、出現頻度の高い単語などがあらかじめ
登録されたデータ圧縮用テーブルを用意し、テキストデ
ータにそれらの単語が出現した場合に、それらの単語と
それらの単語と対応した圧縮符号語とを置き換え、デー
タ量を少なくするデータ圧縮装置が使用されることが多
い。
【0003】
【発明が解決しようとする課題】しかしながら従来装置
では、データ圧縮用テーブルに登録された単語等は固定
されているので、各種キャラクタデータを含んだテキス
トデータに対して柔軟に対応することができず、このた
め、データの圧縮効率が低下する。また、各種キャラク
タデータを含んだテキストデータに柔軟に対応するに
は、あらかじめ固定のデータ圧縮用テーブルをいくつも
用意する必要があるので、データ圧縮装置のメモリを効
果的に使用することができない。このため、データ圧縮
速度が低下する場合がある。
【0004】本発明は上記従来の事情に鑑みてなされた
ものであり、その目的は、各種キャラクタデータを有す
るテキストデータに対しても、高いデータ圧縮効率を維
持できるとともにメモリを有効に利用できるデータ圧縮
装置を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は図1のように構成されてい
る。すなわち、データ圧縮装置は入力データと検索デー
タとが最大長で一致するまで1文字単位またはビット単
位ででデータ圧縮用テーブル10を検索する検索手段1
2と、一致した最大長の検索データと対応した圧縮符号
語を入力データ列にかえて送出する送出手段14と、不
一致とされた入力データ長の内容の検索データ及び対応
する圧縮符号語をデータ圧縮用テーブル10に生成する
生成手段16と、を有する。また、請求項2記載の発明
は図1のように構成され、最小可変ビット数で表現され
る圧縮符号語がビット表現できる最大数を超えたときに
データ圧縮用テーブル10を更新する更新手段18を有
する請求項1記載のデータ圧縮装置である。
【0006】
【作用】本発明では、入力データと検索データとが最大
長で一致するまで1文字単位またはビット単位でデータ
圧縮用テーブルを検索され、不一致とされた入力データ
長の内容の検索データ及びそれに対応する圧縮符号語が
データ圧縮用テーブル10に生成されるので、あらかじ
め固定のデータ圧縮テーブル10を用意する必要がな
い。また、圧縮符号語を最小可変ビットで表現し、その
最小可変ビットで表現できる最大数を超えたときにデー
タ圧縮用テーブル10が更新されるので、不必要な圧縮
符号語にまでメモリをあらかじめ割り当てる必要がな
く、このため、メモリを有効に利用することができる。
【0007】
【実施例】以下、図に基づいて本発明にかかる装置の好
適な実施例について説明する。図2には、データ圧縮装
置20が示されており、データ圧縮装置20には入力部
22、検索部24、メモリ26、出力部28が設けられ
ている。
【0008】メモリ26には、データ圧縮用テーブル1
0が図3のように展開され、データ圧縮用テーブル10
には検索データ30−1,30−2,・・・,30−n
とそれに対応する圧縮符号語32−1,32−2,・・
・,32−nが格納される。各検索データ30−1,3
0−2,・・・,30−nは図4に示されるように、1
文字分または1ビット分のキャラクタデータ(キャラク
タ部)と、自己のキャラクタデータと同位のキャラクタ
データのアドレスを示す第1ポインタと、自己の直近下
位のキャラクタデータのアドレスを示す第2ポインタと
を各々有しており、入力データに応じて各検索データは
リスト構造で生成される。
【0009】図5では実施例によるデータ圧縮作用が、
図6ではデータ圧縮用テーブル10の生成作用が各々説
明されており、ここでは文字列ababcbababa
aが入力データの場合を例にとって実施例のデータ圧縮
を説明する。
【0010】まず、文字列先頭の1文字aがデータ圧縮
装置20の入力部22を介して検索部24に読み込まれ
(ステップ401)、今回入力された1文字に対して新
たな検索データを生成するか否かが、ポインタの設定状
況から判断される(ステップ403)。 ここでは、最初の入力データであり、全ての検索データ
にポインタが設定されていないので(ステップ403で
NO)、検索データは生成されない。そして、入力され
た文字aと一致する検索データがデータ圧縮用テーブル
10から検索される(ステップ407)。なお、データ
圧縮用テーブル10には図6(A)のようにa、b、c
の文字を要素とする各検索データ30−1,30−2,
30−3が初期設定されている。
【0011】次に、入力データaと検索データ30−1
が一致するので(ステップ409でYES)、aに続く
文字があることを示す検索データ30−1の第2ポイン
タにアドレスが示されているか否かが判断される(ステ
ップ411)が、データ圧縮用テーブル10は初期設定
のままなので、第2ポインタはまだ設定されていないと
判断される(ステップ411でNO)。この場合、検索
データ30−1が入力データaと最大長一致なので、検
索データ30−1の圧縮符号語”1”が検索部24から
出力部28へ送出され(ステップ423)、検索データ
30−1の第2ポインタに次の入力文字を検索データ3
0−1の下位データとして生成される検索データ30−
4が図6(B)のようにセットされる(ステップ42
3)。
【0012】さらに、今回の入力データが最終入力デー
タか否かが判断され(ステップ425)、ここでは入力
が続くので2番目の文字データbが読み込まれる(ステ
ップ401)。2番目の文字データbが読み込まれる
と、前回の検索用データ30−1の第2ポインタに検索
データ30−4を示すアドレスがセットされているので
(ステップ403でYES)、検索データ30−4のキ
ャラクタ部にbが設定され、新たに検索データ30−4
が生成される(ステップ405)。
【0013】そして、再びデータ圧縮用テーブル10が
検索され(ステップ407)、入力データbと一致する
検索データの検索が行われ(ステップ409)、ここで
は、検索データ30−2が一致する。検索データ30−
2には第2ポインタがまだ設定されていないので、上記
最初の文字入力a時と同様の処理が繰り返され、検索デ
ータ30−2の圧縮符号語”2”が検索部24から出力
部28へ送出され(ステップ421)、検索データ30
−2の第2ポインタには検索データ30−2の下位デー
タとして生成される検索データ30−5のアドレスが図
6(C)のように設定される(ステップ423)。
【0014】次に、3番目の文字データaが読み込まれ
(ステップ401)、前回生成された検索データ30−
5が生成され、検索データ30−5のキャラクタ部にa
がセットされる(ステップ405)。さらに、データ圧
縮用テーブル10が検索され(ステップ407)、一致
する検索データ30−1が得られると(ステップ409
でYES)、この検索データ30−1の第2ポインタに
アドレスがセットされているか否かが判断される(ステ
ップ411)。ここでは、検索データ30−1の第2ポ
インタには検索データ30−4のアドレスを示すデータ
がセットされているので(ステップ411でYES)、
4番目の文字データbが読み込まれる(ステップ41
3)。
【0015】そして、読み込まれた文字データbが検索
データ30−4と一致するか否かが判断され(ステップ
415)、検索データ30−4のキャラクタ部と文字デ
ータbとが一致するので(ステップ415でYES)、
検索データ30−4に第2ポインタがセットされている
か否かが判断される(ステップ411)。検索データ3
0−4には第2ポインタがセットされていないので(ス
テップ411でNO)、文字abの連続を示す検索デー
タ30−4の圧縮符号語4が出力され(ステップ42
1)、検索データ30−4の第2ポインタにデータ30
−6のアドレスが図6(D)のようにセットされる(ス
テップ423)。
【0016】さらに、5番目の文字cが読み込まれ(ス
テップ401)、この入力データにより検索データ30
−6が生成され、検索データ30−6のキャラクタ部に
文字cがセットされる(ステップ405)。さらに、デ
ータ圧縮用テーブル10が検索され(ステップ40
7)、一致する検索データ30−3が得られると(ステ
ップ409でYES)、この検索データ30−3の第2
ポインタにアドレスがセットされているか否かが判断さ
れる(ステップ411)。
【0017】ここでは、検索データ30−3の第2ポイ
ンタには下位の検索データのアドレスを示すデータがセ
ットされていないので(ステップ411でNO)、文字
cを示す検索データ30−3の圧縮符号語3が出力され
(ステップ421)、検索データ30−3の第2ポイン
タに検索データ30−7のアドレスが図6(E)のよう
にセットされる(ステップ423)。
【0018】6番目の文字bが読み込まれると(ステッ
プ401)、検索データ30−7のキャラクタ部に文字
bがセットされる(ステップ405)。そして、データ
圧縮用テーブル10が検索され(ステップ407)、一
致する検索データ30−2が得られると(ステップ40
9でYES)、この検索データ30−2の第2ポインタ
にアドレスがセットされているか否かが判断される(ス
テップ411)。ここでは、検索データ30−2の第2
ポインタには検索データ30−5のアドレスを示すデー
タがセットされているので(ステップ411でYE
S)、7番目の文字aが読み込まれる(ステップ41
3)。
【0019】さらに、読み込まれた文字aが検索データ
30−5と一致するか否かが判断され(ステップ41
5)、検索データ30−5のキャラクタ部とが一致する
ので(ステップ415でYES)、検索データ30−5
に第2ポインタがセットされているか否かが判断される
(ステップ411)。検索データ30−5には第2ポイ
ンタがセットされていないので(ステップ411でN
O)、文字baの連続を示す検索データ30−5の圧縮
符号語5が出力され(ステップ421)、検索データ3
0−4の第2ポインタに検索データ30−8のアドレス
が図6(F)のようにセットされる(ステップ42
3)。
【0020】さらに、8番目の文字bが読み込まれると
(ステップ401)、検索データ30−8のキャラクタ
部に文字bがセットされる(ステップ405)。データ
圧縮用テーブル10が検索され(ステップ407)、一
致する検索データ30−2が得られると(ステップ40
9でYES)、この検索データ30−2の第2ポインタ
にアドレスがセットされているか否かが判断される(ス
テップ411)。ここでは、検索データ30−2の第2
ポインタには検索データ30−5のアドレスを示すデー
タがセットされているので(ステップ411でYE
S)、9番目の文字aが読み込まれる(ステップ41
3)。
【0021】そして、読み込まれた文字aが検索データ
30−5と一致するか否かが判断され(ステップ41
5)、検索データ30−5のキャラクタ部とが一致する
ので(ステップ415でYES)、検索データ30−5
に第2ポインタがセットされているか否かが判断される
(ステップ411)。検索データ30−5には検索デー
タ30−8を示す第2ポインタがセットされているので
(ステップ411でYES)、さらに10番目の文字b
が読み込まれる(ステップ413)。
【0022】そして、読み込まれた文字bが検索データ
30−8と一致するか否かが判断され(ステップ41
5)、検索データ30−5のキャラクタ部とが一致する
ので(ステップ415でYES)、検索データ30−8
に第2ポインタがセットされているか否かが判断される
(ステップ411)。検索データ30−8には第2ポイ
ンタがセットされていないので(ステップ411でN
O)連続文字babを示す検索データ30−8の圧縮符
号語8が出力され(ステップ421)、検索データ30
−8の第2ポインタに検索データ30−9のアドレスが
図6(G)のようにセットされる(ステップ423)。
【0023】さらに、11番目の文字aが読み込まれる
と(ステップ401)、検索データ30−9のキャラク
タ部に文字aがセットされる(ステップ405)。デー
タ圧縮用テーブル10が検索され(ステップ407)、
一致する検索データ30−1が得られると(ステップ4
09でYES)、この検索データ30−1の第2ポイン
タにアドレスがセットされているか否かが判断される
(ステップ411)。ここでは、検索データ30−1の
第2ポインタには検索データ30−4のアドレスを示す
データがセットされているので(ステップ411でYE
S)、12番目の文字aが読み込まれる(ステップ41
3)。
【0024】読み込まれた文字aが検索データ30−4
と一致するか否かが判断され(ステップ415)、検索
データ30−4のキャラクタ部の文字bとは一致しない
ので(ステップ415でNO)、検索データ30−4の
第1ポインタに自己と同位の異なる検索デ−タ30−1
0があることを示すアドレスが図6(H)のように設定
され(ステップ411)、連続文字aaを示す検索デー
タ30−10が生成される。したがって、次回連続した
文字aaが入力されたときには、検索データ30−4の
第1ポインタにより、連続文字aaを示す検索データ3
0−10が検索できる。そして、ここでは検索データ3
0−1の圧縮符号語”1”が出力され(ステップ42
1)、次文字の入力がないので(ステップ425でYE
S)、処理が終了する。
【0025】以上のように、実施例では入力された文字
の連続に対応して順次新たにデータ圧縮用テーブル10
が更新される。
【0026】図7ではデータ圧縮用テーブル10の圧縮
符号語の生成作用が説明されており、図7では圧縮符号
語がビット表現で示されている。8ビットで表現できる
圧縮符号語は0から255の256個である(図7
(A)参照)。このため、圧縮符号語256がデータ圧
縮用テーブル10に生成される場合には、図7(B)の
ように圧縮符号語255と圧縮符号語256のみを9ビ
ット表現で表し、他の圧縮符号語0〜254は8ビット
表現で表される。さらに、圧縮符号語257がデータ圧
縮用テーブル10に生成される場合には、図7(C)の
ように圧縮符号語254〜257のみを9ビット表現で
表し、他の圧縮符号語0〜253は8ビット表現で表さ
れる。すなわち、圧縮符号語の最終ビットにより次の圧
縮符号語の有無が判断できるので、必要最小限の数の圧
縮符号語のみが最小可変ビット表現によりデータ圧縮用
テーブル10に登録される。
【0027】また、9ビットで表現できる圧縮符号語は
0〜511の512個であり(図7(D)参照)、この
ため、圧縮符号語511がデータ圧縮用テーブル10に
生成さたれた場合には、図7(E)及び図7(F)のよ
うに圧縮符号語0〜511は全て9ビット表現で表され
るように更新され、次の圧縮符号語512を生成すると
きには圧縮符号511,512は10ビット表現で表さ
れる。
【0028】なお、図8では上記のデータ圧縮で圧縮さ
れたデータの伸長作用が示されており、データを伸長す
る場合には、圧縮符号語を圧縮と逆に自己と上位のデー
タを示すポインタがセットされ、このポインタで示され
る最大長のデータが出力される。
【0028】以上説明したように本実施例によれば、入
力データと検索データとが最大長で一致するまで1文字
単位またはビット単位でデータ圧縮用テーブル10が検
索され、不一致とされた入力データ長の内容の検索デー
タ及び対応する圧縮符号語がデータ圧縮用テーブルに生
成されるので、あらかじめ固定のデータ圧縮テーブルを
用意する必要がない。したがって、各種キャラクタデー
タの文字列の入力に柔軟に対応することができ、データ
の圧縮効率を維持することが可能となる。また、あらか
じめ固定のデータ圧縮用テーブル10を用意する必要が
ないのでメモリ効率も向上する。さらに、最小限の圧縮
符号語を最小のビットで表現し、かつビット表現できる
最大数を超えたときにデータ圧縮用テーブル10を更新
するので、圧縮符号語の最大限をあらかじめメモリ26
に用意する必要がなく、データ圧縮装置20のメモリ2
6を有効に利用することができる。
【0029】
【発明の効果】以上説明したように本発明によれば、入
力データと検索データとが最大長で一致するまで1文字
単位またはビット単位でデータ圧縮用テーブルが検索さ
れ、不一致とされた入力データ長の内容の検索データ及
び対応する圧縮符号語がデータ圧縮用テーブルに生成さ
れるので、あらかじめ固定のデータ圧縮テーブルを用意
する必要がない。したがって、各種テキストデータに対
しても、高いデータ圧縮効率を維持することが可能にな
る。また、最小可変ビット数の圧縮符号語でデータ圧縮
用テーブルを形成し、かつビット表現できる最大数を超
えたときのみにデータ圧縮用テーブルが更新されるの
で、メモリを有効に利用することができ、このため、優
れたデータ圧縮速度をスピ−ドアップすることが可能に
なる。
【図面の簡単な説明】
【図1】発明の原理説明図である。
【図2】実施例の構成説明図である。
【図3】データ圧縮用テーブルの要素説明図である。
【図4】検索データの要素説明図である。
【図5】データ圧縮作用を説明するフローチャート。
【図6】データ圧縮用テーブルの生成作用説明図であ
る。
【図7】データ圧縮テーブルの圧縮符号語の生成説明図
である。
【図8】データ伸長用テーブルの生成説明図である。
【符号の説明】
10 データ圧縮用テーブル 16 生成手段 18 更新手段 22 入力部 24 検索部 26 メモリ 28 出力部 30 検索データ 32 圧縮符号語

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力データと検索データとが最大長で一
    致するまで1文字単位またはビット単位でデータ圧縮用
    テーブル(10)を検索する検索手段(12)と、一致
    した最大長の検索データと対応した圧縮符号語を入力デ
    ータ列にかえて送出する送出手段(14)と、不一致と
    された入力データ長の内容の検索データ及び対応する圧
    縮符号語をデータ圧縮用テーブル(10)に生成する生
    成手段(16)と、を有することを特徴とするデータ圧
    縮装置。
  2. 【請求項2】最小可変ビット数で表現される圧縮符号語
    がビット表現できる最大数を超えたときにデータ圧縮用
    テーブル(10)を更新する更新手段(18)、を有す
    ることを特徴とする請求項1記載のデータ圧縮装置。
JP3254541A 1991-09-06 1991-09-06 デ−タ圧縮装置 Pending JPH0566920A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3254541A JPH0566920A (ja) 1991-09-06 1991-09-06 デ−タ圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3254541A JPH0566920A (ja) 1991-09-06 1991-09-06 デ−タ圧縮装置

Publications (1)

Publication Number Publication Date
JPH0566920A true JPH0566920A (ja) 1993-03-19

Family

ID=17266478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3254541A Pending JPH0566920A (ja) 1991-09-06 1991-09-06 デ−タ圧縮装置

Country Status (1)

Country Link
JP (1) JPH0566920A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498555B1 (en) 1999-07-30 2002-12-24 Murata Manufacturing Co., Ltd. Monolithic inductor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4814746A (en) * 1983-06-01 1989-03-21 International Business Machines Corporation Data compression method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4814746A (en) * 1983-06-01 1989-03-21 International Business Machines Corporation Data compression method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6498555B1 (en) 1999-07-30 2002-12-24 Murata Manufacturing Co., Ltd. Monolithic inductor

Similar Documents

Publication Publication Date Title
US5229768A (en) Adaptive data compression system
JP3342700B2 (ja) ストリングリバーサル機構を具備した単一クロックサイクルデータ圧縮装置/圧縮解除装置
JP3273119B2 (ja) データ圧縮・伸長装置
US5663721A (en) Method and apparatus using code values and length fields for compressing computer data
JP2610084B2 (ja) データ伸長方法および装置ならびにデータ圧縮伸長方法および装置
US5281967A (en) Data compression/decompression method and apparatus
EP0490964B1 (en) Improved data compression apparatus
US5396595A (en) Method and system for compression and decompression of data
EP0471518B1 (en) Data compression method and apparatus
WO1993017503A1 (en) Data compression using hashing
JPH04502377A (ja) データ圧縮
US6707400B2 (en) Method and apparatus for fast longest match search
JPH0779263B2 (ja) データ圧縮方法
JPS6356726B2 (ja)
JP4156381B2 (ja) 文字テーブルによって実施されるデータ圧縮の方法および装置
JPH0566920A (ja) デ−タ圧縮装置
JPH10261969A (ja) データ圧縮方法および装置
US6650259B1 (en) Character table implemented data decompression method and apparatus
JP2729416B2 (ja) テキストデータの復元方法
JP2769056B2 (ja) デ−タ圧縮装置
JP3132774B2 (ja) データ圧縮・復元装置
JPH05152971A (ja) データ圧縮・復元方法
JP3236747B2 (ja) データ伸長方式
JP2999561B2 (ja) データ圧縮及び復元装置
US6653949B1 (en) Data compression apparatus and method utilizing tandem coupled matrices