JPH04369028A - データ圧縮方法 - Google Patents

データ圧縮方法

Info

Publication number
JPH04369028A
JPH04369028A JP3145097A JP14509791A JPH04369028A JP H04369028 A JPH04369028 A JP H04369028A JP 3145097 A JP3145097 A JP 3145097A JP 14509791 A JP14509791 A JP 14509791A JP H04369028 A JPH04369028 A JP H04369028A
Authority
JP
Japan
Prior art keywords
compressed
characters
data
compression
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3145097A
Other languages
English (en)
Inventor
Takefumi Ueda
植田 剛文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3145097A priority Critical patent/JPH04369028A/ja
Publication of JPH04369028A publication Critical patent/JPH04369028A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ圧縮方法に係り
、詳しくは、例えば、データ保存装置、及びデータ転送
装置等に用いて好適な、特に、試験データ等のようにデ
ータ種別の少ないデータに対するデータ圧縮方法に関す
る。近年、種々様々な多量の情報が氾濫しており、これ
ら情報をデータとして保存するとき、例えば、そのまま
の状態で格納すると膨大な格納領域を必要とする場合が
あり、このような場合、データを有効に格納するために
、より小さな格納領域にデータを保存するためのデータ
圧縮方法が数多く開発されている。
【0002】そして、一般にデータ圧縮においては、よ
り高い圧縮率によるデータの圧縮が要求される。
【0003】
【従来の技術】従来のこの種のデータ圧縮方法としては
、例えば、図2、及び図3に示すような方法がある。 図2に示すデータ圧縮方法は、ある圧縮対象となる文字
(以下、圧縮対象文字という)αに基づいてデータの圧
縮を行うものであり、この場合は、圧縮対象文字αとし
てNULL文字(“00”)の圧縮による削除を行うも
のであるため、NULL削除と呼ばれる方法である。
【0004】まず、圧縮対象文字αとしてNULL文字
が設定され、NULL文字が2個以上連続している場合
、NULL文字の後に、連続するNULL文字の個数が
付加されることによりデータ圧縮がなされるものである
。ちなみに、この場合、8バイトのデータが7バイトに
圧縮されている。また、図3に示すデータ圧縮方法は、
ビット写像と呼ばれる方法であり、まず、予め圧縮すべ
きデータ中に用いられる文字の分布が調べられて、デー
タ内に分布している最も多くの文字が圧縮対象文字α(
この場合、NULL文字が圧縮対象文字αとなっている
)と仮定される。そして、そのデータ分布がビットの並
びにより表され(以下、ビット表現という)、圧縮対象
図βが作成される。
【0005】ここで、このビット表現について詳しく説
明すると、まず、圧縮対象文字αであるNULL文字が
ビット1で表されるとともに、圧縮対象文字以外の文字
(以下、圧縮対象外文字という)がビット0で表され、
図3に示す圧縮適用範囲中のデータ列、A,00,00
,B,00,C,00,Dが圧縮対象図βとしてビット
01101010で表される。
【0006】すなわち、圧縮すべきデータが圧縮対象図
、圧縮対象外文字の順に配列されてデータが圧縮される
。ちなみに、この場合、8バイトのデータが5バイトに
圧縮されている。そして、これらの圧縮方法は、圧縮を
行う単位が共にファイル単位となっている。
【0007】
【発明が解決しようとする課題】しかしながら、このよ
うな従来のデータ圧縮方法にあっては、圧縮を行う単位
がファイル単位になっているため、ファイル内で最も使
用している文字を圧縮対象文字αと仮定しなければ効率
良く圧縮が行えないという問題点があった。すなわち、
図2に示す従来例にあっては、圧縮対象文字αに基づい
てデータの圧縮を行うものであったため、圧縮対象文字
αを予め仮定していないと展開が行えない。
【0008】つまり、NULL削除もビット写像も、デ
ータ圧縮対象文字が1つであるため、圧縮対象範囲中の
データ内の圧縮対象文字αの分布として、例えば、図4
に示すように、ある特定文字の出現頻度が極端に高い場
合は、効率良くデータを圧縮できるが、図5に示すよう
に、データ中の文字の出現頻度が平均的である場合、圧
縮効率が悪くなるといった問題点がある。
【0009】[目的]そこで本発明は、圧縮すべきデー
タ中に用いられる文字の出現頻度が平均的であった場合
でも高い圧縮率でデータ圧縮のできるデータ圧縮方法を
提供することを目的としている。
【0010】
【課題を解決するための手段】本発明によるデータ圧縮
方法は上記目的達成のため、予め設定された圧縮適用範
囲に存在する圧縮すべきデータ中に用いられる文字の分
布を調べるとともに、該分布に基づいて出現頻度の高い
文字を圧縮対象文字として所定数抽出し、該所定数抽出
された各圧縮対象文字にそれぞれ対応するコードを割り
付け、該圧縮対象文字以外の文字と該圧縮対象文字との
並びをそれぞれビット列で表した圧縮対象図を生成し、
該圧縮すべきデータを該圧縮適用範囲、該圧縮対象文字
、該圧縮対象図、及び該圧縮対象以外の文字の順に配列
したデータとするように構成している。
【0011】
【作用】本発明では、予め設定された圧縮適用範囲に存
在する圧縮すべきデータ中に用いられる文字の分布が調
べられ、この分布に基づいて出現頻度の高い文字が圧縮
対象文字として所定数抽出されて圧縮処理が行われる。 すなわち、圧縮すべきデータ中に用いられる文字の出現
頻度が平均的であった場合においても高い圧縮率でデー
タ圧縮がなされる。
【0012】
【実施例】以下、本発明を図面に基づいて説明する。図
1は本発明に係るデータ圧縮方法の一実施例を示す図で
あり、本実施例のデータ圧縮方法を説明するための図で
ある。なお、図1において、‘□’は8ビット、すなわ
ち、1バイトの文字コード情報を示す。
【0013】本実施例は、予め設定された圧縮適用範囲
a内の各圧縮対象文字bに基づいて圧縮を行い、圧縮対
象文字bがどのように圧縮されたかを示す圧縮対象図c
を作成するとともに、元のデータから圧縮対象文字bを
取り除いたデータを作成するものである。これを詳しく
説明すると、まず、予め設定された圧縮適用範囲aであ
る20バイトのデータエリアに存在する圧縮すべきデー
タ列“AXXXYYYZZZEZFYGXXHJX”に
用いられる文字の分布が調べられ、この分布から出現頻
度の高い文字が3個、圧縮対象文字bとして抽出される
【0014】ちなみに、この場合の圧縮対象範囲におけ
るデータ中のそれぞれの文字の出現数は、Xが6個、Y
が4個、Zが4個で、A,E,F,G,H,Jがそれぞ
れ1個ずつであり、出現数が同数の場合、アルファベッ
ト順に優先順位が決定されるため、圧縮対象文字bはX
,Y,Zとなる。次に、各圧縮対象文字bであるX,Y
,Zに対してX=01、Y=10、Z=11といったコ
ードがそれぞれ割り付けられ、圧縮対象外文字(この場
合、00が割り付けられる)と圧縮対象文字aとの並び
がビット列で表され、表1に示すような圧縮対象図cが
生成される。ちなみに、データの単位が1バイト(8ビ
ット)であるため、圧縮対象図cの個数は(圧縮適用範
囲−1)/4+1で計算で求めることができる。
【0015】
【表1】
【0016】そして、圧縮すべきデータが圧縮適用範囲
a(この場合、20)、圧縮対象文字b(この場合、X
,Y,Z)、圧縮対象図c(表1参照)、圧縮対象外文
字(この場合、A,E,F,G,H,J)の順に配列さ
れたデータといることにより、元々20バイトのデータ
が15バイトに圧縮される。ちなみに、本実施例で用い
た20バイトのデータ列に対して、従来の方法を適用し
た場合、圧縮対象文字をNULL文字ではなくXとした
場合のNULL削除の方法では、わずか1バイトの圧縮
しかできず、Xを圧縮対象文字としたビット写像を用い
た方法でも、3バイトの圧縮しかできない。
【0017】すなわち、ビット写像においては1文字/
1ビット圧縮となっているが、本実施例では3文字/2
ビット圧縮となるため、従来の方法より効率良く圧縮を
行うことができる。また本実施例では、文字以外のデー
タでも使用することが可能であり、適用範囲が広くなっ
ている。
【0018】したがって、圧縮すべきデータ中に用いら
れる文字の出現頻度が平均的であった場合でも、高い圧
縮率でデータ圧縮を行うことができる。なお、上記実施
例は2ビットで1文字を示しており、(00)は圧縮を
していない文字を示しているが、これに限らず、圧縮対
象文字をいくつ設定するかにより1文字を何ビットに設
定するかは任意である。
【0019】また、本実施例では1バイト(8ビット)
で圧縮適用範囲を表すため、255バイトまでしか範囲
を表せないが、圧縮適用範囲に割り当てるバイト数を増
やすことで容易に圧縮適用範囲の増加が可能であること
は言うまでもない。
【0020】
【発明の効果】本発明では、予め設定された圧縮適用範
囲に存在する圧縮すべきデータ中に用いられる文字の分
布を調べ、この分布に基づいて出現頻度の高い文字を圧
縮対象文字として所定数抽出して圧縮処理を行うことが
でき、圧縮すべきデータ中に用いられる文字の出現頻度
が平均的であった場合でも、高い圧縮率でデータ圧縮を
行うことができる。
【図面の簡単な説明】
【図1】本発明一実施例のデータ圧縮方法を説明するた
めの図である。
【図2】従来のデータ圧縮方法を説明するための図であ
る。
【図3】他の従来のデータ圧縮方法を説明するための図
である。
【図4】従来のデータ圧縮方法が有効な場合のデータ分
布を示す図である。
【図5】従来のデータ圧縮方法が有効でない場合のデー
タ分布を示す図である。
【符号の説明】
a    圧縮適用範囲 b    圧縮対象文字 c    圧縮対象図

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  予め設定された圧縮適用範囲に存在す
    る圧縮すべきデータ中に用いられる文字の分布を調べる
    とともに、該分布に基づいて出現頻度の高い文字を圧縮
    対象文字として所定数抽出し、該所定数抽出された各圧
    縮対象文字にそれぞれ対応するコードを割り付け、該圧
    縮対象文字以外の文字と該圧縮対象文字との並びをそれ
    ぞれビット列で表した圧縮対象図を生成し、該圧縮すべ
    きデータを該圧縮適用範囲、該圧縮対象文字、該圧縮対
    象図、及び該圧縮対象以外の文字の順に配列したデータ
    とすることを特徴とするデータ圧縮方法。
JP3145097A 1991-06-18 1991-06-18 データ圧縮方法 Withdrawn JPH04369028A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3145097A JPH04369028A (ja) 1991-06-18 1991-06-18 データ圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3145097A JPH04369028A (ja) 1991-06-18 1991-06-18 データ圧縮方法

Publications (1)

Publication Number Publication Date
JPH04369028A true JPH04369028A (ja) 1992-12-21

Family

ID=15377307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3145097A Withdrawn JPH04369028A (ja) 1991-06-18 1991-06-18 データ圧縮方法

Country Status (1)

Country Link
JP (1) JPH04369028A (ja)

Similar Documents

Publication Publication Date Title
JP3337633B2 (ja) データ圧縮方法及びデータ復元方法並びにデータ圧縮プログラム又はデータ復元プログラムを記録したコンピュータ読み取り可能な記録媒体
US4558302A (en) High speed data compression and decompression apparatus and method
EP0650264A1 (en) Byte aligned data compression
JPH07200247A (ja) データ圧縮装置および方法
DE4340591A1 (de) Datenkompressionsverfahren unter Verwendung kleiner Wörterbücher zur Anwendung auf Netzwerkpakete
JPH03204233A (ja) データ圧縮方法
JPH02228879A (ja) データ圧縮方法
KR100573527B1 (ko) 그래픽 이미지 압축 및 복원 방법
US20030112161A1 (en) Method and apparatus for compressing data in which dictionary sizes are reduced
US6112208A (en) Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
EP2690565B1 (en) Method and system for compressing data records and for processing compressed data records
JP2863370B2 (ja) ファイル圧縮暗号処理装置
JPH04369028A (ja) データ圧縮方法
CN112506651B (zh) 一种大数据量环境中数据运算的方法和设备
CN111488439B (zh) 保存和分析日志数据的系统和方法
US6092070A (en) Method and system for lossless date compression and fast recursive expansion
CN107835158B (zh) Sna网络体系下交互数据的传输方法及装置
JP2790594B2 (ja) データベースレコードの圧縮方法および復元方法
JPH05265416A (ja) 画像情報伝送方式
US9298799B1 (en) Method and apparatus for utilizing patterns in data to reduce file size
JPH03206533A (ja) データ圧縮方式
JPH02190080A (ja) 画像符号化装置
JP3152772B2 (ja) 画像データ復元装置
JPH05260322A (ja) 2値画像圧縮方式
JP3186530B2 (ja) コンピュータデータの圧縮・伸長方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980903