JP2536432B2 - デ―タ圧縮装置 - Google Patents

デ―タ圧縮装置

Info

Publication number
JP2536432B2
JP2536432B2 JP26828193A JP26828193A JP2536432B2 JP 2536432 B2 JP2536432 B2 JP 2536432B2 JP 26828193 A JP26828193 A JP 26828193A JP 26828193 A JP26828193 A JP 26828193A JP 2536432 B2 JP2536432 B2 JP 2536432B2
Authority
JP
Japan
Prior art keywords
data
unit
divided
management
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26828193A
Other languages
English (en)
Other versions
JPH07104970A (ja
Inventor
博男 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP26828193A priority Critical patent/JP2536432B2/ja
Publication of JPH07104970A publication Critical patent/JPH07104970A/ja
Application granted granted Critical
Publication of JP2536432B2 publication Critical patent/JP2536432B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、データ圧縮装置に係
り、とくにデータ通信において好適なデータ圧縮装置に
関する。
【0002】
【従来の技術】コンピュータにおけるデータ圧縮とは、
コンピュータで処理するファイル中のデータを圧縮して
ファイル・サイズを小さくすることである。
【0003】データ圧縮を利用してファイル・サイズを
小さくすることで、ハードディスクの貴重なフリースペ
ースを増やしたり、重要なファイルのバックアップに必
要なフロッピーディスクの枚数を減らすことができる。
【0004】また、モデムを通じてファイルの送受信を
行う際、データ圧縮でファイルを小さくすることで、通
信時間と電話料金を節約することができる。
【0005】つまり、データ圧縮によって記憶や通信に
おけるコストを大幅に減らすことが可能となる。
【0006】そして、データ圧縮は、ファイルアーカイ
バや分散ファイルシステム、データ通信、音声・画像通
信、コンピュータネットワーク等の分野で重要な役割を
果たしている。
【0007】データ圧縮は、符号化とも呼ばれ、圧縮デ
ータ列の長さと原データ列の長さの比で定まる圧縮比を
できるだけ小さくすることを目的とする。
【0008】最も基本的な符号化法は、各文字を一つず
つ符号語に符号化するとき、平均符号長を最小にする方
法である。
【0009】このような符号は、コンパクト符号と呼ば
れ、1952年にハフマンによって具体的な符号の構成
法が示された。
【0010】しかしながらハフマン符号では、英文のテ
キストファイルで80%程度の圧縮比しか実現できず、
しかも圧縮データ列の他に文字と符号語の対応表あるい
は符号の木を必要とするために原データ列よりも圧縮デ
ータ列のほうが長くなる場合がある。
【0011】そこで、符号化の効率を向上させるため
に、何個かの文字をまとめたブロックに対して符号化を
行う「ブロック符号化」が提案された。
【0012】
【発明が解決しようとする課題】しかしながら、上記従
来例においては、バイト単位でバイト列に対して1バイ
トで表せる記号の出現頻度に基づき符号化するために、
バイト単位での出現頻度が特定のデータに片寄らないと
きには、充分な圧縮が行われず、データ記憶時の記憶容
量の削減やデータ転送時の転送時間の短縮が期待できな
いという不都合があった。
【0013】
【発明の目的】本発明の目的は、かかる従来例の有する
不都合を改善し、特に、データ圧縮を有効に行うことが
できるデータ圧縮装置を提供することにある。
【0014】
【課題を解決するための手段】そこで、データを記憶部
から読出すと共にデータを3バイト毎に抽出するデータ
抽出部と、このデータ抽出部が抽出した3バイトのデー
タを3ビット単位で8つの組に分割するデータ分割部
と、このデータ分割部が分割した8つの組の各分割デー
タを比較して各分割データのパターンの内どの分割デー
タのパターンによって符号化するかを決定すると共に8
つの組の各分割データのうちこの決定したあるパターン
と同一の分割データのみを符号化する符号化部と、この
符号化部が符号化した8つの組の各分割データについて
それぞれ符号化されたか否かを符号化した管理データを
作成する管理データ作成部と、この管理データ作成部が
作成した管理データに符号化していない分割データを付
加して圧縮データを生成すると共に当該圧縮データを記
憶部に格納する圧縮データ作成部とを備えた、等の構成
を採っている。これによって前述した目的を達成しよう
とするものである。
【0015】
【作用】データ抽出部は、ファイルから3バイト分のデ
ータを抽出し、データ分割部に出力する。
【0016】データ分割部は、データ抽出部からの3バ
イトデータを3ビット単位で8つの組に分割し、符号化
部に出力する。
【0017】符号化部は、3ビットデータのあるパター
ンで8つの組を符号化して管理データ作成部に出力す
る。
【0018】管理データ作成部は、符号化部が符号化し
た8つの組の3ビットデータの符号から、さらに、1バ
イトのデータを生成する。この管理データを圧縮データ
作成部に出力する。
【0019】圧縮データ作成部は、管理データ作成部か
らの管理データに、符号化したあるパターン以外の組の
データを付加して圧縮データを生成する。
【0020】
【発明の実施例】以下、本発明の一実施例を図1及び図
2を参照して説明する。
【0021】図1は本発明の実施例を示すブロック図で
あり、データ圧縮装置は、データを記憶部6から読出す
と共にデータを3バイト毎に抽出するデータ抽出部1
と、このデータ抽出部1が抽出した3バイトのデータを
3ビット単位で8つの組に分割するデータ分割部2と、
このデータ分割部2が分割した8つの組の各分割データ
を比較して各分割データのパターンの内どの分割データ
のパターンによって符号化するかを決定すると共に8つ
の組の各分割データのうちこの決定したあるパターンと
同一の分割データのみを符号化する符号化部3と、この
符号化部3が符号化した8つの組の各分割データについ
てそれぞれ符号化されたか否かを符号化した管理データ
を作成する管理データ作成部4と、この管理データ作成
部4が作成した管理データに符号化していない分割デー
タを付加して圧縮データを生成すると共に当該圧縮デー
タを記憶部6に格納する圧縮データ作成部5とを備えて
いる。
【0022】また、符号化部3が、予め定められた特定
の分割データのパターンを用いて符当該分割データを符
号化するパターン設定機能を有している。
【0023】さらに、管理データ作成部4が、符号化し
たものを「1」とし、それ以外の組を「0」る符号化管
理機能を有している。
【0024】次に、本実施例の動作について図2を参照
して説明する。
【0025】.データ抽出部1は、記憶部6に格納さ
れているファイルから3バイトのデータを抽出する。一
例として、抽出されたデータが「00h」、「2C
h」、「00h」であったとする。ここでhは、16進
数であることを示すヘキサである。
【0026】この16進数を2進数で、すなわち、バイ
ナリ形式で示すと、「00000000」、「0010
1100」、「00000000」となる。
【0027】.データ分割部2は、データ抽出部1が
抽出したデータを3ビット単位で8つの組に分割すると
ともに、管理データ作成部3に出力する。上記のデータ
の場合は、「000」、「000」、「000」、「0
10」、「110」、「000」、「000」、「00
0」となる。3ビット単位に分割するため、「00h」
と「2Ch」にまたがったデータが符号化部3に出力さ
れる。
【0028】.符号化部3は、データ分割部2からの
3ビットデータに基づいて、ある3ビットの組み合せを
を「1」、それ以外の値の組を「0」として、管理デー
タを作成する。どの組合せで管理データを生成するか
は、ここでは、予め「000」の組みに設定されてい
る。上記のデータの場合は、「1」、「1」、「1」、
「0」、「0」、「1」、「1」、「1」となる。
【0029】.管理データ作成部3は、「11100
111」=「E7h」という管理データを作成する。管
理データの「1」が「000」を示すことを、当該圧縮
データを伸長する図示しないデータ伸長装置に予め設定
されている。
【0030】.圧縮データ作成部4は、管理データ作
成部3からの管理データに、「000」以外の組の値を
付加する。すなわち、上記のデータの場合は、「E7
h」、「010」、「110」となる。
【0031】.さらに、圧縮データ作成部4は、管理
データに続くデータが8ビットの倍数になるように値が
「0」のビットデータを付加し、圧縮データとして記憶
部6に格納する。上記のデータの場合は、「E7H」、
「010」、「110」、「00」となる。すなわち、
「E7H」、「58H」となる。
【0032】上記の例では「00H」、「2CH」、
「00H」という3バイトデータが「E7H」、「58
H」という2バイトデータに圧縮されている。すなわ
ち、圧縮率は66.7%である。
【0033】また、上記の例では、管理データ作成部3
において、3ビットデータが「000」の場合を符号化
しているが、これに限定されるものではなく、出現頻度
の高い3ビットデータを符号化することが可能である。
【0034】符号化部3が備えた分割データのパターン
選択機能は、次のような手段の複合によって実現する。
この分割データは3ビットであるため、分割データのパ
ターンは8通りである。そのため、パターン選択機能
は、分割データの全てに対して8通りのパターンで検索
を行ない、それぞれのパターンの出現率を記憶する。次
に、この出現率が最大であったパターンを選択する。出
現率が高ければ高いほど圧縮率が高くなる。
【0035】本発明において、全てのデータを符号化で
きた場合には、データ容量は3分の1に減少できる。
【0036】
【発明の効果】本発明は以上のように構成され機能する
ので、これによると、データを分割した後にこれを符号
化することによって圧縮するため、別の手段で圧縮率が
低かったデータであっても、有効にかつ確実にデータを
圧縮することができ、これがため、必要な記憶容量を削
減でき、しかもデータの転送時間を短縮することができ
るという従来にない優れたデータ圧縮装置を提供するこ
とができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図である。
【図2】実施例の動作を示す説明図である。
【符号の説明】
1 データ抽出部 2 データ分割部 3 符号化部 4 管理データ作成部 5 圧縮データ作成手段 6 記憶手段

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 データを記憶部から読出すと共にデータ
    を3バイト毎に抽出するデータ抽出部と、このデータ抽
    出部が抽出した3バイトのデータを3ビット単位で8つ
    の組に分割するデータ分割部と、このデータ分割部が分
    割した8つの組の各分割データを比較して各分割データ
    のパターンの内どの分割データのパターンによって符号
    化するかを決定すると共に8つの組の各分割データのう
    ちこの決定したあるパターンと同一の分割データのみを
    符号化する符号化部と、この符号化部が符号化した8つ
    の組の各分割データについてそれぞれ符号化されたか否
    かを符号化した管理データを作成する管理データ作成部
    と、この管理データ作成部が作成した管理データに符号
    化していない分割データを付加して圧縮データを生成す
    ると共に当該圧縮データを記憶部に格納する圧縮データ
    作成部とを備えたことを特徴とするデータ圧縮装置。
  2. 【請求項2】 前記符号化部が、予め定められた特定の
    分割データのパターンを用いて当該分割データを符号化
    するパターン設定機能を有することを特徴とする請求項
    1記載のデータ圧縮装置。
  3. 【請求項3】 前記符号化部が、分割データのパターン
    のうち最も出現頻度の高いパターンを用いて符号化する
    パターン選択機能を有することを特徴とする請求項1記
    載のデータ圧縮装置。
  4. 【請求項4】 前記管理データ作成部が、符号化したも
    のを「1」とし、それ以外の組を「0」と符号化し、こ
    の「1」及び「0」の組み合わせで1バイトのデータを
    作成する符号化管理機能を有することを特徴とする請求
    項1,2又は3項記載のデータ圧縮装置。
JP26828193A 1993-09-30 1993-09-30 デ―タ圧縮装置 Expired - Fee Related JP2536432B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26828193A JP2536432B2 (ja) 1993-09-30 1993-09-30 デ―タ圧縮装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26828193A JP2536432B2 (ja) 1993-09-30 1993-09-30 デ―タ圧縮装置

Publications (2)

Publication Number Publication Date
JPH07104970A JPH07104970A (ja) 1995-04-21
JP2536432B2 true JP2536432B2 (ja) 1996-09-18

Family

ID=17456369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26828193A Expired - Fee Related JP2536432B2 (ja) 1993-09-30 1993-09-30 デ―タ圧縮装置

Country Status (1)

Country Link
JP (1) JP2536432B2 (ja)

Also Published As

Publication number Publication date
JPH07104970A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
JP3337633B2 (ja) データ圧縮方法及びデータ復元方法並びにデータ圧縮プログラム又はデータ復元プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2915568B2 (ja) テープドライブシステムのための適応データ圧縮装置
KR100894002B1 (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
US5396595A (en) Method and system for compression and decompression of data
US5973630A (en) Data compression for use with a communications channel
US5374916A (en) Automatic electronic data type identification process
US5467087A (en) High speed lossless data compression system
US4597057A (en) System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles
EP0584992A2 (en) Text compression technique using frequency ordered array of word number mappers
US5673042A (en) Method of and an apparatus for compressing/decompressing data
JP3240495B2 (ja) データの可逆符号化方法および装置、並びに、伸長装置
US5877711A (en) Method and apparatus for performing adaptive data compression
JPH0779262B2 (ja) 圧縮データの符号化方法
JP2001507543A (ja) 情報を処理する方法および手段
CN101350624A (zh) 一种支持ansi编码的中文文本的压缩方法
US6225922B1 (en) System and method for compressing data using adaptive field encoding
JPH03204233A (ja) データ圧縮方法
JP2536432B2 (ja) デ―タ圧縮装置
JPH0779265B2 (ja) 圧縮データの復号方法
Shanmugasundaram et al. IIDBE: A lossless text transform for better compression
JP2940948B2 (ja) データ圧縮方式
Shanmugasundaram et al. Text preprocessing using enhanced intelligent dictionary based encoding (EIDBE)
EP0340041A2 (en) Start, step, stop unary coding for data compression
EP0494038A2 (en) Run-length encoding in extensible character sets
KR100608151B1 (ko) 유무선 통신망을 매개로 전송되는 데이터의 통신량감축방법과 이 감축방법을 이용한 데이터 통신방법

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960514

LAPS Cancellation because of no payment of annual fees