JPS58112135A - オンラインデ−タ転送におけるデ−タ圧縮方式 - Google Patents

オンラインデ−タ転送におけるデ−タ圧縮方式

Info

Publication number
JPS58112135A
JPS58112135A JP20954581A JP20954581A JPS58112135A JP S58112135 A JPS58112135 A JP S58112135A JP 20954581 A JP20954581 A JP 20954581A JP 20954581 A JP20954581 A JP 20954581A JP S58112135 A JPS58112135 A JP S58112135A
Authority
JP
Japan
Prior art keywords
data
characters
compression
bytes
consecutive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20954581A
Other languages
English (en)
Inventor
Tomohiko Miyahara
宮原 大彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20954581A priority Critical patent/JPS58112135A/ja
Publication of JPS58112135A publication Critical patent/JPS58112135A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)  発明の技術分野 本発明は、オンラインデータ転送におけるr−タ圧縮力
式に関し、轡に大量のデータを比較的遅い通信路を介し
て転送する場合に有利なr−夕圧縮方式に関する。
(2)技術の背景 一般に、大量のデータを比較的遅い通信vIIt−介し
て転送する場合(例えはダングツアイルのオンフィン転
送、リモー) NCPメン!等)に、転送されるデータ
中に同一の文字が連続して存在していることが多い、こ
のような場合に、連続した文字をそのまま伝送する代9
に同一文字が連続していることt−懺わす符号食用いて
データを圧縮することによりr−夕転送時間を短縮する
ことが望ましい、すなわち、比較的遅い通信路において
に、r−夕圧縮による転送時間の短mは、データ圧縮、
拡張操作に資す時間を補って余りある大きなメリ、トに
なると考えられる。更に、データ圧縮、拡張操作が簡単
てろればおる程、また、それに費す時間が短かければ短
かい程、r−夕圧縮の応用範囲は拡がる。例えば、r−
夕圧纏、拡張操作に資す時間をある程度より少くできれ
ば、スペース節約の為に通常のファイル圧i1にも応用
できる。
(3)  (を米技術と問題点 従来形Orデータ圧縮法して、コ/!レジ、ンによる圧
縮がある。これは、同一文字が連続する文字列′に1文
字または2文字に圧縮することによってr−夕の圧縮を
実現するもので、1)、圧縮の制御のために8BC(s
tring control byte ) ′t−使
用する。この圧縮法を用いた場合の圧縮r−タ例が第1
図に示される。第1図において、blよ!ランクを示す
、圧縮データにおいては、2文字以上の!ランクは1つ
の80BK圧縮され、!ランク以外の3文字以上の連続
文字は8CB+当該文字に圧縮される。その他のものは
圧縮されない。SCBのフォーマットはlI2図(4)
、(B)に示される。
前記のデータ圧縮法においては、64文字以上連続した
同一文字を圧縮することはできず、従って63文字以下
に区切って圧縮することが必要に、:。
なる。それゆえ、前記のデータ圧縮法を用いた場合、極
めて大きな数の同一文字が連続するr−タに対しても6
3文字に区切って圧縮するために圧−率が制限されると
いう問題がある。
(4)  発明の目的 本発明の主な目的は、前記の従来形の問題点にかんがみ
、簡便なf−夕圧縮操作および拡張操作により実行可能
でめり、かつ、連続し九同−文字の数が多くなればなる
ほど圧縮効軍がよくなるデータ圧縮方式を提供すること
にめる。
(5)発明の構成 本発明においては、入力ゲータ中に2バイト以上連続す
る同一文字を検出して、咳検出された連続する文字の2
バイトの後に圧−子を付加することにより、2バイト以
上連続する文字でろることを示すようにしたオンライン
ゲータ転送におけるr−夕圧縮方式であって、該連続す
る同一文字が(n+1)バイト連続しているときに、該
nを2進数表示した場合にnを表示するに必要なバイト
数から1を減じ次数だけバイト単位の「0」を連続した
後に該nを表示するバイト単位の2進数を付加した文字
列を圧縮子として用いたことt%値とする、オンライン
ゲータ転送におけるr−夕圧縮方式が提供される。
(6)  発明の実施例 本発明の一実施例としてのオンラインゲータ転送におけ
るデータ圧縮方式が以下に説明される・r−タ圧縮を用
いてr−夕を転送ファイルする場合、入力データlは、
第3図に示されるように、データ圧縮操作2を受けた後
、転送路を介してデータ転送3を行い、受信側にてデー
タ拡張操作4゜の後にr−タフアイル5.・される。
入力データは、1文字が1ノ櫂イト単位すなわち、(’
)0)ta〜(FF)14で収納されている。入力ゲー
タ中に2バイト以上連続する同一文字(H@xコード)
ハ、データ圧縮操作2において次のように変侠される。
例えば、文字島が(n+1)ノ々イト連続しているもの
とする。
”’  *  &  +  &  e  ””  会a
  書”’(n+1) ここでnは10進数で表わされる数である。
1)n+1≦256(−2”)の場合、ここでNはnの
2進数表示(01≦N≦FF)16で6る・ 2)257≦n+1≦65536(=2・2)の場合、
”@m & e & eOeNl  INm、+++こ
こで0は1バイト単位の(,00)、t4をめられす・
またNI Nmはnの2進数表示(010G≦N、N、
≦FFFF)14の上位と下位のバイトを6られす。
3)  65537≦n+1≦16777216(=2
’2’・2”)oI!f1−1・・・e & * & 
eOeOeNl eNl INm l・・・ここでNI
 N、 Nsはnの2進数懺示(oioooo≦NI 
N、 Ns≦FFFjFFF ) 16 O3ツ(Dバ
イトt6られす。
4)  166777217≧n + 1の場合、ここ
でNI N、・・・Nmはmf2進数表示した場合の各
バイトをめられし、mはその/9イト数である。またO
O・・・0は、nがmバイトでめられされることt−S
られす。
前記のr−夕圧縮を実行し良場合の例が第4図に示され
る。纂4図に示されるよう4C1048843バイトの
入力r−夕は、22バイトの転送r−タに変換され、転
送データ中VCは、圧IiIされ九部分を除いては2バ
イト以上の同一文字O連続Fi存在しなくなる。
次に転送データにr−夕拡張嫌作4を行って、元の入力
データを再生する場合を説明する。この操作においては
、転送データは先頭から走査され2バイト同一文字が連
続している位置を検出する。
連続していることが検出されると、その位置が圧縮子の
先頭で6ると認識畜れる0反いで、その2バイトの連続
文字の直後の「0」のバイト数がカウントされ圧縮子の
長さが求められる。以下、次のようにしてデータの再生
が行われる。
1)  a + a e N eの場合(0がOバイト
)、(2≦−十1≦256匁 2)  * @ & a O、NしN1  *O場合(
0カlハ())、−1−1 (257≦n+1≦65536) 3)  aellsOe・”*0+N1 m・”e%e
ONIkf!!(0が(nn−1)□々イト)、 n + 1 (65537≦n+1) このようにして、例えば、第4図に示される転送r−メ
は、再び元の入力r−タに拡張される。
前記のr−夕圧縮法の特徴は、以下の通シである。
1)トランスペアレントデー夕に対する正画法である。
従って圧縮子に特殊な文字を含まないために、入力デー
タ中にどのような文字が塊れてもかまわない、ただし、
圧縮子ONのフィールドは文字数を表わすためどox’
うな文字にもなシ得る。
この九め非ト2ンスペアレント伝送の場合には伝送制御
文字(例、tば、BTX 、 ETX 、 EOT等)
 <!:の−armけるためOII&置が必費となる。
2)圧縮/拡張のロジックが簡明で栃る。
幻 圧縮対象文字に制限がない、すなわち、圧縮子Kq
II殊な文字を使わない友めに、どのような文字(H@
Xコード)でも圧縮の対象になり得る・4)圧縮比が大
ll−0本圧縮法によれば、2・々イト以上256バイ
ト以下の同文字連続が3ノ寸イトの圧縮子に、257バ
イト以上65536バイト以下の同文字連続が5パイ)
O圧縮子に、65537バイト以上16777216バ
イト以下の同文字連続が7バイトの圧縮子に、・・・、
それぞれ置!換えられるため、データ圧縮部の圧縮比は
、3/2〜3/256 、5/257〜5/65536
 、7/65537〜7/16777216 、・・・
と文字連続が長ければ長いほど同上する。
前記のr−タ圧縮操作および拡張操作は、現在一般に用
いられている機械命令を用いたソフトウェアにより実行
することは、充分に可能であるが、更に効率よく実行す
るためには、次のような機械命令t″#九に設けること
が望ましい。
1)  SST (8can fqTorag拳)命令
(概Iり  オペランドで指定された4A囲のr−夕領
域を1バイトずつ走査して同一文字()l・Xコード)
02バイト以上の連続を発見する命令でるる。
(命令形式)  S8T  Rs −R@(説明) R
1が指すアドレスからR3が指すアドレスまでデータ領
域を1バイトずつ走査して、2バイト以上同一文字が連
続している場所を発見したら、R1にその同文字連続の
先頭アドレスを、R3の先1lil−櫂イトにその文字
を、R諺の他03バイトに(連続文字数−1)(雄大は
FFFFFF + 6−16777215) tそnぞ
れセットして終了する。
R1の他のバイトは「0」である、もし指定された範8
に文字の連続が発見されなかったときには、R1に命令
発行時のR1O値を、R1の先19111バイトに命令
発行時のRsが指すアドレスの1文字を、R1の他03
バイトに「O」tセットして終了する。
(4に件コード)  rob:連続文字が発見された。
「l」二連続文字は発見され なかった。
本命令は、r−夕圧纏操作時に同文字連続を走査する際
に、および、データ拡張操作時に圧縮子を走査する際に
有用である。
良に、本発明によるr−夕圧縮、拡張操作に専用の機械
命令として、次の2つのものを新設することが望ましい
2)  CMP (CoMPr*sa )命令(概略)
  第2オペランドで示される領域内にるるデータを本
発明による方法によ)圧縮してその結果を第1オペラン
ドで示されるデータ領域へ入れる。
命令形式)  CMF  Rす怠 (I5!明)  Rsが指すアドレスからR3+1の中
に記されている値の長さOr−夕領域内にめるr−夕に
対して前記のr−夕圧纏を施こす、その結果を81が指
すアドレスからRt+tの中に記されている値の長さの
r−夕領域に格納する。第2オペランドで与えられた領
域内のデータに対する圧縮操作が完了した場合、R1は
圧mf:施した結果のデータが納められているデータ領
域の次のアト9レスを、R1は圧縮の対象となったデー
タが納められているデータ領域の次のアドレスをポイン
トして終了する(第5図(A)参照)。
前記の命令により圧縮操作を実行中に第1オ(ランドで
与えられ九データ領域を使い切ってしまり九場合は、圧
aim作をそこで中断し%R1は圧縮を施した結果のデ
ータが納められている領域の次ノアトレスを、R1は圧
縮を中断する直前までの入力r−夕が納められている領
域の次のアドレスを、十れぞれポイントして終了する(
第5図(B)参照)、ただし、圧縮子が第1オペランド
で与えられたデータ領域の最後にまえがる場合にはその
圧縮子に関する操作赫行われず、第5図(C7に示され
るようなレジスタ状態で終了する。いずれの場合におい
ても、R1+1 ・R1+1の内容は命令終了時には不
定でめる・ 3)■P(見上and )命令 (概略) 第2オペランドで示されるデータ領域内にあ
るデータを本発明によるデータ拡張法により拡張してそ
の結果を纂lオペランドで示されるデータ領域へ入れる
(命令形式)  gxp  ai +g=(説明)  
Rmが指すアドレスからl1m+、 (D中に記されて
いる値の長さのデータ領域内にあるデータに対して前述
し九データ拡張操作を施こす。
その結果tRsが指すアドレスからR1+1の中に記さ
れている値の長さのデータ領域に納める。纂2オイラン
ドで与えられ九領域内にあるデータに対する拡張操作が
完了した場合に、B1はデータ拡張を施こした結果のr
−タが納められている領域の次のアドレスを%Rmは拡
張の対象となった入力データが納められている領域の次
のアドレスを、それぞれボイ/卜シて終了する(第6図
(4)参照)。
前記の命令により拡張操作を実行中に第1オペランドで
与えられたr−夕領域を使い切ってしまり九場合は、拡
張操作をそこで中断し、R1は拡張を施こし九結来のデ
ータが納められている領域の次のアドレスt”sRmは
拡張を中断する直前lでの入力データが納められている
領域の次のアドレスを、それぞれポイントして終了する
(w&6図(B)参照)、ただし、ある圧縮子を拡張し
たr−タが第1オペランドで与えられ九r−タ領域のs
後にまたがる場合にはその圧縮子に関する拡張操作は行
われずI!6図(Qに示されるようなレジスタ状態で終
了する・いずれの場合においてもR1+1 +R1+1
の内容は命令終了時には不定である。
(7)  発明の効果 本発明によれば、簡単なデータ圧縮および拡張操作によ
シ実現することができ、かつ遅絖同−文字数が多くなれ
ばなるほど圧縮比が向上する、r−タ圧縮方式が提供さ
れ得る。
【図面の簡単な説明】
第1図は、従来形Of−タ圧縮法を用い九轡合の圧線デ
ータを説明する図、 aI2図(4)、 CB)は、第1図のデータ圧縮法に
用いられるSCBのフォーマットを示ス図、@3図は、
本発明の一実施例としてのr−夕圧纏万式を示すプロ、
り図、 第4図は、本発明によるデータ圧縮により得られる圧縮
データを示す図、 第5図(4)、 (B) 、 (C)は、本発明による
データ圧縮を実行するために適する機械命令を説明す、
る図、第6図囚、 (B) 、 (C)は、本発明によ
るデータ圧縮を実行するために適する機械命令を説明す
る図でおる。 (符号の説BA) l・・・入力データ、2・・・データ圧縮、3・・・デ
ータ転送、4・・・r−タ拡張、5・・・データファイ
ル。 第5図(A) 第5図(B) 第51il(C) 第6図(A) l/k 6 @(B)

Claims (1)

    【特許請求の範囲】
  1. 入力データ中に2・櫂イト以上連続する同一文字を検出
    して、該検出された連続する文字の27々イトの後に圧
    縮子を付加することにより、2ノ々イト以上連続する文
    字であることを示すようにしたオンラインデータ転送に
    おけるr−夕圧縮方式で6って、該連続する同一文字が
    (、n+1)□”イト連続しているときに、該nな2進
    数表示し九場合にnを表示するに必llな・1イト数か
    ら1を減じ丸数だけバイト単位の「0」を連続した後に
    該nを表示するパイ[単位の2進数を付加した文字列を
    圧縮子として用い九こと1%像とする、オノラインデー
    タ転送におけるデータ圧縮方式。
JP20954581A 1981-12-26 1981-12-26 オンラインデ−タ転送におけるデ−タ圧縮方式 Pending JPS58112135A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20954581A JPS58112135A (ja) 1981-12-26 1981-12-26 オンラインデ−タ転送におけるデ−タ圧縮方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20954581A JPS58112135A (ja) 1981-12-26 1981-12-26 オンラインデ−タ転送におけるデ−タ圧縮方式

Publications (1)

Publication Number Publication Date
JPS58112135A true JPS58112135A (ja) 1983-07-04

Family

ID=16574577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20954581A Pending JPS58112135A (ja) 1981-12-26 1981-12-26 オンラインデ−タ転送におけるデ−タ圧縮方式

Country Status (1)

Country Link
JP (1) JPS58112135A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63148466A (ja) * 1986-12-12 1988-06-21 Hitachi Ltd データ圧縮復元方法
JPS642152A (en) * 1987-06-24 1989-01-06 Fujitsu Ltd File saving processing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63148466A (ja) * 1986-12-12 1988-06-21 Hitachi Ltd データ圧縮復元方法
JPS642152A (en) * 1987-06-24 1989-01-06 Fujitsu Ltd File saving processing system

Similar Documents

Publication Publication Date Title
US5051745A (en) String searcher, and compressor using same
US6014133A (en) Data transmitter/receiver apparatus, data transmitter, data receiver, and data compression method
JPH0568893B2 (ja)
JPH01125028A (ja) 適応データ圧縮方法および装置
JPS607300B2 (ja) 日本語デ−タの圧縮方式
JPS58112135A (ja) オンラインデ−タ転送におけるデ−タ圧縮方式
JPS63148717A (ja) データ圧縮復元処理装置
EP0721699B1 (en) Method and apparatus for a unique and efficient use of a data structure for compressing data
US5351046A (en) Method and system for compacting binary coded decimal data
JPH03206533A (ja) データ圧縮方式
JP3104302B2 (ja) データ圧縮装置
JPH07239771A (ja) データレコード圧縮方法およびデータレコード伸張方法
JP2003318739A (ja) データシーケンスを圧縮するシステム、方法、およびコンピュータ読み取り可能媒体
US20040085232A1 (en) System, method and computer readable medium for compressing a data sequence for partial decompressing
JP2769057B2 (ja) デ−タ圧縮装置
JP3186530B2 (ja) コンピュータデータの圧縮・伸長方法
US6285303B1 (en) Gate table data compression and recovery process
JPH0357018A (ja) シフトコードの圧縮方式
JPH09128212A (ja) 証券情報のデータ圧縮方法とその装置
JPH04217021A (ja) データ圧縮及び復元装置
JPS6266315A (ja) 入力制御方式
JPS54115036A (en) Control system for microprogram
JPH04299411A (ja) ファイル圧縮装置およびファイル伸張装置
JPS5816819B2 (ja) デ−タ圧縮方式
JPH04145726A (ja) データ圧縮及び復元方式