JPS62186619A - デ−タ圧縮方式 - Google Patents
デ−タ圧縮方式Info
- Publication number
- JPS62186619A JPS62186619A JP61028501A JP2850186A JPS62186619A JP S62186619 A JPS62186619 A JP S62186619A JP 61028501 A JP61028501 A JP 61028501A JP 2850186 A JP2850186 A JP 2850186A JP S62186619 A JPS62186619 A JP S62186619A
- Authority
- JP
- Japan
- Prior art keywords
- byte
- kanji code
- bit
- kanji
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013144 data compression Methods 0.000 title claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は情報処理装置疋おけるデータ圧縮方式、さらに
詳しく云えば2バイトより構成される漢字コード列のデ
ータ圧縮方式に関する。
詳しく云えば2バイトより構成される漢字コード列のデ
ータ圧縮方式に関する。
(従来の技術)
従来の漢字コードのデータ圧縮は2バイトコードとして
ではなく、他の文字コードと同様に。
ではなく、他の文字コードと同様に。
1バイト;−ドとしてのデータ圧縮が行われている。
これは連続する同じコード列t、コード自身?示すバイ
トと連続する個数を示すバイトで構成するものである。
トと連続する個数を示すバイトで構成するものである。
(発明が解決しようとする問題点)
このように従来のデータ圧縮では2バイトの漢字コード
全1バイトとして扱っている几め、同じ漢字;−ドが連
続し定場合はデータ圧縮の対象とはなっていない。
全1バイトとして扱っている几め、同じ漢字;−ドが連
続し定場合はデータ圧縮の対象とはなっていない。
本発明の目的は上述の欠点ケ屏決するもので、連続した
同じ漢字コードをデータ圧縮の対象とするデータ圧縮方
式を提供することにある。
同じ漢字コードをデータ圧縮の対象とするデータ圧縮方
式を提供することにある。
(問題点を解決する念めの手段)
前記目的を達成する之めに本発明によるデータ圧縮方式
は第1バイトと第2バイトから構成される漢字コード列
を圧縮するデータ圧縮方式において、入力する漢字コー
ドの第2バイトの最上位ビット全1にするビット変換部
と、前記ビット変換部によりビット変換された漢字コー
ド全記憶する記憶部と、前記ビット変換部にょジビット
変換された漢字コードと前記記憶部に記憶されている現
在の漢字コード列より以前の漢字コードとを比較する比
較部と、前記比較の結果、第1バイトおよび第2バイト
がともに連続して一般し友場合、その回数上計数する計
数部と、前記計数部での計数値と、前記ビット変換部で
ビット変換された漢字コードの第1バイトと第2バイト
のうち1つを前記計数値と前記比収績果により選択して
出力する選択部とから構成しである。
は第1バイトと第2バイトから構成される漢字コード列
を圧縮するデータ圧縮方式において、入力する漢字コー
ドの第2バイトの最上位ビット全1にするビット変換部
と、前記ビット変換部によりビット変換された漢字コー
ド全記憶する記憶部と、前記ビット変換部にょジビット
変換された漢字コードと前記記憶部に記憶されている現
在の漢字コード列より以前の漢字コードとを比較する比
較部と、前記比較の結果、第1バイトおよび第2バイト
がともに連続して一般し友場合、その回数上計数する計
数部と、前記計数部での計数値と、前記ビット変換部で
ビット変換された漢字コードの第1バイトと第2バイト
のうち1つを前記計数値と前記比収績果により選択して
出力する選択部とから構成しである。
(実 施 例)
次に図面等全参照して本発明の詳細な説明する。
一般に、JISの第1水準、第2水撫のような漢字コー
ドに、第1バイト、第2バイトともに(20)16〜(
7F) 1gのコードで表わされている。ここで(X)
tsra、+6進数であることを示している。−例をも
って示すならば例えば「安」は(30)le (42)
la、「易」は(30)1o (57)t6で表わされ
る。
ドに、第1バイト、第2バイトともに(20)16〜(
7F) 1gのコードで表わされている。ここで(X)
tsra、+6進数であることを示している。−例をも
って示すならば例えば「安」は(30)le (42)
la、「易」は(30)1o (57)t6で表わされ
る。
本発明では第1バイトと第2バイトとを区別する几めに
第2バイトの最上位ピッ1グ1″にしている。
第2バイトの最上位ピッ1グ1″にしている。
第2図はデータ圧縮後のコードのビット構成を示す図で
ある。最上位ビットが(す2のとき漢字コードの第1バ
イトを示しs (”)2のとき第2バイトを示してい
る。さらに上位3ビツトが(10す2のとき下位5 b
itで、連続した漢字コードの一致回数を示している。
ある。最上位ビットが(す2のとき漢字コードの第1バ
イトを示しs (”)2のとき第2バイトを示してい
る。さらに上位3ビツトが(10す2のとき下位5 b
itで、連続した漢字コードの一致回数を示している。
第1囚は本発明によるデータ圧縮方式の一実施例を示す
図である。ビット変換部1はデータ入力からの漢字コー
ドを入カレ、その第2バイトの最上位ピッ)t(1)z
にして出力するものである。記憶部2は、ビット変換さ
れ定漢字コード11ヲ次の漢字コードと比較するために
保持するものである。比較部3は現在の漢字コードと1
つ前の漢字コードとを比較するもので、第1バイトのみ
一致したとき一致信号31′?:出力し第1バイト、第
2バイトの両方が一致したとき一致信号32t?出力す
るものである。計数部4は一致傷号32t−受けて一致
した回数を数える5ビツトのカウンタでその回数を出力
線41に出し、(11111)2の時キャリー信号42
ヲ出力するものである。データ選択部5は一致信号32
が真ではなくて、一致回数41が0でないとき、ま友は
キャリー信号42が真のとき、一致回数41の上位に(
100)z′lc付加して、これ會データ出力51とし
て出力する。また、一致信号31.32とも真でないと
きは、ビット変換された漢字コード11の第1バイトヲ
51に出力する。さらに一致信号32が真でないとき、
ビット変換された漢字コード11の第2バイトを51に
出方する。
図である。ビット変換部1はデータ入力からの漢字コー
ドを入カレ、その第2バイトの最上位ピッ)t(1)z
にして出力するものである。記憶部2は、ビット変換さ
れ定漢字コード11ヲ次の漢字コードと比較するために
保持するものである。比較部3は現在の漢字コードと1
つ前の漢字コードとを比較するもので、第1バイトのみ
一致したとき一致信号31′?:出力し第1バイト、第
2バイトの両方が一致したとき一致信号32t?出力す
るものである。計数部4は一致傷号32t−受けて一致
した回数を数える5ビツトのカウンタでその回数を出力
線41に出し、(11111)2の時キャリー信号42
ヲ出力するものである。データ選択部5は一致信号32
が真ではなくて、一致回数41が0でないとき、ま友は
キャリー信号42が真のとき、一致回数41の上位に(
100)z′lc付加して、これ會データ出力51とし
て出力する。また、一致信号31.32とも真でないと
きは、ビット変換された漢字コード11の第1バイトヲ
51に出力する。さらに一致信号32が真でないとき、
ビット変換された漢字コード11の第2バイトを51に
出方する。
ここでr LJ LJ LJ安易」という漢字コード列
がデータとして入力され念場合を説明する。なおr L
I Jは空白を示す記号である。まずruJのコードで
ある(21)16 (21)1gが入力されビット変換
部lで第2バイトの最上位ビットに(1)2が付されて
、コード列(21)111 (Al)Illに変換され
る。比較部3では記憶部2の出力21とこのコード(2
1)16(21)1g とが比較される。記憶部2には
(DO)18(80)16が保持されているとすると比
較部3に対し一致信号31 、32に偽を出力する。こ
の信号により選択部5はデータ出力としてコード列(2
1)ta(Bl)ts金比出力る。ま友この間に記憶部
2にはコード列(21)111 (Bl)1gが保持さ
れる。
がデータとして入力され念場合を説明する。なおr L
I Jは空白を示す記号である。まずruJのコードで
ある(21)16 (21)1gが入力されビット変換
部lで第2バイトの最上位ビットに(1)2が付されて
、コード列(21)111 (Al)Illに変換され
る。比較部3では記憶部2の出力21とこのコード(2
1)16(21)1g とが比較される。記憶部2には
(DO)18(80)16が保持されているとすると比
較部3に対し一致信号31 、32に偽を出力する。こ
の信号により選択部5はデータ出力としてコード列(2
1)ta(Bl)ts金比出力る。ま友この間に記憶部
2にはコード列(21)111 (Bl)1gが保持さ
れる。
次に、再び「1」のコード列(21)16(21)16
が入力されると比較部3において、一致信号31゜32
に真を出力する。よって一致信号32を受けて計数部4
のカウンタの出力は(1)loFcなる。
が入力されると比較部3において、一致信号31゜32
に真を出力する。よって一致信号32を受けて計数部4
のカウンタの出力は(1)loFcなる。
さらに「―」がデータ入力されると、計数部4のカウン
タの出力は(2hOKなる。
タの出力は(2hOKなる。
次いで「安」のコード列(3u、)I6(,42h6が
入力されると、比較部3の出力である一致何芳31゜3
2にともに偽が出力される。この結果よV選V〈部5は
計数部の出力信号41の値(2,)10の上位に(io
o)2を付加してコード列(82)tsをデータ出力5
1として出す。さらに「女」のビット変換され次コード
(30)16(02)16 k出力する。
入力されると、比較部3の出力である一致何芳31゜3
2にともに偽が出力される。この結果よV選V〈部5は
計数部の出力信号41の値(2,)10の上位に(io
o)2を付加してコード列(82)tsをデータ出力5
1として出す。さらに「女」のビット変換され次コード
(30)16(02)16 k出力する。
この間に記憶部2にはコード列(30)16(02)1
8が保持され、計数部4のカウントは、(す1Gになる
。
8が保持され、計数部4のカウントは、(す1Gになる
。
さらに「易」のコード列(30)16 (57ハ6が入
力されると、比較部の出力である一致イぎ号31に真が
出力され、一致イ1号32に偽が出力される。
力されると、比較部の出力である一致イぎ号31に真が
出力され、一致イ1号32に偽が出力される。
この結果により選択部5に「易」のビット変換されたコ
ードの第2バイト(D7)tit”出力する。
ードの第2バイト(D7)tit”出力する。
以上の動作の結果、(21)Is (21)se (2
1) ts(21)16 (21)16 (21)16
(3(1)16 (42)ts (3(1)ts(5
7)16というコードタ1jが% (21)ts(Al
ンts(82)+(30)16 (02ha (D7)
16のコード列にデータ出棺され之ことになる。
1) ts(21)16 (21)16 (21)16
(3(1)16 (42)ts (3(1)ts(5
7)16というコードタ1jが% (21)ts(Al
ンts(82)+(30)16 (02ha (D7)
16のコード列にデータ出棺され之ことになる。
(発明の効果)
以上、詳しく説明したように本発明によるデータ圧縮方
式は連続する漢字コードの@1バイトのみが等しいとき
、第2バイトのみ残し、第1バイト?削除することにj
9データ圧圧縮性なうものである。
式は連続する漢字コードの@1バイトのみが等しいとき
、第2バイトのみ残し、第1バイト?削除することにj
9データ圧圧縮性なうものである。
し九がってかな文字〔(24ンha (21)ta〜(
24)16(83)16)や、英数字((23)16(
3(す16〜(23)is(90)18)などのように
第1バイトが等しい漢字コード列が連続したときにはデ
ータ圧縄の効果が大きくなる。まt、第1バイトと第2
バイトの両方が等しい漢字コードが連続したときにはそ
の個数だけt残し、データ圧Ml−行なうのでその効果
はさらに大きくなる。
24)16(83)16)や、英数字((23)16(
3(す16〜(23)is(90)18)などのように
第1バイトが等しい漢字コード列が連続したときにはデ
ータ圧縄の効果が大きくなる。まt、第1バイトと第2
バイトの両方が等しい漢字コードが連続したときにはそ
の個数だけt残し、データ圧Ml−行なうのでその効果
はさらに大きくなる。
第1図は本発明によるデータ圧縮方式の一実施例を示す
図、第2図はデータ圧、縮後のバイト、コードのビット
構成図である。 1・・・ビット変換部 2・・・記憶部3・・・比
較部 4・・・計数部5・・・選択部 特許出願人 日本電気株式会社 代理人 弁理士 井 ノ ロ 壽 第1図 才2図
図、第2図はデータ圧、縮後のバイト、コードのビット
構成図である。 1・・・ビット変換部 2・・・記憶部3・・・比
較部 4・・・計数部5・・・選択部 特許出願人 日本電気株式会社 代理人 弁理士 井 ノ ロ 壽 第1図 才2図
Claims (1)
- 第1バイトと第2バイトから構成される漢字コード列を
圧縮するデータ圧縮方式において、入力する漢字コード
の第2バイトの最上位ビットを1にするビット変換部と
、前記ビット変換部によりビット変換された漢字コード
を記憶する記憶部と、前記ビット変換部によりビット変
換された漢字コードと前記記憶部に記憶されている現在
の漢字コード列より以前の漢字コードとを比較する比較
部と、前記比較の結果、第1バイトおよび第2バイトが
ともに連続して一致した場合、その回数を計数する計数
部と、前記計数部での計数値と、前記ビット変換部でビ
ット変換された漢字コードの第1バイトと第2バイトの
うち1つを前記計数値と前記比較結果により選択して出
力する選択部とから構成したデータ圧縮方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61028501A JPS62186619A (ja) | 1986-02-12 | 1986-02-12 | デ−タ圧縮方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61028501A JPS62186619A (ja) | 1986-02-12 | 1986-02-12 | デ−タ圧縮方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62186619A true JPS62186619A (ja) | 1987-08-15 |
Family
ID=12250419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61028501A Pending JPS62186619A (ja) | 1986-02-12 | 1986-02-12 | デ−タ圧縮方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62186619A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337762A (ja) * | 1993-05-28 | 1994-12-06 | Hitachi Ltd | データベースレコードの圧縮方法および復元方法 |
-
1986
- 1986-02-12 JP JP61028501A patent/JPS62186619A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06337762A (ja) * | 1993-05-28 | 1994-12-06 | Hitachi Ltd | データベースレコードの圧縮方法および復元方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4597057A (en) | System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles | |
US5608396A (en) | Efficient Ziv-Lempel LZI data compression system using variable code fields | |
US3675211A (en) | Data compaction using modified variable-length coding | |
CA2260883C (en) | Data compression and decompression system with immediate dictionary updating interleaved with string search | |
EP0559824B1 (en) | Binary data communication system | |
US6489902B2 (en) | Data compression for use with a communications channel | |
US5353024A (en) | Method for data compression having an improved encoding algorithm which utilizes a token stacking technique | |
JPS62186619A (ja) | デ−タ圧縮方式 | |
WO2023173842A1 (zh) | Dna编码方法、解码方法、装置、终端设备及介质 | |
JP2940948B2 (ja) | データ圧縮方式 | |
JP3105598B2 (ja) | ユニバーサル符号を用いたデータ圧縮方式 | |
EP0472730B1 (en) | Data compression and restoration method and device therefor | |
US6501395B1 (en) | System, method and computer readable medium for compressing a data sequence | |
JPS6276931A (ja) | デ−タ圧縮装置 | |
US6268811B1 (en) | Data compression method and apparatus with embedded run-length encoding | |
JPS6228867A (ja) | デ−タ圧縮方式 | |
JPH056260A (ja) | 日本語データ圧縮方式 | |
JPH04280517A (ja) | データ圧縮および復元方式 | |
JPH0650478B2 (ja) | デ−タ圧縮記憶方式 | |
JPH03262331A (ja) | データ圧縮方法およびデータ圧縮装置 | |
JPH05341955A (ja) | データ圧縮および復元方式 | |
JPS61232724A (ja) | 文字コ−ドデ−タの圧縮方式 | |
JPS59169254A (ja) | 符号変換方式 | |
JP3143030B2 (ja) | データ圧縮方法及びその装置並びにデータ伸長方法及びその装置 | |
JPS63250221A (ja) | ハフマン復号化器 |