JPH02271723A - 日本語情報圧縮方式 - Google Patents
日本語情報圧縮方式Info
- Publication number
- JPH02271723A JPH02271723A JP9345789A JP9345789A JPH02271723A JP H02271723 A JPH02271723 A JP H02271723A JP 9345789 A JP9345789 A JP 9345789A JP 9345789 A JP9345789 A JP 9345789A JP H02271723 A JPH02271723 A JP H02271723A
- Authority
- JP
- Japan
- Prior art keywords
- japanese
- character
- detection means
- list
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006835 compression Effects 0.000 title claims abstract description 19
- 238000007906 compression Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 abstract description 10
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は日本語情報圧縮方式に関し、特に2バイトのコ
ードで表現された日本語情報を圧縮する日本語情報圧縮
方式に関する。
ードで表現された日本語情報を圧縮する日本語情報圧縮
方式に関する。
従来、日本語情報を圧縮する場合、日本語文字が14ビ
ツトで表現することができ、2バイトに格納するときに
できる2ビツトの余りを詰めて圧縮する方法が通常とら
れている。
ツトで表現することができ、2バイトに格納するときに
できる2ビツトの余りを詰めて圧縮する方法が通常とら
れている。
上述した従来の日本語情報圧縮方式は、約1.14倍の
圧縮効果しか得られないという問題点がある。
圧縮効果しか得られないという問題点がある。
本発明の目的は、上記の圧縮率より大きい圧縮率を得る
ことができる日本語情報圧縮方式を提供することにある
。
ことができる日本語情報圧縮方式を提供することにある
。
本発明の日本語情報圧縮方式は、2バイトのコードで表
現された日本語情報を圧縮する日本語情報圧縮方式にお
いて、 (A>あらかじめ定められた特定文字が登録された表に
もとつき、前記2バイトのコードで表現された日本語情
報を検索して前記特定文字の日本語文字を検出する特定
文字検出手段、(B)前記検出された日本語文字に符号
を割り当てる符号化手段、 を備えて構成されている。
現された日本語情報を圧縮する日本語情報圧縮方式にお
いて、 (A>あらかじめ定められた特定文字が登録された表に
もとつき、前記2バイトのコードで表現された日本語情
報を検索して前記特定文字の日本語文字を検出する特定
文字検出手段、(B)前記検出された日本語文字に符号
を割り当てる符号化手段、 を備えて構成されている。
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の一実施例のブロック図である。
第1図に示す日本語情報圧縮方式は、特定文字表3を検
索して特定のコードの日本語文字を検出する特定文字検
出手段1、日本語文字に符号を割り当てる符号化手段2
から構成されている。
索して特定のコードの日本語文字を検出する特定文字検
出手段1、日本語文字に符号を割り当てる符号化手段2
から構成されている。
次に、動作を説明する。
第2図は特定文字検出手段1の動作を示す流れ図である
。
。
第2図のステップ21で処理の対象となる日本語文字の
先頭に位置付け、ステップ22で現在の位置の日本語文
字が特定文字表3に登録されている文字であれば、ステ
ップ23で符号化手段2を呼び出して符号化を行う。ス
テップ22で現在の位置の日本語文字が特定文字表3に
登録されている文字でなければ、ステップ24でその日
本語文字をそのまま内蔵したメモリに格納する(この場
合は圧縮が行われない)。ステップ25では処理を終了
するか否かの判定が行われ、″No“″であれば、ステ
ップ22に戻り検索を続行する。
先頭に位置付け、ステップ22で現在の位置の日本語文
字が特定文字表3に登録されている文字であれば、ステ
ップ23で符号化手段2を呼び出して符号化を行う。ス
テップ22で現在の位置の日本語文字が特定文字表3に
登録されている文字でなければ、ステップ24でその日
本語文字をそのまま内蔵したメモリに格納する(この場
合は圧縮が行われない)。ステップ25では処理を終了
するか否かの判定が行われ、″No“″であれば、ステ
ップ22に戻り検索を続行する。
次に、第1図の符号化手段2における動作を説明する。
第3図は符号化手段2の動作を示す流れ図である。
第3図のステップ31で現在の日本語文字と等しい特定
文字表3のエントリの位置を2進数で表わし、その最上
位ビットをrON、(0→1)にしたものを変換符号と
して特定文字検出手段1に送出し、特定文字検出手段1
は受信した変換符号を内蔵されたメモリに格納する。
文字表3のエントリの位置を2進数で表わし、その最上
位ビットをrON、(0→1)にしたものを変換符号と
して特定文字検出手段1に送出し、特定文字検出手段1
は受信した変換符号を内蔵されたメモリに格納する。
第4図は本発明の一実施例の処理過程を示す説明図であ
り、第5図は本発明の一実施例の特定文字表3の例を示
す説明図である。
り、第5図は本発明の一実施例の特定文字表3の例を示
す説明図である。
第4図においては、日本語文字列として、[゛標準”の
在り方」をJ I 5−X−0208“情報交換用漢字
符号系”の日本語コード(16進数)で表現し、圧縮を
行った例を示している。
在り方」をJ I 5−X−0208“情報交換用漢字
符号系”の日本語コード(16進数)で表現し、圧縮を
行った例を示している。
例示した日本語文字に含まれる文字のうち、第5図の特
定文字表3に示す「“」、ビ°」、「の」及び「す」は
、そのエントリの位置を1バイトで表現して最上位ビッ
トをrON、とした形式で符号化がなされ、圧縮結果の
個所で示されるような結果が得られる。この場合は、最
初4桁で表現されていたr、、r”、、rの」及び「す
」のコードがそれぞれ2桁のコードに圧縮されている。
定文字表3に示す「“」、ビ°」、「の」及び「す」は
、そのエントリの位置を1バイトで表現して最上位ビッ
トをrON、とした形式で符号化がなされ、圧縮結果の
個所で示されるような結果が得られる。この場合は、最
初4桁で表現されていたr、、r”、、rの」及び「す
」のコードがそれぞれ2桁のコードに圧縮されている。
以上説明したように、本発明は、ひらがな、記号及び数
字等が比較的多数使用されている日本語文字の圧縮にお
いて高い圧縮率を得ることができるという効果を有する
。
字等が比較的多数使用されている日本語文字の圧縮にお
いて高い圧縮率を得ることができるという効果を有する
。
第1図は本発明の一実施例のブロック図、第2図は特定
文字検出手段の動作を示す流れ図、第3図は符号化手段
の動作を示す流れ図、第4図は本発明の一実施例の処理
過程を示す説明図、第5図は本発明の一実施例の特定文
字表の例を示す説明図である。 1・・・特定文字検出手段、2・・・符号化手段、3・
・・特定文字表。 代理人 弁理士 内 原 晋 姑系 第 閉 Dll、493乙3DΔθ、D’?、 AS、3だF、
BE、 4A7D$4WJ 茅 閏
文字検出手段の動作を示す流れ図、第3図は符号化手段
の動作を示す流れ図、第4図は本発明の一実施例の処理
過程を示す説明図、第5図は本発明の一実施例の特定文
字表の例を示す説明図である。 1・・・特定文字検出手段、2・・・符号化手段、3・
・・特定文字表。 代理人 弁理士 内 原 晋 姑系 第 閉 Dll、493乙3DΔθ、D’?、 AS、3だF、
BE、 4A7D$4WJ 茅 閏
Claims (1)
- 【特許請求の範囲】 2バイトのコードで表現された日本語情報を圧縮する日
本語情報圧縮方式において、 (A)あらかじめ定められた特定文字が登録された表に
もとづき、前記2バイトのコードで表現された日本語情
報を検索して前記特定文字の日本語文字を検出する特定
文字検出手段、 (B)前記検出された日本語文字に符号を割り当てる符
号化手段、 を備えたことを特徴とする日本語情報圧縮方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9345789A JPH02271723A (ja) | 1989-04-12 | 1989-04-12 | 日本語情報圧縮方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9345789A JPH02271723A (ja) | 1989-04-12 | 1989-04-12 | 日本語情報圧縮方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02271723A true JPH02271723A (ja) | 1990-11-06 |
Family
ID=14082860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9345789A Pending JPH02271723A (ja) | 1989-04-12 | 1989-04-12 | 日本語情報圧縮方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02271723A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047298A (en) * | 1996-01-30 | 2000-04-04 | Sharp Kabushiki Kaisha | Text compression dictionary generation apparatus |
US7298783B2 (en) | 2002-10-17 | 2007-11-20 | Pantech Co., Ltd | Method of compressing sounds in mobile terminals |
-
1989
- 1989-04-12 JP JP9345789A patent/JPH02271723A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6047298A (en) * | 1996-01-30 | 2000-04-04 | Sharp Kabushiki Kaisha | Text compression dictionary generation apparatus |
US7298783B2 (en) | 2002-10-17 | 2007-11-20 | Pantech Co., Ltd | Method of compressing sounds in mobile terminals |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW312771B (ja) | ||
US5374916A (en) | Automatic electronic data type identification process | |
US6906644B2 (en) | Encoding and decoding apparatus with matching length means for symbol strings | |
CA1056506A (en) | Decoding circuit for variable length codes | |
US4597057A (en) | System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles | |
JP3234104B2 (ja) | 圧縮データをサーチする方法及びシステム | |
US4386416A (en) | Data compression, encryption, and in-line transmission system | |
US4099257A (en) | Markov processor for context encoding from given characters and for character decoding from given contexts | |
JP2000082967A (ja) | デ―タ圧縮方法及びデ―タ圧縮装置 | |
JPH0855008A (ja) | システム生成辞書を用いたデータ圧縮のための方法及びシステム | |
KR100906041B1 (ko) | 폰트 압축 및 검색 방법 및 장치 | |
JPH02271723A (ja) | 日本語情報圧縮方式 | |
EP0847026A2 (en) | Pattern encoding method | |
JPS63148717A (ja) | データ圧縮復元処理装置 | |
JPH02255977A (ja) | 日本語文字列情報圧縮方式 | |
EP0871294A3 (en) | Method and apparatus for compression and decompression of data | |
JPH03206533A (ja) | データ圧縮方式 | |
JPH05224878A (ja) | ユニバーサル符号を用いたデータ圧縮方式 | |
JPH07282040A (ja) | 日本語情報圧縮方式 | |
JPH1155125A (ja) | 文字データの圧縮・復元方法 | |
KR20010091589A (ko) | 코드 변환테이블을 이용한 코드 변환방법 | |
JPS6382061A (ja) | デ−タ圧縮方式 | |
JPS6261427A (ja) | 符号化方式 | |
JPS6276931A (ja) | デ−タ圧縮装置 | |
JP2833871B2 (ja) | 外国人名データ判定方式 |