JPH02271723A - 日本語情報圧縮方式 - Google Patents

日本語情報圧縮方式

Info

Publication number
JPH02271723A
JPH02271723A JP9345789A JP9345789A JPH02271723A JP H02271723 A JPH02271723 A JP H02271723A JP 9345789 A JP9345789 A JP 9345789A JP 9345789 A JP9345789 A JP 9345789A JP H02271723 A JPH02271723 A JP H02271723A
Authority
JP
Japan
Prior art keywords
japanese
character
detection means
list
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9345789A
Other languages
English (en)
Inventor
Takao Kosakai
小堺 隆男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP9345789A priority Critical patent/JPH02271723A/ja
Publication of JPH02271723A publication Critical patent/JPH02271723A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は日本語情報圧縮方式に関し、特に2バイトのコ
ードで表現された日本語情報を圧縮する日本語情報圧縮
方式に関する。
〔従来の技術〕
従来、日本語情報を圧縮する場合、日本語文字が14ビ
ツトで表現することができ、2バイトに格納するときに
できる2ビツトの余りを詰めて圧縮する方法が通常とら
れている。
〔発明が解決しようとする課題〕
上述した従来の日本語情報圧縮方式は、約1.14倍の
圧縮効果しか得られないという問題点がある。
本発明の目的は、上記の圧縮率より大きい圧縮率を得る
ことができる日本語情報圧縮方式を提供することにある
〔課題を解決するための手段〕
本発明の日本語情報圧縮方式は、2バイトのコードで表
現された日本語情報を圧縮する日本語情報圧縮方式にお
いて、 (A>あらかじめ定められた特定文字が登録された表に
もとつき、前記2バイトのコードで表現された日本語情
報を検索して前記特定文字の日本語文字を検出する特定
文字検出手段、(B)前記検出された日本語文字に符号
を割り当てる符号化手段、 を備えて構成されている。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
第1図は本発明の一実施例のブロック図である。
第1図に示す日本語情報圧縮方式は、特定文字表3を検
索して特定のコードの日本語文字を検出する特定文字検
出手段1、日本語文字に符号を割り当てる符号化手段2
から構成されている。
次に、動作を説明する。
第2図は特定文字検出手段1の動作を示す流れ図である
第2図のステップ21で処理の対象となる日本語文字の
先頭に位置付け、ステップ22で現在の位置の日本語文
字が特定文字表3に登録されている文字であれば、ステ
ップ23で符号化手段2を呼び出して符号化を行う。ス
テップ22で現在の位置の日本語文字が特定文字表3に
登録されている文字でなければ、ステップ24でその日
本語文字をそのまま内蔵したメモリに格納する(この場
合は圧縮が行われない)。ステップ25では処理を終了
するか否かの判定が行われ、″No“″であれば、ステ
ップ22に戻り検索を続行する。
次に、第1図の符号化手段2における動作を説明する。
第3図は符号化手段2の動作を示す流れ図である。
第3図のステップ31で現在の日本語文字と等しい特定
文字表3のエントリの位置を2進数で表わし、その最上
位ビットをrON、(0→1)にしたものを変換符号と
して特定文字検出手段1に送出し、特定文字検出手段1
は受信した変換符号を内蔵されたメモリに格納する。
第4図は本発明の一実施例の処理過程を示す説明図であ
り、第5図は本発明の一実施例の特定文字表3の例を示
す説明図である。
第4図においては、日本語文字列として、[゛標準”の
在り方」をJ I 5−X−0208“情報交換用漢字
符号系”の日本語コード(16進数)で表現し、圧縮を
行った例を示している。
例示した日本語文字に含まれる文字のうち、第5図の特
定文字表3に示す「“」、ビ°」、「の」及び「す」は
、そのエントリの位置を1バイトで表現して最上位ビッ
トをrON、とした形式で符号化がなされ、圧縮結果の
個所で示されるような結果が得られる。この場合は、最
初4桁で表現されていたr、、r”、、rの」及び「す
」のコードがそれぞれ2桁のコードに圧縮されている。
〔発明の効果〕
以上説明したように、本発明は、ひらがな、記号及び数
字等が比較的多数使用されている日本語文字の圧縮にお
いて高い圧縮率を得ることができるという効果を有する
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は特定
文字検出手段の動作を示す流れ図、第3図は符号化手段
の動作を示す流れ図、第4図は本発明の一実施例の処理
過程を示す説明図、第5図は本発明の一実施例の特定文
字表の例を示す説明図である。 1・・・特定文字検出手段、2・・・符号化手段、3・
・・特定文字表。 代理人 弁理士  内 原  晋 姑系 第 閉 Dll、493乙3DΔθ、D’?、 AS、3だF、
 BE、 4A7D$4WJ 茅 閏

Claims (1)

  1. 【特許請求の範囲】 2バイトのコードで表現された日本語情報を圧縮する日
    本語情報圧縮方式において、 (A)あらかじめ定められた特定文字が登録された表に
    もとづき、前記2バイトのコードで表現された日本語情
    報を検索して前記特定文字の日本語文字を検出する特定
    文字検出手段、 (B)前記検出された日本語文字に符号を割り当てる符
    号化手段、 を備えたことを特徴とする日本語情報圧縮方式。
JP9345789A 1989-04-12 1989-04-12 日本語情報圧縮方式 Pending JPH02271723A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9345789A JPH02271723A (ja) 1989-04-12 1989-04-12 日本語情報圧縮方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9345789A JPH02271723A (ja) 1989-04-12 1989-04-12 日本語情報圧縮方式

Publications (1)

Publication Number Publication Date
JPH02271723A true JPH02271723A (ja) 1990-11-06

Family

ID=14082860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9345789A Pending JPH02271723A (ja) 1989-04-12 1989-04-12 日本語情報圧縮方式

Country Status (1)

Country Link
JP (1) JPH02271723A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047298A (en) * 1996-01-30 2000-04-04 Sharp Kabushiki Kaisha Text compression dictionary generation apparatus
US7298783B2 (en) 2002-10-17 2007-11-20 Pantech Co., Ltd Method of compressing sounds in mobile terminals

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047298A (en) * 1996-01-30 2000-04-04 Sharp Kabushiki Kaisha Text compression dictionary generation apparatus
US7298783B2 (en) 2002-10-17 2007-11-20 Pantech Co., Ltd Method of compressing sounds in mobile terminals

Similar Documents

Publication Publication Date Title
TW312771B (ja)
US5374916A (en) Automatic electronic data type identification process
US6906644B2 (en) Encoding and decoding apparatus with matching length means for symbol strings
CA1056506A (en) Decoding circuit for variable length codes
US4597057A (en) System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles
US4099257A (en) Markov processor for context encoding from given characters and for character decoding from given contexts
JP2000082967A (ja) デ―タ圧縮方法及びデ―タ圧縮装置
JPH0855008A (ja) システム生成辞書を用いたデータ圧縮のための方法及びシステム
KR100906041B1 (ko) 폰트 압축 및 검색 방법 및 장치
US6122402A (en) Pattern encoding and decoding method and encoder and decoder using the method
JPH02271723A (ja) 日本語情報圧縮方式
JPS63148717A (ja) データ圧縮復元処理装置
JPH02255977A (ja) 日本語文字列情報圧縮方式
EP0871294A3 (en) Method and apparatus for compression and decompression of data
JPH03206533A (ja) データ圧縮方式
JPH05224878A (ja) ユニバーサル符号を用いたデータ圧縮方式
JPH07282040A (ja) 日本語情報圧縮方式
JPH1155125A (ja) 文字データの圧縮・復元方法
JPH0738447A (ja) ハフマン符号の符号化でのランレングス抽出方法、ハフマン符号変換方法およびmh符号化処理方法
KR20010091589A (ko) 코드 변환테이블을 이용한 코드 변환방법
JPS6382061A (ja) デ−タ圧縮方式
JPS6261427A (ja) 符号化方式
JPH04265020A (ja) データ圧縮方式
JPS6276931A (ja) デ−タ圧縮装置
JP2833871B2 (ja) 外国人名データ判定方式