JPH07191972A - 文章圧縮方法 - Google Patents

文章圧縮方法

Info

Publication number
JPH07191972A
JPH07191972A JP3304769A JP30476991A JPH07191972A JP H07191972 A JPH07191972 A JP H07191972A JP 3304769 A JP3304769 A JP 3304769A JP 30476991 A JP30476991 A JP 30476991A JP H07191972 A JPH07191972 A JP H07191972A
Authority
JP
Japan
Prior art keywords
code
character
dictionary
dictionary pointer
pointer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3304769A
Other languages
English (en)
Inventor
Noriyuki Hirai
徳行 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3304769A priority Critical patent/JPH07191972A/ja
Publication of JPH07191972A publication Critical patent/JPH07191972A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 2文字以上を辞書ポインタによる特別コ−ド
で表して圧縮してテキスト容量を減らすことができる文
章圧縮方法を提供する。 【構成】 入力されたキ―を判別し(ステップS1)、
入力が普通の文字の挿入動作を要求するときは、通常の
文字の挿入処理を行い(ステップS2〜ステップS1
0)、入力が変換動作を要求するときは、変換ル―チン
を呼び出して変換対象の文字列と変換ル―チンによって
得られたコ―ドとを入替えて(ステップS2〜ステップ
S3)、辞書ポインタを挿入処理ル―チンへ送って圧縮
処理し(ステップS4〜ステップS10)、各コ―ドが
辞書ポインタか否かを判別し(ステップS13)、ステ
ップS13の判別の結果が文字コ―ドならば通常の表示
ル―チンを呼び出し(ステップS14)、ステップS1
3の判別の結果が辞書ポインタならば辞書ポインタが表
している文字コ―ドデ―タに置換する(ステップS1
5)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワ―ドプロセッサや電
子化された文章圧縮装置に用いられる文章圧縮方法に関
し、特に仮名漢字変換における文章圧縮方法に関する。
【0002】
【従来の技術】ワ―プロ等で用いられる従来の文章圧縮
方法は、文字を入力するとそのままの形で入力された文
字をバッフアに格納する。
【0003】図7は、上述した従来の文章圧縮方法によ
るバッフア内のコ―ド構成の説明図である。
【0004】図7に示すように、従来の文章圧縮方法で
は、原文の各文字を全て1文字単位でコ―ド処理してい
た。例えば、“変換”は、“変”が|4a51|、
“換”は|3439|にそれぞれコ―ド化される。即
ち、一般的に日本語に関してJIS準拠のコ―ドが用い
られるので、各文字ごとに2バイトの領域で1文字単位
のコ―ド処理を行なっていた。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の文章圧縮方法では、限られた文章の容量を減ら
す、即ち、同じ資源(メモリ、デイスク等)を用いても
一度に編集・登録可能な文章容量を増加して処理能力・
処理速度を向上するためには、資源を増設する必要があ
り、その結果コストが増大してしまうという問題点があ
った。
【0006】本発明は、上述した従来の文章圧縮方法に
おける問題点に鑑み、資源を増設することなく処理能力
・処理速度を向上できる文章圧縮方法を提供する。
【0007】
【課題を解決するための手段】本発明は、文章を表す文
字コ―ド及び辞書内の位置を表す辞書ポインタをそれぞ
れ記憶し、変換ル―チンを呼び出して文章中の変換対象
の文字列を変換し、辞書ポインタを挿入処理ル―チンへ
送り、変換対象の文字列と変換ル―チンによって得られ
たコ―ドとを入替えて圧縮処理し、入替えられたコ―ド
が辞書ポインタか否かを判別し、入替えられたコ―ドが
辞書ポインタであると判別されたならば入替えられたコ
―ドを辞書ポインタに対応する文字コ―ドに置換する文
章圧縮方法によって達成される
【0008】
【作用】本発明によれば、文章を表す文字コ―ド及び辞
書内の位置を表す辞書ポインタをそれぞれ記憶し、変換
ル―チンを呼び出して文章中の変換対象の文字列を変換
し、辞書ポインタを挿入処理ル―チンへ送り、変換対象
の文字列と変換ル―チンによって得られたコ―ドとを入
替えて圧縮処理し、入替えられたコ―ドが辞書ポインタ
か否かを判別し、入替えられたコ―ドが辞書ポインタで
あると判別されたならば入替えられたコ―ドを辞書ポイ
ンタに対応する文字コ―ドに置換する。
【0009】
【実施例】以下、図面を参照して本発明の文章圧縮方法
の実施例を説明する。
【0010】図1及び図2は、本発明の文章圧縮方法の
一実施例である仮名漢字変換を利用したテキスト圧縮方
法を説明するためのフロ―チャ−トである。
【0011】図3は、本実施例のテキスト圧縮方法に用
いられるバッフアの内容を示す。
【0012】図3において、|c250|等は辞書ポイ
ンタによるコ―ドを表す。例えば、コ―ド|c250|
は“対象”という2文字分(図7参照)を表している。
【0013】図4は、本実施例のテキスト圧縮方法でコ
―ド化に用いる辞書の一構成例を示す。
【0014】図4の辞書には、文字“対象”が辞書ポイ
ンタ(c250)及び文字コ―ド4250に対応付けさ
れており、これらのコ―ドの最上位バイト(MSB)が
文字コ―ドと辞書ポインタとの判別フラッグとして用い
られている。そして、図4の辞書を用いて、図3に示し
た辞書ポインタによるコ―ドに基づいて圧縮文を形成す
る。
【0015】次に、図1〜図4を用いて本実施例のテキ
スト圧縮方法を説明する。
【0016】(A) 入力及び挿入処理。
【0017】まず、入力されたキ―を判別し(ステップ
S1)、入力が普通の文字の挿入動作を要求するとき
は、通常文字の挿入処理を行い(ステップS2〜ステッ
プS10)、入力が変換動作を要求するときは、変換ル
―チンを呼び出して変換対象の文字列と変換ル―チンに
よって得られたコ―ドとを入替えて(ステップS2〜ス
テップS3)、辞書ポインタを挿入処理ル―チンへ送っ
て圧縮処理し(ステップS4〜ステップS10)、各コ
―ドが辞書ポインタか否かを判別し(ステップS1
3)、ステップS13の判別の結果が文字コ―ドならば
通常の表示ル―チンを呼び出し(ステップS14)、ス
テップS13の判別の結果が辞書ポインタならば辞書ポ
インタが表している文字コ―ドデ―タに置換する(ステ
ップS15)。
【0018】これを実際のバッフア内コ―ドからみる
と、図7のバッフア文字列が、図4に示すコ―ド化用の
辞書によって、図3の圧縮した場合のバッフア文字列に
示すように、例えば原文の文字“変換”が図7の2文字
|4a51||3439|から図4のようなコ―ド化用
の辞書によって、図3では1文字|ca51|に圧縮処
理される。
【0019】同様に、文字“対象”は、図7では2文字
|4250||3e5d|から、図3の1文字|c25
0|に圧縮される。
【0020】続いて、文字“の”は図7では|244e
|、図3でもそのまま|244e|であり、文字コ―ド
と辞書ポインタとがバッフア内に混在する。
【0021】また、図7の|4a51|…|2123|
まで66バイトの容量が必要だったバッフアが、図3の
場合は|ca51|…|2123|まで30バイトの容
量に圧縮されるので、圧縮率が50%となり、テキスト
容量を大幅に減少できる。
【0022】(B) 削除処理。
【0023】図5は本実施例の削除処理におけるコ―ド
展開図であり、図6は本実施例の削除処理された文字列
を示す。
【0024】以下、図1を再び参照して削除処理の動作
を説明する。
【0025】削除動作が要求された場合は、辞書ポイン
タと文字コ―ドをフラグで区別できるようにして、削除
対象の文字が辞書ポインタか否かを判断する(ステップ
S5)。例えば、図4のデ―タの中の最上位ビット(M
SB)をその目的に使うなどの手段をとる。
【0026】ここで、削除すべき文字デ―タが文字コ―
ドなら、通常の削除処理を行ない(ステップS6)、削
除すべき文字デ―タが辞書ポインタならば、そのまま削
除すると文字列が変化してしまうので辞書ポインタを一
旦、辞書ポインタが表している文字コ―ドに置換してか
ら(ステップS7)、通常の削除処理を行う(ステップ
S8)。
【0027】上述した削除処理の一例として、図3の圧
縮コ―ド文字列における文字“コ―ド”の“ド”を削除
する場合を説明する。
【0028】まず、図3の“コ―ド”に対応する辞書ポ
インタ|a533|を図5に示すように文字コ―ド|2
533||213c||2549|に置換し、図6に示
すように“ド”に対応する文字コ―ド|2549|を削
除する。
【0029】(C)表示処理。
【0030】図2の表示フロ―・サブ・ル―チンを参照
して、上述した挿入及び削除処理が施された画面(即
ち、更新された画面)を表示する場合について説明す
る。
【0031】必要表示に関して(ステップS12)、各
コ―ドが辞書ポインタか否かを判別し(ステップS1
3)、ステップS13の判別の結果が文字コ―ドならば
通常の表示ル―チンを呼び出し(ステップS14)、ス
テップS13の判別の結果が辞書ポインタならば削除の
場合と同様に辞書ポインタが表している文字コ―ドデ―
タに置換し(ステップS15)、表示ル―チンを呼び出
す(ステップS16)ことによりバッフア内部の辞書ポ
インタを文字コ―ドデ―タとして表示する。
【0032】上述したように本実施例の文章圧縮方法に
よれば、仮名漢字変換によって得られた文字列をその辞
書内の位置を表すラベル、即ち、辞書ポインタに置き換
えて、バッフア内に文字コ―ドと辞書ポインタを混在さ
せて、必要な動作に応じて文字コ―ドと辞書ポインタと
を区別して処理する。
【0033】
【発明の効果】本発明の文章圧縮方法によれば、文章を
表す文字コ―ド及び辞書内の位置を表す辞書ポインタを
それぞれ記憶し、変換ル―チンを呼び出して文章中の変
換対象の文字列を変換し、辞書ポインタを挿入処理ル―
チンへ送り、変換対象の文字列と変換ル―チンによって
得られたコ―ドとを入替えて圧縮処理し、入替えられた
コ―ドが辞書ポインタか否かを判別し、入替えられたコ
―ドが辞書ポインタであると判別されたならば入替えら
れたコ―ドを辞書ポインタに対応する文字コ―ドに置換
するので、効率よく文字列を圧縮してテキスト容量を減
少できる。
【図面の簡単な説明】
【図1】本発明の文章圧縮方法の一実施例である仮名漢
字変換を利用したテキスト圧縮方法を説明するためのメ
インル−チン・フロ―チャ−トである。
【図2】図1の仮名漢字変換を利用したテキスト圧縮方
法における表示動作を説明するためのサブル―チン・フ
ロ―チャ−トである。
【図3】図1の仮名漢字変換を利用したテキスト圧縮方
法で辞書による圧縮を用いた場合のバッフアの内容を示
す図である。
【図4】図1の仮名漢字変換を利用したテキスト圧縮方
法のコ―ド化に用いる辞書の構造を示す図である。
【図5】図1の仮名漢字変換を利用したテキスト圧縮方
法の削除処理におけるコ―ド展開図である。
【図6】図5の削除処理における削除された文字列を示
す図である。
【図7】従来の文章圧縮方法によるバッフア内のコ―ド
の構成を示す図である。
【符号の説明】
S1 キ−入力 S2 変換処理 S3 変換ル−チンCALL S4 辞書ポインタコ−ド処理 S5 削除判断処理 S6 文字コ−ド削除処理 S7 コ−ド展開処理 S8 辞書ポインタ削除処理 S9 編集ル−チン S10 文字の挿入処理 S11 表示処理

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文章を表す文字コ―ド及び辞書内の位置
    を表す辞書ポインタをそれぞれ記憶し、変換ル―チンを
    呼び出して前記文章中の変換対象の文字列を変換し、前
    記辞書ポインタを挿入処理ル―チンへ送り、前記変換対
    象の文字列と前記変換ル―チンによって得られたコ―ド
    とを入替えて圧縮処理し、前記入替えられたコ―ドが前
    記辞書ポインタか否かを判別し、前記入替えられたコ―
    ドが前記辞書ポインタであると判別されたならば該入替
    えられたコ―ドを該辞書ポインタに対応する前記文字コ
    ―ドに置換することを特徴とする文章圧縮方法。
JP3304769A 1991-11-20 1991-11-20 文章圧縮方法 Pending JPH07191972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3304769A JPH07191972A (ja) 1991-11-20 1991-11-20 文章圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3304769A JPH07191972A (ja) 1991-11-20 1991-11-20 文章圧縮方法

Publications (1)

Publication Number Publication Date
JPH07191972A true JPH07191972A (ja) 1995-07-28

Family

ID=17937004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3304769A Pending JPH07191972A (ja) 1991-11-20 1991-11-20 文章圧縮方法

Country Status (1)

Country Link
JP (1) JPH07191972A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0809840A1 (en) * 1995-12-14 1997-12-03 Motorola, Inc. Apparatus and method for storing and presenting text

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6273370A (ja) * 1985-09-27 1987-04-04 Hitachi Ltd 文書格納・転送方式
JPH01102613A (ja) * 1987-10-14 1989-04-20 Sharp Corp 文字処理装置
JPH01194065A (ja) * 1988-01-29 1989-08-04 Canon Inc 文書処理装置
JPH04223556A (ja) * 1990-12-25 1992-08-13 Nec Off Syst Ltd 文字コードデータの圧縮方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6273370A (ja) * 1985-09-27 1987-04-04 Hitachi Ltd 文書格納・転送方式
JPH01102613A (ja) * 1987-10-14 1989-04-20 Sharp Corp 文字処理装置
JPH01194065A (ja) * 1988-01-29 1989-08-04 Canon Inc 文書処理装置
JPH04223556A (ja) * 1990-12-25 1992-08-13 Nec Off Syst Ltd 文字コードデータの圧縮方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0809840A1 (en) * 1995-12-14 1997-12-03 Motorola, Inc. Apparatus and method for storing and presenting text
EP0809840A4 (en) * 1995-12-14 1999-09-08 Motorola Inc DEVICE AND METHOD FOR STORING AND PRESENTING TEXT

Similar Documents

Publication Publication Date Title
US6877003B2 (en) Efficient collation element structure for handling large numbers of characters
US7512533B2 (en) Method and system of creating and using chinese language data and user-corrected data
EP0268069B1 (en) Method of forming a message file in a computer
US9158742B2 (en) Automatically detecting layout of bidirectional (BIDI) text
US4727511A (en) Multitype characters processing method and terminal device
JP4451908B2 (ja) ユニコード・コンバータ
JP3599867B2 (ja) ユーザがシステムの種々な機能を制御する際にガイドとなるテキスト情報を表わすテキスト・データを処理する方法
JPH07191972A (ja) 文章圧縮方法
US7343380B2 (en) Cross platform locale data name mapping interfaces and methods of use thereof
US8839102B2 (en) Method to automatically display filenames encoded in multiple code sets
JPH10105149A (ja) フォント表示をコンピュータで実施する方法及びそのプログラムを記録した記録媒体
JPH08160929A (ja) 情報処理装置及び情報処理方法
JP2629040B2 (ja) 日本語処理システム
JPS6177969A (ja) 校正におけるペ−ジング方式
JPH0969785A (ja) データ圧縮方法及びデータ圧縮装置
JPS5972511A (ja) 一般コ−ドによる特殊コ−ド入力装置
CN116522915A (zh) 支持二进制数据字面值的词法分析方法、系统及响应方法
JP2023156212A (ja) 文字コード判別装置及び文字コード判別方法
JP2937884B2 (ja) テキストデータ処理システムおよびテキストデータ処理方法
JPH0697455B2 (ja) 仮名漢字変換装置
JP3342036B2 (ja) かな漢字変換装置
JP2862736B2 (ja) 文書編集装置の検索方法
JPS635793B2 (ja)
JPS61260353A (ja) 文書処理方式
JPH07210364A (ja) 情報圧縮方法及び装置