JPH0128976B2 - - Google Patents

Info

Publication number
JPH0128976B2
JPH0128976B2 JP58153050A JP15305083A JPH0128976B2 JP H0128976 B2 JPH0128976 B2 JP H0128976B2 JP 58153050 A JP58153050 A JP 58153050A JP 15305083 A JP15305083 A JP 15305083A JP H0128976 B2 JPH0128976 B2 JP H0128976B2
Authority
JP
Japan
Prior art keywords
code
dictionary
storage device
kana
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58153050A
Other languages
English (en)
Other versions
JPS6045836A (ja
Inventor
Hiroshi Yasuhara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58153050A priority Critical patent/JPS6045836A/ja
Publication of JPS6045836A publication Critical patent/JPS6045836A/ja
Publication of JPH0128976B2 publication Critical patent/JPH0128976B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Digital Computer Display Output (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は文書を効率よく記憶装置に記憶する文
書記憶方式に関するものである。
(従来技術) 従来、文書をコード化して記憶装置に記憶する
方法として、第1図の1に示すようにカナ・英数
字と漢字を1文字2バイトでコード化して記憶す
る方法と、第1図の2に示すようにカナ・英数字
は1バイト、漢字は2バイトでコード化し、カ
ナ・英数字から漢字、漢字からカナ・英数字に変
化する箇所にそれぞれ1バイトの制御コードを挿
入することによりカナ・英数字と漢字を区別して
記憶する方法が用いられていた。前者の方法では
カナ・英数字のコードが2バイトであるため使用
するメモリ容量が増大する欠点があり、後者の方
法では制御コード用にメモリを必要とする欠点が
あつた。さらに、単語や熟語を記憶する場合、該
単語や熟語を構成するカナ・英数字コードと漢字
コードを用いて記憶するので上記いずれの方法を
用いても単語や熟語を構成するカナ・英数字、漢
字の文字数分の記憶領域を必要とする欠点があつ
た。
(発明の目的) 本発明の目的はこれらの欠点を除去するためカ
ナ・英数字、漢字、単語・熟語コードを用いて文
書を効率よく記憶装置に記憶し、記憶した単語・
熟語コードを高速にデコードするものである。
(発明の構成) 本発明はカナ・英数字、漢字、単語、熟語コー
ドに対してバイト毎に2ビツトからなるコードの
種類を識別するフラグを付与し、前記コードとフ
ラグを用いて文書を記憶装置に記憶し、記憶した
単語・熟語コードをこれに対応するカナ・英数
字、漢字コードに復元する際、その単語・熟語コ
ードが辞書一時記憶装置に記憶されている場合は
対応するカナ・英数字、漢字コードを読み出すこ
とにより復元し、記憶されていない場合は辞書フ
アイルから読み出し前記辞書一時記憶装置に記憶
することにより復元することを特徴とする文書記
憶方式である。
(実施例) 第2図は本発明の実施例のシステム構成図であ
つて、3は記憶装置、4はフラグ記憶部、5はデ
ータ記憶部、6は処理装置、7は辞書の一部を一
時的に記憶する辞書一時記憶装置、8は辞書を記
憶する辞書フアイル、9はアドレス線、10はデ
ータ及び制御線である。記憶装置3、処理装置
6、辞書一時記憶装置7、辞書フアイル8はアド
レス線9、データ及び制御線10により共通バス
方式で接続している。
記憶装置3には文書をコード化したデータと該
データにバイト単位毎に付与した2ビツトからな
るフラグとを記憶する。その記憶方法には、第2
図に示す記憶装置3のように物理的に分離したフ
ラグ記憶部4とデータ記憶部5に前記フラグとデ
ータをそれぞれ分離して記憶する方法と、第3図
に示すように前記フラグとデータを同一記憶領域
に混在させて記憶する方法がある。後者の場合、
5番地毎にデータ4バイト分のフラグを記憶す
る。一般に論理番地がn番地のデータをアクセス
する場合、そのデータに対応するフラグは物理番
地の〔n/4〕×4番地の左から(n mod4)番目 のフイールドになり、そのデータは(n+〔n/4〕 +1)番地になる。例えば第3図において、論理
番地が4番目のデータをアクセスする場合そのデ
ータに対応するフラグは物理番地の5番地の左か
ら1番目のフイールド、つまり第3図に示すフラ
グ11になり、そのデータは物理番地の6番地の
データ、つまり第3図に示すデータ12になる。
この方法はフラグとデータを同一記憶領域に混在
させて記憶するので、フラグ記憶のための専用の
記憶領域を必要としない利点がある。
次にフラグとデータの関係を第4図に従つて以
下に説明する。第4図に示すようにフラグは2ビ
ツトで構成され、(0、0)、(0、1)、(1、
0)、(1、1)の4種類がコードの種類に対応し
て設定されている。フラグ値(0、0)は1バイ
トデータに対応し通常のASCIIコードを想定して
いる。これにはカナ、数字、英文字、特殊記号等
の基本文字セツトが対応している。フラグ値
(0、1)は2バイトデータに対応し、JISの漢字
コードを想定している。フラグ値(1、0)は2
バイトデータに対応し、該2バイトデータは単
語、熟語等をコード化したものである。フラグ値
(1、1)は3バイトデータに対応し、該3バイ
トデータはフラグ値(1、0)で収容しきれなか
つた単語、熟語を収容するものであり、単語、熟
語の収容能力を拡張するものである。各データに
は、バイト毎に所定のフラグが与えられる。
第5図は、文書の1例として“洋の東西を問わ
ず………”を第2図に示す記憶装置3に記憶する
各種の方法を示したものである。同図において、
13はカナと漢字コードのみを用いて前記文書例
を記憶した場合、14はカナ、漢字コードに加え
単語コードを使用して記憶した場合、15はカ
ナ、漢字コードに加え熟語コードを使用して記憶
した場合である。同図はカナ、漢字コードの他に
単語又は熟語コードを用いた記憶方法14又は1
5の方が、カナ、漢字コードのみを用いた従来の
記憶方法13にくらべて使用メモリが少く、効率
のよい記憶方法であることを示している。同様に
して、第3図に示す記憶方法を用いて文書を記憶
する場合にも、カナ、漢字コードに加え単語、熟
語コードを用いた方法の方が効率のよい記憶方法
であることがわかる。
次に、第2図に示す記憶装置3に単語、熟語コ
ードで記憶されている文書をカナ・英文字、漢字
コードによる表現に復元する方法を第6図〜第8
図に従つて以下に説明する。第6図は第2図に示
す辞書一時記憶装置7の構成を示す。同図におい
て、16はハツシユ表、17はハツシユ表のエン
トリが有効かどうかを示す有効指示ビツトVを格
納する領域、18は3バイトコードを格納できる
コード格納領域、19はハツシユ表16のエント
リが衝突したときのリンクを指示する衝突リンク
を格納する領域、20は辞書一時格納領域23へ
のポインタである辞書アドレスを格納する領域、
21はフラグ値(1、0)、(1、1)に対応する
2バイト、3バイトコードをハツシユ変換して得
られたハツシユ値、23は単語、熟語コードに対
応する実際のカナ・英数字、漢字コードを格納す
る辞書一時格納領域、25はハツシユ値が同じに
なつて衝突が生じたときのオーバフロー領域であ
る。22は16進表示の2バイトコードX′324Cを
ハツシユ表16に格納した例であり、24は辞書
一時格納領域23のエントリの例であつて、
“東”、“西”という漢字コードが格納されている。
26は2バイトコードX′007020をオーバフロー
領域25に格納した例である。なお、オーバフロ
ー領域25のエントリの形式はハツシユ表16の
Vビツトを除いたものと同一である。
第7図、第8図は単語、熟語コードをカナ・英
数字、漢字コードに復元する動作を示すフローチ
ヤートであつて、第2図に示す処理装置6により
実行される。第7図において、第2図に示す記憶
装置3に記憶されている単語、熟語コードを先頭
番地から順次1バイト単位でそのフラグと共に読
み出し、フラグ値が(0、0)の場合は対応する
1バイトデータをレジスタR0に、フラグ値が
(0、1)又は(1、0)の場合は対応する2バ
イトデータをレジスタR0,R1(R2は0にセ
ツト)に、フラグ値が(1、1)の場合は対応す
る3バイトデータをレジスタR0,R1,R2に
それぞれセツトする。フラグ値(0、0)はカ
ナ・英数字コードに対応するから、前記レジスタ
R0にセツトした1バイトデータはそのまま復元
コードである。フラグ値(0、1)は漢字コード
に対応するから前記レジスタR0,R1にセツト
した2バイトデータはそのまま復元コードであ
る。フラグ値(1、0)又は(1、1)は単語・
熟語コードに対応するから前記レジスタR0,R
1にセツトした2バイトデータ又はR0,R1,
R2にセツトした3バイトデータをカナ・英数
字、漢字コードに復元する必要がある。まず、前
記2バイト又は3バイトデータをハツシユ変換
し、そのハツシユ値で第6図に示すハツシユ表1
6を引き、有効指示ビツトVをチエツクする。該
有効指示ビツトVが0の場合は辞書一時格納領域
23に求める復元コードが格納されていないの
で、第2図に示す辞書フアイル8から前記レジス
タR0,R1,R2に対応する復元コードを読み
出し前記辞書一時格納領域23に格納すると同時
にハツシユ表16のエントリに〔コード=R0、
R1、R2、衝突リンク=0、辞書アドレス=辞書
一時格納領域23の前記復元コードを格納したア
ドレス〕で書き込む。つまり前記辞書アドレスが
指示する辞書一時格納領域23の番地から読み出
すデータが復元コードである。前記有効指示ビツ
トVが1の場合はそのコード格納領域18のコー
ドとレジスタR1,R2,R3を比較する。一致
した場合は辞書アドレス格納領域20の辞書アド
レスが指示する辞書一時格納領域23の番地から
復元コードを得る。一致しない場合はハツシユ表
16のエントリに別のコードが登録済みであるか
ら以後第8図に示すフローチヤートに従つて処理
する。まず前記エントリの衝突リンクをチエツク
する。該衝突リンクの値が0の場合は、第2図に
示す辞書フアイル8からレジスタR0,R1,R
2に対応する復元コードを読み出し、辞書一時格
納領域23に格納し、ハツシユ表16のエントリ
はオーバフロー領域25(OVFAとする)に移
し、当該ハツシユ表エントリには新コードを登録
する。そのとき衝突リンク19の値はOVFAに
する。次に前記衝突リンクの値が0でない場合
は、該衝突リンクが指示するオーバフロー領域2
5のエントリ(エントリAとする。)を読み出す。
該エントリAのコードとレジスタR0,R1,R
2を比較する(ステツプ)。一致した場合はハ
ツシユ表16の前記別コードのエントリ(エント
リHとする)とエントリAを入れ替える。そのと
き、ハツシユ表エントリH、エントリA、エント
リAの直前のエントリ(エントリPとする。)の
衝突リンク格納領域19の衝突リンクの新旧値を
新H、旧H、新A、旧A、新P、旧Pでそれぞれ
表わすと、新H=旧P、新A=旧H、新P=旧A
とする。但し、P=Hのときは新H=旧H、新A
=旧Aとなる。これによりハツシユの衝突キユー
は、よく使うものから順に並ぶことになる。旧エ
トリAの辞書アドレスが指示する辞書一時格納領
域23の番地から読み出すデータが復元コードと
なる。前記ステツプにおいて一致しない場合は
エントリAの衝突リンクを判定する。該衝突リン
クが0のときは第2図に示す辞書フアイル8から
レジスタR0,R1,R2に対応する復元コード
を読み出して第6図に示す辞書一時格納領域23
に格納し、ハツシユ表16の前記別コードのエン
トリをオーバフロー領域25に移しそのあとに前
記復元コードに対応したエントリをセツトする。
前記衝突リンクが0でないときはエントリAの衝
突リンクが指示するオーバフロー領域25のエン
トリを読み出し、上述のステツプ以降の処理を
行い復元コードを得る。ハツシユ表16には常に
使用頻度の高いコードがセツトされることになる
ので、該ハツシユ表16で管理される辞書一時記
憶装置23を用いることにより単語・熟語コード
をカナ・英数字、漢字コードに高速で復元するこ
とができる。
以上説明したように本実施例ではカナ・英数
字、漢字コードに加え単語、熟語コードを用いて
文書を記憶装置に記憶することができるのでメモ
リ容量を少くすることができ、又、フラグとデー
タを共通の記憶領域に記憶することができるので
フラグ専用の記憶装置が不要となるという利点が
ある。又、単語、熟語コードからカナ・英数字、
漢字コードに復元する際、ハツシユ表を用いた辞
書一時記憶装置を用いるので使用頻度の高い単語
や熟語を毎回辞書フアイルから読み出す必要がな
く辞書一時記憶装置から高速に読み出すことがで
きる利点がある。
(発明の効果) 本発明はカナ・英数字、漢字コードに加え単
語、熟語コードを用いて文書を記憶装置に記憶
し、フラグとデータを共通の記憶領域に記憶する
のでメモリを効率よく利用することができる。又
辞書一時記憶装置を用いているので単語、熟語コ
ードからカナ・英数字、漢字コードへ高速に復元
することができる。本発明は日本語文に限らず、
欧文においても効率よい記憶方法として利用でき
る。
【図面の簡単な説明】
第1図は従来の文書記憶方法の説明図、第2図
は本発明の実施例のシステム構成図、第3図は第
2図の記憶装置3の一例を示す構成図、第4図は
本実施例のフラグの構成図、第5図は本実施例の
文書記憶方式の説明図、第6図は第2図の辞書一
時記憶装置7の構成図、第7図、第8図は本実施
例の動作を示すフローチヤートである。 3……記憶装置、4……フラグ記憶部、5……
データ記憶部、6……処理装置、7……辞書一時
記憶装置、8……辞書フアイル、9……アドレス
線、10……データ及び制御線、16……ハツシ
ユ表、17……有効指示ビツト格納領域、18…
…コード格納領域、19……衝突リンク格納領
域、20……辞書アドレス格納領域、21……ハ
ツシユ値、23……辞書一時格納領域、25……
オーバフロー領域。

Claims (1)

  1. 【特許請求の範囲】 1 カナ・英数字、漢字、単語・熟語コードに対
    してバイト毎に2ビツトからなる当該コードの種
    類を識別するフラグを付与し、前記コードとフラ
    グにより文書を記憶装置に記憶し、 記憶した単語・熟語コードをこれに対応するカ
    ナ・英数字、漢字コードに復元する際、当該単
    語・熟語コードが辞書一時記憶装置に記憶されて
    いる場合は対応するカナ・英数字、漢字コードを
    読み出すことにより復元し、 記憶されていない場合は辞書フアイルから読み
    出し前記辞書一時記憶装置に記憶することにより
    復元することを特徴とする文書記憶方式。 2 前記コードとフラグにより文書を記憶装置に
    記憶する際、フラグを複数個にまとめ、該復数個
    のフラグに対応するデータと共に前記記憶装置の
    同一記憶領域内に記憶する特許請求の範囲第1項
    記載の文書記憶方式。 3 前記辞書一時記憶装置から単語・熟語コード
    に対応するカナ・英数字、漢字コードを復元する
    際、ハツシユ表を用いてアクセスし該ハツシユ表
    のエントリが衝突した場合に毎回衝突キユーをつ
    なぎかえることによ最近アクセスした順序に管理
    する特許請求の範囲第1項記載の文書記憶方式。
JP58153050A 1983-08-24 1983-08-24 文書記憶方式 Granted JPS6045836A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58153050A JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58153050A JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Publications (2)

Publication Number Publication Date
JPS6045836A JPS6045836A (ja) 1985-03-12
JPH0128976B2 true JPH0128976B2 (ja) 1989-06-07

Family

ID=15553880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58153050A Granted JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Country Status (1)

Country Link
JP (1) JPS6045836A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01200028A (ja) * 1988-02-04 1989-08-11 Nippon Denso Co Ltd 燃料噴射時期調整装置

Also Published As

Publication number Publication date
JPS6045836A (ja) 1985-03-12

Similar Documents

Publication Publication Date Title
US4342085A (en) Stem processing for data reduction in a dictionary storage file
US4383307A (en) Spelling error detector apparatus and methods
EP0087956B1 (en) System for controlling key storage unit
US4744050A (en) Method for automatically registering frequently used phrases
US4367537A (en) Address retrieval in an electronic dictionary and language interpreter
EP0054667A1 (en) Method of generating a list of expressions semantically related to an input linguistic expression
EP0083393A2 (en) Method of compressing information and an apparatus for compressing English text
US4092729A (en) Apparatus for automatically forming hyphenated words
GB1328061A (en) Data processing system
US4359286A (en) Character set expansion
EP0268069B1 (en) Method of forming a message file in a computer
US4393463A (en) Insertion of character set change codes in an altered text stream
US4613944A (en) Electronic translator having removable data memory and controller both connectable to any one of terminals
US4747053A (en) Electronic dictionary
US5297038A (en) Electronic dictionary and method of codifying words therefor
US6396921B1 (en) Method and system for encoding and decoding typographic characters
JPH0128976B2 (ja)
EP0052757B1 (en) Method of decoding phrases and obtaining a readout of events in a text processing system
US4873628A (en) Command translating computer
US6032165A (en) Method and system for converting multi-byte character strings between interchange codes within a computer system
JPS5918730B2 (ja) 仮名・漢字変換装置
JPH0365588B2 (ja)
JPS6371767A (ja) 文書作成装置
JPS5972511A (ja) 一般コ−ドによる特殊コ−ド入力装置
JPS6134620A (ja) 計算機への入力方法