JPS6045836A - 文書記憶方式 - Google Patents

文書記憶方式

Info

Publication number
JPS6045836A
JPS6045836A JP58153050A JP15305083A JPS6045836A JP S6045836 A JPS6045836 A JP S6045836A JP 58153050 A JP58153050 A JP 58153050A JP 15305083 A JP15305083 A JP 15305083A JP S6045836 A JPS6045836 A JP S6045836A
Authority
JP
Japan
Prior art keywords
code
kana
dictionary
codes
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58153050A
Other languages
English (en)
Other versions
JPH0128976B2 (ja
Inventor
Hiroshi Yasuhara
宏 安原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58153050A priority Critical patent/JPS6045836A/ja
Publication of JPS6045836A publication Critical patent/JPS6045836A/ja
Publication of JPH0128976B2 publication Critical patent/JPH0128976B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (技術分野) 本発明は文書を効率よく記憶装置に記憶する文書記憶方
式に関するものである。
(従来技術) 従来4文書をコード化して記憶装置に記1意する方法と
して、第1図の1に示すようにカナ・英数字と漢字を1
文字2ノぐイトでコートゞ化して記憶する方法と、第1
図の2に示すようにカー)−・英数字は1バイト、漢字
は2・ぐイトでコートゝイヒし、カナ・英数字から漢字
、漢字からカナ・英数字に変イヒする箇所にそれぞれ1
・ぐイトの制御コート゛を挿入することによりカナ・英
数字と漢字を区別して君己憶する方法が用いられていた
。前者の方法ではカナ・英数字のコードが2バイトであ
るだめ使用するメモリ容量が増大する欠点があり、後者
の方法では制御コード用にメモリを必要とする欠点かあ
、っだ。さらに、単語や熟語を記憶する場合、該単語や
熟語を構成するカナ・英数字コードと漢字コードを用い
て記憶するので上記いずれの方法を用いても単語や熟語
を構成するカナ・英数字、漢字の文字敬分の記憶領域を
必要とする欠点があった。
(発明の目的) 本発明の目的はこれらの欠点を除去するだめカナ・英数
字、漢字、単語・熟語コードを用いて文明を効率よく記
憶装置に記憶し、記憶した栄語・熟語コードを高速にデ
コードするものである。
(発明の構成) 本発明はカナ・英数字、漢字、単語、熟語コードに対し
てバイト毎に2ビツトからなる所定のフラグを付与し、
前記コードとフラグを用いて文書を記憶装置に記1.へ
し、記憶した単語・熟語コードをこれに対応するカナ・
英数字、漢字コードに復元する際、前記カナ・莢数字、
漢字コードが辞■一時記憶装置に記憶されている場合は
該カナ・莢数字、漢字コードを読み出すことにより復元
し。
記憶されてい々い場合は辞書ファイルから読み出し前記
辞書一時記憶装置に記憶することにより復元することを
特徴とする文書記憶方式である。
(実施例) 第2図は本発明の実施例のシステム構成図であって、3
は記憶装置、4はフラグ記憶部、5はデータ記憶部、6
は処理装置、7は辞書の一部を一時的に記憶する辞椙一
時記憶装置、8は辞書を記憶する辞書ファイル、9はア
ドレス線、10はデータ及び制御線である。記憶装置3
.処理装置6゜辞書一時記憶装置7.辞書フアイル8は
アドレス線9.データ及び制御線10により共通バス方
式で接続17ている。
記憶装置3には文書をコード化しノ杜データと該データ
にバイト単位毎に何カした2ビツトからなるフラグとを
記憶する。その記憶方法には、第2図に示す記憶装置3
のように物理的に分離しだフラグ記憶部4とデータ記憶
部5に前記フラグとデータをそれぞれ分離して記憶する
方法と、第3図に示すように前記フラグとデータを同一
記憶領域に混在させて記憶する方法がある。後者の場合
、5番地毎にデータ4バイト分のフラグを記憶する。
一般に論理番地がn番地のデータをアクセスする場合、
そのデータに対応するフラグは物理番地の(’+ r−
”〕X 4 )番地の左から(n mod 4 )番目
の1−4 フィールドになり、そのデータは(n−147)+1 
)番地になる。例えば第3図において、論理番地が4番
地のデータをアクセスする場合そのデータに対応するフ
ラグは物理番地の5番地の左から1番目のフィールド、
つ捷り第3図に示すフラグ11になり、そのデータは物
理番地000番地データ。
つ捷り第3図に示すデータ12になる。この方法に1ニ
フラグとデータを同一記憶領域に混在させて記憶するの
て、フラグ記憶のだめの専用の記憶領域を必要としない
利点がある。
次にフラグとデータの関係を第4図に従って以下に説明
する。第4図に示すようにフラグは2ビツトで構成され
、(0,o)、(o、1)、(1゜0)’、(1,1)
の4種類設定されている。フラグ値(0,0)は1バイ
トデータに対応し通常のASCIIコードを想、定して
いる。これにはカナ、数字、英文字、特殊記号等の基本
文字セ、1・か対応している。フラグ値(0、1)は2
バイトデータに対応し、、JTSの漢字コードを想定し
ている。フラグ値(+ 、O)は2バイトデータに力」
応し、該2バイトデータは単語、熟語等をコード化した
ものである。フラグ値(1,1)は:3バイトデータに
対応し、該3バイトデータはフラグ値(1,0)で収容
しきれ々かった単語、熟語を収容するものであり、単語
、熟語の収容能力を拡張するものである。各データにに
、バイト毎に所定のフラグが与えられる。
第5図は、文書の1例として洋の東[Jqを問わず・ 
′を第2図に示す記憶装置3に記憶する各独の方法を示
したものである。同図において、13はカナと漢字コー
ドのみを用いて前記文書例を記憶した場合、14はカナ
、漢字コードに加え単語コードを使用して記憶・した場
合、15はカナ、漢字コードに加え熟語コードを使用し
て記憶した場合である。同図はカナ、漢字コードの他に
単語又は熟語コードを用いた記憶方法14又は15の方
が、カナ、漢字コードのみを用いた従来の記憶方法I3
にくらべて使用メモリが少く、効率のよい記憶方法であ
ることを示している。同様にして。
第3図に示す記憶方法を用いて文書を記憶する場合にも
、カナ、漢字コードに加え単語、熟語コードを用いた方
法の方が効率のよい記憶方法であることがわかる。
次に、8112図に示す記憶装置3に単語、熟語コード
で記憶されている文書をカナ・英数字、漢字ロー)パに
よる表現に復元する方法を第6図〜第8図に従って以下
に説明する。第6図は第2図に示すpj−’f’店一時
記憶装置7の構成を示す。同図において、t t; i
j、ハ、ソ1表、17はバッジ−表のエンドすが有効か
どうかを示す有効指示ビ、l−Vを格納する領域、1B
は:3バイトコードを格納できるコード格納領域、19
d、ハ、/ユ表16のエントリが衝突したときのリンク
を指示する衝突リンクを格納する領域、20は辞書一時
格納領域23へのポインタである辞書アドレスを格納す
る領域。
21はフラグ値(o 、 1) 、 (1,1)に対応
する2バイト、3バイトコードをハ、ンユ変換して得ら
れたハツシュ値、23は単語、熟語コードに対応する実
際のカナ・英数字、漢字コードを格納する辞書一時格納
領域、25はハツシュ値か同じに々って衝突が生じだと
きのオーパンロー領域である。22は2/ぐ・イトコー
ト 工表16に格納した例であり、24は辞店一時格納領域
23のエンドすの例であって,″東″′。
゛°西″という漢字コードと′とうざい″というカナコ
ードが格納されている。26は2バイトコードX’ 0
 0 7 0 2 0をオーバフロー領域25に格納し
た例である。なお、辞書一時格納領域23のエンl− 
’Jの形式はハッ/ユ表16の■ビットを除いたものと
同一である。
第7図,第8図は嚇語,熟語コードをカナ・英数字,漢
字コードに復元する動作を示すフローチャー1・であっ
て、第2図に示す処理装置6に」、り実行される。第7
図において,第2図に示す記憶装置3に記憶されている
単語,熟語コードを先頭番地から順次1バイト単位でそ
のフラグと共に読み出し,フラグ値が(0,0)の場合
は対重する1バイトデータをレジスタROに,フラグ値
が( 0 、 ] )又は(]、(j)の場合は対応す
る2バイトデータをレジスタR O 、 R ]、 (
 R 2.は0にセット)に、フラグ値が(1,1)の
場合は対応する3バイトデータをレジスタRO,R1,
R2にそれぞれセフ1・する。フラグ値(0.0)はカ
ナ・英数字コードに対応するから,前記レジスタ1工0
にセットした1バイトデークはその!r.′!復元コー
ドである。フラグ値( 0 、 1. )は漢字コード
に対応するから前記レジスタRO,R]にセットし/乙
2バイトデータはその11復元コードである。
フラグ値( + 、 0 )又は(1.1)は単語・熟
語コードに対応するから前記レジスタRO 、R1にセ
,1・した2バイトデータ又はRo.R1,R2にセ,
トシた3バイトデータをカナ・英数字,漢字コードに復
元する必要がある。−ヰす,前記2バイト又は3バイI
・データをハッンユ変換し、そのハツシュ値で第6図に
示すハツシュ表16を引き。
有効指示ビ,1・Vをチェックする。該有効指示ビyト
Vが0の場合は辞書一時格納領域23にめる復元コード
が格納されていないので,第2図に示す辞書ファイル8
がら前記レジスタRO,R1。
R2に対応する復元コードを読み出しAil記辞44一
時格納領域23に格納すると同時にバッジ−表16のエ
ントリに〔:r − ト= R O 、 R I 、 
R 2. 。
衝突リンク二〇,辞書アドレス=辞書一時格納領域23
の前記復元コードを格納したアドレス〕で書き込む。つ
1り前記辞書アドレスが指示する辞書一時格納領域23
の番地から読み出すデータが復元コードである。前記有
効指示ビットvが1の+S 合ハソのコード格納領域1
8のコードとレジスタR1.、R2,R3を比較する。
一致した場合は辞書アドレス格納領域2θの辞書アドレ
スが指示する辞書一時格納領域23の番地から復元コー
ドを得る。一致しない場合はハツシュ表16のエントリ
に別のコードが登録済みであるから以後第8図に示すフ
ローチャートに従って処理する。捷ず、前記エントリの
衝突リンクをチェックする。該衝突リンクの値が00場
合は、第2図に示す辞書ファイル8からレジスタRO,
R1,R2に対応する復元コードを読み出し、辞書一時
格納領域23に格納すると同時にバッジ−表16のエン
トリに所定の処理を行なう。次に前記衝突リンクの値が
0で左い場合は、該衝突リンクが指示するオーバフロー
領域25のエンドす(エンドすAとする1、)を読み出
す。該エントリAのコードとレジスタRr)、R1,R
2を比較する(ステ、ゾ■)。一致し/C場合は・・ッ
シー表16の前記別コードのエントりとエントリAを入
替える。そのとき、ハツシュ表二ントリ(エンドすHと
する。)、エントリ A 、 エ ン ト リ A の
直前のエ ン ト リ (エ ン ト リ Pとする。
)の衝突リンク格納領域19の衝突リンクの新旧値を新
H2旧H2新A、旧A、・新P、旧Pでそれぞれ表わす
と、新H−旧P、紙A−旧H1新P−旧Aとする。但し
、P=Hのときは新H−旧H2新A−旧人となる。これ
によりノ・ッシェ〜の衝突ギューは、よく使うものから
順に並ぶことになる。旧エンドすAの辞書アドレスが指
示する辞書一時格納領域23の番地から読み出すデータ
が復元コードと々る。前記ステラフ0■において一致し
ない場合はエンドすAの衝突リンクを判定する。
該衝突リンクが0のときは第2図に示す辞書ファイル8
からレジスタRO,R1,R2に11応する復元コード
を読み出して第6図に示す辞書一時格納領域23に格納
し、ノ・ッゾエ。表IGの前記別コードのエントリをオ
ーバフロー領域25に移しそのあとに前記復元コードに
対応したエントりをセットする。前記衝突リンクがOで
ないときはエントリAの衝突リンクが指示するオー・ぐ
フロー領域25のエントリを読み出し、」ニ述のステ、
フ0■以降の処理を行い、復元コードを得る。・・7シ
ユ表16には常に使用頻度の高いコードがセットされる
ことになるので、該ノ・ッシュ表16で管理される辞書
一時記憶装置23を用いることにより単語・熟語コード
をカナ・英数字、漢字コードに高速で復元することがで
きる。
以上説明したように本実施例ではカナ・英数字。
漢字ロー1δに加え単語、熟語コードを用いて文書を記
憶装置に記憶することができるのでメモリ容−鼠を少く
することができ、又、フラグとデータを共通の記憶領域
に記憶することができるのでフラグ専用の記憶装置が不
要となるという利点がある。
又、t)1語、熟語コードからカナ・英数字、漢字ロー
1゛に復元する際、・・ッシー表を用いた辞書一時hピ
憶装置を用いるので使用頻度の高い単語や熟語を毎回辞
書ファイルから読み出す必要がなく辞書一時記憶装置か
ら高速に読み出すことができる利点かある。
(発明の効果) 本発明はカナ・英数字、漢字コードに加え単語。
〃1語コードを用いて文書を記憶装置に記憶し、フラグ
とデータを共通の記憶領域に記憶するのてメモリを効率
よく利用することができる。又辞書一時記憶装置を用い
ているので単語、熟語コードからカナ・莢数字、漢字コ
ードへ高速に復元することができる。本発明は日本語文
に限らず、欧文においても効率よい記憶方法として利用
できる。
【図面の簡単な説明】
第1図は従来の文書記憶方法の説明図、第2図は本発明
の実施例のシステム構成図、第:う図は第2図の記憶装
置3の一例を示す構成図、第4図は本実施例のフラグの
構成図、第5図は本実施例の文書記憶方式の説明図、第
6図は第2図の辞書一時記憶装置7の構成図、第7図、
第8図は本実施例の動作を示すフローチャートである。 3 ・記憶装置、4・フラグ記憶部、5・・データ記憶
部、6・・処理装置、? 辞書一時記憶装置。 8・・・辞書ファイル、9・アドレスm 、 1/J・
・データ及び制御19 、 J t; ハツシュ表、7
7・・有効指示ビット格納領域、18・・コード格納領
域、19・衝突リンク格納領域、20 ・辞書アドレス
格納領域、2ノ・・・・7シユ値、23・・辞書一時格
納領域、25・オーバフロー領域。 手続補正書(自発) 1 ・11件の表示 昭和58年 特 許 願第153050号2 発明の名
称 文居−記憶方式 ;3を山田をする者 11件との関係 特許出願人 件 所(〒105) 東京都港区虎ノ門1丁目7番12
号名称(029) 2申@気工iis末式会ネ1代表者
 取締役社長橋本南海男 4代理人 住 所(〒105) 東京都港区虎ノ門1丁目7香12
号6補正の内容 (1)明細書第8頁第4行目に「フラグ値(0,1)J
とあるのを「フラグ値(1,0)jと補正する。 (2)同書第8頁第10行目に「22は2バイトコード
」とあるのを「22ば16進表示の2バイトコード」と
補正する。 (3)同書第8頁第16行目に「なお、辞書一時格納領
域23の」とあるのを「なお、オーバフロー領域25の
」と補正する。 (4)同書第11頁第7行目から第8行目に「に格納す
ると・・行なう。次に・・・」とあるのを「に格納し、
バッジ−表16のエントリはオー・ぐフロー領域25 
(0VFAとする)に移し、轟該・・ッノユ表エンl−
1)には新コードを登録する。そのとき衝突リンク19
の値はQVFAにする。次に− 」と補正する。 (5)図面「第2図」「第6図」及び「第8図」を別紙
のとおり補正する。 第8図

Claims (3)

    【特許請求の範囲】
  1. (1) カナ・英数字、漢字、単語・熟語コードに対し
    てバイト毎に2ビ、トからなる所定のフラグをイ附与し
    、前記コードとフラグにより文書を記憶装置に記憶し、
    記憶した単語・熟語コードをこれに対応するカナ・莢数
    字、漢字コードに復元する際、前記カナ・莢数字、漢字
    コードが辞書一時記憶装置に記憶されている場合は該カ
    ナ・英数字。 漢字コードを読み出すことにより復元し、記憶されてい
    ない場合は辞書ファイルから読み出し前記辞書一時記憶
    装置に記憶することにより復元することを特徴とする文
    書記憶方式。
  2. (2)前記コードとフラグにより文書を記憶装置に記憶
    する際、フラグを複数個にまとめ、該複数個のフラグに
    対応するデータと共に前記記憶袋1置の同一記憶領域内
    に記憶する特許請求の範囲第(1)項記載の文書記憶方
    式。
  3. (3)前記辞書一時記憶装置から単語・熟語コードに対
    応するカナ・英数字、漢字コート゛を復元する際、ノ・
    ソシェー表を用いてアクセスし該ノ・、ツ・ンユ表のエ
    ントリが衝突した場合に毎回衝突キューをつなぎかえる
    ことにより最近アクセスした11屓序に管理する特許請
    求の範囲第(1)項記載の文書記憶方式。
JP58153050A 1983-08-24 1983-08-24 文書記憶方式 Granted JPS6045836A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58153050A JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58153050A JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Publications (2)

Publication Number Publication Date
JPS6045836A true JPS6045836A (ja) 1985-03-12
JPH0128976B2 JPH0128976B2 (ja) 1989-06-07

Family

ID=15553880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58153050A Granted JPS6045836A (ja) 1983-08-24 1983-08-24 文書記憶方式

Country Status (1)

Country Link
JP (1) JPS6045836A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4995368A (en) * 1988-02-04 1991-02-26 Nippondenso Co., Ltd. Fuel injection timing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4995368A (en) * 1988-02-04 1991-02-26 Nippondenso Co., Ltd. Fuel injection timing apparatus

Also Published As

Publication number Publication date
JPH0128976B2 (ja) 1989-06-07

Similar Documents

Publication Publication Date Title
EP0294950B1 (en) A method of facilitating computer sorting
US4782325A (en) Arrangement for data compression
GB2097974A (en) Spelling error detector apparatus and methods
JPH026252B2 (ja)
EP0052725A1 (en) Method of reducing the print element changes in a text processing system
JPS6045836A (ja) 文書記憶方式
US4845612A (en) Apparatus for accessing a memory which has dedicated areas for separately storing addresses and character string data
JPS6010349B2 (ja) 文書作成装置
Beebe Character set encoding
JPH0746362B2 (ja) 文字列照合方法
JPS5960691A (ja) 光学文字読取装置
JPS635793B2 (ja)
JP2634926B2 (ja) かな漢字変換装置
JPS5942347B2 (ja) 電子翻訳機
GB2220773A (en) Apparatus for preparing dictionary data for personal dictionary
JPH0352102B2 (ja)
JPS5918730B2 (ja) 仮名・漢字変換装置
JPS5856067A (ja) 文書処理装置
JPH07242022A (ja) パターン変換装置
JPS6081639A (ja) 項目整列方式
GB2128787A (en) A method of printing or otherwise mechanically producing composite characters, such as Chinese characters
EP0326560A1 (en) Arrangement for data compression
JPH0242563A (ja) 文書作成編集装置
JPS6273958A (ja) 漢字プリンタ制御装置
JPH0721798B2 (ja) 言語処理装置