JPH0644264B2 - 単語記憶方式 - Google Patents

単語記憶方式

Info

Publication number
JPH0644264B2
JPH0644264B2 JP58252156A JP25215683A JPH0644264B2 JP H0644264 B2 JPH0644264 B2 JP H0644264B2 JP 58252156 A JP58252156 A JP 58252156A JP 25215683 A JP25215683 A JP 25215683A JP H0644264 B2 JPH0644264 B2 JP H0644264B2
Authority
JP
Japan
Prior art keywords
character
word
characters
stored
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58252156A
Other languages
English (en)
Other versions
JPS60134963A (ja
Inventor
邦男 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP58252156A priority Critical patent/JPH0644264B2/ja
Priority to EP84308971A priority patent/EP0148008B1/en
Priority to DE8484308971T priority patent/DE3484795D1/de
Publication of JPS60134963A publication Critical patent/JPS60134963A/ja
Publication of JPH0644264B2 publication Critical patent/JPH0644264B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 <技術分野> 本発明は単語記憶方式に関するものである。
<従来技術> 電子辞書や綴りチェック機能を有する英文ワードプロセ
ッサを構成する場合、単語やそれに関連する情報を予め
記憶させておく必要があるが、その際単語の文字をその
まま記憶させると記憶量は単語数に比例するので膨大に
なる。
例えば、下記第1表は「J」で始まる単語を100語リ
ストアップしたものであるが、単語と他の単語の間の区
切れを示す区切りコードを/単語ごとに設けると、文字
数564に前記区切りコード100の合計664文字情
報を記憶させねばならなくなる。
とすると、1単語当り約6.6文字となり、上記100
語をサンプルとして評価し得ると仮定すれば、3万語の
単語を記憶するには総計約20万文字を記憶させる必要
がある。
<発明の目的> そこで、本発明の単語記憶方式にあっては、単語及び単
語間の接続情報を記憶するのではなく、単語を構成する
文字(文字の他音節、マーク等を含める。)を1個1個
分割して、該文字及び文字間の接続情報を記憶して、単
語辞書の記憶量削減を図り、新規な圧縮方法を提供する
ことを目的とする。
<実施例> 以下、本発明の構成を実施例とともに記述する。
第1図に本発明の実施例の単語記憶方式の概念(一部省
略)を示した。
これは、前記第1表の単語を文字に分解し、その分解さ
れた文字、文字間の接続情報を6つに種類分けし、該6
つの接続情報を一対一に対応する特定の記号にて表わし
たものである。
その6つの接続情報及びそれに一対一に対応する記号は
下記第2表の通りである。
各接続記号は第1図にて下記第3表の通りの意味を持っ
ている。
上記単語記憶方式によれば、例えば、単語「JACKA
L」が辞書に存在するか否かは、単1回の出発点より、
各単語間の接続記号に従い、 と過不足なく検策が終了することにより判定できる。と
言うわけで、単語「JACKAL」は辞書に存在する。
一方、単語「JACKLL」は となり、「JACK」までは検索できるが、それ以降
「K」に接続する「L」は存在しないので、辞書には単
語「JAKCKLL」は存在しない。
上記第1図の文字の鎖状配列の記憶手段としては、メモ
リーに、 (イ)単語情報及び該単語の接続情報を連絡してそれを1
組にして記憶する方法 と、 (ロ)単語情報のみを記憶させたものと、該単語の接続情
報のみを記憶させたものを別々に用いる方法 とがある。
上記(イ)の方法を第2図に、上記(ロ)の方法は第3図
(a),(b)に示した。なお、前記第3図(a),(b)のカッコ
付数字は後の説明で用いるためのものである。
第4図は本実施例の単語記憶方式を実施した回路のブロ
ックダイヤグラムである。
各構成要素は次の通りである。
1:接続情報 を記憶する装置 2:文字等(文字の他、ハイフン,音節及びマーク等)
を記憶する装置 3:上記装置1,2のアドレスカウンタで、最初はリセ
ットされている(最初のアドレスを指示する)。このア
ドレス情報は上記装置1,2に同じものが与えられ、接
続情報と文字等の情報が対になって出力される。又、信
号Sによりアドレスは1進み、次の接続情報と文字等
の情報を出力する。
4:被検査語を記憶する装置で、被検査語が入力されて
いる(入力手段は公知技術に従う。)。なお、入力語の
文字列の末尾(最後)にはスペース が入力されている。
5:上記装置4のアドレスカウンタで、最初はリセット
されている。信号Sにより次のアドレスを指示し上記
装置4は次の文字を出力する。
6:適切な接続情報であるか否かを記憶するためのカウ
ンタで、信号Sにより1増加し、信号Sで1減少す
る。
7:上記装置1より出力される接続情報を解読する装置 8:上記装置2,4より出力される文字を比較する装置 9:上記装置4より出力される文字がスペース であるか否かを判定する装置 10:カウンタの内容が0であるか否かを判定する装置 なお、同図において、記号◎,が掲載されてあるが、
記号◎は被検査語が存在するという判定を意味し、記号
は被検査語が存在しないという判定を意味する。
又、同図の信号S〜S10は下記第4表通りである。
次に、上記回路の処理を第5図のフローチャートに従い
解読する。
同図において、xは前記アドレスカウンタ3のカウン
ト、yは前記アドレスカウンタ5のカウント及びzは前
記カウンタ6のカウントである。
又、同図において、Aは前記装置1の接続情報、Bは前
記装置2の文字等及びCは被検査語で表わす。
処理ステップの処理内容は下記第5表である。
上記nステップのYES側処理以降は接続情報 に続く接続情報を検索するためのものでnステップ以下
処理は次の通りになっている。
(1)z=0の場合 (a)装置1の出力Aが ならば、 z+1→z x+1→x を実行する。
(b)装置1の出力Aが ならば、装置2と4の出力(文字情報等)を比較し、Y
ESならループより抜け出て、NOならば x+1→x を実行する。
(c)装置1の出力Aが ならば、装置2と4の出力を比較し、YESならループ
より抜け出て、NOならば単語が存在しないという判定
を下す。
(2)z≠0の場合 (a)装置1の出力Aが ならば z+1→z x+1→x を実行する。
(b)装置1の出力Aが ならば x+1→x を実行する。
(c)装置1の出力Aが ならば、 z−1→z x+1→x を実行する。
(3)装置1の出力が ならば、 x+1→x を実行する。
具体的に被検査語「JAGUAR」を上げて説明する。
まず、nステップにて、x,y,zはリセットされ0
がストアーされる。この時、上記装置1,2,4は各々 A,Jを出力するため、n2ステップ、nステップでは
NOが成立し、nステップでYESが成立し、n
テップに進む。そうして、xが第3図(b)の(2)を指示す
るまで進む。
xが第3図(b)の(2)を指示したら、y=0,z=0であ
るから、前記装置1,2,4は各々 J,Jを出力し、nステップはNO、nステップ、
ステップ及びnステップはYESとなり、n10
テップが実行され、xは第3図(b)の(2)となり、yは1
となる。前記装置2,4は「A」,「A」を出力し、前
記装置1は を出力するため、nステップではNO、nステップ
ではYES及びnステップではNOが成立し、再びn
10ステップが実行される。その結果、xは第3図(b)の
(3)を指示し、y=2となり、前記装置1は を出力してnステップ及びnステップはNO、n
ステップはYESとなる。ここで、nステップにより
xは1ずつ増加し、xは第3図(b)の(4)を指示するため
装置1は を出力する。従って、再びnステップに復帰し、xは
第3図(b)の(5)を指示する。z=0であるため、装置1
を出力するまで、xは指示を更新する。このnステッ
プを実行した時、xが第3図(b)の(6)を指示した場合
は、n11ステップが実行され、次にxが第3図(b)の(7)
を指示した時も同様にn11ステップが実行され、z=2
となる。
ステップの実行後、xが第3図(b)の(8)を指示する
と、n17ステップが実行されてzは0になる。そして、
xが第3図(b)の(10)を指示した時、n7ステップ→n
ステップと進むが、n10ステップではNOとなるため、
xはさらに進み、xが第3図(b)の(11)を指示した時、
ステップ→nステップ→nステップと進み、n
10ステップが実行される。この時、y=2,z=0とな
り、nステップ及びnステップのチェックが行なわ
れる。
ここで、装置2,4は共に「G」を出力するため、n
ステップにてYESが成立するが、装置1は を出力するので、n13ステップはNOとなり、よっあ再
びn10ステップが実行され、xは第3図(b)の(12)を指
示し、y=3となる。装置1は 装置2は「G」及び装置3は「U」を出力するため、n
ステップ及びnステップはNO、nステップはY
ESとなるが、x+1→xが行なわれるのみであり、x
が第3図(b)の(13)を指示した時、nステップ及びn
ステップはNO、n14ステップ及びn15ステップはY
ESとなり、n10ステップに戻る。xは第3図(b)の(1
4)を指示し、y=4となるため装置1は 装置2は「A」、装置4は「A」を出力する。従って、
ステップにてYESが成立し、次の段階にても同様
にYESが成立して被検査語「JAGUAR」はすべてチェッ
クされたことになる。続いて、n10ステップが実行さ
れ、xは第3図(b)の(16)を指示し、 を出力する。又、y=6となり「U」が出力され、n
ステップが成立し、n12ステップは成立しないため◎に
辿りつく。
なお、被検査語が存在しないと3箇所あるのいずれか
に到達する。
ところで、第2図、第3図の様に、文字情報及び接続情
報を並べた場合、始点分岐や終了若しくは始点分岐から
出た先はどこに連続するかという問題がある。
この問題を解決する構成を第7図にて説明する。
同図において、□は の2種の接続情報と文字情報を表わしている。従って、
□の中には の接続情報は含まれてないため、必ず、連続するか、途
中で終わることになり、分岐したり分岐を受けることは
ない。
つまり、 b→b→b→b→b→b→b と接続するのである。
従って、被検査語を検索するには例えばbの分岐まで
来たとして、その際右側の文字に連続しなければb
右側、bの右側、bの右側をチェックし、途中で連
続すればそのまま右側へ進めば良い。bの右側でも一
致しなければその語は存在しないことを意味する。又、
からbを探すには右へ進めつつ接続情報のみをチ
ェックすればよく、 を探すことになる。但し、その過程で があれば、その個数だけ が現われるまで は無視する。本例ではbであり、b,bは無視して、それ以降の を探すことによって正しい接続関係が得られる。
同様な例を第8図に掲げた。
付言するに、文字情報と接続情報とは、第6図の通り、
夫々5ビットと3ビットで構成し一単位を8ビットで記
憶させると読み出しに好都合となる。
なお、上記実施例においては、単に単語のみの記憶方式
を掲げたが、もちろん、単語にその関連情報つまり訳語
や品詞等を付随させることも可能である。
上記に単語の検索原理を述べたが、このままでは問題が
ある。
まず、第4図にて説明したカウントxのチェックであ
る。つまり、このカウントxを1ずつ増加させること
は、辞書が大規模になれば時間がかかることになる。で
あるから、例えば、前記装置4に入力された被検査語の
先頭の文字を判断して適当なるカウントxを設定する対
策が考えられる。前記「JAGUAR」の場合、別途テーブル
等にて「J」からカウントxが前記装置1を指示するア
ドレス値を用意しておいて、 0→z 0→y を行って、第5図のnステップより実行する様にする
わけである。
又、前記第5図のnステップにてYESが成立し、n
ステップにてYESが成立した後、第8図のc,c
で示した通り、次のアドレス又は距離を示す情報を持
たせることをすればさらにスピードアップを図れる。
<効果> 以上の様に本発明の単語記憶方式によれば、単語を記憶
させるべき記憶手段(ROM等)の容量を小さくするこ
とができ、又、フロッピーディスク等の外部記憶装置等
よりRAMにロードする場合でもそのディスク及びRO
M容量を縮小でき且つフロード時間を短縮できる。
【図面の簡単な説明】
第1図は本発明の単語記憶方式の概念図、第2図は前記
単語記憶方式の記憶構成図、第3図(a),(b)は前記単語
記憶方式の別の記憶構成図、第4図は前記単語記憶方式
を実施する回路ブロック図、第5図は前記回路の処理説
明のためのフローチャート、第6図は前記単語記憶方式
のメモリー構成図、第7図及び第8図は前記単語記憶方
式の接続関係図である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】個々の文字と、当該個々の文字間の接続関
    係状態を示す接続記号情報とを一対一に対応させて記憶
    し、複数の単語を記憶可能とする単語記憶方式であっ
    て、 前記接続記号情報は少なくとも、 対応する文字が、その直前に記憶された文字に接続する
    唯一の文字であることを示す接続記号情報と、 対応する文字が、その直前に記憶された文字に接続する
    文字であり、かつ当該直前に記憶された文字に接続する
    文字が他にも存在することを示す接続記号情報と、 対応する文字が、その直前に記憶された文字より前に記
    憶された文字に接続する唯一の文字であることを示す接
    続記号情報と、 対応する文字が、その直前に記憶された文字より前に記
    憶された文字に接続する文字であり、かつ当該直前に記
    憶された文字より前に記憶された文字に接続する文字が
    他にも存在することを示す接続記号情報と を含む複数種類からなることを特徴とする単語記憶方
    式。
JP58252156A 1983-12-23 1983-12-23 単語記憶方式 Expired - Lifetime JPH0644264B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP58252156A JPH0644264B2 (ja) 1983-12-23 1983-12-23 単語記憶方式
EP84308971A EP0148008B1 (en) 1983-12-23 1984-12-20 Word spelling correlatively-storing method and its circuit
DE8484308971T DE3484795D1 (de) 1983-12-23 1984-12-20 Verfahren und einrichtung zur korrelativen speicherung von wortorthograpie.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58252156A JPH0644264B2 (ja) 1983-12-23 1983-12-23 単語記憶方式

Publications (2)

Publication Number Publication Date
JPS60134963A JPS60134963A (ja) 1985-07-18
JPH0644264B2 true JPH0644264B2 (ja) 1994-06-08

Family

ID=17233258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58252156A Expired - Lifetime JPH0644264B2 (ja) 1983-12-23 1983-12-23 単語記憶方式

Country Status (3)

Country Link
EP (1) EP0148008B1 (ja)
JP (1) JPH0644264B2 (ja)
DE (1) DE3484795D1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8515482D0 (en) * 1985-06-19 1985-07-24 Int Computers Ltd Search apparatus
GB8815978D0 (en) * 1988-07-05 1988-08-10 British Telecomm Method & apparatus for encoding decoding & transmitting data in compressed form
EP0718980A1 (en) * 1994-12-20 1996-06-26 International Business Machines Corporation Data compression method of individual sequences of strings of a data stream based on a dictionary and device for performing the same
US20080114735A1 (en) * 2006-09-29 2008-05-15 Peter Salemink Systems and methods for managing information

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4342085A (en) * 1979-01-05 1982-07-27 International Business Machines Corporation Stem processing for data reduction in a dictionary storage file
JPS57150070A (en) * 1981-03-12 1982-09-16 Sharp Corp Dictionary for "kana"-"kanji" conversion

Also Published As

Publication number Publication date
EP0148008B1 (en) 1991-07-10
JPS60134963A (ja) 1985-07-18
EP0148008A3 (en) 1987-09-02
EP0148008A2 (en) 1985-07-10
DE3484795D1 (de) 1991-08-14

Similar Documents

Publication Publication Date Title
US4924385A (en) Method of detecting types of parts constituting a larger group of parts
JPS6359660A (ja) 情報処理装置
US5297038A (en) Electronic dictionary and method of codifying words therefor
JPH0644264B2 (ja) 単語記憶方式
CN110717323B (zh) 文档分章方法及装置、终端和计算机可读存储介质
CN109783139B (zh) 软件界面特征提取方法、装置及电子设备
JP2824741B2 (ja) Atmセル検出器
JPS642970B2 (ja)
JPH0117177B2 (ja)
JP3210183B2 (ja) データ圧縮方法及び装置
JPS63103393A (ja) 単語認識装置
JPS583032A (ja) 木構造アクセス処理方式
JP4007504B2 (ja) 単語分割装置、記憶媒体およびプログラム
CN117971747A (zh) 一种围栏式数据接口转换方法、装置、固态硬盘及介质
JP2918380B2 (ja) 文字認識結果の後処理方法
JP2772125B2 (ja) 辞書検索方式
JP3137329B2 (ja) 文書編集装置
JP2896315B2 (ja) 論理シミュレーション方法
CN115221866A (zh) 一种实体词拼写纠错方法和系统
CN115796148A (zh) 一种地址解析方法、装置、计算机设备以及存储介质
JP3018579B2 (ja) 名前検索処理装置
JPS5847462Y2 (ja) 乗算回路
JPS59197929A (ja) カナ漢字変換処理装置
JPH0290364A (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP2006163995A (ja) 索引作成装置及び文書検索装置