JPS6091478A - 単語の綴り検査方式 - Google Patents
単語の綴り検査方式Info
- Publication number
- JPS6091478A JPS6091478A JP58200259A JP20025983A JPS6091478A JP S6091478 A JPS6091478 A JP S6091478A JP 58200259 A JP58200259 A JP 58200259A JP 20025983 A JP20025983 A JP 20025983A JP S6091478 A JPS6091478 A JP S6091478A
- Authority
- JP
- Japan
- Prior art keywords
- word
- memory
- signal
- storage device
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
入力された単語が正しい綴りであるが否かを判定するに
あたっては、その入力された単語が予め特定の単語を収
録した単語辞書のなかに存在するかどうかによって判断
している。
あたっては、その入力された単語が予め特定の単語を収
録した単語辞書のなかに存在するかどうかによって判断
している。
しかるに、収録すべき単語数は多いため従来より各種の
単語辞書部の圧縮技法が開発されてきた。
単語辞書部の圧縮技法が開発されてきた。
〈発明の目的〉
本発明は、単語辞書部には基本的な単語のみを記録して
、その基本的な単語の組み合わさった単語即ち複合語若
しくは合成語は記゛録するこ々なくしたところの、該複
合語若しくは合成語の単語の綴りの検査機能を持たした
単語の綴り検査方式であり、単語辞書部の新規な圧縮方
法を提供することを目的とする。
、その基本的な単語の組み合わさった単語即ち複合語若
しくは合成語は記゛録するこ々なくしたところの、該複
合語若しくは合成語の単語の綴りの検査機能を持たした
単語の綴り検査方式であり、単語辞書部の新規な圧縮方
法を提供することを目的とする。
〈実施例〉
以下、具体的構成につき説明する。
本発明の単語の綴り検査方式の具体例を掲げておく。
例えば、単語辞書ニJmotorJ 、 JboatJ
、 [carJ。
、 [carJ。
[cycleJ の基本的な単語を収録しておき、rm
otorJと他のrboatJ 、 [carJ 、
[cycleJの合成語[motorboatl 、
j−motorc’arJ 、 [motorcycl
ejは前記単語辞書に収録しないで、もし該合成語が被
検査語として与えられたならば、該被検査語の最初の5
文字即ちrmj 、 roj 、 rtj 、 roj
、 rr、Jが単語辞書にあることを調べて、引き続
き残りの文字が該単語辞書に記録されているかを見ると
いうことにするのである。
otorJと他のrboatJ 、 [carJ 、
[cycleJの合成語[motorboatl 、
j−motorc’arJ 、 [motorcycl
ejは前記単語辞書に収録しないで、もし該合成語が被
検査語として与えられたならば、該被検査語の最初の5
文字即ちrmj 、 roj 、 rtj 、 roj
、 rr、Jが単語辞書にあることを調べて、引き続
き残りの文字が該単語辞書に記録されているかを見ると
いうことにするのである。
第1図は本発明の実施例のブロックダイヤグラムである
。
。
同図において、lは記憶装置、2はアドレスカウンタ、
3は記憶装置、4は綴り検査装置、5は信号出力装置で
ある。
3は記憶装置、4は綴り検査装置、5は信号出力装置で
ある。
各構成要素1乃至5について説明する。
■ 記憶装置1
単語を電子的に記憶する装置で、あるアドレス情報がア
ドレスカウンタ2より与えられると該アドレスに対応す
る単語の綴り情報が出力される。本実施例においては、
説明を簡略化するため被検査語は原形(活用形ではない
。)に限定した。
ドレスカウンタ2より与えられると該アドレスに対応す
る単語の綴り情報が出力される。本実施例においては、
説明を簡略化するため被検査語は原形(活用形ではない
。)に限定した。
又、アドレスカウンタ2がカウントアツプする毎に1個
の単語が出力され、その出力される単語はアルファベン
ト類の逆とする。
の単語が出力され、その出力される単語はアルファベン
ト類の逆とする。
■ アドレスカウンタ2
上記の単語記憶装置1より出力する単語のアドレスを指
示するカウンタであり、例えば[mottoJ を出力
していたとしてアドレスが1つアップすると[moto
ristJを出力させるものである。
示するカウンタであり、例えば[mottoJ を出力
していたとしてアドレスが1つアップすると[moto
ristJを出力させるものである。
このアドレスカウンタ2は綴り検査装置4よりの信号(
不一致信号)Saによりカウントアツプし、信号出力装
置5よりの信号S4によりカウントをリセットして再ス
タートする。又、前記信号S3によりカウントアツプし
た時、指示する単語が記憶装置1にもはや存在しなくな
った場合、信号(誤り信号)Ssを出力する。
不一致信号)Saによりカウントアツプし、信号出力装
置5よりの信号S4によりカウントをリセットして再ス
タートする。又、前記信号S3によりカウントアツプし
た時、指示する単語が記憶装置1にもはや存在しなくな
った場合、信号(誤り信号)Ssを出力する。
■ 記憶装置3
図示していない手段により与えられた被検査1″、j−
語を記憶する。又、信号出力装置5よりの信号(シフト
情報信号)S6により内部に記憶している被検査語を与
えられた情報に基づき左シフトし所定の頭何文字分を捨
てる。
語を記憶する。又、信号出力装置5よりの信号(シフト
情報信号)S6により内部に記憶している被検査語を与
えられた情報に基づき左シフトし所定の頭何文字分を捨
てる。
■ 綴り検査装置4
前記記憶装置1及び3より出力さ九る単語の綴りを検査
(チェック)する装置で、該記憶装置3と該記憶装置3
よりの綴り情報が完全に一致した場合に信号(一致信号
)Slを出力する。
(チェック)する装置で、該記憶装置3と該記憶装置3
よりの綴り情報が完全に一致した場合に信号(一致信号
)Slを出力する。
完全に一致していないが記憶装置1より出力される文字
列が記憶装置3より出力される頭何文字部分と一致する
場合、記憶装置1の文字列の文字数を信号出力装置5に
出力する。それ以外の場合は信号(不一致信号)Saを
出力する。
列が記憶装置3より出力される頭何文字部分と一致する
場合、記憶装置1の文字列の文字数を信号出力装置5に
出力する。それ以外の場合は信号(不一致信号)Saを
出力する。
■ 信号出力装置5
信号S2に基づいて記憶装置3をシフトすべき回数情報
を該記憶装置3に出力し、アドレスカウンタ2をリセッ
トして再スタートさせる信号S4を該アドレスカウンタ
2に出力する。
を該記憶装置3に出力し、アドレスカウンタ2をリセッ
トして再スタートさせる信号S4を該アドレスカウンタ
2に出力する。
引き続き動作例を挙げる(第2図参照)。
(イ)被検査語として[rhotoristJが記憶装
置3に与えられた場合 アドレスカウンタ2は図示していない信号によって動作
をスタートシ、最初のアドレスを指示する。記憶装置1
は最初の単語[zoundsJ(−例である。)を出力
するが、それは被検査語と一致せず、さらにそれは被検
査語の頭文字外とも一致しないため綴り検査語@4より
信号S3が出力され、アドレスカウンタ2のアドレスを
アップする。以後、同様の操作を各単語ごとに繰り返し
て記憶装置lがrmotoristJを出力した時綴り
検査装置4は信号S1を出力し被検査語である[mot
oristJが正しい綴りであることを表わす。
置3に与えられた場合 アドレスカウンタ2は図示していない信号によって動作
をスタートシ、最初のアドレスを指示する。記憶装置1
は最初の単語[zoundsJ(−例である。)を出力
するが、それは被検査語と一致せず、さらにそれは被検
査語の頭文字外とも一致しないため綴り検査語@4より
信号S3が出力され、アドレスカウンタ2のアドレスを
アップする。以後、同様の操作を各単語ごとに繰り返し
て記憶装置lがrmotoristJを出力した時綴り
検査装置4は信号S1を出力し被検査語である[mot
oristJが正しい綴りであることを表わす。
(ロ)被検査語として[motorcarJが記憶袋@
3に与えられた場合 チェックが綴り検査装置4で行なわれ、アドレスカウン
タ2が記憶装置1において「mo t o rJのアド
レスを指示した時、記憶装置lからはJmotorJ
が記憶装置3からは[motorcarJが出力される
。該記憶装置3のrmotorcarlのt字列は記憶
装置1の文字列を頭5文字に含んでいるので信号S2が
出力され、信号出力装置5より[mo t o r J
の文字数即ち5だけ左シフトする信号S6が記憶装置
3に送られる。それによって、該記憶装置3は[mot
orcarJを頭より5文字分左シフトし、その結果、
新たな被検査語として記憶装置3にrcarJが残る。
3に与えられた場合 チェックが綴り検査装置4で行なわれ、アドレスカウン
タ2が記憶装置1において「mo t o rJのアド
レスを指示した時、記憶装置lからはJmotorJ
が記憶装置3からは[motorcarJが出力される
。該記憶装置3のrmotorcarlのt字列は記憶
装置1の文字列を頭5文字に含んでいるので信号S2が
出力され、信号出力装置5より[mo t o r J
の文字数即ち5だけ左シフトする信号S6が記憶装置
3に送られる。それによって、該記憶装置3は[mot
orcarJを頭より5文字分左シフトし、その結果、
新たな被検査語として記憶装置3にrcarJが残る。
さらに、信号出力装置5によりアドレスカウンタ2はリ
セットされ再度最初からやり直される。そして、rca
rJという単語が記憶装置1より出力されると綴り検査
装置4より信号Slが出力され正しい綴りであることが
判明する。又、rcarJの単語がなければアドレスカ
ウンタ2は最終アドレスまで進み、信号S5を出して与
えられた被検査語が辞書に収録されていない単語である
ことつまり誤った綴りであることが判明する。
セットされ再度最初からやり直される。そして、rca
rJという単語が記憶装置1より出力されると綴り検査
装置4より信号Slが出力され正しい綴りであることが
判明する。又、rcarJの単語がなければアドレスカ
ウンタ2は最終アドレスまで進み、信号S5を出して与
えられた被検査語が辞書に収録されていない単語である
ことつまり誤った綴りであることが判明する。
〈効 果〉
以上の様に本発明の単語の綴り検査方式によれば、基本
的な単語の組み合わせで作られた複合語若しくは合成語
を単語辞書に収録する必要がなく(7) なるので単語辞書の規模を小さくすることができる。例
えば、三省堂の1新明解英和中辞典」に収録された単語
(見出し語数は約3,000語とあ;E)。)をそのま
ま本発明の単語の綴り検査方式に適用すれば、rgra
ndl で始まる複合語(合成語)は13語も省略でき
る。さらに他の例を掲げれば、独語ではかような複合語
(合成語)が非常に多く、三修社の「現代独和辞典」に
よれば頭部分がl’Fi1mlである複合語(合成語)
はその数が80個余りあり、それらが全て省略できるの
であり、複合語(合成語)の多い言語にとって極めて有
用である。
的な単語の組み合わせで作られた複合語若しくは合成語
を単語辞書に収録する必要がなく(7) なるので単語辞書の規模を小さくすることができる。例
えば、三省堂の1新明解英和中辞典」に収録された単語
(見出し語数は約3,000語とあ;E)。)をそのま
ま本発明の単語の綴り検査方式に適用すれば、rgra
ndl で始まる複合語(合成語)は13語も省略でき
る。さらに他の例を掲げれば、独語ではかような複合語
(合成語)が非常に多く、三修社の「現代独和辞典」に
よれば頭部分がl’Fi1mlである複合語(合成語)
はその数が80個余りあり、それらが全て省略できるの
であり、複合語(合成語)の多い言語にとって極めて有
用である。
ざらに又、英語や独語等の外国語では語尾変化をする語
が非常に多い。しかし、英語、独語の様な言語ではその
活用形式が殆どの場合最後にある単語末尾部分の文字列
によって決まるため活用に関する情報は基本的な単語に
集中するわけで、本発明の単語の綴り検査方式を用いる
と収録効率が第2図は本発明実施例の動作説明に用いる
図である。
が非常に多い。しかし、英語、独語の様な言語ではその
活用形式が殆どの場合最後にある単語末尾部分の文字列
によって決まるため活用に関する情報は基本的な単語に
集中するわけで、本発明の単語の綴り検査方式を用いる
と収録効率が第2図は本発明実施例の動作説明に用いる
図である。
1・・・記憶装置、2・アドレスカウンタ、3 ・記憶
装置、4・・・綴り検査装置、5−信号出力装置。
装置、4・・・綴り検査装置、5−信号出力装置。
Claims (1)
- 1、被検査語が単語辞書部に収録されているか否かを検
査する単語の綴り検査方式であって、被検査語の先頭か
ら所定数の文字と一致する単語が単語辞書部に収録され
ている場合、該被検査語の不一致部分を新たな被検査語
として検査して、前記被検査語の不一致部分が単語辞書
部に収録されていれば被検査語を正しい綴りとし、逆に
前記被検査語の不一致部分が単語辞書部に収録されてい
なければ被検査語を誤りの綴りとするようにしたことを
特徴とする単語の綴り検査方式。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58200259A JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
DE8484307349T DE3473070D1 (en) | 1983-10-25 | 1984-10-25 | Word spelling checking system |
EP84307349A EP0145202B1 (en) | 1983-10-25 | 1984-10-25 | Word spelling checking system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58200259A JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6091478A true JPS6091478A (ja) | 1985-05-22 |
Family
ID=16421382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58200259A Pending JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0145202B1 (ja) |
JP (1) | JPS6091478A (ja) |
DE (1) | DE3473070D1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4701851A (en) * | 1984-10-24 | 1987-10-20 | International Business Machines Corporation | Compound word spelling verification |
JPS6389976A (ja) * | 1986-10-03 | 1988-04-20 | Ricoh Co Ltd | 言語解析装置 |
US5357431A (en) * | 1992-01-27 | 1994-10-18 | Fujitsu Limited | Character string retrieval system using index and unit for making the index |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4829472A (en) * | 1986-10-20 | 1989-05-09 | Microlytics, Inc. | Spelling check module |
NL9101285A (nl) * | 1991-07-23 | 1993-02-16 | Oce Nederland Bv | Inrichting en werkwijze voor het bepalen van gegevens van samengestelde woorden. |
CN102298577A (zh) * | 2011-09-21 | 2011-12-28 | 深圳市万兴软件有限公司 | 一种文本编辑的拼写检测方法及其装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54139355A (en) * | 1978-04-21 | 1979-10-29 | Agency Of Ind Science & Technol | Word separator |
JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57164371A (en) * | 1981-04-01 | 1982-10-08 | Casio Comput Co Ltd | Electronic dictionary |
US4499553A (en) * | 1981-09-30 | 1985-02-12 | Dickinson Robert V | Locating digital coded words which are both acceptable misspellings and acceptable inflections of digital coded query words |
US4597057A (en) * | 1981-12-31 | 1986-06-24 | System Development Corporation | System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles |
-
1983
- 1983-10-25 JP JP58200259A patent/JPS6091478A/ja active Pending
-
1984
- 1984-10-25 DE DE8484307349T patent/DE3473070D1/de not_active Expired
- 1984-10-25 EP EP84307349A patent/EP0145202B1/en not_active Expired
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS54139355A (en) * | 1978-04-21 | 1979-10-29 | Agency Of Ind Science & Technol | Word separator |
JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4701851A (en) * | 1984-10-24 | 1987-10-20 | International Business Machines Corporation | Compound word spelling verification |
JPS6389976A (ja) * | 1986-10-03 | 1988-04-20 | Ricoh Co Ltd | 言語解析装置 |
US5357431A (en) * | 1992-01-27 | 1994-10-18 | Fujitsu Limited | Character string retrieval system using index and unit for making the index |
Also Published As
Publication number | Publication date |
---|---|
EP0145202B1 (en) | 1988-07-27 |
EP0145202A3 (en) | 1985-07-03 |
EP0145202A2 (en) | 1985-06-19 |
DE3473070D1 (en) | 1988-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fodor | Parsing to learn | |
GB1513831A (en) | Error handling apparatus | |
Shimamura | Problems with the finding of stochastic independence as evidence for multiple memory systems | |
JPS6091478A (ja) | 単語の綴り検査方式 | |
BE1003890A6 (fr) | Procede de conversion de base de donnees. | |
US4085312A (en) | Input data-collating device | |
KR910014809A (ko) | 논리 시뮬레이션 방법 | |
JPH0244080B2 (ja) | ||
TWI254919B (en) | Method and device for sampling the disc | |
JPS59127139A (ja) | 文章の異常検査修正装置 | |
JP2969973B2 (ja) | 時刻データ比較処理装置 | |
Develin | Bouleutic Ostracism Again | |
JPH05289905A (ja) | 翻訳時エラーメッセージ詳細情報出力方式 | |
CN115994520A (zh) | 一种信息安全评估中安全目标证据自动生成的系统及方法 | |
JPS6227834A (ja) | コンパイリングリスト出力方式 | |
JP3257535B2 (ja) | 論理照合装置 | |
JPS59128676A (ja) | 文字読取り装置 | |
SU656109A1 (ru) | Устройство дл контрол блоков пам ти | |
Ostergaard | Who is mistaken about priming in “recognition/identification” experiments? A reply to Tulving and Hayman | |
JPS61150037A (ja) | 構文解析エラ−情報出力処理方式 | |
JPH05250211A (ja) | トレース情報出力方式 | |
Richmond | Metre and Prosody in the Halieutica Ascribed to Ovid | |
Bowditch | Medieval Heraldry: Some Fourteenth Century Heraldic Works | |
JPS63247844A (ja) | デ−タの部分的照合方式 | |
JPS58220216A (ja) | 誤り訂正装置 |