JPH079655B2

JPH079655B2 - スペルの誤りの検出訂正方法及び装置

Info

Publication number: JPH079655B2
Application number: JP2215111A
Authority: JP
Inventors: フレデリツク・ジエイ・ダメロー; エリツク・ケイ・メイズ; ロバート・エル・マーサー
Original assignee: インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン
Priority date: 1989-08-31
Filing date: 1990-08-16
Publication date: 1995-02-01
Anticipated expiration: 2010-02-01
Also published as: EP0415000B1; DE69031099D1; US5258909A; EP0415000A2; JPH0398158A; EP0415000A3

Description

【発明の詳細な説明】 A.産業上の利用分野本発明は情報信号中のエラーを検出し、且つ訂正する方
法及び装置、より詳細に言えば、語の綴りの誤り、即ち
スペルのエラーを検出し、且つ訂正する方法及び装置に
関する。 B.従来の技術ワード・プロセツサなどの文章（テキスト）専用の処理
装置や、汎用デイジタル・コンピユータを動作させるワ
ード・プロセツシング・プログラムにおいて、ワードの
スペルの誤りを自動的に検出し、且つ訂正することが望
まれている。ほとんどのスペルの誤りを検出する装置及
びプログラムは、スペルの辞書、即ちスペリング・デイ
クシヨナリ中の記入項目と比較して文章中の各ワードを
チエツクする。スペリング・デイクシヨナリ中にない文
章中のワードは、誤つて綴られたワード、即ちミス・ス
ペルされたワードに見做される。ミス・スペル・ワード
は、例えば、表示装置に示されたミス・スペル・ワード
の輝度を増加し、文章を作成しているオペレータによつ
て識別される。また、或る場合には、ミス・スペル・ワ
ードに類似したスペルを持つ候補のワードを、訂正すべ
き正しいワードの提案としてオペレータに対して表示さ
れる。スペルの誤りを検出し、且つ訂正するための従来の装置
及び方法は幾つかの問題を持つている。最も重要な問題
点としては、従来の装置及び方法が誤つたスペル、また
は「誤用ワード（wrong word）」を検出出来ないことで
ある（誤用ワードとは、誤つたスペルそれ自体はスペリ
ング・デイクシヨナリ中に存在するけれども、そのワー
ドは意図されたワードではない場合を言う）。更に、誤つたスペルがスペリング・デイクシヨナリ中に
無い場合でも、従来の装置及び方法は、正しいスペルの
ための代替え用のワード、即ち候補のワードをランク付
けする手段を全く持たないか、または語の代替に関して
限られた機能の手段しか持つていない。 C.発明が解決しようとする課題本発明の目的は、情報信号が誤つた情報を表わしている
場合に、情報信号中のエラーを検出し、且つ訂正する方
法及び装置を提供することにある。情報信号がワードを
表わしており、誤つて綴られたワードがスペリング・デ
イクシヨナリ中に正しく記入されているが、意図された
ワードではない場合に、本発明は誤つたスペルを検出
し、且つ訂正するための方法及び装置を提供する。本発明の他の目的は、スペルがチエツクされているワー
ドの発生の確率を見積り、且つチエツクされているワー
ドと代替えする候補ワードとして、１つ、またはそれ以
上の代替ワードの確率を見積るための方法及び装置を提
供することにある。 D.課題を解決するための手段本発明に従つたエラー検出方法及び訂正方法において、
ワードの入力ストリングW_iが与えられる。入力ストリン
グの中の第１のワードW₁のスペルはワードの候補ストリ
ングW_cを形成するために、第１のワードW₁とは異なつた
第２のワードW₂を形成するように変更される。ワードの
入力ストリングの発生の確率Ｐ（W_i）と、ワードの候補
ストリングの発生の確率Ｐ（W_c）とが見積られる。ま
た、ワードの入力ストリングW_iとして、ワードの候補ス
トリングW_cを誤つて表わす確率Ｐ（W_i｜W_c）も見積られ
る。その後、Ｐ（W_i）は積Ｐ（W_c）Ｐ（W_i｜W_c）と比較
される。若し、Ｐ（W_i）が積Ｐ（W_c）Ｐ（W_i｜W_c）より
も大きければ、第１の出力が発生される。若しそうでな
ければ、第２の出力が発生される。本発明の１つの実施例においては、第１の出力はワード
の入力ストリングを含んでおり、第２の出力はワードの
候補ストリングを含んでいる。他の実施例においては、
第２の出力はエラー表示を含んでいる。ワードの入力ストリングとしてワードの候補ストリング
を誤つて表示する確率Ｐ（W_i｜W_c）は、第１のワードW₁
として第２のワードW₂を誤つて表示する確率Ｐ（W₁｜
W₂）として見積られる。本発明に従つたエラーの検出及び訂正方法と、装置にお
いて、入力ストリング及び候補ストリング中の各ワード
は正しくスペルされたワードの複数個の組である。本発明の方法及び装置は、ワードの入力ストリングW_i中
のすべてのワードを正しくスペルする確率Ｐ（W_i｜W_i）
が見積られるステツプを含んでいるのが望ましい。この
場合、積Ｐ（W_i）Ｐ（W_i｜W_i）は積Ｐ（W_c）Ｐ（W_i｜
W_c）と比較される。若し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ
（W_c）Ｐ（W_i｜W_c）よりも大きければ、第１の出力が発
生され、そうでなければ、第２の出力が発生される。入力ストリング中のすべてのワードを正しくスペルする
確率Ｐ（W_i｜W_i）は第１のワードW₁を正しくスペルする
確率Ｐ（W₁｜W₁）として見積ることが出来る。本発明の１つの実施例によると、第１のワードW₁は試案
的なワードを形成するために、第１のワード中の１つ、
またはそれ以上の文字を加え、または、削除し、または
並べ換え、または置換することによつて第２のワードW₂
を形成するように変更される。試案的なワードはワード
の組の各ワードと比較される。若し、試案的なワードが
正しくスペルされたワードの組中の１つのワードと一致
すれば、試案的なワードが第２のワードW₂として用いら
れる。他の実施例において、第１のワードのスペルは正しくス
ペルされたワードの組中のＭ個の異なつたワードの混同
したグループを識別することによつて第２のワードを形
成するために変更される。混同したグループ中の各ワー
ドは、例えば、２つの文字だけ、第１のワードとは異な
つたスペルを持つている。他の場合として、混同したグ
ループ中の各ワードは第１のワードと混同され得る１つ
である。混同したグループの少なくとも１つのワードは
第２のワードW₂として選択される。本発明の方法または装置に従つて１つのワードを正しく
スペルする確率を見積つた結果得られた値は0.999であ
つた。Ｍ個のスペルの誤りを持つ時、１つのワードをミ
ス・スペルする確率は0.001/Mであると見積られてい
る。本発明に従つたスペルの誤りの検出及び訂正方法及び装
置は、チエツクされているワードの発生の確率と、１
つ、またはそれ以上のスペルを訂正する候補の発生の確
率とを比較することによつて、誤用されたワードのスペ
ルを検出し、訂正することが可能であると言う利点を持
つている。 E.実施例情報信号中のエラーを検出し且つ訂正するための本発明
の実施例を以下に説明する。各情報信号が、正しくスペ
ルされているワードの複数個の組である１つのワードを
表わしている場合において、本発明はスペルの誤りを検
出し且つ訂正する方法を与える。第１図を参照すると、スペルの誤りの検出及び訂正方法
は、ワードの入力ストリングW_iを与えるステツプで開始
することが判る。入力ストリング中の各ワードはスペル
を持つている。次に、入力ストリング中の第１のワードW₁のスペルは、
候補ワードのストリングW_cを形成するために、第１のワ
ードとは異なつた第２のワードW₂を形成するよう変更さ
れる。第１図において、入力ストリング及び候補ストリングの
各々は３つのワードを含んでいる。本発明に従つて、入
力ストリング及び候補ストリングは２つのワードか、ま
たは２つのワードよりも大きい任意の長さである。例え
ば、各ストリングはセンテンス（文）、またはフレーズ
（節）であつてよい。次に、ワードの入力ストリングの発生の確率Ｐ（W_i）
と、ワードの候補ストリングの発生の確率Ｐ（W_c）とが
見積られる。これらの確率は、以下に詳しく説明するよ
うに、文章の大きなボデイを検査することによつて経験
的に見積られる。また、ワードの入力ストリングW_iとして、ワードの候補
ストリングW_cを誤つて表示する確率Ｐ（W_i｜W_c）が見積
られる。確率Ｐ（W_i｜W_c）は、以下に示す例で説明され
るように、満足する結果が得られるまで、異なつた値を
選択することによつて経験的に選ばれる。必要な確率が見積られた後、Ｐ（W_i）は確率の積Ｐ
（W_c）Ｐ（W_i｜W_c）と比較される。若しＰ（W_i）がＰ
（W_c）Ｐ（W_i｜W_c）と等しいか、またはそれよりも大き
ければ、第１の出力が発生される。それ以外の場合は第
２の出力が発生される。第１図に示したように、第１の出力は入力ストリングW₁
W_MW_Nである。第２の出力は候補ストリングW₂W_MW_Nであ
る。上述の代りに、第２の出力はエラー表示であつてよい。本発明に従つたスペルの誤りの検出方法及び訂正方法の
２つの実施例が第２図及び第３図に示されている。第２
図を参照すると、入力ストリングは３つのワード、「th
e horse ran」のストリングである。ワードの入力スト
リング中の各ワードは正しくスペルされた１組のワード
の１つの要素である。第１のワードW₁は「horse」であ
る。次に、第１のワード「horse」は第２のワードW₂「hous
e」を形成するために変更される。従つて、ワードの候
補ストリングW_cは「the house ran」である。第２のワ
ード「house」もまた、正しくスペルされたワードの組
の１つの要素である。ワードの入力ストリング「the horse ran」の発生の確
率Ｐ（W_i）は５×10^-5であると見積られている。ワード
の候補ストリング「the house ran」の発生の確率Ｐ（W
_c）は１×10^-8であると見積られている。これらの確率
は本発明の動作を説明する目的のための単なる仮説であ
るけれども、この仮説的な数値は、「the horse ran」
の発生の確率が「the house ran」の発生の確率よりも
遥かに大きいことを示している。本発明の方法に従つて、ワードの入力ストリングとして
ワードの候補ストリングを誤つて表示する確率Ｐ（W_i｜
W_c）は第１のワードW₁として第２のワードW₂を誤つて綴
る確率Ｐ（W₁｜W₂）に等しいものと見積られている。実
験によると、0.001の見積が満足な結果を生じるものと
決められている。最後に、Ｐ（W_i）が積、Ｐ（W_c）Ｐ（W_i｜W_c）と比較さ
れる。前者の値（５×10^-5）は後者の値（１×10^-11）
よりも大きいから、ワードの入力ストリングは正しいも
のとして決定され、そしてワードの候補ストリングは排
除される。従つて、出力は「the horse ran」である。第３図は入力ストリングが「the house ran」である場
合において、本発明の検出方法及び訂正方法の動作を説
明するための図である。この場合、第１のワードW₁が
「house」であり、第２のワードW₂が「horse」である。
第２図において見積つた値と同じ確率を使用することに
よつて、入力ストリングの確率（１×10^-8）は、入力ス
トリングとして候補ストリングを誤つて表示する確率
と、候補ストリングの確率との積（５×10^-8）よりも小
さい。従つて、入力ストリングは除去され、候補ストリ
ングが正しいものとして決定される。出力は「the hors
e ran」にセツトされる。本発明に従つたスペルの誤りの検出方法及び訂正方法は
以下の理論に基づいている。ワードW_cの各候補ストリン
グに対して（例えば各候補のセンテンスに対して）、オ
リジナルのセンテンスW_i（ワードの入力ストリング）が
タイプされた通りに候補のセンテンスが実際に意図され
たように与えられる確率は次式で与えられる。この数式において、Ｐ（W_i｜W_c）は、ワードの入力スト
リングW_iとしてワードの候補ストリングW_cを誤つて表わ
す確率である。オリジナルのセンテンスW_iが実際に意図した通りにタイ
プされる確率Ｐ（W_i｜W_i）（即ち、オリジナルのセンテ
ンスW_i中のすべてのワードを正しくスペルする（綴る）
確率が、Ｐ（W_c｜W_i）に対して比較される。単純化する
ために、比較の両側はＰ（W_i）により乗算されるので、
積、Ｐ（W_i）Ｐ（W_i｜W_i）が積、Ｐ（W_c）Ｐ（W_i｜W_c）
と比較される。より高い確率を持つセンテンスが実際に
意図されたセンテンスとして選択される。比較を更に単純化するために、オリジナルのセンテンス
が実際に意図された通りにタイプされる確率Ｐ（W_i｜
W_i）は１に等しいと仮定することができる。ワードの入力ストリングの発生の確率Ｐ（W_i）と、ワー
ドの候補ストリングの発生の確率Ｐ（W_c）とは、各スト
リング中のすべてのｎ−グラムに対するｎ−グラムの確
率の積によつて近似させることが出来る。つまり、各ワ
ードに先行するｎ−１個のワード（またはワードの欠
如）の発生が与えられれば、ワードのストリングの確率
は、ストリング中の各ワードの条件付き確率の積によつ
て近似させることが出来ると言うことである。例えば、
若し、ｎ＝３とすれば、各トライグラム（trigram）の
確率は、トライグラム中の最初の２個のワードの発生が
与えられれば、トライグラムの第３のワードの発生の確
率を表わす。条件付き確率は文章の大きなボデイを検査することによ
つて経験的に決定される。例えば、ストリングW_xW_yの発
生が与えられたとして、ワードW_zの条件付き確率（W_z
｜W_xW_y）は次式から見積ることが出来る。（W_z｜W_xW_y）＝λ_１f₁（W_z｜W_xW_y）＋λ_２f₂（W_z｜
W_y）＋λ_３f₃（W_z）＋λ_４f₄ （２）上式において、 λ_１＋λ_２＋λ_３＋λ_４＝１（７）である。等式（３）乃至（６）において、カウントn_xyzはトレー
ニング文章の大きなボデイ中のトライグラムW_xW_yW_xの発
生度数である。n_xyはトレーニング文章中のバイグラム
（bigram）W_xW_yの発生度数である。同様に、n_yzはトレ
ーニング文章中のバイグラムW_yW_zの発生度数であり、n_y
はワードW_yの発生度数であり、n_zはワードW_zの発生度数
であり、ｎはトレーニング文章中のワードの合計の数で
ある。等式（２）及び（７）中の係数λ_１、λ_２、λ_３
及びλ_４の値は、バール（R.bahl）等、「連続的なスピ
ーチ認識に対する最大尤度のアプローチ」（A Maximum
Likelihood Approach to Continuous Speech Recogniti
on）、パターン分析及び機械のインテリジエンスに関す
るIEEE会報）IEEE Transactions on Pattern Analysis
and Machine Intelligence）、1983年３月、第PAMI−５
巻第２号、179頁乃至190頁に記載されている削除補間法
によつて見積ることが出来る。Ｐ（W_i）Ｐ（W_i｜W_i）とＰ（W_c）Ｐ（W_i｜W_c）との比較
において、確率Ｐ（W_i｜W_c）はオリジナルにタイプされ
たセンテンス中の対応するワードとして候補センテンス
中の各ワードをミス表示する確率の積によつて近似され
る。オリジナルにタイプされたセンテンスと候補のセン
テンスとがただ１ワード（オリジナルのセンテンス中の
ワードW₁と候補のセンテンス中のワードW₂）だけ相異す
る場合、その確率Ｐ（W_i｜W_c）は第１のワードとして第
２のワードをミス・スペルする確率Ｐ（W₁｜W₂）に等し
いものとして見積ることが出来る。任意に与えられたワードの確率は例えば0.001よりも低
い値を持つと見積るのが良い。この値は満足すべき結果
を生じた実験により決定されたものである。ミス・スペ
ルの確率を増加することによつて、本発明は、より多く
のミス・スペルを発見するであろうし、ミス・スペル確
率を減少することによつて、本発明は、より発見される
ミス・スペルは、より少なくなる。オリジナルにタイプ
されたセンテンス中のワードW₁がＭ個のミス・スペルを
持つている時、各ミス・スペルの確率はこの例において
0.001/Mになる。若し、オリジナルにタイプされたセンテンス中のすべて
のワードの確率Ｐ（W_i｜W_i）が１と見積られなければ、
それは、オリジナルにタイプされたセンテンス中に正し
くスペルされた各ワードの積によつて近似させることが
出来る。オリジナルにタイプされたセンテンスと候補の
センテンスとが１ワードだけ異なつている場合、確率Ｐ
（W_i｜W_i）は第１のワードを正しくスペルした確率Ｐ
（W₁｜W₁）として見積られる。第４図は第１のワードW₁のスペルを第２のワードW₂に変
更するのに用いられるサブルーチンを示す。先ず、第１
のワードの中の１つ、またはそれ以上の文字が試案的な
ワードW_Tを形成するように変更される。例えば、第１の
ワードに或る文字を加えるか、第１のワードから或る文
字を削除するか、または第１のワードの中の２つの文字
を並べ換える（transpose）かすることによつて変更が
行われる。次に、試案的なワードW_Tが１組のワード（スペリング・
デイクシヨナリ）Ｌ中の各ワードと比較される。若し、
試案的なワードW_Tがスペリング・デイクシヨナリＬ中の
ワードと一致したならば、第２のW₂が試案的なワードと
等しくセツトされる。第５図はワードのスペルを変更するための他のサブルー
チンを示す。このルーチンにおいて、スペリング・デイ
クシヨナリ中の各ワードは、Ｍ個の異なつたワードを含
む混同したワードのグループL_cが与えられる。例えば、
混同したワードのグループ中の各ワードは、第１のワー
ドW₁のスペルとは、２文字しか違つていないスペルを持
つている。その他に、混同したワードのグループ中の各
ワードは、第１の音と似ているために第１のワードと混
同され勝ちなワード（例えば、「to」、「two」と「to
o」、或は「principle」と「principal」など）であ
る。各候補センテンスに対して、１ワードが第２のワー
ドW₂として混同したワードのグループL_cから選択され
る。第６図は第１図のスペルの誤りの検出方法及び訂正方法
を示す。第６図に示したステツプは第１図のブロツク中
のステツプを置き換えることを意図したものである。この修正に従うと、この方法はワードW_iの入力ストリン
グ中のワードのすべてを正しくスペルする確率Ｐ（W_i｜
W_i）を見積るステツプが含まれている。積Ｐ（W_i）Ｐ
（W_i｜W_i）は積Ｐ（W_c）Ｐ（W_i｜W_c）と比較される。若
し、前者が後者よりも大きいか、または等しければ第１
の出力（例えば、入力ストリング）は発生される。若
し、前者が後者よりも小さければ、第２の出力（例え
ば、候補のストリング）が発生される。例えば、各情報信号がスペルを持つワードを表示する場
合、情報信号中のエラーを検出し且つ訂正する装置は、
プログラムされた汎用デイジタル・コンピユータの形式
のものが好ましい。第７図はそのような装置の構成の例
を示している。第７図に示されたように、ワードの処理装置10は情報信
号の入力ストリングW_iを与える。各情報信号はワードの
ような情報を表わす。ワードを処理する装置10は装置の
他の機能も遂行する中央処理装置12の中で実行されるプ
ログラムであることが望ましい。然しながら、ワードを
処理する装置10はそれ自身の中央処理装置で実行しても
よい。プログラム・インストラクシヨン記憶装置14中のプログ
ラム・インストラクシヨンの管理の下で、中央処理装置
12は、第１の情報信号によつて現わされる情報とは異な
つた情報を表わす第２の情報W₂を形成するために、入力
ストリングW_i中の第１の情報信号W₁を変更する。この変
更は情報信号W_cの候補ストリングを形成する。プログラ
ム・インストラクシヨンの管理の下で、中央処理装置12
は、第２の情報信号がスペリング・デイクシヨナリ中の
エントリであることを確めるために、情報信号W₂とスペ
リング・デイクシヨナリ記憶装置16とを比較する。入力及び候補ストリングを発生させ、中央処理装置12
は、ワード・ストリング確率記憶装置18からの入力及び
候補ストリングの発生の確率の見積を検索するようイン
ストラクシヨンを受ける。情報信号の入力ストリングと
して情報信号の候補ストリングによつて表わされた情報
を誤つて示す確率Ｐ（W_i｜W_c）は記憶装置20から検索さ
れる。最後に、中央処理装置12はＰ（W_i）とＰ（W_c）Ｐ
（W_i｜W_c）とを比較する。第１の出力信号は、若し、前
者が後者よりも大きいか、または等しいならば、例えば
表示装置22に送られる。若し、前者が後者よりも小さけ
れば、第２の出力信号が表示装置22に送られる。本発明に従つたスペルの誤りの検出及び訂正方法及びそ
の装置は、48個のセンテンスから組織的にミス・スペル
された3044個のセンテンスの入力テストが行われた。48
個のセンテンスは、アソシエーテツト・プレス・ニユー
ス・ワイヤ社（Associated Press News Wire）からと、
カナダの議会の議事録から選ばれた。トライグラムの条
件付き確率は、主として事務担当部門の通信文で構成さ
れた文章の大量の集成から得られた。0.999の確率Ｐ（W
_i｜W_i）を用いて、この方法は78％の変更されたセンテ
ンスを選択した。これらのセンテンスのうち97％のセン
テンスが変更された。上述のテストから選択した幾つかの例を以下に説明す
る。第１の例この例において、入力のワード・ストリング（オリジナ
ルにタイプされたセンテンス）は「Isubmit that is wh
at is happening in this case.」である。チエツクさ
れたワードW₁は「Ｉ」である。ワード「Ｉ」は「ａ」と
いう単純な誤りだけしか持つていない。従つて、第２の
ワードW₂は「ａ」であり、そして候補のワード・ストリ
ングW_c（候補のセンテンス）は「a submit that is wha
t is happening in this case」である。別表として末尾に掲げた第１表は入力及び候補のセンテ
ンスと、各センテンスを作るトライグラムと、各トライ
グラムの条件付き確率の自然対数である。各ワードを正
しく綴る確率P_tをP_t＝0.9999、P_t＝0.999、P_t＝0.99、
またはP_t＝0.9の４つの異なつた値の下で実験が遂行さ
れた。確率の対数（基数ｅ）は第１表から見積られるから、こ
の対数は確率の積の見積りの積に加算される。第２表は第１表から得られた合計を示す。P_tのすべての
値に対して、オリジナルのセンテンスW_iは代替の候補セ
ンテンスW_cを越えて選択されている。第２の例この例において、入力のワード・ストリングW_iは「I su
bmit that is what is happening in this case.」であ
る。スペルがチエツクされた第１のワードW₁は「submi
t」である。ワード「submit」は２つの単純なミス・ス
ペル「summit」または「submits」である。この例にお
いて、第２のワードW₂は「summit」であるように選択さ
れている。従つて、候補ワードのストリングW_c（候補の
センテンス）は「I summit that is what is happening in this cas
e.」である。第３表は確率の対数であり、第４表は第３表の合計を与
えている。再度、P_tの各値に対してオリジナルのセンテ
ンスは候補のセンテンスを越えて選択されている。第３の例この例において、入力のワード・ストリングW_i（オリジ
ナルとしてタイプされたセンテンス）は今度は、「a su
bmit that is what is happening in this case.」であ
る。スペルがチエツクされているワードの第１のワード
W₁は「ａ」である。このワード「ａ」は以下に示す10個
の単純なミス・スペルを持つている。即ち、それらは
「Ｉ」、「at」、「as」、「an」、「am」、「ad」、
「ab」、「pa」、「or」、及び「ha」である。第２のワードW₂は「Ｉ」であると選択される。従つて、
候補ストリングは「I submit that is what is happeni
ng in this case.」である。個々の確率の対数は第５表に示されている。Ｍを整数10
として、確率Ｐ（W₁｜W₂）はP_t/Mに等しいことは注意を
要する。第６表は第５表からの合計を与えている。P_tのすべての
値に対して、P_t＝0.9の時を除いて、オリジナルのセン
テンスが候補のセンテンスを越えて選択されている。P_t
＝0.9の時、候補のセンテンスがオリジナルのセンテン
スを越えて選ばれている。第４の例この例において、入力のワード・ストリングW_iは「I su
mmit that is what is happening in this case.」であ
る。スペルがチエツクされているワードの第１のワード
W₁は「summit」である。このワード「summit」は「subm
it」または「summit」の２個の単純なミス・スペルを持
つている。第２のワードW₂は「submit」であると選択される。従つ
て、候補ストリングW_cは「I submit that is what is h
appening in this case.」である。第７表はトライグラムの見積られた確率の対数と、各ワ
ードを正しくスペルされた場合の確率と、または誤つて
スペルされた場合の確率とを示している。Ｍ＝２だか
ら、確率Ｐ（W₁｜W₂）＝P_t/2である。第８表は第７表からの合計を与えている。候補のセンテ
ンスがオリジナルとしてタイプされたセンテンスを越え
て選択されている。従つて、すべての場合にわたつて訂
正が行われている。 F.発明の効果本発明は、スペルがチエツクされているワードの発生の
確率を見積り、且つチエツクされているワードと代替え
する候補ワードとして、１つ、またはそれ以上の代替ワ
ードの確率を見積るための方法及び装置を与える。ま
た、本発明に従つたスペルの誤りの検出及び訂正方法及
び装置は、チエツクされているワードの発生の確率と、
１つ、またはそれ以上のスペルを訂正する候補の発生の
確率とを比較することによつて、誤用されたワードのス
ペルを検出し、訂正することが可能であると言う利点を
持つている。

【図面の簡単な説明】第１図は本発明に従つたスペルの誤りの検出及び訂正方
法の実施例を示すブロツク図、第２図は第１図の実施例
を説明するための具体例を示すブロツク図、第３図は第
１図の実施例を説明するための他の具体例を示すブロツ
ク図、第４図は本発明のスペルの誤りを検出し、訂正す
る方法及び装置において、第２のワードを形成するため
に第１のワードのスペルを変更するルーチンを示す１実
施例の図、第５図は第２のワードを形成するために、第
１のワードのスペルを変更するための方法の１実施例を
示すブロツク図、第６図は第１図に示したスペルの誤り
の検出及び訂正方法の他の実施例を示すブロツク図、第
７図は情報中のエラーを検出し、訂正するための装置の
実施例を示すブロツク図である。 10……ワード・プロセツサ、12……中央処理装置、14…
…プログラム・インストラクシヨン記憶装置、16……ス
ペリング・デイクシヨナリ記憶装置、18……ワード・ス
トリング確率記憶装置、20……Ｐ（W_i｜W_c）記憶装置、
22……表示装置。

Claims

【特許請求の範囲】【請求項１】各ワードがスペルを持つワードの入力スト
リングW_iを与えることと、ワードの候補ストリングW_cを形成するために、第１のワ
ードW₁とは異なつた第２のワードW₂を形成するように入
力ストリング中の第１のワードW₁のスペルを変更するこ
とと、ワードの入力ストリングの発生の確率Ｐ（W_i）を見積る
ことと、ワードの候補ストリングの発生の確率Ｐ（W_c）を見積る
ことと、ワードの入力ストリングW_iとしてワードの候補ストリン
グW_cを誤つて表示する確率Ｐ（W_i｜W_c）を見積ること
と、Ｐ（W_i）と、積Ｐ（W_c）Ｐ（W_i｜W_c）とを比較すること
と、若し、Ｐ（W_i）がＰ（W_c）Ｐ（W_i｜W_c）よりも大きけれ
ば、第１の出力を発生し、若し、Ｐ（W_i）がＰ（W_c）Ｐ
（W_i｜W_c）よりも小さければ、第２の出力を発生するこ
ととからなるスペルの誤りの検出訂正方法。【請求項２】請求項（１）に記載のスペルの誤りの検出
訂正方法において、第１の出力はワードの入力ストリングを含むことと、第２の出力はワードの候補ストリングを含むことと、確率Ｐ（W_i｜W_c）は第１のワードW_iとして第２のワード
W₂をミス・スペルする確率Ｐ（W₁｜W₂）として見積るこ
ととを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項３】請求項（２）に記載のスペルの誤りの検出
訂正方法において、各ワードがスペルを持つワードの組を与えることと、ワードの入力ストリング中の各ワードは複数個のワード
の組であることと、第２のワードW₂は複数個のワードの組であることとを含むスペルの誤りの検出訂正方法。【請求項４】請求項（３）に記載のスペルの誤りの検出
訂正方法において、ワードの入力ストリングW_i中のすべてのワードを正しく
スペルする確率Ｐ（W_i｜W_i）を見積ることと、積Ｐ（W_i）Ｐ（W_i｜W_i）と積Ｐ（W_c）Ｐ（W_i｜W_c）とを
比較することと、若し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）よ
りも大きければ、第１の出力を出力し、そして、若し、
Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）よりも小
さければ、第２の出力を発生することとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項５】請求項（４）に記載のスペルの誤りの検出
訂正方法において、確率Ｐ（W_i｜W_i）が第１のワードを正しくスペルする確
率Ｐ（W₁｜W₁）として見積られることを特徴とするスペ
ルの誤りの検出訂正方法。【請求項６】請求項（５）に記載のスペルの誤りの検出
訂正方法において、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプが、試案的なワードを形成するために、第１のワードに１つ
の文字を付加することと、試案的なワードとワードの組の中の各ワードとを比較す
ることと、若し、試案的なワードがワードの組のワードと一致した
ならば、第２のワードW₂として、試案的なワードを使用
することとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項７】請求項（５）に記載のスペルの誤りの検出
訂正方法において、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプが、試案的なワードを形成するために、第１のワードから１
つの文字を削除することと、試案的なワードとワードの組の各ワードとを比較するこ
とと、若し、試案的なワードがワードの組のワードと一致した
ならば、第２のワードとして、試案的なワードを使用す
ることとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項８】第１のワードが少なくとも２つの文字を含
む請求項（５）に記載のスペルの誤りの検出訂正方法に
おいて、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプが、試案的なワードを形成するために、第１のワード中の少
なくとも２つの文字を並べ換えることと、試案的なワードとワードの組の各ワードとを比較するこ
とと、若し、試案的なワードがワードの組のワードと一致した
ならば、第２のワードとして、試案的なワードを使用す
ることとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項９】第１のワードが少なくとも１つの文字を含
む請求項（５）に記載のスペルの誤りの検出訂正方法に
おいて、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプが、試案的なワードを形成するために、第１のワード中の１
つの文字を異なつた文字に置換することと、試案的なワードとワードの組の各ワードとを比較するこ
とと、若し、試案的なワードがワードの組のワードと一致した
ならば、第２のワードとして、試案的なワードを使用す
ることとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項１０】請求項（５）に記載のスペルの誤りの検
出訂正方法において、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプは、ワードの組中のＭ個の異なつたワードの混同したグルー
プを識別することと、混同したグループ中の各ワードのスペルと、第１のワー
ドのスペルとの間で相異するスペルの数は２個であるこ
とと、第２のワードW₂として混同グループ中の１つのワードを
選択することとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項１１】請求項（５）に記載のスペルの誤りの検
出訂正方法において、第２のワードW₂を形成するために、第１のワードW₁のス
ペルを変更するステツプが、ワードの組中のＭ個の異なつたワードの混同したグルー
プを識別することと、混同したグループ中の各ワードは第１のワードにより混
同していることと、第２のワードW₂として混同したグループ中の１つのワー
ドを選択することとを含むことを特徴とするスペルの誤りの検出訂正方法。【請求項１２】請求項（11）に記載のスペルの誤りの検
出訂正方法において、確率Ｐ（W₁｜W₁）は0.999であると見積ることと、確率Ｐ（W₁｜W_c）は0.001/Mであると見積ることとを特徴とするスペルの誤りの検出訂正方法。【請求項１３】請求項（１）に記載のスペルの誤りの検
出訂正方法において、第２の出力はエラー表示であることを特徴とするスペル
の誤りの検出訂正方法。【請求項１４】情報信号の入力ストリングW_iを与えるこ
とと、各情報信号は情報を表示することと、情報信号の候補ストリングW_cを形成するために、第１の
情報信号により表わされる情報とは異なつた情報を表わ
す第２の情報信号W₂を形成するように入力ストリング中
の第１の情報信号を変更することと、情報信号の入力ストリングの発生の確率Ｐ（W_i）を見積
ることと、情報信号の候補ストリングの発生の確率Ｐ（W_c）を見積
ることと、情報信号のストリングW_iとして情報信号の候補ストリン
グW_cによつて表わされた情報を誤つて表示する確率Ｐ
（W₁｜W_c）を見積ることと、Ｐ（W_i）とＰ（W_c）Ｐ（W₁｜W_c）とを比較することと、若し、Ｐ（W_i）の値がＰ（W_c）Ｐ（W₁｜W_c）の値よりも
大きければ、第１の出力信号を発生し、そして若し、Ｐ
（W_i）の値がＰ（W_c）Ｐ（W₁｜W_c）の値よりも小さけれ
ば、第２の出力信号を発生することとからなる情報信号のエラーの検出訂正方法。【請求項１５】請求項（14）に記載の情報信号のエラー
の検出訂正方法において、第１の出力信号は情報信号の入力ストリングを含むこと
と、第２の出力信号は情報信号の候補ストリングを含むこと
と、第１の信号W₁として第２の情報信号W₂により表わされた
信号を誤つて表示する確率Ｐ（W₁｜W₂）として、確率Ｐ
（W_i｜W_c）が見積られることとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項１６】請求項（15）に記載の情報信号のエラー
の検出訂正方法において、各ワードがスペルを含むワードの組を与えることと、情報信号の入力ストリング中の各情報信号はワードの複
数個の組である１つのワードを表わすことと、第２の情報信号W₂はワードの複数個の組である１つのワ
ードを表わし、第２の情報信号により表わされたワード
は第１の情報信号により表わされたワードとは異なつて
いることとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項１７】請求項（16）に記載の情報信号のエラー
の検出訂正方法において、情報信号の入力ストリングW_i中のすべての情報信号によ
つて表わされた情報を正しく表わす確率Ｐ（W_i｜W_i）を
見積ることと、積Ｐ（W_i）Ｐ（W_i｜W_i）と積Ｐ（W_c）Ｐ（W_i｜W_c）とを
比較することと、若し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）よ
りも大きければ、第１の出力信号を出力し、そして若
し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）より
も小さければ、第２の出力信号を発生することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項１８】請求項（17）に記載の情報信号のエラー
の検出訂正方法において、確率Ｐ（W_i｜W_i）は第１の情報信号W_iによつて表わされ
た情報を正しく表わす確率Ｐ（W₁｜W₁）として見積られ
ることを特徴とする情報信号のエラーの検出訂正方法。【請求項１９】請求項（18）に記載の情報信号のエラー
の検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更するステツプが、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワードに１つの文字を付加することと、試案的なワードと１組のワードの各ワードとを比較する
ことと、若し、試案的なワードがワード組の中の１つのワードと
一致したならば、第２の情報信号W₂として、試案的なワ
ードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２０】請求項（19）に記載の情報信号のエラー
の検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更することが、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワードから１つの文字を削除すること
と、試案的なワードと１組のワードの各ワードとを比較する
ことと、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２１】第１の情報信号は少なくとも２つの文字
を有する１つのワードを表わしている請求項（18）に記
載の情報信号のエラー検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更することが、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワード中の少なくとも２つの文字を並べ
換えることと、試案的なワードと１組のワードの各ワードとを比較する
ことと、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２２】第１の情報信号は少なくとも１つの文字
を有するワードを表わしている請求項（18）に記載の情
報信号のエラーの検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更するステツプが、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワード中の１つの文字を置換すること
と、試案的なワードと１組のワードの各ワードとを比較する
ことと、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２３】請求項（18）に記載の情報信号のエラー
の検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更するステツプが、ワードの組の中のＭ個の異なつたワードの混同したグル
ープを識別することと、混同したグループ中の各ワードと第１の情報信号によつ
て表わされたワードとの間で相異するスペルの文字は２
個であることと、第２の情報信号W₂として、混同したグループ中の１つの
ワードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２４】請求項（18）に記載の情報信号のエラー
の検出訂正方法において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更するステツプが、ワードの組の中のＭ個の異なつたワードの混同したグル
ープを識別することと、混同したグループ中の各ワードは第１の情報信号によつ
て表わされたワードと混同されていることと、第２の情報信号W₂として、混同したグループ中の１つの
ワードを表示することとを含むことを特徴とする情報信号のエラーの検出訂正方
法。【請求項２５】請求項（24）に記載の情報信号のエラー
の検出訂正方法において、確率Ｐ（W₁｜W₁）は0.999と見積られていることと、確率Ｐ（W₁｜W_c）は0.001/Mと見積られていることとを特徴とする情報信号のエラーの検出訂正方法。【請求項２６】請求項（14）に記載の情報信号のエラー
の検出訂正方法において、第２の出力はエラー表示であることを特徴とする情報信
号のエラーの検出訂正方法。【請求項２７】情報信号の入力ストリングW_iを与える手
段と、各情報信号は情報を表示することと、情報信号の候補ストリングW_cを形成するために、第１の
情報信号により表わされる情報とは異なつた情報を表わ
す第２の情報信号W₂を形成するように入力ストリング中
の第１の情報信号を変更する手段と、情報信号の入力ストリングの発生の確率Ｐ（W_i）を見積
る手段と、情報信号の候補ストリングの発生の確率Ｐ（W_c）を見積
る手段と、情報信号のストリングW_iとして情報信号の候補ストリン
グW_cによつて表わされた情報を誤つて表示する確率Ｐ
（W₁｜W_c）を見積る手段と、Ｐ（W_i）とＰ（W_c）Ｐ（W₁｜W_c）とを比較する手段と、若し、Ｐ（W_i）の値がＰ（W_c）Ｐ（W₁｜W_c）の値よりも
大きければ、第１の出力信号を出力し、そして若し、Ｐ
（W_i）の値がＰ（W_c）Ｐ（W₁｜W_c）の値よりも小さけれ
ば、第２の出力信号を出力する手段とからなる情報信号のエラー検出訂正装置。【請求項２８】請求項（27）に記載の情報信号のエラー
検出訂正装置において、第１の出力信号は情報信号の入力ストリングを含むこと
と、第２の出力信号は情報信号の候補ストリングを含むこと
と、第１の信号W₁として第２の情報信号W₂により表わされた
信号を誤つて表示する確率Ｐ（W₁｜W₂）として、確率Ｐ
（W_i｜W_c）が見積られることとを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項２９】請求項（28）に記載の情報信号のエラー
検出訂正装置において、各ワードがスペルを含むワードの組を記憶するデイクシ
ヨナリ手段と、情報信号の入力ストリング中の各情報信号はワードの複
数個の組である１つのワードを表わすことと、第２の情報信号W₂はワードの複数個の組である１つのワ
ードを表わし、第２の情報信号により表わされたワード
は第１の情報信号により表わされているワードとは異な
つていることとを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３０】請求項（29）に記載の情報信号のエラー
検出訂正装置において、情報信号の入力ストリングW_i中のすべての情報信号によ
つて表わされた情報を正しく表わす確率Ｐ（W_i｜W_i）を
見積る手段と、積Ｐ（W_i）Ｐ（W_i｜W_i）と積Ｐ（W_c）Ｐ（W_i｜W_c）とを
比較する手段と、若し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）よ
りも大きければ、第１の出力信号を出力し、そして若
し、Ｐ（W_i）Ｐ（W_i｜W_i）がＰ（W_c）Ｐ（W_i｜W_c）より
も小さければ、第２の出力信号を発生する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３１】請求項（30）に記載の情報信号のエラー
検出訂正装置において、確率Ｐ（W_i｜W_i）は第１の情報信号W_iによつて表わされ
た情報を正しく表わす確率Ｐ（W₁｜W₁）として見積られ
ていることを特徴とする情報信号のエラー検出訂正装
置。【請求項３２】請求項（31）に記載の情報信号のエラー
検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更する手段が、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワードに１つの文字を付加する手段と、試案的なワードと１組のワードの各ワードとを比較する
手段と、若し、試案的なワードがワードの組の中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３３】請求項（31）に記載の情報信号のエラー
検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更する手段が、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワードから１つの文字を削除する手段
と、試案的なワードと１組のワードの各ワードとを比較する
手段と、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３４】第１の情報信号は少なくとも２つの文字
を有する１つのワードを表わしている請求項（31）に記
載の情報信号のエラー検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更する手段が、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワード中の少なくとも２つの文字を並べ
換える手段と、試案的なワードと１組のワードの各ワードとを比較する
手段と、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３３】第１の情報信号は少なくとも１つの文字
を有するワードを表わしている請求項（31）に記載の情
報信号のエラー検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更することが、試案的なワードを形成するために、第１の情報信号によ
つて表わされたワード中の１つの文字を置換する手段と、試案的なワードと１組のワードの各ワードとを比較する
手段と、若し、試案的なワードが１組のワード中の１つのワード
と一致したならば、第２の情報信号W₂として、試案的な
ワードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３６】請求項（31）に記載の情報信号のエラー
検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更する手段が、ワードの組の中のＭ個の異なつたワードの混同したグル
ープを識別する手段と、混同したグループ中の各ワードと第１の情報信号によつ
て表わされたワードとの間で相異するスペルの文字は２
個であることと、第２の情報信号W₂として、混同したグループ中の１つの
ワードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３７】請求項（31）に記載の情報信号のエラー
検出訂正装置において、第２の情報信号W₂を形成するために、第１の情報信号W₁
を変更することが、ワードの組の中のＭ個の異なつたワードの混同したグル
ープを識別する手段と、混同したグループ中の各ワードは第１の情報信号によつ
て表わされたワードと混同されていることと、第２の情報信号W₂として混同したグループ中の１つのワ
ードを表示する手段とを含むことを特徴とする情報信号のエラー検出訂正装
置。【請求項３８】請求項（37）に記載の情報信号のエラー
検出訂正装置において、確率Ｐ（W₁｜W₁）は0.999と見積られていることと、確率Ｐ（W₁｜W_c）は0.001/Mと見積られていることとを特徴とする情報信号のエラー検出訂正装置。【請求項３９】請求項（27）に記載の情報信号のエラー
検出訂正装置において、第２の出力はエラー表示であることを特徴とする情報信
号のエラー検出訂正装置。