JPH05135098A

JPH05135098A - 自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置

Info

Publication number: JPH05135098A
Application number: JP4123850A
Authority: JP
Inventors: Vliembergen Eduardus J W Van; エデユアルダス・ヨセフス・ウイリブローダス・フアン・フリームベルゲン; Louis M G Cremers; ルイス・マリエ・ジエラルダス・クレメルス; Robertus P E H Heemels; ロベルタス・ペトラス・エリザベス・ハベルタス・ヘーメルス
Original assignee: Oce Nederland BV
Current assignee: Canon Production Printing Netherlands BV
Priority date: 1991-05-16
Filing date: 1992-05-15
Publication date: 1993-06-01
Also published as: NL9100849A; EP0513918A1

Abstract

(57)【要約】【目的】本発明は、自然言語において構成されるセン
テンス中のエラーがコンピュータシステムによって訂正
される方法とこの方法を実行するために適した装置を提
供する。【構成】本発明は、自然言語において構成されるセン
テンス中のエラーがコンピュータシステムによって訂正
される方法に関する。この種のエラーはスペリングチェ
ッカによって検出され、この場合、スペリングコレクタ
が僅かに異なるスペリングを有する多数の置換ワードを
発生する。置換ワードによって不正確なワードを置き換
えた後に得られたセンテンスが、構文解析系によってパ
ーズされ、必要ならば、文法的に訂正される。結果的に
得られた正確なセンテンスがユーザによって行われるべ
き選択を提供するためにスクリーン上にディスプレイさ
れる。さらに本発明は、この方法のアプリケーションの
ための装置に関する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、自然言語において構成
されたセンテンス中のエラーをコンピュータシステムに
よって訂正する方法と、この種の方法を実行するために
適した装置とに関する。

【０００２】

【従来の技術及び発明が解決しようとする課題】この種
の方法は、一般にはセンテンス中のスペリングエラーを
有しているとして検出されたワードが訂正されるスペリ
ングチェッカの形式で用いられる。スペリングチェッカ
は多数の代替ワード形式を提供し、このワード形式は訂
正のための提案として用いられ得るが、その訂正の程度
はそれ程優れてはいない。この場合における一つの問題
は、いくつの代替ワードがスペリングチェッカによって
ユーザに合理的に提供され得るかという疑問である。代
替ワードが多数ある場合には、ユーザは多数の代替ワー
ドの中から直ぐに正確なワードを見つけられないだろう
し、一方、少しかない場合には、正確なワードが存在し
ないというかなりのリスクがある。さらに、スペリング
チェッカは、センテンスの各ワードが辞書に従って生じ
るセンテンス中の不正確なワードを文法的には検出しな
い。

【０００３】本発明の目的はこれらの問題の解決法を提
供することにある。この解決法は、訂正されるべきワー
ドを有しているセンテンスがパーズされる時に、訂正さ
れるべきワードが特定のワードカテゴリを有してなくて
はならないことが度々生じるという考えに基づく。この
ように、スペリングコレクタによって発生した代替ワー
ドの全てが、正確な構文解析（パーシング）を提供する
とは限らない。ユーザは、全然、又は殆どエラーのない
パーシングを有する代替センテンスとなる代替を提供さ
れるのみある。このことは代替ワードの数を大きく限定
する。

【０００４】

【課題を解決するための手段】本発明は、自然言語にお
いて構成されたセンテンスのエラーがコンピュータシス
テムによって訂正される方法であって、以下の連続した
段階、スペリングチェッカによってスペリングエラーを
探すために前記センテンスをチェックし、前記スペリン
グチェッカによってチェックされた前記センテンス中の
ワードのスペリングエラーの検出後に、供給された各セ
ンテンスを構文解析系によってパーシングすることを備
えており、前記センテンスのパーシングに関する前記段
階の前に、以下の段階、用語カテゴリによって語彙化さ
れたワードユニットを含んでおり、使用頻度によって決
定される頻度係数を具備しているワードメモリによっ
て、スペリングエラーを有しているとして検出されたワ
ードと僅かに異なるスペリングを有している置換ワード
と呼ばれる代替ワードのリストを発生し、前記頻度係数
に応じたシーケンスに前記置換ワードを配列し、シーケ
ンスに配列された多数の置換ワードを前記構文解析系に
提供し、これによって該構文解析系がこれらのワードに
関する代替センテンスに関連するパーシングを発生する
ことをさらに備えていることを特徴とする方法を提供す
る。

【０００５】上記の方法を実行するためのコンピュータ
システムが前記段階を実行するために用いられる。

【０００６】

【実施例】本発明は、添付図面によって説明される。

【０００７】図１Ａ〜図１Ｂは、本発明による、自然言
語で構成されたセンテンス中の言語エラーがコンピュー
タシステムにおいて訂正される方法を実行するためのフ
ローダイアグラムである。必要な場合には、このフロー
ダイアグラムの説明には図２が用いられるが、この図で
は、上記の方法の適切な実行に必要とされるコンピュー
タシステムのユニット及びモジュールが、簡略ブロック
形式で示されている。図１Ａのフローダイアグラムにお
いて、言語エラーがチェックされるセンテンスは、ステ
ップ３０の入力ユニット２（キーボード又はリーダ）に
よってコンピュータシステムに読み込まれ、次いでステ
ップ３２で語彙化される。

【０００８】センテンスの語彙化（lexicalization) の
間は、各ワードは、語い（lexical）メモリ又はワード
メモリ６を具備しているスペリングチェッカ４に送られ
る。メモリ６によって、スペリングチェッカ４は提供さ
れたワードが存在するかをチェックし、存在している場
合は、ワードは語いメモリ６から一つ又はそれ以上の用
語カテゴリ、又は一つ又はそれ以上のワードカテゴリ、
及びアプリケーション指示カテゴリに関連する一つ又は
それ以上のワード構造を受けとる。用語カテゴリ又はワ
ードカテゴリ及びアプリケーション指示カテゴリの項
は、欧州特許出願第0 361 570 号に記述されている。各
ワードのための全てのワード構造が集められ、リストメ
モリ８に書き込まれる。一つのワードがスペリングエラ
ーを有しており、これによって語いデータが全く入手で
きない場合は、エラーコードがこのワードに付加され、
その形式内に書き込まれる。

【０００９】上記のスペリングチェッカ４は、一般に公
知の種類であって、その関連するプログラムは、適切な
ソフトウェアによってコンピュータシステムに読み込ま
れ得るか、又はモジュラユニットによってコンピュータ
システムに導入され得るかのいずれかである。次のステ
ップ３４は、提供されたセンテンス中に少なくとも一つ
のスペリングエラーがあるかどうかという質問を取り扱
う。この質問の答えが肯定（Ｙ）である場合は、コンピ
ュータシステムのスペリングコレクタ１０は、エラーコ
ードが付与され、従ってスペリングエラーを有している
各ワードに代わる代用ワードとしても知られている、使
用可能な代替ワードをステップ３６のワードメモリ６で
検索する。スペリングエラーを有するワードに代わる使
用可能な代替ワードの項は、現行ワードから僅かに変化
しているスペリングを有するいかなるワードをも示して
いる。例として、不正確なオランダ語“ｂｅｒ”をあげ
るならば、可能性のある代替ワードは、“ｂｅｆ”（＝
ｂａｎｄｓ）、“ｂｅｎ”（＝ａｍ）、“ｂｅｋ”（＝
ｍｏｕｔｈ）、“ｂｅｌ”（＝ｒｉｎｇ／ｂｅｌｌ）、
“ｂｅｐ”（＝Ｃｈｒｉｓｔｉａｎｎａｍｅ）、“ｂ
ｅｄ”（＝ｂｅｄ）、“ｂｅｏ”（＝ｎａｍｅｏｆ
ｂｉｒｄ）、“ｂｅｓ”（＝ｂｅｒｒｙ）、“ｂａｒ”
（＝ｂａｒ）、“ｔｅｒ”（＝ａｔｔｈｅ）、“ｄｅ
ｒ”（＝ｏｆｔｈｅ）、“ｅｅｒ”（＝ｈｏｎｏｕ
ｒ）、“ｇｅｒ”（＝Ｃｈｒｉｓｔｉａｎｎａｍ
ｅ）、“ｏｅｒ”（＝ｂｏｇ−ｏｒｅ）、“ｐｅｒ”
（＝ｐｅｒ）、“ｖｅｒ”（＝ｆａｒ）、“ｂｅｒｋ”
（＝ｂｉｒｃｈ）、“ｂｅｒｇ”（＝ｍｏｕｎｔａｉ
ｎ）、“ｂｅｒｍ”（＝ｖｅｒｇｅ）、“ｏｂｅｒ”
（＝ｗａｉｔｅｒ）、“ｂｏｅｒ”（＝ｆａｒｍｅ
ｒ）、“ｂｉｅｒ”（＝ｂｅｅｒ）、“ｂｅｕｒ”（＝
ｌｉｆｔｕｐ）、及び“ｂｅｅｒ”（＝ｂｅａｒ）で
あり、さらに各ワードに対して、ワードカテゴリ及び／
又はアプリケーション指示カテゴリについての差異に注
意が払われるべきである。例えば、オランダ語のワード
“ｂｅｌ”はワードカテゴリの「動詞」と、別のワード
構造としてのワードカテゴリ「名詞」の両方を有してい
る。

【００１０】同様に、不正確なワード“ｂｅｒ”が英語
テキストに存在している場合は、可能性がある代替の英
語のワードは、“ｂｅｄ”、“ｂａｒ”、“ｂｅｅ
ｒ”、“ｂｅａｒ”、“ｈｅｒ”、“ｐｅｒ”“ｂｉｅ
ｒ”、“ｂｅ”、“ｂｅｅ”、“ｂｅｇ”、“ｂｅｒ
ｅ”、“ｂｅｔ”“ｂｅｙ”、“ｂｕｒ”、“ｂｅｒ
ｇ”及び“ｂｅｒｍ”である。

【００１１】種々のワード構造を有する一組の関連する
代替ワードが非常に広範であり得るだけでなく、ユーザ
は、そこから選択するために限定された供給内の代替ワ
ードに興味を示すだけなので、ワードメモリ６が有利と
なるために使用され、そこでは、各ワードが一つ又はそ
れ以上の関連するワードカテゴリ及びアプリケーション
指示ワードカテゴリを具備しているだけでなく、ワード
の使用頻度によって決定される特定の「頻度係数」をも
具備している。ワードの「頻度係数」の重要度は、この
係数が、そのワードの増大していく使用頻度に応じてよ
り高い値を有することにある。それぞれの使用頻度によ
って規定されるシーケンスにおいて、ワードメモリ６の
中で選択される関連するワード構造を用いて代替ワード
を形成し、次いでセンテンスの他のワードと関連するワ
ード構造と共にリストメモリ８にそれらを記憶させるこ
とが、主として使用されるワードとのワードコンビネー
ションが、不正確なワードの置換における使用可能性を
チェックするために、スペリングエラーを有するワード
の代替として実際的に最初に提供されるという効果を有
する。ステップ３２及びステップ３６を別々に実行する
代わりに、スペリングエラーを検出する時にこれを同時
に行うことも可能である。次いでプログラムは、リスト
メモリ８の各ワードコンビネーションが既にチェックさ
れたかどうかの質問が答えられるステップ４０へと進
む。

【００１２】ステップ４０の質問の答が否定（Ｎ）であ
り、従ってセンテンスに関するより多くのワードコンビ
ネーションがある場合は、他のワード構造を用いても用
いなくても、プログラムはステップ４２へ進む。

【００１３】ステップ４２では、新しい代替ワードが、
センテンスの他のワードと組み合わされて、示されてい
るシーケンスのリストメモリ８から反復して引き出され
る。次のステップ４４では、このようにして形成された
ワードコンビネーションがスクリーン１４上のディスプ
レイのために表示メモリ１２に既に書き込まれたかどう
か質問される。例えば、既に取り扱われており、本来他
の代替ワードを有しているワードコンビネーションがパ
ーシング及び訂正の操作において最終的に訂正された代
替センテンスを生じ、次いでこのセンテンスが現在処理
中のワードコンビネーションのセンテンスと一致してい
ることが可能である。オランダ語の代替ワード“ｗｏｒ
ｄｔ”及び“ｗｏｒｄ”が、不正確なワード“ｗｏｒ
ｔ”に代わって与えられ、ワード“ｗｏｒｄｔ”がワー
ド“ｗｏｒｄ”よりも高い頻度係数が与えられると仮定
しましょう。“ｉｋｗｏｒｄｔｚｉｅｋ”と形成さ
れる最初のコンビネーションをチェックする場合には、
このコンビネーションは、訂正されたセンテンス“ｉｋ
ｗｏｒｄｚｉｅｋ”を最終的に生じる。このセンテ
ンスは、次いでスクリーン１４にディスプレイするため
に表示メモリ１２に書き込まれる。この後、次いで形成
されるワードコンビネーション“ｉｋｗｏｒｄｚｉ
ｅｋ”はもはやチェックを必要としない。

【００１４】同じことが誤った英語のセンテンス、“Ｉ
ｆａｌｓｉｌｌ”に生じ、これには、英語の代替ワ
ード“ｆａｌｌｓ”及び“ｆａｌｌ”が、ワード“ｆａ
ｌｓ”の代用として与えられる。第１のコンビネーショ
ン“Ｉｆａｌｌｓｉｌｌ”が正確なセンテンス“Ｉ
ｆａｌｌｉｌｌ”を生じる。このため次いで形成さ
れるべきコンビネーション“Ｉｆａｌｌｉｌｌ”
は、もはやチェックを必要としない。

【００１５】ステップ４４の質問の答が肯定（Ｙ）であ
る場合は、形成されたワードコンビネーションがステッ
プ４６で削除され、プログラムは、新しいワードコンビ
ネーションが形成されるのを可能にするためにステップ
４０に戻る。しかし、ステップ４４の質問の答が否定
（Ｎ）である場合は、形成されたワードコンビネーショ
ンは、次いでステップ４８のパーシングモジュール１６
に提供される。これらのセンテンスをパーズするために
パーシングモジュール１６が有利となるために使用さ
れ、このパーシングモジュール１６では、ワードはこの
ケースにおいて用いられるワードメモリ６によって語彙
化されており、関連する一つ又はそれ以上のワードカテ
ゴリ及びアプリケーション指示カテゴリが共に各ワード
に付加されている。このように操作するパーシングモジ
ュール１６は、上記の欧州特許出願から公知である。ア
プリケーション指示カテゴリによるパーシングに適さな
いパーシングモジュールはあまり効果的でない場合が多
いが、他のパーシングモジュールもここに使用すること
ができる。

【００１６】ワードコンビネーションがステップ４８で
パーズされる時はいつでも、ステップ４４によって行わ
れた時に提供されたワードコンビネーションのパーシン
グがエラーフリーパーシングを生じたかどうかについ
て、ステップ５０で質問される。この質問の答が肯定
（Ｙ）である場合は、ワードコンビネーションは、次の
ステップ５２で表示メモリ１２に書き込まれる。

【００１７】このプログラムは次いでステップ５４に進
み、チェックされたコンビネーションがオリジナルセン
テンスに一致するかどうかについて質問される。肯定
（Ｙ）の場合は、プログラムはステップ５６に進み、そ
こで表示メモリ１２からのワードコンビネーションがス
クリーン１４にディスプレイされる。ステップ５４の質
問の答が否定（Ｎ）である場合は、プログラムはステッ
プ５８に進み、そこで予め決められた数の代替センテン
スが既に表示メモリ１２に書き込まれたかどうかについ
ての質問について返答される。ステップ５８の質問の答
が肯定（Ｙ）である場合は、プログラムは直接ステップ
５６に進み、そこで表示メモリ１２に記憶されている、
一つ又はそれ以上のセンテンス（又は関連の代替ワード
及び／又はこれらのワードの訂正されたバージョンの
み）がスクリーン１４にディスプレイされる。必要なら
ば、ユーザはそこから入手可能な最良の代替としてワー
ドを選択することができる。また該当するワード又はそ
のワードに関連する語幹（ワードステム）が最後に用い
られた時には、テキストの「発見」動作によって関連の
代替ワードの群から各ワードを検索することによって、
装置に選択させることも可能である。従ってテキストの
最も新しいワードとして生じる代替ワードがベストチョ
イスとして見なされるべきである。

【００１８】ステップ５８の質問の答が否定（Ｎ）であ
り、これによって表示メモリ１２が部分的にしか満たさ
れない場合は、プログラムはステップ４０に戻る。

【００１９】ステップ５０の質問の答が否定（Ｎ）であ
る場合は、プログラムはステップ６０に進み、そこでス
テップ４８で実行されたパーシングが予め決められたし
きい値より低い確率係数値を生じたかどうかについて質
問される。この質問の答が肯定（Ｙ）であるならば、プ
ログラムはステップ４６に進み、そこでワードコンビネ
ーションが削除され、プログラムはステップ４０に戻
る。

【００２０】ステップ６０の質問の答が否定（Ｎ）であ
る場合は、プログラムはステップ６６に進み、そこでワ
ードコンビネーションのパーシングがエラー表示を示し
たかどうかについて質問される。構文解析系が、例え
ば、“ｉｋｗｏｏｒｄｚｉｅｋ”（英語：“Ｉｗ
ｏｒｄｉｌｌ”）、又は“ｉｋｂｅｌｚｏｅｋ”
（英語：“Ｉｒｉｎｇｍｉｓｓｉｎｇ”）のセンテ
ンスと同様に、ステップ４８で供給されたワードコンビ
ネーションを全く処理することができないことは常時可
能である。英語の同様の例を示すセンテンスは、“Ｉ
ｆｕｌｌａｌｌ”及び“Ｉｔｈａｌｌｉｌｌ”で
ある。

【００２１】ステップ６６の質問の答が肯定（Ｙ）であ
る場合は、次のステップ６８で、ワードコンビネーショ
ンは文法的に不正確なセンテンスを訂正するためのモジ
ュールに送られる。この種のモジュールの可能な実施例
は、上記の欧州特許出願に記述されている。上記の訂正
モジュール１８はアプリケーション指示カテゴリに関す
るデータを利用する。このワードコンビネーションがス
テップ６８で訂正を受けた後に、訂正されたワードコン
ビネーションが表示メモリに既に書き込まれたかどうか
についてステップ７０で質問される。この質問の答が肯
定（Ｙ）である場合は、次のステップ４６でワードコン
ビネーションが削除され、プログラムがステップ４０に
戻る。この質問の答が否定（Ｎ）である場合は、ステッ
プ５２では、上記のセンテンスは書き込みのために表示
メモリ１２に送られる。予め決められた数のワードコン
ビネーションがこのメモリ１２に書き込まれた後に、あ
るいはリストメモリ８にこれ以上のワード構造が存在し
ない場合に、センテンスの数、又は関連する代替ワー
ド、又は関連する訂正されたワードがステップ５６のス
クリーンにディスプレイされる。

【００２２】ステップ６６の質問の答が否定（Ｎ）であ
ることは、ユーザが、構文解析系がステップ４８におい
ていかなるパーシングをも供給できないワードコンビネ
ーションを取り扱うことを意味するので、プログラムは
ステップ４６を通ってステップ４０に進む。ステップ４
０の質問の答が肯定（Ｙ）であり、これによってリスト
メモリ８で発生する新しいワードコンビネーションが存
在しない場合は、プログラムはステップ６２に進み、そ
こで表示メモリ１２が空かどうかについて質問される。
この質問の答が否定（Ｎ）である場合は、プログラムは
ステップ５６に進み、そこで表示メモリ１２の内容がス
クリーン１４にディスプレイされる。ステップ６２の質
問の答が肯定（Ｙ）である場合は、ステップ７２が次に
続き、そこでは、しかし低しきい値を有する手続きをユ
ーザがリピートしたいかどうかについてユーザが答える
べき質問がスクリーンに示される。低しきい値の場合に
は、ステップ６０の後に、いくつかのワードコンビネー
ションに関するプログラムがステップ６６によって継続
されることも当然可能である。ユーザが肯定応答キー
（Ｙ）を押した場合は、プログラムはステップ３６に戻
り、手続きがリピートされるが低しきい値を有する。ユ
ーザが否定応答キー（Ｎ）を押した場合は、図１Ｂに示
されるように、プログラムはステップ６４に進む。プロ
グラムが自動的にステップ６４に進むように、ステップ
７２を完全に省略することも可能である。ステップ６４
では、（ステップ３６の）スペリングコレクタ１０が、
このセンテンスからの各オリジナルワード（即ち、エラ
ーコードなしの各ワード）に対して置換されるべき実ワ
ードから僅かなスペリングの変形を有する多数の代替ワ
ードを選択する。しかしながら、これらの代替ワードに
関連する全てのワード構造の全ての可能なコンビネーシ
ョンからワードコンビネーションを作成し、それを正確
かどうかチェックし、かつ必要に応じて訂正することは
実行不可能である。これは相当のコンピュータ処理時間
を必要とするだけでなく、相当の記憶容量をも必要とす
る。これに対して、各ワードについて、同じワードカテ
ゴリ及び同じアプリケーション指示カテゴリを有する多
数の代替ワードが存在するかどうかをチェックすること
によって、文法訂正のためにチェックされる、可能性の
あるワードコンビネーションの数を減少させることは比
較的可能である。従って、同じワードカテゴリ及び同じ
アプリケーション指示カテゴリを有するこの種の代替ワ
ードの群から代表的なものを一つ取り出すことによって
達成される効果は、パーシング及びチェッキングのため
に必要とされるワードコンビネーションの数が大幅に減
少することにある。このチェックの終了の時に、正確な
解決は、適正な解決を検索することにおいて無視解決を
も考慮にいれるべきである。従ってセンテンス中の各ワ
ードに関連する上記操作をステップ６４で実行するため
には、ワードカテゴリ及び／又はアプリケーション指示
カテゴリにおいて互いに異なるワード構造のみが、その
関連する組のワード構造から選択される。以下に説明さ
れるステップ７４を介して、プログラムはステップ７６
に進み、そこで、このように選択されたワード構造から
毎回新しいワードコンビネーションが形成され、次いで
ステップ７８においてこの種のコンビネーションが表示
メモリ１２に既に存在しているかどうかがチェックされ
る。この質問の答が肯定（Ｙ）である場合は、プログラ
ムはステップ８０に進み、そこでワードコンビネーショ
ンが削除される。次いでプログラムはステップ７４に戻
る。これに対してステップ７８の質問の答が否定（Ｎ）
である場合は、プログラムはステップ８２に進み、そこ
でワードコンビネーションはパーシングモジュール１６
によってパーズされる。各々の新しいワードコンビネー
ションは、ステップ８４でエラーフリーパーシングを発
生したかどうかについて判断される。ワードコンビネー
ションについてのこのチェックの答えが肯定（Ｙ）であ
る場合は、このワードコンビネーションはステップ８６
の補助メモリ２０に書き込まれ、この時、プログラムは
ステップ７４に戻る。ステップ７４では、他の使用され
ていないワードコンビネーションが形成され得るかどう
かについて質問する。この質問の答が肯定（Ｙ）である
場合は、プログラムはステップ７６に進む。この質問の
答が否定（Ｎ）である場合は、プログラムはステップ８
８に進む。

【００２３】ステップ８４でワードコンビネーションの
適したパーシングについての質問が否定（Ｎ）である場
合は、ステップ８０で現行のワードコンビネーションが
削除され、プログラムはステップ７４に戻る。ステップ
８８では、セレクションユニット２２によって、ステッ
プ３０で供給された最大量のワードコンビネーションの
オリジナルワードを有するワードコンビネーションが、
補助メモリ２０から選択される。この場合、他のワード
コンビネーションは削除される。

【００２４】ステップ９０では、スペリングコレクタ１
０が各々の選択されたワードコンビネーションの各ワー
ドに関して同じワードカテゴリ及びアプリケーション指
示カテゴリにおける代替ワードをワードメモリ６で連続
的に検索する。これらの代替ワードによって、ワードコ
ンビネーションが形成されかつ表示メモリ１２に書き込
まれ、次のステップ５６（図１Ａ）において、ユーザが
選択するようにスクリーンにディスプレイされる。この
場合、ディスプレイされるワードコンビネーションの数
があまりにも広範であるかもしれないので、関連するワ
ードがテキストに最後に現れる時をチェックするために
「発見」動作が実行され得る。これに基づいて、装置
は、それ自体が、提供されたコンビネーションから選択
し得る。表示メモリ１２がやはり使用可能な解決を含ま
ない場合には、そのことがスクリーンにディスプレイさ
れるべきである。書き込みセンテンスがステップ３２に
おいてスペリングチェッカ４によってチェックされた後
に、ステップ３４におけるスペリングエラーがあるかど
うかについての質問の答が否定（Ｎ）である場合は、こ
のセンテンスは文法的に不正確であるかもしれない。こ
の理由によってこの種のセンテンスは、ステップ４８の
パーシングモジュールに直接送られる。この条件では、
リストメモリは空のままである。

【００２５】図２に示されているユニットは、プログラ
ムに従ってコントロールユニット２４によって制御され
る。

【００２６】図３は、本発明による方法の一つの有利と
なる実施例に関するフローダイアグラムである。

【００２７】図１Ａ〜図１Ｂ、及び図３に同様の重要度
を有するプログラムステップについてはあまり詳細に説
明していない。図３のフローダイアグラムは、開始点Ｓ
で開始され、チェックされるセンテンスがステップ３０
の入力ユニット２によってコンピュータシステムに読み
込まれ、次いでステップ３２で語彙化される。次のステ
ップ３４は供給されたセンテンスに一つ以上のスペリン
グエラーがあるかどうかについての質問を処理する。こ
の質問の答が肯定（Ｙ）である場合は、次のステップ３
５でフラグ“ａ”がワードコンビネーションに付けら
れ、これによってプログラム実行中にこのワードコンビ
ネーションが、オリジナルセンテンスに一致しており、
一つ以上のスペリングエラーを有しているが、まだいか
なる訂正処理も受けていないワードコンビネーションで
あるとして認識されることが示される。フラグ“ａ”を
有するセンテンスに関する訂正動作は規制されるべきで
ある。このことは次の段階３６で、スペリングコレクタ
１０がそこに付加されたワードメモリ６を検索してエラ
ーコードを受けているこれらのワードに対して使用可能
な代替ワードのみを探すことを意味する。異なるワード
構造を有する一組の関連する代替ワードが非常に広範で
あるかもしれないので、関連するセンテンスが、文法的
な規制について正確な解決を提供するどうかを見るため
に、パーシング処理によって各代替ワードをチェックす
るのはしばしば時間を浪費する操作である。従ってパー
ズされるべきワードコンビネーションにいくつかの選択
を用いることはアドバイスできる。パーシングモジュー
ル１６が、用語カテゴリ及びアプリケーション指示カテ
ゴリにおいて一致している代替ワードによって、不正確
なワードが繰り返し置換されるセンテンス間の差異を見
つけないので、パーシングモジュールに必要とされるの
は、他のセンテンスのための文法的構造について表現し
ているセンテンスだけである。さらに、言語使用におい
て最も頻繁に生じる代替ワードは、一般にユーザによっ
て最終的に選択される最良の機会を与えるので、ステッ
プ３６で毎回有利となるために選択された代替ワード
は、最高頻度係数を有するワードである。このようにし
て選択された代替ワードのうち、センテンスの他のワー
ドに属しているワード構造と共に関連するワード構造が
リストメモリ８に記憶される。次のステップ４０は、リ
ストメモリ８からの各ワードコンビネーションがチェッ
クされたかどうかについての質問に答える。この質問の
答が否定（Ｎ）である場合は、プログラムはステップ４
２に進み、そこで新しいワードコンビネーションがリス
トメモリ８から読み取られる。次いでステップ４４で
は、このように形成されたワードコンビネーションが前
もって実行された訂正手続きの結果として、表示メモリ
１２に既に存在しているかどうかについて質問される。
この質問の答が肯定（Ｙ）である場合は、このワードコ
ンビネーションはステップ４６で削除され、プログラム
はまたステップ４０に進む。この質問の答が否定（Ｎ）
である場合は、パーシング手続きはステップ４８のワー
ドコンビネーションで実行される。スペリングエラーが
全くなくかつステップ３４の質問の答が否定（Ｎ）であ
るワードコンビネーションは、ステップ３８においてフ
ラグ“ｂ”を割り当てられた後にステップ４８でパーシ
ング手続きをも必要とする。ワードコンビネーションに
関するフラグ“ｂ”は、これがオリジナルセンテンスに
属するワードコンビネーションであることを示してい
る。ステップ５０では、ワードコンビネーションがエラ
ーフリーパーシングになったかどうかについて質問され
る。この質問の答が否定（Ｎ）である場合は、プログラ
ムはステップ６０に進み、そこでステップ４８において
実行されたパーシングが予め決められたしきい値より低
い確率係数値を生じたかどうかについて質問される。こ
の質問の答が肯定（Ｙ）である場合は、プログラムはス
テップ４６に進み、そこで現行のワードコンビネーショ
ンが削除され、次いでプログラムはステップ４０に戻
る。ステップ６０の質問の答が否定（Ｎ）である場合
は、プログラムはステップ６６に進み、そこでパーシン
グの間にワードコンビネーションにエラー表示が与えら
れたかどうかの質問の答えが得られる。この質問の答が
否定（Ｎ）である場合は、プログラムはステップ４６に
進む。最後の質問の答が肯定（Ｙ）である場合は、ワー
ドコンビネーションのための訂正モジュール１８による
訂正動作は論理的であり、次いで次のステップ６８で実
行される。プログラムは次いでステップ５４に進む。

【００２８】ステップ５０の質問の答が肯定（Ｙ）であ
る場合は、プログラムは、ステップ５４に進み、ワード
コンビネーションがフラグ“ｂ”を搬送しているかどう
かについての質問に答える。この質問の答が肯定（Ｙ）
である場合は、ワードコンビネーションがステップ５２
の表示メモリ１２に書き込まれる。この質問の答が否定
（Ｎ）である場合は、プログラムはステップ８４に進
む。このステップでは、解決スペースが拡大されるべき
であり、これは、他のワード構造が検索されるが、同じ
ワードカテゴリ及びアプリケーション指示カテゴリを有
するワードコンビネーション内のオリジナルでないワー
ド構造が検索されることを意味する。結果として得られ
るワードコンビネーションの中で、表示メモリ１２に既
に存在しているコンビネーションはステップ８０で削除
され、他のセンテンスがこのメモリに書き込まれる。こ
のプログラムは次いでステップ４０に戻る。ステップ４
０の質問の答が肯定（Ｙ）である場合は、プログラムは
ステップ６２に進み、そこで表示メモリ１２が空である
かどうかについて質問され、従って、解決は含まれてい
ない。

【００２９】この質問の答が否定（Ｎ）である場合は、
表示メモリ１２に記憶された解決スペースがステップ５
６のスクリーン１４にディスプレイされる。

【００３０】ステップ６２の質問の答が肯定（Ｙ）であ
り、これによって調査中のワードコンビネーションのた
めの解決がない場合は、次のステップ９２でこのワード
コンビネーションがフラグ“ａ”又は“ｂ”を搬送して
いるかどうかについて質問される。この質問の答が肯定
（Ｙ）である場合は、まだ各ワードに代わる一続きの代
替ワードを検索する可能性がある。誤って綴られたワー
ドに応答して、従って、フラグ“ａ”の存在に応答して
発生した各組の代替ワードは、このように取り扱われた
ままであることを意味する。一組の代替ワードがセンテ
ンスの他のワードの各ワードに代わって発生する。この
種の手続きがステップ３６のスペリングコレクタ１０に
認識され得るべきである。このために、一組の代替ワー
ドが各ワードに代わって発生されるセンテンスは、フラ
グ“ｃ”を具備していなければならず、これはステップ
９４で行われる。次いでプログラムはステップ３６に進
む。これに対してステップ９２の質問の答が否定（Ｎ）
である場合は、解決の可能性がなく、このことがスクリ
ーン１４でユーザに伝えられる。

【００３１】このように書き込まれたプログラムは多数
の不正確なセンテンスの例によって説明される。

【００３２】オランダ語の“ｉｋｗｏｒｄｔｚｉｅ
ｋ”（英語：“Ｉｆａｌｓｉｌｌ”）はステップ３
０の入力ユニット２によって読み込まれる。ステップ３
２では、スペリングチェッカ４はいかなるスペリングエ
ラーをも検出しないので、プログラムが最短経路によっ
てステップ３４からステップ４８へ進む。次いでセンテ
ンスがパーズされ、これがエラー表示及び確率係数の低
下を生じる。欧州特許出願第EP-A-0 361 570号に記述さ
れている構文解析系がこのために有利となるために用い
られ得る。

【００３３】このプログラムはセンテンスが訂正モジュ
ールによって訂正されるステップ５０、６０、６６を通
ってステップ６８に通過する。ここで再び、上記の欧州
特許出願に記述されたような訂正モジュールを用いるこ
とが有利である。次いでプログラムはステップ５２に進
み、そこでセンテンスが表示メモリ１２に書き込まれ
る。プログラムは次いでステップ５６に進み、そこで訂
正されたセンテンスがスクリーンにディスプレイされ
る。

【００３４】第２のオランダ語のセンテンスの例、“ｉ
ｋｗｏｒｔｚｉｅｋ”（英語：“Ｉｆａｌｓｉ
ｌｌ”）もステップ３０の入力ユニットによって読み込
まれる。スペリングチェッカ４は次のステップ３２で不
正確に綴られたワード“ｗｏｒｔ”を検出し、これによ
ってプログラムはステップ３４を通ってステップ３６へ
と通過し、さらにワードメモリ６から多数のオランダ語
の代替ワード、例えば“ｗｏｒｄｔ”（＝ｆａｌｌ
ｓ）、“ｗｏｒｄ”（＝ｆａｌｌ）、“ｋｏｒｔ”（＝
ｓｈｏｒｔ）、“ｍｏｒｔ”（＝ｇｒｕｍｂｌｅｓ）、
及び“ｐｏｒｔ”（＝ｐｏｋｅｓ）をリストメモリ８に
書き込むために選択する。プログラムはステップ４０を
通ってステップ４２へ進み、そこで第１の代替センテン
ス、“ｉｋｗｏｒｄｔｚｉｅｋ”（英語：“Ｉｆａ
ｌｌｓｉｌｌ”）が形成される。このセンテンスは次
いでステップ４８でパーズされる。ワード“ｗｏｒｄ
ｔ”（＝ｆａｌｌｓ）に関するセンテンス中の文法的エ
ラーの結果として、このセンテンスはエラー表示、及び
１より下の確率係数が与えられる。プログラムはステッ
プ５０を通ってステップ６０へ進む。割り当てられた確
率係数がしきい値よりも低い場合は、プログラムはステ
ップ４６に進み、そこでセンテンスが削除される。次い
でプログラムはステップ４０に戻り、第２の代替センテ
ンスを形成する。確率係数がしきい値よりも高い場合
は、プログラムはステップ６６を通ってステップ６８へ
進み、そこでこのセンテンスが“ｉｋｗｏｒｄｚｉ
ｅｋ”（英語：“Ｉｆａｌｌｉｌｌ”）に訂正さ
れ、次いでステップ５２の表示メモリ１２に書き込まれ
る。プログラムは次いでステップ４０に戻り、次いでス
テップ４２で第２の代替センテンス、“ｉｋｗｏｒｄ
ｚｉｅｋ”（英語：“Ｉｆａｌｌｉｌｌ”）が形
成される。しかしながらステップ４４では、このセンテ
ンスが既に表示メモリに書き込まれており、これによっ
て第２の代替センテンスが削除され、プログラムがステ
ップ４０に戻ることが確認される。ステップ４２では、
第３の代替センテンス、“ｉｋｋｏｒｔｚｉｅｋ”
（英語：“Ｉｓｈｏｒｔｉｌｌ”）が次いで形成さ
れる。この代替センテンスはステップ４８において構文
解析系によってパーズされ得ず、いかなるエラー表示も
与えられないが、調整された確率係数が与えられ、これ
は現行のしきい値より低い。

【００３５】プログラムはステップ５０を通ってステッ
プ６０へ、次いでステップ４６へ進み、そこで第３の代
替センテンスが削除される。プログラムは次いでステッ
プ４０へ戻り、そこで第４の代替センテンス、“ｉｋ
ｍｏｒｔｚｉｅｋ”（英語：“Ｉｇｒｕｍｂｌｅｓ
ｉｌｌ”）を形成する。この代替センテンスの他に
“ｉｋｐｏｒｔｚｉｅｋ”（英語：“Ｉｐｏｋｅ
ｓｉｌｌ”）も形成され、センテンス“ｉｋｋｏｒ
ｔｚｉｅｋ”（英語：“Ｉｓｈｏｒｔｉｌｌ”）
と同様に取扱われる。ステップ４０で代替ワードコンビ
ネーションがリストメモリ８に存在していないことが確
認された後に、プログラムはモードＹを通ってステップ
５６へ進む。

【００３６】同様の英語センテンスの例は、“Ｉｆａ
ｌｓｉｌｌ”であり、プログラムは多数の代替ワー
ド、例えば“ｆａｌｌｓ”、“ｆａｌｌ”、“ｆａｔ
ｓ”、及び“ｐａｌｓ”を選択する。

【００３７】図１Ａ〜図１Ｂに関して説明される、第３
のオランダ語のセンテンス例、“ｉｋｗｏｏｒｄｚ
ｉｅｋ”（英語：“Ｉｗｏｒｄｉｌｌ”）におい
て、スペリングエラーは全く検出されず、プログラムは
次いでステップ３４からステップ４８へ進む。構文解析
系はセンテンスをパーズすることができないため、プロ
グラムはステップ５０、６０、６６、４６、４０及び６
２を通ってステップ６４へ進む。スペリングコレクタ１
０は各ワードに代わる多数の代替ワードを選択する。

【００３８】ワード“ｉｋ”（＝Ｉ）は例として以下の
代替ワードを提供する。

【００３９】“ｕｋ”（＝ｌｉｔｔｌｅｍｉｔｅ）、
“ｆｉｋ”（＝ｆｉｒｅ）、“ｐｉｋ”（＝ｐｉｔｃ
ｈ）、“ｉｎ”（＝ｉｎ）、“ｌｉｋ”（＝ｌｉｃ
ｋ）、“ｂｉｋ”（＝ｃｈｉｐ）、“ｅｉｋ”（＝ｏａ
ｋ）、“ｔｉｋ”（＝ｔｏｕｃｈ）、“ｓｉｋ”（＝ｇ
ｏａｔ）、“ｈｉｋ”（＝ｈｉｃｃｕｐ）。

【００４０】ワード“ｗｏｏｒｄ”（＝ｗｏｒｄ）は以
下の代替ワードを提供する。

【００４１】“ｗｏｒｄ”（＝ｆａｌｌ）、“ｗｏｅｒ
ｄ”（＝ｄｒａｋｅ）、“ｍｏｏｒｄ”（＝ｍｕｒｄｅ
ｒ）、“ｎｏｏｒｄ”（＝ｎｏｒｔｈ）、“ｋｏｏｒ
ｄ”（＝ｃｏｒｄ）、“ｂｏｏｒｄ”（＝ｂｏｒｄｅ
ｒ）。

【００４２】さらにワード“ｚｉｅｋ”（＝ｉｌｌ）は
以下の代替ワードを生じる。

【００４３】“ｚｏｅｋ”（＝ｍｉｓｓｉｎｇ）、“ｒ
ｉｅｋ”（＝ｔｈｒｅｅｐｒｏｎｇｅｄｆｏｒｋ）、
“ｋｉｅｋ”（＝ｓｎａｐｓｈｏｔ）、“ｚｉｅｔ”
（＝ｓｅｅｓ）、“ｇｉｅｋ”（＝ｇｉｇ）、“ｐｉｅ
ｋ”（＝ｐｅａｋ）、“ｗｉｅｋ”（＝ｗｉｎｇ）。

【００４４】この点において、異なるワードカテゴリ及
び／又はアプリケーション指示カテゴリを有するワード
の表示のみが選択される。

【００４５】ワード“ｉｋ”（＝Ｉ）（固有名詞、第一
人称、単数）とは無関係に、“ｕｋ”（＝ｌｉｔｔｌｅ
ｍｉｔｅ）（名詞、男性、単数）、“ｉｎ”（＝ｉ
ｎ）（前置詞）、及び“ｂｉｋ”（＝ｃｈｉｐ）（動
詞、第一人称単数）も選択される。ワード“ｗｏｏｒ
ｄ”（＝ｗｏｒｄ）（名詞、中性、単数）とは無関係
に、“ｗｏｒｄｔ”（＝ｆａｌｌｓ）（動詞、第二及び
第三人称単数）、及び“ｗｏｅｒｄ”（＝ｄｒａｋｅ）
（名詞、男性、単数）も選択される。

【００４６】ワード“ｚｉｅｋ”（＝ｉｌｌ）（形容
詞、叙述名詞）とは無関係に、“ｚｏｅｋ”（＝ｍｉｓ
ｓｉｎｇ）（動詞、第一人称単数、形容詞、叙述名
詞）、及び“ｒｉｅｋ”（＝ｔｈｒｅｅｐｏｎｇｅｄ
ｆｏｒｋ）（名詞、男性、単数、動詞、第一人称単数）
も選択される。ステップ７６では、新しいワードコンビ
ネーションが毎回選択され、次いでパーシングのセンテ
ンスとしてステップ８２で構文解析系に提供される。構
文解析系が提供されたセンテンスのエラーフリーパーシ
ングを生じないことが毎回確認される。従ってこのセン
テンスはステップ８０で削除され、この場合、プログラ
ムはステップ７６の連続したワードコンビネーションを
選択するためにステップ７４に戻り、次いでステップ８
２でセンテンスとしてパーズされる。しかしながら、ス
テップ７６で形成されるコンビネーション、“ｉｋｗ
ｏｒｄｚｉｅｋ”（英語：“Ｉｆａｌｌｉｌ
ｌ”）は適切なパーシングを生じ、これによってステッ
プ８４のプログラムはステップ８６に進む。次いでこの
センテンスは補助メモリ２０に書き込まれる。次いでプ
ログラムは再びステップ７４へ進む。ステップ７４が新
しいワードコンビネーションが形成され得ないことを示
す場合は、プログラムは続いてステップ８８へ進む。こ
の場合、オリジナルセンテンスと共通の最大量のワード
を有するセンテンスが選択される。我々はこの場合一つ
のセンテンスにこだわるのみなので、このセンテンスは
選択されたままである。これによってステップ９０で
は、オリジナルでない各ワードに関して、このセンテン
スから同じワードカテゴリ及びアプリケーション指示カ
テゴリを有する代替ワードが集められる。他のセンテン
スがセンテンス“ｉｋｗｏｒｄｚｉｅｋ”（英語：
“Ｉｆａｌｌｉｌｌ”）とは完全に無関係ではない
のが発見される。

【００４７】最後のオランダ語のセンテンス例と同じ不
正確な英語のセンテンスは、“Ｉｔｆａｉｌｉｌｌ”
であるかもしれない。

【００４８】ワード“Ｉｔ”は以下の代替ワード、例え
ば、“Ｉ”、“Ｉｆ”、“Ｉｎ”、“Ｉｔｓ”、“Ｉ
ｓ”を提供する。ワード“ｆａｉｌ”は以下の代替ワー
ド、“ｆａｌｌ”、“ｆａｉｌｓ”、“ｈａｉｌ”、
“ｂａｉｌ”、“ｊａｉｌ”、“ｍａｉｌ”、“ｎａｉ
ｌ”、“ｐａｉｌ”、“ｒａｉｌ”、“ｓａｉｌ”、
“ｔａｉｌ”、“ｗａｉｌ”、及び“ｆｏｉｌ”を提供
する。ワード“ｉｌｌ”は、以下の代替ワード、“ａｌ
ｌ”、“ｆｉｌｌ”、“ｈｉｌｌ”、“ｋｉｌｌ”、
“ｍｉｌｌ”、“ｐｉｌｌ”、“ｒｉｌｌ”、“ｓｉｌ
ｌ”、“ｔｉｌｌ”、及び“ｗｉｌｌ”を提供する。

【００４９】ワード“ｉｔ”（代名詞：三人称単数、主
格、人称）とは無関係に、“Ｉ”（名詞：三人称単数、
可算、代名詞、非関係詞、非疑問詞）、“ｉｆ”（接続
詞）、“ｉｎ”（名詞：可算、三人称単数、前置詞、副
詞的小詞）、“ｉｔｓ”（形容詞：普通、副詞、語尾不
活用）、及び“ｉｓ”（動詞：三人称単数、助動詞、現
在形、自動詞）も選択される。

【００５０】ワード“ｆａｉｌ”（動詞：不定詞、主
格、現在形、三人称複数、二人称複数、一人称複数、二
人称単数、一人称単数、自動詞、他動詞、名詞：三人称
単数、不可算）とは無関係に、“ｆａｌｌ”（動詞：主
格、不定詞、現在形、三人称複数、二人称複数、一人称
複数、二人称単数、一人称単数、自動詞、名詞：可算、
三人称単数）、“ｆａｉｌｓ”（動詞：三人称単数、主
格、現在形、自動詞、他動詞）、“ｈａｉｌ”（動詞：
不定詞、主格、現在形、三人称複数、二人称複数、一人
称複数、二人称単数、一人称単数、自動詞、他動詞、名
詞：三人称単数、不可算、可算）、“ｊａｉｌ”（動
詞：主格、不定詞、現在形、三人称複数、二人称複数、
一人称複数、二人称単数、一人称単数、他動詞、名詞：
不可算、可算、三人称単数）、“ｎａｉｌ”（動詞：主
格、不定詞、現在形、三人称複数、二人称複数、一人称
複数、二人称単数、一人称単数、他動詞、名詞：可算、
三人称単数）、“ｐａｉｌ”（名詞：可算、三人称単
数）、及び“ｒａｉｌ”（動詞：不定詞、主格、現在
形、三人称複数、二人称複数、一人称複数、二人称単
数、一人称単数、自動詞、他動詞、名詞：可算、三人称
単数）も選択される。

【００５１】ワード“ｉｌｌ”（名詞：不可算、可算、
三人称単数、形容詞：普通、副詞、語尾不活用、副詞：
非関係詞、疑問詞）とは無関係に、“ａｌｌ”（名詞：
三人称単数、可算、形容詞：数量詞、普通、副詞：語尾
不活用、非関係詞、非疑問詞、代名詞：非関係詞、非疑
問詞、接頭辞）、“ｆｉｌｌ”（動詞：不定詞、主格、
現在形、三人称複数、二人称複数、一人称複数、二人称
単数、一人称単数、自動詞、他動詞、名詞：三人称単
数、不可算、可算）、“ｋｉｌｌ”（動詞：不定詞、主
格、現在形、三人称複数、二人称複数、一人称複数、二
人称単数、一人称単数、自動詞、他動詞、名詞：三人称
単数、可算）、“ｈｉｌｌ”（名詞：可算、三人称単
数）、“ｐｉｌｌ”（名詞：可算、三人称単数）、“ｔ
ｉｌｌ”（動詞：主格、不定詞、現在形、三人称複数、
二人称複数、一人称複数、二人称単数、一人称単数、他
動詞、名詞：可算、三人称単数、前置詞、接続詞）、及
び“ｗｉｌｌ”（動詞：不定詞、叙法詞、現在形、三人
称複数、二人称複数、一人称複数、三人称単数、二人称
単数、一人称単数、名詞：不可算、可算）も選択され
る。

【００５２】他のセンテンスが、センテンス“Ｉｆａ
ｌｌｉｌｌ”とは完全に無関係でないことが発見され
る。

【００５３】プログラムステップのカテゴリ及び特徴に
ついて完全な表現リストを含む必要はないことに注目さ
れてもよい。なぜならば、カテゴリ及び特徴に関連する
ポインタによってプログラムを実施することがより巧妙
である。上記において、完全な表現リストは本発明の明
確な説明を得るためのみに用いられる。

【００５４】上記例においては、オリジナルワードと一
文字異なるワードのみが用いられている。

【００５５】しかしながら、オリジナルワードと比較し
て二つの文字が相互変換されるワードと、オリジナルワ
ード（“ｈａｉｌ”及び“ｈａｌｅ”のごとき）の音の
関連性を有するワードを含むことも可能である。

【図面の簡単な説明】

【図１Ａ】自然言語で構成されたセンテンス中のエラ
ーがコンピュータシステムによって訂正され得る方法に
関するフローダイアグラムである。

【図１Ｂ】自然言語で構成されたセンテンス中のエラ
ーがコンピュータシステムによって訂正され得る方法に
関するフローダイアグラムである。

【図２】図１Ａ〜図１Ｂに示されているフローダイア
グラムを実行するために用いられるコンピュータシステ
ムを示す図である。

【図３】本発明による方法の一つの好ましい実施例に
関するフローダイアグラムである。

【符号の説明】

２入力ユニット４スペリングチェッカ６語いメモリ又はワードメモリ８リストメモリ１０スペリングコレクタ１２表示メモリ１４スクリーン１６パーシングモジュール１８訂正モジュール２０補助メモリ２２セレクションユニット２４コントロールユニット

フロントページの続き (72)発明者ルイス・マリエ・ジエラルダス・クレメルスオランダ国、5915・エー・エム・フエンロ、カシノウエヒ・44 (72)発明者ロベルタス・ペトラス・エリザベス・ハベルタス・ヘーメルスオランダ国、6043・イエー・エス・ロエルモンド、カステール・フエルダイネンストラート・７

Claims

【特許請求の範囲】

【請求項１】自然言語において構成されたセンテンス
のエラーがコンピュータシステムによって訂正される方
法であって、以下の連続した段階、スペリングエラーを
探すためにスペリングチェッカによって前記センテンス
をチェックし、前記スペリングチェッカによってチェッ
クされた前記センテンス中のワードのスペリングエラー
の検出後に、供給された各センテンスを構文解析系によ
ってパーシングすることを備えており、前記センテンス
のパーシングに関する前記段階の前に、以下の段階、用
語カテゴリによって語彙化されたワードユニットを含ん
でおり、使用頻度によって決定される頻度係数を具備し
ているワードメモリによって、スペリングエラーを有し
ているとして検出されたワードと僅かに異なるスペリン
グを有している置換ワードと呼ばれる代替ワードのリス
トを発生し、前記頻度係数に応じたシーケンスに前記置
換ワードを配列し、シーケンスに配列された多数の置換
ワードを前記構文解析系に提供し、これによって該構文
解析系がこれらのワードに関する代替センテンスに関連
するパーシングを発生することをさらに備えていること
を特徴とする方法。
【請求項２】自然言語において構成されたセンテンス
のエラーがコンピュータシステムによって訂正される方
法であって、前記センテンスのスペリングエラーがスペ
リングチェッカによって前もってチェックされ、ワード
がスペリングエラーを有するとして検出された場合に
は、前記ワードが請求項１に記載の方法によって訂正さ
れ、スペリングエラーを有するとして検出された前記ワ
ードの訂正後に文法的に不正確なセンテンスが存在して
いる場合には、実行されるべき以下の段階、前記ワード
と僅かに異なるスペリングを有する、置換ワードと呼ば
れる各ワードに代わる代替ワードのリストを発生し、前
記センテンス中の置換されるべき一つ又はそれ以上のワ
ードについて発生した置換ワードを用いて代替センテン
スを形成し、形成された前記代替センテンスを連続的に
パーズし、最良のパーシングを有する前記代替センテン
スを選択しかつディスプレイすることを備えていること
を特徴とする方法。
【請求項３】前記代替センテンスが、既にパーズされ
たセンテンスのワードカテゴリのコンビネーションと比
較して異なるワードカテゴリのコンビネーションを含ん
でいる場合のみに、前記代替センテンスのパーシングが
行われることを特徴とする請求項２に記載の方法。
【請求項４】前記ワードと関連したアプリケーション
指示カテゴリをチェックする間に、センテンスをパーズ
するために前記構文解析系が用いられ、エラー表示を搬
送するパーズされたセンテンスが訂正モジュールによっ
て訂正されることを特徴とする請求項３に記載の方法。
【請求項５】自然言語において構成されたセンテンス
中のエラーを訂正するのに適した装置であって、スペリ
ングエラーを探すためにセンテンスをチェックするため
のスペリングチェッカと、用語カテゴリによって語彙化
されたワードユニットを含み、かつ使用頻度によって決
定される頻度係数を具備しているワードメモリによっ
て、スペリングエラーを有しているとして検出されたワ
ードとは僅かに異なるスペリングを有している置換ワー
ドと呼ばれる代替ワードのリストを発生する手段と、ス
ペリングエラーとして検出されたワードが置換ワードに
よって置換される供給されたセンテンスをパーズするた
めの構文解析系とを具備していることを特徴とする装
置。
【請求項６】置換ワードと呼ばれる代替ワードのリス
トを発生するための前記手段が、用語カテゴリ又はアプ
リケーション指示カテゴリに関して互いに異なるこれら
の置換ワードを前記置換ワードから選択するために用い
られることを特徴とする請求項５に記載の装置。
【請求項７】置換ワードと呼ばれる代替ワードのリス
トを発生するための前記手段が、同じ用語カテゴリ及び
アプリケーション指示カテゴリを有するこれらの置換ワ
ードから最高頻度係数を有している前記置換ワードを選
択するためにも用いられることを特徴とする請求項６に
記載の装置。