JPH05135098A - 自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置 - Google Patents

自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置

Info

Publication number
JPH05135098A
JPH05135098A JP4123850A JP12385092A JPH05135098A JP H05135098 A JPH05135098 A JP H05135098A JP 4123850 A JP4123850 A JP 4123850A JP 12385092 A JP12385092 A JP 12385092A JP H05135098 A JPH05135098 A JP H05135098A
Authority
JP
Japan
Prior art keywords
word
sentence
words
spelling
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4123850A
Other languages
English (en)
Inventor
Vliembergen Eduardus J W Van
エデユアルダス・ヨセフス・ウイリブローダス・フアン・フリームベルゲン
Louis M G Cremers
ルイス・マリエ・ジエラルダス・クレメルス
Robertus P E H Heemels
ロベルタス・ペトラス・エリザベス・ハベルタス・ヘーメルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Production Printing Netherlands BV
Original Assignee
Oce Nederland BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oce Nederland BV filed Critical Oce Nederland BV
Publication of JPH05135098A publication Critical patent/JPH05135098A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 本発明は、自然言語において構成されるセン
テンス中のエラーがコンピュータシステムによって訂正
される方法とこの方法を実行するために適した装置を提
供する。 【構成】 本発明は、自然言語において構成されるセン
テンス中のエラーがコンピュータシステムによって訂正
される方法に関する。この種のエラーはスペリングチェ
ッカによって検出され、この場合、スペリングコレクタ
が僅かに異なるスペリングを有する多数の置換ワードを
発生する。置換ワードによって不正確なワードを置き換
えた後に得られたセンテンスが、構文解析系によってパ
ーズされ、必要ならば、文法的に訂正される。結果的に
得られた正確なセンテンスがユーザによって行われるべ
き選択を提供するためにスクリーン上にディスプレイさ
れる。さらに本発明は、この方法のアプリケーションの
ための装置に関する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語において構成
されたセンテンス中のエラーをコンピュータシステムに
よって訂正する方法と、この種の方法を実行するために
適した装置とに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】この種
の方法は、一般にはセンテンス中のスペリングエラーを
有しているとして検出されたワードが訂正されるスペリ
ングチェッカの形式で用いられる。スペリングチェッカ
は多数の代替ワード形式を提供し、このワード形式は訂
正のための提案として用いられ得るが、その訂正の程度
はそれ程優れてはいない。この場合における一つの問題
は、いくつの代替ワードがスペリングチェッカによって
ユーザに合理的に提供され得るかという疑問である。代
替ワードが多数ある場合には、ユーザは多数の代替ワー
ドの中から直ぐに正確なワードを見つけられないだろう
し、一方、少しかない場合には、正確なワードが存在し
ないというかなりのリスクがある。さらに、スペリング
チェッカは、センテンスの各ワードが辞書に従って生じ
るセンテンス中の不正確なワードを文法的には検出しな
い。
【0003】本発明の目的はこれらの問題の解決法を提
供することにある。この解決法は、訂正されるべきワー
ドを有しているセンテンスがパーズされる時に、訂正さ
れるべきワードが特定のワードカテゴリを有してなくて
はならないことが度々生じるという考えに基づく。この
ように、スペリングコレクタによって発生した代替ワー
ドの全てが、正確な構文解析(パーシング)を提供する
とは限らない。ユーザは、全然、又は殆どエラーのない
パーシングを有する代替センテンスとなる代替を提供さ
れるのみある。このことは代替ワードの数を大きく限定
する。
【0004】
【課題を解決するための手段】本発明は、自然言語にお
いて構成されたセンテンスのエラーがコンピュータシス
テムによって訂正される方法であって、以下の連続した
段階、スペリングチェッカによってスペリングエラーを
探すために前記センテンスをチェックし、前記スペリン
グチェッカによってチェックされた前記センテンス中の
ワードのスペリングエラーの検出後に、供給された各セ
ンテンスを構文解析系によってパーシングすることを備
えており、前記センテンスのパーシングに関する前記段
階の前に、以下の段階、用語カテゴリによって語彙化さ
れたワードユニットを含んでおり、使用頻度によって決
定される頻度係数を具備しているワードメモリによっ
て、スペリングエラーを有しているとして検出されたワ
ードと僅かに異なるスペリングを有している置換ワード
と呼ばれる代替ワードのリストを発生し、前記頻度係数
に応じたシーケンスに前記置換ワードを配列し、シーケ
ンスに配列された多数の置換ワードを前記構文解析系に
提供し、これによって該構文解析系がこれらのワードに
関する代替センテンスに関連するパーシングを発生する
ことをさらに備えていることを特徴とする方法を提供す
る。
【0005】上記の方法を実行するためのコンピュータ
システムが前記段階を実行するために用いられる。
【0006】
【実施例】本発明は、添付図面によって説明される。
【0007】図1A〜図1Bは、本発明による、自然言
語で構成されたセンテンス中の言語エラーがコンピュー
タシステムにおいて訂正される方法を実行するためのフ
ローダイアグラムである。必要な場合には、このフロー
ダイアグラムの説明には図2が用いられるが、この図で
は、上記の方法の適切な実行に必要とされるコンピュー
タシステムのユニット及びモジュールが、簡略ブロック
形式で示されている。図1Aのフローダイアグラムにお
いて、言語エラーがチェックされるセンテンスは、ステ
ップ30の入力ユニット2(キーボード又はリーダ)に
よってコンピュータシステムに読み込まれ、次いでステ
ップ32で語彙化される。
【0008】センテンスの語彙化(lexicalization) の
間は、各ワードは、語い(lexical)メモリ又はワード
メモリ6を具備しているスペリングチェッカ4に送られ
る。メモリ6によって、スペリングチェッカ4は提供さ
れたワードが存在するかをチェックし、存在している場
合は、ワードは語いメモリ6から一つ又はそれ以上の用
語カテゴリ、又は一つ又はそれ以上のワードカテゴリ、
及びアプリケーション指示カテゴリに関連する一つ又は
それ以上のワード構造を受けとる。用語カテゴリ又はワ
ードカテゴリ及びアプリケーション指示カテゴリの項
は、欧州特許出願第0 361 570 号に記述されている。各
ワードのための全てのワード構造が集められ、リストメ
モリ8に書き込まれる。一つのワードがスペリングエラ
ーを有しており、これによって語いデータが全く入手で
きない場合は、エラーコードがこのワードに付加され、
その形式内に書き込まれる。
【0009】上記のスペリングチェッカ4は、一般に公
知の種類であって、その関連するプログラムは、適切な
ソフトウェアによってコンピュータシステムに読み込ま
れ得るか、又はモジュラユニットによってコンピュータ
システムに導入され得るかのいずれかである。次のステ
ップ34は、提供されたセンテンス中に少なくとも一つ
のスペリングエラーがあるかどうかという質問を取り扱
う。この質問の答えが肯定(Y)である場合は、コンピ
ュータシステムのスペリングコレクタ10は、エラーコ
ードが付与され、従ってスペリングエラーを有している
各ワードに代わる代用ワードとしても知られている、使
用可能な代替ワードをステップ36のワードメモリ6で
検索する。スペリングエラーを有するワードに代わる使
用可能な代替ワードの項は、現行ワードから僅かに変化
しているスペリングを有するいかなるワードをも示して
いる。例として、不正確なオランダ語“ber”をあげ
るならば、可能性のある代替ワードは、“bef”(=
bands)、“ben”(=am)、“bek”(=
mouth)、“bel”(=ring/bell)、
“bep”(=Christian name)、“b
ed”(=bed)、“beo”(=name of
bird)、“bes”(=berry)、“bar”
(=bar)、“ter”(=at the)、“de
r”(=of the)、“eer”(=honou
r)、“ger”(=Christian nam
e)、“oer”(=bog−ore)、“per”
(=per)、“ver”(=far)、“berk”
(=birch)、“berg”(=mountai
n)、“berm”(=verge)、“ober”
(=waiter)、“boer”(=farme
r)、“bier”(=beer)、“beur”(=
lift up)、及び“beer”(=bear)で
あり、さらに各ワードに対して、ワードカテゴリ及び/
又はアプリケーション指示カテゴリについての差異に注
意が払われるべきである。例えば、オランダ語のワード
“bel”はワードカテゴリの「動詞」と、別のワード
構造としてのワードカテゴリ「名詞」の両方を有してい
る。
【0010】同様に、不正確なワード“ber”が英語
テキストに存在している場合は、可能性がある代替の英
語のワードは、“bed”、“bar”、“bee
r”、“bear”、“her”、“per”“bie
r”、“be”、“bee”、“beg”、“ber
e”、“bet”“bey”、“bur”、“ber
g”及び“berm”である。
【0011】種々のワード構造を有する一組の関連する
代替ワードが非常に広範であり得るだけでなく、ユーザ
は、そこから選択するために限定された供給内の代替ワ
ードに興味を示すだけなので、ワードメモリ6が有利と
なるために使用され、そこでは、各ワードが一つ又はそ
れ以上の関連するワードカテゴリ及びアプリケーション
指示ワードカテゴリを具備しているだけでなく、ワード
の使用頻度によって決定される特定の「頻度係数」をも
具備している。ワードの「頻度係数」の重要度は、この
係数が、そのワードの増大していく使用頻度に応じてよ
り高い値を有することにある。それぞれの使用頻度によ
って規定されるシーケンスにおいて、ワードメモリ6の
中で選択される関連するワード構造を用いて代替ワード
を形成し、次いでセンテンスの他のワードと関連するワ
ード構造と共にリストメモリ8にそれらを記憶させるこ
とが、主として使用されるワードとのワードコンビネー
ションが、不正確なワードの置換における使用可能性を
チェックするために、スペリングエラーを有するワード
の代替として実際的に最初に提供されるという効果を有
する。ステップ32及びステップ36を別々に実行する
代わりに、スペリングエラーを検出する時にこれを同時
に行うことも可能である。次いでプログラムは、リスト
メモリ8の各ワードコンビネーションが既にチェックさ
れたかどうかの質問が答えられるステップ40へと進
む。
【0012】ステップ40の質問の答が否定(N)であ
り、従ってセンテンスに関するより多くのワードコンビ
ネーションがある場合は、他のワード構造を用いても用
いなくても、プログラムはステップ42へ進む。
【0013】ステップ42では、新しい代替ワードが、
センテンスの他のワードと組み合わされて、示されてい
るシーケンスのリストメモリ8から反復して引き出され
る。次のステップ44では、このようにして形成された
ワードコンビネーションがスクリーン14上のディスプ
レイのために表示メモリ12に既に書き込まれたかどう
か質問される。例えば、既に取り扱われており、本来他
の代替ワードを有しているワードコンビネーションがパ
ーシング及び訂正の操作において最終的に訂正された代
替センテンスを生じ、次いでこのセンテンスが現在処理
中のワードコンビネーションのセンテンスと一致してい
ることが可能である。オランダ語の代替ワード“wor
dt”及び“word”が、不正確なワード“wor
t”に代わって与えられ、ワード“wordt”がワー
ド“word”よりも高い頻度係数が与えられると仮定
しましょう。“ik wordt ziek”と形成さ
れる最初のコンビネーションをチェックする場合には、
このコンビネーションは、訂正されたセンテンス“ik
word ziek”を最終的に生じる。このセンテ
ンスは、次いでスクリーン14にディスプレイするため
に表示メモリ12に書き込まれる。この後、次いで形成
されるワードコンビネーション“ik word zi
ek”はもはやチェックを必要としない。
【0014】同じことが誤った英語のセンテンス、“I
fals ill”に生じ、これには、英語の代替ワ
ード“falls”及び“fall”が、ワード“fa
ls”の代用として与えられる。第1のコンビネーショ
ン“I falls ill”が正確なセンテンス“I
fall ill”を生じる。このため次いで形成さ
れるべきコンビネーション“I fall ill”
は、もはやチェックを必要としない。
【0015】ステップ44の質問の答が肯定(Y)であ
る場合は、形成されたワードコンビネーションがステッ
プ46で削除され、プログラムは、新しいワードコンビ
ネーションが形成されるのを可能にするためにステップ
40に戻る。しかし、ステップ44の質問の答が否定
(N)である場合は、形成されたワードコンビネーショ
ンは、次いでステップ48のパーシングモジュール16
に提供される。これらのセンテンスをパーズするために
パーシングモジュール16が有利となるために使用さ
れ、このパーシングモジュール16では、ワードはこの
ケースにおいて用いられるワードメモリ6によって語彙
化されており、関連する一つ又はそれ以上のワードカテ
ゴリ及びアプリケーション指示カテゴリが共に各ワード
に付加されている。このように操作するパーシングモジ
ュール16は、上記の欧州特許出願から公知である。ア
プリケーション指示カテゴリによるパーシングに適さな
いパーシングモジュールはあまり効果的でない場合が多
いが、他のパーシングモジュールもここに使用すること
ができる。
【0016】ワードコンビネーションがステップ48で
パーズされる時はいつでも、ステップ44によって行わ
れた時に提供されたワードコンビネーションのパーシン
グがエラーフリーパーシングを生じたかどうかについ
て、ステップ50で質問される。この質問の答が肯定
(Y)である場合は、ワードコンビネーションは、次の
ステップ52で表示メモリ12に書き込まれる。
【0017】このプログラムは次いでステップ54に進
み、チェックされたコンビネーションがオリジナルセン
テンスに一致するかどうかについて質問される。肯定
(Y)の場合は、プログラムはステップ56に進み、そ
こで表示メモリ12からのワードコンビネーションがス
クリーン14にディスプレイされる。ステップ54の質
問の答が否定(N)である場合は、プログラムはステッ
プ58に進み、そこで予め決められた数の代替センテン
スが既に表示メモリ12に書き込まれたかどうかについ
ての質問について返答される。ステップ58の質問の答
が肯定(Y)である場合は、プログラムは直接ステップ
56に進み、そこで表示メモリ12に記憶されている、
一つ又はそれ以上のセンテンス(又は関連の代替ワード
及び/又はこれらのワードの訂正されたバージョンの
み)がスクリーン14にディスプレイされる。必要なら
ば、ユーザはそこから入手可能な最良の代替としてワー
ドを選択することができる。また該当するワード又はそ
のワードに関連する語幹(ワードステム)が最後に用い
られた時には、テキストの「発見」動作によって関連の
代替ワードの群から各ワードを検索することによって、
装置に選択させることも可能である。従ってテキストの
最も新しいワードとして生じる代替ワードがベストチョ
イスとして見なされるべきである。
【0018】ステップ58の質問の答が否定(N)であ
り、これによって表示メモリ12が部分的にしか満たさ
れない場合は、プログラムはステップ40に戻る。
【0019】ステップ50の質問の答が否定(N)であ
る場合は、プログラムはステップ60に進み、そこでス
テップ48で実行されたパーシングが予め決められたし
きい値より低い確率係数値を生じたかどうかについて質
問される。この質問の答が肯定(Y)であるならば、プ
ログラムはステップ46に進み、そこでワードコンビネ
ーションが削除され、プログラムはステップ40に戻
る。
【0020】ステップ60の質問の答が否定(N)であ
る場合は、プログラムはステップ66に進み、そこでワ
ードコンビネーションのパーシングがエラー表示を示し
たかどうかについて質問される。構文解析系が、例え
ば、“ik woord ziek”(英語:“I w
ord ill”)、又は“ik bel zoek”
(英語:“I ring missing”)のセンテ
ンスと同様に、ステップ48で供給されたワードコンビ
ネーションを全く処理することができないことは常時可
能である。英語の同様の例を示すセンテンスは、“I
full all”及び“It hall ill”で
ある。
【0021】ステップ66の質問の答が肯定(Y)であ
る場合は、次のステップ68で、ワードコンビネーショ
ンは文法的に不正確なセンテンスを訂正するためのモジ
ュールに送られる。この種のモジュールの可能な実施例
は、上記の欧州特許出願に記述されている。上記の訂正
モジュール18はアプリケーション指示カテゴリに関す
るデータを利用する。このワードコンビネーションがス
テップ68で訂正を受けた後に、訂正されたワードコン
ビネーションが表示メモリに既に書き込まれたかどうか
についてステップ70で質問される。この質問の答が肯
定(Y)である場合は、次のステップ46でワードコン
ビネーションが削除され、プログラムがステップ40に
戻る。この質問の答が否定(N)である場合は、ステッ
プ52では、上記のセンテンスは書き込みのために表示
メモリ12に送られる。予め決められた数のワードコン
ビネーションがこのメモリ12に書き込まれた後に、あ
るいはリストメモリ8にこれ以上のワード構造が存在し
ない場合に、センテンスの数、又は関連する代替ワー
ド、又は関連する訂正されたワードがステップ56のス
クリーンにディスプレイされる。
【0022】ステップ66の質問の答が否定(N)であ
ることは、ユーザが、構文解析系がステップ48におい
ていかなるパーシングをも供給できないワードコンビネ
ーションを取り扱うことを意味するので、プログラムは
ステップ46を通ってステップ40に進む。ステップ4
0の質問の答が肯定(Y)であり、これによってリスト
メモリ8で発生する新しいワードコンビネーションが存
在しない場合は、プログラムはステップ62に進み、そ
こで表示メモリ12が空かどうかについて質問される。
この質問の答が否定(N)である場合は、プログラムは
ステップ56に進み、そこで表示メモリ12の内容がス
クリーン14にディスプレイされる。ステップ62の質
問の答が肯定(Y)である場合は、ステップ72が次に
続き、そこでは、しかし低しきい値を有する手続きをユ
ーザがリピートしたいかどうかについてユーザが答える
べき質問がスクリーンに示される。低しきい値の場合に
は、ステップ60の後に、いくつかのワードコンビネー
ションに関するプログラムがステップ66によって継続
されることも当然可能である。ユーザが肯定応答キー
(Y)を押した場合は、プログラムはステップ36に戻
り、手続きがリピートされるが低しきい値を有する。ユ
ーザが否定応答キー(N)を押した場合は、図1Bに示
されるように、プログラムはステップ64に進む。プロ
グラムが自動的にステップ64に進むように、ステップ
72を完全に省略することも可能である。ステップ64
では、(ステップ36の)スペリングコレクタ10が、
このセンテンスからの各オリジナルワード(即ち、エラ
ーコードなしの各ワード)に対して置換されるべき実ワ
ードから僅かなスペリングの変形を有する多数の代替ワ
ードを選択する。しかしながら、これらの代替ワードに
関連する全てのワード構造の全ての可能なコンビネーシ
ョンからワードコンビネーションを作成し、それを正確
かどうかチェックし、かつ必要に応じて訂正することは
実行不可能である。これは相当のコンピュータ処理時間
を必要とするだけでなく、相当の記憶容量をも必要とす
る。これに対して、各ワードについて、同じワードカテ
ゴリ及び同じアプリケーション指示カテゴリを有する多
数の代替ワードが存在するかどうかをチェックすること
によって、文法訂正のためにチェックされる、可能性の
あるワードコンビネーションの数を減少させることは比
較的可能である。従って、同じワードカテゴリ及び同じ
アプリケーション指示カテゴリを有するこの種の代替ワ
ードの群から代表的なものを一つ取り出すことによって
達成される効果は、パーシング及びチェッキングのため
に必要とされるワードコンビネーションの数が大幅に減
少することにある。このチェックの終了の時に、正確な
解決は、適正な解決を検索することにおいて無視解決を
も考慮にいれるべきである。従ってセンテンス中の各ワ
ードに関連する上記操作をステップ64で実行するため
には、ワードカテゴリ及び/又はアプリケーション指示
カテゴリにおいて互いに異なるワード構造のみが、その
関連する組のワード構造から選択される。以下に説明さ
れるステップ74を介して、プログラムはステップ76
に進み、そこで、このように選択されたワード構造から
毎回新しいワードコンビネーションが形成され、次いで
ステップ78においてこの種のコンビネーションが表示
メモリ12に既に存在しているかどうかがチェックされ
る。この質問の答が肯定(Y)である場合は、プログラ
ムはステップ80に進み、そこでワードコンビネーショ
ンが削除される。次いでプログラムはステップ74に戻
る。これに対してステップ78の質問の答が否定(N)
である場合は、プログラムはステップ82に進み、そこ
でワードコンビネーションはパーシングモジュール16
によってパーズされる。各々の新しいワードコンビネー
ションは、ステップ84でエラーフリーパーシングを発
生したかどうかについて判断される。ワードコンビネー
ションについてのこのチェックの答えが肯定(Y)であ
る場合は、このワードコンビネーションはステップ86
の補助メモリ20に書き込まれ、この時、プログラムは
ステップ74に戻る。ステップ74では、他の使用され
ていないワードコンビネーションが形成され得るかどう
かについて質問する。この質問の答が肯定(Y)である
場合は、プログラムはステップ76に進む。この質問の
答が否定(N)である場合は、プログラムはステップ8
8に進む。
【0023】ステップ84でワードコンビネーションの
適したパーシングについての質問が否定(N)である場
合は、ステップ80で現行のワードコンビネーションが
削除され、プログラムはステップ74に戻る。ステップ
88では、セレクションユニット22によって、ステッ
プ30で供給された最大量のワードコンビネーションの
オリジナルワードを有するワードコンビネーションが、
補助メモリ20から選択される。この場合、他のワード
コンビネーションは削除される。
【0024】ステップ90では、スペリングコレクタ1
0が各々の選択されたワードコンビネーションの各ワー
ドに関して同じワードカテゴリ及びアプリケーション指
示カテゴリにおける代替ワードをワードメモリ6で連続
的に検索する。これらの代替ワードによって、ワードコ
ンビネーションが形成されかつ表示メモリ12に書き込
まれ、次のステップ56(図1A)において、ユーザが
選択するようにスクリーンにディスプレイされる。この
場合、ディスプレイされるワードコンビネーションの数
があまりにも広範であるかもしれないので、関連するワ
ードがテキストに最後に現れる時をチェックするために
「発見」動作が実行され得る。これに基づいて、装置
は、それ自体が、提供されたコンビネーションから選択
し得る。表示メモリ12がやはり使用可能な解決を含ま
ない場合には、そのことがスクリーンにディスプレイさ
れるべきである。書き込みセンテンスがステップ32に
おいてスペリングチェッカ4によってチェックされた後
に、ステップ34におけるスペリングエラーがあるかど
うかについての質問の答が否定(N)である場合は、こ
のセンテンスは文法的に不正確であるかもしれない。こ
の理由によってこの種のセンテンスは、ステップ48の
パーシングモジュールに直接送られる。この条件では、
リストメモリは空のままである。
【0025】図2に示されているユニットは、プログラ
ムに従ってコントロールユニット24によって制御され
る。
【0026】図3は、本発明による方法の一つの有利と
なる実施例に関するフローダイアグラムである。
【0027】図1A〜図1B、及び図3に同様の重要度
を有するプログラムステップについてはあまり詳細に説
明していない。図3のフローダイアグラムは、開始点S
で開始され、チェックされるセンテンスがステップ30
の入力ユニット2によってコンピュータシステムに読み
込まれ、次いでステップ32で語彙化される。次のステ
ップ34は供給されたセンテンスに一つ以上のスペリン
グエラーがあるかどうかについての質問を処理する。こ
の質問の答が肯定(Y)である場合は、次のステップ3
5でフラグ“a”がワードコンビネーションに付けら
れ、これによってプログラム実行中にこのワードコンビ
ネーションが、オリジナルセンテンスに一致しており、
一つ以上のスペリングエラーを有しているが、まだいか
なる訂正処理も受けていないワードコンビネーションで
あるとして認識されることが示される。フラグ“a”を
有するセンテンスに関する訂正動作は規制されるべきで
ある。このことは次の段階36で、スペリングコレクタ
10がそこに付加されたワードメモリ6を検索してエラ
ーコードを受けているこれらのワードに対して使用可能
な代替ワードのみを探すことを意味する。異なるワード
構造を有する一組の関連する代替ワードが非常に広範で
あるかもしれないので、関連するセンテンスが、文法的
な規制について正確な解決を提供するどうかを見るため
に、パーシング処理によって各代替ワードをチェックす
るのはしばしば時間を浪費する操作である。従ってパー
ズされるべきワードコンビネーションにいくつかの選択
を用いることはアドバイスできる。パーシングモジュー
ル16が、用語カテゴリ及びアプリケーション指示カテ
ゴリにおいて一致している代替ワードによって、不正確
なワードが繰り返し置換されるセンテンス間の差異を見
つけないので、パーシングモジュールに必要とされるの
は、他のセンテンスのための文法的構造について表現し
ているセンテンスだけである。さらに、言語使用におい
て最も頻繁に生じる代替ワードは、一般にユーザによっ
て最終的に選択される最良の機会を与えるので、ステッ
プ36で毎回有利となるために選択された代替ワード
は、最高頻度係数を有するワードである。このようにし
て選択された代替ワードのうち、センテンスの他のワー
ドに属しているワード構造と共に関連するワード構造が
リストメモリ8に記憶される。次のステップ40は、リ
ストメモリ8からの各ワードコンビネーションがチェッ
クされたかどうかについての質問に答える。この質問の
答が否定(N)である場合は、プログラムはステップ4
2に進み、そこで新しいワードコンビネーションがリス
トメモリ8から読み取られる。次いでステップ44で
は、このように形成されたワードコンビネーションが前
もって実行された訂正手続きの結果として、表示メモリ
12に既に存在しているかどうかについて質問される。
この質問の答が肯定(Y)である場合は、このワードコ
ンビネーションはステップ46で削除され、プログラム
はまたステップ40に進む。この質問の答が否定(N)
である場合は、パーシング手続きはステップ48のワー
ドコンビネーションで実行される。スペリングエラーが
全くなくかつステップ34の質問の答が否定(N)であ
るワードコンビネーションは、ステップ38においてフ
ラグ“b”を割り当てられた後にステップ48でパーシ
ング手続きをも必要とする。ワードコンビネーションに
関するフラグ“b”は、これがオリジナルセンテンスに
属するワードコンビネーションであることを示してい
る。ステップ50では、ワードコンビネーションがエラ
ーフリーパーシングになったかどうかについて質問され
る。この質問の答が否定(N)である場合は、プログラ
ムはステップ60に進み、そこでステップ48において
実行されたパーシングが予め決められたしきい値より低
い確率係数値を生じたかどうかについて質問される。こ
の質問の答が肯定(Y)である場合は、プログラムはス
テップ46に進み、そこで現行のワードコンビネーショ
ンが削除され、次いでプログラムはステップ40に戻
る。ステップ60の質問の答が否定(N)である場合
は、プログラムはステップ66に進み、そこでパーシン
グの間にワードコンビネーションにエラー表示が与えら
れたかどうかの質問の答えが得られる。この質問の答が
否定(N)である場合は、プログラムはステップ46に
進む。最後の質問の答が肯定(Y)である場合は、ワー
ドコンビネーションのための訂正モジュール18による
訂正動作は論理的であり、次いで次のステップ68で実
行される。プログラムは次いでステップ54に進む。
【0028】ステップ50の質問の答が肯定(Y)であ
る場合は、プログラムは、ステップ54に進み、ワード
コンビネーションがフラグ“b”を搬送しているかどう
かについての質問に答える。この質問の答が肯定(Y)
である場合は、ワードコンビネーションがステップ52
の表示メモリ12に書き込まれる。この質問の答が否定
(N)である場合は、プログラムはステップ84に進
む。このステップでは、解決スペースが拡大されるべき
であり、これは、他のワード構造が検索されるが、同じ
ワードカテゴリ及びアプリケーション指示カテゴリを有
するワードコンビネーション内のオリジナルでないワー
ド構造が検索されることを意味する。結果として得られ
るワードコンビネーションの中で、表示メモリ12に既
に存在しているコンビネーションはステップ80で削除
され、他のセンテンスがこのメモリに書き込まれる。こ
のプログラムは次いでステップ40に戻る。ステップ4
0の質問の答が肯定(Y)である場合は、プログラムは
ステップ62に進み、そこで表示メモリ12が空である
かどうかについて質問され、従って、解決は含まれてい
ない。
【0029】この質問の答が否定(N)である場合は、
表示メモリ12に記憶された解決スペースがステップ5
6のスクリーン14にディスプレイされる。
【0030】ステップ62の質問の答が肯定(Y)であ
り、これによって調査中のワードコンビネーションのた
めの解決がない場合は、次のステップ92でこのワード
コンビネーションがフラグ“a”又は“b”を搬送して
いるかどうかについて質問される。この質問の答が肯定
(Y)である場合は、まだ各ワードに代わる一続きの代
替ワードを検索する可能性がある。誤って綴られたワー
ドに応答して、従って、フラグ“a”の存在に応答して
発生した各組の代替ワードは、このように取り扱われた
ままであることを意味する。一組の代替ワードがセンテ
ンスの他のワードの各ワードに代わって発生する。この
種の手続きがステップ36のスペリングコレクタ10に
認識され得るべきである。このために、一組の代替ワー
ドが各ワードに代わって発生されるセンテンスは、フラ
グ“c”を具備していなければならず、これはステップ
94で行われる。次いでプログラムはステップ36に進
む。これに対してステップ92の質問の答が否定(N)
である場合は、解決の可能性がなく、このことがスクリ
ーン14でユーザに伝えられる。
【0031】このように書き込まれたプログラムは多数
の不正確なセンテンスの例によって説明される。
【0032】オランダ語の“ik wordt zie
k”(英語:“I fals ill”)はステップ3
0の入力ユニット2によって読み込まれる。ステップ3
2では、スペリングチェッカ4はいかなるスペリングエ
ラーをも検出しないので、プログラムが最短経路によっ
てステップ34からステップ48へ進む。次いでセンテ
ンスがパーズされ、これがエラー表示及び確率係数の低
下を生じる。欧州特許出願第EP-A-0 361 570号に記述さ
れている構文解析系がこのために有利となるために用い
られ得る。
【0033】このプログラムはセンテンスが訂正モジュ
ールによって訂正されるステップ50、60、66を通
ってステップ68に通過する。ここで再び、上記の欧州
特許出願に記述されたような訂正モジュールを用いるこ
とが有利である。次いでプログラムはステップ52に進
み、そこでセンテンスが表示メモリ12に書き込まれ
る。プログラムは次いでステップ56に進み、そこで訂
正されたセンテンスがスクリーンにディスプレイされ
る。
【0034】第2のオランダ語のセンテンスの例、“i
k wort ziek”(英語:“I fals i
ll”)もステップ30の入力ユニットによって読み込
まれる。スペリングチェッカ4は次のステップ32で不
正確に綴られたワード“wort”を検出し、これによ
ってプログラムはステップ34を通ってステップ36へ
と通過し、さらにワードメモリ6から多数のオランダ語
の代替ワード、例えば“wordt”(=fall
s)、“word”(=fall)、“kort”(=
short)、“mort”(=grumbles)、
及び“port”(=pokes)をリストメモリ8に
書き込むために選択する。プログラムはステップ40を
通ってステップ42へ進み、そこで第1の代替センテン
ス、“ikwordt ziek”(英語:“I fa
lls ill”)が形成される。このセンテンスは次
いでステップ48でパーズされる。ワード“word
t”(=falls)に関するセンテンス中の文法的エ
ラーの結果として、このセンテンスはエラー表示、及び
1より下の確率係数が与えられる。プログラムはステッ
プ50を通ってステップ60へ進む。割り当てられた確
率係数がしきい値よりも低い場合は、プログラムはステ
ップ46に進み、そこでセンテンスが削除される。次い
でプログラムはステップ40に戻り、第2の代替センテ
ンスを形成する。確率係数がしきい値よりも高い場合
は、プログラムはステップ66を通ってステップ68へ
進み、そこでこのセンテンスが“ik word zi
ek”(英語:“I fall ill”)に訂正さ
れ、次いでステップ52の表示メモリ12に書き込まれ
る。プログラムは次いでステップ40に戻り、次いでス
テップ42で第2の代替センテンス、“ik word
ziek”(英語:“I fall ill”)が形
成される。しかしながらステップ44では、このセンテ
ンスが既に表示メモリに書き込まれており、これによっ
て第2の代替センテンスが削除され、プログラムがステ
ップ40に戻ることが確認される。ステップ42では、
第3の代替センテンス、“ik kort ziek”
(英語:“I short ill”)が次いで形成さ
れる。この代替センテンスはステップ48において構文
解析系によってパーズされ得ず、いかなるエラー表示も
与えられないが、調整された確率係数が与えられ、これ
は現行のしきい値より低い。
【0035】プログラムはステップ50を通ってステッ
プ60へ、次いでステップ46へ進み、そこで第3の代
替センテンスが削除される。プログラムは次いでステッ
プ40へ戻り、そこで第4の代替センテンス、“ik
mort ziek”(英語:“I grumbles
ill”)を形成する。この代替センテンスの他に
“ik port ziek”(英語:“I poke
s ill”)も形成され、センテンス“ik kor
t ziek”(英語:“I short ill”)
と同様に取扱われる。ステップ40で代替ワードコンビ
ネーションがリストメモリ8に存在していないことが確
認された後に、プログラムはモードYを通ってステップ
56へ進む。
【0036】同様の英語センテンスの例は、“I fa
ls ill”であり、プログラムは多数の代替ワー
ド、例えば“falls”、“fall”、“fat
s”、及び“pals”を選択する。
【0037】図1A〜図1Bに関して説明される、第3
のオランダ語のセンテンス例、“ik woord z
iek”(英語:“I word ill”)におい
て、スペリングエラーは全く検出されず、プログラムは
次いでステップ34からステップ48へ進む。構文解析
系はセンテンスをパーズすることができないため、プロ
グラムはステップ50、60、66、46、40及び6
2を通ってステップ64へ進む。スペリングコレクタ1
0は各ワードに代わる多数の代替ワードを選択する。
【0038】ワード“ik”(=I)は例として以下の
代替ワードを提供する。
【0039】“uk”(=little mite)、
“fik”(=fire)、“pik”(=pitc
h)、“in”(=in)、“lik”(=lic
k)、“bik”(=chip)、“eik”(=oa
k)、“tik”(=touch)、“sik”(=g
oat)、“hik”(=hiccup)。
【0040】ワード“woord”(=word)は以
下の代替ワードを提供する。
【0041】“word”(=fall)、“woer
d”(=drake)、“moord”(=murde
r)、“noord”(=north)、“koor
d”(=cord)、“boord”(=borde
r)。
【0042】さらにワード“ziek”(=ill)は
以下の代替ワードを生じる。
【0043】“zoek”(=missing)、“r
iek”(=threepronged fork)、
“kiek”(=snapshot)、“ziet”
(=sees)、“giek”(=gig)、“pie
k”(=peak)、“wiek”(=wing)。
【0044】この点において、異なるワードカテゴリ及
び/又はアプリケーション指示カテゴリを有するワード
の表示のみが選択される。
【0045】ワード“ik”(=I)(固有名詞、第一
人称、単数)とは無関係に、“uk”(=little
mite)(名詞、男性、単数)、“in”(=i
n)(前置詞)、及び“bik”(=chip)(動
詞、第一人称単数)も選択される。 ワード“woor
d”(=word)(名詞、中性、単数)とは無関係
に、“wordt”(=falls)(動詞、第二及び
第三人称単数)、及び“woerd”(=drake)
(名詞、男性、単数)も選択される。
【0046】ワード“ziek”(=ill)(形容
詞、叙述名詞)とは無関係に、“zoek”(=mis
sing)(動詞、第一人称単数、形容詞、叙述名
詞)、及び“riek”(=threeponged
fork)(名詞、男性、単数、動詞、第一人称単数)
も選択される。ステップ76では、新しいワードコンビ
ネーションが毎回選択され、次いでパーシングのセンテ
ンスとしてステップ82で構文解析系に提供される。構
文解析系が提供されたセンテンスのエラーフリーパーシ
ングを生じないことが毎回確認される。従ってこのセン
テンスはステップ80で削除され、この場合、プログラ
ムはステップ76の連続したワードコンビネーションを
選択するためにステップ74に戻り、次いでステップ8
2でセンテンスとしてパーズされる。しかしながら、ス
テップ76で形成されるコンビネーション、“ik w
ord ziek”(英語:“I fall il
l”)は適切なパーシングを生じ、これによってステッ
プ84のプログラムはステップ86に進む。次いでこの
センテンスは補助メモリ20に書き込まれる。次いでプ
ログラムは再びステップ74へ進む。ステップ74が新
しいワードコンビネーションが形成され得ないことを示
す場合は、プログラムは続いてステップ88へ進む。こ
の場合、オリジナルセンテンスと共通の最大量のワード
を有するセンテンスが選択される。我々はこの場合一つ
のセンテンスにこだわるのみなので、このセンテンスは
選択されたままである。これによってステップ90で
は、オリジナルでない各ワードに関して、このセンテン
スから同じワードカテゴリ及びアプリケーション指示カ
テゴリを有する代替ワードが集められる。他のセンテン
スがセンテンス“ik word ziek”(英語:
“I fall ill”)とは完全に無関係ではない
のが発見される。
【0047】最後のオランダ語のセンテンス例と同じ不
正確な英語のセンテンスは、“Itfail ill”
であるかもしれない。
【0048】ワード“It”は以下の代替ワード、例え
ば、“I”、“If”、“In”、“Its”、“I
s”を提供する。ワード“fail”は以下の代替ワー
ド、“fall”、“fails”、“hail”、
“bail”、“jail”、“mail”、“nai
l”、“pail”、“rail”、“sail”、
“tail”、“wail”、及び“foil”を提供
する。ワード“ill”は、以下の代替ワード、“al
l”、“fill”、“hill”、“kill”、
“mill”、“pill”、“rill”、“sil
l”、“till”、及び“will”を提供する。
【0049】ワード“it”(代名詞:三人称単数、主
格、人称)とは無関係に、“I”(名詞:三人称単数、
可算、代名詞、非関係詞、非疑問詞)、“if”(接続
詞)、“in”(名詞:可算、三人称単数、前置詞、副
詞的小詞)、“its”(形容詞:普通、副詞、語尾不
活用)、及び“is”(動詞:三人称単数、助動詞、現
在形、自動詞)も選択される。
【0050】ワード“fail”(動詞:不定詞、主
格、現在形、三人称複数、二人称複数、一人称複数、二
人称単数、一人称単数、自動詞、他動詞、名詞:三人称
単数、不可算)とは無関係に、“fall”(動詞:主
格、不定詞、現在形、三人称複数、二人称複数、一人称
複数、二人称単数、一人称単数、自動詞、名詞:可算、
三人称単数)、“fails”(動詞:三人称単数、主
格、現在形、自動詞、他動詞)、“hail”(動詞:
不定詞、主格、現在形、三人称複数、二人称複数、一人
称複数、二人称単数、一人称単数、自動詞、他動詞、名
詞:三人称単数、不可算、可算)、“jail”(動
詞:主格、不定詞、現在形、三人称複数、二人称複数、
一人称複数、二人称単数、一人称単数、他動詞、名詞:
不可算、可算、三人称単数)、“nail”(動詞:主
格、不定詞、現在形、三人称複数、二人称複数、一人称
複数、二人称単数、一人称単数、他動詞、名詞:可算、
三人称単数)、“pail”(名詞:可算、三人称単
数)、及び“rail”(動詞:不定詞、主格、現在
形、三人称複数、二人称複数、一人称複数、二人称単
数、一人称単数、自動詞、他動詞、名詞:可算、三人称
単数)も選択される。
【0051】ワード“ill”(名詞:不可算、可算、
三人称単数、形容詞:普通、副詞、語尾不活用、副詞:
非関係詞、疑問詞)とは無関係に、“all”(名詞:
三人称単数、可算、形容詞:数量詞、普通、副詞:語尾
不活用、非関係詞、非疑問詞、代名詞:非関係詞、非疑
問詞、接頭辞)、“fill”(動詞:不定詞、主格、
現在形、三人称複数、二人称複数、一人称複数、二人称
単数、一人称単数、自動詞、他動詞、名詞:三人称単
数、不可算、可算)、“kill”(動詞:不定詞、主
格、現在形、三人称複数、二人称複数、一人称複数、二
人称単数、一人称単数、自動詞、他動詞、名詞:三人称
単数、可算)、“hill”(名詞:可算、三人称単
数)、“pill”(名詞:可算、三人称単数)、“t
ill”(動詞:主格、不定詞、現在形、三人称複数、
二人称複数、一人称複数、二人称単数、一人称単数、他
動詞、名詞:可算、三人称単数、前置詞、接続詞)、及
び“will”(動詞:不定詞、叙法詞、現在形、三人
称複数、二人称複数、一人称複数、三人称単数、二人称
単数、一人称単数、名詞:不可算、可算)も選択され
る。
【0052】他のセンテンスが、センテンス“I fa
ll ill”とは完全に無関係でないことが発見され
る。
【0053】プログラムステップのカテゴリ及び特徴に
ついて完全な表現リストを含む必要はないことに注目さ
れてもよい。なぜならば、カテゴリ及び特徴に関連する
ポインタによってプログラムを実施することがより巧妙
である。上記において、完全な表現リストは本発明の明
確な説明を得るためのみに用いられる。
【0054】上記例においては、オリジナルワードと一
文字異なるワードのみが用いられている。
【0055】しかしながら、オリジナルワードと比較し
て二つの文字が相互変換されるワードと、オリジナルワ
ード(“hail”及び“hale”のごとき)の音の
関連性を有するワードを含むことも可能である。
【図面の簡単な説明】
【図1A】 自然言語で構成されたセンテンス中のエラ
ーがコンピュータシステムによって訂正され得る方法に
関するフローダイアグラムである。
【図1B】 自然言語で構成されたセンテンス中のエラ
ーがコンピュータシステムによって訂正され得る方法に
関するフローダイアグラムである。
【図2】 図1A〜図1Bに示されているフローダイア
グラムを実行するために用いられるコンピュータシステ
ムを示す図である。
【図3】 本発明による方法の一つの好ましい実施例に
関するフローダイアグラムである。
【符号の説明】
2 入力ユニット 4 スペリングチェッカ 6 語いメモリ又はワードメモリ 8 リストメモリ 10 スペリングコレクタ 12 表示メモリ 14 スクリーン 16 パーシングモジュール 18 訂正モジュール 20 補助メモリ 22 セレクションユニット 24 コントロールユニット
フロントページの続き (72)発明者 ルイス・マリエ・ジエラルダス・クレメル ス オランダ国、5915・エー・エム・フエン ロ、カシノウエヒ・44 (72)発明者 ロベルタス・ペトラス・エリザベス・ハベ ルタス・ヘーメルス オランダ国、6043・イエー・エス・ロエル モンド、カステール・フエルダイネンスト ラート・7

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 自然言語において構成されたセンテンス
    のエラーがコンピュータシステムによって訂正される方
    法であって、以下の連続した段階、スペリングエラーを
    探すためにスペリングチェッカによって前記センテンス
    をチェックし、前記スペリングチェッカによってチェッ
    クされた前記センテンス中のワードのスペリングエラー
    の検出後に、供給された各センテンスを構文解析系によ
    ってパーシングすることを備えており、前記センテンス
    のパーシングに関する前記段階の前に、以下の段階、用
    語カテゴリによって語彙化されたワードユニットを含ん
    でおり、使用頻度によって決定される頻度係数を具備し
    ているワードメモリによって、スペリングエラーを有し
    ているとして検出されたワードと僅かに異なるスペリン
    グを有している置換ワードと呼ばれる代替ワードのリス
    トを発生し、前記頻度係数に応じたシーケンスに前記置
    換ワードを配列し、シーケンスに配列された多数の置換
    ワードを前記構文解析系に提供し、これによって該構文
    解析系がこれらのワードに関する代替センテンスに関連
    するパーシングを発生することをさらに備えていること
    を特徴とする方法。
  2. 【請求項2】 自然言語において構成されたセンテンス
    のエラーがコンピュータシステムによって訂正される方
    法であって、前記センテンスのスペリングエラーがスペ
    リングチェッカによって前もってチェックされ、ワード
    がスペリングエラーを有するとして検出された場合に
    は、前記ワードが請求項1に記載の方法によって訂正さ
    れ、スペリングエラーを有するとして検出された前記ワ
    ードの訂正後に文法的に不正確なセンテンスが存在して
    いる場合には、実行されるべき以下の段階、前記ワード
    と僅かに異なるスペリングを有する、置換ワードと呼ば
    れる各ワードに代わる代替ワードのリストを発生し、前
    記センテンス中の置換されるべき一つ又はそれ以上のワ
    ードについて発生した置換ワードを用いて代替センテン
    スを形成し、形成された前記代替センテンスを連続的に
    パーズし、最良のパーシングを有する前記代替センテン
    スを選択しかつディスプレイすることを備えていること
    を特徴とする方法。
  3. 【請求項3】 前記代替センテンスが、既にパーズされ
    たセンテンスのワードカテゴリのコンビネーションと比
    較して異なるワードカテゴリのコンビネーションを含ん
    でいる場合のみに、前記代替センテンスのパーシングが
    行われることを特徴とする請求項2に記載の方法。
  4. 【請求項4】 前記ワードと関連したアプリケーション
    指示カテゴリをチェックする間に、センテンスをパーズ
    するために前記構文解析系が用いられ、エラー表示を搬
    送するパーズされたセンテンスが訂正モジュールによっ
    て訂正されることを特徴とする請求項3に記載の方法。
  5. 【請求項5】 自然言語において構成されたセンテンス
    中のエラーを訂正するのに適した装置であって、スペリ
    ングエラーを探すためにセンテンスをチェックするため
    のスペリングチェッカと、用語カテゴリによって語彙化
    されたワードユニットを含み、かつ使用頻度によって決
    定される頻度係数を具備しているワードメモリによっ
    て、スペリングエラーを有しているとして検出されたワ
    ードとは僅かに異なるスペリングを有している置換ワー
    ドと呼ばれる代替ワードのリストを発生する手段と、ス
    ペリングエラーとして検出されたワードが置換ワードに
    よって置換される供給されたセンテンスをパーズするた
    めの構文解析系とを具備していることを特徴とする装
    置。
  6. 【請求項6】 置換ワードと呼ばれる代替ワードのリス
    トを発生するための前記手段が、用語カテゴリ又はアプ
    リケーション指示カテゴリに関して互いに異なるこれら
    の置換ワードを前記置換ワードから選択するために用い
    られることを特徴とする請求項5に記載の装置。
  7. 【請求項7】 置換ワードと呼ばれる代替ワードのリス
    トを発生するための前記手段が、同じ用語カテゴリ及び
    アプリケーション指示カテゴリを有するこれらの置換ワ
    ードから最高頻度係数を有している前記置換ワードを選
    択するためにも用いられることを特徴とする請求項6に
    記載の装置。
JP4123850A 1991-05-16 1992-05-15 自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置 Pending JPH05135098A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL9100849 1991-05-16
NL9100849A NL9100849A (nl) 1991-05-16 1991-05-16 Werkwijze voor het met behulp van een computersysteem corrigeren van een fout in een, in een natuurlijke taal gestelde zin, alsmede een inrichting geschikt voor het uitvoeren van deze werkwijze.

Publications (1)

Publication Number Publication Date
JPH05135098A true JPH05135098A (ja) 1993-06-01

Family

ID=19859252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4123850A Pending JPH05135098A (ja) 1991-05-16 1992-05-15 自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置

Country Status (3)

Country Link
EP (1) EP0513918A1 (ja)
JP (1) JPH05135098A (ja)
NL (1) NL9100849A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9300310A (nl) * 1993-02-19 1994-09-16 Oce Nederland Bv Inrichting en werkwijze voor syntactische signaal-analyse.
US6085206A (en) * 1996-06-20 2000-07-04 Microsoft Corporation Method and system for verifying accuracy of spelling and grammatical composition of a document

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage

Also Published As

Publication number Publication date
NL9100849A (nl) 1992-12-16
EP0513918A1 (en) 1992-11-19

Similar Documents

Publication Publication Date Title
US7853874B2 (en) Spelling and grammar checking system
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US5999896A (en) Method and system for identifying and resolving commonly confused words in a natural language parser
JP5538898B2 (ja) 言語分析
JPH07325824A (ja) 文法チェックシステム
JP2002288201A (ja) 質問応答処理方法,質問応答処理プログラム,質問応答処理プログラム記録媒体および質問応答処理装置
JPH0361220B2 (ja)
JPH079655B2 (ja) スペルの誤りの検出訂正方法及び装置
JP3794716B2 (ja) 単語を語形変化させる方法及びその方法を実行するデータ処理装置
JPH0351022B2 (ja)
JPH05135098A (ja) 自然言語で構成されたセンテンス中のエラーがコンピユータシステムによつて訂正される方法と、この方法を実行するために適した装置
GB2264186A (en) Database correction and conversion.
JPH08185393A (ja) 再実行システム及びその方法
EP0539965B1 (en) An electronic dictionary including a pointer file and a word information correction file
JPH05250416A (ja) データベースの登録・検索装置
JPS6337471A (ja) 翻訳方法及び装置
JP3308723B2 (ja) 統語解析装置
JPH06149878A (ja) 外国語文作成読解支援装置
JPS593630A (ja) 文書作成装置
JPH0484261A (ja) 誤り表記検索方式
JP2001134564A (ja) 電子辞書
JP4531325B2 (ja) 機械翻訳装置および機械翻訳方法
JP2002351868A (ja) 電子辞書
JPS62212871A (ja) 文章読み上げ校正装置
JPH0258159A (ja) 日本文の校正システム