JP4103313B2 - Natural language processing apparatus and method - Google Patents

Natural language processing apparatus and method Download PDF

Info

Publication number
JP4103313B2
JP4103313B2 JP2000227189A JP2000227189A JP4103313B2 JP 4103313 B2 JP4103313 B2 JP 4103313B2 JP 2000227189 A JP2000227189 A JP 2000227189A JP 2000227189 A JP2000227189 A JP 2000227189A JP 4103313 B2 JP4103313 B2 JP 4103313B2
Authority
JP
Japan
Prior art keywords
analysis
dictionary
failure
natural language
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000227189A
Other languages
Japanese (ja)
Other versions
JP2002041515A (en
Inventor
美穂子 北村
稔樹 村田
毅至 福居
美樹 佐々木
さより 下畑
正睦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000227189A priority Critical patent/JP4103313B2/en
Publication of JP2002041515A publication Critical patent/JP2002041515A/en
Application granted granted Critical
Publication of JP4103313B2 publication Critical patent/JP4103313B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は自然言語処理装置及び方法に関し、例えば、翻訳パターンを利用して機械翻訳を行う機械翻訳装置及び方法に適用し得るものである。
【0002】
【従来の技術】
翻訳パターンに基づく機械翻訳装置は、原言語パターンの適用によって原言語の構文解析を行う。そのため、適用可能な原言語パターンが存在しなかった場合には、解析失敗、つまり、翻訳失敗となり、翻訳結果が得られない。
【0003】
このような不都合を解決する方法として、特開平5−290082号公報には、パターンを利用した解析部の他に、文法解析による解析部を別途設けている。そして、パターンを適用した解析に失敗した場合には、文法解析によって原言語を解析するという、パターンを用いない従来の方法を行うことで対処することが記載されている。
【0004】
また、解析失敗を表示して、ユーザに入力文の見直しを求める方法をとる装置も考えられる。
【0005】
【発明が解決しようとする課題】
しかしながら、上記公報に記載の装置は、解析部として、複数を搭載しなければならず、無駄が多いということができる。
【0006】
また、上記公報に記載の装置は、パターンに基づく翻訳処理を行う装置でありながら、パターンに基づく翻訳処理の利点を享受することができない。例えば、パターンに基づく解析は、構文解析レベルなどに対しても、ユーザがパターン登録などで自己の好みを反映できる、文法解析では結果が得られない特殊な表現を含んでいても解析できるというような多くの利点を有するが、このような利点を享受することができなくなる。
【0007】
さらに、解析失敗時に、ユーザに入力文の見直しをさせる方法は、当然に、ユーザの負担が大きい。むしろ、尤もらしい翻訳結果を呈示した方がユーザの負担は小さい。
【0008】
そのため、パターンに基づく翻訳処理においては適用可能なパターンが存在しなかった場合においても、パターンをできるだけ適用させて、尤もらしい翻訳結果が得られることが望ましい。
【0009】
本発明は、以上の点を考慮してなされたものであり、解析失敗時においても、同一の解析方法を適用して、ユーザに負担を掛けずに、その失敗を救済することができる自然言語処理装置及び方法を提供しようとしたものである。
【0010】
【課題を解決するための手段】
かかる課題を解決するため、第1の本発明は、入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が解析を行う自然言語処理装置において、(a)上記解析手段が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、(b)上記解析手段が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書と、(c)上記解析手段が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する利用辞書設定手段とを有し、(d)上記利用辞書設定手段は、上記解析手段の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、(e)上記解析手段は、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、最初から解析をし直すことを特徴とする。
第2の本発明は、入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が解析を行う自然言語処理装置において、(a)上記解析手段が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、(b)上記解析手段が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書と、(c)上記解析手段が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する利用辞書設定手段とを有し、(d)上記利用辞書設定手段は、上記解析手段の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、(e)上記解析手段は、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、失敗した以降の解析を実行することを特徴とする。
【0011】
また、第の本発明は、入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が実行する解析工程で解析を行う自然言語処理方法において、(a)上記解析工程が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、上記解析工程が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書とを備えると共に、(b)上記解析工程が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する、利用辞書設定手段が実行する利用辞書設定工程を有し、(c)上記利用辞書設定手段は、上記利用辞書設定工程において、上記解析工程の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、(d)上記解析手段は、上記解析工程において、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、最初から解析をし直すことを特徴とする。
第4の本発明は、入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が実行する解析工程で解析を行う自然言語処理方法において、(a)上記解析工程が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、上記解析工程が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書とを備えると共に、(b)上記解析工程が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する、利用辞書設定手段が実行する利用辞書設定工程を有し、(c)上記利用辞書設定手段は、上記利用辞書設定工程において、上記解析工程の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、(d)上記解析手段は、上記解析工程において、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、失敗した以降の解析を実行することを特徴とする。
【0012】
【発明の実施の形態】
(A)第1の実施形態
以下、本発明による自然言語処理装置及び方法を、機械翻訳装置及び機械翻訳方法に適用した第1の実施形態を図面を参照しながら詳述する。
【0013】
(A−1)第1の実施形態の構成
図1は、第1の実施形態の機械翻訳装置の機能的構成を示すブロック図である。なお、実際上は、例えば、パソコンなどの情報処理装置上に、処理プログラムや固定データなどがローディングされて、第1の実施形態の機械翻訳装置が構築される。
【0014】
図1において、第1の実施形態の機械翻訳装置は、大きくは、入出力部1.1、翻訳処理部1.2、辞書格納部1.3から構成される。
【0015】
入出力部1.1は、翻訳対象となる入力文を入力部1.01から受ける入力処理部1.11、及び、翻訳した結果を出力部1.02に出力する出力処理部1.12を有する。
【0016】
翻訳処理部1.2は、入力文(原言語文)の形態素解析を行う形態素解析部1.21、翻訳パターンを利用して原言語の構文解析を行う構文解析部1.22、原言語の構文解析の結果から目的言語による構文の生成を行う構文生成部1.23、及び、その構文生成の結果から目的言語の形態素生成を行う形態素生成部1.24を有する。
【0017】
構文解析部1.22は、パターン辞書引きを行う辞書引き部1.222、及び、辞書引きした結果をもとに構文解析を行う構文解析器1.221を有する。
【0018】
辞書格納部1.3は、原言語の形態素情報が格納されている原言語形態素辞書1.31、目的言語の形態素情報が格納されている目的言語形態素辞書1.32、原言語と目的言語のパターンの対からなる翻訳パターンが格納されている翻訳パターン辞書1.33、及び、フェイルセーフ(FailSafe)パターン辞書1.34を有する。
【0019】
フェイルセーフパターン辞書1.34も、原言語と目的言語のパターンの対からなる翻訳パターンが格納されているものであるが、少なくとも原言語のパターンについては、実際の原言語文では誤った表現(複数形であるべき箇所が単数形になっていたり、3人称単数であるべき所がそのようになっていなかったりしている表現)を考慮したパターンが格納されている。この点については、動作の項で例示する。
【0020】
また、フェイルセーフパターン辞書1.34は、構文解析部1.22が翻訳パターン辞書1.33を適用した構文解析で解析失敗したときに利用されるものである。フェイルセーフパターン辞書1.34には、文法的には正しくないがユーザが入力しがちなパターン(主格と主動詞の人称不一致のパターン)や、省略を含むパターン(thatの省略のパターン)等、解析失敗を防ぐパターンを予め登録しておく。
【0021】
なお、ユーザは、入力文をキーボードファイル読み込み装置などの入力部1.01を用いて入力し、ディイスプレーやプリンタやファイル格納装などに出力部1.02によって翻訳結果を得る。
【0022】
(A−2)第1の実施形態の動作
次に、第1の実施形態の機械翻訳装置の翻訳動作(第1の実施形態の機械翻訳方法)を説明する。ここで、図2が、第1の実施形態の機械翻訳装置の翻訳動作を示すフローチャートであり、図3が、構文解析部1.22の構文解析処理を示すフローチャートである。
【0023】
なお、第1の実施形態の機械翻訳装置は1文を入力単位としている。また以下の説明においては、ユーザが3人称単数のsを付与し忘れた英文“It show a fact.”(正しくは“It shows a fact.”)を入力した場合を例に説明する。
【0024】
ユーザが、上記入力文を入力部1.01により入力すると、入力処理部1.11が受け取り、翻訳処理部1.2の形態素解析部1.21に渡す(ステップS2.1)。形態素解析部1.21は、原言語形態素辞書1.31の情報を用いて、形態素解析処理を行う(ステップS2.2)。
【0025】
形態素解析結果は、図4に示すように、ルートノードを”root”とした木構造で表現される。複数候補がない形態素の場合には、ルートノードの直下に各形態素の標準形と品詞や変化形などの形態素情報とが付与される。一方、複数候補がある形態素の場合には(図4ではないが)、orノードの子ノードとして各形態素候補の情報が付与される。
【0026】
このような形態素解析結果が与えられた構文解析部2.2は、この結果に対し、翻訳パターン辞書33を用いて、構文解析処理を行う(ステップS2.3)。構文解析部1.22は、図3に示すように、構文解析処理を行う。
【0027】
構文解析のメインの処理が実行される前に辞書引き部1.222において、どの辞書を用いて構文解析するかが予め設定される。最初は、翻訳パターン辞書1.33のみが解析用の辞書としてセットされる(ステップS3.1)。
【0028】
図5は、翻訳パターン辞書1.33の一部の格納内容例(翻訳パターン)を示している。
【0029】
図5において、上側が英語パターンを表し、下側が日本語パターンを表し、これら英語パターン及び日本語パターンが対になっている。各言語のパターンは、
[言語名:パターン名 パターン構成要素]
からなる。
【0030】
言語名は、英語(en)か日本語(ja)かを規定する。パターン名は、例えば、VP、NP等の句構造規則での標識が適用される。パターン構成要素は、単語、変数、又は、単語と変数の並び、からなる。変数は[任意の数字:パターン名(パターン構成要素を伴うこともある)]で記述される。任意の数字部分は、対となっているパターン間での対応関係を示すものである。構文解析においては、変数に、別のパターンが適用することにより、パターンは入れ子構造をとることができる。また、単語及びパターン名は、意味情報などの詳細な情報(素性情報)を持つことができる。さらに、単語及びパターン名は、詳細情報を変数化して、情報の参照をすることもできる。
【0031】
図6は、フェイルセーフパターン辞書1.34の一部の格納内容例(翻訳パターン)を示している。格納されている翻訳パターンの表記方式は、翻訳パターン辞書1.33に格納されている翻訳パターンと同様である。
【0032】
構文解析部1.221は、以上のような翻訳パターン辞書1.33に登録されている各パターンを用いて、構文解析処理を行う(ステップS3.2)。
【0033】
この構文解析処理は、フローチャートの図示は省略するが、構文解析が終了していないことを確認しつつ、パターン辞書引き処理、パターン検査処理及びパターン適用処理の3つの処理を繰り返し行うものである。
【0034】
第1の処理であるパターン辞書引き処理は、形態素解析結果及びそれまでのパターン適用処理の結果から、次に適用の可能性のある翻訳パターンを翻訳パターン辞書1.33から引く処理である。第2の処理であるパターン検査処理は、辞書引きの結果得られた翻訳パターンを現在構築中の木構造に適用するか否かを、各木構造毎に検査する処理である。第3の処理であるパターン適用処理は、検査の結果、適用可能になった木構造と翻訳パターンとに基づいて、木構造にそのパターンを実際に適用する処理である。
【0035】
図7は、上記入力文に対する構文解析途中の木構造を示している。この図7の木構造の各ノード7.1〜7.5は、図5に示した各翻訳パターン(原言語パターン)5.1〜5.5のそれぞれ対応している(7.1:5.1、7.2:5.2、…)。
【0036】
この図7の構文解析途中の木構造は、構文解析をこれ以上続けることはできない。なぜならば、主格と動詞句に関する翻訳パターン(原言語パターン)5.6〜5.8のいずれも、変化に関する条件(3人称単数に関する条件)が形態素解析結果と異なっているため適用できず、構文木を完成させることができないためである。すなわち、入力単語を全て用いて、S(文)をルートノードとした構文木を作ることができない。
【0037】
従って、この場合、構文解析が成功したか否かの判別処理(ステップS3.3)で構文解析は失敗という結果が得られる。なお、構文解析が成功した場合には、構文解析処理は終了し、構文解析結果が構文生成部1.23に与えられる。
【0038】
ステップS3.2の構文解析が失敗したときには、その構文解析でフェイルセーフパターン辞書1.34が利用されていたか否かを判別する(ステップS3.4)。このときには、まだフェイルセーフパターン辞書1.34が利用されていないので、構文解析に利用するパターン辞書として、翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方がセットされ(ステップS3.5)、メインの構文解析処理(ステップS3.3)に戻って、前回失敗した構文解析の途中から構文解析処理を行う。
【0039】
上述したように、図6は、フェイルセーフパターン辞書1.34の格納例を示している。フェイルセーフパターン辞書1.34には、符号6.1や6.2に示すような変化に関する条件のないパターン構成要素で構成されたパターン6.3などの変化等の条件を緩和したパターンを用意しておく。すなわち、変化が正しくない入力文に対応できるようなパターンを用意しておく。
【0040】
従って、翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方がセットされた状態でのメインの構文解析処理(ステップS3.3)で、上記入力文に対し、パターン6.3が適用され、図8に示すようなS(文)をルートノードとした木構造を作成することができ、構文解析が成功し、構文解析処理が終了する。
【0041】
なお、図8の符号8.1と8.2で示した部分は、図6のパターン6.3の各構成要素6.1と6.2に対応している。
【0042】
また、翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方がセットされた状態でメインの構文解析処理を行っても構文解析が失敗したときには、構文解析処理を終了し、構文解析失敗を例えば表示出力させる。
【0043】
得られた構文解析結果は構文生成部1.23に与えられ、構文生成部1.23によって、構文生成処理(図2のステップS2.4)が実行される。構文生成部1.23が生成した木構造は形態素生成部1.24に与えられ、形態素生成部1.24は形態素生成処理を行う(ステップS2.5)。形態素生成処理では、構文生成結果を、終端ノードに位置する日本語単語を左から順に並べ、各単語を目的言語形態素辞書1.32を用いて、動詞の活用形を整えたりなど、各単語の整形をする。その形態素生成結果(訳文)を出力処理部1.12が受取り、出力部1.02によって表示出力したり、ファイルに格納したりする。
【0044】
上述した入力文“It show a fact.”に対しては、「それは事実を示す。」という翻訳結果が得られる。
【0045】
(A−3)第1の実施形態の効果
第1の実施形態の機械翻訳装置及び方法によれば、以下の効果を奏することができる。
【0046】
(a)従来の技術の項で言及した特開平5−290082号公報においては、翻訳失敗の救済は文法解析により行われるため、パターン翻訳の利点を享受できないが、第1の実施形態では、フェイルセーフパターン辞書1.34を利用するという救済であるため、パターン翻訳の利点を享受できる。例えば、翻訳パターン辞書1.33にユーザが登録したパターンや特殊な表現に関するパターンがある場合において、解析失敗の救済時においても、それらパターンを適宜解析に反映させることができる。
【0047】
(b)上記公報の方法においては、パターン解析と文法解析の両方を使用するため、辞書や解析エンジンの開発及び管理は、仕様が全く異なるその両方に対して行う必要があるが、第1の実施形態では、全てがパターン解析上で行われるため、辞書も解析エンジンも全く同じ仕様であり、開発、管理、改良の効率化が図られる。また、解析部構成も簡単なものとなる。
【0048】
(c)フェイルセーフパターン辞書1.34を利用することにより翻訳結果が得られることが大半であるので、入力文を見直すことをユーザに求めることがほぼ不要となってユーザに負担をかけなくてすむようになる。
【0049】
(d)翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方を最初から利用しても良いが、第1の実施形態のように、翻訳パターン辞書1.33だけを利用した構文解析で失敗したときにフェイルセーフパターン辞書1.34を利用するようにすると、正しい入力文に対する構文解析の処理時間を短くできる。すなわち、翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方を最初から利用する場合、検索するパターン数や適合判断するパターン数等が多くなって、正しい入力文に対する構文解析の処理時間も長くなってしまう。
【0050】
(A−4)第1の実施形態の変形実施形態
翻訳パターン辞書1.33は、システムが最初から有する辞書だけでなく、ユーザによって作成された辞書でも同様に利用できる。
【0051】
上記では、構文解析が失敗し、フェイルセーフパターン辞書利用による再解析の開始は、前回失敗した構文解析の途中からの場合を説明したが、途中からでなく、形態素解析が終わった時点、つまり一から構文解析をやり直してもかまわない。
【0052】
上述のように、第1の実施形態より効果が多少落ちるが、翻訳パターン辞書1.33とフェイルセーフパターン辞書1.34の両方を最初から利用して構文解析させるようにしても良い。また、フェイルセーフパターン辞書1.34を最初から利用するか、又は、構文解析の失敗後に利用するかを、ユーザが指定できるようにしても良い。
【0053】
(B)第2の実施形態
次に、本発明による自然言語処理装置及び方法を、機械翻訳装置及び機械翻訳方法に適用した第2の実施形態を図面を参照しながら詳述する。
【0054】
(B−1)第2の実施形態の構成
図9は、第2の実施形態の機械翻訳装置の機能的構成を示すブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0055】
第2の実施形態の機械翻訳装置は、フェイルセーフ(FailSafe)パターン辞書として複数(X個)のフェイルセーフパターン辞書1.341〜1.34Xを設けている点が第1の実施形態とは異っている。
【0056】
各フェイルセーフパターン辞書1.341、…、1.34Xは、解析失敗時に利用されるという点では同様なものである。
【0057】
しかし、例えば、入力文で発生率が高いミスに対応したフェイルセーフ用の翻訳パターンが、小さい番号のフェイルセーフパターン辞書(例えば1.341)に格納され、入力文で発生率が低いミスに対応したフェイルセーフ用の翻訳パターンが、大きい番号のフェイルセーフパターン辞書(例えば1.34X)に格納されているように、適用効率などから区別されている。また例えば、1文中のミス数が少ないものに対応した翻訳パターンが、小さい番号のフェイルセーフパターン辞書(例えば1.341)に格納され、1文中のミス数が多いものに対応した翻訳パターンが、大きい番号のフェイルセーフパターン辞書(例えば1.34X)に格納されているように、ミスの多少などから区別されている。他の観点から区別(優先順位)を付与しても良い。必ずしも、文法上のミスだけでなく、関係代名詞thatの省略(文法的には正しい)にフェイルセーフパターンを適用させるようにしても良く、この場合でも、優先順位を決めて該当するフェイルセーフパターン辞書に格納すれば良い。
【0058】
以上のように、第2の実施形態では、複数のフェイルセーフパターン辞書1.341〜1.34Xを有するので、構文解析部1.22の機能や処理も、第1の実施形態のものとは異なっている。
【0059】
(B−2)第2の実施形態の動作
第2の実施形態の機械翻訳装置は、構文解析処理の動作だけが第1の実施形態と異なっており、以下、構文解析処理を説明する。ここで、図10が、第2の実施形態の機械翻訳装置の構文解析処理の動作を示すフローチャートである。
【0060】
構文解析部1.22は、使用するパターン辞書として翻訳パターン辞書1.33をセットし(ステップS10.1)、フェイルセーフパターン辞書を規定するパラメータnを初期値0に設定した後(ステップS10.2)、メインの構文解析処理を実行する(ステップS10.3)。そして、パラメータnを1インクリメントした後(ステップS10.4)、解析が成功したか否かを判別する(ステップS10.5)。
【0061】
成功したならば、一連の構文解析処理を終了する。一方、失敗したならば、パラメータnの値が、フェイルセーフパターン辞書1.341〜1.34Xの個数X以下か否かを判別する(ステップS10.6)。ここで、パラメータnの値が、フェイルセーフパターン辞書個数Xより大きいことは、全てのフェイルセーフパターン辞書1.341〜1.34Xを適用しても解析を失敗したことを意味し、一連の構文解析処理を終了する。これに対して、パラメータnの値が、フェイルセーフパターン辞書個数X以下であれば、パラメータnが規定するフェイルセーフパターン辞書1.34nを構文解析に使用するパターン辞書として追加セットし(ステップS10.7)、上述したステップS10.3のメインの構文解析処理に戻る。
【0062】
以下、このような第2の実施形態の構文解析処理を次に示す3個の入力文(例文1〜例文3)を適宜用いながら、具体的に説明する。
【0063】
“She found the lady crying.”(例文1)
“She is the lady living here.”(例文2)
“It wanted mending.”(例文3)
ここで、翻訳パターン辞書1.33の格納内容(翻訳パターン)が図11に示すようなものとする。また、フェイルセーフパターン辞書個数Xが2とし、フェイルセーフパターン辞書1.341の格納内容(翻訳パターン)が図12に示すようなものとし、フェイルセーフパターン辞書1.342の格納内容(翻訳パターン)が図13に示すようなものとする。
【0064】
最初、構文解析に使用する辞書として、図10に示す翻訳パターン辞書1.33をセットされる(ステップS10.1)。次に、パラメータnに0をセットし(ステップS10.2)、構文解析のメイン処理を行い(ステップS10.3)、構文解析終了後、パラメータnに1を加える(ステップS10.4)。
【0065】
例文1が入力文である場合には、図14に示す構文解析結果(木構造)の各ノード14.1、14.4〜14.9がそれぞれ、図11の原言語パターン11.1、11.4〜11.9に対応することで明らかなように、翻訳パターン辞書1.33だけを用いた構文解析が成功し、構文解析処理を終了する。
【0066】
一方、例文2又は例文3が入力文である場合には、それぞれ、図15、図16に示すように、翻訳パターン辞書1.33を適用しただけでは構文解析できないため、パラメータn(=1)の値がフェイルセーフ辞書個数X(=2)以下かを確かめ、個数X以下であるので(ステップS10.6)、翻訳パターン辞書1.33に追加してフェイルセーフパターン辞書1.341(符号末尾の1はパラメータnの値)をセットし(ステップS10.7)、再度構文解析のメインの処理を実行する(ステップS10.3)。
【0067】
例文2が入力文である場合には、フェイルセーフパターン辞書1.341の追加セットにより、翻訳パターン辞書1.33だけを適用していた状態ではパターンを適用できなかった部分に、図12のパターン12.Aが適用され、その部分に、図17に示す木構造17.Aを構築することができ、構文解析が成功し、最終的に図17に示す構文解析結果が得られる。
【0068】
一方、例文3が入力文である場合には、フェイルセーフパターン辞書1.341を追加セットしても、依然、構文解析の失敗が続くため、フェイルセーフパターン辞書1.342をさらに追加して再度構文解析を行う。
【0069】
フェイルセーフパターン辞書1.342の追加セットにより、そのフェイルセーフパターン辞書1.342のパターン13.Bが適用され、構文解析の失敗の木構造部分に、図18に示すように木構造19.Bを構築することができ、構文解析が成功し、最終的に図18に示す構文解析結果を得ることができる。
【0070】
以降、構文生成処理、形態素生成処理が順次実行され、例文1、例文2、例文3のそれぞれに対し、「彼女は女性が泣いているのがわかった。」、「彼女はここに住んでいる女性である。」、「それは修繕することを望む。」という翻訳結果が得られる。
【0071】
(B−3)第2の実施形態の効果
第2の実施形態の機械翻訳装置及び方法によれば、第1の実施形態の効果に加えて、以下の効果を奏することもできる。
【0072】
(a)フェイルセーフパターン辞書を複数設けることにより、救済させたいパターンに優先順位を設けることができる。例えば、第2の実施形態の場合では、現在分詞形の動詞に関して、現在分詞形の後置名詞修飾の性質を持つパターンの方が現在分詞形単独での名詞派生の性質を持つパターンより、優先順位を高くしている。
【0073】
(b)また、複数のフェイルセーフパターン辞書を徐々に増やしてセットするようにしたので、解析失敗の原因の優先順位が高いものは、迅速に構文解析結果が得られる。
【0074】
(B−4)第2の実施形態の変形実施形態
上記では、フェイルセーフパターン辞書を失敗を救済するための辞書として利用しているが、失敗を救済する目的ではなく、適用したい辞書の優先度をつけるための手段としても利用できる。例えば、ユーザが登録したパターンからなる辞書を第2の実施形態での翻訳パターン辞書1.33とし、システムが有する翻訳パターン辞書のうち文法に関するパターンをフェイルセーフパターン辞書1.341、各単語の訳語に関するパターンをフェイルセーフパターン辞書1.342とすれば、ユーザが登録したパターンを最優先にして構文解析し、そのユーザが登録したパターンのみで解析が成功すれば、その結果を翻訳結果として出力し、次に、システムが有する翻訳パターン辞書のうち文法に関するパターンを追加して解析し、解析が成功すれば、その結果を翻訳結果として出力し、というようにユーザが登録したパターンをできるだけ優先して翻訳することができる。
【0075】
(C)他の実施形態
上記各実施形態は、翻訳パターンを利用した機械翻訳装置及び方法に本発明を適用したものを示したが、上記各実施形態は、構文解析結果を得るまでの処理に特徴があり、そのため、上記各実施形態の技術思想を他の自然言語処理装置や方法に適用することができる。例えば、質疑応答装置で回答文をパターン(自然言語パターン)を用いて構文解析するまでの部分に本発明の技術思想を適用することができる。
【0076】
また、上記各実施形態は、翻訳パターンを利用した機械翻訳装置及び方法に本発明を適用したものを示したが、翻訳パターンを利用しない機械翻訳装置及び方法にも上記各実施形態の技術思想を適用することができる。例えば、文法規則を適用して構文解析する装置の場合において、文法規則辞書を当初から適用するものと、解析失敗時に適用するものとに分離するようにしても良い。
【0077】
さらに、本発明の技術思想は、構文解析だけでなく、形態素解析等にも適用可能である。すなわち、形態素解析辞書を当初から適用するものと、解析失敗時に適用するものとに分離するようにしても良い。例えば、英語の不規則変化する動詞に対し、その動詞の原形に”ed”を付加したものを解析失敗時に適用する形態素解析辞書に用意しておくようにしても良い。
【0078】
【発明の効果】
以上のように、本発明の自然言語処理装置及び方法によれば、少なくとも最初の解析で利用する基本辞書と、解析失敗後の解析で利用する1又は複数の解析失敗救済辞書とを備え、基本辞書及び又は解析失敗救済辞書を適宜設定して解析失敗後の解析を行うので、解析失敗時においても、同一の解析方法を適用して、ユーザに負担を掛けずにその失敗を救済することができる。
【図面の簡単な説明】
【図1】第1の実施形態の機械翻訳装置の機能的構成を示すブロック図である。
【図2】第1の実施形態の機械翻訳装置の翻訳動作を示すフローチャートである。
【図3】第1の実施形態の構文解析処理の詳細を示すフローチャートである。
【図4】第1の実施形態の形態素解析結果例を示す説明図である。
【図5】第1の実施形態の翻訳パターン辞書1.33の格納内容例を示す説明図である。
【図6】第1の実施形態のフェイルセーフパターン辞書1.34の格納内容例を示す説明図である。
【図7】第1の実施形態の構文解析途中の木構造を示す説明図である。
【図8】第1の実施形態のフェイルセーフパターン辞書1.34をも利用した構文解析結果を示す説明図である。
【図9】第2の実施形態の機械翻訳装置の機能的構成を示すブロック図である。
【図10】第2の実施形態の構文解析処理の詳細を示すフローチャートである。
【図11】第2の実施形態の翻訳パターン辞書1.33の格納内容例を示す説明図である。
【図12】第2の実施形態のフェイルセーフパターン辞書1.341の格納内容例を示す説明図である。
【図13】第2の実施形態のフェイルセーフパターン辞書1.342の格納内容例を示す説明図である。
【図14】第2の実施形態の翻訳パターン辞書1.33を利用した例文1の構文解析結果を示す説明図である。
【図15】第2の実施形態の翻訳パターン辞書1.33を利用した例文2の構文解析途中の木構造を示す説明図である。
【図16】第2の実施形態の翻訳パターン辞書1.33を利用した例文3の構文解析途中の木構造を示す説明図である。
【図17】第2の実施形態のフェイルセーフパターン辞書1.341をも利用した例文2の構文解析結果を示す説明図である。
【図18】第2の実施形態のフェイルセーフパターン辞書1.342をも利用した例文2の構文解析結果を示す説明図である。
【符号の説明】
1.1…入出力部、
1.2…翻訳処理部、
1.21…形態素解析部、
1.22…構文解析部、
1.3…辞書格納部、
1.33…翻訳パターン辞書、
1.34、1.341〜1.34X…フェイルセーフ(FailSafe)パターン辞書。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a natural language processing apparatus and method, and can be applied to, for example, a machine translation apparatus and method that performs machine translation using a translation pattern.
[0002]
[Prior art]
Machine translation devices based on translation patterns perform source language syntax analysis by applying source language patterns. Therefore, if there is no applicable source language pattern, the analysis fails, that is, the translation fails, and the translation result cannot be obtained.
[0003]
As a method for solving such inconvenience, Japanese Patent Laid-Open No. 5-290082 separately provides an analysis unit using grammar analysis in addition to an analysis unit using patterns. In addition, it is described that when an analysis that applies a pattern fails, a conventional method that does not use a pattern, that is, a source language is analyzed by a grammatical analysis.
[0004]
Also, an apparatus that takes a method of displaying an analysis failure and requesting the user to review the input sentence is also conceivable.
[0005]
[Problems to be solved by the invention]
However, the apparatus described in the above publication must be equipped with a plurality of analysis units, which can be said to be wasteful.
[0006]
Further, the device described in the above publication cannot enjoy the advantages of pattern-based translation processing, although it is a device that performs pattern-based translation processing. For example, pattern-based analysis can be performed even if it includes special expressions that cannot be obtained by grammatical analysis, even if the user can reflect their preferences for pattern analysis etc. However, it is impossible to enjoy such advantages.
[0007]
Furthermore, naturally, the method of causing the user to review the input sentence when the analysis fails causes a heavy burden on the user. Rather, the burden on the user is smaller when a reasonable translation result is presented.
[0008]
Therefore, even in the case where there is no applicable pattern in the translation processing based on the pattern, it is desirable to apply a pattern as much as possible and obtain a plausible translation result.
[0009]
The present invention has been made in consideration of the above points, and even when an analysis fails, the same analysis method can be applied to recover the failure without imposing a burden on the user. It is an object of the present invention to provide a processing apparatus and method.
[0010]
[Means for Solving the Problems]
  In order to solve such a problem, the first aspect of the present invention provides an input natural language sentence or a predetermined processing result for the natural language sentence.Analysis targetOn the other hand, in the natural language processing apparatus in which the analysis means performs analysis, (a) the analysis means uses at least the first analysis.Contains grammatically correct analysis informationBasic dictionary and (b) used by the above analysis means for analysis after analysis failureIt stores analysis information that can analyze the part of the analysis target that contains grammatical errors that humans are likely to fall intoOne or a plurality of analysis failure relief dictionaries, and (c) the basic dictionary as a dictionary used by the analysis meansOrThe above analysis failure relief dictionaryAt least one ofUse dictionary setting means to set(D) The use dictionary setting means sets the basic dictionary at the time of the initial analysis of the analysis means, sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure, and (e ) When analyzing after analysis failure, the analysis means re-analyzes from the beginning using the basic dictionary and the analysis failure relief dictionary.It is characterized by that.
  According to a second aspect of the present invention, there is provided a natural language processing apparatus in which an analysis unit analyzes an input natural language sentence or an analysis target that is a predetermined processing result thereof. A basic dictionary storing grammatically correct analysis information for use in (b), and (b) an analysis target including grammatical errors that are likely to fall into humans, which is used in the analysis after the analysis failure. One or a plurality of analysis failure relief dictionaries storing analysis information capable of analyzing a part, and (c) at least one of the basic dictionary or the analysis failure relief dictionary as a dictionary used by the analysis means (D) the usage dictionary setting means sets the basic dictionary at the time of the first analysis of the analysis means, and at the time of analysis after the analysis failure, the basic dictionary and the analysis failure. Set the relief dictionary, the (e) above analyzing means, at the time of analysis after analysis fails, using the basic dictionary and the analysis fails relief dictionary, and executes the subsequent failed analyzed.
[0011]
  The second3The present invention provides an input natural language sentence or a predetermined processing result for the natural language sentence.Analysis targetWhereasPerformed by analysis meansIn the natural language processing method that performs analysis in the analysis process,(A)The above analysis process is used at least for the first analysisContains grammatically correct analysis informationThe basic dictionary and the above analysis process are used for analysis after analysis failureIt stores analysis information that can analyze the part of the analysis target that contains grammatical errors that humans are likely to fall intoOne or more analysis failure relief dictionaries, and(B)The basic dictionary as a dictionary used in the analysis stepOrThe above analysis failure relief dictionaryAt least one ofSet, Use dictionary setting meansA use dictionary setting process,(C) In the usage dictionary setting step, the usage dictionary setting means sets the basic dictionary at the time of the first analysis of the analysis step, and sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure. (D) In the analysis step, the analysis means re-analyzes from the beginning using the basic dictionary and the analysis failure relief dictionary at the time of analysis after analysis failure.It is characterized by that.
  According to a fourth aspect of the present invention, in the natural language processing method for analyzing the input natural language sentence or an analysis target that is a predetermined processing result thereof in an analysis step executed by the analysis unit, (a) the analysis step A basic dictionary that stores grammatically correct analysis information that is used in at least the first analysis, and an analysis that includes grammatical errors that humans are likely to fall into. One or a plurality of analysis failure relief dictionaries storing analysis information capable of analyzing the target portion, and (b) the basic dictionary or the analysis failure relief dictionary as the dictionary used by the analysis step A usage dictionary setting step executed by the usage dictionary setting means for setting at least one; (c) the usage dictionary setting means in the usage dictionary setting step for the first analysis of the analysis step; The basic dictionary and the analysis failure relief dictionary are set at the time of analysis after the failure of analysis, and (d) the analysis means at the time of analysis after the analysis failure in the analysis step. The analysis after the failure is executed using the basic dictionary and the analysis failure relief dictionary.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
(A) First embodiment
Hereinafter, a first embodiment in which a natural language processing apparatus and method according to the present invention are applied to a machine translation apparatus and a machine translation method will be described in detail with reference to the drawings.
[0013]
(A-1) Configuration of the first embodiment
FIG. 1 is a block diagram illustrating a functional configuration of the machine translation apparatus according to the first embodiment. In practice, for example, a processing program or fixed data is loaded on an information processing apparatus such as a personal computer, and the machine translation apparatus of the first embodiment is constructed.
[0014]
In FIG. 1, the machine translation apparatus according to the first embodiment is mainly composed of an input / output unit 1.1, a translation processing unit 1.2, and a dictionary storage unit 1.3.
[0015]
The input / output unit 1.1 includes an input processing unit 1.11 that receives an input sentence to be translated from the input unit 1.01, and an output processing unit 1.12 that outputs the translated result to the output unit 1.02. Have.
[0016]
The translation processing unit 1.2 includes a morpheme analysis unit 1.21 that performs morphological analysis of an input sentence (source language sentence), a syntax analysis unit 1.22 that performs syntax analysis of the source language using a translation pattern, It has a syntax generation unit 1.23 that generates a syntax in the target language from the result of the syntax analysis, and a morpheme generation unit 1.24 that generates a morpheme in the target language from the result of the syntax generation.
[0017]
The syntax analysis unit 1.22 includes a dictionary lookup unit 1.222 that performs pattern dictionary lookup, and a syntax analyzer 1.221 that performs syntax analysis based on the dictionary lookup result.
[0018]
The dictionary storage unit 1.3 includes a source language morpheme dictionary 1.31 in which source language morpheme information is stored, a target language morpheme dictionary 1.32 in which target language morpheme information is stored, and source language and target language It has a translation pattern dictionary 1.33 in which translation patterns made up of pairs of patterns are stored, and a fail safe pattern dictionary 1.34.
[0019]
The fail-safe pattern dictionary 1.34 also stores translation patterns consisting of pairs of source language and target language patterns, but at least the source language pattern is erroneously expressed in the actual source language sentence ( A pattern is stored that takes into account the expression that a place that should be plural is singular or a place that should be third person singular is not. This will be exemplified in the operation section.
[0020]
The fail safe pattern dictionary 1.34 is used when the parsing unit 1.22 fails in the parsing by applying the translation pattern dictionary 1.33. The fail-safe pattern dictionary 1.34 includes patterns that are not grammatically correct but are apt to be input by the user (patterns that do not match the personalities of the main case and main verb), patterns that include abbreviations (patterns that omit a tat) A pattern for preventing analysis failure is registered in advance.
[0021]
The user inputs an input sentence using an input unit 1.01 such as a keyboard file reading device, and obtains a translation result by an output unit 1.02 on a display, a printer, a file storage device, or the like.
[0022]
(A-2) Operation of the first embodiment
Next, the translation operation (machine translation method of the first embodiment) of the machine translation device of the first embodiment will be described. Here, FIG. 2 is a flowchart showing the translation operation of the machine translation apparatus of the first embodiment, and FIG. 3 is a flowchart showing the syntax analysis processing of the syntax analysis unit 1.22.
[0023]
The machine translation apparatus according to the first embodiment uses one sentence as an input unit. Further, in the following description, an example will be described in which the user inputs an English sentence “It shows a fact.” (Correctly “It shows a fact.”) Forgot to give s in the third person singular.
[0024]
When the user inputs the input sentence through the input unit 1.01, the input processing unit 1.11 receives it and passes it to the morpheme analysis unit 1.21 of the translation processing unit 1.2 (step S2.1). The morpheme analysis unit 1.21 performs morpheme analysis processing using information in the source language morpheme dictionary 1.31 (step S2.2).
[0025]
As shown in FIG. 4, the morphological analysis result is expressed by a tree structure with the root node as “root”. In the case of a morpheme that does not have a plurality of candidates, the standard form of each morpheme and morpheme information such as part of speech or change form are assigned immediately below the root node. On the other hand, in the case of a morpheme having a plurality of candidates (not shown in FIG. 4), information on each morpheme candidate is given as a child node of the or node.
[0026]
The syntax analysis unit 2.2 to which such a morpheme analysis result is given performs a syntax analysis process on the result using the translation pattern dictionary 33 (step S2.3). The syntax analysis unit 1.22 performs syntax analysis processing as shown in FIG.
[0027]
Before the main processing of syntax analysis is executed, a dictionary lookup unit 1.222 sets in advance which dictionary is used for syntax analysis. Initially, only the translation pattern dictionary 1.33 is set as a dictionary for analysis (step S3.1).
[0028]
FIG. 5 shows a part of the stored contents (translation pattern) of the translation pattern dictionary 1.33.
[0029]
In FIG. 5, the upper side represents an English pattern, the lower side represents a Japanese pattern, and the English pattern and the Japanese pattern are paired. Each language pattern is
[Language name: Pattern name Pattern component]
Consists of.
[0030]
The language name defines whether it is English (en) or Japanese (ja). As the pattern name, for example, a label according to a phrase structure rule such as VP or NP is applied. A pattern component consists of a word, a variable, or a sequence of words and variables. The variable is described by [arbitrary number: pattern name (may be accompanied by a pattern component)]. Arbitrary numeric parts indicate the correspondence between the paired patterns. In parsing, a pattern can have a nested structure by applying another pattern to a variable. Further, the word and the pattern name can have detailed information (feature information) such as semantic information. In addition, the word and pattern name can be referred to by converting the detailed information into a variable.
[0031]
FIG. 6 shows a part of the stored contents (translation pattern) of the fail safe pattern dictionary 1.34. The notation method of the stored translation pattern is the same as the translation pattern stored in the translation pattern dictionary 1.33.
[0032]
The syntax analysis unit 1.221 performs syntax analysis processing using each pattern registered in the translation pattern dictionary 1.33 as described above (step S3.2).
[0033]
Although the syntax analysis processing is omitted from the flowchart, the three processes of the pattern dictionary lookup processing, the pattern inspection processing, and the pattern application processing are repeatedly performed while confirming that the syntax analysis has not ended.
[0034]
The pattern dictionary lookup process, which is the first process, is a process of subtracting from the translation pattern dictionary 1.33 a translation pattern that may be applied next from the morphological analysis result and the result of the pattern application process so far. The pattern inspection process, which is the second process, is a process for inspecting each tree structure whether or not the translation pattern obtained as a result of dictionary lookup is applied to the tree structure currently being constructed. The pattern application process, which is the third process, is a process of actually applying the pattern to the tree structure based on the tree structure and the translation pattern that can be applied as a result of the inspection.
[0035]
FIG. 7 shows a tree structure in the middle of parsing for the input sentence. The nodes 7.1 to 7.5 in the tree structure of FIG. 7 correspond to the translation patterns (source language patterns) 5.1 to 5.5 shown in FIG. 5 (7.1: 5). .1, 7.2: 5.2, ...).
[0036]
The tree structure in the middle of parsing in FIG. 7 cannot continue parsing any further. This is because none of the translation patterns (source language patterns) 5.6 to 5.8 for the main case and verb phrase can be applied because the conditions for change (conditions for the third person singular) differ from the morphological analysis results. This is because the tree cannot be completed. That is, it is impossible to create a syntax tree using S (sentence) as a root node using all input words.
[0037]
Therefore, in this case, the result of the parsing failure is obtained in the process of determining whether the parsing has succeeded (step S3.3). If the syntax analysis is successful, the syntax analysis process ends and the syntax analysis result is given to the syntax generation unit 1.23.
[0038]
If the syntax analysis in step S3.2 fails, it is determined whether or not the fail-safe pattern dictionary 1.34 was used in the syntax analysis (step S3.4). At this time, since the fail-safe pattern dictionary 1.34 is not yet used, both the translation pattern dictionary 1.33 and the fail-safe pattern dictionary 1.34 are set as pattern dictionaries used for syntax analysis (step S3. 5) Returning to the main parsing process (step S3.3), the parsing process is performed from the middle of the parsing that failed last time.
[0039]
As described above, FIG. 6 shows a storage example of the fail safe pattern dictionary 1.34. In the fail-safe pattern dictionary 1.34, a pattern with relaxed conditions such as a pattern 6.3 composed of pattern constituent elements having no conditions related to changes as shown by reference numerals 6.1 and 6.2 is prepared. Keep it. In other words, a pattern that can handle an input sentence whose change is not correct is prepared.
[0040]
Accordingly, pattern 6.3 is applied to the input sentence in the main parsing process (step S3.3) with both translation pattern dictionary 1.33 and fail-safe pattern dictionary 1.34 set. Then, a tree structure having S (sentence) as a root node as shown in FIG. 8 can be created, the syntax analysis is successful, and the syntax analysis processing is completed.
[0041]
8 correspond to the constituent elements 6.1 and 6.2 of the pattern 6.3 in FIG.
[0042]
If the main parsing process fails even if the main parsing process is performed with both the translation pattern dictionary 1.33 and the fail safe pattern dictionary 1.34 set, the parsing process ends and the parsing process fails. Is displayed and output, for example.
[0043]
The obtained syntax analysis result is given to the syntax generation unit 1.23, and the syntax generation unit 1.23 executes a syntax generation process (step S2.4 in FIG. 2). The tree structure generated by the syntax generation unit 1.23 is given to the morpheme generation unit 1.24, and the morpheme generation unit 1.24 performs morpheme generation processing (step S2.5). In the morpheme generation process, the syntax generation results are arranged in order from the left, Japanese words located at the end node, and each word is arranged using the target language morpheme dictionary 1.32, and the verb usage form is adjusted. Shape it. The output processing unit 1.12 receives the morpheme generation result (translated sentence), and the output unit 1.02 displays and outputs it or stores it in a file.
[0044]
For the above-mentioned input sentence “It show a fact.”, The translation result “It indicates fact” is obtained.
[0045]
(A-3) Effects of the first embodiment
According to the machine translation apparatus and method of the first embodiment, the following effects can be obtained.
[0046]
(A) In Japanese Patent Application Laid-Open No. 5-290082 referred to in the section of the prior art, since the translation failure is remedied by grammatical analysis, the advantage of pattern translation cannot be enjoyed. Since it is a relief to use the safe pattern dictionary 1.34, the advantage of pattern translation can be enjoyed. For example, when there are patterns registered by the user or patterns related to special expressions in the translation pattern dictionary 1.33, these patterns can be appropriately reflected in the analysis even when the analysis failure is remedied.
[0047]
(B) In the method of the above publication, since both pattern analysis and grammatical analysis are used, it is necessary to develop and manage a dictionary and an analysis engine for both different specifications. In the embodiment, since everything is performed on the pattern analysis, the dictionary and the analysis engine have exactly the same specifications, and development, management, and improvement of efficiency are achieved. Also, the analysis unit configuration is simple.
[0048]
(C) Since most of the translation results are obtained by using the fail-safe pattern dictionary 1.34, it is almost unnecessary to ask the user to review the input sentence, and the user is not burdened. I'm going to live.
[0049]
(D) Although both the translation pattern dictionary 1.33 and the fail safe pattern dictionary 1.34 may be used from the beginning, the syntax analysis using only the translation pattern dictionary 1.33 as in the first embodiment If the fail-safe pattern dictionary 1.34 is used when it fails, the parsing processing time for a correct input sentence can be shortened. That is, when both the translation pattern dictionary 1.33 and the fail safe pattern dictionary 1.34 are used from the beginning, the number of patterns to be searched, the number of patterns to be judged for conformance, etc. increase, and the processing time for parsing the correct input sentence Will also be long.
[0050]
(A-4) Modified embodiment of the first embodiment
The translation pattern dictionary 1.33 can be used not only in the dictionary that the system has from the beginning but also in a dictionary created by the user.
[0051]
In the above description, the case where syntax analysis has failed and the re-analysis using the fail-safe pattern dictionary has been started from the middle of the previous failed syntax analysis. You can start parsing again.
[0052]
As described above, although the effect is somewhat lower than in the first embodiment, both the translation pattern dictionary 1.33 and the fail safe pattern dictionary 1.34 may be used from the beginning to perform syntax analysis. Further, the user may be able to specify whether to use the fail-safe pattern dictionary 1.34 from the beginning or after the failure of syntax analysis.
[0053]
(B) Second embodiment
Next, a second embodiment in which the natural language processing apparatus and method according to the present invention are applied to a machine translation apparatus and a machine translation method will be described in detail with reference to the drawings.
[0054]
(B-1) Configuration of the second embodiment
FIG. 9 is a block diagram showing a functional configuration of the machine translation apparatus according to the second embodiment. The same or corresponding parts as those in FIG. 1 according to the first embodiment described above are assigned the same or corresponding reference numerals. It shows.
[0055]
The machine translation apparatus according to the second embodiment is different from the first embodiment in that a plurality (X) of failsafe pattern dictionaries 1.341 to 1.34X are provided as failsafe pattern dictionaries. ing.
[0056]
Each fail-safe pattern dictionary 1.341,..., 1.34X is similar in that it is used when analysis fails.
[0057]
However, for example, a fail-safe translation pattern corresponding to a mistake with a high occurrence rate in an input sentence is stored in a fail-safe pattern dictionary (for example, 1.341) with a small number, and a mistake with a low occurrence rate in an input sentence is handled. Thus, the fail-safe translation pattern is distinguished from the application efficiency so that it is stored in a large-number fail-safe pattern dictionary (for example, 1.34X). In addition, for example, a translation pattern corresponding to a small number of mistakes in one sentence is stored in a fail-safe pattern dictionary with a small number (for example, 1.341), and a translation pattern corresponding to a large number of mistakes in one sentence is As stored in a large-numbered fail-safe pattern dictionary (for example, 1.34X), it is distinguished from the number of mistakes. A distinction (priority order) may be given from another viewpoint. The fail-safe pattern may be applied not only to the grammatical mistake but also to the omission of the relative pronoun tat (grammatically correct). You just store in.
[0058]
As described above, since the second embodiment includes the plurality of fail safe pattern dictionaries 1.341 to 1.34X, the functions and processes of the syntax analysis unit 1.22 are also different from those of the first embodiment. Is different.
[0059]
(B-2) Operation of the second embodiment
The machine translation apparatus according to the second embodiment is different from the first embodiment only in the operation of the parsing process, and the parsing process will be described below. Here, FIG. 10 is a flowchart showing the operation of the syntax analysis process of the machine translation apparatus of the second embodiment.
[0060]
The syntax analysis unit 1.22 sets the translation pattern dictionary 1.33 as a pattern dictionary to be used (step S10.1), and sets a parameter n that defines the failsafe pattern dictionary to an initial value 0 (step S10. 2) The main parsing process is executed (step S10.3). Then, after incrementing the parameter n by 1 (step S10.4), it is determined whether or not the analysis is successful (step S10.5).
[0061]
If successful, the series of parsing processing is terminated. On the other hand, if it fails, it is determined whether or not the value of the parameter n is equal to or less than the number X of the fail safe pattern dictionaries 1.341 to 1.34X (step S10.6). Here, the value of the parameter n being larger than the number X of failsafe pattern dictionaries means that the analysis failed even when all the failsafe pattern dictionaries 1.341 to 1.34X are applied. End the analysis process. On the other hand, if the value of the parameter n is equal to or less than the number X of failsafe pattern dictionaries, the failsafe pattern dictionary 1.34n defined by the parameter n is additionally set as a pattern dictionary used for syntax analysis (step S10. 7) Returning to the main syntax analysis processing in step S10.3 described above.
[0062]
Hereinafter, the syntax analysis process of the second embodiment will be described in detail using the following three input sentences (example sentence 1 to example sentence 3) as appropriate.
[0063]
“She found the ready crying” (example sentence 1)
“She is the ready living here.” (Example sentence 2)
“It wanted tending.” (Example sentence 3)
Here, it is assumed that the stored contents (translation pattern) of the translation pattern dictionary 1.33 are as shown in FIG. Further, the number of fail safe pattern dictionaries X is 2, the stored contents (translation pattern) of the fail safe pattern dictionary 1.341 are as shown in FIG. 12, and the stored contents (translation pattern) of the fail safe pattern dictionary 1.342. Is as shown in FIG.
[0064]
Initially, a translation pattern dictionary 1.33 shown in FIG. 10 is set as a dictionary used for syntax analysis (step S10.1). Next, 0 is set to the parameter n (step S10.2), the main processing of syntax analysis is performed (step S10.3), and 1 is added to the parameter n after completion of the syntax analysis (step S10.4).
[0065]
When the example sentence 1 is an input sentence, the nodes 14.1 and 14.4 to 14.9 of the parsing result (tree structure) shown in FIG. 14 are respectively the source language patterns 11.1, 11 of FIG. As apparent from the correspondence to .4 to 11.9, the syntax analysis using only the translation pattern dictionary 1.33 succeeds, and the syntax analysis processing is terminated.
[0066]
On the other hand, when the example sentence 2 or the example sentence 3 is an input sentence, as shown in FIGS. 15 and 16, respectively, the syntax analysis cannot be performed only by applying the translation pattern dictionary 1.33. Therefore, the parameter n (= 1) Is less than the number of fail-safe dictionaries X (= 2), and is less than the number X (step S10.6), it is added to the translation pattern dictionary 1.33 and the fail-safe pattern dictionary 1.341 (the end of the code) 1 is the value of parameter n) (step S10.7), and the main parsing process is executed again (step S10.3).
[0067]
When the example sentence 2 is an input sentence, the pattern shown in FIG. 12 is applied to a portion where the pattern cannot be applied in a state where only the translation pattern dictionary 1.33 is applied by the additional set of the fail safe pattern dictionary 1.341. 12 A is applied, and the tree structure 17 shown in FIG. A can be constructed, the parsing is successful, and finally the parsing result shown in FIG. 17 is obtained.
[0068]
On the other hand, when the example sentence 3 is an input sentence, even if the fail-safe pattern dictionary 1.341 is additionally set, the syntax analysis still continues to fail, so the fail-safe pattern dictionary 1.342 is further added and again. Parse.
[0069]
An additional set of fail-safe pattern dictionaries 1.342 allows the pattern 13. As shown in FIG. 18, a tree structure 19. B can be constructed, the parsing is successful, and finally the parsing result shown in FIG. 18 can be obtained.
[0070]
Thereafter, the syntax generation process and the morpheme generation process are sequentially executed, and for each of the example sentence 1, the example sentence 2 and the example sentence 3, "she understood that a woman is crying", "she lives here. "I am a woman.", "It wants to be repaired."
[0071]
(B-3) Effects of the second embodiment
According to the machine translation apparatus and method of the second embodiment, in addition to the effects of the first embodiment, the following effects can also be achieved.
[0072]
(A) By providing a plurality of fail-safe pattern dictionaries, a priority order can be set for a pattern to be relieved. For example, in the case of the second embodiment, regarding the present participle verb, the pattern having the property of postfix noun modification of the present participle has priority over the pattern having the property of noun derivation in the present participle form alone. The ranking is high.
[0073]
(B) In addition, since a plurality of fail-safe pattern dictionaries are gradually increased and set, a parsing result can be obtained quickly for those having a high priority of the cause of the parsing failure.
[0074]
(B-4) Modified embodiment of the second embodiment
In the above description, the fail-safe pattern dictionary is used as a dictionary for relieving failure. However, it can be used not for the purpose of relieving failure but also as a means for setting the priority of the dictionary to be applied. For example, a dictionary composed of patterns registered by the user is the translation pattern dictionary 1.33 in the second embodiment, a grammatical pattern among the translation pattern dictionaries of the system is a fail safe pattern dictionary 1.341, and a translation of each word If the pattern related to is a fail-safe pattern dictionary 1.342, the pattern registered by the user is parsed with the highest priority, and if the analysis is successful only with the pattern registered by the user, the result is output as a translation result. Next, add a grammar pattern from the translation pattern dictionary of the system and analyze it. If the analysis is successful, output the result as a translation result, giving priority to the pattern registered by the user as much as possible. Can be translated.
[0075]
(C) Other embodiments
In each of the above embodiments, the present invention is applied to a machine translation device and method using a translation pattern. However, each of the above embodiments is characterized in processing until a syntax analysis result is obtained. The technical idea of each embodiment can be applied to other natural language processing apparatuses and methods. For example, the technical idea of the present invention can be applied to the part until the answer sentence is parsed by using a pattern (natural language pattern) in the question and answer apparatus.
[0076]
Moreover, although each said embodiment showed what applied this invention to the machine translation apparatus and method using a translation pattern, the technical idea of each said embodiment is also applied to the machine translation apparatus and method which does not use a translation pattern. Can be applied. For example, in the case of a device that parses a grammar rule by applying a grammar rule, the grammar rule dictionary may be separated into one that is applied from the beginning and one that is applied when analysis fails.
[0077]
Furthermore, the technical idea of the present invention can be applied not only to syntax analysis but also to morphological analysis. That is, the morphological analysis dictionary may be separated into one that is applied from the beginning and one that is applied when analysis fails. For example, an English verb that changes irregularly may be prepared in a morphological analysis dictionary to which “ed” is added to the original form of the verb when the analysis fails.
[0078]
【The invention's effect】
As described above, according to the natural language processing apparatus and method of the present invention, at least the basic dictionary used in the first analysis and one or more analysis failure relief dictionaries used in the analysis after the analysis failure are provided. Since a dictionary and / or analysis failure remedy dictionary is set appropriately and analysis after analysis failure is performed, even if analysis fails, the same analysis method can be applied to recover the failure without imposing a burden on the user it can.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a functional configuration of a machine translation apparatus according to a first embodiment.
FIG. 2 is a flowchart showing a translation operation of the machine translation apparatus of the first embodiment.
FIG. 3 is a flowchart showing details of syntax analysis processing according to the first embodiment;
FIG. 4 is an explanatory diagram illustrating an example of a morpheme analysis result according to the first embodiment.
FIG. 5 is an explanatory diagram showing an example of stored contents of a translation pattern dictionary 1.33 of the first embodiment.
FIG. 6 is an explanatory diagram illustrating an example of contents stored in a fail-safe pattern dictionary 1.34 according to the first embodiment;
FIG. 7 is an explanatory diagram illustrating a tree structure in the middle of syntax analysis according to the first embodiment;
FIG. 8 is an explanatory diagram illustrating a syntax analysis result that also uses the fail-safe pattern dictionary of 1.34 according to the first embodiment;
FIG. 9 is a block diagram illustrating a functional configuration of a machine translation apparatus according to the second embodiment.
FIG. 10 is a flowchart showing details of syntax analysis processing according to the second embodiment;
FIG. 11 is an explanatory diagram showing an example of stored contents of a translation pattern dictionary 1.33 of the second embodiment.
FIG. 12 is an explanatory diagram illustrating an example of contents stored in a fail-safe pattern dictionary 1.341 according to the second embodiment;
FIG. 13 is an explanatory diagram illustrating an example of contents stored in a fail-safe pattern dictionary 1.342 according to the second embodiment.
FIG. 14 is an explanatory diagram illustrating a syntax analysis result of Example sentence 1 using the translation pattern dictionary 1.33 of the second embodiment.
FIG. 15 is an explanatory diagram showing a tree structure in the middle of syntax analysis of example sentence 2 using the translation pattern dictionary 1.33 of the second embodiment;
FIG. 16 is an explanatory diagram showing a tree structure in the middle of syntax analysis of example sentence 3 using translation pattern dictionary 1.33 of the second embodiment;
FIG. 17 is an explanatory diagram illustrating a syntax analysis result of Example sentence 2 that also uses the fail-safe pattern dictionary 1.341 according to the second embodiment;
FIG. 18 is an explanatory diagram illustrating a syntax analysis result of Example sentence 2 that also uses the fail-safe pattern dictionary 1.342 according to the second embodiment;
[Explanation of symbols]
1.1 ... I / O unit,
1.2 ... Translation processing part,
1.21 ... Morphological analyzer
1.22 ... syntax analysis part,
1.3 ... dictionary storage unit,
1.33 ... Translation pattern dictionary,
1.34, 1.341 to 1.34X: Fail Safe pattern dictionary.

Claims (12)

入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が解析を行う自然言語処理装置において、
上記解析手段が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、
上記解析手段が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書と、
上記解析手段が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する利用辞書設定手段とを有し、
上記利用辞書設定手段は、上記解析手段の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、
上記解析手段は、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、最初から解析をし直す
ことを特徴とする自然言語処理装置。
In the natural language processing apparatus in which the analysis means analyzes the input natural language sentence or the analysis target which is a predetermined processing result for the natural language sentence,
A basic dictionary storing grammatically correct analysis information used by the analysis means at least in the first analysis;
One or a plurality of analysis failure relief dictionaries storing analysis information that can be used for analysis after analysis failure, and the analysis means can analyze a part to be analyzed that includes a grammatical error that is likely to fall ;
As a dictionary in which the analysis means is utilized, it possesses a usage dictionary setting means for setting at least one of the basic dictionary or the analysis fails relief dictionary,
The use dictionary setting means sets the basic dictionary at the time of the initial analysis of the analysis means, sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure,
The natural language processing apparatus characterized in that the analysis means re-analyzes from the beginning using the basic dictionary and the analysis failure relief dictionary at the time of analysis after analysis failure .
入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が解析を行う自然言語処理装置において、
上記解析手段が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、
上記解析手段が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書と、
上記解析手段が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する利用辞書設定手段とを有し、
上記利用辞書設定手段は、上記解析手段の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、
上記解析手段は、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、失敗した以降の解析を実行する
ことを特徴とする自然言語処理装置。
In the natural language processing apparatus in which the analysis means analyzes the input natural language sentence or the analysis target which is a predetermined processing result for the natural language sentence,
A basic dictionary storing grammatically correct analysis information used by the analysis means at least in the first analysis;
One or a plurality of analysis failure relief dictionaries storing analysis information that can be used for analysis after analysis failure, and the analysis means can analyze a part to be analyzed that includes a grammatical error that is likely to fall ;
As a dictionary in which the analysis means is utilized, it possesses a usage dictionary setting means for setting at least one of the basic dictionary or the analysis fails relief dictionary,
The use dictionary setting means sets the basic dictionary at the time of the initial analysis of the analysis means, sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure,
The natural language processing apparatus characterized in that the analysis means executes analysis after failure using the basic dictionary and the analysis failure relief dictionary at the time of analysis after failure of analysis .
複数の上記解析失敗救済辞書に優先順位を付与し、上記利用辞書設定手段は、解析失敗毎に、優先順位が低い解析失敗救済辞書をも次の解析で利用する辞書として追加設定することを特徴とする請求項1又は2に記載の自然言語処理装置。A priority is assigned to the plurality of analysis failure relief dictionaries, and the use dictionary setting means additionally sets an analysis failure relief dictionary having a low priority as a dictionary to be used in the next analysis for each analysis failure. The natural language processing apparatus according to claim 1 or 2 . 上記基本辞書及び上記解析失敗救済辞書の少なくとも2個は、通常の辞書内容を振り分けたものであることを特徴とする請求項1〜のいずれかに記載の自然言語処理装置。At least two of the basic dictionary and the analysis fails remedy dictionary, natural language processing apparatus according to any one of claims 1 to 3, characterized in that which was distributed normal dictionary contents. 上記解析手段が行う解析が構文解析であることを特徴とする請求項1〜のいずれかに記載の自然言語処理装置。Natural language processing apparatus according to any one of claims 1 to 4, characterized in that analysis the analyzing means performs is parsed. 上記解析手段が行う構文解析が、上記基本辞書及び又は上記解析失敗救済辞書に予め準備された自然言語パターンとの照合を利用するものであることを特徴とする請求項に記載の自然言語処理装置。6. The natural language processing according to claim 5 , wherein the syntax analysis performed by the analysis means uses a collation with a natural language pattern prepared in advance in the basic dictionary and / or the analysis failure relief dictionary. apparatus. 入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が実行する解析工程で解析を行う自然言語処理方法において、
上記解析工程が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、上記解析工程が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書とを備えると共に、
上記解析工程が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する、利用辞書設定手段が実行する利用辞書設定工程を有し、
上記利用辞書設定手段は、上記利用辞書設定工程において、上記解析工程の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析 失敗救済辞書を設定し、
上記解析手段は、上記解析工程において、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、最初から解析をし直す
ことを特徴とする自然言語処理方法。
In a natural language processing method for analyzing an input natural language sentence or an analysis target that is a predetermined processing result thereof in an analysis step executed by an analysis unit ,
A basic dictionary that stores grammatically correct analysis information used by the analysis process at least for the first analysis, and a grammatical error that the analysis process uses for analysis after an analysis failure is likely to occur. together and a one or more analysis failure relief dictionary stores analysis information that may analyze portion of the analysis target including,
As a dictionary used by the analysis step, there is a use dictionary setting step executed by a use dictionary setting unit for setting at least one of the basic dictionary or the analysis failure relief dictionary,
In the usage dictionary setting step, the usage dictionary setting means sets the basic dictionary at the time of the first analysis of the analysis step, sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure,
The natural language processing method characterized in that the analysis means re-analyzes from the beginning using the basic dictionary and the analysis failure relief dictionary at the time of analysis after analysis failure in the analysis step .
入力された自然言語文又はそれに対する所定の処理結果である解析対象に対し、解析手段が実行する解析工程で解析を行う自然言語処理方法において、
上記解析工程が少なくとも最初の解析で利用する、文法的に正しい解析用情報を格納している基本辞書と、上記解析工程が、解析失敗後の解析で利用する、人間が陥りやすい文法的な誤りを含む解析対象の部分を解析し得る解析用情報を格納している1又は複数の解析失敗救済辞書とを備えると共に、
上記解析工程が利用する辞書として、上記基本辞書又は上記解析失敗救済辞書の少なくとも一方を設定する、利用辞書設定手段が実行する利用辞書設定工程を有し、
上記利用辞書設定手段は、上記利用辞書設定工程において、上記解析工程の最初の解析時には上記基本辞書を設定し、その解析失敗後の解析時には、上記基本辞書及び上記解析失敗救済辞書を設定し、
上記解析手段は、上記解析工程において、解析失敗後の解析時では、上記基本辞書及び上記解析失敗救済辞書を利用して、失敗した以降の解析を実行する
ことを特徴とする自然言語処理方法。
In a natural language processing method for analyzing an input natural language sentence or an analysis target that is a predetermined processing result thereof in an analysis step executed by an analysis unit ,
A basic dictionary that stores grammatically correct analysis information used by the analysis process at least for the first analysis, and a grammatical error that the analysis process uses for analysis after an analysis failure is likely to occur. together and a one or more analysis failure relief dictionary stores analysis information that may analyze portion of the analysis target including,
As a dictionary used by the analysis step, there is a use dictionary setting step executed by a use dictionary setting unit for setting at least one of the basic dictionary or the analysis failure relief dictionary,
In the usage dictionary setting step, the usage dictionary setting means sets the basic dictionary at the time of the first analysis of the analysis step, sets the basic dictionary and the analysis failure relief dictionary at the time of analysis after the analysis failure,
The natural language processing method, wherein the analysis means performs analysis after the failure using the basic dictionary and the analysis failure relief dictionary at the time of analysis after failure in the analysis step .
複数の上記解析失敗救済辞書に優先順位を付与し、上記利用辞書設定手段は、上記利用辞書設定工程において、解析失敗毎に、優先順位が低い解析失敗救済辞書をも次の解析で利用する辞書として追加設定することを特徴とする請求項7又は8に記載の自然言語処理方法。Priorities are assigned to the plurality of analysis failure relief dictionaries, and the use dictionary setting means uses the analysis failure relief dictionary having a low priority in the next analysis for each analysis failure in the use dictionary setting step . The natural language processing method according to claim 7, wherein the natural language processing method is additionally set. 上記基本辞書及び上記解析失敗救済辞書の少なくとも2個は、通常の辞書内容を振り分けたものであることを特徴とする請求項7〜9のいずれかに記載の自然言語処理方法。 10. The natural language processing method according to claim 7 , wherein at least two of the basic dictionary and the analysis failure repair dictionary are obtained by sorting normal dictionary contents. 上記解析工程で行う解析が構文解析であることを特徴とする請求項7〜10のいずれかに記載の自然言語処理方法。The natural language processing method according to claim 7 , wherein the analysis performed in the analysis step is a syntax analysis. 上記解析工程で行う構文解析が、上記基本辞書及び又は上記解析失敗救済辞書に予め準備された自然言語パターンとの照合を利用するものであることを特徴とする請求項11に記載の自然言語処理方法。The natural language processing according to claim 11 , wherein the syntax analysis performed in the analysis step uses collation with a natural language pattern prepared in advance in the basic dictionary and / or the analysis failure relief dictionary. Method.
JP2000227189A 2000-07-27 2000-07-27 Natural language processing apparatus and method Expired - Fee Related JP4103313B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000227189A JP4103313B2 (en) 2000-07-27 2000-07-27 Natural language processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000227189A JP4103313B2 (en) 2000-07-27 2000-07-27 Natural language processing apparatus and method

Publications (2)

Publication Number Publication Date
JP2002041515A JP2002041515A (en) 2002-02-08
JP4103313B2 true JP4103313B2 (en) 2008-06-18

Family

ID=18720676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000227189A Expired - Fee Related JP4103313B2 (en) 2000-07-27 2000-07-27 Natural language processing apparatus and method

Country Status (1)

Country Link
JP (1) JP4103313B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187645A (en) * 1992-12-16 1994-07-08 Taiyo Yuden Co Ltd Optical disk tracking controller

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06187645A (en) * 1992-12-16 1994-07-08 Taiyo Yuden Co Ltd Optical disk tracking controller

Also Published As

Publication number Publication date
JP2002041515A (en) 2002-02-08

Similar Documents

Publication Publication Date Title
US5999896A (en) Method and system for identifying and resolving commonly confused words in a natural language parser
JP2002312357A (en) Dictionary register for machine translation, dictionary registering method for machine translation, machine translator, machine translating method and recording medium
JPH1011447A (en) Translation method and system based upon pattern
JP2001523019A (en) Automatic recognition of discourse structure in text body
JPS63254559A (en) Spelling aid for compound word
US20040243394A1 (en) Natural language processing apparatus, natural language processing method, and natural language processing program
JP2017199363A (en) Machine translation device and computer program for machine translation
CA2504111A1 (en) Critiquing clitic pronoun ordering in french
Fernandes et al. When does translation require context? a data-driven, multilingual exploration
JP4103313B2 (en) Natural language processing apparatus and method
CN116360794A (en) Database language analysis method, device, computer equipment and storage medium
US7389220B2 (en) Correcting incomplete negation errors in French language text
US20180011833A1 (en) Syntax analyzing device, learning device, machine translation device and storage medium
Andrews et al. The formal definition of Modula-2 and its associated interpreter
KR101747924B1 (en) Method of correcting korean utterance and apparatus perfroming the same
JP2003022264A (en) System for integrating language conversion processing
Horvat Hierarchical statistical semantic translation and realization
Dale et al. Two investigations into intelligent text processing
JPH0728630A (en) Program generating device
Wilkin et al. Parallel communicating grammar systems with context-free components are Turing complete for any communication model
KR100957824B1 (en) Method for checking grammatical error
JP4103311B2 (en) Natural language processing apparatus and method
Paggio Syntactic Analysis and Error Correction for Danish in the SCARRIE project
CA3199973A1 (en) Multilingual conversational semantic processor
JPS62209659A (en) Correcting device for japanese sentence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080317

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees