JP3345763B2 - 自然言語翻訳装置 - Google Patents
自然言語翻訳装置Info
- Publication number
- JP3345763B2 JP3345763B2 JP03447894A JP3447894A JP3345763B2 JP 3345763 B2 JP3345763 B2 JP 3345763B2 JP 03447894 A JP03447894 A JP 03447894A JP 3447894 A JP3447894 A JP 3447894A JP 3345763 B2 JP3345763 B2 JP 3345763B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- sentence
- seed
- syntax tree
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【0001】
【産業上の利用分野】本発明は、自然言語翻訳装置に係
り、特に、入力された自然言語の構造を解析して翻訳す
る、例えば、自然言語自動翻訳システムに用いられる自
然言語翻訳装置に関する。
り、特に、入力された自然言語の構造を解析して翻訳す
る、例えば、自然言語自動翻訳システムに用いられる自
然言語翻訳装置に関する。
【0002】
【従来の技術】従来の自然言語解析方法の一つに、構文
木辞書とのパターンマッチングによる方法ある(例え
ば、特願平5−201467)。この技術は、まず、入
力文を木構造に解析し、この木構造と辞書上に用意され
た構文木パターンとのパターンマッチングを行い、パタ
ーン中の各パターン要素(木構造のノード)の値とし
て、入力木構造の対応文要素を出力する。この解析の応
用が機械翻訳であれば、構文木パターンに対応した辞書
上の目的言語パターンを出力することによって訳文を得
る(例えば、特願昭60−247784)。
木辞書とのパターンマッチングによる方法ある(例え
ば、特願平5−201467)。この技術は、まず、入
力文を木構造に解析し、この木構造と辞書上に用意され
た構文木パターンとのパターンマッチングを行い、パタ
ーン中の各パターン要素(木構造のノード)の値とし
て、入力木構造の対応文要素を出力する。この解析の応
用が機械翻訳であれば、構文木パターンに対応した辞書
上の目的言語パターンを出力することによって訳文を得
る(例えば、特願昭60−247784)。
【0003】その他の従来の自然言語自動翻訳方式とし
ては、構文木辞書によらず、結合価パターンによるもの
が知られている(例えば、特願昭61−23282
6)。この技術では、木構造に解析された木構造から述
語と述語につながる文要素の関係を取り出し、結合価辞
書の条件と比較する。条件を満たせば、結合価辞書に記
載される目的言語パターンを基に、目的言語文を生成す
る。
ては、構文木辞書によらず、結合価パターンによるもの
が知られている(例えば、特願昭61−23282
6)。この技術では、木構造に解析された木構造から述
語と述語につながる文要素の関係を取り出し、結合価辞
書の条件と比較する。条件を満たせば、結合価辞書に記
載される目的言語パターンを基に、目的言語文を生成す
る。
【0004】また、ルールベースの機械翻訳システム
は、形態素・構文解析・意味解析・変換・生成の各フェ
ーズを経るトランスファー方式を基本に実現されている
(例えば、『Ikehara, S., "Multi-level Machine Tran
slation Method", Future Computing Systems, Vol.2.
No.3, 1989』等がある。
は、形態素・構文解析・意味解析・変換・生成の各フェ
ーズを経るトランスファー方式を基本に実現されている
(例えば、『Ikehara, S., "Multi-level Machine Tran
slation Method", Future Computing Systems, Vol.2.
No.3, 1989』等がある。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
技術では、パターンの各パターン要素の値として入力文
木構造の対応文要素のみを出力し、マッチしなかった入
力部の文要素に対しての考慮が払われていないため、パ
ターン要素の値として期待される部分木が複雑な場合
に、正しく部分木範囲を認定することができない。例え
ば、『彼はまるで彼女を知っているように話す』を解析
する場合に、「ように」が事実に反する仮定法の役割を
持っていることを解析するには、「まるで」を含んだ構
文木パターンを用意する必要がある。上記の従来の技術
では、パターン要素の値が「彼女を知っている」になる
のか、「まるで彼女を知っている」になるのか区別がで
きないという問題がある。
技術では、パターンの各パターン要素の値として入力文
木構造の対応文要素のみを出力し、マッチしなかった入
力部の文要素に対しての考慮が払われていないため、パ
ターン要素の値として期待される部分木が複雑な場合
に、正しく部分木範囲を認定することができない。例え
ば、『彼はまるで彼女を知っているように話す』を解析
する場合に、「ように」が事実に反する仮定法の役割を
持っていることを解析するには、「まるで」を含んだ構
文木パターンを用意する必要がある。上記の従来の技術
では、パターン要素の値が「彼女を知っている」になる
のか、「まるで彼女を知っている」になるのか区別がで
きないという問題がある。
【0006】また、従来ルールベースの機械翻訳システ
ムは、使用頻度の高い「なる」、「する」等の一部の和
語動詞や、仮定法等の英語の特殊な表現に対応する日本
語を翻訳する場合には、その表層条件が構文木上に散在
しているため、従来の結合価を基にした解析・変換で
は、十分に取り扱うことができない。散在している条件
を参照するには、構文木上の任意の要素を参照できるル
ール照応機能が必要である。また、意味解析のために
は、構文木を名詞句等の単位に分割する必要があるが、
このルールはその分割前に適用されなくてはならない。
ムは、使用頻度の高い「なる」、「する」等の一部の和
語動詞や、仮定法等の英語の特殊な表現に対応する日本
語を翻訳する場合には、その表層条件が構文木上に散在
しているため、従来の結合価を基にした解析・変換で
は、十分に取り扱うことができない。散在している条件
を参照するには、構文木上の任意の要素を参照できるル
ール照応機能が必要である。また、意味解析のために
は、構文木を名詞句等の単位に分割する必要があるが、
このルールはその分割前に適用されなくてはならない。
【0007】そのため、意味解析を行わない構文木への
直接ルール照応の導入が必要である。このルール照応機
能を木と木のパターンマッチングであり、この機能のみ
でも翻訳実験システムを構築することは可能であるが、
実用的な翻訳システムに採用するには以下の点で不利で
ある。
直接ルール照応の導入が必要である。このルール照応機
能を木と木のパターンマッチングであり、この機能のみ
でも翻訳実験システムを構築することは可能であるが、
実用的な翻訳システムに採用するには以下の点で不利で
ある。
【0008】・どのような構造も同等な単なる木構造と
して扱うため、構造の特性を生かしたルール記述ができ
ず、効率・ルール作成の容易さの点で不利である。
して扱うため、構造の特性を生かしたルール記述ができ
ず、効率・ルール作成の容易さの点で不利である。
【0009】・すべての言語現象をパターン化すること
は、非現実的であり、ルールの網羅性の保証が困難であ
る。
は、非現実的であり、ルールの網羅性の保証が困難であ
る。
【0010】上記は、従来のトランスファー方式を基本
にした翻訳システムの利点の裏返しである。両者の利点
を組み合わせるために、ルール照応による翻訳機能は構
文木上の長距離依存関係を含む等、意味解析型翻訳の能
力を越える表現を主に扱い、意味解析型翻訳は構文木の
葉の部分の翻訳を担当することが考えらるが、この場
合、どのように両者に親和性を持たせるかが問題とな
る。
にした翻訳システムの利点の裏返しである。両者の利点
を組み合わせるために、ルール照応による翻訳機能は構
文木上の長距離依存関係を含む等、意味解析型翻訳の能
力を越える表現を主に扱い、意味解析型翻訳は構文木の
葉の部分の翻訳を担当することが考えらるが、この場
合、どのように両者に親和性を持たせるかが問題とな
る。
【0011】本発明は、上記の点に鑑みてなされたもの
であり、上記従来の問題点を解決し、パターン要素の値
の範囲を正確に指定し、意図した部分木に対しての訳文
が出力できる自然言語翻訳装置を提供することを目的と
する。
であり、上記従来の問題点を解決し、パターン要素の値
の範囲を正確に指定し、意図した部分木に対しての訳文
が出力できる自然言語翻訳装置を提供することを目的と
する。
【0012】
【0013】
【0014】図2は、本発明の原理構成図である。
【0015】本発明の自然言語翻訳装置は、自然言語で
表現される単語列を入力する入力手段10と、単語列を
文要素毎に分割して、文要素に含まれる単語を認定する
とともに構文木21を生成する形態素解析手段20と、
構文木21と構文木テーブル35中の構文木パターンと
の照合によって入力文の構文解析を行う解析手段30
と、構文木パターンのノードである各パターン要素と入
力文の文要素との対応関係を出力する対応関係出力手段
40とを含む自然言語翻訳装置において、各ノードに変
数を持つ構文木パターンを記載した構文木テーブル35
と、各構文木パターンと対応する目的言語生成規則55
を用いて、 (a)種:目的言語に翻訳される変数 (b)種:目的言語に翻訳されない変数 (c)種:ノードの上位の変数に組み込まれる変数の3種のうち、 (a)種、(b)種変数に対応した文節は、それぞれの
変数の値となり、(c)種変数に対応した文節とどの文
節とどの変数にも対応しなかった文節は、木の根または
(a)種、(b)種変数にたどり着くまで構文木の根の
方に順次たどる:(a)種変数にたどり着いた場合に
は、その(a)種編集の一部となる:根又は(b)種変
数にたどり着いた場合には自由要素となる:と扱うマッ
チング手段32とを含む構文解析手段30と、(a)種
変数の値と自由要素の変換過程で翻訳し、目的言語生成
規則55に従って組み合わせることにより訳文を得る翻
訳手段50とを含む。
表現される単語列を入力する入力手段10と、単語列を
文要素毎に分割して、文要素に含まれる単語を認定する
とともに構文木21を生成する形態素解析手段20と、
構文木21と構文木テーブル35中の構文木パターンと
の照合によって入力文の構文解析を行う解析手段30
と、構文木パターンのノードである各パターン要素と入
力文の文要素との対応関係を出力する対応関係出力手段
40とを含む自然言語翻訳装置において、各ノードに変
数を持つ構文木パターンを記載した構文木テーブル35
と、各構文木パターンと対応する目的言語生成規則55
を用いて、 (a)種:目的言語に翻訳される変数 (b)種:目的言語に翻訳されない変数 (c)種:ノードの上位の変数に組み込まれる変数の3種のうち、 (a)種、(b)種変数に対応した文節は、それぞれの
変数の値となり、(c)種変数に対応した文節とどの文
節とどの変数にも対応しなかった文節は、木の根または
(a)種、(b)種変数にたどり着くまで構文木の根の
方に順次たどる:(a)種変数にたどり着いた場合に
は、その(a)種編集の一部となる:根又は(b)種変
数にたどり着いた場合には自由要素となる:と扱うマッ
チング手段32とを含む構文解析手段30と、(a)種
変数の値と自由要素の変換過程で翻訳し、目的言語生成
規則55に従って組み合わせることにより訳文を得る翻
訳手段50とを含む。
【0016】また、本発明の自由要素は、目的言語が英
語である場合に、副詞要素であり、かつ英語構造が文で
ある場合に、文修飾の副詞として扱い、英語構造が文以
外である場合は、ルールの適応を行わない。
語である場合に、副詞要素であり、かつ英語構造が文で
ある場合に、文修飾の副詞として扱い、英語構造が文以
外である場合は、ルールの適応を行わない。
【0017】
【作用】本発明は、木構造パターン上の各パターン要素
を3種類(a)種、(b)種、(c)種に分離されたパ
ターン要素を持つ木構造パターンを用いる照応処理を行
うことにより、パターン要素の値として得られる部分木
の範囲を正確に指定できる。即ち、多数の例文について
エキスパートが解析して作成した辞書(構文木テーブ
ル)を利用するものである。構文を解析し、目的言語に
マッピング(対応付け)する際に、予め分類されている
変数である(a)種、(b)種、(c)種の属性を参照
するため、パターン要素の値として得られる部分木の範
囲を正確に指定することができる。
を3種類(a)種、(b)種、(c)種に分離されたパ
ターン要素を持つ木構造パターンを用いる照応処理を行
うことにより、パターン要素の値として得られる部分木
の範囲を正確に指定できる。即ち、多数の例文について
エキスパートが解析して作成した辞書(構文木テーブ
ル)を利用するものである。構文を解析し、目的言語に
マッピング(対応付け)する際に、予め分類されている
変数である(a)種、(b)種、(c)種の属性を参照
するため、パターン要素の値として得られる部分木の範
囲を正確に指定することができる。
【0018】
【実施例】以下、図面を用いて本発明の実施例を詳細に
説明する。
説明する。
【0019】[解析処理]図3は、本発明の一実施例の
自然言語解析システムの概略構成を示す。自然言語解析
システムは、入力部1、形態素解析部2、構文解析部
3、パターンマッチ部4、出力部5、解析辞書6、構文
解析ルール7及び、構文木辞書8より構成される。
自然言語解析システムの概略構成を示す。自然言語解析
システムは、入力部1、形態素解析部2、構文解析部
3、パターンマッチ部4、出力部5、解析辞書6、構文
解析ルール7及び、構文木辞書8より構成される。
【0020】入力部1から入力された文は、形態素解析
部2で単語列に形態素解析され、構文解析部3で木構造
に解析される。続いて、パターンマッチ部4で構文解析
部3において解析された木構造と構文木辞書8との照合
が行われ、照合結果が出力部5から出力される。なお、
形態素解析部2は、解析辞書6を、構文解析部3は、構
文解析ルール7をそれぞれ参照する。
部2で単語列に形態素解析され、構文解析部3で木構造
に解析される。続いて、パターンマッチ部4で構文解析
部3において解析された木構造と構文木辞書8との照合
が行われ、照合結果が出力部5から出力される。なお、
形態素解析部2は、解析辞書6を、構文解析部3は、構
文解析ルール7をそれぞれ参照する。
【0021】図4は、本発明の一実施例の構文木辞書8
の構成を説明するための図である。ここでは、入力言語
が日本語の場合を取り上げる。構文木辞書8には、構文
木パターンが記載され、各々の構文木パターンは、それ
ぞれパターン番号81を持つ。構文木パターンの各パタ
ーン要素(木構造ノード)は、それぞれ名前(82)を
もつ。各パターン要素82は、予め要素種別83として
(a)種、(b)種、(c)種の3種類に分類されてい
る。条件84は、各パターン要素毎にそれぞれが満たす
べき条件が記述される。例えば、パターン番号100の
構成要素“A”は、種別が(a)種であり、その条件
は、“述語である”と記載される。
の構成を説明するための図である。ここでは、入力言語
が日本語の場合を取り上げる。構文木辞書8には、構文
木パターンが記載され、各々の構文木パターンは、それ
ぞれパターン番号81を持つ。構文木パターンの各パタ
ーン要素(木構造ノード)は、それぞれ名前(82)を
もつ。各パターン要素82は、予め要素種別83として
(a)種、(b)種、(c)種の3種類に分類されてい
る。条件84は、各パターン要素毎にそれぞれが満たす
べき条件が記述される。例えば、パターン番号100の
構成要素“A”は、種別が(a)種であり、その条件
は、“述語である”と記載される。
【0022】次に、パターンマッチ部4の動作を説明す
る。図5は、本発明の一実施例のパターンマッチ部の動
作のフローチャートである。
る。図5は、本発明の一実施例のパターンマッチ部の動
作のフローチャートである。
【0023】パターンマッチ部4は、まず、構文木辞書
7中に未処理パターンがあるかどうか検査し(ステップ
210)、未処理パターンがなければ、本パターンマッ
チによる解析は失敗である(ステップ280)。未処理
パターンがあれば、パターンを1つ取り出す(ステップ
220)。取り出したパターン中の各パターン要素毎
に、その条件を満たす文要素を、入力文から検索する
(ステップ230)。全てのパターン要素が満たされて
いれば(ステップ240)、パターンのマッチ範囲とパ
ターン中の各変数の値を設定し、解析結果とする(ステ
ップ250)。満たされていなければ、ステップ210
に戻って次のパターンについて処理する。
7中に未処理パターンがあるかどうか検査し(ステップ
210)、未処理パターンがなければ、本パターンマッ
チによる解析は失敗である(ステップ280)。未処理
パターンがあれば、パターンを1つ取り出す(ステップ
220)。取り出したパターン中の各パターン要素毎
に、その条件を満たす文要素を、入力文から検索する
(ステップ230)。全てのパターン要素が満たされて
いれば(ステップ240)、パターンのマッチ範囲とパ
ターン中の各変数の値を設定し、解析結果とする(ステ
ップ250)。満たされていなければ、ステップ210
に戻って次のパターンについて処理する。
【0024】上記図5のフローチャート中、ステップ2
50の各変数の値を設定し、解析結果とする場合の処理
を説明する。図6は、本発明の一実施例の解析結果を得
るための動作のフローチャートである。
50の各変数の値を設定し、解析結果とする場合の処理
を説明する。図6は、本発明の一実施例の解析結果を得
るための動作のフローチャートである。
【0025】まず、全ての文要素が終了しているかどう
かを調べ(ステップ310)、終了していれば、処理を
終了する。未処理文要素があれば、文の中から文要素を
1つ取り出す(文要素Xと呼ぶ)(ステップ320)。
文要素Xがパターンのパターン要素と一致するものであ
れば(ステップ330)、パターンのパターン要素種別
に応じた分岐が行われる。ここで、(a)種の要素であ
れば、文要素Xを同パターン要素の変数の値の一部とし
(ステップ350)、ステップ310に移行し、次の文
要素の処理を行う。(b)種の要素であれば、文要素X
はどの変数の値でもないと認定され(ステップ36
0)、ステップ310に移行する。(c)種の要素であ
ればステップ370に移行する。
かを調べ(ステップ310)、終了していれば、処理を
終了する。未処理文要素があれば、文の中から文要素を
1つ取り出す(文要素Xと呼ぶ)(ステップ320)。
文要素Xがパターンのパターン要素と一致するものであ
れば(ステップ330)、パターンのパターン要素種別
に応じた分岐が行われる。ここで、(a)種の要素であ
れば、文要素Xを同パターン要素の変数の値の一部とし
(ステップ350)、ステップ310に移行し、次の文
要素の処理を行う。(b)種の要素であれば、文要素X
はどの変数の値でもないと認定され(ステップ36
0)、ステップ310に移行する。(c)種の要素であ
ればステップ370に移行する。
【0026】ステップ330において、一致していなけ
ればステップ370に移行する。
ればステップ370に移行する。
【0027】ステップ370において、文要素Yとして
文要素Xの値を設定する。続いて、木構造上で文要素Y
の直上につながる文要素を取り出し、新たに文要素Yの
値とする(ステップ375)。すでに文要素Yが木構造
の根に当たり、直上の文要素が存在しなければ(ステッ
プ380)、文要素Xを自由要素と認定する(ステップ
410)。文要素Yの値が設定できれば、ステップ39
0に移行する。ステップ390では、文要素Yがパター
ンのパターン要素と一致するかどうかが調べられ、一致
しなければ、ステップ375に戻って、さらに、上記の
文要素について処理を繰り返す(ステップ390)。一
致するならば、パターンのパターン要素種別に応じた分
岐が行われる(ステップ400)。
文要素Xの値を設定する。続いて、木構造上で文要素Y
の直上につながる文要素を取り出し、新たに文要素Yの
値とする(ステップ375)。すでに文要素Yが木構造
の根に当たり、直上の文要素が存在しなければ(ステッ
プ380)、文要素Xを自由要素と認定する(ステップ
410)。文要素Yの値が設定できれば、ステップ39
0に移行する。ステップ390では、文要素Yがパター
ンのパターン要素と一致するかどうかが調べられ、一致
しなければ、ステップ375に戻って、さらに、上記の
文要素について処理を繰り返す(ステップ390)。一
致するならば、パターンのパターン要素種別に応じた分
岐が行われる(ステップ400)。
【0028】ステップ400における各属性の処理とし
て、 ・(a)種の要素であれば、文要素Xを同パターン要素
の変数の値の一部とし(ステップ420)、ステップ3
10に移行し、次の文要素の処理を行う。 ・(b)種の要素であれば、文要素Xは自由要素である
と認定され(ステップ410)、ステップ310に戻
る。 ・(c)種の要素であれば、ステップ375に戻って、
更に上位の文要素について処理を繰り返す。
て、 ・(a)種の要素であれば、文要素Xを同パターン要素
の変数の値の一部とし(ステップ420)、ステップ3
10に移行し、次の文要素の処理を行う。 ・(b)種の要素であれば、文要素Xは自由要素である
と認定され(ステップ410)、ステップ310に戻
る。 ・(c)種の要素であれば、ステップ375に戻って、
更に上位の文要素について処理を繰り返す。
【0029】上記の処理を具体例を用いて以下に示す。
【0030】第1の例として、入力文として日本語文
『彼はまるで彼女を知っているように話す』を解析する
場合を例にとって動作を説明する。
『彼はまるで彼女を知っているように話す』を解析する
場合を例にとって動作を説明する。
【0031】入力された例文は、構文解析部3で図7に
示すような構造に解析される。同図の例では、根の「話
す」に「彼」と「知っている」が接続されており、「知
っている」にはさらに「彼女」と「まるで」が接続され
ていることを表している。図5のステップ210の検査
では、未処理パターンがあるので、ステップ220で図
4のパターン100を取り出す。ステップ230で各パ
ターン要素の条件が満たされるかどうかを調べ、「話
す」がパターン要素Aの条件に「知っている」がパター
ン要素Bの条件に、「まるで」がパターン要素Cの条件
にそれぞれ合致する。従って、ステップ240の条件を
満たす。ステップ250で図6に示すフローチャートが
実行される。
示すような構造に解析される。同図の例では、根の「話
す」に「彼」と「知っている」が接続されており、「知
っている」にはさらに「彼女」と「まるで」が接続され
ていることを表している。図5のステップ210の検査
では、未処理パターンがあるので、ステップ220で図
4のパターン100を取り出す。ステップ230で各パ
ターン要素の条件が満たされるかどうかを調べ、「話
す」がパターン要素Aの条件に「知っている」がパター
ン要素Bの条件に、「まるで」がパターン要素Cの条件
にそれぞれ合致する。従って、ステップ240の条件を
満たす。ステップ250で図6に示すフローチャートが
実行される。
【0032】図6のフローチャートでは、入力文の5つ
のパターン要素「彼」、「まるで」、「彼女」、「知っ
ている」、「話す」のそれぞれについてどの変数の値で
あるのかの認定がなされる。まず、ステップ310の検
査では、未処理文要素があるので、ステップ320で
「彼」を取り出す。これは、パターンのパターン要素と
対応していない(ステップ330)ので、ステップ37
0に移行する。ここで、文要素Yとして、「彼」が設定
され、ステップ375で文要素Yとして「話す」が設定
される。ステップ380の条件を満たすのでステップ3
90に移行し、「話す」はパターンのパターン要素Aと
対応する(ステップ390)。図4に示す構文木辞書8
の例において、Aは(a)種の要素であるので(ステッ
プ400)、「彼」はパターン要素Aの値の一部となる
(ステップ420)。
のパターン要素「彼」、「まるで」、「彼女」、「知っ
ている」、「話す」のそれぞれについてどの変数の値で
あるのかの認定がなされる。まず、ステップ310の検
査では、未処理文要素があるので、ステップ320で
「彼」を取り出す。これは、パターンのパターン要素と
対応していない(ステップ330)ので、ステップ37
0に移行する。ここで、文要素Yとして、「彼」が設定
され、ステップ375で文要素Yとして「話す」が設定
される。ステップ380の条件を満たすのでステップ3
90に移行し、「話す」はパターンのパターン要素Aと
対応する(ステップ390)。図4に示す構文木辞書8
の例において、Aは(a)種の要素であるので(ステッ
プ400)、「彼」はパターン要素Aの値の一部となる
(ステップ420)。
【0033】次に、ステップ320で「まるで」が取り
出され、これは、パターン要素Cと対応する(ステップ
330)。図4に示す構文木辞書8の例において、Cは
(b)種の要素なので(ステップ340)、「まるで」
は変数の値とはならない(ステップ360)。
出され、これは、パターン要素Cと対応する(ステップ
330)。図4に示す構文木辞書8の例において、Cは
(b)種の要素なので(ステップ340)、「まるで」
は変数の値とはならない(ステップ360)。
【0034】次の「彼女」に対しては、「彼」と同様の
処理によって、パターン要素Bの値の一部となる。
処理によって、パターン要素Bの値の一部となる。
【0035】次に、ステップ320で「知っている」が
取り出されるが、これは、パターン要素Bと対応し(ス
テップ330)、図4によりBは、(a)種の要素なの
で(ステップ340)、「知っている」はパターン要素
Bの値の一部となる(ステップ350)。
取り出されるが、これは、パターン要素Bと対応し(ス
テップ330)、図4によりBは、(a)種の要素なの
で(ステップ340)、「知っている」はパターン要素
Bの値の一部となる(ステップ350)。
【0036】最後の「話す」に対しては、「知ってい
る」と同様の処理によって、パターン要素Aの値の一部
となる。
る」と同様の処理によって、パターン要素Aの値の一部
となる。
【0037】その結果、ステップ250の結果として
は、パターン要素Aの値として「彼」+「話す」を得、
パターン要素Bの値として「彼女」+「知っている」を
得る。
は、パターン要素Aの値として「彼」+「話す」を得、
パターン要素Bの値として「彼女」+「知っている」を
得る。
【0038】第2の例として、『彼は急いで椅子の足
を組む』を解析する場合を例として説明する。
を組む』を解析する場合を例として説明する。
【0039】この場合、例文は、構文解析部3で図9に
示すような構造に解析される。図9は、根の「組む」に
「彼」と「足」と「急いで」が接続されており、「足」
にはさらに「椅子」が接続されていることを表してい
る。
示すような構造に解析される。図9は、根の「組む」に
「彼」と「足」と「急いで」が接続されており、「足」
にはさらに「椅子」が接続されていることを表してい
る。
【0040】まず、ステップ210〜240で図4のパ
ターン100について条件の比較を行うが、条件を満た
さずステップ210に戻る。次にパターン110につい
て比較を行い、「組む」がパターン要素Aの条件に、
「彼」がパターン要素Bの条件に、「足」がパターン要
素Cの条件に、「椅子」がパターン要素Dの条件にそれ
ぞれ合致する。従って、ステップ240の条件を満た
し、ステップ250で図6のフローチャートが実行され
る。
ターン100について条件の比較を行うが、条件を満た
さずステップ210に戻る。次にパターン110につい
て比較を行い、「組む」がパターン要素Aの条件に、
「彼」がパターン要素Bの条件に、「足」がパターン要
素Cの条件に、「椅子」がパターン要素Dの条件にそれ
ぞれ合致する。従って、ステップ240の条件を満た
し、ステップ250で図6のフローチャートが実行され
る。
【0041】図6のフローチャートでは、入力文の5つ
の文要素「彼」、「急いで」、「椅子」、「足」、「組
む」のそれぞれについてどの変数の値であるかの認定が
なされる。「彼」と「足」については上記のの例と同
様に、それぞれ、構文木辞書のパターン要素B,Cの値
の一部であると認定される(ステップ310、320、
330、340、350)。「組む」については、やは
り前例と同様に変数の値とならない(ステップ310、
320、330、340、360)。「椅子」の場合、
ステップ330でパターン要素Dと対応するが、Dは
(c)種の要素(ステップ340)なので、ステップ3
70に移行する。ステップ370で文要素Yとして「椅
子」が設定され、ステップ375で文要素Yとして
「足」が設定される。ステップ380の条件を満たすの
で、ステップ390に移行し、「足」はパターンのパタ
ーン要素Cと対応する(ステップ390)。Cは(a)
種の要素なので(ステップ400)、「足」はパターン
要素Cの値の一部となる(ステップ420)。「急い
で」の場合、ステップ330の条件を満たさず、ステッ
プ370で文要素Yとして「急いで」が設定され、さら
に、ステップ375で文要素Yとして「組む」が設定さ
れる。文要素Yはステップ380、ステップ390の条
件を満たし、ステップ400に移行する。「組む」の対
応パターン要素は、Aであり、種別は(b)であるの
で、ステップ410に移行する。従って、「急いで」は
自由要素であると認定される。
の文要素「彼」、「急いで」、「椅子」、「足」、「組
む」のそれぞれについてどの変数の値であるかの認定が
なされる。「彼」と「足」については上記のの例と同
様に、それぞれ、構文木辞書のパターン要素B,Cの値
の一部であると認定される(ステップ310、320、
330、340、350)。「組む」については、やは
り前例と同様に変数の値とならない(ステップ310、
320、330、340、360)。「椅子」の場合、
ステップ330でパターン要素Dと対応するが、Dは
(c)種の要素(ステップ340)なので、ステップ3
70に移行する。ステップ370で文要素Yとして「椅
子」が設定され、ステップ375で文要素Yとして
「足」が設定される。ステップ380の条件を満たすの
で、ステップ390に移行し、「足」はパターンのパタ
ーン要素Cと対応する(ステップ390)。Cは(a)
種の要素なので(ステップ400)、「足」はパターン
要素Cの値の一部となる(ステップ420)。「急い
で」の場合、ステップ330の条件を満たさず、ステッ
プ370で文要素Yとして「急いで」が設定され、さら
に、ステップ375で文要素Yとして「組む」が設定さ
れる。文要素Yはステップ380、ステップ390の条
件を満たし、ステップ400に移行する。「組む」の対
応パターン要素は、Aであり、種別は(b)であるの
で、ステップ410に移行する。従って、「急いで」は
自由要素であると認定される。
【0042】その結果、ステップ250の結果として
は、パターン要素Bの値として、「彼」、パターン要素
Cの値として「椅子」+「足」を、自由要素として「急
いで」をそれぞれ得る。
は、パターン要素Bの値として、「彼」、パターン要素
Cの値として「椅子」+「足」を、自由要素として「急
いで」をそれぞれ得る。
【0043】[翻訳処理]次に、本発明の上記の解析処
理を自然言語自動翻訳システムに採用した場合の例につ
いて説明する。
理を自然言語自動翻訳システムに採用した場合の例につ
いて説明する。
【0044】図10は、本発明の一実施例の自動言語自
動翻訳システムの概略構成を示す。同図に示すシステム
は、入力部501、解析部502、変換部503、生成
部504、出力部505、解析辞書506、変換辞書5
07及び生成辞書508より構成される。
動翻訳システムの概略構成を示す。同図に示すシステム
は、入力部501、解析部502、変換部503、生成
部504、出力部505、解析辞書506、変換辞書5
07及び生成辞書508より構成される。
【0045】入力部501から入力された文は、解析部
502で原言語構造に解析され、変換部503で目的言
語表現パターンに変換される。続いて、生成部504で
目的言語文を得、出力部505から目的言語文が出力さ
れる。なお、解析部502は解析辞書506を、変換部
503は変換辞書507を、生成部504は生成辞書5
08をそれぞれ参照する。
502で原言語構造に解析され、変換部503で目的言
語表現パターンに変換される。続いて、生成部504で
目的言語文を得、出力部505から目的言語文が出力さ
れる。なお、解析部502は解析辞書506を、変換部
503は変換辞書507を、生成部504は生成辞書5
08をそれぞれ参照する。
【0046】図11は、本発明の一実施例の解析部の動
作のフローチャートである。
作のフローチャートである。
【0047】まず、上記の図5に示すパターンマッチ部
4による解析処理を実行し(ステップ610)、解析に
失敗したら(ステップ620)、従来のルールベースの
機械翻訳システムの解析処理を行う(ステップ63
0)。
4による解析処理を実行し(ステップ610)、解析に
失敗したら(ステップ620)、従来のルールベースの
機械翻訳システムの解析処理を行う(ステップ63
0)。
【0048】図12は、本発明の一実施例の変換辞書の
構成を示す。ここでは、目的言語が英語の場合を取り上
げる。変換辞書507には、構文木辞書8の各パターン
と1対1に対応した目的言語構成ルール820が記載さ
れる。それぞれのルールには、パターン番号810が記
載され、パターン番号810との一致により対応がとれ
る。
構成を示す。ここでは、目的言語が英語の場合を取り上
げる。変換辞書507には、構文木辞書8の各パターン
と1対1に対応した目的言語構成ルール820が記載さ
れる。それぞれのルールには、パターン番号810が記
載され、パターン番号810との一致により対応がとれ
る。
【0049】図13は、本発明の一実施例の変換部の動
作のフローチャートである。
作のフローチャートである。
【0050】上記の図5のパターンマッチ部4の解析処
理においてステップ280の処理が行われた場合、即
ち、解析処理が失敗したら(ステップ710)、従来の
技術による変換処理を行い(ステップ720)、変換結
果とする。成功していたら、変換辞書507から、解析
部502でマッチしたパターンの番号と同一のパターン
番号を持つ目的言語構成ルールを取り出す(ステップ7
30)。次に(a)種のパターン要素の値及び自由要素
を従来技術を用いて目的言語構造に変換する(ステップ
740)。続いて、変換辞書507の目的言語構成ルー
ルに従って、各パターン要素の値の変換結果を組み合わ
せて(ステップ750)、変換結果とする。
理においてステップ280の処理が行われた場合、即
ち、解析処理が失敗したら(ステップ710)、従来の
技術による変換処理を行い(ステップ720)、変換結
果とする。成功していたら、変換辞書507から、解析
部502でマッチしたパターンの番号と同一のパターン
番号を持つ目的言語構成ルールを取り出す(ステップ7
30)。次に(a)種のパターン要素の値及び自由要素
を従来技術を用いて目的言語構造に変換する(ステップ
740)。続いて、変換辞書507の目的言語構成ルー
ルに従って、各パターン要素の値の変換結果を組み合わ
せて(ステップ750)、変換結果とする。
【0051】第2の例として、原言語が日本語で目的
言語が英語の場合で、「彼はまるで彼女を知っているよ
うに話す」を翻訳する場合を例にとって説明する。構文
木辞書8の各パターンに対応して、図12に示すような
英語の生成ルールが用意される。前述の解析方法でマッ
チしたパターン番号として100が得られ、パターン要
素Aの値として「彼」+「話す」、パターン要素Bの値
として「彼女」+「知っている」を得ている。同解析は
成功している(ステップ710)ので、パターン番号1
00の目的言語構成ルールを取り出し(ステップ73
0)、パターン要素Aとパターン要素Bの翻訳結果を得
る(ステップ740)。例えば、Aの翻訳結果とし
て、"he talks"を、Bの翻訳結果として"he knew her"
を得る(ステップ740)。続いて、目的言語構成ルー
ルに従って、各パターン要素の値の変換結果を組み合わ
せて、英語構造を生成し、生成部505に渡す(ステッ
プ750)。生成部505は、訳文として例えば、"He
talks as if he knew her." を出力する。
言語が英語の場合で、「彼はまるで彼女を知っているよ
うに話す」を翻訳する場合を例にとって説明する。構文
木辞書8の各パターンに対応して、図12に示すような
英語の生成ルールが用意される。前述の解析方法でマッ
チしたパターン番号として100が得られ、パターン要
素Aの値として「彼」+「話す」、パターン要素Bの値
として「彼女」+「知っている」を得ている。同解析は
成功している(ステップ710)ので、パターン番号1
00の目的言語構成ルールを取り出し(ステップ73
0)、パターン要素Aとパターン要素Bの翻訳結果を得
る(ステップ740)。例えば、Aの翻訳結果とし
て、"he talks"を、Bの翻訳結果として"he knew her"
を得る(ステップ740)。続いて、目的言語構成ルー
ルに従って、各パターン要素の値の変換結果を組み合わ
せて、英語構造を生成し、生成部505に渡す(ステッ
プ750)。生成部505は、訳文として例えば、"He
talks as if he knew her." を出力する。
【0052】従来の技術により同例を翻訳した場合、パ
ターン要素Bの値が「彼女」+「知っている」なのか、
「彼女」+「知っている」+「まるで」なのかが明確で
なかった。後者として判断された場合、「まるで」が翻
訳され、訳文として例えば、"He talks as if he knew
her completely."が得られていた。
ターン要素Bの値が「彼女」+「知っている」なのか、
「彼女」+「知っている」+「まるで」なのかが明確で
なかった。後者として判断された場合、「まるで」が翻
訳され、訳文として例えば、"He talks as if he knew
her completely."が得られていた。
【0053】第3の例として、「彼は急いで椅子の足
を組む」を翻訳する場合を例にとって説明する。上記の
解析方法で、マッチしたパターン番号として110が得
られ、パターン要素Bの値として「彼」、パターン要素
Cの値として「椅子」+「足」、自由要素として「急い
で」をそれぞれ得ている。同解析は成功している(ステ
ップ710)ので、ステップ730に移行する。パター
ン番号110の目的言語構成ルールを取り出し(ステッ
プ730)、パターン要素Bとパターン要素C及び自由
要素の翻訳結果を得る。例えば、Bの翻訳結果として"h
e"を、Cの翻訳結果として"chair leg" を自由要素の翻
訳結果として"hurriedly" をそれぞれ得る(ステップ7
40)。続いて、生成部504は、目的言語構成ルール
に従って各パターン要素の値の変換結果を組み合わせ
て、英語構造を生成し、生成文を出力部505に渡す。
出力部505は、訳文として例えば"He hurriedly asse
mbles chair legs."を出力する(ステップ750)。
を組む」を翻訳する場合を例にとって説明する。上記の
解析方法で、マッチしたパターン番号として110が得
られ、パターン要素Bの値として「彼」、パターン要素
Cの値として「椅子」+「足」、自由要素として「急い
で」をそれぞれ得ている。同解析は成功している(ステ
ップ710)ので、ステップ730に移行する。パター
ン番号110の目的言語構成ルールを取り出し(ステッ
プ730)、パターン要素Bとパターン要素C及び自由
要素の翻訳結果を得る。例えば、Bの翻訳結果として"h
e"を、Cの翻訳結果として"chair leg" を自由要素の翻
訳結果として"hurriedly" をそれぞれ得る(ステップ7
40)。続いて、生成部504は、目的言語構成ルール
に従って各パターン要素の値の変換結果を組み合わせ
て、英語構造を生成し、生成文を出力部505に渡す。
出力部505は、訳文として例えば"He hurriedly asse
mbles chair legs."を出力する(ステップ750)。
【0054】従来の技術では、同例を翻訳した場合、パ
ターン要素Cの値が「足」なのか、「椅子」+「足」な
のかが明確でなかった。前者として判断された場合、
「椅子」の訳語が失われ、訳文として例えば、"He hurr
iedly assembles legs."が得られていた。あるいは、訳
語消失を避けるため、パターン要素Dを除いた形で辞書
を記述すれば、「彼は、足を組む」でも"He assembls l
egs." が訳出されていた(この場合の動詞はcross が正
しい) 。
ターン要素Cの値が「足」なのか、「椅子」+「足」な
のかが明確でなかった。前者として判断された場合、
「椅子」の訳語が失われ、訳文として例えば、"He hurr
iedly assembles legs."が得られていた。あるいは、訳
語消失を避けるため、パターン要素Dを除いた形で辞書
を記述すれば、「彼は、足を組む」でも"He assembls l
egs." が訳出されていた(この場合の動詞はcross が正
しい) 。
【0055】次に、翻訳システムで用いる構成木テーブ
ルのパターン要素を分類する手順を説明する。図14
は、本発明の一実施例の構成木テーブルのパターン要素
を分類する手順のフローチャートである。分類は訳例に
基づいて行われる。
ルのパターン要素を分類する手順を説明する。図14
は、本発明の一実施例の構成木テーブルのパターン要素
を分類する手順のフローチャートである。分類は訳例に
基づいて行われる。
【0056】まず、訳例から文要素を1つ取り出す(ス
テップ1010、1020)。その文要素がパターンを
選択する条件となる文要素でなく、ここにどのような文
要素が来てもかまわないものであれば(ステップ103
0)、その文要素をパターン要素としない(ステップ1
040)。条件になる文要素であるがこの文要素に対応
する訳語がない場合(ステップ1050)、(b)種の
パターン要素とする(ステップ1070)。対応する訳
語があるが、訳語が一意に決定され(ステップ105
5)、かつ本文要素が構文木上で下位の文要素の訳出に
影響しない(ステップ1060)ならば、(b)種のパ
ターン要素とする(ステップ1070)。一意に決定さ
れないか、下位の文要素の訳出に影響する場合には、構
文木上で上位に(a)種要素があるかどうかが調べられ
(ステップ1080)、なければ(a)種のパターン要
素とする(ステップ1120)。上位に(a)種要素が
あった場合には、本文要素の訳出が構文木上で上位の文
要素によって決定される(ステップ1090)か、また
は、本文要素によって構文木上で上位の文要素の訳出が
決定される(ステップ1100)。パターン要素種別が
決定すれば、ステップ1010に戻り、次の文要素に対
しての処理が行われる。
テップ1010、1020)。その文要素がパターンを
選択する条件となる文要素でなく、ここにどのような文
要素が来てもかまわないものであれば(ステップ103
0)、その文要素をパターン要素としない(ステップ1
040)。条件になる文要素であるがこの文要素に対応
する訳語がない場合(ステップ1050)、(b)種の
パターン要素とする(ステップ1070)。対応する訳
語があるが、訳語が一意に決定され(ステップ105
5)、かつ本文要素が構文木上で下位の文要素の訳出に
影響しない(ステップ1060)ならば、(b)種のパ
ターン要素とする(ステップ1070)。一意に決定さ
れないか、下位の文要素の訳出に影響する場合には、構
文木上で上位に(a)種要素があるかどうかが調べられ
(ステップ1080)、なければ(a)種のパターン要
素とする(ステップ1120)。上位に(a)種要素が
あった場合には、本文要素の訳出が構文木上で上位の文
要素によって決定される(ステップ1090)か、また
は、本文要素によって構文木上で上位の文要素の訳出が
決定される(ステップ1100)。パターン要素種別が
決定すれば、ステップ1010に戻り、次の文要素に対
しての処理が行われる。
【0057】次に、「彼の父は急いで大きな椅子の足を
組んだ」に対して、"His father hurriedly assembled
the large chair legs."の訳例があった場合、この訳例
を基に、パターン要素を作成する手順を説明する。原言
語文は図15の構造を持っている。図15の各文要素に
対してステップ1030以降の判断がなされる。それぞ
れの文要素について説明する。
組んだ」に対して、"His father hurriedly assembled
the large chair legs."の訳例があった場合、この訳例
を基に、パターン要素を作成する手順を説明する。原言
語文は図15の構造を持っている。図15の各文要素に
対してステップ1030以降の判断がなされる。それぞ
れの文要素について説明する。
【0058】「組んだ」:ここは「組む」でなくてはな
らないため、ステップ1030からステップ1050に
移行する。対応する訳語は必ず"assemble"であり、
「父」、「足」、「急いで」は「組む」を訳語選択条件
として用いない(ステップ1050、1055、106
0から1070に移行する)ため、(b)種要素とす
る。
らないため、ステップ1030からステップ1050に
移行する。対応する訳語は必ず"assemble"であり、
「父」、「足」、「急いで」は「組む」を訳語選択条件
として用いない(ステップ1050、1055、106
0から1070に移行する)ため、(b)種要素とす
る。
【0059】「父」:ここは意味カテゴリが[人]以外
では本パターンを選択できない(ステップ1030から
1050に移行する)。訳語は"father"であるが変化し
得る(ステップ1050、1055から1080に移行
する)。上位には、「組む」があるが、(a)種要素は
ない(ステップ1080から1120へ移行する)た
め、(a)種要素とする。
では本パターンを選択できない(ステップ1030から
1050に移行する)。訳語は"father"であるが変化し
得る(ステップ1050、1055から1080に移行
する)。上位には、「組む」があるが、(a)種要素は
ない(ステップ1080から1120へ移行する)た
め、(a)種要素とする。
【0060】「彼」:「父」に対する修飾要素は何であ
ってもかまわないので、ステップ1030から1040
に移行し、パターン要素としない。
ってもかまわないので、ステップ1030から1040
に移行し、パターン要素としない。
【0061】「足」:「足」でなくてはならない(ステ
ップ1030から1050へ移行する)。しかし、「椅
子の足」は"chair leg" であるが、「机の足」の訳語
は"desk's leg"となる等、「椅子」と組み合わせて訳す
必要がある(ステップ1050、1055、1060か
らステップ1080へ移行する)。上位には「組む」が
あるが、(a)種要素はない(ステップ1080からス
テップ1120へ移行する)ため、(a)種要素とす
る。
ップ1030から1050へ移行する)。しかし、「椅
子の足」は"chair leg" であるが、「机の足」の訳語
は"desk's leg"となる等、「椅子」と組み合わせて訳す
必要がある(ステップ1050、1055、1060か
らステップ1080へ移行する)。上位には「組む」が
あるが、(a)種要素はない(ステップ1080からス
テップ1120へ移行する)ため、(a)種要素とす
る。
【0062】「椅子」:ここの意味カテゴリが[生物]
の場合は、動詞は"assemble"ではなく、"cross" となる
ため、本パターンを選択できない。従って、ステップ1
030からステップ1050に移行する。訳語は、"cha
ir" であるが、変化し得る(ステップ1050、105
5から1080移行する)。上位に(a)種要素の
「足」があり(ステップ1080からステップ1090
移行する)、「足」と組み合わせて初めて訳語が決定さ
れる(ステップ1090から1110移行する)ため、
(c)種要素とする。
の場合は、動詞は"assemble"ではなく、"cross" となる
ため、本パターンを選択できない。従って、ステップ1
030からステップ1050に移行する。訳語は、"cha
ir" であるが、変化し得る(ステップ1050、105
5から1080移行する)。上位に(a)種要素の
「足」があり(ステップ1080からステップ1090
移行する)、「足」と組み合わせて初めて訳語が決定さ
れる(ステップ1090から1110移行する)ため、
(c)種要素とする。
【0063】「大きな」:「椅子」に対する修飾要素は
何であってもかまわないのでステップ1030からステ
ップ1040に移行し、パターン要素としない。
何であってもかまわないのでステップ1030からステ
ップ1040に移行し、パターン要素としない。
【0064】「急いで」:「組む」に対する修飾要素が
追加されてもかまわないので、ステップ1030からス
テップ1040に移行し、パターン要素としない。
追加されてもかまわないので、ステップ1030からス
テップ1040に移行し、パターン要素としない。
【0065】上記の手順により、例えば、図4に示すパ
ターン110が得られる。
ターン110が得られる。
【0066】
【発明の効果】上述のように、本発明の自然言語翻訳装
置によれば構文木パターン中の各パターン要素の値とし
て得られる部分木の範囲を正確に指定できる。
置によれば構文木パターン中の各パターン要素の値とし
て得られる部分木の範囲を正確に指定できる。
【0067】また、上述の解析方法を適用した翻訳方法
を用いると、意図した部分木に対しての訳文を出力でき
る、自然言語自動翻訳システムが構築できる。
を用いると、意図した部分木に対しての訳文を出力でき
る、自然言語自動翻訳システムが構築できる。
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例の自然言語解析システムの概
略構成図である。
略構成図である。
【図4】本発明の一実施例の構文木辞書の構成を説明す
るための図である。
るための図である。
【図5】本1明の一実施例のパターンマッチ部の動作の
フローチャートである。
フローチャートである。
【図6】本発明の一実施例の解析結果を得るための動作
のフローチャートである。
のフローチャートである。
【図7】本発明の一実施例の入力文解析の結果の構造を
示す図である。
示す図である。
【図8】本発明の一実施例の構文木パターンの例を示す
図である。
図である。
【図9】本発明の一実施例の入力文解析の結果の構造を
示す図である。
示す図である。
【図10】本発明の一実施例の自動言語自動翻訳システ
ムの概略構成図である。
ムの概略構成図である。
【図11】本発明の一実施例の解析部の動作のフローチ
ャートである。
ャートである。
【図12】本発明の一実施例の変換辞書の構成図であ
る。
る。
【図13】本発明の一実施例の変換部の動作のフローチ
ャートである。
ャートである。
【図14】本発明の一実施例の構成木テーブルのパター
ン要素を分類する手順のフローチャートである。
ン要素を分類する手順のフローチャートである。
【図15】本発明の一実施例の例文の構造を示す動作説
明図である。
明図である。
1 入力部 2 形態素解析部 3 構文解析部 4 パタンマッチ部 5 出力部 6 解析辞書 7 構文解析ルール 8 構文木辞書 10 入力手段 20 形態素解析手段 21 構文木 30 解析手段 31 分類済3種変数 32 マッチング手段 35 構文木テーブル 40 対応関係出力手段 50 翻訳手段 55 目的言語生成規則 81 パターン番号 82 構成要素 83 要素種別 84 条件 501 入力部 502 解析部 503 変換部 504 生成部 505 出力部 506 解析辞書 507 変換辞書 508 生成辞書 810 パターン番号 820 目的言語構成ルール
フロントページの続き (56)参考文献 特開 平6−236394(JP,A) 松尾義博,日本語述語の意味属性に応 じた英語構文の決定,情報処理学会第45 回(平成4年後期)全国大会講演論文集 (3),日本,1992年9月28日,3− 111〜3−112 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 JICSTファイル(JOIS)
Claims (2)
- 【請求項1】 自然言語で表現される単語列を入力する
入力手段と、単語列を文要素毎に分割して、文要素に含
まれる単語を認定するとともに構文木を生成する形態素
解析手段と、該構文木と構文木テーブル中の構文木パタ
ーンとの照合によって入力文の構文解析を行う構文解析
手段と、該構文木パターンのノードである各パターン要
素と入力文の文要素との対応関係を出力する対応関係出
力手段とを含む自然言語翻訳装置において、 各ノードに変数を持つ構文木パターンを記載した構文木
テーブルと、各構文木パターンと対応する目的言語生成
規則を用いて、 (a)種:目的言語に翻訳される変数 (b)種:目的言語に翻訳されない変数 (c)種:ノードの上位の変数に組み込まれる変数の3
種のうち、 (a)種、(b)種変数に対応した文節は、それぞれの
変数の値となり、(c)種の変数に対応した文節とどの
文節とどの変数にも対応しなかった文節は、 木の根または(a)種、(b)種変数にたどり着くまで
構文木の根の方に順次たどる: (a)種変数にたどり着いた場合には、その(a)種編
集の一部となる: 根又は(b)種変数にたどり着いた場合には自由要素と
なる: と扱うマッチング手段とを含む構文解析手段と、 (a)種変数の値と自由要素の変換過程で翻訳し、目的
言語生成規則に従って組み合わせることにより訳文を得
る翻訳手段とを含むことを特徴とする自然言語翻訳装
置。 - 【請求項2】 前記目的言語が英語である場合に、前記
自由要素は、副詞要素であり、かつ英語構造が文である
場合に、文修飾の副詞として扱い、英語構造が文以外で
ある場合は、ルールの適応を行わない請求項1記載の自
然言語翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03447894A JP3345763B2 (ja) | 1994-03-04 | 1994-03-04 | 自然言語翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03447894A JP3345763B2 (ja) | 1994-03-04 | 1994-03-04 | 自然言語翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07244666A JPH07244666A (ja) | 1995-09-19 |
JP3345763B2 true JP3345763B2 (ja) | 2002-11-18 |
Family
ID=12415365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03447894A Expired - Fee Related JP3345763B2 (ja) | 1994-03-04 | 1994-03-04 | 自然言語翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3345763B2 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005527894A (ja) | 2002-03-28 | 2005-09-15 | ユニバーシティ・オブ・サザン・カリフォルニア | 統計的機械翻訳 |
US7711545B2 (en) | 2003-07-02 | 2010-05-04 | Language Weaver, Inc. | Empirical methods for splitting compound words with application to machine translation |
US7698125B2 (en) | 2004-03-15 | 2010-04-13 | Language Weaver, Inc. | Training tree transducers for probabilistic operations |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US7974833B2 (en) | 2005-06-21 | 2011-07-05 | Language Weaver, Inc. | Weighted system of expressing language information using a compact notation |
US7389222B1 (en) | 2005-08-02 | 2008-06-17 | Language Weaver, Inc. | Task parallelization in a text-to-text system |
US7813918B2 (en) | 2005-08-03 | 2010-10-12 | Language Weaver, Inc. | Identifying documents which form translated pairs, within a document collection |
US7624020B2 (en) | 2005-09-09 | 2009-11-24 | Language Weaver, Inc. | Adapter for allowing both online and offline training of a text to text system |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
-
1994
- 1994-03-04 JP JP03447894A patent/JP3345763B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
松尾義博,日本語述語の意味属性に応じた英語構文の決定,情報処理学会第45回(平成4年後期)全国大会講演論文集(3),日本,1992年9月28日,3−111〜3−112 |
Also Published As
Publication number | Publication date |
---|---|
JPH07244666A (ja) | 1995-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3345763B2 (ja) | 自然言語翻訳装置 | |
US7565281B2 (en) | Machine translation | |
US7447623B2 (en) | Machine translation | |
US6330530B1 (en) | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures | |
US20050137853A1 (en) | Machine translation | |
US20050171757A1 (en) | Machine translation | |
Dahl | Translating spanish into logic through logic | |
Bais et al. | A model of a generic natural language interface for querying database | |
JP3919732B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
KR100194798B1 (ko) | 개념 구조를 이용한 다국어 번역시스템에서 단일의미단어 통합 처리 방법 | |
JP3287068B2 (ja) | 自然言語自動翻訳装置 | |
JP3892227B2 (ja) | 機械翻訳システム | |
Aref et al. | English to Arabic machine translation: a critical review and suggestions for development | |
JPH06236394A (ja) | 自然言語自動翻訳装置 | |
JP2935928B2 (ja) | 自然言語翻訳装置 | |
JP2004086919A (ja) | 機械翻訳システム | |
EP1306773A1 (en) | Machine translation | |
JPH07334504A (ja) | 日本語処理システム | |
JPH0256066A (ja) | 訳語複合名詞化処理方式 | |
EP1306774A1 (en) | Machine translation | |
JPS6386071A (ja) | 自然言語翻訳方式 | |
JPH0922413A (ja) | 属性とクラスの関係を一般化する方法と装置 | |
JPH04263364A (ja) | 自然言語自動翻訳方法 | |
JP2002245037A (ja) | 句アラインメント方法 | |
Boguslavsky et al. | within an Advanced NLP System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |