JPH06195373A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH06195373A JPH06195373A JP4343703A JP34370392A JPH06195373A JP H06195373 A JPH06195373 A JP H06195373A JP 4343703 A JP4343703 A JP 4343703A JP 34370392 A JP34370392 A JP 34370392A JP H06195373 A JPH06195373 A JP H06195373A
- Authority
- JP
- Japan
- Prior art keywords
- syntax
- rule
- priority
- tree
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 構文の競合が起こったときに純粋に文法的な
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供する。 【構成】 構文構造の適切さに関する指標を表す構文優
先規則を格納する記憶手段19と、記憶手段19に格納
すべき構文優先規則を入力、修正、または削除する入力
手段11と、同一の文から複数通りの構文構造が得られ
たときに記憶手段19に格納された構文優先規則を参照
して各構文構造の優先順位を決定する構文優先解釈手段
15とを備えている。
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供する。 【構成】 構文構造の適切さに関する指標を表す構文優
先規則を格納する記憶手段19と、記憶手段19に格納
すべき構文優先規則を入力、修正、または削除する入力
手段11と、同一の文から複数通りの構文構造が得られ
たときに記憶手段19に格納された構文優先規則を参照
して各構文構造の優先順位を決定する構文優先解釈手段
15とを備えている。
Description
【0001】
【産業上の利用分野】本発明は、1つの入力文から複数
通りの構文構造を構築できる機械翻訳装置に関する。
通りの構文構造を構築できる機械翻訳装置に関する。
【0002】
【従来の技術】従来の機械翻訳装置は、入力手段から入
力されたソース言語を主中央処理装置(メインCPU)
の制御により翻訳モジュールに入力し、この入力された
ソース言語をメモリに記憶されているメイン辞書やユー
ザ辞書から成る辞書、文法規則および木構造変換規則を
利用して、翻訳モジュールによってターゲット言語に翻
訳するように構成されている。
力されたソース言語を主中央処理装置(メインCPU)
の制御により翻訳モジュールに入力し、この入力された
ソース言語をメモリに記憶されているメイン辞書やユー
ザ辞書から成る辞書、文法規則および木構造変換規則を
利用して、翻訳モジュールによってターゲット言語に翻
訳するように構成されている。
【0003】上記従来の機械翻訳装置では、形態素解析
の結果得られた品詞から、辞書と文法規則を用いて構文
解析を行うと、ほとんどの場合1つの原文に対して複数
通りの構文構造を構築できるので、それに応じて1つの
原文に対して複数通りの翻訳文を生成できる。
の結果得られた品詞から、辞書と文法規則を用いて構文
解析を行うと、ほとんどの場合1つの原文に対して複数
通りの構文構造を構築できるので、それに応じて1つの
原文に対して複数通りの翻訳文を生成できる。
【0004】現実の翻訳作業においては、ほとんどの場
合1つの原文に対しては1つの翻訳文だけしか必要とせ
ず、可能な限り最良の翻訳文であることが望ましい。従
って、1つの原文から複数通りの構文構造ひいては複数
通りの翻訳文が得られる可能性のある場合には、それら
の間で「良さ」を比較して最良の翻訳文を決定する必要
がある。最良の翻訳文を決定するにはいくつかの方法が
知られている。
合1つの原文に対しては1つの翻訳文だけしか必要とせ
ず、可能な限り最良の翻訳文であることが望ましい。従
って、1つの原文から複数通りの構文構造ひいては複数
通りの翻訳文が得られる可能性のある場合には、それら
の間で「良さ」を比較して最良の翻訳文を決定する必要
がある。最良の翻訳文を決定するにはいくつかの方法が
知られている。
【0005】また、従来の機械翻訳装置の多くは、使用
者にとって使いやすくなるように、装置の動作の傾向を
使用者が部分的に変更可能なように構成されている。変
更可能な内容としては一般に次のようなものが知られて
いる。
者にとって使いやすくなるように、装置の動作の傾向を
使用者が部分的に変更可能なように構成されている。変
更可能な内容としては一般に次のようなものが知られて
いる。
【0006】(a)装置の辞書に収録されていない単語
や熟語を登録する。
や熟語を登録する。
【0007】(b)ある特定の条件下では、ある単語や
熟語の訳語を、ある特定のものに限って出力したり、あ
るいはある単語や熟語を原言語のまま出力したり、ある
単語や熟語に関して原言語における発音を目的言語で表
記しただけの形で出力したりする。
熟語の訳語を、ある特定のものに限って出力したり、あ
るいはある単語や熟語を原言語のまま出力したり、ある
単語や熟語に関して原言語における発音を目的言語で表
記しただけの形で出力したりする。
【0008】(c)構文解析を実行する度合を全体的に
深くしたり浅くしたりする。
深くしたり浅くしたりする。
【0009】上述したように、従来の機械翻訳装置にお
いて使用者がその動作を変更することが可能な部分は、
単語や熟語レベルでの訳語出力に関する内容か、あるい
は翻訳過程のある処理の全体的な傾向の強弱を調整する
という程度に限られていた。一般に、翻訳しようとする
文が長くなり構文構造が大規模になると、構文構造を局
所的にとらえているときには必ずしも決定できなかった
適切さが、構文構造を大局的にとらえると構文の形のみ
で適切さを決定できることを人間の翻訳者は経験的に感
じている。
いて使用者がその動作を変更することが可能な部分は、
単語や熟語レベルでの訳語出力に関する内容か、あるい
は翻訳過程のある処理の全体的な傾向の強弱を調整する
という程度に限られていた。一般に、翻訳しようとする
文が長くなり構文構造が大規模になると、構文構造を局
所的にとらえているときには必ずしも決定できなかった
適切さが、構文構造を大局的にとらえると構文の形のみ
で適切さを決定できることを人間の翻訳者は経験的に感
じている。
【0010】従って、構文の形のみに依存するこういっ
た経験則を抽出して系統化させれば、機械翻訳におい
て、1つの原文に対して複数通りの構文構造を構築しう
る場合の各構造の優劣を決定する際に有力な情報となり
得る。
た経験則を抽出して系統化させれば、機械翻訳におい
て、1つの原文に対して複数通りの構文構造を構築しう
る場合の各構造の優劣を決定する際に有力な情報となり
得る。
【0011】
【発明が解決しようとする課題】しかし、従来の機械翻
訳装置では上述したような情報が利用されていなかった
ので、文法知識に堪能な使用者にとってはより良い翻訳
文を選択するために自分の思い通りの構文が選択されて
ほしいという欲求を持っても、それを直接に反映させる
ことができなかった。
訳装置では上述したような情報が利用されていなかった
ので、文法知識に堪能な使用者にとってはより良い翻訳
文を選択するために自分の思い通りの構文が選択されて
ほしいという欲求を持っても、それを直接に反映させる
ことができなかった。
【0012】即ち、上述した従来の機械翻訳装置では、
その装置の動作の傾向を使用者が部分的に変更すること
が可能であるが、ほとんどの場合、単語や熟語レベルで
の訳語出力に関する内容か、あるいは翻訳過程のある処
理の全般的な傾向の強弱を調整するという程度に限られ
ており、特定の構文構造に関して何らかの措置を使用者
が行うということが不可能であった。
その装置の動作の傾向を使用者が部分的に変更すること
が可能であるが、ほとんどの場合、単語や熟語レベルで
の訳語出力に関する内容か、あるいは翻訳過程のある処
理の全般的な傾向の強弱を調整するという程度に限られ
ており、特定の構文構造に関して何らかの措置を使用者
が行うということが不可能であった。
【0013】従って、上述した従来の機械翻訳装置で
は、その装置の動作の傾向を使用者が変更することが可
能になっていても、その変更可能な範囲が文法知識に堪
能の使用者にとっては不十分なものであったので、より
良い翻訳文が出力される可能性がある状況であってもそ
の可能性が有効に活用されないという問題点があった。
本発明の目的は、上記従来の機械翻訳装置における問題
点に鑑み、構文の競合が起こったときに純粋に文法的な
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供することにある。
は、その装置の動作の傾向を使用者が変更することが可
能になっていても、その変更可能な範囲が文法知識に堪
能の使用者にとっては不十分なものであったので、より
良い翻訳文が出力される可能性がある状況であってもそ
の可能性が有効に活用されないという問題点があった。
本発明の目的は、上記従来の機械翻訳装置における問題
点に鑑み、構文の競合が起こったときに純粋に文法的な
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供することにある。
【0014】
【課題を解決するための手段】本発明の目的は、構文構
造の適切さに関する指標を表す情報を格納する記憶手段
と、記憶手段に格納すべき情報則を入力、修正、または
削除する入力手段と、同一の文から複数通りの構文構造
が得られたときに記憶手段に格納された情報を参照して
各構文構造の優先順位を決定する決定手段とを備えてい
る機械翻訳装置によって達成される。
造の適切さに関する指標を表す情報を格納する記憶手段
と、記憶手段に格納すべき情報則を入力、修正、または
削除する入力手段と、同一の文から複数通りの構文構造
が得られたときに記憶手段に格納された情報を参照して
各構文構造の優先順位を決定する決定手段とを備えてい
る機械翻訳装置によって達成される。
【0015】
【作用】本発明の機械翻訳装置では、記憶手段は構文構
造の適切さに関する指標を表す情報を格納し、入力手段
は記憶手段に格納すべき情報則を入力、修正、または削
除し、決定手段は同一の文から複数通りの構文構造が得
られたときに記憶手段に格納された情報を参照して各構
文構造の優先順位を決定する。
造の適切さに関する指標を表す情報を格納し、入力手段
は記憶手段に格納すべき情報則を入力、修正、または削
除し、決定手段は同一の文から複数通りの構文構造が得
られたときに記憶手段に格納された情報を参照して各構
文構造の優先順位を決定する。
【0016】
【実施例】以下、図面を参照して、本発明の機械翻訳装
置の実施例を詳細に説明する。
置の実施例を詳細に説明する。
【0017】図1は、ソース言語が英語、ターゲット言
語が日本語に設定された優先解釈を採用した本発明の機
械翻訳装置の一実施例の構成を示すブロック図である。
語が日本語に設定された優先解釈を採用した本発明の機
械翻訳装置の一実施例の構成を示すブロック図である。
【0018】図1の機械翻訳装置は、入力手段11、入
力手段11に接続された構文優先規則入力手段12、入
力手段11及び構文優先規則入力手段12に接続された
辞書引き・形態素解析手段13、辞書引き・形態素解析
手段13に接続された構文解析手段14、構文解析手段
14に接続された構文優先解釈手段15、構文優先解釈
手段15に接続された構文変換手段16、構文変換手段
16に接続された翻訳文生成手段17、翻訳文生成手段
17に接続された出力手段18、構文優先規則入力手段
12、辞書引き・形態素解析手段13、構文解析手段1
4、決定手段である構文優先解釈手段15、構文変換手
段16、翻訳文生成手段17に共通して接続されている
記憶手段19、及び、上記全ての手段に共通に接続され
た動作制御手段20によって構成されている。
力手段11に接続された構文優先規則入力手段12、入
力手段11及び構文優先規則入力手段12に接続された
辞書引き・形態素解析手段13、辞書引き・形態素解析
手段13に接続された構文解析手段14、構文解析手段
14に接続された構文優先解釈手段15、構文優先解釈
手段15に接続された構文変換手段16、構文変換手段
16に接続された翻訳文生成手段17、翻訳文生成手段
17に接続された出力手段18、構文優先規則入力手段
12、辞書引き・形態素解析手段13、構文解析手段1
4、決定手段である構文優先解釈手段15、構文変換手
段16、翻訳文生成手段17に共通して接続されている
記憶手段19、及び、上記全ての手段に共通に接続され
た動作制御手段20によって構成されている。
【0019】上記記憶手段19は、辞書メモリ191、
文法規則メモリ192、木構造変換規則メモリ193、
構文優先解釈規則メモリ194、原文メモリ195、辞
書引きメモリ196、構文構造メモリ197、バッファ
メモリ198、及びポインタメモリ199によって構成
されている。
文法規則メモリ192、木構造変換規則メモリ193、
構文優先解釈規則メモリ194、原文メモリ195、辞
書引きメモリ196、構文構造メモリ197、バッファ
メモリ198、及びポインタメモリ199によって構成
されている。
【0020】構文構造そのものの適切さの情報を利用で
き、同一の文から逐次にあるいは同時に複数通りの構文
構造が組み立て得る場合に、いずれの構文構造が適切あ
るいは不適切であるかを文の内容によらずある程度は決
定することができる場合がある。
き、同一の文から逐次にあるいは同時に複数通りの構文
構造が組み立て得る場合に、いずれの構文構造が適切あ
るいは不適切であるかを文の内容によらずある程度は決
定することができる場合がある。
【0021】本実施例では、上記の決定を実行すること
ができ、1つの原文に対して同時に1つの翻訳文だけ出
力でき、ユーザが入力手段を操作することにより別の翻
訳文が逐次に出力される機械翻訳装置を説明する。
ができ、1つの原文に対して同時に1つの翻訳文だけ出
力でき、ユーザが入力手段を操作することにより別の翻
訳文が逐次に出力される機械翻訳装置を説明する。
【0022】以下の説明では、「構文構造そのものの適
切さの優劣」を“構文優先度”と呼び、構文優先度を拠
りどころとして適切な構文を選択することを“構文優先
解釈”または単に“優先解釈”と呼ぶ。
切さの優劣」を“構文優先度”と呼び、構文優先度を拠
りどころとして適切な構文を選択することを“構文優先
解釈”または単に“優先解釈”と呼ぶ。
【0023】構文優先規則の入力については、翻訳中も
しくは翻訳を実行していないときなど、機械翻訳装置が
動作中であるなら随時構文優先規則の入力が可能な状態
に移行できるものとする。
しくは翻訳を実行していないときなど、機械翻訳装置が
動作中であるなら随時構文優先規則の入力が可能な状態
に移行できるものとする。
【0024】その移行の際には、ユーザが入力手段を用
いて定められた操作を実行すると、図1の動作制御手段
20によって、構文優先規則入力状態への移行が指示さ
れたと判断され、動作制御手段20によって構文優先規
則入力状態へと移行する。
いて定められた操作を実行すると、図1の動作制御手段
20によって、構文優先規則入力状態への移行が指示さ
れたと判断され、動作制御手段20によって構文優先規
則入力状態へと移行する。
【0025】構文優先規則の入力の際には図1の構文優
先規則入力手段12が用いられ、この結果、構文優先規
則は構文優先解釈規則メモリ194に格納される。
先規則入力手段12が用いられ、この結果、構文優先規
則は構文優先解釈規則メモリ194に格納される。
【0026】また、本実施例では、原文から翻訳文が得
られるまでに、「形態素解析」→「構文解析」→「変
換」→「翻訳文生成」という過程(図5参照)を要する
ような機械翻訳装置に適用する場合について説明してい
るが、本発明を適用しうる機械翻訳装置はこのような仕
組みのものに限定されるものではない。
られるまでに、「形態素解析」→「構文解析」→「変
換」→「翻訳文生成」という過程(図5参照)を要する
ような機械翻訳装置に適用する場合について説明してい
るが、本発明を適用しうる機械翻訳装置はこのような仕
組みのものに限定されるものではない。
【0027】「構文解析」の過程を含む機械翻訳装置に
はすべからく本発明が適用可能である。例えば、「構文
解析」の後に「意味解析」の過程を含むような機械翻訳
装置も含まれる。
はすべからく本発明が適用可能である。例えば、「構文
解析」の後に「意味解析」の過程を含むような機械翻訳
装置も含まれる。
【0028】次に、図2a及び図2bのフロ−チャ−ト
を参照して、図1の機械翻訳装置の動作を説明する まず、入力文“I bought films for
the camera and tapes for
the VTR.”(原文2)が原文メモリ195に
格納される(ステップS1)。原文メモリ195は図7
及び図8で示されるバッファAに相当する。
を参照して、図1の機械翻訳装置の動作を説明する まず、入力文“I bought films for
the camera and tapes for
the VTR.”(原文2)が原文メモリ195に
格納される(ステップS1)。原文メモリ195は図7
及び図8で示されるバッファAに相当する。
【0029】次に、辞書引き・形態素解析手段13によ
り辞書メモリ191が参照されながら原文メモリ195
(バッファA)の内容に形態素解析が施され、その結果
が辞書引きメモリ196に格納される(ステップS
2)。辞書引きメモリ196は図7及び図9で示される
バッファBに相当する。
り辞書メモリ191が参照されながら原文メモリ195
(バッファA)の内容に形態素解析が施され、その結果
が辞書引きメモリ196に格納される(ステップS
2)。辞書引きメモリ196は図7及び図9で示される
バッファBに相当する。
【0030】構文解析結果を格納する図1の構文構造メ
モリ197(バッファC)がクリアされ(ステップS
3)、続いてポインタPcがクリアされる(ステップS
4)。ポインタとは、メモリやバッファ上のある特定の
位置を指し示しておくために設定される変数である。
モリ197(バッファC)がクリアされ(ステップS
3)、続いてポインタPcがクリアされる(ステップS
4)。ポインタとは、メモリやバッファ上のある特定の
位置を指し示しておくために設定される変数である。
【0031】なお、図1に示す記憶手段19の内部に存
在している各メモリは、記憶手段19において固定的に
分類されているわけではなく、状況に応じて、記憶手段
19の中の適切な領域を占有することにより実現されて
いる。記憶手段19のどの領域がどのメモリとして利用
されるかは図1の動作制御手段20によって管理されて
いる。
在している各メモリは、記憶手段19において固定的に
分類されているわけではなく、状況に応じて、記憶手段
19の中の適切な領域を占有することにより実現されて
いる。記憶手段19のどの領域がどのメモリとして利用
されるかは図1の動作制御手段20によって管理されて
いる。
【0032】構文解析手段14により文法規則メモリ1
92が参照されながら構文解析が実行され、その結果、
辞書引きメモリ196(バッファB)の内容から構築可
能なすべての構造解析木が組み立てられ、構文構造メモ
リ197(バッファC)に格納される(ステップS
5)。原文2から作られる場合、図13と図14〜図2
1のそれぞれを組み合わせてできるような構造解析木が
原文メモリ195(バッフA)に格納される。辞書引き
メモリ196(バッファB)の内容から新たな構造解析
木がもう作成できなくなったらステップS5からステッ
プS6に進む。
92が参照されながら構文解析が実行され、その結果、
辞書引きメモリ196(バッファB)の内容から構築可
能なすべての構造解析木が組み立てられ、構文構造メモ
リ197(バッファC)に格納される(ステップS
5)。原文2から作られる場合、図13と図14〜図2
1のそれぞれを組み合わせてできるような構造解析木が
原文メモリ195(バッフA)に格納される。辞書引き
メモリ196(バッファB)の内容から新たな構造解析
木がもう作成できなくなったらステップS5からステッ
プS6に進む。
【0033】構文構造メモリ197(バッファC)に格
納されている複数の構造解析木のそれぞれについて、そ
の構造解析木に付随するフラグ変数Fcが0である場合
に、合致する構文優先規則が構文優先解釈規則メモリ1
94に存在しているかどうか、構文優先解釈手段15に
よって構文優先解釈規則メモリ194の検索が行われる
(ステップS6)。
納されている複数の構造解析木のそれぞれについて、そ
の構造解析木に付随するフラグ変数Fcが0である場合
に、合致する構文優先規則が構文優先解釈規則メモリ1
94に存在しているかどうか、構文優先解釈手段15に
よって構文優先解釈規則メモリ194の検索が行われる
(ステップS6)。
【0034】なお、本実施例の説明において、ある構造
解析木T1とある構文優先規則R1とが「合致する」と
は、R1の左辺に示されている構造解析木のうち「優先
すべき」と指定されているもの(これをいまTR1と呼
ぶ)とT1とが完全に同じものである場合はもちろん、
そうでなくても、T1がTR1より大きく、TR1の一
部分がT1全体と一致する構造になっている場合も含
む。
解析木T1とある構文優先規則R1とが「合致する」と
は、R1の左辺に示されている構造解析木のうち「優先
すべき」と指定されているもの(これをいまTR1と呼
ぶ)とT1とが完全に同じものである場合はもちろん、
そうでなくても、T1がTR1より大きく、TR1の一
部分がT1全体と一致する構造になっている場合も含
む。
【0035】但し、その逆にTR1がT1より大きく、
T1の一部分がTR1全体と一致する構造になっている
場合は含まない。
T1の一部分がTR1全体と一致する構造になっている
場合は含まない。
【0036】また、フラグ変数Fcとは、本実施例にお
いて、構文構造メモリ197(バッファC)に構造解析
木そのもののデータを格納する領域の他に、1つ1つの
構造解析木についてそれがかつて選択されたかどうかの
状態情報を保持する領域が存在し、これをそれぞれの構
造解析木に付随するフラグ変数Fcと称する。フラグ変
数Fcは状態によって0,1の2通りの値をとり得る。
今後、構文構造メモリ197(バッファC)に格納され
ている構造解析木の1つであるT1に付随するフラグ変
数FcをFc(T1)と表す。
いて、構文構造メモリ197(バッファC)に構造解析
木そのもののデータを格納する領域の他に、1つ1つの
構造解析木についてそれがかつて選択されたかどうかの
状態情報を保持する領域が存在し、これをそれぞれの構
造解析木に付随するフラグ変数Fcと称する。フラグ変
数Fcは状態によって0,1の2通りの値をとり得る。
今後、構文構造メモリ197(バッファC)に格納され
ている構造解析木の1つであるT1に付随するフラグ変
数FcをFc(T1)と表す。
【0037】上述したようにステップS3で構文構造メ
モリ197(バッファC)がクリアされる際にはフラグ
Fcは全て0にされる。よって、原文を入力してから初
めてステップS6に達したときには、構文構造メモリ1
97(バッファC)に存在するすべての構造解析木に関
してそのフラグFcは0である。
モリ197(バッファC)がクリアされる際にはフラグ
Fcは全て0にされる。よって、原文を入力してから初
めてステップS6に達したときには、構文構造メモリ1
97(バッファC)に存在するすべての構造解析木に関
してそのフラグFcは0である。
【0038】そのため、いまの場合では、ステップS6
では構文構造メモリ197(バッファC)に存在するす
べての構造解析木に対して構文優先規則とのマッチング
が実行される。また、表1に示すような構文優先規則が
ユーザによって入力されていて構文優先解釈規則メモリ
194に存在しているものとする。
では構文構造メモリ197(バッファC)に存在するす
べての構造解析木に対して構文優先規則とのマッチング
が実行される。また、表1に示すような構文優先規則が
ユーザによって入力されていて構文優先解釈規則メモリ
194に存在しているものとする。
【0039】
【表1】
【0040】構文構造メモリ197(バッファC)に存
在するすべての構造解析木の中で、図3のような構造解
析木だけが、表1の規則(y1)と合致する。図3の構
造解析木は図13と図18の部分的構造解析木を合成し
て得られるものであり、図3の構造解析木を構造解析木
Teと呼ぶ。
在するすべての構造解析木の中で、図3のような構造解
析木だけが、表1の規則(y1)と合致する。図3の構
造解析木は図13と図18の部分的構造解析木を合成し
て得られるものであり、図3の構造解析木を構造解析木
Teと呼ぶ。
【0041】構造解析木Teが表1の規則(y1)と合
致することは図24と図18または図3とを比較すれば
明らかである。よって、ステップS6でのマッチングの
結果、構造解析木TeをポインタPcが指す(ステップ
S7)。こうして、構造解析木Teとその他の構造解析
木Tyとの競合が起こった際に、構文優先規則の働きで
構造解析木Teが優先される。
致することは図24と図18または図3とを比較すれば
明らかである。よって、ステップS6でのマッチングの
結果、構造解析木TeをポインタPcが指す(ステップ
S7)。こうして、構造解析木Teとその他の構造解析
木Tyとの競合が起こった際に、構文優先規則の働きで
構造解析木Teが優先される。
【0042】次に、構造解析木Teに付随するフラグF
c(Te)に1がセットされる(ステップS9)。フラ
グFcが1あるいはそれ以上であることは、このフラグ
Fcに対応する構造解析木が変換部以降に送られたこと
があるということを意味する。
c(Te)に1がセットされる(ステップS9)。フラ
グFcが1あるいはそれ以上であることは、このフラグ
Fcに対応する構造解析木が変換部以降に送られたこと
があるということを意味する。
【0043】構造解析木Teが図1の構文変換手段16
に送られる(ステップS10)。これは図6では変換部
29に相当する。なお、本実施例の説明で用いられる
「送る」という言葉は、あくまでも情報に対して用いら
れるものであるから、送られたあと元の位置(バッファ
など)から無くなってしまうわけではない。例えば、構
文構造メモリ197(バッファC)に存在する構造解析
木Taが構文変換手段16に送られるわけであるが、送
られた後も構文構造メモリ197(バッファC)に構造
解析木Teは、構文構造メモリ197(バッファC)が
クリアされない限り存在し続ける。
に送られる(ステップS10)。これは図6では変換部
29に相当する。なお、本実施例の説明で用いられる
「送る」という言葉は、あくまでも情報に対して用いら
れるものであるから、送られたあと元の位置(バッファ
など)から無くなってしまうわけではない。例えば、構
文構造メモリ197(バッファC)に存在する構造解析
木Taが構文変換手段16に送られるわけであるが、送
られた後も構文構造メモリ197(バッファC)に構造
解析木Teは、構文構造メモリ197(バッファC)が
クリアされない限り存在し続ける。
【0044】こうして構文変換手段16で木構造変換規
則メモリ193が参照されながら構造解析木Teが変換
される。なお、本実施例の説明で用いられる「変換」と
いう言葉も、「送る」と同様、情報に対して用いられる
ものであるから、何かが変換された後も、変換前の形態
のものが原則として存在し続けている。
則メモリ193が参照されながら構造解析木Teが変換
される。なお、本実施例の説明で用いられる「変換」と
いう言葉も、「送る」と同様、情報に対して用いられる
ものであるから、何かが変換された後も、変換前の形態
のものが原則として存在し続けている。
【0045】そして、構造解析木Teが構文変換手段1
6で変換結果が得られたかどうかが判定される(ステッ
プS11)。変換結果が得られなければステップS11
からに進み、構文構造メモリ197(バッファC)に存
在している構造解析木のうち付随するフラグFcが0で
あるものが存在するかが判断され(ステップS17)、
上記ステップS17で存在すると判断されたならば、ス
テップS6に戻るが、存在しない判断されたならば翻訳
失敗となる。
6で変換結果が得られたかどうかが判定される(ステッ
プS11)。変換結果が得られなければステップS11
からに進み、構文構造メモリ197(バッファC)に存
在している構造解析木のうち付随するフラグFcが0で
あるものが存在するかが判断され(ステップS17)、
上記ステップS17で存在すると判断されたならば、ス
テップS6に戻るが、存在しない判断されたならば翻訳
失敗となる。
【0046】ステップS10において、構造解析木Ta
は構文変換手段16でその変換結果が得られるので、ス
テップS11からステップS12に進み、構造解析木T
e(変換後)が図1の翻訳文生成手段17に送られる。
図1の翻訳文生成手段17は図6では翻訳文生成部30
に相当する。
は構文変換手段16でその変換結果が得られるので、ス
テップS11からステップS12に進み、構造解析木T
e(変換後)が図1の翻訳文生成手段17に送られる。
図1の翻訳文生成手段17は図6では翻訳文生成部30
に相当する。
【0047】構造解析木Te(変換後)が翻訳文生成手
段17で生成結果が得られたかどうかが判定される(ス
テップS13)。生成結果が得られなければステップS
13からステップS17に進み、構文構造メモリ197
(バッファC)に存在している構造解析木のうち付随す
るフラグFcが0であるものが存在するかが判断され
(ステップS17)、存在すればステップS6に戻る
が、存在しなければ翻訳失敗となる。
段17で生成結果が得られたかどうかが判定される(ス
テップS13)。生成結果が得られなければステップS
13からステップS17に進み、構文構造メモリ197
(バッファC)に存在している構造解析木のうち付随す
るフラグFcが0であるものが存在するかが判断され
(ステップS17)、存在すればステップS6に戻る
が、存在しなければ翻訳失敗となる。
【0048】本実施例の場合には、ステップS13にお
いて、構造解析木Te(変換後)は翻訳文生成手段17
でその生成結果が得られるので、ステップS13からス
テップS14に進み、構造解析木Teの翻訳結果が出力
手段18に出力される。
いて、構造解析木Te(変換後)は翻訳文生成手段17
でその生成結果が得られるので、ステップS13からス
テップS14に進み、構造解析木Teの翻訳結果が出力
手段18に出力される。
【0049】このようにして出力手段18に出力された
原文2の翻訳文(構造解析木Teを採用した結果の)
“私は、カメラのためのフィルムとVTRのためのテー
プを買った。”(翻訳文8)が適切かどうかをユーザが
判断し、その判断の結果をステップS15で入力手段1
1から入力する。
原文2の翻訳文(構造解析木Teを採用した結果の)
“私は、カメラのためのフィルムとVTRのためのテー
プを買った。”(翻訳文8)が適切かどうかをユーザが
判断し、その判断の結果をステップS15で入力手段1
1から入力する。
【0050】もしユーザが翻訳文8を不適とする旨をス
テップS15で入力したら次のステップS16からステ
ップS17に戻るが、現在の機械翻訳装置の水準からみ
て、ほとんどの場合、原文2の翻訳結果として翻訳文8
は適切であると考えられる。従って多くの場合、ステッ
プS15でユーザは翻訳文8を適切とする旨を入力する
と考えられ、その場合は次のステップS15での判定に
より、原文2の翻訳は終了となる。
テップS15で入力したら次のステップS16からステ
ップS17に戻るが、現在の機械翻訳装置の水準からみ
て、ほとんどの場合、原文2の翻訳結果として翻訳文8
は適切であると考えられる。従って多くの場合、ステッ
プS15でユーザは翻訳文8を適切とする旨を入力する
と考えられ、その場合は次のステップS15での判定に
より、原文2の翻訳は終了となる。
【0051】以上のように、ユーザが入力した構文優先
規則を記憶しておいた結果、原文2の翻訳において構文
の競合が起こった際に、適切な構文に基づく訳文を最初
から出力することができた。もし構文優先規則を記憶さ
せてはいなければ、原文2を翻訳する際に、図3に示す
構造解析木Teではなく別の構造解析木が最初に選ばれ
ていたかもしれず、そうなると最初に出力される翻訳文
は、例えば、“私は、カメラとテープのためのフィルム
をVTRのために買った。”となっていたかも知れず、
これではユーザにとって不適であるとみなされる。
規則を記憶しておいた結果、原文2の翻訳において構文
の競合が起こった際に、適切な構文に基づく訳文を最初
から出力することができた。もし構文優先規則を記憶さ
せてはいなければ、原文2を翻訳する際に、図3に示す
構造解析木Teではなく別の構造解析木が最初に選ばれ
ていたかもしれず、そうなると最初に出力される翻訳文
は、例えば、“私は、カメラとテープのためのフィルム
をVTRのために買った。”となっていたかも知れず、
これではユーザにとって不適であるとみなされる。
【0052】次に、構文解析を含む機械翻訳装置の概略
を説明する。
を説明する。
【0053】図4は、構文解析を含む機械翻訳装置の構
成を概略的に説明するためのブロック図である。
成を概略的に説明するためのブロック図である。
【0054】図4の機械翻訳装置は、主中央処理装置
(メインCPU)21、メインメモリ22、陰極線管
(CRT)や液晶表示装置(LCD)などの表示装置2
3、キーボード24、翻訳モジュール25、翻訳用の辞
書・文法規則及び木構造変換規則等を格納しているメモ
リ26によって構成されている。
(メインCPU)21、メインメモリ22、陰極線管
(CRT)や液晶表示装置(LCD)などの表示装置2
3、キーボード24、翻訳モジュール25、翻訳用の辞
書・文法規則及び木構造変換規則等を格納しているメモ
リ26によって構成されている。
【0055】翻訳モジュール25は、ソース言語が入力
されると、それを翻訳してターゲット言語を出力する。
即ち、キーボード24から入力されたソース言語はメイ
ンCPU21の制御により翻訳モジュール25に送られ
る。翻訳モジュール25はメモリ26に記憶されている
辞書、文法規則及び木構造変換規則等を用いて、入力さ
れたソース言語を後に詳述するようにしてターゲット言
語に翻訳する。その結果は、メインメモリ22に一旦記
憶されると共に、表示装置23に表示される。メインメ
モリ22は各種プログラム実行中のレジスタメモリ及び
表示バッファ等にも利用される。
されると、それを翻訳してターゲット言語を出力する。
即ち、キーボード24から入力されたソース言語はメイ
ンCPU21の制御により翻訳モジュール25に送られ
る。翻訳モジュール25はメモリ26に記憶されている
辞書、文法規則及び木構造変換規則等を用いて、入力さ
れたソース言語を後に詳述するようにしてターゲット言
語に翻訳する。その結果は、メインメモリ22に一旦記
憶されると共に、表示装置23に表示される。メインメ
モリ22は各種プログラム実行中のレジスタメモリ及び
表示バッファ等にも利用される。
【0056】翻訳モジュール25で行われる機械翻訳に
は、図5に示すような解析レベルがある。図中左上にお
いてソース言語が入力されると、レベルL1の辞書引
き、レベルL2の形態素解析、レベルL3の構文解析、
…と、解析が進められる。
は、図5に示すような解析レベルがある。図中左上にお
いてソース言語が入力されると、レベルL1の辞書引
き、レベルL2の形態素解析、レベルL3の構文解析、
…と、解析が進められる。
【0057】機械翻訳はこの解析レベルにより、大きく
次の2つにわけられる。
次の2つにわけられる。
【0058】1つは、レベルL6のソース言語及びター
ゲット言語のどちらにも依存しない概念(中間言語と呼
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
10の形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
ゲット言語のどちらにも依存しない概念(中間言語と呼
ぶ)まで解析し、そこから、レベルL7の文脈生成、レ
ベルL8の意味生成、レベルL9の構文生成、レベルL
10の形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。
【0059】もう1つは、上述のレベルL2の形態素解
析、レベルL3の構文解析、レベルL4の意味解析及び
レベルL5の文脈解析のいずれかまで解析を行ってソー
ス言語の内部構造を得、次に、この得られたソース言語
の内部構造と同レベルのターゲット言語の内部構造に変
換した後、ターゲット言語を生成するトランスファー方
式である。
析、レベルL3の構文解析、レベルL4の意味解析及び
レベルL5の文脈解析のいずれかまで解析を行ってソー
ス言語の内部構造を得、次に、この得られたソース言語
の内部構造と同レベルのターゲット言語の内部構造に変
換した後、ターゲット言語を生成するトランスファー方
式である。
【0060】ここで、上記各解析について説明する。
【0061】(a)辞書引き、形態素解析 図4に示すメモリ26の辞書を引き、入力された文章を
各形態素列(単語列)に分割し、この各単語に対する品
詞などの文法情報および訳語を得て、更に、時制・人称
・数などを解析する。
各形態素列(単語列)に分割し、この各単語に対する品
詞などの文法情報および訳語を得て、更に、時制・人称
・数などを解析する。
【0062】(b)構文解析 後述するようにして単語間の係り受けなどの文章の構造
(構造解析木)を決定する。
(構造解析木)を決定する。
【0063】(c)意味解析 複数の構文解析の結果から意味的に正しいものとそうで
ないものを判別する。
ないものを判別する。
【0064】(d)文脈解析 話題を理解して省略や曖昧さを取り去る。
【0065】本発明で用いる翻訳モジュール25は、少
なくともレベルL3の構文解析のレベルまでの解析を行
うものとする。
なくともレベルL3の構文解析のレベルまでの解析を行
うものとする。
【0066】即ち、本実施例の翻訳モジュール25は図
6に示す機能を有する各部分からなる翻訳モジュールを
考える。
6に示す機能を有する各部分からなる翻訳モジュールを
考える。
【0067】図7は、機能素子を用いて翻訳モジュール
25をハ−ドウエアとして構築した場合のブロック図を
示す。
25をハ−ドウエアとして構築した場合のブロック図を
示す。
【0068】また、図8〜図12は、“This is
a pen.”(原文1)という英文を日本語に翻訳
する場合の図7に示す各バッファA〜Eの内容を示す。
a pen.”(原文1)という英文を日本語に翻訳
する場合の図7に示す各バッファA〜Eの内容を示す。
【0069】以下、図6〜図12を参照して図4の機械
翻訳装置による英日翻訳(英文から日本文への翻訳)の
動作を説明する。
翻訳装置による英日翻訳(英文から日本文への翻訳)の
動作を説明する。
【0070】まず、読み込まれた原文は図8に示すよう
に図7のバッファAに格納される。翻訳プログラム32
に基づく翻訳中央処理装置(翻訳CPU)31の制御に
より、図6の辞書引き形態素解析部27により、バッフ
ァAに格納された原文に従ってメモリ26の辞書を用い
て各単語の訳語等の情報が得られ、得られた情報は図7
のバッファBに格納される。
に図7のバッファAに格納される。翻訳プログラム32
に基づく翻訳中央処理装置(翻訳CPU)31の制御に
より、図6の辞書引き形態素解析部27により、バッフ
ァAに格納された原文に従ってメモリ26の辞書を用い
て各単語の訳語等の情報が得られ、得られた情報は図7
のバッファBに格納される。
【0071】例えば、その各情報の一部である品詞情報
は、図9のように格納される。ここで、thisは多品
詞語であるが、次に説明するように図6の構文解析部2
8により一意に決定される。
は、図9のように格納される。ここで、thisは多品
詞語であるが、次に説明するように図6の構文解析部2
8により一意に決定される。
【0072】構文解析部28ではメモリ26の辞書と文
法規則にしたがって、各単語間の係り受け関係を示す構
造解析木が図10に示すように決定されて、図7のバッ
ファCに格納される。
法規則にしたがって、各単語間の係り受け関係を示す構
造解析木が図10に示すように決定されて、図7のバッ
ファCに格納される。
【0073】この構造解析木は、次のようにして決定さ
れる。
れる。
【0074】メモリ26の文法規則から 文→主部+述部 主部→名詞句 述部→動詞+名詞句 名詞句→代名詞 名詞句→冠詞+名詞 の規則が得られる。この規則は、例えば、1つ目の規則
は“文とは、主部と述部からできている”ということを
表す。
は“文とは、主部と述部からできている”ということを
表す。
【0075】以下、この規則にしたがって構造解析木が
決定される。なお、図10のような構造解析木におい
て、実際の単語(図10では「this」「is」な
ど)の直上にある文法標識(図10では「代名詞」「動
詞」「冠詞」「名詞」など)を“終端標識”と称し、そ
れ以外の文法標識(図10では「文」「主部」「述部」
「名詞句」など)を“非終端標識”と称する。
決定される。なお、図10のような構造解析木におい
て、実際の単語(図10では「this」「is」な
ど)の直上にある文法標識(図10では「代名詞」「動
詞」「冠詞」「名詞」など)を“終端標識”と称し、そ
れ以外の文法標識(図10では「文」「主部」「述部」
「名詞句」など)を“非終端標識”と称する。
【0076】終端標識は一般に「品詞」と呼ばれる概念
と同等なものである。また、上述したような文法規則の
左辺(矢印より左端の項)は非終端標識でなければなら
ない。 図6の変換部29では、上述の構文解析部28
と同様にメモリ26の木構造変換規則を用いて、入力さ
れた英文に対する構文解析木(図10参照)の構造が図
11に示すように日本文に対する構造に変換される。そ
して、得られた結果が図7のバッファDに格納される。
と同等なものである。また、上述したような文法規則の
左辺(矢印より左端の項)は非終端標識でなければなら
ない。 図6の変換部29では、上述の構文解析部28
と同様にメモリ26の木構造変換規則を用いて、入力さ
れた英文に対する構文解析木(図10参照)の構造が図
11に示すように日本文に対する構造に変換される。そ
して、得られた結果が図7のバッファDに格納される。
【0077】図6の翻訳文生成部30は、得られた日本
文字「これ ペンである。」に適切な助詞「は」や助動
詞をつけて、図12のような日本語の形にして、図7の
バッファEに格納する。この日本文「これはペンであ
る。」は、翻訳モジュール25から出力され、メインメ
モリ22に格納されると共に、表示装置23に表示され
る。
文字「これ ペンである。」に適切な助詞「は」や助動
詞をつけて、図12のような日本語の形にして、図7の
バッファEに格納する。この日本文「これはペンであ
る。」は、翻訳モジュール25から出力され、メインメ
モリ22に格納されると共に、表示装置23に表示され
る。
【0078】次に、上述した図4の機械翻訳装置を参照
して図1の機械翻訳装置を再び説明する。
して図1の機械翻訳装置を再び説明する。
【0079】図1の機械翻訳装置の文法規則メモリ19
2に格納されている文法規則が表2に示されているよう
なものであるとする。
2に格納されている文法規則が表2に示されているよう
なものであるとする。
【0080】
【表2】
【0081】なお、図1の文法規則メモリ192は図7
ではメモリ26の一部に相当する。そして、表2のよう
な文法規則に使われている文法標識のうちどれが終端標
識でどれが非終端標識かは表3に示されている。
ではメモリ26の一部に相当する。そして、表2のよう
な文法規則に使われている文法標識のうちどれが終端標
識でどれが非終端標識かは表3に示されている。
【0082】
【表3】
【0083】このような機械翻訳装置に、原文“I b
ought films forthe camera
and tapes for the VTR.”
(原文2)が入力されると、形態素解析がなされた後、
表2のような文法規則に従って構文解析がなされる。そ
の結果、得られる構造解析木はおよそ図13のようにな
る。
ought films forthe camera
and tapes for the VTR.”
(原文2)が入力されると、形態素解析がなされた後、
表2のような文法規則に従って構文解析がなされる。そ
の結果、得られる構造解析木はおよそ図13のようにな
る。
【0084】ただし、原文2の場合、表2の文法規則だ
けでは構造解析木は1通りに決まらない。原文2の中の
“bought films for the cam
era and tapes for the VTR
”(部分節3)の部分は複数通りの解析が可能で、そ
のため図13では解析木が複数通りになる部分は解析木
の形を示さずにその部分全体を覆う三角形として表して
いる。
けでは構造解析木は1通りに決まらない。原文2の中の
“bought films for the cam
era and tapes for the VTR
”(部分節3)の部分は複数通りの解析が可能で、そ
のため図13では解析木が複数通りになる部分は解析木
の形を示さずにその部分全体を覆う三角形として表して
いる。
【0085】図13で解析木が複数通りになる部分の実
際の解析木の形を表したのが図14〜図21である。な
お、実際には部分節3と表2の文法規則から得られる解
析木の形は図14〜図21に示したもので全てではなく
他にも有り得るが、ここではそれらの説明を割愛する。
際の解析木の形を表したのが図14〜図21である。な
お、実際には部分節3と表2の文法規則から得られる解
析木の形は図14〜図21に示したもので全てではなく
他にも有り得るが、ここではそれらの説明を割愛する。
【0086】図14〜図21に示したそれぞれの部分的
解析木にある節点(A)を図13の構造解析木の節点
(A)と繋ぎ合わせて考えることによって、原文2全体
に相当する完全な構造解析木を得ることができる。
解析木にある節点(A)を図13の構造解析木の節点
(A)と繋ぎ合わせて考えることによって、原文2全体
に相当する完全な構造解析木を得ることができる。
【0087】図1の構文構造メモリ197(バッファ
C)はこれらの複数通りの構造解析木のデータを同時に
全て記憶することができる。なお、上述したように構文
構造メモリ197(バッファC)は図7のバッファCに
相当する。
C)はこれらの複数通りの構造解析木のデータを同時に
全て記憶することができる。なお、上述したように構文
構造メモリ197(バッファC)は図7のバッファCに
相当する。
【0088】これらの複数通りの構造解析木に対して、
ユーザが登録した構文優先規則に基づいて構造解析木の
形そのものに優劣をつける機能が、本発明で述べる構文
優先度の学習機能である。
ユーザが登録した構文優先規則に基づいて構造解析木の
形そのものに優劣をつける機能が、本発明で述べる構文
優先度の学習機能である。
【0089】構文優先解釈を導入した構文解析を実行す
る際には、表2で示されるような文法規則の他に、表1
で示されるような構文優先規則を用いる。
る際には、表2で示されるような文法規則の他に、表1
で示されるような構文優先規則を用いる。
【0090】構文優先規則とは、構造解析木の中の1つ
の非終端標識(これを非終端標識Aとする)について、
その下の標識群が所定の構造を形成している場合に、そ
れらの標識群の頂点に位置する非終端標識(すなわち非
終端標識A)を何らかの形で優先することを示す規則で
ある。
の非終端標識(これを非終端標識Aとする)について、
その下の標識群が所定の構造を形成している場合に、そ
れらの標識群の頂点に位置する非終端標識(すなわち非
終端標識A)を何らかの形で優先することを示す規則で
ある。
【0091】本発明の機械翻訳装置では、ユーザが構文
優先規則を入力し、それが機械翻訳装置に備えられてい
るメモリ手段に記憶される。このとき、規則は、全く新
規に入力してもよいし、すでに記憶されている規則を修
正する形でもよい。また、機械翻訳装置の製造者によっ
てあらかじめ用意されている構文優先規則が存在する場
合はそれを修正する形でもよい。あるいは、機械翻訳装
置の有する何らかの機能によって、機械翻訳装置の動作
の過程で構文優先規則が自動的に生成される場合は、そ
れを修正する形でもよい。
優先規則を入力し、それが機械翻訳装置に備えられてい
るメモリ手段に記憶される。このとき、規則は、全く新
規に入力してもよいし、すでに記憶されている規則を修
正する形でもよい。また、機械翻訳装置の製造者によっ
てあらかじめ用意されている構文優先規則が存在する場
合はそれを修正する形でもよい。あるいは、機械翻訳装
置の有する何らかの機能によって、機械翻訳装置の動作
の過程で構文優先規則が自動的に生成される場合は、そ
れを修正する形でもよい。
【0092】一つ一つの構文優先規則は表1の(y1)
に示されるような形式を持っている。
に示されるような形式を持っている。
【0093】ここで、矢印より前の部分、即ち表1の規
則(y1)では “名詞句(名詞句(名詞句+前置詞句(前置詞+*))
+等位接続詞+名詞句(名詞句+前置詞句(前置詞+
*))) 付帯条件;第5要素と第11要素の表層が等しい” の部分が規則の左辺であり、矢印より後の部分、即ち表
1の規則(y1)では1の部分が規則の右辺である。表
1の規則(y1)の左辺には「付帯条件」という項が存
在しているが、構文優先規則の左辺に「付帯条件」は必
須なものではない。
則(y1)では “名詞句(名詞句(名詞句+前置詞句(前置詞+*))
+等位接続詞+名詞句(名詞句+前置詞句(前置詞+
*))) 付帯条件;第5要素と第11要素の表層が等しい” の部分が規則の左辺であり、矢印より後の部分、即ち表
1の規則(y1)では1の部分が規則の右辺である。表
1の規則(y1)の左辺には「付帯条件」という項が存
在しているが、構文優先規則の左辺に「付帯条件」は必
須なものではない。
【0094】次に、構文優先規則の左辺の意味について
説明する。
説明する。
【0095】左辺のうち「付帯条件」を除く部分は、構
文解析木全体のうちある非終端標識およびそれより下層
にあるいくつかの非終端あるいは終端標識からなる部分
的な解析木の形を表現している。本実施例におけるその
表現方法を図22及び図23を用いて説明する。
文解析木全体のうちある非終端標識およびそれより下層
にあるいくつかの非終端あるいは終端標識からなる部分
的な解析木の形を表現している。本実施例におけるその
表現方法を図22及び図23を用いて説明する。
【0096】括弧記号‘(’と‘)’との間に記された
標識は、開き括弧記号‘(’のすぐ左にある標識の1つ
下位の節点の標識であることを示している。例えばA
(B)という規則は標識Aの1つ下に標識Bのみが存在
することを示している。また、プラス記号‘+’は、そ
の‘+’のすぐ左にある標識とその‘+’のすぐ右にあ
る標識とがそれぞれ1つ上の標識を共有していることを
示している。
標識は、開き括弧記号‘(’のすぐ左にある標識の1つ
下位の節点の標識であることを示している。例えばA
(B)という規則は標識Aの1つ下に標識Bのみが存在
することを示している。また、プラス記号‘+’は、そ
の‘+’のすぐ左にある標識とその‘+’のすぐ右にあ
る標識とがそれぞれ1つ上の標識を共有していることを
示している。
【0097】例えば、A(B+C)という規則は図22
に示すように非終端標識Aの1つ下に標識Bと標識Cと
が存在することを示している。
に示すように非終端標識Aの1つ下に標識Bと標識Cと
が存在することを示している。
【0098】以上で述べた括弧記号‘(’と‘)’およ
びプラス記号‘+’を用いることにより、どのように複
雑な構造解析木の形もその中の終端/非終端標識を一列
に並べて表現することが可能である。例えば図23のよ
うな構造解析木はA(B(C+D)+E+F)のように
表現される。
びプラス記号‘+’を用いることにより、どのように複
雑な構造解析木の形もその中の終端/非終端標識を一列
に並べて表現することが可能である。例えば図23のよ
うな構造解析木はA(B(C+D)+E+F)のように
表現される。
【0099】このことから、表1の構文優先規則(y
1)は図24のような構造解析木を示していることがわ
かる。
1)は図24のような構造解析木を示していることがわ
かる。
【0100】表1の規則(y1)の左辺の「付帯条件」
を除いた部分は1つの構造解析木から成っているが、1
つに限られるものではない。構文優先規則の左辺は、1
文全体の構造解析木の中の同一部分に位置付けられ得
る、互いに競合する部分的構造解析木を並べて記述する
こともできる。例えば表1の規則(y2)のような規則
であってもよい。この規則の場合、競合する部分的構造
解析木は記号「:」で区切られて並べられており、ま
た、この規則の右辺は、左辺に並べられた部分的構造解
析木のうち最も優先すべき構造解析木が何番目であるか
を表す。
を除いた部分は1つの構造解析木から成っているが、1
つに限られるものではない。構文優先規則の左辺は、1
文全体の構造解析木の中の同一部分に位置付けられ得
る、互いに競合する部分的構造解析木を並べて記述する
こともできる。例えば表1の規則(y2)のような規則
であってもよい。この規則の場合、競合する部分的構造
解析木は記号「:」で区切られて並べられており、ま
た、この規則の右辺は、左辺に並べられた部分的構造解
析木のうち最も優先すべき構造解析木が何番目であるか
を表す。
【0101】規則(y2)の場合は、左辺に存在する2
つの部分的構造解析木のうち優先すべき構造解析木が2
番目のものであることを示すために、右辺は「2」にな
っている。左辺に部分的構造解析木が1つしか存在しな
い規則(y1)の場合は、右辺は「1」になる。
つの部分的構造解析木のうち優先すべき構造解析木が2
番目のものであることを示すために、右辺は「2」にな
っている。左辺に部分的構造解析木が1つしか存在しな
い規則(y1)の場合は、右辺は「1」になる。
【0102】表1の構文優先規則(y1)は以下に述べ
るような英文解釈上の経験則をルール化したものであ
る。
るような英文解釈上の経験則をルール化したものであ
る。
【0103】例えば次のような英文の部分節があるとす
る。
る。
【0104】“P of Q and R of S
”(部分節4) ここで、P,Q,R,Sは何か実際の英単語またはまと
まった英単語列を表している。そして、それらのうち
P,Rが名詞または名詞句であるとする。すると、部分
節4は、その中のP,Q,R,Sの意味にもよるが、
“Sの、〈QとR〉のP”や、“Sの〈QとR〉の、
P”などと訳すよりも、“QのPと、SのR”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節4は、図25や図26のように
解析するよりも図27のように解析する方が多くの場合
において正しいということである。
”(部分節4) ここで、P,Q,R,Sは何か実際の英単語またはまと
まった英単語列を表している。そして、それらのうち
P,Rが名詞または名詞句であるとする。すると、部分
節4は、その中のP,Q,R,Sの意味にもよるが、
“Sの、〈QとR〉のP”や、“Sの〈QとR〉の、
P”などと訳すよりも、“QのPと、SのR”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節4は、図25や図26のように
解析するよりも図27のように解析する方が多くの場合
において正しいということである。
【0105】但し、“P of Q and R on
S ”(部分節5)のような形の場合は、それによっ
てできるどの構文が正しいかなどとは一概に言えない。
S ”(部分節5)のような形の場合は、それによっ
てできるどの構文が正しいかなどとは一概に言えない。
【0106】また、次のような英文の部分節があるとす
る。
る。
【0107】“T for U or V for W
”(部分節6) 部分節4と同様に、T,U,V,Wは何か実際の英単語
またはまとまった英単語列を表している。そして、それ
らのうちT,Vが名詞または名詞句であるとする。部分
節6は、その中のT,U,V,Wの意味にもよるが、
“Wのための、〈UまたはV〉のためのT”や、“Wの
ための〈UまたはV〉のための、T”などと訳すより
も、“UのためのT、または、WのためのV”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節6は、図28や図29のように
解析するよりも図30のように解析する方が多くの場合
において正しいということである。
”(部分節6) 部分節4と同様に、T,U,V,Wは何か実際の英単語
またはまとまった英単語列を表している。そして、それ
らのうちT,Vが名詞または名詞句であるとする。部分
節6は、その中のT,U,V,Wの意味にもよるが、
“Wのための、〈UまたはV〉のためのT”や、“Wの
ための〈UまたはV〉のための、T”などと訳すより
も、“UのためのT、または、WのためのV”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節6は、図28や図29のように
解析するよりも図30のように解析する方が多くの場合
において正しいということである。
【0108】ただし、“T for U or V i
n W ”(部分節7)のような形の場合は、それによ
ってできるどの構文が正しいなどとは一概に言えない。
n W ”(部分節7)のような形の場合は、それによ
ってできるどの構文が正しいなどとは一概に言えない。
【0109】以上で示された部分節4,5,6,7の解
釈に関する経験則から、“名詞句1前置詞1 句2 等
位接続詞 名詞句3 前置詞2 句4 ”(部分節8)
という単語並びになっている部分節は、前置詞1と前置
詞2が全く同じ単語である場合に限り、名詞句1と前置
詞1と句2とを一まとまりに解釈して名詞句Aとし、同
時に名詞句3と前置詞2と句4とを一まとまりに解釈し
て名詞句Bとし、そうしてできた名詞句Aと名詞句Bと
を等位接続詞で結んで全体を1つの名詞句として解釈す
るのが最も確からしい解釈だという、より一般化された
経験則が抽出できる。
釈に関する経験則から、“名詞句1前置詞1 句2 等
位接続詞 名詞句3 前置詞2 句4 ”(部分節8)
という単語並びになっている部分節は、前置詞1と前置
詞2が全く同じ単語である場合に限り、名詞句1と前置
詞1と句2とを一まとまりに解釈して名詞句Aとし、同
時に名詞句3と前置詞2と句4とを一まとまりに解釈し
て名詞句Bとし、そうしてできた名詞句Aと名詞句Bと
を等位接続詞で結んで全体を1つの名詞句として解釈す
るのが最も確からしい解釈だという、より一般化された
経験則が抽出できる。
【0110】本実施例による構文優先規則の書き方に従
ってこの経験則を定式化したのが表1の規則(y1)で
ある。
ってこの経験則を定式化したのが表1の規則(y1)で
ある。
【0111】規則(y1)では、これまでに説明した標
識や記号の他にアスタリスク記号‘*’が使われてい
る。本実施例の構文優先規則において、アスタリスク記
号‘*’は、どのような終端標識または非終端標識にも
読み替え可能な記号としての意味がある。
識や記号の他にアスタリスク記号‘*’が使われてい
る。本実施例の構文優先規則において、アスタリスク記
号‘*’は、どのような終端標識または非終端標識にも
読み替え可能な記号としての意味がある。
【0112】経験則を表す部分節8において句2および
句4は、標識名が特に指定されていない。このような単
語または句を含む経験則を構文優先規則として定式化す
る際に用いられるのがアスタリスク記号‘*’である。
句4は、標識名が特に指定されていない。このような単
語または句を含む経験則を構文優先規則として定式化す
る際に用いられるのがアスタリスク記号‘*’である。
【0113】規則(y1)では、部分節8でいう前置詞
1と前置詞2とが全く同じ単語であるという条件を要す
るため、規則の左辺に“第5要素と第11要素の表層が
等しい”という付帯条件をつけている。
1と前置詞2とが全く同じ単語であるという条件を要す
るため、規則の左辺に“第5要素と第11要素の表層が
等しい”という付帯条件をつけている。
【0114】本実施例での構文優先規則では、優先条件
(規則の左辺)が終端標識と非終端標識との並びから成
る構造解析木の形だけであるような規則のほか、表層す
なわち単語の字面の情報も付帯的な優先条件とする規則
(y1)のような規則も認めている。熟語か成句のごと
く規則対象範囲の全単語の字面を指定するのではなく、
規則対象範囲の構造解析木の形のほかキーとなる単語に
ついて字面その他の情報を指定する程度であれば本発明
でいう構文優先規則の範疇から逸脱するものではない。
(規則の左辺)が終端標識と非終端標識との並びから成
る構造解析木の形だけであるような規則のほか、表層す
なわち単語の字面の情報も付帯的な優先条件とする規則
(y1)のような規則も認めている。熟語か成句のごと
く規則対象範囲の全単語の字面を指定するのではなく、
規則対象範囲の構造解析木の形のほかキーとなる単語に
ついて字面その他の情報を指定する程度であれば本発明
でいう構文優先規則の範疇から逸脱するものではない。
【0115】規則(y1)の付帯条件でいう第n要素
(nは自然数)とは、その規則の左辺のうち「付帯条
件」を除く部分すなわち構造解析木の形を指定している
部分において、左から順に数えてn番目にある終端また
は非終端標識あるいはアスタリスク記号‘*’を指す。
なお、プラス記号や括弧記号は無視して数える。よっ
て、規則(y1)において第5要素と第11要素はとも
に「前置詞」を意味する。
(nは自然数)とは、その規則の左辺のうち「付帯条
件」を除く部分すなわち構造解析木の形を指定している
部分において、左から順に数えてn番目にある終端また
は非終端標識あるいはアスタリスク記号‘*’を指す。
なお、プラス記号や括弧記号は無視して数える。よっ
て、規則(y1)において第5要素と第11要素はとも
に「前置詞」を意味する。
【0116】本発明の他の実施例には、次に述べるよう
な実現形態がある。
な実現形態がある。
【0117】まず、第2実施例として、翻訳文の出力方
法に関する変形実施例を説明する。上述した実施例(第
1実施例)では、1つの原文に対する翻訳文を同時に1
文だけ出力し、1つの原文に対して複数の翻訳文を生成
しうるような場合はユーザの操作によって1文ずつ逐次
出力する機械翻訳装置を説明したが、本発明の機械翻訳
装置はこのような形式のものに限定されるものではな
い。
法に関する変形実施例を説明する。上述した実施例(第
1実施例)では、1つの原文に対する翻訳文を同時に1
文だけ出力し、1つの原文に対して複数の翻訳文を生成
しうるような場合はユーザの操作によって1文ずつ逐次
出力する機械翻訳装置を説明したが、本発明の機械翻訳
装置はこのような形式のものに限定されるものではな
い。
【0118】1つの原文に対する複数の翻訳文のすべて
を同時に出力するような形式の機械翻訳装置も本発明の
機械翻訳装置は包括する。この場合、翻訳文の出力の際
には複数の翻訳文をそのそれぞれの持つ構文優先度に応
じて明確に順位づけされた形で出力する。また、1つの
原文に対して1種類の翻訳文しか出力されないような形
式の機械翻訳装置であってもよい。
を同時に出力するような形式の機械翻訳装置も本発明の
機械翻訳装置は包括する。この場合、翻訳文の出力の際
には複数の翻訳文をそのそれぞれの持つ構文優先度に応
じて明確に順位づけされた形で出力する。また、1つの
原文に対して1種類の翻訳文しか出力されないような形
式の機械翻訳装置であってもよい。
【0119】次に、構文優先規則の扱いに関する変形実
施例を説明する。
施例を説明する。
【0120】本発明において扱いうる構文優先規則の形
式には次のようなものがある。
式には次のようなものがある。
【0121】(A)優先されるべき部分的構造解析木だ
けを示す。上述した実施例で言えば、図18の構造解析
木のみを示す。このような規則は表1の(y1)に示さ
れている。
けを示す。上述した実施例で言えば、図18の構造解析
木のみを示す。このような規則は表1の(y1)に示さ
れている。
【0122】(B)優先されるべき部分的構造解析木
と、それ以外のいくつかの競合する部分的構造解析木と
を示し、優先されるべき部分的構造解析木にその旨を示
す。上述した実施例で言えば、図14と図18及びその
他の構造解析木を示し、図18の構造解析木を優先すべ
きものとして示す。このような規則は表1の(y1)に
示されている。
と、それ以外のいくつかの競合する部分的構造解析木と
を示し、優先されるべき部分的構造解析木にその旨を示
す。上述した実施例で言えば、図14と図18及びその
他の構造解析木を示し、図18の構造解析木を優先すべ
きものとして示す。このような規則は表1の(y1)に
示されている。
【0123】また、構文優先規則の解釈方法には次のよ
うなものがありうる。
うなものがありうる。
【0124】(C)構文の競合が起こった場合は、規則
において「優先されるべき」とされている部分的解析木
と合致する構造解析木を優先されるべきものとし、それ
以外にバッファC(図7参照)で競合している構造解析
木はすべての同等の「優先されないべき」ものとして扱
う。
において「優先されるべき」とされている部分的解析木
と合致する構造解析木を優先されるべきものとし、それ
以外にバッファC(図7参照)で競合している構造解析
木はすべての同等の「優先されないべき」ものとして扱
う。
【0125】この場合は、生成される構文優先規則が上
記(B)の形式であるなら、それらの規則において「優
先されるべき」構造解析木以外の構造解析木の記述は無
駄になる。つまり規則の形式として上記(B)の形式を
とることは冗長であるが、構文優先規則の解釈方法を後
述する(D)のように変更しても構文優先規則の形式を
変えずに済むという利点がある。逆に規則の形式として
(A)の形式をとり、構文優先規則の解釈方法を(C)
から後述の(D)に変更した場合は、それに対応して規
則を書き換える必要がある。
記(B)の形式であるなら、それらの規則において「優
先されるべき」構造解析木以外の構造解析木の記述は無
駄になる。つまり規則の形式として上記(B)の形式を
とることは冗長であるが、構文優先規則の解釈方法を後
述する(D)のように変更しても構文優先規則の形式を
変えずに済むという利点がある。逆に規則の形式として
(A)の形式をとり、構文優先規則の解釈方法を(C)
から後述の(D)に変更した場合は、それに対応して規
則を書き換える必要がある。
【0126】(D)構文の競合が起こった場合は、規則
において「優先されるべき」とされてる部分的構造解析
木と合致する構造解析木を第一に優先されるべきものと
する。それ以外にバッファC(図7参照)で競合してい
る構造解析木についは、規則に記述のない構造解析木を
次善のものとして優先されるものとし、規則において
「優先されるべき」部分的構造解析木以外のものとして
記述のある部分的構造解析木と合致する構造解析木を最
も優先度の低いものとする。この方法は、構文優先規則
が(B)の形式であるときのみ意味を持つ。
において「優先されるべき」とされてる部分的構造解析
木と合致する構造解析木を第一に優先されるべきものと
する。それ以外にバッファC(図7参照)で競合してい
る構造解析木についは、規則に記述のない構造解析木を
次善のものとして優先されるものとし、規則において
「優先されるべき」部分的構造解析木以外のものとして
記述のある部分的構造解析木と合致する構造解析木を最
も優先度の低いものとする。この方法は、構文優先規則
が(B)の形式であるときのみ意味を持つ。
【0127】上述した実施例では、構文優先規則の形式
は(A)、構文優先規則の解釈方法は(C)を採用して
いる。
は(A)、構文優先規則の解釈方法は(C)を採用して
いる。
【0128】次に、構文優先規則の定量化に関する変形
実施例を説明する。
実施例を説明する。
【0129】上述した方法では、構文優先規則とは「優
先するか、しないか」という2値の結果で判定するもの
であった。但し、規則の解釈方法を(D)のようにすれ
ば、運用により3値とすることができる。一方、「優先
するか、しないか」だけでなく「優先するとしたらどの
程度の強さでか」というように、優先度の強さを数値的
に定め、規則によって優先度の強さに差をつけ、「優先
する」構文どうしが競合した際にどれを優先するかを定
められるような、より高度な優先解釈を可能とする方法
も考えられる。このような構文優先規則は表4に示され
ている。
先するか、しないか」という2値の結果で判定するもの
であった。但し、規則の解釈方法を(D)のようにすれ
ば、運用により3値とすることができる。一方、「優先
するか、しないか」だけでなく「優先するとしたらどの
程度の強さでか」というように、優先度の強さを数値的
に定め、規則によって優先度の強さに差をつけ、「優先
する」構文どうしが競合した際にどれを優先するかを定
められるような、より高度な優先解釈を可能とする方法
も考えられる。このような構文優先規則は表4に示され
ている。
【0130】
【表4】
【0131】表4の構文優先規則において、右辺(→よ
り右側)の数値は優先倍率とでもいうべき数値で、1よ
り大きければ優先されることとされており、数値が大き
いほど優先度が高い。また、表4の(y13)に示され
る規則のように数値が1より小さければ、逆にこの構文
は優先しない(当該規則のない場合に比較して優先度を
低くする)ことを示している。なお、ここでは、表1の
ような形式の規則と区別するために、表4の(y11)
のように数値が整数であっても小数点を付けて表現して
いる。
り右側)の数値は優先倍率とでもいうべき数値で、1よ
り大きければ優先されることとされており、数値が大き
いほど優先度が高い。また、表4の(y13)に示され
る規則のように数値が1より小さければ、逆にこの構文
は優先しない(当該規則のない場合に比較して優先度を
低くする)ことを示している。なお、ここでは、表1の
ような形式の規則と区別するために、表4の(y11)
のように数値が整数であっても小数点を付けて表現して
いる。
【0132】続いて、構文優先規則の表現形式に関する
変形実施例を説明する。
変形実施例を説明する。
【0133】本実施例では、構文優先規則は表1や表4
に示すような、一連の文字列として扱えるような形式で
表現されているが、構文優先規則を入力したり表示装置
に表示したりする際には必ずしもこのような形式でなく
ともよい。例えば、規則を表示するのに、図24に示す
ような構造解析木の形をそのまま示したり、あるいは規
則をユーザが入力する際にも、図形を扱うのに適した入
力手段を用いて、図24のような構造解析木を図面上で
図形的に組み立てていくような方法をとったりしてもよ
い。
に示すような、一連の文字列として扱えるような形式で
表現されているが、構文優先規則を入力したり表示装置
に表示したりする際には必ずしもこのような形式でなく
ともよい。例えば、規則を表示するのに、図24に示す
ような構造解析木の形をそのまま示したり、あるいは規
則をユーザが入力する際にも、図形を扱うのに適した入
力手段を用いて、図24のような構造解析木を図面上で
図形的に組み立てていくような方法をとったりしてもよ
い。
【0134】次に、既成の構文優先規則の有無に関する
変形実施例を説明する。
変形実施例を説明する。
【0135】上述した実施例では、構文優先規則は全て
ユーザが入力して用意するものとされていたが、ユーザ
によって規則が全く入力されていない状態で機械翻訳装
置の製造者によって図1の構文優先解釈規則メモリ19
4に記憶された、いわばレディーメイドの構文優先規則
が用意されていても構わない。また、上述したような点
数つきの構文優先規則がレディーメイドの構文優先規則
として用意されている場合、ユーザによってこの点数が
変更されてもよい。あるいは点数つきかそうでないかに
関わらずレディーメイドの構文優先規則がユーザによる
変更の結果、全く無効にされたり全く別の構造解析木を
優先するように変えてもよい。
ユーザが入力して用意するものとされていたが、ユーザ
によって規則が全く入力されていない状態で機械翻訳装
置の製造者によって図1の構文優先解釈規則メモリ19
4に記憶された、いわばレディーメイドの構文優先規則
が用意されていても構わない。また、上述したような点
数つきの構文優先規則がレディーメイドの構文優先規則
として用意されている場合、ユーザによってこの点数が
変更されてもよい。あるいは点数つきかそうでないかに
関わらずレディーメイドの構文優先規則がユーザによる
変更の結果、全く無効にされたり全く別の構造解析木を
優先するように変えてもよい。
【0136】このとき、レディーメイドの構文優先規則
を直接に変更しないような方法を用いてもよい。例え
ば、レディーメイドの構文優先規則とそれを修正した部
分とが全く別々の記憶手段に記憶されていたり、あるい
は同一の記憶手段であっても明確に区分された領域にそ
れぞれ記憶されていたりしていて、実際に規則を利用す
る際にはこの両者が合成されてあたかも1つの記憶手段
に記憶されている1つの構文優先規則であるように扱わ
れるような方法をとってもよい。
を直接に変更しないような方法を用いてもよい。例え
ば、レディーメイドの構文優先規則とそれを修正した部
分とが全く別々の記憶手段に記憶されていたり、あるい
は同一の記憶手段であっても明確に区分された領域にそ
れぞれ記憶されていたりしていて、実際に規則を利用す
る際にはこの両者が合成されてあたかも1つの記憶手段
に記憶されている1つの構文優先規則であるように扱わ
れるような方法をとってもよい。
【0137】また、機械翻訳装置が有する機能によっ
て、機械翻訳装置の動作の過程で構文優先規則が自動的
に生成される場合に、そのように得られた規則がユーザ
によって修正される機能を機械翻訳装置が有するなら
ば、これらも本発明の機械翻訳装置に包括される適用例
である。
て、機械翻訳装置の動作の過程で構文優先規則が自動的
に生成される場合に、そのように得られた規則がユーザ
によって修正される機能を機械翻訳装置が有するなら
ば、これらも本発明の機械翻訳装置に包括される適用例
である。
【0138】よって、本発明では、構文解析の結果、複
数通りの構文構造の解が逐次にあるいは同時に得られた
後、それらの構文構造を、構文の形から得られる適切さ
によって、競合するいずれが最適かを決定する。そし
て、この「適切さ」を得るために必要な情報は、使用者
が規則の形で与える。
数通りの構文構造の解が逐次にあるいは同時に得られた
後、それらの構文構造を、構文の形から得られる適切さ
によって、競合するいずれが最適かを決定する。そし
て、この「適切さ」を得るために必要な情報は、使用者
が規則の形で与える。
【0139】このことにより、文法知識に堪能な使用者
にとっては自分の知識を翻訳に反映させることができ、
より良い翻訳文を何らかの形で優先して出力することが
容易になる。
にとっては自分の知識を翻訳に反映させることができ、
より良い翻訳文を何らかの形で優先して出力することが
容易になる。
【0140】
【発明の効果】本発明の機械翻訳装置は、構文構造の適
切さに関する指標を表す情報を格納する記憶手段と、記
憶手段に格納すべき情報則を入力、修正、または削除す
る入力手段と、同一の文から複数通りの構文構造が得ら
れたときに記憶手段に格納された情報を参照して各構文
構造の優先順位を決定する決定手段とを備えているの
で、同一の文から複数通りの構文構造が得られた際に、
それら複数の構文構造の間で適切さの順位が自動的に決
定され、最適な構文構造及びその構文構造に基づいて最
適な訳文が得られる。
切さに関する指標を表す情報を格納する記憶手段と、記
憶手段に格納すべき情報則を入力、修正、または削除す
る入力手段と、同一の文から複数通りの構文構造が得ら
れたときに記憶手段に格納された情報を参照して各構文
構造の優先順位を決定する決定手段とを備えているの
で、同一の文から複数通りの構文構造が得られた際に、
それら複数の構文構造の間で適切さの順位が自動的に決
定され、最適な構文構造及びその構文構造に基づいて最
適な訳文が得られる。
【図1】本発明の機械翻訳装置の一実施例の構成を示す
ブロック図である。
ブロック図である。
【図2a】図1の機械翻訳装置の動作を説明するための
フローチャートである。
フローチャートである。
【図2b】図1の機械翻訳装置の動作を説明するための
フローチャートである。
フローチャートである。
【図3】図1の機械翻訳装置で構文優先解釈を実行する
ときに優先する構造解析木の説明図である。
ときに優先する構造解析木の説明図である。
【図4】図1の機械翻訳装置の概略構成を説明するため
のブロック図である。
のブロック図である。
【図5】図4の機械翻訳装置における翻訳レベルの説明
図である。
図である。
【図6】図4の機械翻訳装置における翻訳モジュールの
作用構成図である。
作用構成図である。
【図7】図6の翻訳モジュールの構成を示すブロック図
である。
である。
【図8】図7における各バッファの内容例を示す説明図
である。
である。
【図9】図7における各バッファの内容例を示す説明図
である。
である。
【図10】図7における各バッファの内容例を示す説明
図である。
図である。
【図11】図7における各バッファの内容例を示す説明
図である。
図である。
【図12】図7における各バッファの内容例を示す説明
図である。
図である。
【図13】本発明の機械翻訳装置における構造解析木の
一例を示す説明図である。
一例を示す説明図である。
【図14】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図15】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図16】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図17】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図18】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図19】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図20】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図21】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。
について異なっている部分の詳細を示す説明図である。
【図22】優先解釈ルールの形式の説明図である。
【図23】優先解釈ルールの形式の説明図である。
【図24】優先解釈ルールの形式の説明図である。
【図25】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
【図26】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
【図27】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
【図28】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
【図29】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
【図30】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。
ールが表している構造解析木及び競合する構造解析木の
説明図である。
11 入力手段 12 構文優先規則入力手段 13 辞書引き・形態素解析手段 14 構文解析手段 15 構文優先解釈手段 16 構文変換手段 17 翻訳文生成手段 18 出力手段 19 記憶手段 20 動作制御手段 191 辞書メモリ 192 文法規則メモリ 193 木構造変換規則メモリ 194 構文優先解釈規則メモリ 195 原文メモリ 196 辞書引きメモリ 197 構文構造メモリ 198 バッファメモリ 199 ポインタメモリ
Claims (1)
- 【請求項1】 構文構造の適切さに関する指標を表す情
報を格納する記憶手段と、該記憶手段に格納すべき前記
情報則を入力、修正、または削除する入力手段と、同一
の文から複数通りの構文構造が得られたときに前記記憶
手段に格納された前記情報を参照して該各構文構造の優
先順位を決定する決定手段とを備えていることを特徴と
する機械翻訳装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4343703A JPH06195373A (ja) | 1992-12-24 | 1992-12-24 | 機械翻訳装置 |
US08/124,989 US5495413A (en) | 1992-09-25 | 1993-09-21 | Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes |
US08/451,175 US5864788A (en) | 1992-09-25 | 1995-05-26 | Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4343703A JPH06195373A (ja) | 1992-12-24 | 1992-12-24 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06195373A true JPH06195373A (ja) | 1994-07-15 |
Family
ID=18363602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4343703A Pending JPH06195373A (ja) | 1992-09-25 | 1992-12-24 | 機械翻訳装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5864788A (ja) |
JP (1) | JPH06195373A (ja) |
Families Citing this family (72)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1304988C (zh) * | 1996-10-16 | 2007-03-14 | 夏普公司 | 字符输入装置 |
US6285978B1 (en) * | 1998-09-24 | 2001-09-04 | International Business Machines Corporation | System and method for estimating accuracy of an automatic natural language translation |
US6266642B1 (en) | 1999-01-29 | 2001-07-24 | Sony Corporation | Method and portable apparatus for performing spoken language translation |
US6278968B1 (en) * | 1999-01-29 | 2001-08-21 | Sony Corporation | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system |
US6243669B1 (en) | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
US6223150B1 (en) | 1999-01-29 | 2001-04-24 | Sony Corporation | Method and apparatus for parsing in a spoken language translation system |
US6282507B1 (en) * | 1999-01-29 | 2001-08-28 | Sony Corporation | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection |
US6356865B1 (en) * | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6442524B1 (en) | 1999-01-29 | 2002-08-27 | Sony Corporation | Analyzing inflectional morphology in a spoken language translation system |
US6374224B1 (en) | 1999-03-10 | 2002-04-16 | Sony Corporation | Method and apparatus for style control in natural language generation |
CA2367320A1 (en) | 1999-03-19 | 2000-09-28 | Trados Gmbh | Workflow management system |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US6928448B1 (en) | 1999-10-18 | 2005-08-09 | Sony Corporation | System and method to match linguistic structures using thesaurus information |
US6535886B1 (en) | 1999-10-18 | 2003-03-18 | Sony Corporation | Method to compress linguistic structures |
US6330530B1 (en) | 1999-10-18 | 2001-12-11 | Sony Corporation | Method and system for transforming a source language linguistic structure into a target language linguistic structure based on example linguistic feature structures |
US6721697B1 (en) * | 1999-10-18 | 2004-04-13 | Sony Corporation | Method and system for reducing lexical ambiguity |
US6778949B2 (en) * | 1999-10-18 | 2004-08-17 | Sony Corporation | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures |
US6529865B1 (en) | 1999-10-18 | 2003-03-04 | Sony Corporation | System and method to compile instructions to manipulate linguistic structures into separate functions |
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
JP2003242136A (ja) * | 2002-02-20 | 2003-08-29 | Fuji Xerox Co Ltd | 構文情報タグ付与支援システムおよび方法 |
US7620538B2 (en) * | 2002-03-26 | 2009-11-17 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US7548847B2 (en) * | 2002-05-10 | 2009-06-16 | Microsoft Corporation | System for automatically annotating training data for a natural language understanding system |
US20040186704A1 (en) * | 2002-12-11 | 2004-09-23 | Jiping Sun | Fuzzy based natural speech concept system |
US7043002B2 (en) * | 2003-06-27 | 2006-05-09 | Tekelec | Methods and systems for identifying, redirecting, and processing messages of different SS7 protocol variations |
US8548794B2 (en) * | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7711545B2 (en) * | 2003-07-02 | 2010-05-04 | Language Weaver, Inc. | Empirical methods for splitting compound words with application to machine translation |
GB2405728A (en) * | 2003-09-03 | 2005-03-09 | Business Integrity Ltd | Punctuation of automated documents |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US20100262621A1 (en) * | 2004-03-05 | 2010-10-14 | Russ Ross | In-context exact (ice) matching |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US20060009966A1 (en) * | 2004-07-12 | 2006-01-12 | International Business Machines Corporation | Method and system for extracting information from unstructured text using symbolic machine learning |
GB2417103A (en) * | 2004-08-11 | 2006-02-15 | Sdl Plc | Natural language translation system |
US8600728B2 (en) * | 2004-10-12 | 2013-12-03 | University Of Southern California | Training for a text-to-text application which uses string to tree conversion for training and decoding |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US10319252B2 (en) * | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
JP2007233486A (ja) * | 2006-02-27 | 2007-09-13 | Fujitsu Ltd | 翻訳者支援プログラム,翻訳者支援装置及び翻訳者支援方法 |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US8521506B2 (en) * | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8831928B2 (en) * | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US9262403B2 (en) * | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
GB2468278A (en) * | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
JP5681041B2 (ja) * | 2011-06-03 | 2015-03-04 | 富士通株式会社 | 名寄せ規則生成方法、装置、およびプログラム |
US9195652B2 (en) * | 2011-06-08 | 2015-11-24 | Accenture Global Services Limited | Automated systems and methods for integrated multi-platform communication including real-time language translation |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
CN103365834B (zh) * | 2012-03-29 | 2017-08-18 | 富泰华工业(深圳)有限公司 | 语言歧义消除系统及方法 |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9152623B2 (en) * | 2012-11-02 | 2015-10-06 | Fido Labs, Inc. | Natural language processing system and method |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9606987B2 (en) * | 2013-05-06 | 2017-03-28 | Facebook, Inc. | Methods and systems for generation of a translatable sentence syntax in a social networking system |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
EP3282910A4 (en) * | 2015-04-17 | 2019-01-16 | Ball Corporation | METHOD AND APPARATUS FOR CONTROLLING THE SPEED OF A MATERIAL CONTINUOUS SHEET |
US10421111B2 (en) | 2015-04-17 | 2019-09-24 | Ball Corporation | Method and apparatus for controlling an operation performed on a continuous sheet of material |
JP2017151903A (ja) * | 2016-02-26 | 2017-08-31 | 富士通株式会社 | コンパイル装置、コンパイル方法およびコンパイルプログラム |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US10956670B2 (en) | 2018-03-03 | 2021-03-23 | Samurai Labs Sp. Z O.O. | System and method for detecting undesirable and potentially harmful online behavior |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62267872A (ja) * | 1986-05-16 | 1987-11-20 | Ricoh Co Ltd | 言語解析装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6140672A (ja) * | 1984-07-31 | 1986-02-26 | Hitachi Ltd | 多品詞解消処理方式 |
US4868750A (en) * | 1987-10-07 | 1989-09-19 | Houghton Mifflin Company | Collocational grammar system |
US5005127A (en) * | 1987-10-26 | 1991-04-02 | Sharp Kabushiki Kaisha | System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules |
US5146405A (en) * | 1988-02-05 | 1992-09-08 | At&T Bell Laboratories | Methods for part-of-speech determination and usage |
JP2615121B2 (ja) * | 1988-02-29 | 1997-05-28 | 富士通株式会社 | 文書品質評価方式 |
US4994966A (en) * | 1988-03-31 | 1991-02-19 | Emerson & Stern Associates, Inc. | System and method for natural language parsing by initiating processing prior to entry of complete sentences |
JPH02165378A (ja) * | 1988-12-20 | 1990-06-26 | Csk Corp | 機械翻訳システム |
JPH02281372A (ja) * | 1989-04-24 | 1990-11-19 | Sharp Corp | 機械翻訳装置における挿入副詞句処理方法 |
JPH03150666A (ja) * | 1989-11-07 | 1991-06-27 | Ricoh Co Ltd | 機械翻訳装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
JPH04112366A (ja) * | 1990-09-03 | 1992-04-14 | Ricoh Co Ltd | 自然言語文解析装置 |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US5495413A (en) * | 1992-09-25 | 1996-02-27 | Sharp Kabushiki Kaisha | Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes |
US5475588A (en) * | 1993-06-18 | 1995-12-12 | Mitsubishi Electric Research Laboratories, Inc. | System for decreasing the time required to parse a sentence |
US5510981A (en) * | 1993-10-28 | 1996-04-23 | International Business Machines Corporation | Language translation apparatus and method using context-based translation models |
-
1992
- 1992-12-24 JP JP4343703A patent/JPH06195373A/ja active Pending
-
1995
- 1995-05-26 US US08/451,175 patent/US5864788A/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62267872A (ja) * | 1986-05-16 | 1987-11-20 | Ricoh Co Ltd | 言語解析装置 |
Also Published As
Publication number | Publication date |
---|---|
US5864788A (en) | 1999-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH06195373A (ja) | 機械翻訳装置 | |
JP3377290B2 (ja) | イディオム処理機能を持つ機械翻訳装置 | |
US5005127A (en) | System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules | |
JP3220560B2 (ja) | 機械翻訳装置 | |
KR900009120B1 (ko) | 기계번역장치 | |
JPH08190563A (ja) | 機械翻訳装置 | |
JPS6231467A (ja) | 文章作成装置 | |
JPH0721183A (ja) | 機械翻訳装置 | |
JPH04235673A (ja) | 翻訳装置 | |
JP2593065B2 (ja) | 自然言語処理装置における構文解析結果の表示及び校正のための制御方法 | |
JPH07325826A (ja) | 日本語処理システム | |
JPH06195377A (ja) | 構文優先度学習方式の機械翻訳装置 | |
JP3233800B2 (ja) | 機械翻訳装置 | |
JP3253311B2 (ja) | 言語処理装置および言語処理方法 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP3197110B2 (ja) | 自然言語解析装置および機械翻訳装置 | |
JPH01126767A (ja) | 辞書参照装置 | |
JP2000029882A (ja) | 要約文作成装置 | |
JPS62272359A (ja) | 機械翻訳装置 | |
JPH06110922A (ja) | 機械翻訳装置 | |
JP3353873B2 (ja) | 機械翻訳装置 | |
JPH07191995A (ja) | 機械翻訳装置 | |
JPH0746359B2 (ja) | 日本語文章処理方式 | |
JPS6320570A (ja) | 機械翻訳システム | |
JPH06266715A (ja) | 文書編集装置 |