JPH06195373A

JPH06195373A - 機械翻訳装置

Info

Publication number: JPH06195373A
Application number: JP4343703A
Authority: JP
Inventors: Takeshi Kutsumi; 毅九津見
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1992-12-24
Filing date: 1992-12-24
Publication date: 1994-07-15
Also published as: US5864788A

Abstract

(57)【要約】【目的】構文の競合が起こったときに純粋に文法的な
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供する。【構成】構文構造の適切さに関する指標を表す構文優
先規則を格納する記憶手段１９と、記憶手段１９に格納
すべき構文優先規則を入力、修正、または削除する入力
手段１１と、同一の文から複数通りの構文構造が得られ
たときに記憶手段１９に格納された構文優先規則を参照
して各構文構造の優先順位を決定する構文優先解釈手段
１５とを備えている。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、１つの入力文から複数
通りの構文構造を構築できる機械翻訳装置に関する。

【０００２】

【従来の技術】従来の機械翻訳装置は、入力手段から入
力されたソース言語を主中央処理装置（メインＣＰＵ）
の制御により翻訳モジュールに入力し、この入力された
ソース言語をメモリに記憶されているメイン辞書やユー
ザ辞書から成る辞書、文法規則および木構造変換規則を
利用して、翻訳モジュールによってターゲット言語に翻
訳するように構成されている。

【０００３】上記従来の機械翻訳装置では、形態素解析
の結果得られた品詞から、辞書と文法規則を用いて構文
解析を行うと、ほとんどの場合１つの原文に対して複数
通りの構文構造を構築できるので、それに応じて１つの
原文に対して複数通りの翻訳文を生成できる。

【０００４】現実の翻訳作業においては、ほとんどの場
合１つの原文に対しては１つの翻訳文だけしか必要とせ
ず、可能な限り最良の翻訳文であることが望ましい。従
って、１つの原文から複数通りの構文構造ひいては複数
通りの翻訳文が得られる可能性のある場合には、それら
の間で「良さ」を比較して最良の翻訳文を決定する必要
がある。最良の翻訳文を決定するにはいくつかの方法が
知られている。

【０００５】また、従来の機械翻訳装置の多くは、使用
者にとって使いやすくなるように、装置の動作の傾向を
使用者が部分的に変更可能なように構成されている。変
更可能な内容としては一般に次のようなものが知られて
いる。

【０００６】（ａ）装置の辞書に収録されていない単語
や熟語を登録する。

【０００７】（ｂ）ある特定の条件下では、ある単語や
熟語の訳語を、ある特定のものに限って出力したり、あ
るいはある単語や熟語を原言語のまま出力したり、ある
単語や熟語に関して原言語における発音を目的言語で表
記しただけの形で出力したりする。

【０００８】（ｃ）構文解析を実行する度合を全体的に
深くしたり浅くしたりする。

【０００９】上述したように、従来の機械翻訳装置にお
いて使用者がその動作を変更することが可能な部分は、
単語や熟語レベルでの訳語出力に関する内容か、あるい
は翻訳過程のある処理の全体的な傾向の強弱を調整する
という程度に限られていた。一般に、翻訳しようとする
文が長くなり構文構造が大規模になると、構文構造を局
所的にとらえているときには必ずしも決定できなかった
適切さが、構文構造を大局的にとらえると構文の形のみ
で適切さを決定できることを人間の翻訳者は経験的に感
じている。

【００１０】従って、構文の形のみに依存するこういっ
た経験則を抽出して系統化させれば、機械翻訳におい
て、１つの原文に対して複数通りの構文構造を構築しう
る場合の各構造の優劣を決定する際に有力な情報となり
得る。

【００１１】

【発明が解決しようとする課題】しかし、従来の機械翻
訳装置では上述したような情報が利用されていなかった
ので、文法知識に堪能な使用者にとってはより良い翻訳
文を選択するために自分の思い通りの構文が選択されて
ほしいという欲求を持っても、それを直接に反映させる
ことができなかった。

【００１２】即ち、上述した従来の機械翻訳装置では、
その装置の動作の傾向を使用者が部分的に変更すること
が可能であるが、ほとんどの場合、単語や熟語レベルで
の訳語出力に関する内容か、あるいは翻訳過程のある処
理の全般的な傾向の強弱を調整するという程度に限られ
ており、特定の構文構造に関して何らかの措置を使用者
が行うということが不可能であった。

【００１３】従って、上述した従来の機械翻訳装置で
は、その装置の動作の傾向を使用者が変更することが可
能になっていても、その変更可能な範囲が文法知識に堪
能の使用者にとっては不十分なものであったので、より
良い翻訳文が出力される可能性がある状況であってもそ
の可能性が有効に活用されないという問題点があった。
本発明の目的は、上記従来の機械翻訳装置における問題
点に鑑み、構文の競合が起こったときに純粋に文法的な
情報だけでそれぞれの構文の適切さを与えることができ
る機械翻訳装置を提供することにある。

【００１４】

【課題を解決するための手段】本発明の目的は、構文構
造の適切さに関する指標を表す情報を格納する記憶手段
と、記憶手段に格納すべき情報則を入力、修正、または
削除する入力手段と、同一の文から複数通りの構文構造
が得られたときに記憶手段に格納された情報を参照して
各構文構造の優先順位を決定する決定手段とを備えてい
る機械翻訳装置によって達成される。

【００１５】

【作用】本発明の機械翻訳装置では、記憶手段は構文構
造の適切さに関する指標を表す情報を格納し、入力手段
は記憶手段に格納すべき情報則を入力、修正、または削
除し、決定手段は同一の文から複数通りの構文構造が得
られたときに記憶手段に格納された情報を参照して各構
文構造の優先順位を決定する。

【００１６】

【実施例】以下、図面を参照して、本発明の機械翻訳装
置の実施例を詳細に説明する。

【００１７】図１は、ソース言語が英語、ターゲット言
語が日本語に設定された優先解釈を採用した本発明の機
械翻訳装置の一実施例の構成を示すブロック図である。

【００１８】図１の機械翻訳装置は、入力手段１１、入
力手段１１に接続された構文優先規則入力手段１２、入
力手段１１及び構文優先規則入力手段１２に接続された
辞書引き・形態素解析手段１３、辞書引き・形態素解析
手段１３に接続された構文解析手段１４、構文解析手段
１４に接続された構文優先解釈手段１５、構文優先解釈
手段１５に接続された構文変換手段１６、構文変換手段
１６に接続された翻訳文生成手段１７、翻訳文生成手段
１７に接続された出力手段１８、構文優先規則入力手段
１２、辞書引き・形態素解析手段１３、構文解析手段１
４、決定手段である構文優先解釈手段１５、構文変換手
段１６、翻訳文生成手段１７に共通して接続されている
記憶手段１９、及び、上記全ての手段に共通に接続され
た動作制御手段２０によって構成されている。

【００１９】上記記憶手段１９は、辞書メモリ１９１、
文法規則メモリ１９２、木構造変換規則メモリ１９３、
構文優先解釈規則メモリ１９４、原文メモリ１９５、辞
書引きメモリ１９６、構文構造メモリ１９７、バッファ
メモリ１９８、及びポインタメモリ１９９によって構成
されている。

【００２０】構文構造そのものの適切さの情報を利用で
き、同一の文から逐次にあるいは同時に複数通りの構文
構造が組み立て得る場合に、いずれの構文構造が適切あ
るいは不適切であるかを文の内容によらずある程度は決
定することができる場合がある。

【００２１】本実施例では、上記の決定を実行すること
ができ、１つの原文に対して同時に１つの翻訳文だけ出
力でき、ユーザが入力手段を操作することにより別の翻
訳文が逐次に出力される機械翻訳装置を説明する。

【００２２】以下の説明では、「構文構造そのものの適
切さの優劣」を“構文優先度”と呼び、構文優先度を拠
りどころとして適切な構文を選択することを“構文優先
解釈”または単に“優先解釈”と呼ぶ。

【００２３】構文優先規則の入力については、翻訳中も
しくは翻訳を実行していないときなど、機械翻訳装置が
動作中であるなら随時構文優先規則の入力が可能な状態
に移行できるものとする。

【００２４】その移行の際には、ユーザが入力手段を用
いて定められた操作を実行すると、図１の動作制御手段
２０によって、構文優先規則入力状態への移行が指示さ
れたと判断され、動作制御手段２０によって構文優先規
則入力状態へと移行する。

【００２５】構文優先規則の入力の際には図１の構文優
先規則入力手段１２が用いられ、この結果、構文優先規
則は構文優先解釈規則メモリ１９４に格納される。

【００２６】また、本実施例では、原文から翻訳文が得
られるまでに、「形態素解析」→「構文解析」→「変
換」→「翻訳文生成」という過程（図５参照）を要する
ような機械翻訳装置に適用する場合について説明してい
るが、本発明を適用しうる機械翻訳装置はこのような仕
組みのものに限定されるものではない。

【００２７】「構文解析」の過程を含む機械翻訳装置に
はすべからく本発明が適用可能である。例えば、「構文
解析」の後に「意味解析」の過程を含むような機械翻訳
装置も含まれる。

【００２８】次に、図２ａ及び図２ｂのフロ−チャ−ト
を参照して、図１の機械翻訳装置の動作を説明するまず、入力文“Ｉｂｏｕｇｈｔｆｉｌｍｓｆｏｒ
ｔｈｅｃａｍｅｒａａｎｄｔａｐｅｓｆｏｒ
ｔｈｅＶＴＲ．”（原文２）が原文メモリ１９５に
格納される（ステップＳ１）。原文メモリ１９５は図７
及び図８で示されるバッファＡに相当する。

【００２９】次に、辞書引き・形態素解析手段１３によ
り辞書メモリ１９１が参照されながら原文メモリ１９５
（バッファＡ）の内容に形態素解析が施され、その結果
が辞書引きメモリ１９６に格納される（ステップＳ
２）。辞書引きメモリ１９６は図７及び図９で示される
バッファＢに相当する。

【００３０】構文解析結果を格納する図１の構文構造メ
モリ１９７（バッファＣ）がクリアされ（ステップＳ
３）、続いてポインタＰｃがクリアされる（ステップＳ
４）。ポインタとは、メモリやバッファ上のある特定の
位置を指し示しておくために設定される変数である。

【００３１】なお、図１に示す記憶手段１９の内部に存
在している各メモリは、記憶手段１９において固定的に
分類されているわけではなく、状況に応じて、記憶手段
１９の中の適切な領域を占有することにより実現されて
いる。記憶手段１９のどの領域がどのメモリとして利用
されるかは図１の動作制御手段２０によって管理されて
いる。

【００３２】構文解析手段１４により文法規則メモリ１
９２が参照されながら構文解析が実行され、その結果、
辞書引きメモリ１９６（バッファＢ）の内容から構築可
能なすべての構造解析木が組み立てられ、構文構造メモ
リ１９７（バッファＣ）に格納される（ステップＳ
５）。原文２から作られる場合、図１３と図１４〜図２
１のそれぞれを組み合わせてできるような構造解析木が
原文メモリ１９５（バッフＡ）に格納される。辞書引き
メモリ１９６（バッファＢ）の内容から新たな構造解析
木がもう作成できなくなったらステップＳ５からステッ
プＳ６に進む。

【００３３】構文構造メモリ１９７（バッファＣ）に格
納されている複数の構造解析木のそれぞれについて、そ
の構造解析木に付随するフラグ変数Ｆｃが０である場合
に、合致する構文優先規則が構文優先解釈規則メモリ１
９４に存在しているかどうか、構文優先解釈手段１５に
よって構文優先解釈規則メモリ１９４の検索が行われる
（ステップＳ６）。

【００３４】なお、本実施例の説明において、ある構造
解析木Ｔ１とある構文優先規則Ｒ１とが「合致する」と
は、Ｒ１の左辺に示されている構造解析木のうち「優先
すべき」と指定されているもの（これをいまＴＲ１と呼
ぶ）とＴ１とが完全に同じものである場合はもちろん、
そうでなくても、Ｔ１がＴＲ１より大きく、ＴＲ１の一
部分がＴ１全体と一致する構造になっている場合も含
む。

【００３５】但し、その逆にＴＲ１がＴ１より大きく、
Ｔ１の一部分がＴＲ１全体と一致する構造になっている
場合は含まない。

【００３６】また、フラグ変数Ｆｃとは、本実施例にお
いて、構文構造メモリ１９７（バッファＣ）に構造解析
木そのもののデータを格納する領域の他に、１つ１つの
構造解析木についてそれがかつて選択されたかどうかの
状態情報を保持する領域が存在し、これをそれぞれの構
造解析木に付随するフラグ変数Ｆｃと称する。フラグ変
数Ｆｃは状態によって０，１の２通りの値をとり得る。
今後、構文構造メモリ１９７（バッファＣ）に格納され
ている構造解析木の１つであるＴ１に付随するフラグ変
数ＦｃをＦｃ（Ｔ１）と表す。

【００３７】上述したようにステップＳ３で構文構造メ
モリ１９７（バッファＣ）がクリアされる際にはフラグ
Ｆｃは全て０にされる。よって、原文を入力してから初
めてステップＳ６に達したときには、構文構造メモリ１
９７（バッファＣ）に存在するすべての構造解析木に関
してそのフラグＦｃは０である。

【００３８】そのため、いまの場合では、ステップＳ６
では構文構造メモリ１９７（バッファＣ）に存在するす
べての構造解析木に対して構文優先規則とのマッチング
が実行される。また、表１に示すような構文優先規則が
ユーザによって入力されていて構文優先解釈規則メモリ
１９４に存在しているものとする。

【００３９】

【表１】

【００４０】構文構造メモリ１９７（バッファＣ）に存
在するすべての構造解析木の中で、図３のような構造解
析木だけが、表１の規則（ｙ１）と合致する。図３の構
造解析木は図１３と図１８の部分的構造解析木を合成し
て得られるものであり、図３の構造解析木を構造解析木
Ｔｅと呼ぶ。

【００４１】構造解析木Ｔｅが表１の規則（ｙ１）と合
致することは図２４と図１８または図３とを比較すれば
明らかである。よって、ステップＳ６でのマッチングの
結果、構造解析木ＴｅをポインタＰｃが指す（ステップ
Ｓ７）。こうして、構造解析木Ｔｅとその他の構造解析
木Ｔｙとの競合が起こった際に、構文優先規則の働きで
構造解析木Ｔｅが優先される。

【００４２】次に、構造解析木Ｔｅに付随するフラグＦ
ｃ（Ｔｅ）に１がセットされる（ステップＳ９）。フラ
グＦｃが１あるいはそれ以上であることは、このフラグ
Ｆｃに対応する構造解析木が変換部以降に送られたこと
があるということを意味する。

【００４３】構造解析木Ｔｅが図１の構文変換手段１６
に送られる（ステップＳ１０）。これは図６では変換部
２９に相当する。なお、本実施例の説明で用いられる
「送る」という言葉は、あくまでも情報に対して用いら
れるものであるから、送られたあと元の位置（バッファ
など）から無くなってしまうわけではない。例えば、構
文構造メモリ１９７（バッファＣ）に存在する構造解析
木Ｔａが構文変換手段１６に送られるわけであるが、送
られた後も構文構造メモリ１９７（バッファＣ）に構造
解析木Ｔｅは、構文構造メモリ１９７（バッファＣ）が
クリアされない限り存在し続ける。

【００４４】こうして構文変換手段１６で木構造変換規
則メモリ１９３が参照されながら構造解析木Ｔｅが変換
される。なお、本実施例の説明で用いられる「変換」と
いう言葉も、「送る」と同様、情報に対して用いられる
ものであるから、何かが変換された後も、変換前の形態
のものが原則として存在し続けている。

【００４５】そして、構造解析木Ｔｅが構文変換手段１
６で変換結果が得られたかどうかが判定される（ステッ
プＳ１１）。変換結果が得られなければステップＳ１１
からに進み、構文構造メモリ１９７（バッファＣ）に存
在している構造解析木のうち付随するフラグＦｃが０で
あるものが存在するかが判断され（ステップＳ１７）、
上記ステップＳ１７で存在すると判断されたならば、ス
テップＳ６に戻るが、存在しない判断されたならば翻訳
失敗となる。

【００４６】ステップＳ１０において、構造解析木Ｔａ
は構文変換手段１６でその変換結果が得られるので、ス
テップＳ１１からステップＳ１２に進み、構造解析木Ｔ
ｅ（変換後）が図１の翻訳文生成手段１７に送られる。
図１の翻訳文生成手段１７は図６では翻訳文生成部３０
に相当する。

【００４７】構造解析木Ｔｅ（変換後）が翻訳文生成手
段１７で生成結果が得られたかどうかが判定される（ス
テップＳ１３）。生成結果が得られなければステップＳ
１３からステップＳ１７に進み、構文構造メモリ１９７
（バッファＣ）に存在している構造解析木のうち付随す
るフラグＦｃが０であるものが存在するかが判断され
（ステップＳ１７）、存在すればステップＳ６に戻る
が、存在しなければ翻訳失敗となる。

【００４８】本実施例の場合には、ステップＳ１３にお
いて、構造解析木Ｔｅ（変換後）は翻訳文生成手段１７
でその生成結果が得られるので、ステップＳ１３からス
テップＳ１４に進み、構造解析木Ｔｅの翻訳結果が出力
手段１８に出力される。

【００４９】このようにして出力手段１８に出力された
原文２の翻訳文（構造解析木Ｔｅを採用した結果の）
“私は、カメラのためのフィルムとＶＴＲのためのテー
プを買った。”（翻訳文８）が適切かどうかをユーザが
判断し、その判断の結果をステップＳ１５で入力手段１
１から入力する。

【００５０】もしユーザが翻訳文８を不適とする旨をス
テップＳ１５で入力したら次のステップＳ１６からステ
ップＳ１７に戻るが、現在の機械翻訳装置の水準からみ
て、ほとんどの場合、原文２の翻訳結果として翻訳文８
は適切であると考えられる。従って多くの場合、ステッ
プＳ１５でユーザは翻訳文８を適切とする旨を入力する
と考えられ、その場合は次のステップＳ１５での判定に
より、原文２の翻訳は終了となる。

【００５１】以上のように、ユーザが入力した構文優先
規則を記憶しておいた結果、原文２の翻訳において構文
の競合が起こった際に、適切な構文に基づく訳文を最初
から出力することができた。もし構文優先規則を記憶さ
せてはいなければ、原文２を翻訳する際に、図３に示す
構造解析木Ｔｅではなく別の構造解析木が最初に選ばれ
ていたかもしれず、そうなると最初に出力される翻訳文
は、例えば、“私は、カメラとテープのためのフィルム
をＶＴＲのために買った。”となっていたかも知れず、
これではユーザにとって不適であるとみなされる。

【００５２】次に、構文解析を含む機械翻訳装置の概略
を説明する。

【００５３】図４は、構文解析を含む機械翻訳装置の構
成を概略的に説明するためのブロック図である。

【００５４】図４の機械翻訳装置は、主中央処理装置
（メインＣＰＵ）２１、メインメモリ２２、陰極線管
（ＣＲＴ）や液晶表示装置（ＬＣＤ）などの表示装置２
３、キーボード２４、翻訳モジュール２５、翻訳用の辞
書・文法規則及び木構造変換規則等を格納しているメモ
リ２６によって構成されている。

【００５５】翻訳モジュール２５は、ソース言語が入力
されると、それを翻訳してターゲット言語を出力する。
即ち、キーボード２４から入力されたソース言語はメイ
ンＣＰＵ２１の制御により翻訳モジュール２５に送られ
る。翻訳モジュール２５はメモリ２６に記憶されている
辞書、文法規則及び木構造変換規則等を用いて、入力さ
れたソース言語を後に詳述するようにしてターゲット言
語に翻訳する。その結果は、メインメモリ２２に一旦記
憶されると共に、表示装置２３に表示される。メインメ
モリ２２は各種プログラム実行中のレジスタメモリ及び
表示バッファ等にも利用される。

【００５６】翻訳モジュール２５で行われる機械翻訳に
は、図５に示すような解析レベルがある。図中左上にお
いてソース言語が入力されると、レベルＬ１の辞書引
き、レベルＬ２の形態素解析、レベルＬ３の構文解析、
…と、解析が進められる。

【００５７】機械翻訳はこの解析レベルにより、大きく
次の２つにわけられる。

【００５８】１つは、レベルＬ６のソース言語及びター
ゲット言語のどちらにも依存しない概念（中間言語と呼
ぶ）まで解析し、そこから、レベルＬ７の文脈生成、レ
ベルＬ８の意味生成、レベルＬ９の構文生成、レベルＬ
１０の形態素生成と生成を進めて、ターゲット言語を生
成していくピボット方式である。

【００５９】もう１つは、上述のレベルＬ２の形態素解
析、レベルＬ３の構文解析、レベルＬ４の意味解析及び
レベルＬ５の文脈解析のいずれかまで解析を行ってソー
ス言語の内部構造を得、次に、この得られたソース言語
の内部構造と同レベルのターゲット言語の内部構造に変
換した後、ターゲット言語を生成するトランスファー方
式である。

【００６０】ここで、上記各解析について説明する。

【００６１】（ａ）辞書引き、形態素解析図４に示すメモリ２６の辞書を引き、入力された文章を
各形態素列（単語列）に分割し、この各単語に対する品
詞などの文法情報および訳語を得て、更に、時制・人称
・数などを解析する。

【００６２】（ｂ）構文解析後述するようにして単語間の係り受けなどの文章の構造
（構造解析木）を決定する。

【００６３】（ｃ）意味解析複数の構文解析の結果から意味的に正しいものとそうで
ないものを判別する。

【００６４】（ｄ）文脈解析話題を理解して省略や曖昧さを取り去る。

【００６５】本発明で用いる翻訳モジュール２５は、少
なくともレベルＬ３の構文解析のレベルまでの解析を行
うものとする。

【００６６】即ち、本実施例の翻訳モジュール２５は図
６に示す機能を有する各部分からなる翻訳モジュールを
考える。

【００６７】図７は、機能素子を用いて翻訳モジュール
２５をハ−ドウエアとして構築した場合のブロック図を
示す。

【００６８】また、図８〜図１２は、“Ｔｈｉｓｉｓ
ａｐｅｎ．”（原文１）という英文を日本語に翻訳
する場合の図７に示す各バッファＡ〜Ｅの内容を示す。

【００６９】以下、図６〜図１２を参照して図４の機械
翻訳装置による英日翻訳（英文から日本文への翻訳）の
動作を説明する。

【００７０】まず、読み込まれた原文は図８に示すよう
に図７のバッファＡに格納される。翻訳プログラム３２
に基づく翻訳中央処理装置（翻訳ＣＰＵ）３１の制御に
より、図６の辞書引き形態素解析部２７により、バッフ
ァＡに格納された原文に従ってメモリ２６の辞書を用い
て各単語の訳語等の情報が得られ、得られた情報は図７
のバッファＢに格納される。

【００７１】例えば、その各情報の一部である品詞情報
は、図９のように格納される。ここで、ｔｈｉｓは多品
詞語であるが、次に説明するように図６の構文解析部２
８により一意に決定される。

【００７２】構文解析部２８ではメモリ２６の辞書と文
法規則にしたがって、各単語間の係り受け関係を示す構
造解析木が図１０に示すように決定されて、図７のバッ
ファＣに格納される。

【００７３】この構造解析木は、次のようにして決定さ
れる。

【００７４】メモリ２６の文法規則から文→主部＋述部主部→名詞句述部→動詞＋名詞句名詞句→代名詞名詞句→冠詞＋名詞の規則が得られる。この規則は、例えば、１つ目の規則
は“文とは、主部と述部からできている”ということを
表す。

【００７５】以下、この規則にしたがって構造解析木が
決定される。なお、図１０のような構造解析木におい
て、実際の単語（図１０では「ｔｈｉｓ」「ｉｓ」な
ど）の直上にある文法標識（図１０では「代名詞」「動
詞」「冠詞」「名詞」など）を“終端標識”と称し、そ
れ以外の文法標識（図１０では「文」「主部」「述部」
「名詞句」など）を“非終端標識”と称する。

【００７６】終端標識は一般に「品詞」と呼ばれる概念
と同等なものである。また、上述したような文法規則の
左辺（矢印より左端の項）は非終端標識でなければなら
ない。図６の変換部２９では、上述の構文解析部２８
と同様にメモリ２６の木構造変換規則を用いて、入力さ
れた英文に対する構文解析木（図１０参照）の構造が図
１１に示すように日本文に対する構造に変換される。そ
して、得られた結果が図７のバッファＤに格納される。

【００７７】図６の翻訳文生成部３０は、得られた日本
文字「これペンである。」に適切な助詞「は」や助動
詞をつけて、図１２のような日本語の形にして、図７の
バッファＥに格納する。この日本文「これはペンであ
る。」は、翻訳モジュール２５から出力され、メインメ
モリ２２に格納されると共に、表示装置２３に表示され
る。

【００７８】次に、上述した図４の機械翻訳装置を参照
して図１の機械翻訳装置を再び説明する。

【００７９】図１の機械翻訳装置の文法規則メモリ１９
２に格納されている文法規則が表２に示されているよう
なものであるとする。

【００８０】

【表２】

【００８１】なお、図１の文法規則メモリ１９２は図７
ではメモリ２６の一部に相当する。そして、表２のよう
な文法規則に使われている文法標識のうちどれが終端標
識でどれが非終端標識かは表３に示されている。

【００８２】

【表３】

【００８３】このような機械翻訳装置に、原文“Ｉｂ
ｏｕｇｈｔｆｉｌｍｓｆｏｒｔｈｅｃａｍｅｒａ
ａｎｄｔａｐｅｓｆｏｒｔｈｅＶＴＲ．”
（原文２）が入力されると、形態素解析がなされた後、
表２のような文法規則に従って構文解析がなされる。そ
の結果、得られる構造解析木はおよそ図１３のようにな
る。

【００８４】ただし、原文２の場合、表２の文法規則だ
けでは構造解析木は１通りに決まらない。原文２の中の
“ｂｏｕｇｈｔｆｉｌｍｓｆｏｒｔｈｅｃａｍ
ｅｒａａｎｄｔａｐｅｓｆｏｒｔｈｅＶＴＲ
”（部分節３）の部分は複数通りの解析が可能で、そ
のため図１３では解析木が複数通りになる部分は解析木
の形を示さずにその部分全体を覆う三角形として表して
いる。

【００８５】図１３で解析木が複数通りになる部分の実
際の解析木の形を表したのが図１４〜図２１である。な
お、実際には部分節３と表２の文法規則から得られる解
析木の形は図１４〜図２１に示したもので全てではなく
他にも有り得るが、ここではそれらの説明を割愛する。

【００８６】図１４〜図２１に示したそれぞれの部分的
解析木にある節点（Ａ）を図１３の構造解析木の節点
（Ａ）と繋ぎ合わせて考えることによって、原文２全体
に相当する完全な構造解析木を得ることができる。

【００８７】図１の構文構造メモリ１９７（バッファ
Ｃ）はこれらの複数通りの構造解析木のデータを同時に
全て記憶することができる。なお、上述したように構文
構造メモリ１９７（バッファＣ）は図７のバッファＣに
相当する。

【００８８】これらの複数通りの構造解析木に対して、
ユーザが登録した構文優先規則に基づいて構造解析木の
形そのものに優劣をつける機能が、本発明で述べる構文
優先度の学習機能である。

【００８９】構文優先解釈を導入した構文解析を実行す
る際には、表２で示されるような文法規則の他に、表１
で示されるような構文優先規則を用いる。

【００９０】構文優先規則とは、構造解析木の中の１つ
の非終端標識（これを非終端標識Ａとする）について、
その下の標識群が所定の構造を形成している場合に、そ
れらの標識群の頂点に位置する非終端標識（すなわち非
終端標識Ａ）を何らかの形で優先することを示す規則で
ある。

【００９１】本発明の機械翻訳装置では、ユーザが構文
優先規則を入力し、それが機械翻訳装置に備えられてい
るメモリ手段に記憶される。このとき、規則は、全く新
規に入力してもよいし、すでに記憶されている規則を修
正する形でもよい。また、機械翻訳装置の製造者によっ
てあらかじめ用意されている構文優先規則が存在する場
合はそれを修正する形でもよい。あるいは、機械翻訳装
置の有する何らかの機能によって、機械翻訳装置の動作
の過程で構文優先規則が自動的に生成される場合は、そ
れを修正する形でもよい。

【００９２】一つ一つの構文優先規則は表１の（ｙ１）
に示されるような形式を持っている。

【００９３】ここで、矢印より前の部分、即ち表１の規
則（ｙ１）では “名詞句（名詞句（名詞句＋前置詞句（前置詞＋＊））
＋等位接続詞＋名詞句（名詞句＋前置詞句（前置詞＋
＊）））付帯条件；第５要素と第１１要素の表層が等しい” の部分が規則の左辺であり、矢印より後の部分、即ち表
１の規則（ｙ１）では１の部分が規則の右辺である。表
１の規則（ｙ１）の左辺には「付帯条件」という項が存
在しているが、構文優先規則の左辺に「付帯条件」は必
須なものではない。

【００９４】次に、構文優先規則の左辺の意味について
説明する。

【００９５】左辺のうち「付帯条件」を除く部分は、構
文解析木全体のうちある非終端標識およびそれより下層
にあるいくつかの非終端あるいは終端標識からなる部分
的な解析木の形を表現している。本実施例におけるその
表現方法を図２２及び図２３を用いて説明する。

【００９６】括弧記号‘（’と‘）’との間に記された
標識は、開き括弧記号‘（’のすぐ左にある標識の１つ
下位の節点の標識であることを示している。例えばＡ
（Ｂ）という規則は標識Ａの１つ下に標識Ｂのみが存在
することを示している。また、プラス記号‘＋’は、そ
の‘＋’のすぐ左にある標識とその‘＋’のすぐ右にあ
る標識とがそれぞれ１つ上の標識を共有していることを
示している。

【００９７】例えば、Ａ（Ｂ＋Ｃ）という規則は図２２
に示すように非終端標識Ａの１つ下に標識Ｂと標識Ｃと
が存在することを示している。

【００９８】以上で述べた括弧記号‘（’と‘）’およ
びプラス記号‘＋’を用いることにより、どのように複
雑な構造解析木の形もその中の終端／非終端標識を一列
に並べて表現することが可能である。例えば図２３のよ
うな構造解析木はＡ（Ｂ（Ｃ＋Ｄ）＋Ｅ＋Ｆ）のように
表現される。

【００９９】このことから、表１の構文優先規則（ｙ
１）は図２４のような構造解析木を示していることがわ
かる。

【０１００】表１の規則（ｙ１）の左辺の「付帯条件」
を除いた部分は１つの構造解析木から成っているが、１
つに限られるものではない。構文優先規則の左辺は、１
文全体の構造解析木の中の同一部分に位置付けられ得
る、互いに競合する部分的構造解析木を並べて記述する
こともできる。例えば表１の規則（ｙ２）のような規則
であってもよい。この規則の場合、競合する部分的構造
解析木は記号「：」で区切られて並べられており、ま
た、この規則の右辺は、左辺に並べられた部分的構造解
析木のうち最も優先すべき構造解析木が何番目であるか
を表す。

【０１０１】規則（ｙ２）の場合は、左辺に存在する２
つの部分的構造解析木のうち優先すべき構造解析木が２
番目のものであることを示すために、右辺は「２」にな
っている。左辺に部分的構造解析木が１つしか存在しな
い規則（ｙ１）の場合は、右辺は「１」になる。

【０１０２】表１の構文優先規則（ｙ１）は以下に述べ
るような英文解釈上の経験則をルール化したものであ
る。

【０１０３】例えば次のような英文の部分節があるとす
る。

【０１０４】“ＰｏｆＱａｎｄＲｏｆＳ
”（部分節４）ここで、Ｐ，Ｑ，Ｒ，Ｓは何か実際の英単語またはまと
まった英単語列を表している。そして、それらのうち
Ｐ，Ｒが名詞または名詞句であるとする。すると、部分
節４は、その中のＰ，Ｑ，Ｒ，Ｓの意味にもよるが、
“Ｓの、〈ＱとＲ〉のＰ”や、“Ｓの〈ＱとＲ〉の、
Ｐ”などと訳すよりも、“ＱのＰと、ＳのＲ”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節４は、図２５や図２６のように
解析するよりも図２７のように解析する方が多くの場合
において正しいということである。

【０１０５】但し、“ＰｏｆＱａｎｄＲｏｎ
Ｓ ”（部分節５）のような形の場合は、それによっ
てできるどの構文が正しいかなどとは一概に言えない。

【０１０６】また、次のような英文の部分節があるとす
る。

【０１０７】“ＴｆｏｒＵｏｒＶｆｏｒＷ
”（部分節６）部分節４と同様に、Ｔ，Ｕ，Ｖ，Ｗは何か実際の英単語
またはまとまった英単語列を表している。そして、それ
らのうちＴ，Ｖが名詞または名詞句であるとする。部分
節６は、その中のＴ，Ｕ，Ｖ，Ｗの意味にもよるが、
“Ｗのための、〈ＵまたはＶ〉のためのＴ”や、“Ｗの
ための〈ＵまたはＶ〉のための、Ｔ”などと訳すより
も、“ＵのためのＴ、または、ＷのためのＶ”と訳す方
が概ね正しいことが経験的に知られている。これを解析
構造木で表すと、部分節６は、図２８や図２９のように
解析するよりも図３０のように解析する方が多くの場合
において正しいということである。

【０１０８】ただし、“ＴｆｏｒＵｏｒＶｉ
ｎＷ ”（部分節７）のような形の場合は、それによ
ってできるどの構文が正しいなどとは一概に言えない。

【０１０９】以上で示された部分節４，５，６，７の解
釈に関する経験則から、“名詞句１前置詞１句２等
位接続詞名詞句３前置詞２句４ ”（部分節８）
という単語並びになっている部分節は、前置詞１と前置
詞２が全く同じ単語である場合に限り、名詞句１と前置
詞１と句２とを一まとまりに解釈して名詞句Ａとし、同
時に名詞句３と前置詞２と句４とを一まとまりに解釈し
て名詞句Ｂとし、そうしてできた名詞句Ａと名詞句Ｂと
を等位接続詞で結んで全体を１つの名詞句として解釈す
るのが最も確からしい解釈だという、より一般化された
経験則が抽出できる。

【０１１０】本実施例による構文優先規則の書き方に従
ってこの経験則を定式化したのが表１の規則（ｙ１）で
ある。

【０１１１】規則（ｙ１）では、これまでに説明した標
識や記号の他にアスタリスク記号‘＊’が使われてい
る。本実施例の構文優先規則において、アスタリスク記
号‘＊’は、どのような終端標識または非終端標識にも
読み替え可能な記号としての意味がある。

【０１１２】経験則を表す部分節８において句２および
句４は、標識名が特に指定されていない。このような単
語または句を含む経験則を構文優先規則として定式化す
る際に用いられるのがアスタリスク記号‘＊’である。

【０１１３】規則（ｙ１）では、部分節８でいう前置詞
１と前置詞２とが全く同じ単語であるという条件を要す
るため、規則の左辺に“第５要素と第１１要素の表層が
等しい”という付帯条件をつけている。

【０１１４】本実施例での構文優先規則では、優先条件
（規則の左辺）が終端標識と非終端標識との並びから成
る構造解析木の形だけであるような規則のほか、表層す
なわち単語の字面の情報も付帯的な優先条件とする規則
（ｙ１）のような規則も認めている。熟語か成句のごと
く規則対象範囲の全単語の字面を指定するのではなく、
規則対象範囲の構造解析木の形のほかキーとなる単語に
ついて字面その他の情報を指定する程度であれば本発明
でいう構文優先規則の範疇から逸脱するものではない。

【０１１５】規則（ｙ１）の付帯条件でいう第ｎ要素
（ｎは自然数）とは、その規則の左辺のうち「付帯条
件」を除く部分すなわち構造解析木の形を指定している
部分において、左から順に数えてｎ番目にある終端また
は非終端標識あるいはアスタリスク記号‘＊’を指す。
なお、プラス記号や括弧記号は無視して数える。よっ
て、規則（ｙ１）において第５要素と第１１要素はとも
に「前置詞」を意味する。

【０１１６】本発明の他の実施例には、次に述べるよう
な実現形態がある。

【０１１７】まず、第２実施例として、翻訳文の出力方
法に関する変形実施例を説明する。上述した実施例（第
１実施例）では、１つの原文に対する翻訳文を同時に１
文だけ出力し、１つの原文に対して複数の翻訳文を生成
しうるような場合はユーザの操作によって１文ずつ逐次
出力する機械翻訳装置を説明したが、本発明の機械翻訳
装置はこのような形式のものに限定されるものではな
い。

【０１１８】１つの原文に対する複数の翻訳文のすべて
を同時に出力するような形式の機械翻訳装置も本発明の
機械翻訳装置は包括する。この場合、翻訳文の出力の際
には複数の翻訳文をそのそれぞれの持つ構文優先度に応
じて明確に順位づけされた形で出力する。また、１つの
原文に対して１種類の翻訳文しか出力されないような形
式の機械翻訳装置であってもよい。

【０１１９】次に、構文優先規則の扱いに関する変形実
施例を説明する。

【０１２０】本発明において扱いうる構文優先規則の形
式には次のようなものがある。

【０１２１】（Ａ）優先されるべき部分的構造解析木だ
けを示す。上述した実施例で言えば、図１８の構造解析
木のみを示す。このような規則は表１の（ｙ１）に示さ
れている。

【０１２２】（Ｂ）優先されるべき部分的構造解析木
と、それ以外のいくつかの競合する部分的構造解析木と
を示し、優先されるべき部分的構造解析木にその旨を示
す。上述した実施例で言えば、図１４と図１８及びその
他の構造解析木を示し、図１８の構造解析木を優先すべ
きものとして示す。このような規則は表１の（ｙ１）に
示されている。

【０１２３】また、構文優先規則の解釈方法には次のよ
うなものがありうる。

【０１２４】（Ｃ）構文の競合が起こった場合は、規則
において「優先されるべき」とされている部分的解析木
と合致する構造解析木を優先されるべきものとし、それ
以外にバッファＣ（図７参照）で競合している構造解析
木はすべての同等の「優先されないべき」ものとして扱
う。

【０１２５】この場合は、生成される構文優先規則が上
記（Ｂ）の形式であるなら、それらの規則において「優
先されるべき」構造解析木以外の構造解析木の記述は無
駄になる。つまり規則の形式として上記（Ｂ）の形式を
とることは冗長であるが、構文優先規則の解釈方法を後
述する（Ｄ）のように変更しても構文優先規則の形式を
変えずに済むという利点がある。逆に規則の形式として
（Ａ）の形式をとり、構文優先規則の解釈方法を（Ｃ）
から後述の（Ｄ）に変更した場合は、それに対応して規
則を書き換える必要がある。

【０１２６】（Ｄ）構文の競合が起こった場合は、規則
において「優先されるべき」とされてる部分的構造解析
木と合致する構造解析木を第一に優先されるべきものと
する。それ以外にバッファＣ（図７参照）で競合してい
る構造解析木についは、規則に記述のない構造解析木を
次善のものとして優先されるものとし、規則において
「優先されるべき」部分的構造解析木以外のものとして
記述のある部分的構造解析木と合致する構造解析木を最
も優先度の低いものとする。この方法は、構文優先規則
が（Ｂ）の形式であるときのみ意味を持つ。

【０１２７】上述した実施例では、構文優先規則の形式
は（Ａ）、構文優先規則の解釈方法は（Ｃ）を採用して
いる。

【０１２８】次に、構文優先規則の定量化に関する変形
実施例を説明する。

【０１２９】上述した方法では、構文優先規則とは「優
先するか、しないか」という２値の結果で判定するもの
であった。但し、規則の解釈方法を（Ｄ）のようにすれ
ば、運用により３値とすることができる。一方、「優先
するか、しないか」だけでなく「優先するとしたらどの
程度の強さでか」というように、優先度の強さを数値的
に定め、規則によって優先度の強さに差をつけ、「優先
する」構文どうしが競合した際にどれを優先するかを定
められるような、より高度な優先解釈を可能とする方法
も考えられる。このような構文優先規則は表４に示され
ている。

【０１３０】

【表４】

【０１３１】表４の構文優先規則において、右辺（→よ
り右側）の数値は優先倍率とでもいうべき数値で、１よ
り大きければ優先されることとされており、数値が大き
いほど優先度が高い。また、表４の（ｙ１３）に示され
る規則のように数値が１より小さければ、逆にこの構文
は優先しない（当該規則のない場合に比較して優先度を
低くする）ことを示している。なお、ここでは、表１の
ような形式の規則と区別するために、表４の（ｙ１１）
のように数値が整数であっても小数点を付けて表現して
いる。

【０１３２】続いて、構文優先規則の表現形式に関する
変形実施例を説明する。

【０１３３】本実施例では、構文優先規則は表１や表４
に示すような、一連の文字列として扱えるような形式で
表現されているが、構文優先規則を入力したり表示装置
に表示したりする際には必ずしもこのような形式でなく
ともよい。例えば、規則を表示するのに、図２４に示す
ような構造解析木の形をそのまま示したり、あるいは規
則をユーザが入力する際にも、図形を扱うのに適した入
力手段を用いて、図２４のような構造解析木を図面上で
図形的に組み立てていくような方法をとったりしてもよ
い。

【０１３４】次に、既成の構文優先規則の有無に関する
変形実施例を説明する。

【０１３５】上述した実施例では、構文優先規則は全て
ユーザが入力して用意するものとされていたが、ユーザ
によって規則が全く入力されていない状態で機械翻訳装
置の製造者によって図１の構文優先解釈規則メモリ１９
４に記憶された、いわばレディーメイドの構文優先規則
が用意されていても構わない。また、上述したような点
数つきの構文優先規則がレディーメイドの構文優先規則
として用意されている場合、ユーザによってこの点数が
変更されてもよい。あるいは点数つきかそうでないかに
関わらずレディーメイドの構文優先規則がユーザによる
変更の結果、全く無効にされたり全く別の構造解析木を
優先するように変えてもよい。

【０１３６】このとき、レディーメイドの構文優先規則
を直接に変更しないような方法を用いてもよい。例え
ば、レディーメイドの構文優先規則とそれを修正した部
分とが全く別々の記憶手段に記憶されていたり、あるい
は同一の記憶手段であっても明確に区分された領域にそ
れぞれ記憶されていたりしていて、実際に規則を利用す
る際にはこの両者が合成されてあたかも１つの記憶手段
に記憶されている１つの構文優先規則であるように扱わ
れるような方法をとってもよい。

【０１３７】また、機械翻訳装置が有する機能によっ
て、機械翻訳装置の動作の過程で構文優先規則が自動的
に生成される場合に、そのように得られた規則がユーザ
によって修正される機能を機械翻訳装置が有するなら
ば、これらも本発明の機械翻訳装置に包括される適用例
である。

【０１３８】よって、本発明では、構文解析の結果、複
数通りの構文構造の解が逐次にあるいは同時に得られた
後、それらの構文構造を、構文の形から得られる適切さ
によって、競合するいずれが最適かを決定する。そし
て、この「適切さ」を得るために必要な情報は、使用者
が規則の形で与える。

【０１３９】このことにより、文法知識に堪能な使用者
にとっては自分の知識を翻訳に反映させることができ、
より良い翻訳文を何らかの形で優先して出力することが
容易になる。

【０１４０】

【発明の効果】本発明の機械翻訳装置は、構文構造の適
切さに関する指標を表す情報を格納する記憶手段と、記
憶手段に格納すべき情報則を入力、修正、または削除す
る入力手段と、同一の文から複数通りの構文構造が得ら
れたときに記憶手段に格納された情報を参照して各構文
構造の優先順位を決定する決定手段とを備えているの
で、同一の文から複数通りの構文構造が得られた際に、
それら複数の構文構造の間で適切さの順位が自動的に決
定され、最適な構文構造及びその構文構造に基づいて最
適な訳文が得られる。

【図面の簡単な説明】

【図１】本発明の機械翻訳装置の一実施例の構成を示す
ブロック図である。

【図２ａ】図１の機械翻訳装置の動作を説明するための
フローチャートである。

【図２ｂ】図１の機械翻訳装置の動作を説明するための
フローチャートである。

【図３】図１の機械翻訳装置で構文優先解釈を実行する
ときに優先する構造解析木の説明図である。

【図４】図１の機械翻訳装置の概略構成を説明するため
のブロック図である。

【図５】図４の機械翻訳装置における翻訳レベルの説明
図である。

【図６】図４の機械翻訳装置における翻訳モジュールの
作用構成図である。

【図７】図６の翻訳モジュールの構成を示すブロック図
である。

【図８】図７における各バッファの内容例を示す説明図
である。

【図９】図７における各バッファの内容例を示す説明図
である。

【図１０】図７における各バッファの内容例を示す説明
図である。

【図１１】図７における各バッファの内容例を示す説明
図である。

【図１２】図７における各バッファの内容例を示す説明
図である。

【図１３】本発明の機械翻訳装置における構造解析木の
一例を示す説明図である。

【図１４】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図１５】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図１６】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図１７】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図１８】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図１９】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図２０】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図２１】構造解析木のうち複数通りの解釈がある部分
について異なっている部分の詳細を示す説明図である。

【図２２】優先解釈ルールの形式の説明図である。

【図２３】優先解釈ルールの形式の説明図である。

【図２４】優先解釈ルールの形式の説明図である。

【図２５】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【図２６】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【図２７】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【図２８】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【図２９】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【図３０】本発明の機械翻訳装置で適用する優先解釈ル
ールが表している構造解析木及び競合する構造解析木の
説明図である。

【符号の説明】

１１入力手段１２構文優先規則入力手段１３辞書引き・形態素解析手段１４構文解析手段１５構文優先解釈手段１６構文変換手段１７翻訳文生成手段１８出力手段１９記憶手段２０動作制御手段１９１辞書メモリ１９２文法規則メモリ１９３木構造変換規則メモリ１９４構文優先解釈規則メモリ１９５原文メモリ１９６辞書引きメモリ１９７構文構造メモリ１９８バッファメモリ１９９ポインタメモリ

Claims

【特許請求の範囲】

【請求項１】構文構造の適切さに関する指標を表す情
報を格納する記憶手段と、該記憶手段に格納すべき前記
情報則を入力、修正、または削除する入力手段と、同一
の文から複数通りの構文構造が得られたときに前記記憶
手段に格納された前記情報を参照して該各構文構造の優
先順位を決定する決定手段とを備えていることを特徴と
する機械翻訳装置。