JP2010140381A

JP2010140381A - 機械翻訳装置及び機械翻訳プログラム

Info

Publication number: JP2010140381A
Application number: JP2008317892A
Authority: JP
Inventors: Enko Sai; 遠航蔡; Yumiko Yoshimura; 裕美子吉村; Takashi Shibuya; 貴志澁谷
Original assignee: Toshiba Corp; Toshiba Solutions Corp
Current assignee: Toshiba Corp; Toshiba Digital Solutions Corp
Priority date: 2008-12-15
Filing date: 2008-12-15
Publication date: 2010-06-24
Anticipated expiration: 2028-12-15
Also published as: JP5032453B2

Abstract

【課題】翻訳対象原文の訳文の翻訳精度や完成度が高く、しかも訳文の合成がし易くなるように翻訳用例の優先度を調整できる機械翻訳装置及び機械翻訳プログラムを提供することである。
【解決手段】翻訳用例検索手段３２は翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を翻訳用例データベース２９から検索し、差分対応付け手段３３は翻訳用例検索手段３２で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と翻訳対象原文との差異部分を対応付け、用例優先度付与手段３４は差分対応付け手段３３で対応付けられた各々の翻訳用例の原文と翻訳対象原文との差異部分について構文上の役割を判定し構文上の役割が同じである割合が高いほど高い優先度を翻訳用例に付与する。
【選択図】図１

Description

本発明は、第１言語の翻訳対象原文を第２言語の訳文に翻訳する機械翻訳装置及び機械翻訳プログラムに関する。

第１言語の原文を第２言語の訳文に翻訳する機械翻訳装置においては、第１言語の原文と第２言語文の対訳とからなる翻訳用例を予め翻訳用例データベースに蓄積しておき、入力された翻訳対象原文に類似する翻訳用例を検索して、翻訳対象原文とともに利用者に提示し、翻訳の支援を行うものがある（例えば、特許文献１参照）。

翻訳対象原文に類似する翻訳用例を翻訳用例データベースから検索するにあたっては、翻訳対象原文に含まれる単語または文字が一致する割合が予め定めた割合以上の翻訳用例を翻訳用例データベースから検索することになる。

この検索において、複数の翻訳用例が検索された場合、使用する翻訳用例を最終的に一つに絞り込む必要があるので、検索された翻訳用例には「優先度」を付けるようにしている。そして、決定された優先度の順番で翻訳用例をユーザに提示する。ユーザは提示された翻訳用例のうちから適切な翻訳用例を選択し、その選択した翻訳用例を用いて翻訳対象原文の訳文を合成することになる。現状では、翻訳用例の優先度を以下の方法で決定するようにしている。

（１）翻訳対象原文との「類似度」が高い翻訳用例の優先度を高くする。

「類似度」は、翻訳対象原文と翻訳用例原文との一致する単語の割合または文字の割合によって決める。

（２）類似度が同じである翻訳用例に対しては、検索で先に見つけた翻訳用例を優先する。あるいは、新しく登録した翻訳用例を優先する。

このように、翻訳用例を用いた翻訳において、現状では翻訳対象原文に対して複数の翻訳用例が存在する場合には、翻訳対象原文との類似度の高い翻訳用例の優先度を高くしている。そして、その複数の翻訳用例の類似度が等しい場合は、翻訳用例の検索で先に発見したものを優先するようにしている。
特開２００８−２０４３１２号公報

しかし、このように決められた「優先度の高い翻訳用例」を使用すると、単に、翻訳対象原文と翻訳用例原文との一致する単語の割合または文字の割合によって翻訳用例の優先度を決めているので、翻訳対象原文の訳文の翻訳精度や完成度が低く訳文の合成がし難いことがある。却って、類似度の低い翻訳用例を使用した場合や、類似度が同じでも翻訳用例検索で後で見つけた翻訳用例を使用した場合の方が、翻訳対象原文の訳文の翻訳精度や完成度が高く、訳文の合成がし易いことがある。表１に翻訳用例の類似度と優先度との関係の一例を示し、類似度が高くても、翻訳対象原文の訳文の翻訳精度や完成度が低く訳文の合成がし難い場合について説明する。

[表１のケース１]
翻訳対象原文と翻訳用例１原文とは一致する単語の割合は（４／６）であり、翻訳対象原文と翻訳用例２原文とは一致する単語の割合は（４／５）である。従って、翻訳用例１原文の類似度は６７％、翻訳用例２原文の類似度は８０％であり、翻訳用例２原文の優先度が１で翻訳用例１原文の優先度が２となっているので、現状では、翻訳用例２が優先的に使用される。

ところが、翻訳用例２原文の”unwillingly”と翻訳対象原文の”yesterday”との構文上の役割は”気持や状態を表す副詞句”と”時間を表す副詞句”とで異なり、一方、翻訳用例１原文の”last month”と翻訳対象原文の”yesterday”との構文上の役割は同じ”時間を表す副詞句”である。このため、翻訳用例２原文より類似度は低いが翻訳用例１の訳文を使用した方が精度の高い訳文を得ることができる。

[表１のケース２]
翻訳対象原文と翻訳用例１原文とは一致する単語の割合は（７／９）であり、翻訳対象原文と翻訳用例２原文とは一致する単語の割合は（７／９）である。従って、翻訳用例１原文の類似度は７８％、翻訳用例２原文の類似度は７８％であり、翻訳対象原文との類似度は、翻訳用例１と翻訳用例２は同じであるが、翻訳用例１原文が先に検索発見されたので、翻訳用例１の原文の優先度が１で翻訳用例２の原文の優先度が２となっている。これにより、現状では、翻訳用例１の原文が優先的に使用される。

ところが、翻訳対象原文と翻訳用例１の異なる箇所（差分箇所）は２箇所あり、翻訳用例１を使用して翻訳対象原文の訳文を合成する場合、２つの差分箇所で処理（編集、自動置き換えなど）を行わなければならない。一方、翻訳対象原文と翻訳用例２との差分箇所は１つであり、翻訳用例２を使用して訳文を合成する場合、１つの差分箇所のみを処理すればよい。このように、翻訳用例２を使用した方が、訳文の合成がし易い。

[表１のケース３]
翻訳対象原文と翻訳用例１原文とは一致する単語の割合は（４／５）であり、翻訳対象原文と翻訳用例２原文とは一致する単語の割合は（４／５）である。従って、翻訳用例１原文の類似度は８０％、翻訳用例２原文の類似度は８０％であり、翻訳対象原文との類似度は、翻訳用例１と翻訳用例２は同じであるが、翻訳用例１原文が先に検索発見されたので、翻訳用例１の原文の優先度が１で翻訳用例２の原文の優先度が２となっている。これにより、現状では、翻訳用例１の原文が優先的に使用される。

ところが、翻訳用例１原文の”seldom”には否定の意味合いを持ち、翻訳用例１を使用して翻訳対象原文の訳文を合成する場合、この否定の意味合いを考慮した処理が必要となる（例えば用例訳文中の”しません”を”します”に変更する）。一方、翻訳用例２を使用するとこのような余分な処理を行わなくてよい。このように、翻訳用例２を使用した方が、訳文の合成がし易い。

[表１のケース４]
翻訳対象原文と翻訳用例１原文とは一致する単語の割合は（１０／１２）であり、翻訳対象原文と翻訳用例２原文とは一致する単語の割合は（１０／１２）である。従って、翻訳用例１原文の類似度は８３％、翻訳用例２原文の類似度は８３％であり、翻訳対象原文との類似度は、翻訳用例１と翻訳用例２は同じであるが、翻訳用例１原文が先に検索発見されたので、翻訳用例１の原文の優先度が１で翻訳用例２の原文の優先度が２となっている。これにより、現状では、翻訳用例１の原文が優先的に使用される。

ところが、翻訳用例１訳文には、翻訳用例１原文の”手紙”に対応した訳語がない。そのため、翻訳用例１訳文を使用して翻訳対象原文の訳文を合成する場合、”手紙”と差分である”招待状”に対応した語句がないため、編集や置き換えなどが難しくなる。この場合、翻訳用例２訳文を使用して翻訳対象原文訳文を合成した方が簡単である。

本発明の目的は、翻訳対象原文の訳文の翻訳精度や完成度が高く、しかも訳文の合成がし易くなるように翻訳用例の優先度を調整できる機械翻訳装置及び機械翻訳プログラムを提供することである。

本発明の機械翻訳装置は、機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、前記翻訳用例検索手段で翻訳用例検索で見つけた翻訳用例の原文に対して形態素解析及び構文解析を行い翻訳対象原文及び翻訳用例原文の構文構造を求める翻訳手段と、前記翻訳用例検索手段で複数の翻訳用例が検索された場合には前記翻訳手段で求めた構文構造に基づいて各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分について前記構文構造に基づいて構文上の役割を判定し前記構文上の役割が同じである割合が高いほど高い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする。

本発明によれば、翻訳対象原文の訳文の翻訳精度や完成度が高く、しかも訳文の合成がし易くなるように翻訳用例の優先度を調整できる。

以下、図面を参照しながら本発明の実施の形態について説明する。図１は本発明の実施の形態に係わる機械翻訳装置１１の機能ブロック図、図２は本発明の実施の形態に係る機械翻訳装置のハードウエア構成を示すブロック構成図である。

図２に示すように、機械翻訳装置１１は、例えば一般的なコンピュータに機械翻訳プログラムなどのソフトウェアプログラムがインストールされ、そのソフトウェアプログラムが演算制御装置１２のプロセッサ１３において実行されることにより実現される。

演算制御装置１２は機械翻訳に関する各種演算を行うものであり、演算制御装置１２はプロセッサ１３とメモリ１４とを有し、メモリ１４には翻訳に関する機械翻訳プログラム１５が記憶され、プロセッサ１３により処理が実行される際には作業エリア１６が用いられる。演算制御装置１２の演算結果等は出力装置１７である表示装置１８に表示出力され、また、通信制御装置１９を介して通信ネットワークに出力される。

入力装置２０は演算制御装置１２に情報を入力するものであり、例えば、マウス２１、キーボード２２、ディスクドライブ２３、通信制御装置１９から構成され、例えば、マウス２１やキーボード２２は表示装置１８を介して演算制御装置１２に各種指令を入力し、キーボード２２、ディスクドライブ２３、通信制御装置１９は翻訳対象の文書を入力する。

すなわち、ディスクドライブ２３は翻訳対象の文書のファイルを記憶媒体に入出力するものであり、通信制御装置１９は機械翻訳装置１１をインターネットやＬＡＮなどの通信ネットワークに接続するものである。通信制御装置１９はＬＡＮカードやモデムなどの装置であり、通信制御装置１９を介して通信ネットワークと送受信したデータは入力信号又は出力信号として演算制御装置１２に送受信される。さらに、演算制御装置１２の演算結果や機械翻訳規則や機械翻訳辞書等を記憶するハードディスクドライブ（ＨＤＤ）２４が設けられている。

図１に示す演算制御装置１２内の各機能ブロックは、上述の機械翻訳プログラム１５を構成する各プログラムに対応する。すなわち、プロセッサ１３が機械翻訳プログラム１５を構成する各プログラムを実行することで、演算制御装置１２は、各機能ブロックとして機能することとなる。また、記憶装置２５の各ブロックは、演算制御装置１２内のメモリ１４及びハードディスクドライブ２４の記憶領域に対応する。

演算制御部１２の入力部２６は、ユーザによって入力装置２０から入力された第１言語の翻訳対象の原文データの入力処理を行い翻訳部２７に取り込むものであり、ユーザによって入力装置２０から入力された翻訳操作に必要な情報も入力処理する。また、表示部２８は、翻訳対象の第１言語の原文データや翻訳部２７で翻訳された翻訳後の第２言語の訳文、さらには記憶装置２５の翻訳用例データベース２９から検索された翻訳用例の表示処理を行い表示装置１８に表示するものである。

記憶装置２５に記憶された翻訳用例データベース２９は、予め登録された第１言語の文と第２言語の文との対訳からなる翻訳用例を複数蓄積したデータベースであり、例えば、表１に示した翻訳用例が記憶されている。機械翻訳辞書３０及び機械翻訳規則３１には、第１言語の原文を第２言語の訳文に翻訳する際に使用する語彙・規則が蓄積されている。

翻訳部２７は、訳文翻訳用例データベース２９、機械翻訳辞書３０及び機械翻訳規則３１を用いて、第１言語の原文を第２言語の訳文に機械翻訳を行うものであり、翻訳用例検索手段３２、差分対応付け手段３３、用例優先度付与手段３４及び翻訳手段３５を有している。翻訳用例検索手段３２は、入力された第１言語の翻訳対象原文を検索キーとして翻訳用例データベース２９から翻訳対象原文に類似する翻訳用例を検索するものである。差分対応付け手段３３は、翻訳用例検索手段３２により検索された翻訳用例の原文と翻訳対象原文との差異部分を対応付けるものであり、用例優先度付与手段３４は翻訳用例に優先度を付与するものである。そして、翻訳手段３５は第１言語の翻訳対象原文を第２言語の訳文に翻訳するものである。

機械翻訳装置１１は、入力装置から入力され入力部２６で入力処理して取り込んだ翻訳対象原文について翻訳用例検索手段３２で翻訳用例データベース２９から翻訳用例を検索し、翻訳用例検索手段３２での検索で複数の翻訳用例が得られた場合に、差分対応付け手段３３により翻訳対象原文と翻訳用例との差分箇所を対応付け、用例優先度付与手段３４により差分箇所の属性に応じて得られた翻訳用例に優先度を付与する構成になっている。

機械翻訳装置１１のこれら処理の後に、付与された優先度に基づき翻訳用例リストをユーザに提示したり、優先度の最も高い翻訳用例を使用して翻訳対象原文の訳文を自動的に合成したりすることになる。本発明の特徴点は、翻訳用例検索で見つけた複数の翻訳用例に対して優先度を付与する点であり、複数の翻訳用例に対して優先度を付与した後の翻訳用例リストの提示や訳文の合成などの処理は本発明の本質的な部分でないので、それらの説明は省略する。

図３は本発明の実施の形態に係わる機械翻訳装置の処理内容を示すフローチャートである。ユーザにより入力装置２０から入力された第１言語の翻訳対象原文は、入力部２６で入力処理されて翻訳部２７に取り込まれる。そして、入力装置２０から翻訳指令が入力され入力部２６により翻訳要求が発行されると、翻訳部２７の翻訳手段３５は、取り込まれた翻訳対象原文に対して辞書引き処理・形態素解析を行い（Ｓ１）、各形態素の品詞、活用の種類、各種属性、訳語などの各種情報が得る。続いて、翻訳部２７の翻訳用例検索手段３２は記憶装置２５の翻訳用例データベース２９に対して用例検索を行う（Ｓ２）。すなわち、入力された翻訳対象原文と同じ翻訳用例原文または類似の翻訳用例原文を持つ翻訳用例が蓄積されているか否かを検出する。

この段階では、ステップＳ１の処理により、形態素解析結果や翻訳対象原文中の各語に対する各種情報が取得されているため、例えば、日本語の場合には、カタカナや送り仮名の表記の揺れ、漢字表記とひらがな表記の揺れ、送り仮名の有無の揺れの情報も取得されている。これらの情報により、完全に入力された翻訳対象原文と１文字違わず一致した翻訳用例でなくとも、これらの表記の揺れに関する違いについては、違いとしては認識しないような揺れの吸収処理を行うことも可能である。

一方、表記の揺れは吸収しない完全一致の翻訳用例があるときのみ検索成功とすることも可能である。また、文字・単語上の違いがあっても同値とみなす差異文字数、ないしは差異単語数の割合の下限値を設けて検索の可否を制御する構成としてもよい。これにより、語句・文字の使われ方が類似した翻訳用例を抽出できる。このような場合は、ステップＳ２の翻訳用例検索のタイミングをステップＳ１の辞書引き処理・形態素解析の後にする必要もなくなり、図２の処理の最初に行う構成でもよい。

次に、翻訳用例検索手段３２は翻訳用例が検索できたか否かを判定し（Ｓ３）、翻訳用例が検索できた場合には検索結果は複数か否かを判定する（Ｓ４）。翻訳用例の検索結果が複数ある場合には、翻訳部２７は用例優先度付与処理を実行し（Ｓ５）、さらに翻訳処理を実行する（Ｓ６）。ステップＳ３の判定で、翻訳用例が検索でなかった場合や、ステップＳ４の判定で検索結果が１つだけであるときは、ステップＳ６の翻訳処理に移行する。

次に、図３のステップＳ５の用例優先度付与処理について説明する。用例優先度付与処理は、以下の４通りの翻訳対象原文と翻訳用例原文との差分箇所の属性を考慮に入れて用例の優先度を付与する処理を行う。

（ａ）翻訳対象原文と翻訳用例原文との差分の構文上の役割
（ｂ）差分箇所の数
（ｃ）翻訳用例原文の訳語が複数箇所の分離された語句に対応している割合
（ｄ）翻訳用例原文の翻訳用例訳文に対応訳語がない割合
上記の（ｃ）、（ｄ）は、翻訳対象原文に対する翻訳用例原文だけでなく、翻訳用例訳文を使用して訳文を合成する際の合成のし易さをも考慮に入れるものである。

図４は本発明の実施の形態における用例優先度付与処理の実施例１の処理内容を示すフローチャートである。この実施例１は、前述の「（ａ）翻訳対象原文と翻訳用例原文との差分の構文上の役割」を考慮に入れた用例優先度付与処理ａである。翻訳部２７による用例優先度付与処理ａは以下のようにして行われる。

まず、翻訳部２７の翻訳手段３５は、翻訳対象原文に対して構文解析を行う（Ｓ１１）。そして、翻訳手段３５は、翻訳用例検索で見つけた翻訳用例について、翻訳用例原文に対して形態素解析、構文解析を行う（Ｓ１２）。これによって、翻訳対象原文、翻訳用例原文の文を構成する単語列、各単語の品詞・活用の種類・訳語ほか、翻訳処理に必要な各種情報、そして構文構造がすべて得られる。この処理で構文上の役割が得られる。

差分対応付け手段３３は、これらの情報を用いて、翻訳対象原文と翻訳用例原文との差分の対応付けを行う（Ｓ１３）。

続いて、用例優先度付与手段３４は、翻訳対象原文と翻訳用例原文との差分箇所の数を記憶装置１５の予め定めた記憶領域に記憶する（Ｓ１４）。その後、用例優先度付与手段３４は、各差分箇所において、翻訳対象原文の語句と翻訳用例原文の語句との構文上の役割を比較し（Ｓ１５）、構文上の役割が一致している差分箇所の数を記憶する（Ｓ１６）。最後に、用例優先度付与手段３４は、ステップＳ１４で記憶した差分箇所の数、ステップＳ１６で記憶した構文上の役割が一致している差分箇所の数を用いて当該用例の優先度を算出する（Ｓ１７）。そして、次の翻訳用例があるかどうかを判断し、翻訳用例がある場合にはステップＳ１２に戻り（Ｓ１８）、翻訳用例がなくなるまでステップＳ１２〜ステップＳ１７の処理を繰り返し行う。

ここで、用例優先度付与手段３４によるステップＳ１４での差分箇所の数え方としては、構文解析後の構文木（構文解析の結果を木構造で表したもの）において、ひとまとまりである語句（木構造の１ノード）を１箇所の差分として扱う。また、構文木を利用せず、文中の連続した差分語句をまとめて１箇所の差分として扱う構成にしてもよい。

また、用例優先度付与手段３４によるステップＳ１７の優先度の算出には、優先度をＰ、類似度をα［％］、差分箇所の数をＮ、構文上の役割が一致する差分箇所の数をｎ、係数をｋとしたとき、以下の（１）式を使用する。

［数１］
Ｐ＝（１００％−α）・（ｎ／Ｎ）・ｋ＋α
実施例１においては、構文上の役割０．が一致する差分箇所が類似度αにどれぐらい影響を与えるかを統計的に検証して係数ｋを定めるようにしてもよいし、差分箇所の数などの要素によって係数ｋを動的に定めるようにしてもよい。ここでは、例えば、係数ｋを”０．８”に固定して設定する。

いま、表１のケース１の翻訳対象原文に対して、翻訳用例データベース２９より表１のケース１の２つの翻訳用例が検索されたとする。

翻訳対象原文： He attended our meeting yesterday.
翻訳用例１原文： He attended our meeting last month.
翻訳用例２原文： He attended our meeting unwillingly.
図４のステップＳ１１では、翻訳手段３５により、翻訳対象原文”He attended our meeting yesterday.”について構文解析を行い、翻訳用例検索手段３２で既に検索で見つけた２つの翻訳用例について、それぞれにＳ１２〜Ｓ１７の処理が行われる。

まず、翻訳用例１に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”yesterday”と”last month”とが差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。用例優先度付与手段３４のステップＳ１５の処理で、”yesterday”と”last month”との構文上の役割が比較され、双方ともに同じ”時間表現を表す副詞句”であり構文上の役割が一致すると判定される。次に、用例優先度付与手段３４でのステップＳ１６の処理で、構文上の役割が一致している差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。

そして、用例優先度付与手段３４のステップＳ１７の処理で、ステップＳ１４及びステップＳ１６で得られた差分箇所の数Ｎや構文上の役割が一致する差分箇所の数ｎを用いて優先度Ｐが算出される。すなわち、ケース１の翻訳用例１の類似度αは６７％、差分箇所の数Ｎは１、構文上の役割が一致する差分箇所の数ｎは１、係数ｋは０．８であるので、（１）式にこれらを代入して、ケース１の翻訳用例１の優先度Ｐ１１を求めるとＰ１１＝９３％となる。

次に、翻訳用例２に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”yesterday”と”unwillingly”とが差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。用例優先度付与手段３４のステップＳ１５の処理で、”yesterday”と”unwillingly”が構文上の役割が比較され、これらの構文上の役割が一致しないと判定される。次に、用例優先度付与手段３４でのステップＳ１６の処理で、構文上の役割が一致している差分箇所の数「０」が記憶装置２５の予め定めた記憶領域に記憶される。

そして、用例優先度付与手段３４のステップＳ１７の処理で、ステップＳ１４及びステップＳ１６で得られた差分箇所の数Ｎや構文上の役割が一致する差分箇所の数ｎを用いてケース１の翻訳用例２の優先度Ｐ１２が算出される。すなわち、ケース１の翻訳用例２の類似度αは８０％、差分箇所の数Ｎは１、構文上の役割が一致する差分箇所の数ｎは０、係数ｋは０．８であるので、（１）式にこれらを代入して、ケース１の翻訳用例２の優先度Ｐ１２を求めるとＰ１２＝８０％となる。

このようにして、求められた優先度Ｐ１１、Ｐ１２は、記憶装置２５の予め定めた記憶領域に記憶されるとともに、入力装置２０からの指令により必要に応じて表示部２８を介して表示装置１８に表示される。これにより、翻訳用例１の優先度Ｐ１１が翻訳用例２の優先度Ｐ１２よりも高いことがユーザに提供される。以上の説明では、優先度Ｐは％表示で表したが、優先度の％数値の高い順から「優先度１」、「優先度２」のように翻訳用例の優先度を番号順で付与するようにしてもよい。

以上述べたように、表１のケース１の場合、従来の翻訳用例の選択では、類似度が高い翻訳用例２を優先的に提示する（または使用する）が、本発明の実施例１では、差分箇所の構文上の役割を考慮して優先度Ｐを調整するので、類似度は低いが差分箇所の構文上の役割の一致する割合が大きい翻訳用例１を優先的に提示する（または使用する）ことになる。

本発明の実施の形態の実施例１によれば、翻訳対象原文の翻訳用例が複数ある場合、各翻訳用例において、差分箇所の構文上の役割が同じである翻訳用例の優先度を高くするので、その翻訳用例を用いて翻訳対象原文の訳文を合成する際に完成度の高い訳文が得られる。

図５は本発明の実施の形態における用例優先度付与処理の実施例２の処理内容を示すフローチャートである。この実施例２は、前述の「（ｂ）差分箇所の数」を考慮に入れた用例優先度付与処理ｂである。翻訳部２７による用例優先度付与処理ｂは以下のようにして行われる。

まず、図４に示した実施例１の場合と同様に、翻訳部２７の翻訳手段３５は、翻訳対象原文に対して構文解析を行い（Ｓ１１）、翻訳手段３５は、翻訳用例検索で見つけた翻訳用例について、翻訳用例原文に対して形態素解析、構文解析を行う（Ｓ１２）。そして、差分対応付け手段３３は、これらの情報を用いて、翻訳対象原文と翻訳用例原文との差分の対応付けを行い（Ｓ１３）、用例優先度付与手段３４は、翻訳対象原文と翻訳用例原文との差分箇所の数を記憶装置１５の予め定めた記憶領域に記憶する（Ｓ１４）。

次に、用例優先度付与手段３４は、次の翻訳用例があるかどうかを判断し、翻訳用例がある場合にはステップＳ１２に戻り（Ｓ１９）、翻訳用例がなくなるまでステップＳ１２〜ステップＳ１４の処理を繰り返し行う。その後、すべての翻訳用例のうち、差分箇所の数が最も多い翻訳用例の最多差分箇所数Ｎmaxを取得する（Ｓ２０）。取得した最多差分箇所数Ｎmaxを用いて、最初の翻訳用例から順番に翻訳用例の優先度を算出する（Ｓ２１）。

用例優先度付与手段３４によるステップＳ２１の優先度の算出には、優先度をＰ、類似度をα［％］、差分箇所の数をＮ、最多差分箇所数をＮmaxとしたとき、以下の（２）式を使用する。

［数２］
Ｐ＝（１００−α）・（１−Ｎ／Ｎmax）＋α
実施例２においては、差分箇所Ｎが多いほど（差分箇所Ｎの数が最多差分箇所数Ｎmaxに近づくほど）、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから優先度を低くする。

すなわち、（１００−α）の係数を（１−Ｎ／Ｎmax）としているが、（１００−α）の係数を固定値にしてもよいし、差分箇所Ｎが多い場合に類似度αにどれぐらい影響を与えるかを統計的に検証して、（１００−α）の係数を定めるようにしてもよい。

いま、表１のケース２の翻訳対象原文に対して、翻訳用例データベース２９より表１のケース２の２つの翻訳用例が検索されたとする。

翻訳対象原文： The goods delivered were much different from the sample.
翻訳用例１原文： The products delivered were much different from the model.
翻訳用例２原文： The finished products delivered were much different from the sample.
図５のステップＳ１１では、翻訳手段３５により、”The goods delivered were much different from the sample.”について構文解析を行い、翻訳用例検索手段３２で既に検索で見つけた２つの翻訳用例について、それぞれにＳ１２〜Ｓ１４の処理が行われる。

まず、翻訳用例１に対して、差分対応付け手段３３でのステップＳ１３の処理で、”goods”と”products”、”sample”と”model”が対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「２」が記憶装置２５の予め定めた記憶領域に記憶される。

一方、翻訳用例２に対して、差分対応付け手段３３でのステップＳ１３の処理で、”goods”と”finished products”が対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。

表１のケース２の場合、翻訳用例は翻訳用例１、２の２つであるので、用例優先度付与手段３４のステップＳ２０の処理で、翻訳用例１、２のうちの最多差分箇所を検索し最多差分箇所数Ｎmaxとして「２」を取得する。そして、用例優先度付与手段３４のステップＳ２１の処理で、翻訳用例１、翻訳用例２の優先度を算出する。翻訳用例１の類似度αは７８％、差分箇所Ｎは２、最多差分箇所数Ｎmaxは２であるので、（２）式にこれらを代入して、ケース２の翻訳用例１の優先度Ｐ２１を求めるとＰ２１＝７８％となる。一方、ケース２の翻訳用例２の類似度αは７８％、差分箇所の数Ｎは１、最多差分箇所数Ｎmaxは２であるので、（２）式にこれらを代入して、ケース２の翻訳用例２の優先度Ｐ２２を求めるとＰ２２＝８９％となる。

このようにして、求められた優先度Ｐ２１、Ｐ２２は、記憶装置２５の予め定めた記憶領域に記憶されるとともに、入力装置２０からの指令により必要に応じて表示部２８を介して表示装置１８に表示される。これにより、翻訳用例２の優先度Ｐ２２が翻訳用例２の優先度Ｐ２１よりも高いことがユーザに提供される。

以上述べたように、表１のケース２の場合、従来の翻訳用例の選択では、類似度αが７８％で同じであるため、翻訳用例検索で先に見つけた翻訳用例１を優先的に提示する（または使用する）が、実施例２では、差分箇所数Ｎを考慮して優先度Ｐを調整するので、類似度αが同じであっても差分箇所数Ｎが少ない翻訳用例２を優先的に提示する（または使用する）ようになる。

すなわち、翻訳用例１を使用して翻訳対象原文の訳文を合成する場合、”products”と”model”との２箇所で編集を行わなければならないが、翻訳用例２を使用した場合には、”finished products”の１箇所で編集を行うだけでよい。後者の場合、編集コストが少なく、また、編集による周囲への影響が少ないため訳文合成失敗のリスクが少ない。

本発明の実施の形態の実施例２によれば、差分箇所数に応じて翻訳用例の優先度を調整することによって、差分箇所の少ない翻訳用例が優先的に使用されるため、翻訳用例を用いて翻訳対象原文の訳文を合成する際に完成度の高い訳文が得られる。

図６は本発明の実施の形態における用例優先度付与処理の実施例３の処理内容を示すフローチャートである。この実施例３は、前述の「（ｃ）翻訳用例原文の訳語が複数箇所の分離された語句に対応している割合」を考慮に入れた用例優先度付与処理ｃである。翻訳部２７による用例優先度付与処理ｃは以下のようにして行われる。

次に、用例優先度付与手段３４は差分箇所の分析を行い（Ｓ２２）、差分箇所の翻訳用例原文の訳語が当該翻訳用例の訳文の分離している複数箇所に対応しているか否かをチェックし、当該翻訳用例の訳文の複数箇所に対応している差分箇所の数を記憶装置２５の予め定められた記憶領域に記憶する（Ｓ２３）。その後に、用例優先度付与手段３４は、ステップＳ１４で記憶した差分箇所数、ステップＳ２３で記憶した訳文の複数箇所に対応している差分箇所の数を用いて当該翻訳用例の優先度を算出する（Ｓ２４）。そして、用例優先度付与手段３４は、次の翻訳用例があるかどうかを判断し、翻訳用例がある場合にはステップＳ１２に戻り（Ｓ２５）、翻訳用例がなくなるまでステップＳ１２〜ステップＳ２４の処理を繰り返し行う。

用例優先度付与手段３４によるステップＳ２４の優先度の算出には、優先度をＰ、類似度をα［％］、差分箇所の数をＮ、訳文の複数箇所に対応している差分箇所の数をＮａとしたとき、以下の（３）式を使用する。

［数３］
Ｐ＝α−（１００−α）・（Ｎａ／Ｎ）
実施例３においては、訳文の複数箇所に対応している差分箇所の数Ｎａが多いほど、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから、（１００−α）の係数を（Ｎａ／Ｎ）としている。この（１００−α）の係数である（Ｎａ／Ｎ）は固定値にしてもよいし、訳文の複数箇所に対応している差分箇所が多い場合に類似度にどれぐらい影響を与えるかを統計的に検証して定めるようにしてもよい。

いま、表１のケース３の翻訳対象原文に対して、翻訳用例データベース２９より表１のケース２の２つの翻訳用例が検索されたとする。

翻訳対象原文： He usually attended our meeting.
翻訳用例１原文： He seldom attends our meeting.
翻訳用例２原文： He sometimes attends our meeting.
図６のステップＳ１１では、翻訳手段３５により、”He usually attended our meeting.”について構文解析を行い、翻訳用例検索手段３２で既に検索で見つけた２つの翻訳用例について、それぞれにＳ１２〜Ｓ２４の処理が行われる。

まず、翻訳用例１に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”usually”と”seldom”とが対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。

次に、用例優先度付与手段３４のステップＳ２２の処理で差分箇所の分析が行われる。すなわち、差分箇所である”seldom”が訳文の複数箇所に対応しているかどうかが判定される。翻訳用例原文側の１つの語句が翻訳用例訳文側の分離している複数の部分に対応しているかを分析する方法は様々なものがある。例えば、語句の品詞と”否定”属性とを利用する方法や、語句を翻訳辞書で辞書引きして訳語が構文上の複数部分から構成されるのを利用する方法などがある。

この例文では、語句の品詞と”否定”属性とを利用する。翻訳手段３５による翻訳用例１原文の構文解析後に、”seldom”の属性として”否定”が付与されているので、用例優先度付与手段３４のステップＳ２２の処理で”seldom”の属性として”否定”が付与されていることが分かり、また、”seldom”の品詞が”副詞”であることも判明する。副詞には否定の活用がないため、この”否定”に対応する訳文の部分と”seldom”に対応する訳文の部分は分離している部分となることが分かる。

次に、用例優先度付与手段３４のステップＳ２３の処理で、訳文の複数箇所に対応している差分箇所の数「１」を記憶装置２５の予め定めた記憶領域に記憶する。そして、用例優先度付与手段３４のステップＳ２４の処理で、ケース３の翻訳用例１の優先度を算出する。翻訳用例１の類似度αは８０％、差分箇所Ｎは１、訳文の複数箇所に対応している差分箇所数Ｎａは１であるので、（３）式にこれらを代入して、ケース３の翻訳用例１の優先度Ｐ３１を求めるとＰ３１＝６０％となる。

次に、翻訳用例２に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”usually”と”sometimes”とが対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。

次に、用例優先度付与手段３４のステップＳ２２の処理で差分箇所の分析が行われる。すなわち、差分箇所である”sometimes”が訳文の複数箇所に対応しているかどうかが判定される。”sometimes”は訳文の複数箇所に対応していないので、用例優先度付与手段３４のステップＳ２３の処理で、訳文の複数箇所に対応している差分箇所数「０」を記憶装置２５の予め定めた記憶領域に記憶する。

そして、用例優先度付与手段３４のステップＳ２５の処理で、ケース３の翻訳用例２の優先度Ｐ３２を算出する。翻訳用例１の類似度αは８０％、差分箇所Ｎは１、訳文の複数箇所に対応している差分箇所数Ｎａは０であるので、（３）式にこれらを代入して、ケース３の翻訳用例２の優先度Ｐ３２を求めるとＰ３２＝８０％となる。

このようにして、求められた優先度Ｐ３１、Ｐ３２は、記憶装置２５の予め定めた記憶領域に記憶されるとともに、入力装置２０からの指令により必要に応じて表示部２８を介して表示装置１８に表示される。これにより、翻訳用例１の優先度Ｐ３２が翻訳用例２の優先度Ｐ３１よりも高いことがユーザに提供される。

以上述べたように、表１のケース３の場合、従来の翻訳用例の選択では、類似度αが８０％で同じであるため、翻訳用例検索で先に見つけた翻訳用例１を優先的に提示する（または使用する）が、実施例３では、差分箇所が訳文の複数箇所に対応しているかの観点で当該翻訳用例を使用して翻訳対象原文の訳文を合成する際の合成のし易さを考慮して優先度を調整するので、類似度αが同じであっても、差分箇所が訳文の複数箇所に対応している差分箇所数Ｎａが小さい翻訳用例２を優先的に提示する（または使用する）ようになる。

すなわち、翻訳用例１を使用して翻訳対象原文の訳文を合成する場合、”seldom”が対応している部分を編集するだけでなく、”seldom”が持つ”否定”の意味合いに対応する”しません”の部分も編集しなければならないので、編集コストが増え、また、編集による周囲への影響が増えるため訳文合成失敗のリスクが高くなるが、翻訳用例２を使用した場合にはそのような欠点はない。

本発明の実施の形態の実施例３によれば、差分箇所が用例訳文中の分離されている複数箇所に対応している翻訳用例の優先度を調整して低くし、そうでない翻訳用例を優先的に使用するので、翻訳用例を用いて翻訳対象原文の訳文を合成する際の編集コストや合成失敗のリスクを低減できる。従って、完成度の高い訳文が得られる。

図７は本発明の実施の形態における用例優先度付与処理の実施例３の処理内容を示すフローチャートである。この実施例３は、前述の「（ｄ）翻訳用例原文の翻訳用例訳文に対応訳語がない割合」を考慮に入れた用例優先度付与処理ｄである。翻訳部２７による用例優先度付与処理ｄは以下のようにして行われる。

次に、用例優先度付与手段３４は、ステップＳ１２の処理で得た情報を用いて翻訳用例原文の語句と翻訳用例訳文の語句との対応付けを行う（Ｓ２６）。この対応付けによって、対応する訳文語句がない差分箇所が判明する。そこで、その対応する訳文語句がない差分箇所の数を記憶装置２５の予め定められた記憶領域に記憶する（Ｓ２７）。次に、ステップ１４で記憶した差分箇所の数、ステップＳ２７で記憶した翻訳用例原文の語句に対応する訳文語句がない差分箇所の数を用いて当該翻訳用例の優先度を算出する（Ｓ２８）。そして、用例優先度付与手段３４は、次の翻訳用例があるかどうかを判断し、翻訳用例がある場合にはステップＳ１２に戻り（Ｓ２５）、翻訳用例がなくなるまでステップＳ１２〜ステップＳ２８の処理を繰り返し行う。

用例優先度付与手段３４によるステップＳ２８の優先度の算出には、優先度をＰ、類似度をα［％］、差分箇所の数をＮ、翻訳用例原文の語句に対応する訳文語句がない差分箇所の数をＮｂとしたとき、以下の（４）式を使用する。

［数４］
Ｐ＝α−（１００−α）・（Ｎｂ／Ｎ）
実施例４においては、対応する訳文語句がない差分箇所の数Ｎｂが多いほど、当該翻訳用例を使用した際の編集コストや訳文合成失敗リスクが大きくなることから、（１００−α）の係数を（Ｎｂ／Ｎ）としている。この（１００−α）の係数である（Ｎｂ／Ｎ）は固定値にしてもよいし、対応する訳文語句がない差分箇所が多い場合に類似度にどれぐらい影響を与えるかを統計的に検証して定める構成にしてもよい。

いま、表１のケース４の翻訳対象原文に対して、翻訳用例データベース２９より表１のケース２の２つの翻訳用例が検索されたとする。

翻訳対象原文：昨日彼に招待状を書きました。

翻訳用例１原文：昨日彼に手紙を書きました。

翻訳用例１訳文： I wrote to him yesterday.
翻訳用例２原文：昨日彼に手紙を書きました。

翻訳用例２訳文： I wrote a letter to him yesterday.
図７のステップＳ１１では、翻訳手段３５により、”昨日彼に招待状を書きました。”について構文解析を行い、翻訳用例検索手段３２で既に検索で見つけた２つの翻訳用例について、それぞれにＳ１２〜Ｓ２８の処理が行われる。

まず、翻訳用例１に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”招待状”と”手紙”が対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。用例優先度付与手段３４のステップＳ２６の処理で、翻訳用例１原文の語句と翻訳用例１訳文の語句との対応付けが行われる。これにより、”手紙”に対応している訳文語句がないことが判明する。用例優先度付与手段３４のステップＳ２７の処理で、対応する訳文語句がない差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。

そして、用例優先度付与手段３４のステップＳ２８の処理で、ケース４の翻訳用例１の優先度を算出する。翻訳用例１の類似度αは８３％、差分箇所Ｎは１、翻訳用例原文の語句に対応する訳文語句がない差分箇所の数Ｎｂは１であるので、（４）式にこれらを代入して、ケース４の翻訳用例１の優先度Ｐ４１を求めるとＰ４１＝６６％となる。

次に、翻訳用例２に対する処理について説明する。差分対応付け手段３３でのステップＳ１３の処理で、”招待状”と”手紙”とが対応する差分語句として対応付けられる。用例優先度付与手段３４のステップＳ１４の処理で、差分箇所の数「１」が記憶装置２５の予め定めた記憶領域に記憶される。用例優先度付与手段３４のステップＳ２６の処理で、翻訳用例１原文の語句と翻訳用例１訳文の語句との対応付けが行われ、”手紙”が対応している訳文語句が”letter”であることが判明するので、用例優先度付与手段３４のステップＳ２７の処理で、対応する訳文語句がない差分箇所の数「０」が記憶装置２５の予め定めた記憶領域に記憶される。

そして、用例優先度付与手段３４のステップＳ２８の処理で、ケース４の翻訳用例２の優先度を算出する。翻訳用例２の類似度αは８３％、差分箇所Ｎは１、翻訳用例原文の語句に対応する訳文語句がない差分箇所の数Ｎｂは０であるので、（４）式にこれらを代入して、ケース４の翻訳用例１の優先度Ｐ４２を求めるとＰ４２＝８３％となる。

このようにして、求められた優先度Ｐ４１、Ｐ４２は、記憶装置２５の予め定めた記憶領域に記憶されるとともに、入力装置２０からの指令により必要に応じて表示部２８を介して表示装置１８に表示される。これにより、翻訳用例１の優先度Ｐ４２が翻訳用例２の優先度Ｐ４１よりも高いことがユーザに提供される。

以上述べたように、表１のケース４の場合、類似度αが同じであるため、翻訳用例検索で先に見つけた翻訳用例１を優先的に提示する（または使用する）が、実施例４では、翻訳用例中の差分箇所の翻訳用例原文の語句が翻訳用例訳文中の語句に対応しているかの観点で、当該翻訳用例を使用して翻訳対象原文の訳文を合成する際の合成のし易さを考慮して優先度を調整する。従って、類似度αが同じであっても、翻訳用例原文の語句に対応する訳文語句がない差分箇所の数Ｎｂが小さい翻訳用例２を優先的に提示する（または使用する）ようになる。

ここで、用例優先度付与手段３４のステップ２６での語句の対応付け処理、すなわち、翻訳用例原文（第１言語文）、翻訳用例訳文（第２言語文）の中のどの要素（語句）とどの要素とが対応しているかの判定処理は、形態素解析、構文解析済みの翻訳用例原文（第１言語文）、翻訳用例訳文（第２言語文）とにおいて実施する。

図８は表１のケース４の翻訳用例原文と翻訳用例訳文の構文木の説明図である。表１のケース４の翻訳用例１原文及び翻訳用例２原文中の「ＴＷ」で示しているのは、第２言語の訳語候補として存在する訳語の候補のリストである。複数あるものは、コンマで区切って列挙している。

差分対応付け手段３３での対応付け処理の流れの概要を以下に示す。

［１］以下の処理を第１言語の解析結果の各構成要素ごとに行う。

［１ａ］第１言語文の見出し語（形態素解析後の各要素）を、第２言語文の解析結果の中で「ＴＷ」属性を含む要素を探し、見出し語に対応する訳語を対応候補として抽出する。複数存在すれば複数候補のペアを抽出する。

［１ｂ］第１言語の要素の訳語候補の一つが第２言語文の解析結果中の構成要素と一致するかどうかをチェックし、一致するものがあれば対応候補として抽出する。複数存在すれば複数候補のペアを抽出する。

［２］上記［１］の結果、対応関係に重複がなく、ユニークに対応が決まるものは、対応語句として確定する。また、片方の構造中の１つの要素が他方の構造では２つ以上の連続要素に一致する場合など、要素数が一致しないケースでも対応語句として抽出する。

［３］上記［１］の結果、対応関係にあいまい性がある場合、例えば、同じ語が２回用いられているような場合は、他の対応語句候補と解析結果中での直接的修飾関係や、修飾関係の交差の有無や、部分構造中での他の対応語句候補との共存関係を基に、より可能性の高い対応関係を選択し、あいまい性を解消する。

［４］上記［３］までに対応語句候補が抽出されると、これらの対応語句候補の第１言語文の解析結果構造と第２言語文の解析結果構造との中で、構造的に連続している部分の検出を行う。

差分対応付け手段３３によるこの語句の対応付け処理によって表２の対応関係が得られる。

差分対応付け手段３３によりこの対応付けを行った後の内部データの一覧を表３に示す。

表３に示すように、翻訳用例１原文と翻訳用例１訳文とは、個々の構成要素、品詞情報、及びそれぞれ他方のデータ構造のどの語句に対応するかを示すＩＤ番号を示している。同様に、翻訳用例２原文と翻訳用例２訳文とは、個々の構成要素、品詞情報、及びそれぞれ他方のデータ構造のどの語句に対応するかを示すＩＤ番号とを有している。「−１」が入っている要素は、対応する語句がないことを示す。

この表３の対応関係から、翻訳対象原文との差分である翻訳用例１原文中の「手紙」が、対応している翻訳用例１訳文の語句がないことが分かる。一方、翻訳対象原文との差分である翻訳用例２原文中の「手紙」が、翻訳用例２訳文の語句「letter」に対応していることが分かる。

本発明の実施の形態の実施例４によれば、翻訳用例原文の語句に対応する訳文語句がない差分箇所の数が小さい翻訳用例の優先度を高くするので、翻訳用例を用いて翻訳対象原文の訳文を合成する際に、編集コストや合成失敗のリスクが低くすることができ完成度の高い訳文が得られる。

本発明の実施の形態に係わる機械翻訳装置１１の機能ブロック図。本発明の実施の形態に係る機械翻訳装置のハードウエア構成を示すブロック構成図。本発明の実施の形態に係わる機械翻訳装置の処理内容を示すフローチャート。本発明の実施の形態における用例優先度付与処理の実施例１の処理内容を示すフローチャート。本発明の実施の形態における用例優先度付与処理の実施例２の処理内容を示すフローチャート。本発明の実施の形態における用例優先度付与処理の実施例３の処理内容を示すフローチャート。本発明の実施の形態における用例優先度付与処理の実施例３の処理内容を示すフローチャート。表１のケース４の翻訳用例原文と翻訳用例訳文の構文木の説明図。

符号の説明

１１…機械翻訳装置、１２…演算制御装置、１３…プロセッサ、１４…メモリ、１５…プログラム、１６…作業エリア、１７…出力装置、１８…表示装置、１９…通信制御装置、２０…入力装置、２１…マウス、２２…キーボード、２３…ディスクドライブ、２４…ハードディスクドライブ、２５…記憶装置、２６…入力部、２７…翻訳部、２８…表示部、２９…翻訳用例データベース、３０…機械翻訳辞書、３１…機械翻訳規則、３２…翻訳用例検索手段、３３…差分対応付け手段、３４…用例優先度付与手段、３５…翻訳手段

Claims

機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で翻訳用例検索で見つけた翻訳用例の原文に対して形態素解析及び構文解析を行い翻訳対象原文及び翻訳用例原文の構文構造を求める翻訳手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には前記翻訳手段で求めた構文構造に基づいて各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分について前記構文構造に基づいて構文上の役割を判定し前記構文上の役割が同じである割合が高いほど高い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分の数が少ないほど高い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中の複数箇所の分離された語句に対応しているか否かを判定し複数箇所の分離された語句に対応している割合が高いほど低い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置において、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記翻訳用例データベースから検索する翻訳用例検索手段と、
前記翻訳用例検索手段で複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける差分対応付け手段と、
前記差分対応付け手段で対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中のどの語句に対応しているか判定し対応する語句がない割合が高いほど低い優先度を前記翻訳用例に付与する用例優先度付与手段とを備えたことを特徴とする機械翻訳装置。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第１言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから翻訳用例が検索された翻訳用例の原文に対して形態素解析及び構文解析を行い翻訳対象原文及び翻訳用例原文の構文構造を求める手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には前記構文構造に基づいて各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分について前記構文構造に基づいて構文上の役割を判定し前記構文上の役割が同じである割合が高いほど高い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第１言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分の数が少ないほど高い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第１言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中の複数箇所の分離された語句に対応しているか否かを判定し複数箇所の分離された語句に対応している割合が高いほど低い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。
機械翻訳プログラム、機械翻訳規則、機械翻訳辞書、翻訳用例データベースを記憶した記憶装置と、第１言語の翻訳対象原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し、前記機械翻訳規則、前記機械翻訳辞書、前記翻訳用例データベースを用いて、前記入力装置で入力された第１言語の翻訳対象原文を第２言語の訳文に翻訳する演算制御装置と、前記演算制御装置の処理内容を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
コンピュータに、前記入力装置により入力された第１言語の翻訳対象原文をデータとして入力処理する手順と、
前記翻訳対象原文に含まれる単語または文字と同一の単語または同一の文字が含まれる割合が予め定めた割合以上の翻訳用例を前記記憶装置の前記翻訳用例データベースから検索する手順と、
前記翻訳用例データベースから複数の翻訳用例が検索された場合には各々の翻訳用例の原文と前記翻訳対象原文との差異部分を対応付ける手順と、
対応付けられた各々の前記翻訳用例の原文と前記翻訳対象原文との差異部分が前記翻訳用例の訳文中のどの語句に対応しているか判定し対応する語句がない割合が高いほど低い優先度を前記翻訳用例に付与する手順とを実行させるための機械翻訳プログラム。