JP6620934B2

JP6620934B2 - 翻訳支援方法、翻訳支援装置、翻訳装置及び翻訳支援プログラム

Info

Publication number: JP6620934B2
Application number: JP2016016025A
Authority: JP
Inventors: 山内　真樹; 真樹山内; 菜々美藤原
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2016-01-29
Filing date: 2016-01-29
Publication date: 2019-12-18
Anticipated expiration: 2036-01-29
Also published as: US20170220562A1; US10055404B2; CN107066452B; CN107066452A; JP2017134754A

Description

本発明は、フレーズテーブルを用いる機械翻訳を支援する技術に関する。

機械翻訳の一種として、統計的機械翻訳がある。例えば、特許文献１は、入力文中の句に対して予め構築されたフレーズテーブルによりファジーマッチングを行うステップを具備することを特徴とするフレーズベースの統計的機械翻訳方法を開示している。

特開２０１０−６１６４５号公報

しかしながら、上記特許文献１の技術に対して、翻訳精度に関し、更なる改善が望まれる。

上記課題を解決するために、本発明の一態様である翻訳支援方法は、第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援する方法であって、前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを備える。

上記態様により、さらなる改善が実現できる。

本発明に係る一形態に適用される統計的機械翻訳システムを説明するブロック図である。フレーズテーブルの具体例を説明する説明図である。原文と三つ翻訳候補文とを説明する説明図である。本実施形態に係る翻訳システムの機能ブロック図である。本実施形態に係る翻訳システムの動作を説明するフローチャートである。形態素に分解された原文の一例を説明する説明図である。機械翻訳部によって生成されたデータ構造の一例を説明する説明図である。翻訳結果情報の一例を説明する説明図である。五つの翻訳候補文のそれぞれの形態素解析の結果を説明する説明図である。形態素の評価結果を説明する説明図である。評価部によって探索されたフレーズペアの組み合わせを説明する説明図である。フレーズペアの評価結果を説明する説明図である。

以下で説明する実施の形態は、本発明の一具体例を示すものである。以下の実施の形態で示される数値、構成要素、ステップ、ステップの順序等は、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（本発明に至った知見）
図１は、本発明に係る一形態に適用される統計的機械翻訳システム１を説明するブロック図である。統計的機械翻訳システム１は、対訳コーパス２、単言語コーパス３、翻訳モデル４、言語モデル５及びデコーダ６を備える。対訳コーパス２は、領域別、言語ペア別にそれぞれ用意されている。領域とは、例えば、旅行領域、医療領域である。言語ペアとは、例えば、日本語と英語とのペア、日本語と中国語とのペアである。

統計的機械翻訳システム１は、事前に、対訳コーパス２を学習して翻訳モデル４を生成し、かつ、単言語コーパス３を学習して言語モデル５を生成する。デコーダ６は、入力文（原文）に対して、翻訳モデル４と言語モデル５との組み合わせの中から確率が最大となる翻訳候補文を探索し、これを出力文（翻訳文）とする。ビタビ（Ｖｉｔｅｒｂｉ）やビーム探索を用いた最尤推定により、翻訳候補文が探索される。

翻訳モデル４は、フレーズテーブルによって管理される。フレーズテーブルには、フレーズペア、及び、各フレーズペアのスコアが各フレーズペアに対応付けて格納されている。フレーズペアは、第１言語のフレーズと第２言語のフレーズとの対である。スコアは、フレーズペアの出現確率に関する情報である。第１言語が日本語、第２言語が英語とし、この場合のフレーズテーブルの具体例を説明する。図２は、これを説明する説明図である。フレーズテーブル７において、欄１には、日本語フレーズが示され、欄２には、英語フレーズが示され、欄３には、フレーズの英日翻訳確率が示され、欄４には、単語の英日翻訳確率の積が示され、欄５には、フレーズの日英翻訳確率が示され、欄６には、単語の日英翻訳確率の積が示されている。欄３〜欄６に示される値は、それぞれ、スコアと称される。同じ行に位置する日本語フレーズと英語フレーズとがフレーズペアである。図２では、フレーズペア１〜１６が示されている。

スコアのうち、フレーズの英日翻訳確率（欄３）を用いて実施形態を説明するので、フレーズの英日翻訳確率（欄３）は、値が示されているが、単語の英日翻訳確率の積（欄４）、フレーズの日英翻訳確率（欄５）、単語の日英翻訳確率の積（欄６）は、値が省略されている。

フレーズの英日翻訳確率（欄３）とは、具体的に説明すると、例えば、日本語フレーズＪＦ１（「あれは」を意味する日本語）が、英語フレーズＥＦ１に翻訳される確率が０．１であり、英語フレーズＥＦ２に翻訳される確率が０．７であり、英語フレーズＥＦ３に翻訳される確率が０．２となる。これらの確率が加算された値は、１となる。

統計的機械翻訳システム１が、原文を翻訳するときに生成した複数の翻訳候補文をユーザーに提示し、複数の翻訳候補文の中から最適な翻訳候補文をユーザーに選択させ、それを基にして学習する態様が考えられる。具体的に説明すると、図３は、原文ＯＳと三つの翻訳候補文ＴＳ１，ＴＳ２，ＴＳ３との関係を説明する説明図である。原文ＯＳ（「あれは、ペンです」を意味する日本語）に対する翻訳候補文として、翻訳候補文ＴＳ１，ＴＳ２，ＴＳ３が生成されたとする。

ユーザーが翻訳候補文ＴＳ２を選択したとき、統計的機械翻訳システム１は、翻訳候補文ＴＳ１において、文節Ｃ１を悪い文節、文節Ｃ２を良い文節と学習し、翻訳候補文ＴＳ３において、文節Ｃ３を悪い文節、文節Ｃ４を良い文節、文節Ｃ５を悪い文節と学習する。

上記学習の結果が、フレーズテーブル７のスコアに反映されれば、統計的機械翻訳システム１の翻訳精度が向上する。

しかし、統計的機械翻訳システム１が、原文を翻訳した場合、翻訳候補文（例えば、翻訳候補文ＴＳ１を構成するフレーズペアの組み合わせが、複数発生する。例えば、フレーズペア１，８，１１，１６の組み合わせや、フレーズペア１，７，１５の組み合わせがある。このため、翻訳候補文だけでは、どのフレーズペアの組み合わせによって、その翻訳候補文が生成されたのか分からないので、学習の結果を、フレーズテーブル７のスコアに反映することができない。

そこで、どのフレーズペアの組み合わせによって、翻訳候補文が生成されたのかを特定できるようにするために、以下の改善策を検討した。

翻訳支援方法の一態様は、第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援する方法であって、前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを備える。

翻訳支援方法の一態様は、翻訳文の候補となる複数の翻訳候補文のそれぞれについて、フレーズテーブルに格納されているフレーズペアの中で、翻訳候補文を生成するのに用いられたフレーズペアの組み合わせを特定する組み合わせ情報を記憶する。よって、翻訳支援方法の一態様によれば、翻訳候補文を生成するのに用いられたフレーズペアの組み合わせを特定することができる。

上記構成において、前記記憶ステップは、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせに関するデータ構造、及び、前記データ構造において、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせを得ることができるパスを、前記組み合わせ情報として記憶する。

この構成は、組み合わせ情報の一例である。

上記構成において、前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、前記翻訳支援方法は、複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択ステップと、前記選択ステップで選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶ステップで記憶された前記組み合わせ情報を用いて特定する特定ステップと、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価ステップと、をさらに備える。

この構成は、スコアを調節するための前提として、選択ステップで選択されなかった翻訳候補文を生成するのに用いられたフレーズペアのそれぞれに対して、スコアを調節するための評価をする。

上記構成において、前記評価ステップは、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択ステップで選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする。

この構成は、評価ステップの一態様である。翻訳候補文が、例えば、形態素解析によって分解されたとき、形態素が要素となる。また、翻訳候補文が、例えば、構文解析によって分解されたとき、主語、述語、補語、目的語等が要素となる。スコアを上げるべき評価をする場合の基準、及び、スコアを下げるべき評価をする場合の基準としては、様々な基準が考えられる。これらの基準を考えることは当業者であれば容易なので、所定の基準としている。実施形態では、所定の基準として、後で説明する（１）〜（７）の基準を例示している。

上記構成において、前記スコアを上げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを上げる第１の処理、及び、前記スコアを下げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを下げる第２の処理のうち、少なくとも一方の処理をするスコア調節ステップを、さらに備える。

この構成によれば、評価ステップでの評価に基づいて、選択ステップで選択されなかった翻訳候補文を生成するのに用いられたフレーズペアのスコアを調節するので、機械翻訳の翻訳精度を向上させることができる。スコアを上げる第１の処理及びスコアを下げる第２の処理のうち、少なくとも一方の処理としたのは、両方の処理がされても、機械翻訳の精度が向上するし、片方の処理だけでも機械翻訳の精度が向上するからである。

上記構成において、前記スコア調節ステップが前記第１の処理をする場合、前記第１の処理がされる前記フレーズペアの前記スコアと、前記第１の処理がされる前記フレーズペアと前記第１言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第１の処理に用いられる第１の所定値を設定する第１の設定ステップを、さらに備え、前記スコア調節ステップは、前記第１の設定ステップで設定された前記第１の所定値を用いて、前記第１の処理をする。

この構成によれば、第１の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきに応じて、第１の処理に用いられる第１の所定値を変えることができる。このため、第１の処理に用いられる第１の所定値が固定値の態様と比べて、翻訳精度を向上させることが可能となる。

第１の所定値の設定について詳しく説明する。第１の設定ステップは、第１の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきが比較的大きいとき、第１の処理がされるフレーズペアのスコアが比較的大きく変化するように第１の所定値を設定し、このばらつきが比較的小さいとき、第１の処理がされるフレーズペアのスコアが比較的小さく変化するように第１の所定値を設定する。この逆でもよい。すなわち、第１の設定ステップは、第１の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきが比較的大きいとき、第１の処理がされるフレーズペアのスコアが比較的小さく変化するように第１の所定値を設定し、このばらつきが比較的小さいとき、第１の処理がされるフレーズペアのスコアが比較的大きく変化するように第１の所定値を設定する。

上記構成において、前記スコア調節ステップが前記第２の処理をする場合、前記第２の処理がされる前記フレーズペアの前記スコアと、前記第２の処理がされる前記フレーズペアと前記第１言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第２の処理に用いられる第２の所定値を設定する第２の設定ステップを、さらに備え、前記スコア調節ステップは、前記第２の設定ステップで設定された前記第２の所定値を用いて、前記第２の処理をする。

この構成によれば、第２の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきに応じて、第２の処理に用いられる第２の所定値を変えることができる。このため、第２の処理に用いられる第２の所定値が固定値の態様と比べて、翻訳精度を向上させることが可能となる。

第２の所定値の設定について詳しく説明する。第２の設定ステップは、第２の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきが比較的大きいとき、第２の処理がされるフレーズペアのスコアが比較的大きく変化するように第２の所定値を設定し、このばらつきが比較的小さいとき、第２の処理がされるフレーズペアのスコアが比較的小さく変化するように第２の所定値を設定する。この逆でもよい。すなわち、第２の設定ステップは、第２の処理がされるフレーズペアのスコアと、このフレーズペアと第１言語が同じである他のフレーズペアのスコアとのばらつきが比較的大きいとき、第２の処理がされるフレーズペアのスコアが比較的小さく変化するように第２の所定値を設定し、このばらつきが比較的小さいとき、第２の処理がされるフレーズペアのスコアが比較的大きく変化するように第２の所定値を設定する。

上記構成において、前記記憶ステップは、複数の前記翻訳候補文のそれぞれについて、前記スコアを基にして算出した翻訳結果に関する数値情報を記憶し、前記翻訳支援方法は、前記スコア調節ステップ後の前記フレーズテーブルを用いて、前記原文を再翻訳することにより、前記翻訳文の候補となる複数の前記翻訳候補文を再び生成し、再び生成した複数の前記翻訳候補文のそれぞれについて、前記スコア調節ステップ後の前記フレーズテーブルの前記スコアを基にして算出した前記数値情報を生成する再翻訳ステップと、前記記憶ステップで記憶された前記数値情報と、前記再翻訳ステップで生成された前記数値情報とを比較し、予め定められた基準を満たすか否かを判定する比較ステップと、前記予め定められた基準を満たすと判定されたとき、前記スコア調節ステップを再び実行する再実行ステップと、をさらに備える。

翻訳結果に関する数値情報とは、例えば、ｎ−ｂｅｓｔ順位である。予め定められた基準を満たす場合とは、例えば、記憶ステップで記憶されたｎ−ｂｅｓｔ順位と、再翻訳ステップで生成されたｎ−ｂｅｓｔ順位とを比較して、順位に変化がない場合である。この構成によれば、記憶ステップで記憶された数値情報と、再翻訳ステップで生成された数値情報とを比較し、予め定められた基準を満たすと判定したとき、スコア調節ステップを再び実行する。従って、翻訳精度を向上させることができる。

翻訳支援装置の一態様は、第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援する装置であって、前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部を備える。

翻訳支援装置の一態様は、翻訳支援方法の一態様と同様の作用効果を有する。

翻訳装置の一態様は、第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルと、前記フレーズテーブルを用いて、前記第１言語の原文から前記第２言語の翻訳文を生成するために、前記翻訳文の候補となる複数の翻訳候補文を生成する機械翻訳部と、前記機械翻訳部が生成した複数の前記翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部と、を備える。

翻訳装置の一態様は、翻訳支援方法の一態様と同様の作用効果を有する。

翻訳支援プログラムの一態様は、第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援するプログラムであって、前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを、コンピュータに実行させる。

翻訳支援プログラムの一態様は、翻訳支援方法の一態様と同様の作用効果を有する。

（実施の形態）
以下、図面に基づいて本発明の実施の形態を詳細に説明する。第１言語が日本語、第２言語が英語の組み合わせで説明するが、第１言語と第２言語との組み合わせは、これに限定されない。図４は、本実施形態に係る翻訳システム１０の機能ブロック図である。翻訳システム１０は、統計的機械翻訳を用いて翻訳をする。翻訳システム１０は、ユーザー端末１１及びサーバー１２により構成される。翻訳システム１０は、機能ブロックとして、原文入力部１３、機械翻訳部１４、翻訳候補文出力部１５、選択部１６、翻訳モデル１７、翻訳情報記憶部１８、評価部１９、スコア調節部２０、言語処理部２１、再翻訳部２２、翻訳結果比較部２３、スコア再調節決定部２４及び重み設定部２５を備える。

原文入力部１３、機械翻訳部１４、翻訳候補文出力部１５及び選択部１６は、ユーザー端末１１に備えられる。ユーザー端末１１は、例えば、ディスクトップパソコン、ノートパソコン、スマートフォン、タブレット端末である。

翻訳モデル１７、翻訳情報記憶部１８、評価部１９、スコア調節部２０、言語処理部２１、再翻訳部２２、翻訳結果比較部２３、スコア再調節決定部２４及び重み設定部２５は、サーバー１２に備えられる。サーバー１２は、ユーザー端末１１と通信可能であり、翻訳支援装置の一例である。なお、これらの機能ブロックの一部（例えば、翻訳モデル１７）が、ユーザー端末１１に備えられる態様でもよい。また、翻訳システム１０を構成する全ての機能ブロックが、ユーザー端末１１に備えられる態様でもよい。後者の態様では、サーバー１２が不要となり、ユーザー端末１１のみで成立するので、翻訳支援装置を含む翻訳装置となる。

ユーザー端末１１に備えられる機能ブロックを説明する。原文入力部１３には、ユーザーによって原文が入力される。原文が文字で入力される場合、例えば、キーボード、タッチパネルが原文入力部１３となる。原文が音声で入力される場合、マイク及びマイクから入力された音声を認識する音声認識装置が、原文入力部１３となる。

機械翻訳部１４は、原文入力部１３に入力された第１言語の原文を第２言語の翻訳文の候補となる複数の翻訳候補文を生成する。複数の翻訳候補文は、図１で説明した統計的機械翻訳によって生成される。機械翻訳部１４は、図１に示すデコーダ６であり、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）及びＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）等のハードウェア、並びに、機械翻訳を実行するための各種のソフトウェア等により実現される。

翻訳候補文出力部１５は、機械翻訳部１４で生成された複数の翻訳候補文を出力する。翻訳候補文が文字で出力される場合、ディスプレイが翻訳候補文出力部１５となる。翻訳候補文が音声で出力される場合、スピーカが翻訳候補文出力部１５となる。

ユーザーは、選択部１６を用いて、翻訳候補文出力部１５から出力された複数の翻訳候補文の中から最適な翻訳候補文を選択する。例えば、キーボード、タッチパネルが選択部１６となる。最適な翻訳候補文が音声で選択される場合、マイク及びマイクから入力された音声を認識する音声認識装置が選択部１６となる。

サーバー１２に備えられる機能ブロックを説明する。これらの機能ブロックは、ＣＰＵ、ＲＡＭ及びＲＯＭ等のハードウェア、並びに、機械翻訳を支援するための各種のソフトウェア等により実現される。

翻訳モデル１７は、図１に示す翻訳モデル４と対応しており、図２に示すようなフレーズテーブル７によって管理される。機械翻訳部１４は、翻訳モデル１７を用いて統計的機械翻訳をする。なお、実際の統計的機械翻訳では、翻訳モデル１７に加えて図１に示す言語モデル５が必要となるが、本実施形態では、翻訳システム１０の説明を簡単にするために、言語モデル５については省略している。

翻訳情報記憶部１８は、翻訳情報を記憶する。翻訳情報には、翻訳結果情報及び組み合わせ情報が含まれる。翻訳結果情報は、原文入力部１３に入力された原文、機械翻訳部１４が生成した複数の翻訳候補文等である。組み合わせ情報は、複数の翻訳候補文のそれぞれについて、フレーズテーブル７に格納されているフレーズペアの中で、翻訳候補文を生成するのに用いられたフレーズペアの組み合わせを特定する情報である。翻訳結果情報及び組み合わせ情報については、後で詳細に説明する。

スコア調節部２０は、選択部１６で選択された翻訳候補文（すなわち、ユーザーによって判断された最適な翻訳候補文）を基にして、翻訳モデル１７を管理するフレーズテーブル７のスコアを調節する。

残りの機能ブロックについては、次に説明する翻訳システム１０の動作において、それらの説明をする。

図４及び図５を主に参照して、本実施形態に係る翻訳システム１０の動作を説明する。図５は、この動作を説明するフローチャートである。

ユーザーが原文入力部１３に原文を入力する（ステップＳ１）。原文として、図３の原文ＯＳを例にして説明する。

機械翻訳部１４は、原文入力部１３に入力された原文に対して統計的機械翻訳をする（ステップＳ２）。詳しく説明すると、ステップＳ１で原文入力部１３に入力された原文を所定の方法で分解する。所定の方法として、形態素解析、構文解析等がある。ここでは、形態素解析を例にして説明する。

機械翻訳部１４が、原文を形態素解析することにより、原文は、図６に示す４つの形態素５０に分解される。機械翻訳部１４は、これら４つの形態素５０、及び、翻訳モデル１７を管理する図２に示すようなフレーズテーブル７を用いて、原文の翻訳文の候補となる全ての翻訳候補文を得ることができる、図７に示すデータ構造３０を生成する。図７は、機械翻訳部１４によって生成されたデータ構造３０の一例を説明する説明図である。

データ構造３０は、木構造を有している。ノードは、フレーズペアである。ここでのフレーズペアは、図２に示すフレーズテーブル７に格納されるフレーズペアの中で、翻訳候補文を生成するのに用いられたフレーズペアである。フレーズペアには、日本語フレーズ、英語フレーズ、スコアが、それぞれ示されている。スコアは、図２の欄３に示す値である。

データ構造３０において、翻訳候補文を生成するのに用いられたフレーズペアの組み合わせとして、組み合わせ１〜１０が示されている。例えば、組み合わせ１は、フレーズペア１，７，１１，１６をこの順番に並べた組み合わせである。組み合わせ１による翻訳候補文は、図８に示す翻訳候補文ＴＳ４となる。

機械翻訳部１４は、データ構造３０で示される全ての組み合わせのそれぞれについて、累積確率を計算し、ｎ−ｂｅｓｔ順位を決定する。

機械翻訳部１４は、以上を基にして、翻訳結果情報を生成する。図８は、翻訳結果情報４０の一例を説明する説明図である。翻訳結果情報４０は、原文、並びに、組み合わせのそれぞれについて、累積確率、ｎ−ｂｅｓｔ順位及び翻訳候補文を示す情報である。

累積確率とは、翻訳候補文を生成するのに用いられたフレーズペアのそれぞれのスコア(図２の欄３で示す英日翻訳確率）を掛け算した値である。例えば、組み合わせ１の場合、図７及び図８を参照して、０．１１２（＝０．２×０．８×０．７×１）が累積確率となる。

ｎ−ｂｅｓｔ順位とは、一番大きい累積確率を有する組み合わせからｎ番目に大きい累積確率を有する組み合わせまでの順位を示す。ｎ−ｂｅｓｔ順位のｎは、ここでは、５で説明するが、これに限定されない。機械翻訳部１４は、累積確率が高い順に、１番から５番までの順位を確定する。ここでは、組み合わせ７が１番であり、組み合わせ９が２番であり、組み合わせ１０が３番であり、組み合わせ２が４番であり、組み合わせ５が５番である。

本実施形態では、ｎ−ｂｅｓｔ順位及び累積確率を、翻訳結果に関する数値情報として説明する。なお、ｎ−ｂｅｓｔ順位のみを翻訳結果に関する数値情報としてもよい。

機械翻訳部１４は、翻訳情報を翻訳情報記憶部１８に記憶させる（ステップＳ３）。翻訳情報は、組み合わせ情報及び図８に示す翻訳結果情報４０から構成される。組み合わせ情報とは、図７に示すデータ構造３０及びパス３１である。パス３１とは、データ構造３０において、ｎ−ｂｅｓｔ順位の１番からｎ番（ここでは５番）のそれぞれの組み合わせを得ることができるパスである（ここでは、組み合わせ２のパス３１、組み合わせ５のパス３１、組み合わせ７のパス３１、組み合わせ９のパス３１、組み合わせ１０のパス３１）。翻訳結果情報４０には、上述した翻訳結果に関する数値情報（累積確率、ｎ−ｂｅｓｔ順位）が含まれる。

翻訳候補文出力部１５は、ｎ−ｂｅｓｔ順位の１番からｎ番（ここでは５番）のそれぞれの組み合わせについて、翻訳候補文を出力する（ステップＳ４）。ここでは、図８に示す翻訳候補文ＴＳ５、翻訳候補文ＴＳ６、翻訳候補文ＴＳ７、翻訳候補文ＴＳ８、翻訳候補文ＴＳ９が出力される。翻訳候補文出力部１５が、例えば、ユーザー端末１１のディスプレイの場合、このディスプレイに、これらの翻訳候補文が表示される。

ユーザーは、選択部１６を用いて、ステップＳ４で出力された五つの翻訳候補文の中で、ステップＳ１で入力した原文の翻訳文として、最適な翻訳候補文を選択する（ステップＳ５）。ここでは、図８に示す組み合わせ９で構成される翻訳候補文ＴＳ８が選択されたとする。

言語処理部２１は、ステップＳ４で出力された五つの翻訳候補文のそれぞれについて、所定の解析をして、翻訳候補文を複数の要素で分解する（ステップＳ６）。所定の解析として、形態素解析、構文解析等がある。ここでは、形態素解析を例にして説明する。形態素解析の場合、要素は、形態素となる。図９は、五つの翻訳候補文のそれぞれの形態素解析の結果を説明する説明図である。例えば、組み合わせ７で構成される翻訳候補文ＴＳ７は、形態素５０ａ、形態素５０ｂ、形態素５０ｃ、形態素５０ｄの４つの形態素（要素）に分解される。

評価部１９は、ステップＳ６で分解した形態素のそれぞれについて評価する（ステップＳ７）。詳しく説明すると、評価部１９は、ステップＳ５で選択されなかった翻訳候補文の形態素について、ステップＳ５で選択された翻訳候補文ＴＳ８の形態素５０ｅ、形態素５０ｆ、形態素５０ｇ、形態素５０ｈと同じ形態素を、良い形態素と評価し、異なる形態素を、悪い形態素と評価し、良い形態素とも悪い形態素とも評価できない形態素を、中立の形態素と評価する。

図１０は、形態素の評価結果を説明する説明図である。良い形態素は、○で示し、悪い形態素は、×で示し、中立の形態素は、△で示している。例えば、組み合わせ７で構成される翻訳候補文ＴＳ７の形態素のうち、形態素５０ａは良い形態素と評価され、形態素５０ｂは悪い形態素と評価され、形態素５０ｃは良い形態素と評価され、形態素５０ｄは悪い形態素と評価されている。

評価部１９は、ステップＳ５で選択されなかった翻訳候補文について、翻訳候補文を生成するのに用いられたフレーズペアの組み合わせを特定する（ステップＳ８）。この特定には、ステップＳ３で記憶した翻訳情報に含まれる組み合わせ情報が用いられる。組み合わせ情報とは、上述したように、図７に示すデータ構造３０、及び、データ構造３０において、ｎ−ｂｅｓｔ順位の１番から５番のそれぞれの組み合わせを得ることができるパス３１である。

評価部１９は、組み合わせ７を得ることができるパス３１を用いて、データ構造３０を探索する。これにより、フレーズペア２，９，１６が得られる。評価部１９は、組み合わせ１０を得ることができるパス３１を用いて、データ構造３０を探索する。これにより、フレーズペア４，１４が得られる。評価部１９は、組み合わせ２を得ることができるパス３１を用いて、データ構造３０を探索する。これにより、フレーズペア２，７，１１，１６が得られる。評価部１９は、組み合わせ５を得ることができるパス３１を用いて、データ構造３０を探索する。これにより、フレーズペア２，７，１４が得られる。

図１１は、評価部１９によって探索されたフレーズペアの組み合わせを説明する説明図である。組み合わせ７は、フレーズペア２，９，１６の組み合わせである。組み合わせ１０は、フレーズペア４，１４の組み合わせである。組み合わせ２は、フレーズペア２，７，１１，１６の組み合わせである。組み合わせ５は、フレーズペア２，７，１４の組み合わせである。

評価部１９は、図１１に示すフレーズペアのそれぞれについて、スコア（例えば、フレーズペア２のスコアは、０．８）を調節するための評価をする（ステップＳ９）。具体的には、以下のようにして、フレーズペアは評価される。評価部１９は、図１１に示すフレーズペアのそれぞれについて（すなわち、ステップＳ８で特定された組み合わせを構成するフレーズペアのそれぞれについて）、ステップＳ５で選択された翻訳候補文に含まれる形態素（要素）と比較することにより、スコアを上げるべきフレーズペアについては、スコアを上げるべき評価をし、スコアを下げるべきフレーズペアについては、スコアを下げるべき評価をする。

本実施形態では、スコアを上げるべき評価がされたフレーズペアを良いフレーズペア、スコアを下げるべき評価がされたフレーズペアを悪いフレーズペアとし、いずれの評価もできないフレーズペアを中立のフレーズペアとする。良いフレーズ、悪いフレーズ、中立のフレーズに評価される基準は、例えば、以下の通りである。

（１）フレーズペアの英語フレーズが良い形態素のみによって構成されているとき、そのフレーズペアは、良いフレーズペアと評価される。

（２）フレーズペアの英語フレーズが悪い形態素のみによって構成されているとき、そのフレーズペアは、悪いフレーズペアと評価される。

（３）フレーズペアの英語フレーズが無いとき（例えば、図１１に示すフレーズペア１６）、そのフレーズペアは、中立のフレーズペアと評価される。

（４）フレーズペアの英語フレーズが良い形態素及び中立の形態素によって構成されているとき、そのフレーズペアは、良いフレーズペアと評価される。なお、中立のフレーズペアと評価してもよい。

（５）フレーズペアの英語フレーズが悪い形態素及び中立の形態素によって構成されているとき、そのフレーズペアは、悪いフレーズペアと評価される。なお、中立のフレーズペアと評価してもよい。

（６）フレーズペアの英語フレーズが良い形態素及び悪い形態素によって構成されているとき、又は、フレーズペアの英語フレーズが良い形態素、悪い形態素及び中立の形態素によって構成されているとき、そのフレーズペアは、悪いフレーズペアと評価される。なお、良いフレーズペアと評価してもよい。また、良い形態素の数が悪い形態素の数より多いとき、良いフレーズペアと評価してもよいし、悪い形態素の数が良い形態素の数より多いとき、悪いフレーズペアと評価してもよい。

（７）フレーズペアの英語フレーズが中立の形態素のみによって構成されているとき、そのフレーズペアは、中立のフレーズペアと評価される。

組み合わせ７を例にして具体的に説明する。評価部１９は、組み合わせ７について、図１０に示す形態素の評価を参照して、図１１に示すフレーズペア２，９，１６のそれぞれを評価する。フレーズペア２の英語フレーズＥＦ４は、良い形態素のみによって構成されているので、良いフレーズペアと評価される。フレーズペア９の英語フレーズＥＦ５は、悪い形態素５０ｂ，５０ｄを含むので、悪いフレーズペアと評価される。フレーズペア１６は英語フレーズがないので、中立のフレーズペアと評価される。

図１２は、フレーズペアの評価結果を説明する説明図である。良いフレーズペアは、○で示し、悪いフレーズペアは、×で示し、中立のフレーズペアは、△で示している。

なお、ステップＳ５で選択された翻訳候補文を生成するのに用いられたフレーズペアのそれぞれを、上記と同様にして評価してもよい。この場合、全てのフレーズペアが良いフレーズペアと評価される。

良いフレーズペア、悪いフレーズペア、中立のフレーズペアのスコアに対する処理として、例えば、以下の処理がある。

〈１〉スコア調節部２０は、良いフレーズペアのスコアに所定の重みを掛けて、スコアを大きくする。なお、スコア調節部２０は、良いフレーズペアのスコアに所定値を足して、スコアを大きくしてもよい。

〈２〉スコア調節部２０は、悪いフレーズペアのスコアに所定の重みを掛けて、スコアを小さくする。なお、スコア調節部２０は、悪いフレーズペアのスコアから所定値を引いて、スコアを小さくしてもよい。

〈３〉スコア調節部２０は、中立のフレーズペアのスコアを維持する。

〈４〉スコア調節部２０は、中立のフレーズペアのスコアを、〈１〉と同様にして、大きくする。

〈５〉スコア調節部２０は、中立のフレーズペアのスコアを、〈２〉と同様にして、小さくする。

〈６〉スコア調節部２０は、〈１〉によって、良いフレーズペアのスコアを大きくしたとき、このフレーズペアの日本語フレーズと同じ日本語フレーズを含むフレーズペアのスコアを小さくして、これらのスコアを足した値を１にする。具体的に説明すると、図２を参照して、スコア調節部２０は、例えば、フレーズペア２のスコアを０．９にしたとき、フレーズペア１のスコアを０．１にする。

〈７〉スコア調節部２０は、〈２〉によって、悪いフレーズペアのスコアを小さくしたとき、このフレーズペアの日本語フレーズと同じ日本語フレーズを含むフレーズペアのスコアを大きくして、これらのスコアを足した値を１にする。具体的に説明すると、図２を参照して、スコア調節部２０は、例えば、フレーズペア９のスコアを０．５５にしたとき、フレーズペア１０のスコアを０．４５にする。

スコア調節部２０は、〈１〉〜〈７〉を単独又は組み合わせて、図１２に示すフレーズペアのそれぞれについて、スコアを調節する（ステップＳ１０）。これは、一種の翻訳モデル１７の学習である。スコア調節部２０は、例えば、〈１〉、〈２〉及び〈３〉を用いて、スコアを調節してもよいし、〈１〉のみを用いて、スコアを調節してもよいし、〈２〉のみを用いて、スコアを調節してもよいし、〈１〉及び〈２〉を用いて、スコアを調節してもよいし、〈１〉及び〈４〉を用いて、スコアを調節してもよいし、〈２〉及び〈５〉を用いて、スコアを調節してもよい。

以下では、〈１〉、〈２〉及び〈３〉を用いたスコアの調節について詳しく説明する。良いフレーズペアに対する所定の重みが、例えば、１．２であり、悪いフレーズペアに対する所定の重みが、例えば、０．８とする。図１２を参照して、スコア調節部２０は、まず、組み合わせ７を構成するフレーズペア２，９，１６のスコアを調節する。

スコア調節部２０は、フレーズペア２が良いフレーズペアなので、図２に示すフレーズテーブル７において、フレーズペア２のスコアを、０．８から０．９６（＝０．８×１．２）に上げる。スコア調節部２０は、フレーズペア９が悪いフレーズペアなので、フレーズテーブル７において、フレーズペア９のスコアを、０．６５から０．５２（＝０．６５×０．８）に下げる。スコア調節部２０は、フレーズペア１６が中立のフレーズペアなので、フレーズテーブル７において、フレーズペア１６のスコアを１に維持する。組み合わせ７を構成するフレーズペア２，９，１６のスコア調節後の累積確率は、０．４９９２（＝０．９６×０．５２×１）となり、図８に示す当初の累積確率（０．５２０）より小さくなっている。

なお、スコア調節後の累積確率が、ユーザーが選択した翻訳候補文を構成するフレーズペアの累積確率よりも、依然、大きいとき、再度、ステップＳ１０の処理をしてもよい。すなわち、スコア調節部２０は、組み合わせ７を構成するフレーズペア２，９，１６のスコア調節後の累積確率（０．４９９２）を、ステップＳ５で選択された翻訳候補文を構成するフレーズペアのスコアの累積確率（すなわち、図８に示す組み合わせ９を構成するフレーズペアのスコアの累積確率０．４９０）と比較し、前者が後者より大きいとき、組み合わせ７を構成するフレーズペア２，９，１６に対して、再度、ステップＳ１０の処理をする。

スコア調節部２０は、残りの組み合わせ（組み合わせ１０，２，５）についても、組み合わせ７と同様にして、スコアを調節する。

ステップＳ１０後、再翻訳部２２は、ステップＳ３で記憶された翻訳情報に含まれる原文（すなわち、ステップＳ１で入力された原文）について、ステップＳ２と同様の方法を用いて、再翻訳する（ステップＳ１１）。再翻訳では、スコア調節後のフレーズテーブル７が用いられる。この再翻訳において、再翻訳部２２は、再び生成した複数の翻訳候補文について、再翻訳結果情報（不図示）を生成する。スコア調節後のフレーズテーブル７を用いて再翻訳されるので、再翻訳結果情報が、図８に示す翻訳結果情報４０と異なる可能性があるのは、翻訳結果に関する数値情報（ｎ−ｂｅｓｔ順位、累積確率）である。

なお、機械翻訳部１４がステップＳ１１の処理をしてもよい。この場合、翻訳システム１０には、再翻訳部２２が備えられていない。

翻訳結果比較部２３は、図８に示す翻訳結果情報４０に含まれるｎ−ｂｅｓｔ順位と、上記再翻訳結果情報に含まれるｎ−ｂｅｓｔ順位とを比較し、ｎ−ｂｅｓｔ順位に変化がないか否かを判定する（ステップＳ１２）。ｎ−ｂｅｓｔ順位に変化がない場合は、予め定められた基準を満たす場合の一例である。この替わりに、図８に示す組み合わせ９のｎ−ｂｅｓｔ順位（すなわち、ステップＳ５でユーザーによって選択された翻訳候補文のｎ−ｂｅｓｔ順位）が、再翻訳結果情報に含まれるｎ−ｂｅｓｔ順位において、１位でない場合や、組み合わせ９のｎ−ｂｅｓｔ順位が、再翻訳結果情報に含まれるｎ−ｂｅｓｔ順位において、１位であるが、ｎ−ｂｅｓｔ順位が１位の累積確率と２位の累積確率との差が所定値以下（すなわち、差が僅か）である場合を、予め定められた基準を満たす場合にしてもよい。

翻訳結果比較部２３が、ｎ−ｂｅｓｔ順位に変化がないと判定したとき（ステップＳ１２でＹｅｓ）、スコア再調節決定部２４は、スコア調節を再実行する決定をし（ステップＳ１３）、ステップＳ１０に戻る。

翻訳結果比較部２３が、ｎ−ｂｅｓｔ順位に変化があると判定したとき（ステップＳ１２でＮｏ）、翻訳システム１０の動作が終了する。なお、本実施形態では、ステップＳ１１〜ステップＳ１３を実行したが、ステップＳ１０で翻訳システム１０の動作を終了してもよい。

以上説明したように、本実施形態に係る翻訳システム１０によれば、機械翻訳部１４が生成した複数の翻訳候補文のそれぞれについて、翻訳候補文を生成するのに用いられたフレーズペアを特定できる。従って、複数の翻訳候補文の中から、ユーザーが選択した翻訳候補文を基にして、残りの翻訳候補文を生成するのに用いられたフレーズペアのスコアを調節することができる。

ステップＳ６で構文解析が用いられた場合について簡単に説明する。言語処理部２１は、ステップＳ４で出力された五つの翻訳候補文のそれぞれについて、構文解析をして、翻訳候補文を複数の要素で分解する。構文解析の場合、例えば、構文を木構造で表現した場合の各ノード（簡単のため、例えば、主語Ｓ、述語Ｖ、補語Ｃ、目的語Ｏ等とする）が要素となる。例えば、ステップＳ５で選択された翻訳候補文ＴＳ８（組み合わせ９）は、「ｔｈａｔ＝Ｓ」、「ｉｓ＝Ｖ」、「ａｐｅｎ＝Ｃ」に分解される。他の翻訳候補文、例えば、組み合わせ７は、「ｔｈａｔ＝Ｓ」、「ｗａｓ＝Ｖ」、「ａｐｅｎｃｉｌ＝Ｃ」に分解される。

ステップＳ７では、構文解析で得られた要素が評価される。組み合わせ７を例にして説明すると、評価部１９は、「ｔｈａｔ＝Ｓ」を良い要素、「ｗａｓ＝Ｖ」を悪い要素、「ａｐｅｎｃｉｌ＝Ｃ」を悪い要素と評価する。

評価部１９は、形態素解析の場合と同様にして、図１１に示すフレーズペアのそれぞれについて、スコアを調節するための評価をする（ステップＳ９）。組み合わせ７を例にして説明すると、評価部１９は、フレーズペア２を良いフレーズペアと評価し、フレーズペア９を悪いフレーズペアと評価し、フレーズペア１６を中立のフレーズペアと評価する。

スコア調節部２０は、形態素解析の場合と同様にして、ステップＳ９で評価したフレーズペアのそれぞれについて、スコアを調節する（ステップＳ１０）。このとき、スコア調節部２０は、悪いフレーズペアと評価したフレーズペアについて、比較した要素の種類が異なる場合（例えば、「ａｐｅｎ＝Ｃ」と「ａｐｅｎｃｉｌ＝Ｏ」）のスコアを、比較した要素の種類が同じ場合（例えば、「ａｐｅｎ＝Ｃ」と「ａｐｅｎｃｉｌ＝Ｃ」）のスコアよりも大きく変化させる。これにより、構文構造の誤りに対する学習効果を高めることができる。

本実施形態の変形例を説明する。本実施形態では、スコアの調節（ステップＳ１０）で用いられた所定の重みを、固定値にしているが、変形例では、所定の重みを可変値にする。重み設定部２５は、良いフレーズペア（例えば、図２のフレーズペア２）のスコアを上げる第１の処理（上記〈１〉）がされる場合、良いフレーズペアのスコアと、このフレーズペアと日本語（第１言語）が同じである他のフレーズペア（図２のフレーズペア１）のスコアとのばらつきに応じて、第１の処理に用いられる所定の重み（第１の所定値）を設定する。ばらつきとは、例えば、分散である。そして、スコア調節部２０は、重み設定部２５が設定した所定の重みを用いて、良いフレーズペアのスコアを大きくする。

重み設定部２５は、上記ばらつきが比較的大きいとき、良いフレーズペアのスコアが比較的大きく変化するように所定の重みを設定し、上記ばらつきが比較的小さいとき、良いフレーズペアのスコアが比較的小さく変化するように所定の重みを設定する。この逆でもよい。すなわち、重み設定部２５は、上記ばらつきが比較的大きいとき、良いフレーズペアのスコアが比較的小さく変化するように所定の重みを設定し、上記ばらつきが比較的小さいとき、良いフレーズペアのスコアが比較的大きく変化するように所定の重みを設定する。

重み設定部２５は、悪いフレーズペア（例えば、図２のフレーズペア９）のスコアを下げる第２の処理（上記〈２〉）がされる場合、悪いフレーズペアのスコアと、このフレーズペアと日本語（第１言語）が同じである他のフレーズペア（図２のフレーズペア１０）のスコアとのばらつきに応じて、第２の処理に用いられる所定の重み（第２の所定値）を設定する。ばらつきとは、例えば、分散である。そして、スコア調節部２０は、設定した所定の重みを用いて、悪いフレーズペアのスコアを小さくする。

重み設定部２５は、上記ばらつきが比較的大きいとき、悪いフレーズペアのスコアが比較的大きく変化するように所定の重みを設定し、上記ばらつきが比較的小さいとき、悪いフレーズペアのスコアが比較的小さく変化するように所定の重みを設定する。この逆でもよい。すなわち、重み設定部２５は、上記ばらつきが比較的大きいとき、悪いフレーズペアのスコアが比較的小さく変化するように所定の重みを設定し、上記ばらつきが比較的小さいとき、悪いフレーズペアのスコアが比較的大きく変化するように所定の重みを設定する。

本発明は、例えば、統計的機械翻訳に利用することができる。

１統計的機械翻訳システム
２対訳コーパス
３単言語コーパス
４翻訳モデル
５言語モデル
６デコーダ
７フレーズテーブル
１０翻訳システム
１１ユーザー端末
１２サーバー（翻訳支援装置の一例）
１３原文入力部
１４機械翻訳部
１５翻訳候補文出力部
１６選択部
１７翻訳モデル
１８翻訳情報記憶部
１９評価部
２０スコア調節部
２１言語処理部
２２再翻訳部
２３翻訳結果比較部
２４スコア再調節決定部
２５重み設定部
３０データ構造
３１パス
４０翻訳結果情報
５０，５０ａ〜５０ｈ形態素

Claims

第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援する方法であって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを備え、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記方法は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択ステップと、
前記選択ステップで選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶ステップで記憶された前記組み合わせ情報を用いて特定する特定ステップと、
前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価ステップと、をさらに備え、
前記評価ステップは、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択ステップで選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援方法。
前記記憶ステップは、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせに関するデータ構造、及び、前記データ構造において、複数の前記翻訳候補文のそれぞれを生成するのに用いられた前記フレーズペアの組み合わせを得ることができるパスを、前記組み合わせ情報として記憶する請求項１に記載の翻訳支援方法。
前記スコアを上げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを上げる第１の処理、及び、前記スコアを下げるべき評価がされた前記フレーズペアに対応づけられた前記スコアを下げる第２の処理のうち、少なくとも一方の処理をするスコア調節ステップを、さらに備える請求項１又は２に記載の翻訳支援方法。
前記スコア調節ステップが前記第１の処理をする場合、前記第１の処理がされる前記フレーズペアの前記スコアと、前記第１の処理がされる前記フレーズペアと前記第１言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第１の処理に用いられる第１の所定値を設定する第１の設定ステップを、さらに備え、
前記スコア調節ステップは、前記第１の設定ステップで設定された前記第１の所定値を用いて、前記第１の処理をする請求項３に記載の翻訳支援方法。
前記スコア調節ステップが前記第２の処理をする場合、前記第２の処理がされる前記フレーズペアの前記スコアと、前記第２の処理がされる前記フレーズペアと前記第１言語が同じである他のフレーズペアの前記スコアとのばらつきに応じて、前記第２の処理に用いられる第２の所定値を設定する第２の設定ステップを、さらに備え、
前記スコア調節ステップは、前記第２の設定ステップで設定された前記第２の所定値を用いて、前記第２の処理をする請求項３又は４に記載の翻訳支援方法。
前記記憶ステップは、複数の前記翻訳候補文のそれぞれについて、前記スコアを基にして算出した翻訳結果に関する数値情報を記憶し、
前記翻訳支援方法は、
前記スコア調節ステップ後の前記フレーズテーブルを用いて、前記原文を再翻訳することにより、前記翻訳文の候補となる複数の前記翻訳候補文を再び生成し、再び生成した複数の前記翻訳候補文のそれぞれについて、前記スコア調節ステップ後の前記フレーズテーブルの前記スコアを基にして算出した前記数値情報を生成する再翻訳ステップと、
前記記憶ステップで記憶された前記数値情報と、前記再翻訳ステップで生成された前記数値情報とを比較し、予め定められた基準を満たすか否かを判定する比較ステップと、
前記予め定められた基準を満たすと判定されたとき、前記スコア調節ステップを再び実行する再実行ステップと、をさらに備える請求項３〜５のいずれか一項に記載の翻訳支援方法。
第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援する装置であって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部を備え、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記装置は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択部と、
前記選択部で選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶部に記憶された前記組み合わせ情報を用いて特定し、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価部と、をさらに備え、
前記評価部は、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択部で選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援装置。
第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルと、
前記フレーズテーブルを用いて、前記第１言語の原文から前記第２言語の翻訳文を生成するために、前記翻訳文の候補となる複数の翻訳候補文を生成する機械翻訳部と、
前記機械翻訳部が生成した複数の前記翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶部と、を備える翻訳装置であって、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記翻訳装置は、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択部と、
前記選択部で選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶部に記憶された前記組み合わせ情報を用いて特定し、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価部と、をさらに備え、
前記評価部は、前記特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択部で選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳装置。
第１言語のフレーズと第２言語のフレーズとの対であるフレーズペアが格納されたフレーズテーブルを用いて、前記第１言語の原文を前記第２言語の翻訳文に翻訳する機械翻訳を支援するプログラムであって、
前記翻訳文の候補となる複数の翻訳候補文のそれぞれについて、前記フレーズテーブルに格納されている前記フレーズペアの中で、前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを特定する組み合わせ情報を記憶する記憶ステップを、コンピュータに実行させ、
前記フレーズテーブルには、前記フレーズペアの出現確率に関する情報であるスコアが、前記フレーズテーブルに格納されている前記フレーズペアのそれぞれに対応付けて格納されており、
前記プログラムは、
複数の前記翻訳候補文の中から最適な前記翻訳候補文を、ユーザーに選択させる選択ステップと、
前記選択ステップで選択されなかった前記翻訳候補文を生成するのに用いられた前記フレーズペアの組み合わせを、前記記憶ステップで記憶された前記組み合わせ情報を用いて特定する特定ステップと、
前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記スコアを調節するための評価をする評価ステップと、をさらに、前記コンピュータに実行させ、
前記評価ステップは、前記特定ステップで特定された前記組み合わせを構成する前記フレーズペアのそれぞれについて、前記選択ステップで選択された前記翻訳候補文に含まれる要素と比較することにより、所定の基準を用いて、前記スコアを上げるべき前記フレーズペアについては、前記スコアを上げるべき評価をし、前記スコアを下げるべき前記フレーズペアについては、前記スコアを下げるべき評価をする翻訳支援プログラム。