JP6471074B2

JP6471074B2 - 機械翻訳装置、方法及びプログラム

Info

Publication number: JP6471074B2
Application number: JP2015194048A
Authority: JP
Inventors: 聡園尾; 住田　一男; 一男住田
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2015-09-30
Filing date: 2015-09-30
Publication date: 2019-02-13
Anticipated expiration: 2035-09-30
Also published as: US20170091177A1; JP2017068631A

Description

本発明の実施形態は、機械翻訳装置に関し、特に、入力テキストの翻訳結果を異なる形態で同期させて出力することにより、高い内容理解度で同時翻訳を実現する機械翻訳装置に関する。

近年、話し言葉を対象にした自然言語処理技術の開発が進んでいる。例えば、携帯端末を利用して旅行会話の翻訳を行う機械翻訳技術が広く利用されるようになってきた。旅行会話では短い長さの発話が多く、かつ内容も比較的容易であるため、内容理解度の高い翻訳が実現されている。

一方、会議や講演会などで一人の話者がある程度のまとまりを持って発話する独話と呼ばれる発話形態では、発話が文として途切れずに続いていく場合がある。このような場合は、情報伝達の即時性を高めるために、また、解析が困難な長文の翻訳を避けるために、発話の途中で文を分割し、翻訳処理を漸進的に行う必要がある。このような翻訳は、漸進翻訳または同時翻訳と呼ばれる。

同時翻訳において、音声による自然なコミュニケーションを実現するため、翻訳結果テキストを音声合成し、音声での情報伝達を行う場合がある。しかしながら、話者が発話した音声の発話時間と、翻訳結果テキストを音声合成した場合の再生時間が異なる場合、発話が続くにつれて差分が大きくなってしまい、コミュニケーションの同時性が損なわれてしまう。すなわち、同時翻訳において、翻訳結果テキストをそのまま音声合成すると、音声として聞き取りづらく、翻訳結果の内容理解を妨げてしまう場合がある。

他方、特許文献１では、話者の発話時間と翻訳結果テキストを音声合成した場合の再生時間の差分を検出し、同義語の訳語を入れ替えて再翻訳を行い、音声合成に適した翻訳結果を出力することで、再生時間の差分を小さくする翻訳装置が開示されている。

しかしながら、再生時間を考慮し、平易で簡略化した翻訳結果を出力した場合、音声としては聞き取りやすくなるが、内容伝達の正確さに欠けてしまう場合が生じる。

特開２００２−１２３２８２号公報（第６〜８頁、図７）

本開示は、上述の課題を解決するためになされたものであり、文字情報として画面に提示される翻訳結果と、音声情報として音声合成される翻訳結果とが異なることで、高い内容理解度で同時翻訳を実現する機械翻訳装置、方法及びプログラムを提供することを目的とする。

第１の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳部と、前記翻訳結果の一つを文字情報として出力する画面表示部と、他の前記翻訳結果を音声情報として出力する音声合成部と、前記画面表示部の出力および前記音声合成部の出力を同期させる制御部と、を備える機械翻訳装置である。

第２の発明は、前記入力テキストおよび前記翻訳結果の候補を受け付けて１つ以上の評価基準に基づいて、それぞれの前記候補に対し評価値を算出する評価部を備える第１の発明記載の機械翻訳装置である。

第３の発明は、前記評価基準は、第一言語から第二言語への翻訳の正確さおよび第二言語としての言語の流暢さである第２の発明記載の機械翻訳装置である。

第４の発明は、前記制御部は、前記評価部によって算出された評価値が所定の条件を満たす様に前記複数の翻訳結果の中から異なる翻訳結果を選択し、同期させて前記画面表示部及び前記音声合成部へ出力する第２又は第３の発明記載の機械翻訳装置である。

第５の発明は、前記制御部は、前記複数の翻訳結果の中から、第２言語としての流暢さに関する前記評価値が最も高い翻訳結果を前記音声合成部に出力し、翻訳の正確さに関する前記評価値が最も高い翻訳結果を前記画面表示部に出力する第４の発明記載の機械翻訳装置である。

第６の発明は、前記翻訳部は、第一言語の前記入力テキストから第二言語の訳文テキストへ翻訳する訳文生成部と、前記訳文テキストの部分文字列を別の文字列へと編集する編集規則の集合によって構成される１つ以上の後編集モデルと、前記後編集モデルを用いて前記訳文テキストを後編集する訳文編集部と、前記訳文テキストおよび前記訳文編集部によって後編集された前記訳文テキストを含む少なくとも２つ以上を、複数の翻訳結果として出力する出力部と、を備える第１乃至第５の発明記載の機械翻訳装置である。

第７の発明は、前記入力テキストは、第一言語による複数の音声発話の認識結果であって、前記複数の音声発話の認識結果および前記音声発話の時刻情報を出力する音声認識部をさらに備え、前記制御部は、前記複数の音声発話の時間間隔に基づいて前記音声合成部の出力を行わず、前記画面表示部への出力を行う第４乃至第６の発明記載の機械翻訳装置である。

第８の発明は、前記音声合成部及び前記画面表示部に出力される翻訳結果の評価値にかかる閾値を指定する条件指定部をさらに備え、前記制御部は、前記条件指定部で定められた評価値の閾値に基づいて、前記複数の翻訳結果の中から前記音声合成部及び前記画面表示部へ出力する翻訳結果を選択する第４乃至第６の発明記載の機械翻訳装置である。

第９の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳ステップと、前記翻訳結果の一つを文字情報として出力する画面表示ステップと、他の前記翻訳結果を音声情報として出力する音声合成ステップと、前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を備える機械翻訳方法である。

第１０の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳するステップと、前記翻訳結果の一つを文字情報として出力する画面表示ステップと、他の前記翻訳結果を音声情報として出力する音声合成ステップと、前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を機械翻訳装置に実行させるための機械翻訳プログラムである。

第１の実施形態に係る機械翻訳装置１００のブロック図。第１の実施形態に係る機械翻訳処理のフローチャート。対訳コーパスを用いた後編集モデル１０８の構築方法を説明するための図。人手編集結果を用いた後編集モデル１０８の構築方法を説明するための図。訳文編集部１０７における後編集結果の例を示す図。評価モデルの学習に用いる原文、訳文、評価データの例を示す図。評価部１０３における評価値算出の例を示す図。第１の実施形態に係る機械翻訳処理の効果を説明するための図。第１の実施形態に係る機械翻訳処理の更なる効果を説明するための図。音声入力する場合の第２の実施形態に係る機械翻訳装置１００のブロック図。音声入力する場合の第２の本実施形態に係る機械翻訳処理のフローチャート。ユーザーが条件を入力する場合の第３の実施形態に係る機械翻訳装置１００のブロック図。条件指定部１２０１における音声合成および画面表示条件指定の例を示す図。

以下、本発明の実施の形態について図面を参照しながら説明する。

本実施形態では、原言語である第一言語を日本語、目的言語である第二言語を英語とした場合の翻訳を例にして説明してあるが、翻訳言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。

（第１の実施形態）
図１は、第１の実施形態に係る機械翻訳装置１００を概略的に示している。図１に示すように、機械翻訳装置１００は、翻訳部１０１、制御部１０２、評価部１０３，画面表示部１０４、及び、音声合成部１０５を備える。さらに、翻訳部１０１は、訳文生成部１０６、訳文編集部１０７，後編集モデル１０８、及び、出力部１０９によって構成される。

翻訳部１０１は、機械翻訳装置１００への入力である第一言語の入力テキストを受け付け、第二言語への翻訳結果を少なくとも２つ以上の翻訳結果の候補として出力する。第一言語の入力テキストは、キーボード（図示せず）などで直接入力してもよいし、音声認識装置（図示せず）によって認識された音声認識結果であってもよい。

訳文生成部１０６は、第一言語の入力テキストを受け付け、機械翻訳によって第二言語の翻訳結果（訳文テキスト）を生成する。機械翻訳としては、従来から知られている規則ベース翻訳（ＲｕｌｅＢａｓｅｄＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）、用例ベース翻訳（ＥｘａｍｐｌｅＢａｓｅｄＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）、統計翻訳（ＳｔａｔｉｓｔｉｃａｌＭａｃｈｉｎｅＴｒａｎｓｌａｔｉｏｎ）などが適用可能である。これらは広く一般的に知られているため、ここでは詳細な説明を省略する。

訳文編集部１０７は、訳文生成部１０６から翻訳結果を受け付け、第二言語における編集規則集合を格納した後編集モデル１０８を用いて機械翻訳結果の一部を後編集処理し、新たな翻訳結果を生成する。また、異なる複数の後編集モデルを用いてもよく、１つの後編集モデルに対して１つの後編集された翻訳結果を生成する。後編集モデルおよび後編集処理としては、原言語を機械翻訳訳文、目的言語を参照訳文として統計翻訳を動作させる統計的後編集（ＳｔａｔｉｓｔｉｃａｌＰｏｓｔＥｄｉｔｔｉｎｇ）が適用可能である。

出力部１０９は、訳文生成部１０６によって生成された翻訳結果および訳文編集部１０７によって生成された翻訳結果を受け取り、制御部１０２へ翻訳結果を出力する。

制御部１０２は、翻訳部１０１から翻訳結果を受け付け、評価部１０３による翻訳結果に対する評価値を取得する。取得した評価値に基づいて、画面表示部１０４および音声合成部１０５へ翻訳結果を出力する。

評価部１０３は、制御部１０２を介して翻訳結果を取得し、翻訳結果に対する評価値を算出する。評価値は、例えば、翻訳結果において原文中の内容が訳文中にどれだけ正確に伝わっているかを表した正確さ（Ａｄｅｑｕａｃｙ）や、翻訳結果の訳文が第二言語においてどれだけ自然な文であるかを表した流暢さ（Ｆｌｕｅｎｃｙ）などを評価指標として利用することができ、さらに複数の評価指標を組み合わせて利用してもよい。これらの評価指標は、バイリンガル人手評価者が判定してもよいし、バイリンガル人手評価者が判定した結果を元に機械学習で構築した推定器を用いてもよい。

画面表示部１０４は、制御部１０２から翻訳結果を受け付け、文字情報として画面に表示する。

音声合成部１０５は、制御部１０２から翻訳結果を受け付け、翻訳結果テキストの音声合成処理を行い、音声情報として出力する。音声合成処理は、従来から知られている波形接続型音声合成（ＣｏｎｃａｔｅｎａｔｅＳｙｎｔｈｅｓｉｓ）、フォルマント合成（ＦｏｒｍａｎｔＳｙｎｔｈｅｓｉｓ）、隠れマルコフモデルに基づく合成（ＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌＢａｓｅｄＳｙｎｔｈｅｓｉｓ）などが適用可能である。これらは広く一般的に知られているため、ここでは詳細な説明を省略する。

次に、第１の実施形態に係る機械翻訳装置１００による翻訳処理について説明する。図２は、第1の実施形態に係る翻訳処理の流れを示すフローチャートである。

まず、訳文生成部１０６が入力テキストを受け付けて、翻訳結果を生成する（ステップＳ２０１）。

次に、出力部１０９が翻訳結果を格納する（ステップＳ２０２）。

次に、訳文編集部１０７が後編集モデル１０８を検出し、後編集モデルが利用可能である場合（ステップＳ２０３：Ｙｅｓ）、訳文編集部１０７が、訳文生成部１０６によって生成された翻訳結果に対して後編集を適用することで、新たな翻訳結果を生成し、ステップＳ２０２に戻る（ステップＳ２０４）。

全ての後編集モデルを用いて後編集を行った後（ステップＳ２０３：Ｎｏ）、評価部１０３が、全ての翻訳結果に対して評価値を算出する（ステップＳ２０５）。

次に、制御部１０２が、画面表示に係る第１条件判定を行い、第１条件を満たす翻訳結果の１つを画面表示部１０４へ出力し、画面表示部１０４が翻訳結果の画面表示を行う（ステップＳ２０６）。

最後に、制御部１０２が、音声合成に係る第２条件判定を行い、第２条件を満たす翻訳結果の１つを音声合成部１０５へ出力し、音声合成部１０５が翻訳結果の音声合成を行い（ステップＳ２０７）、処理を終了する。

続いて、本実施形態に係る機械翻訳処理の具体例について説明する。

図３を参照して、後編集モデル１０８の構築方法について説明する。まず、原文と参照訳文の対応が付けられた対訳コーパス３０１を用いて、原文集合３０２の一部もしくは全てを機械翻訳し、訳文集合３０３を生成する。この訳文集合３０３と参照訳文集合３０４を対応付けることで、機械翻訳結果とリファレンスとなる翻訳結果の対集合３０５を得ることができる。得られた対集合３０５に対して、統計翻訳の広く知られている手法（たとえば、句に基づく統計翻訳の学習ステップ）を適用することで、後編集モデル１０８を構築することができる。

また、図４を参照して、後編集モデル１０８の別の構築方法について説明する。まず、原文集合４０１（対訳コーパスでなくてもよい）を機械翻訳し、訳文集合４０２を得る。この訳文集合に対して、人手後編集者（ＰｏｓｔＥｄｉｔｏｒ）が訳文を修正し、任意の後編集訳文４０３を得る。この訳文集合４０２および編集訳文集合４０３を用いることで、前記同様に、統計翻訳の手法で、後編集モデル１０８を構築することができる。この方法は、人手後編集者による作業が必要ではあるが、細かな後編集の制御が可能であること、および対訳コーパスが不要であるという利点がある。

図５を参照して、訳文編集部１０７の動作を説明する。原文５０１「新プロジェクトについて話し合うためにお集まりいただきました。」に対する、訳文生成部１０６の翻訳結果が、訳文５０２「Ｗｅｇａｔｈｅｒｅｄｉｎｏｒｄｅｒｔｏｄｉｓｃｕｓｓａｎｅｗｐｒｏｊｅｃｔ．」であったとする。この訳文５０２に対して、後編集モデル１０８を適用し、「ｇａｔｈｅｒｅｄｉｎｏｒｄｅｒｔｏ」に相当するフレーズ（部分文字列）が別の文字列「ｗｉｌｌ」に、また、「ａ」が「ｔｈｅ」にそれぞれ置換され、後編集結果である訳文５０３「Ｗｅｗｉｌｌｄｉｓｃｕｓｓｔｈｅｎｅｗｐｒｏｊｅｃｔ．」を得る。これは、第二言語の翻訳結果（英語）から第二言語（英語）への統計翻訳に相当し、統計翻訳の広く知られている手法（たとえば、句に基づく統計翻訳のデコード処理）を適用することで、実現される。

次に、図６および図７を参照して、評価部１０３の動作を説明する。図６は、複数の原文および訳文に対して、５段階評価（５が最も評価が高く、１が最も評価が低い）で正確さおよび流暢さを評価した評価データ６００を示している。図７は、任意の翻訳結果に対して評価値を算出する一例を示している。まず、評価データ６００から原文および訳文を入力とし、評価値を出力とする評価モデル７０１を構築する。たとえば、モデルの学習には、Ｍｕｌｔｉ−ｃｌａｓｓＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅ（多クラスＳＶＭ）などの広く知られている機械学習手法が適用可能である。学習時の特徴量７０２として、原文および訳文の文字数、原文および訳文の単語数、原文および訳文の品詞情報、原文および訳文の構文解析情報、原文および訳文のｎ−ｇｒａｍ情報、音声合成された訳文の再生時間、音声合成された訳文のイントネーション情報などを利用することができる。評価部１０３は、評価モデル７０１を参照して、任意の翻訳結果に対して評価値を算出する。図７の例では、原文「新プロジェクトについて話し合うためにお集まりいただきました。」および訳文「Ｗｅｇａｔｈｅｒｅｄｉｎｏｒｄｅｒｔｏｄｉｓｃｕｓｓａｎｅｗｐｒｏｊｅｃｔ．」に対して、正確さ５，流暢さ３の評価値を算出していることを示している。

次に、図８を参照して、本実施形態に係る機械翻訳処理のユーザインターフェースおよびその効果を説明する。入力テキスト８０１「新プロジェクトについて話し合うためにお集まりいただきました。」に対して、翻訳部１０１を動作させ、訳文８０２および訳文８０３を得る。また、評価部１０３を動作させ、訳文８０２の評価値である正確さ５、流暢さ３、および訳文８０３に対する評価値である正確さ４、流暢さ４を得る。制御部１０２は、複数の訳文の中から、正確さの評価値が最も高い訳文８０２を選択し、画面表示部１０４を介して表示エリア８０４に出力すると共に、訳文８０２と異なり、流暢さが最も高い訳文８０３を選択し、音声合成部１０５を介して合成音声８０５として同期させて出力する。これにより、入力テキスト８０１に対して、より流暢で聞き取りやすい翻訳結果を音声情報、より正確な翻訳結果を文字情報として出力させることができ、内容理解度の高い同時通訳が実現される。また、音声合成は、翻訳結果に応答して自動的に出力してもよいし、ユーザーの操作に応答して出力の有無を切り替えてもよい。

また、図９を参照して、本実施形態に係る機械翻訳処理の更なる効果を説明する。入力テキスト９０１「次の会議までにＸのニーズ調査をお願い致します。」に対して、複数の翻訳結果および評価結果９０２、９０３，９０４を得る。これらの評価値の合計は全て同値（６）であるが、流暢さが最も高い訳文９０３を音声として出力することで内容の大まかな理解でき、正確さが最も高い訳文９０４をテキストとして提示することで本来の発話内容を正確に伝えることができる。このようにして、音声情報と文字情報による相補的な内容理解を促すことが可能となる。

（第２の実施形態）
次に、第２の実施形態に係る機械翻訳装置を説明する。

図１０は、音声入力する場合の機械翻訳装置１００を概略的に示している。機械翻訳装置１００は、入力音声を受け付けて、認識結果として入力テキストおよび、入力音声の時刻情報（例えば、音声開始時刻および音声終了時刻）を出力する音声認識部１００１を更に備える。つまり、図１で説明した翻訳部１０１へ入力テキストを、制御部１００２へ時刻情報を出力する。

また、制御部１００２は、図１で説明した翻訳部１０１から複数の翻訳結果を受け付け、さらに、音声認識部１００１から元となる音声入力の時刻情報を受け付ける。そして、評価値および時刻情報に基づいて、画面表示１０４および音声合成部１０５へ翻訳結果を出力する。

このように構成された第２の実施形態に係る機械翻訳装置１００による機械翻訳処理について説明する。図１１は、第２の実施形態における機械翻訳処理の流れを示すフローチャートである。

まず、音声認識部１００１が入力音声を受け付けて、認識結果である入力テキストおよび時刻情報を生成する（ステップＳ１１０１）。

次に、翻訳部１０１（詳細は図１参照）内の訳文生成部１０６が入力テキストを受け付けて、翻訳結果を生成する（ステップＳ１１０２）。

次に、出力部１０９が翻訳結果を格納する（ステップＳ１１０３）。

次に、訳文編集部１０７が後編集モデル１０８を検出し、後編集モデルが利用可能である場合（ステップＳ１１０４：Ｙｅｓ）、訳文編集部１０７が、訳文生成部１０６によって生成された翻訳結果に対して後編集を行うことで、新たな翻訳結果を生成し、ステップＳ１１０３に戻る（ステップＳ１１０５）。

全ての後編集モデルを用いて後編集を行った後（ステップＳ１１０５：Ｎｏ）、評価部１０３が、全ての翻訳結果に対して評価値を算出する（ステップＳ１１０６）。

次に、制御部１００２が、入力音声の１を用いて直前の入力音声との時刻差分（時間間隔）を算出し、時刻差分がある閾値以上である場合（ステップＳ１１０７：Ｙｅｓ）、音声合成に係る第２条件判定を行い、第２条件を満たす翻訳結果の１つを音声合成部１０５へ出力し、音声合成部１０５が翻訳結果の音声合成を行う（ステップＳ１１０９）。音声合成に係る第２条件は、たとえば、評価値の流暢さが最大であることとする。

次に、制御部１００２が、画面表示に係る第１条件判定を行い、第１条件を満たす翻訳結果の１つを画面表示部１０４へ出力し、画面表示部１０４が翻訳結果の画面表示を行い、処理を終了する（ステップＳ１１１０）。画面表示に係る第１条件は、たとえば、評価値の正確さが最大であることとする。

また、時刻差分がある閾値より小さい場合（ステップＳ１１０７：Ｎｏ）、音声合成を行わず、画面表示に係る第１条件を変更する（ステップＳ１１１１）。例えば、画面表示に係る第１条件を、評価値の正確さと流暢さの合計が最大であることとに変更する。最後に、ステップＳ１１１０を行い、処理を終了する。

第２の実施形態によれば、入力発話の時間間隔が短く、音声合成の再生が終わらないうちに次の発話が入力されるという状況を回避することができ、翻訳結果の画面表示によってコミュニケーションの同時性を保つことができる。

（第３の実施形態）
次に、第３の実施形態に係る機械翻訳装置を説明する。

図１２は、ユーザーの条件入力に応答して、制御部１２０２を動作させる機械翻訳装置１００を概略的に示している。機械翻訳装置１００は、ユーザーの条件入力を受け付けて、画面表示および音声合成に係る条件を決定する条件指定部１２０１を更に備える。

また、制御部１２０２は、図１で説明した翻訳部１０１から複数の翻訳結果を受け付け、さらに条件指定部１２０１から指定された条件を受け付ける。そして、評価値が条件指定部１２０１で指定された条件を満たす翻訳結果を選択し、画面表示部１０４および音声合成部１０５へ翻訳結果を出力する。

図１３は、条件指定部１２０１におけるユーザーの条件入力の一例を示している。音声合成および画面表示として選択する翻訳結果の評価値の閾値をスライドバーなどで指定する。例えば、画面表示に係る第１条件指定の値が「正確さ重視方向に５段階中４」であり、音声合成に係る第２条件指定の値１３０１が「流暢さ重視方向に５段階中３」である場合、制御部１０２は、評価値の正確さが４以上の翻訳結果を画面出力として選択し、画面表示を行い、評価値の流暢さが３以上の翻訳結果を音声出力として選択し、音声合成部へ出力する。条件を満足する翻訳結果が複数存在する場合は、その中の一つ（たとえば、流暢さと正確さの合計値が最大の翻訳結果）を選択し、音声合成部へ出力する。また、第１条件または第２条件を満足する翻訳結果が存在しない場合は、画面表示１３０２によってその旨をユーザーに提示し、別の翻訳結果を出力するか、もしくは、翻訳結果を出力しないかを選択させてもよい。

上述した実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の機械翻訳装置による効果と同様な効果を得ることも可能である。

上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク（フレキシブルディスク、ハードディスクなど）、光ディスク（ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、ＤＶＤ−ＲＯＭ、ＤＶＤ±Ｒ、ＤＶＤ±ＲＷなど）、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータ又は組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をＣＰＵで実行させれば、上述した実施形態の機械翻訳装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。

また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているＯＳ（オペレーティングシステム）や、データベース管理ソフト、ネットワーク等のＭＷ（ミドルウェア）等が本実施形態を実現するための各処理の一部を実行してもよい。

さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、ＬＡＮやインターネット等により伝達されたプログラムをダウンロードして記憶又は一時記憶した記録媒体も含まれる。

また、記録媒体は１つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。

また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。

なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

１００機械翻訳装置
１０１翻訳部
１０２制御部
１０３評価部
１０４画面表示部
１０５音声合成部
１０６訳文生成部
１０７訳文編集部
１０８後編集モデル
１０９出力部

Claims

第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳部と、
前記翻訳結果の一つを文字情報として出力する画面表示部と、
他の前記翻訳結果を音声情報として出力する音声合成部と、
前記画面表示部の出力および前記音声合成部の出力を同期させる制御部と、を備える機械翻訳装置。
前記入力テキストおよび前記翻訳結果の候補を受け付けて１つ以上の評価基準に基づいて、それぞれの前記候補に対し評価値を算出する評価部を備える請求項１記載の機械翻訳装置。
前記評価基準は、第一言語から第二言語への翻訳の正確さおよび第二言語としての言語の流暢さである請求項２記載の機械翻訳装置。
前記制御部は、前記評価部によって算出された評価値が所定の条件を満たす様に前記複数の翻訳結果の中から異なる翻訳結果を選択し、同期させて前記画面表示部及び前記音声合成部へ出力する請求項２又は３記載の機械翻訳装置。
前記制御部は、前記複数の翻訳結果の中から、第２言語としての流暢さに関する前記評価値が最も高い翻訳結果を前記音声合成部に出力し、翻訳の正確さに関する前記評価値が最も高い翻訳結果を前記画面表示部に出力する請求項４記載の機械翻訳装置。
前記翻訳部は、第一言語の前記入力テキストから第二言語の訳文テキストへ翻訳する訳文生成部と、
前記訳文テキストの部分文字列を別の文字列へと編集する編集規則の集合によって構成される１つ以上の後編集モデルと、
前記後編集モデルを用いて前記訳文テキストを後編集する訳文編集部と、
前記訳文テキストおよび前記訳文編集部によって後編集された前記訳文テキストを含む少なくとも２つ以上を、複数の翻訳結果として出力する出力部と、を備える請求項１乃至５記載の機械翻訳装置。
前記入力テキストは、第一言語による複数の音声発話の認識結果であって、
前記複数の音声発話の認識結果および前記音声発話の時刻情報を出力する音声認識部をさらに備え、
前記制御部は、前記複数の音声発話の時間間隔に基づいて前記音声合成部の出力を行わず、前記画面表示部への出力を行う請求項４乃至６記載の機械翻訳装置。
前記音声合成部及び前記画面表示部に出力される翻訳結果の評価値にかかる閾値を指定する条件指定部をさらに備え、
前記制御部は、前記条件指定部で定められた評価値の閾値に基づいて、前記複数の翻訳結果の中から前記音声合成部及び前記画面表示部へ出力する翻訳結果を選択する請求項４乃至６記載の機械翻訳装置。
第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳ステップと、
前記翻訳結果の一つを文字情報として出力する画面表示ステップと、
他の前記翻訳結果を音声情報として出力する音声合成ステップと、
前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を備える機械翻訳方法。
第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳するステップと、
前記翻訳結果の一つを文字情報として出力する画面表示ステップと、
他の前記翻訳結果を音声情報として出力する音声合成ステップと、
前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を機械翻訳装置に実行させるための機械翻訳プログラム。