JP6471074B2 - 機械翻訳装置、方法及びプログラム - Google Patents

機械翻訳装置、方法及びプログラム Download PDF

Info

Publication number
JP6471074B2
JP6471074B2 JP2015194048A JP2015194048A JP6471074B2 JP 6471074 B2 JP6471074 B2 JP 6471074B2 JP 2015194048 A JP2015194048 A JP 2015194048A JP 2015194048 A JP2015194048 A JP 2015194048A JP 6471074 B2 JP6471074 B2 JP 6471074B2
Authority
JP
Japan
Prior art keywords
translation
unit
language
output
screen display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015194048A
Other languages
English (en)
Other versions
JP2017068631A (ja
Inventor
聡 園尾
聡 園尾
住田 一男
一男 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2015194048A priority Critical patent/JP6471074B2/ja
Priority to US15/257,052 priority patent/US20170091177A1/en
Publication of JP2017068631A publication Critical patent/JP2017068631A/ja
Application granted granted Critical
Publication of JP6471074B2 publication Critical patent/JP6471074B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Description

本発明の実施形態は、機械翻訳装置に関し、特に、入力テキストの翻訳結果を異なる形態で同期させて出力することにより、高い内容理解度で同時翻訳を実現する機械翻訳装置に関する。
近年、話し言葉を対象にした自然言語処理技術の開発が進んでいる。例えば、携帯端末を利用して旅行会話の翻訳を行う機械翻訳技術が広く利用されるようになってきた。旅行会話では短い長さの発話が多く、かつ内容も比較的容易であるため、内容理解度の高い翻訳が実現されている。
一方、会議や講演会などで一人の話者がある程度のまとまりを持って発話する独話と呼ばれる発話形態では、発話が文として途切れずに続いていく場合がある。このような場合は、情報伝達の即時性を高めるために、また、解析が困難な長文の翻訳を避けるために、発話の途中で文を分割し、翻訳処理を漸進的に行う必要がある。このような翻訳は、漸進翻訳または同時翻訳と呼ばれる。
同時翻訳において、音声による自然なコミュニケーションを実現するため、翻訳結果テキストを音声合成し、音声での情報伝達を行う場合がある。しかしながら、話者が発話した音声の発話時間と、翻訳結果テキストを音声合成した場合の再生時間が異なる場合、発話が続くにつれて差分が大きくなってしまい、コミュニケーションの同時性が損なわれてしまう。すなわち、同時翻訳において、翻訳結果テキストをそのまま音声合成すると、音声として聞き取りづらく、翻訳結果の内容理解を妨げてしまう場合がある。
他方、特許文献1では、話者の発話時間と翻訳結果テキストを音声合成した場合の再生時間の差分を検出し、同義語の訳語を入れ替えて再翻訳を行い、音声合成に適した翻訳結果を出力することで、再生時間の差分を小さくする翻訳装置が開示されている。
しかしながら、再生時間を考慮し、平易で簡略化した翻訳結果を出力した場合、音声としては聞き取りやすくなるが、内容伝達の正確さに欠けてしまう場合が生じる。
特開2002−123282号公報(第6〜8頁、図7)
本開示は、上述の課題を解決するためになされたものであり、文字情報として画面に提示される翻訳結果と、音声情報として音声合成される翻訳結果とが異なることで、高い内容理解度で同時翻訳を実現する機械翻訳装置、方法及びプログラムを提供することを目的とする。
第1の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳部と、前記翻訳結果の一つを文字情報として出力する画面表示部と、他の前記翻訳結果を音声情報として出力する音声合成部と、前記画面表示部の出力および前記音声合成部の出力を同期させる制御部と、を備える機械翻訳装置である。
第2の発明は、前記入力テキストおよび前記翻訳結果の候補を受け付けて1つ以上の評価基準に基づいて、それぞれの前記候補に対し評価値を算出する評価部を備える第1の発明記載の機械翻訳装置である。
第3の発明は、前記評価基準は、第一言語から第二言語への翻訳の正確さおよび第二言語としての言語の流暢さである第2の発明記載の機械翻訳装置である。
第4の発明は、前記制御部は、前記評価部によって算出された評価値が所定の条件を満たす様に前記複数の翻訳結果の中から異なる翻訳結果を選択し、同期させて前記画面表示部及び前記音声合成部へ出力する第2又は第3の発明記載の機械翻訳装置である。
第5の発明は、前記制御部は、前記複数の翻訳結果の中から、第2言語としての流暢さに関する前記評価値が最も高い翻訳結果を前記音声合成部に出力し、翻訳の正確さに関する前記評価値が最も高い翻訳結果を前記画面表示部に出力する第4の発明記載の機械翻訳装置である。
第6の発明は、前記翻訳部は、第一言語の前記入力テキストから第二言語の訳文テキストへ翻訳する訳文生成部と、前記訳文テキストの部分文字列を別の文字列へと編集する編集規則の集合によって構成される1つ以上の後編集モデルと、前記後編集モデルを用いて前記訳文テキストを後編集する訳文編集部と、前記訳文テキストおよび前記訳文編集部によって後編集された前記訳文テキストを含む少なくとも2つ以上を、複数の翻訳結果として出力する出力部と、を備える第1乃至第5の発明記載の機械翻訳装置である。
第7の発明は、前記入力テキストは、第一言語による複数の音声発話の認識結果であって、前記複数の音声発話の認識結果および前記音声発話の時刻情報を出力する音声認識部をさらに備え、前記制御部は、前記複数の音声発話の時間間隔に基づいて前記音声合成部の出力を行わず、前記画面表示部への出力を行う第4乃至第6の発明記載の機械翻訳装置である。
第8の発明は、前記音声合成部及び前記画面表示部に出力される翻訳結果の評価値にかかる閾値を指定する条件指定部をさらに備え、前記制御部は、前記条件指定部で定められた評価値の閾値に基づいて、前記複数の翻訳結果の中から前記音声合成部及び前記画面表示部へ出力する翻訳結果を選択する第4乃至第6の発明記載の機械翻訳装置である。
第9の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳ステップと、前記翻訳結果の一つを文字情報として出力する画面表示ステップと、他の前記翻訳結果を音声情報として出力する音声合成ステップと、前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を備える機械翻訳方法である。
第10の発明は、第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳するステップと、前記翻訳結果の一つを文字情報として出力する画面表示ステップと、他の前記翻訳結果を音声情報として出力する音声合成ステップと、前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を機械翻訳装置に実行させるための機械翻訳プログラムである。
第1の実施形態に係る機械翻訳装置100のブロック図。 第1の実施形態に係る機械翻訳処理のフローチャート。 対訳コーパスを用いた後編集モデル108の構築方法を説明するための図。 人手編集結果を用いた後編集モデル108の構築方法を説明するための図。 訳文編集部107における後編集結果の例を示す図。 評価モデルの学習に用いる原文、訳文、評価データの例を示す図。 評価部103における評価値算出の例を示す図。 第1の実施形態に係る機械翻訳処理の効果を説明するための図。 第1の実施形態に係る機械翻訳処理の更なる効果を説明するための図。 音声入力する場合の第2の実施形態に係る機械翻訳装置100のブロック図。 音声入力する場合の第2の本実施形態に係る機械翻訳処理のフローチャート。 ユーザーが条件を入力する場合の第3の実施形態に係る機械翻訳装置100のブロック図。 条件指定部1201における音声合成および画面表示条件指定の例を示す図。
以下、本発明の実施の形態について図面を参照しながら説明する。
本実施形態では、原言語である第一言語を日本語、目的言語である第二言語を英語とした場合の翻訳を例にして説明してあるが、翻訳言語の組み合わせはこれに限るものではなく、あらゆる言語の組み合わせについて適用することができる。
(第1の実施形態)
図1は、第1の実施形態に係る機械翻訳装置100を概略的に示している。図1に示すように、機械翻訳装置100は、翻訳部101、制御部102、評価部103,画面表示部104、及び、音声合成部105を備える。さらに、翻訳部101は、訳文生成部106、訳文編集部107,後編集モデル108、及び、出力部109によって構成される。
翻訳部101は、機械翻訳装置100への入力である第一言語の入力テキストを受け付け、第二言語への翻訳結果を少なくとも2つ以上の翻訳結果の候補として出力する。第一言語の入力テキストは、キーボード(図示せず)などで直接入力してもよいし、音声認識装置(図示せず)によって認識された音声認識結果であってもよい。
訳文生成部106は、第一言語の入力テキストを受け付け、機械翻訳によって第二言語の翻訳結果(訳文テキスト)を生成する。機械翻訳としては、従来から知られている規則ベース翻訳(Rule Based Machine Translation)、用例ベース翻訳(Example Based Machine Translation)、統計翻訳(Statistical Machine Translation)などが適用可能である。これらは広く一般的に知られているため、ここでは詳細な説明を省略する。
訳文編集部107は、訳文生成部106から翻訳結果を受け付け、第二言語における編集規則集合を格納した後編集モデル108を用いて機械翻訳結果の一部を後編集処理し、新たな翻訳結果を生成する。また、異なる複数の後編集モデルを用いてもよく、1つの後編集モデルに対して1つの後編集された翻訳結果を生成する。後編集モデルおよび後編集処理としては、原言語を機械翻訳訳文、目的言語を参照訳文として統計翻訳を動作させる統計的後編集(Statistical Post Editting)が適用可能である。
出力部109は、訳文生成部106によって生成された翻訳結果および訳文編集部107によって生成された翻訳結果を受け取り、制御部102へ翻訳結果を出力する。
制御部102は、翻訳部101から翻訳結果を受け付け、評価部103による翻訳結果に対する評価値を取得する。取得した評価値に基づいて、画面表示部104および音声合成部105へ翻訳結果を出力する。
評価部103は、制御部102を介して翻訳結果を取得し、翻訳結果に対する評価値を算出する。評価値は、例えば、翻訳結果において原文中の内容が訳文中にどれだけ正確に伝わっているかを表した正確さ(Adequacy)や、翻訳結果の訳文が第二言語においてどれだけ自然な文であるかを表した流暢さ(Fluency)などを評価指標として利用することができ、さらに複数の評価指標を組み合わせて利用してもよい。これらの評価指標は、バイリンガル人手評価者が判定してもよいし、バイリンガル人手評価者が判定した結果を元に機械学習で構築した推定器を用いてもよい。
画面表示部104は、制御部102から翻訳結果を受け付け、文字情報として画面に表示する。
音声合成部105は、制御部102から翻訳結果を受け付け、翻訳結果テキストの音声合成処理を行い、音声情報として出力する。音声合成処理は、従来から知られている波形接続型音声合成(Concatenate Synthesis)、フォルマント合成(Formant Synthesis)、隠れマルコフモデルに基づく合成(Hidden Markov Model Based Synthesis)などが適用可能である。これらは広く一般的に知られているため、ここでは詳細な説明を省略する。
次に、第1の実施形態に係る機械翻訳装置100による翻訳処理について説明する。図2は、第1の実施形態に係る翻訳処理の流れを示すフローチャートである。
まず、訳文生成部106が入力テキストを受け付けて、翻訳結果を生成する(ステップS201)。
次に、出力部109が翻訳結果を格納する(ステップS202)。
次に、訳文編集部107が後編集モデル108を検出し、後編集モデルが利用可能である場合(ステップS203:Yes)、訳文編集部107が、訳文生成部106によって生成された翻訳結果に対して後編集を適用することで、新たな翻訳結果を生成し、ステップS202に戻る(ステップS204)。
全ての後編集モデルを用いて後編集を行った後(ステップS203:No)、評価部103が、全ての翻訳結果に対して評価値を算出する(ステップS205)。
次に、制御部102が、画面表示に係る第1条件判定を行い、第1条件を満たす翻訳結果の1つを画面表示部104へ出力し、画面表示部104が翻訳結果の画面表示を行う(ステップS206)。
最後に、制御部102が、音声合成に係る第2条件判定を行い、第2条件を満たす翻訳結果の1つを音声合成部105へ出力し、音声合成部105が翻訳結果の音声合成を行い(ステップS207)、処理を終了する。
続いて、本実施形態に係る機械翻訳処理の具体例について説明する。
図3を参照して、後編集モデル108の構築方法について説明する。まず、原文と参照訳文の対応が付けられた対訳コーパス301を用いて、原文集合302の一部もしくは全てを機械翻訳し、訳文集合303を生成する。この訳文集合303と参照訳文集合304を対応付けることで、機械翻訳結果とリファレンスとなる翻訳結果の対集合305を得ることができる。得られた対集合305に対して、統計翻訳の広く知られている手法(たとえば、句に基づく統計翻訳の学習ステップ)を適用することで、後編集モデル108を構築することができる。
また、図4を参照して、後編集モデル108の別の構築方法について説明する。まず、原文集合401(対訳コーパスでなくてもよい)を機械翻訳し、訳文集合402を得る。この訳文集合に対して、人手後編集者(Post Editor)が訳文を修正し、任意の後編集訳文403を得る。この訳文集合402および編集訳文集合403を用いることで、前記同様に、統計翻訳の手法で、後編集モデル108を構築することができる。この方法は、人手後編集者による作業が必要ではあるが、細かな後編集の制御が可能であること、および対訳コーパスが不要であるという利点がある。
図5を参照して、訳文編集部107の動作を説明する。原文501「新プロジェクトについて話し合うためにお集まりいただきました。」に対する、訳文生成部106の翻訳結果が、訳文502「We gathered in order to discuss a new project.」であったとする。この訳文502に対して、後編集モデル108を適用し、「gathered in order to」に相当するフレーズ(部分文字列)が別の文字列「will」に、また、「a」が「the」にそれぞれ置換され、後編集結果である訳文503「We will discuss the new project.」を得る。これは、第二言語の翻訳結果(英語)から第二言語(英語)への統計翻訳に相当し、統計翻訳の広く知られている手法(たとえば、句に基づく統計翻訳のデコード処理)を適用することで、実現される。
次に、図6および図7を参照して、評価部103の動作を説明する。図6は、複数の原文および訳文に対して、5段階評価(5が最も評価が高く、1が最も評価が低い)で正確さおよび流暢さを評価した評価データ600を示している。図7は、任意の翻訳結果に対して評価値を算出する一例を示している。まず、評価データ600から原文および訳文を入力とし、評価値を出力とする評価モデル701を構築する。たとえば、モデルの学習には、Multi−classSupport Vector Machine(多クラスSVM)などの広く知られている機械学習手法が適用可能である。学習時の特徴量702として、原文および訳文の文字数、原文および訳文の単語数、原文および訳文の品詞情報、原文および訳文の構文解析情報、原文および訳文のn−gram情報、音声合成された訳文の再生時間、音声合成された訳文のイントネーション情報などを利用することができる。評価部103は、評価モデル701を参照して、任意の翻訳結果に対して評価値を算出する。図7の例では、原文「新プロジェクトについて話し合うためにお集まりいただきました。」および訳文「We gathered in order to discuss a new project.」に対して、正確さ5,流暢さ3の評価値を算出していることを示している。
次に、図8を参照して、本実施形態に係る機械翻訳処理のユーザインターフェースおよびその効果を説明する。入力テキスト801「新プロジェクトについて話し合うためにお集まりいただきました。」に対して、翻訳部101を動作させ、訳文802および訳文803を得る。また、評価部103を動作させ、訳文802の評価値である正確さ5、流暢さ3、および訳文803に対する評価値である正確さ4、流暢さ4を得る。制御部102は、複数の訳文の中から、正確さの評価値が最も高い訳文802を選択し、画面表示部104を介して表示エリア804に出力すると共に、訳文802と異なり、流暢さが最も高い訳文803を選択し、音声合成部105を介して合成音声805として同期させて出力する。これにより、入力テキスト801に対して、より流暢で聞き取りやすい翻訳結果を音声情報、より正確な翻訳結果を文字情報として出力させることができ、内容理解度の高い同時通訳が実現される。また、音声合成は、翻訳結果に応答して自動的に出力してもよいし、ユーザーの操作に応答して出力の有無を切り替えてもよい。
また、図9を参照して、本実施形態に係る機械翻訳処理の更なる効果を説明する。入力テキスト901「次の会議までにXのニーズ調査をお願い致します。」に対して、複数の翻訳結果および評価結果902、903,904を得る。これらの評価値の合計は全て同値(6)であるが、流暢さが最も高い訳文903を音声として出力することで内容の大まかな理解でき、正確さが最も高い訳文904をテキストとして提示することで本来の発話内容を正確に伝えることができる。このようにして、音声情報と文字情報による相補的な内容理解を促すことが可能となる。
(第2の実施形態)
次に、第2の実施形態に係る機械翻訳装置を説明する。
図10は、音声入力する場合の機械翻訳装置100を概略的に示している。機械翻訳装置100は、入力音声を受け付けて、認識結果として入力テキストおよび、入力音声の時刻情報(例えば、音声開始時刻および音声終了時刻)を出力する音声認識部1001を更に備える。つまり、図1で説明した翻訳部101へ入力テキストを、制御部1002へ時刻情報を出力する。
また、制御部1002は、図1で説明した翻訳部101から複数の翻訳結果を受け付け、さらに、音声認識部1001から元となる音声入力の時刻情報を受け付ける。そして、評価値および時刻情報に基づいて、画面表示104および音声合成部105へ翻訳結果を出力する。
このように構成された第2の実施形態に係る機械翻訳装置100による機械翻訳処理について説明する。図11は、第2の実施形態における機械翻訳処理の流れを示すフローチャートである。
まず、音声認識部1001が入力音声を受け付けて、認識結果である入力テキストおよび時刻情報を生成する(ステップS1101)。
次に、翻訳部101(詳細は図1参照)内の訳文生成部106が入力テキストを受け付けて、翻訳結果を生成する(ステップS1102)。
次に、出力部109が翻訳結果を格納する(ステップS1103)。
次に、訳文編集部107が後編集モデル108を検出し、後編集モデルが利用可能である場合(ステップS1104:Yes)、訳文編集部107が、訳文生成部106によって生成された翻訳結果に対して後編集を行うことで、新たな翻訳結果を生成し、ステップS1103に戻る(ステップS1105)。
全ての後編集モデルを用いて後編集を行った後(ステップS1105:No)、評価部103が、全ての翻訳結果に対して評価値を算出する(ステップS1106)。
次に、制御部1002が、入力音声の1を用いて直前の入力音声との時刻差分(時間間隔)を算出し、時刻差分がある閾値以上である場合(ステップS1107:Yes)、音声合成に係る第2条件判定を行い、第2条件を満たす翻訳結果の1つを音声合成部105へ出力し、音声合成部105が翻訳結果の音声合成を行う(ステップS1109)。音声合成に係る第2条件は、たとえば、評価値の流暢さが最大であることとする。
次に、制御部1002が、画面表示に係る第1条件判定を行い、第1条件を満たす翻訳結果の1つを画面表示部104へ出力し、画面表示部104が翻訳結果の画面表示を行い、処理を終了する(ステップS1110)。画面表示に係る第1条件は、たとえば、評価値の正確さが最大であることとする。
また、時刻差分がある閾値より小さい場合(ステップS1107:No)、音声合成を行わず、画面表示に係る第1条件を変更する(ステップS1111)。例えば、画面表示に係る第1条件を、評価値の正確さと流暢さの合計が最大であることとに変更する。最後に、ステップS1110を行い、処理を終了する。
第2の実施形態によれば、入力発話の時間間隔が短く、音声合成の再生が終わらないうちに次の発話が入力されるという状況を回避することができ、翻訳結果の画面表示によってコミュニケーションの同時性を保つことができる。
(第3の実施形態)
次に、第3の実施形態に係る機械翻訳装置を説明する。
図12は、ユーザーの条件入力に応答して、制御部1202を動作させる機械翻訳装置100を概略的に示している。機械翻訳装置100は、ユーザーの条件入力を受け付けて、画面表示および音声合成に係る条件を決定する条件指定部1201を更に備える。
また、制御部1202は、図1で説明した翻訳部101から複数の翻訳結果を受け付け、さらに条件指定部1201から指定された条件を受け付ける。そして、評価値が条件指定部1201で指定された条件を満たす翻訳結果を選択し、画面表示部104および音声合成部105へ翻訳結果を出力する。
図13は、条件指定部1201におけるユーザーの条件入力の一例を示している。音声合成および画面表示として選択する翻訳結果の評価値の閾値をスライドバーなどで指定する。例えば、画面表示に係る第1条件指定の値が「正確さ重視方向に5段階中4」であり、音声合成に係る第2条件指定の値1301が「流暢さ重視方向に5段階中3」である場合、制御部102は、評価値の正確さが4以上の翻訳結果を画面出力として選択し、画面表示を行い、評価値の流暢さが3以上の翻訳結果を音声出力として選択し、音声合成部へ出力する。条件を満足する翻訳結果が複数存在する場合は、その中の一つ(たとえば、流暢さと正確さの合計値が最大の翻訳結果)を選択し、音声合成部へ出力する。また、第1条件または第2条件を満足する翻訳結果が存在しない場合は、画面表示1302によってその旨をユーザーに提示し、別の翻訳結果を出力するか、もしくは、翻訳結果を出力しないかを選択させてもよい。
上述した実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述した実施形態の機械翻訳装置による効果と同様な効果を得ることも可能である。
上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RWなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータ又は組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態の機械翻訳装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶又は一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
100 機械翻訳装置
101 翻訳部
102 制御部
103 評価部
104 画面表示部
105 音声合成部
106 訳文生成部
107 訳文編集部
108 後編集モデル
109 出力部

Claims (10)

  1. 第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳部と、
    前記翻訳結果の一つを文字情報として出力する画面表示部と、
    他の前記翻訳結果を音声情報として出力する音声合成部と、
    前記画面表示部の出力および前記音声合成部の出力を同期させる制御部と、を備える機械翻訳装置。
  2. 前記入力テキストおよび前記翻訳結果の候補を受け付けて1つ以上の評価基準に基づいて、それぞれの前記候補に対し評価値を算出する評価部を備える請求項1記載の機械翻訳装置。
  3. 前記評価基準は、第一言語から第二言語への翻訳の正確さおよび第二言語としての言語の流暢さである請求項2記載の機械翻訳装置。
  4. 前記制御部は、前記評価部によって算出された評価値が所定の条件を満たす様に前記複数の翻訳結果の中から異なる翻訳結果を選択し、同期させて前記画面表示部及び前記音声合成部へ出力する請求項2又は3記載の機械翻訳装置。
  5. 前記制御部は、前記複数の翻訳結果の中から、第2言語としての流暢さに関する前記評価値が最も高い翻訳結果を前記音声合成部に出力し、翻訳の正確さに関する前記評価値が最も高い翻訳結果を前記画面表示部に出力する請求項4記載の機械翻訳装置。
  6. 前記翻訳部は、第一言語の前記入力テキストから第二言語の訳文テキストへ翻訳する訳文生成部と、
    前記訳文テキストの部分文字列を別の文字列へと編集する編集規則の集合によって構成される1つ以上の後編集モデルと、
    前記後編集モデルを用いて前記訳文テキストを後編集する訳文編集部と、
    前記訳文テキストおよび前記訳文編集部によって後編集された前記訳文テキストを含む少なくとも2つ以上を、複数の翻訳結果として出力する出力部と、を備える請求項1乃至5記載の機械翻訳装置。
  7. 前記入力テキストは、第一言語による複数の音声発話の認識結果であって、
    前記複数の音声発話の認識結果および前記音声発話の時刻情報を出力する音声認識部をさらに備え、
    前記制御部は、前記複数の音声発話の時間間隔に基づいて前記音声合成部の出力を行わず、前記画面表示部への出力を行う請求項4乃至6記載の機械翻訳装置。
  8. 前記音声合成部及び前記画面表示部に出力される翻訳結果の評価値にかかる閾値を指定する条件指定部をさらに備え、
    前記制御部は、前記条件指定部で定められた評価値の閾値に基づいて、前記複数の翻訳結果の中から前記音声合成部及び前記画面表示部へ出力する翻訳結果を選択する請求項4乃至6記載の機械翻訳装置。
  9. 第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳する翻訳ステップと、
    前記翻訳結果の一つを文字情報として出力する画面表示ステップと、
    他の前記翻訳結果を音声情報として出力する音声合成ステップと、
    前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を備える機械翻訳方法。
  10. 第一言語の入力テキストを第二言語の複数の翻訳結果に翻訳するステップと、
    前記翻訳結果の一つを文字情報として出力する画面表示ステップと、
    他の前記翻訳結果を音声情報として出力する音声合成ステップと、
    前記画面表示ステップの出力および前記音声合成ステップの出力を同期させる制御ステップと、を機械翻訳装置に実行させるための機械翻訳プログラム。
JP2015194048A 2015-09-30 2015-09-30 機械翻訳装置、方法及びプログラム Active JP6471074B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015194048A JP6471074B2 (ja) 2015-09-30 2015-09-30 機械翻訳装置、方法及びプログラム
US15/257,052 US20170091177A1 (en) 2015-09-30 2016-09-06 Machine translation apparatus, machine translation method and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015194048A JP6471074B2 (ja) 2015-09-30 2015-09-30 機械翻訳装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017068631A JP2017068631A (ja) 2017-04-06
JP6471074B2 true JP6471074B2 (ja) 2019-02-13

Family

ID=58407328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015194048A Active JP6471074B2 (ja) 2015-09-30 2015-09-30 機械翻訳装置、方法及びプログラム

Country Status (2)

Country Link
US (1) US20170091177A1 (ja)
JP (1) JP6471074B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943798A (zh) * 2017-11-23 2018-04-20 深圳哇哇鱼网络科技有限公司 检查输入文本语言并自动同步翻译的系统及方法
US11354521B2 (en) 2018-03-07 2022-06-07 Google Llc Facilitating communications with automated assistants in multiple languages
JP6678764B1 (ja) * 2018-03-07 2020-04-08 グーグル エルエルシー 多言語での自動化されたアシスタントを用いたエンドツーエンドコミュニケーションの促進
US11132517B2 (en) * 2019-06-25 2021-09-28 Lenovo (Singapore) Pte. Ltd. User interface for natural language translation using user provided attributes
US11295092B2 (en) * 2019-07-15 2022-04-05 Google Llc Automatic post-editing model for neural machine translation
US11763098B2 (en) * 2019-08-07 2023-09-19 7299362 Canada Inc. System and method for language translation
KR20210032809A (ko) * 2019-09-17 2021-03-25 삼성전자주식회사 동시 통역 방법 및 장치
CN111753558B (zh) * 2020-06-23 2022-03-04 北京字节跳动网络技术有限公司 视频翻译方法和装置、存储介质和电子设备
CN112287696B (zh) * 2020-10-29 2024-02-23 语联网(武汉)信息技术有限公司 译文后编辑方法、装置、电子设备和存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001100781A (ja) * 1999-09-30 2001-04-13 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
US20030154080A1 (en) * 2002-02-14 2003-08-14 Godsey Sandra L. Method and apparatus for modification of audio input to a data processing system
JP2005063257A (ja) * 2003-08-18 2005-03-10 Canon Inc 情報処理方法、情報処理装置
JP3919771B2 (ja) * 2003-09-09 2007-05-30 株式会社国際電気通信基礎技術研究所 機械翻訳システム、その制御装置、及びコンピュータプログラム
BRPI0417636A (pt) * 2003-12-16 2007-03-27 Speechgear Inc sistema, método, e, meio legìvel por computador
CN101099147B (zh) * 2005-11-11 2010-05-19 松下电器产业株式会社 对话支持装置
JP2008276517A (ja) * 2007-04-27 2008-11-13 Oki Electric Ind Co Ltd 訳文評価装置、訳文評価方法およびプログラム
JP5164061B2 (ja) * 2007-10-24 2013-03-13 インターナショナル・ビジネス・マシーンズ・コーポレーション ユーザのコミュニケーションを支援する技術
WO2011033834A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声翻訳システム、音声翻訳方法および記録媒体
JP5545467B2 (ja) * 2009-10-21 2014-07-09 独立行政法人情報通信研究機構 音声翻訳システム、制御装置、および情報処理方法
JPWO2013077110A1 (ja) * 2011-11-22 2015-04-27 Necカシオモバイルコミュニケーションズ株式会社 翻訳装置、翻訳システム、翻訳方法およびプログラム
JP5528420B2 (ja) * 2011-12-05 2014-06-25 シャープ株式会社 翻訳装置、翻訳方法及びコンピュータプログラム
JP6289448B2 (ja) * 2012-04-25 2018-03-07 コピン コーポレーション 即時翻訳システム
JP2014078132A (ja) * 2012-10-10 2014-05-01 Toshiba Corp 機械翻訳装置、方法およびプログラム
US20140365200A1 (en) * 2013-06-05 2014-12-11 Lexifone Communication Systems (2010) Ltd. System and method for automatic speech translation

Also Published As

Publication number Publication date
US20170091177A1 (en) 2017-03-30
JP2017068631A (ja) 2017-04-06

Similar Documents

Publication Publication Date Title
JP6471074B2 (ja) 機械翻訳装置、方法及びプログラム
US7860719B2 (en) Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers
US9588967B2 (en) Interpretation apparatus and method
KR102375115B1 (ko) 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화
US8626510B2 (en) Speech synthesizing device, computer program product, and method
JP2006330298A (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
JP2012073941A (ja) 音声翻訳装置、方法、及びプログラム
KR101735195B1 (ko) 운율 정보 기반의 자소열 음소열 변환 방법과 시스템 그리고 기록 매체
KR20120038198A (ko) 음성 인식 장치 및 방법
WO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
Krňoul et al. Czech text-to-sign speech synthesizer
WO2009107441A1 (ja) 音声合成装置、テキスト生成装置およびその方法並びにプログラム
JPWO2008056590A1 (ja) テキスト音声合成装置、そのプログラム及びテキスト音声合成方法
JP5079718B2 (ja) 外国語学習支援システム、及びプログラム
CN116933806A (zh) 一种同传翻译系统及同传翻译终端
KR20150027465A (ko) 외국어 고유명사에 대한 다중 발음열 생성 방법 및 장치
JP4409279B2 (ja) 音声合成装置及び音声合成プログラム
JP6411015B2 (ja) 音声合成装置、音声合成方法、およびプログラム
CN113870833A (zh) 语音合成相关系统、方法、装置及设备
US20230245644A1 (en) End-to-end modular speech synthesis systems and methods
WO2023047623A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
US20130080144A1 (en) Machine translation apparatus, a method and a non-transitory computer readable medium thereof
JP2016122033A (ja) 記号列生成装置、音声合成装置、音声合成システム、記号列生成方法、及びプログラム
JP6172491B2 (ja) テキスト整形プログラム、方法及び装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20170220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180205

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20180831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190121

R151 Written notification of patent or utility model registration

Ref document number: 6471074

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350