JP2019121241A - 翻訳装置、翻訳方法、及びプログラム - Google Patents
翻訳装置、翻訳方法、及びプログラム Download PDFInfo
- Publication number
- JP2019121241A JP2019121241A JP2018001414A JP2018001414A JP2019121241A JP 2019121241 A JP2019121241 A JP 2019121241A JP 2018001414 A JP2018001414 A JP 2018001414A JP 2018001414 A JP2018001414 A JP 2018001414A JP 2019121241 A JP2019121241 A JP 2019121241A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- translation
- translated
- similarity
- reverse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
【課題】精度良く翻訳する翻訳装置、翻訳方法、及びプログラムを提供する。【解決手段】翻訳装置(1)は、原言語の原文を入力する入力部(10)と、原文を入力文として、入力文を目標言語に翻訳した第1の翻訳文を生成する制御部(22)と、第1の翻訳文を表示する表示部(14)と、を備え、制御部(22)は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文と、第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文と、第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文と、を生成し、第1の逆翻訳文と入力文の類似度を算出し、類似度に基づいて、第1の翻訳文を表示部に表示するか、又は第2の逆翻訳文を再入力文として目標言語に翻訳した第1の翻訳文を新たに生成するかを決定する。【選択図】図2
Description
本開示は、一の言語で入力した文章を他の言語に翻訳する翻訳装置、翻訳方法、及びプログラムに関する。
特許文献1は、異なる言語の翻訳文から生成した逆翻訳文が同一か否かを検証する検証装置を開示している。この検証装置は、複数の翻訳者によって複数の言語で生成された翻訳文から、それぞれ逆翻訳文を生成する。検証装置は、複数の逆翻訳文を比較して、相違を示す相違データリストを出力する。翻訳者は、相違データリストを参照して、翻訳文を修正する。これにより、多言語の翻訳文のばらつきを効率的にチェックして、ばらつきのない多言語の翻訳文が得られるようにしている。
本開示は、精度良く翻訳する翻訳装置、翻訳方法、及びプログラムを提供する。
本開示の翻訳装置は、原言語の原文を入力する入力部と、原文を入力文として、入力文を目標言語に翻訳した第1の翻訳文を生成する制御部と、第1の翻訳文を表示する表示部と、を備え、制御部は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文と、第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文と、第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文と、を生成し、第1の逆翻訳文と入力文の類似度である第1の類似度を算出し、第1の類似度に基づいて、第1の翻訳文を表示部に表示するか、又は第2の逆翻訳文を再入力文として、目標言語に翻訳した第1の翻訳文を新たに生成するかを決定する。
これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。
本開示の翻訳装置、翻訳方法、及びプログラムによれば、精度良く翻訳することができる。
(用語の定義)
本明細書において、以下のように用語を定義する。
「原言語」:原文の言語
「翻訳言語」:翻訳文の言語
「目標言語」:表示される翻訳文の言語(ゲストの発話言語)
「他言語」:表示されない翻訳文の言語(目標言語以外の翻訳言語)
「目的逆翻訳文」:目標言語の翻訳文を原言語に逆翻訳して生成された逆翻訳文
「非目的逆翻訳文」:他言語の翻訳文を原言語に逆翻訳して生成された逆翻訳文
本明細書において、以下のように用語を定義する。
「原言語」:原文の言語
「翻訳言語」:翻訳文の言語
「目標言語」:表示される翻訳文の言語(ゲストの発話言語)
「他言語」:表示されない翻訳文の言語(目標言語以外の翻訳言語)
「目的逆翻訳文」:目標言語の翻訳文を原言語に逆翻訳して生成された逆翻訳文
「非目的逆翻訳文」:他言語の翻訳文を原言語に逆翻訳して生成された逆翻訳文
(本開示の基礎となった知見)
第1の言語から第2の言語への機械翻訳は、第1の言語と第2の言語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。この対訳コーパスは、対訳言語毎に生成されている。よって、例えば、日本語から英語への翻訳及び英語から日本語への逆翻訳は、日本語と英語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。また、日本語から中国語への翻訳及び中国語から日本語への逆翻訳は、日本語と中国語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。翻訳モデルを使用した機械翻訳では、第1の言語と第2の言語との構文の違いが大きいほど精度が劣る。また、対訳コーパスの言語の種類によって、新しい用語に既に対応している対訳コーパスと、未だ対応していない対訳コーパスが存在する場合がある。さらに、翻訳モデルの学習に用いられる対訳コーパス用の翻訳文は複数の人物によって生成されるため、翻訳の品質が均一にならない。これらの理由により、従来は、翻訳の精度が言語に応じて異なっていた。
第1の言語から第2の言語への機械翻訳は、第1の言語と第2の言語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。この対訳コーパスは、対訳言語毎に生成されている。よって、例えば、日本語から英語への翻訳及び英語から日本語への逆翻訳は、日本語と英語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。また、日本語から中国語への翻訳及び中国語から日本語への逆翻訳は、日本語と中国語の対訳コーパスを使用して学習した翻訳モデルを用いて行われる。翻訳モデルを使用した機械翻訳では、第1の言語と第2の言語との構文の違いが大きいほど精度が劣る。また、対訳コーパスの言語の種類によって、新しい用語に既に対応している対訳コーパスと、未だ対応していない対訳コーパスが存在する場合がある。さらに、翻訳モデルの学習に用いられる対訳コーパス用の翻訳文は複数の人物によって生成されるため、翻訳の品質が均一にならない。これらの理由により、従来は、翻訳の精度が言語に応じて異なっていた。
本開示は、言語の種類によらず、精度良く翻訳する翻訳装置を提供する。具体的には、翻訳精度が他の言語よりも低い言語であっても、他の言語と同等の良い精度で翻訳文を出力することを可能にする。具体的には、本開示の翻訳装置は、目標言語で原文を翻訳して翻訳文を生成し、その翻訳文から逆翻訳文(目的逆翻訳文)を生成する。さらに、翻訳装置は、他言語で原文を翻訳して翻訳文を生成し、その翻訳文から逆翻訳文(非目的逆翻訳文)を生成する。翻訳装置は、目的逆翻訳文の精度が良くない場合には、高精度の非目的逆翻訳文に基づいて、目標言語の翻訳文を生成し直す。これにより、目標言語の翻訳の精度が良くない場合であっても、正しい翻訳文を出力することを可能にする。
(第1実施形態)
以下、第1実施形態について、図面を参照しながら説明する。
以下、第1実施形態について、図面を参照しながら説明する。
1. 構成
1−1. 翻訳装置の外観
図1は、本実施形態にかかる翻訳装置の外観を示す図である。図1に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する翻訳装置である。すなわち、翻訳装置1は、第1の言語(原言語)から第2の言語(翻訳言語)への翻訳と、第2の言語から第1の言語への翻訳とを行うことができる。以下、本実施形態において、翻訳装置1は、第1の言語を話すホスト(例えば、案内者)と第2の言語を話すゲスト(例えば、旅行者)とが翻訳装置1を介して対面で行う会話を翻訳することを想定して説明する。本実施形態において、ホストが話す第1の言語は日本語である。
1−1. 翻訳装置の外観
図1は、本実施形態にかかる翻訳装置の外観を示す図である。図1に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する翻訳装置である。すなわち、翻訳装置1は、第1の言語(原言語)から第2の言語(翻訳言語)への翻訳と、第2の言語から第1の言語への翻訳とを行うことができる。以下、本実施形態において、翻訳装置1は、第1の言語を話すホスト(例えば、案内者)と第2の言語を話すゲスト(例えば、旅行者)とが翻訳装置1を介して対面で行う会話を翻訳することを想定して説明する。本実施形態において、ホストが話す第1の言語は日本語である。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とを備える。マイク10及びスピーカ12は、例えば、翻訳装置1の側面の開口近傍に配置されている。ディスプレイ14及びタッチパネル16は、翻訳装置1の主面に配置されている。ディスプレイ14の長手方向の一方側であるホスト側の領域には、発話アイコン14h及び表示領域15hが配置される。ディスプレイ14の長手方向の他方側であるゲスト側の領域には、発話アイコン14g及び表示領域15gが配置される。各発話アイコン14h、14gに対して、ユーザによるタッチ操作により操作がなされる。
発話アイコン14hは、ホストが発話を行うときに、すなわち、第1の言語の発話を翻訳装置1に入力するときに、ホスト本人がホストの発話の開始時点及び終了時点を指定するための操作アイコンである。発話アイコン14gは、ゲストが発話を行うときに、すなわち、第2の言語の発話を入力するときに、ゲスト本人がゲストの発話の開始時点及び終了時点を指定するための操作アイコンである。表示領域15h、15gは、原文、翻訳文、及び逆翻訳文等を文字列として表示するための領域である。
1−2. 翻訳装置及びサーバの構成
図2は、本実施形態にかかる翻訳システムの電気的な構成を示すブロック図である。本開示の翻訳システム100は、図1に示す翻訳装置1、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5を有する。翻訳装置1は、インターネットのようなネットワーク2を介して、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5のそれぞれとデータ通信を行う。
図2は、本実施形態にかかる翻訳システムの電気的な構成を示すブロック図である。本開示の翻訳システム100は、図1に示す翻訳装置1、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5を有する。翻訳装置1は、インターネットのようなネットワーク2を介して、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5のそれぞれとデータ通信を行う。
音声認識サーバ3は、翻訳装置1からネットワーク2を介してデジタル音声データを受信し、受信したデジタル音声データを音声認識して、原文のテキストデータ(文字列の音声認識データ)を生成するサーバである。
翻訳サーバ4は、複数の翻訳エンジン40を搭載している。本実施形態においては、翻訳サーバ4は、翻訳エンジン40a、40b、40c、40dを有する。翻訳エンジン40aは、日本語と英語の対訳コーパスを使用して学習した翻訳モデルを用いて、日本語から英語への翻訳及び英語から日本語への逆翻訳を行う。翻訳エンジン40bは、日本語と中国語の対訳コーパスを使用して学習した翻訳モデルを用いて、日本語から中国語への翻訳及び中国語から日本語への逆翻訳を行う。翻訳エンジン40cは、日本語と韓国語の対訳コーパスを使用して学習した翻訳モデルを用いて、日本語から韓国語への翻訳及び韓国語から日本語への逆翻訳を行う。翻訳エンジン40dは、日本語とタイ語の対訳コーパスを使用して学習した翻訳モデルを用いて、日本語からタイ語への翻訳及びタイ語から日本語への逆翻訳を行う。翻訳サーバ4が、複数の言語の翻訳エンジン40a、40b、40c、40dを搭載することによって、日本語から複数の言語への翻訳が可能になる。本明細書において、複数の翻訳エンジン40a、40b、40c、40dを特に区別しないときは翻訳エンジン40と称する。翻訳サーバ4は、翻訳装置1からネットワーク2を介して、原文のテキストデータを受信すると、翻訳エンジン40において、受信した原文のテキストデータから翻訳文のテキストデータ(文字列の翻訳データ)を生成する。また、翻訳サーバ4は、翻訳装置1からネットワーク2を介して、翻訳文のテキストデータを受信すると、翻訳エンジン40において、受信した翻訳文のテキストデータを逆翻訳して、逆翻訳文のテキストデータ(文字列の逆翻訳データ)を生成する。
音声合成サーバ5は、翻訳装置1からネットワーク2を介して、翻訳文のテキストデータを受信し、受信した翻訳文のテキストデータを音声合成して、音声信号を生成するサーバである。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とに加えて、通信部18と、記憶部20と、制御部22とを備える。
マイク10は、音声をデジタル音声データに変換する装置である。具体的には、マイク10は、音声を音声信号(アナログ電気信号)に変換し、さらに、AD変換器により音声信号をデジタル音声データに変換する。マイク10は、原文を翻訳装置1に入力する入力部の一例である。入力部は、マイク10に限らず、キーボード、ボタン、スイッチ、カメラ、及びこれらの組み合わせを備えてもよい。原文は、発話(音声)に基づく文及び入力部に直接入力された文を含む。
通信部18は、Bluetooth(登録商標)、Wi−Fi(登録商標)、3G、LTE(登録商標)、IEEE802.11等の通信方式に従って、ネットワーク2を介して音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5とデータ通信を行う通信モジュールである。
記憶部20は、フラッシュメモリ、強誘電体メモリ、HDD、SSD、RAM、及びこれらの組み合わせなどで構成される記録媒体である。記憶部20は、デジタル音声データ、原文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータを格納する。また、記憶部20は、制御部22のための各種プログラムを格納している。
制御部22は、CPU、MPU等で構成され、記憶部20に格納された各種プログラムを実行することにより、翻訳装置1の全体の動作を制御する。制御部22は、記憶部20に格納されたデータやプログラムを読み出して種々の演算処理を行うことで、所定の機能を実現する。本実施形態では、制御部22の機能は、ハードウェアとソフトウェアの協同により実現するが、制御部22を所定の機能を実現するように専用に設計されたハードウェア回路のみで実現してもよい。すなわち、制御部22は、CPU、MPUのみならず、DSP、FPGA、ASIC等で構成することができる。
スピーカ12は、電気信号を音声に変換する装置である。スピーカ12は、制御部22からの音声信号(電気信号)に基づいた音声を出力する。スピーカ12は、翻訳結果の音声又はテキストを外部に出力する出力部の一例である。
ディスプレイ14は、画像を表示する装置であり、液晶表示デバイスまたは有機EL表示デバイスで構成される。ディスプレイ14は、表示領域15h、15gにおいて、制御部22からの、原文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータが示す画像を表示する。ディスプレイ14は、原文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータをホスト又はゲストに対して表示する表示部の一例である。また、ディスプレイ14は上述した発話アイコン14h、14gを表示する。
タッチパネル16は、ユーザが操作する操作部の一例であり、ユーザからの指示を受け付ける。タッチパネル16はディスプレイ14に重畳して配置されている。翻訳装置1は、操作部として、タッチパネル16に限らず、キーボード、ボタン、スイッチ、カメラ、及びこれらの組み合わせを備えてもよい。タッチパネル16は、マイク10に代えて、原文を翻訳装置1に入力する入力部であってもよい。
2. 動作
2−1. 翻訳及び逆翻訳の概要
図3及び図4を参照して、翻訳及び逆翻訳の概要について説明する。図3は、目標言語(ゲストの発話言語)がタイ語である場合の翻訳及び逆翻訳の一例を示している。図4は、再翻訳処理によって得られた翻訳文と逆翻訳文の表示の一例を示している。本実施形態では、目的逆翻訳文が入力文又は再入力文と類似するまで、非目的逆翻訳文を使用して翻訳を繰り返す。
2−1. 翻訳及び逆翻訳の概要
図3及び図4を参照して、翻訳及び逆翻訳の概要について説明する。図3は、目標言語(ゲストの発話言語)がタイ語である場合の翻訳及び逆翻訳の一例を示している。図4は、再翻訳処理によって得られた翻訳文と逆翻訳文の表示の一例を示している。本実施形態では、目的逆翻訳文が入力文又は再入力文と類似するまで、非目的逆翻訳文を使用して翻訳を繰り返す。
具体的には、図3に示すように、ホストが日本語で「おはよー」と発話すると、翻訳システム100は、「おはよー」という入力文51(原文)を、目標言語であるタイ語と、他言語である英語、中国語、及び韓国語とにそれぞれ翻訳する。さらに、翻訳システム100は、タイ語の翻訳文52dを原言語である日本語に逆翻訳して、目的逆翻訳文53dを生成する。翻訳システム100は、英語、中国語、及び韓国語の翻訳文をそれぞれ逆翻訳して、非目的逆翻訳文53a、53b、53cを生成する。図3の例では、目的逆翻訳文53dは「はい取ることができます。」であり、英語及び中国語の翻訳文から生成された非目的逆翻訳文53a、53bは「おはようございます。」である。目的逆翻訳文53dの「はい取ることができます。」と入力文51の「おはよー」は類似していない。一方、非目的逆翻訳文53a、53bの「おはようございます。」と入力文51の「おはよー」は類似している。これは、タイ語の翻訳文52dが間違っている可能性が高いことを意味している。よって、翻訳システム100は、翻訳をやり直す。
翻訳システム100は、入力文と類似している非目的逆翻訳文53a又は非目的逆翻訳文53bの「おはようございます。」を再入力文54として、英語、中国語、韓国語、及びタイ語の翻訳文を新たに生成する。それから、翻訳システム100は、タイ語の翻訳文55dから目的逆翻訳文56dを新たに生成し、英語、中国語、及び韓国語の翻訳文から非目的逆翻訳文56a、56b、56cを新たに生成する。図3の例では、新たに生成した目的逆翻訳文56dは「おはようございます。」である。この目的逆翻訳文56dの「おはようございます。」は、英語及び中国語の翻訳文から生成された非目的逆翻訳文56a、56bの「おはようございます。」と同程度に、再入力文54の「おはようございます。」に類似している。また、目的逆翻訳文56dの「おはようございます。」は、韓国語の翻訳文から生成された非目的逆翻訳文56cの「こんにちは。」よりも、再入力文54の「おはようございます。」に類似している。これは、タイ語の翻訳文55dが正しいことを意味している。よって、翻訳装置1は、再入力文の「おはようございます。」を翻訳することによって得られたタイ語の翻訳文55dとその目的逆翻訳文56dをディスプレイ14に表示する。図4に示すように、翻訳装置1は、例えば、目標言語であるタイ語の翻訳文をゲスト側の表示領域15gに表示し、目的逆翻訳文をホスト側の表示領域15hに表示する。
2−2. 翻訳処理
図5〜図7を参照して翻訳システム100の動作について説明する。図5は、翻訳装置1の制御部22による翻訳処理における動作を示している。図6は、目標言語(ゲストの発話言語)の選択画面60の一例を示す図である。図7は、翻訳装置1の制御部22による再翻訳処理(図5のステップS9の詳細)を示している。
図5〜図7を参照して翻訳システム100の動作について説明する。図5は、翻訳装置1の制御部22による翻訳処理における動作を示している。図6は、目標言語(ゲストの発話言語)の選択画面60の一例を示す図である。図7は、翻訳装置1の制御部22による再翻訳処理(図5のステップS9の詳細)を示している。
図5において、翻訳装置1の制御部22は、最初に、ユーザの選択に基づいて目標言語を設定する(S1)。図6に示すように、翻訳装置1は、例えば、ホストとゲストが会話を開始する前、ゲストが発話言語を選択するための言語選択アイコン61をディスプレイ14に表示している。言語選択アイコン61によって選択できる言語は、翻訳エンジン40a、40b、40c、40dによって翻訳できる言語に対応している。ゲストは、会話を開始する前に、言語選択アイコン61をタッチ操作することによって、ゲスト自身の発話言語を選択する。制御部22は、タッチされた言語選択アイコン61に応じて、目標言語を設定する。例えば、ゲストが英語を示す言語選択アイコン61に触れると、制御部22は英語を目標言語に設定する。
制御部22は、入力文(原文)を取得する(S2)。具体的には、例えば、制御部22は、マイク10を介して、ホストの発話(音声)に応じたデジタル音声データを入力する。制御部22は、デジタル音声データを、ネットワーク2を介して音声認識サーバ3に送信する。音声認識サーバ3は、受信したデジタル音声データを音声認識して、発話文である原文のテキストデータを生成する。制御部22は、音声認識サーバ3からネットワーク2を介して、原文のテキストデータを受信する。
制御部22は、原文を入力文として、入力文から目標言語と他言語の翻訳文をそれぞれ生成する(S3)。具体的には、制御部22は、入力文(原文)のテキストデータを、ネットワーク2を介して、翻訳サーバ4に送信する。翻訳サーバ4は、翻訳エンジン40a、40b、40c、40dにおいて、受信した原文のテキストデータから翻訳文のテキストデータを生成する。翻訳サーバ4は、翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1は、翻訳サーバ4からネットワーク2を介して、翻訳文のテキストデータを受信する。
制御部22は、翻訳文を原言語に翻訳して逆翻訳文を生成する(S4)。ここでは、目標言語の翻訳文から目的逆翻訳文を生成し、他言語の翻訳文から非目的逆翻訳文を生成する。具体的には、制御部22は、翻訳文のテキストデータを、ネットワーク2を介して、翻訳サーバ4に送信する。翻訳サーバ4は、翻訳エンジン40a、40b、40c、40dにおいて、翻訳文のテキストデータから逆翻訳文のテキストデータを生成する。翻訳サーバ4は、逆翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1は、翻訳サーバ4からネットワーク2を介して、逆翻訳文のテキストデータを受信する。
制御部22は、入力文と各逆翻訳文の類似度を算出する(S5)。類似度の算出は、Word2vec、ニューラルネットワーク、レーベンシュタイン距離などの手法を用いて行う。制御部22は、目的逆翻訳文と入力文の類似度を、非目的逆翻訳文と入力文の類似度と比較する(S6)。
制御部22は、目的逆翻訳文と入力文の類似度が、非目的逆翻訳文と入力文の類似度以上か否かを判断する(S7)。ここでは、目的逆翻訳文の類似度を、全ての非目的逆翻訳文の類似度と比較する。例えば、図3の例では、タイ語の翻訳文から生成した目的逆翻訳文の類似度を、英語、中国語、及び韓国語の翻訳文から生成した非目的逆翻訳文の類似度と比較する。目的逆翻訳文の類似度が全ての非目的逆翻訳文の類似度以上であれば(S7でYes)、制御部22は、目標言語の翻訳文及び目的逆翻訳文を出力する(S8)。例えば、制御部22は、目標言語の翻訳文をゲスト側の表示領域15gに表示し、目的逆翻訳文をホスト側の表示領域15hに表示する。なお、翻訳文の表示と同時に、翻訳文を音声で出力してもよい。この場合、制御部22は、翻訳文のテキストデータを、ネットワーク2を介して、音声合成サーバ5に送信する。音声合成サーバ5は、翻訳装置1から受信した翻訳文のテキストデータに基づき、音声合成を行って音声信号を生成する。音声合成サーバ5は、ネットワーク2を介して翻訳装置1に音声信号を送信する。制御部22は、音声合成サーバ5から受信した音声信号に基づき、スピーカ12から翻訳結果を示す音声を出力する。
目的逆翻訳文の類似度が非目的逆翻訳文の類似度より低ければ(S7でNo)、制御部22は、再翻訳処理を行う(S9)。具体的には、目的逆翻訳文の類似度よりも高い類似度を持つ非目的逆翻訳文が一つでもあれば、再翻訳処理を行う。
2−3. 再翻訳処理
図7を参照して、再翻訳処理(図5のステップS9の詳細)について説明する。制御部22は、入力文に対する類似度が、目的逆翻訳文よりも高い非目的逆翻訳文を再入力文として、目標言語及び他言語の翻訳文を新たに生成する(S901)。例えば、類似度が最も高い非目的逆翻訳文を再入力文とする。再入力文から翻訳文を生成する方法は、入力文から翻訳文を生成する方法(図5のステップS3)と同一である。すなわち、制御部22は、翻訳サーバ4に再入力文のテキストデータを送信することによって、翻訳サーバ4から翻訳文のテキストデータを取得する。
図7を参照して、再翻訳処理(図5のステップS9の詳細)について説明する。制御部22は、入力文に対する類似度が、目的逆翻訳文よりも高い非目的逆翻訳文を再入力文として、目標言語及び他言語の翻訳文を新たに生成する(S901)。例えば、類似度が最も高い非目的逆翻訳文を再入力文とする。再入力文から翻訳文を生成する方法は、入力文から翻訳文を生成する方法(図5のステップS3)と同一である。すなわち、制御部22は、翻訳サーバ4に再入力文のテキストデータを送信することによって、翻訳サーバ4から翻訳文のテキストデータを取得する。
制御部22は、目標言語の翻訳文から目的逆翻訳文を新たに生成し、他言語の翻訳文から非目的逆翻訳文を新たに生成する(S902)。再翻訳処理における逆翻訳文の生成方法は、翻訳処理における逆翻訳文の生成方法(図5のステップS4)と同一である。すなわち、制御部22は、翻訳サーバ4に翻訳文のテキストデータを送信することによって、翻訳サーバ4から逆翻訳文のテキストデータを取得する。
制御部22は、再入力文と各逆翻訳文の類似度を算出する(S903)。類似度の算出は、図5のステップS5と同様に、Word2vec、ニューラルネットワーク、レーベンシュタイン距離などの手法を用いて行う。制御部22は、目的逆翻訳文と再入力文の類似度を、非目的逆翻訳文と再入力文の類似度と比較する(S904)。制御部22は、目的逆翻訳文と再入力文の類似度が、非目的逆翻訳文と再入力文の類似度以上か否かを判断する(S905)。
目的逆翻訳文の類似度が全ての非目的逆翻訳文の類似度以上であれば(S905でYes)、制御部22は、目標言語の翻訳文及び目的逆翻訳文を表示する(S906)。例えば、図4に示すように、制御部22は、目標言語の翻訳文をゲスト側の表示領域15gに表示し、目的逆翻訳文をホスト側の表示領域15hに表示する。目的逆翻訳文の類似度が非目的逆翻訳文の類似度より低ければ(S905でNo)、すなわち、目的逆翻訳文の類似度よりも高い非目的逆翻訳文の類似度が一つでもあれば、制御部22は、翻訳回数が所定回数を超えたか否かを判断する(S907)。翻訳回数が所定回数を越えていなければ(S907でNo)、制御部22は、ステップS901に戻り、再入力文に対する類似度が目的逆翻訳文よりも高い非目的逆翻訳文を新たな再入力文として、翻訳文及び逆翻訳文の生成を繰り返す。
翻訳回数が所定回数を越えると(S907でYes)、制御部22は翻訳不可を示す文をディスプレイ14に表示する(S908)。例えば、制御部22は、ホスト側の表示領域15hに翻訳不可を示す文を表示する。
3.効果及び補足等
本実施形態の翻訳装置1は、原言語の原文を入力するマイク10(入力部の一例)と、原文を入力文として、入力文を目標言語に翻訳した翻訳文(第1の翻訳文)を生成する制御部22と、翻訳文を表示するディスプレイ14(表示部の一例)と、を備える。制御部22は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した翻訳文(第2の翻訳文)と、目標言語の翻訳文を原言語に逆翻訳した目的逆翻訳文(第1の逆翻訳文)と、他言語の翻訳文を原言語に逆翻訳した非目的逆翻訳文(第2の逆翻訳文)と、を生成する。制御部22は、目的逆翻訳文と入力文の類似度(第1の類似度)を算出し(S5)、類似度に基づいて、目標言語の翻訳文をディスプレイ14に表示するか、又は非目的逆翻訳文を再入力文として、目標言語に翻訳した翻訳文(第1の翻訳文)を新たに生成するかを決定する(S6、S7)。
本実施形態の翻訳装置1は、原言語の原文を入力するマイク10(入力部の一例)と、原文を入力文として、入力文を目標言語に翻訳した翻訳文(第1の翻訳文)を生成する制御部22と、翻訳文を表示するディスプレイ14(表示部の一例)と、を備える。制御部22は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した翻訳文(第2の翻訳文)と、目標言語の翻訳文を原言語に逆翻訳した目的逆翻訳文(第1の逆翻訳文)と、他言語の翻訳文を原言語に逆翻訳した非目的逆翻訳文(第2の逆翻訳文)と、を生成する。制御部22は、目的逆翻訳文と入力文の類似度(第1の類似度)を算出し(S5)、類似度に基づいて、目標言語の翻訳文をディスプレイ14に表示するか、又は非目的逆翻訳文を再入力文として、目標言語に翻訳した翻訳文(第1の翻訳文)を新たに生成するかを決定する(S6、S7)。
具体的には、制御部22は、非目的逆翻訳文と入力文の類似度(第2の類似度)を算出し、目的逆翻訳文と入力文の類似度が、非目的逆翻訳文と入力文の類似度以上の場合は、目標言語の翻訳文をディスプレイ14に表示する。目的逆翻訳文と入力文の類似度が、非目的逆翻訳文と入力文の類似度よりも低い場合は、非目的逆翻訳文を再入力文として、目標言語に翻訳した翻訳文(第1の翻訳文)を新たに生成する。
これにより、目標言語の翻訳の精度が低い場合は、翻訳精度の高い他言語の翻訳文から生成した非目的逆翻訳文を用いて翻訳文を生成し直すことになるため、精度の高い翻訳文を出力することができる。よって、言語の種類によらず、精度良く翻訳することができる。非目的逆翻訳文は翻訳エンジン40によって生成されているため、原文よりも翻訳に適している。すなわち、非目的逆翻訳文は、原文よりも精度良く翻訳されうる。非目的逆翻訳文を用いて再度翻訳することによって、ユーザによる発話又は入力のやり直しの回数を削減することができる。
さらに、以下の効果も得られる。本実施形態において、翻訳する他言語の種類が増えれば増えるほど、翻訳の精度がより良くなる。目標言語の翻訳文の生成に非目的逆翻訳文を使用するため、目標言語の対訳コーパスが新たな用語に対応していなくても、他言語の対訳コーパスを使用して、精度良く翻訳することができる。また、新たな用語を全ての対訳コーパスに追加しなくても精度の良い翻訳ができるため、対訳コーパスの作成にかかるコストを削減することができる。翻訳精度の低い言語を翻訳の繰り返し回数に基づいて特定することができるため、翻訳モデルの強化をより効率的に行うことができる。また、正しく翻訳できない文章を言語毎に特定することができるため、翻訳モデルの強化をより効率的に行うことができる。
さらに、制御部22は、再入力文を少なくとも1つの他言語に翻訳した翻訳文(第2の翻訳文)を新たに生成すると共に、新たに生成した目標言語の翻訳文を原言語に逆翻訳した目的逆翻訳文(第1の逆翻訳文)と、新たに生成した他言語の翻訳文を原言語に逆翻訳した非目的逆翻訳(第2の逆翻訳文の一例)とを新たに生成する。制御部22は、新たに生成した目的逆翻訳文と再入力文の類似度(第3の類似度)及び新たに生成した非目的逆翻訳文と再入力文の類似度(第4の類似度)を算出する(S903)。制御部22は、目的逆翻訳文と再入力文の類似度が、非目的逆翻訳文と再入力文の類似度以上の場合は、新たに生成した目標言語の翻訳文をディスプレイ14に表示する。目的逆翻訳文と再入力文の類似度が、非目的逆翻訳文と再入力文の類似度よりも低い場合は、新たに生成した非目的逆翻訳文を再入力文として、目標言語の翻訳文(第1の翻訳文)、目的逆翻訳文(第1の逆翻訳文)、他言語の翻訳文(第2の翻訳文)、及び非目的逆翻訳文(第2の逆翻訳文)の生成を繰り返す。
これにより、目標言語の翻訳の精度が良くない場合は、翻訳精度の高い他言語の翻訳文から生成された非目的逆翻訳文を用いて、目標言語の翻訳文の生成を繰り返すことになるため、精度の高い翻訳文を出力することができる。
なお、制御部22は、図5に示す翻訳処理及び図7に示す再翻訳処理を行っているときに翻訳の記録を示す翻訳ログ情報24(翻訳履歴情報の一例)を生成して、記憶部20に格納してもよい。図8は、翻訳ログ情報24の一例を示している。翻訳ログ情報24は、例えば、原文(入力文)、翻訳回数、再入力文、目標言語の翻訳文、目的逆翻訳文、目的逆翻訳文と入力文(又は再入力文)との類似度、他言語の翻訳文、非目的逆翻訳文、及び非目的逆翻訳文と入力文(又は再入力文)との類似度のうちの全部又は少なくともいずれか1つを含む。制御部22は、翻訳ログ情報24を使用して、再入力文を決定してもよい。
(第2実施形態)
本実施形態では、言語が多義語を含む場合であっても、正しい翻訳文を出力することを可能にする。多義語を含む言語の場合、同一の用語が複数の意味を持つため、翻訳が正しくても、入力文と逆翻訳文が一致しない場合が生じる。例えば、韓国語では、「おはよう」、「こんにちは」、及び「こんばんは」に対応する挨拶の用語は一つである。この場合、入力文の「おはよー」及び再入力文の「おはようございます。」に対する韓国語の翻訳文が正しくても、逆翻訳文が「こんにちは。」になる場合がある。そのため、翻訳を繰り返しても、逆翻訳文と再入力文との類似度が低いままになり、翻訳文が出力されない場合が生じる。本実施形態では、同一の用語が複数の意味を持つ言語において、逆翻訳文が入力文又は再入力文と異なる場合であっても、翻訳文が正しければ、その翻訳文を出力する。本実施形態における翻訳システム100の構成は、第1実施形態の図2に示す構成と同一である。
本実施形態では、言語が多義語を含む場合であっても、正しい翻訳文を出力することを可能にする。多義語を含む言語の場合、同一の用語が複数の意味を持つため、翻訳が正しくても、入力文と逆翻訳文が一致しない場合が生じる。例えば、韓国語では、「おはよう」、「こんにちは」、及び「こんばんは」に対応する挨拶の用語は一つである。この場合、入力文の「おはよー」及び再入力文の「おはようございます。」に対する韓国語の翻訳文が正しくても、逆翻訳文が「こんにちは。」になる場合がある。そのため、翻訳を繰り返しても、逆翻訳文と再入力文との類似度が低いままになり、翻訳文が出力されない場合が生じる。本実施形態では、同一の用語が複数の意味を持つ言語において、逆翻訳文が入力文又は再入力文と異なる場合であっても、翻訳文が正しければ、その翻訳文を出力する。本実施形態における翻訳システム100の構成は、第1実施形態の図2に示す構成と同一である。
図9及び図10を参照して、第2実施形態における翻訳及び逆翻訳の概要について説明する。図9は、目標言語(ゲストの発話言語)が韓国語である場合の翻訳及び逆翻訳の一例を示している。図10は、第2実施形態における翻訳文及び逆翻訳文の表示画面の一例を示している。
図9に示すように、ホストが「おはよー」と発話すると、翻訳システム100は、「おはよー」という入力文71(原文)を、目標言語である韓国語と、他言語である英語、中国語、及びタイ語とにそれぞれ翻訳する。さらに、翻訳システム100は、韓国語の翻訳文72cから目的逆翻訳文73cを生成し、英語、中国語、及びタイ語の翻訳文から非目的逆翻訳文73a、73b、73dを生成する。目的逆翻訳文73cの「こんにちは。」と入力文71の「おはよー」の類似度は、非目的逆翻訳文73a、73bの「おはようございます。」と入力文71の「おはよー」の類似度よりも低い。よって、翻訳システム100は、翻訳をやり直す。
翻訳システム100は、入力文71と類似している非目的逆翻訳文73a又は非目的逆翻訳文73bの「おはようございます。」を再入力文74として、英語、中国語、韓国語、及びタイ語の翻訳文を新たに生成する。それから、翻訳システム100は、韓国語の翻訳文75cから目的逆翻訳文76cを生成し、英語、中国語、及びタイ語の翻訳文から非目的逆翻訳文76a、76b、76dを新たに生成する。目的逆翻訳文76cの「こんにちは。」と再入力文74の「おはようございます。」の類似度は、非目的逆翻訳文76a、76b、76dの「おはようございます。」と再入力文「おはようございます。」の類似度よりも低い。しかし、目標言語の前回の翻訳文72cと今回の翻訳文75cとは一致している。この場合、翻訳システム100は、目的逆翻訳文76cと再入力文との不一致は多義語が原因であり、目標言語の翻訳文72c、75cは正しいと判断する。よって、翻訳システム100は、韓国語の翻訳文75cをディスプレイ14に表示する。また、このとき、目的逆翻訳文76cの代わりに、再入力文74との類似度が高い非目的逆翻訳文76a、非目的逆翻訳文76b、又は非目的逆翻訳文76dの「おはようございます。」をディスプレイ14に表示する。例えば、図10に示すように、目標言語である韓国語の翻訳文をゲストの表示領域15gに表示し、類似度が最も高い英語、中国語、又はタイ語の逆翻訳文「おはようございます。」をホストの表示領域15hに表示する。このように、韓国語の翻訳文から生成された目的逆翻訳文76cの「こんにちは。」と再入力文の「おはようございます。」との類似度が低い場合であっても、前回生成した韓国語の翻訳文72cと今回生成した韓国語の翻訳文75cとが同一であれば、その翻訳文72c、75cが正しいと判断して、ディスプレイ14に表示する。
図11を参照して、第2実施形態の再翻訳処理における翻訳装置1の動作について説明する。図11は、第2実施形態における再翻訳処理(図5のステップS9の詳細)を示している。
図11のステップS901〜S908は、第1実施形態の図7のステップS901〜S908と同一である。図11は、図7に対してステップS951〜S953が新たに追加されている。新たに追加されたステップS951〜S953について説明する。
本実施形態においては、目標言語の翻訳文から生成した目的逆翻訳文と再入力文の類似度が、他言語の翻訳文から生成した非目的逆翻訳文と再入力文の類似度より低いときに(S905でNo)、ステップS951に進む。制御部22は目標言語の前回の翻訳文と今回の翻訳文とを比較して(S951)、目標言語の前回の翻訳文と今回の翻訳文が同一か否かを判断する(S952)。目標言語の前回の翻訳文と今回の翻訳文が同一であれば(S952でYes)、制御部22は、目標言語の翻訳文を表示すると共に、再入力文に対して最も類似度が高い非目的逆翻訳文を表示する(S953)。目標言語の前回の翻訳文と今回の翻訳文が異なれば(S952でNo)、制御部22は、翻訳回数が所定回数を超えたか否かを判断する(S907)。
以上のように、制御部22は、新たに生成した目的逆翻訳文(第1の逆翻訳文)と再入力文の類似度(第3の類似度)が、新たに生成した非目的逆翻訳文(第2の逆翻訳文)と再入力文の類似度(第4の類似度)よりも低い場合は、新たに生成した目標言語の翻訳文と、先に生成した目標言語の翻訳文とが同一か否かを判断する(S952)。新たに生成した目標言語の翻訳文と、先に生成した目標言語の翻訳文とが同一のときは、その目標言語の翻訳文をディスプレイ14に表示する(S953)。これにより、多義語であっても、翻訳文を精度良く出力することができる。
また、制御部22は、目標言語の翻訳文と共に、再入力文に対する類似度が目的逆翻訳文よりも高い非目的逆翻訳文をディスプレイ14に表示する。これにより、ホストは、原文が正しく翻訳されたことを確認することができる。
(他の実施形態)
以上のように、本出願において開示する技術の例示として、上記実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。そこで、以下、他の実施形態を例示する。
以上のように、本出願において開示する技術の例示として、上記実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。そこで、以下、他の実施形態を例示する。
上記実施形態においては、図5のステップS7や、図7及び図11のステップS905において、目的逆翻訳文の類似度が非目的逆翻訳文の類似度以上か否かを判断して、目標言語の翻訳文を表示するか又は再翻訳処理を行うかを決定した。しかし、ステップS7やステップS905において、別の判断を行ってもよい。例えば、目的逆翻訳文の類似度が閾値(例えば、最低スコア値)より大きいか否かを判断し、閾値以下のときに再翻訳処理を行ってもよい。別の例では、「第1の閾値(例えば、最低スコア値)<第2の閾値」とし、目的逆翻訳文の類似度が第1の閾値以下且つ非目的逆翻訳文の類似度が第2の閾値以上であるときに、再翻訳処理を行ってもよい。さらに別の例では、目的逆翻訳文の類似度が閾値(例えば、最低スコア値)以下、且つ目的逆翻訳文の類似度と非目的逆翻訳文の類似度との差が所定値以上のときに、再翻訳処理を行ってもよい。
上記実施形態においては、図7及び図11のステップS903において、再入力文と各逆翻訳文の類似度を算出した。これに加えて又はこれに代えて、入力文(原文)と各逆翻訳文の類似度を算出してもよい。
上記実施形態においては、翻訳を繰り返す場合、図7及び図11のステップS901において、再入力文に対する類似度が目的逆翻訳文よりも高い(例えば、最も高い)非目的逆翻訳文を使用した。しかし、別の基準に基づいて、再入力文を決定してもよい。例えば、直前に生成した非目的逆翻訳文と原文との類似度が最も高い非目的逆翻訳文を再入力文にしてもよい。別の例では、直前に限らず過去に生成した非目的逆翻訳文の中から、原文に対する類似度が目的逆翻訳文よりも高い非目的逆翻訳文を選択して、再入力文にしてもよい。
上記実施形態においては、図7及び図11のステップS907において、翻訳回数が所定回数を超えたか否かの判断に基づいて、再翻訳処理を繰り返すか否かを決定した。しかし、別の判断を行ってもよい。例えば、再入力文又は原文に対する類似度が閾値以上の非目的逆翻訳文であって、再入力文としてまだ使用していない逆翻訳文があるか否かを判断して、ある場合に再翻訳処理を繰り返してもよい。その際、選択する再入力文又は原文に対する類似度が閾値以上の非目的逆翻訳文は、現在翻訳しているものに限らず、これまでの翻訳処理すべてにおいて生成された過去の非目的逆翻訳文を対象としてもよい。また、再入力文又は原文に対する非目的逆翻訳文の類似度が一つ前の類似度よりも低いか否かを判断して、低い場合に再翻訳処理を中止してもよい。
図11のステップS952の判断において、目標言語の前回と今回の翻訳文が同一で、且つ、非目的逆翻訳文と再入力文(又は原文)との類似度が閾値より高い場合に、ステップS953に進み、目標言語の翻訳文を表示してもよい。また、目標言語の前回と今回の翻訳文が同一で、且つ、非目的逆翻訳文の再入力文に対する類似度と原文に対する類似度との差が所定値以内の場合に、ステップS953に進み、目標言語の翻訳文を表示してもよい。
上記実施形態において、翻訳装置1は、マイク10で入力した発話(音声)に対応する原文を翻訳したが、キーボードやマウスなどにより、発話以外で入力した原文や、カメラで撮影した手話などのジェスチャにより生成した原文を翻訳してもよい。
上記実施形態では、翻訳装置1が逆翻訳文と入力文又は再入力文との類似度を計算したが、類似度の計算は翻訳サーバ4が行ってもよい。例えば、翻訳サーバ4が、入力文又は再入力文に基づいて、翻訳文及び逆翻訳文を生成して、類似度を算出し、目的逆翻訳文の類似度が非目的逆翻訳文の類似度以上になるまで、翻訳を繰り返しても良い。この場合、翻訳サーバ4は、目的逆翻訳文の類似度が非目的逆翻訳文の類似度以上になったときに、目標言語の翻訳文と目的逆翻訳文とを翻訳装置1に送信してもよい。また、目的逆翻訳文の類似度が非目的逆翻訳文の類似度以上にならずに、翻訳回数が所定回数を超えた場合は、翻訳サーバ4は翻訳不可を示す情報を翻訳装置1に送信してもよい。翻訳装置1は、翻訳サーバ4から取得した目標言語の翻訳文と目的逆翻訳文をディスプレイ14に表示する。
上記実施形態では、音声認識を音声認識サーバ3で行い、翻訳を翻訳サーバ4で行い、音声合成を音声合成サーバ5で行ったが、本開示はこれに限定されない。音声認識、翻訳及び音声合成の少なくとも一つの処理を翻訳装置1内で行ってもよい。例えば、翻訳装置1(端末)に、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5と同一の機能を全て搭載して、翻訳装置1のみで翻訳に関連する全ての処理を行うようにしてもよい。この場合、翻訳装置1は、通信部18を有さなくてもよい。また、音声認識、翻訳及び音声合成を1もしくは2つのサーバで行ってもよい。
上記実施形態では、他言語が3つである場合を例示したが、他言語の数は1つ以上であればよい。また、複数の翻訳エンジンを備える翻訳サーバ4で複数の言語の翻訳及び逆翻訳を行うとしたが、1つの翻訳エンジンを備える複数の翻訳サーバで各言語の翻訳及び逆翻訳を行うとしてもよい。
上記実施形態では、原言語が日本語であり、翻訳言語が、英語、中国語、韓国語、及びタイ語である場合を例示したが、原言語及び翻訳言語は、上記実施形態に限らない。例えば、原言語及び翻訳言語は、他の言語(独語、仏語、スペイン語、ベトナム語、インドネシア語等)でもよい。
(実施形態の概要)
(1)本開示の翻訳装置は、原言語の原文を入力する入力部と、原文を入力文として、入力文を目標言語に翻訳した第1の翻訳文を生成する制御部と、第1の翻訳文を表示する表示部と、を備え、制御部は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文と、第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文(目的逆翻訳文)と、第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文(非目的逆翻訳文)と、を生成し、第1の逆翻訳文と入力文の類似度である第1の類似度を算出し(S5)、第1の類似度に基づいて、第1の翻訳文を表示部に表示するか、又は第2の逆翻訳文を再入力文として目標言語に翻訳した第1の翻訳文を新たに生成するかを決定する(S6、S7)。
(1)本開示の翻訳装置は、原言語の原文を入力する入力部と、原文を入力文として、入力文を目標言語に翻訳した第1の翻訳文を生成する制御部と、第1の翻訳文を表示する表示部と、を備え、制御部は、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文と、第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文(目的逆翻訳文)と、第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文(非目的逆翻訳文)と、を生成し、第1の逆翻訳文と入力文の類似度である第1の類似度を算出し(S5)、第1の類似度に基づいて、第1の翻訳文を表示部に表示するか、又は第2の逆翻訳文を再入力文として目標言語に翻訳した第1の翻訳文を新たに生成するかを決定する(S6、S7)。
入力文に対する類似度に応じて、第2の逆翻訳文を使用して翻訳をやり直すため、言語の種類によらず、精度良く翻訳することができる。
(2)(1)の翻訳装置において、制御部は、第2の逆翻訳文と入力文の類似度である第2の類似度を算出し、第1の類似度が第2の類似度以上の場合は、第1の翻訳文を表示部に表示し、第1の類似度が第2の類似度よりも低い場合は、第2の逆翻訳文を再入力文として、目標言語に翻訳した第1の翻訳文を新たに生成してもよい。
(3)(2)の翻訳装置において、制御部は、再入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文を新たに生成し、新たに生成した第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文(目的逆翻訳文)と、新たに生成した第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文(非目的逆翻訳文)とを新たに生成し、新たに生成した第1の逆翻訳文と再入力文の類似度である第3の類似度及び新たに生成した第2の逆翻訳文と再入力文の類似度である第4の類似度を算出し(S903)、第3の類似度が第4の類似度以上の場合は、新たに生成した第1の翻訳文を表示部に表示し、第3の類似度が第4の類似度よりも低い場合は、新たに生成した第2の逆翻訳文を再入力文として、第1の翻訳文、第1の逆翻訳文、第2の翻訳文、及び第2の逆翻訳文の生成を繰り返してもよい。
再入力文に対する類似度が高くなるまで、翻訳が繰り返されるため、言語の種類によらず、精度良く翻訳することができる。
(4)(3)の翻訳装置において、制御部は、第3の類似度が第4の類似度よりも低い場合は、新たに生成した第1の翻訳文と、先に生成した第1の翻訳文とが同一か否かを判断し(S952)、新たに生成した第1の翻訳文と、先に生成した第1の翻訳文とが同一のときは、第1の翻訳文を表示部に表示してもよい。
これにより、目標言語が多義語を含む場合であっても、精度の良い翻訳文を表示することができる。
(5)(4)の翻訳装置において、制御部は、第1の翻訳文と共に、新たに生成した第2の逆翻訳文を表示部に表示してもよい。
これにより、目標言語が多義語を含む場合であっても、入力文又は再入力文に適した逆翻訳文を表示することができる。これにより、ユーザは、逆翻訳文を確認することによって、翻訳文が正しいか否かを確認することができる。
(6)(3)の翻訳装置は、原文、再入力文、第1の翻訳文、第1の逆翻訳文、第2の翻訳文、第2の逆翻訳文、第1から第4の類似度、及び翻訳の繰り返し回数のうちの一つ以上を含む翻訳履歴情報を格納する記憶部をさらに有してもよい。
(7)本開示の翻訳方法は、入力部が原言語の原文を入力するステップ(S2)と、演算部(翻訳装置1の制御部22及び翻訳サーバ4)が原文を入力文として、入力文を目標言語に翻訳した第1の翻訳文と、入力文を目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文とを生成するステップ(S3)と、演算部(翻訳装置1の制御部22及び翻訳サーバ4)が第1の翻訳文を原言語に逆翻訳した第1の逆翻訳文と、第2の翻訳文を原言語に逆翻訳した第2の逆翻訳文を生成するステップ(S4)と、演算部(制御部22)が第1の逆翻訳文と入力文の類似度を算出するステップ(S5)と、演算部(制御部22)が、類似度に基づいて、第1の翻訳文を表示部に表示するか、又は第2の逆翻訳文を再入力文として、目標言語に翻訳した第1の翻訳文を新たに生成するかを決定するステップ(S6、S7)と、を含む。
本開示の全請求項に記載の翻訳装置及び翻訳方法は、ハードウェア資源、例えば、プロセッサ、メモリ、及びプログラムとの協働などによって、実現される。
本開示は、発話者の音声又は入力文に基づき翻訳する翻訳装置に適用可能である。
1 翻訳装置
2 ネットワーク
3 音声認識サーバ
4 翻訳サーバ
5 音声合成サーバ
10 マイク(入力部)
12 スピーカ(出力部)
14 ディスプレイ(表示部)
14h、14g 発話アイコン
15h、15g 表示領域
16 タッチパネル(操作部)
18 通信部
20 記憶部
22 制御部
24 翻訳ログ情報
40、40a、40b、40c、40d 翻訳エンジン
100 翻訳システム
2 ネットワーク
3 音声認識サーバ
4 翻訳サーバ
5 音声合成サーバ
10 マイク(入力部)
12 スピーカ(出力部)
14 ディスプレイ(表示部)
14h、14g 発話アイコン
15h、15g 表示領域
16 タッチパネル(操作部)
18 通信部
20 記憶部
22 制御部
24 翻訳ログ情報
40、40a、40b、40c、40d 翻訳エンジン
100 翻訳システム
Claims (8)
- 原言語の原文を入力する入力部と、
前記原文を入力文として、前記入力文を目標言語に翻訳した第1の翻訳文を生成する制御部と、
前記第1の翻訳文を表示する表示部と、
を備え、
前記制御部は、
前記入力文を前記目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文と、前記第1の翻訳文を前記原言語に逆翻訳した第1の逆翻訳文と、前記第2の翻訳文を前記原言語に逆翻訳した第2の逆翻訳文と、を生成し、
前記第1の逆翻訳文と前記入力文の類似度である第1の類似度を算出し、
前記第1の類似度に基づいて、前記第1の翻訳文を前記表示部に表示するか、又は前記第2の逆翻訳文を再入力文として、前記目標言語に翻訳した第1の翻訳文を新たに生成するかを決定する、
翻訳装置。 - 前記制御部は、
前記第2の逆翻訳文と前記入力文の類似度である第2の類似度を算出し、
前記第1の類似度が前記第2の類似度以上の場合は、前記第1の翻訳文を前記表示部に表示し、
前記第1の類似度が前記第2の類似度よりも低い場合は、前記第2の逆翻訳文を再入力文として、前記目標言語に翻訳した第1の翻訳文を新たに生成する、
請求項1に記載の翻訳装置。 - 前記制御部は、
前記再入力文を前記目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文を新たに生成し、
新たに生成した前記第1の翻訳文を前記原言語に逆翻訳した第1の逆翻訳文と、新たに生成した前記第2の翻訳文を前記原言語に逆翻訳した第2の逆翻訳文と、を新たに生成し、
新たに生成した前記第1の逆翻訳文と前記再入力文の類似度である第3の類似度及び新たに生成した前記第2の逆翻訳文と前記再入力文の類似度である第4の類似度を算出し、
前記第3の類似度が前記第4の類似度以上の場合は、新たに生成した前記第1の翻訳文を前記表示部に表示し、
前記第3の類似度が前記第4の類似度よりも低い場合は、新たに生成した前記第2の逆翻訳文を再入力文として、前記第1の翻訳文、前記第1の逆翻訳文、前記第2の翻訳文、及び前記第2の逆翻訳文の生成を繰り返す、
請求項2に記載の翻訳装置。 - 前記制御部は、
前記第3の類似度が前記第4の類似度よりも低い場合は、
新たに生成した前記第1の翻訳文と、先に生成した前記第1の翻訳文とが同一か否かを判断し、新たに生成した前記第1の翻訳文と、先に生成した前記第1の翻訳文とが同一のときは、前記第1の翻訳文を前記表示部に表示する、
請求項3に記載の翻訳装置。 - 前記制御部は、前記第1の翻訳文と共に、新たに生成した前記第2の逆翻訳文を前記表示部に表示する、
請求項4に記載の翻訳装置。 - 前記原文、前記再入力文、前記第1の翻訳文、前記第1の逆翻訳文、前記第2の翻訳文、前記第2の逆翻訳文、前記第1から前記第4の類似度、及び翻訳の繰り返し回数のうちの一つ以上を含む翻訳履歴情報を格納する記憶部をさらに有する、
請求項3に記載の翻訳装置。 - 入力部が原言語の原文を入力するステップと、
演算部が前記原文を入力文として、前記入力文を目標言語に翻訳した第1の翻訳文と、前記入力文を前記目標言語とは異なる少なくとも1つの他言語に翻訳した第2の翻訳文とを生成するステップと、
前記演算部が前記第1の翻訳文を前記原言語に逆翻訳した第1の逆翻訳文と、前記第2の翻訳文を前記原言語に逆翻訳した第2の逆翻訳文を生成するステップと、
前記演算部が前記第1の逆翻訳文と前記入力文の類似度を算出するステップと、
前記演算部が、前記類似度に基づいて、前記第1の翻訳文を表示部に表示するか、又は前記第2の逆翻訳文を再入力文として前記目標言語に翻訳した第1の翻訳文を新たに生成するかを決定するステップと、
を含む、翻訳方法。 - 請求項7に記載の翻訳方法をコンピュータに実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018001414A JP2019121241A (ja) | 2018-01-09 | 2018-01-09 | 翻訳装置、翻訳方法、及びプログラム |
US16/223,173 US10872207B2 (en) | 2018-01-09 | 2018-12-18 | Determining translation similarity of reverse translations for a plurality of languages |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018001414A JP2019121241A (ja) | 2018-01-09 | 2018-01-09 | 翻訳装置、翻訳方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019121241A true JP2019121241A (ja) | 2019-07-22 |
Family
ID=67159785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018001414A Pending JP2019121241A (ja) | 2018-01-09 | 2018-01-09 | 翻訳装置、翻訳方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10872207B2 (ja) |
JP (1) | JP2019121241A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021093113A (ja) * | 2019-12-10 | 2021-06-17 | 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. | 機械翻訳モデルのトレーニング方法、装置およびシステム |
US20220139372A1 (en) * | 2020-11-03 | 2022-05-05 | Florida Power And Light Company | Natural language domain corpus data set creation based on enhanced root utterances |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7246027B2 (ja) * | 2017-12-18 | 2023-03-27 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法、及びプログラム |
JP7170984B2 (ja) * | 2018-03-02 | 2022-11-15 | 国立研究開発法人情報通信研究機構 | 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法 |
US10929617B2 (en) * | 2018-07-20 | 2021-02-23 | International Business Machines Corporation | Text analysis in unsupported languages using backtranslation |
US11216617B2 (en) * | 2018-12-18 | 2022-01-04 | King Fahd University Of Petroleum And Minerals | Methods, computer readable media, and systems for machine translation between Arabic and Arabic sign language |
CN111079449B (zh) * | 2019-12-19 | 2023-04-11 | 北京百度网讯科技有限公司 | 平行语料数据的获取方法、装置、电子设备和存储介质 |
US11586833B2 (en) * | 2020-06-12 | 2023-02-21 | Huawei Technologies Co., Ltd. | System and method for bi-directional translation using sum-product networks |
CN113051937A (zh) * | 2021-03-19 | 2021-06-29 | 北京大米科技有限公司 | 机器纠错方法、装置、电子设备和可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006318202A (ja) * | 2005-05-12 | 2006-11-24 | Suri Kaiseki Kenkyusho:Kk | 翻訳装置、翻訳プログラム及び翻訳システム |
WO2013014877A1 (ja) * | 2011-07-28 | 2013-01-31 | 日本電気株式会社 | 信頼度算出装置、翻訳信頼度算出利用方法および翻訳エンジン用プログラム |
US20140358524A1 (en) * | 2011-11-03 | 2014-12-04 | Rex Partners Oy | Machine translation quality measurement |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5360521A (en) | 1976-11-11 | 1978-05-31 | Fujitsu Ltd | Shift method for discharge spot |
JP2005507524A (ja) * | 2001-10-29 | 2005-03-17 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 機械翻訳 |
JP3919771B2 (ja) * | 2003-09-09 | 2007-05-30 | 株式会社国際電気通信基礎技術研究所 | 機械翻訳システム、その制御装置、及びコンピュータプログラム |
US8849628B2 (en) * | 2011-04-15 | 2014-09-30 | Andrew Nelthropp Lauder | Software application for ranking language translations and methods of use thereof |
US9189476B2 (en) * | 2012-04-04 | 2015-11-17 | Electronics And Telecommunications Research Institute | Translation apparatus and method thereof for helping a user to more easily input a sentence to be translated |
JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
US9342499B2 (en) * | 2013-03-19 | 2016-05-17 | Educational Testing Service | Round-trip translation for automated grammatical error correction |
JP6175900B2 (ja) * | 2013-05-23 | 2017-08-09 | 富士通株式会社 | 翻訳装置、方法、及びプログラム |
JP2016071439A (ja) * | 2014-09-26 | 2016-05-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 翻訳方法及び翻訳システム |
JP2016157252A (ja) | 2015-02-24 | 2016-09-01 | 株式会社ゼンリンデータコム | 多言語翻訳検証装置、多言語翻訳検証方法および多言語翻訳検証プログラム |
JP6649124B2 (ja) | 2015-05-25 | 2020-02-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機械翻訳方法、機械翻訳装置及びプログラム |
US9836457B2 (en) | 2015-05-25 | 2017-12-05 | Panasonic Intellectual Property Corporation Of America | Machine translation method for performing translation between languages |
WO2018055983A1 (ja) * | 2016-09-23 | 2018-03-29 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳システム、および評価サーバ |
US10423665B2 (en) * | 2017-08-02 | 2019-09-24 | Oath Inc. | Method and system for generating a conversational agent by automatic paraphrase generation based on machine translation |
-
2018
- 2018-01-09 JP JP2018001414A patent/JP2019121241A/ja active Pending
- 2018-12-18 US US16/223,173 patent/US10872207B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006318202A (ja) * | 2005-05-12 | 2006-11-24 | Suri Kaiseki Kenkyusho:Kk | 翻訳装置、翻訳プログラム及び翻訳システム |
WO2013014877A1 (ja) * | 2011-07-28 | 2013-01-31 | 日本電気株式会社 | 信頼度算出装置、翻訳信頼度算出利用方法および翻訳エンジン用プログラム |
US20140358524A1 (en) * | 2011-11-03 | 2014-12-04 | Rex Partners Oy | Machine translation quality measurement |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021093113A (ja) * | 2019-12-10 | 2021-06-17 | 北京小米移動軟件有限公司Beijing Xiaomi Mobile Software Co.,Ltd. | 機械翻訳モデルのトレーニング方法、装置およびシステム |
US11734521B2 (en) | 2019-12-10 | 2023-08-22 | Beijing Xiaomi Mobile Software Co., Ltd. | Method, device and storage medium for training bidirectional machine translation model using sum of forward and reverse translation similarities |
US20220139372A1 (en) * | 2020-11-03 | 2022-05-05 | Florida Power And Light Company | Natural language domain corpus data set creation based on enhanced root utterances |
US11664010B2 (en) * | 2020-11-03 | 2023-05-30 | Florida Power & Light Company | Natural language domain corpus data set creation based on enhanced root utterances |
Also Published As
Publication number | Publication date |
---|---|
US20190213261A1 (en) | 2019-07-11 |
US10872207B2 (en) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019121241A (ja) | 翻訳装置、翻訳方法、及びプログラム | |
JP6649124B2 (ja) | 機械翻訳方法、機械翻訳装置及びプログラム | |
JP5280642B2 (ja) | 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US9916306B2 (en) | Statistical linguistic analysis of source content | |
JP6709997B2 (ja) | 翻訳装置、翻訳システム、および評価サーバ | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
KR20130018205A (ko) | 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법 | |
KR20100015958A (ko) | 멀티모드 다국어 입력기 | |
JP7246027B2 (ja) | 翻訳装置、翻訳方法、及びプログラム | |
JP2016071439A (ja) | 翻訳方法及び翻訳システム | |
JP7199061B2 (ja) | 翻訳装置 | |
US11403470B2 (en) | Translation device | |
US9384191B2 (en) | Written language learning using an enhanced input method editor (IME) | |
JP2012159969A (ja) | 機械翻訳装置、方法およびプログラム | |
Kang | Spoken language to sign language translation system based on HamNoSys | |
US20180300021A1 (en) | Text input system with correction facility | |
JP5722375B2 (ja) | 文末表現変換装置、方法、及びプログラム | |
JP5652824B2 (ja) | テキスト入力装置、それを含む翻訳装置、テキスト入力方法及びコンピュータプログラム | |
JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
WO2013136344A2 (en) | Method and system for transliterating text from one language to multiple language scripts | |
Riaz et al. | Echoes in Silence: A Technological Leap for Pakistan Sign Language Translation and Recognition | |
Bellegarda | Multilingual Transliteration for Pan-Indic Keyboard Input | |
Andres et al. | Corpus-based Sequence to Sequence with Luong Attention Mechanism for Ilocano to English Translation | |
Narayanan et al. | Providing Suggestions of Expanded Text from Abbreviated Text Input |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211102 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211105 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220419 |