JP7246027B2 - 翻訳装置、翻訳方法、及びプログラム - Google Patents

翻訳装置、翻訳方法、及びプログラム Download PDF

Info

Publication number
JP7246027B2
JP7246027B2 JP2019560853A JP2019560853A JP7246027B2 JP 7246027 B2 JP7246027 B2 JP 7246027B2 JP 2019560853 A JP2019560853 A JP 2019560853A JP 2019560853 A JP2019560853 A JP 2019560853A JP 7246027 B2 JP7246027 B2 JP 7246027B2
Authority
JP
Japan
Prior art keywords
sentence
translation
translated sentence
translated
proper noun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019560853A
Other languages
English (en)
Other versions
JPWO2019123854A1 (ja
Inventor
鶴 蔡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Publication of JPWO2019123854A1 publication Critical patent/JPWO2019123854A1/ja
Application granted granted Critical
Publication of JP7246027B2 publication Critical patent/JP7246027B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

本開示は、一の言語で入力した文章を他の言語に翻訳する翻訳装置、翻訳方法、及びプログラムに関する。
特許文献1は、翻訳後の文章から未知語を抽出する未知語抽出装置を開示している。この未知語抽出装置は、第1の言語による文章を第2の言語に翻訳して翻訳文を生成し、生成した翻訳文を第2の言語から第1の言語に再翻訳して、再翻訳文に基づいて未知語を抽出している。これにより、翻訳文から未知語を抽出できない場合であっても、未知語を適切に抽出できるようにしている。
特開2015-170093号公報
本開示は、固有名詞の登録の利便性を向上させる翻訳装置、翻訳方法、及びプログラムを提供する。
本開示の翻訳装置は、第1の言語の原文の入力を受ける入力部と、制御部を備える。制御部は、原文を第2の言語に翻訳して生成された第1の翻訳文と第1の翻訳文を第1の言語に翻訳して生成された第1の逆翻訳文を取得する。制御部は、原文から固有名詞候補を抽出し、固有名詞候補の第2の言語の訳語を生成し、固有名詞候補と固有名詞候補の訳語に基づいて原文を第2の言語に翻訳して第2の翻訳文を生成し、固有名詞候補と固有名詞候補の訳語に基づいて第2の翻訳文を第1の言語に翻訳した第2の逆翻訳文を生成する。さらに、翻訳装置は、第1の逆翻訳文及び第2の逆翻訳文を表示する表示部と、第1の逆翻訳文と第2の逆翻訳文のいずれか一方を選択するユーザの操作を受け付ける操作部と、を備える。制御部は、ユーザの選択に応じて、第1の翻訳文と第2の翻訳文のいずれか一方を原文の翻訳文として表示部に表示する。
これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。
本開示の翻訳装置、翻訳方法、及びプログラムによれば、固有名詞の登録の利便性が向上する。例えば、ユーザは、固有名詞を手入力しなくても、翻訳装置が生成した固有名詞の訳語を含む逆翻訳文を承認(選択)又は否認(非選択)することにより、登録したい固有名詞を簡単に登録することができる。
図1は、翻訳装置の外観を示す図である。 図2は、翻訳システムの電気的な構成を示すブロック図である。 図3は、抽出モデルを説明するための図である。 図4は、固有名詞辞書を説明するための図である。 図5は、仮登録情報を説明するための図である。 図6は、代替語辞書を説明するための図である。 図7は、置換情報を説明するための図である。 図8は、翻訳装置の制御部による翻訳処理を示すフローチャートである。 図9は、通常処理による翻訳文の生成処理を示すフローチャートである。 図10は、置換処理による翻訳文の生成処理を示すフローチャートである。 図11は、置換処理の概要を説明するための図である。 図12は、仮登録処理による翻訳文の生成処理を示すフローチャートである。 図13は、固有名詞候補の訳語の生成を説明するための図である。 図14は、仮登録処理における通常処理と置換処理の対比を説明するための図である。 図15は、逆翻訳文の表示画面と選択結果に応じた翻訳文の表示画面の一例を示す図である。 図16は、通常処理による逆翻訳文の生成処理を示すフローチャートである。 図17は、置換処理による逆翻訳文の生成処理を示すフローチャートである。 図18は、翻訳装置の制御部による登録推奨処理を示すフローチャートである。 図19は、登録推奨画面の一例を示す図である。
(本開示の基礎となった知見)
原文に固有名詞が含まれていると、原文が正しく翻訳されない場合がある。翻訳に失敗しないようにするためには、ユーザが、固有名詞とその訳語を翻訳装置に登録することが考えられる。この場合、ユーザによる固有名詞の手入力が必要になる。しかし、ユーザが未登録の固有名詞を把握して、登録すべき固有名詞のみを効率良く入力することは難しい。例えば、第1の言語を話すユーザが第2の言語の翻訳文を理解できない場合、ユーザは、翻訳文を確認しても、固有名詞が正しく翻訳されているか否かを判断することができない。この場合、固有名詞の登録が必要か否かをユーザが判断することは難しい。また、第1の言語を話すユーザが第2の言語の翻訳文を理解できたとしても、翻訳の失敗の原因が固有名詞の登録の有無によるものかどうかを正確に把握することは難しい。よって、この場合も、固有名詞の登録が必要か否かをユーザが正確に判断することは難しい。このように、従来は、未登録の固有名詞を効率良く登録することができなかった。
本開示の翻訳装置は、未登録の固有名詞を効率良く登録することを可能にする。具体的には、本開示の翻訳装置は、原文から固有名詞候補(未登録の固有名詞)を抽出し、抽出した固有名詞候補の訳語を生成して、仮登録情報を生成する。翻訳装置は、仮登録情報を用いた翻訳文及び逆翻訳の生成と、仮登録情報を用いない翻訳文及び逆翻訳文の生成とを行って、両方の逆翻訳文を表示する。これにより、ユーザは、表示された2つの逆翻訳文を見比べることによって、固有名詞候補の登録の要否を容易に判断すると共に、固有名詞候補の訳語を確認することができる。また、翻訳装置は、ユーザによる逆翻訳文の選択の操作に基づいて、仮登録情報を本登録する。すなわち、翻訳装置は、固有名詞候補を固有名詞として登録する。よって、本開示の翻訳装置によれば、ユーザは、登録したい固有名詞とその訳語を手入力することなく、翻訳装置により生成された逆翻訳文を承認(選択)することにより、簡単に固有名詞を登録することができる。
(実施形態)
以下、実施形態について、図面を参照しながら説明する。
1. 構成
1-1. 翻訳装置の外観
図1は、本実施形態にかかる翻訳装置の外観を示す図である。図1に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する翻訳装置である。すなわち、翻訳装置1は、第1の言語から第2の言語への翻訳と、第2の言語から第1の言語への翻訳とを行うことができる。例えば、第1の言語は日本語であり、第2の言語は英語である。以下、日本語を話すホスト(例えば、案内者)と英語を話すゲスト(例えば、旅行者)とが翻訳装置1を介して対面で行う会話を翻訳することを想定して、本実施形態を説明する。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とを備える。マイク10及びスピーカ12は、例えば、翻訳装置1の側面の開口近傍に配置されている。ディスプレイ14及びタッチパネル16は、翻訳装置1の主面に配置されている。ディスプレイ14の長手方向の一方側であるホスト側の領域には、発話アイコン14h及び表示領域15hが配置される。ディスプレイ14の長手方向の他方側であるゲスト側の領域には、発話アイコン14g及び表示領域15gが表示される。各発話アイコン14h、14gに対して、ユーザによるタッチ操作により操作がなされる。
発話アイコン14hは、ホストが発話を行うときに、すなわち、日本語(第1の言語)の発話を翻訳装置1に入力するときに、ホスト本人がホストの発話の開始時点及び終了時点を指定するための操作アイコンである。発話アイコン14gは、ゲストが発話を行うときに、すなわち、英語(第2の言語)の発話を入力するときに、ゲスト本人がゲストの発話の開始時点及び終了時点を指定するための操作アイコンである。表示領域15h、15gは、発話文、翻訳文、及び逆翻訳文等を文字列として表示するための領域である。
1-2. 翻訳装置及びサーバの構成
図2は、本実施形態にかかる翻訳システムの電気的な構成を示すブロック図である。本開示の翻訳システム100は、図1に示す翻訳装置1、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5を有する。翻訳装置1は、インターネットのようなネットワーク2を介して、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5のそれぞれとデータ通信を行う。
音声認識サーバ3は、翻訳装置1からネットワーク2を介してデジタル音声データを受信し、受信したデジタル音声データを音声認識して、発話文のテキストデータ(文字列の音声認識データ)を生成するサーバである。
翻訳サーバ4は、日本語から英語及び英語から日本語への翻訳機能を有する翻訳エンジンを搭載している。翻訳サーバ4は、翻訳装置1からネットワーク2を介して、発話文のテキストデータを受信し、受信した発話文のテキストデータを翻訳して、翻訳文のテキストデータ(文字列の翻訳データ)を生成する。また、翻訳サーバ4は、翻訳装置1からネットワーク2を介して、翻訳文のテキストデータを受信し、受信した翻訳文のテキストデータを逆翻訳して、逆翻訳文のテキストデータ(文字列の逆翻訳データ)を生成する。翻訳サーバ4は、第1の言語から第2の言語への翻訳機能及び第2の言語から第1の言語への翻訳機能を有する外部装置の一例である。
音声合成サーバ5は、翻訳装置1からネットワーク2を介して、翻訳文のテキストデータを受信し、受信した翻訳文のテキストデータを音声合成して、音声信号を生成するサーバである。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とに加えて、通信部18と、記憶部20と、制御部22とを備える。
マイク10は、音声をデジタル音声データに変換する装置である。具体的には、マイク10は、音声を音声信号(アナログ電気信号)に変換し、さらに、AD変換器により音声信号をデジタル音声データに変換する。マイク10は、発話(音声)又は発話文(テキスト)を翻訳装置1に入力する入力部の一例である。
通信部18は、Bluetooth(登録商標)、Wi-Fi(登録商標)、3G、LTE(登録商標)、IEEE802.11等の通信方式に従って、ネットワーク2を介して音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5とデータ通信を行う通信モジュールである。
記憶部20は、フラッシュメモリ、強誘電体メモリ、HDD、SSD、RAM、及びこれらの組み合わせなどで構成される記録媒体である。記憶部20は、デジタル音声データ、発話文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータを格納する。また、記憶部20は、制御部22のための各種プログラムを格納している。
さらに、本実施形態において、記憶部20は、抽出モデル情報31、固有名詞辞書32、仮登録情報33、代替語辞書34、及び置換情報35を格納する。抽出モデル情報31は、原文から固有名詞を抽出する抽出モデルを示す情報である。固有名詞辞書32は、第1の言語の固有名詞と固有名詞の第2の言語による訳語とを対応付けた情報である。仮登録情報33は、第1の言語の固有名詞候補と固有名詞候補の第2の言語による訳語とを対応付けた情報である。本明細書において、固有名詞辞書32に登録されていない固有名詞を「固有名詞候補」と称する。代替語辞書34は、翻訳時に固有名詞又は固有名詞候補の代わりに使用される用語である代替語を含む情報である。置換情報35は、置き換え前の用語と置き換え後の用語との対応付けを示す情報である。
制御部22は、CPU、MPU等で構成され、記憶部20に格納された各種プログラムを実行することにより、翻訳装置1の全体の動作を制御する。制御部22は、記憶部20に格納されたデータやプログラムを読み出して種々の演算処理を行うことで、所定の機能を実現する。本実施形態では、制御部22の機能は、ハードウェアとソフトウェアの協同により実現する。また、所定の機能を実現するように専用に設計されたハードウェア回路のみで、制御部22を実現してもよい。すなわち、制御部22は、CPU、MPUのみならず、DSP、FPGA、ASIC等で構成することができる。
スピーカ12は、電気信号を音声に変換する装置である。スピーカ12は、制御部22からの音声信号(電気信号)に基づいた音声を出力する。スピーカ12は、翻訳結果の音声又はテキストを外部に出力する出力部の一例である。
ディスプレイ14は、画像を表示する装置であり、液晶表示デバイスまたは有機EL表示デバイスで構成される。ディスプレイ14は、表示領域15h、15gにおいて、制御部22からの、発話文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータが示す画像を表示する。ディスプレイ14は、発話文のテキストデータ、翻訳文のテキストデータ、及び逆翻訳文のテキストデータをホスト又はゲストに対して表示する表示部の一例である。また、ディスプレイ14は上述した発話アイコン14h、14gを表示する。
タッチパネル16は、ユーザが操作する操作部の一例であり、ユーザからの指示を受け付ける。タッチパネル16はディスプレイ14に重畳して配置されている。翻訳装置1は、操作部として、タッチパネル16に限らず、キーボード、ボタン、スイッチ、及びこれらの組み合わせを備えてもよい。
1-3. 各種情報
図3から図7を参照して、記憶部20に格納される、抽出モデル情報31、固有名詞辞書32、仮登録情報33、代替語辞書34、及び置換情報35について説明する。
図3は、抽出モデルを説明するための図である。抽出モデルは、文章の句構造と単語構造を解析することによって文章から固有名詞を抽出するモデルである。翻訳装置1は、抽出モデルを示す抽出モデル情報31を予め記憶部20に格納しておく。抽出モデルは、例えば、モデル生成装置によって生成される。このモデル生成装置は、翻訳装置1とは別の装置(例えば、サーバ)であってもよいし、翻訳装置1であってもよい。モデル生成装置は、予め固有名詞のテキストデータ及び固有名詞を含む文章のテキストデータを学習用データとして使用して、抽出モデルを生成する。例えば、抽出モデルの生成において、モデル生成装置は、固有名詞の形態素などの情報に基づいて固有名詞の単語構造を解析して、固有名詞になる部分の特徴を学習する。例えば、普通名詞が連続している場合は固有名詞である可能性があると学習する。これにより、モデル生成装置は、固有名詞になる部分の特徴を示す固有名詞形態素情報を生成する。さらに、モデル生成装置は、文章の句全体の構造を解析することによって、名詞の前後に現れる情報の確率分布を学習する。例えば、名詞の前後に「は」、「に」等の単語がある確率を学習する。これにより、モデル生成装置は、固有名詞を含む句の特徴を示す句構造解析情報を生成する。そして、モデル生成装置は、固有名詞形態素情報と句構造解析情報の比重を決定して、抽出モデルを生成する。翻訳装置1は、翻訳時における固有名詞の抽出を、抽出モデル情報31を使用して行う。これにより、例えば、ホストが発話文ST1(「近畿経済産業局はあちらです。」)と発話すると、抽出モデルにより、句構造と単語構造が解析されて、固有名詞候補N1(「近畿経済産業局」)が抽出される。
図4は、固有名詞辞書32の一例を示している。固有名詞辞書32は、固有名詞の第1の言語(日本語)と第2の言語(英語)の対訳を登録したものである。固有名詞辞書32は、さらに、固有名詞のクラスを示す情報であるクラス名を含む。クラスは、固有名詞の用語を分類するものであって、用語が示す対象のカテゴリ(ジャンル)である。クラスは、例えば、地名、人名を含む。本明細書において、「固有名詞」、「固有名詞の訳語」、及び「クラス名」をまとめて「固有名詞に関する情報」とも称する。
図5は、仮登録情報33を説明するための図である。仮登録情報33は、固有名詞候補の第1の言語(日本語)と第2の言語(英語)の対訳を登録したものである。仮登録情報33は、さらに、固有名詞候補のクラスを示す情報であるクラス名を含む。クラスは、固有名詞候補の用語を分類するものであって、用語が示す対象のカテゴリ(ジャンル)である。クラスは、例えば、地名、人名を含む。本明細書において、「固有名詞候補」、「固有名詞候補の訳語」、及び「クラス名」をまとめて「固有名詞候補に関する情報」とも称する。
図6は、代替語辞書34の一例を示している。代替語辞書34は、翻訳時に固有名詞又は固有名詞候補の代わりに使用される代替語を含む。代替語辞書34に含まれる代替語は、翻訳エンジンにおいて正確に翻訳される一般的な用語である。代替語辞書34に含まれる代替語は、単語及び語句を含む。例えば、代替語辞書34は、普通名詞を含む。代替語辞書34に含まれる用語は、複数の言語(本実施形態において、日本語及び英語)の対訳で記載される。本明細書において、代替語辞書34内の複数の言語の対訳で記載された用語のうち、発話者の言語で記載された用語を「代替語」と呼び、翻訳される言語で記載された用語を「代替語の訳語」と呼ぶ。代替語辞書34は、各クラスにつき、1つ以上の代替語とその訳語とを含む。
図7は、置換情報35の一例を示している。置換情報35は、置き換え前の用語と置き換え後の用語とが対応付けられたものである。置換情報35は、置換処理により翻訳文を生成するときに生成される。
2. 動作
2-1. 翻訳処理
以上のように構成された翻訳システム100の動作について、図8を参照して説明する。図8は、翻訳装置1の制御部22による動作を示している。図8においては、マイク10から入力した発話者の音声に対応する発話文を原文として翻訳する例について説明する。
翻訳装置1の制御部22は、マイク10を介して、発話者の発話(音声)に応じたデジタル音声データを入力する(S1)。すなわち、マイク10は、発話文の入力を受ける。制御部22は、デジタル音声データを、ネットワーク2を介して音声認識サーバ3に送信する(S2)。音声認識サーバ3は、受信したデジタル音声データを音声認識して、発話文のテキストデータを生成する。翻訳装置1の制御部22は、音声認識サーバ3からネットワーク2を介して、発話文のテキストデータを受信する(S3)。
制御部22は、発話文内において固有名詞を検索し(S4)、発話文内に固有名詞があるか否かを判断する(S5)。具体的には、抽出モデル情報31を使用して、発話文(原文)のテキストデータから固有名詞を抽出する。例えば図3に示すように、発話文が文章ST1の場合、抽出モデルにより、固有名詞候補N1が固有名詞として抽出される。
発話文内に固有名詞がなければ(S5でNo)、制御部22は、通常処理により翻訳文を生成する(S6)。発話文内に固有名詞があれば(S5でYes)、制御部22はその固有名詞が固有名詞辞書32に登録されているか否かを判断する(S7)。固有名詞が固有名詞辞書32に登録されていれば(S7でYes)、制御部22は置換処理により翻訳文を生成する(S8)。固有名詞が固有名詞辞書32に登録されていなければ(S7でNo)、制御部22は仮登録処理により翻訳文を生成する(S9)。
制御部22は、ステップS6、S8、又はS9によって生成した翻訳文をディスプレイ14に表示する(S10)。制御部22は、翻訳文の表示と同時に、翻訳文を音声で出力してもよい。この場合、制御部22は、ステップS6、S8、又はS9によって生成された翻訳文のテキストデータを、ネットワーク2を介して、音声合成サーバ5に送信する。音声合成サーバ5は、翻訳装置1から受信した翻訳文のテキストデータに基づき、音声合成を行って音声信号を生成し、ネットワーク2を介して翻訳装置1に音声信号を送信する。制御部22は、音声合成サーバ5から受信した音声信号に基づき、スピーカ12から翻訳結果を示す音声を出力する。
2-2.通常処理による翻訳文の生成
図9を参照して、通常処理による翻訳文の生成について説明する。図9は、通常処理による翻訳文の生成処理(図8のステップS6の詳細)を示している。翻訳装置1の制御部22は、発話文内に固有名詞が含まれていない場合に、図9に示す通常処理による翻訳文の生成を行う。まず、制御部22は、発話文のテキストデータを、ネットワーク2を介して、翻訳サーバ4に送信する(S601)。翻訳サーバ4は、第1の言語の発話文を第2の言語に翻訳して、翻訳文のテキストデータを生成する。翻訳サーバ4は、翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1は、翻訳サーバ4からネットワーク2を介して、翻訳文のテキストデータを受信する(S602)。例えば、翻訳装置1は、通常処理では、発話文(「東京駅はあちらです。」)を翻訳サーバ4に送信して、翻訳サーバ4から翻訳文(「Tokyo Station is over there.」)を受信する。
2-3.置換処理による翻訳文の生成
図10及び図11を参照して、置換処理による翻訳文の生成について説明する。図10は、置換処理による翻訳文の生成処理(図8のステップS8の詳細)を示している。図11は、置換処理による翻訳文の生成の概要を示している。翻訳装置1の制御部22は、発話文内に含まれる固有名詞が固有名詞辞書32に登録されている場合に、図10に示す置換処理による翻訳文の生成を行う。
まず、翻訳装置1の制御部22は、発話文の中の固有名詞を代替語に置換する(S801)。例えば、制御部22は、発話文ST2(「天神社はあちらです。」)に含まれる固有名詞N2(「天神社」)を代替語に置換する。このとき、制御部22は、固有名詞をクラスに応じた代替語に置換する。図4に示すように、固有名詞辞書32に登録されている固有名詞N2の用語が属するクラスは「地名」である。また、図6に示すように、代替語辞書34には、クラス「地名」に属する代替語N3(「東京駅」)が登録されている。よって、制御部22は、クラス「地名」に基づいて、代替語辞書34から代替語N3を選択する。図11の(1)から(2)に示すように、制御部22は、発話文ST2の文中の固有名詞N2の文字を代替語N3に置き換える。
制御部22は、固有名詞と置き換え後の代替語とを対応付けて置換情報35として記録する(S802)。例えば、図7の置換情報35に示すように、固有名詞N2が置き換え前の用語として記録され、代替語N3が置き換え後の用語として記録される。
制御部22は、ネットワーク2を介して、置換後の発話文のテキストデータを翻訳サーバ4に送信する(S803)。ここでは、代替語N3を含む代替文ST3(「東京駅はあちらです。」)が送信される。翻訳サーバ4は、受信した発話文のテキストデータを翻訳して、翻訳文のテキストデータを生成する。図11の(2)から(3)に示すように、翻訳サーバ4は、代替文ST3を「Tokyo Station is over there.」に翻訳する。翻訳サーバ4は、翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1の制御部22は、翻訳サーバ4からネットワーク2を介して、翻訳文のテキストデータを受信する(S804)。
制御部22は、翻訳文内における代替語の訳語を固有名詞の訳語に復元する(S805)。これにより、図11の(3)から(4)に示すように、「Tokyo Station is over there.」が「Ten Temple is over there.」に復元される。具体的には、まず、制御部22は、図7に示す置換情報35の置き換え後の代替語N3に基づいて、図6に示す代替語辞書34から訳語の「Tokyo Station」を読み出す。また、制御部22は、置換情報35の置き換え前の固有名詞N2に基づいて、図4に示す固有名詞辞書32から訳語の「Ten Temple」を読み出す。それから、制御部22は、翻訳文中の「Tokyo Station」を「Ten Temple」に置き換える。
2-4.仮登録処理による翻訳文の生成
図12~図15を参照して、仮登録処理による翻訳文の生成について具体的に説明する。
図12は、仮登録処理による翻訳文の生成処理(図8のステップS9の詳細)を示している。翻訳装置1の制御部22は、発話文内に含まれる固有名詞が固有名詞辞書32に登録されていない場合に、図12に示す仮登録処理による翻訳文の生成を行う。
まず、翻訳装置1の制御部22は、図8のステップS4の検索によって見つかった固有名詞候補(未登録の固有名詞)の訳語を生成して、固有名詞候補に関する情報を仮登録情報33に登録する(S901)。すなわち、制御部22は、固有名詞候補、固有名詞候補の訳語、及びクラス名を仮登録情報33に登録する。
図13を参照して、固有名詞候補の訳語の生成について説明する。具体的には、まず、制御部22は、固有名詞候補を形態素解析して、固有名詞候補を複数の名詞に分割する。これにより、固有名詞候補N1は、例えば、名詞N11(「近畿」)、名詞N12(「経済」)、名詞N13(「産業」)、名詞N14(「局」)に分割される。そして、制御部22は、それぞれの名詞の訳語を生成する。例えば、名詞N11~N14のそれぞれの訳語「Kinki」、「Economy」、「Industry」、「Bureau」を生成する。固有名詞候補を構成する各名詞の訳語の生成は、同一の方法で行ってもよいし、異なる方法で行ってもよい。一例では、翻訳装置1の記憶部20に、第1の言語と第2の言語の対訳を含む用語の辞書を格納しておき、翻訳装置1の制御部22がその辞書に基づいて固有名詞候補の訳語を生成する。別の例では、固有名詞候補に一般名詞及び地名が含まれる場合は、翻訳サーバ4に一般名詞及び地名のテキストデータを送信して、翻訳サーバ4から一般名詞及び地名の翻訳結果を取得する。さらに、固有名詞候補に一般名詞及び地名とは異なる特有部分が含まれる場合は、翻訳装置1の制御部22がその特有部分を読み音のアルファベットに変換する。制御部22は、各名詞の翻訳結果を結合して、固有名詞候補の訳語を生成する。図13の場合、固有名詞候補N1の訳語として「Kinki Economy Industry Bureau」を生成する。そして、制御部22は、固有名詞候補とその訳語を仮登録情報33に登録する。このとき、制御部22は、固有名詞候補を構成する用語からクラスを識別して、クラス名についても仮登録情報33に登録する。
制御部22は、通常処理により、第1の言語の発話文(原文)を第2に言語に翻訳して翻訳文を生成する(S902)。通常処理による翻訳文の生成は、上述したように図9に示すステップS601及びS602によって行う。制御部22は、通常処理により、生成した翻訳文を第1言語に再度翻訳して逆翻訳文を生成する(S903)。通常処理による逆翻訳文の生成の詳細については後述する。
制御部22は、仮登録情報33を使用して、置換処理により、第1の言語の発話文(原文)を第2に言語に翻訳して翻訳文を生成する(S904)。置換処理による翻訳文の生成は、上述したように図10に示すステップS801~S805によって行う。この場合、発話文に含まれる固有名詞候補がクラスに応じた代替語に置換される。制御部22は、置換処理により、生成した翻訳文を第1の言語に再度翻訳して逆翻訳文を生成する(S905)。置換処理による逆翻訳文の生成の詳細については後述する。
ステップS902~S905に示すように、仮登録処理においては、通常処理と置換処理の両方で、原文を翻訳して翻訳文を生成し、さらにその翻訳文を第1言語に戻すことによって逆翻訳文を生成する。
図14を参照して、ステップS902~S905に示す通常処理と置換処理によって生成される翻訳文及び逆翻訳文の具体例について説明する。図14は、通常処理と置換処理による翻訳文及び逆翻訳文の対比を示している。通常処理P1においては、原文(発話文)がそのまま翻訳されて翻訳文が生成される。例えば、発話者(ホスト)が発話文ST1と発話すると、発話文ST1というテキスト(発話文)が翻訳サーバ4の翻訳エンジンにおいて「Close the industry office is over there.」のテキスト(翻訳文)に翻訳される。また、逆翻訳文を生成する場合は、翻訳文がそのまま、翻訳エンジンにおいて元の言語に翻訳される。これにより、逆翻訳文ST4(「業界の近くの営業所はあちらです。」)のテキストが得られる。
置換処理P2においては、例えば、発話者(ホスト)が発話文ST1と発話すると、原文(発話文)中の固有名詞候補が代替語に置き換えられてから、翻訳される。ここでは、固有名詞候補N1のクラス「地名」に基づいて、代替語辞書34から代替語N3が選択されて、発話文中の固有名詞候補N1が代替語N3に置き換えられる。この場合、固有名詞候補N1と代替語N3とが対応付けられて置換情報35として記録される。そして、代替文ST3というテキストが翻訳サーバ4の翻訳エンジンにおいて、代替翻訳文として「Tokyo Station is over there.」のテキストに翻訳される。翻訳装置1は、仮登録情報33、代替語辞書34、及び置換情報35に基づいて、代替語N3の訳語である「Tokyo Station」を、固有名詞候補N1の訳語である「Kinki Economy Industry Bureau」に置き換える。これにより、翻訳文として「Kinki Economy Industry Bureau is over there.」が得られる。逆翻訳文を生成する場合は、翻訳文中の「Kinki Economy Industry Bureau」が「Tokyo Station」に再度置き換えられて、代替翻訳文の「Tokyo Station is over there.」というテキストが翻訳エンジンにおいて元の言語に戻される。これにより、代替逆翻訳文ST5(「東京駅はあちらです。」)というテキストが得られる。翻訳装置1は、置換情報35に基づいて、得られたテキスト内の代替語N3を固有名詞候補N1に復元することによって、逆翻訳文ST6(「近畿経済産業局はあちらです。」)を生成する。逆翻訳文を生成するとき、上述したように翻訳文中の「Kinki Economy Industry Bureau」を「Tokyo Station」に再度置き換えて代替翻訳文(置換処理P2の(5))を作成してもよいし、翻訳エンジンで翻訳された代替翻訳文(置換処理P2の(3))をそのまま使用してもよい。
図14に示すように、同一の発話文であっても、通常処理P1と置換処理P2とでは、生成される翻訳文及び逆翻訳文が異なる場合が生じる。
制御部22は、通常処理と置換処理によって生成された逆翻訳文をホスト側の表示領域15hに表示する(S906)。図15は、逆翻訳文の表示画面50の一例と、逆翻訳文(A)が選択されたときの翻訳文の表示画面51の一例を示している。図15の表示画面50に示すように、制御部22は、置換処理によって生成された逆翻訳文(A)と通常処理によって生成された逆翻訳文(B)を発話者(ホスト)側の表示領域15hに表示する。さらに、制御部22は、逆翻訳文(A)及び(B)のいずれが正しいかを問い合わせる文を表示領域15hに表示する。また、タッチパネル16上に逆翻訳文(A)及び(B)を選択するための選択アイコン41及び選択アイコン42を表示する。これにより、ホストは、選択アイコン41又は選択アイコン42を選択することによって、発話と同一又は類似している逆翻訳文を逆翻訳文(A)及び(B)の中から選択することができる。
制御部22は、発話者(ホスト)によって置換処理による逆翻訳文が選択されたか否かを判断する(S907)。置換処理による逆翻訳文が選択された場合(S907でYes)、制御部22は、置換処理によって生成された翻訳文を表示用翻訳文に決定する(S908)。通常処理による逆翻訳文が選択された場合(S907でNo)、制御部22は、通常処理によって生成された翻訳文を表示用翻訳文に決定する(S909)。また、通常処理による逆翻訳文が選択された場合は、制御部22は、ステップS901において仮登録情報33に登録した固有名詞候補、訳語、及びクラス名を仮登録情報33から削除する(S910)。
ステップS908又はステップS909において、表示用翻訳文として決定された翻訳文はゲスト側の表示領域15gに表示される(図8のS10)。例えば、図15に示すように、ホストが選択アイコン41にタッチ操作して置換処理によって生成された逆翻訳文(A)を選択したときは、置換処理によって生成された翻訳文の「Kinki Economy Industry Bureau is over there.」がゲスト側の表示領域15gに表示される。
2-5.通常処理による逆翻訳文の生成
図16を参照して、通常処理による逆翻訳文の生成について説明する。図16は、通常処理による逆翻訳文の生成処理(図12のステップS903の詳細)を示している。翻訳装置1の制御部22は、翻訳文のテキストデータを、ネットワーク2を介して、翻訳サーバ4に送信する(S931)。翻訳サーバ4は、第2の言語の翻訳文を第1の言語に翻訳して、逆翻訳文のテキストデータを生成する。翻訳サーバ4は、逆翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1の制御部22は、翻訳サーバ4からネットワーク2を介して、逆翻訳文のテキストデータを受信する(S932)。
2-6.置換処理による逆翻訳文の生成
図17を参照して、置換処理による逆翻訳文の生成について説明する。図17は、置換処理による逆翻訳文の生成処理(図12のステップS905の詳細)を示している。制御部22は、置換情報35に基づいて、翻訳文内における固有名詞候補の訳語を代替語の訳語に置換する(S951)。具体的には、制御部22は、置換情報35の置き換え後の代替語N3に基づいて、代替語辞書34から訳語の「Tokyo Station」を読み出す。それから、制御部22は、翻訳文「Kinki Economy Industry Bureau is over there.」の中の「Kinki Economy Industry Bureau」を「Tokyo Station」に変換する。翻訳装置1の制御部22は、置換後の翻訳文のテキストデータを、ネットワーク2を介して、翻訳サーバ4に送信する(S952)。なお、図10のステップS804において受信した翻訳文(代替翻訳文)の「Tokyo Station is over there.」を翻訳サーバ4に送信してもよい。この場合は、ステップS951を省略する。翻訳サーバ4は、第2の言語の翻訳文を第1の言語に翻訳して、逆翻訳文のテキストデータを生成する。翻訳サーバ4は、逆翻訳文のテキストデータを、ネットワーク2を介して、翻訳装置1に送信する。翻訳装置1の制御部22は、翻訳サーバ4からネットワーク2を介して、逆翻訳文のテキストデータを受信する(S953)。ここでは、代替逆翻訳文ST5を受信する。制御部22は、置換情報35に基づいて、逆翻訳文中の代替語を固有名詞候補に復元する(S954)。ここでは、代替語N3が固有名詞候補N1に復元される。
2-7.固有名詞候補の本登録処理
図18及び図19を参照して、固有名詞候補の本登録について説明する。図18は、翻訳装置1の制御部22による登録推奨処理を示している。図19は、登録推奨画面の一例を示している。登録推奨処理は、ユーザにより逆翻訳文の選択が行われた後(図12のステップS907の後)に行われる。具体的には、登録推奨処理は、例えば、翻訳文が表示された後(図8のステップS10の後)であって、ホストとゲストとの対話がされていないときに行われる。
制御部22は、記憶部20から仮登録情報33を読み出す(S11)。制御部22は、読み出した仮登録情報33に基づいて、固有名詞候補の登録推奨画面をディスプレイ14に表示する(S12)。登録推奨画面は、固有名詞候補の登録の要否を問い合わせる画面である。例えば、図19に示すように、登録推奨画面52は、仮登録情報33に登録されている固有名詞候補及びその訳語のリストと、各固有名詞候補を選択するためのチェックボックスと、固有名詞候補の登録の要否を決定するための「はい」アイコン43及び「いいえ」アイコン44とを含む。固有名詞候補及びその訳語のリストはホスト側の表示領域15hに表示される。固有名詞候補の登録の要否を決定するアイコン43、44はタッチパネル16上のホスト側に表示される。
制御部22は、登録が選択されたか否かを判断する(S13)。例えば、制御部22は、図19において、1つ以上の固有名詞候補が選択された状態で、登録を指示する「はい」アイコン43が選択されたか否かを判断する。登録が選択された場合(S13でYes)、制御部22は、登録が選択された固有名詞候補に関する情報を固有名詞辞書32に登録する(S14)。具体的には、例えば、仮登録情報33に基づいて、選択された固有名詞候補と、固有名詞候補の訳語及びクラス名を固有名詞辞書32に登録する。そして、仮登録情報33を記憶部20から削除する(S15)。登録する固有名詞候補が一つも選択されなかった場合(S13でNo)は、ステップS14を実行せずに、仮登録情報33を削除する(S15)。例えば、図19において、「いいえ」アイコン44が選択された場合は、固有名詞候補に関する情報を固有名詞辞書32に登録せずに、仮登録情報33を削除する。
以上により、ホストは、表示された固有名詞候補とその訳語のリストを確認して、登録したい固有名詞候補を選択して、登録を決定するためのアイコン43を選択するだけで、固有名詞候補を固有名詞辞書32に登録することができる。
3. 効果等
本実施形態の翻訳装置1は、固有名詞(置換対象の用語の一例)を示す固有名詞辞書32(登録情報の一例)を使用して翻訳する。翻訳装置1は、第1の言語の原文を入力するマイク10(入力部の一例)と、固有名詞辞書32を格納する記憶部20と、制御部22を備える。制御部22は、原文を第2の言語に翻訳した第1の翻訳文と第1の翻訳文を第1の言語に翻訳した第1の逆翻訳文を生成すると共に、原文から固有名詞候補を抽出し、固有名詞候補の第2の言語による訳語を生成して、固有名詞候補と固有名詞候補の訳語とを対応付けた仮登録情報33を生成し、仮登録情報33に基づいて原文を第2の言語に翻訳した第2の翻訳文と第2の翻訳文を第1の言語に翻訳した第2の逆翻訳文を生成する。さらに、翻訳装置1は、第1の逆翻訳文及び第2の逆翻訳文を表示するディスプレイ14(表示部の一例)と、第2の逆翻訳文を選択するか否かのユーザの操作を受け付けるタッチパネル16(操作部の一例)と、を備える。制御部22は、ユーザが第2の逆翻訳文を選択した場合に、固有名詞候補を新たな固有名詞として、仮登録情報33に基づいて、固有名詞候補及び固有名詞候補の訳語を固有名詞辞書32に登録する。
具体的には、制御部22は、ユーザが第2の逆翻訳文を選択した場合、固有名詞候補を登録するか否かを問い合わせる画面(例えば、登録推奨画面52)をディスプレイ14に表示させる。そして、制御部22は、タッチパネル16を介して、ユーザからの登録の指示を受けたときに、固有名詞候補及び固有名詞候補の訳語を固有名詞辞書32に登録する。
これにより、ユーザは、固有名詞候補を含む原文の逆翻訳文を確認した後、固有名詞候補を登録するか否かを選択するだけで、固有名詞候補を固有名詞辞書32に登録することができる。よって、ユーザは、未登録の固有名詞を手入力する必要性がなくなる。よって、本開示の翻訳装置1によれば、未登録の固有名詞を登録するときの利便性が向上する。
制御部22は、ユーザが第1の逆翻訳文を選択したときは、第1の翻訳文を原文の翻訳文としてディスプレイ14に表示し、ユーザが第2の逆翻訳文を選択したときは、第2の翻訳文を原文の翻訳文としてディスプレイ14に表示する。
これにより、ユーザの第1の逆翻訳文又は第2の逆翻訳文の選択に応じて、翻訳結果として表示する翻訳文を第1の翻訳文と第2の翻訳文の中から選択することができる。よって、固有名詞が原文に含まれていても、精度の良い翻訳文を表示することができる。
また、本実施形態の翻訳装置1は、マイク10と、制御部22と、ディスプレイ14と、タッチパネル16を備える。マイク10は、第1の言語の原文の入力を受ける。制御部22は、原文を第2の言語に翻訳して生成された第1の翻訳文と第1の翻訳文を第1の言語に翻訳して生成された第1の逆翻訳文を取得する。制御部22は、原文から固有名詞候補を抽出し、固有名詞候補の第2の言語の訳語を生成し、固有名詞候補と固有名詞候補の訳語に基づいて原文を第2の言語に翻訳して第2の翻訳文を生成し、固有名詞候補と固有名詞候補の訳語に基づいて第2の翻訳文を第1の言語に翻訳して第2の逆翻訳文を生成する。ディスプレイ14は、第1の逆翻訳文及び第2の逆翻訳文を表示する。タッチパネル16は、第1の逆翻訳文と第2の逆翻訳文のいずれか一方を選択するユーザの操作を受け付ける。制御部22は、ユーザの選択に応じて、第1の翻訳文と第2の翻訳文のいずれか一方を原文の翻訳文としてディスプレイ14に表示する。
これにより、ユーザの第1の逆翻訳文又は第2の逆翻訳文の選択に応じて、翻訳結果として表示する翻訳文が第1の翻訳文と第2の翻訳文の中から選択される。よって、より原文に近い翻訳文を表示することができる。よって、固有名詞が原文に含まれていても、精度の良い翻訳文を表示することができる。
(他の実施形態)
以上のように、本出願において開示する技術の例示として、上記実施形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施形態にも適用可能である。そこで、以下、他の実施形態を例示する。
上記実施形態においては、図19に示すような登録推奨画面52を表示して、発話者が固有名詞候補の登録を選択したときに、固有名詞候補及びその訳語を固有名詞辞書32に登録した。しかし、固有名詞候補及びその訳語の固有名詞辞書32への登録のタイミングは上記実施形態に限定しない。登録推奨画面52を表示せずに、固有名詞候補及その訳語を固有名詞辞書32に登録してもよい。例えば、図15に示すような置換処理と通常処理の逆翻訳文のいずれかを選択させる画面50を表示して、置換処理による逆翻訳文が選択されたとき(図12のステップS907でYES)に、固有名詞候補及びその訳語を固有名詞辞書32に登録してもよい。これにより、ユーザが固有名詞の登録を自ら意識しなくても、固有名詞候補が新たな固有名詞として登録される。よって、固有名詞の登録における利便性が向上する。
上記実施形態においては、翻訳文が表示された後(図8のステップS10の後)に登録推奨画面52を表示する例について説明した。しかし、仮登録情報33を生成した後であれば、任意のタイミングで登録推奨画面52を表示してもよい。例えば、置換処理と通常処理による逆翻訳文のいずれかを選択させる画面50を表示する前又は翻訳文を表示する前に、仮登録情報33に基づいて登録推奨画面52を表示してもよい。
上記実施形態においては、図15に示すように、逆翻訳文を表示したときに、置換処理によって生成された逆翻訳文(A)と通常処理によって生成された逆翻訳文(B)のいずれか一方をユーザに選択させた。しかし、ユーザが、逆翻訳文(A)及び(B)の両方ともを非選択にできるようにしてもよい。例えば、逆翻訳文(A)及び(B)の選択アイコン41及び42に加えて、原文の再入力を行うための再入力アイコンを表示してもよい。これにより、通常処理によって生成された逆翻訳文と置換処理によって生成された逆翻訳文のいずれもが原文と異なる場合に、ユーザは発話をやり直すことができる。ユーザが、このような再入力アイコンを選択したときは、仮登録情報33から図12のステップS901で登録した固有名詞候補を削除する。すなわち、図12のステップS907でNoの後、ステップS909を実行せずに、ステップS910を実行する。
上記実施形態においては、固有名詞辞書32に含まれる用語が発話文に含まれる場合に置換処理によって翻訳される例について説明した。しかし、置換対象となる用語は固有名詞に限らない。固有名詞以外の用語(単語又は語句)が置換対象であってもよい。この場合、置換対象の用語及びその訳語とクラス名とを含む登録辞書(登録情報の一例)を記憶部20に格納してもよい。登録辞書と固有名詞辞書32を一つの辞書に統一してもよいし、登録辞書と固有名詞辞書32とを併用してもよい。
上記実施形態においては、仮登録処理による翻訳文の生成において、通常処理と置換処理の両方で翻訳文及び逆翻訳文を生成した。しかし、仮登録処理による翻訳文の生成において、置換処理のみによる翻訳文及び逆翻訳文の生成を行ってもよい。
上記実施形態において、翻訳装置1は、マイク10で入力した発話(音声)に対応する発話文を翻訳したが、キーボードやマウスなどにより、発話以外で入力した入力文を翻訳してもよい。
上記実施形態では、音声認識を音声認識サーバ3で行い、翻訳を翻訳サーバ4で行い、音声合成を音声合成サーバ5で行った。しかし、本開示はこれに限定されない。音声認識、翻訳及び音声合成の少なくとも一つの処理を翻訳装置1内で行ってもよい。例えば、翻訳装置1(端末)に、音声認識サーバ3、翻訳サーバ4、及び音声合成サーバ5と同一の機能を全て搭載して、翻訳装置1のみで翻訳に関連する全ての処理を行うようにしてもよい。この場合、翻訳装置1は、通信部18を有さなくてもよい。すなわち、翻訳装置1の制御部22は、翻訳装置1が翻訳または逆翻訳して生成した文章を取得してもよい。
上記実施形態では、日本語と英語の間の翻訳の例を示した。しかし、翻訳対象とする言語は、日本語及び英語に限定されず、他の言語(中国語、独語、仏語、スペイン語、韓国語、タイ語、ベトナム語、インドネシア語等)でもよい。
(実施形態の概要)
(1)本開示の翻訳装置は、置換対象の用語を示す登録情報を使用して翻訳する翻訳装置であって、第1の言語の原文を入力する入力部と、登録情報を格納する記憶部と、制御部を備える。制御部は、原文を第2の言語に翻訳した第1の翻訳文と第1の翻訳文を第1の言語に翻訳した第1の逆翻訳文を生成すると共に、原文から固有名詞候補を抽出し、固有名詞候補の第2の言語による訳語を生成して、固有名詞候補と固有名詞候補の訳語とを対応付けた仮登録情報を生成し、仮登録情報に基づいて原文を第2の言語に翻訳した第2の翻訳文と第2の翻訳文を第1の言語に翻訳した第2の逆翻訳文を生成する。さらに、翻訳装置は、第1の逆翻訳文及び第2の逆翻訳文を表示する表示部と、第2の逆翻訳文を選択するか否かのユーザの操作を受け付ける操作部と、を備える。制御部は、ユーザが第2の逆翻訳文を選択した場合に、固有名詞候補を新たな置換対象の用語として、仮登録情報に基づいて、固有名詞候補及び固有名詞候補の訳語を登録情報に登録する。
これにより、ユーザは、固有名詞を登録するときに、固有名詞を手入力する必要がなくなる。ユーザは、固有名詞候補を含む原文の逆翻訳文を確認し、第2の逆翻訳文を選択(承認)又は非選択(否認)すればよい。これにより、固有名詞を登録するか否かが決定される。よって、本開示の翻訳装置によれば、未登録の固有名詞を登録するときの利便性が向上する。
(2)(1)の翻訳装置において、制御部は、ユーザが第2の逆翻訳文を選択した場合、固有名詞候補を登録するか否かを問い合わせる画面を表示部に表示させ、操作部を介して、ユーザからの登録の指示を受けたときに、固有名詞候補及び固有名詞候補の訳語を登録情報に登録してもよい。
これにより、ユーザは、固有名詞候補を登録するか否かを選択するだけで、固有名詞候補を登録することができる。よって、ユーザが固有名詞を手入力する必要性がなくなり、未登録の固有名詞を登録するときの利便性が向上する。
(3)(1)の翻訳装置において、制御部は、ユーザが第1の逆翻訳文を選択したときは、第1の翻訳文を原文の翻訳文として表示部に表示し、ユーザが第2の逆翻訳文を選択したときは、第2の翻訳文を原文の翻訳文として表示部に表示してもよい。
これにより、ユーザの第1の逆翻訳文又は第2の逆翻訳文の選択に応じて、翻訳結果として表示する翻訳文が第1の翻訳文と第2の翻訳文の中から選択される。よって、より原文に近い翻訳文を表示することができる。よって、固有名詞が原文に含まれていても、精度の良い翻訳文を表示することができる。
(4)(1)の翻訳装置において、記憶部は、第1の言語から第2の言語への翻訳機能と第2の言語から第1の言語への翻訳機能を有する外部機器が翻訳可能な第1の言語の代替語と代替語の第2の言語の訳語とを対応付けた代替語辞書をさらに格納してもよい。制御部は、外部機器に原文を送信することによって、第1の翻訳文を取得し、第1の翻訳文を外部機器に送信することによって、第1の逆翻訳文を取得してもよい。制御部は、原文中の固有名詞候補を代替語に置換した代替文を外部機器に送信することによって、代替文を第2の言語に翻訳した代替翻訳文を取得し、代替翻訳文中の代替語の訳語を固有名詞候補の訳語に復元して第2の翻訳文を生成してもよい。制御部は、代替翻訳文を外部機器に送信することによって、代替翻訳文を第1の言語に翻訳した代替逆翻訳文を取得し、代替逆翻訳文中の代替語を固有名詞候補に復元して、第2の逆翻訳文を生成してもよい。
(5)(1)の翻訳装置において、制御部は、原文の句構造と単語構造を解析することによって、原文から固有名詞候補を抽出してもよい。
これにより、精度良く、固有名詞候補を原文から抽出することができる。
(6)(1)の翻訳装置において、制御部は、固有名詞候補を形態素解析により複数の名詞に分割し、複数の名詞の各々の第2の言語による訳語に基づいて、固有名詞候補の訳語を生成してもよい。
(7)別の翻訳装置は、第1の言語の原文を入力する入力部と、制御部を備える。制御部は、原文を第2の言語に翻訳した第1の翻訳文と第1の翻訳文を第1の言語に翻訳した第1の逆翻訳文を生成すると共に、原文から固有名詞候補を抽出し、固有名詞候補の第2の言語による訳語を生成して、固有名詞候補と固有名詞候補の訳語とを対応付けた仮登録情報を生成し、仮登録情報に基づいて原文を第2の言語に翻訳した第2の翻訳文と第2の翻訳文を第1の言語に翻訳した第2の逆翻訳文を生成する。さらに、翻訳装置は、第1の逆翻訳文及び第2の逆翻訳文を表示する表示部と、第1の逆翻訳文と第2の逆翻訳文のいずれか一方を選択するユーザの操作を受け付ける操作部と、を備える。制御部は、ユーザの選択に応じて、第1の翻訳文と第2の翻訳文のいずれか一方を原文の翻訳文として表示部に表示する。
これにより、ユーザの第1の逆翻訳文又は第2の逆翻訳文の選択に応じて、翻訳結果として表示する翻訳文が第1の翻訳文と第2の翻訳文の中から選択される。よって、より原文に近い翻訳文を表示することができる。よって、固有名詞が原文に含まれていても、精度の良い翻訳文を表示することができる。
(8)本開示の翻訳方法は、置換対象の用語を示す登録情報を使用して翻訳する翻訳方法であって、入力部が第1の言語の原文を入力するステップと、演算部(翻訳装置1の制御部22及び翻訳サーバ4)が原文を第2の言語に翻訳した第1の翻訳文と第1の翻訳文を第1の言語に翻訳した第1の逆翻訳文を生成するステップと、演算部(制御部22)が原文から固有名詞候補を抽出するステップと、演算部(制御部22)が固有名詞候補の第2の言語による訳語を生成して、固有名詞候補と固有名詞候補の訳語とを対応付けた仮登録情報を生成するステップと、演算部(翻訳装置1の制御部22及び翻訳サーバ4)が仮登録情報に基づいて、原文を第2の言語に翻訳した第2の翻訳文と第2の翻訳文を第1の言語に翻訳した第2の逆翻訳文を生成するステップと、表示部が第1の逆翻訳文及び第2の逆翻訳文を表示するステップと、操作部が第2の逆翻訳文を選択するか否かのユーザの操作を受け付けるステップと、ユーザが第2の逆翻訳文を選択した場合、演算部(制御部22)が固有名詞候補を新たな置換対象の用語として、仮登録情報に基づいて、固有名詞候補及び固有名詞候補の訳語を登録情報に登録するステップと、を含む。
これにより、ユーザは、固有名詞を登録するときに、固有名詞を手入力する必要がなくなる。ユーザは、固有名詞候補を含む原文の逆翻訳文を確認し、第2の逆翻訳文を選択(承認)又は非選択(否認)すればよい。これにより、固有名詞を登録するか否かが決定される。よって、本開示の翻訳装置によれば、未登録の固有名詞を登録するときの利便性が向上する。
本開示の全請求項に記載の翻訳装置及び翻訳方法は、ハードウェア資源、例えば、プロセッサ、メモリ、及びプログラムとの協働などによって、実現される。
本開示は、発話者の音声又は入力文に基づき翻訳する翻訳装置に適用可能である。
1 翻訳装置
2 ネットワーク
3 音声認識サーバ
4 翻訳サーバ
5 音声合成サーバ
10 マイク(入力部)
12 スピーカ(出力部)
14 ディスプレイ(表示部)
14h、14g 発話アイコン
15h、15g 表示領域
16 タッチパネル(操作部)
18 通信部
20 記憶部
22 制御部
31 抽出モデル情報
32 固有名詞辞書
33 仮登録情報
34 代替語辞書
35 置換情報
100 翻訳システム

Claims (11)

  1. 第1の言語の原文の入力を受ける入力部と、
    前記原文を第2の言語に翻訳して生成された第1の翻訳文と前記第1の翻訳文を前記第1の言語に翻訳して生成された第1の逆翻訳文を取得し、前記原文から固有名詞候補を抽出し、前記固有名詞候補の第2の言語の訳語を生成し、前記固有名詞候補と前記固有名詞候補の訳語に基づいて前記原文を前記第2の言語に翻訳して第2の翻訳文を生成し、前記固有名詞候補と前記固有名詞候補の訳語に基づいて前記第2の翻訳文を前記第1の言語に翻訳して第2の逆翻訳文を生成する制御部と、
    前記第1の逆翻訳文及び前記第2の逆翻訳文を表示する表示部と、
    前記第1の逆翻訳文と前記第2の逆翻訳文のいずれか一方を選択するユーザの操作を受け付ける操作部と、
    登録情報を格納する記憶部と、
    を備え、
    前記制御部は、前記ユーザの選択に応じて、前記第1の翻訳文と前記第2の翻訳文のいずれか一方を前記原文の翻訳文として前記表示部に表示し、
    前記制御部は、前記ユーザが前記第2の逆翻訳文を選択した場合に、前記固有名詞候補及び前記固有名詞候補の訳語を前記登録情報に登録する、
    翻訳装置。
  2. 前記制御部は、前記固有名詞候補と前記固有名詞候補の訳語とを対応付けた仮登録情報を生成し、前記仮登録情報に基づいて、前記第2の翻訳文と前記第2の逆翻訳文を生成する、
    請求項1に記載の翻訳装置。
  3. 前記制御部は、前記ユーザが前記第2の逆翻訳文を選択した場合、前記固有名詞候補を登録するか否かを問い合わせる画面を前記表示部に表示させ、前記操作部を介して、前記ユーザからの登録の指示を受けたときに、前記固有名詞候補及び前記固有名詞候補の訳語を前記登録情報に登録する、
    請求項に記載の翻訳装置。
  4. 前記制御部は、前記ユーザが前記第1の逆翻訳文を選択したときは、前記第1の翻訳文を前記原文の翻訳文として前記表示部に表示し、前記ユーザが前記第2の逆翻訳文を選択したときは、前記第2の翻訳文を前記原文の翻訳文として前記表示部に表示する、
    請求項1に記載の翻訳装置。
  5. 前記制御部は、
    前記第1の言語から前記第2の言語への翻訳機能と前記第2の言語から前記第1の言語への翻訳機能とを有する外部機器に前記原文を送信することによって、前記第1の翻訳文を取得し、
    前記外部機器に前記第1の翻訳文を送信することによって、前記第1の逆翻訳文を取得する、
    請求項に記載の翻訳装置。
  6. 前記記憶部は、前記第1の言語の代替語と前記代替語の前記第2の言語の訳語とを対応付けた代替語辞書を格納しており、
    前記代替語と前記代替語の訳語は、前記外部機器によって翻訳可能であり、
    前記制御部は、
    前記登録情報に登録された前記固有名詞候補を含む文章の入力を前記入力部が受けたとき、前記文章中の前記固有名詞候補を前記代替語に置換して生成された代替文を前記外部機器に送信することによって、前記代替文を前記第2の言語に翻訳して生成された代替翻訳文を取得し、前記代替翻訳文中の前記代替語の訳語を前記固有名詞候補の訳語に復元して前記文章の翻訳文を生成する、
    請求項に記載の翻訳装置。
  7. 前記制御部は、
    前記代替翻訳文を前記外部機器に送信することによって、前記代替翻訳文を前記第1の言語に翻訳して生成された代替逆翻訳文を取得し、前記代替逆翻訳文中の前記代替語を前記固有名詞候補に復元して前記文章の逆翻訳文を生成する、
    請求項に記載の翻訳装置。
  8. 前記制御部は、前記原文の句構造と単語構造を解析することによって、前記原文から前記固有名詞候補を抽出する、請求項1に記載の翻訳装置。
  9. 前記制御部は、前記固有名詞候補を形態素解析により複数の名詞に分割し、前記複数の名詞の各々の前記第2の言語の訳語に基づいて、前記固有名詞候補の訳語を生成する、請求項1に記載の翻訳装置。
  10. 入力部が第1の言語の原文の入力を受けるステップと、
    演算部が前記原文を第2の言語に翻訳して生成された第1の翻訳文と前記第1の翻訳文を前記第1の言語に翻訳して生成された第1の逆翻訳文を取得するステップと、
    前記演算部が前記原文から固有名詞候補を抽出するステップと、
    前記演算部が前記固有名詞候補の第2の言語の訳語を生成するステップと、
    前記演算部が前記固有名詞候補と前記固有名詞候補の訳語に基づいて、前記原文を前記第2の言語に翻訳して第2の翻訳文を生成するステップと、
    前記演算部が前記固有名詞候補と前記固有名詞候補の訳語に基づいて、前記第2の翻訳文を前記第1の言語に翻訳して第2の逆翻訳文を生成するステップと、
    表示部が前記第1の逆翻訳文及び前記第2の逆翻訳文を表示するステップと、
    操作部が前記第1の逆翻訳文と前記第2の逆翻訳文のいずれか一方を選択するユーザの操作を受け付けるステップと、
    前記演算部が、前記ユーザの選択に応じて、前記第1の翻訳文と前記第2の翻訳文のいずれか一方を前記原文の翻訳文として前記表示部に表示するステップと、
    前記演算部は、前記ユーザが前記第2の逆翻訳文を選択した場合に、前記固有名詞候補及び前記固有名詞候補の訳語を登録情報として記憶部に登録するステップと、
    を含む、翻訳方法。
  11. 請求項10に記載の翻訳方法をコンピュータに実行させるプログラム。
JP2019560853A 2017-12-18 2018-11-01 翻訳装置、翻訳方法、及びプログラム Active JP7246027B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017242029 2017-12-18
JP2017242029 2017-12-18
PCT/JP2018/040637 WO2019123854A1 (ja) 2017-12-18 2018-11-01 翻訳装置、翻訳方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2019123854A1 JPWO2019123854A1 (ja) 2021-01-07
JP7246027B2 true JP7246027B2 (ja) 2023-03-27

Family

ID=66994014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019560853A Active JP7246027B2 (ja) 2017-12-18 2018-11-01 翻訳装置、翻訳方法、及びプログラム

Country Status (3)

Country Link
US (1) US11227116B2 (ja)
JP (1) JP7246027B2 (ja)
WO (1) WO2019123854A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7246027B2 (ja) * 2017-12-18 2023-03-27 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
JP7170984B2 (ja) * 2018-03-02 2022-11-15 国立研究開発法人情報通信研究機構 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法
CN113191163B (zh) * 2021-05-21 2023-06-30 北京有竹居网络技术有限公司 一种翻译方法、翻译装置、翻译设备以及存储介质
CN116090442B (zh) * 2022-10-24 2023-09-22 武汉大学 一种语言差异分析方法、系统、终端及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225963A (ja) 2007-03-14 2008-09-25 National Institute Of Information & Communication Technology 機械翻訳装置、置換辞書生成装置、機械翻訳方法、置換辞書生成方法、及びプログラム
JP2016218995A (ja) 2015-05-25 2016-12-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機械翻訳方法、機械翻訳装置及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5896371A (ja) * 1981-12-02 1983-06-08 Sharp Corp 情報検索装置
JPH0754522B2 (ja) * 1987-02-27 1995-06-07 日本電信電話株式会社 自然言語複合名詞解析・変換方式
JPH03148764A (ja) 1989-11-02 1991-06-25 Ricoh Co Ltd 機械翻訳装置
JPH09101960A (ja) 1995-10-03 1997-04-15 Brother Ind Ltd 機械翻訳装置
AU7753998A (en) * 1997-05-28 1998-12-30 Shinar Linguistic Technologies Inc. Translation system
JP2002108858A (ja) * 2000-09-20 2002-04-12 Internatl Business Mach Corp <Ibm> 機械翻訳方法、機械翻訳装置および記録媒体
JP3379090B2 (ja) 2001-03-02 2003-02-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 機械翻訳システム、機械翻訳方法、及び機械翻訳用プログラム
US20020169592A1 (en) * 2001-05-11 2002-11-14 Aityan Sergey Khachatur Open environment for real-time multilingual communication
US9015030B2 (en) * 2011-04-15 2015-04-21 International Business Machines Corporation Translating prompt and user input
JP6203083B2 (ja) 2014-03-06 2017-09-27 株式会社Nttドコモ 未知語抽出装置及び未知語抽出方法
JP2016071439A (ja) * 2014-09-26 2016-05-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 翻訳方法及び翻訳システム
US9836457B2 (en) 2015-05-25 2017-12-05 Panasonic Intellectual Property Corporation Of America Machine translation method for performing translation between languages
KR102407630B1 (ko) * 2015-09-08 2022-06-10 삼성전자주식회사 서버, 사용자 단말 및 이들의 제어 방법.
WO2017112813A1 (en) * 2015-12-22 2017-06-29 Sri International Multi-lingual virtual personal assistant
US10460040B2 (en) * 2016-06-27 2019-10-29 Facebook, Inc. Language model using reverse translations
JP7246027B2 (ja) * 2017-12-18 2023-03-27 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム
JP2019121241A (ja) * 2018-01-09 2019-07-22 パナソニックIpマネジメント株式会社 翻訳装置、翻訳方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008225963A (ja) 2007-03-14 2008-09-25 National Institute Of Information & Communication Technology 機械翻訳装置、置換辞書生成装置、機械翻訳方法、置換辞書生成方法、及びプログラム
JP2016218995A (ja) 2015-05-25 2016-12-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機械翻訳方法、機械翻訳装置及びプログラム

Also Published As

Publication number Publication date
WO2019123854A1 (ja) 2019-06-27
US20200302124A1 (en) 2020-09-24
JPWO2019123854A1 (ja) 2021-01-07
US11227116B2 (en) 2022-01-18

Similar Documents

Publication Publication Date Title
JP7246027B2 (ja) 翻訳装置、翻訳方法、及びプログラム
Ebden et al. The Kestrel TTS text normalization system
JP5121252B2 (ja) 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
JP4058071B2 (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP6709997B2 (ja) 翻訳装置、翻訳システム、および評価サーバ
JP2019121241A (ja) 翻訳装置、翻訳方法、及びプログラム
KR20130018205A (ko) 언어 변환에 있어서 다중 리딩 모호성 해결을 위한 방법
KR100660495B1 (ko) 음성 인식에 있어서의 통계적 언어 모델링을 위한 방법
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d&#39;enregistrement, programme et ordinateur
JP7199061B2 (ja) 翻訳装置
JP7117629B2 (ja) 翻訳装置
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
US11868718B2 (en) Technology name/service name generation device and method therefor
WO2020246175A1 (ja) 翻訳装置
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP2013050742A (ja) 音声認識装置および音声認識方法
JP2018055491A (ja) 言語処理装置、言語処理方法、及び言語処理プログラム
Jamro Sindhi language processing: A survey
JP4018668B2 (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
Yu et al. Identification of Code‐Switched Sentences and Words Using Language Modeling Approaches
JP2017151553A (ja) 機械翻訳装置、機械翻訳方法、及びプログラム
Elsheikh Timeline of the development of Arabic PoS taggers and Morphological analysers
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP2010257085A (ja) 検索装置、検索方法、および検索プログラム
WO2023166651A1 (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230303

R151 Written notification of patent or utility model registration

Ref document number: 7246027

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151