WO2020246175A1

WO2020246175A1 - 翻訳装置

Info

Publication number: WO2020246175A1
Application number: PCT/JP2020/017824
Authority: WO
Inventors: 石川　智一
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2019-06-04
Filing date: 2020-04-24
Publication date: 2020-12-10
Also published as: CN113924573A; JP7526942B2; US11995416B2; US20220092277A1; JPWO2020246175A1

Abstract

第１の言語における入力文を取得し、機械翻訳を実行する外部装置（４２）と通信して、入力文の翻訳結果を示す翻訳文を出力する翻訳装置（１）は、置換対象の用語と訳語とを対応づけて含む第１の辞書情報（３１）、及び、代替用語を含む第２の辞書情報（３２）を記憶する記憶部（２０）と、入力文に含まれる置換対象の用語を代替用語に置換して置換文を生成する制御部（２２）と、置換文を外部装置に出力し、外部装置から置換文の翻訳結果を取得する通信部（１８）とを備える。代替用語は、特定の文字列で構成される。制御部は、通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して（Ｓ２５）、検知した文字列を、置換対象の用語の訳語に置換して、翻訳文を生成する（Ｓ２６）。

Description

翻訳装置

　本開示は、一の言語で入力した文章を他の言語に翻訳する翻訳装置に関する。

　特許文献１は、ユーザにより入力された英語のテキストを日本語のテキストに翻訳する電子辞書装置を開示している。この電子辞書装置は、事前に登録しておいた登録単語が、入力された英語のテキスト中に含まれている場合は、翻訳結果である日本語のテキスト内において登録単語に対応する訳語を英語に置き換えて表示している。すなわち、登録単語については英語の状態で表示し、登録単語以外の部分については日本語に翻訳された状態で表示している。例えば、「cheap」が登録単語として登録されていた場合、「This is a cheap bag.」の翻訳結果として、「これは、cheapかばんです。」を出力している。さらに、特許文献１の電子辞書装置は、訳／決定キーの押下に応じて、英語及び日本語のテキスト中の登録単語及びその訳語を下線付きで表示している。これにより、ユーザが、登録単語についての語学学習をできるようにしている。

特許第４９２９６３２号公報

　本開示は、第１の言語から第２の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を提供する。

　本開示の一態様に係る翻訳装置は、第１の言語における入力文を取得し、第１の言語から第２の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第１の言語の置換対象の用語と、置換対象の用語に対する第２の言語の訳語とを対応づけて含む第１の辞書情報、及び、置換対象の用語の代わりに使用される、少なくとも１つの代替用語を含む第２の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第２の言語における置換文の翻訳結果を取得する。代替用語は、特定の文字列で構成される。制御部は、通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、検知した文字列を、第１の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。

　本開示の別の態様に係る翻訳装置は、第１の言語における入力文を取得し、第１の言語から第２の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第１の言語の置換対象の用語と、置換対象の用語に対する第２の言語の訳語とを対応づけて含む第１の辞書情報、及び、第１の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第２の言語の訳語とを対応づけて含む第２の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第２の言語における置換文の翻訳結果を取得する。制御部は、通信部から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する。制御部は、代替用語の訳語がないと判断した場合、第２の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部に出力させる。制御部は、代替用語の訳語があると判断した場合、当該訳語を、第１の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。

　これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。

　本開示に係る翻訳装置によると、第１の言語から第２の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる。

本開示に係る翻訳エンジンと語彙置換／復元処理を説明するための図本開示の実施形態１における翻訳装置の外観を示す図実施形態１における翻訳システムの構成を示すブロック図実施形態１における登録語辞書の一例を示す図実施形態１における代替語辞書の一例を示す図実施形態１における置換情報の一例を示す図翻訳システムにおける翻訳装置の動作を説明するためのフローチャート実施形態１における語彙置換／復元処理を例示するフローチャート実施形態１における語彙置換／復元処理を説明するための図実施形態２における代替語辞書の一例を示す図実施形態２における語彙置換／復元処理を例示するフローチャート実施形態２における置換情報の一例を示す図実施形態２における代替語辞書の変形例を示す図

　以下、適宜図面を参照しながら、本開示の実施形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

　なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。

（本開示に到った知見）
　本開示の実施形態を説明するにあたり、まずは本願発明者が本開示に到った知見について、図１を用いて説明する。

　図１は、本開示に係る翻訳エンジン５と語彙置換／復元処理を説明するための図である。翻訳エンジン５は、種々の言語における用語の対訳を管理する翻訳辞書５ａ、及び文章中の形態素を解析する形態素解析部５ｂ等を備え、各種の第１の言語から第２の言語への機械翻訳を実行する。語彙置換／復元処理は、特定の語彙に関して語彙置換／復元技術を適用し、翻訳文を生成する翻訳処理である。翻訳エンジン５においては、翻訳辞書５ａ等に登録されていない用語、即ち未知語がある場合が想定される。こうした場合に適用可能な語彙置換／復元処理について、以下では第１の言語が日本語であり、第２の言語が英語である例を用いて説明する。

　図１では、翻訳対象とする入力文が、日本語で「手荷物カウンターはこちらです。」という文章Ｊ１であり、入力文の文章Ｊ１中に含まれた「手荷物カウンター」という用語Ｊ１１が未知語である場合を例示する。未知語としては、例えば、特定の職種に関わるシーンのみで使用される専門的な用語であって、一般的ではないような用語が想定される。

　語彙置換／復元処理は、例えば、翻訳エンジン５による機械翻訳の前処理を行う置換部２ａと、後処理を行う復元部２ｂとにより実現される。置換部２ａは、例えば入力文の文章Ｊ１中で未知語である用語Ｊ１１を置換対象として、未知語の代わりに用いられる用語すなわち代替用語への置換を行う。

　代替用語としては、例えば、未知語よりは一般的と考えられる一方で、各種の入力文として想定される文章には含まれ難いと考えられる用語を用いることができる。これにより、入力文が含む用語との混同を回避して、誤訳を生じ難くすることが期待される。本例では、日本語で「あさぎりの湯」という用語Ｊ２１を代替用語に用いる。置換部２ａは、置換結果の置換文として、用語Ｊ２１を含めた「あさぎりの湯はこちらです。」という文章Ｊ２を翻訳エンジン５に出力する。

　図１の例では、翻訳エンジン５は、上記の文章Ｊ２に対する機械翻訳の処理を実行し、処理結果の文章Ｅ２として「Spa of Asagiri is here.」を出力している。当該文章Ｅ２は、未知語の代わりの用語Ｊ２１の訳語Ｅ２１として、「Spa of Asagiri」を含んでいる。復元部２ｂは、当該文章Ｅ２のような置換文の機械翻訳の結果から、入力文の翻訳結果として提示する翻訳文において未知語を復元するための処理を行う。

　図１では、復元部２ｂの処理が成功した場合を例示している。復元部２ｂは、上記の文章Ｅ２を処理し、入力文の文章Ｊ１に対する翻訳文として「Baggage counter is here.」という文章Ｅ１を出力している。当該文章Ｅ１では、上記文章Ｅ２中の代替用語の訳語Ｅ２１が、入力文では未知語のため置換部２ａの置換対象とした用語Ｊ１１の訳語Ｅ１１である「Baggage counter」に換わっている。

　本例のように、復元部２ｂが、置換文の機械翻訳結果の文章Ｅ２中で、代替用語の訳語Ｅ２１を、訳語Ｅ１１のような未知語に再置換できれば、適切に未知語が復元された翻訳文を得ることができる。この際、未知語の復元後の訳語Ｅ１１は、翻訳エンジン５の処理とは独立して予め、置換対象の用語Ｊ１１に対応づけて、復元部２ｂ及び置換部２ａ側で設定可能である。

　しかしながら、代替用語の訳語Ｅ２１は、翻訳エンジン５の内部処理に応じて変動し、復元部２ｂ側で予め想定した訳語とは、異なるものになってしまう場合が考えられる。又、翻訳エンジン５における処理時に、形態素解析部５ｂが代替用語の形態素を適切に認識できないことで、機械翻訳結果に不具合が生じる場合も想定される。こうした種々の観点から、従来の語彙置換／復元技術による翻訳処理においては、未知語の復元が失敗するような事態を回避し難く、入力文の翻訳結果を示すように翻訳文を精度良く得ることが困難であるという問題点が、本願発明者の鋭意研究によって明らかとなった。

　そこで、本願発明者は、上記の問題点について鋭意検討を重ね、語彙置換／復元処理及び代替用語の改善により、例えば翻訳エンジン５の未知語を含んだ入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を考案した。以下、本開示に係る翻訳装置の実施形態を説明する。

（実施形態１）
　以下、図面を用いて、実施形態１を説明する。実施形態１では、翻訳エンジン５によって翻訳されないような特定の文字列を代替用語として用いる翻訳装置について説明する。

１．構成
　図２は、実施形態１にかかる翻訳装置１の外観を示す図である。図２に示す翻訳装置１は、例えばタブレットタイプの翻訳装置であり、言語が異なる２人のユーザの会話を翻訳する。以下、本実施形態においては、日本語を話すホスト（例えば、案内者）と英語を話すゲスト（例えば、旅行者）とが対面で行う会話を、翻訳装置１が翻訳することを想定して説明する。

　翻訳装置１は、マイク１０と、スピーカ１２と、ディスプレイ１４と、タッチパネル１６とを備える。マイク１０及びスピーカ１２は、例えば、翻訳装置１の側面の開口近傍に配置されている。ディスプレイ１４及びタッチパネル１６は、翻訳装置１の主面に配置されている。ディスプレイ１４の長手方向の一方側（例えば、ホスト側）の領域には、発話アイコン１４ｈ及び表示領域１５ｈが配置される。ディスプレイ１４の長手方向の他方側（例えば、ゲスト側）の領域には、発話アイコン１４ｇ及び表示領域１５ｇが表示される。各発話アイコン１４ｈ、１４ｇに対して、ユーザによるタッチ操作がなされる。

　発話アイコン１４ｈは、ホストが発話を行うときに、すなわち、翻訳元として日本語の発話を翻訳装置１に入力するときに、ホスト本人がホストの発話の開始時点及び終了時点を指定するための操作アイコンである。発話アイコン１４ｇは、ゲストが発話を行うときに、すなわち、翻訳元として英語の発話を入力するときに、ゲスト本人がゲストの発話の開始時点及び終了時点を指定するための操作アイコンである。表示領域１５ｈ，１５ｇは、音声認識結果および翻訳結果等を文字列として表示するための領域である。

　図３は、実施形態１にかかる翻訳システム１００の構成を示すブロック図である。翻訳システム１００は、図２に示す翻訳装置１、音声認識サーバ４１、翻訳サーバ４２、及び音声合成サーバ４３を有する。翻訳装置１は、インターネットのような通信ネットワーク４を介して、音声認識サーバ４１、翻訳サーバ４２、及び音声合成サーバ４３のそれぞれとデータ通信を行う。

　音声認識サーバ４１は、翻訳装置１から通信ネットワーク４を介して音声データを受信し、受信した音声データを音声認識して、認識結果の文字列で構成される音声認識データ、すなわち発話文のテキストデータを生成するサーバである。なお、音声認識サーバ４１は、本実施形態における翻訳装置１の外部の音声認識装置の一例である。

　翻訳サーバ４２は、翻訳エンジン５が搭載されたサーバである。翻訳サーバ４２は、翻訳装置１から通信ネットワーク４を介して音声認識データを受信し、受信した音声認識データに対して翻訳エンジン５による機械翻訳を実行して、機械翻訳の結果を示すテキストデータである翻訳データを生成する。翻訳サーバ４２は、第１の言語から第２の言語への翻訳機能を有する外部装置の一例である。

　音声合成サーバ４３は、翻訳装置１から通信ネットワーク４を介して翻訳データを受信し、受信した翻訳データを音声合成して音声信号を生成するサーバである。

　翻訳装置１は、マイク１０と、スピーカ１２と、ディスプレイ１４と、タッチパネル１６とに加えて、通信部１８と、記憶部２０と、制御部２２とを備える。

　マイク１０は、物理的な音声を音声データに変換する装置である。具体的には、マイク１０は、外部から入力される音声を、アナログ電気信号の音声信号に変換し、さらに、ＡＤ変換器により音声信号をデジタルの音声データに変換する。マイク１０は、発話等の音声を入力する音声入力部の一例である。

　通信部１８は、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｗｉ－Ｆｉ（登録商標）、３Ｇ、ＬＴＥ（登録商標）、ＩＥＥＥ８０２．１１等の通信方式に従って、通信ネットワーク４を介して音声認識サーバ４１、翻訳サーバ４２、及び音声合成サーバ４３とデータ通信を行う通信モジュールである。

　記憶部２０は、フラッシュメモリ、強誘電体メモリ、ＨＤＤ、ＳＳＤ、ＲＡＭ、及びこれらの組み合わせなどで構成される記録媒体である。記憶部２０は、マイク１０の音声データ、音声認識データ、及び翻訳データを格納する。また、記憶部２０は、制御部２２のための各種プログラムを格納している。

　本実施形態において、記憶部２０は、登録語辞書３１、代替語辞書３２、及び置換情報３３を格納する。登録語辞書３１は、語彙置換／復元処理において置換対象とする特定の用語を登録する辞書情報の一例である。代替語辞書３２は、翻訳時に置換対象の代わりに使用される代替用語を含む辞書情報の一例である。置換情報３３は、置換前の用語と置換後の用語との対応付けを示す情報である。登録語辞書３１、代替語辞書３２、及び置換情報３３のデータ構造については後述する。

　制御部２２は、ＣＰＵ、ＭＰＵ等で構成され、記憶部２０に格納された各種プログラムを実行することにより、翻訳装置１の全体の動作を制御する。制御部２２は、例えば機能的構成として置換部２ａ及び復元部２ｂを含む。本実施形態では、制御部２２の機能は、ハードウェアとソフトウェアの協働により実現するが、所定の機能を実現するように専用に設計されたハードウェア回路のみで実現してもよい。すなわち、制御部２２は、ＣＰＵ、ＭＰＵのみならず、ＤＳＰ、ＦＰＧＡ、ＡＳＩＣ等で構成することができる。

　スピーカ１２は、電気信号を音声に変換する装置である。スピーカ１２は、制御部２２からの音声信号（電気信号）に基づいた音声を出力する。スピーカ１２は、翻訳結果等の音声を外部に出力する出力部の一例である。

　ディスプレイ１４は、画像を表示する装置であり、液晶表示デバイスまたは有機ＥＬ表示デバイスで構成される。ディスプレイ１４は、表示領域１５ｈ、１５ｇにおいて、制御部２２からの音声認識データ、翻訳データ、及び、逆翻訳データが示す画像を表示する。ディスプレイ１４は、音声認識データ、及び翻訳データ等をホスト及びゲストに対して表示出力する出力部の一例である。また、ディスプレイ１４は上述した発話アイコン１４ｈ、１４ｇを表示する。

　タッチパネル１６は、ユーザが操作する操作部であり、ユーザからの指示を受け付ける。タッチパネル１６はディスプレイ１４に重畳して配置されている。

１－１．データ構造について
　本実施形態の翻訳装置１に格納される、登録語辞書３１、代替語辞書３２、及び置換情報３３のデータ構造について、図４～図６を参照して説明する。

　図４は、登録語辞書３１の一例を示す。登録語辞書３１には、語彙置換／復元処理において置換対象とする特定の用語が登録されている。本実施形態では、翻訳装置１の登録語辞書３１に登録される用語が、翻訳エンジン５にとって未知語であることを想定している。こうした置換対象の用語は、例えば各種の固有名詞を含む。

　登録語辞書３１に含まれる用語は、単語及び語句を含む。登録語辞書３１は、複数の言語による対訳で記載された用語を含む。図４では、当該複数の言語が日本語および英語である例を示しているが、特にこれに限らず、種々の自然言語を採用可能である。以下では、登録語辞書３１内の複数の言語による対訳で記載された用語のうち、翻訳元の言語で記載された用語を「登録用語」と呼び、翻訳先の言語で記載された用語を「登録用語の訳語」と呼ぶ。

　登録語辞書３１は、例えば登録用語の種別を示すクラス毎に設けられる。クラスは、用語を分類するものであって、用語が示す対象のカテゴリである。クラスは、例えば、地名、および食べ物を含む。登録語辞書３１は、登録用語と関連付けて付加情報を含んでもよい。付加情報は、例えば、クラスが「地名」であれば、登録用語が示す場所の写真やアクセス手段を示す情報である。

　登録語辞書３１に登録される用語は、必ずしも未知語に限らず、例えば翻訳エンジン５による機械翻訳では所望のとおりに翻訳され難いと想定される用語であってもよい。又、特に翻訳エンジン５における登録の有無を勘案することなく、特定の分野のみで使用される専門用語や、一部の場所又は地域のみで使用される用語が、登録語辞書３１に登録されてもよい。これにより、語彙置換／復元処理を介して、登録語辞書３１中の対訳に従った登録用語の訳語を翻訳文にて訳出させるようなことができる。

　図５は、本実施形態における代替語辞書３２の一例を示す。代替語辞書３２は、翻訳時に登録用語の代わりに使用される代替用語を含む。本実施形態の代替語辞書３２は、図５に示すように、特殊な文字列で構成される代替用語である代替文字列を、例えばクラス別に管理する。

　本実施形態において、代替文字列は、例えば図５に示す文字列Ｗ１のように、先頭の記号ｍ０と、末尾の記号ｍ１と、先頭及び末尾の記号ｍ０，ｍ１の間に並んだ文字部分ｗ１０とを含む。

　代替文字列における先頭及び末尾の記号ｍ０，ｍ１は、例えば「＋」などの予め規定された記号に設定される。例えば「＋」の記号ｍ０，ｍ１によると、代替文字列を含めた文章の形態素解析等において、代替文字列の内外が区別され易くすることができる。各記号ｍ０，ｍ１は、例えば互いに同一の記号に設定されるが、同一の記号でなくてもよい。各記号ｍ０，ｍ１は、例えば各種の括弧記号に設定されてもよい。

　代替文字列における文字部分ｗ１０は、例えば文字列Ｗ１に示すように、互いに同種の文字を複数、並べて構成される。文字部分ｗ１０の複数文字は、例えば意味を成さないように、すなわち当該文字の並びが意味を有する単語等にならないように設定される。これにより、翻訳エンジン５における機械翻訳の処理前後で、代替文字列が変わらないようにし易くすることができる。代替文字列としては、翻訳エンジン５における機械翻訳の処理前後で変化しないことが想定される特定の文字列に設定可能である。

　又、文字部分ｗ１０の文字種は、例えば翻訳元の言語において発生頻度が比較的低い文字種に設定される。例えば、翻訳元が日本語の場合に、文字部分ｗ１０をアルファベットに設定することにより、漢字等よりも発生頻度が低減される。代替語辞書３２は、各種言語毎に、別々の代替文字列を管理してもよく、例えば翻訳元とする言語と、同言語において発生頻度が低い文字種の代替文字列とを対応付けてもよい。

　図６は、置換情報３３の一例を示す。置換情報３３は、後述する語彙置換／復元処理の実行時に生成され、例えば当該処理中に一時的に記憶部２０に記憶される。置換情報３３は、置換前の用語と置換後の用語とを対応付けて含む。置換前の用語は、語彙置換／復元処理において置換対象の登録用語であり、置換後の用語は、置換対象の登録用語に対する代替用語である。

２．動作
　以上のように構成される翻訳システム１００及び翻訳装置１の動作を以下説明する。

２－１．全体動作
　翻訳システム１００及び翻訳装置１の全体的な動作について、図７を参照して説明する。本実施形態において、翻訳エンジン５は翻訳サーバ４２に搭載されている。翻訳装置１は翻訳サーバ４２に発話文のテキストデータを送信し、翻訳サーバ４２から翻訳結果を示す翻訳文のテキストデータを取得する。

　図７は、翻訳システム１００における翻訳装置１を説明するためのフローチャートである。図７のフローチャートに示す各処理は、翻訳装置１の制御部２２によって実行される。

　まず、翻訳装置１の制御部２２は、マイク１０を介して、発話者による発話の音声に応じた音声データを取得する（Ｓ１）。

　制御部２２は、音声認識処理により、発話文を取得する（Ｓ２）。具体的に、制御部２２は、まず取得した音声データを、通信ネットワーク４を介して音声認識サーバ４１に送信する。音声認識サーバ４１は、受信した音声データを音声認識して、発話文のテキストデータを生成する。翻訳装置１は、音声認識サーバ４１から通信ネットワーク４を介して、発話文のテキストデータを受信する。

　次に、制御部２２は、取得した発話文内において、登録語辞書３１に含まれる登録用語を検索する（Ｓ３）。そして、制御部２２は、発話文内に登録用語があるか否かを判断する（Ｓ４）。

　発話文内に登録用語がなければ（Ｓ４でＮＯ）、制御部２２は、語彙置換／復元処理ではない通常の翻訳処理を行う（Ｓ５～Ｓ６）。通常の翻訳処理は、特に置換部２ａ及び復元部２ｂを用いずに、発話文に対する翻訳文を取得する処理である。

　具体的に、翻訳装置１の制御部２２は、まず発話文のテキストデータを、通信ネットワーク４を介して翻訳サーバ４２に送信する（Ｓ５）。翻訳サーバ４２は、翻訳エンジン５において発話文に対する機械翻訳を実行して、機械翻訳の結果のテキストデータを生成する。翻訳サーバ４２は、生成したテキストデータを、通信ネットワーク４を介して翻訳装置１に送信する。翻訳装置１は、翻訳サーバ４２から通信ネットワーク４を介して、翻訳結果のテキストデータを、翻訳文として受信する（Ｓ６）。

　一方、発話文内に登録用語があれば（Ｓ４でＹＥＳ）、制御部２２は、本実施形態に係る語彙置換／復元処理を行う（Ｓ７）。本実施形態に係る語彙置換／復元処理によると、代替文字列を用いることにより、翻訳文の精度を良くすることができる。語彙置換／復元処理の詳細については後述する。

　制御部２２は、例えば、ステップＳ６、Ｓ７の翻訳結果を表示するようにディスプレイ１４を制御する（Ｓ８）。例えば、ディスプレイ１４は、図２に例示するように、発話文をホスト側の表示領域１５ｈに表示すると共に、翻訳文をゲスト側の表示領域１５ｇに表示する。なお、発話文の表示と翻訳文の表示は、同時に行ってもよいし、順番に行ってもよい。例えば、制御部２２は、翻訳サーバ４２から翻訳文のテキストを受信する前に発話文を先に表示させてもよい。

　翻訳装置１の制御部２２は、例えば翻訳結果の表示（Ｓ８）により、図７のフローチャートに示す動作を終了する。

　以上の翻訳システム１００及び翻訳装置１の動作によると、翻訳装置１において、発話によって入力文の一例である発話文の入力を受け付けると共に、翻訳エンジン５による機械翻訳を用いた発話文に対する翻訳結果の翻訳文を提示することができる。

　翻訳装置１は、翻訳文の表示（Ｓ８）に加えて、又は代えて、翻訳文を音声で出力してもよい。この場合、翻訳装置１の制御部２２は、ステップＳ６、Ｓ７で得られた翻訳文のテキストデータを、通信ネットワーク４を介して、音声合成サーバ４３に送信する。音声合成サーバ４３は、翻訳装置１から受信した翻訳文のテキストデータに基づき、音声合成を行って音声信号を生成し、通信ネットワーク４を介して翻訳装置１に音声信号を送信する。制御部２２は、音声合成サーバ４３から受信した音声信号に基づき、スピーカ１２から翻訳結果を示す音声を出力する。

２－２．語彙置換／復元処理
　本実施形態における語彙置換／復元処理（Ｓ７）の詳細について、図８～図９を用いて説明する。

　図８は、本実施形態における語彙置換／復元処理を例示するフローチャートである。図９は、本実施形態における語彙置換／復元処理を説明するための図である。

　以下の説明では、ホストが発した日本語の発話を翻訳システム１００が英語に翻訳し、その翻訳結果をゲストに伝達する場面の一例を想定して説明する。具体的には図９に示すように、入力文の一例の発話文が、未知語として日本語の用語Ｊ１１を含んだ「手荷物カウンター前に自販機があります。」という文章Ｊ１０である例を用いて説明する。本例において、翻訳装置１の制御部２２は、発話文中の用語Ｊ１１に基づき図７のステップＳ４でＹＥＳに進み、ステップＳ７において図８の処理を実行する。

　まず、翻訳装置１の制御部２２は、置換部２ａとして機能し、発話文の中の登録用語を、代替用語とする特定の文字列に置換する（Ｓ２１）。置換部２ａとしての制御部２２は、記憶部２０における登録語辞書３１及び代替語辞書３２を参照して、ステップＳ２１の処理を行う。

　例えば、図４に示すように、登録語辞書３１には、図９の例の未知語である用語Ｊ１１が、予めクラス「地名」に属するように登録されている。ステップＳ２１において、制御部２２は、クラス「地名」に基づいて、例えば図５に示す代替語辞書３２から、同クラスに属する代替文字列の一つである「+LDMVA+」という文字列Ｗ１を代替用語として選択する。そして、制御部２２は、入力文の文章Ｊ１０中の用語Ｊ１１を、選択した代替用語に置換し、置換文として図９に示すように「+LDMVA+前に自販機があります。」という文章Ｊ２０を生成する。

　制御部２２は、置換前後の用語を対応付けて置換情報３３として記録する（Ｓ２２）。図９の例の置換情報３３としては、例えば図６に示すように、置換対象とした用語Ｊ１１が置換前の用語として記録され、代替用語として選択した文字列Ｗ１が置換後の用語として記録される。

　制御部２２は、通信部１８を介して、発話文に対する置換結果の置換文を翻訳サーバ４２に送信する（Ｓ２３）。本例では、置換文として、代替用語の文字列Ｗ１を含んだ文章Ｊ２０を示すテキストデータが送信される。

　翻訳サーバ４２は、受信した置換文のテキストデータに対して、翻訳エンジン５による機械翻訳の処理を実行して、機械翻訳の結果を示すテキストデータを生成する。図９の例では、置換文の文章Ｊ２０に対する機械翻訳の結果として、「There is a vending machine in front of +LDMVA+.」という文章Ｅ２０が生成されている。翻訳サーバ４２は、置換文の翻訳結果の文章を示すテキストデータを、通信ネットワーク４を介して翻訳装置１に送信する。翻訳装置１の制御部２２は、翻訳サーバ４２から通信部１８を介して、置換文の翻訳結果を受信する（Ｓ２４）。

　次に、制御部２２は、復元部２ｂとして機能し、受信した翻訳結果において代替用語の文字列を検知して（Ｓ２５）、発話文の翻訳結果が復元された翻訳文を生成する（Ｓ２６）。図９の例では、文章Ｊ１０に対する翻訳文として「Baggage counter is here.」といった文章Ｅ１が、上記の文章Ｅ２０から復元される。

　具体的に、復元部２ｂとしての制御部２２は、まず図６に示す置換情報３３から置換後の代替用語の文字列Ｗ１を特定し、置換文の翻訳結果の文章Ｅ２０において文字列Ｗ１を検索する（Ｓ２５）。さらに、制御部２２は、置換情報３３から、置換前の登録用語が用語Ｊ１１であることを特定する。制御部２２は、登録語辞書３１から用語Ｊ１１に対応する「Baggage counter」を訳語Ｅ１１として読み出して、文章Ｅ２０中の「+LDMVA+」を訳語Ｅ１１に置換する。これにより、上記の文章Ｅ２０のような翻訳文が生成される（Ｓ２６）。

　制御部２２は、翻訳文を生成する（Ｓ２６）と、図７のステップＳ７の処理を終了し、ステップＳ８に進む。

　以上の処理によると、語彙置換／復元処理において、未知語に対する代替用語として、例えば「+LDMVA+」といった特殊な文字列Ｗ１が用いられる（Ｓ２１）。こうした特殊な文字列Ｗ１は、翻訳エンジン５に翻訳されない、即ち翻訳サーバ４２における機械翻訳の処理前後で変更されないこととなる。このため、制御部２２は、機械翻訳の結果から代替用語と同じ文字列Ｗ１の再置換により、翻訳先の言語で未知語を復元する復元部２ｂとしての処理（Ｓ２５～Ｓ２６）を成功し易く、翻訳文を精度良く得ることができる。

　上記のような特定の文字列Ｗ１を代替用語として用いることで、例えば翻訳サーバ４２における機械翻訳の処理時（Ｓ２３～Ｓ２４）において、形態素解析の誤認識を回避し易くすることができる。

　例えば図１の例の用語Ｊ２１を代替用語として用いた場合、一般的な形態素解析部５ｂは、図９に示すように、発話文の文章Ｊ１０に対する置換後の文章Ｊ２２中で、漢字等の同種の文字が並んだ部分を纏めて一形態素と認識する可能性が高い。このため、文章Ｊ２２における用語Ｊ２１前後の内容によっては、用語Ｊ２１の内外を誤って区切るような形態素解析が行われ、文章Ｊ２２の機械翻訳結果に、用語Ｊ２１の訳語が現れないような不具合を回避し難い。

　これに対して、本実施形態の代替用語として用いる特定の文字列Ｗ１によると、文字列Ｗ１の先頭及び末尾の記号「＋」により、形態素解析において、代替用語と外部とが区切られる可能性を高めることができる。又、先頭及び末尾の記号間に同種の文字を並べることにより、代替用語内部を纏めて認識される可能性を高められる。これにより、形態素解析の誤認識を回避し易くすることができる。この際、翻訳サーバ４２の形態素解析部５ｂには、特に形態素解析のための辞書等に文字列Ｗ１を登録しなくてもよい。

　さらに、本実施形態の代替用語としての文字列Ｗ１が、日本語などの翻訳元の言語で、特に意味を成さないものに設定されることにより、翻訳サーバ４２における機械翻訳の処理時に、文字列Ｗ１とは別の文字列の訳語に変更される事態を回避し易くすることができる。これにより、翻訳装置１において復元部２ｂの処理対象を検知し易くして、翻訳文における未知語の復元を成功し易くすることができる。

　なお、翻訳サーバ４２においては、例えば翻訳辞書５ａに、代替用語の文字列Ｗ１のクラスが登録されていてもよい。例えば文字列Ｗ１が「地名」の意味合いであることを前提として、当該文字列Ｗ１を含んだ文章Ｊ２０全体の翻訳精度を良くすることができる。こうした翻訳辞書５ａへの登録は、形態素解析部５ｂに対する登録とは別に行え、翻訳サーバ４２への登録負担を低減することができる。

３．まとめ
　以上のように、本実施形態において、翻訳装置１は、第１の言語（例えば、日本語）における入力文（例えば、発話文）を取得し、翻訳サーバ４３と通信して、文章Ｊ１０等の入力文の翻訳結果を示す文章Ｅ１０等の翻訳文を出力する。翻訳サーバ４３は、第１の言語から第２の言語（例えば、英語）への機械翻訳を実行する外部装置の一例である。翻訳装置１は、記憶部２０と、制御部２２と、通信部１８とを備える。記憶部２０は、第１の辞書情報の一例である登録語辞書３１、及び第２の辞書情報の一例である代替語辞書３２を記憶する。登録語辞書３１は、第１の言語の置換対象の用語である登録用語と、登録用語に対する第２の言語の訳語とを対応づけて含む。代替語辞書３２は、置換対象の用語の代わりに使用される、少なくとも１つの代替用語を含む。制御部２２は、入力文に含まれる置換対象の用語を代替用語に置換して、文章Ｊ２０のように置換結果を示す置換文を生成する（Ｓ２１）。通信部１８は、置換文を翻訳サーバ４２に出力し（Ｓ２３）、翻訳サーバ４２から、文章Ｅ２０のように第２の言語における置換文の翻訳結果を取得する（Ｓ２４）。代替用語は、例えば文字列Ｗ１のように、特定の文字列で構成される。制御部２２は、通信部１８から取得した置換文の翻訳結果において当該特定の文字列を検知して（Ｓ２５）、検知した文字列を、登録語辞書３１において置換対象の登録用語（例えば用語Ｊ１１）に対応づけられた訳語（例えば訳語Ｅ１１）に置換して、翻訳文を生成する（Ｓ２６）。

　以上の翻訳装置１によると、代替用語として用いる特定の文字列が、翻訳サーバ４に翻訳されないことを利用して、置換文の翻訳結果において当該文字列を検知して（Ｓ２５）、翻訳文を復元する（Ｓ２６）。これにより、翻訳サーバ４の翻訳エンジン５に翻訳される代替用語を用いた場合のような復元の失敗を回避し易くして、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。

　本実施形態において、代替用語として用いる代替文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号ｍ０，ｍ１と、先頭の記号ｍ０と末尾の記号ｍ１との間に並んだ互いに同種の複数文字の文字部分ｗ１０とを含む。

　こうした代替文字列によると、翻訳エンジン５に翻訳されない可能性が比較的高く、翻訳エンジン５の処理後に、処理前と同じ文字列を維持し易い。代替文字列として、例えば第１の言語において発生頻度が低い文字種を用いることで、当該文字列が翻訳されない可能性をより高めて、適切な翻訳文をより得易くすることができる。

　本実施形態において、置換対象の用語は、例えば固有名詞を含む。置換対象の用語は、例えば翻訳サーバ４に未登録である未知語と想定される用語に設定可能である。これにより、入力文に未知語が含まれていても、翻訳文を精度良く得ることができる。

　本実施形態において、代替語辞書３２は、用語の種別を示すクラス毎に代替用語を分類してもよい。この場合、制御部２２は、入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、置換文を生成する（Ｓ２１）。クラスに応じた代替用語により、翻訳文の精度向上を図れる。

　本実施形態において、翻訳装置１は、発話を入力する音声入力部の一例のマイク１０をさらに備えてもよい。通信部１８は、発話の音声データを外部の音声認識装置の一例である音声認識サーバ４１に出力し、音声認識サーバ４１から音声データに対する認識結果の入力文を取得してもよい（Ｓ２）。こうした翻訳装置１によると、ユーザの発話に対する適切な翻訳文を得易い。

（実施形態２）
　以下、図１０～図１２を用いて実施形態２を説明する。実施形態２では、図１を用いて説明した問題点について、実施形態１とは別の解決策を提供する。

　以下、実施形態１に係る翻訳装置１及び翻訳システム１００と同様の構成、動作の説明は適宜、省略して、本実施形態に係る翻訳装置１及び翻訳システム１００を説明する。

　本実施形態では、語彙置換／復元処理において翻訳エンジン５の機械翻訳結果を取得すると代替用語の訳語が含まれているか否かを判断し、判断結果によっては代替用語を替えて同処理を繰り返す翻訳装置１について説明する。

　図１０は、実施形態２における代替語辞書３２Ａの一例を示す。本実施形態の翻訳装置１は、代替用語として、単語及び語句を含む用語であって、例えば翻訳エンジン５において精度良く翻訳されることが想定される用語を用いる。

　本実施形態の代替語辞書３２Ａにおいては、代替用語として用いる用語が、登録語辞書３１と同じ複数の言語（例えば日本語及び英語）の対訳で記載される。本実施形態の語彙置換／復元処理では、代替語辞書３２Ａにおいて複数の言語のうちの翻訳元の言語で記載された用語が「代替用語」として置換文に用いられ、翻訳先の言語で記載された用語が「代替用語の訳語」として翻訳文に用いられる。

　代替語辞書３２Ａは、例えば実施形態１と同様の各クラスにおいて、複数の代替用語とその訳語とを含む。又、本実施形態の代替語辞書３２Ａは、例えば図１０に示すように、代替用語間の優先順位を管理する。優先順位は、本実施形態の語彙置換／復元処理において代替用語として用いる際に優先される順番を示す。本例では、同じクラスの代替用語の間で、優先順位が設定されている。優先順位「１」を有する用語が、最も高い優先順位の代替用語となる。

　図１１は、実施形態２における語彙置換／復元処理を例示するフローチャートである。本実施形態の翻訳装置１は、実施形態１と同様の動作の実行時に、図７のステップＳ７において図８のフローチャートの代わりに本フローチャートに例示するような処理を実行する。

　まず、翻訳装置１の制御部２２は、本実施形態の代替語辞書３２Ａにおいて、優先順位が高い代替用語から順番に、１つの代替用語を選択する（Ｓ２１ａ）。制御部２２は、選択した代替用語を用いて置換部２ａ及び復元部２ｂとしての処理を実施形態１と同様に行う（Ｓ２１ｂ～Ｓ２５ａ）。図１２に、本実施形態における置換情報３３Ａの一例を示す。

　図１２は、置換前の用語Ｊ１１と同じクラスの代替語辞書３２Ａにおいて優先順位が最も高い用語Ｊ２３が、ステップＳ２１ａで選択された場合におけるステップＳ２２の置換情報３３Ａを例示している。この場合、制御部２２は、発話文中の用語Ｊ１１を、選択した用語Ｊ２３に置換して、置換文を生成する（Ｓ２１ｂ）。用語Ｊ２３のような代替用語は、翻訳サーバ４２における機械翻訳の処理時に、例えば日本語から英語に翻訳される。

　制御部２２は、翻訳サーバ４２から置換文の翻訳結果を受信すると（Ｓ２４）、置換情報３３Ａおよび代替語辞書３２Ａを参照して、受信した置換文の翻訳結果の文章において、代替用語の訳語を検知する（Ｓ２５ａ）。具体的に、制御部２２は、置換情報３３Ａにおける置換後の用語Ｊ２３の訳語Ｅ２３を、代替語辞書３２Ａから読み出し、機械翻訳の結果の文章において、訳語Ｅ２３を検索する。

　上記のような場合、翻訳サーバ４２における置換文の翻訳結果の文章に、あらかじめ想定した代替用語の訳語Ｅ２３が含まれていない場合が考えられる。制御部２２は、ステップＳ２５ａの検知結果に基づいて、翻訳サーバ４２から受信した置換文の翻訳結果の文章中に、代替用語の訳語があるか否かを判断する（Ｓ２５ｂ）。

　制御部２２は、置換文の翻訳結果に代替用語の訳語がないと判断すると（Ｓ２５ｂでＮＯ）、代替語辞書３２Ａを参照して、代替用語の下位候補があるか否かを判断する（Ｓ２５ｃ）。代替用語の下位候補は、代替語辞書３２Ａにおいて、置換文に用いた代替用語と同じクラスの中で、当該代替用語よりも下位の優先順位を有する代替用語である。

　代替用語の下位候補がある場合（Ｓ２５ｃでＹＥＳ）、制御部２２は、代替用語の下位候補の中で最も高い優先順位を有する代替用語を選択し（Ｓ２１ａ）、ステップＳ２１ｂ以降の処理を再度、行う。これにより、優先順位が高い順に代替用語を用いて置換文が繰り返し生成され、翻訳サーバ４２に送信される（Ｓ２３）。翻訳エンジン５は順次、受信した置換文の機械翻訳を実行する。

　制御部２２は、置換文の翻訳結果に代替用語の訳語があると判断すると（Ｓ２５ｂでＹＥＳ）、代替用語の訳語を登録用語の訳語に置換して、実施形態１と同様に翻訳文を生成する（Ｓ２６）。その後、制御部２２は、図７のステップＳ７を終了し、ステップＳ８に進む。

　以上の処理によると、代替用語を含めて置換文を生成した際に、翻訳エンジン５による置換文の翻訳結果に、当該代替用語に対して想定した訳語が含まれていなかった場合には（Ｓ２５ｂでＮＯ）、別の代替用語を用いて置換文の生成などが再び行われる（Ｓ２１ａ～Ｓ２４）。このような別々の代替用語による複数の置換文に対する機械翻訳の結果のいずれかに、想定した代替用語の訳語が含まれていれば（Ｓ２５ｂでＹＥＳ）、未知語を復元した翻訳文を得ることができる（Ｓ２６）。又、未知語の復元を失敗して代替用語の訳語Ｅ２３に類似した訳語が未知語の代わりに含まれた文章が、ユーザに見えてしまう事態を回避し易くすることができる。このように、翻訳文の精度を良くすることができる。

　なお、置換文の翻訳結果に代替用語の訳語がないとの判断（Ｓ２５ｂでＮＯ）が繰り返され、代替用語の下位候補がなくなった場合（Ｓ２５ｃでＮＯ）、制御部２２は、例えばステップＳ２６の処理を行わず、図７のステップＳ７を終了する。

　上記の場合、続くステップＳ８において、制御部２２は、例えば最後に受信した置換文の翻訳結果を翻訳文としてディスプレイ１４に表示させてもよい。例えば、代替語辞書３２Ａにおいて優先順位が最下位の代替用語として、翻訳結果が表示されたとしても、ホスト等のユーザの不快感を招かないと考えられる用語を登録しておく。これにより、最終的に未知語の復元を失敗した文章が表示されたとしてもユーザの不快感を生じにくくすることができる。また、上記翻訳文の表示に代えて、又はこれに加えて、制御部２２は、各種のエラー表示を表示させてもよい。

　以上のように、本実施形態において、翻訳装置１は、第１の言語における入力文を取得し、第１の言語から第２の言語への機械翻訳を実行する翻訳サーバ４３等と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置１は、記憶部２０と、制御部２２と、通信部１８とを備える。記憶部２０は、第１の辞書情報の一例である登録語辞書３１、及び第２の辞書情報の一例である代替語辞書３２Ａを記憶する。本実施形態の代替語辞書３２Ａは、第１の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第２の言語の訳語とを対応づけて含む。制御部２２は、通信部１８から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する（Ｓ２５ｂ）。制御部２２は、代替用語の訳語がないと判断した場合（Ｓ２５ｂでＮＯ）、代替語辞書３２Ａにおいて当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部１８に出力させる（Ｓ２５ｃ～Ｓ２３）。制御部２２は、代替用語の訳語があると判断した場合（Ｓ２５ｂでＹＥＳ）、当該訳語を、登録語辞書３１において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する（Ｓ２６）。

　以上の翻訳装置１によると、代替用語を含めた置換文の翻訳結果に、代替語辞書３２Ａにおいて対応する代替用語の訳語がなかった場合（Ｓ２５ｂでＮＯ）、別の代替用語を用いて再度、置換文の機械翻訳が行われる。このように、複数回の置換文を用いることで、１回の置換文のみの場合よりも、翻訳文の復元が最終的に失敗する可能性を低減し、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。又、未知語の復元を失敗した文章が、ユーザに見えてしまう事態を回避し易くすることができる。

　本実施形態において、代替語辞書３２Ａは、複数の代替用語における優先順位を管理してもよい。制御部２２は、複数の代替用語において優先順位が高い代替用語から順番に、置換文に用いる（Ｓ２１ａ）。例えば、置換文の翻訳結果に訳語が含まれる可能性が高い代替用語の優先順位を高く設定することにより、翻訳文の復元を効率良く成功させることができる。

（他の実施形態）
　以上のように、本出願において開示する技術の例示として、実施形態１～２を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。

　上記の実施形態２における語彙置換／復元処理（図１１）では、実施形態１における特定の文字列が用いられてもよい。このような変形例について、図１３を用いて説明する。

　図１３は、本変形例における代替語辞書３２Ｂを例示する。例えば実施形態２と同様の代替語辞書３２Ｂにおいて、実施形態１の代替文字列が登録されてもよい。図１３の例では、代替語辞書３２Ｂに、文字列Ｗ１が代替用語として含まれている。本例の代替語辞書３２Ｂでは、日本語及び英語といった各言語において、同じ文字列Ｗ１が記載されている。

　上記の代替語辞書３２Ｂによると、制御部２２は、例えば図１１のステップＳ２１ｂにおいて日本語等の翻訳元の言語の記載を参照して、文字列Ｗ１を代替用語として用いる。又、ステップＳ２５ａでは、英語等の翻訳先の言語の記載を参照して、同じ文字列Ｗ１が代替用語の訳語として用いられる。このように、特殊な文字列Ｗ１と他の代替用語とを同様に用いて、語彙置換／復元処理を行うことができる。

　以上のように、本変形例において、代替語辞書３２Ｂにおける複数の代替用語は、特定の文字列で構成された代替用語を含んでもよい。代替語辞書３２Ｂは、特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含んでもよい。

　また、実施形態１の代替語辞書３２を用いて、実施形態２と同様の語彙置換／復元処理が行われてもよい。例えば図５の代替語辞書３２において、代替文字列間の優先順位は、クラス毎に登録された昇順に設定可能である。

　上記の代替語辞書３２によると、図１１と同様の処理時に、制御部２２は、ステップＳ２５ａ，Ｓ２５ｂにおいて、代替用語の訳語の代わりに、図８のステップＳ２５と同様に代替文字列の有無を検知する。この際、代替文字列がないことが検知されれば（Ｓ２５ｂでＮＯ）、異なる文字列で構成される別の代替文字列を用いて置換文の生成が繰り返され（Ｓ２１ａ～Ｓ２５ｃ）、翻訳文の精度を向上できる。

　以上のように、本変形例において、代替語辞書３２は、互いに異なる文字列で構成された複数の代替用語を含んでもよい。制御部２２は、通信部１８から取得した置換文の翻訳結果において、置換文に用いた文字列がないことを検知すると（Ｓ２５ｂでＮＯ）、当該文字列の代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部１８に出力さてもよい（Ｓ２５ｃ～Ｓ２３）。

　上記の各実施形態の翻訳装置１は、発話の言語（例えば、日本語）を他の言語（例えば、英語）に翻訳して得られた翻訳結果である翻訳文を、元の言語（例えば、日本語）に翻訳する逆翻訳機能をさらに有してもよい。この場合、翻訳装置１は、置換された状態の翻訳文を翻訳サーバ４に送信し、翻訳サーバ４から逆翻訳文を取得する。

　上記の各実施形態では、音声認識を音声認識サーバ４１で行い、翻訳を翻訳サーバ４２で行い、音声合成を音声合成サーバ５で行ったが、本開示はこれに限定されない。音声認識、翻訳及び音声合成の少なくとも一つの処理を翻訳装置１内で行ってもよい。例えば、翻訳装置１（端末）に、音声認識サーバ４１、翻訳サーバ４２、及び音声合成サーバ４３と同一の機能を全て搭載して、翻訳装置１のみで翻訳に関連する全ての処理を行うようにしてもよい。この場合、翻訳装置１は、通信ネットワーク４に接続するような通信部１８を有さなくてもよい。例えば制御部２２において翻訳サーバ４の機能である翻訳エンジン５と情報の受け渡しを行う機能が、翻訳エンジン５に対する通信部を構成してもよい。

　上記の各実施形態では、日本語と英語の間の翻訳の例を示した。しかし、翻訳処理の対象とする言語は、日本語と英語に限定されず、他の言語であってもよく、例えば中国語、独語、仏語、スペイン語、韓国語、タイ語、ベトナム語、インドネシア語等であってもよい。

　上記の各実施形態において、翻訳装置１は、マイク１０で入力した発話文を入力文として翻訳したが、発話以外で入力した入力文を翻訳してもよい。例えば、翻訳装置１は、キーボードやマウスなどで入力した入力文を翻訳してもよい。つまり、本開示の翻訳装置１は、種々の入力文の文章を翻訳するときに、文章中の置換対象の用語を代替用語に置換して翻訳する。そして、翻訳文に含まれる代替用語の訳語を、代替用語により置換された置換対象の用語に対する訳語に復元し、翻訳文を表示する。

　以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。

　したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。

　また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において、種々の変更、置換、付加、省略などを行うことができる。

　本開示は、種々の場面で各種の言語間における翻訳を行うための翻訳装置に適用可能である。

Claims

　第１の言語における入力文を取得し、前記第１の言語から第２の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
　前記第１の言語の置換対象の用語と、前記置換対象の用語に対する前記第２の言語の訳語とを対応づけて含む第１の辞書情報、及び、前記置換対象の用語の代わりに使用される、少なくとも１つの代替用語を含む第２の辞書情報を記憶する記憶部と、
　前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
　前記置換文を前記外部装置に出力し、前記外部装置から前記第２の言語における前記置換文の翻訳結果を取得する通信部とを備え、
　前記代替用語は、特定の文字列で構成され、
　前記制御部は、
　　前記通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、
　　検知した文字列を、前記第１の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成する
翻訳装置。
　前記特定の文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号と、前記先頭の記号と前記末尾の記号との間に並んだ互いに同種の複数文字とを含む
請求項１に記載の翻訳装置。
　前記第２の辞書情報は、互いに異なる文字列で構成された複数の代替用語を含み、
　前記制御部は、前記通信部から取得した置換文の翻訳結果において、前記置換文に用いた文字列がないことを検知すると、当該文字列の代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させる
請求項１又は２に記載の翻訳装置。
　第１の言語における入力文を取得し、前記第１の言語から第２の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
　前記第１の言語の置換対象の用語と、前記置換対象の用語に対する前記第２の言語の訳語とを対応づけて含む第１の辞書情報、及び、前記第１の言語において前記置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する前記第２の言語の訳語とを対応づけて含む第２の辞書情報を記憶する記憶部と、
　前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
　前記置換文を前記外部装置に出力し、前記外部装置から前記第２の言語における前記置換文の翻訳結果を取得する通信部とを備え、
　前記制御部は、
　　前記通信部から取得した置換文の翻訳結果において、前記代替用語の訳語があるか否かを判断し、
　　前記代替用語の訳語がないと判断した場合、前記第２の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させ、
　　前記代替用語の訳語があると判断した場合、当該訳語を、前記第１の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成する
翻訳装置。
　前記複数の代替用語は、特定の文字列で構成された代替用語を含み、
　前記第２の辞書情報は、前記特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含む
請求項４に記載の翻訳装置。
　前記第２の辞書情報は、前記複数の代替用語における優先順位を管理し、
　前記制御部は、前記複数の代替用語において前記優先順位が高い代替用語から順番に、前記置換文に用いる
請求項３～５のいずれか１項に記載の翻訳装置。
　前記置換対象の用語は、固有名詞を含む
請求項１～６のいずれか１項に記載の翻訳装置。
　前記第２の辞書情報は、用語の種別を示すクラス毎に前記代替用語を分類しており、
　前記制御部は、前記入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、前記置換文を生成する
請求項１～７のいずれか１項に記載の翻訳装置。
　発話を入力する音声入力部をさらに備え、
　前記通信部は、前記発話の音声データを外部の音声認識装置に出力し、前記音声認識装置から前記音声データに対する前記入力文を取得する
請求項１～８のいずれか１項に記載の翻訳装置。