WO2019016985A1

WO2019016985A1 - 翻訳装置、翻訳方法及びプログラム

Info

Publication number: WO2019016985A1
Application number: PCT/JP2018/003367
Authority: WO
Inventors: 夏樹佐伯
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2017-07-20
Filing date: 2018-02-01
Publication date: 2019-01-24
Also published as: US20200143793A1; US11264007B2; JP7170279B2; CN110892407A; JPWO2019016985A1; EP3657361A1; EP3657361A4

Abstract

翻訳装置は、音声認識部と、記憶部と、翻訳処理部と、情報取得部とを備える。音声認識部は、音声を認識して、第１言語における発話文を生成する。記憶部は、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文を格納する。翻訳処理部は、発話文に基づいて記憶部に格納された複数の用例文を検索して検索結果の用例文を取得し、検索結果の用例文に基づく変換文を生成する。情報取得部は、特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得する。翻訳処理部は、検索結果の用例文が特定のパラメータを含む場合、当該特定情報が示す特定の用語に基づく変換文を生成する。

Description

翻訳装置、翻訳方法及びプログラム

　本開示は、機械翻訳を実行する翻訳装置、翻訳方法及びプログラムに関する。

　特許文献１は、機械翻訳装置を開示している。特許文献１の機械翻訳装置は、原言語の用例文と、原言語の用例文を翻訳した対象言語の用例文とを対応づけて記憶している。機械翻訳装置は、音声発話を音声認識し、音声認識結果と用例文との類似度を算出して、類似度がしきい値以上の用例文を用いて翻訳を行っている。

　特許文献２は、音声認識結果にユーザの読み間違いなどによる不明瞭な単語が含まれる場合であっても、ユーザの発話を適切に理解するための発話解析方法を開示している。特許文献２の発話解析方法では、ユーザの発話を示す音声データを音声認識した認識結果から、予め定めたルールに従って、ユーザの発話の意図に沿わない不明瞭な単語を推定している。発話解析方法では、推定された不明瞭単語と読み間違い単語との類似性に基づいて、ユーザの意図に沿った正解単語を類推している。

特許第４３９３４９４号公報特開２０１４－１４５８４２号公報

　本開示の目的は、発話の音声認識に基づく機械翻訳の精度を良くすることができる翻訳装置及び翻訳方法を提供することである。

　本開示に係る翻訳装置は、音声認識部と、記憶部と、翻訳処理部と、情報取得部とを備える。音声認識部は、音声を認識して、第１言語における発話文を生成する。記憶部は、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文を格納する。翻訳処理部は、発話文に基づいて記憶部に格納された複数の用例文を検索して検索結果の用例文を取得し、検索結果の用例文に基づく変換文を生成する。情報取得部は、特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得する。翻訳処理部は、検索結果の用例文が特定のパラメータを含む場合、当該特定情報が示す特定の用語に基づく変換文を生成する。

　本開示に係る翻訳方法は、翻訳装置が実行する翻訳方法である。翻訳装置の記憶部には、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文が格納されている。翻訳方法は、特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得するステップと、音声を認識して、第１言語における発話文を生成するステップと、発話文に基づいて記憶部に格納された複数の用例文を検索して検索結果の用例文を取得し、検索結果の用例文に基づく変換文を生成するステップとを含む。変換文を生成するステップにおいて、検索結果の用例文が特定のパラメータを含む場合、当該特定情報が示す特定の用語に基づいて変換文が生成される。

　本開示に係る翻訳装置及び翻訳方法によると、発話文に対応する用例文中のパラメータに対する特定情報が取得された場合には特定の用語に基づいて翻訳文を生成する。これにより、発話の音声認識に基づく機械翻訳の精度を良くすることができる。

図１は、実施形態１に係る翻訳システムの構成を示すブロック図である。図２は、翻訳システムにおける用例文データベースを説明するための図である。図３は、翻訳システムにおけるパラメータテーブルを説明するための図である。図４は、パラメータのサブカテゴリを説明するための図である。図５は、翻訳システムの動作を説明するためのフローチャートである。図６は、翻訳システムの動作を説明するための図である。図７は、翻訳システムにおける情報更新処理を説明するための図である。図８は、翻訳システムにおける情報更新処理を説明するためのフローチャートである。図９は、翻訳システムにおける翻訳処理を説明するためのフローチャートである。図１０は、翻訳システムにおける翻訳処理を説明するための図である。図１１は、情報更新処理の変形例を説明するための図である。

　以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

　なお、出願人は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。

　（実施形態１）
　実施形態１では、本開示に係る翻訳装置を、航空機の乗客に対するアナウンスを翻訳する翻訳システムに適用する適用例について説明する。

　１．構成
　実施形態１に係る翻訳システム及び翻訳装置の構成について、図１を用いて説明する。図１は、本実施形態に係る翻訳システム１の構成を示すブロック図である。

　本実施形態の翻訳システム１は、図１に示すように、マイクロホン（以下「マイク」と略記する）１１と、複数のディスプレイ装置１２と、翻訳装置２とを備える。翻訳システム１は、例えば航空機の機内に設置される。翻訳システム１では、例えば客室乗務員がマイク１１を用いて種々の機内アナウンスを行う際に、翻訳装置２が、機内アナウンスの機械翻訳を行う。ディスプレイ装置１２は、乗客の座席等において機械翻訳による翻訳文を表示する。

　マイク１１は、客室乗務員等のユーザに用いられる。マイク１１は、ユーザの発話を含む音声を収音し、収音結果の音声データを生成する。翻訳システム１は、さらに、図示しないスピーカを備えてもよい。スピーカは、マイク１１によって生成された音声データを機内に音声出力する。

　ディスプレイ装置１２は、例えば乗客の座席に備え付けられている。ディスプレイ装置１２は、液晶ディスプレイ又は有機ＥＬディスプレイ等のモニタ、ＣＰＵ等のコントローラ、通信Ｉ／Ｆ（インタフェース）および操作Ｉ／Ｆなどを備える。ディスプレイ装置１２は、コントローラの制御により、翻訳文などの各種情報をモニタに表示する。

　本実施形態において、ディスプレイ装置１２は、機内に構築された有線又は無線のＬＡＮ等の通信ネットワークを介して、翻訳装置２に接続されている。乗客等のユーザは、操作Ｉ／Ｆを介してディスプレイ装置１２を操作可能であり、例えば表示される翻訳文の言語を設定可能である。

　翻訳装置２は、マイク１１からの音声データの音声認識によって得られる発話文に対して、予め設定された用例文を用いて機械翻訳を実行するコンピュータ装置である。用例文は、例えば機内アナウンス等において、頻繁に用いられることが想定される定型の文章である。翻訳装置２は、図１に示すように、制御部２０と、記憶部２１と、通信部２２と、操作部２３とを備える。

　制御部２０は、翻訳装置２の全体動作を制御する。制御部２０は、例えばソフトウェアと協働して所定の機能を実現するＣＰＵ等を含む。制御部２０は、記憶部２１に格納されたデータ及びプログラムを読み出して種々の演算処理を行い、各種の機能を実現する。制御部２０は、マイク１１及び各ディスプレイ装置１２とデータの送受信を行う通信Ｉ／Ｆを含み、翻訳システム１の各種動作を制御してもよい。

　例えば、制御部２０は、音声認識部２０ａ、翻訳処理部２０ｂ、及び情報更新処理部２０ｃとして機能する。音声認識部２０ａは、マイク１１から出力される音声データに基づいて、音声認識を実行する。翻訳処理部２０ｂは、音声認識部２０ａの認識結果に基づいて、第１言語から第２言語への翻訳処理を実行する。第１及び第２言語としては、種々の言語を採用することができる。情報更新処理部２０ｃは、翻訳処理に用いる情報を更新する情報更新処理を実行する。各種処理の詳細については後述する。

　なお、制御部２０は、所定の機能を実現するように設計された専用の電子回路や再構成可能な電子回路などのハードウェア回路であってもよい。制御部２０は、ＣＰＵ、ＭＰＵ、ＧＰＵ、ＧＰＧＰＵ、ＴＰＵ、マイコン、ＤＳＰ、ＦＰＧＡ、ＡＳＩＣ等の種々の半導体集積回路で構成されてもよい。また、音声認識部２０ａ、翻訳処理部２０ｂ、及び情報更新処理部２０ｃとしてそれぞれ機能する別々のハードウェア資源が用いられてもよい。

　記憶部２１は、翻訳装置２の機能を実現するために必要なプログラム及びデータを記憶する記憶媒体である。記憶部２１は、例えばハードディスク（ＨＤＤ）又は半導体記憶装置（ＳＳＤ）などで構成される。上記のプログラムは、各種の通信ネットワークから提供されてもよいし、可搬性を有する記録媒体に格納されていてもよい。

　例えば、記憶部２１は、各ディスプレイ装置１２の言語設定を示す情報、用例文データベース２１ａ、及びパラメータテーブル２１ｂ等を格納する。以下、「データベース」を「ＤＢ」と略記する場合がある。用例文ＤＢ２１ａは、翻訳処理において用いられる用例文を管理するデータベースである。用例文は、頻繁に用いられることが想定される定型の文章である。用例文の中で種々の用語に置き換え可能な箇所は、パラメータとして記述される。パラメータテーブル２１ｂは、用例文中のパラメータに関する情報を管理するデータテーブルである。用例文ＤＢ２１ａ，パラメータテーブル２１ｂについては後述する。

　記憶部２１は、例えばＤＲＡＭ又はＳＲＡＭ等のＲＡＭを含んでもよく、データを一時的に記憶したり、制御部２０の作業エリアとして機能したりしてもよい。また、記憶部２１は、例えば制御部２０が実行するプログラム及び固定パラメータなどを格納するＲＯＭを含んでもよい。

　通信部２２は、翻訳システム１の外部のシステム等に、通信ネットワークを介して通信接続するＩ／Ｆ回路である。外部システムは、例えば航空機の便名、出発地、目的地などを示す情報を含むフライト情報を取り扱う航空機のシステムである。通信部２２は、本実施形態における情報取得部の一例である。

　操作部２３は、ユーザの操作の入力を受ける入力装置である。操作部２３は、例えば、キーボード、タッチパッド、タッチパネル、ボタン、スイッチ、及びこれらの組み合わせで構成される。操作部２３は、機内のコックピットにおいてパイロット等が操作可能な各種入力装置を含んでもよい。操作部２３は、本実施形態における情報取得部の一例である。

　１－１．データベースについて
　本実施形態において翻訳装置２の記憶部２１に格納される用例文ＤＢ２１ａ及びパラメータテーブル２１ｂについて、図２，３，４を用いて説明する。図２は、用例文ＤＢ２１ａを説明するための図である。図３は、パラメータテーブル２１ｂを説明するための図である。

　図２は、航空機の機内アナウンスに用いられることが想定される複数の用例文を格納した用例文ＤＢ２１ａを例示している。図２に例示する用例文ＤＢ２１ａは、用例文の識別番号「Ｎｏ．」と、互いに対訳となる「日本語」及び「英語」の用例文とを関連付けて記録している。用例文ＤＢ２１ａは、さらに、中国語及び韓国語などの種々の言語の用例文を関連付けていてもよい。以下では、翻訳装置２における翻訳元の第１言語が日本語であり、翻訳先の第２言語が英語である場合について説明する。この場合、用例文ＤＢ２１ａにおける「英語」の用例文は、関連付けされた「日本語」の用例文の対訳文となる。

　用例文ＤＢ２１ａ中の「Ｎｏ．１」の用例文は、{%airports!%}というパラメータと、{%flight_num%}というパラメータとを含んでいる。記号「{%」は用例文中のパラメータ箇所の始端を示し、記号「%}」はパラメータ箇所の終端を示す。各パラメータは、置換可能な複数の用語に対応するカテゴリを示している。例えば、パラメータ「{%airports!%}」は、種々の空港名に置換可能なカテゴリ「airports!」を示している。また、パラメータ「{%flight_num%}」は、種々の便名に置換可能なカテゴリ「flight_num」を示している。各種パラメータに関する情報は、パラメータテーブル２１ｂで管理される。なお、記号「!」は、カテゴリに応じたパラメータの重み付けを示す。

　図３に例示するパラメータテーブル２１ｂは、「カテゴリ名」と、「検索語彙」と、「訳語」とを関連付けて記録している。「カテゴリ名」は、上記のようなパラメータのカテゴリの名称を示す。「検索語彙」は、翻訳元の第１言語の文中でパラメータに対応する用語を検索するための語彙を示す。「訳語」は、「検索語彙」に該当した用語に対する、翻訳先の第２言語の対訳の用語を示す。

　図３の例では、「検索語彙」は日本語で設定されている。「検索語彙」は、各カテゴリにおいて複数の言い方がある用語を検索可能にする正規表現で記述される。例えば、図３の検索語彙Ａ１によると、「羽田空港」、「東京空港」、「羽田国際空港」および「東京国際空港」といった用語を統一的に検索できる。パラメータテーブル２１ｂの「検索語彙」は、翻訳元の第１言語として用いる種々の言語で設定されてもよい。

　また、図３の例では、「訳語」は英語で設定されているが、パラメータテーブル２１ｂの「訳語」は、翻訳先として用いる第２言語に応じて、種々の言語で複数、登録されてもよい。

　図４は、パラメータのサブカテゴリを説明するための図である。本実施形態では、上記のようなパラメータのカテゴリを細分化するサブカテゴリを用いる。例えば、図４に示すように、カテゴリ「airports!」は、二つのサブカテゴリ「airports!:dest」、「airports!:irreg」を含む。サブカテゴリの指定は、記号「:」から行われる。

　サブカテゴリ「airports!:dest」は、目的地の空港を示す。サブカテゴリ「airports!:irreg」は、緊急着陸先の空港を示す。上記のサブカテゴリは、「空港」を、「本来の目的地の空港」と「緊急着陸先の空港」とに細分化している。各サブカテゴリのパラメータは、それぞれ図２の用例文ＤＢ２１ａ中の「Ｎｏ．２」、「Ｎｏ．３」の用例文に含まれている。カテゴリ「airports!」は、例えば出発地の空港など、さらなるサブカテゴリを含んでいてもよい。また、用例文ＤＢ２１ａ中の「Ｎｏ．１」の用例文のように、特にサブカテゴリが指定されないパラメータ{%airports!%}が用いられてもよい。

　サブカテゴリによる細分化は、空港名のカテゴリ「airports!」に限らず、種々のカテゴリにおいて行われてもよい。一例として、図４の例では、天気を示すカテゴリ「weather」が、今日の天気を示すサブカテゴリ「weather:today」と、明日の天気を示すサブカテゴリ「weather:tomorrow」とに細分化されている。本実施形態では、以上のようにサブカテゴリを用いて用例文ＤＢ２１ａ中のパラメータを構成することにより、サブカテゴリ毎に得られた情報に基づき翻訳装置２による翻訳精度を良くすることができる。

　２．動作
　以上のように構成される翻訳システム１及び翻訳装置２の動作を以下、説明する。

　２－１．全体動作
　翻訳システム１の全体動作について、図５，６を用いて説明する。図５は、翻訳システム１の動作を説明するためのフローチャートである。図６は、翻訳システム１の動作を説明するための図である。

　図５のフローチャートは、図１の翻訳システム１においてマイク１１が音声データを生成したときに開始される。本フローチャートによる各処理は、翻訳装置２の制御部２０によって実行される。

　まず、翻訳装置２の制御部２０は、マイク１１から音声データを取得する（Ｓ１）。図６の例では、「皆様、この飛行機はＡＢＣ航空、羽田空港行きです。」という発話がマイク１１に対して為されたときに得られた音声データＤ１を示している。

　次に、制御部２０は、取得した音声データＤ１に基づいて、発話文の音声認識を行う（Ｓ２）。具体的に、制御部２０は、音声認識部２０ａとして機能し、音声データＤ１に対して、予め設定された第１言語における音声認識処理を行う。音声認識部２０ａは、音声認識結果の発話文Ｄ２をテキストデータとして生成する。

　次に、制御部２０は、音声認識結果の発話文Ｄ２に基づいて、第１言語から第２言語への翻訳処理を行う（Ｓ３）。図６では、第１言語が日本語であり、第２言語が英語である例を示している。

　ステップＳ３の翻訳処理は、翻訳処理部２０ｂとしての制御部２０が、用例文ＤＢ２１ａにおいて、音声認識結果の発話文Ｄ２に類似する用例文を検索することによって行われる。この際、検索結果の用例文に対応する対訳文中のパラメータを、復元箇所Ｐ０のように、適切な訳語に復元することで、テキストデータの翻訳文Ｄ３が生成される。以上のような翻訳処理によると、用例文ＤＢ２１ａに複数の言語で対訳文を格納しておくことにより、種々の第２言語への翻訳が可能となる。ステップＳ３の翻訳処理の詳細については後述する。翻訳文Ｄ３は、本実施形態における変換文の一例である。

　次に、制御部２０は、翻訳結果の翻訳文Ｄ３をディスプレイ装置１２に送信して、ディスプレイ装置１２に翻訳文Ｄ３を表示させる（Ｓ４）。この際、制御部２０は、ディスプレイ装置１２毎に予め設定された言語の翻訳結果を配信する。また、制御部２０は、翻訳文における復元箇所Ｐ０をディスプレイ装置１２に強調表示させてもよい。強調表示は、太字、下線、マーカ等の種々の方法で行える。

　制御部２０は、ディスプレイ装置１２への翻訳結果のデータ送信を行って（Ｓ４）、本フローチャートによる処理を終了する。

　以上の処理によると、例えば航空機の乗客が、機内アナウンスが放送されているときに、個々のディスプレイ装置１２において所望の言語の翻訳結果を確認することができる。

　また、以上の処理によると、例えばステップＳ２の音声認識に誤認識が生じた場合においても、誤認識の影響を低減して精度良くステップＳ３の機械翻訳を行うことができる。例えば、図６の例では、ステップＳ２の音声認識結果に誤認識箇所Ｐ１が含まれている。これに対して、ステップＳ３の翻訳処理によると、発話文Ｄ２の一部に誤認識箇所Ｐ１が含まれていても、誤認識箇所Ｐ１以外の部分において音声認識結果の発話文Ｄ２に類似した用例文が検索される。そして、検索された用例文に対応した適切な翻訳文Ｄ３が生成される。

　以上の処理においては、カテゴリに応じたパラメータを用いることにより、同一カテゴリ内の別々の用語を含む発話文に対して、共通の用例文を用いて処理することができる。ところで、上記のようなパラメータに対応する用語は、事前に確定している場合がある。例えば、航空機の機内アナウンスにおいて、目的地及び便名などの情報は、航空機の運行前の時点で確定することとなる。また、緊急着陸先の空港は、出発時には確定していないが、緊急のアナウンス時には確定している。

　本実施形態の翻訳システム１では、上記のような事前に確定している情報を利用して翻訳精度を良くするために、種々のカテゴリにおけるサブカテゴリ毎に、パラメータに対応付ける用語を確定させる情報更新機能を導入する。このような情報更新機能を実現する本実施形態の情報更新処理について、以下説明する。

　２－２．情報更新処理
　本実施形態の情報更新処理について、図７，８を用いて説明する。図７は、本実施形態の情報更新処理を説明するための図である。

　図７では、「airports!:dest」というサブカテゴリのパラメータと、「羽田空港」を意味する用語Ａ２とを示す情報を含んだパラメータ確定情報を例示している。パラメータ確定情報は、サブカテゴリで規定される特定のパラメータに特定の用語を対応付けることが確定されたことを示す特定情報の一例である。制御部２０は、通信部２２或いは操作部２３のような各種情報取得部を介して、パラメータ確定情報を取得する。

　本実施形態の情報更新処理では、図７に示すように、翻訳システム１においてパラメータ確定情報が取得されたときに、翻訳装置２の記憶部２１におけるパラメータテーブル２１ｂを更新する。以下では、取得されたパラメータ確定情報において、特定のパラメータに対する用語が第１言語（日本語）で確定された場合に実行される情報更新処理について説明する。

　図８は、本実施形態の情報更新処理を説明するためのフローチャートである。図８のフローチャートによる各処理は、翻訳装置２の制御部２０が、情報更新処理部２０ｃとして機能することによって実行される。

　まず、制御部２０は、各種情報取得部を介して、パラメータ確定情報を取得する（Ｓ１１）。例えば、制御部２０は、通信部２２を介して翻訳システム１の外部システムから入手した、航空機の運行に関するフライト情報などの所定の情報から、現時点で各種サブカテゴリについて確定した用語の情報を検索する。また、制御部２０は、操作部２３におけるユーザの入力により、各種サブカテゴリについて確定された用語の情報を取得してもよい。

　次に、制御部２０は、パラメータ確定情報の確定された用語が、パラメータテーブル２１ｂの検索語彙に含まれるか否かを判断する（Ｓ１２）。例えば、確定された用語が用語Ａ２である場合、図７に示すように、カテゴリ「airports!」における１行目の検索語彙の正規表現にマッチすることから、制御部２０は、ステップＳ１２で「Ｙｅｓ」に進む。

　制御部２０は、確定された用語がパラメータテーブル２１ｂの検索語彙に含まれると判断した場合（Ｓ１２で「Ｙｅｓ」）、パラメータテーブル２１ｂを参照して、確定された用語の訳語を特定する（Ｓ１３）。例えば、制御部２０は、パラメータテーブル２１ｂにおいて用語Ａ２の正規表現に関連付けされた訳語「Tokyo International Airport」を特定する。パラメータテーブル２１ｂに複数の言語で訳語が格納されている場合、制御部２０は、各々の言語における訳語を一括して特定可能である。

　一方、制御部２０は、確定された用語がパラメータテーブル２１ｂの検索語彙に含まれないと判断した場合（Ｓ１２で「Ｎｏ」）、パラメータテーブル２１ｂ中の検索の代わりに外部から、各種情報取得部を介して確定された用語の訳語を取得する（Ｓ１４）。

　次に、制御部２０は、パラメータ確定情報の確定された用語に対応付けるサブカテゴリのパラメータ及び訳語を保存するように、パラメータテーブル２１ｂを更新する（Ｓ１５）。図７の例では、パラメータ確定情報の用語Ａ２を「airports!:dest」に対応付けるために、制御部２０は、カテゴリ名として「airports!:dest」と、訳語「Tokyo International Airport」とを関連付けてパラメータテーブル２１ｂに登録する。

　以上の処理によると、パラメータテーブル２１ｂにおいて、サブカテゴリのパラメータに対するパラメータ確定情報の更新状態を管理することができる。図７のようにパラメータテーブル２１ｂに登録されたサブカテゴリ「airports!:dest」を含む情報は、本実施形態では、語彙の検索等には特に利用されず、パラメータ確定情報を示すものとして用いられる。

　以上のようにパラメータ確定情報が得られた状態において、翻訳処理（図５のＳ３）を実行する際に、翻訳装置２は、該当するサブカテゴリのパラメータに対して保存した訳語を用いることで、翻訳精度を向上させる。本実施形態の翻訳処理の詳細について、以下説明する。

　２－３．翻訳処理
　図５のステップＳ３の翻訳処理について、図９，１０を用いて説明する。図９は、翻訳システム１における翻訳処理を説明するためのフローチャートである。図１０は、翻訳処理を説明するための図である。

　図９に示すフローチャートの各処理は、翻訳装置２の制御部２０が、翻訳処理部２０ｂとして機能することによって実行される。本フローチャートは、図５のステップＳ２の実行後に開始される。

　まず、制御部２０は、パラメータテーブル２１ｂを参照して、音声認識結果の発話文において、パラメータが示すカテゴリに含まれる語彙を検索する（Ｓ３０）。例えば、制御部２０は、図１０に示すように、テキストデータの発話文Ｄ２に検索式Ｅ１を適用して、用語Ａ２を特定する。検索式Ｅ１は、図３に示すように、パラメータテーブル２１ｂにおいて、検索語彙の正規表現としてカテゴリ「airports!」に関連付けされている。なお、ステップＳ３０の語彙検索は、特にサブカテゴリを用いずに実行される（図７参照）。

　次に、制御部２０は、発話文において語彙検索結果の用語をパラメータに置換すると共に、置換前後の対応関係を示す置換情報を生成する（Ｓ３１）。例えば、制御部２０は、生成した置換情報を記憶部２１に一時的に記憶する。

　図１０の例では、制御部２０は、発話文Ｄ２において用語Ａ２を、対応するカテゴリのパラメータ{%airports!%}に置換する。さらに、制御部２０は、語彙検索の結果に基づき、パラメータテーブル２１ｂから用語Ａ２の正規表現に関連付けされた訳語「Tokyo International Airport」を取得する。制御部２０は、パラメータ{%airports!%}と置換元の用語Ａ２と訳語「Tokyo International Airport」とを関連付けて、図１０に示すように置換情報Ｄ４を生成する。

　次に、制御部２０は、パラメータの置換後の発話文に基づいて、図２の用例文ＤＢ２１ａから発話文に類似する用例文を検索するためのスコアを、用例文毎に計算する（Ｓ３２）。制御部２０は、例えば図１０のような発話文の文字列Ｄ２０と用例文の文字列Ｄ２１との間のいわゆる編集距離（レーベンシュタイン距離）を計算して、スコアを算出する。また、編集距離とは別の公知の手法を適用して各用例文のスコアを算出し、発話文に対する類似度を評価することもできる。

　図１０の例では、評価対象の文字列Ｄ２０，Ｄ２１において、カテゴリの重み付け記号「！」が、類似度の評価に対する寄与を大きくするために、所定の複数個（例えば５個）の文字「＿」に置き換えられている。また、句読点などの文字は、類似度の評価に寄与しないようにするために、各文字列Ｄ２０，Ｄ２１から除外されている。さらに、用例文ＤＢ２１ａ中の用例文に含まれた「:dest」のようなサブカテゴリの情報についても、編集距離の計算に用いずに、句読点などと同様に類似度の評価に寄与させないようにしている。

　次に、制御部２０は、スコアの計算結果に基づいて、用例文ＤＢ２１ａにおける検索結果の用例文を決定する（Ｓ３３）。例えば、制御部２０は、最も高いスコアを有する用例文を、検索結果の用例文として決定する。

　次に、制御部２０は、用例文ＤＢ２１ａを参照して、決定した用例文に関連付けされた対訳文を取得する（Ｓ３４）。図１０の例は、用例文ＤＢ２１ａから取得された対訳文にサブカテゴリのパラメータ{%airports!:dest%}が含まれる例を示している。

　次に、制御部２０は、例えばパラメータテーブル２１ｂを参照して、取得した対訳文が、予めパラメータ確定情報により確定されたサブカテゴリのパラメータを含むか否かを判断する（Ｓ３５）。例えば、図３のようにパラメータテーブル２１ｂにサブカテゴリのパラメータが特に登録されていない場合、或いは登録されたサブカテゴリのパラメータが取得した対訳文に含まれない場合、制御部２０はステップＳ３５で「Ｎｏ」に進む。

　制御部２０は、対訳文が、確定されたサブカテゴリを含まないと判断した場合（Ｓ３５でＮｏ）、発話文Ｄ２の置換時に記憶した置換情報Ｄ４に基づいて、対訳文中のパラメータを置換情報Ｄ４中の訳語に置換する（Ｓ３７）。この場合、発話文Ｄ２におけるパラメータの置換元の情報に基づいて、対訳文中のパラメータに対応する訳語を復元して、翻訳文Ｄ３が生成される。

　一方、制御部２０は、対訳文が確定されたサブカテゴリを含むと判断した場合（Ｓ３５でＹｅｓ）、例えば図７のようにパラメータテーブル２１ｂに登録されたパラメータ確定情報により、置換情報Ｄ４を更新する（Ｓ３６）。具体的に、制御部２０は、パラメータテーブル２１ｂに登録された訳語に基づいて、対応するパラメータの置換情報Ｄ４中の訳語を上書きする。

　この場合、制御部２０は、更新された置換情報に基づいて、対訳文中のパラメータを訳語に置換する（Ｓ３７）。これにより、発話文Ｄ２における置換元の情報の代わりに、事前に得られたパラメータ確定情報に基づきパラメータ{%airports!:dest%}が復元されて、翻訳文Ｄ３が生成される。

　次に、制御部２０は、パラメータを訳語に置換した対訳文を翻訳文Ｄ３として出力する（Ｓ３８）。これにより、制御部２０は、図５のステップＳ３の処理を終了し、ステップＳ４の処理に進む。

　以上の処理によると、パラメータ確定情報が事前に取得された場合に対応するパラメータを含む用例文が検索結果として決定された場合（Ｓ３５で「Ｙｅｓ」）、当該情報が示す特定の用語の訳語で対訳文中のパラメータを復元して、翻訳文Ｄ３が生成される。これにより、例えばパラメータの置換元の発話文Ｄ２の中の用語が、音声認識の誤認識あるいは発話の間違い等により誤っていた場合であっても、事前にパラメータ確定情報として得られた正解の訳語に翻訳でき、翻訳精度を向上できる。

　例えば、ステップＳ３０の検索対象の発話文が「皆様、この飛行機はＡＢＣ航空伊丹空港行きです」というように、パラメータ確定情報の用語「羽田空港」から誤って「伊丹空港」になっていた場合、パラメータの置換時（Ｓ３１）に得られる訳語は「Osaka International Airport」となる（図７参照）。これに対して、制御部２０は、置換情報をパラメータ確定情報で更新することにより（Ｓ３６）、翻訳文中では「羽田空港」の訳語「Tokyo International Airport」に復元することができる。

　また、ステップＳ３０の検索対象の発話文が「皆様、この飛行機はＡＢＣ航空あいうえお行きです」というように、空港名から誤って「あいうえお」になっていた場合、語彙検索に該当せず、パラメータへの置換が機能しないこととなる。このため、当該箇所の訳語がステップＳ３１の時点では得られない。これに対して、制御部２０は、置換情報をパラメータ確定情報で更新することにより（Ｓ３６）、翻訳文中では「羽田空港」の訳語「Tokyo International Airport」に復元することができる。

　以上の翻訳処理において、ステップＳ３１の処理は、ステップＳ３０において特に語彙検索に該当する用語が検索されなかった場合、適宜、省略される。また、ステップＳ３０において発話文の１文中に複数の用語が検索された場合には、制御部２０は、各々のパラメータに対して、それぞれ関連付けした置換情報を生成する。

　また、ステップＳ３３の処理において、スコアの計算は、用例文ＤＢ２１ａにおける一部の用例文に対して行われてもよい。例えば、制御部２０は、航空機の離陸前後、或いは搭乗中などのフライトシーンに関する情報を取得して、計算対象の用例文の絞り込みを行ってもよい。この場合、例えば用例文ＤＢ２１ａにおける用例文が、フライトシーンに応じて予め分類されていてもよい。

　また、ステップＳ３３の処理において、算出されたスコアに所定のしきい値以上のスコアがない場合、ステップＳ３４における翻訳文の出力を行わないようにしてもよい。これにより、翻訳精度が著しく低い翻訳文については、ディスプレイ装置１２に表示されないようにすることができる。

　３．効果等
　以上のように、本実施形態に係る翻訳装置２は、音声認識部２０ａと、記憶部２１と、翻訳処理部２０ｂと、情報取得部として通信部２２，操作部２３とを備える。音声認識部２０ａは、音声を認識して、第１言語における発話文Ｄ２を生成する。記憶部２１は、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文の用例文ＤＢ２１ａを格納する。翻訳処理部２０ｂは、発話文Ｄ２に基づいて記憶部２１に格納された複数の用例文を検索して検索結果の用例文を取得し、検索結果の用例文に基づく変換文の一例として第２言語による翻訳文Ｄ３を生成する。通信部２２または操作部２３は、特定のパラメータに対して対応付けられた特定の用語を示す特定情報であるパラメータ確定情報を取得する（図７，８）。翻訳処理部２０ｂは、検索結果の用例文が特定のパラメータを含む場合（Ｓ３５でＹｅｓ）、パラメータ確定情報が示す特定の用語に基づいて翻訳文Ｄ３を生成する。翻訳処理部２０ｂは、検索結果の用例文が当該特定のパラメータを含まない場合（Ｓ３５でＮｏ）、当該パラメータに対応する発話文Ｄ２中の用語に基づいて、翻訳文を生成する。

　以上の翻訳装置２によると、パラメータ確定情報が取得された場合には確定された用語に基づいて翻訳文Ｄ３を生成する。これにより、発話の音声認識に基づく機械翻訳の精度を良くすることができる。

　本実施形態において、上記の特定のパラメータは、カテゴリを細分化するサブカテゴリによって規定される（図４，８参照）。サブカテゴリ毎に用語を確定可能にすることで、他のサブカテゴリに干渉することなく、確定された用語を用いた翻訳精度を向上できる。

　また、本実施形態において、記憶部２１は、用例文ＤＢ２１ａにおいて、複数の用例文と、複数の用例文とそれぞれ対応する第２言語における複数の対訳文とを関連付けて格納する（図２参照）。翻訳処理部２０ｂは、検索結果の用例文に関連付けされた対訳文を用いて翻訳文を生成する（Ｓ３３～Ｓ３７）。これにより、発話文を種々の言語に翻訳可能である。

　また、本実施形態において、翻訳処理部２０ｂは、検索結果の用例文中のパラメータに対するパラメータ確定情報が取得されていない場合（Ｓ３５でＮｏ）、当該用例文に関連付けされた対訳文において、発話文中の用語に対する第２言語の訳語で当該パラメータを置換する。翻訳処理部２０ｂは、当該パラメータに対するパラメータ確定情報が取得された場合（Ｓ３５でＮｏ）、特定の用語に対する第２言語の訳語で当該パラメータを置換する。これにより、翻訳文における訳語をパラメータ確定情報で確定して、翻訳精度を向上できる。

　また、本実施形態において、翻訳処理部２０ｂは、各カテゴリに含まれる用語に対する検索式に基づいて、発話文Ｄ２においてパラメータに対応する用語を検索する（Ｓ３０）。これにより、パラメータが示すカテゴリに関して、発話文Ｄ２において語彙検索を行うことができる。

　また、本実施形態において、翻訳処理部２０ｂは、発話文Ｄ２において検索された用語を、対応するパラメータに置換し（Ｓ３１）、置換されたパラメータを含む発話文と各用例文との間の類似度に基づいて、用例文の検索を行う（Ｓ３２，Ｓ３３）。これにより、同一カテゴリの用語について統一的に、用例文の検索を行うことができる。

　また、本実施形態において、用例文ＤＢ２１ａ中の複数の用例文は、航空機内におけるアナウンスに用いられる文章を含む。本実施形態の翻訳装置２は、機内アナウンスに適用することができる。

　また、本実施形態に係る翻訳方法は、翻訳装置２が実行する翻訳方法である。翻訳装置２の記憶部２１には、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文が格納されている。本方法は、特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得するステップＳ１１と、音声を認識して、第１言語における発話文を生成するステップＳ１と、発話文に基づいて記憶部２１に格納された複数の用例文を検索して検索結果の用例文を取得し、検索結果の用例文に基づき翻訳文を生成するステップＳ３とを含む。翻訳文を生成するステップＳ３において、検索結果の用例文が特定のパラメータを含む場合（Ｓ３５でＹｅｓ）、当該特定情報が示す特定の用語に基づいて翻訳文が生成される。ステップＳ３において、検索結果の用例文が当該特定のパラメータを含む場合（Ｓ３５でＮｏ）、当該パラメータに対応する発話文中の用語に基づいて、翻訳文が生成される。

　以上の翻訳方法を翻訳装置２に実行させるためのプログラムが提供されてもよい。以上の翻訳方法及びプログラムによると、発話の音声認識に基づく機械翻訳の精度を良くすることができる。

　（他の実施形態）
　以上のように、本出願において開示する技術の例示として、実施形態１を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。

　上記の実施形態１では、パラメータ確定情報が得られた際の情報更新処理においてパラメータテーブル２１ｂを更新する例を説明した（図７，８参照）。情報更新処理においては、さらに、用例文ＤＢ２１ａが更新されてもよい。この変形例について、図１１を用いて説明する。

　図１１は、情報更新処理の変形例を説明するための図である。本変形例の情報更新処理では、制御部２０は、図８のステップＳ１５において、図１１に示すように、用例文ＤＢ２１ａにおいて、用例文のシャドウコピーＣ２を生成する。用例文のシャドウコピーは、パラメータ確定情報のサブカテゴリ「airports!:dest」のパラメータを含む用例文（Ｎｏ．２）において、確定された用語Ａ２がパラメータに代入されたデータである。

　用例文のシャドウコピーＣ２は、例えば実施形態１と同様の翻訳処理（図９）において、発話文が「皆様、この飛行機はＡＢＣ航空あいうえお行きです」というように、パラメータへの置換が機能しないような誤りが含まれる場合に有効である。即ち、このような発話文に対しては、パラメータを有する「Ｎｏ．２」の用例文と用例文のシャドウコピーＣ２とのいずれかのスコアが最大となることが想定される。このことから、いずれが検索結果としても翻訳文を適切に生成することができる。

　また、上記の各実施形態においては、パラメータ確定情報が得られた際に、図９のステップＳ３０の語彙検索については特に変更されなかった。例えば、パラメータ確定情報が得られた際には、確定された用語の検索を無効化するようにしてもよい。

　また、上記の各実施形態では、翻訳装置２を航空機の機内アナウンスの翻訳に適用する適用例を説明した。本開示の適用例はこれに限らず、例えば電車中のアナウンス、飲食店の注文、接客等において、それぞれの用例に応じた用例文を用いた機械翻訳に適用することができる。

　また、上記の各実施形態では、変換文の一例として第２言語による翻訳文を生成する翻訳装置２について説明した。本開示の技術に基づき生成される変換文は、翻訳文に限らず、例えば第１言語の文章であってもよい。例えば、本開示の翻訳装置は、発話文の検索結果として得られる用例文のパラメータを、発話文中の対応する用語又はパラメータ確定情報で得られる第１言語の用語で復元した文章を、変換文として出力してもよい。これにより、例えば、発話文中の言い誤り、敬語、方言などの修正（翻訳）を精度良く行うことができる。

　以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。

　したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。

　また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において、種々の変更、置換、付加、省略などを行うことができる。

　本開示は、種々の用例文を用いた機械翻訳を実行する翻訳装置、翻訳方法及びプログラムに適用可能である。

　　１　　翻訳システム
　　２　　翻訳装置
　　２０　　制御部
　　２０ａ　　音声認識部
　　２０ｂ　　翻訳処理部
　　２０ｃ　　情報更新処理部
　　２１　　記憶部
　　２２　　通信部
　　２３　　操作部

Claims

　音声を認識して、第１言語における発話文を生成する音声認識部と、
　複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文を格納する記憶部と、
　前記発話文に基づいて前記記憶部に格納された前記複数の用例文を検索して検索結果の用例文を取得し、前記検索結果の用例文に基づく変換文を生成する翻訳処理部と、
　特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得する情報取得部とを備え、
　前記翻訳処理部は、
　　　前記検索結果の用例文が前記特定のパラメータを含む場合、前記特定情報が示す前記特定の用語に基づいて前記変換文を生成する、
翻訳装置。
　前記特定のパラメータは、前記カテゴリを細分化するサブカテゴリによって規定される
請求項１に記載の翻訳装置。
　前記記憶部は、前記複数の用例文と、前記複数の用例文とそれぞれ対応する第２言語における複数の対訳文とを関連付けて格納し、
　前記翻訳処理部は、前記複数の対訳文の中で前記検索結果の用例文に関連付けされた対訳文を用いて、前記変換文として前記第２言語による翻訳文を生成する
請求項１又は２に記載の翻訳装置。
　前記翻訳処理部は、
　　　前記検索結果の用例文が前記特定のパラメータを含む場合、前記特定の用語に対する前記第２言語の訳語で前記特定のパラメータを置換する
請求項３に記載の翻訳装置。
　前記翻訳処理部は、前記複数の用語に対する検索式に基づいて、前記発話文を検索して前記パラメータに対応する用語を取得する
請求項１～４のいずれか１項に記載の翻訳装置。
　前記翻訳処理部は、
　前記発話文において取得された用語を、前記パラメータに置換して文字列を生成し、
　前記パラメータを含む前記文字列と前記複数の用例文の各々との間の類似度に基づいて、前記複数の用例文の検索を行う
請求項５に記載の翻訳装置。
　前記翻訳処理部は、
　　　前記検索結果の用例文が前記特定のパラメータを含まない場合、前記発話文において取得された用語に対する前記第２言語の訳語で、前記検索結果の用例文の前記パラメータを置換する
請求項６に記載の翻訳装置。
　前記複数の用例文は、航空機内におけるアナウンスに用いられる文章を含む
請求項１～７のいずれか１項に記載の翻訳装置。
　翻訳装置が実行する翻訳方法であって、
　前記翻訳装置の記憶部には、複数の用語に対応するカテゴリを示すパラメータを含んだ複数の用例文が格納されており、
　特定のパラメータに対して対応付けられた特定の用語を示す特定情報を取得するステップと、
　音声を認識して、第１言語における発話文を生成するステップと、
　前記発話文に基づいて前記記憶部に格納された前記複数の用例文を検索して検索結果の用例文を取得し、前記検索結果の用例文に基づく変換文を生成するステップとを含み、
　前記変換文を生成するステップにおいて、
　　　前記検索結果の用例文が前記特定のパラメータを含む場合、前記特定情報が示す前記特定の用語に基づいて前記変換文が生成される
翻訳方法。
　請求項９に記載の翻訳方法を翻訳装置に実行させるためのプログラム。