JP2021117676A

JP2021117676A - 翻訳装置、翻訳方法、プログラム

Info

Publication number: JP2021117676A
Application number: JP2020010101A
Authority: JP
Inventors: 聡黒川; Satoshi Kurokawa; 由敬石橋; Yoshitaka Ishibashi; 智藤井; Satoshi Fujii; 喜敏須田; Yoshitoshi Suda; 信公明賀; Nobuhiro MYOGA; 昌司吉田; Masashi Yoshida; 英樹嶋田; Hideki Shimada
Original assignee: NEC Corp; Sumitomo Mitsui Construction Co Ltd
Current assignee: NEC Corp; Sumitomo Mitsui Construction Co Ltd
Priority date: 2020-01-24
Filing date: 2020-01-24
Publication date: 2021-08-10
Anticipated expiration: 2040-01-24
Also published as: JP6710818B1; WO2021149267A1

Abstract

【課題】第一の言語の入力音声を、第一の言語以外の一つ以上の翻訳先言語の出力音声に変換して送信先装置へ送信する際に、滞りなく音声を送信先装置へ送信できる翻訳装置を提供する。【解決手段】第一の言語の入力音声の入力を検知した場合に、第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換し、一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する。【選択図】図１

Description

本発明は、翻訳装置、翻訳方法、プログラムに関する。

複数の言語話者が協働して作業する場合、ある指示者などの第一話者が第一の言語で発した音声の内容が、第一の言語を習得していない他の言語の話者に正確に伝わる必要がある。関連する技術として、第一の言語の音声を翻訳した翻訳テキストデータを生成する技術が特許文献１に開示されている。

特開２０１９−００４３９２号公報

上述のような翻訳において、第一話者が第一の言語で発した音声の内容が、第一の言語を習得していない他の言語の話者に、より短時間で伝わる仕組みが求められる。

そこでこの発明は、上述の課題を解決する翻訳装置、翻訳方法、プログラムを提供することを目的としている。

発明の第一の態様によれば、翻訳装置は、第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する翻訳手段と、前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する音声送信手段と、を備えることを特徴とする。

発明の第二の態様によれば、翻訳方法は、第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換し、前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信することを特徴とする。

発明の第三の態様によれば、プログラムは、翻訳装置のコンピュータを、第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する翻訳手段、前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する音声送信手段、として機能させることを特徴とする。

本発明によれば、第一話者が第一の言語で発した音声の内容が、第一の言語を習得していない他の言語の話者に、より短時間で伝わる翻訳装置を提供することができる。

本発明の一実施形態による翻訳システムの構成を示すブロック図である。本発明の一実施形態による翻訳サーバ、トランシーバサーバ、仲介サーバのハードウェア構成を示す図である。本発明の一実施形態による翻訳サーバの機能ブロック図である。本発明の一実施形態による翻訳部の詳細な機能構成を示す図である。本発明の一実施形態によるトランシーバサーバが記憶するユーザ管理テーブルを示す図である。本発明の一実施形態による翻訳システムの処理フローを示す図である。本発明の一実施形態による翻訳サーバの最小構成を示す図である。本発明の一実施形態による最小構成による翻訳サーバの処理フローを示す図である。

以下、本発明の一実施形態による翻訳装置を図面を参照して説明する。
図１は本実施形態による翻訳装置を含む翻訳システムの構成を示すブロック図である。
翻訳システム１００は、少なくとも翻訳サーバ１を備える。本実施形態による翻訳システム１００は、さらにトランシーバサーバ２、仲介サーバ３を備える。
翻訳サーバ１は、入力した音声を、所定の翻訳先言語の音声に変換して出力する機能を有する。
トランシーバサーバ２は、ユーザ端末５と直接、通信を行う装置であり、グループに含まれる各ユーザ端末５の管理、音声通信処理、ユーザ管理などを行う。
仲介サーバ３は、音声データやテキストデータのトランシーバサーバ２と翻訳サーバ１との通信を仲介する。

また図１ではユーザ端末５１、５２、５３、５４がトランシーバサーバ２と通信接続する態様を示している。ユーザ端末５１、５２、５３、５４を総称してユーザ端末５と呼ぶこととする。本実施形態においては、ユーザ端末５１を、ある建設現場の管理者が利用する。またユーザ端末５２、ユーザ端末５３、ユーザ端末５４を、建設現場の作業者が利用する。ユーザ端末５２、ユーザ端末５３、ユーザ端末５４を利用する作業者は、それぞれが異なる言語を母国語として会話をする作業者であるとする。ユーザ端末５はトランシーバ端末の機能を有する。そして管理者がユーザ端末５１を介して、各作業者に指示を音声で伝える。トランシーバサーバ２は、管理者の音声を受信して仲介サーバ３を介して翻訳サーバ１へ送信する。翻訳サーバ１は、管理者の音声を入力すると、直ちにユーザ端末５２、５３、５４を利用する各作業者の利用する言語に変換して、対応するユーザ端末５へ送信する。これにより、翻訳サーバ１を備えた翻訳システム１００は、管理者である第一話者が第一の言語で発した音声の内容が、第一の言語を習得していない他の言語の話者である作業者に、より短時間で伝わる仕組みを提供する。

図２は、翻訳サーバ、トランシーバサーバ、仲介サーバのハードウェア構成を示す図である。
図２で示すように、翻訳サーバ１、トランシーバサーバ２、仲介サーバ３は、それぞれ、ＣＰＵ（Central Processing Unit）１０１、ＲＯＭ（Read Only Memory）１０２、ＲＡＭ（Random Access Memory）１０３、データベース１０４、通信モジュール１０５等の各ハードウェアを備えたコンピュータである。なおユーザ端末５も同様のハードウェアを備えたコンピュータである。

図３は、翻訳サーバの機能ブロック図である。
翻訳サーバ１は、翻訳管理プログラムを実行する。これにより翻訳サーバ１は、制御部１１、翻訳部１２、音声送信部１３、テキストデータ送信部１４を備える。

制御部１１は、他の機能部を制御する。
翻訳部１２は、第一の言語の入力音声の入力を検知した場合に、第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する。翻訳部１２は、入力音声をテキスト化した第一テキストデータと、当該第一テキストデータに対応する翻訳先言語のテキストデータとを生成し、当該翻訳先言語のテキストデータを音声変換して翻訳先言語の出力音声を生成する。
音声送信部１３は、一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用するユーザ端末５（送信先装置）へ送信する。
テキストデータ送信部１４は、ユーザ端末５からのテキストデータ送信要求があった場合に、当該ユーザ端末５に対応する言語を示す翻訳先言語の出力音声をテキスト化した翻訳先言語のテキストデータを当該ユーザ端末５へ送信する。

図４は翻訳部の詳細な機能構成を示す図である。
図４で示すように、翻訳部１２は、音声翻訳ＡＰＩ（Application Programming Interface）１２１、機械翻訳ＡＰＩ１２２、音声合成ＡＰＩ１２３、音声認識機能１２４、翻訳機能１２５、音声合成機能１２６を備える。音声翻訳ＡＰＩ１２１は、外部から入力した入力音声を音声認識機能１２４へ出力する。機械翻訳ＡＰＩ１２２は、機械翻訳のためのＡＰＩである。音声合成ＡＰＩ１２３は、翻訳によって変換された翻訳先言語の出力音声を出力する。音声認識機能１２４は、入力音声をその音声の言語のテキストに変換する。翻訳機能１２５は、入力音声のテキストを、他の指定された翻訳先言語のテキストに変換する。音声合成機能１２６は、翻訳先言語のテキストを、その翻訳先言語の音声に変換して音声合成ＡＰＩ１２３へ出力する。

図５はトランシーバサーバが記憶するユーザ管理テーブルを示す図である。
トランシーバサーバは、ある建設現場の管理者と作業者の利用する端末を、一つのグループに属するユーザの利用する端末として記憶する。例えば、端末ＩＤに、建設現場ＩＤ、企業ＩＤ、ユーザＩＤを紐づけて記憶する。そのほか、ユーザＩＤに、管理者ＩＤや、作業者ＩＤを紐づけて記憶してよい。ユーザ端末５１を利用するユーザをユーザＡ、ユーザ端末５２を利用するユーザをユーザＢ、ユーザ端末５３を利用するユーザをユーザＣ、ユーザ端末５４を利用するユーザをユーザＤと呼ぶこととする。ユーザＡは、建設現場の管理者、ユーザＢ，Ｃ，Ｄは建設現場の作業者であるとする。

この場合、トランシーバサーバ２は、ユーザ端末５１の端末ＩＤに、ユーザＡが管理する作業現場の建設現場ＩＤ、ユーザＡが属する企業の企業ＩＤ、ユーザＡの識別情報であるユーザＩＤ、ユーザＡが管理者であることを示す管理者ＩＤを紐づけて記憶する。またトランシーバサーバ２は、ユーザ端末５２の端末ＩＤに、ユーザＢが管理する作業現場の建設現場ＩＤ、ユーザＢを管理する企業の企業ＩＤ、ユーザＢの識別情報であるユーザＩＤ、ユーザＢが作業者であることを示す作業者ＩＤを紐づけて記憶する。またトランシーバサーバ２は、ユーザ端末５３の端末ＩＤに、ユーザＣが管理する作業現場の建設現場ＩＤ、ユーザＣを管理する企業の企業ＩＤ、ユーザＣの識別情報であるユーザＩＤ、ユーザＣが作業者であることを示す作業者ＩＤを紐づけて記憶する。またトランシーバサーバ２は、ユーザ端末５４の端末ＩＤに、ユーザＤが管理する作業現場の建設現場ＩＤ、ユーザＤを管理する企業の企業ＩＤ、ユーザＤの識別情報であるユーザＩＤ、ユーザＤが作業者であることを示す作業者ＩＤを紐づけて記憶する。なおトランシーバサーバ２は、作業者ＩＤや管理者ＩＤに紐づけてそのユーザが母語とする言語を示す言語ＩＤを記憶する。これら記憶する情報は、トランシーバサーバ２のユーザ管理テーブルにおいて記録される。

図６は本実施形態による処理フローを示す図である。
次に図６を用いて本実施形態による処理フローを順を追って説明する。
各ユーザは自身が利用するユーザ端末５を起動させる。これによりユーザ端末５１〜５４のそれぞれは、トランシーバサーバ２と通信接続を行う。この状態で、各ユーザはユーザ端末５を用いて、他のユーザと会話を行うことができる。

この時、まずユーザＡが、ユーザ端末５１のディスプレイに表示されている発話ボタンを押下する。ユーザ端末５１は、呼開始指示をトランシーバサーバ２へ送信する（ステップＳ１０１）。呼開始指示にはユーザ端末５１の端末ＩＤと呼番号が含まれる。トランシーバサーバ２は、呼開始指示に基づいてユーザ端末５が属するグループに含まれるユーザ端末同士の音声通信処理を開始する（ステップＳ１０２）。トランシーバサーバ２は、呼開始指示に含まれる端末ＩＤを取得する。

トランシーバサーバ２は、端末ＩＤに紐づいて同じグループに属する端末ＩＤをトランシーバサーバ２のデータベースに記録されているユーザ管理テーブルから取得する。これら取得した端末ＩＤは、ユーザ端末５２，５３，５４の各端末ＩＤであるとする。トランシーバサーバ２は、ユーザ端末５１，５２，５３，５４のそれぞれに紐づいてユーザ管理テーブルが記憶する言語ＩＤを取得する。トランシーバサーバ２は、呼出元のユーザ端末５１の端末ＩＤと対応する言語ＩＤ、呼出先のユーザ端末５２，５３，５４の端末ＩＤ、各端末ＩＤに対応する言語ＩＤ、呼番号、を含む翻訳開始指示を、仲介サーバ３を介して翻訳サーバ１へ送信する（ステップＳ１０３）。仲介サーバ３は、翻訳開始指示を翻訳サーバ１へ送信する。

そして、ユーザＡはユーザ端末５１に備わるマイクに向けて音声を発する。当該音声は作業者に対する指示などであってよい。ユーザ端末５１は、ユーザ端末５１の端末ＩＤと音声データと、呼番号とを含む発話データを、トランシーバサーバ２へ送信する（ステップＳ１０４）。トランシーバサーバ２は発話データを、仲介サーバ３を介して翻訳サーバ１へ送信する（ステップＳ１０５）。ユーザＡは、発話を終了すると、ユーザ端末５１のディスプレイに表示されている終話ボタンを押下する。するとユーザ端末５１は終話通知をトランシーバサーバ２へ送信する（ステップＳ１０６）。なおトランシーバサーバ２は、終話通知を受信する前に、ユーザＡの翻訳しない音声データを、直ちに呼出先のユーザ端末５へ送信してもよい。

翻訳サーバ１は翻訳開始指示を受信する。翻訳サーバ１は端末ＩＤと発話データを受信する。翻訳サーバ１は呼番号に基づいて、翻訳開始指示と発話データの対応関係を検知する。翻訳サーバ１の翻訳部１２は、呼番号に基づいて特定した翻訳開始指示に含まれる、呼出元のユーザ端末５１の端末ＩＤと対応する言語ＩＤと、呼出先のユーザ端末５２，５３，５４の端末ＩＤと各端末ＩＤに対応する言語ＩＤとを取得する。翻訳部１２は、呼出元のユーザ端末５１の端末ＩＤと対応する言語ＩＤを翻訳元の言語の言語ＩＤとして特定する。翻訳部１２は、呼出先のユーザ端末５２，５３，５４の端末ＩＤと対応する各言語ＩＤを翻訳先の言語の言語ＩＤとして特定する。

そして翻訳部１２の音声認識機能１２４が、翻訳開始指示を受信している状況であれば、終話通知を受信している受信していないにかかわらず、直ちに翻訳処理を開始する。この時、翻訳部１２の音声認識機能１２４は、同じ呼番号に基づいて特定した発話データに含まれる音声データを、翻訳元の言語ＩＤが示す翻訳元言語のテキストデータ（第一テキストデータ）に変換する（ステップＳ１０７）。翻訳部１２は、音声データをテキストデータに変換する際に公知の音声テキスト変換の技術を用いればよい。翻訳部１２は呼番号と翻訳元言語のテキストデータとを紐づけてデータベース等に記憶してよい。

また翻訳部１２の音声認識機能１２４が、翻訳元言語のテキストデータを、特定した翻訳先の言語ＩＤが示す翻訳先言語のテキストデータに翻訳する（ステップＳ１０８）。翻訳部１２は、翻訳元言語のテキストデータを翻訳先言語のテキストデータに変換する際に、公知の翻訳技術を用いてよい。翻訳部１２は呼番号と翻訳先言語のテキストデータとを紐づけてデータベースに記録する（ステップＳ１０９）。ここでユーザＢが言語Ｂ、ユーザＣが言語Ｃ、ユーザＤが言語Ｄを母語とする作業者である場合、言語Ｂを翻訳先言語とするテキストデータ、言語Ｃを翻訳先言語とするテキストデータ、言語Ｄを翻訳先言語とするテキストデータ、の３つの言語のテキストデータが生成される。

また翻訳部１２の音声合成機能１２６が、翻訳先言語のテキストデータを音声に変換し、翻訳先言語毎のテキストデータに対応する音声データを生成する（ステップＳ１１０）。翻訳部１２は、翻訳先言語の音声データと、言語ＩＤと、当該言語ＩＤに紐づく端末ＩＤと呼番号とを紐づけた出力音声データを、生成した翻訳先言語の音声データ毎に生成してデータベースに記録してもよい。本実施形態においては、音声合成機能１２６は、翻訳先言語Ｂの音声データを含む出力音声データ、翻訳先言語Ｃの音声データを含む出力音声データ、翻訳先言語Ｄの音声データを含む出力音声データ、の３つの出力音声データを生成して、データベースに記録する。音声合成ＡＰＩ１２３は、音声合成機能１２６の生成した３つの出力音声データをそれぞれ取得する。音声合成ＡＰＩ１２３は、各出力音声データを音声送信部１３へ出力する。

音声送信部１３は、３つの出力音声データを、仲介サーバ３を介してトランシーバサーバ２へ送信する（ステップＳ１１１）。トランシーバサーバ２は、３つの出力音声データを受信する。トランシーバサーバ２は出力音声データに含まれる端末ＩＤを送信先のユーザ端末の端末ＩＤと特定する。トランシーバサーバ２は、終話通知を受信している受信していないにかかわらず、各出力音声データを、ユーザ端末５２、ユーザ端末５３、ユーザ端末５４へそれぞれ一斉同報送信する（ステップＳ１１２）。つまり、トランシーバサーバ２は、ユーザ端末５２の端末ＩＤを含み翻訳先言語Ｂの音声データを含む出力音声データをユーザ端末５２へ送信する。またトランシーバサーバ２は、ユーザ端末５３の端末ＩＤを含み翻訳先言語Ｃの音声データを含む出力音声データをユーザ端末５３へ送信する。またトランシーバサーバ２は、ユーザ端末５４の端末ＩＤを含み翻訳先言語Ｄの音声データを含む出力音声データをユーザ端末５４へ送信する。

以上の処理により、ユーザＡがユーザ端末５１を用いて指示した音声が翻訳サーバ１により呼出先の各ユーザの母語の言語にそれぞれ翻訳されて、その翻訳後の音声データを含む出力音声データがユーザ端末５に一斉同報送信される。各ユーザ端末５は、出力音声データに含まれる音声データを用いてスピーカから音声を発する。ユーザＢ，Ｃ，Ｄは、ユーザＡの自身の言語に翻訳された指示に基づいて現場の作業を行うことができる。

上述の処理によれば、翻訳サーバ１は、ユーザ端末５１からの音声が届くと直ちに翻訳を開始している。これにより、ユーザＡがユーザ端末５１に入力した音声が直ちに翻訳されて、一斉同報送信により、呼出先のユーザ端末５へ翻訳後の出力音声データが届く。トランシーバの技術では、呼出元のユーザは、ユーザ端末に自身の音声を入力し、送信権開放の指示を入力するが、本実施形態においては送信権開放の指示をしない場合でも、翻訳サーバが翻訳の開始と翻訳後の出力音声データを呼出先の端末に一斉同報送信する。送信権開放とはユーザが自身の発話する権利を他のユーザに開放することを意味する。これにより、呼出元のユーザの操作も簡略化することができる。

呼出先のユーザ端末５２，５３，５４のユーザは、出力音声データに含まれる音声データのテキストデータの送信を要求することができる。この場合、呼出先のユーザは、ユーザ端末５のディスプレイに表示されているテキストデータ送信要求ボタンを押下する。一例としてユーザ端末５２を利用するユーザＢが、ユーザ端末５２のディスプレイに表示されているテキストデータ送信要求ボタンを押下したとする。この場合、ユーザ端末５２は、自端末の端末ＩＤを含むテキストデータ送信要求をトランシーバサーバ２へ送信する（ステップＳ１１３）。

トランシーバサーバ２はテキストデータ送信要求を受信する。トランシーバサーバ２はテキストデータ送信要求を、仲介サーバ３を介して翻訳サーバ１へ送信する（ステップＳ１１４）。翻訳サーバ１のテキストデータ送信部１４は、テキストデータ送信要求に含まれる端末ＩＤを取得する。テキストデータ送信部１４は、端末ＩＤに紐づいて自装置のデータベースに登録されている翻訳先言語のテキストデータのうち、未送信の翻訳先言語のテキストデータを取得する。テキストデータ送信部１４は取得した翻訳先言語のテキストデータとテキストデータ送信要求に含まれる端末ＩＤとを含むテキストデータ応答を、仲介サーバ３を介してトランシーバサーバ２へ送信する（ステップＳ１１５）。トランシーバサーバ２は、テキストデータ応答を端末ＩＤに基づいてユーザ端末５２へ送信する（ステップＳ１１６）。

ユーザ端末５２はテキストデータ応答を受信する。ユーザ端末５２はテキストデータ応答に含まれる翻訳先言語のテキストデータをディスプレイに出力する（ステップＳ１１７）。これにより、ユーザＢはユーザ端末５２に表示されたテキストデータを確認し、ユーザＡが行った指示等の音声の文字列を確認することができる。

上述の処理によれば、ユーザが指示した場合にのみテキストデータ送信要求に基づくテキストデータ応答が、当該ユーザの利用するユーザ端末５に送信される。これにより、翻訳サーバ１は全ての翻訳先言語のテキストデータを呼出先のユーザ端末５に送信する必要が無いため、処理負荷を軽減することができる。

上述の処理においては、ユーザの操作に基づいて、呼出先のユーザ端末５が送信したテキストデータ送信要求を翻訳サーバ１が受信した場合にのみ、翻訳サーバ１のテキストデータ送信部１４が、翻訳先言語のテキストデータとテキストデータ送信要求に含まれる端末ＩＤとを含むテキストデータ応答を送信している。しかしながら、呼出先のユーザ端末５は、ステップＳ１１２でトランシーバサーバ２から送信された出力音声データを受信した場合に、自動的に、翻訳サーバ１に向けてテキストデータ送信要求を複数回送信するポーリングを行い、その結果、翻訳サーバ１からテキストデータ応答を受信してもよい。これにより、ユーザの労力なく短時間で、出力音声データに対応する翻訳先言語のテキストデータを呼出先のユーザ端末５に表示させることができる。

また上述の処理においては、翻訳サーバ１はテキストデータ送信要求を受信した場合にのみテキストデータ応答を送信しているが、出力音声データの送信と共に、またはその後直ちに、テキストデータ送信要求を受信することなく、テキストデータ応答に対応する情報を含むテキストデータを、各呼出先のユーザ端末５へ送信するようにしてもよい。

図７は翻訳サーバの最小構成を示す図である。
図８は最小構成による翻訳サーバの処理フローを示す図である。
翻訳サーバ１は、少なくとも翻訳部１２と、音声送信部１３の構成を備えればよい。
翻訳部１２は、第一の言語の入力音声の入力を検知した場合に、第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する（ステップＳ２０１）。
音声送信部１３は、一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する（ステップＳ２０２）。

上述の各装置は内部に、コンピュータシステムを有している。そして、上述した各処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。

また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル（差分プログラム）であっても良い。

１・・・翻訳サーバ（翻訳装置）
２・・・トランシーバサーバ
３・・・仲介サーバ
５・・・ユーザ端末
１１・・・制御部
１２・・・翻訳部（翻訳手段）
１３・・・音声送信部（音声送信手段）
１４・・・テキストデータ送信部（テキストデータ送信手段）

発明の第一の態様によれば、翻訳装置は、送信元装置の識別情報に紐付けられた、複数の送信先装置の識別情報と当該識別情報に対応する翻訳先言語とをそれぞれ記憶する記憶部と、前記送信元装置からの第一の言語の入力音声の入力を検知した場合に、その入力音声を、前記第一の言語とは異なる前記送信先装置の識別情報に対応する一つ以上の前記翻訳先言語の出力音声へ直ちに変換し、前記複数の翻訳先言語の出力音声をテキスト化したテキストデータをそれぞれ生成する翻訳手段と、前記一つ以上の翻訳先言語の出力音声を、前記識別情報に対応する送信先装置へそれぞれ送信する音声送信手段と、前記翻訳先言語の出力音声を受信した前記送信先装置からのテキストデータ送信要求があった場合に、テキストデータ送信要求に含まれる当該送信先装置の識別情報に対応する翻訳先言語の前記出力音声をテキスト化した前記翻訳先言語のテキストデータを当該送信先装置へ送信するテキストデータ送信手段と、を備えることを特徴とする。

発明の第二の態様によれば、翻訳方法は、送信元装置の識別情報に紐付けられた、複数の送信先装置の識別情報と当該識別情報に対応する翻訳先言語とをそれぞれ記憶し、前記送信元装置からの第一の言語の入力音声の入力を検知した場合に、その入力音声を、前記第一の言語とは異なる前記送信先装置の識別情報に対応する一つ以上の前記翻訳先言語の出力音声へ直ちに変換し、前記複数の翻訳先言語の出力音声をテキスト化したテキストデータをそれぞれ生成し、前記一つ以上の翻訳先言語の出力音声を、前記識別情報に対応する送信先装置へそれぞれ送信し、前記翻訳先言語の出力音声を受信した前記送信先装置からのテキストデータ送信要求があった場合に、テキストデータ送信要求に含まれる当該送信先装置の識別情報に対応する翻訳先言語の前記出力音声をテキスト化した前記翻訳先言語のテキストデータを当該送信先装置へ送信することを特徴とする。

発明の第三の態様によれば、プログラムは、翻訳装置のコンピュータを、送信元装置の識別情報に紐付けられた、複数の送信先装置の識別情報と当該識別情報に対応する翻訳先言語とをそれぞれ記憶する記憶手段、前記送信元装置からの第一の言語の入力音声の入力を検知した場合に、その入力音声を、前記第一の言語とは異なる前記送信先装置の識別情報に対応する一つ以上の前記翻訳先言語の出力音声へ直ちに変換し、前記複数の翻訳先言語の出力音声をテキスト化したテキストデータをそれぞれ生成する翻訳手段、前記一つ以上の翻訳先言語の出力音声を、前記識別情報に対応する送信先装置へそれぞれ送信する音声送信手段、前記翻訳先言語の出力音声を受信した前記送信先装置からのテキストデータ送信要求があった場合に、テキストデータ送信要求に含まれる当該送信先装置の識別情報に対応する翻訳先言語の前記出力音声をテキスト化した前記翻訳先言語のテキストデータを当該送信先装置へ送信するテキストデータ送信手段、として機能させることを特徴とする。

Claims

第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する翻訳手段と、
前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する音声送信手段と、
を備える翻訳装置。
前記翻訳手段は、前記翻訳先言語の出力音声をテキスト化したテキストデータを生成し、
前記送信先装置に対応する言語を示す翻訳先言語の前記出力音声をテキスト化した前記翻訳先言語のテキストデータを当該送信先装置へ送信するテキストデータ送信手段、
を備える請求項１に記載の翻訳装置。
前記テキストデータ送信手段は、前記送信先装置からのテキストデータ送信要求があった場合に、テキストデータ送信要求に含まれる前記送信先装置の識別情報に基づいて特定した翻訳先言語の前記テキストデータを、当該送信先装置へ送信する
請求項２に記載の翻訳装置。
前記翻訳手段は、前記入力音声をテキスト化した第一テキストデータと、当該第一テキストデータに対応する前記翻訳先言語のテキストデータとを生成し、当該翻訳先言語のテキストデータを音声変換して前記翻訳先言語の出力音声を生成する
請求項１から請求項３の何れか一項に記載の翻訳装置。
前記音声送信手段は、翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ一斉同報送信する
請求項１から請求項４のいずれか一項に記載の翻訳装置。
第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換し、
前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する
翻訳方法。
翻訳装置のコンピュータを、
第一の言語の入力音声の入力を検知した場合に、前記第一の言語とは異なる一つ以上の翻訳先言語の出力音声へ直ちに変換する翻訳手段、
前記一つ以上の翻訳先言語の出力音声を、対応する言語を話すユーザの利用する送信先装置へ送信する音声送信手段、
として機能させるプログラム。