JPWO2016006354A1

JPWO2016006354A1 - 情報処理装置及び翻訳データ提供方法

Info

Publication number: JPWO2016006354A1
Application number: JP2016532491A
Authority: JP
Inventors: 康憲加藤; 和樹関谷; 浩中里; 有一好光; 雅高水澤
Original assignee: NEC Solution Innovators Ltd
Current assignee: NEC Solution Innovators Ltd
Priority date: 2014-07-08
Filing date: 2015-05-27
Publication date: 2017-06-01
Also published as: WO2016006354A1

Abstract

情報処理装置（５０）は、端末装置から言語情報を取得する情報取得部（５１）と、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信部（５２）と、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信部（５３）と、前記受信された翻訳データを前記端末装置に送信する提供部（５４）と、を有する。

Description

本発明は、翻訳サービスを提供する技術に関する。

下記特許文献１には、多言語交信方法が提案されている。この方法では、座席に設けられたモニタでリストの中から所望の言語が選択されると、その座席と選択言語との対応関係が管理される。その対応関係に基づいて、その座席の音響システムやモニタには、その選択言語でコンテンツが出力される。

下記特許文献２には、チャットシステムにおけるチャネルとＶｏＩＰ（Voice over IP（Internet Protocol））システムにおけるＶｏＩＰ用会議室との間を中断することなく円滑にかつ容易に移行できるマルチチャネル会話システムが提案されている。この提案システムは、ＶｏＩＰ会議室内で送受信される音声会話メッセージを音声認識し、その認識結果である文字列を翻訳し、この翻訳結果の文字列とその文字列から抽出されたキーワードをチャットサーバに送信する。チャットサーバは、翻訳結果の文字列情報と抽出されたキーワードを文字列会話メッセージとしてクライアント端末に送信する。

下記特許文献３には、コミュニケーション支援方法が提案されている。この提案では、クライアント装置が、音声データを言語認識及び言語解析することで、第一言語に基づく内部表現を生成し、この内部表現の重要度を判定する。サーバ装置は、その重要度に応じたモードでその内部表現を第二言語に翻訳する。この提案手法によれば、重要な内容を含まない入力に対しては、低負荷の翻訳処理が自動的に選択されることで、翻訳結果を得るまでの応答時間を早めることができる。

特表２００６−５１２６４７号公報特開２００４−１８５０８８号公報特開２００４−３５５１１８号公報

上述の提案手法では、サーバ装置が複数のクライアント装置に対して多言語の翻訳結果を提供する。これにより、各クライアント装置の各ユーザは、所望の言語でのコンテンツの提供をそれぞれ受けることができる。しかしながら、このような手法では、各クライアント装置は、各ユーザの正当性を証明して、サーバ装置と通信（セッション）を確立することが求められる。正当性証明のために、各ユーザ情報がサーバ装置にそれぞれ登録される。即ち、このような手法によれば、会話の参加者や講義の聴講者といった情報が全てサーバ装置上に残ることになる。このような情報は、個人的な嗜好を示す個人情報であると考えることができる。

本発明は、このような事情に鑑みてなされたものであり、聞き手の個人情報をサーバ装置へ登録することなく、聞き手に所望の言語への翻訳サービスを提供する技術を実現する。

本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。

第一の側面は、情報処理装置に関する。第一の側面に係る情報処理装置は、端末装置から言語情報を取得する情報取得手段と、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、前記受信された翻訳データを前記端末装置に送信する提供手段と、を有する。

第二の側面は、少なくとも１つのコンピュータにより実行される翻訳データ提供方法に関する。第二の側面に係る翻訳データ提供方法は、端末装置から言語情報を取得し、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、前記受信された翻訳データを前記端末装置に送信する、ことを含む。

なお、本発明の他の側面としては、上記第二の側面の方法を少なくとも１つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。

上記各側面によれば、聞き手の個人情報をサーバ装置へ登録することなく、聞き手に所望の言語への翻訳サービスを提供する技術を実現することができる。

上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

第一実施形態における発話者装置を含む翻訳システムのシステム構成を概念的に示す図である。第一実施形態における発話者装置のハードウェア構成例を概念的に示す図である。第一実施形態における発話者装置の処理構成例を概念的に示す図である。対応記憶部に格納される対応付け情報の例を示す図である。サーバ装置からの正常応答のデータの例を示す図である。サーバ装置からの異常応答のデータの例を示す図である。サーバ装置の処理構成例を概念的に示す図である。第一実施形態における発話者装置の動作例を示すフローチャートである。第二実施形態における発話者装置の動作例を示すフローチャートである。第三実施形態における情報処理装置の処理構成例を概念的に示す図である。第三実施形態における情報処理装置の動作例を示すフローチャートである。

以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の各実施形態の構成に限定されない。

［第一実施形態］
以下、第一実施形態における発話者装置及び翻訳データ提供方法について複数の図面を用いて説明する。

〔システム構成〕
図１は、第一実施形態における発話者装置を含む翻訳システムのシステム構成を概念的に示す図である。翻訳システムは、サーバ装置１０、発話者装置２０等を含む。翻訳システムは、サーバ装置１０を介して、聞き手装置３０に翻訳サービスを提供する。翻訳システムは、複数のサーバ装置１０、複数の発話者装置２０を含むこともできるし、１つのサーバ装置１０を介して、複数の聞き手装置３０に翻訳サービスを提供することもできる。

サーバ装置１０と発話者装置２０とは、通信網９を介して通信可能に接続される。通信網９は、携帯電話回線網、Ｗｉ−Ｆｉ（Wireless Fidelity）回線網、インターネット通信網、専用回線網、ＬＡＮ（Local Area Network）等である。本実施形態では、通信網９の通信形態は制限されない。

サーバ装置１０は、いわゆるコンピュータであり、図１に示されるように、ＣＰＵ（Central Processing Unit）２、メモリ３、入出力インタフェース（Ｉ／Ｆ）４、通信ユニット７等を有する。メモリ３は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ハードディスク等である。入出力Ｉ／Ｆ４は、表示装置（図示せず）、入力装置（図示せず）等のユーザインタフェース装置と接続可能である。通信ユニット７は、発話者装置２０のような他のコンピュータとの通信や、他の機器との信号のやりとり等を行う。サーバ装置１０のハードウェア構成は制限されない。

《発話者装置》
図２は、第一実施形態における発話者装置２０のハードウェア構成例を概念的に示す図である。発話者装置２０は、ＰＣ（Personal Computer）、携帯電話、スマートフォン、タブレット端末、ウェアラブルコンピュータのようないわゆるコンピュータである。発話者装置２０は、ＣＰＵ１１、メモリ１２、表示ユニット１３、タッチセンサ１４、通信ユニット１５、マイクロフォンユニット１６、スピーカユニット１７等を有する。ＣＰＵ１１は、他の各ユニットとバス等の通信線により接続される。

メモリ１２は、ＲＡＭ、ＲＯＭ、補助記憶装置（ハードディスク等）である。
表示ユニット１３は、ＬＣＤ（Liquid Crystal Display）やＣＲＴ（Cathode Ray Tube）ディスプレイ等のようなモニタを含み、表示処理を行う。

タッチセンサ１４は、外部からの接触を感知することによりユーザからの操作入力を受け付ける。タッチセンサ１４は、非接触状態であっても外部からの近接状態を検知することができるセンサであってもよい。また、表示ユニット１３及びタッチセンサ１４は、タッチパネルユニットとして実現されてもよい。更に、発話者装置２０は、タッチセンサ１４と共に、又は、タッチセンサ１４の代わりに、マウスやキーボード等の入力装置と接続される入出力インタフェース（図示せず）を持つようにしてもよい。

マイクロフォンユニット１６は、集音装置である。
スピーカユニット１７は、音出力装置である。
通信ユニット１５は、無線又は有線により他の装置と通信を行う。例えば、発話者装置２０が携帯型端末の場合には、通信ユニット１５は、無線により通信網９と接続し、通信網９を介してサーバ装置１０の通信ユニット７と通信を行い、聞き手装置３０とも無線通信を行う。発話者装置２０と聞き手装置３０との間の無線通信の形態には、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＺｉｇＢｅｅ、ＮＦＣ（Near Field Communication）、Ｗｉ−Ｆｉ等がある。但し、その無線通信の形態は制限されない。

発話者装置２０は、図２に示されるハードウェア要素以外にも、撮像ユニット、振動センサ、加速度センサ等を含むこともできる。発話者装置２０のハードウェア構成も制限されない。

聞き手装置３０は、いわゆるコンピュータであり、発話者装置２０と同様のハードウェア構成を有する。発話者装置２０と通信可能であり、かつ、発話者装置２０から送られる翻訳データを出力可能であれば、聞き手装置３０のハードウェア構成も制限されない。発話者装置２０と聞き手装置３０とのハードウェア構成は異なっていてもよい。

〔処理構成〕
《発話者装置》
図３は、第一実施形態における発話者装置２０の処理構成例を概念的に示す図である。発話者装置２０は、情報取得部２１、対応記憶部２２、発話データ取得部２３、送信部２４、受信部２５、提供部２６等を有する。これら各処理部は、例えば、ＣＰＵ１１によりメモリ１２に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、ＣＤ（Compact Disc）、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから通信ユニット１５を介してインストールされ、メモリ１２に格納されてもよい。

情報取得部２１は、複数の聞き手装置３０から言語情報及び端末ＩＤをそれぞれ取得する。言語情報は、各聞き手装置３０のユーザが用いる言語の情報であり、日本語、英語、フランス語、ドイツ語、中国語等を示す。各聞き手装置３０から得られる言語情報は、複数の言語を示すこともできる。言語情報が複数の言語を示す場合には、各言語に優先度が付されていてもよい。各聞き手装置３０のユーザの使用言語が異なる場合には、情報取得部２１は、複数の聞き手装置３０から複数の異なる言語情報を取得することになる。

端末ＩＤは、端末識別情報であり、発話者装置２０と聞き手装置３０との間の通信で宛先又は送信元のアドレスとして用いられる。情報取得部２１による言語情報及び端末ＩＤの具体的な取得手法については、実施例の項で例示する。
情報取得部２１は、取得された各言語情報及び各端末ＩＤを対応付けて対応記憶部２２に格納する。

図４は、対応記憶部２２に格納される対応付け情報の例を示す図である。図４に例示されるように、対応記憶部２２は、端末ＩＤと言語情報とを対応付けて記憶する。対応記憶部２２に格納される言語情報及び端末ＩＤは、情報取得部２１により取得されたものそのものであってもよいし、情報取得部２１により取得されたものに加工が施されたものであってもよい。例えば、情報取得部２１がテキストデータにより言語情報を取得した場合に、対応記憶部２２には、そのテキストデータが示す言語に対応する言語ＩＤが格納されてもよい。また、情報取得部２１により取得された言語情報が複数の言語を示す場合に、対応記憶部２２には、その複数の言語から抽出された１つの言語の情報が格納されてもよい。対応記憶部２２に格納される端末ＩＤは、発話者装置２０により独自に生成された識別データであってもよい。この場合、発話者装置２０は、その独自に生成した識別データと情報取得部２１により取得された端末ＩＤとの対応付けを管理する。

発話データ取得部２３は、発話者の発話音声データを取得する。発話データ取得部２３は、マイクロフォンユニット１６により集音された音声信号がＰＣＭ（Pulse Code Modulation）により変換された音声データを発話音声データとして取得する。マイクロフォンユニット１６により集音される音声信号には、発話者の発話音声に加えて、環境音も含まれる。そこで、発話データ取得部２３は、取得された音声データに対して環境音を除去するためのフィルタ処理を施し、得られる音声データを発話音声データとすることもできる。また、発話データ取得部２３は、発話者が発言していない無言時間も含む発話音声データを取得してもよいし、無言時間が除去された発話音声データを取得してもよい。

発話データ取得部２３による発話音声データの取得手法は、このような手法に制限されない。発話データ取得部２３は、発話者の発話が録音され、メモリ１２や可搬型記録媒体や他のコンピュータに格納されている発話音声データを取得してもよい。

発話データ取得部２３は、発話者の発話で用いられる言語の情報を更に取得する。発話データ取得部２３は、発話者の言語情報を予め持ってもよい。発話者の言語情報は、モニタに表示される入力画面に基づいて入力装置をユーザが操作することにより入力されてもよい。

送信部２４は、発話データ取得部２３により取得された発話音声データ及び発話者の言語情報に対応する言語データ、並びに、対応記憶部２２に格納される言語情報に対応する言語指定データをサーバ装置１０に送信する。言語指定データ及び言語データには、例えば、ＩＥＴＦ（The Internet Engineering Task Force）によりＢＣＰ４７として定義された形式が利用される。但し、言語指定データ及び言語データのデータ形式は任意である。言語データは、発話データ取得部２３により取得される発話者の言語情報そのものであってもよい。言語指定データは、対応記憶部２２に格納される言語情報そのものであってもよい。

発話音声データ、発話者の言語データ及び言語指定データの送信タイミングは、同時でなくてもよい。例えば、送信部２４は、情報取得部２１により言語情報が取得された後であれば、言語指定データを他のデータより先に送信することができる。また、送信部２４は、発話データ取得部２３が発話者の言語情報が予め有している場合には、発話者の言語データを他のデータより先に送信することができる。

受信部２５は、送信部２４により送信された発話音声データが、同様に送信された言語指定データが示す言語に翻訳された、翻訳テキストデータをサーバ装置１０から受信する。受信部２５は、言語指定データが複数の言語を示す場合、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する。

関連付け可能な状態で受信されるのであれば、翻訳テキストデータ及び言語データの複数のペアと音声認識結果のテキストデータとの受信の仕方は限定されない。例えば、受信部２５は、翻訳テキストデータ及び言語データの複数のペアと音声認識結果のテキストデータとを１つの通信メッセージ（応答データ）で受信する。また、受信部２５は、当該複数のペアと音声認識結果のテキストデータとを別々の通信メッセージ（応答データ）で受信してもよい。この場合、当該複数のペアと音声認識結果のテキストデータとを関連付けるための関連識別データが各通信メッセージにそれぞれ設定されればよい。更に、受信部２５は、１つの翻訳テキストデータを含む当該複数ペアに対して、複数の音声認識結果のテキストデータを受信してもよい。この場合にも、関連識別データを用いることにより、複数の音声認識結果のテキストデータが連結され、かつ、その連結されたテキストデータが当該複数のペアと関連付けられる。

図５は、サーバ装置１０からの正常応答のデータの例を示す図である。図６は、サーバ装置１０からの異常応答のデータの例を示す図である。図５及び図６の例では、サーバ装置１０からの応答データは、ＪＳＯＮ（JavaScript（登録商標） Object Notation）形式で記載されている。キー「ｒｅｓｕｌｔ」の値が正常応答か否か（ＯＫ又はＥＲＲＯＲ）を示し、キー「ｒｅｃｇ」の配列が音声認識結果を示し、キー「ｔｒａｎｓ」の配列が翻訳結果を示し、キー「ｃｏｄｅ」の値がエラーコードを示し、キー「ｍｅｓｓａｇｅ」の値がエラーメッセージを示す。「ｒｅｃｇ」配列は、発話者の言語データに相当する要素「ｒｅｇｉｏｎ」、発話音声データの音声認識結果のテキストデータに相当する要素「ｔｅｘｔ」を有する。「ｔｒａｎｓ」配列は、言語データに相当する要素「ｒｅｇｉｏｎ」とその言語データに対応する翻訳テキストデータに相当する要素「ｔｅｘｔ」とのペアが、言語指定データが示す言語の数分、含まれる。

図５の例によれば、翻訳テキストデータと言語データとは、「ｔｒａｎｓ」配列内の１要素として関連付けられており、翻訳テキストデータと言語データとの複数ペアは、応答データ内の「ｒｅｃｇ」配列と「ｔｒａｎｓ」配列との関係により関連付けられている。但し、受信部２５がサーバ装置１０から受信する応答データは、図５及び図６に示される形式に制限されない。識別データが各応答データに設定されれば、「ｒｅｃｇ」配列と「ｔｒａｎｓ」配列とは異なる応答データにより受信されてもよい。

送信部２４及び受信部２５は、例えば、Ｗｅｂソケットを用いることにより、サーバ装置１０との間で１つのセッションで双方向通信を行うことができる。これによれば、発話者装置２０からサーバ装置１０に向かう方向の発話音声データ等と、逆方向の翻訳テキストデータ等とが非同期でやりとりされ得る。即ち、サーバ装置１０は、受信した発話音声データを自由に区切り、区切られた部分的な発話音声データから変換された翻訳テキストデータを発話者装置２０に任意のタイミングで逐次送信することができる。

提供部２６は、受信部２５により受信された翻訳テキストデータを、その翻訳テキストデータに対応する言語情報と対応付けられて対応記憶部２２に記憶される端末ＩＤを宛先に指定して送信する。このとき、提供部２６は、翻訳テキストデータに関連付けられて受信される言語データを用いて、その言語データと一致する言語情報と対応付けられた端末ＩＤを対応記憶部２２から抽出する。１つの言語データに関して複数の端末ＩＤが対応記憶部２２から抽出された場合、提供部２６は、当該翻訳テキストデータを、抽出された端末ＩＤの数分コピーし、コピーされた複数の翻訳テキストデータをそれら端末ＩＤが示す複数の聞き手装置３０に送信する。

言語の異なる複数の翻訳テキストデータが受信された場合、提供部２６は、複数の聞き手装置３０が、受信された複数の翻訳テキストデータの中の、各聞き手装置３０の言語情報に対応する翻訳テキストデータをそれぞれ受信できるように、当該受信された複数の翻訳テキストデータを送信する。この場合、提供部２６は、翻訳テキストデータ毎に、対応記憶部２２から装置ＩＤを抽出し、各翻訳テキストデータを、抽出された装置ＩＤを宛先に指定してそれぞれ送信する。提供部２６は、翻訳テキストデータと共に、音声認識結果のテキストデータも聞き手装置３０に送信してもよい。

《サーバ装置》
図７は、サーバ装置１０の処理構成例を概念的に示す図である。サーバ装置１０は、音声認識部３１、翻訳部３２等を有する。これら各処理部は、例えば、ＣＰＵ２によりメモリ３に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、ＣＤ、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから通信ユニット７を介してインストールされ、メモリ３に格納されてもよい。

音声認識部３１は、発話者装置２０から発話音声データを受信し、その発話音声データに対して音声認識処理を行う。音声認識処理には、周知の音声認識技術が利用されればよい。例えば、音声認識部３１は、音の波形データを集めて形成される音響モデルと、単語と単語の並び方を集めて形成される言語モデルを用いて、発話音声データを発話テキストデータに変換する。この場合、音声認識部３１は、発話者装置２０から送られる発話者の言語データに基づいて、音声認識処理で用いる音響モデル及び言語モデルをその言語データが示す言語用のモデルに切り替える。また、サーバ装置１０は、言語毎に、各言語にカスタマイズされた音声認識部３１をそれぞれ有してもよい。この場合には、発話者装置２０から送られる発話者の言語データに基づいて、サーバ装置１０は、実行する音声認識部３１を切り替えることもできる。

翻訳部３２は、音声認識部３１により得られた発話テキストデータに対して、発話者の言語データが示す言語から言語指定データが示す言語への翻訳処理（機械翻訳）を実行する。この翻訳処理には、ルールベース翻訳手法、統計ベース翻訳手法等のような周知の翻訳技術が利用されればよい。言語指定データが複数の異なる言語を示す場合、翻訳部３２は、発話テキストデータに対して、各言語に対応する翻訳処理をそれぞれ実行する。翻訳部３２は、上記翻訳処理により、言語指定データが示す各言語の翻訳テキストデータをそれぞれ生成する。

翻訳部３２は、生成された翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ（発話テキストデータ）と関連付けた状態で応答データとして発話者装置２０に送信する。例えば、翻訳部３２は、図５及び図６に示される形式を持つ応答データを発話者装置２０に送信する。

翻訳部３２は、翻訳するのに十分な長さの発話テキストデータが音声認識部３１により得られるまで待って、翻訳処理を実行してもよい。即ち、翻訳部３２により翻訳処理されるデータ単位と、音声認識部３１により音声認識処理されるデータ単位とは異なってもよい。翻訳部３２は、音声認識部３１により発話テキストデータが得られたものの、そのデータに対して翻訳処理をしない場合には、音声認識結果のテキストデータ（発話テキストデータ）、及び、このテキストデータの翻訳結果となる翻訳テキストデータと関連付けるための関連識別データを、応答データとして発話者装置２０に送信してもよい。このようにすれば、発話者装置２０が、長い間、応答データをサーバ装置１０から受け取れないという事象を回避することができる。

〔動作例／購買支援方法〕
以下、第一実施形態における翻訳データ提供方法について図８を用いて説明する。図８は、第一実施形態における発話者装置２０の動作例を示すフローチャートである。図８に示されるように、第一実施形態における翻訳データ提供方法は、発話者装置２０のような少なくとも１つのコンピュータにより実行される。例えば、図示される各工程は、発話者装置２０が有する各処理部により実行される。各工程は、発話者装置２０が有する上述の各処理部の処理内容と同様であるため、各工程の詳細は、適宜省略される。

以下の説明では、発話者装置２０が複数の聞き手装置３０に翻訳データを提供する場合が例示される。

発話者装置２０は、複数の聞き手装置３０の各々から言語情報及び装置ＩＤをそれぞれ取得する（Ｓ８１）。発話者装置２０は、取得された言語情報と装置ＩＤとを対応付けて対応記憶部２２に格納する（Ｓ８２）。

発話者装置２０は、発話者の発話音声データ及び言語情報を取得する（Ｓ８３）。
発話者装置２０は、（Ｓ８３）で取得された言語情報に対応する言語データ及び（Ｓ８３）で取得された発話音声データ、並びに、（Ｓ８２）で対応記憶部２２に格納された言語情報に対応する言語指定データをサーバ装置１０に送信する（Ｓ８４）。対応記憶部２２に複数の異なる言語を示す言語情報が格納されている場合には、当該複数の言語を示す言語指定データがサーバ装置１０へ送信される。

サーバ装置１０は、（Ｓ８４）で送信されたデータを受信し、受信された発話音声データに対して、発話者の言語データが示す言語に対応する音声認識処理を施し、発話テキストデータを生成する。サーバ装置１０は、その発話テキストデータに対して、発話者の言語から、受信された言語指定データが示す言語への翻訳処理を実行する。結果、サーバ装置１０は、発話音声データが当該言語指定データが示す言語へ翻訳された翻訳テキストデータを生成する。

発話者装置２０は、（Ｓ８４）で送信したデータに対する応答データをサーバ装置１０から受信する（Ｓ８５）。応答データは、正常応答か否かを示す値を含む。正常応答を示す応答データは、更に、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペア、及び、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータを含む。言語指定データが複数の言語を示す場合、発話者装置２０は、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で応答データとして受信する。また、発話者装置２０は、音声認識結果のテキストデータ及び関連識別データを応答データとして受信する場合もあり得る。

発話者装置２０は、その応答データが正常応答を示すか否かを判定する（Ｓ８６）。発話者装置２０は、その応答データが正常応答を示さない場合（Ｓ８６；ＮＯ）、その応答データに設定されている情報に基づいて、エラー情報を出力する（Ｓ８７）。出力されるエラー情報は、図６に例示されるように、応答データ内に設定されていてもよい。また、エラー情報の出力形態は任意である。発話者装置２０は、表示ユニット１３のモニタにエラー情報を出力することができる。発話者装置２０は、そのエラー情報を読み上げる音声又はそのエラー情報に対応する音をスピーカユニット１７に送出させてもよい。また、発話者装置２０は、エラー情報を各聞き手装置３０にそれぞれ送信してもよい。

発話者装置２０は、その応答データが正常応答を示す場合（Ｓ８６；ＹＥＳ）、応答データに含まれる翻訳テキストデータの宛先を特定する（Ｓ８８）。具体的には、発話者装置２０は、翻訳テキストデータに対応する言語情報に対応付けられた装置ＩＤを対応記憶部２２から抽出し、抽出された装置ＩＤをその翻訳テキストデータの宛先として用いる。このとき、１つの翻訳テキストデータに対して複数の宛先（装置ＩＤ）が特定される場合もあり得る。また、応答データに異なる複数の言語に関する複数の翻訳テキストデータが含まれる場合には、発話者装置２０は、複数の翻訳テキストデータの各々に関し、宛先（装置ＩＤ）を特定する。

発話者装置２０は、（Ｓ８８）で特定された宛先に基づいて、各聞き手装置３０に、所望の翻訳テキストデータをそれぞれ送信する（Ｓ８９）。発話者装置２０は、１つの翻訳テキストデータの宛先として複数の端末ＩＤが抽出された場合、その翻訳テキストデータを、抽出された端末ＩＤの数分コピーし、コピーされた複数の翻訳テキストデータをそれら端末ＩＤが示す複数の聞き手装置３０に送信する。また、応答データに言語の異なる複数の翻訳テキストデータが含まれている場合、発話者装置２０は、複数の聞き手装置３０が、受信された複数の翻訳テキストデータの中の、各聞き手装置３０の言語情報に対応する翻訳テキストデータをそれぞれ受信できるように、当該複数の翻訳テキストデータを送信する。

発話者装置２０は、翻訳テキストデータと共に、音声認識結果のテキストデータも聞き手装置３０に送信してもよい。また、発話者装置２０は、応答データが正常応答を示し（Ｓ８６；ＹＥＳ）、かつ、その応答データに翻訳テキストデータが含まれない場合には、その応答データを保持し、次の応答データを待つ（図示せず）。発話者装置２０は、翻訳テキストデータを含む応答データを受信した場合に、関連識別データに基づいて、音声認識結果のテキストデータの連結、及び、その連結されたデータと翻訳テキストデータとの関連付けを行う。この場合、発話者装置２０は、翻訳テキストデータが含まれない応答データに含まれる音声認識結果のテキストデータのみを聞き手装置３０に送信してもよい。

聞き手装置３０は、発話者装置２０に送信した言語情報が示す言語に、発話音声データが翻訳された翻訳テキストデータを取得し、その翻訳テキストデータをモニタに表示する。また、聞き手装置３０は、その翻訳テキストデータを読み上げる音声を出力することもできる。更に、聞き手装置３０は、翻訳テキストデータと共に受信される、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータも同様に出力してもよい。また、聞き手装置３０は、翻訳テキストデータなく、音声認識結果のテキストデータを受信した場合には、そのテキストデータのみを出力してもよい。

図８では、複数の工程（処理）が順番に表されているが、第一実施形態で実行される工程及びその工程の実行順序は、図８の例のみに限定されない。例えば、（Ｓ８３）で取得される発話音声データと発話者の言語情報とは、異なるタイミングで取得されてもよい。発話者の言語情報は、（Ｓ８１）よりも前に取得され得る。また、図８では、説明の便宜のため簡易化されているが、発話音声データが随時取得される場合には、（Ｓ８３）以降が繰り返される。更に、当該翻訳データ提供方法は、正常応答を示す応答データに含まれる音声認識結果のテキストデータ及び翻訳テキストデータを表示ユニット１３のモニタに表示させる工程を含むこともできる。

〔第一実施形態における作用及び効果〕
上述のように、第一実施形態では、翻訳データの提供を望む聞き手装置３０から言語情報及び装置ＩＤが発話者装置２０により取得され、言語情報及び装置ＩＤが対応付けられて対応記憶部２２に格納される。そして、翻訳の元データとなる発話音声データが、発話者装置２０により取得され、対応記憶部２２に格納される対応情報に対応する言語指定データ及び発話音声データが発話者装置２０からサーバ装置１０に送られる。サーバ装置１０では、音声認識により発話音声データが発話テキストデータに変換され、この発話テキストデータが言語指定データにより示される言語に翻訳される。この翻訳テキストデータは、サーバ装置１０から発話者装置２０に送られ、その翻訳テキストデータに対応する言語情報と対応付けられて対応記憶部２２に格納される装置ＩＤを宛先に指定して、発話者装置２０から聞き手装置３０に送信される。

このように、第一実施形態によれば、聞き手装置３０は、発話音声データを取得する発話者装置２０を介して、サーバ装置１０で生成された翻訳テキストデータを取得することができる。即ち、聞き手装置３０は、発話者装置２０に言語情報及び装置ＩＤを提供することで、サーバ装置１０にアクセスすることなく、発話者装置２０から翻訳テキストデータを取得することができる。逆に、サーバ装置１０は、発話者装置２０のみを認識すればよく、送信する翻訳テキストデータをどの聞き手装置３０が受けるのかを認識する必要はない。従って、第一実施形態によれば、聞き手装置３０のユーザ（聞き手）の個人情報をサーバ装置１０に登録することなく、当該ユーザに、所望の言語への翻訳サービスを提供することができる。

聞き手装置３０のユーザの個人情報がサーバ装置１０に登録されるのを出来る限り避ける理由は、サーバ装置１０が翻訳の元となる発話に無関係な第三者的な（公共的な）立場にあるからである。第一実施形態では、発話者装置２０に、聞き手装置３０の言語情報及び端末ＩＤが格納される。しかしながら、発話者装置２０及び聞き手装置３０の各ユーザは、発話者と聞き手の関係、又は、それに近似する関係（例えば、発話音声データを取得する者とその発話の聞き手の関係）にあるため、発話者装置２０は、翻訳の元となる発話に関係する当事者的な立場にある。よって、発話者装置２０にそれら情報が格納されたとしても、個人情報の漏えいには結び付きにくい。

また、第一実施形態では、発話音声データに加えて、発話者の言語情報に対応する言語データが発話者装置２０からサーバ装置１０へ送信される。これにより、サーバ装置１０は、その言語データ用に、音声認識処理及び翻訳処理を切り替えることができるため、複数の翻訳形態をサポートすることができる。

更に、第一実施形態では、聞き手装置３０から取得された言語情報が複数の異なる言語を示す場合に、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアが、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付けられた状態で発話者装置２０により受信される。これにより、複数の聞き手装置３０が複数の異なる言語を要求する場合でも、各聞き手装置３０は、略同タイミングで、所望の言語に翻訳された翻訳テキストデータをそれぞれ取得することができる。

また、第一実施形態では、サーバ装置１０から発話者装置２０には、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペアが、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータと関連付け可能な状態で提供される。これにより、音声認識結果のテキストデータを発話者装置２０のモニタに表示させるようにすれば、発話者装置２０のユーザである発話者又はその発話を聴くことができる者は、そのテキストデータを見ることで、翻訳テキストデータが正確か否かを判断することができる。また、音声認識結果のテキストデータがサーバ装置１０において翻訳処理をするのに十分な文長を持たない場合には、翻訳テキストデータなしで、音声認識結果のテキストデータがサーバ装置１０から発話者装置２０に提供されてもよい。これにより、発話者装置２０は、サーバ装置１０での翻訳状況を把握することができる。

［第二実施形態］
以下、第二実施形態における発話者装置及び翻訳データ提供方法について複数の図面を用いて説明する。第二実施形態におけるシステム構成は第一実施形態と同様である。また、第二実施形態におけるサーバ装置１０及び発話者装置２０の処理構成についても第一実施形態と同様である。

第二実施形態では、発話者装置２０は、サーバ装置１０から、翻訳テキストデータ等に加えて、音声認識の信頼度情報を更に取得する。以下、第二実施形態について、第一実施形態と異なる内容を中心に説明し、第一実施形態と同様の内容については適宜省略する。

《サーバ装置》
音声認識部３１は、発話音声データに対して音声認識処理を行うことで発話テキストデータを生成し、更に、その音声認識結果の信頼度を算出する。例えば、音声認識部３１は、音響モデル及び言語モデルを用いて導出した認識結果候補の各単語に対して尤度を計算し、その候補の中から最終的に選択される単語の尤度と選択されなかった単語の尤度との差を用いて、当該信頼度を算出することができる。この場合、尤度の差が大きい程、高い信頼度が付与され、尤度の差が小さい程、低い信頼度が付与される。このような音声認識結果の信頼度の算出手法には周知の手法が利用されればよい。

翻訳部３２は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で発話者装置２０に送信する。翻訳部３２は、音声認識部３１により得られた発話テキストデータに対して翻訳処理をしない場合には、音声認識結果のテキストデータ（発話テキストデータ）、このテキストデータの翻訳結果となる翻訳テキストデータと関連付けるための関連識別データ、及び、その音声認識結果の信頼度情報を、応答データとして発話者装置２０に送信してもよい。

《発話者装置》
受信部２５は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態でサーバ装置１０から受信する。関連付け可能な状態で受信されるのであれば、翻訳テキストデータ、言語データ、音声認識結果のテキストデータ及び信頼度情報の受信の仕方は限定されない。音声認識結果のテキストデータ及び信頼度情報と、翻訳テキストデータ及び言語データとが別の応答データとして受信される場合には、第一実施形態で述べたように、各応答データには関連識別データが設定されればよい。

提供部２６は、受信部２５で受信された信頼度情報に基づいて、同様に受信された翻訳テキストデータをそのまま聞き手装置３０に送信するか否かを判定する。提供部２６は、その信頼度情報が所定値以上の信頼度を示す場合には、第一実施形態と同様に、翻訳テキストデータを聞き手装置３０に送信する。一方、提供部２６は、その信頼度情報が所定値よりも低い信頼度を示す場合には、その翻訳テキストデータの確度も低いため、信頼度が低いことを出力する。提供部２６は、信頼度が低いことを表示ユニット１３のモニタに表示させてもよいし、音でスピーカユニット１７に出力させてもよい。信頼度と比較される所定値は、信頼度の閾値であり、予め提供部２６により保持される。

また、提供部２６は、その信頼度情報が所定値よりも低い場合、その翻訳テキストデータを聞き手装置３０に送らないようにしてもよいし、送るか否かをユーザに決めさせてもよい。提供部２６は、信頼度が低いことと共に、聞き手装置３０に送信するか否かを選択するための操作ボタンをモニタに表示させ、その操作ボタンに対するユーザ操作に応じて、その翻訳テキストデータを送信すること又は送信しないことを決定してもよい。提供部２６は、翻訳テキストデータと共に、信頼度情報を聞き手装置３０に送信してもよい。

〔動作例／購買支援方法〕
以下、第二実施形態における翻訳データ提供方法について図９を用いて説明する。図９は、第二実施形態における発話者装置２０の動作例を示すフローチャートである。第二実施形態における翻訳データ提供方法の実行主体は、第一実施形態と同様である。各工程は、発話者装置２０が有する上述の各処理部の処理内容と同様であるため、各工程の詳細は、適宜省略される。また、図９において、図８と同様の内容の工程については、図８と同じ符号が付されている。

発話者装置２０は、第一実施形態と同様に、（Ｓ８１）から（Ｓ８４）を実行する。
サーバ装置１０は、（Ｓ８４）で送信されたデータを受信し、第一実施形態と同様に、音声認識処理及び翻訳処理を実行し、結果として、発話音声データが言語指定データが示す言語へ翻訳された翻訳テキストデータを生成する。加えて、第二実施形態では、サーバ装置１０は、音声認識結果の信頼度を算出する。サーバ装置１０は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で応答データとして発話者装置２０へ送信する。サーバ装置１０は、翻訳テキストデータなく、音声認識結果のテキストデータ、関連識別データ及びその音声認識結果の信頼度情報を応答データとして発話者装置２０へ送信してもよい。

発話者装置２０は、その応答データをサーバ装置１０から受信する（Ｓ９１）。応答データは、正常応答か否かを示す値、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペア、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ、及び、音声認識結果の信頼度情報を含む。言語指定データが複数の言語を示す場合、発話者装置２０は、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ及び信頼度情報と関連付けられた状態で応答データとして受信する。また、発話者装置２０は、音声認識結果のテキストデータ、関連識別データ及び音声認識結果の信頼度情報を応答データとして受信する場合もあり得る。

発話者装置２０は、その応答データが正常応答を示すか否かを判定する（Ｓ９２）。発話者装置２０は、その応答データが正常応答を示さない場合（Ｓ９２；ＮＯ）、第一実施形態と同様に、エラー情報を出力する（Ｓ８７）。

発話者装置２０は、その応答データが正常応答を示す場合（Ｓ９２；ＹＥＳ）、更に、応答データに含まれる信頼度情報が所定値より低い信頼度を示すか否かを判定する（Ｓ９３）。発話者装置２０は、信頼度情報が所定値以上の信頼度を示す場合（Ｓ９３；ＮＯ）、第一実施形態と同様に、応答データに含まれる翻訳テキストデータの宛先を特定し（Ｓ８８）、各聞き手装置３０に、所望の翻訳テキストデータをそれぞれ送信する（Ｓ８９）。第二実施形態では、発話者装置２０は、翻訳テキストデータと共に、信頼度情報を聞き手装置３０に送信してもよい。

聞き手装置３０は、発話者装置２０から翻訳テキストデータを受信し、第一実施形態と同様に、その翻訳テキストデータを出力するモニタに表示する。第二実施形態では、聞き手装置３０は、翻訳テキストデータと共に受信される信頼度情報を出力することもできる。

一方、発話者装置２０は、信頼度情報が所定値より低い信頼度を示す場合（Ｓ９３；ＹＥＳ）、信頼度が低いことを提示する（Ｓ９４）。例えば、発話者装置２０は、信頼度が低いことを表示ユニット１３のモニタに表示させてもよいし、音でスピーカユニット１７に出力させてもよい。

更に、発話者装置２０は、信頼度が低いことを提示すると共に、その翻訳テキストデータを聞き手装置３０に送信するか否かをユーザに選択させる操作画面をモニタに表示させる。発話者装置２０は、操作画像を介したユーザ操作により、ユーザが送信を選択したか否かを判定する（Ｓ９５）。発話者装置２０は、ユーザが送信を選択したと判定すると（Ｓ９５；ＹＥＳ）、上述のように（Ｓ８８）を実行する。発話者装置２０は、ユーザが送信を選択しなかったと判定した場合には（Ｓ９５；ＮＯ）、エラー情報を出力する（Ｓ８７）。

図９では、複数の工程（処理）が順番に表されているが、第二実施形態で実行される工程及びその工程の実行順序は、図９の例のみに限定されない。例えば、図９に示される（Ｓ９５）を省き、信頼度が所定値よりも低い場合には（Ｓ９３；ＹＥＳ）、発話者装置２０は、無条件に、その翻訳テキストデータを聞き手装置３０に送らず、エラー情報を出力してもよい（Ｓ８７）。また、発話者装置２０は、信頼度と所定値との比較結果に依存せず、応答データに含まれる信頼度情報を常に提示するようにしてもよい。

〔第二実施形態における作用及び効果〕
上述のように、第二実施形態では、音声認識結果の信頼度情報が、翻訳テキストデータ、言語データ、音声認識結果のテキストデータに関連付け可能な状態で、サーバ装置１０から発話者装置２０へ提供される。これにより、発話者装置２０は、この信頼度情報に基づいて、翻訳テキストデータをそのまま聞き手装置３０に送信するか否かを判定することができる。音声認識結果の信頼度が低い場合、音声認識結果のテキストデータの確度が低く、結果として、そのテキストデータから変換される翻訳テキストデータの確度も低くなる。従って、その信頼度情報を用いることで、誤った翻訳内容が聞き手装置３０に提供されるのを防ぐことができる。また、発話者装置２０がその信頼度情報を提示すれば、発話者に音声認識の信頼度が低いことを認識させることができ、発話者に言い直しの機会を与えることができる。これにより、発話内容を他の言語で適切に聞き手に伝えることができる。更に、信頼度が低い場合に、発話者装置２０が翻訳テキストデータの聞き手装置３０への送信をユーザに選択させることで、信頼度が低くても正しく翻訳された翻訳テキストデータについては、聞き手装置３０に提供することができる。

［第一実施形態及び第二実施形態の補足］
図１には、１台のサーバ装置１０が例示されているが、翻訳システムは、複数のサーバ装置１０を含むこともできる。例えば、音声認識部３１を有するサーバ装置１０と翻訳部３２を有するサーバ装置１０とが異なる装置であってもよい。この場合、発話者装置２０が発話音声データ等を送信するサーバ装置１０と、発話者装置２０が翻訳テキストデータ等を受信するサーバ装置１０とが異なることになる。また、翻訳言語毎に異なるサーバ装置１０が設けられてもよい。

また、聞き手装置３０は、他の聞き手装置３０を介して、発話者装置２０と通信を行ってもよい。例えば、発話者装置２０と複数の聞き手装置３０とは無線マルチホップネットワークを形成してもよい。この例によれば、発話者装置２０からの電波が届かない位置に存在する聞き手装置３０も発話者装置２０から翻訳データの提供を受けることができる。無線マルチホップネットワークにおけるデータの伝搬手法には、周知の手法が利用されればよい。

［第三実施形態］
以下、第三実施形態における情報処理装置及び翻訳データ提供方法について図１０及び図１１を用いて説明する。

図１０は、第三実施形態における情報処理装置の処理構成例を概念的に示す図である。図１０に示されるように、情報処理装置５０は、情報取得部５１、送信部５２、受信部５３、提供部５４等を有する。情報取得部５１は、端末装置から言語情報を取得する。送信部５２は、情報取得部５１により取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する。受信部５３は、発話データが言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する。提供部５４は、受信された翻訳データを上記端末装置に送信する。

情報処理装置５０の一例が、上述の発話者装置２０である。端末装置の一例が、上述の聞き手装置３０であり、サーバ装置の一例が、上述のサーバ装置１０である。但し、受信部５３が翻訳データを受信するサーバ装置と、送信部５２が音声データを送信するサーバ装置とが異なってもよい。

送信部５２の具体的処理内容の一例が、上述の送信部２４である。送信部５２により送信される発話データは、音声データでなくてもよい。例えば、送信部５２は、発話テキストデータを発話データとしてサーバ装置に送信してもよい。発話テキストデータは、情報処理装置５０の入力装置をユーザが操作することで入力されてもよい。また、情報処理装置５０が上述の音声認識部３１を有し、当該発話テキストデータは、その音声認識部３１により発話音声データから変換されてもよい。この場合、情報処理装置５０は、音声認識結果のテキストデータを生成し、音声認識の信頼度を算出することができる。発話データの送信先であるサーバ装置は、音声認識部３１を持たなくてもよい。

送信部５２は、発話者の言語情報に対応する言語データを送信しなくてもよい。これは、発話者の言語が固定的に１つに決められている場合や、サーバ装置側で発話データから言語が自動で認識可能である場合等に該当する。

受信部５３の具体的処理内容の一例が、上述の受信部２５で示される。受信部５３により受信される翻訳データは、テキストデータではなく、音声データであってもよい。この場合、サーバ装置は、翻訳音声データを生成し、送信する。また、受信部５３は、送信部５２により送信される言語指定データが１つの言語を示す場合等には、翻訳データに対応する言語データを受信しなくてもよい。更に、受信部５３は、音声認識結果のテキストデータも受信しなくてもよい。翻訳データのみが端末装置に提供されればよく、情報処理装置５０において音声認識結果のテキストデータを必ずしも提示しなくてもよいからである。

提供部５４の具体的処理内容の一例が、上述の提供部２６で示される。提供部５４により送信される翻訳データは、テキストデータではなく、音声データであってもよい。受信部５３がサーバ装置から翻訳テキストデータを取得する場合、提供部５４は、その翻訳テキストデータを読み上げる翻訳音声データを生成し、その翻訳音声データを端末装置に送信してもよい。

また、提供部５４は、端末ＩＤを指定したユニキャスト通信ではなく、翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信することもできる。この場合、端末装置は、受信された翻訳データの中から、所望の言語データと関連付けられた翻訳データを抽出すればよい。

情報取得部５１の具体的処理内容の一例が、上述の情報取得部２１で示される。但し、情報取得部５１は、提供部５４が無線ブロードキャストで翻訳データを送信する場合には、装置ＩＤを取得しなくてもよい。

図１０に示されるように、情報処理装置５０は、対応記憶部２２を有していなくてもよい。この場合、情報取得部５１は、他のコンピュータが有する対応記憶部２２に、各言語情報及び各端末ＩＤを対応付けて格納すればよい。また、情報取得部５１は、装置ＩＤを取得しない場合には、言語情報のみを保持すればよい。

図１０に示される情報処理装置５０は、例えば、図２に示される上述の発話者装置２０と同様のハードウェア構成を有し、その発話者装置２０と同様にプログラムが処理されることで、上述の各処理部が実現される。情報処理装置５０のハードウェア構成は制限されない。

図１１は、第三実施形態における情報処理装置５０の動作例を示すフローチャートである。図１１に示されるように、第三実施形態における翻訳データ提供方法は、情報処理装置５０のような少なくとも１つのコンピュータにより実行される。例えば、図示される各工程は、情報処理装置５０が有する各処理部により実行される。

本実施形態における翻訳データ提供方法は、（Ｓ１１１）〜（Ｓ１１６）を含む。（Ｓ１１１）では、コンピュータが、端末装置から言語情報を取得する。（Ｓ１１２）では、コンピュータが、（Ｓ１１１）で取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する。（Ｓ１１３）では、コンピュータが、応答データをサーバ装置から受信する。応答データが正常応答を示す場合（Ｓ１１４；ＹＥＳ）、応答データは、発話データが言語指定データが示す言語に翻訳された翻訳データを含む。応答データが正常応答を示さない場合（Ｓ１１４；ＮＯ）、コンピュータは、エラー情報を出力する（Ｓ１１６）。（Ｓ１１５）では、コンピュータは、（Ｓ１１３）で受信された翻訳データを端末装置に送信する。

（Ｓ１１１）の一例が、図８及び図９の（Ｓ８１）であり、（Ｓ１１２）の一例が、図８及び図９の（Ｓ８４）であり、（Ｓ１１３）の一例が、図８の（Ｓ８５）及び図９の（Ｓ９１）である。（Ｓ１１５）の一例が、図８及び図９の（Ｓ８８）及び（Ｓ８９）であり、（Ｓ１１６）の一例が、図８及び図９の（Ｓ８７）である。

また、第三実施形態は、このような翻訳データ提供方法を少なくとも１つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録した当該少なくとも１つのコンピュータが読み取り可能な記録媒体であってもよい。

第三実施形態によれば、上述の第一実施形態及び第二実施形態と同様の作用効果を得ることができる。

以下に実施例を挙げ、上述の各実施形態を更に詳細に説明する。本発明は以下の実施例から何ら限定を受けない。

翻訳データの提供を受けるにあたり、聞き手は、自身の聞き手装置３０を操作して、自身の聞き手装置３０を発話者装置２０とペアリングをさせる。聞き手装置３０と発話者装置２０との間のペアリングは、両端末間の無線通信の形態（Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＺｉｇＢｅｅ、ＮＦＣ、Ｗｉ−Ｆｉ等）に対応する認証等を経て、実現される。このペアリングの過程で、発話者装置２０（情報取得部２１）は、各聞き手装置３０から端末ＩＤをそれぞれ取得してもよい。更に、発話者装置２０は、ペアリング時に、各聞き手装置３０との間に無線チャネルをそれぞれ確立すると共に、各聞き手装置３０からユーザプロフィール情報をそれぞれ受信する（情報取得部２１及び情報取得部５１）。このユーザプロフィール情報に、聞き手の言語情報が含まれる。これにより、聞き手装置３０のユーザは、発話者装置２０とペアリングを行う指示操作をするだけで、翻訳データの提供を受けることができる。

また、発話者装置２０は、人体の表面電界を利用するヒューマンエリアネットワーク技術を用いて、聞き手の言語情報を聞き手装置３０から取得することもできる。この場合、情報取得部２１及び情報取得部５１は、聞き手装置３０のような端末装置との間での人体通信の成功に伴い、その端末装置から言語情報を取得する。この場合、発話者装置２０は、ヒューマンエリアネットワーク技術を用いた人体通信を行う通信ユニット１５を持ち、通信ユニット１５を用いた人体通信により、言語情報を取得する。このようにすれば、聞き手装置３０のユーザは、聞き手装置３０を保持しつつ、発話者装置２０の保持者と、握手のような体を触れ合わせる行動をするだけで、簡単に、翻訳データの提供を受けることができる。

上述の各実施形態は、発話者と聞き手装置３０のユーザである聞き手との会話における発話を翻訳対象とすることができる。更に、各実施形態は、講演会やセミナー等での講演者の発話を翻訳対象とすることもできる。この場合、各々異なる言語で聴講することを希望する複数の聞き手が存在する可能性がある。発話者装置２０にペアリングできる聞き手装置３０の数に制限がある場合でも、無線マルチホップネットワークを用いることで、複数の聞き手装置３０が発話者装置２０と通信をすることができる。また、無線マルチホップネットワークを用いなくとも、複数の発話者装置２０を用いて、全ての聞き手装置３０がいずれか１つの発話者装置２０とペアリングできるようにすることもできる。上述の各実施形態によれば、各聞き手は、所望の言語の翻訳データを略同時にそれぞれ聞くことができる。

なお、上述の説明で用いた複数のフローチャートでは、複数の工程（処理）が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態及び各変形例は、内容が相反しない範囲で組み合わせることができる。

上記の内容の一部又は全部は、以下のようにも特定され得る。但し、上述の内容が以下の記載に限定されるものではない。

１．端末装置から言語情報を取得する情報取得手段と、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、
前記受信された翻訳データを前記端末装置に送信する提供手段と、
を備える情報処理装置。
２．前記情報取得手段は、複数の端末装置から複数の異なる言語情報を取得し、
前記送信手段は、前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データをサーバ装置に送信し、
前記受信手段は、サーバ装置から前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
前記提供手段は、前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
１．に記載の情報処理装置。
３．前記情報取得手段は、前記端末装置から、前記言語情報及び端末識別情報を取得し、各端末識別情報と各言語情報とを対応付けて記憶し、
前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
１．又は２．に記載の情報処理装置。
４．前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
１．から３．のいずれか１つに記載の情報処理装置。
５．前記発話者の発話音声データ及び言語情報を取得する発話データ取得手段、
を更に備え、
前記送信手段は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データをサーバ装置に送信し、
前記受信手段は、サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
１．から４．のいずれか１つに記載の情報処理装置。
６．前記受信手段は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
５．に記載の情報処理装置。
７．前記受信手段は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
５．又は６．に記載の情報処理装置。
８．前記情報取得手段は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
１．から７．のいずれか１つに記載の情報処理装置。

９．少なくとも１つのコンピュータに実行される翻訳データ提供方法において、
端末装置から言語情報を取得し、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、
前記受信された翻訳データを前記端末装置に送信する、
ことを含む翻訳データ提供方法。
１０．複数の端末装置から複数の異なる言語情報を取得し、
前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データを送信し、
前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
ことを更に含む９．に記載の翻訳データ提供方法。
１１．前記端末装置から端末識別情報を取得し、
各端末識別情報と各言語情報とを対応付けて記憶する、
ことを更に含み、
前記端末装置への送信は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
９．又は１０．に記載の翻訳データ提供方法。
１２．前記端末装置への送信は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
９．から１１．のいずれか１つに記載の翻訳データ提供方法。
１３．前記発話者の発話音声データ及び言語情報を取得する、
ことを更に含み、
前記サーバ装置への送信は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データを送信し、
前記サーバ装置からの受信は、前記サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
９．から１２．のいずれか１つに記載の翻訳データ提供方法。
１４．前記サーバ装置からの受信は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
１３．に記載の翻訳データ提供方法。
１５．前記サーバ装置からの受信は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
１３．又は１４．に記載の翻訳データ提供方法。
１６．前記言語情報の取得は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
９．から１５．のいずれか１つに記載の翻訳データ提供方法。

１７．９．から１６．のいずれか１つに記載の翻訳データ提供方法を少なくとも１つのコンピュータに実行させるプログラム。
１８．１７．に記載のプログラムをコンピュータが読み取り可能に記録する記録媒体。

この出願は、２０１４年７月８日に出願された日本出願特願２０１４−１４０１３４号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

端末装置から言語情報を取得する情報取得手段と、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、
前記受信された翻訳データを前記端末装置に送信する提供手段と、
を備える情報処理装置。
前記情報取得手段は、複数の端末装置から複数の異なる言語情報を取得し、
前記送信手段は、前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データをサーバ装置に送信し、
前記受信手段は、サーバ装置から前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
前記提供手段は、前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
請求項１に記載の情報処理装置。
前記情報取得手段は、前記端末装置から、前記言語情報及び端末識別情報を取得し、各端末識別情報と各言語情報とを対応付けて記憶し、
前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
請求項１又は２に記載の情報処理装置。
前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
請求項１から３のいずれか１項に記載の情報処理装置。
前記発話者の発話音声データ及び言語情報を取得する発話データ取得手段、
を更に備え、
前記送信手段は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データをサーバ装置に送信し、
前記受信手段は、サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
請求項１から４のいずれか１項に記載の情報処理装置。
前記受信手段は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
請求項５に記載の情報処理装置。
前記受信手段は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
請求項５又は６に記載の情報処理装置。
前記情報取得手段は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
請求項１から７のいずれか１項に記載の情報処理装置。
少なくとも１つのコンピュータに実行される翻訳データ提供方法において、
端末装置から言語情報を取得し、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、
前記受信された翻訳データを前記端末装置に送信する、
ことを含む翻訳データ提供方法。
請求項９に記載の翻訳データ提供方法を少なくとも１つのコンピュータに実行させるプログラム。