JPWO2016006354A1 - 情報処理装置及び翻訳データ提供方法 - Google Patents

情報処理装置及び翻訳データ提供方法 Download PDF

Info

Publication number
JPWO2016006354A1
JPWO2016006354A1 JP2016532491A JP2016532491A JPWO2016006354A1 JP WO2016006354 A1 JPWO2016006354 A1 JP WO2016006354A1 JP 2016532491 A JP2016532491 A JP 2016532491A JP 2016532491 A JP2016532491 A JP 2016532491A JP WO2016006354 A1 JPWO2016006354 A1 JP WO2016006354A1
Authority
JP
Japan
Prior art keywords
data
language
information
translation
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016532491A
Other languages
English (en)
Inventor
康憲 加藤
康憲 加藤
和樹 関谷
和樹 関谷
浩 中里
浩 中里
有一 好光
有一 好光
雅高 水澤
雅高 水澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Publication of JPWO2016006354A1 publication Critical patent/JPWO2016006354A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

情報処理装置(50)は、端末装置から言語情報を取得する情報取得部(51)と、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信部(52)と、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信部(53)と、前記受信された翻訳データを前記端末装置に送信する提供部(54)と、を有する。

Description

本発明は、翻訳サービスを提供する技術に関する。
下記特許文献1には、多言語交信方法が提案されている。この方法では、座席に設けられたモニタでリストの中から所望の言語が選択されると、その座席と選択言語との対応関係が管理される。その対応関係に基づいて、その座席の音響システムやモニタには、その選択言語でコンテンツが出力される。
下記特許文献2には、チャットシステムにおけるチャネルとVoIP(Voice over IP(Internet Protocol))システムにおけるVoIP用会議室との間を中断することなく円滑にかつ容易に移行できるマルチチャネル会話システムが提案されている。この提案システムは、VoIP会議室内で送受信される音声会話メッセージを音声認識し、その認識結果である文字列を翻訳し、この翻訳結果の文字列とその文字列から抽出されたキーワードをチャットサーバに送信する。チャットサーバは、翻訳結果の文字列情報と抽出されたキーワードを文字列会話メッセージとしてクライアント端末に送信する。
下記特許文献3には、コミュニケーション支援方法が提案されている。この提案では、クライアント装置が、音声データを言語認識及び言語解析することで、第一言語に基づく内部表現を生成し、この内部表現の重要度を判定する。サーバ装置は、その重要度に応じたモードでその内部表現を第二言語に翻訳する。この提案手法によれば、重要な内容を含まない入力に対しては、低負荷の翻訳処理が自動的に選択されることで、翻訳結果を得るまでの応答時間を早めることができる。
特表2006−512647号公報 特開2004−185088号公報 特開2004−355118号公報
上述の提案手法では、サーバ装置が複数のクライアント装置に対して多言語の翻訳結果を提供する。これにより、各クライアント装置の各ユーザは、所望の言語でのコンテンツの提供をそれぞれ受けることができる。しかしながら、このような手法では、各クライアント装置は、各ユーザの正当性を証明して、サーバ装置と通信(セッション)を確立することが求められる。正当性証明のために、各ユーザ情報がサーバ装置にそれぞれ登録される。即ち、このような手法によれば、会話の参加者や講義の聴講者といった情報が全てサーバ装置上に残ることになる。このような情報は、個人的な嗜好を示す個人情報であると考えることができる。
本発明は、このような事情に鑑みてなされたものであり、聞き手の個人情報をサーバ装置へ登録することなく、聞き手に所望の言語への翻訳サービスを提供する技術を実現する。
本発明の各側面では、上述した課題を解決するために、それぞれ以下の構成を採用する。
第一の側面は、情報処理装置に関する。第一の側面に係る情報処理装置は、端末装置から言語情報を取得する情報取得手段と、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、前記受信された翻訳データを前記端末装置に送信する提供手段と、を有する。
第二の側面は、少なくとも1つのコンピュータにより実行される翻訳データ提供方法に関する。第二の側面に係る翻訳データ提供方法は、端末装置から言語情報を取得し、前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、前記受信された翻訳データを前記端末装置に送信する、ことを含む。
なお、本発明の他の側面としては、上記第二の側面の方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記録媒体であってもよい。この記録媒体は、非一時的な有形の媒体を含む。
上記各側面によれば、聞き手の個人情報をサーバ装置へ登録することなく、聞き手に所望の言語への翻訳サービスを提供する技術を実現することができる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
第一実施形態における発話者装置を含む翻訳システムのシステム構成を概念的に示す図である。 第一実施形態における発話者装置のハードウェア構成例を概念的に示す図である。 第一実施形態における発話者装置の処理構成例を概念的に示す図である。 対応記憶部に格納される対応付け情報の例を示す図である。 サーバ装置からの正常応答のデータの例を示す図である。 サーバ装置からの異常応答のデータの例を示す図である。 サーバ装置の処理構成例を概念的に示す図である。 第一実施形態における発話者装置の動作例を示すフローチャートである。 第二実施形態における発話者装置の動作例を示すフローチャートである。 第三実施形態における情報処理装置の処理構成例を概念的に示す図である。 第三実施形態における情報処理装置の動作例を示すフローチャートである。
以下、本発明の実施の形態について説明する。なお、以下に挙げる各実施形態はそれぞれ例示であり、本発明は以下の各実施形態の構成に限定されない。
[第一実施形態]
以下、第一実施形態における発話者装置及び翻訳データ提供方法について複数の図面を用いて説明する。
〔システム構成〕
図1は、第一実施形態における発話者装置を含む翻訳システムのシステム構成を概念的に示す図である。翻訳システムは、サーバ装置10、発話者装置20等を含む。翻訳システムは、サーバ装置10を介して、聞き手装置30に翻訳サービスを提供する。翻訳システムは、複数のサーバ装置10、複数の発話者装置20を含むこともできるし、1つのサーバ装置10を介して、複数の聞き手装置30に翻訳サービスを提供することもできる。
サーバ装置10と発話者装置20とは、通信網9を介して通信可能に接続される。通信網9は、携帯電話回線網、Wi−Fi(Wireless Fidelity)回線網、インターネット通信網、専用回線網、LAN(Local Area Network)等である。本実施形態では、通信網9の通信形態は制限されない。
サーバ装置10は、いわゆるコンピュータであり、図1に示されるように、CPU(Central Processing Unit)2、メモリ3、入出力インタフェース(I/F)4、通信ユニット7等を有する。メモリ3は、RAM(Random Access Memory)、ROM(Read Only Memory)、ハードディスク等である。入出力I/F4は、表示装置(図示せず)、入力装置(図示せず)等のユーザインタフェース装置と接続可能である。通信ユニット7は、発話者装置20のような他のコンピュータとの通信や、他の機器との信号のやりとり等を行う。サーバ装置10のハードウェア構成は制限されない。
《発話者装置》
図2は、第一実施形態における発話者装置20のハードウェア構成例を概念的に示す図である。発話者装置20は、PC(Personal Computer)、携帯電話、スマートフォン、タブレット端末、ウェアラブルコンピュータのようないわゆるコンピュータである。発話者装置20は、CPU11、メモリ12、表示ユニット13、タッチセンサ14、通信ユニット15、マイクロフォンユニット16、スピーカユニット17等を有する。CPU11は、他の各ユニットとバス等の通信線により接続される。
メモリ12は、RAM、ROM、補助記憶装置(ハードディスク等)である。
表示ユニット13は、LCD(Liquid Crystal Display)やCRT(Cathode Ray Tube)ディスプレイ等のようなモニタを含み、表示処理を行う。
タッチセンサ14は、外部からの接触を感知することによりユーザからの操作入力を受け付ける。タッチセンサ14は、非接触状態であっても外部からの近接状態を検知することができるセンサであってもよい。また、表示ユニット13及びタッチセンサ14は、タッチパネルユニットとして実現されてもよい。更に、発話者装置20は、タッチセンサ14と共に、又は、タッチセンサ14の代わりに、マウスやキーボード等の入力装置と接続される入出力インタフェース(図示せず)を持つようにしてもよい。
マイクロフォンユニット16は、集音装置である。
スピーカユニット17は、音出力装置である。
通信ユニット15は、無線又は有線により他の装置と通信を行う。例えば、発話者装置20が携帯型端末の場合には、通信ユニット15は、無線により通信網9と接続し、通信網9を介してサーバ装置10の通信ユニット7と通信を行い、聞き手装置30とも無線通信を行う。発話者装置20と聞き手装置30との間の無線通信の形態には、例えば、Bluetooth(登録商標)、ZigBee、NFC(Near Field Communication)、Wi−Fi等がある。但し、その無線通信の形態は制限されない。
発話者装置20は、図2に示されるハードウェア要素以外にも、撮像ユニット、振動センサ、加速度センサ等を含むこともできる。発話者装置20のハードウェア構成も制限されない。
聞き手装置30は、いわゆるコンピュータであり、発話者装置20と同様のハードウェア構成を有する。発話者装置20と通信可能であり、かつ、発話者装置20から送られる翻訳データを出力可能であれば、聞き手装置30のハードウェア構成も制限されない。発話者装置20と聞き手装置30とのハードウェア構成は異なっていてもよい。
〔処理構成〕
《発話者装置》
図3は、第一実施形態における発話者装置20の処理構成例を概念的に示す図である。発話者装置20は、情報取得部21、対応記憶部22、発話データ取得部23、送信部24、受信部25、提供部26等を有する。これら各処理部は、例えば、CPU11によりメモリ12に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD(Compact Disc)、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから通信ユニット15を介してインストールされ、メモリ12に格納されてもよい。
情報取得部21は、複数の聞き手装置30から言語情報及び端末IDをそれぞれ取得する。言語情報は、各聞き手装置30のユーザが用いる言語の情報であり、日本語、英語、フランス語、ドイツ語、中国語等を示す。各聞き手装置30から得られる言語情報は、複数の言語を示すこともできる。言語情報が複数の言語を示す場合には、各言語に優先度が付されていてもよい。各聞き手装置30のユーザの使用言語が異なる場合には、情報取得部21は、複数の聞き手装置30から複数の異なる言語情報を取得することになる。
端末IDは、端末識別情報であり、発話者装置20と聞き手装置30との間の通信で宛先又は送信元のアドレスとして用いられる。情報取得部21による言語情報及び端末IDの具体的な取得手法については、実施例の項で例示する。
情報取得部21は、取得された各言語情報及び各端末IDを対応付けて対応記憶部22に格納する。
図4は、対応記憶部22に格納される対応付け情報の例を示す図である。図4に例示されるように、対応記憶部22は、端末IDと言語情報とを対応付けて記憶する。対応記憶部22に格納される言語情報及び端末IDは、情報取得部21により取得されたものそのものであってもよいし、情報取得部21により取得されたものに加工が施されたものであってもよい。例えば、情報取得部21がテキストデータにより言語情報を取得した場合に、対応記憶部22には、そのテキストデータが示す言語に対応する言語IDが格納されてもよい。また、情報取得部21により取得された言語情報が複数の言語を示す場合に、対応記憶部22には、その複数の言語から抽出された1つの言語の情報が格納されてもよい。対応記憶部22に格納される端末IDは、発話者装置20により独自に生成された識別データであってもよい。この場合、発話者装置20は、その独自に生成した識別データと情報取得部21により取得された端末IDとの対応付けを管理する。
発話データ取得部23は、発話者の発話音声データを取得する。発話データ取得部23は、マイクロフォンユニット16により集音された音声信号がPCM(Pulse Code Modulation)により変換された音声データを発話音声データとして取得する。マイクロフォンユニット16により集音される音声信号には、発話者の発話音声に加えて、環境音も含まれる。そこで、発話データ取得部23は、取得された音声データに対して環境音を除去するためのフィルタ処理を施し、得られる音声データを発話音声データとすることもできる。また、発話データ取得部23は、発話者が発言していない無言時間も含む発話音声データを取得してもよいし、無言時間が除去された発話音声データを取得してもよい。
発話データ取得部23による発話音声データの取得手法は、このような手法に制限されない。発話データ取得部23は、発話者の発話が録音され、メモリ12や可搬型記録媒体や他のコンピュータに格納されている発話音声データを取得してもよい。
発話データ取得部23は、発話者の発話で用いられる言語の情報を更に取得する。発話データ取得部23は、発話者の言語情報を予め持ってもよい。発話者の言語情報は、モニタに表示される入力画面に基づいて入力装置をユーザが操作することにより入力されてもよい。
送信部24は、発話データ取得部23により取得された発話音声データ及び発話者の言語情報に対応する言語データ、並びに、対応記憶部22に格納される言語情報に対応する言語指定データをサーバ装置10に送信する。言語指定データ及び言語データには、例えば、IETF(The Internet Engineering Task Force)によりBCP47として定義された形式が利用される。但し、言語指定データ及び言語データのデータ形式は任意である。言語データは、発話データ取得部23により取得される発話者の言語情報そのものであってもよい。言語指定データは、対応記憶部22に格納される言語情報そのものであってもよい。
発話音声データ、発話者の言語データ及び言語指定データの送信タイミングは、同時でなくてもよい。例えば、送信部24は、情報取得部21により言語情報が取得された後であれば、言語指定データを他のデータより先に送信することができる。また、送信部24は、発話データ取得部23が発話者の言語情報が予め有している場合には、発話者の言語データを他のデータより先に送信することができる。
受信部25は、送信部24により送信された発話音声データが、同様に送信された言語指定データが示す言語に翻訳された、翻訳テキストデータをサーバ装置10から受信する。受信部25は、言語指定データが複数の言語を示す場合、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する。
関連付け可能な状態で受信されるのであれば、翻訳テキストデータ及び言語データの複数のペアと音声認識結果のテキストデータとの受信の仕方は限定されない。例えば、受信部25は、翻訳テキストデータ及び言語データの複数のペアと音声認識結果のテキストデータとを1つの通信メッセージ(応答データ)で受信する。また、受信部25は、当該複数のペアと音声認識結果のテキストデータとを別々の通信メッセージ(応答データ)で受信してもよい。この場合、当該複数のペアと音声認識結果のテキストデータとを関連付けるための関連識別データが各通信メッセージにそれぞれ設定されればよい。更に、受信部25は、1つの翻訳テキストデータを含む当該複数ペアに対して、複数の音声認識結果のテキストデータを受信してもよい。この場合にも、関連識別データを用いることにより、複数の音声認識結果のテキストデータが連結され、かつ、その連結されたテキストデータが当該複数のペアと関連付けられる。
図5は、サーバ装置10からの正常応答のデータの例を示す図である。図6は、サーバ装置10からの異常応答のデータの例を示す図である。図5及び図6の例では、サーバ装置10からの応答データは、JSON(JavaScript(登録商標) Object Notation)形式で記載されている。キー「result」の値が正常応答か否か(OK又はERROR)を示し、キー「recg」の配列が音声認識結果を示し、キー「trans」の配列が翻訳結果を示し、キー「code」の値がエラーコードを示し、キー「message」の値がエラーメッセージを示す。「recg」配列は、発話者の言語データに相当する要素「region」、発話音声データの音声認識結果のテキストデータに相当する要素「text」を有する。「trans」配列は、言語データに相当する要素「region」とその言語データに対応する翻訳テキストデータに相当する要素「text」とのペアが、言語指定データが示す言語の数分、含まれる。
図5の例によれば、翻訳テキストデータと言語データとは、「trans」配列内の1要素として関連付けられており、翻訳テキストデータと言語データとの複数ペアは、応答データ内の「recg」配列と「trans」配列との関係により関連付けられている。但し、受信部25がサーバ装置10から受信する応答データは、図5及び図6に示される形式に制限されない。識別データが各応答データに設定されれば、「recg」配列と「trans」配列とは異なる応答データにより受信されてもよい。
送信部24及び受信部25は、例えば、Webソケットを用いることにより、サーバ装置10との間で1つのセッションで双方向通信を行うことができる。これによれば、発話者装置20からサーバ装置10に向かう方向の発話音声データ等と、逆方向の翻訳テキストデータ等とが非同期でやりとりされ得る。即ち、サーバ装置10は、受信した発話音声データを自由に区切り、区切られた部分的な発話音声データから変換された翻訳テキストデータを発話者装置20に任意のタイミングで逐次送信することができる。
提供部26は、受信部25により受信された翻訳テキストデータを、その翻訳テキストデータに対応する言語情報と対応付けられて対応記憶部22に記憶される端末IDを宛先に指定して送信する。このとき、提供部26は、翻訳テキストデータに関連付けられて受信される言語データを用いて、その言語データと一致する言語情報と対応付けられた端末IDを対応記憶部22から抽出する。1つの言語データに関して複数の端末IDが対応記憶部22から抽出された場合、提供部26は、当該翻訳テキストデータを、抽出された端末IDの数分コピーし、コピーされた複数の翻訳テキストデータをそれら端末IDが示す複数の聞き手装置30に送信する。
言語の異なる複数の翻訳テキストデータが受信された場合、提供部26は、複数の聞き手装置30が、受信された複数の翻訳テキストデータの中の、各聞き手装置30の言語情報に対応する翻訳テキストデータをそれぞれ受信できるように、当該受信された複数の翻訳テキストデータを送信する。この場合、提供部26は、翻訳テキストデータ毎に、対応記憶部22から装置IDを抽出し、各翻訳テキストデータを、抽出された装置IDを宛先に指定してそれぞれ送信する。提供部26は、翻訳テキストデータと共に、音声認識結果のテキストデータも聞き手装置30に送信してもよい。
《サーバ装置》
図7は、サーバ装置10の処理構成例を概念的に示す図である。サーバ装置10は、音声認識部31、翻訳部32等を有する。これら各処理部は、例えば、CPU2によりメモリ3に格納されるプログラムが実行されることにより実現される。また、当該プログラムは、例えば、CD、メモリカード等のような可搬型記録媒体やネットワーク上の他のコンピュータから通信ユニット7を介してインストールされ、メモリ3に格納されてもよい。
音声認識部31は、発話者装置20から発話音声データを受信し、その発話音声データに対して音声認識処理を行う。音声認識処理には、周知の音声認識技術が利用されればよい。例えば、音声認識部31は、音の波形データを集めて形成される音響モデルと、単語と単語の並び方を集めて形成される言語モデルを用いて、発話音声データを発話テキストデータに変換する。この場合、音声認識部31は、発話者装置20から送られる発話者の言語データに基づいて、音声認識処理で用いる音響モデル及び言語モデルをその言語データが示す言語用のモデルに切り替える。また、サーバ装置10は、言語毎に、各言語にカスタマイズされた音声認識部31をそれぞれ有してもよい。この場合には、発話者装置20から送られる発話者の言語データに基づいて、サーバ装置10は、実行する音声認識部31を切り替えることもできる。
翻訳部32は、音声認識部31により得られた発話テキストデータに対して、発話者の言語データが示す言語から言語指定データが示す言語への翻訳処理(機械翻訳)を実行する。この翻訳処理には、ルールベース翻訳手法、統計ベース翻訳手法等のような周知の翻訳技術が利用されればよい。言語指定データが複数の異なる言語を示す場合、翻訳部32は、発話テキストデータに対して、各言語に対応する翻訳処理をそれぞれ実行する。翻訳部32は、上記翻訳処理により、言語指定データが示す各言語の翻訳テキストデータをそれぞれ生成する。
翻訳部32は、生成された翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ(発話テキストデータ)と関連付けた状態で応答データとして発話者装置20に送信する。例えば、翻訳部32は、図5及び図6に示される形式を持つ応答データを発話者装置20に送信する。
翻訳部32は、翻訳するのに十分な長さの発話テキストデータが音声認識部31により得られるまで待って、翻訳処理を実行してもよい。即ち、翻訳部32により翻訳処理されるデータ単位と、音声認識部31により音声認識処理されるデータ単位とは異なってもよい。翻訳部32は、音声認識部31により発話テキストデータが得られたものの、そのデータに対して翻訳処理をしない場合には、音声認識結果のテキストデータ(発話テキストデータ)、及び、このテキストデータの翻訳結果となる翻訳テキストデータと関連付けるための関連識別データを、応答データとして発話者装置20に送信してもよい。このようにすれば、発話者装置20が、長い間、応答データをサーバ装置10から受け取れないという事象を回避することができる。
〔動作例/購買支援方法〕
以下、第一実施形態における翻訳データ提供方法について図8を用いて説明する。図8は、第一実施形態における発話者装置20の動作例を示すフローチャートである。図8に示されるように、第一実施形態における翻訳データ提供方法は、発話者装置20のような少なくとも1つのコンピュータにより実行される。例えば、図示される各工程は、発話者装置20が有する各処理部により実行される。各工程は、発話者装置20が有する上述の各処理部の処理内容と同様であるため、各工程の詳細は、適宜省略される。
以下の説明では、発話者装置20が複数の聞き手装置30に翻訳データを提供する場合が例示される。
発話者装置20は、複数の聞き手装置30の各々から言語情報及び装置IDをそれぞれ取得する(S81)。発話者装置20は、取得された言語情報と装置IDとを対応付けて対応記憶部22に格納する(S82)。
発話者装置20は、発話者の発話音声データ及び言語情報を取得する(S83)。
発話者装置20は、(S83)で取得された言語情報に対応する言語データ及び(S83)で取得された発話音声データ、並びに、(S82)で対応記憶部22に格納された言語情報に対応する言語指定データをサーバ装置10に送信する(S84)。対応記憶部22に複数の異なる言語を示す言語情報が格納されている場合には、当該複数の言語を示す言語指定データがサーバ装置10へ送信される。
サーバ装置10は、(S84)で送信されたデータを受信し、受信された発話音声データに対して、発話者の言語データが示す言語に対応する音声認識処理を施し、発話テキストデータを生成する。サーバ装置10は、その発話テキストデータに対して、発話者の言語から、受信された言語指定データが示す言語への翻訳処理を実行する。結果、サーバ装置10は、発話音声データが当該言語指定データが示す言語へ翻訳された翻訳テキストデータを生成する。
発話者装置20は、(S84)で送信したデータに対する応答データをサーバ装置10から受信する(S85)。応答データは、正常応答か否かを示す値を含む。正常応答を示す応答データは、更に、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペア、及び、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータを含む。言語指定データが複数の言語を示す場合、発話者装置20は、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で応答データとして受信する。また、発話者装置20は、音声認識結果のテキストデータ及び関連識別データを応答データとして受信する場合もあり得る。
発話者装置20は、その応答データが正常応答を示すか否かを判定する(S86)。発話者装置20は、その応答データが正常応答を示さない場合(S86;NO)、その応答データに設定されている情報に基づいて、エラー情報を出力する(S87)。出力されるエラー情報は、図6に例示されるように、応答データ内に設定されていてもよい。また、エラー情報の出力形態は任意である。発話者装置20は、表示ユニット13のモニタにエラー情報を出力することができる。発話者装置20は、そのエラー情報を読み上げる音声又はそのエラー情報に対応する音をスピーカユニット17に送出させてもよい。また、発話者装置20は、エラー情報を各聞き手装置30にそれぞれ送信してもよい。
発話者装置20は、その応答データが正常応答を示す場合(S86;YES)、応答データに含まれる翻訳テキストデータの宛先を特定する(S88)。具体的には、発話者装置20は、翻訳テキストデータに対応する言語情報に対応付けられた装置IDを対応記憶部22から抽出し、抽出された装置IDをその翻訳テキストデータの宛先として用いる。このとき、1つの翻訳テキストデータに対して複数の宛先(装置ID)が特定される場合もあり得る。また、応答データに異なる複数の言語に関する複数の翻訳テキストデータが含まれる場合には、発話者装置20は、複数の翻訳テキストデータの各々に関し、宛先(装置ID)を特定する。
発話者装置20は、(S88)で特定された宛先に基づいて、各聞き手装置30に、所望の翻訳テキストデータをそれぞれ送信する(S89)。発話者装置20は、1つの翻訳テキストデータの宛先として複数の端末IDが抽出された場合、その翻訳テキストデータを、抽出された端末IDの数分コピーし、コピーされた複数の翻訳テキストデータをそれら端末IDが示す複数の聞き手装置30に送信する。また、応答データに言語の異なる複数の翻訳テキストデータが含まれている場合、発話者装置20は、複数の聞き手装置30が、受信された複数の翻訳テキストデータの中の、各聞き手装置30の言語情報に対応する翻訳テキストデータをそれぞれ受信できるように、当該複数の翻訳テキストデータを送信する。
発話者装置20は、翻訳テキストデータと共に、音声認識結果のテキストデータも聞き手装置30に送信してもよい。また、発話者装置20は、応答データが正常応答を示し(S86;YES)、かつ、その応答データに翻訳テキストデータが含まれない場合には、その応答データを保持し、次の応答データを待つ(図示せず)。発話者装置20は、翻訳テキストデータを含む応答データを受信した場合に、関連識別データに基づいて、音声認識結果のテキストデータの連結、及び、その連結されたデータと翻訳テキストデータとの関連付けを行う。この場合、発話者装置20は、翻訳テキストデータが含まれない応答データに含まれる音声認識結果のテキストデータのみを聞き手装置30に送信してもよい。
聞き手装置30は、発話者装置20に送信した言語情報が示す言語に、発話音声データが翻訳された翻訳テキストデータを取得し、その翻訳テキストデータをモニタに表示する。また、聞き手装置30は、その翻訳テキストデータを読み上げる音声を出力することもできる。更に、聞き手装置30は、翻訳テキストデータと共に受信される、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータも同様に出力してもよい。また、聞き手装置30は、翻訳テキストデータなく、音声認識結果のテキストデータを受信した場合には、そのテキストデータのみを出力してもよい。
図8では、複数の工程(処理)が順番に表されているが、第一実施形態で実行される工程及びその工程の実行順序は、図8の例のみに限定されない。例えば、(S83)で取得される発話音声データと発話者の言語情報とは、異なるタイミングで取得されてもよい。発話者の言語情報は、(S81)よりも前に取得され得る。また、図8では、説明の便宜のため簡易化されているが、発話音声データが随時取得される場合には、(S83)以降が繰り返される。更に、当該翻訳データ提供方法は、正常応答を示す応答データに含まれる音声認識結果のテキストデータ及び翻訳テキストデータを表示ユニット13のモニタに表示させる工程を含むこともできる。
〔第一実施形態における作用及び効果〕
上述のように、第一実施形態では、翻訳データの提供を望む聞き手装置30から言語情報及び装置IDが発話者装置20により取得され、言語情報及び装置IDが対応付けられて対応記憶部22に格納される。そして、翻訳の元データとなる発話音声データが、発話者装置20により取得され、対応記憶部22に格納される対応情報に対応する言語指定データ及び発話音声データが発話者装置20からサーバ装置10に送られる。サーバ装置10では、音声認識により発話音声データが発話テキストデータに変換され、この発話テキストデータが言語指定データにより示される言語に翻訳される。この翻訳テキストデータは、サーバ装置10から発話者装置20に送られ、その翻訳テキストデータに対応する言語情報と対応付けられて対応記憶部22に格納される装置IDを宛先に指定して、発話者装置20から聞き手装置30に送信される。
このように、第一実施形態によれば、聞き手装置30は、発話音声データを取得する発話者装置20を介して、サーバ装置10で生成された翻訳テキストデータを取得することができる。即ち、聞き手装置30は、発話者装置20に言語情報及び装置IDを提供することで、サーバ装置10にアクセスすることなく、発話者装置20から翻訳テキストデータを取得することができる。逆に、サーバ装置10は、発話者装置20のみを認識すればよく、送信する翻訳テキストデータをどの聞き手装置30が受けるのかを認識する必要はない。従って、第一実施形態によれば、聞き手装置30のユーザ(聞き手)の個人情報をサーバ装置10に登録することなく、当該ユーザに、所望の言語への翻訳サービスを提供することができる。
聞き手装置30のユーザの個人情報がサーバ装置10に登録されるのを出来る限り避ける理由は、サーバ装置10が翻訳の元となる発話に無関係な第三者的な(公共的な)立場にあるからである。第一実施形態では、発話者装置20に、聞き手装置30の言語情報及び端末IDが格納される。しかしながら、発話者装置20及び聞き手装置30の各ユーザは、発話者と聞き手の関係、又は、それに近似する関係(例えば、発話音声データを取得する者とその発話の聞き手の関係)にあるため、発話者装置20は、翻訳の元となる発話に関係する当事者的な立場にある。よって、発話者装置20にそれら情報が格納されたとしても、個人情報の漏えいには結び付きにくい。
また、第一実施形態では、発話音声データに加えて、発話者の言語情報に対応する言語データが発話者装置20からサーバ装置10へ送信される。これにより、サーバ装置10は、その言語データ用に、音声認識処理及び翻訳処理を切り替えることができるため、複数の翻訳形態をサポートすることができる。
更に、第一実施形態では、聞き手装置30から取得された言語情報が複数の異なる言語を示す場合に、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアが、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付けられた状態で発話者装置20により受信される。これにより、複数の聞き手装置30が複数の異なる言語を要求する場合でも、各聞き手装置30は、略同タイミングで、所望の言語に翻訳された翻訳テキストデータをそれぞれ取得することができる。
また、第一実施形態では、サーバ装置10から発話者装置20には、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペアが、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータと関連付け可能な状態で提供される。これにより、音声認識結果のテキストデータを発話者装置20のモニタに表示させるようにすれば、発話者装置20のユーザである発話者又はその発話を聴くことができる者は、そのテキストデータを見ることで、翻訳テキストデータが正確か否かを判断することができる。また、音声認識結果のテキストデータがサーバ装置10において翻訳処理をするのに十分な文長を持たない場合には、翻訳テキストデータなしで、音声認識結果のテキストデータがサーバ装置10から発話者装置20に提供されてもよい。これにより、発話者装置20は、サーバ装置10での翻訳状況を把握することができる。
[第二実施形態]
以下、第二実施形態における発話者装置及び翻訳データ提供方法について複数の図面を用いて説明する。第二実施形態におけるシステム構成は第一実施形態と同様である。また、第二実施形態におけるサーバ装置10及び発話者装置20の処理構成についても第一実施形態と同様である。
第二実施形態では、発話者装置20は、サーバ装置10から、翻訳テキストデータ等に加えて、音声認識の信頼度情報を更に取得する。以下、第二実施形態について、第一実施形態と異なる内容を中心に説明し、第一実施形態と同様の内容については適宜省略する。
《サーバ装置》
音声認識部31は、発話音声データに対して音声認識処理を行うことで発話テキストデータを生成し、更に、その音声認識結果の信頼度を算出する。例えば、音声認識部31は、音響モデル及び言語モデルを用いて導出した認識結果候補の各単語に対して尤度を計算し、その候補の中から最終的に選択される単語の尤度と選択されなかった単語の尤度との差を用いて、当該信頼度を算出することができる。この場合、尤度の差が大きい程、高い信頼度が付与され、尤度の差が小さい程、低い信頼度が付与される。このような音声認識結果の信頼度の算出手法には周知の手法が利用されればよい。
翻訳部32は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で発話者装置20に送信する。翻訳部32は、音声認識部31により得られた発話テキストデータに対して翻訳処理をしない場合には、音声認識結果のテキストデータ(発話テキストデータ)、このテキストデータの翻訳結果となる翻訳テキストデータと関連付けるための関連識別データ、及び、その音声認識結果の信頼度情報を、応答データとして発話者装置20に送信してもよい。
《発話者装置》
受信部25は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態でサーバ装置10から受信する。関連付け可能な状態で受信されるのであれば、翻訳テキストデータ、言語データ、音声認識結果のテキストデータ及び信頼度情報の受信の仕方は限定されない。音声認識結果のテキストデータ及び信頼度情報と、翻訳テキストデータ及び言語データとが別の応答データとして受信される場合には、第一実施形態で述べたように、各応答データには関連識別データが設定されればよい。
提供部26は、受信部25で受信された信頼度情報に基づいて、同様に受信された翻訳テキストデータをそのまま聞き手装置30に送信するか否かを判定する。提供部26は、その信頼度情報が所定値以上の信頼度を示す場合には、第一実施形態と同様に、翻訳テキストデータを聞き手装置30に送信する。一方、提供部26は、その信頼度情報が所定値よりも低い信頼度を示す場合には、その翻訳テキストデータの確度も低いため、信頼度が低いことを出力する。提供部26は、信頼度が低いことを表示ユニット13のモニタに表示させてもよいし、音でスピーカユニット17に出力させてもよい。信頼度と比較される所定値は、信頼度の閾値であり、予め提供部26により保持される。
また、提供部26は、その信頼度情報が所定値よりも低い場合、その翻訳テキストデータを聞き手装置30に送らないようにしてもよいし、送るか否かをユーザに決めさせてもよい。提供部26は、信頼度が低いことと共に、聞き手装置30に送信するか否かを選択するための操作ボタンをモニタに表示させ、その操作ボタンに対するユーザ操作に応じて、その翻訳テキストデータを送信すること又は送信しないことを決定してもよい。提供部26は、翻訳テキストデータと共に、信頼度情報を聞き手装置30に送信してもよい。
〔動作例/購買支援方法〕
以下、第二実施形態における翻訳データ提供方法について図9を用いて説明する。図9は、第二実施形態における発話者装置20の動作例を示すフローチャートである。第二実施形態における翻訳データ提供方法の実行主体は、第一実施形態と同様である。各工程は、発話者装置20が有する上述の各処理部の処理内容と同様であるため、各工程の詳細は、適宜省略される。また、図9において、図8と同様の内容の工程については、図8と同じ符号が付されている。
発話者装置20は、第一実施形態と同様に、(S81)から(S84)を実行する。
サーバ装置10は、(S84)で送信されたデータを受信し、第一実施形態と同様に、音声認識処理及び翻訳処理を実行し、結果として、発話音声データが言語指定データが示す言語へ翻訳された翻訳テキストデータを生成する。加えて、第二実施形態では、サーバ装置10は、音声認識結果の信頼度を算出する。サーバ装置10は、翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で応答データとして発話者装置20へ送信する。サーバ装置10は、翻訳テキストデータなく、音声認識結果のテキストデータ、関連識別データ及びその音声認識結果の信頼度情報を応答データとして発話者装置20へ送信してもよい。
発話者装置20は、その応答データをサーバ装置10から受信する(S91)。応答データは、正常応答か否かを示す値、翻訳テキストデータとその翻訳テキストデータに対応する言語データとのペア、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ、及び、音声認識結果の信頼度情報を含む。言語指定データが複数の言語を示す場合、発話者装置20は、当該複数の言語に対応する、翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数のペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータ及び信頼度情報と関連付けられた状態で応答データとして受信する。また、発話者装置20は、音声認識結果のテキストデータ、関連識別データ及び音声認識結果の信頼度情報を応答データとして受信する場合もあり得る。
発話者装置20は、その応答データが正常応答を示すか否かを判定する(S92)。発話者装置20は、その応答データが正常応答を示さない場合(S92;NO)、第一実施形態と同様に、エラー情報を出力する(S87)。
発話者装置20は、その応答データが正常応答を示す場合(S92;YES)、更に、応答データに含まれる信頼度情報が所定値より低い信頼度を示すか否かを判定する(S93)。発話者装置20は、信頼度情報が所定値以上の信頼度を示す場合(S93;NO)、第一実施形態と同様に、応答データに含まれる翻訳テキストデータの宛先を特定し(S88)、各聞き手装置30に、所望の翻訳テキストデータをそれぞれ送信する(S89)。第二実施形態では、発話者装置20は、翻訳テキストデータと共に、信頼度情報を聞き手装置30に送信してもよい。
聞き手装置30は、発話者装置20から翻訳テキストデータを受信し、第一実施形態と同様に、その翻訳テキストデータを出力するモニタに表示する。第二実施形態では、聞き手装置30は、翻訳テキストデータと共に受信される信頼度情報を出力することもできる。
一方、発話者装置20は、信頼度情報が所定値より低い信頼度を示す場合(S93;YES)、信頼度が低いことを提示する(S94)。例えば、発話者装置20は、信頼度が低いことを表示ユニット13のモニタに表示させてもよいし、音でスピーカユニット17に出力させてもよい。
更に、発話者装置20は、信頼度が低いことを提示すると共に、その翻訳テキストデータを聞き手装置30に送信するか否かをユーザに選択させる操作画面をモニタに表示させる。発話者装置20は、操作画像を介したユーザ操作により、ユーザが送信を選択したか否かを判定する(S95)。発話者装置20は、ユーザが送信を選択したと判定すると(S95;YES)、上述のように(S88)を実行する。発話者装置20は、ユーザが送信を選択しなかったと判定した場合には(S95;NO)、エラー情報を出力する(S87)。
図9では、複数の工程(処理)が順番に表されているが、第二実施形態で実行される工程及びその工程の実行順序は、図9の例のみに限定されない。例えば、図9に示される(S95)を省き、信頼度が所定値よりも低い場合には(S93;YES)、発話者装置20は、無条件に、その翻訳テキストデータを聞き手装置30に送らず、エラー情報を出力してもよい(S87)。また、発話者装置20は、信頼度と所定値との比較結果に依存せず、応答データに含まれる信頼度情報を常に提示するようにしてもよい。
〔第二実施形態における作用及び効果〕
上述のように、第二実施形態では、音声認識結果の信頼度情報が、翻訳テキストデータ、言語データ、音声認識結果のテキストデータに関連付け可能な状態で、サーバ装置10から発話者装置20へ提供される。これにより、発話者装置20は、この信頼度情報に基づいて、翻訳テキストデータをそのまま聞き手装置30に送信するか否かを判定することができる。音声認識結果の信頼度が低い場合、音声認識結果のテキストデータの確度が低く、結果として、そのテキストデータから変換される翻訳テキストデータの確度も低くなる。従って、その信頼度情報を用いることで、誤った翻訳内容が聞き手装置30に提供されるのを防ぐことができる。また、発話者装置20がその信頼度情報を提示すれば、発話者に音声認識の信頼度が低いことを認識させることができ、発話者に言い直しの機会を与えることができる。これにより、発話内容を他の言語で適切に聞き手に伝えることができる。更に、信頼度が低い場合に、発話者装置20が翻訳テキストデータの聞き手装置30への送信をユーザに選択させることで、信頼度が低くても正しく翻訳された翻訳テキストデータについては、聞き手装置30に提供することができる。
[第一実施形態及び第二実施形態の補足]
図1には、1台のサーバ装置10が例示されているが、翻訳システムは、複数のサーバ装置10を含むこともできる。例えば、音声認識部31を有するサーバ装置10と翻訳部32を有するサーバ装置10とが異なる装置であってもよい。この場合、発話者装置20が発話音声データ等を送信するサーバ装置10と、発話者装置20が翻訳テキストデータ等を受信するサーバ装置10とが異なることになる。また、翻訳言語毎に異なるサーバ装置10が設けられてもよい。
また、聞き手装置30は、他の聞き手装置30を介して、発話者装置20と通信を行ってもよい。例えば、発話者装置20と複数の聞き手装置30とは無線マルチホップネットワークを形成してもよい。この例によれば、発話者装置20からの電波が届かない位置に存在する聞き手装置30も発話者装置20から翻訳データの提供を受けることができる。無線マルチホップネットワークにおけるデータの伝搬手法には、周知の手法が利用されればよい。
[第三実施形態]
以下、第三実施形態における情報処理装置及び翻訳データ提供方法について図10及び図11を用いて説明する。
図10は、第三実施形態における情報処理装置の処理構成例を概念的に示す図である。図10に示されるように、情報処理装置50は、情報取得部51、送信部52、受信部53、提供部54等を有する。情報取得部51は、端末装置から言語情報を取得する。送信部52は、情報取得部51により取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する。受信部53は、発話データが言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する。提供部54は、受信された翻訳データを上記端末装置に送信する。
情報処理装置50の一例が、上述の発話者装置20である。端末装置の一例が、上述の聞き手装置30であり、サーバ装置の一例が、上述のサーバ装置10である。但し、受信部53が翻訳データを受信するサーバ装置と、送信部52が音声データを送信するサーバ装置とが異なってもよい。
送信部52の具体的処理内容の一例が、上述の送信部24である。送信部52により送信される発話データは、音声データでなくてもよい。例えば、送信部52は、発話テキストデータを発話データとしてサーバ装置に送信してもよい。発話テキストデータは、情報処理装置50の入力装置をユーザが操作することで入力されてもよい。また、情報処理装置50が上述の音声認識部31を有し、当該発話テキストデータは、その音声認識部31により発話音声データから変換されてもよい。この場合、情報処理装置50は、音声認識結果のテキストデータを生成し、音声認識の信頼度を算出することができる。発話データの送信先であるサーバ装置は、音声認識部31を持たなくてもよい。
送信部52は、発話者の言語情報に対応する言語データを送信しなくてもよい。これは、発話者の言語が固定的に1つに決められている場合や、サーバ装置側で発話データから言語が自動で認識可能である場合等に該当する。
受信部53の具体的処理内容の一例が、上述の受信部25で示される。受信部53により受信される翻訳データは、テキストデータではなく、音声データであってもよい。この場合、サーバ装置は、翻訳音声データを生成し、送信する。また、受信部53は、送信部52により送信される言語指定データが1つの言語を示す場合等には、翻訳データに対応する言語データを受信しなくてもよい。更に、受信部53は、音声認識結果のテキストデータも受信しなくてもよい。翻訳データのみが端末装置に提供されればよく、情報処理装置50において音声認識結果のテキストデータを必ずしも提示しなくてもよいからである。
提供部54の具体的処理内容の一例が、上述の提供部26で示される。提供部54により送信される翻訳データは、テキストデータではなく、音声データであってもよい。受信部53がサーバ装置から翻訳テキストデータを取得する場合、提供部54は、その翻訳テキストデータを読み上げる翻訳音声データを生成し、その翻訳音声データを端末装置に送信してもよい。
また、提供部54は、端末IDを指定したユニキャスト通信ではなく、翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信することもできる。この場合、端末装置は、受信された翻訳データの中から、所望の言語データと関連付けられた翻訳データを抽出すればよい。
情報取得部51の具体的処理内容の一例が、上述の情報取得部21で示される。但し、情報取得部51は、提供部54が無線ブロードキャストで翻訳データを送信する場合には、装置IDを取得しなくてもよい。
図10に示されるように、情報処理装置50は、対応記憶部22を有していなくてもよい。この場合、情報取得部51は、他のコンピュータが有する対応記憶部22に、各言語情報及び各端末IDを対応付けて格納すればよい。また、情報取得部51は、装置IDを取得しない場合には、言語情報のみを保持すればよい。
図10に示される情報処理装置50は、例えば、図2に示される上述の発話者装置20と同様のハードウェア構成を有し、その発話者装置20と同様にプログラムが処理されることで、上述の各処理部が実現される。情報処理装置50のハードウェア構成は制限されない。
図11は、第三実施形態における情報処理装置50の動作例を示すフローチャートである。図11に示されるように、第三実施形態における翻訳データ提供方法は、情報処理装置50のような少なくとも1つのコンピュータにより実行される。例えば、図示される各工程は、情報処理装置50が有する各処理部により実行される。
本実施形態における翻訳データ提供方法は、(S111)〜(S116)を含む。(S111)では、コンピュータが、端末装置から言語情報を取得する。(S112)では、コンピュータが、(S111)で取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する。(S113)では、コンピュータが、応答データをサーバ装置から受信する。応答データが正常応答を示す場合(S114;YES)、応答データは、発話データが言語指定データが示す言語に翻訳された翻訳データを含む。応答データが正常応答を示さない場合(S114;NO)、コンピュータは、エラー情報を出力する(S116)。(S115)では、コンピュータは、(S113)で受信された翻訳データを端末装置に送信する。
(S111)の一例が、図8及び図9の(S81)であり、(S112)の一例が、図8及び図9の(S84)であり、(S113)の一例が、図8の(S85)及び図9の(S91)である。(S115)の一例が、図8及び図9の(S88)及び(S89)であり、(S116)の一例が、図8及び図9の(S87)である。
また、第三実施形態は、このような翻訳データ提供方法を少なくとも1つのコンピュータに実行させるプログラムであってもよいし、このようなプログラムを記録した当該少なくとも1つのコンピュータが読み取り可能な記録媒体であってもよい。
第三実施形態によれば、上述の第一実施形態及び第二実施形態と同様の作用効果を得ることができる。
以下に実施例を挙げ、上述の各実施形態を更に詳細に説明する。本発明は以下の実施例から何ら限定を受けない。
翻訳データの提供を受けるにあたり、聞き手は、自身の聞き手装置30を操作して、自身の聞き手装置30を発話者装置20とペアリングをさせる。聞き手装置30と発話者装置20との間のペアリングは、両端末間の無線通信の形態(Bluetooth(登録商標)、ZigBee、NFC、Wi−Fi等)に対応する認証等を経て、実現される。このペアリングの過程で、発話者装置20(情報取得部21)は、各聞き手装置30から端末IDをそれぞれ取得してもよい。更に、発話者装置20は、ペアリング時に、各聞き手装置30との間に無線チャネルをそれぞれ確立すると共に、各聞き手装置30からユーザプロフィール情報をそれぞれ受信する(情報取得部21及び情報取得部51)。このユーザプロフィール情報に、聞き手の言語情報が含まれる。これにより、聞き手装置30のユーザは、発話者装置20とペアリングを行う指示操作をするだけで、翻訳データの提供を受けることができる。
また、発話者装置20は、人体の表面電界を利用するヒューマンエリアネットワーク技術を用いて、聞き手の言語情報を聞き手装置30から取得することもできる。この場合、情報取得部21及び情報取得部51は、聞き手装置30のような端末装置との間での人体通信の成功に伴い、その端末装置から言語情報を取得する。この場合、発話者装置20は、ヒューマンエリアネットワーク技術を用いた人体通信を行う通信ユニット15を持ち、通信ユニット15を用いた人体通信により、言語情報を取得する。このようにすれば、聞き手装置30のユーザは、聞き手装置30を保持しつつ、発話者装置20の保持者と、握手のような体を触れ合わせる行動をするだけで、簡単に、翻訳データの提供を受けることができる。
上述の各実施形態は、発話者と聞き手装置30のユーザである聞き手との会話における発話を翻訳対象とすることができる。更に、各実施形態は、講演会やセミナー等での講演者の発話を翻訳対象とすることもできる。この場合、各々異なる言語で聴講することを希望する複数の聞き手が存在する可能性がある。発話者装置20にペアリングできる聞き手装置30の数に制限がある場合でも、無線マルチホップネットワークを用いることで、複数の聞き手装置30が発話者装置20と通信をすることができる。また、無線マルチホップネットワークを用いなくとも、複数の発話者装置20を用いて、全ての聞き手装置30がいずれか1つの発話者装置20とペアリングできるようにすることもできる。上述の各実施形態によれば、各聞き手は、所望の言語の翻訳データを略同時にそれぞれ聞くことができる。
なお、上述の説明で用いた複数のフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態及び各変形例は、内容が相反しない範囲で組み合わせることができる。
上記の内容の一部又は全部は、以下のようにも特定され得る。但し、上述の内容が以下の記載に限定されるものではない。
1. 端末装置から言語情報を取得する情報取得手段と、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、
前記受信された翻訳データを前記端末装置に送信する提供手段と、
を備える情報処理装置。
2. 前記情報取得手段は、複数の端末装置から複数の異なる言語情報を取得し、
前記送信手段は、前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データをサーバ装置に送信し、
前記受信手段は、サーバ装置から前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
前記提供手段は、前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
1.に記載の情報処理装置。
3. 前記情報取得手段は、前記端末装置から、前記言語情報及び端末識別情報を取得し、各端末識別情報と各言語情報とを対応付けて記憶し、
前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
1.又は2.に記載の情報処理装置。
4. 前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
1.から3.のいずれか1つに記載の情報処理装置。
5. 前記発話者の発話音声データ及び言語情報を取得する発話データ取得手段、
を更に備え、
前記送信手段は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データをサーバ装置に送信し、
前記受信手段は、サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
1.から4.のいずれか1つに記載の情報処理装置。
6. 前記受信手段は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
5.に記載の情報処理装置。
7. 前記受信手段は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
5.又は6.に記載の情報処理装置。
8. 前記情報取得手段は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
1.から7.のいずれか1つに記載の情報処理装置。
9. 少なくとも1つのコンピュータに実行される翻訳データ提供方法において、
端末装置から言語情報を取得し、
前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、
前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、
前記受信された翻訳データを前記端末装置に送信する、
ことを含む翻訳データ提供方法。
10. 複数の端末装置から複数の異なる言語情報を取得し、
前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データを送信し、
前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
ことを更に含む9.に記載の翻訳データ提供方法。
11. 前記端末装置から端末識別情報を取得し、
各端末識別情報と各言語情報とを対応付けて記憶する、
ことを更に含み、
前記端末装置への送信は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
9.又は10.に記載の翻訳データ提供方法。
12. 前記端末装置への送信は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
9.から11.のいずれか1つに記載の翻訳データ提供方法。
13. 前記発話者の発話音声データ及び言語情報を取得する、
ことを更に含み、
前記サーバ装置への送信は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データを送信し、
前記サーバ装置からの受信は、前記サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
9.から12.のいずれか1つに記載の翻訳データ提供方法。
14. 前記サーバ装置からの受信は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
13.に記載の翻訳データ提供方法。
15. 前記サーバ装置からの受信は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
13.又は14.に記載の翻訳データ提供方法。
16. 前記言語情報の取得は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
9.から15.のいずれか1つに記載の翻訳データ提供方法。
17. 9.から16.のいずれか1つに記載の翻訳データ提供方法を少なくとも1つのコンピュータに実行させるプログラム。
18. 17.に記載のプログラムをコンピュータが読み取り可能に記録する記録媒体。
この出願は、2014年7月8日に出願された日本出願特願2014−140134号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (10)

  1. 端末装置から言語情報を取得する情報取得手段と、
    前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信する送信手段と、
    前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信する受信手段と、
    前記受信された翻訳データを前記端末装置に送信する提供手段と、
    を備える情報処理装置。
  2. 前記情報取得手段は、複数の端末装置から複数の異なる言語情報を取得し、
    前記送信手段は、前記取得された複数の言語情報に対応する前記言語指定データ及び前記発話データをサーバ装置に送信し、
    前記受信手段は、サーバ装置から前記言語指定データが示す複数の言語に翻訳された複数の翻訳データを各翻訳データに対応する言語データとそれぞれ関連付けられた状態で受信し、
    前記提供手段は、前記複数の端末装置が、前記受信された複数の翻訳データの中の、各端末装置の言語情報に対応する翻訳データをそれぞれ受信できるように、前記受信された複数の翻訳データを送信する、
    請求項1に記載の情報処理装置。
  3. 前記情報取得手段は、前記端末装置から、前記言語情報及び端末識別情報を取得し、各端末識別情報と各言語情報とを対応付けて記憶し、
    前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語情報と対応付けられて記憶される端末識別情報を宛先に指定して送信する、
    請求項1又は2に記載の情報処理装置。
  4. 前記提供手段は、前記受信された翻訳データを、その翻訳データに対応する言語データと関連付けて、無線ブロードキャスト送信する、
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記発話者の発話音声データ及び言語情報を取得する発話データ取得手段、
    を更に備え、
    前記送信手段は、前記発話者の言語情報に対応する言語データ、前記発話データとしての前記発話音声データ、及び、前記言語指定データをサーバ装置に送信し、
    前記受信手段は、サーバ装置から翻訳テキストデータを前記翻訳データとして受信する、
    請求項1から4のいずれか1項に記載の情報処理装置。
  6. 前記受信手段は、前記言語指定データが示す複数の言語に対応する、前記翻訳テキストデータとその翻訳テキストデータに対応する言語データとの複数ペアを、その翻訳テキストデータの元となった発話音声データの音声認識結果のテキストデータと関連付け可能な状態で受信する、
    請求項5に記載の情報処理装置。
  7. 前記受信手段は、前記翻訳テキストデータ、その翻訳テキストデータに対応する言語データ、その翻訳テキストデータの元となる発話音声データの音声認識結果のテキストデータ、及び、その音声認識結果の信頼度情報を関連付け可能な状態で受信する、
    請求項5又は6に記載の情報処理装置。
  8. 前記情報取得手段は、前記端末装置との間での人体通信の成功に伴い、前記端末装置から前記言語情報を取得する、
    請求項1から7のいずれか1項に記載の情報処理装置。
  9. 少なくとも1つのコンピュータに実行される翻訳データ提供方法において、
    端末装置から言語情報を取得し、
    前記取得された言語情報に対応する言語指定データ及び発話者の発話データをサーバ装置に送信し、
    前記発話データが前記言語指定データが示す言語に翻訳された翻訳データをサーバ装置から受信し、
    前記受信された翻訳データを前記端末装置に送信する、
    ことを含む翻訳データ提供方法。
  10. 請求項9に記載の翻訳データ提供方法を少なくとも1つのコンピュータに実行させるプログラム。
JP2016532491A 2014-07-08 2015-05-27 情報処理装置及び翻訳データ提供方法 Pending JPWO2016006354A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014140134 2014-07-08
JP2014140134 2014-07-08
PCT/JP2015/065266 WO2016006354A1 (ja) 2014-07-08 2015-05-27 情報処理装置及び翻訳データ提供方法

Publications (1)

Publication Number Publication Date
JPWO2016006354A1 true JPWO2016006354A1 (ja) 2017-06-01

Family

ID=55063996

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016532491A Pending JPWO2016006354A1 (ja) 2014-07-08 2015-05-27 情報処理装置及び翻訳データ提供方法

Country Status (2)

Country Link
JP (1) JPWO2016006354A1 (ja)
WO (1) WO2016006354A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6243071B1 (ja) * 2017-04-03 2017-12-06 旋造 田代 通信内容翻訳処理方法、通信内容翻訳処理プログラム、及び、記録媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334353A (ja) * 1992-06-02 1993-12-17 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声翻訳通信方式
JP2006004296A (ja) * 2004-06-18 2006-01-05 Cypress Soft Kk 多言語翻訳システム、中央処理装置、コンピュータプログラム及び多言語翻訳方法
JP2013171478A (ja) * 2012-02-22 2013-09-02 Zenrin Datacom Co Ltd 検索サーバ装置、情報検索方法および情報検索プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05334353A (ja) * 1992-06-02 1993-12-17 A T R Jido Honyaku Denwa Kenkyusho:Kk 音声翻訳通信方式
JP2006004296A (ja) * 2004-06-18 2006-01-05 Cypress Soft Kk 多言語翻訳システム、中央処理装置、コンピュータプログラム及び多言語翻訳方法
JP2013171478A (ja) * 2012-02-22 2013-09-02 Zenrin Datacom Co Ltd 検索サーバ装置、情報検索方法および情報検索プログラム

Also Published As

Publication number Publication date
WO2016006354A1 (ja) 2016-01-14

Similar Documents

Publication Publication Date Title
JP6475386B2 (ja) 機器の制御方法、機器、及びプログラム
CN110730952B (zh) 处理网络上的音频通信的方法和系统
US10216729B2 (en) Terminal device and hands-free device for hands-free automatic interpretation service, and hands-free automatic interpretation service method
KR102489914B1 (ko) 전자 장치 및 이의 제어 방법
EP2770445A2 (en) Method and system for supporting a translation-based communication service and terminal supporting the service
WO2015158130A1 (en) Method and system of operating a social networking application via an external device
US20180309703A1 (en) Communication system and storage medium
US20160366528A1 (en) Communication system, audio server, and method for operating a communication system
US20180286388A1 (en) Conference support system, conference support method, program for conference support device, and program for terminal
US20180288110A1 (en) Conference support system, conference support method, program for conference support device, and program for terminal
JP7437356B2 (ja) 電子機器の通訳機能提供方法およびイヤセット機器
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
WO2015143114A1 (en) Sign language translation apparatus with smart glasses as display featuring a camera and optionally a microphone
KR20200013774A (ko) 보이스 가능 디바이스를 디스플레이 디바이스와 페어링
JP2020160431A (ja) 音声認識装置、音声認識方法及びそのプログラム
JP6570893B2 (ja) 翻訳支援システムおよび情報処理装置
US20200279570A1 (en) Speaker determination apparatus, speaker determination method, and control program for speaker determination apparatus
WO2016006354A1 (ja) 情報処理装置及び翻訳データ提供方法
TWM515143U (zh) 語音翻譯系統及翻譯處理裝置
JP6669374B1 (ja) 設定装置、設定方法及び設定プログラム
JP7304170B2 (ja) インターホンシステム
KR20130116128A (ko) 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법
US20220199096A1 (en) Information processing apparatus and information processing method
JP6523974B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法、および、プログラム
JP2015036826A (ja) コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180424