JP2016171565A - ウェアラブル装置及び翻訳システム - Google Patents

ウェアラブル装置及び翻訳システム Download PDF

Info

Publication number
JP2016171565A
JP2016171565A JP2016018575A JP2016018575A JP2016171565A JP 2016171565 A JP2016171565 A JP 2016171565A JP 2016018575 A JP2016018575 A JP 2016018575A JP 2016018575 A JP2016018575 A JP 2016018575A JP 2016171565 A JP2016171565 A JP 2016171565A
Authority
JP
Japan
Prior art keywords
language
user
speaker
translation
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016018575A
Other languages
English (en)
Other versions
JP6603875B2 (ja
Inventor
石川 智一
Tomokazu Ishikawa
智一 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to US15/067,036 priority Critical patent/US20160267075A1/en
Publication of JP2016171565A publication Critical patent/JP2016171565A/ja
Application granted granted Critical
Publication of JP6603875B2 publication Critical patent/JP6603875B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】異言語の話者間の会話を翻訳する際に会話の自然さを損ないにくいウェアラブル翻訳装置を提供する。
【解決手段】ウェアラブル翻訳装置1は、ユーザの身体に装着可能であるウェアラブル翻訳装置1であって、ユーザから第1言語の音声を取得して第1言語の音声信号を生成するマイクロホン装置13と、第1言語の音声信号から変換された第2言語の音声信号を取得する制御回路11とを備える。また、第2言語の音声信号に対して所定の処理を実行する音声処理回路15と、処理された第2言語の音声信号を音声として出力するスピーカ装置16とを備える。また、音声処理回路15は、スピーカ装置16の上方にユーザの発声器が位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザの発声器の位置に向けて移動させる。
【選択図】図1

Description

本開示は、異言語の話者間の会話を自動的かつリアルタイムに翻訳するために、ユーザの身体に装着して使用されるウェアラブル装置及び翻訳システムに関する。
音声認識、機械翻訳、及び音声合成の技術の発達により、異言語の話者間の会話を自動的かつリアルタイムに翻訳する翻訳装置が知られている。このような翻訳装置のなかには、携帯型又はウェアラブル型のものもある。
例えば、特許文献1は、騒音下の野外でも自然に近い形で自動翻訳通話を実現する自動翻訳装置を開示している。
特開2007−272260号公報 特開2012−093705号公報 国際公開第2009/101778号 特開2009−296110号公報
翻訳装置の利便性を向上するためには、例えば、翻訳装置の使用時に翻訳装置の存在をなるべく話者及び聴取者に意識させず、翻訳装置が介在しても自然な会話であると話者及び聴取者が認識できるようにすることが求められる。
本開示は、異言語の話者間の会話を翻訳する際に会話の自然さを保つウェアラブル装置及び翻訳システムを提供する。
本開示の態様に係るウェアラブル翻訳装置は、ユーザの身体に装着可能であるウェアラブル翻訳装置であって、ユーザから第1言語の音声を取得して第1言語の音声信号を生成するマイクロホン装置と、第1言語の音声信号から変換された第2言語の音声信号を取得する制御回路とを備える。また、第2言語の音声信号に対して所定の処理を実行する音声処理回路と、処理された第2言語の音声信号を音声として出力するスピーカ装置とを備える。また、音声処理回路は、スピーカ装置の上方にユーザの発声器が位置することが検出された場合、同検出に応じて、スピーカ装置の音像をスピーカ装置の位置からユーザの発声器の位置に向けて移動させる。
本開示の態様に係るウェアラブル装置及び翻訳システムは、異言語の話者間の会話を翻訳する際に会話の自然さを保つのに有効である。
第1の実施の形態に係る翻訳システムの構成を示すブロック図 第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置をユーザが装着した状態の第1の例を示す図 第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置をユーザが装着した状態の第2の例を示す図 第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置をユーザが装着した状態の第3の例を示す図 第1の実施の形態に係る翻訳システムの動作を示すシーケンス図 第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置のスピーカ装置からユーザの発声器までの距離の測定を説明する図 第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置を使用したときの音像の上昇を説明する図 第2の実施の形態に係る翻訳システムのウェアラブル翻訳装置をユーザが装着した状態の例を示す図 第3の実施の形態に係る翻訳システムの構成を示すブロック図 第4の実施の形態に係る翻訳システムの構成を示すブロック図 第4の実施の形態に係る翻訳システムの動作を示すシーケンス図 第5の実施の形態に係る翻訳システムのウェアラブル翻訳装置の構成を示すブロック図
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細な説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、添付図面および以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらによって特許請求の範囲に記載の主題を限定することを意図するものではない。
(第1の実施の形態)
以下、図1〜図7を参照して、第1の実施の形態に係る翻訳システムについて説明する。
[1−1.構成]
図1は、第1の実施の形態に係る翻訳システムの構成を示すブロック図である。翻訳システム100は、ウェアラブル翻訳装置1、アクセスポイント装置2、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5を含む。
ウェアラブル翻訳装置1は、ユーザの身体の所定位置に装着可能である。ウェアラブル翻訳装置1は、例えばユーザの胸部又は腹部に装着される。ウェアラブル翻訳装置1は、アクセスポイント装置2と無線通信する。アクセスポイント装置2は、例えばインターネットを介して、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5と通信する。従って、ウェアラブル翻訳装置1は、アクセスポイント装置2を介して、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5と通信する。音声認識サーバ装置3は音声信号をテキストに変換する。機械翻訳サーバ装置4は第1言語のテキストを第2言語のテキストに変換する。音声合成サーバ装置5はテキストを音声信号に変換する。
音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5はそれぞれ、CPU等の制御回路やメモリを備えたコンピュータ装置である。音声認識サーバ装置3においては、所定のプログラムに従って制御回路が第1言語の音声信号を第1言語のテキストに変換する処理を実行する。機械翻訳サーバ装置4においては、所定のプログラムに従って制御回路が第1言語のテキストを第2言語のテキストに変換する処理を実行する。音声合成サーバ装置5は、所定のプログラムに従って制御回路が第2言語のテキストを第2言語の音声信号に変換する。なお、本実施の形態では、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5はそれぞれ別のコンピュータ装置により構成されているが、単一のサーバ装置により構成されていてもよいし、複数のサーバ装置により構成され、分散させた機能を実行するようにしてもよい。
本実施の形態では、ウェアラブル翻訳装置1のユーザが第1言語の話者であり、当該ユーザに対面する第2言語の話者と会話する場合について説明する。なお、以下の説明では、第2言語の話者は発話せず、聴取者としてのみ会話に参加するものとする。
ウェアラブル翻訳装置1は、制御回路11、距離測定装置12、マイクロホン装置13、無線通信回路14、音声処理回路15、及びスピーカ装置16を備える。距離測定装置12は、スピーカ装置16からユーザの発声器31a(図2〜図4)までの距離を測定する。ここで、発声器とは、ユーザの口だけでなく、ユーザの顎や鼻下部分等の口周辺部を含む部分であり、スピーカ装置16からの距離情報が入手可能な部分である。
マイクロホン装置13は、ユーザから第1言語の音声を取得して第1言語の音声信号を生成する。無線通信回路14は、アクセスポイント装置2を介して、ウェアラブル翻訳装置1の外部の音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5と通信する。制御回路11は、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5から、無線通信回路14を介して、第1言語の音声信号から翻訳された第2言語の音声信号を取得する。音声処理回路15は、第2言語の音声信号に対して所定の処理を実行する。スピーカ装置16は、処理された第2言語の音声信号を音声として出力する。
図2は、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1をユーザ31が装着した状態の第1の例を示す図である。ウェアラブル翻訳装置1は、例えばストラップ21でもってユーザ31の首にかけられることにより、ユーザ31の胸部又は腹部に位置するように装着される。マイクロホン装置13は、例えば、図2のようにユーザ31がウェアラブル翻訳装置1を装着したときに、地面に対して鉛直方向に並ぶ少なくとも2つのマイクロホンを含むマイクロホンアレーである。マイクロホン装置13は、マイクロホン装置13からユーザの発声器31a向かう方向にビームを有する。スピーカ装置16は、図2のように、ユーザ31がウェアラブル翻訳装置1を装着したときに、ユーザ31に対面する聴取者に向かって音声を出力するように設けられる。
図3は、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1をユーザ31が装着した状態の第2の例を示す図である。ウェアラブル翻訳装置1は、ユーザ31の衣服の胸部又は腹部にピンなどで装着されてもよい。ウェアラブル翻訳装置1は、例えば名札型に構成されてもよい。
図4は、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1をユーザ31が装着した状態の第3の例を示す図である。ウェアラブル翻訳装置1は、例えばベルト22でユーザ31の腕に装着されてもよい。
従来、翻訳装置の使用時に翻訳装置のスピーカが話者の発声器31a(例えば口)から離れていると、翻訳された音声が発声器31aとは異なる場所から聴こえてくることにより、聴取者が違和感を覚えるという問題がある。翻訳装置の利便性を向上するためには、翻訳装置の使用時に翻訳装置の存在をなるべく話者及び聴取者に意識させず、翻訳装置が介在しても自然な会話であると話者自身が認識できるようにすることが求められる。
このため、本実施の形態に係る翻訳システム100のウェアラブル翻訳装置1において、音声処理回路15は、以下に説明するように、スピーカ装置16の上方にユーザ31の発声器31aが位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させる。なお、音声処理回路15は、ユーザ31の発声器31aが検出されない場合、スピーカ装置16の音像を移動させない。
[1−2.動作]
図5は、第1の実施の形態に係る翻訳システム100の動作を示すシーケンス図である。ユーザ31からマイクロホン装置13を介して第1言語の音声信号が入力されたとき、制御回路11は、入力された音声信号を音声認識サーバ装置3に送る。音声認識サーバ装置3は、入力された音声信号に対して音声認識を行って、認識された第1言語のテキストを生成し、制御回路11に送る。制御回路11は、音声認識サーバ装置3から第1言語のテキストが送られると、第1言語から第2言語に翻訳することを指示する制御信号とともに、第1言語のテキストを機械翻訳サーバ装置4に送る。機械翻訳サーバ装置4は、第1言語のテキストの機械翻訳を行って、翻訳された第2言語のテキストを生成し、制御回路11に送る。制御回路11は、機械翻訳サーバ装置4から第2言語のテキストが送られると、第2言語のテキストを音声合成サーバ装置5に送る。音声合成サーバ装置5は、第2言語のテキストの音声合成を行って、合成された第2言語の音声信号を生成し、制御回路11に送る。制御回路11は、音声合成サーバ装置5から第2言語の音声信号が送られると、第2言語の音声信号を音声処理回路15に送る。音声処理回路15は、スピーカ装置16の上方にユーザ31の発声器31aが位置することが検出された場合は、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させるように、第2言語の音声信号の処理を行う。音声処理回路15は、処理された音声信号をスピーカ装置16から音声として出力する。
なお、音声処理回路15は、ウェアラブル翻訳装置1から所定の距離内に発声器31aが位置することが検出されない場合や、ウェアラブル翻訳装置1に対し発声器31aが所定の方向(例えば、上方の方向)に位置することが検出されない場合は、処理を終了し、音声出力を行わない。
図6は、第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置1のスピーカ装置16からユーザ31の発声器31aまでの距離の測定を説明する図である。距離測定装置12は、例えば、図6のようにユーザ31がウェアラブル翻訳装置1を装着したときに、ウェアラブル翻訳装置1の上面に位置するように設けられる。距離測定装置12は、スピーカ及びマイクロホンを備える。距離測定装置12は、距離測定装置12のスピーカでユーザ31の発声器31aに向けてインパルス信号を放射し、距離測定装置12のマイクロホンでユーザ31の下あごで反射されたインパルス信号を受信する。これにより、距離測定装置12は距離測定装置12からユーザ31の下あごまでの距離Dを測定する。距離測定装置12からスピーカ装置16までの距離は既知である。したがって、ユーザ31の下あごから口までの距離は異なるユーザであっても大きな違いはないので、距離Dを測定することによりスピーカ装置16からユーザ31の発声器31aまでの距離を得ることができる。
なお、ここでは、スピーカ装置16の上方にユーザ31の発声器31aが位置することを検出する一例として、スピーカ装置16からユーザ31の発声器31aまでの距離を測定したが、他の検出方法でもよい。つまり、スピーカ装置16の音像をユーザ31の発声器31aに向けて移動できるように、ウェアラブル翻訳装置1と発声器31aとの間の距離及び方向が検出できればよい。
また、ユーザ31がウェアラブル翻訳装置1を図3又は図4のように装着するとき、距離測定装置12は、スピーカ装置16からユーザ31の発声器31aまでの距離に替えて、スピーカ装置16に対するユーザ31の発声器31aの相対位置を測定してもよい。距離測定装置12は、例えば特許文献2の技術を用いて、スピーカ装置16に対するユーザ31の発声器31aの相対位置を測定してもよい。
以上のように、取得されたスピーカ装置16からユーザ31の発声器31aまでの距離情報は、制御回路11Cに送られ、制御回路11Cによりスピーカ装置16の上方にユーザ31の発声器31aが位置することが検出される。
図7は、第1の実施の形態に係る翻訳システムのウェアラブル翻訳装置1を使用したときの音像の上昇を説明する図である。ユーザ31は第1言語の話者であり、かつ、ユーザ31は、第2言語の話者である聴取者32と対面している。ユーザ31及び聴取者32が会話する通常の状況下では、ユーザ31及び聴取者32の両方が立った状態又は座った状態で、1〜3m離れて対面している。ユーザ31が例えば図2のようにウェアラブル翻訳装置1を装着したとき、ウェアラブル翻訳装置1は、ユーザ31の発声器31aの下方であって、首の直下から腰までの範囲のどこかにある。また、聴取者32の聴覚器(両耳)は、地面に対して平行な水平面内にある。この場合、音声の特定周波数成分を調整することにより、音像を上昇させることができる。音声処理回路15は、スピーカ装置16の上方にユーザ31の発声器31aが位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させるように、第2言語の音声信号の特定周波数成分を調整(強調)する。
例えば、特許文献3の技術を適用すると、音声処理回路15は以下のように動作する。音声処理回路15は、スピーカ装置16から聴取者32に向けて出力される音声の音圧周波数特性が第1のピークと第2のピークを有するように周波数特性を形成する。第1のピークの中心周波数を6kHz±15%の範囲内に設定する。第2のピークの中心周波数を13kHz±20%の範囲内に設定する。第1のピークのレベルを3dB以上12dB以下の範囲内に設定し、第2のピークのレベルを3dB以上25dB以下の範囲内に設定してもよい。第1のピークまたは第2のピークは、スピーカ装置16自体の音圧周波数特性に基づいて設定されてもよい。スピーカ装置16から出力される音声の音圧周波数特性は、中心周波数が8kHz±10%においてディップが形成された特性曲線を有してもよい。ディップは、スピーカ装置16自体の音圧周波数特性に基づいて設定されてもよい。第1のピークまたは第2のピークのレベルまたはQ値は調整可能にされてもよい。音声処理回路15は、スピーカ装置16から聴取者32に向けて出力される音声の音圧周波数特性における高域レベルを、所定レベルだけブーストするよう構成してもよい。
以上のように、音声処理回路15は所定の周波数特性を有する音声信号を形成することにより、スピーカ装置16がユーザ31の発声器31aから離れていても、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aに向けて上昇させる。これにより、図7に示すように、仮想的なスピーカ装置16’の位置に音像を形成することができる。
第2言語の音声信号の特定周波数成分をf、スピーカ装置16から仮想的なスピーカ装置16’までの距離をd1、スピーカ装置16から聴取者32の耳までの距離をd2、スピーカ装置16から出力される音声信号をS2(f)(ただし、fは周波数を表す)、スピーカ装置16から仮想的なスピーカ装置16’までの伝達関数をH1(f,d1)、仮想的なスピーカ装置16’から聴取者32の耳までの伝達関数をH3(f,d2)とする。このとき、聴取者32が聴く音声信号は、(1)式となる。
S2(f)・H1(f,d1)・H3(f,d2) (1)
音声処理回路15は、例えば10cmのオーダーの分解能で、スピーカ装置16の音像を移動させることができる。
ウェアラブル翻訳装置1は、ウェアラブル翻訳装置1が実質的に静止しているか否かを検出するための重力センサを備えてもよい。ウェアラブル翻訳装置1が静止していない場合、スピーカ装置16からユーザ31の発声器31aまでの正確な距離を測定できないと考えられる。この場合、スピーカ装置16からユーザ31の発声器31aまでの距離の測定を中止してもよい。それに代わって、ウェアラブル翻訳装置1が静止していない場合、スピーカ装置16からユーザ31の発声器31aまでの距離をおおまかに測定し、音声処理回路15は、おおまかに測定された距離に基づいて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させてもよい。
距離測定装置12は、最初に、例えば、ユーザ31がウェアラブル翻訳装置1を装着したときに、スピーカ装置16からユーザ31の発声器31aまでの距離をおおまかに測定する。音声処理回路15は、おおまかに測定された距離に基づいて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させてもよい。その後、距離測定装置12は、スピーカ装置16からユーザ31の発声器31aまでのより正確な距離を測定する。音声処理回路15は、測定された正確な距離に基づいて、スピーカ装置16からユーザ31の発声器31aまでの距離に基づいて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させてもよい。
[1−3.効果等]
第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1は、ユーザ31の身体に装着可能であるウェアラブル翻訳装置1であって、ユーザ31から第1言語の音声を取得して第1言語の音声信号を生成するマイクロホン装置13と、第1言語の音声信号から変換された第2言語の音声信号を取得する制御回路11とを備える。また、第2言語の音声信号に対して所定の処理を実行する音声処理回路15と、処理された第2言語の音声信号を音声として出力するスピーカ装置16とを備える。また、音声処理回路15は、スピーカ装置16の上方にユーザ31の発声器31aが位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させる。
上記ウェアラブル翻訳装置1によれば、異言語の話者間の会話を翻訳する際に、会話の自然さを損ないにくいウェアラブル翻訳装置1を提供することができる。これにより、ウェアラブル型の翻訳装置に特有の「簡易さ」及び「身軽感」などの翻訳体験をユーザに提供することができる。さらに、音声処理回路15が合成された音声の音像をユーザ31の発声器31aの位置に向けて移動させるので、ユーザ31自身があたかも外国語を話しているかのような翻訳体験を提供することができる。
また、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1によれば、ウェアラブル翻訳装置1はユーザ31の胸部又は腹部に装着されてもよい。これにより、ウェアラブル型の翻訳装置に特有の「簡易さ」及び「身軽感」などの翻訳体験をユーザに提供することができる。
また、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1によれば、音声処理回路15は、第2言語の音声信号の特定周波数成分を調整してもよい。このように、音声の特定周波数成分を調整することにより、音像を上昇させることができる。
また、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1によれば、マイクロホン装置13は、マイクロホン装置13からユーザ31の発声器31aに向かう方向にビームを有してもよい。これにより、ユーザ31の発話以外の雑音(例えば、図7の聴取者32の発話)による影響を受けにくくなる。
また、第1の実施の形態に係る翻訳システム100のウェアラブル翻訳装置1は、スピーカ装置16からユーザ31の発声器31aまでの距離を測定する距離測定装置12をさらに備えてもよい。これにより、スピーカ装置16からユーザ31の発声器31aまでの実際の距離に基づいて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて適切に移動させることができる。
また、第1の実施の形態に係る翻訳システム100は、ウェアラブル翻訳装置1、ウェアラブル翻訳装置1の外部に、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5を備える。また、音声認識サーバ装置3は、第1言語の音声信号を第1言語のテキストに変換する。また、機械翻訳サーバ装置4は、第1言語のテキストを第2言語のテキストに変換する。また、音声合成サーバ装置5は、第2言語のテキストを第2言語の音声信号に変換する。また、制御回路11は、音声合成サーバ装置5から無線通信回路14を介して第2言語の音声信号を取得する。これにより、ウェアラブル翻訳装置1の構成を簡単化することができる。例えば、音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5は、ウェアラブル翻訳装置1の製造者又は販売者とは異なるサードパーティ(クラウドサービス)によって提供されてもよい。クラウドサービスを用いることにより、例えば、多言語のウェアラブル翻訳装置を低コストで提供することができる。
(第2の実施の形態)
次に、図8を参照して、第2の実施の形態に係る翻訳システムのウェアラブル翻訳装置について説明する。
なお、第1の実施の形態における翻訳システム100及びウェアラブル翻訳装置1と同様の構成については同様の符号を付し、その説明は省略する場合がある。
[2−1.構成]
図8は、第2の実施の形態に係る翻訳システムのウェアラブル翻訳装置1Aをユーザ31が装着した状態の例を示す図である。ウェアラブル翻訳装置1Aは、図1のスピーカ装置16に代えて、複数のスピーカ16a,16bを含むスピーカ装置16Aを備える。他の点では、図8のウェアラブル翻訳装置1Aは、図1のウェアラブル翻訳装置1と同様に構成される。
[2−2.動作]
スピーカ装置16Aの2つのスピーカ16a,16bは、互いに近接して配置され、ステレオダイポール再生を行う。音声処理回路15は、スピーカ装置16Aからユーザ31の発声器31aまでの距離と、ユーザ31に対面する仮想的人物の頭部伝達関数とに基づいて、スピーカ装置16Aの音像をスピーカ装置16Aの位置からユーザ31の発声器31aの位置に向けて移動させるように、第2言語の音声信号をフィルタリングする。頭部伝達関数は、例えば、ユーザ31の正面に1〜3m離れて対面している聴取者を仮定して計算される。これにより、第1の実施の形態(図7)と同様に、スピーカ装置16Aがユーザ31の発声器31aから離れていても、スピーカ装置16Aの音像をスピーカ装置16Aの位置からユーザ31の発声器31aに向けて上昇させることができる。
それに代わって、ウェアラブル翻訳装置1Aを図3又は図4のように装着するとき、音声処理回路15は、スピーカ装置16Aから出力される音声が所定方向にビームを有するように、第2言語の音声信号を分配し、分配された各音声信号の位相を調整してもよい。これにより、スピーカ装置16Aから出力される音声のビームの方向を変化させることができる。
スピーカ装置16Aから出力される音声のビームの方向を変化させるために、例えば、特許文献4の技術を適用してもよい。
[2−3.効果等]
第2の実施の形態に係るウェアラブル翻訳装置1Aによれば、スピーカ装置16Aは、互いに近接して配置された2つのスピーカ16a,16bを含み、ステレオダイポール再生を行ってもよい。音声処理回路15は、スピーカ装置16Aからユーザ31の発声器31aまでの距離と、ユーザ31に対面する仮想的人物の頭部伝達関数とに基づいて、第2言語の音声信号をフィルタリングしてもよい。これにより、ステレオダイポール再生の技術を用いて、スピーカ装置16Aの音像をスピーカ装置16Aの位置からユーザ31の発声器31aの位置に向けて移動させることができる。
第2の実施の形態に係るウェアラブル翻訳装置1Aによれば、スピーカ装置16Aは複数のスピーカ16a,16bを含んでもよい。音声処理回路15は、スピーカ装置16Aから出力される音声が所定方向にビームを有するように、第2言語の音声信号を分配し、分配された各音声信号の位相を調整してもよい。これにより、ウェアラブル翻訳装置1Aがユーザ31の発声器31aの下方に位置していなくても、スピーカ装置16Aの音像をスピーカ装置16Aの位置からユーザ31の発声器31aの位置に向けて移動させることができる。
(第3の実施の形態)
次に、図9を参照して、第3の実施の形態に係る翻訳システムについて説明する。
なお、第1の実施の形態における翻訳システム100及びウェアラブル翻訳装置1と同様の構成については同様の符号を付し、その説明は省略する場合がある。
[3−1.構成]
図9は、第3の実施の形態に係る翻訳システム300の構成を示すブロック図である。図9の翻訳システム300のウェアラブル翻訳装置1Bは、図1の距離測定装置12に代えて、ユーザ入力装置17を備える。他の点では、図9のウェアラブル翻訳装置1Bは、図1のウェアラブル翻訳装置1と同様に構成される。
[3−2.動作]
ユーザ入力装置17は、スピーカ装置16からユーザの発声器31aまでの距離を指定するユーザ入力を取得する。なお、ユーザ入力装置17は、タッチパネルやボタン等によって構成される。
ウェアラブル翻訳装置1Bには予め決められた複数の距離(例えば、遠(60cm)、中(40cm)、近(20cm))が選択可能に設定される。ユーザは、ユーザ入力装置17を用いてこれらの距離のうちの1つを選択することができる。制御回路11Cは、ユーザ入力装置17からの入力信号(距離の選択)に応じてスピーカ装置16からユーザの発声器31aまでの距離(図7のd1)を決定する。これにより、制御回路11Cは、スピーカ装置16の上方にユーザ31の発声器31aが位置することを検出する。
[3−3.効果等]
第3の実施の形態に係る翻訳システム300によれば、ウェアラブル翻訳装置1Bは、スピーカ装置16からユーザの発声器31aまでの距離を指定するユーザ入力を取得するユーザ入力装置17を備える。図1の距離測定装置12を除去したことにより、図9のウェアラブル翻訳装置1Bの構成は、図1のウェアラブル翻訳装置1よりも簡単化される。
(第4の実施の形態)
次に、図10及び図11を参照して、第4の実施の形態に係る翻訳システムについて説明する。
なお、第1の実施の形態における翻訳システム100及びウェアラブル翻訳装置1と同様の構成については同様の符号を付し、その説明は省略する場合がある。
[4−1.構成]
図10は、第4の実施の形態に係る翻訳システム400の構成を示すブロック図である。翻訳システム400は、ウェアラブル翻訳装置1、アクセスポイント装置2、及び翻訳サーバ装置41を含む。翻訳サーバ装置41は、音声認識サーバ装置3A、機械翻訳サーバ装置4A、及び音声合成サーバ装置5Aを備える。図10のウェアラブル翻訳装置1及びアクセスポイント装置2は、図1のウェアラブル翻訳装置1及びアクセスポイント装置2と同様に構成される。図10の音声認識サーバ装置3A、機械翻訳サーバ装置4A、及び音声合成サーバ装置5Aは、図1の音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5と同様の機能をそれぞれ有する。アクセスポイント装置2は、例えばインターネットを介して、翻訳サーバ装置41と通信する。従って、ウェアラブル翻訳装置1は、アクセスポイント装置2を介して翻訳サーバ装置41と通信する。
[4−2.動作]
図11は、第4の実施の形態に係る翻訳システム400の動作を示すシーケンス図である。ユーザ31からマイクロホン装置13を介して、第1言語の音声信号が入力されたとき、制御回路11は、入力された音声信号を翻訳サーバ装置41に送る。翻訳サーバ装置41の音声認識サーバ装置3Aは、入力された音声信号に対して音声認識を行って、認識された第1言語のテキストを生成し、機械翻訳サーバ装置4Aに送る。機械翻訳サーバ装置4Aは、第1言語のテキストの機械翻訳を行って、翻訳された第2言語のテキストを生成し、音声合成サーバ装置5Aに送る。音声合成サーバ装置5Aは、第2言語のテキストの音声合成を行って、合成された第2言語の音声信号を生成し、制御回路11に送る。制御回路11は、翻訳サーバ装置41から第2言語の音声信号が送られると、第2言語の音声信号を音声処理回路15に送る。音声処理回路15は、スピーカ装置16の上方にユーザ31の発声器31aが位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザ31の発声器31aの位置に向けて移動させるように、第2言語の音声信号の処理を行い、処理された音声信号をスピーカ装置16から音声として出力する。
[4−3.効果等]
第4の実施の形態に係る翻訳システム400は、音声認識サーバ装置3A、機械翻訳サーバ装置4A、及び音声合成サーバ装置5Aを、一体の翻訳サーバ装置41として備えてもよい。これにより、第1の実施の形態に係る翻訳システムよりも通信回数を削減することにより、通信にかかる時間及び電力消費を削減することができる。
(第5の実施の形態)
次に、図12を参照して、第5の実施の形態に係るウェアラブル翻訳装置について説明する。
なお、第1の実施の形態における翻訳システム100及びウェアラブル翻訳装置1と同様の構成については同様の符号を付し、その説明は省略する場合がある。
[5−1.構成]
図12は、第5の実施の形態に係るウェアラブル翻訳装置1Cの構成を示すブロック図である。図12のウェアラブル翻訳装置1Cは、図1の音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5の機能を有する。ウェアラブル翻訳装置1Cは、制御回路11C、距離測定装置12、マイクロホン装置13、音声処理回路15、スピーカ装置16、音声認識回路51、機械翻訳回路52、及び音声合成回路53を備える。図12の距離測定装置12、マイクロホン装置13、音声処理回路15、スピーカ装置16は、図1の対応する構成要素と同様に構成される。音声認識回路51、機械翻訳回路52、及び音声合成回路53は、図1の音声認識サーバ装置3、機械翻訳サーバ装置4、及び音声合成サーバ装置5と同様の機能をそれぞれ有する。制御回路11Cは、音声認識回路51、機械翻訳回路52、及び音声合成回路53から、第1言語の音声信号から翻訳された第2言語の音声信号を取得する。
[5−2.動作]
ユーザからマイクロホン装置13を介して第1言語の音声信号が入力されたとき、制御回路11Cは、入力された音声信号を音声認識回路51に送る。音声認識回路51は、入力された音声信号に対して音声認識を行って、認識された第1言語のテキストを生成し、制御回路11Cに送る。制御回路11Cは、音声認識回路51から第1言語のテキストが送られると、第1言語から第2言語に翻訳することを指示する制御信号とともに、第1言語のテキストを機械翻訳回路52に送る。機械翻訳回路52は、第1言語のテキストの機械翻訳を行って、翻訳された第2言語のテキストを生成し、制御回路11Cに送る。制御回路11Cは、機械翻訳回路52から第2言語のテキストが送られると、第2言語のテキストを音声合成回路53に送る。音声合成回路53は、第2言語のテキストの音声合成を行って、合成された第2言語の音声信号を生成し、制御回路11Cに送る。制御回路11Cは、音声合成回路53から第2言語の音声信号が送られると、第2言語の音声信号を音声処理回路15に送る。音声処理回路15は、スピーカ装置16の上方にユーザの発声器31aが位置することが検出された場合、同検出に応じて、スピーカ装置16の音像をスピーカ装置16の位置からユーザの発声器31aの位置に向けて移動させるように、第2言語の音声信号の処理を行い、処理された音声信号をスピーカ装置16から音声として出力する。
音声認識回路51は、入力された音声信号に対して音声認識を行って、認識された第1言語のテキストを生成した後、制御回路11Cにではなく、機械翻訳回路52に送ってもよい。同様に、機械翻訳回路52は、第1言語のテキストの機械翻訳を行って、翻訳された第2言語のテキストを生成した後、制御回路11Cにではなく、音声合成回路53に送ってもよい。
[5−3.効果等]
第5の実施の形態に係るウェアラブル翻訳装置1Cは、第1言語の音声信号を第1言語のテキストに変換する音声認識回路51と、第1言語のテキストを第2言語のテキストに変換する機械翻訳回路52と、第2言語のテキストを第2言語の音声信号に変換する音声合成回路53とをさらに備えてもよい。制御回路11Cは、音声合成回路53から第2言語の音声信号を取得してもよい。これにより、ウェアラブル翻訳装置1Cは外部のサーバ装置と通信することなく、異言語の話者間の会話を翻訳することができる。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、第1〜第5の実施の形態を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、第1〜第5の実施の形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
以下に、他の実施の形態を例示する。
第1〜第4の実施の形態では、ウェアラブル翻訳装置の通信回路の一例として無線通信回路14を用いて説明したが、通信回路は、外部の音声認識サーバ装置、機械翻訳サーバ装置、及び音声合成サーバ装置と通信可能なものであればよい。従って、ウェアラブル翻訳装置は外部の音声認識サーバ装置、機械翻訳サーバ装置、及び音声合成サーバ装置に有線接続されていてもよい。
第1〜第5の実施の形態では、ウェアラブル翻訳装置の制御回路、通信回路、及び音声処理回路を別個のブロックとして示したが、これらの回路は単一の集積回路チップとして構成されてもよい。また、ウェアラブル翻訳装置の制御回路、通信回路、及び音声処理回路の機能は、汎用のプロセッサ上で実行されるプログラムによって実装されてもよい。
第1〜第5の実施の形態では、1人のユーザ(話者)のみがウェアラブル翻訳装置を使用する場合について説明したが、互いに会話しようとする複数の話者のそれぞれがウェアラブル翻訳装置を用いてもよい。
第1〜第5の実施の形態では、スピーカ装置の音像をスピーカ装置の位置からユーザの発声器31aの位置に向けて移動させるものとして説明したが、スピーカ装置の音像をスピーカ装置の位置からユーザの発声器31a以外の位置に向けて移動させてもよい。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示によれば、異言語の話者間の会話を翻訳する際に会話の自然さを損ないにくいウェアラブル装置を提供することができる。
1,1A,1B,1C ウェアラブル翻訳装置
2 アクセスポイント装置
3,3A 音声認識サーバ装置
4,4A 機械翻訳サーバ装置
5,5A 音声合成サーバ装置
11,11C 制御回路
12 距離測定装置
13 マイクロホン装置
14 無線通信回路
15 音声処理回路
16,16A スピーカ装置
16a,16b スピーカ
16’ 仮想的なスピーカ装置
17 ユーザ入力装置
21 ストラップ
22 ベルト
31 ユーザ(話者)
32 聴取者
41 翻訳サーバ装置
51 音声認識回路
52 機械翻訳回路
53 音声合成回路

Claims (11)

  1. ユーザの身体に装着可能であるウェアラブル装置であって、
    前記ユーザから第1言語の音声を取得して第1言語の音声信号を生成するマイクロホン装置と、
    前記第1言語の音声信号から変換された第2言語の音声信号を取得する制御回路と、
    前記第2言語の音声信号に対して所定の処理を実行する音声処理回路と、
    前記処理された第2言語の音声信号を音声として出力するスピーカ装置とを備え、
    前記音声処理回路は、前記スピーカ装置の上方に前記ユーザの発声器が位置することが検出された場合、前記検出に応じて、前記スピーカ装置の音像を前記スピーカ装置の位置から前記ユーザの前記発声器の位置に向けて移動させる、
    ウェアラブル装置。
  2. 前記ユーザの発声器が検出されない場合、前記音声処理回路は、前記スピーカ装置の音像を移動させない、
    請求項1記載のウェアラブル装置。
  3. 前記音声処理回路は、前記第2言語の音声信号の特定周波数成分を調整する、
    請求項1記載のウェアラブル装置。
  4. 前記スピーカ装置は、互いに近接して配置された2つのスピーカを含み、ステレオダイポール再生を行い、
    前記音声処理回路は、前記スピーカ装置から前記ユーザの発声器までの距離と、前記ユーザに対面する仮想的人物の頭部伝達関数とに基づいて、前記第2言語の音声信号をフィルタリングする、
    請求項1記載のウェアラブル装置。
  5. 前記スピーカ装置は、複数のスピーカを含み、
    前記音声処理回路は、前記スピーカ装置から出力される音声が所定方向にビームを有するように、前記第2言語の音声信号を分配し、前記分配された音声信号の位相を調整する、
    請求項1に記載のウェアラブル装置。
  6. 前記マイクロホン装置は、前記マイクロホン装置から前記ユーザの前記発声器に向かう方向にビームを有する、
    請求項1に記載のウェアラブル装置。
  7. 前記スピーカ装置から前記ユーザの前記発声器までの距離を測定する距離測定装置をさらに備える、
    請求項1に記載のウェアラブル装置。
  8. 前記スピーカ装置から前記ユーザの前記発声器までの距離を指定するユーザ入力を取得するユーザ入力装置をさらに備える、
    請求項1に記載のウェアラブル装置。
  9. 前記第1言語の音声信号を第1言語のテキストに変換する音声認識回路と、
    前記第1言語のテキストを第2言語のテキストに変換する機械翻訳回路と、
    前記第2言語のテキストを第2言語の音声信号に変換する音声合成回路とをさらに備え、
    前記制御回路は、前記音声合成回路から前記第2言語の音声信号を取得する、
    請求項1に記載のウェアラブル装置。
  10. 通信回路をさらに備える請求項1に記載のウェアラブル装置、及び
    前記ウェアラブル翻訳装置に接続可能な、音声認識サーバ装置と、機械翻訳サーバ装置と、及び音声合成サーバ装置とを備える翻訳システムであって、
    前記音声認識サーバ装置は、前記第1言語の音声信号を第1言語のテキストに変換し、
    前記機械翻訳サーバ装置は、前記第1言語のテキストを第2言語のテキストに変換し、
    前記音声合成サーバ装置は、前記第2言語のテキストを第2言語の音声信号に変換し、
    前記制御回路は、前記音声合成サーバ装置から前記通信回路を介して前記第2言語の音声信号を取得する、
    翻訳システム。
  11. 前記音声認識サーバ装置、前記機械翻訳サーバ装置、及び前記音声合成サーバ装置を、一体の翻訳サーバ装置として備える、
    請求項10に記載の翻訳システム。
JP2016018575A 2015-03-13 2016-02-03 ウェアラブル装置及び翻訳システム Active JP6603875B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/067,036 US20160267075A1 (en) 2015-03-13 2016-03-10 Wearable device and translation system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015050942 2015-03-13
JP2015050942 2015-03-13

Publications (2)

Publication Number Publication Date
JP2016171565A true JP2016171565A (ja) 2016-09-23
JP6603875B2 JP6603875B2 (ja) 2019-11-13

Family

ID=56984266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016018575A Active JP6603875B2 (ja) 2015-03-13 2016-02-03 ウェアラブル装置及び翻訳システム

Country Status (1)

Country Link
JP (1) JP6603875B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107750020A (zh) * 2017-12-05 2018-03-02 北京中电慧声科技有限公司 一种带有电子桌牌的话筒及会议系统
CN108445451A (zh) * 2018-05-11 2018-08-24 四川斐讯信息技术有限公司 一种智能音箱及其声源定位方法
KR20200090580A (ko) * 2019-01-21 2020-07-29 (주)한컴인터프리 스마트 의류를 이용하는 통번역 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107750020A (zh) * 2017-12-05 2018-03-02 北京中电慧声科技有限公司 一种带有电子桌牌的话筒及会议系统
CN108445451A (zh) * 2018-05-11 2018-08-24 四川斐讯信息技术有限公司 一种智能音箱及其声源定位方法
KR20200090580A (ko) * 2019-01-21 2020-07-29 (주)한컴인터프리 스마트 의류를 이용하는 통번역 시스템
KR102170684B1 (ko) * 2019-01-21 2020-10-27 (주)한컴인터프리 스마트 의류를 이용하는 통번역 시스템

Also Published As

Publication number Publication date
JP6603875B2 (ja) 2019-11-13

Similar Documents

Publication Publication Date Title
US10097921B2 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US20160267075A1 (en) Wearable device and translation system
DK2882204T3 (en) Hearing aid device for hands-free communication
US9236050B2 (en) System and method for improving speech recognition accuracy in a work environment
US9271077B2 (en) Method and system for directional enhancement of sound using small microphone arrays
US20190138603A1 (en) Coordinating Translation Request Metadata between Devices
US9747282B1 (en) Translation with conversational overlap
US20100098266A1 (en) Multi-channel audio device
JPWO2010084769A1 (ja) 補聴装置
JP2011061422A (ja) 情報処理装置、情報処理方法およびプログラム
JP6603875B2 (ja) ウェアラブル装置及び翻訳システム
US10152476B2 (en) Wearable device and translation system
KR20140097699A (ko) 3차원 이퀄 라우드니스 컨투어를 이용한 난청 보상 장치 및 방법
JP6977768B2 (ja) 情報処理装置、情報処理方法、音声出力装置、および音声出力方法
CN110837353B (zh) 补偿耳内音频信号的方法、电子装置及记录介质
US20150117688A1 (en) Hybrid hearing device
WO2017166495A1 (zh) 一种语音信号处理方法及装置
CN113038318B (zh) 一种语音信号处理方法及装置
US9355648B2 (en) Voice input/output device, method and programme for preventing howling
WO2019119376A1 (en) Earphone and method for uplink cancellation of an earphone
JP2016177782A (ja) ウェアラブル装置及び翻訳システム
US20190306618A1 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
KR102044970B1 (ko) 환경 특징 추출 방법 및 이를 이용한 보청기 작동 방법
JP2019096220A (ja) 文字情報提供装置および方法
US10897665B2 (en) Method of decreasing the effect of an interference sound and sound playback device

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20160525

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180831

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20190116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190709

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190916

R151 Written notification of patent or utility model registration

Ref document number: 6603875

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151