(本開示の基礎となった知見)
近年、ユーザの頭部に装着され、ユーザに映像及び音声を視聴させるディスプレイ装置であるヘッドマウントディスプレイが普及している。ヘッドマウントディスプレイの用途として、例えば、飛行機の機内サービスとして、乗客にヘッドマウントディスプレイを用いた機内エンターテイメントを提供する航空会社も登場している。
ヘッドマウントディスプレイを装着した乗客は、映像及び音声に没入することができる一方、外部の人とのコミュニケーションを取り難くなるという課題がある。例えば、客室乗務員は、乗客に声をかけても、その乗客が自分に気づいているかどうかを認識できない。
そこで、乗客は、ヘッドマウントディスプレイを装着した状態で、自分に近づいてきた客室乗務員を認識し、なるべくヘッドマウントディスプレイを外さずに、コンテンツを視聴したまま、客室乗務員と簡易なコミュニケーションを取りたいという要望がある。また、客室乗務員は、ヘッドマウントディスプレイを装着した乗客が自分に気づいていることを認識したいという要望がある。
ここで、ヘッドマウントディスプレイの装着者と外部の人とのコミュニケーションを容易にする技術として、特許文献1に開示された技術が提案されている。この技術では、ヘッドマウントディスプレイの装着者への通知(映像及び音声による通知)を行った後、ヘッドマウントディスプレイの外側にその旨を表示する。この表示により、外部の人は、装着者への通知が行われたことを知ることができる。
しかしながら、特許文献1の技術では、ヘッドマウントディスプレイの装着者に通知を行った旨をヘッドマウントディスプレイの外側に表示しているのであって、必ずしも、ヘッドマウントディスプレイの装着者がその通知に気付いた旨をヘッドマウントディスプレイの外側に表示しているわけではない。例えば、音声によって装着者に通知した場合、ヘッドマウントディスプレイで再生しているコンテンツの音量が大きいときには、装着者は、その通知に気付かない。そのような場合であっても、特許文献1の技術では、ヘッドマウントディスプレイの外側に、装着者に通知した旨が表示される。すなわち、特許文献1の技術では、外部の人は、装着者が通知に気付いたかどうかが分からない。
また、特許文献1の技術は、ヘッドマウントディスプレイの装着者が通知に必ず気づくことを前提としている。そのことを確保するために、装着者への通知が映像による通知である場合には、装着者が気づき易い映像が表示される。そのために、ヘッドマウントディスプレイのコンテンツ視聴が邪魔されてしまう。一方、装着者への通知が音声による通知である場合には、装着者が気づき易い音声を提供するために、一旦ヘッドマウントディスプレイで再生しているコンテンツの音声を止める、あるいは、小さくする等の処理が必要となる。そのために、やはり、ヘッドマウントディスプレイのコンテンツ視聴が邪魔されてしまう。
さらに、特許文献1の技術では、ヘッドマウントディスプレイの装着者の意思、つまり、外部の人とのコミュニケーションを取りたいか否かがヘッドマウントディスプレイの外側での表示に反映されない。
このように、特許文献1の技術によれば、ヘッドマウントディスプレイの装着者と外部の人とのコミュニケーションがある程度は可能になるものの、双方の意思を確認し合える程度の円滑なコミュニケーションまではできないという問題がある。
そこで、本開示は、ヘッドマウントディスプレイの装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションを図ることを可能にするヘッドマウントディスプレイ及びその制御方法を提供する。
そのために、本開示の一形態に係るヘッドマウントディスプレイでは、ヘッドマウントディスプレイの装着者に声をかけている外部の人の位置(音座標)を特定しておく。そして、ヘッドマウントディスプレイの装着者がその音座標の向きに頭、身体、手又は腕を動かしたことを検知した場合、ヘッドマウントディスプレイの装着者が外部の声に反応したと判断して、ヘッドマウントディスプレイの外側に、その旨を表示する。
これにより、ヘッドマウントディスプレイの装着者が通知に気付いた旨を外部から認識できる。よって、ヘッドマウントディスプレイの装着者に対して、コンテンツの邪魔をしない通知、つまり、コンテンツを視聴しながらの自然な通知ができる。また、ヘッドマウントディスプレイの装着者の意思、つまり、外部とのコミュニケーションを取りたいか否かがヘッドマウントディスプレイの外側での表示に反映される。
つまり、本開示により、ヘッドマウントディスプレイの装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションを図ることを可能にするヘッドマウントディスプレイが実現される。
より詳しくは、本開示の一形態に係るヘッドマウントディスプレイは、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部と、前記収音部で収音された音から音声を検出する音声検出部と、前記ヘッドマウントディスプレイの装着者の頭部の動きを検知する頭部動作検知部と、外部から視認可能な情報を表示する外部ディスプレイと、前記音声検出部によって音声が検出され、かつ、前記頭部動作検知部によって前記装着者の頭部が前記特定の方向を向くような動きが検知された場合に、前記装着者が前記音声に応答したことを示す情報を前記外部ディスプレイに表示する応答検知部とを備える。
これにより、ヘッドマウントディスプレイの装着者の頭部が、外部の人が発する音声の音源方向に設定された特定の方向を向くことが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイに表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイに表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
ここで、前記ヘッドマウントディスプレイは、さらに、前記音声検出部で検出された音声が予め定められた人の音声であるか否かを判定する話者識別部を備え、前記応答検知部は、前記話者識別部によって前記音声が予め定められた人の音声であると判定され、かつ、前記頭部動作検知部によって前記装着者の頭部が前記特定の方向を向くような動きが検知された場合に、前記情報を前記外部ディスプレイに表示してもよい。
これにより、ヘッドマウントディスプレイの装着者が、予め定められた人からの音声に応答する意思を示した場合に、そのことが外部ディスプレイに表示される。よって、装着者に飛び込んでくる雑音としての無関係な人からの音声に装着者が応答したと誤認識されることが抑制され、ヘッドマウントディスプレイの応答精度が向上される。
また、前記ヘッドマウントディスプレイは、さらに、音源を探査する音源探査部を備え、前記収音部は、前記音源探査部で探査された音源の方向を前記特定の方向からの音として収音してもよい。
これにより、音源の方向が音源探査部で探査されるので、外部の人の音声が特定の方向からの音声に固定される必要がなくなる。つまり、あらゆる方向からの音声に対して装着者が応答した場合にそのことが外部ディスプレイに表示され、ヘッドマウントディスプレイの利便性が向上される。
また、前記ヘッドマウントディスプレイは、さらに、前記映像に伴う音を前記装着者に提供するヘッドホンと、前記音声検出部で検出された音声を前記映像に伴う音に重畳させて前記ヘッドホンに出力する音声重畳部とを備えてもよい。
これにより、外部の人の音声が、映像に伴う音に重畳されてヘッドホンから出力されるので、ヘッドマウントディスプレイの装着者は、再生しているコンテンツの音声を視聴しながら、外部の人の音声も聞くことができる。よって、装着者と外部の人との間で、より円滑なコミュニケーションが可能になる。
また、前記音声重畳部は、前記音声検出部で検出された音声が前記特定の方向に対応する方向から聞こえるように音像定位を行ったうえで、前記映像に伴う音に重畳させてもよい。
これにより、音像定位により、ヘッドマウントディスプレイの装着者は、外部の人の音声が、現実の音源方向、あるいは、それに対応した音源方向から聞こえるので、ヘッドマウントディスプレイを装着していないときと同様に、音声を発した外部の人がいる方向を容易に察知できる。
また、前記ヘッドマウントディスプレイは、さらに、前記映像に伴う音を前記装着者に提供するヘッドホンを備え、前記応答検知部は、前記情報を前記外部ディスプレイに表示するときに、前記ヘッドホンに提供される音の音量を下げてもよい。
これにより、外部の人が装着者に向けて音声を発したときに、ヘッドホンに提供される音の音量が下がる。よって、ヘッドマウントディスプレイの装着者は、ヘッドマウントディスプレイを装着したまま、外部の人の音声を聞き取ることができる。
また、前記応答検知部は、前記音声検出部によって音声が検出され、かつ、前記頭部動作検知部によって前記装着者の頭部が前記特定の方向を向くような動きが検知された場合に、前記装着者が発する音声を収音するように、前記収音部に対して収音する方向を変更させる制御をしてもよい。
これにより、外部の人から音声に対して装着者が顔を向ける応答をした後に、装着者からの音声を収音するように収音方向が変更されるので、続いて装着者が発する音声が収音される。よって、装着者と外部の人との間で、より円滑なコミュニケーションが可能になる。
なお、本開示の他の形態は、ヘッドマウントディスプレイの制御方法である。その制御方法は、映像を提示するヘッドマウントディスプレイの制御方法であって、特定の方向からの音を収音する収音ステップと、前記収音ステップで収音された音から音声を検出する音声検出ステップと、前記ヘッドマウントディスプレイの装着者の頭部の動きを検知する頭部動作検知ステップと、前記音声検出ステップによって音声が検出され、かつ、前記頭部動作検知ステップによって前記装着者の頭部が前記特定の方向を向くような動きが検知された場合に、前記装着者が前記音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイに表示する応答検知ステップとを含む。
また、本開示の一形態に係るヘッドマウントディスプレイは、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部と、前記収音部で収音された音から音声を検出する音声検出部と、前記ヘッドマウントディスプレイの装着者の身体の向きを検知する身体動作検知部と、外部から視認可能な情報を表示する外部ディスプレイと、前記音声検出部によって音声が検出され、かつ、前記身体動作検知部によって前記装着者の身体が前記特定の方向を向いたことが検知された場合に、前記装着者が前記音声に応答したことを示す情報を前記外部ディスプレイに表示する応答検知部とを備える。
これにより、ヘッドマウントディスプレイの装着者の身体が、外部の人が発する音声の音源方向に設定された特定の方向を向くことが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイに表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイに表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
なお、本開示の他の形態は、ヘッドマウントディスプレイの制御方法である。その制御方法は、映像を提示するヘッドマウントディスプレイの制御方法であって、特定の方向からの音を収音する収音ステップと、前記収音ステップで収音された音から音声を検出する音声検出ステップと、前記ヘッドマウントディスプレイの装着者の身体の向きをを検知する身体動作検知ステップと、前記音声検出ステップによって音声が検出され、かつ、前記身体動作検知ステップによって前記装着者の身体が前記特定の方向を向いたことが検知された場合に、前記装着者が前記音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイに表示する応答検知ステップとを含む。
また、本開示の一形態に係るヘッドマウントディスプレイは、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部と、前記収音部で収音された音から音声を検出する音声検出部と、前記ヘッドマウントディスプレイの装着者の手又は腕の動きを検知する手腕動作検知部と、外部から視認可能な情報を表示する外部ディスプレイと、前記音声検出部によって音声が検出され、かつ、前記手腕動作検知部によって前記装着者の手又は腕の所定の動きが検知された場合に、前記装着者が前記音声に応答したことを示す情報を前記外部ディスプレイに表示する応答検知部とを備える。
これにより、ヘッドマウントディスプレイの装着者の手又は腕の所定の動きが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイに表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイに表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
なお、本開示の他の形態は、ヘッドマウントディスプレイの制御方法である。その制御方法は、映像を提示するヘッドマウントディスプレイの制御方法であって、特定の方向からの音を収音する収音ステップと、前記収音ステップで収音された音から音声を検出する音声検出ステップと、前記ヘッドマウントディスプレイの装着者の手又は腕の動きを検知する手腕動作検知ステップと、前記音声検出ステップによって音声が検出され、かつ、前記手腕動作検知ステップによって前記装着者の手又は腕の所定の動きが検知された場合に、前記装着者が前記音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイに表示する応答検知ステップとを含む。
また、本開示の他の形態は、CPU、プロセッサ又はコンピュータによって実行されるプログラム又はプログラムが記録されたコンピュータ読み取り可能なディスク又は半導体メモリ等の記録媒体である。そのプログラムには、上記ヘッドマウントディスプレイの制御方法を構成するステップが含まれる。
以下、実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本開示の包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する。
(実施の形態)
図1は、実施の形態に係るヘッドマウントディスプレイ10の外観図である。このヘッドマウントディスプレイ10は、ヘッドマウントディスプレイ10の装着者がヘッドマウントディスプレイ10を装着したまま外部の人と双方の意思を確認し合える程度の円滑なコミュニケーションを図ることを可能にしたヘッドマウントディスプレイである。このヘッドマウントディスプレイ10には、外から見える構成要素として、マイク12a~12d、外部ディスプレイ16、及び、ヘッドホン35が備えられている。
マイク12a~12dは、ヘッドマウントディスプレイ10の前方からくる音の音源方向を検知するマイクであり、ヘッドマウントディスプレイ10の前面における上下左右の4箇所に設けられている。なお、必ずしもヘッドマウントディスプレイ10に4個のマイクが必要ではなく、例えば、上下方向だけ、あるいは、左右方向だけに離れて2個のマイクが設けられていてもよい。
外部ディスプレイ16は、外部から視認可能な情報を表示するディスプレイであり、例えば、LED等のランプ、LCD等の2次元ディスプレイである。なお、「外部から視認可能な情報」とは、単なるランプの点灯、文字、記号、アイコン、画像、及び、それらの少なくとも二つの混合のいずれであってもよい。
ヘッドホン35は、ヘッドマウントディスプレイ10が提供する映像に伴う音を装着者に提供するヘッドホンであり、オープンエア型又は密閉型のヘッドホンである。本実施の形態では、ヘッドホン35は、ヘッドマウントディスプレイ10で再生された映像に伴う音を出力するとともに、外部の人の音声もヘッドマウントディスプレイ10の装着者に聞こえるように、オープンエア型のヘッドホンであるのが好ましい。
図2は、図1に示されるヘッドマウントディスプレイ10の構成を示すブロック図である。ヘッドマウントディスプレイ10は、収音部11、音声検出部14、頭部動作検知部15、外部ディスプレイ16、応答検知部17、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
収音部11は、特定の方向からの音を収音する処理部であり、4つのマイク12a~12d及び指向性処理部13で構成される。指向性処理部13は、4つのマイク12a~12dからの音信号に対して信号処理を施すことによって、特定の方向からの音だけを収音する。信号処理として、4つのマイク12a~12dからの音信号の遅延をずらすことで特定の方向の音を強調する遅延型ビームフォーマ、あるいは、特定の方向の音とそれ以外の不要方向の音とを遅延型によって生成し、特定の方向の音から不要方向の音を除去する適応型ビームフォーマ方法がある。あるいは、単一指向性マイク1つで特定の方向の音を収音する方法がある。あるいは、異なる方向の音を収音する複数の単一指向性マイクを準備し、特定の方向に対応する単一指向性マイクだけを選択する方法等がある。
なお、「特定の方向」とは、ヘッドマウントディスプレイ10の装着者とその装着者に話しかける外部の人との位置関係がある程度定まっている場合、例えば、飛行機内においてヘッドマウントディスプレイ10を装着した乗客と客室乗務員との場面に限定した場合には、予め定められた固定の方向(例えば、通路寄りの斜め前上の方向)である。ただし、「特定の方向」は、固定の方向に限られず、外部から指示される動的に変化する方向であってもよい。
また、収音部11を構成するマイクの個数は、4に限られない。例えば、収音部11は、特定の方向の収音であれば、3つ以上のマイクで構成されてもよい。
音声検出部14は、収音部11で収音された音から音声を検出する処理部であり、例えば、収音部11から出力された信号において、音声の周波数帯におけるパワーが一定時間、閾値を超えた場合に、収音部11から出力された信号を音声と判断し、音声を検出したことを応答検知部17に通知する。
頭部動作検知部15は、ヘッドマウントディスプレイ10の装着者の頭部の動きを検知し、検知した結果を示す信号を応答検知部17に出力するセンサであり、例えば、ジャイロ及び加速度センサの少なくとも一つである。なお、頭部動作検知部15は、カメラ等を用いて装着者の視線を検出することによって頭部の動きを検知してもよい。
応答検知部17は、音声検出部14によって音声が検出され、かつ、頭部動作検知部15によって装着者の頭部が、収音部11が収音する特定の方向を向くような動きが検知された場合に、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する処理部である。なお、「装着者の頭部が特定の方向を向く」とは、「装着者の顔が特定の方向を向く」ことを意味する。
内部ディスプレイ34は、ヘッドマウントディスプレイ10の装着者に映像を提示するディスプレイであり、例えば、3D用映像パネルである。
映像再生部30は、コンテンツを記憶するコンテンツ記憶部31を有し、リモコン(図示せず)等による装着者からの指示に従って、コンテンツ記憶部31からコンテンツを読み出して再生し、映像信号を内部ディスプレイ34に出力するとともに、映像に伴う音信号をヘッドホン35に出力する処理部であり、例えば、映像デコーダ及びプログラムを有するプロセッサ等で構成される。
なお、指向性処理部13、音声検出部14及び応答検知部17は、典型的には、プログラムを保持するROM、RAM、プログラムを実行するプロセッサ、及び、周辺回路と接続するための入出力回路等で構成されたシステム回路又はマイクロコンピュータによって、ソフトウェア的に実現される。ただし、これらは、それぞれの処理を実現するASIC、ゲートアレイ等の専用の論理回路によって、ハードウェア的に実現されてもよい。
次に、以上のように構成された本実施の形態に係るヘッドマウントディスプレイ10の動作について説明する。
図3は、本実施の形態に係るヘッドマウントディスプレイ10の動作(つまり、ヘッドマウントディスプレイ10の制御方法)を示すフローチャートである。ここでは、飛行機の乗客が椅子に座った状態でヘッドマウントディスプレイ10を装着し、コンテンツを再生している場面を想定する。
まず、収音部11は、特定の方向からの音を収音する(収音ステップS10)。具体的には、指向性処理部13は、4つのマイク12a~12dからの音信号に対して、遅延型ビームフォーマ等の信号処理を施すことによって、特定の方向(ここでは、斜め前上の方向)からの音だけを収音する。
続いて、音声検出部14は、収音部11で収音された音から音声を検出する(音声検出ステップS11)。具体的には、音声検出部14は、収音部11から出力された信号において、音声の周波数帯におけるパワーが一定時間、閾値を超えた場合に、収音部11から出力された信号を音声と判断し、音声を検出したことを応答検知部17に通知する。これにより、応答検知部17は、斜め前上からの音声が検出されたか否か、つまり、客室乗務員がヘッドマウントディスプレイ10の装着者に話しかけたか否かを判断する。
応答検知部17は、音声検出部14によって音声が検出された場合には(S11でYES)、ステップS12以降の処理に進み、そうでない場合には(S11でNO)、処理を終了する。
頭部動作検知部15では、ヘッドマウントディスプレイ10の装着者の頭部の動きが検知され、検知された結果を示す信号が応答検知部17に出力している(頭部動作検知ステップS12)。
応答検知部17は、頭部動作検知部15から出力される信号を解析することで、ヘッドマウントディスプレイ10の装着者(ここでは、乗客)が客室乗務員からの話しかけに応答したか否かを判断する(S13)。
具体的には、応答検知部17は、頭部動作検知部15によって、収音部11が収音する特定の方向に装着者の頭部が向くような動きが検知された場合に(S13でYES)、装着者が客室乗務員からの話しかけに応答したと判断し、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する(応答検知ステップS14)。
その後、応答検知部17は、処理の終了条件が満たされるか否かを判断し(S15)、満たされるまで、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示し続ける。なお、「処理の終了条件」とは、装着者が音声に応答しなくなることであり、例えば、頭部動作検知部15によって、装着者の頭部が、収音部11が収音する特定の方向を向くような動きが検知されなくなることである。
一方、応答検知部17は、頭部動作検知部15によって、装着者の頭部が、収音部11が収音する特定の方向を向くような動きが検知されなかった場合には(S13でNO)、装着者が客室乗務員からの話しかけに応答しなかったと判断し、処理を終了する。
このように、本実施の形態に係るヘッドマウントディスプレイ10は、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部11と、収音部11で収音された音から音声を検出する音声検出部14と、ヘッドマウントディスプレイ10の装着者の頭部の動きを検知する頭部動作検知部15と、外部から視認可能な情報を表示する外部ディスプレイ16と、音声検出部14によって音声が検出され、かつ、頭部動作検知部15によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する応答検知部17とを備える。
また、本実施の形態に係るヘッドマウントディスプレイ10の制御方法は、映像を提示するヘッドマウントディスプレイ10の制御方法であって、特定の方向からの音を収音する収音ステップS10と、収音ステップS10で収音された音から音声を検出する音声検出ステップS11と、ヘッドマウントディスプレイ10の装着者の頭部の動きを検知する頭部動作検知ステップS12と、音声検出ステップS11によって音声が検出され、かつ、頭部動作検知ステップS12によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイ16に表示する応答検知ステップS14とを含む。
これにより、ヘッドマウントディスプレイ10の装着者の顔が、外部の人が発する音声の音源方向に設定された特定の方向を向くことが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイ16に表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイ16に表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
なお、本実施の形態では、図3のフローチャートにおいて、指向性処理(S10)及び音声検出(S11)の後に、頭部動作の検知(S12)が行われたが、このような順序に限定されない。指向性処理(S10)及び音声検出(S11)と、頭部動作の検知(S12)とは、順序が入れ替わってもよいし、並行して行われてもよい。
(変形例1)
次に、実施の形態の変形例1に係るヘッドマウントディスプレイについて説明する。
図4は、実施の形態の変形例1に係るヘッドマウントディスプレイ10aの構成を示すブロック図である。ヘッドマウントディスプレイ10aは、話者を識別する機能を有するヘッドマウントディスプレイであり、収音部11、音声検出部14、話者識別部18、頭部動作検知部15、外部ディスプレイ16、応答検知部17a、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10aは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、新たな構成要素として話者識別部18を備える点、及び、変形例に係る応答検知部17aを備える点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
話者識別部18は、音声検出部14で検出された音声が予め定められた人の音声であるか否かを判定し、その判定結果を応答検知部17aに通知する処理部である。本変形例では、話者識別部18は、客室乗務員らの音声が予め登録された記憶部を有しており、音声検出部14で検出された音声が記憶部に登録された音声のいずれかに一致するか否かを判断する。
例えば、話者識別部18は、i-vectorを用いて話者の特徴量を抽出し、話者を識別する(非特許文献1:辻川美沙貴ら、「i-vectorによる短い発話の話者識別の検討」、信学技報、vol.115、no.99、SP2015-12、pp.65-70、2015年6月)。つまり、話者識別部18では、音声は多次元の特徴量ベクトルに変換される。新たに入力された音声も特徴量ベクトルに変換され、登録済みの特徴量ベクトルのいずれかと近いか否かで、入力された音声が客室乗務員の音声であるか否かが判定される。
なお、話者識別部18は、典型的には、プログラムを保持するROM、RAM、プログラムを実行するプロセッサ、及び、周辺回路と接続するための入出力回路等で構成されたシステム回路又はマイクロコンピュータによって、ソフトウェア的に実現される。ただし、これらは、それぞれの処理を実現するASIC、ゲートアレイ等の専用の論理回路によって、ハードウェア的に実現されてもよい。
応答検知部17aは、基本的には実施の形態に係る応答検知部17と同様の機能を有し、本変形例では、話者識別部18によって音声が予め定められた人の音声であると判定され、かつ、頭部動作検知部15によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する。
図5は、本変形例に係るヘッドマウントディスプレイ10aの動作(つまり、ヘッドマウントディスプレイ10aの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、ステップS20が追加されている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
音声検出部14で検出された音声が検出されると(S11でYES)、話者識別部18は、音声検出部14で検出された音声が予め定められた人の音声であるか否かを判定し、その判定結果を応答検知部17aに通知する(S20)。具体的には、話者識別部18は、音声検出部14を介して入力された音声の特徴量ベクトルが、予め登録された客室乗務員らの音声の特徴量ベクトルのいずれかに近いか否かを判定し、その判定結果を応答検知部17aに通知する。
応答検知部17aは、話者識別部18から、入力された音声が予め定められた人(ここでは、客室乗務員)の音声であるとの通知を受けた場合には(S20でYES)、ステップS12以降の処理に進み、そうでない場合には(S20でNO)、処理を終了する。
ステップS12以降において、応答検知部17aは、頭部動作検知部15によって、装着者の頭部が、収音部11が収音する特定の方向を向くような動きが検知された場合に(S13でYES)、装着者が客室乗務員からの話しかけに応答したと判断し、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する(応答検知ステップS14)点は、実施の形態と同様である。
このように、本変形例に係るヘッドマウントディスプレイ10aは、実施の形態の構成に加えて、音声検出部14で検出された音声が予め定められた人の音声であるか否かを判定する話者識別部18を備える。応答検知部17aは、話者識別部18によって音声が予め定められた人の音声であると判定され(S20)、かつ、頭部動作検知部15によって装着者の頭部が特定の方向を向くような動きが検知された場合に(S13)、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する。
これにより、ヘッドマウントディスプレイ10aの装着者が、予め定められた人からの音声に応答する意思を示した場合に、そのことが外部ディスプレイ16に表示される。よって、装着者に飛び込んでくる雑音としての無関係な人からの音声に装着者が応答したと誤認識されることが抑制され、ヘッドマウントディスプレイ10aの応答精度が向上される。
(変形例2)
次に、実施の形態の変形例2に係るヘッドマウントディスプレイについて説明する。
図6は、実施の形態の変形例2に係るヘッドマウントディスプレイ10bの構成を示すブロック図である。ヘッドマウントディスプレイ10bは、音源を探査する機能を有するヘッドマウントディスプレイであり、収音部11a、音声検出部14、頭部動作検知部15、外部ディスプレイ16、応答検知部17、音源探査部19、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10bは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、新たな構成要素として音源探査部19を備える点、及び、変形例に係る収音部11aを備える点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
音源探査部19は、音源を探査する処理部である。具体的には、音源探査部19は、4つのマイク12a~12dを用いて、周囲で発生する音の方向又は位置(3次元空間における座標)を探査する。例えば、音源探査部19は、距離を置いて設置された2つのマイクのそれぞれに同一音が到達する時間差に基づいて、2つのマイクを含む平面における音源方向を特定する。あるいは、音源探査部19は、距離を置いて設置された2つのマイクを対として、異なる方向に並ぶ2対のマイクを用いることで、2つの音源方向の交点を音源の位置として特定する。
なお、音源探査部19は、典型的には、プログラムを保持するROM、RAM、プログラムを実行するプロセッサ、及び、周辺回路と接続するための入出力回路等で構成されたシステム回路又はマイクロコンピュータによって、ソフトウェア的に実現される。ただし、これらは、それぞれの処理を実現するASIC、ゲートアレイ等の専用の論理回路によって、ハードウェア的に実現されてもよい。
収音部11aは、音源探査部19で探査された音源の方向を特定の方向からの音として収音する。具体的には、収音部11aを構成する指向性処理部13aは、4つのマイク12a~12dからの音信号に対して、音源探査部19で探査された音源の方向からの音だけを収音するための信号処理を施すことによって、音源探査部19で探査された音源の方向からの音だけを収音する。信号処理は、例えば、実施の形態の収音部11と同様である。
図7は、本変形例に係るヘッドマウントディスプレイ10bの動作(つまり、ヘッドマウントディスプレイ10bの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、ステップS22が追加されている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
音源探査部19は、指向性処理部13aによる指向性処理(S10)に先立ち、音源を探査する(S22)。例えば、音源探査部19は、4つのマイク12a~12dを用いて、音源の位置(3次元空間における座標)を探査する。なお、音源が探査されなかった場合は(S22でNO)、処理は終了される。
一方、音源が探査された場合は(S22でYES)、収音部11aの指向性処理部13aは、音源探査部19で探査された音源の位置を向く方向を特定の方向からの音として収音する(S10)。具体的には、指向性処理部13aは、4つのマイク12a~12dからの音信号に対して、音源探査部19で探査された音源の方向からの音だけを収音するための信号処理を施すことによって、音源探査部19で探査された音源の方向からの音だけを収音する。以降の処理(S11~)は、実施の形態と同様である。
このように、本変形例に係るヘッドマウントディスプレイ10bは、実施の形態の構成に加えて、音源を探査する音源探査部19を備える。収音部11aは、音源探査部19で探査された音源の方向を特定の方向からの音として収音する。
これにより、音源の方向が音源探査部19で探査されるので、外部の人の音声が特定の方向からの音声に固定される必要がなくなる。つまり、あらゆる方向からの音声に対して装着者が応答した場合にそのことが外部ディスプレイ16に表示され、ヘッドマウントディスプレイ10bの利便性が向上される。
(変形例3)
次に、実施の形態の変形例3に係るヘッドマウントディスプレイについて説明する。
図8は、実施の形態の変形例3に係るヘッドマウントディスプレイ10cの構成を示すブロック図である。ヘッドマウントディスプレイ10cは、映像再生に伴う音に外部の人からの音声を重畳させてヘッドホン35に出力する機能を有するヘッドマウントディスプレイであり、収音部11a、音声検出部14、音源探査部19、音声重畳部20、頭部動作検知部15、外部ディスプレイ16、応答検知部17、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10cは、基本的には実施の形態の変形例2に係るヘッドマウントディスプレイ10bと同様の構成を備えるが、新たな構成要素として音声重畳部20を備える点で、実施の形態の変形例2と異なる。以下、実施の形態の変形例2と異なる点を中心に説明する。
音声重畳部20は、音声検出部14で検出された音声を映像に伴う音に重畳させてヘッドホン35に出力する処理部である。このとき、音声重畳部20は、音声検出部14で検出された音声が特定の方向に対応する方向から聞こえるように音像定位を行ったうえで、映像に伴う音に重畳させる。具体的には、音声重畳部20は、音声検出部14で検出された音声に対して、その音声が立体的に(つまり、音源探査部19で探査された方向から)聞こえるように、音像定位の信号処理を施したうえで、ヘッドホン35の再生チャネルに割り当てて出力する。例えば、音声重畳部20は、人の頭部の形を考慮して(つまり、頭部伝達関数を用いて)、音声検出部14で検出された音声に対して音像定位の信号処理を施すことにより、ヘッドホン35が2chであっても、外部の人の音声が立体的に聞こえるようにする。
なお、本変形例では、ヘッドホン35は、外部の人の音声がヘッドマウントディスプレイ10の装着者に聞こえるので、密閉型のヘッドホンであってもよい。
また、音声重畳部20は、典型的には、プログラムを保持するROM、RAM、プログラムを実行するプロセッサ、及び、周辺回路と接続するための入出力回路等で構成されたシステム回路又はマイクロコンピュータによって、ソフトウェア的に実現される。ただし、これらは、それぞれの処理を実現するASIC、ゲートアレイ等の専用の論理回路によって、ハードウェア的に実現されてもよい。
図9は、本変形例に係るヘッドマウントディスプレイ10cの動作(つまり、ヘッドマウントディスプレイ10cの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態の変形例2に係る図7に示されるフローチャートと同様であるが、ステップS24及びS26が追加されている点で、実施の形態の変形例2と異なる。以下、実施の形態の変形例2と異なる点を中心に説明する。
本変形例では、音声検出部14によって音声が検出されると(S11)、音声重畳部20は、音声検出部14で検出された音声に対して、その音声が音源探査部19で探査された方向から聞こえるように、音像定位の信号処理を施し(S24)、映像再生部30で再生された音に重畳したうえで、ヘッドホン35に出力する(S26)。
以降の処理(S13~)は、実施の形態と同様である。
このように、本変形例に係るヘッドマウントディスプレイ10cは、実施の形態の構成に加えて、音声検出部14で検出された音声を映像に伴う音に重畳させてヘッドホン35に出力する音声重畳部20を備える。
これにより、外部の人(例えば、客室乗務員)の音声が、映像に伴う音に重畳されてヘッドホン35から出力されるので、ヘッドマウントディスプレイ10cの装着者は、再生しているコンテンツの音声を視聴しながら、外部の人の音声も聞くことができる。よって、装着者と外部の人との間で、より円滑なコミュニケーションが可能になる。
また、音声重畳部20は、音声検出部14で検出された音声が特定の方向に対応する方向から聞こえるように音像定位を行ったうえで、映像に伴う音に重畳させる。
これにより、音像定位により、ヘッドマウントディスプレイ10cの装着者は、外部の人(例えば、客室乗務員)の音声が、現実の音源方向、あるいは、それに対応した音源方向から聞こえるので、ヘッドマウントディスプレイ10cを装着していないときと同様に、音声を発した外部の人がいる方向を容易に察知できる。
なお、本変形例では、図9のフローチャートにおいて、頭部動作の検知(S12)の後に、音像定位重畳(S24)及び再生(S26)が行われたが、この順序に限定されない。頭部動作の検知(S12)と、音像定位重畳(S24)及び再生(S26)とは、順序が入れ替わってもよいし、並行して行われてもよい。
(変形例4)
次に、実施の形態の変形例4として、本開示に係るヘッドマウントディスプレイを自動車の遠隔操縦システムに応用した例について説明する。遠隔操縦システムは、遠隔で自動車を操縦するための運転装置と、運転装置と無線通信によって接続され、運転装置によって遠隔操縦される自動車とで構成される。
図10Aは、実施の形態の変形例4に係る遠隔操縦システム40を構成する運転装置41の外観図である。図10Bは、実施の形態の変形例4に係る遠隔操縦システム40を構成する自動車45の外観図である。
図10Aに示されるように、運転装置41は、屋内等に設置され、自動車45の運転席を模擬した装置である。運転装置41は、遠隔で自動車45を操縦するためのハンドル、アクセル、ブレーキ等で構成される。
運転装置41の前面には、実施の形態に係るヘッドマウントディスプレイの内部ディスプレイ34に相当するもの(ここでは、内部ディスプレイ34と記す)が設けられている。本変形例では、この内部ディスプレイ34には、自動車45に設置されて自動車45の前方を撮像するカメラから送られてきた映像が表示される。また、運転装置41には、実施の形態に係るヘッドマウントディスプレイのヘッドホンに相当するスピーカ36が設けられている。本変形例では、スピーカ36は、自動車45の前面に取り付けられたマイク12a~12dで収音された音をマルチスピーカで再生する。
図10Bに示されるように、自動車45は、運転装置41によって遠隔操縦され、無人で走行することができる。自動車45の前面の4箇所には、実施の形態に係るヘッドマウントディスプレイのマイク12a~12dに相当するもの(ここでは、マイク12a~12dと記す)が取り付けられている。また、自動車45のフロントガラスの前面は、実施の形態に係るヘッドマウントディスプレイの外部ディスプレイ16に相当するもの(ここでは、外部ディスプレイ16と記す)が設けられている。
図11は、本変形例に係る遠隔操縦システム40の主要な構成を示すブロック図である。ここでは、遠隔操縦システム40の構成要素のうち、実施の形態に係るヘッドマウントディスプレイを応用した箇所の構成要素だけが示されている。
遠隔操縦システム40は、収音部11a、音声検出部14、音源探査部19、音声重畳部20、頭部動作検知部15、外部ディスプレイ16、応答検知部17、映像再生部30、内部ディスプレイ34、及び、スピーカ36を備える。この構成は、図8に示される実施の形態の変形例3に係るヘッドマウントディスプレイ10cにおけるヘッドホン35をスピーカ36に置き換えたものに相当する。ただし、本変形例では、映像再生部30は、自動車45に設置される上述したカメラである。また、音声検出部14は、図10Bに示される自転車46のブレーキ音等の危険を予知する音として予め登録された車両周囲音を検出する。また、頭部動作検知部15は、運転装置41で操縦する遠隔操縦者の頭に装着される加速度センサ又は遠隔操縦者の頭部の動きを撮影して検出するカメラ等である。また、典型的には、収音部11a、映像再生部30及び外部ディスプレイ16は、自動車45に設けられ、他の構成要素は、運転装置41に設けられるか、あるいは、遠隔操縦者に取り付けられる。
この遠隔操縦システム40は、上述したように、基本的な機能として実施の形態の変形例3に係るヘッドマウントディスプレイ10cと同様の構成を備えるので、実施の形態の変形例3と同様の効果が奏される。つまり、遠隔操縦システム40には、音声検出部14で検出された自転車46のブレーキ音等の車両周囲音を音像定位させることで現実の音源方向に近い方向から危険を予知する音が聞こえるように信号処理をする音声重畳部20が設けられている。よって、遠隔操縦者の頭部が、自転車46のブレーキ音等の車両周囲音の音源方向を向いた場合に、図10Bに示されるように、遠隔操縦者が車両周囲音に気付いた旨が自動車45の外部ディスプレイ16に表示される。
この際、自動車45の外部ディスプレイ16は自転車46の運転者以外も見る。外部ディスプレイ16の表示が、自転車46の運転者に気付いたことを表す表示であることを自転車46の運転者に直感的に示すために、自転車46に近い位置に表示する、または、自転車46の方向に矢印や眼球アイコンを向けて表示する、または、自転車46をカメラで撮影した映像を鏡面表示する、などの表示を行う。
これにより、自転車46の運転者は、自分に接近してきた自動車45が、自分の自転車46のブレーキ音に気付いてくれたことを、目視により、知ることができる。よって、このようなヘッドマウントディスプレイを応用した遠隔操縦システム40によれば、遠隔操縦者と自動車及びその周囲とは距離が離れているにもかかわらず、遠隔操縦者と外部の人(ここでは、自転車46の運転者)との間で、円滑なコミュニケーションが可能になる。
(変形例5)
次に、実施の形態の変形例5に係るヘッドマウントディスプレイについて説明する。
図12は、実施の形態の変形例5に係るヘッドマウントディスプレイ10dの構成を示すブロック図である。ヘッドマウントディスプレイ10dは、ヘッドホンに提供される音の音量を自動で下げる機能を有するヘッドマウントディスプレイであり、収音部11、音声検出部14、頭部動作検知部15、外部ディスプレイ16、応答検知部17b、映像再生部30、内部ディスプレイ34、ヘッドホン35、及び、音増幅器37を備える。
本変形例に係るヘッドマウントディスプレイ10dは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、新たな構成要素として音増幅器37を備える点、及び、変形例に係る応答検知部17bを備える点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
音増幅器37は、映像再生部30から出力された音信号を、応答検知部17bからの制御指示に従って増幅又は減衰させて、ヘッドホン35に出力する音量調整器であり、例えば、可変ゲインアンプで構成される。
応答検知部17bは、基本的には実施の形態に係る応答検知部17と同様の機能を有し、本変形例では、さらに、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示するときに、ヘッドホン35に提供される音の音量を下げるように音増幅器37を制御する。
図13は、本変形例に係るヘッドマウントディスプレイ10dの動作(つまり、ヘッドマウントディスプレイ10dの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、ステップS28が追加されている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
応答検知部17bは、頭部動作検知部15によって、収音部11が収音する特定の方向に装着者の頭部が向くような動きが検知された場合に(S13でYES)、ヘッドホン35に提供される音の音量を下げるように音増幅器37を制御したうえで(S28)、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する(応答検知ステップS14)。
このように、本変形例に係るヘッドマウントディスプレイ10dは、実施の形態の構成に加えて、映像再生部30から出力された音の音量を調整する音増幅器37を備える。応答検知部17bは、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示するときに、ヘッドホン35に提供される音の音量を下げるように音増幅器37を制御する。
これにより、外部の人が装着者に向けて音声を発したときに、ヘッドホン35に提供される音の音量が下がる。よって、ヘッドマウントディスプレイ10dの装着者は、ヘッドマウントディスプレイ10dを装着したまま、外部の人の音声を聞き取ることができる。
(変形例6)
次に、実施の形態の変形例6に係るヘッドマウントディスプレイについて説明する。
図14は、実施の形態の変形例6に係るヘッドマウントディスプレイ10eの構成を示すブロック図である。ヘッドマウントディスプレイ10eは、外部の人だけでなく装着者が発する音声も収音する機能を有するヘッドマウントディスプレイであり、収音部11b、音声検出部14、頭部動作検知部15、外部ディスプレイ16、応答検知部17c、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10eは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、変形例に係る収音部11b及び応答検知部17cを備える点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
収音部11bは、基本的には実施の形態に係る収音部11と同様の機能を有するが、本変形例では、変形例に係る指向性処理部13bを有する。指向性処理部13bは、実施の形態に係る指向性処理部13と同様に、4つのマイク12a~12dからの音信号に対して信号処理を施すことによって特定の方向からの音だけを収音する機能を有するが、本変形例では、さらに、応答検知部17cからの制御指示に従って、装着者が発する音声を収音するように収音する方向を変更する機能を有する。具体的には、指向性処理部13bは、応答検知部17cからの制御指示に従って、信号処理として、4つのマイク12a~12dからの音信号の遅延をずらすことで、予め定められた特定の方向、又は、装着者の方向からの音を強調する遅延型ビームフォーマ等を行う。
応答検知部17cは、基本的には実施の形態に係る応答検知部17と同様の機能を有し、本変形例では、さらに、音声検出部14によって音声が検出され、かつ、頭部動作検知部15によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が発する音声を収音するように、収音部11bに対して収音する方向を変更させる制御をする。
図15は、本変形例に係るヘッドマウントディスプレイ10eの動作(つまり、ヘッドマウントディスプレイ10eの制御方法)を示すフローチャートである。図16は、本変形例に係るヘッドマウントディスプレイ10eの外部ディスプレイ16における表示例を示す図である。
図15に示される動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、外部ディスプレイ16への表示(S30、S33、S35)、及び、収音部11bに対する制御(S31、S32)等が追加されている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
音声検出部14によって音声が検出されると(S11でYES)、応答検知部17cは、図16の(b)の表示例のように、音声検出部14によって音声が検出されたことを示す画像、つまり、客室乗務員がヘッドマウントディスプレイ10eの装着者に呼びかけているときにマイク12a~12dが機能していることを示す画像(ここでは、マイク等を示す画像)を、外部ディスプレイ16に表示する(S30)。これにより、外部ディスプレイ16は、平常時の表示状態(ここでは、図16の(a)に示される無表示)から、マイク12a~12dが機能していることを示す画像の表示(図16の(b))に変化する。よって、客室乗務員は、自分の呼びかけがヘッドマウントディスプレイ10eのマイク12a~12dによって検知されたことを知ることができる。
続いて、収音部11bが収音する特定の方向に装着者の頭部が向くような動きが検知された場合に(S13でYES)、応答検知部17cは、装着者が発する音声を収音するように、収音部11bに対して収音する方向を変更させる制御をする(S31)。その結果、収音部11bは、装着者の音声を収音するように指向性処理を行うことになる(S32)。
そして、応答検知部17cは、図16の(c)の表示例のように、装着者が応答したことを示す画像(ここでは、クエッションマーク)を外部ディスプレイ16に表示する(S33)。これにより、客室乗務員は、自分の呼びかけに対してヘッドマウントディスプレイ10eの装着者が気付いてくれたことを知ることができる。
その後、応答検知部17cは、処理の終了条件が満たされるか否かを判断し(S15)、満たされない場合には(S15でNO)、収音部11b及び音声検出部14を介して、装着者の音声が検出されたか否かを判断し(S34)、装着者の音声が検出されない場合には(S34でNO)、応答表示(S33)と終了判定(S15)とを繰り返す。
一方、装着者の音声が検出された場合には(S34でYES)、応答検知部17cは、図16の(d)の表示例のように、装着者が発話したこと、つまり、装着者が客室乗務員の呼びかけに対して返事をしたことを示す画像(ここでは、エクスクラメーションマーク)を外部ディスプレイ16に表示する(S33)。これにより、客室乗務員は、自分の呼びかけに対してヘッドマウントディスプレイ10eの装着者が返事をしてくれたことを知ることができる。
なお、応答検知部17cは、図16の(d)に示される表示をした後は、客室乗務員からの呼びかけに対してヘッドマウントディスプレイ10eの装着者が返事を返す一連の会話が終了したとみなして、図16の(e)の表示例のように、外部ディスプレイ16を、図16の(a)と同じ平常時の表示状態に戻し、処理を終了する。
このように、本変形例に係るヘッドマウントディスプレイ10eでは、応答検知部17cは、音声検出部14によって音声が検出され、かつ、頭部動作検知部15によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が発する音声を収音するように、収音部11bに対して収音する方向を変更させる制御をする。
これにより、外部の人から音声に対して装着者が顔を向ける応答をした後に、装着者からの音声を収音するように収音方向が変更されるので、続いて装着者が発する音声が収音される。よって、装着者と外部の人との間で、より円滑なコミュニケーションが可能になる。
(変形例7)
次に、実施の形態の変形例7に係るヘッドマウントディスプレイについて説明する。
図17は、実施の形態の変形例7に係るヘッドマウントディスプレイ10fの構成を示すブロック図である。ヘッドマウントディスプレイ10fは、装着者がヘッドマウントディスプレイ10fを装着したまま外部の人と双方の意思を確認し合える程度の円滑なコミュニケーションを図ることを可能にしたヘッドマウントディスプレイであり、収音部11、音声検出部14、身体動作検知部15A、外部ディスプレイ16、応答検知部17、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10fは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、頭部動作検知部15にかえて、新たな構成要素として身体動作検知部15Aを備える点が実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
身体動作検知部15Aは、身体の向きを検知して音声への応答を判断する。身体の向きを検知する手段として、ヘッドマウントディスプレイ10fの装着者に向けたカメラの画像を利用して画像認識する手段や、ヘッドマウントディスプレイ10fの装着者の身体に加速度センサやジャイロセンサを装着する手段がある。また、手にリモコンを持っている場合には、リモコン内に搭載した加速度センサやジャイロセンサを利用できる。身体動作検知部15Aによって身体が特定の方向を向いたことで音声へ応答したことを判断する。
図18は、本変形例に係るヘッドマウントディスプレイ10fの動作(つまり、ヘッドマウントディスプレイ10fの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、ステップS12がS12Aへかわっている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
応答検知部17は、音声検出部14によって音声が検出された場合には(S11でYES)、ステップS12A以降の処理に進み、そうでない場合には(S11でNO)、処理を終了する。
身体動作検知部15Aでは、ヘッドマウントディスプレイ10fの装着者の身体の動きが検知され、検知された結果を示す信号が応答検知部17に出力している(身体動作検知ステップS12A)。
応答検知部17は、身体動作検知部15Aから出力される信号を解析することで、ヘッドマウントディスプレイ10の装着者(ここでは、乗客)が客室乗務員からの話しかけに応答したか否かを判断する(S13)。
具体的には、応答検知部17は、身体動作検知部15Aによって、収音部11が収音する特定の方向に装着者の身体が特定の方向を向いたことが検知された場合に(S13でYES)、装着者が客室乗務員からの話しかけに応答したと判断し、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する(応答検知ステップS14)。
その後、応答検知部17は、処理の終了条件が満たされるか否かを判断し(S15)、満たされるまで、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示し続ける。なお、「処理の終了条件」とは、装着者が音声に応答しなくなることであり、例えば、身体動作検知部15Aによって、装着者の身体が、収音部11が収音する特定の方向を向くような動きが検知されなくなることである。
一方、応答検知部17は、身体動作検知部15Aによって、装着者の身体が、収音部11が収音する特定の方向を向くような動きが検知されなかった場合には(S13でNO)、装着者が客室乗務員からの話しかけに応答しなかったと判断し、処理を終了する。
このように、本実施の形態に係るヘッドマウントディスプレイ10fは、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部11と、収音部11で収音された音から音声を検出する音声検出部14と、ヘッドマウントディスプレイ10の装着者の身体の向きを検知する身体動作検知部15Aと、外部から視認可能な情報を表示する外部ディスプレイ16と、音声検出部14によって音声が検出され、かつ、身体動作検知部15Aによって装着者の身体が特定の方向を向いたことが検知された場合に、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する応答検知部17とを備える。
また、本実施の形態に係るヘッドマウントディスプレイ10の制御方法は、映像を提示するヘッドマウントディスプレイ10の制御方法であって、特定の方向からの音を収音する収音ステップS10と、収音ステップS10で収音された音から音声を検出する音声検出ステップS11と、ヘッドマウントディスプレイ10の装着者の身体の向きを検知する身体動作検知ステップS12Aと、音声検出ステップS11によって音声が検出され、かつ、身体動作検知ステップS12Aによって装着者の身体が前記特定の方向を向いたことが検知された場合に、装着者が音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイ16に表示する応答検知ステップS14とを含む。
これにより、ヘッドマウントディスプレイ10の装着者の身体が、外部の人が発する音声の音源方向に設定された特定の方向を向くことが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイ16に表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイ16に表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
なお、本実施の形態では、図18のフローチャートにおいて、指向性処理(S10)及び音声検出(S11)の後に、身体動作の検知(S12A)が行われたが、このような順序に限定されない。指向性処理(S10)及び音声検出(S11)と、身体動作の検知(S12A)とは、順序が入れ替わってもよいし、並行して行われてもよい。
(変形例8)
次に、実施の形態の変形例8に係るヘッドマウントディスプレイについて説明する。
図19は、実施の形態の変形例8に係るヘッドマウントディスプレイ10gの構成を示すブロック図である。ヘッドマウントディスプレイ10gは、装着者がヘッドマウントディスプレイ10gを装着したまま外部の人と双方の意思を確認し合える程度の円滑なコミュニケーションを図ることを可能にしたヘッドマウントディスプレイであり、収音部11、音声検出部14、手腕動作検知部15B、外部ディスプレイ16、応答検知部17、映像再生部30、内部ディスプレイ34、及び、ヘッドホン35を備える。
本変形例に係るヘッドマウントディスプレイ10gは、基本的には実施の形態に係るヘッドマウントディスプレイ10と同様の構成を備えるが、頭部動作検知部15にかえて、新たな構成要素として手腕動作検知部15Bを備える点が実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
手腕動作検知部15Bは、手又は腕の動きを検知して音声への応答を判断する。手又は腕の動きを検知する手段として、ヘッドマウントディスプレイ10gの装着者に向けたカメラの画像を利用して画像認識する手段や、ヘッドマウントディスプレイ10gの装着者の身体に加速度センサやジャイロセンサを装着する手段がある。また、手にリモコンを持っている場合には、リモコン内に搭載した加速度センサやジャイロセンサを利用できる。手腕動作検知部15Bによって手又は腕の所定の動き(例えば上に手を挙げるなど)をすることで音声へ応答したことを判断する。
図20は、本変形例に係るヘッドマウントディスプレイ10gの動作(つまり、ヘッドマウントディスプレイ10gの制御方法)を示すフローチャートである。この動作は、基本的には実施の形態に係る図3に示されるフローチャートと同様であるが、ステップS12がS12Bへかわっている点で、実施の形態と異なる。以下、実施の形態と異なる点を中心に説明する。
応答検知部17は、音声検出部14によって音声が検出された場合には(S11でYES)、ステップS12B以降の処理に進み、そうでない場合には(S11でNO)、処理を終了する。
手腕動作検知部15Bでは、ヘッドマウントディスプレイ10gの装着者の手腕の動きが検知され、検知された結果を示す信号が応答検知部17に出力している(手腕動作検知ステップS12B)。
応答検知部17は、手腕動作検知部15Bから出力される信号を解析することで、ヘッドマウントディスプレイ10の装着者(ここでは、乗客)が客室乗務員からの話しかけに応答したか否かを判断する(S13)。
具体的には、応答検知部17は、手腕動作検知部15Bによって、収音部11が収音する特定の方向に装着者の手又は腕の所定の動きが検知された場合に(S13でYES)、装着者が客室乗務員からの話しかけに応答したと判断し、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する(応答検知ステップS14)。
その後、応答検知部17は、処理の終了条件が満たされるか否かを判断し(S15)、満たされるまで、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示し続ける。なお、「処理の終了条件」とは、装着者が音声に応答しなくなることであり、例えば、手腕動作検知部15Bによって、装着者の手又は腕の所定の動きが検知されなくなることである。
一方、応答検知部17は、手腕動作検知部15Bによって、装着者の手又は腕の所定の動きが検知されなかった場合には(S13でNO)、装着者が客室乗務員からの話しかけに応答しなかったと判断し、処理を終了する。
このように、本実施の形態に係るヘッドマウントディスプレイ10gは、映像を提示するヘッドマウントディスプレイであって、特定の方向からの音を収音する収音部11と、収音部11で収音された音から音声を検出する音声検出部14と、ヘッドマウントディスプレイ10の装着者の手又は腕の動きを検知する手腕動作検知部15Bと、外部から視認可能な情報を表示する外部ディスプレイ16と、音声検出部14によって音声が検出され、かつ、手腕動作検知部15Bによって装着者の手又は腕の所定の動きが検知された場合に、装着者が音声に応答したことを示す情報を外部ディスプレイ16に表示する応答検知部17とを備える。
また、本実施の形態に係るヘッドマウントディスプレイ10の制御方法は、映像を提示するヘッドマウントディスプレイ10の制御方法であって、特定の方向からの音を収音する収音ステップS10と、収音ステップS10で収音された音から音声を検出する音声検出ステップS11と、ヘッドマウントディスプレイ10の装着者の手又は腕の動きを検知する手腕動作検知ステップS12Bと、音声検出ステップS11によって音声が検出され、かつ、手腕動作検知ステップS12Bによって装着者の手又は腕の所定の動きが検知された場合に、装着者が音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイ16に表示する応答検知ステップS14とを含む。
これにより、ヘッドマウントディスプレイ10の装着者の身体が、外部の人が発する音声の音源方向に設定された特定の方向を向くことが検知された場合に、装着者が音声に応答したことを示す情報が外部ディスプレイ16に表示される。よって、装着者が、外部の人の音声に応答する意思を示した場合に、そのことが外部ディスプレイ16に表示されるので、装着者と外部の人とが双方の意思を確認し合える程度の円滑なコミュニケーションが可能になる。
なお、本実施の形態では、図20のフローチャートにおいて、指向性処理(S10)及び音声検出(S11)の後に、手腕動作の検知(S12B)が行われたが、このような順序に限定されない。指向性処理(S10)及び音声検出(S11)と、手腕動作の検知(S12B)とは、順序が入れ替わってもよいし、並行して行われてもよい。
以上、本開示に係るヘッドマウントディスプレイ及びその制御方法について、実施の形態及び変形例に基づいて説明したが、本開示は、これらの実施の形態及び変形例に限定されるものではない。本開示の主旨を逸脱しない限り、当業者が思いつく各種変形を実施の形態及び変形例に施したものや、実施の形態及び変形例における一部の構成要素を組み合わせて構築される別の形態も、本開示の範囲内に含まれる。
例えば、実施の形態の変形例1に係るヘッドマウントディスプレイ10aに対して、変形例2に係る音源探査部19、変形例3に係る音声重畳部20、変形例5に係る音増幅器37を追加し、応答検知部が、これらの変形例に係る機能を備えてもよい。これにより、各変形例に係る効果を奏する高機能なヘッドマウントディスプレイが実現される。
また、実施の形態及び変形例において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリ等の記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、実施の形態及び変形例に係るヘッドマウントディスプレイ等を実現するソフトウェアは、次のようなプログラムである。
すなわち、このプログラムは、コンピュータに、映像を提示するヘッドマウントディスプレイの制御方法を実行させるものである。その制御方法は、映像を提示するヘッドマウントディスプレイ10の制御方法であって、特定の方向からの音を収音する収音ステップS10と、収音ステップS10で収音された音から音声を検出する音声検出ステップS11と、ヘッドマウントディスプレイ10の装着者の頭部の動きを検知する頭部動作検知ステップS12と、音声検出ステップS11によって音声が検出され、かつ、頭部動作検知ステップS12によって装着者の頭部が特定の方向を向くような動きが検知された場合に、装着者が音声に応答したことを示す情報を、外部から視認可能な情報を表示する外部ディスプレイ16に表示する応答検知ステップS14とを含む。
また、このプログラムは、ヘッドマウントディスプレイ10の装着者の頭部の動きを検知する頭部動作検知ステップS12にかえて、ヘッドマウントディスプレイ10fの装着者の身体の向きを検知する身体動作検知ステップS12A、または、ヘッドマウントディスプレイ10gの装着者の手又は腕の所定の動きを検知する手腕動作検知ステップS12Bを利用してもよい。