JP2021131423A - 音声再生装置、音声再生方法および音声再生プログラム - Google Patents

音声再生装置、音声再生方法および音声再生プログラム Download PDF

Info

Publication number
JP2021131423A
JP2021131423A JP2020025529A JP2020025529A JP2021131423A JP 2021131423 A JP2021131423 A JP 2021131423A JP 2020025529 A JP2020025529 A JP 2020025529A JP 2020025529 A JP2020025529 A JP 2020025529A JP 2021131423 A JP2021131423 A JP 2021131423A
Authority
JP
Japan
Prior art keywords
sound
user
hear
voice
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020025529A
Other languages
English (en)
Inventor
光希 有田
Mitsuki Arita
光希 有田
幸生 多田
Yukio Tada
幸生 多田
和也 粂原
Kazuya Kumehara
和也 粂原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2020025529A priority Critical patent/JP2021131423A/ja
Priority to US17/175,369 priority patent/US11322129B2/en
Publication of JP2021131423A publication Critical patent/JP2021131423A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17827Desired external signals, e.g. pass-through audio such as music or speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17823Reference signals, e.g. ambient acoustic environment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1783Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions
    • G10K11/17837Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions by retaining part of the ambient acoustic environment, e.g. speech or alarm signals that the user needs to hear
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17873General system configurations using a reference signal without an error signal, e.g. pure feedforward
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17885General system configurations additionally using a desired external signal, e.g. pass-through audio such as music or speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/108Communication systems, e.g. where useful sound is kept and noise is cancelled
    • G10K2210/1081Earphones, e.g. for telephones, ear protectors or headsets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3011Single acoustic input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3014Adaptive noise equalizers [ANE], i.e. where part of the unwanted sound is retained
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3027Feedforward
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3036Modes, e.g. vibrational or spatial modes

Landscapes

  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Navigation (AREA)
  • Headphones And Earphones (AREA)
  • Stereophonic System (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】ユーザに対する外部音の出力をオン/オフすることができる音響デバイスを用い、外部音を適宜ユーザに対して出力することにより、環境音をユーザに体験させる。【解決手段】ユーザに到来する外部音を収音するマイクを備える。外部音をスピーカに供給するヒアスルー処理、および、外部音をキャンセルするキャンセル音を生成してスピーカに供給するノイズキャンセル処理を実行する信号処理部を備える。記憶部は、ヒアスルー処理およびノイズキャンセル処理の機能レベルを指定する制御情報、および、トリガ情報を含むイベント情報を記憶する。制御部は、トリガの発生を検出したとき、このトリガで実行を指示されたイベント情報の制御情報を読み出して信号処理部に出力する。【選択図】図5

Description

この発明の一実施形態は、ユーザに対する外部音の出力をオン/オフすることができる音響デバイスを用いた音声再生装置に関する。
ユーザに、音響による拡張現実(AR:Augmented Reality)を体験させるARシステムが提案されている(たとえば特許文献1)。音響によるARシステムは、ユーザにヘッドホン、またはイヤホンなどの音響デバイスを装用させ、ユーザが滞在している場所に応じた音声を音響デバイスから放音する。特許文献1に記載の情報処理装置は、たとえばコンテンツツーリズムに適用される。特許文献1に記載の情報処理装置は、アニメーションなどのコンテンツに関係する場所で、ユーザの位置に応じて所定のポイントへユーザを誘導する音声をキャラクタの声で出力する。
特開2017−103598号公報
コンテンツツーリズムの場合、ARシステムは、コンテンツに関係する場所で、アニメーション、映画またはドラマなどのコンテンツを再現する。一方、ARシステムは、コンテンツを再現することだけでなく、ユーザに、コンテンツに関係する場所の環境音を体験させることも重要である。しかし、上記従来のARシステムでは、ユーザに対して再生する音声は、キャラクタの声などコンテンツに関する音声のみである。このため、上記従来のARシステムではコンテンツの再現は可能であっても、ARシステムを通じてコンテンツに関係する場所の環境音を体験させることができなかった。
この発明の一実施形態に係る目的の一つは、外部音を適宜ユーザに対して出力することにより、環境音をユーザに体験させることのできる音声再生装置を提供することにある。
本発明の一実施形態に係る音声再生装置は、スピーカ、マイク、信号処理部、記憶部および制御部を備える。スピーカは、ユーザに装用され、ユーザの耳に向けて音声を放音する。マイクは、ユーザに到来する外部音を収音する。信号処理部は、外部音をスピーカに供給するヒアスルー処理、および、外部音をキャンセルするキャンセル音を生成してスピーカに供給するノイズキャンセル処理を実行する。記憶部は、ヒアスルー処理およびノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、イベント実行を指示する事象であるトリガの情報を含むイベント情報を記憶する。制御部は、トリガの発生を検出したとき、このトリガで実行を指示されたイベント情報の制御情報を読み出して信号処理部に出力する。
実施形態に係る音声再生方法は、ユーザに装用されるスピーカで、ユーザの耳に向けて音声を放音することと、ユーザに到来する外部音をマイクで収音することと、外部音をスピーカに供給するヒアスルー処理、および、外部音をキャンセルするキャンセル音を生成してスピーカに供給するノイズキャンセル処理を信号処理部で実行することと、ヒアスルー処理およびノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、イベント実行を指示する事象であるトリガの情報を含むイベント情報を記憶部に記憶することと、トリガ情報に対応するトリガの発生を検出したとき、このトリガに対応するトリガ情報で実行を指示されたイベント情報の制御情報を読み出して信号処理部に出力することと、を備えたことを特徴とする。
実施形態に係る音声再生プログラムは、ユーザに装用され、前記ユーザの耳に向けて音声を放音するスピーカと、前記ユーザに到来する外部音を収音するマイクと、を備え、前記外部音を前記スピーカに供給するヒアスルー処理、および、前記外部音をキャンセルするキャンセル音を生成して前記スピーカに供給するノイズキャンセル処理を実行する音響デバイスが接続される携帯端末装置の制御部を、前記ヒアスルー処理および前記ノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、前記制御情報に基づく制御の実行を指示する事象であるトリガの情報を含むイベント情報を記憶する第1手段、および、前記トリガの発生を検出したとき、該トリガで実行を指示された制御情報を読み出して前記音響デバイスに出力する第2手段、として機能させることを特徴とする。
この発明の一実施形態によれば、外部音を適宜ユーザに対して出力することができるため、ユーザがいる場所の環境音をユーザに体験させることができる。
図1は、この発明の実施形態である音声再生システムの構成を示す図である。 図2は、音声再生システムの携帯端末装置のブロック図である。 図3は、音声再生システムのヘッドホンのブロック図である。 図4は、音声再生システムがユーザを案内する公園の地図を示す図である。 図5は、音声再生システムが公園を案内する場合のシナリオの例を示す図である。 図6は、音声再生システムのシナリオ進行処理を示すフローチャートである。
本発明の一実施形態に係る音声再生装置は、スピーカ、マイク、信号処理部、記憶部および制御部を備える。スピーカは、ユーザに装用され、ユーザの耳に向けて音声を放音する。マイクは、ユーザに到来する外部音を収音する。信号処理部は、外部音をスピーカに供給するヒアスルー処理、および、外部音をキャンセルするキャンセル音を生成してスピーカに供給するノイズキャンセル処理を実行する。記憶部は、ヒアスルー処理およびノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、イベント実行を指示する事象であるトリガ情報を含むイベント情報を記憶する。制御部は、トリガの発生を検出したとき、このトリガで実行を指示されたイベント情報の制御情報を読み出して信号処理部に出力する。
制御情報は、信号処理部を、ノイズキャンセルモード、ヒアスルーモード、および、中間モードのいずれかに制御する情報を含んでいてもよい。ノイズキャンセルモードは、ノイズキャンセル処理を100パーセントで機能させ、かつ、ヒアスルー処理を機能させないモードである。ヒアスルーモードは、ノイズキャンセル処理を機能させず、かつ、ヒアスルー処理を100パーセントで機能させるモードである。中間モードは、ノイズキャンセル処理を100パーセント未満で機能させ、かつ、ヒアスルー処理を100パーセント未満で機能させるモードである。
信号処理部は、ノイズキャンセル処理またはヒアスルー処理の機能レベルを切り換えるとき、その機能レベルを徐々に変化させるフェード処理で切り換えてもよい。
制御情報は、ヒアスルー処理によりスピーカに供給される外部音に対して、音質の調整を指示する情報を含んでいてもよい。この場合、信号処理部は、外部音に対する音質の調整を指示する制御情報を受信したとき、外部音に対して音質を調整する処理を行う。
上記音声再生装置が、音声データを再生し、この音声を内部音声として信号処理部に出力する音声生成部をさらに備えてもよい。この場合、記憶部は、音声データを含むイベント情報を記憶している。制御部は、トリガの発生を検出したとき、このトリガで実行を指示されたイベント情報の制御情報を読み出して信号処理部に出力するとともに、このイベント情報の音声データを音声生成部に出力して再生させる。信号処理部は、入力された内部音声を、外部音および/またはキャンセル音とミキシングしてスピーカに供給する。内部音声にミキシングされる音声は、ノイズキャンセルモード時はキャンセル音のみ、ヒアスルーモード時は外部音のみ、中間モード時は外部音およびキャンセル音の両方である。
記憶部は、アニメーション、映画またはドラマにゆかりの場所を案内するためのシナリオとして編集された複数のイベント情報を記憶していてもよい。
図1は、本発明が適用される音声再生システム1の構成を示す図である。音声再生システム1は、携帯端末装置10、および、音響デバイスであるヘッドホン20を含む。図2は、音声再生システム1の携帯端末装置10のブロック図である。図3は、音声再生システム1のヘッドホン20のブロック図である。
図1は、ユーザLが、携帯端末装置10を手に持ち、ヘッドホン20を装用した例を示している。携帯端末装置10は、例えば、スマートホン(多機能携帯電話)が用いられる。携帯端末装置10とヘッドホン20とは、Bluetooth(登録商標)で接続されており、相互に通信可能である。携帯端末装置10とヘッドホン20との接続は、Bluetoothに限定されず、他の無線通信規格または有線でもよい。携帯端末装置10は、携帯電話通信網またはWi−Fi(登録商標)を介してサーバ2と通信する。
ヘッドホン20は、ハウジング21L、ハウジング21R、およびヘッドバンド22を備える。左右のハウジング21L、21Rは、ヘッドバンド22でつながれた形状をしている。ヘッドホン20は、いわゆる耳掛け型である。左右のハウジング21R,21Lには、それぞれ左右のスピーカ23L、23Rが設けられている。ヘッドホン20は、ヘッドバンド22に3軸のジャイロセンサ25を有する。ジャイロセンサ25は、コリオリ力により、ユーザLの頭部の前後の傾き、左右の傾き、および、水平回転の角度を検出する。ヘッドホン20は、ジャイロセンサ25により、ユーザLの頭部の向きをトラッキングする。なお、音響デバイスとして、左右のスピーカ23L、23Rがヘッドバンド22でつながれていないイヤホンが用いられてもよい。この場合、ジャイロセンサ25は、左右のスピーカ23L、23R付近または別の場所に設けられればよい。
ヘッドホン20は、アクティブノイズキャンセル(ANC)処理、および、ヒアスルー(HT)処理を実行する機能を備えている。アクティブノイズキャンセルとは、外部音(環境音)がハウジング21L、21Rを透過してユーザLの耳に到達する音であるリーク音をキャンセルしてユーザLに静かな音響環境を提供する処理である。具体的には、ヘッドホン20は、以下の処理を行う。外部マイク26L、26Rが外部音を収音し、収音信号を得る。ヘッドホン信号処理部24が、ハウジング21L、21Rのリーク特性を表す伝達関数で収音信号をフィルタリングしてリーク音の波形を得る。ヘッドホン信号処理部24が、このリーク音の逆相信号であるキャンセル音を生成して、左右のスピーカ23L、23Rから放音する。これにより、リーク音がキャンセルされる。
ヒアスルーとは、ユーザLに対して、ヘッドホン20をしていないような音響環境を提供する処理である。具体的には、ヘッドホン20は、以下のような処理を行う。外部マイク26L、26Rが外部音を収音して収音信号を得る。ヘッドホン信号処理部24が、収音信号をフィルタリングしてユーザLが外部音を直接聴いた場合と同じような音質になるように調整する。ヘッドホン信号処理部24は、この調整された収音信号を左右のスピーカ23L、23Rから放音する。空気振動として直接聴こえてくる外部音と、外部音と同じ波形の信号がスピーカ23L、23Rから放音された音声とは、ユーザLにとって異なる音質の音である。ヘッドホン信号処理部24は、収音信号をそのままスピーカ23L、23Rから放音せず、収音信号と実際の外部音との音質の違いを補正するフィルタ係数でフィルタリングを行う。これにより、ユーザLは、外部音を、ヘッドホン20を介さずに直接聞いているような感覚になる。
ヘッドホン20は、携帯端末装置10から送られてくる外部音制御コマンドにしたがってアクティブノイズキャンセルおよびヒアスルーの機能レベルを調整する。
携帯端末装置10は、記憶部101に記憶されている音声データを再生する。携帯端末装置10は、再生した音声が所定の位置から聴こえてくるように定位制御する。この定位制御は、頭部伝達関数を用いて行われる。頭部伝達関数とは、以下のような関数である。音源位置からユーザの両耳に到来する音声は、ユーザLの頭部形状や耳介形状などの影響を受けて、到来方向に応じた特有の周波数特性となる。ユーザLは、この特有の周波数特性を聴き分けて、音声の到来方向を判断している。頭部伝達関数とは、音源位置からユーザLの両耳の外耳道までの音声の伝達関数である。携帯端末装置10が、頭部伝達関数(頭部インパルス応答)を用いて音声をフィルタリングする。これにより、ユーザLは、ヘッドホン20で音声を聴いた場合に、該音声が所定の方向から聞こえてきたかのような感覚を持つことができる。
音声再生システム1は、例えば、コンテンツツーリズムに用いられる。コンテンツツーリズムとは、アニメーション、映画またはドラマなど(以下、アニメーション等)の舞台となった場所など、アニメーション等に関係する場所をめぐる小旅行である。音声再生システム1は、コンテンツツーリズムにおいて、舞台となった場所を案内する音声、および、アニメーション等の一場面の音声などを再生する。コンテンツツーリズムに使用されるデータであるコンテンツデータ72は、携帯端末装置10の記憶部101に記憶されている。音声再生システム1は、コンテンツデータ72に基づいて、場所やタイミングに合わせた音声の再生、音像定位の制御、および、外部音制御(アクティブノイズキャンセルおよびヒアスルー)の切り換えを行う。
図2は、携帯端末装置10のブロック図である。携帯端末装置10は、ハードウェア的には、制御部100、記憶部101、信号処理部102、広域通信部103、デバイス通信部104、および、測位部105などを備えたスマートホンである。制御部100は、CPU,ROMおよびRAMを内蔵したマイクロコンピュータを含んでいる。記憶部101は、不揮発メモリであるフラッシュメモリを備えている。
記憶部101には、プログラム70、フィルタ係数71、およびコンテンツデータ72が記憶されている。プログラム70は、携帯端末装置10およびヘッドホン20を音声再生システム1として機能させるアプリケーションプログラムである。フィルタ係数71は、音声をユーザLに対して所定の方向に定位させるための頭部伝達関数を時間軸に展開した頭部インパルス応答であり、FIRフィルタの係数として用いられる。コンテンツデータ72は、音声再生システム1を上述のコンテンツツーリズムで使用する場合に必要なデータセットである。
コンテンツデータ72は、シナリオファイル721、地図データ722および音声データセット723を含んでいる。地図データ722は、例えば図4に示すようなアニメーション等の舞台となった場所の通路やオブジェクトを座標値で記憶したデータである。シナリオファイル721は、ユーザLが地図データ722の場所を訪れたとき、どの場所でまたはどのタイミングに、どの音声データを再生するか、および、どのような外部音制御を行うかなどを記憶したファイルである。シナリオファイル721は、たとえば図5に示すような構成である。音声データセット723は、コンテンツツーリズムにおいて、再生される複数の音声データを含んでいる。音声データセット723には、コンテンツツーリズムの場所を解説する音声、および、この場所を舞台としたアニメーション等で出演者(キャラクタ)が喋ったセリフなどの音声が含まれる。
制御部100は、プログラム70との協働により、頭部方向決定部111、位置決定部112、および、音声生成部113として機能する。
頭部方向決定部111は、ユーザLの頭部の方向を決定する。ユーザLの頭部の方向とは、たとえば図4に示す地図上でユーザがどの方向を向いているかを示す情報である。頭部方向決定部111は、ヘッドホン20のジャイロセンサ25からユーザLの頭部の角速度情報を取得する。頭部方向決定部111は、取得した角速度情報を積算してユーザLの頭部の回転角を算出し、この回転角を初期頭部方向に加算して現在の頭部方向を決定する。ユーザLの初期頭部方向を予め測定する処理は、キャリブレーションと呼ばれる。頭部方向決定部111は、ユーザLが公園500の入口である地点P1に立ったとき、ユーザLは経路R1方向を向いているとして、経路R1方向を初期頭部方向とする。制御部100は、決定された現在の頭部方向に基づき、再生された音声をどの方向に定位させるかを決定する。
位置決定部112は、測位部105から測位情報を取得する。位置決定部112は、この測位情報に基づき、たとえば図4に示す地図上でユーザLがどこにいるかを決定する。
音声生成部113は、音声データセット723の音声データに基づき音声を生成する。音声生成部113は、音声データがPCMなどの波形データの場合、この波形データを再生する。音声生成部113は、音声データがMIDIなどの音声合成情報の場合は、ソフトシンセサイザを構成して音声を合成する。音声生成部113で生成され、ヘッドホン20に送信される音声は内部音声と呼ばれる。音声生成部113は、制御部100とは別のたとえばDSPなどのハードウェアで構成されてもよい。この場合、音声生成部113と後述の信号処理部102とが、ハードウェアを共有してもよい。
信号処理部102は、DSPで構成される。信号処理部102は、位置決定部112が決定したユーザLの位置、および頭部方向決定部111が決定したユーザLの頭部の方向に基づき、再生された音声が目的の位置に定位されるようフィルタリングを行う。フィルタリングに用いられるフィルタは、頭部インパルス応答をフィルタ係数とするFIRフィルタである。また、信号処理部102は、再生された音声の音質を調整するフィルタリングを行ってもよい。
広域通信部103は、LTE、5Gなどの携帯電話通信網を介して遠隔の機器と通信する。具体的には、広域通信部103は、サーバ2と通信する。サーバ2は、複数のコンテンツデータ72を記憶している。携帯端末装置10は、サーバ2にアクセスして、コンテンツツーリズムで使用するコンテンツデータ72をダウンロードする。また、グループ(複数のユーザL)が、同じ場所を巡る場合、各ユーザLの携帯端末装置10が、サーバ2を介して相互に位置を確認してもよい。なお、携帯端末装置10が、Wi−Fiを使用可能なエリアで使用される場合、サーバ2との通信はWi−Fi経由であってもよい。
デバイス通信部104は、ヘッドホン20と通信する通信回路である。ヘッドホン20(ヘッドホン通信部27)は、Bluetooth、またはWi−Fiダイレクトなどの通信機能を備えている。デバイス通信部104は、ヘッドホン20と同じ通信機能を備えていればよい。
測位部105は、GPS(グローバル・ポジショニング・システム)のGPS信号(PNコード)を受信して自身の位置を測定する。測位部105は、測定した位置データを、位置決定部112に供給する。測位部105は、GPS以外の他のシステムを用いて、または、GPSおよび他のシステムを用いて、位置を測定してもよい。他のシステムとは、たとえば、準天頂衛星みちびき、または、北斗衛星測位システムBeiDouなどである。
図3のブロック図を参照して、ヘッドホン20の構成を説明する。ヘッドホン20は、図1に示したように、左右のハウジング21L、21Rをアーチ型のヘッドバンド22で接続したものである。左ハウジング21Lには、スピーカ23L、外部マイク26L、ヘッドホン信号処理部24およびヘッドホン通信部27が設けられている。右ハウジング21Rには、スピーカ23R、および外部マイク26Rが設けられている。ヘッドバンド22には、ジャイロセンサ25が設けられている。
外部マイク26L、26Rは、それぞれ左右のハウジング21L、21Rの外側に設けられている。外部マイク26L、26Rは、ユーザLがヘッドホン20を装用していなかったならば、ユーザLの左右の耳に到達したであろう環境音(外部音)を収音する。スピーカ23L、23Rは、それぞれ左右のハウジング21L、21Rの内側にユーザLの外耳道に対向するように設けられている。
ヘッドホン通信部27は、上述のBluetooth、Wi−Fiダイレクトなどの通信方式で携帯端末装置10(デバイス通信部104)と通信する。ヘッドホン通信部27は、携帯端末装置10から、再生された音声信号、または外部音制御コマンドなどを受信する。また、ヘッドホン通信部27は、携帯端末装置10に対して、ジャイロセンサ25の検出値などを送信する。
ヘッドホン信号処理部24は、DSPなどのデジタル処理回路を含み、スピーカ23L、23Rに供給する音声信号に対して、上述したような信号処理を施す。信号処理は、アクティブノイズキャンセル処理、ヒアスルー処理、およびヒアスルー音の加工(詳細後述)を含む。信号処理は、ヒアスルー音またはキャンセル音と携帯端末装置10から受信した音声信号とのミキシングも含む。本発明の信号処理部は、携帯端末装置10の信号処理部102、および、ヘッドホン信号処理部24の両方に対応している。
図4は、地図データ722に基づいて描かれた地図の例を示す図である。この地図は、アニメーション等の舞台となった場所である公園500を示す地図である。この公園500が、コンテンツツーリズムの目的地である。この地図において、図に示したY方向が北であり、X方向が東である。
図5は、シナリオファイル721の例を示す図である。シナリオファイル721は、複数のイベント情報を含む。各イベント情報は、トリガ情報、および、このイベントで実行される処理情報を含む。処理情報は、外部音制御の態様、再生すべき音声データ、および、定位位置の全部または一部である。トリガ情報は、イベント情報の処理(イベント)をいつ実行するかのタイミング(トリガ)を示す情報である。トリガは、たとえば、所定の地点にユーザが到達したこと、所定の経路をユーザが移動していること、所定の時間ある場所に滞在したことなどである。制御部100は、トリガを検出すると、そのトリガに対応するイベント情報に基づいて、イベントを実行する。ユーザLが、公園500を訪れて公園500内を移動した場合、音声再生システム1は、ユーザLの移動場所などに合わせて、イベントを実行する。音声再生システム1は、音声データを再生し、かつ、外部音制御を行う。以下の説明では、シナリオファイル721をシナリオ721と呼ぶ場合がある。
図4の地図は、公園500の一部を示している。この公園500は、アニメーションの舞台となった場所である。公園500には、野外ステージ502および池504が設けられている。アニメーションには、複数のキャラクタ(アニメーションの登場人物)が、野外ステージ502、および、池504のそれぞれで映画を撮影する場面がある。ユーザLは、音声によるルート案内にしたがって公園500を巡る。
ユーザLは、地点P1から公園500に入り、経路R1−R4を経て公園500を出る。経路R1−R4は、それぞれ、地点P1−P4で接続されている。地点P4で、経路が分岐している。地点P4で出題されるクイズにユーザLが正解すると、経路R4が案内され、ユーザがクイズに誤答すると、経路R5が案内される。ユーザLが、地点P1−P4に到達するごとに、および、経路R1−R5を通過するごとに、音声再生システム1は、シナリオ721に基づき、それぞれの地点および経路に合わせた音声を再生し、外部音制御を切り換える。
ユーザLが、公園500の南西角の入口である地点P1に到達すると、音声再生システム1が、経路R1をP2方向へ進むようにルート案内の音声を再生する。頭部方向決定部111は、経路R1の方向を初期頭部方向として記憶する。このとき、音声再生システム1は、アクティブノイズキャンセル処理およびヒアスルー処理を、それぞれ50%の機能レベルで機能させる。50%のアクティブノイズキャンセル処理とは、たとえばハウジング21L、21Rを透過してくるリーク音を1/2のレベルまで低下させる処理である。具体的には、50%のアクティブノイズキャンセル処理とは、キャンセル信号をリーク音の1/2のレベルで出力して、リーク音を1/2だけキャンセルする処理である。50%のヒアスルー処理とは、外部マイク26L、26Rで収音した外部音を、ユーザが(ヘッドホン20無しで)直接聴取した場合の1/2のレベルでスピーカ23L、23Rから放音する機能である。音声再生システム1は、ルート案内の再生時、アクティブノイズキャンセルおよびヒアスルーを併用することで、ユーザLにその場所の外部音を聴かせて臨場感を与えつつ、案内音声を聴き取りやすくする。なお、アクティブノイズキャンセルおよびヒアスルーの併用の割合は、50%と50%に限定されない。また、両者の割合の合計が100%にならなくても良い。たとえば、アクティブノイズキャンセルを全く機能させないで(0%)、ヒアスルーを50%だけ機能させることも可能である。アクティブノイズキャンセルおよびヒアスルーをそれぞれ100%未満の機能レベルで機能させる外部音制御モードは、中間モードと呼ばれる。
信号処理部102は、ルート案内の音声を、ユーザLの側方(たとえば、頭部方向に対して左90度に1メートル離れた位置)に定位するよう定位制御する。このように、信号処理部102は、ルート案内を、公園500内の固定された場所ではなく、ユーザLに対する相対的な位置に定位するよう制御する。これにより、ユーザLは、ユーザLに付き添っているガイドが話しているような聴感でルート案内を聞くことができる。
ユーザLは、ルート案内に従い、経路R1に沿って公園500に入る。経路R1では、音声再生システム1は、この公園500の解説音声とこの公園500を舞台にしたアニメーションの解説音声を再生する。これらの解説音声の再生時、音声再生システム1は、アクティブノイズキャンセル0%、ヒアスルー70%の機能レベルで機能させ、公園500にいるという臨場感をルート案内時よりも高くする。解説音声の定位位置は、ルート案内時と同様にユーザLの左横1メートルである。
経路R1は、公園500の入口の地点P1から、公園500内の野外ステージ502の客席後方に位置する地点P2までの経路である。ユーザLが経路R1を歩いて地点P2に到着すると、音声再生システム1が、経路R2を地点P3(野外ステージ502)方向へ進むようにルート案内の音声を再生する。このルート案内の再生時、音声再生システム1は、アクティブノイズキャンセルおよびヒアスルーを、それぞれ50%の機能レベルで機能させる。ルート案内の定位位置は、たとえばユーザLの左横1メートルである。
経路R2は、野外ステージ502の客席の後方から野外ステージ502方向に移動する経路である。ユーザLが、経路R2を歩き始めると、音声再生システム1が、アニメーションの音声を、野外ステージ502方向に定位するように再生する。アニメーションの音声とは、たとえばアニメーションの場面を音声で再現したものであり、キャラクタのセリフやBGM(バックグラウンドミュージック)などからなる。アニメーションの音声の再生時、音声再生システム1は、ヒアスルーを100%の機能レベルで機能させ、アクティブノイズキャンセルを機能させない。すなわち、音声再生システム1は、ユーザLに対して、アニメーションの音声を公園500の外部音(環境音)の中で聴かせる。音声再生システム1は、アニメーションの音声を、野外ステージ502上でのキャラクタの配置に合わせて定位制御する。これにより、ユーザLは、目の前の野外ステージ502でアニメーションの場面が演じられているのを鑑賞しているような没入感を得ることができる。ヒアスルーを100%の機能レベルで機能させ、アクティブノイズキャンセルを機能させない外部音制御モードは、ヒアスルーモードと呼ばれる。
ユーザLは、このアニメーションの音声を聴ききながら経路R2を地点P3まで歩く。地点P3は、野外ステージ502の上であり、再生中のアニメーションが演じられている場所である。ユーザLが、地点P3に到着したのち、所定時間(例えば1分)この地点P3に滞在すると、音声再生システム1は、再生中のアニメーションの音声の定位制御および外部音制御を変更する。アニメーションの音声には複数のキャラクタのセリフが含まれている。音声再生システム1は、そのうちの1つのキャラクタ(以下、キャラクタAと呼ぶ)のセリフをユーザLの頭部に定位させる。ユーザLは、自分の頭部でキャラクタAのセリフが再生されるため、自分自身がキャラクタAになったような没入感が得られる。音声再生システム1は、他のキャラクタ(キャラクタB,Cと呼ぶ)のセリフを、野外ステージ502上の所定の位置に定位する。所定の位置とは、たとえば、アニメーションの場面でキャラクタB,Cが演じていた場所である。地点P3におけるアニメーションの音声の再生時、音声再生システム1は、アクティブノイズキャンセルを100%の機能レベルで機能させ、ヒアスルーを機能させない。すなわち、音声再生システム1は、ユーザLに対して、アニメーションの音声のみを聴かせる。これにより、ユーザLは、自分自身がキャラクタAで、他のキャラクタB,Cとともにアニメーションの一場面を演じているような没入感を得ることができる。アクティブノイズキャンセルを100%の機能レベルで機能させ、ヒアスルーを機能させない外部音制御モードは、ノイズキャンセルモードと呼ばれる。
なお、複数のユーザからなるグループが、野外ステージ502を訪れた場合、音声再生システム1は、各ユーザにキャラクタA、B、Cをそれぞれ割り当て、グループでアニメーションの一場面を演じているような演出をすることも可能である。複数のユーザが公園500を訪れた場合の音声再生システム1およびサーバ2の処理動作については後述する。
アニメーションの音声の再生が終了したのち、音声再生システム1は、経路R3を地点P4方向へ進むようにルート案内の音声を再生する。このルート案内の再生時、音声再生システム1は、アクティブノイズキャンセルおよびヒアスルーを、それぞれ50%の機能レベルで機能させる。ルート案内の定位位置は、たとえばユーザLの左横1メートルである。
経路R3は、野外ステージ502上の地点P3から客席の横を通って地点P4に至る経路である。地点P4は、野外ステージ502があるエリアと池504があるエリアとの境界の地点である。音声再生システム1は、経路R3では、ヘッドホン20をヒアスルー100%、アクティブノイズキャンセル0%に設定する。これにより、ユーザLは、公園500の環境音である鳥の声や木の葉のざわめきなどをゆっくり聴くことができる。このとき、音声再生システム1は、季節や時間帯に合わせたBGMを小さい音量で再生してもよい。
ユーザLが、地点P4に到達すると、音声再生システム1は、ユーザLに対してクイズを出題する。クイズは音声データとして音声データセット723に含まれている。音声生成部113は、音声データセット723を再生することによってユーザLにクイズを出題する。クイズの出題時、音声再生システム1は、アクティブノイズキャンセル100%、ヒアスルー0%の機能レベルで機能させる。クイズ音声の定位位置は、ユーザLの正面1メートルとする。
クイズは、たとえばアニメーションの内容に関する問題などにするのが好適である。ユーザLは、携帯端末装置10の画面を操作してこのクイズに回答する。クイズに対する回答の方法は、携帯端末装置10の画面操作に限定されない。たとえば、ユーザLが、正解と思う方向に歩きだす、または正解と思う方向に頭部を向けるなどの方法で回答してもよい。
ユーザLがクイズに正解すると、音声再生システム1は、経路R4を進むようにルート案内の音声を再生する。一方、ユーザLがクイズに誤答すると、音声再生システム1は、経路R5を進むようにルート案内の音声を再生する。このルート案内の再生時、音声再生システム1は、アクティブノイズキャンセルおよびヒアスルーを、それぞれ50%の機能レベルで機能させる。ルート案内の定位位置は、たとえばユーザLの左横1メートルである。
経路R4は、地点P4から池504を一周し、東側の通路を通って公園500から出る経路である。ユーザLがクイズに正解して経路R4を進むと、音声再生システム1は、池504の中央にある島505に定位するようにアニメーションの音声を再生する。音声再生システム1は、ヒアスルー70%、アクティブノイズキャンセル100%の機能レベルで機能させる。さらに、音声再生システム1は、ヒアスルー処理で再生される外部音であるヒアスルー音を信号処理して暖かい音質に加工する。暖かい音質とは、例えば、音のダイナミックレンジを広げ、かつ、なだらかな特性のローパスフィルタで高音域を減衰させた音質である。音声再生システム1は、アニメーションの音声とフィルタリングされた外部音およびキャンセル音をミキシングしてスピーカ23L、23Rから放音する。
ユーザLは、信号処理により、暖かい音質に加工されたアニメーションの音声およびフィルタリングされた外部音を聴きながら池504を一周する。池504には噴水が設置されているため、ユーザLは噴水の音を背景にアニメーションの音声を聴くことになる。ユーザLは、アニメーションの音声を聴きながら、池504を巡って公園500から退場する。
経路R5は、地点P4から東側の通路を通って公園500から出る経路である。ユーザLがクイズに誤答して経路R5を進むと、音声再生システム1は、外部音をフィルタリングしたホラーな音を出力する。ユーザLがクイズに誤答して経路R5を進むと、音声再生システム1は、アクティブノイズキャンセルを100%の機能レベルで機能させるとともに、ヒアスルーも100%の機能レベルで機能させる。さらに、音声再生システム1は、ヒアスルー音を信号処理してホラーな音質に加工する。ホラーな音質とは、例えば、高音を極端にカットして、テープエコーをかけた音質である。テープエコーとは、遅延した1または複数のピークを持つフィルタ処理である。
ユーザLが、クイズに正解した場合、経路R4でアニメーションの音声を聴く。しかし、クイズに誤答した場合、ユーザLは、経路R5でホラーな外部音のみ聴く。このように、このコンテンツデータ72(シナリオ721)は、クイズに正解した場合と誤答した場合とで、経路を分岐して音声の処理が異なるよう編集されている。
図6は、制御部100がシナリオ721に基づく処理を行う動作を示すフローチャートである。この処理は、一定時間(たとえば1秒)ごとに繰り返し実行される。制御部100は、シナリオ721に記載されたいずれかのイベントのトリガが発生したか否かを判断する(ステップS11、ステップSnを以下単にSnと言う。)。トリガが発生していなければ(S11でNO)、制御部100は、今回の動作を終了する。トリガが発生していれば(S11でYES)、制御部100は、対応するイベントデータの外部音制御情報を読み出して(S12)、外部音制御コマンドとしてヘッドホン20に送信する(S13)。外部音制御情報は、アクティブノイズキャンセル、ヒアスルーおよびヒアスルー音の信号処理を含む。制御部100は、再生される音声データがあるか否かを判断する(S14)。再生する音声データがない場合(S14でNO)、制御部100は、動作を終了する。
再生する音声データがある場合(S14でYES)、制御部100は、まず再生される音声の定位位置に対応する頭部インパルス応答をフィルタ係数71から読み出し(S15)、信号処理部102にセットする(S16)。制御部100は、再生する音声データを読み出し(S17)、音声を再生する(S18)。デバイス通信部104は、再生され、定位処理がされた音声をヘッドホン20に送信する。
図6に示したフローチャートの処理は、処理の内容が変更されない範囲において順不同である。
グループすなわち複数のユーザが、一緒に公園500を訪れる場合の音声再生システム1の処理について説明する。複数のユーザ(この例では3人のユーザ)をそれぞれユーザL1、ユーザL2およびユーザL3とし、ユーザL1がグループのリーダであるとする。
各ユーザL1、L2、L3は、サーバ2経由または直接相互通信でグループを形成する。たとえば、サーバ2を経由する場合、ユーザL1がサーバ2上にグループを作成して仲間を募集する。この時点でユーザL1がリーダとなる。このグループにユーザL2、L3が参加してグループが形成される。サーバ2、および各ユーザL1、L2、L3の携帯端末装置10は、それぞれ、グループのメンバーをグループテーブルに登録する。また、直接相互通信の場合、ユーザL1が自身の携帯端末装置10を使用して他のユーザL2、L3の携帯端末装置10に対してグループへの参加を勧誘するメッセージを送信する。ユーザL2、L3がこのメッセージに対して、自身の携帯端末装置10を用いて返信することにより、グループが形成される。各ユーザL1、L2、L3の携帯端末装置10は、グループのメンバーをグループテーブルに登録する。また、サーバ2は、グループおよびそのメンバーを登録してもよい。各ユーザL1、L2、L3の携帯端末装置10相互間の通信は、たとえば、Bluetooth、または、Wi−Fiダイレクトなどの通信方式で行えばよい。
グループが形成されると、メンバーは、一緒にコンテンツツーリズムで訪れる場所を決定する。訪れる場所が決定されると、各ユーザL1、L2、L3の携帯端末装置10は、決定された場所のコンテンツデータ72をサーバ2からダウンロードする。グループのメンバーは、コンテンツツーリズムの目的地(たとえば公園500)に一緒にでかける。公園500では、各ユーザL1、L2、L3の携帯端末装置10は、自身が測位した位置でシナリオ721を進行させる。なお、各ユーザL1、L2、L3が別々にシナリオ721を進行させるのでなく、リーダであるユーザL1の携帯端末装置10が測位した位置に基づいて、全員(ユーザL1、L2、L3)のシナリオ721を同期して進行させてもよい。
図5に示したイベント5番、野外ステージ502上の地点P3では、各メンバーが一緒にシナリオ721を進行させる。すなわち、ユーザL1、L2、L3の携帯端末装置10が、ユーザL1の携帯端末装置10のシナリオ721の進行(アニメーションの音声の再生)に同期して、シナリオ721を進行させる。
野外ステージ502上では、まず、各メンバーの役割(どのキャラクタを演じるか)が決められる。サーバ2またはリーダであるユーザL1の携帯端末装置10が役割を自動的に決定してもよく、各ユーザL1、L2、L3が申告することによって役割を決定しもよい。各ユーザL1、L2、L3は、たとえば携帯端末装置10に表示される複数のキャラクタのいずれかをタップすることで、そのキャラクタを演じることを他のメンバーの携帯端末装置10に通知し、申告するようにしてもよい。
各ユーザの携帯端末装置10は、それぞれ複数のキャラクタのセリフの定位を決定する。すなわち、そのユーザ自身が担当するキャラクタのセリフは、ユーザの頭部に定位させ、他のユーザが担当するキャラクタのセリフは、担当するキャラクタがいる位置に定位させる。ユーザの位置はサーバ2経由、または、直接通信で共有される。
このように、音声再生システム1は、複数のユーザでイベントを実行する場合に、地点P3の演出効果をより発揮する。複数のユーザがぞれぞれキャラクタを担当し、音声再生システム1は、シナリオ721に基づいてセリフの音声を再生する。これにより、ユーザは自分がセリフを喋る訳ではないが、それぞれのユーザがアニメーションのキャラクタになったような拡張現実を体感でき、コンテンツツーリズムの没入感を高めることができる。
また、イベント8番のクイズでは、リーダの回答が全員を代表する。すなわち、音声再生システム1は、リーダが正解すれば、全員を経路R4に案内し、リーダが誤答すれば、全員を経路R5に案内する。また、逆に、各ユーザの携帯端末装置10が、自分のメンバーの回答を採用し、採用した回答に基づいて経路を案内してもよい。この場合、音声再生システム1は、クイズの正誤に応じて、各ユーザを経路R4、または、経路R5にばらばらに案内するため、グループを一時的にばらばらにすることができる。
以上の実施形態では、音声再生システム1が、コンテンツツーリズムに適用される場合について説明した。実施形態の音声再生システム1は、コンテンツツーリズム以外にも適用可能である。たとえば、実施形態の音声再生システム1は、お化け屋敷、脱出ゲーム、または美術館の展示ガイドなどに適用することができる。
お化け屋敷では、音声再生システム1は、アクティブノイズキャンセルを100%の機能レベルで機能させて、ユーザLが何も聴こえない状況にすることで、恐怖感を増大させることができる。脱出ゲームにおいても同様に、音声再生システム1は、迷路内ではアクティブノイズキャンセルを100%の機能レベルで機能させればよい。ユーザLが脱出できたときに、音声再生システム1は、アクティブノイズキャンセルを0%にして、ユーザLに周囲の音を聴かせることにより、脱出できたときの開放感を増大させることができる。
ユーザがマニュアル操作で、ヘッドホン20の外部音制御をアクティブノイズキャンセル100%、ヒアスルー0%にセットしている場合、携帯端末装置10が強制的にヒアスルーを機能させてもよい。携帯端末装置10は、交差点などユーザにとって危険と思われる場所に来たと判断したときに強制的にヒアスルーを機能させる。あるいは、携帯端末装置10は、外部マイク26でサイレン、クラクションまたは人の声などを収音したとき、強制的にヒアスルーを機能させてもよい。
図4の説明で述べたが、音声再生システム1は、ヒアスルーにおいて、ヒアスルー音をスピーカ23L,Rから放音するだけでなく、フィルタリング等の信号処理をしてから放音してもよい。これにより、音声再生システム1は、ヒアスルー音をそのまま聴かせる場合と異なる雰囲気の音にすることができる。たとえば、ヒアスルー音に対する処理としては、フィルタ、エコー、リバーブなどがある。ヒアスルー音に付与する効果としては、(公園を歩いているにもかかわらず)洞窟にいるような音質にすることなどがある。
音声再生システム1は、外部音制御の切り換えを、瞬時に切り換えるのみでなく、徐々に切り換える、すなわちフェードさせて切り換えてもよい。
イベントの実行を指示するトリガは、ユーザLが所定の位置に移動したことに限定されない。たとえば、トリガは、現在時刻、ユーザの動作(頭の向き、歩数、移動速度、停止している時間)などでもよい。また、音声再生システム1は、夕方である、秋であるなど、該当する時期に来なければ実現しできないトリガを設けることにより、ユーザLに対して複数回の訪問、再訪を促すことが可能である。
以上の実施形態では、ユーザLの頭部方向および位置を検出する手段として、3軸のジャイロセンサ25、および、GPSなどの測位部105が用いられた。ユーザLの頭部方向および位置を検出する手段は、これらに限定されない。例えば、3軸のジャイロセンサ25に代えて、3軸のジャイロセンサおよび3軸の加速度センサ(モーションセンサ)を有する6軸センサが用いられてもよい。6軸センサを用いることにより、位置決定部112は、ユーザLの初期位置が決定されれば、GPSなどの測位ができない場所でもユーザLの移動に追従した位置決定が可能になる。
更に、3軸のジャイロセンサ25に代えて、3軸のジャイロセンサおよび3軸の加速度センサに加えて、3軸の方位センサ(コンパス)を有する9軸センサが用いられてもよい。9軸センサを用いることにより、頭部方向決定部111は、必要に応じて方位センサの検出値を参照してジャイロセンサの積算値を校正し、積分誤差を解消することができる。音声の定位方向の制御は、頭部方向決定部111が、応答特性の良いジャイロセンサの積算値を用いて実行すればよい。
1 音声再生システム
2 サーバ
10 携帯端末装置(スマートホン)
20 ヘッドホン
23L,23R スピーカ
24 ヘッドホン信号処理部
25 ジャイロセンサ
26L,26R 外部マイク
100 制御部
101 記憶部
103 信号処理部
72 コンテンツデータ
721 シナリオファイル
722 地図データ
723 音声データセット

Claims (14)

  1. ユーザに装用され、前記ユーザの耳に向けて音声を放音するスピーカと、
    前記ユーザに到来する外部音を収音するマイクと、
    前記外部音を前記スピーカに供給するヒアスルー処理、および、前記外部音をキャンセルするキャンセル音を生成して前記スピーカに供給するノイズキャンセル処理を実行する信号処理部と、
    前記ヒアスルー処理および前記ノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、イベント実行を指示する事象であるトリガの情報を含むイベント情報を記憶した記憶部と、
    前記トリガの発生を検出したとき、該トリガで実行を指示されたイベント情報の制御情報を読み出して前記信号処理部に出力する制御部と、
    を備えた音声再生装置。
  2. 前記制御情報は、前記信号処理部を、前記ノイズキャンセル処理を100パーセントで機能させ、かつ、前記ヒアスルー処理を機能させないノイズキャンセルモード、前記ノイズキャンセル処理を機能させず、かつ、前記ヒアスルー処理を100パーセントで機能させるヒアスルーモード、および、前記ノイズキャンセル処理を100パーセント未満で機能させ、かつ、前記ヒアスルー処理を100パーセント未満で機能させる中間モードのいずれかに制御する情報を含む請求項1に記載の音声再生装置。
  3. 前記信号処理部は、前記ノイズキャンセル処理または前記ヒアスルー処理の機能レベルを切り換えるとき、その機能レベルを徐々に変化させて切り換える請求項1または請求項2に記載の音声再生装置。
  4. 前記制御情報は、前記ヒアスルー処理により前記スピーカに供給される外部音に対して、音質の調整を指示する情報を含み、
    前記信号処理部は、前記制御情報として前記外部音に対する音質の調整を指示する情報を受信したとき、この制御情報に基づいて、前記外部音に対して音質を調整する処理を行う
    請求項1乃至請求項3のいずれかに記載の音声再生装置。
  5. 音声データを再生し、再生した音声を内部音声として前記信号処理部に出力する音声生成部をさらに備え、
    前記イベント情報は、前記音声データを含んでおり、
    前記制御部は、前記トリガの発生を検出したとき、該トリガで実行を指示されたイベント情報の制御情報を読み出して前記信号処理部に出力するとともに、該イベント情報の音声データを前記音声生成部に出力して再生させ、
    前記信号処理部は、入力された前記内部音声を、前記外部音および/または前記キャンセル音とミキシングして前記スピーカに供給する
    請求項1乃至請求項4のいずれかに記載の音声再生装置。
  6. 前記記憶部は、アニメーション、映画またはドラマにゆかりの場所を案内するためのシナリオとして編集された複数のイベント情報を記憶している請求項5に記載の音声再生装置。
  7. ユーザに装用されるスピーカで、前記ユーザの耳に向けて音声を放音することと、
    前記ユーザに到来する外部音をマイクで収音することと、
    前記外部音を前記スピーカに供給するヒアスルー処理、および、前記外部音をキャンセルするキャンセル音を生成して前記スピーカに供給するノイズキャンセル処理を信号処理部で実行することと、
    前記ヒアスルー処理および前記ノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、イベント実行を指示する事象であるトリガの情報を含むイベント情報を記憶部に記憶することと、
    前記トリガの発生を検出したとき、該トリガで実行を指示されたイベント情報の制御情報を読み出して前記信号処理部に出力することと、
    を備えた音声再生方法。
  8. 前記制御情報は、前記信号処理部を、前記ノイズキャンセル処理を100パーセントで機能させ、かつ、前記ヒアスルー処理を機能させないノイズキャンセルモード、前記ノイズキャンセル処理を機能させず、かつ、前記ヒアスルー処理を100パーセントで機能させるヒアスルーモード、および、前記ノイズキャンセル処理を100パーセント未満で機能させ、かつ、前記ヒアスルー処理を100パーセント未満で機能させる中間モードのいずれかに制御する情報を含む請求項7に記載の音声再生方法。
  9. 前記信号処理部で実行するステップは、前記ノイズキャンセル処理または前記ヒアスルー処理の機能レベルを切り換えるとき、その機能レベルを徐々に変化させて切り換える請求項7または請求項8に記載の音声再生方法。
  10. 前記制御情報は、前記ヒアスルー処理により前記スピーカに供給される外部音に対して、音質の調整を指示する情報を含み、
    前記信号処理部で実行するステップは、前記制御情報として前記外部音に対する音質の調整を指示する情報を受信したとき、この制御情報に基づいて、前記外部音に対して音質を調整する処理を行う
    請求項7乃至請求項9のいずれかに記載の音声再生方法。
  11. 前記イベント情報は、音声データをさらに記憶し、
    前記信号処理部で実行するステップは、さらに、前記音声データを再生して前記スピーカに供給する
    請求項7乃至請求項10のいずれかに記載の音声再生方法。
  12. 前記記憶するステップは、前記記憶部に、アニメーション、映画またはドラマにゆかりの場所を案内するためのシナリオとして編集された複数のイベント情報を記憶する請求項11に記載の音声再生方法。
  13. ユーザに装用され、前記ユーザの耳に向けて音声を放音するスピーカと、前記ユーザに到来する外部音を収音するマイクと、を備え、前記外部音を前記スピーカに供給するヒアスルー処理、および、前記外部音をキャンセルするキャンセル音を生成して前記スピーカに供給するノイズキャンセル処理を実行する音響デバイスが接続される携帯端末装置の制御部を、
    前記ヒアスルー処理および前記ノイズキャンセル処理のそれぞれの機能レベルを指定する制御情報、および、前記制御情報に基づく制御の実行を指示する事象であるトリガの情報を含むイベント情報を記憶する第1手段、および、
    前記トリガの発生を検出したとき、該トリガで実行を指示された制御情報を読み出して前記音響デバイスに出力する第2手段、
    として機能させる音声再生プログラム。
  14. 前記第1手段が記憶するイベント情報は、音声データをさらに含み、
    前記第2手段は、前記トリガの発生を検出したとき、さらに、前記音声データを再生して前記音響デバイスに送信する
    請求項13に記載の音声再生プログラム。
JP2020025529A 2020-02-18 2020-02-18 音声再生装置、音声再生方法および音声再生プログラム Pending JP2021131423A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020025529A JP2021131423A (ja) 2020-02-18 2020-02-18 音声再生装置、音声再生方法および音声再生プログラム
US17/175,369 US11322129B2 (en) 2020-02-18 2021-02-12 Sound reproducing apparatus, sound reproducing method, and sound reproducing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020025529A JP2021131423A (ja) 2020-02-18 2020-02-18 音声再生装置、音声再生方法および音声再生プログラム

Publications (1)

Publication Number Publication Date
JP2021131423A true JP2021131423A (ja) 2021-09-09

Family

ID=77272774

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020025529A Pending JP2021131423A (ja) 2020-02-18 2020-02-18 音声再生装置、音声再生方法および音声再生プログラム

Country Status (2)

Country Link
US (1) US11322129B2 (ja)
JP (1) JP2021131423A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022098651A (ja) * 2020-12-22 2022-07-04 株式会社カプコン 情報処理システムおよびプログラム
WO2024034270A1 (ja) * 2022-08-10 2024-02-15 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3644622A1 (en) * 2018-10-25 2020-04-29 GN Audio A/S Headset location-based device and application control

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010046304A1 (en) * 2000-04-24 2001-11-29 Rast Rodger H. System and method for selective control of acoustic isolation in headsets
JP2017103598A (ja) 2015-12-01 2017-06-08 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022098651A (ja) * 2020-12-22 2022-07-04 株式会社カプコン 情報処理システムおよびプログラム
JP7158648B2 (ja) 2020-12-22 2022-10-24 株式会社カプコン 情報処理システムおよびプログラム
WO2024034270A1 (ja) * 2022-08-10 2024-02-15 ソニーグループ株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
US20210256951A1 (en) 2021-08-19
US11322129B2 (en) 2022-05-03

Similar Documents

Publication Publication Date Title
US11322129B2 (en) Sound reproducing apparatus, sound reproducing method, and sound reproducing system
US20150326963A1 (en) Real-time Control Of An Acoustic Environment
KR101011543B1 (ko) 바이노럴 오디오 시스템에서 사용하기 위한 다-차원 통신 공간을 생성하는 방법 및 장치
US11638869B2 (en) Information processing device and information processing method
CN108141684A (zh) 声音输出设备、声音生成方法以及程序
US20130322667A1 (en) Personal navigation system with a hearing device
JP4694763B2 (ja) ヘッドホン装置
Harma et al. Techniques and applications of wearable augmented reality audio
JP7456463B2 (ja) 情報処理装置、情報処理方法、並びにプログラム
JP2002505818A (ja) 人工音響環境を生成するためのシステム
JP2008042390A (ja) 車内会話支援システム
JP2005333211A (ja) 音響収録方法、音響収録再生方法、音響収録装置および音響再生装置
US11451923B2 (en) Location based audio signal message processing
JP2019087973A (ja) 情報処理装置、および情報処理方法、並びにプログラム
JP2671329B2 (ja) オーディオ再生装置
DK2887695T3 (en) A hearing aid system with selectable perceived spatial location of audio sources
JP3750198B2 (ja) 音像定位装置
JP7484290B2 (ja) 移動体位置推定装置および移動体位置推定方法
JP7063353B2 (ja) 音声ナビゲーションシステムおよび音声ナビゲーション方法
JP6817282B2 (ja) 音声生成プログラム、および音声生成装置
JP7463796B2 (ja) デバイスシステム、音質制御方法および音質制御プログラム
Tikander Development and evaluation of augmented reality audio systems
WO2024034270A1 (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230815

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240220