JP2023508901A

JP2023508901A - 不可視スピーカによる仮想効果音のためのシステムと方法

Info

Publication number: JP2023508901A
Application number: JP2022537483A
Authority: JP
Inventors: シャオ－フーシー，; ジェイムズジェン，; ジュオチャオジェン，
Original assignee: ハーマンインターナショナルインダストリーズ，インコーポレイテッド
Priority date: 2019-12-31
Filing date: 2020-12-30
Publication date: 2023-03-06
Also published as: KR20220120587A; EP4085662A1; CN115280799A; WO2021138421A1; US20230011591A1

Abstract

少なくとも１つの実施形態では、聴取環境において仮想効果音を提供するための装置が提供される。装置は、少なくとも１つのコントローラ及びオーディオ再生デバイスを含む。オーディオ再生デバイスは、オーディオ入力ソースからオーディオ入力信号を受信し、頭部伝達関数（ＨＲＴＦ）をオーディオ入力信号に適用するようにプログラムされた少なくとも１つのコントローラを含む。少なくとも１つのコントローラは、オーディオ入力信号にクロストークキャンセルを適用し、ＨＲＴＦ及びクロストークキャンセルをオーディオ入力信号に適用した後に、聴取環境にいる聴取者に見えない少なくとも１つのスピーカでの再生のためにオーディオ出力信号を生成するようにさらにプログラムされる。【選択図】図１

Description

関連出願の相互参照
本願は、２０１９年１２月３１日出願の米国仮特許出願第６２／９５５，８４４号の利益を主張し、その開示は、その全体が参照により本明細書に組み込まれる。

本明細書に開示される態様は、一般に、１つまたは複数のスピーカにより仮想効果音を提供するためのシステム及び方法に関する。詳細には、本明細書に開示される実施形態は、限定されないが、バーチャライザと壁内スピーカとの組み合わせを提供して、目に見えるスピーカなしで完全なサラウンド音響体験を提供することができる。

マルチチャンネルシステムは、セットアップ手順が複雑であることが知られており、スピーカの配置によって大きく影響を受ける可能性がある。これらの問題は、悪名高いセットアップ手順と空間内の配線とともに、一貫性のない音場の再現につながり得る。さらに、空間クロスモデルに関する文献は、視覚モダリティが他の感覚からの情報に影響を与える可能性があることを示唆している。いくつかの研究は、空間的合同の程度を変えるとき、視覚が、聞くものを支配することを示している。したがって、視覚が、聴覚よりも統合ローカリゼーションに大きな影響を与え得る。聴取者がスピーカ（複数可）と配線を見ることができる場合、全体的な音の位置の知覚に大きな影響を与える可能性がある。

サウンドバーなどの優れた設計のオールインワンシステムにより、セットアップの複雑さが軽減され得る。ただし、通常、これらのシステムは、フォームファクタの制約により、低周波数の不足の影響を抱え得る。また、最近のサウンドバーは、側壁の反射を使用することにより、より広い音像を提供する傾向がある。このような技術の性能は、側壁の影響を大きく受ける可能性があり、通常、追加の校正手順が必要になり得る。

少なくとも１つの実施形態では、聴取環境において仮想効果音を提供するための装置が提供される。装置は、少なくとも１つのコントローラ及びオーディオ再生デバイスを含む。オーディオ再生デバイスは、オーディオ入力ソースからオーディオ入力信号を受信し、頭部伝達関数（ＨＲＴＦ）をオーディオ入力信号に適用するようにプログラムされた少なくとも１つのコントローラを含む。少なくとも１つのコントローラは、オーディオ入力信号にクロストークキャンセルを適用し、ＨＲＴＦ及びクロストークキャンセルをオーディオ入力信号に適用した後に、聴取環境にいる聴取者に見えない少なくとも１つのスピーカでの再生のためにオーディオ出力信号を生成するようにさらにプログラムされる。

少なくとも１つの実施形態では、聴取環境において仮想効果音を提供するための装置が提供される。装置は、少なくとも１つのコントローラ及びオーディオ再生デバイスを含む。オーディオ再生デバイスは、オーディオ入力ソースからオーディオ入力信号を受信し、頭部伝達関数（ＨＲＴＦ）をオーディオ入力信号に適用するようにプログラムされた少なくとも１つのコントローラを含む。少なくとも１つのコントローラは、オーディオ入力信号にクロスロークキャンセルを適用し、オーディオ入力信号にＨＲＴＦ及びクロストークキャンセルを適用した後に、オーディオ出力信号を生成するようにさらにプログラムされる。少なくとも１つのコントローラは、サラウンド音響体験を伴う聴取環境で再生するため、オーディオ出力信号を第１の隠蔽スピーカ及び第２の隠蔽スピーカに送信するようにさらにプログラムされる。

少なくとも１つの別の実施形態では、聴取環境において仮想効果音を提供するための方法が提供される。方法は、オーディオ再生デバイスにおいて、オーディオ入力ソースからオーディオ入力信号を受信すること及び少なくとも頭部伝達関数（ＨＲＴＦ）をオーディオ入力信号に適用することを含む。方法は、オーディオ入力信号にクロスロークキャンセルを適用すること、及びオーディオ入力信号にＨＲＴＦ及びクロストークキャンセルを適用した後に、オーディオ出力信号を生成することをさらに含む。方法は、聴取環境に少なくとも１つの仮想スピーカの位置を生成して、物理的に聴取環境に位置する少なくとも１つの隠蔽スピーカがオーディオ出力信号を再生する間に、少なくとも１つの仮想スピーカがオーディオ出力信号を再生している効果を提供することをさらに含む。

本開示の実施形態は、添付の特許請求の範囲で詳細に指摘される。しかしながら、様々な実施形態の他の特徴は、添付の図面と併せて以下の詳細な説明を参照することによって、より明らかになり、最もよく理解されるであろう。

全体として、一実施形態による、１つまたは複数のスピーカにより仮想効果音を提供するためのシステムを示す。一実施形態による、クロストークキャンセルと頭部伝達関数（ＨＲＴＦ）とを組み合わせる全体的な原理を示す。一実施形態によるＨＲＴＦの測定の１つの概略図を示す。一実施形態によるＨＲＴＦを利用することによる異なるチャンネルの仮想化を示す。一実施形態によるスピーカの配置の前面及び背面の音響面の例を示す。一実施形態によるスピーカの配置の前面及び背面の音響面の例を示す。一実施形態による聴取環境でのスピーカのセットアップを示す。一実施形態による、聴取環境において仮想効果音を提供するための方法を示す。

必要に応じて、本発明の詳細な実施形態が本明細書中に開示されるが、開示される実施形態は、さまざまな形式及び代替の形式で具現化され得る本発明の単なる例示にすぎないことを理解されたい。図は必ずしも縮尺通りではなく、一部の特徴は、特定の構成要素の詳細を示すために誇張または最小限に抑えられる場合がある。したがって、本明細書に開示される具体的な構造上の、そして機能上の詳細は、限定的と解釈されるべきではなく、本発明を様々に利用するために単に当業者に教示するための代表的な基礎として解釈されるべきである。

本明細書及び添付書類に開示するコントローラ／デバイスは、任意の数のマイクロプロセッサ、集積回路、メモリデバイス（たとえば、ＦＬＡＳＨ（登録商標）、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、電気的プログラム可能読み取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラム可能読み取り専用メモリ（ＥＥＰＲＯＭ）、またはそれらの他の適切な変形）、及び本明細書に開示する動作（複数可）を実施するために互いに協働するソフトウェアを含み得ることを認識されたい。加えて、開示される係るコントローラは、開示される任意の数の機能を行うようにプログラムされる非一時的コンピュータ可読媒体内で具体化されるコンピュータプログラムを実行するために１つ以上のマイクロプロセッサを利用する。さらに、本明細書で提供されるコントローラ（複数可）は、ハウジングと、ハウジングの内部に配置される、様々な数のマイクロプロセッサ、集積回路、及びメモリデバイス（例えば、ＦＬＡＳＨ（登録商標）、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、電気的にプログラム可能な読み取り専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラム可能な読み取り専用メモリ（ＥＥＰＲＯＭ））を含む。開示されるコントローラ（複数可）はまた、本明細書で論じられるような他のハードウェアベースのデバイスとの間でそれぞれデータを送受信するためのハードウェアベースの入力及び出力も含む。

図１は、全体として、一実施形態による、１つまたは複数のスピーカにより仮想効果音を提供するためのシステム１００を示す。システム１００は、一般に、オーディオ入力ソース１０２、頭部伝達関数（ＨＲＴＦ）ブロック１０４、クロストークキャンセルブロック１０６、及び少なくとも１つのスピーカ１０８（以下、「スピーカ１０８」または「スピーカ（複数）１０８」）を含む。一例では、少なくとも１つのスピーカ１０８（以下、「スピーカ１０８」または「スピーカ（複数）１０８」）は、壁内スピーカ（複数可）として定義され得、壁または他の障壁の後ろに置かれ得、聴取者に物理的に見られることから完全に隠蔽される（つまり、完全に不可視である）。追加的または代替的に、スピーカ１０８は、床または天井に置かれ得る。スピーカ１０８の不可視特性を参照するが、スピーカ１０８を覆うスピーカグリルもまた隠蔽されるかまたは不可視であり、聴取者に見えるのは壁、天井、または床だけであることが認識される。この場合、スピーカ１０８の実際の物理的位置に関して、聴取者に与えられる視覚的な手がかりはない。

オーディオ入力ソース１０２、ＨＲＴＦブロック１０４、及びクロストークキャンセルブロック１０６は、オーディオ再生デバイス１１０などの単一のデバイスに組み込まれ得ることが認識される。あるいは、オーディオ再生デバイス１００は、複数のデバイスに分散され得る。オーディオ再生デバイス１１０は、本明細書に開示される任意の数の動作を実行するため少なくとも１つのコントローラ１０３（「コントローラ１２１」）を含む。一例では、オーディオ再生デバイス１１０は、携帯電話（例えば、スマートフォン、ｉ－Ｐｈｏｎｅ（登録商標）など）、手持ち式コンピュータ（例えば、携帯情報端末（「ＰＤＡ」）など）、タブレット（たとえば、ｉ－Ｐａｄ（登録商標）など）、ポータブルオーディオデバイス（たとえば、ｉ－Ｐａｄ（登録商標）など）、またはそれらの他の適切な変形などのモバイルデバイスに対応することができるが、それらに限定されない。オーディオ再生デバイス１１０は、ホームオーディオシステム（例えば、テレビ、例えば、ブルーレイプレーヤなどのメディアプレーヤなど）に接続して、またはその件に関して、通常、サラウンドサウンド形式でオーディオを再生する任意のシステムのために使用され得ることも認識される。一般に、クロストークキャンセルブロック１０６は、残りのすべての標的位置で音を消去しながら、単一の標的位置で所望の信号を再現するように構成される。

オーディオ再生デバイス１１０はまた、聴取者がスピーカ（複数可）１０８に仮想位置を割り当てることができるようにするためのユーザインターフェース１１１を含む。本態様は、下記により詳細に説明される。オーディオ再生デバイス１１０は、オーディオデータの無線受信などの無線通信を容易にするため、及び／または聴取環境１１５で再生するためのスピーカ１０８へのオーディオデータの無線伝送を容易にするために、任意の数のトランシーバ１１２を含み得る。オーディオ再生デバイス１１０は、無線通信を容易にするために任意の数の無線プロトコルを利用することができる。例えば、無線プロトコルは、ブルートゥース（登録商標）、ＷｉＦｉ（登録商標）などを含み得る。オーディオ再生デバイス１１０は、オーディオデータのスピーカ１０８への伝送を可能にするコードを実行するためのコントローラ１１４を含む。オーディオデータは、ｗａｖ、ｍｐ３、ｗｍａなどのファイル形式の形態であり得るが、これらに限定されない。オーディオ再生デバイス１１０は、ＷｉＦｉ接続を介して、再生のために任意の数の前述のオーディオデータを取得して保存するためサーバ１１６に通信するようにさらに構成される。

オーディオ再生デバイス１１０はまた、オーディオ再生デバイス１１０がトランシーバ１１２の１つまたは複数を介して外部ソースからデータを受信するときに、データをスピーカ１０８に送信するように構成され得る。たとえば、オーディオ再生デバイス１１０は、周波数変調（ＦＭ）または振幅変調（ＡＭ）などを介してラジオ局（またはタワー）から放送されるオーディオデータを受信することができる。オーディオ再生デバイス１１０及びスピーカ１０８は、スピーカ１０８の少なくとも１つと統合され得、残りのスピーカ１０８と無線通信することができることも認識される。

オーディオ再生デバイス１１０は、サラウンドサウンド形式を利用するがこれに限定されない任意のシステムに実装され得る。オーディオ再生デバイス１１０は、仮想アップミキサーとして使用され、任意の数の人工マルチチャンネルソースを作成することができる。さまざまな非限定的な例には、５．１チャンネルまたは７．１チャンネルが含まれる。サラウンドサウンドに関しては、これには聴取者を囲むさまざまなスピーカが関わり得る。サラウンドサウンドには、１人または複数の聴取者を囲むスピーカからの複数のオーディオチャンネルを使用して、オーディオ再現の忠実度と深さを高める技術が含まれ得る。一般に、本明細書に開示される態様は、オーディオ再生デバイス１０８によって（例えば、ＨＲＴＦブロック１０４及びクロストークキャンセルブロック１０６を介して）提供されるバーチャライザ１０９を提供して、目に見えるスピーカ１０８なしで完全なサラウンドサウンド体験を提供することができる。本明細書に開示される態様は、ドルビー（登録商標）、ＴＨＸ（登録商標）などであるがこれらに限定されない、任意の数のマルチチャンネル符号化技術に適用できることも認識される。

例えば、バーチャライザ１０９は、完全に較正されたマルチチャンネルオーディオシステムの同様の感覚を模倣するステレオ出力を提供するために、クロストークキャンセル（クロストークキャンセルブロック１０６を介して）及びＨＲＴＦ（ＨＲＴＦブロック１０８を介して）を含むブロックとして定義され得る。一例では、オーディオ入力ソース１０２は、オーディオ入力ソースをマルチチャンネルオーディオ（例えば、５．１、７．１など）に復号し得る。ＨＲＴＦブロック１０４は、ＨＲＴＦを利用して、オーディオオブジェクトを空間内の対応する位置に位置付けることができる。ＨＲＴＦは一般に、音源からの音がユーザの鼓膜に到達する方法を記述する伝達関数に対応する。これには、聴取者の外耳の形状、聴取者の頭部と体の形状、及び周囲の音響特性に影響を与えることも含まれ得る。ＨＲＴＦは、聴取者が音の方向を正確に認識できるかどうかにも影響を与える可能性がある。クロストークキャンセルブロック１０６は、ステレオ公差汚染項を消去して、聴取環境の音場を広げることができる。一般に、方向性キューを含むオーディオ信号は、聴取者の耳で再現される。ただし、クロストークはこれらのキューを不鮮明にし、音像定位に悪影響を与える可能性がある。したがって、クロストークキャンセルを使用して、スピーカ１０８から反対側の耳への音を最小限に抑えることができる。

図２は、一実施形態による、クロストークキャンセルとＨＲＴＦとを組み合わせる全体的な原理を示す。図２は、一般に、聴取者（またはユーザ）１５０の前に置かれる２つのスピーカ１０８ａ、１０８ｂを示している。第１及び第２のＨＲＴＦ１５２ａ、１５２ｂも図２に示されている。一般に、ＨＲＴＦ１５２ａ、１５２ｂのそれぞれは、聴取者１５０の頭部の周りの物理的な伝播と散乱による異なる方向からの自由場における音声信号の線形フィルタリングに対応するか、またはそれを記載する。時間領域で表される場合、ＨＲＴＦ１５２ａ、１５２ｂは、頭部インパルス応答（ＨＲＩＲ）と呼ばれることもある。このようなＨＲＩＲは、特殊な音像定位キューを備えており、空間オーディオシステムの設計と再現に使用され得る。一般に、ＨＲＴＦ１５２ａ、１５２ｂは、壁、天井、及び床からの反射が測定されたインパルス応答に影響を与えるのを防ぐために実施及び測定されるフィルタリングに対応する。ＨＲＴＦ１５２ａ、１５２ｂは、最初に特徴付けまたは確立され（すなわち、または測定され）、次いで、ＨＲＴＦブロック１０４内に符号化された形態で格納され得る。クロストークキャンセル及びＨＲＴＦを壁内（または隠蔽）スピーカ１０８と組み合わせるという概念は、スピーカ１０８が聴取者１５０から隠されている間、音響が任意の数の異なる方向で来るという効果を追加する。

図３は、一実施形態によるＨＲＴＦの測定の１つの概略図を示す。ＨＲＴＦの測定は、天井、床、壁からの音の反射を防ぐため無響室で実施され得る。図２に示す聴取者１５０は、図３のダミーヘッド１７０に置き換えられている。この場合、２つのマイク（図示せず）が、ダミーヘッド１７０内に配置され、ダミーヘッド１７０がターンテーブル１７２上に配置される。ダミーヘッド１７０は、座標系の原点に固定することができる。次に、ＨＲＴＦのさまざまな角度が聴取環境で測定され得る。ＨＲＴＦ（複数可）が取得されると、オーディオ再生デバイス１１２は、デジタルフィルタ（たとえば、ＨＲＴＦブロック１０４）を利用して、図４により詳細に示すように、サラウンドサウンドのさまざまなチャンネルのスピーカ位置を仮想化できる。例えば、ＨＲＴＦブロック１０４によってフィルタリングされる入力信号は、音像の方向を提供することができる。クロストークキャンセルを使用すると、実際のシステム及び環境内の現実のＨＲＴＦが除去される。この場合、ＨＲＴＦブロック１０４を形成する設計されたＨＲＴＦデジタルフィルタが、聴取者（または製造者）の所望の仮想角度に従って開発及び実装され得る。

図４は、サラウンドサウンドシステムの実際のスピーカ１０８ａ、１０８ｂの位置と、仮想スピーカ２００ａ～２００ｅの位置を示している。一般に、仮想スピーカ２００ａ～２００ｅは、サラウンドサウンドシステムにおいて聴取者１５０によって知覚される音像に対応する。スピーカ１０８ａ、１０８ｂは、聴取者１５０のためにオーディオを実際に再生しているスピーカであり得る。しかしながら、ＨＲＴＦ（複数可）を提供するＨＲＴＦブロック１０４と、クロストークキャンセルを提供するクロストークキャンセルブロック１０６を利用して仮想スピーカ２００ａ～２００ｅ（例えば、聴取者１５０によって知覚される音像）が生成される。例えば、仮想スピーカ２００ａは、聴取環境１１５内の左スピーカであると聴取者１５０によって知覚され得、仮想スピーカ２００ｂは、聴取環境１１５内の中央スピーカであると聴取者１５０によって知覚され得、仮想スピーカ２００ｃは、聴取者１５０によって聴取環境１１５内の右スピーカとして知覚され得、仮想スピーカ２００ｄは、聴取者１５０によって聴取環境１１５内のサラウンド右スピーカとして知覚され得、仮想スピーカ２００ｅは、聴取者１５０によって聴取環境１１５内のサラウンド左スピーカであると知覚され得る。

図４は、一般に、仮想スピーカ２００ａ～２００ｅが極座標系２２０（たとえば、０～３６０度）内に配置されていることを示している。したがって、オーディオ再生デバイス１０２は、聴取者１５０が、ユーザインターフェース１１１を介して極座標系２２０の任意の座標に対して仮想スピーカ２００ａ～２００ｅのそれぞれに位置を割り当てる能力を可能にすることができる。この場合、ＨＲＴＦは、３６０度までのすべての単一（または１つ）の度数で測定され得る。聴取者１５０または設計者は、仮想位置（または仮想スピーカ２００ａ～２００ｅ）として、１つの入力チャンネルごとに１つの角度を選択することができる。測定されたＨＲＴＦで選択された角度をクロストークキャンセルと組み合わせることにより、聴取者は、スピーカ１０８からではなく、仮想スピーカ２００ａ～２００ｅから来る音を知覚することができる。ユーザインターフェース１１１は、タッチ入力デバイス、マイクなどの音声コマンド回路（例えば、音声コマンドを電気入力信号に変換するマイク及び回路）、物理的スイッチ、または聴取者１５０が電気デバイスに情報を入力する能力を可能にする他の適切なデバイスの形態であり得ることが認識される。一例では、ユーザインターフェース１１１は、その画面上に極座標系２２０をグラフで描写することができ、聴取者１５０は、必要に応じて、システム２２０に示されるように、対応する仮想スピーカ２００ａ～２００ｅを特定の座標に単に割り当てることができる。本明細書に開示される態様は、サラウンド標準（例えば、ドルビーまたはデジタルシアターシステム（ＤＴＳ）サラウンドスピーカ位置）によって示されるデフォルト位置または提供された各オーディオソースに対するカスタムユーザ入力（複数可）の読み取りのいずれかとして、音の投影位置を変更し得ることが認識される。

上記のように、より広い音場の知覚を達成するために、オーディオ再生デバイス１１０は、クロストークキャンセルブロック１０６を利用して、クロストークキャンセルを実施することができる。したがって、Ｇ（ｒｋ）がｋ番目のスピーカと最適化された位置ｒとの間のクロストークキャンセル関数として機能すると仮定する。２つの耳で受信される信号はｓで与えられる。

ｓ＝Ｈｑ式（１）

式中、Ｈは聴取者１５０の耳とスピーカ１０８ａ、１０８ｂとの間の伝達関数であり、ｑはソース強度であり、次のように書くことができる。

ｑ＝Ｇｄ式（２）

式中、ＧはＧ（ｒｋ）の行列であり、ｄは入力信号である。入力信号と受信信号の間の誤差は、次のようになり得る。

ｅ＝ｄ－ｓ式（３）

誤差信号ｅを最小化するために、Ｇは次の式で与えられる。

Ｇ＝［Ｈ^ＨＨ］^－１Ｈ^Ｈ式（４）

オーディオオブジェクトを空間内の対応する場所に位置付けるため、式（４）は、次のように変更され得る。
Ｇ_Ｔ＝Ｃ_Ｆ［Ｈ^ＨＨ］^－１Ｈ^Ｈ式（５）

式中、Ｃ_Ｆは、頭部伝達関数の行列である。

図５及び６は、一実施形態によるスピーカの配置の前面及び背面の音響面の一例を示している。このような音響面は、アクチュエータを使用した解決策と見なすことができる。アクチュエータは、振動を表面に伝達して音を送達することができる。一般に、アクチュエータは、入力信号に基づいて振動を生成するように構成されるドライバに対応し得る。このようなアクチュエータは、振動して最終的に音響を送達する表面に接続され得る。この実装は、さまざまな利点を提供し得る。たとえば、音は表面から来る。したがって、スピーカ１０８内にドライバを隠し、聴取環境の壁内にスピーカ１０８を埋め込み、それによって不可視スピーカを作成することが可能である。視覚モダリティがしばしば聴覚からの情報に影響を与えることを示唆し得る空間クロスモデルに関して、空間感覚が音響によって影響を受けるように、スピーカ１０８は任意の配線とともに隠され得る。したがって、スピーカ１０８に仮想サラウンドオーディオが提示される場合、結果として得られるオーディオ体験は、映画館で映画を見るのに匹敵し得る。スピーカの放射面のサイズがかなり大きいため、これはサウンドバーやテレビよりも有利な場合があり、サウンドステージは広くて没入感がある。視覚が聴取者に聞こえるものを支配することを示す研究がある。したがって、視覚は聴覚よりも統合ローカリゼーションに大きな影響を及ぼす。ただし、聴取者がスピーカを認識せず、スピーカの配線が隠されている場合、音像定位は音、または望ましくはＨＲＴＦとクロストークキャンセルを使用した仮想音像によって支配され得る。

図７は、一実施形態による、聴取環境３０２におけるスピーカ配置３００を示している。配置３００において、オーディオ再生デバイス１１０は、オーディオデータを再生するためにテレビ受像機３１２内に置かれ得る。オーディオ再生デバイス１１０は、オーディオデータを提供するために一般的に配置されるより大きなデバイス内に置かれ得ることが認識される。音響面３１０ａ、３１０ｂは、それぞれ、スピーカ１０８ａ、１０８ｂの前面に置かれ得る。オーディオ再生デバイス１１０内のバーチャライザ１０９を音響面３１０ａ、３１０ｂと組み合わせることにより、配置３００は、例えば、最小のセットアップ手順を備えた完全に没入型のオーディオサラウンドサウンドセットアップであり得、環境３０２内に視覚的かつ前向きな物理的影響を提供し得る。図示のように、仮想スピーカ２００ａ～２００ｅは壁内に埋め込まれており、聴取者１５０には見えない。

図８は、一実施形態による、聴取環境１１５内に仮想効果音を提供するための方法４００を示す。動作４０２では、オーディオ再生デバイス１１０は、オーディオ入力ソース１０２からオーディオ入力信号を受信する。上記のように、オーディオ入力ソース１０２は、オーディオ再生デバイス１１０の外部にあり得ることが認識される。別の例では、オーディオ入力ソース１０２は、オーディオ再生デバイス１１０の内部にあってもよい。

動作４０４では、オーディオ再生デバイス１１０は、ＨＲＴＦをオーディオ入力信号に適用する。動作４０６では、オーディオ再生デバイス１１０は、クロストークキャンセルをオーディオ入力信号に適用する。動作４０８では、オーディオ再生デバイス１１０は、ＨＲＴＦ及びクロストークキャンセルをオーディオ入力信号に適用した後、オーディオ出力信号を生成する。動作４１０では、オーディオ再生デバイス１１０は、聴取環境１１５内に少なくとも１つの仮想スピーカ２００ａ～２００ｅの位置を生成して、聴取環境１１５内のスピーカ１０８が、オーディオ出力信号を再生する間、少なくとも１つの仮想スピーカ２００ａ～２００ｅがオーディオ出力信号を再生している効果を提供する。

例示的な実施形態が上述されたが、これらの実施形態が本発明のすべての可能な形式を説明することは意図されていない。むしろ、明細書で使用する言葉は限定ではなく説明のための言葉であり、本発明の趣旨及び範囲から逸脱することなく多様な変更が成され得ることが理解される。加えて、種々の実現実施形態の特徴は、本発明の別の実施形態を形成するために組み合わせることができる。

Claims

聴取環境で仮想効果音を提供するための装置であって、
少なくとも１つのコントローラと、
オーディオ再生デバイスであって、
オーディオ入力ソースからオーディオ入力信号を受信することと、
頭部伝達関数（ＨＲＴＦ）を前記オーディオ入力信号に適用することと、
前記オーディオ入力信号にクロストークキャンセルを適用することと、
前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用した後、前記聴取環境において聴取者には見えない少なくとも１つのスピーカによる再生のために、オーディオ出力信号を生成することと、を実行するようにプログラムされている、前記少なくとも１つのコントローラを含むオーディオ再生デバイスと、を備える、前記装置。
前記オーディオ再生デバイスが、前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用する前に、前記オーディオ入力信号のマルチ入力チャンネルをマルチチャンネルオーディオに復号するようにさらにプログラムされている、請求項１に記載の装置。
前記オーディオ再生デバイスが、サラウンドサウンドシステムのための前記マルチ入力チャンネルを復号するようにさらにプログラムされている、請求項２に記載の装置。
前記オーディオ再生デバイスが、仮想スピーカの位置を示す入力を受信するためのユーザインターフェースを含んで、前記聴取者が前記仮想スピーカの位置で前記オーディオ出力信号を受信しているという知覚を提供する、請求項１に記載の装置。
前記入力が、極座標系における前記仮想スピーカの位置に対応する、請求項４に記載の装置。
前記オーディオ再生デバイスが、モバイルデバイス、ラップトップ、タブレット、テレビ、またはメディアプレーヤのうちの１つである、請求項１に記載の装置。
前記少なくとも１つのスピーカが、壁、天井、及び床のうちの１つに置かれて、前記少なくとも１つのスピーカが前記聴取者に見えないようにする、請求項１に記載の装置。
聴取環境で仮想効果音を提供するための装置であって、
少なくとも１つのコントローラと、
オーディオ再生デバイスであって、
オーディオ入力ソースからオーディオ入力信号を受信することと、
少なくとも頭部伝達関数（ＨＲＴＦ）を前記オーディオ入力信号に適用することと、
前記オーディオ入力信号にクロストークキャンセルを適用することと、
前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用した後、オーディオ出力信号を生成することと、
サラウンドサウンド体験を備えた前記聴取環境で再生するために前記オーディオ出力信号を第１の隠蔽スピーカと第２の隠蔽スピーカとに送信することと、
を実行するようにプログラムされている前記少なくとも１つのコントローラを含むオーディオ再生デバイスと、を備える、前記装置。
前記オーディオ再生デバイスが、
前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用する前に、前記オーディオ入力信号のマルチ入力チャンネルをマルチチャンネルオーディオに復号するようにさらにプログラムされている、請求項８に記載の装置。
前記オーディオ再生デバイスが、サラウンドサウンドシステムのための前記マルチ入力チャンネルを復号するようにさらにプログラムされている、請求項９に記載の装置。
前記オーディオ再生デバイスが、仮想スピーカの位置を示す入力を受信するためのユーザインターフェースを含んで、前記聴取者が前記仮想スピーカの位置で前記オーディオ出力信号を受信しているという知覚を提供する、請求項８に記載の装置。
前記入力が、極座標系における前記仮想スピーカの位置に対応する、請求項１１に記載の装置。
前記オーディオ再生デバイスが、モバイルデバイス、ラップトップ、タブレット、テレビ、またはメディアプレーヤのうちの１つである、請求項８に記載の装置。
前記第１の隠蔽スピーカ及び前記第２の隠蔽スピーカのうちの少なくとも一方が、壁、天井、及び床のうちの１つに置かれて、前記第１の隠蔽スピーカ及び前記第２の隠蔽スピーカの少なくとも一方を前記聴取者に対して隠蔽されるようにする、請求項８に記載の装置。
聴取環境で仮想効果音を提供するための方法であって、
オーディオ入力ソースからオーディオ再生デバイスでオーディオ入力信号を受信することと、
少なくとも頭部伝達関数（ＨＲＴＦ）を前記オーディオ入力信号に適用することと、
前記オーディオ入力信号にクロストークキャンセルを適用することと、
前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用した後、オーディオ出力信号を生成することと、
前記聴取環境で少なくとも１つの仮想スピーカの位置を生成して、前記聴取環境に物理的に配置される少なくとも１つの隠蔽スピーカが前記オーディオ出力信号を再生する間、前記少なくとも１つの仮想スピーカが前記オーディオ出力信号を再生しているという効果を提供することと、を含む、前記方法。
前記ＨＲＴＦ及び前記クロストークキャンセルを前記オーディオ入力信号に適用する前に、前記オーディオ入力信号のマルチ入力チャンネルをマルチチャンネルオーディオに復号することをさらに含む、請求項１５に記載の方法。
前記マルチ入力チャンネルを復号することが、サラウンドサウンドシステムのための前記マルチ入力チャンネルを復号することをさらに含む、請求項１６に記載の方法。
前記少なくとも１つの仮想スピーカの位置を示すユーザインターフェースを介して入力を受信することをさらに含む、請求項１５に記載の方法。
前記入力が、極座標系における前記仮想スピーカの位置に対応する、請求項１８に記載の方法。
前記少なくとも１つの不可視スピーカが、壁、天井、及び床のうちの１つに置かれる、請求項１５に記載の方法。