いくつかの実施形態について、添付の図面を参照しながら記述する。多くの詳細について記載するが、本発明の一部の実施形態は、これらの詳細なしに実施され得ることが理解される。他の事例では、本説明の理解を妨げないように、周知の回路、構造、及び技術については詳細に示していない。
図1Aは、聴取領域101内のオーディオシステム100の図を示している。オーディオシステム100は、オーディオソース103A及び一組のスピーカアレイ105を含むことができる。オーディオソース103Aは、ユーザ107のための種々の音声ビームパターンを発する、スピーカアレイ105内の個々のトランスデューサ109を駆動するために、スピーカアレイ105に接続され得る。一実施形態では、スピーカアレイ105は、多数の音声プログラムコンテンツの個々のチャネルを表すオーディオビームパターンを生成するように設定され得る。これらの音声プログラムコンテンツの再生が、聴取領域101内の別個のオーディオゾーン113に向けられ得る。例えば、スピーカアレイ105は、第1の音声プログラムコンテンツの左前面、右前面、及び中央前面チャネルを表すビームパターンを生成し、第1のゾーン113Aに向けてもよい。この例では、第1の音声プログラムコンテンツに用いられる同じスピーカアレイ105の1つ以上は、同時に、第2の音声プログラムコンテンツの左前面及び右前面チャネルを表すビームパターンを生成し、第2のゾーン113Bに向けてもよい。他の実施形態では、異なる組のスピーカアレイ105が、第1及び第2のゾーン113A及び113Bの各々について選択され得る。以下では、これらのスピーカアレイ105を駆動して、別個の音声プログラムコンテンツ及び対応する別個のゾーン113のオーディオビームを生成する技術について更に詳細に記述する。
図1Aに示すように、聴取領域101は、部屋又は別の閉鎖空間である。例えば、聴取領域101は、屋内の部屋、シアター等であってもよい。閉鎖空間として示しているが、他の実施形態では、聴取領域101は、屋外アリーナを含む、屋外の領域又は位置であってもよい。各実施形態では、スピーカアレイ105は、聴取領域101内に配置されて、一組のユーザ107によって知覚される音声を生成することができる。
図2Aは、一実施形態による例示的なオーディオソース103Aの構成要素図を示している。図1Aに示したように、オーディオソース103Aは、テレビジョン装置であるが、スピーカアレイ105が音声を聴取領域101へ出力できるように、音声コンテンツをスピーカアレイ105に送信できる任意の電子デバイスであってもよい。例えば、他の実施形態では、オーディオソース103Aは、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ホームシアターレシーバ、セットトップボックス、パーソナルビデオプレーヤ、DVDプレーヤ、ブルーレイプレーヤ、ゲームシステム、及び/又はモバイルデバイス(例えばスマートフォン)であってもよい。
図1Aには単一のオーディオソース103によって示しているが、一部の実施形態では、オーディオシステム100は、スピーカアレイ105に接続される多数のオーディオソース103を含んでもよい。例えば、図1Bに示したように、オーディオソース103A及び103Bの両方が、スピーカアレイ105に接続されてもよい。この構成では、オーディオソース103A及び103Bは、スピーカアレイ105の各々を同時に駆動して、別個の音声プログラムコンテンツに対応する音声を出力してもよい。例えば、オーディオソース103Aは、スピーカアレイ105A〜105Cを利用して音声をゾーン113Aへ出力するテレビジョン装置であってもよい一方、オーディオソース103Bは、スピーカアレイ105A及び105Cを利用して音声をゾーン113Bへ出力するラジオであってもよい。オーディオソース103Bは、オーディオソース103Bに関して図2Aに示すものと同様に構成され得る。
図2Aに示すように、オーディオソース103Aは、ハードウェアプロセッサ201及び/又はメモリユニット203を含むことができる。プロセッサ201及びメモリユニット203は、オーディオソース103Aの種々の機能及び動作を実施するのに必要とされる動作を行う、プログラマブルデータ処理構成要素とデータ記憶装置との任意の適切な組合せを表すために、本明細書では概ね用いられる。プロセッサ201は、スマートフォンに典型的に見られるアプリケーションプロセッサであってもよい一方、メモリユニット203は、超小型電子技術による不揮発性ランダムアクセスメモリを表すことができる。オペレーティングシステムが、オーディオソース103Aの種々の機能に固有のアプリケーションプログラムとともにメモリユニット203に記憶され得、これらのプログラムは、プロセッサ201によって走らされるか又は実行されて、オーディオソース103Aの種々の機能を実行する。例えば、レンダリング計画ユニット209が、メモリユニット203に記憶されてもよい。以下で更に詳細に記述するように、レンダリング計画ユニット209は、聴取領域101で再生される音声プログラムコンテンツの各チャネルのビーム属性を生成するために用いられ得る。これらのビーム属性は、オーディオビームを聴取領域101内の対応するオーディオゾーン113へ出力するために用いられ得る。
一実施形態では、オーディオソース103Aは、外部デバイス及び/又はリモートデバイスからオーディオ信号を受信するための1つ以上のオーディオ入力205を含むことができる。例えば、オーディオソース103Aは、ストリーミングメディアサービス及び/又はリモートサーバからオーディオ信号を受信してもよい。オーディオ信号は、音声プログラムコンテンツ(例えば、楽曲又は動画用オーディオトラック)の1つ以上のチャネルを表すことができる。例えば、多チャネル音声プログラムコンテンツの単一のチャネルに対応する単一の信号が、オーディオソース103Aの入力205によって受信されてもよい。別の例では、単一の信号が、単一の信号に多重化される、音声プログラムコンテンツの多数のチャネルに対応してもよい。
一実施形態では、オーディオソース103Aは、外部デバイス及び/又はリモートデバイスからデジタルオーディオ信号を受信するデジタルオーディオ入力205Aを含むことができる。例えば、オーディオ入力205Aは、TOSLINKコネクタ又はデジタル無線インターフェース(例えば、無線ローカルエリアネットワーク(wireless local area network、WLAN)アダプタ又はBluetooth(登録商標)レシーバ)であってもよい。一実施形態では、オーディオソース103Aは、外部デバイスからアナログオーディオ信号を受信するアナログオーディオ入力205Bを含むことができる。例えば、オーディオ入力205Bは、ワイヤ又はコンジットを受け、対応するアナログ信号を受信するように設計される、バインディングポスト、ファーンスタッククリップ、又はフォノプラグであってもよい。
外部ソース又はリモートソースから音声プログラムコンテンツを受信するとして記述しているが、一部の実施形態では、音声プログラムコンテンツは、オーディオソース103Aにローカルに記憶されてもよい。例えば、1つ以上の音声プログラムコンテンツが、メモリユニット203に記憶されてもよい。
一実施形態では、オーディオソース103Aは、スピーカアレイ105又は他のデバイス(例えば、リモートオーディオ/ビデオストリーミングサービス)と通信するためのインターフェース207を含むことができる。インターフェース207は、有線媒体(例えば、コンジット又はワイヤ)を利用して、スピーカアレイ105と通信することができる。別の実施形態では、インターフェース207は、図1A及び図1Bに示したように、無線接続によってスピーカアレイ105と通信することができる。例えば、ネットワークインターフェース207は、IEEE802.11の規格セット、セルラー汎欧州デジタル移動通信システム(Global System for Mobile Communications、GSM(登録商標))規格、セルラー符号分割多元接続(Code Division Multiple Access、CDMA)規格、ロングタームエボリューション(Long Term Evolution、LTE)規格、及び/又はBluetooth規格を含む、スピーカアレイ105と通信するための1つ以上の無線プロトコル及び無線規格を利用してもよい。
図2Bに示すように、スピーカアレイ105は、対応するインターフェース212を介してオーディオソース103Aからオーディオチャネルに対応するオーディオ信号を受信することができる。これらのオーディオ信号は、スピーカアレイ105内の1つ以上のトランスデューサ109を駆動するために用いられ得る。インターフェース207と同様に、インターフェース212は、有線プロトコル及び有線規格、及び/又は、IEEE802.11の規格セット、セルラー汎欧州デジタル移動通信システム(Global System for Mobile Communications、GSM)規格、セルラー符号分割多元接続(Code Division Multiple Access、CDMA)規格、ロングタームエボリューション(Long Term Evolution、LTE)規格、及び/又はBluetooth規格を含む、1つ以上の無線プロトコル及び無線規格を利用することができる。一部の実施形態では、スピーカアレイ105は、スピーカアレイ105内のトランスデューサ109を駆動するために、デジタル−アナログコンバータ217、電力増幅器211、遅延回路213、及びビームフォーマ215を含むことができる。
オーディオソース103Aとは別個に記述し図示しているが、一部の実施形態では、オーディオソース103Aの1つ以上の構成要素が、スピーカアレイ105内に組み込まれてもよい。例えば、スピーカアレイ105の1つ以上は、ハードウェアプロセッサ201、メモリユニット203、及び1つ以上のオーディオ入力205を含んでもよい。
図3Aは、一実施形態によるスピーカアレイ105のうちの1つの側面図を示している。図3Aに示すように、スピーカアレイ105は、多数のトランスデューサ109を湾曲したキャビネット111に収容することができる。示すように、キャビネット111は、円筒形であるが、他の実施形態では、多面体、切頭体、円錐体、角錐体、三角柱、六角柱、又は球体を含む任意の形状であってもよい。
図3Bは、一実施形態によるスピーカアレイ105の断面俯瞰図を示している。図3A及び図3Bに示すように、スピーカアレイ105内のトランスデューサ109は、キャビネット111の湾曲面を覆うようにキャビネット111を取り囲む。トランスデューサ109は、フルレンジドライバ、ミッドレンジドライバ、サブウーファ、ウーファ、及びツイータの任意の組合せであり得る。トランスデューサ109の各々は、円筒状の磁気ギャップを通って軸方向に動くようにワイヤのコイル(例えばボイスコイル)を拘束するフレキシブルサスペンションを介して、強固なバスケット又はフレームに接続された軽量ダイアフラム又はコーンを用いることができる。ボイスコイルは、電気オーディオ信号が加えられると、電流によってボイスコイル内に磁界が生成され、可変電磁石となる。コイルとトランスデューサ109の磁気システムとは、相互作用し、コイル(及び、したがって、取り付けられたコーン)を前後に動かす機械力を生じさせ、それにより、オーディオソース103A等のオーディオソースから来る加えられた電気オーディオ信号の制御の下で音声を再生する。トランスデューサ109として電磁ダイナミックスピーカドライバを用いると記述しているが、当業者は、圧電ドライバ、平面電磁ドライバ、及び静電ドライバ等の他の種類のスピーカドライバが可能であることを認識するであろう。
各トランスデューサ109は、オーディオソース103Aから受信した別個の分離したオーディオ信号に応じて、独立して別個に駆動されて音声を生成することができる。異なるパラメータ及び設定(オーディオ周波数域にわたる遅延、振幅変動、及び位相変動を制御するフィルタを含む)にしたがってスピーカアレイ105内のトランスデューサ109を独立して別個に駆動させることによって、スピーカアレイ105は、オーディオソース103によって出力される音声プログラムコンテンツの各チャネルを正確に表す多くの指向性/ビームパターンを生成することができる。例えば、一実施形態では、スピーカアレイ105は、図4に示す指向性パターンのうちの1つ以上を独立的に又は集合的に生成することができる。
図1A及び図1Bには3つのスピーカアレイ105を含むとして示しているが、他の実施形態では、異なる数のスピーカアレイ105を用いてもよい。例えば、図5Aに示すように、2つのスピーカアレイ105を用いてもよい一方、図5Bに示すように、4つのスピーカアレイ105を聴取領域101内で用いてもよい。スピーカアレイ105の数、種類、及び配置は、時間とともに変化する場合がある。例えば、ユーザ107が、動画の再生中にスピーカアレイ105を移動してもよく、及び/又は、スピーカアレイ105をシステム100に追加してもよい。また、1つのオーディオソース103A(図1A)又は2つのオーディオソース103A及び103B(図1B)を含むとして示しているが、スピーカアレイ105と同様に、オーディオソース103の数、種類、及び配置は、時間とともに変化する場合がある。
一実施形態では、スピーカアレイ105、オーディオソース103、及びユーザ107のレイアウトは、以下で更に詳細に記述するように、種々のセンサ及び/又は入力機器を用いて決定され得る。スピーカアレイ105、オーディオソース103、及び/又はユーザ107の決定されたレイアウトに基づいて、オーディオビーム属性が、聴取領域101で再生される音声プログラムコンテンツの各チャネルについて生成され得る。これらのビーム属性は、以下で更に詳細に記述するように、オーディオビームを対応するオーディオゾーン113へ出力するために用いられ得る。
図6に移って、1つ以上の音声プログラムコンテンツに基づいて、1つ以上のスピーカアレイ105を駆動して聴取領域101内の1つ以上のゾーン113の音声を生成するための方法600について議論する。方法600の各動作は、オーディオソース103A/103B及び/又はスピーカアレイ105の1つ以上の構成要素によって実行され得る。例えば、方法600の動作のうちの1つ以上は、オーディオソース103のレンダリング計画ユニット209によって実行され得る。図7は、一実施形態によるレンダリング計画ユニット209の構成要素図を示している。図7に示すレンダリング計画ユニット209の各要素について、以下に記述する方法600に関して記述する。
上記したように、一実施形態では、オーディオソース103の1つ以上の構成要素が、1つ以上のスピーカアレイ105内に組み込まれ得る。例えば、スピーカアレイ105の1つは、マスタースピーカアレイ105として指定されてもよい。本実施形態では、方法600の動作は、このマスタースピーカアレイ105によって単独で又は主として実行され得、方法600に関して以下で更に詳細に記述するように、マスタースピーカアレイ105によって生成されたデータが他のスピーカアレイ105に分配され得る。
方法600の動作を特定の順序で記述し図示しているが、他の実施形態では、動作は、異なる順序で実行されてもよい。一部の実施形態では、2つ以上の動作が、同時に又は一部重複する期間に実行されてもよい。
一実施形態では、方法600は、音声プログラムコンテンツを表す1つ以上のオーディオ信号の受信によって動作601で開始することができる。一実施形態では、1つ以上の音声プログラムコンテンツは、動作601でスピーカアレイ105のうちの1つ以上(例えばマスタースピーカアレイ105)及び/又はオーディオソース103によって受信され得る。例えば、音声プログラムコンテンツに対応する信号が、動作601でオーディオ入力205のうちの1つ以上及び/又はコンテンツ再分配及び転送ユニット701によって受信されてもよい。音声プログラムコンテンツは、動作601で、ストリーミングインターネットサービス、セットトップボックス、ローカル又はリモートのコンピュータ、パーソナルオーディオ機器及びパーソナルビデオ機器等を含む種々のソースから受信され得る。オーディオ信号がリモートソース又は外部ソースから受信されるとして記述しているが、一部の実施形態では、信号は、オーディオソース103及び/又はスピーカアレイ105に端を発してもよく、それらによって生成されてもよい。
上記したように、オーディオ信号の各々は、スピーカアレイ105によって聴取領域101の各々のゾーン113でユーザ107に対して再生される音声プログラムコンテンツ(例えば、楽曲又は動画用オーディオトラック)を表すことができる。一実施形態では、音声プログラムコンテンツの各々は、1つ以上のオーディオチャネルを含むことができる。例えば、音声プログラムコンテンツが、左前面チャネル、中央前面チャネル、右前面チャネル、左サラウンドチャネル、及び右サラウンドチャネルを含む、5つのオーディオチャネルを含んでもよい。他の実施形態では、5.1、7.1、又は9.1の多チャネルオーディオストリームが用いられ得る。これらのオーディオチャネルの各々は、動作601で受信された対応する信号によって又は単一の信号によって表され得る。
1つ以上の音声プログラムコンテンツを表す1つ以上の信号を動作601で受信すると、方法600は、1)聴取領域101の特性、2)スピーカアレイ105のレイアウト/位置、3)ユーザ107の位置、4)音声プログラムコンテンツの特性、5)オーディオソース103のレイアウト、及び/又は6)各オーディオゾーン113の特性を記述する1つ以上のパラメータを決定することができる。例えば、動作603で、方法600は、聴取領域101の特性を決定することができる。これらの特性は、聴取領域101の大きさ及び形状(例えば、聴取領域101内の壁、床、及び天井の配置)及び/又は聴取領域101の残響特性、及び/又は聴取領域101内の物体の配置(例えば、ソファー、テーブル等の配置)を含むことができる。一実施形態では、これらの特性は、ユーザ入力709(例えば、マウス、キーボード、タッチスクリーン、又は他の任意の入力機器)、及び/又はセンサデータ711(例えば、静止画又はビデオカメラのデータ及びオーディオビーコンデータ)の使用によって決定され得る。例えば、カメラによる画像が、聴取領域101内の障害物の大きさを決定するために利用されてもよく、可聴又は非可聴のテスト音声を利用するオーディオビーコンによるデータが、聴取領域101の残響特性を示してもよく、及び/又はユーザ107は、入力機器709を利用して、聴取領域101の大きさ及びレイアウトを手動で示してもよい。センサデータ711を生成する入力機器709及びセンサは、オーディオソース103及び/又はスピーカアレイ105又は外部デバイスの一部(例えば、オーディオソース103及び/又はスピーカアレイ105と通信しているモバイルデバイス)に組み込まれ得る。
一実施形態では、方法600は、動作605で聴取領域101内及び/又は各ゾーン113内のスピーカアレイ105のレイアウト及び配置を決定することができる。一実施形態では、動作603と同様に、動作605は、ユーザ入力709及び/又はセンサデータ711の使用によって実行され得る。例えば、テスト音声が、スピーカアレイ105の各々によって順次又は同時に発せられ、対応する一組のマイクによって検知されてもよい。これらの検知された音声に基づいて、動作605は、聴取領域101内及び/又はゾーン113内のスピーカアレイ105の各々のレイアウト及び配置を決定してもよい。別の例では、ユーザ107は、ユーザ入力709の使用によって聴取領域101内及び/又はゾーン113内のスピーカアレイ105のレイアウト及び配置の決定を支援してもよい。この例では、ユーザ107は、聴取領域101の写真又はビデオストリームを用いてスピーカアレイ105の位置を手動で示してもよい。スピーカアレイ105のこのレイアウト及び配置は、スピーカアレイ105間の距離、スピーカアレイ105と1人以上のユーザ107との間の距離、スピーカアレイ105と1つ以上のオーディオソース103との間の距離、及び/又はスピーカアレイ105と聴取領域101内若しくはゾーン113内の1つ以上の物体(例えば、壁、ソファー等)との間の距離を含むことができる。
一実施形態では、方法600は、動作607で聴取領域101内及び/又は各ゾーン113内の各ユーザ107の配置を決定することができる。一実施形態では、動作603及び605と同様に、動作607は、ユーザ入力709及び/又はセンサデータ711の使用によって実行され得る。例えば、聴取領域101及び/又はゾーン113のキャプチャされた画像/ビデオが解析されて、聴取領域101内及び/又は各ゾーン113内の各ユーザ107の配置が決定されてもよい。解析は、ユーザ107の配置を検出し決定するための顔認識の使用を含んでもよい。他の実施形態では、マイクが、聴取領域101内及び/又はゾーン113内のユーザ107の位置を検出するために用いられ得る。ユーザ107の配置は、1つ以上のスピーカアレイ105、1つ以上のオーディオソース103、及び/又は聴取領域101内若しくはゾーン113内の1つ以上の物体を基準とし得る。一部の実施形態では、グローバルポジショニングセンサ、動き検出センサ、マイク等を含む他の種類のセンサが、ユーザ107の位置を検出するために用いられ得る。
一実施形態では、方法600は、動作609で、受信された1つ以上の音声プログラムコンテンツに関する特性を決定することができる。一実施形態では、特性は、各音声プログラムコンテンツのチャネルの数、各音声プログラムコンテンツの周波数域、及び/又は各音声プログラムコンテンツのコンテンツ形式(例えば、音楽、会話、又は音響効果)を含むことができる。以下で更に詳細に記述するように、この情報は、音声プログラムコンテンツを再生するために必要とされるスピーカアレイ105の数又は種類を決定するために用いられ得る。
一実施形態では、方法600は、動作611で聴取領域101内及び/又は各ゾーン113内の各オーディオソース103の配置を決定することができる。一実施形態では、動作603、605及び607と同様に、動作611は、ユーザ入力709及び/又はセンサデータ711の使用によって実行され得る。例えば、聴取領域101及び/又はゾーン113のキャプチャされた画像/ビデオが解析されて、聴取領域101内及び/又は各ゾーン113内のオーディオソース103の各々の配置が決定されてもよい。解析は、オーディオソース103の配置を検出し決定するためのパターン認識の使用を含んでもよい。オーディオソース103の配置は、1つ以上のスピーカアレイ105、1人以上のユーザ107、及び/又は聴取領域101内若しくはゾーン113内の1つ以上の物体を基準とし得る。
動作613で、方法600は、聴取領域113内のゾーン113を決定/定義することができる。ゾーン113は、対応する音声プログラムコンテンツに関連付けられる聴取領域101のセグメントを表す。例えば、第1の音声プログラムコンテンツが、上述し図1A及び図1Bに示したように、ゾーン113Aに関連付けられてもよい一方、第2の音声プログラムコンテンツが、ゾーン113Bに関連付けられてもよい。この例では、第1の音声プログラムコンテンツは、ゾーン113Aで再生されるように指定される一方、第2の音声プログラムコンテンツは、ゾーン113Bで再生されるように指定される。円形として示しているが、ゾーン113は、任意の形状で定義されてもよく、任意の大きさであってもよい。一部の実施形態では、ゾーン113は、一部重複することができ、及び/又は聴取領域101全体を囲むことができる。
一実施形態では、聴取領域101内のゾーン113の決定/定義は、ユーザ107の決定された位置、オーディオソース103の決定された位置、及び/又はスピーカアレイ105の決定された位置に基づいて自動的に設定され得る。例えば、ユーザ107A及び107Bがオーディオソース103A(例えばテレビジョン装置)の近くに位置する一方、ユーザ107C及び107Dがオーディオソース103B(例えばラジオ)の近くに位置すると決定すると、動作613は、ユーザ107A及び107Bの周辺の第1のゾーン113A、並びにユーザ107C及び107Dの周辺の第2のゾーン113Bを定義してもよい。他の実施形態では、ユーザ107は、ユーザ入力709を用いて手動でゾーンを定義することができる。例えば、ユーザ107が、キーボード、マウス、タッチスクリーン、又は別の入力機器を利用して、聴取領域101内の1つ以上のゾーン113のパラメータを示してもよい。一実施形態では、ゾーン113の定義は、大きさ、形状、及び/又は、別のゾーン及び/又は別の物体(例えば、ユーザ107、オーディオソース103、スピーカアレイ105、聴取領域101内の壁等)に対する配置を含むことができる。この定義は、音声プログラムコンテンツと各ゾーン113との関連付けを含むこともできる。
図6に示すように、動作603、605、607、609、611、及び613の各々は、同時に実行され得る。しかし、他の実施形態では、動作603、605、607、609、611、及び613の1つ以上は、連続的に又はそうでなければ重複しない様式で実行され得る。一実施形態では、動作603、605、607、609、611、及び613の1つ以上は、レンダリング及び計画ユニット209の再生ゾーン/モード生成器705によって実行され得る。
1)聴取領域101の特性、2)スピーカアレイ105のレイアウト/位置、3)ユーザ107の位置、4)オーディオストリームの特性、5)オーディオソース103のレイアウト、及び6)各オーディオゾーン113の特性を記述する1つ以上のパラメータを取得した後に、方法600は、動作615に移ることができる。動作615では、動作601で受信された音声プログラムコンテンツが、再ミキシングされて、各音声プログラムコンテンツの1つ以上のオーディオチャネルが生成され得る。上記したように、動作601で受信された各音声プログラムコンテンツは、多数のオーディオチャネルを含むことができる。動作615で、オーディオチャネルが、オーディオシステム100の性能及び要件(例えば、スピーカアレイ105の数、種類、及び配置)に基づいて、これらの音声プログラムコンテンツのために抽出され得る。一実施形態では、動作615での再ミキシングは、コンテンツ再分配及び転送ユニット701のミキシングユニット703によって実行され得る。
一実施形態では、動作615での各音声プログラムコンテンツの任意選択的なミキシングには、動作603、605、607、609、611、及び613によって導出されたパラメータ/特性が考慮され得る。例えば、動作615は、音声プログラムコンテンツのアンビエンス又はサラウンドのオーディオチャネルを表すためにスピーカアレイ105の数が十分ではないと決定してもよい。これにより、動作615は、動作601で受信された1つ以上の音声プログラムコンテンツをアンビエンス及び/又はサラウンドチャネルなしでミキシングしてもよい。反対に、動作603、605、607、609、611、及び613によって導出されたパラメータに基づいて、アンビエンス又はサラウンドのオーディオチャネルを生成するためにスピーカアレイ105の数が十分であると決定すると、動作615は、動作601で受信された1つ以上の音声プログラムコンテンツからアンビエンス及び/又はサラウンドチャネルを抽出してもよい。
動作615での受信された音声プログラムコンテンツの任意選択的なミキシングの後に、動作617は、対応する各ゾーン113へ出力される音声プログラムコンテンツの各チャネルに対応する一組のオーディオビーム属性を生成することができる。一実施形態では、属性は、ゲイン値、遅延値、ビーム形式パターン値(例えば、心臓形、無指向性、及び八の字形のビーム形式パターン)、及び/又はビーム角度値(例えば0°〜180°)を含むことができる。各組のビーム属性は、1つ以上の音声プログラムコンテンツのチャネルの対応するビームパターンを生成するために用いられ得る。例えば、図8に示すように、ビーム属性は、1つ以上の音声プログラムコンテンツのQ個のオーディオチャネル及びN個のスピーカアレイ105の各々に対応する。これにより、ゲイン値、遅延値、ビーム形式パターン値、及びビーム角度値のQ×N行列が生成される。これらのビーム属性は、聴取領域101内のゾーン113に関連付けられて集束される、対応する音声プログラムコンテンツのオーディオビームをスピーカアレイ105に生成させる。以下で更に詳細に記述するように、聴取環境(例えば、オーディオシステム100、聴取領域101、及び/又はゾーン113)内で変化が起きると、ビーム属性は、これらの変化に対処するために調節され得る。一実施形態では、ビーム属性は、動作617で、ビーム形成アルゴリズムユニット707を用いて生成され得る。
図9Aは、一実施形態による例示的なオーディオシステム100を示している。この例では、スピーカアレイ105A〜105Dは、音声プログラムコンテンツの5つのチャネルに対応する音声をゾーン113Aへ出力してもよい。特に、スピーカアレイ105Aは、左前面ビーム及び左中央前面ビームを出力し、スピーカアレイ105Bは、右前面ビーム及び右中央前面ビームを出力し、スピーカアレイ105Cは、左サラウンドビームを出力し、スピーカアレイ105Dは、右サラウンドビームを出力する。左中央前面及び右中央前面のビームは、中央前面チャネルを集合的に表すことができる一方、スピーカアレイ105A〜105Dによって生成される他の4つのビームは、音声プログラムコンテンツの5つのチャネルの対応するオーディオチャネルを表す。スピーカアレイ105A〜105Dによって生成されたこれらの6つのビームの各々について、動作615は、上述したファクタの1つ以上に基づいて一組のビーム属性を生成することができる。ビーム属性の組は、聴取環境の変化する条件に基づいて対応するビームを生成する。
図9Aは、単一のゾーン(例えばゾーン113A)で再生される単一の音声プログラムコンテンツに対応しているが、図9Bに示すように、スピーカアレイ105A〜105Dは、別のゾーン(例えばゾーン113B)で再生される別の音声プログラムコンテンツのオーディオビームを同時に生成してもよい。図9Bに示すように、スピーカアレイ105A〜105Dは、上述した音声プログラムコンテンツの5つのチャネルをゾーン113Aで表すために6つのビームパターンを生成する一方、スピーカアレイ105A及び105Cは、2つのチャネルを有する第2の音声プログラムコンテンツをゾーン113Bで表すために追加の2つのビームパターンを生成してもよい。この例では、動作615は、スピーカアレイ105A〜105Dによって再生される7つのチャネル(すなわち、第1の音声プログラムコンテンツの5つのチャネル及び第2の音声プログラムコンテンツの2つのチャネル)に対応するビーム属性を生成してもよい。ビーム属性の組は、聴取環境の変化する条件に基づいて対応するビームを生成する。
各々の場合では、ビーム属性は、対応する各ゾーン113、ゾーン113内の一組のユーザ107、及び対応する音声プログラムコンテンツを基準とすることができる。例えば、図9Aに関して上述した第1の音声プログラムコンテンツのビーム属性は、ゾーン113Aの特性、ユーザ107A及び107Bに対するスピーカアレイ105の配置、並びに第1の音声プログラムコンテンツの特性に関して生成されてもよい。対照的に、第2の音声プログラムコンテンツのビーム属性は、ゾーン113Bの特性、ユーザ107C及び107Dに対するスピーカアレイ105の配置、並びに第2の音声プログラムコンテンツの特性を基準としてもよい。これにより、第1及び第2の音声プログラムコンテンツの各々は、各々のゾーン113A及び113Bの条件に対して対応する各オーディオゾーン113A及び113Bで再生され得る。
動作617の後、動作619は、ビーム属性の組の各々を対応するスピーカアレイ105に送信することができる。例えば、図9Bのスピーカアレイ105Aは、第1の音声プログラムコンテンツの各左前面ビーム及び左前面中央ビームに対応する3組のビームパターン属性と、第2の音声プログラムコンテンツのビームパターン属性とを受信してもよい。スピーカアレイ105は、これらのビーム属性を用いて、動作601で受信された各音声プログラムコンテンツの音声を対応する各ゾーン113で連続的に出力することができる。
一実施形態では、各音声プログラムコンテンツは、関連付けられたビームパターン属性の組とともに対応するスピーカアレイ105に送信され得る。他の実施形態では、これらの音声プログラムコンテンツは、ビームパターン属性の組とは別個に各スピーカアレイ105に送信され得る。
音声プログラムコンテンツ及び対応するビームパターン属性の組を受信すると、スピーカアレイ105は、動作621で、トランスデューサ109の各々を駆動して、対応するビームパターンを対応するゾーン113で生成することができる。例えば、図9Bに示すように、スピーカアレイ105A〜105Dは、ゾーン113A及び113Bで2つの音声プログラムコンテンツのビームパターンを生成してもよい。上述したように、各スピーカアレイ105は、これらのビームパターン属性及び音声プログラムコンテンツに基づいて、トランスデューサ109を駆動してビームパターンを生成するために、対応するデジタル−アナログコンバータ217、電力増幅器211、遅延回路213、及びビームフォーマ215を含むことができる。
動作623で、方法600は、動作603、605、607、609、611、及び613の実行によって、音声システム100内、聴取領域101内、及び/又はゾーン113内で何かが変化したかを判定することができる。例えば、変化は、スピーカアレイ105の移動、ユーザ107の移動、音声プログラムコンテンツの変化、聴取領域101内及び/又はゾーン113内での別の物体の移動、オーディオソース103の移動、ゾーン113の再定義等を含んでもよい。変化は、動作623でユーザ入力709及び/又はセンサデータ711の使用によって決定され得る。例えば、聴取領域101及び/又はゾーン113の画像が、変化が起きたかを判定するために連続的に検査されてもよい。聴取領域101内及び/又はゾーン113内の変化を決定すると、方法600は、動作603、605、607、609、611、及び/又は613に戻って、1)聴取領域101の特性、2)スピーカアレイ105のレイアウト/位置、3)ユーザ107の位置、4)音声プログラムコンテンツの特性、5)オーディオソース103のレイアウト、及び/又は6)各オーディオゾーン113の特性を記述する1つ以上のパラメータを決定することができる。これらのデータを用いることによって、新しいビームパターン属性が、上述した同様の技術を用いて構成され得る。反対に、変化が動作623で検出されなかった場合、方法600は、動作621で事前に生成されたビームパターン属性に基づいてビームパターンを出力し続けることができる。
動作623で聴取環境の変化を検出するとして記述しているが、一部の実施形態では、動作623は、別のトリガイベントが起きたかどうかを判定してもよい。例えば、他のトリガイベントは、期間の経過、オーディオシステム100の初期設定等を含んでもよい。これらのトリガイベントの1つ以上を検出すると、動作623は、上述したように聴取環境のパラメータを決定するために、動作603、605、607、609、611、及び613に移行するように方法600を導くことができる。
上述したように、方法600は、スピーカアレイ105の配置/レイアウト、ユーザ107の配置、聴取領域101の特性、音声プログラムコンテンツの特性、及び/又は聴取環境の任意の他のパラメータに基づいて、ビームパターン属性を生成することができる。これらのビームパターン属性は、スピーカアレイ105を駆動して、聴取領域の別個のゾーン113で1つ以上の音声プログラムコンテンツのチャネルを表すビームを生成するために用いられ得る。聴取領域101内及び/又はゾーン113内で変化が起きると、ビームパターン属性は、変化した環境を反映するように更新され得る。これにより、オーディオシステム100によって生成される音声には、聴取領域101及びゾーン113の可変の条件が連続的に考慮され得る。これらの変化する条件に適応することによって、オーディオシステム100は、種々のゾーン113で各音声プログラムコンテンツを正確に表す音声を再生することができる。
上で説明したように、本発明のある実施形態が、製造物品であることができ、同製造物品では、機械可読媒体(超小型電子技術によるメモリ等)が、上述した動作を実行するように1つ以上のデータ処理構成要素(本明細書では概して「プロセッサ」と称される)をプログラムする命令を記憶している。他の実施形態では、これらの動作の一部は、結線論理(例えば、専用のデジタルフィルタブロック及びステートマシン)を含む特定のハードウェア構成要素により実行され得る。これらの動作は、代わりに、プログラムされたデータ処理構成要素と固定された結線回路構成要素との任意の組合せにより実行されてもよい。
いくつかの実施形態を記述し添付の図面に図示してきたが、このような実施形態は、大まかな発明を例示するものにすぎず、限定するものではないこと、また、他の種々の変更が当業者によって想起され得るので、本発明は、図示及び記述した特定の構成及び配置には限定されないことが理解されるべきである。よって、説明は、限定的ではなく例示的であると見なされるべきである。