JP2023551090A

JP2023551090A - 音を出力する方法及びスピーカ

Info

Publication number: JP2023551090A
Application number: JP2023522355A
Authority: JP
Inventors: グラウゴー，ラース
Original assignee: CLANG
Current assignee: CLANG
Priority date: 2020-10-07
Filing date: 2021-09-24
Publication date: 2023-12-07
Also published as: WO2022073775A1; US20230370777A1; EP4226651A1

Abstract

オーディオ信号を複数のスピーカトランスデューサのための信号に変換する方法であって、オーディオ信号は、各々が特定の周波数間隔を表すオーディオサブ信号に分割され、各スピーカトランスデューサのための信号は、経時的に変化する各オーディオサブ信号の一部を含む。

Description

本発明は、音を出力する方法に関し、特に、音信号に空間情報を付与する方法に関するものである。

既知のスピーカシステムは、ステレオセットアップ、サラウンドセットアップ、または全方向性セットアップであり、スピーカが異なる周波数帯域用のスピーカトランスデューサから構成されていても、同じスピーカトランスデューサがその帯域内の電気オーディオ信号の少なくとも実質的にすべてを受信し、その帯域の音の少なくとも実質的にすべてを常に出力するという意味で、静止スピーカが「静止」オーディオ信号を出力する。

無指向性スピーカシステムは、中心点から３６０度にわたって放射状に音を反射し、音の分散は実質的に垂直面内にある。モノラルやステレオの音を分散させるための戦略が異なり、ドライバを真上や斜めに向けた全指向性システムもあれば、曲面や円錐形の反射板にドライバを上向きに放射させるシステムもある。全方位型と言いながら、いずれも真の球体スピーカシステムではなく、固定または静止した状態で目的の波形を放射することを目的としている。

従来のサラウンドシステムは、リスナの前方、側方、後方に配置された複数のスピーカ振動子を用いて、再生音の忠実度と奥行きを豊かにすることを目的としている。サラウンドサウンドシステムには、様々な形式や数のスピーカトランスデューサが存在するが、それらはすべて、固定または静止した方法で所望の波形を放出することを目的としている。これは、設置された膨大な数の異なる音響空間のリスニング環境に関係なく、あるいは、カスタマイズ可能な音場として、特定のリスニング環境に音を合わせる自動化またはユーザ定義のプロセスに基づいている場合がある。これらのシステムに共通するのは、リスニング環境が再生に与える影響を無視、あるいは否定、中断することを目的としていることであり、一度確立されたこれらの固定、カスタマイズ可能、あるいはユーザ定義可能な音場は安定したままである。

その結果、これらの従来のシステムは、ある設置配置における「最適」な再生と、あるリスニング環境における「理想的」なリスニングポジションで動作する。その結果、スピーカによる比較的貧弱な音楽再生と、アコースティック演奏による複雑で豊かな音の拡散との間に著しい差が生じ、この差はオーディオシステム業界を当初から苦しめてきた。また、このようなシステムは、スタジオ録音やデジタルで制作された音楽コンテンツなど、音響的に制作されていない他の音場に対して、豊かさを提供することができない。さらに、音響空間は、空間内の人、物、その他の要素の細かな動きにより、完全に一定であることはなく、音の全体的な知覚品質にとって重要な微細な変化を音に与える。本オーディオシステムはまた、入力されるオーディオ信号に追加の３次元オーディオキューをもたらす、または調達するそのプロセスにおいて、この事実を考慮に入れることができ、それによって、リスナは、リスナが音源と同じ空間にいるかのように、３次元の方法でサウンド再生を聞く。これは２次元的な方法とは対照的で、リスナは、高度に決定されたリスニングポジションと条件にいない限り、リスニングスペースに外から入ってきたかのように音を聞くことになる。

本発明の第１の態様は、オーディオ信号に基づいて音声を出力する方法に関し、該方法は、
オーディオ信号を受信するステップと、
オーディオ信号から複数のオーディオサブ信号を生成するステップであって、各オーディオサブ信号は、１００－８０００Ｈｚの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれない、生成するステップと、
各々が少なくとも１００－８０００Ｈｚの間隔でサウンドを出力することができる複数のサウンド出力ドライバまたはラウドスピーカトランスデューサを備えたスピーカを提供するステップであって、そのスピーカトランスデューサは部屋または会場内に配置される、提供するステップと、
各ラウドスピーカトランスデューサに対して電気サブ信号を生成するステップであって、各電気サブ信号は、各オーディオサブ信号の所定の部分を構成する、生成するステップと、
前記電気サブ信号を前記スピーカトランスデューサに供給するステップと
を含み、
前記電気サブ信号を生成するステップは、各電気サブ信号のオーディオサブ信号の所定部分を、経時的に、変更するステップを含む。

本明細書において、オーディオ信号は、アナログ又はデジタルなどの任意のフォーマットで受信されることができる。信号は、モノラル信号、ステレオオーディオ信号、サラウンドサウンド信号など、任意の数のチャネルをそこに含んでいてもよい。オーディオ信号は、多くの場合、ＦＬＡＣ、ＡＬＡＣ、ＡＰＥ、ＯＦＲ、ＴＴＡ、ＷＶ、ＭＰＥＧなどのコーデックによって符号化される。多くの場合、オーディオ信号は、オーディオ信号が４０Ｈｚ～１５ｋＨｚのようなより狭い周波数間隔に適していても、２０Ｈｚ～２０ｋＨｚの可聴周波数間隔の全て又は大部分の周波数からなる。

オーディオ信号は、通常、物理的又は音の所望の出力に対応し、ここで、対応とは、オーディオ信号が、少なくとも所望の周波数帯域内で、音と同じ周波数成分、しばしば同じ相対的信号強度を有することである。そのような成分及び相対的な信号強度は、しばしば時間の経過とともに変化するが、対応関係は、好ましくは変化しない。

オーディオ信号は、無線で、又はケーブル（光又は電気）のようなワイヤを介して搬送されることがある。オーディオ信号は、ストリーミングまたはライブセッションから、または任意の種類のストレージから受信されてもよい。

オーディオ信号又は少なくともその周波数間隔に対応する音信号を出力することが所望される。本発明は、人間の耳が音が届く方向を判断できる周波数帯域の音と、この周波数区間内の音の部屋や会場での相互作用に注目する。この周波数間隔は、１００～８０００Ｈｚの周波数間隔と見なすことができるが、所望により、例えば３００～７ｋＨｚ、３００～６ｋＨｚ、４００～４ｋＨｚ、または２００～６ｋＨｚの間で選択することができる。

聴覚系は音源定位のために、両耳間の時間・レベル差（または強度・ラウドネス差）、スペクトル情報、タイミング解析、相関解析、パターンマッチングなど、いくつかの手がかりを用いる。耳間レベル差は、１．５００Ｈｚ～８０００Ｈｚの範囲で起こっており、レベル差は周波数依存性が高く、周波数が高くなるにつれて大きくなる。聴覚間時間差は８００－１．５００Ｈｚの範囲で優勢であり、聴覚間位相差は８０－８００Ｈｚの範囲である。

４００Ｈｚ以下の周波数では、頭の寸法（耳の距離２１．５ｃｍ、６２５μｓの耳間時間差に相当）が音波の１／４波長より小さいので、耳間の位相差の混乱が問題になり始める。２００Ｈｚ以下では、耳間レベル差が非常に小さくなり、ＩＬＤだけでは入力方向の正確な評価がほぼ不可能になる。８０Ｈｚ以下では、位相差、ＩＬＤ、ＩＴＤのすべてが小さくなり、音の方向を決定することができなくなる。

同じように頭の大きさを考慮すると、１．６００Ｈｚ以上の周波数では、頭の大きさが音波の波長より大きくなるため、位相情報が曖昧になる。しかし、ＩＬＤは大きくなり、さらに高周波数では群遅延が顕著になる。つまり、音のオンセット、トランジェントがあれば、このオンセットの耳間の遅延を利用して、対応する音源の入力方向を決定することができる。このメカニズムは、残響環境において特に重要になる。

本発明によれば、オーディオ信号から多数のオーディオサブ信号が生成され、各オーディオサブ信号は、１００～８０００Ｈｚの周波数間隔内のオーディオ信号を表し、あるサブ信号の周波数間隔は、別のサブ信号の周波数間隔に完全に含まれることはない。したがって、サブ信号は、周波数間隔内のオーディオ信号を表す。サブ信号は、オーディオ信号の関連部分を構成することが望まれる場合がある。サブ信号は、所望の周波数間隔を選択するために、オーディオ信号にバンドパスフィルタ及び／又は１つ以上のハイパス及び／又はローパスフィルタを適用することによって生成されてもよい。サブオーディオ信号は、周波数間隔内のオーディオ信号と同一であってもよいが、フィルタはその端部（極端な周波数）では理想的でないことが多く、例えばハイパスフィルタの中心周波数以下の周波数はある程度通過させるようにフィルタが品質を失うことが多い。

どのオーディオサブ信号も、他のオーディオサブ信号の周波数間隔に完全に含まれる周波数間隔を有していない。したがって、オーディオサブ信号はすべて、オーディオ信号の異なる周波数間隔を表現する。したがって、１００～８０００Ｈｚの区間内の各周波数について、オーディオサブ信号におけるそれらの表現は同じではないだろう。周波数は、オーディオサブ信号の１つまたは複数の周波数間隔内に入り、他のものには入らない場合がある。当然ながら、周波数間隔が重なることもある。フィルタリング効率（Ｑ値）は、所望に応じて選択することができる。フィルタリングは、ディスクリート部品、ＤＳＰ、プロセッサ等で実行されてもよい。

音または少なくともオーディオサブ信号によって定義される音を出力するために、少なくとも１００～８０００Ｈｚの所望の周波数区間で音を出力することができる複数の音出力スピーカトランスデューサをそれぞれ含むスピーカが提供される。スピーカトランスデューサは、同一のものであってもよいし、同一のインピーダンス曲線などの同一の特性を有していてもよい。あるいは、スピーカトランスデューサは、異なるタイプのものであってもよい。オーディオ信号又はオーディオサブ信号のような同一の信号が、各ラウドスピーカトランスデューサから出力されたときに同一の音を発生することが好ましい。それにもかかわらず、異なるタイプまたは異なる特性を有するスピーカトランスデューサを使用することができる。例えば、スピーカトランスデューサ用の電気サブ信号が当該スピーカトランスデューサに適合され、すべてのスピーカトランスデューサが少なくとも実質的に同じ音を出力する、すなわち、それぞれが、１つまたは複数の周波数などの音出力と、音を生成するためにスピーカトランスデューサに適合され投入された信号と、の関係が同じである場合、スピーカトランスデューサは、このようになる。

ラウドスピーカトランスデューサは、部屋または会場内に配置され、少なくとも３つの異なる方向に向けられることがある。部屋または会場は、１つまたは複数の壁、天井、および床を有することができる。部屋または会場は、壁／天井／床／柱などの１つまたは複数の音反射要素を有することが好ましい。

スピーカトランスデューサの組み合わせは、平らな表面から離れる球の半分のような１８０度の球を表現するように選択されることもある。このような平坦な表面は、キーボード表面、ラップトップ表面、またはスクリーン表面である可能性がある。

スピーカトランスデューサの方向は、スピーカトランスデューサによって出力される音波の主方向であってよい。スピーカトランスデューサは、最も高い音強度が出力される、または音強度プロファイルが多かれ少なかれ対称である周りの、対称軸などの軸を有することができる。

スピーカトランスデューサは、少なくとも３つの異なる方向に向けられる。方向は、垂直または水平面に投影したとき、または交差するように変換したときなど、これらの間に少なくとも５°、例えば少なくとも１０°、例えば少なくとも２０°の角度が存在する場合、異なることがある。２つの方向間の角度は、２つの方向間の可能な最小の角度であってよい。２つの方向は、同じ軸に沿って、反対方向に伸びることがある。明らかに、４、５、６、７、８、１０個以上のスピーカトランスデューサが使用される場合など、３つ以上の異なる方向が好まれる場合がある。

特に興味深い実施形態は、１つのラウドスピーカトランスデューサが立方体の各面に設けられ、立方体から離れた方向に音を出力するように向けられるものである。この実施形態では、６つの異なる方向が使用されている。別の実施形態では、ラウドスピーカトランスデューサは、壁、天井、床に配置され、ラウドスピーカトランスデューサ間の空間に音を送り込むような方向になっている。

各ラウドスピーカトランスデューサのために、電気サブ信号が生成される。このように、各スピーカトランスデューサは、他のスピーカトランスデューサから独立して操作することができる。明らかに、多数のスピーカトランスデューサが使用される場合、複数のスピーカトランスデューサは、同一に駆動または操作される可能性がある。そのような同一に駆動されるスピーカトランスデューサは、同じ方向又は異なる方向を有することができる。

この文脈では、電気サブ信号は、ラウドスピーカトランスデューサに意図された信号である。この信号は、ラウドスピーカトランスデューサに直接供給されてもよいし、増幅及び／又はフィルタリングなどによって、ラウドスピーカトランスデューサに適合されてもよい。さらに、電気サブ信号は、光、無線、または電気配線など、任意の形式であってよい。電気サブ信号は、所望により任意のコーデックを用いて符号化されてもよく、デジタル又はアナログであってもよい。スピーカトランスデューサは、電気サブ信号を受信してスピーカトランスデューサを駆動するために、減圧、フィルタ、増幅器、受信機、ＤＡＣなどを含んでいてもよい。

各電気サブ信号は、スピーカトランスデューサに供給される前に、任意の所望の方法で適合させることができる。一実施形態では、電気サブ信号は、スピーカトランスデューサに供給される前に増幅される。その実施形態または別の実施形態では、電気サブ信号は、その周波数特性が当該ラウドスピーカトランスデューサのものに適合されるように、フィルタリングまたは等化などの適合がなされることがある。異なるラウドスピーカトランスデューサに対して異なる増幅及び適応が望まれる場合がある。

各電気サブ信号は、各オーディオサブ信号の所定の部分を構成し、又は表現する。この部分は、一部のオーディオサブ信号ではゼロであることもある。次に、各オーディオサブ信号は、数学的な言い方をすれば、重みまたは係数を掛けられ、その後、すべての結果のオーディオサブ信号が合計されて電気サブ信号が形成される場合がある。明らかに、この処理は、コンピュータ、プロセッサ、コントローラ、ＤＳＰ、ＦＰＧＡなどで行われることがあり、このコンピュータは、その後、スピーカトランスデューサに供給するために、またはスピーカトランスデューサに供給する前に変換／受信／適応／増幅されるために、電気サブ信号または各電気信号を出力する。

当然ながら、電気サブ信号及び／又はオーディオサブ信号は、その生成とスピーカトランスデューサへの供給との間に保存されることがある。したがって、実際のオーディオ信号に加えて、またはその代わりに、そのような信号が保存される新しいオーディオフォーマットが見られ得る。

電気サブ信号がスピーカトランスデューサに供給されると、音が出力される。

オーディオサブ信号の和が、オーディオサブ信号の外側周波数間隔内に提供されるオーディオ信号の部分と少なくとも実質的に同一であることが好ましい。したがって、オーディオサブ信号は、オーディオ信号のその部分を表すように選択され得る。この全体的な周波数間隔の外側にあるオーディオ信号の部分は、異なる方法で処理されることがある。この文脈では、オーディオサブ信号の和の強度は、オーディオ信号の対応する部分のエネルギ／ラウドネスの１０％以内、例えば５％以内であってよい。また、代替的に、合成されたオーディオサブ信号の１００Ｈｚ、５０Ｈｚ又は１０Ｈｚなどの所定の幅の各周波数区間におけるエネルギ／ラウドネスは、オーディオ信号の同じ周波数区間におけるエネルギ／ラウドネスの５％以内など、１０％以内であってもよい。

当然のことながら、全体的な願望として、オーディオ信号のその周波数間隔内の周波数成分を不明瞭にしないように、スケーリングまたは増幅が許容される場合がある。したがって、周波数間隔内の１つ、２つ、３つ、複数または２つの周波数の各組について、その周波数での、合計されたオーディオサブバンドの強度が、オーディオ信号の強度の１０％以内、例えば５％以内であることが望まれ得る。したがって、相対的な周波数強度が維持されることが望まれる。

同様に、電気サブ信号の和は、電気サブ信号の外側の周波数間隔内に提供されるオーディオ信号の部分と少なくとも実質的に同一であることが好ましい。したがって、電気サブ信号は、オーディオ信号のその部分を表すことができる。この全体的な周波数間隔の外側にあるオーディオ信号の部分は、他のトランスデューサによって扱われることがある。この文脈では、電気サブ信号の和の強度は、オーディオ信号の対応する部分のエネルギ／ラウドネスの１０％以内、例えば５％以内であってよい。また、代替的に、電気サブ信号の合計の１００Ｈｚ、５０Ｈｚ又は１０Ｈｚなどの所定の幅の各周波数区間におけるエネルギ／ラウドネスは、オーディオ信号の同じ周波数区間におけるエネルギ／ラウドネスの５％以内など、１０％以内である場合がある。

当然のことながら、全体的な願望として、オーディオ信号のその周波数間隔内の周波数成分を不明瞭にしないように、スケーリングまたは増幅が許容される場合がある。したがって、周波数間隔内の１つ、２つ、３つ、複数、または２つの周波数の各組について、その周波数での、合計された電気サブバンドの強度が、オーディオ信号の強度の１０％以内、例えば５％以内であることが望まれ得る。このように、相対的な周波数強度は、オーディオ信号から音出力まで維持されることが望ましい。

明らかに、電気サウンド信号は、オーディオ信号が正しく表現されるように、すべてのスピーカトランスデューサからの音出力が相関するように調整されることが望まれる。したがって、オーディオサブ信号、電気サブ信号、および任意の適応／増幅の生成は、好ましくは、信号の調整および位相を保持する。

本発明によれば、電気サブ信号の生成は、各電気サブ信号におけるオーディオサブ信号の所定部分を経時的に変化させることからなる。したがって、各電気サブ信号の生成は、上記の数学的な話し方に戻ると、オーディオサブ信号に掛けられる重み（複数可）が時間と共に変化し、電気サブ信号において、所定のオーディオサブ信号の割合が時間と共に変化するように行われる。

部分または割合が時間とともに変化する方法は、以下に説明する多くの方法で選択することができる。一つの方法として、オーディオサブ信号は、それぞれがその特定の信号に対応する音を出力する仮想ラウドスピーカトランスデューサと考えることができる。実際のラウドスピーカトランスデューサの１つ以上は、仮想ラウドスピーカトランスデューサの音の一部を、実際のラウドスピーカトランスデューサのどこに配置され、どのように指示されるかに応じて出力する。この種の抽象化は、標準的なステレオセットアップにも見られ、クラシックオーケストラの弦楽器セクションなどの仮想音源の位置は、ステレオセットアップの実際のラウドスピーカトランスデューサから離れた場所に配置されていても、この仮想位置から来るかのように聞こえる音で表現されることがある。

このように、電気サブ信号に含まれるオーディオサブ信号の部分は、オーディオサブ信号に対応する仮想ラウドスピーカトランスデューサの所望の位置、および潜在的な方向と、実際のラウドスピーカトランスデューサの位置、および潜在的な方向の相関によって決定することができる。位置が近いほど、また関連する場合は方向が揃っているほど、そのスピーカトランスデューサの電気サブ信号の中にオーディオサブ信号の大きな部分が見られる可能性がある。

この決定は、例えば、球などの幾何学的形状上で、実スピーカトランスデューサと仮想スピーカトランスデューサの位置をシミュレーションすることによって行うことができ、実スピーカトランスデューサは固定位置を有するが、仮想スピーカトランスデューサはその形状上を移動することが許される。そして、実ラウドスピーカトランスデューサの電気信号における仮想ラウドスピーカトランスデューサのオーディオ信号の部分は、当該仮想ラウドスピーカトランスデューサと仮想実ラウドスピーカトランスデューサとの間の距離に基づいて決定され得る。

一実施形態では、オーディオ信号を受信するステップは、ステレオ信号を受信することを含んでいる。この状況において、オーディオサブ信号を生成するステップは、ステレオオーディオ信号の各チャネルに対して、複数のオーディオサブ信号を生成することからなり得る。

そして、多数のオーディオサブ信号が右チャネルに関連し、多数のオーディオサブ信号が左チャネルに関連することがある。少なくとも実質的に同じ周波数間隔を有する左チャネルの１つのオーディオサブ信号と右チャネルの１つのサブ信号の組が存在し、そのような組の仮想スピーカトランスデューサが少なくとも実質的に反対方向に、または少なくとも同じ方向には向けられないことが望まれ得る。これは、ラウドスピーカトランスデューサの位置と潜在的な方向を知りながら、電気サブ信号の部分を適宜選択することによって得られる。また、オーディオサブ信号の各ペアがより独立性を持ち、協調を持たないこと、または協調が同じサブバンドの左チャネルと右チャネルとの間の方向における完全な一致を回避することに関係することが望まれることもある。

一実施形態では、オーディオ信号を受信するステップは、モノラル信号を受信することと、オーディオ信号から、モノラル信号に対して少なくとも実質的に位相が反転している第２の信号を生成することとを含む。この状況では、オーディオサブ信号を生成するステップは、モノラルオーディオ信号および第２の信号のそれぞれについて、複数のオーディオサブ信号を生成することからなる場合がある。

そして、これら２つの信号は、ステレオ信号の上記左信号および右信号として扱われ、多数のオーディオサブバンドがモノラル信号に関連し、多数のオーディオサブバンドが他のチャネルに関連し得るようにすることができる。少なくとも実質的に同じ周波数間隔を有するモノラル信号の１つのオーディオサブバンドと他の信号の１つのサブバンドのペアが存在し、そのようなペアの仮想スピーカトランスデューサが少なくとも実質的に反対方向に、または少なくとも同じ方向には向かないことが望まれ得る。これは、ラウドスピーカトランスデューサの位置、潜在的な方向を知りながら、電気サブ信号における部分を適宜選択することによって得られる。

空間的なオーディオキューがある中央帯域のサブ帯域は、いくつかの手段によって生成または定義することができ、サブ帯域の数は一般に多いほど良い結果をもたらす。また、周波数の境界を対数的に設定することも利点となり、１つのサブバンド分割は、１００、３００、１．２００、４０００に境界（Ｈｚ）を持つ３バンドにすることができる。別の分割では、ここでは６バンドで、１００、２００、４００、８００、１．６００、３．２００、６．４００に境界（Ｈｚ）を持つことができる。このような低い数のサブバンドは、１、２、３またはそれ以上の仮想ドライバに与えることができ、同じサブバンドが仮想球の異なる位置にある１、２、３またはそれ以上の同時仮想ドライバに分配されるようにする。これにより、仮想ドライバの数は、結果として得られるオーディオ球の滑らかさに大きく貢献するため、結果が向上する。

サブバンドの分割は、例えば、心理音響学的なスケールであるＢａｒｋスケールのように、等距離が知覚的に等距離に対応するような他の概念に従うこともできる。Ｂａｒｋスケールで１８個のサブバンドを分割した場合、サブバンドの境界（Ｈｚ）は、１００、２００、３００、４００、５１０、６３０、７７０、９２０、１０８０、１２７０、１４８０、１７２０、２０００、２３２０、２７００、３１５０、３７００、４４００に設定する。

多数のサブバンドの場合、１／３オクターブへの分割も成功し、サブバンドの境界（Ｈｚ）は１１１、１４０、１８０、２２４、２８１、３５３、４４９、５６１、７０７、８９８、１１２２、１４０３、１７９５、２２４４、２８０５、３５３４、４４８８、５６１０、７０６９とする。

また、サブバンドは減算によって構成することもでき、５サブバンド減算法では、１００、２００、４００、８００、１．６００、３．２００にサブバンド境界（Ｈｚ）を与え、各仮想ドライバのサブバンドは、ｂａｎｄ１＋ｂａｎｄ３、ｂａｎｄ１＋ｂａｎｄ４、ｂａｎｄ２＋ｂａｎｄ４、ｂａｎｄ２＋ｂａｎｄ５、ｂａｎｄ３＋ｂａｎｄ５という組み合わせからなる。

さらに、サウンドスフィアへの入射音のスムーズなレンダリングを提供することができるため、動的境界アプローチも可能であり、これについては本書の他の箇所で詳しく説明する。

上記のサブバンド境界を決定する方法の例は、サウンドスフィアの音色、または「フレーバー」がある程度変化するという点で、すべてわずかに異なる結果を提供する。しかし、これらはすべて、オーディオ球における空間オーディオキューの追加、または調達に備えるための、許容され、概念的に一貫した方法である。

上記のように任意の数のバンドを使用してサブバンド境界が決定されると、各サブバンドにおける信号のエネルギ、パワー、ラウドネス又は強度の推定値を計算することが可能である。これは通常、二乗和や対数演算などの非線形、時間平均演算、さらに平滑化を含み、その結果、互いに比較できるサブバンド量、またはピンクノイズなどのターゲット信号の量を得ることができる。この比較により、サブバンド量に一定のゲイン係数を乗じることで調整することが可能である。このゲインは、１）ピンクノイズのような理論的な信号またはノイズモデルによって決定される、２）リアルタイム動作で測定された最高ゲインをあらかじめ決められたレベル内に保存することによって動的に推定される、３）トレーニングで過去に観測されたゲインの機械学習による、などがある。サブバンド量を調整する別の方法は、本書の他の箇所で深く議論されているように、境界の周波数を動的に変更することである。

一実施形態は、オーディオ信号から、１００Ｈｚなどの第１の閾値周波数以下の周波数を有するその低周波部分を導出するステップと、低周波部分を全ての電気サブ信号に少なくとも実質的に均等に、または同じ仮想ドライバのサブ信号に比例して含むステップとをさらに含む。この態様では、低周波を有するオーディオ信号は、全てのオーディオサブ信号および／または全ての電気サブ信号によって出力される。代替的に、この低周波信号を一部のオーディオサブ信号および／または一部の電気サブ信号のみに提供することが望まれ得る。

代替案としては、この低周波をスピーカトランスデューサによってではなく、１つまたは複数の別個のスピーカトランスデューサによって提供することが考えられる。

一実施形態は、オーディオ信号から、８０００Ｈｚなどの第２の閾値周波数を超える周波数を有するその高域部分を導出するステップをさらに含み、この高域部分を、すべての電気サブ信号において少なくとも実質的に均等に、または同じ仮想ドライバのサブ信号に対して比例して含ませる。このようにして、高周波を有するオーディオ信号は、全てのオーディオサブ信号及び／又は全ての電気サブ信号によって出力される。代替的に、この高周波信号を一部のオーディオサブ信号および／または一部の電気サブ信号のみに提供することが望まれ得る。

代替案としては、この高周波をスピーカトランスデューサによってではなく、１つ以上の別個のスピーカトランスデューサによって提供することが考えられる。

上述のように、各電気サブ信号で表されるオーディオサブ信号の部分の選択は、多くの考慮事項に基づいて実行され得る。

ある状況では、各オーディオサブ信号および／または電気サブ信号における音エネルギ、ラウドネスまたは強度が同じであるか、または少なくとも実質的に同じであることが所望され得る。他方、例えば異なる周波数の組の強度／ラウドネスの間に見られる対応が、オーディオ信号と音出力において同じか、少なくとも実質的に同じであるべきであるように、全体の音出力がオーディオ信号に対応することが望まれる場合がある。したがって、オーディオサブバンドにおけるエネルギまたはラウドネスは、当該周波数間隔における１つ、より多くの、またはすべての周波数においてその強度／ラウドネスを増加させることによって増加することができるが、これは所望されないかもしれない。あるいは、周波数間隔内の強度／ラウドネスは、周波数間隔を広げることによって増加させることができる。このような動的境界アプローチは、低周波数成分及び高周波数成分に係る、組み合わせた周波数帯の２つの外側周波数境界を決定するためにも使用することができる。これは、個々の周波数帯域が計算される前に計算されてもよく、これらの外側周波数境界は、結合されたスピーカトランスデューサによって放射される結合信号のコヒーレンスが、入力音との対応、または類似性の望ましい程度を有するように計算されてもよい。

この文脈では、音又は信号のエネルギ、ラウドネス又は強度は、多くの方法で決定することができる。一つの方法は、特定の周波数帯域の振幅に対応する、変換の各周波数ビンの大きさを返すフーリエ変換によって、スペクトル包絡線を計算することであろう。その後、得られたエンベロープを周波数領域で重みとして積分し、結果をサブバンドの数に相当する数の等しいサイズにセグメント化すると、境界が積分から得られる各セグメントの周波数軸上の交点に一致するため、サブバンドの新しい周波数境界が得られる。

別の方法としては、フィルタバンク分析によってスペクトル包絡線を計算することが考えられ、フィルタバンクは、入力される音をいくつかの別々の周波数帯域に分割し、各帯域の振幅を返す。これは、５１２個、またはそれ以上、またはそれ以下の多数のバンドパスフィルタによって達成される可能性があり、結果として生じるバンドセンターとラウドネスは、前の例と同様の方法で統合される。

フィルタバンクの例の別のバリエーションは、フィルタバンドの数が特定の実装におけるサブバンドの数と同じである非均一フィルタバンクを使用することである。フィルタバンクの各フィルタの勾配と中心周波数は、サブバンドの幅を計算するために使用することができ、そこからサブバンド間の周波数境界を導出することができる。

さらに、オクターブバンドフィルタのバンクを使用し、静的な重み付けを行い、その後、上記の統合ステップを行うという方法もある。

別の方法として、音楽情報検索（ＭＩＲ）で開発された音楽類似度測定を使用することもできる。この方法は、オーディオ信号から意味のある計算可能な特徴を抽出し推論することを扱う。このような特徴のコレクションと、周波数サブバンドへの適切なセグメンテーションがあれば、簡単なルックアップ処理で、システムで再生されている音楽のカテゴリを決定し、それに応じて周波数バンドを動的に設定することができる。

最後に、特徴による機械学習のような統計的方法を使用して、与えられたオーディオ入力に対するサブバンド境界の適切な周波数に関する予測および決定を行うことができ、ここで、アルゴリズムは、サンプルオーディオデータの大規模なコレクションで事前に訓練される。

したがって、オーディオサブ信号を生成するステップは、各オーディオサブ信号における結合エネルギが所定のエネルギ／ラウドネス値の１０％以内となるように、オーディオサブ信号の１つまたは複数の周波数間隔を選択することを含み得る。したがって、すべてのオーディオサブ信号は、この値の１０％以内のエネルギ／ラウドネスを有する。当然のことながら、所定のエネルギ／ラウドネス値は、オーディオサブ信号のエネルギ／ラウドネス値の平均値であってよい。あるいは、エネルギ／ラウドネスは、例えば、オーディオ信号自体、またはそのチャネルについて決定されてもよい。このエネルギ／ラウドネスは、オーディオ信号またはチャネルに望まれるオーディオサブ信号の数に分割されてもよい。例えば、間隔１００～８０００Ｈｚのオーディオ信号におけるエネルギ／ラウドネスが決定され、３つのオーディオサブ信号が所望される場合には、３で割られることがある。そして、各オーディオ信号のエネルギ／ラウドネスは、この求められたエネルギ／ラウドネスの９０％から１１０％の間であることが望ましい。そして、このエネルギ／ラウドネスを達成するために、周波数間隔を適合させることができる。周波数間隔が重なるようにしてもよいことは、再認識される。

上記のエネルギ／ラウドネスの考慮は、オーディオサブ信号および／または電気サブ信号に関するものであってもよいことは、再掲される。

特に興味深い実施形態では、１つの－または各－電気サブ信号で表されるオーディオサブ信号の部分は、むしろ著しく変化する。したがって、電気サブ信号を生成するステップが、１つまたは複数の電気サブ信号に対して、電気サブ帯域で表されるオーディオサブ帯域の部分が１秒あたり少なくとも５％増加または減少するように電気サブ信号を生成することを含むことが望まれ得る。したがって、オーディオサブ帯域のエネルギ／ラウドネス／強度の割合であってもよいその部分は、１秒間に５％以上変化する。したがって、ｔ＝０において、その割合が５０％である場合、ｔ＝１（秒）において、その割合は４７．５％以下または５２．５％以上である。

特に、スピーカトランスデューサが、任意の所望のサイズ及び形状のスピーカキャビネットなどのエンクロージャの外面に設けられている場合、オーディオサブ信号は、キャビネット内又はキャビネットの表面又は所定の幾何学的形状上を動き回る個々の仮想スピーカトランスデューサと見ることができる。その位置、および、所定の方向であると仮定しない場合には任意に方向は、実際のラウドスピーカトランスデューサの位置、および、潜在的に方向と相関し、部分または重みを計算するために使用される。そして、形状内または形状上の個々の仮想スピーカトランスデューサの回転または移動をシミュレートすることにより、部分の時間的変化を得ることができる。

明らかに、仮想ラウドスピーカトランスデューサが出力する音は、仮想ラウドスピーカトランスデューサを形成するオーディオサブ信号の一部を受信する実際のラウドスピーカトランスデューサが出力する音である。各ラウドスピーカトランスデューサに供給される部分と、ラウドスピーカトランスデューサの位置、そして場合によってはその方向によって、仮想ラウドスピーカトランスデューサから出力されるサウンド全体が決定される。仮想ラウドスピーカトランスデューサの再位置決めまたは回転は、個々のラウドスピーカトランスデューサにおける対応する音の強度／ラウドネスを変更することにより、つまりラウドスピーカトランスデューサにおけるそのオーディオサブ信号の部分または電気サブ信号を変更することにより行われる。

本発明の第２の態様は、オーディオ信号に基づいて音声を出力するシステムに関し、該システムは、
オーディオ信号を受信する入力と、
各々が少なくとも１００－８０００Ｈｚの間隔で音を出力することができる複数の音出力スピーカトランスデューサを含むスピーカであって、該スピーカトランスデューサは部屋または会場内に配置されている、スピーカと、
オーディオ信号から複数のオーディオサブ信号を生成するように、且つ、各ラウドスピーカトランスデューサ用に電気サブ信号を生成するように、構成されたコントローラであって、各オーディオサブ信号は１００－８０００Ｈｚの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれておらず、各電気サブ信号は各オーディオサブ信号の所定の部分を含む、コントローラと、
電気サブ信号をラウドスピーカトランスデューサに供給する手段と
を含み、
前記コントローラは、各電気サブ信号の、オーディオサブ信号の所定の部分が経時的に変化するように、電気サブ信号の各々を生成するように構成されている。

本明細書において、システムは、別個の要素の組み合わせであってもよいし、単一の単体要素であってもよい。入力、コントローラ、及びスピーカは、オーディオ信号を受信して音を出力するように構成された単一の要素であってよい。

あるいは、コントローラは、電気サブ信号またはオーディオ信号をスピーカから遠隔で生成し、スピーカに供給するように、スピーカから分離または分離可能であってもよい。

明らかに、コントローラは、通信するように構成された１つまたは複数の要素であってよい。したがって、オーディオサブ信号は、１つのコントローラで生成され、電気サブ信号は、別のコントローラで生成される場合がある。後述するように、新しいコーデックまたはカプセル化が生成されてもよく、それによって、オーディオサブ信号または電気サブ信号が、制御され標準化された方法でコントローラまたはスピーカに転送され、次にこれらを解釈してサウンドを出力することができる。

上述したように、オーディオ信号は、既知のコーデックまたはエンコーディングフォーマットのいずれかなど、任意のフォーマットであってよい。オーディオ信号は、ライブパフォーマンス、ストリーミング、またはストレージから受信されることがある。

入力は、無線ソースから、電気ケーブルから、光ファイバから、ストレージなどから信号を受信するように構成されてもよい。入力は、オーディオ信号に到達するために、任意の所望または必要な信号処理、変換、エラー訂正などを構成することができる。したがって、入力は、アンテナ、コネクタ、コントローラまたはＭＡＣなどの別のチップの入力などであってもよい。

スピーカは、信号を受信し、音を出力するように構成される。この文脈では、スピーカは、音を出力するように構成された複数のスピーカトランスデューサを含んでいる。ラウドスピーカトランスデューサは、上述した少なくとも３つの異なる方向に音を向ける。

複数のラウドスピーカトランスデューサが、例えばオーディオサブ信号の周波数間隔によってカバーされる周波数間隔の全てをカバーするために必要である場合、複数のラウドスピーカトランスデューサは同じ方向に向けられることがある。この周波数間隔が広く、スピーカトランスデューサがより狭い動作周波数間隔を有する場合、方向ごとに多数の異なるスピーカトランスデューサが必要とされる場合がある。

また、スピーカトランスデューサの指向性が狭すぎる場合、当該オーディオサブ信号で特定の角度区間をカバーするために、わずかに分流する方向のみを有する複数のこのようなスピーカトランスデューサを提供することが望まれる場合がある。
前述したように、より多くの方向が使用されてもよい。

電気サブ信号は、ラウドスピーカトランスデューサに供給されることになる。電気サブ信号を生成するコントローラ又はその部分は、これらがスピーカに運ばれる必要がないように、スピーカに設けられてもよい。あるいは、スピーカにこれらの信号を受信するための入力部を設けることもできる。この入力は、このような信号を受信し、必要に応じて受信した信号を処理して各ラウドスピーカトランスデューサの信号を得るように構成されていなければならないことは明らかである。この処理は、スピーカ入力によって受信された汎用信号または複合信号から電気サブ信号を導き出すものであってもよい。

当該周波数間隔は、少なくとも１００～８０００Ｈｚであるが、より狭くてもよい。

コントローラは、オーディオ信号から多数のオーディオサブ信号を生成するように構成される。このプロセスは、上記でさらに説明される。

オーディオサブ信号の数は、電気サブ信号の数に対応する必要はないことに留意されたい。

上述したように、同一または別のコントローラが、オーディオ信号から、各電気サブ信号におけるオーディオサブ信号の部分が時間的に変化する方法で、電気サブ信号を生成してもよい。

一実施形態では、入力は、ステレオ信号を受信するように構成される。そして、コントローラは、ステレオオーディオ信号の各チャネルに対して複数のオーディオサブ信号を生成するように構成され得る。そして、同じ周波数間隔に対応するオーディオサブ信号は、所定のスピーカトランスデューサに供給され、また、２つの信号が高すぎる部分で（同じ電気サブ信号に含まれる）同じスピーカトランスデューサに供給されないように、時間をかけて供給され得る。

別の実施形態では、入力は、モノラル信号を受信するように構成される。そして、コントローラは、オーディオ信号から、モノラル信号に対して少なくとも実質的に位相反転された第２の信号を生成し、モノラルオーディオ信号と第２の信号のそれぞれに対して複数のオーディオサブ信号を生成するように構成され得る。そして、同じ周波数間隔に対応するオーディオサブ信号は、所定のスピーカトランスデューサに供給され、また、２つの信号が高すぎる部分で（同じ電気サブ信号に含まれる）同じスピーカトランスデューサに供給されないように、時間をかけて供給され得る。

一実施形態では、コントローラは、オーディオ信号から、１００Ｈｚ、２００Ｈｚ、３００Ｈｚ、４００Ｈｚまたはその間の任意の周波数であり得る第１の閾値周波数未満の周波数を有するその低周波部分を導出し、低周波部分をすべての電気サブ信号に少なくとも実質的に均一に含むようにさらに構成される。あるいは、スピーカは、この低周波信号が供給される別個のスピーカトランスデューサから構成され得る。

一実施形態では、コントローラは、オーディオ信号から、４０００Ｈｚ、５０００Ｈｚ、６０００Ｈｚ、７０００Ｈｚもしくは８０００Ｈｚまたはその間の任意の周波数である第２の閾値周波数を超える周波数を有するその高域部分を導出し、この高域部分をすべての電気サブ信号に少なくとも実質的に均等に含めるようにさらに構成される。あるいは、スピーカは、この高周波信号が供給される別個のスピーカトランスデューサから構成されることも可能である。

一実施形態では、コントローラは、各オーディオサブ信号における結合エネルギ、例えば結合ラウドネスが所定のエネルギ／ラウドネスの値の１０％以内となるように、オーディオサブ信号の１つまたは複数の周波数間隔を選択するようにさらに構成される。上述したように、各オーディオサブ信号におけるエネルギ、ラウドネス又は強度が同じであることが好ましい場合がある。これを達成するために、各オーディオサブ信号の周波数間隔を適合させることができる。所定のエネルギ値は、例えばチャネル内の全てのオーディオサブ信号又は全てのオーディオサブ信号の平均エネルギ又はラウドネス値、又はオーディオサブ信号の全体の周波数間隔内のようなオーディオ信号のエネルギ／ラウドネスの割合であってもよい。

一実施形態では、コントローラは、１つまたは複数の電気サブ信号（複数可）に対して、電気サブ帯域で表されるオーディオサブ帯域の一部が１秒あたり少なくとも５％増加または減少するように、電気サブ信号を生成するようにさらに構成される。この態様では、電気サブ信号におけるオーディオサブ信号の部分は、かなり多く変化する。

別段の指定がない限り、添付の図面は、本明細書に記載された技術革新の態様を例示する。図面を参照すると、いくつかの図および本明細書を通して、同種の数字が同種の部品を指し、現在開示されている原理のいくつかの実施形態が、例として例示され、限定するものではない。

図１は、オーディオデバイスの一実施形態を示す。図２は、代表的なリスニング環境に対応するサウンドスフィアを示す図である。図３は、別の代表的なリスニング環境に対応する別の可能なサウンドスフィアを示す図である。図４は、別の代表的なリスニング環境に対応する別の可能なサウンドスフィアを示す図である。図５は、空間的な音源定位のための周波数帯域を示す図である。図６は、ラウドスピーカトランスデューサ上の音分布を示す図である。図７ａは、ラウドスピーカトランスデューサ上の別の音の分布を示す図である。図７ｂは、ラウドスピーカトランスデューサの別の音響分布を示す図である。図８は、３次元指向性因子を説明する図である。図９は、オーディオ処理環境を説明するための図である。図１０は、別のオーディオ処理環境を説明するための図である。

詳細な説明
以下では、滑らかに変化する、または一定の３次元空気中遷移を有するサウンドスフィアを提供するためのシステムに関する様々な革新的な原理を説明する。例えば、開示された原理の或る態様は、所望のサウンドスフィアまたはその近似をリスニング環境全体に投影するように構成されたオーディオデバイスに関係する。

方法行為の文脈で説明されるそのようなシステムの実施形態は、開示された原理の便利な例示例であるとして選択された、企図されるシステムの特定の例にすぎない。開示された原理の１つ以上は、対応する様々なシステム特性のいずれかを達成するために、様々な他のオーディオシステムに組み込むことができる。

したがって、本明細書で論じた特定の例とは異なる属性を有するシステムは、１つまたは複数の現在開示されている革新的な原理を具体化することができ、本明細書に詳細に説明されていない用途に使用することができる。したがって、そのような代替の実施形態も本開示の範囲内にある。

いくつかの実施態様において、本明細書に開示された革新は、一般に、滑らかに変化する音の定位情報を提供するために組み合わされる、複数のビームを有する３次元サウンドスフィアを提供するためのシステムおよび関連技術に関する。例えば、いくつかの開示されたオーディオシステムは、微妙に変化する、または一定の、位相関係、および独立した振幅で、音の周波数帯におけるサブセクションをラウドスピーカトランスデューサに投影できる。これにより、オーディオシステムは、リスニング環境全体にわたって、あらゆる入力オーディオに、付加された、または調達された、空間情報をレンダリングすることができる。

一例として、オーディオデバイスは、各々が独立したフルレンジトランスデューサを構成するラウドスピーカトランスデューサのアレイを有することができる。オーディオデバイスは、プロセッサと、プロセッサによって実行されると、オーディオデバイスに、オーディオ信号のパンニングプロセスによってラウドスピーカトランスデューサに沿ってゆっくりと移動される個々の仮想形状成分、形状成分の調整ペアなどの重みのある組み合わせで、３次元波形を３６０度の球形としてレンダリングさせる命令を含むメモリとを備える。各スピーカトランスデューサについて、オーディオデバイスは、指定された手順に従って、受信したオーディオ信号をフィルタリングすることができる。ダイナミックサウンドスフィアを実行する場合、オーディオデバイスは、音響空間においてそれらが合計されるとき、結合されたスフィアコンポーネントにわたって元の音を保持する。したがって、リスナにとって、結果として得られる音は、元の音の周波数エンベロープを保持するが、動的な、または一定の、３次元オーディオ空間化の追加、または調達がある。

本開示は、その３次元オーディオレンダリングを、２つの指定された閾値の上下の合計信号と組み合わせることができ、閾値の外のオーディオ信号は、認知リスニング装置に識別可能な、音の定位に関する情報を保持しない。これらの２つの範囲は、別々に２つのモノフォニックオーディオ信号に合計され、すべてのスピーカトランスデューサに同時に送信することができる。これにより、オーディオデバイスは、低域と高域の全てのスピーカトランスデューサの独立した制御とともに、認知リスニング装置が認識できる完全な３次元空間化を提供できる。

本開示は、１つのオーディオデバイス上の１つのモノラル信号入力を、デバイスのスピーカトランスデューサの数と等しい数の独立したスフィアコンポーネント、またはデバイスのスピーカトランスデューサの数とは異なる数の仮想スフィアコンポーネントで管理できる。各スフィアコンポーネントは、周波数範囲のサブセットとすることができ、すべての成分は、成分のバランスのとれた総和として、範囲に沿って均等に分配することができる。これらの成分は、幾何学的立体の平面上のすべてのスピーカトランスデューサで独立してパンすることができ、または幾何学的立体の対向する点で極性反転ペアとして、または他の方法で変更することができ、それらは隣接する平面間の任意の点に配置することができる。このようなシステムは、２つのデバイスと対になったステレオ構成で使用され、モノフォニックオーディオチャネルのそれぞれに別々の３次元空間化を提供し、左チャネルと右チャネルを２つのオーディオデバイスに別々にレンダリングし、３次元ステレオフォニックオーディオレンダリングシステムを結果としてもたらす。また、ステレオペアを個別にパンニングすることも可能であり、反対側のポイントに相関を観察することはできない。

本開示は、ユニットのスピーカトランスデューサの数の半分に等しい独立した反復の数で、１つのオーディオシステム上の１つのステレオ信号を管理することができる。各ペアは、ステレオ信号の周波数範囲のサブセットであり、幾何学的立体上の対向する点、または立体の隣接する平面の間の任意の点に配置され得る。ステレオペアは均等にパンされ、１つのオーディオデバイスで入力ステレオ信号の満足のいくレンダリングを行うことができる。その結果、点音源、３次元ステレオフォニックオーディオレンダリングシステムが実現する。

プロセッサメモリに格納された命令は、もしそう望むなら、帯域間の等しいラウドネスを観察することができる周波数帯域の適応可能な分割を作り出すことができる。これは、非常に局所的な周波数範囲におけるエネルギ／ラウドネスの変化による突然の方向転換を回避する。

Ｉ．概要
ここで図１及び図２を参照すると、オーディオデバイス（又はスピーカ）１０は、部屋２０に配置され得る。３次元サウンドスフィア３０がオーディオデバイス１０によってレンダリングされ、リスナの最適なリスニングエリアはスフィア３０と一致する。

図３及び図４は、デバイス１０の位置決めの他の例示的な表現を示す。オーディオデバイス１０は、デバイス１０に対する１つまたは複数の反射境界、例えば壁２２ａ、２２ｂの位置、ならびにサウンドスフィア３０ａ、３０ｂと一致するリスナの可能性が高い位置２６ａ、２６ａに対応し得る。レンダリングされた３次元サウンドスフィア３０ａ、３０ｂは、波形が壁から折り返されるにつれて強化される。

以下でより詳細に説明するように、３次元サウンドスフィアは、スフィアコンポーネントの組み合わせによって構成することができる。３次元サウンドスフィアは、異なるオーディオ周波数、又は周波数帯域に沿った振幅、位相及び時間の変化に依存する。このような依存関係を管理するための方法論を考案することができ、開示されたオーディオデバイスは、これらの方法をオーディオコンテンツを含む音響信号またはデジタル信号に適用して、３次元サウンドスフィアとしてレンダリングすることができる。

セクションＩＩでは、図１に描かれたデバイスを参照しながら、このようなオーディオデバイスに関連する原理を説明する。セクションＩＩＩでは、望ましい３次元サウンドスフィアに関する原理を説明し、セクションＩＶでは、オーディオコンテンツを仮想と現実の両方のスフィアコンポーネントの組み合わせに分解し、音響空間でそれらを再組み立てすることに関する原理を説明する。セクションＶでは、オーディオデバイスの３次元性とその周波数による変化に関する指向性の原理を開示する。セクションＶＩは、オーディオコンテンツを含む入力５１上の入力オーディオ信号から、所望の３次元音圏の近似をレンダリングするのに適したオーディオプロセッサに関連する原理を記述している。セクションＶＩＩでは、開示された処理方法を実装するのに適したコンピューティング環境に関する原理を説明する。これは、実行されると、例えば、コンピューティング環境のプロセッサ５０に１つ以上の開示された方法を実行させる命令を含む機械読取可能媒体の例を含むことになる。そのような命令は、ソフトウェア、ファームウェア、またはハードウェアに埋め込むことができる。さらに、開示された方法および技術は、様々な形態の信号プロセッサにおいて、やはり、ソフトウェア、ファームウェア、またはハードウェアで実施することができる。

ＩＩ．オーディオデバイス
図１は、複数の個別のラウドスピーカトランスデューサまたはラウドスピーカトランスデューサＳ１，Ｓ２，．．．，Ｓ６を含むラウドスピーカアレイを内蔵したラウドスピーカキャビネット１２を含むオーディオデバイス１０を示す。

一般に、ラウドスピーカアレイは、図示されたアレイが６つのラウドスピーカトランスデューサを持つにもかかわらず、任意の数の個別のラウドスピーカトランスデューサを持つことができる。図１に示されているスピーカトランスデューサの数は、図の便宜のために選択されている。他のアレイは６個より多いか少ないトランスデューサを持ち、トランスデューサ対の３軸より多いか少ない場合があり、軸は１つのトランスデューサのみを持つことができる。たとえば、オーディオデバイス用のアレイの一実施形態は、２、３、４、５、６、７、８、９、１０、１１、またはそれ以上のラウドスピーカトランスデューサを持つことができる。

図１では、キャビネット１２は、キュービックキャビネットの対向する角１６に配置された中心軸ｚを定義する一般的に立方体の形状をしている。

図のラウドスピーカアレイ内の各ラウドスピーカトランスデューサＳ１，Ｓ２，．．．，Ｓ６は、立方体の平面上に、軸の中心に対して一定、または実質的に一定の位置で、均一な半径距離、極、および方位角で均等に分布している。図１では、ラウドスピーカトランスデューサは互いに約９０度の球状の間隔で配置されている。

スピーカトランスデューサは他の配置も可能である。たとえば、アレイ内のスピーカトランスデューサは、ラウドスピーカキャビネット１２内に均等に分布している場合もあれば、不均等に分布している場合もある。また、スピーカトランスデューサＳ１、Ｓ２、．．．、Ｓ６は、図１に示すような一定距離の位置ではなく、軸中心から測定したさまざまな選択された球面位置に配置することができる。たとえば、各スピーカトランスデューサは２つ以上の軸点から分布させることができる。

各トランスデューサＳ１、Ｓ２、．．．、Ｓ６は、例えばウーファー、ツィーター、ミッドレンジ、フルレンジなどの特定の周波数帯での音の出力のために特別に設計された、電気力学的または他のタイプのラウドスピーカトランスデューサであってもよい。オーディオデバイス１０は７番目のスピーカトランスデューサＳ０と組み合わせることができ、アレイからの出力を補うことができる。例えば、補助的なラウドスピーカトランスデューサＳ０は、選択された周波数、例えばサブウーファーとしてのローエンド周波数を放射するように構成することができる。補足的なラウドスピーカトランスデューサＳ０は、オーディオデバイス１０に内蔵することも、別のキャビネットに収納することもできる。また、高周波出力用にＳ０のスピーカトランスデューサを使用することもできる。

ラウドスピーカキャビネット１２は立方体として示されているが、ラウドスピーカキャビネット１２の他の実施形態は別の形状をしている。例えば、いくつかのラウドスピーカキャビネットは、例えば、一般的な角柱構造、四面体構造、球形構造、楕円形構造、トロイダル構造、またはその他の任意の望ましい３次元形状として配置することができる。

ＩＩＩ．３次元サウンドスフィア
再び図２を参照すると、オーディオデバイス１０は部屋の中央に配置することができる。このような状況では、前述のように、オーディオデバイス１０の周囲に３次元サウンドスフィアが均等に分布する。

３次元の球に音響エネルギを投影することにより、２次元のオーディオシステムと比較して、ユーザのリスニング体験を向上させることができる。なぜなら、一次元および２次元の音場における従来技術とは対照的に、開示によって提供される３次元のリスニングキューは、物理的な世界におけるサウンドキューと同様に、空間的であり、したがって没入的であるからである。

さらに、追加された空間オーディオキューは、リスニングフィールド全体、つまり球が、元のサウンド入力の顕著な特徴の均等なバランス、またはほぼ均等なバランスを含む限り、理想的なリスニングポジションに基づいて動作しないため、開示のリスニングスペースは、デバイス１０の周囲に無限のリスニングポジションを提供する。

図３は、図２に示すのとは異なる位置にあるオーディオデバイス１０を示している。図２では、音場３０は円形をしており、音響エネルギを壁２２にほとんどまたは全く向けていない。図３に示された３次元サウンドスフィアは図２に示されたものとは異なるが、図３に示されたサウンドスフィアは、壁２２の反射がサウンドスフィア３０と両立しないわけではないため、壁２２と、現在は部分的に折りたたまれている、図３に示されたサウンドスフィア３０と一致する可能性のあるリスニング位置と比較して、ラウドスピーカの図示された位置によく適合することができる。これは、球の成分がラウドスピーカトランスデューサに沿って常にシフトされるため、特定の周波数、すなわち周波数帯域の恒常的な強制を回避するためである。同様に、図４は、部屋のさらに別の位置にあるオーディオデバイス１０と、図２に示すオーディオデバイス１０の位置と比較して、再び壁２２の位置と部屋の配置によって対応して折りたたまれた、聴取位置と一致する３次元サウンドスフィア３０を示している。この特別な配置では、図３のように球の成分をシフトすることによって音の球の３０の投影に関する同じ状況が発生しており、特定の周波数、または周波数帯域が常に強制されることはない。

オーディオデバイスのいくつかの実施形態では、オーディオデバイスの１０の壁２２への近接が極端であるか、非常に顕著である場合に、３次元音場を変更することができる。例えば、オーディオデバイス１０のｚ軸を原点とした極座標を用いて３次元サウンドスフィア３０を表現することにより、ユーザは、オーディオデバイス１０のｚ軸を基準としたスピーカトランスデューサの振幅の方向スケーリングをタッチスクリーン上で「描画」することにより、サウンドスフィア３０を球から非対称三軸楕円形に修正することができる。

さらに他の実施形態では、ユーザは、オーディオデバイス１０またはリモートによって格納された複数の３次元非対称三軸楕円体から選択することができる。リモートで保存されている場合、オーディオデバイス１０は選択された三軸非対称楕円体を通信接続を介してロードできる。さらに別の実施形態では、ユーザは、スマートフォンまたはタブレット上で、上記のように、所望の３軸非対称楕円体輪郭または既存の部屋の境界を「描画」することができ、オーディオデバイス１０は、通信接続を介して、ユーザのデバイスから直接または間接的に、所望の非対称３軸楕円体、または部屋の境界の表現を受信することができる。コンピュータ環境に関連して後述するように、タッチスクリーン以外の他の形式のユーザ入力を使用することができる。

ＩＶ．３次元サウンドスフィアのモード分解と再構成
図５は、３次元聴覚における空間音源定位のために、聞き手の聴覚の全周波数範囲のサブセットとして、（１００Ｈｚに位置する）４０から（３ｋＨｚに位置する）４５までの周波数範囲を示している。音源定位の手がかりには、両耳間の時間差とレベル差、スペクトル情報、タイミング解析、相関解析、パターンマッチングなどがある。本開示では、聴覚系のこの知識を使用して、４０から４５の周波数範囲をいくつかのバンド（矢印）に分割し、これらのバンドを処理することによって、入力音に空間情報を追加または調達する。バンドの数は、ラウドスピーカトランスデューサの数の半分にすることができ、トランスデューサの数を増やしたり減らしたりすることができる。

すべての可能な実施例ではなく一例の手段として、図６では、ハイパスフィルタ５０、バンドパスフィルタ５１、５２、および５３、およびローパスフィルタ５４は、オーディオストリームを５つのサブストリームまたはオーディオサブ信号に分離する。ハイパスフィルタは４ｋＨｚ以上の信号成分を、ローパスフィルタは１００Ｈｚ以下の信号成分を除去する。フィルタ５０および５４からの音声ストリームは３次元可聴範囲外にあり、異なる方法に従ってすべてのラウドスピーカトランスデューサＳ１、Ｓ２、．．．、Ｓ６に等しく送信されるか、またはラウドスピーカトランスデューサＳ０に送信される。フィルタ５１、５２、および５３からの各周波数帯域からの信号のコピーは、位相シフトの程度を適用することによって、または極性反転によって変更することができ、その後、個々の信号の合計として、オーディオデバイス１０の元の信号に対して１８０度の反対の点などの異なる点に変更された信号を送信して、ラウドスピーカトランスデューサＳ１－Ｓ６の信号に到達する。結果として得られるオーディオ出力は、３組の接続されたスフィアコンポーネントに独立した空間キューを追加したモノフォニックサウンドで、モノフォニックで３次元の音の球になる。この例の変形では、フィルタ５１、５２、および５３からのオーディオストリームは、個別にラウドスピーカトランスデューサＳ１、Ｓ２、．．．、Ｓ６に送信され、ランダムまたは半ランダムに調整された方法で移動される。これは同様に、単音の３次元サウンドスフィアの空間的な手掛かりを提供するが、前の例とは大幅に異なる性質のものである。

図７ａは同じシナリオを表しているが、ステレオ信号入力である。すべての可能な実施例ではなく一例として、図７ａでは、ハイパスフィルタ６０、バンドパスフィルタ６１、６２、６３、およびローパスフィルタ６４は、オーディオを５つのオーディオストリームに分離する。フィルタ６０および６４からのオーディオストリームは、３次元可聴範囲の外にあり、すべてのラウドスピーカトランスデューサＳ１、Ｓ２、．．．、Ｓ６に均等に送信される。これは、低域通過オーディオと高域通過オーディオの合計モノラル信号として、空間情報をまったく、またはほとんど提供しないため、または低域通過オーディオと高域通過オーディオの左および／または右チャネルの２つの個別のオーディオストリームとして、放出前に送信される。３次元可聴範囲内にあるフィルタ６１、６２、および６３からのオーディオストリームは、個別に送信されるが、現在は、スピーカトランスデューサ［Ｓ１、Ｓ２］、［Ｓ３、Ｓ４］、［Ｓ５、Ｓ６］、またはトランスデューサ間の任意の軸点にペアで送信される。結果として得られるオーディオ出力は、ポイントソースの立体音響の３次元音場を提供するための空間キューの追加または調達を伴う立体音響である。

図７ｂは、ステレオ信号入力が別々のモノラルチャネルとして扱われるシナリオを示している。すべての可能な実施例ではなく一例の手段として、図７ｂでは、ハイパスフィルタ７０、バンドパスフィルタ７１Ａ、７１Ｂ、７２Ａ、７２Ｂ、７３Ａ、７３Ｂおよびローパスフィルタ７４は、オーディオを８つのオーディオストリームに分離する。フィルタ７０および７４からのオーディオストリームは、３次元可聴範囲の外にあり、すべてのラウドスピーカトランスデューサＳ１、Ｓ２、．．．、Ｓ６に均等に送信される。これは、低域通過オーディオと高域通過オーディオの合計モノラル信号として、空間情報をまったく、またはほとんど提供しないため、または低域通過オーディオと高域通過オーディオの左および／または右チャネルの２つの個別のオーディオストリームとして、放出前に送信される。３次元可聴範囲内にあるフィルタ７１Ａ、７１Ｂ、７２Ａ、７２Ｂ、７３Ａ、７３Ｂからのオーディオストリームは、個別に、スピーカトランスデューサ［Ｓ１、Ｓ２、Ｓ３、Ｓ４、Ｓ５、Ｓ６］、またはトランスデューサ間の任意の軸点に送信される。結果として得られるオーディオ出力は、複数の単一方向のサウンドであり、空間キューを追加または調達して、ポイントソースの複数の単一方向の３次元音場を提供する。したがって、図７ａと比較して、（同じサブバンドに関連する）対応する音声サブ信号が出力される方向の角度に相関関係は必要ない。

Ｖ．指向性の検討
図８は、サウンドデバイスの１０指向性係数の態様を表している。指向性係数の範囲は１－∞で、ラウドスピーカトランスデューサ（またはその他の任意の音発生器）が、加えられたエネルギを球形セクションに閉じ込める能力を示す。オーディオデバイスは、可聴周波数範囲（例：約２０Ｈｚ～約２０ｋＨｚ）全体で方向性の度合いが異なり、一般に、周波数が２０Ｈｚに近づくにつれて方向性係数が低くなり、周波数が高くなるにつれて指向性係数が高くなる。公開されているオーディオデバイスの１０指向性係数は、ラウドスピーカトランスデューサが均等に、またはほぼ均等に等辺の幾何学的立体に分布していることを考えると、全周波数範囲で１または１に近い。開示されたオーディオデバイスの１０個の個々のラウドスピーカトランスデューサの指向性係数は、低周波では２、または２に近く、周波数範囲によって変化するが、高周波ではより高い値に向かう。指向性係数が８の場合、各トランスデューサは球状の部分を持ち、前述のキューブキャビネット上の６つのトランスデューサと組み合わせて、オーディオデバイス１０用の完全な球体に結合される。単一のラウドスピーカトランスデューサに対する有向エネルギは、定義されたリスニングウィンドウを決定するため、ラウドスピーカを原点に配置した一定半径の選択された角度位置の範囲として、ラウドスピーカに対するユーザの位置が変化すると、ユーザのリスニング体験は減少する。指向性係数がはるかに低いこの開示は、２次元音場における従来の技術よりも、無限またははるかに多くの所望のリスニング位置を持つ。

すべての周波数にわたって所望のサウンドスフィアまたは滑らかに変化するスフィアコンポーネント（またはパターン）を実現するために、上記のスフィアコンポーネントは等化を受けることができるので、各スフィアコンポーネントは全体を通して所望の周波数応答を持つ対応する音場を提供する。別の言い方をすれば、球の成分全体に所望の周波数応答を与えるようにフィルタを設計することができる。そして、等化されたスフィアコンポーネントを組み合わせることで、可聴周波数の範囲内で可聴周波数および／または選択された周波数帯域にわたってスフィアコンポーネントが滑らかに遷移する音の球をレンダリングすることができる。

ＶＩ．オーディオプロセッサ
オーディオデバイス１０でオーディオコンテンツ（例：音楽作品、映画のサウンドトラック）を再生するためのオーディオレンダリングプロセッサのブロック図を図９に示す。
オーディオレンダリングプロセッサ５０は、特定用途向け集積回路（ＡＳＩＣ）、汎用マイクロプロセッサ、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、デジタルシグナルコントローラ、または一連のハードウェア論理構造（例：フィルタ、算術論理ユニット、専用ステートマシン）などの特殊目的プロセッサであってもよい。場合によっては、オーディオレンダリングプロセッサは、マシン実行可能命令の組み合わせを使用して実装でき、プロセッサによって実行されると、オーディオデバイスが記述されているように１つ以上の入力チャネルを処理するようになる。レンダリングプロセッサ５０は、入力オーディオソース５１からサウンドプログラムのコンテンツの入力チャネルを受け取る。

入力オーディオソース５１は、デジタル入力またはアナログ入力を提供することができる。入力オーディオソースまたは入力５１は、メディアプレーヤアプリケーションプログラムを実行しているプログラム化されたプロセッサを含むことができ、レンダリングプロセッサへのデジタルオーディオ入力を生成するデコーダを含むことができる。これを行うために、デコーダは、エンコードされたオーディオ信号をデコードすることができ、それは、ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｅｃ（ＡＡＣ）、ＭＰＥＧＡｕｄｉｏＬａｙｅｒＩＩ、ＭＰＥＧＡｕｄｉｏＬＡＹＥＲＩＩＩ、およびＦｒｅｅＬｏｓｓｌｅｓｓＡｕｄｉｏＣｏｄｅｃ（ＦＬＡＣ）などの適切なオーディオコーデックを使用してエンコードされている場合がある。あるいは、入力オーディオソースには、アナログまたは光学式のオーディオ信号を、たとえばライン入力からオーディオレンダリングプロセッサ５０用のデジタル形式に変換するコーデックを含めることもできる。あるいは、音楽作品のステレオ録音の左右チャネルの２チャネル入力のように複数の入力オーディオチャネルがある場合もあれば、映画や映画の５．１サラウンド形式のオーディオサウンドトラック全体のように複数の入力オーディオチャネルがある場合もある。その他のオーディオフォーマットの例としては、７．１および９．１サラウンドフォーマットがある。

ラウドスピーカトランスデューサ５８のアレイは、オーディオレンダリングプロセッサ５０によってオーディオコンテンツに適用されるスフィアコンポーネントセグメント５２ａ．．．５２Ｎの組み合わせに基づいて、目的の音の球（またはその近似）をレンダリングすることができる。図９に従ったレンダリングプロセッサ５０は、概念的にはスフィアコンポーネントドメインとラウドスピーカトランスデューサドメインに分けることができる。コンポーネント領域では、各構成するスフィアコンポーネント５２ａ．．．５２Ｎごとのセグメント処理５３ａ．．．５３Ｎを、上記のように希望するスフィアコンポーネントに対応させてオーディオコンテンツに適用することができる。イコライザ５４ａ．．．．５４Ｎは、それぞれのスフィアコンポーネント５２ａ．．．５２Ｎにイコライゼーションを提供して、前述の、特定のオーディオデバイス１０から生じる指向性係数の変動のために、及び、所望の非対称の楕円体球の輪郭に向けた任意の球調整から、調整するために、

ラウドスピーカトランスデューサ領域では、アレイ５８内のそれぞれのラウドスピーカトランスデューサによって再生される信号を提供するために、球領域行列を様々な球領域信号に適用することができる。一般的には、行列はＭ×Ｎサイズの行列であり、Ｎはラウドスピーカトランスデューサの数、Ｍ＝（２×Ｎ）＋（２×Ｏ）であり、ここでＯは仮想スフィアコンポーネントの数を表す。イコライザ５６ａ．．．５６Ｎは、それぞれのスフィアコンポーネント５７ａ．．．５７Ｎにイコライゼーションを提供して、前述の、特定のオーディオデバイス１０から生じる指向性係数の変動のために、及び、所望の楕円体球の輪郭に向けた任意の球調整から、調整できる。

オーディオレンダリングプロセッサ５０は、トランスデューサアレイ５８で再生するための入力オーディオ信号を所望の方法でレンダリングするために、他の信号処理操作を実行することができることを理解すべきである。別の実施形態では、ラウドスピーカトランスデューサ信号を修正する方法を決定するために、オーディオレンダリングプロセッサは、一定または変化する境界周波数を決定するために適応フィルタプロセスを使用することができる。図１０は、合成音（例えば、デジタルキーボード、デジタルオーディオワークステーション（ＤＡＷ））をレンダリングするためのオーディオデバイス１０、または電気および／または音響楽器のオーディオレンダリングプロセッサのブロック図である。

ＶＩＩ．コンピューティング環境
図１０は、適切なコンピューティング環境１００の一般化された例を示しており、コントローラ５０の動作を含むことができ、ここでは、例えば、サウンドスフィアを手続き的に生成することに関連する方法、実施形態、技法、および技術が記述されている。コンピューティング環境１００は、各技術が多様な汎用または特殊目的のコンピューティング環境で実装される可能性があるため、ここに開示されている技術の使用範囲または機能性に関する制限を示唆することを意図していない。例えば、開示された各技術は、ウェアラブルおよびハンドヘルドデバイス、モバイル通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラム可能な家電製品、組み込みプラットフォーム、ネットワークコンピュータ、ミニコンピュータ、メインフレームコンピュータ、スマートフォン、タブレットコンピュータ、データセンターなどを含む、他のコンピュータシステム構成で実装することができる。開示された各技術は、通信接続またはネットワークを介してリンクされた、またはデジタルまたはアナログ楽器に組み込まれたリモート処理デバイスによってタスクが実行される分散コンピューティング環境でも実施される場合がある。分散コンピューティング環境では、プログラムモジュールをローカルとリモートの両方のメモリストレージデバイスに配置できる。

コンピューティング環境１００は、少なくとも一つの中央処理装置１１０とメモリ１２０を含む。図１０では、この最も基本的な構成１３０が破線内に含まれている。中央処理装置１１０は、コンピュータで実行可能な命令を実行し、実プロセッサでも仮想プロセッサでもよい。マルチプロセッシングシステムでは、複数のプロセッシングユニットがコンピュータで実行可能な命令を実行して処理能力を高めることで、複数のプロセッサを同時に動作させることができる。メモリ１２０は、揮発性メモリ（例えば、レジスタ、キャッシュ、ＲＡＭなど）、不揮発性メモリ（例えば、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリなど）、またはこれらの組み合わせである。メモリ１２０は、プロセッサによって実行されたときに、例えば、ここで説明する革新的な技術の一つ以上を実装することができるソフトウェア１８０ａを格納する。

コンピューティング環境には、追加の機能がある場合がある。例えば、コンピューティング環境１００は、ストレージ１４０、一つ以上の入力デバイス１５０、一つ以上の出力デバイス１６０、及び一つ以上の通信接続１７０を含む。バス、コントローラ、ネットワークなどの相互接続メカニズム（図示せず）は、コンピューティング環境１００のコンポーネントを相互接続する。通常、オペレーティングシステムソフトウェア（図示せず）は、コンピューティング環境１００で実行される他のソフトウェアの動作環境を提供し、コンピューティング環境１００のコンポーネントの活動を調整する。

ストレージ１４０は、取り外し可能であっても、取り外し不可能であってもよく、磁気ディスク、磁気テープまたはカセット、不揮発性固体メモリ、ＣＤ－ＲＯＭ、ＣＤ－ＲＷ、ＤＶＤ、磁気テープ、光学データストレージデバイス、および搬送波を含む機械可読媒体の選択された形態、または情報を保存するために使用することができ、コンピューティング環境１００内でアクセスすることができるその他の機械可読媒体を含めることができる。ストレージ１４０は、ここで説明する技術を実装できるソフトウェア１８０ｂの命令を格納する。

ストレージ１４０は、ソフトウェア命令が分散して格納され実行されるように、ネットワーク上に分散することもできる。他の実施例では、これらの操作のいくつかは、ハードワイヤードロジックを含む特定のハードウェアコンポーネントによって実行される場合がある。これらの操作は、プログラムされたデータ処理コンポーネントと固定されたハードワイヤード回路コンポーネントの任意の組み合わせによって実行することもできる。

入力デバイス１５０は、キーボード、キーパッド、マウス、ペン、タッチスクリーン、タッチパッド、トラックボールなどのタッチ入力デバイス、音声入力デバイス、スキャンデバイス、またはコンピューティング環境１００に入力を提供する別のデバイスであってもよい。オーディオの場合、入力デバイス１５０は、マイクまたは他のトランスデューサ（例：アナログまたはデジタル形式で音声入力を受け付けるサウンドカードまたは類似のデバイス）、またはコンピューティング環境１００にオーディオサンプルを提供するコンピュータ可読媒体リーダを含むことができる。

出力デバイス１６０は、ディスプレイ、プリンタ、スピーカトランスデューサ、ＤＶＤライター、またはコンピューティング環境１００からの出力を提供する別のデバイスであってもよい。

通信接続１７０は、通信媒体（例：接続ネットワーク）を介した別のコンピューティングエンティティへの通信を可能にする。通信媒体は、コンピュータで実行可能な命令、圧縮されたグラフィックス情報、（処理されたオーディオ信号を含む）処理された信号情報、またはその他のデータなどの情報を変調信号で伝達する。

したがって、開示されたコンピューティング環境は、ここに開示されているように、開示された方向推定およびオーディオレンダリングプロセスを実行するのに適している。

機械可読媒体は、コンピューティング環境１００内でアクセス可能な任意の利用可能な媒体である。コンピューティング環境１００では、制限ではなく例として、機械可読媒体にはメモリ１２０、ストレージ１４０、通信媒体（図示せず）、および上記のいずれかの組み合わせが含まれる。有形の機械可読（またはコンピュータ可読）媒体は、一時的な信号を除外する。

上で説明したように、いくつかの開示した原則は、命令を格納する（マイクロエレクトロニックメモリなどの）有形の非一時的機械可読媒体に具体化することができ、それは、推定、適応、計算、計算、測定、（オーディオプロセッサ５０による）調整、センシング、測定、フィルタリング、加算、減算、反転、比較、意思決定を含む、上述のデジタル信号処理操作を実行するために、一つ以上のデータ処理コンポーネント（ここでは一般的に「プロセッサ」と呼ぶ）をプログラムする。他の実施例では、（機械プロセスの）これらの操作のいくつかは、配線されたロジック（例えば、専用のデジタルフィルターブロック）を含む特定の電子ハードウェアコンポーネントによって実行される場合がある。これらの操作は、プログラムされたデータ処理コンポーネントと固定されたハードワイヤード回路コンポーネントの任意の組み合わせによって実行することもできる。

オーディオデバイス１０は、音を生成するように構成されたラウドスピーカキャビネット１２を含むことができる。オーディオデバイス１０は、プロセッサと、プロセッサによって実行されると、ここに記載されているように、３次元球体構築プロセスとそれをサポートするプロセスを自動的に実行する命令が格納された非遷移的な機械可読媒体（メモリ）を含むこともできる。

上記の例は、一般に、オーディオをレンダリングするための装置、方法、および関連システムに関するものであり、より具体的には、目的の３次元球パターンを提供するためのものである。それにもかかわらず、詳細に上述したもの以外の実施形態は、ここに記載されたそれぞれの装置の構成における付随する変更とともに、ここに開示された原理に基づいて企図される。

方向およびその他の相対的な参照（例えば、上、下、上、下、左、右、後、前など。）は、ここでの図面および原則の議論を容易にするために使用することができるが、制限することを意図したものではない。例えば、「上」、「下」、「上」、「下」、「水平」、「垂直」、「左」、「右」などの特定の用語が使用されることがある。このような用語は、特に例示された実施形態に関して、相対的な関係を扱う場合に説明をある程度明確にするために、該当する場合に使用される。ただし、このような用語は、絶対的な関係、位置、および／または方向を意味するものではない。例えば、物体に関しては、物体をひっくり返すだけで「上」の面が「下」の面になる。それにもかかわらず、それは同じ表面であり、物体は同じままである。ここでいう「ａｎｄ／ｏｒ」とは、「ａｎｄ」や「ｏｒ」のほか、「ａｎｄ」や「ｏｒ」も意味する。さらに、ここに引用されているすべての特許文献および非特許文献は、すべての目的のために参照によりその全体がここに組み込まれる。

任意の特定の例に関連して上記で説明した原則は、ここで説明する別の例に関連して説明した原則と組み合わせることができる。したがって、この詳細な説明は限定的な意味で解釈されるものではなく、この開示のレビューの後、当業者は、ここに記載されている様々な概念を使用して考案できる多種多様な信号処理およびオーディオレンダリング技術を評価するであろう。

さらに、当業者は、ここに開示された例示的な実施形態が、開示された原則から逸脱することなく、様々な構成および／または使用に適応できることを理解するであろう。ここで開示された原理を適用すると、所望の３次元球面音場を提供することに適応した多種多様なシステムを提供することができる。例えば、上記の説明または図面において特定の計算エンジンの一部を構成するものとして特定されたモジュールは、ここに記載されているものとは異なる分割、１つ以上のモジュール間での分散、または完全に省略することができる。同様に、そのようなモジュールは、いくつかの開示された原則から逸脱することなく、異なる計算エンジンの一部として実装することができる。

開示された実施形態の前の説明は、当業者が開示された技術革新を行ったり使用したりできるようにするために提供される。これらの実施形態に対する様々な修正は、当業者には容易に明らかであり、ここで定義された一般的な原則は、本開示の精神または範囲から逸脱することなく、他の実施形態に適用することができる。したがって、請求項に記載されている発明は、本明細書に示されている実施形態に限定することを意図しているのではなく、請求項の文言と一致する全範囲を与えられるべきであり、例えば、冠詞「ａ」または「ａｎ」を使用して単数形の要素を参照することは、特に明記されていない限り、「１つのみ」を意味するのではなく、「１つ以上」を意味することを意図している。開示全体を通じて説明されている様々な実施形態の特徴および方法行為に相当する構造的および機能的な全ての行為であって、当該技術分野における通常の技術者に知られている、または後に知られるようになるものは、ここに記載され主張されている特徴によって包含されることを意図している。さらに、ここで開示されるものは、そのような開示がクレームに明示的に記載されているかどうかにかかわらず、公衆に提供されることを意図したものではない。クレームの記載は、「ｍｅａｎｓｆｏｒ」又は「ｓｔｅｐｆｏｒ」という語句を用いて明示的に記載されない限り、解釈されない。

したがって、開示された原理を適用することができる多くの可能な実施形態を考慮して、我々は、例えば、技術の範囲内にあるすべてのものを含め、当業者が理解しているように、ここに記載されている特徴及び技術のあらゆる組み合わせを請求する権利を留保する。

Claims

オーディオ信号に基づいて音声を出力する方法であって、
オーディオ信号を受信するステップと、
オーディオ信号から複数のオーディオサブ信号を生成するステップであって、各オーディオサブ信号は１００－８０００Ｈｚの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれない、生成するステップと、
各々が少なくとも１００－８０００Ｈｚの間隔でサウンドを出力することができる複数のサウンド出力ラウドスピーカトランスデューサを備えたスピーカを提供するステップであって、そのラウドスピーカトランスデューサは部屋または会場内に配置される、提供するステップと、
各ラウドスピーカトランスデューサの電気サブ信号を生成するステップであって、各電気サブ信号は、各オーディオサブ信号の所定の部分を構成する、生成するステップと、
電気サブ信号をスピーカのトランスデューサに供給するステップと
を含み、
前記電気サブ信号を生成するステップは、各電気サブ信号のオーディオサブ信号の所定の部分を、経時的に、変更するステップを含む、
方法。
オーディオ信号を受信するステップは、ステレオ信号を受信することを含み、
オーディオサブ信号を生成するステップは、ステレオオーディオ信号の各チャネルに対して、複数のオーディオサブ信号を生成することを含む、
請求項１に記載の方法。
オーディオ信号を受信するステップは、モノラル信号を受信して、そのモノラル信号に少なくとも実質的に位相反転した第２の信号をオーディオ信号から生成することを含み、
オーディオサブ信号を生成するステップは、モノラルオーディオ信号と第２の信号の各々に対して複数のオーディオサブ信号を生成することを含む、
請求項１に記載の方法。
オーディオ信号から低周波部分を導出するステップを、更に含み、
低周波部分は、第１の閾値周波数以下の周波数を有し、
全ての電気サブ信号には少なくとも実質的に均等に低周波部分を含む
請求項１～３のいずれか一に記載の方法。
オーディオ信号から高周波部分を導出するステップを、更に含み、
低周波部分は、第２の閾値周波数を超える周波数を有し、
全ての電気サブ信号には少なくとも実質的に均等に高周波部分を含む、
請求項１～４のいずれか一に記載の方法。
オーディオサブ信号を生成するステップが、各オーディオサブ信号のエネルギ/ラウドネスの合計が所定のエネルギ／ラウドネスの値の10%以内になるように、１つ以上のオーディオサブ信号の周波数間隔を選択することを含む、
請求項１～５のいずれか一に記載の方法。
電気サブ信号を生成するステップが、１つ以上の電気サブ信号について、電気サブバンドで表されるオーディオサブバンドの一部が１秒あたり少なくとも５%増加または減少するように、電気サブ信号を生成することを含む、
請求項１～６のいずれか一に記載の方法。
オーディオ信号に基づいて音声を出力するシステムにおいて、
オーディオ信号を受信する入力と、
各々が少なくとも１００－８０００Ｈｚの間隔で音を出力することができる複数のサウンド出力ラウドスピーカトランスデューサを含むスピーカであって、該ラウドスピーカトランスデューサは部屋または会場内に配置されている、スピーカと、
オーディオ信号から複数のオーディオサブ信号を生成するように、且つ、各ラウドスピーカトランスデューサ用に電気サブ信号を生成するように、構成されたコントローラであって、各オーディオサブ信号は１００－８０００Ｈｚの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれておらず、各電気サブ信号は各オーディオサブ信号の所定の部分を含む、コントローラと、
電気サブ信号をラウドスピーカトランスデューサに供給する手段と
を含み、
前記コントローラは、各電気サブ信号の、オーディオサブ信号の所定の部分が経時的に変化するように、電気サブ信号の各々を生成するように構成されている、
システム。
前記入力がステレオ信号を受信するように構成され、前記コントローラがステレオオーディオ信号の各チャネルに対して複数のオーディオサブ信号を生成するように構成されている、
請求項８に記載のシステム。
前記入力がモノラル信号を受信するように構成され、前記コントローラがオーディオ信号から、そのモノラル信号に少なくとも実質的に位相反転した第２の信号を生成して、モノラルオーディオ信号と第２の信号の各々に対して複数のオーディオサブ信号を生成するように構成されている、
請求項８に記載のシステム。
前記コントローラが、更に、
オーディオ信号から、第１の閾値周波数以下の周波数を有する低周波数部分を導出し、全ての電気サブ信号に少なくとも実質的に均等に低周波数部分を含む
ように構成されている、請求項８～１０のいずれか一に記載のシステム。
前記コントローラが、更に、
オーディオ信号から、第２の閾値周波数を超える周波数を有する高周波部分を導出し、全ての電気サブ信号に少なくとも実質的に均等に高周波部分を含む
ように構成されている、請求項８～１１のいずれか一に記載のシステム。
各オーディオサブ信号におけるエネルギ／ラウドネスの合計値が所定のエネルギ／ラウドネスの値の１０％以内になるように、前記コントローラが、更に、１つ以上のオーディオサブ信号の周波数間隔を選択するように構成されている、
請求項８～１２のいずれか一に記載のシステム。
電気サブバンドで表されるオーディオサブバンドの一部が１秒間に少なくとも５％増加または減少するように、前記コントローラが、更に、１つ以上の電気サブ信号について、電気サブ信号を生成するように構成されている、
請求項８～１３のいずれか一に記載のシステム。