JP2023551090A - 音を出力する方法及びスピーカ - Google Patents

音を出力する方法及びスピーカ Download PDF

Info

Publication number
JP2023551090A
JP2023551090A JP2023522355A JP2023522355A JP2023551090A JP 2023551090 A JP2023551090 A JP 2023551090A JP 2023522355 A JP2023522355 A JP 2023522355A JP 2023522355 A JP2023522355 A JP 2023522355A JP 2023551090 A JP2023551090 A JP 2023551090A
Authority
JP
Japan
Prior art keywords
audio
signal
sub
signals
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023522355A
Other languages
English (en)
Inventor
グラウゴー,ラース
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CLANG
Original Assignee
CLANG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CLANG filed Critical CLANG
Publication of JP2023551090A publication Critical patent/JP2023551090A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • H04R3/14Cross-over networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/03Connection circuits to selectively connect loudspeakers or headphones to amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Abstract

オーディオ信号を複数のスピーカトランスデューサのための信号に変換する方法であって、オーディオ信号は、各々が特定の周波数間隔を表すオーディオサブ信号に分割され、各スピーカトランスデューサのための信号は、経時的に変化する各オーディオサブ信号の一部を含む。

Description

本発明は、音を出力する方法に関し、特に、音信号に空間情報を付与する方法に関するものである。
既知のスピーカシステムは、ステレオセットアップ、サラウンドセットアップ、または全方向性セットアップであり、スピーカが異なる周波数帯域用のスピーカトランスデューサから構成されていても、同じスピーカトランスデューサがその帯域内の電気オーディオ信号の少なくとも実質的にすべてを受信し、その帯域の音の少なくとも実質的にすべてを常に出力するという意味で、静止スピーカが「静止」オーディオ信号を出力する。
無指向性スピーカシステムは、中心点から360度にわたって放射状に音を反射し、音の分散は実質的に垂直面内にある。モノラルやステレオの音を分散させるための戦略が異なり、ドライバを真上や斜めに向けた全指向性システムもあれば、曲面や円錐形の反射板にドライバを上向きに放射させるシステムもある。全方位型と言いながら、いずれも真の球体スピーカシステムではなく、固定または静止した状態で目的の波形を放射することを目的としている。
従来のサラウンドシステムは、リスナの前方、側方、後方に配置された複数のスピーカ振動子を用いて、再生音の忠実度と奥行きを豊かにすることを目的としている。サラウンドサウンドシステムには、様々な形式や数のスピーカトランスデューサが存在するが、それらはすべて、固定または静止した方法で所望の波形を放出することを目的としている。これは、設置された膨大な数の異なる音響空間のリスニング環境に関係なく、あるいは、カスタマイズ可能な音場として、特定のリスニング環境に音を合わせる自動化またはユーザ定義のプロセスに基づいている場合がある。これらのシステムに共通するのは、リスニング環境が再生に与える影響を無視、あるいは否定、中断することを目的としていることであり、一度確立されたこれらの固定、カスタマイズ可能、あるいはユーザ定義可能な音場は安定したままである。
その結果、これらの従来のシステムは、ある設置配置における「最適」な再生と、あるリスニング環境における「理想的」なリスニングポジションで動作する。その結果、スピーカによる比較的貧弱な音楽再生と、アコースティック演奏による複雑で豊かな音の拡散との間に著しい差が生じ、この差はオーディオシステム業界を当初から苦しめてきた。また、このようなシステムは、スタジオ録音やデジタルで制作された音楽コンテンツなど、音響的に制作されていない他の音場に対して、豊かさを提供することができない。さらに、音響空間は、空間内の人、物、その他の要素の細かな動きにより、完全に一定であることはなく、音の全体的な知覚品質にとって重要な微細な変化を音に与える。本オーディオシステムはまた、入力されるオーディオ信号に追加の3次元オーディオキューをもたらす、または調達するそのプロセスにおいて、この事実を考慮に入れることができ、それによって、リスナは、リスナが音源と同じ空間にいるかのように、3次元の方法でサウンド再生を聞く。これは2次元的な方法とは対照的で、リスナは、高度に決定されたリスニングポジションと条件にいない限り、リスニングスペースに外から入ってきたかのように音を聞くことになる。
本発明の第1の態様は、オーディオ信号に基づいて音声を出力する方法に関し、該方法は、
オーディオ信号を受信するステップと、
オーディオ信号から複数のオーディオサブ信号を生成するステップであって、各オーディオサブ信号は、100-8000Hzの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれない、生成するステップと、
各々が少なくとも100-8000Hzの間隔でサウンドを出力することができる複数のサウンド出力ドライバまたはラウドスピーカトランスデューサを備えたスピーカを提供するステップであって、そのスピーカトランスデューサは部屋または会場内に配置される、提供するステップと、
各ラウドスピーカトランスデューサに対して電気サブ信号を生成するステップであって、各電気サブ信号は、各オーディオサブ信号の所定の部分を構成する、生成するステップと、
前記電気サブ信号を前記スピーカトランスデューサに供給するステップと
を含み、
前記電気サブ信号を生成するステップは、各電気サブ信号のオーディオサブ信号の所定部分を、経時的に、変更するステップを含む。
本明細書において、オーディオ信号は、アナログ又はデジタルなどの任意のフォーマットで受信されることができる。信号は、モノラル信号、ステレオオーディオ信号、サラウンドサウンド信号など、任意の数のチャネルをそこに含んでいてもよい。オーディオ信号は、多くの場合、FLAC、ALAC、APE、OFR、TTA、WV、MPEGなどのコーデックによって符号化される。多くの場合、オーディオ信号は、オーディオ信号が40Hz~15kHzのようなより狭い周波数間隔に適していても、20Hz~20kHzの可聴周波数間隔の全て又は大部分の周波数からなる。
オーディオ信号は、通常、物理的又は音の所望の出力に対応し、ここで、対応とは、オーディオ信号が、少なくとも所望の周波数帯域内で、音と同じ周波数成分、しばしば同じ相対的信号強度を有することである。そのような成分及び相対的な信号強度は、しばしば時間の経過とともに変化するが、対応関係は、好ましくは変化しない。
オーディオ信号は、無線で、又はケーブル(光又は電気)のようなワイヤを介して搬送されることがある。オーディオ信号は、ストリーミングまたはライブセッションから、または任意の種類のストレージから受信されてもよい。
オーディオ信号又は少なくともその周波数間隔に対応する音信号を出力することが所望される。本発明は、人間の耳が音が届く方向を判断できる周波数帯域の音と、この周波数区間内の音の部屋や会場での相互作用に注目する。この周波数間隔は、100~8000Hzの周波数間隔と見なすことができるが、所望により、例えば300~7kHz、300~6kHz、400~4kHz、または200~6kHzの間で選択することができる。
聴覚系は音源定位のために、両耳間の時間・レベル差(または強度・ラウドネス差)、スペクトル情報、タイミング解析、相関解析、パターンマッチングなど、いくつかの手がかりを用いる。耳間レベル差は、1.500Hz~8000Hzの範囲で起こっており、レベル差は周波数依存性が高く、周波数が高くなるにつれて大きくなる。聴覚間時間差は800-1.500Hzの範囲で優勢であり、聴覚間位相差は80-800Hzの範囲である。
400Hz以下の周波数では、頭の寸法(耳の距離21.5cm、625μsの耳間時間差に相当)が音波の1/4波長より小さいので、耳間の位相差の混乱が問題になり始める。200Hz以下では、耳間レベル差が非常に小さくなり、ILDだけでは入力方向の正確な評価がほぼ不可能になる。80Hz以下では、位相差、ILD、ITDのすべてが小さくなり、音の方向を決定することができなくなる。
同じように頭の大きさを考慮すると、1.600Hz以上の周波数では、頭の大きさが音波の波長より大きくなるため、位相情報が曖昧になる。しかし、ILDは大きくなり、さらに高周波数では群遅延が顕著になる。つまり、音のオンセット、トランジェントがあれば、このオンセットの耳間の遅延を利用して、対応する音源の入力方向を決定することができる。このメカニズムは、残響環境において特に重要になる。
本発明によれば、オーディオ信号から多数のオーディオサブ信号が生成され、各オーディオサブ信号は、100~8000Hzの周波数間隔内のオーディオ信号を表し、あるサブ信号の周波数間隔は、別のサブ信号の周波数間隔に完全に含まれることはない。したがって、サブ信号は、周波数間隔内のオーディオ信号を表す。サブ信号は、オーディオ信号の関連部分を構成することが望まれる場合がある。サブ信号は、所望の周波数間隔を選択するために、オーディオ信号にバンドパスフィルタ及び/又は1つ以上のハイパス及び/又はローパスフィルタを適用することによって生成されてもよい。サブオーディオ信号は、周波数間隔内のオーディオ信号と同一であってもよいが、フィルタはその端部(極端な周波数)では理想的でないことが多く、例えばハイパスフィルタの中心周波数以下の周波数はある程度通過させるようにフィルタが品質を失うことが多い。
どのオーディオサブ信号も、他のオーディオサブ信号の周波数間隔に完全に含まれる周波数間隔を有していない。したがって、オーディオサブ信号はすべて、オーディオ信号の異なる周波数間隔を表現する。したがって、100~8000Hzの区間内の各周波数について、オーディオサブ信号におけるそれらの表現は同じではないだろう。周波数は、オーディオサブ信号の1つまたは複数の周波数間隔内に入り、他のものには入らない場合がある。当然ながら、周波数間隔が重なることもある。フィルタリング効率(Q値)は、所望に応じて選択することができる。フィルタリングは、ディスクリート部品、DSP、プロセッサ等で実行されてもよい。
音または少なくともオーディオサブ信号によって定義される音を出力するために、少なくとも100~8000Hzの所望の周波数区間で音を出力することができる複数の音出力スピーカトランスデューサをそれぞれ含むスピーカが提供される。スピーカトランスデューサは、同一のものであってもよいし、同一のインピーダンス曲線などの同一の特性を有していてもよい。あるいは、スピーカトランスデューサは、異なるタイプのものであってもよい。オーディオ信号又はオーディオサブ信号のような同一の信号が、各ラウドスピーカトランスデューサから出力されたときに同一の音を発生することが好ましい。それにもかかわらず、異なるタイプまたは異なる特性を有するスピーカトランスデューサを使用することができる。例えば、スピーカトランスデューサ用の電気サブ信号が当該スピーカトランスデューサに適合され、すべてのスピーカトランスデューサが少なくとも実質的に同じ音を出力する、すなわち、それぞれが、1つまたは複数の周波数などの音出力と、音を生成するためにスピーカトランスデューサに適合され投入された信号と、の関係が同じである場合、スピーカトランスデューサは、このようになる。
ラウドスピーカトランスデューサは、部屋または会場内に配置され、少なくとも3つの異なる方向に向けられることがある。部屋または会場は、1つまたは複数の壁、天井、および床を有することができる。部屋または会場は、壁/天井/床/柱などの1つまたは複数の音反射要素を有することが好ましい。
スピーカトランスデューサの組み合わせは、平らな表面から離れる球の半分のような180度の球を表現するように選択されることもある。このような平坦な表面は、キーボード表面、ラップトップ表面、またはスクリーン表面である可能性がある。
スピーカトランスデューサの方向は、スピーカトランスデューサによって出力される音波の主方向であってよい。スピーカトランスデューサは、最も高い音強度が出力される、または音強度プロファイルが多かれ少なかれ対称である周りの、対称軸などの軸を有することができる。
スピーカトランスデューサは、少なくとも3つの異なる方向に向けられる。方向は、垂直または水平面に投影したとき、または交差するように変換したときなど、これらの間に少なくとも5°、例えば少なくとも10°、例えば少なくとも20°の角度が存在する場合、異なることがある。2つの方向間の角度は、2つの方向間の可能な最小の角度であってよい。2つの方向は、同じ軸に沿って、反対方向に伸びることがある。明らかに、4、5、6、7、8、10個以上のスピーカトランスデューサが使用される場合など、3つ以上の異なる方向が好まれる場合がある。
特に興味深い実施形態は、1つのラウドスピーカトランスデューサが立方体の各面に設けられ、立方体から離れた方向に音を出力するように向けられるものである。この実施形態では、6つの異なる方向が使用されている。別の実施形態では、ラウドスピーカトランスデューサは、壁、天井、床に配置され、ラウドスピーカトランスデューサ間の空間に音を送り込むような方向になっている。
各ラウドスピーカトランスデューサのために、電気サブ信号が生成される。このように、各スピーカトランスデューサは、他のスピーカトランスデューサから独立して操作することができる。明らかに、多数のスピーカトランスデューサが使用される場合、複数のスピーカトランスデューサは、同一に駆動または操作される可能性がある。そのような同一に駆動されるスピーカトランスデューサは、同じ方向又は異なる方向を有することができる。
この文脈では、電気サブ信号は、ラウドスピーカトランスデューサに意図された信号である。この信号は、ラウドスピーカトランスデューサに直接供給されてもよいし、増幅及び/又はフィルタリングなどによって、ラウドスピーカトランスデューサに適合されてもよい。さらに、電気サブ信号は、光、無線、または電気配線など、任意の形式であってよい。電気サブ信号は、所望により任意のコーデックを用いて符号化されてもよく、デジタル又はアナログであってもよい。スピーカトランスデューサは、電気サブ信号を受信してスピーカトランスデューサを駆動するために、減圧、フィルタ、増幅器、受信機、DACなどを含んでいてもよい。
各電気サブ信号は、スピーカトランスデューサに供給される前に、任意の所望の方法で適合させることができる。一実施形態では、電気サブ信号は、スピーカトランスデューサに供給される前に増幅される。その実施形態または別の実施形態では、電気サブ信号は、その周波数特性が当該ラウドスピーカトランスデューサのものに適合されるように、フィルタリングまたは等化などの適合がなされることがある。異なるラウドスピーカトランスデューサに対して異なる増幅及び適応が望まれる場合がある。
各電気サブ信号は、各オーディオサブ信号の所定の部分を構成し、又は表現する。この部分は、一部のオーディオサブ信号ではゼロであることもある。次に、各オーディオサブ信号は、数学的な言い方をすれば、重みまたは係数を掛けられ、その後、すべての結果のオーディオサブ信号が合計されて電気サブ信号が形成される場合がある。明らかに、この処理は、コンピュータ、プロセッサ、コントローラ、DSP、FPGAなどで行われることがあり、このコンピュータは、その後、スピーカトランスデューサに供給するために、またはスピーカトランスデューサに供給する前に変換/受信/適応/増幅されるために、電気サブ信号または各電気信号を出力する。
当然ながら、電気サブ信号及び/又はオーディオサブ信号は、その生成とスピーカトランスデューサへの供給との間に保存されることがある。したがって、実際のオーディオ信号に加えて、またはその代わりに、そのような信号が保存される新しいオーディオフォーマットが見られ得る。
電気サブ信号がスピーカトランスデューサに供給されると、音が出力される。
オーディオサブ信号の和が、オーディオサブ信号の外側周波数間隔内に提供されるオーディオ信号の部分と少なくとも実質的に同一であることが好ましい。したがって、オーディオサブ信号は、オーディオ信号のその部分を表すように選択され得る。この全体的な周波数間隔の外側にあるオーディオ信号の部分は、異なる方法で処理されることがある。この文脈では、オーディオサブ信号の和の強度は、オーディオ信号の対応する部分のエネルギ/ラウドネスの10%以内、例えば5%以内であってよい。また、代替的に、合成されたオーディオサブ信号の100Hz、50Hz又は10Hzなどの所定の幅の各周波数区間におけるエネルギ/ラウドネスは、オーディオ信号の同じ周波数区間におけるエネルギ/ラウドネスの5%以内など、10%以内であってもよい。
当然のことながら、全体的な願望として、オーディオ信号のその周波数間隔内の周波数成分を不明瞭にしないように、スケーリングまたは増幅が許容される場合がある。したがって、周波数間隔内の1つ、2つ、3つ、複数または2つの周波数の各組について、その周波数での、合計されたオーディオサブバンドの強度が、オーディオ信号の強度の10%以内、例えば5%以内であることが望まれ得る。したがって、相対的な周波数強度が維持されることが望まれる。
同様に、電気サブ信号の和は、電気サブ信号の外側の周波数間隔内に提供されるオーディオ信号の部分と少なくとも実質的に同一であることが好ましい。したがって、電気サブ信号は、オーディオ信号のその部分を表すことができる。この全体的な周波数間隔の外側にあるオーディオ信号の部分は、他のトランスデューサによって扱われることがある。この文脈では、電気サブ信号の和の強度は、オーディオ信号の対応する部分のエネルギ/ラウドネスの10%以内、例えば5%以内であってよい。また、代替的に、電気サブ信号の合計の100Hz、50Hz又は10Hzなどの所定の幅の各周波数区間におけるエネルギ/ラウドネスは、オーディオ信号の同じ周波数区間におけるエネルギ/ラウドネスの5%以内など、10%以内である場合がある。
当然のことながら、全体的な願望として、オーディオ信号のその周波数間隔内の周波数成分を不明瞭にしないように、スケーリングまたは増幅が許容される場合がある。したがって、周波数間隔内の1つ、2つ、3つ、複数、または2つの周波数の各組について、その周波数での、合計された電気サブバンドの強度が、オーディオ信号の強度の10%以内、例えば5%以内であることが望まれ得る。このように、相対的な周波数強度は、オーディオ信号から音出力まで維持されることが望ましい。
明らかに、電気サウンド信号は、オーディオ信号が正しく表現されるように、すべてのスピーカトランスデューサからの音出力が相関するように調整されることが望まれる。したがって、オーディオサブ信号、電気サブ信号、および任意の適応/増幅の生成は、好ましくは、信号の調整および位相を保持する。
本発明によれば、電気サブ信号の生成は、各電気サブ信号におけるオーディオサブ信号の所定部分を経時的に変化させることからなる。したがって、各電気サブ信号の生成は、上記の数学的な話し方に戻ると、オーディオサブ信号に掛けられる重み(複数可)が時間と共に変化し、電気サブ信号において、所定のオーディオサブ信号の割合が時間と共に変化するように行われる。
部分または割合が時間とともに変化する方法は、以下に説明する多くの方法で選択することができる。一つの方法として、オーディオサブ信号は、それぞれがその特定の信号に対応する音を出力する仮想ラウドスピーカトランスデューサと考えることができる。実際のラウドスピーカトランスデューサの1つ以上は、仮想ラウドスピーカトランスデューサの音の一部を、実際のラウドスピーカトランスデューサのどこに配置され、どのように指示されるかに応じて出力する。この種の抽象化は、標準的なステレオセットアップにも見られ、クラシックオーケストラの弦楽器セクションなどの仮想音源の位置は、ステレオセットアップの実際のラウドスピーカトランスデューサから離れた場所に配置されていても、この仮想位置から来るかのように聞こえる音で表現されることがある。
このように、電気サブ信号に含まれるオーディオサブ信号の部分は、オーディオサブ信号に対応する仮想ラウドスピーカトランスデューサの所望の位置、および潜在的な方向と、実際のラウドスピーカトランスデューサの位置、および潜在的な方向の相関によって決定することができる。位置が近いほど、また関連する場合は方向が揃っているほど、そのスピーカトランスデューサの電気サブ信号の中にオーディオサブ信号の大きな部分が見られる可能性がある。
この決定は、例えば、球などの幾何学的形状上で、実スピーカトランスデューサと仮想スピーカトランスデューサの位置をシミュレーションすることによって行うことができ、実スピーカトランスデューサは固定位置を有するが、仮想スピーカトランスデューサはその形状上を移動することが許される。そして、実ラウドスピーカトランスデューサの電気信号における仮想ラウドスピーカトランスデューサのオーディオ信号の部分は、当該仮想ラウドスピーカトランスデューサと仮想実ラウドスピーカトランスデューサとの間の距離に基づいて決定され得る。
一実施形態では、オーディオ信号を受信するステップは、ステレオ信号を受信することを含んでいる。この状況において、オーディオサブ信号を生成するステップは、ステレオオーディオ信号の各チャネルに対して、複数のオーディオサブ信号を生成することからなり得る。
そして、多数のオーディオサブ信号が右チャネルに関連し、多数のオーディオサブ信号が左チャネルに関連することがある。少なくとも実質的に同じ周波数間隔を有する左チャネルの1つのオーディオサブ信号と右チャネルの1つのサブ信号の組が存在し、そのような組の仮想スピーカトランスデューサが少なくとも実質的に反対方向に、または少なくとも同じ方向には向けられないことが望まれ得る。これは、ラウドスピーカトランスデューサの位置と潜在的な方向を知りながら、電気サブ信号の部分を適宜選択することによって得られる。また、オーディオサブ信号の各ペアがより独立性を持ち、協調を持たないこと、または協調が同じサブバンドの左チャネルと右チャネルとの間の方向における完全な一致を回避することに関係することが望まれることもある。
一実施形態では、オーディオ信号を受信するステップは、モノラル信号を受信することと、オーディオ信号から、モノラル信号に対して少なくとも実質的に位相が反転している第2の信号を生成することとを含む。この状況では、オーディオサブ信号を生成するステップは、モノラルオーディオ信号および第2の信号のそれぞれについて、複数のオーディオサブ信号を生成することからなる場合がある。
そして、これら2つの信号は、ステレオ信号の上記左信号および右信号として扱われ、多数のオーディオサブバンドがモノラル信号に関連し、多数のオーディオサブバンドが他のチャネルに関連し得るようにすることができる。少なくとも実質的に同じ周波数間隔を有するモノラル信号の1つのオーディオサブバンドと他の信号の1つのサブバンドのペアが存在し、そのようなペアの仮想スピーカトランスデューサが少なくとも実質的に反対方向に、または少なくとも同じ方向には向かないことが望まれ得る。これは、ラウドスピーカトランスデューサの位置、潜在的な方向を知りながら、電気サブ信号における部分を適宜選択することによって得られる。
空間的なオーディオキューがある中央帯域のサブ帯域は、いくつかの手段によって生成または定義することができ、サブ帯域の数は一般に多いほど良い結果をもたらす。また、周波数の境界を対数的に設定することも利点となり、1つのサブバンド分割は、100、300、1.200、4000に境界(Hz)を持つ3バンドにすることができる。別の分割では、ここでは6バンドで、100、200、400、800、1.600、3.200、6.400に境界(Hz)を持つことができる。このような低い数のサブバンドは、1、2、3またはそれ以上の仮想ドライバに与えることができ、同じサブバンドが仮想球の異なる位置にある1、2、3またはそれ以上の同時仮想ドライバに分配されるようにする。これにより、仮想ドライバの数は、結果として得られるオーディオ球の滑らかさに大きく貢献するため、結果が向上する。
サブバンドの分割は、例えば、心理音響学的なスケールであるBarkスケールのように、等距離が知覚的に等距離に対応するような他の概念に従うこともできる。Barkスケールで18個のサブバンドを分割した場合、サブバンドの境界(Hz)は、100、200、300、400、510、630、770、920、1080、1270、1480、1720、2000、2320、2700、3150、3700、4400に設定する。
多数のサブバンドの場合、1/3オクターブへの分割も成功し、サブバンドの境界(Hz)は111、140、180、224、281、353、449、561、707、898、1122、1403、1795、2244、2805、3534、4488、5610、7069とする。
また、サブバンドは減算によって構成することもでき、5サブバンド減算法では、100、200、400、800、1.600、3.200にサブバンド境界(Hz)を与え、各仮想ドライバのサブバンドは、band1+band3、band1+band4、band2+band4、band2+band5、band3+band5という組み合わせからなる。
さらに、サウンドスフィアへの入射音のスムーズなレンダリングを提供することができるため、動的境界アプローチも可能であり、これについては本書の他の箇所で詳しく説明する。
上記のサブバンド境界を決定する方法の例は、サウンドスフィアの音色、または「フレーバー」がある程度変化するという点で、すべてわずかに異なる結果を提供する。しかし、これらはすべて、オーディオ球における空間オーディオキューの追加、または調達に備えるための、許容され、概念的に一貫した方法である。
上記のように任意の数のバンドを使用してサブバンド境界が決定されると、各サブバンドにおける信号のエネルギ、パワー、ラウドネス又は強度の推定値を計算することが可能である。これは通常、二乗和や対数演算などの非線形、時間平均演算、さらに平滑化を含み、その結果、互いに比較できるサブバンド量、またはピンクノイズなどのターゲット信号の量を得ることができる。この比較により、サブバンド量に一定のゲイン係数を乗じることで調整することが可能である。このゲインは、1)ピンクノイズのような理論的な信号またはノイズモデルによって決定される、2)リアルタイム動作で測定された最高ゲインをあらかじめ決められたレベル内に保存することによって動的に推定される、3)トレーニングで過去に観測されたゲインの機械学習による、などがある。サブバンド量を調整する別の方法は、本書の他の箇所で深く議論されているように、境界の周波数を動的に変更することである。
一実施形態は、オーディオ信号から、100Hzなどの第1の閾値周波数以下の周波数を有するその低周波部分を導出するステップと、低周波部分を全ての電気サブ信号に少なくとも実質的に均等に、または同じ仮想ドライバのサブ信号に比例して含むステップとをさらに含む。この態様では、低周波を有するオーディオ信号は、全てのオーディオサブ信号および/または全ての電気サブ信号によって出力される。代替的に、この低周波信号を一部のオーディオサブ信号および/または一部の電気サブ信号のみに提供することが望まれ得る。
代替案としては、この低周波をスピーカトランスデューサによってではなく、1つまたは複数の別個のスピーカトランスデューサによって提供することが考えられる。
一実施形態は、オーディオ信号から、8000Hzなどの第2の閾値周波数を超える周波数を有するその高域部分を導出するステップをさらに含み、この高域部分を、すべての電気サブ信号において少なくとも実質的に均等に、または同じ仮想ドライバのサブ信号に対して比例して含ませる。このようにして、高周波を有するオーディオ信号は、全てのオーディオサブ信号及び/又は全ての電気サブ信号によって出力される。代替的に、この高周波信号を一部のオーディオサブ信号および/または一部の電気サブ信号のみに提供することが望まれ得る。
代替案としては、この高周波をスピーカトランスデューサによってではなく、1つ以上の別個のスピーカトランスデューサによって提供することが考えられる。
上述のように、各電気サブ信号で表されるオーディオサブ信号の部分の選択は、多くの考慮事項に基づいて実行され得る。
ある状況では、各オーディオサブ信号および/または電気サブ信号における音エネルギ、ラウドネスまたは強度が同じであるか、または少なくとも実質的に同じであることが所望され得る。他方、例えば異なる周波数の組の強度/ラウドネスの間に見られる対応が、オーディオ信号と音出力において同じか、少なくとも実質的に同じであるべきであるように、全体の音出力がオーディオ信号に対応することが望まれる場合がある。したがって、オーディオサブバンドにおけるエネルギまたはラウドネスは、当該周波数間隔における1つ、より多くの、またはすべての周波数においてその強度/ラウドネスを増加させることによって増加することができるが、これは所望されないかもしれない。あるいは、周波数間隔内の強度/ラウドネスは、周波数間隔を広げることによって増加させることができる。このような動的境界アプローチは、低周波数成分及び高周波数成分に係る、組み合わせた周波数帯の2つの外側周波数境界を決定するためにも使用することができる。これは、個々の周波数帯域が計算される前に計算されてもよく、これらの外側周波数境界は、結合されたスピーカトランスデューサによって放射される結合信号のコヒーレンスが、入力音との対応、または類似性の望ましい程度を有するように計算されてもよい。
この文脈では、音又は信号のエネルギ、ラウドネス又は強度は、多くの方法で決定することができる。一つの方法は、特定の周波数帯域の振幅に対応する、変換の各周波数ビンの大きさを返すフーリエ変換によって、スペクトル包絡線を計算することであろう。その後、得られたエンベロープを周波数領域で重みとして積分し、結果をサブバンドの数に相当する数の等しいサイズにセグメント化すると、境界が積分から得られる各セグメントの周波数軸上の交点に一致するため、サブバンドの新しい周波数境界が得られる。
別の方法としては、フィルタバンク分析によってスペクトル包絡線を計算することが考えられ、フィルタバンクは、入力される音をいくつかの別々の周波数帯域に分割し、各帯域の振幅を返す。これは、512個、またはそれ以上、またはそれ以下の多数のバンドパスフィルタによって達成される可能性があり、結果として生じるバンドセンターとラウドネスは、前の例と同様の方法で統合される。
フィルタバンクの例の別のバリエーションは、フィルタバンドの数が特定の実装におけるサブバンドの数と同じである非均一フィルタバンクを使用することである。フィルタバンクの各フィルタの勾配と中心周波数は、サブバンドの幅を計算するために使用することができ、そこからサブバンド間の周波数境界を導出することができる。
さらに、オクターブバンドフィルタのバンクを使用し、静的な重み付けを行い、その後、上記の統合ステップを行うという方法もある。
別の方法として、音楽情報検索(MIR)で開発された音楽類似度測定を使用することもできる。この方法は、オーディオ信号から意味のある計算可能な特徴を抽出し推論することを扱う。このような特徴のコレクションと、周波数サブバンドへの適切なセグメンテーションがあれば、簡単なルックアップ処理で、システムで再生されている音楽のカテゴリを決定し、それに応じて周波数バンドを動的に設定することができる。
最後に、特徴による機械学習のような統計的方法を使用して、与えられたオーディオ入力に対するサブバンド境界の適切な周波数に関する予測および決定を行うことができ、ここで、アルゴリズムは、サンプルオーディオデータの大規模なコレクションで事前に訓練される。
したがって、オーディオサブ信号を生成するステップは、各オーディオサブ信号における結合エネルギが所定のエネルギ/ラウドネス値の10%以内となるように、オーディオサブ信号の1つまたは複数の周波数間隔を選択することを含み得る。したがって、すべてのオーディオサブ信号は、この値の10%以内のエネルギ/ラウドネスを有する。当然のことながら、所定のエネルギ/ラウドネス値は、オーディオサブ信号のエネルギ/ラウドネス値の平均値であってよい。あるいは、エネルギ/ラウドネスは、例えば、オーディオ信号自体、またはそのチャネルについて決定されてもよい。このエネルギ/ラウドネスは、オーディオ信号またはチャネルに望まれるオーディオサブ信号の数に分割されてもよい。例えば、間隔100~8000Hzのオーディオ信号におけるエネルギ/ラウドネスが決定され、3つのオーディオサブ信号が所望される場合には、3で割られることがある。そして、各オーディオ信号のエネルギ/ラウドネスは、この求められたエネルギ/ラウドネスの90%から110%の間であることが望ましい。そして、このエネルギ/ラウドネスを達成するために、周波数間隔を適合させることができる。周波数間隔が重なるようにしてもよいことは、再認識される。
上記のエネルギ/ラウドネスの考慮は、オーディオサブ信号および/または電気サブ信号に関するものであってもよいことは、再掲される。
特に興味深い実施形態では、1つの-または各-電気サブ信号で表されるオーディオサブ信号の部分は、むしろ著しく変化する。したがって、電気サブ信号を生成するステップが、1つまたは複数の電気サブ信号に対して、電気サブ帯域で表されるオーディオサブ帯域の部分が1秒あたり少なくとも5%増加または減少するように電気サブ信号を生成することを含むことが望まれ得る。したがって、オーディオサブ帯域のエネルギ/ラウドネス/強度の割合であってもよいその部分は、1秒間に5%以上変化する。したがって、t=0において、その割合が50%である場合、t=1(秒)において、その割合は47.5%以下または52.5%以上である。
特に、スピーカトランスデューサが、任意の所望のサイズ及び形状のスピーカキャビネットなどのエンクロージャの外面に設けられている場合、オーディオサブ信号は、キャビネット内又はキャビネットの表面又は所定の幾何学的形状上を動き回る個々の仮想スピーカトランスデューサと見ることができる。その位置、および、所定の方向であると仮定しない場合には任意に方向は、実際のラウドスピーカトランスデューサの位置、および、潜在的に方向と相関し、部分または重みを計算するために使用される。そして、形状内または形状上の個々の仮想スピーカトランスデューサの回転または移動をシミュレートすることにより、部分の時間的変化を得ることができる。
明らかに、仮想ラウドスピーカトランスデューサが出力する音は、仮想ラウドスピーカトランスデューサを形成するオーディオサブ信号の一部を受信する実際のラウドスピーカトランスデューサが出力する音である。各ラウドスピーカトランスデューサに供給される部分と、ラウドスピーカトランスデューサの位置、そして場合によってはその方向によって、仮想ラウドスピーカトランスデューサから出力されるサウンド全体が決定される。仮想ラウドスピーカトランスデューサの再位置決めまたは回転は、個々のラウドスピーカトランスデューサにおける対応する音の強度/ラウドネスを変更することにより、つまりラウドスピーカトランスデューサにおけるそのオーディオサブ信号の部分または電気サブ信号を変更することにより行われる。
本発明の第2の態様は、オーディオ信号に基づいて音声を出力するシステムに関し、該システムは、
オーディオ信号を受信する入力と、
各々が少なくとも100-8000Hzの間隔で音を出力することができる複数の音出力スピーカトランスデューサを含むスピーカであって、該スピーカトランスデューサは部屋または会場内に配置されている、スピーカと、
オーディオ信号から複数のオーディオサブ信号を生成するように、且つ、各ラウドスピーカトランスデューサ用に電気サブ信号を生成するように、構成されたコントローラであって、各オーディオサブ信号は100-8000Hzの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれておらず、各電気サブ信号は各オーディオサブ信号の所定の部分を含む、コントローラと、
電気サブ信号をラウドスピーカトランスデューサに供給する手段と
を含み、
前記コントローラは、各電気サブ信号の、オーディオサブ信号の所定の部分が経時的に変化するように、電気サブ信号の各々を生成するように構成されている。
本明細書において、システムは、別個の要素の組み合わせであってもよいし、単一の単体要素であってもよい。入力、コントローラ、及びスピーカは、オーディオ信号を受信して音を出力するように構成された単一の要素であってよい。
あるいは、コントローラは、電気サブ信号またはオーディオ信号をスピーカから遠隔で生成し、スピーカに供給するように、スピーカから分離または分離可能であってもよい。
明らかに、コントローラは、通信するように構成された1つまたは複数の要素であってよい。したがって、オーディオサブ信号は、1つのコントローラで生成され、電気サブ信号は、別のコントローラで生成される場合がある。後述するように、新しいコーデックまたはカプセル化が生成されてもよく、それによって、オーディオサブ信号または電気サブ信号が、制御され標準化された方法でコントローラまたはスピーカに転送され、次にこれらを解釈してサウンドを出力することができる。
上述したように、オーディオ信号は、既知のコーデックまたはエンコーディングフォーマットのいずれかなど、任意のフォーマットであってよい。オーディオ信号は、ライブパフォーマンス、ストリーミング、またはストレージから受信されることがある。
入力は、無線ソースから、電気ケーブルから、光ファイバから、ストレージなどから信号を受信するように構成されてもよい。入力は、オーディオ信号に到達するために、任意の所望または必要な信号処理、変換、エラー訂正などを構成することができる。したがって、入力は、アンテナ、コネクタ、コントローラまたはMACなどの別のチップの入力などであってもよい。
スピーカは、信号を受信し、音を出力するように構成される。この文脈では、スピーカは、音を出力するように構成された複数のスピーカトランスデューサを含んでいる。ラウドスピーカトランスデューサは、上述した少なくとも3つの異なる方向に音を向ける。
複数のラウドスピーカトランスデューサが、例えばオーディオサブ信号の周波数間隔によってカバーされる周波数間隔の全てをカバーするために必要である場合、複数のラウドスピーカトランスデューサは同じ方向に向けられることがある。この周波数間隔が広く、スピーカトランスデューサがより狭い動作周波数間隔を有する場合、方向ごとに多数の異なるスピーカトランスデューサが必要とされる場合がある。
また、スピーカトランスデューサの指向性が狭すぎる場合、当該オーディオサブ信号で特定の角度区間をカバーするために、わずかに分流する方向のみを有する複数のこのようなスピーカトランスデューサを提供することが望まれる場合がある。
前述したように、より多くの方向が使用されてもよい。
電気サブ信号は、ラウドスピーカトランスデューサに供給されることになる。電気サブ信号を生成するコントローラ又はその部分は、これらがスピーカに運ばれる必要がないように、スピーカに設けられてもよい。あるいは、スピーカにこれらの信号を受信するための入力部を設けることもできる。この入力は、このような信号を受信し、必要に応じて受信した信号を処理して各ラウドスピーカトランスデューサの信号を得るように構成されていなければならないことは明らかである。この処理は、スピーカ入力によって受信された汎用信号または複合信号から電気サブ信号を導き出すものであってもよい。
当該周波数間隔は、少なくとも100~8000Hzであるが、より狭くてもよい。
コントローラは、オーディオ信号から多数のオーディオサブ信号を生成するように構成される。このプロセスは、上記でさらに説明される。
オーディオサブ信号の数は、電気サブ信号の数に対応する必要はないことに留意されたい。
上述したように、同一または別のコントローラが、オーディオ信号から、各電気サブ信号におけるオーディオサブ信号の部分が時間的に変化する方法で、電気サブ信号を生成してもよい。
一実施形態では、入力は、ステレオ信号を受信するように構成される。そして、コントローラは、ステレオオーディオ信号の各チャネルに対して複数のオーディオサブ信号を生成するように構成され得る。そして、同じ周波数間隔に対応するオーディオサブ信号は、所定のスピーカトランスデューサに供給され、また、2つの信号が高すぎる部分で(同じ電気サブ信号に含まれる)同じスピーカトランスデューサに供給されないように、時間をかけて供給され得る。
別の実施形態では、入力は、モノラル信号を受信するように構成される。そして、コントローラは、オーディオ信号から、モノラル信号に対して少なくとも実質的に位相反転された第2の信号を生成し、モノラルオーディオ信号と第2の信号のそれぞれに対して複数のオーディオサブ信号を生成するように構成され得る。そして、同じ周波数間隔に対応するオーディオサブ信号は、所定のスピーカトランスデューサに供給され、また、2つの信号が高すぎる部分で(同じ電気サブ信号に含まれる)同じスピーカトランスデューサに供給されないように、時間をかけて供給され得る。
一実施形態では、コントローラは、オーディオ信号から、100Hz、200Hz、300Hz、400Hzまたはその間の任意の周波数であり得る第1の閾値周波数未満の周波数を有するその低周波部分を導出し、低周波部分をすべての電気サブ信号に少なくとも実質的に均一に含むようにさらに構成される。あるいは、スピーカは、この低周波信号が供給される別個のスピーカトランスデューサから構成され得る。
一実施形態では、コントローラは、オーディオ信号から、4000Hz、5000Hz、6000Hz、7000Hzもしくは8000Hzまたはその間の任意の周波数である第2の閾値周波数を超える周波数を有するその高域部分を導出し、この高域部分をすべての電気サブ信号に少なくとも実質的に均等に含めるようにさらに構成される。あるいは、スピーカは、この高周波信号が供給される別個のスピーカトランスデューサから構成されることも可能である。
一実施形態では、コントローラは、各オーディオサブ信号における結合エネルギ、例えば結合ラウドネスが所定のエネルギ/ラウドネスの値の10%以内となるように、オーディオサブ信号の1つまたは複数の周波数間隔を選択するようにさらに構成される。上述したように、各オーディオサブ信号におけるエネルギ、ラウドネス又は強度が同じであることが好ましい場合がある。これを達成するために、各オーディオサブ信号の周波数間隔を適合させることができる。所定のエネルギ値は、例えばチャネル内の全てのオーディオサブ信号又は全てのオーディオサブ信号の平均エネルギ又はラウドネス値、又はオーディオサブ信号の全体の周波数間隔内のようなオーディオ信号のエネルギ/ラウドネスの割合であってもよい。
一実施形態では、コントローラは、1つまたは複数の電気サブ信号(複数可)に対して、電気サブ帯域で表されるオーディオサブ帯域の一部が1秒あたり少なくとも5%増加または減少するように、電気サブ信号を生成するようにさらに構成される。この態様では、電気サブ信号におけるオーディオサブ信号の部分は、かなり多く変化する。
別段の指定がない限り、添付の図面は、本明細書に記載された技術革新の態様を例示する。図面を参照すると、いくつかの図および本明細書を通して、同種の数字が同種の部品を指し、現在開示されている原理のいくつかの実施形態が、例として例示され、限定するものではない。
図1は、オーディオデバイスの一実施形態を示す。 図2は、代表的なリスニング環境に対応するサウンドスフィアを示す図である。 図3は、別の代表的なリスニング環境に対応する別の可能なサウンドスフィアを示す図である。 図4は、別の代表的なリスニング環境に対応する別の可能なサウンドスフィアを示す図である。 図5は、空間的な音源定位のための周波数帯域を示す図である。 図6は、ラウドスピーカトランスデューサ上の音分布を示す図である。 図7aは、ラウドスピーカトランスデューサ上の別の音の分布を示す図である。 図7bは、ラウドスピーカトランスデューサの別の音響分布を示す図である。 図8は、3次元指向性因子を説明する図である。 図9は、オーディオ処理環境を説明するための図である。 図10は、別のオーディオ処理環境を説明するための図である。
詳細な説明
以下では、滑らかに変化する、または一定の3次元空気中遷移を有するサウンドスフィアを提供するためのシステムに関する様々な革新的な原理を説明する。例えば、開示された原理の或る態様は、所望のサウンドスフィアまたはその近似をリスニング環境全体に投影するように構成されたオーディオデバイスに関係する。
方法行為の文脈で説明されるそのようなシステムの実施形態は、開示された原理の便利な例示例であるとして選択された、企図されるシステムの特定の例にすぎない。開示された原理の1つ以上は、対応する様々なシステム特性のいずれかを達成するために、様々な他のオーディオシステムに組み込むことができる。
したがって、本明細書で論じた特定の例とは異なる属性を有するシステムは、1つまたは複数の現在開示されている革新的な原理を具体化することができ、本明細書に詳細に説明されていない用途に使用することができる。したがって、そのような代替の実施形態も本開示の範囲内にある。
いくつかの実施態様において、本明細書に開示された革新は、一般に、滑らかに変化する音の定位情報を提供するために組み合わされる、複数のビームを有する3次元サウンドスフィアを提供するためのシステムおよび関連技術に関する。例えば、いくつかの開示されたオーディオシステムは、微妙に変化する、または一定の、位相関係、および独立した振幅で、音の周波数帯におけるサブセクションをラウドスピーカトランスデューサに投影できる。これにより、オーディオシステムは、リスニング環境全体にわたって、あらゆる入力オーディオに、付加された、または調達された、空間情報をレンダリングすることができる。
一例として、オーディオデバイスは、各々が独立したフルレンジトランスデューサを構成するラウドスピーカトランスデューサのアレイを有することができる。オーディオデバイスは、プロセッサと、プロセッサによって実行されると、オーディオデバイスに、オーディオ信号のパンニングプロセスによってラウドスピーカトランスデューサに沿ってゆっくりと移動される個々の仮想形状成分、形状成分の調整ペアなどの重みのある組み合わせで、3次元波形を360度の球形としてレンダリングさせる命令を含むメモリとを備える。各スピーカトランスデューサについて、オーディオデバイスは、指定された手順に従って、受信したオーディオ信号をフィルタリングすることができる。ダイナミックサウンドスフィアを実行する場合、オーディオデバイスは、音響空間においてそれらが合計されるとき、結合されたスフィアコンポーネントにわたって元の音を保持する。したがって、リスナにとって、結果として得られる音は、元の音の周波数エンベロープを保持するが、動的な、または一定の、3次元オーディオ空間化の追加、または調達がある。
本開示は、その3次元オーディオレンダリングを、2つの指定された閾値の上下の合計信号と組み合わせることができ、閾値の外のオーディオ信号は、認知リスニング装置に識別可能な、音の定位に関する情報を保持しない。これらの2つの範囲は、別々に2つのモノフォニックオーディオ信号に合計され、すべてのスピーカトランスデューサに同時に送信することができる。これにより、オーディオデバイスは、低域と高域の全てのスピーカトランスデューサの独立した制御とともに、認知リスニング装置が認識できる完全な3次元空間化を提供できる。
本開示は、1つのオーディオデバイス上の1つのモノラル信号入力を、デバイスのスピーカトランスデューサの数と等しい数の独立したスフィアコンポーネント、またはデバイスのスピーカトランスデューサの数とは異なる数の仮想スフィアコンポーネントで管理できる。各スフィアコンポーネントは、周波数範囲のサブセットとすることができ、すべての成分は、成分のバランスのとれた総和として、範囲に沿って均等に分配することができる。これらの成分は、幾何学的立体の平面上のすべてのスピーカトランスデューサで独立してパンすることができ、または幾何学的立体の対向する点で極性反転ペアとして、または他の方法で変更することができ、それらは隣接する平面間の任意の点に配置することができる。このようなシステムは、2つのデバイスと対になったステレオ構成で使用され、モノフォニックオーディオチャネルのそれぞれに別々の3次元空間化を提供し、左チャネルと右チャネルを2つのオーディオデバイスに別々にレンダリングし、3次元ステレオフォニックオーディオレンダリングシステムを結果としてもたらす。また、ステレオペアを個別にパンニングすることも可能であり、反対側のポイントに相関を観察することはできない。
本開示は、ユニットのスピーカトランスデューサの数の半分に等しい独立した反復の数で、1つのオーディオシステム上の1つのステレオ信号を管理することができる。各ペアは、ステレオ信号の周波数範囲のサブセットであり、幾何学的立体上の対向する点、または立体の隣接する平面の間の任意の点に配置され得る。ステレオペアは均等にパンされ、1つのオーディオデバイスで入力ステレオ信号の満足のいくレンダリングを行うことができる。その結果、点音源、3次元ステレオフォニックオーディオレンダリングシステムが実現する。
プロセッサメモリに格納された命令は、もしそう望むなら、帯域間の等しいラウドネスを観察することができる周波数帯域の適応可能な分割を作り出すことができる。これは、非常に局所的な周波数範囲におけるエネルギ/ラウドネスの変化による突然の方向転換を回避する。
I.概要
ここで図1及び図2を参照すると、オーディオデバイス(又はスピーカ)10は、部屋20に配置され得る。3次元サウンドスフィア30がオーディオデバイス10によってレンダリングされ、リスナの最適なリスニングエリアはスフィア30と一致する。
図3及び図4は、デバイス10の位置決めの他の例示的な表現を示す。オーディオデバイス10は、デバイス10に対する1つまたは複数の反射境界、例えば壁22a、22bの位置、ならびにサウンドスフィア30a、30bと一致するリスナの可能性が高い位置26a、26aに対応し得る。レンダリングされた3次元サウンドスフィア30a、30bは、波形が壁から折り返されるにつれて強化される。
以下でより詳細に説明するように、3次元サウンドスフィアは、スフィアコンポーネントの組み合わせによって構成することができる。3次元サウンドスフィアは、異なるオーディオ周波数、又は周波数帯域に沿った振幅、位相及び時間の変化に依存する。このような依存関係を管理するための方法論を考案することができ、開示されたオーディオデバイスは、これらの方法をオーディオコンテンツを含む音響信号またはデジタル信号に適用して、3次元サウンドスフィアとしてレンダリングすることができる。
セクションIIでは、図1に描かれたデバイスを参照しながら、このようなオーディオデバイスに関連する原理を説明する。セクションIIIでは、望ましい3次元サウンドスフィアに関する原理を説明し、セクションIVでは、オーディオコンテンツを仮想と現実の両方のスフィアコンポーネントの組み合わせに分解し、音響空間でそれらを再組み立てすることに関する原理を説明する。セクションVでは、オーディオデバイスの3次元性とその周波数による変化に関する指向性の原理を開示する。セクションVIは、オーディオコンテンツを含む入力51上の入力オーディオ信号から、所望の3次元音圏の近似をレンダリングするのに適したオーディオプロセッサに関連する原理を記述している。セクションVIIでは、開示された処理方法を実装するのに適したコンピューティング環境に関する原理を説明する。これは、実行されると、例えば、コンピューティング環境のプロセッサ50に1つ以上の開示された方法を実行させる命令を含む機械読取可能媒体の例を含むことになる。そのような命令は、ソフトウェア、ファームウェア、またはハードウェアに埋め込むことができる。さらに、開示された方法および技術は、様々な形態の信号プロセッサにおいて、やはり、ソフトウェア、ファームウェア、またはハードウェアで実施することができる。
II.オーディオデバイス
図1は、複数の個別のラウドスピーカトランスデューサまたはラウドスピーカトランスデューサS1,S2,...,S6を含むラウドスピーカアレイを内蔵したラウドスピーカキャビネット12を含むオーディオデバイス10を示す。
一般に、ラウドスピーカアレイは、図示されたアレイが6つのラウドスピーカトランスデューサを持つにもかかわらず、任意の数の個別のラウドスピーカトランスデューサを持つことができる。図1に示されているスピーカトランスデューサの数は、図の便宜のために選択されている。他のアレイは6個より多いか少ないトランスデューサを持ち、トランスデューサ対の3軸より多いか少ない場合があり、軸は1つのトランスデューサのみを持つことができる。たとえば、オーディオデバイス用のアレイの一実施形態は、2、3、4、5、6、7、8、9、10、11、またはそれ以上のラウドスピーカトランスデューサを持つことができる。
図1では、キャビネット12は、キュービックキャビネットの対向する角16に配置された中心軸zを定義する一般的に立方体の形状をしている。
図のラウドスピーカアレイ内の各ラウドスピーカトランスデューサS1,S2,...,S6は、立方体の平面上に、軸の中心に対して一定、または実質的に一定の位置で、均一な半径距離、極、および方位角で均等に分布している。図1では、ラウドスピーカトランスデューサは互いに約90度の球状の間隔で配置されている。
スピーカトランスデューサは他の配置も可能である。たとえば、アレイ内のスピーカトランスデューサは、ラウドスピーカキャビネット12内に均等に分布している場合もあれば、不均等に分布している場合もある。また、スピーカトランスデューサS1、S2、...、S6は、図1に示すような一定距離の位置ではなく、軸中心から測定したさまざまな選択された球面位置に配置することができる。たとえば、各スピーカトランスデューサは2つ以上の軸点から分布させることができる。
各トランスデューサS1、S2、...、S6は、例えばウーファー、ツィーター、ミッドレンジ、フルレンジなどの特定の周波数帯での音の出力のために特別に設計された、電気力学的または他のタイプのラウドスピーカトランスデューサであってもよい。オーディオデバイス10は7番目のスピーカトランスデューサS0と組み合わせることができ、アレイからの出力を補うことができる。例えば、補助的なラウドスピーカトランスデューサS0は、選択された周波数、例えばサブウーファーとしてのローエンド周波数を放射するように構成することができる。補足的なラウドスピーカトランスデューサS0は、オーディオデバイス10に内蔵することも、別のキャビネットに収納することもできる。また、高周波出力用にS0のスピーカトランスデューサを使用することもできる。
ラウドスピーカキャビネット12は立方体として示されているが、ラウドスピーカキャビネット12の他の実施形態は別の形状をしている。例えば、いくつかのラウドスピーカキャビネットは、例えば、一般的な角柱構造、四面体構造、球形構造、楕円形構造、トロイダル構造、またはその他の任意の望ましい3次元形状として配置することができる。
III.3次元サウンドスフィア
再び図2を参照すると、オーディオデバイス10は部屋の中央に配置することができる。このような状況では、前述のように、オーディオデバイス10の周囲に3次元サウンドスフィアが均等に分布する。
3次元の球に音響エネルギを投影することにより、2次元のオーディオシステムと比較して、ユーザのリスニング体験を向上させることができる。なぜなら、一次元および2次元の音場における従来技術とは対照的に、開示によって提供される3次元のリスニングキューは、物理的な世界におけるサウンドキューと同様に、空間的であり、したがって没入的であるからである。
さらに、追加された空間オーディオキューは、リスニングフィールド全体、つまり球が、元のサウンド入力の顕著な特徴の均等なバランス、またはほぼ均等なバランスを含む限り、理想的なリスニングポジションに基づいて動作しないため、開示のリスニングスペースは、デバイス10の周囲に無限のリスニングポジションを提供する。
図3は、図2に示すのとは異なる位置にあるオーディオデバイス10を示している。図2では、音場30は円形をしており、音響エネルギを壁22にほとんどまたは全く向けていない。図3に示された3次元サウンドスフィアは図2に示されたものとは異なるが、図3に示されたサウンドスフィアは、壁22の反射がサウンドスフィア30と両立しないわけではないため、壁22と、現在は部分的に折りたたまれている、図3に示されたサウンドスフィア30と一致する可能性のあるリスニング位置と比較して、ラウドスピーカの図示された位置によく適合することができる。これは、球の成分がラウドスピーカトランスデューサに沿って常にシフトされるため、特定の周波数、すなわち周波数帯域の恒常的な強制を回避するためである。同様に、図4は、部屋のさらに別の位置にあるオーディオデバイス10と、図2に示すオーディオデバイス10の位置と比較して、再び壁22の位置と部屋の配置によって対応して折りたたまれた、聴取位置と一致する3次元サウンドスフィア30を示している。この特別な配置では、図3のように球の成分をシフトすることによって音の球の30の投影に関する同じ状況が発生しており、特定の周波数、または周波数帯域が常に強制されることはない。
オーディオデバイスのいくつかの実施形態では、オーディオデバイスの10の壁22への近接が極端であるか、非常に顕著である場合に、3次元音場を変更することができる。例えば、オーディオデバイス10のz軸を原点とした極座標を用いて3次元サウンドスフィア30を表現することにより、ユーザは、オーディオデバイス10のz軸を基準としたスピーカトランスデューサの振幅の方向スケーリングをタッチスクリーン上で「描画」することにより、サウンドスフィア30を球から非対称三軸楕円形に修正することができる。
さらに他の実施形態では、ユーザは、オーディオデバイス10またはリモートによって格納された複数の3次元非対称三軸楕円体から選択することができる。リモートで保存されている場合、オーディオデバイス10は選択された三軸非対称楕円体を通信接続を介してロードできる。さらに別の実施形態では、ユーザは、スマートフォンまたはタブレット上で、上記のように、所望の3軸非対称楕円体輪郭または既存の部屋の境界を「描画」することができ、オーディオデバイス10は、通信接続を介して、ユーザのデバイスから直接または間接的に、所望の非対称3軸楕円体、または部屋の境界の表現を受信することができる。コンピュータ環境に関連して後述するように、タッチスクリーン以外の他の形式のユーザ入力を使用することができる。
IV.3次元サウンドスフィアのモード分解と再構成
図5は、3次元聴覚における空間音源定位のために、聞き手の聴覚の全周波数範囲のサブセットとして、(100Hzに位置する)40から(3kHzに位置する)45までの周波数範囲を示している。音源定位の手がかりには、両耳間の時間差とレベル差、スペクトル情報、タイミング解析、相関解析、パターンマッチングなどがある。本開示では、聴覚系のこの知識を使用して、40から45の周波数範囲をいくつかのバンド(矢印)に分割し、これらのバンドを処理することによって、入力音に空間情報を追加または調達する。バンドの数は、ラウドスピーカトランスデューサの数の半分にすることができ、トランスデューサの数を増やしたり減らしたりすることができる。
すべての可能な実施例ではなく一例の手段として、図6では、ハイパスフィルタ50、バンドパスフィルタ51、52、および53、およびローパスフィルタ54は、オーディオストリームを5つのサブストリームまたはオーディオサブ信号に分離する。ハイパスフィルタは4kHz以上の信号成分を、ローパスフィルタは100Hz以下の信号成分を除去する。フィルタ50および54からの音声ストリームは3次元可聴範囲外にあり、異なる方法に従ってすべてのラウドスピーカトランスデューサS1、S2、...、S6に等しく送信されるか、またはラウドスピーカトランスデューサS0に送信される。フィルタ51、52、および53からの各周波数帯域からの信号のコピーは、位相シフトの程度を適用することによって、または極性反転によって変更することができ、その後、個々の信号の合計として、オーディオデバイス10の元の信号に対して180度の反対の点などの異なる点に変更された信号を送信して、ラウドスピーカトランスデューサS1-S6の信号に到達する。結果として得られるオーディオ出力は、3組の接続されたスフィアコンポーネントに独立した空間キューを追加したモノフォニックサウンドで、モノフォニックで3次元の音の球になる。この例の変形では、フィルタ51、52、および53からのオーディオストリームは、個別にラウドスピーカトランスデューサS1、S2、...、S6に送信され、ランダムまたは半ランダムに調整された方法で移動される。これは同様に、単音の3次元サウンドスフィアの空間的な手掛かりを提供するが、前の例とは大幅に異なる性質のものである。
図7aは同じシナリオを表しているが、ステレオ信号入力である。すべての可能な実施例ではなく一例として、図7aでは、ハイパスフィルタ60、バンドパスフィルタ61、62、63、およびローパスフィルタ64は、オーディオを5つのオーディオストリームに分離する。フィルタ60および64からのオーディオストリームは、3次元可聴範囲の外にあり、すべてのラウドスピーカトランスデューサS1、S2、...、S6に均等に送信される。これは、低域通過オーディオと高域通過オーディオの合計モノラル信号として、空間情報をまったく、またはほとんど提供しないため、または低域通過オーディオと高域通過オーディオの左および/または右チャネルの2つの個別のオーディオストリームとして、放出前に送信される。3次元可聴範囲内にあるフィルタ61、62、および63からのオーディオストリームは、個別に送信されるが、現在は、スピーカトランスデューサ[S1、S2]、[S3、S4]、[S5、S6]、またはトランスデューサ間の任意の軸点にペアで送信される。結果として得られるオーディオ出力は、ポイントソースの立体音響の3次元音場を提供するための空間キューの追加または調達を伴う立体音響である。
図7bは、ステレオ信号入力が別々のモノラルチャネルとして扱われるシナリオを示している。すべての可能な実施例ではなく一例の手段として、図7bでは、ハイパスフィルタ70、バンドパスフィルタ71A、71B、72A、72B、73A、73Bおよびローパスフィルタ74は、オーディオを8つのオーディオストリームに分離する。フィルタ70および74からのオーディオストリームは、3次元可聴範囲の外にあり、すべてのラウドスピーカトランスデューサS1、S2、...、S6に均等に送信される。これは、低域通過オーディオと高域通過オーディオの合計モノラル信号として、空間情報をまったく、またはほとんど提供しないため、または低域通過オーディオと高域通過オーディオの左および/または右チャネルの2つの個別のオーディオストリームとして、放出前に送信される。3次元可聴範囲内にあるフィルタ71A、71B、72A、72B、73A、73Bからのオーディオストリームは、個別に、スピーカトランスデューサ[S1、S2、S3、S4、S5、S6]、またはトランスデューサ間の任意の軸点に送信される。結果として得られるオーディオ出力は、複数の単一方向のサウンドであり、空間キューを追加または調達して、ポイントソースの複数の単一方向の3次元音場を提供する。したがって、図7aと比較して、(同じサブバンドに関連する)対応する音声サブ信号が出力される方向の角度に相関関係は必要ない。
V.指向性の検討
図8は、サウンドデバイスの10指向性係数の態様を表している。指向性係数の範囲は1-∞で、ラウドスピーカトランスデューサ(またはその他の任意の音発生器)が、加えられたエネルギを球形セクションに閉じ込める能力を示す。オーディオデバイスは、可聴周波数範囲(例:約20Hz~約20kHz)全体で方向性の度合いが異なり、一般に、周波数が20Hzに近づくにつれて方向性係数が低くなり、周波数が高くなるにつれて指向性係数が高くなる。公開されているオーディオデバイスの10指向性係数は、ラウドスピーカトランスデューサが均等に、またはほぼ均等に等辺の幾何学的立体に分布していることを考えると、全周波数範囲で1または1に近い。開示されたオーディオデバイスの10個の個々のラウドスピーカトランスデューサの指向性係数は、低周波では2、または2に近く、周波数範囲によって変化するが、高周波ではより高い値に向かう。指向性係数が8の場合、各トランスデューサは球状の部分を持ち、前述のキューブキャビネット上の6つのトランスデューサと組み合わせて、オーディオデバイス10用の完全な球体に結合される。単一のラウドスピーカトランスデューサに対する有向エネルギは、定義されたリスニングウィンドウを決定するため、ラウドスピーカを原点に配置した一定半径の選択された角度位置の範囲として、ラウドスピーカに対するユーザの位置が変化すると、ユーザのリスニング体験は減少する。指向性係数がはるかに低いこの開示は、2次元音場における従来の技術よりも、無限またははるかに多くの所望のリスニング位置を持つ。
すべての周波数にわたって所望のサウンドスフィアまたは滑らかに変化するスフィアコンポーネント(またはパターン)を実現するために、上記のスフィアコンポーネントは等化を受けることができるので、各スフィアコンポーネントは全体を通して所望の周波数応答を持つ対応する音場を提供する。別の言い方をすれば、球の成分全体に所望の周波数応答を与えるようにフィルタを設計することができる。そして、等化されたスフィアコンポーネントを組み合わせることで、可聴周波数の範囲内で可聴周波数および/または選択された周波数帯域にわたってスフィアコンポーネントが滑らかに遷移する音の球をレンダリングすることができる。
VI.オーディオプロセッサ
オーディオデバイス10でオーディオコンテンツ(例:音楽作品、映画のサウンドトラック)を再生するためのオーディオレンダリングプロセッサのブロック図を図9に示す。
オーディオレンダリングプロセッサ50は、特定用途向け集積回路(ASIC)、汎用マイクロプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、デジタルシグナルコントローラ、または一連のハードウェア論理構造(例:フィルタ、算術論理ユニット、専用ステートマシン)などの特殊目的プロセッサであってもよい。場合によっては、オーディオレンダリングプロセッサは、マシン実行可能命令の組み合わせを使用して実装でき、プロセッサによって実行されると、オーディオデバイスが記述されているように1つ以上の入力チャネルを処理するようになる。レンダリングプロセッサ50は、入力オーディオソース51からサウンドプログラムのコンテンツの入力チャネルを受け取る。
入力オーディオソース51は、デジタル入力またはアナログ入力を提供することができる。入力オーディオソースまたは入力51は、メディアプレーヤアプリケーションプログラムを実行しているプログラム化されたプロセッサを含むことができ、レンダリングプロセッサへのデジタルオーディオ入力を生成するデコーダを含むことができる。これを行うために、デコーダは、エンコードされたオーディオ信号をデコードすることができ、それは、Advanced Audio Codec(AAC)、MPEG Audio Layer II、MPEG Audio LAYER III、およびFree Lossless Audio Codec(FLAC)などの適切なオーディオコーデックを使用してエンコードされている場合がある。あるいは、入力オーディオソースには、アナログまたは光学式のオーディオ信号を、たとえばライン入力からオーディオレンダリングプロセッサ50用のデジタル形式に変換するコーデックを含めることもできる。あるいは、音楽作品のステレオ録音の左右チャネルの2チャネル入力のように複数の入力オーディオチャネルがある場合もあれば、映画や映画の5.1サラウンド形式のオーディオサウンドトラック全体のように複数の入力オーディオチャネルがある場合もある。その他のオーディオフォーマットの例としては、7.1および9.1サラウンドフォーマットがある。
ラウドスピーカトランスデューサ58のアレイは、オーディオレンダリングプロセッサ50によってオーディオコンテンツに適用されるスフィアコンポーネントセグメント52a...52Nの組み合わせに基づいて、目的の音の球(またはその近似)をレンダリングすることができる。図9に従ったレンダリングプロセッサ50は、概念的にはスフィアコンポーネントドメインとラウドスピーカトランスデューサドメインに分けることができる。コンポーネント領域では、各構成するスフィアコンポーネント52a...52Nごとのセグメント処理53a...53Nを、上記のように希望するスフィアコンポーネントに対応させてオーディオコンテンツに適用することができる。イコライザ54a....54Nは、それぞれのスフィアコンポーネント52a...52Nにイコライゼーションを提供して、前述の、特定のオーディオデバイス10から生じる指向性係数の変動のために、及び、所望の非対称の楕円体球の輪郭に向けた任意の球調整から、調整するために、
ラウドスピーカトランスデューサ領域では、アレイ58内のそれぞれのラウドスピーカトランスデューサによって再生される信号を提供するために、球領域行列を様々な球領域信号に適用することができる。一般的には、行列はM×Nサイズの行列であり、Nはラウドスピーカトランスデューサの数、M=(2×N)+(2×O)であり、ここでOは仮想スフィアコンポーネントの数を表す。イコライザ56a...56Nは、それぞれのスフィアコンポーネント57a...57Nにイコライゼーションを提供して、前述の、特定のオーディオデバイス10から生じる指向性係数の変動のために、及び、所望の楕円体球の輪郭に向けた任意の球調整から、調整できる。
オーディオレンダリングプロセッサ50は、トランスデューサアレイ58で再生するための入力オーディオ信号を所望の方法でレンダリングするために、他の信号処理操作を実行することができることを理解すべきである。別の実施形態では、ラウドスピーカトランスデューサ信号を修正する方法を決定するために、オーディオレンダリングプロセッサは、一定または変化する境界周波数を決定するために適応フィルタプロセスを使用することができる。図10は、合成音(例えば、デジタルキーボード、デジタルオーディオワークステーション(DAW))をレンダリングするためのオーディオデバイス10、または電気および/または音響楽器のオーディオレンダリングプロセッサのブロック図である。
VII.コンピューティング環境
図10は、適切なコンピューティング環境100の一般化された例を示しており、コントローラ50の動作を含むことができ、ここでは、例えば、サウンドスフィアを手続き的に生成することに関連する方法、実施形態、技法、および技術が記述されている。コンピューティング環境100は、各技術が多様な汎用または特殊目的のコンピューティング環境で実装される可能性があるため、ここに開示されている技術の使用範囲または機能性に関する制限を示唆することを意図していない。例えば、開示された各技術は、ウェアラブルおよびハンドヘルドデバイス、モバイル通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラム可能な家電製品、組み込みプラットフォーム、ネットワークコンピュータ、ミニコンピュータ、メインフレームコンピュータ、スマートフォン、タブレットコンピュータ、データセンターなどを含む、他のコンピュータシステム構成で実装することができる。開示された各技術は、通信接続またはネットワークを介してリンクされた、またはデジタルまたはアナログ楽器に組み込まれたリモート処理デバイスによってタスクが実行される分散コンピューティング環境でも実施される場合がある。分散コンピューティング環境では、プログラムモジュールをローカルとリモートの両方のメモリストレージデバイスに配置できる。
コンピューティング環境100は、少なくとも一つの中央処理装置110とメモリ120を含む。図10では、この最も基本的な構成130が破線内に含まれている。中央処理装置110は、コンピュータで実行可能な命令を実行し、実プロセッサでも仮想プロセッサでもよい。マルチプロセッシングシステムでは、複数のプロセッシングユニットがコンピュータで実行可能な命令を実行して処理能力を高めることで、複数のプロセッサを同時に動作させることができる。メモリ120は、揮発性メモリ(例えば、レジスタ、キャッシュ、RAMなど)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリなど)、またはこれらの組み合わせである。メモリ120は、プロセッサによって実行されたときに、例えば、ここで説明する革新的な技術の一つ以上を実装することができるソフトウェア180aを格納する。
コンピューティング環境には、追加の機能がある場合がある。例えば、コンピューティング環境100は、ストレージ140、一つ以上の入力デバイス150、一つ以上の出力デバイス160、及び一つ以上の通信接続170を含む。バス、コントローラ、ネットワークなどの相互接続メカニズム(図示せず)は、コンピューティング環境100のコンポーネントを相互接続する。通常、オペレーティングシステムソフトウェア(図示せず)は、コンピューティング環境100で実行される他のソフトウェアの動作環境を提供し、コンピューティング環境100のコンポーネントの活動を調整する。
ストレージ140は、取り外し可能であっても、取り外し不可能であってもよく、磁気ディスク、磁気テープまたはカセット、不揮発性固体メモリ、CD-ROM、CD-RW、DVD、磁気テープ、光学データストレージデバイス、および搬送波を含む機械可読媒体の選択された形態、または情報を保存するために使用することができ、コンピューティング環境100内でアクセスすることができるその他の機械可読媒体を含めることができる。ストレージ140は、ここで説明する技術を実装できるソフトウェア180bの命令を格納する。
ストレージ140は、ソフトウェア命令が分散して格納され実行されるように、ネットワーク上に分散することもできる。他の実施例では、これらの操作のいくつかは、ハードワイヤードロジックを含む特定のハードウェアコンポーネントによって実行される場合がある。これらの操作は、プログラムされたデータ処理コンポーネントと固定されたハードワイヤード回路コンポーネントの任意の組み合わせによって実行することもできる。
入力デバイス150は、キーボード、キーパッド、マウス、ペン、タッチスクリーン、タッチパッド、トラックボールなどのタッチ入力デバイス、音声入力デバイス、スキャンデバイス、またはコンピューティング環境100に入力を提供する別のデバイスであってもよい。オーディオの場合、入力デバイス150は、マイクまたは他のトランスデューサ(例:アナログまたはデジタル形式で音声入力を受け付けるサウンドカードまたは類似のデバイス)、またはコンピューティング環境100にオーディオサンプルを提供するコンピュータ可読媒体リーダを含むことができる。
出力デバイス160は、ディスプレイ、プリンタ、スピーカトランスデューサ、DVDライター、またはコンピューティング環境100からの出力を提供する別のデバイスであってもよい。
通信接続170は、通信媒体(例:接続ネットワーク)を介した別のコンピューティングエンティティへの通信を可能にする。通信媒体は、コンピュータで実行可能な命令、圧縮されたグラフィックス情報、(処理されたオーディオ信号を含む)処理された信号情報、またはその他のデータなどの情報を変調信号で伝達する。
したがって、開示されたコンピューティング環境は、ここに開示されているように、開示された方向推定およびオーディオレンダリングプロセスを実行するのに適している。
機械可読媒体は、コンピューティング環境100内でアクセス可能な任意の利用可能な媒体である。コンピューティング環境100では、制限ではなく例として、機械可読媒体にはメモリ120、ストレージ140、通信媒体(図示せず)、および上記のいずれかの組み合わせが含まれる。有形の機械可読(またはコンピュータ可読)媒体は、一時的な信号を除外する。
上で説明したように、いくつかの開示した原則は、命令を格納する(マイクロエレクトロニックメモリなどの)有形の非一時的機械可読媒体に具体化することができ、それは、推定、適応、計算、計算、測定、(オーディオプロセッサ50による)調整、センシング、測定、フィルタリング、加算、減算、反転、比較、意思決定を含む、上述のデジタル信号処理操作を実行するために、一つ以上のデータ処理コンポーネント(ここでは一般的に「プロセッサ」と呼ぶ)をプログラムする。他の実施例では、(機械プロセスの)これらの操作のいくつかは、配線されたロジック(例えば、専用のデジタルフィルターブロック)を含む特定の電子ハードウェアコンポーネントによって実行される場合がある。これらの操作は、プログラムされたデータ処理コンポーネントと固定されたハードワイヤード回路コンポーネントの任意の組み合わせによって実行することもできる。
オーディオデバイス10は、音を生成するように構成されたラウドスピーカキャビネット12を含むことができる。オーディオデバイス10は、プロセッサと、プロセッサによって実行されると、ここに記載されているように、3次元球体構築プロセスとそれをサポートするプロセスを自動的に実行する命令が格納された非遷移的な機械可読媒体(メモリ)を含むこともできる。
上記の例は、一般に、オーディオをレンダリングするための装置、方法、および関連システムに関するものであり、より具体的には、目的の3次元球パターンを提供するためのものである。それにもかかわらず、詳細に上述したもの以外の実施形態は、ここに記載されたそれぞれの装置の構成における付随する変更とともに、ここに開示された原理に基づいて企図される。
方向およびその他の相対的な参照(例えば、上、下、上、下、左、右、後、前など。)は、ここでの図面および原則の議論を容易にするために使用することができるが、制限することを意図したものではない。例えば、「上」、「下」、「上」、「下」、「水平」、「垂直」、「左」、「右」などの特定の用語が使用されることがある。このような用語は、特に例示された実施形態に関して、相対的な関係を扱う場合に説明をある程度明確にするために、該当する場合に使用される。ただし、このような用語は、絶対的な関係、位置、および/または方向を意味するものではない。例えば、物体に関しては、物体をひっくり返すだけで「上」の面が「下」の面になる。それにもかかわらず、それは同じ表面であり、物体は同じままである。ここでいう「and/or」とは、「and」や「or」のほか、「and」や「or」も意味する。さらに、ここに引用されているすべての特許文献および非特許文献は、すべての目的のために参照によりその全体がここに組み込まれる。
任意の特定の例に関連して上記で説明した原則は、ここで説明する別の例に関連して説明した原則と組み合わせることができる。したがって、この詳細な説明は限定的な意味で解釈されるものではなく、この開示のレビューの後、当業者は、ここに記載されている様々な概念を使用して考案できる多種多様な信号処理およびオーディオレンダリング技術を評価するであろう。
さらに、当業者は、ここに開示された例示的な実施形態が、開示された原則から逸脱することなく、様々な構成および/または使用に適応できることを理解するであろう。ここで開示された原理を適用すると、所望の3次元球面音場を提供することに適応した多種多様なシステムを提供することができる。例えば、上記の説明または図面において特定の計算エンジンの一部を構成するものとして特定されたモジュールは、ここに記載されているものとは異なる分割、1つ以上のモジュール間での分散、または完全に省略することができる。同様に、そのようなモジュールは、いくつかの開示された原則から逸脱することなく、異なる計算エンジンの一部として実装することができる。
開示された実施形態の前の説明は、当業者が開示された技術革新を行ったり使用したりできるようにするために提供される。これらの実施形態に対する様々な修正は、当業者には容易に明らかであり、ここで定義された一般的な原則は、本開示の精神または範囲から逸脱することなく、他の実施形態に適用することができる。したがって、請求項に記載されている発明は、本明細書に示されている実施形態に限定することを意図しているのではなく、請求項の文言と一致する全範囲を与えられるべきであり、例えば、冠詞「a」または「an」を使用して単数形の要素を参照することは、特に明記されていない限り、「1つのみ」を意味するのではなく、「1つ以上」を意味することを意図している。開示全体を通じて説明されている様々な実施形態の特徴および方法行為に相当する構造的および機能的な全ての行為であって、当該技術分野における通常の技術者に知られている、または後に知られるようになるものは、ここに記載され主張されている特徴によって包含されることを意図している。さらに、ここで開示されるものは、そのような開示がクレームに明示的に記載されているかどうかにかかわらず、公衆に提供されることを意図したものではない。クレームの記載は、「means for」又は「step for」という語句を用いて明示的に記載されない限り、解釈されない。
したがって、開示された原理を適用することができる多くの可能な実施形態を考慮して、我々は、例えば、技術の範囲内にあるすべてのものを含め、当業者が理解しているように、ここに記載されている特徴及び技術のあらゆる組み合わせを請求する権利を留保する。

Claims (14)

  1. オーディオ信号に基づいて音声を出力する方法であって、
    オーディオ信号を受信するステップと、
    オーディオ信号から複数のオーディオサブ信号を生成するステップであって、各オーディオサブ信号は100-8000Hzの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれない、生成するステップと、
    各々が少なくとも100-8000Hzの間隔でサウンドを出力することができる複数のサウンド出力ラウドスピーカトランスデューサを備えたスピーカを提供するステップであって、そのラウドスピーカトランスデューサは部屋または会場内に配置される、提供するステップと、
    各ラウドスピーカトランスデューサの電気サブ信号を生成するステップであって、各電気サブ信号は、各オーディオサブ信号の所定の部分を構成する、生成するステップと、
    電気サブ信号をスピーカのトランスデューサに供給するステップと
    を含み、
    前記電気サブ信号を生成するステップは、各電気サブ信号のオーディオサブ信号の所定の部分を、経時的に、変更するステップを含む、
    方法。
  2. オーディオ信号を受信するステップは、ステレオ信号を受信することを含み、
    オーディオサブ信号を生成するステップは、ステレオオーディオ信号の各チャネルに対して、複数のオーディオサブ信号を生成することを含む、
    請求項1に記載の方法。
  3. オーディオ信号を受信するステップは、モノラル信号を受信して、そのモノラル信号に少なくとも実質的に位相反転した第2の信号をオーディオ信号から生成することを含み、
    オーディオサブ信号を生成するステップは、モノラルオーディオ信号と第2の信号の各々に対して複数のオーディオサブ信号を生成することを含む、
    請求項1に記載の方法。
  4. オーディオ信号から低周波部分を導出するステップを、更に含み、
    低周波部分は、第1の閾値周波数以下の周波数を有し、
    全ての電気サブ信号には少なくとも実質的に均等に低周波部分を含む
    請求項1~3のいずれか一に記載の方法。
  5. オーディオ信号から高周波部分を導出するステップを、更に含み、
    低周波部分は、第2の閾値周波数を超える周波数を有し、
    全ての電気サブ信号には少なくとも実質的に均等に高周波部分を含む、
    請求項1~4のいずれか一に記載の方法。
  6. オーディオサブ信号を生成するステップが、各オーディオサブ信号のエネルギ/ラウドネスの合計が所定のエネルギ/ラウドネスの値の10%以内になるように、1つ以上のオーディオサブ信号の周波数間隔を選択することを含む、
    請求項1~5のいずれか一に記載の方法。
  7. 電気サブ信号を生成するステップが、1つ以上の電気サブ信号について、電気サブバンドで表されるオーディオサブバンドの一部が1秒あたり少なくとも5%増加または減少するように、電気サブ信号を生成することを含む、
    請求項1~6のいずれか一に記載の方法。
  8. オーディオ信号に基づいて音声を出力するシステムにおいて、
    オーディオ信号を受信する入力と、
    各々が少なくとも100-8000Hzの間隔で音を出力することができる複数のサウンド出力ラウドスピーカトランスデューサを含むスピーカであって、該ラウドスピーカトランスデューサは部屋または会場内に配置されている、スピーカと、
    オーディオ信号から複数のオーディオサブ信号を生成するように、且つ、各ラウドスピーカトランスデューサ用に電気サブ信号を生成するように、構成されたコントローラであって、各オーディオサブ信号は100-8000Hzの周波数間隔内のオーディオ信号を表し、あるオーディオサブ信号の周波数間隔は別のオーディオサブ信号の周波数間隔に完全には含まれておらず、各電気サブ信号は各オーディオサブ信号の所定の部分を含む、コントローラと、
    電気サブ信号をラウドスピーカトランスデューサに供給する手段と
    を含み、
    前記コントローラは、各電気サブ信号の、オーディオサブ信号の所定の部分が経時的に変化するように、電気サブ信号の各々を生成するように構成されている、
    システム。
  9. 前記入力がステレオ信号を受信するように構成され、前記コントローラがステレオオーディオ信号の各チャネルに対して複数のオーディオサブ信号を生成するように構成されている、
    請求項8に記載のシステム。
  10. 前記入力がモノラル信号を受信するように構成され、前記コントローラがオーディオ信号から、そのモノラル信号に少なくとも実質的に位相反転した第2の信号を生成して、モノラルオーディオ信号と第2の信号の各々に対して複数のオーディオサブ信号を生成するように構成されている、
    請求項8に記載のシステム。
  11. 前記コントローラが、更に、
    オーディオ信号から、第1の閾値周波数以下の周波数を有する低周波数部分を導出し、全ての電気サブ信号に少なくとも実質的に均等に低周波数部分を含む
    ように構成されている、請求項8~10のいずれか一に記載のシステム。
  12. 前記コントローラが、更に、
    オーディオ信号から、第2の閾値周波数を超える周波数を有する高周波部分を導出し、全ての電気サブ信号に少なくとも実質的に均等に高周波部分を含む
    ように構成されている、請求項8~11のいずれか一に記載のシステム。
  13. 各オーディオサブ信号におけるエネルギ/ラウドネスの合計値が所定のエネルギ/ラウドネスの値の10%以内になるように、前記コントローラが、更に、1つ以上のオーディオサブ信号の周波数間隔を選択するように構成されている、
    請求項8~12のいずれか一に記載のシステム。
  14. 電気サブバンドで表されるオーディオサブバンドの一部が1秒間に少なくとも5%増加または減少するように、前記コントローラが、更に、1つ以上の電気サブ信号について、電気サブ信号を生成するように構成されている、
    請求項8~13のいずれか一に記載のシステム。
JP2023522355A 2020-10-07 2021-09-24 音を出力する方法及びスピーカ Pending JP2023551090A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP20200429 2020-10-07
EP20200429.7 2020-10-07
DKPA202170162 2021-04-07
DKPA202170162 2021-04-07
PCT/EP2021/076395 WO2022073775A1 (en) 2020-10-07 2021-09-24 A method of outputting sound and a loudspeaker

Publications (1)

Publication Number Publication Date
JP2023551090A true JP2023551090A (ja) 2023-12-07

Family

ID=81126443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023522355A Pending JP2023551090A (ja) 2020-10-07 2021-09-24 音を出力する方法及びスピーカ

Country Status (4)

Country Link
US (1) US20230370777A1 (ja)
EP (1) EP4226651A1 (ja)
JP (1) JP2023551090A (ja)
WO (1) WO2022073775A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
JP4637725B2 (ja) * 2005-11-11 2011-02-23 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
JP4940671B2 (ja) * 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
TWI449442B (zh) * 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統

Also Published As

Publication number Publication date
WO2022073775A1 (en) 2022-04-14
US20230370777A1 (en) 2023-11-16
EP4226651A1 (en) 2023-08-16

Similar Documents

Publication Publication Date Title
Zotter et al. Ambisonics: A practical 3D audio theory for recording, studio production, sound reinforcement, and virtual reality
US9197977B2 (en) Audio spatialization and environment simulation
KR101341523B1 (ko) 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법
US10405125B2 (en) Spatial audio rendering for beamforming loudspeaker array
JP5455657B2 (ja) 音声の再現を高めるための方法および装置
TWI517028B (zh) 音訊空間定位和環境模擬
TWI686794B (zh) 以保真立體音響格式所編碼聲訊訊號為l個揚聲器在已知位置之解碼方法和裝置以及電腦可讀式儲存媒體
CN109891503B (zh) 声学场景回放方法和装置
Zotter et al. A beamformer to play with wall reflections: The icosahedral loudspeaker
Wiggins An investigation into the real-time manipulation and control of three-dimensional sound fields
Laitinen et al. Parametric time-frequency representation of spatial sound in virtual worlds
JP6246922B2 (ja) 音響信号処理方法
KR101186398B1 (ko) 오디오 신호를 처리하는 장치
US11611840B2 (en) Three-dimensional audio systems
Malham Approaches to spatialisation
Pulkki et al. Spatial effects
Blauert et al. Providing surround sound with loudspeakers: a synopsis of current methods
JP2022502872A (ja) 低音マネジメントのための方法及び装置
Pulkki et al. Multichannel audio rendering using amplitude panning [dsp applications]
WO2018193162A2 (en) Audio signal generation for spatial audio mixing
US9877137B2 (en) Systems and methods for playing a venue-specific object-based audio
JP2023551090A (ja) 音を出力する方法及びスピーカ
Donley et al. Reproducing personal sound zones using a hybrid synthesis of dynamic and parametric loudspeakers
De Sena Analysis, design and implementation of multichannel audio systems
CN116569566A (zh) 一种输出声音的方法及扩音器

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20230605