JP6092387B2 - 3dオーディオ階層符号化を用いたラウドスピーカーの位置補償 - Google Patents

3dオーディオ階層符号化を用いたラウドスピーカーの位置補償 Download PDF

Info

Publication number
JP6092387B2
JP6092387B2 JP2015523177A JP2015523177A JP6092387B2 JP 6092387 B2 JP6092387 B2 JP 6092387B2 JP 2015523177 A JP2015523177 A JP 2015523177A JP 2015523177 A JP2015523177 A JP 2015523177A JP 6092387 B2 JP6092387 B2 JP 6092387B2
Authority
JP
Japan
Prior art keywords
geometry
speakers
audio
loudspeaker
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015523177A
Other languages
English (en)
Other versions
JP2015527821A5 (ja
JP2015527821A (ja
Inventor
セン、ディパンジャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2015527821A publication Critical patent/JP2015527821A/ja
Publication of JP2015527821A5 publication Critical patent/JP2015527821A5/ja
Application granted granted Critical
Publication of JP6092387B2 publication Critical patent/JP6092387B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

優先権の主張
[0001]本願は、平成24年7月16日に出願された米国仮特許出願61/672,280および平成25年1月18日に出願された米国仮特許出願61/754,416の利益を主張する。
[0002]本開示は、空間オーディオ符号化に関する。
[0003]NHK(日本放送協会またはジャパンブロードキャスティング)によって開発された、例えば、5.1ホームシアターシステムから22.2システムまでの様々な「サラウンドオーディオ」形式が存在する。しばしば、これらのいわゆるサラウンドオーディオ形式は、スピーカーがオーディオ再生システムにおいて音場を最適に再現し得るように位置すべき場所を特定する。さらに、1つまたは複数のサラウンドオーディオ形式を支援するオーディオ再生システムを有するそれらは、オーディオ再生システムが配置される部屋は、スピーカーが設置され得る場所に制限がある場合が多いため、指定されたフォーマットの場所にスピーカーを正確に設置できないことがよくある。特定のフォーマットは、スピーカーが位置し得る場所の観点から他のフォーマットよりもより柔軟性があるが、より柔軟性のあるフォーマットへのアップグレードや移行に関連するコストが高いため、これらのより柔軟性のあるフォーマットへのアップグレードや移行を躊躇した結果、いくつかのフォーマットがより広く採用され続けている。
[0004]本開示は、より柔軟性のあるサラウンド音声形式への移行を容易にする一方でこの後方互換性の欠如に対応するために用いられる方法、システム、および装置を記載する(さらに、これらのフォーマットはどこにスピーカーが配置されるかの観点から「より柔軟」である)。本開示に記載された技術は、音場の2次元または3次元表示を提供し得る球面調和係数(spherical harmonic coefficients)(SHC)への変換に適応し得る後方互換性オーディオ信号を送信および受信の両方を行う種々の方法を提供し得る。5.1サラウンド音声形式に準ずる後方互換性オーディオ信号のSHCへの変換を可能にすることによって、この技術は、ほとんど任意のスピーカーの幾何学的配置に写像され得る音場の3次元表示を回復させ得る。
[0005]1つの観点において、オーディオ信号処理の方法は、音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて、変換することと、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の第1の階層セットを、第2の変換を用いて、周波数領域において変換すること、を備える。
[0006]1つの観点において、装置は、音場を記述する要素の第1の階層セットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上で球面波モデルに基づく第1の変換を実行しおよびスピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットを生成するために、要素の第1の階層セット上の周波数領域において第2の変換を実行するように構成される1つまたは複数のプロセッサを備える。
[0007]1つの観点において、装置は、音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて変換するための手段と、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の第1の階層セットを、第2の変換を用いて、周波数領域において変換するための手段を備える。
[0008]1つの観点において、非一時的コンピュータ可読記憶媒体は、実行されたとき、音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて、変換することと、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の第1の階層セットを、第2の変換を用いて周波数領域において変換することを1つまたは複数のプロセッサにさせる命令を記憶している。
[0009]1つの観点において、方法は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信することを備え、そこにおいて、ラウドスピーカーチャネルは要素の階層セットに変換されている。
[0010]1つの観点において、装置は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信するように構成された1つまたは複数のプロセッサを備え、そこにおいて、ラウドスピーカーチャネルは要素の階層セットに変換されている。
[0011]1つの観点において、装置は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信するための手段を備え、そこにおいて、ラウドスピーカーチャネルは要素の階層セットに変換されている。
[0012]1つの観点において、命令を備える非一時的コンピュータ可読記憶媒体は、命令が実行される場合、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信することを1つまたは複数のプロセッサにさせ、そこにおいて、ラウドスピーカーチャネルは要素の階層セットに変換されている。
[0013]1つの観点において、方法は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信することを備え、そこにおいて、第1の幾何学的配置はチャネルの場所に対応する。
[0014]1つの観点において、装置は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信するように構成された1つまたは複数のプロセッサを備え、そこにおいて、幾何学的配置はチャネルの場所に対応する。
[0015]1つの観点において、装置は、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信するための手段を備え、そこにおいて、幾何学的配置はチャネルの場所に対応する。
[0016]1つの観点において、命令が格納された非一時的コンピュータ可読記憶媒体は、命令が実行されると、スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信することを1つまたは複数のプロセッサにさせ、そこにおいて幾何学的配置はチャネルの場所に対応する。
[0017]この技術の1つまたは複数の観点の詳細は添付の図面および下記の詳細名説明において説明される。これらの技術の他の特徴、オブジェクト、および利点は詳細な説明および図面、および請求項から明白になるだろう。
[0018]図1は、コーデックを用いた標準用の一般的な構造を示す図である。 [0019]図2は、モノラル/ステレオに関する後方互換性の例を示す図である。 [0020]図3は、後方互換性を検討しない場面ベースの符号化の例を示す図である。 [0021]図4は、後方互換設計を用いるエンコーディング過程の例を示す図である。 [0022]図5は、場面ベースのデータをデコードできない従来のデコーダ上でのデコードの過程の例を示す図である。 [0023]図6は、場面ベースのデータを扱うことができるデバイスを用いるデコードの過程の例を示す図である。 [0024]図7Aは、本開示に記載された技術の様々な観点にしたがってオーディオ信号処理の方法を示すフローチャートである。 [0025]図7Bは、本開示に記載された技術の様々な観点を実行する装置を示すブロック図である。 [0026]図7Cは、別の一般的な構成に従ったオーディオ信号処理のための装置を示すブロック図である。 [0027]図8Aは、本開示に記載された技術の様々な観点に従ったオーディオ信号処理の方法を示すフローチャートである。 [0028]図8Bは、本開示に記載された技術の様々な観点にしたがった方法の実施を示すフローチャートである。 [0029]図9Aは、SHCからマルチチャネル信号への変換を示す図である。 [0030]図9Bは、マルチチャネル信号からSHCへの変換を示す図である。 [0031]図9Cは、配置Aと互換性のあるマルチチャネル信号からSHCへの第1の変換とSHCから配置Bと互換性のあるマルチチャネル信号への第2の変換を示す図である。 [0032]図10Aは、一般的な構成に従ったオーディオ信号処理M400の方法を示すフローチャートである。 [0033]図10Bは一般的な構成に従ったオーディオ信号処理MF400のための装置を示すブロック図である。 [0034]図10Cは、別の一般的な構成に従ったオーディオ信号処理A400のための装置を示すブロック図である。 [0035]図10Dは、本開示に記載された技術の様々な観点を実行するシステムの例を示す図である。 [0036]図11Aは、本開示に記載された技術の様々な観点を実行する別のシステムの例を示す図である。 [0037]図11Bは、デコーダによって実行され得る一連の動作を示す図である。 [0038]図12Aは、一般的な構成に従ったオーディオ信号処理の方法を示すフローチャートである。 [0039]図12Bは、一般的な構成に従った装置を示すブロック図である。 [0040]図12Cは、一般的な構成に従ったオーディオ信号処理の方法を示すフローチャートである。 [0041]図12Dは、一般的な構成に従ったオーディオ信号処理の方法を示すフローチャートである。 [0042]図13Aは、本開示に記載された技術の様々な観点を実行し得るオーディオ再生システムの例を示すブロック図である。 図13Bは、本開示に記載された技術の様々な観点を実行し得るオーディオ再生システムの例を示すブロック図である。 図13Cは、本開示に記載された技術の様々な観点を実行し得るオーディオ再生システムの例を示すブロック図である。 [0043]図14は、本開示に記載された技術の様々な観点を実行し得る自動車用オーディオシステムを示す図である。
詳細な説明
[0044]その文脈によって明示的に限定されない限り、用語「信号」は、その通常の意味のいずれかを示すためにここで用いられ、有線、バス、または他の送信媒体上に表される記憶場所(または記憶場所のセット)の状態を含む。その文脈によって明示的に限定されない限り、用語「生成する」は、コンピュータで計算するないし別の方法で生成するようなその通常の意味のうちのいずれかを示すためにここで用いられる。文脈によって明示的に限定されない限り、用語「計算する」は、コンピュータで計算する、評価する、見積もる、推定する、および/または複数の値から選択するといった通常の意味のうちのいずれかを示すためにここで用いられる。その文脈によって明示的に限定されない限り、用語「取得する」は、計算する、抽出する、受信する(例えば、外部デバイスから)、および/または検索する(例えば、記憶素子のアレイから)といった通常の意味のいずれかを示すために用いられる。その文脈によって明示的に限定されない限り、用語「選択する」は、識別する、示す、適用するおよび/または2つ以上のセットの少なくとも1つおよび全部未満を用いるといった、通常の意味のいずれかを示すために用いられる。
用語「備える」が、本願明細書および請求項において用いられる場合、他の要素または動作を除外しない。用語「に基づいて」(「AはBに基づく」のような)は、(i)「から抽出する」(例えば、「BはAに先行するものである」)、(ii)「少なくとも〜に基づいて」(例えば、「Aは少なくともBに基づく」)および特定の文脈において適切な場合、(iii)「と同じ」(例えば、「AはBと同じ」)の場合を含む、その通常の意味のいずれかを示すために用いられる。同様に、用語「に応じて」は、「少なくとも〜に応じて」を含むその通常の意味のいずれかを示すために用いられる。
[0045]マルチマイクロフォンオーディオ検出デバイスのマイクロフォンの「場所」への言及は、文脈によって別段指示が無い限り、マイクロフォンの音響的に感度の高い表面の中央の場所を示す。用語「チャネル」は、特定の文脈にしたがって、場合によっては信号パスを示すために、およびまた別の場合にはこういったパスによって搬送される信号を示すために用いられる。別段指示が無い限り、用語「連続」は、2つ以上のアイテムの配列を示すために用いられる。用語「周波数コンポーネント」は、信号(例えば、高速フーリエ変換によって生成される)の周波数領域表現のサンプルまたは信号のサブバンド(例えば、バーク尺度またはメル尺度サブバンド)のように、信号の周波数バンドまたは周波数のセットのうちの1つを示すために用いられる。
[0046]別段指示が無い限り、特定の機能を有する装置の動作の任意の開示は、類似した機能を有する方法を開示することを明示的に意図しており(およびその逆も同様)、および特定の構成に従った装置の動作の任意の開示は、類似した構成に従った方法を開示することを明示的に意図している(およびその逆も同様)。用語「構成」は、その特定の文脈によって示されるような方法、装置および/またはシステムを参照して用いられ得る。
用語「方法」、「プロセス」、「手順」、「技術」は、特定の文脈によって別段指示が無い限り包括的および交換可能に用いられる。用語「装置」および「デバイス」はまた、特定の文脈によって別段指示が無い限り、包括的および交換可能に用いられる。用語「要素」および「モジュール」は、より大きい構成の一部を示すために典型的に用いられる。その文脈によって明示的に限定されない限り、用語「システム」は、「共通の目的にかなうよう相互に作用する要素のグループ」を含むその通常の意味のいずれかを示すためにここで用いられる。
[0047]サラウンドオーディオの発展が昨今娯楽向けの多くの出力フォーマットを入手可能にした。こういったサラウンドオーディオのフォーマット例は、よく知られている5.1フォーマット(下記の6つのチャネル:フロントレフト(FL)、フロントライト(FR)、センターまたはフロントセンター、バックレフトまたはサラウンドレフト、バックライトまたはサラウンドライト、および低音効果(LFE)を含む)、需要が増えつつある7.1フォーマット、および先進的な22.2フォーマット(例えば、超高速解像度テレビの標準と共に用いるための)を含む。さらなる具体例は、球面調和関数の配列に関するフォーマットを含む。サラウンドオーディオのフォーマットは2次元および/または3次元でオーディオを符号化するのが望ましいかもしれない。
[0048]オーディオの材料は一度作られると(例えば、コンテンツクリエータによって)、続いて異なる出力とスピーカーの設定にデコードされおよびレンダリングされることが可能なフォーマットにエンコードされる「一度作成したら何度でも使う」という哲学に従うことが望ましい。
[0049]将来のMPEGエンコーダへの入力は、3つの可能なフォーマット(i)予め特定された位置でラウドスピーカーを介して演奏されることを意味する従来型のチャネルベースのオーディオ、(ii)それらの位置座標(他の情報の間の)を含むメタデータに関連する単一のオーディオのオブジェクトに関するディスクリートパルス符号変調(PCM)データを含むオブジェクトベースのオーディオ、(iii)球面調和基本関数(spherical harmonic basis functions)(いわゆる「球面調和係数」またはSHCと呼ばれる)の係数を用いて音場を再現することを含む場面ベースのオーディオなどのうちの任意の1つである。
[0050]第3の場面ベースのフォーマットを使用する多くの利点がある。しかし、このフォーマットを使用する1つの可能性のある不利な点は、既存の消費者オーディオシステムへの後方互換性がないことである。例えば、ほとんどの既存のシステムは、5.1チャネル入力に対応する。従来のチャネルベースの行列化されたオーディオは、拡張されたチャネルフォーマットのサブセットとして5.1のサンプルを持つことによってこの問題を回避することができる。ビットストリームにおいて、5.1のサンプルは、既存の(または「レガシー」)システムによって認識される場所にあり、および臨時のチャネルは、全てのチャネルサンプルを含むフレーム・パケットの拡張された部分に配置され得る。あるいは、5.1チャネルデータは、より数の多いチャネル上での行列演算から決定され得る。
[0051]SHCを用いる場合の後方互換性の欠如は、SHCがPCMデータでないという事実に起因する。本開示は、音場を再現するために、球面調和基本関数の係数(coefficients of spherical harmonic basis functions)(また、「球面調和係数」またはSHCと呼ばれる)を使用する場合に、後方互換性の欠如に対応するために用いられ得る。
[0052]市場には様々な「サラウンドオーディオ」形式が存在する。それらは、例えば、5.1ホームシアターシステム(ステレオを超越してリビングルームに進出を果たした点で最も成功している)からNHK(日本放送協会またはジャパンブロードキャスティング)によって開発された22.2システムに及ぶ。コンテンツの作成者(例えば、ハリウッドスタジオ)は、一度映画に関するサウンドトラックを作成すると、それぞれのスピーカーの構成用にそのサウンドトラックをリミックスするための労力を費やすことを望まないだろう。標準化されたビットストリームへのエンコードとレンダラの場所におけるスピーカーの配置と音響の条件に順応可能および依存しないそれに続くデコードを提供することが望ましい。
[0053]図1は、再現のために最終的に用いられる特定の設定にかかわらず、均一なリスニング体験の目的を達成するために、ムービング・ピクチャー・エクスパーツ・グループ(MPEG)コーデックを用いてこういった標準化のための一般構造を示す。図1に示されるように、MPEGエンコーダ10は、オーディオソース12のエンコードされたバージョンを生成するためにオーディオソース12をエンコードし、そこで、オーディオソース12のエンコードされたバージョンは、MPEGデコーダ16へ送信チャネル14を介して送信される。MPEGデコーダ16は、オーディオソース12を少なくとも部分的に回復させるために、オーディオソース12のエンコードされたバージョンをデコードする。オーディオソース12の回復したバージョンは、図1の例において出力18として示される。
[0054]後方互換性は、互換性を保持するためにレガシーモノフォニック再生システムにとって必要不可欠であったため、立体音響形式が導入された時にも課題であった。モノラル・ステレオ後方互換性は行列化を用いて保持されていた。ステレオ「M:中間」および「S:側面」形式は、Mチャネルだけを用いることによってモノラル機能のシステムとの互換性を保持することができる。
[0055]図2は、「L:左」および「R:右」チャネルをデコードするために単純な2×2行列演算を実行し得るステレオ機能のあるシステム19を示す図である。M−S信号は、上記の行列(たまたま同一である)の逆を用いることによってL−R信号からコンピュータで計算され得る。この方法において、レガシーモノラルプレイヤ20が機能を保持する一方で、ステレオプレイヤ22は左右のチャネルを正確にデコードすることができる。類似の方法において、モノラルプレイヤ20とステレオプレイヤ22の機能を保持しおよび3つのチャネルプレイヤの機能を追加する後方互換性を維持する第3のチャネルが追加され得る。
[0056]オブジェクトベースのフォーマットにおける後方互換性の課題に対処するための1つの提案されたアプローチは、オブジェクトと共にダウンミックスされた5.1チャネル信号を送信することである。こういったシナリオにおいて、レガシー5.1システムは、より進化したレンダラが、音場をレンダリングするために、5.1オーディオと個々のオーディオオブジェクトの組合せを用いるか、あるいは個々のオブジェクトのみを用いる間、ダウンミックスされたチャネルベースのオーディオを再生するだろう。
[0057]音場を再現すために、要素の階層セットを用いることが望ましいかもしれない。要素の階層セットとは、要素が、下位の要素の基本セットがモデル化された音場の完全な再現を提供するように順序づけられているセットである。セットは、上位の要素を含むように拡張されるので、再現がより詳細になる。
[0058]要素の階層セットの1つの例は、SHCのセットである。下記の式は、SHCを用いる音場の記述または再現を実際に示す。
Figure 0006092387
[0059]この式は、音場の任意の位置
Figure 0006092387
における圧力piがSHC
Figure 0006092387
によって独自に再現され得ることを示す。
ここで、
Figure 0006092387
、cが、音の速度(〜343m/s)であり、
Figure 0006092387
が参照の位置(または観察位置)であり、
Figure 0006092387
が順序nの球ベッセル関数であり、
Figure 0006092387
が、順序(order)nと従属順序(suborder)mの球面調和基本関数である。角括弧内の用語は、ディスクリートフーリエ変換(DFT)、ディスクリートコサイン変換(DCT)、またはウェイブレット変換のような様々な時間周波数変換によって近似され得る信号(すなわち、
Figure 0006092387
)の周波数領域の表現であると認識され得る。階層セットの他の具体例は、ウェイブレット変換係数のセットと多重解像基底関数の係数の他のセットを含む。
[0060]上記の式は、周波数領域内にあることに加えて、異なる半径方向距離(または「半径」)に関するSHCの導出を可能にする球面波モデルをも表す。すなわち、SHCは、SHCがいわゆる「スイートスポット」すなわち聴衆がリッスンしようとする場所から様々な異なる距離に位置するソースに適合することを意味する異なる半径、rのために抽出され得る。SHCは次に、異なる球面上にあるスピーカーを有する標準ではないスピーカー幾何学的配置のためにスピーカーフィードを定義するために用いられ、それによって、標準ではないスピーカー幾何学的配置から成るスピーカーを使用する音場を潜在的に好適に再現する。この点において、他のスピーカーと同じ球面上に無いそれらのスピーカーの半径情報(radial information)(例えば、スイートスポットからスピーカーまで測定された半径のような)を受信して、波面の広がりを補償するために遅延を生じさせ、SHCは、異なる半径方向距離にある音場をより正確に再現するために上記の式を用いて抽出され得る。
[0061]SHC
Figure 0006092387
は、様々なマイクロフォンアレイ構成によって物理的に取得され得る(例えば、録音される)か、あるいは代替として、それらは、音場のチャネルベースまたはオブジェクトベースの記述から抽出され得る。前述は、提案されたエンコーダに入力された場面ベースのオーディオを表す。例えば、25個の係数を含む4次表現が用いられ得る。
[0062]個々のオーディオオブジェクトに対応する音場に関する係数
Figure 0006092387
は下記のように記述される。
Figure 0006092387
iが
Figure 0006092387
の場合、
Figure 0006092387
は、順位nの球面ハンケル関数(第2種の)であり、および
Figure 0006092387
はオブジェクトの場所である。
エネルギー源
Figure 0006092387
を周波数の関数(例えば、PCMストリーム上で高速フーリエ変換を実行するといった時間周波数解析技術を用いて)であると知ることは、各PCMオブジェクトとその場所をSHC
Figure 0006092387
にコンバートすることを我々に可能にする。さらに、各オブジェクトに関する
Figure 0006092387
係数は付加的であることが示される(上記は線形および直交分解であるため)。この方法において、多数のPCMオブジェクトは、
Figure 0006092387
係数(例えば、個々のオブジェクトに関する係数ベクトルの総数として)によって表され得る。基本的に、これらの係数は、音場についての情報(3D座標関数としての圧力)を含み、上記は、観察位置
Figure 0006092387
の周辺における個々のオブジェクトから全体の音場の表現への変換を表す。当業者は、上記の式がわずかに異なる形式で文法を表示し得ることを認識するだろう。
[0063]本開示は、音場を表す要素の完全な階層セットのサブセット(例えば、基本セット)(例えば、後方互換性が課題ではなかった場合以外に用いられ得るSHCのセット)をオーディオの複数のチャネル(例えば、従来のマルチチャネルオーディオフォーマットを表す)にコンバートするために用いられ得るシステム、方法、および装置の記述を含む。こういったアプローチが、後方互換性を維持するために望ましいいくつかのチャネルに適用され得る。こういったアプローチは、少なくとも従来の5.1サラウンド/ホームシアタ機能との互換性を維持するために実施されるだろうことが予測され得る。5.1フォーマットに関して、マルチチャネルオーディオチャネルは、フロントレフト、センター、フロントライト、レフトサラウンド、ライトサラウンドおよび低周波数効果(LFE)である。SHCの総数は、様々な要素に依存し得る。場面ベースのオーディオに関して、例えば、SHCの総数は録音アレイにおけるマイクロフォントランスデュ―サの数によって制約され得る。チャネルおよびオブジェクトベースのオーディオに関して、SHCの総数は使用可能な帯域幅によって決定され得る。
[0064]エンコードされたチャネルは、所望の対応するチャネルベースのフォーマットに準拠する対応するパケットの部分に詰め込まれ得る。階層セットの残り(例えば、サブセットの一部ではなかったSHC)はコンバートされることはなく、その代わりに後方互換性のあるマルチチャネルオーディオと並行して送信(および/または格納)するためにエンコードされ得る。例えば、これらのエンコードされたビットは、フレーム(例えば、ユーザ定義の部分)に関するパケットの拡張された部分に詰め込まれ得る。
[0065]別の実施例において、エンコードまたはトランスコード演算は、マルチチャネル信号上で行われ得る。例えば、5.1チャネルは、多くの消費者デバイスとセットトップボックス内にあるAC3デコーダと共に後方互換性を保持するためにAC3フォーマット(ATSC A/52またはドルビーデジタルとも呼ばれる)にコード化され得る。このシナリオにおいてさえ、階層セットの残り(例えば、サブセットの一部ではなかったSHC)は、別々にエンコードされ、およびAC3パケット(例えば、auxdata)の1つまたは複数の拡張された部分に送信されることになる(および/または格納されることになる)。用いられ得る対象のフォーマットの他の具体例は、ドルビーTrueHD、DTS−HDマスターオーディオ、およびMPEGサラウンドを含む。
[0066]デコーダにおいて、レガシーシステムは、マルチチャネルオーディオコンテンツのみを用いてそのフレーム・パケットの拡張された部分を無視し、その結果機能を保持するだろう。
[0067]先進的なレンダラは、マルチチャネルオーディオを階層セットの元のサブセット(例えば、SHCの基本セット)にコンバートするために逆変換を実行するように実装され得る。チャネルが再エンコードまたはトランスコードされた場合、中間のデコードのステップが実行され得る。パケットの拡張された部分におけるビットは、階層セットの残り(例えば、SHCの拡張セット)を抽出するためにデコードされるであろう。
この方法において、完全な階層セット(例えば、SHCのセット)は、音場レンダリングの様々なタイプが行われるのを可能にするために回復され得る。
[0068]こういった後方互換性のあるシステムの例は、エンコーダとデコーダの両方の構造に関する説明を用いて、下記のシステムの図において要約される。
[0069]図3は、本開示に記載された技術の観点にしたがって、場面ベースの球面調和関数のアプローチを用いてエンコーディングとデコーディングの過程を実行するシステム30を示すブロック図である。この例において、エンコーダ32は、レンダリングのためにSHC34を受信するように送信され(および/または格納され)およびデコーダ40(「場面ベースのデコーダ40」と示される)においてデコードされるソース球面調和関数係数34(「SHC34」)の記述を生成する。こういったエンコーディングは、量子化(例えば、1つまたは複数のコードブックインデックスへの)、誤り訂正コード化、冗長コード化、等のような1つまたは複数の不可逆的または可逆的なコード化の過程を含み得る。さらにまたは代替として、こういったエンコーディングは、Bフォーマット、Gフォーマット、または高次アンビソニクス(HOA)等のアンビソニックフォーマットへのエンコーディングを含み得る。一般的に、エンコーダ32は、エンコードされたSHC38を生成するために、冗長性および無関係性(不可逆的または可逆的コード化のために)を利用する既知の技術を用いてSHC34をエンコードし得る。エンコーダ32は、多くの場合ビットストリームの形式の送信チャネル36を介してこのエンコードされたSHC38を送信し得る(エンコードされたSHC38をデコードする際に有益であり得る他のデータと共にエンコードされたSHC38を含み得る)。デコーダ40は、SHC34またはそれらのわずかに修正されたバージョンを回復するために、エンコードされたSHC38を受信および復号し得る。デコーダ40は、回復したSHC34を球面調和関数レンダラ42に出力し得、それは、1つまたは複数の出力オーディオ信号44として回復したSHC34をレンダリングし得る。場面ベースのデコーダ40を持たない古い受信器は、こういった信号をデコードでき得ず、そのため、プログラムを再現でき得ない。
[0070]図4は、本開示に記載された技術の様々な観点を実行し得るエンコーダ50を示す図である。ソースSHC34(例えば、図3に示されたのと同じ)は、場面ベースの録音可能なスタジオにおいて、ミキシングエンジニアによってミックスされたソース信号であり得る。SHC34はまた、マイクロフォンアレイ、またはサラウンドスピーカーによるソニックプレゼンテーション(sonic presentation)の録音によって取得され得る。
[0071]エンコーダ50は、SHC34のセットの2つの部分を別々に処理し得る。エンコーダ50は、互換性のあるマルチチャネル信号55を生成するために、SHC34(「基本セット34A」)の基本セットに変換行列52を適用し得る。再エンコーダ/トランスコーダ56は、マルチチャネル信号を記述する後方互換コード化信号59にこれらの信号55(FFT領域、または時間領域等の周波数領域に存在し得る)を次にエンコードする。互換性のあるコーダは、AC3(またATSC A/52またはドルビーデジタルと呼ばれる)、ドルビーTrueHD、DTS−HDマスターオーディオ、MPEGサラウンド等の例を含むこともある。こういった実装にとって、2つ以上の異なるトランスコーダを含むことも可能であり、それぞれが、送信および/または格納するための2つの異なる後方互換性ビットストリームを形成するために、異なる各フォーマット(例えば、AC3トランスコーダおよびドルビーTrueHDトランスコーダ)にマルチチャネル信号をコード化する。代替として、コード化は、例えば、線形PCMストリームのセット(HDMI(登録商標)標準によってサポートされる)のようなマルチチャネルオーディオ信号を出力するだけのために完全に除去され得た。
[0072]SHC34の残りの1つは、SHC34の拡張セット(「拡張セット34B」)を表し得る。エンコーダ50は、基本セット34Bをエンコードするために場面ベースのエンコーダ54を起動し、それがビットストリーム57を形成する。エンコーダ50は次に、後方互換性ビットストリーム59とビットストリーム57を多重化するために、ビット多重化装置58(「ビット mux 58」)を起動し得る。エンコーダ50は次に、送信チャネル(例えば、有線および/または無線チャネル)を介して、この多重化されたビットストリーム61を送信し得る。
[0073]図5は、標準の非場面ベースのみをサポートする標準デコーダ70を示す図であるが、本開示に記載された技術にしたがって形成された後方互換性ビットストリーム59を回復することができる。言い換えれば、デコーダ70において、受信器が古くおよび従来のデコーダをサポートするだけの場合、デコーダは、図5に示されたように、後方互換性ビットストリーム59のみを取り込み、および拡張セットビットストリーム57を破棄する。動作中、デコーダ70は多重化されたビットストリーム61を受信しおよびビット逆多重化装置(「ビットdemux72」)を起動する。ビット逆多重化装置72は、後方互換性ビットストリーム59と拡張されたビットストリーム57を回復するために、多重化されたビットストリーム61を逆多重化する。デコーダ70は次に、後方互換性ビットストリーム59をデコードするために後方互換性デコーダ74を起動し、それによって出力オーディオ信号75を生成する。
[0074]図6は、本開示に記載された技術の様々な観点を実行し得る別のデコーダ80を示す図である。受信器が新しく、および場面ベースのデコーディングをサポートする場合、デコーディングの過程は図6に示され、それは、図4のエンコーダに対する可逆過程である。デコーダ70に類似して、デコーダ80は、後方互換性ビットストリーム59と拡張されたビットストリーム57を回復するために、多重化されたビットストリーム61を逆多重化するビットde−mux72を含む。しかし、デコーダ80は次に、後方互換性ビットストリーム59をトランスコードし、およびマルチチャネル互換性信号55を回復するために、変換器82を起動し得る。デコーダ80は次に、基本セット34A´を回復するために、マルチチャネル互換性信号55に逆変換行列84を適用し得る(そこで、素数(´)は、この基本セット34A´が基本セット34Aと比較してわずかに修正され得ることを表す)。デコーダ80はまた、拡張セット34B´を回復するために、拡張されたビットストリーム57をデコードし得る場面ベースのデコーダ86を起動し得る(そこで、再度、素数(´)は、この拡張された34B´が拡張された34Bと比較してわずかに修正され得ることを表す)。いずれかの事象において、デコーダ80は、出力オーディオ信号90を生成するために、基本セット53A´と拡張された53B´の組合せをレンダリングするように球面調和関数レンダラ88を起動し得る。
[0075]言い換えれば、適用可能な場合、変換器82は、後方互換性ビットストリーム59をマルチチャネル信号55に変換する。続いて、これらのマルチチャネル信号55は、基本セット34A´を回復するために逆行列84によって処理される。拡張された34B´は、場面ベースのデコーダ86によって回復される。SHCの完全なセット34´は、SHレンダラ88によって結合されおよび処理される。
[0076]こういった実装の設計は、マルチチャネルオーディオに(例えば、従来のフォーマットに)変換されるべき元の階層セットのサブセットを選択することを含み得る。
基本セット(例えば、SHCの)からマルチチャネルオーディオへの順方向コンバートおよび基本セットへ戻る逆方向コンバートでどれくらいの誤りが形成されるかという別の課題が生じ得る。
[0077]上記の課題に対する種々の解決策が可能である。下記の議論において、5.1フォーマットは、典型的な対象のマルチチャネルオーディオのフォーマットとして用いられ、およびアプローチの例が詳細に論じられるだろう。方法論は、他のマルチチャネルオーディオのフォーマットへと汎用化され得る。
[0078]5つの信号(特定の場所からの全帯域オーディオに対応する)は、5.1フォーマットにおいて使用可能であるので(標準化された場所を持たずおよび5つのチャネルにロウパスフィルタをかけることによって決定され得るLFE信号をプラスする)、1つのアプローチは、5.1フォーマットへコンバートするために5つのSHCを用いことになる。さらに、5.1フォーマットは2Dレンダリングだけが可能なので、いくつかの水平情報を搬送するSHCだけを使用することが望ましい。例えば、係数
Figure 0006092387
は、水平指向性上の非常にわずかな情報を搬送し、それによってこのサブセットから除外され得る。
Figure 0006092387
の実数または虚部についても同様である。これらのうちのいくつかは、インプリメンテーション(実数、虚数、複素数またはそれらの組み合わせなどの文法に様々な定義が存在する)において選択された球面調和基本関数の定義に依存して変化する。この方法において、5つの
Figure 0006092387
係数がコンバートのために精選され得る。
係数
Figure 0006092387
は無指向性上の情報を搬送するので、常にこの係数を用いることが望ましい。同様に、それらは重要な水平指向性の情報を搬送するので、
Figure 0006092387
の実数部と
Figure 0006092387
の虚数部を含むことが望ましい。最後の2つの係数に関して可能な候補は、
Figure 0006092387
の実数および虚数部を含む。種々の他の組み合わせもまた可能である。例えば、基本セットは、たった3つの係数
Figure 0006092387
Figure 0006092387
の実数部、および
Figure 0006092387
の虚数部を含むように選択され得る。
[0079]次のステップは、SHCの基本セット(例えば、上記で選択された5つの係数)および5.1フォーマットにおける5つの全帯域オーディオ信号の間でコンバート可能な可逆行列を定義することである。可逆性とって望ましいのは、わずかな解像度の損失があるまたは解像度の損失が無いSHCのセットへ全帯域オーディオ信号のコンバートを可能にすることである。
[0080]この行列を定義するための1つの可能な方法は、「モードマッチング」として知られる演算である。ここで、ラウドスピーカーフィードは、各ラウドスピーカーが球面波を形成すると仮定することによってコンピュータで計算される。こういったシナリオにおいて、第1番目のラウドスピーカーに起因する特定の位置
Figure 0006092387
における圧力(周波数の関数として)は、下記の式によって求められる。
Figure 0006092387
Figure 0006092387
が、第l(エル)番目のラウドスピーカーの位置を表す場合、
Figure 0006092387
は、第l番目のスピーカー(周波数領域における)のラウドスピーカーフィードである。全ての5つのスピーカーに起因する全圧力Ptは、下記の式によって求められる。
Figure 0006092387
[0081]我々はまた、5つのSHCの観点から全圧力が下記の式によって求められることを知っている。
Figure 0006092387
[0082]上記の2つの式を等しいと見なすことは、下記の式のように、SHCの観点からラウドスピーカーフィードを式で表すために変換行列を用いることを我々に可能にする。
Figure 0006092387
[0083]この式は、5つのラウドスピーカーフィードと選択されたSHCの間の直接の関係性があることを示す。変換行列は、例えば、どのSHCがサブセット(例えば、基本セット)内で使用されたかおよびSH基本関数のどの定義が使用されたかに依存して変化し得る。類似の方法において、選択された基本セットから異なるチャネルフォーマット(例えば、7.1、22.2)へコンバートするための変換行列が構成され得る。
[0084]上記の式における変換行列はスピーカーフィードからSHCへのコンバートを可能にする一方で、我々は、SHCから開始して、我々が5台のチャネルフィードを算出し、次にデコーダにおいて、我々が任意にSHCへ逆にコンバートすることができる(先端的な(すなわち、非レガシーな)レンダラが存在する)ように可逆的な行列が望ましい。
[0085]行列の可逆性を確保するために上記のフレームワークを操作する種々の方法が利用され得る。これらは、5台のスピーカーラウドスピーカーの位置と(例えば、ITU−R BS.775−1標準によって規定された角度公差を依然として順守する5.1システムの5台のラウドスピーカーのうちの1つまたは複数の位置とTデザインを順守するトランスデューサの通常の空間を調整することが通常上位互換性がある)、最大階数および明確に定義された固有値を確保するためにしばしば機能する様々な行列操作技術と正則化技術(例えば、周波数依存正則化)を変更することを含むが、それに限定されることはない。最終的に、全ての操作後に、修正された行列が、正確なおよび/または許容可能なラウドスピーカーフィードを実際に確実に作成できるようにするために、心理音響学的に5.1の演出をテストすることが望ましい。可逆性が保持される限り、SHCへの正確なデコードを確実にするための逆の課題は問題ではない。
[0086]いくつかのローカルスピーカー(local speaker)の幾何学的配置(デコーダにおけるスピーカーの幾何学的配置を指し得る)に関して、可逆性を確保するように上記のフレームワークを操作するための上記に概略説明された方法は、望ましいオーディオのイメージの品質に満たない結果となり得る。すなわち、音の再現は、取り込んだオーディオと比較すると、常に正確な音の定位をもたらすわけではない。この望ましいオーディオに満たない画像品質を修正するために、この技法は、「仮想ポートスピーカー」と称され得る概念を導入するためにさらに増加し得る。1つまたは複数のラウドスピーカーが、上述されたITU−R BS.775−1のような標準によって規定された一定の角度公差を有する特定のまたは定義された空間の領域内に再配置されるか、または配置されるようことを要求するよりむしろ、上記のフレームワークは、ベクトルベース振幅パンニング(VBAP)、距離ベース振幅パンニング、またはパンニングの別の形式といったパンニングのいくつかの形式を含むように修正され得る。例示の目的のためにVBAPに焦点を当てると、VBAPは、「仮想スピーカー」として特徴づけられ得るものを効果的に導入し得る。
VBAPは一般的に、これらの1つまたは複数のラウドスピーカーが、1つまたは複数のラウドスピーカーの場所および/または角度の少なくとも1つとは異なる1つまたは複数の場所および角度にある仮想スピーカーから生じるように思われる音を効果的に出力するために、1つまたは複数のラウドスピーカーへのフィードを修正し得る。
[0087]例示のために、SHCの観点からラウドスピーカーフィードを決定するための上記の式は、下記の式のように修正され得る。
Figure 0006092387
[0088]上記の式において、サイズM行掛けるN列のサイズのVBAP行列は、そこにおいて、Mはスピーカーの数を表し、(および上記の式では5と等しくなる)およびNは仮想スピーカーの数を表す。VBAP行列は、聴衆の定義された場所からのスピーカーの各位置までのベクトルと聴衆の定義された場所から仮想スピーカーの各位置までのベクトルの関数としてコンピュータ計算され得る。上記の式におけるD行列は、サイズN行掛ける(order+1)2列から成り得、そこにおいて、orderは、SH関数の順序を指し得る。D行列とは下記の行列を指し得る。
Figure 0006092387
[0089]実質的に、VBAP行列は、スピーカーの場所と仮想スピーカーを考慮に入れる「利得調整」と称され得るものを提供するM×Nの行列である。この方法にパンニングを導入することは、ローカルスピーカーの幾何学的配置によって再現される場合のより良い品質イメージをもたらすマルチチャネルオーディオより高品質に再現される。さらに、この式にVBAPを組み込むことによって、この技法は、様々な標準で規定された技法と一致しない不十分なスピーカー幾何学的配置を克服し得る。
[0090]実際に、この式は反転され、およびラウドスピーカーの特定の幾何学的配置または構成のためにSHCからマルチチャネルフィードへ逆に変換するために用いられ得、それは、下記で幾何学的配置Bと称され得る。すなわち、この式は、g行列の値を求めるために反転され得る。この逆方程式は下記の通りである。
Figure 0006092387
[0091]g行列は、この例において、5.1スピーカーの構成における5台のラウドスピーカーのそれぞれに関するスピーカー利得を表し得る。この構成に用いられる仮想スピーカーの場所は、5.1マルチチャネルフォーマットの仕様書または標準で定義された場所に対応し得る。これらの仮想スピーカーの場所それぞれをサポートし得るラウドスピーカーの場所は、いくつかの周知のオーディオ位置測定技術を用いて決定され得、その多くは、ヘッドエンドユニットに関する各ラウドスピーカーの場所を決定するために特定の周波数を有するトーンを実行することを抱合する(例えば、オーディオ/映像受信器(A/V受信器)、テレビ、ゲームシステム、デジタル映像ディスク(disc)システム、または他のタイプのヘッドエンドシステム)。代替として、ヘッドエンドユニットのユーザは、各ラウドスピーカーの場所を手動で特定し得る。いくつかの事象において、これらの周知の場所と可能な角度が与えられた場合、ヘッドエンドユニットは、VBAPによって仮想ラウドスピーカーの実際の構成を仮定して利得の値を求め得る。
[0092]この点において、この技術は、第1の複数の仮想ラウドスピーカーチャネル信号を生成するために、第1の複数のラウドスピーカーチャネル信号上でベクトルベースの振幅パンニングまたはパンニングの他の形式を実行することをデバイスまたは装置に可能にし得る。これらの仮想ラウドスピーカーチャネル信号は、仮想ラウドスピーカー生じるように思われる音を形成することをこれらのラウドスピーカーに可能にするラウドスピーカーに提供される信号を表し得る。その結果、第1の複数のラウドスピーカーチャネル信号上で第1の変換を実行する場合、技術は、音場を記述する要素の階層セットを生成するために第1の複数の仮想ラウドスピーカーチャネル信号上で第1の変換を実行することをデバイスまたは装置に可能にし得る。
[0093]さらに、この技術は、第2の複数のラウドスピーカーチャネル信号を生成するために要素の階層セットで第2の変換を実行することを装置に可能にし得、そこで第2の複数のラウドスピーカーチャネル信号のそれぞれは、対応する異なる空間の領域と関連づけられ、そこで第2複数のラウドスピーカーチャネル信号は、第2の複数の仮想ラウドスピーカーチャネルを備え、およびそこで第2の複数の仮想ラウドスピーカーチャネル信号は、対応する異なる空間の領域と関連付けられる。この技術は、いくつかの事例において、第2複数のラウドスピーカーチャネル信号を生成するために、第2の複数の仮想ラウドスピーカーチャネル信号上でベクトルベースの振幅パンニングを実行することをデバイスに可能にし得る。
[0094]上記の変換行列は、「モードマッチング」の基準から抽出されたが、代替の変換行列は、圧力マッチング、エネルギーマッチング等のような他の基準から抽出され得る。基本セット(例えば、SHCサブセット)と従来のマルチチャネルオーディオの間の変換を可能にする行列が抽出され得、および(マルチチャネルオーディオの忠実度を低減しない)操作の後、同じく可逆的であるわずかに修正された行列が定式化され得れば十分である。
[0095]上記のセクションは、5.1互換性システムに関する設計を論じた。細部は、異なる対象のフォーマットに関して適宜に調整され得る。例として、7.1システムへの互換性を可能にするために、2つの追加のオーディオコンテンツチャネルが互換性必須条件に加えられ、さらに2つのSHCが基本セットに加えられ、その結果、行列が可逆的になる。7.1システム(例えば、ドルビーTrueHD)のための大多数のラウドスピーカーの配置は、依然として水平面上にされるので、SHCの選択は高さ情報を有するものを依然として除く。この方法において、水平面信号レンダリングは、レンダリングシステム内の追加されたラウドスピーカーチャネルから利益を享受するだろう。高さの多様性(例えば、9.1、11.1および22.2システム)を有するラウドスピーカーを含むシステムにおいて、基本セット内にSHCの高さ情報を含むことが望ましいかもしれない。
[0096]ステレオおよびモノラルのようなより少ない数のチャネルに関して、多くの従来技術における既存の5.1ソリューションは、コンテンツ情報を維持するために、ダウンミックスを十分にカバーするべきである。これらのケースは自明であると考えられるので、本開示においてはさらに論じることはしない。
[0097]したがって、上記は、要素の階層セット(例えば、SHCのセット)と複数のオーディオチャネルの間でコンバートするための無損失メカニズムを表す。マルチチャネルオーディオ信号がこれ以上符号化雑音にさらされない限り誤りを招くことは無い。マルチチャネルオーディオ信号が符号化雑音にさらされる場合、SHCへのコンバートが誤りをまねく可能性がある。しかし、係数の値を監視し、およびマルチチャネルオーディオ信号の影響を低減するための適切な対処をすることによってこれらの誤りを説明することができる。これらの方法は、SHC再現の際に内在する冗長性を含むSHCの特徴を考慮に入れ得る。
[0098]マルチチャネルに対して一般論を述べてきたが、それはセットトップボックスのようなレガシーコンシューマのオーディオシステムの機能を確保するための「最小公倍数」であるので、現在の市場における主役は5.1チャネルに向けられている。
[0099]ここに記載されたアプローチは、SHCベースの音場の再現の使用する際の潜在的不利な点へ解決策を提供する。この解決法が無ければ、数百万個のレガシー再生システム内に機能を持つごとができないことによって課せられたかなりの損失のせいで、SHCベースの表現は決して展開され得ない。
[0100]図7Aは、本開示に記載された技術の様々な観点と一致するタスクT100、T200、およびT300を含む一般的な構成にしたがったオーディオ信号処理M100の方法を示すフローチャートである。タスクT100は、音場の記述(例えば、SHCのセット)を、要素の基本セット、例えば、図4の例に示された基本セット34Aおよび要素の拡張セット、例えば、拡張セット34Bに分割する。タスクT200は、複数のチャネル信号55を生成するために、基本セット34A上で、変換行列52のような可逆的な変換を実行し、そこにおいて、複数のチャネル信号55のそれぞれは、対応する異なる空間の領域と関連づけられる。タスクT300は、複数のチャネル信号55を記述する第1の部分と拡張セット34Bを記述する第2の部分(例えば、付加的なデータ部分)を含むパケットを生成する。
[0101]図7Bは、本開示に記載された技術の様々な観点と一致する一般的な構成による装置MF100を示すブロック図である。装置MF100は、要素の基本セット、例えば、図4の例に示された基本セット34Aと要素の拡張セット34Bを含む音場の記述を形成するための手段F100を含む(例えば、タスクT100を参照してここに記載されたように)。装置MFはまた、複数のチャネル信号55を生成するために、基本セット34A上で、変換行列52のような可逆的な変換を実行するための手段F200を含み、そこにおいて、複数のチャネル信号55のそれぞれは対応する異なる空間の領域と関連づけられる(例えばタスクT200を参照してここに記載されたように)。装置MF100はまた、複数のチャネル信号55を記述する第1の部分と要素34Bの拡張セットを記述する第2の部分を含むパケットを生成するための手段F300を含む(例えば、タスクT300を参照してここに記載されたように)。
[0102]図7Cは、本開示に記載された技術の様々な観点と一致する別の一般的な構成に従ったオーディオ信号処理のための装置A100のブロック図である。装置A100は、要素の基本セット、例えば、図4の例に示された基本セット34Aと要素34Bの拡張セットを含む音場の記述を生成するように構成されたエンコーダ100を含む(例えば、タスクT100を参照してここに記載されたように)。装置A100は、複数のチャネル信号55を生成するために、基本セット34A上で、変換行列52のような可逆的な変換を実行するように構成され、そこにおいて、複数のチャネル信号55のそれぞれは、対応する異なる空間の領域と関連づけられる(例えば、タスクT200を参照してここに記載したように)。装置A100はまた、複数のチャネル信号55を記述する第1の部分と要素34Bの拡張セットを記述する第2の部分を含むパケットを生成するように構成されたパケタイザを含む(例えば、タスクT300を参照してここに記載されたように)。
[0103]図8Aは、本開示に記載された技術の1つの例を表すタスクT400およびT500を含む一般的な構成に従ったオーディオ信号処理M100の方法を示すフローチャートである。タスクT400は、パケットを、図5および6の例に示された信号55のような複数のチャネル信号を記述し、それぞれが対応する異なる空間の領域と関連づけられる第1の部分と図5の例に示された基本セット34Aのような要素の拡張セットを記述する第2の部分に分割する。タスクT500は、要素の基本セット34A´を回復するために、複数のチャネル信号55上で逆変換行列84のような逆変換を実行する。
この方法において、基本セット34A´は、音場(例えば、SHCのセット)を記述する要素の階層セットの下層部分を備えおよび要素34B´の拡張セットは、階層セットの上層部分を備える。
[0104]図8Bは、タスクT505およびT605を含む方法M100の実施例M300を示すフローチャートである。複数のオーディオ信号のそれぞれに関して(例えば、オーディオオブジェクト)、タスクT505は、信号と信号に関する空間情報を、音場を記述する対応する要素の階層セットにエンコードする。タスクT605は、タスクT100で処理される音場の記述を生成するために、複数の階層セットを結合する。例えば、タスクT605は、結合された音場の記述を生成するために、複数の階層セットを追加するように(例えば、係数ベクトル加法を実行するように)実装され得る。1つのオブジェクトに関する要素の階層セット(例えば、SHCベクトル)は、別のオブジェクトに関する要素の階層セットよりも高位(例えば、長い幅)を有し得る。例えば、前景にあるオブジェクト(例えば、主演者の声)は、背景にあるオブジェクト(例えば、音響効果)よりも高位のセットを用いて表され得る。
[0105]ここに開示された原則はまた、チャネルベースのオーディオスキームにおけるラウドスピーカーの幾何学的配置における差異を補償するためのシステム、方法、および装置を実装するために用いられ得る。例えば、通常、プロのオーディオ技術者/アーティストは、特定の幾何学的配置(「幾何学的配置A」)におけるラウドスピーカーを用いてオーディオをミックスする。特定の代替手段のラウドスピーカーの幾何学的配置(幾何学的配置B)に関するラウドスピーカーフィードを形成することが望ましい。ここに開示された技術は、(例えば、ラウドスピーカーフィードとSHCの間の変換行列を参照して)幾何学的配置AからのラウドスピーカーフィードをSHCへコンバートし、次にそれらをラウドスピーカーの幾何学的配置Bへ再レンダリングするために用いられ得る。別の例において、幾何学的配置Bは標準化された幾何学的配置(例えば、ITU−R BS.775−1標準のような標準文書に定められているような)である。すなわち、この標準化された幾何学的配置は、各スピーカーが配置される空間の場所または領域を定義し得る。標準によって定義されたこれらの空間の領域は、定義された空間の領域と称され得る。こういったアプローチは、聴衆と相対的なラウドスピーカーの1つまたは複数の距離(半径)における幾何学的配置AおよびBの間の差だけでなく聴衆と相対的な1つまたは複数のラウドスピーカーの方位角および/または高度角の差を補償するために用いられ得る。こういったコンバートは、エンコーダおよび/またはデコーダにおいて実行され得る。
[0106]図9Aは、本開示に記載された技術の様々な観点にしたがって、変換行列102のアプリケーションを経由するSHC100から特定の幾何学的配置と互換性のあるマルチチャネル信号104への上述したようなコンバートを示す図である。
[0107]図9Bは、本開示に記載された技術の様々な観点にしたがって、変換行列106(それは、変換行列102の反転した幾何学的配置であり得る)を経由するSHC100´を回復するために、特定の幾何学的配置と互換性のあるマルチチャネル信号104からの上述したようなコンバートを示す図である。
[0108]図9Cは、本開示に記載された技術の様々な観点にしたがって、SHC100´を回復するために幾何学的配置Aと互換性のあるマルチチャネル信号104からの上述したような変換行列A108のアプリケーションを経由する第1のコンバートと変換行列110のアプリケーションを経由するSHC100´から幾何学的配置Bと互換性のあるマルチチャネル信号112への第2のコンバートを示す図である。図9Cに示されるような実装は、SHCから他の幾何学的配置と互換性のあるマルチチャネル信号への1つまたは複数の付加的な変換を含むように拡張され得ることが留意される。
[0109]基本的な場合において、幾何学的配置AおよびBにおけるチャネルの数は同じである。こういった幾何学的なコンバートのアプリケーションに関して、変換行列の可逆性を確保するために上述された制約を緩和することが可能であり得ることが留意される。さらなる実装は、幾何学的配置Aにおけるチャネルの数が幾何学的配置Bにおけるチャネルの数よりも多いまたは少ないシステム、方法、装置を含む。
[0110]図10Aは、本開示に記載された技術の様々な観点と一致するタスクT600およびT700を含む一般的な構成に従ったオーディオ信号処理の方法M400を示すフローチャートである。タスクT600は、図9Cに示される第1の複数のチャネル信号、例えば、信号104上の第1の変換、例えば、変換行列A108を実行し、そこで、各第1の複数のチャネル信号104は、音場(例えば、図9Bおよび9Cを参照して記載された)要素の階層的セット、例えば、回復したSHC100´を作成するために対応する異なる空間の領域と関連づけられる。タスクT700は、第2の複数のチャネル信号112を生成するために、要素100´の階層セット上で、第2の変換、例えば、変換行列110を実行し、そこにおいて、第2の複数のチャネル信号112のそれぞれは、対応する異なる空間の領域(例えば、タスクT200および図4、9A、および9Cを参照してここに記載された)と関連づけられる。
[0111]図10Bは、一般的な構成に従ったオーディオ信号処理MF400のための装置を示すブロック図である。装置MF400は、第1の複数のチャネル信号、例えば、信号104上で、図9Cの例に示された第1の変換、例えば、変換行列A108を実行するための手段F600を含み、そこにおいて、第1の複数のチャネル信号104のそれぞれは、音場(例えば、タスクT600を参照してここに記載された)を記述する要素の階層的セット、例えば、回復したSHC100´を生成するために、対応する異なる空間の領域と関連づけられる。装置MF100はまた、第2の複数のチャネル信号112を生成するために、要素の階層的セット100´上で第2の変換、例えば、変換行列B110を実行するための手段F700を含み、そこにおいて、第2の複数のチャネル信号112のそれぞれは、対応する異なる空間の領域と関連づけられる(例えば、タスクT200およびT700を参照してここに記載された)。
[0112]図10Cは、本開示に記載された技術と一致する一般的な別の構成にしたがって、オーディオ信号処理A400のための装置を示すブロック図である。装置A400は、第1の複数のチャネル信号、例えば、信号104上で、第1の変換、例えば、変換行列A108を実行するように構成された第1の変換モジュール600を含み、そこにおいて、第1の複数のチャネル信号104のそれぞれは、音場を記述する要素の階層セット、例えば、回復したSHC100´を生成するために、対応する異なる空間の領域と関連づけられる(例えば、タスク600を参照して記載された)。装置A100はまた、第2の複数のチャネル信号112を生成するために、要素100´の階層セット上で、第2の変換、例えば、変換行列B110を実行するように構成された第2の変換モジュール250を含み、そこにおいて、第2の複数のチャネル信号112のそれぞれは、対応する異なる空間の領域と関連づけられる(例えば、タスクT200およびT600を参照してここに記載された)。第2の変換モジュール250は、例えば、変換モジュール200の実装として認識され得る。
[0113]図10Dは、入力チャネル123(例えば、PCMストリームのセットであり、それぞれは異なるチャネルに対応する)を受信しおよび送信チャネル126を介した送信のために対応するエンコードされた信号125を生成する(および/または、図の簡単のために図示されないが、DVDディスク(disk)のような記憶媒体に格納する)エンコーダ122を含むシステム120の例を示す図である。このシステム120はまた、エンコードされた信号125を受信しおよび特定のラウドスピーカーの幾何学的配置にしたがってラウドスピーカーフィード127の対応するセットを形成するデコーダ124を含む。1つの例において、エンコーダ122は、図9Cに示されたような手順を実行するために実装され、そこにおいて、入力チャネルは、幾何学的配置Aに対応しおよびエンコードされた信号125は、幾何学的配置Bに対応するマルチチャネル信号を記述する。別の例において、デコーダ124は幾何学的配置Aの知識を持ち、そして図9Cに示されたような手順を実行するように実装される。
[0114]図11Aは、幾何学的配置Aに対応する複数の入力チャネル133のセットを受信しおよび対応する幾何学的配置Aの記述(例えば、空間におけるラウドスピーカーの調整の)と共に、送信チャネル136(および/またはDVDディスク(disk)のような記憶媒体に格納するため)を介する送信のために対応するエンコードされた信号135を生成するエンコーダ132を含む別のシステム130の例を示す図である。このシステム130はまた、エンコードされた信号135と幾何学的配置Aの記述を受信するデコーダ134を含みおよび異なるラウドスピーカーの幾何学的配置Bにしたがって対応するラウドスピーカーフィード137のセットを形成する。
[0115]図11Bは、マルチチャネル信号140からSHC142への第1のコンバート(上述した変換行列A 144のアプリケーションを経由する)と、そのコンバートは幾何学的配置Aの記述141にしたがって適応的であり(例えば、第1の変換モジュール600の対応する実装によって)、SHC142から幾何学的配置Bと互換性のあるマルチチャネル信号148への第2のコンバート(変換行列B 146のアプリケーションを経由すする)を用いて、デコーダ134によって実行され得る演算のシーケンスを示すブロック図である。第2のコンバートは、特定の幾何学的配置Bに固定され得、または所望の幾何学的配置B(例えば、第2の変換モジュール250の対応する実装に提供されるような)の記述(例示の簡単のために図11Bの例に図示されない)にしたがって適応的でもある。
[0116]図12Aは、タスクT800およびT900を含む一般的な構成にしたがってオーディオ信号処理M500の方法を示すフローチャートである。タスクT800は、スピーカーの第1の幾何学的配置から要素の第1の階層セット、例えば、SHC142へ、音場を記述するオーディオチャネル情報の第1のセット、例えば、信号140を、第1の変換(図11Bの例に示された変換行列A 144のような)を用いて、変換する。タスクT900は、第2の変換(変換行列B 146のような)を用いて、要素144の第1の階層的セットをスピーカーの第2の幾何学的配置に関するオーディオチャネル情報148の第2のセットに変換する。第1および第2の幾何学的配置は、例えば、異なる半径、方位角、および/または仰角を有し得る。
[0117]図12Bは、一般的な構成に従った装置A500を示すブロック図である。装置A500は、音場を記述するオーディオチャネル情報の第1のセット、例えば、信号140上で、スピーカーの第1の幾何学的配置から要素の第1の階層セット例えば、SHC144への図11Bの例に示された変換行列A 144のような第1の変換を実行するように構成されたプロセッサ150を含む。装置A500はまた、オーディオチャネル情報の第1のセットを格納するように構成されたメモリ152を含む。
[0118]図12Cは、スピーカーの第1の幾何学的配置の座標、例えば、記述141と共に、図11Bの例に示されたラウドスピーカーチャネル、例えば、信号140を受信する一般的な構成に従ったオーディオ信号処理M600の方法を示すフローチャートであり、そこにおいて、ラウドスピーカーチャネルは要素の階層的セット、例えば、SHC144に変換されている。
[0119]図12Dは、スピーカーの第1の幾何学的配置の座標、例えば、記述141と共に、図11Bの例に示されたラウドスピーカーチャネル、例えば、信号140を送信する一般的な構成に従ったオーディオ信号処理の方法M700を示すフローチャートであり、そこにおいて、第1の幾何学的配置はチャネルの場所に対応する。
[0120]図13A−13Cは、本開示に記載された技術の様々な観点を実行し得るオーディオ再生システム200A−200Cの例を示すブロック図である。図13Aの例において、オーディオ再生システム200Aは、オーディオソースデバイス212、ヘッドエンドデバイス214、フロントレフトスピーカー216A、フロントレフトスピーカー216B、センタースピーカー216C、レフトサラウンドサウンドスピーカー216D、およびライトサラウンドサウンドスピーカー216Eを含む。専用のスピーカー216A−216E(「スピーカー216」)を含むように示されているが、技術は、複数のスピーカーを含む他のデバイスが専用のスピーカー216の代わりに用いられる場合の例において実行され得る。
[0121]オーディオソースデバイス212は、ソースオーディオデータを生成することができるデバイスの任意のタイプを表し得る。例えば、オーディオソースデバイス212は、テレビジョンセット(インターネット接続を特徴としおよび/またはアプリケーションの実行をサポートすることができるオペレーティングシステムを実行するいわゆる「スマートテレビジョン」または「smarTVs」を含む)、デジタルセットトップボックス(STB)、デジタルビデオディスク(DVD)プレイヤ、高解像度ディスクプレイヤ、ゲームシステム、マルチメディアプレイヤ、ストリーミングマルチメディアプレイヤ、録音プレイヤ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットまたはスレートコンピュータ、セルラー電話(いわゆる「スマートフォン」を含む)、またはソースオーディオデータを生成あるいは提供することができるデバイスまたはコンポーネントの任意の他のタイプを表し得る。いくつかの例において、オーディオソースデバイス212は、例えば、オーディオソースデバイス212がテレビジョン、デスクトップコンピュータ、ラップトップコンピュータ、タブレットまたはスレートコンピュータ、またはセルラー電話を表す場合の例において、ディスプレーを含み得る。
[0122]ヘッドエンドデバイス214は、オーディオソースデバイス212によって生成されたあるいは提供されたソースオーディオデータを処理することができる(または、言い換えれば、レンダリングする)任意のデバイスを表す。いくつかの例において、単一デバイスを形成するためにオーディオソースデバイス212と統合され得、例えば、そのために、ヘッドエンドデバイス214は、ヘッドエンドデバイス214内部にあるかまたはその一部である。例示のために、オーディオソースデバイス212が、いくつかの具体例を提供するために、テレビジョン、デスクトップコンピュータ、ラップトップコンピュータ、スレートまたはタブレットコンピュータ、ゲームシステム、携帯電話、または高解像度ディスク(disc)プレイヤを表す場合、オーディオソースデバイス212はヘッドエンドデバイス214と統合され得る。すなわち、ヘッドエンドデバイス214は、テレビジョン、デスクトップコンピュータ、ラップトップコンピュータ、スレートまたはタブレットコンピュータ、ゲームシステム、セルラー電話、または高解像度ディスク(disc)プレイヤ、等のような様々なデバイスのうちのいずれかであり得る。ヘッドエンドデバイス214は、オーディオソースデバイス212と統合されない場合、オーディオソースデバイス212およびスピーカー216と有線接続または無線接続を介して通信することによって多数のインターフェースを提供する(それは通常「A/V受信器」と称される)オーディオ/ビデオ受信器を表し得る。
[0123]スピーカー216のそれぞれは、1つまたは複数のトランスデューサを有するラウドスピーカーを表し得る。典型的に、フロントレフトスピーカー216Aは、フロントライトスピーカー216Bと類似しているかまたはほぼ同じであり、その一方で、サラウンドレフトスピーカー216Dは、サラウンドライトスピーカー216Eと類似しているかまたはほぼ同じである。スピーカー216は、ヘッドエンドデバイス214と通信することによって、有線および/またはいくつかの事例においては無線インターフェースを提供し得る。スピーカー216は、積極的に電力供給されるか、または受動的に電力供給され、そこにおいて、受動的に電力供給される場合、ヘッドエンドデバイス214はスピーカー216のそれぞれを駆動し得る。
[0124]典型的なマルチチャネルサウンドシステム(それは「マルチチャネルサラウンドオーディオシステム」または「サラウンドオーディオシステム」とも称され得る)において、ヘッドエンドデバイス214の1つの例を表し得るA/V受信器は、専用のフロントレフト、フロントセンター、フロントライト、バックレフト(それは「サラウンドレフト」とも称され得る)およびバックライト(それは「サラウンドライト」とも称され得る)スピーカー216の配置に対応するソースオーディオデータを処理する。A/V受信器はしばしば、より高いオーディオ品質を提供し、スピーカーに電力を供給し、および干渉を低減するようにこれらのスピーカーのそれぞれに専用の有線接続を提供する。A/V受信器は、適切なチャネルをスピーカー216のうちの適切な1つに提供するように構成され得る。
[0125]多数の異なるサラウンドサウンドフォーマットは、音のステージまたは領域を再現するために存在し、それによってより没入型のオーディオ体験を提供する。5.1サラウンドサウンドシステムにおいて、A/V受信器は、センターチャネル、レフトチャネル、ライトチャネル、リアライトチャネルおよびリアレフトチャネルを含むオーディオの5つのチャネルをレンダリングする。5.1の「.1」をフォーマットする付加的チャネルはサブウーハーまたは低音チャネルに関する。他のサラウンドサウンドフォーマットは、7.1サラウンドサウンドフォーマット(それは付加的なリアレフトとライトチャネルを追加する)および22.2サラウンドサウンドフォーマット(それは付加的なフォワードおよびリアチャネルおよび別のサブウーハーまたは低音チャネルに加えて不揃いの高さの付加的なチャネルを追加する)を含む。
[0126]5.1サラウンドサウンドフォーマットのコンテキストにおいて、A/V受信器は、これらの5つのラウドスピーカー216用の5つのチャネルとサブウーハー用の低音チャネルをレンダリングし得る(図13Aまたは13Bの例には示されない)。A/V受信器は、サラウンドサウンドシステムが動作する特定の部屋における音場を十分に再現するように信号のボリュームレベルと他の特徴を変更するために信号をレンダリングし得る。すなわち、オリジナルのサラウンドオーディオ信号は、15x15のフットルーム(foot room)のような所与の部屋に対応するために取得および処理されてきた。A/V受信器は、サラウンドサウンドシステムが動作する部屋に対応するこの信号を処理し得る。A/V受信器は、より良質の音のステージをつくるためにこのレンダリングを実行し、それによってより良いまたはより没入型のリスニング体験を提供し得る。
[0127]図13Bの例において、スピーカー216は、破線の長方形で表された長方形スピーカーの幾何学的配置218に配置される。このスピーカーの幾何学的配置は、上述された様々なオーディオの標準のうちの1つまたは複数によって規定されたスピーカーの幾何学的配置と類似しているかまたはほぼ同じである。標準化されたスピーカーの幾何学的配置に類似性が与えられた場合、ヘッドエンドデバイス214はオーディオ信号220を上述した方法におけるSHCに変換またはコンバートしないが、スピーカー216を介するこれらのオーディオ信号220を単に再生するだけであり得る。
[0128]しかし、ヘッドエンドデバイス214は、スピーカーの幾何学的配置218が意図された音場を好適に再現するスピーカーフィードを潜在的に形成するために、上述した標準のうちの1つに規定されたスピーカーの幾何学的配置に類似するが、同一でない場合でも、この変換を実行するのに適合し得る。この点において、それらのスピーカーの幾何学的配置に類似する一方で、ヘッドエンドデバイス214は、音場を好適に再現するためにこの開示において上述された技術を依然として実行し得る。
[0129]図13Bの例において、システム200Bは、システム200Bもまたオーディオソースデバイス212、ヘッドエンドデバイス214およびスピーカー216を含む点で、システム200Aに類似する。しかし、長方形のスピーカーの幾何学的配置218に配置されたスピーカー216を有するよりむしろ、システム200B配置されたスピーカー216を有する。標準でないスピーカーの幾何学的配置222は、非対称のスピーカーの幾何学的配置の1つの例を表し得る。
[0130]この標準でないスピーカーの幾何学的配置222の結果として、ユーザは、ヘッドエンドデバイス214が標準でないスピーカーの幾何学的配置222を規定できるようにスピーカー216のそれぞれの場所を入力するためにヘッドエンドデバイス214と整合を取り得る。ヘッドエンドデバイス214は、入力オーディオ信号220をSHCに変換し、次にSHCをスピーカー216の標準でないスピーカーの幾何学的配置222に与えられる音場を好適に再現するスピーカーフィードに変換する。
[0131]図13Cの例において、システム200Cはシステム200Cがまたオーディオソースデバイス212、ヘッドエンドデバイス214、およびスピーカー216を含む点でシステム200Aと200Bに類似する。しかし、長方形スピーカーの幾何学的配置218に配置されたスピーカー216を有するよりむしろ、システム200Cは多平面の幾何学的配置226に配置されたスピーカー216を有する。多平面スピーカーの幾何学的配置226は、少なくとも1つのスピーカーが他のスピーカー216のうちの図13Cの例における2つまたはそれ以上と同じ平面、例えば、平面228に存在しない非対称の多平面スピーカーの配置のうちの1つの例を表し得る。図13Cの例に示されたように、ライトサラウンドスピーカー216Eは、平面228からスピーカー216Eの場所への垂直置換230を有する。残りのスピーカー216A−216Dはそれぞれ平面228に設置され、それらはスピーカー216A−216Dのそれぞれに共通であり得る。しかし、スピーカー216Eは、スピーカー216A−216Dとは異なる平面に存在し、そのためスピーカー216は2つまたはそれを超える、または言い換えれば多平面に存在する。
[0132]この多平面スピーカーの幾何学的配置228の結果として、ユーザは、ヘッドエンドデバイス214がマルチ平面スピーカーの幾何学的配置226を特定できるようにスピーカー216のそれぞれの場所を入力するためにヘッドエンドデバイス214と整合を取り得る。次にヘッドエンドデバイス214は、入力オーディオ信号220をSHCに変換し、次にSHCをスピーカー216のマルチ平面スピーカーの幾何学的配置226に与えられる音場を好的に再現するスピーカーフィードに変換する。
[0133]図14は、本開示に記載された技術の様々な観点を実行し得る自動車用オーディオシステム250を示す図である。図14の例に示されたように、自動車用オーディオシステム250は、図13A−13Cの例に示された上述されたオーディオソースデバイス212に実質的に類似し得るオーディオソースデバイス252を含む。自動車用サウンドシステム250はまた、ヘッドエンドデバイス254(「H/Eデバイス254」)を含み、それは、上述されたヘッドエンドデバイス214に実質的に類似し得る。自動車251のフロントダッシュに設置されるように示されているが、オーディオソースデバイス252とヘッドエンドデバイス254のうちの1つまたは両方は、具体例として、自動車の床、天井、または後方のコンパートメントを含む自動車251内のいずれかに設置され得る。
[0134]自動車用オーディオシステム250はさらに、フロントスピーカー256A、ドライバ側スピーカー256B、同乗者側スピーカー256C、リアスピーカー256D、周辺スピーカー256Eおよびサブウーハー258を含む。個々に示されていないが、図14の例における各サークルおよび/またはスピーカー型オブジェクトは別々のまたは個々のスピーカーを表す。しかし、それぞれが自らのスピーカーフィードを受信する別々のスピーカーとして動作する一方で、スピーカーのうちの1つまたは複数は、スピーカーのうちのいくつかと連携する2つの間のどこかに位置する仮想スピーカーと称され得るものを提供するために別のスピーカーと連動して動作し得る。
[0135]この点において、フロントスピーカー256Aのうちの1つまたは複数は、図13A−13Cの例に示されたセンタースピーカー216Cに類似するセンタースピーカーを表し得る。1つ又は複数のフロントスピーカー256Aはまた、フロントレフトスピーカー216Aに類似するフロントレフトスピーカーを表すが、フロントスピーカー256Aのうちの1つまたは複数は、いくつかの事例において、フロントライトスピーカー216Bに類似するフロントライトスピーカーを表し得る。いくつかの例において、ドライバ側スピーカー256Bのうちの1つまたは複数は、フロントライトスピーカー216Bに類似するフロントライトスピーカーを表し得る。いくつかの例において、フロントスピーカー256Aおよびドライバ側スピーカー256Bの両方のうちの1つまたは複数はフロントレフトスピーカー216Aに類似するフロントレフトスピーカーを表し得る。同様に、いくつかの事例において、同乗者側スピーカー256Cのうちの1つまたは複数は、フロントライトスピーカー216Bに類似するフロントライトスピーカーを表し得る。いくつかの例において、フロントスピーカー256Aと同乗者側スピーカー256Cの両方のうちの1つまたは複数は、フロントライトスピーカー216Bに類似するフロントライトスピーカーを表し得る。
[0136]さらに、1つまたは複数のドライバ側スピーカー256Bは、いくつかの例において、サラウンドレフトスピーカー216Dに類似するサラウンドレフトスピーカーを表し得る。いくつかの例において、リアスピーカー256Dのうちの1つまたは複数はサラウンドレフトスピーカーDに類似するサラウンドレフトスピーカーを表し得る。いくつかの例において、ドライバ側スピーカー256Bとリアスピーカー256Dの両方のうちの1つまたは複数は、サラウンドレフトスピーカー216Dに類似するサラウンドレフトスピーカーを表し得る。同様に、1つまたは複数の同乗者側スピーカー256Cは、いくつかの例において、サラウンドライトスピーカー216Eに類似するサラウンドライトスピーカーを表し得る。いくつかの例において、1つまたは複数のリアスピーカー256Dは、サラウンドライトスピーカーを表し、取り囲む右側のスピーカー216Eに類似し得る。いくつかの例において、同乗者側スピーカー256Cとリアスピーカー256Dの両方のうちの1つまたは複数は、サラウンドレフトスピーカー216Dに類似するサラウンドライトスピーカーを表し得る。
[0137]周辺ピーカー256Eは、自動車251の床、自動車251の天井、または自動車251内のシート、いずれかのコンソールまたは他のコンパートメントを含む自動車251のいずれか他の可能な内装空間にインストールされるスピーカーを表し得る。サブウーハー258は、低周波数効果を再現するために設計されたスピーカーを表す。
[0138]ヘッドエンドデバイス254は、音場を表すSHC(上述したとおり、しばしば音場の3次元表示を表す)を回復するために拡張セットを用いて増大され得るオーディオソースデバイス252から後方互換性のある信号を変換するために上述した技術の様々な観点を実行し得る。音場の包括的な再現として特徴づけられ得るものの結果として、ヘッドエンドデバイス254は次に、スピーカー256A−256Eのそれぞれに関して個々のフィードを形成するためにSHCを変換し得る。ヘッドエンドデバイス254は、この仕方においてスピーカーフィードを形成し得、その結果、スピーカー256A−256Eを介して演奏される場合、音場は、1つの例として、標準に一致する標準化されたスピーカーフィードを使用する音場の再現と比較して好適に再現され得る(特に、通常せいぜい10個−16個のスピーカーを特徴とする乗用車用サウンドシステムと比較して、比較的多数のスピーカー256A−256Eを与えられた場合)。
[0139]ここに開示された方法および装置は一般的に、こういったアプリケーションの移動式または携帯用の例を含み、および/または遠場のソースから信号を検知する任意の送受信用および/またはオーディオ検知用アプリケーションに適用され得る。例えば、ここに開示された構成の範囲は、符号分割多元接続(CDMA)無線通信経由のインターフェースを用いるように構成された無線電話通信システムに属する通信デバイスを含む。そうでなければ、ここに記載された特徴を有する方法および装置が、有線および/または無線(例えば、CDMA、TDMA、FDMA、および/またはTD−SCDMA)を介するボイスオーバIP(VoIP)を用いるシステムのような当業者に周知の広範囲の技術を用いる様々な通信システムのいずれかに属し得ることが当業者によって理解されるであろう。
[0140]ここで開示された通信デバイス(例えば、スマートフォン、タブレットコンピュータ)がパケット交換(例えば、VoIPのようなプロトコルにしたがってオーディオ送信を行うように配置された有線および/または無線ネットワーク)および/または回路交換されるネットワークでの使用のために適合され得ることが特に検討され、それによって開示される。ここに開示された通信デバイスが、全帯域の広帯域符号化システムと分割帯の域広帯域符号化システムを含む、狭帯域符号化システム(例えば、およそ4または5キロヘルツのオーディオ周波数範囲を符号化するシステム)および/または広帯域符号化システム(例えば、5キロヘルツ以上のオーディオ周波数をエンコードするシステム)において使用するために適合され得ることが特に検討され、その結果開示されている。
[0141]記載された構成の先の説明は、ここで開示された方法および他の構造を作成または使用することを当業者に可能にするように提供される。ここに示されおよび記載されたフローチャート、ブロック図、および他の構造は、単なる例であり、およびこれらの構造の他の変形例もまた、本開示の範囲内である。これらの構成に対する種々の修正が可能であり、ここで説明された包括的な原理は、同様に、他の構成にも適用され得る。したがって、本開示は、上記に示された構成に限定されることを意図するものではないが、むしろここでの任意の仕方において開示された原則および新規事項と一致するもっとも広い範囲に適合するべきであり、それは、元の開示の一部を形成する。
[0142]当業者は、情報および信号が種々の異なる技術および技法のいずれかを用いて表され得ることを理解するだろう。例えば、上記の記述を通して参照され得る、データ、命令、コマンド、情報、信号、ビット、および記号は、電圧、電流、電磁波、磁場または磁性粒子、光電場または光学粒子、またはそれらの任意の組合せによって表され得る。
[0143]ここで開示されたような構成の実装のための重要な設計要求は、圧縮されたオーディオまたはオーディオ画像情報(例えば、ここで特定された例のうちの1つとして、圧縮フォーマットにしたがってエンコードされたファイルまたはストリーム)または広帯域通信(例えば、12、16、44.1、48、または192キロヘルツのような8キロヘルツより高いサンプルレートにおける例えば、音声通信)のような、特に計算集中型アプリケーションに関して、処理遅延および/または計算の複雑性(典型的に秒またはMIPS毎に数百万の命令において測定される)を最小限にすることを含み得る。
[0144]マルチマイクロフォン処理システムの目的は、全体のノイズの10から12dBの削減を実現すること、所望のスピーカーの移動中に音声レベルと色を維持すること、およびノイズが、積極的なノイズ除去のではなく背景に移動したという認識を得られること、会話の残響除去、および/またはより積極的なノイズ削減のための後処理のオプションを可能にすることを含み得る。
[0145]ここに開示された装置(例えば、装置A100、MF100)は、意図されたアプリケーションに適切であるとみなされるソフトウェア、および/またはファ−ムウェアとハードウェアとの任意の組合せに実装され得る。例えば、こういった装置の要素は、例えば、同じチップ上またはチップセット内の2つ以上のチップの間に存在する電子および/または光学デバイスとして組み立てられ得る。こういったデバイスの1つの例は、トランジスタまたは論理ゲートのような、論理要素の固定されたまたはプログラム可能なアレイであり、およびこれらの要素のいずれかは、こういったアレイの1つまたは複数として実装され得る。装置の要素のうちのいずれか2つ以上または全てであっても同じアレイまたは複数のアレイ内に実装され得る。こういった1つのアレイまたは複数のアレイは、1つまたは複数のチップ(例えば、3つ以上のチップを含むチップセット内に)実装され得る。
[0146]ここに開示された装置の様々な実装のうちの1つまたは複数の要素はまた、マイクロプロセッサ、組み込みプロセッサ、IPコア、デジタル信号プロセッサ、FPGA(フィールド・プログラマブル・ゲイト・アレイ)、ASSP(特定用途向け標準製品)、およびASIC(特定用途向け集積回路)のような論理要素の1つまたは複数の固定されたまたはプログラム可能なアレイに上で実行可能に配列された1つまたは複数の命令のセットの全体または一部に実装され得る。ここに開示された装置の実装の様々な要素のうちのいずれかはまた、1つまたは複数のコンピュータ(例えば、1つまたは複数の命令のセットまたは一連の命令を含む機械、または「プロセッサ」とも称される)として統合され得、およびこれらの要素のうちの2つ以上または全てであってもこういったコンピュータまたは複数のコンピュータ内に実装され得る。
[0147]ここに開示されたとおり処理するためのプロセッサまたは他の手段は、例えば、同じチップ上またはチップセット内の2つ以上のチップのうちに存在する電子および/または光学デバイスとして組み立てられ得る。こういったデバイスの1つの例は、トランジスタまたは論理ゲートのような、固定されたまたはプログラム可能な論理要素であり、およびこれらの要素のいずれかは1つまたは複数のこういったアレイのとして実装され得る。こういった一つのアレイまたは複数のアレイは、1つまたは複数のチップ内に(例えば、2つ以上のチップを含むチップセット内に)実装され得る。こういった複数のアレイの例は、マイクロプロセッサ、埋め込みプロセッサ、IPコア、DSP、FPGA、アンチスプーフィングSP、およびASICのような論理要素の固定されたまたはプログラム可能なアレイを含む。ここに開示されたように処理するためのプロセッサまたは他の手段はまた、1つまたは複数のコンピュータ(例えば、命令の1つまたは複数のセットまたは一連の命令を実行するようにプログラムされた1つまたは複数のアレイを含む機械)または他のプロセッサとして統合され得る。プロセッサが埋め込まれるデバイスまたはシステム(例えば、オーディオ検出デバイス)の動作に直接関連するタスクのように、ここに記載されたようなオーディオ符号化手順とは直接関係しないタスクを行いまたは他の命令のセットを実行することが、ここで記載されたプロセッサにとって可能である。オーディオ検出デバイスのプロセッサによって実行されることがここに開示された方法の一部にとって可能であり、および1つまたは複数の他のプロセッサの制御の下で実行されることが方法の別の一部にとって可能である。
[0148]当業者は、様々な実例となるモジュール、論理ブロック、回路、およびテストおよびここに開示された構成に関連して記載された他の動作が電気的なハードウェア、コンピュータソフトウェア、またはその両方の組み合わせとして実装され得ることを評価するだろう。こういったモジュール、論理ブロック、回路、および演算は、実装され、または、汎用プロセッサ、デジタル信号プロセッサ(DSP)、ASICまたはASSP、FPGAまたは他のプログラム可能な論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、またはここに開示された構成をもたらすために設計されたそれらの任意の組合せと共に実装され得る。例えば、こういった構成は、配線接続された回路、アプリケーション特定集積回路に組入れられた回路構成、不揮発性記憶媒体にロードされたファ−ムウェアプログラム、または機械可読コードとしてデータ記憶媒体からまたはデータ記憶媒体へロードされたソフトウェアプログラム、に少なくとも部分的に実装され得、こういったコードは、汎用プロセッサまたは他のデジタル信号処理ユニットのような論理要素のアレイによって実行可能な命令である。汎用プロセッサは、マイクロプロセッサであっても良いが、代替として、プロセッサは、従来のプロセッサ、コントローラ、マイクロコントローラ、またはステートマシーンのいずれかであっても良い。プロセッサはまた、例えば、DSPとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、DSPコアと連結する1つまた複数のマイクロプロセッサ、または任意の他のこういった構成である、コンピューティングデバイスの組み合わせとして実装され得る。ソフトウェアモジュールは、RAM(ランダム・アクセスメモリ)、ROM(読み取り専用メモリ)、フラッシュRAMのような不揮発性RAM(NVRAM)、消去可能プログラム可能ROM(EPROM)、電気的に消去可能なプログラム可能ROM(EEPROM)、レジスタ、ハードディスク、リムーバブル・ディスク、またはCD−ROM、または当技術分野において周知の記憶媒体のような非一時的記憶媒体に属し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、および記憶媒体へ情報を書き込むことができるようなプロセッサに結合され得る。代替として、記憶媒体はプロセッサに統合され得る。プロセッサおよび記憶媒体は、ASIC内に属し得る。ASICはユーザ端末に属し得る。代替として、プロセッサおよび記憶媒体は、ユーザ端末内のディスクリートコンポーネントとして存在し得る。
[0149]ここに開示された様々な方法(例えば、方法M100、M200、M300)は、プロセッサのような論理要素のアレイによって実行され得、およびここに記載された装置の様々な要素は、例えばアレイにおいて実行されるように設計されたモジュールとして実装されることが留意される。ここで用いられたように、用語「モジュール」または「サブモジュール」は、任意の方法、装置、デバイス、ユニット、またはソフトウェア、ハードウェア、またはファ−ムウェア形式にコンピュータ命令(例えば、論理式)を含むコンピュータ−可読データ記憶媒体を指し得る。多数のモジュールまたはシステムは、1つのモジュールまたはシステムに組み込まれることができ、または1つのモジュールまたはシステムは、同じ機能を実行するために多数のモジュールまたはシステムに分割されることができることが理解されるべきである。ソフトウェアまたは他のコンピュータ実行可能な命令に実装される場合、プロセスの要素は本質的に、例えばルーチン、プログラム、オブジェクト、コンポーネント、データ構造、などの関連するタスクを実行するためのコードセグメントである。用語「ソフトウェア」は、ソースコード、アッセンブリ言語コード、機械コード、バイナリコード、ファ−ムウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な1つまたは複数の命令のセットまたは一連の命令のいずれかを含むと理解されるべきである。プログラムまたはコードセグメントは、プロセッサ可読記憶媒体に格納されるか、または送信媒体または通信リンクを介する搬送波に統合されるコンピュータデータ信号によって送信されることができる。
[0150]ここに開示された方法、スキーム、および技術の実装はまた、論理要素のアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械)を含む機械によって読み取り可能および/または実行可能な命令の1つまたは複数のセットとして実体的に統合され得る(例えば、ここにリスト化された1つまたは複数のコンピュータ可読媒体において)。用語「コンピュータ可読媒体」は、揮発性、不揮発性、取り外し可能、および取り外し可能でない媒体を含み得る任意の媒体を含み得る。コンピュータ可読媒体の例は、電子回路、半導体メモリデバイス、ROM、フラッシュメモリ、消去可能なROM(EROM)、フロッピー(登録商標)ー(登録商標)ディスケットまたは他の磁気記憶装置、CD−ROM/DVDまたは他の光学記憶装置、ハードディスク、光ファイバ媒体、無線周波数(RF)リンク、または所望の情報を格納しおよびアクセス可能な任意の他の媒体を含む。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバ、無線、電磁石の、RFリンク等の送信媒体を介して伝搬することができる任意の信号を含み得る。コードセグメントは、インターネットまたはイントラネットのようなコンピュータネットワークを介してダウンロードされ得る。いずれかの場合において、現在の開示の範囲はこういった実施例に限定されると解釈されるべきではない。
[0151]ここに記載された方法のタスクのそれぞれは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、またはその2つの組合せに直接統合され得る。ここに開示されたような方法の実装の典型的なアプリケーションにおいて、論理要素のアレイ(例えば、論理ゲート)は、この方法の様々なタスクのうちの1つ、2つ以上、または全てでさえも実行するように構成される。1つまたは複数(場合によっては全て)のタスクはまた、論理要素(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械)のアレイを含む機械(例えば、コンピュータ)によって読み取り可能および/または実行可能なコンピュータ・プログラム・プロダクト(例えば、ディスク(disk)フラッシュまたは他の不揮発性メモリカード、半導体メモリチップ、等のような1つまたは複数のデータ記憶媒体)に統合されるコード(例えば、命令の1つまたは複数のセット)として実装され得る。ここに開示された方法を実装したタスクは、2つ以上の例えばアレイまたは機械によって行われ得る。これらまたは他の実装において、タスクは、例えば通信機能を有するセルラー電話または他のデバイスといった無線通信のためのデバイス内で行われ得る。こういったデバイスは、回路切り替えおよび/またはパケット切り替えネットワークをと通信するように構成され得る(例えば、VoIPのような1つまたは複数のプロトコルを用いて)。例えば、こういったデバイスは、エンコードされたフレームを受信および/または送信するように構成されたRF回路を含み得る。
[0152]ここに開示された様々な方法は、ハンドセット、ヘッドセット、または携帯用デジタルアシスタント(PDA)のような携帯用通信デバイスによって行われ得、およびここに記載された様々な装置がこういったデバイス内に含まれ得ることが明示的に開示される。典型的なリアルタイムの(例えば、オンライン)アプリケーションは、こういったモバイルデバイスを用いて行われる電話での会話である。
[0153]1つまたは複数の例示的な実施例において、ここに記載された動作は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組み合わせにおいて実施され得る。ソフトウェアに実装される場合、こういった動作は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体に格納されるか、またはコンピュータ可読媒体を介して送信され得る。用語「コンピュータ可読媒体」は、コンピュータ可読記憶媒体と通信(例えば、送信)媒体の両方を含む。限定ではなく例として、コンピュータ可読記憶媒体は、半導体メモリ(無制限に動的または静的なRAM、ROM、EEPROM、および/またはフラッシュRAMを含み得る)または強誘電体、磁気抵抗、オブシンスキー効果メモリ、重合体メモリ、または相変化メモリ、CD−ROMまたは他の光学ディスク記憶装置、および/または磁気ディスク記憶装置または他の磁気記憶デバイスのような記憶素子のアレイを備えることができる。こういった記憶媒体はコンピュータによってアクセス可能な命令の形式またはデータ構造で情報を格納し得る。通信媒体は、命令またはデータ構造の形式で所望のプログラムコードを搬送するために用いられることができおよびある場所から別の場所へのコンピュータプログラムの転送を容易にする任意の媒体を含むコンピュータによってアクセス可能な任意の媒体を備えることができる。同様に、任意の接続は適切にコンピュータ可読媒体と称される。例えば、ソフトウェアが、ウェブサイト、サーバ、または同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者線(DSL)、または赤外線、無線、および/またはマイクロ波のような無線技術を用いる他の遠隔ソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、および/またはマイクロ波のような無線技術は媒体の定義に含まれる。ここで用いられるようなディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光学ディスク、デジタル多用途ディスク(DVD)、フロッピーディスク、およびブルーレイディスクTM(ブルーレイディスクアソシエーション、ユニバーサルシティ、カリフォルニア)を含み、そこにおいて、ディスク(disk)が、通常データを磁気的に再生する一方で、ディスク(disc)は、レーザを用いて光学的にデータを再生する。上記の組み合わせはまた、コンピュータ可読媒体の範囲に含まれるべきである。
[0154]ここに記載されたような音響信号処理装置(例えば、装置A100またはMF100)は、特定の動作を制御するために会話入力を受け入れる電子デバイスに統合され得るか、そうでなければ、通信デバイスのように背景雑音から所望のノイズを分離することから利益を享受し得る。多くのアプリケーションは、多方向から生じる背景音からクリアな所望の音を拡張または分離することから利益を享受し得る。こういったアプリケーションは、音声認識と検波、会話の拡張と分離、音声活性化制御などの機能を統合する電子または計算デバイス内に人間機械インターフェースを含み得る。限定された処理機能を提供するのみのデバイスにおいて適切なこういった音響信号処理装置を実装することが望ましいはずである。
[0155]ここに記載されたモジュール、要素、およびデバイスの様々な実装の要素は、例えば同じチップ上またはチップセット内の2つ以上のチップの間に属する電子および/または光学デバイスとして組み込まれ得る、こういったデバイスの1つの例は、トランジスタまたはゲートのような固定されたまたはプログラム可能な論理要素のアレイである。ここに記載された装置の様々な実装のうちの1つまたは複数の要素は、マイクロプロセッサ、埋め込みプロセッサ、IPコア、デジタル信号プロセッサ、FPGA、ASSP、およびASICにおいて実行するように配置された命令の1つまたは複数のセットとして全体または一部に実装され得る。
[0156]装置が埋め込まれるデバイスまたはシステムの別の動作に関連するタスクのように、装置の動作に直接関係しないタスクを行いまたは他の命令のセットを実行するために用いられることが、ここに記載された装置の実装の1つまたは複数の要素にとって可能である。共通の構造を有することが、装置の実装の1つまたは複数の要素にとっても可能である(例えば、異なる時間に異なる要素に対応するコードの一部を実行するために用いられるプロセッサ、異なる時間に異なるエレメントに対応するタスクを行うために実行される命令のセット、または異なる時間に異なる要素に関する動作を行う電子および/または光学デバイスの配置)。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
オーディオ信号処理の方法であって、
前記方法は、
音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて、変換することと、
スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換すること、
を備えるオーディオ信号処理の方法。
[C2]
スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる半径を有する、C1に記載の方法。
[C3]
スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる方位角を有する、C1に記載の方法。
[C4]
スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる仰角を有する、C1に記載の方法。
[C5]
要素の前記第1の階層セットは球面調和係数を備える、C1に記載の方法。
[C6]
前記第2の変換を用いて変換することは、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換することを備えるC5に記載の方法。
[C7]
仮想オーディオチャネル情報の第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でパンニングを実行することをさらに備え、
そこにおいて、前記第1の変換を用いて変換することは、前記音場を記述する要素の前記第1の階層セットを生成するために、仮想オーディオチャネル情報の前記第1のセットを、前記第1の変換を用いて変換することを備える、C1に記載の方法。
[C8]
オーディオチャネル情報の前記第1のセット上でパンニングを実行することは、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行することを備える、C7に記載の方法。
[C9]
オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、C1に記載の方法。
[C10]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C9に記載の方法。
[C11]
オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
そこにおいて、オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる空間の領域と関連づけられ、
そこにおいて、前記方法は、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行することをさらに備える、C1に記載の方法。
[C12]
パンニングを実行することは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行することを備える、C11に記載の方法。
[C13]
仮想オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C11に記載の方法。
[C14]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C13に記載の方法。
[C15]
オーディオチャネル情報の前記第1のセットは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C1に記載の方法。
[C16]
スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、C1に記載の方法。
[C17]
スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、C1に記載の方法。
[C18]
スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、C1に記載の方法。
[C19]
スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、C1に記載の方法。
[C20]
スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、C1に記載の方法。
[C21]
スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、C1に記載の方法。
[C22]
前記第1の変換を用いて変換することは、前記音場を記述する要素の前記第1の階層セットに、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセットを、前記球面波モデルに基づく前記第1の変換を用いて、周波数領域において変換すること、を備えるC1に記載の方法。
[C23]
音場を記述する要素の第1の階層セットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上で球面波モデルに基づく第1の変換を実行し、および、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットを生成するために、要素の前記第1の階層セット上で周波数領域において第2の変換を実行するように構成される1つまたは複数のプロセッサを備える、装置。
[C24]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、C23に記載の装置。
[C25]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、C23に記載の装置。
[C26]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、C23に記載の装置。
[C27]
要素の前記第1の階層セットは球面調和係数を備える、C23に記載の装置。
[C28]
前記1つまたは複数のプロセッサは、前記第1の変換と前記第2の変換を実行するように構成されるエンコーダを備える、C23に記載の装置。
[C29]
前記1つまたは複数のプロセッサは、前記第2の変換を実行する場合、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差分を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットを生成するために、要素の前記第1の階層セット上で前記第2の変換を実行するようにさらに構成される、C28に記載の装置。
[C30]
前記1つまたは複数のプロセッサは、仮想オーディオチャネル情報の第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でパンニングを実行するようにさらに構成され、
および、そこにおいて、前記1つまたは複数のプロセッサは、前記第1の変換を用いて変換する場合、前記音場を記述する要素の前記階層セットを生成するために、仮想オーディオチャネル情報の前記第1のセットを、前記第1の変換を用いて、変換するようにさらに構成される、C23に記載の装置。
[C31]
前記1つまたは複数のプロセッサは、オーディオチャネル情報の前記第1のセット上でパンニングを実行する場合、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行するようにさらに構成される、C30に記載の装置。
[C32]
オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、C23に記載の装置。
[C33]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C32に記載の装置。
[C34]
オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
そこにおいて、オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる空間の領域と関連づけられ、
および、そこにおいて、前記1つまたは複数のプロセッサは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行するようにさらに構成される、C23に記載の装置。
[C35]
前記1つまたは複数のプロセッサは、パンニングを実行する場合、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行するようにさらに構成される、C34に記載の装置。
[C36]
仮想オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C34に記載の装置。
[C37]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C36に記載の装置。
[C38]
オーディオチャネル情報の前記第1のセットは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C23に記載の装置。
[C39]
スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、C23に記載の装置。
[C40]
スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、C23に記載の装置。
[C41]
スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、C23に記載の装置。
[C42]
スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、C23に記載の装置。
[C43]
スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、C23に記載の装置。
[C44]
スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、C23に記載の装置。
[C45]
前記1つまたは複数のプロセッサは、前記第1の変換を実行する場合、前記音場を記述する要素の前記第1の階層セットを生成するために、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセット上で周波数領域において前記第1の変換を実行するように構成される、C23に記載の装置。
[C46]
音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて、変換するための手段と、
スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換するための手段、
を備える装置。
[C47]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、C46に記載の装置。
[C48]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、C46に記載の装置。
[C49]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、C46に記載の装置。
[C50]
要素の前記第1の階層セットは球面調和係数を備える、C46に記載の装置。
[C51]
前記第2の変換を用いて変換するための手段は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換するための手段、を備えるC46に記載の装置。
[C52]
仮想オーディオチャネル情報の第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でパンニングを実行するための手段をさらに備え、
そこにおいて、前記第1の変換を用いて変換するための前記手段は、前記音場を記述する要素の前記階層セットを生成するために、仮想オーディオチャネル情報の前記第1のセットを、前記第1の変換を用いて、変換するための手段を備える、C46に記載の装置。
[C53]
オーディオチャネル情報の前記第1のセット上でパンニングを実行するための前記手段は、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行するための手段を備える、C52に記載の装置。
[C54]
オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、C46に記載の装置。
[C55]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C54に記載の装置。
[C56]
オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
そこにおいて、オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる空間の領域と関連づけられ、
および、そこにおいて、前記方法は、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行することをさらに備える、C46に記載の装置。
[C57]
パンニングを実行することは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行することを備える、C56に記載の装置。
[C58]
仮想オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C46に記載の装置。
[C59]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C58に記載の装置。
[C60]
オーディオチャネル情報の前記第1のセットは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C46に記載の装置。
[C61]
スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、C46に記載の装置。
[C62]
スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、C46に記載の装置。
[C63]
スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、C46に記載の装置。
[C64]
スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、C46に記載の装置。
[C65]
スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、C46に記載の装置。
[C66]
スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、C46に記載の装置。
[C67]
前記第1の変換を用いて変換するための前記手段は、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセットを、前記音場を記述する要素の前記第1の階層セットに、前記球面波モデルに基づく前記第1の変換を用いて、周波数領域において変換するための手段を備える、C46に記載の装置。
[C68]
その上に命令が記憶された非一時的コンピュータ可読記憶媒体であって、前記命令が実行されたとき、
音場を記述する要素の第1の階層セットに、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、球面波モデルに基づく第1の変換を用いて、変換することと、
スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換すること、
を1つまたは複数のプロセッサにさせる、非一時的コンピュータ可読記憶媒体。
[C69]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信することを備える方法であって、そこにおいて、前記ラウドスピーカーチャネルは要素の階層セットに変換されている、方法。
[C70]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標はスピーカーの第2の幾何学的配置に写像される、C69の方法。
[C71]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、C70に記載の方法。
[C72]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、C70に記載の方法。
[C73]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、C70に記載の方法。
[C74]
要素の前記第1の階層セットは球面調和係数を備える、C70に記載の方法。
[C75]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に写像される、C70に記載の方法。
[C76]
仮想ラウドスピーカーチャネルを形成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行することと、
前記音場を記述する要素の前記階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて、変換すること、
をさらに備える、C69に記載の方法。
[C77]
前記ラウドスピーカーチャネル上でパンニングを実行することは、前記仮想ラウドスピーカーチャネルを形成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C76に記載の方法。
[C78]
前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、C76に記載の方法。
[C79]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C78に記載の方法。
[C80]
仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換することと、
異なるラウドスピーカーチャネルを形成するために前記仮想ラウドスピーカーチャネル上でパンニングを実行すること、そこにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
をさらに備える、C76に記載の方法。
[C81]
パンニングを実行することは、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C80に記載の方法。
[C82]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C80に記載の方法。
[C83]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C82に記載の方法。
[C84]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C80に記載の方法。
[C85]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信するように構成された1つまたは複数のプロセッサを備える装置であって、そこにおいて、前記ラウドスピーカーチャネルは要素の階層セットに変換されている、装置。
[C86]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標はスピーカーの第2の幾何学的配置に写像される、C85に記載の装置。
[C87]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、C86に記載の装置。
[C88]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、C86に記載の装置。
[C89]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、C86に記載の装置。
[C90]
要素の前記第1の階層セットは球面調和係数を備える、C86に記載の装置。
[C91]
前記プロセッサはデコーダを備える、C86に記載の装置。
[C92]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に写像される、C91に記載の装置。
[C93]
前記1つまたは複数のプロセッサは、仮想ラウドスピーカーチャネルを形成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて前記ラウドスピーカーチャネル上でパンニングを実行し、および前記音場を記述する要素の前記階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて、変換するようにさらに構成される、C85に記載の装置。
[C94]
前記1つまたは複数のプロセッサは、前記ラウドスピーカーチャネル上でパンニングを実行する場合、前記仮想ラウドスピーカーチャネルを形成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するようにさらに構成される、C93に記載の装置。
[C95]
前記ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連づけられる、C93に記載の装置。
[C96]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C95に記載の装置。
[C97]
前記1つまたは複数のプロセッサは、前記仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換するように、および、異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行する、そこにおいて、前記異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、ように、さらに構成される、C93に記載の装置。
[C98]
前記1つまたは複数のプロセッサは、パンニングを実行する場合、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するようにさらに構成される、C97に記載の装置。
[C99]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C97に記載の装置。
[C100]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C99に記載の装置。
[C101]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、前記異なるラウドスピーカーチャネルは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C97に記載の装置。
[C102]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信するための手段、そこにおいて、前記ラウドスピーカーチャネルは要素の階層セットに変換されている、
を備える、装置。
[C103]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標はスピーカーの第2の幾何学的配置に写像される、C102に記載の装置。
[C104]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、C103に記載の装置。
[C105]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、C103に記載の装置。
[C106]
スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、C103に記載の装置。
[C107]
要素の前記第1の階層セットは球面調和係数を備える、C103に記載の装置。
[C108]
前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するためにスピーカーの前記第2の幾何学的配置に写像される、C103に記載の装置。
[C109]
仮想ラウドスピーカーチャネルを形成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行するための手段と、
前記音場を記述する要素の前記階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて、変換するための手段、
をさらに備える、C103に記載の装置。
[C110]
前記ラウドスピーカーチャネル上でパンニングを実行するための前記手段は、前記仮想ラウドスピーカーチャネルを形成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、C109に記載の装置。
[C111]
前記ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連づけられる、C109に記載の装置。
[C112]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C111に記載の装置。
[C113]
仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換するための手段と、
異なるラウドスピーカーチャネルを形成するために前記仮想ラウドスピーカーチャネル上でパンニングを実行するための手段、そこにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
をさらに備える、C109に記載の装置。
[C114]
パンニングを実行するための前記手段は、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、C113に記載の装置。
[C115]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C113に記載の装置。
[C116]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C115に記載の装置。
[C117]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C113に記載の装置。
[C118]
命令を備える非一時的コンピュータ可読記憶媒体であって、前記命令が実行されたとき、
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信すること、そこにおいて、前記ラウドスピーカーチャネルは要素の階層セットに変換されている、
を1つまたは複数のプロセッサにさせる、非一時的コンピュータ可読記憶媒体。
[C119]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信すること、そこにおいて、前記第1の幾何学的配置は前記チャネルの場所に対応する、
を備える、方法。
[C120]
スピーカーの前記第1の幾何学的配置からのオーディオチャネル情報の第1のセットは、音場を記述する要素の第1の階層セットに、第1の変換を用いて、変換される、C119に記載の方法。
[C121]
要素の前記第1の階層セットは、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、第2の変換を用いて、変換される、C120に記載の方法。
[C122]
要素の前記第1の階層セットは、スピーカーの前記第1の幾何学的配置における1つまたは複数の要素とスピーカーの前記第2の幾何学的配置における1つまたは複数の要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、前記第2の変換を用いて、変換される、C121に記載の方法。
[C123]
仮想ラウドスピーカーチャネルを形成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行することと、
前記音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換すること、
をさらに備える、C119に記載の方法。
[C124]
前記ラウドスピーカーチャネル上でパンニングを実行することは、前記仮想ラウドスピーカーチャネルを形成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C123に記載の方法。
[C125]
前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、C123に記載の方法。
[C126]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C125に記載の方法。
[C127]
仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換することと、
異なるラウドスピーカーチャネルを形成するために前記仮想ラウドスピーカーチャネル上でパンニングを実行すること、そこにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
をさらに備える、C123に記載の方法。
[C128]
パンニングを実行することは、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C127に記載の方法。
[C129]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C128に記載の方法。
[C130]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C129に記載の方法。
[C131]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C127に記載の方法。
[C132]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信する、そこにおいて、前記幾何学的配置は前記チャネルの前記場所に対応する、
ように構成された1つまたは複数のプロセッサを備える、装置。
[C133]
スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の第1のセットは、音場を記述する要素の第1の階層セットに、球面波モデルに基づく第1の変換を用いて、変換される、C132に記載の装置。
[C134]
要素の前記第1の階層セットは、スピーカーの第2の幾何学的配置からのオーディオチャネル情報の第2のセットに、球面波モデルに基づく第2の変換を用いて、周波数領域において変換される、C133に記載の装置。
[C135]
要素の前記第1の階層セットは、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、前記第2の変換を用いて、変換される、C134に記載の装置。
[C136]
前記1つまたは複数のプロセッサは、仮想ラウドスピーカーチャネルを形成するためにスピーカーの前記第1の幾何学的配置の前記座標に基づいて前記ラウドスピーカーチャネル上でパンニングを実行するように、および、前記音場を記述する要素の前記階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて、変換するように、さらに構成される、C132に記載の装置。
[C137]
前記1つまたは複数のプロセッサは、前記ラウドスピーカーチャネル上でパンニングを実行する場合、前記仮想ラウドスピーカーチャネルを形成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するように、さらに構成される、C136に記載の装置。
[C138]
前記ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連づけられる、C136に記載の装置。
[C139]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C138に記載の装置。
[C140]
前記1つまたは複数のプロセッサは、仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換するように、および、異なるラウドスピーカーチャネルを形成するために前記仮想ラウドスピーカーチャネル上でパンニングを実行する、そこにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、ように、
さらに構成される、C136に記載の装置。
[C141]
前記1つまたは複数のプロセッサは、パンニングを実行する場合、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するように、さらに構成される、C140に記載の装置。
[C142]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C140に記載の装置。
[C143]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C142に記載の装置。
[C144]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C140に記載の装置。
[C145]
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信するための手段、そこにおいて、前記幾何学的配置は前記チャネルの前記場所に対応する、
を備える装置。
[C146]
スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の第1のセットは、音場を記述する要素の第1の階層セットに、第1の変換を用いて、変換される、C145に記載の装置。
[C147]
要素の前記第1の階層セットは、スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、第2の変換を用いて、変換される、C146に記載の装置。
[C148]
要素の前記第1の階層セットは、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、第2の変換を用いて、変換される、C147に記載の装置。
[C149]
仮想ラウドスピーカーチャネルを形成するためにスピーカーの前記第1の幾何学的配置の前記座標に基づいて前記ラウドスピーカーチャネル上でパンニングを実行することと、
前記音場を記述する要素の前記階層セットを生成するために前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて、変換すること、
をさらに備える、C145に記載の装置。
[C150]
前記ラウドスピーカーチャネル上でパンニングを実行することは、前記仮想ラウドスピーカーチャネルを形成するために前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C149に記載の装置。
[C151]
前記ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連づけられる、C149に記載の装置。
[C152]
前記異なる定義をされた空間の領域は、1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C151に記載の装置。
[C153]
仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換することと、
異なるラウドスピーカーチャネルを形成するために前記仮想ラウドスピーカーチャネル上でパンニングを実行すること、そこにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
を備える、C149に記載の装置。
[C154]
パンニングを実行することは、前記異なるラウドスピーカーチャネルを形成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、C153に記載の装置。
[C155]
仮想ラウドスピーカーチャネルのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、C153に記載の装置。
[C156]
前記異なる定義をされた空間の領域は1つまたは複数のオーディオフォーマット仕様とオーディオフォーマットの標準において定義される、C155に記載の装置。
[C157]
前記ラウドスピーカーチャネルは第1の空間的な幾何学的配置と関連づけられ、および、そこにおいて、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、C153に記載の装置。
[C158]
その上に命令が記憶された非一時的コンピュータ可読記憶媒体であって、前記命令が実行されると、
スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信すること、そこにおいて、前記幾何学的配置は前記チャネルの前記場所に対応する、
を1つまたは複数のプロセッサにさせる、非一時的コンピュータ可読記憶媒体。

Claims (149)

  1. オーディオ信号処理の方法であって
    想オーディオチャネル情報の第1のセットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上でパンニングを実行することと、
    音場を記述する要素の第1の階層セットに、仮想オーディオチャネル情報の前記第1のセットを、球面波モデルに基づく第1の変換を用いて変換することと、
    スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換すること
    を備えるオーディオ信号処理の方法。
  2. スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる半径を有する、請求項1に記載の方法。
  3. スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる方位角を有する、請求項1に記載の方法。
  4. スピーカーの前記第1の幾何学的配置とスピーカーの前記第2の幾何学的配置は異なる仰角を有する、請求項1に記載の方法。
  5. 要素の前記第1の階層セットは球面調和係数を備える、請求項1に記載の方法。
  6. 前記第2の変換を用いて変換することは、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換することを備える請求項1に記載の方法。
  7. オーディオチャネル情報の前記第1のセット上でパンニングを実行することは、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行することを備える、請求項1に記載の方法。
  8. オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項1に記載の方法。
  9. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項8に記載の方法。
  10. オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
    ーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる空間の領域と関連づけられ、
    記方法は、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行することをさらに備える、請求項1に記載の方法。
  11. 仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行することは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行することを備える、請求項10に記載の方法。
  12. 仮想オーディオチャネル情報の前記第2のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項10に記載の方法。
  13. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項12に記載の方法。
  14. オーディオチャネル情報の前記第1のセットは第1の空間的な幾何学的配置と関連づけられ、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項1に記載の方法。
  15. スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、請求項1に記載の方法。
  16. スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、請求項1に記載の方法。
  17. スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、請求項1に記載の方法。
  18. スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、請求項1に記載の方法。
  19. スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、請求項1に記載の方法。
  20. スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、請求項1に記載の方法。
  21. 前記第1の変換を用いて変換することは、前記音場を記述する要素の前記第1の階層セットに、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセットを、前記球面波モデルに基づく前記第1の変換を用いて、周波数領域において変換すること、を備える、請求項1に記載の方法。
  22. 装置であって、
    オーディオデータを格納するように構成されたメモリと、
    前記オーディオデータの少なくとも一部分を処理するための1つ以上のプロセッサと、
    を備え、前記1つ以上のプロセッサは、
    仮想オーディオチャネル情報の第1のセットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上でパンニングを実行し、音場を記述する要素の第1の階層セットを生成するために、仮想オーディオチャネル情報の前記第1のセット上で球面波モデルに基づく第1の変換を実行し、
    スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットを生成するために、要素の前記第1の階層セット上で周波数領域において第2の変換を実行する
    ように構成される、装置。
  23. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、請求項22に記載の装置。
  24. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、請求項22に記載の装置。
  25. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、請求項22に記載の装置。
  26. 要素の前記第1の階層セットは球面調和係数を備える、請求項22に記載の装置。
  27. 前記1つ以上のプロセッサは、前記第1の変換と前記第2の変換を実行するように構成されるエンコーダを備える、請求項22に記載の装置。
  28. 前記1つ以上のプロセッサは、前記第2の変換を実行するとき、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットを生成するために、要素の前記第1の階層セット上で前記第2の変換を実行するようにさらに構成される、請求項27に記載の装置。
  29. 前記1つ以上のプロセッサは、オーディオチャネル情報の前記第1のセット上でパンニングを実行するとき、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行するようにさらに構成される、請求項22に記載の装置。
  30. オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項22に記載の装置。
  31. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項30に記載の装置。
  32. オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
    オーディオチャネル情報の前記第2のセットのそれぞれは、対応する異なる空間の領域と関連づけられ、
    前記1つ以上のプロセッサは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行するようにさらに構成される、請求項23に記載の装置。
  33. 前記1つ以上のプロセッサは、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行するとき、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行するようにさらに構成される、請求項32に記載の装置。
  34. 仮想オーディオチャネル情報の前記第2のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項32に記載の装置。
  35. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項34に記載の装置。
  36. オーディオチャネル情報の前記第1のセットは、第1の空間的な幾何学的配置と関連づけられ、オーディオチャネル情報の前記第2のセットは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項22に記載の装置。
  37. スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、請求項22に記載の装置。
  38. スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、請求項22に記載の装置。
  39. スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、請求項22に記載の装置。
  40. スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、請求項22に記載の装置。
  41. スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、請求項22に記載の装置。
  42. スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、請求項22に記載の装置。
  43. 前記1つ以上のプロセッサは、前記第1の変換を実行するとき、前記音場を記述する要素の前記第1の階層セットを生成するために、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセット上で周波数領域において前記第1の変換を実行するように構成される、請求項22に記載の装置。
  44. 装置であって、
    仮想オーディオチャネル情報の第1のセットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上でパンニングを実行するための手段と、
    音場を記述する要素の第1の階層セットに、仮想オーディオチャネル情報の前記第1のセットを、球面波モデルに基づく第1の変換を用いて変換するための手段と、
    スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換するための手段
    備える装置。
  45. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、請求項44に記載の装置。
  46. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有しする、請求項44に記載の装置。
  47. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、請求項44に記載の装置。
  48. 要素の前記第1の階層セットは球面調和係数を備える、請求項44に記載の装置。
  49. 前記第2の変換を用いて変換するための前記手段は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換するための手段、を備える、請求項44に記載の装置。
  50. オーディオチャネル情報の前記第1のセット上でパンニングを実行するための前記手段は、仮想オーディオチャネル情報の前記第1のセットを生成するために、オーディオチャネル情報の前記第1のセット上でベクトルベースの振幅パンニングを実行するための手段を備える、請求項44に記載の装置。
  51. オーディオチャネル情報の前記第1のセットのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項44に記載の装置。
  52. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項51に記載の装置。
  53. オーディオチャネル情報の前記第2のセットは仮想オーディオチャネル情報の第2のセットを備え、
    ーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる空間の領域と関連づけられ、
    前記装置は、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行するための手段をさらに備える、請求項44に記載の装置。
  54. 仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行することは、オーディオチャネル情報の前記第2のセットを生成するために、仮想オーディオチャネル情報の前記第2のセット上でベクトルベースの振幅パンニングを実行することを備える、請求項53に記載の装置。
  55. 仮想オーディオチャネル情報の前記第2のセットのそれぞれは対応する異なる定義をされた空間の領域と関連付けられる、請求項44に記載の装置。
  56. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項55に記載の装置。
  57. オーディオチャネル情報の前記第1のセットは第1の空間的な幾何学的配置と関連づけられ、オーディオチャネル情報の前記第2のセットは前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項44に記載の装置。
  58. スピーカーの前記第1の幾何学的配置は正方形の幾何学的配置である、請求項44に記載の装置。
  59. スピーカーの前記第1の幾何学的配置は長方形の幾何学的配置である、請求項44に記載の装置。
  60. スピーカーの前記第1の幾何学的配置は球形の幾何学的配置である、請求項44に記載の装置。
  61. スピーカーの前記第2の幾何学的配置は正方形の幾何学的配置である、請求項44に記載の装置。
  62. スピーカーの前記第2の幾何学的配置は長方形の幾何学的配置である、請求項44に記載の装置。
  63. スピーカーの前記第2の幾何学的配置は球形の幾何学的配置である、請求項44に記載の装置。
  64. 前記第1の変換を用いて変換するための前記手段は、前記音場を記述する要素の前記第1の階層セットに、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の前記第1のセットを、前記球面波モデルに基づく前記第1の変換を用いて、周波数領域において変換するための手段を備える、請求項44に記載の装置。
  65. 命令が記憶されたコンピュータ可読記憶媒体であって、前記命令が実行されたとき、
    仮想オーディオチャネル情報の第1のセットを生成するために、スピーカーの第1の幾何学的配置に関するオーディオチャネル情報の第1のセット上でパンニングを実行することと、
    音場を記述する要素の第1の階層セットに、仮想オーディオチャネル情報の前記第1のセットを、球面波モデルに基づく第1の変換を用いて変換することと、
    スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の前記第1の階層セットを、第2の変換を用いて、周波数領域において変換すること
    を1つ以上のプロセッサに行わせる、コンピュータ可読記憶媒体。
  66. 方法であって、
    スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信することと、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行することと、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換することと
    を備える、方法。
  67. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの第2の幾何学的配置に写像される、請求項66の方法。
  68. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、請求項67に記載の方法。
  69. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、請求項67に記載の方法。
  70. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、請求項67に記載の方法。
  71. 要素の前記第1の階層セットは球面調和係数を備える、請求項67に記載の方法。
  72. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に写像される、請求項67に記載の方法。
  73. 前記ラウドスピーカーチャネル上でパンニングを実行することは、前記仮想ラウドスピーカーチャネルを生成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、請求項66に記載の方法。
  74. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項66に記載の方法。
  75. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項74に記載の方法。
  76. 仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換することと、
    異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行することと、ここにおいて、前記異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
    をさらに備える、請求項66に記載の方法。
  77. 前記仮想ラウドスピーカーチャネル上でパンニングを実行することは、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、請求項76に記載の方法。
  78. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項76に記載の方法。
  79. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項78に記載の方法。
  80. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項76に記載の方法。
  81. 装置であって、
    オーディオデータを格納するように構成されたメモリと、
    前記オーディオデータの少なくとも一部分を処理するための1つ以上のプロセッサと、
    を備え、前記1つ以上のプロセッサは、
    スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信し、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの前記第1の幾何学的配置の座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行し、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換する
    ように構成される、装置。
  82. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの第2の幾何学的配置に写像される、請求項81に記載の装置。
  83. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、請求項82に記載の装置。
  84. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、請求項82に記載の装置。
  85. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、請求項82に記載の装置。
  86. 要素の第1の階層セットは球面調和係数を備える、請求項82に記載の装置。
  87. 前記プロセッサはデコーダを備える、請求項82に記載の装置。
  88. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に写像される、請求項87に記載の装置。
  89. 前記1つ以上のプロセッサは、前記ラウドスピーカーチャネル上でパンニングを実行するとき、前記仮想ラウドスピーカーチャネルを生成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するようにさらに構成される、請求項81に記載の装置。
  90. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項81に記載の装置。
  91. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項90に記載の装置。
  92. 前記1つ以上のプロセッサは、前記仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換し、および、異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行するようにさらに構成され、ここにおいて、前記異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、請求項81に記載の装置。
  93. 前記1つ以上のプロセッサは、仮想オーディオチャネル情報の前記第2のセット上でパンニングを実行するとき、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するようにさらに構成される、請求項92に記載の装置。
  94. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項92に記載の装置。
  95. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項94に記載の装置。
  96. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項92に記載の装置。
  97. 装置であって、
    スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信するための手段と、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの前記第1の幾何学的配置の前記座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行するための手段と、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換するための手段と
    を備える、装置。
  98. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの第2の幾何学的配置に写像される、請求項97に記載の装置。
  99. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる半径を有する、請求項98に記載の装置。
  100. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる方位角を有する、請求項98に記載の装置。
  101. スピーカーの前記第1の幾何学的配置と前記第2の幾何学的配置は異なる仰角を有する、請求項98に記載の装置。
  102. 要素の第1の階層セットは球面調和係数を備える、請求項98に記載の装置。
  103. 前記ラウドスピーカーチャネルと前記第1の幾何学的配置の座標は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するために、スピーカーの前記第2の幾何学的配置に写像される、請求項98に記載の装置。
  104. 前記ラウドスピーカーチャネル上でパンニングを実行するための前記手段は、前記仮想ラウドスピーカーチャネルを生成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、請求項98に記載の装置。
  105. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項98に記載の装置。
  106. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項105に記載の装置。
  107. 仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換するための手段と、
    異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行するための手段と、ここにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
    をさらに備える、請求項98に記載の装置。
  108. 前記仮想ラウドスピーカーチャネル上でパンニングを実行するための前記手段は、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、請求項107に記載の装置。
  109. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項107に記載の装置。
  110. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項109に記載の装置。
  111. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項107に記載の装置。
  112. 命令を備えるコンピュータ可読記憶媒体であって、前記命令が実行されたとき、
    スピーカーの第1の幾何学的配置の座標と共にラウドスピーカーチャネルを受信することと、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの前記第1の幾何学的配置の座標に基づいて、前記ラウドスピーカーチャネル上でパンニングを実行することと、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換することと
    を1つ以上のプロセッサに行わせる、コンピュータ可読記憶媒体。
  113. 方法であって、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの第1の幾何学的配置の座標に基づいて、ラウドスピーカーチャネル上でパンニングを実行することと、ここにおいて、前記第1の幾何学的配置は、前記仮想ラウドスピーカーチャネルの場所に対応する、
    スピーカーの前記第1の幾何学的配置の前記座標と共にラウドスピーカーチャネルを送信することと、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換することと
    を備える、方法。
  114. 前記音場を記述する要素の前記階層セットは、スピーカーの前記第1の幾何学的配置からオーディオチャネル情報の第1のセットに、前記第1の変換を用いて変換することを備える、請求項113に記載の方法。
  115. スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の第1の階層セットを、第2の変換を用いて変換することをさらに備える、請求項114に記載の方法。
  116. スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換することは、スピーカーの第1の幾何学的配置における1つ以上の要素とスピーカーの第2の幾何学的配置における1つ以上の要素の間の位置の差異を補償すること備える、請求項115に記載の方法。
  117. 前記ラウドスピーカーチャネル上でパンニングを実行することは、前記仮想ラウドスピーカーチャネルを生成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、請求項113に記載の方法。
  118. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項113に記載の方法。
  119. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項118に記載の方法。
  120. 前記仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換することと、
    異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行すること、ここにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
    をさらに備える、請求項113に記載の方法。
  121. 前記仮想ラウドスピーカーチャネル上でパンニングを実行することは、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行することを備える、請求項120に記載の方法。
  122. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項121に記載の方法。
  123. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項122に記載の方法。
  124. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項120に記載の方法。
  125. 装置であって、
    オーディオデータを格納するように構成されたメモリと、
    前記オーディオデータの少なくとも一部分を処理するための1つ以上のプロセッサと、
    を備え、前記1つ以上のプロセッサは、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの第1の幾何学的配置の座標に基づいて、ラウドスピーカーチャネル上でパンニングを実行すし、ここにおいて、スピーカーの前記第1の幾何学的配置は、前記仮想ラウドスピーカーチャネルの場所に対応する、
    スピーカーの前記第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信する、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換する
    ように構成される、装置。
  126. 前記音場を記述する要素の前記階層セットを生成するために、前記1つ以上のプロセッサは、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、前記第1の変換を用いて変換するように構成される、請求項125に記載の装置。
  127. 前記1つ以上のプロセッサは、スピーカーの第2の幾何学的配置からのオーディオチャネル情報の第2のセットに、周波数領域において要素の第1の階層セットを、第2の変換を用いて変換するようにさらに構成される、請求項126に記載の装置。
  128. スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換するために、前記1つ以上のプロセッサは、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するように構成される、請求項127に記載の装置。
  129. 前記1つ以上のプロセッサは、前記ラウドスピーカーチャネル上でパンニングを実行するとき、前記仮想ラウドスピーカーチャネルを生成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するようにさらに構成される、請求項125に記載の装置。
  130. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項125に記載の装置。
  131. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項130に記載の装置。
  132. 前記1つ以上のプロセッサは、仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換し、および、異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行するようにさらに構成され、ここにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、請求項125に記載の装置。
  133. 前記1つ以上のプロセッサは、前記仮想ラウドスピーカーチャネル上でパンニングを実行するとき、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するように、さらに構成される、請求項132に記載の装置。
  134. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項132に記載の装置。
  135. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項134に記載の装置。
  136. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項135に記載の装置。
  137. 装置であって、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの第1の幾何学的配置の座標に基づいて、ラウドスピーカーチャネル上でパンニングを実行するための手段と、ここにおいて、前記第1の幾何学的配置は、前記仮想ラウドスピーカーチャネルの場所に対応する、
    スピーカーの前記第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信するための手段と、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換するための手段と
    を備える、装置。
  138. 前記仮想ラウドスピーカーチャネルを変換するための前記手段は、スピーカーの前記第1の幾何学的配置に関するオーディオチャネル情報の第1のセットを、前記第1の変換を用いて変換するための手段を備える、請求項137に記載の装置。
  139. スピーカーの第2の幾何学的配置に関するオーディオチャネル情報の第2のセットに、要素の第1の階層セットを、第2の変換を用いて変換するための手段を備える、請求項138に記載の装置。
  140. スピーカーの前記第2の幾何学的配置に関するオーディオチャネル情報の前記第2のセットに、要素の前記第1の階層セットを、前記第2の変換を用いて変換するための前記手段は、スピーカーの前記第1の幾何学的配置における要素とスピーカーの前記第2の幾何学的配置における要素の間の位置の差異を補償するための手段を備える、請求項139に記載の装置。
  141. 前記ラウドスピーカーチャネル上でパンニングを実行するための前記手段は、前記仮想ラウドスピーカーチャネルを生成するために、前記ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、請求項137に記載の装置。
  142. 前記ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連づけられる、請求項137に記載の装置。
  143. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項142に記載の装置。
  144. 仮想ラウドスピーカーチャネルに、要素の前記階層セットを、球面波モデルに基づく第2の変換を用いて、周波数領域において変換するための手段と、
    異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でパンニングを実行するための手段と、ここにおいて、異なるラウドスピーカーチャネルのそれぞれは、対応する異なる空間の領域と関連づけられる、
    をさらに備える、請求項137に記載の装置。
  145. 前記仮想ラウドスピーカーチャネル上でパンニングを実行するための前記手段は、前記異なるラウドスピーカーチャネルを生成するために、前記仮想ラウドスピーカーチャネル上でベクトルベースの振幅パンニングを実行するための手段を備える、請求項144に記載の装置。
  146. 前記仮想ラウドスピーカーチャネルのそれぞれは、対応する異なる定義をされた空間の領域と関連付けられる、請求項144に記載の装置。
  147. 前記異なる定義をされた空間の領域は、オーディオフォーマット仕様とオーディオフォーマットの標準の1つ以上で定義される、請求項146に記載の装置。
  148. 前記ラウドスピーカーチャネルは、第1の空間的な幾何学的配置と関連づけられ、前記異なるラウドスピーカーチャネルは、前記第1の空間的な幾何学的配置と異なる第2の空間的な幾何学的配置と関連づけられる、請求項144に記載の装置。
  149. 命令が記憶されたコンピュータ可読記憶媒体であって、前記命令が実行されたとき、
    仮想ラウドスピーカーチャネルを生成するために、スピーカーの第1の幾何学的配置の座標に基づいて、ラウドスピーカーチャネル上でパンニングを実行することと、ここにおいて、前記第1の幾何学的配置は、前記仮想ラウドスピーカーチャネルの場所に対応する、
    スピーカーの前記第1の幾何学的配置の座標と共にラウドスピーカーチャネルを送信することと、
    音場を記述する要素の階層セットを生成するために、前記仮想ラウドスピーカーチャネルを、球面波モデルに基づく第1の変換を用いて変換することと
    を1つ以上のプロセッサに行わせる、コンピュータ可読記憶媒体。
JP2015523177A 2012-07-16 2013-07-16 3dオーディオ階層符号化を用いたラウドスピーカーの位置補償 Expired - Fee Related JP6092387B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261672280P 2012-07-16 2012-07-16
US61/672,280 2012-07-16
US201361754416P 2013-01-18 2013-01-18
US61/754,416 2013-01-18
US13/942,657 US9473870B2 (en) 2012-07-16 2013-07-15 Loudspeaker position compensation with 3D-audio hierarchical coding
US13/942,657 2013-07-15
PCT/US2013/050648 WO2014014891A1 (en) 2012-07-16 2013-07-16 Loudspeaker position compensation with 3d-audio hierarchical coding

Publications (3)

Publication Number Publication Date
JP2015527821A JP2015527821A (ja) 2015-09-17
JP2015527821A5 JP2015527821A5 (ja) 2017-01-26
JP6092387B2 true JP6092387B2 (ja) 2017-03-08

Family

ID=49914013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015523177A Expired - Fee Related JP6092387B2 (ja) 2012-07-16 2013-07-16 3dオーディオ階層符号化を用いたラウドスピーカーの位置補償

Country Status (8)

Country Link
US (1) US9473870B2 (ja)
EP (1) EP2873254B1 (ja)
JP (1) JP6092387B2 (ja)
KR (1) KR101759005B1 (ja)
CN (1) CN104429102B (ja)
BR (1) BR112015001001A2 (ja)
IN (1) IN2014MN02630A (ja)
WO (1) WO2014014891A1 (ja)

Families Citing this family (106)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202509B2 (en) 2006-09-12 2015-12-01 Sonos, Inc. Controlling and grouping in a multi-zone media system
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US8788080B1 (en) 2006-09-12 2014-07-22 Sonos, Inc. Multi-channel pairing in a media system
US8923997B2 (en) 2010-10-13 2014-12-30 Sonos, Inc Method and apparatus for adjusting a speaker system
US11265652B2 (en) 2011-01-25 2022-03-01 Sonos, Inc. Playback device pairing
US11429343B2 (en) 2011-01-25 2022-08-30 Sonos, Inc. Stereo playback configuration and control
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US8811630B2 (en) 2011-12-21 2014-08-19 Sonos, Inc. Systems, methods, and apparatus to filter audio
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US9729115B2 (en) 2012-04-27 2017-08-08 Sonos, Inc. Intelligently increasing the sound level of player
US9524098B2 (en) 2012-05-08 2016-12-20 Sonos, Inc. Methods and systems for subwoofer calibration
USD721352S1 (en) 2012-06-19 2015-01-20 Sonos, Inc. Playback device
US9690539B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration user interface
US9668049B2 (en) 2012-06-28 2017-05-30 Sonos, Inc. Playback device calibration user interfaces
US9690271B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2875511B1 (en) 2012-07-19 2018-02-21 Dolby International AB Audio coding for improving the rendering of multi-channel audio signals
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
US8965033B2 (en) 2012-08-31 2015-02-24 Sonos, Inc. Acoustic optimization
BR122021021503B1 (pt) * 2012-09-12 2023-04-11 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d
US9008330B2 (en) 2012-09-28 2015-04-14 Sonos, Inc. Crossover frequency adjustments for audio speakers
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
USD721061S1 (en) 2013-02-25 2015-01-13 Sonos, Inc. Playback device
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9226087B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9226073B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
CN117253494A (zh) * 2014-03-21 2023-12-19 杜比国际公司 用于对压缩的hoa信号进行解码的方法、装置和存储介质
WO2015147433A1 (ko) * 2014-03-25 2015-10-01 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
US9367283B2 (en) 2014-07-22 2016-06-14 Sonos, Inc. Audio settings
USD883956S1 (en) 2014-08-13 2020-05-12 Sonos, Inc. Playback device
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9891881B2 (en) 2014-09-09 2018-02-13 Sonos, Inc. Audio processing algorithm database
US10127006B2 (en) 2014-09-09 2018-11-13 Sonos, Inc. Facilitating calibration of an audio playback device
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
EP3208801A4 (en) * 2014-10-16 2018-03-28 Sony Corporation Transmitting device, transmission method, receiving device, and receiving method
WO2016066743A1 (en) 2014-10-31 2016-05-06 Dolby International Ab Parametric encoding and decoding of multichannel audio signals
US9973851B2 (en) 2014-12-01 2018-05-15 Sonos, Inc. Multi-channel playback of audio content
US10664224B2 (en) 2015-04-24 2020-05-26 Sonos, Inc. Speaker calibration user interface
WO2016172593A1 (en) 2015-04-24 2016-10-27 Sonos, Inc. Playback device calibration user interfaces
USD768602S1 (en) 2015-04-25 2016-10-11 Sonos, Inc. Playback device
USD886765S1 (en) 2017-03-13 2020-06-09 Sonos, Inc. Media playback device
US20170085972A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Media Player and Media Player Design
USD920278S1 (en) 2017-03-13 2021-05-25 Sonos, Inc. Media playback device with lights
USD906278S1 (en) 2015-04-25 2020-12-29 Sonos, Inc. Media player device
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
TWI607655B (zh) 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program
US9729118B2 (en) 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US9538305B2 (en) 2015-07-28 2017-01-03 Sonos, Inc. Calibration error conditions
EP3329486B1 (en) * 2015-07-30 2020-07-29 Dolby International AB Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation
US12087311B2 (en) 2015-07-30 2024-09-10 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding an HOA representation
US9736610B2 (en) 2015-08-21 2017-08-15 Sonos, Inc. Manipulation of playback device response using signal processing
US9712912B2 (en) 2015-08-21 2017-07-18 Sonos, Inc. Manipulation of playback device response using an acoustic filter
CN108028985B (zh) 2015-09-17 2020-03-13 搜诺思公司 用于计算设备的方法
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
USD1043613S1 (en) 2015-09-17 2024-09-24 Sonos, Inc. Media player
US9961467B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
US10249312B2 (en) * 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
US9961475B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
US10070094B2 (en) * 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US9886234B2 (en) 2016-01-28 2018-02-06 Sonos, Inc. Systems and methods of distributing audio to one or more playback devices
US9949052B2 (en) 2016-03-22 2018-04-17 Dolby Laboratories Licensing Corporation Adaptive panner of audio objects
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
HK1219390A2 (zh) 2016-07-28 2017-03-31 Siremix Gmbh 終端混音設備
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
GB2554446A (en) 2016-09-28 2018-04-04 Nokia Technologies Oy Spatial audio signal format generation from a microphone array using adaptive capture
US10412473B2 (en) 2016-09-30 2019-09-10 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
USD851057S1 (en) 2016-09-30 2019-06-11 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
USD827671S1 (en) 2016-09-30 2018-09-04 Sonos, Inc. Media playback device
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
CA3043444A1 (en) 2016-10-19 2018-04-26 Audible Reality Inc. System for and method of generating an audio image
US10721578B2 (en) * 2017-01-06 2020-07-21 Microsoft Technology Licensing, Llc Spatial audio warp compensator
GB2563635A (en) 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
US10609485B2 (en) * 2017-09-29 2020-03-31 Apple Inc. System and method for performing panning for an arbitrary loudspeaker setup
GB2566992A (en) 2017-09-29 2019-04-03 Nokia Technologies Oy Recording and rendering spatial audio signals
US11004457B2 (en) * 2017-10-18 2021-05-11 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
US11606663B2 (en) 2018-08-29 2023-03-14 Audible Reality Inc. System for and method of controlling a three-dimensional audio engine
SG11202007627RA (en) * 2018-10-08 2020-09-29 Dolby Laboratories Licensing Corp Transforming audio signals captured in different formats into a reduced number of formats for simplifying encoding and decoding operations
KR102599744B1 (ko) 2018-12-07 2023-11-08 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 방향 컴포넌트 보상을 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램
CN111757240B (zh) * 2019-03-26 2021-08-20 瑞昱半导体股份有限公司 音频处理方法与音频处理系统
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN115376527A (zh) * 2021-05-17 2022-11-22 华为技术有限公司 三维音频信号编码方法、装置和编码器
CN115376528A (zh) * 2021-05-17 2022-11-22 华为技术有限公司 三维音频信号编码方法、装置和编码器
DE102021122597A1 (de) 2021-09-01 2023-03-02 Synotec Psychoinformatik Gmbh Mobiler, immersiver 3D-Audioraum
WO2024076829A1 (en) * 2022-10-05 2024-04-11 Dolby Laboratories Licensing Corporation A method, apparatus, and medium for encoding and decoding of audio bitstreams and associated echo-reference signals

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09244663A (ja) 1996-03-04 1997-09-19 Taimuuea:Kk 過渡応答信号生成方法、音響再生方法及び装置
US6577738B2 (en) 1996-07-17 2003-06-10 American Technology Corporation Parametric virtual speaker and surround-sound system
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
CA2406926A1 (en) * 2000-04-19 2001-11-01 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030007648A1 (en) * 2001-04-27 2003-01-09 Christopher Currell Virtual audio system and techniques
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US7558393B2 (en) 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
JP5032977B2 (ja) 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
US20090313029A1 (en) 2006-07-14 2009-12-17 Anyka (Guangzhou) Software Technologiy Co., Ltd. Method And System For Backward Compatible Multi Channel Audio Encoding and Decoding with the Maximum Entropy
AU2007322488B2 (en) 2006-11-24 2010-04-29 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
GB0817950D0 (en) * 2008-10-01 2008-11-05 Univ Southampton Apparatus and method for sound reproduction
US8332229B2 (en) 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
GB2476747B (en) 2009-02-04 2011-12-21 Richard Furse Sound system
JP5163545B2 (ja) 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
EP2539892B1 (fr) 2010-02-26 2014-04-02 Orange Compression de flux audio multicanal
WO2011117399A1 (en) 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
NZ587483A (en) 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
US9271081B2 (en) 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
US20120093323A1 (en) 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
WO2013068402A1 (en) 2011-11-10 2013-05-16 Sonicemotion Ag Method for practical implementations of sound field reproduction based on surface integrals in three dimensions
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9288603B2 (en) * 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
CN107071687B (zh) 2012-07-16 2020-02-14 杜比国际公司 用于渲染音频声场表示以供音频回放的方法和设备
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2875511B1 (en) * 2012-07-19 2018-02-21 Dolby International AB Audio coding for improving the rendering of multi-channel audio signals
US9761229B2 (en) * 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9131298B2 (en) * 2012-11-28 2015-09-08 Qualcomm Incorporated Constrained dynamic amplitude panning in collaborative sound systems
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups

Also Published As

Publication number Publication date
KR20150038048A (ko) 2015-04-08
WO2014014891A1 (en) 2014-01-23
KR101759005B1 (ko) 2017-07-17
US20140016802A1 (en) 2014-01-16
JP2015527821A (ja) 2015-09-17
EP2873254B1 (en) 2017-11-29
CN104429102B (zh) 2017-12-15
BR112015001001A2 (pt) 2017-06-27
EP2873254A1 (en) 2015-05-20
CN104429102A (zh) 2015-03-18
IN2014MN02630A (ja) 2015-10-16
US9473870B2 (en) 2016-10-18

Similar Documents

Publication Publication Date Title
JP6092387B2 (ja) 3dオーディオ階層符号化を用いたラウドスピーカーの位置補償
JP6105062B2 (ja) 後方互換性のあるオーディオ符号化のためのシステム、方法、装置、およびコンピュータ可読媒体
US10674262B2 (en) Merging audio signals with spatial metadata
CN107533843B (zh) 用于捕获、编码、分布和解码沉浸式音频的系统和方法
TWI611706B (zh) 將虛擬揚聲器映射至實體揚聲器
WO2014014757A1 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
CN118522297A (zh) 将以不同格式捕获的音频信号转换为减少数量的格式以简化编码及解码操作
US20200120438A1 (en) Recursively defined audio metadata
US20240119945A1 (en) Audio rendering system and method, and electronic device
EP3808106A1 (en) Spatial audio capture, transmission and reproduction
TW202105164A (zh) 用於低頻率效應之音訊呈現
US20240119946A1 (en) Audio rendering system and method and electronic device
EP3803860A1 (en) Spatial audio parameters
TW201517022A (zh) 球面諧波係數之寫碼
EP3987824B1 (en) Audio rendering for low frequency effects

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160617

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161208

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20161208

TRDD Decision of grant or rejection written
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20161227

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170208

R150 Certificate of patent or registration of utility model

Ref document number: 6092387

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees