JP2016509820A - 仮想スピーカーを物理スピーカーにマッピングすること - Google Patents

仮想スピーカーを物理スピーカーにマッピングすること Download PDF

Info

Publication number
JP2016509820A
JP2016509820A JP2015557126A JP2015557126A JP2016509820A JP 2016509820 A JP2016509820 A JP 2016509820A JP 2015557126 A JP2015557126 A JP 2015557126A JP 2015557126 A JP2015557126 A JP 2015557126A JP 2016509820 A JP2016509820 A JP 2016509820A
Authority
JP
Japan
Prior art keywords
speakers
renderer
virtual
physical
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015557126A
Other languages
English (en)
Other versions
JP2016509820A5 (ja
JP6284955B2 (ja
Inventor
ペーターズ、ニルス・グンサー
モーレール、マーティン・ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016509820A publication Critical patent/JP2016509820A/ja
Publication of JP2016509820A5 publication Critical patent/JP2016509820A5/ja
Application granted granted Critical
Publication of JP6284955B2 publication Critical patent/JP6284955B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

概して、物理スピーカーのうちの1つに対する仮想スピーカーのうちの1つの相対的位置に基づいて仮想スピーカーのうちの1つの位置を最初に調整させる、仮想スピーカーを物理スピーカーにマッピングするための技法について説明される。1つまたは複数のプロセッサを備えるデバイスが本技法を実行し得る。1つまたは複数のプロセッサは、幾何学的配置で配置された複数の仮想スピーカーのうちの1つと複数の物理スピーカーのうちの1つとの間の位置の差を決定することと、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整することとを行うように構成され得る。

Description

[0001] 本出願は、2013年5月31日に出願された米国仮出願第61/829,832号および2013年2月7日に出願された米国仮出願第61/762,302号の利益を主張する。
[0002] 本開示は、オーディオレンダリング(audio rendering)に関し、より詳細には、球面調和係数(spherical harmonic coefficient)のレンダリングに関する。
[0003] 高次アンビソニックス(HOA:higher order ambisonics)信号(しばしば複数の球面調和係数(SHC:spherical harmonic coefficient)または他の階層要素(hierarchical element)によって表される)は、音場の3次元表現である。このHOAまたはSHC表現は、このSHC信号からレンダリングされたマルチチャネルオーディオ信号を再生するために使用されるローカルスピーカー幾何学的配置(local speaker geometry)に依存しない様式でこの音場を表し得る。このSHC信号はまた、このSHC信号が、5.1オーディオチャネルフォーマットまたは7.1オーディオチャネルフォーマットなど、よく知られ大いに採用されているマルチチャネルフォーマットにレンダリングされ得るような後方互換性を可能にし得る。SHC表現は、したがって、後方互換性にも適応する音場のより良い表現を可能にする。
[0004] 概して、特定のローカルスピーカー幾何学的配置に適するオーディオレンダラを決定するための技法について説明される。SHCはよく知られているマルチチャネルスピーカーフォーマットに適応し得るが、通常、エンドユーザリスナーは、これらのマルチチャネルフォーマットによって要求される様式でスピーカーを適切に置いたりまたは配置したりせず、その結果、不規則なスピーカー幾何学的配置(irregular speaker geometry)が生じる。本開示で説明される技法は、ローカルスピーカー幾何学的配置を決定し、次いで、このローカルスピーカー幾何学的配置に基づいてSHC信号をレンダリングするためのレンダラを決定し得る。レンダリングデバイスは、いくつかの異なるレンダラ、たとえば、モノレンダラ、ステレオレンダラ、水平専用レンダラまたは3次元レンダラの中から選択し、ローカルスピーカー幾何学的配置に基づいてこのレンダラを生成し得る。このレンダラは、不規則なスピーカー幾何学的配置を考慮し、それによって、規則的なスピーカー幾何学的配置(regular speaker geometry)のために設計された規則的なレンダラと比較して不規則なスピーカー幾何学的配置にもかかわらず、音場のより良い再現を可能にし得る。
[0005] その上、本技法は、可逆性を維持しSHCを復元するように、仮想スピーカー幾何学的配置(virtual speaker geometry)と呼ばれ得る、均一なスピーカー幾何学的配置にレンダリングし得る。本技法は、その場合、これらの仮想スピーカーを(仮想スピーカーが最初に配置された水平面とは異なる仰角(elevation)であり得る)様々な水平面に投射(project)するための様々な動作を実行し得る。本技法は、デバイスが、これらの投射された仮想スピーカーを、不規則なスピーカー幾何学的配置で配置された様々な物理スピーカーにマッピングするレンダラを生成することを可能にし得る。これらの仮想スピーカーをこのように投射することは、音場のより良い再現を可能にし得る。
[0006] 一例では、方法が、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定することと、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定することとを備える。
別の例では、デバイスが、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定することと、決定されたローカルスピーカー幾何学的配置に基づいて動作するようにデバイスを構成することとを行うように構成された1つまたは複数のプロセッサを備える。
[0007] 別の例では、デバイスが、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するための手段と、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定するための手段とを備える。
[0008] 別の例では、非一時的コンピュータ可読記憶媒体は、実行されたとき、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定することと、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定することとを1つまたは複数のプロセッサに行わせる命令を記憶している。
[0009] 別の例では、方法が、複数の物理スピーカーのうちの1つと幾何学的配置で配置された複数の仮想スピーカーのうちの1つとの間の位置の差を決定することと、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整することとを備える。
[0010] 別の例では、デバイスが、複数の物理スピーカーのうちの1つと幾何学的配置で配置された複数の仮想スピーカーのうちの1つとの間の位置の差を決定することと、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整することとを行うように構成された1つまたは複数のプロセッサを備える。
[0011] 別の例では、デバイスが、複数の物理スピーカーのうちの1つと幾何学的配置で配置された複数の仮想スピーカーのうちの1つとの間の位置の差を決定するための手段と、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整するための手段とを備える。
[0012] 別の例では、非一時的コンピュータ可読記憶媒体は、実行されたとき、複数の物理スピーカーのうちの1つと幾何学的配置で配置された複数の仮想スピーカーのうちの1つとの間の位置の差を決定することと、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整することとを1つまたは複数のプロセッサに行わせる命令を記憶している。
[0013] 本技法の1つまたは複数の態様の詳細が添付の図面および以下の説明に記載されている。これらの技法の他の特徴、目的、および利点は、その説明および図面から、また特許請求の範囲から明らかになろう。
[0014] 様々な次数および副次数の球面調和基底関数を示す図。 様々な次数および副次数の球面調和基底関数を示す図。 [0015] 本開示で説明される技法の様々な態様を実装し得るシステムを示す図。 [0016] 本開示で説明される技法の様々な態様を実装し得るシステムを示す図。 [0017] 本開示で説明される技法の様々な態様を実施する際の、図4の例に示されたレンダラ決定ユニットの例示的な動作を示す流れ図。 [0018] 図4の例に示されたステレオレンダラ生成ユニットの例示的な動作を示す流れ図。 [0019] 図4の例に示された水平レンダラ生成ユニットの例示的な動作を示す流れ図。 [0020] 図4の例に示された3Dレンダラ生成ユニットの例示的な動作を示す流れ図。 図4の例に示された3Dレンダラ生成ユニットの例示的な動作を示す流れ図。 [0021] 不規則な3Dレンダラを決定するときに下半球処理と上半球処理とを実行する際の、図4の例に示された3Dレンダラ生成ユニットの例示的な動作を示す流れ図。 [0022] 本開示に記載された技法に従ってどのようにステレオレンダラが生成され得るかを示すユニット空間におけるグラフ299を示す図。 [0023] 本開示に記載された技法に従ってどのように不規則な水平レンダラが生成され得るかを示すユニット空間におけるグラフ304を示す図。 [0024] 本開示で説明される技法に従ってどのように不規則な3Dレンダラが生成され得るかを示すグラフ306Aを示す図。 本開示で説明される技法に従ってどのように不規則な3Dレンダラが生成され得るかを示すグラフ306Bを示す図。 [0025] 本開示で説明される技法の様々な態様に従って形成されるビットストリームを示す図。 本開示で説明される技法の様々な態様に従って形成されるビットストリームを示す図。 本開示で説明される技法の様々な態様に従って形成されるビットストリームを示す図。 本開示で説明される技法の様々な態様に従って形成されるビットストリームを示す図。 [0026] 本開示で説明される技法の様々な態様を実装し得る3Dレンダラ決定ユニットを示す図。 本開示で説明される技法の様々な態様を実装し得る3Dレンダラ決定ユニットを示す図。 [0027] 22.2スピーカー幾何学的配置を示す図。 22.2スピーカー幾何学的配置を示す図。 [0028] 本開示で説明される技法の様々な態様による、仮想スピーカーのうちの1つまたは複数が投射された水平面によってセグメント化される、仮想スピーカーがその上に配置された仮想球体を示す図。 本開示で説明される技法の様々な態様による、仮想スピーカーのうちの1つまたは複数が投射された水平面によってセグメント化される、仮想スピーカーがその上に配置された仮想球体を示す図。 [0001] 本開示で説明される技法の様々な態様による、要素の階層セットに適用され得るウィンドウ処理関数を示す図。
[0029] サラウンド音の発展は、現今では娯楽のための多くの出力フォーマットを利用可能にしている。そのようなサラウンド音フォーマットの例は、普及している5.1フォーマット(これは、フロントレフト(FL)と、フロントライト(FR)と、センターまたはフロントセンターと、バックレフトまたはサラウンドレフトと、バックライトまたはサラウンドライトと、低周波効果(LFE:low frequency effect)という、6つのチャネルを含む)、発展中の7.1フォーマット、および来るべき22.2フォーマット(たとえば、超高精細度テレビジョン規格とともに使用するための)を含む。さらなる例は、球面調和アレイ(spherical harmonic array)のためのフォーマットを含む。
[0030] (2013年1月付けの、ジュネーブ、スイスにおいて協定で公開された、「Call for Proposals for 3D Audio」と題する、ISO/IEC JTC1/SC29/WG11/N13411文書に応答して概して開発され得る)将来のMPEGエンコーダへの入力は、随意に以下の3つの可能なフォーマットのうちの1つである。(i)事前指定された位置にあるラウドスピーカーを通して再生されるように意図された、従来のチャネルベースのオーディオ、(ii)(情報の中でも)単一オーディオオブジェクトのロケーション座標を含んでいる関連するメタデータ(metadata)とともに単一オーディオオブジェクトのための離散パルスコード変調(PCM)データを伴う、オブジェクトベースのオーディオ、および(iii)球面調和基底関数の係数(「球面調和係数(spherical harmonic coefficient)」またはSHCとも呼ばれる)を使用して音場を表すことを伴う、シーンベースのオーディオ。
[0031] 市場には様々な「サラウンド音(surround-sound)」フォーマットがある。それらは、たとえば、5.1ホームシアターシステム(これは、ステレオを超えたリビングルームへの進出に関して最も成功している)から、NHK(日本放送協会(Nippon Hoso Kyokai)または日本放送協会(Japan Broadcasting Corporation))によって開発された22.2システムにまでわたる。コンテンツ作成者(たとえば、ハリウッドスタジオ)は、一度に映画のサウンドトラックを作成することを望み、スピーカー構成ごとにサウンドトラックをリミックス(remix)する労力を費やすことを望まない。最近では、規格化委員会が、規格化されたビットストリームへの符号化と、スピーカーの幾何学的配置およびレンダラの位置における音響条件に適応可能でアグノスティック(agnostic)である後続の復号とを提供するための方法を考察している。
[0032] コンテンツ作成者にそのようなフレキシビリティを提供するために、要素の階層セットが音場を表すために使用され得る。要素の階層セットは、モデル化された音場の完全な表現をより低次の要素の基本セットが提供するように要素が順序付けられる、要素のセットを指し得る。このセットはより高次の要素を含むように拡張されるので、表現はより詳細なものになる。
[0033] 要素の階層セットの一例は、球面調和係数(SHC)のセットである。次の式は、SHCを使用した音場の記述または表現を示す。
この式は、音場の任意の点{rr,θr,φr}における圧力piがSHC
によって一意に表され得ることを示す。ここで、
であり、cは音速(約343m/s)であり、{rr,θr,φr}は基準の点(または観測点)であり、jn(・)は次数nの球ベッセル関数(spherical Bessel function)であり、
は次数nと副次数mとの球面調和基底関数である。角括弧の中の項は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、またはウェーブレット変換などの様々な時間周波数変換によって近似され得る、信号の周波数領域の表現(すなわち、S(ω,rr,θr,φr))であることが認識され得る。階層セットの他の例は、ウェーブレット変換係数のセット、および多分解能基底関数(multiresolution basis function)の係数の他のセットを含む。
[0034] 図1は、0次(n=0)から4次(n=4)までの球面調和基底関数を示す図である。わかるように、各次数について、図示されてはいるが説明を簡単にするために図2の例では明示的に述べられていない副次数mという拡張がある。
[0035] 図2は、0次(n=0)から4次(n=4)までの球面調和基底関数を示す別の図である。図2では、球面調和基底関数は、図示された次数と副次数の両方を伴う3次元座標空間において示されている。
[0036] いずれの場合も、SHC
は、様々なマイクロフォンアレイ構成によって物理的に取得(たとえば、記録)され得、あるいは代替的に、それらは音場のチャネルベースまたはオブジェクトベースの記述から導出され得る。前者は、エンコーダへのシーンベース(scene-based)のオーディオ入力を表す。たとえば、1+24個の(25個の、したがって4次)係数を伴う4次表現が使用され得る。
[0037] これらのSHCがどのようにオブジェクトベースの記述から導出され得るかを例示するために、次の式について考える。個々のオーディオオブジェクトに対応する音場の係数
は、
として表され得、
ただし、iは
であり、
は次数nの(第2の種類の)球ハンケル関数(spherical Hankel function)であり、{rs,θs、φs}はオブジェクトのロケーションである。周波数の関数として(たとえば、PCMストリームに対して高速フーリエ変換を実行するなど、時間周波数分析技法を使用して)ソースエネルギーg(ω)を知ることで、各PCMオブジェクトとそれのロケーションとをSHC
に変換することが可能になる。さらに、各オブジェクトの
係数は、(上記が線形および直交分解であるので)加法的であることが示され得る。このようにして、多数のPCMオブジェクトが
係数によって(たとえば、個々のオブジェクトについての係数ベクトルの和として)表され得る。本質的に、これらの係数は、音場に関する情報(3D座標の関数としての圧力)を含んでおり、上記は、観測点{rr,θr,φr}の近傍における、音場全体の表現への個々のオブジェクトからの変換を表す。残りの図は、オブジェクトベースおよびSHCベースのオーディオコーディングのコンテキストにおいて以下で説明される。
[0038] 図3は、本開示で説明される技法の様々な態様を実行し得るシステム20を示す図である。図3の例に示されているように、システム20は、コンテンツ作成者22とコンテンツ消費者24とを含む。コンテンツ作成者22は、コンテンツ消費者24など、コンテンツ消費者による消費のためにマルチチャネルオーディオコンテンツを生成し得る映画スタジオまたは他のエンティティを表し得る。しばしば、このコンテンツ作成者は、ビデオコンテンツと併せてオーディオコンテンツを生成する。コンテンツ消費者24は、マルチチャネルオーディオコンテンツを再生することが可能な任意の形態のオーディオ再生システムを指し得るオーディオ再生システム32を所有するかまたはそれへのアクセスを有する個人を表す。図3の例では、コンテンツ消費者24はオーディオ再生システム32を含む。
[0039] コンテンツ作成者22は、オーディオレンダラ28とオーディオ編集システム30とを含む。オーディオレンダラ26は、スピーカーフィード(「ラウドスピーカーフィード(loudspeaker feed)」、「スピーカー信号(speaker signal)」、または「ラウドスピーカー信号(loudspeaker signal)」とも呼ばれることがある)をレンダリングするかまたはさもなければ生成するオーディオ処理ユニットを表し得る。各スピーカーフィードは、マルチチャネルオーディオシステムの特定のチャネルのための音を再現するスピーカーフィードに対応し得る。図3の例では、レンダラ38は、5.1、7.1または22.2サラウンド音スピーカーシステム中の5つ、7つまたは22個のスピーカーの各々のためのスピーカーフィードを生成する、従来の5.1、7.1または22.2サラウンド音フォーマットのためのスピーカーフィードをレンダリングし得る。代替的に、レンダラ28は、上記で論じられたソース球面調和係数(source spherical harmonic coefficient)の特性を鑑みて、任意の数のスピーカーを有する任意のスピーカー構成のためにソース球面調和係数からスピーカーフィードをレンダリングするように構成され得る。レンダラ28は、このようにして、図3ではスピーカーフィード29として示されている、いくつかのスピーカーフィードを生成し得る。
[0040] コンテンツ作成者は、編集プロセス中に、球面調和係数27(「SHC27」)をレンダリングして、高忠実度を有しないかまたは納得のいくサラウンド音エクスペリエンスを提供しない音場の態様を識別しようとする試みにおいて、レンダリングされたスピーカーフィードを聴取し得る。コンテンツ作成者22は、次いで、(しばしば、上記で説明された様式でソース球面調和係数がそれから導出され得る様々なオブジェクトの操作を通して間接的に)ソース球面調和係数を編集し得る。コンテンツ作成者22は、球面調和係数27を編集するためにオーディオ編集システム30を使用し得る。オーディオ編集システム30は、オーディオデータを編集し、このオーディオデータを1つまたは複数のソース球面調和係数として出力することが可能な任意のシステムを表す。
[0041] 編集プロセスが完了すると、コンテンツ作成者22は、球面調和係数27に基づいてビットストリーム31を生成し得る。すなわち、コンテンツ作成者22は、ビットストリーム31を生成することが可能な任意のデバイスを表し得る、ビットストリーム生成デバイス36を含む。いくつかの事例では、ビットストリーム生成デバイス36は、球面調和係数27を(一例として、エントロピー符号化によって)バンド幅圧縮し、容認されるフォーマットで球面調和係数27のバンド幅圧縮バージョンを構成してビットストリーム31を形成するエンコーダを表し得る。他の事例では、ビットストリーム生成デバイス36は、マルチチャネルオーディオコンテンツまたはそれの派生(derivative)を圧縮するために、一例として、従来のオーディオサラウンド音符号化プロセスのものと同様のプロセスを使用してマルチチャネルオーディオコンテンツ29を符号化するオーディオエンコーダ(場合によっては、MPEGサラウンドまたはそれの派生など、知られているオーディオコーディング規格に準拠するオーディオエンコーダ)を表し得る。圧縮されたマルチチャネルオーディオコンテンツ29は、次いで、コンテンツ29をバンド幅圧縮するためにエントロピー符号化されるかまたは何らかの他の方法でコーディングされ、合意されたフォーマットに従って構成されて、ビットストリーム31が形成され得る。直接圧縮されてビットストリーム31が形成されるか、またはレンダリングされ、次いで圧縮されてビットストリーム31が形成されるかにかかわらず、コンテンツ作成者22は、ビットストリーム31をコンテンツ消費者24に送信し得る。
[0042] 図3ではコンテンツ消費者24に直接送信されるものとして示されているが、コンテンツ作成者22は、コンテンツ作成者22とコンテンツ消費者24との間に配置された中間デバイスにビットストリーム31を出力し得る。この中間デバイスは、このビットストリームを要求し得るコンテンツ消費者24に後で配信するためにビットストリーム31を記憶し得る。中間デバイスは、ファイルサーバ、ウェブサーバ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、モバイルフォン、スマートフォン、またはオーディオデコーダによる後での取出しのためにビットストリーム31を記憶することが可能な任意の他のデバイスを備え得る。代替的に、コンテンツ作成者22は、コンパクトディスク、デジタルビデオディスク、高精細度ビデオディスクまたは他の記憶媒体などの記憶媒体にビットストリーム31を記憶し得、それらの大部分は、コンピュータによって読み取られることが可能であり、したがって、コンピュータ可読記憶媒体と呼ばれることがある。このコンテキストでは、送信チャネルは、これらの媒体に記憶されたコンテンツが送信されるチャネルを指し得る(ならびに、小売店および他の店舗ベースの配信機構を含み得る)。いずれの場合も、本開示の技法は、したがって、この点において図3の例に限定されるべきではない。
[0043] 図3の例にさらに示されているように、コンテンツ消費者24はオーディオ再生システム32を含む。オーディオ再生システム32は、マルチチャネルオーディオデータを再生することが可能な任意のオーディオ再生システムを表し得る。オーディオ再生システム32はいくつかの異なるレンダラを含み得る。オーディオ再生システム32はまた、複数のオーディオレンダラの中からオーディオレンダラ34を決定するかまたはさもなければ選択するように構成されたユニットを表し得るレンダラ決定ユニット40を含み得る。いくつかの事例では、レンダラ決定ユニット40は、いくつかのあらかじめ定義されたレンダラからレンダラ34を選択し得る。他の事例では、レンダラ決定ユニット40は、ローカルスピーカー幾何学的配置情報41に基づいてオーディオレンダラ34を動的に決定し得る。ローカルスピーカー幾何学的配置情報41は、オーディオ再生システム32、聴取者、あるいは任意の他の識別可能な領域またはロケーションに対する、オーディオ再生システム32に結合された各スピーカーのロケーションを指定し得る。しばしば、聴取者は、ローカルスピーカー幾何学的配置情報41を入力するためにグラフィカルユーザインターフェース(GUI)または他の形態のインターフェースを介してオーディオ再生システム32とインターフェースし得る。いくつかの事例では、オーディオ再生システム32は、しばしば、いくつかのトーンを発することと、オーディオ再生システム32に結合されたマイクロフォンを介してそれらのトーンを測定することとによって自動的に(この例では、いかなる聴取者の介入も必要とせずに、を意味する)ローカルスピーカー幾何学的配置情報41を決定し得る。
[0044] オーディオ再生システム32はさらに、抽出デバイス38を含み得る。抽出デバイス38は、ビットストリーム生成デバイス36のプロセスとは概して逆であり得るプロセスを通して球面調和係数27’(「SHC27’」、これは球面調和係数27の修正形態または複製を表し得る)を抽出することが可能な任意のデバイスを表し得る。オーディオ再生システム32は、球面調和係数27’を受信し、SHC27’と、指定されたかまたは利用可能な場合はオーディオレンダリング情報(audio rendering information)39とを抽出するために抽出デバイス38を呼び出し得る。
[0045] いずれの場合も、上記のレンダラ34の各々は、異なる形態のレンダリングを提供し得、ここで、異なる形態のレンダリングは、ベクトルベース振幅パンニング(VBAP:vector-base amplitude panning)を実行する様々な方法のうちの1つまたは複数、距離ベースの振幅パンニング(DBAP:distance based amplitude panning)を実行する様々な方法のうちの1つまたは複数、単純なパンニングを実行する様々な方法のうちの1つまたは複数、ニアフィールド補償(NFC:near field compensation)フィルタ処理を実行する様々な方法のうちの1つまたは複数および/または波動場合成(wave field synthesis)を実行する様々な方法のうちの1つまたは複数を含み得る。選択されたレンダラ34は、次いで、球面調和係数27’をレンダリングして、(説明を簡単にするために図3の例には示されていない、オーディオ再生システム32に電気的にまたは場合によってはワイヤレスに結合されたラウドスピーカーの数に対応する)いくつかのスピーカーフィード35を生成し得る。
[0046] 典型的には、オーディオ再生システム32は、複数のオーディオレンダラのうちのいずれかの1つを選択し得、(いくつかの例を挙げると、DVDプレーヤ、Blu−ray(登録商標)プレーヤ、スマートフォン、タブレットコンピュータ、ゲーミングシステム、およびテレビジョンなどの)ビットストリーム31が受信されたソースに応じてオーディオレンダラのうちの1つまたは複数を選択するように構成され得る。オーディオレンダラのうちのどの1つでも選択され得るが、しばしば、コンテンツを作成するときに使用されたオーディオレンダラは、コンテンツがオーディオレンダラのうちのこの1つ、すなわち、図3の例ではオーディオレンダラ28を使用してコンテンツ作成者22によって作成されたということに起因して、より良い(および場合によっては最良の)形態のレンダリングを提供する。ローカルスピーカー幾何学的配置のレンダリング形態と同じであるかまたは少なくともそれに近いレンダリング形態を有するオーディオレンダラ34のうちの1つを選択することにより、コンテンツ消費者24にとってより良いサラウンド音エクスペリエンスをもたらし得る音場のより良い表現が提供され得る。
[0047] ビットストリーム生成デバイスは、オーディオレンダリング情報(audio rendering information)39(「オーディオレンダリング情報(audio rendering info)39」)を含むようにビットストリーム31を生成し得る。オーディオレンダリング情報39は、マルチチャネルオーディオコンテンツを生成するときに使用されたオーディオレンダラ、すなわち、図4の例ではオーディオレンダラ28を識別する信号値を含み得る。いくつかの事例では、信号値は、複数のスピーカーフィードへの球面調和係数をレンダリングするために使用される行列を含む。
[0048] いくつかの事例では、信号値は、ビットストリームが複数のスピーカーフィードへの球面調和係数をレンダリングするために使用される行列を含むことを示すインデックスを定義する2つ以上のビットを含む。いくつかの事例では、インデックスが使用されるとき、信号値は、ビットストリーム中に含まれる行列の行の数を定義する2つ以上のビットと、ビットストリーム中に含まれる行列の列の数を定義する2つ以上のビットとをさらに含む。この情報を使用して、および2次元行列の各係数は典型的には32ビット浮動小数点数によって定義されることを鑑みて、行列のビットで表されるサイズは、行列の各係数を定義している、行の数と、列の数と、浮動小数点数のサイズ、すなわち、この例では32ビットとの関数として計算され得る。
[0049] いくつかの事例では、信号値は、複数のスピーカーフィードへの球面調和係数をレンダリングするために使用されるレンダリングアルゴリズムを指定する。レンダリングアルゴリズムは、ビットストリーム生成デバイス36と抽出デバイス38の両方に知られている行列を含み得る。すなわち、レンダリングアルゴリズムは、パンニング(たとえば、VBAP、DBAPまたは単純なパンニング)あるいはNFCフィルタ処理など、他のレンダリングステップに加えて行列の適用を含み得る。いくつかの事例では、信号値は、複数のスピーカーフィードへの球面調和係数をレンダリングするために使用される複数の行列のうちの1つに関連付けられたインデックスを定義する2つ以上のビットを含む。この場合も、ビットストリーム生成デバイス36と抽出デバイス38の両方は、インデックスが複数の行列のうちの特定の1つを一意に識別し得るように、複数の行列と複数の行列の次数とを示す情報で構成され得る。代替的に、ビットストリーム生成デバイス36は、インデックスが複数の行列のうちの特定の1つを一意に識別し得るように、複数の行列および/または複数の行列の次数を定義するビットストリーム31中のデータを指定し得る。
[0050] いくつかの事例では、信号値は、複数のスピーカーフィードへの球面調和係数をレンダリングするために使用される複数のレンダリングアルゴリズムのうちの1つに関連付けられたインデックスを定義する2つ以上のビットを含む。この場合も、ビットストリーム生成デバイス36と抽出デバイス38の両方は、インデックスが複数の行列のうちの特定の1つを一意に識別し得るように、複数のレンダリングアルゴリズムと複数のレンダリングアルゴリズムの次数とを示す情報で構成され得る。代替的に、ビットストリーム生成デバイス36は、インデックスが複数の行列のうちの特定の1つを一意に識別し得るように、複数の行列および/または複数の行列の次数を定義するビットストリーム31中のデータを指定し得る。
[0051] いくつかの事例では、ビットストリーム生成デバイス36は、ビットストリーム中のオーディオフレームごとにオーディオレンダリング情報39を指定する。他の事例では、ビットストリーム生成デバイス36は、ビットストリーム中でオーディオレンダリング情報39を1回指定する。
[0052] 抽出デバイス38は、次いで、ビットストリーム中で指定されたオーディオレンダリング情報39を決定し得る。オーディオレンダリング情報39中に含まれる信号値に基づいて、オーディオ再生システム32は、オーディオレンダリング情報39に基づく複数のスピーカーフィード35をレンダリングし得る。上述されたように、信号値は、いくつかの事例では、複数のスピーカーフィードへの球面調和係数をレンダリングするために使用される行列を含み得る。この場合、オーディオ再生システム32は、その行列に基づいてスピーカーフィード35をレンダリングするためにオーディオレンダラ34のうちの1つを使用して、その行列でオーディオレンダラ34のうちのこの1つを構成し得る。
[0053] いくつかの事例では、信号値は、ビットストリームがスピーカーフィード35への球面調和係数27’をレンダリングするために使用される行列を含むことを示すインデックスを定義する2つ以上のビットを含む。抽出デバイス38は、インデックスに応答して、ビットストリームからの行列をパースし得、その後、オーディオ再生システム32は、パースされた行列でオーディオレンダラ34のうちの1つを構成し、スピーカーフィード35をレンダリングするためにレンダラ34のうちのこの1つを呼び出し得る。信号値が、ビットストリーム中に含まれる行列の行の数を定義する2つ以上のビットと、ビットストリーム中に含まれる行列の列の数を定義する2つ以上のビットとを含むとき、抽出デバイス38は、インデックスに応答して、および上記で説明された様式で行の数を定義する2つ以上のビットと列の数を定義する2つ以上のビットとに基づいて、ビットストリームからの行列をパースし得る。
[0054] いくつかの事例では、信号値は、スピーカーフィード35への球面調和係数27’をレンダリングするために使用されるレンダリングアルゴリズムを指定する。これらの事例では、オーディオレンダラ34の一部または全部がこれらのレンダリングアルゴリズムを実行し得る。オーディオ再生デバイス32は、次いで、球面調和係数27’からスピーカーフィード35をレンダリングするために、指定されたレンダリングアルゴリズム、たとえば、オーディオレンダラ34のうちの1つを利用し得る。
[0055] 信号値が、スピーカーフィード35への球面調和係数27’をレンダリングするために使用される複数の行列のうちの1つに関連付けられたインデックスを定義する2つ以上のビットを含むとき、オーディオレンダラ34の一部または全部はこの複数の行列を表し得る。したがって、オーディオ再生システム32は、インデックスに関連付けられたオーディオレンダラ34のうちの1つを使用して球面調和係数27’からスピーカーフィード35をレンダリングし得る。
[0056] 信号値が、スピーカーフィード35への球面調和係数27’をレンダリングするために使用される複数のレンダリングアルゴリズムのうちの1つに関連付けられたインデックスを定義する2つ以上のビットを含むとき、オーディオレンダラ34の一部または全部はこれらのレンダリングアルゴリズムを表し得る。したがって、オーディオ再生システム32は、インデックスに関連付けられたオーディオレンダラ34のうちの1つを使用して球面調和係数27’からスピーカーフィード35をレンダリングし得る。
[0057] このオーディオレンダリング情報がビットストリーム中で指定される頻度に応じて、抽出デバイス38は、オーディオレンダリング情報39をオーディオフレームごとにまたは1回決定し得る。
[0058] このようにしてオーディオレンダリング情報39を指定することによって、本技法は、潜在的に、マルチチャネルオーディオコンテンツ35が再現されるようにコンテンツ作成者22が意図した様式に従って、マルチチャネルオーディオコンテンツ35のより良い再現を生じ得る。その結果、本技法は、より没入できるサラウンド音またはマルチチャネルオーディオエクスペリエンスを提供し得る。
[0059] ビットストリーム中でシグナリングされる(かまたはさもなければ指定される)ものとして説明されたが、オーディオレンダリング情報39は、ビットストリームとは別個のメタデータとして、または言い換えれば、ビットストリームとは別個のサイド情報として指定され得る。ビットストリーム生成デバイス36は、本開示で説明される技法をサポートしない抽出デバイスとのビットストリーム互換性を維持するために(およびそれによってそれらの抽出デバイスによる成功したパースを可能にするために)、ビットストリーム31とは別個にこのオーディオレンダリング情報39を生成し得る。したがって、ビットストリーム中で指定されるものとして説明されたが、本技法は、ビットストリーム31とは別個にオーディオレンダリング情報39を指定するための他の方法を可能にし得る。
[0060] その上、ビットストリーム31中であるいはビットストリーム31とは別個のメタデータまたはサイド情報中でシグナリングされるかまたはさもなければ指定されるものとして説明されたが、本技法は、ビットストリーム生成デバイス36が、ビットストリーム31中でオーディオレンダリング情報39の一部分を指定し、ビットストリーム31とは別個のメタデータとしてオーディオレンダリング情報39の一部分を指定することを可能にし得る。たとえば、ビットストリーム生成デバイス36は、ビットストリーム31で行列を識別するインデックスを指定し得、ここで、識別される行列を含む複数の行列を指定するテーブルは、ビットストリームとは別個のメタデータとして指定され得る。オーディオ再生システム32は、次いで、インデックスの形態でビットストリーム31から、およびビットストリーム31とは別個に指定されたメタデータからオーディオレンダリング情報39を決定し得る。オーディオ再生システム32は、いくつかの事例では、(オーディオ再生システム32の製造業者または規格化団体によってたいがいホストされる)事前構成されたかまたは構成されたサーバからテーブルおよび任意の他のメタデータをダウンロードするかまたはさもなければ取り出すように構成され得る。
[0061] しかしながら、よくあることだが、コンテンツ消費者24は、(典型的にはサラウンド音オーディオフォーマット団体によって)指定された幾何学的配置に従ってスピーカーを適切に構成しない。しばしば、コンテンツ消費者24は、固定された高さに、および聴取者に対して正確に指定されたロケーションにスピーカーを置かない。コンテンツ消費者24は、これらのロケーションにスピーカーを置くことが不可能であるか、または、好適なサラウンド音エクスペリエンスを達成するためにスピーカーをそこに置くべき指定されたロケーションがあることにさえ気づいていないことがある。SHCを使用することは、SHCが2次元または3次元で音場を表すことを鑑みて、スピーカーのよりフレキシブルな配置を可能にし、これは、SHCから、たいていの任意のスピーカー幾何学的配置で構成されたスピーカーによって、音場の容認できる(または、非SHCオーディオシステムのそれと比較して、少なくともより良いサウンディング)再現が提供され得ることを意味する。
[0062] たいていの任意のローカルスピーカー幾何学的配置へのSHCのレンダリングを可能にするために、本開示で説明される技法は、レンダラ決定ユニット40が、上記で説明された様式でオーディオレンダリング情報39を使用して標準のレンダラを選択することだけでなく、ローカルスピーカー幾何学的配置情報41に基づいてレンダラを動的に生成することをも可能にし得る。図4〜図12Cに関してより詳細に説明されるように、本技法は、ローカルスピーカー幾何学的配置情報41によって指定された特定のローカルスピーカー幾何学的配置に適合されたレンダラ34を生成するための少なくとも4つの例示的な方法を提供し得る。これらの3つの方法は、モノレンダラ34と、ステレオレンダラ34と、水平マルチチャネルレンダラ34(ここで、たとえば、「水平マルチチャネル(horizontal multi-channel)」は、3つ以上のスピーカーを有し、それらのスピーカーのすべてが概して同じ水平面上にあるかまたはその近くにある、マルチチャネルスピーカー構成を指す)と、3次元(3D)レンダラ34(ここで、3次元レンダラは、スピーカーの複数の水平面のためにレンダリングし得る)とを生成するための方法を含み得る。
[0063] 動作中、オーディオ決定ユニット40は、オーディオレンダリング情報39またはローカルスピーカー幾何学的配置情報41に基づいてレンダラ34を選択し得る。しばしば、コンテンツ消費者24は、レンダラ決定ユニット40が、オーディオレンダリング情報39に基づいて(これはすべてのビットストリーム中で存在するとは限らないので、存在するとき)レンダラ34を選択し、および存在しないとき、ローカルスピーカー幾何学的配置情報41に基づいてレンダラ34を決定する(またはあらかじめ決定されている場合は選択する)という選好を指定し得る。いくつかの事例では、コンテンツ消費者24は、レンダラ決定ユニット40が、レンダラ34の選択中にオーディオレンダリング情報39を考慮することさえせずに、ローカルスピーカー幾何学的配置情報41に基づいてレンダラ34を決定する(またはあらかじめ決定されて場合は選択する)という選好を指定し得る。ただ2つの代替形態が提供されたが、レンダラ決定ユニット40がどのようにオーディオレンダリング情報39および/またはローカルスピーカー幾何学的配置41に基づいてレンダラ34を選択するかについて任意の数の選好が指定され得る。したがって、本技法は、この点において上記で論じられた2つの例示的な代替形態に限定されるべきではない。
[0064] いずれの場合も、レンダラ決定ユニット40がローカルスピーカー幾何学的配置情報41に基づいてレンダラ34を決定すべきであると仮定すると、レンダラ決定ユニット40は、最初に、ローカルスピーカー幾何学的配置を、上記で手短に述べられた4つのカテゴリーのうちの1つにカテゴリー分類し得る。すなわち、レンダラ決定ユニット40は、最初に、ローカルスピーカー幾何学的配置情報41がモノスピーカー幾何学的配置、ステレオスピーカー幾何学的配置、同じ水平面上に3つ以上のスピーカーを有する水平マルチチャネルスピーカー幾何学的配置、または、3つ以上のスピーカーを有し、そのうちの2つが(しばしば何らかのしきい値高さによって分離された)異なる水平面上にある3次元マルチチャネルスピーカー幾何学的配置に概して準拠することをローカルスピーカー幾何学的配置情報41が示すかどうかを決定し得る。このローカルスピーカー幾何学的配置情報41に基づいてローカルスピーカー幾何学的配置をカテゴリー分類すると、レンダラ決定ユニット40は、モノレンダラと、ステレオレンダラと、水平マルチチャネルレンダラと、3次元マルチチャネルレンダラとのうちの1つを生成し得る。レンダラ決定ユニット40は、次いで、オーディオ再生システム32による使用のためにこのレンダラ34を提供し得、その後、オーディオ再生システム32は、マルチチャネルオーディオデータ35を生成するために上記で説明された様式でSHC27’をレンダリングし得る。
[0065] このようにして、本技法は、オーディオ再生システム32が、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定することと、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定することとを可能にし得る。
[0066] いくつかの例では、オーディオ再生システム32は、マルチチャネルオーディオデータを生成するために、決定されたレンダラを使用して球面調和係数をレンダリングし得る。
[0067] いくつかの例では、オーディオ再生システム32は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置がステレオスピーカー幾何学的配置に合致(conform)するときにステレオレンダラを決定し得る。
[0068] いくつかの例では、オーディオ再生システム32は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置が、3つ以上のスピーカーを有する水平マルチチャネルスピーカー幾何学的配置に合致するときに水平マルチチャネルレンダラを決定し得る。
[0069] いくつかの例では、オーディオ再生システム32は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置が、2つ以上の水平面上に3つ以上のスピーカーを有する3次元マルチチャネルスピーカー幾何学的配置を合致するときに3次元マルチチャネルレンダラを決定し得る。
[0070] いくつかの例では、オーディオ再生システム32は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を指定する入力を聴取者から受信し得る。
[0071] いくつかの例では、オーディオ再生システム32は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を指定する入力を、グラフィカルユーザインターフェースを介して聴取者から受信し得る。
[0072] いくつかの例では、オーディオ再生システム32は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を自動的に決定し得る。
[0073] 以下は、上記の技法を集約するための1つの方法である。概して、SHC27などの高次アンビソニックス信号は、球面調和基底関数を使用する3次元音場の表現であり、ここで、球面調和基底関数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる。この表現は、エンドユーザスピーカー幾何学的配置に依存しないので理想的な音フォーマットを提供し得、その結果、この表現は、符号化側の事前知識なしに、コンテンツ消費者において任意の幾何学的配置にレンダリングされ得る。次いで、最終スピーカー信号が、その特定のスピーカーの方向を向く極パターンを概して表す球面調和係数の線形結合によって導出され得る。5.0/5.1などの共通スピーカーレイアウトのための特定のHOAレンダラを設計することについて、また、不規則な2Dおよび3Dスピーカー幾何学的配置のために(通常「オンザフライで(on the fly)」と呼ばれる)リアルタイムまたはほぼリアルタイムでレンダラを生成することについて)調査が行われた。規則的な(t設計(t-design))スピーカー幾何学的配置の「ゴールデン(golden)」ケースは、擬逆元(pseudo-inverse)ベースのレンダリング行列を使用することによってよく知られていることがある。来るべきMPEG−H規格の場合、任意のスピーカー幾何学的配置を取り、当該のスピーカー幾何学的配置にとって最良のレンダリング行列を作り出すための正しい方法を使用することができるシステムが必要とされ得る。
[0074] 本開示で説明される技法の様々な態様は、HOAまたはSHCレンダラ生成システム/アルゴリズムを提供する。このシステムは、モノ、ステレオ、水平、3次元など、どんなタイプのスピーカー幾何学的配置が使用中であるか、または知られている幾何学的配置/レンダラ行列としてフラグを付けられているかを検出する。
[0075] 図4は、図3のレンダラ決定ユニット40をより詳細に示すブロック図である。図4の例に示されているように、レンダラ決定ユニット40は、レンダラ選択ユニット42と、レイアウト決定ユニット44と、レンダラ生成ユニット46とを含み得る。レンダラ選択ユニット42は、レンダリング情報39に基づいてあらかじめ定義されたものを選択するか、またはレンダリング情報39において指定されたレンダリングを選択し、この選択または指定されたレンダラをレンダラ34として出力するように構成されたユニットを表し得る。
[0076] レイアウト決定ユニット44は、ローカルスピーカー幾何学的配置情報41に基づいてローカルスピーカー幾何学的配置をカテゴリー分類するように構成されたユニットを表し得る。レイアウト決定ユニット44は、ローカルスピーカー幾何学的配置を、1)モノスピーカー幾何学的配置、2)ステレオスピーカー幾何学的配置、3)水平マルチチャネルスピーカー幾何学的配置、および4)3次元マルチチャネルスピーカー幾何学的配置という、上記で説明された3つのカテゴリーのうちの1つにカテゴリー分類し得る。レイアウト決定ユニット44は、ローカルスピーカー幾何学的配置が3つのカテゴリーのうちのどれに最も合致するかを示すカテゴリー分類情報45をレンダラ生成ユニット46に受け渡し得る。
[0077] レンダラ生成ユニット46は、カテゴリー分類情報45とローカルスピーカー幾何学的配置情報41とに基づいてレンダラ34を生成するように構成されたユニットを表し得る。レンダラ生成ユニット46は、モノレンダラ生成ユニット48Dと、ステレオレンダラ生成ユニット48Aと、水平レンダラ生成ユニット48Bと、3次元(3D)レンダラ生成ユニット48Cとを含み得る。モノレンダラ生成ユニット48Aは、ローカルスピーカー幾何学的配置情報41に基づいてモノレンダラを生成するように構成されたユニットを表し得る。ステレオレンダラ生成ユニット48Aは、ローカルスピーカー幾何学的配置情報41に基づいてステレオレンダラを生成するように構成されたユニットを表し得る。ステレオレンダラ生成ユニット48Aによって採用されるプロセスについては、図6の例に関して以下でより詳細に説明される。水平レンダラ生成ユニット48Bは、ローカルスピーカー幾何学的配置情報41に基づいて水平マルチチャネルレンダラを生成するように構成されたユニットを表し得る。水平レンダラ生成ユニット48Bによって採用されるプロセスについては、図7の例に関して以下でより詳細に説明される。3Dレンダラ生成ユニット48Cは、ローカルスピーカー幾何学的配置情報41に基づいて3Dマルチチャネルレンダラを生成するように構成されたユニットを表し得る。水平レンダラ生成ユニット48Bによって採用されるプロセスについては、図8および図9の例に関して以下でより詳細に説明される。
[0078] 図5は、本開示で説明される技法の様々な態様を実行する際の、図4の例に示されたレンダラ決定ユニット40の例示的な動作を示す流れ図である。図5の流れ図は、概して、いくつかの軽微な表記法の変更を除いて、図4に関して上記で説明されたレンダラ決定ユニット40によって実行される動作を略述している。図5の例では、レンダラフラグは、オーディオレンダリング情報39の特定の例を指す。「SHC次数(SHC order)」はSHCの最大次数を指す。「ステレオレンダラ(stereo renderer)」はステレオレンダラ生成ユニット48Aを指し得る。「水平レンダラ(horizontal renderer)」は水平レンダラ生成ユニット48Bを指し得る。「3Dレンダラ」は3Dレンダラ生成ユニット48Cを指し得る。「レンダラ行列(Renderer Matrix)」はレンダラ選択ユニット42を指し得る。
[0079] 図5の例に示されているように、レンダラ選択ユニット42は、レンダリングフラグ39’として示され得るレンダリングフラグが、ビットストリーム31(またはビットストリーム31に関連付けられた他のサイドチャネル情報)中に存在するかどうかを受信し、決定し得る(60)。レンダラフラグ39’がビットストリーム31中に存在するとき(「YES」60)、レンダラ選択ユニット42は、レンダラフラグ39’に基づいて潜在的な複数のレンダラからレンダラを選択し、選択されたレンダラをレンダラ34として出力し得る(62、64)。
[0080] レンダラフラグ39’がビットストリーム中に存在しないとき(「NO」60)、レンダラ選択ユニット42はレンダラ決定ユニット40を呼び出し得、レンダラ決定ユニット40はローカルスピーカー幾何学的配置情報41を決定し得る。ローカルスピーカー幾何学的配置情報41に基づいて、レンダラ決定ユニット40は、モノレンダラ決定ユニット48D、スピーカーレンダラ決定ユニット48A、水平レンダラ決定ユニット48Bまたは3Dレンダラ決定ユニット48Cのうちの1つを呼び出し得る。
[0081] ローカルスピーカー幾何学的配置情報41がモノローカルスピーカー幾何学的配置を示すとき、レンダリング決定ユニット40はモノレンダラ決定ユニット48Dを呼び出し得、モノレンダラ決定ユニット48Dは、(SHC次数に潜在的に基づいて)モノレンダリングを決定し、モノレンダラをレンダラ34として出力し得る(66、64)。ローカルスピーカー幾何学的配置情報41がステレオローカルスピーカー幾何学的配置を示すとき、レンダリング決定ユニット40はステレオレンダラ決定ユニット48Aを呼び出し得、ステレオレンダラ決定ユニット48Aは、(SHC次数に潜在的に基づいて)ステレオレンダリングを決定し、ステレオレンダラをレンダラ34として出力し得る(68、64)。ローカルスピーカー幾何学的配置情報41が水平ローカルスピーカー幾何学的配置を示すとき、レンダリング決定ユニット40は水平レンダラ決定ユニット48Bを呼び出し得、水平レンダラ決定ユニット48Bは、(SHC次数に潜在的に基づいて)水平レンダリングを決定し、水平レンダラをレンダラ34として出力し得る(70、64)。ローカルスピーカー幾何学的配置情報41がステレオローカルスピーカー幾何学的配置を示すとき、レンダリング決定ユニット40は3Dレンダラ決定ユニット48Cを呼び出し得、3Dレンダラ決定ユニット48Cは、(SHC次数に潜在的に基づいて)3Dレンダリングを決定し、3Dレンダラをレンダラ34として出力し得る(72、64)。
[0082] このようにして、本技法は、レンダラ決定ユニット40が、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定することと、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定することとを可能にし得る。
[0083] 図6は、図4の例に示されたステレオレンダラ生成ユニット48Aの例示的な動作を示す流れ図である。図6の例では、ステレオレンダラ生成ユニット48Aは、ローカルスピーカー幾何学的配置情報41を受信し(100)、次いで、所与のスピーカー幾何学的配置のための「スイートスポット(sweet spot)」と見なされ得るものにおける聴取者位置に対してスピーカー間の角距離を決定し得る(102)。ステレオレンダラ生成ユニット48Aは、次いで、球面調和係数のHOA/SHC次数によって限定される、最高許容次数を計算し得る(104)。ステレオレンダラ生成ユニット48Aは、次に、決定された許容次数に基づいて等しい離間したアジマス(azimuth)を生成し得る(106)。
[0084] ステレオレンダラ生成ユニット48Aは、次いで、2次元(2D)レンダラを形成する仮想または現実のスピーカーのロケーションにおいて球面基底関数をサンプリングし得る。ステレオレンダラ生成ユニット48Aは、次いで、この2Dレンダラの(行列数学のコンテキストで理解される)擬逆元(pseudo-inverse)を実行し得る(108)。数学的に、この2Dレンダラは以下の行列によって表され得る。
この行列のサイズはV行×(n+1)2であり得、ただし、Vは仮想スピーカーの数を示し、nはSHC次数を示す。
は次数nの(第二種の)球ハンケル関数である。
は次数nと副次数mとの球面調和基底関数である。{θr,φr}は球面座標に関する基準点(または観測点)である。
[0085] ステレオレンダラ生成ユニット48Aは、次いで、アジマスを右位置と左位置とに回転させて2つの異なる2Dレンダラを生成し(110、112)、次いで、それらを2Dレンダラ行列に合成し得る(114)。ステレオレンダラ生成ユニット48Aは、次いで、この2Dレンダラ行列を3Dレンダラ行列に変換し(116)、(図6の例では次数’として示された)許容次数と次数nとの間の差をゼロパディングし得る(120)。ステレオレンダラ生成ユニット48Aは、次いで、3Dレンダラ行列に関してエネルギー保存を実行し(122)、この3Dレンダラ行列を出力し得る(124)。
[0086] このようにして、本技法は、ステレオレンダラ生成ユニット48Aが、SHC次数、および左スピーカー位置と右スピーカー位置との間の角距離に基づいてステレオレンダリング行列を生成することを可能にし得る。ステレオレンダラ生成ユニット48Aは、次いで、左スピーカー位置と、次いで右スピーカー位置とに一致するようにレンダリング行列のフロント位置を回転させ、次いで、これらの左行列と右行列とを合成して最終レンダリング行列を形成し得る。
[0087] 図7は、図4の例に示された水平レンダラ生成ユニット48Bの例示的な動作を示す流れ図である。図7の例では、水平レンダラ生成ユニット48Bは、ローカルスピーカー幾何学的配置情報41を受信し(130)、次いで、所与のスピーカー幾何学的配置のための「スイートスポット」と見なされ得るものにおける聴取者位置に対してスピーカー間の角距離を見つけ得る(132)。水平レンダラ生成ユニット48Bは、次いで、最小角距離と最大角距離とを計算し、最小角距離を最大角距離と比較し得る(134)。最小角距離が等しい(かまたは何らかの角度しきい値内でほぼ等しい)とき、水平レンダラ生成ユニット48Bは、ローカルスピーカー幾何学的配置が規則的であると決定する。最小角距離が最大角距離に等しくない(かまたは何らかの角度しきい値内でほぼ等しくない)とき、水平レンダラ生成ユニット48Bは、ローカルスピーカー幾何学的配置が不規則であると決定し得る。
[0088] ローカルスピーカー幾何学的配置が規則的であると決定されたときについて最初に考えると、水平レンダラ生成ユニット48Bは、上記で説明するように、球面調和係数のHOA/SHC次数によって限定される、最高許容次数を計算し得る(136)。水平レンダラ生成ユニット48Bは、次に、2Dレンダラの擬逆元を生成し(138)、2Dレンダラのこの擬逆元を3Dレンダラに変換し(140)、3Dレンダラをゼロパディングし得る(142)。
[0089] ローカルスピーカー幾何学的配置が不規則であると決定されたときについて次に考えると、水平レンダラ生成ユニット48Bは、上記で説明するように、球面調和係数のHOA/SHC次数によって限定される、最高許容次数を計算し得る(144)。水平レンダラ生成ユニット48Bは、次いで、許容次数に基づいて等しい離間したアジマスを生成して(146)、2Dレンダラを生成し得る。水平レンダラ生成ユニット48Bは、2Dレンダラの擬逆元を実行し(148)、随意のウィンドウ処理演算を実行し得る(150)。いくつかの事例では、水平レンダラ生成ユニット48Bはウィンドウ処理演算を実行しないことがある。いずれの場合も、水平レンダラ生成ユニット48Bはまた、等しいアジマスを現実のアジマスにプレースする利得をパンニングし(不規則なスピーカー幾何学的配置について、152)、パンニングされた利得での擬逆元2Dレンダラの行列乗算を実行し得る(154)。数学的に、パンニング利得行列は、ベクトルベース振幅パンニング(VBAP)を実行するサイズR×VのVBAP行列を表し得、ただし、Vはここでも仮想スピーカーの数を表し、Rは現実のスピーカーの数を表す。VBAP行列は次のように指定され得る。
乗算は次のように表され得る。
水平レンダラ生成ユニット48Bは、次いで、2Dレンダラである行列乗算の出力を3Dレンダラに変換し(156)、次いで、ここでも上記で説明されたように、3Dレンダラをゼロパディングし得る(158)。
[0090] 上記では、仮想スピーカーを現実のスピーカーにマッピングするために特定のタイプのパンニングを実行するものとして説明されたが、本技法は、仮想スピーカーを現実のスピーカーにマッピングするどんな方法に関しても実行され得る。その結果、行列は、R×Vのサイズを有する「仮想対現実スピーカーマッピング行列(virtual-to-real speaker mapping matrix)」として示され得る。したがって、乗算は、次のようにより一般的に表され得る。
このVirtual_to_Real_Speaker_Mapping_Matrixは、ベクトルベース振幅パンニング(VBAP)を実行するための行列のうちの1つまたは複数、距離ベースの振幅パンニング(DBAP)を実行するための行列のうちの1つまたは複数、単純なパンニングを実行するための行列のうちの1つまたは複数、ニアフィールド補償(NFC)フィルタ処理を実行するための行列のうちの1つまたは複数および/または波動場合成を実行するための行列のうちの1つまたは複数を含むを含む、仮想スピーカーを現実のスピーカーにマッピングし得る任意のパンニングまたは他の行列を表し得る。
[0091] 規則的な3Dレンダラが生成されるか不規則な3Dレンダラが生成されるかにかかわらず、水平レンダラ生成ユニット48Bは、規則的な3Dレンダラまたは不規則な3Dレンダラに関してエネルギー保存を実行し得る(160)。すべてではないがいくつかの例では、水平レンダラ生成ユニット48Bは、3Dレンダラの空間特性に基づいて最適化を実行し(162)、この最適化された3Dレンダラまたは最適化されていない3Dレンダラを出力し得る(164)。
[0092] 水平のサブカテゴリーでは、本システムは、したがって、概して、スピーカーの幾何学的配置が規則的に離間しているか不規則であるかを検出し、次いで、擬逆元またはAllRAD手法に基づいてレンダリング行列を作成し得る。AllRAD手法は、2013年3月18〜21日、メラノにおけるAIA−DAGA中に提示された、「Comparison of energy−preserving and all−round Ambisonic decoders」と題する、Franz Zotterらによる論文においてより詳細に論じられている。ステレオサブカテゴリーでは、HOA次数、および左スピーカー位置と右スピーカー位置との間の角距離に基づいて、規則的な水平のためのレンダラ行列を作成することによってレンダリング行列が生成される。レンダリング行列のフロント位置が、次いで、左スピーカー位置と、次いで右スピーカー位置とに一致するように回転させられ、次いで、合成されて最終レンダリング行列が形成される。
[0093]図8Aおよび図8Bは、図4の例に示された3Dレンダラ生成ユニット48Cの例示的な動作を示す流れ図である。図8Aの例では、3Dレンダラ生成ユニット48Cが、ローカルスピーカー幾何学的配置情報41を受信し(170)、次いで、第1の次数の幾何学的配置とHOA/SHC次数nの幾何学的配置とを使用して球面調和基底関数(spherical harmonics basis function)を決定し得る(172、174)。3Dレンダラ生成ユニット48Cは、次いで、第1の次数以下の基底関数と、1の次数よりも大きいがn以下の球面基底関数に関連付けられた基底関数との両方のための条件数を決定し得る(176、178)。3Dレンダラ生成ユニット48Cは、次いで、いくつかの例では1.05の値を有するしきい値を表し得るいわゆる「規則的値(regular value)」に条件値の両方を比較する(180)。
[0094] 条件値の両方が規則的値を下回るとき、3Dレンダラ生成ユニット48Cは、ローカルスピーカー幾何学的配置が規則的である(左から右におよび前方から後方に、ある意味で対称的であり、スピーカーが等間隔に離間している)と決定し得る。条件値の両方が規則的値を下回らないかまたはそれよりも小さくないとき、3Dレンダラ生成ユニット48Cは、第1の次数以下の球面基底関数から計算された条件値を規則的値と比較し得る(182)。第1の次数以下の条件値が規則的値よりも小さいとき(「YES」182)、3Dレンダラ生成ユニット48Cは、ローカルスピーカー幾何学的配置がほぼ規則的(nearly regular)である(または、図8の例に示されているように、「ほぼ規則的(near regular)」である)と決定する。第1の次数以下の条件値が規則的値を下回らないとき(「NO」182)、3Dレンダラ生成ユニット48Cは、ローカル幾何学的配置が不規則であると決定する。
[0095] ローカルスピーカー幾何学的配置が規則的であると決定されたとき、3Dレンダラ生成ユニット48Cは、図7の例に関して記載された規則的な3D行列決定に関して上記で説明された様式と同様の様式で3Dレンダリング行列を決定し、ただし、3Dレンダラ生成ユニット48Cは、スピーカーの複数の水平面のためにこの行列を生成することが例外である(184)。ローカルスピーカー幾何学的配置がほぼ規則的であると決定されたとき、3Dレンダラ生成ユニット48Cは、図7の例に関して記載された不規則な2D行列決定に関して上記で説明された様式と同様の様式で3Dレンダリング行列を決定し、ただし、3Dレンダラ生成ユニット48Cは、スピーカーの複数の水平面のためにこの行列を生成することが例外である(186)。ローカルスピーカー幾何学的配置が不規則であると決定されたとき、3Dレンダラ生成ユニット48Cは、「PERFORMING 2D AND/OR 3D PANNING WITH RESPECT TO HEIRARCHICAL SETS OF ELEMENTS」と題する米国仮出願第U.S.61/762,302号において説明された様式と同様の様式で3Dレンダリング行列を決定し、ただし、この決定のより一般的な性質に適応するための軽微な変更が例外である(本開示の技法は、この仮出願において例として提供された22.2スピーカー幾何学的配置には限定されないという点において、188)。
[0096] 規則的な3Dレンダリング行列が生成されるか、ほぼ規則的な3Dレンダリング行列が生成されるか、不規則な3Dレンダリング行列が生成されるかにかかわらず、3Dレンダラ生成ユニット48Cは、生成された行列に関してエネルギー保存を実行し(190)、それに続いて、いくつかの事例では、3Dレンダリング行列の空間特性に基づいてこの3Dレンダリング行列を最適化する(192)。3Dレンダラ生成ユニット48Cは、次いで、このレンダラをレンダラ34として出力し得る(194)。
[0097] 結果として、3次元の場合、本システムは、(擬逆元を使用して)規則的を、(第1の次数では規則的であるが、HOA次数では規則的でなく、AllRAD方法を使用する)ほぼ規則的を、または最終的に不規則(これは上記の米国仮出願第U.S.61/762,302号に基づくが、潜在的により一般的な手法として実装される)を検出し得る。3次元不規則プロセス188は、不規則な3次元リスニングのための包囲レンダラを作成するために、適切な場合、スピーカーによってカバーされるエリアのための3D−VBAP三角測量(triangulation)、トップボトムにおける高低パンニングリング、水平バンド、伸長ファクタ(stretch factor)などを生成し得る。上記のオプションのすべては、幾何学的配置間のオンザフライスイッチングが、同じ知覚されるエネルギーを有するように、エネルギー保存を使用し得る。多くの不規則またはほぼ不規則オプションは、随意の球面調和ウィンドウ処理を使用する。
[0098] 図8Bは、不規則な3Dローカルスピーカー幾何学的配置を介したオーディオコンテンツの再生のための3Dレンダラを決定する際の、3Dレンダラ決定ユニット48Cの動作を示す流れ図である。図8Bの例に示されているように、3Dレンダラ決定ユニット48Cは、上記で説明するように、球面調和係数のHOA/SHC次数によって限定される、最高許容次数を計算し得る(196)。3Dレンダラ生成ユニット48Cは、次いで、許容次数に基づいて等しい離間したアジマスを生成して(198)、3Dレンダラを生成し得る。3Dレンダラ生成ユニット48Cは、3Dレンダラの擬逆元を実行し(200)、随意のウィンドウ処理演算を実行し得る(202)。いくつかの事例では、3Dレンダラ生成ユニット48Cはウィンドウ処理演算を実行しないことがある。
[0099] 3Dレンダラ決定ユニット48Cはまた、図9に関して以下でより詳細に説明されるように、下半球処理と上半球処理とを実行し得る(204、206)。3Dレンダラ決定ユニット48Cは、下半球処理と上半球処理とを実行するとき、現実のスピーカー間の角距離を「伸長(stretch)」すべき量と、パンニングをいくつかのしきい値高さに限定するためのパンニング限界を指定し得る2Dパンニング限界と、スピーカーが同じ水平面において考慮される水平高さバンドを指定し得る水平バンド量とを示す(以下でより詳細に説明される)半球データを生成し得る。
[0100] 3Dレンダラ決定ユニット48Cは、いくつかの事例では、下半球処理と上半球処理とのうちの1つまたは複数からの半球データに基づいて、場合によってはローカルスピーカー幾何学的配置を「伸長(stretch)」しながら、3D VBAP三角形を構築するために、3D VBAP演算を実行し得る(208)。3Dレンダラ決定ユニット48Cは、より多くの空間をカバーするために、所与の半球内で現実のスピーカー角距離を伸長し得る。3Dレンダラ決定ユニット48Cはまた、下半球と上半球とのための2Dパンニングデュープレットを識別し得(210、212)、ここで、これらのデュープレットは、それぞれ、下半球と上半球とにおいて仮想スピーカーごとに2つの現実のスピーカーを識別する。3Dレンダラ決定ユニット48Cは、次いで、等間隔に離間した幾何学的配置を生成するときに識別された各規則的な幾何学的配置位置にわたってループし、下半球および上半球仮想スピーカーの2Dパンニングデュープレット(2D panning duplet)と3D VBAP三角形とに基づいて以下の分析を実行し得る(214)。
[0101] 3Dレンダラ決定ユニット48Cは、仮想スピーカーが、下半球と上半球とのための半球データにおいて指定された上側と下側の水平バンド値内にあるかどうかを決定し得る(216)。仮想スピーカーがこれらのバンド値内にあるとき(「YES」216)、3Dレンダラ決定ユニット48Cは、これらの仮想スピーカーの仰角を0に設定する(218)。言い換えれば、3Dレンダラ決定ユニット48Cは、いわゆる「スイートスポット」の周りの球体を二等分する中間水平面に近い下半球と上半球とにおける仮想スピーカーを識別し、この水平面上にこれらの仮想スピーカーのロケーションがあるように設定し得る。これらの仮想スピーカーロケーションを0に設定した後に、または仮想スピーカーが上側と下側の水平バンド値内にないとき(「NO」216)、3Dレンダラ決定ユニット48Cは、中間水平面に沿って仮想スピーカーを現実のスピーカーにマッピングするために使用される3Dレンダラの水平面部分を生成するために、3D VBAPパンニング(または仮想スピーカーを現実のスピーカーにマッピングする任意の他の形態または方法)を実行し得る。
[0102] 3Dレンダラ決定ユニット48Cは、仮想スピーカーの各規則的な幾何学的配置位置にわたってループするとき、下半球仮想スピーカーが、下半球データにおいて指定された下半球仰角限界を下回るかどうかを決定するために、下半球においてそれらの仮想スピーカーを評価し得る(222)。3Dレンダラ決定ユニット48Cは、上半球仮想スピーカーが、上半球データにおいて指定された上半球仰角限界を上回るかどうかを決定するために、これらの上半球仮想スピーカーに関して同様の評価を実行し得る(224)。下半球仮想スピーカーの場合は下回るか、または上半球仮想スピーカーの場合は上回るとき(「YES」226、228)、3Dレンダラ決定ユニット48Cは、それぞれ、識別された下側デュープレットと上側デュープレットとでパンニングを実行して(230、232)、仮想スピーカーの仰角をクリッピングするパンニングリングと呼ばれ得るものを効果的に作成し得、所与の半球の水平バンドの上側に現実のスピーカー間でそれをパンニングする。
[0103] 3Dレンダラ決定ユニット(3D renderer determination unit)48Cは、次いで、3D VBAPパンニング行列を下側デュープレットパンニング行列および上側デュープレットパンニング行列と合成し(234)、合成されたパンニング行列で行列マルチプル3Dレンダラへの行列乗算を実行し得る(236)。3Dレンダラディタメーションユニット(3D renderer determation unit)48Cは、次いで、(図6の例では次数’として示された)許容次数と次数nとの間の差をゼロパディングし(238)、不規則な3Dレンダラを出力し得る。
[0104] このようにして、本技法は、レンダラ決定ユニット40が、球面調和係数が関連付けられた球面基底関数の許容次数を決定することと、許容次数が、レンダリングされることを必要とされる球面調和係数のものを識別する、決定された許容次数に基づいてレンダラを決定することとを可能にし得る。
[0105] いくつかの例では、レンダラ決定ユニット40許容次数は、球面調和係数の再生のために使用されるスピーカーの決定されたローカルスピーカー幾何学的配置を鑑みてレンダリングされることに必要とされる球面調和係数のものを識別する。
[0106] いくつかの例では、レンダラ決定ユニット40は、レンダラを決定するとき、レンダラが、決定された許容次数よりも小さいかまたはそれに等しい次数を有する球面基底関数に関連付けられた球面調和係数のもののみをレンダリングするように、レンダラを決定し得る。
[0107] いくつかの例では、レンダラ決定ユニット40はし得る、許容次数は、球面調和係数が関連付けられた球面基底関数の最大次数Nよりも小さい。
[0108] いくつかの例では、レンダラ決定ユニット40は、マルチチャネルオーディオデータを生成するために、決定されたレンダラを使用して球面調和係数をレンダリングし得る。
[0109] いくつかの例では、レンダラ決定ユニット40は、球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定し得る。レンダラを決定するとき、レンダラ決定ユニット40は、決定された許容次数とローカルスピーカー幾何学的配置とに基づいてレンダリングを決定し得る。
[0110] いくつかの例では、レンダラ決定ユニット40は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置がステレオスピーカー幾何学的配置に合致するときに許容次数の球面調和係数のものをレンダリングするためにステレオレンダラを決定し得る。
[0111] いくつかの例では、レンダラ決定ユニット40は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置が、3つ以上のスピーカーを有する水平マルチチャネルスピーカー幾何学的配置に合致するときに許容次数の球面調和係数のものをレンダリングするために水平マルチチャネルレンダラを決定し得る。
[0112] いくつかの例では、レンダラ決定ユニット40は、水平マルチチャネルレンダラを決定するとき、決定されたローカルスピーカー幾何学的配置が不規則なスピーカー幾何学的配置を示すときに許容次数の球面調和係数のものをレンダリングするために不規則な水平マルチチャネルレンダラを決定し得る。
[0113] いくつかの例では、レンダラ決定ユニット40は、水平マルチチャネルレンダラを決定するとき、決定されたローカルスピーカー幾何学的配置が規則的なスピーカー幾何学的配置を示すときに許容次数の球面調和係数のものをレンダリングするために規則的な水平マルチチャネルレンダラを決定し得る。
[0114] いくつかの例では、レンダラ決定ユニット40は、ローカルスピーカー幾何学的配置に基づいてレンダラを決定するとき、ローカルスピーカー幾何学的配置が、2つ以上の水平面上に3つ以上のスピーカーを有する3次元マルチチャネルスピーカー幾何学的配置を合致するときに許容次数の球面調和係数のものをレンダリングするために3次元マルチチャネルレンダラを決定し得る。
[0115] いくつかの例では、レンダラ決定ユニット40は、3次元マルチチャネルレンダラを決定するとき、決定されたローカルスピーカー幾何学的配置が不規則なスピーカー幾何学的配置を示すときに許容次数の球面調和係数のものをレンダリングするために不規則な3次元マルチチャネルレンダラを決定し得る。
[0116] いくつかの例では、レンダラ決定ユニット40は、3次元マルチチャネルレンダラを決定するとき、決定されたローカルスピーカー幾何学的配置がほぼ規則的なスピーカー幾何学的配置を示すときに許容次数の球面調和係数のものをレンダリングするためにほぼ規則的な3次元マルチチャネルレンダラを決定し得る。
[0117] いくつかの例では、レンダラ決定ユニット40は、3次元マルチチャネルレンダラを決定するとき、決定されたローカルスピーカー幾何学的配置が規則的なスピーカー幾何学的配置を示すときに許容次数の球面調和係数のものをレンダリングするために規則的な3次元マルチチャネルレンダラを決定し得る。
[0118] いくつかの例では、レンダラ決定ユニット40は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を指定する入力を聴取者から受信し得る。
[0119] いくつかの例では、レンダラ決定ユニット40は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を指定する入力を、グラフィカルユーザインターフェースを介して聴取者から受信し得る。
[0120] いくつかの例では、レンダラ決定ユニット40は、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するとき、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を自動的に決定し得る。
[0121] 図9は、不規則な3Dレンダラを決定するときに下半球処理と上半球処理とを実行する際の、図4の例に示された3Dレンダラ生成ユニット48Cの例示的な動作を示す流れ図である。図9の例に示されたプロセスに関するさらなる情報は、上記の米国仮出願第U.S.61/762,302号において見つけられ得る。図9の例に示されたプロセスは、図8Bに関して上記で説明された下半球処理または上半球処理を表し得る。
[0122] 初めに、3Dレンダラ決定ユニット48Cが、ローカルスピーカー幾何学的配置情報41を受信し、第1の半球の現実のスピーカーロケーションを決定し得る(250、252)。3Dレンダラ決定ユニット48Cは、次いで、第1の半球を反対側の半球上に複製し、HOA次数の幾何学的配置を使用して球面調和を生成し得る(254、256)。3Dレンダラ決定ユニット48Cは、ローカルスピーカー幾何学的配置の規則性(または均一性)を示し得る条件数を決定し得る(258)。条件数がしきい値数よりも小さいか、または現実のスピーカー間の最大絶対値仰角差が90度に等しいとき(「YES」260)、3Dレンダラ決定ユニット48Cは、0の伸長値(stretch value)と、sign(90)の2Dパンニング限界値と、0の水平バンド値とを含む半球データを決定し得る(262)。上述されたように、伸長値は、現実のスピーカー間の角距離を「伸長(stretch)」すべき量と、パンニングをいくつかのしきい値高さに限定するためのパンニング限界を指定し得る2Dパンニング限界と、スピーカーが同じ水平面において考慮される水平高さバンドを指定し得る水平バンド量とを示す。
[0123] 3Dレンダラ決定ユニット48Cはまた、最も高い/最も低い(上半球処理が実行されるのか下半球処理が実行されるのかに応じた)スピーカーのアジマス(azimuth)の角距離を決定し得る(264)。条件数がしきい値数よりも大きいか、または現実のスピーカー間の最大絶対値仰角差が90度に等しくないとき(「YES」260)、3Dレンダラ決定ユニット48Cは、最大絶対値仰角差が0よりも大きいかどうか、および最大角距離がしきい値角距離よりも小さいかどうかを決定し得る(266)。最大絶対値仰角差が0よりも大きく、最大角距離がしきい値角距離よりも小さいとき(「YES」266)、3Dレンダラ決定ユニット48Cは、次いで、仰角の最大絶対値が70よりも大きいかどうかを決定し得る(268)。
[0124] 仰角の最大絶対値が70よりも大きいとき(「YES」268)、3Dレンダラ決定ユニット48Cは、0に等しい伸長値と、仰角の絶対値の最大値の符号に等しい2Dパンニング限界と、0に等しい水平バンド値とを含む半球データを決定する(270)。仰角の最大絶対値が70よりも小さいかまたはそれに等しいとき(「NO」268)、3Dレンダラ決定ユニット48Cは、10−仰角の最大絶対値×70×10に等しい伸長値と、仰角の絶対値の最大値の符号付き形式−伸長値に等しい2Dパンニング限界と、仰角の最大絶対値の符号付き形式×0.1に等しい水平バンド値とを含む半球データを決定し得る(272)。
[0125] 最大絶対値仰角差が0よりも小さいかまたはそれに等しいか、あるいは最大角距離がしきい値角距離よりも大きいかまたはそれに等しいとき(「NO」266)、3Dレンダラ決定ユニット48Cは、次いで、仰角の絶対値の最小値が0に等しいかどうかを決定し得る(274)。仰角の絶対値の最小値が0に等しいとき(「YES」274)、3Dレンダラ決定ユニット48Cは、0に等しい伸長値と、0に等しい2Dパンニング限界と、0に等しい水平バンド値と、仰角が0に等しい現実のスピーカーのインデックスを識別する制限半球値とを含む半球データを決定し得る(276)。仰角の絶対値の最小値が0に等しくないとき(「NO」274)、3Dレンダラ決定ユニット48Cは、最低仰角スピーカーのインデックスに等しい制限半球値を決定し得る(278)。3Dレンダラ決定ユニット48Cは、次いで、仰角の最大絶対値が70よりも大きいかどうかを決定し得る(280)。
[0126] 仰角の最大絶対値が70よりも大きいとき(「YES」280)、3Dレンダラ決定ユニット48Cは、0に等しい伸長値と、仰角の絶対値の最大値の符号付き形式に等しい2Dパンニング限界と、0に等しい水平バンド値とを含む半球データを決定し得る(282)。仰角の最大絶対値が70よりも小さいかまたはそれに等しいとき(「NO」280)、3Dレンダラ決定ユニット48Cは、10−仰角の最大絶対値×70×10に等しい伸長値と、仰角の絶対値の最大値の符号付き形式−伸長値に等しい2Dパンニング限界と、仰角の最大絶対値の符号付き形式×0.1に等しい水平バンド値とを含む半球データを決定し得る(282)。
[0127] 図10は、本開示に記載された技法に従ってどのようにステレオレンダラが生成され得るかを示すユニット空間におけるグラフ299を示す図である。図10の例に示されているように、仮想スピーカー300A〜300Hは、(いわゆる「スイートスポット」を中心とする)ユニット球体を二等分する水平面の円周の周りに均一な幾何学的配置で配置される。物理スピーカー302Aおよび302Bは、仮想スピーカー300Aから測定されて(それぞれ)30度および−30度の角距離に配置される。ステレオレンダラ決定ユニット48Aは、上記でより詳細に説明された様式で仮想スピーカー300Aを物理スピーカー302Aおよび302Bにマッピングするステレオレンダラ34を決定し得る。
[0128] 図11は、本開示に記載された技法に従ってどのように不規則な水平レンダラが生成され得るかを示すユニット空間におけるグラフ304を示す図である。図11の例に示されているように、仮想スピーカー300A〜300Hは、(いわゆる「スイートスポット」を中心とする)ユニット球体を二等分する水平面の円周の周りに均一な幾何学的配置で配置される。物理スピーカー302A〜302D(「物理スピーカー(physical speaker)302」)は、水平面の円周の周りに不規則に配置される。水平レンダラ決定ユニット48Bは、上記でより詳細に説明された様式で仮想スピーカー300A〜300H(「仮想スピーカー(virtual speaker)300」)を物理スピーカー302にマッピングする不規則な水平レンダラ34を決定し得る。
[0129] 水平レンダラ決定ユニット48Bは、仮想スピーカー300を(最も小さい角距離を有することに関して)仮想スピーカーの各々に最も近い現実のスピーカー302のうちの2つにマッピングし得る。マッピングは次の表に記載されている。
[0130] 図12Aおよび図12Bは、本開示で説明される技法に従ってどのように不規則な3Dレンダラが生成され得るかを示すグラフ306Aおよび306Bを示す図である。図12Aの例では、グラフ306Aは、伸長されたスピーカーロケーション308A〜308H(「伸長されたスピーカーロケーション(stretched speaker location)308」)を含む。3Dレンダラ決定ユニット48Cは、図9の例に関して上記で説明された様式で伸長された現実のスピーカーロケーション308を有する半球データを識別し得る。グラフ306Aはまた、伸長されたスピーカーロケーション308に対して現実のスピーカーロケーション302A〜302H(「現実のスピーカーロケーション(real speaker location)302」)を示しており、ここで、いくつかの事例では、現実のスピーカーロケーション302は、伸長されたスピーカーロケーション308と同じであり、他の事例では、現実のスピーカーロケーション302は、伸長されたスピーカーロケーション308と同じではない。
[0131] グラフ306Aはまた、上側2Dパンニングデュープレットを表す上側2Dパンニング補間ライン310Aと、下側2Dパンニングデュープレットを表す下側2Dパンニング補間ライン310Bとを含み、それらの各々については、図8の例に関して上記でより詳細に説明されている。手短に言えば、3Dレンダラ決定ユニット48Cは、上側2Dパンニングデュープレットに基づいて上側2Dパンニング補間ライン310Aを決定し、下側2Dパンニングデュープレットに基づいて下側2Dパンニング補間ライン310Bを決定し得る。上側2Dパンニング補間ライン310Aは上側2Dパンニング行列を表し得、一方、下側2Dパンニング補間ライン310Bは下側2Dパンニング行列を表し得る。上記で説明されたこれらの行列は、次いで、3D VBAP行列および規則的な幾何学的配置レンダラと合成されて、不規則な3Dレンダラ34が生成され得る。
[0132] 図12Bの例では、グラフ306Bはグラフ306Aに仮想スピーカー300を追加し、ここで、伸長されたスピーカーロケーション308への仮想スピーカー300のマッピングを示すラインとの不要な混同を回避するために、仮想スピーカー300は図12Bの例では正式に示されていない。典型的には、上記で説明されたように、3Dレンダラ決定ユニット48Cは、図11および図12の水平例に示されたものと同様に、仮想スピーカー300の各々を、仮想スピーカーに最も近い角距離を有する伸長されたスピーカーロケーション308のうちの2つ以上にマッピングする。したがって、不規則な3Dレンダラは、図12Bの例に示された様式で、仮想スピーカーを、伸長されたスピーカーロケーションにマッピングし得る。
[0133] したがって、本技法は、第1の例では、音場を表す球面調和係数の再生のために使用される1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するための手段、たとえば、レンダラ決定ユニット40と、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定するための手段、たとえば、レンダラ決定ユニット40とを備える、オーディオ再生システム32などのデバイスを提供し得る。
[0134] 第2の例では、第1の例のデバイスは、マルチチャネルオーディオデータを生成するために、決定された2次元レンダラまたは3次元レンダラを使用して球面調和係数をレンダリングするための手段、たとえば、オーディオレンダラ34をさらに備え得る。
[0135] 第3の例では、第1の例のデバイス、ここにおいて、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定するための手段は、ローカルスピーカー幾何学的配置がステレオスピーカー幾何学的配置に合致するとき、2次元ステレオレンダラを決定するための手段、たとえば、ステレオレンダラ生成ユニット48Aを備え得る。
[0136] 第4の例では、第1の例のデバイス、ここにおいて、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定するための手段は、ローカルスピーカー幾何学的配置が、3つ以上のスピーカーを有する水平マルチチャネルスピーカー幾何学的配置に合致するとき、水平2次元マルチチャネルレンダラを決定するための手段、たとえば、水平レンダラ生成ユニット48Bを備える。
[0137] 第5の例では、第4の例のデバイス、ここにおいて、水平2次元マルチチャネルレンダラを決定するための手段は、図7の例に関して説明されたように、決定されたローカルスピーカー幾何学的配置が不規則なスピーカー幾何学的配置を示すとき、不規則な水平2次元マルチチャネルレンダラを決定するための手段を備える。
[0138] 第6の例では、第4の例のデバイス、ここにおいて、水平2次元マルチチャネルレンダラを決定するための手段は、図7の例に関して説明されたように、決定されたローカルスピーカー幾何学的配置が規則的なスピーカー幾何学的配置を示すとき、規則的な水平2次元マルチチャネルレンダラを決定するための手段を備える。
[0139] 第7の例では、第1の例のデバイス、ここにおいて、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定するための手段は、ローカルスピーカー幾何学的配置が、2つ以上の水平面上に3つ以上のスピーカーを有する3次元マルチチャネルスピーカー幾何学的配置に合致するとき、3次元マルチチャネルレンダラを決定するための手段、たとえば、3Dレンダラ生成ユニット48Cを備える。
[0140] 第8の例では、第7の例のデバイス、ここにおいて、3次元マルチチャネルレンダラを決定するための手段は、図8Aおよび図8Bの例に関して上記で説明されたように、決定されたローカルスピーカー幾何学的配置が不規則なスピーカー幾何学的配置を示すとき、不規則な3次元マルチチャネルレンダラを決定するための手段を備える。
[0141] 第9の例では、第7の例のデバイス、ここにおいて、3次元マルチチャネルレンダラを決定するための手段は、図8Aの例に関して上記で説明されたように、決定されたローカルスピーカー幾何学的配置がほぼ規則的なスピーカー幾何学的配置を示すとき、ほぼ規則的な3次元マルチチャネルレンダラを決定するための手段を備える。
[0142] 第10の例では、第7の例のデバイス、ここにおいて、3次元マルチチャネルレンダラを決定するための手段は、図8Aの例に関して上記で説明されたように、決定されたローカルスピーカー幾何学的配置が規則的なスピーカー幾何学的配置を示すとき、規則的な3次元マルチチャネルレンダラを決定するための手段を備える。
[0143] 第11の例では、第1の例のデバイス、ここにおいて、レンダラを決定するための手段は、図5〜図8Bの例に関して上記で説明されたように、球面調和係数が関連付けられた球面基底関数の許容次数を決定するための手段と、許容次数が、決定されたローカルスピーカー幾何学的配置を鑑みてレンダリングされることを必要とされる球面調和係数のものを識別する、決定された許容次数に基づいてレンダラを決定するための手段とを備える。
[0144] 第12の例では、第1の例のデバイス、ここにおいて、2次元レンダラまたは3次元レンダラを決定するための手段は、図5〜図8Bの例に関して上記で説明されたように、球面調和係数が関連付けられた球面基底関数の許容次数を決定するための手段と、許容次数が、決定されたローカルスピーカー幾何学的配置を鑑みてレンダリングされることを必要とされる球面調和係数のものを識別する、2次元レンダラまたは3次元レンダラが、決定された許容次数よりも小さいかまたはそれに等しい次数を有する球面基底関数に関連付けられた球面調和係数のもののみをレンダリングするように、2次元レンダラまたは3次元レンダラを決定するための手段とを備える。
[0145] 第13の例では、第1の例のデバイス、ここにおいて、1つまたは複数のスピーカーのローカルスピーカー幾何学的配置を決定するための手段は、ローカルスピーカー幾何学的配置を記述するローカルスピーカー幾何学的配置情報を指定する入力を聴取者から受信するための手段を備える。
[0146] 第14の例では、第1の例のデバイス、ここにおいて、ローカルスピーカー幾何学的配置に基づいて2次元レンダラまたは3次元レンダラを決定することは、ローカルスピーカー幾何学的配置がモノスピーカー幾何学的配置に合致するとき、モノレンダラを決定すること、たとえば、モノレンダラ決定ユニット48Dを備える。
[0147] 図13A〜図13Dは、本開示で説明される技法に従って形成されるビットストリーム31A〜31Dを示す図である。図13Aの例では、ビットストリーム31Aは、図3の例に示されたビットストリーム31の一例を表し得る。ビットストリーム31Aは、信号値54を定義する1つまたは複数のビットを含むオーディオレンダリング情報39Aを含む。この信号値54は、以下で説明されるタイプの情報の任意の組合せを表し得る。ビットストリーム31Aはまた、オーディオコンテンツ51の一例を表し得るオーディオコンテンツ58を含む。
[0148] 図13Bの例では、ビットストリーム31Bはビットストリーム31Aと同様であり得、ここで、信号値54は、インデックス54Aと、シグナリングされる行列の行サイズ54Bを定義する1つまたは複数のビットと、シグナリングされる行列の列サイズ54Cを定義する1つまたは複数のビットと、行列係数54Dとを備える。インデックス54Aは2〜5ビットを使用して定義され得るが、行サイズ54Bと列サイズ54Cとの各々は2〜16ビットを使用して定義され得る。
[0149] 抽出デバイス38は、インデックス54Aを抽出し、行列がビットストリーム31B中に含まれることをそのインデックスがシグナリングするかどうかを決定し得る(ここで、0000または1111など、いくつかのインデックス値は、行列が明示的にビットストリーム31B中で指定されていることをシグナリングし得る)。図13Bの例では、ビットストリーム31Bは、行列が明示的にビットストリーム31B中で指定されていることをシグナリングするインデックス54Aを含む。その結果、抽出デバイス38は、行サイズ54Bと列サイズ54Cとを抽出し得る。抽出デバイス38は、行サイズ54Bと、列サイズ54Cと、各行列係数の(図13Aに示されていない)シグナリングされるかまたは暗黙的なビットサイズの関数として、行列係数を表すパースすべきビット数を計算するように構成され得る。決定されたビット数を使用して、抽出デバイス38は行列係数54Dを抽出し得、オーディオ再生デバイス24は、その行列係数54Dを使用して、上記で説明されたようにオーディオレンダラ34のうちの1つを構成し得る。ビットストリーム31B中でオーディオレンダリング情報39Bを1回シグナリングするものとして示されているが、オーディオレンダリング情報39Bは、ビットストリーム31B中で複数回シグナリングされるか、あるいは少なくとも部分的にまたは完全に別個のアウトオブバンドチャネル中で(いくつかの事例では随意のデータとして)シグナリングされ得る。
[0150] 図13Cの例では、ビットストリーム31Cは、上記の図3の例に示されたビットストリーム31の一例を表し得る。ビットストリーム31Cは、この例ではアルゴリズムインデックス54Eを指定する信号値54を含むオーディオレンダリング情報39Cを含む。ビットストリーム31Cはオーディオコンテンツ58をも含む。アルゴリズムインデックス54Eは、上述されたように、2〜5ビットを使用して定義され得、ここで、このアルゴリズムインデックス54Eは、オーディオコンテンツ58をレンダリングするときに使用されるべきレンダリングアルゴリズムを識別し得る。
[0151] 抽出デバイス38は、アルゴリズムインデックス50Eを抽出し、行列がビットストリーム31C中に含まれることをアルゴリズムインデックス54Eがシグナリングするかどうかを決定し得る(ここで、0000または1111など、いくつかのインデックス値は、行列が明示的にビットストリーム31C中で指定されていることをシグナリングし得る)。図8Cの例では、ビットストリーム31Cは、行列が明示的にビットストリーム31C中で指定されていないことをシグナリングするアルゴリズムインデックス54Eを含む。その結果、抽出デバイス38は、アルゴリズムインデックス54Eをオーディオ再生デバイスに転送し、オーディオ再生デバイスは、(利用可能な場合は)対応する1つ、(図3および図4の例ではレンダラ34として示されている)レンダリングアルゴリズムを選択する。図13Cの例では、ビットストリーム31C中でオーディオレンダリング情報39Cを1回シグナリングするものとして示されているが、オーディオレンダリング情報39Cは、ビットストリーム31C中で複数回シグナリングされるか、あるいは少なくとも部分的にまたは完全に別個のアウトオブバンドチャネル中で(いくつかの事例では随意のデータとして)シグナリングされ得る。
[0152] 図13Dの例では、ビットストリーム31Cは、上記の図4、図5および図8に示されたビットストリーム31の一例を表し得る。ビットストリーム31Dは、この例では行列インデックス54Fを指定する信号値54を含むオーディオレンダリング情報39Dを含む。ビットストリーム31Dはオーディオコンテンツ58をも含む。行列インデックス54Fは、上述されたように、2〜5ビットを使用して定義され得、ここで、この行列インデックス54Fは、オーディオコンテンツ58をレンダリングするときに使用されるべきレンダリングアルゴリズムを識別し得る。
[0153] 抽出デバイス38は、行列インデックス50Fを抽出し、行列がビットストリーム31D中に含まれることを行列インデックス54Fがシグナリングするかどうかを決定し得る(ここで、0000または1111など、いくつかのインデックス値は、行列が明示的にビットストリーム31C中で指定されていることをシグナリングし得る)。図8Dの例では、ビットストリーム31Dは、行列が明示的にビットストリーム31D中で指定されていないことをシグナリングする行列インデックス54Fを含む。その結果、抽出デバイス38は、行列インデックス54Fをオーディオ再生デバイスに転送し、オーディオ再生デバイスは、(利用可能な場合は)対応する1つ、レンダラ34を選択する。図13Dの例では、ビットストリーム31D中でオーディオレンダリング情報39Dを1回シグナリングするものとして示されているが、オーディオレンダリング情報39Dは、ビットストリーム31D中で複数回シグナリングされるか、あるいは少なくとも部分的にまたは完全に別個のアウトオブバンドチャネル中で(いくつかの事例では随意のデータとして)シグナリングされ得る。
[0154] 図14Aおよび図14Bは、本開示で説明される技法の様々な態様を実行し得る3Dレンダラ決定ユニット48Cの別の例である。すなわち、3Dレンダラ決定ユニット48Cは、仮想スピーカーが、球体幾何学的配置を二等分する水平面よりも下側の球体幾何学的配置において配置されたとき、仮想スピーカーをその水平面上のロケーションに投射することと、再現される音場が、仮想スピーカーの投射されたロケーションから発生するように思われる少なくとも1つの音を含むように、音場を再現する第1の複数のラウドスピーカーチャネル信号を生成するとき、音場を記述する要素の階層セット上で2次元パンニングを実行することと、を行うように構成されたユニットを表し得る。
[0155] 図14Aの例では、3Dレンダラ決定ユニット48Cは、SHC27’を受信し、仮想ラウドスピーカーt設計レンダリングを実行するように構成されたユニットを表し得る仮想スピーカーレンダラ350を呼び出し得る。仮想スピーカーレンダラ350は、SCH27’をレンダリングし、所与の数(たとえば、22個または32個)の仮想スピーカーのためのラウドスピーカーチャネル信号を生成し得る。
[0156] 3Dレンダラ決定ユニット48Cはさらに、球面重み付けユニット352と、上半球3Dパンニングユニット354と、イヤレベル2Dパンニングユニット356と、下半球2Dパンニングユニット358とを含む。球面重み付けユニット352は、いくつかのチャネルを重み付けするように構成されたユニットを表し得る。上半球3Dパンニングユニット354は、球状に重み付けされた仮想ラウドスピーカーチャネル信号上で、様々な上半球の物理スピーカー、または、言い換えれば、現実のスピーカーの間でこれらの信号をパンニングするように3Dパンニングを実行するように構成されたユニットを表す。イヤレベル半球2Dパンニングユニット356は、球状に重み付けされた仮想ラウドスピーカーチャネル信号上で、様々なイヤレベルの物理スピーカー、または、言い換えれば、現実のスピーカーの間でこれらの信号をパンニングするように2Dパンニングを実行するように構成されたユニットを表す。下半球2Dパンニングユニット358は、球状に重み付けされた仮想ラウドスピーカーチャネル信号上で、様々な下半球の物理スピーカー、または、言い換えれば、現実のスピーカーの間でこれらの信号をパンニングするように2Dパンニングを実行するように構成されたユニットを表す。
[0157] 図14Bの例では、3Dレンダリング決定ユニット48C’は、3Dレンダリング決定ユニット48C’が球面重み付けを実行しないことがあるかまたはさもなければ球面重み付けユニット352を含まないことがあることを除いて、図14Bに示されたものと同様であり得る。
[0158] いずれの場合も、典型的には、ラウドスピーカーフィードは、各ラウドスピーカーが球面波を生成すると仮定することによって計算される。そのようなシナリオでは、l番目のラウドスピーカーによる、ある位置r、θ、φにおける(周波数の関数としての)音圧は、
によって与えられ、
ただし、{rl、θl、φl}はl番目のラウドスピーカーの位置を表し、gl(ω)は、(周波数領域における)l番目のスピーカーのラウドスピーカーフィードである。すべての5つのスピーカーによる全音圧Ptは、したがって、
によって与えられる。
[0159] 我々はまた、5つのSHCに関する全圧力が次の式によって与えられることを知っている。
[0160] 上記の2つの式を同等とすることにより、次のようにSHCに関してラウドスピーカーフィードを表すための変換行列を使用することが可能になる。
[0161] この式は、5つのラウドスピーカーフィードと、選定されたSHCとの間に直接的な関係があることを示している。変換行列は、たとえば、サブセット(たとえば、基本セット)中でどのSHCが使用されたか、およびSH基底関数のどの定義が使用されるかに応じて変化し得る。同様に、選択された基本セットから異なるチャネルフォーマット(たとえば、7.1、22.2)に変換するための変換行列が構築され得る
[0162] 上記の式中の変換行列によってスピーカーフィードからSHCへの変換が可能になるが、SHCで開始し、我々が5つのチャネルフィードを作り出すことができ、次いで、デコーダにおいて、(高度な(すなわち、非レガシー)レンダラが存在するとき)我々が場合によってはSHCに変換し戻すことができるように、我々は、行列が可逆であることを好むことがある。
[0163] 行列の可逆性を保証するために上記のフレームワークを操作する様々な方法が活用され得る。これらは、限定はしないが、ラウドスピーカーの位置を変化させること(たとえば、5.1システムの5つのラウドスピーカーのうちの1つまたは複数の位置を、依然としてそれらがITU−R BS.775−1規格によって指定された角度トレランスに従うように調整すること、T設計に従うものなど、トランスデューサの規則的な離間が、典型的には正常に作動する)、正規化技法(たとえば、周波数依存正規化)、ならびにフルランクおよび明確な固有値を保証するようにしばしば動作する様々な他の行列操作技法を含む。最後に、すべての操作の後に、修正された行列が実際に正しいおよび/または許容できるラウドスピーカーフィードを再現することを保証するために、5.1レンディションを聴覚心理的にテストすることが望ましいことがある。可逆性が保存される限り、SHCへの正しい復号を保証する逆問題は問題点でない。
[0164] (デコーダにおけるスピーカー幾何学的配置を指すことがある)いくつかのローカルスピーカー幾何学的配置では、可逆性を保証するために上記のフレームワークを操作するための上記で概説された方法は、望ましいとは言えない音像を生じることがある。すなわち、音再現は、キャプチャされているオーディオと比較されたとき、常に音の正しい定位を生じるとは限らない。この望ましいとは言えない音像を補正するために、本技法は、「仮想スピーカー(virtual speaker)」と呼ばれ得る概念を導入するようさらに拡張され得る。1つまたは複数のラウドスピーカーが、上述のITU−R BS.775−1などの規格によって指定された、いくつかの角度トレランスを有する特定のまたは定義された空間領域中で再配置または配置されることを要するのではなく、上記のフレームワークは、ベクトルベース振幅パンニング(VBAP:vector base amplitude panning)、距離ベースの振幅パンニング、または他の形態のパンニングなど、何らかの形態のパンニングを含むように修正され得る。説明のためにVBAPに焦点を当てると、VBAPは、「仮想スピーカー」として特徴づけられ得るものを効果的に導入し得る。VBAPは、概して、1つまたは複数のラウドスピーカーが、仮想スピーカーをサポートする1つまたは複数のラウドスピーカーのロケーションおよび/または角度のうちの少なくとも1つと異なるロケーションおよび角度のうちの1つまたは複数において仮想スピーカーから発生するように思われる音を効果的に出力するように、これらの1つまたは複数のラウドスピーカーへのフィードを修正し得る。
[0165] 例示のために、SHCに関してラウドスピーカーフィードを決定するための上記の式は、次のように修正され得る。
[0166] 上記の式において、VBAP行列はM行×N列のサイズであり、ただし、Mはスピーカーの数を示し(上記の式では5に等しくなるはずであり)、Nは仮想スピーカーの数を示す。VBAP行列は、聴取者の定義されたロケーションからスピーカーの位置の各々へのベクトルと、聴取者の定義されたロケーションから仮想スピーカーの位置の各々へのベクトルとの関数として計算され得る。上記の式中のD行列はN行×(order+1)2列のサイズであり得、ただし、orderはSH関数の次数を指し得る。D行列は次の行列を表し得る。
[0167] 事実上、VBAP行列は、スピーカーのロケーションと仮想スピーカーの位置とを考慮する「利得調整(gain adjustment)」と呼ばれ得るものを提供するM×N行列である。このようにしてパンニングを導入することにより、ローカルスピーカー幾何学的配置によって再現されたとき、より良質の像を生じるマルチチャネルオーディオのより良い再現がもたらされ得る。その上、この式にVBAPを組み込むことによって、本技法は、様々な規格において指定されているスピーカー幾何学的配置とは整合しない劣悪なスピーカー幾何学的配置を克服し得る。
[0168] 実際には、この式は、反転させられ、SHCを、以下で幾何学的配置Bと呼ばれることがあるラウドスピーカーの特定の幾何学的配置または構成のためのマルチチャネルフィードに変換し戻すために使用され得る。すなわち、この式は、g行列について解くために反転させられ得る。反転させられた式は次のようになり得る。
[0169] g行列は、この例では、5.1スピーカー構成における5つのラウドスピーカーの各々についてのスピーカー利得を表し得る。この構成において使用される仮想スピーカーロケーションは、5.1マルチチャネルフォーマット仕様または規格において定義されているロケーションに対応し得る。これらの仮想スピーカーの各々をサポートし得るラウドスピーカーのロケーションは、任意の数の知られているオーディオ定位技法を使用して決定され得、それらの多くは、(オーディオ/ビデオ受信機(A/V受信機)、テレビジョン、ゲーミングシステム、デジタルビデオディスクシステム、または他のタイプのヘッドエンドシステムなどの)ヘッドエンドユニットに対して各ラウドスピーカーのロケーションを決定するために特定の周波数を有するトーンを再生することを伴う。代替的に、ヘッドエンドユニットのユーザが、ラウドスピーカーの各々のロケーションを手動で指定し得る。いずれの場合も、これらの知られているロケーションと考えられる角度とを鑑みて、ヘッドエンドユニットは、利得について解き、VBAPを介して仮想ラウドスピーカーの理想的な構成を仮定し得る。
[0170] この点において、本技法は、デバイスまたは装置が、第1の複数の仮想ラウドスピーカーチャネル信号を発生するために、第1の複数のラウドスピーカーチャネル信号上でベクトルベース振幅パンニングまたは他の形態のパンニングを実行することを可能にし得る。これらの仮想ラウドスピーカーチャネル信号は、ラウドスピーカーが、仮想ラウドスピーカーから発生するように思われる音を発生することを可能にする、これらのラウドスピーカーに提供される信号を表し得る。その結果、第1の複数のラウドスピーカーチャネル信号上で第1の変換を実行するとき、本技法は、デバイスまたは装置が、音場を記述する要素の階層セットを発生するために、第1の複数の仮想ラウドスピーカーチャネル信号上で第1の変換を実行することを可能にし得る。
[0171] その上、本技法は、装置が、第2の複数のラウドスピーカーチャネル信号を発生するために要素の階層セット上で第2の変換を実行することを可能にし得、ここで、第2の複数のラウドスピーカーチャネル信号の各々は、対応する異なる空間領域に関連付けられ、ここで、第2の複数のラウドスピーカーチャネル信号は第2の複数の仮想ラウドスピーカーチャネルを備え、およびここで、第2の複数の仮想ラウドスピーカーチャネル信号は、対応する異なる空間領域に関連付けられる。本技法は、いくつかの事例では、デバイスが、第2の複数のラウドスピーカーチャネル信号を発生するために、第2の複数の仮想ラウドスピーカーチャネル信号上でベクトルベース振幅パンニングを実行することを可能にし得る。
[0172] 上記の変換行列は「モード整合(mode matching)」基準から導出されたが、音圧整合、エネルギー整合など、他の基準からも代替の変換行列が導出され得る。基本セット(たとえば、SHCサブセット)と従来のマルチチャネルオーディオとの間の変換を可能にする行列が導出され得ることと、また、(マルチチャネルオーディオの忠実度を低減しない)操作後に、可逆でもあるわずかに修正された行列も作成され得ることとで、十分である。
[0173] いくつかの事例では、パンニングが3次元空間において実行されるという意味で「3Dパンニング(3D panning)」と呼ばれることもある、上記で説明されたパンニングを実行するときに、上記で説明された3Dパンニングは、アーティファクトを導入するか、またはさもなければスピーカーフィードのより低品質な再生を生じることがある。例として説明するために、上記で説明された3Dパンニングは、図15Aおよび図15Bに示されている22.2スピーカー幾何学的配置に関して採用されることがある。
[0174] 図15Aおよび図15Bは、同じ22.2スピーカー幾何学的配置を示し、ここで、図15Aに示されたグラフ中の黒点は、(低周波スピーカーを除く)すべてのラウドスピーカー、22個のスピーカーのロケーションを示し、図15Bは、これらの同じスピーカーのロケーションを示すが、これらのスピーカーの(影つき半球の背後に位置するスピーカーをブロックする)半球位置性質をさらに定義する。いずれの場合も、実際のスピーカーのいくつか(その数は上記ではMとして示されている)は、実際にその半球において聴取者の耳の背後にあり、聴取者の頭は、図15Aおよび図15Bのグラフ中の(0,0,0)の(x,y,z)点の周りの半球中のどこかに配置される。その結果、聴取者の頭の背後にあるスピーカーを仮想化するように3Dパンニングを実行することを試みることは、特に、SHCを生成するときに通常仮定され、仮想スピーカーの位置を伴う図12Bの例に示されている、完全な球体の周りに均一に配置された仮想スピーカーを有する、32スピーカー球体(半球ではない)幾何学的配置を仮想化することを試みるとき、困難であり得る。
[0175] 本開示で説明される技法によれば、図14Aの例に示された3Dレンダラ決定ユニット48Cは、仮想スピーカーが、球体幾何学的配置を二等分する水平面よりも下側の球体幾何学的配置において配置されたとき、仮想スピーカーをその水平面上のロケーションに投射することと、再現される音場が、仮想スピーカーの投射されたロケーションから発生するように思われる少なくとも1つの音を含むように、音場を再現する第1の複数のラウドスピーカーチャネル信号を生成するとき、音場を記述する要素の階層セット上で2次元パンニングを実行することと、を行うようにユニットを表し得る。
[0176] 水平面は、いくつかの事例では、球体幾何学的配置を2つの等しい部分に二等分し得る。図16Aは、本開示で説明される技法による、仮想スピーカーが上方にその上に投射される、水平面402によって二等分された球体400を示している。仮想スピーカー300A〜300C、ここで、下側の仮想スピーカー300A〜300Cは、図14Aおよび図14Bの例に関して上記で概説された方法で2次元プランニングを実行するより前に、上記で具陳された様式で水平面402上に投射される。球体400を等しく二等分する水平面402上に投射されるものとして説明されているが、本技法は、仮想スピーカーを球体400内の任意の水平面(たとえば仰角)に投射し得る。
[0177] 図16Bは、本開示で説明される技法による、仮想スピーカーが下方にその上に投射される、水平面402によって二等分された球体400を示している。図16Bのこの例では、3Dレンダラ決定ユニット48Cが、仮想スピーカー300A〜300Cを水平面402に下に投射し得る。球体400を等しく二等分する水平面402上に投射されるものとして説明されているが、本技法は、仮想スピーカーを球体400内の任意の水平面(たとえば仰角)に投射し得る。
[0178] このようにして、本技法は、3Dレンダラ決定ユニット48Cが、幾何学的配置で配置された複数の仮想スピーカーのうちの1つの位置に対して複数の物理スピーカーのうちの1つの位置を決定することと、決定された位置に基づいて幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整することとを行うことを可能にし得る。
[0179] 3Dレンダラ決定ユニット48Cは、第1の複数のラウドスピーカーチャネル信号を生成するとき、要素の階層セット上で2次元パンニングに加えて第1の変換を実行するようにさらに構成され得、ここにおいて、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる空間領域に関連付けられる。この第1の変換は、上記の式においてD-1として反映され得る。
[0180] 3Dレンダラ決定ユニット48Cは、要素の階層セット上で2次元パンニングを実行するとき、第1の複数のラウドスピーカーチャネル信号を生成するときに要素の階層セット上で2次元ベクトルベース振幅パンニング(two dimensional vector base amplitude panning)を実行するようにさらに構成され得る。
[0181] いくつかの事例では、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる定義された空間領域に関連付けられる。さらに、これらの異なる定義された空間領域は、オーディオフォーマット仕様およびオーディオフォーマット規格のうちの1つまたは複数において定義される。
[0182] 3Dレンダラ決定ユニット48Cは、同じくまたは代替的に、仮想スピーカーが、球体幾何学的配置においてイヤレベルでまたはその近くで水平面の近くに球体幾何学的配置で配置されたとき、再現される音場が、仮想スピーカーのロケーションから発生するように思われる少なくとも1つの音を含むように、音場を再現する第1の複数のラウドスピーカーチャネル信号を生成するときに、音場を記述する要素の階層セット上で2次元パンニングを実行するように構成され得る。
[0183] このコンテキストでは、3Dレンダラ決定ユニット48Cは、第1の複数のラウドスピーカーチャネル信号を生成するとき、要素の階層セット上で2次元パンニングに加えて(同じく上述のD-1変換を指し得る)第1の変換を実行するようにさらに構成され得、ここで、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる空間領域に関連付けられる。
[0184] その上、3Dレンダラ決定ユニット48Cは、要素の階層セット上で2次元パンニングを実行するとき、第1の複数のラウドスピーカーチャネル信号を生成するときに要素の階層セット上で2次元ベクトルベース振幅パンニングを実行するようにさらに構成され得る。
[0185] いくつかの事例では、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる定義された空間領域に関連付けられる。さらに、これらの異なる定義された空間領域は、オーディオフォーマット仕様およびオーディオフォーマット規格のうちの1つまたは複数において定義され得る。
[0186] 本開示で説明される技法の他の態様のいずれかの代替としてまたはそれと併せて、デバイス10の1つまたは複数のプロセッサは、仮想スピーカーが、球体幾何学的配置を二等分する水平面の上側に球体幾何学的配置で配置されたとき、音場が、仮想スピーカーのロケーションから発生するように思われる少なくとも1つの音を含むように、音場を記述する第1の複数のラウドスピーカーチャネル信号を生成するときに要素の階層セット上で3次元パンニングを実行するようにさらに構成され得る。
[0187] この場合も、このコンテキストでは、3Dレンダラ決定ユニット48Cは、第1の複数のラウドスピーカーチャネル信号を生成するとき、要素の階層セット上で3次元パンニングに加えて第1の変換を実行するようにさらに構成され得、ここにおいて、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる空間領域に関連付けられる。
[0188] その上、3Dレンダラ決定ユニット48Cは、要素の階層セット、第1の複数のラウドスピーカーチャネル信号上で3次元パンニングを実行するとき、第1の複数のラウドスピーカーチャネル信号を生成するときに要素の階層セット上で3次元ベクトルベース振幅パンニングを実行するようにさらに構成され得る。いくつかの事例では、第1の複数のラウドスピーカーチャネル信号の各々は、対応する異なる定義された空間領域に関連付けられる。さらに、これらの異なる定義された空間領域は、オーディオフォーマット仕様およびオーディオフォーマット規格のうちの1つまたは複数において定義され得る。
[0189] 本開示で説明される技法の他の態様のいずれかの代替としてまたはそれと併せて、3Dレンダラ決定ユニット48Cは、要素の階層セットからの複数のラウドスピーカーチャネル信号の生成において3次元パンニングと2次元パンニングの両方を実行するとき、要素の階層セットの各々の次数に基づいて要素の階層セットに対して重み付けを実行するようにさらに構成され得る。
[0190] 3Dレンダラ決定ユニット48Cは、重み付けを実行するとき、要素の階層セットの各々の次数に基づいて要素の階層セットに対してウィンドウ関数を実行するようにさらに構成され得る。このウィンドウ処理関数は図17の例に示され得、ただし、y軸はデシベルを反映し、x軸はSHCの次数を示す。その上、デバイス10の1つまたは複数のプロセッサは、重み付けを実行するとき、要素の階層セットの各々の次数に基づいて要素の階層セットに対して、一例として、カイザーベッスルウィンドウ関数(Kaiser Bessle window function)を実行するようにさらに構成され得る。
[0191] これらの1つまたは複数のプロセッサは、各々、これらの1つまたは複数のプロセッサにあるとされる様々な機能を実行するための手段を表し得る。他の手段は、単独であるいは本開示で説明される技法の組合せで様々な態様を実行し得るソフトウェアを実行することに専用のまたはそれが可能な、専用特定用途向けハードウェア、フィールドプログラマブルゲートアレイ、特定用途向け集積回路または任意の他の形態のハードウェアを含み得る。
[0192] 本技法によって識別され、潜在的に解決される問題は、以下のように要約され得る。高次アンビソニックス/球面調和係数サラウンド音素材の忠実に再生にとって、ラウドスピーカーの配置は重要であり得る。理想的には、等距離のラウドスピーカーの3次元球体が望まれ得る。実世界では、現在のラウドスピーカーセットアップは、典型的には、1)等しく分散されず、2)聴取者の周りと上側の上半球にのみ存在し、下側の下半球には存在せず、3)レガシーサポート(たとえば、5.1スピーカーセットアップ)のために、通常は耳の高さにラウドスピーカーのリングを有する。この問題に対処し得る1つの戦略は、(以下で、「t設計(t-design)」と呼ばれる)理想的なラウドスピーカーレイアウトを仮想的に作成すること、および、これらの仮想ラウドスピーカーを、3次元ベクトルベース振幅パンニング(3D−VBAP)方法を介して現実の(非理想的に配置された)ラウドスピーカー上に投射することである。たとえそうでも、下半球からの仮想ラウドスピーカーの投射により、再生の品質を劣化させる強度の定位誤差および他の知覚アーティファクトが生じ得るので、これは問題への最適な解決策を表さないことがある。
[0193] 本開示で説明される技法の様々な態様は、上記で概説された戦略の欠陥を克服し得る。本技法は、以下のように、仮想ラウドスピーカー信号の様々な取扱いを提供し得る。本技法の第1の態様は、デバイス10が、2次元パンニング方法を使用して、下半球から水平面上に来て2つの最も近い現実のラウドスピーカー上に投射される仮想ラウドスピーカーを直交してマッピングすることを可能にし得る。その結果、本技法の第1の態様は、間違って投射された仮想ラウドスピーカーによって引き起こされる定位誤差を最小化、低減または除去し得る。第2に、耳の高さ(またはその周り)にある上半球中の仮想ラウドスピーカーも、本開示で説明される技法の第2の態様に従って2次元パンニング方法を使用して、2つの最も近いラウドスピーカーに投射され得る。この第2の修正形態の背後にある理由は、人間は、アジマス方向の知覚と比較して、仰角の音源の知覚はそれほど正確でないことがあるからであり得る。VBAPは、仮想音源のアジマス方向の作成は正確であることが概して知られているが、仰角の音の作成は比較的不正確であり、しばしば、知覚される仮想音源は、意図されたよりも高い仰角で知覚される。本技法の第2の態様は、それから恩恵を受けることがなく品質の劣化さえ生じるであろう、空間エリア中で3D−VBAPを使用することを回避する。
[0194] 本技法の第3の態様は、イヤレベルの上側の上半球のすべての残りの仮想ラウドスピーカーが、従来の3次元パンニング方法を使用して投射されることである。いくつかの事例では、本技法の第4の態様が実行され得、ここでは、すべての高次アンビソニックス/球面調和係数サラウンド音素材は、素材のより滑らかな空間再現を高めるために、球面調和次数の関数として重み付け関数を使用して重み付けされる。これは、2Dおよび3Dパンニングされた仮想ラウドスピーカーのエネルギーを整合させるために潜在的に有益であることが示されている。
[0195] 本開示で説明される技法の各態様を実行するものとして示されているが、3Dレンダラ決定ユニット48Cは、本開示で説明される態様の任意の組合せを実行し、上記4つの態様のうちの1つまたは複数を実行し得る。いくつかの事例では、球面調和係数を生成する異なるデバイスが、本技法の様々な態様を相互的様式で実行し得る。冗長性を回避するために詳細に説明されていないが、本開示の技法は、図14Aの例に厳密に限定されるべきではない。
[0196] 上記のセクションでは、5.1互換システムのための設計について論じた。詳細は、異なるターゲットフォーマットのために相応に調整され得る。一例として、7.1システムのための互換性を可能にするために、行列が可逆になるように、2つの余分のオーディオコンテンツチャネルが互換要件に追加され、2つのさらなるSHCが基本セットに追加され得る。7.1システムのための大多数のラウドスピーカー配置(たとえば、ドルビーTrueHD)は依然として水平面上にあるので、SHCの選択は、高さ情報による選択を依然として除外することができる。このようにして、水平面信号レンダリングは、レンダリングシステム中の追加されたラウドスピーカーチャネルから恩恵を受けることになる。高さダイバーシティをもつラウドスピーカーを含むシステム(たとえば、9.1、11.1および22.2システム)では、高さ情報をもつSHCを基本セット中に含めることが望ましいることがある。ステレオおよびモノのようにより少ないチャネル数では、既存の5.1ソリューション インは、コンテンツ情報を維持するためにダウンミックス(downmix)をカバーするのに十分であり得る。
[0197] このように、上記のことは、要素の階層セット(たとえば、SHCのセット)と、複数のオーディオチャネルとの間で変換するためのロスレス機構を表す。マルチチャネルオーディオ信号がさらなるコーディング雑音を受けない限り、どんな誤差も発生しない。それらがコーディング雑音を受ける場合、SHCへの変換は誤差を発生し得る。しかしながら、それらの影響を低減するために係数の値を監視し、適切なアクションを取ることによって、これらの誤差をなくすことが可能である。これらの方法は、SHC表現における固有の冗長性を含む、SHCの特性を考慮に入れ得る。
[0198] 本明細書で説明される手法は、音場のSHCベースの表現の使用における潜在的欠点に対する解決策を提供する。この解決策がなければ、何百万ものレガシー再生システムにおいて機能を有することが可能ではないことによって強いられる顕著な欠点により、SHCベースの表現は展開されないであろう。
[0199]したがって、本技法は、第1の例では、複数の物理スピーカーのうちの1つと幾何学的配置で配置された複数の仮想スピーカーのうちの1つとの間の位置の差を決定するための手段、たとえば、レンダラ決定ユニット40と、位置の決定された差に基づいて、および複数の仮想スピーカーを複数の物理スピーカーにマッピングするより前に、幾何学的配置内の複数の仮想スピーカーのうちの1つの位置を調整するための手段、たとえば、レンダラ決定ユニット40とを備えるデバイスを提供し得る。
[0200] 第2の例では、第1の例のデバイス、ここにおいて、位置の差を決定するための手段は、複数の物理スピーカーのうちの1つと複数の仮想スピーカーのうちの1つとの間の仰角の差を決定するための手段、たとえば、3Dレンダラ決定ユニット48Cを備える。
[0201] 第3の例では、第1の例のデバイス、ここにおいて、図8A〜図9および図14A〜図16Bの例に関して上記でより詳細に説明されたように、位置の差を決定するための手段は、複数の物理スピーカーのうちの1つと複数の仮想スピーカーのうちの1つとの間の仰角の差を決定するための手段を備え、およびここにおいて、複数の仮想スピーカーのうちの1つの位置を調整するための手段は、仰角の決定された差がしきい値を超えるとき、複数の仮想スピーカーのうちの1つを複数の仮想スピーカーの元の仰角よりも低い仰角に投射するための手段を備える。
[0202] 第4の例では、第1の例のデバイス、ここにおいて、図8A〜図9および図14A〜図16Bの例に関して上記でより詳細に説明されたように、位置の差を決定するための手段は、複数の物理スピーカーのうちの1つと複数の仮想スピーカーのうちの1つとの間の仰角の差を決定するための手段を備え、およびここにおいて、複数の仮想スピーカーのうちの1つの位置を調整するための手段は、仰角の決定された差がしきい値を超えるとき、複数の仮想スピーカーのうちの1つを複数の仮想スピーカーのうちの1つの元の仰角よりも高い仰角に投射するための手段を備える。
[0203] 第5の例では、図8Aおよび図8Bの例に関して上記でより詳細に説明されたように、再現される音場が、仮想スピーカーの調整されたロケーションから発生するように思われる少なくとも1つの音を含むように、音場を再現するために、複数の物理スピーカーを駆動するための複数のラウドスピーカーチャネル信号を生成するとき、音場を記述する要素の階層セット上で2次元パンニングを実行するための手段をさらに備える、第1の例のデバイス。
[0204] 第6の例では、第5の例のデバイス、ここにおいて、要素の階層セットは、複数の球面調和係数を備える。
[0205] 第7の例では、第5の例のデバイス、ここにおいて、図8Aおよび図8Bの例に関して上記でより詳細に説明されたように、要素の階層セット上で2次元パンニングを実行するための手段は、複数のラウドスピーカーチャネル信号を生成するとき、要素の階層セット上で2次元ベクトルベースの振幅パンニングを実行するための手段を備える。
[0206] 第8の例では、図8A〜図12Bの例に関して上記でより詳細に説明されたように、複数の物理スピーカーのうちの対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するための手段をさらに備える、第1の例のデバイス。
[0207] 第9の例では、図8A〜図12Bの例に関して上記でより詳細に説明されたように、複数の物理スピーカーのうちの対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するための手段をさらに備える、第1の例のデバイス、ここにおいて、位置の差を決定するための手段は、複数の仮想スピーカーのうちの1つの位置に対して、伸長された物理スピーカー位置のうちの少なくとも1つとの間の差を決定するための手段を備える。
[0208] 第10の例では、図8A〜図12Bおよび図14A〜図16Bの例に関して上記でより詳細に説明されたように、複数の物理スピーカーのうちの対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するための手段をさらに備える、第1の例のデバイス、ここにおいて、位置の差を決定するための手段は、伸長された物理スピーカー位置のうちの少なくとも1つと複数の仮想スピーカーのうちの1つの位置との間の仰角の差を決定するための手段を備え、およびここにおいて、複数の仮想スピーカーのうちの1つの位置を調整するための手段は、仰角の決定された差がしきい値を超えるとき、複数の仮想スピーカーのうちの1つを複数の仮想スピーカーの元の仰角よりも低い仰角に投射するための手段を備える。
[0209] 第11の例では、図8A〜図12Bおよび図14A〜図16Bの例に関して上記でより詳細に説明されたように、複数の物理スピーカーのうちの対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するための手段をさらに備える、第1の例のデバイス、ここにおいて、位置の差を決定するための手段は、伸長された物理スピーカー位置のうちの少なくとも1つと複数の仮想スピーカーのうちの1つの位置との間の仰角の差を決定するための手段を備え、およびここにおいて、複数の仮想スピーカーのうちの1つの位置を調整するための手段は、仰角の決定された差がしきい値を超えるとき、複数の仮想スピーカーのうちの1つを複数の仮想スピーカーの元の仰角よりも高い仰角に投射するための手段を備える。
[0210] 第12の例では、第1の例のデバイス、ここにおいて、図8A〜図12Bおよび図14A〜図16Bの例に関して上記でより詳細に説明されたように、複数の仮想スピーカーは、球面幾何学的配置(spherical geometry)で配置される。
[0211] 第13の例では、第1の例のデバイス、ここにおいて、複数の仮想スピーカーは、多面体幾何学的配置(polyhedron geometry)で配置される。説明を簡単にするために、本開示の図1〜図17によって示される例のいずれにおいても図示されていないが、本技法は、いくつかの例を提供すれば、立方幾何学的配置、12面体幾何学的配置、20・12面体幾何学的配置、菱形30面体幾何学的配置、プリズム幾何学的配置、およびピラミッド幾何学的配置など、任意の形態の多面体幾何学的配置を含む、任意の仮想スピーカー幾何学的配置に関して実行され得る。
[0212] 第14の例では、第1の例のデバイス、ここにおいて、複数の物理スピーカーは、不規則なスピーカー幾何学的配置で配置される。
[0213] 第15の例では、第1の例のデバイス、ここにおいて、複数の物理スピーカーは、複数の異なる水平面上に不規則なスピーカー幾何学的配置で配置される。
[0214] 例に応じて、本明細書で説明された方法のいずれかのいくつかの行為またはイベントは、異なる順序で実行され得、互いに付加、統合、または除外され得る(たとえば、すべての説明された行為またはイベントが、方法の実行のために必要であるとは限らない)ことを理解されたい。その上、いくつかの例では、行為またはイベントは、連続的にではなく、たとえば、マルチスレッド処理、割込み処理、または複数のプロセッサを通じて、同時に実行され得る。さらに、本開示のいくつかの態様は、明快のために単一のデバイス、モジュールまたはユニットによって実行されるものとして説明されているが、本開示の技法は、デバイス、ユニットまたはモジュールの組合せによって実行され得ることを理解されたい。
[0215] 1つまたは複数の例では、説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実装され得る。ソフトウェアで実装される場合、機能は、1つまたは複数の命令またはコードとしてコンピュータ可読媒体上に記憶されるか、あるいはコンピュータ可読媒体を介して送信され、ハードウェアベースの処理ユニットによって実行され得る。コンピュータ可読媒体は、たとえば、通信プロトコルに従って、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、データ記憶媒体または通信媒体などの有形媒体に対応するコンピュータ可読記憶媒体を含み得る。
[0216] このようにして、コンピュータ可読媒体は、概して、(1)非一時的である有形コンピュータ可読記憶媒体、あるいは(2)信号または搬送波などの通信媒体に対応し得る。データ記憶媒体は、本開示で説明された技法の実装のための命令、コードおよび/またはデータ構造を取り出すために1つまたは複数のコンピュータあるいは1つまたは複数のプロセッサによってアクセスされ得る任意の利用可能な媒体であり得る。コンピュータプログラム製品はコンピュータ可読媒体を含み得る。
[0217] 限定ではなく例として、そのようなコンピュータ可読記憶媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスクストレージ、磁気ディスクストレージ、または他の磁気ストレージデバイス、フラッシュメモリ、あるいは、命令またはデータ構造の形態の所望のプログラムコードを記憶するために使用されコンピュータによってアクセスされ得る、任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。たとえば、命令が、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、または赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。
[0218] ただし、コンピュータ可読記憶媒体およびデータ記憶媒体は、接続、搬送波、信号、または他の一時媒体を含まないが、代わりに非一時的有形記憶媒体を対象とすることを理解されたい。本明細書で使用されるディスク(disk)およびディスク(disc)は、コンパクトディスク(disc)(CD)、レーザーディスク(登録商標)(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)およびBlu−rayディスク(disc)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)は、データをレーザーで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含まれるべきである。
[0219] 命令は、1つまたは複数のデジタル信号プロセッサ(DSP)、汎用マイクロプロセッサ、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、あるいは他の等価な集積回路またはディスクリート論理回路など、1つまたは複数のプロセッサによって実行され得る。したがって、本明細書で使用される「プロセッサ(processor)」という用語は、前述の構造、または本明細書で説明された技法の実装に適した任意の他の構造のいずれかを指し得る。さらに、いくつかの態様では、本明細書で説明された機能は、符号化および復号のために構成された専用のハードウェアおよび/またはソフトウェアモジュール内に提供されるか、あるいは複合コーデックに組み込まれ得る。また、本技法は、1つまたは複数の回路または論理要素において完全に実装され得る。
[0220] 本開示の技法は、ワイヤレスハンドセット、集積回路(IC)、またはICのセット(たとえば、チップセット)を含む、多種多様なデバイスまたは装置において実装され得る。本開示では、開示された技法を実行するように構成されたデバイスの機能的態様を強調するために様々な構成要素、モジュール、またはユニットについて説明されたが、それらの構成要素、モジュール、またはユニットを、必ずしも異なるハードウェアユニットによって実現する必要があるとは限らない。むしろ、上記で説明されたように、様々なユニットが、好適なソフトウェアおよび/またはファームウェアとともに、上記で説明された1つまたは複数のプロセッサを含めて、コーデックハードウェアユニットにおいて組み合わされるか、または相互動作ハードウェアユニットの集合によって提供され得る。
[0221] 本技法の様々な実施形態が説明された。これらおよび他の実施形態は以下の特許請求の範囲内に入る。
[0101] 3Dレンダラ決定ユニット48Cは、仮想スピーカーが、下半球と上半球とのための半球データにおいて指定された上側と下側の水平バンド値内にあるかどうかを決定し得る(216)。仮想スピーカーがこれらのバンド値内にあるとき(「YES」216)、3Dレンダラ決定ユニット48Cは、これらの仮想スピーカーの仰角を0に設定する(218)。言い換えれば、3Dレンダラ決定ユニット48Cは、いわゆる「スイートスポット」の周りの球体を二等分する中間水平面に近い下半球と上半球とにおける仮想スピーカーを識別し、この水平面上にこれらの仮想スピーカーのロケーションがあるように設定し得る。これらの仮想スピーカーロケーションを0に設定した後に、または仮想スピーカーが上側と下側の水平バンド値内にないとき(「NO」216)、3Dレンダラ決定ユニット48Cは、中間水平面に沿って仮想スピーカーを現実のスピーカーにマッピングするために使用される3Dレンダラの水平面部分を生成するために、3D VBAPパンニング(または仮想スピーカーを現実のスピーカーにマッピングする任意の他の形態または方法)を実行し得る(220)
[0126] 仰角の最大絶対値が70よりも大きいとき(「YES」280)、3Dレンダラ決定ユニット48Cは、0に等しい伸長値と、仰角の絶対値の最大値の符号付き形式に等しい2Dパンニング限界と、0に等しい水平バンド値とを含む半球データを決定し得る(282)。仰角の最大絶対値が70よりも小さいかまたはそれに等しいとき(「NO」280)、3Dレンダラ決定ユニット48Cは、10−仰角の最大絶対値×70×10に等しい伸長値と、仰角の絶対値の最大値の符号付き形式−伸長値に等しい2Dパンニング限界と、仰角の最大絶対値の符号付き形式×0.1に等しい水平バンド値とを含む半球データを決定し得る(284)。
[0147] 図13A〜図13Dは、本開示で説明される技法に従って形成されるビットストリーム31A〜31Dを示す図である。図13Aの例では、ビットストリーム31Aは、図3の例に示されたビットストリーム31の一例を表し得る。ビットストリーム31Aは、信号値54を定義する1つまたは複数のビットを含むオーディオレンダリング情報39Aを含む。この信号値54は、以下で説明されるタイプの情報の任意の組合せを表し得る。ビットストリーム31Aはまた、オーディオコンテンツ29の一例を表し得るオーディオコンテンツ58を含む。
[0151] 抽出デバイス38は、アルゴリズムインデックス54Eを抽出し、行列がビットストリーム31C中に含まれることをアルゴリズムインデックス54Eがシグナリングするかどうかを決定し得る(ここで、0000または1111など、いくつかのインデックス値は、行列が明示的にビットストリーム31C中で指定されていることをシグナリングし得る)。図8Cの例では、ビットストリーム31Cは、行列が明示的にビットストリーム31C中で指定されていないことをシグナリングするアルゴリズムインデックス54Eを含む。その結果、抽出デバイス38は、アルゴリズムインデックス54Eをオーディオ再生デバイスに転送し、オーディオ再生デバイスは、(利用可能な場合は)対応する1つ、(図3および図4の例ではレンダラ34として示されている)レンダリングアルゴリズムを選択する。図13Cの例では、ビットストリーム31C中でオーディオレンダリング情報39Cを1回シグナリングするものとして示されているが、オーディオレンダリング情報39Cは、ビットストリーム31C中で複数回シグナリングされるか、あるいは少なくとも部分的にまたは完全に別個のアウトオブバンドチャネル中で(いくつかの事例では随意のデータとして)シグナリングされ得る。
[0153] 抽出デバイス38は、行列インデックス50Fを抽出し、行列がビットストリーム31D中に含まれることを行列インデックス54Fがシグナリングするかどうかを決定し得る(ここで、0000または1111など、いくつかのインデックス値は、行列が明示的にビットストリーム31C中で指定されていることをシグナリングし得る)。図13Dの例では、ビットストリーム31Dは、行列が明示的にビットストリーム31D中で指定されていないことをシグナリングする行列インデックス54Fを含む。その結果、抽出デバイス38は、行列インデックス54Fをオーディオ再生デバイスに転送し、オーディオ再生デバイスは、(利用可能な場合は)対応する1つ、レンダラ34を選択する。図13Dの例では、ビットストリーム31D中でオーディオレンダリング情報39Dを1回シグナリングするものとして示されているが、オーディオレンダリング情報39Dは、ビットストリーム31D中で複数回シグナリングされるか、あるいは少なくとも部分的にまたは完全に別個のアウトオブバンドチャネル中で(いくつかの事例では随意のデータとして)シグナリングされ得る。
[0221] 本技法の様々な実施形態が説明された。これらおよび他の実施形態は以下の特許請求の範囲内に入る。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
幾何学的配置で配置された複数の仮想スピーカーのうちの1つと複数の物理スピーカーのうちの1つとの間の位置の差を決定することと、
位置の前記決定された差に基づいて、および前記複数の仮想スピーカーを前記複数の物理スピーカーにマッピングするより前に、前記幾何学的配置内の前記複数の仮想スピーカーのうちの前記1つの位置を調整することとを備える方法。
[C2]
位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備える、C1に記載の方法。
[C3]
位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備え、
前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射することを備える、C1に記載の方法。
[C4]
位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備え、
前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーのうちの前記1つの元の仰角よりも高い仰角に投射することを備える、C1に記載の方法。
[C5]
再現される音場が、前記仮想スピーカーの前記調整されたロケーションから発生するように思われる少なくとも1つの音を含むように、前記音場を再現するために、前記複数の物理スピーカーを駆動するための複数のラウドスピーカーチャネル信号を生成するとき、前記音場を記述する要素の階層セット上で2次元パンニングを実行することをさらに備える、C1に記載の方法。
[C6]
要素の前記階層セットが、複数の球面調和係数を備える、C5に記載の方法。
[C7]
要素の前記階層セット上で2次元パンニングを実行することが、前記複数のラウドスピーカーチャネル信号を生成するとき、要素の前記階層セット上で2次元ベクトルベース振幅パンニングを実行することを備える、C5に記載の方法。
[C8]
前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備える、C1に記載の方法。
[C9]
前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
ここにおいて、位置の前記差を決定することが、前記複数の仮想スピーカーのうちの前記1つの前記位置に対して前記伸長された物理スピーカー位置のうちの少なくとも1つとの間の差を決定することを備える、C1に記載の方法。
[C10]
前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
ここにおいて、位置の前記差を決定することが、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定することを備え、および
ここにおいて、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射することを備える、C1に記載の方法。
[C11]
前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
ここにおいて、位置の前記差を決定することが、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定することを備え、および
ここにおいて、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも高い仰角に投射することを備える、C1に記載の方法。
[C12]
前記複数の仮想スピーカーが、球面幾何学的配置で配置された、C1に記載の方法。
[C13]
前記複数の仮想スピーカーが、多面体幾何学的配置で配置された、C1に記載の方法。
[C14]
前記複数の物理スピーカーが、不規則なスピーカー幾何学的配置で配置された、C1に記載の方法。
[C15]
前記複数の物理スピーカーが、複数の異なる水平面上に不規則なスピーカー幾何学的配置で配置された、C1に記載の方法。
[C16]
幾何学的配置で配置された複数の仮想スピーカーのうちの1つと複数の物理スピーカーのうちの1つとの間の位置の差を決定することと、位置の前記決定された差に基づいて、および前記複数の仮想スピーカーを前記複数の物理スピーカーにマッピングするより前に、前記幾何学的配置内の前記複数の仮想スピーカーのうちの前記1つの位置を調整することとを行うように構成された1つまたは複数のプロセッサを備えるデバイス。
[C17]
前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成された、C16に記載のデバイス。
[C18]
前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射するようにさらに構成された、C16に記載のデバイス。
[C19]
前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーのうちの前記1つの元の仰角よりも高い仰角に投射するようにさらに構成された、C16に記載のデバイス。
[C20]
前記1つまたは複数のプロセッサは、再現される音場が、前記仮想スピーカーの前記調整されたロケーションから発生するように思われる少なくとも1つの音を含むように、前記音場を再現するために、前記複数の物理スピーカーを駆動するための複数のラウドスピーカーチャネル信号を生成するとき、前記音場を記述する要素の階層セット上で2次元パンニングを実行するようにさらに構成された、C16に記載のデバイス。
[C21]
要素の前記階層セットが、複数の球面調和係数を備える、C20に記載のデバイス。
[C22]
前記1つまたは複数のプロセッサが、要素の前記階層セット上で2次元パンニングを実行するとき、前記複数のラウドスピーカーチャネル信号を生成するときに要素の前記階層セット上で2次元ベクトルベース振幅パンニングを実行するようにさらに構成された、C20に記載のデバイス。
[C23]
前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成された、C16に記載のデバイス。
[C24]
前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の仮想スピーカーのうちの前記1つの前記位置に対して前記伸長された物理スピーカー位置のうちの少なくとも1つとの間の差を決定するようにさらに構成された、C16に記載のデバイス。
[C25]
前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定するようにさらに構成され、および
ここにおいて、前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射するようにさらに構成された、C16に記載のデバイス。
[C26]
前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定するようにさらに構成され、および
ここにおいて、前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも高い仰角に投射するようにさらに構成された、C16に記載のデバイス。
[C27]
前記複数の仮想スピーカーが、球面幾何学的配置で配置された、C16に記載のデバイス。
[C28]
前記複数の仮想スピーカーが、多面体幾何学的配置で配置された、C16に記載のデバイス。
[C29]
前記複数の物理スピーカーが、不規則なスピーカー幾何学的配置で配置された、C16に記載のデバイス。
[C30]
前記複数の物理スピーカーが、複数の異なる水平面上に不規則なスピーカー幾何学的配置で配置された、C16に記載のデバイス。

Claims (30)

  1. 幾何学的配置で配置された複数の仮想スピーカーのうちの1つと複数の物理スピーカーのうちの1つとの間の位置の差を決定することと、
    位置の前記決定された差に基づいて、および前記複数の仮想スピーカーを前記複数の物理スピーカーにマッピングするより前に、前記幾何学的配置内の前記複数の仮想スピーカーのうちの前記1つの位置を調整することと
    を備える方法。
  2. 位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備える、請求項1に記載の方法。
  3. 位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備え、
    前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射することを備える、
    請求項1に記載の方法。
  4. 位置の前記差を決定することが、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定することを備え、
    前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーのうちの前記1つの元の仰角よりも高い仰角に投射することを備える、
    請求項1に記載の方法。
  5. 再現される音場が、前記仮想スピーカーの前記調整されたロケーションから発生するように思われる少なくとも1つの音を含むように、前記音場を再現するために、前記複数の物理スピーカーを駆動するための複数のラウドスピーカーチャネル信号を生成するとき、前記音場を記述する要素の階層セット上で2次元パンニングを実行することをさらに備える、請求項1に記載の方法。
  6. 要素の前記階層セットが、複数の球面調和係数を備える、請求項5に記載の方法。
  7. 要素の前記階層セット上で2次元パンニングを実行することが、前記複数のラウドスピーカーチャネル信号を生成するとき、要素の前記階層セット上で2次元ベクトルベース振幅パンニングを実行することを備える、請求項5に記載の方法。
  8. 前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備える、請求項1に記載の方法。
  9. 前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
    ここにおいて、位置の前記差を決定することが、前記複数の仮想スピーカーのうちの前記1つの前記位置に対して前記伸長された物理スピーカー位置のうちの少なくとも1つとの間の差を決定することを備える、
    請求項1に記載の方法。
  10. 前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
    ここにおいて、位置の前記差を決定することが、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定することを備え、および
    ここにおいて、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射することを備える、
    請求項1に記載の方法。
  11. 前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定することをさらに備え、
    ここにおいて、位置の前記差を決定することが、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定することを備え、および
    ここにおいて、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整することは、仰角の前記決定された差がしきい値を超えるとき、前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも高い仰角に投射することを備える、
    請求項1に記載の方法。
  12. 前記複数の仮想スピーカーが、球面幾何学的配置で配置された、請求項1に記載の方法。
  13. 前記複数の仮想スピーカーが、多面体幾何学的配置で配置された、請求項1に記載の方法。
  14. 前記複数の物理スピーカーが、不規則なスピーカー幾何学的配置で配置された、請求項1に記載の方法。
  15. 前記複数の物理スピーカーが、複数の異なる水平面上に不規則なスピーカー幾何学的配置で配置された、請求項1に記載の方法。
  16. 幾何学的配置で配置された複数の仮想スピーカーのうちの1つと複数の物理スピーカーのうちの1つとの間の位置の差を決定することと、位置の前記決定された差に基づいて、および前記複数の仮想スピーカーを前記複数の物理スピーカーにマッピングするより前に、前記幾何学的配置内の前記複数の仮想スピーカーのうちの前記1つの位置を調整することとを行うように構成された1つまたは複数のプロセッサ
    を備えるデバイス。
  17. 前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成された、請求項16に記載のデバイス。
  18. 前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成され、
    前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射するようにさらに構成された、
    請求項16に記載のデバイス。
  19. 前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の物理スピーカーのうちの前記1つと前記複数の仮想スピーカーのうちの前記1つとの間の仰角の差を決定するようにさらに構成され、
    前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーのうちの前記1つの元の仰角よりも高い仰角に投射するようにさらに構成された、
    請求項16に記載のデバイス。
  20. 前記1つまたは複数のプロセッサは、再現される音場が、前記仮想スピーカーの前記調整されたロケーションから発生するように思われる少なくとも1つの音を含むように、前記音場を再現するために、前記複数の物理スピーカーを駆動するための複数のラウドスピーカーチャネル信号を生成するとき、前記音場を記述する要素の階層セット上で2次元パンニングを実行するようにさらに構成された、請求項16に記載のデバイス。
  21. 要素の前記階層セットが、複数の球面調和係数を備える、請求項20に記載のデバイス。
  22. 前記1つまたは複数のプロセッサが、要素の前記階層セット上で2次元パンニングを実行するとき、前記複数のラウドスピーカーチャネル信号を生成するときに要素の前記階層セット上で2次元ベクトルベース振幅パンニングを実行するようにさらに構成された、請求項20に記載のデバイス。
  23. 前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成された、請求項16に記載のデバイス。
  24. 前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記複数の仮想スピーカーのうちの前記1つの前記位置に対して前記伸長された物理スピーカー位置のうちの少なくとも1つとの間の差を決定するようにさらに構成された、
    請求項16に記載のデバイス。
  25. 前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定するようにさらに構成され、および
    ここにおいて、前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも低い仰角に投射するようにさらに構成された、
    請求項16に記載のデバイス。
  26. 前記1つまたは複数のプロセッサが、前記複数の物理スピーカーのうちの前記対応する1つまたは複数の位置とは異なる1つまたは複数の伸長された物理スピーカー位置を決定するようにさらに構成され、
    ここにおいて、前記1つまたは複数のプロセッサが、位置の前記差を決定するとき、前記伸長された物理スピーカー位置のうちの少なくとも1つと前記複数の仮想スピーカーのうちの前記1つの前記位置との間の仰角の差を決定するようにさらに構成され、および
    ここにおいて、前記1つまたは複数のプロセッサは、前記複数の仮想スピーカーのうちの前記1つの前記位置を調整するとき、仰角の前記決定された差がしきい値を超えるときに前記複数の仮想スピーカーのうちの前記1つを前記複数の仮想スピーカーの元の仰角よりも高い仰角に投射するようにさらに構成された、
    請求項16に記載のデバイス。
  27. 前記複数の仮想スピーカーが、球面幾何学的配置で配置された、請求項16に記載のデバイス。
  28. 前記複数の仮想スピーカーが、多面体幾何学的配置で配置された、請求項16に記載のデバイス。
  29. 前記複数の物理スピーカーが、不規則なスピーカー幾何学的配置で配置された、請求項16に記載のデバイス。
  30. 前記複数の物理スピーカーが、複数の異なる水平面上に不規則なスピーカー幾何学的配置で配置された、請求項16に記載のデバイス。
JP2015557126A 2013-02-07 2014-02-07 仮想スピーカーを物理スピーカーにマッピングすること Expired - Fee Related JP6284955B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361762302P 2013-02-07 2013-02-07
US61/762,302 2013-02-07
US201361829832P 2013-05-31 2013-05-31
US61/829,832 2013-05-31
US14/174,775 2014-02-06
US14/174,775 US9913064B2 (en) 2013-02-07 2014-02-06 Mapping virtual speakers to physical speakers
PCT/US2014/015315 WO2014124268A1 (en) 2013-02-07 2014-02-07 Mapping virtual speakers to physical speakers

Publications (3)

Publication Number Publication Date
JP2016509820A true JP2016509820A (ja) 2016-03-31
JP2016509820A5 JP2016509820A5 (ja) 2017-02-16
JP6284955B2 JP6284955B2 (ja) 2018-02-28

Family

ID=51259222

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2015557126A Expired - Fee Related JP6284955B2 (ja) 2013-02-07 2014-02-07 仮想スピーカーを物理スピーカーにマッピングすること
JP2015557125A Expired - Fee Related JP6309545B2 (ja) 2013-02-07 2014-02-07 球面調和係数のためのレンダラを決定すること

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015557125A Expired - Fee Related JP6309545B2 (ja) 2013-02-07 2014-02-07 球面調和係数のためのレンダラを決定すること

Country Status (7)

Country Link
US (2) US9913064B2 (ja)
EP (2) EP2954703B1 (ja)
JP (2) JP6284955B2 (ja)
KR (2) KR20150115822A (ja)
CN (2) CN104969577B (ja)
TW (2) TWI611706B (ja)
WO (2) WO2014124264A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019225190A1 (ja) * 2018-05-22 2019-11-28 ソニー株式会社 情報処理装置、情報処理方法、プログラム

Families Citing this family (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8483853B1 (en) 2006-09-12 2013-07-09 Sonos, Inc. Controlling and manipulating groupings in a multi-zone media system
US9202509B2 (en) 2006-09-12 2015-12-01 Sonos, Inc. Controlling and grouping in a multi-zone media system
US8788080B1 (en) 2006-09-12 2014-07-22 Sonos, Inc. Multi-channel pairing in a media system
US8923997B2 (en) 2010-10-13 2014-12-30 Sonos, Inc Method and apparatus for adjusting a speaker system
US11429343B2 (en) 2011-01-25 2022-08-30 Sonos, Inc. Stereo playback configuration and control
US11265652B2 (en) 2011-01-25 2022-03-01 Sonos, Inc. Playback device pairing
US8938312B2 (en) 2011-04-18 2015-01-20 Sonos, Inc. Smart line-in processing
US9042556B2 (en) 2011-07-19 2015-05-26 Sonos, Inc Shaping sound responsive to speaker orientation
US8811630B2 (en) 2011-12-21 2014-08-19 Sonos, Inc. Systems, methods, and apparatus to filter audio
US9084058B2 (en) 2011-12-29 2015-07-14 Sonos, Inc. Sound field calibration using listener localization
US9729115B2 (en) 2012-04-27 2017-08-08 Sonos, Inc. Intelligently increasing the sound level of player
US9524098B2 (en) 2012-05-08 2016-12-20 Sonos, Inc. Methods and systems for subwoofer calibration
USD721352S1 (en) 2012-06-19 2015-01-20 Sonos, Inc. Playback device
US9219460B2 (en) 2014-03-17 2015-12-22 Sonos, Inc. Audio settings based on environment
US9690539B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration user interface
US9690271B2 (en) 2012-06-28 2017-06-27 Sonos, Inc. Speaker calibration
US9706323B2 (en) 2014-09-09 2017-07-11 Sonos, Inc. Playback device calibration
US9668049B2 (en) 2012-06-28 2017-05-30 Sonos, Inc. Playback device calibration user interfaces
US9106192B2 (en) 2012-06-28 2015-08-11 Sonos, Inc. System and method for device playback calibration
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) * 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US8930005B2 (en) 2012-08-07 2015-01-06 Sonos, Inc. Acoustic signatures in a playback system
US8965033B2 (en) 2012-08-31 2015-02-24 Sonos, Inc. Acoustic optimization
US9008330B2 (en) 2012-09-28 2015-04-14 Sonos, Inc. Crossover frequency adjustments for audio speakers
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
USD721061S1 (en) 2013-02-25 2015-01-13 Sonos, Inc. Playback device
KR102332968B1 (ko) 2013-04-26 2021-12-01 소니그룹주식회사 음성 처리 장치, 정보 처리 방법, 및 기록 매체
US9681249B2 (en) 2013-04-26 2017-06-13 Sony Corporation Sound processing apparatus and method, and program
US9412385B2 (en) * 2013-05-28 2016-08-09 Qualcomm Incorporated Performing spatial masking with respect to spherical harmonic coefficients
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9854377B2 (en) 2013-05-29 2017-12-26 Qualcomm Incorporated Interpolation for decomposed representations of a sound field
JP6369465B2 (ja) * 2013-07-24 2018-08-08 ソニー株式会社 情報処理装置および方法、並びにプログラム
US9807538B2 (en) * 2013-10-07 2017-10-31 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
KR102231755B1 (ko) 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9226087B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9226073B2 (en) 2014-02-06 2015-12-29 Sonos, Inc. Audio output balancing during synchronized playback
US9264839B2 (en) 2014-03-17 2016-02-16 Sonos, Inc. Playback device configuration based on proximity detection
US10412522B2 (en) 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
CN106105270A (zh) * 2014-03-25 2016-11-09 英迪股份有限公司 用于处理音频信号的系统和方法
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9367283B2 (en) 2014-07-22 2016-06-14 Sonos, Inc. Audio settings
USD883956S1 (en) 2014-08-13 2020-05-12 Sonos, Inc. Playback device
US10127006B2 (en) 2014-09-09 2018-11-13 Sonos, Inc. Facilitating calibration of an audio playback device
US9891881B2 (en) 2014-09-09 2018-02-13 Sonos, Inc. Audio processing algorithm database
US9910634B2 (en) 2014-09-09 2018-03-06 Sonos, Inc. Microphone calibration
US9952825B2 (en) 2014-09-09 2018-04-24 Sonos, Inc. Audio processing algorithms
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
BR112017008015B1 (pt) 2014-10-31 2023-11-14 Dolby International Ab Métodos e sistemas de decodificação e codificação de áudio
CN106537941B (zh) * 2014-11-11 2019-08-16 谷歌有限责任公司 虚拟声音系统和方法
EP3024253A1 (en) * 2014-11-21 2016-05-25 Harman Becker Automotive Systems GmbH Audio system and method
US9973851B2 (en) 2014-12-01 2018-05-15 Sonos, Inc. Multi-channel playback of audio content
WO2016172593A1 (en) 2015-04-24 2016-10-27 Sonos, Inc. Playback device calibration user interfaces
US10664224B2 (en) 2015-04-24 2020-05-26 Sonos, Inc. Speaker calibration user interface
USD906278S1 (en) 2015-04-25 2020-12-29 Sonos, Inc. Media player device
USD886765S1 (en) 2017-03-13 2020-06-09 Sonos, Inc. Media playback device
US20170085972A1 (en) 2015-09-17 2017-03-23 Sonos, Inc. Media Player and Media Player Design
USD768602S1 (en) 2015-04-25 2016-10-11 Sonos, Inc. Playback device
USD920278S1 (en) 2017-03-13 2021-05-25 Sonos, Inc. Media playback device with lights
US10248376B2 (en) 2015-06-11 2019-04-02 Sonos, Inc. Multiple groupings in a playback system
EP3314916B1 (en) 2015-06-25 2020-07-29 Dolby Laboratories Licensing Corporation Audio panning transformation system and method
US9729118B2 (en) 2015-07-24 2017-08-08 Sonos, Inc. Loudness matching
US9538305B2 (en) 2015-07-28 2017-01-03 Sonos, Inc. Calibration error conditions
EP3329486B1 (en) * 2015-07-30 2020-07-29 Dolby International AB Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation
US9712912B2 (en) 2015-08-21 2017-07-18 Sonos, Inc. Manipulation of playback device response using an acoustic filter
US9736610B2 (en) 2015-08-21 2017-08-15 Sonos, Inc. Manipulation of playback device response using signal processing
EP3531714B1 (en) 2015-09-17 2022-02-23 Sonos Inc. Facilitating calibration of an audio playback device
US9693165B2 (en) 2015-09-17 2017-06-27 Sonos, Inc. Validation of audio calibration using multi-dimensional motion check
WO2017079334A1 (en) 2015-11-03 2017-05-11 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
CN105392102B (zh) * 2015-11-30 2017-07-25 武汉大学 用于非球面扬声器阵列的三维音频信号生成方法及系统
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
CN108476371A (zh) * 2016-01-04 2018-08-31 哈曼贝克自动系统股份有限公司 声波场生成
US9743207B1 (en) 2016-01-18 2017-08-22 Sonos, Inc. Calibration using multiple recording devices
US11106423B2 (en) 2016-01-25 2021-08-31 Sonos, Inc. Evaluating calibration of a playback device
US10003899B2 (en) 2016-01-25 2018-06-19 Sonos, Inc. Calibration with particular locations
US9886234B2 (en) 2016-01-28 2018-02-06 Sonos, Inc. Systems and methods of distributing audio to one or more playback devices
DE102016103209A1 (de) 2016-02-24 2017-08-24 Visteon Global Technologies, Inc. System und Verfahren zur Positionserkennung von Lautsprechern und zur Wiedergabe von Audiosignalen als Raumklang
US9864574B2 (en) 2016-04-01 2018-01-09 Sonos, Inc. Playback device calibration based on representation spectral characteristics
US9860662B2 (en) 2016-04-01 2018-01-02 Sonos, Inc. Updating playback device configuration information based on calibration data
US9763018B1 (en) 2016-04-12 2017-09-12 Sonos, Inc. Calibration of audio playback devices
FR3050601B1 (fr) * 2016-04-26 2018-06-22 Arkamys Procede et systeme de diffusion d'un signal audio a 360°
US9794710B1 (en) 2016-07-15 2017-10-17 Sonos, Inc. Spatial audio correction
US9860670B1 (en) 2016-07-15 2018-01-02 Sonos, Inc. Spectral correction using spatial calibration
US10372406B2 (en) 2016-07-22 2019-08-06 Sonos, Inc. Calibration interface
US10459684B2 (en) 2016-08-05 2019-10-29 Sonos, Inc. Calibration of a playback device based on an estimated frequency response
USD851057S1 (en) 2016-09-30 2019-06-11 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
US10412473B2 (en) 2016-09-30 2019-09-10 Sonos, Inc. Speaker grill with graduated hole sizing over a transition area for a media device
USD827671S1 (en) 2016-09-30 2018-09-04 Sonos, Inc. Media playback device
US10712997B2 (en) 2016-10-17 2020-07-14 Sonos, Inc. Room association based on name
KR20190091445A (ko) 2016-10-19 2019-08-06 오더블 리얼리티 아이엔씨. 오디오 이미지를 생성하는 시스템 및 방법
CN110383856B (zh) * 2017-01-27 2021-12-10 奥罗技术公司 用于平移音频对象的处理方法和系统
JP6543848B2 (ja) * 2017-03-29 2019-07-17 本田技研工業株式会社 音声処理装置、音声処理方法及びプログラム
CN110771181B (zh) * 2017-05-15 2021-09-28 杜比实验室特许公司 用于将空间音频格式转换为扬声器信号的方法、系统和设备
US10015618B1 (en) * 2017-08-01 2018-07-03 Google Llc Incoherent idempotent ambisonics rendering
US10609485B2 (en) 2017-09-29 2020-03-31 Apple Inc. System and method for performing panning for an arbitrary loudspeaker setup
WO2019149337A1 (en) * 2018-01-30 2019-08-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs
WO2020030303A1 (en) * 2018-08-09 2020-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An audio processor and a method for providing loudspeaker signals
US11206484B2 (en) 2018-08-28 2021-12-21 Sonos, Inc. Passive speaker authentication
US10299061B1 (en) 2018-08-28 2019-05-21 Sonos, Inc. Playback device calibration
WO2020044244A1 (en) 2018-08-29 2020-03-05 Audible Reality Inc. System for and method of controlling a three-dimensional audio engine
US11798569B2 (en) * 2018-10-02 2023-10-24 Qualcomm Incorporated Flexible rendering of audio data
US10739726B2 (en) 2018-10-03 2020-08-11 International Business Machines Corporation Audio management for holographic objects
KR102323529B1 (ko) 2018-12-17 2021-11-09 한국전자통신연구원 복합 차수 앰비소닉을 이용한 오디오 신호 처리 방법 및 장치
WO2020200964A1 (en) 2019-03-29 2020-10-08 Sony Corporation Apparatus and method
CN113853803A (zh) * 2019-04-02 2021-12-28 辛格股份有限公司 用于空间音频渲染的系统和方法
US11122386B2 (en) * 2019-06-20 2021-09-14 Qualcomm Incorporated Audio rendering for low frequency effects
US10734965B1 (en) 2019-08-12 2020-08-04 Sonos, Inc. Audio calibration of a portable playback device
CN110751956B (zh) * 2019-09-17 2022-04-26 北京时代拓灵科技有限公司 一种沉浸式音频渲染方法及系统
CN115715470A (zh) * 2019-12-30 2023-02-24 卡姆希尔公司 用于提供空间化声场的方法
US11246001B2 (en) 2020-04-23 2022-02-08 Thx Ltd. Acoustic crosstalk cancellation and virtual speakers techniques
US11750971B2 (en) 2021-03-11 2023-09-05 Nanning Fulian Fugui Precision Industrial Co., Ltd. Three-dimensional sound localization method, electronic device and computer readable storage

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100092014A1 (en) * 2006-10-11 2010-04-15 Fraunhofer-Geselischhaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction space
JP2010252220A (ja) * 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9204485D0 (en) 1992-03-02 1992-04-15 Trifield Productions Ltd Surround sound apparatus
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
EP1275272B1 (en) * 2000-04-19 2012-11-21 SNK Tech Investment L.L.C. Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions
JP3624805B2 (ja) 2000-07-21 2005-03-02 ヤマハ株式会社 音像定位装置
US7113610B1 (en) 2002-09-10 2006-09-26 Microsoft Corporation Virtual sound source positioning
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US20040264704A1 (en) * 2003-06-13 2004-12-30 Camille Huin Graphical user interface for determining speaker spatialization parameters
US8054980B2 (en) 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
US7928311B2 (en) 2004-12-01 2011-04-19 Creative Technology Ltd System and method for forming and rendering 3D MIDI messages
JP2008118166A (ja) 2005-06-30 2008-05-22 Pioneer Electronic Corp スピーカエンクロージャ、これを備えたスピーカシステムおよび多チャンネルステレオシステム
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
JP4674505B2 (ja) 2005-08-01 2011-04-20 ソニー株式会社 音声信号処理方法、音場再現システム
WO2007101958A2 (fr) * 2006-03-09 2007-09-13 France Telecom Optimisation d'une spatialisation sonore binaurale a partir d'un encodage multicanal
DE102007059597A1 (de) 2007-09-19 2009-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Eine Vorrichtung und ein Verfahren zur Ermittlung eines Komponentensignals in hoher Genauigkeit
EP2056627A1 (en) 2007-10-30 2009-05-06 SonicEmotion AG Method and device for improved sound field rendering accuracy within a preferred listening area
JP4338102B1 (ja) 2008-08-25 2009-10-07 薫 長山 スピーカーシステム
US8391500B2 (en) * 2008-10-17 2013-03-05 University Of Kentucky Research Foundation Method and system for creating three-dimensional spatial audio
EP2374123B1 (fr) 2008-12-15 2019-04-10 Orange Codage perfectionne de signaux audionumeriques multicanaux
EP2205007B1 (en) 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
GB2467534B (en) 2009-02-04 2014-12-24 Richard Furse Sound system
WO2010092014A2 (en) * 2009-02-11 2010-08-19 Basf Se Pesticidal mixtures
GB0906269D0 (en) 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
AU2010305313B2 (en) * 2009-10-07 2015-05-28 The University Of Sydney Reconstruction of a recorded sound field
US20110091055A1 (en) * 2009-10-19 2011-04-21 Broadcom Corporation Loudspeaker localization techniques
KR101953279B1 (ko) 2010-03-26 2019-02-28 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2609759B1 (en) * 2010-08-27 2022-05-18 Sennheiser Electronic GmbH & Co. KG Method and device for enhanced sound field reproduction of spatially encoded audio input signals
EP2450880A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
JP2012104871A (ja) 2010-11-05 2012-05-31 Sony Corp 音響制御装置及び音響制御方法
WO2012088336A2 (en) * 2010-12-22 2012-06-28 Genaudio, Inc. Audio spatialization and environment simulation
WO2013141768A1 (en) 2012-03-22 2013-09-26 Dirac Research Ab Audio precompensation controller design using a variable set of support loudspeakers
US9473870B2 (en) * 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
WO2014012945A1 (en) 2012-07-16 2014-01-23 Thomson Licensing Method and device for rendering an audio soundfield representation for audio playback
MX347100B (es) * 2012-12-04 2017-04-12 Samsung Electronics Co Ltd Aparato de suministro de audio y método de suministro de audio.
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
US9854377B2 (en) 2013-05-29 2017-12-26 Qualcomm Incorporated Interpolation for decomposed representations of a sound field
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
US20150264483A1 (en) 2014-03-14 2015-09-17 Qualcomm Incorporated Low frequency rendering of higher-order ambisonic audio data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100092014A1 (en) * 2006-10-11 2010-04-15 Fraunhofer-Geselischhaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction space
JP2010252220A (ja) * 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
EP2541547A1 (en) * 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019225190A1 (ja) * 2018-05-22 2019-11-28 ソニー株式会社 情報処理装置、情報処理方法、プログラム
JPWO2019225190A1 (ja) * 2018-05-22 2021-06-10 ソニーグループ株式会社 情報処理装置、情報処理方法、プログラム
US11463836B2 (en) 2018-05-22 2022-10-04 Sony Corporation Information processing apparatus and information processing method
JP7306384B2 (ja) 2018-05-22 2023-07-11 ソニーグループ株式会社 情報処理装置、情報処理方法、プログラム

Also Published As

Publication number Publication date
TW201436588A (zh) 2014-09-16
CN104969577A (zh) 2015-10-07
KR101877604B1 (ko) 2018-07-12
US9736609B2 (en) 2017-08-15
EP2954702A1 (en) 2015-12-16
KR20150115822A (ko) 2015-10-14
KR20150115823A (ko) 2015-10-14
JP6284955B2 (ja) 2018-02-28
CN104956695B (zh) 2017-06-06
EP2954703A1 (en) 2015-12-16
US20140219456A1 (en) 2014-08-07
WO2014124268A1 (en) 2014-08-14
TWI611706B (zh) 2018-01-11
JP2016509819A (ja) 2016-03-31
WO2014124264A1 (en) 2014-08-14
EP2954702B1 (en) 2019-06-05
TWI538531B (zh) 2016-06-11
CN104956695A (zh) 2015-09-30
JP6309545B2 (ja) 2018-04-11
TW201436587A (zh) 2014-09-16
US20140219455A1 (en) 2014-08-07
EP2954703B1 (en) 2019-12-18
US9913064B2 (en) 2018-03-06
CN104969577B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
JP6284955B2 (ja) 仮想スピーカーを物理スピーカーにマッピングすること
JP6676801B2 (ja) マルチチャンネル音声コンテンツを表すビットストリームを生成する方法、およびデバイス
RU2646344C2 (ru) Обработка пространственно диффузных или больших звуковых объектов
EP3668124B1 (en) Screen related adaptation of hoa content
US20150264483A1 (en) Low frequency rendering of higher-order ambisonic audio data
KR101818877B1 (ko) 고차 앰비소닉 오디오 렌더러들에 대한 희소성 정보의 획득
US11122386B2 (en) Audio rendering for low frequency effects
KR101941764B1 (ko) 고차 앰비소닉 오디오 렌더러들에 대한 대칭성 정보의 획득
WO2020257193A1 (en) Audio rendering for low frequency effects

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180131

R150 Certificate of patent or registration of utility model

Ref document number: 6284955

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees