JP2017520174A5 - - Google Patents

Download PDF

Info

Publication number
JP2017520174A5
JP2017520174A5 JP2016569921A JP2016569921A JP2017520174A5 JP 2017520174 A5 JP2017520174 A5 JP 2017520174A5 JP 2016569921 A JP2016569921 A JP 2016569921A JP 2016569921 A JP2016569921 A JP 2016569921A JP 2017520174 A5 JP2017520174 A5 JP 2017520174A5
Authority
JP
Japan
Prior art keywords
matrix
higher order
order ambisonic
information
render
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016569921A
Other languages
Japanese (ja)
Other versions
JP6423009B2 (en
JP2017520174A (en
Filing date
Publication date
Priority claimed from US14/724,615 external-priority patent/US9883310B2/en
Application filed filed Critical
Priority claimed from PCT/US2015/033273 external-priority patent/WO2015184316A1/en
Publication of JP2017520174A publication Critical patent/JP2017520174A/en
Publication of JP2017520174A5 publication Critical patent/JP2017520174A5/ja
Application granted granted Critical
Publication of JP6423009B2 publication Critical patent/JP6423009B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (15)

高次アンビソニック係数をレンダリングするように構成されるデバイスであって、
複数のスピーカーフィードを生成する、前記高次アンビソニック係数をレンダリングするために使用される行列の希薄さを示す希薄さ情報を、前記高次アンビソニック係数の符号化されたバージョンを含むビットストリームから取得することと、
前記行列の符号シンメトリを示す符号シンメトリ情報を前記ビットストリームから取得することと、
前記行列を表わすために使用される低減されたビット数を前記ビットストリームから取得することと、
前記希薄さ情報、前記符号シンメトリ情報、および前記低減されたビット数に基づいて、前記行列を再構成することと
を行うように構成される1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合され、前記希薄さ情報を記憶するように構成されるメモリと
を備える、デバイス。
A device configured to render higher order ambisonic coefficients,
Sparseness information indicating the sparseness of the matrix used to render the higher order ambisonic coefficients to generate a plurality of speaker feeds from a bitstream containing an encoded version of the higher order ambisonic coefficients Getting,
Obtaining code symmetry information indicating code symmetry of the matrix from the bitstream;
Obtaining a reduced number of bits used to represent the matrix from the bitstream;
One or more processors configured to: reconstruct the matrix based on the sparse information, the code symmetry information, and the reduced number of bits;
And a memory coupled to the one or more processors and configured to store the sparse information.
前記1つまたは複数のプロセッサは、前記行列が前記高次アンビソニック係数から前記複数のスピーカーフィードをレンダリングするために使用されるスピーカーレイアウトを決定するようにさらに構成される、
請求項1に記載のデバイス。
The one or more processors are further configured to determine a speaker layout in which the matrix is used to render the plurality of speaker feeds from the higher order ambisonic coefficients.
The device of claim 1.
前記複数のスピーカーフィードに基づいて前記高次アンビソニック係数によって表わされる音場を再生するように構成されるスピーカーをさらに備える、
請求項1に記載のデバイス。
A speaker configured to reproduce a sound field represented by the higher order ambisonic coefficient based on the plurality of speaker feeds;
The device of claim 1.
前記1つまたは複数のプロセッサは、前記複数のスピーカーフィードを生成するときに使用されるオーディオレンダラを識別する信号値を示すオーディオレンダリング情報を前記ビットストリームから取得することと、前記オーディオレンダリング情報に基づいて前記複数のスピーカーフィードをレンダリングすることとを行うようにさらに構成される、
請求項1に記載のデバイス。
The one or more processors obtain audio rendering information from the bitstream indicating signal values identifying audio renderers used when generating the plurality of speaker feeds, and based on the audio rendering information Further configured to render the plurality of speaker feeds;
The device of claim 1.
前記信号値は、前記複数のスピーカーフィードに前記高次アンビソニック係数をレンダリングするために使用される前記行列に関連付けられたインデックスを含み、
前記1つまたは複数のプロセッサは、前記信号値中に含まれる前記インデックスに関連付けられた前記行列に基づいて前記複数のスピーカーフィードをレンダリングするように構成される、
請求項4に記載のデバイス。
The signal value includes an index associated with the matrix used to render the higher order ambisonic coefficients in the plurality of speaker feeds;
The one or more processors are configured to render the plurality of speaker feeds based on the matrix associated with the index included in the signal value.
The device of claim 4.
高次アンビソニック係数をレンダリングする方法であって、
複数のスピーカーフィードを生成する、前記高次アンビソニック係数をレンダリングするために使用される行列の希薄さを示す希薄さ情報を、前記高次アンビソニック係数の符号化されたバージョンを含むビットストリームから取得することと、
前記行列の符号シンメトリを示す符号シンメトリ情報を前記ビットストリームから取得することと、
前記行列を表わすために使用される低減されたビット数を前記ビットストリームから取得することと、
前記希薄さ情報、前記符号シンメトリ情報、および前記低減されたビット数に基づいて、前記行列を再構成することと
を備える、方法。
A method for rendering higher order ambisonic coefficients,
Sparseness information indicating the sparseness of the matrix used to render the higher order ambisonic coefficients to generate a plurality of speaker feeds from a bitstream containing an encoded version of the higher order ambisonic coefficients Getting,
Obtaining code symmetry information indicating code symmetry of the matrix from the bitstream;
Obtaining a reduced number of bits used to represent the matrix from the bitstream;
Reconstructing the matrix based on the sparseness information, the code symmetry information, and the reduced number of bits.
前記行列が前記高次アンビソニック係数からマルチチャネルオーディオデータをレンダリングするために使用されるスピーカーレイアウトを決定することをさらに備える、
請求項6に記載の方法。
The matrix further comprising: determining a speaker layout used to render multi-channel audio data from the higher order ambisonic coefficients;
The method of claim 6.
前記複数のスピーカーフィードに基づいて前記高次アンビソニック係数によって表わされる音場を再生することをさらに備える、
請求項6に記載の方法。
Replaying a sound field represented by the higher order ambisonic coefficient based on the plurality of speaker feeds;
The method of claim 6.
前記複数のスピーカーフィードを生成するときに使用されるオーディオレンダラを識別する信号値を示すオーディオレンダリング情報を前記ビットストリームから取得することと、
前記オーディオレンダリング情報に基づいて前記複数のスピーカーフィードをレンダリングすることと
をさらに備える、請求項6に記載の方法。
Obtaining audio rendering information from the bitstream indicating a signal value identifying an audio renderer used when generating the plurality of speaker feeds;
The method of claim 6, further comprising rendering the plurality of speaker feeds based on the audio rendering information.
前記信号値は、前記複数のスピーカーフィードを生成するために、前記高次アンビソニック係数をレンダリングするために使用される前記行列に関連付けられたインデックスを含み、
前記方法は、前記信号値中に含まれる前記インデックスに関連付けられた前記行列に基づいて前記複数のスピーカーフィードをレンダリングすることをさらに備える、
請求項9に記載の方法。
The signal value includes an index associated with the matrix used to render the higher order ambisonic coefficients to generate the plurality of speaker feeds;
The method further comprises rendering the plurality of speaker feeds based on the matrix associated with the index included in the signal value.
The method of claim 9.
ビットストリームを作成するように構成されるデバイスであって、
複数のスピーカーフィードを生成する、高次アンビソニック係数をレンダリングするために使用される行列を記憶するように構成されるメモリと、
前記メモリに結合され、
前記行列の符号シンメトリを示す符号シンメトリ情報を取得することと、
前記行列の希薄さを示す希薄さ情報を取得することと、
前記符号シンメトリ情報および前記希薄さ情報に基づいて、前記行列を表わすために使用される低減されたビット数を決定することと、
前記高次アンビソニック係数の符号化されたバージョン、前記符号シンメトリ情報、前記希薄さ情報、および前記低減されたビット数を含むように前記ビットストリームを生成することと
を行うように構成される1つまたは複数のプロセッサと
を備える、デバイス。
A device configured to create a bitstream,
A memory configured to store a matrix used to render higher order ambisonic coefficients to generate a plurality of speaker feeds;
Coupled to the memory,
Obtaining code symmetry information indicating code symmetry of the matrix;
Obtaining sparse information indicating the sparseness of the matrix;
Determining a reduced number of bits used to represent the matrix based on the code symmetry information and the sparseness information;
Generating the bitstream to include a coded version of the higher order ambisonic coefficients, the code symmetry information, the sparseness information, and the reduced number of bits 1 A device comprising one or more processors.
前記1つまたは複数のプロセッサは、前記行列が前記高次アンビソニック係数から前記複数のスピーカーフィードをレンダリングするために使用されるスピーカーレイアウトを決定するようにさらに構成される、
請求項11に記載のデバイス。
The one or more processors are further configured to determine a speaker layout in which the matrix is used to render the plurality of speaker feeds from the higher order ambisonic coefficients.
The device of claim 11.
前記高次アンビソニック係数によって表わされる音場をキャプチャするように構成されるマイクロフォンをさらに備える、
請求項11に記載のデバイス。
Further comprising a microphone configured to capture a sound field represented by the higher order ambisonic coefficient;
The device of claim 11.
ビットストリームを作成する方法であって、
複数のスピーカーフィードを生成する、高次アンビソニック係数をレンダリングするために使用される行列の希薄さを示す希薄さ情報を取得することと、
前記行列の符号シンメトリを示す符号シンメトリ情報を取得することと、
前記符号シンメトリ情報および前記希薄さ情報に基づいて、前記行列を表わすために使用される低減されたビット数を決定することと、
前記高次アンビソニック係数の符号化されたバージョン、前記符号シンメトリ情報、前記希薄さ情報、および前記低減されたビット数を含むように前記ビットストリームを生成することと
を備える、方法。
A method of creating a bitstream,
Obtaining sparseness information indicating the sparseness of the matrix used to render the higher-order ambisonic coefficients that generate multiple speaker feeds;
Obtaining code symmetry information indicating code symmetry of the matrix;
Determining a reduced number of bits used to represent the matrix based on the code symmetry information and the sparseness information;
Generating the bitstream to include a coded version of the higher order ambisonic coefficients, the code symmetry information, the sparseness information, and the reduced number of bits.
前記行列が前記高次アンビソニック係数からマルチチャネルオーディオデータをレンダリングするために使用されるスピーカーレイアウトを決定することをさらに備える、
請求項14に記載の方法。
The matrix further comprising: determining a speaker layout used to render multi-channel audio data from the higher order ambisonic coefficients;
The method according to claim 14.
JP2016569921A 2014-05-30 2015-05-29 Obtaining symmetry information for higher-order ambisonic audio renderers Active JP6423009B2 (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201462005829P 2014-05-30 2014-05-30
US62/005,829 2014-05-30
US201462023662P 2014-07-11 2014-07-11
US62/023,662 2014-07-11
US14/724,615 2015-05-28
US14/724,615 US9883310B2 (en) 2013-02-08 2015-05-28 Obtaining symmetry information for higher order ambisonic audio renderers
PCT/US2015/033273 WO2015184316A1 (en) 2014-05-30 2015-05-29 Obtaining symmetry information for higher order ambisonic audio renderers

Publications (3)

Publication Number Publication Date
JP2017520174A JP2017520174A (en) 2017-07-20
JP2017520174A5 true JP2017520174A5 (en) 2018-10-04
JP6423009B2 JP6423009B2 (en) 2018-11-14

Family

ID=53366342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016569921A Active JP6423009B2 (en) 2014-05-30 2015-05-29 Obtaining symmetry information for higher-order ambisonic audio renderers

Country Status (9)

Country Link
EP (1) EP3149972B1 (en)
JP (1) JP6423009B2 (en)
KR (1) KR101941764B1 (en)
CN (1) CN106465029B (en)
BR (1) BR112016028212B1 (en)
CA (1) CA2950014C (en)
ES (1) ES2696930T3 (en)
HU (1) HUE039048T2 (en)
WO (1) WO2015184316A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10015618B1 (en) * 2017-08-01 2018-07-03 Google Llc Incoherent idempotent ambisonics rendering
BR112020017338A2 (en) 2018-07-02 2021-03-02 Dolby Laboratories Licensing Corporation methods and devices for encoding and / or decoding immersive audio signals
CN110099351B (en) * 2019-04-01 2020-11-03 中车青岛四方机车车辆股份有限公司 Sound field playback method, device and system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2010305313B2 (en) * 2009-10-07 2015-05-28 The University Of Sydney Reconstruction of a recorded sound field
WO2014012945A1 (en) * 2012-07-16 2014-01-23 Thomson Licensing Method and device for rendering an audio soundfield representation for audio playback
US9854377B2 (en) 2013-05-29 2017-12-26 Qualcomm Incorporated Interpolation for decomposed representations of a sound field

Similar Documents

Publication Publication Date Title
KR102182761B1 (en) Signaling audio rendering information in a bitstream
US9761229B2 (en) Systems, methods, apparatus, and computer-readable media for audio object clustering
US9478225B2 (en) Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
CN105027199B (en) Refer in bit stream and determine spherical harmonic coefficient and/or high-order ambiophony coefficient
US10249312B2 (en) Quantization of spatial vectors
CN104471640B (en) The scalable downmix design with feedback of object-based surround sound coding decoder
JP2017520177A5 (en)
ES2729624T3 (en) Reduction of correlation between higher order ambisonic background channels (HOA)
JP2017521693A5 (en)
JP2017534910A5 (en)
JP2016509819A5 (en)
JP2016510435A5 (en)
JP2016510905A5 (en)
JP2009526260A5 (en)
JP2017519239A5 (en)
JP2009526259A5 (en)
CN105580070A (en) Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
MX2012003785A (en) Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value.
AR086775A1 (en) SYSTEM AND METHOD FOR GENERATION, CODIFICATION AND REPRESENTATION OF ADAPTIVE AUDIO SIGNALS
JP2017525318A5 (en)
JP2009526262A5 (en)
JP2017534911A5 (en)
EP3400598B1 (en) Mixed domain coding of audio
WO2015138856A1 (en) Low frequency rendering of higher-order ambisonic audio data
CN108141689B (en) Transition from object-based audio to HOA