JP7142109B2 - 空間オーディオパラメータのシグナリング - Google Patents
空間オーディオパラメータのシグナリング Download PDFInfo
- Publication number
- JP7142109B2 JP7142109B2 JP2020566885A JP2020566885A JP7142109B2 JP 7142109 B2 JP7142109 B2 JP 7142109B2 JP 2020566885 A JP2020566885 A JP 2020566885A JP 2020566885 A JP2020566885 A JP 2020566885A JP 7142109 B2 JP7142109 B2 JP 7142109B2
- Authority
- JP
- Japan
- Prior art keywords
- coherence
- parameter
- speaker
- determining
- channel audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011664 signaling Effects 0.000 title description 10
- 230000005236 sound signal Effects 0.000 claims description 182
- 238000000034 method Methods 0.000 claims description 88
- 230000001427 coherent effect Effects 0.000 claims description 82
- 238000009792 diffusion process Methods 0.000 claims description 61
- 238000004091 panning Methods 0.000 claims description 50
- 238000004458 analytical method Methods 0.000 claims description 46
- 230000007480 spreading Effects 0.000 claims description 29
- 238000003892 spreading Methods 0.000 claims description 29
- 238000009826 distribution Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 description 136
- 230000005540 biological transmission Effects 0.000 description 32
- 230000015572 biosynthetic process Effects 0.000 description 22
- 238000003786 synthesis reaction Methods 0.000 description 21
- 239000013598 vector Substances 0.000 description 20
- 230000008447 perception Effects 0.000 description 18
- 239000000203 mixture Substances 0.000 description 14
- 238000013139 quantization Methods 0.000 description 13
- 230000009471 action Effects 0.000 description 11
- 238000013461 design Methods 0.000 description 8
- 238000009877 rendering Methods 0.000 description 7
- 239000004065 semiconductor Substances 0.000 description 6
- 238000003491 array Methods 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008867 communication pathway Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Description
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定する手段と、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定する手段であって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、決定する手段と、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信する手段と、
を備える。
前記少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた前記少なくとも1つの情報を前記送信する手段は、前記少なくとも1つのコヒーレンスパラメータの少なくとも1つの配向、前記少なくとも1つのコヒーレンスパラメータの少なくとも1つの幅、および前記少なくとも1つのコヒーレンスパラメータの少なくとも1つの範囲のうちの少なくとも1つを送信してもよい。
前記2つ以上のスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータ、前記少なくとも1つのコヒーレンスパラメータ、および/または前記伝送オーディオ信号に基づいて再生され得る。
前記拡散コヒーレンスパラメータは、識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つ以上のスピーカーチャネルオーディオ信号間でチャネル間コヒーレンス情報に基づいて決定されてもよく、
前記識別されたスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータに基づいて識別される。
前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの方向パラメータに空間的に最も近い前記スピーカーチャネルオーディオ信号である前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つのスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたステレオネスパラメータを決定し、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する少なくとも2つ以上のスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたコヒーレントパンニングパラメータを決定し、
前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成してもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定し、
前記識別されたスピーカーからの方向からサーチし、エリアでの各サーチが、一連の角度ステップで0から180度までの角度を含み、
定義された主要なスピーカーチャネルと、前記サーチエリア内の任意のスピーカーチャネルとの間で平均コヒーレンス値を推定し、
前記平均コヒーレンス値に基づいて、実質的に一定のコヒーレンスエリアを決定し、
最も大きいコヒーレンスエリアの2倍で拡散範囲を設定し、
前記拡散範囲に基づいて、前記コヒーレントパンニングパラメータを定義してもよい。
前記スピーカーと、前記最も大きいコヒーレンスエリアの内側のすべてのスピーカーとの間で正規化されたコヒーレンスca、iを決定し、
閾値エネルギーよりも低いエネルギーを有するスピーカーを省略し、
残りのスピーカーから最小のコヒーレンスを選択し、
前記残りのスピーカー間でエネルギー分配に基づいて、エネルギー分配パラメータを決定し、
前記コヒーレントパンニングパラメータを決定するために、前記最も大きいコヒーレンスエリアで前記エネルギー分配パラメータを乗算してもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定し、
前記識別されたスピーカーからの方向からサーチし、リングでの各サーチが、一連の角度ステップで0から180度までの角度によって定義され、
前記サーチリングの近くに配置されたすべてのスピーカーについて、平均コヒーレンス値および平均エネルギー値を推定し、
前記平均コヒーレンス値および平均エネルギー値に基づいて、最も大きいコヒーレンスリング角度を決定し、
前記最も大きいコヒーレンスリング角度の2倍で拡散範囲を設定し、
前記拡散範囲に基づいて、前記ステレオネスパラメータを定義してもよい。
前記識別されたスピーカーと、前記最も大きいコヒーレンスリング上の他のスピーカーとの間で正規化されたコヒーレンスを決定し、
それぞれのエネルギーによって重み付けされる前記正規化されたコヒーレンスの平均値を求め、
前記最も大きいコヒーレンスリング上のエネルギーおよび前記最も大きいコヒーレンスリングの内側のエネルギーの比を求め、
前記ステレオネスパラメータを形成するために、エネルギーの前記比および正規化されたコヒーレンスの平均値を乗算してもよい。
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定することであって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、決定することと、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信することと、
を含む。
前記2つ以上のスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータ、前記少なくとも1つのコヒーレンスパラメータ、および/または前記伝送オーディオ信号に基づいて再生され得る。
前記拡散コヒーレンスパラメータは、識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つ以上のスピーカーチャネルオーディオ信号間でチャネル間コヒーレンス情報に基づいて決定されてもよく、
前記識別されたスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータに基づいて識別される。
前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの方向パラメータに空間的に最も近い前記スピーカーチャネルオーディオ信号である前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つのスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたステレオネスパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する少なくとも2つ以上のスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたコヒーレントパンニングパラメータを決定することと、
前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成することと、を含んでもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定することと、
前記識別されたスピーカーからの方向からサーチすることであって、エリアでの各サーチが、一連の角度ステップで0から180度までの角度を含む、サーチすることと、
定義された主要なスピーカーチャネルと、前記サーチエリア内の任意のスピーカーチャネルとの間で平均コヒーレンス値を推定することと、
前記平均コヒーレンス値に基づいて、実質的に一定のコヒーレンスエリアを決定することと、
最も大きいコヒーレンスエリアの2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記コヒーレントパンニングパラメータを定義することと、を含んでもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを決定することと、
前記スピーカーと、前記最も大きいコヒーレンスエリアの内側のすべてのスピーカーとの間で正規化されたコヒーレンスca、iを決定することと、
閾値エネルギーよりも低いエネルギーを有するスピーカーを省略することと、
残りのスピーカーから最小のコヒーレンスを選択することと、
前記残りのスピーカー間でエネルギー分配に基づいて、エネルギー分配パラメータを決定することと、
前記コヒーレントパンニングパラメータを決定するために、前記最も大きいコヒーレンスエリアで前記エネルギー分配パラメータを乗算することと、を含んでもよい。
前記識別されたスピーカーからの方向からサーチすることであって、リングでの各サーチが、一連の角度ステップで0から180度までの角度によって定義される、サーチすることと、
前記サーチリングの近くに配置されたすべてのスピーカーについて、平均コヒーレンス値および平均エネルギー値を推定することと、
前記平均コヒーレンス値および平均エネルギー値に基づいて、最も大きいコヒーレンスリング角度を決定することと、
前記最も大きいコヒーレンスリング角度の2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記ステレオネスパラメータを定義することと、を含んでもよい。
最も大きいエネルギーを有する最も大きいコヒーレンスリング上でスピーカーを識別することと、
前記識別されたスピーカーと、前記最も大きいコヒーレンスリング上の他のスピーカーとの間で正規化されたコヒーレンスを決定することと、
それぞれのエネルギーによって重み付けされる前記正規化されたコヒーレンスの平均値を求めることと、
前記最も大きいコヒーレンスリング上のエネルギーおよび前記最も大きいコヒーレンスリングの内側のエネルギーの比を求めることと、
前記ステレオネスパラメータを形成するために、エネルギーの前記比および正規化されたコヒーレンスの平均値を乗算することと、を含んでもよい。
少なくとも1つのプロセッサと、
コンピュータプログラムコードを含む少なくとも1つのメモリと、
を備える。
前記少なくとも1つのメモリおよび前記コンピュータプログラムコードは、前記少なくとも1つのプロセッサによって、前記装置に少なくとも、
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定させ、
前記少なくとも1つの空間オーディオパラメータおよび少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのコヒーレンスパラメータに対応付けられた、前記少なくとも1つのオーディオ信号関係パラメータを、前記2つ以上のスピーカーチャネルオーディオ信号間で決定させ、
前記少なくとも1つの空間オーディオパラメータを送信させ、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信させる
ように構成されている。
前記2つ以上のスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータ、前記少なくとも1つのコヒーレンスパラメータ、および/または前記伝送オーディオ信号に基づいて再生され得る。
前記拡散コヒーレンスパラメータは、識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つ以上のスピーカーチャネルオーディオ信号間でチャネル間コヒーレンス情報に基づいて決定されてもよく、
前記識別されたスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータに基づいて識別される。
前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの方向パラメータに空間的に最も近い前記スピーカーチャネルオーディオ信号である前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つのスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたステレオネスパラメータを決定し、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する少なくとも2つ以上のスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたコヒーレントパンニングパラメータを決定し、
前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成してもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定し、
前記識別されたスピーカーからの方向からサーチし、エリアでの各サーチが、一連の角度ステップで0から180度までの角度を含み、
定義された主要なスピーカーチャネルと、前記サーチエリア内の任意のスピーカーチャネルとの間で平均コヒーレンス値を推定し、
前記平均コヒーレンス値に基づいて、実質的に一定のコヒーレンスエリアを決定し、
最も大きいコヒーレンスエリアの2倍で拡散範囲を設定し、
前記拡散範囲に基づいて、前記コヒーレントパンニングパラメータを定義してもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを決定し、
前記スピーカーと、前記最も大きいコヒーレンスエリアの内側のすべてのスピーカーとの間で正規化されたコヒーレンスca、iを決定し、
閾値エネルギーよりも低いエネルギーを有するスピーカーを省略し、
残りのスピーカーから最小のコヒーレンスを選択し、
前記残りのスピーカー間でエネルギー分配に基づいて、エネルギー分配パラメータを決定し、
前記コヒーレントパンニングパラメータを決定するために、前記最も大きいコヒーレンスエリアで前記エネルギー分配パラメータを乗算してもよい。
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定し、
前記識別されたスピーカーからの方向からサーチし、リングでの各サーチが、一連の角度ステップで0から180度までの角度によって定義され、
前記サーチリングの近くに配置されたすべてのスピーカーについて、平均コヒーレンス値および平均エネルギー値を推定し、
前記平均コヒーレンス値および平均エネルギー値に基づいて、最も大きいコヒーレンスリング角度を決定し、
前記最も大きいコヒーレンスリング角度の2倍で拡散範囲を設定し、
前記拡散範囲に基づいて、前記ステレオネスパラメータを定義してもよい。
最も大きいエネルギーを有する最も大きいコヒーレンスリング上でスピーカーを識別し、
前記識別されたスピーカーと、前記最も大きいコヒーレンスリング上の他のスピーカーとの間で正規化されたコヒーレンスを決定し、
それぞれのエネルギーによって重み付けされる前記正規化されたコヒーレンスの平均値を求め、
前記最も大きいコヒーレンスリング上のエネルギーおよび前記最も大きいコヒーレンスリングの内側のエネルギーの比を求め、
前記ステレオネスパラメータを形成するために、エネルギーの前記比および正規化されたコヒーレンスの平均値を乗算してもよい。
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定することであって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、決定することと、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信することと、
を実行させる。
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定することであって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、決定することと、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信することと、
を実行させる。
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定するように構成された空間オーディオパラメータ決定回路と、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定するように構成されたオーディオ信号関係パラメータ決定回路であって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、オーディオ信号関係パラメータ決定回路と、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信することを制御するための送信制御回路と、を備える。
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために少なくとも1つの空間オーディオパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定することであって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号を再生するように、少なくとも1つのコヒーレンスパラメータが、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供するように、前記少なくとも1つのオーディオ信号関係パラメータは前記少なくとも1つのコヒーレンスパラメータに対応付けられている、決定することと、
前記少なくとも1つの空間オーディオパラメータを送信し、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信することと、
を実行させる。
1)音声が、「エアリー」知覚を生成するために2つのスピーカーを使用(例えば、中央の代わりに、前方左および右を使用)してコヒーレントに再生される。
2)音声が、「近い」知覚を生成するために3つの(または3つを超える)スピーカーを使用(例えば、中央のみの代わりに、前方左、右、および中央を使用)してコヒーレントに再生される。
3)音声が、「頭の内側での」または「上での」知覚を生成するために(ほぼ)すべてのスピーカーからコヒーレントに再生される。
ここで、bは、周波数ビンインデックスであり、nは、フレームインデックスであり、iは、スピーカーチャネルインデックスである。別の式では、nは、元の時間領域信号よりも低いサンプリングレートを有する時間インデックスと考えられ得る。これらの周波数ビンは、ビンのうちの1つ以上を帯域インデックスk=0,...,K-1にグループ化するサブ帯域にグループ化され得る。各サブ帯域kは、最も低いビンbk,lowと、最も高いビンbk,highと、を有し、サブ帯域は、bk,low~bk,highのすべてのビンを含む。サブ帯域の幅は、任意の好適な分配に近似し得る。例えば、等価矩形帯域幅尺度(Equivalent Rectangular Bandwidth:ERB)またはバーク(Bark)尺度である。
以下のように、ilおよびirスピーカーのエネルギーと、il、ir、およびicスピーカーのエネルギーとの間の比を決定するように構成されてもよい。
c'iejは、最大音量チャネルと、M個の次に大音量チャネルとの間の正規化されたコヒーレンスである。
・0~180度回転での拡散配向コード、および
・拡散範囲についての0~360度中心角での円形セクタコード
を拡散コヒーレンスエンコーダにエンコードさせ得る。
ここで、bはシグナリングビットであり、Qstepは、量子化ステップサイズである。4ビット表現について、これは、以下のとおりである。
ここで、Iは、単位行列であり、Uは、1の行列であり、Mは、出力チャネルの数である。言い換えると、γが0のとき、周囲の共分散行列CAは対角であり、γが1のとき、周囲の共分散行列は、そのすべてのチャネルペアがコヒーレントであるように決定する。
を有することを決定するように構成されてもよい。そのベクトルについての共分散行列は、以下のとおりである。
ここで、
cbin(k)は、第k番目の周波数インデックスの周波数についてのバイノーラル拡散フィールドコヒーレンスである。言い換えると、γ(k,n)が1であるとき、周囲の共分散行列CAは、左耳と右耳との間の完全なコヒーレンスを決定する。γ(k,n)がゼロのとき、CAは、拡散フィールドで人間のリスナーにとって自然である、左耳と右耳との間のコヒーレンス(大まかに、高周波数でゼロ、低周波数で高い)を決定する。
ここで、θΔパラメータは、方位角寸法に関して、「拡散」音声エネルギーの幅を定義する。それは、パラメータ入力として提供される場合、例えば、30度または拡散範囲パラメータの半分であり得る。
ターゲット共分散行列決定器1205は、3つの方向でコヒーレントに音声を再生することと等価である、パンニングアンビソニックスベクトルを決定し得る。
ここで、θΔパラメータは、方位角寸法に関して、「拡散」音声エネルギーの幅を定義する。それは、パラメータ入力として提供される場合、例えば、30度または拡散範囲パラメータの半分であり得る。
2)音声が、「近い」知覚を生成するために3つの(または3つを超える)スピーカーを使用(例えば、中央のみの代わりに、前方左、右、および中央を使用)してコヒーレントに再生される。
3)音声が、「頭の内側での」または「上での」知覚を生成するために(ほぼ)すべてのスピーカーからコヒーレントに再生される。
2)音声は、部分的に周囲、すなわち、中央のスピーカーでのドライサウンドおよびすべてのスピーカーでの非相関音声として再生される。音源は、遠く離れているように知覚されるが、一方、それは、元の信号と近かった。
3)音声は、周囲として再生され、ほとんどすべての音声は、すべてのスピーカーから非相関として再生される。空間知覚は、元の信号のものに対してほぼ反対である。
1)音声は、元の信号のように2つのスピーカーを使用してコヒーレントに再生される。
2)音声は、元の信号のように3つのスピーカーを使用してコヒーレントに再生される。
3)音声は、元の信号のようにすべてのスピーカーを使用してコヒーレントに再生される。
(a)(アナログおよび/またはデジタル回路のみでの実装態様などの)ハードウェアのみの回路実装態様
(b)(i)ソフトウェア/ファームウェアを有するアナログおよび/またはデジタルハードウェア回路の組合せ、(ii)(デジタル信号プロセッサを含む)ソフトウェアを有するハードウェアプロセッサ、ソフトウェア、および携帯電話またはサーバなどの装置に様々な機能を実行させるように一緒に機能するメモリの任意の部分などの、(適用可能な)ハードウェア回路およびソフトウェアの組合せ
(c)動作のためにソフトウェア(例えば、ファームウェア)を必要とするが、ソフトウェアは、動作のために必要とされないときに存在しない場合がある、マイクロプロセッサまたはマイクロプロセッサの一部などのハードウェア回路および/またはプロセッサ
Claims (18)
- 装置であって、
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために、少なくとも1つの空間オーディオパラメータを決定する手段と、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定する手段と、
を備え、
前記少なくとも1つの空間オーディオパラメータは、少なくとも1つの方向パラメータと少なくとも1つのエネルギー比パラメータの少なくとも1つを含み、
前記少なくとも1つのオーディオ信号関係パラメータは少なくとも1つのコヒーレンスパラメータに対応付けられており、前記少なくとも1つのコヒーレンスパラメータは、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供し、それによって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号が再生され、
前記装置は更に、
前記少なくとも1つの空間オーディオパラメータを送信すると共に、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信する手段、
を備え、ここで前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた前記少なくとも1つの情報は、チャネル間コヒーレンスエリアの配向、幅、範囲の少なくとも1つを含む、装置。 - 前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの空間オーディオパラメータと、前記少なくとも1つのコヒーレンスパラメータと、伝送オーディオ信号のいずれか1つ以上に基づいて再生されるように、前記2つ以上のスピーカーチャネルオーディオ信号から伝送オーディオ信号を決定するように構成される、
請求項1に記載の装置。 - 前記2つ以上のスピーカーチャネルオーディオ信号間から前記少なくとも1つのコヒーレンスパラメータを決定するように構成され、
前記少なくとも1つのコヒーレンスパラメータを決定することは、拡散コヒーレンスパラメータを決定することを含み、
前記拡散コヒーレンスパラメータは、識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つ以上のスピーカーチャネルオーディオ信号間でチャネル間コヒーレンス情報に基づいて決定され、
前記識別されたスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータに基づいて識別される、
請求項1又は2に記載の装置。 - 前記拡散コヒーレンスパラメータを決定することは、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの方向パラメータに空間的に最も近い前記スピーカーチャネルオーディオ信号である前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つのスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたステレオネスパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する少なくとも2つ以上のスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すことに対応付けられたコヒーレントパンニングパラメータを決定することと、
前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成することと、
を含む、請求項3に記載の装置。 - 前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成することは、さらに、
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定することと、
前記識別されたスピーカーからの方向からサーチすることであって、エリアでの各サーチが、一連の角度ステップで0から180度までの角度を含むことと、
前記識別されたスピーカーと、前記サーチエリア内の任意のスピーカーチャネルとの間で平均コヒーレンス値を推定することと、
前記平均コヒーレンス値に基づいて、一定のコヒーレンスエリアを決定し、
最も大きいコヒーレンスエリアの2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記コヒーレントパンニングパラメータを定義することと、
を含む、請求項4に記載の装置。 - 前記最も大きいコヒーレンスエリアに基づいて、前記コヒーレントパンニングパラメータを定義することは、
前記少なくとも1つの方向パラメータに最も近いスピーカーを決定することと、
前記スピーカーと、前記最も大きいコヒーレンスエリアの内側のすべてのスピーカーとの間で正規化されたコヒーレンスを決定することと、
閾値エネルギーよりも低いエネルギーを有するスピーカーを省略することと、
残りのスピーカーから最小のコヒーレンスを選択することと、
前記残りのスピーカー間でエネルギー分配に基づいて、エネルギー分配パラメータを決定することと、
前記コヒーレントパンニングパラメータを決定するために、前記エネルギー分配パラメータを最小のコヒーレンスに乗算することと、
を含む、請求項5に記載の装置。 - 前記ステレオネスパラメータを決定することは、
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定することと、
前記識別されたスピーカーからの方向からサーチすることであって、リングでの各サーチが、一連の角度ステップで0から180度までの角度によって定義されることと、
前記サーチリングから所定の角度以内に配置されたすべてのスピーカーについて、平均コヒーレンス値および平均エネルギー値を推定することと、
前記平均コヒーレンス値および平均エネルギー値に基づいて、最も大きいコヒーレンスリング角度を決定することと、
前記最も大きいコヒーレンスリング角度の2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記ステレオネスパラメータを定義することと、
を含む、請求項4から6のいずれかに記載の装置。 - 前記拡散範囲に基づいて、前記ステレオネスパラメータを定義することは、
最も大きいコヒーレンスリング上で最も大きいエネルギーを有するスピーカーを識別することと、
前記識別されたスピーカーと、前記最も大きいコヒーレンスリング上の他のスピーカーとの間で正規化されたコヒーレンスを決定することと、
それぞれのエネルギーによって重み付けされる前記正規化されたコヒーレンスの平均値を求めることと、
前記最も大きいコヒーレンスリング上のエネルギーおよび前記最も大きいコヒーレンスリングの内側のエネルギーの比を求めることと、
前記ステレオネスパラメータを形成するために、エネルギーの前記比および正規化されたコヒーレンスの平均値を乗算することと、
を含む、請求項7に記載の装置。 - 方法であって、
2つ以上のスピーカーチャネルオーディオ信号について、空間オーディオ再生を提供するために、少なくとも1つの空間オーディオパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのオーディオ信号関係パラメータを決定することと、
を含み、
前記少なくとも1つの空間オーディオパラメータは、少なくとも1つの方向パラメータと少なくとも1つのエネルギー比パラメータの少なくとも1つを含み、
前記少なくとも1つのオーディオ信号関係パラメータは少なくとも1つのコヒーレンスパラメータに対応付けられており、前記少なくとも1つのコヒーレンスパラメータは、少なくとも2つの周波数帯域について、前記2つ以上のスピーカーチャネルオーディオ信号間で少なくとも1つのチャネル間コヒーレンス情報を提供し、それによって、前記少なくとも1つの空間オーディオパラメータおよび前記少なくとも1つのオーディオ信号関係パラメータに基づいて、前記2つ以上のスピーカーチャネルオーディオ信号が再生され、
前記方法は更に、
前記少なくとも1つの空間オーディオパラメータを送信すると共に、少なくとも1つの決定された値を使用して、前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた少なくとも1つの情報を送信すること、
を含み、ここで前記少なくとも1つのチャネル間コヒーレンス情報に対応付けられた前記少なくとも1つの情報は、チャネル間コヒーレンスエリアの配向、幅、範囲の少なくとも1つを含む、方法。 - 前記2つ以上のスピーカーチャネルオーディオ信号が、前記少なくとも1つの空間オーディオパラメータと、前記少なくとも1つのコヒーレンスパラメータと、伝送オーディオ信号のいずれか1つ以上に基づいて再生されるように、前記2つ以上のスピーカーチャネルオーディオ信号から伝送オーディオ信号を決定することと、
を含む、請求項9に記載の方法。 - 前記2つ以上のスピーカーチャネルオーディオ信号間で前記少なくとも1つのコヒーレンスパラメータを決定することを含み、
前記少なくとも1つのコヒーレンスパラメータを決定することは、拡散コヒーレンスパラメータを決定することを含み、
前記拡散コヒーレンスパラメータは、識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つ以上のスピーカーチャネルオーディオ信号間でチャネル間コヒーレンス情報に基づいて決定され、
前記識別されたスピーカーチャネルオーディオ信号は、前記少なくとも1つの空間オーディオパラメータに基づいて識別される、
請求項9又は10に記載の方法。 - 前記拡散コヒーレンスパラメータを決定することは、
前記2つ以上のスピーカーチャネルオーディオ信号は、少なくとも1つの方向パラメータに空間的に最も近い前記スピーカーチャネルオーディオ信号である前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する2つのスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すステレオネスパラメータを決定することと、
前記2つ以上のスピーカーチャネルオーディオ信号が、前記識別されたスピーカーチャネルオーディオ信号に空間的に隣接する少なくとも2つ以上のスピーカーチャネルオーディオ信号を使用して、コヒーレントに再生されることを示すコヒーレントパンニングパラメータを決定することと、
前記ステレオネスパラメータおよび前記コヒーレントパンニングパラメータに基づいて、前記拡散コヒーレンスパラメータを生成することと、
を含む、請求項11に記載の方法。 - 前記拡散コヒーレンスパラメータを生成することは、
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定することと、
前記識別されたスピーカーからの方向からサーチすることであって、エリアでの各サーチが、一連の角度ステップで0から180度までの角度を含む、サーチすることと、
前記識別されたスピーカーと、前記サーチエリア内の任意のスピーカーチャネルとの間で平均コヒーレンス値を推定することと、
前記平均コヒーレンス値に基づいて、一定のコヒーレンスエリアを決定することと、
最も大きいコヒーレンスエリアの2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記コヒーレントパンニングパラメータを定義することと、をさらに含む、請求項12に記載の方法。 - 前記最も大きいコヒーレンスエリアに基づいて、前記コヒーレントパンニングパラメータを定義することは、
前記少なくとも1つの方向パラメータに最も近いスピーカーを決定することと、
前記スピーカーと、前記最も大きいコヒーレンスエリアの内側のすべてのスピーカーとの間で正規化されたコヒーレンスを決定することと、
閾値エネルギーよりも低いエネルギーを有するスピーカーを省略することと、
残りのスピーカーから最小のコヒーレンスを選択することと、
前記残りのスピーカー間でエネルギー分配に基づいて、エネルギー分配パラメータを決定することと、
前記コヒーレントパンニングパラメータを決定するために、前記エネルギー分配パラメータを最小のコヒーレンスに乗算することと、
を含む、請求項13に記載の方法。 - 前記ステレオネスパラメータを決定することは、
前記少なくとも1つの方向パラメータに最も近いスピーカーを識別するために、主要な方向分析を決定することと、
前記識別されたスピーカーからの方向からサーチすることであって、リングでの各サーチが、一連の角度ステップで0から180度までの角度によって定義されることと、
前記サーチリングから所定の角度以内に配置されたすべてのスピーカーについて、平均コヒーレンス値および平均エネルギー値を推定することと、
前記平均コヒーレンス値および平均エネルギー値に基づいて、最も大きいコヒーレンスリング角度を決定することと、
前記最も大きいコヒーレンスリング角度の2倍で拡散範囲を設定することと、
前記拡散範囲に基づいて、前記ステレオネスパラメータを定義することと、
を含む、請求項12から14のいずれかに記載の方法。 - 前記拡散範囲に基づいて、前記ステレオネスパラメータを定義することは、
最も大きいコヒーレンスリング上で最も大きいエネルギーを有するスピーカーを識別することと、
前記識別されたスピーカーと、前記最も大きいコヒーレンスリング上の他のスピーカーとの間で正規化されたコヒーレンスを決定することと、
それぞれのエネルギーによって重み付けされる前記正規化されたコヒーレンスの平均値を求めることと、
前記最も大きいコヒーレンスリング上のエネルギーおよび前記最も大きいコヒーレンスリングの内側のエネルギーの比を求めることと、
前記ステレオネスパラメータを形成するために、エネルギーの前記比および正規化されたコヒーレンスの平均値を乗算することと、
を含む、請求項15に記載の方法。 - 処理手段及び記憶手段を備える装置であって、前記記憶手段はプログラム命令を格納し、前記プログラム命令は、前記処理手段に実行されると、前記装置に、請求項9から16のいずれかに記載の方法を遂行させるように構成される、装置。
- 装置の処理手段に実行されると、前記装置に、請求項9から16のいずれかに記載の方法を遂行させるように構成されるプログラム命令を備える、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1808930.0A GB2574239A (en) | 2018-05-31 | 2018-05-31 | Signalling of spatial audio parameters |
GB1808930.0 | 2018-05-31 | ||
PCT/FI2019/050412 WO2019229298A1 (en) | 2018-05-31 | 2019-05-29 | Signalling of spatial audio parameters |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021525392A JP2021525392A (ja) | 2021-09-24 |
JP7142109B2 true JP7142109B2 (ja) | 2022-09-26 |
Family
ID=62872740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020566885A Active JP7142109B2 (ja) | 2018-05-31 | 2019-05-29 | 空間オーディオパラメータのシグナリング |
Country Status (6)
Country | Link |
---|---|
US (2) | US11412336B2 (ja) |
EP (1) | EP3803857A4 (ja) |
JP (1) | JP7142109B2 (ja) |
CN (1) | CN112513980A (ja) |
GB (1) | GB2574239A (ja) |
WO (1) | WO2019229298A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
GB2590651A (en) | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
CN115472170A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
GB2615323A (en) * | 2022-02-03 | 2023-08-09 | Nokia Technologies Oy | Apparatus, methods and computer programs for enabling rendering of spatial audio |
GB2615607A (en) * | 2022-02-15 | 2023-08-16 | Nokia Technologies Oy | Parametric spatial audio rendering |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007531915A (ja) | 2004-04-05 | 2007-11-08 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ステレオコーディング及びデコーディングの方法及び装置 |
JP2009531735A (ja) | 2006-03-28 | 2009-09-03 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
KR100878371B1 (ko) * | 2005-04-19 | 2009-01-15 | 돌비 스웨덴 에이비 | 공간적 오디오 파라미터들의 효율적인 부호화를 위한에너지 종속 양자화 |
KR100857106B1 (ko) | 2005-09-14 | 2008-09-08 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
WO2007080225A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
US7965848B2 (en) | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
CN101518103B (zh) | 2006-09-14 | 2016-03-23 | 皇家飞利浦电子股份有限公司 | 多通道信号的甜点操纵 |
AU2007312597B2 (en) * | 2006-10-16 | 2011-04-14 | Dolby International Ab | Apparatus and method for multi -channel parameter transformation |
UA94117C2 (ru) | 2006-10-16 | 2011-04-11 | Долби Свиден Ав | Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов |
AU2008215232B2 (en) | 2007-02-14 | 2010-02-25 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
EP2398257B1 (en) | 2008-12-18 | 2017-05-10 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US8332229B2 (en) | 2008-12-30 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte. Ltd. | Low complexity MPEG encoding for surround sound recordings |
WO2010149823A1 (en) | 2009-06-23 | 2010-12-29 | Nokia Corporation | Method and apparatus for processing audio signals |
US9042560B2 (en) * | 2009-12-23 | 2015-05-26 | Nokia Corporation | Sparse audio |
CN102859590B (zh) | 2010-02-24 | 2015-08-19 | 弗劳恩霍夫应用研究促进协会 | 产生增强下混频信号的装置、产生增强下混频信号的方法以及计算机程序 |
US8908874B2 (en) * | 2010-09-08 | 2014-12-09 | Dts, Inc. | Spatial audio encoding and reproduction |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
JP6078556B2 (ja) * | 2012-01-23 | 2017-02-08 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオ・レンダリング・システムおよびそのための方法 |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
EP2830048A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
EP3444815B1 (en) | 2013-11-27 | 2020-01-08 | DTS, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
US20170026901A1 (en) | 2015-07-21 | 2017-01-26 | Qualcomm Incorporated | Neighbor aware network data link presence indication |
FR3045915A1 (fr) * | 2015-12-16 | 2017-06-23 | Orange | Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal |
FR3048808A1 (fr) * | 2016-03-10 | 2017-09-15 | Orange | Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal |
JP6770698B2 (ja) * | 2016-03-28 | 2020-10-21 | 公立大学法人会津大学 | スピーカから再生される音の定位化方法、及びこれに用いる音像定位化装置 |
GB2554446A (en) | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Spatial audio signal format generation from a microphone array using adaptive capture |
GB2559765A (en) | 2017-02-17 | 2018-08-22 | Nokia Technologies Oy | Two stage audio focus for spatial audio processing |
CN108694955B (zh) * | 2017-04-12 | 2020-11-17 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2574239A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
-
2018
- 2018-05-31 GB GB1808930.0A patent/GB2574239A/en not_active Withdrawn
-
2019
- 2019-05-29 WO PCT/FI2019/050412 patent/WO2019229298A1/en unknown
- 2019-05-29 US US17/058,742 patent/US11412336B2/en active Active
- 2019-05-29 JP JP2020566885A patent/JP7142109B2/ja active Active
- 2019-05-29 EP EP19811863.0A patent/EP3803857A4/en active Pending
- 2019-05-29 CN CN201980050085.5A patent/CN112513980A/zh active Pending
-
2022
- 2022-05-05 US US17/737,441 patent/US11832078B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007531915A (ja) | 2004-04-05 | 2007-11-08 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ステレオコーディング及びデコーディングの方法及び装置 |
JP2009531735A (ja) | 2006-03-28 | 2009-09-03 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2019229298A1 (en) | 2019-12-05 |
US11832078B2 (en) | 2023-11-28 |
GB2574239A (en) | 2019-12-04 |
US20210219084A1 (en) | 2021-07-15 |
US20220272475A1 (en) | 2022-08-25 |
US11412336B2 (en) | 2022-08-09 |
CN112513980A (zh) | 2021-03-16 |
JP2021525392A (ja) | 2021-09-24 |
EP3803857A1 (en) | 2021-04-14 |
GB201808930D0 (en) | 2018-07-18 |
EP3803857A4 (en) | 2022-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240007814A1 (en) | Determination Of Targeted Spatial Audio Parameters And Associated Spatial Audio Playback | |
JP7142109B2 (ja) | 空間オーディオパラメータのシグナリング | |
US11832080B2 (en) | Spatial audio parameters and associated spatial audio playback | |
US9794721B2 (en) | System and method for capturing, encoding, distributing, and decoding immersive audio | |
US11350213B2 (en) | Spatial audio capture | |
US20220369061A1 (en) | Spatial Audio Representation and Rendering | |
TWI745795B (zh) | 使用低階、中階及高階分量產生器用於編碼、解碼、場景處理及基於空間音訊編碼與DirAC有關的其他程序的裝置、方法及電腦程式 | |
GB2576769A (en) | Spatial parameter signalling | |
US20210250717A1 (en) | Spatial audio Capture, Transmission and Reproduction | |
US20220174443A1 (en) | Sound Field Related Rendering | |
JP7223872B2 (ja) | 空間音声パラメータの重要度の決定および関連符号化 | |
WO2022258876A1 (en) | Parametric spatial audio rendering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220912 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7142109 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |