JP7223872B2 - 空間音声パラメータの重要度の決定および関連符号化 - Google Patents
空間音声パラメータの重要度の決定および関連符号化 Download PDFInfo
- Publication number
- JP7223872B2 JP7223872B2 JP2021557812A JP2021557812A JP7223872B2 JP 7223872 B2 JP7223872 B2 JP 7223872B2 JP 2021557812 A JP2021557812 A JP 2021557812A JP 2021557812 A JP2021557812 A JP 2021557812A JP 7223872 B2 JP7223872 B2 JP 7223872B2
- Authority
- JP
- Japan
- Prior art keywords
- sub
- coherence
- ambient
- bands
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 59
- 230000001427 coherent effect Effects 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 18
- 238000013139 quantization Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- 230000008447 perception Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 239000004065 semiconductor Substances 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000009792 diffusion process Methods 0.000 description 5
- 238000004091 panning Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012732 spatial analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008867 communication pathway Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
si(b,n),
ここで、bは周波数ビン指数であり、nは時間周波数ブロック(フレーム)指数であり、iはチャンネル指数である。別の式では、nは、元の時間領域信号のものよりも低いサンプリング速度を有する時間指数として考慮することができる。これらの周波数ビンは、ビンのうちの1つまたは複数を帯域指数k=0,…,K-1のサブ帯域にグループ化するサブ帯域にグループ化され得る。各サブ帯域kは最も低いビンbk,lowおよび最も高いビンbk,highを有し、サブ帯域はbk,low~bk,highの全てのビンを包含する。サブ帯域の幅は任意の好適な分布を近似することができる。例えば、等価矩形帯域幅(Equivalent rectangular bandwidth、ERB)尺度またはバーク尺度である。
ic=arg(min(|θ-αi|))
ここで、αiはラウドスピーカiの角度である。
Ei=cii
を決定し、ilおよびirラウドスピーカならびにil、irおよびicラウドスピーカのエネルギーの間の比を
μ=c’lrξlr/lrc
を生成し得る。
c’clr=min(c’cl,c’cr)。
κ=c’clrξclr
として決定し得る。
k=0~K-1について、a(k,n)=1-r(k,n)
k=0~K-1について、ρ(k,n)=a(k,n)γ(k,n)
ξ(n)=max(ξ1(n),ξ2(n))
e(n)=1、ξ(n)>τ(n)である場合
e(n)=0、ξ(n)≦τ(n)である場合
ここで、e(n)=1は、TFブロック(またはサブフレーム)nのためのコヒーレンス値を符号化すること(および伝送すること)を表し、e(n)=0は、サブフレームnのためのコヒーレンス値を符号化しないことを表す。
102 マルチチャンネル信号
103 移送信号生成器
104 移送信号
105 分析プロセッサ
106 メタデータ
107 符号器
108 方向パラメータ
109 音声符号器コア
110 エネルギー比パラメータ
111 メタデータ符号器/量子化器
112 コヒーレンスパラメータ
121 分析部分
131 合成部分
133 復号器/デマルチプレクサ
135 移送抽出器
137 メタデータ抽出器
139 合成プロセッサ
201 時間周波数領域変換器
202 時間周波数信号
203 空間分析器
205 方向符号器
207 エネルギー比符号器
209 コヒーレンス符号器
211 コンバイナ
401 コヒーレンス値重要度決定器
403 コヒーレンス値符号化決定器
405 コヒーレンスパラメータ符号器
1400 デバイス
1405 ユーザインターフェース
1407 プロセッサ
1409 入力/出力ポート
1411 メモリ
Claims (17)
- 空間音声符号化のための装置であって、
1つまたは複数の音声信号のために、空間音声再生を提供するためのサブ帯域ベースの空間音声パラメータを受信または決定するための手段であって、前記空間音声パラメータがフレームの複数のサブ帯域のサブ帯域ごとの周囲コヒーレンス値を含む、手段と、
前記複数のサブ帯域のそれぞれごとの方向対エネルギー比値を受信するための手段と、
前記複数のサブ帯域の各々のためのコヒーレントな無指向性エネルギーの割合を決定するための手段であって、サブ帯域のためのコヒーレントな無指向性エネルギーの前記割合が、前記サブ帯域のための無指向性エネルギー比に前記サブ帯域のための前記周囲コヒーレンス値を乗算したものとして決定され、前記無指向性エネルギー比が、1から前記サブ帯域のための前記指向性対総計エネルギー比を引いたものとして決定される、手段、及び全ての前記複数のサブ帯域のために、コヒーレントな無指向性エネルギーの前記決定された割合を合計するための手段を備える、決定するための手段によって、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための重要度尺度を決定するための手段と、
前記重要度尺度を用いて、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するべきかどうかを決定するための手段と、
を備える、装置。 - 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を決定するための前記手段が、
サブ帯域ごとに、コヒーレントな無指向性エネルギーの前記割合に前記無指向性エネルギー比を乗算するための手段、
全ての前記複数のサブ帯域のために、サブ帯域ごとの、コヒーレントな無指向性エネルギーの前記割合と前記無指向性エネルギー比との積を合計するための手段、および
サブ帯域ごとの、コヒーレントな無指向性エネルギーの前記割合と前記無指向性エネルギー比との前記合計された積を、サブ帯域ごとの前記無指向性エネルギー比の合計によって正規化するための手段、
をさらに備える、請求項1に記載の装置。 - 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度が前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための第1の重要度尺度である、請求項1に記載の装置。
- 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度が前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための第2の重要度尺度である、請求項2に記載の装置。
- 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を決定するための前記手段が、
前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を前記第1の重要度尺度および前記第2の重要度尺度のうちの最大値として決定するための手段を備える、請求項3または4に記載の装置。 - 前記重要度尺度を用いて、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するべきかどうかを決定するための前記手段が、
前記重要度尺度を閾値と比較するための手段、および
前記重要度尺度が前記閾値を超えたときに、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するための手段、
を備える、請求項1~2および5のいずれか1項に記載の装置。 - 前記周囲コヒーレンス値が前記2つ以上のチャンネル音声信号の間のチャンネル間コヒーレンスに基づいて決定される、請求項1~6のいずれか1項に記載の装置。
- 前記複数のサブ帯域の各々のための前記周囲コヒーレンス値が、前記装置が、
前記2つ以上のチャンネル音声信号に関連付けられた共分散行列を計算すること、
前記共分散行列に基づいて決定された最も大きいエネルギーを有するチャンネル音声信号、および他のチャンネル音声信号のサブセットを監視することであって、前記サブセットが、1つ~次に大きいエネルギーを有するチャンネル音声信号の総数より1つ少ないものの間で決定された数である、監視すること、ならびに
前記最も大きいエネルギーを有する前記チャンネル音声信号と、前記次に大きいエネルギーのチャンネル音声信号の各々との間で決定された正規化コヒーレンスのうちの最小値を選択することに基づいて前記周囲共分散パラメータを生成すること、
を行うための手段を備えることによって決定される、請求項7に記載の装置。 - 空間音声符号化のための方法であって、
1つまたは複数の音声信号のために、空間音声再生を提供するためのサブ帯域ベースの空間音声パラメータを受信または決定することであって、前記空間音声パラメータがフレームの複数のサブ帯域のサブ帯域ごとの周囲コヒーレンス値を含む、受信または決定することと、
前記複数のサブ帯域のそれぞれごとの方向対エネルギー比値を受信することと、
前記複数のサブ帯域の各々のためのコヒーレントな無指向性エネルギーの割合を決定することであって、サブ帯域のためのコヒーレントな無指向性エネルギーの前記割合が、前記サブ帯域のための無指向性エネルギー比に前記サブ帯域のための前記周囲コヒーレンス値を乗算したものとして決定され、前記無指向性エネルギー比が、1から前記サブ帯域のための前記指向性対総計エネルギー比を引いたものとして決定される、決定すること、及び全ての前記複数のサブ帯域のために、コヒーレントな無指向性エネルギーの前記決定された割合を合計することを含む、決定することによって、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための重要度尺度を決定することと、
前記重要度尺度を用いて、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するべきかどうかを決定することと、
を含む、方法。 - 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を決定することが、
サブ帯域ごとに、コヒーレントな無指向性エネルギーの前記割合に前記無指向性エネルギー比を乗算すること、
全ての前記複数のサブ帯域のために、サブ帯域ごとの、コヒーレントな無指向性エネルギーの前記割合と前記無指向性エネルギー比との積を合計すること、および
サブ帯域ごとの、コヒーレントな無指向性エネルギーの前記割合と前記無指向性エネルギー比との前記合計された積を、サブ帯域ごとの前記無指向性エネルギー比の合計によって正規化すること、
をさらに含む、請求項9に記載の方法。 - 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度が前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための第1の重要度尺度である、請求項9に記載の方法。
- 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度が前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための第2の重要度尺度である、請求項10に記載の方法。
- 前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を決定することが、
前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための前記重要度尺度を前記第1の重要度尺度および前記第2の重要度尺度のうちの最大値として決定することを含む、請求項11または12に記載の方法。 - 前記重要度尺度を用いて、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するべきかどうかを決定することが、
前記重要度尺度を閾値と比較すること、および
前記重要度尺度が前記閾値を超えたときに、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化すること、
を含む、請求項9~10および13のいずれか1項に記載の方法。 - 前記周囲コヒーレンス値が前記2つ以上のチャンネル音声信号の間のチャンネル間コヒーレンスに基づいて決定される、請求項9~14のいずれか1項に記載の方法。
- 前記複数のサブ帯域の各々のための前記周囲コヒーレンス値が、前記装置が、
前記2つ以上のチャンネル音声信号に関連付けられた共分散行列を計算すること、
前記共分散行列に基づいて決定された最も大きいエネルギーを有するチャンネル音声信号、および他のチャンネル音声信号のサブセットを監視することであって、前記サブセットが、1つ~次に大きいエネルギーを有するチャンネル音声信号の総数より1つ少ないものの間で決定された数である、監視すること、ならびに
前記最も大きいエネルギーを有する前記チャンネル音声信号と、前記次に大きいエネルギーのチャンネル音声信号の各々との間で決定された正規化コヒーレンスのうちの最小値を選択することに基づいて前記周囲共分散パラメータを生成すること、
を含むことによって決定される、請求項15に記載の方法。 - コンピュータプログラムコードを記憶した非一時的なコンピュータ読取可能記録媒体であって、前記コンピュータプログラムコードは少なくとも1つのプロセッサ上で実行されたときに、装置に、
1つまたは複数の音声信号のために、空間音声再生を提供するためのサブ帯域ベースの空間音声パラメータを受信または決定させ、前記空間音声パラメータがフレームの複数のサブ帯域のサブ帯域ごとの周囲コヒーレンス値を含み、
前記複数のサブ帯域のそれぞれごとの方向対エネルギー比値を受信させ、
前記装置に、前記複数のサブ帯域の各々のためのコヒーレントな無指向性エネルギーの割合を決定させ、サブ帯域のためのコヒーレントな無指向性エネルギーの前記割合が、前記サブ帯域のための無指向性エネルギー比に前記サブ帯域のための前記周囲コヒーレンス値を乗算したものとして決定され、前記無指向性エネルギー比が、1から前記サブ帯域のための前記指向性対総計エネルギー比を引いたものとして決定されるものであり、及び全ての前記複数のサブ帯域のために、コヒーレントな無指向性エネルギーの前記決定された割合を合計させることによって、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値のための重要度尺度を決定させ、
前記重要度尺度を用いて、前記フレームの前記複数のサブ帯域の前記周囲コヒーレンス値を符号化するべきかどうかを決定させる、
ことを特徴とする、コンピュータ読取可能記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1904303.3A GB2582749A (en) | 2019-03-28 | 2019-03-28 | Determination of the significance of spatial audio parameters and associated encoding |
GB1904303.3 | 2019-03-28 | ||
PCT/FI2020/050194 WO2020193865A1 (en) | 2019-03-28 | 2020-03-26 | Determination of the significance of spatial audio parameters and associated encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022528660A JP2022528660A (ja) | 2022-06-15 |
JP7223872B2 true JP7223872B2 (ja) | 2023-02-16 |
Family
ID=66443108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021557812A Active JP7223872B2 (ja) | 2019-03-28 | 2020-03-26 | 空間音声パラメータの重要度の決定および関連符号化 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220189494A1 (ja) |
EP (1) | EP3948861A4 (ja) |
JP (1) | JP7223872B2 (ja) |
KR (1) | KR102664650B1 (ja) |
CN (1) | CN113678199A (ja) |
GB (1) | GB2582749A (ja) |
MX (1) | MX2021011856A (ja) |
WO (1) | WO2020193865A1 (ja) |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735254B2 (en) * | 2001-06-29 | 2004-05-11 | Qualcomm, Inc. | DCT compression using Golomb-Rice coding |
DE602004007945T2 (de) * | 2003-09-29 | 2008-05-15 | Koninklijke Philips Electronics N.V. | Codierung von audiosignalen |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
CN1993733B (zh) * | 2005-04-19 | 2010-12-08 | 杜比国际公司 | 空间音频参数量化器、去量化器及参数量化、去量化方法 |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
CN101499279B (zh) * | 2009-03-06 | 2011-11-02 | 武汉大学 | 空间参数逐级精细的比特分配方法及其装置 |
EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
CN102844808B (zh) * | 2010-11-03 | 2016-01-13 | 华为技术有限公司 | 用于编码多通道音频信号的参数编码器 |
CN103548077B (zh) * | 2011-05-19 | 2016-02-10 | 杜比实验室特许公司 | 参数化音频编译码方案的取证检测 |
CN102208188B (zh) * | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
WO2013149671A1 (en) * | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
ES2560402T3 (es) * | 2012-04-05 | 2016-02-18 | Huawei Technologies Co., Ltd | Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico |
EP2690621A1 (en) * | 2012-07-26 | 2014-01-29 | Thomson Licensing | Method and Apparatus for downmixing MPEG SAOC-like encoded audio signals at receiver side in a manner different from the manner of downmixing at encoder side |
US9830920B2 (en) * | 2012-08-19 | 2017-11-28 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9406307B2 (en) * | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
CN104885151B (zh) * | 2012-12-21 | 2017-12-22 | 杜比实验室特许公司 | 用于基于感知准则呈现基于对象的音频内容的对象群集 |
US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
TWI618051B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2866227A1 (en) * | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
US20170208415A1 (en) * | 2014-07-23 | 2017-07-20 | Pcms Holdings, Inc. | System and method for determining audio context in augmented-reality applications |
CN107452387B (zh) | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | 一种声道间相位差参数的提取方法及装置 |
GB201718341D0 (en) * | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2574238A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Spatial audio parameter merging |
CN112997248A (zh) * | 2018-10-31 | 2021-06-18 | 诺基亚技术有限公司 | 确定空间音频参数的编码和相关联解码 |
WO2020102156A1 (en) * | 2018-11-13 | 2020-05-22 | Dolby Laboratories Licensing Corporation | Representing spatial audio by means of an audio signal and associated metadata |
GB2590651A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
-
2019
- 2019-03-28 GB GB1904303.3A patent/GB2582749A/en not_active Withdrawn
-
2020
- 2020-03-26 CN CN202080024931.9A patent/CN113678199A/zh active Pending
- 2020-03-26 WO PCT/FI2020/050194 patent/WO2020193865A1/en unknown
- 2020-03-26 JP JP2021557812A patent/JP7223872B2/ja active Active
- 2020-03-26 EP EP20778687.2A patent/EP3948861A4/en active Pending
- 2020-03-26 US US17/441,829 patent/US20220189494A1/en active Pending
- 2020-03-26 MX MX2021011856A patent/MX2021011856A/es unknown
- 2020-03-26 KR KR1020217034950A patent/KR102664650B1/ko active IP Right Grant
Non-Patent Citations (1)
Title |
---|
Nokia Corporation,Proposal for MASA format,3GPP TDocs (written contributions) at meeting: S4-102,S4-190121,2019年02月,1-10,https://www.3gpp.org/ftp/TSG_SA/WG4_CODEC/TSGS4_102_Bruges/Docs/S4-190121.zip |
Also Published As
Publication number | Publication date |
---|---|
US20220189494A1 (en) | 2022-06-16 |
WO2020193865A1 (en) | 2020-10-01 |
EP3948861A1 (en) | 2022-02-09 |
CN113678199A (zh) | 2021-11-19 |
GB201904303D0 (en) | 2019-05-15 |
GB2582749A (en) | 2020-10-07 |
KR102664650B1 (ko) | 2024-05-10 |
EP3948861A4 (en) | 2022-11-09 |
MX2021011856A (es) | 2021-10-22 |
KR20210146980A (ko) | 2021-12-06 |
JP2022528660A (ja) | 2022-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210377685A1 (en) | Determination of Targeted Spatial Audio Parameters and Associated Spatial Audio Playback | |
JP7142109B2 (ja) | 空間オーディオパラメータのシグナリング | |
US20230197086A1 (en) | The merging of spatial audio parameters | |
US20230402053A1 (en) | Combining of spatial audio parameters | |
EP3874492B1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
US20210250717A1 (en) | Spatial audio Capture, Transmission and Reproduction | |
GB2576769A (en) | Spatial parameter signalling | |
EP3818730A1 (en) | Energy-ratio signalling and synthesis | |
KR20200140874A (ko) | 공간 오디오 파라미터의 양자화 | |
US20230335141A1 (en) | Spatial audio parameter encoding and associated decoding | |
JP7223872B2 (ja) | 空間音声パラメータの重要度の決定および関連符号化 | |
WO2022223133A1 (en) | Spatial audio parameter encoding and associated decoding | |
US20240185869A1 (en) | Combining spatial audio streams | |
US20230410823A1 (en) | Spatial audio parameter encoding and associated decoding | |
US20240046939A1 (en) | Quantizing spatial audio parameters | |
US20230335143A1 (en) | Quantizing spatial audio parameters | |
US20230178085A1 (en) | The reduction of spatial audio parameters | |
US20240079014A1 (en) | Transforming spatial audio parameters | |
JP2024512953A (ja) | 空間音声ストリームの結合 | |
WO2024115051A1 (en) | Parametric spatial audio encoding | |
CN116547749A (zh) | 音频参数的量化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211027 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7223872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |