JP6250071B2 - パラメトリック・マルチチャネル・エンコードのための方法 - Google Patents
パラメトリック・マルチチャネル・エンコードのための方法 Download PDFInfo
- Publication number
- JP6250071B2 JP6250071B2 JP2015558469A JP2015558469A JP6250071B2 JP 6250071 B2 JP6250071 B2 JP 6250071B2 JP 2015558469 A JP2015558469 A JP 2015558469A JP 2015558469 A JP2015558469 A JP 2015558469A JP 6250071 B2 JP6250071 B2 JP 6250071B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- spatial
- parameters
- input signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 84
- 238000001228 spectrum Methods 0.000 claims description 224
- 238000012545 processing Methods 0.000 claims description 196
- 238000005070 sampling Methods 0.000 claims description 112
- 230000001052 transient effect Effects 0.000 claims description 87
- 230000002123 temporal effect Effects 0.000 claims description 57
- 230000007704 transition Effects 0.000 claims description 41
- 238000013139 quantization Methods 0.000 claims description 31
- 230000001419 dependent effect Effects 0.000 claims description 30
- 230000002238 attenuated effect Effects 0.000 claims description 16
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000002156 mixing Methods 0.000 description 93
- 230000006870 function Effects 0.000 description 84
- 102100025018 Dynein regulatory complex subunit 2 Human genes 0.000 description 31
- 101000908413 Homo sapiens Dynein regulatory complex subunit 2 Proteins 0.000 description 31
- 238000006243 chemical reaction Methods 0.000 description 21
- 238000009499 grossing Methods 0.000 description 17
- 238000012805 post-processing Methods 0.000 description 17
- 230000001934 delay Effects 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 16
- 238000000354 decomposition reaction Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 102100025015 Dynein regulatory complex subunit 3 Human genes 0.000 description 8
- 101000908408 Homo sapiens Dynein regulatory complex subunit 3 Proteins 0.000 description 8
- 101000813988 Homo sapiens Epidermal growth factor receptor kinase substrate 8-like protein 1 Proteins 0.000 description 8
- 102100025032 Dynein regulatory complex protein 1 Human genes 0.000 description 6
- 101000908373 Homo sapiens Dynein regulatory complex protein 1 Proteins 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 101100465868 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) drc-2 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本願は2013年2月21日に出願された米国仮特許出願第61/767,673号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
本稿はオーディオ符号化システムに関する。詳細には、本稿は、パラメトリック・マルチチャネル・オーディオ符号化のための効率的な方法およびシステムに関する。
上記の式に示した線形結合に戻ると、さらに、利得パラメータk1、k2がビットストリームP中の共通の単一の混合パラメータに依存していてもよいことを注意しておく。さらに、これらの利得パラメータは、k1 2+k2 2=1となるよう規格化されてもよい。
・オーディオ信号561のフレーム当たりにパラメータ符号化ユニット520によって決定されるべきパラメータ集合の最大数および/または特定の数。この制御設定は、空間的パラメータの時間的分解能に影響することを許容するので、本稿では時間的分解能設定と称される。
・パラメータ符号化ユニット520によって空間的パラメータが決定されるべき周波数帯域の数。この制御設定は、空間的パラメータの周波数分解能に影響することを許容するので、周波数分解能設定と称される。
・空間的パラメータを量子化するために使われるべき量子化器の分解能。この制御設定は、本稿では量子化器設定と称される。
0.5<sp・max{|E1,1(p)|,|E2,2(p)|,|E1,2(p)|}≦1.0
となるように、かつシフトzpが最小となるように決定されてもよい。混合パラメータが決定される各周波数帯域pおよび/または各時間区間[q,v]について個々にこのことを保証することによって、有効な値範囲を保証しつつ、固定小数点算術における増大した(たとえば最大の)精度が達成されうる。
窓関数586:直前のフレームの最後のスペクトルとK/Q番目のスペクトル589との間で窓関数586は0から1に線形に上昇してもよい。K/Q番目のスペクトルと48番目のスペクトル589の間で、窓関数586は1から0に線形に降下してもよい(図5e参照)。
図7bに示されるような窓関数721:直前のフレームの最後のスペクトルとK/Q番目のスペクトルとの間で窓関数721は0から1に線形に上昇。K/Q番目のスペクトルと(N−1)番目のスペクトルの間で、窓関数721は1で一定のまま。N番目のスペクトルと2*K/Q番目のスペクトルとの間で窓関数586は0で一定のまま。N番目のスペクトルにおける過渡成分は過渡点724(これは直後のフレーム590の空間的パラメータの集合についてのサンプリング点に対応する)によって表現される。さらに、相補的窓関数722(これは、直前のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに現在フレーム585のスペクトルに適用される)および窓関数723(これは、直後のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに直後のフレーム590のスペクトルに適用される)が図7bに示されている。全体として、窓関数721は、先読みフレーム590における一つまたは複数の過渡成分の場合に、第一の過渡点724より前の先読みフレームのスペクトルは、現在フレーム585についての空間的パラメータの集合711を決定するためにフルに考慮に入れられることを保証する。他方、過渡点724より後の先読みフレーム590のスペクトルは無視される。
図7cに示されるような窓関数731:最初のスペクトルと(N−1)番目のスペクトルとの間で窓関数731は0で一定のまま。N番目のスペクトルとK/Q番目のスペクトルの間で、窓関数731は1で一定のまま。K/Q番目のスペクトルと2*K/Q番目のスペクトルとの間で窓関数731は1から0に線形に降下。図7cは、N番目のスペクトルにおける過渡点734(これは空間的パラメータの単一の集合711についてのサンプリング点に対応する)を示している。さらに、図7cは、直前のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに現在フレーム585のスペクトルに適用される窓関数732と、直後のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに直後のフレーム590のスペクトルに適用される窓関数733とを示している。
図7dの窓関数741:最初のスペクトルと(N−1)番目のスペクトルとの間で窓関数741は0で一定のまま。N番目のスペクトルと(M−1)番目のスペクトルの間で、窓関数741は1で一定のまま。M番目のスペクトルと48番目のスペクトルとの間で窓関数は0で一定のまま。図7dは、N番目のスペクトルにおける過渡点744(すなわち、空間的パラメータの前記集合のサンプリング点)およびM番目のスペクトルにおける過渡点745を示している。さらに、図7dは、直前のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに現在フレーム585のスペクトルに適用される窓関数742と、直後のフレームについての空間的パラメータの前記一つまたは複数の集合を決定するときに直後のフレーム590のスペクトルに適用される窓関数743とを示している。
窓関数:
i)空間的パラメータの第一の集合:直前のフレームの最後のスペクトルとK/2Q番目のスペクトルとの間で窓関数は0から1に線形に上昇。K/2Q番目のスペクトルとK/Q番目のスペクトルの間で、窓は1から0に線形に降下。K/Q番目のスペクトルと2*K/Q番目のスペクトルの間で、窓は0で一定のまま。
窓関数:
i)空間的パラメータの第一の集合:直前のフレームの最後のスペクトルとK/2Q番目のスペクトルとの間で窓は0から1に線形に上昇。K/2Q番目のスペクトルとK/Q番目のスペクトルの間で、窓は1から0に線形に降下。K/Q番目のスペクトルと2*K/Q番目のスペクトルの間で、窓は0で一定のまま。
窓関数:
i)空間的パラメータの第一の集合:最初のスペクトルと(N−1)番目のスペクトルとの間で窓は0で一定のまま。N番目のスペクトルと(M−1)番目のスペクトルの間で窓は1で一定のまま。M番目のスペクトルと2*K/Q番目のスペクトルの間で、窓は0で一定のまま。
窓関数:
i)空間的パラメータの第一の集合:最初のスペクトルと(N−1)番目のスペクトルとの間で窓は0で一定のまま。N番目のスペクトルと(M−1)番目のスペクトルの間で窓は1で一定のまま。M番目のスペクトルと2*K/Q番目のスペクトルの間で、窓は0で一定のまま。
・窓関数は、空間的パラメータの直前の集合のサンプリング点から空間的パラメータの現在の集合のサンプリング点までの諸スペクトルのなめらかなフェーズインを提供する;
・空間的パラメータの後続の集合が過渡成分に関連付けられていない場合、窓関数は、空間的パラメータの現在の集合のサンプリング点から空間的パラメータの後続の集合のサンプリング点まで諸スペクトルのなめらかなフェーズアウトを提供する;
・空間的パラメータの後続の集合が過渡成分に関連付けられている場合、窓関数は、空間的パラメータの現在の集合のサンプリング点から空間的パラメータの後続の集合のサンプリング点の前のスペクトルまでの諸スペクトルをフルに考慮し、空間的パラメータの後続の集合のサンプリング点から始まる諸スペクトルを打ち消す。
・窓関数は、空間的パラメータの現在の集合のサンプリング点に先行する諸スペクトルを打ち消す;
・空間的パラメータの後続の集合のサンプリング点が過渡成分に関連付けられている場合、窓関数は、空間的パラメータの現在の集合のサンプリング点から空間的パラメータの後続の集合のサンプリング点の前のスペクトルまでの諸スペクトルをフルに考慮し、空間的パラメータの後続の集合のサンプリング点から始まる諸スペクトルを打ち消す;
・空間的パラメータの後続の集合が過渡成分に関連付けられていない場合、窓関数は、空間的パラメータの現在の集合のサンプリング点から現在フレームの終わりのスペクトルまでの諸スペクトルをフルに考慮し、先読みフレームの先頭から空間的パラメータの前記後続の集合のサンプリング点までの諸スペクトルのなめらかなフェーズアウトを提供する。
・DRC処理経路:遅延807=3072、すなわち2フレーム;
・クリップ利得処理経路:遅延808、809、802の和=3360。これはダウンミックス信号のデコーダの遅延811にダウンミックス処理経路の遅延を加えたものに対応する;
・空間的メタデータ処理経路:遅延802、803、804、805、809の和=4000。これは、ダウンミックス信号のデコーダの遅延811および時間領域から周波数領域への変換段301、302によって引き起こされる遅延812にダウンミックス処理経路の遅延を加えたものに対応する。
いくつかの態様を記載しておく。
〔態様1〕
ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって:
・マルチチャネル入力信号から前記ダウンミックス信号を生成するよう構成されたダウンミックス処理ユニット(510)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号から前記空間的メタデータを決定するよう構成されたパラメータ処理ユニット(520)と;
・一つまたは複数の外部設定に基づいて前記パラメータ処理ユニットのための一つまたは複数の制御設定を決定するよう構成された構成設定ユニット(540)であって、前記一つまたは複数の外部設定は、前記ビットストリームのための目標データ・レートを含み、前記一つまたは複数の制御設定は、前記空間的メタデータのための最大データ・レートを含む、構成設定ユニットとを有する、
オーディオ・エンコード・システム。
〔態様2〕
・前記パラメータ処理ユニットは、空間的メタデータ・フレームと称される、前記マルチチャネル入力信号のフレームについての空間的メタデータを決定するよう構成されており;
・前記マルチチャネル入力信号のフレームは、前記マルチチャネル入力信号の、あらかじめ決定された数のサンプルを含み;
・前記空間的メタデータのための前記最大データ・レートは、空間的メタデータ・フレームのためのメタデータ・ビットの最大数を示す、
態様1記載のオーディオ・エンコード・システム。
〔態様3〕
前記パラメータ処理ユニットは、前記一つまたは複数の制御設定に基づいて決定された空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過するかどうかを判定するよう構成されている、態様2記載のオーディオ・エンコード・システム。
〔態様4〕
・空間的メタデータ・フレームが空間的パラメータの一つまたは複数の集合を含み;
・前記一つまたは複数の制御設定が、前記パラメータ処理ユニットによって決定されるべき空間的メタデータ・フレーム当たりの空間的パラメータの集合の数を示す時間的分解能設定を含み;
・前記パラメータ処理ユニットが、現在の空間的メタデータ・フレームが空間的パラメータの複数の集合(711、712)を有している場合かつ現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過している場合には、現在の空間的メタデータ・フレームからの空間的パラメータの集合(711)を破棄するよう構成されている、
態様3記載のオーディオ・エンコード・システム。
〔態様5〕
・空間的パラメータの前記一つまたは複数の集合は、対応する一つまたは複数のサンプリング点に関連付けられており;
・前記一つまたは複数のサンプリング点は、対応する一つまたは複数の時点を示し;
・前記パラメータ処理ユニットは、現在のメタデータ・フレームの前記複数のサンプリング点(583、584)が前記マルチチャネル入力信号の過渡成分に関連付けられていない場合、現在の空間的メタデータ・フレームから空間的パラメータの第一の集合(711)を破棄するよう構成されており、空間的パラメータの前記第一の集合は、第二のサンプリング点(584)より前の第一のサンプリング点(583)に関連付けられており;
・前記パラメータ処理ユニットは、現在のメタデータ・フレームの前記複数のサンプリング点が前記マルチチャネル入力信号の過渡成分に関連付けられている場合には、現在の空間的メタデータ・フレームから空間的パラメータの第二の集合(712)を破棄するよう構成されている、
態様4記載のオーディオ・エンコード・システム。
〔態様6〕
・前記一つまたは複数の制御設定は、複数のあらかじめ決定された型の量子化器からの第一の型の量子化器を示す量子化器設定を含み;
・前記パラメータ処理ユニットは、前記第一の型の量子化器に従って、空間的パラメータの前記一つまたは複数の集合を量子化するよう構成されており;
・前記複数のあらかじめ決定された型の量子化器は、それぞれ異なる量子化器分解能を提供し;
・前記パラメータ処理ユニットは、現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、前記第一の型の量子化器より低い分解能をもつ第二の型の量子化器に従って空間的パラメータの前記一つまたは複数の集合の空間的パラメータの一つ、いくつかまたは全部を再量子化するよう構成されている、
態様4または5記載のオーディオ・エンコード・システム。
〔態様7〕
前記複数のあらかじめ決定された型の量子化器が細かい量子化および粗い量子化を含む、態様6記載のオーディオ・エンコード・システム。
〔態様8〕
前記パラメータ処理ユニットは:
・空間的パラメータの現在の集合(712)の、空間的パラメータの直前の集合(711)に対する差に基づいて時間的差分パラメータの集合を決定し;
・エントロピー符号化を使って時間的差分パラメータの前記集合をエンコードし;
・時間的差分パラメータのエンコードされた集合を、現在の空間的メタデータ・フレーム中に挿入し;
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、時間的差分パラメータの前記集合のエントロピーを低減する
よう構成されている、態様4ないし7のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様9〕
前記パラメータ処理ユニットは、時間的差分パラメータの前記集合のエントロピーを低減するために、時間的差分パラメータの前記集合の時間的差分パラメータのうちの一つ、いくつかまたは全部を、時間的差分パラメータの可能な値の増大した確率をもつ値に等しく設定するよう構成されている、態様8記載のオーディオ・エンコード・システム。
〔態様10〕
・前記一つまたは複数の制御設定は、周波数分解能設定を含み;
・前記周波数分解能設定は、異なる周波数帯域の数を示し;
・前記パラメータ処理ユニットは、異なる周波数帯域について、帯域パラメータと称される異なる空間的パラメータを決定するよう構成されており;
・空間的パラメータの集合は、前記異なる周波数帯域についての対応する帯域パラメータを含む、
態様4ないし9のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様11〕
前記パラメータ処理ユニットは、
・第一の周波数帯域における一つまたは複数の帯域パラメータの、第二の、隣接する周波数帯域における対応する一つまたは複数の帯域パラメータに対する差に基づいて、周波数差分パラメータの集合を決定し;
・エントロピー符号化を使って、周波数差分パラメータの前記集合をエンコードし;
・周波数差分パラメータのエンコードされた集合を、現在の空間的メタデータ・フレーム中に挿入し;
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合に、周波数差分パラメータの前記集合のエントロピーを低減する
よう構成されている、態様10記載のオーディオ・エンコード・システム。
〔態様12〕
前記パラメータ処理ユニットは、周波数差分パラメータの前記集合のエントロピーを低減するために、周波数差分パラメータの前記集合の周波数差分パラメータのうちの一つ、いくつかまたは全部を、周波数差分パラメータの可能な値の増大した確率をもつ値に等しく設定するよう構成されている、態様11記載のオーディオ・エンコード・システム。
〔態様13〕
前記パラメータ処理ユニットが、
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、周波数帯域の数を低減し;
・低減した数の周波数帯域を使って、現在の空間的メタデータ・フレームについての空間的パラメータの前記一つまたは複数の集合を再決定する
よう構成されている、態様10ないし12のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様14〕
・前記一つまたは複数の外部設定は:前記マルチチャネル入力信号のサンプリング・レート、前記ダウンミックス信号のチャネルの数m、前記マルチチャネル入力信号のチャネルの数nおよび対応するデコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期のうちの一つまたは複数をさらに含み;
・前記一つまたは複数の制御設定は:決定されるべき空間的メタデータのフレーム当たりの空間的パラメータの集合の数を示す時間的分解能設定、空間的パラメータが決定されるべき周波数帯域の数を示す周波数分解能設定、空間的メタデータを量子化するために使われるべき量子化器の型を示す量子化器設定および前記マルチチャネル入力信号の現在フレームが独立フレームとしてエンコードされるべきかどうかの指示のうちの一つまたは複数をさらに含む、
態様1ないし13のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様15〕
・前記一つまたは複数の外部設定は、対応するデコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期をさらに含み;
・前記一つまたは複数の制御設定は、現在の空間的メタデータ・フレームが独立フレームとしてエンコードされるべきであるかどうかの指標をさらに含み;
・前記パラメータ処理ユニットは、前記マルチチャネル入力信号のフレームの対応するシーケンスについて、空間的メタデータ・フレームのシーケンスを決定するよう構成されており;
・前記構成設定ユニットは、空間的メタデータ・フレームの前記シーケンスから、独立フレームとしてエンコードされるべき前記一つまたは複数の空間的メタデータ・フレームを、前記更新周期に基づいて、決定するよう構成されている、
態様2ないし14のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様16〕
前記構成設定ユニットは、
・前記マルチチャネル入力信号のフレームの前記シーケンスの現在フレームが、前記更新周期の整数倍である時点におけるサンプルを含むかどうかを判定し;
・現在フレームに対応する現在の空間的メタデータ・フレームが独立フレームであることを判別する
よう構成されている、態様15記載のオーディオ・エンコード・システム。
〔態様17〕
前記パラメータ処理ユニットは、現在の空間的メタデータ・フレームが独立フレームとしてエンコードされるべきである場合、現在の空間的メタデータ・フレームの空間的パラメータの一つまたは複数の集合を、以前の空間的メタデータ・フレームに含まれるデータとは独立にエンコードするよう構成されている、態様15記載のオーディオ・エンコード・システム。
〔態様18〕
・n=6かつm=2である;および/または
・前記マルチチャネル・アップミックス信号は5.1信号である;および/または
・前記ダウンミックス信号はステレオ信号である;および/または
・前記マルチチャネル入力信号は5.1信号である、
態様1ないし17のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様19〕
・前記ダウンミックス処理ユニットが、前記ダウンミックス信号を、ドルビー・デジタル・プラス・エンコーダを使ってエンコードするよう構成されており;
・前記ビットストリームは、ドルビー・デジタル・プラス・ビットストリームに対応し;
・前記空間的メタデータは、前記ドルビー・デジタル・プラス・ビットストリームのデータ・フィールド内に含まれる、
態様1ないし18のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様20〕
・前記空間的メタデータが空間的パラメータの一つまたは複数の集合を含み;
・空間的パラメータの前記集合のある空間的パラメータが、前記マルチチャネル入力信号の異なるチャネルの間の相互相関を示す、
態様1ないし19のうちいずれか一項記載のオーディオ・エンコード・システム。
〔態様21〕
ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定するよう構成されているパラメータ処理ユニット(520)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの一つまたは複数の集合を含み、当該パラメータ処理ユニットは、
・マルチチャネル入力信号のあるチャネルの現在フレームおよび直後のフレームから複数のスペクトルを決定するよう構成された変換ユニット(521)と;
・窓関数を使って前記複数のスペクトルに重み付けすることによって、前記マルチチャネル入力信号の前記チャネルの現在フレームについての前記空間的メタデータ・フレームを決定するよう構成されたパラメータ決定ユニット(523)を有し;
前記窓関数は:前記空間的メタデータ・フレーム内に含まれる空間的パラメータの集合の数、前記マルチチャネル入力信号の現在フレーム内または直後のフレーム内の一つまたは複数の過渡成分の存在および/または前記過渡成分の時点の一つまたは複数に依存する、
パラメータ処理ユニット。
〔態様22〕
・前記窓関数は、集合依存の窓関数を含み;
・前記パラメータ決定ユニットは、前記集合依存の窓関数を使って前記複数のスペクトルに重み付けすることによって、前記マルチチャネル入力信号の前記チャネルの現在フレームについての空間的パラメータの集合を決定するよう構成されており;
・前記集合依存の窓関数は、空間的パラメータの前記集合が過渡成分に関連付けられているか否かに依存する、
態様21記載のパラメータ処理ユニット。
〔態様23〕
空間的パラメータの前記集合(711)が過渡成分に関連付けられていない場合、
・前記集合依存の窓関数は、空間的パラメータの先行する集合(710)のサンプリング点から空間的パラメータの前記集合(711)のサンプリング点までの前記複数のスペクトルのフェーズインを提供する;および/または
・空間的パラメータの後続集合(712)が過渡成分に関連付けられていれば、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から空間的パラメータの前記後続集合(712)のサンプリング点の前の前記複数のスペクトルのうちのスペクトルまで、前記複数のスペクトルを含め、空間的パラメータの前記後続集合(712)のサンプリング点から始まり前記複数のスペクトルを打ち消す、
態様22記載のパラメータ処理ユニット。
〔態様24〕
空間的パラメータの前記集合(711)が過渡成分に関連付けられている場合、
・前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点の前の前記複数のスペクトルからのスペクトルを打ち消す;および/または
・空間的パラメータの後続集合(712)のサンプリング点が過渡成分に関連付けられていれば、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から空間的パラメータの前記後続集合(712)のサンプリング点の前の前記複数のスペクトルのうちの前記スペクトルまで、前記複数のスペクトルからのスペクトルを含め、空間的パラメータの前記後続集合(712)のサンプリング点から始まり前記複数のスペクトルからのスペクトルを打ち消す;および/または
・空間的パラメータの前記後続集合(712)が過渡成分に関連付けられていなければ、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から現在フレーム(585)の終わりにある前記複数のスペクトルのうちのスペクトルまで前記複数のスペクトルのスペクトルを含め、直後のフレーム(590)の先頭から空間的パラメータの前記後続集合(712)のサンプリング点まで前記複数のスペクトルのスペクトルのフェーズアウトを提供する、
態様22記載のパラメータ処理ユニット。
〔態様25〕
ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは空間的パラメータの集合を含み、当該パラメータ処理ユニットは:
・マルチチャネル入力信号の第一のチャネルのフレームから第一の複数の変換係数を決定し、前記マルチチャネル入力信号の第二のチャネルの対応するフレームから第二の複数の変換係数を決定するよう構成された変換ユニット(561)であって、前記第一および第二の複数の変換係数は、それぞれ前記第一および第二のチャネルのフレームの第一および第二の時間/周波数表現を提供し、前記第一および第二の時間/周波数表現は、複数の周波数ビンおよび複数の時間ビンを含む、変換ユニットと;
・固定小数点算術を使って前記第一および第二の複数の変換係数に基づいて空間的パラメータの前記集合を決定するよう構成されたパラメータ決定ユニット(523)であって、空間的パラメータの前記集合は、異なる数の周波数ビンを含む異なる周波数帯域について対応する帯域パラメータを含み、特定の周波数帯域についての特定の帯域パラメータは、前記特定の周波数帯域の前記第一および第二の複数の変換係数からの変換係数に基づいて決定され、前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用されるシフトが、前記特定の周波数帯域に依存する、パラメータ決定ユニットとを有する、
パラメータ処理ユニット。
〔態様26〕
前記特定の周波数帯域についての前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用される前記シフトが、前記特定の周波数帯域内に含まれる周波数ビンの数に依存する、態様25記載のパラメータ処理ユニット。
〔態様27〕
前記特定の周波数帯域についての前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用される前記シフトが、前記特定の帯域パラメータを決定するために使われる時間ビンの数に依存する、態様25または26記載のパラメータ処理ユニット。
〔態様28〕
前記パラメータ決定ユニットは、前記特定の周波数帯域について、前記特定の帯域パラメータの精度を最大にする対応するシフトを決定するよう構成されている、態様25ないし27のうちいずれか一項記載のパラメータ処理ユニット。
〔態様29〕
前記パラメータ決定ユニットは、前記特定の周波数帯域についての前記特定の帯域パラメータを決定するのを、
・前記第一の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて第一のエネルギー推定値を決定し;
・前記第二の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて第二のエネルギー推定値を決定し;
・前記第一および第二の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて共分散を決定し;
・前記第一のエネルギー推定値、前記第二のエネルギー推定値および前記共分散のうちの最大に基づいて、前記特定の帯域パラメータについての前記シフトを決定する
ことによって行なうよう構成されている、態様25ないし28のうちいずれか一項記載のパラメータ処理ユニット。
〔態様30〕
マルチチャネル入力信号に基づいてビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって:
・前記マルチチャネル入力信号の第一の諸フレームの対応するシーケンスから、ダウンミックス信号の諸フレームのシーケンスを生成するよう構成されたダウンミックス処理ユニット(510)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号の第二の諸フレームのシーケンスから空間的メタデータ・フレームのシーケンスを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを含むマルチチャネル・アップミックス信号を生成するためである、パラメータ処理ユニットと;
・ビットストリーム・フレームのシーケンスを含む前記ビットストリームを生成するよう構成されたビットストリーム生成ユニット(503)であって、ビットストリーム・フレームは、前記マルチチャネル入力信号の第一の諸フレームの前記シーケンスの第一のフレームに対応する前記ダウンミックス信号のフレームと、前記マルチチャネル入力信号の第二の諸フレームの前記シーケンスの第二のフレームに対応する空間的メタデータ・フレームとを示し、前記第二のフレームは前記第一のフレームとは異なる、ビットストリーム生成ユニットとを有する、
オーディオ・エンコード・システム。
〔態様31〕
・前記第一のフレームおよび前記第二のフレームは同数のサンプルを有する;および/または
・前記第一のフレームのサンプルが前記第二のフレームのサンプルに先行する、
態様30記載のオーディオ・エンコード・システム。
〔態様32〕
前記第一のフレームは、あらかじめ決定された数のサンプルだけ前記第二のフレームより先行する、態様30または31記載のオーディオ・エンコード・システム。
〔態様33〕
前記あらかじめ決定された数のサンプルは、928個のサンプルである、態様32記載のオーディオ・エンコード・システム。
〔態様34〕
マルチチャネル入力信号に基づいてビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって、
・ダウンミックス処理ユニット(510)であって、
・前記マルチチャネル入力信号のフレームの対応するシーケンスについて、クリッピング保護利得のシーケンスを決定する段階であって、現在のクリッピング保護利得は、ダウンミックス信号の対応する現在フレームのクリッピングを防止するために、前記マルチチャネル入力信号の現在フレームに適用されるべき減衰を示す、段階と;
・現在のクリッピング保護利得と、前記マルチチャネル入力信号の先行フレームの先行クリッピング保護利得とを補間してクリッピング保護利得曲線を与える段階と;
・前記マルチチャネル入力信号の現在フレームに前記クリッピング保護利得曲線を適用して、前記マルチチャネル入力信号の減衰した現在フレームを与える段階と;
・前記マルチチャネル入力信号の減衰した現在フレームから前記ダウンミックス信号のフレームのシーケンスの現在フレームを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階とを実行するよう構成されている
ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号から空間的メタデータ・フレームのシーケンスを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、nチャネルを含むマルチチャネル・アップミックス信号を生成するためである、パラメータ処理ユニットと;
・対応するデコード・システムが前記マルチチャネル・アップミックス信号を生成できるようにするよう、クリッピング保護利得の前記シーケンス、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスを示す前記ビットストリームを生成するよう構成されたビットストリーム生成ユニット(503)とを有する、
オーディオ・エンコード・システム。
〔態様35〕
前記クリッピング保護利得曲線は、
・前記先行クリッピング保護利得から前記現在のクリッピング保護利得へのなめらかな遷移を提供する遷移セグメントと;
・前記現在のクリッピング保護利得において平坦なままである平坦なセグメントとを含む、
態様34記載のオーディオ・エンコード・システム。
〔態様36〕
・前記遷移セグメントは、前記マルチチャネル入力信号の現在フレームのあらかじめ決定された数のサンプルを通じて広がり、
・サンプルの前記あらかじめ決定された数は、1より大きく、前記マルチチャネル入力信号の現在フレームのサンプルの総数より小さい、
態様35記載のオーディオ・エンコード・システム。
〔態様37〕
ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって:
・マルチチャネル入力信号から前記ダウンミックス信号を生成するよう構成されたダウンミックス処理ユニット(510)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号のフレームの対応するシーケンスについての空間的メタデータのフレームのシーケンスを決定するよう構成されたパラメータ処理ユニットと;
・一つまたは複数の外部設定に基づいて前記パラメータ処理ユニットについての一つまたは複数の制御設定を決定するよう構成された構成設定ユニット(540)とを有し、
前記一つまたは複数の外部設定は、対応するデコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期を含み、前記構成設定ユニットは、前記更新周期に基づいて、空間的メタデータのフレームの前記シーケンスから、独立フレームとしてエンコードされるべき空間的メタデータの一つまたは複数のフレームを決定するよう構成されている、
オーディオ・エンコード・システム。
〔態様38〕
ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成する方法であって、
・マルチチャネル入力信号から前記ダウンミックス信号を生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・一つまたは複数の外部設定に基づいて一つまたは複数の制御設定を決定する段階であって、前記一つまたは複数の外部設定は、前記ビットストリームのための目標データ・レートを含み、前記一つまたは複数の制御設定は、前記空間的メタデータのための最大データ・レートを含む、段階と;
・前記一つまたは複数の制御設定に従って、前記マルチチャネル入力信号から前記空間的メタデータを決定する段階とを含む、
方法。
〔態様39〕
ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定する方法であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの一つまたは複数の集合を含み、当該方法は、
・マルチチャネル入力信号のあるチャネルの現在フレームおよび直後のフレームから複数のスペクトルを決定する段階と;
・窓関数を使って前記複数のスペクトルに重み付けして、複数の重み付けされたスペクトルを与える段階と;
・前記複数の重み付けされたスペクトルに基づいて前記マルチチャネル入力信号の前記チャネルの現在フレームについての前記空間的メタデータ・フレームを決定する段階であって、前記窓関数は:前記空間的メタデータ・フレーム内に含まれる空間的パラメータの集合の数、前記マルチチャネル入力信号の前記現在フレームまたは前記直後のフレームにおける一つまたは複数の過渡成分の存在および/または前記過渡成分の時点、のうちの一つまたは複数に依存する、段階とを含む、
方法。
〔態様40〕
ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定する方法であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの集合を含み、当該方法は、
・マルチチャネル入力信号の第一のチャネルのフレームから第一の複数の変換係数を決定する段階と;
・前記マルチチャネル入力信号の第二のチャネルの対応するフレームから第二の複数の変換係数を決定する段階であって、前記第一および第二の複数の変換係数は、それぞれ前記第一および第二のチャネルのフレームの第一および第二の時間/周波数表現を提供し、前記第一および第二の時間/周波数表現は複数の周波数ビンおよび複数の時間ビンを含み、空間的パラメータの前記集合が、異なる数の周波数ビンを含む異なる周波数帯域について、対応する帯域パラメータを含む、段階と;
・固定小数点算術を使って特定の周波数帯域についての特定の帯域パラメータを決定するときに適用されるべきシフトを決定する段階であって、前記シフトは、前記特定の周波数帯域に基づいて決定される、段階と;
・前記特定の周波数帯域にはいる前記第一および第二の複数の変換係数に基づいて、固定小数点算術および決定された前記シフトを使って、前記特定の帯域パラメータを決定する段階とを含む、
方法。
〔態様41〕
マルチチャネル入力信号に基づくビットストリームを生成する方法であって、
・前記マルチチャネル入力信号の第一の諸フレームの対応するシーケンスから、ダウンミックス信号の諸フレームのシーケンスを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・前記マルチチャネル入力信号の第二の諸フレームのシーケンスから空間的メタデータ・フレームのシーケンスを決定する段階であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを有するマルチチャネル・アップミックス信号を生成するためである、段階と;
・ビットストリーム・フレームのシーケンスを含む前記ビットストリームを生成する段階であって、ビットストリーム・フレームは、前記マルチチャネル入力信号の第一の諸フレームの前記シーケンスの第一のフレームに対応する前記ダウンミックス信号のフレームと、前記マルチチャネル入力信号の第二の諸フレームの前記シーケンスの第二のフレームに対応する空間的メタデータ・フレームとを示し、前記第二のフレームは前記第一のフレームとは異なる、段階とを含む、
方法。
〔態様42〕
マルチチャネル入力信号に基づいてビットストリームを生成する方法であって、
・前記マルチチャネル入力信号のフレームの対応するシーケンスについて、クリッピング保護利得のシーケンスを決定する段階であって、現在のクリッピング保護利得は、ダウンミックス信号の対応する現在フレームのクリッピングを防止するために、前記マルチチャネル入力信号の現在フレームに適用されるべき減衰を示す、段階と;
・現在のクリッピング保護利得と、前記マルチチャネル入力信号の先行フレームの先行クリッピング保護利得とを補間してクリッピング保護利得曲線を与える段階と;
・前記マルチチャネル入力信号の現在フレームに前記クリッピング保護利得曲線を適用して、前記マルチチャネル入力信号の減衰した現在フレームを与える段階と;
・前記マルチチャネル入力信号の減衰した現在フレームから前記ダウンミックス信号のフレームのシーケンスの現在フレームを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・前記マルチチャネル入力信号から空間的メタデータ・フレームのシーケンスを決定する段階であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを有するマルチチャネル・アップミックス信号を生成するためである、段階と;
・前記ビットストリームに基づく前記マルチチャネル・アップミックス信号の生成を可能にするため、クリッピング保護利得の前記シーケンス、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスを示す前記ビットストリームを生成する段階とを含む、
方法。
〔態様43〕
ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成する方法であって、
・マルチチャネル入力信号から前記ダウンミックス信号を生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・一つまたは複数の外部設定に基づいて一つまたは複数の制御設定を決定する段階であって、前記一つまたは複数の外部設定は、デコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期を含む、段階と;
・前記一つまたは複数の制御設定に従って、前記マルチチャネル入力信号のフレームの対応するシーケンスについて、空間的メタデータのフレームのシーケンスを決定する段階と;
・前記更新周期に基づいて、空間的メタデータのフレームの前記シーケンスからの空間的メタデータの一つまたは複数のフレームを、独立フレームとしてエンコードする段階とを含む、
方法。
〔態様44〕
態様38、41ないし43のうちいずれか一項によって生成されたビットストリームをデコードするよう構成されているオーディオ・デコーダ(140)。
Claims (39)
- ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって:
・マルチチャネル入力信号から前記ダウンミックス信号を決定するよう構成されたダウンミックス処理ユニット(510)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号から前記空間的メタデータを生成するよう構成されたパラメータ処理ユニット(520)と;
・一つまたは複数の外部設定に基づいて前記パラメータ処理ユニットのための一つまたは複数の制御設定を決定するよう構成された構成設定ユニット(540)であって、前記一つまたは複数の外部設定は、前記ビットストリームのための目標データ・レートを含み、前記一つまたは複数の制御設定は、前記空間的メタデータのための最大データ・レートを含む、構成設定ユニットとを有しており、
・前記パラメータ処理ユニットは、空間的メタデータ・フレームと称される、前記マルチチャネル入力信号のフレームについての空間的メタデータを決定するよう構成されており;
・前記マルチチャネル入力信号のフレームは、前記マルチチャネル入力信号の、あらかじめ決定された数のサンプルを含み;
・前記空間的メタデータのための前記最大データ・レートは、空間的メタデータ・フレームのためのメタデータ・ビットの最大数を示し、
前記パラメータ処理ユニットは、前記一つまたは複数の制御設定に基づいて決定された空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過するかどうかを判定するよう構成されており、
・空間的メタデータ・フレームが空間的パラメータの一つまたは複数の集合を含み;
・前記一つまたは複数の制御設定が、前記パラメータ処理ユニットによって決定されるべき空間的メタデータ・フレーム当たりの空間的パラメータの集合の数を示す時間的分解能設定を含み;
・前記パラメータ処理ユニットが、現在の空間的メタデータ・フレームが空間的パラメータの複数の集合を有している場合かつ現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過している場合には、空間的パラメータの前記複数の集合のうちの少なくとも一つの集合を残して一つまたは複数の集合を破棄するよう構成されている、
オーディオ・エンコード・システム。 - ・前記メタデータ・フレームが空間的パラメータの複数の集合を有しており、現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過しており;
・空間的パラメータの前記複数の集合は、対応する二つ以上のサンプリング点に関連付けられており;
・前記二つ以上のサンプリング点は、対応する二つ以上の時点を示し;
・前記パラメータ処理ユニットは、現在のメタデータ・フレームの前記複数のサンプリング点(583、584)が前記マルチチャネル入力信号の過渡成分に関連付けられていない場合、現在の空間的メタデータ・フレームから空間的パラメータの第一の集合(711)を破棄するよう構成されており、空間的パラメータの前記第一の集合は、第二のサンプリング点(584)より前の第一のサンプリング点(583)に関連付けられており;
・前記パラメータ処理ユニットは、現在のメタデータ・フレームの前記複数のサンプリング点が前記マルチチャネル入力信号の過渡成分に関連付けられている場合には、現在の空間的メタデータ・フレームから空間的パラメータの第二の集合(712)を破棄するよう構成されている、
請求項1記載のオーディオ・エンコード・システム。 - ・前記一つまたは複数の制御設定は、複数のあらかじめ決定された型の量子化器からの第一の型の量子化器を示す量子化器設定を含み;
・前記パラメータ処理ユニットは、前記第一の型の量子化器に従って、空間的パラメータの前記一つまたは複数の集合を量子化するよう構成されており;
・前記複数のあらかじめ決定された型の量子化器は、それぞれ異なる量子化器分解能を提供し;
・前記パラメータ処理ユニットは、現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、前記第一の型の量子化器より低い分解能をもつ第二の型の量子化器に従って空間的パラメータの前記一つまたは複数の集合の空間的パラメータの一つ、いくつかまたは全部を再量子化するよう構成されている、
請求項1または2記載のオーディオ・エンコード・システム。 - 前記複数のあらかじめ決定された型の量子化器が細かい量子化および粗い量子化を含む、請求項3記載のオーディオ・エンコード・システム。
- 前記パラメータ処理ユニットは:
・空間的パラメータの現在の集合(712)の、空間的パラメータの直前の集合(711)に対する差に基づいて時間的差分パラメータの集合を決定し;
・エントロピー符号化を使って時間的差分パラメータの前記集合をエンコードし;
・時間的差分パラメータのエンコードされた集合を、現在の空間的メタデータ・フレーム中に挿入し;
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、時間的差分パラメータの前記集合のエントロピーを低減する
よう構成されている、請求項1ないし4のうちいずれか一項記載のオーディオ・エンコード・システム。 - 前記パラメータ処理ユニットは、時間的差分パラメータの前記集合のエントロピーを低減するために、時間的差分パラメータの前記集合の時間的差分パラメータのうちの一つ、いくつかまたは全部を、時間的差分パラメータの可能な値の増大した確率をもつ値に等しく設定するよう構成されている、請求項5記載のオーディオ・エンコード・システム。
- ・前記一つまたは複数の制御設定は、周波数分解能設定を含み;
・前記周波数分解能設定は、異なる周波数帯域の数を示し;
・前記パラメータ処理ユニットは、異なる周波数帯域について、帯域パラメータと称される異なる空間的パラメータを決定するよう構成されており;
・空間的パラメータの集合は、前記異なる周波数帯域についての対応する帯域パラメータを含む、
請求項1ないし6のうちいずれか一項記載のオーディオ・エンコード・システム。 - 前記パラメータ処理ユニットは、
・第一の周波数帯域における一つまたは複数の帯域パラメータの、第二の、隣接する周波数帯域における対応する一つまたは複数の帯域パラメータに対する差に基づいて、周波数差分パラメータの集合を決定し;
・エントロピー符号化を使って、周波数差分パラメータの前記集合をエンコードし;
・周波数差分パラメータのエンコードされた集合を、現在の空間的メタデータ・フレーム中に挿入し;
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合に、周波数差分パラメータの前記集合のエントロピーを低減する
よう構成されている、請求項7記載のオーディオ・エンコード・システム。 - 前記パラメータ処理ユニットは、周波数差分パラメータの前記集合のエントロピーを低減するために、周波数差分パラメータの前記集合の周波数差分パラメータのうちの一つ、いくつかまたは全部を、周波数差分パラメータの可能な値の増大した確率をもつ値に等しく設定するよう構成されている、請求項8記載のオーディオ・エンコード・システム。
- 前記パラメータ処理ユニットが、
・現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過すると判定される場合、周波数帯域の数を低減し;
・低減した数の周波数帯域を使って、現在の空間的メタデータ・フレームについての空間的パラメータの前記一つまたは複数の集合を再決定する
よう構成されている、請求項7ないし9のうちいずれか一項記載のオーディオ・エンコード・システム。 - ・前記一つまたは複数の外部設定は:前記マルチチャネル入力信号のサンプリング・レート、前記ダウンミックス信号のチャネルの数m、前記マルチチャネル入力信号のチャネルの数nおよび対応するデコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期のうちの一つまたは複数をさらに含み;
・前記一つまたは複数の制御設定は:決定されるべき空間的メタデータのフレーム当たりの空間的パラメータの集合の数を示す時間的分解能設定、空間的パラメータが決定されるべき周波数帯域の数を示す周波数分解能設定、空間的メタデータを量子化するために使われるべき量子化器の型を示す量子化器設定および前記マルチチャネル入力信号の現在フレームが独立フレームとしてエンコードされるべきかどうかの指示のうちの一つまたは複数をさらに含む、
請求項1ないし10のうちいずれか一項記載のオーディオ・エンコード・システム。 - ・前記一つまたは複数の外部設定は、対応するデコード・システムが前記ビットストリームに同期することが要求される時間期間を示す更新周期をさらに含み;
・前記一つまたは複数の制御設定は、現在の空間的メタデータ・フレームが独立フレームとしてエンコードされるべきであるかどうかの指標をさらに含み;
・前記パラメータ処理ユニットは、前記マルチチャネル入力信号のフレームの対応するシーケンスについて、空間的メタデータ・フレームのシーケンスを決定するよう構成されており;
・前記構成設定ユニットは、空間的メタデータ・フレームの前記シーケンスから、独立フレームとしてエンコードされるべき前記一つまたは複数の空間的メタデータ・フレームを、前記更新周期に基づいて、決定するよう構成されている、
請求項1ないし11のうちいずれか一項記載のオーディオ・エンコード・システム。 - 前記構成設定ユニットは、
・前記マルチチャネル入力信号のフレームの前記シーケンスの現在フレームが、前記更新周期の整数倍である時点におけるサンプルを含むかどうかを判定し;
・現在フレームに対応する現在の空間的メタデータ・フレームが独立フレームであることを判別する
よう構成されている、請求項12記載のオーディオ・エンコード・システム。 - 前記パラメータ処理ユニットは、現在の空間的メタデータ・フレームが独立フレームとしてエンコードされるべきである場合、現在の空間的メタデータ・フレームの空間的パラメータの一つまたは複数の集合を、以前の空間的メタデータ・フレームに含まれるデータとは独立にエンコードするよう構成されている、請求項12記載のオーディオ・エンコード・システム。
- ・n=6かつm=2である;および/または
・前記マルチチャネル・アップミックス信号は5.1信号である;および/または
・前記ダウンミックス信号はステレオ信号である;および/または
・前記マルチチャネル入力信号は5.1信号である、
請求項1ないし14のうちいずれか一項記載のオーディオ・エンコード・システム。 - ・前記ダウンミックス処理ユニットが、前記ダウンミックス信号を、ドルビー・デジタル・プラス・エンコーダを使ってエンコードするよう構成されており;
・前記ビットストリームは、ドルビー・デジタル・プラス・ビットストリームに対応し;
・前記空間的メタデータは、前記ドルビー・デジタル・プラス・ビットストリームのデータ・フィールド内に含まれる、
請求項1ないし15のうちいずれか一項記載のオーディオ・エンコード・システム。 - ・前記空間的メタデータが空間的パラメータの一つまたは複数の集合を含み;
・空間的パラメータの前記集合のある空間的パラメータが、前記マルチチャネル入力信号の異なるチャネルの間の相互相関を示す、
請求項1ないし16のうちいずれか一項記載のオーディオ・エンコード・システム。 - ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定するよう構成されているパラメータ処理ユニット(520)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの一つまたは複数の集合を含み、当該パラメータ処理ユニットは、
・マルチチャネル入力信号のあるチャネルの現在フレームおよび直後のフレームから複数のスペクトルを決定するよう構成された変換ユニット(521)と;
・窓関数を使って前記複数のスペクトルに重み付けすることによって、前記マルチチャネル入力信号の前記チャネルの現在フレームについての前記空間的メタデータ・フレームを決定するよう構成されたパラメータ決定ユニット(523)を有し;
前記窓関数は:前記空間的メタデータ・フレーム内に含まれる空間的パラメータの集合の数、前記マルチチャネル入力信号の現在フレーム内または直後のフレーム内の一つまたは複数の過渡成分の存在および/または前記一つまたは複数の過渡成分の時点、のうちの一つまたは複数に依存する、
パラメータ処理ユニット。 - ・前記窓関数は、集合依存の窓関数を含み;
・前記パラメータ決定ユニットは、前記集合依存の窓関数を使って前記複数のスペクトルに重み付けすることによって、前記マルチチャネル入力信号の前記チャネルの現在フレームについての空間的パラメータの集合を決定するよう構成されており;
・前記集合依存の窓関数は、空間的パラメータの前記集合が過渡成分に関連付けられているか否かに依存する、
請求項18記載のパラメータ処理ユニット。 - 空間的パラメータの前記集合(711)が過渡成分に関連付けられていない場合、
・前記集合依存の窓関数は、空間的パラメータの先行する集合(710)のサンプリング点から空間的パラメータの前記集合(711)のサンプリング点までの前記複数のスペクトルのフェーズインを提供する;および/または
・空間的パラメータの後続集合(712)が過渡成分に関連付けられていれば、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から空間的パラメータの前記後続集合(712)のサンプリング点の前の前記複数のスペクトルのうちのスペクトルまで、前記複数のスペクトルを含め、空間的パラメータの前記後続集合(712)のサンプリング点から始まり前記複数のスペクトルを打ち消す、
請求項19記載のパラメータ処理ユニット。 - 空間的パラメータの前記集合(711)が過渡成分に関連付けられている場合、
・前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点の前の前記複数のスペクトルからのスペクトルを打ち消す;および/または
・空間的パラメータの後続集合(712)のサンプリング点が過渡成分に関連付けられていれば、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から空間的パラメータの前記後続集合(712)のサンプリング点の前の前記複数のスペクトルのうちの前記スペクトルまで、前記複数のスペクトルからのスペクトルを含め、空間的パラメータの前記後続集合(712)のサンプリング点から始まり前記複数のスペクトルからのスペクトルを打ち消す;および/または
・空間的パラメータの前記後続集合(712)が過渡成分に関連付けられていなければ、前記集合依存の窓関数は、空間的パラメータの前記集合(711)のサンプリング点から現在フレーム(585)の終わりにある前記複数のスペクトルのうちのスペクトルまで前記複数のスペクトルのスペクトルを含め、直後のフレーム(590)の先頭から空間的パラメータの前記後続集合(712)のサンプリング点まで前記複数のスペクトルのスペクトルのフェーズアウトを提供する、
請求項19記載のパラメータ処理ユニット。 - ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは空間的パラメータの集合を含み、当該パラメータ処理ユニットは:
・マルチチャネル入力信号の第一のチャネルのフレームから第一の複数の変換係数を決定し、前記マルチチャネル入力信号の第二のチャネルの対応するフレームから第二の複数の変換係数を決定するよう構成された変換ユニット(561)であって、前記第一および第二の複数の変換係数は、それぞれ前記第一および第二のチャネルのフレームの第一および第二の時間/周波数表現を提供し、前記第一および第二の時間/周波数表現は、複数の周波数ビンおよび複数の時間ビンを含む、変換ユニットと;
・固定小数点算術を使って前記第一および第二の複数の変換係数に基づいて空間的パラメータの前記集合を決定するよう構成されたパラメータ決定ユニット(523)であって、空間的パラメータの前記集合は、異なる数の周波数ビンを含む異なる周波数帯域について対応する帯域パラメータを含み、特定の周波数帯域についての特定の帯域パラメータは、前記特定の周波数帯域の前記第一および第二の複数の変換係数からの変換係数に基づいて決定され、前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用されるシフトが、前記特定の周波数帯域に依存する、パラメータ決定ユニットとを有する、
パラメータ処理ユニット。 - 前記特定の周波数帯域についての前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用される前記シフトが、前記特定の周波数帯域内に含まれる周波数ビンの数に依存する、請求項22記載のパラメータ処理ユニット。
- 前記特定の周波数帯域についての前記特定の帯域パラメータを決定するために前記固定小数点算術によって使用される前記シフトが、前記特定の帯域パラメータを決定するために使われる時間ビンの数に依存する、請求項22または23記載のパラメータ処理ユニット。
- 前記パラメータ決定ユニットは、前記特定の周波数帯域について、前記特定の帯域パラメータの精度を最大にする対応するシフトを決定するよう構成されている、請求項22ないし24のうちいずれか一項記載のパラメータ処理ユニット。
- 前記パラメータ決定ユニットは、前記特定の周波数帯域についての前記特定の帯域パラメータを決定するのを、
・前記第一の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて第一のエネルギー推定値を決定し;
・前記第二の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて第二のエネルギー推定値を決定し;
・前記第一および第二の複数の変換係数からの前記特定の周波数帯域にはいる変換係数に基づいて共分散を決定し;
・前記第一のエネルギー推定値、前記第二のエネルギー推定値および前記共分散のうちの最大の値に基づいて、前記特定の帯域パラメータについての前記シフトを決定する
ことによって行なうよう構成されている、請求項22ないし25のうちいずれか一項記載のパラメータ処理ユニット。 - マルチチャネル入力信号に基づいてビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって:
・前記マルチチャネル入力信号の第一の諸フレームの対応するシーケンスから、ダウンミックス信号の諸フレームのシーケンスを生成するよう構成されたダウンミックス処理ユニット(510)であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号の第二の諸フレームのシーケンスから空間的メタデータ・フレームのシーケンスを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを含むマルチチャネル・アップミックス信号を生成するためである、パラメータ処理ユニットと;
・ビットストリーム・フレームのシーケンスを含む前記ビットストリームを生成するよう構成されたビットストリーム生成ユニット(503)であって、ビットストリーム・フレームは、前記マルチチャネル入力信号の第一の諸フレームの前記シーケンスの第一のフレームに対応する前記ダウンミックス信号のフレームと、前記マルチチャネル入力信号の第二の諸フレームの前記シーケンスの第二のフレームに対応する空間的メタデータ・フレームとを示し、前記第二のフレームは前記第一のフレームとは異なる、ビットストリーム生成ユニットとを有する、
オーディオ・エンコード・システム。 - ・前記第一のフレームおよび前記第二のフレームは同数のサンプルを有する;および/または
・前記第一のフレームのサンプルが前記第二のフレームのサンプルに先行する、
請求項27記載のオーディオ・エンコード・システム。 - 前記第一のフレームは、あらかじめ決定された数のサンプルだけ前記第二のフレームより先行する、請求項27または28記載のオーディオ・エンコード・システム。
- 前記あらかじめ決定された数のサンプルは、928個のサンプルである、請求項29記載のオーディオ・エンコード・システム。
- マルチチャネル入力信号に基づいてビットストリームを生成するよう構成されたオーディオ・エンコード・システムであって、
・ダウンミックス処理ユニット(510)であって、
・前記マルチチャネル入力信号のフレームの対応するシーケンスについて、クリッピング保護利得のシーケンスを決定する段階であって、現在のクリッピング保護利得は、ダウンミックス信号の対応する現在フレームのクリッピングを防止するために、前記マルチチャネル入力信号の現在フレームに適用されるべき減衰を示す、段階と;
・現在のクリッピング保護利得と、前記マルチチャネル入力信号の先行フレームの先行クリッピング保護利得とを補間してクリッピング保護利得曲線を与える段階と;
・前記マルチチャネル入力信号の現在フレームに前記クリッピング保護利得曲線を適用して、前記マルチチャネル入力信号の減衰した現在フレームを与える段階と;
・前記マルチチャネル入力信号の減衰した現在フレームから前記ダウンミックス信号のフレームのシーケンスの現在フレームを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階とを実行するよう構成されている
ダウンミックス処理ユニットと;
・前記マルチチャネル入力信号から空間的メタデータ・フレームのシーケンスを決定するよう構成されたパラメータ処理ユニット(520)であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、nチャネルを含むマルチチャネル・アップミックス信号を生成するためである、パラメータ処理ユニットと;
・対応するデコード・システムが前記マルチチャネル・アップミックス信号を生成できるようにするよう、クリッピング保護利得の前記シーケンス、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスを示す前記ビットストリームを生成するよう構成されたビットストリーム生成ユニット(503)とを有する、
オーディオ・エンコード・システム。 - 前記クリッピング保護利得曲線は、
・前記先行クリッピング保護利得から前記現在のクリッピング保護利得へのなめらかな遷移を提供する遷移セグメントと;
・前記現在のクリッピング保護利得において平坦なままである平坦なセグメントとを含む、
請求項31記載のオーディオ・エンコード・システム。 - ・前記遷移セグメントは、前記マルチチャネル入力信号の現在フレームのあらかじめ決定された数のサンプルを通じて広がり、
・サンプルの前記あらかじめ決定された数は、1より大きく、前記マルチチャネル入力信号の現在フレームのサンプルの総数より小さい、
請求項32記載のオーディオ・エンコード・システム。 - ダウンミックス信号と、前記ダウンミックス信号からマルチチャネル・アップミックス信号を生成するための空間的メタデータとを示すビットストリームを生成する方法であって、
・マルチチャネル入力信号から前記ダウンミックス信号を生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・前記マルチチャネル入力信号から前記空間的メタデータを決定する段階と;
・一つまたは複数の外部設定に基づいて一つまたは複数の制御設定を決定する段階であって、前記一つまたは複数の外部設定は、前記ビットストリームのための目標データ・レートを含み、前記一つまたは複数の制御設定は、前記空間的メタデータのための最大データ・レートを含む、段階と;
・前記一つまたは複数の制御設定に従って、前記マルチチャネル入力信号から前記空間的メタデータを決定する段階とを含み、
・前記空間的メタデータを決定する段階は、空間的メタデータ・フレームと称される、前記マルチチャネル入力信号のフレームについての空間的メタデータを決定することを含み;
・前記マルチチャネル入力信号のフレームは、前記マルチチャネル入力信号の、あらかじめ決定された数のサンプルを含み;
・前記空間的メタデータのための前記最大データ・レートは、空間的メタデータ・フレームのためのメタデータ・ビットの最大数を示し、
前記空間的メタデータを決定する段階は、前記一つまたは複数の制御設定に基づいて決定された空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過するかどうかを判定することを含み、
・空間的メタデータ・フレームが空間的パラメータの一つまたは複数の集合を含み;
・前記一つまたは複数の制御設定が、前記空間的メタデータを決定する段階によって決定されるべき空間的メタデータ・フレーム当たりの空間的パラメータの集合の数を示す時間的分解能設定を含み;
・前記空間的メタデータを決定する段階が、現在の空間的メタデータ・フレームが空間的パラメータの複数の集合を有している場合かつ現在の空間的メタデータ・フレームのビット数がメタデータ・ビットの前記最大数を超過している場合には、空間的パラメータの前記複数の集合のうちの少なくとも一つの集合を残して一つまたは複数の集合を破棄するよう構成されている、
方法。 - ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定する方法であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの一つまたは複数の集合を含み、当該方法は、
・マルチチャネル入力信号のあるチャネルの現在フレームおよび直後のフレームから複数のスペクトルを決定する段階と;
・窓関数を使って前記複数のスペクトルに重み付けして、複数の重み付けされたスペクトルを与える段階と;
・前記複数の重み付けされたスペクトルに基づいて前記マルチチャネル入力信号の前記チャネルの現在フレームについての前記空間的メタデータ・フレームを決定する段階とを含み、
前記窓関数は:前記空間的メタデータ・フレーム内に含まれる空間的パラメータの集合の数、前記マルチチャネル入力信号の前記現在フレームまたは前記直後のフレームにおける一つまたは複数の過渡成分の存在および/または前記一つまたは複数の過渡成分の時点、のうちの一つまたは複数に依存する、
方法。 - ダウンミックス信号の対応するフレームからマルチチャネル・アップミックス信号のフレームを生成するための空間的メタデータ・フレームを決定する方法であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル・アップミックス信号はn個のチャネルを有し、n、mは整数であり、m<nであり、前記空間的メタデータ・フレームは、空間的パラメータの集合を含み、当該方法は、
・マルチチャネル入力信号の第一のチャネルのフレームから第一の複数の変換係数を決定する段階と;
・前記マルチチャネル入力信号の第二のチャネルの対応するフレームから第二の複数の変換係数を決定する段階であって、前記第一および第二の複数の変換係数は、それぞれ前記第一および第二のチャネルのフレームの第一および第二の時間/周波数表現を提供し、前記第一および第二の時間/周波数表現は複数の周波数ビンおよび複数の時間ビンを含み、空間的パラメータの前記集合が、異なる数の周波数ビンを含む異なる周波数帯域について、対応する帯域パラメータを含む、段階と;
・固定小数点算術を使って特定の周波数帯域についての特定の帯域パラメータを決定するときに適用されるべきシフトを決定する段階であって、前記シフトは、前記特定の周波数帯域に基づいて決定される、段階と;
・前記特定の周波数帯域にはいる前記第一および第二の複数の変換係数に基づいて、固定小数点算術および決定された前記シフトを使って、前記特定の帯域パラメータを決定する段階とを含む、
方法。 - マルチチャネル入力信号に基づくビットストリームを生成する方法であって、
・前記マルチチャネル入力信号の第一の諸フレームの対応するシーケンスから、ダウンミックス信号の諸フレームのシーケンスを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・前記マルチチャネル入力信号の第二の諸フレームのシーケンスから空間的メタデータ・フレームのシーケンスを決定する段階であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを有するマルチチャネル・アップミックス信号を生成するためである、段階と;
・ビットストリーム・フレームのシーケンスを含む前記ビットストリームを生成する段階であって、ビットストリーム・フレームは、前記マルチチャネル入力信号の第一の諸フレームの前記シーケンスの第一のフレームに対応する前記ダウンミックス信号のフレームと、前記マルチチャネル入力信号の第二の諸フレームの前記シーケンスの第二のフレームに対応する空間的メタデータ・フレームとを示し、前記第二のフレームは前記第一のフレームとは異なる、段階とを含む、
方法。 - マルチチャネル入力信号に基づいてビットストリームを生成する方法であって、
・前記マルチチャネル入力信号のフレームの対応するシーケンスについて、クリッピング保護利得のシーケンスを決定する段階であって、現在のクリッピング保護利得は、ダウンミックス信号の対応する現在フレームのクリッピングを防止するために、前記マルチチャネル入力信号の現在フレームに適用されるべき減衰を示す、段階と;
・現在のクリッピング保護利得と、前記マルチチャネル入力信号の先行フレームの先行クリッピング保護利得とを補間してクリッピング保護利得曲線を与える段階と;
・前記マルチチャネル入力信号の現在フレームに前記クリッピング保護利得曲線を適用して、前記マルチチャネル入力信号の減衰した現在フレームを与える段階と;
・前記マルチチャネル入力信号の減衰した現在フレームから前記ダウンミックス信号のフレームのシーケンスの現在フレームを生成する段階であって、前記ダウンミックス信号はm個のチャネルを有し、前記マルチチャネル入力信号はn個のチャネルを有し、n、mは整数であり、m<nである、段階と;
・前記マルチチャネル入力信号から空間的メタデータ・フレームのシーケンスを決定する段階であって、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスは、n個のチャネルを有するマルチチャネル・アップミックス信号を生成するためである、段階と;
・前記ビットストリームに基づく前記マルチチャネル・アップミックス信号の生成を可能にするため、クリッピング保護利得の前記シーケンス、前記ダウンミックス信号のフレームの前記シーケンスおよび空間的メタデータ・フレームの前記シーケンスを示す前記ビットストリームを生成する段階とを含む、
方法。 - 請求項34、37、38のうちいずれか一項によって生成されたビットストリームをデコードするよう構成されているオーディオ・デコーダ(140)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361767673P | 2013-02-21 | 2013-02-21 | |
US61/767,673 | 2013-02-21 | ||
PCT/EP2014/053475 WO2014128275A1 (en) | 2013-02-21 | 2014-02-21 | Methods for parametric multi-channel encoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223244A Division JP6472863B2 (ja) | 2013-02-21 | 2017-11-21 | パラメトリック・マルチチャネル・エンコードのための方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016509260A JP2016509260A (ja) | 2016-03-24 |
JP6250071B2 true JP6250071B2 (ja) | 2017-12-20 |
Family
ID=50151293
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558469A Active JP6250071B2 (ja) | 2013-02-21 | 2014-02-21 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2017223244A Active JP6472863B2 (ja) | 2013-02-21 | 2017-11-21 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2019009146A Active JP6728416B2 (ja) | 2013-02-21 | 2019-01-23 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2020113774A Active JP7138140B2 (ja) | 2013-02-21 | 2020-07-01 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2022140475A Pending JP2022172286A (ja) | 2013-02-21 | 2022-09-05 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2024110637A Pending JP2024147632A (ja) | 2013-02-21 | 2024-07-10 | パラメトリック・マルチチャネル・エンコードのための方法 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017223244A Active JP6472863B2 (ja) | 2013-02-21 | 2017-11-21 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2019009146A Active JP6728416B2 (ja) | 2013-02-21 | 2019-01-23 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2020113774A Active JP7138140B2 (ja) | 2013-02-21 | 2020-07-01 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2022140475A Pending JP2022172286A (ja) | 2013-02-21 | 2022-09-05 | パラメトリック・マルチチャネル・エンコードのための方法 |
JP2024110637A Pending JP2024147632A (ja) | 2013-02-21 | 2024-07-10 | パラメトリック・マルチチャネル・エンコードのための方法 |
Country Status (5)
Country | Link |
---|---|
US (7) | US9715880B2 (ja) |
EP (2) | EP2959479B1 (ja) |
JP (6) | JP6250071B2 (ja) |
CN (3) | CN116665683A (ja) |
WO (1) | WO2014128275A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105531761B (zh) | 2013-09-12 | 2019-04-30 | 杜比国际公司 | 音频解码系统和音频编码系统 |
MY181977A (en) * | 2013-10-22 | 2021-01-18 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
EP3210206B1 (en) * | 2014-10-24 | 2018-12-05 | Dolby International AB | Encoding and decoding of audio signals |
WO2016162165A1 (en) * | 2015-04-10 | 2016-10-13 | Thomson Licensing | Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation |
US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
KR102219752B1 (ko) | 2016-01-22 | 2021-02-24 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 채널 간 시간 차를 추정하기 위한 장치 및 방법 |
CN108701463B (zh) * | 2016-02-03 | 2020-03-10 | 杜比国际公司 | 音频译码中的高效格式转换 |
DE102016104665A1 (de) * | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
GB2551780A (en) * | 2016-06-30 | 2018-01-03 | Nokia Technologies Oy | An apparatus, method and computer program for obtaining audio signals |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
CN108665902B (zh) * | 2017-03-31 | 2020-12-01 | 华为技术有限公司 | 多声道信号的编解码方法和编解码器 |
US10699723B2 (en) * | 2017-04-25 | 2020-06-30 | Dts, Inc. | Encoding and decoding of digital audio signals using variable alphabet size |
CN114898761A (zh) | 2017-08-10 | 2022-08-12 | 华为技术有限公司 | 立体声信号编解码方法及装置 |
GB2574238A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Spatial audio parameter merging |
US10169852B1 (en) * | 2018-07-03 | 2019-01-01 | Nanotronics Imaging, Inc. | Systems, devices, and methods for providing feedback on and improving the accuracy of super-resolution imaging |
US10755722B2 (en) | 2018-08-29 | 2020-08-25 | Guoguang Electric Company Limited | Multiband audio signal dynamic range compression with overshoot suppression |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
GB2577698A (en) | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
GB2582916A (en) * | 2019-04-05 | 2020-10-14 | Nokia Technologies Oy | Spatial audio representation and associated rendering |
US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
US11361776B2 (en) * | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
CN112151045B (zh) * | 2019-06-29 | 2024-06-04 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
CA3147429A1 (en) * | 2019-08-01 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Systems and methods for covariance smoothing |
CN112447166B (zh) * | 2019-08-16 | 2024-09-10 | 阿里巴巴集团控股有限公司 | 一种针对目标频谱矩阵的处理方法及装置 |
GB2586586A (en) | 2019-08-16 | 2021-03-03 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2587196A (en) | 2019-09-13 | 2021-03-24 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
GB2592896A (en) * | 2020-01-13 | 2021-09-15 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
CN116762127A (zh) * | 2020-12-15 | 2023-09-15 | 诺基亚技术有限公司 | 量化空间音频参数 |
KR20230153402A (ko) * | 2021-03-11 | 2023-11-06 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 다운믹스 신호들의 적응형 이득 제어를 갖는 오디오 코덱 |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100496144B1 (ko) * | 1997-03-25 | 2005-11-23 | 삼성전자주식회사 | 디브이디 오디오 디스크 및 이를 재생하는 장치 및 방법 |
CN1320547C (zh) * | 1997-11-21 | 2007-06-06 | 日本胜利株式会社 | 一种音频信号的记录重放方法 |
US6757396B1 (en) * | 1998-11-16 | 2004-06-29 | Texas Instruments Incorporated | Digital audio dynamic range compressor and method |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
JP4547965B2 (ja) | 2004-04-02 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置、方法及びプログラム |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
US8744862B2 (en) | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
SE0402651D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
US20060235683A1 (en) | 2005-04-13 | 2006-10-19 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Lossless encoding of information with guaranteed maximum bitrate |
JP4521032B2 (ja) | 2005-04-19 | 2010-08-11 | ドルビー インターナショナル アクチボラゲット | 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 |
KR20070003544A (ko) * | 2005-06-30 | 2007-01-05 | 엘지전자 주식회사 | 아비트러리다운믹스게인을 이용한 클리핑복원 |
US8494667B2 (en) * | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US7742913B2 (en) * | 2005-10-24 | 2010-06-22 | Lg Electronics Inc. | Removing time delays in signal paths |
US8238561B2 (en) * | 2005-10-26 | 2012-08-07 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
KR100888474B1 (ko) * | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
KR101065704B1 (ko) * | 2006-09-29 | 2011-09-19 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치 |
WO2008060111A1 (en) * | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
US8200351B2 (en) * | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
KR101401964B1 (ko) * | 2007-08-13 | 2014-05-30 | 삼성전자주식회사 | 메타데이터 인코딩/디코딩 방법 및 장치 |
EP2204044B1 (en) | 2007-09-28 | 2014-07-30 | Dolby Laboratories Licensing Corporation | Multimedia coding and decoding with additional information capability |
US8239210B2 (en) * | 2007-12-19 | 2012-08-07 | Dts, Inc. | Lossless multi-channel audio codec |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
CA2871268C (en) | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
ES2387869T3 (es) * | 2008-07-30 | 2012-10-03 | FRANCE TéLéCOM | Reconstrucción de datos de audio multicanal |
JP5603339B2 (ja) | 2008-10-29 | 2014-10-08 | ドルビー インターナショナル アーベー | 既存のオーディオゲインメタデータを使用した信号のクリッピングの保護 |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
CN105225667B (zh) * | 2009-03-17 | 2019-04-05 | 杜比国际公司 | 编码器系统、解码器系统、编码方法和解码方法 |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
JP5531486B2 (ja) * | 2009-07-29 | 2014-06-25 | ヤマハ株式会社 | オーディオ機器 |
US8498874B2 (en) | 2009-09-11 | 2013-07-30 | Sling Media Pvt Ltd | Audio signal encoding employing interchannel and temporal redundancy reduction |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
ES2810824T3 (es) * | 2010-04-09 | 2021-03-09 | Dolby Int Ab | Sistema decodificador, método de decodificación y programa informático respectivo |
ES2526761T3 (es) | 2010-04-22 | 2015-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para modificar una señal de audio de entrada |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
MX2013009304A (es) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. |
KR101748756B1 (ko) | 2011-03-18 | 2017-06-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
MX349398B (es) | 2011-12-15 | 2017-07-26 | Fraunhofer Ges Forschung | Metodo, aparato y programa de computadora para evitar artefactos de recorte. |
US8622251B2 (en) | 2011-12-21 | 2014-01-07 | John OREN | System of delivering and storing proppant for use at a well site and container for such proppant |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US9516446B2 (en) * | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
CA2898567C (en) | 2013-01-28 | 2018-09-18 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
MY181977A (en) | 2013-10-22 | 2021-01-18 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
JP6593173B2 (ja) | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
CA2942743C (en) | 2014-03-25 | 2018-11-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
EP3522554B1 (en) | 2014-05-28 | 2020-12-02 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Data processor and transport of user control data to audio decoders and renderers |
RU2699406C2 (ru) | 2014-05-30 | 2019-09-05 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
CA2953242C (en) | 2014-06-30 | 2023-10-10 | Sony Corporation | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
CN108028631B (zh) | 2015-05-29 | 2022-04-19 | 弗劳恩霍夫应用研究促进协会 | 用于音量控制的装置和方法 |
MY181475A (en) | 2015-06-17 | 2020-12-23 | Fraunhofer Ges Forschung | Loudness control for user interactivity in audio coding systems |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-02-21 CN CN202310791753.8A patent/CN116665683A/zh active Pending
- 2014-02-21 CN CN201910673941.4A patent/CN110379434B/zh active Active
- 2014-02-21 JP JP2015558469A patent/JP6250071B2/ja active Active
- 2014-02-21 US US14/767,883 patent/US9715880B2/en active Active
- 2014-02-21 WO PCT/EP2014/053475 patent/WO2014128275A1/en active Application Filing
- 2014-02-21 EP EP14705785.5A patent/EP2959479B1/en active Active
- 2014-02-21 CN CN201480010021.XA patent/CN105074818B/zh active Active
- 2014-02-21 EP EP19181299.9A patent/EP3582218A1/en active Pending
-
2017
- 2017-07-11 US US15/646,482 patent/US10360919B2/en active Active
- 2017-11-21 JP JP2017223244A patent/JP6472863B2/ja active Active
-
2019
- 2019-01-23 JP JP2019009146A patent/JP6728416B2/ja active Active
- 2019-06-10 US US16/436,835 patent/US10643626B2/en active Active
-
2020
- 2020-05-01 US US16/864,694 patent/US10930291B2/en active Active
- 2020-07-01 JP JP2020113774A patent/JP7138140B2/ja active Active
-
2021
- 2021-02-17 US US17/177,217 patent/US11488611B2/en active Active
-
2022
- 2022-09-05 JP JP2022140475A patent/JP2022172286A/ja active Pending
- 2022-10-28 US US17/975,955 patent/US11817108B2/en active Active
-
2023
- 2023-11-09 US US18/505,996 patent/US12100404B2/en active Active
-
2024
- 2024-07-10 JP JP2024110637A patent/JP2024147632A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP2959479B1 (en) | 2019-07-03 |
JP2024147632A (ja) | 2024-10-16 |
US11817108B2 (en) | 2023-11-14 |
US10360919B2 (en) | 2019-07-23 |
US20190348052A1 (en) | 2019-11-14 |
JP7138140B2 (ja) | 2022-09-15 |
US10643626B2 (en) | 2020-05-05 |
US10930291B2 (en) | 2021-02-23 |
CN110379434B (zh) | 2023-07-04 |
JP2020170188A (ja) | 2020-10-15 |
JP2022172286A (ja) | 2022-11-15 |
EP3582218A1 (en) | 2019-12-18 |
CN110379434A (zh) | 2019-10-25 |
US9715880B2 (en) | 2017-07-25 |
US20200321011A1 (en) | 2020-10-08 |
US11488611B2 (en) | 2022-11-01 |
CN105074818B (zh) | 2019-08-13 |
WO2014128275A1 (en) | 2014-08-28 |
JP6472863B2 (ja) | 2019-02-20 |
US20240144941A1 (en) | 2024-05-02 |
US20210249022A1 (en) | 2021-08-12 |
JP2019080347A (ja) | 2019-05-23 |
EP2959479A1 (en) | 2015-12-30 |
JP6728416B2 (ja) | 2020-07-22 |
CN105074818A (zh) | 2015-11-18 |
US20230123244A1 (en) | 2023-04-20 |
US12100404B2 (en) | 2024-09-24 |
US20160005407A1 (en) | 2016-01-07 |
JP2018049287A (ja) | 2018-03-29 |
CN116665683A (zh) | 2023-08-29 |
US20170309280A1 (en) | 2017-10-26 |
JP2016509260A (ja) | 2016-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6472863B2 (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
US8738385B2 (en) | Pitch-based pre-filtering and post-filtering for compression of audio signals | |
JP6735053B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
US7340391B2 (en) | Apparatus and method for processing a multi-channel signal | |
JP4712799B2 (ja) | マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法 | |
EP2279562B1 (en) | Factorization of overlapping transforms into two block transforms | |
US20090204397A1 (en) | Linear predictive coding of an audio signal | |
JP5163545B2 (ja) | オーディオ復号装置及びオーディオ復号方法 | |
KR20070088329A (ko) | 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법 | |
EP2904609A1 (en) | Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding | |
US20100250260A1 (en) | Encoder | |
RU2635244C2 (ru) | Устройство и способ для пространственного кодирования аудиообъекта с использованием скрытых объектов для воздействия на смесь сигналов | |
RU2799737C2 (ru) | Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания | |
US20150170656A1 (en) | Audio encoding device, audio coding method, and audio decoding device | |
KR20140037118A (ko) | 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6250071 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |