JP6013646B2 - オーディオ処理システム - Google Patents
オーディオ処理システム Download PDFInfo
- Publication number
- JP6013646B2 JP6013646B2 JP2016505845A JP2016505845A JP6013646B2 JP 6013646 B2 JP6013646 B2 JP 6013646B2 JP 2016505845 A JP2016505845 A JP 2016505845A JP 2016505845 A JP2016505845 A JP 2016505845A JP 6013646 B2 JP6013646 B2 JP 6013646B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- stage
- mode
- audio
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 139
- 230000003595 spectral effect Effects 0.000 claims description 96
- 230000005236 sound signal Effects 0.000 claims description 81
- 238000013139 quantization Methods 0.000 claims description 63
- 238000000034 method Methods 0.000 claims description 56
- 238000005070 sampling Methods 0.000 claims description 41
- 230000010076 replication Effects 0.000 claims description 33
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 238000000354 decomposition reaction Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 8
- 230000010363 phase shift Effects 0.000 claims description 8
- 238000011144 upstream manufacturing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 32
- 238000010586 diagram Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 28
- 238000002156 mixing Methods 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 9
- 238000012937 correction Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 230000003111 delayed effect Effects 0.000 description 6
- 238000011049 filling Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000026676 system process Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本願は、2013年4月5日に出願された米国仮特許出願第61/809,019号および2013年9月10日に出願された米国仮特許出願第61/875,959号の優先権を主張するものである。
本開示は概括的にはオーディオ・エンコードおよびデコードに関する。さまざまな実施形態は声エンコードおよびデコードに特に好適なオーディオ・エンコードおよびデコード・システム(オーディオ・コーデック・システムと称される)を提供する。
・圧伸(companding)コンポーネント105;
・高周波数再構成、パラメトリック・ステレオおよびアップミックスのための組み合わされたコンポーネント106;および
・ダイナミックレンジ制御コンポーネント107
を含む。
図6は、エンコードされたオーディオ・ビットストリームPを受領し、図6ではステレオ・ベースバンド信号L、Rの対として示されている再構成されたオーディオ信号をその最終出力としてもつオーディオ処理システム100の一般化されたブロック図である。この例では、ビットストリームPは量子化された、変換符号化された二チャネルのオーディオ・データを含むことが想定される。オーディオ処理システム100は、通信ネットワーク、無線受信機またはメモリ(図示せず)からオーディオ・ビットストリームPを受領してもよい。システム100の出力は、再生のためにラウドスピーカーに供給されてもよく、あるいは通信ネットワークまたは無線リンクを通じたさらなる伝送のためまたはメモリにおける記憶のために同じまたは異なるフォーマットで再エンコードされてもよい。
本節での用法では、オーディオ信号は、純粋なオーディオ信号、オーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはこれらの任意のものをメタデータと組み合わせたものでありうる。
この節での用法では、左右符号化またはエンコードは、左(L)および右(R)のステレオ信号が、信号間のいかなる変換も実行することなく符号化されることを意味する。
図19aは、例示的な変換ベースの発話エンコーダ100のブロック図を示している。エンコーダ100は、入力として、変換係数のブロック131(符号化単位とも称される)を受領する。変換係数のブロック131は、入力オーディオ信号のサンプルのシーケンスを時間領域から変換領域に変換するよう構成された変換ユニットによって得られたものであってもよい。変換ユニットは、MDCTを実行するよう構成されていてもよい。変換ユニットは、AACまたはHE-AACのような一般的オーディオ・コーデックの一部であってもよい。そのような一般的オーディオ・コーデックは、異なるブロック・サイズ、たとえば長ブロックおよび短ブロックを利用してもよい。例示的なブロック・サイズは長ブロックについては1024サンプル、短ブロックについては256サンプルである。サンプリング・レート44.1kHzおよび50%の重複を想定すると、長ブロックは入力オーディオ信号の約20msをカバーし、短ブロックは入力オーディオ信号の約5msをカバーする。長ブロックは典型的には、入力オーディオ信号の静的セグメントのために使われ、短ブロックは典型的には入力オーディオ信号の過渡的セグメントのために使われる。
・ノイズ充填量子化器321。これは、0dBよりやや低いまたは0dBに等しいSNRを与えうる。該SNRはレート割り当てプロセスについては0dBと近似されてもよい。
・Ndith個の量子化器322。これは減算的ディザリングを使ってもよく、典型的には中間的なSNRレベルに対応する。(たとえばNdith>0)
・Ncq個の古典的量子化器323。これは減算的ディザリングを使わず、典型的には比較的高いSNRレベルに対応する(たとえばNcq>0)。ディザリングされない量子化器323はスカラー量子化器に対応しうる。
iAlloc[bandIdx]=iEnv[bandIdx]−(iMax−CONSTANT_OFFSET)+AllocOffset
によって与えられてもよい。ここで、CONSTANT_OFFSETは一定のオフセットであってもよく、たとえばCONSTANT_OFFSET=20である。例として、ビット割り当てプロセスが、ビットレート制約条件がオフセット・パラメータAllocOffset=−13を使って達成できると判定したとすると、七番目の周波数帯域の量子化器インデックス1007はiAlloc[7]=−17−(−15−20)−13=5として得られうる。上述したビット割り当て公式をすべての周波数帯域302について使うことによって、すべての周波数帯域302についての量子化器インデックス1006(および結果として量子化器321、322、323)が決定されうる。0より小さい量子化器インデックスは量子化器インデックス0に丸められてもよい。同様に、最大の利用可能な量子化器インデックスより大きい量子化器インデックスは、最大の利用可能な量子化器インデックスまで丸められてもよい。
rfu=min(1,max(g,0))
である。
上記の記述を吟味すれば、当業者には本発明のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、本発明はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本発明の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ・ビットストリームを受け入れるよう構成されたオーディオ処理システム(図1、100)であって:
フロントエンド・コンポーネントであって:
・量子化されたスペクトル係数を受領し、中間信号の第一の周波数領域表現を出力するよう適応された量子化解除段;および
・前記中間信号の前記第一の周波数領域表現を受領し、それに基づいて前記中間信号の時間領域表現を合成する逆変換段を含む、
フロントエンド・コンポーネントと;
処理段であって:
・前記中間信号の前記時間領域表現を受領し、前記中間信号の第二の周波数領域表現を出力する分解フィルタバンク;
・前記中間信号の前記第二の周波数領域表現を受領して処理されたオーディオ信号の周波数領域表現を出力する少なくとも一つの処理コンポーネント;および
・前記処理されたオーディオ信号の前記周波数領域表現を受領し、前記処理されたオーディオ信号の時間領域表現を出力する合成フィルタバンクを含む、
処理段と;
サンプル・レート変換器であって、前記処理されたオーディオ信号の前記時間領域表現を受領し、ターゲット・サンプリング周波数でサンプリングされた再構成されたオーディオ信号を出力するサンプル・レート変換器とを有し、
前記中間オーディオ信号の前記時間領域表現および前記処理されたオーディオ信号の前記時間領域表現のそれぞれの内部サンプリング・レートは等しい、
オーディオ処理システム。
〔態様2〕
前記フロントエンド・コンポーネントが、オーディオ・モードおよび該オーディオ・モードとは異なる声モードで動作可能である、態様1記載のオーディオ処理システム。
〔態様3〕
前記フロントエンド・コンポーネントの前記オーディオ・モードから前記声モードへのモード変化は前記逆変換段の最大フレーム長を短縮することを含む、態様2記載のオーディオ処理システム。
〔態様4〕
前記少なくとも一つの処理コンポーネントが:
M個のチャネルをもつダウンミックス信号を受領し、それに基づいてN個のチャネルをもつ信号を出力するパラメトリック・アップミックス段であって、少なくとも、1≦M<Nであるモードおよび1≦M=Nであるモードにおいて動作可能である、パラメトリック・アップミックス段と;
前記処理段が一定の総合遅延をもつために前記パラメトリック・アップミックス段の現在モードを補償するよう構成された第一の遅延段とを含む、
態様1ないし3のうちいずれか一項記載のオーディオ処理システム。
〔態様5〕
前記処理段に並列に配置され、前記処理段の一定の前記総合遅延に等しい遅延を受けるよう構成された第二の遅延段を有するバイパス・ラインをさらに有する、態様4記載のオーディオ処理システム。
〔態様6〕
前記パラメトリック・アップミックス段がさらに、少なくとも、M=3かつN=5であるモードで動作可能である、態様4または5記載のオーディオ処理システム。
〔態様7〕
前記フロントエンド・コンポーネントが、M=3かつN=5である前記パラメトリック・アップミックス段のモードにおいて、ダウンミックス信号を含む中間信号を与えるよう構成されており、前記フロントエンド・コンポーネントは、前記オーディオ・ビットストリーム中の合同符号化されたチャネルから前記M=3個のチャネルのうちの二つのチャネルを導出する、態様6記載のオーディオ処理システム。
〔態様8〕
前記少なくとも一つの処理コンポーネントがさらに、前記パラメトリック・アップミックス段の上流に配置され、高周波数内容を再構成するよう動作可能なスペクトル帯域複製モジュールをさらに含み、前記スペクトル帯域複製モジュールは
・少なくとも、前記パラメトリック・アップミックス段のM<Nであるモードにおいてアクティブであるよう構成され、
・前記パラメトリック・アップミックス段がM=Nであるモードのいずれかにあるときは前記パラメトリック・アップミックス段の現在モードとは独立に動作可能である、
態様4ないし7のうちいずれか一項記載のオーディオ処理システム。
〔態様9〕
前記少なくとも一つの処理コンポーネントがさらに、前記パラメトリック・アップミックス段と並列にまたは前記パラメトリック・アップミックス段の下流に配置され、前記N個のチャネルのそれぞれを波形符号化された低周波数内容で補強するよう動作可能な波形符号化段(図8、214)を含み、前記波形符号化段は、前記パラメトリック・アップミックス段および前記スペクトル帯域複製モジュールの現在モードとは独立にアクティブ化可能かつ非アクティブ化可能である、態様8記載のオーディオ処理システム。
〔態様10〕
少なくとも、前記パラメトリック・アップミックス段がM>2であるM=Nモードにあるデコード・モードにおいて動作可能である、態様9記載のオーディオ処理システム。
〔態様11〕
少なくとも次のデコード・モード、すなわち:
i)パラメトリック・アップミックス段がM=N=1モードにある;
ii)パラメトリック・アップミックス段がM=N=1モードにあり、スペクトル帯域複製モジュールがアクティブ;
iii)パラメトリック・アップミックス段がM=1、N=2モードにあり、スペクトル帯域複製モジュールがアクティブ;
iv)パラメトリック・アップミックス段がM=1、N=2モードにあり、スペクトル帯域複製モジュールがアクティブであり、波形符号化段がアクティブ;
v)パラメトリック・アップミックス段がM=2、N=5モードにあり、スペクトル帯域複製モジュールがアクティブ;
vi)パラメトリック・アップミックス段がM=2、N=5モードにあり、スペクトル帯域複製モジュールがアクティブであり、波形符号化段がアクティブ;
vii)パラメトリック・アップミックス段がM=3、N=5モードにあり、スペクトル帯域複製モジュールがアクティブ;
viii)パラメトリック・アップミックス段がM=N=2モードにある;
ix)パラメトリック・アップミックス段がM=N=2モードにあり、スペクトル帯域複製モジュールがアクティブ;
x)パラメトリック・アップミックス段がM=N=7モードにある;
xi)パラメトリック・アップミックス段がM=N=7モードにあり、スペクトル帯域複製モジュールがアクティブ
において動作可能な態様10記載のオーディオ処理システム。
〔態様12〕
前記処理段の下流に配置された次のコンポーネント、すなわち
少なくとも一つのチャネルがサラウンド・チャネルを表わす前記処理されたオーディオ信号の前記時間領域表現を受領し、前記少なくとも一つのサラウンド・チャネルに対して90度の位相シフトを実行するよう構成された位相シフト・コンポーネント;および
前記位相シフト・コンポーネントから前記処理されたオーディオ信号を受領し、それに基づいて二つのチャネルをもつダウンミックス信号を出力するよう構成されたダウンミックス・コンポーネント
をさらに有する、態様1ないし11のうちいずれか一項記載のオーディオ処理システム。
〔態様13〕
前記フロントエンド・コンポーネントが:
再構成された変換係数の一つまたは複数の以前のブロック(図23a、149)に基づき、かつ前記ビットストリームから導出された一つまたは複数の予測器パラメータ(図23a、520)に基づいて、推定された平坦化された変換係数の現在ブロック(図23a、150)を決定するよう構成されている予測器(図23a、517)と;
所定の量子化器の集合(図22、326、327)を使って前記ビットストリーム内に含まれる係数データ(図23a、163)に基づいて、量子化された予測誤差係数の現在ブロック(図17a、147)を決定するよう構成されたスペクトル・デコーダであって、前記スペクトル・デコーダは前記一つまたは複数の予測器パラメータに依存して所定の量子化器の前記集合を決定するよう構成されている、スペクトル・デコーダ(図23a、502)と;
推定された平坦化された変換係数の前記現在ブロック(図23a、150)に基づき、かつ量子化された予測誤差係数の前記現在ブロック(図23a、147)に基づいて、再構成された平坦化された変換係数の現在ブロック(図23a、148)を決定するよう構成された加算ユニット(図23a、116)と;
現在ブロック包絡(図23b、136)を使って、再構成された平坦化された変換係数の前記現在ブロックにスペクトル形状を与えることによって、再構成された変換係数の現在ブロック(図23a、149)を決定するよう構成された逆平坦化ユニット(図23a、114)とをさらに含み、前記再構成された発話信号は再構成された変換係数の前記現在ブロックに基づいて決定される、
態様1ないし12のうちいずれか一項記載のオーディオ処理システム。
〔態様14〕
前記オーディオ・ビットストリームに基づいて少なくとも一つの追加的チャネルを用意し、前記追加的チャネルを前記再構成されたオーディオ信号に含めるよう構成されたLfeデコーダをさらに有する、態様1ないし13のうちいずれか一項記載のオーディオ処理システム。
〔態様15〕
オーディオ・ビットストリームを処理する方法であって:
量子化されたスペクトル係数を受領し、周波数から時間への変換が後続する逆量子化を実行し、それにより中間オーディオ信号の表現が得られる、段階と;
前記中間オーディオ信号に対して周波数領域において少なくとも一つの処理ステップを実行する段階と;
処理されたオーディオ信号のサンプリング・レートをターゲット・サンプリング周波数に変え、それにより再構成されたオーディオ信号の時間領域表現が得られる、段階とを含み、
前記中間オーディオ信号の前記時間領域表現および前記処理されたオーディオ信号の前記時間領域表現のそれぞれの内部サンプリング・レートは等しく、
前記逆量子化および/または周波数から時間への変換は、少なくともオーディオ・モードおよび声モードで動作可能なハードウェア・コンポーネントにおいて実行され、現在モードは前記量子化されたスペクトル係数に関連付けられたメタデータに従って選択される、
方法。
〔態様16〕
態様15記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
Claims (15)
- オーディオ・ビットストリームを受け入れるよう構成されたオーディオ処理システムであって:
前記ビットストリームを受領して量子化されたスペクトル係数を出力するよう適応されたデコーダと;
フロントエンド・コンポーネントであって:
・前記量子化されたスペクトル係数を受領し、中間信号の第一の周波数領域表現を出力するよう適応された量子化解除段;および
・前記中間信号の前記第一の周波数領域表現を受領し、それに基づいて前記中間信号の時間領域表現を合成する逆変換段を含む、
フロントエンド・コンポーネントと;
処理段であって:
・前記中間信号の前記時間領域表現を受領し、前記中間信号の第二の周波数領域表現を出力する分解フィルタバンク;
・前記中間信号の前記第二の周波数領域表現を受領して処理されたオーディオ信号の周波数領域表現を出力する少なくとも一つの処理コンポーネント;および
・前記処理されたオーディオ信号の前記周波数領域表現を受領し、前記処理されたオーディオ信号の時間領域表現を出力する合成フィルタバンクを含む、
処理段と;
サンプル・レート変換器であって、前記処理されたオーディオ信号の前記時間領域表現を受領し、ターゲット・サンプリング周波数でサンプリングされた再構成されたオーディオ信号を出力するサンプル・レート変換器とを有し、
前記中間オーディオ信号の前記時間領域表現および前記処理されたオーディオ信号の前記時間領域表現のそれぞれの内部サンプリング・レートは等しく、
前記少なくとも一つの処理コンポーネントが:
M個のチャネルをもつダウンミックス信号を受領し、それに基づいてN個のチャネルをもつ信号を出力するパラメトリック・アップミックス段であって、少なくとも、1≦M<Nである、遅延が付随するモードおよび1≦M=Nであるモードにおいて動作可能である、パラメトリック・アップミックス段と;
前記処理段が前記パラメトリック・アップミックス段の現在の動作モードとは独立に一定の総合遅延をもつために、前記パラメトリック・アップミックス段が1≦M=Nのモードのとき、1≦M<Nであるモードに付随する前記遅延を補償するよう、遅延を受けるように構成された第一の遅延段とを含む、
オーディオ処理システム。 - 前記フロントエンド・コンポーネントが、オーディオ・モードおよび声固有モードで動作可能であり、前記フロントエンド・コンポーネントの前記オーディオ・モードから前記声固有モードへのモード変化は前記逆変換段の最大フレーム長を短縮することを含む、請求項1記載のオーディオ処理システム。
- 前記サンプル・レート変換器が、前記処理されたオーディオ信号の前記時間領域表現の内部サンプリング・レートから高々5%異なるターゲット・サンプリング周波数でサンプリングされた再構成されたオーディオ信号を与えるよう動作可能である、請求項2記載のオーディオ処理システム。
- 前記処理段に並列に配置され、前記処理段の一定の前記総合遅延に等しい遅延を受けるよう構成された第二の遅延段を有するバイパス・ラインをさらに有する、請求項1ないし3のうちいずれか一項記載のオーディオ処理システム。
- 前記パラメトリック・アップミックス段がさらに、少なくとも、M=3かつN=5であるモードで動作可能である、請求項1ないし4のうちいずれか一項記載のオーディオ処理システム。
- 前記フロントエンド・コンポーネントが、M=3かつN=5である前記パラメトリック・アップミックス段のモードにおいて、ダウンミックス信号を含む中間信号を与えるよう構成されており、前記フロントエンド・コンポーネントは、前記M=3個のチャネルのうちの二つのチャネルを前記オーディオ・ビットストリーム中の合同符号化されたチャネルから導出する、請求項5記載のオーディオ処理システム。
- 前記少なくとも一つの処理コンポーネントがさらに、前記パラメトリック・アップミックス段の上流に配置され、高周波数内容を再構成するよう動作可能なスペクトル帯域複製モジュールをさらに含み、前記スペクトル帯域複製モジュールは
・少なくとも、前記パラメトリック・アップミックス段のM<Nであるモードにおいてアクティブであるよう構成され、
・前記パラメトリック・アップミックス段がM=Nであるモードのいずれかにあるときは前記パラメトリック・アップミックス段の現在モードとは独立に動作可能である、
請求項1ないし6のうちいずれか一項記載のオーディオ処理システム。 - 前記少なくとも一つの処理コンポーネントがさらに、前記パラメトリック・アップミックス段と並列にまたは前記パラメトリック・アップミックス段の下流に配置され、前記N個のチャネルのそれぞれを波形符号化された低周波数内容で補強するよう動作可能な波形符号化段を含み、前記波形符号化段は、前記パラメトリック・アップミックス段および前記スペクトル帯域複製モジュールの現在モードとは独立にアクティブ化可能かつ非アクティブ化可能である、請求項7記載のオーディオ処理システム。
- 少なくとも、前記パラメトリック・アップミックス段がM>2であるM=Nモードにあるデコード・モードにおいて動作可能である、請求項8記載のオーディオ処理システム。
- 少なくとも次のデコード・モード、すなわち:
i)パラメトリック・アップミックス段がM=N=1モードにある;
ii)パラメトリック・アップミックス段がM=N=1モードにあり、スペクトル帯域複製モジュールがアクティブ;
iii)パラメトリック・アップミックス段がM=1、N=2モードにあり、スペクトル帯域複製モジュールがアクティブ;
iv)パラメトリック・アップミックス段がM=1、N=2モードにあり、スペクトル帯域複製モジュールがアクティブであり、波形符号化段がアクティブ;
v)パラメトリック・アップミックス段がM=2、N=5モードにあり、スペクトル帯域複製モジュールがアクティブ;
vi)パラメトリック・アップミックス段がM=2、N=5モードにあり、スペクトル帯域複製モジュールがアクティブであり、波形符号化段がアクティブ;
vii)パラメトリック・アップミックス段がM=3、N=5モードにあり、スペクトル帯域複製モジュールがアクティブ;
viii)パラメトリック・アップミックス段がM=N=2モードにある;
ix)パラメトリック・アップミックス段がM=N=2モードにあり、スペクトル帯域複製モジュールがアクティブ;
x)パラメトリック・アップミックス段がM=N=7モードにある;
xi)パラメトリック・アップミックス段がM=N=7モードにあり、スペクトル帯域複製モジュールがアクティブ
において動作可能な請求項9記載のオーディオ処理システム。 - 前記処理段の下流に配置された次のコンポーネント、すなわち
少なくとも一つのチャネルがサラウンド・チャネルを表わす前記処理されたオーディオ信号の前記時間領域表現を受領し、前記少なくとも一つのサラウンド・チャネルに対して90度の位相シフトを実行するよう構成された位相シフト・コンポーネント;および
前記位相シフト・コンポーネントから前記処理されたオーディオ信号を受領し、それに基づいて二つのチャネルをもつダウンミックス信号を出力するよう構成されたダウンミックス・コンポーネント
をさらに有する、請求項1ないし10のうちいずれか一項記載のオーディオ処理システム。 - 前記オーディオ・ビットストリームに基づいて少なくとも一つの追加的チャネルを用意し、前記追加的チャネルを前記再構成されたオーディオ信号に含めるよう構成されたLfeデコーダをさらに有する、請求項1ないし11のうちいずれか一項記載のオーディオ処理システム。
- オーディオ・ビットストリームを処理する方法であって:
前記ビットストリームに基づいて量子化されたスペクトル係数を提供する段階と;
前記量子化されたスペクトル係数を受領し、周波数から時間への変換が後続する逆量子化を実行し、それにより中間オーディオ信号の時間領域表現が得られる、段階と;
前記中間オーディオ信号の前記時間領域表現に基づいて前記中間オーディオ信号の周波数領域表現を提供する段階と;
前記中間オーディオ信号の前記周波数領域表現に対して少なくとも一つの処理ステップを実行することによって、処理されたオーディオ信号の周波数領域表現を提供する段階と;
前記処理されたオーディオ信号の前記周波数領域表現に基づいて、前記処理されたオーディオ信号の時間領域表現を提供する段階と;
前記処理されたオーディオ信号の前記時間領域表現のサンプリング・レートをターゲット・サンプリング周波数に変え、それにより再構成されたオーディオ信号が得られる、段階とを含み、
前記中間オーディオ信号の前記時間領域表現および前記処理されたオーディオ信号の前記時間領域表現のそれぞれの内部サンプリング・レートは等しく、
当該方法はさらに:
前記少なくとも一つの処理コンポーネントが:
少なくとも、1≦M<Nである、遅延が付随するモードおよび1≦M=Nであるモードのうちから現在モードを決定する段階を含み、
前記少なくとも一つの処理ステップは:
M個のチャネルをもつダウンミックス信号を受領し、それに基づいてN個のチャネルをもつ信号を出力し;
前記処理ステップの総合遅延が前記現在モードとは独立に一定であるために、前記現在モードが1≦M=Nのモードであることに応答して、1≦M<Nであるモードに付随する前記遅延を補償する遅延を受けることを含む、
方法。 - 前記逆量子化および/または周波数から時間への変換は、少なくともオーディオ・モードおよび声固有モードで動作可能なハードウェア・コンポーネントにおいて実行され、現在モードは前記量子化されたスペクトル係数に関連付けられたメタデータに従って選択され、前記オーディオ・モードから前記声固有モードへのモード変化は前記周波数から時間への変換の最大フレーム長を短縮することを含む、請求項13記載の方法。
- 請求項13または14記載の方法をコンピュータに実行するためのコンピュータ・プログラム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361809019P | 2013-04-05 | 2013-04-05 | |
US61/809,019 | 2013-04-05 | ||
US201361875959P | 2013-09-10 | 2013-09-10 | |
US61/875,959 | 2013-09-10 | ||
PCT/EP2014/056857 WO2014161996A2 (en) | 2013-04-05 | 2014-04-04 | Audio processing system |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016184272A Division JP6407928B2 (ja) | 2013-04-05 | 2016-09-21 | オーディオ処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016514858A JP2016514858A (ja) | 2016-05-23 |
JP6013646B2 true JP6013646B2 (ja) | 2016-10-25 |
Family
ID=50489074
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016505845A Active JP6013646B2 (ja) | 2013-04-05 | 2014-04-04 | オーディオ処理システム |
JP2016184272A Active JP6407928B2 (ja) | 2013-04-05 | 2016-09-21 | オーディオ処理システム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016184272A Active JP6407928B2 (ja) | 2013-04-05 | 2016-09-21 | オーディオ処理システム |
Country Status (11)
Country | Link |
---|---|
US (2) | US9478224B2 (ja) |
EP (1) | EP2981956B1 (ja) |
JP (2) | JP6013646B2 (ja) |
KR (1) | KR101717006B1 (ja) |
CN (2) | CN105247613B (ja) |
BR (1) | BR112015025092B1 (ja) |
ES (1) | ES2934646T3 (ja) |
HK (1) | HK1214026A1 (ja) |
IN (1) | IN2015MN02784A (ja) |
RU (1) | RU2625444C2 (ja) |
WO (1) | WO2014161996A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017017749A (ja) * | 2013-04-05 | 2017-01-19 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
KR101987565B1 (ko) * | 2014-08-28 | 2019-06-10 | 노키아 테크놀로지스 오와이 | 오디오 파라미터 양자화 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US20180082693A1 (en) * | 2015-04-10 | 2018-03-22 | Thomson Licensing | Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
WO2017080835A1 (en) * | 2015-11-10 | 2017-05-18 | Dolby International Ab | Signal-dependent companding system and method to reduce quantization noise |
KR101968456B1 (ko) * | 2016-01-26 | 2019-04-11 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 적응형 양자화 |
KR102546098B1 (ko) * | 2016-03-21 | 2023-06-22 | 한국전자통신연구원 | 블록 기반의 오디오 부호화/복호화 장치 및 그 방법 |
US20170289536A1 (en) * | 2016-03-31 | 2017-10-05 | Le Holdings (Beijing) Co., Ltd. | Method of audio debugging for television and electronic device |
US10770082B2 (en) * | 2016-06-22 | 2020-09-08 | Dolby International Ab | Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
PT3539127T (pt) * | 2016-11-08 | 2020-12-04 | Fraunhofer Ges Forschung | Dispositivo de downmix e método para executar o downmix de pelo menos dois canais e codificador multicanal e descodificador multicanal |
GB2559200A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10863300B2 (en) | 2018-06-18 | 2020-12-08 | Magic Leap, Inc. | Spatial audio for interactive audio environments |
US11545165B2 (en) * | 2018-07-03 | 2023-01-03 | Panasonic Intellectual Property Corporation Of America | Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels |
CN112384976B (zh) * | 2018-07-12 | 2024-10-11 | 杜比国际公司 | 动态eq |
JP2022523564A (ja) | 2019-03-04 | 2022-04-25 | アイオーカレンツ, インコーポレイテッド | 機械学習を使用するデータ圧縮および通信 |
CN110335615B (zh) * | 2019-05-05 | 2021-11-16 | 北京字节跳动网络技术有限公司 | 音频数据的处理方法、装置、电子设备及存储介质 |
WO2021004047A1 (zh) * | 2019-07-09 | 2021-01-14 | 海信视像科技股份有限公司 | 显示装置、音频播放方法 |
BR112022003440A2 (pt) * | 2019-09-03 | 2022-05-24 | Dolby Laboratories Licensing Corp | Codec de efeitos de baixa latência, baixa frequência |
RU2731602C1 (ru) * | 2019-09-30 | 2020-09-04 | Ордена трудового Красного Знамени федеральное государственное бюджетное образовательное учреждение высшего образования "Московский технический университет связи и информатики" (МТУСИ) | Способ и устройство компандирования с предыскажением звуковых вещательных сигналов |
CN113140225B (zh) * | 2020-01-20 | 2024-07-02 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备及存储介质 |
CN111354365B (zh) * | 2020-03-10 | 2023-10-31 | 苏宁云计算有限公司 | 一种纯语音数据采样率识别方法、装置、系统 |
JP7567180B2 (ja) * | 2020-03-13 | 2024-10-16 | ヤマハ株式会社 | 音響処理装置および音響処理方法 |
GB2624686A (en) * | 2022-11-25 | 2024-05-29 | Lenbrook Industries Ltd | Improvements to audio coding |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
JP4108317B2 (ja) * | 2001-11-13 | 2008-06-25 | 日本電気株式会社 | 符号変換方法及び装置とプログラム並びに記憶媒体 |
US7657427B2 (en) | 2002-10-11 | 2010-02-02 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
EP1618763B1 (en) * | 2003-04-17 | 2007-02-28 | Koninklijke Philips Electronics N.V. | Audio signal synthesis |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
GB0402661D0 (en) * | 2004-02-06 | 2004-03-10 | Medical Res Council | TPL2 and its expression |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
TWI393120B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
MX2007011915A (es) * | 2005-03-30 | 2007-11-22 | Koninkl Philips Electronics Nv | Codificacion de audio multicanal. |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
EP1912206B1 (en) * | 2005-08-31 | 2013-01-09 | Panasonic Corporation | Stereo encoding device, stereo decoding device, and stereo encoding method |
US20080004883A1 (en) | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
DE602007012116D1 (de) * | 2006-08-15 | 2011-03-03 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
SG175632A1 (en) | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
US8363842B2 (en) * | 2006-11-30 | 2013-01-29 | Sony Corporation | Playback method and apparatus, program, and recording medium |
JP4930320B2 (ja) * | 2006-11-30 | 2012-05-16 | ソニー株式会社 | 再生方法及び装置、プログラム並びに記録媒体 |
US8200351B2 (en) | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
US8553891B2 (en) * | 2007-02-06 | 2013-10-08 | Koninklijke Philips N.V. | Low complexity parametric stereo decoder |
US8290167B2 (en) * | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
GB2467247B (en) * | 2007-10-04 | 2012-02-29 | Creative Tech Ltd | Phase-amplitude 3-D stereo encoder and decoder |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
US8546172B2 (en) * | 2008-01-18 | 2013-10-01 | Miasole | Laser polishing of a back contact of a solar cell |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
JP5551694B2 (ja) | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101381513B1 (ko) * | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
CN102099857B (zh) * | 2008-07-18 | 2013-03-13 | 杜比实验室特许公司 | 用于解码器中的编码音频数据的频域后滤波的方法和系统 |
WO2010042024A1 (en) | 2008-10-10 | 2010-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Energy conservative multi-channel audio coding |
WO2010070016A1 (en) * | 2008-12-19 | 2010-06-24 | Dolby Sweden Ab | Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters |
WO2010075895A1 (en) | 2008-12-30 | 2010-07-08 | Nokia Corporation | Parametric audio coding |
EP2214161A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
BRPI1009467B1 (pt) | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
FR2947945A1 (fr) | 2009-07-07 | 2011-01-14 | France Telecom | Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques |
KR20110022252A (ko) | 2009-08-27 | 2011-03-07 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
KR20110049068A (ko) * | 2009-11-04 | 2011-05-12 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
US8489391B2 (en) | 2010-08-05 | 2013-07-16 | Stmicroelectronics Asia Pacific Pte., Ltd. | Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication |
CN103262158B (zh) | 2010-09-28 | 2015-07-29 | 华为技术有限公司 | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 |
CN102844808B (zh) | 2010-11-03 | 2016-01-13 | 华为技术有限公司 | 用于编码多通道音频信号的参数编码器 |
CN102959620B (zh) | 2011-02-14 | 2015-05-13 | 弗兰霍菲尔运输应用研究公司 | 利用重迭变换的信息信号表示 |
EP2523473A1 (en) * | 2011-05-11 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an output signal employing a decomposer |
CN103918029B (zh) * | 2011-11-11 | 2016-01-20 | 杜比国际公司 | 使用过采样谱带复制的上采样 |
CN105247613B (zh) * | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
-
2014
- 2014-04-04 CN CN201480024625.XA patent/CN105247613B/zh active Active
- 2014-04-04 US US14/781,232 patent/US9478224B2/en active Active
- 2014-04-04 RU RU2015147158A patent/RU2625444C2/ru active
- 2014-04-04 BR BR112015025092-0A patent/BR112015025092B1/pt active IP Right Grant
- 2014-04-04 ES ES14717713T patent/ES2934646T3/es active Active
- 2014-04-04 KR KR1020157031853A patent/KR101717006B1/ko active IP Right Grant
- 2014-04-04 IN IN2784MUN2015 patent/IN2015MN02784A/en unknown
- 2014-04-04 EP EP14717713.3A patent/EP2981956B1/en active Active
- 2014-04-04 CN CN201910045920.8A patent/CN109509478B/zh active Active
- 2014-04-04 WO PCT/EP2014/056857 patent/WO2014161996A2/en active Application Filing
- 2014-04-04 JP JP2016505845A patent/JP6013646B2/ja active Active
-
2016
- 2016-02-18 HK HK16101744.9A patent/HK1214026A1/zh unknown
- 2016-09-01 US US15/255,009 patent/US9812136B2/en active Active
- 2016-09-21 JP JP2016184272A patent/JP6407928B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017017749A (ja) * | 2013-04-05 | 2017-01-19 | ドルビー・インターナショナル・アーベー | オーディオ処理システム |
Also Published As
Publication number | Publication date |
---|---|
US20160055855A1 (en) | 2016-02-25 |
BR112015025092A2 (pt) | 2017-07-18 |
HK1214026A1 (zh) | 2016-07-15 |
CN109509478A (zh) | 2019-03-22 |
US9478224B2 (en) | 2016-10-25 |
JP2016514858A (ja) | 2016-05-23 |
US9812136B2 (en) | 2017-11-07 |
EP2981956B1 (en) | 2022-11-30 |
RU2625444C2 (ru) | 2017-07-13 |
US20160372123A1 (en) | 2016-12-22 |
KR20150139601A (ko) | 2015-12-11 |
CN105247613B (zh) | 2019-01-18 |
RU2015147158A (ru) | 2017-05-17 |
ES2934646T3 (es) | 2023-02-23 |
EP2981956A2 (en) | 2016-02-10 |
WO2014161996A2 (en) | 2014-10-09 |
JP6407928B2 (ja) | 2018-10-17 |
CN105247613A (zh) | 2016-01-13 |
KR101717006B1 (ko) | 2017-03-15 |
CN109509478B (zh) | 2023-09-05 |
IN2015MN02784A (ja) | 2015-10-23 |
BR112015025092B1 (pt) | 2022-01-11 |
JP2017017749A (ja) | 2017-01-19 |
WO2014161996A3 (en) | 2014-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6407928B2 (ja) | オーディオ処理システム | |
US10573327B2 (en) | Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels | |
JP7156986B2 (ja) | 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム | |
JP6735053B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
US8046214B2 (en) | Low complexity decoder for complex transform coding of multi-channel sound | |
JP4772279B2 (ja) | オーディオ信号のマルチチャネル/キュー符号化/復号化 | |
JP5542306B2 (ja) | オーディオ信号のスケーラブル符号化及び復号 | |
US20080077412A1 (en) | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding | |
EP1807824A1 (en) | Interpolation and signalling of spacial reconstruction parameters for multichannel coding and decoding of audio sources | |
KR20140004086A (ko) | 반대 위상의 채널들에 대한 개선된 스테레오 파라메트릭 인코딩/디코딩 | |
KR20090007396A (ko) | 손실 인코딩된 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하여 소스 신호를 무손실 인코딩하기 위한 방법 및 장치 | |
JP2019506633A (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
US7725324B2 (en) | Constrained filter encoding of polyphonic signals | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
EP1639580B1 (en) | Coding of multi-channel signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160830 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6013646 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |