JP7033182B2 - 信号をインタリーブするためのオーディオ復号器 - Google Patents
信号をインタリーブするためのオーディオ復号器 Download PDFInfo
- Publication number
- JP7033182B2 JP7033182B2 JP2020203849A JP2020203849A JP7033182B2 JP 7033182 B2 JP7033182 B2 JP 7033182B2 JP 2020203849 A JP2020203849 A JP 2020203849A JP 2020203849 A JP2020203849 A JP 2020203849A JP 7033182 B2 JP7033182 B2 JP 7033182B2
- Authority
- JP
- Japan
- Prior art keywords
- signals
- frequency
- stage
- waveform
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 description 20
- 230000008878 coupling Effects 0.000 description 18
- 238000010168 coupling process Methods 0.000 description 18
- 238000005859 coupling reaction Methods 0.000 description 18
- 230000008901 benefit Effects 0.000 description 12
- 239000013598 vector Substances 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Error Detection And Correction (AREA)
Description
本明細書における開示は、一般に、マルチチャネルオーディオ符号化に関する。特に、本開示は、パラメトリック符号化(parametric coding)及び離散的マルチチャネル符号化(discrete multi-channel coding)を含むハイブリッド符号化のための符号器及び復号器に関する。
「関連出願への相互参照」
本願は、2013年4月5日に出願された米国仮特許出願番号61/808,680号に対して同様に優先権を主張する2014年4月4日に出願されたPCT出願番号PCT/EP2014/056852号の第371条の国内段階出願である2015年9月1日に出願された米国特許出願番号14/772,001号の継続出願であり、この結果、これらの出願の各々は、その全体を参照することにより本明細書に含まれる。
本願は、2013年4月5日に出願された米国仮特許出願番号61/808,680号に対して同様に優先権を主張する2014年4月4日に出願されたPCT出願番号PCT/EP2014/056852号の第371条の国内段階出願である2015年9月1日に出願された米国特許出願番号14/772,001号の継続出願であり、この結果、これらの出願の各々は、その全体を参照することにより本明細書に含まれる。
従来のマルチチャネルオーディオ符号化において、可能な符号化スキームは、MPEG Surround(登録商標)のような離散的マルチチャネル符号化又はパラメトリック符号化を含む。使用されるスキームは、オーディオシステムの帯域幅によって決まる。パラメトリック符号化方法は、受聴品質(listening quality)に関してスケーラブルかつ効率的であるということが知られており、それは、低いビットレートのアプリケーションにおいてパラメトリック符号化方法を特に魅力的にする。高いビットレートのアプリケーションでは、離散的マルチチャネル符号化がしばしば使用される。特に低いビットレートと高いビットレートとの間のビットレートを有するアプリケーションでは、既存の分配フォーマット又は処理フォーマット、及び付随する符号化技術は、それらの帯域効率の観点から改善され得る。
(“Kroon”等による)米国特許第7292901号(US7292901)は、ハイブリッドオーディオ信号が少なくとも1つのダウンミックスされたスペクトル成分、及び少なくとも1つの純粋な(unmixed:ミックスされていない)スペクトル成分から形成されるハイブリッド符号化方法に関連している。そのアプリケーションにおいて公開された方法は、特定のビットレートを有するアプリケーションの容量を増大させ得るが、しかし、オーディオ処理システムの効率をさらに増大させるためには、さらなる改善が必要とされ得る。
実例の実施例が、添付図面を参照してここで説明されることになる。
全ての図面は、概略的であるとともに、概して、本開示を説明するために必要である要素だけを示す一方、他の要素は省略され得るか、又は単に示唆され得る。特に示されない限り、異なる図面において、同等の参照符号は同等の要素を参照する。
「復号器の概観」
ここで使用されるように、オーディオ信号は、純粋なオーディオ信号、オーディオビジュアル信号若しくはマルチメディア信号のオーディオ部分、又は、メタデータと結合されたこれらのうちのいずれかであり得る。
ここで使用されるように、オーディオ信号は、純粋なオーディオ信号、オーディオビジュアル信号若しくはマルチメディア信号のオーディオ部分、又は、メタデータと結合されたこれらのうちのいずれかであり得る。
ここで使用されるように、複数の信号のダウンミキシングは、例えば、より少ない数の信号が獲得されるように、一次結合を形成することにより、複数の信号を結合することを意味する。ダウンミキシングに対する逆動作は、アップミキシングと呼ばれ、すなわち、より多い数の信号を獲得するように、より少ない数の信号に対して操作を行うことを指す。
第1の態様によれば、実例の実施例は、入力信号に基づいてマルチチャネルオーディオ信号を復元するための方法、装置、及びコンピュータプログラム製品を提案する。提案された方法、装置、及びコンピュータプログラム製品は、一般に、同じ特徴及び利点を有し得る。
実例の実施例によれば、M個(M>2)の符号化されたチャネルを復元するための、マルチチャネルオーディオ処理システムに適した復号器が提供される。復号器は、第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含むN個(1<N<M)の波形符号化ダウンミックス信号を受信するように構成される第1の受信ステージを含む。
復号器は、第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むM個の波形符号化信号を受信するように構成される第2の受信ステージであって、M個の波形符号化信号のそれぞれがM個の符号化されたチャネルのうちのそれぞれのチャネルに対応する、第2の受信ステージを更に含む。
復号器は、M個の波形符号化信号を第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むN個のダウンミックス信号へダウンミックスするように構成される、第2の受信ステージの下流のダウンミックスステージを更に含む。
復号器は、第1の受信ステージにより受信されるN個の波形符号化ダウンミックス信号のそれぞれを、ダウンミックスステージからのN個のダウンミックス信号のうちの対応する1つと結合して、N個の結合されたダウンミックス信号にするように構成される、第1の受信ステージ及びダウンミックスステージの下流の第1の結合ステージを更に含む。
復号器は、高周波復元を実行することにより、第1の結合ステージからのN個の結合されたダウンミックス信号のそれぞれを第2のクロスオーバ周波数より上の周波数範囲に拡張するように構成される、第1の結合ステージの下流の高周波復元ステージを更に含む。
復号器は、第1のクロスオーバ周波数より上の周波数に対応するスペクトル係数を含むM個のアップミックス信号への、高周波復元ステージからの周波数拡張されたN個の結合されたダウンミックス信号のパラメトリックアップミックスを実行するように構成される、高周波復元ステージの下流のアップミックスステージであって、M個のアップミックス信号のそれぞれがM個の符号化されたチャネルのうちの1つに対応する、アップミックスステージを更に含む。
復号器は、アップミックスステージからのM個のアップミックス信号を、第2の受信ステージにより受信されるM個の波形符号化信号と結合するように構成される、アップミックスステージ及び第2の受信ステージの下流の第2の結合ステージを更に含む。
M個の波形符号化信号は、パラメトリック信号が混合されることなく純粋に波形符号化された信号であり、すなわち、それらは、処理されたマルチチャネルオーディオ信号のダウンミックスされていない離散的表現である。これらの波形符号化信号で表されたより低い周波数を有することの利点は、人間の耳が、低周波を有するオーディオ信号の部分に対してより敏感である、ということであり得る。更に良い品質によりこの部分を符号化することによって、復号されたオーディオの全体の印象が強まり得る。
少なくとも2つのダウンミックス信号を有することの利点は、この実施例が、1つだけのダウンミックスチャネルを有するシステムと比較すると、ダウンミックス信号の増大した次元数(dimensionality)を提供する、ということである。この実施例によれば、1つのダウンミックス信号システムにより提供されるビットレートにおける利得を上回るかもしれない、より良く復号されたオーディオ品質が、したがって提供され得る。
パラメトリックダウンミックス及び離散的マルチチャネル符号化を含むハイブリッド符号化を使用することの利点は、これが、従来のパラメトリック符号化アプローチ、すなわちHE-AACを有するMPEG Surroundと比較すると、特定のビットレートに関して復号されたオーディオ信号の品質を改良し得る、ということである。1秒あたり約72キロビット(kbps)のビットレートにおいて、従来のパラメトリック符号化モデルは飽和する可能性があり、すなわち、復号されたオーディオ信号の品質は、符号化のためのビットの不足によるためではなく、パラメトリックモデルの欠点によって制限される。したがって、約72kbpsからのビットレートに関しては、より低い周波数を離散的に波形符号化することにビットを使用することが、より有益であり得る。同時に、パラメトリックダウンミックス及び離散的マルチチャネル符号化を使用するハイブリッドアプローチ(hybrid approach:複合型のアプローチ)は、これが、全てのビットがより低い周波数を波形符号化することに使用されるアプローチを使用すること、及び残りの周波数のためにスペクトル帯域複製(spectral band replication:SBR)を使用することに比較して、特定のビットレート、例えば128kbps以下のビットレートに関して復号されたオーディオ信号の品質を改良し得る、ということである。
第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトルデータのみを含むN個の波形符号化ダウンミックス信号を有することの利点は、オーディオ信号処理システムのための必要とされるビット通信速度が減らされ得る、ということである。その代りに、バンドパスフィルタ処理されたダウンミックス信号を有することによって節約されたビットは、より低い周波数を波形符号化することに使用されることができ、例えば、それらの周波数のためのサンプル周波数がより高くされ得るか、又は第1のクロスオーバ周波数が増やされ得る。
上記で言及されたように、人間の耳が低周波を有するオーディオ信号の部分に対してより敏感であるので、第2のクロスオーバ周波数より上の周波数を有するオーディオ信号の部分としての高周波は、復号されたオーディオ信号の知覚されるオーディオ品質を減少させずに、高周波復元により再現され得る。
本実施例に関する更なる利点は、アップミックスステージで実行されるパラメトリックアップミックスが第1のクロスオーバ周波数より上の周波数に対応するスペクトル係数だけを処理するので、アップミックスの複雑さが減少する、ということであり得る。
別の実施例によれば、第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含むN個の波形符号化ダウンミックス信号のそれぞれが第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むN個のダウンミックス信号のうちの対応する1つと結合されてN個の結合されたダウンミックス信号になる、第1の結合ステージにおいて実行される結合は、周波数領域において実行される。
この実施例の利点は、M個の波形符号化信号、及びN個の波形符号化ダウンミックス信号が、それぞれ、M個の波形符号化信号、及びN個の波形符号化ダウンミックス信号に対する独立したウィンドウ処理によるオーバーラップウィンドウ化変換(overlapping windowed transform)を使用して波形符号器(waveform coder)により符号化されることができ、それでもやはり復号器により復号可能であり得る、ということであり得る。
別の実施例によれば、高周波復元ステージにおいてN個の結合されたダウンミックス信号のそれぞれを第2のクロスオーバ周波数より上の周波数範囲に拡張することは、周波数領域において実行される。
更なる実施例によれば、第2の結合ステージにおいて実行される結合、すなわち、第1のクロスオーバ周波数より上の周波数に対応するスペクトル係数を含むM個のアップミックス信号の、第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むM個の波形符号化信号との結合は、周波数領域において実行される。上記で言及されたように、QMF領域において信号を結合することの利点は、MDCT領域において信号を符号化するために使用されるオーバーラップウィンドウ化変換の独立したウィンドウ処理が使用され得る、ということである。
別の実施例によれば、アップミックスステージにおいて実行される、M個のアップミックス信号への、周波数拡張されたN個の結合されたダウンミックス信号のパラメトリックアップミックスは、周波数領域において実行される。
さらに別の実施例によれば、第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むN個のダウンミックス信号へ、M個の波形符号化信号をダウンミックスすることは、周波数領域において実行される。
一実施例によれば、周波数領域は、直交ミラーフィルタ(Quadrature Mirror Filter:QMF)領域である。
別の実施例によれば、M個の波形符号化信号が第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むN個のダウンミックス信号へダウンミックスされる、ダウンミキシングステージにおいて実行されるダウンミキシングは、時間領域において実行される。
さらに別の実施例によれば、第1のクロスオーバ周波数は、マルチチャネルオーディオ処理システムのビット伝送速度によって決まる。これは、第1のクロスオーバ周波数より下の周波数を有するオーディオ信号の部分が単に波形符号化されるので、利用可能な帯域幅が復号されたオーディオ信号の品質を改良するために利用される、ということをもたらし得る。
別の実施例によれば、高周波復元ステージにおいて高周波復元を実行することにより、N個の結合されたダウンミックス信号のそれぞれを第2のクロスオーバ周波数より上の周波数範囲に拡張することは、高周波復元パラメータを使用して実行される。高周波復元パラメータは、復号器により、例えば受信ステージにおいて受信され得るとともに、その後高周波復元ステージに送信され得る。高周波復元は、例えばスペクトル帯域複製(SBR)を実行することを含み得る。
別の実施例によれば、アップミキシングステージにおけるパラメトリックアップミックスは、アップミックスパラメータの使用と共に行われる。アップミックスパラメータは、符号器により、例えば受信ステージにおいて受信されるとともに、アップミキシングステージに送信される。周波数拡張されたN個の結合されたダウンミックス信号の無相関化されたバージョンが生成されるとともに、周波数拡張されたN個の結合されたダウンミックス信号、及び周波数拡張されたN個の結合されたダウンミックス信号の無相関化されたバージョンに行列演算が行われる。行列演算のパラメータは、アップミックスパラメータにより与えられる。
別の実施例によれば、第1の受信ステージにおける受信されたN個の波形符号化ダウンミックス信号、及び第2の受信ステージにおける受信されたM個の波形符号化信号は、それぞれ、N個の波形符号化ダウンミックス信号、及びM個の波形符号化信号に対する独立したウィンドウ処理によるオーバーラップウィンドウ化変換を使用して符号化される。
これの利点は、これが改良された符号化品質、そしてしたがって、復号されたマルチチャネルオーディオ信号の品質向上を可能にする、ということであり得る。例えば、もし時間におけるある時点で過渡信号がより高い周波数帯域において検出されるならば、より低い周波数帯域のためにデフォルトのウィンドウシーケンスが保持され得る一方、波形符号器は、より短いウィンドウシーケンスによってこの特別なタイムフレームを符号化し得る。
実施例によれば、復号器は、第1のクロスオーバ周波数より上の周波数のサブセットに対応するスペクトル係数を含む更なる波形符号化信号を受信するように構成される第3の受信ステージを含み得る。復号器は、アップミックスステージの下流のインタリービングステージを更に含み得る。インタリービングステージは、更なる波形符号化信号をM個のアップミックス信号のうちの1つとインタリーブするように構成され得る。第3の受信ステージは、複数の更なる波形符号化信号を受信するように更に構成され得るとともに、インタリービングステージは、複数の更なる波形符号化信号を複数のM個のアップミックス信号とインタリーブするように更に構成され得る。
これは、ダウンミックス信号からパラメータ的に復元することが困難である第1のクロスオーバ周波数より上の周波数範囲の特定の部分が、パラメータ的に復元されたアップミックス信号とのインタリーブの結果として、波形符号化形式において提供され得る、ということにおいて有利である。
1つの代表的な実施例において、インタリーブすることは、更なる波形符号化信号をM個のアップミックス信号のうちの1つと加算することにより実行される。別の代表的な実施例によれば、更なる波形符号化信号をM個のアップミックス信号のうちの1つとインタリーブするステップは、M個のアップミックス信号のうちの1つを更なる波形符号化信号のスペクトル係数に対応する第1のクロスオーバ周波数より上の周波数のサブセットにおける更なる波形符号化信号によって置き換えるステップを含む。
代表的な実施例によれば、復号器は、例えば第3の受信ステージにより制御信号を受信するように更に構成され得る。制御信号は、更なる波形符号化信号をM個のアップミックス信号のうちの1つとどのようにインタリーブするかを示すことができ、更なる波形符号化信号をM個のアップミックス信号のうちの1つとインタリーブするステップは、制御信号に基づいている。具体的には、制御信号は、更なる波形符号化信号がM個のアップミックス信号のうちの1つとインタリーブされるべきである、QMF領域における1つ又は複数の時間/周波数タイルのような、周波数範囲及び時間範囲を示し得る。したがって、インタリーブすることは、1つのチャネルの中の時間及び周波数において発生し得る。
これの利点は、波形符号化信号を符号化するために使用されるオーバーラップウィンドウ化変換のエイリアシング、又はスタートアップ/フェードアウト問題に悩まされない時間範囲及び周波数範囲が選択されることができる、ということである。
いくつかの実施例によれば、オーディオ処理システムにおいて符号化されたオーディオビットストリームを復号するための方法が開示される。当該方法は、符号化されたオーディオビットストリームから第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含む第1の波形符号化信号を抽出するステップと、第2のクロスオーバ周波数においてパラメトリック復号を実行し、復元された信号を生成するステップとを含む。第2のクロスオーバ周波数は、第1のクロスオーバ周波数より上であるとともに、パラメトリック復号は、符号化されたオーディオビットストリームから取得された復元パラメータを使用して復元された信号を生成する。当該方法は、符号化されたオーディオビットストリームから第1のクロスオーバ周波数より上の周波数のサブセットに対応するスペクトル係数を含む第2の波形符号化信号を抽出するステップと、第2の波形符号化信号を復元された信号とインタリーブし、インタリーブされた信号を生成するステップとを更に含む。それから、インタリーブされた信号は、第1の波形符号化信号と結合される。
多数の変形物が同様に存在する。例えば、第1のクロスオーバ周波数は、オーディオ処理システムのビット伝送速度によって決まり得るとともに、インタリーブするステップは、(i)第2の波形符号化信号を復元された信号と加算するステップ、(ii)第2の波形符号化信号を復元された信号と結合するステップ、又は(iii)復元された信号を第2の波形符号化信号と置き換えるステップを含み得る。インタリーブされた信号を第1の波形符号化信号と結合するステップは、周波数領域において実行され得るか、又は第2のクロスオーバ周波数においてパラメトリック復号を実行し、復元された信号を生成するステップは、周波数領域において実行され得る。パラメトリック復号は、(i)アップミックスパラメータを使用するパラメトリックアップミキシング、又は(ii)スペクトル帯域複製(SBR)のような、高周波復元パラメータを使用する高周波復元のいずれかを含み得る。当該方法は、インタリーブされた信号を生成するためにインタリーブするステップの間に使用される制御信号を受信するステップを更に含み得る。制御信号は、インタリーブするステップに対して周波数範囲又は時間範囲のいずれかを指定することによって、第2の波形符号化信号を復元された信号とどのようにインタリーブするかを示し得る。制御信号の第1の値は、インタリーブするステップがそれぞれの周波数範囲に対して実行されるということを示し得る。インタリーブするステップは、同様に、結合するステップより前に実行され得る。インタリーブするステップ及び結合するステップは、同様に、単一のステージ又は動作に結合され得る。第1の波形符号化信号及び第2の波形符号化信号は、周波数又は時間領域におけるオーディオ信号の波形を表す信号を含み得る。
「符号器の概観」
第2の態様によれば、実例の実施例は、入力信号に基づいてマルチチャネルオーディオ信号を符号化するための方法、装置、及びコンピュータプログラム製品を提案する。
第2の態様によれば、実例の実施例は、入力信号に基づいてマルチチャネルオーディオ信号を符号化するための方法、装置、及びコンピュータプログラム製品を提案する。
提案された方法、装置、及びコンピュータプログラム製品は、一般に、同じ特徴及び利点を有し得る。
上記の復号器の概観で提示された特徴及び構成に関する利点は、一般に、符号器のための対応する特徴及び構成に有効であり得る。
実例の実施例によれば、M個(M>2)のチャネルを符号化するための、マルチチャネルオーディオ処理システムに適した符号器が提供される。
符号器は、符号化されるべきM個のチャネルに対応するM個の信号を受信するように構成される受信ステージを含む。
符号器は、M個の信号を受信ステージから受信するとともに、第1のクロスオーバ周波数までの周波数に対応する周波数範囲に関してM個の信号を個別に波形符号化することにより、第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含むM個の波形符号化信号を生成するように構成される第1の波形符号化ステージを更に含む。
符号器は、M個の信号を受信ステージから受信するとともに、M個の信号をN個(1<N<M)のダウンミックス信号へダウンミックスするように構成されるダウンミキシングステージを更に含む。
符号器は、N個のダウンミックス信号をダウンミキシングステージから受信するとともに、N個のダウンミックス信号に高周波復元符号化を行うように構成される高周波復元符号化ステージであって、第2のクロスオーバ周波数より上のN個のダウンミックス信号の高周波復元を可能にする高周波復元パラメータを抽出するように構成される高周波復元符号化ステージを更に含む。
符号器は、M個の信号を受信ステージから受信するとともに、N個のダウンミックス信号をダウンミキシングステージから受信し、第1のクロスオーバ周波数より上の周波数に対応する周波数範囲に関してM個の信号にパラメトリック符号化を行うように構成されるパラメトリック符号化ステージであって、第1のクロスオーバ周波数より上の周波数範囲に関してM個のチャネルに対応するM個の復元された信号へのN個のダウンミックス信号のアップミキシングを可能にするアップミックスパラメータを抽出するように構成されるパラメトリック符号化ステージを更に含む。
符号器は、N個のダウンミックス信号をダウンミキシングステージから受信するとともに、第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応する周波数範囲に関してN個のダウンミックス信号を波形符号化することによりN個の波形符号化ダウンミックス信号を生成するように構成される第2の波形符号化ステージであって、N個の波形符号化ダウンミックス信号が第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含む、第2の波形符号化ステージを更に含む。
一実施例によれば、高周波復元符号化ステージにおいてN個のダウンミックス信号に高周波復元符号化を行うことは、周波数領域において、好ましくは直交ミラーフィルタ(QMF)領域において実行される。
更なる実施例によれば、パラメトリック符号化ステージにおいてM個の信号にパラメトリック符号化を行うことは、周波数領域において、好ましくは直交ミラーフィルタ(QMF)領域において実行される。
さらに別の実施例によれば、第1の波形符号化ステージにおいてM個の信号を個別に波形符号化することによりM個の波形符号化信号を生成することは、M個の信号にオーバーラップウィンドウ化変換を適用することを含み、異なるオーバーラップウィンドウシーケンス(overlapping window sequence)がM個の信号のうちの少なくとも2つのために使用される。
実施例によれば、符号器は、第1のクロスオーバ周波数より上の周波数範囲のサブセットに対応する周波数範囲に関してM個の信号のうちの1つを波形符号化することにより、更なる波形符号化信号を生成するように構成される第3の波形符号化ステージを更に含む。
実施例によれば、符号器は、制御信号生成ステージを含み得る。制御信号生成ステージは、復号器において更なる波形符号化信号をM個の信号のうちの1つのパラメトリック復元物(parametric reconstruction)とどのようにインタリーブするかを示す制御信号を生成するように構成される。例えば、制御信号は、更なる波形符号化信号がM個のアップミックス信号のうちの1つとインタリーブされるべきである周波数範囲及び時間範囲を示し得る。
「実例の実施例」
図1は、M個の符号化されたチャネルを復元するための、マルチチャネルオーディオ処理システムにおける復号器100の一般化された構成図である。復号器100は、図2から図4と関連してさらに詳細に説明されることになる3つの概念的な要素200、300、400を備える。第1の概念的な要素200において、復号器は、復号されるべきマルチチャネルオーディオ信号を表しているN個の波形符号化ダウンミックス信号及びM個の波形符号化信号を受信し、ここで1<N<Mである。例示された実例において、Nは2にセットされる。第2の概念的な要素300において、M個の波形符号化信号は、ダウンミックスされ、そしてN個の波形符号化ダウンミックス信号と結合される。高周波復元(HFR)が、その場合に、結合されたダウンミックス信号のために実行される。第3の概念的な要素400において、高周波復元された信号は、アップミックスされ、そしてM個の波形符号化信号は、M個の符号化されたチャネルを復元するために、アップミックス信号と結合される。
図1は、M個の符号化されたチャネルを復元するための、マルチチャネルオーディオ処理システムにおける復号器100の一般化された構成図である。復号器100は、図2から図4と関連してさらに詳細に説明されることになる3つの概念的な要素200、300、400を備える。第1の概念的な要素200において、復号器は、復号されるべきマルチチャネルオーディオ信号を表しているN個の波形符号化ダウンミックス信号及びM個の波形符号化信号を受信し、ここで1<N<Mである。例示された実例において、Nは2にセットされる。第2の概念的な要素300において、M個の波形符号化信号は、ダウンミックスされ、そしてN個の波形符号化ダウンミックス信号と結合される。高周波復元(HFR)が、その場合に、結合されたダウンミックス信号のために実行される。第3の概念的な要素400において、高周波復元された信号は、アップミックスされ、そしてM個の波形符号化信号は、M個の符号化されたチャネルを復元するために、アップミックス信号と結合される。
図2から図4と関連して説明された代表的な実施例では、符号化された5.1サラウンド音声の復元が説明される。低周波効果信号(low frequency effect signal)は説明された実施例又は図面では言及されない、ということが注意されても良い。これは、あらゆる低周波効果が無視されることを意味しない。低周波効果(low frequency effect:Lfe)は、当業者によって良く知られているあらゆる適当な方法で、復元された5つのチャネルに加えられる。説明された復号器が、7.1又は9.1サラウンド音声のような他のタイプの符号化されたサラウンド音声に等しく十分に適している、ということが同じく注意されても良い。
図2は、図1における復号器100の第1の概念的な要素200を例示する。復号器は、2つの受信ステージ212、241を含む。第1の受信ステージ212において、ビットストリーム202は、2つの波形符号化ダウンミックス信号208a~bに復号されて逆量子化される。2つの波形符号化ダウンミックス信号208a~bのそれぞれは、第1のクロスオーバ周波数kyと第2のクロスオーバ周波数kxとの間の周波数に対応するスペクトル係数を含む。
第2の受信ステージ214において、ビットストリーム202は、5つの波形符号化信号210a~eに復号されて逆量子化される。5つの波形符号化信号210a~eのそれぞれは、第1のクロスオーバ周波数kyまでの周波数に対応するスペクトル係数を含む。
一例として、信号210a~eは、2つのチャネルペア成分と、センターのための1つの単一チャネル成分とを含む。チャネルペア成分は、例えば、左前信号と左サラウンド信号の組み合わせ、及び右前信号と右サラウンド信号の組み合わせであり得る。更なる実例は、左前信号と右前信号の組み合わせ、及び左サラウンド信号と右サラウンド信号の組み合わせである。これらのチャネルペア成分は、例えば、和と差(sum-and-difference)のフォーマットにおいて符号化され得る。5つの信号210a~eの全ては、独立したウィンドウ処理によるオーバーラップウィンドウ化変換を使用して符号化されることができ、それでもやはり復号器により復号可能である。これは、改良された符号化品質、そしてしたがって、復号された信号の品質向上を可能にし得る。
一例として、第1のクロスオーバ周波数kyは、1.1kHzである。一例として、第2のクロスオーバ周波数kxは、5.6~8kHzの範囲内にある。第1のクロスオーバ周波数kyは、たとえ個別の信号に基づいていても、変化することがあり、すなわち、符号器は、特定の出力信号における信号成分がステレオのダウンミックス信号208a~bにより忠実に再現されないかもしれないことを検知することができ、そして、信号成分の適切な波形符号化を実行するために、その特定の時間インスタンスの間、帯域幅、すなわち、関連する波形符号化信号、すなわち210a~eの第1のクロスオーバ周波数kyを増やすことができる、ということが注意されるべきである。
この記述におけるあとの方で説明されることになるように、復号器100の残りのステージは、概して、直交ミラーフィルタ(Quadrature Mirror Filter:QMF)領域において動作する。この理由のために、第1及び第2の受信ステージ212、214により、修正離散的コサイン変換(modified discrete cosine transform:MDCT)形式で受信される信号208a~b、210a~eのそれぞれは、逆MDCT216を適用することにより時間領域に変換される。各信号は、その場合に、QMF変換218を適用することにより、もとの周波数領域に変換される。
図3において、5つの波形符号化信号210は、ダウンミックスステージ308において、第1のクロスオーバ周波数kyまでの周波数に対応するスペクトル係数を含む2つのダウンミックス信号310、312へダウンミックスされる。これらのダウンミックス信号310、312は、図2において示される2つのダウンミックス信号208a~bを作成するための符号器で使用されたのと同じダウンミキシングスキームを使用して、ローパスマルチチャネル信号210a~eに対してダウンミックスを実行することにより、形成され得る。
2つの新しいダウンミックス信号310、312は、次に、結合されたダウンミックス信号302a~bを形成するように、第1の結合ステージ320、322において、対応するダウンミックス信号208a~bと結合される。したがって、結合されたダウンミックス信号302a~bのそれぞれは、ダウンミックス信号310、312が起源である第1のクロスオーバ周波数kyまでの周波数に対応するスペクトル係数と、第1の受信ステージ212(図2において示される)において受信される2つの波形符号化ダウンミックス信号208a~bが起源である第1のクロスオーバ周波数kyと第2のクロスオーバ周波数kxとの間の周波数に対応するスペクトル係数とを含む。
復号器は、高周波復元(HFR)ステージ314を更に含む。HFRステージは、高周波復元を実行することにより、結合ステージからの2つの結合されたダウンミックス信号302a~bのそれぞれを第2のクロスオーバ周波数kxより上の周波数範囲に拡張するように構成される。いくつかの実施例によれば、実行される高周波復元は、スペクトル帯域複製(SBR)を実行することを含む。高周波復元は、あらゆる適当な方法でHFRステージ314により受信され得る高周波復元パラメータを使用することにより実行され得る。
高周波復元ステージ314からの出力は、適用されたHFR拡張部分316、318を有するダウンミックス信号208a~bを含む2つの信号304a~bである。上記で説明されたように、HFRステージ314は、2つのダウンミックス信号208a~bと結合される第2の受信ステージ214(図2において示される)からの入力信号210a~eに存在する周波数に基づいて、高周波復元を実行することになる。幾分単純化されて、HFR範囲316、318は、HFR範囲316、318までコピーされたダウンミックス信号310、312からのスペクトル係数の部分を含む。したがって、5つの波形符号化信号210a~eの部分は、HFRステージ314からの出力304のHFR範囲316、318に現れることになる。
高周波復元ステージ314より前のダウンミキシングステージ308におけるダウンミキシング及び第1の結合ステージ320、322における結合は、時間領域において、すなわち、逆修正離散的コサイン変換(MDCT)216(図2において示される)を適用することにより各信号が時間領域に変換されたあとで、実行されることができる、ということが注意されるべきである。しかしながら、もし、波形符号化信号210a~e及び波形符号化ダウンミックス信号208a~bが、波形符号器により、独立したウィンドウ処理によるオーバーラップウィンドウ化変換を使用して符号化される可能性があるならば、信号210a~eと信号208a~bは、時間領域においてシームレスに結合されないかもしれない。したがって、もし少なくとも第1の結合ステージ320、322における結合がQMF領域において実行されるならば、より良く制御されたシナリオが実現される。
図4は、復号器100の第3及び最後の概念的な要素400を例示する。HFRステージ314からの出力304は、アップミックスステージ402への入力を構成する。アップミックスステージ402は、周波数が拡張された信号304a~bにパラメトリックアップミックスを実行することにより、5つの信号出力404a~eを作成する。5つのアップミックス信号404a~eのそれぞれは、第1のクロスオーバ周波数kyより上の周波数に対する符号化された5.1のサラウンド音声における5つの符号化されたチャネルのうちの1つに対応する。代表的なパラメトリックアップミックス手順によれば、アップミックスステージ402は、最初にパラメトリックミキシングパラメータを受信する。アップミックスステージ402は、周波数拡張された2つの結合されたダウンミックス信号304a~bの無相関化されたバージョンを更に生成する。アップミックスステージ402は、周波数拡張された2つの結合されたダウンミックス信号304a~b、及び周波数拡張された2つの結合されたダウンミックス信号304a~bの無相関化されたバージョンに行列演算を更に行い、ここで、行列演算のパラメータは、アップミックスパラメータにより与えられる。その代りに、当該技術において知られているあらゆる他のパラメトリックアップミックス手順が適用され得る。適用可能なパラメトリックアップミキシング手順は、例えば、“MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding”(“Herre”等、Journal of the Audio Engineering Society、Vol. 56、No. 11、2008年11月)において説明される。
したがって、アップミックスステージ402からの出力404a~eは、第1のクロスオーバ周波数kyより下の周波数を含まない。第1のクロスオーバ周波数kyまでの残りの周波数に対応するスペクトル係数は、遅延ステージ412によりアップミックス信号404のタイミングに適合するように遅延された5つの波形符号化信号210a~eに存在する。
復号器100は、第2の結合ステージ416、418を更に含む。第2の結合ステージ416、418は、5つのアップミックス信号404a~eを、第2の受信ステージ214(図2において示される)により受信された5つの波形符号化信号210a~eと結合するように構成される。
あらゆる現在のLfe信号が、結果として生じる結合された信号422に別個の信号として加えられ得る、ということが注意されても良い。信号422のそれぞれは、次に、逆QMF変換414を適用することにより時間領域に変換される。したがって、逆QMF変換414からの出力は、完全に復号された5.1チャネルオーディオ信号になる。
図6は、復号システム100の改良版である復号システム100’を例示する。復号システム100’は、図1の概念的な要素200、300、及び400に対応する概念的な要素200’、300’、及び400’を有する。図6の復号システム100’と図1の復号システムとの間の差異は、概念的な要素200’に第3の受信ステージ616が存在し、そして第3の概念的な要素400’にインタリービングステージ714が存在する、ということである。
第3の受信ステージ616は、更なる波形符号化信号を受信するように構成される。更なる波形符号化信号は、第1のクロスオーバ周波数より上の周波数のサブセットに対応するスペクトル係数を含む。更なる波形符号化信号は、逆MDCT216を適用することにより、時間領域に変換され得る。その場合に、それは、QMF変換218を適用することにより、もとの周波数領域に変換され得る。
更なる波形符号化信号は別個の信号として受信され得る、ということが理解されるべきである。しかしながら、更なる波形符号化信号は、同様に、5つの波形符号化信号210a~eのうちの1つ又は複数の一部分を形成し得る。言い換えれば、更なる波形符号化信号は、例えば同じMDCT変換を使用して、5つの波形符号化信号210a~eのうちの1つ又は複数と一緒に符号化され得る。もしそうであるならば、第3の受信ステージ616は第2の受信ステージに対応し、すなわち、更なる波形符号化信号は、第2の受信ステージ214によって5つの波形符号化信号210a~eと一緒に受信される。
図7は、図6の復号器100’の第3の概念的な要素300’を更に詳細に例示する。高周波数拡張されたダウンミックス信号304a~b、及び5つの波形符号化信号210a~eに加えて、更なる波形符号化信号710が第3の概念的な要素400’に入力される。例示された実例において、更なる波形符号化信号710は、5つのチャネルのうちの第3のチャネルに対応する。更なる波形符号化信号710は、第1のクロスオーバ周波数kyから始まる周波数区間に対応するスペクトル係数を更に含む。しかしながら、更なる波形符号化信号710によりカバーされる第1のクロスオーバ周波数より上の周波数範囲のサブセットの形式は、もちろん異なる実施例では変化し得る。複数の波形符号化信号710a~eが受信されることができ、異なる波形符号化信号は異なる出力チャネルに対応し得る、ということが同様に注意されるべきである。複数の更なる波形符号化信号710a~eによりカバーされる周波数範囲のサブセットは、複数の更なる波形符号化信号710a~eのうちの異なる信号の間で変化し得る。
更なる波形符号化信号710は、アップミックスステージ402から出力されるアップミックス信号404のタイミングに適合するように、遅延ステージ712により遅延され得る。アップミックス信号404、及び更なる波形符号化信号710は、次に、インタリーブステージ714に入力される。インタリーブステージ714は、インタリーブされた信号704を生成するために、アップミックス信号404を更なる波形符号化信号710とインタリーブ、すなわち結合する。本実例において、インタリービングステージ714は、したがって、第3のアップミックス信号404cを更なる波形符号化信号710とインタリーブする。インタリーブすることは、2つの信号を一緒に加えることにより実行され得る。しかしながら、概して、インタリーブすることは、信号が重なる周波数範囲及び時間範囲において、アップミックス信号404を更なる波形符号化信号710と交換することにより実行される。
インタリーブされた信号704は、次に、第2の結合ステージ416、418に入力され、ここで、インタリーブされた信号704は、出力信号722を生成するために、図4を参照して説明されたのと同じ方法で波形符号化信号201a~eと結合される。結合がインタリーブすることの前に行われるように、インタリーブステージ714と第2の結合ステージ416、418の順序は逆転されるかもしれない、ということが注意されるべきである。
さらに、更なる波形符号化信号710が5つの波形符号化信号210a~eのうちの1つ又は複数の一部分を形成する状況において、第2の結合ステージ416、418、及びインタリーブステージ714は、単一のステージに結合され得る。具体的には、そのような結合されたステージは、第1のクロスオーバ周波数kyまでの周波数に対する5つの波形符号化信号210a~eのスペクトル成分を使用するであろう。第1のクロスオーバ周波数より上の周波数に対して、結合されたステージは、更なる波形符号化信号710とインタリーブされたアップミックス信号404を使用するであろう。
インタリーブステージ714は、制御信号の制御下で動作し得る。この目的のために、復号器100’は、例えば第3の受信ステージ616を通して、更なる波形符号化信号をM個のアップミックス信号のうちの1つとどのようにインタリーブするかを示す制御信号を受信し得る。例えば、制御信号は、更なる波形符号化信号710がアップミックス信号404のうちの1つとインタリーブされるべきである周波数範囲及び時間範囲を示し得る。例えば、周波数範囲及び時間範囲は、インタリーブすることが実行されるべきである時間/周波数タイルに関して表され得る。時間/周波数タイルは、インタリーブすることが実行されるQMF領域の時間/周波数グリッドに関しての時間/周波数タイルであり得る。
制御信号は、インタリーブすることが実行されるべきである時間/周波数タイルを示すために、バイナリベクトルのようなベクトルを使用し得る。具体的には、インタリーブすることが実行されるべきである周波数を示している、周波数指示に関する第1のベクトルが存在し得る。指示は、例えば、第1のベクトルにおいて、対応する周波数区間に対して論理1を示すことにより行われ得る。インタリーブすることが実行されるべきである時間区間を示している、時間指示に関する第2のベクトルが同様に存在し得る。指示は、例えば、第2のベクトルにおいて、対応する時間区間に対して論理1を示すことにより行われ得る。この目的のために、時間指示がサブフレーム基準で行われ得るように、時間フレームは、概して、複数の時間スロットに分割される。第1及び第2のベクトルをインターセクト(intersect)することにより、時間/周波数マトリクスが構築され得る。例えば、時間/周波数マトリクスは、第1及び第2のベクトルが論理1を示す各時間/周波数タイルに対する論理1を含むバイナリマトリクスであり得る。インタリーブステージ714は、その場合に、例えば、時間/周波数マトリクスにおいて例えば論理1などにより示された時間/周波数タイルに関して、アップミックス信号404のうちの1つ又は複数が更なる波形符号化信号710により置き換えられるように、インタリーブすることを実行することに関して、時間/周波数マトリクスを使用し得る。
ベクトルは、インタリーブすることが実行されるべきである時間/周波数タイルを示すためにバイナリスキームよりむしろ他のスキームを使用し得る、ということが注意される。例えば、ベクトルは、ゼロのような第1の値を用いて、インタリーブすることが実行されるべきではないことを示すとともに、第2の値を用いて、インタリーブすることが、第2の値により識別される特定のチャネルに関して実行されるべきであることを示すであろう。
図5は、一例として、一実施例による、M個のチャネルを符号化するための、マルチチャネルオーディオ処理システムに適した符号化システム500の一般化された構成図を示す。
図5において説明された代表的な実施例において、5.1サラウンド音声の符号化が説明される。したがって、例示された実例において、Mは5にセットされる。説明された実施例において、又は図面において、低周波効果信号は言及されない、ということが注意されても良い。これは、あらゆる低周波効果が無視されることを意味しない。低周波効果(Lfe)は、当業者によって良く知られているあらゆる適当な方法で、ビットストリーム552に加えられる。説明された符号器が、7.1又は9.1サラウンド音声のような他のタイプのサラウンド音声を符号化することに等しく十分に適している、ということが同じく注意されても良い。符号器500において、5つの信号502、504は、受信ステージ(図示せず)において受信される。符号器500は、受信ステージから5つの信号502、504を受信し、5つの信号502、504を個別に波形符号化することにより、5つの波形符号化信号518を生成するように構成される第1の波形符号化ステージ506を含む。波形符号化ステージ506は、例えば、5つの受信された信号502、504のそれぞれにMDCT変換を行い得る。復号器に関して論じられたように、符号器は、5つの受信された信号502、504のそれぞれを、独立したウィンドウ処理によるMDCT変換を使用して符号化することを選択し得る。これは、改良された符号化品質、そしてしたがって、復号された信号の品質向上を可能にし得る。
5つの波形符号化信号518は、第1のクロスオーバ周波数までの周波数に対応する周波数範囲に関して波形符号化される。したがって、5つの波形符号化信号518は、第1のクロスオーバ周波数までの周波数に対応するスペクトル係数を含む。これは、5つの波形符号化信号518のそれぞれにローパスフィルタ処理を行うことにより獲得され得る。5つの波形符号化信号518は、その場合に、心理音響モデル(psychoacoustic model)に従って量子化520される。心理音響モデルは、できる限り正確に、マルチチャネルオーディオ処理システムで利用可能なビットレートを考察し、システムの復号器側で復号される場合に聞き手により知覚される符号化された信号を再現するように構成される。
上記で論じられたように、符号器500は、離散的マルチチャネル符号化及びパラメトリック符号化を含むハイブリッド符号化を実行する。離散的マルチチャネル符号化は、上記で説明されたように、波形符号化ステージ506において、第1のクロスオーバ周波数までの周波数に関して、入力信号502、504のそれぞれに対して実行される。パラメトリック符号化は、復号器側で、第1のクロスオーバ周波数より上の周波数に関して、N個のダウンミックス信号から5つの入力信号502、504を復元することができるように、実行される。図5における例示された実例において、Nは2にセットされる。5つの入力信号502、504のダウンミキシングは、ダウンミキシングステージ534において実行される。ダウンミキシングステージ534は、QMF領域において有利に動作する。したがって、ダウンミキシングステージ534に入力される前に、QMF分析ステージ526により、5つの信号502、504はQMF領域に変換される。ダウンミキシングステージは、5つの信号502、504に線形ダウンミキシング動作を実行し、2つのダウンミックス信号544、546を出力する。
これらの2つのダウンミックス信号544、546は、逆QMF変換554が行われることによりそれらがもとの時間領域に変換されたあとで、第2の波形符号化ステージ508により受信される。第2の波形符号化ステージ508は、第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応する周波数範囲に関して、2つのダウンミックス信号544、546を波形符号化することにより、2つの波形符号化ダウンミックス信号を生成することになる。波形符号化ステージ508は、例えば、2つのダウンミックス信号のそれぞれにMDCT変換を行い得る。したがって、2つの波形符号化ダウンミックス信号は、第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含む。2つの波形符号化ダウンミックス信号は、次に、心理音響モデルに従って量子化522される。
復号器側で第2のクロスオーバ周波数より上の周波数を復元することを可能にするために、高周波復元(HFR)パラメータ538が、2つのダウンミックス信号544、546から抽出される。これらのパラメータは、HFR符号化ステージ532において抽出される。
復号器側で2つのダウンミックス信号544、546から5つの信号を復元することを可能にするために、5つの入力信号502、504がパラメトリック符号化ステージ530により受信される。5つの信号502、504は、第1のクロスオーバ周波数より上の周波数に対応する周波数範囲に関して、パラメトリック符号化が行われる。パラメトリック符号化ステージ530は、その場合に、第1のクロスオーバ周波数より上の周波数範囲に関して、5つの入力信号502、504(すなわち、符号化された5.1サラウンド音声における5つのチャネル)に対応する5つの復元された信号への、2つのダウンミックス信号544、546のアップミキシングを可能にするアップミックスパラメータ536を抽出するように構成される。アップミックスパラメータ536は、第1のクロスオーバ周波数より上の周波数のためだけに抽出される、ということが注意されても良い。これは、パラメトリック符号化ステージ530の複雑さ、及び対応するパラメトリックデータのビットレートを低減し得る。
ダウンミキシング534は、時間領域において達成されることができる、ということが注意されても良い。そのような場合に、HFR符号化ステージ532は、概して、QMF領域において動作するので、QMF分析ステージ526は、ダウンミキシングステージ534の下流で、HFR符号化ステージ532より前に配置されるべきである。この場合、逆QMFステージ554は省略されることができる。
符号器500は、ビットストリーム生成ステージ、すなわちビットストリームマルチプレクサ524を更に含む。符号器500の代表的な実施例によれば、ビットストリーム生成ステージは、5つの符号化及び量子化された信号548、2つのパラメータ信号536、538、及び2つの符号化及び量子化されたダウンミックス信号550を受信するように構成される。これらは、マルチチャネルオーディオシステムにおいて更に分配されるように、ビットストリーム生成ステージ524によりビットストリーム552に変換される。
説明されたマルチチャネルオーディオシステムでは、例えばインターネット上でオーディオをストリーミングする場合に、最大の利用可能なビットレートがしばしば存在する。入力信号502、504の各時間フレームの特性が異なるので、5つの波形符号化信号548と2つのダウンミックス波形符号化信号550との間でビットの正確な同じ割り当ては使用されないかもしれない。さらに、各個別の信号548及び550は、信号が心理音響モデルに従って復元され得るように、より多い又はより少ない割り当てられたビットを必要とするかもしれない。代表的な実施例によれば、第1及び第2の波形符号化ステージ506、508は、共通のビット貯蔵器を共有する。符号化されたフレーム当たりの利用可能なビットは、最初に、符号化されるべき信号の特性及び現在の心理音響モデルに応じて、第1及び第2の波形符号化ステージ506、508の間で分配される。上記で説明されたように、ビットは、その場合に、個別の信号548、550の間で分配される。高周波復元パラメータ538、及びアップミックスパラメータ536のために使用されるビットの数は、当然ながら、利用可能なビットを分配する場合に考慮される。第1のクロスオーバ周波数の周辺における知覚的に滑らかな遷移のために、特定の時間フレームにおいて割り当てられたビットの数に関して、第1及び第2の波形符号化ステージ506、508のための心理音響モデルを調整するように、注意が払われる。
図8は、符号化システム800の代替実施例を例示する。図8の符号化システム800と図5の符号化システム500との間の差異は、符号器800が、第1のクロスオーバ周波数より上の周波数範囲のサブセットに対応する周波数範囲に関して、入力信号502、504のうちの1つ又は複数を波形符号化することにより、更なる波形符号化信号を生成するように準備される、ということである。
この目的のために、符号器800は、インタリーブ検出ステージ802を含む。インタリーブ検出ステージ802は、パラメトリック符号化ステージ530及び高周波復元符号化ステージ532により符号化されたパラメトリック復元物(parametric reconstruction)によってうまく復元されない入力信号502、504の部分を識別するように構成される。例えば、インタリーブ検出ステージ802は、入力信号502、504を、パラメトリック符号化ステージ530及び高周波復元符号化ステージ532により定義される入力信号502、504のパラメトリック復元物と比較し得る。比較に基づいて、インタリーブ検出ステージ802は、波形符号化されるべき、第1のクロスオーバ周波数より上の周波数範囲のサブセット804を識別し得る。インタリーブ検出ステージ802は、同様に、第1のクロスオーバ周波数より上の周波数範囲の識別されたサブセット804が波形符号化されるべき時間範囲を識別し得る。識別された周波数及び時間サブセット804、806は、第1の波形符号化ステージ506に入力され得る。受信された周波数及び時間サブセット804及び806に基づいて、第1の波形符号化ステージ506は、サブセット804、806により識別された時間範囲及び周波数範囲に関して、入力信号502、504のうちの1つ又は複数を波形符号化することにより、更なる波形符号化信号808を生成する。更なる波形符号化信号808は、次に、ステージ520により符号化及び量子化され得るとともに、ビットストリーム846に加えられ得る。
インタリーブ検出ステージ802は、制御信号生成ステージを更に含み得る。制御信号生成ステージは、復号器において更なる波形符号化信号を入力信号502、504のうちの1つのパラメトリック復元物とどのようにインタリーブするかを示す制御信号810を生成するように構成される。図7を参照して説明されたように、例えば、制御信号は、更なる波形符号化信号がパラメトリック復元物とインタリーブされるべきである周波数範囲及び時間範囲を示し得る。制御信号は、ビットストリーム846に加えられ得る。
「等価物、拡張物、代替物、及びその他の物」
本開示の更なる実施例は、上記の記述を検討したあとで当業者には明白になるであろう。本記述及び図面が実施例及び実例を開示するとしても、本開示は、これらの特定の実例に限定されない。多くの修正及び変更が、添付の請求項により定義される本開示の範囲からはずれずに行われ得る。請求項に現れる引用符号は、それらの範囲を限定するものとして理解されるべきではない。
本開示の更なる実施例は、上記の記述を検討したあとで当業者には明白になるであろう。本記述及び図面が実施例及び実例を開示するとしても、本開示は、これらの特定の実例に限定されない。多くの修正及び変更が、添付の請求項により定義される本開示の範囲からはずれずに行われ得る。請求項に現れる引用符号は、それらの範囲を限定するものとして理解されるべきではない。
さらに、開示された実施例に対する変形物は、図面、本開示、及び添付された請求項の検討から、本開示を実践する際に当業者により理解されて達成されることができる。請求項において、“備える(comprising)”という単語は、他の要素又はステップを除外しないとともに、不定冠詞“a”又は“an”は、複数を除外しない。特定の手段が相互に異なる従属請求項において暗唱されるという単なる事実は、これらの手段の組み合わせが有効に使用されることができないことを示さない。
上記において開示されたシステム及び方法は、ソフトウェア、ファームウェア、ハードウェア、又はそれらの組み合わせとして実施されても良い。ハードウェア実装では、上記の記述で言及される機能ユニットの間のタスクの分割は、必ずしも物理的なユニットへの分割に対応するものではなく、逆に、一つの物理的なコンポーネントが複数の機能を有していても良く、そして一つのタスクが協働するいくつかの物理的コンポーネントにより実行されても良い。特定のコンポーネント若しくは全てのコンポーネントは、デジタル信号プロセッサ若しくはマイクロプロセッサにより実行されるソフトウェアとして実施されても良く、又は、ハードウェアとして、若しくは特定用途向け集積回路として実施されても良い。そのようなソフトウェアは、コンピュータ記憶媒体(又は非一時的媒体)及び通信媒体(又は一時的媒体)を含み得るコンピュータ読み取り可能媒体により頒布されても良い。当業者には良く知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータのような情報の記憶のための任意の方法または技術で実施された、揮発性及び不揮発性媒体、取り外し可能及び取り外し不可能媒体の両方の媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリ若しくは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)若しくは他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置若しくは他の磁気記憶デバイス、又は、所望される情報を記憶するために使用されることができるとともに、コンピュータによりアクセスされることができる他の任意の媒体を含むが、これらに限定されない。さらに、当業者には、通信媒体が、概して、コンピュータ可読命令、データ構造、プログラムモジュール、又は他のデータを、搬送波のような変調されたデータ信号、又は他の転送手段において具現するとともに、任意の情報配信媒体を含むことは、良く知られている。
Claims (2)
- M個(M>2)の符号化されたチャネルを復元するための、マルチチャネルオーディオ処理システムにおける復号方法であって、
第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含むN個(N<M)の波形符号化ダウンミックス信号を受信するステップと、
前記M個の符号化されたチャネルのうちのそれぞれのチャネルに対応する、スペクトル係数を含むM個の波形符号化信号を受信するステップと、
周波復元を実行することによりN個の復元されたダウンミックス信号を決定するステップであって、前記周波復元は、前記N個の波形符号化ダウンミックス信号に基づいて、前記第2のクロスオーバ周波数より上の周波数範囲に対応する、前記N個の復元されたダウンミックス信号を決定することを含む、ステップと、
M個のアップミックス信号への、前記N個の周波復元されたダウンミックス信号のパラメトリックアップミックスを実行するステップと、
前記M個のアップミックス信号を、前記M個の波形符号化信号とインタリーブするステップとを含む、復号方法。 - M個(M>2)の符号化されたチャネルを復元するための、マルチチャネルオーディオ処理システムにおける復号器であって、
第1のクロスオーバ周波数と第2のクロスオーバ周波数との間の周波数に対応するスペクトル係数を含むN個(N<M)の波形符号化ダウンミックス信号を受信するよう構成された第一の受信段と、
前記M個の符号化されたチャネルのうちのそれぞれのチャネルに対応する、スペクトル係数を含むM個の波形符号化信号を受信するよう構成された第二の受信段と、
周波復元を実行することによりN個の復元されたダウンミックス信号を決定するよう構成された周波復元段であって、前記周波復元は、前記N個の波形符号化ダウンミックス信号に基づいて、前記第2のクロスオーバ周波数より上の周波数範囲に対応する、前記N個の復元されたダウンミックス信号を決定することを含む、周波復元段と、
M個のアップミックス信号への、前記N個の周波復元されたダウンミックス信号のパラメトリックアップミックスを実行するよう構成された、前記周波復元段の下流のアップミックス段と、
前記アップミックス段からの前記M個のアップミックス信号を、前記第二の受信段からの前記M個の波形符号化信号とインタリーブするよう構成された、前記アップミックス段および前記第二の受信段の下流のインタリーバ段とを有する、復号器。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022027834A JP7413418B2 (ja) | 2013-04-05 | 2022-02-25 | 信号をインタリーブするためのオーディオ復号器 |
JP2023220177A JP2024038139A (ja) | 2013-04-05 | 2023-12-27 | 信号をインタリーブするためのオーディオ復号器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361808680P | 2013-04-05 | 2013-04-05 | |
US61/808,680 | 2013-04-05 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019104477A Division JP6808781B2 (ja) | 2013-04-05 | 2019-06-04 | 信号をインタリーブするためのオーディオ復号器 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022027834A Division JP7413418B2 (ja) | 2013-04-05 | 2022-02-25 | 信号をインタリーブするためのオーディオ復号器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021047450A JP2021047450A (ja) | 2021-03-25 |
JP7033182B2 true JP7033182B2 (ja) | 2022-03-09 |
Family
ID=50439393
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558506A Active JP6031201B2 (ja) | 2013-04-05 | 2014-04-04 | オーディオ符号器及び復号器 |
JP2016206760A Active JP6377110B2 (ja) | 2013-04-05 | 2016-10-21 | 信号をインタリーブするためのオーディオ復号器 |
JP2018138533A Active JP6537683B2 (ja) | 2013-04-05 | 2018-07-24 | 信号をインタリーブするためのオーディオ復号器 |
JP2019104477A Active JP6808781B2 (ja) | 2013-04-05 | 2019-06-04 | 信号をインタリーブするためのオーディオ復号器 |
JP2020203849A Active JP7033182B2 (ja) | 2013-04-05 | 2020-12-09 | 信号をインタリーブするためのオーディオ復号器 |
JP2022027834A Active JP7413418B2 (ja) | 2013-04-05 | 2022-02-25 | 信号をインタリーブするためのオーディオ復号器 |
JP2023220177A Pending JP2024038139A (ja) | 2013-04-05 | 2023-12-27 | 信号をインタリーブするためのオーディオ復号器 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015558506A Active JP6031201B2 (ja) | 2013-04-05 | 2014-04-04 | オーディオ符号器及び復号器 |
JP2016206760A Active JP6377110B2 (ja) | 2013-04-05 | 2016-10-21 | 信号をインタリーブするためのオーディオ復号器 |
JP2018138533A Active JP6537683B2 (ja) | 2013-04-05 | 2018-07-24 | 信号をインタリーブするためのオーディオ復号器 |
JP2019104477A Active JP6808781B2 (ja) | 2013-04-05 | 2019-06-04 | 信号をインタリーブするためのオーディオ復号器 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022027834A Active JP7413418B2 (ja) | 2013-04-05 | 2022-02-25 | 信号をインタリーブするためのオーディオ復号器 |
JP2023220177A Pending JP2024038139A (ja) | 2013-04-05 | 2023-12-27 | 信号をインタリーブするためのオーディオ復号器 |
Country Status (21)
Country | Link |
---|---|
US (6) | US9489957B2 (ja) |
EP (3) | EP3627506B1 (ja) |
JP (7) | JP6031201B2 (ja) |
KR (7) | KR102380370B1 (ja) |
CN (2) | CN109410966B (ja) |
AU (1) | AU2014247001B2 (ja) |
BR (7) | BR122017006819B1 (ja) |
CA (1) | CA2900743C (ja) |
DK (1) | DK2954519T3 (ja) |
ES (2) | ES2748939T3 (ja) |
HK (1) | HK1213080A1 (ja) |
HU (1) | HUE031660T2 (ja) |
IL (1) | IL240117A0 (ja) |
MX (4) | MX347936B (ja) |
MY (3) | MY183360A (ja) |
PL (1) | PL2954519T3 (ja) |
RU (2) | RU2602988C1 (ja) |
SG (1) | SG11201506139YA (ja) |
TW (1) | TWI546799B (ja) |
UA (1) | UA113117C2 (ja) |
WO (1) | WO2014161992A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
WO2015007774A1 (de) | 2013-07-18 | 2015-01-22 | Basf Se | Vereinzelung einer polyarylenetherlösung |
KR102244612B1 (ko) * | 2014-04-21 | 2021-04-26 | 삼성전자주식회사 | 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법 |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
WO2016204581A1 (ko) | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
WO2017125559A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling |
US10146500B2 (en) * | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
US10354667B2 (en) * | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
EP3588495A1 (en) | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010536299A (ja) | 2007-08-13 | 2010-11-25 | エルジー エレクトロニクス インコーポレイティド | リミキシング能力を有する向上したオーディオ |
Family Cites Families (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5459B2 (ja) | 1973-12-20 | 1979-01-05 | ||
IT1044736B (it) * | 1975-04-23 | 1980-04-21 | Cselt Centro Studi Lab Telecom | Sistema numerico per la trasmissione dei canali di due fasci modulati a impulsi codificati alla velocita di un solo fascio |
JP2000122679A (ja) * | 1998-10-15 | 2000-04-28 | Sony Corp | 音声帯域拡張方法及び装置、音声合成方法及び装置 |
JP3677185B2 (ja) * | 1999-11-29 | 2005-07-27 | 株式会社東芝 | 符号分割多重伝送方式と送信装置及び受信装置 |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US20030220800A1 (en) | 2002-05-21 | 2003-11-27 | Budnikov Dmitry N. | Coding multichannel audio signals |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
ATE527654T1 (de) * | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
BRPI0509100B1 (pt) | 2004-04-05 | 2018-11-06 | Koninl Philips Electronics Nv | Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal |
DE602005011439D1 (de) | 2004-06-21 | 2009-01-15 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen |
EP1768107B1 (en) * | 2004-07-02 | 2016-03-09 | Panasonic Intellectual Property Corporation of America | Audio signal decoding device |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
DE602006002501D1 (de) | 2005-03-30 | 2008-10-09 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
JP2006323037A (ja) * | 2005-05-18 | 2006-11-30 | Matsushita Electric Ind Co Ltd | オーディオ信号復号化装置 |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
WO2007046659A1 (en) * | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
EP1853092B1 (en) | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
CN101512639B (zh) * | 2006-09-13 | 2012-03-14 | 艾利森电话股份有限公司 | 用于语音/音频发送器和接收器的方法和设备 |
KR101435893B1 (ko) * | 2006-09-22 | 2014-09-02 | 삼성전자주식회사 | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
KR101405972B1 (ko) | 2007-07-02 | 2014-06-12 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
RU2443075C2 (ru) | 2007-10-09 | 2012-02-20 | Конинклейке Филипс Электроникс Н.В. | Способ и устройство для генерации бинаурального аудиосигнала |
EP2215629A1 (en) * | 2007-11-27 | 2010-08-11 | Nokia Corporation | Multichannel audio coding |
CA2708861C (en) | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
AU2008344132B2 (en) * | 2008-01-01 | 2012-07-19 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
AU2009221443B2 (en) * | 2008-03-04 | 2012-01-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for mixing a plurality of input data streams |
CN102089814B (zh) * | 2008-07-11 | 2012-11-21 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
ES2592416T3 (es) * | 2008-07-17 | 2016-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificación/decodificación de audio que tiene una derivación conmutable |
TWI413109B (zh) * | 2008-10-01 | 2013-10-21 | Dolby Lab Licensing Corp | 用於上混系統之解相關器 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
WO2010097748A1 (en) | 2009-02-27 | 2010-09-02 | Koninklijke Philips Electronics N.V. | Parametric stereo encoding and decoding |
KR101433701B1 (ko) * | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
ES2452569T3 (es) | 2009-04-08 | 2014-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase |
KR20110018107A (ko) | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
AU2010303039B9 (en) * | 2009-09-29 | 2014-10-23 | Dolby International Ab | Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
CN102257567B (zh) * | 2009-10-21 | 2014-05-07 | 松下电器产业株式会社 | 音响信号处理装置、音响编码装置及音响解码装置 |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
CA3097372C (en) * | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
EP3779975B1 (en) | 2010-04-13 | 2023-07-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction |
BR112013004362B1 (pt) | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
EP2477188A1 (en) | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
KR101742136B1 (ko) * | 2011-03-18 | 2017-05-31 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
FR2973551A1 (fr) | 2011-03-29 | 2012-10-05 | France Telecom | Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique |
WO2012146757A1 (en) | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
US9117440B2 (en) | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
US9166864B1 (en) * | 2012-01-18 | 2015-10-20 | Google Inc. | Adaptive streaming for legacy media frameworks |
EP3528249A1 (en) * | 2013-04-05 | 2019-08-21 | Dolby International AB | Stereo audio encoder and decoder |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
-
2014
- 2014-03-13 TW TW103109074A patent/TWI546799B/zh active
- 2014-04-04 MY MYPI2015702591A patent/MY183360A/en unknown
- 2014-04-04 KR KR1020217000152A patent/KR102380370B1/ko active IP Right Grant
- 2014-04-04 BR BR122017006819-9A patent/BR122017006819B1/pt active IP Right Grant
- 2014-04-04 KR KR1020177019979A patent/KR102094129B1/ko active IP Right Grant
- 2014-04-04 EP EP19187815.6A patent/EP3627506B1/en active Active
- 2014-04-04 PL PL14715308T patent/PL2954519T3/pl unknown
- 2014-04-04 CA CA2900743A patent/CA2900743C/en active Active
- 2014-04-04 BR BR122022004786-6A patent/BR122022004786B1/pt active IP Right Grant
- 2014-04-04 EP EP16203268.4A patent/EP3171361B1/en active Active
- 2014-04-04 KR KR1020227009866A patent/KR20220044609A/ko active Application Filing
- 2014-04-04 DK DK14715308.4T patent/DK2954519T3/en active
- 2014-04-04 RU RU2015136341/08A patent/RU2602988C1/ru active
- 2014-04-04 ES ES16203268T patent/ES2748939T3/es active Active
- 2014-04-04 UA UAA201508409A patent/UA113117C2/uk unknown
- 2014-04-04 BR BR112015019711-6A patent/BR112015019711B1/pt active IP Right Grant
- 2014-04-04 KR KR1020207022458A patent/KR102201951B1/ko active IP Right Grant
- 2014-04-04 MY MYPI2016001939A patent/MY185848A/en unknown
- 2014-04-04 BR BR122022004784A patent/BR122022004784B8/pt active Search and Examination
- 2014-04-04 CN CN201910025733.3A patent/CN109410966B/zh active Active
- 2014-04-04 KR KR1020247008382A patent/KR20240038819A/ko active Application Filing
- 2014-04-04 ES ES14715308.4T patent/ES2619117T3/es active Active
- 2014-04-04 MY MYPI2020000226A patent/MY196084A/en unknown
- 2014-04-04 HU HUE14715308A patent/HUE031660T2/en unknown
- 2014-04-04 SG SG11201506139YA patent/SG11201506139YA/en unknown
- 2014-04-04 US US14/772,001 patent/US9489957B2/en active Active
- 2014-04-04 CN CN201480011081.3A patent/CN105308680B/zh active Active
- 2014-04-04 BR BR122022004787-4A patent/BR122022004787B1/pt active IP Right Grant
- 2014-04-04 AU AU2014247001A patent/AU2014247001B2/en active Active
- 2014-04-04 BR BR122021004537-2A patent/BR122021004537B1/pt active IP Right Grant
- 2014-04-04 MX MX2015011145A patent/MX347936B/es active IP Right Grant
- 2014-04-04 RU RU2016141142A patent/RU2641265C1/ru active
- 2014-04-04 WO PCT/EP2014/056852 patent/WO2014161992A1/en active Application Filing
- 2014-04-04 EP EP14715308.4A patent/EP2954519B1/en active Active
- 2014-04-04 KR KR1020207007982A patent/KR102142837B1/ko active IP Right Grant
- 2014-04-04 KR KR1020157023507A patent/KR101763129B1/ko active IP Right Grant
- 2014-04-04 JP JP2015558506A patent/JP6031201B2/ja active Active
- 2014-04-04 MX MX2017006575A patent/MX369023B/es unknown
- 2014-04-04 BR BR122020017065-4A patent/BR122020017065B1/pt active IP Right Grant
-
2015
- 2015-07-23 IL IL240117A patent/IL240117A0/en active IP Right Grant
- 2015-08-27 MX MX2022004397A patent/MX2022004397A/es unknown
- 2015-08-27 MX MX2019012711A patent/MX2019012711A/es unknown
-
2016
- 2016-01-26 HK HK16100836.0A patent/HK1213080A1/zh unknown
- 2016-08-03 US US15/227,283 patent/US9728199B2/en active Active
- 2016-10-21 JP JP2016206760A patent/JP6377110B2/ja active Active
-
2017
- 2017-07-03 US US15/641,033 patent/US10438602B2/en active Active
-
2018
- 2018-07-24 JP JP2018138533A patent/JP6537683B2/ja active Active
-
2019
- 2019-06-04 JP JP2019104477A patent/JP6808781B2/ja active Active
- 2019-10-04 US US16/593,830 patent/US11114107B2/en active Active
-
2020
- 2020-12-09 JP JP2020203849A patent/JP7033182B2/ja active Active
-
2021
- 2021-08-31 US US17/463,192 patent/US11830510B2/en active Active
-
2022
- 2022-02-25 JP JP2022027834A patent/JP7413418B2/ja active Active
-
2023
- 2023-11-08 US US18/504,879 patent/US20240153517A1/en active Pending
- 2023-12-27 JP JP2023220177A patent/JP2024038139A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010536299A (ja) | 2007-08-13 | 2010-11-25 | エルジー エレクトロニクス インコーポレイティド | リミキシング能力を有する向上したオーディオ |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7033182B2 (ja) | 信号をインタリーブするためのオーディオ復号器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7033182 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |