JP6019266B2 - ステレオ・オーディオ・エンコーダおよびデコーダ - Google Patents

ステレオ・オーディオ・エンコーダおよびデコーダ Download PDF

Info

Publication number
JP6019266B2
JP6019266B2 JP2016505842A JP2016505842A JP6019266B2 JP 6019266 B2 JP6019266 B2 JP 6019266B2 JP 2016505842 A JP2016505842 A JP 2016505842A JP 2016505842 A JP2016505842 A JP 2016505842A JP 6019266 B2 JP6019266 B2 JP 6019266B2
Authority
JP
Japan
Prior art keywords
signal
signals
waveform
encoded
crossover frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016505842A
Other languages
English (en)
Other versions
JP2016519786A (ja
Inventor
プルンハーゲン,ヘイコ
クヨーリング,クリストファー
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2016519786A publication Critical patent/JP2016519786A/ja
Application granted granted Critical
Publication of JP6019266B2 publication Critical patent/JP6019266B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本開示は概括的にはステレオ・オーディオ符号化に関する。詳細には、本開示は減数混合〔ダウンミックス〕および離散的ステレオ符号化を含むハイブリッド符号化のためのデコーダおよびエンコーダに関する。
通常のステレオ・オーディオ符号化では、可能な符号化方式は低ビットレート用途で使われるパラメトリック・ステレオ符号化を含む。中間レートでは、左/右(L/R)または中央/サイド(M/S)波形ステレオ符号化がしばしば使われる。既存の頒布フォーマットおよび関連する符号化技法は、特に低ビットレートと中間ビットレートの間のビットレートでの用途において、その帯域幅効率の観点から改善されうる。
ステレオ・オーディオ・システムにおけるオーディオ頒布の効率を改善する試みは、統合音声音響符号化(USAC)規格においてなされている。USAC規格は、パラメトリック・ステレオ符号化技法と組み合わせた低帯域幅の波形符号化ベースのステレオ符号化を導入する。しかしながら、USACによって提案される解決策は、単純なM/SまたはL/S符号化より効率的な何かをするために修正離散コサイン変換(MDCT)においてステレオ符号化を案内するためにパラメトリック・ステレオ・パラメータを使う。この解決策の欠点は、直交ミラー・フィルタ(QMF)領域で抽出および計算されたパラメトリック・ステレオ・パラメータに基づいてMDCT領域で低帯域幅波形ベースのステレオ符号化をできるだけよく利用することが難しいことがあると言うことである。
上記に鑑み、上記で論じた欠点の一つまたは複数を解決するまたは少なくとも軽減するために、さらなる改善が必要とされうる。
例示的な実施形態について、ここで付属の図面を参照して記述する。
例示的な実施形態に基づくデコード・システムの一般化されたブロック図である。 図1のデコード・システムの第一の部分を示す図である。 図1のデコード・システムの第二の部分を示す図である。 図1のデコード・システムの第三の部分を示す図である。 第一の例示的な実施形態に基づくエンコード・システムの一般化されたブロック図である。 第二の実施形態に基づくエンコード・システムの一般化されたブロック図である。
すべての図面は概略的であり、概して本開示を明確にするために必要な部分を示すだけである。他の部分は省略されたり、あるいは単に示唆されたりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。
〈I.概観――デコーダ〉
本稿での用法では、左右符号化またはエンコードは、左(L)および右(R)ステレオ信号が信号間のいかなる変換も実行することなく符号化されることを意味する。
本稿での用法では、和差符号化またはエンコードは、左右のステレオ信号の和Mが一つの信号(和)として符号化され、左右のステレオ信号の差Sが一つの信号(差)として符号化されることを意味する。和差符号化は中央/サイド符号化と呼ばれることもある。よって、左右形式と和差形式の間の関係は、M=L+RおよびS=L−Rとなる。左右ステレオ信号を和差形式に変換し、逆に和差形式を左右ステレオ信号に変換するとき、両方向における変換がマッチする限り、種々の規格化またはスケーリングが可能であることが注意されうる。本開示では、M=L+RおよびS=L−Rが主として使われるが、異なるスケーリング、たとえばM=(L+R)/2およびS=(L−R)/2を使うシステムも同じようにうまく機能する。
本稿での用法では、ダウンミックス相補的(dmx/comp)符号化またはエンコードは、左右ステレオ信号を、符号化前に、重み付けパラメータaに依存する行列乗算を受けさせることを意味する。よって、dmx/comp符号化は、dmx/comp/a符号化と呼ばれることもある。ダウンミックス相補形式と左右形式および和差形式の間の関係は、典型的には、dmx=L+R=Mおよびcomp=(1−a)L−(1+a)R=−aM+Sである。注目すべきことに、このように、ダウンミックス相補表現でのダウンミックス信号は和差表現の和信号Mと等価である。
本稿での用法では、オーディオ信号は純粋なオーディオ信号、オーディオビジュアル信号またはマルチメディア信号のオーディオ部分またはこれらの任意のものをメタデータと組み合わせたものでありうる。
第一の側面によれば、例示的な実施形態は、入力信号に基づいてステレオ・チャネル・オーディオ信号をデコードするための方法、装置およびコンピュータ・プログラム・プロダクトを提案する。提案される方法、装置およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
例示的な実施形態によれば、二つのオーディオ信号をデコードするデコーダが提供される。デコーダは、前記二つのオーディオ信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成された受領段を有する。ここで、前記第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された(waveform-coded)信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号とを含み、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号を含む。
デコーダはさらに、前記受領段の下流の混合段を有する。混合段は、前記第一および第二の信号波形符号化された信号が前記第一のクロスオーバー周波数までのすべての周波数について和差形式であるかどうかを検査し、そうでなければ、前記第一および第二の波形符号化された信号を和差形式に変換するよう構成されている。それにより、前記第一の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された和信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号との組み合わせになり、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された差信号を含むようになる。
デコーダはさらに、前記混合段の下流に、前記第一および第二の信号を増数混合〔アップミックス〕してステレオ信号の左および右のチャネルを生成するよう構成されたアップミックス段を有する。ここで、前記第一のクロスオーバー周波数より下の周波数については前記アップミックス段は前記第一および第二の信号の逆和差変換を実行するよう構成されており、前記第一のクロスオーバー周波数より上の周波数については前記アップミックス段は前記第一の信号の前記ダウンミックス信号のパラメトリック増数混合を実行するよう構成されている。
純粋に波形符号化された低周波数、すなわちステレオ・オーディオ信号の離散的表現をもつことの利点は、人間の耳が低周波数をもつオーディオ部分により敏感であるということでありうる。この部分をよりよい品質で符号化することにより、デコードされたオーディオの全体的な印象が高まりうる。
前記第一の信号のパラメトリック・ステレオ符号化された部分、すなわち波形符号化されたダウンミックス信号と、上述したステレオ・オーディオ信号の離散的表現とをもつことの利点は、通常のパラメトリック・ステレオ・アプローチを使うのに比べて、ある種のビットレートについては、これがデコードされたオーディオ信号の品質を改善しうるということである。約32〜40キロビット毎秒(kbps)のビットレートでは、パラメトリック・ステレオ・モデルは飽和しうる。すなわち、デコードされたオーディオ信号の品質は、符号化のためのビットの欠乏ではなく、パラメトリック・モデルの欠点によって制限される。その結果、約32kbpsからのビットレートについては、より低い周波数を波形符号化することにビットを使うほうが有益でありうる。同時に、第一の信号のパラメトリック・ステレオ符号化された部分および頒布されるステレオ・オーディオ信号の離散的表現の両方を使うハイブリッド・アプローチは、低周波数を波形符号化することにすべてのビットが使われるアプローチを使うことおよび残りの周波数についてスペクトル帯域複製(SBR)を使うことに比べ、たとえば48kbpsより下でのある種のビットレートについて、デコードされたオーディオの品質を改善しうるということである。
このように、デコーダは、二チャネル・ステレオ・オーディオ信号をデコードするために有利に使用される。
もう一つの実施形態によれば、前記混合段において前記第一および第二の波形符号化された信号を和差形式に変換することは、重複窓掛け変換領域において実行される。重複窓掛け変換領域はたとえば修正離散コサイン変換(MDCT)領域であってもよい。これは、左右形式またはdmx/comp形式のような他の利用可能なオーディオ頒布フォーマットの和差形式への変換がMDCT領域では達成するのが簡単なので、有利でありうる。結果として、信号は、エンコードされる信号の特性に依存して、前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、異なる諸フォーマットを使ってエンコードされうる。これは、改善された符号化品質および符号化効率を許容しうる。
さらにもう一つの実施形態によれば、前記アップミックス段における前記第一および第二の信号の増数混合は、直交ミラー・フィルタ(QMF)領域において実行される。増数混合は、左および右のステレオ信号を生成するよう実行される。
もう一つの実施形態によれば、前記波形符号化されたダウンミックス信号は、前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間の周波数に対応するスペクトル・データを含む。高周波数再構成(HFR)パラメータがデコーダによって、たとえば前記受領段において受領され、次いで、該高周波数再構成パラメータを使って高周波数再構成を実行することにより前記第一の信号の前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張するために、高周波数再構成段に送られる。高周波数再構成はたとえば、スペクトル帯域複製(SBR)を実行することを含んでいてもよい。
前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間の周波数に対応するスペクトル・データのみを含む波形符号化されたダウンミックス信号をもつことの利点は、当該ステレオ・システムについての必要とされるビット伝送レートが減少されうるということである。あるいはまた、帯域通過フィルタリングされたダウンミックス信号をもつことによって節約されるビットが、より低い周波数を波形符号化することに対して使われ、たとえばそうした周波数の量子化がより細かくなりうる、あるいは前記第一のクロスオーバー周波数を高くしうる。
上述したように、人間の耳は低周波数をもつオーディオ信号部分に対してより敏感なので、前記第二のクロスオーバー周波数より上の周波数をもつオーディオ信号部分のような高周波数は、デコードされたオーディオ信号の知覚されるオーディオ品質を低下させることなく高周波数再構成によって再生成されてもよい。
あるさらなる実施形態によれば、前記第一の信号の前記ダウンミックス信号は、前記第一および第二の信号の増数混合が実行される前に、前記第二のクロスオーバー周波数より上の周波数範囲まで拡張される。これは、前記アップミックス段がすべての周波数に対応するスペクトル・データをもつ入力和信号をもつことになるので、有利でありうる。
あるさらなる実施形態によれば、前記第一の信号の前記ダウンミックス信号は、前記第一および第二の波形符号化された信号を和差形式に変換した後に前記第二のクロスオーバー周波数より上の周波数範囲まで拡張される。これは、前記ダウンミックス信号が和差表現における前記和信号に対応するため、前記高周波数再構成段が同じ形、すなわち和形式で表現された前記第二のクロスオーバー周波数までの周波数に対応するスペクトル・データをもつ入力信号をもつことになるので、有利でありうる。
もう一つの実施形態によれば、前記アップミックス段における増数混合は、アップミックス・パラメータを使ってなされる。アップミックス・パラメータはデコーダによって、たとえば前記受領段において受領され、前記アップミックス段に送られる。前記ダウンミックス信号の脱相関されたバージョンが生成され、前記ダウンミックス信号および前記ダウンミックス信号の前記脱相関されたバージョンが行列演算にかけられる。行列演算のパラメータはアップミックス・パラメータによって与えられる。
あるさらなる実施形態によれば、前記受領段において受領された前記第一および第二の波形符号化された信号は、左右形式、和差形式および/またはダウンミックス相補形式で波形符号化されている。ここで、相補信号は、信号適応的である重み付けパラメータaに依存する。このように、波形符号化された信号は、当該信号の特性に依存して異なる形で符号化され、それでいてデコーダによってデコード可能でありうる。このことは、システムのあるビットレートが与えられたときに、改善された符号化品質を、よってデコードされたオーディオ・ステレオ信号の改善された品質を許容しうる。あるさらなる実施形態では、重み付けパラメータaは実数値である。このことは、信号の虚部を近似する追加的な段が必要とされないので、デコーダを簡略化しうる。さらなる利点は、デコーダの計算量が低減でき、そのことはデコーダの低減したデコード遅延/レイテンシーにもつながりうるということである。
さらにもう一つの実施形態によれば、前記受領段において受領された前記第一および第二の波形符号化された信号は、和差形式で波形符号化されている。これは、前記第一および第二の信号が、それぞれ前記第一および第二の信号について独立な窓掛けをもつ重複窓掛け変換を使って符号化され、それでいてデコーダによってデコード可能であることができることを意味する。このことは、システムのあるビットレートを与えられて、改善された符号化品質を、よってデコードされたオーディオ・ステレオ信号の改善された品質を許容しうる。たとえば、和信号に置いてかと成分が検出されるが、差信号においては検出されない場合、波形符号化器は、和信号をより短い窓を用いて符号化しうる一方、差信号についてはより長いデフォルトの窓が保持されうる。このことは、サイド信号もより短い窓シーケンスを用いて符号化された場合に比べ、より高い符号化効率を提供しうる。
〈II.概観――エンコーダ〉
第二の側面によれば、例示的な実施形態は、入力信号に基づいてステレオ・チャネル・オーディオ信号をエンコードするための方法、装置およびコンピュータ・プログラム・プロダクトを提案する。
提案される方法、装置およびコンピュータ・プログラム・プロダクトは一般に同じ特徴および利点をもつことがある。
上記のデコーダの概観において呈示された特徴およびセットアップに関する利点は一般に、エンコーダについての対応する特徴およびセットアップについても有効でありうる。
例示的な実施形態によれば、二つのオーディオ信号をエンコードするエンコーダが提供される。エンコーダは、エンコードされるべき、前記二つの信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成された受領段を有する。
エンコーダはさらに、前記受領段から前記第一および第二の信号を受け取って、それらを和信号である第一の変換された信号および差信号である第二の変換された信号に変換するよう構成された変換段を有する。
エンコーダはさらに、前記変換段から前記第一および第二の変換された信号を受領し、それらを波形符号化してそれぞれ第一および第二の波形符号化された信号にするよう構成された波形符号化段を有する。ここで、前記第一のクロスオーバー周波数より上の周波数については、前記波形符号化段は前記第一の変換された信号を波形符号化するよう構成されており、前記第一のクロスオーバー周波数までの周波数については、前記波形符号化段は前記第一および第二の変換された信号を波形符号化するよう構成されている。
エンコーダはさらに、前記受領段から前記第一および第二の信号を受け取り、前記第一のクロスオーバー周波数より上の周波数について前記第一および第二の信号のスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを抽出するために、前記第一および第二の信号をパラメトリック・ステレオ・エンコードにかけるよう構成されたパラメトリック・ステレオ・エンコード段を有する。
エンコーダはさらに、前記波形符号化段からの前記第一および第二の波形符号化された信号と、前記パラメトリック・ステレオ・エンコード段からの前記パラメトリック・ステレオ・パラメータを受領し、前記第一および第二の波形符号化された信号および前記パラメトリック・ステレオ・パラメータを含むビットストリームを生成するよう構成されたビットストリーム生成段を有する。
もう一つの実施形態によれば、前記変換段における前記第一および第二の信号の変換は時間領域で実行される。
もう一つの実施形態によれば、前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、エンコーダは、逆和差変換を実行することによって、前記第一および第二の波形符号化された信号を左右形式に変換してもよい。
もう一つの実施形態によれば、前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、エンコーダは、前記第一および第二の波形符号化された信号に対して行列演算を実行することによって、前記第一および第二の波形符号化された信号をダウンミックス/相補形式に変換してもよい。前記行列演算は重み付けパラメータaに依存する。重み付けパラメータaは次いで、ビットストリーム生成段において前記ビットストリームに含められてもよい。
さらにもう一つの実施形態によれば、前記第一のクロスオーバー周波数より上の周波数について、前記変換段において前記第一および第二の変換された信号を波形符号化することは、前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間の周波数について前記第一の変換された信号を波形符号化し、前記第二のクロスオーバー周波数より上では前記第一の波形符号化された信号を0に設定することを含む。次いで、前記第一の信号および前記第二の信号のダウンミックス信号が、前記ダウンミックス信号の高周波数再構成を可能にする高周波数再構成パラメータを生成するために、高周波数再構成段において高周波数再構成エンコードにかけられてもよい。次いで、高周波数再構成パラメータは前記ビットストリーム生成段において前記ビットストリームに含められてもよい。
あるさらなる実施形態によれば、ダウンミックス信号は前記第一および第二の信号に基づいて計算される。
もう一つの実施形態によれば、前記第一および第二の信号を前記パラメトリック・ステレオ・エンコード段においてパラメトリック・ステレオ・エンコードにかけることは、まず前記第一および第二の信号を和信号である第一の変換された信号および差信号である第二の変換された信号に変換し、次いで、前記第一および第二の変換された信号をパラメトリック・ステレオ・エンコードにかけることによって実行される。ここで、高周波数再構成エンコードにかけられる前記ダウンミックス信号は、前記第一の変換された信号である。
〈III.例示的な実施形態〉
図1は、図2〜図4との関連でのちにより詳細に説明する三つの概念部分200、300、400を有するデコード・システム100の一般化されたブロック図である。第一の概念部分200では、ビットストリームが受領され、第一および第二の信号にデコードされる。第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号とを両方含む。第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号のみを含む。
第二の概念部分300では、前記第一および第二の信号の波形符号化された部分が和差形式でなく、たとえばM/S形式である場合、前記第一および第二の信号の波形符号化された部分が和差形式に変換される。その後、前記第一および第二の信号は時間領域に、次いで直交ミラー・フィルタ(QMF)領域に変換される。第三の概念部分400では、第一の信号は高周波数再構成される(HFR)。前記第一および第二の部分の両方は次いでアップミックスされて、デコード・システム100によってデコードされるエンコードされた信号の周波数帯域全体に対応するスペクトル係数をもつ左右のステレオ信号出力を生成する。
図2は、図1におけるデコード・システム100の第一の概念部分200を示している。デコード・システム100は受領段212を有する。受領段212では、ビットストリーム・フレーム202がデコードされて、量子化解除されて第一の信号204aおよび第二の信号204bにされる。ビットストリーム・フレーム202は、デコードされる前記二つのオーディオ信号の時間フレームに対応する。第一の信号204aは、第一のクロスオーバー周波数kyまでの周波数に対応するスペクトル・データを含む第一の波形符号化された信号208と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号206とを含む。例として、第一のクロスオーバー周波数kyは1.1kHzである。
いくつかの実施形態によれば、前記波形符号化されたダウンミックス信号206は、前記第一のクロスオーバー周波数kyと第二のクロスオーバー周波数kxとの間の周波数に対応するスペクトル・データを含む。例として、第二のクロスオーバー周波数kxは5.6〜8kHzの範囲内にある。
受領された第一および第二の波形符号化された信号208、210は、左右形式、和差形式および/またはダウンミックス相補形式で波形符号化されていてもよい。ここで、相補信号は、信号適応的である重み付けパラメータaに依存する。波形符号化されたダウンミックス信号206は、パラメトリック・ステレオに好適なダウンミックスに対応し、これは上記によれば和形式に対応する。しかしながら、信号204bは第一のクロスオーバー周波数kyより上には内容をもたない。各信号206、208、210は修正離散コサイン変換(MDCT)領域で表現される。
図3は、図1のデコード・システム100の第二の概念部分300を示している。デコード・システム100は混合段302を有する。デコード・システム100の設計は、のちにより詳細に述べる高周波数再構成段への入力が和フォーマットである必要があることを要求する。結果として、混合段は、第一および第二の波形符号化された信号208、210が和差形式であるかどうかを検査するよう構成される。第一および第二の信号波形符号化された信号が前記第一のクロスオーバー周波数kyまでのすべての周波数について和差形式であるのでなければ、混合段302は、波形符号化された信号208、210全体を和差形式に変換する。混合段302への入力信号208、210の周波数の少なくとも部分集合がダウンミックス相補形式である場合には、混合段302への入力として、重み付けパラメータaが要求される。入力信号208、210がダウンミックス相補形式で符号化されたいくつかの部分集合の周波数を含んでいてもよいこと、その場合には各部分集合が重み付けパラメータaの同じ値を使って符号化される必要はないことを注意してもよい。この場合、いくつかの重み付けパラメータaが混合段302への入力として要求される。
上述したように、混合段302は常に入力信号204a〜bの和差表現を出力する。MDCT領域で表現された信号を和差表現に変換できるためには、MDCT符号化された信号の窓掛けが同じである必要がある。これは、第一および第二の信号波形符号化された信号208、210がL/Rまたはダウンミックス相補形式である場合には、信号204aについての窓掛けと信号204bについての窓掛けが独立であることができないことを含意する。
結果として、第一および第二の信号波形符号化された信号208、210が和差形式である場合、信号204aについての窓掛けと信号204bについての窓掛けは独立であってもよい。
混合段302のあと、和差信号は、逆修正離散コサイン変換(MDCT-1)312を適用することによって、時間領域に変換される。
次いで、二つの信号304a〜bは、二つのQMFバンク314を用いて解析される。ダウンミックス信号306が前記低周波数を含まないので、周波数分解能を増すために信号をナイキスト・フィルタバンクを用いて解析する必要はない。これは、ダウンミックス信号が低周波数を含むシステム、たとえばMPEG-4パラメトリック・ステレオのような通常のパラメトリック・ステレオ・デコードに比較されうる。そうしたシステムでは、ダウンミックス信号は、周波数分解能をQMFバンクによって達成されるより高くし、それによりたとえばバーク周波数スケールによって表わされる人間の聴覚系の周波数選択性によりよくマッチするために、ナイキスト・フィルタバンクを用いて解析される必要がある。
QMFバンク314からの出力信号304は、第一のクロスオーバー周波数kyまでの周波数に対応するスペクトル・データを含む波形符号化された和信号308と、第一のクロスオーバー周波数kyと第二のクロスオーバー周波数kxとの間の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号306との組み合わせである第一の信号304aを含む。出力信号304はさらに、第一のクロスオーバー周波数kyまでの周波数に対応するスペクトル・データを含む波形符号化された差信号310を含む第二の信号304bを含む。信号304bは、第一のクロスオーバー周波数kyより上には内容をもたない。
のちに述べるように、高周波数再構成段416(図4との関連で示す)は、前記低周波数、すなわち前記出力信号304からの前記第一の波形符号化された信号308および前記波形符号化されたダウンミックス信号306を、第二のクロスオーバー周波数kxより上の周波数を再構成するために使う。高周波数再構成段416が作用する信号が、前記低周波数にわたって同様の型の信号であることが有利である。この観点から、混合段302に、常に前記第一および第二の信号波形符号化された信号208、210の和差表現を出力させることが有利である。これが、出力される第一の信号304aの第一の波形符号化された信号308および波形符号化されたダウンミックス信号306が同様の性質であることを含意するからである。
図4は、図1のデコード・システム100の第三の概念部分400を示している。高周波数再構成(HFR)段416は、高周波数再構成を実行することにより、第一の信号入力信号304aのダウンミックス信号306を第二のクロスオーバー周波数kxより上の周波数範囲に拡張する。HFR段416の構成設定に依存して、HFR段416への入力は信号304a全体またはダウンミックス信号306だけである。高周波数再構成は、任意の好適な仕方で高周波数再構成段416によって受領されうる高周波数再構成パラメータを使うことによってなされる。ある実施形態によれば、実行される高周波数再構成は、スペクトル帯域複製(SBR)を実行することを含む。
高周波数再構成段314からの出力は、SBR拡張412が適用されたダウンミックス信号406を含む信号404である。高周波数再構成された信号404および信号403bは次いで、左Lおよび右Rステレオ信号412a〜bを生成するよう、アップミックス段420にフィードされる。第一のクロスオーバー周波数kyより下の周波数に対応するスペクトル係数については、アップミックスは、第一および第二の信号408、310の逆和差変換を実行することを含む。これは単に、先に概説したように中央‐サイド表現から左‐右表現に移行することを意味する。第一のクロスオーバー周波数kyまでの周波数に対応するスペクトル係数については、ダウンミックス信号406およびSBR拡張412は脱相関器418を通じてフィードされる。ダウンミックス信号406およびSBR拡張412ならびにダウンミックス信号406およびSBR拡張412の脱相関されたバージョンは、次いで、パラメトリック混合パラメータを使ってアップミックスされ、第一のクロスオーバー周波数kyより上の周波数についての左および右のチャネル416、414を再構成する。当技術分野において知られている任意のパラメトリック・アップミックス手順が適用されうる。
図1〜図4に示したエンコーダの上記の例示的な実施形態100では、第一の受領される信号204aが第二のクロスオーバー周波数kxまでの周波数に対応するスペクトル・データしか含まないので、高周波数再構成が必要とされていることを注意しておくべきである。さらなる実施形態では、第一の受領された信号は、エンコードされた信号の全周波数に対応するスペクトル・データを含む。この実施形態によれば、高周波数再構成は必要とされない。当業者は、この場合に例示的なエンコーダ100をどのように適応させるべきかを理解する。
図5は、ある実施形態に基づくエンコード・システム500の一般化されたブロック図を例として示している。
このエンコード・システムでは、エンコードされるべき第一および第二の信号540、542が受領段(図示せず)によって受領される。これらの信号540、542は、左540および右542のステレオ・オーディオ・チャネルの時間フレームを表わす。信号540、542は時間領域で表現されている。エンコード・システムは、変換段510を有する。信号540、542は変換段510において和差フォーマット544、546に変換される。
エンコード・システムはさらに、変換段510から第一および第二の変換された信号544、546を受領するよう構成されている波形符号化段514を含む。波形変換段は典型的には、MDCT領域で動作する。この理由により、変換された信号544、546は、波形符号化段514の前にMDCT変換512にかけられる。波形符号化段では、第一および第二の変換された信号544、546は波形符号化されて、それぞれ第一および第二の波形符号化された信号518、520にされる。
第一のクロスオーバー周波数kyより上の周波数については、波形符号化段514は、第一の変換された信号544を波形符号化して、第一の波形符号化された信号518の波形符号信号552にするよう構成されている。波形符号化段514は、第一のクロスオーバー周波数kyより上では第二の波形符号化された信号520を0に設定するよう、あるいはこれらの周波数を全くエンコードしないよう、構成されていてもよい。第一のクロスオーバー周波数kyより上の周波数については、波形符号化段514は、第一の変換された信号544を波形符号化して、第一の波形符号化された信号518の波形符号化された信号552にするよう構成されている。
第一のクロスオーバー周波数kyより下の周波数については、前記二つの信号548、550についてどの種類のステレオ符号化を使うべきかについて、波形符号化段514において決定がなされる。第一のクロスオーバー周波数kyより下での変換された信号544、546の特性に依存して、波形符号化された信号548、550の異なる部分集合について異なる決定がされることができる。符号化は、左/右符号化、中央/サイド符号化、すなわち和と差の符号化またはdmx/comp/a符号化であることができる。信号548、550が波形符号化段514において和差符号化によって波形符号化される場合、波形符号化された信号518、520は、それぞれ信号518、520についての独立な窓掛けを用いる重複窓掛け変換を使って符号化されてもよい。
例示的な第一のクロスオーバー周波数kyは1.1kHzであるが、この周波数はステレオ・オーディオ・システムのビット伝送レートに依存して、あるいはエンコードされるべきオーディオの特性に依存して変わりうる。
こうして、波形符号化段514から少なくとも二つの信号518、520が出力される。第一のクロスオーバー周波数kyより下の信号の一つまたは複数の部分集合または周波数帯域全体が重み付けパラメータaに依存して行列演算を実行することによってダウンミックス/相補形式で符号化される場合、このパラメータも信号522として出力される。いくつかの部分集合がダウンミックス/相補形式でエンコードされる場合、各部分集合は重み付けパラメータaの同じ値を使って符号化される必要はない。この場合、いくつかの重み付けパラメータが信号522として出力される。
これら二つまたは三つの信号518、520、522はエンコードおよび量子化524されて単一の合成信号558にされる。
デコーダ側で第一のクロスオーバー周波数より上の周波数について第一および第二の信号540、542のスペクトル・データを再構成できるために、パラメトリック・ステレオ・パラメータ536が信号540、542から抽出される必要がある。この目的のために、エンコーダ500は、パラメトリック・ステレオ(PS)エンコード段530を有する。PSエンコード段530は典型的にはQMF領域で動作する。したがって、PSエンコード段530に入力される前に、第一および第二の信号540、542はQMF分解段526によってQMF領域に変換される。PSエンコーダ段530は、第一のクロスオーバー周波数kyより上の周波数についてパラメトリック・ステレオ・パラメータ536を抽出するだけであるよう適応される。
パラメトリック・ステレオ・パラメータ536がパラメトリック・ステレオ・エンコードされる信号の特性を反映することを注意しておいてもいいだろう。よって、これらのパラメータは周波数選択的である、すなわち、パラメータ536の各パラメータは、左または右の入力信号540、542の周波数の部分集合に対応しうる。PSエンコード段530はパラメトリック・ステレオ・パラメータ536を計算し、これらを一様または非一様な仕方で量子化する。パラメータは上述したように周波数選択的に計算され、ここで、入力信号540、542の周波数範囲全体はたとえば15個のパラメータ帯域に分割される。これらは人間の聴覚系の周波数分解能のモデル、たとえばバーク・スケールに従って離間されていてもよい。
図5に示したエンコーダ500の例示的な実施形態では、波形符号化段514は、第一のクロスオーバー周波数kyと第二のクロスオーバー周波数kxとの間の周波数について第一の変換された信号544を波形符号化し、第二のクロスオーバー周波数kxより上では第一の波形符号化された信号518を0に設定するよう構成されている。これは、エンコーダ500を一部とするオーディオ・システムの要求される伝送レートをさらに軽減するためになされてもよい。第二のクロスオーバー周波数kxより上の信号を再構成できるために、高周波数再構成パラメータ538が生成される必要がある。この例示的実施形態によれば、これはダウンミックス段534においてQMF領域で表わされる二つの信号540、542をダウンミックスすることによってなされる。結果として得られるダウンミックス信号はたとえば信号540、542の和に等しく、次いで、高周波数パラメータ538を生成するために、高周波数再構成(HFR)エンコード段532における高周波数再構成エンコードにかけられる。パラメータ538はたとえば、当業者によく知られるように、第二のクロスオーバー周波数kxより上の周波数のスペクトル包絡、ノイズ加算情報などを含んでいてもよい。
例示的な第二のクロスオーバー周波数kxは5.6〜8kHzであるが、この周波数はステレオ・オーディオ・システムのビット伝送レートに依存して、あるいはエンコードされるオーディオの特性に依存して変えられてもよい。
エンコーダ500はさらに、ビットストリーム生成段、すなわちビットストリーム・マルチプレクサ524を有する。エンコーダ500の例示的な実施形態によれば、ビットストリーム生成段は、エンコードされ、量子化された信号544および二つのパラメータ信号536、538を受領するよう構成されている。これらは、ステレオ・オーディオ・システムにおいてさらに頒布されるため、ビットストリーム生成段562によってビットストリーム560に変換される。
もう一つの実施形態によれば、波形符号化段514が、第一のクロスオーバー周波数kyより上のすべての周波数について第一の変換された信号544を波形符号化するよう構成されている。この場合、HFRエンコード段532は必要とされず、結果として、高周波数再構成パラメータ538はビットストリームに含められない。
図6は、例として、もう一つの実施形態に基づくエンコーダ・システム600の一般化されたブロック図を示している。この実施形態は、QMF分解段526によって変換される信号544、546が和差フォーマットであるという点で図5に示した実施形態と異なっている。結果として、和信号544がすでにダウンミックス信号の形なので、別個のダウンミックス段534の必要がない。このように、SBRエンコード段532は、高周波数再構成パラメータ538を抽出するために和信号544に対して作用する必要があるだけである。PSエンコーダ530は、パラメトリック・ステレオ・パラメータ536を抽出するために、和信号544および差信号546の両方に対して作用するよう適応されている。
〈等価物、拡張、代替その他〉
上記の記述を吟味すれば、当業者には本開示のさらなる実施形態が明白になるであろう。本稿および図面は実施形態および例を開示しているが、開示はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本開示の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
さらに、本開示を実施する当業者によって、開示される実施形態に対する変形が理解され、実施されることができる。請求項において、「有する/含む」の語は他の要素またはステップを排除するものではなく、単数形の表現は複数を排除するものではない。ある種の施策が互いに異なる従属請求項に記載されているというだけの事実がこれらの施策の組み合わせが有利に使用できないことを示すものではない。
上記で開示されたシステムおよび方法は、ソフトウェア、ファームウェア、ハードウェアまたはそれらの組み合わせとして実装されうる。ハードウェア実装では、上記の記述で言及された機能ユニットの間でのタスクの分割は必ずしも物理的なユニットへの分割に対応しない。むしろ、一つの物理的コンポーネントが複数の機能を有していてもよく、一つのタスクが協働していくつかの物理的コンポーネントによって実行されてもよい。ある種のコンポーネントまたはすべてのコンポーネントは、デジタル信号プロセッサまたはマイクロプロセッサによって実行されるソフトウェアとして実装されてもよく、あるいはハードウェアとしてまたは特定用途向け集積回路として実装されてもよい。そのようなソフトウェアは、コンピュータ記憶媒体(または非一時的な媒体)および通信媒体(または一時的な媒体)を含みうるコンピュータ可読媒体上で頒布されてもよい。当業者にはよく知られているように、コンピュータ記憶媒体という用語は、コンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータのような情報の記憶のための任意の方法または技術において実装される揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体を含む。コンピュータ記憶媒体は、これに限られないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイスまたは、所望される情報を記憶するために使用されることができ、コンピュータによってアクセスされることができる他の任意の媒体を含む。さらに、通信媒体が典型的にはコンピュータ可読命令、データ構造、プログラム・モジュールまたは他のデータを、搬送波または他の転送機構のような変調されたデータ信号において具現し、任意の情報送達媒体を含むことは当業者にはよく知られている。
いくつかの態様を記載しておく。
〔態様1〕
二つのオーディオ信号をデコードするデコード方法であって、
前記二つのオーディオ信号のある時間フレームに対応する第一の信号および第二の信号を受領する段階であって、前記第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号とを含み、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号を含む、段階と;
前記第一および第二の波形符号化された信号が前記第一のクロスオーバー周波数までのすべての周波数について和差形式であるのでなければ、前記第一および第二の波形符号化された信号を和差形式に変換し、それにより、前記第一の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された和信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む前記波形符号化されたダウンミックス信号との組み合わせになり、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された差信号を含むようになる、段階と;
前記第一および第二の信号をアップミックスしてステレオ信号の左および右のチャネルを生成する段階であって、前記第一のクロスオーバー周波数より下の周波数については該アップミックスは前記第一および第二の信号の逆和差変換を実行することを含み、前記第一のクロスオーバー周波数より上の周波数については前記アップミックスは前記第一の信号の前記ダウンミックス信号のパラメトリックなアップミックスを実行することを含む、段階とを含む、
デコード方法。
〔態様2〕
前記第一および第二の波形符号化された信号を和差形式に変換する前記段階は、重複窓掛け変換領域において実行される、態様1記載のデコード方法。
〔態様3〕
前記重複窓掛け変換領域は修正離散コサイン変換(MDCT)領域である、態様2記載のデコード方法。
〔態様4〕
前記第一および第二の信号をアップミックスして左右のステレオ信号を生成する前記段階が、直交ミラー・フィルタ(QMF)領域において実行される、態様1ないし3のうちいずれか一項記載のデコード方法。
〔態様5〕
前記波形符号化されたダウンミックス信号は、前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間の周波数に対応するスペクトル・データを含み、当該方法がさらに、
高周波数再構成パラメータを受領する段階と;
前記高周波数再構成パラメータを使って高周波数再構成を実行することにより前記第一の信号の前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する段階とを含む、
態様1ないし4のうちいずれか一項記載のデコード方法。
〔態様6〕
高周波数再構成を実行することにより前記第一の信号の前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する前記段階が、スペクトル帯域複製(SBR)を実行することを含む、態様5記載のデコード方法。
〔態様7〕
前記第一の信号の前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する前記段階が、前記第一および第二の信号をアップミックスするより前に実行される、態様5または6記載のデコード方法。
〔態様8〕
前記第一の信号の前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する前記段階が、前記第一および第二の波形符号化された信号を和差形式に変換したあとに実行される、態様5ないし7のうちいずれか一項記載のデコード方法。
〔態様9〕
前記第一の信号の前記ダウンミックス信号のパラメトリックなアップミックスの処理が:
アップミックス・パラメータを受領し;
前記ダウンミックス信号の脱相関されたバージョンを生成し;
前記ダウンミックス信号および前記ダウンミックス信号の前記脱相関されたバージョンを行列演算にかけることを含み、前記行列演算のパラメータは前記アップミックス・パラメータによって与えられる、
態様1ないし8のうちいずれか一項記載のデコード方法。
〔態様10〕
受領された前記第一および第二の波形符号化された信号は、左右形式、和差形式および/またはダウンミックス相補形式で波形符号化されており、相補信号は、信号適応的である重み付けパラメータaに依存する、態様1ないし9のうちいずれか一項記載のデコード方法。
〔態様11〕
前記重み付けパラメータaが実数値である、態様10記載のデコード方法。
〔態様12〕
受領された前記第一および第二の波形符号化された信号は和差形式で波形符号化され、前記第一および第二の信号が、それぞれ前記第一および第二の信号について独立な窓掛けをもつ重複窓掛け変換を使って符号化される、態様10記載のデコード方法。
〔態様13〕
態様1ないし12のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様14〕
二つのオーディオ信号をデコードするデコーダであって、
前記二つのオーディオ信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成された受領段であって、前記第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む波形符号化されたダウンミックス信号とを含み、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号を含む、受領段と;
前記受領段の下流の混合段であって、前記第一および第二の信号波形符号化された信号が前記第一のクロスオーバー周波数までのすべての周波数について和差形式であるかどうかを検査し、そうでなければ、前記第一および第二の波形符号化された信号を和差形式に変換し、それにより、前記第一の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された和信号と、前記第一のクロスオーバー周波数より上の周波数に対応するスペクトル・データを含む前記波形符号化されたダウンミックス信号との組み合わせであり、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された差信号を含むようにするよう構成されている混合段と;
前記第一および第二の信号をアップミックスしてステレオ信号の左および右のチャネルを生成するよう構成されている、前記混合段の下流のアップミックス段であって、前記第一のクロスオーバー周波数より下の周波数については該アップミックス段は前記第一および第二の信号の逆和差変換を実行するよう構成されており、前記第一のクロスオーバー周波数より上の周波数については前記アップミックス段は前記第一の信号の前記ダウンミックス信号のパラメトリックなアップミックスを実行するよう構成されている、アップミックス段とを有する
デコーダ。
〔態様15〕
二つのオーディオ信号をエンコードするエンコード方法であって:
エンコードされるべき、前記二つの信号のある時間フレームに対応する第一の信号および第二の信号を受領する段階と;
前記第一および第二の信号を和信号である第一の変換された信号および差信号である第二の変換された信号に変換する段階と;
前記第一および第二の変換された信号を波形符号化してそれぞれ第一および第二の波形符号化された信号にする段階であって、第一のクロスオーバー周波数より上の周波数については、前記波形符号化は前記第一の変換された信号を波形符号化することを含み、前記第一のクロスオーバー周波数までの周波数については、前記波形符号化は前記第一および第二の変換された信号を波形符号化することを含む、段階と;
前記第一のクロスオーバー周波数より上の周波数について前記第一および第二の信号のスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを抽出するために、前記第一および第二の信号をパラメトリック・ステレオ・エンコードにかける段階と;
前記第一および第二の波形符号化された信号と、前記パラメトリック・ステレオ・パラメータとを含むビットストリームを生成する段階とを含む、
エンコード方法。
〔態様16〕
前記第一および第二の信号の変換は時間領域で実行される、態様15記載のエンコード方法。
〔態様17〕
前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、逆和差変換を実行することによって、前記第一および第二の波形符号化された信号を左右形式に変換する段階をさらに含む、態様15または16記載のエンコード方法。
〔態様18〕
前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、前記第一および第二の波形符号化された信号に対して行列演算を実行することによって、前記第一および第二の波形符号化された信号をダウンミックス/相補形式に変換する段階であって、前記行列演算は重み付けパラメータaに依存する、段階と;
前記重み付けパラメータaを前記ビットストリームに含める段階とをさらに含む、
態様15ないし17のうちいずれか一項記載のエンコード方法。
〔態様19〕
前記第一のクロスオーバー周波数より上の周波数について、前記第一および第二の変換された信号を波形符号化する処理は、前記第一のクロスオーバー周波数と第二のクロスオーバー周波数との間の周波数について前記第一の変換された信号を波形符号化し、前記第二のクロスオーバー周波数より上では前記第一の波形符号化された信号を0に設定することを含み、
当該方法はさらに、
前記第一の信号および前記第二の信号のダウンミックス信号を、前記ダウンミックス信号の高周波数再構成を可能にする高周波数再構成パラメータを生成するために、高周波数再構成エンコードにかける段階と;
前記高周波数再構成パラメータを前記ビットストリームに含める段階とを含む、
態様15ないし18のうちいずれか一項記載のエンコード方法。
〔態様20〕
前記ダウンミックス信号を前記第一および第二の信号に基づいて計算する段階をさらに含む、態様19記載のエンコード方法。
〔態様21〕
前記第一および第二の信号を前記パラメトリック・ステレオ・エンコードにかける処理は、まず前記第一および第二の信号を和信号である第一の変換された信号および差信号である第二の変換された信号に変換する前記の処理を実行し、次いで、前記第一および第二の変換された信号をパラメトリック・ステレオ・エンコードにかけることによって実行され、高周波数再構成エンコードにかけられる前記ダウンミックス信号は、前記第一の変換された信号である、態様19記載のエンコード方法。
〔態様22〕
態様15ないし21のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様23〕
二つのオーディオ信号をエンコードするエンコーダであって:
エンコードされるべき、前記二つの信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成されている受領段と;
前記第一および第二の信号を前記受領段から受領し、それらの信号を和信号である第一の変換された信号および差信号である第二の変換された信号に変換するよう構成されている変換段と;
前記第一および第二の変換された信号を前記変換段から受領し、それらの信号を波形符号化してそれぞれ第一および第二の波形符号化された信号にするよう構成されている波形符号化段であって、第一のクロスオーバー周波数より上の周波数については、前記波形符号化段は前記第一の変換された信号を波形符号化するよう構成されており、前記第一のクロスオーバー周波数までの周波数については、前記波形符号化段は前記第一および第二の変換された信号を波形符号化するよう構成されている、波形符号化段と;
前記第一および第二の信号を前記受領段から受領し、前記第一のクロスオーバー周波数より上の周波数について前記第一および第二の信号のスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを抽出するために、前記第一および第二の信号をパラメトリック・ステレオ・エンコードにかけるよう構成されているパラメトリック・ステレオ・エンコード段と;
前記波形符号化段からの前記第一および第二の波形符号化された信号と、前記パラメトリック・ステレオ・エンコード段からの前記パラメトリック・ステレオ・パラメータとを受領し、前記第一および第二の波形符号化された信号および前記パラメトリック・ステレオ・パラメータを含むビットストリームを生成するよう構成されているビットストリーム生成段とを有する、
エンコーダ。

Claims (16)

  1. 二つのオーディオ信号をデコードするデコード方法であって、
    前記二つのオーディオ信号のある時間フレームに対応する第一の信号および第二の信号を受領する段階であって、前記第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、第一のクロスオーバー周波数と第二のクロスオーバー周波数の間の周波数に対応する波形符号化されたスペクトル・データを含むダウンミックス信号とを含み、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号を含み、受領される前記第一および第二の波形符号化された信号が、左右形式、和差形式および/またはダウンミックス相補形式で波形符号化されており、相補信号は、受領される前記第一および第二の信号に加えて受領される、信号適応的である重み付けパラメータaに依存し、前記和差形式は前記重み付けパラメータの特定の値に対応する、段階と;
    前記第一および第二の波形符号化された信号が前記第一のクロスオーバー周波数までのすべての周波数について和差形式であるかどうかを検査し、そうでなければ、前記第一および第二の波形符号化された信号を和差形式に変換し、それにより、前記第一の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された和信号と、前記第一のクロスオーバー周波数と前記第二のクロスオーバー周波数の間の周波数に対応するスペクトル・データを含む前記ダウンミックス信号との組み合わせになり、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された差信号を含むようになる、段階と;
    高周波数再構成パラメータを受領する段階と;
    前記高周波数再構成パラメータを使って高周波数再構成を実行することにより前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する段階と;
    アップミックス・パラメータを受領する段階と;
    前記第一および第二の信号を混合してステレオ信号の左および右のチャネルを生成する段階であって、前記第一のクロスオーバー周波数より下の周波数については該混合は前記第一および第二の信号の逆和差変換を実行することを含み、前記第一のクロスオーバー周波数より上の周波数については前記混合は前記アップミックス・パラメータを使うことにより前記ダウンミックス信号のパラメトリックなアップミックスを実行することを含む、段階とを含む、
    デコード方法。
  2. 前記第一および第二の波形符号化された信号を和差形式に変換する前記段階は、重複窓掛け変換領域において実行される、請求項1記載のデコード方法。
  3. 前記重複窓掛け変換領域は修正離散コサイン変換(MDCT)領域である、請求項2記載のデコード方法。
  4. 前記第一および第二の信号を混合してステレオ信号のおよび右のチャネルを生成する前記段階が、直交ミラー・フィルタ(QMF)領域において実行される、請求項1ないし3のうちいずれか一項記載のデコード方法。
  5. 高周波数再構成を実行することにより前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する前記段階が、スペクトル帯域複製(SBR)を実行することを含む、請求項1ないし4のうちいずれか一項記載のデコード方法。
  6. 前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張する前記段階が、前記第一および第二の波形符号化された信号を和差形式に変換したあとに実行される、請求項1ないし5のうちいずれか一項記載のデコード方法。
  7. 前記ダウンミックス信号のパラメトリックなアップミックスの処理が:
    前記ダウンミックス信号の脱相関されたバージョンを生成し;
    前記ダウンミックス信号および前記ダウンミックス信号の前記脱相関されたバージョンを行列演算にかけることを含み、前記行列演算のパラメータは前記アップミックス・パラメータによって与えられる、
    請求項1ないし6のうちいずれか一項記載のデコード方法。
  8. 前記重み付けパラメータaが実数値である、請求項1ないし7のうちいずれか一項記載のデコード方法。
  9. 受領された前記第一および第二の波形符号化された信号は和差形式で波形符号化されており受領された前記第一および第二の信号和差形式で波形符号化された後にそれぞれ前記第一および第二の信号について独立な窓掛けをもつ重複窓掛け変換を使って符号化されたものである、請求項1ないし8のうちいずれか一項記載のデコード方法。
  10. コンピュータに請求項1ないし9のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
  11. 二つのオーディオ信号をデコードするデコーダであって、
    前記二つのオーディオ信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成された受領段であって、前記第一の信号は、第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第一の波形符号化された信号と、第一のクロスオーバー周波数と第二のクロスオーバー周波数の間の周波数に対応する波形符号化されたスペクトル・データを含むダウンミックス信号とを含み、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む第二の波形符号化された信号を含み、受領される前記第一および第二の波形符号化された信号が、左右形式、和差形式および/またはダウンミックス相補形式で波形符号化されており、相補信号は、受領される前記第一および第二の信号に加えて受領される、信号適応的である重み付けパラメータaに依存し、前記和差形式は前記重み付けパラメータの特定の値に対応する受領段と;
    前記受領段の下流の混合段であって、前記第一および第二の信号波形符号化された信号が前記第一のクロスオーバー周波数までのすべての周波数について和差形式であるかどうかを検査し、そうでなければ、前記第一および第二の波形符号化された信号を和差形式に変換し、それにより、前記第一の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された和信号と、前記第一のクロスオーバー周波数と前記第二のクロスオーバー周波数の間の周波数に対応するスペクトル・データを含む前記ダウンミックス信号との組み合わせであり、前記第二の信号は、前記第一のクロスオーバー周波数までの周波数に対応するスペクトル・データを含む波形符号化された差信号を含むようにするよう構成されている混合段と;
    前記混合段の下流の高周波数再構成段であって、高周波数再構成パラメータを受領し、前記高周波数再構成パラメータを使って高周波数再構成を実行することにより前記ダウンミックス信号を前記第二のクロスオーバー周波数より上の周波数範囲に拡張するよう構成されている高周波数再構成段と;
    アップミックス・パラメータを受領し、前記第一および第二の信号を混合してステレオ信号の左および右のチャネルを生成するよう構成されている、前記高周波数再構成段の下流の混合段であって、前記第一のクロスオーバー周波数より下の周波数については該混合段は前記第一および第二の信号の逆和差変換を実行するよう構成されており、前記第一のクロスオーバー周波数より上の周波数については前記混合段は前記アップミックス・パラメータを使うことにより前記ダウンミックス信号のパラメトリックなアップミックスを実行するよう構成されている、混合段とを有する
    デコーダ。
  12. 二つのオーディオ信号をエンコードするエンコード方法であって:
    エンコードされるべき、前記二つの信号のある時間フレームに対応する第一の信号および第二の信号を受領する段階と;
    前記第一および第二の信号を、和差変換を実行することによって、和信号である第一の変換された信号および差信号である第二の変換された信号に変換する段階と;
    前記第一および第二の変換された信号を符号化してそれぞれ第一および第二の符号化された信号にする段階であって、第一のクロスオーバー周波数と第二のクロスオーバー周波数の間の周波数については、前記符号化は前記第一の変換された信号を波形符号化することを含み、前記第一のクロスオーバー周波数までの周波数については、前記符号化は:
    前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、逆和差変換を実行することによって、前記第一および第二の変換された信号を修正する処理、および/または、前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、前記第一および第二の変換された信号に対して行列演算を実行することによって、前記第一および第二の変換された信号をダウンミックス相補形式に変換することによって前記第一および第二の変換された信号を修正する処理であって、前記行列演算は重み付けパラメータaに依存し、前記重み付けパラメータのある特定の値は前記第一および第二の変換された信号を和信号および差信号として維持することに対応する、処理を行ない;
    修正された前記第一および第二の変換された信号を波形符号化することを含み、
    前記第二のクロスオーバー周波数より上の周波数については前記符号化は前記第一の符号化された信号を0に設定することを含む、
    段階と;
    前記第二のクロスオーバー周波数より上の周波数について前記第一の変換された信号の高周波数再構成を可能にする高周波数再構成パラメータを、前記第一の変換された信号に基づいて生成する段階と;
    前記第一のクロスオーバー周波数より上の周波数について前記第一および第二の変換された信号からの前記第一および第二の信号のスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを前記第一および第二の信号に基づいて抽出する段階と;
    前記第一および第二の符号化された信号と、前記パラメトリック・ステレオ・パラメータと、前記高周波数再構成パラメータと、該当すれば前記重み付けパラメータaとを含むビットストリームを生成する段階とを含む、
    エンコード方法。
  13. 前記第一および第二の信号の変換は時間領域で実行される、請求項12記載のエンコード方法。
  14. パラメトリック・ステレオ・パラメータを抽出する前記段階が、まず前記第一および第二の信号を第一の変換された信号および第二の変換された信号に変換する前記の処理を実行し、次いで、前記第一および第二の変換された信号に基づいて前記パラメトリック・ステレオ・パラメータを抽出することによって実行される、請求項12または13記載のエンコード方法。
  15. コンピュータに請求項12ないし14のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
  16. 二つのオーディオ信号をエンコードするエンコーダであって:
    エンコードされるべき、前記二つの信号のある時間フレームに対応する第一の信号および第二の信号を受領するよう構成されている受領段と;
    前記第一および第二の信号を前記受領段から受領し、それらの信号を和差変換を実行することによって和信号である第一の変換された信号および差信号である第二の変換された信号に変換するよう構成されている変換段と;
    前記第一および第二の変換された信号を前記変換段から受領し、それらの信号を符号化してそれぞれ第一および第二の符号化された信号にするよう構成されている符号化段であって、第一のクロスオーバー周波数と第二のクロスオーバー周波数の間の周波数については、前記符号化段は前記第一の変換された信号を波形符号化するよう構成されており、前記第一のクロスオーバー周波数までの周波数については、前記符号化段は:
    前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、逆和差変換を実行することによって、前記第一および第二の変換された信号を修正する処理、および/または、前記第一のクロスオーバー周波数より下の周波数の少なくとも部分集合について、前記第一および第二の変換された信号に対して行列演算を実行することによって、前記第一および第二の変換された信号をダウンミックス相補形式に変換することによって前記第一および第二の変換された信号を修正する処理であって、前記行列演算は重み付けパラメータaに依存し、前記重み付けパラメータのある特定の値は前記第一および第二の変換された信号を和信号および差信号として維持することに対応する、処理を行ない;
    修正された前記第一および第二の変換された信号を波形符号化するよう構成されており、
    前記第二のクロスオーバー周波数より上の周波数については前記符号化段は前記第一の符号化された信号を0に設定するよう構成されている、
    符号化段と;
    前記第二のクロスオーバー周波数より上の周波数について前記第一の変換された信号の高周波数再構成を可能にする高周波数再構成パラメータを、前記第一の変換された信号に基づいて生成するよう構成された高周波数再構成(HFR)段と;
    前記第一のクロスオーバー周波数より上の周波数について前記第一の変換された信号からの前記第一および第二の信号のスペクトル・データの再構成を可能にするパラメトリック・ステレオ・パラメータを前記第一および第二の信号に基づいて抽出するよう構成されたパラメトリック・ステレオ・エンコード段と;
    前記符号化段からの前記第一および第二の符号化された信号および該当するなら前記重み付けパラメータaと、前記パラメトリック・ステレオ・エンコード段からの前記パラメトリック・ステレオ・パラメータと、前記HFRエンコーダ段からの前記高周波数再構成パラメータとを受領し、前記第一および第二の波形符号化された信号、前記パラメトリック・ステレオ・パラメータ、前記高周波数再構成パラメータおよび該当するなら前記重み付けパラメータaを含むビットストリームを生成するよう構成されているビットストリーム生成段とを有する、
    エンコーダ。
JP2016505842A 2013-04-05 2014-04-04 ステレオ・オーディオ・エンコーダおよびデコーダ Active JP6019266B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361808684P 2013-04-05 2013-04-05
US61/808,684 2013-04-05
PCT/EP2014/056854 WO2014161993A1 (en) 2013-04-05 2014-04-04 Stereo audio encoder and decoder

Publications (2)

Publication Number Publication Date
JP2016519786A JP2016519786A (ja) 2016-07-07
JP6019266B2 true JP6019266B2 (ja) 2016-11-02

Family

ID=50473291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016505842A Active JP6019266B2 (ja) 2013-04-05 2014-04-04 ステレオ・オーディオ・エンコーダおよびデコーダ

Country Status (9)

Country Link
US (5) US9570083B2 (ja)
EP (3) EP3528249A1 (ja)
JP (1) JP6019266B2 (ja)
KR (4) KR20160111042A (ja)
CN (6) CN116741188A (ja)
BR (4) BR112015025080B1 (ja)
HK (1) HK1214882A1 (ja)
RU (3) RU2645271C2 (ja)
WO (1) WO2014161993A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
RU2630754C2 (ru) 2013-05-24 2017-09-12 Долби Интернешнл Аб Эффективное кодирование звуковых сцен, содержащих звуковые объекты
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
ES2643789T3 (es) 2013-05-24 2017-11-24 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
EP3044783B1 (en) * 2013-09-12 2017-07-19 Dolby International AB Audio coding
JP6392353B2 (ja) 2013-09-12 2018-09-19 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオ・コンテンツの符号化
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
CN107004421B (zh) * 2014-10-31 2020-07-07 杜比国际公司 多通道音频信号的参数编码和解码
EP3246923A1 (en) 2016-05-20 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a multichannel audio signal
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN112951252B (zh) * 2021-05-13 2021-08-03 北京百瑞互联技术有限公司 一种lc3音频码流的混音方法、装置、介质及设备

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60311794C5 (de) 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
BR0311601A (pt) * 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
JP4939933B2 (ja) 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
ATE474310T1 (de) 2004-05-28 2010-07-15 Nokia Corp Mehrkanalige audio-erweiterung
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
PL1810281T3 (pl) * 2004-11-02 2020-07-27 Koninklijke Philips N.V. Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
MX2007005261A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1851760B1 (en) 2005-02-10 2015-10-07 Koninklijke Philips N.V. Sound synthesis
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
ATE532350T1 (de) * 2006-03-24 2011-11-15 Dolby Sweden Ab Erzeugung räumlicher heruntermischungen aus parametrischen darstellungen mehrkanaliger signale
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US20080232601A1 (en) 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
JPWO2008132850A1 (ja) 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
PL2137725T3 (pl) * 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
WO2009067741A1 (en) * 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
ES2898865T3 (es) * 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
CN102089816B (zh) * 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
EP2626855B1 (en) 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
EP2483887B1 (en) * 2009-09-29 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mpeg-saoc audio signal decoder, method for providing an upmix signal representation using mpeg-saoc decoding and computer program using a time/frequency-dependent common inter-object-correlation parameter value
EP2513899B1 (en) 2009-12-16 2018-02-14 Dolby International AB Sbr bitstream parameter downmix
ES2935911T3 (es) * 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT

Also Published As

Publication number Publication date
US20190088266A1 (en) 2019-03-21
WO2014161993A1 (en) 2014-10-09
EP4300488A3 (en) 2024-02-28
BR122021009022B1 (pt) 2022-08-16
BR112015025080A2 (pt) 2017-07-18
BR122021009025B1 (pt) 2022-08-30
CN110047496A (zh) 2019-07-23
CN116741188A (zh) 2023-09-12
CN110010140B (zh) 2023-04-18
US10163449B2 (en) 2018-12-25
US20230245667A1 (en) 2023-08-03
KR20190134821A (ko) 2019-12-04
US20200286497A1 (en) 2020-09-10
CN110010140A (zh) 2019-07-12
RU2665214C1 (ru) 2018-08-28
CN105103225A (zh) 2015-11-25
EP3528249A1 (en) 2019-08-21
CN116741187A (zh) 2023-09-12
US20160027446A1 (en) 2016-01-28
CN105103225B (zh) 2019-06-21
BR122017006701B1 (pt) 2022-03-03
US9570083B2 (en) 2017-02-14
CN116741186A (zh) 2023-09-12
JP2016519786A (ja) 2016-07-07
KR20230020553A (ko) 2023-02-10
CN110047496B (zh) 2023-08-04
US11631417B2 (en) 2023-04-18
RU2690885C1 (ru) 2019-06-06
HK1214882A1 (zh) 2016-08-05
RU2015147181A (ru) 2017-05-16
KR20160111042A (ko) 2016-09-23
EP2981960A1 (en) 2016-02-10
US20170133025A1 (en) 2017-05-11
BR112015025080B1 (pt) 2021-12-21
EP4300488A2 (en) 2024-01-03
RU2645271C2 (ru) 2018-02-19
EP2981960B1 (en) 2019-03-13
BR122017006701A2 (pt) 2019-09-03
KR20150126651A (ko) 2015-11-12
RU2019116192A (ru) 2020-11-27
US10600429B2 (en) 2020-03-24

Similar Documents

Publication Publication Date Title
JP6019266B2 (ja) ステレオ・オーディオ・エンコーダおよびデコーダ
JP7413418B2 (ja) 信号をインタリーブするためのオーディオ復号器
JP2022010239A (ja) マルチチャネル・オーディオ・コンテンツの符号化
JP2021507316A (ja) オーディオ信号の高周波再構成技術の後方互換性のある統合
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161003

R150 Certificate of patent or registration of utility model

Ref document number: 6019266

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250