JP5122681B2 - パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ - Google Patents

パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ Download PDF

Info

Publication number
JP5122681B2
JP5122681B2 JP2011510076A JP2011510076A JP5122681B2 JP 5122681 B2 JP5122681 B2 JP 5122681B2 JP 2011510076 A JP2011510076 A JP 2011510076A JP 2011510076 A JP2011510076 A JP 2011510076A JP 5122681 B2 JP5122681 B2 JP 5122681B2
Authority
JP
Japan
Prior art keywords
signal
parametric stereo
downmix
monaural
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011510076A
Other languages
English (en)
Other versions
JP2011522472A (ja
JP2011522472A5 (ja
Inventor
エリク ジー ピー シュエイエルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011522472A publication Critical patent/JP2011522472A/ja
Publication of JP2011522472A5 publication Critical patent/JP2011522472A5/ja
Application granted granted Critical
Publication of JP5122681B2 publication Critical patent/JP5122681B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

本発明は、空間パラメータに基づいてモノラルのダウンミクス信号から左信号及び右信号を生成するための、パラメトリックステレオアップミクス装置に関する。本発明は更に、パラメトリックステレオアップミクス装置を有するパラメトリックステレオデコーダ、空間パラメータに基づいてモノラルのダウンミクス信号から左信号及び右信号を生成するための方法、オーディオ再生装置、パラメトリックステレオダウンミクス装置、パラメトリックステレオエンコーダ、差分信号のための予測残留信号を生成するための方法、及びコンピュータプログラムに関する。
パラメトリックステレオ(PS)は、ここ数年のオーディオエンコードにおける大きな進展のひとつである。パラメトリックステレオの基礎は、J. Breebaart、S. van de Par、A. Kohlrausch及びE. Schuijersによる「Parametric Coding of Stereo Audio」(EURASIP J. Appl. Signal Process. 、vol. 9、1305-1322頁、2004年)に説明されている。従来方法、即ちオーディオ信号のいわゆる離散符号化に比べ、図1に示されるようなPSエンコーダは、ステレオ信号対(l、r)101、102を、単一のモノラルのダウンミクス信号104と、空間像を記述する少量のパラメトリック103とに変換する。これらパラメータは、チャネル間強度差(iids)、チャネル間位相(又は時間)差(ipds/itds)及びチャネル間コヒーレンス/相関(iccs)を有する。PSエンコーダ100において、ステレオ入力信号(l、r)の空間像が解析され、iid、ipd及びiccパラメータが得られる。好適には、これらパラメータは、時間及び周波数に依存する。各時間/周波数タイルについて、iid、ipd及びiccパラメータが決定される。これらパラメータは量子化及びエンコードされ(140)、PSビットストリームに帰着する。更に、これらパラメータは一般に、ステレオ入力信号のダウンミクスがどのように生成されるかを制御するためにも利用される。結果のモノラルの合計信号104は次いで、旧来のモノラルオーディオエンコーダ120を用いてエンコードされる。最後に、結果のモノラルのビットストリームとPSビットストリームとが併合され、全体のステレオビットステレオ107を構築する。
PSデコーダ200において、ステレオビットストリームは、モノラルのビットストリーム202とPSビットストリーム203とに分割される。モノラルのオーディオ信号がデコードされ、モノラルのダウンミクス信号204の再構築に帰着する。該モノラルのダウンミクス信号は、デコードされた空間像パラメータ205と共に、PSアップミクス230に供給される。該PSアップミクスは次いで、出力ステレオ信号対(l、r)206、207を生成する。iccのキューを合成するため、PSアップミクスは、いわゆる非相関信号(sd)を利用する。即ち、凡そ同じスペクトル及び時間エンベロープを持つが、モノラル入力信号に対して略ゼロの相関を持つモノラルオーディオ信号から、信号が生成される。次いで、空間像パラメータに基づいて、各時間/周波数タイルについてのPSアップミクス内で、以下のように2x2行列が決定され適用される。
Figure 0005122681
ここでHijは(i,j)アップミクス行列Hのエントリを表す。H行列のエントリは、PSパラメータであるiid、iic及び任意にipd/opdの関数である。最先端のPSシステムにおいては、ipd/opdパラメータが利用される場合、アップミクス行列Hは以下のように分解されることができる。
Figure 0005122681
ここで左辺の2x2行列は位相回転を表し、ipd及びopdパラメータの関数であり、右辺の2x2行列は、iid及びiicパラメータを復元する部分を表す。
国際特許出願公開WO2003090206A1において、デコーダにおいてipdを左及び右チャネルに等しく分散させることが提案されている。更に、測定されたipdを半分にして整合を得ることにより、左及び右信号を共に互いに向かって回転させることにより、ダウンミクス信号を生成することが提案されている。実際には、略位相が整合していない信号の場合、このことは、エンコーダにおいて生成されたダウンミクスとデコーダにおいて生成されたアップミクスの両方について、時間とともにipdが約180度の周囲で僅かに変化することに帰着し、このことはラッピングが179、178、−179、177、−179、…のような角度のシーケンスから成り得ることによる。これらのジャンプの結果、ダウンミクスにおける後続する時間/周波数タイルは位相の不連続、又は換言すれば位相の不安定を呈する。本質的なオーバラップ−加算合成構成のため、このことは可聴のアーティファクトに帰着する。
一例として、或る時間/周波数タイルにおいて、ダウンミクスが
s=lej(π/2−ε)+rej(−π/2+ε)
のように生成され、ここでεは何らかの任意の小さな角度であり、測定されたipdが180度に近かったことを意味し、次の時間−周波数タイルについては、ダウンミクスが
s=lej(−π/2+ε)+rej(π/2−ε)
のように生成され、測定されたipdが−180度に近かったことを意味する、ダウンミクスを考える。一般的なオーバラップ−加算合成を用いると、連続する時間/周波数タイルの中間点の間で位相相殺が生じることとなる。
以上に議論されたパラメトリックステレオ符号化の主な欠点は、出力ステレオ対を生成する際に利用されるPSデコーダにおける両耳間位相差(ipd)のキューの合成の不安定さである。該不安定さは、ダウンミクスを生成するためにPSエンコーダにおいて、及び出力信号を生成するためにPSデコーダにおいて、実行される位相修正に起因する。該不安定さの結果、出力ステレオ対の、より低いオーディオ品質が知覚されることとなる。
該位相不安定の問題に対処するため、実際には、ipd合成がしばしば破棄される。しかしながら、このことは、再構築されたステレオ信号の低減された(空間)オーディオ品質に帰着する。
ipdパラメータが利用される場合の該不安定問題に対処する他の代替策は、位相基準を持つデコーダを提供するために、いわゆる全体位相差(opds)をビットストリームに組み込むことである。このようにして、共通の位相回転を可能とすることにより、時間/周波数タイルに亘る連続性が増大させられ得る。しかしながら、このことはビットレートの増大と引き換えに実現され、従って全体のシステム性能の低下に帰着する。
本発明の目的は、付加的なビットレートの増大を伴うことなく生成される左及び右信号の改善されたオーディオ品質を持ち、且つ両耳間位相差(ipds)合成により引き起こされる不安定さの問題のない、モノラルのダウンミクス信号から左信号及び右信号を生成するための改善されたパラメトリックステレオアップミクス装置を提供することにある。
本目的は、予測係数を用いてスケーリングされたモノラルダウンミクス信号に基づいて左信号と右信号との差を有する差分信号を予測するための手段を有する、パラメトリックステレオ(PS)アップミクス装置により達成される。該予測係数は、前記空間パラメータから導出される。該PSアップミクス装置は更に、前記モノラルダウンミクス信号と前記差分信号との合計及び差分に基づいて前記左信号及び前記右信号を導出するための算術手段を有する。
提案されるPSアップミクス装置は、既知のPSデコーダとは異なる、左信号及び右信号の導出の方法を提供する。既知のPSデコーダにおけるように統計的な意味で正しい空間像を復元するために空間パラメータを適用する代わりに、提案されるPSアップミクス装置は、モノラルダウンミクス信号及び空間パラメータから差分信号を構築する。既知のPSも提案されるPSも、正しい出力比(iids)、相互相関(iccs)及び位相関係(ipds)を復元することも目的としている。しかしながら、既知のPSデコーダは、最も正確な波形の合致を得ようとするものではない。その代わりに、測定されたエンコーダパラメータが、復元されたデコーダパラメータに統計的に合致することを保証するものである。提案されるPSアップミクスにおいては、モノラルダウンミクス信号及び推定された差分信号に適用される、合計及び差分のような単純な算術演算により、左信号及び右信号が得られる。斯かる構築は、再構築される左及び右信号の品質及び安定性に対して優れた結果をもたらす。なぜなら、信号の元の位相の振舞を復元する近接波形合致を提供するからである。
一実施例においては、前記予測係数は、前記差分信号に対する前記ダウンミクス信号の波形マッチングに基づく。波形マッチング自体が、ipd及びopd合成のために既知のPSデコーダにおいて利用される統計的手法ほど、不安定さの問題に直面しない。なぜなら、本質的に位相保存を提供するからである。従って、(複素値の)スケーリングされたモノラルダウンミクス信号として導出された差分信号を利用し、波形マッチングに基づいて予測計数を導出することにより、既知のPSデコーダの不安定さの要因が除去される。該波形マッチングは、例えば差分信号に対するモノラルダウンミクス信号の最小二乗マッチングを有し、差分信号を
d=α・s
と算出し、ここでsはダウンミクス信号であり、αは予測係数である。最小二乗予測法は、
Figure 0005122681
により与えられることは良く知られており、ここで<s,d>*はダウンミクスと差分信号との相互相関の複素共役を表し、<s,s>はダウンミクス信号の出力を表す。
更なる実施例においては、前記予測係数は、前記空間パラメータの関数として、
Figure 0005122681
により与えられ、ここでiid、ipd及びiccは空間パラメータであり、iidはチャネル間強度差であり、ipdはチャネル間位相差であり、iccはチャネル間コヒーレンスである。知覚的に有意義な意味で複素値の予測係数αを量子化することは、一般に困難である。なぜなら、必要される正確さが、再構築されるべき左及び右信号の特性に依存するからである。それ故、本実施例の利点は、複素数の予測係数αと比べて、空間パラメータについての必要とされる量子化の正確さが、心理音響学から良く知られている点である。従って、心理音響学の知識の最適な利用が、予測係数を効率的に、即ちとり得る最小のステップで量子化して、ビットレートを低減するために利用され得る。更に、本実施例は、後方互換性のあるPSコンテンツを用いたアップミクスを可能とする。
更なる実施例においては、前記差分信号を予測するための手段は、スケーリングされた非相関モノラルダウンミクス信号を加算することにより前記差分信号を拡張するように構成される。一般に、モノラルダウンミクス信号から元のエンコーダ差分信号を完全に予測することは不可能であるため、残留信号をもたらす。該残留信号は、ダウンミクス信号とは相関を持たない。なぜなら、そうでないならば、予測係数により考慮に入れられているはずであるからである。多くの場合、残留信号は、録音の反響音場を有する。残留信号は、モノラルダウンミクス信号から導出される、非相関モノラルダウンミクス信号を用いて効果的に合成されることができる。
更なる実施例においては、前記非相関モノラルダウンミクスは、前記モノラルダウンミクス信号のフィルタリングにより得られる。該フィルタリングの目的は、モノラルダウンミクス信号と類似するスペクトル及び時間エンベロープを持つが、ゼロに略近い相関を持つ信号を効果的に生成し、該信号がエンコーダにおいて導出された残留成分の合成変形に対応するようにすることである。このことは例えば、全通過フィルタリング、遅延、格子反響フィルタリング、フィルタリング遅延網、又はこれらの組み合わせにより達成され得る。加えて、非相関信号の各時間/周波数タイルについての出力がモノラルダウンミクス信号の出力に略対応することを確実にするため、非相関信号に出力正規化が適用されても良い。このようにして、デコーダ出力信号が、適正な量の非相関信号出力を含むことが確実にされる。
更なる実施例においては、前記非相関モノラルダウンミクスに適用されるスケーリング因子は、予測エネルギー損失を補償するように設定される。非相関モノラルダウンミクスに適用されるスケーリング因子は、デコーダ側における左信号と右信号の全体の信号出力が、エンコーダ側におけるそれぞれ左信号と右信号の信号出力に合致することを確実にする。従って、スケーリング因子βは、予測エネルギー損失補償因子としても解釈され得る。
更なる実施例においては、前記非相関モノラルダウンミクスに適用されるスケーリング因子は、前記空間パラメータの関数として、
Figure 0005122681
により与えられ、ここでiid、ipd及びiccは空間パラメータであり、iidはチャネル間強度差であり、ipdはチャネル間位相差であり、iccはチャネル間コヒーレンスであり、αは前記予測係数である。予測係数の場合と同様に、非相関スケーリング因子βを空間パラメータの関数として表現することは、これら空間パラメータの必要とされる量子化の正確さについての知識の利用を可能とする。従って、心理音響の最適な使用が、ビットレートを低減するために利用され得る。
更なる実施例においては、前記パラメトリックステレオアップミクスは、付加的な入力として前記差分信号についての予測残留信号を持ち、前記算術手段は、前記モノラルダウンミクス信号、前記差分信号及び前記差分信号についての前記予測残留信号に基づいて、前記左信号及び前記右信号を導出するように構成される。信号の長い名称を避けるため、予測残留信号なる語句は、本明細書の残りの部分を通じて、差分信号についての予測残留信号のために用いられる。予測残留信号は、元のエンコーダにおける該信号に相当する信号による、合成非相関信号の代替として動作する。このことは、デコーダにおいて元のステレオ信号を復元することを可能とする。しかしながら、このことは、付加的なビットレートと引き換えに為される。なぜなら、予測信号は、エンコードされデコーダに送信される必要があるからである。それ故、典型的には、予測残留信号の帯域幅は制限される。予測残留信号は、所与の時間/周波数タイルについての非相関モノラルダウンミクス信号を完全に置き換えても良いし、又は相補的な態様で動作しても良い。後者は、予測残留信号が僅かにしか符号化されない場合、例えば最上位周波数ビンの幾つかのみがエンコードされるような場合に、有益となり得る。この場合、エンコーダの状況に比べて、依然としてエネルギーが失われることとなる。このエネルギーの欠如は、非相関信号により埋め合わせられる。このとき、新たな非相関スケーリング因子β'が、
Figure 0005122681
と算出され、ここで<dres,cod,dres,cod>は符号化された予測残留信号の信号出力であり、<s,s>はモノラルダウンミクス信号の出力である。これらの信号出力はデコーダ側で測定されることができ、従って信号パラメータとして送信される必要がない。
本発明は更に、前記パラメトリックステレオアップミクス装置を有するパラメトリックステレオデコーダ、及び前記パラメトリックステレオデコーダを有するオーディオ再生装置を提供する。
本発明はまた、パラメトリックステレオダウンミクス装置、及び前記パラメトリックステレオダウンミクス装置を有するパラメトリックステレオエンコーダを提供する。
本発明は更に、方法請求項、及びプログラム可能な装置が本発明による方法を実行することを可能とするコンピュータプログラムを提供する。
本発明のこれらの及び他の態様は、図面に示される実施例を参照しながら説明され明らかとなるであろう。
図面を通して、同一の参照番号は類似する又は対応する特徴を示す。図面に示される特徴の幾つかは、典型的にはソフトウェアで実装され、それ自体がソフトウェアモジュール又はオブジェクトのようなソフトウェアエンティティを表す。
パラメトリックステレオエンコーダ(先行技術)のアーキテクチャを模式的に示す。 パラメトリックステレオデコーダ(先行技術)のアーキテクチャを模式的に示す。 空間パラメータに基づいてモノラルのダウンミクス信号から左信号及び右信号を生成する、本発明によるパラメトリックステレオアップミクス装置を示す。 スケーリングされた非相関モノラルダウンミクス信号を加算することにより差分信号を拡張するように構成された予測手段を有するパラメトリックステレオアップミクス装置を示す。 付加的な入力として差分信号についての予測残留信号を持つパラメトリックステレオアップミクス装置を示す。 本発明によるパラメトリックステレオアップミクス装置を有するパラメトリックステレオデコーダを示す。 本発明による、空間パラメータに基づいてモノラルのダウンミクス信号から左信号及び右信号を生成するための方法についてのフロー図を示す。 空間パラメータに基づいて左信号及び右信号からモノラルのダウンミクス信号を生成する、本発明によるパラメトリックステレオダウンミクス装置を示す。 本発明によるパラメトリックステレオダウンミクス装置を有するパラメトリックステレオエンコーダを示す。
図3は、本発明によるパラメトリックステレオアップミクス装置300を示す。該パラメトリックステレオアップミクス装置300は、空間パラメータ205に基づいてモノラルのダウンミクス信号204から左信号206及び右信号207を生成する。
該パラメトリックステレオアップミクス装置300は、予測係数321によりスケーリングされたモノラルダウンミクス信号204に基づいて左信号206と右信号207との間の差を有する差分信号311を予測するための手段310であって、予測係数321は、ユニット320内において空間パラメータ205から導出されるものである手段310と、モノラルダウンミクス信号204と該差分信号311との合計及び差分に基づいて左信号206及び右信号207を導出するための算出手段330とを有している
左信号206及び右信号207は好適には以下のように再構築される。
l=s+d
r=s−d
ここでsはモノラルダウンミクス信号であり、dは差分信号である。このことは、エンコーダ合計信号が
Figure 0005122681
として算出されるという仮定に基づくものである。
実際には、左信号206及び右信号207を構築する際に利得正規化がしばしば適用される:
Figure 0005122681
ここでcは利得正規化定数であり、空間パラメータの関数である。利得正規化は、モノラルダウンミクス信号204の出力が、左信号206及び右信号207の出力の合計に等しくなることを確実にする。この場合、エンコーダ合計信号が、
s=c・(l+r)
として算出された。
空間パラメータは、予めエンコーダにおいて決定され、パラメトリックステレオアップミクス300を有するデコーダに送信される。該空間パラメータは、以下のように、各時間/周波数タイル毎に、フレーム毎に決定される。
Figure 0005122681
ここでiidはチャネル間強度差であり、iccはチャネル間コヒーレンスであり、ipdはチャネル間位相差であり<l,l>及び<r,r>はそれぞれ左及び右信号出力であり、<l,r>は左信号と右信号との間の正規化されていない複素値共分散係数を表す。
DFT(FFT)のような典型的な複素値周波数ドメインについては、これら出力は、
Figure 0005122681
のように測定される。ここでktileはパラメータ帯域に対応するDFTビンを表す。ここで、例えばP. Ekstrandによる「Bandwidth extension of audio signals by spectral band replication」(Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002) 、Leuven、ベルギー、2002年11月、73−79頁)に記載されたような、複素指数変調QMFバンクのような、他の複素ドメイン表現が利用されても良いことに留意されたい。
1.5乃至2kHzまでの低周波数については、以上の式が成り立つ。しかしながら、より高い周波数については、ipdパラメータは知覚に重要ではなく、それ故これらパラメータはゼロ値に設定され、以下に帰着する。
Figure 0005122681
代替としては、高い周波数においては位相差よりも広帯域エンベロープが知覚に重要であるため、iccは
Figure 0005122681
と算出される。
利得正規化定数cは、
Figure 0005122681
と表現される。
左信号と右信号との位相が合っていないためにcは無限大に近づき得るため、利得正規化定数cの値は典型的には以下のように制限される。
Figure 0005122681
ここでcmaxは最大増幅因子であり、例えばcmax=2である。
一実施例においては、前記予測係数は、波形マッチングを用いたモノラルダウンミクス信号204からの差分信号311の推定に基づく。該波形マッチングは、例えば差分信号311に対するモノラルダウンミクス信号204の最小二乗マッチングを有し、
d=α・s
と与えられる差分信号に帰着し、ここでsはモノラルダウンミクス信号204であり、αは予測係数321である。
最小二乗マッチングの他にも、Lノルム以外のノルムを用いた波形マッチングが利用され得る。代替としては、pノルム誤差||d−α・s||が、例えば知覚的に重み付けされても良い。しかしながら、送信された空間像パラメータから予測係数を導出するための比較的単純な計算に帰着するため、最小二乗マッチングが有利である。
予測係数αについての最小二乗予測法は、
Figure 0005122681
により与えられることが良く知られている。ここで<s,d>はモノラルダウンミクス信号204と差分信号311との相互相関の複素共役を表し、<s,s>はモノラルダウンミクス信号の出力を表す。
更なる実施例においては、予測係数321は、以下のように、空間パラメータの関数として与えられる。
Figure 0005122681
該予測係数は、以上の式に従って、ユニット320において算出される。
図4は、スケーリングされた非相関モノラルダウンミクス信号を加算することにより差分信号を拡張するように構成された予測手段310を有する、パラメトリックステレオアップミクス装置300を示す。モノラルダウンミクス信号204は、非相関化のためのユニット340に供給される。その結果、ユニット340の出力部において、非相関モノラルダウンミクス信号341が供給される。予測手段310において、差分信号の第1の部分が、予測係数321を用いてモノラルダウンミクス信号204をスケーリングすることにより算出される。更に、非相関モノラルダウンミクス信号341もまた、スケーリング因子322を用いて、予測手段310においてスケーリングされる。その結果の差分信号の第2の部分は、差分信号の第1の部分に加算され、拡張された差分信号311に帰着する。モノラルダウンミクス信号204及び拡張された差分信号311は算術手段330に供給され、該算術手段330が左信号206及び右信号207を算出する。
一般に、予測係数を用いてスケーリングを行うだけでは、モノラルダウンミクス信号から差分信号を正確に予測することはできない。このことは、残留信号dres=d−α・sをもたらす。該残留信号は、ダウンミクス信号とは相関を持たない。なぜなら、そうでないならば、予測係数により考慮に入れられているはずであるからである。多くの場合、残留信号は、録音の反響音場を有する。残留信号は、モノラルダウンミクス信号から導出される、非相関モノラルダウンミクス信号を用いて効果的に合成される。該非相関信号は、予測手段310において算出された差分信号の第2の部分である。
更なる実施例においては、該非相関モノラルダウンミクス341は、モノラルダウンミクス信号204のフィルタリングにより得られる。該フィルタリングは、ユニット340において実行される。該フィルタリングは、モノラルダウンミクス信号204と類似するスペクトル及び時間エンベロープを持つが、ゼロに略近い相関を持つ信号を生成し、該信号がエンコーダにおいて導出された残留成分の合成変形に対応するようにする。この効果は例えば、全通過フィルタリング、遅延、格子反響フィルタリング、フィルタリング遅延網、又はこれらの組み合わせにより達成される。
更なる実施例においては、非相関モノラルダウンミクス341に適用されるスケーリング因子322が、予測エネルギー損失を補償するように設定される。非相関モノラルダウンミクス341に適用されるスケーリング因子322は、パラメトリックステレオアップミクス装置300の出力部における左信号206及び右信号207の全体信号出力が、エンコーダ側におけるそれぞれ左及び右信号出力の信号出力と合致することを確実にする。従って、スケーリング因子(以下βとして示される)は、予測エネルギー損失補償因子として解釈される。このとき、差分信号dは、
d=α・s+β・s
として表され、sは非相関モノラルダウンミクス信号である。
該スケーリング因子322は、差分信号d及びモノラルダウンミクス信号sに対応する信号出力によって、
Figure 0005122681
と表現され得ることが分かる。
更なる実施例においては、非相関モノラルダウンミクス341に適用されるスケーリング因子322が、以下のように、空間パラメータ205の関数として与えられる。
Figure 0005122681
該スケーリング因子322は、ユニット320において導出される。
エンコーダにおいてダウンミクス正規化が適用されていない場合、即ちダウンミクス信号がs=1/2(l+r)として算出された場合、左信号206及び右信号207は、
Figure 0005122681
と表現される。
ダウンミクスが適用されている場合、即ちダウンミクス信号がs=c(l+r)として算出された場合、左信号206及び右信号207は、
Figure 0005122681
と表現される。
図5は、付加的な入力として差分信号についての予測残余信号331を持つパラメトリックステレオアップミクス装置500を示す。算術手段330は、モノラルダウンミクス信号204、差分信号311及び該予測残余信号331に基づいて、左信号206及び右信号207を導出するように構成される。手段310は、予測係数321を用いてスケーリングされたモノラルダウンミクス信号204に基づいて、差分信号311を予測する。該予測係数321は、空間パラメータ205に基づいて、ユニット320において導出される。
左信号206及び右信号207は、それぞれ
l=s+d+dres
r=s−d−dres
と与えられ、ここでdresは予測残留信号である。
代替として、出力正規化がダウンミクスに適用されているが、残留信号には適用されていない場合には、左信号及び右信号は、
Figure 0005122681
と導出される。
予測残留信号331は、元のエンコーダにおける該信号に相当する信号による、合成非相関信号341の代替として動作する。該信号は、パラメトリックステレオアップミクス装置300により元のステレオ信号を復元することを可能とする。予測残留信号331は、所与の時間/周波数タイルについての非相関モノラルダウンミクス信号341を完全に置き換えても良いし、又は相補的な態様で動作しても良い。後者は、予測残留信号が僅かにしか符号化されない場合、例えば最上位周波数ビンの幾つかのみがエンコードされるような場合に、有益である。この場合、エンコーダ予測残留信号と比べて、依然としてエネルギーが失われることとなる。このエネルギーの欠如は、非相関信号341により埋め合わせられる。このとき、新たな非相関スケーリング因子β'が、
Figure 0005122681
と算出され、ここで<dres,cod,dres,cod>は符号化された予測残留信号の信号出力であり、<s,s>はモノラルダウンミクス信号204の出力である。
パラメトリックステレオアップミクス装置300は、パラメトリックステレオデコーダの最先端の構成において、いずれの追加的な適合なく利用されることができる。この場合、パラメトリックステレオアップミクス装置300は、図2に示されたようなアップミクスユニット230を置き換える。予測残留信号331がパラメトリックステレオアップミクス400により利用される場合には、図6に示される幾つかの適合が必要となる。
図6は、本発明によるパラメトリックステレオアップミクス装置400を有するパラメトリックステレオデコーダを示す。パラメトリックステレオデコーダは、入力ビットストリームを、モノラルビットストリーム202と予測残留ビットストリーム332とパラメータビットストリーム203とに分割するための多重分離手段210を有する。モノラルデコード手段220は、該モノラルビットストリーム202をモノラルダウンミクス信号204にデコードする。該モノラルデコード手段は更に、予測残留ビットストリーム332を予測残留信号331にデコードするように構成される。パラメータデコード手段240は、パラメータビットストリーム203を空間パラメータ205にデコードする。パラメトリックステレオアップミクス装置400は、空間パラメータ205に基づいて、モノラルダウンミクス信号204及び予測残留信号331から、左信号206及び右信号207を生成する。モノラルダウンミクス信号204及び予測残留信号のデコードはデコード手段220により実行されるが、該デコードはデコードされるべき信号のそれぞれのための別個のデコードソフトウェア及び/又はハードウェアにより実行されることも可能である。
図7は、本発明による、空間パラメータに基づいてモノラルダウンミクス信号204から左信号206及び右信号207を生成するための方法のフロー図を示す。第1のステップ710において、左信号206と右信号207との間の差を有する差分信号311が、予測係数321を用いてスケーリングされたモノラルダウンミクス信号204に基づいて予測され、ここで該予測係数は空間パラメータ205から導出される。第2のステップ720において、モノラルダウンミクス信号204と該差分信号311との合計及び差分に基づいて左信号206及び右信号207が導出される。
第2のステップ720において予測残留信号が利用可能である場合には、モノラルダウンミクス信号204及び分信号311に加えて該測残留信号が、左信号206及び右信号207を導出するために利用される。
パラメトリックステレオデコーダにおいてパラメトリックステレオアップミクス300が利用される場合には、パラメトリックステレオエンコーダに対する変更は必要とされない。先行技術において知られたパラメトリックステレオエンコーダが用いられることができる。
しかしながら、パラメトリックステレオアップミクス400が利用される場合には、パラメトリックステレオエンコーダは、ビットストリームに予測残留信号を供給するように適合される必要がある。
図8は、空間パラメータに基づいて左信号及び右信号からモノラルダウンミクス信号を生成する、本発明によるパラメトリックステレオダウンミクス装置800を示す。該パラメトリックステレオダウンミクス装置800は、モノラルダウンミクス信号104に加え、予測残留信号である更なる信号801を出力する。該パラメトリックステレオダウンミクス装置800は、左信号101と右信号102との間の差を有する差分信号811、及びモノラルダウンミクス信号104を導出するための、更なる算術手段810を有する。該パラメトリックステレオダウンミクス装置800は更に、空間パラメータ103から導出された所定の予測係数831を用いてスケーリングされたモノラルダウンミクス信号104と差分信号811との間の差として予測残留信号(差分信号についての)を導出するための更なる予測手段820を有する。該所定の予測係数は、ユニット830において決定される。該所定の予測係数は、モノラルダウンミクス信号104に直交する予測残留信号801を提供するように選択される。加えて、ダウンミクス信号の出力正規化が利用されても良い(図8には図示されていない)。
パラメトリックステレオアップミクス装置とパラメトリックステレオダウンミクス装置とにおいて、モノラルダウンミクス及び予測残留に対応する信号の番号は異なる参照番号を持っているが、モノラルダウンミクス信号204及び104は互いに対応し、予測残留信号331及び801も互いに対応することは明らかであろう。
図9は、本発明によるパラメトリックステレオダウンミクス装置800を有するパラメトリックステレオエンコーダを示す。該パラメトリックステレオエンコーダは、
左信号101及び右信号102から空間パラメータ103を導出するための推定手段130と、
空間パラメータ103に基づいて左信号101及び右信号102からモノラルダウンミクス信号104を生成するための、本発明によるパラメトリックステレオダウンミクス手段110と、
モノラルダウンミクス信号104をモノラルビットストリーム105にエンコードするためのモノラルエンコード手段120であって、予測残留信号801を予測残留ビットストリーム802にエンコードするように更に構成されたモノラルエンコード手段120と、
空間パラメータ103をパラメータビットストリーム106にエンコードするためのパラメータエンコード手段140と、
モノラルビットストリーム105とパラメータビットストリーム106と予測残留ビットストリーム802とを出力ビットストリーム107へと併合するための多重化手段150と、
を有する。
モノラルダウンミクス信号104及び予測残留信号801のエンコードはエンコード手段120により実行されるが、該エンコードは、エンコードされるべき信号のそれぞれのための別個のエンコードソフトウェア及び/又はハードウェアにより実行されることも可能である。
更に、複数の手段、要素又は方法ステップは、別個に列記されていても、例えば単一のユニット又はプロセッサにより実装されても良い。加えて、個々の特徴が異なる請求項に含められ得るが、これら特徴は有利に組み合わせられても良く、異なる請求項に含められていることは、これら特徴の組み合わせが利用可能ではない及び/又は有利ではないことを意味するものではない。また、或るカテゴリの請求項に特徴を含むことは、該カテゴリに対する限定を意味するものではなく、該特徴が他の請求項のカテゴリに適宜等しく適用可能であることを示す。更に、請求項における特徴の順序は、これら特徴が動作する順序を示すものではなく、またとりわけ、方法の請求項における個々のステップの順序は、これらステップが該順序で実行される必要があることを示すものではない。これらステップは、いずれの適切な順序で実行されても良い。加えて、単数形の参照は複数を除外するものではない。従って、「1つの(a、an)」、「第1の(first)」及び「第2の(second)」等への参照は、複数を除外するものではない。請求項における参照記号は単に例を明確にするためのものであり、いずれの態様においても請求項の範囲を限定するものとして解釈されるべきではない。

Claims (17)

  1. 空間パラメータに基づいてモノラルダウンミクス信号から左信号及び右信号を生成するための、パラメトリックステレオアップミクス装置において、前記パラメトリックステレオアップミクス装置は、前記空間パラメータから導出される予測係数を用いてスケーリングされた前記モノラルダウンミクス信号に基づいて前記左信号と前記右信号との差を有する差分信号を予測するための手段と、前記モノラルダウンミクス信号と前記差分信号との合計及び差分に基づいて前記左信号及び前記右信号を導出するための算術手段と、を有することを特徴とする、パラメトリックステレオアップミクス装置。
  2. 前記予測係数は、前記差分信号に対する前記ダウンミクス信号の波形マッチングに基づく、請求項1に記載のパラメトリックステレオアップミクス装置。
  3. 前記予測係数は、前記空間パラメータの関数として、
    Figure 0005122681
    により与えられ、ここでiid、ipd及びiccは空間パラメータであり、iidはチャネル間強度差であり、ipdはチャネル間位相差であり、iccはチャネル間コヒーレンスである、請求項2に記載のパラメトリックステレオアップミクス装置。
  4. 前記差分信号を予測するための手段は、スケーリングされた非相関モノラルダウンミクス信号を加算することにより前記差分信号を拡張するように構成された、請求項1乃至3のいずれか一項に記載のパラメトリックステレオアップミクス装置。
  5. 前記非相関モノラルダウンミクスは、前記モノラルダウンミクス信号のフィルタリングにより得られる、請求項4に記載のパラメトリックステレオアップミクス装置。
  6. 前記非相関モノラルダウンミクスに適用されるスケーリング因子は、予測エネルギー損失を補償するように設定される、請求項4に記載のパラメトリックステレオアップミクス装置。
  7. 前記非相関モノラルダウンミクスに適用されるスケーリング因子は、前記空間パラメータの関数として、
    Figure 0005122681
    により与えられ、ここでiid、ipd及びiccは空間パラメータであり、iidはチャネル間強度差であり、ipdはチャネル間位相差であり、iccはチャネル間コヒーレンスであり、αは前記予測係数である、請求項6に記載のパラメトリックステレオアップミクス装置。
  8. 前記パラメトリックステレオアップミクスは、付加的な入力として前記差分信号についての予測残留信号を持ち、前記算術手段は、前記モノラルダウンミクス信号、前記差分信号及び前記差分信号についての前記予測残留信号に基づいて、前記左信号及び前記右信号を導出するように構成された、請求項1乃至7のいずれか一項に記載のパラメトリックステレオアップミクス装置。
  9. 入力ビットストリームをモノラルビットストリームとパラメータビットストリームとに分割するための多重分離手段と、前記モノラルビットストリームをモノラルダウンミクス信号にデコードするためのモノラルデコード手段と、前記パラメータビットストリームを空間パラメータにデコードするためのパラメータデコード手段と、前記空間パラメータに基づいて前記モノラルダウンミクス信号から左信号及び右信号を生成するためのパラメトリックステレオアップミクス手段と、を有するパラメトリックステレオデコーダであって、前記パラメトリックステレオデコーダは更に、請求項1乃至7のいずれか一項に記載のパラメトリックステレオアップミクス装置を有する、パラメトリックステレオデコーダ。
  10. 入力ビットストリームをモノラルビットストリームとパラメータビットストリームとに分割するための多重分離手段と、前記モノラルビットストリームをモノラルダウンミクス信号にデコードするためのモノラルデコード手段と、前記パラメータビットストリームを空間パラメータにデコードするためのパラメータデコード手段と、前記空間パラメータに基づいて前記モノラルダウンミクス信号から左信号及び右信号を生成するためのパラメトリックステレオアップミクス手段と、を有するパラメトリックステレオデコーダにおいて、前記多重分離手段は更に、前記入力ビットストリームから予測残留ビットストリームを抽出するように構成され、前記モノラルデコード手段は更に、前記予測残留ビットストリームから差分信号についての予測残留信号をデコードするように構成され、前記パラメトリックステレオアップミクス手段は、請求項8に記載のパラメトリックステレオアップミクス装置であることを特徴とする、パラメトリックステレオデコーダ。
  11. 空間パラメータに基づいてモノラルダウンミクス信号から左信号及び右信号を生成するための方法において、
    前記空間パラメータから導出される予測係数を用いてスケーリングされた前記モノラルダウンミクス信号に基づいて前記左信号と前記右信号との差を有する差分信号を予測するステップと、
    前記モノラルダウンミクス信号と前記差分信号との合計及び差分に基づいて前記左信号及び前記右信号を導出するステップと、
    を有することを特徴とする方法。
  12. 前記左信号及び前記右信号を導出するステップは、前記差分信号についての予測残留信号にも基づく、請求項11に記載の空間パラメータに基づいてモノラルダウンミクス信号から左信号及び右信号を生成するための方法。
  13. 請求項9又は10に記載のパラメトリックステレオデコーダを有する、オーディオ再生装置。
  14. 空間パラメータに基づいて左信号及び右信号からモノラルダウンミクス信号を生成するためのパラメトリックステレオダウンミクス装置において、前記パラメトリックステレオダウンミクス装置は、付加的な出力として差分信号についての予測残留信号を持ち、前記パラメトリックステレオダウンミクス装置は、前記左信号と前記右信号との間の差を有する差分信号及びモノラルダウンミクス信号を導出するための更なる算術手段と、前記空間パラメータから導出された所定の予測係数を用いてスケーリングされた前記モノラルダウンミクス信号と前記差分信号との間の差として前記差分信号についての予測残留信号を導出するための更なる予測手段と、を有することを特徴とする、パラメトリックステレオダウンミクス装置。
  15. 左信号及び右信号から空間パラメータを導出するための推定手段と、空間パラメータに基づいて前記左信号及び前記右信号からモノラルダウンミクス信号を生成するためのパラメトリックステレオダウンミクス手段と、前記モノラルダウンミクス信号をモノラルビットストリームにエンコードするためのモノラルエンコード手段と、空間パラメータをパラメータビットストリームにエンコードするためのパラメータエンコード手段と、前記モノラルビットストリームと前記パラメータビットストリームとを出力ビットストリームへと併合するための多重化手段と、を有するパラメトリックステレオエンコーダにおいて、前記パラメトリックステレオダウンミクス手段は、請求項14に記載のパラメトリックステレオダウンミクス装置であり、前記モノラルエンコード手段は更に、差分信号についての予測残留信号を予測残留ビットストリームへとエンコードするように構成され、前記多重化手段は更に、前記予測ビットストリームを出力ストリームへ併合するように構成されたことを特徴とする、パラメトリックステレオエンコーダ。
  16. 空間パラメータに基づいて左信号及び右信号から差分信号についての予測残留信号を生成するための方法において、
    前記左信号と前記右信号との間の差分信号を導出するステップと、
    前記空間パラメータから導出された予測係数を用いてスケーリングされたモノラルダウンミクス信号と前記差分信号との間の差として前記差分信号についての予測残留信号を導出するステップと、
    を有することを特徴とする方法。
  17. 請求項11、12又は16に記載の方法を実行するためのコンピュータプログラム。
JP2011510076A 2008-05-23 2009-05-14 パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ Active JP5122681B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08156801 2008-05-23
EP08156801.6 2008-05-23
PCT/IB2009/052009 WO2009141775A1 (en) 2008-05-23 2009-05-14 A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Publications (3)

Publication Number Publication Date
JP2011522472A JP2011522472A (ja) 2011-07-28
JP2011522472A5 JP2011522472A5 (ja) 2012-10-18
JP5122681B2 true JP5122681B2 (ja) 2013-01-16

Family

ID=40943873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011510076A Active JP5122681B2 (ja) 2008-05-23 2009-05-14 パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ

Country Status (10)

Country Link
US (6) US8811621B2 (ja)
EP (1) EP2283483B1 (ja)
JP (1) JP5122681B2 (ja)
KR (1) KR101629862B1 (ja)
CN (1) CN102037507B (ja)
BR (3) BRPI0908630B1 (ja)
MX (1) MX2010012580A (ja)
RU (1) RU2497204C2 (ja)
TW (1) TWI484477B (ja)
WO (1) WO2009141775A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8472789B2 (en) 2010-10-05 2013-06-25 Panasonic Corporation Image editing apparatus, image editing method, and image editing program
US8625668B2 (en) 2006-01-10 2014-01-07 Kabushiki Kaisha Toshiba Information processing apparatus and video decoding method of information processing apparatus
US11545165B2 (en) 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0908630B1 (pt) * 2008-05-23 2020-09-15 Koninklijke Philips N.V. Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
EP3093843B1 (en) * 2009-09-29 2020-12-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mpeg-saoc audio signal decoder, mpeg-saoc audio signal encoder, method for providing an upmix signal representation using mpeg-saoc decoding, method for providing a downmix signal representation using mpeg-saoc decoding, and computer program using a time/frequency-dependent common inter-object-correlation parameter value
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
WO2011104146A1 (en) * 2010-02-24 2011-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
ES2935962T3 (es) * 2010-04-09 2023-03-13 Dolby Int Ab Codificación estéreo usando un modo de predicción o un modo de no predicción
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
ES2958392T3 (es) 2010-04-13 2024-02-08 Fraunhofer Ges Forschung Método de decodificación de audio para procesar señales de audio estéreo usando una dirección de predicción variable
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US8654984B2 (en) * 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
JP6163545B2 (ja) 2012-06-14 2017-07-12 ドルビー・インターナショナル・アーベー 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え
MY176410A (en) 2012-08-03 2020-08-06 Fraunhofer Ges Forschung Decoder and method for a generalized spatial-audio-object-coding parametric concept for multichannel downmix/upmix cases
MX362990B (es) * 2013-01-08 2019-03-01 Dolby Int Ab Prediccion basada en modelo en un banco de filtros de muestreo critico.
US9830918B2 (en) 2013-07-05 2017-11-28 Dolby International Ab Enhanced soundfield coding using parametric component generation
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
KR101461110B1 (ko) * 2013-09-06 2014-11-12 광주과학기술원 스테레오 확장장치 및 스테레오 확장방법
ES2660778T3 (es) * 2013-10-21 2018-03-26 Dolby International Ab Reconstrucción paramétrica de señales de audio
EP3061088B1 (en) 2013-10-21 2017-12-27 Dolby International AB Decorrelator structure for parametric reconstruction of audio signals
CN103700372B (zh) * 2013-12-30 2016-10-05 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
US9955276B2 (en) * 2014-10-31 2018-04-24 Dolby International Ab Parametric encoding and decoding of multichannel audio signals
CA3011914C (en) 2016-01-22 2021-08-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
EP3748633A1 (en) * 2016-11-08 2020-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
CA3042580C (en) * 2016-11-08 2022-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
WO2018129143A1 (en) * 2017-01-04 2018-07-12 That Corporation Configurable multi-band compressor architecture with advanced surround processing
US10877192B2 (en) 2017-04-18 2020-12-29 Saudi Arabian Oil Company Method of fabricating smart photonic structures for material monitoring
US10401155B2 (en) 2017-05-12 2019-09-03 Saudi Arabian Oil Company Apparatus and method for smart material analysis
PL3659140T3 (pl) 2017-07-28 2024-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do enkodowania lub dekodowania enkodowanego sygnału wielokanałowego za pomocą sygnału wypełnienia generowanego przez filtr szerokopasmowy
CN109389987B (zh) * 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品
CN109389986B (zh) 2017-08-10 2023-08-22 华为技术有限公司 时域立体声参数的编码方法和相关产品
CN114005455A (zh) * 2017-08-10 2022-02-01 华为技术有限公司 时域立体声编解码方法和相关产品
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
JP2021508380A (ja) 2017-12-19 2021-03-04 ドルビー・インターナショナル・アーベー 音声音響統合復号および符号化の改良のための方法、機器、およびシステム
EP3729427A1 (en) 2017-12-19 2020-10-28 Dolby International AB Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements
SG11202009801VA (en) 2018-04-05 2020-11-27 Fraunhofer Ges Forschung Apparatus, method or computer program for estimating an inter-channel time difference
WO2019193149A1 (en) * 2018-04-05 2019-10-10 Telefonaktiebolaget Lm Ericsson (Publ) Support for generation of comfort noise, and generation of comfort noise
US10841689B2 (en) * 2018-10-02 2020-11-17 Harman International Industries, Incorporated Loudspeaker and tower configuration
AU2019392876B2 (en) 2018-12-07 2023-04-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to DirAC based spatial audio coding using direct component compensation
CN114270437A (zh) * 2019-06-14 2022-04-01 弗劳恩霍夫应用研究促进协会 参数编码与解码
US12100403B2 (en) * 2020-03-09 2024-09-24 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium
EP4120249A4 (en) * 2020-03-09 2023-11-15 Nippon Telegraph And Telephone Corporation SOUND SIGNAL CODING METHOD, SOUND SIGNAL DECODING METHOD, SOUND SIGNAL CODING DEVICE, SOUND SIGNAL DECODING DEVICE, PROGRAM AND RECORDING MEDIUM
JP7380838B2 (ja) * 2020-03-09 2023-11-15 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
WO2021181746A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
CN100508026C (zh) * 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
DE60311794T2 (de) * 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR20060132697A (ko) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코더 및 트랜스코딩 방법
US7813513B2 (en) * 2004-04-05 2010-10-12 Koninklijke Philips Electronics N.V. Multi-channel encoder
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7835918B2 (en) 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
EP1817767B1 (en) 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
RU2417458C2 (ru) 2005-07-19 2011-04-27 Конинклейке Филипс Электроникс Н.В. Генерирование многоканальных звуковых сигналов
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
MX2009003570A (es) * 2006-10-16 2009-05-28 Dolby Sweden Ab Codificacion mejorada y representacion de parametros para codificacion de objetos de mezcla descendente de multicanal.
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
MY148040A (en) * 2007-04-26 2013-02-28 Dolby Int Ab Apparatus and method for synthesizing an output signal
EP2023600A1 (en) 2007-07-27 2009-02-11 Thomson Licensing Method of color mapping from non-convex source gamut into non-convex target gamut
BRPI0908630B1 (pt) * 2008-05-23 2020-09-15 Koninklijke Philips N.V. Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8625668B2 (en) 2006-01-10 2014-01-07 Kabushiki Kaisha Toshiba Information processing apparatus and video decoding method of information processing apparatus
US8472789B2 (en) 2010-10-05 2013-06-25 Panasonic Corporation Image editing apparatus, image editing method, and image editing program
US11545165B2 (en) 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels

Also Published As

Publication number Publication date
BR122020009732B1 (pt) 2021-01-19
US20190058960A1 (en) 2019-02-21
US20110096932A1 (en) 2011-04-28
CN102037507A (zh) 2011-04-27
US9591425B2 (en) 2017-03-07
TW201011736A (en) 2010-03-16
JP2011522472A (ja) 2011-07-28
KR20110020846A (ko) 2011-03-03
US11871205B2 (en) 2024-01-09
BRPI0908630B1 (pt) 2020-09-15
CN102037507B (zh) 2013-02-06
BRPI0908630A8 (pt) 2017-12-12
EP2283483B1 (en) 2013-03-13
EP2283483A1 (en) 2011-02-16
US10136237B2 (en) 2018-11-20
US20140321652A1 (en) 2014-10-30
BRPI0908630A2 (pt) 2017-10-03
RU2497204C2 (ru) 2013-10-27
US8811621B2 (en) 2014-08-19
MX2010012580A (es) 2010-12-20
US20210274302A1 (en) 2021-09-02
WO2009141775A1 (en) 2009-11-26
US20170134875A1 (en) 2017-05-11
US11019445B2 (en) 2021-05-25
TWI484477B (zh) 2015-05-11
US20240121567A1 (en) 2024-04-11
BR122020009727B1 (pt) 2021-04-06
KR101629862B1 (ko) 2016-06-24
RU2010152580A (ru) 2012-06-27

Similar Documents

Publication Publication Date Title
JP5122681B2 (ja) パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
JP7270096B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
JP6196249B2 (ja) 複数のチャネルを有するオーディオ信号を符号化する装置と方法
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
CA2887228C (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
AU2015201672B2 (en) Apparatus for generating a decorrelated signal using transmitted phase information

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120511

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20120511

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20120604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120607

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20120828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120925

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121024

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5122681

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250