JP5607626B2 - パラメトリックステレオ変換システム及び方法 - Google Patents

パラメトリックステレオ変換システム及び方法 Download PDF

Info

Publication number
JP5607626B2
JP5607626B2 JP2011523003A JP2011523003A JP5607626B2 JP 5607626 B2 JP5607626 B2 JP 5607626B2 JP 2011523003 A JP2011523003 A JP 2011523003A JP 2011523003 A JP2011523003 A JP 2011523003A JP 5607626 B2 JP5607626 B2 JP 5607626B2
Authority
JP
Japan
Prior art keywords
data
channel
frequency domain
phase
phase difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011523003A
Other languages
English (en)
Other versions
JP2012500410A (ja
Inventor
ジェフリー トンプソン
ロバート リームズ
アーロン ワーナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
DTS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS Inc filed Critical DTS Inc
Publication of JP2012500410A publication Critical patent/JP2012500410A/ja
Application granted granted Critical
Publication of JP5607626B2 publication Critical patent/JP5607626B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

(関連出願)
本出願は、2007年8月17日に出願された「Parametric Stereo Conversion System and Method(パラメトリックステレオ変換システム及び方法)」という名称の米国仮出願第60/965,227号に対する優先権を主張し、当該出願は、あらゆる目的で引用により本明細書に組み込まれている。
本発明は、オーディオコーダの分野に関し、より具体的には、位相データにおける変化について振動強度データを補償して、位相データが含まれない場合に発生する恐れがあるオーディオアーチファクト又は他の雑音の生成を伴わずに各チャネルにおいて振動強度データのみを伝送可能にするように、振動強度及び位相データを有する多チャネルオーディオデータを調整するためのシステム及び方法に関する。
位相及び振動強度データを含むオーディオ信号から位相データを取り除く多チャネルオーディオ符号化技法は、当該技術分野で公知である。これらの技法は、通常は位相情報を含むはずのステレオ音響音をシミュレートするのに用いられることになる左チャネル信号と右チャネル信号との間の振動強度差を用いたパラメトリックステレオを含む。かかるパラメトリックステレオは、聴取者が、信号内に位相データも含まれていた場合に体感することになる最大音場深さを有するステレオ音響音を体感することは可能ではないが、単純なモノラル音(各チャネルの振幅が等しい場合など)よりも優れた音質を改善する何らかの音場深さを提供する。
振動強度及び位相データを含む多チャネルオーディオデータから、振動強度データのみを含む多チャネルオーディオデータに変換することに伴う1つの問題は、位相データを適正に処理することである。位相データが単に削除された場合、結果として生じる振動強度のみのデータを聴取者にとって不快なものにするオーディオアーチファクトが生成されることになる。先進的オーディオ符号化(AAC)システムのような幾つかのシステムは、位相データの取り除きを補償するために受信器によって用いられる側波帯情報を利用するが、かかるシステムは、ユーザが、側波帯データを処理できる特殊な受信器を有することを必要とし、また、不快なオーディオアーチファクトを生成する恐れがある雑音信号が側波帯データ内に導入される場合に起こる可能性がある問題を生じやすい。これに加えて、高周波数位相変化に対して側波帯データを伝送する試みは、低ビットレート伝送処理が用いられる場合にオーディオアーチファクトを生成する恐れがある。
本発明によれば、多チャネルオーディオ信号を処理して位相データの振動強度データを補償するためのシステム及び方法が提供され、これにより位相データ及び振動強度データを有するオーディオデータを振動強度データのみを有するオーディオデータに変換することに関する既知の問題が解決される。
詳細には、多チャネルオーディオ信号を処理して位相データについての振動強度データを補償するシステム及び方法が提供され、これにより側波帯データの必要性を排除し、変換処理中に生じる恐れがあるオーディオアーチファクトが補償される。
本発明の例示的な実施形態によれば、位相変調されたステレオデータからパラメトリックステレオデータを生成するためのシステムが提供される。位相差システムは、左チャネルデータ及び右チャネルデータを受け取り、左チャネルデータと右チャネルデータとの間の位相差を特定する。位相差重み付けシステムは、位相差データを受け取り、位相差データに基づいて左チャネル振幅データ及び右チャネル振幅データを調節するための重み付けデータを生成する。振動強度修正システムは、重み付けデータを用いて左チャネル振幅データ及び右チャネル振幅データを調節し、左チャネルデータ及び右チャネルデータ内の位相データを取り除く。
本発明は、多くの重要な技術的利点を提供する。本発明の1つの重要な技術的利点は、位相データの振動強度データを補償する多チャネルオーディオ信号を処理するためのシステム及び方法であって、位相データにおける変化に基づいて振動強度データを平滑化し、低ビットレートの振動強度データが高周波数位相変化を含むように調節された場合に生じる恐れがあるオーディオアーチファクトの生成を回避するようにする。
当業者であれば、図面を併用して以下の詳細な説明を読むと、本発明の利点及び優れた特徴並びに本発明の他の重要な態様が更に理解されるであろう。
本発明の例示的な実施形態による、位相データ及び振動強度データの両方を有する多チャネルオーディオデータをパラメトリックステレオ等の振動強度データのみを利用する多チャネルオーディオデータに変換するためのシステムの図である。 本発明の例示的な実施形態による、位相差重み付け係数の図である。 本発明の例示的な実施形態による、コヒーレンス空間調整システムの図である。 本発明の例示的な実施形態による、パラメトリック符号化のための方法の図である。 本発明の例示的な実施形態による、動的位相傾向補正のためのシステムの図である。 本発明の例示的な実施形態による、スペクトル平滑化を実施するためのシステムの図である。 本発明の例示的な実施形態による、電力補償強度再パニングのためのシステムの図である。
以下の説明では、本明細書及び図面全体にわたって同様の要素が同じ参照番号で示している。図面は縮尺通りではない場合があり、特定の構成要素が一般的な形式又は概略的な形式で示され、明瞭及び簡潔にする目的で商標により特定することができる。
図1は、本発明の例示的な実施形態による、位相及び振動強度データの両方を有する多チャネルオーディオデータを、パラメトリックステレオ等の振動強度データのみを利用する多チャネルオーディオデータに変換するためのシステム100の図である。システム100は、強度又は振動強度データのみを用いてステレオ像データを生成するために、左右チャネルの音データにおける位相差を識別し、位相差を振動強度差に変換する。同様に、適切な場合には追加のチャネルを付加的又は代替的に用いることができる。
システム100は、時間−周波数変換システム102において時間領域右チャネルオーディオデータを受け取り、時間−周波数変換システム104において時間領域左チャネルオーディオデータを受け取る。1つの例示的な実施形態では、システム100は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの適切な組み合わせで実装することができ、デジタルシステムプロセッサ、汎用処理プラットフォーム、又はその他の適切なプラットフォーム上で動作する1つ又はそれ以上のソフトウェアシステムとすることができる。本明細書で用いるハードウェアシステムは、ディスクリート構成要素、集積回路、特定用途向け集積回路、フィールドプログラマブルゲートアレイ、又はその他の適切なハードウェアの組み合わせを含むことができる。ソフトウェアシステムは、1つ又はそれ以上のオブジェクト、エージェント、スレッド、コード行、サブルーチン、個別ソフトウェアアプリケーション、2つ又はそれ以上のソフトウェアアプリケーション内又は2つ又はそれ以上のプロセッサ上で動作する2つ又はそれ以上のコード行又はその他の適切ソフトウェア構造、或いはその他の適切なソフトウェア構造を含むことができる。1つの例示的な実施形態では、ソフトウェアシステムは、オペレーティングシステム等の汎用ソフトウェアアプリケーション内で動作する1つ又はそれ以上のコード行もしくは他の適切なソフトウェア構造、及び専用ソフトウェアアプリケーション内で動作する1つ又はそれ以上のコード行もしくはその他の適切なソフトウェア構造を含むことができる。
時間−周波数変換システム102及び時間−周波数変換システム104は、右及び左チャネルの時間領域オーディオデータをそれぞれ周波数領域データに変換する。1つの例示的な実施形態では、周波数領域データは、30ミリ秒等の適切な時間間隔にわたる周波数データの1,024個のビン等のサンプル間隔にわたって取り込まれた周波数データフレームを含むことができる。周波数データのビンは、20kHz等の所定の周波数範囲にわたって均等に間隔を置いて配置することができ、臨界帯域、等価方形帯域幅(ERB)等の所定の帯域内に集中することができ、或いは、他の方法で適切に分散させることができる。
時間−周波数変換システム102及び時間−周波数変換システム104は、位相差システム106に結合される。本明細書で用いる用語「結合された」及び「結合する」等の同種の用語は、物理的接続(電線、光ファイバ、通信媒体等)、仮想接続(データメモリデバイスのランダム割り当てメモリーロケーション、又はハイパーテキスト転送プロトコル(HTTP)リンク等を通じて)、論理接続(集積回路内の1つ又はそれ以上の半導体デバイス等を通じて)、又はその他の適切な接続を含むことができる。1つの例示的な実施形態では、通信媒体は、ネットワーク又はその他の適切な通信媒体とすることができる。
位相差システム106は、時間−周波数変換システム102及び時間−周波数変換システム104によって生成された周波数データフレーム内の周波数ビン間の位相差を特定する。これらの位相差は、通常は聴取者により知覚されることになる位相データであって、信号のステレオ音響品質を高める位相データを表す。
位相差システム106は、N−2フレームバッファ110、N−1フレームバッファ112、及びNフレームバッファ114を含むバッファシステム108に結合される。1つの例示的な実施形態では、バッファシステム108は、望ましい個数のフレームからの位相差データを記憶するようにするため、適切な個数のフレームバッファを含むことができる。N−2フレームバッファ110は、時間−周波数変換システム102及び時間−周波数変換システム104によって変換された最後から2番目のデータフレームについての位相差システム106から受け取った位相差データを記憶する。同様にN−1フレームバッファ112は、位相差システム106からの位相差データの前のフレームについての位相差データを記憶する。Nフレームバッファ114は、位相差システム106によって生成された位相差の現在のフレームについての現在位相差データを記憶する。
位相差システム116は、N−2フレームバッファ110及びN−1フレームバッファ112に結合され、これらのバッファ内に記憶された2組の位相差データ間の位相差を特定する。同様に位相差システム118は、N−1フレームバッファ112及びNフレームバッファ114に結合され、これらのバッファ内に記憶された2組の位相差データ間の位相差を特定する。同様に、追加の位相差システムを用いて、バッファシステム108内に記憶された適切な個数のフレームについての位相差を生成することができる。
位相差システム120は、位相差システム116及び位相差システム118に結合され、各システムから位相差データを受け取り、合計位相差を特定する。この例示的な実施形態では、大きい位相差を有する周波数ビンと小さい位相差を有する周波数ビンとを識別するために、3つの連続する周波数データフレームについての位相差が特定される。追加の位相差システムを付加的又は代替的に用いて、所定数の位相差データフレームについての合計位相差を特定することができる。
位相差バッファ122は、3つのフレームからなる前の組についての位相差システム120からの位相差データを記憶する。同様にバッファシステム108が、3つよりも多くのフレーム差を有する場合には、位相差バッファ122は、更なる位相差データを記憶することができる。位相差バッファ122は、フレーム(N−4、N−3、N−2)から生成された組、フレーム(N−3、N−2、N−1)から生成された組、フレーム(N−2、N−1、N)から生成された組、フレーム(N−1、N、N+1)から生成された組、又は位相差データの他の適切な組等、位相差データの追加の前の組についての位相差データを付加的又は代替的に記憶することができる。
位相差重み付けシステム124は、位相差バッファ122からバッファリングされた位相差データを受け取り、位相差システム120から現在の位相差データを受け取り、位相差重み付け係数を適用する。1つの例示的な実施形態では、高度の位相差を呈する周波数ビンには、一定の位相差を呈する周波数ビンよりも小さい重み付け係数が与えられる。このようにして、周波数差データを用いて、連続するフレーム間で高度の位相差を呈する周波数ビンから変化を取り除き、連続するフレーム間で低い位相差を呈している周波数ビンに対してエンファシスを与えるように振動強度データを平滑にすることができる。この平滑化は、特に低ビットレートのオーディオデータが処理又は生成されている場合に、位相及び振動強度データを有するオーディオデータから、パラメトリックステレオデータ等の振動強度データのみを有するオーディオデータへの変換によって導入される可能性のあるオーディオアーチファクトを低減又は取り除くのを助けることができる。
振動強度修正システム126は、位相差重み付けシステム124から位相差重み付け係数データを受け取り、時間−周波数変換システム102及び時間−周波数変換システム104からの変換された右チャネル及び左チャネルのデータに振動強度修正データを提供する。このようにして、左右チャネルのオーディオについての現在のフレーム周波数データは、振動強度を調節して位相差を補正するように修正され、左右の振動強度値の間のパニングを用いてステレオ音を作成できるようになる。このようにして、右チャネルと左チャネルとの間の位相差が平滑化されて振幅修正データに変換され、位相データの伝送を必要とすることなく、振幅のみによってステレオ又はその他の多チャネル音をシミュレートするようになる。同様に、バッファシステムを用いて修正中である現在の周波数データフレームをバッファリングし、周波数データの(N−1、N、N+1)フレームの組、又は他の好適なデータの組からのデータを利用することができる。振動強度修正システム126はまた、聴取者に対する見かけ上のステージ幅を減幅又は拡幅するために、所定の周波数ビン、周波数ビン群にわたって、又はその他の適切な方式で2つ又はそれ以上のチャネルの間の振動強度における差を圧縮又は拡大することができる。
周波数−時間変換システム128及び周波数−時間変換システム130は、振動強度修正システム126から修正された振動強度データを受け取り、周波数データを時間信号に変換する。このようにして、周波数−時間変換システム128及び周波数−時間変換システム130それぞれによって生成される左チャネルデータ及び右チャネルデータは、同相であるが振動強度が異なり、強度のみを用いてステレオデータをシミュレートし、位相データを記憶、伝送、又は他の方法で処理する必要がないようにする。
動作時には、システム100は、位相及び振動強度データを含む多チャネルオーディオデータを処理して振動強度データのみを有する多チャネルオーディオデータを生成し、ステレオ音響又はその他の多チャネルオーディオデータを生成するために伝送する必要があるデータ量を低減する。システム100は、周波数データの変化について振動強度データを補償して高周波数位相変化からの作用を低減するようにすることによって、位相及び振動強度データを含むオーディオデータが振動強度データのみを含むオーディオデータに変換される時に生じる可能性があるオーディオアーチファクトを取り除く。このようにして、オーディオデータの伝送に利用可能なビットレートが高周波数位相データを正確に表すのに必要とされるビットレートよりも低い場合に導入される可能性があるオーディオアーチファクトが取り除かれる。
図2は、本発明の例示的な実施形態による位相差重み付け係数200A及び200Bの図である。位相差重み付け係数200A及び200Bは、位相変化の関数として振幅データに適用されることになる例示的な正規化重み付け係数を示している。1つの例示的な実施形態では、高度の位相変化を示す周波数ビンは、低度の位相変化を示す周波数ビンよりも小さい正規化重み係数で重み付けされ、パラメトリックステレオデータ又はその他の多チャネルデータがステレオ音を不適切に表す要因となる潜在的雑音又はその他のオーディオアーチファクトを平滑化する。1つの例示的な実施形態では、位相差重み付け係数200A及び200Bは、位相差重み付けシステム124又はその他の適切なシステムが適用することができる。重み付け量は、オーディオデータに対するビットレートにおいて期待される低減に対応するよう修正することができる。例えば、高度のデータ低減が必要とされる場合には、高度の位相変化を呈する周波数ビンに与えられる重み付けは、位相差重み付け係数200Aに示される漸近的方式などで有意に低減させることができ、低度のデータ低減が必要とされる場合には、高度の位相変化を呈する周波数ビンに与えられる重み付けは、位相差重み付け係数200Bを用いるなどによって、それ程有意には低減しなくてもよい。
図3は、本発明の例示的な実施形態によるコヒーレンス空間調整システム300の図である。コヒーレンス空間調整システム300は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの適切な組み合わせで実装することができ、1つ又はそれ以上のディスクリートデバイス、汎用処理プラットフォーム上で動作する1つ又はそれ以上のシステム、又はその他の適切なシステムとすることができる。
コヒーレンス空間調整システム300は、空間調整システムの例示的な実施形態を提示するが、空間調整アルゴリズムを実装するためのその他の適切なフレームワーク、システム、プロセス、又はアーキテクチャを付加的又は代替的に用いることもできる。
コヒーレンス空間調整システム300は、多チャネルオーディオ信号の空間様相を修正し(すなわち、システム300は、ステレオ調整システムを例示している)、オーディオ圧縮中のアーチファクトを軽減する。ステレオ入力スペクトルの位相スペクトルは、最初に減算器302によって差分され、差分位相スペクトルを作成する。差分位相スペクトルは、乗算器304を通じて重み付け係数Y(K)=B1X(K)+B2X(K−1)−A1Y(K−1)で重み付けされる。ここで、
Y(K)=平滑化された周波数ビンKの振動強度
Y(K−1)=平滑化された周波数ビンK−1の振動強度
X(K)=周波数ビンKの振動強度
X(K−1)=周波数ビンK−1の振動強度
1=重み付け係数
2=重み付け係数
1=重み付け係数
1+B2+A1=1
である。
重み付け係数B1、B2、及びA1は、観測、システム設計、又はその他の適切な要因に基づいて決定することができる。1つの例示的な実施形態では、重み付け係数B1、B2、及びA1は、全ての周波数ビンに対して固定される。同様に重み付け係数B1、B2、及びA1は、臨界帯域又はその他の適切な周波数ビン群に基づいて修正することができる。
次いで、重み付き差分位相信号は2で除算し、減算器308によって入力位相スペクトル0から減算して、加算器306によって入力スペクトル1と加算する。減算器308及び加算器306の出力は、それぞれ出力調整された位相スペクトル0及び1である。
動作時には、コヒーレンス空間調整システム300は、パラメトリックステレオでの使用などのため、単相スペクトル帯域を生成する作用がある。
図4は、本発明の例示的な実施形態によるパラメトリック符号化のための方法400の図である。方法400は402で始まり、ここでN個のオーディオデータチャネルが周波数領域に変換される。1つの例示的な実施形態では、フーリエ変換又はその他の適切な変換を用いること等によって、左右のチャネルステレオデータは各々、所定の間隔にわたって周波数領域データフレームに変換することができる。次に、本方法は404に進む。
404では、チャネル間の位相差が特定される。1つの例示的な実施形態では、左右のチャネルオーディオデータの周波数ビンを比較して、左チャネルと右チャネルとの間の位相差を特定することができる。次いで、本方法は406に進む。
406では、フレームについての位相差データがバッファ内に記憶される。1つの例示的な実施形態では、バッファシステムは、位相差データを記憶するために所定数のバッファを含むことができ、バッファは動的に割り当てることができ、又はその他の適切な処理を用いることができる。次に、本方法は408に進む。
408では、M個のデータフレームがバッファ内に記憶されたか否かを判定する。1つの例示的な実施形態では、Mは、3又は他の何れかの適切な整数に等しいとすることができ、望ましい個数のフレーム間で平滑化を実施できるようにする。408で、M個のデータフレームが記憶されていないと判定された場合、本方法は402に戻る。そうでなければ本方法は410に進む。
410では、M−1フレームとMフレームとの間の位相差を特定する。例えば、Mが3に等しい場合には、2番目のデータフレームと3番目のデータフレームとの間の位相差が特定される。次いで、本方法は412に進み、ここで位相差データがバッファリングされる。1つの例示的な実施形態では、所定数のバッファをハードウェア又はソフトウェア内に作成することができ、バッファシステムは、バッファデータ記憶領域を動的に割り当てることができ、又はその他の適切なプロセスを用いることができる。次に、本方法は414に進み、ここでMを1だけ減少させる。次いで本方法は416に進み、ここでMが0であるか否かを判定する。例えば、Mが0である場合には、全てのバッファリングされたデータフレームが処理されている。Mが0ではないと判定された場合、本方法は402に戻る。そうでなければ、本方法は418に進む。
418では、バッファリングされたフレームの位相差データ間の位相差が特定される。例えば、2つの位相差データフレームが記憶されている場合には、これらの2つのフレーム間の差が特定される。同様に位相差データの3つ、4つ、又はその他の適切な個数のフレームを用いることができる。次いで、本方法は420に進み、ここで多フレーム差分データがバッファリングされる。次に、本方法は422に進む。
422では、所定数の多フレームバッファ値が記憶されたか否かを判定する。所定数の多フレームバッファ値が記憶されていないと判定された場合には、本方法は402に戻る。そうでなければ本方法は424に進む。
424では、前の多フレームバッファと現在の多フレームバッファについての位相差データが生成される。例えば、2つの多フレームバッファリングされたデータ値が存在する場合には、2つの多フレームバッファ間の位相差が特定される。同様にNが2よりも大きい場合の現在の多フレームバッファと前の多フレームバッファとの間の位相差も特定することができる。次に、本方法は426に進む。
426では、位相差データに基づいて周波数データの現在、前回、又はその他の適切なフレーム内の各周波数ビンに対して重み付け係数を適用する。例えば、に、重み付け係数は、小さい位相変化を呈する周波数ビンについて振動強度値により大きい重みを適用することができ、大きい変化を呈する周波数ビンには重みを置かないようにすることができ、位相データが破棄されるか或いは他の方法で考慮される場合にパラメトリックステレオデータ内にオーディオアーチファクトを生じさせる恐れがある位相データを表すオーディオアーチファクト、雑音、又はその他の情報を低減するようにする。重み付け係数は、オーディオデータ伝送ビットレートにおける所定の低減に基づいて選択することができ、周波数ビン又は周波数ビン群に基づいて付加的又は代替的に変更することができる。次に、本方法は428に進む。
428では、左右のチャネルデータについての重み付き周波数データを周波数領域から時間領域に変換する。1つの例示的な実施形態では、平滑化プロセスは、オーディオデータフレームの先行する組に基づいて、オーディオデータフレームの現在の組に対して実施することができる。別の例示的な実施形態では、平滑化プロセスは、オーディオデータフレームの先行及び後続の組に基づいて、オーディオデータフレームの前の組に対して実施することができる。同様に他の適切なプロセスを付加的又は代替的に用いることができる。このようにして、オーディオデータチャネルは、パラメトリック多チャネル品質を呈し、ここでは位相データが除去されているが、該位相データは振動強度データに変換されており、位相データの記憶又は伝送を必要とせず、更に、チャネル間の位相変化の周波数が、利用可能な伝送チャネル帯域幅によって対応可能な周波数を超える時に生じる恐れがあるオーディオアーチファクトを生成することなく多チャネル音をシミュレートするようになる。
動作時には、方法400は、パラメトリックステレオ又はその他の多チャネルデータを生成可能にする。方法400は、ステレオ又はその他の多チャネルデータ間の周波数差を除去して、これらの周波数変化を振動強度変化に変換し、左右又はその他の複数のチャネル間の位相関係を伝送又は他の方法で処理することを必要とせずにステレオ音響又はその他の多チャネル音の様相を保持するようにする。このようにして、既存の受信器を用いて、位相データの取り除きを補償するために受信器によって必要とされることになる側波帯データ又はその他のデータを必要とすることなく位相補償された多チャネルオーディオデータを生成することができる。
図5は、本発明の例示的な実施形態による動的位相傾向補正のシステム500の図である。システム500は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの適切な組み合わせで実装することができ、汎用処理プラットフォーム上で動作する1つ又はそれ以上のソフトウェアシステムとすることができる。
システム500は、ステレオ音響音源又は他の好適なシステムから生成もしくは受け取った左右のチャネル時間信号を供給できる左時間信号システム502と右時間信号システム504とを含む。短時間フーリエ変換システム506及び508は、それぞれ左時間信号システム502及び右時間信号システム504に結合され、時間信号の時間−周波数領域変換を実施する。フーリエ変換、離散余弦変換、又はその他の適切な変換等の他の変換を付加的又は代替的に用いることができる。
短時間フーリエ変換システム506及び508からの出力は、それぞれ3フレーム遅延システム510及び520に供給される。短時間フーリエ変換システム506及び508の振動強度出力は、それぞれ振動強度システム512及び518に供給される。短時間フーリエ変換システム506及び508の位相出力は、それぞれ位相システム514及び516に供給される。振動強度システム512及び518並びに位相システム514及び516によって追加の処理を実施することができ、或いは、これらのシステムは、それぞれの未処理信号又はデータを供給することができる。
臨界帯域フィルタバンク522及び524は、それぞれ振動強度システム512及び518から振動強度データを受け取り、周波数データの所定帯域をフィルタリングする。1つの例示的な実施形態では、臨界フィルタバンク522及び524は、線形に間隔を置いて配置された周波数ビンを、バーク周波数スケール等の周波数ビンの知覚エネルギー及び人間の聴覚応答に基づいて、周波数ビンをグループ化する心理音響フィルタに基づいて非線形周波数ビン群にグループ化することができる。1つの例示的な実施形態では、バーク周波数スケールは、人間の聴覚の第1の24個の臨界帯域に対応して、1バークから24バークの範囲にわたることができる。例示的なバーク帯域端は、ヘルツ単位で、0、100、200、300、400、510、630、770、920、1080、1270、1480、1720、2000、2320、2700、3150、3700、4400、5300、6400、7700、9500、12000、15500として与えられる。例示的な帯域中心は、ヘルツ単位で50、150、250、350、450、570、700、840、1000、1170、1370、1600、1850、2150、2500、2900、3400、4000、4800、5800、7000、8500、10500、13500である。
この例示的な実施形態では、バーク周波数スケールは、15.5kHzの高さまでしか定義されない。従って、この例示的なバークスケールに対する最高サンプリングレートは、ナイキスト限界又は31kHzである。40kHzのサンプリングレートを用いることができるように、19kHz(24番目のバーク帯域端と23番目の臨界帯域幅との和)の上に広がる25番目の例示的バーク帯域を利用することができる。同様に、54kHzまでのサンプリングレートを用いることができるように、値20500及び27000を付加すること等によって追加のバーク帯域端を利用することができる。一般的に人間の聴覚は20kHzを超えて広がることはないが、実際には40kHzよりも高いオーディオサンプリングレートが一般的である。
時間平滑化システム526は、フィルタリングされた振動強度データを臨界帯域フィルタバンク522及び524から受け取り、位相データを位相システム514及び516から受け取って、データの時間平滑化を実施する。1つの例示的な実施形態では、次式のアルゴリズムを適用すること等によって、又はその他の適切な方式で左右チャネル間の位相デルタを特定することができる。
Figure 0005607626
ここで、
P=左右チャネル間の位相差
l=左ステレオ入力信号
r=右ステレオ入力信号
m=現在のフレーム
k=周波数ビンインデックス
次いで、次式のアルゴリズムを適用すること等によって又はその他の適切な方式でデルタ平滑化係数を特定することができる。
Figure 0005607626
ここで、
δ=平滑化係数
x=平滑化バイアスを制御するパラメータ(通常は1であり、パニングを強調するために1よりも大きくすることができ、パニングを低減するために1よりも小さくすることができる)
P=左右チャネル間の位相差
m=現在のフレーム
k=周波数ビンインデックス
次いで、次式のアルゴリズムを適用すること等によって又はその他の適切な方式でスペクトル優勢度平滑化係数を特定することができる。
Figure 0005607626
ここで、
D=平滑化係数
C=臨界帯域エネルギー(フィルタバンク出力)
N=知覚帯域(フィルタバンク帯域の個数)
m=現在のフレーム
b=周波数帯域
次に、次式のアルゴリズムを適用すること等によって又はその他の適切な方式で位相デルタ信号を平滑化することができる。
Figure 0005607626
ここで、
δ=平滑化係数
D=線形等価周波数に再マッピングされたスペクトル優勢度重み
P=左右チャネル間の位相差
スペクトル平滑化システム528は、時間平滑化システムからの出力を受け取り、望ましくないオーディオアーチファクトを生じる恐れがあるスペクトル変化を低減するなどのために、出力のスペクトル平滑化を実施する。
位相応答フィルタシステム530は、スペクトル平滑化システム528並びに時間遅延システム510及び520の出力を受け取り、位相応答フィルタリングを実施する。1つの例示的な実施形態では、位相応答フィルタシステム530は、次式を適用すること等によって又はその他の適切な方式で位相シフト係数を計算することができる。
ここで、
Figure 0005607626
ここで、
l=左チャネル複素フィルタ係数
r=右チャネル複素フィルタ係数
X=入力位相信号
次いで、次式のアルゴリズムを適用すること等によって又はその他の適切な方式で入力信号をフィルタリングすることができる。
Figure 0005607626
ここで、
l=左複素係数
r=右複素係数
l=左ステレオ入力信号
r=右ステレオ入力信号
l=左位相シフトされた結果
r=右位相シフトされた結果
逆短時間フーリエ変換システム532及び534は、それぞれ位相応答フィルタシステム530から左右位相シフトされたデータを受け取り、データに対して逆短時間フーリエ変換を実施する。逆フーリエ変換、逆離散余弦変換、又はその他の適切な変換等の他の変換を付加的又は代替的に用いてもよい。
左時間信号システム536及び右時間信号システム538は、低ビットレートチャネルを介した伝送用のステレオ音響信号等の左右チャネル信号を供給する。1つの例示的な実施形態では、左時間信号システム536及び右時間信号システム538によって供給される処理済み信号を用いて、他の場合には望ましくないオーディオアーチファクトを生じるはずのオーディオ成分を取り除くことによって、低ビットレートにおいて改善されたオーディオ品質を有するステレオ音響音データを供給することができる。
図6は、本発明の例示的な実施形態に従ってスペクトル平滑化を実施するためのシステム600の図である。システム600は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの適切な組み合わせで実装することができ、汎用処理プラットフォーム上で動作する1つ又はそれ以上のソフトウェアシステムとすることができる。
システム600は、時間平滑化システム502又はその他の適切なシステム等から処理済み位相信号を受け取ることができる位相信号システム602を含む。余弦システム604及び正弦システム606は、それぞれ処理済み位相信号の位相の余弦値及び正弦値を生成する。ゼロ位相フィルタ608及び610は、それぞれ余弦値及び正弦値のゼロ位相フィルタリングを実施し、位相推定システム612は、ゼロ位相フィルタリングされた余弦データ及び正弦データを受け取り、スペクトル平滑化信号を生成する。
動作時には、システム600は、フィルタリングして高周波数成分を低減することが困難である可能性がある、Πから−Πまで変化する位相値を有する位相信号を受け取る。システム600は、位相信号を正弦値及び余弦値に変換し、ゼロ位相フィルタを用いて高周波数成分を低減できるようにする。
図7は、本発明の例示的な実施形態による、電力補償強度の再パニングのためのシステム700の図である。システム700は、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの適切な組み合わせで実装することができ、汎用処理プラットフォーム上で動作する1つ又はそれ以上のソフトウェアシステムとすることができる。
システム700は、ステレオ音響音源又は他の好適なシステムから生成もしくは受け取った左右のチャネル時間信号を供給できる左時間信号システム702と右時間信号システム704とを含む。短時間フーリエ変換システム706及び710は、それぞれ左時間信号システム702及び右時間信号システム704に結合され、時間信号の時間−周波数領域変換を実施する。フーリエ変換、離散余弦変換、又はその他の適切な変換等の他の変換を付加的又は代替的に用いることができる。
強度再パニングシステム708は、左右チャネル変換信号の強度再パニングを実施する。1つの例示的な実施形態では、強度再パニングシステム708は、次式のアルゴリズム又はその他の適切なプロセスを適用することができる。
Figure 0005607626
ここで、
l=左チャネルの強度パニングされた信号
r=右チャネルの強度パニングされた信号
l=左ステレオ入力信号
r=右ステレオ入力信号
β=左右信号間の位相差の除去に起因するステレオ像の知覚される崩壊を補償する非線形任意的選択肢(一般的に1であり、パニングを増大するために1よりも大きくすることができ、パニングを低減するために1よりも小さくすることができる)
複合信号生成システム712は、左右チャネル変換信号及び左右チャネルの強度パニングされた信号から複合信号を生成する。1つの例示的な実施形態では、複合信号生成システム712は、次式のアルゴリズム又はその他の適切な処理を適用することができる。
Figure 0005607626
ここで、
l=周波数依存窓(W)によって決定される、強度パニングされた信号と混合された原信号を含む左チャネルの複合信号
r=周波数依存窓(W)によって決定される、強度パニングされた信号と混合された原信号を含む左チャネルの複合信号
l=左ステレオ入力信号
r=右ステレオ入力信号
l=左強度パニングされた信号
r=右強度パニングされた信号
W=異なる周波数における混合を決定する周波数依存窓(周波数にわたる可変バイパスであり、0の場合には原信号のみであり、ゼロよりも大きい場合(例えば0.5)には、原信号と強度パニングされた信号との混合が生じる)
電力補償システム714は、左右チャネル変換信号及び左右チャネルの複合信号から電力補償された信号を生成する。1つの例示的な実施形態では、電力補償システム714は、次式のアルゴリズム又はその他の適切な処理を適用することができる。
Figure 0005607626
ここで、
l=左チャネルの電力補償された信号
r=右チャネルの電力補償された信号
l=左チャネルの複合信号
r=右チャネルの複合信号
l=左チャネルのステレオ入力信号
r=右チャネルのステレオ入力信号
逆短時間フーリエ変換システム716及び718は、電力補償システム714から電力補償されたデータを受け取り、このデータに対して逆短時間フーリエ変換を実施する。逆フーリエ変換、逆離散余弦変換、又はその他の適切な変換等の他の変換を付加的又は代替的に用いてもよい。
左時間信号システム720及び右時間信号システム722は、低ビットレートチャネルを介した伝送用のステレオ音響信号等の左右チャネル信号を供給する。1つの例示的な実施形態では、左時間信号システム720及び右時間信号システム722によって供給される処理済み信号を用いて、他の場合には望ましくないオーディオアーチファクトを生じるはずのオーディオ成分を取り除くことによって、低ビットレートにおいて改善されたオーディオ品質を有するステレオ音響音データを供給することができる。
本発明のシステム及び方法の例示的な実施形態を本明細書において詳細に説明したが、当業者であれば、添付の請求項の範囲及び技術的思想から逸脱することなく、これらのシステム及び方法に種々の置き換え及び修正を加えることができる点は理解されるであろう。
102、104 時間−周波数変換システム
106、116、118、120、122 位相差システム
108 バッファシステム
110 N−2フレームバッファ
112 N−1フレームバッファ
114 Nフレームバッファ
124 位相差重み付けシステム
126 振動強度修正システム
128、130 周波数−時間変換システム

Claims (17)

  1. 位相変調されたステレオデータからパラメトリックステレオデータを生成するためのシステムであって、
    左チャネルオーディオデータ及び右チャネルオーディオデータを含む前記位相変調されたステレオデータを受け取り、該左チャネルオーディオデータから生成された左チャネル周波数領域データと該右チャネルオーディオデータから生成された右チャネル周波数領域データとの間の位相差に基づいて位相差データを生成する位相差システムであって、
    前記左チャネル周波数領域データが左チャネル振幅データと左チャネル位相データを含み、前記右チャネル周波数領域データが右チャネル振幅データと右チャネル位相データを含む、位相差システムと、
    前記位相差データを受け取り、該位相差データに基づいて前記左チャネル振幅データ及び前記右チャネル振幅データを調節するための重み付けデータを生成する位相差重み付けシステムと、
    前記重み付けデータを用いて前記左チャネル振幅データ及び前記右チャネル振幅データを調節し、前記左チャネル周波数領域データから前記左チャネル位相データを及び前記右チャネル周波数領域データから前記右チャネル位相データを取り除き、前記パラメトリックステレオデータを生成する振動強度修正システムと、
    を備えるシステム。
  2. 前記位相差重み付けシステムは、複数の左チャネル周波数領域データフレーム及び右チャネル周波数領域データフレームを受け取る、
    請求項1に記載のシステム。
  3. 2つ又はそれ以上の対応する左チャネル周波数領域データフレーム及び右チャネル周波数領域データフレームにおいて前記左チャネル周波数領域データと前記右チャネル周波数領域データとの間の前記位相差データを記憶するバッファシステムを更に備える、
    請求項2に記載のシステム。
  4. 前記位相差重み付けシステムは左チャネル周波数領域データ及び右チャネル周波数領域データの第1及び第2対応フレームについて前記位相差データを受け取り、左チャネル周波数領域データ及び右チャネル周波数領域データの第1及び第2対応フレームの間の第1位相差を特定し、
    前記位相差重み付けシステムは左チャネル周波数領域データ及び右チャネル周波数領域データの第2及び第3対応フレームについて前記位相差データを受け取り、左チャネル周波数領域データ及び右チャネル周波数領域データの前記第2及び第3対応フレームの間の第2位相差を特定する、
    請求項3に記載のシステム。
  5. 前記位相差重み付けシステムは、前記第1及び第2位相差に基づいて前記左チャネル振幅データ及び前記右チャネル振幅データを調節するための重み付けデータを生成する、請求項4に記載のシステム。
  6. 前記振動強度修正システムは、前記重み付けデータを用いて前記左チャネル周波数領域データ及び前記右チャネル周波数領域データの左チャネル振幅データ及び右チャネル振幅データを調節し、前記左チャネル周波数領域データ及び前記右チャネル周波数領域データ内の位相データを取り除く、
    請求項5に記載のシステム。
  7. 前記左チャネル位相データが取り除かれた状態になっている前記左チャネル周波数領域データと前記右チャネル位相データが取り除かれた状態になっている右チャネル周波数領域データを前記振動強度修正システムから受け取り、前記左チャネル周波数領域データ及び前記右チャネル周波数領域データを振幅調節された左チャネル時間領域データ及び振幅調節された右チャネル時間領域データに変換する周波数領域−時間領域変換システムを更に備える、
    請求項6に記載のシステム。
  8. 位相変調されたオーディオデータからパラメトリックオーディオデータを生成する方法であって、
    時間領域信号からの第1チャネルオーディオデータを第1チャネル周波数領域データに変換する段階であって、
    前記第1チャネル周波数領域データが第1チャネル振幅データ及び第1チャネル位相データを含む、段階と、
    時間領域信号からの第2チャネルオーディオデータを第2チャネル周波数領域データに変換する段階であって、
    前記第2チャネル周波数領域データが第2チャネル振幅データ及び第2チャネル位相データを含む、段階と、
    前記第1チャネル周波数領域データ及び前記第2チャネル周波数領域データ間の位相差を特定する段階と、
    前記第1チャネル周波数領域データ及び前記第2チャネル周波数領域データ間の位相差に基づいて前記第1チャネル振幅データ及び前記第2チャネル振幅データに適用するための重み付けデータを決定する段階と、
    前記重み付けデータを有する前記第1チャネル振幅データを調節して前記第1チャネル周波数領域データから前記第1チャネル位相データを取り除く段階と、及び、
    前記重み付けデータを有する前記第2チャネル振幅データを調節して前記第2チャネル周波数領域データから前記第2チャネル位相データを取り除く段階とを含む方法。
  9. 前記第1チャネル周波数領域データが、第1の複数のフレームを含み、第2チャネル周波数領域データが第2の複数のフレームを含み、
    前記第1の複数のフレームと第2の複数のフレームの2つ又はそれ以上の対応するフレーム間の位相差を特定する段階と、
    を含む、
    請求項8に記載の方法。
  10. 前記重み付けデータが前記第1の複数のフレームと第2の複数のフレームの2つ又はそれ以上の対応するフレーム間の位相差に基づいて決定される、
    請求項9に記載の方法。
  11. 位相変調されたオーディオデータからパラメトリックオーディオデータを生成するためのシステムであって、
    オーディオデータの第1チャネル及びオーディオデータの第2チャネルを受け取る手段であって、前記第1チャネルオーディオデータが第1チャネル振幅データ及び第1チャネル位相データを含む2つ以上の第1チャネル周波数ビンを含み、前記第2チャネルオーディオデータが第2チャネル振幅データ及び第2チャネル位相データを含む2つ以上の第2チャネル周波数ビンを含む、手段と、
    前記2つ又はそれ以上の第1チャネル周波数ビンと前記2つまたはそれ以上の第2チャネル周波数ビンとの間の位相差を特定する手段と、
    前記位相差を受け取り、前記位相差に基づいて重み付けデータを生成する手段と、
    生成された前記重み付けデータを用いて前記第1チャネル振幅データ及び第2チャネル振幅データを調節し、前記2つ又はそれ以上の第1チャネル周波数ビンから前記第1チャネル位相データ及び前記2つまたはそれ以上の第2チャネル周波数ビンから前記第2チャネル位相データを取り除く手段と、を備えるシステム。
  12. 前記位相差を受け取る手段は、前記2つ又はそれ以上のオーディオデータチャネルにおける複数の周波数領域データフレームを受け取る、
    請求項11に記載のシステム。
  13. 前記2つ又はそれ以上の第1チャネル周波数ビンと前記2つまたはそれ以上の第2チャネル周波数ビンについての周波数領域データの複数のフレームについて、前記2つ又はそれ以上の第1チャネル周波数ビンと前記2つまたはそれ以上の第2チャネル周波数ビンの間の位相差を記憶する手段を更に備える、
    請求項12に記載のシステム。
  14. 前記第1チャネルのオーディオデータ第2チャネルのオーディオデータデータに対する前記2つ又はそれ以上の対応する複数のフレームの周波数領域データについて前記2つ又はそれ以上の第1チャネル周波数ビンと前記2つまたはそれ以上の第2チャネル周波数ビンの間の記憶された位相差データの2つ又はそれ以上の組の間の位相差を特定する手段を更に備える、
    請求項13に記載のシステム。
  15. 前記第1チャネルのオーディオデータチ及び第2チャネルのオーディオデータ対して前記2つ又はそれ以上の対応する複数のフレームの周波数領域データについて前記2つ又はそれ以上の第1チャネル周波数ビンと前記2つまたはそれ以上の第2チャネル周波数ビンの間の記憶された位相差の2つ又はそれ以上の組の間の1つ又はそれ以上の位相差に基づいて、1つ又はそれ以上のチャネルの第1チャネルのオーディオデータ及び第2チャネルのオーディオデータにおける前記第1チャネル振幅データ及び第2チャネル振幅データを調節するための前記重み付けデータを生成する手段を更に備える、
    請求項14に記載のシステム。
  16. 前記重み付けデータを用いて前記第1チャネルのオーディオデータチ及び第2チャネルの前記1つ又はそれ以上のチャネルの前記複数のフレームの前記周波数領域データについての振幅データを調節して、重み付けされた周波数領域データを取得する手段を更に備える、
    請求項15に記載のシステム。
  17. 前記重み付き周波数領域データを時間領域に変換する手段を更に備える、
    請求項16に記載のシステム。
JP2011523003A 2008-08-15 2009-08-14 パラメトリックステレオ変換システム及び方法 Expired - Fee Related JP5607626B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/192,404 2008-08-15
US12/192,404 US8385556B1 (en) 2007-08-17 2008-08-15 Parametric stereo conversion system and method
PCT/US2009/004674 WO2010019265A1 (en) 2008-08-15 2009-08-14 Parametric stereo conversion system and method

Publications (2)

Publication Number Publication Date
JP2012500410A JP2012500410A (ja) 2012-01-05
JP5607626B2 true JP5607626B2 (ja) 2014-10-15

Family

ID=41669154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011523003A Expired - Fee Related JP5607626B2 (ja) 2008-08-15 2009-08-14 パラメトリックステレオ変換システム及び方法

Country Status (9)

Country Link
US (1) US8385556B1 (ja)
EP (1) EP2313884B1 (ja)
JP (1) JP5607626B2 (ja)
KR (1) KR101552750B1 (ja)
CN (1) CN102132340B (ja)
HK (2) HK1150186A1 (ja)
PL (1) PL2313884T3 (ja)
TW (1) TWI501661B (ja)
WO (1) WO2010019265A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2353160A1 (en) * 2008-10-03 2011-08-10 Nokia Corporation An apparatus
EP2345026A1 (en) * 2008-10-03 2011-07-20 Nokia Corporation Apparatus for binaural audio coding
EP2326108B1 (en) * 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
CA2793140C (en) 2010-04-09 2016-05-31 Dolby International Ab Mdct-based complex prediction stereo coding
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
JP6216553B2 (ja) * 2013-06-27 2017-10-18 クラリオン株式会社 伝搬遅延補正装置及び伝搬遅延補正方法
JP6543627B2 (ja) 2013-07-30 2019-07-10 ディーティーエス・インコーポレイテッドDTS,Inc. 一定出力ペアワイズパニングによるマトリクスデコーダ
CN105981411B (zh) 2013-11-27 2018-11-30 Dts(英属维尔京群岛)有限公司 用于高声道计数的多声道音频的基于多元组的矩阵混合
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US10045145B2 (en) * 2015-12-18 2018-08-07 Qualcomm Incorporated Temporal offset estimation
US10491179B2 (en) * 2017-09-25 2019-11-26 Nuvoton Technology Corporation Asymmetric multi-channel audio dynamic range processing
CN107799121A (zh) * 2017-10-18 2018-03-13 广州珠江移动多媒体信息有限公司 一种无线广播音频的数字水印嵌入及检出方法
CN108962268B (zh) * 2018-07-26 2020-11-03 广州酷狗计算机科技有限公司 确定单声道的音频的方法和装置
CN109036455B (zh) * 2018-09-17 2020-11-06 中科上声(苏州)电子有限公司 直达声与背景声提取方法、扬声器系统及其声重放方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1479071B1 (en) 2002-02-18 2006-01-11 Koninklijke Philips Electronics N.V. Parametric audio coding
WO2007109338A1 (en) * 2006-03-21 2007-09-27 Dolby Laboratories Licensing Corporation Low bit rate audio encoding and decoding
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7639823B2 (en) 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
US7283634B2 (en) * 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
JP3968450B2 (ja) * 2005-09-30 2007-08-29 ザインエレクトロニクス株式会社 ステレオ変調器およびそれを用いたfmステレオ変調器
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
JP4940671B2 (ja) * 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation

Also Published As

Publication number Publication date
TWI501661B (zh) 2015-09-21
CN102132340A (zh) 2011-07-20
JP2012500410A (ja) 2012-01-05
KR101552750B1 (ko) 2015-09-11
CN102132340B (zh) 2012-10-03
US8385556B1 (en) 2013-02-26
TW201016041A (en) 2010-04-16
EP2313884A1 (en) 2011-04-27
KR20110055651A (ko) 2011-05-25
HK1155549A1 (en) 2012-05-18
HK1150186A1 (en) 2011-11-04
WO2010019265A1 (en) 2010-02-18
EP2313884A4 (en) 2012-12-12
PL2313884T3 (pl) 2014-08-29
EP2313884B1 (en) 2014-03-26

Similar Documents

Publication Publication Date Title
JP5607626B2 (ja) パラメトリックステレオ変換システム及び方法
US9407993B2 (en) Latency reduction in transposer-based virtual bass systems
US10750278B2 (en) Adaptive bass processing system
JP5802753B2 (ja) マルチチャンネルオーディオ再生のためのアップミキシング方法及びシステム
EP2907324B1 (en) System and method for reducing latency in transposer-based virtual bass systems
US20120106742A1 (en) Audio content enhancement using bandwidth extension techniques
TW202116077A (zh) 使用頻譜正交音訊分量之副頻帶空間及串擾處理
TWI689918B (zh) 用於對相聽覺傳輸技術之揚聲器系統之串音消除
JP6865885B2 (ja) サブバンド空間オーディオエンハンスメント
US10484808B2 (en) Audio signal processing apparatus and method for processing an input audio signal
CN107534823B (zh) 用于修改立体声信号的立体声像的音频信号处理装置和方法
KR102470429B1 (ko) 우선순위에 의한 공간 인식 다중 대역 압축 시스템
CN112566008A (zh) 音频上混方法、装置、电子设备和存储介质
US20130085762A1 (en) Audio encoding device
JP6244652B2 (ja) 音声処理装置及びプログラム
JP2011151698A (ja) 音源信号補完装置
WO2013050605A1 (en) Stability and speech audibility improvements in hearing devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130507

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140226

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140523

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140530

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140828

R150 Certificate of patent or registration of utility model

Ref document number: 5607626

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees