JP5358691B2 - 位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム - Google Patents

位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム Download PDF

Info

Publication number
JP5358691B2
JP5358691B2 JP2011541522A JP2011541522A JP5358691B2 JP 5358691 B2 JP5358691 B2 JP 5358691B2 JP 2011541522 A JP2011541522 A JP 2011541522A JP 2011541522 A JP2011541522 A JP 2011541522A JP 5358691 B2 JP5358691 B2 JP 5358691B2
Authority
JP
Japan
Prior art keywords
phase
audio signal
phase value
upmix
smoothed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011541522A
Other languages
English (en)
Other versions
JP2012512438A (ja
Inventor
マティアス ノイズィンガー
ユリアン ロビヤール
ジョーハン ヒルペアト
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2012512438A publication Critical patent/JP2012512438A/ja
Application granted granted Critical
Publication of JP5358691B2 publication Critical patent/JP5358691B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

本発明に係る実施形態は、ダウンミックスオーディオ信号をアップミックスする装置、方法およびコンピュータプログラムに関する。
本発明に係るいくつかの実施形態は、パラメトリックマルチチャンネルオーディオ符号化のための適応位相パラメータ平滑化に関する。
以下において、本発明の背景が記載される。パラメトリックオーディオ符号化における最近の進展は、マルチチャンネルオーディオ信号(例えば5.1)を、サイド情報ストリームを加えた1つ(またはより多く)のダウンミックスチャンネルに連帯して符号化する技術をもたらしている。これらの技術は、バイノーラルキュー符号化、パラメトリックステレオおよびMPEGサラウンド等として知られている。
多くの刊行物は、いわゆる「バイノーラルキュー符号化」パラメトリックマルチチャンネル符号化のアプローチを記述している(例えば、非特許文献1〜5を参照)。
「パラメトリックステレオ」は、送信されたモノラル信号に加えたパラメータのサイド情報に基づく2チャンネルステレオ信号のパラメトリック符号化に関連する技術である(例えば、非特許文献6,7を参照)。
「MPEGサラウンド」はパラメトリックマルチチャンネル符号化に対するISO規格である(例えば、非特許文献8を参照)。
上述の技術は、人間の空間聴力に対して関連する知覚キューを、モノラルまたはステレオダウンミックス信号と共にレシーバにコンパクトな形で送信することに基づく。通常のキューは、チャンネル間レベル差(ILD)、チャンネル間相関またはコヒーレンス(ICC)、並びにチャンネル間時間差(ITD)、チャンネル間位相差(IPD)および全体位相差(OPD)とすることができる。
これらのパラメータは、いくつかのケースでは、人間の聴覚解像度に適合する周波数および時間分解能において送信される。
送信のために、パラメータは、通常は量子化され(または、いくつかのケースではさらに必ず量子化され)、しばしば(特に低ビットレートシナリオに対して)、むしろ粗い量子化が用いられる。
時間更新インターバルは、信号特性に依存して、エンコーダによって決定される。これは、パラメータはダウンミックス信号のすべてのサンプルに対しては送信されないことを意味する。言い換えれば、いくつかのケースでは、上述のキューを記述するパラメータの送信レート(または送信周波数または更新レート)は、オーディオサンプル(またはオーディオサンプル群)の送信レート(または送信周波数または更新レート)より小さくすることができる。
チャンネル間位相差(IPD)および全体位相差(OPD)を送信する代わりに、チャンネル間位相差(IPD)のみを送信し、デコーダにおいて全体位相差(OPD)を推定することもできる。
デコーダは、いくつかのケースにおいて、パラメータを、例えば各サンプル(またはオーディオサンプル)に、時間上で連続的にギャップのない方法で適用しなければならない可能性があるので、中間パラメータは、通常はパラメータセットの過去と現在の間の補間によって、デコーダ側で導き出されることを必要とするかもしれない。
いくつかの従来の補間アプローチは、しかしながら、劣等なオーディオ品質に結果としてなる。
以下に、一般的なバイノーラルキュー符号化のスキームが、図7を参照して記載される。図7は、バイノーラルキュー符号化エンコーダ810とバイノーラルキュー符号化デコーダ820を備えるバイノーラルキュー符号化送信システム800の概略ブロック図を示す。バイノーラルキュー符号化エンコーダ810は、例えば、複数のオーディオ信号812a、812bおよび812cを受信することができる。更に、バイノーラルキュー符号化エンコーダ810は、ダウンミックス部814を用いて、オーディオ入力信号812a〜812cをダウンミックスし、例えば、和信号とすることができ、「AS」または「X」によって示すことができるダウンミックス信号816を取得するように構成される。更に、バイノーラルキュー符号化エンコーダ810は、解析部818を用いてオーディオ入力信号812a〜812cを解析し、サイド情報信号819(「SI」)を取得するように構成される。和信号816およびサイド情報信号819は、バイノーラルキュー符号化エンコーダ810からバイノーラルキュー符号化デコーダ820に送信される。バイノーラルキュー符号化デコーダ820は、和信号816およびチャンネル間キュー824に基づいて、例えばオーディオチャンネルy1、y2、…、yNを備えるマルチチャンネルオーディオ出力信号を合成するように構成することができる。この目的のために、バイノーラルキュー符号化デコーダ820は、和信号816およびチャンネル間キュー824を受信し、オーディオ信号y1、y2、…、yNを提供するバイノーラルキュー符号化合成部822を備えることができる。
バイノーラルキュー符号化デコーダ820は、サイド情報819およびオプションとしてユーザー入力827を受信するように構成されたサイド情報処理部826を更に備える。サイド情報処理部826は、サイド情報819およびオプションのユーザー入力827に基づいてチャンネル間キュー824を提供するように構成される。
要約すると、オーディオ入力信号は、解析され、そしてダウンミックスされる。サイド情報を加えた和信号は、デコーダに送信される。チャンネル間キューは、サイド情報およびローカルユーザ入力から生成される。バイノーラルキュー符号化の合成は、マルチチャネルオーディオ出力信号を生成する。
詳細は、C. Faller と F. Baumgarte による記事「バイノーラルキュー符号化第2部:スキームとアプリケーション」(IEEE論文集「音声とオーディオ処理」第11巻、第6号、2003年11月で公表)を参照されたい。
しかしながら、多くの従来のバイノーラルキュー符号化デコーダは、サイド情報が粗くまたは不十分な分解能で量子化される場合、劣化した品質を有するマルチチャンネル出力オーディオ信号を提供することが分かっている。
この問題から鑑みて、アップミックス信号の異なるチャンネル間の位相関係を記述するサイド情報が比較的低い分解能で量子化された場合に、聴覚インプレッションの劣化を低減する、ダウンミックスオーディオ信号をアップミックスされたオーディオ信号にアップミックスする改善されたコンセプトのニーズがある。
C. FallerとF. Baumgarte、「知覚パラメータ化を用いた空間オーディオの効率的な表現」、IEEE WASPAA、Mohonk、NY、2001年10月 F. BaumgarteとC. Faller、「バイノーラルキュー符号化のための聴覚空間キューの評価」、ICASSP、オーランド、FL、2002年5月 C. FallerとF. Baumgarte、「バイノーラルキュー符号化:空間オーディオの新規で効率的な表現」、ICASSP、オーランド、FL、2002年5月 C. FallerとF. Baumgarte、「フレキシブルレンダリングを有するオーディオ圧縮に適用されるバイノーラルキュー符号化」、AES 第113回大会、ロサンゼルス、予稿集5686、2002年10月 C. FallerとF. Baumgarte、「バイノーラルキュー符号化−パート2:スキームおよびアプリケーション」、IEEE研究報告(音声とオーディオ)、第11巻、第6号、2003年11月 J. Breebaart,S. van de Par,A. Kohlrausch,E. Schuijers、「低いビットレートでの高品質パラメトリック空間オーディオ符号化」、AES 第116回大会、ベルリン、予稿集6072、2004年5月 E. Schuijers,J. Breebaart,H. Purnhagen,J. Engdegard、「低い複雑度のパラメトリックステレオ符号化」、AES 第116回大会、ベルリン、予稿集6073、2004年5月 ISO/IEC JTC1/SC29/WG11、23003-1(MPEGサラウンド) J. Blauert、「空間聴覚:ヒューマン音響位置決め」、MITプレス、ケンブリッジ、MA、1997年改訂版
本発明に係る実施形態は、1つ以上のダウンミックスオーディオチャンネルを記述するダウンミックスオーディオ信号を、複数のアップミックスされたオーディオチャンネルを記述するアップミックスされたオーディオ信号にアップミックスする装置を構築する。装置は、アップミックスされたオーディオ信号を取得するために、時間的に可変のアップミックスパラメータを、ダウンミックス信号をアップミックスするために適用するように構成されたアップミックス部を備える。時間的に可変のアップミックスパラメータは、時間的に可変の平滑化された位相値を含む。装置は、量子化されたアップミックスパラメータ入力情報に基づいてアップミックス部によって用いられる1つ以上の時間的に平滑化されたアップミックスパラメータを取得するように構成されたパラメータ決定部を更に備える。パラメータ決定部は、位相変化限定アルゴリズムを用いて、前の平滑化された位相値のスケーリングされたバージョンを入力位相情報のスケーリングされたバージョンと結合し、前の平滑化された位相値と入力位相情報に基づいて現在の平滑化された位相値を決定するように構成される。
本発明に係るこの実施形態は、前の平滑化された位相値を位相変化限定アルゴリズムとともに考慮することが、平滑化された位相値の不連続性を適度に小さく保つことを可能とするので、位相変化限定アルゴリズムを用いて、前の平滑化された位相値のスケーリングされたバージョンを入力位相情報のスケーリングされたバージョンと結合することによって、アップミックス信号における聞き取れるアーチファクトを低減するまたはさらに回避することができるという発見に基づいている。引き続く平滑化された位相値(例えば前の平滑化された位相値と現在の平滑化された位相値)の不連続性の低減は、次に、引き続く位相値(例えば前の平滑化された位相値と現在の平滑化された位相値)が適用されるオーディオ信号の部分間の遷移での聞き取れる周波数変動を回避する(または十分に小さく保つ)ことを助ける。
上記を要約すると、本発明は、パラメトリックマルチチャンネルオーディオ符号化のための適応位相処理の一般的なコンセプトを構築する。本発明に係る実施形態は、粗い量子化または急速な位相パラメータの変化によって生じる出力信号におけるアーチファクトを低減することによって、他の技術に取って代わる。
好ましい実施形態において、パラメータ決定部は、現在の平滑化された位相値が、前の平滑化された位相値によって定義される第1の開始方向から位相値情報によって定義される第1の終了方向に数学的に正方向に伸展する第1の角度領域と、位相値情報によって定義される第2の開始方向から前の平滑化された位相値によって定義される第2の終了方向に数学的に正方向に伸展する第2の角度領域のうちの、より小さい角度領域にあるように、前の平滑化された位相値のスケーリングされたバージョンを、入力位相情報のスケーリングされたバージョンと結合するように構成される。したがって 、本発明のいくつかの実施形態において、位相値の再帰的な(無限インパルス応答タイプの)平滑化によって導入される位相変動は、可能な限り小さく保たれる。したがって、聞き取れるアーチファクトは、可能な限り小さく保たれる。例えば、装置は、現在の平滑化された位相値が、第1の角度範囲は180°以上をカバーし、第2の角度範囲は180°未満をカバーし、合せて360°をカバーする2つの角度範囲のうちのより小さい角度範囲の中に位置することを確実にするように構成することができる。したがって、位相変化限定アルゴリズムによって、前の平滑化された位相値と現在の平滑化された位相値の位相差が180°より小さく、好ましくはさらに90°より小さいことが確保にされる。これは、聞き取れるアーチファクトを可能な限り小さく保つことを助ける。
好ましい実施形態において、パラメータ決定部は、位相入力情報と前の平滑化された位相値の差に依存して複数の異なる結合ルールから結合ルールを選択し、選択された結合ルールを用いて現在の平滑化された位相値を決定するように構成される。したがって、前の平滑化された位相値と現在の平滑化された位相値の位相変化が予め定められた閾値より小さい、または、さらに一般的にいえば十分に小さいまたは可能な限り小さいことを確実にする適当な結合ルールが選択されることを達成することができる。したがって、発明の装置は、固定の結合ルールを有する類似の装置より優れた性能を示す。
好ましい実施形態において、パラメータ決定部は、位相入力情報と前の平滑化された位相値の差が−πと+πの範囲にある場合に、基本的な結合ルールを選択し、1つ以上の異なる位相適応結合ルールを選択するように構成される。基本的な結合ルールは、位相入力情報のスケーリングされたバージョンと前の平滑化された位相値のスケーリングされたバージョンとの、定数の被加数を有しない線形結合を定義する。1つ以上の位相適応結合ルールは、入力位相情報のスケーリングされたバージョンと前の平滑化された位相値のスケーリングされたバージョンとの、定数の位相適応被加数を考慮に入れた線形結合を定義する。したがって、前の平滑化された位相値と入力位相情報の有益で簡単に使える線形結合を実行することができ、前の平滑化された位相値と入力位相情報の差が比較的大きい値(πより大きいまたは−πより小さい)をとる場合、付加的な被加数を選択的に適用することができる。したがって、前の平滑化された位相値と入力位相情報に大きな差があるような問題となるケースは、引き続く平滑化された位相値の位相変化を十分に小さく保つことを可能とする十分に適応された位相適応結合ルールによって処理することができる。
好ましい実施形態において、パラメータ決定部は、平滑化された位相量と対応する入力位相量との差が予め定められた閾値よりも大きい場合に、位相値平滑化を選択的に無効にするように構成された平滑化制御部を備える。したがって、位相値平滑化機能は、入力位相情報において大きな変化がある場合に無効とすることができる。入力位相情報の比較的大きい(量子化ステップよりかなり大きい)変化は、しばしばオーディオ信号の中の特定の音響イベントに関連するので、通常は、入力位相情報の非常に大きな変化は、実際には、非平滑化位相変更を実行することを要求されることを示す。このように、ほとんどのケースにおいて聴覚インプレッションを改善する位相値の平滑化は、この特定のケースにおいて有害となる。したがって、聴覚インプレッションは、位相値平滑化機能を選択的に無効にすることによって、さらに改善することができる。
好ましい実施形態において、平滑化制御部は、平滑化された位相量として、2つの平滑化された位相値の差を評価し、対応する入力位相量として、2つの平滑化された位相値に対応する2つの入力位相値の差を評価するように構成される。いくつかのケースにおいて、マルチチャンネルオーディオ信号の異なる(アップミックスされた)チャンネルに関係する位相値の差が、位相値平滑化機能を無効にすべきかどうかを決定する特に意味のある量であることが分っている。
好ましい実施形態において、アップミックス部は、平滑機能(または位相値平滑化機能)が有効である場合に、所定の時間部分に対して、異なる平滑化された位相値によって定義される異なる時間的に平滑化された位相回転を適用し、チャンネル間位相差を有するアップミックスされたオーディオチャンネルの信号を取得し、平滑機能(または位相値平滑化機能)が無効である場合に、異なる平滑化されない位相値によって定義される時間的に平滑化されない位相回転を適用し、チャンネル間位相差を有するアップミックスされたオーディオチャンネルの異なる信号を取得するように構成される。このケースにおいて、パラメータ決定部は、異なるアップミックスされたオーディオチャンネルの信号を取得するために適用された平滑化された位相値の差が、アップミックス部に受信されるかまたはアップミックス部によって受信された情報から導き出された平滑化されないチャンネル間位相差値から、予め定められた閾値以上異なる場合に、位相値平滑化機能を選択的に有効または無効にするように構成された、平滑化制御部を備える。チャンネル間位相差値が位相値平滑化機能を活性化および非活性化するための判定基準として評価される場合に、位相値平滑化機能の選択的な不活性化は、聴覚インプレッションを改善する観点から特に有用であることが分かっている。
好ましい実施形態において、パラメータ決定部は、平滑化された位相値と対応する入力位相値の間の現在の差に依存して、一連の平滑化された位相値を決定するためのフィルタ時定数を調節するように構成される。フィルタ時定数を調節することによって、入力位相値の低および中程度の変化に対して平滑化特性を十分によく保ちながら、入力位相値の非常に大きな変化に対して十分に小さい整定時間を得ることが達成される。入力位相値の比較的小さい(または、最大でも中程度の)変化は、しばしば定量化の粒状性によって生じるので、この機能は特別な利益をもたらす。言い換えれば、定量化の粒状性によって生じる入力位相値の段階的変化は、平滑化の効率的な動作に結果としてなる場合がある。このようなケースにおいて、平滑化機能は、比較的長いフィルタ時定数が良好な結果をもたらし、平滑化機能は特に有益である場合がある。対照的に、量子化ステップよりかなり大きい入力位相値の非常に大きな変化は、通常は位相値の所望の大きな変化に対応する。この場合、比較的短いフィルタ時定数は、良好な結果をもたらす。したがって、平滑化された位相値と対応する入力位相値との現在の差に依存してフィルタ時定数を調節することによって、入力位相値の意図的な大きな変化は平滑化された位相値の速い変化に結果としてなり、量子化ステップのサイズをとる入力位相値の比較的小さな変化は平滑化された位相値の比較的遅く、滑らかな遷移に結果としてなることを達成することができる。したがって、良好な聴覚インプレッションは、所望の位相値の意図的な大きな変化と、所望の位相値の小さな変化(それは、しかしながら、1量子化ステップだけ入力位相値の変化を生じさせるかもしれない)の両方に対して達成される。
好ましい実施形態において、パラメータ決定部は、アップミックスされたオーディオ信号の異なるチャンネルに関係する2つの平滑化された位相値の差によって定義された平滑化されたチャンネル間位相差と、非平滑化チャンネル間位相差情報によって定義された非平滑化チャンネル間位相差との差に依存して、一連の平滑化された位相値を決定するためのフィルタ時定数を調節するように構成される。フィルタ時定数を選択的に調節するコンセプトは、チャンネル間位相差の処理とともに有効に使用できることが分かっている。
好ましい実施形態において、アップミックスする装置は、オーディオビットストリームから抽出される情報に依存して、位相値平滑化機能を選択的に有効または無効にするように構成される。オーディオエンコーダの制御下で、オーディオデコーダにおいて位相値平滑化機能を選択的に有効または無効にする可能性を提供することによって、聴覚インプレッションの改善を得ることができることが分かっている。
本発明による実施形態は、上述されたダウンミックスオーディオ信号をアップミックスされたオーディオ信号にアップミックスする装置の機能を実施する方法を構築する。前記方法は、上述された装置と同じアイデアに基づいている。
加えて、本発明による実施形態は、前記方法を実行するコンピュータプログラムを構築する。
本発明による実施形態は、添付図面を参照して、引き続いて記載される。
本発明の一実施形態に係るダウンミックスオーディオ信号をアップミックスする装置の概略ブロック図を示す。 本発明の他の実施形態に係るダウンミックスオーディオ信号をアップミックスする装置の概略ブロック図を示す。 本発明の他の実施形態に係るダウンミックスオーディオ信号をアップミックスする装置の概略ブロック図を示す。 全体位相差OPD1、OPD2およびチャンネル間位相差IPDの概略表現を示す。 位相変化限定アルゴリズムの第1のケースの位相関係のグラフィック表現を示す。 位相変化限定アルゴリズムの第1のケースの位相関係のグラフィック表現を示す。 位相変化限定アルゴリズムの第2のケースの位相関係のグラフィック表現を示す。 位相変化限定アルゴリズムの第2のケースの位相関係のグラフィック表現を示す。 本発明の一実施形態に係るダウンミックスオーディオ信号をアップミックスされたオーディオ信号にアップミックスする方法のフローチャートを示す。 一般的なバイノーラルキュー符号化のスキームを表す概略ブロック図を示す。
1. 図1に係る実施形態
図1は、本発明の一実施形態に係るダウンミックスオーディオ信号をアップミックスする装置100の概略ブロック図を示す。装置100は、1つ以上のダウンミックスオーディオチャンネルを記述するダウンミックスオーディオ信号110を受信し、複数のアップミックスされたオーディオチャンネルを記述するアップミックスされたオーディオ信号120を提供するように構成される。装置100は、アップミックスされたオーディオ信号120を取得するために、時間的に可変のアップミックスパラメータを、ダウンミックスオーディオ信号110をアップミックスするために適用するように構成されたアップミックス部130を備える。装置100は、また、量子化されたアップミックスパラメータ入力情報142を受信するように構成されたパラメータ決定部140を備える。
パラメータ決定部140は、アップミックス部130による使用に対して、量子化されたアップミックスパラメータ入力情報142に基づいて1つ以上の時間的に平滑化されたアップミックスパラメータ144を取得するように構成される。パラメータ決定部140は、前の平滑化された位相値のスケーリングされたバージョンを、量子化されたアップミックスパラメータ入力情報142に含まれる入力位相情報142aのスケーリングされたバージョンと結合し、前の平滑化された位相値と入力位相情報に基づいて現在の平滑化された位相値144aを決定するように構成される。現在の平滑化された位相値144aは、時間的に可変の平滑化されたアップミックスパラメータ144に含まれる。
以下において、装置100の機能に関するいくつかの詳細が記載される。ダウンミックスオーディオ信号110は、例えば、(ここでは示されないエンコーダによって決定される更新レートでオーバラップするまたはオーバラップしない周波数バンドまたは周波数サブバンドを記述する)時間−周波数ドメインにおいて、ダウンミックスオーディオ信号を表す複素数値のセットのシーケンスの形で、アップミックス部130に入力される。アップミックス部130は、ダウンミックスオーディオ信号110の多重チャンネルを、時間的に可変の平滑化されたアップミックスパラメータに依存して線形に結合する、および/または、ダウンミックスオーディオ信号110のチャンネルを、補助信号(例えば非相関化信号)(ここで、補助信号は、ダウンミックスオーディオ信号110の同じオーディオチャンネルから、ダウンミックスオーディオ信号110の1つ以上の他のオーディオチャンネルから、またはダウンミックスオーディオ信号110のオーディオチャンネルの結合から導き出すことができる)と線形に結合するように構成される。このように、時間的に可変の平滑化されたアップミックスパラメータ144は、ダウンミックスオーディオ信号110に基づいて、アップミックスされたオーディオ信号120(またはそれのチャンネル)の生成において用いられる振幅スケーリングおよび/または位相回転(または時間遅延)を決定するために、アップミックス部130によって使用することができる。
パラメータ決定部140は、通常は、時間的に可変の平滑化されたアップミックスパラメータ144を、量子化されたアップミックスパラメータ入力情報142によって記述されるサイド情報の更新レートに等しい(または、いくつかのケースでは、より高い)更新レートで提供するように構成される。パラメータ決定部140は、量子化されたアップミックスパラメータ入力情報142の粗い(ビットレート節減)定量化に起因するアーチファクトを回避する(または、少なくとも、低減する)ように構成することができる。この目的に対して、パラメータ決定部140は、例えば、チャンネル間位相差を記述する位相情報の平滑化を適用することができる。量子化されたアップミックスパラメータ入力情報142に含まれる入力位相情報142aのこの平滑化は、聞き取れるアーチファクトに結果としてなる大きくて突然の位相の変化が回避される(または、少なくとも、許容できる程度に限定される)ように、位相変化限定アルゴリズム143を用いて実行される。
平滑化は、好ましくは、現在の平滑化された位相値が前の平滑化された位相値と入力位相情報の現在値の両方に依存するように、前の平滑化された位相値を入力位相情報142aの値と結合することによって実行される。こうすることによって、単純な平滑化アルゴリズムの構成を用いて、特別に滑らかな遷移を得ることができる。言い換えれば、有限インパルス応答平滑化の不都合は、前の平滑化された位相値が考慮される無限インパルス応答タイプの平滑化を提供することによって回避することができる。
オプションとして、パラメータ決定部140は、量子化されたアップミックスパラメータ入力情報142が比較的長い時間インターバル(例えば、ダウンミックスオーディオ信号110のスペクトル値のセットにつき一度未満)で送信される場合に有益である付加的な補間機能を備えることができる。
要約すると、装置100は、時間的に可変の平滑化された位相値144aがアップミックス部130を用いてダウンミックスオーディオ信号110からアップミックスされたオーディオ信号120を導き出すことに適切なように、量子化されたアップミックスパラメータ入力情報142に基づく時間的に可変の平滑化された位相値144aの提供を可能とする。
前の平滑化された位相値の考慮が位相変化限定と結合される上述のコンセプトを用いて、平滑化された位相値144aを提供することによって、聞き取れるアーチファクトは低減される(またはさらに除去される)。したがって、アップミックスされたオーディオ信号120の良好な聴覚インプレッションが得られる。
2. 図2に係る実施形態
2.1 図2の実施形態の概要
オーディオ信号をアップミックスする装置の構成と動作に関する更なる詳細は、図2aと2bを参照して記載される。図2aと2bは、本発明の他の実施形態に係るダウンミックスオーディオ信号をアップミックスする装置200の概略ブロック図を示す。
装置200は、ダウンミックスオーディオ信号210とサイド情報SIに基づいてマルチチャンネル(例えば5.1)オーディオ信号を生成するデコーダと考えることができる。装置200は、装置100に関して記載された機能を実装する。
装置200は、例えば、いわゆる「バイノーラルキュー符号化」、いわゆる「パラメトリックステレオ」、またはいわゆる「MPEGサラウンド」によって符号化されたマルチチャンネルオーディオ信号を復号化するのに役立つことができる。当然、装置200は、同様に、空間キューを用いて他のシステムによって符号化されたマルチチャンネルオーディオ信号をアップミックスするために用いることができる。
簡単のため、装置200は、単一チャンネルのダウンミックスオーディオ信号の2チャンネル信号へのアップミックスを実行することが記載されている。しかしながら、ここで記載されたコンセプトは、ダウンミックスオーディオ信号が複数のチャンネルを備えるケースに、また、アップミックスされたオーディオ信号が2以上のチャンネルを備えるケースに容易に拡張することができる。
2.2 図2の実施形態の入力信号および入力タイミング
装置200は、ダウンミックスオーディオ信号210とサイド情報212を受信するように構成される。更に、装置200は、例えば、多重チャンネルを備えるアップミックスされたオーディオ信号214を提供するように構成される。
ダウンミックスオーディオ信号210は、例えば、エンコーダによって(例えば、図7において示されるBCCエンコーダ810によって)生成される和信号であってもよい。ダウンミックスオーディオ信号210は、例えば、複素周波数分解の形で、時間−周波数ドメインにおいて表すことができる。例えば、オーディオ信号の複数の周波数サブバンド(それは、オーバラップするまたはオーバラップしないでもよい)のオーディオコンテンツは、対応する複素数値によって表すことができる。所定の周波数バンドに対して、ダウンミックスオーディオ信号は、引き続く(オーバラップするまたはオーバラップしない)時間インターバルに対して考慮中の周波数サブバンドにおいてオーディオコンテンツを記述する複素数値のシーケンスによって表すことができる。次の時間インターバルに対する引く続く複素数値は、例えばフィルタバンク(例えばQMFフィルタバンク)、高速フーリエ変換等、その他を用いて、装置100において(マルチチャンネルオーディオ信号デコーダの一部であってもよい)、または装置100に接続される補助装置において、取得することができる。しかしながら、ここで記載されたダウンミックスオーディオ信号210の表現は、マルチチャンネルオーディオ信号エンコーダからマルチチャンネルオーディオ信号デコーダまたは装置100へのダウンミックスオーディオ信号の送信に用いられるダウンミックス信号の表現と、通常は同一でない。したがって、ダウンミックスオーディオ信号210は、複素数値のセットまたはベクトルのストリームによって表現することができる。
以下において、ダウンミックスオーディオ信号210の引き続く時間インターバルは、整数値インデックスkで示されると仮定される。また、装置200は、ダウンミックスオーディオ信号210のインターバルk毎およびチャンネル毎の複素数値のワンセットまたはベクトルを受信すると仮定される。このように、1つのサンプル(複素数値のセットまたはベクトル)は、時間インデックスkによって記述されるすべてのオーディオサンプル更新インターバルに対して受信される。
言い換えれば、ダウンミックスオーディオ信号210のオーディオサンプル(「AS」)は、単一のオーディオサンプルASが各オーディオサンプル更新インターバルkと関連付けられるように、装置200によって受信される。
装置200は、更に、アップミックスパラメータを記述するサイド情報212を受信する。例えば、サイド情報212は、1つ以上の次のアップミックスパラメータ:チャンネル間レベル差(ILD)、チャンネル間相関(またはコヒーレンス)(ICC)、チャンネル間時間差(ITD)、チャンネル間位相差(IPD)または全体位相差(OPD)を記述することができる。通常、サイド情報212は、ILDパラメータと、パラメータICC、ITD、IPD、OPDのうちの少なくとも1つを含む。しかしながら、バンド幅を節減するために、サイド情報212は、いくつかの実施形態において、ダウンミックスオーディオ信号210の多重のオーディオサンプル更新インターバルkにつき一度(または、サイド情報の単一セットの送信が複数のオーディオサンプル更新インターバルkにわたって時間的に拡散されてもよい)、装置200に送信されるかまたは装置200によって受信されるのみである。このように、いくつかのケースにおいて、複数のオーディオサンプル更新インターバルkに対してただ1つのサイド情報パラメータのセットがある。しかしながら、他のケースにおいて、各オーディオサンプル更新インターバルkに対して1つのサイド情報パラメータのセットがあってもよい。
サイド情報が更新されるインターバルはインデックスnによって示され、単に簡単のため、以下において、整数値インデックスkによって示されるダウンミックスオーディオ信号210の引き続く時間インターバルはk=nの関係を保つように、サイド情報SI 212が更新される時間インターバルと同一であると仮定される。しかしながら、サイド情報SI 212の更新が、ダウンミックスオーディオ信号210の複数の引き続く時間インターバルkにつき一度だけ実行される場合、補間は、例えば、引き続く入力位相情報値
Figure 0005358691
例えば、サイド情報は、オーディオサンプル更新インターバルk=4、k=8およびk=16において、装置200に送信(装置200によって受信)することができる。逆に、どんなサイド情報212、前記オーディオサンプル更新インターバルの間に、装置200に送信(または装置200によって受信)することができない。このように、エンコーダは、例えば、必要なときにのみ(例えば、サイド情報が予め定められた値よりも多く変化するとデコーダが認識するときに)サイド情報の最新情報を提供することを決定することができるので、サイド情報212の更新インターバルは、時間上で変化させることができる。例えば、オーディオサンプル更新インターバルk=4に対して装置200によって受信されるサイド情報は、オーディオサンプル更新インターバルk=3、4、5と関連付けることができる。同様に、オーディオサンプル更新インターバルk=8に対して装置200によって受信されるサイド情報は、オーディオサンプル更新インターバルk=6、7、8、9、10、その他と関連付けることができる。しかしながら、異なる関連付けは当然に可能であり、サイド情報の更新インターバルは、述べられたよりも当然に大きくてもよくまたは小さくてもよい。
2.3 図2の実施形態の出力信号および出力タイミング
しかしながら、装置200は、アップミックスされたオーディオ信号を、複素周波数成分で提供するのに役立つ。例えば、装置200は、アップミックスされたオーディオ信号がダウンミックスオーディオ信号210と同じオーディオサンプル更新インターバルまたはオーディオ信号更新レートを備えるように、アップミックスされたオーディオ信号214を提供するように構成することができる。言い換えれば、ダウンミックスオーディオ信号210の各サンプル(またはオーディオサンプル更新インターバルk)に対して、いくつかの実施形態において、アップミックスされたオーディオ信号214のサンプルが生成される。
2.4 アップミックス
以下において、たとえデコーダ入力サイド情報212が、いくつかの実施形態において、より大きい更新インターバルでのみ更新することができるとしても、ダウンミックスオーディオ信号210をアップミックスするために用いられるアップミックスパラメータの最新情報を、各オーディオサンプル更新インターバルkに対して、どのように取得することができるかが詳細に記載される。以下において、単一のサブバンドに対する処理が記載されるが、コンセプトは当然に多重のサブバンドに拡張することができる。
装置200は、キーコンポーネントとして、複素線形結合部として動作するように構成されたアップミックス部230を備える。アップミックス部230は、オーディオサンプル更新インターバルkに関連付けられたダウンミックスオーディオ信号210のサンプルx(t)またはx(k)(例えば、特定の周波数バンドを表す)を受信するように構成される。信号x(t)またはx(k)は、時には「ドライ信号」としても示される。加えて、アップミックス部230は、ダウンミックスオーディオ信号の非相関化されたバージョンを表すサンプルq(t)またはq(k)を受信するように構成される。
更に、装置200は、ダウンミックスオーディオ信号のサンプルx(k)を受信し、それに基づいてダウンミックスオーディオ信号(x(k)によって表される)の非相関化バージョンのサンプルq(k)を提供するように構成された非相関化部240(例えば遅延部または反射部)を備える。ダウンミックスオーディオ信号(サンプルx(k))の非相関化バージョン(サンプルq(k))は、「ウェット信号」として示すことができる。
アップミックス部230は、例えば、「ドライ信号」(x(k)で表される)と「ウェット信号」(q(k)で表される)の実数値の(または、いくつかのケースでは複素数値の)線形結合を実行し、第1のアップミックスされたチャンネル信号(サンプルy1(k)で表される)と第2のアップミックスされたチャンネル信号(サンプルy2(k)で表される)を取得するように構成されたマトリクスベクトル乗部232を備える。マトリクスベクトル乗部232は、例えば、次のマトリクスベクトル乗算を実行し、アップミックスされたチャンネル信号のサンプルy1(k)とy2(k)を取得するように構成することができる。
Figure 0005358691
Figure 0005358691
Figure 0005358691
2.5 アップミックスパラメータの更新
Figure 0005358691
プミックスチャンネル位相値α1(k)、α2(k)を、各オーディオサンプル更新インターバルkに対して更新することが望ましい。アップミックスパラメータマトリクスを各オーディオサンプル更新インターバルkに対して更新することは、アップミックスパラメータマトリクスが実際の音響環境に常によく適合するという利益をもたらす。サイド情報212が多重のオーディオサンプル更新インターバルkにつき一度だけ更新される場合であっても、アップミックスパラメータマトリクスの変化が多重のオーディオサンプル更新インターバルにわたって配布されるので、アップミックスパラメータマトリクスをすべてのオーディオサンプル更新インターバルkに対して更新することは、引き続くオーディオサ
Figure 0005358691
ることが望ましい。同様に、少なくとも連続オーディオ信号の間、前記アップミックスチャンネル位相値の階段状の変化を回避するために、アップミックスチャンネル位相値α1(k)とα2(k)を十分にしばしば更新することが望ましい。また、サイド情報SI、212の定量化によって生じ得るアーチファクトを低減または回避するために、アップミックスチャンネル位相値を時間的に平滑化することが望ましい。
装置200は、サイド情報212に基づいて、時間的に可変のアップミックスパラメー
Figure 0005358691
ル位相値α1(k)、α2(k)を提供するように構成されるサイド情報処理ユニット250を備える。サイド情報処理ユニット250は、例えば、サイド情報212が多重のオーディオサンプル更新インターバルkにつき一度だけ更新される場合であっても、すべてのオーディオサンプル更新インターバルkに対してアップミックスパラメータの更新されたセットを提供するように構成される。しかしながら、いくつかの実施形態において、サイド情報処理250は、時間的に可変の平滑化アップミックスパラメータの更新されたセットを、より少ない頻度で、例えばサイド情報SI、212の更新について一度のみ提供するように構成することができる。
サイド情報処理ユニット250は、サイド情報212を受信し、それに基づいて、アップミックスパラメータ入力情報(例えば、入力振幅情報254と入力位相情報256を含む)と考えることができる1つ以上のアップミックスパラメータを、(例えばアップミックスパラメータの振幅値のシーケンス254とアップミックスパラメータの位相値のシーケンス256の形で)導き出すように構成されるアップミックスパラメータ入力情報決定部252を備える。例えば、アップミックスパラメータ入力情報決定部252は、複数のキュー(例えば、ILD、ICC、ITD、IPD、OPD)を結合し、アップミックスパラメータ入力情報254、256を取得するか、または1つ以上のキューを個別に評価することができる。アップミックスパラメータ入力情報決定部252は、入力振幅値のシーケンス254(入力振幅情報としても示される)と、分離した入力位相値のシーケンス256(入力位相情報としても示される)の形で、アップミックスパラメータを記述するように構成される。入力位相値のシーケンス256の要素は、入力位相情報αnと考えることができる。シーケンス254の入力振幅値は、例えば、複素数の絶対値を表すことができ、シーケンス256の入力位相値は、例えば、複素数の角度値(または位相値)(例えば、実部-虚部直交座標系における実部軸に対して測定される)を表すことができる。
このように、アップミックスパラメータ入力情報決定部252は、アップミックスパラメータの入力振幅値のシーケンス254とアップミックスパラメータの入力位相値のシーケンス256を提供することができる。アップミックスパラメータ入力情報決定部252は、サイド情報の1つのセットからアップミックスパラメータの完全なセット(例えばマ
Figure 0005358691
すように構成することができる。サイド情報212のセットと入力アップミックスパラメータ254、256のセットの間に関連があってもよい。したがって、アップミックスパラメータ入力情報決定部252は、アップミックスパラメータの更新インターバルにつき一度、すなわちサイド情報のセットの更新につき一度、シーケンス254、256の入力アップミックスパラメータを更新するように構成することができる。
サイド情報処理ユニットは、更に、以下において詳細に記載されるパラメータ平滑化部260(時には、簡単に「パラメータ決定部」で示される)を備える。パラメータ平滑化部260は、アップミックスパラメータ(またはマトリクス要素)の(実数値の)入力振幅値のシーケンス254と、入力位相情報αnと考えることができるアップミックスパラメータ(またはマトリクス要素)の(実数値の)入力位相値のシーケンス256を受信するように構成される。更に、パラメータ平滑化部は、シーケンス254とシーケンス256の平滑化に基づいて、時間的に可変の平滑化されたアップミックスパラメータ262のシーケンスを提供するように構成される。
パラメータ平滑化部260は、振幅値平滑化部270と位相値平滑化部272を備える。
振幅値平滑化部は、シーケンス254を受信し、それに基づいてアップミックスパラメ
Figure 0005358691
74を提供するように構成される。振幅値平滑化部270は、例えば、以下において詳述される振幅値平滑化を実行するように構成することができる。
同様に、位相値平滑化部272は、シーケンス256を受信し、それに基づいてアップミックスパラメータの(またはマトリクス値の)時間的に可変の平滑化された位相値のシーケンス276を提供するように構成することができる。位相値平滑化部272は、例えば、以下において詳細に記載される平滑化アルゴリズムを実行するように構成することができる。
いくつかの実施形態では、振幅値平滑化部270と位相値平滑化部は、振幅値平滑化と位相値平滑化を別々にまたは独立して実行するように構成される。このように、シーケンス254の振幅値は、位相値平滑化に影響を及ぼさず、シーケンス256の位相値は、振幅値平滑化に影響を及ぼさない。しかしながら、振幅値平滑部270と位相値平滑化部272は、シーケンス274、276がアップミックスパラメータの平滑化された振幅値と平滑化された位相値の対応するペアーを含むように同期した方法で動作するものと仮定される。
通常、パラメータ平滑化部260は、異なるアップミックスパラメータまたはマトリクス要素に関して別々に作用する。このように、パラメータ平滑化部260は、各アップミ
Figure 0005358691
トリクス要素に対して、振幅値の1つのシーケンス254を受信することができる。同様に、パラメータ平滑化部260は、各アップミックスされたオーディオチャンネルの位相調節に対して、入力位相値αnの1つのシーケンス256を受信することができる。
2.6 パラメータ平滑化に関する詳細
以下において、IPD/OPDの定量化および/またはデコーダにおけるOPDの評価によって生じる位相処理アーチファクトを低減する本発明の実施形態に関する詳細が記載される。簡単のため、以下の記載は、同じ技術を適用することができるmからnチャンネルへのアップミックスの一般的なケースに限定することなく、単に1から2チャンネルへのアップミックスに限定する。
デコーダの、例えば1から2チャンネルへのアップミックス手順は、ドライ信号と呼ばれるダウンミックス信号x(x(k)でも示される)とウェット信号と呼ばれるダウンミックス信号の非相関化バージョンq(q(k)でも示される)とから構成されるベクトル
Figure 0005358691
qは、非相関化フィルタ240を通してダウンミックス信号xを供給することによって生成される。アップミックス信号yは、出力の第1と第2のチャンネル(例えばy1(k)とy2(k))を包含するベクトルである。全信号x、q、yは、複素周波数分解(例えば、時間−周波数ドメイン表現)において利用することができる。
このマトリクス演算は、すべての周波数バンドの全サブバンドサンプルに対して(または少なくともいくつかの周波数バンドのいくつかのサブバンドサンプルに対して)(例えば、別々に)実行される。例えば、マトリクス演算は、以下の式に従って実行することができる。
Figure 0005358691
Figure 0005358691
てドライ信号とウェット信号の混合を実行し、両方の出力チャンネルの出力レベルをILDによって定まるように調節する実数値のマトリクス要素に結果としてなる空間キュー、通常はILDとICCから導き出される。
空間キュー(例えば、ILD、ICC、ITD、IPDおよび/またはOPD)の送信に対して、エンコーダにおけるいくつかのまたは全てのタイプのパラメータを量子化することが望ましい(またはさらに必要である)。特に低ビットレートシナリオに対して、送信データの量を低減するために、むしろ粗い定量化を用いることがしばしば望ましい(またはさらに必要である)。しかしながら、特定のタイプの信号に対して、粗い定量化は聞き取れるアーチファクトに結果としてなる可能性がある。これらのアーチファクトを低減するために、アーチファクトの原因となる隣接する量子化ステップの間の遷移を平滑化す
Figure 0005358691
平滑化は、例えば、次のようなマトリクス要素の単純なローパスフィルタリングによって実行される。
Figure 0005358691
Figure 0005358691
平滑化は、空間パラメータが急速に変化する信号部分上で負の効果を有するかもしれないので、エンコーダから送信される付加的なサイド情報によって、平滑化を制御するようにしてもよい。
以下において、位相値の適用と決定が更に詳細に記載される。IPDおよび/またはOPDが用いられる場合、付加的な位相シフトを、出力信号(例えば、サンプルy1(k)およびy2(k)によって定義される信号)に適用してもよい。IPDは、2つのチャン
Figure 0005358691
プミックスチャンネル信号)の間の位相差を記述するのに対して、OPDは1つのチャンネルとダウンミックスの間の位相差を記述する。
以下において、IPDとOPDの定義が、ダウンミックス信号と複数のチャンネル信号の間の位相関係の概略表現を示す図3を参照して簡単に説明される。ここで図3を参照して、ダウンミックス信号(またはそのスペクトル係数x(k))の位相は、第1のポインタ310で表される。位相調節された第1のアップミックスされたチャンネル信号(また
Figure 0005358691
スペクトル係数)と位相調節された第2のアップミックスされたチャンネル信号(またはそのスペクトル係数)の間の位相差は、OPD2で示される。位相調節された第1のアップミックスされたチャンネル信号(またはそのスペクトル係数)と位相調節された第2のアップミックスされたチャンネル信号(またはそのスペクトル係数)の間の位相差は、IPDで示される。
原信号の位相属性を復元するために(例えば、位相調節された第1のアップミックスされたチャンネル信号と位相調節された第2のアップミックスされたチャンネル信号をドライ信号に基づいて適当な位相で提供するために)、両方のチャンネルに対するOPDは知られていなければならない。しばしば、IPDは、1つのOPDとともに送信される(第2のOPDは、次にこれらから算出することができる)。送信データ量を低減するために、IPDのみを送信し、デコーダにおいて、ダウンミックス信号に含まれる位相情報を、送信されたILDおよびIPDとともに用いてOPDを推定することも可能である。この処理は、例えば、アップミックスパラメータ入力情報決定部252によって実行することができる。
デコーダにおける(例えば、装置200における)位相復元は、出力サブバンド信号(例えば、スペクトル係数y1(k)、y2(k)によって記載される信号)の複素回転によって、以下の式に従って実行される。
Figure 0005358691
上記の式において、角度α1とα2は、2つのチャンネルに対するOPD(または、例えば平滑化されたOPD)に等しい。
上述のように、パラメータ(例えばILDパラメータおよび/またはICCパラメータ)の粗い定量化は、聞き取れるアーチファクトに結果としてなる可能性があり、それはIPDとOPDの定量化に対してもあてはまる。上記の平滑化演算は、アップミックスマト
Figure 0005358691
トを低減するだけであるが、一方で位相パラメータの定量化によって生じるそれらは影響されない。
さらにまた、各出力チャンネルに適用される上記時間的に変化する位相回転によって付加的なアーチファクトが導入される可能性がある。位相シフト角α1とα2が時間上で急速に変動する場合、適用される回転角が、短いドロップアウトまたは瞬間的な信号周波数の変化を生じさせるかもしれないことが分かっている。
これらの課題の両方とも、上記の平滑化アプローチの修正バージョンを角度α1とα2に適用することによって、有意に低減することができる。このケースのように、平滑化フィルタは、2πごとの回りを覆う角度に適用されるので、いわゆるアンラッピングによっ
Figure 0005358691
Figure 0005358691
Figure 0005358691
Figure 0005358691
Figure 0005358691
、2つの角度領域のうちの第1の角度領域は、ポインタ410、450をポインタ412、452に向かって数学的に正方向(逆時計回り)に回転させることによってカバーされ、第2の角度領域は、ポインタ412、452をポインタ410、450に向かって数学的に正方向(逆時計回り)に回転させることによってカバーされる。
Figure 0005358691
Figure 0005358691
演算ルール(それは線形結合ルールであってもよい)を選択するように構成することができる。
2.7 平滑化コンセプトのオプションの拡張
以下において、上述された位相値平滑化コンセプトのいくつかのオプションの拡張が述べられる。他のパラメータ(例えば、ILD、ICC、ITD)に関しては、例えば、原信号(例えばエンコーダによって処理された信号)のIPDが急速に変化する場合、回転角の速い変更が必要な信号があってもよい。このような信号に対して、位相値平滑部272によって実行される平滑化は、(いくつかのケースにおいて)出力品質に関して負の効果を有し、このようなケースにおいて適用されるべきでない。すべての信号処理バンドに対してエンコーダから平滑化を制御するために必要とされる起こりうるビットレートオーバーヘッドを回避するために、適応平滑化制御(例えば、平滑化制御部を用いて実施される)を、デコーダにおいて(例えば装置200において)用いることができ、結果として生じるIPD(すなわち、2つの平滑化された角度、例えば角度α1(k)とα2(k)の差が演算され、送信されたIPD(例えば入力位相情報αnによって記述されるチャンネル間位相差)と比較される。差が特定の閾値より大きい場合に、平滑化は無効とすることができ、(例えば位相調節233によって、)未処理の角度(例えば入力位相情報によって記述され、アップミックスパラメータ入力情報決定部によって提供される角度αn)を用いることができ、そうでない場合は、(例えば位相調節233によって)、ローパスフィルタ処理された角度(例えば、位相値平滑化部272によって提供される平滑化された位相値n)を出力信号に適用することができる。
(オプションの)高度化バージョンにおいて、位相値平滑化部272で適用されるアルゴリズムは、処理されたIPDと未処理のIPDの間の現在の差に基づいて修正される可変のフィルタ時定数を用いて拡張することができる。例えば、(フィルタ時定数を決定す
Figure 0005358691
いくつかの実施形態では、付加的に単一のビットを、(オプションとして)(ダウンミックスオーディオ信号210とサイド情報212を表す)ビットストリームにおいて送信し、適応平滑化制御が最適結果を与えない一定のクリチカル信号のケースにおいて、エンコーダから全てのバンドに対する平滑化を完全に有効にするまたは無効にすることができる。
3.結 論
上記を要約すると、パラメトリックマルチチャンネルオーディオ符号化に対する適応位相処理の全般的なコンセプトが記載された。本発明による実施形態は、位相パラメータの粗い定量化または速い変化によって生じる出力信号のアーチファクトを低減することによって、他の技術に取って代わる。
4. 方 法
本発明に係る実施形態は、1つ以上のダウンミックスオーディオチャンネルを記述するダウンミックスオーディオ信号を、複数のアップミックスされたオーディオチャンネルを記述するアップミックスされたオーディオ信号にアップミックスする方法を含む。図6は、このような方法のフローチャートを示し、全体として700で示される。
方法700は、前の平滑化された位相値のスケーリングされたバージョンを、位相変化限定アルゴリズムを用いて、現在の位相入力情報のスケーリングされたバージョンと結合し、前の平滑化された位相値と入力位相情報に基づいて現在の平滑化された位相値を決定するステップ710を備える。
方法700は、また、アップミックスされたオーディオ信号を取得するために、時間的に平滑化された位相値を含む時間的に可変のアップミックスパラメータを、ダウンミックスオーディオ信号をアップミックスするために適用するステップ720を備える。
当然、方法700は、本発明の装置に関して本願明細書に記載されたいずれかの特徴および機能によって補足することができる。
5.実施変形例
装置の局面においていくつかの態様が記載されているが、これらの態様は、また対応する方法の記載を表すことは明らかであり、1つのブロックまたはデバイスが方法のステップまたは方法のステップの特徴に対応する。同様に、方法のステップの局面において記載される態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の記載を表す。いくつかのまたは全ての方法のステップは、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路のようなハードウェア装置によって(または、用いて)実行することができる。いくつかの実施形態において、1つ以上の最も重要な方法のステップは、このような装置によって実行することができる。
特定の実施要求に依存して、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施は、その上に格納される電気的に読取可能な制御信号を有し、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを用いて実行することができる。それ故に、デジタル記憶媒体は、コンピュータ読取可能であってもよい。
本発明に係るいくつかの実施形態は、本願明細書に記載された方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電気的に読取可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、コンピュータプログラム製品がコンピュータ上で動作するとき、当該方法の1つを実行するように動作するプログラムコードを有するコンピュータプログラム製品として実施することができる。プログラムコードは、例えば機械読取可能なキャリアに記憶されたものでもよい。
他の実施形態は、機械読取可能なキャリアに格納された、本願明細書に記載された方法の1つを実行するためのコンピュータプログラムを含む。
言い換えれば、本発明の方法の実施形態は、それ故に、コンピュータプログラムがコンピュータ上で動作するときに、本願明細書に記載された方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の方法の更なる実施形態は、それ故に、その上に記録された本願明細書に記載された方法の1つを実行するためのコンピュータプログラムを含むデータキャリア(またはデジタル記憶媒体、またはコンピュータ読取可能媒体)である。
本発明の方法の更なる実施形態は、それ故に、本願明細書に記載された方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
更なる実施形態は、本願明細書に記載された方法の1つを実行するように構成されまたは適合された処理手段、例えばコンピュータ、またはプログラマブルロジックデバイスを含む。
更なる実施形態は、その上に本願明細書に記載された方法の1つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
いくつかの実施形態において、プログラマブルロジックデバイス(例えばフィールドプログラマブルゲートアレイ)を、本願明細書に記載された方法のいくつかまたは全ての機能を実行するために用いることができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイを、本願明細書に記載された方法の1つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、好ましくはいかなるハードウェア装置によっても実行される。
上記した実施形態は、単に本発明の原理を図示したものである。本願明細書に記載された構成と細部の修正と変形は、当業者にとって明らかであると理解される。それ故に、本発明は、単に後述の特許クレームのスコープによって限定され、本願明細書の実施形態の記述と説明によって示される特定の詳細によって限定されないことを意図する。

Claims (13)

  1. Figure 0005358691
  2. Figure 0005358691
  3. Figure 0005358691
  4. Figure 0005358691
  5. Figure 0005358691
  6. Figure 0005358691
  7. 前記平滑化制御部は、前記平滑化された位相量として、2つの平滑化された位相値差を評価し、前記対応する入力位相量として、前記2つの平滑化された位相値対応する2つの入力位相値(256)の差を評価するように構成された、請求項6に記載の装置(100、200)。
  8. Figure 0005358691
  9. Figure 0005358691
  10. Figure 0005358691
  11. 前記アップミックスする装置は、オーディオビットストリームから引き出された情報に依存して、位相値平滑化機能を選択的に有効および無効にするように構成された、請求項1〜10のいずれかに記載の装置(100、200)。
  12. 1つ以上のダウンミックスオーディオチャンネルを記述するダウンミックスオーディオ信号を、複数のアップミックスされたオーディオチャンネルを記述するアップミックスされたオーディオ信号にアップミックスする方法であって、
    前の平滑化された位相値のスケーリングされたバージョンを、位相変化限定アルゴリズムを用いて、現在の入力位相情報のスケーリングされたバージョンと結合し、前記前の平滑化された位相値と前記入力位相情報に基づいて現在の時間的に平滑化された位相値を決定するステップ(710)と、
    アップミックスされたオーディオ信号を取得するために、時間的に平滑化された位相値を含む時間的に可変のアップミックスパラメータを、ダウンミックスオーディオ信号をアップミックスするために適用するステップ(720)と、
    を備えた、方法(700)。
  13. コンピュータプログラムがコンピュータ上で動作するときに、前記コンピュータに請求項12に記載された方法を実行させるためのコンピュータプログラム。
JP2011541522A 2009-04-08 2010-04-01 位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム Active JP5358691B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16760709P 2009-04-08 2009-04-08
US61/167,607 2009-04-08
PCT/EP2010/054448 WO2010115850A1 (en) 2009-04-08 2010-04-01 Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing

Publications (2)

Publication Number Publication Date
JP2012512438A JP2012512438A (ja) 2012-05-31
JP5358691B2 true JP5358691B2 (ja) 2013-12-04

Family

ID=42335156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011541522A Active JP5358691B2 (ja) 2009-04-08 2010-04-01 位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム

Country Status (20)

Country Link
US (6) US9053700B2 (ja)
EP (2) EP2405425B1 (ja)
JP (1) JP5358691B2 (ja)
KR (1) KR101356972B1 (ja)
CN (2) CN102257563B (ja)
AR (1) AR076238A1 (ja)
AU (1) AU2010233863B2 (ja)
BR (1) BRPI1004215B1 (ja)
CA (1) CA2746524C (ja)
CO (1) CO6501150A2 (ja)
ES (2) ES2452569T3 (ja)
HK (2) HK1163915A1 (ja)
MX (1) MX2011006248A (ja)
MY (1) MY160545A (ja)
PL (2) PL2405425T3 (ja)
RU (1) RU2550525C2 (ja)
SG (1) SG174117A1 (ja)
TW (1) TWI420512B (ja)
WO (1) WO2010115850A1 (ja)
ZA (1) ZA201103703B (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011039668A1 (en) * 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
US9424852B2 (en) 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
EP2834814B1 (en) 2012-04-05 2016-03-02 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
RU2625945C2 (ru) 2013-01-29 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
SG11201600466PA (en) * 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
CN105531761B (zh) * 2013-09-12 2019-04-30 杜比国际公司 音频解码系统和音频编码系统
CN105531928B (zh) 2013-09-12 2018-10-26 杜比实验室特许公司 音频编解码器的系统方面
EP2854133A1 (en) 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
KR102244379B1 (ko) 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
KR102486338B1 (ko) 2014-10-31 2023-01-10 돌비 인터네셔널 에이비 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩
WO2016168408A1 (en) 2015-04-17 2016-10-20 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
KR102372931B1 (ko) 2015-06-26 2022-03-11 칸도우 랩스 에스에이 고속 통신 시스템
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
AU2017357453B2 (en) * 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
CN110419079B (zh) 2016-11-08 2023-06-27 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
US10366695B2 (en) 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
KR102452390B1 (ko) 2017-12-28 2022-10-06 칸도우 랩스 에스에이 동기식으로 스위칭된 다중 입력 복조 비교기
US11523238B2 (en) * 2018-04-04 2022-12-06 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
CN108770120B (zh) * 2018-05-25 2021-03-23 上海乘讯信息科技有限公司 一种智能通道状态灯
EP3671741A1 (en) 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
EP3726730B1 (en) * 2019-04-17 2021-08-25 Goodix Technology (HK) Company Limited Peak current limiter
CN110491366B (zh) * 2019-07-02 2021-11-09 招联消费金融有限公司 音频平滑处理方法、装置、计算机设备和存储介质
TWI805019B (zh) * 2020-10-09 2023-06-11 弗勞恩霍夫爾協會 使用參數平滑處理編碼音頻場景的裝置、方法或電腦程式
MX2023003962A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una conversion de parametros.
US11533576B2 (en) * 2021-03-29 2022-12-20 Cae Inc. Method and system for limiting spatial interference fluctuations between audio signals

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6737572B1 (en) * 1999-05-20 2004-05-18 Alto Research, Llc Voice controlled electronic musical instrument
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
ES2261637T3 (es) 2001-04-09 2006-11-16 Koninklijke Philips Electronics N.V. Sistema de codificacion del habla adpcm, con filtros de difuminado de fase y difuminado de fase inverso.
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
WO2007091845A1 (en) 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101379555B (zh) * 2006-02-07 2013-03-13 Lg电子株式会社 用于编码/解码信号的装置和方法
RU2343563C1 (ru) * 2007-05-21 2009-01-10 Федеральное государственное унитарное предприятие "ПЕНЗЕНСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ ИНСТИТУТ" (ФГУП "ПНИЭИ") Способ передачи и приема закодированной речи
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
EP2169665B1 (en) 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal

Also Published As

Publication number Publication date
US10580418B2 (en) 2020-03-03
JP2012512438A (ja) 2012-05-31
CA2746524A1 (en) 2010-10-14
CN103325374B (zh) 2017-06-06
CN102257563B (zh) 2013-09-25
HK1163915A1 (en) 2012-09-14
PL2394268T3 (pl) 2014-06-30
SG174117A1 (en) 2011-10-28
RU2550525C2 (ru) 2015-05-10
RU2011123124A (ru) 2012-12-20
US20200168233A1 (en) 2020-05-28
US20220358939A1 (en) 2022-11-10
EP2394268B1 (en) 2014-01-08
ZA201103703B (en) 2012-02-29
CA2746524C (en) 2015-03-03
HK1166174A1 (en) 2012-10-19
US20180358026A1 (en) 2018-12-13
US20110255714A1 (en) 2011-10-20
TWI420512B (zh) 2013-12-21
US10056087B2 (en) 2018-08-21
AU2010233863A1 (en) 2010-10-14
MY160545A (en) 2017-03-15
KR20110095339A (ko) 2011-08-24
US9053700B2 (en) 2015-06-09
EP2394268A1 (en) 2011-12-14
AR076238A1 (es) 2011-05-26
PL2405425T3 (pl) 2014-12-31
CN102257563A (zh) 2011-11-23
BRPI1004215A2 (pt) 2016-12-06
US20170301356A1 (en) 2017-10-19
KR101356972B1 (ko) 2014-02-05
US20150131801A1 (en) 2015-05-14
ES2511390T3 (es) 2014-10-22
US9734832B2 (en) 2017-08-15
MX2011006248A (es) 2011-07-20
BRPI1004215B1 (pt) 2021-08-17
ES2452569T3 (es) 2014-04-02
CO6501150A2 (es) 2012-08-15
US11430453B2 (en) 2022-08-30
EP2405425B1 (en) 2014-07-23
TW201118860A (en) 2011-06-01
CN103325374A (zh) 2013-09-25
AU2010233863B2 (en) 2013-09-26
WO2010115850A1 (en) 2010-10-14
EP2405425A1 (en) 2012-01-11

Similar Documents

Publication Publication Date Title
JP5358691B2 (ja) 位相値平滑化を用いてダウンミックスオーディオ信号をアップミックスする装置、方法、およびコンピュータプログラム
JP6196249B2 (ja) 複数のチャネルを有するオーディオ信号を符号化する装置と方法
KR101290486B1 (ko) 다운믹스 오디오 신호를 업믹싱하는 장치, 방법 및 컴퓨터 프로그램
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
JP6133422B2 (ja) マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
JP2012516596A (ja) ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
JP2016525716A (ja) 適応位相アライメントを用いたマルチチャネルダウンミックスにおけるコムフィルタアーチファクトの抑制

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110616

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130205

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130902

R150 Certificate of patent or registration of utility model

Ref document number: 5358691

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250