JP4834153B2 - 非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ - Google Patents

非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ Download PDF

Info

Publication number
JP4834153B2
JP4834153B2 JP2009512420A JP2009512420A JP4834153B2 JP 4834153 B2 JP4834153 B2 JP 4834153B2 JP 2009512420 A JP2009512420 A JP 2009512420A JP 2009512420 A JP2009512420 A JP 2009512420A JP 4834153 B2 JP4834153 B2 JP 4834153B2
Authority
JP
Japan
Prior art keywords
channel
filter
binaural
upmix
gain factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009512420A
Other languages
English (en)
Other versions
JP2009539283A (ja
Inventor
ラルス ヴィレモエス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2009539283A publication Critical patent/JP2009539283A/ja
Application granted granted Critical
Publication of JP4834153B2 publication Critical patent/JP4834153B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、HRTFフィルタリングによって、利用できるダウンミックスされた信号およびさらなる制御データに基づくマルチチャンネル音声信号のバイノーラル復号化に関する。
音声符号化における最近の進展は、ステレオ(またはモノラル)信号および対応する制御データに基づいて音声信号のマルチチャンネル表現を再現することが可能である方法を実施している。これらの方法は、さらなる制御データが、送信されたモノラルまたはステレオ・チャンネルに基づくサラウンド・チャンネルの、アップミックスとも呼ばれる、再現を制御するために送信されるので、ドルビー社プロロジック(Prologic(登録商標))のような古くからあるマトリクスに基づく解決策とは実質的に異なる。
したがって、そのようなパラメトリック・マルチチャンネル・オーディオ・デコーダ、例えばMPEGサラウンド(MPEG Surround(登録商標))は、M個の送信されたチャンネルおよびさらなる制御データに基づいてN個のチャンネルを再構成し、そこにおいてN>Mである。このさらなる制御データは、N個のチャンネルの全ての送信のために要求されるものより著しく低いデータレートを表し、符号化を非常に効率的にすると同時に、Mチャンネル装置およびNチャンネル装置の両方の互換性を確実にする[J.Breebaartらの「MPEG空間音声符号化/MPEGサラウンド:概要および現状(MPEG spatial audio coding / MPEG Surround(登録商標):overview and current status)」、第119回AESコンベンションのプロシーディング、米国、ニューヨーク、2005年10月、プレプリント6447]。
これらのパラメトリック・サラウンド符号化方法は、通常、チャンネル・レベル差(CLD)およびチャンネル間コヒーレンス/相互相関(ICC)に基づくサラウンド信号のパラメータ化を含む。これらのパラメータは、アップミックス・プロセスにおけるチャンネル対間のパワー比および相関関係を表す。さらに、チャンネル予測係数(CPC)が、アップミックス手順中に、中間または出力チャンネルを予測するために、先行技術でも用いられる。
音声符号化における他の進展は、ステレオ・ヘッドホンを超えるマルチチャンネル信号印象を得る手段を提供している。これは、元のマルチチャンネル信号およびHRTF(頭部伝達関数)フィルタを用いて、マルチチャンネル信号をステレオにダウンミックスすることによって一般に行われる。
あるいは、左のバイノーラル・チャンネルおよび右のバイノーラル・チャンネルを有するバイノーラル信号の生成をショートカットすることは、もちろん、コンピュータの効率のためおよび音質のために役立つ。
しかしながら、問題は、元のHRTFフィルタをどのように組み合わせることができるかということである。さらに、問題は、エネルギー損失の影響を受けるアップミキシング・ルールのコンテクストにおいて起こり、すなわち、マルチチャンネル・デコーダ入力信号が、例えば、第1のダウンミックス・チャンネルおよび第2のダウンミックス・チャンネルを有るダウンミックス信号を含み、さらに、非エネルギー節約型のやり方でアップミックスするために用いられる空間パラメータを有する場合に起こる。そのようなパラメータは、予測パラメータまたはCPCパラメータとして公知でもある。これらのパラメータは、チャンネル・レベル差パラメータとは対照的に、それらが2つのチャンネル間にエネルギー分布を反映するために計算されないが、エネルギー・エラー(例えば損失)を自動的にもたらすできる限り最良な波形整合を実行するために計算されるという特性を有し、これは、予測パラメータが生成される場合に、アップミックスのエネルギー節約型特性を配慮しないが、元の信号と比較して再構成された信号のできる限り良好な時間またはサブバンド・ドメイン波形整合を有することを配慮するからである。
そのような送信された空間予測パラメータに基づいてHRTFフィルタを単に線形に組み合わせる場合、チャンネルの予測が十分に機能しない場合に特に重大なアーチファクトを受信する。その状況において、わずかな線形依存性でさえ、バイノーラル出力の望まれていないスペクトル有色化につながる。このアーチファクトは、対で無相関でありかつ同等の大きさを有する信号を元のチャンネルが伝送する場合に、最も高い頻度で発生することが見出された。
J.Breebaartらの「MPEG空間音声符号化/MPEGサラウンド:概要および現状(MPEG spatial audio coding / MPEG Surround(登録商標):overview and current status)」、第119回AESコンベンションのプロシーディング、米国、ニューヨーク、2005年10月、プレプリント6447
本発明の目的は、例えば、マルチチャンネル信号のヘッドホン再生に用いることができるバイノーラル信号を得るためにマルチチャンネル復号化のための効率的で質的に受け入れることができる概念を提供することである。
本発明の第1の態様によれば、この目的は、ダウンミックス信号をアップミックス・ルールでアップミックスするために用いることができるアップミックス・ルール情報を含むパラメータを用いて元のマルチチャンネル信号から導出されるダウンミックス信号からバイノーラル信号を生成するためのマルチチャンネル・デコーダであって、アップミックス・ルールはエネルギー・エラーをもたらし、マルチチャンネル・デコーダは、アップミックス・ルール情報およびアップミックス・チャンネルに対応する頭部伝達関数に基づくフィルタのフィルタ特性に基づいて、エネルギー・エラーを低減しまたは除去するための少なくとも1つの利得係数を計算するための利得係数計算機と、エネルギー補正されたバイノーラル信号を得るために少なくとも1つの利得係数、フィルタ特性およびアップミックス・ルール情報を用いてダウンミックス信号をフィルタにかけるためのフィルタ・プロセッサとを含む、マルチチャンネル・デコーダによって達成される。
本発明の第2の態様によれば、この目的は、ダウンミックス信号をアップミックス・ルールでアップミックスするために用いることができるアップミックス・ルール情報を含むパラメータを用いて元のマルチチャンネル信号から導出されるダウンミックス信号からバイノーラル信号を生成するためのマルチチャンネル復号化の方法であって、アップミックス・ルールはエネルギー・エラーをもたらし、マルチチャンネル復号化の方法は、アップミックス・ルール情報およびアップミックス・チャンネルに対応する頭部伝達関数に基づくフィルタのフィルタ特性に基づいて、エネルギー・エラーを低減しまたは除去するための少なくとも1つの利得係数を計算するステップと、エネルギー補正されたバイノーラル信号を得るために少なくとも1つの利得係数、フィルタ特性およびアップミックス・ルール情報を用いてダウンミックス信号をフィルタにかけるステップとを含む、マルチチャンネル号化の方法によって達成される。
本発明のさらなる態様は、コンピュータ上で実行されるときに、そのマルチチャンネル復号化の方法を実施する、コンピュータで読み取り可能なコードを有するコンピュータプログラムに関する。
本発明は、マルチチャンネル信号を完全にレンダリングしかつその後に膨大な数のHRTFフィルタを適用しなくてもバイノーラル信号を得るためにダウンミックス信号をフィルタにかけるためのエネルギー・エラーをもたらすアップミックスに関するアップミックス・ルール情報を有利に用いることもできるという知見に基づいている。それどころか、本発明によれば、エネルギー・エラーの影響を受けるアップミックス・ルールに関するアップミックス・ルール情報は、ダウンミックス信号のバイノーラル・レンダリングをショートカットするために有利に用いることができ、そのとき、本発明によれば、利得係数は、ダウンミックス信号をフィルタにかける場合に計算されさらに用いられ、この利得係数は、エネルギー・エラーが低減されまたは完全に除去されるように計算される。
特に、この利得係数は、予測パラメータのようなアップミックス・ルールに関する情報に依存するだけでなく、重要なことに、アップミックス・ルールが与えられる、アップミックス・チャンネルに対応する頭部伝達関数に基づくフィルタにも依存する。特に、これらのアップミックス・チャンネルは、本発明の好適な実施形態において決して存在せず、それは、バイノーラル・チャンネルが、例えば、3つの中間チャンネルを第一にレンダリングしないで計算されるからである。しかしながら、アップミックス・チャンネル自体が好適な実施形態において決して存在しないにもかかわらず、アップミックス・チャンネルに対応するHRTFに基づくフィルタを導出しまたは提供することができる。利得係数を生成する場合に、HRTFに基づくフィルタも利得係数の計算に影響するように、そのようなエネルギー損失の影響を受けるアップミックス・ルールによって導入されるエネルギー・エラーが、エンコーダからデコーダに送信されるアップミックス・ルール情報に対応するだけでなく、HRTFに基づくフィルタにも依存することが見出された。
それからみて、本発明は、予測パラメータのようなアップミックス・ルール情報とアップミックス・ルールを用いるアップミキシングの結果であるチャンネルのためのHRTFに基づくフィルタの特定の見掛けとの間の相互依存を説明する。
このように、本発明は、パラメトリック・マルチチャンネル音声のバイノーラル復号化と組み合わせて予測アップミックスの使用から起こるスペクトル有色化の問題の解決策を提供する。
本発明の好適な実施形態は、以下の特徴を含む:M個の復号化された信号およびN>MのN個のチャンネルの作成に関する空間パラメータからバイノーラル音声信号を生成するためのオーディオ・デコーダであって、そのデコーダは、多数のサブバンドにおいて、P対のバイノーラル・サブバンド・フィルタおよびP個の中間チャンネルの作成に関する空間パラメータのサブセットから2つの補償利得を推定するための利得計算機と、多数のサブバンドにおいて、P対のバイノーラル・サブバンド・フィルタの線形結合によって得られるM対のバイノーラル・サブバンド・フィルタを修正するための利得調整器とを含み、その修正は、利得計算機によって計算される2つの利得を有するM対のそれぞれの乗算からなる。
本発明は、添付図面を参照して、図示の例によって説明されるが、本発明の範囲または精神は限定されない。
図1は、HRTF関連フィルタを用いるパラメトリック・マルチチャンネル信号のバイノーラル合成を図示する。 図2は、組み合わせられたフィルタリングを用いるパラメトリック・マルチチャンネル信号のバイノーラル合成を図示する。 図3は、本発明のパラメータ/フィルタ・コンバイナのコンポーネントを図示する。 図4は、MPEGサラウンド空間復号化の構成を図示する。 図5は、本発明の利得補償なしで復号化されたバイノーラル信号のスペクトルを図示する。 図6は、バイノーラル信号の本発明の復号化のスペクトルを図示する。 図7は、HRTFを用いる従来のバイノーラル合成を図示する。 図8は、MPEGサラウンド・エンコーダを図示する。 図9は、MPEGサラウンド・デコーダおよびバイノーラル・シンセサイザのカスケードを図示する。 図10は、特定の構成のための概念的な3Dバイノーラル・デコーダを図示する。 図11は、特定の構成のための空間エンコーダを図示する。 図12は、空間(MPEGサラウンド)デコーダを図示する。 図13は、利得係数補正なしでバイノーラル信号を得るために4つのフィルタを用いる2つのダウンミックス・チャンネルのフィルタリングを図示する。 図14は、5チャンネル・セットアップにおいて異なるHRTFフィルタ1−10を説明するための空間セットアップを図示する。 図15は、L、LsおよびR、Rsのチャンネルが組み合わされた場合の図14の状況を図示する。 図16aは、HRTFフィルタの最大組合せが実行され、さらに、図13の4つのフィルタだけが残る場合の図14または図15からのセットアップを図示する。 図16bは、非エネルギー節約型アップミックスをもたらすアップミックス係数を有する図20のエンコーダによって決定されるようなアップミックス・ルールを図示する。 図17は、HRTFフィルタが4つのHRTFに基づくフィルタを最終的に得るためにどのように組み合されるかについて図示する。 図18は、本発明のマルチチャンネル・デコーダの好適な実施形態を図示する。 図19aは、利得補正なしでHRTFに基づくフィルタリングの後にスケーリング・ステージを有する本発明のマルチチャンネル・デコーダの第1の実施形態を図示する。 図19bは、利得調整されたフィルタ出力信号をもたらす調整されたHRTFに基づくフィルタを有する本発明の装置を図示する。 図20は、非エネルギー節約型アップミックス・ルールのための情報を生成するエンコーダのための例を示す。
本発明の利得調整形態について詳細に述べる前に、HRTFフィルタの組合せおよびHRTFに基づくフィルタの使用について図7〜図11に関連して述べる。
本発明の特徴および効果をよりよく概説するために、より精巧な記載が最初になされる。バイノーラル合成アルゴリズムは、図7に概説される。1セットの入力チャンネルは、1セットのHRTFによってフィルタにかけられる。それぞれの入力信号は、2つの信号(左「L」および右「R」の成分)に分割され、これらの信号のそれぞれは、所望の音源位置に対応するHRTFによってその後にフィルタにかけられる。全ての左耳の信号は、左のバイノーラル出力信号を生成するためにその後に合計され、さらに右耳の信号は、右のバイノーラル出力信号を生成するために合計される。
HRTF畳み込みは、時間ドメインにおいて実行することができるが、計算効率のため周波数ドメインにおいてフィルタリングを実行することがしばしば好まれる。その場合、図7に示される合計は、周波数ドメインにおいても実行される。
原理上、図7に概説されるようにバイノーラル合成方法は、MPEGサラウンド・エンコーダ/デコーダと組み合わせて直接的に用いることができる。MPEGサラウンド・エンコーダは、図8に概略的に示される。マルチチャンネル入力信号は、空間エンコーダによって分析され、空間パラメータと相まって、モノラルまたはステレオ・ダウンミックス信号をもたらす。ダウンミックスは、いかなる従来のモノラルまたはステレオ・オーディオ・コーデックでも符号化することができる。結果として生じるダウンミックス・ビットストリームは、マルチプレクサによって空間パラメータと組み合わされ、総出力ビットストリームをもたらす。
MPEGサラウンド・デコーダと組み合わせてバイノーラル合成スキームは、図9に示される。入力ビットストリームは、空間パラメータおよびダウンミックス・ビットストリームをもたらすように分離される。後のビットストリームは、従来のモノラルまたはステレオ・デコーダを用いて復号化される。復号化されたダウンミックスは、空間デコーダによって復号化され、それは、送信された空間パラメータに基づいてマルチチャンネル出力を生成する。最後に、マルチチャンネル出力は、図7に図示されるように、バイノーラル合成ステージによって処理され、バイノーラル出力信号をもたらす。
しかしながら、そのようなMPEGサラウンド・デコーダおよびバイノーラル合成モジュールのカスケードの少なくとも3つの不利な点がある:
・マルチチャンネル信号表現は、中間ステップとして計算され、バイノーラル合成ステップにおけるHRTF畳み込みおよびダウンミキシングが続く。HRTF畳み込みがチャンネル・ベースごとに実行されなければならないにもかかわらず、それぞれの音声チャンネルが異なる空間位置を有することがあるという事実を考えると、これは、煩雑性の観点から望ましくない状況である。
・空間デコーダは、フィルタバンク(QMF)・ドメインにおいて作動する。一方、HRTF畳み込みは、FFTドメインにおいて典型的に適用される。したがって、マルチチャンネルQMF合成フィルタバンク、マルチチャンネルDFT変換およびステレオ逆DFT変換のカスケードは必要であり、高い計算要求を伴うシステムをもたらす。
・マルチチャンネル再構成を作成するために空間デコーダによって作成される符号化アーチファクトは、聞こえて、(ステレオ)バイノーラル出力においておそらく高められる。
空間エンコーダは、図11に示される。左前、左サラウンド、中央、右前および右サラウンドのチャンネルのためのLf、Ls、C、RfおよびRs信号からなるマルチチャンネル入力信号は、2つの「OTT」ユニットによって処理され、それらの両方は、モノラル・ダウンミックスおよび2つの入力信号のためのパラメータを生成する。結果として生じるダウンミックス信号は、中央のチャンネルと相まって、「TTT」(2対3)エンコーダによってさらに処理され、ステレオ・ダウンミックスおよびさらなる空間パラメータを生成する。
「TTT」エンコーダから生じるパラメータは、典型的に、パラメータ・バンドごとに一対の予測係数、または、3つの入力信号のエネルギー比を表す一対のレベル差からなる。「OTT」エンコーダのパラメータは、周波数バンドごとに入力信号間のレベル差およびコヒーレンスまたは相互相関値からなる。
図12には、MPEGサラウンド・デコーダが図示される。ダウンミックス信号l0およびr0は、2対3モジュールに入力され、中央のチャンネル、右側のチャンネルおよび左側のチャンネルを再現する。これらの3つのチャンネルは、6つの出力チャンネルを生じるいくつかのOTTモジュール(1対2)によってさらに処理される。
対応するバイノーラル・デコーダは、概念的な観点からわかるように、図10に示される。フィルタバンク・ドメイン内で、ステレオ入力信号(L0、R0)は、TTTデコーダによって処理され、3つの信号L、RおよびCをもたらす。これらの3つの信号は、HRTFパラメータ処理を受ける。結果として生じる6つのチャンネルは、ステレオ・バイノーラル出力対(Lb、Rb)を生成するために合計される。
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Hx(Y)フィルタは、元のHRTFフィルタのパラメトリック・バージョンのパラメトリック重み付けられた組合せとして表すことができる。これが働くために、元のHRTFフィルタは、
・左耳のインパルス応答のための周波数バンドごとの(平均)レベル、
・右耳のインパルス応答のための周波数バンドごとの(平均)レベル、
・左耳および右耳のインパルス応答間の(平均)到着時間または位相差
として表される。
Figure 0004834153
そのため、HRTFパラメータ処理は、単に中央のチャンネルの音源位置に対応するPlおよびPrを有する信号の乗算からなる一方で、位相差は、対称的に分布される。このプロセスは、QMFバンドごとに個々に実行され、一方ではHRTFパラメータからQMFフィルタバンクへのマッピングを用い、他方では空間パラメータからQMFバンドへのマッピングを用いる。
Figure 0004834153
明らかに、HRTFは、6つの元のチャンネルのためのパラメータ化されたHRTFフィルタのためのレベルおよび位相差の重み付けられた組合せである。
Figure 0004834153
Figure 0004834153
上述のアプローチは、周波数バンドごとの平均レベルおよび周波数バンドごとの平均位相差として十分正確に表すことができる短いHRTFフィルタに効果がある。しかしながら、長いエコーHRTFには、これは事実でない。
本発明は、任意の長さのHRTFフィルタを取り扱うために2×2マトリクス・バイノーラル・デコーダのアプローチをどのように拡張するかを教示する。これを達成するために、本発明は、次のステップを含む:
・HRTFフィルタ応答をフィルタバンク・ドメインに変換
・HRTFフィルタ対からの全体的な遅延差または位相差の抽出
・HRTFフィルタ対の応答をCLDパラメータの関数としてモーフィング
・利得調整
これは、Y=L0、R0およびX=L、R、Cの6つの複素利得HY(X)を6つのフィルタで置き換えることによって達成される。これらのフィルタは、Y=L0、R0およびX=Lf、Ls、Rf、Rs、Cの10個の複素利得HY(X)から導出され、それらは、QMFドメインにおいて所定のHRTFフィルタ応答を表す。これらのQMF表現は、後述する方法に従って達成することができる。
Figure 0004834153
Figure 0004834153
フィルタのモーフィングにおけるこの位相パラメータの役割は、2つの面を有する。第1に、それは、前および後のスピーカ間の音源位置に対応する主要な遅延時間をモデル化する組み合わせられた応答を導く重ね合わせの前に、2つのフィルタの遅延補償を実現する。第2に、それは、必要な利得補償係数gをより安定にしさらにφXY=0の単純な重ね合わせの場合よりも周波数とともにゆっくり変化させる。
Figure 0004834153
φXY=0の単純な重ね合わせの場合、ρXYの値は、周波数の関数として一定でなく振動する方法で変化し、それは、広範囲な利得調整の必要を導く。実用的な実装において、利得gの値を制限する必要があり、信号の残留するスペクトル有色化を回避することができない。
対照的に、本発明によって教示されるように遅延に基づく位相補償を伴うモーフィングの使用は、周波数の関数としてρXYのスムースな挙動を導く。この値は、自然なHRTFから導出されたフィルタ対のための1つの近くにさえしばしばあり、これは、それらが遅延および振幅において主に異なり、さらに、位相パラメータの目的が遅延差をQMFフィルタバンク・ドメインにおいて考慮に入れることであるからである。
Figure 0004834153
以下で考慮される全ての信号は、離散時間信号の変調されたフィルタ・バンクまたはウィンドウ化されたFFT分析からのサブバンド・サンプルまたは離散時間信号である。当然のことながら、これらのサブバンドは、対応する合成フィルタ・バンク操作によって離散時間ドメインへ戻って変換されなければならない。
図1は、HRTF関連フィルタを用いるパラメトリック・マルチチャンネル信号のバイノーラル合成のための手順を図示する。N個のチャンネルを含むマルチチャンネル信号は、M<NのM個の送信されたチャンネルおよび送信された空間パラメータに基づいて空間復号化101によって生成される。これらのN個のチャンネルは、HRTFフィルタリングによってバイノーラル・リスニングを目的とする2つの出力チャンネルに次々に変換される。このHRTFフィルタリング102は、左耳のための1つのHRTFフィルタおよび右耳のための1つのHRTFフィルタでそれぞれの入力チャンネルをフィルタにかけた結果を重ね合わせる。全般的に見て、これは、2N個のフィルタを必要とする。パラメトリック・マルチチャンネル信号は、N個のラウドスピーカによって聞かれる場合に高品質なリスナーの体験を達成するのに対して、N個の信号のわずかな相互依存性は、バイノーラル・リスニングのためのアーチファクトを導く。これらのアーチファクトは、符号化の前に元のN個のチャンネルのHRTFフィルタリングによって定義されるように、参照バイノーラル信号からスペクトル・コンテントにおける偏差によって支配される。この連なりのさらなる不利な点は、バイノーラル合成のための総計算コストがコンポーネント101および102ごとに必要なコストの追加となるということである。
図2は、本発明によって教示される組み合わされたフィルタリングを用いることによるパラメトリック・マルチチャンネル信号のバイノーラル合成を図示する。送信された空間パラメータは、201によって、2つのセットSet1およびSet2に分割される。ここで、Set2は、M個の送信されたチャンネルからP個の中間チャンネルの作成に関するパラメータを含み、Set1は、P個の中間チャンネルからN個のチャンネルの作成に関するパラメータを含む。先行技術のプリコンバイナ202は、2N個のHRTF関連サブバンド・フィルタの選択された対と、パラメータSet1および選択された対のフィルタに依存する重みとを組み合わせる。この事前組合せの結果は、P個の中間チャンネルごとにバイノーラル・フィルタ対を表す2P個のバイノーラル・サブバンド・フィルタとなる。本発明のコンバイナ203は、パラメータSet2および2P個のバイノーラル・サブバンド・フィルタの両方に依存する重みを適用することによって2P個のバイノーラル・サブバンド・フィルタを1セットの2M個のバイノーラル・サブバンド・フィルタに組み合わせる。比較すると、先行技術のリニア・コンバイナは、パラメータSet2だけに依存する重みを適用する。結果として生じる1セットの2M個のフィルタは、M個の送信されたチャンネルごとにバイノーラル・フィルタ対からなる。フィルタ・プロセッサとしての組み合わされたフィルタリング・ユニット204は、対応するフィルタ対を有するフィルタリングによって、M個の送信されたチャンネルごとに2つのチャンネル出力への一対の貢献を得る。その後、全てのM個の貢献は、サブバンド・ドメインにおいて2つのチャンネル出力を形成するために合計される。
図3は、空間パラメータおよびバイノーラル・フィルタの組合せのための本発明のコンバイナ203のコンポーネントを図示する。リニア・コンバイナ301は、所定の空間パラメータから導出される重みを適用することによって、2P個のバイノーラル・サブバンド・フィルタを2M個のバイノーラル・フィルタに組み合わせ、そこにおいて、これらの空間パラメータは、M個の送信されたチャンネルからP個の中間チャンネルの作成に関する。特に、この線形結合は、M個の送信されたチャンネルから、P個の音源からのバイノーラル・フィルタリングが後に続くP個の中間チャンネルへのアップミックスの連なりをシミュレートする。利得調整器303は、左耳の出力に対応するそれぞれのフィルタに共通の左の利得を適用し、さらに、右耳の出力に対応するそれぞれのフィルタに共通の右の利得を適用することによって、リニア・コンバイナ301から2M個のバイノーラル・フィルタを修正する。それらの利得は、空間パラメータおよび2P個のバイノーラル・フィルタから利得を導出する利得計算機302から得られる。本発明のコンポーネント302および303の利得調整の目的は、空間復号化のP個の中間チャンネルがリニア・コンバイナ301のため不必要なスペクトル有色化を導く線形依存性をもたらす状況を補償することである。本発明によって教示される利得計算機302は、空間パラメータの関数として、P個の中間チャンネルのエネルギー分布を推定するための手段を含む。
図4は、ステレオ送信された信号の場合においてMPEGサラウンド空間復号化の構成を図示する。M=2個の送信された信号の分析サブバンドは、P=3個の中間信号、すなわち組み合わされた左、組み合わされた右、および組み合わされた中央の中間信号を出力する2→3ボックス401に送られる。このアップミックスは、図2のSet2に対応する送信された空間パラメータのサブセットに依存する。3つの中間信号は、lf(左前)、ls(左サラウンド)、rf(右前)、rs(右サラウンド)、c(中央)、およびlfe(低周波拡張)の合計がN=6個の信号405を生成する3つの1→2ボックス402−404にその後に送られる。このアップミックスは、図2におけるSet1に対応する送信された空間パラメータのサブセットに依存する。最終的なマルチチャンネル・デジタル音声出力は、6つのサブバンド信号を6つの合成フィルタバンクに通すことによって作成される。
図5は、本発明の利得補償によって解決される問題を図示する。左耳のための参照HRTFフィルタにかけられたバイノーラル出力のスペクトルは、実線グラフとして示される。点線グラフは、コンバイナ203がリニア・コンバイナ301だけからなる場合に、図2の方法によって生成されるように対応する復号化された信号のスペクトルを示す。それが分かるように、周波数の間隔3−4kHzおよび11−13kHzにおいて所望の参照スペクトルと比較して相当なスペクトル・エネルギー損失がある。また、1kHzおよび10kHz周辺に、小さいスペクトル・ブーストもある。
図6は、本発明の利得補償を使用する利点を図示する。実線グラフは、図5におけるものと同じ参照スペクトルであるが、点線グラフは、コンバイナ203が図3の全てのコンポーネントからなる場合に、図2の方法によって生成されるように復号化された信号のスペクトルを示す。それが分かるように、図5の2つのカーブのものと比較して2つのカーブ間に大幅に改善されたスペクトル整合がある。
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
引用(10)によって与えられる補償利得を計算することができるようにするために残ることは、任意の係数までの元のチャンネルのエネルギー分布||xp||2、p=1、2、・・・、Pを推定することである。本発明は、これらのチャンネルが無相関であり、さらに、エンコーダが予測エラーを最小化することを目的とするという仮定に対応する予測マトリクスCmodelを、エネルギー分布の関数として計算することによってこれを行うことを教示する。そして、エネルギー分布は、可能であれば方程式Cmodel=Cの非線形システムを解くことによって推定される。解決策のない方程式のシステムを導く予測パラメータに対して、利得補償係数は、gn=1に設定される。この発明の手順は、最も重要な特別な場合において以下のセクションに詳述される。
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
Figure 0004834153
本発明の補正利得係数は、いかなるHRTF関連の問題なしに利用できる直接的なマルチチャンネル利得補償との共存をもたらすことができる。
MPEGサラウンドでは、予測損失の補償は、0<ρ≦1が送信された空間パラメータの一部である係数1/ρをアップミックス・マトリクスCに乗じることによってデコーダにおいてすでに適用されている。その場合、(27)および(28)の利得は、積ρgnおよびρgでそれぞれ置き換えられなければならない。そのような補償は、図5および図6において研究されるバイノーラル復号化のために適用される。それは、図5の先行技術の復号化が参照と比較してスペクトルのブースト部分をなぜ有するのかという理由である。それらの周波数領域に対応するサブバンドに対して、本発明の利得補償は、送信されたパラメータ利得係数1/ρを方程式(28)から導出される小さい値で効果的に置き換える。
さらに、ρ=1の場合が良好な予測に対応するので、本発明によって教示される利得補償のより保守的な変形は、ρ=1に対してバイノーラル利得補償を無効にする。
Figure 0004834153
したがって、復号化のこのモードの全体の構成も、P=M=3を設定し、さらに、(7)および(31)で定義される線形結合だけを実行するためにコンバイナ203を修正することによって、図2を用いて記述されている。
図13は、修正された表現において図3におけるリニア・コンバイナ301の結果を図示する。コンバイナの結果は、4つのHRTFに基づくフィルタh11、h12、h21およびh22である。図16aおよび図17の記載からより明らかなように、これらのフィルタは、図16aの15、16、17、18によって示されるフィルタに対応する。
図16aは、左耳または左のバイノーラル点を有し、さらに、右耳または右のバイノーラル点を有するリスナーの頭部を図示する。図16aがステレオ・シナリオに対応するだけの場合に、フィルタ15、16、17、18は、個々に測定され、または、インターネットを介して若しくはリスナー、左のチャンネル・スピーカおよび右のチャンネル・スピーカ間の異なる位置のための対応するテキストブックにおいて得られる、典型的な頭部伝達関数である。
しかしながら、本発明はマルチチャンネル・バイノーラル・デコーダを目的とするので、15、16、17、18で示されるフィルタは、純粋なHRTFフィルタではなく、HRTFに基づくフィルタであり、それは、HRTF特性を反映するだけでなく、空間パラメータに依存し、さらに、特に、図2に関連して述べられるように、空間パラメータSet1および空間パラメータSet2に依存する。
図14は、図16aにおいて用いられるHRTFに基づくフィルタの基礎を示す。特に、リスナーが、例えば、典型的なサラウンド・ホームまたはシネマ・エンターテインメント・システムにおいて見つけることができる5チャンネル・スピーカ・セットアップの5つのスピーカ間のスイート・スポットに位置付けられる状況が説明される。チャンネルごとに、伝達関数としてHRTFを有するフィルタのチャンネル・インパルス応答に変換することができる2つのHRTFが存在する。特に技術的に周知であるように、例えば、図14のHRTF1が、スピーカLsから発するサウンドがリスナーの頭部のまわりを通った後に右耳に入る状況を説明するように、HRTFに基づくフィルタは、人の頭部の中で音波伝搬を説明する。それに対して、左サラウンド・スピーカLsから発するサウンドは、ほとんど直接的に左耳に入り、頭部や耳などの形状で耳の位置の影響を部分的にしか受けない。したがって、HRTF1および2が互いに異なることが明らかになる。
同じことは、左のチャンネルLに対する両耳の関係が異なるので、左のチャンネルのためのHRTF3および4にも当てはまる。これは、他の全てのHRTFにも適用され、ただし図14から明らかなように、中央のチャンネルのためのHRTF5および6は、個々のリスナー非対称性がHRTFデータによって提供されない限り、互いにほとんど同一であるか完全に同一でもある。
上述のように、これらのHRTFは、モデル頭部に対して決定され、いかなる特定の「平均的な頭部」やラウドスピーカ・セットアップのためにダウンロードすることができる。
ここで、図17において171および172で明らかなように、組合せは、図15にL´で示される左側の2つのHRTFに基づくフィルタを得るために、左のチャンネルおよび左サラウンドのチャンネルを組み合わせることが行われる。同じ手順が、HRTF13およびHRTF14を生じる図15にR´で示されるように右側に対して実行される。このため、図17におけるアイテム173およびアイテム174について言及がされる。しかしながら、ここで、アイテム171、172、173および174においてそれぞれのHRTFを組み合わせるために、元のセットアップのLのチャンネルおよびLsのチャンネル間または元のマルチチャンネル・セットアップのRのチャンネルおよびRsのチャンネル間のエネルギー分布を反映しているチャンネル間レベル差パラメータが説明される。特に、これらのパラメータは、HRTFが線形に組み合される場合に重み係数を定義する。
前に概説されるように、位相係数は、HRTFを組み合わせる場合に適用することもでき、位相係数は、組み合されるHRTF間の時間遅延またはアンラッピングされた位相差によって定義される。しかしながら、この位相係数は、送信されたパラメータに依存しない。
そのため、HRTF11、12、13および14は、真のHRTFフィルタではないが、HRTFに基づくフィルタであり、その理由は、これらのフィルタがHRTFに従属するだけでなく、送信された信号から独立しているからである。その代わりに、HRTF11、12、13および14は、チャンネル・レベル差パラメータcldlおよびcldrがこれらのHRTF11、12、13および14を計算するために用いられるという事実のために、送信された信号にも依存している。
ここで、図15の状況が得られ、それは、好適なダウンミックス信号に含まれるような2つの送信されたチャンネルよりはむしろまだ3つのチャンネルを有する。したがって、図16aに図示されるように、4つのHRTF15、16、17、18への6つのHRTF11、12、5、6、13、14の組合せが実行されなければならない。
このために、HRTF11、5、13は、左のアップミックス・ルールを用いて組み合され、それは、図16bにおけるアップミックス・マトリクスから明らかになる。特に、図16bに示されさらにブロック175に示される左のアップミックス・ルールは、パラメータm11、m21およびm31を含む。この左のアップミックス・ルールは、図16のマトリクス方程式において、左のチャンネルで乗じられるためにある。したがって、これらの3つのパラメータは、左のアップミックス・ルールと呼ばれる。
ブロック176において概説されるように、同じHRTF11、5、13は、組み合わされるが、右のアップミックス・ルールを用いて、すなわち図16b実施形態において、パラメータm12、m22およびm32は、全てが図16bにおける右のチャンネルR0で乗じられるために用いられる。
このように、HRTF15およびHRTF17が生成される。同様に、図15のHRTF12、HRTF6およびHRTF14は、HRTF16を得るためにアップミックスの左のパラメータm11、m21およびm31を用いて組み合される。対応する組合せは、HRTF12、HRTF6、HRTF14を用いて実行されるが、その時、図16aのHRTF18を得るためにm12、m22およびm32によって示されるアップミックスの右のパラメータまたは右のアップミックス・ルールが用いられる。
また、図14における元のHRTFが送信された信号に全く依存しないとともに、新しいHRTFに基づくフィルタ15、16、17、18が送信された信号に依存することが強調され、その理由は、マルチチャンネル信号に含まれる空間パラメータが、これらのフィルタ15、16、17および18を計算するために用いられるからである。
最後にバイノーラルの左のチャンネルLBおよびバイノーラルの右のチャンネルRBを得るために、フィルタ15および17の出力は、加算器130aにおいて組み合わされなければならない。同様に、フィルタ16および18の出力は、加算器130bにおいて組み合されなければならない。これらの加算器130a、130bは、人間の耳の範囲内で2つの信号の重ね合わせを反映する。
その後、図18が説明される。図18は、元のマルチチャンネル信号から導出されるダウンミックス信号を用いてバイノーラル信号を生成するための本発明のマルチチャンネル・デコーダの好適な実施形態を示す。ダウンミックス信号は、z1およびz2で示され、または、「L」および「R」によって示されもする。さらに、ダウンミックス信号は、それに関連するパラメータを有し、パラメータは、少なくとも、左および左サラウンドのためのチャンネル・レベル差または右および右サラウンドのためのチャンネル・レベル差とアップミキシング・ルールに関する情報とである。
もちろん、元のマルチチャンネル信号が3つのチャンネル信号だけであった場合、cldlまたはcldrは送信されず、パラメトリック・サイド情報だけがアップミックス・ルールに関する情報であり、それは、前に概説されるように、アップミックス信号におけるエネルギー・エラーを生じるようなアップミックス・ルールである。このように、アップミックス信号の波形は、非バイノーラル・レンダリングが実行される場合、できる限り元の波形に近く整合されるにもかかわらず、アップミックスされたチャンネルのエネルギーは、対応する元のチャンネルのエネルギーと異なる。
図18の好適な実施形態において、アップミックス・ルール情報は、2つのアップミックス・パラメータcpc1、cpc2によって反映される。しかしながら、いかなる他のアップミックス・ルール情報も、特定数のビットを介して適用しさらに送信することができる。特に、テーブル・インデックスだけがエンコーダからデコーダに送信されなければならないように、デコーダで所定のテーブルを用いて特定のアップミックス・シナリオおよびアップミックス・パラメータを信号で伝えることができる。あるいは、2つのチャンネルから3つより多いチャンネルへのアップミックスのように異なるアップミキシング・シナリオを用いることもできる。あるいは、図20に関してさらに詳細に述べられるように、アップミックス・ルールに適合しなければならない対応する異なるダウンミックス・ルールを必要とする2つより多い予測アップミックス・パラメータを送信することもできる。
アップミックス・ルール情報のためのそのような好適な実施形態に関係なく、エネルギー損失の影響を受けるセットのアップミックスされたチャンネルを生成するアップミックスと同じくらい十分に長いいかなるアップミックス・ルール情報も、可能であり、それは、対応するセットの元の信号に波形整合される。
本発明のマルチチャンネル・デコーダは、エネルギー・エラーを低減しまたは除去するために、少なくとも1つの利得係数gl、grまたはgを計算するための利得係数計算機180を含む。利得係数計算機は、アップミックス・ルールが適用される場合に、アップミックス・ルール情報と、得られるアップミックス・チャンネルに対応するHRTFに基づくフィルタのフィルタ特性とに基づいて、利得係数を計算する。しかしながら、前に概説されるように、バイノーラル・レンダリングにおいて、このアップミックスは行われない。それにもかかわらず、図15および図17のブロック175、176、177、178に関連して述べられるように、これらのアップミックス・チャンネルに対応するHRTFに基づくフィルタは、いずれにせよ用いられる。
前に概説されるように、利得係数計算機180は、nの代わりにlまたはrが代入される場合に、方程式(27)に概説されるように、異なる利得係数glおよびgrを計算することができる。あるいは、利得係数計算機は、方程式(28)によって示されるように、両方のチャンネルのための単一の利得係数を生成することができる。
重要なことに、本発明の利得係数計算機180は、アップミックス・ルールに基づくだけでなく、アップミックス・チャンネルに対応するHRTFに基づくフィルタのフィルタ特性にも基づく利得係数を計算する。これは、フィルタ自体が送信された信号に依存し、さらに、エネルギー・エラーで影響を受ける状況を反映する。このように、エネルギー・エラーは、予測パラメータCPC1、CPC2のようなアップミックス・ルール情報によって生じるだけでなく、フィルタ自体によっても影響を受ける。
したがって、うまく適応された利得補正を得るために、本発明の利得係数は、予測パラメータに依存するだけでなく、同様にアップミックス・チャンネルに対応するフィルタにも依存する。
HRTFに基づくフィルタと同様に利得係数およびダウンミックス・パラメータは、左のバイノーラル・チャンネルLBを有し、さらに、正のバイノーラル・チャンネルRBを有するエネルギー補正されたバイノーラル信号を得るために、ダウンミックス信号をフィルタにかけるためのフィルタ・プロセッサ182において用いられる。
好適な実施形態において、利得係数は、アップミックス・チャンネルに対応するフィルタのチャンネル・インパルス応答に含まれる総エネルギーと、この総エネルギーおよび推定されたアップミックス・エネルギー・エラーΔEの差との関係に依存する。ΔEは、好ましくは、アップミックス・チャンネルに対応するフィルタのチャンネル・インパルス応答を組み合わせ、組み合されたチャンネル・インパルス応答のエネルギーを計算することによって計算することができる。図18におけるGLおよびGRのための関係において全ての数が正の数であり、それはΔEおよびEのための定義から明らかになるので、両方の利得係数が1より大きいことが明らかである。これは、ほとんどの時間において、バイノーラル信号のエネルギーが元のマルチチャンネル信号のエネルギーより低いという図5に図示される体験を反映する。留意することは、マルチチャンネル利得補償が適用される場合、すなわち、係数ρが大部分の信号において用いられる場合でも、それにもかかわらずエネルギー損失が生じることである。
図19aは、図18のフィルタ・プロセッサ182の好適な実施形態を図示する。特に、図19aは、ブロック182aにおいて利得補償なしで図16aの組み合わされたフィルタ15、16、17、および18が用いられ、さらにフィルタ出力信号が図13に概説されるように加算される場合の状況を図示する。そして、ボックス182aの出力は、ボックス180によって計算される利得係数を用いて出力を拡大縮小するためのスケーラ・ボックス182bに入力される。
あるいは、フィルタ・プロセッサは、図19bに示されるように構成することができる。ここで、HRTF15〜18は、ボックス182cに図示されるように計算される。このように、計算機182cは、いかなる利得調整なしでHRTFの組合せを実行する。そして、フィルタ調整器182dが提供され、それは、本発明で計算された利得係数を用いる。フィルタ調整器は、ブロック180eに示される調整されたフィルタをもたらし、そこにおいて、ブロック180eは、調整されたフィルタを用いてフィルタリングを実行し、さらに図13に示されるように対応するフィルタ出力の次の加算を実行する。このように、図19aにおけるようなポスト・スケーリングは、利得補正されたバイノーラル・チャンネルLBおよびRBを得るために必要でない。
一般に、方程式16、方程式17および方程式18に関連して概説されたように、利得計算は、推定されたアップミックス・エラーΔEを用いて行われる。この近似は、アップミックス・チャンネルの数がダウンミックス・チャンネルの数+1に等しい場合に特に役立つ。このように、2つのダウンミックス・チャンネルの場合、この近似は、3つのアップミックス・チャンネルに効果がある。あるいは、3つのダウンミックス・チャンネルを有する場合、この近似は、4つのアップミックス・チャンネルがあるシナリオに有効に働きもする。
しかしながら、アップミックス・エラーの推定に基づく利得係数の計算が、例えば、5つのチャンネルが3つのダウンミックス・チャンネルを用いて予測されるというシナリオのために実行することができることに留意すべきである。あるいは、2つのダウンミックス・チャンネルから4つのアップミックス・チャンネルへの予測に基づくアップミックスを用いることもできる。推定されたアップミックス・エネルギー・エラーΔEに関して、好適な場合のための方程式(25)に示されるようにこの推定されたエラーを直接的に計算することができるだけでなく、ビットストリームにおいて実際に発生されたアップミックス・エラーに関するいくらかの情報を送信することもできる。それにもかかわらず、方程式(25)から(28)に関連して説明されるように特別な場合と異なる場合においても、予測パラメータを用いてアップミックス・チャンネルのためのHRTFに基づくフィルタに基づいて、値En Bを計算することができる。方程式(26)が考慮されると、HRTFに基づくフィルタ・インパルス応答のエネルギーのための重み係数が対応して適応される場合に、この方程式が2/4予測アップミックス・スキームに容易に適用することもできることが明らかになる。
それからみて、方程式(27)の一般の構成、すなわちEB/(EB−ΔEB)の関係に基づく利得係数の計算が他のシナリオにも適用されることが明らかになる。
その後、図20は、デコーダがバイノーラル・フィルタ・プロセッサのコンテクストにおいて利得補償を実行することができるように、デコーダに送信されるダウンミックス信号L、Rおよびアップミックス・ルール情報を生成するために用いられることができる予測に基づくエンコーダの概略的な実施を示すために述ベられる。
ダウンミキサ191は、(LsおよびRs)で図示されるように、5つの元のチャンネルまたは3つの元のチャンネルを受信する。ダウンミキサ191は、所定のダウンミックス・ルールに基づいて動くことができる。その場合、ライン192によって示されるようにダウンミックス・ルール指示は必要がない。もちろん、エラー・ミニマイザ193は、対応する元の入力チャンネルに関してアップミキサ194の出力で再構成されたチャンネル間のエラーを最小化するために、ダウンミックス・ルールも変化することができる。
このように、エラー・ミニマイザ193は、再構成されたチャンネルが最小の予測損失ΔEを有するように、ダウンミックス・ルール192またはアップミックス・ルール196を変化することができる。この最適化問題は、エラー・ミニマイザ193内の周知のアルゴリズムのいずれかによって解決され、それは、好ましくは、再構成チャンネルおよび入力チャンネル間の差を最小化するサブバンドに関するやり方で作動する。
前述のように、入力チャンネルは、元のチャンネルL、Ls、R、Rs、Cであり得る。あるいは、入力チャンネルは、3つのチャンネルL、R、Cであり得るが、このコンテクストにおいて、入力チャンネルL、Rは、図11において図示される対応するOTTボックスによって導出することができる。あるいは、元の信号がチャンネルL、R、Cを有する場合、これらのチャンネルは、「元のチャンネル」と称することもできる。
さらに、図20は、いかなるアップミックス・ルール情報も、デコーダがこのアップミックス・ルール情報を用いてアップミックスを実行する位置にある限り、2つの予測パラメータの送信をさらに用いることができることを図示する。このように、アップミックス・ルール情報は、ルックアップ・テーブルへのエントリーまたはいかなる他のアップミックス関連情報であることができる。
したがって、本発明は、HRTFフィルタリングによって利用できるダウンミックスされた信号およびさらなる制御データに基づくマルチチャンネル音声信号のバイノーラル復号化を実行する効率的なやり方を提供する。本発明は、バイノーラル復号化を伴う予測アップミックスの組合せから起こるスペクトル有色化の問題の解決策を提供する。
本発明の方法の特定の実現要求によっては、本発明の方法は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。この実施は、本発明の方法が実行されるように、プログラム可能なコンピュータシステムと協動する、それに記憶される電子的に読み取ることができる制御信号を有する特にディスク、DVDまたはCDなどのデジタル記憶媒体を用いて実行することができる。そのため、本発明は、一般に、機械で読み取り可能なキャリアに記憶されたプログラムコードを有するコンピュータプログラム製品であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行される場合に本発明の方法を実行するように作動する。したがって、換言すれば、本発明の方法は、コンピュータプログラムがコンピュータ上で実行される場合に、本発明の方法のうちの少なくとも1つを実行するためのプログラムコードを有するコンピュータプログラムである。
上述には本発明の特定の実施の形態に関して特に示され説明されたが、形式や詳細のさまざまな他の変更が本発明の精神および範囲から逸脱することなくできるということは、当業者にとって理解されよう。さまざまな変更が本願明細書において開示されさらに特許請求の範囲によって理解される上位概念から逸脱することなく異なる実施の形態に適応する際にできることを理解すべきである。

Claims (24)

  1. ダウンミックス信号をアップミックス・ルールでアップミックスするために用いることができるアップミックス・ルール情報を含むパラメータを用いて元のマルチチャンネル信号から導出されるダウンミックス信号からバイノーラル信号を生成するためのマルチチャンネル・デコーダであって、前記アップミックス・ルールはエネルギー・エラーをもたらし、前記マルチチャンネル・デコーダは、
    前記アップミックス・ルール情報およびアップミックス・チャンネルに対応する頭部伝達関数に基づくフィルタのフィルタ特性に基づいて、前記エネルギー・エラーを低減しまたは除去するための少なくとも1つの利得係数を計算するための利得係数計算機、および
    エネルギー補正されたバイノーラル信号を得るために前記少なくとも1つの利得係数、前記フィルタ特性および前記アップミックス・ルール情報を用いて前記ダウンミックス信号をフィルタにかけるためのフィルタ・プロセッサを含む、マルチチャンネル・デコーダ。
  2. 前記フィルタ・プロセッサは、前記ダウンミックス信号のチャンネルごとに2つの利得調整されたフィルタのためのフィルタ係数を計算し、さらに前記2つの利得調整されたフィルタのそれぞれを用いて前記ダウンミックス・チャンネルをフィルタにかけるように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  3. 前記フィルタ・プロセッサは、前記利得係数を用いないで前記ダウンミックス・チャンネルのチャンネルごとに2つのフィルタのためのフィルタ係数を計算し、さらに前記ダウンミックス・チャンネルをフィルタにかけ、さらに前記ダウンミックス・チャンネルをフィルタにかけた後に利得調整するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  4. 前記利得係数計算機は、前記フィルタ特性の組み合わされたインパルス応答のエネルギーに基づいて前記利得係数を計算するように作動し、前記組み合わされたインパルス応答は、個々のフィルタ・インパルス応答を加算しまたは減算することによって計算される、請求項1に記載のマルチチャンネル・デコーダ。
  5. 前記利得係数計算機は、個々のフィルタ・インパルス応答のパワーの組合せに基づいて前記利得係数を計算するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  6. 前記利得係数計算機は、個々のフィルタ・インパルス応答のパワーの重み付けられた加算に基づいて前記利得係数を計算するように作動し、前記重み付けられた加算において用いられる重み付け係数は、前記アップミックス・ルール情報に依存する、請求項5に記載のマルチチャンネル・デコーダ。
  7. 前記利得係数計算機は、分子および分母を有する表現に基づいて前記利得係数を計算するように作動し、前記分子は、個々のフィルタ・インパルス応答のパワーの組合せを有し、さらに前記分母は、個々のフィルタ・インパルス応答のパワーの重み付けられた加算を有し、前記重み付けられた加算において用いられる重み付け係数は、前記アップミックス・ルール情報に依存する、請求項1に記載のマルチチャンネル・デコーダ。
  8. Figure 0004834153
  9. Figure 0004834153
  10. 前記利得係数計算機は、左のバイノーラル・チャンネルおよび右のバイノーラル・チャンネルのための共通の利得係数を計算するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  11. 前記フィルタ・プロセッサは、前記フィルタ特性として、仮想の中央、左および右の位置のための前記左のバイノーラル・チャンネルおよび前記右のバイノーラル・チャンネルのための前記頭部伝達関数に基づくフィルタを用いるか、または、仮想の左前の位置および仮想の左サラウンドの位置のためのHRTFフィルタを組み合わせることによって若しくは仮想の右前の位置および仮想の右サラウンドの位置のためのHRTFフィルタを組み合わせることによって導出されるフィルタ特性を用いるように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  12. 元の左のチャンネルおよび左サラウンドのチャンネルまたは元の右のチャンネルおよび右サラウンドのチャンネルに関するパラメータは、デコーダ入力信号に含まれ、さらに
    前記フィルタ・プロセッサは、前記頭部伝達関数フィルタを組み合わせるための前記パラメータを用いるように作動する、請求項11に記載のマルチチャンネル・デコーダ。
  13. 前記利得係数計算機は、バイノーラル・チャンネルのための前記HRTFに基づくフィルタのチャンネル・インパルス応答のエネルギーの重み付けられた線形結合と前記重み付けられた線形結合から推定されたエネルギー・エラーを減算することによって得られる値との比に基づいて前記バイノーラル・チャンネルのための前記利得係数を計算するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  14. 前記利得係数計算機は、前記重み係数を決定するための前記アップミックス・ルールに関する情報を用いるように作動する、請求項13に記載のマルチチャンネル・デコーダ。
  15. 前記アップミックス・ルール情報は、対応する3つの入力チャンネルに関して前記エネルギー・エラーを有する出力チャンネルをもたらすアップミックス・マトリクスを構成するために用いることができる少なくとも2つの予測パラメータを含む、請求項14に記載のマルチチャンネル・デコーダ。
  16. 前記フィルタ・プロセッサは、フィルタ特性として、
    第1の左のバイノーラル出力を得るための左のダウンミックス・チャンネルをフィルタにかけるための第1のフィルタ、
    第2の左のバイノーラル出力を得るための右のダウンミックス・チャンネルをフィルタにかけるための第2のフィルタ、
    第1の右のバイノーラル出力を得るための左のダウンミックス・チャンネルをフィルタにかけるための第3のフィルタ、
    第2の右のバイノーラル出力を得るための右のダウンミックス・チャンネルをフィルタにかけるための第4のフィルタ、
    左のバイノーラル・チャンネルを得るために前記第1の左のバイノーラル出力および前記第2の左のバイノーラル出力を加算するため、および、右のバイノーラル・チャンネルを得るために前記第1の右のバイノーラル出力および前記第2の右のバイノーラル出力を加算するための加算器を有するように作動し、
    前記フィルタ・プロセッサは、前記左のバイノーラル・チャンネルのための利得係数を、加算の前または後に前記第1のフィルタおよび前記2のフィルタにまたは前記左のバイノーラル出力に適用し、さらに、前記右のバイノーラル・チャンネルのための前記利得係数を、加算の前または後に前記第3のフィルタおよび前記4のフィルタにまたは前記右のバイノーラル出力に適用するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  17. 前記アップミックス・ルール情報は、2つのチャンネルから3つのチャンネルへのアップミックスをもたらすアップミックス・マトリクスを構成するために用いることができるアップミックス・パラメータを含む、請求項1に記載のマルチチャンネル・デコーダ。
  18. Figure 0004834153
  19. 予測損失パラメータが、マルチチャンネル・デコーダ入力信号に含まれ、さらに
    前記フィルタ・プロセッサは、前記予測損失パラメータを用いて前記利得係数を拡大縮小するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  20. 前記利得計算機は、サブバンドに関して前記利得係数を計算するように作動し、さらに
    前記フィルタ・プロセッサは、サブバンドに関して前記利得係数を適用するように作動する、請求項1に記載のマルチチャンネル・デコーダ。
  21. 前記フィルタ・プロセッサは、HRTFフィルタのチャンネル・インパルス応答の重み付けられまたは位相シフトされたバージョンを加算することによって2つのチャンネルに関連するHRTFフィルタを組み合わせるように作動し、前記HRTFフィルタにある前記チャンネル・インパルス応答を重み付けるための重み係数は、前記チャンネル間のレベル差に依存し、さらに適用された位相シフトは、前記HRTFフィルタの前記チャンネル・インパルス応答間の時間遅延に依存する、請求項11に記載のマルチチャンネル・デコーダ。
  22. HRTFに基づくフィルタまたはHRTFフィルタのフィルタ特性は、複素指数変調フィルタバンクを用いてHRTFフィルタの実数値フィルタ・インパルス応答をフィルタにかけることによって得られる複素サブバンド・フィルタである、請求項1に記載のマルチチャンネル・デコーダ。
  23. ダウンミックス信号をアップミックス・ルールでアップミックスするために用いることができるアップミックス・ルール情報を含むパラメータを用いて元のマルチチャンネル信号から導出されるダウンミックス信号からバイノーラル信号を生成するためのマルチチャンネル復号化の方法であって、前記アップミックス・ルールはエネルギー・エラーをもたらし、前記マルチチャンネル復号化の方法は、
    前記アップミックス・ルール情報およびアップミックス・チャンネルに対応する頭部伝達関数に基づくフィルタのフィルタ特性に基づいて、前記エネルギー・エラーを低減しまたは除去するための少なくとも1つの利得係数を計算するステップ、および
    エネルギー補正されたバイノーラル信号を得るために前記少なくとも1つの利得係数、前記フィルタ特性および前記アップミックス・ルール情報を用いて前記ダウンミックス信号をフィルタにかけるステップを含む、マルチチャンネル号化の方法。
  24. コンピュータ上で実行されるときに、請求項23に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
JP2009512420A 2006-06-02 2006-09-04 非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ Active JP4834153B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US80381906P 2006-06-02 2006-06-02
US60/803,819 2006-06-02
PCT/EP2006/008613 WO2007140809A1 (en) 2006-06-02 2006-09-04 Binaural multi-channel decoder in the context of non-energy-conserving upmix rules

Publications (2)

Publication Number Publication Date
JP2009539283A JP2009539283A (ja) 2009-11-12
JP4834153B2 true JP4834153B2 (ja) 2011-12-14

Family

ID=37685624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009512420A Active JP4834153B2 (ja) 2006-06-02 2006-09-04 非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ

Country Status (13)

Country Link
US (19) US8027479B2 (ja)
EP (2) EP2024967B1 (ja)
JP (1) JP4834153B2 (ja)
KR (1) KR101004834B1 (ja)
CN (3) CN102547551B (ja)
AT (1) ATE503244T1 (ja)
DE (1) DE602006020936D1 (ja)
ES (1) ES2527918T3 (ja)
HK (2) HK1146975A1 (ja)
MY (2) MY180689A (ja)
SI (1) SI2024967T1 (ja)
TW (1) TWI338461B (ja)
WO (1) WO2007140809A1 (ja)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2007032647A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR100921453B1 (ko) 2006-02-07 2009-10-13 엘지전자 주식회사 부호화/복호화 장치 및 방법
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
MX2010012580A (es) * 2008-05-23 2010-12-20 Koninkl Philips Electronics Nv Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico.
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
ES2524391T3 (es) * 2008-07-31 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de señal para señales binaurales
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN102177542B (zh) 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
KR101342425B1 (ko) * 2008-12-19 2013-12-17 돌비 인터네셔널 에이비 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하기 위한 방법 및 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하도록 구성된 리버브레이터
KR101595995B1 (ko) 2008-12-22 2016-02-22 코닌클리케 필립스 엔.브이. 송신 효과 처리에 의한 출력 신호의 생성
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
CN102667923B (zh) 2009-10-20 2014-11-05 弗兰霍菲尔运输应用研究公司 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2326108B1 (en) * 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
US9042559B2 (en) 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
SG182466A1 (en) 2010-01-12 2012-08-30 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
CN101835072B (zh) * 2010-04-06 2011-11-23 瑞声声学科技(深圳)有限公司 虚拟环绕声处理方法
AU2011237882B2 (en) 2010-04-09 2014-07-24 Dolby International Ab MDCT-based complex prediction stereo coding
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
EP2609589B1 (en) * 2010-09-28 2016-05-04 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR20140037118A (ko) * 2011-06-07 2014-03-26 삼성전자주식회사 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
US9178553B2 (en) * 2012-01-31 2015-11-03 Broadcom Corporation Systems and methods for enhancing audio quality of FM receivers
US9602927B2 (en) * 2012-02-13 2017-03-21 Conexant Systems, Inc. Speaker and room virtualization using headphones
KR101580240B1 (ko) 2012-02-17 2016-01-04 후아웨이 테크놀러지 컴퍼니 리미티드 다채널 오디오 신호를 인코딩하는 파라메트릭 인코더
JP6065452B2 (ja) * 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
SG11201504514WA (en) * 2012-11-09 2015-07-30 Stormingswiss Sarl Non-linear inverse coding of multichannel signals
WO2014164361A1 (en) * 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
US9369818B2 (en) 2013-05-29 2016-06-14 Qualcomm Incorporated Filtering with binaural room impulse responses with content analysis and weighting
US9384741B2 (en) * 2013-05-29 2016-07-05 Qualcomm Incorporated Binauralization of rotated higher order ambisonics
US9215545B2 (en) 2013-05-31 2015-12-15 Bose Corporation Sound stage controller for a near-field speaker-based audio system
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830335A3 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830336A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
MY195412A (en) * 2013-07-22 2023-01-19 Fraunhofer Ges Forschung Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods, Computer Program and Encoded Audio Representation Using a Decorrelation of Rendered Audio Signals
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR20230156153A (ko) * 2014-03-24 2023-11-13 돌비 인터네셔널 에이비 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
JP6520937B2 (ja) * 2014-06-06 2019-05-29 ソニー株式会社 オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
CN106716525B (zh) * 2014-09-25 2020-10-23 杜比实验室特许公司 下混音频信号中的声音对象插入
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
GB2544458B (en) 2015-10-08 2019-10-02 Facebook Inc Binaural synthesis
US10331750B2 (en) 2016-08-01 2019-06-25 Facebook, Inc. Systems and methods to manage media content items
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109036446B (zh) * 2017-06-08 2022-03-04 腾讯科技(深圳)有限公司 一种音频数据处理方法以及相关设备
US10305553B2 (en) * 2017-06-19 2019-05-28 Virginia Tech Intellectual Properties, Inc. Encoding and decoding of information for wireless transmission using multi-antenna transceivers
US10749594B1 (en) * 2017-08-18 2020-08-18 DeepSig Inc. Learning-based space communications systems
DE102017124046A1 (de) * 2017-10-16 2019-04-18 Ask Industries Gmbh Verfahren zur Durchführung eines Morphingvorgangs
CN110853658B (zh) * 2019-11-26 2021-12-07 中国电影科学技术研究所 音频信号的下混方法、装置、计算机设备及可读存储介质
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
GB2609667A (en) * 2021-08-13 2023-02-15 British Broadcasting Corp Audio rendering

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding
JP2006500817A (ja) * 2002-09-23 2006-01-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号の生成
WO2006045371A1 (en) * 2004-10-20 2006-05-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Individual channel temporal envelope shaping for binaural cue coding schemes and the like
WO2006048203A1 (en) * 2004-11-02 2006-05-11 Coding Technologies Ab Methods for improved performance of prediction based multi-channel reconstruction

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3571794A (en) * 1967-09-27 1971-03-23 Bell Telephone Labor Inc Automatic synchronization recovery for data systems utilizing burst-error-correcting cyclic codes
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5727068A (en) * 1996-03-01 1998-03-10 Cinema Group, Ltd. Matrix decoding method and apparatus
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7680289B2 (en) * 2003-11-04 2010-03-16 Texas Instruments Incorporated Binaural sound localization using a formant-type cascade of resonators and anti-resonators
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
US20060093164A1 (en) * 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
DE102004053090A1 (de) * 2004-11-03 2006-05-04 Basf Ag Verfahren zur Herstellung von Natriumdithionit
EP1810396A1 (en) 2004-11-05 2007-07-25 Labofa Munch A/S A drive mechanism for elevating and lowering a tabletop
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US8577686B2 (en) * 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
CN101406074B (zh) * 2006-03-24 2012-07-18 杜比国际公司 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
FR2899423A1 (fr) * 2006-03-28 2007-10-05 France Telecom Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme.
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
BR112012026324B1 (pt) * 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
EP4060661B1 (en) * 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006500817A (ja) * 2002-09-23 2006-01-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号の生成
WO2005036925A2 (en) * 2003-10-02 2005-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Compatible multi-channel coding/decoding
WO2006045371A1 (en) * 2004-10-20 2006-05-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Individual channel temporal envelope shaping for binaural cue coding schemes and the like
WO2006048203A1 (en) * 2004-11-02 2006-05-11 Coding Technologies Ab Methods for improved performance of prediction based multi-channel reconstruction

Also Published As

Publication number Publication date
ATE503244T1 (de) 2011-04-15
US10412524B2 (en) 2019-09-10
EP2216776B1 (en) 2014-11-12
MY180689A (en) 2020-12-07
US10097940B2 (en) 2018-10-09
US20180139559A1 (en) 2018-05-17
KR101004834B1 (ko) 2010-12-28
US8027479B2 (en) 2011-09-27
US10412526B2 (en) 2019-09-10
EP2216776A2 (en) 2010-08-11
US20180098170A1 (en) 2018-04-05
US10021502B2 (en) 2018-07-10
US10123146B2 (en) 2018-11-06
MY157026A (en) 2016-04-15
TWI338461B (en) 2011-03-01
US10412525B2 (en) 2019-09-10
US20190110151A1 (en) 2019-04-11
US20180109898A1 (en) 2018-04-19
CN102523552B (zh) 2014-07-30
US20180091914A1 (en) 2018-03-29
US20180098169A1 (en) 2018-04-05
US10863299B2 (en) 2020-12-08
US20170272885A1 (en) 2017-09-21
US8948405B2 (en) 2015-02-03
HK1124156A1 (en) 2009-07-03
TW200803190A (en) 2008-01-01
US20190110150A1 (en) 2019-04-11
US20200021937A1 (en) 2020-01-16
EP2216776A3 (en) 2011-03-23
US20110091046A1 (en) 2011-04-21
US20180109897A1 (en) 2018-04-19
EP2024967B1 (en) 2011-03-23
US20180139558A1 (en) 2018-05-17
US20190116443A1 (en) 2019-04-18
US10085105B2 (en) 2018-09-25
US20230209291A1 (en) 2023-06-29
SI2024967T1 (sl) 2011-11-30
DE602006020936D1 (de) 2011-05-05
WO2007140809A1 (en) 2007-12-13
CN102523552A (zh) 2012-06-27
US10097941B2 (en) 2018-10-09
KR20090007471A (ko) 2009-01-16
EP2024967A1 (en) 2009-02-18
CN101460997A (zh) 2009-06-17
US10091603B2 (en) 2018-10-02
JP2009539283A (ja) 2009-11-12
US10015614B2 (en) 2018-07-03
US9699585B2 (en) 2017-07-04
ES2527918T3 (es) 2015-02-02
US10469972B2 (en) 2019-11-05
US11601773B2 (en) 2023-03-07
CN102547551A (zh) 2012-07-04
US20210195357A1 (en) 2021-06-24
US20070280485A1 (en) 2007-12-06
US9992601B2 (en) 2018-06-05
US20190110149A1 (en) 2019-04-11
US20180132051A1 (en) 2018-05-10
HK1146975A1 (en) 2011-07-22
US20140343954A1 (en) 2014-11-20
CN102547551B (zh) 2014-12-17

Similar Documents

Publication Publication Date Title
JP4834153B2 (ja) 非エネルギー節約型アップミックス・ルールのコンテクストにおけるバイノーラル・マルチチャンネル・デコーダ
JP4606507B2 (ja) 多チャンネル信号のパラメータ表現からの空間ダウンミックスの生成

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101213

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110922

R150 Certificate of patent or registration of utility model

Ref document number: 4834153

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250