JP5222279B2 - マルチチャネルオーディオ再構成における信号整形のための改善された方法 - Google Patents

マルチチャネルオーディオ再構成における信号整形のための改善された方法 Download PDF

Info

Publication number
JP5222279B2
JP5222279B2 JP2009501862A JP2009501862A JP5222279B2 JP 5222279 B2 JP5222279 B2 JP 5222279B2 JP 2009501862 A JP2009501862 A JP 2009501862A JP 2009501862 A JP2009501862 A JP 2009501862A JP 5222279 B2 JP5222279 B2 JP 5222279B2
Authority
JP
Japan
Prior art keywords
channel
signal component
direct signal
downmix
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009501862A
Other languages
English (en)
Other versions
JP2009531724A5 (ja
JP2009531724A (ja
Inventor
サーシャ デッシュ
カルステン リンツマイエル
ユルゲン ヘルレ
ハラルド ポップ
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2009531724A publication Critical patent/JP2009531724A/ja
Publication of JP2009531724A5 publication Critical patent/JP2009531724A5/ja
Application granted granted Critical
Publication of JP5222279B2 publication Critical patent/JP5222279B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2217/00Details of magnetostrictive, piezoelectric, or electrostrictive transducers covered by H04R15/00 or H04R17/00 but not provided for in any of their subgroups
    • H04R2217/03Parametric transducers where sound is generated or captured by the acoustic demodulation of amplitude modulated ultrasonic waves
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

本発明は、マルチチャネルオーディオ再構成における改善された信号整形の概念に関し、特にエンベロープ整形の新たな手法に関する。
オーディオ符号化の近年の発達により、ステレオ(又はモノラル)信号とそれに対応する制御データとに基づくオーディオ信号を、マルチチャネル表現へと再構成することが可能となった。これらの方法は、ドルビープロロジック等のような従前の行列に基づく方法とは基本的に相違する。なぜなら、送信されたモノラル又はステレオチャネルに基づくサラウンドチャネルの再構成を制御するための追加的な制御データが送信されるからである。この再構成はアップミックスとも呼ばれる。このようなパラメトリック・マルチチャネル・オーディオ復号器は、送信されたM個のチャネルと追加的な制御データとに基づいてN個(N>M)のチャネルを再構成する。この追加的な制御データを使用することは、N個の全てのチャネルを送信する場合に比べて非常に低いデータレートをもたらすため、符号化効率を著しく向上させ、同時にM個のチャネルを有する装置とN個のチャネルを有する装置との両方に対して互換性を確立できる。M個のチャネルは、単一のモノラルチャネル表現、ステレオチャネル表現又は5.1チャネル表現のいずれであっても良い。したがって、5.1チャネルの後方互換信号へとダウンミックスされた7.2チャネルの元の信号及び空間オーディオパラメータが空間オーディオ復号器へと入力され、少ない追加的ビットレートオーバヘッドを用いて、元の7.2チャネルにきわめて近いバージョンを再現させることが可能となる。
これらのパラメトリックサラウンド符号化方法は通常、時間及び周波数により変化するILD(チャネル間レベル差)パラメータ及びICC(チャネル間コヒーレンス)パラメータに基づく、サラウンド信号のパラメータ化を含む。これらのパラメータは、例えば元のマルチチャネル信号のチャネルペア間の出力比及び相関関係について記述している。復号化処理においては、受信されたダウンミックスチャネルのエネルギーを、伝送されたILDパラメータの記述に従ってすべてのチャネルペアの間に配分することにより、再現マルチチャネル信号を取得できる。しかし、異なるチャネルにおける信号は極めて異なる一方で、マルチチャネル信号は、すべてのチャネルの間に等しいパワー配分を与えることができる。その結果、非常に広範囲の音を聞いた印象を与えることになるが、正確な音の広さは、信号とその信号のデコリレート(相関分離) バージョンとをICCパラメータの記述に従ってミキシングすることによって取得できる。
信号のデコリレートバージョンは、ウェット信号又は拡散信号と呼ばれることも多く、全帯域通過フィルタなどの残響装置(reverberator)の中に信号を通過させることによって得られる。デコリレート化の簡易な形態は、信号に特定の遅延を加えることである。一般に当業界では様々な残響装置が公知であり、使用される残響装置の正確な実装形態は本件では重要ではない。
デコリレータからの出力は、通常はきわめて平坦である時間応答を有する。したがって、ディラック入力信号は減衰する雑音にバーストアウトを与えることになる。デコリレート信号と元の信号とをミキシングする時には、拍手喝采の信号のようなある種の過渡信号タイプに対しては所定の後処理を施し、追加的に導入されて部屋の大きさを過大に感じさせるようなアーチファクトやプレエコータイプのアーチファクトの知覚認識を回避することが重要である。
一般的に本発明は、マルチチャネルオーディオを、(例えば1又は2チャネルの)オーディオダウンミックスデータと関連するパラメトリックマルチチャネルデータとの組合せとして表すシステムに関する。そのような方式(例えば両耳キューコーディング)においては、オーディオダウンミックスデータストリームが伝送されるが、ダウンミックスの最も簡易な形態は、1つのマルチチャネル信号の中の異なる信号を加算するだけであることが分かるであろう。このような信号(和信号)は、パラメトリックマルチチャネルデータストリーム(サイド情報)を伴う。サイド情報は、例えばマルチチャネル信号の元のチャネルの空間的な相互関係を記述するために、上述の一つ又はそれ以上のパラメータタイプを含む。ある意味では、パラメトリックマルチチャネル方式は、例えば和信号及びサイド情報を有することで、ダウンミックスデータの送信/受信端に対して、前処理/後処理用プロセッサとして機能する。ダウンミックスデータの和信号は、任意のオーディオ又は音声符号器を用いて、さらに符号化されてもよいことに留意するべきである。
近年、低帯域幅搬送波を介したマルチチャネル信号の伝送がますます普及しているため、「空間オーディオ符号化」、「MPEGサラウンド」の名でも公知であるこれらシステムは十分に開発されつつある。
後述の非特許文献1〜11は、これらの技術との関連において公知である。
1つの伝送されたモノラル信号を介した2つのチャネルの伝送に焦点を絞った関連技術は、「パラメトリックステレオ」と呼ばれ、例えば後述の非特許文献12と13においてより広範囲にわたって記述されている。
空間オーディオ復号器において、マルチチャネルアップミックスは、既に述べたように、直接信号部分と、直接信号部分からデコリレート化によって導出される拡散信号部分とから計算される。したがって、一般に拡散信号部分は直接信号部分とは異なる時間エンベロープを有する。「時間エンベロープ」という語は、ここでは時間とともに変化する信号のエネルギー又は振幅の変動を表している。時間エンベロープに差異がある場合、広いステレオ画像と過渡的なエンベロープ構造とを同時に有する入力信号のためのアップミックス信号においては、アーチファクト(プレエコー及びポストエコーと呼ばれる時間的なスミアリング(汚染))をもたらす。過渡信号とは一般に短い時間周期において著しく変動している信号である。
この種の信号に関しておそらく最も重要な例は拍手喝采のような信号であり、ライブ録音において頻繁に存在する。
アップミックス信号の中に不適切な時間エンベロープを有する拡散/デコリレートされる音を導入することによって引き起こされるアーチファクトを回避するために、複数の技術が提案されている。
特許文献1は、直接信号の時間エンベロープに適合させるために、拡散信号の時間エンベロープを整形することによって、臨界過度信号の知覚品質を改善することができることを示している。
この手法は、「時間エンベロープ整形」(TES)及び「時間処理」(TP)などの様々なツールによってMPEGサラウンド技術に既に導入されている。拡散信号の目標の時間エンベロープは、伝送されたダウンミックス信号のエンベロープから導出されるため、この方法は追加的なサイド情報を伝送する必要がない。しかし、結果として、拡散音の時間的な微細構造はすべての出力チャネルに関して同一である。伝送されたダウンミックス信号から直接的に導出される直接信号部分も類似の時間エンベロープを有するため、この方法は「クリスプネス」に関して喝采のような信号の知覚的な品質を改善しうる。しかし、直接信号及び拡散信号はすべてのチャネルに関して類似の時間エンベロープを有するため、このような技術は喝采のような信号の主観的品質を強化しうるが、その信号における単一の喝采のような事象の空間的配分を改善することはできない。なぜなら、この改善は、仮に過渡信号の出現の際に1つの再現チャネルが他のチャネルよりはるかに強烈であった場合にのみ可能となるからであり、実際にはチャネルが基本的に同一の時間エンベロープを共有する信号を持つため、不可能だからである。
この問題を克服するための別の方法は特許文献2によって記述されている。この手法は、直接信号及び拡散信号の両方の微細な時間的整形を行うために、符号器によって伝送されたきめの細かい時間的広帯域サイド情報を利用する。明らかにこの手法は、各出力チャネルにおいて個別の時間的微細構造を可能にする。したがって、過渡事象が出力チャネルの一部にのみ生じる信号にも対応することができる。この手法のさらなる変形が特許文献3に記述されている。過渡的な符号化信号の知覚的な品質を改善するためのこれら両文献に記載の対処法は、拡散信号のエンベロープの時間的整形であって、対応する直接信号の時間エンベロープに適合させるための整形を含む。
前述したの従来技術の両方の方法において、クリスプネスに関して拍手喝采のような信号の主観的品質を改善することができるが、後者の手法のみが再構成信号の空間的な再配分も改善することができる。それでもやはり、合成された喝采の信号の主観的品質は依然として不満足なものとなる。ドライ音と拡散音との組合せを時間的に整形すると、特性の歪みをもたらすためである(個別のクラップ音のアタックは、緩い時間的整形のみが行われる場合には「しまり」がないと認識され、その他の場合にはきわめて高い時間解像度を有する整形が信号に施されて歪みが導入される)。この歪は、拡散信号が直接信号の単なる遅延複製である場合に明白となる。直接信号にミキシングされる拡散信号は、直接信号とは異なるスペクトル組成を有する可能性が高い。したがって、たとえ直接信号のエンベロープに適合させるように拡散信号のエンベロープがスケールされる場合であっても、元の信号に直接的に由来していない異なるスペクトルの寄与が再構成信号に存在することになる。そのため、直接信号のエンベロープに適合させるように拡散信号がスケールされる場合には、再構成中に拡散信号部分が強調される(音量大となる)と、導入される歪みがさらにひどくなる可能性がある。
マルチチャネルの適切な符号化及び復号化に関し、多数の文献が存在する。
特許文献4は、複素指数関数的に変調されたフィルタバンクと適応型時間信号化法とに基づくマルチチャネルオーディオ信号の発展的な処理に関する。入力信号に基づいてデコリレート信号を生成するための合成器は、複数のサブバンド信号に基づいて作動し、各サブバンド信号は少なくとも2つのサブバンドサンプルのシーケンスを含む。この合成器は、残響フィルタを用いて各サブバンド信号をフィルタ処理するフィルタステージを含み、残響処理された複数の信号を取得する。このとき、残響処理された複数の信号は合同して一つのデコリレート信号を表現する。このデコリレート信号は、モノラル信号及びコヒーレンス値から成るパラメトリック符号化されたステレオ信号に基づいて、信号を再構成するために使用される。
非特許文献14は、コヒーレンスのキューを合成する方法に関する。この合成のために、数100msに相当するインパルス応答を持つ遅い残響をモデル化するデコリレートフィルタが使用され、その結果、自然的な音響を備えた拡散音を生成する仕組みが可能となった。
非特許文献15は、FFTフィルタに代えてQMFフィルタバンクを使用することで、パラメトリックステレオ分析及び合成における複雑性をいかに低減できるかについて説明するものである。
特許文献5はBCC符号化に関し、特に符号化の仕組みに関するものである。この符号化においては、入力チャネルの1つあるいは複数のチャネルが、BCC符号器においてダウンミックスされずかつBCC復号器においてアップミックスされない非修正チャネルとして送信される。
米国特許出願第11/006,492号 米国特許出願第11/006,482号 米国特許出願第60/726,389号 国際公開WO2004/097794A2 米国出願公開第2005/00583004A1 C. Faller and F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization,"in Proc. IEEE WASPAA, Mohonk, NY, Oct. 2001. F. Baumgarte and C. Faller, "Estimation of auditory spatial cues for binaural cue coding,"in Proc. ICASSP 2002, Orlando, FL, May 2002. C. Faller and F. Baumgarte, "Binaural cue coding: a novel and efficient representation of spatial audio,"in Proc. ICASSP 2002, Orlando, FL, May 2002. F. Baumgarte and C. Faller, "Why binaural cue coding is better than intensity stereo coding,"in Proc. AES 112th Conv., Munich, Germany, May 2002. C. Faller and F. Baumgarte, "Binaural cue coding applied to stereo and multi-channel audio compression,"in Proc. AES 112th Conv., Munich, Germany, May 2002. F. Baumgarte and C. Faller, "Design and evaluation of binaural cue coding,"in AES 113th Conv., Los Angeles, CA, Oct. 2002. C. Faller and F. Baumgarte, "Binaural cue coding applied to audio compression with flexible rendering,"in Proc. AES 113th Conv., Los Angeles, CA, Oct. 2002. J. Breebaart, J. Herre, C. Faller, J. Roeden, F. Myburg, S. Disch, H. Purnhagen, G. Hoto, M. Neusinger, K. Kjoerling, W. Oomen: "MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status", 119th AES Convention, New York 2005, Preprint 6599 J. Herre, H. Purnhagen, J. Breebaart, C. Faller, S. Disch, K. Kjoerling, E. Schuijers, J. Hilpert, F. Myburg, "The Reference Model Architecture for MPEG Spatial Audio Coding", 118th AES Convention, Barcelona 2005, Preprint 6477 J. Herre, C. Faller, S. Disch, C. Ertel, J. Hilpert, A. Hoelzer, K. Linzmeier, C. Spenger, P. Kroon: "Spatial Audio Coding: Next-Generation Efficient and Compatible Coding of Multi-Channel Audio", 117th AES Convention, San Francisco 2004, Preprint 6186 J. Herre, C. Faller, C. Ertel, J. Hilpert, A Hoelzer, C. Spenger: "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", 116th AES Convention, Berlin 2004, Preprint 6049. J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116th Convention, Berlin, Preprint 6072, May 2004 E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Preprint 6073, May 2004. C. Faller, "Parametoric multi-channel audio coding: synthesis of coherence cues", IEEE transactions on audio, speech and language processing, IEEE service center, N. Y., US, pages 299 to 310, XP007900793, pages 303 to 305, January 2006 OOMEN W et al., "MPEG4-EXT2: CE on low complexity parametric stereo", international standard ISO/IEC, JTC1/SC 29/WG11, December 2003
本発明の目的は、マルチチャネル再構成における改善された信号整形の概念を提供することである。
本目的は、請求項1又は請求項29による装置、請求項28による方法及び請求項30によるコンピュータプログラムによって達成される。
本発明は、以下の知見を基礎とする。即ち、ダウンミックスチャネルに基づいて直接信号成分及び拡散信号成分を生成するための生成手段が用いられる場合には、複数の元のチャネルをダウンミックスすることによって導出される少なくとも1つのダウンミックスチャネルと元のチャネルの時間的(微細)構造に関する追加的な情報を含むパラメータ表現とを使用するマルチチャネル再構成装置によって、再構成出力チャネルが高品質で効率的に再構成可能となる、という知見である。再構成出力チャネルの時間的微細構造が、伝送された追加的な情報により示される所望の時間的微細構造に適合するように、直接信号成分が修正されさえすれば、品質を本質的に向上させることができる。
換言すれば、ダウンミックス信号から直接的に導出される直接信号部分をスケールすることにより、過渡信号が生じる瞬間に追加的なアーチファクトが導入されることを殆どなくすことができる。従来技術のようにウェット信号部分が所望のエンベロープに適合するようにスケールされる場合には、再構成されるチャネルの中の元の過渡信号が、直接信号にミキシングされ強調された拡散信号によってマスキングされることがきわめてよく発生すると考えられ、これについては後で詳細に説明する。
本発明は、この問題を直接信号成分をスケールすることのみで克服する。したがって、時間エンベロープを記述するための追加的なパラメータをサイド情報の中に伝送することに起因して、さらなるアーチファクトが導入されるという機会をなくすことができる。
本発明の一実施形態によれば、エンベロープスケーリングパラメータは、白色化されたスペクトル、すなわち信号の異なるスペクトル部分が略同一のエネルギーを有するスペクトルを用いた直接信号及び拡散信号の表現を使用して導出される。白色化スペクトルを用いることには二重の利点がある。ひとつには、直接信号をスケールするために用いられるスケーリング係数(scaling factor)の計算のための基礎として白色化スペクトルを用いることにより、各時間スロットごとに時間的構造に関する情報を含むパラメータを一つだけ伝送すれば良いことになる。多数の周波数帯域の中で信号が処理されるマルチチャネルオーディオ符号化においては通例であるように、この特徴により、追加的に必要となるサイド情報の数を減少させることができ、その結果、追加的なパラメータの伝送のためのビットレートを増大させることができる。通常、ICLD及びICCなどの他のパラメータは、時間フレーム及びパラメータ帯域ごとに1回伝送される。パラメータ帯域の数が20より多くなる可能性もあるので、各チャネルごとに単一のパラメータを1つだけ伝送すればよいという特徴は大きな利点である。一般に、マルチチャネル符号化において、信号はフレーム構成において処理される。すなわち、複数のサンプリング値、例えば各フレームごとに1024個のサンプリング値を有するまとまりにおいて処理される。さらに、既述したように信号は処理される前に複数のスペクトル部分に分割され、最後に、通常1つのICC及びICLDパラメータが信号の各フレーム及びスペクトル部分ごとに伝送される。
パラメータを1つだけ用いることの第2の利点は、当該の過渡信号が当然ながら広いスペクトルを有することから、物理的に動機付けられる。したがって、単一のチャネル内の過渡信号のエネルギーを正確に考慮するために、エネルギースケーリング係数の計算のために白色化スペクトルを用いることは最適といえる。
本発明のさらなる実施形態において、直接信号成分を修正するという本発明の概念は、さらなる残余信号が存在する場合、所定のスペクトル的限界値を上回る信号のスペクトル部分に関してだけ適用される。なぜなら、残余信号がダウンミックス信号と共に元のチャネルの高品質な再現を可能にするからである。
要約すると、本発明の概念は、従来技術の手法に対して改善された時間的及び空間的品質を提供し、従来技術に関連する問題点を回避するように設計される。つまり、個別のチャネルの微細な時間エンベロープ構造を記述するためにサイド情報が伝送され、その結果、復号器側でアップミックスチャネル信号の微細な時間的/空間的整形を可能にする。本発明に係る方法は、以下の知見/検討事項に基づいている。
・拍手喝采のような信号は、単一の明瞭な近くのクラップ音と濃厚に重なる遠くのクラップ音に由来する雑音のような環境(雰囲気)の部分とから構成されるものと見なすことができる。
・空間オーディオ復号器において、近くのクラップ音の時間エンベロープに関する最適な近似とは直接信号である。したがって、本発明の方法では直接信号だけが処理される。
・拡散信号は主に信号の環境部分を表す。そのため、たとえ喝采の「クリスプネス」において一定の主観的改善が達成される可能性があったとしても、微細な時間解像度においては、いかなる処理も歪み及び変調によるアーチファクトを導入する確率が高い。これらの事項を検討した結果として、本発明の処理においては拡散信号は元のままに置かれる(微細な時間的整形を施さない)。
・しかし、拡散信号はアップミックス信号のエネルギーバランスに寄与してしまう。本発明の方法は、この寄与に対し、直接信号部分にのみ適用されるべき伝送情報から修正された広帯域スケーリング係数を計算することで対処する。この修正された係数は、所定の時間間隔における全体的なエネルギーが一定のまとまりの中では同一であり、あたかも元(修正前)の係数が、この所定の時間間隔において、信号の直接信号部分及び拡散信号部分の両方に適用されたかのごとくになるように、選択される。
・本発明の方法を用いると、空間的キューのスペクトル解像度を低く選択した場合、例えば「全帯域幅」を選択した場合に、信号に包含される過渡信号はスペクトル的に無欠の状態に確保され、最適な主観的オーディオ品質が得られる。この場合には、本発明の方法では空間的解像度が時間的解像度へと安全に交換されるため、必ずしも平均的な空間サイド情報のビットレートを増大させるわけではない。
主観的な品質の改善は、時間軸だけに関して信号のドライ部分を増幅又は減衰(「整形」)し、その結果、
・過渡的な位置における直接信号成分を増強することによって過渡的な品質を強化すると同時に、不適切な時間エンベロープを有する拡散信号に由来するさらなる歪みを回避することになり、
・過渡的な事象の空間起点においては拡散信号部分に比べて直接信号部分を強調し、遠くのパニング(平坦な)位置においては拡散信号部分に比べて直接信号部分を減衰させることによって、空間的な定位を改善することが達成される。
図1は、本発明の概念によって解決される課題をより明確に示すために、従来技術によるマルチチャネルオーディオデータの符号化の一例を示す。
一般に、符号器側では、元のマルチチャネル信号10がマルチチャネル符号器12に入力され、元のマルチチャネル信号の種々のチャネル間の空間的な配分を互いに相対的に表すサイド情報14を導出する。サイド情報14の生成とは別に、マルチチャネル符号器12は、元のマルチチャネル信号からダウンミックスされた一つ又はそれ以上の和信号16を生成する。広く用いられている有名な構成は、いわゆる5−1−5構成及び5−2−5構成である。5−1−5構成においては、符号器は5つの入力チャネルから単一のモノラル音響和信号16を生成し、対応する復号器18は再構成マルチチャネル信号20の5つの再構成チャネルを生成しなければならない。5−2−5構成においては、符号器は5つの入力チャネルから2つのダウンミックスチャネルを生成し、ダウンミックスチャネルの第1のチャネルは通常左側又は右側の一方の情報を持ち、ダウンミックスチャネルの第2のチャネルは他方の側の情報を持つ。
元のチャネルの空間的配分を記述するサンプルパラメータは、例えば図1において、事前に導入されたパラメータICLD及びICCなどである。
サイド情報14を導出する解析の中で、マルチチャネル信号10の元のチャネルのサンプルは通常、元のチャネルの特定の周波数間隔を表すサブバンド領域において処理されることが分かるであろう。単一の周波数間隔はκによって表される。一部の適用例においては、入力チャネルは処理前に混成(ハイブリッド)フィルタバンクによってフィルタリングされてもよい。すなわち、パラメータ帯域κがさらに再分割され、各再分割がkによって表記されてもよい。
さらに、元のチャネルを記述するサンプル値の処理は、各単一のパラメータ帯域内でフレーム毎に行われる。すなわち、複数の連続サンプルが有限持続時間を持つ一つのフレームを形成する。上述した複数のBCCパラメータは、一つの完全なフレームを典型的に記述している。
本発明に何らかの関連があり、既に当業界では公知のパラメータはICLDパラメータである。このパタメータは、元のマルチチャネル又は信号の一つのチャネルの一つの信号フレーム内に含まれたエネルギーを、他のチャネルの対応するフレームに対する相対関係において記述している。
通例、1つの伝送された和信号のみからマルチチャネル信号を再構成するための追加的なチャネルは、デコリレータ又は残響装置を用いて和信号から導出されたデコリレート信号の助けによって生成される。典型的な適用例では、離散サンプル周波数は44.100kHであってもよく、この場合、単一のサンプルが元のチャネルの約0.02msの有限長の間隔を表している。フィルタバンクを用いた場合、信号は多数の信号部分に分割され、それぞれが元の信号の有限の周波数間隔を表すことに留意すべきである。チャネルを記述するパラメータの増加を補うために、通常は時間解像度が低減される。その結果、一つのフィルタバンク領域内の単一のサンプルによって記述される有限長の時間部分が0.5msより大きい値まで増大してもよい。典型的なフレーム長は10〜15msで変化しうる。
デコリレート信号を導出する際には、本発明の範囲を制限することなく、様々なフィルタ構成及び/又は遅延、あるいはその組合せを利用してもよい。デコリレート信号を導出するために、全体的なスペクトルが必ずしも用いられなくてもよい。例えば遅延及び/又はフィルタを用いてデコリレート信号を導出するために、和信号(ダウンミックス信号)のスペクトルの下限(κの特定の値)より高いスペクトル部分のみを用いてもよい。デコリレート信号は一般に、ダウンミックス信号(ダウンミックスチャネル)から導出された信号を表すものであり、その結果、このデコリレート信号とダウンミックスチャネルとを用いて導出される相関係数は、1から有意に、例えば0.2だけずれている。
図1bは、マルチチャネルオーディオ符号化中のダウンミックス及び再構成処理のきわめて簡略化した例を挙げて、マルチチャネル信号のチャネルの再構成中に直接信号成分のみをスケールするという本発明の概念の大きな利点を説明する。以下の説明では、いくつかの簡略化を仮定する。第1の簡略化は、左チャネル及び右チャネルのダウンミックスはチャネル内の振幅の単純な加算であることである。第2の簡略化は、相関関係が信号全体の単純な遅延であると仮定されることである。
これらの仮定の下で、左チャネル21a及び右チャネル21bのフレームが符号化されるものとする。図示するウィンドウのx軸上に示されるように、マルチチャネルオーディオ符号化においては、処理は通常一定のサンプル周波数毎にサンプリングされたサンプル値に対して行われる。この点については、説明の簡略化のために以下の概略説明ではさらには言及しないものとする。
既に述べたように、符号器側では、左チャネル及び右チャネルが結合(ダウンミックス)されてダウンミックスチャネル22となり、復号器に伝送されることになる。復号器側では、デコリレート信号23が、この例では左チャネル21a及び右チャネル21bの和である伝送されたダウンミックスチャネル22から導出される。既に説明したように、左チャネルの再構成は、次にダウンミックスチャネル22及びデコリレート信号23から導出される信号フレームから行われる。
各単一のフレームは、単一のチャネルの個別のフレーム内のエネルギーをマルチチャネル信号の他のチャネルの対応するフレームのエネルギーに関連付けるICLDパラメータによって示されるように、結合前にグローバルスケーリングを受けることが分かるであろう。
本例において、等しいエネルギーが左チャネル21aのフレーム及び右チャネル21bのフレームの中に包含されると仮定されるため、伝送されたダウンミックスチャネル22及びデコリレート信号23は、結合前におよそ0.5を係数としてスケールされる。つまり、アップミキシングがダウンミキシングと同様に単に2つの信号を合計する場合には、元の左チャネル21aの再構成は、スケールされたダウンミックスチャネル24a及びスケールされたデコリレート信号24bの和となる。
伝送のための加算とICLDパラメータによるスケールのために、過渡信号の信号対背景比は、およそ1/2を係数として減少されることになる。さらに、2つの信号を単純に加算する場合には、エコータイプの追加的なアーチファクトが、スケールされたデコリレート信号24bの過渡的構成の遅延された位置に導入される可能性がある。
図1bの中のフレーム24bにおける破線によって示されているように、従来技術では、スケールされた伝送チャネル24aのエンベロープと合致するように、スケールされたデコリレート信号24bの振幅をスケールすることによって、エコーの問題を克服しようと試みている。スケーリングに起因して、元の過渡信号における左チャネル21a内の振幅が増大され得る。しかし、フレーム24bでのスケーリングにおけるデコリレート信号のスペクトル組成は、元の過渡信号のスペクトル組成とは異なる。したがって、信号の全体的な強度が十分に再現されうる場合であっても、可聴アーチファクトが信号に導入される。
本発明の大きな利点は、再構成される直接信号成分をスケールするだけであることである。このチャネルは、正しいスペクトル組成と正しいタイミングとを有する元の過渡信号に対応した信号成分を有するため、ダウンミックスチャネルのみをスケールすることにより、元の過渡事象を高精度で再構成する再構成信号を取得できる。なぜなら、元の過渡信号と同様のスペクトル組成を有する信号部分のみがスケーリングによって強調されるからである。
図2は、本発明の概念の原理を詳述するために、本発明のマルチチャネル再構成装置の一例のブロック図を示す。
図2において、生成器32と直接信号修正器34と結合器36とを有するマルチチャネル再構成装置30を示す。生成器32は、複数の元のチャネルからダウンミックスされたダウンミックスチャネル38と、1つの元のチャネルの時間的構造に関する情報を含むパラメータ表現40とを受信する。
生成器32は、ダウンミックスチャネルに基づき、直接信号成分42及び拡散信号成分44を生成する。
直接信号修正器34は、直接信号成分42のほか、拡散信号成分44を受信し、元のチャネルの時間的構造に関する情報を有するパラメータ表現40をさらに受信する。本発明によれば、直接信号修正器34はパラメータ表現を用いて直接信号成分42のみを修正し、修正された直接信号成分46を導出する。
修正された直接信号成分46と直接信号修正器34によって変更されていない拡散信号成分44とが結合器36に入力され、修正された直接信号成分46及び拡散信号成分44を結合して、再構成された出力チャネル50を得る。
伝送されたダウンミックスチャネル38から残響(デコリレーション)のない状態で導出された直接信号成分42を修正するだけで、従来技術の場合のように追加的なアーチファクト及び可聴歪みを導入することなく、潜在的な元のチャネルの時間エンベロープに密接に合致するような再構成出力チャネルの時間エンベロープを再構成することが可能になる。
図3にさらに詳述されるように、本発明のエンベロープ整形は、合成された出力信号の広帯域エンベロープを復元する。本発明のエンベロープ整形は、修正されたアップミックスの処理を含み、次いで各出力チャネルの直接信号部分のエンベロープ平坦化及び再整形を行う。再整形に関して、パラメータ表現のビットストリームに包含されるパラメトリック広帯域エンベロープサイド情報が用いられる。このサイド情報は、本発明の一実施形態によれば、元の入力チャネル信号のエンベロープに対する伝送されたダウンミックス信号のエンベロープの関連を表す比(envRatio)からなる。復号器においては、ゲイン係数はこれらの比率から導出されて、与えられた出力チャネルのフレームにおける各時間スロット毎に直接信号に適用される。本発明の概念によれば、各チャネルの拡散音部分は変更されない。
図3のブロック図に示される本発明の好ましい実施形態は、MPEG空間復号器の復号器信号の流れに合わせるように修正されたマルチチャネル再構成装置60である。
マルチチャネル再構成装置60は、MPEG符号化の中で用いられたように、複数の元のチャネルのダウンミックスによって導出されたダウンミックスチャネル68及びマルチチャネル信号の元のチャネルの空間特性に関する情報を有するパラメータ表現70を用いて、直接信号成分64及び拡散信号成分66を生成するための生成器62を備える。マルチチャネル再構成装置60は直接信号修正器69をさらに備え、入力として、直接信号成分64、拡散信号成分66、ダウンミックス信号68及び追加的なエンベロープサイド情報72を受信する。
直接信号修正器69は、その修正器出力73において、以下にさらに詳細に記述するように修正された修正直接信号成分を提供する。
結合器74は、修正された直接信号成分及び拡散信号成分を受信して、再構成された出力チャネル76を得る。
図に示されているように、本発明は、既存のマルチチャネル環境において容易に実装されうる。そのような符号化方式の中で、本発明の概念の一般的な適用は、パラメータビットストリームの中で追加的に伝送されたいくつかのパラメータに基づき、オン及びオフを切り替えることが可能である。例えば、1に設定したときに、本発明の概念の利用が必要であることを示す追加的なフラグbsTempShapeEnableを導入することが可能である。
さらに、本発明の概念をチャネルごとに適用する必要性がある場合、特に指定する追加的なフラグを導入することが可能である。したがって、例えばbsEnvShapeChannelと呼ばれる追加的なフラグを用いてもよい。このフラグは、各個別のチャネルに対して利用可能であり、1に設定したときに本発明の概念の使用を指示してもよい。
説明を容易にするため、2チャネルの構成のみが図3に示されていることがさらに分かるであろう。当然のことながら、本発明は2チャネル構成にのみ限定されることを意図しているわけではない。さらに本発明の概念に関連して、任意のチャネル構成を用いてもよい。例えば本発明の高度なエンベロープ整形に関連して、5つ又は7つの入力チャネルを用いてもよい。
本発明の概念が、図3に示されているように、MPEG符号化方式の中で適用され、bsTempShapeEnableを1に設定することにより本発明の概念の適用が信号通知された時、生成器62は、修正されたポストミキシングを使用して、混成(ハイブリッド)サブバンド領域内で、直接信号成分及び拡散信号成分を以下の式に基づいてそれぞれ合成する:
Figure 0005222279
この式及び以下の段落において、ベクトルwn,kは、サブバンド領域のk番目のサブバンドに関するn個の混成サブバンドパラメータのベクトルを記述している。前記式によって示されているように、直接信号パラメータ及び拡散信号パラメータyは、アップミキシングの中で別個に導出される。直接出力は直接信号成分及び残余信号を持ち、残余信号はMPEG符号化においてさらに存在しうる信号である。拡散出力は、拡散信号のみを提供する。本発明の概念によれば、直接信号成分のみが導入されたエンベロープ整形(本発明のエンベロープ整形)によってさらに処理される。
エンベロープ整形処理は、異なる信号のエンベロープ抽出操作を利用する。直接信号修正器69の中で行われているエンベロープ抽出処理は、直接信号成分に対する本発明による修正の適用前に必須の工程であるため、以下の段落においてさらに詳細に説明する。
既に述べたように、混成サブバンド領域の中で、サブバンドはkと表記される。複数のサブバンドkがパラメータ帯域κに体系化されてもよい。
以下に説明される本発明の実施形態の根底にあるパラメータ帯域に対するサブバンドの関係は、図4の表において示される。
まず、1つのフレーム内の各スロットについて、あるパラメータ帯域κのエネルギー
Figure 0005222279
が混成サブバンド入力信号であるyn,kを用いて次式により計算される。
Figure 0005222279
ここで、κstart=10及びκstop=18である。
この合計は、図4によれば、1つのパラメータ帯域κに帰するすべての
Figure 0005222279
を含む。
続いて、各パラメータ帯域について長期間のエネルギー平均
Figure 0005222279
が次式で計算される。
Figure 0005222279
αは第1次のIIRローパス(約400msの時間定数)に対応する重み付け係数であり、nは時間スロットインデックスを示している。平滑化総平均(広帯域)エネルギー
Figure 0005222279
は、次式で計算される。
Figure 0005222279
ここで、
Figure 0005222279
である。
前記式から分かるように、時間エンベロープは、ゲイン係数がチャネルの平滑化表現から導出される前に平滑化される。平滑化とは一般に、減少する勾配を有する元のチャネルから平滑化表現を導出することを意味する。
前記式から分かるように、続いて記述される白色化演算は、時間的に平滑化された総エネルギー推定値及びサブバンドにおける平滑化エネルギー推定値に基づいており、これにより、最終的なエンベロープ推定値のより十分な安定性を確保する。
これらのエネルギー比は、スペクトル白色化演算のための重みを得るために決定される。
Figure 0005222279
広帯域のエンベロープ推定値は、長期間のエネルギー平均を基にして正規化しながら、パラメータ帯域の重み付けされた寄与を合計し、さらに平方根を計算することで得られる。
Figure 0005222279
ここで、
Figure 0005222279
である。βは、第1次のIIRローパス(約40msの時間定数)に対応する重み付け係数である。
スペクトル的に白色化されたエネルギー又は振幅は、スケーリング係数の計算のための基礎として用いられる。前記式から分かるように、スペクトル的な白色化とは、同一のエネルギー又は平均振幅がオーディオチャネルの表現の各スペクトル帯域の中に包含されるように、スペクトルを変更することを意味する。この白色化は、当該の過渡信号が非常に広いスペクトルを持ち、この過渡信号を他の非過渡信号に対して抑制しないようなゲイン係数を計算する上で、利用可能なスペクトル全体に関する全ての情報を用いることが必要であるとき、非常に有利である。換言すれば、スペクトル的に白色化された信号とは、それら信号のスペクトル表現の異なるスペクトル帯域において略等しいエネルギーを有する信号である。
本発明の直接信号修正器は、直接信号成分を修正する。既に述べたように、伝送された残余信号が存在する場合には、開始インデックスから始まる一部のサブバンドインデックスに処理が制限されてもよい。さらに、この処理は一般に閾値インデックスを超えるサブバンドインデックスに制限されてもよい。
エンベロープ整形処理は、各出力チャネルについての直接信号のエンベロープの平坦化と、それに続く目標エンベロープへの再整形とからなる。サイド情報の中で各出力チャネルに関してbsEnvShapeChannel=1が信号通知された時、エンベロープ整形処理により各出力チャネルの直接信号に適用されるゲイン曲線が得られる。
エンベロープ整形処理は、次のような混成サブバンドkのみについて行われる。
k>7
伝送された残余信号が存在する場合には、kは、当該のチャネルのアップミックスに含まれた最も高い残余帯域を超えて始まるように選択される。
前の段落で説明したように、5−1−5構成においては、伝送されたダウンミックスのエンベロープEnvDmxを推定し、続いて、符号器によって伝送及び再量子化されたエンベロープ比envRatiochを用いてその推定値をスケールすることによって、目標エンベロープが得られる。
続いて、各出力チャネルのエンベロープEnvchを推定し、その推定値を目標エンベロープに関連付けることによって、各出力チャネルについて、1つのフレーム内のすべてのスロットにおけるゲイン曲線gch(n)が計算される。最後に、このゲイン曲線はアップミックスチャネルの直接信号部分をスケールするためだけの効果的なゲイン曲線に変換される。
Figure 0005222279
ここで、
Figure 0005222279
である。
5−2−5構成の場合には、L(左前)及びLs(左後)のための目標エンベロープは、左チャネルの伝送されたダウンミックス信号のエンベロープEnvDmxLから導出され、R(右前)及びRs(右後)のためには、右チャネルの伝送されたダウンミックス信号のエンベロープEnvDmxRが用いられる。中央チャネルは、左右の伝送されたダウンミックス信号のエンベロープの和から導出される。
各出力チャネルについてのゲイン曲線は、各出力チャネルのエンベロープEnvL,Ls,C,R,Rsを推定しかつそのエンベロープを目標エンベロープに関連付けることによって計算される。第2のステップにおいて、このゲイン曲線はアップミックスチャネルの直接信号部分をスケールするためだけの効果的なゲイン曲線に変換される。
Figure 0005222279
式中、
Figure 0005222279
である。
すべてのチャネルについて、bsEnvShapeChannel=1である場合、次のエンベロープ調整ゲイン曲線が適用される。
Figure 0005222279
その他の場合には、直接信号は単に複製される。
Figure 0005222279
最後に、各個別のチャネルの修正された直接信号成分は、以下の式に基づき、混成サブバンド領域内の対応する個別のチャネルの拡散信号成分と結合されなければならない。
Figure 0005222279
前記の段落から分かるように、本発明の概念は、空間オーディオ復号器における拍手喝采のような信号の知覚的な品質及び空間的配分を改善することを教示している。この改善は、空間アップミックス信号の直接信号部分だけをスケールするために、時間的にきめの細かい微細なスケーリングを用いてゲイン係数を導出することによって達成される。これらのゲイン係数は、伝送されたサイド情報と符号器における直接信号及び拡散信号のレベル又はエネルギー値とから本質的に導出される。
上述の例は特に振幅値に基づく計算について記述しているが、本発明の方法はこれに制限される訳ではなく、例えばエネルギー値等のような信号の時間エンベロープを記述するのに適した他の数値を用いた計算も可能である。
上述の例は5−1−5チャネル構成及び5−2−5チャネル構成に関する計算を記述している。当然のことながら、前記で概略を述べた原理は、例えば7−2−7チャネル構成及び7−5−7チャネル構成についても同様に適用可能である。
図5は本発明のマルチチャネルオーディオ復号器100の例を示しており、1つの元のマルチチャネル信号の複数のチャネルをダウンミックスすることで導出されたダウンミックスチャネル102と、元のマルチチャネル信号の元のチャネル(左前、右前、左後及び右後)の時間的構造に関する情報を含むパラメータ表現104を受信する。マルチチャネル復号器100は、ダウンミックスチャネル102の根底にある元のチャネルのそれぞれに関して直接信号成分及び拡散信号成分を生成するための生成器106を有している。マルチチャネル復号器100は、再構成されるべき各チャネルのために4つの本発明の直接信号修正器108a〜108dをさらに備え、マルチチャネル復号器がその出力112で4つの出力チャネル(左前、右前、左後及び右後)を出力するようになっている。
本発明のマルチチャネル復号器を再構成される4つの元のチャネルの構成例を用いて詳述してきたが、本発明の概念は任意の数のチャネルを有するマルチチャネルオーディオ方式において実施されてもよい。
図6は、再構成出力チャネルを生成する本発明の方法を詳述するブロック図を示す。
生成ステップ110において、直接信号成分及び拡散信号成分がダウンミックスチャネルから導出される。修正ステップ112において、直接信号成分が1つの元のチャネルの時間的構造に関する情報を含むパラメータ表現のパラメータを用いて修正される。
結合ステップ114において、修正された直接信号成分及び拡散信号成分が結合されて再構成出力チャネルを得る。
本発明の方法は、所定の実施要件に応じて、ハードウェア又はソフトウェアで実施することができる。この実施は、その中に格納される電子的に読出し可能な制御信号を有し、本発明の方法が実行されるようにプログラム可能なコンピュータシステムと協働するディジタル記憶媒体、特にディスク、DVD又はCDを用いて実行できる。したがって、一般に本発明は機械読出し可能なキャリアに格納されたプログラムコードを有するコンピュータプログラム製品であり、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに、本発明の方法を実行するように動作する。したがって、換言すれば、本発明の方法は、コンピュータプログラムがコンピュータ上で実行されるときに、本発明の方法の少なくとも1つを実行するためのプログラムコードを有するコンピュータプログラムである。
前掲の内容は、その特定の実施形態を参照して具体的に図示して記述してきたが、本発明の趣旨及び範囲を逸脱することなく、形態及び詳細における種々の他の変更を行ってもよいことは当業者によって理解されよう。種々の変更は、本願明細書に開示され、以下の請求項によって理解されるより広汎な概念を逸脱することなく、異なる実施形態に適合されてもよい。
マルチチャネル符号器及び対応する復号器のブロック図である。 デコリレートされた信号を用いた信号再構成の概略図である。 本発明のマルチチャネル再構成装置の一例を示す図である。 本発明のマルチチャネル再構成装置のさらなる例を示す図である。 マルチチャネル復号方式の中で異なるパラメータ帯域を識別するために用いられるパラメータ帯域表現の一例を示す図である。 本発明のマルチチャネル復号器の一例を示す図である。 出力チャネルを再構成する本発明の方法の一例を詳細に示すブロック図である。
符号の説明
30 マルチチャネル再構成装置
32 生成器
34 直接信号修正器
36 結合器
38 ダウンミックスチャネル
40 時間的構造に関する情報を有するパラメータ
42 直接信号
44 拡散信号
46 修正された直接信号
50 再構成された出力チャネル
60 マルチチャネル再構成装置
62 空間復号器
64 直接信号
66 拡散信号
68 ダウンミックス
69 直接信号修正器
70 空間サイド情報
72 エンベロープサイド情報
74 直接信号及び拡散信号のミキシング、合成フィルタバンク
76 アップミックス

Claims (30)

  1. 複数の元のチャネルをダウンミックスすることにより導出された少なくとも1つのダウンミックスチャネル(38;68)と、元のチャネルの時間的構造に関する情報を含むパラメータ表現(40;72)とを用いて、再構成出力チャネル(50;76)を生成するためのマルチチャネル再構成装置(30;60)であって、
    前記ダウンミックスチャネル(38;68)に基づいて、前記再構成出力チャネル(50;76)のための直接信号成分(42;64)と拡散信号成分(44;66)とを生成する生成手段(32;62)であって、前記直接信号成分は前記ダウンミックスチャネルからデコリレートされずに導出されたものであり、前記拡散信号成分は前記ダウンミックスチャネルからデコリレーションにより導出されたものである、生成手段と、
    前記拡散信号成分は修正せずに、前記パラメータ表現(40;72)の元のチャネルの時間的構造に関する情報を用いて前記直接信号成分(42;64)を修正するための直接信号修正手段(34;69)と、
    前記修正された直接信号成分(46)と前記拡散信号成分(44;66)とを結合して前記再構成出力チャネル(50;76)を得るための結合手段(36;74)と、を備えるマルチチャネル再構成装置。
  2. 前記生成手段(32;62)は前記ダウンミックスチャネル(38;68)の成分のみを用いて前記直接信号成分(42;64)を生成する請求項1に記載のマルチチャネル再構成装置。
  3. 前記生成手段(32;62)は、前記ダウンミックスチャネル(38;68)のフィルタリングされた部分及び/又は遅延された部分を用いて、前記拡散信号成分(44;66)を生成する請求項1又は2に記載のマルチチャネル再構成装置。
  4. 前記直接信号修正手段(34;69)は、前記元のチャネルの有限長の時間部分において前記元のチャネルに含まれたエネルギーを示す前記元のチャネルの時間的構造に関する情報を使用する、請求項1〜3のいずれかに記載のマルチチャネル再構成装置。
  5. 前記直接信号修正手段(34;69)は、前記元のチャネルの有限長の時間部分における前記元のチャネルの平均振幅を示す前記元のチャネルの時間的構造に関する情報を使用する、請求項1〜3のいずれかに記載のマルチチャネル再構成装置。
  6. 前記結合手段(36;74)は、前記修正された直接信号成分(46)と前記拡散信号成分(44;66)とを加算して前記再構成出力チャネルを得る、請求項1〜5のいずれかに記載のマルチチャネル再構成装置。
  7. 前記複数の元のチャネルの左側の情報を有する第1のダウンミックスチャネルと前記複数の元のチャネルの右側の情報を有する第2のダウンミックスチャネルとを使用し、前記第1のダウンミックスチャネルから生成された直接信号成分及び拡散信号成分だけを用いて左側に関する第1の再構成出力チャネルを結合し、前記第2のダウンミックス信号から生成された直接信号成分及び拡散信号成分だけを用いて右側に関する第2の再構成出力チャネルを結合する、請求項1〜6のいずれかに記載のマルチチャネル再構成装置。
  8. 前記直接信号修正手段(34;69)は、前記パラメータ表現(40;72)内の追加的なパラメトリック情報のフレーム時間部分より短い有限長の時間部分についての前記直接信号を修正し、前記追加的なパラメトリック情報は、前記直接信号成分及び前記拡散信号成分を生成するための前記生成手段(32;62)によって使用される、請求項1〜7のいずれかに記載のマルチチャネル再構成装置。
  9. 前記生成手段(32;62)は、前記複数の元のチャネルの他のチャネルに対する一つの元のチャネルのエネルギーに関する情報を有する追加的なパラメトリック情報を使用する、請求項8に記載のマルチチャネル再構成装置。
  10. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)の時間的構造と元のチャネルの時間的構造とを関連させるように元のチャネルの時間的構造に関する情報を使用する、請求項1〜9のいずれかに記載のマルチチャネル再構成装置。
  11. 前記元のチャネルの時間的構造に関する情報及び前記ダウンミックスチャネルの時間的構造に関する情報は、エネルギー又は振幅を含む請求項1〜10のいずれかに記載のマルチチャネル再構成装置。
  12. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)の時間的構造に関するダウンミックス時間的情報をさらに導出する、請求項1〜11のいずれかに記載のマルチチャネル再構成装置。
  13. 前記直接信号修正手段(34;69)は、有限長の時間間隔内の前記ダウンミックスチャネル(38;68)に含まれたエネルギー又は前記有限長の時間間隔における振幅を表すダウンミックス時間的情報を導出する、請求項12に記載のマルチチャネル再構成装置。
  14. 前記直接信号修正手段(34;69)は、前記ダウンミックス時間的情報及び前記元のチャネルの時間的構造に関する情報を用いて、再構成される前記ダウンミックスチャネル(38;68)のための目標の時間的構造をさらに導出する、請求項12又は13に記載のマルチチャネル再構成装置。
  15. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)の所定のスペクトル下限より高いスペクトル部分に関する前記ダウンミックス時間的情報を導出する、請求項12〜14のいずれかに記載のマルチチャネル再構成装置。
  16. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)をさらにスペクトル的に白色化し、当該スペクトル的に白色化されたダウンミックスチャネル(38;68)を用いて前記ダウンミックス時間的情報をさらに導出する、請求項12〜15のいずれかに記載のマルチチャネル再構成装置。
  17. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)の平滑化表現をさらに導出し、前記ダウンミックスチャネルの前記平滑化表現から前記ダウンミックス時間的情報をさらに導出する、請求項12〜16のいずれかに記載のマルチチャネル再構成装置。
  18. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)を第1次ローパスフィルタによってフィルタリングすることにより前記平滑化表現を導出する、請求項17に記載のマルチチャネル再構成装置。
  19. 前記直接信号修正手段(34;69)は、前記直接信号成分及び前記拡散信号成分の結合の時間的構造に関する情報をさらに導出する、請求項1〜18のいずれかに記載のマルチチャネル再構成装置。
  20. 前記直接信号修正手段(34;69)は、前記直接信号成分及び前記拡散信号成分の結合をスペクトル的に白色化し、当該スペクトル的に白色化された直接信号成分及び拡散信号成分を用いて、前記直接信号成分及び前記拡散信号成分の結合の時間的構造に関する情報を導出する、請求項19に記載のマルチチャネル再構成装置。
  21. 前記直接信号修正手段(34;69)は、前記直接信号成分及び前記拡散信号成分の結合の平滑化表現を導出し、当該直接信号成分及び拡散信号成分の結合の平滑化表現から前記直接信号成分及び前記拡散信号成分の結合の時間的構造に関する情報を導出する、請求項19又は20に記載のマルチチャネル再構成装置。
  22. 前記直接信号修正手段(34;69)は、第1次ローパスフィルタを用いて前記直接信号成分及び前記拡散信号成分をフィルタリングすることによって、前記直接信号成分及び前記拡散信号成分の結合の平滑化表現を導出する、請求項21に記載のマルチチャネル再構成装置。
  23. 前記直接信号修正手段(34;69)は、前記元のチャネルの有限長の時間間隔におけるエネルギー又は振幅と、前記ダウンミックスチャネル(38;68)の前記有限長の時間間隔におけるエネルギー又は振幅との比率を表す前記元のチャネルの時間的構造に関する情報を用いる、請求項1〜22のいずれかに記載のマルチチャネル再構成装置。
  24. 前記直接信号修正手段(34;69)は、前記ダウンミックスチャネル(38;68)及び前記時間的構造に関する情報を用いて、前記再構成出力チャネル(50;76)のための目標の時間的構造を導出する、請求項1〜23のいずれかに記載のマルチチャネル再構成装置。
  25. 前記直接信号修正手段(34;69)は、前記再構成出力チャネル(50;76)の時間的構造が許容範囲内で前記目標の時間的構造に等しくなるように前記直接信号成分を修正する、請求項24に記載のマルチチャネル再構成装置。
  26. 前記直接信号修正手段(34;69)は中間スケーリング係数を導出し、当該中間スケーリング係数によってスケールされた前記直接信号成分と前記拡散信号成分とを用いて前記再構成出力チャネル(50;76)が結合されるとき、前記再構成出力チャネル(50;76)の前記時間的構造が許容範囲内で前記目標の時間的構造に等しくなるように、前記中間スケーリング係数を導出する、請求項24に記載のマルチチャネル再構成装置。
  27. 前記直接信号修正手段(34;69)は、前記中間スケーリング係数と前記直接信号成分及び前記拡散信号成分とを用いて最終スケーリング係数をさらに導出し、当該最終スケーリング係数によってスケールされた前記直接信号成分と前記拡散信号成分とを用いて前記再構成出力チャネル(50;76)が結合されるとき、前記再構成出力チャネル(50;76)の時間的構造が許容範囲内で前記目標の時間的構造に等しくなるように、前記最終スケーリング係数を導出する、請求項26に記載のマルチチャネル再構成装置。
  28. 複数の元のチャネルをダウンミックスすることにより導出された少なくとも1つのダウンミックスチャネル(38;68)と、元のチャネルの時間的構造に関する情報を含むパラメータ表現(40;72)とを用いて、再構成出力チャネル(50;76)を生成するための方法であって、
    前記ダウンミックスチャネル(38;68)に基づいて、前記再構成出力チャネル(50;76)のための直接信号成分と拡散信号成分とを生成するステップであって、前記直接信号成分は前記ダウンミックスチャネルからデコリレートされずに導出されたものであり、前記拡散信号成分は前記ダウンミックスチャネルからデコリレーションにより導出されたものである、ステップと、
    前記拡散信号成分は修正せずに、前記パラメータ表現(40;72)の元のチャネルの時間的構造に関する情報を用いて前記直接信号成分を修正するステップと、
    前記修正された直接信号成分(46)と前記拡散信号成分(44;66)とを結合して前記再構成出力チャネル(50;76)を得るステップと、を備える方法。
  29. 複数の元のチャネルをダウンミックスすることにより導出された少なくとも1つのダウンミックスチャネル(38;68)と、元のチャネルの時間的構造に関する情報を含むパラメータ表現(40;72)とを用いて、マルチチャネル信号を再構成するためのマルチチャネルオーディオ復号器であって、請求項1〜27のいずれかに記載のマルチチャネル再構成装置を備えるマルチチャネルオーディオ復号器。
  30. コンピュータに請求項28に記載の方法を実行させるためのコンピュータプログラム。
JP2009501862A 2006-03-28 2006-05-18 マルチチャネルオーディオ再構成における信号整形のための改善された方法 Active JP5222279B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US78709606P 2006-03-28 2006-03-28
US60/787,096 2006-03-28
PCT/EP2006/004732 WO2007110101A1 (en) 2006-03-28 2006-05-18 Enhanced method for signal shaping in multi-channel audio reconstruction

Publications (3)

Publication Number Publication Date
JP2009531724A JP2009531724A (ja) 2009-09-03
JP2009531724A5 JP2009531724A5 (ja) 2011-12-08
JP5222279B2 true JP5222279B2 (ja) 2013-06-26

Family

ID=36649469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009501862A Active JP5222279B2 (ja) 2006-03-28 2006-05-18 マルチチャネルオーディオ再構成における信号整形のための改善された方法

Country Status (21)

Country Link
US (1) US8116459B2 (ja)
EP (1) EP1999997B1 (ja)
JP (1) JP5222279B2 (ja)
KR (1) KR101001835B1 (ja)
CN (1) CN101406073B (ja)
AT (1) ATE505912T1 (ja)
AU (1) AU2006340728B2 (ja)
BR (1) BRPI0621499B1 (ja)
CA (1) CA2646961C (ja)
DE (1) DE602006021347D1 (ja)
ES (1) ES2362920T3 (ja)
HK (1) HK1120699A1 (ja)
IL (1) IL194064A (ja)
MX (1) MX2008012324A (ja)
MY (1) MY143234A (ja)
NO (1) NO339914B1 (ja)
PL (1) PL1999997T3 (ja)
RU (1) RU2393646C1 (ja)
TW (1) TWI314024B (ja)
WO (1) WO2007110101A1 (ja)
ZA (1) ZA200809187B (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP5173811B2 (ja) 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
JP4787331B2 (ja) * 2006-01-19 2011-10-05 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
CA2637722C (en) * 2006-02-07 2012-06-05 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
AU2006340728B2 (en) 2006-03-28 2010-08-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction
EP2071564A4 (en) * 2006-09-29 2009-09-02 Lg Electronics Inc METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US8600532B2 (en) * 2007-12-09 2013-12-03 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN101662688B (zh) * 2008-08-13 2012-10-03 韩国电子通信研究院 音频信号的编码和解码方法及其装置
WO2010028784A1 (en) * 2008-09-11 2010-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
CN102246543B (zh) * 2008-12-11 2014-06-18 弗兰霍菲尔运输应用研究公司 产生多信道音频信号的装置
JP5932337B2 (ja) * 2008-12-22 2016-06-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 遠隔端通話者信号と複合信号との間の音響カップリングの特定
JP5678048B2 (ja) * 2009-06-24 2015-02-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ カスケード化されたオーディオオブジェクト処理ステージを用いたオーディオ信号デコーダ、オーディオ信号を復号化する方法、およびコンピュータプログラム
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
ES2605248T3 (es) * 2010-02-24 2017-03-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para generar señal de mezcla descendente mejorada, método para generar señal de mezcla descendente mejorada y programa de ordenador
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
RU2580084C2 (ru) * 2010-08-25 2016-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для генерирования декоррелированного сигнала, используя переданную фазовую информацию
EP2612321B1 (en) * 2010-09-28 2016-01-06 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
US8675881B2 (en) * 2010-10-21 2014-03-18 Bose Corporation Estimation of synthetic audio prototypes
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
WO2012158705A1 (en) * 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
EP2724555B1 (en) * 2011-06-24 2015-04-22 Koninklijke Philips N.V. Audio signal processor for processing encoded multi-channel audio signals and method therefor
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
KR101775086B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
KR101729930B1 (ko) 2013-02-14 2017-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
EP3008726B1 (en) 2013-06-10 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
BR112015030672B1 (pt) * 2013-06-10 2021-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V aparelho e método de codificação, processamento e decodificação de envelope de sinal de áudio por divisão do envelope de sinal de áudio empregando codificação e quantização de distribuição
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830046A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal to obtain modified output signals
EP3022949B1 (en) * 2013-07-22 2017-10-18 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP3053359B1 (en) 2013-10-03 2017-08-30 Dolby Laboratories Licensing Corporation Adaptive diffuse signal generation in an upmixer
EP3074970B1 (en) 2013-10-21 2018-02-21 Dolby International AB Audio encoder and decoder
KR102486365B1 (ko) 2013-10-21 2023-01-09 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
BR112017006325B1 (pt) * 2014-10-02 2023-12-26 Dolby International Ab Método de decodificação e decodificador para o realce de diálogo
JP6603414B2 (ja) 2016-02-17 2019-11-06 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 過渡処理を高めるためのポストプロセッサ、プレプロセッサ、オーディオ符号器、オーディオ復号器、及び関連する方法
EP3335218B1 (en) * 2016-03-16 2019-06-05 Huawei Technologies Co., Ltd. An audio signal processing apparatus and method for processing an input audio signal
CN110998722B (zh) 2017-07-03 2023-11-10 杜比国际公司 低复杂性密集瞬态事件检测和译码
CN110246508B (zh) * 2019-06-14 2021-08-31 腾讯音乐娱乐科技(深圳)有限公司 一种信号调制方法、装置和存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4217276C1 (ja) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5794180A (en) 1996-04-30 1998-08-11 Texas Instruments Incorporated Signal quantizer wherein average level replaces subframe steady-state levels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
TWI497485B (zh) * 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
CN102163429B (zh) * 2005-04-15 2013-04-10 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
AU2006340728B2 (en) 2006-03-28 2010-08-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Enhanced method for signal shaping in multi-channel audio reconstruction

Also Published As

Publication number Publication date
WO2007110101A1 (en) 2007-10-04
NO20084409L (no) 2008-10-21
ES2362920T3 (es) 2011-07-15
DE602006021347D1 (de) 2011-05-26
TWI314024B (en) 2009-08-21
ZA200809187B (en) 2009-11-25
ATE505912T1 (de) 2011-04-15
IL194064A (en) 2014-08-31
MY143234A (en) 2011-04-15
PL1999997T3 (pl) 2011-09-30
US20070236858A1 (en) 2007-10-11
MX2008012324A (es) 2008-10-10
JP2009531724A (ja) 2009-09-03
NO339914B1 (no) 2017-02-13
BRPI0621499B1 (pt) 2022-04-12
CA2646961A1 (en) 2007-10-04
AU2006340728A1 (en) 2007-10-04
CA2646961C (en) 2013-09-03
HK1120699A1 (en) 2009-04-03
EP1999997A1 (en) 2008-12-10
KR20080107446A (ko) 2008-12-10
RU2393646C1 (ru) 2010-06-27
US8116459B2 (en) 2012-02-14
KR101001835B1 (ko) 2010-12-15
TW200738037A (en) 2007-10-01
CN101406073B (zh) 2013-01-09
RU2008142565A (ru) 2010-05-10
CN101406073A (zh) 2009-04-08
BRPI0621499A2 (pt) 2011-12-13
EP1999997B1 (en) 2011-04-13
AU2006340728B2 (en) 2010-08-19

Similar Documents

Publication Publication Date Title
JP5222279B2 (ja) マルチチャネルオーディオ再構成における信号整形のための改善された方法
CA2582485C (en) Individual channel shaping for bcc schemes and the like
AU2005324210C1 (en) Compact side information for parametric coding of spatial audio
JP4909272B2 (ja) 空間オーディオコーディングにおける複数チャンネルデコリレーション
JP4625084B2 (ja) バイノーラルキュー符号化方法等のための拡散音の整形
EP1934973B1 (en) Temporal and spatial shaping of multi-channel audio signals
JP4712799B2 (ja) マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法
US8019350B2 (en) Audio coding using de-correlated signals
JP5511136B2 (ja) マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法
TWI396188B (zh) 依聆聽事件之函數控制空間音訊編碼參數的技術
WO2013120531A1 (en) Parametric encoder for encoding a multi-channel audio signal
KR102482162B1 (ko) 오디오 인코더 및 디코더

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110920

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110928

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20111024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130308

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5222279

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250