JP2008516290A - 非相関信号を用いた音声符号化 - Google Patents

非相関信号を用いた音声符号化 Download PDF

Info

Publication number
JP2008516290A
JP2008516290A JP2007536127A JP2007536127A JP2008516290A JP 2008516290 A JP2008516290 A JP 2008516290A JP 2007536127 A JP2007536127 A JP 2007536127A JP 2007536127 A JP2007536127 A JP 2007536127A JP 2008516290 A JP2008516290 A JP 2008516290A
Authority
JP
Japan
Prior art keywords
signal
channel
uncorrelated
channels
decorrelation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007536127A
Other languages
English (en)
Other versions
JP4598830B2 (ja
Inventor
ハイコ プルンハーゲン
ヨナス エングデガルド
イェルーン ブレーバールト
エリク スフエイエルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008516290A publication Critical patent/JP2008516290A/ja
Application granted granted Critical
Publication of JP4598830B2 publication Critical patent/JP4598830B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

元のマルチチャネル信号から導出されたダウンミックスされた信号と、ダウンミックス信号から非相関信号セットを導出する非相関器(101)によって生成された非相関信号セットとを用いて、再生されたチャネルが、互いに少なくとも部分的に非相関となるように、少なくとも3つのチャネルを有するマルチチャネル信号を再生することが可能である。非相関信号セット内の非相関信号が互いに、相互にほぼ直交する。すなわち、チャネル対間の直交性の関係が、直交性許容範囲内で満たされる。
【選択図】図1

Description

本発明は、空間パラメータを用いたマルチチャネル音声信号の符号化に関し、特に、非相関信号を生成して用いるための新規の向上した概念に関する。
近年、マルチチャネル音声再生技術がますます重要になっている。5チャネル以上の別々の音声チャネルを有するマルチチャネル音声信号を効率的に伝送する点に関して、ステレオ信号またはマルチチャネル信号を圧縮する方法がいくつか開発されている。マルチチャネル音声信号のパラメトリック符号化に関する最近のアプローチ(パラメトリックステレオ(PS)、“バイノーラルキュー符号化”(BCC)等)は、(モノラルチャネルまたはいくつかのチャネルからなる)ダウンミキシング信号およびパラメトリックサイド情報により、マルチチャネル音声信号を表している。これは、“空間キュー”とも呼ばれ、その知覚空間サウンドステージを特徴付けるものである。
一般に、マルチチャネル符号化装置は入力として少なくとも2つのチャネルを入力して、1つ以上のキャリアチャネルとパラメトリックデータとを出力する。デコーダで元のマルチチャネル信号の近似値を算出できるように、パラメトリックデータが導出される。通常、キャリアチャネル(複数のチャネル)は、サブバンドサンプル、スペクトル係数、時間領域サンプル等を含み、基礎となる信号の比較的よい表現を提供するが、パラメトリックデータはこのようなスペクトル係数のサンプルは含んでおらず、その代わりに、特定の再生アルゴリズムを制御する制御パラメータを含んでいる。このような再生は、乗算、時間シフティング、周波数シフティング、位相シフティング等による重み付けを含むこともできる。従って、パラメトリックデータは、信号または対応付けられたチャネルの比較的粗い表現だけが含まれる。
バイノーラルキュー符号化(BCC)技術は、多数の刊行物に記載されている。例えば、“ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化(Binaural cuecoding applied to stereo and multi‐channel audio compression)”、C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)、(2002年5月、AES変換論文誌5574、ミュンヘン)、“バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)”(2ICASSP刊行物)、および“バイノーラルキュー符号化:空間音声の正常で効率的な表現(Binaural cue coding: a normal and efficient representation of spatial audio)”C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)2002年5月フロリダ州オーランド。
BCC符号化では、重なりウィンドウを用いた変換に基づくDFT(離散フーリエ変換)を用いて、多数の音声入力チャネルがスペクトル表現に変換される。次に、得られた均一なスペクトルは、重複しない部分にそれぞれ分割される。各部分は、等価の矩形帯域幅(ERB)に正比例する帯域幅を有している。次に、ICLD(チャネル間レベル差)およびICTD(チャネル間時間差)と呼ばれる空間パラメータが、各部分に対して推定される。ICLDパラメータは2つのチャネル間のレベル差を記述し、ICTDパラメータは、異なるチャネルの2つの信号の間の時間差(位相シフト)を記述する。通常、基準チャネルに対して、レベル差および時間差が各チャネルに与えられる。これらのパラメータを導出した後で、パラメータが量子化されて、最後に送信するために符号化される。
ICLDパラメータおよびICTDパラメータは、最も重要な音源ローカリゼーションパラメータを表しているが、さらにパラメータを導入することにより、これらのパラメータを用いて空間表現を向上させることができる。
“パラメトリックステレオ”と呼ぶ関連技術は、送信したモノラル信号とともにパラメータサイド情報に基づいて、2チャネルステレオ信号のパラメトリック符号化について記載する。これに関連して、チャネル間強度差(IID)、チャネル間位相差(IPD)、およびチャネル間コヒーレンス(ICC)と呼ぶ3種類の空間パラメータが取り入れられている。コヒーレンスパラメータ(相関パラメータ)を用いて空間パラメータセットを拡張することは、知覚空間の“拡散”またはサウンドステージの空間の“まとまり具合”をパラメータ化することが可能にする。パラメトリックステレオは、次の文献により詳細に記載されている。“ステレオ音声のパラメトリック符号化(Parametric coding of stereo audio)”、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、およびE.シュイエールス(Schuijers)、(符号応用紀要(EURASIPJ.Appl.Sign.Proc.)2005年9月、1305−1322頁)”、“低ビットレートでの高品質パラメトリック空間音声符号化(High‐Quality Parametric Spatial Audio Coding at Low Bit rates)”、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、E.シュイエールス(Schuijers)、(2004年5月、AES第116回大会、ベルリン、予稿集6072)、および“低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)”、E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、(2004年5月、AES第116回大会、ベルリン、予稿集6073)。
本発明は、音声信号の空間特性について、パラメトリック符号化を行うことに関する。パラメトリックマルチチャネル音声デコーダは、送信されたM個のチャネルに基づいて、N個のチャネルを再生する。N>Mで、さらに制御データが存在する。さらにある制御データは、N個のチャネルを全て送信することよりも、非常に低いデータ速度を表す。この符号化を非常に効率的なものにしながら、少なくともM個のチャネル装置とN個のチャネル装置とをともに用いて、同時に、互換性を実現する。空間特性を記述するために典型的に用いられるパラメータは、チャネル間強度差(IID)、チャネル間時間差(ITD)、およびチャネル間コヒーレンス(ICC)である。これらのパラメータに基づいて空間特性を再生するために、ICパラメータによれば、2つ以上のチャネル間の相関を正確なレベルで再生することができる方法が必要である。これは、非相関の手段により達成される。すなわち、非相関信号を送信された信号から導出して、あるアップミキシング処理内で、非相関信号を送信された信号と合成する方法である。送信された信号、非相関信号、およびIID/ICCパラメータに基づくアップミキシングを行う方法は、上記を参照して述べられる。
非相関信号を生成するのに利用できる方法がいくつかある。好ましくは、非相関信号は、元の入力信号として、同様の、または等しい時間エンベロープおよびスペクトルエンベロープを有している。理想的には、オールパス周波数応答を用いた線形時間不変(LTI)関数が望ましい。このことを達成する明らかな方法の1つは、定遅延を用いる方法である。しかしながら、遅延、または任意の他のLTIオールパス関数を用いることは、処理していない信号を付加した後の非オールパス応答になる。遅延を行う場合は、結果は、典型的なくし形フィルタになる。ステレオ拡張効果を効率的なものにできるとしたとしても、くし形フィルタは、元のサウンドの自然さが相当低下した不要の“金属”音を与えることがよくある。品質や相互非相関を維持しているものの、定遅延方法や他の従来技術方法では、2つ以上の非相関信号を生成することができない。
従って、再生したマルチチャネル音声信号の知覚品質は、送信された信号から非相関信号を生成することが可能な、効率的な概念に大きく依存する。理想的には、非相関信号はそれを導出した信号と直交する。すなわち、完全な非相関である。完全な非相関信号を利用できるとすると、個々のチャネルが相互に非相関であるマルチチャネルアップミックスを、1つの非相関信号を用いて導出することができない。アップミキシング中に、送信された信号を生成された非相関信号と合成することにより、再生された音声チャネルが生成されるが、非相関信号と送信された信号との合成を行う程度は、典型的には、送信された空間音声パラメータ(ICC)により制御される。再生された音声チャネルはそれぞれ同じ非相関信号部分を有しているので、従って、相互に完全な非相関信号を得ることができない。
C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)、"ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化(Binaural cuecoding applied to stereo and multi‐channel audio compression)"、(2002年5月、AES変換論文誌5574、ミュンヘン) C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)、"バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)"(2ICASSP刊行物)、2002年5月フロリダ州オーランド C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)、"バイノーラルキュー符号化:空間音声の正常で効率的な表現(Binaural cue coding: a normal and efficient representation of spatial audio)"2002年5月フロリダ州オーランド A.コーラウシュ(Kohlrausch)、およびE.シュイエールス(Schuijers)、"ステレオ音声のパラメトリック符号化(Parametric coding of stereo audio)"、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、(符号応用紀要(EURASIPJ.Appl.Sign.Proc.)2005年9月、1305−1322頁)" J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、E.シュイエールス(Schuijers)、"低ビットレートでの高品質パラメトリック空間音声符号化(High‐Quality Parametric Spatial Audio Coding at Low Bit rates)"、(2004年5月、AES第116回大会、ベルリン、予稿集6072) E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、"低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)"、(2004年5月、AES第116回大会、ベルリン、予稿集6073)
本発明の目的は、非相関性が高い信号を生成する、より効率的な概念を提供することである。
この目的は、請求項1に記載の装置または請求項15に記載の方法により、達成される。
本発明は、元のマルチチャネル信号から導出したダウンミックスされた信号と、ダウンミックス信号から非相関信号セットを導出する非相関器により生成された非相関信号セットとを用いて、再生されたチャネルが少なくとも部分的に互いに非相関であるように、少なくとも3つのチャネルを有するマルチチャネル信号を再生することができるという知見に基づく。非相関信号セット内の非相関信号は、互いに相互におおよそ直交する。すなわち、チャネル対の間の直交性の関係は、直交性許容範囲内で満たされる。
例えば、直交性許容範囲を、2つの信号間の相関の度合を定量化する相互相関係数から導出することができる。1の相互相関係数は、完全な相関を意味する。すなわち、2つの全く同質の信号を意味する。他方、0の相互相関係数は、信号の完全非相関または直交性を意味する。従って、直交性許容範囲を、0からある決まった上限の範囲の相関係数値の間隔として定義することもできる。
従って、本発明は、インパルス特性および知覚音声品質を維持しながら、1つ以上の直交する信号を効率的に生成する課題に関し、この解決方法を提供する。
本発明の一実施の形態では、IIR格子フィルタは、ノイズシーケンスから導出されたフィルタ係数を有する非相関器として実施され、フィルタリングは、複素数値または実数フィルタバンク内で実行される。
本発明の一実施の形態では、マルチチャネル信号を構成する方法は、格子IIRフィルタ群を用いて、いくつかの直交する信号またはほぼ直交する信号を生成する方法を含む。
本発明の別の実施の形態では、いくつかの直交する信号を生成する方法が、知覚的に動機付けられるように、直交性または直交性の近似値を得るフィルタ係数を選択する方法を有する。
本発明の別の実施の形態では、格子IIRフィルタ群が、マルチチャネル信号の再生を行う間に、複素数値のフィルタバンク内で用いられる。
本発明の別の実施の形態では、空間デコーダ内の格子構造に基づいて、1つ以上のオールパスIIRフィルタを用いることにより、1つ以上の直交するまたはほぼ直交する信号を生成する方法が実施される。
本発明の別の実施の形態では、IIRフィルタリングに用いるフィルタ係数がランダムノイズシーケンスに基づいている、上述の実施の形態が実施される。
本発明の別の実施の形態では、時間遅延が、用いられるフィルタにさらに加算される。
本発明の別の実施の形態では、フィルタバンク領域内でフィルタリング処理が行われる。
本発明の別の実施の形態では、複素数値のフィルタバンク内でフィルタリング処理が行われる。
本発明の別の実施の形態では、出力信号のセットを形成するためにフィルタリングにより生成された直交する信号が混合される。
本発明の別の実施の形態では、送信された制御データに基づいて直交する信号の混合を行ったり、本発明のデコーダに供給したりする。
本発明の別の実施の形態では、本発明のデコーダまたは本発明の復号化方法は、少なくとも2つの生成された出力信号の所望の相互相関を示す、少なくとも1つのパラメータを含む制御データを用いる。
本発明の別の実施の形態では、本発明の概念を用いて、4つの非相関信号を導出することにより、送信されたモノラル信号から5.1チャネルサラウンド信号のアップミックスが行われる。次に、いくつかの混合規則によれば、出力5.1チャネル信号を形成するために、モノラルダウンミックスされた信号および4つの非相関信号は、ともに混合される。従って、信号がアップミックスに用いられるので、相互に非相関の出力信号を生成する可能性を提供する。すなわち、本発明の生成に起因して、送信されたモノラル信号および4つの生成された非相関信号がほぼ非相関となる。
本発明の別の実施の形態では、2つの個々のチャネルが、5.1チャネル信号のダウンミックスとして送信される。1つの実施例では、ほぼ完全な非相関となるアップミックスの基礎として、4つのチャネルを生成するために、本発明の概念を用いて、2つの相互に非相関信号がさらに導出される。上述の実施の形態変形例では、次のアップミキシングに利用できる別の非相関信号を生成するために、第3の非相関信号が算出され、他の2つの非相関信号と混合される。個々のチャネル、例えば、5.1サラウンド信号のセンターチャネルについて、知覚品質をさらに向上させる。
本発明の別の実施の形態では、導出に先だって、本発明の概念を用いて、モノラルの送信されたチャネルから5つの音声チャネルは、アップミックスされる。続いて、4つの非相関信号を、5つの上述のアップミックスされたチャネルのうちの4つのチャネルと合成して、相互にほぼ非相関の5つの出力音声チャネルを生成することができる。
本発明の別の実施の形態では、フィルタリングに基づいて、本発明のIIRフィルタを適用する前または後に、音声信号の遅延が行われる。この遅延は、生成された信号の非相関性をさらに向上させ、そして、生成された非相関信号を元のダウンミックスされた信号と混ぜるとき、カラー化(カラーライゼーション)を低減する。
本発明の別の実施の形態では、フィルタバンク(複合変更)のサブバンド領域内で、非相関信号の生成が行われる。非相関信号を導出するフィルタバンクのある決まったフィルタバンクインデックスを用いて、非相関器が用いられるフィルタ係数が導出される。
本発明の別の実施の形態では、音声信号の格子IIRオールパスフィルタリングを行う格子IIRフィルタを用いて、非相関信号が導出される。格子IIRフィルタを用いることは、大きな利点がある。適切な非相関信号を生成するのに好ましい、このようなフィルタの応答が指数関数的に減衰することは、このようなフィルタの固有の特性である。また、非相関信号の生成に用いられるフィルタに所望の長い減衰パルス応答を持たせることは、格子フィルタ構造を用いることにより、メモリが効率的で、計算上効率的な(複雑さが低い)やり方で達成することができる。
前述の実施の形態の変形例では、ノイズシーケンスから導出されたフィルタ係数を供給する手段により、用いられるフィルタ係数(反射係数)が与えられる。この変形例では、サブバンドのサブバンドインデックスに基づいて、反射係数が個別に算出される。非相関信号を導出するために、格子フィルタが用いられる。
本発明の一実施の形態では、フィルタされた信号と変更していない入力信号とが、出力信号セットを形成するために、混合行列Dにより合成される。混合行列Dは、出力信号の相互相関とともに、各出力信号のエネルギーを定義する。好ましくは、混合行列Dのエントリ(重み)は時間可変で、送信された制御データに依存する。好ましくは、制御パラメータは、特定の出力信号および/またはある決まった相互相関パラメータの間の(所望の)レベル差を含む。
本発明の別の実施の形態では、本発明の音声デコーダは、再生した信号の知覚品質を向上させるために、音声受信装置または再生装置に組み込まれる。
次に、以下の図面を参照して、本発明の好適な実施の形態について説明する。
図1は、本発明の音声復号化概念を示すブロック図である。
図2は、本発明の概念を実現しない従来技術のデコーダを示す。
図3は、本発明による5.1マルチチャネル音声デコーダを示す。
図4は、本発明による別の5.1チャネル音声デコーダを示す。
図5は、別の本発明の音声デコーダを示す。
図6は、本発明のマルチチャネル音声デコーダの別の実施の形態を示す。
図7は、非相関信号の生成を概略で示す。
図8は、非相関信号の生成に用いる格子IIRフィルタを示す。
図9は、本発明の音声デコーダを有する受信装置または音声再生装置を示す。
図10は、本発明の音声デコーダを有する受信装置または再生装置を用いた伝送を示す。
以下に説明する実施の形態は、直交する信号を生成する向上した方法である、本発明の原理を単に説明するためのものである。ここに説明する構成および詳細の変形、変更について、当業者には明らかであろう。従って、ここに記載して説明する実施の形態で表される特定の詳細ではなく、本発明の特許請求の範囲によってのみ限定されるものである。
図1は、パラメトリックステレオまたはマルチチャネルシステムに用いられる信号の非相関をとる本発明の装置を示す。本発明の装置は、入力信号102から導出された複数の直交する非相関信号を生成する手段101を含む。生成手段は、格子IIR構造に基づく非相関フィルタのアレイ(配列)とすることができる。入力信号102(x)は、例えば、複合QMFバンクから得られた時間領域信号または1つのサブバンド領域信号とすることができる。手段101が出力する信号y1〜ynはすべて、得られる相互に直交する非相関信号またはほぼ直交する非相関信号である。
空間イメージの知覚的幅広さを再生するために、2つ以上のチャネル間のコヒーレンスを低減するようにパラメトリックステレオまたはパラメトリックマルチチャネルシステムの空間特性を再生することが重要なので、マルチチャネル信号の最終的なアップミックスを生成するために、得られる非相関信号を用いることができる。出力チャネルに対して、元の信号(x)のフィルタされたバージョン(h1(x))を付加することにより、このことを行うことができる。従って、N個の異なるフィルタを用いてN個の信号間のコヒーレンスを低減することは、以下に基づいて行うことができる。

y1=a*x+b*h1(x)
y2=a*x+b*h2(x)
...
yn=a*x+b*hn(x)

xは元の信号で、y1〜ynは得られる出力信号で、aおよびbはコヒーレンス量を制御する利得係数で、h1〜hnは異なる非相関フィルタである。より一般的には、入力信号xとフィルタhn(j=1...N)でフィルタされた入力信号xとの一次結合として、出力信号yi(i=1...I)の式を立てることができる。
Figure 2008516290
ここで、混合行列Dにより、出力信号yiの相互相関と出力レベルとを求める。
音色の変化を防ぐために、好ましくは、問題になっているフィルタにオールパス特性を持たせる必要がある。うまくいっているアプローチの1つでは人工的な反響処理に用いられるものと同様の、オールパスフィルタを用いている。通常、人工的な反響アルゴリズムは、満足のいく時間的な拡散であるインパルス応答を生成するために、高時間分解能を必要とする。このようなオールパスフィルタを設計する方法の1つでは、ランダムノイズシーケンスをインパルス応答として用いている。次に、このフィルタを、FIRフィルタとして容易に実施することができる。フィルタされた出力間の独立性を十分な度合で得るために、FIRフィルタのインパルス応答を比較的長くする必要があるので、たたみこみを行うために十分な量の計算を行う手間がかかる。オールパスIIRフィルタは、この目的に好適なものである。非相関フィルタを設計する場合に、IIR構造には利点を持っている。

a)すべての自然な反響に共通する自然な指数関数的減衰は、非相関フィルタに望ましい。これは、IIRフィルタの固有の特性である。
b)IIRフィルタのインパルス応答の減衰を長くするには、対応するFIRフィルタは一般に、複雑さの点でより高価であり、より費用がかかる。
しかしながら、任意のランダムノイズシーケンスが係数ベクトルとして適格であるFIRの場合よりも、IIRオールパスフィルタを設計する方が容易である。複数の非相関フィルタを対象とする場合の設計上の制約条件は、各フィルタ出力の直交する出力(すなわち、相互に基本的に低い相関に追従するフィルタインパルス応答)を形成しながら、すべてのフィルタに対して同じ減衰特性を維持する機能についても必要である。基本的な要件として、安定性を得る必要がある。
本発明は、格子IIRフィルタ構造の手段により、複数の直交するオールパスフィルタを生成するために新規の方法を示すものである。このアプローチは、いくつかの利点を持っている。

a)(インパルス応答に必要な長さについて考える場合、)FIRフィルタよりも複雑でないこと。
b)すべての反射係数の大きさの絶対値が1よりも小さい場合は、安定性制約条件を容易に満たすことができ、これが自動的に得られる。
c)ランダムノイズシーケンスに基づいて、同じ減衰特性を用いてさらに容易に複数の直交するオールパスフィルタを設計することができる。
d)ワード長の作用が有限であることに起因する量子化誤差に対して非常に耐性がある。
格子IIRフィルタの反射係数はランダムノイズシーケンスに基づくことができるが、十分な直交性および他の重要な特性を得るために、性能をさらに良くするには、これらの係数を、より複雑なやり方で分類したり、ランダムでない方法で処理したりすることも必要である。直接的な方法は、多数のランダム反射係数ベクトルを生成して、共通の減衰エンベロープ等の、ある基準に基づいてある決まったセットを選択して、選択されたセット等の、すべての相互インパルス応答相関を最小化する。
具体的には、ランダムノイズシーケンスの大きなセットから開始しても良い。オールパスセクションで、これらのシーケンスそれぞれが反射係数として用いられる。続いて、得られるオールパスセクションのインパルス応答は、各ランダムノイズシーケンスに対して算出される。最後に、相互に非相関インパルス応答を与えるこれらのノイズシーケンスを選択する。
非相関アルゴリズムが複素数値のQMFバンク等の(複合)フィルタバンクに基づく際に、大きな利点がある。このフィルタバンクは、例えば、等化、減衰時間、インパルス密度および音色について、非相関器の特性を周波数で選択することが可能となる柔軟性を提供する。オールパス特性を維持しながら、これらの特性の多くを変更することができることに留意されたい。このような格子IIRフィルタの設計指針となる聴覚による認識に関する知見は、多くある。重要な側面は、インパルス応答の減衰エンベロープの長さおよび形状である。また、非相関信号を元の信号と混合する場合にどのような種類のくし形フィルタ特性が得られるかという大きな影響として、オプションとして周波数依存の、さらに前もって遅延を行う必要があることは重要である。十分なインパルス密度を得るには、好ましくは、格子フィルタの反射係数に基づくノイズが、異なるフィルタバンクチャネルに対して異なっている必要がある。さらに良いインパルス密度を得るために、フィルタバンク内で部分遅延近似値を用いることができる。
図2は、1つの非相関信号を用いて次のパラメトリックステレオボックスにより、送信されたモノラルダウンミックス信号に対してマルチチャネル信号を導出するために、階層型復号化構造を示す。従来技術アプローチについて簡単に考察すると、本発明により解決される課題に対する動機となる。図2に示す1対3チャネルデコーダ110は、非相関器112、第1のパラメトリックステレオアップミキサ114および第2のパラメトリックステレオアップミキサ116を備える。
モノラル入力信号118が、非相関信号120を導出するために、非相関器112に入力される。1つの非相関信号が、1つだけ導出される。第1のパラメトリックステレオアップミキサは、入力としてモノラルダウンミックス信号118と非相関信号120とを受信する。第1のアップミキサ114は、チャネルの混合を制御する相関パラメータ126を用いて、モノラルダウンミキシング信号118と非相関信号120とを混合することにより、センターチャネル122と合成チャネル124とを導出する。
次に、合成チャネル124が第2のパラメトリックステレオアップミキサ116に入力されて、音声デコーダの第2の階層レベルを構築する。第2のパラメトリックステレオアップミキサ116は、入力として非相関信号120をさらに受信して、合成チャネル124と非相関信号120とを混合することにより、左チャネル128と右チャネル130とを導出する。
非相関器112がモノラルダウンミックス信号118と完全に直交する非相関信号を導出できる場合は、大抵の場合、合成チャネル124と完全な非相関となるセンターチャネル122を生成することが可能である。各アップミックスされたチャネルが非相関信号120またはモノラルダウンミキシング信号118のいずれかから生成される信号成分を主として有することを表すアップミックスを、制御情報126が示す場合は、ほぼ完全非相関が得られる。しかしながら、次に、同じ非相関信号120が、左チャネル128および右チャネル130を導出するために用いられるので、これが、センターチャネル122と、チャネル128または130の一方との間の残りの相関になることが明らかである。
モノラルダウンミックス信号と完全に直交すると考えられる非相関信号120から、完全に非相関である左チャネル128と右チャネル130とを導出するというような極端な場合について考察する場合に、このことがさらによく明らかになる。合成チャネル124がモノラルダウンミックスチャネル118についてだけ情報を有している場合に、左チャネル128と右チャネル130との間で完全非相関を得ることができる。このことは同時に、センターチャネル122が主として非相関信号112を含むことを意味している。従って、非相関左チャネル128および右チャネル130は、一方のチャネルが主に非相関信号120に関する情報を含んでいて、もう一方のチャネルが主にモノラルダウンミキシング信号118と全く同じ合成信号124を含んでいることを意味している。従って、左チャネルまたは右チャネルが完全非相関となる唯一の方法により、センターチャネル122とチャネル128または130のいずれかとの間が強制的にほぼ完全な相関となる。
これは、異なっていて、かつ相互に直交する非相関信号を生成する本発明の概念を適用することにより、一番望ましくない特性を正常に回避することができる。
図3は、前非相関器行列401、非相関器402および混合行列403を備える本発明のマルチチャネル音声デコーダ400の一実施の形態を示す。本発明のデコーダ400は、5つの音声チャネルおよび低周波数拡張チャネルを、モノラルダウンミキシング信号405と、ICCパラメータまたはICLDパラメータ等のその他の空間制御データから導出した、1対5構成を示している。これらは、図3の原理的な概略図には示していない。モノラルダウンミキシング信号405は、前非相関器行列401に入力される。前非相関器行列401は、4つの本発明の非相関器h1〜h4を備える非相関器402への入力となる4つの中間信号406を導出する。これらは、非相関器402の出力で、4つの相互に直交する非相関信号408に適用される。
混合行列403は、入力として、4つの相互に直交する非相関信号408とともに前非相関器行列401によりモノラルダウンミックス信号405から導出したダウンミキシング信号410を受信する。
混合行列403は、モノラル信号410と4つの非相関信号408とを合成して、左フロントチャネル414aと、左サラウンドチャネル414bと、右フロントチャネル414cと、右サラウンドチャネル414dと、センターチャネル414eと、低周波数拡張チャネル414fとを含む5.1出力信号412を生成する。
4つの相互に直交する非相関信号408を生成することにより、少なくとも部分的に非相関である5.1チャネル信号の5つのチャネルを生成する機能が得られることは重要であると留意されたい。本発明の好適な実施の形態では、これらはチャネル414a〜414eである。低周波数拡張チャネル414fは、すべてのサラウンドチャネル414a〜414eに対して1つの低周波数チャネルを合成した、マルチチャネル信号の低周波数部分を含んでいる。
図4は、2つの送信された信号から5.1チャネルサラウンド信号を導出するための、本発明の2対5デコーダを示す。
マルチチャネル音声デコーダ500は、前非相関器行列501、非相関器502および混合行列503を備える。2対5構成では、2つの送信されたチャネルである505aおよび505bは、前非相関器行列に入力されて、オプションとして、ICCパラメータおよびICLDパラメータ等の制御データをさらに用いて、中間左チャネル506a、中間右チャネル506bおよび中間センターチャネル506cおよび2つの中間チャネル506dを、送信されたチャネル505aおよび505bから導出する。
中間チャネル506dは、非相関器502への入力として用いられて、2つの相互に直交する非相関信号、またはほぼ直交する非相関信号を導出して、中間左チャネル506a、中間右チャネル506bおよび中間センターチャネル506cとともに混合行列503に入力する。
混合行列503は、最終的な5.1チャネル音声信号508を前述の信号から導出する。1対5マルチチャネル音声デコーダ400が導出したチャネルについてすでに述べたように、最後に導出した音声チャネルは同じ有利な特性を有している。
図5は、マルチチャネル音声デコーダ400および500の機能を組み合わせた本発明の別の実施の形態を示す。マルチチャネル音声デコーダ600は、前非相関行列601、非相関器602および混合行列603を備える。マルチチャネル音声デコーダ600は、入力信号605が前非相関器601に入力する構成に基づいて、異なるモードで動作可能な順応性のある装置である。一般に、前非相関器は、入力パラメータ608を生成するために、一部を送信されて変更された非相関器602の入力として作用する中間信号607を導出する。入力パラメータ608は混合行列603に入力するパラメータで、入力チャネル構成に基づいて、混合行列603が出力チャネル構成610aまたは610bを導出する。
1対5構成において、ダウンミックス信号およびオプションの残留信号は、前非相関器行列に供給されて、4つの中間信号(e1〜e4)を導出して、非相関器の入力として用いて、4つの非相関信号(d1〜d4)を導出して、入力信号から導出した、直接送信された信号mとともに入力パラメータ608を構成する。
残留信号が、さらに入力として供給される場合は、一般にサブバンド領域で動作する非相関器602を、非相関信号を導出する代わりに残留信号を転送するように動作させても良いことに留意されたい。また、特定の周波数帯域だけを選択するようにしてもよい。
2対5構成では、入力信号605は、左チャネル、右チャネル、およびオプションとして残留信号を含む。この構成では、前非相関器行列が、左チャネル、右チャネル、センターチャネル、さらに2つの中間チャネル(e1、e2)を導出する。従って、混合行列603への入力パラメータは、左チャネル、右チャネル、センターチャネル、および2つの非相関信号(d1およびd2)で構成される。別の変形例では、前非相関器行列がさらに非相関器(D5)への入力として用いられる中間信号(e5)を導出して、その出力を信号(e5)から導出された非相関信号(d5)と、非相関信号(d1およびd2)とを合成したものとしてもよい。この場合は、センターチャネルと、左右のチャネルとの間でさらに非相関が確実に行われる。
図6は、アップミキシング処理を行った後で、非相関信号が、個々の音声チャネルと合成される、本発明の別の実施の形態を示す。この別の実施の形態では、モノラル音声チャネル620は、アップミキサ624によりアップミックスされる。このアップミキシングを、別の制御データ622により制御することもできる。アップミックスチャネル630は、互いに相関して、共通にドライチャネルと呼ぶ、5つの音声チャネルを含む。4つのドライチャネル630を非相関の相互に直交する信号と合成することにより、最終的なチャネル632を導出することができる。その結果、互いに少なくとも部分的に非相関である5つのチャネルを生成することができる。図3に関して、このことを混合行列の特殊な例として理解できる。
図7は、非相関信号を生成する本発明の非相関器700を示すブロック図である。非相関器700は、前遅延装置702および非相関装置704を備える。
入力信号706は、所定の時間信号706を遅延するために、前遅延装置702に入力される。前遅延装置702からの出力は、非相関器700の出力として非相関信号708を導出するために、非相関装置704に接続される。
本発明の好適な実施の形態では、非相関装置704は格子IIRオールパスフィルタを備える。非相関器700のオプションの変形例では、フィルタ係数710の供給装置の手段によりフィルタ係数(反射係数)は、非相関装置704に入力される。本発明の非相関器700がフィルタリングサブバンド内で(例えば、QMFフィルタバンク内で)動作する場合は、現在処理されたサブバンド信号のサブバンドインデックスを、非相関装置704にさらに入力しても良い。この場合、本発明をさらに変更した例では、供給されたサブバンドインデックスに基づいて、非相関装置704の異なるフィルタ係数を適用したり、算出したりしても良い。
図8は、非相関信号を生成するために好適に用いられる格子IIRフィルタを示す。
図8に示すIIRフィルタ800は、音声信号802を入力として受信して、入力信号の非相関バージョンを出力804として導出する。IIR格子フィルタを用いる大きな利点は、余分なコストをかけない適切な非相関信号を導出するために必要な指数関数的に減衰するインパルス応答のことである。というのは、これが、格子IIRフィルタの固有の特性であるからである。必要とされるフィルタの安定性を得るには、絶対値が1より小さいフィルタ係数k(0)〜k(M−1)を有する必要があることに留意されたい。また、複数の非相関信号を1つの入力信号から導出する本発明の概念の大きな利点である格子IIRフィルタに基づいて、複数の直交するオールパスフィルタをさらに容易に設計することができる。異なる導出された非相関信号は、互いにほぼ完全な非相関をとるか、または直交している。
オールパス格子フィルタの設計および特性について、次の文献により詳細に記載されている。“適応フィルタ理論(Adaptive Filter Theory)”、シモン・ヘイキン(Simon Haykin)、2002年プレンティスホール社(PrenticeHall)ISBN 0−13−090126−1。
図9は、本発明の音声デコーダ902、ビットストリーム入力904、および音声出力906を有する本発明の受信装置または音声再生装置900を示す。
ビットストリームを、本発明の受信装置/音声再生装置900の入力904に入力することができる。次に、ビットストリームが、デコーダ902により復号化され、復号化された信号が、本発明の受信装置/音声再生装置900の出力906で出力されたり、再生されたりする。
図10は、送信装置908および本発明の受信装置900を備える伝送システムを示す。
送信装置908の入力インターフェース910での音声信号は、符号化され、送信装置908の出力から受信装置900の入力904に送信される。受信装置が、音声信号を復号化して、その出力906で音声信号を再生したり、出力したりする。
本発明は、空間パラメータを用いて、音声信号のマルチチャネル表現を符号化することに関する。本発明は、出力チャネル間のコヒーレンスを低減するために、信号の非相関のための新規の方法を教示するものである。複数の非相関信号を生成する新規の概念は、本発明の音声デコーダで非常に有利なものであるが、本発明の概念を、このような信号を効率的に生成する必要がある、任意の他の技術分野に用いることもできることは、いうまでもない。
本発明では、1つのアップミキシング工程でアップミキシングを行うマルチチャネル音声デコーダについて詳細に説明してきたが、もちろん、本発明を、例えば、図2に示すような階層型復号化構造に基づく音声デコーダに組み込むこともできる。
上記の実施の形態では、1つのダウンミックス信号から非相関信号を導出することについて主に説明しているが、二以上の音声チャネルを、非相関器または前非相関行列の入力として用いることもできることはいうまでもない。すなわち、ダウンミックス信号が二以上のダウンミックスされた音声チャネルを含んでいる。
また、格子フィルタのフィルタ次数に制限がなく、信号そのセット内の他の信号に直交する、または主に直交する非相関信号を導出する新規のセットのフィルタ係数を求めることが可能なので、1つの入力信号から導出された非相関信号の数には基本的に制限はない。
本発明の方法の特定の実施要件によるが、本発明の方法を、ハードウェアまたはソフトウェアで実施することができる。本発明の方法を実行するプログラム可能コンピュータシステムと協働する、デジタル記憶媒体、特に、電気的に読み取り可能な制御信号を格納されたディスクまたはCDを用いることにより、実施することができる。一般に、本発明は、機械読み取り可能キャリアに格納したプログラムコードを有するコンピュータプログラム製品である。コンピュータプログラム製品をコンピュータ上で実行する場合は、プログラムコードは、本発明の方法を実行する。換言すれば、従って、本発明の方法は、コンピュータプログラムをコンピュータ上で実行する場合は、少なくとも1つの本発明の方法を実行するプログラムコードを有するコンピュータプログラムである。
前述のように、特定の実施の形態を参照して特に図示して説明してきたが、本発明の精神、範囲を逸脱することなく、形態や詳細を様々変更することができることが、当業者ならば理解できるであろう。ここに開示するより広い概念から逸脱することなく、異なる実施の形態に適用して、変更が可能なことが、以下の特許請求の範囲から理解できるであろう。
本発明の音声復号化概念を示すブロック図である。 本発明の概念を実現しない従来技術のデコーダを示す。 本発明による5.1マルチチャネル音声デコーダを示す。 本発明による別の5.1チャネル音声デコーダを示す。 別の本発明の音声デコーダを示す。 本発明のマルチチャネル音声デコーダの別の実施の形態を示す。 非相関信号の生成を概略で示す。 非相関信号の生成に用いる格子IIRフィルタを示す。 本発明の音声デコーダを有する受信装置または音声再生装置を示す。 本発明の音声デコーダを有する受信装置または再生装置を用いた伝送を示す。

Claims (20)

  1. 元々のマルチチャネル信号から導出されたダウンミックス信号(405;505a、b;605;620)を用いて、マルチチャネル信号(412;508;610a;610b;630)の再生を生成するためのマルチチャネルデコーダ(400;500;600)であって、
    少なくとも3つのチャネルを有する前記マルチチャネル信号(412;508;610a;610b;630)の再生を行い、
    非相関規則は、前記ダウンミックス信号を用いて導出された第1の非相関信号および第2の非相関信号であり、そして、前記第1の非相関信号および前記第2の非相関信号が直交性許容範囲内で互いに直交するものであり、前記非相関規則を用いて、非相関信号のセットを導出するための非相関器(402;502;602;700)と、
    前記少なくとも3つのチャネルが互いに少なくとも部分的に非相関となるように、前記ダウンミックス信号(405;505a、b;605;620)と、前記第1の非相関信号および前記第2の非相関信号と、アップミックス情報とを用いて、出力チャネルを生成する出力チャネル算出装置(403;503;603)とを備えるデコーダ。
  2. 0の直交性値が完全な直交性を示し、1の直交性値が完全な相関を示す場合に、前記直交性許容範囲が0.5より小さい直交性値を含むような前記非相関規則である、請求項1に記載のマルチチャネルデコーダ(400;500;600)。
  3. 前記復号化規則は、前記第1のおよび第2の非相関信号を導出することが、IIRフィルタの手段により、前記ダウンミックス信号(405;505a、b;605;620)から抽出された音声チャネル(406;506;607)のフィルタリングを含むというものである、請求項1または請求項2に記載のマルチチャネルデコーダ(400;500;600)。
  4. 前記IIRフィルタは、オールパスフィルタ特性を有する格子構造に基づく格子フィルタ(704;800)である、請求項3に記載のマルチチャネルデコーダ(400;500;600)。
  5. 前記IIRフィルタ(800)が、
    前記音声チャネルの実際の部分と、第1の重み付け係数で重み付けした前記音声チャネルの前の部分とを加算する前記フィルタの順方向予測経路内の第1の加算器と、
    前記音声チャネルの前記前の部分を、前記音声信号の第2の重み付け係数で重み付けした前記実際の部分に加算する逆方向予測経路内の第2の加算器とを備え、
    前記第1の重み付け係数および前記第2の重み付け係数の前記絶対値が等しい、請求項3または請求項4に記載のマルチチャネルデコーダ(400;500;600)。
  6. 前記IIRフィルタ(704;800)が、ランダムノイズシーケンスから導出された第1の重み付け係数および第2の重み付け係数を用いるために動作する、請求項5に記載のマルチチャネルデコーダ(400;500;600)。
  7. 前記非相関規則は、前記ダウンミックス信号(405;505a、b;605;620)の時間遅延されたバージョンを用いて導出された前記第1の非相関信号および前記第2の非相関信号である、請求項1ないし請求項6のいずれかに記載の、マルチチャネルデコーダ(400;500;600)。
  8. 前記復号化規則は、実数または複素数値のフィルタバンクによって前記ダウンミックス信号(405;505a、b;605;620)から導出された前記ダウンミックス信号の一部を用いて、導出された前記第1の非相関信号および前記第2の非相関信号というものである、請求項1ないし請求項7のいずれかに記載の、マルチチャネルデコーダ(400;500;600)。
  9. 導出規則を用いて、前記ダウンミックス信号(405;505a、b;605;620)から前記音声チャネルを導出するためのチャネル分解装置(401;501;601)をさらに備える、請求項3ないし請求項7のいずれかに記載のマルチチャネルデコーダ(400;500;600)。
  10. 前記導出規則は、前記ダウンミックス信号が、1つの元のチャネルに関する情報を有し、前記ダウンミックス信号(405;505a、b;605;620)から導出された4つのチャネルである、請求項9に記載のマルチチャネルデコーダ(400;500;600)。
  11. 前記導出規則は、前記ダウンミックス信号が、2つの元のチャネルに関する情報を有し、前記ダウンミックス信号(405;505a、b;605;620)から導出された2つのチャネルである、請求項9に記載のマルチチャネルデコーダ(400;500;600)。
  12. 前記出力チャネル算出装置が、1つの音声チャネルに関する情報を有するダウンミックス信号(405;505a、b;605;620)と、4つの非相関信号とから5つの出力チャネルを生成するために動作する、請求項1ないし請求項11のいずれかに記載のマルチチャネルデコーダ(400;500;600)。
  13. 前記出力チャネル算出装置が、2つの音声チャネルに関する情報を有する前記ダウンミックス信号(405;505a、b;605;620)と、2つの非相関信号とから5つの出力チャネルを生成するために動作する、請求項1ないし請求項11のいずれかに記載のマルチチャネルデコーダ(400;500;600)。
  14. 前記出力チャネル算出装置(403;503;603)が、第1の出力チャネルおよび第2の出力チャネルの所望の相関を示すパラメータを少なくとも1つ含むアップミックスされた情報を用いるために動作する、請求項1ないし請求項13のいずれかに記載の、マルチチャネルデコーダ(400;500;600)。
  15. 少なくとも3つのチャネルを有するマルチチャネル信号の再生を行い、元のマルチチャネル信号から導出さえたダウンミックス信号を用いてマルチチャネル信号を生成する方法であって、
    非相関規則は、前記ダウンミックス信号を用いて導出された前記第1の非相関信号および前記第2の非相関信号であり、そして、前記第1の非相関信号および前記第2の非相関信号が直交性許容範囲で互いに直交するものであり、前記非相関規則を用いて、非相関信号のセットを導出するステップと、
    前記少なくとも3つのチャネルが互いに少なくとも部分的に非相関となるように、前記ダウンミックス信号と、前記第1の非相関信号および前記第2の非相関信号と、アップミックス情報とを用いて出力チャネルを生成するステップとを含む、方法。
  16. 少なくとも3つのチャネルを有する、再生されたマルチチャネル信号であって、前記再生されたマルチチャネル信号が、元のマルチチャネル信号から導出されたダウンミックス信号と、前記ダウンミックス信号を用いて導出された第1の非相関信号および第2の非相関信号とを用いて再生され、前記第1の非相関信号および前記第2の非相関信号が、直交性許容範囲内で互いに直交する、信号。
  17. 請求項16に記載の再生されたマルチチャネル信号を格納した、コンピュータ読み取り可能記録媒体。
  18. 請求項1に記載のマルチチャネルデコーダ(400;500;600)を有する受信装置または音声再生装置である、前記受信装置または音声再生装置。
  19. 請求項15に記載のマルチチャネル信号の再生を行うための方法を有する方法である、受信方法または音声を再生する方法。
  20. コンピュータ上で動作する場合は、前記方法請求項15または請求項19のいずれかに記載の方法を実行するコンピュータプログラム。
JP2007536127A 2004-11-02 2005-10-31 非相関信号を用いた音声符号化 Active JP4598830B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0402649A SE0402649D0 (sv) 2004-11-02 2004-11-02 Advanced methods of creating orthogonal signals
PCT/EP2005/011664 WO2006048227A1 (en) 2004-11-02 2005-10-31 Multichannel audio signal decoding using de-correlated signals

Publications (2)

Publication Number Publication Date
JP2008516290A true JP2008516290A (ja) 2008-05-15
JP4598830B2 JP4598830B2 (ja) 2010-12-15

Family

ID=33448765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007536127A Active JP4598830B2 (ja) 2004-11-02 2005-10-31 非相関信号を用いた音声符号化

Country Status (12)

Country Link
US (1) US8019350B2 (ja)
EP (1) EP1808047B1 (ja)
JP (1) JP4598830B2 (ja)
KR (1) KR100903843B1 (ja)
CN (2) CN101061751B (ja)
ES (1) ES2544946T3 (ja)
HK (2) HK1107739A1 (ja)
PL (1) PL1808047T3 (ja)
RU (1) RU2369982C2 (ja)
SE (1) SE0402649D0 (ja)
TW (1) TWI331321B (ja)
WO (1) WO2006048227A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012516596A (ja) * 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
JP2016026317A (ja) * 2010-04-09 2016-02-12 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP2016522445A (ja) * 2013-05-24 2016-07-28 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
JP2016531483A (ja) * 2013-07-22 2016-10-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
KR101205480B1 (ko) * 2004-07-14 2012-11-28 돌비 인터네셔널 에이비 오디오 채널 변환
KR100737386B1 (ko) 2004-12-31 2007-07-09 한국전자통신연구원 공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
KR101356586B1 (ko) * 2005-07-19 2014-02-11 코닌클리케 필립스 엔.브이. 다중 채널 오디오 신호를 생성하기 위한 디코더, 수신기 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
CN101410891A (zh) * 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
BRPI0707969B1 (pt) * 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
CA2646961C (en) * 2006-03-28 2013-09-03 Sascha Disch Enhanced method for signal shaping in multi-channel audio reconstruction
US8488796B2 (en) * 2006-08-08 2013-07-16 Creative Technology Ltd 3D audio renderer
WO2008102527A1 (ja) * 2007-02-20 2008-08-28 Panasonic Corporation マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
PL2137725T3 (pl) * 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
WO2009045649A1 (en) * 2007-08-20 2009-04-09 Neural Audio Corporation Phase decorrelation for audio processing
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2229676B1 (en) * 2007-12-31 2013-11-06 LG Electronics Inc. A method and an apparatus for processing an audio signal
US20100284549A1 (en) * 2008-01-01 2010-11-11 Hyen-O Oh method and an apparatus for processing an audio signal
AU2008344073B2 (en) 2008-01-01 2011-08-11 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP5266332B2 (ja) * 2008-01-01 2013-08-21 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
FR2954570B1 (fr) * 2009-12-23 2012-06-08 Arkamys Procede de codage/decodage d'un flux numerique stereo ameliore et dispositif de codage/decodage associe
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
CN102741920B (zh) * 2010-02-01 2014-07-30 伦斯莱尔工艺研究院 利用编码和最大长度级序列的用于立体声和环绕声的音频信号去相关
AU2011295367B2 (en) 2010-08-25 2014-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
CN102802112B (zh) * 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
CN102364885B (zh) * 2011-10-11 2014-02-05 宁波大学 一种基于信号频谱包络的频谱感知方法
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
RU2015121941A (ru) * 2012-11-09 2017-01-10 Стормингсвисс Сарл Нелинейное обратное кодирование многоканальных сигналов
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9754596B2 (en) 2013-02-14 2017-09-05 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
JP6013646B2 (ja) * 2013-04-05 2016-10-25 ドルビー・インターナショナル・アーベー オーディオ処理システム
US20150036828A1 (en) * 2013-05-08 2015-02-05 Max Sound Corporation Internet audio software method
US20150036826A1 (en) * 2013-05-08 2015-02-05 Max Sound Corporation Stereo expander method
US20140362996A1 (en) * 2013-05-08 2014-12-11 Max Sound Corporation Stereo soundfield expander
SG11201600466PA (en) 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
JP6392353B2 (ja) 2013-09-12 2018-09-19 ドルビー・インターナショナル・アーベー マルチチャネル・オーディオ・コンテンツの符号化
EP3044783B1 (en) 2013-09-12 2017-07-19 Dolby International AB Audio coding
EP3061089B1 (en) 2013-10-21 2018-01-17 Dolby International AB Parametric reconstruction of audio signals
AU2014339065B2 (en) 2013-10-21 2017-04-20 Dolby International Ab Decorrelator structure for parametric reconstruction of audio signals
CN110970041B (zh) * 2014-07-01 2023-10-20 韩国电子通信研究院 处理多信道音频信号的方法和装置
US9380387B2 (en) 2014-08-01 2016-06-28 Klipsch Group, Inc. Phase independent surround speaker
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
CN107004421B (zh) * 2014-10-31 2020-07-07 杜比国际公司 多通道音频信号的参数编码和解码
CA3127805C (en) 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
US10560661B2 (en) 2017-03-16 2020-02-11 Dolby Laboratories Licensing Corporation Detecting and mitigating audio-visual incongruence
BR112020001660A2 (pt) 2017-07-28 2021-03-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para decodificar um sinal multicanal codificado, descorrelacionador de sinal de áudio, método para descorrelacionar um sinal de entrada de áudio

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0946799A (ja) * 1995-08-02 1997-02-14 Toshiba Corp オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
JP2001188572A (ja) * 1998-11-16 2001-07-10 Victor Co Of Japan Ltd 音声符号化装置
JP2002541524A (ja) * 1999-04-07 2002-12-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5278909A (en) 1992-06-08 1994-01-11 International Business Machines Corporation System and method for stereo digital audio compression with co-channel steering
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
CA2308576A1 (en) 1997-11-14 1999-05-27 W. Waves (Usa) Inc. Post-amplification stereophonic to surround sound decoding circuit
US6438518B1 (en) 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002175097A (ja) 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7272555B2 (en) * 2001-09-13 2007-09-18 Industrial Technology Research Institute Fine granularity scalability speech coding for multi-pulses CELP-based algorithm
CN1471236A (zh) * 2003-07-01 2004-01-28 北京阜国数字技术有限公司 用于感知音频编码的信号自适应多分辨率滤波器组
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0946799A (ja) * 1995-08-02 1997-02-14 Toshiba Corp オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
JP2001188572A (ja) * 1998-11-16 2001-07-10 Victor Co Of Japan Ltd 音声符号化装置
JP2002541524A (ja) * 1999-04-07 2002-12-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012516596A (ja) * 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
US9099078B2 (en) 2009-01-28 2015-08-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Upmixer, method and computer program for upmixing a downmix audio signal
JP2019012279A (ja) * 2010-04-09 2019-01-24 ドルビー・インターナショナル・アーベー デコーダシステム、復号方法及びコンピュータプログラム
US11217259B2 (en) 2010-04-09 2022-01-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
JP2016026317A (ja) * 2010-04-09 2016-02-12 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
US11264038B2 (en) 2010-04-09 2022-03-01 Dolby International Ab MDCT-based complex prediction stereo coding
US9761233B2 (en) 2010-04-09 2017-09-12 Dolby International Ab MDCT-based complex prediction stereo coding
US10276174B2 (en) 2010-04-09 2019-04-30 Dolby International Ab MDCT-based complex prediction stereo coding
JP2018022159A (ja) * 2010-04-09 2018-02-08 ドルビー・インターナショナル・アーベー デコーダシステム、復号方法及びコンピュータプログラム
JP2018022162A (ja) * 2010-04-09 2018-02-08 ドルビー・インターナショナル・アーベー デコーダシステム及び復号方法
US9892736B2 (en) 2010-04-09 2018-02-13 Dolby International Ab MDCT-based complex prediction stereo coding
JP2019008314A (ja) * 2010-04-09 2019-01-17 ドルビー・インターナショナル・アーベー デコーダシステム及び復号方法
US11810582B2 (en) 2010-04-09 2023-11-07 Dolby International Ab MDCT-based complex prediction stereo coding
JP2016026318A (ja) * 2010-04-09 2016-02-12 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
US10347260B2 (en) 2010-04-09 2019-07-09 Dolby International Ab MDCT-based complex prediction stereo coding
US10283127B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10283126B2 (en) 2010-04-09 2019-05-07 Dolby International Ab MDCT-based complex prediction stereo coding
US10360920B2 (en) 2010-04-09 2019-07-23 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US10475459B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US10475460B2 (en) 2010-04-09 2019-11-12 Dolby International Ab Audio downmixer operable in prediction or non-prediction mode
US10553226B2 (en) 2010-04-09 2020-02-04 Dolby International Ab Audio encoder operable in prediction or non-prediction mode
US10586545B2 (en) 2010-04-09 2020-03-10 Dolby International Ab MDCT-based complex prediction stereo coding
US10734002B2 (en) 2010-04-09 2020-08-04 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
JP2016522445A (ja) * 2013-05-24 2016-07-28 ドルビー・インターナショナル・アーベー オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ
JP2016531483A (ja) * 2013-07-22 2016-10-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 無相関化信号の寄与の残差信号ベースの調整を用いたマルチチャンネルオーディオデコーダ、マルチチャンネルオーディオエンコーダ、方法およびコンピュータプログラム

Also Published As

Publication number Publication date
KR20070041724A (ko) 2007-04-19
ES2544946T3 (es) 2015-09-07
SE0402649D0 (sv) 2004-11-02
HK1152789A1 (en) 2012-03-09
RU2369982C2 (ru) 2009-10-10
TWI331321B (en) 2010-10-01
CN101061751B (zh) 2013-06-19
PL1808047T3 (pl) 2015-12-31
EP1808047A1 (en) 2007-07-18
CN101930740A (zh) 2010-12-29
CN101930740B (zh) 2012-05-30
WO2006048227A1 (en) 2006-05-11
JP4598830B2 (ja) 2010-12-15
US8019350B2 (en) 2011-09-13
TW200630959A (en) 2006-09-01
RU2006146685A (ru) 2008-07-10
HK1107739A1 (en) 2008-04-11
KR100903843B1 (ko) 2009-06-25
EP1808047B1 (en) 2015-06-17
CN101061751A (zh) 2007-10-24
US20060165184A1 (en) 2006-07-27

Similar Documents

Publication Publication Date Title
JP4598830B2 (ja) 非相関信号を用いた音声符号化
KR100895609B1 (ko) 공간 오디오의 파라메트릭 코딩을 위한 조밀한 부수 정보
KR100922419B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 확산음 엔벌로프 정형
KR100924576B1 (ko) 바이노럴 큐 코딩 방법 등을 위한 개별 채널 시간 엔벌로프정형
TWI396188B (zh) 依聆聽事件之函數控制空間音訊編碼參數的技術
RU2509442C2 (ru) Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
AU2006212191B2 (en) Parametric joint-coding of audio sources
JP5592974B2 (ja) 多チャネルダウンミックスされたオブジェクト符号化における強化された符号化及びパラメータ表現
EP2122613B1 (en) A method and an apparatus for processing an audio signal
JP4856653B2 (ja) 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング
NO337395B1 (no) Oppbygging av multikanal-utgangssignal og generering av nedblandingssignal
JP2008522244A (ja) オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
WO2006060278A1 (en) Synchronizing parametric coding of spatial audio with externally provided downmix

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100831

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4598830

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250