JP4909272B2 - 空間オーディオコーディングにおける複数チャンネルデコリレーション - Google Patents

空間オーディオコーディングにおける複数チャンネルデコリレーション Download PDF

Info

Publication number
JP4909272B2
JP4909272B2 JP2007530171A JP2007530171A JP4909272B2 JP 4909272 B2 JP4909272 B2 JP 4909272B2 JP 2007530171 A JP2007530171 A JP 2007530171A JP 2007530171 A JP2007530171 A JP 2007530171A JP 4909272 B2 JP4909272 B2 JP 4909272B2
Authority
JP
Japan
Prior art keywords
audio signals
signals
correlation
audio
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007530171A
Other languages
English (en)
Other versions
JP2008511044A (ja
Inventor
シーフェルト、アラン・ジェフリー
ビントン、マーク・ステュアート
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2008511044A publication Critical patent/JP2008511044A/ja
Application granted granted Critical
Publication of JP4909272B2 publication Critical patent/JP4909272B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Casting Or Compression Moulding Of Plastics Or The Like (AREA)

Description

本発明は、オーディオエンコーダーと、オーディオデコーダーと、これらに関連する方法、このような方法を実施するためのコンピュータプログラム、及びこのようなエンコーダーにより生成されるビットストリームに係るシステムとに関する。
最近発表された制限されたビットレートのコーディング技法では、入力複数チャンネル信号を分析し、ダウンミックス合成信号(入力信号より少ないチャンネルの信号)及び元の音場のパラメトリックモデルを含むサイド情報を導き出す。このサイド情報と合成信号は、元の音場に似た音場を再構成させるためにパラメトリックモデルを合成信号に適用するデコーダー伝送される。このような「空間コーディング」システムの第1の目的は、非常に制限された量のデータで複数チャンネルの音場を再構成させることである。したがって、これにより、元の音場をシミュレートするために使うパラメトリックモデルでの制限が強化される。このような空間コーディングシステムの詳細は、以下に「参照としての編入」の表題で引用したものを含む、種々の文書に記載されている。
このような空間コーディングシステムは、一般に、チャンネル同士の振幅差、チャンネル同士の時間差又は位相差、及びチャンネル同士の相関関係のような元の音場をモデル化するためのパラメータを採用する。一般に、このようなパラメータは、コード化された各チャンネルの複数のスペクトル帯域のために予測され、時間の推移に対して動的に予測される。
代表的な従来技術の空間コーディングシステムを、図1a(エンコーダー)、図1b(デコーダー)に示す。複数入力信号は重複させたDFT(離散周波数変換)を用いて周波数領域に変換される。このDFTスペクトルは、次いで、耳の臨界帯域に近似させた帯域に分割される。チャンネル同士の振幅差、チャンネル同士の時間差又は位相差、及びチャンネル同士の相関関係の予測値がこの帯域の各々に対して計算される。元の入力信号をモノフォニックな合成信号にダウンミックスするためにこれらの予測値が用いられる。この合成信号は、予測した空間パラメータと共にデコーダーに送られ、そこで、合成信号は、重複させたDFTと臨界帯域間隔を用いて周波数領域に変換される。次いで、この空間パラメータは、元の複数チャンネル信号に近似させるために対応する帯域に適用される。
デコーダーにおいては、チャンネル同士の振幅差と時間差又は位相差の適用は比較的簡単であるが、これらのチャンネル同士の相関関係を元の複数チャンネル信号と適合させるためにアップミックスされたチャンネルを修正することはかなり困難である。一般に、デコーダーにおいて、振幅差と時間差又は位相差のみを適用すると、アップミックスされたチャンネルのチャンネル同士の相関関係が、元の信号より大きくなり、オーディオサウンドが元のものより空間的に「崩れたもの」、又は、環境性を失ったものとなる。これはしばしば、サイド情報伝送コストを制限するために周波数及び/又は時間を横切って値の平均化が行われるせいである。元のチャンネル同士の相関関係の感触を復元するために、ある形式のデコリレーションをアップミックスされたチャンネルの少なくともいくつかに対して行わなければならない。以下に引用した、Breebaart等によるAES Convention Paper 6072及び国際出願WO03/090206には、単一のダウンミックスされたチャンネルからアップミックスした2つのチャンネル間にチャンネル間の望ましい相関関係を課す技法が提示されている。ダウンミックスされたチャンネルはまず、デコリレーションフィルターを通り抜け、もう1つのデコリレーションされた信号を生成する。次いで、2つのアップミックスされたチャンネルは、元のダウンミックスされた信号とデコリレーションされた信号の一次結合としてそれぞれ計算される。このデコリレーションフィルターは周波数に依存する時間遅れとして設計され、時間遅れは周波数が増加するにつれて増加する。このようなフィルターは、トランジエントの時間的分散を減少させる一方、顕著な可聴デコリレーションを提供するという好ましい特性を有する。また、元の信号にデコリレーションされた信号を加えることは、固定時間遅れのデコリレーションフィルターと関連付けられるくし型フィルター効果が得られないかもしれない。
このBreebaart等による論文及び出願に記載された技術は、2つのアップミックスチャンネルのみに対して設計されたものであるが、このような技術は、任意の数のアップミックスチャンネルに対するのが好ましい。本発明の特徴は、より一般的な複数チャンネルデコリレーションの問題を解決するのみならず、周波数領域での効率的な実施も提供する。
本発明の特徴によれば、N個のオーディオ信号のセットを、その特性が時間領域で線形時間不変となるか又は周波数領域でそれと等価な一意的なデコリレーションフィルター特性でフィルターし、デコリレーションフィルター特性毎に、時間及び周波数を変化させる方式で、その入力信号と出力信号とを結合し、N個の処理された信号のセットを提供する。この結合は一次結合でも良く、受け取ったパラメータの助けを借りて動作させてもよい。一意的なデコリレーションフィルター特性の各々は、各フィルター特性における対応する入力信号がN個の信号のすべてとの間で有する相関関係より小さい相関関係を、各フィルター特性の出力信号がN個の信号のすべてとの間で有するよう、また、各フィルター特性における対応する入力信号がN個の信号の他のすべてとの間で有する相関関係より小さい相関関係を、各出力信号が他のすべての出力信号との間で有するように選定することができる。このようにして、各一意的なデコリレーションフィルターは、各フィルターの出力信号がN個のオーディオ信号のそれぞれとほぼデコリレーションされるように、また、各出力信号がすべての他のオーディオ信号とほぼデコリレーションされるように選定される。N個のオーディオ信号のセットは、M個のオーディオ信号から合成することができ、ここで、Mは1以上でありNはM以上であり、この場合にM個のオーディオ信号をN個のオーディオ信号にアップミックスしてもよい。
本発明のさらなる特徴によれば、前記N個の合成されたオーディオ信号同士の好ましい空間関係を記述するパラメータを受け取る。この場合にアップミックスは、受け取ったパラメータにより定めることができる。この受け取ったパラメータはN個の合成されたオーディオ信号同士の好ましい空間関係を記述することができ、アップミックスを受け取ったパラメータにより動作させることができる。
本発明の他の特徴によれば、各デコリレーションフィルター特性は、複数の自由度を持つモデルにより特徴づけてもよい。各デコリレーションフィルター特性は、時間遅れが周波数の増加と共に単調に減少する、周波数の変化により時間遅れが変化する形の応答を持つことができる。各フィルター特性のインパルス応答は、その瞬時周波数がそのシークエンス(sequence)の持続時間においてπからゼロになるような、単調減少する、有限持続時間の正弦波のシークエンスで特徴づけることができる。ノイズシークエンスを、例えば可聴アーティファクトを特定の信号状態以下に減少させるために、正弦波のシークエンスの瞬時位相に付加してもよい。
本発明のさらに他の特徴によれば、N個の処理された信号同士の好ましい空間関係を記述するパラメータを受け取り、結合の程度は、受け取ったパラメータにより定めることができる。オーディオ信号の各々は、チャンネルを表すことができ、結合動作を助ける受け取ったパラメータは、チャンネル同士の相関関係に関するパラメータとすることができる。受信した他のパラメータには、1以上のチャンネル同士の振幅差とチャンネル化の時間差又は位相差に関するパラメータが含まれる。
本発明は、例えば、エンコーダーでN個の元のオーディオ信号がM個の信号にダウンミックスされ(M<N)、そして、エンコーダーで生成されたサイド情報を用いて、再びN個の信号にデコーダーでアップミックスされるような、空間コーディングシステムに適用される。本発明の特徴は、複数チャンネルが単一のモノフォニックチャンネルにダウンミックスされる(そしてそこからアップミックスが行われる)ような、以下の引例に記述したような空間コーディングシステムに適用することができるのみならず、Mark
Franklin Davisにより、2005年2月28に出願された国際出願PCT/US2005/006359、表題「Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels Are Represented By Fewer Channels and Auxiliary Information」に開示されているような、複数のチャンネルにダウンミックスがなされる(そしてそこからアップミックスが行われる)ようなシステムにも適用することができる。前記PCT/US2005/006359出願は、本明細書にそのすべてを参照として編入する。
デコーダーにおいて、サイド情報により送られた信号間の振幅差及び時間差または位相差を適用することにより、M個のダウンミックスされた信号からN個のアップミックスされた信号の第1のセットが生成される。次に、一意的なデコリレーションフィルターでN個の信号をフィルターすることにより、この第1のセットからN個のアップミックスされた信号の第2のセットが生成される。このフィルターは、各信号に対して1つ、N個のデコリレーションフィルターがあるという意味で「一意的」である。N個の一意的なデコリレーションフィルターのセットは、それぞれのフィルター入力に関してデコリレーションされた(以下の式3a参照)相互にデコリレーションされたN個の信号(以下の式3b参照)を生成するよう設計されている。エンコーダーへの入力信号のそれぞれに近似する出力信号をデコーダーから生成するために、フィルターされていないアップミックス信号と共に、これらの十分デコリレーションされた信号が用いられる。それぞれの近似値は、アップミックスされた信号の第1のセットからのフィルターされていない各信号と、アップミックスされた信号の第2のセットからの対応するフィルターされた信号との一次結合として計算される。この一次結合の係数は、時間と周波数に応じて変化し、エンコーダーにより生成されたサイド情報に含めてデコーダーに送られる。場合によっては、このシステムを効率的に実施するために、N個のデコリレーションフィルターは、時間領域よりむしろ周波数領域で適用することが好ましい。これは、例えば、以下に記載するように、エンコーダー及びデコーダーに用いられるDFTに適切にゼロパッディング(zero−padding)及び窓化を行うことにより実施してもよい。フィルターは時間領域で適用してもよい。
図2及び図3を参照すると、元のN個のオーディオ信号は、x、i=1...Nで表される。エンコーダーで生成されたM個のダウンミックスされた信号は、y、j=1...Mで表される。
Figure 0004909272
これらの信号は、時間と周波数を変えることで既述の第1のセットと第2のセットからの信号を混合することにより計算される。
Figure 0004909272
パラメータα[b,t]とβ[b,t]は、エンコーダーで生成されたサイド情報で特定された時間と周波数を変える混合係数である。これらは、「係数の混合計算」の表題で以下に記載したように計算することができる。
[デコリレーションフィルターの設計]
Figure 0004909272
当業者でよく知られているように、単純な時間遅れをデコリレーションフィルターとして使うことができ、この場合、デコリレーション効果は、時間遅れが増加するにつれて増加する。しかし、このようなデコリレータにより信号がフィルターされ、そして、式(2)で示したように元の信号が加算されたとき、特に高い周波数で、エコーが聞こえることがある。当業者に知られた改善法は、時間遅れを周波数と線形に最大時間遅れからゼロまで減少させる、周波数の変化により時間遅れを変化させるフィルターを使う方法である。このようなフィルターで唯一自由になるパラメータは最大時間遅れである。このようなフィルターにおいて、低周波数では顕著な時間遅れを受けるのでデコリレーションの効果を保持する一方、高周波数では顕著な時間遅れは無いので感知できるエコーが削除される。本発明の特徴として、デコリレーションフィルターの特性は、より自由度の高いモデルにより特徴づけられることが好ましい。特に、このようなフィルターは、瞬時周波数を単調に増加させる機能を有することができ、これは、理論的に無限に多くの様々な形式をとることができる。各フィルターのインパルス応答は、その瞬時周波数が例えばそのシークエンスの連続に対してπからゼロになるような、単調減少する有限連続の正弦波のシークエンスで特徴づけることができる。これは、ナイキスト周波数に対する時間遅れが0に等しく、DCに対する時間遅れがシークエンスの長さに等しいことを意味する。この一般形態から、各フィルターのインパルス応答は下式で与えられる、
Figure 0004909272
ここで、ω(t)は、単調増加する瞬時周波数関数であり、ω’(t)は、この瞬時周波数の第1導関数であり、φ(t)は瞬時周波数の積分値に初期位相φ0を加えることにより得られる瞬時位相であり、Lはこのフィルターの長さである。乗算項√ω’(t)は、周波数応答h[n]をすべての周波数でほぼフラットにするために必要であり、フィルター振幅Aは、周波数応答の振幅がほぼ一様になるよう選定される。これは以下のようにAを選択することと等価である。
Figure 0004909272
関数ω(t)の有用なパラメータ化の1つは以下で与えられる、
Figure 0004909272
パラメータαは、シークエンスの持続中にどれだけ速く瞬時周波数がゼロに減少するかを定めるものである。角周波数ωの関数として時間遅れtを解くために等式(5)を以下のように変形することができる、
Figure 0004909272
α=0のとき、すべてのωに対してt(ω)=Lであり、言い換えれば、フィルターは長さLの純粋な時間遅れとなることに留意しなければならない。α=∞のとき、すべてのωに対してt(ω)=0であり、フィルターは単純なインパルスとなる。聴覚的なデコリレーションの目的では、最適な音響結果をもたらすために、αの設定は1と10との間のどこかで見出される。しかし、式(4a)中のフィルターインパルス応答h[n]がチャープ(小鳥のさえずる声)のようなシークエンスの形態となるため、インパルス的なオーディオ信号をそのようなフィルターでフィルターすることは、元のトランジェントの位置に、フィルターされた信号中にしばしば可聴な「チャーピング」アーティファクトが生じる結果となる。この影響による可聴性は、αを増加させるとともに減少するが、フィルターの正弦波シークエンスの瞬時位相にノイズシークエンスを加えることによりさらにこの影響を減少させることができる。これは、下式のように、フィルター応答の瞬時位相にノイズ項を加えることにより達成できる、
Figure 0004909272
このノイズシークエンスN[n]をπの小さな端数の分散を持つガウスノイズに等しくすることは、インパルス応答サウンドをチャープのようなものでなくノイズのようなものにするのに十分である一方、ω(t)で定義された周波数と時間遅れとの間の好ましい関係は広い範囲で維持される。式(5)で定義されたようなω(t)を持つ式(7)におけるフィルターは、4つの自由なパラメータ、L,α,φ,及びN[n]を持つ。これらのパラメータをすべてのフィルターh[n]、i=1...Nに亘ってお互いに十分異なるよう選定することにより、式(3)の好ましいデコリレーション条件に合致させることができる。
[係数の混合の計算]
時間と周波数を変化させて係数α[b,t]とβ[b,t]とを混合したものは、元の信号xの対同士で帯域毎の相関関係から、エンコーダーで生成することができる。具体的には、帯域bの時間tにおける、信号iと信号jとの正規化された相関関係(ここで、「i」は信号1...Nのうちの任意の1つであり、「j」は信号1...Nのうちの他の任意の1つである)は下式で与えられる。
Figure 0004909272
ここで、期待値Eは時間tの近傍の時間τについて実行される。
Figure 0004909272
Figure 0004909272
これらのパラメータα[b,t]は空間コーディングシステムのサイド情報に含めて伝送される。デコーダーにて、パラメータβ[b,t]は下式のように計算される、
Figure 0004909272
サイド情報を伝送するコストを削減するために、優勢なチャンネルと2番目に優勢なチャンネルのみに対するパラメータα[b,t]を送ってもよい。そして、他のすべてのチャンネルについてのα[b,t]の値は、2番目に優勢なチャンネルの値に設定される。さらなる近似として、パラメータα[b,t]をすべてのチャンネルで同じ値に設定してもよい。この場合、優勢なチャンネルと2番目に優勢なチャンネルとの間の正規化された相関関係の平方根を用いてもよい。
[周波数領域におけるデコリレーションフィルターの実施]
分析窓と合成窓を適切に選択し重複させたDFTは、本発明の特徴を効率的に実施するために用いられる。図4は、適切な分析窓/合成窓のペアの例を描いたものである。図4は、周波数領域においてデコリレーションを適用するための重複させたDFTの分析窓及び合成窓を示す。重複させ傾斜をつけた窓は再現された信号中のアーティファクトを最小限にするために必要である。
分析窓は、重複させた分析窓の和が選択した重複間隔について一貫性を保つように設計される。例えば、カイザー・ベッセル(KBD)窓を選択してもよい。このような分析窓により、重複させたDFTに変更が加えられていなければ、合成窓なしで分析された信号を合成することができる。周波数領域で乗算を行いデコリレーションフィルターで畳み込むために、分析窓はまたゼロパッドされたものでなければならない。ゼロパッディングなしでは、通常の畳み込みではなく循環畳み込みが起こる。もし最大デコリレーションフィルター長がLmaxで与えられるなら、少なくともLmaxの分析窓の後のゼロパッディングが必要となる。しかし、チャンネル同士の振幅差と位相差も周波数領域で適用され、これらの修正により、結果的に分析窓の前後で畳み込みもれが生じる。したがって、付加的なゼロパッディングを分析窓のメインローブの前後に付加する。最終的に、分析窓のメインローブを横切って一様であり、Lmaxの長さのゼロパッディングである分析窓が使われる。この領域の外側には、しかしながら、合成されたオーディオにおける誤動作を削除するために合成窓はゼロ方向に傾いている。本発明の特徴には、このような分析窓/合成窓の設定とゼロパッディングの使用とが含まれている。
適切な窓パラメータを以下に示す、
DFT長さ: 2048
分析窓メインローブ長さ(AWML): 1024
ホップサイズ(HS): 512
リーディングゼロパッド(ZPlead): 256
ラギングゼロパッド(ZPlag): 768
分析窓の傾き(SWT): 128
max: 640
このような窓パラメータが適切であることは分かったが、特定の値が本発明にとって決定的なものになるわけではない。
Figure 0004909272
ここで、Z[k,t]は、上述の分析窓を用いて、ダウンミックスされた信号y,j=1...M、の重複させたDFTから計算されたものである。kbBeginとkbEndを帯域bに関連付けたビンインデックスの最初と最後とすると、式(2)は以下のように実行することができる、
Figure 0004909272
図2を参照すると、本発明の特徴を具体化したエンコーダーの簡単化した例が示されており、入力信号xは、PCM信号のような複数のオーディオ入力信号であり、それぞれのオーディオ信号、1からnまでが時間領域から周波数領域への変換器又は変換機能(「T/F」)22のそれぞれに入力される。分かりやすくするために、1つのT/Fブロックのみが示されているが、1からnまでの入力信号のそれぞれに1つあることが了解されよう。入力オーディオ信号は、例えば、左、中央、右、等の空間方向を表すことができる。各T/Fは、例えば、入力オーディオサンプルをブロックに分割し、ブロックを窓化し、ブロックを重複させ、窓化し重複させた各ブロックを離散周波数変換(DFT)を用いて周波数領域に変換し、その結果生じた周波数スペクトルを耳の臨界帯域、例えば等価矩形帯域(ERB)スケールを用いて例えば21個の帯域、をシミュレートする帯域に区分する。このようなDFT処理は当業者にはよく知られている。時間領域から周波数領域への他の変換パラメータ及び技法を用いてもよい。どんな特定のパラメータも特定の技法も本発明にとって決定的なものとはならない。しかし、説明を簡単にするために、本明細書における説明では、このようなDFT変換技法を採用することを前提とする。
T/F22の周波数領域の出力は各々スペクトル係数のセットとなる。これらのセットのすべては、ダウンミキサー又はダウンミックス機能(「ダウンミックス」)24に入力される。このダウンミキサー又はダウンミックス機能は、前述の空間コーディングの刊行物又は前述のDavis他による国際特許出願にいろいろと記載したようなものでもよい。ダウンミックス24の出力、前述の空間コーディングシステムの場合は単一チャンネルy、前述のDavis他による刊行物では複数チャンネルyは、AACやAC−3その他のような適切なコーディングを用いて知覚的にエンコードされたものでもよい。詳細が公にされた知覚コーディングシステムは、以下に「参照としての編入」の表題で本明細書に含める。ダウンミックス24の出力は、知覚コーディングされたものであってもなくても、「オーディオ情報」として特徴づけられる。このオーディオ情報は、各々一般的に上記のT/Fとは逆の機能を実行する周波数領域から時間領域への変換器又は変換機能(「F/T」)26により、変換されて時間領域に戻され、その後、窓化と重複させた加算が行われる。F/T26からの時間領域の情報は、エンコードされたビットストリームを出力するビットストリームパッカー又はパッキング機能(「ビットストリームパッカー」)28に入力される。
T/F22によって生成されたスペクトル係数のセットはまた、前述の空間コーディングについての種々の刊行物に記載されているような、例えば、チャンネル同士の振幅差、チャンネル同士の時間差又は位相差、及び、チャンネル同士の相関関係のような「空間パラメータ」を有する「サイド情報」を計算する空間パラメータ計算器又は計算機能30に入力される。空間パラメータサイド情報は、ビットストリーム中の空間パラメータを含むビットストリームパッカー28に入力される。
T/F22によって生成された空間スペクトル係数のセットはまた、上述したような相関係数α[b,t]を計算する、相関係数計算器又は計算機能(「相関係数の計算」)32に入力される。この相関係数は、ビットストリーム中の相関係数を含むビットストリームパッカー28に入力される。この相関係数は、「サイド情報」として特徴づけてもよい。サイド情報は、オーディオ情報をデコードするに際して有用である。
実際の実施形態では、このオーディオ情報のみならず、サイド情報及び相関係数もまた伝送コストを最小限にするために何らかの方法で、量子化又はコード化されるであろう。しかしながら、表現を簡単にするため、及びこの詳細は良く知られており本発明を理解する上で役に立たないので、量子化と逆量子化については図示されていない。
図3を参照すると、ここには本発明の特徴を具体化したデコーダーの簡単化した例が示されているが、例えば、図2に関連して説明した形式のエンコーダーにより作られたビットストリームが、空間情報サイド情報、相関係数サイド情報α[b,t]、及びオーディオ情報を提供するビットストリームアンパッカー32に入力される。このオーディオ情報は、時間領域から周波数領域への変換器又は変換機能(「T/F」)34に入力される。このT/Fは図2の変換器22と同じものでもよい。この周波数領域のオーディオ情報は、受け取った空間パラメータのサイド情報の助けを借りて動作するアップミキサー36に入力される。このアップミキサーは、前述の空間コーディングについての刊行物に記載された、又は、オーディオ情報が複数チャンネルに伝送される場合はDavis他の国際出願に記載されたようにさまざまに動作する。このアップミキサーの出力は、上記の複数の信号zとなる。アップミックスされた信号zの各々は、上述の特性hを持つ一意的なデコリレーションフィルター38に入力される。表現を簡単にするために、単一のフィルターのみ示したが、各アップミックスされた信号に別々の一意的なフィルターがあることは理解されよう。
Figure 0004909272
相関係数α[b,t]はマルチプレクサ40に入力され、そこで上述のようにアップミックスされた信号のそれぞれの時間が乗算される。相関係数α[b,t]はまた、上述のように、相関係数α[b,t]から相関係数β[b,t]を導き出す計算器又は計算機能(「β[b,t]の計算」)42にも入力される。
Figure 0004909272
[実施例]
本発明は、ハードウェア又はソフトウェア又はこれらの組み合わせ(例えばプログラマブルロジックアレー)により実施可能である。特に記述が無い場合は、本発明の1部として組み込まれるアルゴリズムは特定のコンピュータ又はその他の装置に本来的に結びついたものではない。特に、さまざまな汎用機でここに開示した記載のプログラムを用いてもよく、あるいは、必要な方法のステップを実行するためのもっと特化した装置(例えば集積回路)を組み立てたほうがもっと便利かもしれない。このように、本発明は、それぞれが少なくとも1つのプロセッサと、少なくとも1つのデータ記憶システム(揮発メモリ及び不揮発メモリ及び/又は記憶装置を含む)と、少なくとも1つの入力装置又は入力ポートと、少なくとも1つの出力装置からなる1以上のプログラム可能なコンピュータシステムで動作する1以上のコンピュータプログラムにより実行することができる。ここに記載した機能を実行し出力情報を出力するために入力データにプログラムコードが適用される。出力情報は、1以上の出力装置に既知の方法で適用される。
このようなプログラムの各々は、コンピュータシステムと通信するため必要とされるどのようなコンピュータ言語(機械言語、アセンブリ言語、高級手続言語又はロジック言語又はオブジェクト指向プログラミング言語を含む)、で実行してもよい。いずれにせよ、言語はコンパイル言語又はインタプリタ言語とすることができる。
このようなコンピュータプログラムの各々は、その記憶媒体又は記憶装置をコンピュータシステムが読み取り、ここに記載された手続を実行するときに、コンピュータを設定し実行させるために、汎用又は専用のプログラマブルコンピュータにより読み取り可能な記憶媒体又は記憶装置(例えば、半導体メモリ又は半導体媒体、又は磁気又は光学媒体)に保存又はダウンロードされることが好ましい。発明したシステムは、コンピュータプログラムコンピュータが設定された読取可能な記憶媒体であって、コンピュータシステムにここに記載した機能を実行するために、あらかじめ定めた特定の方法で動作させるよう構成されている記憶媒体としての実施も考えることができる。本発明の多くの実施の形態を記載した。しかしながら、本発明の精神と技術的範囲を逸脱することなく多くの変更を加えることができることは了解されよう。例えば、ここに記載したステップのいくつかは独立したものであり、したがって、この記載とは違った順序で実施することができる。
[参照としての編入]
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[AC−3]
ATSC標準A52/A:Digital Audio Compression Standard (AC-3), Revision A、Advanced Television Systems Committee、2001年8月20日。このA52/A書面は、ワールドワイドウェブhttp://www.atsc.org/standards.html.にて参照することができる。
Steve Vernonによる、1995年8月の EEE Trans.Consumer Electronics,Vol.41,No. 3、「Design and Implementation of AC-3 Coders」、
Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」、
Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」、
米国特許、5,583,962と、5,632,005と、5,633,981と、5,727,119と、6,021,386、
[AAC]
ISO/IEC IS-14496(パート3、オーディオ)、1996年、AAC ISO/IEC JTC1/SC29, 「Information technology-very low bitrate audio-visual coding」、
ISO/IEC 13818-7、International Standard、1997年「MPEG-2 advanced audio coding, AAC」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、1996年、Proc. of the 101st AES-Convention、「ISO/IEC
MPEG-2 Advanced Audio Coding」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、Journal of the AES, Vol.45, No.10, October 1997, pp. 789-814、「ISO/IEC
MPEG-2 Advanced Audio Coding」、
Karlheinz Brandenburgによる、Proc. of the AES 17th International Conference on High Quality Audio Coding, Florence, Italy, 1999、「MP3
and AAC explained」、及び、
G. A. Soulodre他による、J. Audio Eng. Soc, Vol.46, No.3, pp 164-177 March 1998、「Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs」、
[MPEG Intensity Stereo]
米国特許、5,323,396と、5,539,829と、5,606,618と、5,621,855、
米国公開特許出願US2001/0044713、
[空間的コーディング及びパラメトリックコーディング]
Mark Franklin Davisによる2005年2月28日出願の国際出願、PCT/US2005/006359、表題「Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information」、
米国特許出願公開公報US2003/0026441、2003年2月6日公開、
米国特許出願公開公報US2003/0035553、2003年2月20日公開、
米国特許出願公開公報US2003/0219130(Baumgarte & Faller)、2003年11月27日公開、
Audio Engineering Society 論文5852、2003年3月、
国際公開公報WO03/090207、2003年10月30日公開、
国際公開公報WO03/090208、2003年10月30日公開、
国際公開公報WO03/007656、2003年1月22日公開、
国際公開公報WO03/090206、2003年10月30日公開、
Baumgarte他による、2003年12月25日に公開された、米国特許出願公開公報US2003/0236583Al、表題「Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals」、出願番号S.N.10/246,570、
Faller他による、Audio Engineering Society Convention Paper 5574, 112th Convention, Munich, May 2002、「Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression」、
Baumgarte他による、Audio Engineering Society Convention Paper 5575, 112th Convention, Munich, May 2002、「Why Binaural Cue Coding is Better than Intensity Stereo Coding」、
Baumgarte他による、Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, October 2002、「Design and Evaluatin of Binaural Cue Coding Schemes」、
Faller他による、IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New
York, October 2001, pp.199-202、「Efficient Representation of Spatial Audio Using Perceptual Parametrization」、
Baumgarte他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1801-1804、「Estimation of Auditory Spatial Cues for Binaural Cue Coding」、
Faller他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1841II-1844、「Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio」、
Breebaart他による、Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, May 2004、「High-quality parametric spatial audio coding at low bitrates」、
Baumgarte他による、Audio Engineering Society Convention Paper 6060, 116th Convention, Berlin, May
2004、「Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing」、
Schuijers他による、Audio Engineering Society Convention Paper 6073, 116th Convention, Berlin, May
2004、「Low complexity parametric stereo coding」、
Engdegard他による、Audio Engineering Society Convention Paper 6074, 116th Convention, Berlin, May
2004、「Synthetic Ambience in Parametric Stereo Coding」、
[その他]
Herreによる米国特許5,812,971、表題「Enhanced Joint Stereo Coding Method Using Temporal Envelope Shaping」1998年9月22日付、
Herre他による、Audio Engineering Society Preprint 3799, 96th Convention, Amsterdam, 1994、
Truman他による、2003年10月2日に公開された、米国特許出願公開公報US2003/0187663Al、表題「Broadband Frequency Translation for High Frequency Regeneration」、出願番号S.N.10/113,858。
一般的な従来技術の空間コーディングエンコーダーの簡単化したブロック図である。 一般的な従来技術の空間コーディングデコーダーの簡単化したブロック図である。 本発明の特徴を具体化したエンコーダー又はエンコーディング機能の実施例の簡単化した機能ブロック図である。 本発明の特徴を具体化したデコーダー又はデコーディング機能の実施例の簡単化した機能ブロック図である。 本発明の特徴を実施するのに適した、分析/合成窓のペアを理想化して描いたものである。

Claims (18)

  1. N個のオーディオ信号のセットを処理する方法であって、N個のオーディオ信号の各々を、N個の異なるデコリレーションフィルター間で、一意的なデコリレーションフィルターによりフィルターするステップを具備し、各デコリレーションフィルターは入力信号として前記N個のオーディオ信号のうちの1つを受け取り、線形時間不変特性にするものであり、デコリレーションフィルター毎に、複数の周波数帯域の各々において、入力信号及び出力信号を時間変動パラメータで乗算した結果を結合し、N個の処理された信号のセットを提供することを特徴とし、
    前記各一意的なデコリレーションフィルターは、a)該デコリレーションフィルターの出力信号と前記N個のオーディオ信号のすべてとの間の相関が、該デコリレーションフィルターの入力信号と前記N個のオーディオ信号の他のすべてとの間の相関より小さくなるよう、及び、b)各出力信号と他のすべての出力信号との間の相関が、該デコリレーションフィルターの入力信号と前記N個のオーディオ信号の他のすべてとの間の相関より小さくなるよう、選定されることを特徴とする、
    方法。
  2. 前記N個のオーディオ信号の各々は、チャンネルを表し、前記時間変動パラメータは、チャンネル間の相互相関を表すことを特徴とする請求項1に記載の方法。
  3. 前記N個のオーディオ信号のセットは、M個のオーディオ信号から合成されたものであり、Mは1以上であり、NはMより大きく、M個のオーディオ信号をN個のオーディオ信号にアップミックスするステップをさらに具備することを特徴とする請求項1又は請求項2に記載の方法。
  4. 前記N個の合成されたオーディオ信号同士の好ましい空間関係を記述したパラメータを受け取るステップをさらに具備し、前記アップミックスするステップは受け取ったパラメータを用いて行われることを特徴とする請求項3に記載の方法。
  5. 各デコリレーションフィルターは、複数の自由度を持つモデルにより特徴づけられたものであることを特徴とする請求項1乃至請求項4のいずれか1項に記載の方法。
  6. 各デコリレーションフィルターは、時間遅れが周波数の増加と共に単調に減少する、周波数の変化により時間遅れが変化する形の応答を有することを特徴とする請求項1乃至請求項5のいずれか1項に記載の方法。
  7. 各フィルター特性のインパルス応答は、その瞬時周波数が単調減少する、有限持続時間の正弦波のシークエンスで特徴づけられることを特徴とする請求項6に記載の方法。
  8. 正弦波のシークエンスの瞬時位相にノイズシークエンスが付加されることを特徴とする請求項7に記載の方法。
  9. 前記結合は、一次結合であることを特徴とする請求項1乃至請求項8のいずれか1項に記載の方法。
  10. 前記結合による結合の程度は、受け取ったパラメータを用いて定められることを特徴とする請求項1乃至請求項9のいずれか1項に記載の方法。
  11. 前記N個の処理された信号同士の好ましい空間関係を記述するパラメータを受け取るステップであって、前記結合による結合の程度は、受け取ったパラメータを用いて定められることを特徴とするステップをさらに具備することを特徴とする請求項1乃至請求項9のいずれか1項に記載の方法。
  12. 前記オーディオ信号の各々はチャンネルを表し、結合動作を助ける前記受け取ったパラメータはチャンネル同士の相関関係に関する前記時間変動パラメータであることを特徴とする請求項10又は請求項11に記載の方法。
  13. 受信した他のパラメータには、1以上のチャンネル同士の振幅差とチャンネル同士の時間差又は位相差に関するパラメータが含まれることを特徴とする請求項12に記載の方法。
  14. 前記請求項1乃至請求項13のいずれか1項に記載の方法を実行するオーディオプロセッサ。
  15. 前記請求項1乃至請求項13のいずれか1項に記載の方法の実施に適合した装置。
  16. 前記請求項1乃至請求項13のいずれか1項に記載の方法をコンピュータに実行させるための、コンピュータが読み込み可能な媒体に記憶させたコンピュータプログラム。
  17. 請求項14に記載のオーディオプロセッサ又は請求項15に記載の装置をコンピュータに制御させるための、コンピュータが読み込み可能な媒体に記憶させたコンピュータプログラム。
  18. N個のオーディオ信号のセットを処理する装置であって、
    N個のオーディオ信号の各々を、N個の異なるデコリレーションフィルター間で、一意的なデコリレーションフィルターによりフィルターする手段と、各デコリレーションフィルターは入力信号として前記N個のオーディオ信号のうちの1つを受け取り、線形時間不変特性にするものであり、デコリレーションフィルター毎に、複数の周波数帯域の各々において、入力信号及び出力信号を時間変動パラメータで乗算した結果を結合し、N個の処理された信号のセットを提供する手段とを具備することを特徴とし、
    前記各一意的なデコリレーションフィルターは、a)該デコリレーションフィルターの出力信号と前記N個のオーディオ信号のすべてとの間の相関が、該デコリレーションフィルターの入力信号と前記N個のオーディオ信号の他のすべてとの間の相関より小さくなるよう、及び、b)各出力信号と他のすべての出力信号との間の相関が、該デコリレーションフィルターの入力信号と前記N個のオーディオ信号の他のすべてとの間の相関より小さくなるよう、選定されることを特徴とする、
    装置。
JP2007530171A 2004-08-25 2005-08-24 空間オーディオコーディングにおける複数チャンネルデコリレーション Active JP4909272B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US60472504P 2004-08-25 2004-08-25
US60/604,725 2004-08-25
US70013705P 2005-07-18 2005-07-18
US60/700,137 2005-07-18
US70578405P 2005-08-05 2005-08-05
US60/705,784 2005-08-05
PCT/US2005/030453 WO2006026452A1 (en) 2004-08-25 2005-08-24 Multichannel decorrelation in spatial audio coding

Publications (2)

Publication Number Publication Date
JP2008511044A JP2008511044A (ja) 2008-04-10
JP4909272B2 true JP4909272B2 (ja) 2012-04-04

Family

ID=35448169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007530171A Active JP4909272B2 (ja) 2004-08-25 2005-08-24 空間オーディオコーディングにおける複数チャンネルデコリレーション

Country Status (16)

Country Link
US (1) US8015018B2 (ja)
EP (1) EP1782417B1 (ja)
JP (1) JP4909272B2 (ja)
KR (1) KR101178060B1 (ja)
CN (1) CN101010723B (ja)
AT (1) ATE447756T1 (ja)
AU (1) AU2005280041B2 (ja)
BR (1) BRPI0514620A8 (ja)
CA (1) CA2576739C (ja)
DE (1) DE602005017502D1 (ja)
HK (1) HK1099839A1 (ja)
IL (1) IL181406A (ja)
MX (1) MX2007001949A (ja)
MY (1) MY143850A (ja)
TW (1) TWI393121B (ja)
WO (1) WO2006026452A1 (ja)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
CN101151659B (zh) * 2005-03-30 2014-02-05 皇家飞利浦电子股份有限公司 多通道音频编码器、设备、方法及其解码器、设备和方法
DE602006002501D1 (de) * 2005-03-30 2008-10-09 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
WO2007032648A1 (en) 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
TWI329462B (en) 2006-01-19 2010-08-21 Lg Electronics Inc Method and apparatus for processing a media signal
JP5054035B2 (ja) 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
TWI489886B (zh) * 2006-04-03 2015-06-21 Lg Electronics Inc 音頻訊號解碼方法及其裝置
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
DE602007013415D1 (de) 2006-10-16 2011-05-05 Dolby Sweden Ab Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
US8385556B1 (en) 2007-08-17 2013-02-26 Dts, Inc. Parametric stereo conversion system and method
CN101981616A (zh) * 2008-04-04 2011-02-23 松下电器产业株式会社 立体声信号变换装置、立体声信号逆变换装置及其方法
JP5326465B2 (ja) * 2008-09-26 2013-10-30 富士通株式会社 オーディオ復号方法、装置、及びプログラム
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
BRPI1007528B1 (pt) 2009-01-28 2020-10-13 Dolby International Ab Sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento
RU2493618C2 (ru) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
US8255821B2 (en) * 2009-01-28 2012-08-28 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
JP5433022B2 (ja) 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
AU2010303039B9 (en) * 2009-09-29 2014-10-23 Dolby International Ab Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
CN102157150B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
CA3097372C (en) 2010-04-09 2021-11-30 Dolby International Ab Mdct-based complex prediction stereo coding
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9117440B2 (en) 2011-05-19 2015-08-25 Dolby International Ab Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal
WO2012164153A1 (en) * 2011-05-23 2012-12-06 Nokia Corporation Spatial audio processing apparatus
US9299355B2 (en) * 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
EP2939443B1 (en) * 2012-12-27 2018-02-14 DTS, Inc. System and method for variable decorrelation of audio signals
WO2014126689A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
WO2014126688A1 (en) * 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2830333A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
SG11201600466PA (en) * 2013-07-22 2016-02-26 Fraunhofer Ges Forschung Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
CN105338446B (zh) * 2014-07-04 2019-03-12 南宁富桂精密工业有限公司 音频声道控制电路
CN104518821B (zh) * 2014-12-12 2019-05-24 上海华为技术有限公司 一种宽带波束成形算法、网元以及系统
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
CN106161820B (zh) * 2015-04-16 2019-04-23 中国科学院声学研究所 一种用于立体声声学回声抵消的通道间去相关方法
WO2018096036A1 (en) 2016-11-23 2018-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for adaptive control of decorrelation filters
US10560661B2 (en) 2017-03-16 2020-02-11 Dolby Laboratories Licensing Corporation Detecting and mitigating audio-visual incongruence
ES2965741T3 (es) * 2017-07-28 2024-04-16 Fraunhofer Ges Forschung Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
CN113873420B (zh) * 2021-09-28 2023-06-23 联想(北京)有限公司 音频数据处理方法及装置

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5539829A (en) * 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US6289308B1 (en) * 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5351338A (en) * 1992-07-06 1994-09-27 Telefonaktiebolaget L M Ericsson Time variable spectral analysis based on interpolation for speech coding
JPH08179786A (ja) * 1994-12-20 1996-07-12 Onkyo Corp 車載用ステレオ再生装置
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6096960A (en) * 1996-09-13 2000-08-01 Crystal Semiconductor Corporation Period forcing filter for preprocessing sound samples for usage in a wavetable synthesizer
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
WO1999053674A1 (en) * 1998-04-08 1999-10-21 British Telecommunications Public Limited Company Echo cancellation
JP2000152399A (ja) 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US6175631B1 (en) * 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
GB2353926B (en) 1999-09-04 2003-10-29 Central Research Lab Ltd Method and apparatus for generating a second audio signal from a first audio signal
GB0018787D0 (en) * 2000-07-31 2000-09-20 Scient Generics Ltd Communication system
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US6458044B1 (en) * 2001-06-13 2002-10-01 Taylor Made Golf Company, Inc. Golf club head and method for making it
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
ES2268340T3 (es) 2002-04-22 2007-03-16 Koninklijke Philips Electronics N.V. Representacion de audio parametrico de multiples canales.
ES2280736T3 (es) * 2002-04-22 2007-09-16 Koninklijke Philips Electronics N.V. Sintetizacion de señal.
DE60326782D1 (de) 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
CN1460992A (zh) * 2003-07-01 2003-12-10 北京阜国数字技术有限公司 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US20050265558A1 (en) * 2004-05-17 2005-12-01 Waves Audio Ltd. Method and circuit for enhancement of stereo audio reproduction
US7876909B2 (en) * 2004-07-13 2011-01-25 Waves Audio Ltd. Efficient filter for artificial ambience
KR101283525B1 (ko) * 2004-07-14 2013-07-15 돌비 인터네셔널 에이비 오디오 채널 변환
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
CN102395098B (zh) * 2005-09-13 2015-01-28 皇家飞利浦电子股份有限公司 生成3d声音的方法和设备
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8488796B2 (en) * 2006-08-08 2013-07-16 Creative Technology Ltd 3D audio renderer

Also Published As

Publication number Publication date
HK1099839A1 (en) 2007-08-24
US8015018B2 (en) 2011-09-06
WO2006026452A1 (en) 2006-03-09
KR20070051856A (ko) 2007-05-18
ATE447756T1 (de) 2009-11-15
IL181406A0 (en) 2007-07-04
IL181406A (en) 2011-04-28
EP1782417A1 (en) 2007-05-09
US20080126104A1 (en) 2008-05-29
TW200611241A (en) 2006-04-01
BRPI0514620A (pt) 2008-06-17
AU2005280041B2 (en) 2010-04-22
AU2005280041A1 (en) 2006-03-09
MX2007001949A (es) 2007-04-23
CN101010723B (zh) 2011-05-18
CN101010723A (zh) 2007-08-01
CA2576739A1 (en) 2006-03-09
KR101178060B1 (ko) 2012-08-30
EP1782417B1 (en) 2009-11-04
TWI393121B (zh) 2013-04-11
JP2008511044A (ja) 2008-04-10
MY143850A (en) 2011-07-15
BRPI0514620A8 (pt) 2018-07-31
DE602005017502D1 (de) 2009-12-17
CA2576739C (en) 2013-08-13

Similar Documents

Publication Publication Date Title
JP4909272B2 (ja) 空間オーディオコーディングにおける複数チャンネルデコリレーション
JP5292498B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP4712799B2 (ja) マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
JP6279077B2 (ja) 適応位相アライメントを用いたマルチチャネルダウンミックスにおけるコムフィルタアーチファクトの抑制
MX2007001972A (es) Ensamble de guia de fruta de carriles multiples para un extractor de jugo y metodos relacionados.
KR20060109297A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
Yu et al. Low-complexity binaural decoding using time/frequency domain HRTF equalization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110921

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111020

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4909272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250