JP5523589B2 - カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 - Google Patents

カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 Download PDF

Info

Publication number
JP5523589B2
JP5523589B2 JP2012556464A JP2012556464A JP5523589B2 JP 5523589 B2 JP5523589 B2 JP 5523589B2 JP 2012556464 A JP2012556464 A JP 2012556464A JP 2012556464 A JP2012556464 A JP 2012556464A JP 5523589 B2 JP5523589 B2 JP 5523589B2
Authority
JP
Japan
Prior art keywords
filter bank
signal
subband
audio signal
synthesis filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012556464A
Other languages
English (en)
Other versions
JP2013525824A (ja
Inventor
ラーシュ ヴィレメース
ペール エクストランド
ザシャ ディッシュ
フレーデリク ナーゲル
シュテファン ヴィルデ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2013525824A publication Critical patent/JP2013525824A/ja
Application granted granted Critical
Publication of JP5523589B2 publication Critical patent/JP5523589B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Networks Using Active Elements (AREA)
  • Auxiliary Devices For Music (AREA)

Description

本発明は、高周波数再構成(HFR)のための高調波転換方法を利用するオーディオ源符号化システム、および高調波の歪みの生成が処理された信号に明瞭さを加える、例えば、いわゆるエキサイタなどのデジタル効果プロセッサ、および元々の信号のスペクトル内容を維持しながら信号の持続時間を拡張する時間伸張器に関する。
PCT WO 98/57436において、オーディオ信号の低い周波数帯域から高周波数帯域を再構成するための方法として転換という概念が確立された。この概念をオーディオ符号化に用いることによってビットレートが実質的に節約できる。HFRに基づいたオーディオ符号化システムでは、低帯域幅信号がコア波形符号器によって処理され、復号器側で、転換と、目標スペクトル形状を記述する非常に低いビットレートの付加的副情報とを用いてより高い周波数が再生成される。コア符号化信号の帯域幅が狭い低ビットレートでは、知覚的に心地よい特性を有する高帯域を再構成することがますます重要になっている。PCT WO 98/57436において定義されている高調波転換は、低クロスオーバ周波数の状況における複雑な音楽素材に対して非常に性能がよい。高調波転換の原理は、周波数ωの正弦曲線を周波数Tω(ここで、T>1は、転換次数を規定する整数である)の正弦曲線にマッピングするということである。これに対し、単一側波帯変調(SSB)に基づくHFR方法は、周波数ωの正弦曲線を周波数ω+Δω(ここで、Δωは、固定の周波数シフト)の正弦曲線にマッピングする。低帯域幅のコア信号であれば、SSB転換により不協和的アーチファクトが生じ得る。
可能な限り最善のオーディオ品質を達成するために、現状の技術水準の高品質な高調波HFR方法は、高周波数分解能および高度なオーバサンプリングを有する複素変調されたフィルタバンク、例えば、短時間フーリエ変換(STFT)を用いて要求されるオーディオ品質を達成する。正弦曲線の合計の非線形処理から生じる不要な相互変調歪みを回避するためには微細分解能が必要である。十分に高い周波数分解能、すなわち、狭いサブバンドでの高品質方法は、各サブバンドに最大1つの正弦曲線を有することを目指す。高度な時間オーバサンプリングは、エイリアス型の歪みを回避するために必要であり、ある程度のオーバサンプリングは、過渡信号の前エコーを回避するために必要である。明らかな欠点は、演算が非常に複雑になり得るということである。
サブバンドブロックに基づいた高調波転換は、相互変調積を抑制するために用いられるもう1つのHFR方法であり、この場合、粗めの周波数分解能および低めのオーバサンプリングを有するフィルタバンク、例えばマルチチャネルQMFバンクを用いる。この方法では、複素サブバンドサンプルの時間ブロックは共通の位相修正器によって処理され、修正されたサンプルをいくつか重畳することで出力サブバンドサンプルを形成する。これは、他の方法では入力サブバンド信号がいくつかの正弦曲線からなる場合に生じるであろう相互変調積を抑制するという正味の効果を有する。ブロックを基本としたサブバンド処理に基づく転換は、高品質な転換器より演算の複雑性がずっと低く、多くの信号に対しほとんど同じ品質を提供する。しかし、この複雑性は、単純なSSBに基づくHFR方法より依然ずっと高いものである。というのは、典型的なHFR応用では、それぞれが異なる転換次数Tの信号を処理する複数の分析フィルタバンクが、所要の帯域幅を合成するために必要であるからである。さらに、フィルタバンクが異なる転換次数の信号を処理するにもかかわらず、入力信号のサンプリングレートを一定のサイズの分析フィルタバンクに適合させるのが一般的な方法である。また、非重複電力スペクトル密度を有する異なる転換次数から処理された出力信号を得るために入力信号にバンドパスフィルタを適用するのが一般的である。
オーディオ信号の記憶または送信は厳しいビットレート制限を受けることがよくある。過去においては、非常に低いビットレートしか可能でない場合、符号器は送信オーディオ帯域幅を大幅に減少させることを余儀なくされてきた。今日の現代的なオーディオコーデックは帯域幅拡張(BWE)方法(文献1〜12)を用いることによって広帯域信号を符号化することができる。これらのアルゴリズムは、HFスペクトル領域(「パッチング」)への転換およびパラメータ駆動の後置処理の応用により復号化された信号の低周波数部分(LF)から生成された高周波数内容(HF)のパラメトリック表現によっている。LF部分は、任意のオーディオまたは音声符号器で符号化される。例えば、文献1〜4に記載の帯域幅拡張方法は、多数のHFパッチを生成するために、「コピーアップ」とも呼ばれる単一側波帯変調(SSB)に依っている。
最近、異なるパッチの生成のために1バンクの位相ボコーダ(文献15〜17)を用いる新しいアルゴリズムが提示されている(文献13)(図20参照)。この方法は、SSB帯域幅拡張が行われた信号にみられることの多い聴覚的な粗さを避けるために開発されてきた。しかし、BWEアルゴリズムをコーデック鎖の復号器側で行うので、演算の複雑性は重大な問題である。現状の方法、特に位相ボコーダに基づくHBEは、SSBに基づく方法に比べて演算の複雑性が大幅に増加するという欠点がある。
上記に概説したように、既存の帯域幅拡張スキームは、一度に1つの所与の信号ブロックにただ1つのパッチング方法(それが、SSBに基づくパッチング(文献1〜4)またはHBEボコーダに基づくパッチング(文献15〜17)であっても)を適用する。さらに、現代のオーディオ符号器(文献19〜20)は、全般的に時間ブロックに基づくパッチング方法を別のパッチングスキーム間で切り替える可能性を提供する。
SSBコピーアップパッチングは、オーディオ信号に不要な粗さを導入するが、演算は単純であり、過渡信号の時間包絡線を保存する。さらに、演算の複雑性は、非常に単純なSSBコピーアップ方法の演算に比べて非常に大きい。
複雑性の低減については、サンプリングレートが特に重要である。これは、高サンプリングレートは複雑性が高く、低サンプリングレートは、一般的に、所要の動作の数が減少するために複雑性が低いためである。しかしながら、一方で、帯域幅拡張応用の状況では、特に、コア符号器出力信号のサンプリングレートは典型的に非常に低いため、このサンプリングレートでは全帯域幅信号には低すぎることとなる。言い換えれば、復号器出力信号のサンプリングレートが、例えば、コア符号器出力信号の最大周波数の2または2.5倍である場合、例えば、係数2での帯域幅拡張というのは、サンプリングが、さらに生成された高周波数成分を「網羅する」ことができるほど帯域幅拡張された信号のサンプリングレートが高くなるようにアップサンプリング動作が必要とされるということである。
さらに、分析フィルタバンクおよび合成フィルタバンクなどのフィルタバンクは、かなりの量の処理動作を担当している。したがって、フィルタバンクの大きさ、すなわち、フィルタバンクが、32チャネルフィルタバンク、64チャネルフィルタバンクまたはさらに多くの数のチャネルを有するフィルタバンクであるかどうかが、オーディオ処理アルゴリズムの複雑性に大きく影響することとなる。一般に、フィルタバンクチャネルの数が多い場合、数が少ない場合に比べて多くの処理動作が必要であるので、より複雑性が高くなる。これにより、ボコーダのような応用または他のオーディオ効果応用などの、異なるサンプリングレートが重要な点である帯域幅拡張応用および他のオーディオ処理応用において、複雑性とサンプリングレートまたはオーディオ帯域幅との間に特定の依存性がある。これは、アップサンプリング動作またはサブバンドフィルタリング動作により、その特定の動作のために不適切なツールまたはアルゴリズムを選択すると、オーディオ品質を特に向上させることなく複雑性が大幅に増加する可能性があるということである。
本発明の目的は、一方で低複雑性処理および他方で高オーディオ品質を可能とするオーディオ処理の向上した概念を提供することである。
この目的は、請求項1または18に記載の入力オーディオ信号を処理する装置、請求項20または21に記載の入力オーディオ信号を処理する方法、または請求項22に記載のコンピュータプログラムによって達成される。
本発明の実施形態は、オーディオ品質を犠牲にすることなく複雑性の低い再サンプリングを得るために、分析および/または合成フィルタバンクの特定のカスケード配置に依る。ある実施形態では、入力オーディオ信号を処理する装置は、入力オーディオ信号からオーディオ中間信号を合成するための合成フィルタバンクを含み、入力オーディオ信号は、処理方向において合成フィルタバンクの前に置かれた分析フィルタバンクによって生成された複数の第1のサブバンド信号によって表され、合成フィルタバンクのフィルタバンクチャネルの数は、分析フィルタバンクのチャネルの数より小さい。中間信号はオーディオ中間信号から複数の第2のサブバンド信号を生成するためのさらなる分析フィルタバンクによってさらに処理され、該さらなる分析フィルタバンクのチャネル数は、合成フィルタバンクのチャネル数と異なり、これにより、上記複数のサブバンド信号のサブバンド信号のサンプリングレートは、分析フィルタバンクによって生成された上記複数の第1のサブバンド信号のうちの第1のサブバンド信号のサンプリングレートとは異なる。
合成フィルタバンクと後に接続されるさらなる分析フィルタバンクとのカスケードは、サンプリングレート変換を提供し、合成フィルタバンクへ入力された元々のオーディオ入力信号の帯域幅部分の基本帯域への変調を追加的に提供する。例えば、帯域幅拡張スキームのコア復号器の出力信号であり得る元々の入力オーディオ信号から抽出されたこの時間中間信号は、好ましくは、基本帯域へ変調された臨界的にサンプリングされた信号として表されており、この表現、すなわち、再サンプリングされた出力信号により、サブバンド表現を得るためにさらなる分析フィルタバンクによって処理される際に、行ってもいいし行わなくてもよいが、例えば、非線形サブバンド動作、続いて高周波数再構成処理および最終的な合成フィルタバンクでのサブバンドの混合などの帯域幅拡張に関係する処理動作であり得るさらなる処理動作を複雑性の低い処理にすることが可能であることを見出した。
本出願は、帯域幅拡張の場合および帯域幅拡張に関係しない他のオーディオ応用の場合におけるオーディオ信号を処理する装置、方法またはコンピュータプログラムの異なる局面を提供する。以下に記載し、特許請求する個々の局面の特徴は、部分的にまたは全部組み合わせることができるが、また、互いに別個に用いることもできる。というのは、個々の局面だけでも、コンピュータシステムまたはマイクロプロセッサで実行されると、知覚的品質、演算の複雑性およびプロセッサ/メモリリソースに関する利点を提供するからである。
実施形態は、入力信号のHFRフィルタバンク分析段への効率的なフィルタリングおよびサンプリングレート変換によってサブバンドブロックに基づく高調波HFR方法の演算の複雑性を低減する方法を提供する。さらに、入力信号へ適用されるバンドパスフィルタは、サブバンドブロックに基づく転換器において時代遅れであることが示され得る。
本実施形態は、単一分析および合成フィルタバンク対のフレームワークにおいて数次数のサブバンドブロックに基づく転換を効率的に実行することによりサブバンドブロックに基づく高調波転換の演算の複雑性を低減することを助ける。知覚的品質対演算の複雑性のトレードオフにより、適切なサブセットの次数のみまたはすべての次数の転換を、フィルタバンク対内で一緒に行うことができる。さらに、ある転換次数だけが直接的に計算されるが、残りの帯域幅は、利用可能な、すなわち、以前に計算された転換次数(たとえば、2次)および/またはコア符号化帯域幅の複製によって満たされるという組み合わされた転換スキーム。この場合、パッチングは、複製のために利用可能な供給源範囲のすべての考え得る組み合わせを用いて実行することができる。
さらに、実施形態は、高品質な高調波HFR方法とサブバンドブロックに基づく高調波HFR方法の両方をHFRツールのスペクトル整合により改善する方法を提供する。特に、HFR生成信号のスペクトル境界を包絡線調整周波数表のスペクトル境界に整合させることによって性能を改善する。さらに、リミッタツールのスペクトル境界を同じ原理によりHFR生成信号のスペクトル境界に整合させる。
さらに、実施形態は、例えば、高調波パッチングとコピーアップパッチングとからなる混合パッチングを適用するパッチングスキームの適用により、過渡信号の知覚品質を改善し、同時に演算の複雑性を低減するよう構成されている。
特定の実施形態において、カスケードのフィルタバンク構造の個々のフィルタバンクは、直交ミラーフィルタバンク(QMF)であり、これはすべて、フィルタバンクチャネルの中心周波数を規定する1セットの変調周波数を用いて変調された低域通過プロトタイプフィルタまたは窓に依る。好ましくは、すべての窓関数またはプロトタイプフィルタは、異なるサイズ(フィルタバンクチャネル)を有するフィルタバンクのフィルタも互いに依存するように互いに依存する。好ましくは、ある実施形態において、第1の分析フィルタバンク、あとに接続されたフィルタバンク、さらなる分析フィルタバンク、および処理のいくらか後の状態では最終的な合成フィルタバンクを含むフィルタバンクのカスケード構造における最大のフィルタバンクは、所定の数の窓関数またはプロトタイプフィルタ係数を有する窓関数またはプロトタイプフィルタ応答を有する。サイズのより小さなフィルタバンクはすべて、この窓関数がサブサンプリングされたものである。すなわち、他のフィルタバンクの窓関数は、「大きな」窓関数のサブサンプリングされたものであるということである。例えば、あるフィルタバンクが大きなフィルタバンクのサイズの半分である場合、窓関数は半分の数の係数を有し、サイズが小さい方のフィルタバンクの係数は、サブサンプリングによって導出される。このような状況において、サブサンプリングとは、例えば、サイズが半分の小さい方のフィルタバンクのために1つおきにフィルタ係数を取るということである。しかし、非整数値のフィルタバンクサイズ間に他の関係があるときは、最後に小さい方のフィルタバンクの窓がここでも大きい方のフィルタバンクの窓のサブサンプリングされたものになるように窓係数のある種の補間を行う。
本発明の実施形態は、さらなる処理のために入力オーディオ信号の一部しか必要としない状況において特に有用であり、この状況はとくに、高調波帯域幅拡張の場合に起こる。この場合、ボコーダ式処理動作が特に好ましい。
この実施形態は、スペクトル整合を用いて、効率的な時間および周波数領域動作によるQMF転換器の複雑性を低減し、QMFおよびDFTに基づく高調波スペクトル帯域複製のオーディオ品質を改善することが実施形態の利点である。
実施形態は、高周波数再構成(HFR)のために例えば、サブバンドブロックに基づく高調波転換方法を用いるオーディオ源符号化システム、および高調波歪みの生成が処理信号に明瞭さを加える、いわゆるエキサイタなどのデジタル効果プロセッサ、および元々の信号のスペクトル内容を維持しながら信号の持続時間を拡張する時間伸張器に関する。実施形態は、HFRフィルタバンク分析段に先立つ入力信号の効率的なフィルタリングおよびサンプリングレート変換によるサブバンドブロックに基づく高調波HFR方法の演算の複雑性を低減する方法を提供する。さらに実施形態は、入力信号に適用される従来のバンドパスフィルタがサブバンドブロックに基づくHFRシステムにおいて時代遅れであることを示している。さらに、実施形態は、高品質な高調波HFR方法とサブバンドブロックに基づく高調波HFR方法の両方をHFRツールのスペクトル整合によって改善する方法を提供する。特に、実施形態は、HFR生成信号のスペクトル境界を包絡線調整周波数表のスペクトル境界に整合することによる性能の改善の仕方を教示する。さらに、リミッタツールのスペクトル境界は、同様の原理によりHFR生成信号のスペクトル境界に整合される。
本発明は、以下に、添付の図面を参照しながら、発明の範囲または精神を限定しない例示的な実施例によって説明する。
図1は、HFR増強復号器フレームワークにおける転換次数が2、3、4のブロックに基づく転換器の動作を示す。 図2は、図1における非線形サブバンド伸長の動作を示す。 図3は、HFR分析フィルタバンクに先立つ再サンプラーおよびバンドパスフィルタが、多重レート時間領域再サンプラーとQMFに基づくバンドパスフィルタとを用いて実施される図1のブロックに基づく転換器の効率的な実施を示す。 図4は、図3の多重レート時間領域再サンプラーの効率的な実施のためのブロックの構築の一例を示す。 図5aは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図5bは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図5cは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図5dは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図5eは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図5fは、転換次数が2の図4の異なるブロックによって処理された信号例への効果を示す。 図6は、HFR分析フィルタバンクに先立つ再サンプラーおよびバンドパスフィルタの代わりに、32帯域分析フィルタバンクから選択されたサブバンドに対し動作する小型のサブサンプリングされた合成フィルタバンクが用いられた図1のブロックに基づく転換器の効率的な実施を示す。 図7は、転換次数が2の図6のサブサンプリングされた合成フィルタバンクによって処理された信号例への効果を示す。 図8aは、係数が2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図8bは、係数が2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図8cは、係数が2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図8dは、係数が2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図8eは、係数が2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図9aは、係数が3/2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図9bは、係数が3/2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図9cは、係数が3/2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図9dは、係数が3/2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図9eは、係数が3/2の効率的な多重レート時間領域ダウンサンプラの実施ブロックを示す。 図10は、HFR増強符号器における包絡線調整周波数帯域の境界に対するHFR転換器信号のスペクトル境界の整合を示す。 図11は、HFR転換信号のスペクトル境界の不整合によってアーチファクトが生じる場合を示す。 図12は、HFR転換信号のスペクトル境界の整合の結果、図11のアーチファクトが回避される場合を示す。 図13は、HFR転換信号のスペクトル境界へのリミッタツールにおけるスペクトル境界の適合を示す。 図14は、サブバンドブロックに基づく高調波転換の原理を示す。 図15は、HFR増強オーディオコーデックにおけるいくつかの転換次数を用いてサブバンドブロックに基づく転換の応用の事例を示す。 図16は、転換次数ごとに別個の分析フィルタバンクを適用する多次数サブバンドブロックに基づく転換動作の従来例を示す。 図17は、64帯域QMF分析フィルタバンクを適用する多次数サブバンドブロックに基づく転換の効率的な動作の本発明の一例を示す。 図18は、サブバンド信号式処理を形成する別の一例を示す。 図19は、単一側波帯変調(SSB)パッチングを示す。 図20は、高調波帯域幅拡張(HBE)パッチングを示す。 図21は、第1のパッチが、周波数拡散により生成され、第2のパッチが低周波数部分のSSBコピーアップにより生成される混合パッチングを示す。 図22は、第2のパッチを生成するためのSSBコピーアップ動作に第1のHBEパッチを用いる別の混合パッチングを示す。 図23は、分析および合成フィルタバンクの好ましいカスケード構造を示す。 図24aは、図23の小型の合成フィルタバンクの好適な実施を示す。 図24bは、図23のさらなる分析フィルタバンクの好適な実施を示す。 図25aは、ISO/IEC 14496−3: 2005(E)の所定の分析および合成フィルタバンクの概要を示し、特に図23の分析フィルタバンクとして用いられ得る分析フィルタバンクの実施および図23の最終合成フィルタバンクとして用いられ得る合成フィルタバンクの実施を示す。 図25bは、図25aの分析フィルタバンクのフローチャートとしての実施を示す。 図25cは、図25aの合成フィルタバンクの好適な実施を示す。 図26は、帯域幅拡張処理の場合のフレームワークの概略図を示す。 図27aは、図23の更なる分析フィルタバンクによって出力されるサブバンド信号の処理の好適な実施を示す。 図27bは、図23の更なる分析フィルタバンクによって出力されるサブバンド信号の処理の好適な実施を示す。
好適な実施形態の説明
以下の実施形態は例示にすぎず、効率的な時間および周波数領域動作によってQMF転換器の複雑性を低減させ、かつ、スペクトル整合によってQMFおよびDFTの両方に基づく高調波SBRのオーディオ品質を改善し得る。ここで説明した構成ならびに詳細の修正および変形が当業者に明らかであろうことが理解される。したがって、添付の特許請求の範囲によってのみ限定され、実施形態の記載および説明によって提示された特定の詳細によって限定されないことが意図される。
図23は、入力オーディオ信号を処理するための装置の好ましい実施を示しており、ここでは、入力オーディオ信号は、例えば、コアオーディオ復号器2301によって出力されたライン2300における時間領域入力信号であり得る。入力オーディオ信号は、例えば、M個のチャネルを有する分析フィルタバンクである第1の分析フィルタバンク2302に入力される。従って、特に、分析フィルタバンク2302は、サンプリングレートがf=f/MであるM個のサブバンド信号2303を出力する。これは、分析フィルタバンクは臨界的にサンプリングされた分析フィルタバンクであることを意味する。つまり、分析フィルタバンク2302は、ライン2300のM個の入力サンプルの各ブロックに対して各サブバンドチャネルにつき1つのサンプルを提供する。好ましくは、分析フィルタバンク2302は、各サブバンドサンプルが振幅および位相または等しく実部分と虚部分とを有することを意味する複素変調されたフィルタバンクである。したがって、ライン2300の入力オーディオ信号は、分析フィルタバンク2302によって生成される複数の第1のサブバンド信号2303によって表される。
すべての第1のサブバンド信号のうちの1サブセットが合成フィルタバンク2304に入力される。合成フィルタバンク2304は、M個のチャネル(ここでMは、Mより小さい)を有する。したがって、フィルタバンク2302によって生成されたサブバンド信号のすべてが合成フィルタバンク2304に入力されるわけではなく、サブセット、すなわち、2305によって示されるようなそれより少ない所定量のチャネルが入力される。図23の実施形態において、サブセット2305は、所定の中間の帯域幅を網羅するが、代替的に、このサブセットはまた、フィルタバンク2302のフィルタバンクチャネル1から始まり、Mより小さいチャネル番号を有するチャネルまでの帯域幅を網羅してもよいし、代替的に、サブセット2305はまた、最も高いチャネルMと整合し、チャネル番号1より高いチャネル番号を有するより低いチャネルまで伸びるサブバンド信号群を網羅してもよい。代替的に、チャネルのインデックス付与は、実際に用いられる表記によっては、ゼロから始まってもよい。しかしながら、好ましくは、帯域幅拡張動作では、2305で示されるサブバンド信号群によって表された所定の中間帯域幅が合成フィルタバンク2304に入力される。
群2305に属さない他のチャネルは、合成フィルタバンク2304に入力されない。合成フィルタバンク2304は、サンプリングレートがf・M/Mである中間のオーディオ信号2306を生成する。MはMよりも小さいので、中間信号2306のサンプリングレートはライン2300の入力オーディオ信号のサンプリングレートよりも小さい。したがって、中間信号2306は、サブバンド2305で表される帯域幅に対応する、ダウンサンプリングされ、かつ、基本帯域に復調された信号を表す。というのは、サブセット2305の境界でのエイリアシング問題を避けるための、最も低いまたは最も高いチャネルについてのゼロパディング動作とは別に、群2305のうち最も低いチャネルは、M合成フィルタバンクのチャネル1に入力され、ブロック2305のうち最も高いチャネルは、ブロック2304の最も高い入力に入力されるからである。入力オーディオ信号を処理する装置は、中間信号2306を分析するためのさらなる分析フィルタバンク2307をさらに備え、該さらなる分析フィルタバンクはM(ここでMは、Mとは異なり、好ましくはMより大きい)個のチャネルを有する。MがMより大きい場合、さらなる分析フィルタバンク2307によって出力された2308で示されるサブバンド信号のサンプリングレートは、サブバンド信号2303のサンプリングレートより低くなる。しかし、MがMより小さい場合、サブバンド信号2308のサンプリングレートは、複数の第1のサブバンド信号2303のサンプリングレートより高くなる。
したがって、フィルタバンク2304および2307(そして好ましくは2302)のカスケードは、非常に効率的で高品質なアップサンプリングまたはダウンサンプリング動作あるいは一般的に非常に効率的な再サンプリング処理ツールを提供する。複数の第2のサブバンド信号2308は、フィルタバンク2304,2307(そして好ましくは2302)のカスケードによって再サンプリングされたデータで処理を行うプロセッサ2309でさらに処理されることが好ましい。さらに、ブロック2309はまた、最後にブロック2309によって出力されたサブバンドがブロック2302によって出力されたサブバンドと同じサンプリングレートであるように帯域幅拡張処理動作のためのアップサンプリング動作を行うことが好ましい。そして、帯域幅拡張処理応用では、これらのサブバンドは、例えば、分析フィルタバンク2302によって生成されるような低帯域サブバンドであることが好ましい、2310で示される追加のサブバンドとともに合成フィルタバンク2311に入力される。合成フィルタバンク2311は、最終的に、処理された時間領域信号、例えばサンプリングレート2fを有する帯域幅拡張された信号を提供する。ブロック2311によって出力されたこのサンプリングレートは、本実施形態では、ライン2300の信号のサンプリングレートの2倍であり、ブロック2311によって出力されたこのサンプリングレートはブロック2309での処理によって生成される追加の帯域幅が、処理された時間領域信号において高オーディオ品質で表されるような十分な大きさである。
カスケードのフィルタバンクの本発明の所定の応用によっては、フィルタバンク2302は、別個の装置であってもよく、入力オーディオ信号を処理する装置は、合成フィルタバンク2304とさらなる分析フィルタバンク2307とを含むのみであり得る。言い換えれば、分析フィルタバンク2302は、ブロック2304,2307と、実施によっては、ブロック2309および2311をも含む「後置」プロセッサとは別に配置されてもよい。
他の実施形態において、カスケードフィルタバンクを実施する本発明の応用は、
ある装置が、分析フィルタバンク2302とそれより小さな合成フィルタバンク2304とを含み、中間信号が、異なるディストリビュータによって、または異なる分散チャネルを介して分散される異なるプロセッサに与えられるという点で異なり得る。そして、分析フィルタバンク2302とそれより小さい合成フィルタバンク2304との混成はサブセット2305によって表される帯域幅信号をダウンサンプリングおよび同時に基本帯域に復調させる非常に効率的な方法を表している。このダウンサンプリングおよび基本帯域への復調は、オーディオ品質にいかなる損失もなく、特にオーディオ情報にいかなる損失もなく行われ、したがって高品質の処理である。
図23の表は、異なる装置のある例示的な番号を示す。好ましくは、分析フィルタバンク2302は32チャネルを有し、合成フィルタバンクは12チャネルを有し、さらなる分析フィルタバンクは、24チャネルといった合成フィルタバンクのチャネルの2倍のチャネルを有し、最終的な合成フィルタバンク2311は、64チャネルを有する。一般的に言って、分析フィルタバンク2302のチャネル数は多く、合成フィルタバンク2304のチャネル数は少なく、さらなる分析フィルタバンク2307のチャネル数は中くらいで、合成フィルタバンク2311のチャネルの数は非常に多い。分析フィルタバンク2302によって出力されたサブバンド信号のサンプリングレートはf/Mである。中間信号のサンプリングレートはf・M/Mである。2308で示されているさらなる分析フィルタバンクのサブバンドチャネルのサンプリングレートは、f・M/(M・M)であり、ブロック2309の処理がサンプリングレートを2倍にする場合、合成フィルタバンク2311は、サンプリングレートが2fの信号を出力する。しかし、ブロック2309の処理がサンプリングレートを2倍にしない場合、合成フィルタバンクによって出力されるサンプリングレートはそれに応じて低くなる。次いで、本発明に関するさらなる好適な実施形態について説明する。
図14は、サブバンドブロックに基づく転換の原理を示している。入力時間領域信号は、多数の複素値化されたサブバンド信号を提供する分析フィルタバンク1401に供給される。これらは、サブバンド処理ユニット1402に供給される。多数の複素値化された出力サブバンドは、合成フィルタバンク1403に供給され、合成フィルタバンク1403は、修正された時間領域信号を出力する。サブバンド処理ユニット1402は、修正された時間領域信号が転換次数T>1に相当する入力信号の転換後のものとなるように非線形ブロックに基づくサブバンド処理動作を行う。ブロックに基づくサブバンド処理という概念は、一度に1つより多いサブバンドサンプルのブロックについての非線形動作を含むことにより定義され、後続のブロックは窓関数処理され、重複加算されて出力サブバンド信号を生成する。
フィルタバンク1401および1403は、QMFまたは窓関数処理されたDFTのような複素指数変調型のいかなるものであってもよい。これらは、変調において偶数または奇数重ねてもよく、広範囲のプロトタイプフィルタまたは窓から定義され得る。物理的ユニットで測定された以下の2つのフィルタバンクパラメータの指数Δf/Δfを知ることは重要である。
Δf:分析フィルタバンク1401のサブバンド周波数間隔
Δf:合成フィルタバンク1403のサブバンド周波数間隔
サブバンド処理1402の構成では、供給源と目標サブバンドインデックスとの対応関係を見つけることが必要である。物理的周波数Ωの入力正弦曲線が、インデックスn≒Ω/Δfの入力サブバンドで生じる主な寄与となる。所望の転換された物理的周波数T・Ωの出力正弦曲線は、インデックスm≒T・Ω/Δfの合成サブバンドを供給することから生じる。したがって、所与の目標サブバンドインデックスmのサブバンド処理の適切な供給源サブバンドインデックス値は、以下の式に従わなくてはならない。
Figure 0005523589
図15は、HFR増強オーディオコーデックでの数次数の転換を用いてサブバンドブロックに基づく転換の応用の事例を示している。送信されたビットストリームをコア復号器1501で受信し、コア復号器1501は、サンプリング周波数fで低帯域幅復号コア信号を与える。低周波数は、複素変調された32帯域QMF分析バンク1502によって、次に、64帯域QMF分析バンク(反転QMF)1505によって、出力サンプリング周波数2fに再サンプリングされる。2つのフィルタバンク1502および1505は、同じ物理的分解能パラメータΔf=Δfを有し、HFR処理ユニット1504は、低帯域幅コア信号に対応する未修正の低い方のサブバンドをそのまま通過させる。多重転換ユニット1503からの出力帯域にHFR処理ユニット1504によってスペクトル成形および修正が行われ、それを64帯域QMF合成バンク1505の高い方のサブバンドに供給することによって出力信号の高周波数内容が得られる。多重転換ユニット1503は、復号されたコア信号を入力し、いくつかの転換された信号成分の重畳または混合の64QMF帯域分析を表す多数のサブバンド信号を出力する。目的は、HFR処理をとばすと、各成分は、コア信号の整数の物理的転換(T=2,3,...)に対応するということである。
図16は、転換次数ごとに別個の分析フィルタバンクを適用する多次数のサブバンドブロックに基づく転換1603の動作の従来の事例を示している。ここでは、出力サンプリングレート2fで動作する64帯域QMFの領域に3つの転換次数T=2,3,4を生成し、伝達するとする。混合ユニット1604は単に、各転換係数分岐からの関連のサブバンドを選択し、HFR処理ユニットに供給すべき単一多重のQMFサブバンドに混合する。
最初に、ケースT=2について考察する。目的は、具体的には、64帯域QMF分析1602−2、サブバンド処理ユニット1603−2、および64帯域QMF合成1505という処理鎖がT=2の物理的転換となることである。これら3つのブロックが図14の1401,1402および1403であると認めると、Δf/Δf=2であるので、(1)式により、1603−2の仕様は、供給源nと目標サブバンドmとの対応関係がn=mとなるということが分かる。
T=3の場合は、例示したシステムは、入力サンプリングレートを係数3/2だけ低くしてfから2f/3に変換するサンプリングレート変換器1601−3を含む。その目的は具体的には、64帯域QMF分析1602−3、サブバンド処理ユニット1603−3、および64帯域QMF合成1505という処理鎖がT=3の物理的転換という結果になることである。これら3つのブロックが図14の1401,1402および1403であると認めると、Δf/Δf=3という再サンプリングであるので、(1)式は、供給源nと目標サブバンドmとの対応関係がここでもn=mとなるという1603−3の仕様を与えることが分かる。
T=4の場合は、例示したシステムは、入力サンプリングレートを係数2だけ低くしてfからf/2に変換するサンプリングレート変換器1601−4を含む。目的は具体的には、64帯域QMF分析1602−4、サブバンド処理ユニット1603−4、および64帯域QMF合成1505という処理鎖がT=4の物理的転換となることである。これら3つのブロックが図14の1401,1402および1403であると認めると、Δf/Δf=4という再サンプリングであるので、(1)式は、供給源nと目標サブバンドmとの対応関係がここでもn=mとなるという1603−4の仕様を与えることが分かる。
図17は、単一の64帯域QMF分析フィルタバンクを適用する多次数サブバンドブロックに基づく転換の効率的な動作のための本発明の事例を示している。実際、図16の3つの別個のQMF分析バンクおよび2つのサンプリングレート変換器を用いると、かなり演算の複雑性は高くなり、また、サンプリングレート変換1601−3のためにフレームに基づく処理の実施による欠点もいくつかある。現在の実施形態は、2つの分岐1601−3→1602−3→1603−3および1601−4→1602−4→1603−4を、それぞれ、サブバンド処理1703−3および1703−4に置き換えることを教示している。ただし、分岐1602−2→1603−2は、図16から変化はない。3つのすべての転換次数は、Δf/Δf=2である図14のフィルタバンク領域で行うことになる。T=3の場合、(1)式で与えられた1703−3の仕様は、供給源nと目標サブバンドmとの対応関係がn≒2m/3であるということである。T=4の場合、(1)式で与えられた1703−4の仕様は、供給源nと目標サブバンドmとの対応関係がn≒2mであるということである。さらに複雑性を低減させるために、すでに計算された転換次数またはコア復号器の出力をコピーして転換次数をいくつか生成してもよい。
図1は、SBR(ISO/IEC 14496-3:2009, "情報技術−オーディオビジュアル対象物の符号化―第3部:オーディオ)などのHFR増強復号器フレームワークにおいて転換次数2,3,4を用いたサブバンドブロックに基づく転換器の動作を示している。ビットストリームは、コア復号器101によって時間領域に復号化され、HFRモジュール103に渡され、HFRモジュール103は、基本帯域コア信号から高周波数信号を生成する。生成後、HFR生成信号は、送信された副情報によってできるだけ元の信号に一致するようにダイナミックに調整される。この調整は、1つまたは幾つかの分析QMFバンクから得られたサブバンド信号に対してHFRプロセッサ105によって行われる。典型的な手法は、コア復号器が、入力および出力信号の周波数の半分の周波数でサンプリングされた時間領域信号に対して動作するというものである。すなわち、HFR復号器モジュールは、コア信号を効果的にサンプリング周波数を2倍に再サンプリングするというものである。このサンプリングレート変換は通常、32帯域分析QMFバンク102によってコア符号器信号をフィルタリングするという第1のステップによって得られる。いわゆるクロスオーバ周波数より下のサブバンド、すなわち、全コア符号器信号エネルギーを含む32サブバンドのより低いサブセットがHFR生成信号を運ぶサブバンドのセットと混成される。通常、そのように混成されたサブバンドの数は64であり、これは、合成QMFバンク106を通してフィルタリングされた後、HFRモジュールからの出力と混合された、サンプリングレート変換コア符号器信号となる。
HFRモジュール103のサブバンドブロックに基づく転換器では、出力サンプリングレート2fで動作する64帯域QMFの領域に3つの転換次数T=2,3,4が生成され、伝達されることになる。入力時間領域信号は、ブロック103−12,103−13および103−14においてバンドパスフィルタリングされる。これが行われるのは、異なる転換次数によって処理された出力信号が生成され、非重複のスペクトル内容を有するようにするためである。信号はさらにダウンサンプリングされ(103−23,103−24)、入力信号のサンプリングレートを一定の大きさ(この場合64)の分析フィルタバンクに合うように適合させる。尚、サンプリングレートをfから2fへ増加させるのは、サンプリングレート変換器が、転換されたサブバンド信号が入力信号と等しいサンプリングレートを有することとなるTではなく、T/2のダウンサンプリング係数を用いるということによって説明することができる。ダウンサンプリングされた信号は、別々のHFR分析フィルタバンク(103−32,103−33および103−34)に供給される。これは、各転換次数に対して1つずつ供給され、これにより、多数の複素数値化されたサブバンド信号が与えられる。これらは、非線形サブバンド伸長ユニット(103−42,103−43および103−44)に供給される。この多数の複素数値化された出力サブバンドは、サブサンプリング分析バンク102からの出力とともに混合/混成モジュール104に供給される。混合/混成ユニットは単に、コア分析フィルタバンク102と単一多重のQMFサブバンドへの各伸長係数分岐とからのサブバンドを混合し、QMFサブバンドは、HFR処理ユニット105に供給される。
異なる転換次数からの信号スペクトルが重複されないよう設定されているとき、すなわち、T次の転換次数信号のスペクトルが、(T−1)次信号からのスペクトルが終了するところから開始するとき、転換された信号は帯域通過特性を有する必要がある。したがって、図1は従来のバンドパスフィルタ103−12〜103−14である。しかし、混合/混成ユニット104による利用可能なサブバンドの中からの単純な排他的選択によって、別個のバンドパスフィルタが必要なくなり、省くことができる。その代わりに、104における異なるサブバンドチャネルに対して転換分岐から異なる寄与を独立して供給することによってQMFバンクによって提供された固有の帯域通過特性が利用される。また、104において混成された帯域のみに時間伸長を適用するだけでもよい。
図2は、非線形サブバンド伸長ユニットの動作を示す。ブロック抽出器201は、複素数値化された入力信号から有限のフレームのサンプルをサンプリングする。フレームは入力ポインター位置によって規定される。このフレームは、202において非線形処理され、次に203の有限長窓によって窓関数処理される。結果としてのサンプルは、出力フレーム位置が出力ポインター位置によって規定される重複加算ユニット204において先に出力されたサンプルに加算される。入力ポインタは、固定量増加され、出力ポインタは同量倍のサブバンド伸長係数で増加される。この一連の動作を繰り返すことで、合成窓の長さまで、入力サブバンド信号持続時間倍のサブバンド伸長係数である持続時間を有する出力信号を生成することになる。
SBRによって用いられるSSB転換器(ISO/IEC 14496-3:2009, "情報技術−オーディオビジュアル対象物の符号化、第3部:オーディオ)は、典型的に、第1のサブバンドを除いて全基本帯域を利用し、高帯域信号を生成するが、高調波転換器は、一般的にコア符号器スペクトルの小さい方の部分を用いる。用いる量、いわゆる供給源範囲は、転換次数、帯域幅拡張係数および混成された結果に適用する規則、例えば、異なる転換次数から生成された信号がスペクトル的に重複できるかどうかに依存する。この結果、所与の転換のための高調波転換器出力スペクトルのうち、実際には限られた部分のみがHFR処理モジュール105によって用いられる。
図18は、単一サブバンド信号を処理するための処理実施例の別の実施形態を示す。単一サブバンド信号は、図18に示されない分析フィルタバンクによってフィルタリングされる前または後のどちらかにある種の間引きが行われている。したがって、単一サブバンド信号の時間長は、間引きされる以前の時間長より短い。単一サブバンド信号は、ブロック抽出器201と同じであり得るが、実施の仕方が異なってもよいブロック抽出器1800に入力される。図18のブロック抽出器1800は、例えば、eと呼ばれるサンプル/ブロック進行値を用いて動作する。サンプル/ブロック進行値は、可変であってもよく、また固定値に設定されていてもよく、図18ではブロック抽出ボックス1800への矢印で示されている。ブロック抽出器1800の出力には、複数の抽出ブロックが存在する。これらのブロックは、大きく重複している。というのは、サンプル/ブロック進行値eは、ブロック抽出器のブロック長さより大幅に小さいからである。例えば、ブロック抽出器は12サンプルのブロックを抽出する。第1のブロックは、サンプル0〜11を含み、第2のブロックは、サンプル1〜12を含み、第3のブロックは、サンプル2〜13を含む、等々である。この実施形態において、サンプル/ブロック進行値eは1であり、11回重複されている。
個々のブロックは、各ブロック毎に窓関数を用いてブロックに窓関数処理を行う窓関数処理器1802に入力される。さらに、各ブロックの位相を計算する位相計算器1804が設けられる。位相計算器1804は、窓関数処理の前または後のいずれかに個々のブロックを用いる。そして、位相調整値p×kは、計算され、位相調整器1806に入力される。位相調整器は、調整値をブロックの各サンプルに適用する。さらに係数kは帯域幅拡張係数に等しい。例えば、係数2の帯域幅拡張を得ようとするとき、ブロック抽出器1800によって抽出されたブロック用に計算された位相pは、係数2で乗算され、位相調整器1806のブロックの各サンプルに適用された調整値はp×2である。これは値/規則の例である。あるいは、合成のために較正された位相は、k * p、p + (k-1)*pである。この例では、較正係数は、乗算の場合、2であり、加算の場合1*pである。位相較正値を計算するために他の値/規則を用いてもよい。
ある実施形態では、単一サブバンド信号は複素サブバンド信号であり、ブロックの位相は複数の異なる方法で計算される。1つの方法は、ブロックの中央または中央近傍のサンプルを採取し、この複素サンプルの位相を計算する。すべてのサンプルの位相を計算することも可能である。
位相調整器は、窓関数処理器の次に動作するように図18に示されているが、これらの2つのブロックを入れ替えて、ブロック抽出器によって抽出されたブロックに対して位相調整を行い、その後に窓関数処理動作を行ってもよい。両動作、すなわち窓関数処理と位相調整は、実数または複素数乗算であるので、これらの2つの動作は、それ自体が位相調整乗算係数と窓関数処理係数との積である複素乗算係数を用いて単一の動作にまとめてもよい。
位相調整されたブロックは、重複/加算および振幅較正ブロック1808に入力され、そこで、窓関数処理され、位相調整されたブロックは、重複加算される。しかしながら、重要なことは、ブロック1808のサンプル/ブロック進行値は、ブロック抽出器1800で用いられた値とは異なるということである。特に、ブロック1808のサンプル/ブロック進行値は、ブロック1800で用いられた値eより大きいので、ブロック1808によって出力された信号の時間伸長が得られる。このように、ブロック1808で出力された処理されたサブバンド信号の長さは、ブロック1800に入力されたサブバンド信号より長い。2の帯域幅拡張を得ようとするとき、ブロック1800の対応する値の2倍のサンプル/ブロック進行値を用いる。これにより、係数が2の時間伸長が得られる。しかし、他の時間伸長係数が必要な場合、ブロック1808の出力が所要の時間長を要するような他のサンプル/ブロック進行値を用いることができる。
重複問題の対応に関しては、ブロック1800,1808において重複が異なるという問題に対応するために振幅較正を行うことが好ましい。しかし、この振幅較正もまた、窓関数処理器/位相調整乗算係数に導入されてもよいが、振幅較正はまた、重複/処理のあとに行われてもよい。
ブロック長が12で、ブロック抽出器のサンプル/ブロック進行値が1である上記の例において、係数が2の帯域幅拡張を行う場合、重複/加算ブロック1808のサンプル/ブロック進行値は2となる。これは、依然として5つのブロックが重複する。係数が3の帯域幅拡張を行う場合、ブロック1808によって用いられるサンプル/ブロック進行値は3となり、重複は低下して、重複3となる。4倍の帯域幅拡張を行う場合、重複加算ブロック1808は4というサンプル/ブロック進行値を用いることが必要であり、2より多い数のブロックの重複となる。
入力信号を供給源範囲だけを含む転換器分岐に限ることによって大きな演算の節約を達成することができ、これは、各転換次数に適合するサンプリングレートにおいてである。サブバンドブロックに基づくHFR生成器のためのこのようなシステムの基本ブロックスキームを図3に示す。入力コア符号器信号は、HFR分析フィルタバンクより前の専用ダウンサンプラによって処理される。
各ダウンサンプラの本質的な作用は、供給源範囲の信号をフィルタリングし、それを、可能な限り低いサンプリングレートで分析フィルタバンクに渡すことである。ここで、「可能な限り低い」とは、ダウンストリーム処理に依然として適切な最も低いサンプリングレートであり、必ずしも間引き後のエイリアシングを回避する最低のサンプリングレートとは限らない。サンプリングレート変換は様々な方法で得ることができる。本発明の範囲はこれには限らないが、以下に2つの例を挙げる。第1の例は、多重レート時間領域処理によって行われる再サンプリングを示し、第2の例は、QMFサブバンド処理によって達成される再サンプリングを示す。
図4は、転換次数が2の多重レート時間領域ダウンサンプラにおけるブロックの例を示す。帯域幅BHzおよびサンプリング周波数fの入力信号を複素指数によって変調して(401)、以下のようなDC周波数へ供給源範囲の開始を周波数シフトする。
Figure 0005523589
変調後の入力信号とスペクトルの例を図5(a)および(b)に示す。変調信号は、補間され(402)、通過帯域限界0およびB/2Hzを有する複素数値化された低域通過フィルタによってフィルタリングされる(403)。それぞれのステップの後のスペクトルを図5(c)および(d)に示す。フィルタリングされた信号はその後、間引きされ(404)、信号の実数部を計算する(405)。これらのステップ後の結果を図5(e)および(f)に示す。この特定の例では、T=2、B=0.6(規格化されたスケール、すなわち、f=2)の場合、供給源範囲を確実に網羅するためにPを24とする。ダウンサンプリング係数は以下のようになる。
Figure 0005523589
ここで、分数は、共通因子8で約分している。従って、補間係数は3であり(図5(c)から分かるように)、間引き係数は8である。ノーブルアンデンティティ(「多重レートシステムおよびフィルタバンク」、P.P.ヴァイディアナサン、1993年、プレンティスホール、イングルウッドクリフ)を用いることによって、間引き器は、図4のずっと左側に、補間器は、ずっと右側に動かすことができる。このように、変調およびフィルタリングは、可能な限り低いサンプリングレートで行われ、演算の複雑性はさらに低下する。
別の手法は、SBR HFR方法にすでに存在するサブサンプリングされた32帯域分析QMFバンク102からのサブバンド出力を用いることである。異なる転換分岐のための供給源範囲を網羅するサブバンドを、HFR分析フィルタバンクの前の小型のサブサンプリングされたQMFバンクによって時間領域に合成する。この種のHFRシステムを図6に示す。小型のQMFバンクは、元の64帯域QMFバンクをサブサンプリングすることによって得られる。ここでは、原型のフィルタ係数は、元の原型フィルタの線形補間によって求められる。図6における表記に従うと、2次転換器分岐の前の合成QMFバンクは、Q=12帯域(32帯域QMFにおいて8から19までのゼロに基づくインデックスを有するサブバンド)を有する。合成プロセスのエイリアシングを防ぐために、第1(インデックス8)および最後(インデックス19)の帯域を0に設定する。その結果、出力されたスペクトルを図7に示す。ブロックに基づく転換分析フィルタバンクは、2Q=24帯域、すなわち、多重レート時間領域ダウンサンプラに基づく例(図3)と同じ数の帯域を有する。
図6および図23を比較すると、図6の要素601が図23の分析フィルタバンク2302に相当することが明らかとなる。さらに、図23の合成フィルタバンク2304は、要素602−2に相当し、図23のさらなる分析フィルタバンク2307は、要素603−2に相当する。ブロック604−2はブロック2309に相当し、混成器605は、合成フィルタバンク2311に相当し得るが、他の実施形態では、混成器はサブバンド信号を出力するよう構成されていてもよいし、混成器に接続されたさらなる合成フィルタバンクを用いてもよい。しかし、実施によっては、図26を参照して後に説明するような所定の高周波数再構成は、合成フィルタバンク2311または混成器205による合成フィルタリングの前に行われてもよいし、図23の合成フィルタバンク2311の合成フィルタリングの後、または図6のブロック605の混成器の後に行われてもよい。
602−3から604−3にのびている、または602−Tから604−Tにのびている他の分岐は図23に示されていないが、同様の方法で実施することができるが、図6のTが転換係数に相当する異なるサイズのフィルタバンクを有して実施することができる。しかし、図27の場合で説明するように、ブロック604−2が係数が2の転換を提供するだけでなく、図26および図27の場合に説明するように用いられる所定の合成フィルタバンクとともに、係数が3および係数が4の転換も提供するように、転換係数が3の転換および転換係数が4の転換を要素602−2〜604−2からなる処理分岐に導入することができる。
図6の実施形態において、Qは、Mに相当し、Mは、例えば12に等しい。さらに、要素2307に相当するさらなる分析フィルタバンク603−2のサイズは該実施形態において24のような2Mに等しい。
さらに、上述したように、合成フィルタバンク2304の最も低いサブバンドチャネルおよび最も高いサブバンドチャネルには、エイリアシング問題を避けるためにゼロを与えてもよい。
図1で概説したシステムは、図3および図4において概説された再サンプリングの単純化した特別のケースとみることができる。この構成を単純化するために、変調器を省く。さらに、HFR分析フィルタリングはすべて、64帯域分析フィルタバンクを用いて得ることができる。したがって、図3のP=P=P=64となり、ダウンサンプリング係数は、2次転換分岐では1、3次転換分岐では1.5、4次転換分岐では2である。
本発明の臨界的サンプリング処理の場合において、MPEG4(ISO/IEC14496−3)に定義されるような図23のブロック2302または図6のブロック601に相当する32帯域分析QMFバンクからのサブバンド信号を用いることができることが本発明の利点である。MPEG−4規格におけるこの分析フィルタバンクの定義を図25aの上側部分に示し、また、MPEG−4規格からとられた図25bのフローチャートとして示されている。この規格のSBR(スペクトル帯域幅複製)部分は、参照により本明細書中に組み込まれている。特に、図23の分析フィルタバンク2302または図6の32帯域QMF601を図25aの上側部分および図25bのフローチャートに示されているように実施することができる。
さらに、図23のブロック2311に示す合成フィルタバンクもまた図25aの下側部分および図25cのフローチャートに示されているように実施することができる。しかし、他の任意のフィルタバンク定義を適用することができるが、少なくとも分析フィルタバンク2302については、図25aおよび図25bに示されるような実施が、少なくともスペクトル帯域幅複製などの帯域幅拡張応用、一般的にいうと、高周波数再構成処理応用の場合において、この32チャネルを有するMPEG−4分析フィルタバンクによって提供されるロバスト性、安定性および高品質のために好ましい。
合成フィルタバンク2304は、転換器のための供給源範囲を網羅するサブバンドのうちの1つのサブセットを合成するよう構成されている。この合成は、時間領域において中間信号2306を合成するために行われる。好ましくは、合成フィルタバンク2304は小型のサブサンプリングされた実数値QMFバンクである。
このフィルタバンクの時間領域出力2306は、次いで、フィルタバンクサイズの2倍の複素値分析QMFバンクに与えられる。このQMFは図23のブロック2307で表されている。この手順によって、関連した供給源範囲だけが2倍の周波数分解能を有するQMFサブバンド領域に変換されるので、演算の複雑性において実質的な節約が可能となる。小型のQMFバンクは、元々の64帯域QMFバンクのサブサンプリングによって得られ、そこでは、プロトタイプフィルタ係数を元々のプロトタイプフィルタの線形補間によって得るのである。好ましくは、640サンプルを有するMPEG−4合成フィルタバンクに関連するプロトタイプフィルタを用い、このMPEG−4分析フィルタバンクは320の窓サンプルの窓を有する。
サブサンプリングされたフィルタバンクの処理を図24aおよび図24bに記述する。まず、以下の変数を決定する。
Figure 0005523589
ここで、Mは、サブサンプリングされた合成フィルタバンクのサイズであり、kは、サブサンプリングされた合成フィルタバンクに入るべき32帯域QMFバンクからの第1のチャネルのサブバンドインデックスを表す。アレイstartSubband2kL を表1に挙げる。床関数{x} は、引数x をマイナス無限大に向かって最も近い整数に丸める。
Figure 0005523589
したがって、M値は、図23の合成フィルタバンク2304のサイズを規定し、Kは、図23に示されるサブセット2305の第1のチャネルである。具体的に、式ftableLowにおける値は、ISO/IEC14496−3、第4.6.18.3.2節に規定されている。これもまた、参照により本明細書に組み入れられる。尚、値Mは増分4で進む。つまり、 合成フィルタバンク2304のサイズは、4、8、12、16、20、24、28または32であり得るということである。
好ましくは、合成フィルタバンク2304は、実数値合成フィルタバンクである。そのためには、1セットのM個の実数値サブバンドサンプルを図24aの第1のステップに従い、M個の新たな複素値サブバンドサンプルから計算する。そのためには、以下の等式を用いる。
Figure 0005523589
この式において、exp() は、複素指数関数を示し、i は、虚数単位であり、kL は上に定義されたものである。
・アレイvのサンプルを2M位置ずらす。最も古い2Mサンプルを捨てる。
・M実数値サブバンドサンプルをマトリックスN,すなわち、マトリックスベクタ積N・Vを計算し、ここで、
Figure 0005523589
この演算からの出力をアレイvの位置0から2M−1に記憶する。
・図24aのフローチャートに従って、vからサンプルを抽出して10M要素アレイgを作成する。
・窓cをアレイのサンプルに掛け、アレイwを生成する。窓係数cは係数cの線形補間、すなわち以下の式により得られる。
Figure 0005523589
ここでμ(n)およびρ(n)は、それぞれ、64・n/Mの整数部および分数部として定義される。窓係数cは、ISO/IEC 14496−3:2009の表4.A.87に見出すことができる。
したがって、合成フィルタバンクは、サイズが異なるフィルタバンクのための記憶された窓関数を用いてサブサンプリングまたは補間によってプロトタイプ窓関数を計算するプロトタイプ窓関数計算器を有する。
・M個の新しい出力サンプルを図24aのフローチャートの最後のステップに従って、アレイwからのサンプルを合算することによって計算する。
続いて、図23のさらなる分析フィルタバンク2307の好ましい実施を図24bのフローチャートとともに説明する。
・図24bの第1のステップに従って、アレイxのサンプルを2M位置ずらす。最も古い方から2M個のサンプルを捨て、2M個の新しいサンプルを位置0〜2M−1に記憶する。
・窓係数c2iをアレイxのサンプルに掛ける。窓係数c2iは係数cの線形補間、すなわち以下の等式により得られる。
Figure 0005523589
ここで、μ(n)およびρ(n)は、それぞれ、32・n/Mの整数部および分数部として定義される。窓係数cは、ISO/IEC 14496−3:2009の表4.A.87に見出すことができる。
したがって、さらなる合成フィルタバンク2307は、サイズが異なるフィルタバンクのための記憶された窓関数を用いてサブサンプリングまたは補間によってプロトタイプ窓関数を計算するプロトタイプ窓関数計算器を有する。
・図24bのフローチャートの式に従って、サンプルを合算して4M要素アレイuを作成する。
・マトリックスベクタ乗算M・uによって2M個の新しい複素値サブバンドサンプルを計算する。ここで、
Figure 0005523589
この式において、exp()は、複素指数関数であり、i は、虚数単位である。
係数2のダウンサンプラのブロック図を図8(a)に示す。現在実数値の低域通過フィルタをH(z)=B(z)/A(z)(ここで、B(z)は非再帰部(FIR)であり、A(z)は再帰部(IIR)である)と書くことができる。しかし、効率的な実施のために、演算の複雑性を低減させるためにノーブルアイデンティティを用いて、すべての極がA(z)として多重度2(二重極)を有するようにフィルタを設計するのがよい。したがって、フィルタは図8(b)に示すように係数化することができる。ノーブルアイデンティティ1を用いて、図8(c)のように再帰部を間引き器を越えるように移動させてもよい。非再帰フィルタB(z)は、以下の式のように標準的な2成分の多相分解を用いて実施することができる。
Figure 0005523589
したがって、ダウンサンプラは、図8(d)のように構成してもよい。ノーブルアイデンティティ1を用いた後、図8(e)に示すように、FIR部を可能な限り低いサンプリングレートで演算する。図8(e)から、FIR動作(遅延、間引きおよび多相成分)は、2つのサンプルの入力ストライドを用いた窓関数加算動作としてみなすことができることが容易に分かる。2つの入力サンプルでは、1つの新しい出力サンプルが生成され、効果的に、係数2のダウンサンプリングとなる。
係数が1.5=3/2のダウンサンプラのブロック図を図9(a)に示す。実数値の低域通過フィルタをここでもH(z)=B(z)/A(z)(ここで、B(z)は非再帰部(FIR)であり、A(z)は再帰部(IIR)である)と書くことができる。上記と同様に、効率的な実施のために、演算の複雑性を低減させるためにノーブルアイデンティティを用いて、すべての極が、それぞれA(z)またはA(z)として多重度2(二重極)または多重度3(三重極)のいずれかを有するようにフィルタを設計するのがよい。ここで、低域通過フィルタの設計アルゴリズムの方が効率的であるので二重極が選ばれているが、実際、その再帰部は三重極手法に比べて実施が1.5倍複雑である。したがって、図9(b)に示すようにフィルタを係数化することができる。ノーブルアイデンティティ2を用いて、図9(c)のように再帰部を補間器の前に移動させてもよい。非再帰フィルタB(z)は、以下の式のように標準的な2・3=6成分の多相分解を用いて実施することができる。
Figure 0005523589
したがって、ダウンサンプラは、図9(d)のように構成してもよい。ノーブルアイデンティティ1および2を用いた後、図9(e)に示すように、FIR部を可能な限り低いサンプリングレートで演算する。図9(e)から、偶数のインデックスの出力サンプルは、低い方のグループの3つの多相フィルタ(E(z),E(z),E(z))を用いて演算され、奇数のインデックスの出力サンプルは、高い方のグループ(E(z),E(z),E(z))から演算されることが容易に分かる。各グループの動作(遅延鎖、間引きおよび多相成分)は、3つのサンプルの入力ストライドを用いた窓関数加算動作としてみなすことができる。、下側のグループは、元のフィルタB(z)からの偶数のインデックスの係数を用いるのに対し、上側のグループに用いられる窓関数係数は奇数のインデックスの係数である。したがって、3つの入力サンプルのグレープでは、2つの新しい出力サンプルが生成され、効果的に、係数1.5のダウンサンプリングとなる。
コア復号器(図1の101)からの時間領域信号はまた、コア復号器のより小さいサブサンプリングされた合成変換を用いることによってサブサンプリングされてもよい。より小さい合成変換を用いることにより、演算の複雑性がさらに低下する。クロスオーバ周波数、すなわち、コア符号器信号の帯域幅によっては、合成変換サイズと名目サイズQ(Q<1)との比がサンプリングレートQfを有するコア符号器出力信号となる。本応用において概説した例におけるサブサンプリングされたコア符号器信号を処理するために、図1のすべての分析フィルタバンク(102,103−32,103−33,103−34)は、図3のダウンサンプラ(301−2,301−3,301−T)、図4の間引き器404および図6の分析フィルタバンク601と同様に、係数Qでスケーリングする必要がある。明らかに、Qは、すべてのフィルタバンクサイズが整数となるように選ぶ必要がある。
図10は、SBR(ISO/IEC 14496-3:2009,「情報技術−オーディオビジュアル対象物の符号化、第3部:オーディオ」)などのHFR増強符号器における包絡線調整周波数表のスペクトル境界に対するHFR転換器信号のスペクトル境界の整合を示している。図10(a)は、クロスオーバ周波数kから停止周波数kまでの周波数範囲を網羅する包絡線調整表、いわゆるスケール係数帯域を含む周波数帯域の様式的グラフを示す。スケール係数帯域は、再生成される高帯域周波数のエネルギーレベル、すなわち、周波数包絡線を調整するときHFR増強符号器に用いられる周波数グリッドを構成する。包絡線を調整するために、信号エネルギーは、スケール係数帯域境界および選択された時間境界によって制約される時間/周波数ブロックについて平均化される。図10(b)に示すように、異なる転換次数によって生成された信号がスケール係数帯域に整合していない場合、転換帯域境界の近傍でスペクトルエネルギーが大幅に変化するとアーチファクトが生じ得る。というのは、包絡線調整プロセスにより、スペクトル構造が1つのスケール係数帯域内に維持されるからである。したがって、提案された解決法は、図10(c)に示すように、転換された信号の周波数境界をスケール係数帯域の境界に適合させることである。この図においては、転換帯域の周波数境界を既存のスケール係数帯域境界に整合させるために、転換次数が2および3(T=2,3)よって生成された信号の上側境界を図10(b)より少し低くしている。
不整合の境界を用いるときのアーチファクトの可能性を示す実際の手法を図11に示す。図11(a)は、ここでもスケール係数帯域境界を示す。図11(b)は、コア復号基本帯域信号とともに転換次数T=2,3,4の調整されていないHFR生成信号を示す。図11(c)は、平らな目標包絡線が想定されたときの包絡線調整された信号を示す。斜め格子模様領域を有するブロックは、出力信号において異常の原因となり得る高い帯域内エネルギー変化を有するスケール係数帯域を表している。
図12は、図11の手法を示すが、今回は整合した境界を用いている。図12(a)は、スケール係数帯域境界を示し、図12(b)は、コア復号基本帯域信号とともに転換次数T=2,3,4の調整されていないHFR生成信号を示し、図11(c)と同様に、図12(c)は、平らな目標包絡線が想定されたときの包絡線調整された信号を示す。この図から分かるように、転換信号帯域の不整合による高い帯域内エネルギー変化を有するスケール係数帯域がないので、アーチファクトの可能性が低下している。
図13は、例えば、SBR(ISO/IEC 14496-3:2009,「情報技術-オーディオビジュアル対象物の符号化、第3部:オーディオ」)に記載されるようなHFRリミッタ帯域境界の、HFR増強符号器における高調波パッチへの適用を示している。リミッタは、スケール係数帯域よりずっと粗い分解能を有する周波数帯域において動作するが、動作の原理はほとんど同じである。リミッタにおいて、リミッタ帯域のそれぞれについての平均の利得値を計算する。スケール係数帯域のそれぞれについて計算された個々の利得値、すなわち、包絡線利得値は、リミッタの平均利得値より、ある乗算係数より多く超えることが許されない。リミッタの目的は、スケール係数帯域利得の大きな変化を各リミッタ帯域内に抑えることである。転換器により生成された帯域をスケール係数帯域に適用すれば、帯域内エネルギーの小さな変化は、確実にスケール係数帯域内になるが、本発明によると、転換器帯域境界にリミッタ帯域境界を適用することにより、転換器で処理された帯域間の大きなスケールエネルギー差を扱う。図13(a)は、転換次数T=2、3、4のHFR生成信号の周波数限界を示す。異なる転換された信号のエネルギーレベルは大きく異なり得る。図13(b)は、典型的に対数周波数目盛での一定の幅を有するリミッタの周波数帯域を示す。転換器周波数帯域境界は、一定のリミッタ境界として加算され、残りのリミッタ境界は、例えば、図13(c)に示されるように、できるだけ対数関係を維持するように再計算される。装置の場合についていくつかの局面を説明してきたが、これらの局面はまた、対応する方法の説明でもあり、対応する方法では、ブロックまたは装置が方法ステップまたは方法ステップの特徴に相当する。同様に、方法ステップの場合において説明している局面はまた、対応するブロックまたは項目あるいは対応する装置の特徴の説明でもあることを表わす。
さらなる実施形態は、図21に示すような混合されたパッチングスキームを用いる。ここでは、時間ブロック内での混合されたパッチング方法が行われている。HFスペクトルの異なる領域を全部網羅するために、BWEはいくつかのパッチを含む。HBEにおいて、より高いパッチは位相ボコーダ内で高い転換係数を必要とし、このため過渡信号の知覚品質が特に悪化する。
このように、実施形態は、好ましくは演算が効率的なSSBコピーアップパッチングによって上側スペクトル領域を占める高次のパッチと、好ましくはHBEパッチングによって高調波構造の保存が望ましい中央のスペクトル領域を網羅する低次のパッチとを生成する。パッチング方法の個々の混合は、経時において静的であってもよいし、また、好ましくは、ビットストリームにおいて信号化され得る。
コピーアップ動作では、図21に示すように低周波数情報を用いる。あるいは、HBE方法を用いて生成されたパッチからのデータを図21に示すように用いてもよい。後者は、高いパッチほど密度の低い音調構造となる。これら2つの例の他にも、コピーアップとHBEのあらゆる組み合わせが考えられる。
提案された概念の利点は、
・過渡信号の知覚品質の改善
・演算の複雑性の低減である。
図26は、帯域幅拡張のための好ましい処理鎖を示す。ここでは、異なる処理動作がブロック1020a,1020bで示される非線形サブバンド処理内で行われる。フィルタバンク2302,2304,2307のカスケードは、図26ではブロック1010によって表わされている。さらに、ブロック2309は、要素1020a,1020bに相当し得、包絡線調整器1030は、図23のブロック2309とブロック2311との間に置くこともできるし、またはブロック2311の処理の後に置くこともできる。この実施においては、帯域幅拡張された信号などの処理された時間領域信号の帯域選択処理が、合成フィルタバンク2311の前に存在する、サブバンド領域ではなく時間領域において行われる。
図26は、さらなる実施形態による低帯域入力信号1000から帯域幅拡張オーディオ信号を生成する装置を示す。この装置は、分析フィルタバンク1010、サブバンド式非線形サブバンドプロセッサ1020a,1020b、続いて接続された包絡線調整器1030、すなわち、一般に言う、例えば、パラメータライン1040で入力されるような高周波数再構成パラメータで動作する高周波数再構成プロセッサを備える。包絡線調整器、すなわち、一般に言う高周波数再構成プロセッサは、各サブバンドチャネルについての個々のサブバンド信号を処理し、各サブバンドチャネルについて処理されたサブバンド信号を合成フィルタバンク1050に入力する。合成フィルタバンク1050は、低帯域コア復号器信号のサブバンド表現をそれより低いチャネル入力信号で受信する。実施によっては、図26における分析フィルタバンク1010の出力から低帯域を取り出すこともできる。転換されたサブバンド信号は、高周波数再構成を行う合成フィルタバンクのより高いフィルタバンクチャネルに供給される。
フィルタバンク1050は、最後に、転換係数2,3,4による帯域幅拡張を含む転換器出力信号を出力し、ブロック1050による出力信号はもはや、クロスオーバ周波数、すなわちSBRまたはHRR生成信号成分の最も低い周波数に対応するコア符号器信号の最も高い周波数に限定された帯域幅ではない。
図26の実施形態において、分析フィルタバンクは、2倍のオーバサンプリングを行い、ある分析サブバンド間隔1060をもっている。合成フィルタバンク1050は、この実施形態においては、図27の場合に後述するような転換寄与に帰着する分析サブバンド間隔の2倍の大きさを有するサブバンド間隔1070を有する。
図27は、図26における非線形サブバンドプロセッサ1020aの好適な実施形態についての詳細な実施を示す。図27に示される回路は、単一のサブバンド信号108を入力として受け取り、これは、3つの「分岐」において処理される。上側分岐110aは、転換係数が2の転換用である。図27において110bで示される中央の分岐は、転換係数が3の転換用であり、図27における下側の分岐は、転換係数が4の転換用であり、参照番号110cにより示されている。しかし、分岐110aについて図27の各処理要素により得られる実際の転換は1つだけ(すなわち、転換なし)である。中央の分岐110bについて図27に示される処理要素により得られる実際の転換は、1.5に等しく、下側の分岐110cについての実際の転換は2に等しい。このことは、転換係数Tが示されている図27の左側への括弧書きの番号により示されている。1.5および2の転換は、分岐110b,110cにおける間引き操作および重複加算プロセッサによる時間伸長処理を有することにより得られる第1の転換寄与を表している。第2の寄与、すなわち、転換の2倍処理は、分析フィルタバンクのサブバンド間隔の2倍である合成サブバンド間隔107を有する合成フィルタバンク105により得られる。従って、合成フィルタバンクは、分析サブバンド間隔の2倍をもつので、いずれの間引き機能も分岐110aにおいては生じない。
しかし、1.5による転換を得るために、分岐110bは間引き機能をもっている。合成フィルタバンクが分析フィルタバンクの物理的サブバンド間隔の2倍を有するということにより、図27において、第2の分岐110bについてのブロック抽出器の左側に示すように転換係数3が得られる。
同様に、第3の分岐は、転換係数2に対応する間引き機能を有し、分析フィルタバンクおよび合成フィルタバンクにおける異なるサブバンド間隔の最終的な寄与は、最終的に第3の分岐110cの転換係数4に対応する。
特に、各分岐は、ブロック抽出器120a,120b,120cを有し、これらのブロック抽出器の各々は、図18のブロック抽出器1800と同じようなものであってもよい。さらに、各分岐は、位相計算器122a,122bおよび122cを有し、この位相計算器は、図18の位相計算器1804と同じようなものであってもよい。さらに、各分岐は位相調整器124a,124b,124cを有し、この位相調整器は、図18の位相調整器1806と同じようなものであってもよい。さらに、各分岐は、窓関数処理器126a,126b,126cを有し、これら窓関数処理器の各々は図18の窓関数処理器1802と同じようなものであってもよい。それにもかかわらず、窓関数処理器126a,126b,126cは、いくつかの「ゼロパディング」とともに矩形窓を適用するようにも構成され得る。図27の実施形態における各分岐110a,110b,110cからの転換またはパッチ信号は、加算器128に入力され、加算器128は、各分岐からの寄与を現在のサブバンド信号に加算し、加算器128の出力でいわゆる転換ブロックを最終的に得る。次に、重複加算器130における重複加算処理が行われ、重複加算器130は、図18の重複/加算ブロック1808と同じようなものであってもよい。重複加算器は、重複加算進行値2・e(ここで、eは、ブロック抽出器120a,120b,120cの重複進行値または「ストライド値」である)を適用し、重複加算器130は、図27の実施形態においては、チャネルk、すなわち、現在観察されているサブバンドチャネルについての単一のサブバンド出力である転換された信号を出力する。図27において示される処理は、各分析サブバンドについてまたはあるグループの分析サブバンドについて行われ、図26において示されるように、転換されたサブバンド信号は、ブロック1030によって処理された後で合成フィルタバンク1050に入力されて、最終的に、ブロック1050の出力で図26において示される転換出力信号を得る。
ある実施形態においては、第1の転換分岐110aのブロック抽出器120aは、10個のサブバンドサンプルを抽出し、その後、これらの10個のQMFサンプルを極座標に変換する。位相調整器124aにより生成されるこの出力は、窓関数処理器126aに送られ、窓関数処理器126aは、ブロックの最初および最後の値についてのゼロにより出力を拡張する。この操作は、長さ10の矩形窓での(合成)窓関数処理に等しい。分岐110aにおけるブロック抽出器120aは、間引きを行わない。したがって、ブロック抽出器によって抽出されたサンプルは、それらが抽出されたのと同じサンプル間隔で、抽出されたブロックにマッピングされる。
しかしながら、これは、分岐110bおよび110cについてのものとは異なる。ブロック抽出器120bは、好ましくは8つのサブバンドサンプルのブロックを抽出し、これらの8つのサブバンドサンプルを、抽出されたブロックにおいて異なるサブバンドサンプル間隔にて分配する。抽出されたブロックについての非整数サブバンドサンプル入力は、補間により得られ、こうして得られたQMFサンプルは、補間サンプルとともに極座標に変換され、位相調整器により処理される。次に、ここでも、窓関数処理器126bにおける窓関数処理が、最初の2つのサンプルと最後の2つのサンプルについてのゼロにより位相調整器124bにより出力されるブロックを拡張するために行われ、その処理は、長さ8の矩形窓での(合成)窓関数処理に等しい。
ブロック抽出器120cは、6個のサブバンドサンプルの時間範囲を持つブロックを抽出するよう構成され、間引き係数2の間引きを行い、QMFサンプルの極座標への変換を行い、そして、位相調整器124bにおいて再度操作を行い、その出力は、ここでは最初の3つのサブバンドサンプルおよび最後の3つのサブバンドサンプルについてのゼロによりここでも拡張される。この操作は、長さ6の矩形窓での(合成)窓関数処理と等しい。
各分岐の転換出力は、ついで加算器128により加算されて混成されたQMF出力を形成し、混成されたQMF出力は最終的にブロック130において重複加算処理を用いて重畳される。ここで、重複加算進行またはストライド値は、上述したようにブロック抽出器120a、120b、120cのストライド値の2倍である。
ある実施形態では、サブバンドブロックに基づく高調波転換を用いることによってオーディオ信号を復号する方法を含み、この方法は、Mバンド分析フィルタバンクによりコア復号信号のフィルタリングを行い、1セットのサブバンド信号を得ることと、該サブバンド信号の1サブセットを、少ない数のサブバンドを有するサブサンプリングされた合成フィルタバンクによって合成し、サブサンプリングした供給源範囲信号を得ることとを含む。
ある実施形態は、HFR生成信号のスペクトルバンド境界をパラメトリックプロセスに用いられたスペクトル境界に整合させる方法に関する。
ある実施形態は、HFR生成信号のスペクトル境界を包絡線調整周波数表のスペクトル境界に整合させる方法に関し、この方法は、転換係数TのHFR生成信号の基本帯域幅限度を超えない包絡線調整周波数表において最も高い境界を検索することと、得られた最も高い境界を転換係数TのHFR生成信号の周波数限度として用いることとを含む。
ある実施形態は、リミッタツールのスペクトル境界をHFR生成信号のスペクトル境界に整合させる方法に関し、この方法は、HFR生成信号の周波数境界をリミッタツールによって用いられる周波数バンド境界を作成するときに用いられる境界の表に加えることと、リミッタが、定数境界として加えられた周波数境界を用い、それに従って残りの境界を調整するようにさせることとを含む。
ある実施形態は、転換動作がサブバンド信号の時間ブロックで行われる低分解能フィルタバンク領域におけるいくつかの整数の転換次数を含むオーディオ信号の混成転換に関する。
さらなる実施形態は、2より大きい転換次数が次数2の転換環境に埋め込まれる混成転換に関する。
さらなる実施形態は、3より大きい転換次数が次数3の転換環境に埋め込まれ、4より低い転換次数は別に行われる混成転換に関する。
さらなる実施形態は、転換次数(例えば、2より大きい転換次数)は、コア符号化帯域幅を含む以前に計算された転換次数(すなわち特に、より低い次数)の複製によって作成される混成転換に関する。利用可能な転換次数のコア帯域幅との考えうるすべての組み合わせが可能であり制限はない。
ある実施形態は、転換に必要な分析フィルタバンクの数を減少させるので演算の複雑性が低下することに関する。
ある実施形態は、入力オーディオ信号からの帯域幅拡張信号を生成するための装置であって、第1のパッチ信号および第1のパッチ信号とは異なるパッチ周波数を有する第2のパッチ信号を得るために入力オーディオ信号をパッチングするパッチャであって、第1のパッチ信号は、第1のパッチングアルゴリズムを用いて生成され、第2のパッチ信号は、第2のパッチングアルゴリズムを用いて生成されるようなパッチャと、帯域幅拡張信号を得るために第1のパッチ信号および第2のパッチ信号を混成する混成器とを含む装置に関する。
さらなる実施形態は、第1のパッチングアルゴリズムが高調波パッチングアルゴリズムであり、第2のパッチングアルゴリズムが非高調波パッチングアルゴリズムである該装置に関する。
さらなる実施形態は、第1のパッチング周波数は、第2のパッチング周波数より低いか、またはその反対である上記の装置に関する。
さらなる実施形態は、入力信号がパッチング情報を含み、パッチャが、パッチング情報に応じて第1のパッチングアルゴリズムまたは第2のパッチングアルゴリズムを変化させるために入力信号から抽出されたパッチング情報により制御されるよう構成される上記の装置に関する。
さらなる実施形態は、パッチャが、オーディオ信号サンプルの後続ブロックをパッチするよう動作し、パッチャが、第1のパッチングアルゴリズムおよび第2のパッチングアルゴリズムをオーディオサンプルの同じブロックに適用するよう構成される上記の装置に関する。
さらなる実施形態は、パッチャが、任意の次数で、帯域幅拡張係数によって制御される間引き器、フィルタバンクおよびフィルタバンクサブバンド信号のための伸長器を含む上記の装置に関する。
さらなる実施形態は、伸長器が、抽出進行値に応じて多くの重複ブロックを抽出するブロック抽出器と、窓関数および位相較正に基づいて各ブロックのサブバンドサンプリング値を調整する位相調整器または窓関数処理器と、抽出進行値よりも大きい重複進行値を用いて窓関数処理され、かつ、位相調整されたブロックの重複加算処理を行う重複/加算器とを含む上記の装置に関する。
さらなる実施形態は、オーディオ信号を帯域幅拡張するための装置であって、ダウンサンプリングされたサブバンド信号を得るためにオーディオ信号をフィルタリングするフィルタバンクと、異なる方法で異なるサブバンド信号を処理する複数の異なるサブバンドプロセッサであって、異なる伸長係数を用いて異なるサブバンド信号時間伸長動作を行う複数の異なるサブバンドプロセッサと、帯域幅拡張されたオーディオ信号を得るために複数の異なるサブバンドプロセッサによって出力される処理されたサブバンドを混合するための混合器とを含む装置に関する。
さらなる実施形態は、オーディオ信号をダウンサンプリングするための装置であって、変調器と、補間係数を用いる補間器と、複素低域通過フィルタと、補間係数より高い間引き係数を用いる間引き器とを含む装置に関する。
ある実施形態は、オーディオ信号をダウンサンプリングするための装置であって、オーディオ信号から複数のサブバンド信号を生成するための第1のフィルタバンクであって、サブバンド信号のサンプリングレートがオーディオ信号のサンプリングレートよりも低いような第1のフィルタバンクと、サンプルレート変換を行うための分析フィルタバンクがあとに続く少なくとも1つの合成フィルタバンクであって、分析フィルタバンクのチャネル数と異なるチャネル数を有する合成フィルタバンクと、サンプルレート変換された信号を処理するための時間伸長プロセッサと、時間伸長された信号と低帯域信号または異なる時間伸長された信号とを混成するための混成器とを含む装置に関する。
さらなる実施形態は、非整数のダウンサンプリング係数によってオーディオ信号をダウンサンプリングするための装置であって、デジタルフィルタと、補間係数を有する補間器と、偶数および奇数のタップを有する多位相要素と、補間係数より大きな間引き係数を有する間引き器とを含み、間引き係数および補間係数は、補間係数と間引き係数の比が整数ではないように選択される装置に関する。
ある実施形態は、オーディオ信号を処理するための装置であって、ある係数分名目変換サイズより小さい合成変換サイズを有するコア復号器であって、名目変換サイズに対応する名目サンプリングレートより小さなサンプリングレートを有するコア復号器によって出力信号が生成されるコア復号器と、1つ以上のフィルタバンクを有するポストプロセッサと、1つ以上の時間伸長器と、混合器とを含み、1つ以上のフィルタバンクのフィルタバンクチャネルの数が、名目変換サイズによって決定された数より少ない装置に関する。
さらなる実施形態は、低帯域信号を処理するための装置であって、低帯域オーディオ信号を用いて多数のパッチを生成するパッチ生成器と、スケール係数帯域境界を有する隣接するスケール係数帯域に与えられたスケール係数を用いて信号の包絡線を調整する包絡線調整器とを含み、パッチ生成器は、隣接するパッチ間の境界が、周波数スケールにおいて隣接するスケール係数間の境界と一致するように、多数のパッチを行うよう構成された装置に関する。
ある実施形態は、低帯域オーディオ信号を処理するための装置であって、低帯域オーディオ信号を用いて多数のパッチを生成するパッチ生成器と、リミッタ帯域境界を有する隣接するリミッタ帯域に制限することによって信号の包絡線調整値を制限する包絡線調整リミッタとを含み、パッチ生成器は、隣接するパッチ間の境界が、周波数スケールにおいて隣接するリミッタ帯域間の境界と一致するように、多数のパッチを行うよう構成された装置に関する。
本発明の処理は帯域幅拡張スキームに依るオーディオコーデックを増強するために有用である。特に、所与のビットレートでの最適な知覚品質が非常に重要であり、同時に処理力が制限されたリソースである場合に有用である。
最も適した応用は、オーディオ復号器であり、これは携帯式装置で実施され、したがって電池での電力供給で動作することが多い。
本発明の符号化されたオーディオ信号は、デジタル記憶媒体に記憶することもできるし、また、インターネットのような、無線送信媒体または有線送信媒体などの送信媒体で送信することもできる。
実施要件によっては、本発明の実施形態は、ハードウェアまたはソフトウェアにおいて実施可能である。そのような実施は、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協同する(または協同し得る)電子的に読み取り可能な制御信号を記憶させるデジタル記憶媒体、例えば、フロッピーディスク、DVD、CD、ROM、PROM、EPROM、EEPROM、またはフラッシュメモリを用いて行うことが可能である。
本発明によるいくつかの実施形態は、ここで記述された方法のうちの1つを行うように、プログラム可能なコンピュータシステムと協働し得る電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般的に、本発明の実施形態は、コンピュータプログラムがコンピュータで実行されるときに、方法のうちの1つを行う動作が可能なプログラムコードを持つコンピュータプログラム製品として実施することが可能である。プログラムコードは、例えば、マシン可読キャリアに記憶され得る。
他の実施形態は、マシン可読キャリアに記憶された、ここで記述された方法のうちの1つを行うコンピュータプログラムを含む。
言い換えると、発明の方法の実施形態は、それゆえにコンピュータプログラムがコンピュータで実行されるときに、ここで記述された方法のうちの1つを行うためのプログラムコードを有するコンピュータプログラムである。
従って、本発明の方法のさらなる実施形態は、ここで記述された方法のうちの1つを行うためのコンピュータプログラムを記憶して成るデータキャリア(デジタル記憶媒体、またはコンピュータ可読媒体)である。
従って、本発明の方法のさらなる実施形態は、ここで記載された方法のうちの1つを行うためのコンピュータプログラムを表すデータストリームまたは信号列である。このデータストリーム、すなわち、信号列は、例えば、インターネットを介したデータ通信接続を介して転送されるよう構成され得る。
さらなる実施形態は、ここで記述された方法のうちの1つを行うよう構成されるかまたは適合する処理手段、例えば、コンピュータ、すなわち、プログラム可能な論理デバイスを含む。
さらなる実施形態は、ここで記述された方法のうちの1つを行うためのコンピュータプログラムがインストールされたコンピュータを含む。
いくつかの実施形態において、プログラム可能な論理デバイス(例えば、フィールドプログラマブルゲートアレイ)を、ここで記述された方法のうちの機能のいくつかまたはすべてを行うために使用し得る。いくつかの実施形態においては、フィールドプログラマブルゲートアレイは、ここで記述された方法のうちの1つを行うために、マイクロプロセッサと協同し得るものである。一般に、これらの方法は、好ましくは、何らかのハードウェア装置により行われる。
上述した実施形態は、単に本発明の原理を例示するに過ぎない。構成の修正及び変形、並びにここに記述された詳細は、当業者にとっては明白であると考える。従って、本発明は、ここでの実施形態の記述及び説明により表される特定の細部によるのではなく、付随する特許請求の範囲によってのみ限定されるべきであることが意図される。
[文献]
(1) M. Dietz, L. Liljeryd, K. Kjoerling および O. Kunz, “Spectral Band Replication, a novel approach in audio coding,”(スペクトル帯域複製、オーディオ符号化における新しい手法」)第112回AES会議、ミュンヘン、2002年5月
(2) S. Meltzer, R. Boehmおよび F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM),”(「全世界のデジタルラジオ」などのデジタル放送用SBR増強オーディオコーデック)第112回 AES会議、 ミュンヘン、2002年5月
(3) T. Ziegler, A. Ehret, P. Ekstrandおよび M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,”(SBRでのmp3増強:新しいmp3PROアルゴリズムの特徴と能力)第112回 AES会議、ミュンヘン、2002年5月
(4) 国際規格ISO/IEC 14496-3:2001/FPDAM 1, “Bandwidth Extension,”(帯域幅拡張) ISO/IEC, 2002. Speech bandwidth extension method and apparatus(音声帯域幅拡張方法および装置)Vasu Iyengarら
(5) E. Larsen, R. M. Aarts,および M. Danessis. Efficient high-frequency bandwidth extension of music and speech(音楽と音声の効率的な高周波数帯域幅拡張)第112回AES会議、ミュンヘン、ドイツ、2002年5月
(6) R. M. Aarts, E. Larsen,および O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension(低域および高域周波数帯域幅拡張の統一手法)第115回AES会議、ニューヨーク、USA、2003年10月.
(7) K. Kaeyhkoe. A Robust Wideband Enhancement for Narrowband Speech Signal. Research Report(狭帯域音声信号用ロバストな広帯域増強、リサーチリポート), Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing(音響およびオーディオ信号処理実験室), 2001年.
(8) E. Larsenおよび R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design(オーディオ帯域幅拡張−心理音響学、信号処理および拡声器設計への応用). John Wiley & Sons, Ltd, 2004年
(9) E. Larsen, R. M. Aarts,および M. Danessis. Efficient high-frequency bandwidth extension of music and speech(音楽と音声の効率的な高周波数帯域幅拡張)第112回AES会議、ミュンヘン、ドイツ、2002年5月
(10) J. Makhoul. Spectral Analysis of Speech by Linear Prediction(線形予測による音声のスペクトル分析、IEEE Transactions on Audio and Electroacoustics, AU-21(3), 1973年6月.
(11) 米国特許出願第08/951,029号, Ohmoriら Audio band width extending system and method(オーディオ帯域幅拡張システムおよび方法)
(12) 米国特許第6895375号, Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech(狭帯域音声の帯域幅拡張用システム)
(13) Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs,”(オーディオコーデック用高調波帯域幅拡張方法)音響、音声および信号処理についての ICASSP国際会議、IEEE CNF、台北、台湾、2009年4月
(14) Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, “A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs,”(オーディオコーデック用新しい過渡信号処理でのボコーダ駆動帯域拡張方法) 第126回AES会議、ミュンヘン、ドイツ、2009年5月
(15) M. Puckette. Phase-locked Vocoder. IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995."(位相ロックされたボコーダ、オーディオおよび音響への信号処理の応用に関するIEEE ASSP会議、モホンク1995年), Roebel, A.: Transient detection and preservation in the phase vocoder(位相ボコーダにおける過渡信号検出および保存); citeseer.ist.psu.edu/679246.html
(16) Laroche L., Dolson M.: “Improved phase vocoder timescale modification of audio"(オーディオの向上した位相ボコーダ時間スケール修正)、 IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323--332,
(17) 米国特許第6549884号 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting(位相ボコーダピッチシフティング)
(18) Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Hoelzer, A.; Spenger, C, “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio,” (MP3サラウンド:多重チャネルオーディオの効率的で互換性のある符号化)、第116回 会議、Aud. Eng. Soc., 2004年5月
(19) Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jeremie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates(低ビットレートでの高品質のための統一音声およびオーディオ符号化スキーム)、ICASSP 2009年、2009年4月19〜24日、台北、台湾
(20) Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jeremie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding(低ビットレート統一音声およびオーディオ符号化のための新スキーム)、第126回AES会議、2009年5月7日、ミュンヘン

Claims (22)

  1. 入力オーディオ信号(2300)を処理するための装置であって、
    入力オーディオ信号(2300)から中間オーディオ信号(2306)を合成するための合成フィルタバンク(2304)であって、該入力オーディオ信号(2300)は、分析フィルタバンク(2302)によって生成される複数の第1のサブバンド信号(2303)によって表され、合成フィルタバンク(2304)のフィルタバンクチャネル数(MS)は、分析フィルタバンク(2302)のチャネル数(M)より小さい、合成フィルタバンク(2304)と、
    前記中間オーディオ信号(2306)から複数の第2のサブバンド信号(2308)を生成するためのさらなる分析フィルタバンク(2307)であって、該さらなる分析フィルタバンク(2307)は、前記合成フィルタバンク(2304)のチャネル数とは異なるチャネル数(MA)を有し、前記複数の第2のサブバンド信号(2308)のサブバンド信号のサンプリングレートは、前記複数の第1のサブバンド信号(2303)の第1のサブバンド信号のサンプリングレートとは異なる、さらなる分析フィルタバンク(2307)とを備える装置。
  2. 前記合成フィルタバンク(2304)は、実数値フィルタバンクである、請求項1に記載の装置。
  3. 前記複数の第1のサブバンド信号(2303)の第1のサブバンド信号の数は、24以上であり、
    前記合成フィルタバンク(2304)のフィルタバンクチャネルの数は、22以下である、請求項1に記載の装置。
  4. 前記合成フィルタバンク(2304)は、全帯域幅入力オーディオ信号(2300)を表す前記複数の第1のサブバンド信号のすべての第1のサブバンド信号(2303)のサブグループ(2305)のみを処理するよう構成され、前記合成フィルタバンク(2304)は、基本帯域に変調される全帯域幅入力オーディオ信号(2300)の帯域セグメントとして前記中間オーディオ信号(2306)を生成するよう構成されている、請求項1から請求項3のいずれか1項に記載の装置。
  5. 前記複数の第1のサブバンド信号(2303)を得るために、前記入力オーディオ信号(2300)の時間領域表現を受け取り、該時間領域表現を分析するための分析フィルタバンク(2302)をさらに備え、
    前記複数の第1のサブバンド信号(2303)のサブグループ(2305)は、前記合成フィルタバンク(2304)に入力され、
    前記複数の第1のサブバンド信号の残りのサブバンド信号は、前記合成フィルタバンク(2304)に入力されない、請求項1から請求項4のいずれか1項に記載の装置。
  6. 前記分析フィルタバンク(2302)は、複素値フィルタバンクであり、
    前記合成フィルタバンク(2304)は、前記第1のサブバンド信号から実数値サブバンド信号を計算する実数値計算器を含み、
    該実数値計算器によって計算された実数値サブバンド信号は、前記中間オーディオ信号(2306)を得るために前記合成フィルタバンク(2304)によってさらに処理される、請求項1から請求項5のいずれか1項に記載の装置。
  7. 前記さらなる分析フィルタバンク(2307)は、複素値フィルタバンクであり、前記複数の第2のサブバンド信号(2308)を複素サブバンド信号として生成するよう構成されている、請求項1から請求項6のいずれか1項に記載の装置。
  8. 前記合成フィルタバンク(2304)、前記さらなる分析フィルタバンク(2307)または前記分析フィルタバンク(2302)は、同じフィルタバンク窓のサブサンプリングされたものを用いるよう構成されている、請求項1から請求項7のいずれか1項に記載の装置。
  9. 前記複数の第2のサブバンド信号(2308)を処理するためのサブバンド信号プロセッサ(2309)と、
    複数の処理されたサブバンドをフィルタリングするためのさらなる合成フィルタバンク(2311)とをさらに備え、
    前記さらなる合成フィルタバンク(2311)、前記合成フィルタバンク(2304)、前記分析フィルタバンク(2302)または前記さらなる分析フィルタバンク(2307)は、同じフィルタバンク窓のサブサンプリングされたものを用いるよう構成されているか、あるいは、前記さらなる合成フィルタバンク(2311)は、合成窓を適用するよう構成され、
    前記さらなる分析フィルタバンク(2307)、前記合成フィルタバンク(2304)または前記分析フィルタバンク(2302)は、前記さらなる合成フィルタバンク(2311)によって用いられる合成窓のサブサンプリングされたものを適用するよう構成されている、請求項1から請求項8のいずれか1項に記載の装置。
  10. 複数の処理されたサブバンドを得るために1つのサブバンドにつき1つの非線形処理動作を行うためのサブバンド信号プロセッサ(2309)と、
    送信されたパラメータ(1040)に基づいて入力信号を調整するための高周波数再構成プロセッサ(1030)と、
    前記入力オーディオ信号(2300)と前記複数の処理されたサブバンド信号とを混成するためのさらなる合成フィルタバンク(2311,1050)とをさらに備え、
    前記高周波再構成プロセッサ(1030)は、前記さらなる合成フィルタバンク(1050、2311)の出力を処理し、または、前記複数の処理されたサブバンドが前記さらなる合成フィルタバンク(2311,1050)に入力される前に、前記複数の処理されたサブバンドを処理するよう構成されている、請求項1から請求項9のいずれか1項に記載の装置。
  11. 前記さらなる分析フィルタバンク(2307)または前記合成フィルタバンク(2304)は、前記さらなる分析フィルタバンク(2307)または前記合成フィルタバンク(2304)のためのチャネル数に関する情報を用いて、サイズが異なるフィルタバンクのための記憶された窓関数を用いてサブサンプリングまたは補間することによってプロトタイプ窓関数を計算するためのプロトタイプ窓関数計算器を有する、請求項1から請求項10のいずれか1項に記載の装置。
  12. 前記合成フィルタバンク(2304)は、前記合成フィルタバンク(2304)の最も低いフィルタバンクチャネルおよび最も高いフィルタバンクチャネルへの入力をゼロに設定するよう構成されている、請求項1から請求項11のいずれか1項に記載の装置。
  13. ブロックに基づく高調波転換を行うよう構成されている装置であって、前記合成フィルタバンク(2304)は、サブサンプリングされたフィルタバンクである、請求項1から請求項12のいずれか1項に記載の装置。
  14. 前記複数の第2のサブバンド信号(2308)を処理するためのサブバンド信号プロセッサ(2309)をさらに備え、
    前記サブバンド信号プロセッサ(2309)は、任意の順番で、帯域幅拡張係数により制御される間引き器と、サブバンド信号用の伸長器とを含み、
    前記伸長器は、抽出進行値に応じていくつかの重複しているブロックを抽出するためのブロック抽出器(1800,120a,120b,120c)と、窓関数または位相較正に基づいて各ブロックにおけるサブバンドサンプリング値を調整するための位相調整器(1806,124a,124b,124c)または窓関数処理器(1802,126a,126b,126c)と、前記抽出進行値より大きな重複進行値を用いて窓関数処理され、位相調整されたブロックの重複加算処理を行うための重複加算器(1808,130)とを含む、請求項1から請求項13のいずれか1項に記載の装置。
  15. サブバンド信号プロセッサ(2309)をさらに備え、
    前記サブバンド信号プロセッサ(2309)は、
    転換信号を得るために異なる転換係数のための複数の異なる処理分岐(110a,110b,110c)であって、各処理分岐が、サブバンドサンプルのブロックを抽出する(120a,120b,120c)よう構成される複数の異なる処理分岐(110a,110b,110c)と、
    転換ブロックを得るために、前記転換信号を加算するための加算器(128)と、
    前記複数の異なる処理分岐(110a,110b,110c)におけるブロックを抽出する(120a,120b,120c)ために用いられるブロック進行値より大きなブロック進行値を用いて時間的に連続した転換ブロックを重複加算するための重複加算器(130)とを含む、請求項1から請求項14のいずれか1項に記載の装置。
  16. 前記合成フィルタバンク(2304)および前記さらなる分析フィルタバンク(2307)が、サンプルレート変換を行うよう構成されている前記分析フィルタバンク(2302)と、
    前記サンプルレート変換された信号を処理するための時間伸長プロセッサ(100a,100b,100c)と、
    処理された時間領域信号を得るための時間伸長プロセッサによって生成された処理サブバンド信号を混成するための混成器(2311,605)とをさらに備える、請求項1から請求項15のいずれか1項に記載の装置。
  17. 前記さらなる分析フィルタバンク(2307)のチャネル数は、前記合成フィルタバンク(2304)のチャネルの数より大きい、請求項1から請求項16のいずれか1項に記載の装置。
  18. 入力オーディオ信号を処理するための装置であって、
    ある数(M)の分析フィルタバンクチャネルを有する分析フィルタバンク(2302)であって、該分析フィルタバンク(2302)は、複数の第1のサブバンド信号(2303)を得るために入力オーディオ信号(2300)をフィルタリングするよう構成されている、分析フィルタバンク(2302)と、
    第1のサブバンド信号(2303)の一群(2305)を用いて中間オーディオ信号(2306)を合成するための合成フィルタバンク(2304)であって、該一群は、前記分析フィルタバンク(2302)のフィルタバンクチャネルの数より小さい数のサブバンド信号を含み、前記中間オーディオ信号(2306)は、前記入力オーディオ信号(2300)の一帯域幅部分のサブサンプリング表現である、合成フィルタバンク(2304)とを備える装置。
  19. 前記分析フィルタバンク(2302)は、臨界的にサンプリングされた複素QMFフィルタバンクであり、
    前記合成フィルタバンク(2304)は、臨界的にサンプリングされた実数値QMFフィルタバンクである、請求項18に記載の装置。
  20. 入力オーディオ信号を処理するための方法であって、
    入力オーディオ信号(2300)から中間オーディオ信号(2306)を合成するための合成フィルタバンク(2304)を用いて合成フィルタリングするステップであって、該入力オーディオ信号(2300)は、分析フィルタバンク(2302)によって生成される複数の第1のサブバンド信号(2303)によって表され、合成フィルタバンク(2304)のフィルタバンクチャネルの数(MS)は、分析フィルタバンク(2302)のチャネル数(M)より小さい、合成フィルタリングステップと、
    前記中間オーディオ信号(2306)から複数の第2のサブバンド信号(2308)を生成するためのさらなる分析フィルタバンク(2307)を用いて分析フィルタリングするステップであって、該さらなる分析フィルタバンク(2307)は、前記合成フィルタバンク(2304)のチャネル数とは異なるチャネル数(MA)を有し、前記複数の第2のサブバンド信号(2308)のサブバンド信号のサンプリングレートは、前記複数の第1のサブバンド信号(2303)の第1のサブバンド信号のサンプリングレートとは異なる、分析フィルタリングステップとを含む方法。
  21. 入力オーディオ信号を処理するための方法であって、
    ある数(M)の分析フィルタバンクチャネルを有する分析フィルタバンク(2302)を用いて分析フィルタリングするステップであって、該分析フィルタバンク(2302)は、複数の第1のサブバンド信号(2303)を得るために入力オーディオ信号(2300)をフィルタリングするよう構成されている、分析フィルタバンクステップと、
    第1のサブバンド信号(2303)の一群(2305)を用いて中間オーディオ信号(2306)を合成するための合成フィルタバンク(2304)を用いて合成フィルタリングするステップであって、該一群は、前記分析フィルタバンク(2302)のフィルタバンクチャネルの数より小さい数のサブバンド信号を含み、前記中間オーディオ信号(2306)は、前記入力オーディオ信号(2300)の一帯域幅部分のサブサンプリング表現である、合成フィルタリングステップとを含む方法。
  22. 求項20または21に記載の方法をコンピュータに実行させるためのコンピュータプログラム。
JP2012556464A 2010-03-09 2011-03-04 カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法 Active JP5523589B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09
US61/312,127 2010-03-09
PCT/EP2011/053315 WO2011110500A1 (en) 2010-03-09 2011-03-04 Apparatus and method for processing an input audio signal using cascaded filterbanks

Publications (2)

Publication Number Publication Date
JP2013525824A JP2013525824A (ja) 2013-06-20
JP5523589B2 true JP5523589B2 (ja) 2014-06-18

Family

ID=43987731

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2012556463A Active JP5588025B2 (ja) 2010-03-09 2011-03-04 パッチ境界整合を用いてオーディオ信号を処理するための装置および方法
JP2012556464A Active JP5523589B2 (ja) 2010-03-09 2011-03-04 カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012556463A Active JP5588025B2 (ja) 2010-03-09 2011-03-04 パッチ境界整合を用いてオーディオ信号を処理するための装置および方法

Country Status (18)

Country Link
US (7) US9305557B2 (ja)
EP (4) EP2545553B1 (ja)
JP (2) JP5588025B2 (ja)
KR (2) KR101414736B1 (ja)
CN (2) CN103038819B (ja)
AR (2) AR080477A1 (ja)
AU (2) AU2011226211B2 (ja)
BR (5) BR122021014312B1 (ja)
CA (2) CA2792452C (ja)
ES (2) ES2935637T3 (ja)
HK (1) HK1181180A1 (ja)
MX (2) MX2012010416A (ja)
MY (1) MY154204A (ja)
PL (2) PL3570278T3 (ja)
RU (1) RU2586846C2 (ja)
SG (1) SG183967A1 (ja)
TW (2) TWI446337B (ja)
WO (2) WO2011110499A1 (ja)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
EP2581905B1 (en) 2010-06-09 2016-01-06 Panasonic Intellectual Property Corporation of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
TWI478548B (zh) * 2012-05-09 2015-03-21 Univ Nat Pingtung Sci & Tech 對等網路串流傳輸方法
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103915104B (zh) * 2012-12-31 2017-07-21 华为技术有限公司 信号带宽扩展方法和用户设备
WO2014129233A1 (ja) * 2013-02-22 2014-08-28 三菱電機株式会社 音声強調装置
WO2014142576A1 (ko) * 2013-03-14 2014-09-18 엘지전자 주식회사 무선 통신 시스템에서 단말 간 직접 통신을 이용한 신호 수신 방법
CN105393456B (zh) * 2013-03-26 2018-06-22 拉克伦·保罗·巴拉特 虚拟采样率增加的音频滤波
US9305031B2 (en) 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
TWI548190B (zh) * 2013-08-12 2016-09-01 中心微電子德累斯頓股份公司 根據控制法則來控制功率轉換器的功率級之控制器及方法
WO2015027327A1 (en) * 2013-08-28 2015-03-05 Mixgenius Inc. System and method for performing automatic audio production using semantic data
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
WO2015041477A1 (ko) 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10204630B2 (en) 2013-10-22 2019-02-12 Electronics And Telecommunications Research Instit Ute Method for generating filter for audio signal and parameterizing device therefor
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
WO2015079946A1 (ja) * 2013-11-29 2015-06-04 ソニー株式会社 周波数帯域拡大装置および方法、並びにプログラム
BR112016014892B1 (pt) 2013-12-23 2022-05-03 Gcoa Co., Ltd. Método e aparelho para processamento de sinal de áudio
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
EP4294055A1 (en) 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
CN108966111B (zh) 2014-04-02 2021-10-26 韦勒斯标准与技术协会公司 音频信号处理方法和装置
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
KR101523559B1 (ko) * 2014-11-24 2015-05-28 가락전자 주식회사 토폴로지를 이용한 오디오 스트림 형성 장치 및 방법
TWI732403B (zh) * 2015-03-13 2021-07-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10129659B2 (en) 2015-05-08 2018-11-13 Doly International AB Dialog enhancement complemented with frequency transposition
KR101661713B1 (ko) * 2015-05-28 2016-10-04 제주대학교 산학협력단 파라메트릭 어레이 응용을 위한 변조 방법 및 장치
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
JP6797187B2 (ja) * 2015-08-25 2020-12-09 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ・デコーダおよびデコード方法
BR112018005391B1 (pt) * 2015-09-22 2023-11-21 Koninklijke Philips N.V Aparelho para processamento de sinais de áudio, método de processamento de sinais de áudio, e dispositivo
CN109074813B (zh) 2015-09-25 2020-04-03 杜比实验室特许公司 处理高清晰度音频数据
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
US10157621B2 (en) * 2016-03-18 2018-12-18 Qualcomm Incorporated Audio signal decoding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10848363B2 (en) 2017-11-09 2020-11-24 Qualcomm Incorporated Frequency division multiplexing for mixed numerology
BR112020012654A2 (pt) * 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN114242090A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
WO2019207036A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
US20230085013A1 (en) * 2020-01-28 2023-03-16 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111768793B (zh) * 2020-07-11 2023-09-01 北京百瑞互联技术有限公司 一种lc3音频编码器编码优化方法、系统、存储介质

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4152192B2 (ja) 2001-04-13 2008-09-17 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の高品質タイムスケーリング及びピッチスケーリング
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7372907B2 (en) * 2003-06-09 2008-05-13 Northrop Grumman Corporation Efficient and flexible oversampled filterbank with near perfect reconstruction constraint
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US7949057B2 (en) * 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
ES2791001T3 (es) * 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
CN1668058B (zh) * 2005-02-21 2011-06-15 南望信息产业集团有限公司 基于递归最小平方差的子带回声抵消器
WO2006108543A1 (en) 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
WO2007069150A1 (en) 2005-12-13 2007-06-21 Nxp B.V. Device for and method of processing an audio data stream
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2910743B1 (fr) * 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
AU2008339211B2 (en) * 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2296145B1 (en) 2008-03-10 2019-05-22 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
US9147902B2 (en) 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
RU2443028C2 (ru) 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
CA2730200C (en) 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
EP2169665B1 (en) 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
US8831958B2 (en) 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
PL4231291T3 (pl) * 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CA3076203C (en) 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
EP3723090B1 (en) * 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio

Also Published As

Publication number Publication date
US20180366130A1 (en) 2018-12-20
US20170194011A1 (en) 2017-07-06
CA2792450C (en) 2016-05-31
CA2792452A1 (en) 2011-09-15
AU2011226211A1 (en) 2012-10-18
BR112012022740A2 (pt) 2020-10-13
JP2013525824A (ja) 2013-06-20
US20200279571A1 (en) 2020-09-03
PL3570278T3 (pl) 2023-03-20
MX2012010416A (es) 2012-11-23
MY154204A (en) 2015-05-15
KR20120131206A (ko) 2012-12-04
EP2545553A1 (en) 2013-01-16
TWI446337B (zh) 2014-07-21
TW201207841A (en) 2012-02-16
CN103038819A (zh) 2013-04-10
SG183967A1 (en) 2012-10-30
RU2586846C2 (ru) 2016-06-10
AU2011226212A1 (en) 2012-10-18
US9792915B2 (en) 2017-10-17
BR122021019082B1 (pt) 2022-07-26
US11495236B2 (en) 2022-11-08
AU2011226211B2 (en) 2014-01-09
EP2545548A1 (en) 2013-01-16
BR122021014305B1 (pt) 2022-07-05
HK1181180A1 (en) 2013-11-01
US20130051571A1 (en) 2013-02-28
KR20120139784A (ko) 2012-12-27
US10032458B2 (en) 2018-07-24
BR112012022574A2 (pt) 2021-09-21
KR101414736B1 (ko) 2014-08-06
CN102939628B (zh) 2015-05-13
US11894002B2 (en) 2024-02-06
JP2013521538A (ja) 2013-06-10
AR080477A1 (es) 2012-04-11
US9305557B2 (en) 2016-04-05
BR112012022740B1 (pt) 2021-12-21
CN103038819B (zh) 2015-02-18
AU2011226212B2 (en) 2014-03-27
EP2545553B1 (en) 2014-07-30
EP4148729A1 (en) 2023-03-15
US20130090933A1 (en) 2013-04-11
US20240135939A1 (en) 2024-04-25
KR101425154B1 (ko) 2014-08-13
EP3570278A1 (en) 2019-11-20
CN102939628A (zh) 2013-02-20
RU2012142732A (ru) 2014-05-27
CA2792450A1 (en) 2011-09-15
TW201207842A (en) 2012-02-16
US20230074883A1 (en) 2023-03-09
BR112012022574B1 (pt) 2022-05-17
MX2012010415A (es) 2012-10-03
ES2522171T3 (es) 2014-11-13
EP3570278B1 (en) 2022-10-26
US10770079B2 (en) 2020-09-08
ES2935637T3 (es) 2023-03-08
CA2792452C (en) 2018-01-16
WO2011110500A1 (en) 2011-09-15
JP5588025B2 (ja) 2014-09-10
PL2545553T3 (pl) 2015-01-30
BR122021014312B1 (pt) 2022-08-16
AR080476A1 (es) 2012-04-11
WO2011110499A1 (en) 2011-09-15
TWI444991B (zh) 2014-07-11

Similar Documents

Publication Publication Date Title
JP5523589B2 (ja) カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
EP2238591B1 (en) Device and method for a bandwidth extension of an audio signal
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140408

R150 Certificate of patent or registration of utility model

Ref document number: 5523589

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250