JP2016500839A

JP2016500839A - スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法

Info

Publication number: JP2016500839A
Application number: JP2015536045A
Authority: JP
Inventors: ザーシャ・ディシュ; ベンヤミン・シュベルト; ラルフ・ガイゲル; ベルンド・エドレル; マルティン・ディエツ
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2012-10-10
Filing date: 2013-09-20
Publication date: 2016-01-14
Anticipated expiration: 2033-09-20
Also published as: CA2887188A1; TW201419268A; KR101777485B1; RU2015117432A; ZA201503152B; US9570085B2; MX344955B; JP6563338B2; ES2896016T3; JP6789915B2; US20150213808A1; EP2720222A1; SG10201702285QA; CA2944927C; TWI543152B; EP3133598A1; MX2015004506A; AR092958A1; JP7005564B2; KR20150066570A

Abstract

符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための装置が提供される。この装置は、複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するための処理ユニット（１１５）を備え、スペクトル係数の各々は符号化オーディオ信号スペクトル内でのスペクトル位置およびスペクトル値を有し、スペクトル係数は符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けされ、それによって、スペクトル係数はスペクトル係数のシーケンスを形成する。さらに、この装置は、復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するための疑似係数決定器（１２５）を備え、疑似係数の各々はスペクトル値を有する。さらに、この装置は、修正オーディオ信号スペクトルを得るために少なくとも１つまたは複数個の疑似係数を、決定されたスペクトルパターンで置換するための置換ユニット（１３５）を備え、決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、少なくとも２つのパターン係数の各々は、スペクトル値を有する。さらに、この装置は、オーディオ出力信号を得るために修正オーディオ信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニット（１４５）を備えている。【選択図】図１Ａ

Description

本発明は、オーディオ信号符号化、復号および処理に関し、特に、スペクトルパターンを利用することによるシヌソイドおよびスイープの効率的な合成に関する。

オーディオ信号処理はますます重要になっている。最新の知覚オーディオコーデックはますます低いビットレートで満足なオーディオ品質をもたらすことを要求されているため、問題が生じている。加えて、たとえば、双方向性通信アプリケーションまたは分散ゲーミングなどについては許容される待ち時間も非常に短い場合が多い。

最新の波形保存変換オーディコーデックは、雑音置換または帯域幅拡大のような、パラメトリックにコード化された強化を備えていることが多い。これらの既知のパラメトリックツールに加えて、パラメトリックなサイド情報からそのような復号器において正弦波トーンを合成することが望ましい場合もある。コーデックが広く受け入れられ、展開されるには複雑度が低いことが不可欠であるため、コーデック開発において計算複雑度は常に重要な基準である。それゆえ、これらのトーンを生成する効率的な方法が必要とされている。

たとえば、ＭＰＥＧ−ＤＵＳＡＣ（ＭＰＥＧ−Ｄ＝Moving Picture Experts Group-D、ＵＳＡＣ＝Unified Speech and Audio Coding：音声音響統合コード化）オーディオコーデックは、時間領域予測コード化と変換領域コード化との間で切り替えることが多いが、それにもかかわらず、音楽コンテンツは依然として主に変換領域においてコード化される。たとえば、１４ｋｂｉｔ／ｓ未満の低いビットレートにおいて、変換コーダを通じてコード化されるとき、音楽アイテムにおける音の成分は良好に聞こえないことが多く、これがオーディオを十分な品質でコード化するタスクをなおさら困難なものにしている。

加えて、低遅延制約によって、（低遅延に最適化された窓形状および／または変換長に起因して）、一般に、変換コーダのフィルタバンクの周波数応答が最適に及ばないものになり、それゆえ、そのようなコーデックの知覚品質がさらに損なわれる。

従来の心理音響モデルに従って、量子化雑音に関する透明性に対する要件が定義される。高いビットレートにおいては、これはヒト聴覚マスキングレベルに従う量子化雑音の知覚的に適合された最適な時間／周波数分布に関係する。一方、低いビットレートにおいては、透明性を達成することはできない。それゆえ、低いビットレートにおいてはマスキングレベル要件低減戦略が採用される場合がある。

すでに、音楽コンテンツのための最高級のコーデック、特に、修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）に基づく変換コーダが提供されている。ＭＤＣＴはスペクトル係数を周波数領域において量子化し送信する。しかしながら、非常に低いデータレートにおいては、各時間フレームのごくわずかなスペクトルラインしか、そのフレームに利用可能なビットによってコード化することができない。結果として、時間変調アーティファクトおよびいわゆる震音（warbling）アーティファクトがコード化信号に導入されることは避けられない。

最も顕著には、これらのタイプのアーティファクトは準定常な音の成分において知覚される。これは特に、遅延制約に起因して、既知の漏れ効果に起因する隣接するスペクトル係数間の重大なクロストーク（スペクトル広がり）を含む変換窓形状が選択されなければならない場合に起こる。しかしながら、とはいえ低ビットレートによる粗い量子化の後、非ゼロのままである隣接するスペクトル係数は通常、これらのうちほんの１つまたはいくつかのみである。

上述のように、従来技術において、１つの手法によれば、変換コーダが利用される。音楽コンテンツのコード化によく適している現代の高圧縮比オーディオコーデックはすべて、変換コード化に依拠する。最も顕著な例は、ＭＰＥＧ２／４先進的音響コード化（ＡＡＣ：Advanced Audio Coding）およびＭＰＥＧ−Ｄ音声音響統合コード化（ＵＳＡＣ：Unified Speech and Audio Coding）である。ＵＳＡＣは、主に発話コード化のために意図されている代数符号励振線形予測（ＡＣＥＬＰ：Algebraic Code Excited Linear Prediction）モジュールおよび変換符号化励起（ＴＣＸ：Transform Coded Excitation）モジュール（［非特許文献５］参照）、ならびに代替的に、主に音楽のコード化のために意図されているＡＡＣに一致する切り替えコアを有する。ＡＡＣのように、ＴＣＸも変換ベースのコード化方法である。低ビットレート設定において、これらのコード化方式は、特に基礎となるコード化方式が修正離散コサイン変換（ＭＤＣＴ）に基づく場合に、震音アーティファクトを呈する傾向がある（［非特許文献１］参照）。

音楽再生について、変換コーダは、オーディオデータ圧縮のための好ましい技法である。しかしながら、低ビットレートにおいて、従来の変換コーダは、強い震音アーティファクトおよび粗さのアーティファクトを呈する。アーティファクトのほとんどは、音のスペクトル成分のコード化が粗すぎることに由来する。これは、特にこれらが、主に厳密な遅延要件を満たすように設計されている最適に及ばないスペクトル伝達機能（漏れ効果）によってスペクトル的に不鮮明になっている場合に起こる。

従来技術の別の手法によれば、コード化方式は、過渡信号、シヌソイドおよび雑音について完全にパラメトリックである。特に、中および低ビットレートについて、完全にパラメトリックなオーディオコーデックが標準化されており、そのうち最も顕著なものが、ＭＰＥＧ−４ Part 3,Subpart 7 Harmonic and Individual Lines plus Noise（ＨＩＬＮ）（［非特許文献２］参照）およびＭＰＥＧ−４ Part 3,Subpart 8 SinuSoidal Coding（ＳＳＣ）（［非特許文献３］参照）である。しかしながら、パラメトリックコーダには、音声が不快なほど人工的になるという問題があり、しかもビットレートが増加しても知覚的な透明性に向けて良好にスケーリングしない。

さらなる手法は、波形とパラメトリックとのハイブリッドのコード化を可能にする。［非特許文献４］において、変換ベースの波形コード化とＭＰＥＧ４−ＳＳＣ（正弦波部分のみ）とのハイブリッドが提案されている。反復プロセスにおいて、シヌソイドが抽出され、信号から減算されて、変換コード化技法によってコード化されることになる残差信号が形成される。抽出されたシヌソイドはパラメータのセットによってコード化され、残差とともに送信される。［非特許文献６］において、シヌソイドと残差とを別個にコード化するハイブリッドコード化手法が提供されている。［非特許文献７］において、いわゆるConstrained Energy Lapped Transform（ＣＥＬＴ）コーデック／ゴーストウェブページで、発振器バンクをハイブリッドコード化に利用するアイディアが示されている。しかしながら、復号器と並列に作動し、その出力が時間領域において復号器の合成フィルタバンクの出力と合成される発振器バンクによって人工的な音を生成することは、多くの発振器が高いサンプリングレートにおいて並列に計算される必要があるため、膨大な計算負荷がかかることを意味する。コーデック開発および展開において計算複雑度は常に重要な基準であり、それゆえ、これらの音を生成するより効率的な方法が必要とされている。

中程度以上のビットレートにおいて、変換コーダは、それらの音が自然であることに起因して、音楽のコード化によく適している。そこでは、基礎となる心理音響モデルの透明性要件が完全にまたはほぼ完全に満たされている。しかしながら、低ビットレートにおいて、心理音響モデルの要件に甚だしく違反せざるを得ず、そのような状況において、変換コーダは、震音、粗さ、および音楽の雑音のアーティファクトに陥る傾向がある。

完全にパラメトリックなオーディオコーデックはより低いビットレートにほぼ適しているが、それらはしかしながら、不快なほど人工的に聞こえることが既知である。その上、やや粗いパラメトリックモデルを漸進的に改良することは実現可能でないため、これらのコーデックは知覚的な透明性までシームレスにスケーリングしない。

波形とパラメトリックとのハイブリッドのコード化は、個々の手法の限界を克服する可能性があり得、両方の技法の相補う直交する特性から利益が得られる可能性があり得る。しかしながら、これは、現行の技術水準においては、ハイブリッドコーデックの変換コード化部分とパラメトリック部分との間に相互作用がないことがネックになっている。問題は、パラメトリックコーデック部分と変換コーデック部分との間の信号分割、変換部分とパラメトリック部分との間のビット配分操作、パラメータシグナリング技法、および、パラメトリックコーデック出力と変換コーデック出力との間のシームレスな混合に関する。

当該技術分野のさらなる先行する刊行物は、直に時間領域における正弦波音、または、ＤＦＴ周波数領域における部分的に一定の音の合成に関し［非特許文献１３］、ＤＦＴ領域における切り詰めパターンのＳＮＲ最適化［非特許文献１２］に関する。知覚的コーデック環境［非特許文献１０］または帯域幅拡大の筋書き［非特許文献１１］におけるＭＤＣＴに基づく部分的に一定の周波数の音の埋め込みがすでに記載されている。しかしながら、スイープの効率的な生成およびＭＤＣＴ領域におけるシームレスなトラックへのそれらの連結は見たところまだ対処されておらず、パラメータ空間における利用可能な自由度に対する理にかなった制限も定義されていない。

[1] Daudet, L.; Sandler, M.; , "MDCT analysis of sinusoids: exact results and applications to coding artifacts reduction," Speech and Audio Processing, IEEE Transactions on, vol.12, no.3, pp. 302-312, May 2004 [2] Purnhagen, H.; Meine, N.;, "HILN-the MPEG-4 parametric audio coding tools," Circuits and Systems, 2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium an, vol.3, no., pp.201-204 vol.3, 2000 [3] Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:," Advances in Parametrie Coding for High-Quality Audio," Audio Engineering Society Convention 114, preprint, Amsterdam/NL, March 2003 [4] van Schijndel, N.H. ; van de Par, S.; , "Rate-distortion optimized hybrid sound coding," Applications of Signal Processing to Audio and Acoustics, 2005. IEEE Workshop on, vol., no., pp. 235-238, 16-19 Oct. 2005 [5] Bessette, 8.; Lefebvre, R.; Salami, R. ; , "Universal speech/audio coding using hybrid ACELP/TCX techniques," Acoustics, Speech, and Signal Processing, 2005. Proceedings. (ICASSP '05). IEEE International Conference on, vol.3, no., pp. iii/301- iii/304 Val. 3, 18-23 March 2005 [6] Ferreira, A.J.S. "Combined spectral envelope normalization and subtraction of sinusoidal components in the ODFT and MDCT frequency domains," Applications of Signal Processing to Audio and Acoustics, 2001 IEEE Workshop on the, vol., no., pp.51-54, 2001 [7] http://people.xiph.org/~xiphmont/demo/ghost/demo.htmlThe corresponding archive.org-website is stored at: http://web.archive.org/web/20110121141149/http://people.xiph.org/~xiphmont /demo/ghost/demo.html [8] ISO/IEC 14496-3:2005(E) - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4 [9] ISO/IEC 14496-3:2009(E) - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4 [10] Anibal J. S. Ferreira. Perceptual coding using sinusoidal modeling in the mdct domain. In Audio Engineering Society Convention ll2, 4 2002. [11] Deepen Ferreira, Anibal J. S.; Sinha. Accurate spectral replacement. In Audio Engineering Society Convention JJ 8, 5 2005. [12] Rade Kutil. Optimized sinusoid synthesis via inverse truncated fourier transforrn. Trans. Audio. Speech and Lang. Proc., 17(2):221-230, February 2009. [13] Nikolaus Meine and Heiko Purnhagen. Fast sinusoid synthesis for mpeg-4 hiln parametric audio decoding. Proc. of the 5 th Int. Conference on Digital Audio Effects (DAFx-02), Hamburg, Germany, September 26-28, 2002, 0(0), 2002.

本発明の目的は、ハイブリッドオーディオ復号のための改善された概念を提供することである。

本発明の目的は、請求項１に記載の装置、請求項１４に記載の装置、請求項２０に記載の方法、請求項２１に記載の方法、および請求項２２に記載のコンピュータプログラムによって解決される。

符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための装置が提供される。

この装置は、複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するための処理ユニットを備え、スペクトル係数の各々は符号化オーディオ信号スペクトル内のスペクトル位置およびスペクトル値を有し、スペクトル係数はスペクトル係数がスペクトル係数のシーケンスを形成するように符号化オーディオ信号スペクトル内のそれらのスペクトル位置に従って連続して順序付けされている。

その上、この装置は復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するための疑似係数決定器を備え、疑似係数の各々はスペクトル位置およびスペクトル値を有する。

さらに、この装置は、修正オーディオ信号スペクトルを得るために、少なくとも１つまたは複数の疑似係数を、決定されたスペクトルパターンで置換するための置換ユニットを備え、決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、少なくとも２つのパターン係数の各々はスペクトル値を有する。

その上、この装置は、オーディオ出力信号を得るために修正オーディオ信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニットを備える。

一実施形態において、この装置は、複数の記憶されているスペクトルパターンを記憶しているデータベースまたはメモリを含むストレージユニットをさらに備えることができ、記憶されているスペクトルパターンの各々は一定のスペクトル特性（たとえば、一定の周波数、掃引周波数など。それぞれはビン上（on-bin）位置のバージョンまたはビン間（between-bin）位置のバージョンで。）を有する。置換ユニットは、ストレージユニットに、要求されたスペクトルパターンとして、記憶されているスペクトルパターンの１つを要求するように構成することができる。ストレージユニットは、その要求されたスペクトルパターンを提供するように構成することができ、置換ユニットは、その要求されたスペクトルパターンに基づいて少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するように構成することができる。

一実施形態によれば、置換ユニットは、疑似係数決定器によって決定された１つ以上の疑似係数のうちの少なくとも１つから導出される第１の導出スペクトル位置に応じて、ストレージユニットにその記憶されているスペクトルパターンの１つを要求するように構成することができる。

一実施形態において、１つ以上の疑似係数のうちの少なくとも１つから導出される第１の導出スペクトル位置は、疑似係数のうちの１つの疑似係数のスペクトル位置とすることができる。

別の実施形態において、１つ以上の疑似係数は各々が符号成分を含む符号付きの値であり、置換ユニットは、１つ以上の疑似係数のうちの１つの疑似係数のスペクトル位置とその疑似係数の符号成分に基づいて、その符号成分が第１の符号値を有するときは第１の導出スペクトル位置がその疑似係数のスペクトル位置に等しくなるように、その符号値が異なる第２の値を有するときは第１の導出スペクトル位置がその疑似係数のスペクトル位置を所定の値だけシフトすることによってもたらされる修正位置に等しくなるように、第１の導出スペクトル位置を決定するように構成されている。

たとえば、疑似ラインの半ビン周波数分解能は、その疑似係数の符号によって示すことができる。そのため、疑似係数の符号成分が第２の符号値を有する場合に、たとえば、時間―周波数領域を考えると、その疑似係数のスペクトル位置がシフトされる所定の値は、たとえば２つの連続するビンの周波数差の半分に対応させることができる。

疑似係数の符号成分は疑似係数のスペクトル値に含むことができる。

一実施形態において、ストレージユニットのデータベースまたはメモリ内に記憶されている複数の記憶されているスペクトルパターンは、定常音パターンまたは周波数掃引パターンのいずれかとすることができる。疑似係数決定器は、復号オーディオ信号スペクトルの２つ以上の時間的に連続する疑似係数を決定するように構成することができる。置換ユニットは、第１の疑似係数から導出される第１の導出スペクトル位置と、第２の疑似係数から導出される第２の導出スペクトル位置との間の絶対差が閾値よりも小さいか否かに応じて、２つ以上の時間的に連続する疑似係数のうちの第１の疑似係数および第２の疑似係数をトラックに割り当てるように構成することができる。また、置換ユニットは、トラックの第１の疑似係数から導出される第１の導出スペクトル位置がトラックの第２の疑似係数から導出される第２の導出スペクトル位置に等しいときに、ストレージユニットに、定常音パターンの１つを要求するように構成することができる。さらに、置換ユニットは、トラックの第１の疑似係数から導出される第１の導出スペクトル位置がトラックの第２の疑似係数から導出される第２の導出スペクトル位置とは異なるときに、ストレージユニットに周波数掃引パターンの１つを要求するように構成することができる。

一実施形態によれば、置換ユニットは、トラックの第２の疑似係数から導出される第２の導出スペクトル位置とトラックの第１の疑似係数から導出される第１の導出スペクトル位置との間の周波数差が、所定の値の半分に等しいときに、ストレージユニットに、周波数掃引パターンのうちの第１の周波数掃引パターンを要求するように構成することができる。さらに、置換ユニットは、トラックの第２の疑似係数から導出される第２の導出スペクトル位置とトラックの第１の疑似係数から導出される第１の導出スペクトル位置との間の周波数差が、所定の値に等しいときに、ストレージユニットに、周波数掃引パターンのうちの第１の周波数掃引パターンとは異なる第２の周波数掃引パターンを要求するように構成することができる。さらに、置換ユニットは、トラックの第２の疑似係数から導出される第２の導出スペクトル位置とトラックの第１の疑似係数から導出される第１の導出スペクトル位置との間の周波数差が、所定の値の１．５倍に等しいときに、ストレージユニットに、周波数掃引パターンのうちの第１の周波数掃引パターンとも第２の周波数掃引パターンとも異なる第３の周波数掃引パターンを要求するように構成することができる。

一実施形態によれば、置換ユニットは、決定されたスペクトルパターンを得るために、ストレージユニットから提供される、要求されたスペクトルパターンを修正するように構成されているパターン適合ユニットを備えている。

一実施形態において、パターン適合ユニットは、決定されたスペクトルパターンを得るために、１つ以上の疑似係数のうちの１つの疑似係数のスペクトル値に応じて、要求されたスペクトルパターンのパターン係数のスペクトル値を再スケーリングすることによって、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができる。

一実施形態によれば、パターン適合ユニットは、開始位相に応じて、開始位相が第１の開始位相値を有するときは要求されたスペクトルパターンのパターン係数の各々のスペクトル値が第１の様式で修正されるように、および、開始位相が異なる第２の開始位相値を有するときは要求されたスペクトルパターンのパターン係数の各々のスペクトル値が第２の様式で修正されるように、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができる。

一実施形態によれば、要求されたスペクトルパターンのパターン係数の各々のスペクトル値は実数部と虚数部とを含む複素係数とすることができる。そのような実施形態において、パターン適合ユニットは、複素回転係数ｅ^j・φを適用することによって、ストレージユニットによって提供される要求されたスペクトルパターンのパターン係数の各々の実数部および虚数部を修正することによって、要求されたスペクトルパターンを修正するように構成することができる。φは角度（たとえば、角度値）である。これによって、複素係数の各々について、複素平面内でその複素係数を表すベクトルが、複素係数の各々について同じ角度だけ回転される。

一実施形態において、要求されたスペクトルパターンのパターン係数の各々のスペクトル値は実数部と虚数部とを含む。パターン適合ユニットは、要求されたスペクトルパターンのパターン係数の各々の実数部および虚数部をネゲート（negate）することによって、または、要求されたスペクトルパターンのパターン係数の各々のスペクトル値の実数部もしくはネゲートされた実数部および虚数部もしくはネゲートされた虚数部をスワップ（swap）することによって、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができる。

一実施形態において、パターン適合ユニットは、パターンの時間的ミラーリング（mirroring）を実現することによって、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができる。一般に、これは、パターンの複素共役を（虚数部に−１を乗算することによって）計算し、複素位相項（ひねり（twiddle））を適用することによって、周波数領域において得ることができる。

一実施形態において、復号オーディオ信号スペクトルはＭＤＣＴ領域において表される。パターン適合ユニットは、修正スペクトルパターンを得るために、要求されたスペクトルパターンのパターン係数のスペクトル値を修正することによって、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができ、その場合、スペクトル値は奇積層離散フーリエ変換領域（Oddly-Stacked Discrete Fourier Transform domain）において表される。さらに、パターン適合ユニットは、決定されたスペクトルパターンを得るために、修正スペクトルパターンのパターン係数のスペクトル値を、奇積層離散フーリエ変換領域からＭＤＣＴ領域へと変換するように構成することができる。その上、置換ユニットは、ＭＤＣＴ領域において表される修正オーディオ信号スペクトルを得るために、少なくとも１つまたは複数の疑似係数を、ＭＤＣＴ領域において表される決定されたスペクトルパターンで置換するように構成することができる。

または、複数の実施形態において、スペクトル値は複素修正離散コサイン変換（ＣＭＤＣＴ：Complex Modified Discrete Cosine Transform）領域において表すこともできる。さらに、これらの実施形態において、パターン適合ユニットは、決定されたスペクトルパターンを得るために、複素修正パターンの実数部を単純に抽出することによって、修正スペクトルパターンのパターン係数のスペクトル値をＣＭＤＣＴ領域からＭＤＣＴ領域へと変換するように構成することができる。

さらに、複数のスペクトルパターンを生成するための装置が提供される。この装置は、第１の領域において複数の信号を生成するための信号生成器を備えている。さらに、この装置は、複数のスペクトルパターンを得るために、それらの複数の信号の各信号を第１の領域から第２の領域へと変換するための信号変換ユニットを備えており、それらの複数の変換されたスペクトルパターンの各パターンは複数の係数を含む。さらに、この装置は、複数の処理されたパターンを得るために、それらの変換されたスペクトルパターンの係数のうちの１つ以上を除去することによって、それらの変換されたスペクトルパターンを切り詰める（truncate）ための後処理ユニットを備えている。さらに、この装置は、データベースまたはメモリを含むストレージユニットを備え、そのストレージユニットはそれらの複数の処理されたパターンの各処理されたパターンをデータベースまたはメモリに記憶するように構成されている。信号生成器は、以下の式に基づいてそれらの複数の信号の各信号を生成するように構成されている。
x(t) = cos (2πφ(t))
および
式中、ｔおよびτは時間を示し、φ（ｔ）はｔにおける瞬時位相であり、ｆ（τ）はτにおける瞬時周波数であり、それらの複数の信号の各信号は第１の時点におけるその信号の瞬時周波数である開始周波数（ｆ₀）、および、異なる第２の時点におけるその信号の瞬時周波数である目標周波数（ｆ₁）を有する。信号生成器は、それらの複数の信号のうちの第１の信号を、第１の信号の目標周波数が開始周波数と等しくなるように生成するように構成されている。さらに、信号生成器は、それらの複数の信号のうちの異なる第２の信号を、第１の信号の目標周波数が開始周波数とは異なるように生成するように構成されている。

一実施形態によれば、信号変換ユニットは、それらの複数の信号の各信号を、時間領域である第１の領域からスペクトル領域である第２の領域へと変換するように構成することができる。信号変換ユニットは、その信号を変換するための複数のタイムブロックのうちの第１のタイムブロックを生成するように構成することができ、それらの複数のタイムブロックの各タイムブロックは複数の重み付きサンプルを含み、それらの重み付きサンプルの各々は複数の重みのうちの１つの重みによって重み付けされているその信号の信号サンプルであり、それらの複数の重みはそのタイムブロックに割り当てられ、それらの複数の重みの各重みは時点に割り当てられる。それらの複数の信号の各信号の開始周波数（ｆ₀）は第１の時点におけるその信号の瞬時周波数とすることができ、それらのタイムブロックのうちの第１のタイムブロックのそれらの重みのうちの第１の重みが第１の時点に割り当てられ、それらのタイムブロックのうちの異なる第２のタイムブロックのそれらの重みのうちの第２の重みが第１の時点に割り当てられ、それらのタイムブロックのうちの第１のタイムブロックとそれらのタイムブロックのうちの第２のタイムブロックは重なり、それらの重みのうちの第１の重みはそれらの重みのうちの第２の重みに等しい。それらの複数の信号の各信号の目標周波数（ｆ₁）は第２の時点におけるその信号の瞬時周波数とすることができ、それらのタイムブロックのうちの第１のタイムブロックのそれらの重みのうちの第３の重みが第２の時点に割り当てられ、それらのタイムブロックのうちの異なる第３のタイムブロックのそれらの重みのうちの第４の重みが第２の時点に割り当てられ、それらのタイムブロックのうちの第１のタイムブロックとそれらのタイムブロックのうちの第３のタイムブロックは重なり、それらの重みのうちの第３の重みはそれらの重みのうちの第４の重みに等しい。

注目すべきは、たとえば、パターンの生成には１つのタイムブロック（たとえば、それらのタイムブロックのうちの第１のタイムブロック）のみを生成すれば十分であり得るということである。

一実施形態によれば、それらの複数の信号の各信号は、第１の時点におけるその信号の位相である開始位相（φ₀）、および、異なる第２の時点におけるその信号の位相である目標位相（φ₁）を有し、信号生成器は、それらの複数の信号のうちの第１の信号の開始位相（φ₀）がそれらの複数の信号のうちの異なる第２の信号の開始位相（φ₀）に等しくなるように、それらの複数の信号を生成するように構成されている。

それらの複数の信号の各信号の開始位相（開始周波数および停止周波数の選択によって、事実上は開始位相および目標（停止）位相）はその開始時点と停止時点において調整することができる。

開始および停止時点のこの特別な選択によって、異なるスペクトル特性を有するパターンが連結される場合に発生する場合がある重畳加算アーティファクトが低減される。

一実施形態において、後処理ユニットは、複数の回転されたスペクトルパターンを得るために、それらの変換されたスペクトルパターンの各スペクトルパターンのスペクトル係数に対してπ／４の回転を行うようにさらに構成することができる。

別の実施形態において、後処理ユニットは、複数の任意に回転されたスペクトルパターンを得るために、それらの変換されたスペクトルパターンの各々のスペクトル係数に任意の位相角の回転を行うようにさらに構成することができる。

さらなる実施形態によれば、信号生成器は、それらの複数の信号として、第１の信号、第２の信号、および１つ以上のさらなる信号を、それらのさらなる信号の各々の目標周波数と開始周波数との各差が第２の信号の目標周波数と開始周波数との差の整数倍になるように、生成するように構成することができる。

さらに、符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための方法が提供される。この方法は、
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するステップであって、それらのスペクトル係数の各々は符号化オーディオ信号スペクトル内のスペクトル位置およびスペクトル値を有し、それらのスペクトル係数がスペクトル係数のシーケンスを形成するように、それらのスペクトル係数は符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理するステップと、
復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するステップであって、それらの疑似係数の各々はそれらのスペクトル係数のうちの１つである、決定するステップと、
修正オーディオ信号スペクトルを得るために少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するステップであって、決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、それらの少なくとも２つのパターン係数の各々はスペクトル値を有する、置換するステップと、
オーディオ出力信号を得るために修正オーディオ信号スペクトルを時間領域に変換するステップと、
を含む。

さらに、複数のスペクトルパターンを生成するための方法が提供される。この方法は、
第１の領域において複数の信号を生成するステップと、
複数のスペクトルパターンを得るために、それらの複数の信号の各信号を第１の領域から第２の領域へと変換するステップであって、それらの複数の変換されたスペクトルパターンの各パターンは複数の係数を含んでいる、変換するステップと、
複数の処理されたパターンを得るために、それらの変換されたスペクトルパターンの係数のうちの１つ以上を除去することによって、それらの変換されたスペクトルパターンを切り詰めるステップと、
それらの複数の処理されたパターンの各処理されたパターンをデータベースまたはメモリに記憶するステップと、
を含む。

それらの複数の信号の各信号を生成するステップは以下の式
x(t) = cos (2πφ(t))
および
に基づいて行われる。式中、ｔおよびτは時間を示し、φ（ｔ）はｔにおける瞬時位相であり、ｆ（τ）はτにおける瞬時周波数であり、それらの複数の信号の各信号は、第１の時点におけるその信号の瞬時周波数である開始周波数（ｆ₀）と異なる第２の時点におけるその信号の瞬時周波数である目標周波数（ｆ₁）を有する。

それらの複数の信号を生成するステップは、第１の信号の目標周波数（ｆ₁）が開始周波数（ｆ₀）と等しくなるように、それらの複数の信号のうちの第１の信号を生成することによって行われる。さらに、それらの複数の信号を生成するステップは、第１の信号の目標周波数（ｆ₁）が開始周波数（ｆ₀）と異なるように、それらの複数の信号のうちの異なる第２の信号を生成することによって行われる。

さらに、コンピュータまたは信号プロセッサ上で実行されるとき、上述した方法を実施するためのコンピュータプログラムが提供される。

ＡＡＣまたはＵＳＡＣのような現代のコーデックはオーディオのＭＤＣＴ領域表現に基づいているので、実施形態は、音パターンを復号器におけるＭＤＣＴスペクトルにパッチすることによって合成音を生成するための概念を提供する。スイープを含む高品質の正弦波音をシームレスに合成するために、適切なスペクトルパターンを導出してＭＤＣＴ時間／周波数（ｔ／ｆ）格子の中の（および間の）それらの目標位置に適合させ得る方法が説明されている。

先進的音響コード化（ＡＡＣ）または音声音響統合コード化（ＵＳＡＣ）のような現代のコーデックは、オーディオの修正離散コサイン変換（ＭＤＣＴ）領域表現に基づいている。実施形態は、音パターンを復号器におけるＭＤＣＴスペクトルに直接パッチすることによって合成音を生成する。これだけで、超低複雑度の実施態様を実現することができる。

実施形態において、スイープを含む高品質の正弦波音を合成するために、適切なスペクトルパターンが導出されてＭＤＣＴｔ／ｆ格子の中の（および間の）それらの目標位置に適合される。

実施形態によれば、低遅延および低ビットレートのオーディオコード化が提供される。いくつかの実施形態は、トーンフィリング（ＴＦ）と称される新しく、かつ独創的な概念に基づいている。トーンフィリングという用語は、そうでなければ不良にコード化されてしまう自然音が、知覚的に同様でなお純正弦音に置換されるコード化技法を示す。それによって、最も近いＭＤＣＴビンのスペクトル位置に対するシヌソイドの位置に応じた一定のレートにおける振幅変調アーティファクト（「震音」として知られる。）が回避される。

実施形態において、すべての考えられるアーティファクトの不快性の度合いが重み付けされる。これは、知覚的態様とアーティファクトの定常性に関係する。知覚的態様は、たとえばピッチ、調和性、変調などである。すべての態様が音声知覚不快性モデル（ＳＰＡＭ：Sound Perception Annoyance Model）において評価される。そのようなモデルによって操作されて、トーンフィリングは大きな利点をもたらす。自然音を純正弦音で置換することによって導入されるピッチと変調の誤差は、自然音の量子化が粗いことによって引き起こされる負荷雑音と定常性不良（「震音」）の影響に対して重み付けされる。

トーンフィリングは、シヌソイド＋雑音コーデックに対する大きな差をもたらす。たとえば、ＴＦは、シヌソイドを減算する代わりに、音を、所定の勾配を有する線形正弦スイープとシヌソイドで置換する。知覚的に同様の音は、置換されることになる元の音声成分と同じ局所重心（ＣＯＧ：Center Of Gravity）を有する。実施形態によれば、元の音がオーディオスペクトルにおいて消去される（ＣＯＧ関数の左足から右足）。一般に、置換に使用されるシヌソイドの周波数分解能は可能な限り粗い。これは、調和しない感覚を回避するための知覚的要件を考慮に入れながらも、サイド情報を最小限に抑えるためである。

いくつかの実施形態において、トーンフィリングは、その知覚的要件に起因する低域遮断周波数よりも上で行うことができるが、その低域遮断周波数未満では行われない。トーンフィリングを行うとき、音は変換コーダ内でスペクトル疑似ラインによって表される。しかしながら、トーンフィリング搭載符号化器において、疑似ラインは、従来の心理音響モデルによって制御される通常の処理を受ける。それゆえ、トーンフィリングを行うとき、パラメトリック部分を事前に制約する必要はない（ビットレートｘにおいて、ｙ個の音の成分が置換される）。そのため、変換コーデックへの密な統合が達成される。

トーンフィリング機能は、局所ＣＯＧ（平滑化推定値、ピーク品質尺度）を検出し、音の成分を除去し、置換疑似ライン（たとえば、疑似係数）を生成することによって、符号化器において利用することができる。置換疑似ラインは、その振幅によってレベル情報を保持し、そのスペクトル位置によって周波数情報を保持し、その符号によって精細な周波数情報（半ビンオフセット）を保持する。疑似係数（疑似ライン）は、ちょうど任意の通常のスペクトル係数（スペクトルライン）のように、コーデックの後続の量子化ユニットによって取り扱われる。

トーンフィリングは、さらに、分離されたスペクトルラインを検出することによって復号器において利用することができ、真の疑似係数（疑似ライン）はフラグアレイ（たとえば、ビットフィールド）によってマーキングすることができる。その復号器は、正弦波トラックを構築するために、疑似ライン情報をリンクすることができる。連続したトラックを合成するために生成／存続／消滅方式を利用することができる。

復号のために、疑似係数（疑似ライン）は、サイド情報内で送信されるフラグアレイによってそのようなものとしてマーキングすることができる。疑似ラインの半ビン周波数分解能は、疑似係数（疑似ライン）の符号によって信号として送ることができる。その復号器において、疑似ラインは、逆変換ユニットの前にスペクトルから消去することができ、発振器バンクによって別個に合成することができる。経時的に、発振器の対をリンクすることができ、発信器出力の円滑な展開を保証するためにパラメータ補間を利用することができる。

パラメータ駆動発振器のオンとオフの設定は、それらが変換コーデックの窓操作の時間的特性に密接に対応し、したがって、出力信号の変換コーデック生成部分と発振器生成部分との間のシームレスな遷移が保証されるように、成形することができる。

提供される概念は、ＡＡＣ、ＴＣＸまたは同様の構成のような既存の変換コード化方式に良好かつ容易に統合される。パラメータ量子化精度の操作は、コーデックの既存のレート制御によって事実上実施することができる。

いくつかの実施形態において、疑似ライン（疑似係数）は、コーデックに存在する量子化器によって、正弦波パラメータを別個に信号として伝えるのとは対照的に、ちょうど任意の通常スペクトルラインのように取り扱うことができる。

いくつかの実施形態において、先行するスペクトルの外挿から得られる正弦波トラックの任意選択的に測定される開始位相を利用することができる。

いくつかの実施形態によれば、正弦波トラックのオン／オフ設定におけるエイリアスをモデル化することによって、任意選択の時間領域エイリアス除去（ＴＤＡＣ：Time Domain Alias Cancellation）技法を利用することができる。

以下において、本発明の実施形態を図面を参照してより詳細に説明する。

一実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す図である。別の実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す図である。さらなる実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す図である。一実施形態による、複数のスペクトルパターンを生成するための装置を示す図である。ＭＤＣＴタイムブロックに対する掃引パターンのパラメータ整合を示す図である。トーンパターンのパッチング（patching）プロセスを示す図である。（ａ〜ｂ）は原型パターン生成を示し、（ｃ）はパターン切り詰めを示し、（ｄ）は目標位置および位相へのパターン適合を示し、（ｅ〜ｆ）はパターンパッチングを示す。（上パネルから下パネルへ）ビン上の正弦、ビン間の正弦、ビン上のスイープ、ビン間のスイープの、正規化スペクトル音パターンを示す図である。正弦窓についてのパターン長の関数としての切り詰め音パターンの信号対雑音比（ＳＮＲ）を示す図である。実施形態による、重なる合うブロックについての複数の時点における正弦波スイープの瞬時周波数を示す図である。実施形態による、ＤＣＴおよびＤＣＴＩＶ基底関数の位相進行を示す図である。一実施形態によるパワースペクトル、置換ＭＤＣＴスペクトル、量子化ＭＤＣＴスペクトル、およびＭＤＣＴスペクトルをパターンとともに示す図である。一実施形態によるオーディオ信号入力スペクトルを符号化するための装置を示す図である。オーディオ信号入力スペクトル、対応するパワースペクトルおよび修正（置換）オーディオ信号スペクトルを示す図である。他のパワースペクトル、他の修正（置換）オーディオ信号スペクトル、および量子化オーディオ信号スペクトルを示す図であり、量子化オーディオ信号スペクトルは符号化器側で生成されたものであるが、いくつかの実施形態においては復号側で復号された復号オーディオ信号スペクトルに対応することもある。一実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す図である。別の実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す図である。元のシヌソイドと、ＭＤＣＴ／逆ＭＤＣＴチェーンによって処理された後のシヌソイドとを比較した２つの図である。

図７は一実施形態によるオーディオ信号入力スペクトルを符号化するための装置を示す。この符号化するための装置は、極値決定器４１０、スペクトル修正器４２０、処理ユニット４３０、およびサイド情報生成器４４０を備えている。

図７の装置をより詳細に考察する前に、図７の装置によって符号化されるオーディオ信号入力スペクトルをより詳細に考察する。

原則として、いかなる種類のオーディオ信号スペクトルも、図７の装置によって符号化することができる。オーディオ信号入力スペクトルは、たとえば、ＭＤＣＴ（修正離散コサイン変換）スペクトル、ＤＦＴ（離散フーリエ変換：Discrete Fourier Transform）振幅スペクトルまたはＭＤＳＴ（修正離散サイン変換：Modified Discrete Sine Transform）スペクトルとすることができる。

図８はオーディオ信号入力スペクトル５１０の一例を示す。図８において、オーディオ信号入力スペクトル５１０はＭＤＣＴスペクトルである。

オーディオ信号入力スペクトルは複数のスペクトル係数を含む。スペクトル係数の各々はオーディオ信号入力スペクトル内のスペクトル位置とスペクトル値を有する。

図８の例を考えると、オーディオ信号入力スペクトルはオーディオ信号のＭＤＣＴ変換からもたらされ、たとえば、オーディオ信号入力スペクトルを得るためにオーディオ信号を変換したフィルタバンクは、たとえば、１０２４個のチャネルを使用することができる。その結果、スペクトル係数の各々は１０２４個のチャネルのうちの１つと関連付けられ、チャネル番号（たとえば、０〜１０２３間の番号）はそれらのスペクトル係数のスペクトル位置と考えることができる。図８において、横座標５１１はスペクトル係数のスペクトル位置を指す。より良好に図解するために、５２〜１４８の間のスペクトル位置を有する係数のみが図８によって図示されている。

図８において、縦座標５１２はスペクトル係数のスペクトル値を決定するのに役立つ。ＭＤＣＴスペクトル、ここでは、オーディオ信号入力スペクトルのスペクトル係数のスペクトル値を示す図８の例において、横座標５１２はスペクトル係数のスペクトル値を指す。ＭＤＣＴオーディオ信号入力スペクトルのスペクトル係数はスペクトル値として正の実数も負の実数ももつことができることに留意すべきである。

それに対し、他のオーディオ信号入力スペクトルには、正またはゼロのスペクトル値を有するスペクトル係数のみをもつものがある。たとえば、オーディオ信号入力スペクトルがＤＦＴ振幅スペクトルである場合、そのスペクトル係数は離散フーリエ変換からもたらされる係数の大きさを表すスペクトル値をもち、それらのスペクトル値は正またはゼロだけしかとることができない。

さらなる実施形態において、オーディオ信号入力スペクトルは、複素数であるスペクトル値を有するスペクトル係数を含む。たとえば、振幅および位相情報を示すＤＦＴスペクトルは、複素数のスペクトル値を有するスペクトル係数を含むことができる。

図８に例示的に示すように、スペクトル係数は、スペクトル係数がスペクトル係数のシーケンスを形成するように、オーディオ信号入力スペクトル内のそれらのスペクトル位置に従って連続的に順序付けされている。各スペクトル係数は１つ以上の先行係数のうちの少なくとも１つと１つ以上の後続係数を有し、そのスペクトル係数の各先行係数は、シーケンス内でそのスペクトル係数に先行するスペクトル係数のうちの１つである。そのスペクトル係数の各後続係数は、シーケンス内でそのスペクトル係数に後続するスペクトル係数のうちの１つである。たとえば、図８において、スペクトル位置８１、８２または８３（以下続く）を有するスペクトル係数はスペクトル位置８０を有するスペクトル係数の後続係数である。スペクトル位置７９、７８または７７（以下続く）を有するスペクトル係数はスペクトル位置８０を有するスペクトル係数の先行係数である。ＭＤＣＴスペクトルの例について、スペクトル係数のスペクトル位置は、スペクトル係数が関係するＭＤＣＴ変換のチャネルであることができる（たとえばチャネル番号、たとえば０〜１０２３の間のチャネル番号）。ただし、ここでも、例示を目的として、図８のＭＤＣＴスペクトル５１０は、５２〜１４８のスペクトル位置を有するスペクトル係数のみを示している。

図７に戻って、ここで極値決定器４１０をより詳細に説明する。極値決定器４１０は１つ以上の極値係数を決定するように構成されている。

一般に、極値決定器４１０は、複数個のオーディオ信号入力スペクトル又は１個のオーディオ信号入力スペクトルに関係するスペクトルを極値係数について調べる。極値係数を決定する目的は、後に、１つ以上の局所音領域がオーディオ信号スペクトルにおいて疑似係数で置換、たとえば各音領域について単一の疑似係数で置換、されるからである。

一般に、オーディオ信号入力スペクトルが関係する、オーディオ信号のパワースペクトルにおける「尖頂のある領域」（peaky area）が、音領域を示す。それゆえ、オーディオ信号入力スペクトルが関係するオーディオ信号のパワースペクトルにおける「尖頂のある領域」を識別することが好ましい場合がある。極値決定器４１０は、たとえば、パワースペクトルを調べることができる。パワースペクトルは係数を含み、それらの係数は比較係数と称することができる（それらのスペクトル値が極値決定器によって比較される対になっているからである。）。このように、オーディオ信号入力スペクトルのスペクトル係数の各々はそれに関連付けられる比較値を有する。

図８にはパワースペクトル５２０が図示されている。パワースペクトル５２０とＭＤＣＴオーディオ信号入力スペクトル５１０は同じオーディオ信号に関係する。パワースペクトル５２０は、比較係数と称される係数を含む。各スペクトル係数は、横座標５２１に関係するスペクトル位置および比較値を有する。オーディオ信号入力スペクトルの各スペクトル係数はそれと関連付けられる比較係数を有し、したがって、それと関連付けられるその比較係数の比較値をさらに有する。たとえば、オーディオ信号入力スペクトルのスペクトル値と関連付けられる比較値は、オーディオ信号入力スペクトルの考察されているスペクトル係数と同じスペクトル位置を有する比較係数の比較値とすることができる。オーディオ信号入力スペクトル５１０の３つのスペクトル係数とパワースペクトル５２０の３つの比較係数との関連付け（および、したがってこれらの比較係数の比較値との関連付け）が、それぞれの比較係数（またはそれらの比較値）とオーディオ信号入力スペクトル５１０のそれぞれのスペクトル係数との関連を示す破線５１３、５１４、５１５によって示されている。

極値決定器４１０は、極値係数の各々がスペクトル係数のうちの１つであって、その比較値がそのスペクトル係数の先行係数のうちの１つの比較値よりも大きく、かつそのスペクトル係数の後続係数のうちの１つの比較値よりも大きいスペクトル係数であるように、１つ以上の極値係数を決定するように構成することができる。

たとえば、極値決定器４１０はパワースペクトルの極大値を決定することができる。言い換えれば、極値決定器４１０は、極値係数の各々がスペクトル係数のうちの１つであって、その比較値がそのスペクトル係数の直近の先行係数の比較値よりも大きく、かつそのスペクトル係数の直近の後続係数の比較値よりも大きいスペクトル係数であるように、１つ以上の極値係数を決定するように構成することができる。ここで、スペクトル係数の直近の先行係数とは、スペクトル係数のうち、パワースペクトル内でそのスペクトル係数の直前にあるものである。そのスペクトル係数の直近の後続係数とは、スペクトル係数のうちの、パワースペクトル内でそのスペクトル係数の直後にあるものである。

しかしながら、他の実施形態は、極値決定器４１０がすべての極大を決定することを必要としない。たとえば、いくつかの実施形態において、極値決定器は、たとえば、特定の周波数範囲のみに関係するパワースペクトルの特定の部分のみを調べることができる。

他の実施形態において、極値決定器４１０は、考察されている極大の比較値と、後続の極小および／または先行する極小の比較値との間の差が、閾値よりも大きい係数のみを極値係数として決定するように構成されている。

極値決定器４１０は、比較スペクトル上の１つ以上の極値を決定することができ、比較スペクトルの係数の比較値がＭＤＣＴスペクトルのＭＤＣＴ係数の各々に割り当てられている。しかしながら、比較スペクトルは、オーディオ信号入力スペクトルよりも高いスペクトル分解能をもつことができる。たとえば、比較スペクトルは、ＭＤＣＴオーディオ信号入力スペクトルの２倍のスペクトル分解能を有するＤＦＴスペクトルであることができる。これによって、ＤＦＴの１つおきのスペクトル値のみがその後、ＭＤＣＴスペクトルのスペクトル値に割り当てられる。しかしながら、比較スペクトルの１つ以上の極値が決定されるとき、比較スペクトルの他の係数を考慮に入れることもできる。これによって、比較スペクトルの係数を、オーディオ信号入力スペクトルのスペクトル係数に割り当てられていない極値であるが、直近の先行係数および直近の後続係数を有する極値として決定することができる。それらの直近の先行係数および直近の後続係数は、それぞれそのオーディオ信号入力スペクトルのスペクトル係数およびそのオーディオ信号入力スペクトルのそのスペクトル係数の直近の後続係数に割り当てられている。したがって、比較スペクトルの（たとえば、高分解能ＤＦＴスペクトルの）その極値は、（ＭＤＣＴ）オーディオ信号入力スペクトルのそのスペクトル係数と、（ＭＤＣＴ）オーディオ信号入力スペクトルのそのスペクトル係数の直近の後続係数との間に位置する、（ＭＤＣＴ）オーディオ信号入力スペクトル内のスペクトル位置に割り当てられると考えることができる。そのような状況は、後に説明するように、疑似係数の適切な符号値を選択することによって符号化することができる。これによって、サブビン分解能が達成される。

ただし、いくつかの実施形態においては、極値係数は、その比較値がその直近の先行係数の比較値およびその直近の後続係数の比較値よりも大きいという要件を満たす必要がない。その代わりに、それらの実施形態においては、極値係数の比較値が、その先行係数のうちの１つおよびその後続係数のうちの１つよりも大きいということで十分であり得る。たとえば、以下のような状況を考察する。

表１によって記述される状況において、極値決定器４１０は、スペクトル位置２１４にあるスペクトル係数が極値係数であると合理的にみなすことができる。スペクトル係数２１４の比較値はその直近の先行係数２１３よりも大きくなく（０．８３＜０．８４）、かつその直近の後続係数２１５よりも大きくない（０．８３＜０．８５）が、その先行係数のうちのもう１つ、すなわち先行係数２１２の比較値よりも（大幅に）大きく（０．８３＞０．０２）、かつその後続係数のうちのもう１つ、すなわち後続係数２１６の比較値よりも（大幅に）大きい（０．８３＞０．０１）。さらに、スペクトル係数が係数２１２および２１６の比較値と比較して相対的に大きい比較値を有する３つの係数２１３、２１４、２１５の中央に位置するため、スペクトル係数２１４がこの「尖頂のある領域」の極値であるとみなすのが合理的であろう。

たとえば、極値決定器４１０は、比較係数のいくつかまたはすべてから、その比較係数の比較値がその比較係数のスペクトル位置に最も近い３つの先行係数の比較値のうちの少なくとも１つよりも大きいか否かを決定するように構成することができる。および／または、極値決定器４１０は、比較係数のいくつかまたはすべてから、その比較係数の比較値がその比較係数のスペクトル位置に最も近い３つの後続係数の比較値のうちの少なくとも１つよりも大きいか否かを決定するように構成することができる。極値決定器４１０はその後、その決定の結果に応じてその比較係数を選択すべきか否かを決定することができる。

いくつかの実施形態においては、各スペクトル係数の比較値は、オーディオ信号のエネルギー保存変換からもたらされるさらなるスペクトル（比較スペクトル）のさらなる係数の２乗値である。

さらなる実施形態においては、各スペクトル係数の比較値は、オーディオ信号のエネルギー保存変換からもたらされるさらなるスペクトルのさらなる係数の振幅値である。

一実施形態によれば、さらなるスペクトルは離散フーリエ変換スペクトルであり、その場合、エネルギー保存変換は離散フーリエ変換である。

さらなる実施形態によれば、さらなるスペクトルは複素修正離散コサイン変換（ＣＭＤＣＴ）スペクトルであり、その場合、エネルギー保存変換はＣＭＤＣＴである。

別の実施形態においては、極値決定器４１０は、比較スペクトルを調べなくてもよく、その代わりにオーディオ信号入力スペクトル自体を調べればよい。これは、たとえば、オーディオ信号入力スペクトル自体がエネルギー保存変換からもたらされるとき、たとえば、オーディオ信号入力スペクトルが離散フーリエ変換振幅スペクトルであるときに合理的であり得る。

たとえば、極値決定器４１０は、各極値係数が、スペクトル値がその先行係数のうちの１つのスペクトル値よりも大きく、かつその後続係数のうちの１つのスペクトル値よりも大きいスペクトル係数のうちの１つであるように、１つ以上の極値係数を決定するように構成することができる。

一実施形態においては、極値決定器４１０は、各極値係数が、スペクトル値がその直近の先行係数のスペクトル値よりも大きく、かつその直近の後続係数のスペクトル値よりも大きいスペクトル係数のうちの１つであるように、１つ以上の極値係数を決定するように構成することができる。

さらに、この装置は、極値係数のうちの少なくとも１つの極値係数の先行係数または後続係数のスペクトル値を所定の値に設定することによって修正オーディオ信号スペクトルを得るために、オーディオ信号入力スペクトルを修正するためのスペクトル修正器４２０を備えている。スペクトル修正器４２０は、１つ以上の極値係数のスペクトル値を前記所定の値に設定しないように構成されているか、または、１つ以上の極値係数のうちの少なくとも１つを疑似係数で置換するように構成されているが、その疑似係数のスペクトル値は前記所定の値とは異なる。

好ましくは、前記所定の値はゼロとすることができる。たとえば、図８の修正（置換）オーディオ信号スペクトル５３０において、多くのスペクトル係数のスペクトル値はスペクトル修正器４２０によってゼロに設定されている。

言い換えれば、修正オーディオ信号スペクトルを得るために、スペクトル修正器４２０は少なくとも、極値係数のうちの１つの極値係数の先行係数または後続係数のスペクトル値を所定の値に設定することになる。その所定の値は、たとえば、ゼロとすることができる。そのような先行係数または後続係数の比較値はその極値の比較値よりも小さい。

さらに、極値係数自体に関して、スペクトル修正器４２０は以下のように進行することになる。
スペクトル修正器４２０は、極値係数を前記の所定の値に設定しないか、または
スペクトル修正器４２０は極値係数のうちの少なくとも１つを疑似係数に置換するが、その疑似係数のスペクトル値は前記の所定の値とは異なる。これは、極値係数のうちの少なくとも１つの極値係数のスペクトル値が所定の値に設定され、スペクトル係数のうちの別の１つのスペクトル係数のスペクトル値がその所定の値とは異なる値に設定されることを意味する。そのような値は、たとえば、その極値係数のスペクトル値、その極値係数の先行係数のうちの１つの先行係数のスペクトル値、もしくはその極値係数の後続係数のうちの１つの後続係数のスペクトル値から導出することができる。または、そのような値は、たとえば、その極値係数の比較値、その極値係数の先行係数のうちの１つの先行係数の比較値、もしくはその極値係数の後続係数のうちの１つの後続係数の比較値から導出することができる。

スペクトル修正器４２０は、たとえば、極値係数のうちの１つを、その極値係数のスペクトル値もしくは比較値から導出されるスペクトル値を有する疑似係数、その極値係数の先行係数のうちの１つの先行係数のスペクトル値もしくは比較値から導出されるスペクトル値を有する疑似係数、またはその極値係数の後続係数のうちの１つの後続係数のスペクトル値もしくは比較値から導出されるスペクトル値を有する疑似係数で置換するように構成することができる。

さらに、この装置は、符号化オーディオ信号スペクトルを得るために修正オーディオ信号スペクトルを処理するための処理ユニット４３０を備えている。

たとえば、処理ユニット４３０は、任意の種類のオーディオ符号化器、たとえば、ＭＰ３（ＭＰＥＧ−１オーディオ層ＩＩＩまたはＭＰＥＧ−２オーディオ層ＩＩＩ、ＭＰＥＧ＝Moving Picture Experts Group）オーディオ符号化器、ＷＭＡ（Windows Media Audio）のためのオーディオ符号化器、ＷＡＶＥファイルのためのオーディオ符号化器、ＭＰＥＧ−２／４ＡＡＣ（先進的音響コード化：Advanced Audio Coding）オーディオ符号化器、またはＭＰＥＧ−ＤＵＳＡＣ（音声音響統合コード化：Unified Speed and Audio Coding）コーダとすることができる。

処理ユニット４３０は、たとえば、［非特許文献８］（ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4）に記載されているような、または、［非特許文献９］（ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4）に記載されているようなオーディオ符号化器とすることもできる。たとえば、処理ユニット４３０は、たとえば、［非特許文献８］に記載されているような量子化器および／もしくは時間的雑音成形ツールを備えてもよく、並びに／または、処理ユニット４３０は、たとえば、［非特許文献８］に記載されているような知覚的雑音置換ツールを備えてもよい。

さらに、この装置は、サイド情報を生成し送信するためのサイド情報生成器４４０を備えている。サイド情報生成器４４０は、スペクトル修正器４２０によって生成された修正オーディオ信号入力スペクトル内に１つ以上の疑似係数候補を位置特定するように構成されている。さらに、サイド情報生成器４４０は、疑似係数候補のうちの少なくとも１つを選択候補として選択するように構成されている。さらに、サイド情報生成器４４０は、サイド情報が選択候補を疑似係数として示すような、サイド情報を生成するように構成されている。

図７に示す実施形態において、サイド情報生成器４４０はスペクトル修正器４２０による疑似係数の位置（たとえば、疑似係数の各々の位置）を受信するように構成されている。さらに、図７の実施形態において、サイド情報生成器４４０は疑似係数候補の位置（たとえば、疑似係数候補の各々の位置）を受信するように構成されている。

たとえば、いくつかの実施形態において、処理ユニット４３０は量子化オーディオ信号スペクトルに基づいて疑似係数候補を決定するように構成することができる。一実施形態において、処理ユニット４３０は修正オーディオ信号スペクトルを量子化することによって量子化オーディオ信号スペクトルを生成しておくことができる。たとえば、処理ユニット４３０は量子化オーディオ信号スペクトルの少なくとも１つのスペクトル係数を疑似係数候補として決定することができ、その疑似係数候補はスペクトル値が所定の値（たとえば０）である直近の先行係数と、スペクトル値が所定の値である直近の後続係数とを有する。

また、他の実施形態において、処理ユニット４３０が量子化オーディオ信号スペクトルをサイド情報生成器４４０に渡し、サイド情報生成器４４０自体が量子化オーディオ信号スペクトルに基づいて疑似係数候補を決定してもよい。他の実施形態によれば、疑似係数候補は、また、修正オーディオ信号スペクトルに基づいて決定される。

サイド情報生成器によって生成されるサイド情報は、静的な所定のサイズのものとすることができるか、またはそのサイズは信号適応的に反復して推定することができる。この場合、サイド情報の実際のサイズも復号器に送信される。そのため、一実施形態によれば、サイド情報生成器４４０はサイド情報のサイズを送信するように構成されている。

一実施形態によれば、極値決定器４１０は、比較係数、たとえば、図８におけるパワースペクトル５２０の係数を調べるように構成され、最小係数の各々が、比較値がその先行係数のうちの１つの先行係数の比較値よりも小さくかつその後続係数のうちの１つの後続係数の比較値よりも小さいスペクトル係数のうちの１つであるように、１つ以上の最小係数を決定するように構成されている。そのような実施形態において、スペクトル修正器４２０は、１つ以上の極値係数の比較値と１つ以上の最小係数の比較値とに基づいて、代表値を所定の値とは異なるように決定するように構成することができる。さらに、スペクトル修正器４２０は、オーディオ信号入力スペクトルの係数のうちの１つの係数のスペクトル値を、そのスペクトル値を代表値に設定することによって、変更するように構成することができる。

特定の実施形態において、極値決定器は、比較係数、たとえば、図８におけるパワースペクトル５２０の係数を調べるように構成され、最小係数の各々が、その比較値がその直近の先行係数の比較値よりも小さく、かつその直近の後続係数の比較値よりも小さいスペクトル係数のうちの１つであるように、１つ以上の最小係数を決定するように構成されている。

または、極値決定器４１０は、オーディオ信号入力スペクトル５１０自体を調べるように構成され、１つ以上の最小係数の各々が、そのスペクトル値がその先行係数のうちの１つのスペクトル値よりも小さく、かつその後続係数のうちの１つのスペクトル値よりも小さいスペクトル係数のうちの１つであるように、１つ以上の最小係数を決定するように構成されている。そのような実施形態において、スペクトル修正器４２０は、極値係数のうちの１つ以上のスペクトル値と最小係数のうちの１つ以上のスペクトル値に基づいて、代表値をそれが所定の値とは異なるように決定するように構成することができる。さらに、スペクトル修正器４２０は、オーディオ信号入力スペクトルの係数のうちの１つの係数のスペクトル値を、それを上の代表値に設定することによって変更するように構成することができる。

特定の実施形態において、極値決定器４１０は、オーディオ信号入力スペクトル５１０自体を調べるように構成され、１つ以上の最小係数の各々が、スペクトル値がその直近の先行係数のスペクトル値よりも小さくかつその直近の後続係数のスペクトル値よりも小さいスペクトル係数のうちの１つであるように、１つ以上の最小係数を決定するように構成されている。

両実施形態において、スペクトル修正器４２０は、代表値を決定するために、極値係数と最小係数のうちの１つ以上、特にそれらの関連付けられる比較値またはそれらのスペクトル値を考慮に入れる。それ故、オーディオ信号入力スペクトルのスペクトル係数のうちの１つのスペクトル係数のスペクトル値が代表値に設定される。そのため、そのスペクトル値が代表値に設定されているスペクトル係数は、たとえば、極値係数自体であってもよく、または、極値係数に置き換わる疑似係数であってもよい。

一実施形態において、極値決定器４１０は、スペクトル値のシーケンスの１つ以上のサブシーケンスを、サブシーケンスの各々がオーディオ信号入力スペクトルの複数の連続するスペクトル係数を含むように決定するように構成することができる。連続するスペクトル係数は、それらのスペクトル位置に従ってサブシーケンス内で連続的に順序付けされる。サブシーケンスの各々は、その連続的に順序付けされたサブシーケンス内で最初にある第１の要素と、その連続的に順序付けされたサブシーケンス内で最後にある最後の要素とを有する。

特定の実施形態において、サブシーケンスの各々は、たとえば、最小係数のうちの２つと極値係数のうちの１つとを正確に含むことができる。最小係数の一方はサブシーケンスの最初の要素であり、最小係数の他方はサブシーケンスの最後の要素である。

一実施形態において、スペクトル修正器４２０は、それらのサブシーケンスのうちの１つのサブシーケンスの係数のスペクトル値または比較値に基づいて代表値を決定するように構成することができる。たとえば、極値決定器４１０が、比較スペクトル、たとえばパワースペクトル５２０、の比較係数を調べている場合、スペクトル修正器４２０はそれらのサブシーケンスのうちの１つのサブシーケンスの係数の比較値に基づいて代表値を決定するように構成することができる。一方、極値決定器４１０がオーディオ信号入力スペクトル５１０のスペクトル係数を調べている場合、スペクトル修正器４２０は、それらのサブシーケンスのうちの１つのサブシーケンスの係数のスペクトル値に基づいて代表値を決定するように構成することができる。

スペクトル修正器４２０は、そのサブシーケンスの複数の係数のうちの１つの係数のスペクトル値を、それを代表値に設定することによって変更するように構成されている。

表２は、スペクトル位置２５２〜２５８に５つのスペクトル係数を有する例を示す。

極値決定器４１０はスペクトル係数２５５（スペクトル位置２５５を有するスペクトル係数）が極値係数であると決定することができる。それは、スペクトル係数２５５の比較値（０．７３）がその先行係数２５４（ここでは直近の先行係数）の比較値（０．４８）よりも大きく、その比較値（０．７３）がその後続係数２５６（ここでは直近の後続係数）の比較値（０．４５）よりも大きいからである。

さらに、極値決定器４１０はスペクトル係数２５３が最小係数であると決定することができる。それは、スペクトル係数２５３の比較値（０．０５）がその先行係数２５２（ここでは直近の先行係数）の比較値（０．１２）よりも小さく、その比較値（０．０５）がその後続係数２５４（ここでは直近の後続係数）の比較値（０．４８）よりも小さいからである。

さらに、極値決定器４１０はスペクトル係数２５７が最小係数であると決定することができる。それは、スペクトル係数２５７の比較値（０．０３）がその（ここでは直近の）先行係数２５６（ここでは直近の先行係数）の比較値（０．４５）よりも小さく、その比較値（０．０３）がその後続係数２５８（ここでは直近の後続係数）の比較値（０．１８）よりも小さいからである。

したがって、極値決定器４１０は、スペクトル係数２５５が極値係数であると決定し、スペクトル係数２５３を極値係数２５５に最も近い先行する最小係数であると決定し、スペクトル係数２５７を極値係数２５５に最も近い後続する最小係数であると決定することによって、スペクトル係数２５３〜２５７を含むサブシーケンスを決定することができる。

次に、スペクトル修正器４２０はすべてのスペクトル係数２５３〜２５７の比較係数に基づいてサブシーケンス２５３〜２５７の代表値を決定することができる。

たとえば、スペクトル修正器４２０は、サブシーケンスのすべてのスペクトル係数の比較値を合計するように構成することができる。（たとえば、表２について、サブシーケンス２５３〜２５７の代表値は、このとき、合計０．０５＋０．４８＋０．７３＋０．４５＋０．０３＝１．７４となる）。

または、たとえば、スペクトル修正器４２０は、サブシーケンスのすべてのスペクトル係数の比較値の２乗を合計するように構成することができる。（たとえば、表２について、サブシーケンス２５３〜２５７の代表値は、このとき、合計（０．０５）²＋（０．４８）²＋（０．７３）²＋（０．４５）²＋（０．０３）²＝０．９６９２となる）。

または、たとえば、スペクトル修正器４２０は、サブシーケンス２５３〜２５７のすべてのスペクトル係数の比較値の２乗の合計の平方根をとるように構成することができる。（たとえば、表２について、代表値はこのとき、０．９８４４８である）。

いくつかの実施形態によれば、スペクトル修正器４２０は、極値係数のスペクトル値（表２ではスペクトル係数２５３のスペクトル値）を所定の値に設定することになる。

しかしながら、他の実施形態は、重心手法を使用する。表３は、スペクトル係数２８２〜２８８を含むサブシーケンスを示す。

極値係数はスペクトル位置２８５に位置するが、重心手法によれば、重心は異なるスペクトル位置に位置する。

重心のスペクトル位置を決定するために、極値決定器４１０は、サブシーケンスのすべてのスペクトル係数の重み付けスペクトル位置を合計して、その結果をサブシーケンスのスペクトル係数の比較値の合計で除算する。その後、重心を決定するために、除算の結果に商業的丸めを適用することができる。スペクトル係数の重み付けスペクトル位置は、そのスペクトル位置とその比較値との積である。

手短に言えば、極値決定器は、以下によって重心を得ることができる。
１）サブシーケンスの各スペクトル係数について比較値およびスペクトル位置の積を求める。
２）第１の合計を得るために、１）において求められた積を合計する。
３）第２の合計を得るために、サブシーケンスのすべてのスペクトル係数の比較値を合計する。
４）中間結果を生成するために、第１の合計を第２の合計で除算する。
５）重心を得るために、中間結果に最近への丸め（round-to-nearest rounding）を適用する（最近への丸め：８．４９は８に丸められ、８．５は９に丸められる）。

このように、表３の例について、重心は、以下によって得られる。
(0.04×282＋0.10×283＋0.20×284＋0.93×285＋0.92×286＋0.90×287＋0.05×288)/(0.04＋0.10＋0.20＋0.93＋0.92＋0.90＋0.05)
＝897.25/3.14
＝285.75
＝286。

このように、極値決定器４１０は、表３の例についてはスペクトル位置２８６を重心として決定するように構成される。

いくつかの実施形態において、極値決定器４１０は、完全な比較スペクトル（例えば、パワースペクトル５２０）を調べないか、または完全な音声信号入力スペクトルを調べない。代わりに、極値決定器４１０は、比較スペクトルまたはオーディオ信号入力スペクトルを部分的にのみ調べることができる。

図９はそのような例を示す。そこでは、（比較スペクトルとしての）パワースペクトル６２０は、極値決定器４１０によって、係数５５で開始して調べられている。５５より小さいスペクトル位置の係数は調べられていない。それゆえ、５５より小さいスペクトル位置にあるスペクトル係数は、置換ＭＤＣＴスペクトル６３０において修正されていないままである。それに対し、図８はすべてのＭＤＣＴスペクトルラインがスペクトル修正器４２０によって修正された置換ＭＤＣＴスペクトル５３０を示している。

このように、スペクトル修正器４２０は、オーディオ信号入力スペクトルのうちの少なくともいくつかのスペクトル係数のスペクトル値が修正されていないままにしておくように、オーディオ信号入力スペクトルを修正するように構成することができる。

いくつかの実施形態において、スペクトル修正器４２０は、比較値のうちの１つ、または、極値係数のうちの１つの極値係数のスペクトル値の値の差が閾値より小さいか否かを決定するように構成されている。そのような実施形態において、スペクトル修正器４２０は、オーディオ信号入力スペクトルのうちの少なくともいくつかのスペクトル係数のスペクトル値が、その値の差が閾値より小さいか否かに応じて、修正オーディオ信号スペクトルにおいて修正されていないままにしておくように、オーディオ信号入力スペクトルを修正するように構成されている。

たとえば、一実施形態において、スペクトル修正器４２０は、極値係数のすべてを修正または置換するのではなく、代わりに、極値係数のいくつかだけを修正または置換するように構成することができる。たとえば、極値係数（たとえば極大）の比較値と後続および／または先行する最小値の比較値との差が閾値より小さいときに、スペクトル修正器はこれらのスペクトル値（および、たとえばそれらの間のスペクトル係数のスペクトル値）を修正せず、代わりにこれらのスペクトル値を修正（置換）ＭＤＣＴスペクトル６３０において修正されていないままにするように決定することができる。図９の修正ＭＤＣＴスペクトル６３０において、スペクトル係数１００〜１１２のスペクトル値およびスペクトル係数１２４〜１３６のスペクトル値は、未修正（置換）スペクトル６３０においてスペクトル修正器によって修正されていないままにされている。

処理ユニットは、量子化ＭＤＣＴスペクトル６３５を得るために、修正（置換）ＭＤＣＴスペクトル６３０の係数を量子化するようにさらに構成することができる。

一実施形態によれば、スペクトル修正器４２０は、微調整情報を受信するように構成することができる。オーディオ信号入力スペクトルのスペクトル係数のスペクトル値は各々が符号成分を含む符号付きの値とすることができる。微調整情報が第１の微調整状態にあるとき、スペクトル修正器は、１つ以上の極値係数のうちの１つの極値係数の符号成分または疑似係数の符号成分を第１の符号値に設定するように構成することができる。また、微調整情報が異なる第２の微調整状態にあるとき、スペクトル修正器は、１つ以上の極値係数のうちの１つの極値係数のスペクトル値の符号成分または疑似係数の符号成分を異なる第２の符号値に設定するように構成することができる。

たとえば、表４において、スペクトル係数のスペクトル値は、スペクトル係数２９１が第１の微調整状態にあり、スペクトル係数３０１が第２の微調整状態にあり、スペクトル係数３２１が第１の微調整状態にあること等を示している。

たとえば、上述した重心決定に戻ると、重心が２つのスペクトル位置間にある（例えば、ほぼ中央にある）場合、スペクトル修正器は、第２の微調整状態が示されるように符号を設定することができる。

一実施形態によれば、処理ユニット４３０は、量子化オーディオ信号スペクトルを得るために修正オーディオ信号スペクトルを量子化するように構成することができる。処理ユニット４３０は、符号化オーディオ信号スペクトルを得るためにその量子化オーディオ信号スペクトルを処理するようにさらに構成することができる。

さらに、処理ユニット４３０は、その量子化オーディオ信号スペクトルのスペクトル係数のうち、スペクトル値が所定の値に等しい直近の先行係数とスペクトル値が所定の値に等しい直近の後続係数をもつスペクトル係数のみについて、その係数が極値係数のうちの１つであるか否かを示すサイド情報を生成するようにさらに構成することができる。

そのような情報は、極値決定器４１０によって処理ユニット４３０に提供することができる。

たとえば、量子化オーディオ信号スペクトルのスペクトル係数のうちスペクトル値が所定の値に等しい直近の先行係数とスペクトル値が所定の値に等しい直近の後続係数をもつスペクトル係数の各々について、（たとえば、ビット値１によって）その係数が極値係数のうちの１つであるか、または、（たとえば、ビット値０によって）その係数が極値係数のうちの１つでないかを示すそのような情報は、処理ユニット４３０によってビットフィールドに記憶することができる。一実施形態において、復号器は、オーディオ信号入力スペクトルを復元するためにこの情報を後に使用することができる。ビットフィールドは、固定長または信号に合わせて選択された長さをもつことができる。後者の場合、ビットフィールドの長さは付加情報として復号器に伝達することができる。

たとえば、処理ユニット４３０によって生成されるビットフィールド［０００１１１１１１］は、（連続して順序付けられている）（量子化）オーディオ信号スペクトルに現れる最初の３つの「独立型（stand-alone）」係数（それらのスペクトル値は所定の値に等しくなく、それらの先行係数のスペクトル値とそれらの後続係数のスペクトル値が所定の値に等しい）が極値係数ではなく、次の６つの「独立型」係数が極値係数であることを示すことができる。このビットフィールドは図９の量子化ＭＤＣＴスペクトル６３５にみられる状況を説明しており、そこでは最初の３つの「独立型」係数５、８、２５は極値係数でなく、次の６つの「独立型」係数５９、７１、８３、９４、１１６、１４１が極値係数である。

ここでも、そのスペクトル係数の直近の先行係数は量子化オーディオ信号スペクトル内でそのスペクトル係数の直前にある別のスペクトル係数であり、そのスペクトル係数の直近の後続係数は量子化オーディオ信号スペクトル内でそのスペクトル係数の直後にある別のスペクトル係数である。

提案されている概念は、低ビットレートにおける従来のブロックベースの変換コーデックの知覚的品質を強化するものである。オーディオ信号スペクトルの部分的な音領域、すなわち隣接する極小値間にわたり１つの極大値をもつ音領域を、疑似ライン（疑似係数とも称される）によって置換することを提案する。その疑似ラインは、いくつかの実施形態においては置換されるその音領域と同様のエネルギーまたはレベルを有する。

低ビットレートにおいて、実施形態は、単一の技術の手に余るビットレートに対して改善された知覚的な品質および改善されたスケーリングを得るために、波形コード化およびパラメトリック符号化を緊密に統合する方法の概念を提供する。

いくつかの実施形態では、スペクトルの「尖頂のある領域」（隣接する極小値間にわたり、１つの極大値をもつ領域）は、各々単一のシヌソイドに完全に置換することができる。それに対し、正弦波コーダでは残差から合成シヌソイドを反復的に減算する。適切な「尖頂のある領域」が抽出されて滑らかな、わずかに白色化されたスペクトル表現になり、特定の特徴（ピークの高さ、ピークの形状）に関して選択される。

いくつかの実施形態によれば、これらの置換シヌソイドは、コード化されるスペクトル内の疑似ライン（疑似係数）として表わすことができ、（例えば、真の値の現実の突起に対応する通常のＭＤＣＴラインとは対照的に）シヌソイドの全振幅またはエネルギーを反映する。

いくつかの実施形態によれば、疑似ライン（疑似係数）は、サイド情報フラグアレイによってそのようなものとしてマーキングすることができる。

いくつかの実施形態においては、疑似ラインの符号の選択が、半サブバンド周波数分解能を示すことができる。

いくつかの実施形態において、周波数分解能が制限されている（例えば半サブバンド）ことに起因して、正弦波置換には低域遮断周波数が妥当であり得る。

以下において、符号化オーディオ信号に基づいてオーディオ出力信号を生成するための概念を示す。これらの概念は、ＭＤＣＴ領域におけるシヌソイドおよびスイープの効率的な合成を実現する。

図１Ａは、一実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す。

この装置は、複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するための処理ユニット１１５を備え、スペクトル係数の各々は符号化オーディオ信号スペクトル内のスペクトル位置およびスペクトル値を有し、スペクトル係数はスペクトル係数のシーケンスを形成するように符号化オーディオ信号スペクトル内のそれらのスペクトル位置に従って連続して順序付けされる。

さらに、この装置は、復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するための疑似係数決定器１２５を備え、疑似係数の各々はスペクトル係数のうちの１つである（疑似係数の各々はスペクトル係数のうちの１つであるため、疑似係数の各々はスペクトル位置およびスペクトル値を有する）。

さらに、この装置は、修正オーディオ信号スペクトルを得るために少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するための置換ユニット１３５を備え、決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、少なくとも２つのパターン係数の各々はスペクトル値を有する。

たとえば、いくつかの実施形態において、置換ユニット１３５は、スペクトルパターンを、ストレージユニットから取得されるスペクトルパターンとして取得することができる。ストレージユニットは、この装置に含まれ、データベースまたはメモリを含む。他の実施形態において、置換ユニット１３５は遠隔ユニットからスペクトルパターンを取得することもできる。遠隔ユニットはたとえば遠隔データベースであり、たとえばこの装置から遠く離れて位置するものである。さらなる実施形態において、スペクトルパターンは分析的にオンザフライ（on-the-fly）（実行時、必要に応じて）で生成される。取得されたスペクトルパターンは、その後、決定されたスペクトルパターンとして利用することができる。
または、決定されたスペクトルパターンは、たとえば、取得されたスペクトルパターンを修正することによって、取得されたスペクトルパターンから導出することができる。

さらに、この装置は、オーディオ出力信号を得るために修正オーディオ信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニット１４５を備えている。

図１Ｂは、別の実施形態による、符号化オーディオ信号スペクトルに基づいてオーディ出力信号を生成するための装置を示す。図１Ｂの装置は、それ自体がデータベースまたはメモリを含むストレージユニット１５５をさらに備えているという点で、図１Ａの実施形態の装置と異なる。

特に、図１Ｂの実施形態の装置は、複数の記憶されているスペクトルパターンをその中に記憶しているデータベースまたはメモリを含むストレージユニット１５５をさらに備えている。記憶されているスペクトルパターンの各々は、スペクトル特性（たとえば、一定周波数、掃引周波数、各々ビン上またはビン間位置のバージョン、など）を有する。置換ユニット１３５は、記憶されているスペクトルパターンの１つを、要求されたスペクトルパターンとしてストレージユニット１５５に要求するように構成されている。ストレージユニット１５５は、その要求されたスペクトルパターンを提供するように構成されている。さらに、置換ユニット１３５は、要求されたスペクトルパターンに基づいて少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するように構成されている。

好ましい実施形態において、記憶されているスペクトルパターンは、特定の周波数ごとに記憶されてはいない。そうすることは膨大な量のメモリを必要とする。したがって、各パターン（たとえば、一定のビン上パターン、一定のビン間パターンおよび様々なスイープに対するいくつかのパターン）は一度しか記憶されない。この一般的なパターンはその後、たとえば、データベースから要求され、目標周波数、たとえば、目標周波数８２００Ｈｚに適合され、必要とされる位相（たとえば、０rad）に適合され、その後、目標スペクトル位置にパッチされる。

一実施形態において、置換ユニット１３５は、疑似係数決定器１２５によって決定される１つ以上の疑似係数のうちの少なくとも１つから導出される第１の導出スペクトル位置に応じてストレージユニット１５５に、記憶されているスペクトルパターンの１つを要求するように構成されている。たとえば、その要求はパターンの性質（一定、スイープなど）に応じて決まり、そのパターン適合は、正弦波トラック内のスペクトル位置と先行係数に応じて、または正弦波トラックの信号に適応して決定される開始位相に応じて決まる。

一実施形態において、１つ以上の疑似係数のうちの少なくとも１つから導出される第１の導出スペクトル位置は、それらの疑似係数のうちの１つの疑似係数のスペクトル位置とすることができる。

別の実施形態において、１つ以上の疑似係数は各々が符号成分を含む符号付きの値であり、置換ユニット１３５は、１つ以上の疑似係数のうちの１つの疑似係数のスペクトル位置とその疑似係数の符号成分に基づいて、符号成分が第１の符号値を有するときに第１の導出スペクトル位置がその疑似係数のスペクトル位置に等しくなるように、および符号値が異なる第２の値を有するときに、第１の導出スペクトル位置が、その疑似係数のスペクトル位置を所定の値だけシフトすることによってもたらされる修正位置に等しくなるように、第１の導出スペクトル位置を決定するように構成されている。

たとえば、疑似ラインの半ビン周波数分解能は、その疑似係数の符号によって示すことができる。そのため、疑似係数の符号成分が第２の符号値を有する場合に、たとえば、時間―周波数領域を考えると、その疑似係数のスペクトル位置がシフトされる所定の値は、２つの連続するビンの周波数差の半分に対応させることができる。

特定の実施形態において、疑似係数１２５決定器は、復号オーディオ信号スペクトルの２つ以上の時間的に連続する疑似係数を決定するように構成されている。置換ユニット１３５は、第１の疑似係数から導出される第１の導出スペクトル位置と、第２の疑似係数から導出される第２の導出スペクトル位置との間の絶対差が閾値よりも小さいか否かに応じて、２つ以上の時間的に連続する疑似係数のうちの第１の疑似係数および第２の疑似係数をトラックに割り当てるように構成されている。ストレージユニットのデータベースまたはメモリ内に記憶されている複数の記憶されているスペクトルパターンは、定常音パターンまたは周波数掃引パターンのいずれかとすることができる。そのため、置換ユニット１３５は、トラックの第１の疑似係数から導出される第１の導出スペクトル位置がトラックの第２の疑似係数から導出される第２の導出スペクトル位置に等しいときに、ストレージユニット１５５に、定常音パターンの１つを要求するように構成することができる。さらに、置換ユニット１３５は、トラックの第１の疑似係数から導出される第１の導出スペクトル位置がトラックの第２の疑似係数から導出される第２の導出スペクトル位置とは異なるときに、ストレージユニット１５５に周波数掃引パターンの１つを要求するように構成することができる。

たとえば、トラックの第１の疑似係数から導出される第１の導出スペクトル位置は、第１の疑似係数のスペクトル位置とすることができる。たとえば、トラックの第２の疑似係数から導出される第２の導出スペクトル位置は、第２の疑似係数のスペクトル位置とすることができる。

たとえば、疑似係数は、複数の時間−周波数ビンのうちの１つ、または２つの時間−周波数ビンの間の中間周波数位置、たとえば、時間−周波数ビン（ｎ，ｋ）に割り当てることができる。ｎは時間を示し、ｋは周波数を示す。疑似係数の時間−周波数ビンの周波数または２つの時間−周波数ビンの間の周波数位置の周波数は、したがって、その疑似係数のスペクトル位置を示すことができる。置換ユニット１３５は、時間−周波数ビン（ｎ，ｋ）を受信すると、時刻（ｎ−１）において現在の疑似係数の時間−周波数ビンの直前にあり、現在の疑似係数の時間−周波数ビンの周波数に等しいかまたは近い（ｋに等しいまたは近い）時間−周波数ビンに割り当てられている疑似係数をすでに受信したか否かをチェックする。置換ユニット１３５は、その後、両方の疑似係数をトラックに割り当てる。

たとえば、時間において現在の時間−周波数ビンの直前にある時間−周波数ビンを有する疑似係数は、両方の周波数の絶対周波数差が閾値よりも小さい場合、現在の時間−周波数ビンの周波数に近いと考えることができる。（たとえば、周波数インデックスが周波数であると考えられる場合、絶対差が２よりも小さい場合）。

トラックの両方の疑似係数が同じスペクトル位置を有する場合、置換ユニット１３５は、これを、定常音が存在するという指標であるとみなし、対応する周波数を有する定常音パターンを要求する。

一方、トラックのスペクトル係数のスペクトル位置が異なる場合、置換ユニット１３５は、これを、スイープが存在する指標であるとみなし、ストレージユニット１５５に周波数掃引パターンを要求する。トラック内の先行する疑似係数の周波数位置によって示される周波数は、このとき、掃引パターンの開始周波数を示すことができ、トラック内の現在の疑似係数の周波数位置によって示される周波数は、このとき、掃引パターンの目標周波数を示すことができる。

一実施形態によれば、置換ユニット１３５は、トラックの第２の疑似係数とトラックの第１の疑似係数との間の周波数差が所定の値の半分に等しいとき、ストレージユニットに周波数掃引パターンのうちの第１の周波数掃引パターンを要求するように構成することができる。

さらに、置換ユニット１３５は、トラックの第２の疑似係数とトラックの第１の疑似係数との間の周波数差が所定の値に等しいとき、ストレージユニットに周波数掃引パターンのうちの、第１の周波数掃引パターンとは異なる、第２の周波数掃引パターンを要求するように構成することができる。

さらに、置換ユニット１３５は、トラックの第２の疑似係数とトラックの第１の疑似係数との間の周波数差が所定の値の１．５倍に等しいとき、ストレージユニットに周波数掃引パターンのうちの、第１の周波数掃引パターンとも第２の周波数掃引パターンとも異なる、第３の周波数掃引パターンを要求するように構成することができる。

たとえば、所定の値は、２つの時間的に連続する時間−周波数ビン間の周波数差とすることができる。したがって、そのような実施形態において、開始周波数と目標周波数との間の周波数差が周波数ビン差の１／２倍だけ、周波数ビン差の１．０倍だけ、および、周波数ビン差の３／２倍だけ異なるスイープのパターンが提供される。

図１Ｃは一実施形態による装置を示し、置換ユニット１３５は、決定されたスペクトルパターンを得るために、ストレージユニット１５５から提供される要求されたスペクトルパターンを修正するように構成されているパターン適合ユニット１３８を備えている。

一実施形態において、パターン適合ユニット１３８は、決定されたスペクトルパターンを得るために、１つ以上の疑似係数のうちの１つの疑似係数のスペクトル値に応じて、要求されたスペクトルパターンのパターン係数のスペクトル値を再スケーリングすることによって、ストレージユニット１５５によって提供される要求されたスペクトルパターンを修正するように構成することができる。スペクトル置換ユニット１３５は、修正オーディオ信号スペクトルを得るために、その後、少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するように構成される。したがって、この実施形態によれば、要求されたスペクトルパターンのパターン係数のスペクトル値のサイズは、疑似係数のスペクトル値に応じて調整することができる。

一実施形態によれば、パターン適合ユニット１３８は、開始位相に応じて、開始位相が第１の開始位相値を有するときは要求されたスペクトルパターンのパターン係数の各々のスペクトル値が第１の様式で修正されるように、および、開始位相が異なる第２の開始位相値を有するときは要求されたスペクトルパターンのパターン係数の各々のスペクトル値が第２の様式で修正されるように、ストレージユニットによって提供される要求されたスペクトルパターンを修正するように構成することができる。トラックのパターンの位相を調整することによって、トラックの１つのパターンから後続するパターンへのシームレスな遷移を達成することができる。

一実施形態によれば、要求されたスペクトルパターンのパターン係数の各々のスペクトル値は、実数部と虚数部とを含む複素係数である。パターン適合ユニット１３８は、複素係数の各々について、複素平面内でその複素係数を表すベクトルが、複素係数の各々について同じ角度だけ回転されるように、ストレージユニット１５５によって提供される要求されたスペクトルパターンのパターン係数の各々の実数部および虚数部を修正することによって、要求されたスペクトルパターンを修正するように構成することができる。または、記憶されているパターンの位相を、複素回転係数ｅ^j・φを適用することによって回転してもよい。φは任意の位相角である。

特定の実施形態において、要求されたスペクトルパターンのパターン係数の各々のスペクトル値は実数部と虚数部とを含む。そのような実施形態において、パターン適合ユニット１３８は、要求されたスペクトルパターンのパターン係数の各々のスペクトル値の実数部および虚数部をネゲートすることによって、または、要求されたスペクトルパターンのパターン係数の各々のスペクトル値の実数部もしくはネゲートされた実数部および虚数部もしくはネゲートされた虚数部をスワップすることによって、ストレージユニット１５５によって提供される要求されたスペクトルパターンを修正するように構成することができる。

一実施形態において、パターン適合ユニット１３８は、パターンの時間的ミラーリングを実現することによって、ストレージユニット１５５によって提供される要求されたスペクトルパターンを修正するように構成することができる。一般に、これは、パターンの複素共役を（虚数部に−１を乗算することによって）計算し、複素位相項（ひねり）を適用することによって、周波数領域において得ることができる。

一実施形態において、復号オーディオ信号スペクトルはＭＤＣＴ領域において表される。そのような実施形態においては、パターン適合ユニット１３８は、このとき、修正スペクトルパターンを得るために、要求されたスペクトルパターンのパターン係数のスペクトル値を修正することによってストレージユニット１５５によって提供される要求されたスペクトルパターンを修正するように構成され、その場合、スペクトル値は奇積層離散フーリエ変換領域において表される。さらに、パターン適合ユニット１３８は、そのような実施形態において、決定されたスペクトルパターンを得るために、修正スペクトルパターンのパターン係数のスペクトル値を、奇積層離散フーリエ変換領域からＭＤＣＴ領域へと変換するように構成することができる。さらに、置換ユニット１３５は、そのような実施形態において、ＭＤＣＴ領域において表される修正オーディオ信号スペクトルを得るために、少なくとも１つまたは複数の疑似係数を、ＭＤＣＴ領域において表される決定されたスペクトルパターンで置換するように構成されている。

または、複数の実施形態において、スペクトル値は、複素修正離散コサイン変換（ＣＭＤＣＴ）領域において表すことができる。さらに、これらの実施形態において、パターン適合ユニット１３８は、決定されたスペクトルパターンを得るために、複素修正パターンの実数部を単純に抽出することによって、修正スペクトルパターンのパターン係数のスペクトル値をＣＭＤＣＴ領域からＭＤＣＴ領域へと変換するように構成することができる。

図１Ｄは、一実施形態による、複数のスペクトルパターンを生成するための装置を示す。

この装置は、第１の領域において複数の信号を生成するための信号生成器１６５を備えている。

さらに、この装置は、複数のスペクトルパターンを得るために、複数の信号の各信号を第１の領域から第２の領域へと変換するための信号変換ユニット１７５を備えており、複数の変換されたスペクトルパターンの各パターンは複数の係数を含む。

さらに、この装置は、複数の処理されたパターンを得るために、変換されたスペクトルパターンの係数のうちの１つ以上を除去することによって、変換されたスペクトルパターンを切り詰めるための後処理ユニット１８５を備えている。

さらに、この装置は、データベースまたはメモリを含むストレージユニット１９５を備えており、ストレージユニット１９５は複数の処理されたパターンの各処理されたパターンをデータベースまたはメモリに記憶するように構成されている。

信号生成器１６５は、以下の式
x(t) = cos (2πφ(t))
および
に基づいて複数の信号の各信号を生成するように構成されている。式中、ｔおよびτは時間を示し、φ（ｔ）はｔにおける瞬時位相であり、ｆ（τ）はτにおける瞬時周波数である。複数の信号の各信号は、第１の時点におけるその信号の瞬時周波数である開始周波数（ｆ₀）と、異なる第２の時点におけるその信号の瞬時周波数である目標周波数（ｆ₁）を有する。

信号生成器１６５は、第１の信号の目標周波数（ｆ₁）が開始周波数（ｆ₀）と等しくなるように、複数の信号のうちの第１の信号を生成するように構成されている。さらに、信号生成器１６５は、第１の信号の目標周波数（ｆ₁）が開始周波数（ｆ₀）とは異なるように、複数の信号のうちの異なる第２の信号を生成するように構成されている。

一実施形態によれば、信号変換ユニット１７５は、複数の信号の各信号を、時間領域である第１の領域からスペクトル領域である第２の領域へと変換するように構成されている。信号変換ユニット１７５は、その信号を変換するための複数のタイムブロックのうちの第１のタイムブロックを生成するように構成されており、それらの複数のタイムブロックの各タイムブロックは複数の重み付きサンプルを含み、それらの重み付きサンプルの各々は複数の重みのうちの１つの重みによって重み付けされているその信号の信号サンプルであり、それらの複数の重みはそのタイムブロックに割り当てられ、それらの複数の重みの各重みは時点に割り当てられている。それらの複数の信号の各信号の開始周波数（ｆ₀）は第１の時点におけるその信号の瞬時周波数であり、それらのタイムブロックのうちの第１のタイムブロックのそれらの重みのうちの第１の重みが第１の時点に割り当てられ、それらのタイムブロックのうちの異なる第２のタイムブロックのそれらの重みのうちの第２の重みが第１の時点に割り当てられ、それらのタイムブロックのうちの第１のタイムブロックとそれらのタイムブロックのうちの第２のタイムブロックは重なり、それらの重みのうちの第１の重みはそれらの重みのうちの第２の重みに等しい。それらの複数の信号の各信号の目標周波数（ｆ₁）は第２の時点におけるその信号の瞬時周波数であり、それらのタイムブロックのうちの第１のタイムブロックのそれらの重みのうちの第３の重みが第２の時点に割り当てられ、それらのタイムブロックのうちの異なる第３のタイムブロックのそれらの重みのうちの第４の重みが第２の時点に割り当てられ、それらのタイムブロックのうちの第１のタイムブロックとそれらのタイムブロックのうちの第３のタイムブロックは重なり、それらの重みのうちの第３の重みはそれらの重みのうちの第４の重みに等しい。

たとえば、図６Ａは一例を示しており、第１の時点がｎ₀によって示され、第２の時点がｎ₁によって示されている。重なり合っているブロックがブロックＬとＬ＋１として示されている。それらの重みは、ブロックＬ内の曲線およびブロックＬ＋１内の曲線によってそれぞれ描写されている。

注目すべきは、たとえば、パターンの生成には１つのタイムブロック（たとえば、それらのタイムブロックのうちの第１のタイムブロック）のみを生成すれば十分であるということである。

一実施形態によれば、それらの複数の信号の各信号は、第１の時点におけるその信号の位相である開始位相（φ₀）と異なる第２の時点におけるその信号の位相である目標位相（φ₁）を有し、信号生成器（１６５）は、それらの複数の信号のうちの第１の信号の開始位相（φ₀）がそれらの複数の信号のうちの異なる第２の信号の開始位相（φ₀）に等しくなるように、それらの複数の信号を生成するように構成されている。

それらの複数の信号の各信号の開始位相（開始周波数および停止周波数の選択によって、事実上は開始位相および目標（停止）位相）はその開始時点と停止時点において調整される。

第１の（開始）時点と第２の（停止）時点のこの特別な選択によって、異なるスペクトル特性を有するパターンが連結される場合に発生することのある重畳加算アーティファクトが低減される。

一実施形態において、後処理ユニット１８５は、複数の回転されたスペクトルパターンを得るために、変換されたスペクトルパターンの各々のスペクトル係数に対してπ／４の回転を行うようにさらに構成することができる。

さらなる実施形態によれば、信号生成器１６５は、それらの複数の信号として、第１の信号、第２の信号および１つ以上のさらなる信号を、それらのさらなる信号の各々の目標周波数と開始周波数との各差が第２の信号の目標周波数と開始周波数との差の整数倍になるように、生成するように構成することができる。

たとえば、第２の信号の目標周波数と開始周波数とのその周波数差は、半ビン周波数差、時間−周波数ビンでは例えば２つの連続するビンの周波数差の半分の周波数差、と一致させることができる。さらなる第３の信号の目標周波数と開始周波数とのその周波数差は、１ビン周波数差、時間−周波数ビンでは例えば２つの連続するビンの周波数差と等しい周波数差、と一致させることができる。さらなる第４の信号の目標周波数と開始周波数とのその周波数差は、１．５ビン周波数差、時間−周波数ビンでは例えば２つの連続するビンの周波数差の１．５倍と等しい周波数差、と一致させることができる。

したがって、第３の信号の目標周波数と開始周波数との差と、第２の信号の目標周波数と開始周波数との差との比は、２．０（整数値）である。第４の信号の目標周波数と開始周波数との差と、第２の信号の目標周波数と開始周波数との差との比は、３．０（整数値）である。

特定の実施形態をより詳細に述べる前に、より良好な説明のために、ＭＤＣＴの基礎を説明する。

実数の信号ｘ（ｎ）のＭＤＣＴは、長さＮで、時刻ｌにおいてｗ（ｎ）の窓をかけられた信号セグメント
について、以下のように定義される。
（ｍ＋１／２）の中の＋１／２は周波数シフトを表す。（ｎ＋１／２＋Ｍ／２）は時間シフトを表す。

逆変換は以下のように記述される。

ＭＤＣＴは以下のように定義される複素修正離散コサイン変換（ＣＭＤＣＴ）の実数部と考えることができる。

さらに、ＣＭＤＣＴは、奇積層離散フーリエ変換（ＯＤＦＴ：Oddly-Stacked Discrete Fourier Transform）または離散フーリエ変換（ＤＦＴ）と指数関数の前ひねりおよび後ひねり位相項として表現することができる。

は、後ひねりによる時間シフトを表す。

以下において、ＭＤＣＴ領域における音パターンの抽出とパッチングを説明する。ここで、特定のＭＤＣＴの特性に関していくつか説明する。特に、最初に、ＭＤＣＴのための準備を考察する。

指数関数的ないわゆる後ひねり項を含む式（４）から分かるように、ＣＭＤＣＴは、ＤＦＴまたはＯＤＦＴと比較して時間シフトされた基底関数を有する。したがって、パッチ適用の実際のスペクトル位置からパッチされているシヌソイドの絶対位相オフセットφ₀を分離することが所望される場合、このひねりを考慮に入れるべきである。

実施形態は、ＯＤＦＴ領域においてパターン抽出とパッチングを行い、ＭＤＣＴ係数と混合する前にそのひねりを適用することによってすべてのパターンの重ね合わせを後処理する。

各パッチは、以下の式に従って生成される原型シヌソイドまたはスイープの切り詰め複素ＯＤＦＴスペクトルを抽出することによって得られる。変動する瞬時周波数（ＩＦ）ｆ（ｔ）を有するシヌソイドは以下のように合成することができる。
x(t) = cos (2πφ(t)) （５）
ここで、瞬時位相は以下のようになる。

時間離散ＭＤＣＴと時間連続シヌソイドとの間の関係の記述を単純にするために、以下では正規化サンプリングレートｆｓ＝１を仮定する。掃引テンプレートの瞬時周波数（ＩＦ）ｆ（τ）は、開始ＩＦおよび目標ＩＦがそれぞれ、長さＮの各ＭＤＣＴタイムブロックの時間領域エイリアス除去（ＴＤＡＣ）対称点ｔ₀＝Ｎ／４＋０．５およびｔ₁＝３Ｎ／４＋０．５に厳密に達するように選択される。長さＭ＝Ｎ／２の時間間隔における周波数範囲Δｆ＝ｆ₁−ｆ₀にわたる周波数ｆ₀からｆ₁への線形掃引は、以下の瞬時周波数（ＩＦ）を有する。
これによって、瞬時位相は以下のようになる。

（パターン合成に利用されることになるＭＤＣＴと比較して）２倍の分解能の開始周波数および終端周波数を有するシヌソイドを、
および
を選択することによって生成することができ、周波数オフセットｍは変換ビンインデックスにおいて測定される。奇数インデックスは「ビン上」周波数に対応し、偶数インデックスは「ビン間」周波数を与える。連続するフレーム間の位相進行は以下のように計算することができる。

これは、パターンのシームレスな時間的連結のために、各パッチの位相が、開始周波数インデックスｋおよび先行するパターンの周波数オフセットインデックスｍに応じてπ／４の整数倍だけ調整されるべきであることを意味する。変数ｍは掃引速度と考えることもでき、たとえば、ｍ＝１は、１つのタイムブロックの継続時間にわたる半ビン掃引を示す。

さらに、整数ビンスペクトルシフトの補償を行なうことができる。これらの原型シヌソイドまたはスイープのスペクトル位置は、周期的折り返し誤差を最小限に抑えるためにスペクトルの中央に位置するように選択することが有益である。原型シヌソイドおよびパッチング目標位置のスペクトル距離ｄに応じて、パッチング目標位置とは無関係に常に所定の固定位相を得るために、ｄπ／２の後処理回転によってパッチが適合される。言い換えれば、後処理回転が、スペクトルシフトによって本質的に引き起こされる望ましくない位相回転を補償する。

次に、効率と精度を考察する。最初に計算効率を考察する。

表５は種々の後ひねりを実現するための演算を示す。記憶されるべきパターンの量を妥当に小さいままにし、かつ、最も重要なことには、表５にリストされている演算によってπの特定の単分数だけの回転を達成することができるということを活用することを可能にするために、可能性のある周波数およびスイープは制約されるべきである。

以下において、周波数分解能を考察する。これらの制約は、同時に、パラメトリックにコード化された信号部分を知覚的に満足に再現することを可能にするために必要とされる。そのような信号部分は、音パターンの任意の時間シーケンスを含み得るため、自由度が追加されるごとに記憶されるべきパターンの数が倍増するか、またはその代わりにパターンを適合させるための計算コストが倍増する。したがって、意図される目標スペクトル範囲において平均的な聴き手によってデチューニング効果（detuning effect）が知覚されないように、スペクトル分解能を選択することが理にかなっている。

訓練された聴き手および音楽家は、５セントまでのデチューニングを知覚することが可能であり、平均的な聴き手は約１０セント（半音の１０分の１）の偏差を許容し得る。それゆえ、正弦音のスペクトル置換は、許容可能なデチューニングの最悪の場合の筋書きに対応する一定の遮断周波数よりも上でのみ行われるべきである。たとえば、５１２帯域ＭＤＣＴにおいて、１２．８ｋＨｚのサンプリング周波数で、帯域あたりのスペクトル分解能は１２．５Ｈｚである。音パターンに対して半帯域分解能を選択すると、最大周波数偏差は３．１２５Ｈｚになり、これは、約５４０Ｈｚの遮断周波数より上では１０セント以下である。

次に、パターンサイズを考察する。実施形態によれば、記憶されるべきパターンは切り詰められる。パターンの実際のサイズは、通常は変換コーダによってすでに決定されている窓タイプ（たとえば、ＡＡＣのための正弦またはカイザー−ベッセル派生（ＫＢＤ：Kaiser-Bessel derived）窓）と許容可能な信号雑音比（ＳＮＲ）に応じて決まる。複素数値パターンが記憶されるが、実際のパッチングは適合して回転されたパターンの実数部のみを使用して行われる。

以下において、音パターンを考察する。最初に、定常音パターンを説明する。

前述の理由から、スペクトル分解能は、ＭＤＣＴの公称分解能の２倍に選択されるべきである。結果として、すべてのパターンの２つのバージョン、すなわち、ビン位置と一致する周波数を有するシヌソイドのもの（ビン上パターン）とビン位置間に位置する周波数のもの（ビン間パターン）、を記憶する必要がある。可能なメモリ要件を最小にするために、実際のパターンの係数の半分のみを記憶してパターン対称性を活用することができる。

式（９）（ｍ＝０に設定）によれば、これらの定常音パターンの任意の時間シーケンスにおいて、ラップ位相（wrapped phase）進行は、ビン上パターンについては△φ＝π／２または△φ＝−π／２になり、ビン間パターンについては△φ＝０または△φ＝πになる。これは、ＭＤＣＴの周波数奇積に起因する。

絶対ラップ位相はφ₀＋ｎπ／２によって計算することができ、式中、ｎは、ビン上パターンについては、
であり、ビン間パターンについては
である。実際の整数の選択はビン数の偶奇性（偶数／奇数）に応じて決まる。φ₀は任意の位相オフセット値を示す。したがって、純粋な定常音パターンについて、それらのパターンを、ＭＤＣＴスペクトルのシーケンスのｔ／ｆ格子内のそれらの意図される位置に適合させるために、４つの選択的な回転による後処理が必要とされる。φ₀＋ｎπ／２，
の選択によって、これらの回転はわずかなものになる。

次に、周波数掃引パターンを考察する。

スペクトル分解能がＭＤＣＴの公称分解能の２倍であることに起因して、各掃引パターンの２つのバージョン、すなわち、ビン位置と一致する開始周波数を有するスイープのもの、および、ビン位置間に位置する開始周波数のもの、も記憶する必要がある。さらに、許容可能なスイープは、線形であり、かつ各々下り方向バージョンと上り方向バージョンにおいてタイムブロックあたりＭＤＣＴビンの半分、全部および１．５倍をカバーするように定義されるので、結果として記憶されるべきパターンはさらに１２パターンになる。可能なメモリ要件を最小にするために、掃引パターンは一方向においてのみ記憶し、反対方向はパターンを時間的にミラーリングすることによって導出することができる。式（９）
によれば、半ビン掃引距離を含むパターンは、φ₀＋ｎπ／４だけの後処理回転を必要とする。

以下において、パターンの連結を考察する。この目的のために図２を参照する。図２は、ＭＤＣＴタイムブロックに対する正弦波パターンのパラメータ整合を示す。パターンが時系列において連結される場合、図２の点ｎ₀における実際のパターンの開始位相が（前述の回転を使用して）選択される必要があり、点ｎ１における目標位相（停止位相）が、後続のパターンとシームレスに連続するために記憶される必要がある。

半ビン掃引距離を包含するスイープが、掃引パターンと定常パターンの両方についてφ₀＋ｎπ／４だけの後処理回転によって後処理される。スイープ部分と定常部分は時間シーケンスにおいて任意に連結されることがあるためである。φ₀＋ｎπ／４，
の選択の結果として、パターンの実数部と虚数部の合計／差およびその後の
によるスケーリングによって、回転がやや計算しやすくもなる。または、すべてのパターンは、π／４事前回転バージョンで付加的に記憶することができ、ｎπ／２，ｎ＝１，２，３だけのわずかな後処理回転とともに適用することができる（表５参照）。

図３は、例示的なトーンパターンパッチングプロセスを示す。（ａ〜ｂ）は原型パターン生成を示し、（ｃ）はパターン切り詰めを示し、（ｄ）は目標位置と位相へのパターン適合を示し、（ｅ〜ｆ）はパターンパッチングを示す。

特に、図３のパネル（ａ）〜（ｆ）において、ＭＤＣＴ特性に関して上述したような、パターン測定からパターン適合およびパッチングまでのプロセス全体が描写されている。最初に、式（５）および（６）に従って正弦またはスイープを生成することによって、パターンが構築される。その後、生成された信号は、複素スペクトル（ｂ）を得るためにＯＤＦＴ周波数領域（ａ）に変換される。次に、複素パターンがその意図される長さに切り詰めされて（ｃ）、テーブルに記憶される。

そのパターンが音信号部分を合成するために必要とされるときはいつでも、そのパターンはパターンの連結に関して上述したようにその目標位相に適合され、さらに、整数ビンスペクトルシフトの補償に関連して上述したように、スペクトルシフトによって引き起こされる位相回転を補償される（ｄ）。さらに、ＯＤＦＴに対してＣＭＤＣＴに存在する時間シフトが、上述したように後ひねりを適用することによって実施される。後ひねりを適用することは、パッチされるべきすべてのパターンのスペクトル（ｅ）への寄与を合計した後に、効率的に行うことができる。最後に、実際のパッチングが、適合されたパターンの実数部のみを使用してＭＤＣＴ領域において行われる。ＩＭＤＣＴが所望の時間領域信号をもたらし、そのスペクトルはパネル（ｆ）に描写されている。

図４は一実施形態による正規化スペクトル音パターンを示す図であり、特に、（上パネルから下パネルへ）ビン上の正弦、ビン間の正弦、ビン上のスイープ、ビン間のスイープを示す。より詳細には、図４は、５１２帯域ＭＤＣＴを使用する一般的な低ビットレート変換コーデックの筋書きについての異なる音パターンの選択を、正弦窓を用いて１２．８ｋＨｚのサンプリング周波数と音パターンに対する半ビン分解能で例示的に描写している。上パネルから下パネルへいくつかの正規化スペクトルＯＤＦＴ音パターンがプロットされてする。すなわち、ビン上の正弦、ビン間の正弦、ビン上のスイープ、およびビン間のスイープである。これらのようないくつかのパターンは、テーブルに記憶される必要がある。

すべてのパターンタイプは以下の４つの変形形態において記憶される。
・ビン上およびビン間
・開始位相０および開始位相π／４（パターンの連結に関連して上述したように事前回転されている）

掃引パターンはさらに以下の６つの変形形態を有する。
・半ビンスイープ、全ビンスイープおよび１．５ビンスイープ
・上り掃引方向および下り掃引方向

記憶されるべきパターンの総数は（１定常＋６スイープ）の４倍であり、２８個の複素パターンになる。

可能なメモリ要件を最小にするために、掃引パターンはあるいは一方向においてのみ記憶することができ、反対方向はパターンの時間的なミラーリングに重複するスペクトル処理によって導出することができる。一般に、これは、周波数領域において、パターンの複素共役を（虚数部に−１を乗算することによって）計算し、実際の領域（ＯＤＦＴ、ＣＭＤＣＴなど）に依存する複素位相項（ひねり）を適用することによって得ることができる。

切り詰めスペクトルパターンを合成することによって得ることができる信号品質は、窓タイプと、パターン長の実際の選択に応じて決まる。窓タイプは通常は変換コーデックによってすでに決定されており、パターン長はコーデックの全体的な知覚的品質と利用可能なリソース（メモリ、計算複雑度）に適合させることができる。

図５は、切り詰め音パターンの信号対雑音比（ＳＮＲ）を正弦窓についてのパターン長の関数として示す。特に、図５は、正弦窓についてのパターン長の関数としての平均ＳＮＲを示す。図３に関連して説明した筋書きにおいて、パターンをたとえば１９ビンに切り詰めることによって、約６５ｄＢの平均ＳＮＲがもたらされる。より低いＳＮＲがたとえば超低ビットレートコーデックにおいて許容可能である場合、すでに５ビンのパターン長で十分であり得る。

図６Ａは図２の図解の変形を示す。図６Ａは、実施形態による、重なり合っているブロックについての複数時点における瞬時周波数を示している。

図６Ｂは、図６Ａに示されている図に関し、実施形態によるＤＣＴ基底関数とＤＣＴＩＶ基底関数についての位相進行を示す。

図６Ｃは、一実施形態によるパワースペクトル６７０、置換ＭＤＣＴスペクトル６７５、量子化ＭＤＣＴスペクトル６８０、およびパターンを有するＭＤＣＴスペクトル６８５を示す。

量子化ＭＤＣＴスペクトル６８０は、符号化器側で置換ＭＤＣＴスペクトル６７５を量子化することによって生成されている。置換ＭＤＣＴスペクトル６７５は、符号化器からの上述したオーディオ信号入力スペクトル（図示せず）とパワースペクトル６７０に基づいて生成されている。

量子化ＭＤＣＴスペクトル６８０は、復号器側で符号化オーディオ信号スペクトル（図示せず）を処理することによって、その量子化ＭＤＣＴスペクトル６８０を復号オーディオ信号スペクトルとして得られる。

図６Ｃから分かるように、復号オーディオ信号スペクトル６８０中の疑似係数６９１、６９２、６９３、６９４、６９５および６９６は、それぞれスペクトルパターン６５１、６５２、６５３、６５４、６５５および６５６に置換される。

上述したものと同じ低ビットレートコーデックの筋書きについて、新たに提案した音パターン合成の計算複雑度を、時間領域における単純な発振器バンクの計算複雑度に対して比較した。１３．２ｋｂｐｓのやや低いビットレートにおいて完全な知覚コーデック設定で単音アイテムをコード化している間、最大２０の正弦波トラックがアクティブであると仮定した。コーデックのＣ実施態様において計算作業負荷を測定した。測定に使用したアイテムは各々、豊かな倍音成分を有する少なくとも１つの主要な楽器（たとえば、ピッチパイプ、ヴァイオリン、ハープシコード、サクソフォンポップ、金管アンサンブル）を含んでいた。平均して、音パターンベースの合成の計算複雑度は、時間領域における発振器バンクを使用した単純な実施態様のわずか１０％である。

上述した実施形態は、パラメトリックシヌソイドおよび正弦スイープを生成することによって、低ビットレートＭＤＣＴベースオーディオコーダを強化するための概念を提供する。提供された概念を適用すると、そのような信号は、後処理位相回転によって適合される音パターンを使用する復号器において非常に効率的に生成することができる。これらの音パターンの実際の分析について、コーダのＩＭＤＣＴフィルタバンクをともに使用できる。上述したように、スペクトル分解能の最初の選択によって、知覚的に適切な音生成のための低域遮断周波数、ストレージメモリ需要、および、必要とされる後処理の計算複雑度が決まる。例示的な低ビットレートオーディオコーデックの筋書きにおいて、時間領域発振器バンクの実施態様と比較して９０％の計算複雑度低減が、６５ｄＢのＳＮＲで達成されている。

１つのソリューションはフルサンプルレートで時間領域における発振器バンクを利用するが、そのようなソリューションは、連続するパラメータ間の円滑な補間を可能にする。しかしながら、このソリューションは計算的に重い。

計算複雑度を低くするには、ＭＤＣＴトーンフィリング（ＴＦ：ToneFilling）スペクトルパターンを利用することが有利である。そこでは、スペクトルは、ブロックサンプルレートにおいてＴＦパターンでパッチできる。切り詰めスペクトルパターンは、たとえば、テーブル、たとえばデータベースまたはメモリのテーブル内に記憶することができる。

実施形態において、５０％重なり合っている合成窓による振幅、および適切な勾配を有する掃引パターンの選択による周波数の正弦波トラックの「補間」が提供され、これは計算的に非常に効率的である。

実施形態は、エイリアシングを最小限に抑えるための時間領域パターン設計を提供する。その位相と瞬時周波数（ＩＦ）は、重なり合っているブロックが等しい重みを有する時点において正確に一致する。

図６Ａから分かるように、対称点は以下に位置する。
ｎ₀：1/4×b_length＋０．５、および
ｎ₁：3/4×b_length＋０．５

正弦波トラックにシームレスに適合させるために、一実施形態によれば、パターンは整数ビンパターン（「ビン上位置」）、分数ビンパターン（「ビン間位置」）および線形スイープ、すなわち、半スイープ、全スイープおよび１．５ビンスイープから選択される。

選択されたパターンは、振幅スケーリングを行うことによって、かつ、位相に関して、パターンソース位置、目標位置、時間的な先行係数の位相の関数としての複素回転（ひねり）を行うことによって、ＭＤＣＴｔ／ｆ格子内の意図される位置に適合される。

周波数分解能が制限されていることに起因して、特に以下のような、所定の回転の離散的なセットのみが必要とされる。
実数部、虚数部及び符号を転置することによるＮ×π／２回転
π／４事前回転パターンによって実施されるＮ×π／４回転

ＭＤＣＴ時間シフトを実施するには、ＯＤＦＴ領域におけるパターン／パッチングが必要である。π／２位相粒度、および２つの異なるパターンタイプによって、半ビン分解能が実現される。

＋π／２または−π／２だけの整数ビンパターン進行位相によって、０またはπだけの分数ビンパターン進行位相によってＯＤＦＴ／ＤＣＴ−ＩＶ周波数シフトが実現され、これは、ビン数の偶奇性（偶数／奇数）に応じて決まる。これは図６Ｂによって示されている。

実施形態において、すべてのパターンは、これらの代替形態の組合せをカバーする４つの変形形態において記憶される。
整数ビンまたは分数ビン、
φ＝０またはφ＝π／４（半ビンスイープを取り扱うのに必要とされる事前回転）

実施形態において、掃引パターンは、これらの代替形態の組合せをカバーするさらなる６つの変形形態を有する。
半ビンスイープ、全ビンスイープまたは１．５ビンスイープ、および
上りまたは下り

この結果として、総数は、４×（１定常＋６スイープ）＝２８複素パターンとなる。実際のパッチは、最終的な（回転された）パターンの実数部である。

この提供された概念は、たとえば、ＵＳＡＣに、特に変換コード化信号経路において利用することができる。

以上を要約すると、ＭＤＣＴは、震音アーティファクトの発生に起因して低ビットレートにおける音信号のコード化にとって重大である。しかしながら、従来の心理音響モデルは、これを考慮に入れない。したがって、不快性が最小のモデルが必要とされている。パラメトリックコード化ツールが低ビットレートにおいて有用であり得る。トーンフィリングアーティファクトは、震音よりも不快性が低いものであり得る。

ｔ／ｆ適合ＭＤＣＴパターンをパッチすることによって、トーンフィリング発振器の効率的な実装を達成することができる。トーンフィリングを利用することによって、低ビットレートにおける非常に優れた品質および調性音楽の低遅延コード化が得られる。

以下において、いくつかのさらなる実施形態に関する説明を行う。

図１０は、符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための装置を示す。

この装置は、復号オーディオ信号スペクトルを得るために符号化オーディオ信号スペクトルを処理するための処理ユニット１１０を備えている。復号オーディオ信号スペクトルは複数のスペクトル係数を含み、スペクトル係数の各々は、符号化オーディオ信号スペクトル内のスペクトル位置とスペクトル値を有し、スペクトル係数は、符号化オーディオ信号スペクトル内のそれらのスペクトル位置に従って連続して順序付けされ、それによって、スペクトル係数はスペクトル係数のシーケンスを形成する。

さらに、この装置は、サイド情報（side info）を使用して復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するための疑似係数決定器１２０を備えており、疑似係数の各々はスペクトル位置とスペクトル値を有する。

さらに、この装置は、修正オーディオ信号スペクトルを得るために１つ以上の疑似係数を所定の値に設定するためのスペクトル修正ユニット１３０を備えている。

さらに、この装置は、時間領域変換信号を得るために修正オーディオ信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニット１４０を備えている。

さらに、この装置は、時間領域発振器信号を生成するための制御可能発振器１５０を備えており、制御可能発振器は、１つ以上の疑似係数のうちの少なくとも１つの疑似係数のスペクトル位置およびスペクトル値によって制御される。

さらに、この装置は、オーディオ出力信号を得るために時間領域変換信号と時間領域発振器信号とを混合するためのミキサ１６０を備えている。

一実施形態において、そのミキサは、時間領域において時間領域変換信号を時間領域発振器信号に加えることによって、時間領域変換信号と時間領域発振器信号とを混合するように構成することができる。

処理ユニット１１０は、たとえば、任意の種類のオーディオ復号器、たとえば、ＭＰ３オーディオ復号器、ＷＭＡのためのオーディオ復号器、ＷＡＶＥファイルのためのオーディオ復号器、ＡＡＣオーディオ復号器またはＵＳＡＣオーディオ復号器とすることができる。

処理ユニット１１０は、たとえば、［非特許文献８］（ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4）に記載されているような、または、［非特許文献９］（ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4）に記載されているようなオーディオ復号器とすることもできる。たとえば、処理ユニット４３０は、たとえば、［非特許文献８］に記載されているような量子化値の再スケーリング（「逆量子化（de-quantization）」）ツールおよび／もしくは時間的雑音成形ツールを備えることができ、並びに／または処理ユニット４３０は、たとえば、［非特許文献８］に記載されているような知覚的雑音置換ツールを備えることができる。

一実施形態によれば、スペクトル係数の各々は直近の先行係数および直近の後続係数のうちの少なくとも１つを有することができ、そのスペクトル係数の直近の先行係数はシーケンス内でそのスペクトル係数の直前にあるスペクトル係数のうちの１つとすることができ、そのスペクトル係数の直近の後続係数はシーケンス内でそのスペクトル係数の直後にあるスペクトル係数のうちの１つとすることができる。

疑似係数決定器１２０は、シーケンスの少なくとも１つのスペクトル係数を決定することによって、復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するように構成することができる。そのスペクトル係数は、所定の値と異なるスペクトル値を有し、スペクトル値が所定の値に等しい直近の先行係数を有し、かつスペクトル値が所定の値に等しい直近の後続係数を有する。一実施形態において、所定の値はゼロとすることができ、所定の値はゼロとすることができる。

言い換えれば、疑似係数決定器１２０は、復号オーディオ信号スペクトルの係数のいくつかまたはすべてについて、それぞれ考察されている係数が所定の値と異なるか否か（好ましくは、０とは異なるか否か）、先行する係数のスペクトル値が所定の値に等しいか否か（好ましくは、０に等しいか否か）、および、後続する係数のスペクトル値が所定の値に等しいか否か（好ましくは、０に等しいか否か）を決定する。

いくつかの実施形態においては、そのような決定された係数は（常に）疑似係数である。

一方、他の実施形態においては、そのような決定された係数は疑似係数候補であり（候補に過ぎず）、疑似係数である場合があるし、またはそうでない場合もある。それらの実施形態において、疑似係数決定器１２０は、疑似係数候補であって、所定の値と異なるスペクトル値を有し、スペクトル値が所定の値に等しい直近の先行係数を有し、スペクトル値が所定の値に等しい直近の後続係数を有し得る、少なくとも１つの疑似係数候補を決定するように構成されている。

疑似係数決定器１２０は、その場合、その疑似係数候補が疑似係数であることをサイド情報が示すか否かを決定することによって、疑似係数候補が疑似係数であるか否かを決定するように構成されている。

たとえば、スペクトル値が所定の値に等しい直近の先行係数およびスペクトル値が所定の値に等しい直近の後続係数を含む量子化オーディオ信号スペクトルのスペクトル係数の各々について、（たとえば、ビット値１によって）そのスペクトル係数が極値係数のうちの１つであるか、または、（たとえば、ビット値０によって）そのスペクトル係数が極値係数のうちの１つでないかを示すそのようなサイド情報は、疑似係数決定器１２０によってビットフィールドにおいて受信することができる。

たとえば、ビットフィールド［０００１１１１１１］は、（連続して順序付けられている）（量子化）オーディオ信号スペクトルに現れる最初の３つの「独立型」係数（それらのスペクトル値は所定の値に等しくなく、それらの先行係数およびそれらの後続係数のスペクトル値が所定の値に等しい）が極値係数ではなく、次の６つの「独立型」係数が極値係数であることを示すことができる。このビットフィールドは、図９の量子化ＭＤＣＴスペクトル６３５に見られる状況を説明しており、最初の３つの「独立型」係数５、８、２５は極値係数ではなく、次の６つの「独立型」係数５９、７１、８３、９４、１１６、１４１が極値係数である。

スペクトル修正ユニット１３０は、復号オーディオ信号スペクトルから疑似係数を「削除」するように構成することができる。実際には、スペクトル修正ユニットは、復号オーディオ信号スペクトルの疑似係数のスペクトル値を所定の値（好ましくは０）に設定する。（少なくとも１つの）疑似係数は（少なくとも１つの）制御可能発振器１５０を制御しさえすればよいことになるため、これは理にかなっている。たとえば、図９における量子化ＭＤＣＴスペクトル６３５を考察する。スペクトル６３５が復号オーディオ信号スペクトルと考えられる場合、スペクトル修正ユニット１３０は、修正オーディオ信号スペクトルを得るために極値係数５９、７１、８３、９４、１１６および１４１のスペクトル値を設定することになり、スペクトルの他の係数を修正されないままにすることになる。

スペクトル−時間変換ユニット１４０は、修正オーディオ信号スペクトルをスペクトル領域から時間領域に変換する。たとえば、修正オーディオ信号スペクトルはＭＤＣＴスペクトルであることができ、その場合、スペクトル−時間変換ユニット１４０は逆修正離散コサイン変換（ＩＭＤＣＴ）フィルタバンクとすることができる。他の実施形態において、このスペクトルはＭＤＳＴスペクトルであることができ、その場合、スペクトル−時間変換ユニット１４０は逆修正離散サイン変換（ＩＭＤＳＴ）フィルタバンクとすることができる。または、さらなる実施形態において、このスペクトルはＤＦＴスペクトルであることができ、その場合、スペクトル−時間変換ユニット１４０は逆離散フーリエ変換（ＩＤＦＴ）フィルタバンクとすることができる。

制御可能発振器１５０は、発振器信号の発振器信号周波数が１つ以上の疑似係数のうちの１つの疑似係数のスペクトル位置に応じて決まることができるように、発振器信号周波数を有する時間領域発振器信号を生成するように構成することができる。発振器によって生成される発振器信号は時間領域正弦信号とすることができる。制御可能発振器１５０は、１つ以上の疑似係数のうちの１つの疑似係数のスペクトル値に応じて時間領域正弦信号の振幅を制御するように構成することができる。

一実施形態によれば、疑似係数は各々が符号成分を含む符号付きの値である。符号成分が第１の符号値を有するとき発振器信号周波数が第１の周波数値をもつことができ、符号成分が異なる第２の値を有するとき発信器信号周波数が異なる第２の周波数値をもつことができるように、発信器信号の発振器信号周波数が１つ以上の疑似係数のうちの１つの疑似係数の符号成分に応じて決まることができるように、制御可能発振器１５０は時間領域発振器信号を生成するように構成することができる。

たとえば、図９のＭＤＣＴスペクトル６３５におけるスペクトル位置５９にある疑似係数を考察する。周波数８２００Ｈｚがスペクトル位置５９に割り当てられ、周波数８４００Ｈｚがスペクトル位置６０に割り当てられる場合、制御可能発振器は、疑似係数のスペクトル値の符号が正であれば、たとえば、発信器周波数を８２００Ｈｚに設定し、疑似係数のスペクトル値の符号が負であれば、例えば、発信器周波数を８３００Ｈｚに設定するように構成することができる。

このように、疑似係数のスペクトル値の符号は、制御可能発振器が、発振器周波数を、疑似係数（例えば、スペクトル位置５９）から導出されるスペクトル位置に割り当てられた周波数（例えば、８２００Ｈｚ）に設定するか、または、疑似係数（例えば、スペクトル位置５９）から導出されるスペクトル位置に割り当てられた周波数（例えば、８２００Ｈｚ）とその疑似係数から導出されるスペクトル位置の直後にあるスペクトル位置（例えば、スペクトル位置６０）に割り当てられた周波数（例えば、８４００Ｈｚ）との間の周波数（例えば、８３００Ｈｚ）に設定するかを制御するために使用することができる。

図１１は、一実施形態を示し、この装置は、１つ以上の疑似係数のさらなる疑似係数のスペクトル値によって制御されるさらなる時間領域発信器信号を生成するためのさらなる制御可能発振器２５２、２５４、２５６を備えている。

さらなる制御可能発振器２５２、２５４、２５６は各々、さらなる時間領域発振器信号のうちの１つを生成する。制御可能発振器２５２、２５４、２５６の各々は、複数の疑似係数のうちの１つの疑似係数から導出されるスペクトル位置に基づいて発振器信号の周波数を操作するように構成されている。かつ／または、制御可能発振器２５２、２５４、２５６の各々は、疑似係数のうちの１つの疑似係数のスペクトル値に基づいて発振器信号の振幅を操作するように構成されている。

さらなる制御可能発振器２５２、２５４、２５６は各々、さらなる時間領域発振器信号のうちの１つを生成する。制御可能発振器２５２、２５４、２５６の各々は、疑似係数のうちの１つの疑似係数のスペクトル位置に基づいて発振器信号の周波数を操作するように構成されている。かつ／または、制御可能発振器２５２、２５４、２５６の各々は、疑似係数のうちの１つの疑似係数のスペクトル値に基づいて発振器信号の振幅を操作するように構成されている。

図１０および図１１のミキサ１６０は、オーディオ出力信号を得るために、スペクトル−時間変換ユニット１４０によって生成される時間領域変換信号と、１つ以上の制御可能発振器１５０、２５２、２５４、２５６によって生成される１つ以上の時間領域発振器信号とを混合するように構成されている。ミキサ１６０は、時間領域変換信号および１つ以上の時間領域発振器信号の重ね合わせによって、オーディオ出力信号を生成することができる。

図１２は、元のシヌソイド（左）と、ＭＤＣＴ／ＩＭＤＣＴチェーンによって処理された後のシヌソイド（右）とを比較した２つの図を示す。ＭＤＣＴ／ＩＭＤＣＴチェーンによって処理された後、正弦波は震音アーティファクトを含む。上記で提供された概念は、シヌソイドがＭＤＣＴ／ＩＭＤＣＴチェーンによって処理されることを回避し、代わりに、正弦波情報が疑似係数によって符号化され、かつ／または、シヌソイドが制御可能発振器によって再生される。

いくつかの態様が装置に関して説明されているが、明らかに、これらの態様はまた、対応する方法の説明をも表す。その場合、ブロックまたは装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップに関して説明されている態様も、対応するブロックもしくは部材または対応する装置の特徴の説明を表す。

本発明の分解された信号は、デジタル記憶媒体に記憶することができ、または、伝送媒体、例えば無線伝送媒体、もしくはインターネットなどの有線伝送媒体で送信することができる。

特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実施することができる。その実施態様は、電子的に読み出し可能な制御信号を記憶し、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する（または協働することができる）デジタル記憶媒体、たとえば、フロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフラッシュメモリを使用して実行することがでる。

本発明によるいくつかの実施形態は、本明細書において説明されている方法のうちの１つが実行されるように、プログラム可能なコンピュータシステムと協働することのできる電子的に読み込み可能な制御信号を有する持続性データキャリアを含む。

概して、本発明の実施形態はプログラムコードを有するコンピュータプログラム製品として実施することができる。そのプログラムコードは、このコンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の１つを実行するために動作可能なものである。そのプログラムコードは、たとえば、機械読取り可能な担体に記憶することができる。

他の実施形態は、機械読取り可能な担体に記憶されている、本明細書において説明されている方法の１つを実行するためのコンピュータプログラムを含む。

言い換えれば、本発明の方法の一実施形態は、それゆえ、コンピュータプログラムがコンピュータで作動するとき、本明細書において説明されている方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

本発明の方法のさらなる実施形態は、本明細書において説明されている方法の１つを実行するためのコンピュータプログラムを記録しているデータ担体（またはデジタル記憶媒体もしくはコンピュータ読取り可能な媒体）である。

それゆえ、本発明の方法のさらなる実施形態は、本明細書において説明されている方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。そのデータストリームまたは信号のシーケンスは、データ通信接続、たとえば、インターネットを介して転送されるように構成することができる。

さらなる実施形態は、本明細書において説明されている方法の１つを実行するように構成または適合されている処理手段、たとえば、コンピュータまたはプログラム可能な論理デバイスを含む。

さらなる実施形態は、本明細書において説明されている方法の１つを実行するためのコンピュータプログラムをインストールしているコンピュータを含む。

いくつかの実施形態において、プログラム可能な論理デバイス（たとえば、フィールドプログラマブルゲートアレイ）を、本明細書において説明されている方法の機能のいくつかまたはすべてを実行するために使用することができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイが、本明細書において説明されている方法の１つを実行するために、マイクロプロセッサと協働することができる。概して、それらの方法は好ましくは、任意のハードウェア装置によって実行される。

上述した実施形態は、本発明の原理の例示に過ぎない。本発明装置または本明細書において説明されている詳細を変更し修正することが当業者である他の者には一目瞭然であることがわかる。それゆえ、意図するところは、添付の特許請求項の範囲のみによって制限され、本明細書における実施形態の記載および説明によって提示されている具体的な詳細によっては制限されないということである。

Claims

符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための装置であって、
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために前記符号化オーディオ信号スペクトルを処理するための処理ユニット（１１５）であって、前記スペクトル係数の各々は前記符号化オーディオ信号スペクト内でのスペクトル位置およびスペクトル値を有し、前記スペクトル係数は前記スペクトル係数がスペクトル係数のシーケンスを形成するように前記符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理ユニット（１１５）と、
前記復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するための疑似係数決定器（１２５）であって、前記疑似係数の各々は前記スペクトル係数のうちの１つである、疑似係数決定器（１２５）と、
修正オーディオ信号スペクトルを得るために少なくとも１つまたは複数個の疑似係数を、決定されたスペクトルパターンで置換するための置換ユニット（１３５）であって、前記決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、前記少なくとも２つのパターン係数の各々はスペクトル値を有する置換ユニット（１３５）と、
前記オーディオ出力信号を得るために前記修正オーディオ信号スペクトルを時間領域に変換するためのスペクトル−時間変換ユニット（１４５）と、
を備えた装置。
該装置は、複数の記憶されているスペクトルパターンを記憶しているデータベースまたはメモリを含むストレージユニット（１５５）をさらに備え、前記複数の記憶されているスペクトルパターンの各々はスペクトル特性をもち、
前記置換ユニット（１３５）は、前記ストレージユニット（１５５）に、要求されたスペクトルパターンとして、前記記憶されているスペクトルパターンのうちの１つを要求するように構成され、
前記ストレージユニット（１５５）は、前記要求されたスペクトルパターンを提供するように構成され、
前記置換ユニット（１３５）は、前記要求されたスペクトルパターンに基づいて前記少なくとも１つまたは複数の疑似係数を前記決定されたスペクトルパターンで置換するように構成されている請求項１に記載の装置。
前記置換ユニット（１３５）は、前記疑似係数決定器（１２５）によって決定された前記１つ以上の疑似係数のうちの少なくとも１つから導出される第１の導出スペクトル位置に応じて、前記ストレージユニット（１５５）に、前記記憶されているスペクトルパターンのうちの前記１つを要求するように構成されている請求項２に記載の装置。
前記１つ以上の疑似係数は各々が符号成分を含む符号付きの値であり、
前記置換ユニット（１３５）は、前記１つ以上の疑似係数のうちの１つの疑似係数のスペクトル位置とその疑似係数の符号成分に基づいて、その符号成分が第１の符号値を有するときは前記第１の導出スペクトル位置がその疑似係数のスペクトル位置に等しくなるように、その符号成分が異なる第２の値を有するときは前記第１の導出スペクトル位置がその疑似係数のスペクトル位置を所定の値だけシフトすることによってもたらされる修正位置に等しくなるように、前記第１の導出スペクトル位置を決定するように構成されている請求項３に記載の装置。
前記ストレージユニット（１５５）の前記データベースまたは前記メモリ内に記憶されている前記複数の記憶されているスペクトルパターンは定常音パターンまたは周波数掃引パターンのいずれかであり、
前記疑似係数決定器（１２５）は前記復号オーディオ信号スペクトルの２つ以上の時間的に連続する疑似係数を決定するように構成され、
前記置換ユニット（１３５）は、前記２つ以上の時間的に連続する疑似係数のうちの第１の疑似係数と第２の疑似係数を、前記第１の疑似係数から導出される前記第１の導出スペクトル位置と前記第２の疑似係数から導出される第２の導出スペクトル位置との間の絶対差が閾値よりも小さいか否かに応じてトラックに割り当てるように構成され、
前記置換ユニット（１３５）は、前記トラックの前記第１の疑似係数から導出される前記第１の導出スペクトル位置が前記トラックの前記第２の疑似係数から導出される前記第２の導出スペクトル位置に等しいときは前記ストレージユニット（１５５）に前記定常音パターンの１つを要求するように構成され、前記トラックの前記第１の疑似係数から導出される前記第１の導出スペクトル位置が前記トラックの前記第２の疑似係数から導出される前記第２の導出スペクトル位置とは異なるときは前記ストレージユニット（１５５）に前記周波数掃引パターンの１つを要求するように構成されている請求項３又は４に記載の装置。
前記置換ユニット（１３５）は、前記トラックの前記第２の疑似係数から導出される前記第２の導出スペクトル位置と前記トラックの前記第１の疑似係数から導出される前記第１の導出スペクトル位置との間の周波数差が所定の値の半分に等しいとき、前記ストレージユニット（１５５）に前記周波数掃引パターンのうちの第１の周波数掃引パターンを要求するように構成され、
前記置換ユニット（１３５）は、前記トラックの前記第２の疑似係数から導出される前記第２の導出スペクトル位置と前記トラックの前記第１の疑似係数から導出される前記第１の導出スペクトル位置との間の前記周波数差が前記所定の値に等しいとき、前記ストレージユニット（１５５）に前記周波数掃引パターンのうちの前記第１の周波数掃引パターンとは異なる第２の周波数掃引パターンを要求するように構成され、
前記置換ユニット（１３５）は、前記トラックの前記第２の疑似係数から導出される前記第２の導出スペクトル位置と前記トラックの前記第１の疑似係数から導出される前記第１の導出スペクトル位置との間の前記周波数差が前記所定の値の１．５倍に等しいとき、前記ストレージユニット（１５５）に、前記周波数掃引パターンのうちの、前記第１の周波数掃引パターンとも前記第２の周波数掃引パターンとも異なる第３の周波数掃引パターンを要求するように構成されている請求項５に記載の装置。
前記置換ユニット（１３５）は、前記決定されたスペクトルパターンを得るために、前記ストレージユニット（１５５）から提供される、前記要求されたスペクトルパターンを修正するように構成されているパターン適合ユニット（１３８）を備えている請求項２から６のいずれか一項に記載の装置。
前記パターン適合ユニット（１３８）は、前記要求されたスペクトルパターンの前記パターン係数の前記スペクトル値を前記１つ以上の疑似係数のうちの１つの疑似係数の前記スペクトル値に応じて再スケーリングすることによって、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項７に記載の装置。
前記パターン適合ユニット（１３８）は、開始位相に応じて、前記開始位相が第１の開始位相値を有するときは前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値が第１の様式で修正されるように、前記開始位相が異なる第２の開始位相値を有するときは前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値が第２の様式で修正されるように、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項７または８に記載の装置。
前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値は実数部と虚数部とを含む複素係数であり、
前記パターン適合ユニット（１３８）は、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンの前記パターン係数の各々の前記実数部および前記虚数部を複素回転係数ｅ^j・φ（φは角度値）を適用することによって修正することによって、前記要求されたスペクトルパターンを修正するように構成されている請求項７から９のいずれか一項に記載の装置。
前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値は実数部と虚数部とを含む複素係数であり、
前記パターン適合ユニット（１３８）は、前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値の前記実数部および前記虚数部をネゲートすることによって、または、前記要求されたスペクトルパターンの前記パターン係数の各々の前記スペクトル値の前記実数部もしくはネゲートされた実数部および前記虚数部もしくはネゲートされた虚数部をスワップすることによって、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項７から９のいずれか一項に記載の装置。
前記パターン適合ユニット（１３８）は、前記パターンの複素共役を計算し複素位相項を適用することによって前記パターンの時間的ミラーリングを実現することによって、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンを修正するように構成されている請求項７から１１のいずれか一項に記載の装置。
前記復号オーディオ信号スペクトルはＭＤＣＴ領域において表され、
前記パターン適合ユニット（１３８）は、修正スペクトルパターンを得るために、前記要求されたスペクトルパターンの前記パターン係数の前記スペクトル値を修正することによって、前記ストレージユニット（１５５）によって提供される前記要求されたスペクトルパターンを修正するように構成され、前記スペクトル値は奇積層離散フーリエ変換領域において表され、
前記パターン適合ユニット（１３５）は、前記決定されたスペクトルパターンを得るために、前記修正スペクトルパターンの前記パターン係数の前記スペクトル値を、前記奇積層離散フーリエ変換領域から前記ＭＤＣＴ領域へと変換するように構成され、
前記置換ユニット（１３５）は、前記ＭＤＣＴ領域において表される前記修正オーディオ信号スペクトルを得るために、前記少なくとも１つまたは複数の疑似係数を、前記ＭＤＣＴ領域において表される前記決定されたスペクトルパターンで置換するように構成されている請求項７から１２のいずれか一項に記載の装置。
複数のスペクトルパターンを生成するための装置であって、
第１の領域において複数の信号を生成するための信号生成器（１６５）と、
複数のスペクトルパターンを得るために、前記複数の信号の各信号を前記第１の領域から第２の領域へと変換するための信号変換ユニット（１７５）であって、前記複数の変換されたスペクトルパターンの各パターンは複数の係数を含む信号変換ユニット（１７５）と、
複数の処理されたパターンを得るために、前記変換されたスペクトルパターンの前記係数のうちの１つ以上を除去することによって、前記変換されたスペクトルパターンを切り詰めるための後処理ユニット（１８５）と、
データベースまたはメモリを含み、前記複数の処理されたパターンの各処理されたパターンを前記データベースまたは前記メモリに記憶するように構成されているストレージユニット（１９５）と、を備え、
前記信号生成器（１６５）は以下の式に基づいて前記複数の信号の各信号を生成するように構成され、
x(t) = cos (2πφ(t))
および
式中、ｔおよびτは時間を示し、
φ（ｔ）はｔにおける瞬時位相であり、
ｆ（τ）はτにおける瞬時周波数であり、
前記複数の信号の各信号は、第１の時点におけるその信号の瞬時周波数である開始周波数（ｆ₀）、および、異なる第２の時点におけるその信号の瞬時周波数である目標周波数（ｆ₁）を有し、
前記信号生成器（１６５）は、前記複数の信号のうちの第１の信号を、前記第１の信号の前記目標周波数が前記開始周波数と等しくなるように生成するように構成され、
前記信号生成器（１６５）は、前記複数の信号のうちの異なる第２の信号を、前記第１の信号の前記目標周波数が前記開始周波数とは異なるように生成するように構成されている装置。
前記信号変換ユニット（１７５）は、前記複数の信号の各信号を、時間領域である前記第１の領域からスペクトル領域である第２の領域へと変換するように構成され、
前記信号変換ユニット（１７５）は、その信号を変換するための複数のタイムブロックのうちの第１のタイムブロックを生成するように構成され、
前記複数のタイムブロックの各タイムブロックは複数の重み付きサンプルを含み、前記重み付きサンプルの各々は複数の重みのうちの１つの重みによって重み付けされているその信号の信号サンプルであり、前記複数の重みはそのタイムブロックに割り当てられ、前記複数の重みの各重みは時点に割り当てられ、
前記複数の信号の各信号の前記開始周波数（ｆ₀）は前記第１の時点におけるその信号の瞬時周波数であり、前記タイムブロックのうちの前記第１のタイムブロックの前記重みのうちの第１の重みが前記第１の時点に割り当てられ、前記タイムブロックのうちの異なる第２のタイムブロックの前記重みのうちの第２の重みが前記第１の時点に割り当てられ、前記タイムブロックのうちの前記第１のタイムブロックと前記タイムブロックのうちの前記第２のタイムブロックは重なり、前記重みのうちの前記第１の重みは前記重みのうちの前記第２の重みに等しく、
前記複数の信号の各信号の前記目標周波数（ｆ₁）は前記第２の時点におけるその信号の瞬時周波数であり、前記タイムブロックのうちの前記第１のタイムブロックの前記重みのうちの第３の重みが前記第２の時点に割り当てられ、前記タイムブロックのうちの異なる第３のタイムブロックの前記重みのうちの第４の重みが前記第２の時点に割り当てられ、前記タイムブロックのうちの前記第１のタイムブロックと前記タイムブロックのうちの前記第３のタイムブロックは重なり、前記重みのうちの前記第３の重みは前記重みのうちの前記第４の重みに等しい請求項１４に記載の装置。
前記複数の信号の各信号は第１の時点におけるその信号の位相である開始位相（φ₀）を有し、
前記信号生成器（１６５）は、前記複数の信号のうちの第１の信号の前記開始位相（φ₀）が前記複数の信号のうちの異なる第２の信号の前記開始位相（φ₀）に等しくなるように、前記複数の信号を生成するように構成されている請求項１４または１５に記載の装置。
前記後処理ユニット（１８５）は、複数の任意に回転されたスペクトルパターンを得るために、前記変換されたスペクトルパターンの各々の前記スペクトル係数に任意の位相角の回転を行うようにさらに構成されている請求項１４から１６のいずれか一項に記載の装置。
前記後処理ユニット（１８５）は、複数の回転されたスペクトルパターンを得るために、前記変換されたスペクトルパターンの各々の前記スペクトル係数にπ／４の回転を行うようにさらに構成されている請求項１４から１６のいずれか一項に記載の装置。
前記信号生成器（１６５）は、前記複数の信号として、前記第１の信号、前記第２の信号および１つ以上のさらなる信号を、前記さらなる信号の各々の前記目標周波数と前記開始周波数との各差が前記第２の信号の前記目標周波数と前記開始周波数との差の整数倍になるように、生成するように構成されている請求項１４から１８のいずれか一項に記載の装置。
符号化オーディオ信号スペクトルに基づいてオーディオ出力信号を生成するための方法であって、
複数のスペクトル係数を含む復号オーディオ信号スペクトルを得るために前記符号化オーディオ信号スペクトルを処理するステップであって、前記スペクトル係数の各々は前記符号化オーディオ信号スペクト内でのスペクトル位置およびスペクトル値を有し、前記スペクトル係数がスペクトル係数のシーケンスを形成するように、前記スペクトル係数は前記符号化オーディオ信号スペクトル内でのそれらのスペクトル位置に従って連続して順序付けられている、処理するステップと、
前記復号オーディオ信号スペクトルの１つ以上の疑似係数を決定するステップであって、前記疑似係数の各々は前記スペクトル係数のうちの１つである、決定するステップと、
修正オーディオ信号スペクトルを得るために少なくとも１つまたは複数の疑似係数を決定されたスペクトルパターンで置換するステップであって、前記決定されたスペクトルパターンは少なくとも２つのパターン係数を含み、前記少なくとも２つのパターン係数はスペクトル値を有する、置換するステップと、
前記オーディオ出力信号を得るために前記修正オーディオ信号スペクトルを時間領域に変換するステップと、
を含む方法。
複数のスペクトルパターンを生成するための方法であって、
第１の領域において複数の信号を生成するステップと、
複数のスペクトルパターンを得るために、前記複数の信号の各信号を前記第１の領域から第２の領域へと変換するステップであって、前記複数の変換されたスペクトルパターンの各パターンは複数の係数を含む、変換するステップと、
複数の処理されたパターンを得るために、前記変換されたスペクトルパターンの前記係数のうちの１つ以上を除去することによって、前記変換されたスペクトルパターンを切り詰めるステップと、
前記複数の処理されたパターンの各処理されたパターンをデータベースまたはメモリに記憶するステップと、を含み、
前記複数の信号の各信号を生成することは、以下の式に基づいて行われ、
x(t) = cos (2πφ(t))
および
式中、ｔおよびτは時間を示し、
φ（ｔ）はｔにおける瞬時位相であり、
ｆ（τ）はτにおける瞬時周波数であり、
前記複数の信号の各信号は、第１の時点におけるその信号の瞬時周波数である開始周波数（ｆ₀）、および、異なる第２の時点におけるその信号の瞬時周波数である目標周波数（ｆ₁）を有し、
前記複数の信号を生成するステップは、前記複数の信号のうちの第１の信号を、前記第１の信号の前記目標周波数（ｆ₁）が前記開始周波数（ｆ₀）と等しくなるように生成することによって行われ、かつ、
前記複数の信号を生成するステップは、前記複数の信号のうちの異なる第２の信号を、前記第１の信号の前記目標周波数（ｆ₁）が前記開始周波数（ｆ₀）とは異なるように生成することによって行われる方法。
コンピュータまたは信号プロセッサ上で実行されるとき、請求項２０または２１に記載の方法を実施するためのコンピュータプログラム。