JP6262668B2

JP6262668B2 - 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法

Info

Publication number: JP6262668B2
Application number: JP2014558299A
Authority: JP
Inventors: 石川　智一; 智一石川; チョンコックセン; リウゾンシアン
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2013-01-22
Filing date: 2013-12-18
Publication date: 2018-01-17
Anticipated expiration: 2033-12-18
Also published as: JPWO2014115225A1; US9424847B2; CN104584124A; EP2950308A1; EP2950308A4; CN104584124B; WO2014115225A1; EP2950308B1; US20150162010A1

Description

本発明は、音信号の符号化装置および復号装置等に関し、特に、音信号の符号化および復号における帯域幅拡張技術に関する。

一般的に、音信号（スピーチ信号およびオーディオ信号）の符号化には、コア符号化ツールとパラメトリック符号化ツールの２種類のツールが用いられる。

パラメトリック符号化ツールの１つである帯域幅拡張ツール（ＢＷＥツール）として、ＭＰＥＧＵＳＡＣ（非特許文献２）などの技術では、コピーアップ方法と、ハーモニック方法とが知られている。

Ｃａｒｏｔ，Ａｌｅｘａｎｄｅｒ，ｅｔａｌ "ＮｅｔｗｏｒｋｅｄＭｕｓｉｃＰｅｒｆｏｒｍａｎｃｅ：ＳｔａｔｅｏｆｔｈｅＡｒｔ"，ＡＥＳ３０ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅ，２００７Ｍａｒｃｈ１５−１７Ｎｅｕｅｎｄｏｒｆ，ｅｔａｌ， "ＭＰＥＧＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｉｎｇ - ＴｈｅＩＳＯ／ＭＰＥＧＳｔａｎｄａｒｄｆｏｒＨｉｇｈ−ＥｆｆｉｃｉｅｎｃｙＡｕｄｉｏＣｏｄｉｎｇｏｆａｌｌＣｏｎｔｅｎｔＴｙｐｅｓ"，ＡＥＳ１３２ｎｄＣｏｎｖｅｎｔｉｏｎ，２０１２Ａｐｒｉｌ２６−２９．Ｓｉｎｈａ，ｅｔａｌ， "ＡＮｏｖｅｌＩｎｔｅｇｒａｔｅｄＡｕｄｉｏＢａｎｄｗｉｄｔｈＥｘｔｅｎｓｉｏｎＴｏｏｌｋｉｔ（ＡＢＥＴ）"，ＡＥＳ１２０ｔｈＣｏｎｖｅｎｔｉｏｎ，２００６，Ｍａｙ２０−２３．ＳｈｕｉｘｉａｎＣｈｅｎ，ｅｔａｌ， "ＥｓｔｉｍａｔｉｎｇＳｐａｔｉａｌＣｕｅｓｆｏｒＡｕｄｉｏＣｏｄｉｎｇｉｎＭＤＣＴＤｏｍａｉｎ"，ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭｕｌｔｉｍｅｄｉａａｎｄＥｘｐｏ，２００９，Ｊｕｎｅ２８−Ｊｕｌｙ３Ｄａｕｄｅｔ，Ｓａｎｄｌｅｒ， "ＭＤＣＴＡｎａｌｙｓｉｓｏｆＳｉｎｕｓｏｉｄｓ：ＥｘａｃｔＲｅｓｕｌｔｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｔｏＣｏｄｉｎｇＡｒｔｉｆａｃｔｓＲｅｄｕｃｔｉｏｎ"，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．１２，Ｎｏ．３，Ｍａｙ２００４．

コピーアップ方法は、低周波数部分のスペクトルをコピーして高周波数部分のスペクトルを生成するシンプルな方法である。コピーアップ方法においては、２つのスペクトル間のハーモニック関係を正確に保てない点が課題である。つまり、音質が課題である。

一方、ハーモニック方法は、低周波数部分のスペクトルをハーモニックに伸長し、切り出すことで、高周波数部分のスペクトルを生成する方法である。ハーモニック方法においては、処理が複雑であるため、遅延時間が大きい点や大きなメモリを必要とする点が課題となる。

そこで、本発明は、新たな帯域幅拡張方法を用いた帯域幅拡張パラメータ生成装置等を提供する。

本発明の一態様に係る帯域幅拡張パラメータ生成装置は、入力音信号の高域部分を示す高域信号を抽出する抽出部と、前記高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとを算出する算出部とを備える。

なお、これらの包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

本発明の帯域幅拡張パラメータ生成装置等によれば、遅延時間および使用メモリを抑制し、かつ高音質な帯域幅拡張が可能となる。

図１は、コピーアップ方法（図１の（ａ））と、ハーモニック方法（図１の（ｂ））とを説明するための模式図である。図２は、ＵＳＡＣのデコーダにおける２つのＢＷＥモードを示すブロック図である。図３は、実施の形態１に係る符号化装置の機能構成を示すブロック図である。図４は、実施の形態１に係る符号化装置の動作のフローチャートである。図５は、タイムスロットとパラメータスロットとの関係、および、サブバンドとパラメータ帯域との関係を示す図である。図６は、実施の形態２に係る復号装置の機能構成を示すブロック図である。図７は、実施の形態２に係る復号装置の動作のフローチャートである。図８は、実施の形態３に係る符号化装置の機能構成を示すブロック図である。図９は、実施の形態３に係る符号化装置の動作のフローチャートである。図１０は、フレーマーのフレーミング動作および窓処理動作を示す図である。図１１は、ＭＤＣＴ領域、ＭＤＳＴ領域、および、複素領域のそれぞれにおける純粋なトーンのエネルギーを示す図である。図１２は、実施の形態４に係る復号装置の機能構成を示すブロック図である。図１３は、実施の形態４に係る復号装置の動作のフローチャートである。

（本発明の基礎となった知見）
一般的に、音信号（スピーチ信号およびオーディオ信号）の符号化には、パラメトリック符号化ツールとコア符号化ツールとの少なくとも２種類のツールが用いられる。まず、パラメトリック符号化ツールについて説明する。

パラメトリック符号化ツールは、入力音信号（以下、入力信号、原信号または符号化対象の信号と記載する場合がある）の知覚的特徴を維持して再構成することを目的とする符号化を行う。この符号化によって、入力信号の知覚的特徴は、低ビットレートで符号化された少数のパラメータにより示される。

パラメトリック符号化ツールにより符号化された信号を復号した信号である再構成信号は、知覚的には入力信号の品質を維持しているが、再構成信号の波形と入力信号の波形とは類似しない。パラメトリック符号化ツールとしては、帯域幅拡張ツールとマルチチャンネル拡張ツールが挙げられる。

帯域幅拡張ツールは、信号の高周波数部分の低周波数部分とのハーモニック関係を利用することにより、信号の高周波数部分をパラメトリックに符号化する。帯域幅拡張ツールの符号化により生成されたパラメータ（帯域幅拡張パラメータ）の例としては、サブバンドエネルギーとトーン・ノイズ比とが挙げられる。

帯域幅拡張パラメータは、スペクトル的に拡張された高周波数部分の信号の振幅の形成に用いられる。高周波数部分の信号は、デコーダにおいてパッチングまたは伸長により低周波数部分が拡張されることで形成される。なお、デコーダでは、フロア・ノイズおよび音質等が適宜補われる。結果として得られる出力信号の波形は、入力信号の波形とは類似しないが、出力信号は、知覚的には入力信号に似ている。

ＨＥ−ＡＡＣは、このような帯域幅拡張ツールおよびスペクトル帯域複製（ＳＢＲ）を含むコーデックである。ＳＢＲでは、直交ミラーフィルタバンク（ＱＭＦ）を用いて生成された時間・周波数ハイブリッド領域でパラメータ算出が行われる。ＩＴＵ−ＴＧ．７１８も帯域幅拡張ツールを有するコーデックであるが、ＩＴＵ−ＴＧ．７１８では、パラメータ算出は、修正離散コサイン変換（ＭＤＣＴ）領域で行われる。

マルチチャンネル拡張ツールは、マルチチャンネル信号を符号化用のチャンネルサブセットにダウンミックスする。この結果、個々のチャンネル間の関係がパラメトリックに符号化される。マルチチャンネル拡張ツールの符号化により生成されたパラメータの例としては、チャンネル間レベル差、チャンネル間時間差、および、チャンネル間相関が挙げられる。デコーダでは、復号済みのダウンミックスチャンネルと、人工生成した「非相関」信号とをミキシングすることにより、個々のチャンネルを合成する。ミキシングの重みは、前述のパラメータに基づいて算出される。ＭＰＥＧサラウンド（ＭＰＳ）は、マルチチャンネル拡張ツールの適例である。

次に、コア符号化ツールについて説明する。コア符号化ツールは、パラメトリック符号化ツールとは対照的に、入力信号の波形の特徴を維持して再構成することを目的とする符号化を行う。コア符号化ツールは、通常、人間の耳が最も敏感に反応するスペクトラムの低周波数部分に適用される。コア符号化ツールは、大きくは、オーディオコーデックとスピーチコーデックの２つに分類される。

オーディオコーデックは、局所化されたスペクトル成分を含む定常信号（例えば、トーン信号や高調波信号）を符号化するのに適している。オーディオコーデックでは、符号化は主に周波数領域で行われる。

オーディオコーデックのエンコーダは、時間・周波数変換およびＭＤＣＴを用いて信号を周波数（スペクトル）領域に変換する。ＭＤＣＴに際しては、部分的に重なり合うフレームが窓処理される。

フレームの部分的な重なりは、デコーダにおいて隣接するフレーム間の平滑化メカニズムを実施するために設けられている。窓処理には、平滑化のため高分解スペクトルを生成するとともにフレームの境界をぼかすという２つの目的がある。

フレームの部分的重なりにより生じる重要でないサンプリング効果を補うため、ＭＤＣＴに際し、時間領域サンプルは、より少数の符号化用のスペクトル係数に変換される。この変換によりエイリアシング成分が生じ、エイリアシング成分はデコーダにおいて重ね合わされることで相殺される。

オーディオコーデックでは、音響心理学的モデルを容易に適用することができる点が利点である。具体的には、オーディオコーデックでは、より多くのビットをマスクする音（マスカー）に、より少ないビットをマスクされる音（マスキー）に割り当てることができる。マスキーは、他の音によってマスクされ、人間の耳では感知できない音である。

このように、音響心理学的モデルを適用することにより、オーディオコーデックでは、符号化効率と音質とを大幅に向上することができる。ＭＰＥＧアドバンスドオーディオ符号化（ＡＡＣ）は、純粋なオーディオコーデックの適例である。

スピーチコーデックは、声道のピッチ特性を利用するモデルに基づくコーデックであるため、人間の音声（スピーチ信号）の符号化に適している。

スピーチコーデックのエンコーダにおいては、スピーチ信号のスペクトル包絡線を取得するために線形予測（ＬＰ）フィルタが用いられ、スピーチ信号は、ＬＰフィルタ係数に符号化される。次に、ＬＰフィルタにより、スピーチ信号は逆フィルタリングされて（スペクトル的に分離されて）、スペクトル的にフラットな励起信号が生成される。生成された励起信号は、通常、「コードワード」で励起信号を示すベクトル量子化（ＶＱ）スキームで離散的に符号化される。

スピーチコーデックでは、線形予測の他に、長期間の音声を取得するため長期予測（ＬＴＰ）も組み入れることができる。また、スピーチコーデックでは、線形予測の前に音声信号に白色化フィルタを適用することにより、音響心理学的な側面を考慮することができる。

スピーチコーデックでは、励起信号の離散的な符号化により、低ビットレートで良い音質が得られる。しかしながら、スピーチコーデックでは、音楽のようなコンテンツの複素スペクトルの取得はできないため、このようなコンテンツの符号化には適していない。ＩＴＵ−Ｔの適応マルチレート広帯域（ＡＭＲ−ＷＢ）は、純粋なスピーチコーデックの適例である。

３つめのコーデックとして、変換符号化励振（ＴＣＸ）と呼ばれるコーデックが知られている。ＴＣＸは、ＬＰ符号化と変換符号化とを組み合わせたようなコーデックである。

ＴＣＸでは、まず、信号の線形予測フィルタから導出した知覚フィルタで知覚的に信号が重み付けされる。次に、重み付けされた信号は、スペクトル領域（スペクトル係数）に変換され、ＶＱスキームでスペクトル係数が符号化される。

ＴＣＸは、ＩＴＵ−Ｔの適応マルチレート広帯域＋（ＡＭＲ−ＷＢ＋）コーデックで見られる。なお、ＡＭＲ−ＷＢ＋で用いられる周波数変換は、離散フーリエ変換（ＤＦＴ）である。

ところで、近年、高精細化（ＨＤ）技術の発展にともない、通信装置は、通信用途のみならず、マルチメディアやエンターテイメントなど多目的に使用されている。また、これに応じて、スピーチおよびオーディオの両方に対応できる統合コーデックに対する需要が高まっている。

例えば、ＭＰＥＧでは、統合音声音響符号化（ＵＳＡＣ）が標準化されている（非特許文献２）。ＵＳＡＣは、上記の全てのツール（ＡＡＣ、ＬＰ、ＴＣＸ、ＳＢＲ、および、ＭＰＳ）のうち最適なツールを組み合わせることが可能な、低ビットレートのコーデックである。また、ＵＳＡＣは、スピーチおよびオーディオの符号化に広範囲のビットレートで対応することができる。

ＵＳＡＣのエンコーダは、ＭＰＳツールを作動させてステレオ信号をモノラル信号にダウンミックスする。また、ＵＳＡＣのエンコーダは、ＳＢＲツールを作動させて全帯域のモノラル信号を狭帯域のモノラル信号に圧縮する。そして、ＵＳＡＣのエンコーダは、狭帯域のモノラル信号を符号化するため、信号選別器を用いて入力信号の特徴を分析し、どのコアコーデック（ＡＡＣ、ＬＰ、ＴＣＸ）を作動させるべきかを決定する。

ここで、最近では、ソーシャル・ネットワーク文化の台頭により、テレビ会議や音響映像を用いた双方向のエンターテイメントなどの社会活動に参加する、インターネットに精通した人々が増加している。今後、普及が予想される活動の１つとしては、例えば、異なる場所にいるユーザがインターネットを介して集まり、楽器を演奏したり合唱したりアカペラで歌ったりするネットワーク上の音楽演奏が挙げられる。

このようなネットワーク上の音楽演奏等を想定した場合、人間の耳が知覚する「音ずれ」を防ぐため、信号処理およびネットワークによる遅延との合計が３０ミリ秒未満でなければならない（非特許文献２参照）。

例えば、エコー除去およびネットワークによる遅延が２０ミリ秒の遅延となる場合、符号化および復号において許容される遅延は、約１０ミリ秒である。したがって、符号化および復号において用いられるＢＷＥツールも、低遅延であることが望ましい。

ＵＳＡＣでは、ＢＷＥツールとして、コピーアップ方法と、ハーモニック方法とが知られている。２つの方法の相違点は、高周波スペクトルが低周波スペクトルから導出される方法にある。なお、ハーモニック方法は、ＵＳＡＣで新たに提示された方法であり、強いハーモニック構造で信号の符号化を改善する。

図１は、コピーアップ方法と、ハーモニック方法とを説明するための模式図である。図１の（ａ）に示されるように、コピーアップ方法では、低周波数部分のスペクトルが直接高周波数部分のスペクトルとしてコピーされる。コピーアップ方法の動作の複雑度は非常に低いが、コピーアップ方法の動作は２つのスペクトル間のハーモニック関係を正確に保てない。

一方、図１の（ｂ）に示されるように、ハーモニック方法では、低周波数部分のスペクトルをハーモニックに伸長し、切り出すことで、高周波数部分のスペクトルを生成する。この動作原理はフェーズボコーダの動作原理と似ており、時間的伸長および再サンプリングのサブプロセスを複数含む。したがって、ハーモニック方法の動作の複雑度は高くなる。

ＵＳＡＣにおいて、この２つの方法は２つのＢＷＥモードとして存在する。以下、ＵＳＡＣのデコーダの基本的な構成について説明する。図２は、ＵＳＡＣのデコーダにおける２つのＢＷＥモードを示すブロック図である。

まず、コアデコーダから得られる狭帯域信号にＱＭＦ分析２００が行われ、３２帯域のサブバンド信号が生成される。理論上は、３２帯域のサブバンド信号には、高周波（ＨＦ）調整２０６前にＢＷＥモードフラグに応じて、コピーアップモード２０７またはハーモニックモード２０８の処理が行われればよい。

しかしながら、フィルタリング動作のフレーム間の連続性を維持するため（つまり、フィルタメモリバッファを連続的に維持するため）、両方のモードが常に作動していなければならない。これにより、大きなメモリ（ＲＯＭおよびＲＡＭ）が必要となる。

また、ハーモニックモード２０８では、複雑度が高く大きなメモリを必要とすることに加えて、３２帯域のサブバンド信号を６４帯域のサブバンド信号に変換するために、臨界サンプリング２０２がさらに必要となる。

具体的には、３２帯域のサブバンド信号を時間領域に変換するＱＭＦ合成２０３を行い、続いて、ＱＭＦ合成２０３後の時間領域の信号にＱＭＦ分析２０４を行うことにより６４帯域のサブバンド信号が生成される。生成された６４帯域のサブバンド信号は、時間的伸長および再サンプリング２０５され、高周波数部分が生成される。

ハーモニックモード２０８では、このように、臨界サンプリング２０２におけるＱＭＦフィルタバンク処理によって、復号処理にさらに遅延が生じる。

一方、コピーアップモード２０７においてコピーアップ２０１が行われる場合、トーン成分が広範囲に広がる（トーン性が弱い）信号に対しては、ハーモニック方法と同様の効果が得られる。なぜなら、このような場合人間の耳は、高周波数部分のトーン成分を区別することができないからである。

しかしながら、上述のように、コピーアップモード２０７では、低周波数部分のスペクトルと、コピーされた高周波数部分のスペクトルとの間の調和関係を保つことができない。このため、強いハーモニック構造の（トーン性が強い）信号に適用された場合、コピーアップ２０１はうまくいかない。なお、トーン性が強い信号では、トーン成分は、通常、高エネルギーのトーン成分と、その高調波とが支配的となる。

そこで、発明者らは、このような知見に基づき、コピーアップ方法およびハーモニック方法における複雑さ、遅延、および、メモリ等の問題を解決するために、新たな帯域幅拡張技術を発明した。

具体的には、本発明の一態様に係る帯域幅拡張パラメータ生成装置は、入力音信号の高域部分を示す高域信号を抽出する抽出部と、前記高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとを算出する算出部とを備える。

本発明の一態様に係る符号化装置は、上記帯域幅拡張パラメータ生成装置と、前記高域部分が除かれた前記入力音信号を示す信号をコアパラメータに符号化する符号化部と、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを含むビットストリームを生成して出力するビットストリーム・マルチプレクサとを備える。

また、さらに、前記高域部分が除かれた前記入力音信号である狭帯域信号を生成するフィルタ部と、前記入力音信号をサブバンド信号に変換するＱＭＦ（ＱｕａｄｒａｔｕｒｅＭｉｒｒｏｒＦｉｌｔｅｒ）分析部とを備え、前記符号化部は、前記狭帯域信号を前記コアパラメータに符号化し、前記抽出部は、前記サブバンド信号の高域部分であるＨＦサブバンド信号を前記高域信号として抽出してもよい。

また、さらに、前記入力音信号をＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）処理したＭＤＣＴ信号を生成するＭＤＣＴ部と、前記入力音信号をＭＤＳＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ）処理したＭＤＳＴ信号を生成するＭＤＳＴ部とを備え、前記符号化部は、前記入力音信号の前記高域部分に対応する部分が除かれた前記ＭＤＣＴ信号をコアパラメータに符号化し、前記抽出部は、前記ＭＤＣＴ信号および前記ＭＤＳＴ信号から複素信号を生成し、生成した前記複素信号の高域部分を前記高域信号として抽出してもよい。

本発明の一態様に係る復号装置は、ビットストリームを復号する復号装置であって、前記ビットストリームには、符号化された入力音信号の低域部分であるコアパラメータと、前記入力音信号の高域部分を示す高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとが含まれ、前記復号装置は、前記コアパラメータを復号することによって復号済み狭帯域信号を生成する復号部と、前記復号済み狭帯域信号のトーン成分を示す信号である低域トーン信号と、前記復号済み狭帯域信号のフロア成分を示す信号である低域フロア信号とを生成する分割部と、前記低域トーン信号を用いて前記高域信号のトーン成分に対応する信号である高域トーン信号を生成するトーン拡張部と、前記低域フロア信号を用いて前記高域信号のフロア成分に対応する信号である高域フロア信号を生成するフロア拡張部と、前記トーンパラメータを用いて前記高域トーン信号を調整した調整済みトーン信号を生成するトーン調整部と、前記フロアパラメータを用いて前記高域フロア信号を調整した調整済みフロア信号を生成するフロア調整部と、前記コアパラメータから得られる信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した帯域幅拡張信号を生成する加算部とを備える。

また、前記トーン拡張部は、前記低域トーン信号に含まれるトーン成分の高調波成分を示す信号を前記高域トーン信号として生成してもよい。

また、さらに、前記復号済み狭帯域信号をサブバンド信号に変換するＱＭＦ分析部を備え、前記分割部は、前記サブバンド信号を分割することによって、前記低域トーン信号と、前記低域フロア信号とを生成し、前記加算部は、前記コアパラメータから得られる信号である前記サブバンド信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成してもよい。

また、前記トーン拡張部は、前記低域トーン信号におけるサブバンドの中から、トーン成分のエネルギーが（１）隣接するサブバンドのトーン成分のエネルギーの所定倍よりも大きく、かつ、（２）当該サブバンドのフロア成分のエネルギーの所定倍よりも大きいサブバンドを選択し、選択したサブバンドの整数倍のサブバンドに、当該選択したサブバンドの前記低域トーン信号を複製することによって前記高域トーン信号を生成してもよい。

また、さらに、前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、前記帯域幅拡張信号を時間領域に変換するＱＭＦ合成部とを備えてもよい。

また、前記復号部は、（１）前記コアパラメータを復号してＭＤＣＴ信号を生成し、（２）前記ＭＤＣＴ信号をＭＤＳＴ領域に変換したＭＤＳＴ信号を生成し、（３）生成した前記ＭＤＣＴ信号および前記ＭＤＳＴ信号から得られる複素信号を前記復号済み狭帯域信号として生成し、前記加算部は、前記コアパラメータから得られる信号である前記ＭＤＣＴ信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成してもよい。

また、前記トーン拡張部は、前記低域トーン信号における周波数ビンの中から、トーン成分のエネルギーが隣接する周波数ビンのトーン成分のエネルギーの所定倍よりも大きい周波数ビンを選択し、選択した周波数ビンの整数倍の周波数ビンに、当該選択した周波数ビンの前記低域トーン信号を複製することによって前記高域トーン信号を生成してもよい。

また、さらに、前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、前記帯域幅拡張信号を時間領域に変換するＩＭＤＣＴ（ＩｎｖｅｒｓｅＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）部とを備えてもよい。

以下、実施の形態について、図面を参照しながら具体的に説明する。

なお、以下で説明する実施の形態は、いずれも包括的または具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置および接続形態、ステップ、ステップの順序などは、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。

（実施の形態１）
実施の形態１では、本発明の帯域幅拡張技術を用いた符号化装置について説明する。図３は、実施の形態１に係る符号化装置の機能構成を示すブロック図である。図４は、実施の形態１に係る符号化装置の動作のフローチャートである。

図３に示されるように、実施の形態１に係る符号化装置１００ａは、フィルタ部３００と、符号化部３０１と、ＱＭＦ分析部３０２と、抽出部３０３と、算出部３０４と、ビットストリーム・マルチプレクサ３０５とを備える。

なお、抽出部３０３と、算出部３０４とを帯域幅拡張パラメータ生成装置３０６とも記載する。つまり、帯域幅拡張パラメータ生成装置３０６は、抽出部３０３と、算出部３０４とを備える。

フィルタ部３００（ローパスフィルタ）は、入力信号ｘ（ｎ）から、入力信号ｘ（ｎ）の高域部分（高周波数部分）を除いた狭帯域信号ｘ_ＮＢ（ｎ）を生成する（Ｓ１０１）。ここで、ｎはサンプル指標である。狭帯域信号ｘ_ＮＢ（ｎ）は、言い換えれば、入力信号ｘ（ｎ）の低域部分（低周波数部分）であり、符号化部３０１で符号化される。一方、入力信号ｘ（ｎ）の高域部分は、算出部３０４により符号化される。

符号化部３０１は、狭帯域信号ｘ_ＮＢ（ｎ）（高域部分が除かれた入力信号ｘ（ｎ）を示す信号）をコアパラメータに符号化する（Ｓ１０２）。ＡＡＣ、ＬＰ、および、ＴＣＸなど先行技術のコアエンコーダは全て符号化部３０１において用いられる。例えば、符号化部３０１がスピーチおよびオーディオハイブリッド符号化に対応している場合には、符号化部３０１においては、上記のコアエンコーダのうち２つ以上が用いられる。

符号化部３０１は、１つのコアコーダから別のコアコーダへの切り替えにおいて、滑らかでアーチファクトのないフレーム移行を行うための追加パラメータを生成するコーデック切り替えハンドラをさらに備えてもよい。

ＱＭＦ分析部３０２（ＱＭＦ分析フィルタバンク）は、入力信号ｘ（ｎ）を２Ｍ帯域表示のサブバンド信号Ｘ（ｔｓ、ｓｂ）に変換する（Ｓ１０３）。

抽出部３０３は、入力信号ｘ（ｎ）の高域部分を示す高域信号を抽出する。具体的には、サブバンド信号Ｘ（ｔｓ、ｓｂ）の高域部分であるＸ_ＨＦ（ｔｓ，ｓｂ）を高域信号として抽出する（Ｓ１０４）。高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）の開始周波数は、フィルタ部３００を構成するローパスフィルタ帯域幅と一致することになる。以後、この開始周波数（所定の周波数）を交差周波数ｆ_{ｘｏｖｅｒ}と記載する。なお、ＵＳＡＣにおいては、Ｍ＝３２である。

算出部３０４は、高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）を用いてトーンパラメータとフロアパラメータとを算出する（Ｓ１０５）。トーンパラメータは、高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）のうちのトーン成分のエネルギーの大きさを示すパラメータである。フロアパラメータは、高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）のうちのトーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すパラメータである。

トーン成分とは、音信号のうち周波数軸上のピーク成分を意味し、音源の定常的かつ周期的な振動に起因する成分に相当する。言い換えれば、トーン成分は、音信号のうち特定の周波数に偏在する成分であり、符号化対象の音を発する音源の固有の性質を主に示す成分である。「トーン性が強い（高い）」とは、基本的には、トーン成分のエネルギーが大きいことを意味する。

一方、フロア成分とは、音信号のうち、摩擦や乱流など定常的だが非周期的な現象に起因するいわゆる定常ノイズ成分や、打撃や音源状態の急激な変化など非定常的な現象に起因するいわゆる過渡ノイズ成分に相当する。言い換えれば、フロア成分は、音信号のうち周波数に関係なく存在する成分である。

算出部３０４のトーンパラメータおよびフロアパラメータの算出方法の詳細については後述する。

ビットストリーム・マルチプレクサ３０５は、トーンパラメータ、フロアパラメータ、および、コアパラメータを組み合わせて、これらのパラメータを含むビットストリームを生成し、復号装置に出力する（Ｓ１０６）。

次に、算出部３０４の帯域幅拡張パラメータ（トーンパラメータおよびフロアパラメータ）の算出方法の詳細について説明する。

高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）は、所定のパラメータスロット（ｐｓ）と、パラメータ帯域（ｐｂ）とによって定められるパラメータユニット（ｐｓ、ｐｂ）に区分される。算出部３０４は、パラメータユニット（ｐｓ、ｐｂ）ごとに、１つのトーンパラメータと１つのフロアパラメータとを算出し量子化する。

図５は、タイムスロットとパラメータスロットとの関係、および、サブバンドとパラメータ帯域との関係を示す図である。パラメータ帯域およびパラメータスロットの境界や分解能などの関係を規定する情報は、予め定められていてもよいし、このような情報は、動的に算出されてビットストリームの一部を形成してもよい。

実施の形態１では、トーンパラメータは、トーン成分のエネルギー（以下、トーンエネルギーとも記載する）であり、フロアパラメータは、フロア成分のエネルギー（以下、フロアエネルギーとも記載する）である。なお、トーンパラメータは、トーン成分のエネルギーの大きさを示すものであればどのようなパラメータであってもよい。フロアパラメータは、フロア成分のエネルギーの大きさを示すものであればどのようなものであってもよい。

算出部３０４は、線形予測方法を用いて、以下のようにトーンパラメータおよびフロアパラメータを算出（推定）する。

１．算出部３０４は、共分散マトリクス要素をサブバンドｓｂごとに以下のように算出する。言い換えれば、各ＱＭＦ係数に対して相関係数を算出する。

２．算出部３０４は、線形予測係数を以下のように算出する。

３．算出部３０４は、パラメータユニットのトーンエネルギーの合計を以下のように算出する。

４．算出部３０４は、パラメータユニットのフロアエネルギーの合計を以下のように算出する。

以上のように算出されたトーンパラメータおよびフロアパラメータは、量子化後、ビットストリームとして復号装置に送信される。

なお、トーンエネルギーとフロアエネルギーとを算出する方法は、上記の方法に限定されるものではない。トーンエネルギーとフロアエネルギーとは、先行技術を含むどのような方法で算出されてもよい。

また、非線形量子化および差分符号化など、トーンパラメータおよびフロアパラメータは、どのような方法で量子化（符号化）されてもよい。この場合、先行技術を含む様々な量子化技術（符号化技術）が適用可能である。

また、符号化装置１００ａが実行する帯域幅拡張方法は、別の構造的に互換性のある帯域幅拡張方法（例えば、コピーアップ方法など）を含む複数の帯域幅拡張方法を選択的に実行することが可能なマルチモード符号化方法の一部として実現されてもよい。このような符号化方法では、ＢＷＥフラグは、パラメータユニットごとに好ましい帯域幅拡張方法を示し、ビットストリームの一部として生成される。

以上説明したように、実施の形態１に係る符号化装置１００ａは、入力信号の高域部分のトーンエネルギーおよびフロアエネルギーを推定し、これらのエネルギーの大きさを示す帯域幅拡張パラメータを生成（符号化）する。帯域幅拡張パラメータを用いることにより、復号装置は、入力信号と同様のエネルギー、トーン・フロア比、および、調和構造の帯域幅拡張信号を生成することができる。

（実施の形態２）
実施の形態２では、符号化装置１００ａに対応する復号装置について説明する。図６は、実施の形態２に係る復号装置の機能構成を示すブロック図である。図７は、実施の形態２に係る復号装置の動作のフローチャートである。

図６に示されるように、復号装置２００ａは、ビットストリーム・デマルチプレクサ５００と、復号部５０１と、ＱＭＦ分析部５０２と、分割部５０３と、トーン拡張部５０４と、フロア拡張部５０５と、トーン調整部５０６と、フロア調整部５０７と、加算部５０８と、ＱＭＦ合成部５０９とを備える。

ビットストリーム・デマルチプレクサ５００は、ビットストリームをアンパックすることによって、トーンパラメータ、フロアパラメータ、および、コアパラメータを生成（抽出）する（Ｓ２０１）。

復号部５０１は、コアパラメータを復号し、復号済み狭帯域信号ｘ（ｎ）を生成する（Ｓ２０２）。ＡＡＣ、ＬＰ、および、ＴＣＸなど、先行技術のコアデコーダは全て復号部５０１において用いられる。例えば、復号部５０１がスピーチおよびオーディオハイブリッド符号化に対応している場合には、復号部５０１においては上述のコアデコーダのうち２つ以上が用いられる。

復号部５０１は、１つのコアコーダから別のコアコーダへの切り替えにおいて、滑らかでアーチファクトのないフレーム移行を行うためのコーデック切り替えハンドラをさらに備えてもよい。また、復号部５０１において、窓処理、重なり部分の追加、エイリアシング除去などのコーデック切り替え技術が用いられてもよい。

ＱＭＦ分析部５０２は、復号済み狭帯域信号ｘ（ｎ）をＭ帯域表示のサブバンド信号Ｘ（ｔｓ，ｓｂ）に変換する。サブバンド信号Ｘ（ｔｓ、ｓｂ）の帯域幅の上限は、ｆ_{ｘｏｖｅｒ}になる。なお、サブバンド信号Ｘ（ｔｓ、ｓｂ）は、コアパラメータから得られる信号である。

分割部５０３は、復号済み狭帯域信号ｘ（ｎ）のトーン成分を示す信号である低域トーン信号と、復号済み狭帯域信号ｘ（ｎ）のフロア成分を示す信号である低域フロア信号とを生成する。具体的には、分割部５０３は、サブバンド信号Ｘ（ｔｓ，ｓｂ）を低域トーン信号Ｘ_Ｔ（ｔｓ，ｓｂ）および低域フロア信号Ｘ_Ｆ（ｔｓ，ｓｂ）に分割する。実施の形態２では、線形予測および逆フィルタリングにより、以下のように分割が行われる。

１．分割部５０３は、サブバンド信号Ｘ（ｔｓ，ｓｂ）に、実施の形態１で説明した式（１）〜（５）を適用し、線形予測係数α_０（ｐｓ、ｓｂ）およびα_１（ｐｓ、ｓｂ）、トーンエネルギーＥ_Ｔ（ｐｓ、ｓｂ）、並びに、フロアエネルギーＥ_Ｆ（ｐｓ、ｓｂ）を算出する。

２．分割部５０３は、サブバンド信号Ｘ（ｔｓ，ｓｂ）に逆フィルタリングを行い、以下のように、低域トーン信号Ｘ_Ｔ（ｔｓ，ｓｂ）および低域フロア信号Ｘ_Ｆ（ｔｓ，ｓｂ）を導出する。

３．分割部５０３は、トーンエネルギー（低域トーン信号Ｘ_Ｔ（ｔｓ，ｓｂ）のエネルギー）に基づいて、サブバンドｓｂがトーン性が高い（強い）か否かを評価する。この評価においては、閾値を評価基準とすることができる。例えば、サブバンドｓｂのトーンエネルギーが、以下の式（８）、（９）、および（１０）を満たす場合、当該サブバンドｓｂのトーン性は高いと評価される。

具体的には、サブバンドｓｂのトーンエネルギーが、隣接サブバンドのトーンエネルギーのＣ_１（Ｃ_１＞０）倍よりも高い場合であって、かつ、当該サブバンドｓｂのフロアエネルギーのＣ_２（Ｃ_２＞０）倍よりも高い場合、当該サブバンドｓｂのトーン性は高いと評価される。なお、変形例として、分割部５０３は、高調波の分布が密集しすぎないように、所定の周波数より上の帯域のサブバンドのみをハーモニック拡張に用いてもよい。

４．上記の基準を満たす全てのサブバンドｓｂから、互いにハーモニックス関係ではないサブバンドｓｂ（つまり、相互に最重要であるサブバンドｓｂ）をトーンエネルギーが高い順にＮ_Ｔ個（例えば、３個）選択する。以下、選択されたサブバンドｓｂをトーンサブセットｓｂ_Ｔと記載する。

なお、サブバンド信号Ｘ（ｔｓ，ｓｂ）を低域トーン信号（トーン成分）と低域フロア信号（フロア成分）とに分割する方法、および、トーンエネルギーの高いサブバンドｓｂを選択する方法は、上記のような方法に限定されるものではなく、どのような方法が用いられてもよい。

また、上記サブバンドの評価および選択は、トーン拡張部５０４が行ってもよい。つまり、トーン拡張部５０４は、低域トーン信号におけるサブバンドｓｂの中から、トーンサブセットｓｂ_Ｔを選択してもよい。トーンサブセットｓｂ_Ｔは、上述のように、トーン成分のエネルギーが隣接するサブバンドのトーン成分のエネルギーの所定倍よりも大きく、かつ、当該サブバンドのフロア成分のエネルギーの所定倍よりも大きいサブバンドである。

フロア拡張部５０５は、低域フロア信号Ｘ_Ｆ（ｔｓ，ｓｂ）を用いて高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）（＝入力信号の高域部分）のフロア成分に対応する信号である高域フロア信号を生成する（Ｓ２０５）。具体的には、フロア拡張部５０５は、低域フロア信号Ｘ_Ｆ（ｔｓ，ｓｂ）を高周波数部分にパッチした高域フロア信号（パッチ済みフロア信号）Ｘ’_Ｆ（ｔｓ，ｓｂ）を生成する。

実施の形態２では、高域フロア信号Ｘ’_Ｆ（ｔｓ，ｓｂ）の生成には、ＨＥ−ＡＡＣにおいて用いられているコピーアップ方法が用いられる。関数ｍａｐ（）を、ｍａｐ（ｓｂ）のサブバンドを高周波数領域のサブバンドｓｂにコピーするパッチング関数とした場合、パッチング動作は、以下の式で示される。

トーン拡張部５０４は、低域トーン信号Ｘ_Ｔ（ｔｓ，ｓｂ）を用いて高域信号Ｘ_ＨＦ（ｔｓ，ｓｂ）（＝入力信号の高域部分）のトーン成分に対応する信号である高域トーン信号（拡張済みトーン信号）を生成する（Ｓ２０６）。具体的には、トーン拡張部５０４は、低域トーン信号Ｘ_Ｔ（ｔｓ，ｓｂ）を高周波数領域にハーモニックに（＝基本波と高調波との関係性を維持して）拡張した高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）を生成する。

実施の形態２では、トーン拡張部５０４は、以下のハーモニック拡張方法を用いる。

１．トーン拡張部５０４は、整数ハーモニック比（例えば、２、３、４）に応じて、トーンサブセットｓｂ_Ｔに位置するトーン性の高いトーン成分を高周波数領域に複製（コピー）する。以下の擬似コードは、複製動作を示す。なお、以下の式では、最大ハーモニック比（例えば、４）を設定することができる。

なお、ここでのハーモニック拡張方法は、図２で説明したハーモニックモードにおけるハーモニック方法とは異なり、ＱＭＦフィルタバンク処理（ＱＭＦ合成２０３およびＱＭＦ分析２０４）、および、時間的伸長および再サンプリング２０５が行われない。このため、ここでのハーモニック拡張方法は、図２のハーモニック方法よりも低遅延である。

２．トーンエネルギーの低い（トーン性の高いトーン成分を有しない）サブバンドｓｂには、フロア拡張部５０５が使用するものと同一のｍａｐ（ｓｂ）関数を用いたコピーアップ方法が適用される。

このとき、トーンサブセットｓｂ_Ｔに位置するトーン成分は、既に上述のハーモニック拡張方法によって高周波数領域に複製されているため、コピーアップ方法によって再度パッチングされることはない。

高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）および高域フロア信号Ｘ’_Ｆ（ｔｓ，ｓｂ）は、Ｍ帯域より大きく２Ｍ帯域未満であることが予測される。

以上のように、トーン拡張部５０４は、低域トーン信号に含まれるトーン成分の高調波成分を示す信号を高域トーン信号として生成する。

トーン調整部５０６は、トーンパラメータを用いて高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）を調整した調整済みトーン信号Ｘ”_Ｔ（ｔｓ，ｓｂ）を生成する（Ｓ２０７）。実施の形態２では、トーンパラメータは、パラメータユニット（ｐｓ、ｐｂ）ごとに定められたトーンエネルギーＥ_Ｔ（ｐｓ、ｐｂ）であり、高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）は、以下のように調整される。

言い換えれば、トーン調整部５０６は、トーンパラメータが示すトーンエネルギーにエネルギーが調整された高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）である調整済みトーン信号Ｘ”_Ｔ（ｔｓ，ｓｂ）を生成する。

サブバンド信号Ｘ（ｔｓ，ｓｂ）自体のトーン性が低いときには、高域トーン信号Ｘ’_Ｔ（ｔｓ，ｓｂ）は、パラメータ帯域ｐｂ内でトーン成分を有しない場合がある。このような場合、トーン調整部５０６の調整動作の前に、人工的な高調波ハーモニックがパラメータ帯域ｐｂの中心に注入されてもよい。以下に例を示す。

フロア調整部５０７は、フロアパラメータを用いて高域フロア信号Ｘ’_Ｆ（ｔｓ，ｓｂ）を調整した調整済みフロア信号Ｘ”_Ｆ（ｔｓ，ｓｂ）を生成する（Ｓ２０８）。実施の形態２では、フロアパラメータは、パラメータユニット（ｐｓ，ｐｂ）ごとに定められたフロアエネルギーＥ_Ｆ（ｐｓ，ｐｂ）であり、高域フロア信号Ｘ’_Ｆ（ｔｓ，ｓｂ）は、以下のように調整される。

言い換えれば、フロア調整部５０７は、フロアパラメータが示すフロアエネルギーにエネルギーが調整された高域フロア信号Ｘ’_Ｆ（ｔｓ，ｓｂ）である調整済みフロア信号Ｘ”_Ｆ（ｔｓ，ｓｂ）を生成する。

なお、パラメータスロットとパラメータ帯域間の境界は、予め定められていてもよいし、ビットストリームに含まれる情報を用いて動的に生成されてもよい。

加算部５０８は、サブバンド信号Ｘ（ｔｓ，ｓｂ）、調整済みトーン信号Ｘ”_Ｔ（ｔｓ，ｓｂ）、および、調整済みフロア信号Ｘ”_Ｆ（ｔｓ，ｓｂ）を加算した帯域幅拡張信号Ｘ”（ｔｓ，ｓｂ）を生成する（Ｓ２０９）。

ＱＭＦ合成部５０９（ＱＭＦ合成フィルタバンク）は、帯域幅拡張信号Ｘ”（ｔｓ，ｓｂ）を時間領域の信号ｘ”（ｎ）に変換（逆変換）する（Ｓ２１０）。

なお、トーンエネルギー（トーンパラメータ）およびフロアエネルギー（フロアパラメータ）には、使用前に、共通の前処理が行われてもよい。例えば、タイムスロット方向およびサブバンド方向のいずれか一方、または、両方において、ローパスフィルタによって、トーンエネルギーおよびフロアエネルギーが補間および（または）平滑化されてもよい。

また、逆フィルタリングの度合いは、線形予測係数に一定の「チャープ関数」を乗じることにより調整されてもよい。

また、復号装置２００ａが実行する帯域幅拡張方法は、別の帯域幅拡張方法（例えば、コピーアップ方法など）を含む複数の帯域幅拡張方法を選択的に実行することが可能なマルチモード復号方法の一部として実現されてもよい。このような復号方法では、ＢＷＥフラグは、パラメータユニットごとに好ましい帯域幅拡張方法を示し、ビットストリームから抽出される。

以上説明したように、実施の形態２に係る復号装置２００ａは、トーン性の強いトーン成分をハーモニックに拡張し、単純複製したフロア成分と合成することにより、入力信号（原信号）のハーモニックな音質を保つことができる。

また、復号装置２００ａが実行する帯域幅拡張方法は、先行技術のハーモニック方法で用いられる臨界サンプリング、時間的伸長および再サンプリング（ダウンサンプリング）が必須でない。したがって、復号装置２００ａが実行する帯域幅拡張方法によれば、複雑さ、遅延、および、メモリに関する要件を軽減することが可能である。

（実施の形態３）
本発明の帯域幅拡張技術は、ＭＤＣＴ処理を行う符号化装置にも適用可能である。実施の形態３では、このような符号化装置について説明する。図８は、実施の形態３に係る符号化装置の機能構成を示すブロック図である。図９は、実施の形態３に係る符号化装置の動作のフローチャートである。

図８に示されるように、実施の形態３に係る符号化装置１００ｂは、フレーマー６００と、ＭＤＣＴ部６０１と、符号化部６０２と、ＭＤＳＴ部６０３と、抽出部６０４と、算出部６０５と、ビットストリーム・マルチプレクサ６０６とを備える。

なお、抽出部６０４と、算出部６０５とを帯域幅拡張パラメータ生成装置６０７とも記載する。つまり、帯域幅拡張パラメータ生成装置６０７は、抽出部６０４と、算出部６０５とを備える。

フレーマー６００は、ＭＤＣＴ処理およびＭＤＳＴ処理の前処理として、入力信号をフレームに分割し（フレーミング）、所定数のフレームごとに窓処理する（Ｓ３０１）。図１０は、フレーマー６００のフレーミングおよび窓処理を示す図である。

図１０の（ａ）に示されるように、フレーマー６００の窓処理においては、入力信号ｘ（ｎ）の連続する２つのフレーム７００ごとに窓関数７０１が適用される。窓関数が適用されたフレーム７００は、その後符号化装置１００ｂ側でＭＤＣＴ処理７０２され、図１０の（ｂ）に示されるように復号装置側でＩＭＤＣＴ処理７０３された後、窓処理７０４される。

窓処理には、符号化のためのより優れた周波数分解能の提供、および、復号装置で逆変換されたフレームの結合の際にフレーミングアーチファクトを防ぐ平滑化メカニズムの提供という２つの目的がある。フレーマー６００は、前処理（フレーミングおよび窓処理）後の入力信号ｘ（ｎ）を窓処理済み信号ｘ’（ｎ）として出力する。

ＭＤＣＴ部６０１は、前処理後の入力信号をＭＤＣＴ処理したＭＤＣＴ信号Ｘ_Ｃ（ｋ）を生成する（Ｓ３０２）。具体的には、ＭＤＣＴ部６０１は、窓処理済み信号ｘ’（ｎ）をＭＤＣＴ領域に変換し、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）を生成する。なお、ｋは周波数ビン指標（以下、単に、周波数ビンとも記載する）である。

符号化部６０２は、入力信号ｘ（ｎ）の高域部分に対応する部分が除かれたＭＤＣＴ信号Ｘ_Ｃ（ｋ）（高域部分が除かれた入力信号ｘ（ｎ）を示す信号）をコアパラメータに符号化する（Ｓ３０３）。つまり、符号化部６０２は、ｆ_{ｘｏｖｅｒ}より下の帯域のＭＤＣＴ信号Ｘ_Ｃ（ｋ）をコアパラメータに符号化する。ＡＡＣなどで用いられている先行技術のＭＤＣＴ符号化方法は、符号化部６０２で用いられる。

ＭＤＳＴ部６０３は、前処理後の入力信号をＭＤＳＴ処理したＭＤＳＴ信号Ｘ_Ｓ（ｋ）を生成する（Ｓ３０４）。具体的には、ＭＤＳＴ部６０３は、窓処理済み信号ｘ’（ｎ）をＭＤＳＴ領域に変換し、ＭＤＳＴ信号Ｘ_Ｓ（ｋ）を生成する。

抽出部６０４は、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）およびＭＤＳＴ信号Ｘ_Ｓ（ｋ）から複素信号Ｘ（ｋ）を生成し、生成した複素信号の高周波数部分（高域部分）を高域信号Ｘ（ｋ）（ｋ＞ｆ_{ｘｏｖｅｒ}）として抽出する（Ｓ３０５）。また、抽出部６０４は、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）およびＭＤＳＴ信号Ｘ_Ｓ（ｋ）の高周波数部分を抽出し、それらの部分を合わせることで複素信号を生成してもよい。

抽出部６０４は、ＭＤＣＴ信号またはＭＤＳＴ信号自体からトーンエネルギーを正確に取得できないため、複素信号を算出する。これについては、図１１を用いて説明する。図１１は、５ｋＨｚの純粋なトーン成分のトーンエネルギーを示す図であり、図１１の（ａ）は、ＭＤＣＴエネルギー、図１１の（ｂ）は、ＭＤＳＴエネルギー、図１１の（ｃ）は、複素エネルギーをそれぞれ示す。

図１１の例では、フレームサイズが１０２４サンプルであり、サンプリング周波数は４８ｋＨｚである。図１１の（ａ）および図１１の（ｂ）から分かるように、いくつかのフレームにおけるトーンエネルギーは、他のいくつかのフレームにおけるトーンエネルギーより実質的に小さくなる。したがって、複数のスペクトルのうち１つのみがトーン成分の抽出に用いられる場合、トーン性の高いトーン成分が見逃される可能性がある。

一方、図１１の（ｃ）に示されるように、複素信号では、全てのフレームにおいて同一のトーン成分のトーンエネルギー（複素エネルギー）は一定である。

算出部６０５は、高域信号Ｘ（ｋ）（ｋ＞ｆ_{ｘｏｖｅｒ}）を用いてトーンパラメータおよびフロアパラメータを算出する（Ｓ３０６）。トーンパラメータは、高域信号Ｘ（ｋ）（ｋ＞ｆ_{ｘｏｖｅｒ}）のうちのトーン成分のエネルギーの大きさを示すパラメータである。フロアパラメータは、高域信号Ｘ（ｋ）（ｋ＞ｆ_{ｘｏｖｅｒ}）のうちのトーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すパラメータである。

算出部６０５のトーンパラメータおよびフロアパラメータの算出方法の詳細については後述する。

ビットストリーム・マルチプレクサ６０６は、トーンパラメータ、フロアパラメータ、および、コアパラメータを組み合わせて、これらのパラメータを含むビットストリームを生成し、復号装置に出力する（Ｓ３０７）。

次に、算出部６０５の帯域幅拡張パラメータ（トーンパラメータおよびフロアパラメータ）の算出方法の詳細について説明する。

高域信号Ｘ（ｋ）（ｋ＞ｆ_{ｘｏｖｅｒ}）は、所定のパラメータ帯域ｐｂに区分される。このときの区分は、実施の形態１で図５を用いて説明した区分に類似しており、相違点は、ＭＤＣＴ領域においては、タイムスロット次元が存在しないことである。算出部６０５は、パラメータ帯域ｐｂごとに、１つのトーンパラメータと１つのフロアパラメータとを算出し量子化する。

実施の形態３では、トーンパラメータは、トーンエネルギーであり、フロアパラメータは、フロアエネルギーである。算出部６０５は、以下のようにトーンパラメータおよびフロアパラメータを算出（推定）する。

１．算出部６０５は、各周波数ビン指標ｋのエネルギーを以下のように算出する。

２．算出部６０５は、以下の式を満たす周波数ビン指標ｋ（ｋ_Ｔ）を探す。

３．算出部６０５は、各周波数ビン指標ｋのトーンエネルギーＥ_Ｔ（ｋ）およびフロアエネルギーＥ_Ｆ（ｋ）を以下のように算出する。

４．算出部６０５は、パラメータ帯域ｐｂのトーンエネルギーの合計を以下のように算出する。

５．算出部６０５は、パラメータ帯域ｐｂのフロアエネルギーの合計を以下のように算出する。

なお、ＭＤＣＴ領域においてトーン成分を識別する上述の方法は、単なる例にすぎずこのような方法に限定されない。ＭＤＣＴ領域においてトーン成分を識別するより高度な技術が先行技術の中に存在する。

例えば、信頼度を高めるため、現在のフレームにおいて識別されたトーン成分は、過去のフレームにおいて見られるトーン成分と比較されてもよい。この場合、現在および過去の両方のフレームの同一の周波数ビン指標において現れるトーン成分のみが「確定した」トーン成分とみなされる。

また、例えば、周波数ビンｋにおけるトーン成分の判定基準には、隣接する周波数ビン指標ｋ−１およびｋ＋１だけでなく、周波数ビン指標ｋ−２およびｋ＋２などが含まれてもよい。

以上説明したように、実施の形態３に係る符号化装置１００ｂによれば、ＭＤＣＴ領域においてもトーンエネルギーおよびフロアエネルギーの大きさを示す帯域幅拡張パラメータを生成（符号化）することができる。帯域幅拡張パラメータを用いることにより、復号装置は、入力信号と同様のエネルギー、トーン・フロア比、および、調和構造の帯域幅拡張信号を生成することができる。

（実施の形態４）
実施の形態４では、符号化装置１００ｂに対応する復号装置について説明する。図１２は、実施の形態４に係る復号装置の機能構成を示すブロック図である。図１３は、実施の形態４に係る復号装置の動作のフローチャートである。

図１２に示されるように、復号装置２００ｂは、ビットストリーム・デマルチプレクサ９００と、復号部９１１（コア復号部９０１および複素信号生成部９０２）と、分割部９０３と、トーン拡張部９０４と、フロア拡張部９０５と、トーン調整部９０６と、フロア調整部９０７と、加算部９０８と、ＩＭＤＣＴ部９０９と、フレーマー９１０とを備える。

ビットストリーム・デマルチプレクサ９００は、ビットストリームをアンパックすることによって、トーンパラメータ、フロアパラメータ、および、コアパラメータを生成（抽出）する（Ｓ４０１）。

復号部９１１は、コアパラメータを復号し、復号済み狭帯域信号Ｘ（ｋ）を生成する（Ｓ４０２）。

具体的には、まず、コア復号部９０１は、コアパラメータを復号してＭＤＣＴ信号Ｘ_Ｃ（ｋ）を生成する。つまり、ＭＤＣＴ信号は、コアパラメータから得られる信号である。ＡＡＣなどで用いられている先行技術のＭＤＣＴ復号方法は、コア復号部９０１で用いられる。

そして、複素信号生成部９０２は、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）をＭＤＳＴ領域に変換したてＭＤＳＴ信号Ｘ_Ｓ（ｋ）を生成する。ＭＤＣＴ信号Ｘ_Ｃ（ｋ）をＭＤＳＴ領域に変換してＭＤＳＴ信号Ｘ_Ｓ（ｋ）を生成する方法としては、先行技術のＭＤＣＴ・ＭＤＳＴ変換方法（例えば、非特許文献４）が適用できる。

そして、複素信号生成部９０２は、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）と、ＭＤＳＴ信号Ｘ_Ｓ（ｋ）とを用いて、以下のように複素信号を生成する。

なお、複素信号Ｘ（ｋ）は、帯域幅の上限がｆ_{ｘｏｖｅｒ}の復号済み狭帯域信号である。

分割部９０３は、復号済み狭帯域信号Ｘ（ｋ）のトーン成分を示す信号である低域トーン信号と、復号済み狭帯域信号Ｘ（ｋ）のフロア成分を示す信号である低域フロア信号とを生成する（Ｓ４０３）。具体的には、分割部５０３は、復号済み狭帯域信号Ｘ（ｋ）を低域トーン信号Ｘ_Ｔ（ｋ）および低域フロア信号Ｘ_Ｆ（ｋ）に分割する。実施の形態４では、この分割は以下のよう行われる。

１．分割部９０３は、実施の形態３で説明した式（１９）〜（２２）を用いて、トーン成分ｋ_Ｔ、全体エネルギーＥ（ｋ）、トーンエネルギーＥ_Ｔ（ｋ）、および、フロアエネルギーＥ_Ｆ（ｋ）を周波数ビン指標ｋごとに算出する。

２．分割部９０３は、低域トーン信号Ｘ_Ｔ（ｋ）および低域フロア信号Ｘ_Ｆ（ｋ）を以下のように導出する。言い換えれば、分割部９０３は、復号済み狭帯域信号Ｘ（ｋ）をエネルギーの大きさに応じて分割することによって低域トーン信号Ｘ_Ｔ（ｋ）および低域フロア信号Ｘ_Ｆ（ｋ）を生成する。

３．分割部９０３は、周波数ビン指標ｋ_Ｔの中から、トーンエネルギーが高い順にＮ_Ｔ個のトーンサブセットｋ_Ｔ２を選択する。なお、変形例として、分割部９０３は、高調波の分布が密集しすぎないように、所定の周波数より上の周波数ビン指標のみをハーモニック拡張に用いてもよい。

また、上記トーンサブセットの選択は、トーン拡張部９０４が行ってもよい。つまり、トーン拡張部９０４は、低域トーン信号における周波数ビンｋの中から、トーン成分のエネルギーが隣接する周波数ビンのトーン成分のエネルギーの所定倍よりも大きい周波数ビンｋ（ｋ_Ｔ、ｋ_Ｔ２）を選択してもよい。

フロア拡張部９０５は、低域フロア信号Ｘ_Ｆ（ｋ）を用いて高域信号（＝入力信号の高域部分）のフロア成分に対応する信号である高域フロア信号を生成する（Ｓ４０４）。フロア拡張部９０５は、低域フロア信号Ｘ_Ｆ（ｋ）を高周波数部分にパッチした高域フロア信号（パッチ済みフロア信号）Ｘ’_Ｆ（ｋ）を生成する。具体的には、例えば、ＨＥ−ＡＡＣにおいて使用されるコピーアップ技術などが適用可能である。

関数ｍａｐ（）を、ｍａｐ（ｋ）の周波数ビン指標を高周波数領域の周波数ビン指標ｋにコピーするパッチング関数とした場合、パッチング動作は、以下の式で示される。

トーン拡張部９０４は、低域トーン信号Ｘ_Ｔ（ｋ）を用いて高域信号（＝入力信号の高域部分）のトーン成分に対応する信号である高域トーン信号（拡張済みトーン信号）を生成する（Ｓ４０５）。具体的には、トーン拡張部９０４は、低域トーン信号Ｘ_Ｔ（ｋ）を高周波数領域にハーモニックに拡張した高域トーン信号Ｘ’_Ｔ（ｋ）を生成する。

実施の形態４では、トーン拡張部９０４は、以下のハーモニック拡張方法を用いる。なお、以下の説明では周波数ビン指標ｋ_Ｔに対してハーモニック拡張方法が適用されるが、トーンサブセットｋ_Ｔ２にハーモニック拡張方法が適用されてもよい。

１．トーン拡張部９０４は、整数ハーモニック比（例えば、２、３、４）に応じて、トーンサブセットｋ_Ｔに位置するトーン性の高いトーン成分を高周波数領域に複製（コピー）する。つまり、トーン拡張部９０４は、選択した周波数ビン（トーンサブセットｋ_Ｔ）の整数倍の周波数ビンに、当該選択した周波数ビンの低域トーン信号を複製することによって高域トーン信号を生成する。以下の擬似コードは、複製動作を示す。なお、以下の式では、コピー動作は、最大ハーモニック比ｒａｔｉｏ_ｍａｘ（例えば、４）が限度となる。

２．トーン成分のない周波数ビン指標には、フロア拡張部９０５が使用するものと同一のｍａｐ（ｋ）関数を用いたコピーアップ方法が適用される。

このとき、トーンサブセットｋ_Ｔのトーン成分は、既に上述のハーモニック拡張方法によって高周波数領域に複製されているため、コピーアップ方法によって再度パッチングされることはない。

以上のように、トーン拡張部９０４は、低域トーン信号に含まれるトーン成分の高調波成分を示す信号を高域トーン信号として生成する。

トーン調整部９０６は、トーンパラメータを用いて高域トーン信号Ｘ’_Ｔ（ｋ）を調整した調整済みトーン信号Ｘ”_Ｔ（ｋ）を生成する（Ｓ４０６）。実施の形態４では、トーンパラメータは、パラメータ帯域ｐｂごとに定められたトーンエネルギーＥ_Ｔ（ｐｂ）であり、高域トーン信号Ｘ’_Ｔ（ｋ）は、以下のように調整される。

言い換えれば、トーン調整部９０６は、トーンパラメータが示すトーンエネルギーにエネルギーが調整された高域トーン信号Ｘ’_Ｔ（ｋ）である調整済みトーン信号Ｘ”_Ｔ（ｋ）を生成する。

復号済み狭帯域信号Ｘ（ｋ）自体のトーン性が低いときには、高域トーン信号Ｘ’_Ｔ（ｋ）は、パラメータ帯域ｐｂ内でトーン成分を有しない場合がある。このような場合、トーン調整部９０６の調整動作の前に、人工的な高調波成分をパラメータ帯域の中心に注入することができる。以下に例を示す。

Ｄａｕｄｅｔらの文献（非特許文献５）には、純粋な正弦波トーンのＭＤＣＴスペクトルは、シフト済みｓｉｎｃ（）関数と、シフト済みコサイン変調との積であることが記載されている。この分析に基づき、周波数ビン指標ｋの中心に正弦波トーンを注入するため、以下のような信号を周波数ビン指標の区間［ｋ−２，ｋ＋２］に注入しなければならない。ここで、ｆｒはフレーム指標である。

なお、複雑さを軽減するため、ｋ−２およびｋ＋２への注入は省略されてもよい。これにより、音質は少し低下することになるが、ｋ−２およびｋ＋２は、低振幅であるため音質への影響は限定的である。

フロア調整部９０７は、フロアパラメータを用いて高域フロア信号Ｘ’_Ｆ（ｋ）を調整した調整済みフロア信号Ｘ”_Ｆ（ｋ）を生成する（Ｓ４０７）。実施の形態４では、フロアパラメータは、パラメータ帯域ｐｂごとに定められたフロアエネルギーＥ_Ｆ（ｋ）であり、高域フロア信号Ｘ’_Ｆ（ｋ）は、以下のように調整される。

言い換えれば、フロア調整部９０７は、フロアパラメータが示すフロアエネルギーにエネルギーが調整された高域フロア信号Ｘ’_Ｆ（ｋ）である調整済みフロア信号Ｘ”_Ｆ（ｋ）を生成する。

加算部９０８は、ＭＤＣＴ信号Ｘ_Ｃ（ｋ）、調整済みトーン信号Ｘ”_Ｔ（ｋ）の実数部分、および、調整済みフロア信号Ｘ”_Ｆ（ｋ）の実数部分を加算した帯域幅拡張信号Ｘ”（ｋ）を生成する（Ｓ４０８）。

ＩＭＤＣＴ部９０９は、帯域幅拡張信号Ｘ”（ｋ）を時間領域の信号ｘ”（ｎ）に変換（逆変換）する（Ｓ４０９）。

フレーマー９１０は、時間領域の信号ｘ”（ｎ）に対して窓処理と、重なり部分の追加処理とを行い、復号信号ｘ’’’（ｎ）を生成する（Ｓ４１０）。実施の形態３で説明した図１０の（ｂ）はフレーマー９１０の動作を示す図である。

以上説明したように、実施の形態４に係る復号装置２００ｂは、トーン性の強いトーン成分をハーモニックに拡張し、単純複製したフロア成分と合成することにより、入力信号（原信号）のハーモニックな音質を保つことができる。

また、復号装置２００ｂが実行する帯域幅拡張方法は、先行技術のハーモニック方法で用いられる臨界サンプリング、時間的伸長および再サンプリング（ダウンサンプリング）が必須でない。したがって、復号装置２００ｂが実行する帯域幅拡張方法によれば、複雑さ、遅延、および、メモリに関する要件を軽減することが可能である。

（その他の実施の形態）
本発明は、帯域幅拡張パラメータ生成装置として実現されてもよい。

上記実施の形態において説明した各フローチャートのステップの順序は、一例であり、実行可能な範囲で変更されてもよい。また、並列処理が可能なステップについては並列処理されてもよい。

また、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

（まとめ）
上記実施の形態に係る帯域幅拡張パラメータ生成装置および符号化装置は、入力信号の高域部分のトーンエネルギーおよびフロアエネルギーを推定し、これらのエネルギーの大きさを示す帯域幅拡張パラメータを生成する。

上記実施の形態に係る復号装置は、復号した狭帯域信号からトーン性の高いトーン成分を選択および抽出し、抽出したトーン成分を用いてハーモニックに高周波数領域に拡張する。そして、復号装置は、残りのフロア成分、つまり、抽出したトーン成分を復号した狭帯域信号から差し引いた成分が、コピーアップ方法により、高周波数領域として複製される。

さらに、抽出されたトーン成分と複製されたフロア成分とが入力信号と同一のトーンエネルギーおよびトーン・フロア比になるように、符号化装置が生成した帯域幅拡張パラメータを用いてこれらの成分を調整する。

上記実施の形態に係る帯域幅拡張方法は、基本的には、複雑度の低いコピーアップ方法による単純な拡張であるため、先行技術のハーモニック方法が必要とする臨界サンプリング、時間的伸長、および再サンプリングは必要ない。このため、複雑度、遅延、および、メモリは大幅に改善される。

以上、一つまたは複数の態様に係る帯域幅拡張パラメータ生成装置、符号化装置、および復号装置について、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、一つまたは複数の態様の範囲内に含まれてもよい。

なお、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。このため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。

本発明は、音信号の符号化および復号に関するアプリケーションに適用することができる。本発明は、例えば、カセットブック、放送システム、携帯用メディア機器、（携帯電話やタブレットを含む）モバイル通信端末、テレビ会議機器、および、ネットワーク上の音楽演奏アプリケーションに適用できる。

１００ａ、１００ｂ符号化装置
２００、２０４ＱＭＦ分析
２００ａ、２００ｂ復号装置
２０１コピーアップ
２０２臨界サンプリング
２０３ＱＭＦ合成
２０５時間的伸長および再サンプリング
２０６ＨＦ調整
２０７コピーアップモード
２０８ハーモニックモード
３００フィルタ部
３０１、６０２符号化部
３０２、５０２ＱＭＦ分析部
３０３、６０４抽出部
３０４、６０５算出部
３０５、６０６ビットストリーム・マルチプレクサ
３０６、６０７帯域幅拡張パラメータ生成装置
５００、９００ビットストリーム・デマルチプレクサ
５０１、９１１復号部
５０３、９０３分割部
５０４、９０４トーン拡張部
５０５、９０５フロア拡張部
５０６、９０６トーン調整部
５０７、９０７フロア調整部
５０８、９０８加算部
５０９ＱＭＦ合成部
６００、９１０フレーマー
６０１ＭＤＣＴ部
６０３ＭＤＳＴ部
７００フレーム
７０１窓関数
７０２ＭＤＣＴ処理
７０３ＩＭＤＣＴ処理
７０４窓処理
９０１コア復号部
９０２複素信号生成部
９０９ＩＭＤＣＴ部

Claims

ビットストリームを復号する復号装置であって、
前記ビットストリームには、符号化された入力音信号の低域部分であるコアパラメータと、前記入力音信号の高域部分を示す高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとが含まれ、
前記復号装置は、
前記コアパラメータを復号することによって復号済み狭帯域信号を生成する復号部と、
前記復号済み狭帯域信号のトーン成分を示す信号である低域トーン信号と、前記復号済み狭帯域信号のフロア成分を示す信号である低域フロア信号とを生成する分割部と、
前記低域トーン信号を用いて前記高域信号のトーン成分に対応する信号である高域トーン信号を生成するトーン拡張部と、
前記低域フロア信号を用いて前記高域信号のフロア成分に対応する信号である高域フロア信号を生成するフロア拡張部と、
前記トーンパラメータを用いて前記高域トーン信号を調整した調整済みトーン信号を生成するトーン調整部と、
前記フロアパラメータを用いて前記高域フロア信号を調整した調整済みフロア信号を生成するフロア調整部と、
前記コアパラメータから得られる信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した帯域幅拡張信号を生成する加算部とを備える
復号装置。
前記トーン拡張部は、前記低域トーン信号に含まれるトーン成分の高調波成分を示す信号を前記高域トーン信号として生成する
請求項１に記載の復号装置。
さらに、前記復号済み狭帯域信号をサブバンド信号に変換するＱＭＦ分析部を備え、
前記分割部は、前記サブバンド信号を分割することによって、前記低域トーン信号と、前記低域フロア信号とを生成し、
前記加算部は、前記コアパラメータから得られる信号である前記サブバンド信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成する
請求項１に記載の復号装置。
前記トーン拡張部は、前記低域トーン信号におけるサブバンドの中から、トーン成分のエネルギーが（１）隣接するサブバンドのトーン成分のエネルギーの所定倍よりも大きく、かつ、（２）当該サブバンドのフロア成分のエネルギーの所定倍よりも大きいサブバンドを選択し、選択したサブバンドの整数倍のサブバンドに、当該選択したサブバンドの前記低域トーン信号を複製することによって前記高域トーン信号を生成する
請求項３に記載の復号装置。
さらに、
前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、
前記帯域幅拡張信号を時間領域に変換するＱＭＦ合成部とを備える
請求項３または４に記載の復号装置。
前記復号部は、（１）前記コアパラメータを復号してＭＤＣＴ信号を生成し、（２）前記ＭＤＣＴ信号をＭＤＳＴ領域に変換したＭＤＳＴ信号を生成し、（３）生成した前記ＭＤＣＴ信号および前記ＭＤＳＴ信号から得られる複素信号を前記復号済み狭帯域信号として生成し、
前記加算部は、前記コアパラメータから得られる信号である前記ＭＤＣＴ信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した前記帯域幅拡張信号を生成する
請求項１に記載の復号装置。
前記トーン拡張部は、前記低域トーン信号における周波数ビンの中から、トーン成分のエネルギーが隣接する周波数ビンのトーン成分のエネルギーの所定倍よりも大きい周波数ビンを選択し、選択した周波数ビンの整数倍の周波数ビンに、当該選択した周波数ビンの前記低域トーン信号を複製することによって前記高域トーン信号を生成する
請求項６に記載の復号装置。
さらに、
前記ビットストリームから、前記トーンパラメータ、前記フロアパラメータ、および、前記コアパラメータを生成するビットストリーム・デマルチプレクサと、
前記帯域幅拡張信号を時間領域に変換するＩＭＤＣＴ（ＩｎｖｅｒｓｅＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）部とを備える
請求項６または７に記載の復号装置。
ビットストリームを復号する復号方法であって、
前記ビットストリームには、符号化された入力音信号の低域部分であるコアパラメータと、前記入力音信号の高域部分を示す高域信号のうちのトーン成分のエネルギーの大きさを示すトーンパラメータと、前記高域信号のうちの前記トーン成分が除かれた成分であるフロア成分のエネルギーの大きさを示すフロアパラメータとが含まれ、
前記復号方法は、
前記コアパラメータを復号することによって復号済み狭帯域信号を生成する復号ステップと、
前記復号済み狭帯域信号のトーン成分を示す信号である低域トーン信号と、前記復号済み狭帯域信号のフロア成分を示す信号である低域フロア信号とを生成する分割ステップと、
前記低域トーン信号を用いて前記高域信号のトーン成分に対応する信号である高域トーン信号を生成するトーン拡張ステップと、
前記低域フロア信号を用いて前記高域信号のフロア成分に対応する信号である高域フロア信号を生成するフロア拡張ステップと、
前記トーンパラメータを用いて前記高域トーン信号を調整した調整済みトーン信号を生成するトーン調整ステップと、
前記フロアパラメータを用いて前記高域フロア信号を調整した調整済みフロア信号を生成するフロア調整ステップと、
前記コアパラメータから得られる信号、前記調整済みトーン信号、および、前記調整済みフロア信号を加算した帯域幅拡張信号を生成する加算ステップとを含む
復号方法。