JP4708446B2

JP4708446B2 - 符号化装置、復号装置およびそれらの方法

Info

Publication number: JP4708446B2
Application number: JP2008044774A
Authority: JP
Inventors: 正浩押切; 智史山梨; 利幸森井
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2007-03-02
Filing date: 2008-02-26
Publication date: 2011-06-22
Anticipated expiration: 2028-02-26
Also published as: RU2488897C1; CN101611442A; US20140019144A1; US8543392B2; WO2008120437A1; US8935162B2; EP2128860B1; EP2128860A1; JP2009042733A; CN102385866A; CN102394066B; EP2747080B1; BRPI0808705A2; EP2128860A4; US20130332150A1; KR20090117883A; RU2012115551A; EP2747079A3; ES2473277T3; CN102385866B

Description

本発明は、スケーラブル符号化方式の通信システムに使用される符号化装置、復号装置およびそれらの方法に関する。

移動体通信システムでは、電波資源等の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。その一方で、通話音声の品質向上や臨場感の高い通話サービスの実現も望まれており、その実現には、音声信号の高品質化のみならず、より帯域の広いオーディオ信号等、音声信号以外の信号をも高品質に符号化することが望ましい。

このように相反する２つの要求に対し、複数の符号化技術を階層的に統合する技術が有望視されている。この技術は、音声信号に適したモデルで入力信号を低ビットレートで符号化する第１レイヤと、入力信号と第１レイヤの復号信号との差分信号を音声以外の信号にも適したモデルで符号化する第２レイヤとを階層的に組み合わせるものである。このように階層的に符号化を行う技術は、符号化装置から得られるビットストリームにスケーラビリティ性、すなわち、ビットストリームの一部の情報からでも復号信号を得ることができる性質を有するため、一般的にスケーラブル符号化（階層符号化）と呼ばれている。

スケーラブル符号化方式は、その性質から、ビットレートの異なるネットワーク間の通信に柔軟に対応することができるので、ＩＰプロトコルで多様なネットワークが統合されていく今後のネットワーク環境に適したものと言える。

ＭＰＥＧ−４（Moving Picture Experts Group phase-4）で規格化された技術を用いてスケーラブル符号化を実現する例として、例えば、非特許文献１に開示されている技術がある。この技術は、第１レイヤにおいて、音声信号に適したＣＥＬＰ（Code Excited Linear Prediction；符号励振線形予測）符号化を用い、第２レイヤにおいて、原信号から第１レイヤ復号信号を減じた残差信号に対して、ＡＡＣ（Advanced Audio Coder）やＴｗｉｎＶＱ（Transform Domain Weighted Interleave Vector Quantization；周波数領域重み付きインターリーブベクトル量子化）等の変換符号化を用いる。

一方、非特許文献２は、基本構成単位としてモジュール化されたＴｗｉｎＶＱを用いて所望の周波数帯域のＭＤＣＴ係数を階層的に符号化する手法を開示している。当該モジュールを共通化して複数回使用することにより、シンプルかつ自由度の高いスケーラブル符号化を実現できる。この手法では、各階層(レイヤ)の符号化対象となるサブバンドはあらかじめ決められている構成が基本となるが、入力信号の性質に応じて各階層レイヤの符号化対象となるサブバンドの位置をあらかじめ定められた帯域の中で変動させる構成も開示されている。
三木弼一編著、「ＭＰＥＧ−４のすべて」、初版、（株）工業調査会、１９９８年９月３０日、ｐ．１２６−１２７神明夫他、「階層的変換符号化基本モジュールによって構成されるスケーラブル楽音符号化」、電子情報通信学会論文誌A, Vol. J83-A, No.3, pp.241-252, 2000年3月 "AMR Wideband Speech Codec; Transcoding functions", 3GPP TS 26.190, March 2001. "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems", 3GPP2 C.S0052-A, April 2005. "ピッチフィルタリングによる帯域拡張技術を用いた7/10/15 kHz帯域スケーラブル音声符号化方式", 音講論集3-11-4, pp.327-328, March 2004.

しかしながら、出力信号の音声品質を改善する上で、第２レイヤ符号化部のサブバンド（ターゲット周波数帯域）をどのように設定するかが重要となる。非特許文献２に開示の手法に従えば、第２レイヤの符号化対象となるサブバンドはあらかじめ決められている（図２１（Ａ））。この場合、常に所定のサブバンドの品質を上げることになるため、そのサブバンド以外の帯域に誤差成分が集中している場合に十分な音声品質の改善効果は得られないという問題がある。

また、入力信号の性質に応じて、各階層(レイヤ)の符号化対象となるサブバンドの位置をあらかじめ定められた帯域の中で変動させる（図２１（Ｂ））ことが記載されているが、サブバンドの採りえる位置が所定の帯域の中に限定されてしまうので、前述した課題を解決することにはならない。また、仮にサブバンドの採りえる帯域が入力信号の全帯域にわたる（図２１（Ｃ））ようにした場合、サブバンドの位置を特定するための演算量が増加してしまうという問題がある。さらに、レイヤ数を増やしたときに、レイヤ毎にサブバンドの位置を特定する必要があるため、この問題は顕著になる。

本発明は、かかる点に鑑みてなされたものであり、スケーラブル符号化方式において、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができる符号化装置、復号装置およびそれらの方法を提供することを目的とする。

本発明の符号化装置は、入力変換係数に対して符号化処理を行い、第１レイヤ符号化データを生成する第１レイヤ符号化手段と、前記第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号変換係数を生成する第１レイヤ復号手段と、前記入力変換係数と前記第１レイヤ復号変換係数との誤差である第１レイヤ誤差変換係数のうち、前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行い、第２レイヤ符号化データを生成する第２レイヤ符号化手段と、具備し、前記第２レイヤ符号化手段は、全帯域に渡って、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を、所定の第１刻み幅で探索し、特定した第１帯域を示す第１位置情報を生成する第１位置特定手段と、前記第１帯域に渡って、前記第１刻み幅より細かい第２刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第２位置情報を生成する第２位置特定手段と、前記第１位置情報、前記第２位置情報により特定されたターゲット周波数帯域に含まれる前記第１レイヤ誤差変換係数を符号化して符号化情報を生成する符号化手段と、を具備する構成を採る。

本発明の復号装置は、入力変換係数に対して符号化処理を行って得られた第１レイヤ符号化データ、前記第１レイヤ符号化データを復号した第１レイヤ復号変換係数と前記入力変換係数との誤差である第１レイヤ誤差変換係数のうち前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行って得られた第２レイヤ符号化データ、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を示す第１位置情報、および前記第１帯域の中の前記ターゲット周波数帯域を示す第２位置情報を受信する受信手段と、前記第１レイヤ符号化データを復号して第１レイヤ復号変換係数を生成する第１レイヤ復号手段と、前記第１位置情報および前記第２位置情報に基づいて前記ターゲット周波数帯域を特定し、前記第２レイヤ符号化データを復号して第１レイヤ復号誤差変換係数を生成する第２レイヤ復号手段と、前記第１レイヤ復号変換係数と前記第１レイヤ復号誤差変換係数とを加算して第２レイヤ復号変換係数を生成する加算手段と、を具備する構成を採る。

本発明の符号化方法は、入力変換係数に対して符号化処理を行い、第１レイヤ符号化データを生成する第１レイヤ符号化ステップと、前記第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号変換係数を生成する第１レイヤ復号ステップと、前記入力変換係数と前記第１レイヤ復号変換係数との誤差である第１レイヤ誤差変換係数のうち、前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行い、第２レイヤ符号化データを生成する第２レイヤ符号化ステップと、具備し、前記第２レイヤ符号化ステップは、全帯域に渡って、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を、所定の第１刻み幅で探索し、特定した第１帯域を示す第１位置情報を生成する第１位置特定ステップと、前記第１帯域に渡って、前記第１刻み幅より細かい第２刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第２位置情報を生成する第２位置特定ステップと、前記第１位置情報、前記第２位置情報により特定されたターゲット周波数帯域に含まれる前記第１レイヤ誤差変換係数を符号化して符号化情報を生成する符号化ステップと、を具備する方法を採る。

本発明の復号方法は、入力変換係数に対して符号化処理を行って得られた第１レイヤ符号化データ、前記第１レイヤ符号化データを復号した第１レイヤ復号変換係数と前記入力変換係数との誤差である第１レイヤ誤差変換係数のうち前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行って得られた第２レイヤ符号化データ、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を示す第１位置情報、および前記第１帯域の中の前記ターゲット周波数帯域を示す第２位置情報を受信する受信ステップと、前記第１レイヤ符号化データを復号して第１レイヤ復号変換係数を生成する第１レイヤ復号ステップと、前記第１位置情報および前記第２位置情報に基づいて前記ターゲット周波数帯域を特定し、前記第２レイヤ符号化データを復号して第１レイヤ復号誤差変換係数を生成する第２レイヤ復号ステップと、前記第１レイヤ復号変換係数と前記第１レイヤ復号誤差変換係数とを加算して第２レイヤ復号変換係数を生成する加算ステップと、を具備する方法を採る。

本発明によれば、第１位置特定手段より入力信号の全帯域に渡って、相対的に広い帯域幅、および相対的に粗い刻み幅で、誤差が大きい帯域を探索して特定し、第２位置特定手段は、第１位置特定手段により特定された帯域において、相対的に狭い帯域幅、および相対的に細かい刻み幅でターゲット周波数帯域（誤差が最も大きい周波数帯域）を探索して特定することにより、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができ、音質を改善することができる。

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

（実施の形態１）
図１は、本発明の実施の形態１に係る符号化装置の主要な構成を示すブロック図である。図１に示す符号化装置１００は、周波数領域変換部１０１と、第１レイヤ符号化部１０２と、第１レイヤ復号部１０３と、減算部１０４と、第２レイヤ符号化部１０５と、多重化部１０６とを備える。

周波数領域変換部１０１は、時間領域の入力信号を周波数領域の信号（入力変換係数）に変換し、入力変換係数を第１レイヤ符号化部１０２に出力する。

第１レイヤ符号化部１０２は、入力変換係数に対して符号化処理を行い、第１レイヤ符号化データを生成し、この第１レイヤ符号化データを第１レイヤ復号部１０３および多重化部１０６に出力する。

第１レイヤ復号部１０３は、第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号変換係数を生成し、減算部１０４に出力する。

減算部１０４は、入力変換係数から第１レイヤ復号部１０３で生成された第１レイヤ復号変換係数を減じて第１レイヤ誤差変換係数を生成し、この第１レイヤ誤差変換係数を第２レイヤ符号化部１０５に出力する。

第２レイヤ符号化部１０５は、減算部１０４より出力された第１レイヤ誤差変換係数の符号化処理を行い、第２レイヤ符号化データを生成し、この第２レイヤ符号化データを多重化部１０６に出力する。

多重化部１０６は、第１レイヤ符号化部１０２で求められる第１レイヤ符号化データと第２レイヤ符号化部１０５で求められる第２レイヤ符号化データを多重化してビットストリームを形成し、これを最終的な符号化データとして通信路に出力する。

図２は、図１に示した第２レイヤ符号化部１０５の構成を示すブロック図である。図２に示す第２レイヤ符号化部１０５は、第１位置特定部２０１と、第２位置特定部２０２と、符号化部２０３と、多重化部２０４とを備える。

第１位置特定部２０１は、減算部１０４から入力される第１レイヤ誤差変換係数を用いて、符号化の対象となるターゲット周波数帯域が採り得る帯域を、所定の帯域幅および所定の刻み幅で探索し、特定した帯域を示す情報を第１位置情報として、第２位置特定部２０２、符号化部２０３および多重化部２０４へ出力する。なお、第１位置特定部２０１の詳細については後述する。なお、この特定した帯域を、「範囲」もしくは「領域」などと言うこともできる。

第２位置特定部２０２は、第１位置特定部２０１より特定された帯域の中から、第１位置特定部２０１での帯域幅より狭い帯域幅、および第１位置特定部２０１での刻み幅より細かい刻み幅でターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す情報を第２位置情報として、符号化部２０３および多重化部２０４へ出力する。なお、第２位置特定部２０２の詳細については後述する。

符号化部２０３は、第１位置情報および第２位置情報により特定されたターゲット周波数帯域に含まれる第１レイヤ誤差変換係数を符号化し、符号化情報を生成して多重化部２０４に出力する。なお、符号化部２０３の詳細については後述する。

多重化部２０４は、第１位置情報、第２位置情報、符号化情報を多重化し、第２レイヤ符号化データを生成して出力する。なお、この多重化部２０４は必須ではなく、これらの情報を直接図１に示す多重化部１０６に出力しても良い。

図３は、図２に示した第１位置特定部２０１が特定する帯域を示す図である。

図３では、第１位置特定部２０１は、予め所定の帯域幅で設定される３つの帯域の中から１つを特定し、この帯域の位置情報を第１位置情報として、第２位置特定部２０２、符号化部２０３および多重化部２０４に出力する。図３に示す各帯域はターゲット周波数帯域以上の帯域幅を持つように設定される（帯域１はＦ_１以上Ｆ_３未満、帯域２はＦ_２以上Ｆ_４未満、帯域３はＦ_３以上Ｆ_５未満としている）。なお、本実施の形態では各帯域は同一の帯域幅を持つように設定されているが、各帯域が異なる帯域幅を持つように設定しても良い。例えば、人間の聴覚の臨界帯域幅のように、低域に位置する帯域の帯域幅は狭く、高域に位置する帯域の帯域幅は広くなるように設定しても良い。

次いで、第１位置特定部２０１による帯域の特定方法について説明する。ここでは、第１位置特定部２０１は、第１レイヤ誤差変換係数のエネルギーの大きさを基準に帯域を特定する。第１レイヤ誤差変換係数をｅ_１（ｋ）と示し、各帯域に含まれる第１レイヤ誤差変換係数のエネルギーＥ_Ｒ（ｉ）を次式（１）により算出する。

ここで、ｉは帯域を特定する識別子、ＦＲＬ（ｉ）は帯域ｉの最低域周波数、ＦＲＨ（ｉ)は帯域ｉの最高域周波数を表す。

このように、第１レイヤ誤差変換係数のエネルギーが大きい帯域を特定し、誤差が大きい帯域に含まれる第１レイヤ誤差変換係数を符号化することにより、入力信号に対する復号信号の誤差が小さくなり、音声品質を改善することができる。

なお、第１レイヤ誤差変換係数のエネルギーの代わりに、次式（２）のように帯域幅で正規化した正規化エネルギーＮＥ_Ｒ（ｉ）を算出しても良い。

また、帯域を特定する基準として、第１レイヤ誤差変換係数のエネルギーの代わりに、人間の聴感特性を反映した重み付けが行われた第１レイヤ誤差変換係数のエネルギーＷＥ_Ｒ（ｉ）、ＷＮＥ_Ｒ（ｉ）（帯域幅で正規化した正規化エネルギー）を、式（３）、（４）により算出しても良い。ここで、ｗ（ｋ）は人間の聴感特性に関連する重みを表す。

この場合、第１位置特定部２０１は、聴感特性上、重要度の高い周波数には重みを大きくして、その周波数を含む帯域が選択されやすいようにし、一方、重要度の低い周波数には重みを小さくして、その周波数を含む帯域が選択されにくいようにする。これにより、聴感的に重要な帯域が優先的に選択されるため、上記同様の音質改善の効果を得ることができる。この重みとして、例えば、入力信号または第１レイヤの復号信号を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。

また、帯域の選択法において、周波数が予め設定された基準周波数（Ｆｘ）よりも低い低域部に配置された帯域の中から帯域を選択するようにしても良い。図４の例では、帯域１〜帯域８の中から帯域を選択する。帯域の選択に制限（基準周波数）を設定する理由は次の通りである。音声信号の特徴の１つである調波構造またはハーモニクス構造（ある周波数間隔でスペクトルがピーク状に現れる構造）は、高域部に比べて低域部のピークが大きく現れ、符号化処理によって生じる量子化誤差（誤差スペクトルまたは誤差変換係数）においても同様に、高域部よりは低域部のピーク性が強くなる。そのため、たとえ、低域部の誤差スペクトル（誤差変換係数）のエネルギーが高域部と比べて小さくても、低域部の誤差スペクトル（誤差変換係数）のピーク性が高域部に比べ強くなる傾向にあることから、低域部の誤差スペクトル（誤差変換係数）が聴覚マスキング閾値（人間が音を感じ取ることのできる閾値）を超えやすくなり、その結果、聴感的な音質劣化を引き起こす。

この方法によれば、基準周波数を予め設定することにより、周波数が基準周波数（Ｆｘ）よりも高い高域部と比べて、誤差変換係数（または誤差ベクトル）のピーク性が強い低域部からターゲット周波数が決定されるため、誤差変換係数のピークを抑えることができ、音質を改善することができる。

さらに、帯域の選択法において、低中域部に配置されている帯域の中から帯域を選択するようにしても良い。図３の例では、帯域３は選択候補から除外し、帯域１および帯域２の中から帯域を選択する。これにより、低中域部の中からターゲット周波数帯域が決定されることになる。

以下では、第１位置特定部２０１は、帯域１を特定した場合に「１」を、帯域２を特定した場合に「２」を、帯域３を特定した場合に「３」を第１位置情報として出力する。

図５は、図２に示した第２位置特定部２０２が特定するターゲット周波数帯域の位置を示す図である。

第２位置特定部２０２は、第１位置特定部２０１により特定された帯域において、さらに細かい刻み幅でターゲット周波数帯域を特定し、そのターゲット周波数帯域の位置情報を第２位置情報として符号化部２０３および多重化部２０４に出力する。

次いで、第２位置特定部２０２によるターゲット周波数帯域の特定方法を説明する。ここでは、図２に示す第１位置特定部２０１から出力される第１位置情報が「２」である場合を例にして、ターゲット周波数帯域の幅をＢＷとする。また、帯域２の最低周波数Ｆ_２を起点にし、この最低周波数Ｆ_２を便宜上Ｇ_１とする。そして、第２位置特定部２０２が特定することができるターゲット周波数帯域の最低周波数をＧ_２〜Ｇ_Ｎとする。なお、第２位置特定部２０２が特定するターゲット周波数帯域の刻み幅はＧ_ｎ−Ｇ_ｎ−１であり、一方、第１位置特定部２０１が特定する帯域の刻み幅はＦ_ｎ−Ｆ_ｎ−１（Ｇ_ｎ−Ｇ_ｎ−１＜Ｆ_ｎ−Ｆ_ｎ−１）である。

第２位置特定部２０２は、最低周波数がそれぞれＧ_１、…、Ｇ_Ｎのターゲット周波数帯域候補から、第１レイヤ誤差変換係数のエネルギー又はそれに類する基準で、ターゲット周波数帯域を特定する。例えば、全てのＧ_ｎ個のターゲット周波数帯域候補について、式（５）により第１レイヤ誤差変換係数のエネルギーを算出し、算出されたエネルギーＥ_Ｒ（ｎ）が最大であるターゲット周波数帯域を特定し、このターゲット周波数帯域の位置情報を第２位置情報として出力する。

なお、上記説明したように、人間の聴感特性を反映した重み付けが行われた第１レイヤ誤差変換係数のエネルギーＷＥ_Ｒ（ｎ）が基準となる場合、次式（６）によりＷＥ_Ｒ（ｎ）の算出を行う。ここで、ｗ（ｋ）は人間の聴感特性に関連する重みを表す。この重みとして、例えば、入力信号または第１レイヤの復号信号を基に算出された聴覚マスキング閾値や、人間の聴覚のラウドネス特性を利用して求めたものを用いても良い。

この場合、第２位置特定部２０２は、聴感特性上、重要度の高い周波数には重みを大きくして、その周波数を含むターゲット周波数帯域が選択されやすいようにし、一方、重要度の低い周波数には重みを小さくして、その周波数を含むターゲット周波数帯域が選択されにくいようにする。これにより、聴感的に重要なターゲット周波数帯域が優先的に選択されるため、音質をさらに改善することができる。

図６は、図２に示した符号化部２０３の構成を示すブロック図である。図６に示す符号化部２０３は、目標信号構成部３０１と、誤差算出部３０２と、探索部３０３と、形状符号帳３０４と、ゲイン符号帳３０５とを備える。

目標信号構成部３０１は、第１位置特定部２０１から入力される第１位置情報と第２位置特定部２０２から入力される第２位置情報とを使用してターゲット周波数帯域を特定し、減算部１０４から入力される第１レイヤ誤差変換係数からターゲット周波数帯域に含まれる部分を抽出し、抽出された第１レイヤ誤差変換係数を目標信号として誤差算出部３０２に出力する。この第１誤差変換係数をｅ_１（ｋ）と表す。

誤差算出部３０２は、誤差変換係数の形状を表す候補（形状候補）を格納する形状符号帳３０４から入力される第ｉ番目の形状候補、誤差変換係数のゲインを表す候補（ゲイン候補）を格納するゲイン符号帳３０５から入力される第ｍ番目のゲイン候補、および目標信号構成部３０１から入力される目標信号に基づいて、次式（７）により誤差Ｅを算出し、算出された誤差Ｅを探索部３０３に出力する。

ここで、ｓｈ（ｉ，ｋ）は第ｉ番目の形状候補、ｇａ（ｍ）は第ｍ番目のゲイン候補を表す。

探索部３０３は、誤差算出部３０２により算出された誤差Ｅを基に、誤差Ｅが最小である形状候補とゲイン候補との組み合わせを探索し、探索結果である形状情報とゲイン情報とを符号化情報として、図２に示す多重化部２０４に出力する。ここで、形状情報は誤差Ｅを最小にするときのパラメータｍ、ゲイン情報は誤差Ｅを最小にするときのパラメータｉを指す。

なお、誤差算出部３０２は、聴感的に重要なスペクトルに大きな重み付けを行うことにより聴感的に重要なスペクトルの影響を大きくし、次式（８）により誤差Ｅを求めても良い。ここで、ｗ（ｋ）は人間の聴感特性に関連する重みを表す。

このように、聴感特性上、重要度の高い周波数には重みを大きくして、聴感特性上、重要度の高い周波数の量子化歪の影響を大きくし、一方、重要度の低い周波数には重みを小さくして、重要度の低い周波数の量子化歪の影響を小さくすることにより、主観品質を改善することができる。

図７は、本実施の形態に係る復号装置の主要な構成を示すブロック図である。図７に示す復号装置６００は、分離部６０１と、第１レイヤ復号部６０２と、第２レイヤ復号部６０３と、加算部６０４と、切替部６０５と、時間領域変換部６０６と、ポストフィルタ６０７とを備える。

分離部６０１は、通信路を介して入力されるビットストリームを、第１レイヤ符号化データと第２レイヤ符号化データとに分離して、それぞれ第１レイヤ符号化データを第１レイヤ復号部６０２へ、第２レイヤ符号化データを第２レイヤ復号部６０３へ出力する。また、分離部６０１は、入力されるビットストリームに第１レイヤ符号化データおよび第２レイヤ符号化データの両者が含まれる場合には、「２」をレイヤ情報として切替部６０５に出力する。一方、分離部６０１は、ビットストリームに第１レイヤ符号化データしか含まれていない場合には、「１」をレイヤ情報として切替部６０５に出力する。なお、全ての符号化データが廃棄されている場合もあるが、その場合は各レイヤの復号部は所定の誤り補償処理を行い、ポストフィルタはレイヤ情報が「１」として処理を行うものとする。本実施の形態では、復号装置において、全ての符号化データまたは第２レイヤ符号化データが廃棄された符号化データのいずれかが得られることを前提として説明を行う。

第１レイヤ復号部６０２は、第１レイヤ符号化データの復号処理を行い、第１レイヤ復号変換係数を生成し、加算部６０４および切替部６０５に出力する。

第２レイヤ復号部６０３は、第２レイヤ符号化データの復号処理を行い、第１レイヤ復号誤差変換係数を生成し、加算部６０４に出力する。

加算部６０４は、第１レイヤ復号変換係数と第１レイヤ復号誤差変換係数を加算して第２レイヤ復号変換係数を生成し、切替部６０５に出力する。

切替部６０５は、分離部６０１から入力されるレイヤ情報に基づき、レイヤ情報が「１」の場合には第１レイヤ復号変換係数を、レイヤ情報が「２」の場合には第２レイヤ復号変換係数を、復号変換係数として時間領域変換部６０６に出力する。

時間領域変換部６０６は、復号変換係数を時間領域の信号に変換し復号信号を生成し、ポストフィルタ６０７に出力する。

ポストフィルタ６０７は、時間領域変換部６０６から出力される復号信号に対して、ポストフィルタ処理を行って、出力信号を生成する。

図８は、図７に示した第２レイヤ復号部６０３の構成を示す図である。図８に示す第２レイヤ復号部６０３は、形状符号帳７０１と、ゲイン符号帳７０２と、乗算部７０３と、配置部７０４とを備える。

形状符号帳７０１は、分離部６０１から出力された第２レイヤ符号化データに含まれる形状情報を基に形状候補ｓｈ（ｉ，ｋ）を選択して、乗算部７０３に出力する。

ゲイン符号帳７０２は、分離部６０１から出力された第２レイヤ符号化データに含まれるゲイン情報を基にゲイン候補ｇａ（ｍ）を選択して、乗算部７０３に出力する。

乗算部７０３は、形状候補ｓｈ（ｉ，ｋ）にゲイン候補ｇａ（ｍ）を乗じ、配置部７０４に出力する。

配置部７０４は、分離部６０１から出力された第２レイヤ符号化データに含まれる第１位置情報と第２位置情報とにより特定されるターゲット周波数帯域に、乗算部７０３から入力されるゲイン候補乗算後の形状候補を配置し、第１レイヤ復号誤差変換係数として、加算部６０４に出力する。

図９は、図８に示した配置部７０４から出力される第１レイヤ復号誤差変換係数の様子を示す図である。ここで、Ｆ_ｍは第１位置情報により特定される周波数、Ｇ_ｎは第２位置情報により特定される周波数を表す。

このように、本実施の形態によれば、第１位置特定部２０１が、入力信号の全帯域に渡って、所定の帯域幅および所定の刻み幅で誤差が大きい帯域を探索して特定し、第２位置特定部２０２は、第１位置特定部２０１により特定された帯域において、上記所定の帯域幅より狭い帯域幅、および上記所定の刻み幅より細かい刻み幅でターゲット周波数帯域を探索して特定することにより、全帯域の中から誤差が大きい帯域を少ない演算量で正確に特定することができ、音質を改善することができる。

（実施の形態２）
実施の形態２では、第２位置特定部２０２によるターゲット周波数帯域の別の特定方法について説明する。図１０は、図２に示した第２位置特定部２０２が特定するターゲット周波数の位置を示す図である。本実施の形態に係る符号化装置の第２位置特定部は、実施の形態１で説明した符号化装置の第２位置特定部と異なっており、単一のターゲット周波数を特定する。単一のターゲット周波数に対応する誤差変換係数の形状候補はパルス（または線スペクトル）で表される。なお、本実施の形態において、符号化装置の構成は、符号化部２０３の内部構成を除いて、図１に示した符号化装置と同一であり、復号装置の構成は第２レイヤ復号部６０３の内部構成を除いて、図７に示した復号装置と同一であるので、これらの説明を省略し、第２位置特定に関連する符号化部２０３及び復号装置の第２レイヤ復号部６０３のみについて説明する。

本実施の形態では、第２位置特定部２０２は、第１位置特定部２０１により特定された帯域において、単一のターゲット周波数を特定する。従って、本実施の形態では、単一の第１レイヤ誤差変換係数が符号化の対象として選択される。ここでは、第１位置特定部２０１が帯域２を特定した場合を例にして説明する。ターゲット周波数帯域の帯域幅をＢＷとした場合、本実施の形態ではＢＷ＝１である。

具体的に、第２位置特定部２０２は、図１０に示すように、帯域２に含まれる複数のターゲット周波数候補Ｇ_Ｎに対して、上記の式（５）により、それぞれの第１レイヤ誤差変換係数のエネルギーを算出し、または上記の式（６）により、それぞれの人間の聴感特性を反映した重み付けが行われた第１レイヤ誤差変換係数のエネルギーを算出する。また、第２位置特定部２０２は、算出したエネルギーが最大となるターゲット周波数Ｇ_ｎ（１≦ｎ≦Ｎ）を特定し、特定されたターゲット周波数Ｇ_ｎの位置情報を第２位置情報として符号化部２０３に出力する。

図１１は、図６に示した符号化部２０３の別の態様の構成を示すブロック図である。図１１に示す符号化部２０３は、図６に対して形状符号帳３０５を削除した構成を採る。なお、この構成は形状符号帳３０４から出力される信号が常に「１」の場合に相当する。

符号化部２０３は、第２位置特定部２０２で特定されたターゲット周波数Ｇ_ｎに含まれる第１レイヤ誤差変換係数を符号化し、符号化情報を生成して多重化部２０４に出力する。ここでは、第２位置特定部２０２から入力されるターゲット周波数は単一であり、符号化の対象となる第１レイヤ誤差変換係数も単一となるので、符号化部２０３は形状符号帳３０４からの形状情報を必要とせず、ゲイン符号帳３０５のみで探索を行い、探索結果のゲイン情報を符号化情報として、多重化部２０４に出力する。

図１２は、図８に示した第２レイヤ復号部６０３の別の態様の構成を示すブロック図である。図１２に示す第２レイヤ復号部６０３は、図８に対して、形状符号帳７０１と乗算部７０３とを削除した構成を採る。なお、この構成は形状符号帳７０１から出力される信号が常に「１」である場合に相当する。

配置部７０４は、分離部６０１から出力された第２レイヤ符号化データに含まれる第１位置情報と第２位置情報とにより特定される単一のターゲット周波数に、ゲイン情報によりゲイン符号帳から選択したゲイン候補を配置し、第１レイヤ復号誤差変換係数として、加算部６０４に出力する。

このように、本実施の形態によれば、第２位置特定部２０２は、第１位置特定部２０１により特定された帯域の中から単一のターゲット周波数を特定することにより、線スペクトルを正確に表すことができるため、母音のようなトーナリティの強い信号（多数のピークが観察されるスペクトル特性を有する信号）の音質を改善することができる。

（実施の形態３）
実施の形態３では、第２位置特定部によるターゲット周波数帯域の別の特定方法について説明する。なお、本実施の形態において、符号化装置の構成は、第２レイヤ符号化部１０５の内部構成を除いて、図１に示した符号化装置と同一であるので、その説明を省略する。

図１３は、本実施の形態に係る符号化装置の第２レイヤ符号化部１０５の構成を示すブロック図である。図１３に示す第２レイヤ符号化部１０５は、図２に対して、第２位置特定部２０２に代えて、第２位置特定部３０１を備える構成を採る。図２に示した第２レイヤ符号化部１０５と同一の構成には同一の番号を付し、その説明を省略する。

図１３に示す第２位置特定部３０１は、第１サブ位置特定部３１１−１と、第２サブ位置特定部３１１−２と、…、第Ｊサブ位置特定部３１１−Ｊと、多重化部３１２とを備える。

複数のサブ位置特定部（３１１−１、…、３１１−Ｊ）は、第１位置特定部２０１より特定された帯域において、それぞれ異なるターゲット周波数を特定する。具体的には、第ｎ番目のサブ位置特定部３１１−ｎは、第１位置特定部２０１より特定された帯域から第１〜第ｎ−１番目のサブ位置特定部（３１１−１、…、３１１−ｎ−１）が特定したターゲット周波数を除いた帯域において、第ｎ番目のターゲット周波数を特定する。

図１４は本実施の形態に係る符号化装置の複数のサブ位置特定部（３１１−１、…、３１１−Ｊ）が特定するターゲット周波数の位置を示す図である。ここでは、第１位置特定部２０１が帯域２を特定し、第２位置特定部３０１によりＪ個のターゲット周波数の位置を特定する場合を例にして説明する。

図１４（Ａ）に示すように、第１サブ位置特定部３１１−１は、帯域２におけるターゲット周波数候補の中から１つのターゲット周波数を特定し（ここではＧ_３）、そのターゲット周波数の位置情報を多重化部３１２に出力するとともに第２サブ位置特定部３１１−２に出力する。

図１４（Ｂ）に示すように、第２サブ位置特定部３１１−２は、帯域２から第１サブ位置特定部３１１−１が特定したターゲット周波数Ｇ_３を除いたターゲット周波数の候補の中から１つのターゲット周波数を特定し（ここではＧ_Ｎ−１）、そのターゲット周波数の位置情報を多重化部３１２に出力するとともに第３サブ位置特定部３１１−３に出力する。

同様に、図１４（Ｃ）に示すように、第Ｊサブ位置特定部３１１−Ｊは、帯域２から第１〜第Ｊ−１サブ位置特定部（３１１−１、…、３１１−Ｊ−１）が特定したＪ−１個のターゲット周波数を除いたターゲット周波数の候補の中から１つのターゲット周波数を選択し（ここではＧ_５）、それを特定する位置情報を多重化部３１２に出力する。

多重化部３１２は、サブ位置特定部（３１１−１、…３１１−Ｊ）から入力されるＪ個の位置情報を多重して第２位置情報を生成し、符号化部２０３と多重化部２０４に出力する。なお、この多重化部３１２は必須ではなく、Ｊ個の位置情報を直接符号化部２０３および多重化部２０４に出力しても良い。

このように、第２位置特定部３０１は、第１位置特定部２０１により特定された帯域において、Ｊ個のターゲット周波数を特定し、複数個のピークを表現することができるため、母音のようなトーナリティの強い信号の音質を更に改善することができる。また、第１位置特定部２０１により特定された帯域の中からJ個のターゲット周波数を決定すれば良いため、全帯域の中からJ個のターゲット周波数を決定する場合に比べて、複数個のターゲット周波数の組み合わせ数を大幅に削減することできる。これにより、低ビットレート化および低演算量化を実現することができる。

（実施の形態４）
実施の形態４では、第２レイヤ符号化部１０５における別の符号化方法について説明する。なお、本実施の形態において、符号化装置の構成は、第２レイヤ符号化部１０５の内部構成を除いて、図１に示した符号化装置と同一であるので、その説明を省略する。

図１５は、本実施の形態に係る符号化装置の他の態様の第２レイヤ符号化部１０５の構成を示すブロック図である。図１５に示す第２レイヤ符号化部１０５は、図２に示した第２位置特定部２０２を有さず、更に、図２に示した符号化部２０３に代えて符号化部２２１を備える構成を採る。

符号化部２２１は、ターゲット周波数に含まれる誤差変換係数の符号化の際に生じる量子化歪が最小となるように第２位置情報を決定する。この第２位置情報は第２位置情報符号帳３２１に記憶されている。

図１６は、図１５に示した符号化部２２１の構成を示すブロック図である。図１６に示す符号化部２２１は、図６に示した符号化部２０３に対して第２位置情報符号帳３２１を追加し、探索部３０３に代えて探索部３２２を備える構成を採る。なお、図６に示した符号化部２０３と同一の構成には同一の番号を付し、その説明を省略する。

第２位置情報符号帳３２１は、後述する探索部３２２からの制御信号に従い、記憶している第２位置情報の候補から１つの第２位置情報を選択し、目標信号構成部３０１に出力する。図１６の第２位置情報符号帳３２１では、黒点はそれぞれの第２位置情報候補のターゲット周波数の位置を表す。

目標信号構成部３０１は、第１位置特定部２０１から入力される第１位置情報と第２位置情報符号帳３２１において選択された第２位置情報を用いてターゲット周波数を特定し、減算部１０４から入力される第１レイヤ誤差変換係数から特定したターゲット周波数に含まれる部分を抽出し、抽出された第１レイヤ誤差変換係数を目標信号として誤差算出部３０２に出力する。

探索部３２２は、誤差算出部３０２から入力される誤差Ｅを基に、誤差Ｅが最小となる形状候補とゲイン候補、そして第２位置情報候補の組み合わせを探索し、探索結果の形状情報、ゲイン情報および第２位置情報を符号化情報として、図１５に示す多重化部２０４に出力する。また、探索部３２２は、第２位置情報候補を選択して目標信号構成部３０１に出力するという制御信号を第２位置情報符号帳３２１に出力する。

このように、本実施の形態によれば、ターゲット周波数に含まれる誤差変換係数の符号化の際に生じる量子化歪が最小となるように第２位置情報を決定するので、最終的な量子化歪が小さくなるため、音声品質を改善することができる。

なお、本実施の形態では、図１６に示した第２位置情報符号帳３２１が、単一のターゲット周波数を要素として持つ第２位置情報候補を記憶する例について説明したが、本発明はこれに限らず、図１７に示すように第２位置情報符号帳３２１は、複数個のターゲット周波数を要素として持つ第２位置情報候補を記憶しても良い。図１７は、第２位置情報符号帳３２１に記憶している第２位置情報候補がそれぞれ３つのターゲット周波数を持つ場合の符号化部２２１を示す図である。

また、本実施の形態では、図１６に示した誤差算出部３０２が、形状符号帳３０４およびゲイン符号帳３０５に基づいて誤差Ｅを算出する例について説明したが、本発明はこれに限らず、図１８に示すように形状符号帳３０４を削除し、ゲイン符号帳３０５のみに基づいて誤差Ｅを算出してもよい。図１８は、図１５に示した符号化部２２１の別の構成を示すブロック図である。この構成は、形状符号帳３０４から出力される信号が常に「１」である場合に相当する。この場合、形状が複数個のパルスで構成され、形状符号帳３０４は不要になるため、探索部３２２はゲイン符号帳３０５および第２位置情報符号帳３２１のみを探索し、探索結果のゲイン情報および第２位置情報を符号化情報として、図１５に示した多重化部２０４に出力する。

なお、本実施の形態では、第２位置情報符号帳３２１が、実際に記憶領域を確保して第２位置情報候補を記憶する形態を採ることを前提に説明したが、本発明はこれに限らず、第２位置情報符号帳３２１が、あらかじめ定められた処理手順に従い第２位置情報候補を生成するようにしても良い。この場合、第２位置情報符号帳３２１には記憶領域が不用となる。

（実施の形態５）
実施の形態５では、第１位置特定部による帯域の別の特定方法について説明する。なお、本実施の形態において、符号化装置の構成は、第２レイヤ符号化部１０５の内部構成を除いて、図１に示した符号化装置と同一であるので、その説明を省略する。

図１９は本実施の形態に係る符号化装置の第２レイヤ符号化部１０５の構成を示すブロック図である。図１９示す第２レイヤ符号化部１０５は、図２に示した第１位置特定部２０１に代えて、第１位置特定部２３１を備える構成を採る。

図示せぬ算出部は、入力信号に対してピッチ分析し、ピッチ周期を求め、求められたピッチ周期の逆数からピッチ周波数を算出する。なお、算出部は、第１レイヤ符号化部１０２の符号化処理によって生成された第１レイヤ符号化データからピッチ周波数を算出してもよい。この場合、第１レイヤ符号化データが送信されるため、ピッチ周波数を特定する情報を別途送信する必要がなくなる。また、算出部は、ピッチ周期を特定するピッチ周期情報を多重化部１０６に出力する。

第１位置特定部２３１は、図示せぬ算出部から入力されるピッチ周波数に基づいて、所定の相対的に広い帯域幅で帯域を特定し、特定された帯域の位置情報を第１位置情報として第２位置特定部２０２、符号化部２０３および多重化部２０４に出力する。

図２０は、図１９に示した第１位置特定部２３１が特定する帯域の位置を示す図である。図２０に示す３つの帯域は、入力されるピッチ周波数ＰＦを基に定められる基準周波数Ｆ_１〜Ｆ_３の整数倍の近傍の帯域である。基準周波数は、ピッチ周波数ＰＦに所定の値を加えて求められる周波数である。具体的な例として、ここでは−１、０、１をＰＦに加えた値とし、基準周波数はＦ_１＝ＰＦ−１、Ｆ_２＝ＰＦ、Ｆ_３＝ＰＦ＋１となる。

ピッチ周波数の整数倍を基準とした帯域を設定する理由は、音声信号には、特にピッチ周期性の強い母音部において、ピッチ周期の逆数(ピッチ周波数)の整数倍近傍にスペクトルのピークが立つという特徴（調波構造またはハーモニクス）があり、また、第１レイヤ誤差変換係数においてもピッチ周波数の整数倍近傍に大きな誤差が生じやすいからである。

このように、本実施の形態によれば、第１位置特定部２３１は、ピッチ周波数の整数倍近傍の帯域を特定するため、最終的に第２位置特定部２０２により特定されるターゲット周波数はピッチ周波数の近傍になるので、少ない演算量で音声品質を改善することができる。

（実施の形態６）
実施の形態６では、符号化処理において、高域部を雑音などによる近似信号で代用する方法を用いる第１レイヤ符号化部を有する符号化装置に、本発明による符号化方法を適用する場合について説明する。図２２は本実施の形態に係る符号化装置２２０の主要な構成を示すブロック図である。図２２に示す符号化装置２２０は、第１レイヤ符号化部２２０１と、第１レイヤ復号部２２０２と、遅延部２２０３と、減算部１０４と、周波数領域変換部１０１と、第２レイヤ符号化部１０５と、多重化部１０６とを備える。なお、図２２の符号化装置２２０において、図１に示した符号化装置１００と同様の構成要素には同一の番号を付し、その説明を省略する。

本実施の形態の第１レイヤ符号化部２２０１は、高域部を雑音などによる近似信号で代用する方式を採用する。具体的には、聴感的に重要度の低い高域部を近似信号で表し、その代わりに聴感的に重要な低域部（または低中域部）のビット配分を増やしてこの帯域の原信号に対する忠実度を向上させる。これにより、全体的な音質の向上を図る。例えば、ＡＭＲ−ＷＢ方式(非特許文献３)やＶＭＲ−ＷＢ方式(非特許文献４)が挙げられる。

第１レイヤ符号化部２２０１は、入力信号を符号化して第１レイヤ符号化データを生成し、多重化部１０６及び第１レイヤ復号部２２０２に出力する。なお、第１レイヤ符号化部２２０１の詳細については後述する。

第１レイヤ復号部２２０２は、第１レイヤ符号化部２２０１から入力される第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号信号を生成し、減算部１０４に出力する。なお、第１レイヤ復号部２２０２の詳細については後述する。

次いで、図２３を用いて、第１レイヤ符号化部２２０１の詳細について説明する。図２３は符号化装置２２０の第１レイヤ符号化部２２０１の構成を示すブロック図である。図２３に示すように、第１レイヤ符号化部２２０１は、ダウンサンプリング部２２１０と、コア符号化部２２２０とから構成される。

ダウンサンプリング部２２１０は、時間領域の入力信号をダウンサンプリングして、所望のサンプリングレートに変換し、ダウンサンプリングした時間領域信号をコア符号化部２２２０に出力する。

コア符号化部２２２０は、ダウンサンプリング部２２１０の出力信号に対して符号化処理を行い、第１レイヤ符号化データを生成し、第１レイヤ復号部２２０２及び多重化部１０６に出力する。

次いで、図２４を用いて第１レイヤ復号部２２０２の詳細について説明する。図２４は符号化装置２２０の第１レイヤ復号部２２０２の構成を示すブロック図である。図２４に示すように、第１レイヤ復号部２２０２は、コア復号部２２３０と、アップサンプリング部２２４０と、高域成分付与部２２５０と、から構成される。

コア復号部２２３０は、コア符号化部２２２０から入力される第１レイヤ符号化データを用いて復号処理を行って復号信号を生成し、アップサンプリング部２２４０に出力するとともに、復号処理によって求められた復号ＬＰＣ係数を高域成分付与部２２５０に出力する。

アップサンプリング部２２４０は、コア復号部２２３０から出力された復号信号をアップサンプリングして、入力信号と同じサンプリングレートに変換し、アップサンプリング後の信号を高域成分付与部２２５０に出力する。

高域成分付与部２２５０は、ダウンサンプリング部２２４０よりアップサンプリングされた信号に対して、例えば非特許文献３および非特許文献４に記載されている方法により高域成分の近似信号を生成し、欠損した高域部を補う。

図２５は、本実施の形態に係る符号化装置に対応する復号装置の主要な構成を示すブロック図である。図２５の復号装置２５０は、図７に示した復号装置６００と同様の基本構成を有しており、第１レイヤ復号部６０２に代えて、第１レイヤ復号部２５０１を備える。第１レイヤ復号部２５０１は符号化装置の第１レイヤ復号部２２０２と同様に、図示せぬコア復号部、アップサンプリング部及び高域成分付与部から構成される。ここでは、それらについての詳細な説明を省略する。

コア復号部より与えられる復号ＬＰＣ係数によって構成される合成フィルタに、雑音信号のような符号化部および復号部で付加情報なしに生成できる信号を通し、合成フィルタの出力信号を高域成分の近似信号に用いる。このとき、入力信号の高域成分と第１レイヤ復号信号の高域成分が全く異なる波形となるため、減算部で求められる誤差信号の高域成分のエネルギーは入力信号の高域成分のエネルギーよりもむしろ大きくなってしまう。これにより、第２レイヤ符号化部では、聴感的な重要度が低い高域部に配置された帯域が選択されやすくなるという問題が生じる。

本実施の形態によれば、上記のように第１レイヤ符号化部２２０１の符号化処理において、高域部を雑音などによる近似信号で代用する方法を用いる符号化装置２２０において、予め設定された基準周波数よりも周波数が低い低域部から帯域を選択することにより、誤差信号（又は誤差変換係数）の高域部のエネルギーが増大されても、聴覚的な感度の高い低域部を第２レイヤ符号化部の符号化対象として選択することできるため、音質を改善することができる。

なお、本実施の形態では、高域部に関する情報を復号部に送らない構成を例にして説明したが、本発明はこれに限らず、例えば、非特許文献５のように高域部の信号を低域部に比べて低ビットレートで符号化して復号部に送る構成であっても良い。

また、図２２に示す符号化装置２２０において、減算部１０４は、時間領域の信号同士の差をとる構成であるが、減算部は周波数領域の変換係数同士の差をとる構成にしても良い。この場合、周波数領域変換部１０１を遅延部２２０３と減算部１０４の間に配置して入力変換係数を求め、第１レイヤ復号部２２０２と減算部１０４の間に周波数領域変換部１０１を新たに追加して第１レイヤ復号変換係数を求める。そして、減算部１０４は入力変換係数と第１レイヤ復号変換係数の差をとり、その誤差変換係数を第２レイヤ符号化部に直接与える構成となる。この構成によれば、ある帯域では差をとり別の帯域では差はとらないなど、各帯域に適した減算処理が可能になり、音質をさらに改善することができる。

（実施の形態７）
実施の形態７では、他の構成の符号化装置及び復号装置において、本発明による符号化方法を適用する場合について説明する。図２６は、本実施の形態に係る符号化装置２６０の主要な構成を示すブロック図である。

図２６に示す符号化装置２６０は、図２２に示した符号化装置２２０に対して、重みフィルタ部２６０１を追加した構成を有する。なお、図２６の符号化装置２６０において、図２２と同様の構成要素については同一の番号を付し、その説明を省略する。

重みフィルタ部２６０１は、減算部１０４から入力される誤差信号に聴感的な重み付けをするフィルタ処理を行い、フィルタ処理後の信号を周波数領域変換部１０１に出力する。重みフィルタ部２６０１は、入力信号のスペクトル包絡と逆のスペクトル特性を有し、入力信号のスペクトルを平坦化（白色化）もしくはそれに近いスペクトル特性に変化させる。例えば、重みフィルタＷ（ｚ）は、第１レイヤ復号部２２０２で得られる復号ＬＰＣ係数を用いて、次式（９）のように構成される。

ここで、α（ｉ）は復号ＬＰＣ係数、ＮＰはＬＰＣ係数の次数、そしてγはスペクトル平坦化（白色化）の程度を制御するパラメータであり、０≦γ≦１の範囲の値をとる。γが大きいほど平坦化の程度が大きくなり、例えばγには０.９２を用いる。

図２７に示す復号装置２７０は、図２５に示した復号装置２５０に対して、合成フィルタ部２７０１を追加した構成を有する。なお、図２７の復号装置２７０において、図２５と同様の構成要素については同一の番号を付し、その説明を省略する。

合成フィルタ部２７０１は、時間領域変換部６０６から入力される信号に対して、平坦化されたスペクトルの特性を元の特性に復元するフィルタ処理を行い、フィルタ処理後の信号を加算部６０４に出力する。合成フィルタ部２７０１は、式（９）で表される重みフィルタと逆のスペクトル特性、すなわち入力信号のスペクトル包絡と同様の特性を有する。合成フィルタＢ（ｚ）は、式（９）を用いて次式（１０）のように表される。

一般的には、上記のような符号化装置及び復号装置において、音声信号のスペクトル包絡は低域部のエネルギーが高域部のエネルギーより大きく現れるため、合成フィルタを通す前の信号の符号化歪が低域部と高域部で同等であっても、合成フィルタを通した後では低域部の符号化歪が大きくなる。音声信号を低ビットレートに圧縮して転送する場合には符号化歪を十分に小さくすることができないため、前述したような復号部の合成フィルタ部の影響によって符号化歪の低域部のエネルギーが増大されてしまい、低域部の品質劣化が現れやすくなるという問題がある。

本実施の形態の符号化方法によれば、周波数が基準周波数よりも低い低域部からターゲット周波数が決定されるため、低域部が第２レイヤ符号化部１０５の符号化対象として選択されやすく、それにより低域部の符号化歪を小さくすることができる。すなわち、本実施の形態によれば、合成フィルタによって低域部が強調されても、低域部の符号化歪が知覚されにくくなるため、音質を改善する効果が得られる。

なお、本実施の形態では符号化装置２６０の減算部１０４を時間領域の信号同士の差をとる構成としたが、本発明はこれに限らず、周波数領域の変換係数同士の差をとる構成としても良い。具体的には、重みフィルタ部２６０１と周波数領域変換部１０１を遅延部２２０３と減算部１０４の間に配置して入力変換係数を求め、そして第１レイヤ復号部２２０２と減算部１０４の間に重みフィルタ部２６０１と周波数領域変換部１０１を新たに追加して第１レイヤ復号変換係数を求める。そして、減算部１０４では入力変換係数と第１レイヤ復号変換係数の差をとり、その誤差変換係数を第２レイヤ符号化部１０５に直接与える構成とする。この構成によれば、ある帯域では差をとり別の帯域では差はとらないなど、各帯域に適した減算処理が可能になり、音質をさらに改善することができる。

また、本実施の形態では、符号化装置２２０のレイヤ数が２である場合を例にして説明したが、本発明はこれに限らず、例えば、図２８に示す符号化装置２８０のように、符号化階層をレイヤ数が２以上の構成としてもよい。

図２８は符号化装置２８０の主要な構成を示すブロック図である。図１に示した符号化装置１００に対して、第２レイヤ復号部２８０１と、第３レイヤ符号化部２８０２と、第３レイヤ復号部２８０３と、第４レイヤ符号化部２８０４と、２つの加算器２８０５を追加し、３つの減算部１０４を有する構成を採る。

図２８に示す第３レイヤ符号化部２８０２と第４レイヤ符号化部２８０４は、図１に示した第２レイヤ符号化部１０５と同様の構成を有し、同様の動作を行い、第２レイヤ復号部２８０１と第３レイヤ復号部２８０３は、図１に示した第１レイヤ復号部１０３と同様の構成を有し、同様の動作を行う。ここでは、各レイヤ符号化部における帯域の位置について、図２９を用いて説明する。

各レイヤ符号化部における帯域の配置の一例として、図２９（Ａ）は、第２レイヤ符号化部における帯域の位置を示し、図２９（Ｂ）は、第３レイヤ符号化部における帯域の位置を示し、図２９（Ｃ）は、第４レイヤ符号化部における帯域の位置を示し、帯域数はそれぞれ４である。

より詳しく言うと、第２レイヤ符号化部１０５では、レイヤ２の基準周波数Ｆｘ（Ｌ２）を超えないように４つの帯域が配置され、第３レイヤ符号化部２８０２では、レイヤ３の基準周波数Ｆｘ（Ｌ３）を超えないように４つの帯域が配置され、第４レイヤ符号化部２８０４では、レイヤ４の基準周波数Ｆｘ（Ｌ４）を超えないよう帯域が配置されている。そして、各レイヤの基準周波数の間には、Ｆｘ（Ｌ２）<Ｆｘ（Ｌ３）<Ｆｘ（Ｌ４）の関係がある。すなわち、ビットレートが低いレイヤ２では、聴感的な感度の高い低域部の中から符号化の対象となる帯域を決定し、ビットレートが高くなる高位レイヤになるほど高域部まで含めた帯域の中から符号化の対象となる帯域を決定する。

このような構成を採ることにより、低位レイヤにおいて低域部を重視し、高位レイヤにおいてより広い帯域をカバーするようにするため、音声信号の高音質化を実現することができる。

図３０は、図２８に示した符号化装置２８０に対応する復号装置３００の主要な構成を示すブロック図である。図３０の復号装置３００は、図７に示した復号装置６００に対して、第３レイヤ復号部３００１と第４レイヤ復号部３００２と２つの加算器６０４とを追加した構成を有する。なお、第３レイヤ復号部３００１と第４レイヤ復号部３００２は、図７に示した復号装置６００の第２レイヤ復号部６０３と同様の構成を有し、同様の動作を行うため、ここでは、その詳細な説明を省略する。

また、各レイヤ符号化部における帯域の配置の別の一例として、図３１（Ａ）は第２レイヤ符号化部１０５における４つの帯域の位置を示し、図３１（Ｂ）は、第３レイヤ符号化部２８０２における６つの帯域の位置を示し、図３１（Ｃ）は、第４レイヤ符号化部２８０４における８つの帯域の位置を示す。

図３１では、各レイヤ符号化部において、各帯域は等間隔に配置され、図３１（Ａ）に示すような低位レイヤでは低域部に配置された帯域のみが符号化の対象となり、図３１（Ｂ）または（Ｃ）に示すような高位レイヤになるほど符号化の対象となる帯域が増える。

このような構成によれば、各レイヤでは帯域が等間隔に配置され、低位レイヤでは符号化の対象となる帯域を選択する場合、選択候補である低域部に配置される帯域の数が少ないため、演算量とビットレートを削減することができる。

（実施の形態８）
本発明の実施の形態８は、第１位置特定部の動作のみにおいて実施の形態１と相違し、それを示すために、本実施の形態に係る第１位置特定部には「８０１」という番号を付す。第１位置特定部８０１は、符号化対象となるターゲット周波数が採り得る帯域を特定する際、全帯域をあらかじめ複数の部分帯域に分割し、各部分帯域において所定の帯域幅および所定の刻み幅で探索を行う。そして、第１位置特定部８０１は、探索により求められた各部分帯域内の帯域を結合して、符号化対象となるターゲット周波数が採り得る帯域とする。

本実施の形態に係る第１位置特定部８０１の動作について図３２を用いて説明する。図３２は、部分帯域数Ｎ＝２であって、低域部をカバーするように部分帯域１が設定され、高域部をカバーするように部分帯域２が設定される場合を例示する。部分帯域１では、予め所定の帯域幅に設定された複数の帯域の中から１つの帯域が選択される（この帯域の位置情報を第１部分帯域位置情報と呼ぶ）。同様に、部分帯域２では、予め所定の帯域幅に設定された複数の帯域の中から１つの帯域が選択される（この帯域の位置情報を第２部分帯域位置情報と呼ぶ）。

次に、第１位置特定部８０１は、部分帯域１において選択された帯域と、部分帯域２において選択された帯域とを結合して結合帯域を構成する。この結合帯域が第１位置特定部８０１により特定される帯域となり、次いで第２位置特定部２０２は当該結合帯域を基に第２位置情報を特定する。例えば、部分帯域１で選択された帯域が帯域２、部分帯域２で選択された帯域が帯域４である場合、第１位置特定部８０１は、図３２の下段に示されるようにこの２つの帯域を結合し、符号化対象となる周波数帯域が採り得る帯域とする。

図３３は、部分帯域の数がＮである場合に対応する第１位置特定部８０１の構成を示すブロック図である。図３３において、減算部１０４から入力される第１レイヤ誤差変換係数は部分帯域１特定部８１１−１〜部分帯域Ｎ特定部８１１−Ｎそれぞれに与えられる。各々の部分帯域ｎ特定部８１１−ｎ（ｎ＝１〜Ｎ）は、所定の部分帯域ｎの中から１つの帯域を選択し、選択された帯域の位置を示す情報(第ｎ部分帯域位置情報)を第１位置情報構成部８１２に出力する。

第１位置情報構成部８１２は、各々の部分帯域ｎ特定部８１１−ｎから入力される第ｎ部分帯域位置情報（ｎ＝１〜Ｎ）を用いて第１位置情報を構成し、当該第１位置情報を第２位置特定部２０２、符号化部２０３、および多重化部２０４に出力する。

図３４は、第１位置情報構成部８１２において第１位置情報を構成する様子を例示する図である。この図において、第１位置情報構成部８１２は、第１部分帯域位置情報（Ａ１ビット）〜第Ｎ部分帯域位置情報(ＡＮビット)を順番に並べて第１位置情報を構成する。ここで、各々の第ｎ部分帯域位置情報のビット長Ａｎは、各部分帯域ｎに含まれる候補帯域の数により決まり、それぞれ異なる値を有しても良い。

図３５は、本実施の形態の復号処理において、第１位置情報と第２位置情報とを用いて第１レイヤ復号誤差変換係数を求める様子を示す図である。ここでは、部分帯域数が２である場合を例にとって説明する。なお、以下の説明においては、実施の形態１に係る第２レイヤ復号部６０３を構成する各構成要素の名称および番号を流用する。

配置部７０４は、乗算部７０３から入力されるゲイン候補乗算後の形状候補に対して、第２位置情報を用いて再配置を行う。次に、配置部７０４は、第２位置情報を用いた再配置後の形状候補に対して、第１位置情報を用いてさらに部分帯域１および部分帯域２への再配置を行う。配置部７０４は、このようにして求められた信号を第１レイヤ復号誤差変換係数として出力する。

本実施の形態によれば、第１位置特定部は各々の部分帯域の中から１つの帯域を選択するため、部分帯域に少なくとも１つの復号スペクトルを配置することが可能となる。これにより、全帯域の中から１つの帯域を決定する実施形態に比べて、音質を改善したい複数の帯域をあらかじめ設定しておくことができる。例えば、低域部と高域部の両者の品質改善を同時に図りたい場合などに本実施の形態は有効である。

また、本実施の形態によれば、低位レイヤ（本実施の形態では第１レイヤ）において低ビットレートの符号化を行う場合でも、復号信号の主観品質を改善することができる。低位レイヤにＣＥＬＰ方式を用いる構成はその一例である。ＣＥＬＰ方式は、波形マッチングに基づく符号化方式であるため、高域部に比べてエネルギーの大きい低域部の量子化歪がより小さくなるように符号化が行われる。その結果、高域部のスペクトルが減衰してしまい、こもり感（帯域感の欠如）として知覚される。その一方でＣＥＬＰ方式の符号化は低ビットレートの符号化方式であるため、低域の量子化歪を十分に抑えることができず、その量子化歪は雑音感として知覚されてしまう。本実施形態では、低域部と高域部の各々から符号化の対象となる帯域を選択するため、低域部の雑音感、高域部のこもり感という異なる２つの劣化要因を同時に解消し、主観品質を改善することが可能となる。

また、本実施の形態によれば、低域から選択された帯域および高域から選択された帯域を結合して結合帯域を構成し、この結合帯域の中でスペクトルの形状を決定するため、高域よりも低域の品質改善が必要なフレームでは、低域を重視したスペクトルの形状を選択し、低域よりも高域の品質改善が必要なフレームでは、高域を重視したスペクトルの形状を選択するという適応処理を行うことができ、主観品質を改善することができる。例えば、スペクトルの形状をパルスで表す場合、高域よりも低域の品質改善が必要なフレームでは低域に多くのパルスを配置し、低域よりも高域の品質改善が必要なフレームでは高域に多くのパルスを配置することができ、このような適応処理により、主観品質を改善することができる。

なお、本実施の形態のバリエーションとして、図３６に示すように、特定の部分帯域において常に固定の帯域が選択されるようにしても良い。図３６に示す例では、部分帯域２において常に帯域４が選択され、これが結合帯域の一部となっている。これにより、本実施の形態の効果と同様に、音質を改善したい帯域をあらかじめ設定しておくことが可能となり、かつ、例えば、部分帯域２の部分帯域位置情報が不用となるため、図３４に示されたような第１位置情報を表すためのビット数をより小さくすることができる。

また、図３６は、高域部（部分帯域２）において常に固定の範囲が選択される場合を例にとって示しているが、これに限定されず、低域部（部分帯域１）において常に固定の範囲が選択されるようにしても良いし、また図３６には図示されていない中域部の部分帯域において、常に固定の範囲が選択されるようにしても良い。

また、本実施の形態のバリエーションとして、図３７に示すように、各部分帯域において設定される候補帯域の帯域幅が異なっていても良い。図３７においては、部分帯域１において設定されている候補帯域よりも部分帯域２において設定されている部分帯域の帯域幅が短い場合を例示している。

以上、本発明の実施の形態について説明した。

なお、各レイヤ符号化部における帯域の配置として、本発明では上記説明した例に限らず、例えば、低位レイヤでは各帯域の帯域幅を狭く、高位レイヤでは各帯域の帯域幅を広くするように構成しても良い。

また、上記の各実施の形態では、過去のフレームで選択した帯域に関連付けて現フレームの帯域を選択しても良い。例えば、前フレームで選択した帯域の近傍に位置する帯域の中から現フレームの帯域を決定してもよい。また、前フレームで選択した帯域の近傍に現フレームの帯域の候補を再配置し、その再配置された帯域の候補の中から現フレームの帯域を決定してもよい。また、範囲情報を数フレームに１度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いてもよい（帯域情報の間欠伝送）。

また、上記の各実施の形態では、低位レイヤで選択した帯域に関連付けて現在のレイヤの帯域を選択しても良い。例えば、低位レイヤで選択した帯域の近傍に位置する帯域の中から現在のレイヤの帯域を決定してもよい。低位レイヤで選択した帯域の近傍に現在のレイヤの帯域の候補を再配置し、その再配置された帯域の候補の中から現在のレイヤの帯域を決定してもよい。また、範囲情報を数フレームに１度の割合で伝送し、範囲情報を伝送しないフレームでは過去に伝送された範囲情報が表す範囲を用いてもよい（帯域情報の間欠伝送）。

なお、本発明は、スケーラブル符号化の階層数に制限はない。

また、上記実施の形態では、復号信号として音声信号を想定しているが、本発明はこれに限らず、例えば、オーディオ信号などでもよい。

また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

本発明は、スケーラブル符号化方式の通信システムに使用される符号化装置、復号装置等に用いるのに好適である。

本発明の実施の形態１に係る符号化装置の主要な構成を示すブロック図図１に示した第２レイヤ符号化部の構成を示すブロック図図２に示した第１位置特定部が特定する帯域の位置を示す図図２に示した第１位置特定部が特定する帯域の他の位置を示す図図２に示した第２位置特定部が特定するターゲット周波数帯域の位置を示す図図２に示した符号化部の構成を示すブロック図本発明の実施の形態１に係る復号装置の主要な構成を示すブロック図図７に示した第２レイヤ復号部の構成を示す図図８に示した配置部から出力される第１レイヤ復号誤差変換係数の様子を示す図図２に示した第２位置特定部が特定するターゲット周波数の位置を示す図図６に示した符号化部の別の態様の構成を示すブロック図図８に示した第２レイヤ復号部の別の態様の構成を示すブロック図本発明の実施の形態３に係る符号化装置の第２レイヤ符号化部の構成を示すブロック図実施の形態３に係る符号化装置の複数のサブ位置特定部が特定するターゲット周波数の位置を示す図本発明の実施の形態４に係る符号化装置の第２レイヤ符号化部の構成を示すブロック図図１５に示した符号化部の構成を示すブロック図図１６の第２位置情報符号帳に記憶するそれぞれの第２位置情報候補が３つのターゲット周波数を持つ場合の符号化部を示す図図１５に示した符号化部の別の構成を示すブロック図本発明の実施の形態５に係る第２レイヤ符号化部の構成を示すブロック図図１９に示した第１位置特定部が特定する帯域の位置を示す図従来の音声符号化装置の第２レイヤ符号化部の符号化帯域を示す図実施の形態６に係る符号化装置の主要な構成を示すブロック図図２２に示した符号化装置の第１レイヤ符号化部の構成を示すブロック図図２２に示した符号化装置の第１レイヤ復号部の構成を示すブロック図図２２に示した符号化装置に対応する復号装置の主要な構成を示すブロック図実施の形態７に係る符号化装置の主要な構成を示すブロック図図２６に示した符号化装置に対応する復号装置の主要な構成を示すブロック図実施の形態７に係る他の態様の符号化装置の主要な構成を示すブロック図図２８に示した第２レイヤ符号化部における帯域の位置を示す図図２８に示した第３レイヤ符号化部における帯域の位置を示す図図２８に示した第４レイヤ符号化部における帯域の位置を示す図図２８に示した符号化装置に対応する復号装置の主要な構成を示すブロック図図２８に示した第２レイヤ符号化部における帯域の他の位置を示す図図２８に示した第３レイヤ符号化部における帯域の他の位置を示す図図２８に示した第４レイヤ符号化部における帯域の他の位置を示す図実施の形態８に係る第１位置特定部の動作を説明するための図実施の形態８に係る第１位置特定部の構成を示すブロック図実施の形態８に係る第１位置情報構成部において第１位置情報を構成する様子を例示する図実施の形態８に係る復号処理を説明するための図実施の形態８に係るバリエーションを説明するための図実施の形態８に係るバリエーションを説明するための図

符号の説明

１０１周波数領域変換部
１０２、２２０１第１レイヤ符号化部
１０３、２２０２第１レイヤ復号部
１０４減算部
１０５第２レイヤ符号化部
１０６、２０４多重化部
２０１、８０１第１位置特定部
２０２第２位置特定部
２０３、２２１符号化部
３０１目標信号構成部
３０２誤差算出部
３０３探索部
３０４形状符号帳
３０５ゲイン符号帳
３１１−１、…、３１１−Ｊサブ位置特定部
３２１第２位置情報符号帳
６０１分離部
６０２、２５０１第１レイヤ復号部
６０３、２５０２第２レイヤ復号部
６０４加算部
６０５切替部
６０６時間領域変換部
６０７ポストフィルタ
７０１形状符号帳
７０２ゲイン符号帳
７０３乗算部
７０４配置部
２２０３遅延部
２２１０ダウンサンプリング部
２２２０コア符号化部
２２３０コア復号部
２２４０アップサンプリング部
２２５０高域成分付与部
２６０１重みフィルタ部
２７０１合成フィルタ部
２８０１第２レイヤ復号部
２８０２第３レイヤ符号化部
２８０３第３レイヤ復号部
２８０４第４レイヤ符号化部
３００１第３レイヤ復号部
３００２第４レイヤ復号部

Claims

入力変換係数に対して符号化処理を行い、第１レイヤ符号化データを生成する第１レイヤ符号化手段と、
前記第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号変換係数を生成する第１レイヤ復号手段と、
前記入力変換係数と前記第１レイヤ復号変換係数との誤差である第１レイヤ誤差変換係数のうち、前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行い、第２レイヤ符号化データを生成する第２レイヤ符号化手段と、具備し、
前記第２レイヤ符号化手段は、
全帯域に渡って、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を、所定の第１刻み幅で探索し、特定した第１帯域を示す第１位置情報を生成する第１位置特定手段と、
前記第１帯域に渡って、前記第１刻み幅より細かい第２刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第２位置情報を生成する第２位置特定手段と、
前記第１位置情報、前記第２位置情報により特定されたターゲット周波数帯域に含まれる前記第１レイヤ誤差変換係数を符号化して符号化情報を生成する符号化手段と、
を具備する符号化装置。
前記第２位置特定手段は、
単一のターゲット周波数により前記ターゲット周波数帯域を特定する、
請求項１に記載の符号化装置。
前記第２位置特定手段は、
複数のターゲット周波数により前記ターゲット周波数帯域を特定する、
請求項１に記載の符号化装置。
前記第２位置特定手段は、
前記第１レイヤ誤差変換係数の符号化の際に生じる量子化歪みが最小となるように前記ターゲット周波数帯域を特定する、
請求項１に記載の符号化装置。
前記第１位置特定手段は、
前記第１レイヤ誤差変換係数のエネルギーの大きさを基準に前記第１帯域を特定する、
請求項１に記載の符号化装置。
前記第１位置特定手段は、
設定された基準周波数よりも低い低域部から前記第１帯域を特定する、
請求項１に記載の符号化装置。
前記第１位置特定手段は、
ピッチ周波数の整数倍を基準に前記第１帯域を特定する、
請求項１に記載の符号化装置。
符号化処理のレイヤ数は、２以上であって、
基準周波数は、高位レイヤほど高く設定され、
前記第１位置特定手段は、
レイヤ毎に前記各基準周波数よりも低い低域部から前記第１帯域を特定する、
請求項１に記載の符号化装置。
前記第１位置特定手段は、
全帯域を複数の部分帯域に分割し、前記複数の部分帯域各々において１つの帯域を選択し、選択された複数の帯域を結合した結合帯域を、前記第１帯域とする、
請求項１記載の符号化装置。
前記第１位置特定手段は、
前記複数の部分帯域の中の少なくとも１つにおいて、予め決められた固定の帯域を選択する、
請求項９記載の符号化装置。
入力変換係数に対して符号化処理を行って得られた第１レイヤ符号化データ、前記第１レイヤ符号化データを復号した第１レイヤ復号変換係数と前記入力変換係数との誤差である第１レイヤ誤差変換係数のうち前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行って得られた第２レイヤ符号化データ、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を示す第１位置情報、および前記第１帯域の中の前記ターゲット周波数帯域を示す第２位置情報を受信する受信手段と、
前記第１レイヤ符号化データを復号して第１レイヤ復号変換係数を生成する第１レイヤ復号手段と、
前記第１位置情報および前記第２位置情報に基づいて前記ターゲット周波数帯域を特定し、前記第２レイヤ符号化データを復号して第１レイヤ復号誤差変換係数を生成する第２レイヤ復号手段と、
前記第１レイヤ復号変換係数と前記第１レイヤ復号誤差変換係数とを加算して第２レイヤ復号変換係数を生成する加算手段と、
を具備する復号装置。
前記第２レイヤ復号手段は、
前記第２レイヤ符号化データに含まれる形状情報およびゲイン情報を用いて復号を行う、
請求項１１記載の復号装置。
入力変換係数に対して符号化処理を行い、第１レイヤ符号化データを生成する第１レイヤ符号化ステップと、
前記第１レイヤ符号化データを用いて復号処理を行い、第１レイヤ復号変換係数を生成する第１レイヤ復号ステップと、
前記入力変換係数と前記第１レイヤ復号変換係数との誤差である第１レイヤ誤差変換係数のうち、前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行い、第２レイヤ符号化データを生成する第２レイヤ符号化ステップと、具備し、
前記第２レイヤ符号化ステップは、
全帯域に渡って、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を、所定の第１刻み幅で探索し、特定した第１帯域を示す第１位置情報を生成する第１位置特定ステップと、
前記第１帯域に渡って、前記第１刻み幅より細かい第２刻み幅で前記ターゲット周波数帯域を探索し、特定したターゲット周波数帯域を示す第２位置情報を生成する第２位置特定ステップと、
前記第１位置情報、前記第２位置情報により特定されたターゲット周波数帯域に含まれる前記第１レイヤ誤差変換係数を符号化して符号化情報を生成する符号化ステップと、
を具備する符号化方法。
入力変換係数に対して符号化処理を行って得られた第１レイヤ符号化データ、前記第１レイヤ符号化データを復号した第１レイヤ復号変換係数と前記入力変換係数との誤差である第１レイヤ誤差変換係数のうち前記誤差が最も大きいターゲット周波数帯域部分に対して符号化処理を行って得られた第２レイヤ符号化データ、前記ターゲット周波数帯域よりも広い帯域幅で前記誤差が最も大きい第１帯域を示す第１位置情報、および前記第１帯域の中の前記ターゲット周波数帯域を示す第２位置情報を受信する受信ステップと、
前記第１レイヤ符号化データを復号して第１レイヤ復号変換係数を生成する第１レイヤ復号ステップと、
前記第１位置情報および前記第２位置情報に基づいて前記ターゲット周波数帯域を特定し、前記第２レイヤ符号化データを復号して第１レイヤ復号誤差変換係数を生成する第２レイヤ復号ステップと、
前記第１レイヤ復号変換係数と前記第１レイヤ復号誤差変換係数とを加算して第２レイヤ復号変換係数を生成する加算ステップと、
を具備する復号方法。