JPWO2005111568A1

JPWO2005111568A1 - 符号化装置、復号化装置、およびこれらの方法

Info

Publication number: JPWO2005111568A1
Application number: JP2006513565A
Authority: JP
Inventors: 押切　正浩; 正浩押切; 江原　宏幸; 宏幸江原
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2004-05-14
Filing date: 2005-05-13
Publication date: 2008-03-27
Anticipated expiration: 2025-05-13
Also published as: KR20120008537A; US8417515B2; WO2005111568A1; EP3336843B1; KR101143724B1; KR20070017524A; US20080027733A1; JP5371931B2; EP2991075A2; EP2991075B1; EP1744139A1; JP4810422B2; EP1744139B1; EP1744139A4; EP3336843A1; BRPI0510014A; BRPI0510014B1; EP2991075A3; KR101213840B1; JP2011043853A

Abstract

ある帯域のスペクトルを別の帯域のスペクトルで置換する技術において、挿入されるスペクトルのダイナミックレンジを適切に調整することができる符号化装置を開示する。この装置において、スペクトル変形部（１１２）は、帯域０≦ｋ＜ＦＬの第１スペクトルＳ１（ｋ）を様々に変形させてダイナミックレンジを変化させ、適切なダイナミックレンジとなる変形の仕方について調べる。この変形に関する情報は符号化され、多重化部（１１５）に与えられる。拡張帯域スペクトル符号化部（１１４）は、有効信号帯域が０≦ｋ＜ＦＨの第２スペクトルＳ２（ｋ）を参照信号として、第１スペクトルＳ１（ｋ）の高域（ＦＬ≦ｋ＜ＦＨ）に含めるべきスペクトル（拡張帯域スペクトル）を、変形後の第１スペクトルＳ１’（ｋ）に基づいて推定し、この推定スペクトルに関する情報を符号化して多重化部（１１５）に与える。

Description

本発明は、音声信号、オーディオ信号等を符号化／復号化する符号化装置、復号化装置、およびこれらの方法に関する。

音声信号を低ビットレートで圧縮する音声符号化技術は、移動体通信における電波等の有効利用のために重要である。さらに近年の傾向として、通話音声の品質向上に対する期待が高まってきており、臨場感の高い通話サービスの実現が望まれている。ここでいう臨場感とは、話者が取り巻く音環境（例えばＢＧＭ）を意味し、そのためオーディオ等の音声以外の信号をも高品質に符号化できることが望ましい。

音声信号を符号化する音声符号化に、ＩＴＵ−Ｔ（ＩｎｔｅｒｎａｔｉｏｎａｌＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＵｎｉｏｎＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｉｚａｔｉｏｎＳｅｃｔｏｒ）で規格化されているＧ７２６、Ｇ７２９等の方式が存在する。これらの方式は、狭帯域信号（３００Ｈｚ〜３．４ｋＨｚ）を対象とし、８ｋｂｉｔ／ｓ〜３２ｋｂｉｔ／ｓで符号化が行える。これら方式は低ビットレートで符号化できるものの、対象としている狭帯域信号は周波数帯域が最大３．４ｋＨｚまでと狭いため、その品質はこもっており臨場感に欠ける傾向にある。

また、ＩＴＵ−Ｔや３ＧＰＰ（Ｔｈｅ３ｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ）には、信号帯域が５０Ｈｚ〜７ｋＨｚの音声を符号化する標準方式（Ｇ．７２２、Ｇ．７２２．１、ＡＭＲ−ＷＢ等）が存在する。これらの方式は、ビットレートが６．６ｋｂｉｔ／ｓ〜６４ｋｂｉｔ／ｓで広帯域音声信号の符号化が行えるものの、広帯域音声を高品質に符号化するためには比較的ビットレートを高くする必要がある。また音質の観点では、広帯域音声は狭帯域音声に比べ高音質であるものの、高臨場感が要求されるサービスに対しては十分とは言い難い。

一般に、信号の最大周波数が１０〜１５ｋＨｚ程度まであるとＦＭラジオ相当の臨場感が得られ、２０ｋＨｚ程度までであればＣＤ並みの品質が得られる。このような帯域を有する信号に対しては、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔＧｒｏｕｐ）で規格化されているレイヤ３方式やＡＡＣ方式等に代表されるオーディオ符号化が適している。しかしながら、これらオーディオ符号化方式を音声通信の符号化方式として適用する場合には、音声を品質よく符号化するためにビットレートを高く設定する必要がある。その他に符号化遅延が大きくなる、等の問題がある。

周波数帯域の広い信号を低ビットレートで高品質に符号化する方法として、入力信号のスペクトルを低域部と高域部との２つのスペクトルに分割し、高域スペクトルは低域スペクトルを複製しこれと置換する（高域スペクトルを低域スペクトルで代用する）ことにより、全体のビットレートを低減させる技術がある（例えば、特許文献１参照）。この技術は、低域スペクトルの符号化に多くのビットを配分して高品質に符号化し、一方、高域スペクトルは符号化後の低域スペクトルを複製することを基本の処理として、少ないビット配分で符号化が行なわれる。

また、この技術に類似した技術として、符号化ビットを十分に配分できない帯域に対しては、他の所定の部分帯域スペクトル情報を用いて近似することで品質を向上させる技術（例えば、特許文献２参照）や、付加情報なしに狭帯域信号を広帯域信号に帯域拡張するため、狭帯域信号の低域スペクトルを高域スペクトルに複製することを基本の処理とする技術（例えば、特許文献３参照）がある。

なお、いずれの技術においても、スペクトルの補充を行いたい帯域に、別の帯域のスペクトルを複製してきて、スペクトル包絡を滑らかにするためのゲイン調整を行った後に、この複製スペクトルを挿入している。
特表２００１−５２１６４８号公報特開平９−１５３８１１号公報特開平９−９０９９２号公報

しかしながら、音声信号またはオーディオ信号のスペクトルにおいては、低域スペクトルのダイナミックレンジ（スペクトル振幅の絶対値（絶対振幅）の最大値と最小値との比）が、高域スペクトルのダイナミックレンジよりも大きくなる現象がよく見られる。図１は、この現象を説明するための図で、オーディオ信号のスペクトルの一例を示すものである。このスペクトルは、標本化周波数３２ｋＨｚのオーディオ信号を３０ｍｓの長さで周波数分析したときの対数スペクトルである。

この図に示されるように、周波数０〜８０００Ｈｚの低域スペクトルはピーク性が強く（鋭敏なピークが多数存在し）、この帯域でのスペクトルのダイナミックレンジは大きくなる。一方、周波数８０００〜１５０００Ｈｚの高域スペクトルのダイナミックレンジは小さくなる。このようなスペクトル特性を有する信号に対して、従来の低域スペクトルを高域スペクトルに複製する方法では、たとえ高域スペクトルのゲイン調整を行ったとしても、以下に示すように、高域スペクトルには不必要なピーク形状が現れる。

図２は、図１に示したスペクトルの低域のスペクトル（１０００〜７０００Ｈｚ）を複製し、エネルギー調整することにより、高域スペクトル（１００００〜１６０００Ｈｚ）を得た場合の全帯域のスペクトルを示す図である。

上記の処理を行うと、この図にあるように、１００００Ｈｚ以上の帯域Ｒ１に不必要なピーク形状が現れる。このピークはオリジナルの高域スペクトルには見られなかったものである。そして、このスペクトルを時間領域に変換して得られる復号信号には、鈴が鳴るように聞こえるノイズが発生し、主観品質が低下するという問題が発生する。このように、ある帯域のスペクトルを別の帯域のスペクトルで代用する技術においては、挿入されるスペクトルのダイナミックレンジを適切に調整する必要がある。

よって、本発明の目的は、ある帯域のスペクトルを別の帯域のスペクトルで代用（置換）する技術において、挿入されるスペクトルのダイナミックレンジを適切に調整して、復号信号の主観品質を向上させることができる符号化装置、復号化装置、およびこれらの方法を提供することである。

本発明の符号化装置は、入力信号の高域スペクトル部の符号化を行う符号化手段と、前記入力信号の低域スペクトル部を符号化した信号を復号化した第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、を具備し、前記符号化手段は、前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号化を行う構成を採る。

また、本発明の復号化装置は、符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換手段と、前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化手段と、前記符号化装置で生成された符号に含まれるスペクトル変形情報に従って前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、を具備し、前記復号化手段は、前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する構成を採る。

また、本発明の復号化装置は、符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換手段と、前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化手段と、前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、を具備し、前記制限手段は、前記第１の低域スペクトルに基づいて制限の仕方に関する情報を推定し、推定された情報を用いて前記第２の低域スペクトルを生成し、前記復号化手段は、前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する構成を採る。

本発明によれば、ある帯域のスペクトルを別の帯域のスペクトルで代用する技術において、挿入されるスペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

オーディオ信号のスペクトルの一例を示す図低域のスペクトルを複製し、エネルギー調整することにより、高域スペクトルを得た場合の全帯域のスペクトルを示す図実施の形態１に係る符号化装置の主要な構成を示すブロック図実施の形態１に係るスペクトル符号化部内部の主要な構成を示すブロック図実施の形態１に係るスペクトル変形部内部の主要な構成を示すブロック図実施の形態１に係る変形部内部の主要な構成を示すブロック図実施の形態１に係る変形部によって得られる変形スペクトルの例を示す図実施の形態１に係る変形部の別のバリエーションの構成を示すブロック図実施の形態１に係る階層復号化装置の主要な構成を示すブロック図実施の形態１に係るスペクトル復号化部内部の主要な構成を示すブロック図実施の形態２に係るスペクトル符号化部を説明するためのブロック図実施の形態２に係るスペクトル符号化部の別のバリエーションの構成を示すブロック図実施の形態２に係るスペクトル復号化部の主要な構成を示すブロック図実施の形態３に係るスペクトル符号化部の主要な構成を示すブロック図実施の形態３に係る変形情報推定部の説明を行う図実施の形態３に係る変形部の主要な構成を示すブロック図実施の形態３に係るスペクトル復号化部の主要な構成を示すブロック図実施の形態４に係る階層符号化装置の主要な構成を示すブロック図実施の形態４に係るスペクトル符号化部の主要な構成を示すブロック図実施の形態４に係る階層復号化装置の主要な構成を示すブロック図実施の形態４に係るスペクトル復号化部の主要な構成を示すブロック図実施の形態５に係るスペクトル符号化部の主要な構成を示す図実施の形態５に係る変形情報推定部の主要な構成を示すブロック図実施の形態５に係るスペクトル復号化部の主要な構成を示す図実施の形態６に係るスペクトル変形方法を説明するための図実施の形態６に係るスペクトル変形部内部の主要な構成を示すブロック図変形スペクトルの生成方法を説明するための図変形スペクトルの生成方法を説明するための図実施の形態６に係るスペクトル変形部内部の主要な構成を示したブロック図

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。

（実施の形態１）
図３は、本発明の実施の形態１に係る階層符号化装置１００の主要な構成を示すブロック図である。ここでは、符号化情報が複数のレイヤからなる階層構造を有する場合、すなわち、階層符号化（スケーラブル符号化）を行う場合を例にとって説明する。

階層符号化装置１００の各部は、信号の入力に伴い以下の動作を行う。

ダウンサンプリング部１０１は、入力信号からサンプリングレートの低い信号を生成し第１レイヤ符号化部１０２に与える。第１レイヤ符号化部１０２は、ダウンサンプリング部１０１から出力された信号を符号化する。第１レイヤ符号化部１０２で得られた符号化コードは、多重化部１０３に与えられると共に、第１レイヤ復号化部１０４に与えられる。第１レイヤ復号化部１０４は、第１レイヤ符号化部１０２から出力された符号化コードから第１レイヤの復号信号Ｓ１を生成する。

一方、遅延部１０５は、入力信号に所定の長さの遅延を与える。この遅延は、ダウンサンプリング部１０１、第１レイヤ符号化部１０２、および第１レイヤ復号化部１０４で生じる時間遅れを補正するためのものである。スペクトル符号化部１０６は、第１レイヤ復号化部１０４で生成された第１レイヤ復号信号Ｓ１を用いて、遅延部１０５から出力された所定時間遅延された入力信号Ｓ２のスペクトル符号化を行い、生成された符号化コードを多重化部１０３に出力する。

多重化部１０３は、第１レイヤ符号化部１０２で求められる符号化コードとスペクトル符号化部１０６で求められる符号化コードとを多重化し、これを出力符号化コードとして符号化装置１００の外部に出力する。

図４は、上記のスペクトル符号化部１０６内部の主要な構成を示すブロック図である。

このスペクトル符号化部１０６は、周波数領域変換部１１１、スペクトル変形部１１２、周波数領域変換部１１３、拡張帯域スペクトル符号化部１１４、および多重化部１１５から主に構成される。

スペクトル符号化部１０６には、第１レイヤ復号化部１０４から有効信号帯域が０≦ｋ＜ＦＬ（ｋは各サブバンドの周波数）の第１信号Ｓ１が入力され、また、遅延部１０５から有効信号帯域が０≦ｋ＜ＦＨ（ただし、ＦＬ＜ＦＨ）の第２信号Ｓ２が入力される。スペクトル符号化部１０６は、第１信号Ｓ１の帯域０≦ｋ＜ＦＬのスペクトルを利用して、第２信号Ｓ２の帯域ＦＬ≦ｋ＜ＦＨのスペクトルを推定し、この推定情報を符号化して出力する。

周波数領域変換部１１１は、入力される第１信号Ｓ１に周波数変換を行い、低域スペクトルである第１スペクトルＳ１（ｋ）を算出する。一方、周波数領域変換部１１３は、入力される第２信号Ｓ２に周波数変換を行い、広帯域の第２スペクトルＳ２（ｋ）を算出する。ここで周波数変換の方法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を適用する。また、Ｓ１（ｋ）は、第１スペクトルの周波数ｋのサブバンドのスペクトルであり、Ｓ２（ｋ）は、第２スペクトルの周波数ｋのサブバンドのスペクトルである。

スペクトル変形部１１２は、第１スペクトルＳ１（ｋ）を様々に変形させることにより第１スペクトルのダイナミックレンジを変化させ、適切なダイナミックレンジとなる変形の仕方について調べる。そして、この変形に関する情報（変形情報）を符号化して多重化部１１５に与える。このスペクトル変形処理の詳細については後ほど詳述する。また、スペクトル変形部１１２は、適切なダイナミックレンジとなった第１スペクトルＳ１（ｋ）を拡張帯域スペクトル符号化部１１４に出力する。

拡張帯域スペクトル符号化部１１４は、第２スペクトルＳ２（ｋ）を参照信号として、第１スペクトルＳ１（ｋ）の高域（ＦＬ≦ｋ＜ＦＨ）に含めるべきスペクトル（拡張帯域スペクトル）を推定し、この推定スペクトルに関する情報（推定情報）を符号化して多重化部１１５に与える。ここで、拡張帯域スペクトルの推定は、変形後の第１スペクトルＳ１’（ｋ）に基づいて行われる。

多重化部１１５は、スペクトル変形部１１２から出力された変形情報の符号化コードと、拡張帯域スペクトル符号化部１１４から出力された拡張帯域スペクトルに関する推定情報の符号化コードと、を多重化して出力する。

図５は、上記のスペクトル変形部１１２内部の主要な構成を示すブロック図である。

スペクトル変形部１１２は、第１スペクトルＳ１（ｋ）のダイナミックレンジが第２スペクトルＳ２（ｋ）の高域スペクトル（ＦＬ≦ｋ＜ＦＨ）のダイナミックレンジに最も近付くような変形を第１スペクトルＳ１（ｋ）に加える。そして、このときの変形情報を符号化して出力する。

バッファ１２１は、入力された第１スペクトルＳ１（ｋ）を一時保存し、必要に応じ第１スペクトルＳ１（ｋ）を変形部１２２に与える。

変形部１２２は、下記の手順に従い、第１スペクトルＳ１（ｋ）を様々に変形して変形第１スペクトルＳ１’（ｊ，ｋ）を生成し、これをサブバンドエネルギー算出部１２３に与える。ここで、ｊは各変形処理を識別するためのインデックスである。

サブバンドエネルギー算出部１２３は、変形第１スペクトルＳ’（ｊ，ｋ）の周波数帯域を複数のサブバンドに分割し、所定の範囲のサブバンドのエネルギー（サブバンドエネルギー）を求める。例えば、サブバンドエネルギーを求める範囲をＦ１Ｌ≦ｋ＜Ｆ１Ｈと定めたとき、この帯域幅をＮ分割したときのサブバンド幅ＢＷＳは次の（式１）のように表される。
ＢＷＳ＝（Ｆ１Ｈ−Ｆ１Ｌ＋１）／Ｎ・・・（式１）
よって、第ｎサブバンドの最小周波数Ｆ１Ｌ（ｎ）および最大周波数Ｆ１Ｈ（ｎ）は、それぞれ（式２）（式３）と表される。
Ｆ１Ｌ（ｎ）＝Ｆ１Ｌ＋ｎ・ＢＷＳ・・・（式２）
Ｆ１Ｈ（ｎ）＝Ｆ１Ｌ＋（ｎ＋１）・ＢＷＳ−１・・・（式３）
ここでｎは０〜Ｎ−１の値をとる。このとき、サブバンドエネルギーＰ１（ｊ，ｎ）は次の（式４）のように算出される。

または、次の（式５）のようにサブバンドに含まれるスペクトルの平均値として求めてもよい。

このようにして求められたサブバンドエネルギーＰ１（ｊ，ｎ）が分散算出部１２４に与えられる。

分散算出部１２４は、サブバンドエネルギーＰ１（ｊ，ｎ）のばらつきの程度を表すために、分散σ１^２（ｊ）を次の（式６）に従い算出する。

ここで、Ｐ１ｍｅａｎ（ｊ）はサブバンドエネルギーＰ１（ｊ，ｎ）の平均値を表し、次の（式７）のように算出される。

このようにして算出された、変形情報ｊにおけるサブバンドエネルギーのばらつきの度合いを表す分散σ１^２（ｊ）は探索部１２５に与えられる。

サブバンドエネルギー算出部１２６および分散算出部１２７は、上記のサブバンドエネルギー算出部１２３および分散算出部１２４で行われる一連の処理と同様に、入力される第２スペクトルＳ２（ｋ）に対して、サブバンドエネルギーのばらつきの度合いを表す分散σ２^２を算出する。ただし、サブバンドエネルギー算出部１２６および分散算出部１２７の処理は、以下の点で上記と異なる。すなわち、第２スペクトルＳ２（ｋ）のサブバンドエネルギーを算出する所定の範囲を、Ｆ２Ｌ≦ｋ＜Ｆ２Ｈと定める。ここで、第１スペクトルのダイナミックレンジを第２スペクトルの高域スペクトルのダイナミックレンジに近づける必要があることから、ＦＬ≦Ｆ２Ｌ＜Ｆ２Ｈの条件を満足するＦ２Ｌを設定する。また、第２スペクトルに対するサブバンド数は、第１スペクトルのサブバンド数Ｎと一致させる必要はない。ただし、第１スペクトルのサブバンド幅と第２スペクトルのサブバンド幅とがほぼ一致するように、第２スペクトルのサブバンド数は設定される。

探索部１２５は、第１スペクトルのサブバンドの分散σ１^２（ｊ）と第２スペクトルのサブバンドの分散σ２^２とが最も近付く際の第１スペクトルのサブバンドの分散σ１^２（ｊ）を探索により決定する。具体的には、探索部１２５は、全ての変形候補０≦ｊ＜Ｊに対して第１スペクトルのサブバンドの分散σ１^２（ｊ）を算出し、この算出値と第２スペクトルのサブバンドの分散σ２^２とを比較し、両者が最も近付く際のｊの値（最適変形情報ｊｏｐｔ）を決定し、このｊｏｐｔをスペクトル変形部１１２の外部および変形部１２８に出力する。

変形部１２８は、この最適変形情報ｊｏｐｔに対応する変形第１スペクトルＳ’（ｊｏｐｔ，ｋ）を生成し、スペクトル変形部１１２の外部に出力する。なお、最適変形情報ｊｏｐｔは多重化部１１５に、変形第１スペクトルＳ１’（ｊｏｐｔ，ｋ）は拡張帯域スペクトル符号化部１１４に送られる。

図６は、上記の変形部１２２内部の主要な構成を示すブロック図である。なお、変形部１２８内部の構成も基本的に変形部１２２と同様である。

正号／負号抽出部１３１は、第１スペクトルの各サブバンドの符号情報ｓｉｇｎ（ｋ）を求め、正号／負号付与部１３４に出力する。

絶対値算出部１３２は、第１スペクトルの各サブバンドに対し、振幅の絶対値を算出し、この値を指数値算出部１３３に与える。

指数変数テーブル１３５は、第１スペクトルの変形に用いられる指数変数α（ｊ）を記録している。このテーブルに含まれる変数のうちｊに対応する値が、指数変数テーブル１３５から出力される。具体的には、指数変数テーブル１３５には、例えば、指数変数α（ｊ）＝｛１．０，０．８，０．６，０．４｝の４つからなる指数変数の候補が記録されており、探索部１２５から指定されたインデックスｊに基づき１つの指数変数α（ｊ）が選択され、指数値算出部１３３に与えられる。

指数値算出部１３３は、指数変数テーブル１３５から出力された指数変数を用いて、絶対値算出部１３２から出力されるスペクトル（絶対値）の指数値、すなわち、各サブバンドの振幅の絶対値をα（ｊ）でべき乗した値を算出する。

正号／負号付与部１３４は、指数値算出部１３３から出力される指数値に対し、正号／負号抽出部１３１で先に求めておいた符号情報ｓｉｇｎ（ｋ）を付与し、変形第１スペクトルＳ１’（ｊ，ｋ）として出力する。

よって変形部１２２から出力される変形第１スペクトルＳ１’（ｊ，ｋ）は、次の（式８）のように表される。

図７は、上記の変形部１２２（または変形部１２８）によって得られる変形スペクトルの例を示す図である。

なお、ここでは、指数変数α（ｊ）＝｛１．０，０．６，０．２｝の場合を例にとって説明している。また、ここでは、各スペクトルの比較が容易となるように、α（ｊ）＝１．０の場合のスペクトルＳ７１を上方に４０ｄＢ、α（ｊ）＝０．６の場合のスペクトルＳ７２を上方に２０ｄＢだけシフトさせて表示をしている。この図から、指数変数α（ｊ）によって、スペクトルのダイナミックレンジを変化させることが可能であることがわかる。

以上説明したように、本実施の形態に係る符号化装置（スペクトル符号化部１０６）によれば、第１信号（０≦ｋ＜ＦＬ）から求められる第１スペクトルを使って、第２信号（０≦ｋ＜ＦＨ）から求められる第２スペクトルの高域部（ＦＬ≦ｋ＜ＦＨ）を推定し、推定情報を符号化する際に、第１スペクトルをそのまま用いずに、第１スペクトルに変形を加えた後に上記推定を行うようにする。このとき、どのように変形したかを表す情報（変形情報）も併せて符号化し、復号化側に伝送する。

第１スペクトルに加える変形の具体的な方法は、第１スペクトルをサブバンドに分割し、各サブバンド内に含まれるスペクトルの絶対振幅の平均（サブバンド平均振幅）をサブバンド毎に求め，これらサブバンド平均振幅を統計処理して求められる分散が、第２スペクトルの高域部のスペクトルから同様にして求められるサブバンド平均振幅の分散に最も近付くように、第１スペクトルを変形する。すなわち、第１スペクトルの絶対振幅の平均的な振れ幅と、第２スペクトルの高域スペクトルの絶対振幅の平均的な振れ幅とが同等の値となるように第１スペクトルを変形する。また、この具体的な変形方法を示す変形情報を符号化する。なお、サブバンド平均振幅の代わりに、各サブバンドに含まれるスペクトルのエネルギーを用いても良い。

上記の具体的な変形方法のさらに詳細は、第１スペクトルのスペクトルをα乗（０≦α≦１）することで、サブバンド内のスペクトルの絶対振幅のばらつき（振れ）を制御する。そして、使用されたαに関する情報を復号化側へ伝送する。

上記の構成を採ることにより、第１スペクトルのダイナミックレンジと第２スペクトルの高域部のダイナミックレンジとが大きく異なる場合でも、推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

また、以上の構成において、第１スペクトル全体をα乗（０≦α≦１）することにより、スペクトルの振幅に対し一様な制限を加えている。これにより、鋭敏（急峻）なピークを鈍化させることができる。また、例えば、ただ単に所定値以上のピークをピークカットする変形を行った場合、スペクトルが不連続となり異音が発生するおそれがあるが、上記の構成を採ることにより、スペクトルは滑らかなままであり異音の発生を防止することができる。

なお、本実施の形態では、スペクトルの絶対振幅のばらつきの度合い（振れ幅）を表す指標として分散を用いる場合を例にとって説明したが、これに限らず、例えば標準偏差等の別の指標を適用しても良い。

また、本実施の形態では、符号化装置１００内の変形部１２２（または変形部１２８）において、指数関数を使用する場合を例にとって説明したが、以下に示すような方法を用いても良い。

図８は、変形部の別のバリエーション（変形部１２２ａ）の構成を示すブロック図である。なお、変形部１２２（または変形部１２８）と同一の構成要素には同一の符号を付し、その説明を省略する。

上記の変形部１２２（または変形部１２８）では、指数関数を使用しているために演算量が大きくなる傾向にある。そこで、指数関数を使用せずにスペクトルのダイナミックレンジを変化させるようにすることで演算量の増大を回避する。

絶対値算出部１３２は、入力された第１スペクトルＳ１（ｋ）の各スペクトルの絶対値を算出し、平均値算出部１４２および変形スペクトル算出部１４３に出力する。平均値算出部１４２は、次の（式９）に従いスペクトルの絶対値の平均値Ｓ１ｍｅａｎを算出する。

乗数テーブル１４４には、変形スペクトル算出部１４３で使用される乗数の候補が記録されており、探索部１２５から指定されたインデックスに基づいて１つの乗数が選択され、変形スペクトル算出部１４３に出力される。ここでは、乗数テーブルに、乗数ｇ（ｊ）＝｛１．０，０．９，０．８，０．７｝の４候補が記録されているものとする。

変形スペクトル算出部１４３は、絶対値算出部１３２から出力された第１スペクトルの絶対値と、乗数テーブル１４４から出力された乗数ｇ（ｊ）とを用いて、変形スペクトルＳ１’（ｋ）の絶対値を次の（式１０）に従い算出し、正号／負号付与部１３４に出力する。

正号／負号付与部１３４は、変形スペクトル算出部１４３から出力された変形スペクトルＳ１’（ｋ）の絶対値に、正号／負号抽出部１３１で得られた符号情報ｓｉｇｎ（ｋ）を付与し、次の（式１１）で表される最終的な変形スペクトルＳ１’（ｋ）を生成し、出力する。

また、本実施の形態では、変形部が、正号／負号抽出部、絶対値算出部、正号／負号付与部を備える場合を例にとって説明したが、入力されるスペクトルが常に正である場合には、これらの構成は必要ない。

次いで、上記の階層符号化装置１００で生成された符号化コードを復号化することができる階層復号化装置１５０の構成について以下詳細に説明する。

図９は、本実施の形態に係る階層復号化装置１５０の主要な構成を示すブロック図である。

分離部１５１は、入力された符号化コードに分離処理を施し、第１レイヤ復号化部１５２用の符号化コードＳ５１と、スペクトル復号化部１５３用の符号化コードＳ５２とを生成する。第１レイヤ復号化部１５２は、分離部１５１で得られた符号化コードを用いて信号帯域０≦ｋ＜ＦＬの復号信号を復号し、この復号信号Ｓ５３をスペクトル復号化部１５３に与える。また、第１レイヤ復号化部１５２の出力は、復号化装置１５０の出力端子にも接続されている。これにより、第１レイヤ復号化部１５２で生成される第１レイヤ復号信号を出力する必要が生じた場合には、この出力端子を介し出力させることができる。

スペクトル復号化部１５３には、分離部１５１で分離された符号化コードＳ５２と第１レイヤ復号化部１５２から出力される第１レイヤ復号信号Ｓ５３とが与えられる。スペクトル復号化部１５３は、後述のスペクトル復号化を行い、信号帯域０≦ｋ＜ＦＨの広帯域の復号信号を生成し、これを出力する。スペクトル復号化部１５３では、第１レイヤ復号化部１５２から与えられる第１レイヤ復号信号３５３を第１信号とみなして処理を行うことになる。

図１０は、上記のスペクトル復号化部１５３内部の主要な構成を示すブロック図である。

このスペクトル復号化部１５３には、符号化コードＳ５２および第１レイヤ復号信号Ｓ５３（有効周波数帯域が０≦ｋ＜ＦＬの第１信号）が入力される。

分離部１６１は、入力された符号化コードＳ５２から、上記の符号化側のスペクトル変形部１１２で生成された変形情報と、拡張帯域スペクトル符号化情報とを分離し、変形情報は変形部１６２に、拡張帯域スペクトル符号化情報は拡張帯域スペクトル生成部１６３に出力する。

周波数領域変換部１６４は、入力された時間領域信号である第１レイヤ復号信号Ｓ５３に対し周波数変換を施し、第１スペクトルＳ１（ｋ）を算出する。この周波数変換法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を使用する。

変形部１６２は、分離部１６１から与えられる変形情報に基づいて、周波数領域変換部１６４から与えられる第１スペクトルＳ１（ｋ）に変形を加え、変形第１スペクトルＳ１’（ｋ）を生成する。なお、この変形部１６２内部の構成は、既に説明した符号化側の変形部１２２（図６参照）と同様なので、説明を省略する。

拡張帯域スペクトル生成部１６３は、変形後の第１スペクトルＳ１’（ｋ）を用いて、第１スペクトルＳ１（ｋ）の拡張帯域ＦＬ≦ｋ＜ＦＨに含めるべき第２スペクトルの推定値Ｓ２”（ｋ）を生成し、この第２スペクトルの推定値Ｓ２”（ｋ）をスペクトル構成部１６５に与える。

スペクトル構成部１６５は、周波数領域変換部１６４から与えられる第１スペクトルＳ１（ｋ）と、拡張帯域スペクトル生成部１６３から与えられる第２スペクトルの推定値Ｓ２”（ｋ）とを結合し、復号スペクトルＳ３（ｋ）を生成する。この復号スペクトルＳ３（ｋ）は次の（式１２）のように表される。

この復号スペクトルＳ３（ｋ）は、時間領域変換部１６６へ与えられる。

時間領域変換部１６６は、復号スペクトルＳ３（ｋ）を時間領域の信号に変換した後、必要に応じて適切な窓掛けおよび重ね合わせ加算等の処理を行ってフレーム間に生じる不連続を回避し、最終的な復号信号を出力する。

このように、本実施の形態に係る復号化装置（スペクトル復号化部１５３）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することができる。

（実施の形態２）
本発明の実施の形態２では、第１スペクトルを内部状態として持つピッチフィルタを用いて第２スペクトルを推定し、このピッチフィルタの特性を符号化する。

本実施の形態に係る階層符号化装置の構成は、実施の形態１に示した階層符号化装置と同様であるので、異なる構成であるスペクトル符号化部２０１を図１１のブロック図を用いて説明する。なお、実施の形態１に示したスペクトル符号化部１０６（図４参照）と同一の構成要素には同一の符号を付し、その説明を省略する。

内部状態設定部２０３は、スペクトル変形部１１２にて生成された変形第１スペクトルＳ１’（ｋ）を使ってフィルタリング部２０４で用いられるフィルタの内部状態Ｓ（ｋ）を設定する。

フィルタリング部２０４は、内部状態設定部２０３で設定されたフィルタの内部状態Ｓ（ｋ）と、ラグ係数設定部２０６から与えられるラグ係数Ｔとに基づいてフィルタリングを行い、第２スペクトルの推定値Ｓ２”（ｋ）を算出する。なお、本実施の形態では、フィルタを次の（式１３）で表されるものを使用した場合について説明する。

ここで、Ｔは、ラグ係数設定部２０６から与えられる係数を表す。また、ここではＭ＝１とする。フィルタリング部２０４におけるフィルタリング処理は、次の（式１４）に示すように、周波数の低い方から順に、周波数Ｔだけ低いスペクトルを中心に対応する係数β_ｉを乗じて加算することにより推定値を算出する。

この式に従う処理を、ＦＬ≦ｋ＜ＦＨの間に行う。ここでＳ（ｋ）は、フィルタの内部状態を表す。このとき算出されるＳ（ｋ）（ただし、ＦＬ≦ｋ＜ＦＨ）が、第２スペクトルの推定値Ｓ２”（ｋ）として利用される。

探索部２０５は、周波数領域変換部１１３から与えられる第２スペクトルＳ２（ｋ）と、フィルタリング部２０４から与えられる第２スペクトルの推定値Ｓ２”（ｋ）との類似度を算出する。

なお、この類似度には様々な定義が存在するが、本実施の形態では、まずフィルタ係数β_−１およびβ_１を０とみなして最小２乗誤差に基づき定義される次の（式１５）に従い算出される類似度を使用する。

この方法では、最適なラグ係数Ｔを算出した後にフィルタ係数β_ｉを決定することになる。ここで、ＥはＳ２（ｋ）とＳ２”（ｋ）間の２乗誤差を表す。また、上記（式１５）の右辺第１項は、ラグ係数Ｔに関わらず固定値となるので、（式１５）の右辺第２項を最大とするＳ２”（ｋ）を生成するラグ係数Ｔが探索されることになる。本実施の形態では、（式１５）の右辺第２項を類似度と呼ぶことにする。

ラグ係数設定部２０６は、予め定められた探索範囲ＴＭＩＮ〜ＴＭＡＸに含まれるラグ係数Ｔを順次フィルタリング部２０４に出力する。そのため、フィルタリング部２０４では、ラグ係数設定部２０６からラグ係数Ｔが与えられる度に、ＦＬ≦ｋ＜ＦＨの範囲のＳ（ｋ）をゼロクリアした後のフィルタリングが行われ、探索部２０５では、その度に類似度が算出される。探索部２０５は、算出される類似度が最大となるときの係数ＴｍａｘをＴＭＩＮ〜ＴＭＡＸの間から決定し、その係数Ｔｍａｘをフィルタ係数算出部２０７、スペクトル概形符号化部２０８，および多重化部１１５に与える。

フィルタ係数算出部２０７は、探索部２０５から与えられる係数Ｔｍａｘを用いてフィルタ係数β_ｉを求める。ここで、フィルタ係数β_ｉは、次の（式１６）に従う２乗歪Ｅを最小にするように求められる。

フィルタ係数算出部２０７は、複数個のβ_ｉの組合せを予めテーブルとして有しており、上記（式１６）の２乗歪Ｅを最小とするβ_ｉの組合せを決定し、そのコードを多重化部１１５に出力すると共に、フィルタ係数β_ｉをスペクトル概形符号化部２０８に与える。

スペクトル概形符号化部２０８は、内部状態設定部２０３から与えられる内部状態Ｓ（ｋ）と、探索部２０５から与えられるラグ係数Ｔｍａｘと、フィルタ係数算出部２０７から与えられるフィルタ係数β_ｉとを用いてフィルタリングを行い、帯域ＦＬ≦ｋ＜ＦＨの第２スペクトルの推定値Ｓ２”（ｋ）を求める。そして、スペクトル概形符号化部２０８は、第２スペクトルの推定値Ｓ２”（ｋ）と第２スペクトルＳ２（ｋ）とを用いてスペクトル概形の調整係数の符号化を行う。

なお、本実施の形態では、このスペクトル概形情報をサブバンド毎のスペクトルパワで表す場合について説明する。このとき、第ｊサブバンドのスペクトルパワは次の（式１７）で表される。

ここで、ＢＬ（ｊ）は第ｊサブバンドの最小周波数、ＢＨ（ｊ）は第ｊサブバンドの最大周波数を表す。このようにして求められた第２スペクトルのサブバンドのスペクトルパワを第２スペクトルのスペクトル概形情報とみなす。

同様に、スペクトル概形符号化部２０８は、第２スペクトルの推定値Ｓ２”（ｋ）のサブバンドのスペクトルパワＢ”（ｊ）を次の（式１８）に従い算出し、サブバンド毎の変動量Ｖ（ｊ）を次の（式１９）に従い算出する。

次に、スペクトル概形符号化部２０８は、変動量Ｖ（ｊ）を符号化してそのコードを多重化部１１５に送る。

多重化部１１５は、スペクトル変形部１１２から得られる変形情報と、探索部２０５から得られる最適ラグ係数Ｔｍａｘの情報と、フィルタ係数算出部２０７から得られるフィルタ係数の情報と、スペクトル概形符号化部２０８から得られるスペクトル概形調整係数の情報とを多重化して出力する。

このように、本実施の形態によれば、第１スペクトルを内部状態として持つピッチフィルタを用いて第２スペクトルを推定するので、このピッチフィルタの特性のみを符号化すれば良く、低ビットレート化が可能となる。

なお、本実施の形態では、周波数領域変換部を備える場合を説明したが、これらは時間領域信号を入力とする場合に必要な構成要素であり、直接スペクトルが入力される場合には周波数領域変換部は必要ない。

また、本実施の形態では、上記（式１３）においてＭ＝１の場合を例にとって説明したが、Ｍの値は１に限定されることはなく、０以上の整数を用いることが可能である。

また、本実施の形態では、ピッチフィルタが上記（式１３）のフィルタ関数（伝達関数）を用いる場合を例にとって説明したが、ピッチフィルタは１次のピッチフィルタであっても良い。

図１２は、本実施の形態に係るスペクトル符号化部２０１の別のバリエーション（スペクトル符号化部２０１ａ）の構成を示すブロック図である。なお、スペクトル符号化部２０１と同一の構成要素には同一の符号を付し、その説明を省略する。

フィルタリング部２０４で用いられるフィルタは、次の（式２０）のように簡略化したものを用いる。

この式は、上記（式１３）において、Ｍ＝０、β_０＝１とした場合のフィルタ関数となっている。
このフィルタにより生成される第２スペクトルの推定値Ｓ２”（ｋ）は、以下の（式２１）を用いて、Ｔだけ離れた内部状態Ｓ（ｋ）の低域スペクトルを順次コピーすることにより求めることができる。

また、探索部２０５は、既に述べたのと同様に、最適な係数Ｔｍａｘを上記（式１５）を最小とするラグ係数Ｔを探索して決定する。このようにして求められた係数Ｔｍａｘは多重化部１１５に与えられる。

上記の構成を採ることにより、フィルタリング部２０４で用いるフィルタの構成が簡易なため、フィルタ係数算出部２０７が不要となり、少ない演算量で第２スペクトルの推定を行うことができる。すなわち、この構成によれば、符号化装置の構成が簡易となり、符号化処理の演算量を削減することができる。

次いで、上記のスペクトル符号化部２０１（またはスペクトル符号化部２０１ａ）で生成された符号化コードを復号化することができる復号側のスペクトル復号化部２５１の構成について以下詳細に説明する。

図１３は、本実施の形態に係るスペクトル復号化部２５１の主要な構成を示すブロック図である。なお、このスペクトル復号化部２５１は、実施の形態１に示したスペクトル復号化部１５３（図１０参照）と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。異なるのは拡張帯域スペクトル生成部１６３ａの内部構成である。

内部状態設定部２５２は、変形部１６２から出力される変形後の第１スペクトルＳ１’（ｋ）を使ってフィルタリング部２５３で用いられるフィルタの内部状態Ｓ（ｋ）を設定する。

フィルタリング部２５３は、符号化側のスペクトル符号化部２０１（２０１ａ）で生成された符号化コードから、分離部１６１を介してフィルタに関する情報を得る。具体的には、スペクトル符号化部２０１の場合は、ラグ係数Ｔｍａｘおよびフィルタ係数β_ｉが得られ、スペクトル符号化部２０１ａの場合には、ラグ係数Ｔｍａｘのみが得られる。そして、フィルタリング部２５３は、変形部１６２で生成された変形第１スペクトルＳ１’（ｋ）をフィルタの内部状態Ｓ（ｋ）として、取得したフィルタ情報に基づいてフィルタリングを行い、復号スペクトルＳ”（ｋ）を算出する。このフィルタリング方法は、符号化側のスペクトル符号化部２０１（２０１ａ）で用いられたフィルタ関数に依存し、スペクトル符号化部２０１の場合は、復号側でも上記（式１３）に従ってフィルタリングが行われ、スペクトル符号化部２０１ａの場合には、復号側でも上記（式２０）に従ってフィルタリングが行われる。

スペクトル概形復号化部２５４は、分離部１６１から与えられたスペクトル概形情報に基づいてスペクトル概形情報を復号する。本実施の形態では、サブバンド毎の変動量の量子化値Ｖｑ（ｊ）を用いる場合を例にとって説明を行う。

スペクトル調整部２５５は、フィルタリング部２５３から得られるスペクトルＳ”（ｋ）に、スペクトル概形復号化部２５４から得られるサブバンド毎の変動量の量子化値Ｖｑ（ｊ）を次の（式２２）に従って乗じることにより、スペクトルＳ”（ｋ）の周波数帯域ＦＬ≦ｋ＜ＦＨのスペクトル形状を調整し、第２スペクトルの推定値Ｓ２”（ｋ）を生成する。

ここで、ＢＬ（ｊ）およびＢＨ（ｊ）は、それぞれ第ｊサブバンドの最小周波数、最大周波数を表す。上記（式２２）に従って算出された第２スペクトルの推定値Ｓ２”（ｋ）は、スペクトル構成部１６５に与えられる。

スペクトル構成部１６５は、実施の形態１で前述したように、第１スペクトルＳ１（ｋ）と第２スペクトルの推定値Ｓ２”（ｋ）とを結合して復号スペクトルＳ３（ｋ）を生成し、時間領域変換部１６６に与える。

このように、本実施の形態に係る復号化装置（スペクトル復号化部２５１）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することができる。

（実施の形態３）
図１４は、本発明の実施の形態３に係るスペクトル符号化部の主要な構成を示すブロック図である。図１４において、図４と同一名称および同一符号を付したブロックは同一機能を有するので説明を省略する。本実施の形態３では、符号化側、復号化側で共通な情報を基にスペクトルのダイナミックレンジを調整する。これにより、スペクトルのダイナミックレンジを調整するダイナミックレンジ調整係数を表す符号化コードを出力する必要がない。ダイナミックレンジ調整係数を表す符号化コードを出力する必要がないために、ビットレートを低減することができる。

図１４におけるスペクトル符号化部３０１は、周波数領域変換部１１１と拡張帯域スペクトル符号化部１１４との間に、図４におけるスペクトル変形部１１２の代わりに、ダイナミックレンジ算出部３０２、変形情報推定部３０３、および変形部３０４を有する。実施の形態１におけるスペクトル変形部１１２は、第１スペクトルＳ１（ｋ）を様々に変形させることにより第１スペクトルのダイナミックレンジを変化させ、適切なダイナミックレンジとなる変形の仕方（変形情報）について調べ、この変形情報を符号化して出力する。一方、本実施の形態３では、符号化側および復号化側で共通な情報に基づきこの変形情報の推定を行い、推定変形情報に従い第１スペクトルＳ１（ｋ）の変形を行う。

したがって本実施の形態３では、スペクトル変形部１１２の代わりに、ダイナミックレンジ算出部３０２と、変形情報推定部３０３と、その推定変形情報に基づき第１スペクトルを変形する変形部３０４とを有する。なお、変形情報はスペクトル符号化部及び後述するスペクトル復号化部のそれぞれ内部にて推定により求められるため、スペクトル符号化部３０１から変形情報を符号化コードとして出力する必要がなく、このため図４のスペクトル符号化部１０６に配置されている多重化部１１５は必要としない。

周波数領域変換部１１１より第１スペクトルＳ１（ｋ）が出力され、ダイナミックレンジ算出部３０２と変形部３０４とに与えられる。ダイナミックレンジ算出部３０２は、第１スペクトルＳ１（ｋ）のダイナミックレンジを定量化し、その結果をダイナミックレンジ情報として出力する。ダイナミックレンジの定量化の手法としては、実施の形態１と同様に、第１スペクトルの周波数帯域を複数のサブバンドに分割し、所定の範囲のサブバンドのエネルギー（サブバンドエネルギー）を求め、当該サブバンドエネルギーの分散値を算出し、この分散値をダイナミックレンジ情報として出力する。

次に、図１５を用いて変形情報推定部３０３の説明を行う。変形情報推定部３０３には、ダイナミックレンジ算出部３０２よりダイナミックレンジ情報が入力され、切替部３０５に与えられる。切替部３０５は、前記ダイナミックレンジ情報を基に変形情報テーブル３０６内に記録されている推定変形情報の候補の中から１つの推定変形情報を選択し、出力する。変形情報テーブル３０６には０〜１の間の値をとる複数の推定変形情報の候補が記録されており、この候補はダイナミックレンジ情報と対応するようにあらかじめ学習によって決めておく。

図１６は変形部３０４の主要な構成を示すブロック図である。図６と同一名称および同一符号を付したブロックは同一の機能を有するので説明を省略する。図１６の変形部３０４における指数値算出部３０７は、変形情報推定部３０３より与えられる推定変形情報（０〜１の間をとる）に従い、絶対値算出部１３２から出力されるスペクトルの絶対振幅の指数値、すなわち、推定変形情報でべき乗した値を、正号／負号付与部１３４に出力する。正号／負号付与部１３４は、指数値算出部３０７から出力される指数値に対し、正号／負号抽出部１３１で先に求めておいた符号情報を付与し、変形第１スペクトルとして出力する。

以上説明したように、本実施の形態に係る符号化装置（スペクトル符号化部３０１）によれば、第１信号から求められる第１スペクトル（０≦ｋ＜ＦＬ）を使って、第２信号から求められる第２スペクトル（０≦ｋ＜ＦＨ）の高域部（ＦＬ≦ｋ＜ＦＨ）を推定し、推定情報を符号化する際に、第１スペクトルをそのまま用いずに、第１スペクトルに変形を加えた後に上記推定を行うようにすることで、推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。このとき、どのように変形したかを表す情報（変形情報）は、符号化側、復号化側で共通な情報（本実施の形態３では第１スペクトル）を基に変形情報を確定するために、変形情報に関する符号化コードを復号化部に伝送する必要がなく、ビットレートを低減させることが可能となる。

なお、変形情報推定部３０３において、変形情報テーブル３０６を用いた、第１スペクトルのダイナミックレンジ情報と推定変形情報との対応づけを行う代わりに、第１スペクトルのダイナミックレンジ情報を入力値、推定変形情報を出力値とするマッピング関数を用いても良い。この場合、関数の出力値である推定変形情報は０〜１の間の値をとるように制限される。

図１７は、本実施の形態３に係るスペクトル復号化部３５３の主要な構成を示すブロック図である。この構成において、図１０と同一名称および同一符号を付したブロックは同一の機能を有するため説明を省略する。周波数領域変換部１６４と拡張帯域スペクトル生成部１６３との間に、ダイナミックレンジ算出部３６１、変形情報推定部３６２、および変形部３６３を有する。図１０における変形部１６２は、符号化側のスペクトル変形部１１２で生成された変形情報を入力し、この変形情報に基づいて、周波数領域変換部１６４から与えられる第１スペクトルＳ１（ｋ）に変形を施す。これに対し本実施の形態３は、上記スペクトル符号化部３０１と同様に、符号化側および復号化側で共通な情報に基づきこの変形情報の推定を行い、推定変形情報にしたがって第１スペクトルＳ１（ｋ）の変形を行う。

したがって本実施の形態３では、ダイナミックレンジ算出部３６１、変形情報推定部３６２、および変形部３６３を有する。なお、上記スペクトル符号化部３０１と同様に、変形情報は、スペクトル復号化部の内部にて推定により求められるため、入力される符号化コードには変形情報が含まれていないため、図１０のスペクトル復号化部１５３に配置されている分離部１６１は必要としない。

周波数領域変換部１６４より第１スペクトルＳ１（ｋ）が出力され、ダイナミックレンジ算出部３６１と変形部３６３とに与えられる。以降、ダイナミックレンジ算出部３６１、変形情報推定部３６２、および変形部３６３の動作については、既に説明した符号化側のスペクトル符号化部３０１（図１４参照）内のダイナミックレンジ算出部３０２、変形情報推定部３０３、および変形部３０４と同様なので説明を省略する。なお、変形情報推定部３６２内の変形情報テーブルは、スペクトル符号化部３０１における変形情報推定部３０３内の変形情報テーブル３０６と同じ推定変形情報の候補が記録されている。

また、拡張帯域スペクトル生成部１６３、スペクトル構成部１６５、時間領域変換部１６６の動作は、実施の形態１の図１０に記載のものと同様なので、説明を省略する。

このように、本実施の形態に係る復号化装置（スペクトル復号化部３５３）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することで、推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

なお、本実施の形態では、変形情報推定部３０３において推定変形情報が求められるが、この推定変形情報を実施の形態１の図４記載のスペクトル符号化部１０６に適用してスペクトル変形部１１２に当該推定変形情報を与え、スペクトル変形部１１２では変形情報推定部３０３より与えられる推定変形情報を基準にその近傍の変形情報を指数変数テーブル１３５から選択し、その限定された変形情報の中から最も適切な変形情報を探索部１２５にて決定する。この構成では、最終的に選択された変形情報の符号化コードは、前記基準となる推定変形情報からの相対値として表される。このように正確な変形情報を符号化して復号化部へ伝送することができるため、復号信号の主観品質を維持しながら、変形情報を表すビット数を少なくすることができるという効果が得られる。

（実施の形態４）
本発明の実施の形態４では、第１レイヤ符号化部より与えられるピッチゲインに基づきスペクトル符号化部内の変形部に出力される推定変形情報を決定する。

図１８は、本実施の形態に係る階層符号化装置４００の主要な構成を示すブロック図である。図１８において図３と同一名称および同一符号を付したブロックは、同一機能を有するため説明を省略する。

本実施の形態４における階層符号化装置４００では、第１レイヤ符号化部４０２で求められたピッチゲインをスペクトル符号化部４０６に与える。具体的には、第１レイヤ符号化部４０２において、第１レイヤ符号化部４０２に内在する適応符号帳（図示せず）から出力される適応コードベクトルに乗じられる適応コードベクトルゲインが、ピッチゲインとして出力され、スペクトル符号化部４０６に入力される。この適応コードベクトルゲインは、入力信号の周期性が強い場合に大きな値をとり、入力信号の周期性が弱い場合に小さな値をとるという特徴がある。

図１９は、本実施の形態４に係るスペクトル符号化部４０６の主要な構成を示すブロック図である。図１９において図１４と同一名称および同一符号を付したブロックは、同一機能を有するので説明を省略する。変形情報推定部４１１は第１レイヤ符号化部４０２より与えられるピッチゲインを使って推定変形情報を出力する。変形情報推定部４１１は前述した図１５の変形情報推定部３０３と同様の構成となる。ただし、変形情報テーブルはピッチゲインに対して設計されたものを適用する。また、本実施の形態においても、変形情報テーブルを用いる構成の代わりにマッピング関数を用いる構成であっても良い。

このように、本実施の形態に係る符号化装置（スペクトル符号化部４０６）によれば、入力信号の周期性をも考慮して推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

次に、上記階層符号化装置４００で生成された符号化コードを復号化することができる階層復号化装置４５０の構成について、以下に説明する。

図２０は、本実施の形態に係る階層復号化装置４５０の主要な構成を示すブロック図である。図２０において、第１レイヤ復号化部４５２より出力されるピッチゲインがスペクトル復号化部４５３に与えられている。第１レイヤ復号化部４５２において、第１レイヤ復号化部４５２に内在する適応符号帳（図示せず）から出力される適応コードベクトルに乗じられる適応コードベクトルゲインが、ピッチゲインとして出力され、スペクトル復号化部４５３に入力される。

図２１は、本実施の形態４に係るスペクトル復号化部４５３の主要な構成を示すブロック図である。変形情報推定部４６１は第１レイヤ復号化部４５２より与えられるピッチゲインを使って推定変形情報を出力する。変形情報推定部４６１は前述した図１５の変形情報推定部３０３と同様の構成となる。ただし、変形情報テーブルは変形情報推定部４１１内のものと同様のもので、ピッチゲインに対して設計されたものを適用する。また、本実施の形態においても、変形情報テーブルを用いる構成の代わりにマッピング関数を用いる構成であっても良い。

このように、本実施の形態に係る復号化装置（スペクトル復号化部４５３）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することで、入力信号の周期性をも考慮して推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

なお、ピッチゲインと共にピッチ周期（第１レイヤ符号化部４０２に内在する適応符号帳探索の結果得られるラグのこと）を用いて変形情報を推定する構成であっても良い。この場合、ピッチ周期を利用することで、ピッチ周期の短い音声（例えば女声）とピッチ周期の長い音声（例えば男声）にそれぞれ適した変形情報の推定を行うことができ、推定精度を向上させることができる。

また、本実施の形態では、変形情報推定部４１１において推定変形情報が求められるが、実施の形態３と同様に、この推定変形情報を実施の形態１の図４記載のスペクトル符号化部１０６に適用してスペクトル変形部１１２に当該推定変形情報を与え、スペクトル変形部１１２では変形情報推定部４１１より与えられる推定変形情報を基準にその近傍の変形情報を指数変数テーブル１３５から選択し、その限定された変形情報の中から最も適切な変形情報を探索部１２５にて決定する。この構成では、最終的に選択された変形情報の符号化コードは、前記基準となる推定変形情報からの相対値として表される。このように正確な変形情報を符号化して復号化部へ伝送することができるため、復号信号の主観品質を維持しながら、変形情報を表すビット数を少なくすることができるという効果が得られる。

（実施の形態５）
本発明の実施の形態５では、第１レイヤ符号化部より与えられるＬＰＣ係数に基づきスペクトル符号化部内の変形部に出力される推定変形情報を決定する。

本実施の形態５における階層符号化装置の構成は前述した図１８と同様となる。ただし、第１レイヤ符号化部４０２からスペクトル符号化部４０６に対して出力されるパラメータは、ピッチゲインではなくＬＰＣ係数である。

本実施の形態に係るスペクトル符号化部４０６の主要な構成は、図２２に示すものとなる。前述した図１９との違いは、変形情報推定部５１１に与えられるパラメータがピッチゲインではなくＬＰＣ係数であることと、変形情報推定部５１１内の構成である。

図２３は、本実施の形態に係る変形情報推定部５１１の主要な構成を示すブロック図である。変形情報推定部５１１は、判定テーブル５１２、類似度判定部５１３、変形情報テーブル５１４、および切替部５１５より構成される。変形情報テーブル５１４は、図１５における変形情報テーブル３０６と同様に推定変形情報の候補が記録されている。ただし、この推定変形情報の候補は、ＬＰＣ係数に対して設計されたものを適用する。判定テーブル５１２にはＬＰＣ係数の候補が格納されており、判定テーブル５１２と変形情報テーブル５１４とは対応付けが為されている。すなわち、判定テーブル５１２から第ｊ番目のＬＰＣ係数の候補が選ばれたとき、そのＬＰＣ係数候補に適した推定変形情報は変形情報テーブル５１４の第ｊ番目に格納されている。ＬＰＣ係数はスペクトルの概形（スペクトル包絡）を少ないパラメータで精度良く表現できるという特徴があり、このスペクトル概形とダイナミックレンジを制御する推定変形情報を対応付けることができる。本実施の形態は、この特徴を利用して構成したものである。

類似度判定部５１３は、第１レイヤ符号化部４０２より与えられるＬＰＣ係数と最も類似するＬＰＣ係数を判定テーブル５１２の中から求める。この類似性の判定には、ＬＰＣ係数同士の距離（歪）、またはＬＰＣ係数をＬＳＰ（ＬｉｎｅＳｐｅｃｔｒｕｍＰａｉｒ）係数などの別のパラメータに変換した後の両者の歪を求め、その歪が最小となるときのＬＰＣ係数を判定テーブル５１２より求める。

歪を最小（つまり最も類似度が高い）とするときの判定テーブル５１２内のＬＰＣ係数の候補を表すインデックスが類似度判定部５１３より出力され、切替部５１５に与えられる。切替部５１５は、このインデックスが表す推定変形情報の候補を選択し、変形情報推定部５１１より出力される。

このように、本実施の形態に係る符号化装置（スペクトル符号化部４０６）によれば、入力信号のスペクトル概形をも考慮して推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

次に、本実施の形態５における階層符号化装置で生成された符号化コードを復号化することができる階層復号化装置の構成について、以下説明する。

本実施の形態５における階層復号化装置の構成は前述した図２０と同様となる。ただし、第１レイヤ復号化部４５２からスペクトル復号化部４５３に対して出力されるパラメータは、ピッチゲインではなくＬＰＣ係数である。

本実施の形態に係るスペクトル復号化部４５３の主要な構成は、図２４に示すものとなる。前述した図２１との違いは、変形情報推定部５６１に与えられるパラメータがピッチゲインではなくＬＰＣ係数であることと、変形情報推定部５６１内の構成である。

変形情報推定部５６１内の構成は、図２２におけるスペクトル符号化部４０６内の変形情報推定部５１１、すなわち図２３に記載のものと同様となり、判定テーブル５１２及び変形情報テーブル５１４に記録された情報も、符号化側と復号化側とで共通のものである。

このように、本実施の形態に係る復号化装置（スペクトル復号化部４５３）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することで、入力信号のスペクトル概形をも考慮して推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。

なお、本実施の形態では、変形情報推定部５１１において推定変形情報が求められるが、実施の形態４と同様に、この推定変形情報を実施の形態１の図４記載のスペクトル符号化部１０６に適用してスペクトル変形部１１２に当該推定変形情報を与え、スペクトル変形部１１２では変形情報推定部５１１より与えられる推定変形情報を基準にその近傍の変形情報を指数変数テーブル１３５から選択し、その限定された変形情報の中から最も適切な変形情報を探索部１２５にて決定する。この構成では、最終的に選択された変形情報の符号化コードは、前記基準となる推定変形情報からの相対値として表される。このように正確な変形情報を符号化して復号化部へ伝送することができるため、復号信号の主観品質を維持しながら、変形情報を表すビット数を少なくすることができるという効果が得られる。

（実施の形態６）
本発明の実施の形態６に係る階層符号化装置の基本的構成は、実施の形態１に示した階層符号化装置と同様であるので、その説明を省略し、スペクトル変形部１１２と異なる構成であるスペクトル変形部６１２について以下説明する。

スペクトル変形部６１２は、第１スペクトルＳ１（ｋ）［０≦ｋ＜ＦＬ］のダイナミックレンジが、第２スペクトルＳ２（ｋ）の高域部［ＦＬ≦ｋ＜ＦＨ］のダイナミックレンジに近づくように、第１スペクトルＳ１（ｋ）に以下の変形を加える。スペクトル変形部６１２は、この変形に関する変形情報を符号化して出力する。

図２５は、本実施の形態に係るスペクトル変形方法を説明するための図である。

この図は、第１スペクトルＳ１（ｋ）の振幅の分布を示している。第１スペクトルＳ１（ｋ）は、周波数ｋ［０≦ｋ＜ＦＬ］の値によって異なる振幅を示す。そこで、横軸に振幅をとり、縦軸にその振幅における出現確率をとると、振幅の平均値ｍ１を中心として図に示すような正規分布に近い分布が現れる。

本実施の形態では、まず、この分布を、平均値ｍ１に近いグループ（図中の領域Ｂ）と、平均値ｍ１から遠いグループ（図中の領域Ａ）とに大きく分ける。次に、これら２つのグループの振幅の代表値、具体的には、領域Ａに含まれるスペクトルの振幅の平均値と、領域Ｂに含まれるスペクトルの振幅の平均値とを求める。ここで、振幅は、平均値ｍ１を零と換算し直した（各値から平均値ｍ１を減じた）場合の振幅の絶対値を用いる。例えば、領域Ａは、平均値ｍ１よりも振幅の大きい領域と、平均値ｍ１よりも振幅の小さな領域との２つの領域から成るが、平均値ｍ１を零と換算し直すことにより、２つの領域に含まれるスペクトルの振幅の絶対値は、同じ様な値を有することになる。よって、例えば領域Ａの平均値であれば、第１スペクトルのうちで換算後の振幅（絶対値）が比較的大きなスペクトルを１つのグループとし、このグループの振幅の代表値を求めたことに相当し、領域Ｂの平均値であれば、第１スペクトルのうちで換算後の振幅が比較的小さなスペクトルを１つのグループとし、このグループの振幅の代表値を求めたことに相当している。よって、これら２つの代表値は、第１スペクトルのダイナミックレンジを概略的に表現したパラメータとなる。

次に、本実施の形態では、第２スペクトルに対し、第１スペクトルで行ったのと同様の処理を行い、第２スペクトルの各グループに対応する代表値を求める。そして、領域Ａにおける第１スペクトルの代表値と第２スペクトルの代表値との比（具体的には、第２スペクトルの代表値の第１スペクトルの代表値に対する比）、および領域Ｂにおける第１スペクトルの代表値と第２スペクトルの代表値との比を求める。よって、第１スペクトルのダイナミックレンジと第２スペクトルのダイナミックレンジとの比を概算的に求めることができる。本実施の形態に係るスペクトル変形部は、この比をスペクトルの変形情報として符号化し、出力する。

図２６は、スペクトル変形部６１２内部の主要な構成を示すブロック図である。

スペクトル変形部６１２は、第１スペクトルの上記各グループに対する代表値を算出する系統と、第２スペクトルの上記各グループに対する代表値を算出する系統と、これら２つの系統で算出された代表値に基づいて変形情報を決定する変形情報決定部６２６と、この変形情報に基づいて変形スペクトルを生成する変形スペクトル生成部６２７とに大別される。

第１スペクトルの代表値を算出する系統は、具体的には、ばらつき度算出部６２１−１と、第１閾値設定部６２２−１と、第２閾値設定部６２３−１と、第１平均スペクトル算出部６２４−１と、第２平均スペクトル算出部６２５−１とからなる。第２スペクトルの代表値を算出する系統も、基本的には、第１スペクトルの代表値を算出する系統と同様の構成からなり、図中において同一の構成に対しては同一の符号を付し、符号の後に続く枝番により処理系統の違いを表す。そして、同一の構成要素については、その説明を省略する。

ばらつき度算出部６２１−１は、入力される第１スペクトルＳ１（ｋ）の振幅の分布から、第１スペクトルの平均値ｍ１からの「ばらつき度」を算出し、第１閾値設定部６２２−１および第２閾値設定部６２３−１に出力する。「ばらつき度」とは、具体的には、第１スペクトルの振幅分布の標準偏差σ１のことである。

第１閾値設定部６２２−１は、ばらつき度算出部６２１−１で求まった第１スペクトルの標準偏差σ１を用いて第１閾値ＴＨ１を求める。ここで、第１閾値ＴＨ１とは、第１スペクトルのうち、上記領域Ａに含まれる比較的絶対振幅の大きなスペクトルを特定するための閾値であり、標準偏差σ１に所定の定数ａを乗じた値が使用される。

第２閾値設定部６２３−１の動作も、第１閾値設定部６２２−１の動作と同様であるが、求める第２閾値ＴＨ２は、第１スペクトルのうちの領域Ｂに含まれる比較的絶対振幅の小さなスペクトルを特定するための閾値であり、標準偏差σ１に所定の定数ｂ（＜ａ）を乗じた値が使用される。

第１平均スペクトル算出部６２４−１は、第１閾値ＴＨ１よりも外側に位置するスペクトル、すなわち、領域Ａに含まれるスペクトルの振幅の平均値（以下、第１平均値という）を求め、変形情報決定部６２６に出力する。

具体的には、第１平均スペクトル算出部６２４−１は、第１スペクトルの各サブバンドのスペクトルの振幅（ただし、換算前の値）を、第１スペクトルの平均値ｍ１に第１閾値ＴＨ１を加えた値（ｍ１＋ＴＨ１）と比較し、この値よりも大きな振幅を有するスペクトルを特定する（ステップ１）。次に、第１平均スペクトル算出部６２４−１は、第１スペクトルの各サブバンドのスペクトルの振幅値を、第１スペクトルの平均値ｍ１から第１閾値ＴＨ１を減じた値（ｍ１−ＴＨ１）と比較し、この値よりも小さな振幅を有するスペクトルを特定する（ステップ２）。そして、ステップ１およびステップ２の双方で求まったスペクトルの振幅に対し、上記の平均値ｍ１をゼロとする換算を行い、得られた換算値の絶対値の平均値を求め、変形情報決定部６２６に出力する。

第２平均スペクトル算出部は、第２閾値ＴＨ２よりも内側に位置するスペクトル、すなわち、領域Ｂに含まれるスペクトルの振幅の平均値（以下、第２平均値という）を求め、変形情報決定部６２６に出力する。具体的な動作は、第１平均スペクトル算出部６２４−１と同様である。

上記処理で求まった第１平均値および第２平均値が、第１スペクトルの領域Ａおよび領域Ｂに対する代表値である。

第２スペクトルの代表値を求める処理も基本的には上記と同様である。ただし、第１スペクトルと第２スペクトルとは異なるスペクトルであるので、第１閾値ＴＨ１に準ずる第３閾値ＴＨ３は、第２スペクトルの標準偏差σ２に所定の定数ｃを乗じた値が使用され、第２閾値ＴＨ２に準ずる第４閾値ＴＨ４は、第２スペクトルの標準偏差σ２に所定の定数ｄ（＜ｃ）を乗じた値が使用される。

変形情報決定部６２６は、第１平均スペクトル算出部６２４−１で得られる第１平均値、第２平均スペクトル算出部６２５−１で得られる第２平均値、第３平均スペクトル算出部６２４−２で得られる第３平均値、および第４平均スペクトル算出部６２５−２で得られる第４平均値を用いて、以下のように変形情報を決定する。

すなわち、変形情報決定部６２６は、第１平均値と第３平均値との比（以下、第１ゲインと呼ぶ）、および第２平均値と第４平均値との比（以下、第２ゲインと呼ぶ）を算出する。そして、変形情報決定部６２６は、変形情報の複数の符号化候補が予め記憶されたデータテーブルを内部に備えているので、第１ゲインおよび第２ゲインをこれらの符号化候補と比較し、最も類似した符号化候補を選択して、この符号化候補を表すインデックスを変形情報として出力する。また、このインデックスは、変形スペクトル生成部６２７にも送られる。

変形スペクトル生成部６２７は、入力信号である第１スペクトル、第１閾値設定部６２２−１で得られる第１閾値ＴＨ１、第２閾値設定部６２３−１で得られる第２閾値ＴＨ２、および変形情報決定部６２６から出力される変形情報、を用いて、第１スペクトルの変形を行い、生成された変形スペクトルを出力する。

図２７、図２８は、変形スペクトルの生成方法を説明するための図である。

変形スペクトル生成部６２７は、変形情報を用いて第１平均値と第３平均値との比の復号値（以下、復号第１ゲインと呼ぶ）、および第２平均値と第４平均値との比の復号値（以下、復号第２ゲインと呼ぶ）を生成する。これらの対応関係は、図２７に示す通りである。

次に、変形スペクトル生成部６２７は、第１スペクトルの振幅値と第１閾値ＴＨ１とを比較することにより、領域Ａに属するスペクトルを特定し、これらのスペクトルに復号第１ゲインを乗じる。同様に、変形スペクトル生成部６２７は、第１スペクトルの振幅値と第２閾値ＴＨ２とを比較することにより、領域Ｂに属するスペクトルを特定し、これらのスペクトルに復号第２ゲインを乗じる。

一方、図２８に示す通り、第１スペクトルのうち、第１閾値ＴＨ１と第２閾値ＴＨ２とに挟まれる領域（以下、領域Ｃ）に属するスペクトルに対しては、符号化情報が存在しない。そこで、変形スペクトル生成部６２７は、復号第１ゲインと復号第２ゲインの中間的な値を有するゲインを使用する。例えば、図２８に示されるような、復号第１ゲインと、復号第２ゲインと、第１閾値ＴＨ１と、第２閾値ＴＨ２とに基づく特性曲線から、ある振幅ｘに対応する復号ゲインｙを求め、このゲインを第１スペクトルの振幅に乗じれば良い。すなわち、復号ゲインｙは、復号第１ゲインおよび復号第２ゲインの線形補間値となっている。

図２９は、復号化装置で使用されるスペクトル変形部６６２内部の主要な構成を示したブロック図である。なお、このスペクトル変形部６６２は、実施の形態１で示した変形部１６２に対応するものである。

基本的動作は上記のスペクトル変形部６１２と同様なので、詳細な説明は省略するが、このスペクトル変形部６６２は、第１スペクトルのみを処理対象とするので、処理系統が１つとなっている。

このように、本実施の形態によれば、第１スペクトルの振幅の分布および第２スペクトルの振幅の分布をそれぞれ把握し、比較的絶対振幅の大きなグループと比較的絶対振幅の小さなグループとに分けて、各グループの振幅の代表値を求める。そして、第１スペクトルと第２スペクトルの各グループの振幅の代表値の比をとることにより、第１スペクトルおよび第２スペクトル間のダイナミックレンジの比、すなわちスペクトルの変形情報を得て、これを符号化する。これにより、指数関数のような演算量の多い関数を用いることなく、変形情報を求めることができる。

また、本実施の形態によれば、第１スペクトルおよび第２スペクトルの振幅の分布から標準偏差を求め、この標準偏差に基づいて第１閾値〜第４閾値を求める。よって、実際のスペクトルに基づいた閾値が設定されるので、変形情報の符号化精度を向上させることができる。

また、本実施の形態によれば、復号第１ゲインおよび復号第２ゲインを用いて第１スペクトルのゲイン調整を行うことにより、第１スペクトルのダイナミックレンジを制御する。そして、復号第１ゲインおよび復号第２ゲインは、第１スペクトルが第２スペクトルの高域部に近づくように決定される。よって、第１スペクトルのダイナミックレンジは、第２スペクトルの高域部のダイナミックレンジに近づく。さらに、復号第１ゲインおよび復号第２ゲインの算出には、指数関数のような演算量の多い関数を使用する必要がない。

なお、本実施の形態では、復号第１ゲインが復号第２ゲインよりも大きい場合を例にとって説明したが、音声信号の性質によっては、復号第１ゲインよりも復号第２ゲインの方が大きい場合がある。すなわち、第１スペクトルのダイナミックレンジよりも第２スペクトルの高域部のダイナミックレンジの方が大きい場合がある。このような現象は、入力音声信号が摩擦音のような音の場合に生じることが多い。かかる場合にも本実施の形態に係るスペクトル変形方法は適用することができる。

また、本実施の形態では、スペクトルを絶対振幅の比較的大きなグループと比較的小さなグループとの２つのグループに分ける場合を例にとって説明したが、ダイナミックレンジの再現性を高めるために、より多くのグループに分けるようにしても良い。

また、本実施の形態では、平均値を基準として振幅を換算し、この換算後の振幅に基づいて、スペクトルを振幅の比較的大きなグループと比較的小さなグループとに分ける場合を例にとって説明したが、元の振幅値をそのまま用いて、この振幅に基づいてスペクトルのグルーピングを行っても良い。

また、本実施の形態では、スペクトルの絶対振幅のばらつき度を算出するのに標準偏差を用いる場合を例にとって説明したが、これに限定されず、例えば、標準偏差と同様の統計的パラメータとして分散を用いることができる。

また、本実施の形態では、各グループのスペクトル振幅の代表値として、各グループにおけるスペクトルの絶対振幅の平均値を用いる場合を例にとって説明したが、これに限定されず、例えば、各グループにおけるスペクトルの絶対振幅の中央値等を用いても良い。

また、本実施の形態では、ダイナミックレンジの調整に各スペクトルの振幅値を用いる場合を例にとって説明したが、振幅値の代わりにスペクトルのエネルギー値を用いても良い。

また、各グループに対応する代表値を求める際に、例えばＭＤＣＴ係数のように、最初からスペクトルの振幅に正または負の符号を持つ場合には、平均値を零と換算する必要はなく、単にスペクトルの振幅の絶対値を用いて各グループに対応する代表値を求めれば良い。

以上、本発明の各実施の形態について説明した。

本発明に係る符号化装置および復号化装置は、上記各実施の形態に限定されず、種々変更して実施することが可能である。

本発明に係る符号化装置および復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。

なお、ここでは、本発明をスケーラブル符号化方式に適用する場合を例にとって説明したが、本発明は別の符号化方式にも適用可能である。

また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。例えば、本発明に係る符号化方法（復号化方法）のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置（復号化装置）と同様の機能を実現することができる。

また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されていても良いし、一部または全てを含むように１チップ化されていても良い。

また、ここではＬＳＩとしたが、集積度の違いによって、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩ等と呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現しても良い。ＬＳＩ製造後に、プログラム化することが可能なＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）や、ＬＳＩ内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。

さらに、半導体技術の進歩または派生する別技術により、ＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適応等が可能性としてあり得る。

本明細書は、２００４年５月１４日出願の特願２００４−１４５４２５、２００４年１１月５日出願の特願２００４−３２２９５３、および２００５年４月２８日出願の特願２００５−１３３７２９に基づく。これらの内容はすべてここに含めておく。

本発明に係る符号化装置、復号化装置、およびこれらの方法は、スケーラブル符号化／復号化等に適用できる。

音声信号を符号化する音声符号化に、ＩＴＵ−Ｔ（International Telecommunication Union Telecommunication Standardization Sector）で規格化されているＧ７２６、Ｇ７２９等の方式が存在する。これらの方式は、狭帯域信号（３００Ｈｚ〜３．４ｋＨｚ）を対象とし、８ｋｂｉｔ／ｓ〜３２ｋｂｉｔ／ｓで符号化が行える。これら方式は低ビットレートで符号化できるものの、対象としている狭帯域信号は周波数帯域が最大３．４ｋＨｚまでと狭いため、その品質はこもっており臨場感に欠ける傾向にある。

また、ＩＴＵ−Ｔや３ＧＰＰ（The 3rd Generation Partnership Project）には、信号帯域が５０Ｈｚ〜７ｋＨｚの音声を符号化する標準方式（Ｇ．７２２、Ｇ．７２２．１、ＡＭＲ−ＷＢ等）が存在する。これらの方式は、ビットレートが６．６ｋｂｉｔ／ｓ〜６４ｋｂｉｔ／ｓで広帯域音声信号の符号化が行えるものの、広帯域音声を高品質に符号化するためには比較的ビットレートを高くする必要がある。また音質の観点では、広帯域音声は狭帯域音声に比べ高音質であるものの、高臨場感が要求されるサービスに対しては十分とは言い難い。

一般に、信号の最大周波数が１０〜１５ｋＨｚ程度まであるとＦＭラジオ相当の臨場感が得られ、２０ｋＨｚ程度までであればＣＤ並みの品質が得られる。このような帯域を有する信号に対しては、ＭＰＥＧ（Moving Picture Expert Group）で規格化されているレイヤ３方式やＡＡＣ方式等に代表されるオーディオ符号化が適している。しかしながら、これらオーディオ符号化方式を音声通信の符号化方式として適用する場合には、音声を品質よく符号化するためにビットレートを高く設定する必要がある。その他に符号化遅延が大きくなる、等の問題がある。

また、本発明の復号化装置は、符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換手段と、前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復
号化する復号化手段と、前記符号化装置で生成された符号に含まれるスペクトル変形情報に従って前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、を具備し、前記復号化手段は、前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する構成を採る。

周波数領域変換部１１１は、入力される第１信号Ｓ１に周波数変換を行い、低域スペクトルである第１スペクトルＳ１(ｋ)を算出する。一方、周波数領域変換部１１３は、入力される第２信号Ｓ２に周波数変換を行い、広帯域の第２スペクトルＳ２(ｋ)を算出する。ここで周波数変換の方法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を適用する。また、Ｓ１(ｋ)は、第１スペクトル
の周波数ｋのサブバンドのスペクトルであり、Ｓ２(ｋ)は、第２スペクトルの周波数ｋのサブバンドのスペクトルである。

スペクトル変形部１１２は、第１スペクトルＳ１(ｋ)を様々に変形させることにより第１スペクトルのダイナミックレンジを変化させ、適切なダイナミックレンジとなる変形の仕方について調べる。そして、この変形に関する情報（変形情報）を符号化して多重化部１１５に与える。このスペクトル変形処理の詳細については後ほど詳述する。また、スペクトル変形部１１２は、適切なダイナミックレンジとなった第１スペクトルＳ１(ｋ)を拡張帯域スペクトル符号化部１１４に出力する。

拡張帯域スペクトル符号化部１１４は、第２スペクトルＳ２(ｋ)を参照信号として、第１スペクトルＳ１(ｋ)の高域（ＦＬ≦ｋ＜ＦＨ）に含めるべきスペクトル（拡張帯域スペクトル）を推定し、この推定スペクトルに関する情報（推定情報）を符号化して多重化部１１５に与える。ここで、拡張帯域スペクトルの推定は、変形後の第１スペクトルＳ１'(ｋ)に基づいて行われる。

スペクトル変形部１１２は、第１スペクトルＳ１(ｋ)のダイナミックレンジが第２スペクトルＳ２(ｋ)の高域スペクトル（ＦＬ≦ｋ＜ＦＨ）のダイナミックレンジに最も近付くような変形を第１スペクトルＳ１(ｋ)に加える。そして、このときの変形情報を符号化して出力する。

バッファ１２１は、入力された第１スペクトルＳ１(ｋ)を一時保存し、必要に応じ第１スペクトルＳ１(ｋ)を変形部１２２に与える。

変形部１２２は、下記の手順に従い、第１スペクトルＳ１(ｋ)を様々に変形して変形第１スペクトルＳ１'（ｊ，ｋ）を生成し、これをサブバンドエネルギー算出部１２３に与える。ここで、ｊは各変形処理を識別するためのインデックスである。

サブバンドエネルギー算出部１２３は、変形第１スペクトルＳ'（ｊ，ｋ）の周波数帯域を複数のサブバンドに分割し、所定の範囲のサブバンドのエネルギー（サブバンドエネルギー）を求める。例えば、サブバンドエネルギーを求める範囲をＦ１Ｌ≦ｋ＜Ｆ１Ｈと定めたとき、この帯域幅をＮ分割したときのサブバンド幅ＢＷＳは次の（式１）のように表される。
ＢＷＳ＝（Ｆ１Ｈ−Ｆ１Ｌ＋１）／Ｎ・・・（式１）
よって、第ｎサブバンドの最小周波数Ｆ１Ｌ(ｎ)および最大周波数Ｆ１Ｈ(ｎ)は、それぞれ（式２）（式３）と表される。
Ｆ１Ｌ(ｎ) ＝Ｆ１Ｌ＋ｎ・ＢＷＳ・・・（式２）
Ｆ１Ｈ(ｎ) ＝Ｆ１Ｌ＋（ｎ＋１）・ＢＷＳ−１・・・（式３）
ここでｎは０〜Ｎ−１の値をとる。このとき、サブバンドエネルギーＰ１(ｊ，ｎ)は次の（式４）のように算出される。

このようにして求められたサブバンドエネルギーＰ１(ｊ，ｎ)が分散算出部１２４に与えられる。

分散算出部１２４は、サブバンドエネルギーＰ１(ｊ，ｎ)のばらつきの程度を表すために、分散σ１^２(ｊ）を次の（式６）に従い算出する。

ここで、Ｐ１ｍｅａｎ(ｊ）はサブバンドエネルギーＰ１(ｊ，ｎ）の平均値を表し、次の（式７）のように算出される。

このようにして算出された、変形情報ｊにおけるサブバンドエネルギーのばらつきの度合いを表す分散σ１^２(ｊ）は探索部１２５に与えられる。

サブバンドエネルギー算出部１２６および分散算出部１２７は、上記のサブバンドエネルギー算出部１２３および分散算出部１２４で行われる一連の処理と同様に、入力される第２スペクトルＳ２(ｋ)に対して、サブバンドエネルギーのばらつきの度合いを表す分散σ２^２を算出する。ただし、サブバンドエネルギー算出部１２６および分散算出部１２７の処理は、以下の点で上記と異なる。すなわち、第２スペクトルＳ２(ｋ)のサブバンドエネルギーを算出する所定の範囲を、Ｆ２Ｌ≦ｋ＜Ｆ２Ｈと定める。ここで、第１スペクトルのダイナミックレンジを第２スペクトルの高域スペクトルのダイナミックレンジに近づける必要があることから、ＦＬ≦Ｆ２Ｌ＜Ｆ２Ｈの条件を満足するＦ２Ｌを設定する。また、第２スペクトルに対するサブバンド数は、第１スペクトルのサブバンド数Ｎと一致させる必要はない。ただし、第１スペクトルのサブバンド幅と第２スペクトルのサブバンド幅とがほぼ一致するように、第２スペクトルのサブバンド数は設定される。

変形部１２８は、この最適変形情報ｊｏｐｔに対応する変形第１スペクトルＳ'(ｊｏｐｔ，ｋ)を生成し、スペクトル変形部１１２の外部に出力する。なお、最適変形情報ｊｏｐｔは多重化部１１５に、変形第１スペクトルＳ１'(ｊｏｐｔ，ｋ)は拡張帯域スペクトル符号化部１１４に送られる。

指数変数テーブル１３５は、第１スペクトルの変形に用いられる指数変数α(ｊ)を記録している。このテーブルに含まれる変数のうちｊに対応する値が、指数変数テーブル１３５から出力される。具体的には、指数変数テーブル１３５には、例えば、指数変数α(ｊ)
＝｛1.0, 0.8, 0.6, 0.4}の４つからなる指数変数の候補が記録されており、探索部１２５から指定されたインデックスｊに基づき１つの指数変数α(ｊ)が選択され、指数値算出部１３３に与えられる。

指数値算出部１３３は、指数変数テーブル１３５から出力された指数変数を用いて、絶対値算出部１３２から出力されるスペクトル（絶対値）の指数値、すなわち、各サブバンドの振幅の絶対値をα(ｊ)でべき乗した値を算出する。

正号／負号付与部１３４は、指数値算出部１３３から出力される指数値に対し、正号／負号抽出部１３１で先に求めておいた符号情報ｓｉｇｎ（ｋ）を付与し、変形第１スペクトルＳ１'(ｊ，ｋ)として出力する。

よって変形部１２２から出力される変形第１スペクトルＳ１'(ｊ，ｋ)は、次の（式８）のように表される。

なお、ここでは、指数変数α(ｊ) ＝｛1.0, 0.6, 0.2｝の場合を例にとって説明している。また、ここでは、各スペクトルの比較が容易となるように、α(ｊ) ＝ 1.0 の場合のスペクトルＳ７１を上方に４０ｄＢ、α(ｊ) ＝ 0.6 の場合のスペクトルＳ７２を上方に２０ｄＢだけシフトさせて表示をしている。この図から、指数変数α(ｊ)によって、スペクトルのダイナミックレンジを変化させることが可能であることがわかる。

以上説明したように、本実施の形態に係る符号化装置（スペクトル符号化部１０６）によれば、第１信号（０≦ｋ＜ＦＬ）から求められる第１スペクトルを使って、第２信号（０≦ｋ＜ＦＨ）から求められる第２スペクトルの高域部（ＦＬ≦ｋ＜ＦＨ）を推定し、推定情報を符号化する際に、第１スペクトルをそのまま用いずに、第１スペクトルに変形を加えた後に上記推定を行うようにする。このとき、どのように変形したかを表す情報（変
形情報）も併せて符号化し、復号化側に伝送する。

絶対値算出部１３２は、入力された第１スペクトルＳ１(ｋ)の各スペクトルの絶対値を算出し、平均値算出部１４２および変形スペクトル算出部１４３に出力する。平均値算出部１４２は、次の（式９）に従いスペクトルの絶対値の平均値Ｓ１ｍｅａｎを算出する。

乗数テーブル１４４には、変形スペクトル算出部１４３で使用される乗数の候補が記録されており、探索部１２５から指定されたインデックスに基づいて１つの乗数が選択され、変形スペクトル算出部１４３に出力される。ここでは、乗数テーブルに、乗数ｇ(ｊ) ＝｛1.0, 0.9, 0.8, 0.7｝の４候補が記録されているものとする。

変形スペクトル算出部１４３は、絶対値算出部１３２から出力された第１スペクトルの絶対値と、乗数テーブル１４４から出力された乗数ｇ（ｊ）とを用いて、変形スペクトルＳ１'(ｋ)の絶対値を次の（式１０）に従い算出し、正号／負号付与部１３４に出力する。

正号／負号付与部１３４は、変形スペクトル算出部１４３から出力された変形スペクトルＳ１'(ｋ)の絶対値に、正号／負号抽出部１３１で得られた符号情報ｓｉｇｎ（ｋ）を付与し、次の（式１１）で表される最終的な変形スペクトルＳ１'(ｋ)を生成し、出力する。

スペクトル復号化部１５３には、分離部１５１で分離された符号化コードＳ５２と第１レイヤ復号化部１５２から出力される第１レイヤ復号信号Ｓ５３とが与えられる。スペクトル復号化部１５３は、後述のスペクトル復号化を行い、信号帯域０≦ｋ＜ＦＨの広帯域の復号信号を生成し、これを出力する。スペクトル復号化部１５３では、第１レイヤ復号化部１５２から与えられる第１レイヤ復号信号Ｓ５３を第１信号とみなして処理を行うことになる。

周波数領域変換部１６４は、入力された時間領域信号である第１レイヤ復号信号Ｓ５３に対し周波数変換を施し、第１スペクトルＳ１(ｋ)を算出する。この周波数変換法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を使用する。

変形部１６２は、分離部１６１から与えられる変形情報に基づいて、周波数領域変換部１６４から与えられる第１スペクトルＳ１(ｋ)に変形を加え、変形第１スペクトルＳ１'(ｋ)を生成する。なお、この変形部１６２内部の構成は、既に説明した符号化側の変形部１２２（図６参照）と同様なので、説明を省略する。

拡張帯域スペクトル生成部１６３は、変形後の第１スペクトルＳ１'(ｋ)を用いて、第１スペクトルＳ１(ｋ)の拡張帯域ＦＬ≦ｋ＜ＦＨに含めるべき第２スペクトルの推定値Ｓ２”(ｋ)を生成し、この第２スペクトルの推定値Ｓ２”(ｋ)をスペクトル構成部１６５に与える。

スペクトル構成部１６５は、周波数領域変換部１６４から与えられる第１スペクトルＳ１(ｋ)と、拡張帯域スペクトル生成部１６３から与えられる第２スペクトルの推定値Ｓ２”(ｋ)とを結合し、復号スペクトルＳ３（ｋ）を生成する。この復号スペクトルＳ３（ｋ）は次の（式１２）のように表される。

内部状態設定部２０３は、スペクトル変形部１１２にて生成された変形第１スペクトル
Ｓ１'(ｋ)を使ってフィルタリング部２０４で用いられるフィルタの内部状態Ｓ（ｋ）を設定する。

フィルタリング部２０４は、内部状態設定部２０３で設定されたフィルタの内部状態Ｓ（ｋ）と、ラグ係数設定部２０６から与えられるラグ係数Ｔとに基づいてフィルタリングを行い、第２スペクトルの推定値Ｓ２”(ｋ)を算出する。なお、本実施の形態では、フィルタを次の（式１３）で表されるものを使用した場合について説明する。

この式に従う処理を、ＦＬ≦ｋ＜ＦＨの間に行う。ここでＳ（ｋ）は、フィルタの内部状態を表す。このとき算出されるＳ(ｋ)（ただし、ＦＬ≦ｋ＜ＦＨ）が、第２スペクトルの推定値Ｓ２”(ｋ)として利用される。

探索部２０５は、周波数領域変換部１１３から与えられる第２スペクトルＳ２(ｋ)と、フィルタリング部２０４から与えられる第２スペクトルの推定値Ｓ２”(ｋ)との類似度を算出する。

この方法では、最適なラグ係数Ｔを算出した後にフィルタ係数β_ｉを決定することになる。ここで、ＥはＳ２(ｋ)とＳ２”(ｋ)間の２乗誤差を表す。また、上記（式１５）の右辺第１項は、ラグ係数Ｔに関わらず固定値となるので、（式１５）の右辺第２項を最大とするＳ２”(ｋ)を生成するラグ係数Ｔが探索されることになる。本実施の形態では、（式１５）の右辺第２項を類似度と呼ぶことにする。

ラグ係数設定部２０６は、予め定められた探索範囲ＴＭＩＮ〜ＴＭＡＸに含まれるラグ係数Ｔを順次フィルタリング部２０４に出力する。そのため、フィルタリング部２０４では、ラグ係数設定部２０６からラグ係数Ｔが与えられる度に、ＦＬ≦ｋ＜ＦＨの範囲のＳ（ｋ）をゼロクリアした後のフィルタリングが行われ、探索部２０５では、その度に類似度が算出される。探索部２０５は、算出される類似度が最大となるときの係数ＴｍａｘをＴＭＩＮ〜ＴＭＡＸの間から決定し、その係数Ｔｍａｘをフィルタ係数算出部２０７、ス
ペクトル概形符号化部２０８，および多重化部１１５に与える。

スペクトル概形符号化部２０８は、内部状態設定部２０３から与えられる内部状態Ｓ(ｋ)と、探索部２０５から与えられるラグ係数Ｔｍａｘと、フィルタ係数算出部２０７から与えられるフィルタ係数β_ｉとを用いてフィルタリングを行い、帯域ＦＬ≦ｋ＜ＦＨの第２スペクトルの推定値Ｓ２”(ｋ)を求める。そして、スペクトル概形符号化部２０８は、第２スペクトルの推定値Ｓ２”(ｋ)と第２スペクトルＳ２(ｋ)とを用いてスペクトル概形の調整係数の符号化を行う。

ここで、ＢＬ(ｊ)は第ｊサブバンドの最小周波数、ＢＨ(ｊ)は第ｊサブバンドの最大周波数を表す。このようにして求められた第２スペクトルのサブバンドのスペクトルパワを第２スペクトルのスペクトル概形情報とみなす。

同様に、スペクトル概形符号化部２０８は、第２スペクトルの推定値Ｓ２”(ｋ)のサブバンドのスペクトルパワＢ”(ｊ)を次の（式１８）に従い算出し、サブバンド毎の変動量Ｖ（ｊ）を次の（式１９）に従い算出する。

この式は、上記（式１３）において、Ｍ＝０、β_０＝１とした場合のフィルタ関数となっている。
このフィルタにより生成される第２スペクトルの推定値Ｓ２”(ｋ)は、以下の（式２１）を用いて、Ｔだけ離れた内部状態Ｓ(ｋ)の低域スペクトルを順次コピーすることにより求めることができる。

図１３は、本実施の形態に係るスペクトル復号化部２５１の主要な構成を示すブロック図である。なお、このスペクトル復号化部２５１は、実施の形態１に示したスペクトル復号化部１５３（図１０参照）と同様の基本的構成を有しており、同一の構成要素には同一
の符号を付し、その説明を省略する。異なるのは拡張帯域スペクトル生成部１６３ａの内部構成である。

内部状態設定部２５２は、変形部１６２から出力される変形後の第１スペクトルＳ１'(ｋ)を使ってフィルタリング部２５３で用いられるフィルタの内部状態Ｓ（ｋ）を設定する。

フィルタリング部２５３は、符号化側のスペクトル符号化部２０１（２０１ａ）で生成された符号化コードから、分離部１６１を介してフィルタに関する情報を得る。具体的には、スペクトル符号化部２０１の場合は、ラグ係数Ｔｍａｘおよびフィルタ係数β_ｉが得られ、スペクトル符号化部２０１ａの場合には、ラグ係数Ｔｍａｘのみが得られる。そして、フィルタリング部２５３は、変形部１６２で生成された変形第１スペクトルＳ１'(ｋ)をフィルタの内部状態Ｓ（ｋ）として、取得したフィルタ情報に基づいてフィルタリングを行い、復号スペクトルＳ”(ｋ)を算出する。このフィルタリング方法は、符号化側のスペクトル符号化部２０１（２０１ａ）で用いられたフィルタ関数に依存し、スペクトル符号化部２０１の場合は、復号側でも上記（式１３）に従ってフィルタリングが行われ、スペクトル符号化部２０１ａの場合には、復号側でも上記（式２０）に従ってフィルタリングが行われる。

スペクトル調整部２５５は、フィルタリング部２５３から得られるスペクトルＳ”(ｋ)に、スペクトル概形復号化部２５４から得られるサブバンド毎の変動量の量子化値Ｖｑ（ｊ）を次の（式２２）に従って乗じることにより、スペクトルＳ”(ｋ)の周波数帯域ＦＬ≦ｋ＜ＦＨのスペクトル形状を調整し、第２スペクトルの推定値Ｓ２”(ｋ)を生成する。

ここで、ＢＬ(ｊ)およびＢＨ(ｊ)は、それぞれ第ｊサブバンドの最小周波数、最大周波数を表す。上記（式２２）に従って算出された第２スペクトルの推定値Ｓ２”(ｋ)は、スペクトル構成部１６５に与えられる。

スペクトル構成部１６５は、実施の形態１で前述したように、第１スペクトルＳ１(ｋ)と第２スペクトルの推定値Ｓ２”(ｋ)とを結合して復号スペクトルＳ３(ｋ)を生成し、時間領域変換部１６６に与える。

図１４におけるスペクトル符号化部３０１は、周波数領域変換部１１１と拡張帯域スペクトル符号化部１１４との間に、図４におけるスペクトル変形部１１２の代わりに、ダイナミックレンジ算出部３０２、変形情報推定部３０３、および変形部３０４を有する。実施の形態１におけるスペクトル変形部１１２は、第１スペクトルＳ１(ｋ)を様々に変形させることにより第１スペクトルのダイナミックレンジを変化させ、適切なダイナミックレンジとなる変形の仕方（変形情報）について調べ、この変形情報を符号化して出力する。一方、本実施の形態３では、符号化側および復号化側で共通な情報に基づきこの変形情報の推定を行い、推定変形情報に従い第１スペクトルＳ１(ｋ)の変形を行う。

周波数領域変換部１１１より第１スペクトルＳ１(ｋ)が出力され、ダイナミックレンジ算出部３０２と変形部３０４とに与えられる。ダイナミックレンジ算出部３０２は、第１スペクトルＳ１(ｋ)のダイナミックレンジを定量化し、その結果をダイナミックレンジ情報として出力する。ダイナミックレンジの定量化の手法としては、実施の形態１と同様に、第１スペクトルの周波数帯域を複数のサブバンドに分割し、所定の範囲のサブバンドのエネルギー（サブバンドエネルギー）を求め、当該サブバンドエネルギーの分散値を算出し、この分散値をダイナミックレンジ情報として出力する。

以上説明したように、本実施の形態に係る符号化装置（スペクトル符号化部３０１）によれば、第１信号から求められる第１スペクトル（０≦ｋ＜ＦＬ）を使って、第２信号から求められる第２スペクトル（０≦ｋ＜ＦＨ）の高域部（ＦＬ≦ｋ＜ＦＨ）を推定し、推定情報を符号化する際に、第１スペクトルをそのまま用いずに、第１スペクトルに変形を加えた後に上記推定を行うようにすることで、推定スペクトルのダイナミックレンジを適切に調整することができ、復号信号の主観品質を向上させることができる。このとき、どのように変形したかを表す情報（変形情報）は、符号化側、復号化側で共通な情報（本実施の形態３では第１スペクトル）を基に変形情報を確定するために、変形情報に関する符号化コードを復号化部に伝送する必要がなく、ビットレートを低減させることが可能とな
る。

図１７は、本実施の形態３に係るスペクトル復号化部３５３の主要な構成を示すブロック図である。この構成において、図１０と同一名称および同一符号を付したブロックは同一の機能を有するため説明を省略する。周波数領域変換部１６４と拡張帯域スペクトル生成部１６３との間に、ダイナミックレンジ算出部３６１、変形情報推定部３６２、および変形部３６３を有する。図１０における変形部１６２は、符号化側のスペクトル変形部１１２で生成された変形情報を入力し、この変形情報に基づいて、周波数領域変換部１６４から与えられる第１スペクトルＳ１(ｋ)に変形を施す。これに対し本実施の形態３は、上記スペクトル符号化部３０１と同様に、符号化側および復号化側で共通な情報に基づきこの変形情報の推定を行い、推定変形情報にしたがって第１スペクトルＳ１(ｋ)の変形を行う。

周波数領域変換部１６４より第１スペクトルＳ１(ｋ)が出力され、ダイナミックレンジ算出部３６１と変形部３６３とに与えられる。以降、ダイナミックレンジ算出部３６１、変形情報推定部３６２、および変形部３６３の動作については、既に説明した符号化側のスペクトル符号化部３０１（図１４参照）内のダイナミックレンジ算出部３０２、変形情報推定部３０３、および変形部３０４と同様なので説明を省略する。なお、変形情報推定部３６２内の変形情報テーブルは、スペクトル符号化部３０１における変形情報推定部３０３内の変形情報テーブル３０６と同じ推定変形情報の候補が記録されている。

このように、本実施の形態に係る復号化装置（スペクトル復号化部４５３）によれば、本実施の形態に係る符号化装置で符号化された信号を復号化することで、入力信号の周期性をも考慮して推定スペクトルのダイナミックレンジを適切に調整することができ、復号
信号の主観品質を向上させることができる。

類似度判定部５１３は、第１レイヤ符号化部４０２より与えられるＬＰＣ係数と最も類似するＬＰＣ係数を判定テーブル５１２の中から求める。この類似性の判定には、ＬＰＣ係数同士の距離（歪）、またはＬＰＣ係数をＬＳＰ（Line Spectrum Pair）係数などの別のパラメータに変換した後の両者の歪を求め、その歪が最小となるときのＬＰＣ係数を判定テーブル５１２より求める。

ばらつき度算出部６２１−１は、入力される第１スペクトルＳ１（ｋ）の振幅の分布から、第１スペクトルの平均値ｍ１からの「ばらつき度」を算出し、第１閾値設定部６２２
−１および第２閾値設定部６２３−１に出力する。「ばらつき度」とは、具体的には、第１スペクトルの振幅分布の標準偏差σ１のことである。

すなわち、変形情報決定部６２６は、第１平均値と第３平均値との比（以下、第１ゲインと呼ぶ）、および第２平均値と第４平均値との比（以下、第２ゲインと呼ぶ）を算出する。そして、変形情報決定部６２６は、変形情報の複数の符号化候補が予め記憶されたデータテーブルを内部に備えているので、第１ゲインおよび第２ゲインをこれらの符号化候
補と比較し、最も類似した符号化候補を選択して、この符号化候補を表すインデックスを変形情報として出力する。また、このインデックスは、変形スペクトル生成部６２７にも送られる。

また、本実施の形態によれば、第１スペクトルおよび第２スペクトルの振幅の分布から標準偏差を求め、この標準偏差に基づいて第１閾値〜第４閾値を求める。よって、実際のスペクトルに基づいた閾値が設定されるので、変形情報の符号化精度を向上させることが
できる。

以上、本発明の各実施の形態について説明した。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現しても良い。ＬＳＩ製造後に、プログラム化することが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。

Claims

入力信号の高域スペクトル部の符号化を行う符号化手段と、
前記入力信号の低域スペクトル部の符号化信号を復号化した第１の低域スペクトルを取得し、この第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、
を具備し、
前記符号化手段は、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号化を行う、
符号化装置。
前記制限手段で使用された制限の仕方に関する情報を、前記符号化手段によって得られた符号化情報と併せて送信する送信手段、
をさらに具備することを特徴とする請求項１記載の符号化装置。
前記制限手段は、
前記第２の低域スペクトルの振幅の平均的な振れ幅と、前記高域スペクトル部の振幅の平均的な振れ幅とが同等となるように、前記第１の低域スペクトルの振幅を一様に制限する、
請求項１記載の符号化装置。
前記制限手段は、
前記第１の低域スペクトルの振幅を０から１までの範囲内の所定値で一様にべき乗することで前記第２の低域スペクトルを生成する、
請求項１記載の符号化装置。
前記符号化手段は、
前記第２の低域スペクトルを内部状態として有するピッチフィルタと、
前記ピッチフィルタを用いて前記高域スペクトル部を推定する推定手段と、
を具備し、
前記推定手段の推定結果に対応する前記ピッチフィルタの特性を符号化する、
請求項１記載の符号化装置。
前記ピッチフィルタの特性は、次の伝達関数によって表される、
請求項５記載の符号化装置。

ただし、
Ｐ（ｚ）：ピッチフィルタの伝達関数
ｚ：ｚ変換係数
Ｔ：ラグ係数
前記制限手段は、
前記第１の低域スペクトルに基づいて制限の仕方に関する情報を推定し、推定された情報を用いて前記第２の低域スペクトルを生成する、
請求項１記載の符号化装置。
前記制限手段は、
前記第１の低域スペクトルを用いてダイナミックレンジ情報を求めるダイナミックレンジ算出手段と、
前記ダイナミックレンジ情報を用いて、前記第１の低域スペクトルの振幅を一様に制限するための変形情報を推定する変形情報推定手段と、
推定された前記変形情報を用いて前記第１の低域スペクトルの振幅を一様に制限する変形手段と、
を具備する請求項７記載の符号化装置。
前記制限手段は、
前記入力信号の周期性を示すピッチ情報を用いて、前記第１の低域スペクトルの振幅を一様に制限するための変形情報を推定する変形情報推定手段と、
推定された前記変形情報を用いて前記第１の低域スペクトルの振幅を一様に制限する変形手段と、
を具備する請求項７記載の符号化装置。
前記ピッチ情報は、
ピッチゲインとピッチ周期との少なくとも一方を用いて構成されている、
請求項９記載の符号化装置。
前記制限手段は、
前記入力信号のスペクトル概形情報を用いて、前記第１の低域スペクトルの振幅を一様に制限するための変形情報を推定する変形情報推定手段と、
推定された前記変形情報を用いて前記第１の低域スペクトルの振幅を一様に制限する変形手段と、
を具備する請求項７記載の符号化装置。
前記変形情報推定手段は、
複数のスペクトル概形情報の候補が格納されたスペクトル概形情報格納手段と、
複数のダイナミックレンジ情報の候補が格納されたダイナミックレンジ情報格納手段と、
を具備し、
前記スペクトル概形情報格納手段から、前記入力信号のスペクトル概形情報に対応するスペクトル概形情報の候補を選択し、
前記ダイナミックレンジ情報格納手段から、前記選択されたスペクトル概形情報の候補に対応するダイナミックレンジ情報の候補を選択することで前記変形情報を推定する、
請求項１１記載の符号化装置。
前記第１の低域スペクトルを振幅の違いに応じて複数のグループに分ける第１の分類手段と、
前記第１の低域スペクトルの各グループの振幅の代表値を取得する第１の代表値取得手段と、
前記高域スペクトル部を振幅の違いに応じて複数のグループに分ける第２の分類手段と、
前記高域スペクトル部の各グループの振幅の代表値を取得する第２の代表値取得手段と、
をさらに具備し、
前記制限手段は、
前記第１の低域スペクトルの各グループの代表値と、前記高域スペクトル部の各グループの代表値とに基づいて、前記第１の低域スペクトルの振幅を一様に制限する、
請求項１記載の符号化装置。
前記制限手段は、
前記各代表値間の振幅を、前記各代表値に対して線形補間を行うことにより求める、
請求項１３記載の符号化装置。
前記制限手段は、
前記第１の低域スペクトルの各グループの代表値と、前記高域スペクトル部の各グループの代表値との比に基づいて、前記第１の低域スペクトルの振幅を一様に制限する、
請求項１３記載の符号化装置。
前記第１および第２の代表値取得手段は、
各グループの振幅の平均値または中央値を取得する、
請求項１３記載の符号化装置。
符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換手段と、
前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化手段と、
前記符号化装置で生成された符号に含まれるスペクトル変形情報に従って前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、
を具備し、
前記復号化手段は、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する、
復号化装置。
符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換手段と、
前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化手段と、
前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限手段と、
を具備し、
前記制限手段は、
前記第１の低域スペクトルに基づいて制限の仕方に関する情報を推定し、推定された情報を用いて前記第２の低域スペクトルを生成し、
前記復号化手段は、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する、
復号化装置。
請求項１記載の符号化装置を具備する通信端末装置。
請求項１記載の符号化装置を具備する基地局装置。
請求項１７記載の復号化装置を具備する通信端末装置。
請求項１７記載の復号化装置を具備する基地局装置。
請求項１８記載の復号化装置を具備する通信端末装置。
請求項１８記載の復号化装置を具備する基地局装置。
入力信号の高域スペクトル部の符号化を行う符号化ステップと、
前記入力信号の低域スペクトル部の符号化信号を復号化した第１の低域スペクトルを取得する取得ステップと、
前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限ステップと、
を具備し、
前記符号化ステップは、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号化を行う、
符号化方法。
符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換ステップと、
前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化ステップと、
前記符号化装置で生成された符号に含まれるスペクトル変形情報を取得する取得ステップと、
前記スペクトル変形情報に従って前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限ステップと、
を具備し、
前記復号化ステップは、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する、
復号化方法。
符号化装置で生成された符号に含まれる低域スペクトル部の符号を復号化した信号を周波数領域の信号に変換した第１の低域スペクトルを生成する変換ステップと、
前記符号化装置で生成された符号に含まれる高域スペクトル部の符号を復号化する復号化ステップと、
前記第１の低域スペクトルの振幅を一様に制限した第２の低域スペクトルを生成する制限ステップと、
を具備し、
前記制限ステップは、
前記第１の低域スペクトルに基づいて制限の仕方に関する情報を推定し、推定された情報を用いて前記第２の低域スペクトルを生成し、
前記復号化ステップは、
前記第２の低域スペクトルに基づいて前記高域スペクトル部の符号を復号化する、
復号化方法。