JP4635709B2

JP4635709B2 - 音声符号化装置及び方法、並びに音声復号装置及び方法

Info

Publication number: JP4635709B2
Application number: JP2005137667A
Authority: JP
Inventors: 祐樹松村; 志朗鈴木; 恵祐東山; 光行畠中; 祐基光藤
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2005-05-10
Filing date: 2005-05-10
Publication date: 2011-02-23
Anticipated expiration: 2025-05-10
Also published as: USRE46388E1; US8521522B2; USRE48272E1; US20060259298A1; JP2006317549A

Description

本発明は、いわゆる変換符号化によって入力音声信号を符号化し、得られた符号列を伝送し、又は記録媒体に記録する音声符号化装置及びその方法、並びに伝送され、又は記録媒体から読み出した符号列を復号して出力音声信号を得る音声復号装置及びその方法に関する。

従来、音声符号化装置において、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して正規化・量子化を行い、量子化誤差である差分周波数スペクトルに対して再度、正規化・量子化を行う方法が知られている（特許文献１，２を参照）。これにより、音声符号化装置の量子化精度を向上させることができ、また、音声復号装置の性能や使用環境に応じたスケーラビリティを実現することができる。

特許３２２７９４５号公報特許３２２７９４８号公報

しかしながら、この特許文献１，２記載の技術を含めた従来の技術では、正規化・量子化を多段化する場合に、各段における量子化ビット数を少ない演算量で適切に設定する手法は確立されていないのが現状であった。

本発明は、このような従来の実情に鑑みて提案されたものであり、多段の正規化・量子化を行って入力音声信号を符号化する際に、各段における量子化ビット数を少ない演算量で適切に設定することが可能な音声符号化装置及びその方法、並びにその音声符号化装置によって得られた符号列を復号して出力音声信号を得る音声復号装置及びその方法を提供することを目的とする。

上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段（工程）と、所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段（工程）と、上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段（工程）と、上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段（工程）と、上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段（工程）と、上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化手段（工程）と、上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段（工程）と、上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段（工程）とを備え、上記量子化情報計算手段（工程）は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する。

また、上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段（工程）と、所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段（工程）と、上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段（工程）と、上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段（工程）と、上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段（工程）と、上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化手段（工程）と、上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段（工程）と、上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段（工程）とを備え、上記量子化情報計算手段（工程）は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する。

また、上述した目的を達成するために、本発明に係る音声符号化装置及びその方法は、入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段（工程）と、所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段（工程）と、上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段（工程）と、上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段（工程）と、上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段（工程）と、上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第２の正規化手段（工程）と、上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段（工程）と、上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段（工程）とを備え、上記量子化情報計算手段（工程）は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する。

また、上述した目的を達成するために、本発明に係る音声復号装置及びその方法は、入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段（工程）と、上記正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段（工程）と、上記第１の量子化情報に対応した第１の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを生成する第１の逆量子化手段（工程）と、上記正規化情報に対応した第１の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第１の逆正規化手段（工程）と、上記第２の量子化情報に対応した第２の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第２の逆量子化手段（工程）と、上記正規化情報及び上記第１の量子化情報に対応した第２の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第２の逆正規化手段（工程）と、上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段（工程）と、上記加算手段（工程）によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段（工程）とを備え、上記量子化情報計算手段（工程）は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する。

本発明に係る音声符号化装置及びその方法、並びに音声復号装置及びその方法によれば、多段の正規化・量子化を行って入力音声信号を符号化して符号列を生成し、また、その符号列を復号して出力音声信号を得る際に、各段における量子化ビット数を少ない演算量で適切に設定することが可能とされる。

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して２段の正規化・量子化を行って符号化し、符号列を生成する音声符号化装置及びその方法、並びにその符号列を復号して出力音声信号を得る音声復号装置及びその方法に適用したものである。

（第１の実施の形態）
先ず、第１の実施の形態における音声符号化装置の概略構成を図１に示す。また、図１に示す音声符号化装置１０における符号化処理の手順を図２のフローチャートに示す。以下、図１を参照しながら、図２のフローチャートについて説明する。

図２のステップＳ１において、時間周波数変換部１１は、音声信号（ＰＣＭ（Pulse Code Modulation）データ等）を所定単位時間（フレーム）毎に入力し、ステップＳ２において、この入力音声信号を時間周波数変換し、周波数スペクトルmdspec1を生成する。例えば、時間周波数変換として変形離散コサイン変換（Modified Discrete Cosine Transform；ＭＤＣＴ）を用いる場合、Ｎサンプルの音声信号は、Ｎ／２サンプルのＭＤＣＴ係数に変換される。時間周波数変換部１１は、周波数スペクトルmdspec1を第１の正規化部１３及び減算部１７に供給すると共に、正規化情報idsfを量子化情報計算部１２に供給する。

次にステップＳ３において、量子化情報計算部１２は、正規化情報idsf等に基づいて、周波数スペクトルmdspec1を量子化する際の量子化ビット数を表す量子化情報idwl1と後述する２段目の量子化における量子化ビット数を表す量子化情報idwl2とを決定する。なお、量子化情報計算部１２において正規化情報idsf等に基づいて量子化情報idwl1，idwl2を決定する処理の詳細については後述する。

続いてステップＳ４において、第１の正規化部１３は、正規化情報idsfに対応した正規化係数sf1(idsf)を用いて周波数スペクトルmdspec1を以下の式（１）、
nspec1＝mdspec1＊sf1(idsf) ・・・(1)
で示すように正規化し、得られた正規化周波数スペクトルnspec1を第１の量子化部１４に供給する。この処理により、周波数スペクトルmdspec1は、±ｆ∈Ｒの範囲に正規化される。正規化情報idsfと正規化係数sf1(idsf)との関係は、例えば以下の表１のように表される。

続いてステップＳ５において、第１の量子化部１４は、量子化情報idwl1に対応した量子化係数qf1(idwl1)を用いて正規化周波数スペクトルnspec1を量子化し、得られた量子化周波数スペクトルqspec1を逆量子化部１５及び符号列符号化部２０に供給する。例えば、図３に示すような線形量子化を行う場合、量子化周波数スペクトルqspec1は以下の式（２）、
qspec1＝(int)(floor(nspec1＊qf1(idwl1))＋0.5) ・・・(2)
のように求められる。この処理により、正規化周波数スペクトルnspec1は、量子化ステップ幅nstep(idwl1)で表されるステップ数の量子化周波数スペクトルqspec1に量子化される。量子化情報idwl1と量子化ステップ幅nstep(idwl1)及び量子化係数qf1(idwl1)との関係は、例えば以下の表２のように表される。

続いてステップＳ６において、逆量子化部１５は、量子化情報idwl1に対応した逆量子化係数iqf1(idwl1)を用いて量子化周波数スペクトルqspec1を以下の式（３）、
nspec1'＝qspec1＊iqf1(idwl1) ・・・(3)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を逆正規化部１６に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、以下の式（４）、
iqf1(idwl1)＝1／qf1(idwl1) ・・・(4)
で表される。

続いてステップＳ７において、逆正規化部１６は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec1'を以下の式（５）、
mdspec1'＝nspec1'＊isf1(idsf) ・・・(5)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を減算部１７に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、以下の式（６）、
isf1(idsf)＝1／sf1(idsf) ・・・(6)
で表される。

続いてステップＳ８において、減算部１７は、以下の式（７）、
mdspec2＝mdspec1−mdspec1' ・・・(7)
で示すように周波数スペクトルmdspec1から周波数スペクトルmdspec1'を減算し、得られた差分周波数スペクトルmdspec2を第２の正規化部１８に供給する。

続いてステップＳ９において、第２の正規化部１８は、正規化係数sf2を用いて差分周波数スペクトルmdspec2を以下の式（８）、
nspec2＝mdspec2＊sf2
＝(mdspec1−mdspec1')＊sf2
＝((nspec1−nspec1')＊isf1(idsf))＊sf2 ・・・(8)
で示すように正規化し、得られた差分正規化周波数スペクトルnspec2を第２の量子化部１９に供給する。

ここで、正規化周波数スペクトルnspec1は、正規化情報idsfに対応した正規化係数sf1(idsf)により±ｆ∈Ｒの範囲に正規化されているため、例えば図３に示すように、量子化情報idwl1に対応して量子化ステップ幅nstep(idwl1)が一意に決定されるような線形量子化を行う場合には、量子化前後での正規化周波数スペクトルnspec1、nspec1'の差分は最大量子化誤差である±ｆ／nstep(idwl1)の範囲となる。したがって、正規化係数sf2は、以下の式（９）、
sf2(idsf,idwl1)＝sf1(idsf)＊nstep(idwl1)／f ・・・(9)
で示すように算出することができる。すなわち、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出することができる。

続いてステップＳ１０において、第２の量子化部１９は、量子化情報idwl2に対応した量子化係数qf2(idwl2)を用いて差分正規化周波数スペクトルnspec2を量子化し、得られた差分量子化周波数スペクトルqspec2を符号列符号化部２０に供給する。例えば、図３に示すような線形量子化を行う場合、差分量子化周波数スペクトルqspec2は以下の式（１０）、
qspec2＝(int)(floor(nspec2＊qf2(idwl2))＋0.5) ・・・(10)
のように求められる。なお、量子化情報idwl2と量子化係数qf2(idwl2)との関係は、上述した表２と同様であってもよく、異なっていてもよい。

続いてステップＳ１１において、符号列符号化部２０は、量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、正規化情報idsf、及び量子化情報idwl1，idwl2を符号化し、ステップＳ１２において、得られた符号列を出力する。

続いてステップＳ１３において、入力音声信号が終了したか否かを判別し、終了していない場合にはステップＳ１に戻り、入力音声信号が終了している場合には符号化処理を終了する。

以下、量子化情報計算部１２において正規化情報idsfに基づいて量子化情報idwl1，idwl2を決定する処理について詳細に説明する。ここでは一例として、図４、図５の実線ａで示すスペクトル包絡を有する周波数スペクトルに対して、所定の処理単位毎に量子化情報idwl1，idwl2を計算する場合について考える。

先ず、正規化情報idsf等に基づいて総量子化情報idwl0が計算される。例えば図４のようなスペクトル包絡を有する周波数スペクトルの場合には、以下の表３の上段に示すように総量子化情報idwl0が計算され、図５のようなスペクトル包絡を有する周波数スペクトルの場合には、以下の表４の上段に示すように総量子化情報idwl0が計算される。

ここで、計算機シミュレーションや大規模ハードウェア等により、例えば最大２４ビット等の量子化ビット数を確保することができる場合には、この総量子化情報idwl0に基づいて量子化を行うことが可能である。しかしながら、通常はハードウェア上の制約等によりこの総量子化情報idwl0を無制限に許可することは困難であり、例えば最大１６ビット等の量子化ビット数に制限される。このため、総量子化情報idwl0が１６以上、すなわち１６ビット以上の量子化ビット数を必要としていた周波数スペクトルに対しては、１６ビット量子化時の最大ＳＮＲ（Signal to Noise Ratio）以上の量子化精度を確保することは不可能であり、図４、図５の破線ｂで示すようなノイズフロアとなる。すなわち、図４の場合には低周波数帯域におけるＳＮＲが悪化し、図５の場合にはトーンの中心f0近傍におけるＳＮＲが悪化する。

このため、１段目の量子化の結果得られた誤差である差分周波数スペクトルに対して２段目の量子化を行い、局所的に悪化したＳＮＲを改善することになるが、従来、各段における量子化ビット数を少ない演算量で適切に設定する手法は確立されていないのが現状であった。

そこで、本実施の形態の量子化情報計算部１２は、所定のリミッタlim1，lim2を用いることにより、各段における量子化ビット数を少ない演算量で適切に設定する。すなわち、第１の量子化部１４における量子化情報idwl1に対してはリミッタlim1による制限を設け、この制限を超過する場合には、超過分を第２の量子化部１９における量子化情報idwl2として配分する。また、第２の量子化部１９における量子化情報idwl2に対してはリミッタlim2による制限を設け、この制限を超過する場合には、その制限内に収まるように量子化情報idwl2を設定する。

この量子化情報計算部１２の処理手順を図６のフローチャートに示す。先ずステップＳ２１において、正規化情報idsf等に基づいて総量子化情報idwl0を決定し、ステップＳ２２において、この総量子化情報idwl0を量子化情報idwl1として設定する。

次にステップＳ２３において、量子化情報idwl1の値がリミッタlim1の値よりも大きいか否かを判別し、量子化情報idwl1の値がリミッタlim1の値以下である場合には、ステップＳ２５に進む。一方、量子化情報idwl1の値がリミッタlim1の値よりも大きい場合には、ステップＳ２４において量子化情報idwl1の値をリミッタlim1の値に制限した後、ステップＳ２５に進む。

続いてステップＳ２５において、総量子化情報idwl0の値から量子化情報idwl1の値を減算して得られた値を量子化情報idwl2の値として設定する。

続いてステップＳ２６において、量子化情報idwl2の値がリミッタlim2の値よりも大きいか否かを判別し、量子化情報idwl2の値がリミッタlim2の値以下である場合には、ステップＳ２８において量子化情報idwl1，idwl2を決定する。一方、量子化情報idwl2の値がリミッタlim2の値よりも大きい場合には、ステップＳ２７において量子化情報idwl2の値をリミッタlim2の値に制限した後、ステップＳ２８において量子化情報idwl1，idwl2を決定する。

例えば、上述した表３、表４の上段のように総量子化情報idwl0が計算されていた場合、それぞれ表３、表４の中段及び下段に示すように量子化情報idwl1，idwl2が決定される。この表では、第１の量子化部１４における最大量子化ビット数を１６ビットとしており、量子化情報idwl1が０〜１５の範囲の値となるため（idwl1＝１５のときnstep(idwl1)＝６５５３５（±３２７６７）＜２^１６)、量子化情報idwl1に対するリミッタlim1の値を１５としている。そして、総量子化情報idwl0に対してリミッタlim1（＝１５）による制限を設けたものを量子化情報idwl1として設定し、超過分（idwl0−idwl1）の量子化情報を量子化情報idwl2として設定している。

このようにして決定された量子化情報idwl1，idwl2を用いて図４、図５の実線ａで示すスペクトル包絡を有する周波数スペクトルを量子化した場合のノイズフロアを図４、図５の一点鎖線ｃで示す。図４、図５からも分かるように、本実施の形態における音声符号化装置１０によれば、量子化の結果得られた誤差である差分周波数スペクトルに対して適切なビット配分で再量子化を行うことができ、ハードウェア上の制約等により局所的に悪化したＳＮＲを改善することが可能になる。

次に、この音声符号化装置１０に対応する音声復号装置の概略構成を図７に示す。また、図７に示す音声復号装置３０における復号処理の手順を図８のフローチャートに示す。以下、図７を参照しながら、図８のフローチャートについて説明する。

図８のステップＳ３１において、符号列復号部３１は、符号列を入力し、ステップＳ３２において、この入力符号列を復号して量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、正規化情報idsf、及び量子化情報idwl1，idwl2を生成する。符号列復号部３１は、量子化周波数スペクトルqspec1を第１の逆量子化部３２に供給し、差分量子化周波数スペクトルqspec2を第２の逆量子化部３４に供給する。

次にステップＳ３３において、第１の逆量子化部３２は、量子化情報idwl1に対応した逆量子化係数iqf1(idwl1)を用いて量子化周波数スペクトルqspec1を以下の式（１１）、
nspec1'＝qspec1＊iqf1(idwl1) ・・・(11)
で示すように逆量子化し、得られた正規化周波数スペクトルnspec1'を第１の逆正規化部３３に供給する。ここで、量子化係数qf1(idwl1)と逆量子化係数iqf1(idwl1)との関係は、上述した式（４）で表される。

続いてステップＳ３４において、第１の逆正規化部３３は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec1'を以下の式（１２）、
mdspec1'＝nspec1'＊isf1(idsf) ・・・(12)
で示すように逆正規化し、得られた周波数スペクトルmdspec1'を加算部３６に供給する。ここで、正規化係数sf1(idsf)と逆正規化係数isf1(idsf)との関係は、上述した式（６）で表される。

続いてステップＳ３５において、第２の逆量子化部３４は、量子化情報idwl2に対応した逆量子化係数iqf2(idwl2)を用いて差分量子化周波数スペクトルqspec2を以下の式（１３）、
nspec2'＝qspec2＊iqf2(idwl2) ・・・(13)
で示すように逆量子化し、得られた差分正規化周波数スペクトルnspec2'を第２の逆正規化部３５に供給する。ここで、量子化係数qf2(idwl2)と逆量子化係数iqf2(idwl2)との関係は、以下の式（１４）、
iqf2(idwl2)＝1／qf2(idwl2) ・・・(14)
で表される。

続いてステップＳ３６において、第２の逆正規化部３５は、正規化情報idsf及び量子化情報idwl1に対応した逆正規化係数isf2(idsf,idwl1)を用いて差分正規化周波数スペクトルnspec2'を以下の式（１５）、
mdspec2'＝nspec2'＊isf2(idsf,idwl1) ・・・(15)
で示すように逆正規化し、得られた差分周波数スペクトルmdspec2'を加算部３６に供給する。ここで、逆正規化係数isf2(idsf,idwl1)と正規化情報idsf及び量子化情報idwl1との関係は、以下の式（１６）、
isf2(idsf,idwl1)＝1／sf2(idsf,idwl1)＝isf1(idsf)＊f／nstep(idwl1) ・・・(16)
で表される。なお、ステップＳ３５及びステップＳ３６の処理は、ステップＳ３３及びステップＳ３４の処理よりも前に行ってもよく、並列に行ってもよい。

続いてステップＳ３７において、加算部３６は、以下の式（１７）、
mdspec'＝mdspec1'＋mdspec2' ・・・(17)
で示すように周波数スペクトルmdspec1'と差分周波数スペクトルmdspec2'とを加算し、得られた周波数スペクトルmdspec'を周波数時間変換部３７に供給する。

続いてステップＳ３８において、周波数時間変換部３７は、周波数スペクトルmdspec'を周波数時間変換して音声信号を生成し、ステップＳ３９において、この音声信号を出力する。例えば、周波数時間変換として逆変形離散コサイン変換（Inverse MDCT；ＩＭＤＣＴ）を用いる場合、Ｎ／２サンプルのＭＤＣＴ係数は、Ｎサンプルの音声信号に変換される。

続いてステップＳ４０において、入力符号列が終了したか否かを判別し、終了していない場合にはステップＳ３１に戻り、入力符号列が終了している場合には復号処理を終了する。

（第２の実施の形態）
ところで、上述のように２段の正規化・量子化を行う場合には、１段目及び２段目の量子化情報idwl1，idwl2を符号化する必要があるため、段数に応じて周波数スペクトル情報の符号化効率が低下してしまう。そこで、本実施の形態では、この量子化情報idwl1，idwl2の符号化を省略することにより周波数スペクトル情報の符号化効率を向上させる方法について説明する。

図９は、本実施の形態における音声符号化装置４０の概略構成を示したものであり、図１０は、音声符号化装置４０に対応する音声復号装置５０の概略構成を示したものである。
何れも、上述した音声符号化装置１０及び音声復号装置３０と同様の構成については同一符号を付して詳細な説明を省略する。

この音声符号化装置４０において、量子化情報計算部４１は、正規化情報idsf等に基づいて量子化情報idwl1，idwl2を一意に決定する。なお、量子化情報計算部４１において正規化情報idsf等に基づいて量子化情報idwl1，idwl2を一意に決定する処理の詳細については後述する。また、符号列符号化部２０は、量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、及び正規化情報idsfを符号化し、得られた符号列を出力する。

一方、音声復号装置５０において、量子化情報計算部５１は、正規化情報idsf等に基づいて量子化情報idwl1，idwl2を一意に決定する。なお、量子化情報計算部５１において正規化情報idsf等に基づいて量子化情報idwl1，idwl2を一意に決定する処理の詳細についても後述する。

以下、量子化情報計算部４１，５１において正規化情報idsf等に基づいて量子化情報idwl1，idwl2を一意に決定する処理について詳細に説明する。

量子化情報計算部４１，５１は、正規化情報idsf及び所定の変数Ａから、量子化情報idwl0を以下の表５に示すように一意に決定する。

この表５から分かるように、正規化情報idsfが１つ小さくなると量子化情報idwl0も１つ小さくなる。これは、正規化情報idsfがＸであり量子化情報がＢである場合の絶対ＳＮＲをＳＮＲabsとしたとき、正規化情報idsfがＸ−１である場合に同等のＳＮＲabsを得るには略々Ｂ−１の量子化情報で示される量子化ビット数が必要となり、また正規化情報idsfがＸ−２である場合には同様に略々Ｂ−２の量子化情報で示される量子化ビット数が必要となることに着目したものである。

上述した変数Ａとは、最大の正規化情報idsfに対して割り当てられる最大量子化情報を示しており、この値は付加情報として符号列に含められる。なお、この変数Ａとしては先ず規格上とり得る最大の量子化ビット数を設定し、符号化の結果、総使用ビット数が総使用可能ビット数を上回る場合には、順次繰り下げられる。

この変数Ａの値が１７ビットである場合において、正規化情報idsfと量子化情報idwl0との関係を示すテーブルの一例を以下の表６に示す。この表６において丸で囲まれている数字は、スペクトル毎に決定された総量子化情報idwl0を表すものとする。

表６に示すように、正規化情報idsfが最大の３１である場合には総量子化情報idwl0は最大の１７となり、例えば正規化情報idsfが最大の正規化情報idsfより２だけ小さい２９である場合には総量子化情報idwl0は１５となる。なお、該当する正規化情報idsfが最大の正規化情報idsfよりも１７以上小さい場合には量子化ビット数がマイナスになってしまうが、その場合は０ビットと下限を設けることとする。

量子化情報計算部４１，５１は、このようにして求められたスペクトル毎の総量子化情報idwl0に基づいて量子化情報idwl1，idwl2を決定する。すなわち、量子化情報idwl1に対してはリミッタlim1による制限を設け、この制限を超過する場合には、超過分を量子化情報idwl2として配分する。また、量子化情報idwl2に対してはリミッタlim2による制限を設け、この制限を超過する場合には、その制限内に収まるように量子化情報idwl2を設定する。

ところで、このようにして量子化情報idwl1，idwl2を一意に決定した場合、ノイズフロアは略々平坦になる。すなわち、人間の聴感上重要な低域についても聴感上重要でない高域についても一様な量子化精度で量子化を行っているため、雑音感は最小とならない。

そこで、量子化情報計算部４１，５１において、以下の表７に示すように、スペクトル毎の正規化情報idsfに対して重み係数Ｗｎ[ｉ]（ｉ＝０〜Ｎ／２−１）を加算し、新たな正規化情報idsf1を生成するようにしても構わない。

この表７の例では、低域の正規化情報idsfには４乃至１の値を加算し、高域の正規化情報idsfには何も加算していない。このように正規化情報idsfに対して重み係数Ｗｎ[ｉ]を加算することで、低域にビットを集中させて、人間の聴覚に重要な帯域の音質を向上させることができる。

表７のように重み係数Ｗｎ[ｉ]を加算した場合、正規化情報idsfの最大値が３５となるため、表６のテーブルを正規化情報idsfの最大加算数である４だけ大きい方向へ単純に拡張したとすると、例えば以下の表８のようになる。この表８において、破線の丸で囲まれている数字は重み付けを行わない場合におけるスペクトル毎の総量子化情報idwl0を表し、実線の丸で囲まれている数字は重み付けを行う場合におけるスペクトル毎の総量子化情報idwl0を表す。

この表８の例では、低域の量子化精度が向上するが、最大量子化情報が増加して総使用ビット数が増加するため、実際には総使用ビット数が総使用可能ビット数に収まるようにビット調整を行うことが好ましい。

なお、上述した重み係数Ｗｎ[ｉ]としては、予め符号化側と復号側とで固定のものを用いてもよく、或いは、符号化側で音源の特徴（周波数エネルギ、過渡特性、ゲイン、マスキング特性など）に基づいて最適な重み係数Ｗｎ[ｉ]を生成してもよい。後者の場合、量子化情報計算部４１は、例えば周波数スペクトルmdspec1に基づいて重み係数Ｗｎ[ｉ]を生成し、符号列符号化部２０は、この重み係数Ｗｎ[ｉ]を符号化して符号列に含める。

このように、本実施の形態における音声符号化装置４０及び音声復号装置５０によれば、正規化情報idsfに基づいて量子化情報idwl1，idwl2を一意に決定し、また、正規化情報idsfと量子化情報idwl1とに基づいて正規化係数sf2(idsf,idwl1)を算出するため、符号列には周波数スペクトル情報以外のサイド情報として正規化情報idsfを含めるのみでよい。さらに、サイド情報の削減によって生じた余剰ビットを量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化に流用することで、量子化周波数スペクトルqspec1及び差分量子化周波数スペクトルqspec2の符号化効率を向上させることができる。

（第３の実施の形態）
次に、第３の実施の形態として図１１に示す音声符号化装置６０は、基本構造を図１に示した音声符号化装置１０と同様とするが、周波数スペクトルmdspec1と周波数スペクトルmdspec1'との差分に対して２段目の正規化・量子化を行うのではなく、正規化周波数スペクトルnspec1と正規化周波数スペクトルnspec1'との差分に対して２段目の正規化・量子化を行う点に特徴を有している。したがって、先に図１に示した音声符号化装置１０と同様の構成については同一符号を付して詳細な説明を省略する。

この音声符号化装置６０において、減算部６１は、以下の式（１８）、
nspec2＝nspec1−nspec1' ・・・(18)
で示すように正規化周波数スペクトルnspec1から正規化周波数スペクトルnspec1'を減算し、得られた差分正規化周波数スペクトルnspec2を第２の正規化部６２に供給する。

第２の正規化部６２は、正規化係数sf2を用いて差分正規化周波数スペクトルnspec2を以下の式（１９）、
nnspec2＝nspec2＊sf2
＝(nspec1−nspec1')＊sf2 ・・・(19)
で示すように正規化し、得られた差分再正規化周波数スペクトルnnspec2を第２の量子化部６３に供給する。

ここで、正規化周波数スペクトルnspec1は、正規化情報idsfに対応した正規化係数sf1(idsf)により±ｆ∈Ｒの範囲に正規化されているため、例えば図３に示すように、量子化情報idwl1に対応して量子化ステップ幅nstep(idwl1)が一意に決定されるような線形量子化を行う場合には、量子化前後での正規化周波数スペクトルnspec1、nspec1'の差分は最大量子化誤差である±ｆ／nstep(idwl1)の範囲となる。したがって、正規化係数sf2は、以下の式（２０）、
sf2(idwl1)＝nstep(idwl1)／f ・・・(20)
で示すように算出することができる。すなわち、量子化情報idwl1に基づいて正規化係数sf2(idwl1)を算出することができる。

第２の量子化部６３は、量子化情報idwl2に対応した量子化係数qf2(idwl2)を用いて差分再正規化周波数スペクトルnnspec2を量子化し、得られた差分量子化周波数スペクトルqspec2を符号列符号化部２０に供給する。例えば、図３に示すような線形量子化を行う場合、差分量子化周波数スペクトルqspec2は以下の式（２１）、
qspec2＝(int)(floor(nnspec2＊qf2(idwl2))＋0.5) ・・・(21)
のように求められる。

符号列符号化部２０は、量子化周波数スペクトルqspec1、差分量子化周波数スペクトルqspec2、正規化情報idsf、及び量子化情報idwl1，idwl2を符号化し、得られた符号列を出力する。

次に、この音声符号化装置６０に対応する音声復号装置の概略構成を図１２に示す。図１２に示す音声復号装置７０は、基本構造を図７に示した音声復号装置３０と同様とするため、音声復号装置３０と同様の構成については同一符号を付して詳細な説明を省略する。

この音声復号装置７０において、第２の逆量子化部７１は、量子化情報idwl2に対応した逆量子化係数iqf2(idwl2)を用いて差分量子化周波数スペクトルqspec2を以下の式（２２）、
nnspec2'＝qspec2＊iqf2(idwl2) ・・・(22)
で示すように逆量子化し、得られた差分再正規化周波数スペクトルnnspec2'を第２の逆正規化部７２に供給する。

第２の逆正規化部７２は、量子化情報idwl1に対応した逆正規化係数isf2(idwl1)を用いて差分再正規化周波数スペクトルnnspec2'を以下の式（２３）、
nspec2'＝nnspec2'＊isf2(idwl1) ・・・(23)
で示すように逆正規化し、得られた差分正規化周波数スペクトルnspec2'を加算部７３に供給する。ここで、逆正規化係数isf2(idwl1)と量子化情報idwl1との関係は、以下の式（２４）、
isf2(idwl1)＝1／sf2(idwl1)＝f／nstep(idwl1) ・・・(24)
で表される。

加算部７３は、以下の式（２５）、
nspec'＝nspec1'＋nspec2' ・・・(25)
で示すように正規化周波数スペクトルnspec1'と差分正規化周波数スペクトルnspec2'とを加算し、得られた正規化周波数スペクトルnspec'を第１の逆正規化部７４に供給する。

第１の逆正規化部７４は、正規化情報idsfに対応した逆正規化係数isf1(idsf)を用いて正規化周波数スペクトルnspec'を以下の式（２６）、
mdspec'＝nspec'＊isf1(idsf) ・・・(26)
で示すように逆正規化し、得られた周波数スペクトルmdspec'を周波数時間変換部３７に供給する。

周波数時間変換部３７は、周波数スペクトルmdspec'を周波数時間変換して音声信号を生成し、この音声信号を出力する。

（第４の実施の形態）
上述した第１乃至第３の実施の形態では、音声符号化装置及び音声復号装置の基本的な３種類の構成について説明したが、本実施の形態では、音声符号化装置及び音声復号装置の変形例について説明する。なお、音声符号化装置１０及び音声復号装置３０と同様の構成については同一符号を付して詳細な説明を省略する。

先ず、図１３は、第１の変形例における音声符号化装置８０の概略構成を示したものであり、図１４は、音声符号化装置８０に対応する音声復号装置９０の概略構成を示したものである。この音声符号化装置８０において、前処理部８１は、入力音声信号を時間周波数変換する前に、入力音声信号に対して帯域分割やゲイン調整等の前処理を施す。一方、音声復号装置９０において、後処理部９１は、周波数スペクトルmdspec'を周波数時間変換した後、音声信号に対して帯域合成やゲイン調整等の後処理を施す。

次に、図１５は、第２の変形例における音声符号化装置１００の概略構成を示したものであり、図１６は、音声符号化装置１００に対応する音声復号装置１１０の概略構成を示したものである。この音声符号化装置１００において、第１の前処理部１０１は、周波数スペクトルmdspec1に対して周波数スペクトル分布に応じた非線形変換等の前処理を施し、後処理部１０２は、周波数スペクトルmdspec1'に対して対応する非線形逆変換等の後処理を施す。また、第２の前処理部１０３は、差分周波数スペクトルmdspec2に対して周波数スペクトル分布に応じた非線形変換等の前処理を施す。一方、音声復号装置１１０において、第１の後処理部１１１は、周波数スペクトルmdspec1'に対して符号化側と対応する非線形逆変換等の後処理を施し、第２の後処理部１１２は、差分周波数スペクトルmdspec2'に対して符号化側と対応する非線形逆変換等の後処理を施す。

上述した第１乃至第３の実施の形態では、第１の量子化部１４において線形量子化を行うことを前提として説明したが、非線形量子化は非線形変換後に線形量子化を行うことと等価であるため、図１５のように、第１の量子化部１４の前段に非線形変換を行う第１の前処理部１０１を設けることで、非線形量子化を行う場合にも適用することが可能である。

次に、図１７は、第３の変形例における音声符号化装置１２０の概略構成を示したものであり、図１８は、音声符号化装置１２０に対応する音声復号装置１３０の概略構成を示したものである。この音声符号化装置１２０において、第１の正規化量子化部１２１は、正規化量子化係数sf1(idsf)*qf1(idwl1)を用いて周波数スペクトルmdspec1を正規化・量子化し、逆量子化逆正規化部１２２は、逆量子化逆正規化係数iqf1(idwl1)*isf1(idsf)を用いて量子化周波数スペクトルqspec1を逆量子化・逆正規化する。また、第２の正規化量子化部１２３は、正規化量子化係数sf2(idsf,idwl1)*qf2(idwl2)を用いて差分周波数スペクトルmdspec2を正規化・量子化する。一方、音声復号装置１３０において、第１の逆量子化逆正規化部１３１は、逆量子化逆正規化係数iqf1(idwl1)*isf1(idsf)を用いて量子化周波数スペクトルqspec1を逆量子化・逆正規化し、第２の逆量子化逆正規化部１３２は、逆量子化逆正規化係数iqf2(idwl2)*isf2(idsf,idwl1)を用いて差分量子化周波数スペクトルqspec2を逆量子化・逆正規化する。このように、正規化係数と量子化係数とを予め乗算しておくことで正規化処理及び量子化処理を１つの処理に纏めることができ、逆量子化係数と逆正規化係数とを予め乗算しておくことで逆量子化処理及び逆正規化処理を１つの処理に纏めることができるため、演算量及び処理量を低減することができる。

なお、本実施の形態では、第１の実施の形態における音声符号化装置１０及び音声復号装置３０の変形例について説明したが、第２の実施の形態における音声符号化装置４０及び音声復号装置５０や、第３の実施の形態における音声符号化装置６０及び音声復号装置７０についても同様の変形が可能である。

以上、本発明を実施するための最良の形態について説明したが、本発明は上述した実施の形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。

例えば、上述した実施の形態では、入力音声信号を時間周波数変換して得られた周波数スペクトルに対して２段の正規化・量子化を行って符号化するものとして説明したが、これに限定されるものではなく、任意の段数の正規化・量子化を行って符号化する場合に拡張可能である。この場合、ｋ段目（ｋは１以上の整数）の量子化情報idwlkに対してはリミッタlimkによる制限を設け、この制限を超過する場合には、超過分を（ｋ＋１）段目の量子化情報idwl(k+1)として配分する。

また、上述した実施の形態では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。

第１の実施の形態における音声符号化装置の概略構成を示す図である。同音声符号化装置における符号化処理の手順を示すフローチャートである。同音声符号化装置の第１の量子化部における量子化処理の一例を示す図である。量子化前のスペクトル包絡と量子化後のノイズフロアとの一例を示す図である。量子化前のスペクトル包絡と量子化後のノイズフロアとの他の例を示す図である。同音声符号化装置の量子化情報計算部における処理手順を示すフローチャートである。図１の音声符号化装置に対応する音声復号装置の概略構成を示す図である。同音声復号装置における復号処理の手順を示すフローチャートである。第２の実施の形態における音声符号化装置の概略構成を示す図である。図９の音声符号化装置に対応する音声復号装置の概略構成を示す図である。第３の実施の形態における音声符号化装置の概略構成を示す図である。図１１の音声符号化装置に対応する音声復号装置の概略構成を示す図である。第４の実施の形態における音声符号化装置の概略構成を示す図である。図１３の音声符号化装置に対応する音声復号装置の概略構成を示す図である。第４の実施の形態における音声符号化装置の概略構成の他の例を示す図である。図１５の音声符号化装置に対応する音声復号装置の概略構成を示す図である。第４の実施の形態における音声符号化装置の概略構成の他の例を示す図である。図１７の音声符号化装置に対応する音声復号装置の概略構成を示す図である。

符号の説明

１０音声符号化装置、１１時間周波数変換部、１２量子化情報計算部、１３第１の正規化部、１４第１の量子化部、１５逆量子化部、１６逆正規化部、１７減算部、１８第２の正規化部、１９第２の量子化部、２０符号列符号化部、３０音声復号装置、３１符号列復号部、３２第１の逆量子化部、３３第１の逆正規化部、３４第２の逆量子化部、３５第２の逆正規化部、３６加算部、３７周波数時間変換部

Claims

入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化手段と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段と、
上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化装置。
上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項１記載の音声符号化装置。
前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、ｋ段目（ｋは１以上の整数）に配分した量子化情報がｋ段目の制限を超過する場合に、超過分を（ｋ＋１）段目の量子化情報として配分する
ことを特徴とする請求項１記載の音声符号化装置。
入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化工程と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化工程と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化工程と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化工程と、
上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化方法。
入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算手段と、
上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化手段と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化装置。
上記第１の量子化手段では、上記第１の量子化情報に対応して最大量子化誤差が一意に決定され、
上記第２の正規化係数は、上記第１の正規化係数と上記最大量子化誤差の逆数との積により決定される
ことを特徴とする請求項５記載の音声符号化装置。
上記正規化情報が１ずつ増減すると、上記総量子化情報で表される量子化ビット数が１ビットずつ増減することを特徴とする請求項５記載の音声符号化装置。
上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項５記載の音声符号化装置。
前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、ｋ段目（ｋは１以上の整数）に配分した量子化情報がｋ段目の制限を超過する場合に、超過分を（ｋ＋１）段目の量子化情報として配分する
ことを特徴とする請求項５記載の音声符号化装置。
入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化工程と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化工程と、
上記周波数スペクトルから上記量子化周波数スペクトルを逆量子化及び逆正規化した周波数スペクトルを減算し、差分周波数スペクトルを生成する減算工程と、
上記正規化情報及び上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分周波数スペクトルを正規化し、差分正規化周波数スペクトルを生成する第２の正規化工程と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化工程と、
上記正規化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化方法。
入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換手段と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化手段と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化手段と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算手段と、
上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第２の正規化手段と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化手段と、
上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化手段とを備え、
上記量子化情報計算手段は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化装置。
上記周波数スペクトル又は上記正規化周波数スペクトルに対して非線形変換を施す前処理手段と、
上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトル、又はこの正規化周波数スペクトルを逆正規化した周波数スペクトルに対して非線形逆変換を施す後処理手段と
をさらに備えることを特徴とする請求項１１記載の音声符号化装置。
前段における差分周波数スペクトルを正規化及び線形量子化する正規化手段及び量子化手段が多段に設けられており、
上記量子化情報計算手段は、各段の量子化情報に所定の制限を設け、ｋ段目（ｋは１以上の整数）に配分した量子化情報がｋ段目の制限を超過する場合に、超過分を（ｋ＋１）段目の量子化情報として配分する
ことを特徴とする請求項１１記載の音声符号化装置。
入力音声信号を時間周波数変換して周波数スペクトルを生成する時間周波数変換工程と、
所定の正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算工程と、
上記正規化情報に対応した第１の正規化係数を用いて上記周波数スペクトルを周波数成分毎に正規化し、正規化周波数スペクトルを生成する第１の正規化工程と、
上記第１の量子化情報に対応した第１の量子化係数を用いて上記正規化周波数スペクトルを線形量子化し、量子化周波数スペクトルを生成する第１の量子化工程と、
上記正規化周波数スペクトルから上記量子化周波数スペクトルを逆量子化した正規化周波数スペクトルを減算し、差分正規化周波数スペクトルを生成する減算工程と、
上記第１の量子化情報に対応した第２の正規化係数を用いて上記差分正規化周波数スペクトルを正規化し、差分再正規化周波数スペクトルを生成する第２の正規化工程と、
上記第２の量子化情報に対応した第２の量子化係数を用いて上記差分再正規化周波数スペクトルを線形量子化し、差分量子化周波数スペクトルを生成する第２の量子化工程と、
上記正規化情報、上記第１の量子化情報、上記第２の量子化情報、上記量子化周波数スペクトル、及び上記差分量子化周波数スペクトルを符号化し、符号列を出力する符号列符号化工程とを有し、
上記量子化情報計算工程では、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声符号化方法。
入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号手段と、
上記正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算手段と、
上記第１の量子化情報に対応した第１の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを生成する第１の逆量子化手段と、
上記正規化情報に対応した第１の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第１の逆正規化手段と、
上記第２の量子化情報に対応した第２の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第２の逆量子化手段と、
上記正規化情報及び上記第１の量子化情報に対応した第２の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第２の逆正規化手段と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算手段と、
上記加算手段によって得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換手段とを備え、
上記量子化情報計算手段は、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声復号装置。
入力符号列を復号し、正規化情報、量子化周波数スペクトル、及び差分量子化周波数スペクトルを生成する符号列復号工程と、
上記正規化情報に基づいて量子化ビット数を表す総量子化情報を生成し、該総量子化情報を配分することにより、量子化ビット数を表す第１の量子化情報及び第２の量子化情報を生成する量子化情報計算工程と、
上記第１の量子化情報に対応した第１の逆量子化係数を用いて上記量子化周波数スペクトルを線形逆量子化し、正規化周波数スペクトルを生成する第１の逆量子化工程と、
上記正規化情報に対応した第１の逆正規化係数を用いて上記正規化周波数スペクトルを逆正規化し、周波数スペクトルを生成する第１の逆正規化工程と、
上記第２の量子化情報に対応した第２の逆量子化係数を用いて上記差分量子化周波数スペクトルを線形逆量子化し、差分正規化周波数スペクトルを生成する第２の逆量子化工程と、
上記正規化情報及び上記第１の量子化情報に対応した第２の逆正規化係数を用いて上記差分正規化周波数スペクトルを逆正規化し、差分周波数スペクトルを生成する第２の逆正規化工程と、
上記周波数スペクトルと上記差分周波数スペクトルとを加算する加算工程と、
上記加算工程にて得られた周波数スペクトルを周波数時間変換し、出力音声信号を生成する周波数時間変換工程とを有し、
上記量子化情報計算工程では、上記第１の量子化情報に所定の制限を設けると共に、上記総量子化情報を上記第１の量子化情報として配分し、上記所定の制限の超過分を上記第２の量子化情報として配分することにより、上記第１の量子化情報及び上記第２の量子化情報を生成する
ことを特徴とする音声復号方法。