JP2016218465A

JP2016218465A - 音声信号の符号化と復号化の方法および装置

Info

Publication number: JP2016218465A
Application number: JP2016153513A
Authority: JP
Inventors: 峰岩 ▲斉▼; Fengyan Qi; ▲澤▼新 ▲劉▼; Zexin Liu; 磊苗; Miao Lei
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2011-07-13
Filing date: 2016-08-04
Publication date: 2016-12-22
Anticipated expiration: 2032-03-22
Also published as: KR20160149326A; US20130018660A1; EP3174049B1; EP2613315A4; US11127409B2; PT3174049T; ES2612516T3; KR20140005358A; KR101765740B1; US20200135219A1; ES2718400T3; US20180261234A1; US9984697B2; PT2613315T; US9105263B2; EP2613315B1; JP6702593B2; EP3174049A1; JP2018106208A; EP2613315A1

Abstract

【課題】復号化の間に再構築される高周波数の調波が割込みにより平滑でなくなる。これにより、雑音が大量に生成され、再構築された音声の品質が悪くなることを防止する音声信号符号化及び復号化方法並びに装置を提供する。
【解決手段】音声信号の周波数帯を複数のサブバンドに分割し、および各サブバンドのサブバンド正規化因子を量子化するステップと、量子化した当該サブバンド正規化因子に従って、または量子化した当該サブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定するステップと、決定した当該信号帯域幅内のサブバンドにビットを割り当てるステップと、サブバンドごとに割り当てたビットに従って、当該音声信号のスペクトル係数を符号化するステップと、を含む。このように、ビットを集約化することによって、決定された信号帯域幅が効果的に符号化および復号化され、音声品質が改善される。
【選択図】図１

Description

本発明は、音声信号の符号化と復号化の技術の分野に関し、特に、音声信号の符号化と復号化の方法および装置に関する。

現在、通信ではますます音声の品質が重要となってきている。したがって、音声品質を保証しつつ、符号化と復号化の最中にできるだけ音楽品質を改善する必要がある。音楽信号は通常かなり十分な情報を保持し、したがって、従来の音声ＣＥＬＰ（ＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ、符号励起線形予測）符号化モードは音楽信号の符号化には適していない。一般に、変換符号化モードは、周波数領域内の音楽信号を処理して音楽信号の符号化品質を改善するために使用される。しかし、限られた符号化ビットを効果的に使用して情報を効率的に符号化する方法は現在の音声符号化の分野においてホットな研究課題である。

現在の音声符号化技術は一般に、ＦＦＴ（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ、高速フーリエ変換）またはＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ、修正離散余弦変換）を使用して時間領域信号を周波数領域に変換し、次いで周波数領域信号を符号化している。低ビット・レートの場合で量子化するための有限数のビットでは、全ての音声信号を量子化することはできない。したがって、一般にＢＷＥ（ＢａｎｄｗｉｄｔｈＥｘｔｅｎｓｉｏｎ、帯域幅拡張）技術およびスペクトル重ね合わせ技術が使用されることがある。

符号化の側では、第１の入力時間領域信号が周波数領域に変換され、サブバンド正規化因子、即ち、スペクトルのエンベロープ情報が周波数領域から抽出される。量子化したサブバンド正規化因子を使用することにより当該スペクトルを正規化して、正規化スペクトル情報を取得する。最後に、サブバンドごとのビット割当てが決定され、正規化スペクトルが量子化される。このように、量子化されたエンベロープ情報と正規化スペクトル情報へと音声信号が符号化され、次いでビット・ストリームが出力される。

復号化側の処理は、符号化側の処理の逆である。低速符号化の最中は、符号化側では全ての周波数帯を符号化することはできない。復号化側では、帯域幅拡張技術が、符号化側で符号化されなかった周波数帯を復元する必要がある。一方、量子化器の制限のため多数のゼロ周波数点が符号化されたサブバンドで生ずることがある。したがって、性能を改善するために雑音充填モジュールが必要である。最後に、復号化されたサブバンド正規化因子を復号化された正規化スペクトル係数に適用して、再構築されたスペクトル係数を取得し、逆変換を実施して時間領域の音声信号を出力する。

しかし、符号化プロセス中は、高周波数の調波に幾つかの分散した符号化ビットが割り当てられることがある。しかし、このケースでは、時間軸でのビット分布は連続的ではなく、結果として、復号化の間に再構築される高周波数の調波が割込みにより平滑でなくなる。これにより、雑音が大量に生成され、再構築された音声の品質が悪くなる。

本発明の諸実施形態では、音声信号の符号化および復号化の方法と装置を提供する。これらにより、音声品質を改善することができる。

１態様では、音声信号の符号化方法を提供する。当該方法は、音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのサブバンド正規化因子を量子化するステップと、量子化したサブバンド正規化因子に従って、または、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定するステップと、決定した信号帯域幅内のサブバンドにビットを割り当てるステップと、サブバンドごとに割り当てたビットに従って、当該音声信号のスペクトル係数を符号化するステップとを含む。

別の態様では、音声信号の復号化方法を提供する。当該方法は、量子化したサブバンド正規化因子を取得するステップと、量子化したサブバンド正規化因子に従って、または量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定するステップと、決定した信号帯域幅内のサブバンドにビットを割り当てるステップと、サブバンドごとに割り当てたビットに従って正規化スペクトルを復号化するステップと、復号化した正規化スペクトルに対して雑音充填と帯域幅拡張を実施して、正規化した全帯域スペクトルを取得するステップと、正規化した全帯域スペクトルとサブバンド正規化因子に従って、音声信号のスペクトル係数を取得するステップとを含む。

さらに別の態様では、音声信号の符号化装置を提供する。当該装置は、音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのサブバンド正規化因子を量子化するように構成された量子化ユニットと、量子化したサブバンド正規化因子に従って、または量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定するように構成された第１の決定ユニットと、当該第１の決定ユニットにより決定された信号帯域幅内のサブバンドにビットを割り当てるように構成された第１の割当てユニットと、サブバンドごとに当該第１の割当てユニットにより割り当てたビットに従って音声信号のスペクトル係数を符号化するように構成された符号化ユニットとを備える。

さらに別の態様では、音声信号復号化装置を提供する。当該音声信号復号化装置は、量子化したサブバンド正規化因子を取得するように構成された取得ユニットと、量子化したサブバンド正規化因子に従って、または量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定するように構成された第２の決定ユニットと、当該第２の決定ユニットにより決定された信号帯域幅内のサブバンドにビットを割り当てるように構成された第２の割当てユニットと、サブバンドごとに当該第２の割当てユニットにより割り当てたビットに従って、正規化スペクトルを復号化するように構成された復号化ユニットと、雑音充填および帯域幅拡張を当該復号化ユニットによって復号化された当該正規化スペクトルに対して実施して、正規化した全帯域スペクトルを取得するように構成された拡張ユニットと、正規化した全帯域スペクトルとサブバンド正規化因子に従って、音声信号のスペクトル係数を取得するように構成された受信ユニットとを備える。

本発明の諸実施形態によれば、符号化と復号化の間に、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅が決定される。このように、ビットを集約化することによって、決定された信号帯域幅が効果的に符号化および復号化され、音声品質が改善される。

本発明の技術的解決策をより明確にするために、本発明の様々な実施形態を示す添付図面を以下で簡単に説明する。明らかに、添付図面は例示的な目的のためにすぎず、当業者は創造的な作業なしにかかる添付図面から他の図面を導出することができる。

本発明の１実施形態に従う音声信号符号化方法の流れ図である。本発明の１実施形態に従う音声信号復号化方法の流れ図である。本発明の１実施形態に従う音声信号符号化装置のブロック図である。本発明の別の実施形態に従う音声信号符号化装置のブロック図である。本発明の１実施形態に従う音声信号復号化装置のブロック図である。本発明の別の実施形態に従う音声信号復号化装置のブロック図である。

本発明の諸実施形態で開示する技術的解決策を、諸実施形態と添付図面を参照して以下で説明する。明らかに、当該実施形態は例示的なものにすぎない。当業者は、創造的な作業なしに本明細書で与えた当該実施形態から他の実施形態を導出することができ、全てのかかる諸実施形態は本発明の保護範囲に入る。

図１は、本発明の１実施形態に従う音声信号符号化方法の流れ図である。

１０１では、音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのサブバンド正規化因子を量子化する。

以下では、ＭＤＣＴ変換を詳細な説明の１例として使用する。まず、ＭＤＣＴ変換を入力音声信号に対して実施して周波数領域係数を取得する。ＭＤＣＴ変換は、ウィンドウ化、時間領域エイリアシング、および離散ＤＣＴ変換のような処理を含んでもよい。

例えば、時間領域信号ｘ（ｎ）が正弦ウィンドウ化（ｓｉｎｅ−ｗｉｎｄｏｗｅｄ）される。

得られるウィンドウ化信号は、

である。次に、時間領域エイリアシング操作を行う。即ち、

である。Ｉ_Ｌ／２およびＪ_Ｌ／２はそれぞれ、次数をＬ／２とした２つの正方行列を示す。即ち、

である。

ＤＣＴ変換を当該時間領域に対して実施して、最終的に当該周波数領域のＭＤＣＴ係数を取得する。即ち、

である。

当該周波数領域のエンベロープが当該ＭＤＣＴ係数から抽出されて量子化される。全体の周波数が、異なる周波数領域の解像度を有する複数のサブバンドに分割される。各サブバンドの正規化因子が抽出され、当該サブバンド正規化因子が量子化される。

例えば、１６ｋＨｚの帯域幅を有する周波数帯に対応する３２ｋＨｚの周波数で標本化される音声信号に関して、そのフレーム長が２０ｍｓ（６４０個の標本化点）である場合には、サブバンド分割を表１に示す形態に従って実施してもよい。

まず、サブバンドを幾つかのサブバンドにグループ化し、グループ内のサブバンドを細かく分割する。各サブバンド内の正規化因子は、

により定義される。Ｌ_ｐはサブバンド内の係数の数を示し、Ｓ_ｐはサブバンド内の開始点を示し、ｅ_ｐはサブバンド内の終了点を示し、Ｐはサブバンドの総数を示す。

正規化因子を取得した後、当該因子を対数領域で量子化して、量子化したサブバンド正規化因子ｗｎｏｒｍを取得してもよい。

１０２では、量子化したサブバンド正規化因子に従って、または量子化したサブバンド正規化因子とビット・レート情報に従ってビット割当ての信号帯域幅を決定する。

場合によっては、１実施形態では、当該ビット割当ての信号帯域幅ｓｆｍ＿ｌｉｍｉｔを音声信号の帯域幅の一部として、例えば、低周波数では０〜ｓｆｍ＿ｌｉｍｉｔの帯域幅の一部または当該帯域幅の中間部分として定義してもよい。

１例では、ビット割当ての信号帯域幅ｓｆｍ＿ｌｉｍｉｔを定義するとき、比率因子をビット・レート情報に従って決定してもよい。当該比率因子は、０より大きく１以下である。１実施形態では、ビット・レートが小さいほど比率因子も小さい。例えば、様々なビット・レートに対応する因子の値を表２に従って取得してもよい。

あるいは、当該因子を式、例えば、
ｆａｃｔ＝ｑｘ（０．５＋ｂｉｔｒａｔｅ＿ｖａｌｕｅ／１２８０００）
に従って取得してもよい。ここで、ｂｉｔｒａｔｅ＿ｖａｌｕｅはビット・レートの値、例えば２４０００を示し、ｑは補正因子を示す。例えば、ｑ＝１と仮定してもよい。本発明の当該実施形態は、かかる具体的な値の例には限定されない。

当該帯域幅の一部は、比例因子と量子化したサブバンド正規化因子ｗｎｏｒｍとに従って決まる。各サブバンド内のスペクトル・エネルギを、量子化したサブバンド正規化因子に従って取得してもよく、当該スペクトル・エネルギを、蓄積したスペクトル・エネルギが全サブバンドの総スペクトル・エネルギに当該比率因子を乗じた積より大きくなるまで、低周波数から高周波数まで各サブバンド内で蓄積してもよく、現在のサブバンドに続く帯域幅が上記帯域幅の一部として使用される。

例えば、最低の蓄積周波数点をまず設定し、当該周波数点より低い各サブバンドのスペクトル・エネルギｅｎｅｒｇｙ＿ｌｏｗを計算してもよい。当該スペクトル・エネルギは、上記サブバンド正規化因子に従って次式により取得してもよい。

ｑは、設定された最低の蓄積周波数点に対応するサブバンドを示す。

それに応じて推定を行ってもよく、全てのサブバンドの合計スペクトル・エネルギｅｎｅｒｇｙ＿ｓｕｍが計算されるまでサブバンドを追加する。

ｅｎｅｒｇｙ＿ｌｏｗに基づいて、サブバンドを低周波数から高周波数まで１つずつ追加し蓄積してスペクトル・エネルギｅｎｅｒｇｙ＿ｌｉｍｉｔを取得し、ｅｎｅｒｇｙ＿ｌｉｍｉｔ＞ｆａｃｔｘｅｎｅｒｇｙ＿ｓｕｍが満たされるかどうかを判定する。満たされない場合には、高蓄積スペクトル・エネルギのためにさらにサブバンドを追加する必要がある。満たされる場合には、現在のサブバンドを、定義された帯域幅の部分の最後のサブバンドとして使用する。現在のサブバンドのシーケンス番号ｓｆｍ＿ｌｉｍｉｔを、当該定義された部分の帯域幅、即ち、０〜ｓｆｍ＿ｌｉｍｉｔを示すために出力する。

以上の例では、ビット・レートを使用して比率因子を決定した。別の例では、サブバンド正規化因子を使用して当該因子を決定してもよい。例えば、音声信号の調波クラスまたは雑音レベルｎｏｉｓｅ＿ｌｅｖｅｌをまずサブバンド正規化因子に従って取得する。一般に、音声信号の調波クラスが高くなるほど、雑音レベルは低くなる。以下では、雑音レベルを詳細な説明の例として使用する。雑音レベルｎｏｉｓｅ＿ｌｅｖｅｌを以下の式に従って取得してもよい。

ｗｎｏｒｍは復号化されたサブバンド正規化因子を示し、ｓｆｍは周波数帯全体のサブバンドの数を示す。

ｎｏｉｓｅ＿ｌｅｖｅｌが高いとき当該因子は大きく、ｎｏｉｓｅ＿ｌｅｖｅｌが低いときには当該因子は小さい。調波クラスをパラメータとして使用する場合には、当該調波クラスが高いとき当該因子は小さく、調波クラスが小さいときには当該因子は大きい。

以上では０〜ｓｆｍ＿ｌｉｍｉｔの低周波数帯域幅を使用しているが、本発明の当該実施形態はこれに限定されないことに留意されたい。必要に応じて、当該帯域幅の一部を別の形、例えば、非零の低周波数点からｓｆｍ＿ｌｉｍｉｔまでの帯域幅の一部で実装してもよい。かかる変形は全て本発明の実施形態の範囲に入る。

１０３では、決定した信号帯域幅内のサブバンドにビットを割り当てる。

ビット割当てを、決定した信号帯域幅内のサブバンドのｗｎｏｒｍ値に従って実施してもよい。以下の反復方法、即ち、ａ）最大ｗｎｏｒｍ値に対応するサブバンドを発見し、特定数のビットを割り当て、ｂ）それに従って当該サブバンドのｗｎｏｒｍ値を減らし、ｃ）ビットが完全に割り当てられるまでａ）とｂ）を繰り返す、といった方法を使用してもよい。

１０４では、サブバンドごとに割り当てたビットに従って当該音声信号のスペクトル係数を符号化する。

例えば、符号化係数が格子ベクトル量子化法、または、ＭＤＣＴスペクトル係数を量子化するための別の既存の方法を使用してもよい。

本発明の当該実施形態によれば、符号化と復号化の間に、ビット割当ての信号帯域幅を、量子化したサブバンド正規化因子とビット・レート情報に従って決定する。このように、ビットを集約化することによって、決定された信号帯域幅が効果的に符号化および復号化され、音声品質が改善される。

例えば、決定された信号帯域幅が低周波数部分の０〜ｓｆｍ＿ｌｉｍｉｔであるとき、信号帯域幅０〜ｓｆｍ＿ｌｉｍｉｔの中でビットが割り当てられる。低ビット・レートの場合にビットを集約化することによって、選択された周波数帯が効果的に符号化されるように、かつ、符号化されていない周波数帯に対してより効果的な帯域幅拡張が実施されるように、ビット割当ての帯域幅ｓｆｍ＿ｌｉｍｉｔを制限する。この理由は主に、ビット割当ての帯域幅が制限されていない場合には、分散した符号化ビットが高周波数の調波に割り当てられる可能性があるからである。しかし、このケースでは、時間軸でのビット分散は連続的でなく、そのため再構築された高周波数の調波は滑らかでなく途切れている。ビット割当ての帯域幅が制限されている場合には、分散したビットが低周波数に集約化され、低周波数信号を良好に符号化することができ、低周波数信号を用いることにより高周波数の調波に対して帯域幅拡張が実施され、より連続的な高周波数の調波信号が可能となる。

場合によっては、１実施形態では、図３に示す１０３で、ビット割当ての信号帯域幅ｓｆｍ＿ｌｉｍｉｔを決定した後のビット割当て中に、より多くのビットが高周波数帯域に割り当てられるように、当該帯域幅内のサブバンドのサブバンド正規化因子をまず調節する。当該調節のスケールは、ビット・レートに対して自己適応的であってもよい。ここでは、帯域幅内で多くのエネルギを有する低周波数帯により多くのビットが割り当てられ、量子化に必要なビットが十分である場合に、サブバンド正規化因子を調節して当該周波数帯内の高周波数を量子化するためのビットを増やすことができることを考慮している。このように、多くの調波を符号化することができ、これは高周波数帯の帯域幅拡張に有益である。例えば、帯域幅の一部の中間サブバンドのサブバンド正規化因子を、当該中間サブバンドに続く各サブバンドのサブバンド正規化因子として使用する。具体的には、（ｓｆｍ＿ｌｉｍｉｔ／２）番目のサブバンドの正規化因子を、周波数ｓｆｍ＿ｌｉｍｉｔ／２−ｓｆｍ＿ｌｉｍｉｔ内の各サブバンドのサブバンド正規化因子として使用してもよい。ｓｆｍ＿ｌｉｍｉｔ／２が整数でない場合には、ｓｆｍ＿ｌｉｍｉｔ／２を切り上げるかまたは切り下げてもよい。このケースでは、ビット割当て中に、調節したサブバンド正規化因子を使用してもよい。

さらに、本発明の別の実施形態によれば、本発明の当該実施形態で提供した符号化および復号化方法において、音声信号のフレームの分類をさらに考慮してもよい。このケースでは、本発明の当該実施形態において、様々な分類に関する様々な符号化と復号化のポリシーを使用することができる。その結果、様々な信号の符号化および復号化の品質が改善される。例えば、音声信号を雑音（ｎｏｉｓｅ）、調波（ｈａｒｍｏｎｉｃ）、過渡信号（ｔｒａｎｓｉｅｎｔ）のようなタイプに分類してもよい。一般に、雑音風の信号はフラットなスペクトルで雑音モードとして分類され、時間領域において突然変化する信号はフラットなスペクトルで過渡信号モードとして分類され、強い調波特性を有する信号は、大きく変化するスペクトルで多くの情報を含む、調波モードとして分類される。

以下では、調波タイプおよび非調波タイプを詳細な説明に使用する。本発明の当該実施形態では、図１に示す１０１の前に、音声信号のフレームが調波タイプに属するか非調波タイプに属するかを判定してもよい。音声信号のフレームが当該調波タイプに属する場合には、図２に示す方法を連続的に実施する。具体的には、調波タイプのフレームに関して、ビット割当ての信号帯域幅を図１に示す実施形態に従って定義してもよい。即ち、フレームのビット割当ての信号帯域幅を当該フレームの帯域幅の一部として定義してもよい。非調波タイプのフレームに関して、ビット割当ての信号帯域幅を、図１に示す実施形態に従って帯域幅の一部に対して定義してもよく、または、ビット割当ての信号帯域幅を定義せず、フレームのビット割当て帯域幅をフレームの帯域幅全体として決定してもよい。

音声信号のフレームを、ピーク平均率に従って分類してもよい。例えば、当該フレームのサブバンド（高周波数のサブバンド）の全部または一部の各サブバンドのピーク平均率が取得される。当該ピーク平均率は、サブバンドのピーク・エネルギをサブバンドの平均エネルギで除すことにより計算される。ピーク平均率が第１の閾値より大きいサブバンドの数が第２の閾値以上であるとき、フレームが当該調波タイプに属すると判定し、ピーク平均率が第１の閾値より大きいサブバンドの数が第２の閾値より小さいときには、当該フレームが非調波タイプに属すると判定する。当該第１の閾値および当該第２の閾値を必要に応じて設定または変更してもよい。

しかし、本発明の当該実施形態はピーク平均率に従う分類の例には限定されず、別のパラメータに従って分類を行ってもよい。

低ビット・レートの場合にビットを集約化することによって、選択された周波数帯が効果的に符号化されるように、かつ、符号化されていない周波数帯に対してより効果的な帯域幅拡張が実施されるように、ビット割当ての帯域幅ｓｆｍ＿ｌｉｍｉｔを制限する。この理由は主に、ビット割当ての帯域幅が制限されていない場合には、分散した符号化ビットが高周波数の調波に割り当てられる可能性があるからである。しかし、このケースでは、時間軸でのビット分散は連続的でなく、そのため再構築された高周波数の調波は滑らかでなく途切れている。ビット割当ての帯域幅が制限されている場合には、分散したビットが低周波数に集約化され、低周波数信号を良好に符号化することができ、低周波数信号を用いることにより高周波数の調波に対して帯域幅拡張が実施され、より連続的な高周波数の調波信号が可能となる。

以上では、符号化側での処理を説明した。これは、復号化側と逆の処理である。図２は、本発明の１実施形態に従う音声信号の復号化方法の流れ図である。

２０１では、量子化したサブバンド正規化因子を取得する。量子化したサブバンド正規化因子を、ビット・ストリームを復号化することによって取得してもよい。

２０２では、量子化したサブバンド正規化因子に従って、または、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定する。２０２は図１に示す１０２と同様であり、したがってその説明は繰り返さない。

２０３では、決定した当該信号帯域幅内のサブバンドにビットを割り当てる。２０３は図１の１０３と同様であり、したがってその説明は繰り返さない。

２０４では、サブバンドごとに割り当てたビットに従って正規化スペクトルを復号化する。

２０５では、復号化した正規化スペクトルに対して雑音充填と帯域幅拡張を実施して、正規化した全帯域スペクトルを取得する。

２０６では、当該正規化した全帯域スペクトルとサブバンド正規化因子に従って音声信号のスペクトル係数を取得する。

例えば、各サブバンドの正規化スペクトルに当該サブバンドのサブバンド正規化因子を乗ずることによって、音声信号のスペクトル係数を復元し取得する。

本発明の当該実施形態によれば、符号化および復号化の最中に、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅が決定される。このように、ビットを集約化することによって、決定された信号帯域幅が効果的に符号化および復号化され、音声品質が改善される。

本実施形態では、ステップ２０５で説明した雑音充填と帯域幅拡張は順序の点で限定されない。具体的には、雑音充填を帯域幅拡張の前に実施してもよい。または、帯域幅拡張を雑音充填の前に実施してもよい。さらに、本実施形態によれば、帯域幅拡張を周波数帯の一部について実施してもよく、雑音充填を当該周波数帯の他の部分に対して同時に実施してもよい。かかる変形は本発明の当該実施形態の範囲内にある。

ゼロ周波数点の多くが、サブバンド符号化中の量子化器の制限に起因して生成されることがある。一般に、一部の雑音を充填して、再構築された音声信号の音が確実により自然なものであるようにしてもよい。

雑音充填を最初に実施する場合には、雑音充填の後に帯域幅拡張を正規化スペクトルに対して実施して、正規化した全帯域スペクトルを取得してもよい。例えば、第１の周波数帯を、現在のフレームと当該現在のフレームより前のＮ個のフレームのビット割当てに従って決定し、コピーすべき周波数帯（コピー）として使用してもよい。Ｎは正の整数である。一般に、ビットが割り当てられた複数の連続的なサブバンドが当該第１の周波数帯の範囲として選択されることが望ましい。次に、高周波数帯域のスペクトル係数を当該第１の周波数帯のスペクトル係数に従って取得する。

１例としてＮ＝１である場合を用いると、場合によっては、１実施形態では、現在のフレームに対して割り当てたビットと以前のＮ個のフレームに割り当てたビットの間の相関関係を取得してもよく、取得した相関関係に従って第１の周波数帯を決定してもよい。例えば、現在のフレームに割り当てたビットをＲ＿ｃｕｒｒｅｎｔとし、以前のフレームに割り当てたビットをＲ＿ｐｒｅｖｉｏｕｓとすると、Ｒ＿ｃｕｒｒｅｎｔにＲ＿ｐｒｅｖｉｏｕｓを乗ずることによって相関関係Ｒ＿ｃｏｒｒｅｌａｔｉｏｎを取得してもよい。

相関関係を取得した後、Ｒ＿ｃｏｒｒｅｌａｔｉｏｎ≠０を満たす第１のサブバンドを、ビットが割り当てられた最高周波数帯ｌａｓｔ＿ｓｆｍから低周波数帯へと検索する。これは、現在のフレームとその前のフレームの両方にビットが割り当てられていることを示す。当該サブバンドのシーケンス番号がｔｏｐ＿ｂａｎｄであると仮定する。

１実施形態では、取得したｔｏｐ＿ｂａｎｄを第１の周波数帯の上限として使用してもよく、ｔｏｐ＿ｂａｎｄ／２を第１の周波数帯の下限として使用してもよい。前のフレームの第１の周波数帯の下限と現在のフレームの第１の周波数帯の下限の間の差が１ｋＨｚ未満である場合には、前のフレームの第１の周波数帯の下限を現在のフレームの第１の周波数帯の下限として使用してもよい。これは、帯域幅拡張に対する第１の周波数帯の連続性を保証し、それにより帯域幅拡張の後の連続的な高周波数スペクトルを保証するためのものである。現在のフレームのＲ＿ｃｕｒｒｅｎｔをキャッシュして次フレームのＲ＿ｐｒｅｖｉｏｕｓとして使用する。ｔｏｐ＿ｌｉｍｉｔ／２が整数でない場合には、ｔｏｐ＿ｌｉｍｉｔ／２を切り上げるかまたは切り下げてもよい。

帯域幅拡張の間、第１の周波数帯のスペクトル係数ｔｏｐ＿ｂａｎｄ／２−ｔｏｐ＿ｂａｎｄを高周波数帯域ｌａｓｔ＿ｓｆｍ−ｈｉｇｈ＿ｓｆｍにコピーする。

以上では、雑音充填を最初に実施する１例を説明した。本発明の当該実施形態はそれには限定されない。具体的には、帯域幅拡張を最初に行い、次にバックグラウンド雑音を拡張された完全な周波数帯で充填してもよい。この雑音充填の方法は以上の例と同様であってもよい。

さらに、高周波数帯域に関して、例えば、前述の範囲ｌａｓｔ＿ｓｆｍ−ｈｉｇｈ＿ｓｆｍ、周波数帯範囲ｌａｓｔ＿ｓｆｍ−ｈｉｇｈ＿ｓｆｍ内の充填されたバックグラウンド雑音を、復号化側で推定されたｎｏｉｓｅ＿ｌｅｖｅｌ値を用いることによってさらに調節してもよい。ｎｏｉｓｅ＿ｌｅｖｅｌを計算する方法については、式（８）を参照されたい。ｎｏｉｓｅ＿ｌｅｖｅｌは、復号化されたサブバンド正規化因子を用いることにより、充填された雑音の強度レベルを区別するために取得される。したがって、符号化ビットを送信する必要はない。

高周波数帯域内のバックグラウンド雑音を、以下の方法に従って取得した雑音レベルを用いることによって調整してもよい。

は復号化された正規化因子を示しｎｏｉｓｅ＿ＣＢ（ｋ）は雑音コードブックを示す。

このように、低周波数信号を用いることによって帯域幅拡張が高周波数の調波に対して実施され、高周波数の調波信号をより連続的にすることができ、それにより音声品質が保証される。

以上では、第１の周波数帯のスペクトル係数を直接コピーする１例を説明した。本発明によれば、第１の周波数帯域幅のスペクトル係数をまず調節してもよく、調節したスペクトル係数を用いることによって帯域幅拡張を実施して、高周波数帯域の性能をさらに高めることができる。

正規化長をスペクトル平坦性情報と高周波数帯域の信号タイプに従って取得してもよく、第１の周波数帯のスペクトル係数は取得した正規化長に従って正規化され、第１の周波数帯の正規化スペクトル係数は高周波数帯域のスペクトル係数として使用される。

スペクトル平坦性情報は、第１の周波数帯における各サブバンドのピーク平均率、第１の周波数帯に対応する時間領域信号の相関関係、または第１の周波数帯に対応する時間領域信号のゼロ交差率を含んでもよい。以下では、ピーク平均率を詳細な説明の１例として使用する。しかし、本発明の当該実施形態はそのような限定を示唆しない。具体的には、他の平坦性情報を調節に使用してもよい。ピーク平均率は、サブバンドのピーク・エネルギを当該サブバンドの平均エネルギで除したものから計算される。

まず、第１の周波数帯の各サブバンドのピーク平均率を第１の周波数帯のスペクトル係数に従って計算し、当該サブバンドが調波サブバンドであるかどうかをピーク平均率の値と当該サブバンド内の最大ピーク値とに従って判定し、調波サブバンドの数ｎ＿ｂａｎｄを蓄積し、最後に、正規化長ｌｅｎｇｔｈ＿ｎｏｒｍ＿ｈａｒｍをｎ＿ｂａｎｄと高周波数帯域の信号タイプに従って自己適応的に決定する。

ここで、Ｍは第１の周波数帯のサブバンドの数を示し、αは自己適応的な信号タイプを示し、調波信号の場合はα＞１である。

続いて、取得した正規化長を用いることによって第１の周波数帯のスペクトル係数を正規化してもよく、第１の周波数帯の正規化スペクトル係数は高周波数帯域の係数として使用される。

以上は帯域幅拡張性能を改善する１例を示し、帯域幅拡張性能を改善できる他のアルゴリズムを本発明に適用してもよい。

さらに、符号化側と同様に、音声信号のフレームの分類を復号化側でさらに考慮してもよい。このケースでは、本発明の当該実施形態では、様々な分類に関する様々な符号化および復号化のポリシーを使用することができ、それにより様々な信号の符号化および復号化の品質が改善する。音声信号のフレームを分類する方法については、符号化側の方法を参照されたい。ここではその方法は説明しない。

フレーム・タイプを示す分類情報をビット・ストリームから抽出してもよい。調波タイプのフレームに関して、ビット割当ての信号帯域幅を図２に示す実施形態に従って定義してもよい。即ち、フレームのビット割当ての信号帯域幅を当該フレームの帯域幅の一部として定義してもよい。非調波タイプのフレームに関して、ビット割当ての信号帯域幅を図２に示す実施形態に従って、または、先行技術に従って帯域幅の一部に対して定義してもよく、ビット割当ての信号帯域幅を定義しなくともよい。例えば、フレームのビット割当て帯域幅を当該フレームの帯域幅全体として決定してもよい。

周波数帯全体のスペクトル係数を取得した後、再構築された時間領域の音声信号を、周波数逆変換を使用することによって取得してもよい。したがって、本発明の当該実施形態では、非調波信号の品質を維持しつつ調波信号の品質を改善することができる。

図３は、本発明の１実施形態に従う音声信号符号化装置のブロック図である。図３を参照すると、音声信号符号化装置３０は、量子化ユニット３１、第１の決定ユニット３２、第１の割当てユニット３３、および符号化ユニット３４を備える。

量子化ユニット３１は、音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのサブバンド正規化因子を量子化する。第１の決定ユニット３２は、量子化ユニット３１により量子化したサブバンド正規化因子に従って、または、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定する。第１の割当てユニット３３は、第１の決定ユニット３２により決定された信号帯域幅内のサブバンドにビットを割り当てる。符号化ユニット３４は、サブバンドごとに第１の割当てユニット３３により割り当てられたビットに従って音声信号のスペクトル係数を符号化する。

図４は、本発明の別の実施形態に従う音声信号符号化装置のブロック図である。図４に示す音声信号符号化装置４０では、図３に示すものと同様なユニットまたは要素は、同じ参照番号により示してある。

ビット割当ての信号帯域幅を決定するとき、第１の決定ユニット３２はビット割当ての信号帯域幅を音声信号の帯域幅の一部に対して定義してもよい。例えば、図４に示すように、第１の決定ユニット３２は第１の比率因子決定モジュール３２１を備えてもよい。第１の比率因子決定モジュール３２１は、ビット・レート情報に従って比率因子を判定するように構成される。当該比率因子は０より大きく１以下である。あるいは、第１の決定ユニット３２は、第１の比率因子決定モジュール３２１を置き換えるための第２の比率因子決定モジュール３２２を備えてもよい。第２の比率因子決定モジュール３２２は、サブバンド正規化因子に従って音声信号の調波クラスまたは雑音レベルを取得し、調波クラスと雑音レベルに従って比率因子を決定する。

さらに、第１の決定ユニット３２はさらに、第１の帯域幅決定モジュール３２３を備える。比率因子を取得した後、第１の帯域幅決定モジュール３２３は、比率因子と量子化したサブバンド正規化因子に従って帯域幅の一部を決定してもよい。

あるいは、１実施形態では、第１の帯域幅決定モジュール３２３は、帯域幅の一部を決定するとき、量子化したサブバンド正規化因子に従って各サブバンド内のスペクトル・エネルギを取得し、蓄積したスペクトル・エネルギが全サブバンドの総スペクトル・エネルギに比率因子を乗じた積より大きくなるまで、各サブバンド内のスペクトル・エネルギを低周波数から高周波数まで蓄積し、現在のサブバンドに続く帯域幅を当該帯域幅の一部として使用する。

分類情報を考えると、音声信号符号化装置４０が、音声信号のフレームを分類するように構成された分類ユニット３５をさらに備えてもよい。例えば、分類ユニット３５が、音声信号のフレームが調波タイプに属するか非調波タイプに属するかを判定してもよく、音声信号のフレームが調波タイプに属する場合には、量子化ユニット３１をトリガしてもよい。１実施形態では、フレームのタイプをピーク平均率に従って判定してもよい。例えば、分類ユニット３５がフレームのサブバンドの全部または一部から各サブバンドのピーク平均率を取得し、ピーク平均率が第１の閾値より大きいサブバンドの数が第２の閾値以上であるとき、当該フレームが調波タイプに属すると判定し、ピーク平均率が第１の閾値より大きいサブバンドの数が第２の閾値より小さいときには、当該フレームが非調波タイプに属すると判定する。このケースでは、第１の決定ユニット３２は、当該フレームが調波タイプに属するとみなし、ビット割当ての信号帯域幅をフレームの帯域幅の一部として定義する。

あるいは、別の実施形態では、第１の割当てユニット３３がサブバンド正規化因子調整モジュール３３１およびビット割当てモジュール３３２を備えてもよい。サブバンド正規化因子調整モジュール３３１が、決定した信号帯域幅内のサブバンドのサブバンド正規化因子を調節する。ビット割当てモジュール３３２は、調節したサブバンド正規化因子に従ってビットを割り当てる。例えば、第１の割当てユニット３３が帯域幅の一部の中間サブバンドのサブバンド正規化因子を、当該中間サブバンドに続く各サブバンドのサブバンド正規化因子として使用してもよい。

図５は、本発明の１実施形態に従う音声信号復号化装置のブロック図である。図５に示す音声信号復号化装置５０は、取得ユニット５１、第２の決定ユニット５２、第２の割当てユニット５３、復号化ユニット５４、拡張ユニット５５、および復元ユニット５６を備える。

取得ユニット５１は、量子化したサブバンド正規化因子を取得する。第２の決定ユニット５２は、取得ユニット５１によって取得した量子化したサブバンド正規化因子に従って、または、量子化したサブバンド正規化因子とビット・レート情報に従って、ビット割当ての信号帯域幅を決定する。第２の割当てユニット５３は、第２の決定ユニット５２により決定された信号帯域幅内のサブバンドにビットを割り当てる。復号化ユニット５４は、サブバンドごとに第２の割当てユニット５３により割り当てたビットに従って正規化スペクトルを復号化する。拡張ユニット５５は、復号化ユニット５４によって復号化された正規化スペクトルに対して雑音充填および帯域幅拡張を実施して、正規化した全帯域スペクトルを取得する。復元ユニット５６は、拡張ユニット５５により取得した正規化した全帯域スペクトルとサブバンド正規化因子に従って音声信号のスペクトル係数を取得する。

本発明の当該実施形態によれば、符号化と復号化の間に、ビット割当ての信号帯域幅が、量子化したサブバンド正規化因子とビット・レート情報に従って決定される。このように、ビットを集約化することによって、決定された信号帯域幅が効果的に符号化および復号化され、音声品質が改善される。

図６は、本発明の別の実施形態に従う音声信号復号化装置のブロック図である。図６に示す音声信号復号化装置６０では、図５に示すものと同様なユニットまたは要素は、同じ参照番号により示してある。

図４に示す第１の決定ユニット３２と同様に、ビット割当ての信号帯域幅を決定するとき、音声信号復号化装置６０の第２の決定ユニット５２が、ビット割当ての信号帯域幅を音声信号の帯域幅の一部に対して定義してもよい。例えば、第２の決定ユニット５２が、ビット・レート情報に従って比率因子を決定するように構成された第３の比率因子決定ユニット５２１を備えてもよい。当該比率因子は０より大きく１以下である。あるいは、第２の決定ユニット５２が、サブバンド正規化因子に従って音声信号の調波クラスまたは雑音レベルを取得し、調波クラスと雑音レベルに従って比率因子を決定するように構成された第４の比率因子決定ユニット５２２を備えてもよい。

加えて、第２の決定ユニット５２はさらに第２の帯域幅決定モジュール５２３を備える。比率因子を取得した後、第２の帯域幅決定モジュール５２３は、当該比率因子と量子化したサブバンド正規化因子とに従って帯域幅の一部を判定してもよい。

あるいは、１実施形態では、第２の帯域幅決定モジュール５２３が、当該帯域幅の一部を決定するとき、量子化したサブバンド正規化因子に従って各サブバンド内のスペクトル・エネルギを取得し、蓄積したスペクトル・エネルギが全サブバンドの総スペクトル・エネルギに比率因子を乗じた積より大きくなるまで、各サブバンド内のスペクトル・エネルギを低周波数から高周波数まで蓄積し、現在のサブバンドに続く帯域幅を当該帯域幅の一部として使用する。

あるいは、１実施形態では、拡張ユニット５５がさらに、第１の周波数帯決定モジュール５５１およびスペクトル係数取得モジュール５５２を備えてもよい。第１の周波数帯決定モジュール５５１は、Ｎを正の整数として、現在のフレームと当該現在のフレームより前のＮ個のフレームのビット割当てに従って、第１の周波数帯を決定する。スペクトル係数取得モジュール５５２は、第１の周波数帯のスペクトル係数に従って高周波数帯域のスペクトル係数を取得する。例えば、第１の周波数帯を決定するとき、第１の周波数帯決定モジュール５５１は、現在のフレームに対して割り当てたビットと前のＮ個のフレームに割り当てたビットの間の相関関係を取得し、取得した相関関係に従って第１の周波数帯を決定してもよい。

バックグラウンド雑音を調節する必要がある場合には、音声信号復号化装置６０がさらに、サブバンド正規化因子に従って雑音レベルを取得し、取得した雑音レベルを使用することにより高周波数帯域内のバックグラウンド雑音を調節するように構成された調整ユニット５７を備えてもよい。

あるいは、別の実施形態では、スペクトル係数取得モジュール５５２が、スペクトル平坦性情報と高周波数帯域の信号タイプに従って正規化長を取得し、取得した正規化長に従って第１の周波数帯のスペクトル係数を正規化し、第１の周波数帯の正規化スペクトル係数を高周波数帯域のスペクトル係数として使用してもよい。当該スペクトル平坦性情報が、第１の周波数帯における各サブバンドのピーク平均率、第１の周波数帯に対応する時間領域信号の相関関係、または第１の周波数帯に対応する時間領域信号のゼロ交差率を含んでもよい。

本発明の当該実施形態によれば、符号化および復号化システムが音声信号符号化装置および音声信号復号化装置を備えてもよい。

本発明の技術的解決策を、電子ハードウェア、コンピュータ・ソフトウェア、または本発明の当該実施形態で説明した例示的なユニットおよびアルゴリズムステップを組み合わせることによってハードウェアとソフトウェアの組合せとして実装してもよいことは当業者には理解される。諸機能をハードウェアで実装するかソフトウェアで実装するかは当該技術的解決策の具体的な適用事例と設計した限定事項に依存する。当業者は、具体的な適用事例のケースにおいて様々な方法を用いて当該諸機能を実装してもよい。しかし、当該実装形態は本発明の範囲を超えるものではない。

説明を簡単かつ簡潔にするために、以上で説明したシステム、装置、およびユニットの動作プロセスについては、方法の実施形態における対応する説明を参照できることは当業者には明らかに理解され、ここでは詳細には説明しない。

本発明で提供した例示的な実施形態では、開示したシステム、装置、および機器、および方法を他の方式で実装してもよいことは理解される。例えば、装置の実施形態は例示的なものにすぎない。例えば、当該ユニットは論理機能によってのみ分割される。実際の実装形態では、他の分割方式を使用してもよい。例えば、複数のユニットもしくは要素を組み合わせるかもしくはシステムに統合し、または、幾つかの機能を無視するかもしくは実装しなくともよい。さらに、図示または説明した内部結合、直接結合、または通信接続を、幾つかのインタフェース、装置、または電子モードもしくは機械モードのユニット、または他の方式で実装してもよい。

幾つかのコンポーネントとして使用されるユニットが互いに物理的に独立であってもなくてもよい。ユニットとして示した要素が、複数のネットワーク・ユニット上の位置に配置されるかまたは複数のネットワーク・ユニットに展開された、物理ユニットであってもなくてもよい。当該ユニットの一部または全部を必要に応じて選択して、本発明の当該実施形態で開示した技術的解決策を実装してもよい。

さらに、本発明の実施形態における様々な機能ユニットを処理ユニットに統合してもよく、または、物理的な独立ユニットに統合してもよい。または、２つの機能ユニットもしくは３つ以上の機能ユニット１つのユニットに統合してもよい。

諸機能をソフトウェア機能ユニットおよび関数の形態で独立な商用利用製品として実装する場合には、当該諸機能をコンピュータ読取可能記憶媒体に格納してもよい。かかる理解をもとに、当該技術的解決策、または、先行技術への貢献を構成する本発明で開示した技術的解決策、または、当該技術的解決策の一部を本質的にソフトウェア製品の形で具体化してもよい。当該ソフトウェア製品を記憶媒体に格納してもよい。当該ソフトウェア製品は、コンピュータ装置（ＰＣ、サーバ、またはネットワーク装置）が本発明の当該実施形態で提供した方法または諸ステップの一部を実行できるようにする幾つかの命令を含む。当該記憶媒体には、プログラム・コードを格納できる様々な媒体、例えば、ＲＯＭ（ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）、ＲＡＭ（ｒａｎｄｏｍａｃｃｅｓｓｍｅｍｏｒｙ）、磁気ディスク、またはＣＤ−ＲＯＭ（ｃｏｍｐａｃｔｄｉｓｃ−ｒｅａｄｏｎｌｙｍｅｍｏｒｙ）が含まれる。

纏めると、以上は本発明の例示的な実施形態にすぎず、本発明の範囲はこれに限定されるものではない。本発明の技術的範囲に入る当業者に容易想到な変形または置換えは本発明の保護範囲に入る。したがって、本発明の保護範囲は添付の特許請求の範囲に支配される。

３１量子化ユニット
３２第１の決定ユニット
３３第１の割当てユニット
３４符号化ユニット
３５分類ユニット
３２１第１の比率因子決定モジュール
３２２第２の比率因子決定モジュール
３２３第１の帯域幅決定モジュール
３３１サブバンド正規化因子調整モジュール
３３２ビット割当てモジュール
５１取得ユニット
５２第２の決定ユニット
５３第２の割当てユニット
５４復号化ユニット
５５拡張ユニット
５６復元ユニット
５７調整ユニット
５２１第３の比率因子決定ユニット
５２２第４の比率因子決定ユニット
５２３第２の帯域幅決定モジュール
５５１第１の周波数帯決定モジュール
５５２スペクトル係数取得モジュール

Claims

音声信号の周波数帯を複数のサブバンドに分割するステップと、
各サブバンドのエンベロープを量子化するステップと、
前記量子化されたエンベロープに従って、または前記量子化されたエンベロープおよびビット・レート情報に従ってビット割当ての信号帯域幅を決定するステップと、
前記決定された信号帯域幅内の特定のサブバンドの量子化されたエンベロープを調節するステップと、
前記調節されたエンベロープに従って前記特定のサブバンドにビットを割り当てるステップと、
前記特定のサブバンドに対して割り当てられた前記ビットに従って前記特定のサブバンドのスペクトル係数を符号化するステップと、
を含む、音声信号符号化方法。
前記決定されたビット割当ての信号帯域幅は前記音声信号の帯域幅の一部である、請求項１に記載の方法。
前記量子化されたエンベロープおよびビット・レート情報に従ってビット割当ての信号帯域幅を決定するステップは、
前記ビット・レート情報に従って比率因子を決定するステップと、前記比率因子は０より大きくかつ１以下であるステップと、
前記比率因子および前記量子化されたエンベロープに従って前記ビット割当ての信号帯域幅を決定するステップと、
を含む、請求項１または２に記載の方法。
前記比率因子および前記量子化されたエンベロープに従って前記ビット割当ての信号帯域幅を決定するステップは、
蓄積された量子化されたエネルギが所定数のサブバンドの量子化されたエネルギの合計に前記比率因子を乗じた積より大きくなるまで、各サブバンドの量子化されたエネルギを低周波数から高周波数に蓄積するステップ
を含み、
現在のサブバンドに続く帯域幅は前記ビット割当ての信号帯域幅に対応し、前記現在のサブバンドは前記蓄積された量子化されたエネルギが前記積より大きいサブバンドに対応する、
請求項３に記載の方法。
前記音声信号が調波タイプに対応するときに実施される、請求項１乃至４の何れか１項に記載の方法。
前記決定された信号帯域幅内の特定のサブバンドの量子化されたエンベロープを調節するステップは、
前記特定のサブバンドが中間サブバンドに続くとき、前記ビット割当ての信号帯域幅の前記中間サブバンドの量子化されたエンベロープに等しいように前記特定のサブバンドの前記量子化されたエンベロープを調節するステップ
を含む、請求項１乃至５の何れか１項に記載の方法。
前記中間サブバンドの前記量子化されたエンベロープに等しいように前記特定のサブバンドの前記量子化されたエンベロープを調節する前に、前記方法はさらに、
前記ビット割当ての信号帯域幅内の前記サブバンドの前記量子化されたエンベロープに従って、前記ビット割当ての信号帯域幅内のサブバンドを再順序付けするステップ
を含み、
前記中間サブバンドおよび前記特定のサブバンドは再順序付けされたサブバンドである、
請求項６に記載の方法。
音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのエンベロープを量子化するように構成された量子化ユニットと、
前記量子化されたエンベロープに従って、または前記量子化されたエンベロープおよびビット・レート情報に従ってビット割当ての信号帯域幅を決定するように構成された第１の決定ユニットと、
前記決定された信号帯域幅内の特定のサブバンドの量子化されたエンベロープを調節するように構成されたサブバンドエンベロープ調節ユニットと、
前記調節されたエンベロープに従って前記特定のサブバンドにビットを割り当てるように構成された第１の割当てユニットと、
前記特定のサブバンドに対して割り当てられた前記ビットに従って前記特定のサブバンドのスペクトル係数を符号化するように構成された符号化ユニットと、
を備える、音声信号符号化装置。
前記決定されたビット割当ての信号帯域幅は前記音声信号の帯域幅の一部である、請求項８に記載の装置。
前記第１の決定ユニットは、
前記ビット・レート情報に従って比率因子を決定するように構成された第１の比率因子決定モジュールであって、前記比率因子は０より大きくかつ１以下である、第１の比率因子決定モジュールと、
前記比率因子および前記量子化されたエンベロープに従ってビット割当ての信号帯域幅を決定するように構成された第１の帯域幅決定モジュールと、
を備える、請求項８または９に記載の装置。
前記第１の帯域幅決定モジュールは、蓄積された量子化されたエネルギが所定数のサブバンドの量子化されたエネルギの合計に前記比率因子を乗じた積より大きくなるまで、各サブバンドの量子化されたエネルギを低周波数から高周波数に蓄積するように構成され、現在のサブバンドに続く帯域幅は前記ビット割当ての信号帯域幅に対応し、前記現在のサブバンドは前記蓄積された量子化されたエネルギが前記積より大きいサブバンドに対応する、請求項１０に記載の装置。
前記量子化ユニットは、前記音声信号が調波タイプに対応するとき、音声信号の周波数帯を複数のサブバンドに分割し、各サブバンドのエンベロープを量子化するように構成された、請求項８乃至１１の何れか１項に記載の装置。
前記サブバンドエンベロープ調節ユニットは、前記特定のサブバンドが中間サブバンドに続くとき、前記ビット割当ての信号帯域幅の前記中間サブバンドの量子化されたエンベロープに等しいように前記特定のサブバンドの前記量子化されたエンベロープを調節するように構成された、請求項８乃至１２の何れか１項に記載の装置。
前記装置は、前記ビット割当ての信号帯域幅内の前記サブバンドの前記量子化されたエンベロープに従って、前記ビット割当ての信号帯域幅内のサブバンドを再順序付けするように構成されたユニットをさらに備え、前記中間サブバンドおよび前記特定のサブバンドは再順序付けされたサブバンドである、請求項１３に記載の装置。