JP6552986B2

JP6552986B2 - 音声符号化装置、方法及びプログラム

Info

Publication number: JP6552986B2
Application number: JP2016044737A
Authority: JP
Inventors: 信行西澤
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2016-03-08
Filing date: 2016-03-08
Publication date: 2019-07-31
Anticipated expiration: 2036-03-08
Also published as: JP2017161648A

Description

本発明は、音声符号化装置、方法及びプログラムに関する。

非特許文献１に記載のＭＰＥＧオーディオでは、所謂、サブバンド符号化が使用される。図５は、ＭＰＥＧオーディオ・レイヤ１又は２の符号化装置の概略図である。なお、以下の処理は、フレームと呼ばれる所定期間の信号を単位として行われる。ディジタルオーディオ信号である入力信号は、フィルタバンク５０及び決定部５１に入力される。フィルタバンク５０は、入力信号を、所定の周波数帯域毎に分割し、各周波数帯域の信号を量子化部５２に出力する。一方、決定部５１は、人間の聴覚特性に基づき、各周波数帯域の信号の量子化ステップを決定し、決定した量子化ステップを示す量子化ステップ情報を量子化部５２に出力する。量子化部５２は、量子化ステップ情報に基づき各周波数帯域の信号を量子化して生成部５３に出力する。生成部５３は、各周波数帯域の量子化後の信号（振幅値列）からビットストリームを生成して出力する。ここで、決定部５１は、人間の聴覚心理モデルに基づき量子化ステップを決定する。具体的には、人間の聴感上、信号対雑音比（ＳＮＲ）が低くても良い周波数帯域に対しては量子化ステップを荒くして量子化ビット数を小さくし、これにより、オーディオ信号の圧縮を行っている。

なお、ＭＰＥＧオーディオ・レイヤ３の場合には、量子化部５２において外部ループと内部ループの２つのループ処理が行われる。具体的には、内部ループにおいて量子化ステップを決定し、外部ループにおいて、聴覚心理モデルに基づき符号化誤差を評価する。

ＩＳＯ／ＩＥＣ１１１７２−３：１９９３Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ――Ｃｏｄｉｎｇｏｆｍｏｖｉｎｇｐｉｃｔｕｒｅｓａｎｄａｓｓｏｃｉａｔｅｄａｕｄｉｏｆｏｒｄｉｇｉｔａｌｓｔｏｒａｇｅｍｅｄｉａａｔｕｐｔｏａｂｏｕｔ１．５Ｍｂｉｔ／ｓ――Ｐａｒｔ３：Ａｕｄｉｏ

ＭＰＥＧオーディオ等のサブバンド符号化に基づくオーディオ符号化は、音声信号に限定されないオーディオ信号を符号化の対象としており、音声信号を符号化した場合、音声信号を主な対象とする音声符号化技術よりも高いビットレートを設定しないと、音声符号化技術と同等の品質を得ることができない。しかし、従来のオーディオ符号化であっても、入力が音声信号であることが仮定できれば、符号化の方法を音声信号の特徴に基づき修正することで、ビットレートを低くすることができる。ＭＰＥＧオーディオ等のオーディオ符号化装置及び復号装置は広く普及しており、音声符号化技術による符号化装置および復号装置よりも低コストで利用できる場合があるので、復号装置については、従来の復号装置をそのまま使用できる様に、従来のオーディオ符号化を修正すれば、低ビットレートの音声伝送を低コストで実現することができる。

本発明は、広く普及したオーディオ符号の復号装置をそのまま使用でき、かつ、ビットレートを当該オーディオ符号より低くできる音声符号化装置、方法及びプログラムを提供するものである。

本発明の一側面によると、音声信号を符号化する音声符号化装置は、前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第１信号を出力する分割手段と、前記複数の第１信号それぞれの量子化ステップを決定する決定手段と、前記決定手段が決定した量子化ステップに基づき第１信号の各サンプルを量子化する量子化手段と、前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定手段と、前記第１信号の量子化誤差によるパワーが、前記第１信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第１信号のサンプルの振幅を調整する調整手段と、を備えていることを特徴とする。

広く普及したオーディオ符号の復号装置をそのまま使用でき、かつ、ビットレートを当該オーディオ符号より低くすることができる。

一実施形態による音声符号化装置の構成図。一実施形態による量子化・重畳部の構成図。一実施形態による量子化・重畳部の構成図。一実施形態による量子化・重畳部の構成図。サブバンド符号化装置の構成図。

以下、本発明の例示的な実施形態について図面を参照して説明する。なお、以下の実施形態は例示であり、本発明を実施形態の内容に限定するものではない。また、以下の各図においては、実施形態の説明に必要ではない構成要素については図から省略する。

＜第一実施形態＞
図１は、本実施形態による音声符号化装置の概略的な構成図である。なお、以下で説明する処理は、フレームと呼ばれる所定期間の信号を単位として行われる。ディジタル音声信号である入力信号は、まず、分離部１０に入力される。分離部１０は、入力信号を第１信号と第２信号に分離し、第１信号をフィルタバンク１１に出力し、第２信号を量子化・重畳部１３に出力する。ここで、第１信号は、音声信号を三角関数の和で近似した信号であり、以下では周期成分信号とも呼ぶ。一方、第２信号は、音声信号から第１信号を減じた信号であり、雑音成分に近い特性を持つため、以下では雑音成分信号とも呼ぶ。また、入力信号は、決定部１２にも入力される。フィルタバンク１１は、第１信号を、所定の周波数帯域毎に分割し、各周波数帯域に分割された第１信号を量子化・重畳部１３に出力する。決定部１２は、人間の聴覚特性に基づき、各周波数帯域の信号の量子化ステップを決定し、決定した量子化ステップを示す量子化ステップ情報を量子化・重畳部１３に出力する。量子化・重畳部１３での処理については後述するが、最終的に、量子化・重畳部１３は、第２信号と、決定部１２からの量子化ステップ情報に基づき、各周波数帯域に分割された第１信号の各サンプルの振幅値を生成部１４に出力する。量子化・重畳部１３は、決定部１２が決定した量子化ステップを変更する場合があり、量子化ステップを変更した場合、量子化・重畳部１３は、変更後の量子化ステップを示す量子化ステップ情報を生成部１４に出力する。なお、量子化ステップを変更しなかった場合、量子化・重畳部１３は、決定部１２からの量子化ステップ情報をそのまま生成部１４に出力する。生成部１４は、各周波数帯域のサンプルの振幅と量子化ステップ情報に基づきビットストリームを生成して出力する。ここで、決定部１２は、人間の聴覚心理モデルに基づき量子化ステップを決定する。具体的には、人間の聴感上、信号対雑音比（ＳＮＲ）が低くても良い周波数帯域に対しては量子化ステップを荒くして量子化ビット数を小さくする。

図２は、本実施形態による量子化・重畳部１３の構成図である。なお、図の簡略化のため、図２において、決定部１２からの量子化ステップ情報が量子化部１３１に入力される状態のみを示しているが、決定部１２からの量子化ステップ情報は、図２の各機能ブロックが利用可能となっているものとする。量子化部１３１は、決定部１２からの量子化ステップ情報に従い、帯域分割された第１信号それぞれの量子化を行い、量子化後の各サンプルの振幅を誤差判定部１３２及び振幅調整部１３５に出力する。誤差判定部１３２は、帯域分割された元の第１信号の振幅と、量子化後の振幅との差を各サンプルについて求め、これを量子化誤差として確率計算部１３４に出力する。

また、第２信号はパワー判定部１３３に入力される。パワー判定部１３３は、フレーム期間に渡る第２信号を周波数領域の信号に変換し、フィルタバンク１１における周波数帯域それぞれについて信号パワーを求め、各周波数帯域の第２信号のパワーを示すパワー情報を確率計算部１３４に出力する。確率計算部１３４は、各サンプルの量子化誤差とパワー情報に基づき、各サンプルに対して、増加確率ｐ（０≦ｐ≦１）と、減少確率ｑ（０≦ｑ≦１）と、維持確率ｒ（０≦ｒ≦１）と、を求める。なお、ｐ＋ｑ＋ｒ＝１である。この増加確率ｐ、減少確率ｑ及び維持確率ｒの算出方法については後述する。

振幅調整部１３５は、量子化後のサンプルの振幅を、当該サンプルに対応する増加確率ｐ、減少確率ｑ及び維持確率ｒに基づき調整し、当該サンプルの調整後の振幅を生成部１４に出力する。また、量子化ステップ情報を生成部１４に出力する。

続いて、振幅調整部１３５においてどの様に振幅を調整するかについて説明する。一例として、増加確率ｐが０．３であり、減少確率ｑが０．５であり、よって、維持確率ｒが０．２であるものとする。振幅調整部１３５は、量子化後のサンプルに対して０以上１以下の一様乱数を生成する。この乱数が０以上０．３以下（つまり、その値の範囲が増加確率ｐである０．３）であると、振幅調整部１３５は、当該サンプルの振幅を量子化ステップで１つ分だけ大きくする。一方、乱数が０．３より大きく、かつ、０．８以下（つまり、その値の範囲が減少確率ｑである０．５）であると、振幅調整部１３５は、当該サンプルの振幅を量子化ステップで１つ分だけ小さくする。一方、乱数が０．８より大きく、かつ、１．０以下（つまり、その値の範囲が維持確率ｒである０．２）であると、振幅調整部１３５は、当該サンプルの振幅を変更しない。

続いて、確率計算部１３４における、増加確率ｐ、減少確率ｑ及び維持確率ｒの求め方について説明を行う。なお、以下の処理は、各周波数帯域に対してそれぞれ行う。具体的な例として、１つのフレームには８つのサンプルが存在し、ある周波数帯域の第１信号のサンプルの振幅が、その時間順に６８、９９、７８、１４、−５７、−９８、−８７、−３０であるものとする。また、パワー情報が、当該フレームにおける当該周波数帯域のパワーが２０であることを示し、量子化ステップ情報が、当該フレームにおける当該周波数帯域の量子化ステップが１６であることを示しているものとする。

この場合、量子化部１３１における量子化後の各サンプルの振幅は、６４、９６、８０、１６、−６４、−９６、−８０、−３２となる。したがって、誤差判定部１３２が、確率計算部１３４に出力する各サンプルの量子化誤差は、−４、−３、２、２、−７、２、７、−２となる。この場合、量子化誤差の合計は−３であり、よって、サンプル当たりの量子化誤差、つまり、量子化誤差の平均値は−３／８＝−０．３７５となる。また、量子化誤差によるパワーは、各量子化誤差の２乗の平均値として求めることができ、本例において、各サンプルの量子化誤差の２乗は、１６、９、４、４、４９、４、４９、４である。よって、量子化誤差による２乗誤差の合計値は１３９であり、量子化誤差によるパワーは１７．３７５となる。

本実施形態においては、振幅調整部１３５が出力する調整後のサンプルの振幅について、量子化誤差の期待値が０であり、かつ、量子化誤差のパワーの期待値が、パワー情報で示される２０になる或いは近づくように、増加確率ｐ、減少確率ｑ及び維持確率ｒを求める。ここで、振幅調整部１３５が出力する調整後のサンプルの量子化誤差とは、振幅調整部１３５の出力と第１信号との差のことを言う。例えば、１番目のサンプルの元の振幅は６８であり、量子化部１３１による量子化後の振幅は６４である。ここで、１番目のサンプルについて、量子化ステップを１つだけ増加させるとその振幅は８０となり、量子化ステップを１つだけ減少させるとその振幅は４８となる。したがって、量子化誤差の期待値を０とすると、以下の式（１）が得られる。
ｐ（８０−６８）＋ｑ（４８−６８）＋ｒ（６４−６８）＝０（１）
また、量子化誤差のパワーの期待値を雑音成分信号のパワー、つまり、本例では２０とすると、以下の式（２）が得られる。
ｐ（８０−６８）^２＋ｑ（４８−６８）^２＋ｒ（６４−６８）^２＝２０（２）
また。上述した様に、増加確率ｐ、減少確率ｑ及び維持確率ｒには式（３）で示す関係がある。
ｒ＝１−ｐ−ｑ（３）

本実施形態では、上記式（１）〜（３）に基づき増加確率ｐ、減少確率ｑ及び維持確率ｒを求める。なお、本例において、ｐ＝０．１５６２５、ｑ＝−０．０９３７５、ｒ＝０．９３７５であり、増加確率ｐ、減少確率ｑ及び維持確率ｒの総てが０以上１以下の値にはならない。例えば、増加確率ｐ、減少確率ｑ及び維持確率ｒの総てが０以上１以下の値であり、かつ、増加確率ｐ及び減少確率ｑの和が１以下であれば、上述した様に対応するサンプルの振幅を調整する。しかしながら、本例の様に、増加確率ｐ、減少確率ｑ及び維持確率ｒとして０未満の値や、１より大きい値が得られた場合、本実施形態では、増加確率ｐ又は減少確率ｑを０とし、パワーの期待値のみに基づき増加確率ｐ又は減少確率ｑと、維持確率ｒを求める。なお、増加確率ｐ及び減少確率ｑのどちらを０とするかは、実際に予め決めておくことも、ランダムに選択することも、交互に選択することもできる。あるいは、双方を実験的に試みて、量子化誤差の期待値の絶対値が小さくなる方法を選択しても良い。以下では、増加確率ｐ及び減少確率ｑを纏めて変更確率ｓ（０≦ｓ≦１）と呼ぶものとする。

そうすると、ここでは例として減少確率ｑの方を０としたとき式（２）及び式（３）は、それぞれ、以下の式（４）及び式（５）になる。
ｓ（８０−６８）^２＋ｒ（６４−６８）^２＝２０（４）
ｒ＝１−ｓ（５）
上記式（４）及び（５）から変更確率ｓは０．０３１２５となり、維持確率ｒは０．９６８７５となる。この場合、振幅調整部１３５は、発生した乱数の値により確率０．０３１２５でサンプルの振幅を量子化ステップで１だけ増加又は減少させることになる。

なお、本実施形態では、増加確率ｐ、減少確率ｑ及び維持確率ｒの内、１つでも０未満の値や、１より大きい値があると、増加確率ｐ及び減少確率ｑのいずれかを０として増加確率ｐ、減少確率ｑ及び維持確率ｒを求めたが、常に、増加確率ｐ及び減少確率ｑのいずれかを０として増加確率ｐ、減少確率ｑ及び維持確率ｒを求める形態であっても良い。つまり、常に上記式（４）及び（５）に基づき変更確率ｓ及び維持確率ｒを求めてサンプルの振幅を調整する形態とすることができる。この場合、変更確率ｓに基づき振幅を増加させるのか減少させるのかは予め決めておくことも、ランダムに選択することも、交互に選択することもできる。あるいは、双方を実験的に試みて、量子化誤差の期待値の絶対値が小さくなる方法を選択しても良い。また、本実施形態では、分離部１０において入力信号を第１信号と第２信号に分離した。しかしながら、音声符号化装置の外部において第１信号と第２信号とに分離しておき、音声符号化装置は、外部の装置から第１信号と第２信号の両方をそれぞれ受信する形態であって良い。これは、一部の音声合成装置においては、周期成分信号と雑音成分信号をそれぞれ個別に生成するため、そのような音声合成装置で合成した音声を本発明による音声符号化装置で伝送する場合、音声合成装置における周期成分信号と雑音成分信号を、それぞれ本発明における第1成分信号、第２成分信号とすれば、分離部１０は必要ないからである。また、本実施形態において、第１信号は音声の周期信号成分であるとしたが、本発明はそれに限定されない。具体的には、帯域分割した結果が、その各帯域において白色雑音と見做せれるような信号を第２信号とすれば良く、この場合、入力信号から第２信号を減じた信号を第１信号とすることができる。例えば、破裂音的な音声区間を対象に、第１信号を単一のインパルスとしても良い。

続いて、本発明における上記処理の考え方について説明する。図５に示すオーディオ符号化装置は、周期成分信号（第１信号）及び雑音成分信号（第２信号）を区別することなく処理を行う。一方、音声信号から周期成分信号を減じることで得られる雑音成分信号は、フィルタバンクにより分割された各周波数帯域においては、白色雑音と見做せる。したがって、本発明においては、周期成分信号を従来のオーディオ符号化と同様に量子化した上で、雑音成分については、その波形を考慮することなく、そのパワーのみを考慮して符号化を行う。具体的には、量子化雑音も白色雑音と見做せるため、周期成分信号を量子化し、量子化雑音が雑音成分信号のパワーに近づく様に、量子化後のサンプルの振幅をサンプル単位でそれぞれ調整する。この構成により、雑音成分を含めた波形に基づき行う符号化に比べて符号化により生じるビット量を減少させ、よって、低ビットレート化を実現することができる。なお、本実施形態では、量子化ステップを１ステップだけ増加又は減少させたが、２ステップだけ増加又は減少させる等、複数ステップだけ増加又は減少させる形態であっても良い。つまり、量子化ステップの整数倍を所定値とし、所定値だけサンプルの振幅を確率的に増減させる構成とすることができる。

以上、各周波数帯域において、周期成分信号のサンプルの振幅を調整して雑音成分信号のパワーを量子化雑音として重畳させる。この構成により音声信号の圧縮率を高めることができる。また、本実施形態における音声符号化装置が出力する信号は、従来のオーディオ符号化の符号化装置と同じであり、よって、従来のオーディオ符号化の復号装置をそのまま使用することが可能になる。

＜第二実施形態＞
続いて、本実施形態について、第一実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図１と同様である。図３は、本実施形態による量子化・重畳部１３の構成図である。本実施形態と第一実施形態は、確率計算部１３４において、増加確率ｐ、減少確率ｑ及び維持確率ｒの内、１つでも０未満の値や、１より大きい値が得られた場合の処理が異なるのみであり、その他の処理は第一実施形態と同様である。

上述した様に、第一実施形態では、増加確率ｐ、減少確率ｑ及び維持確率ｒの内、１つでも０未満の値や、１より大きい値があると、増加確率ｐ及び減少確率ｑのいずれかを０として増加確率ｐ、減少確率ｑ及び維持確率ｒを求めていた。本実施形態では、増加確率ｐ、減少確率ｑ及び維持確率ｒの内、１つでも０未満の値や、１より大きい値があると、当該フレームにおける量子化ステップをより小さい値に変更する。例えば、量子化ステップを１６から８に変更するものとする。この場合、上記例の最初のサンプルの振幅について、量子化ステップを１つだけ増加させると、その振幅は７２になり、量子化ステップを１つだけ減少させると、その振幅は５６になる。したがって、量子化誤差の期待値を０とし、量子化誤差パワーの期待値を２０とすると、以下の式（６）及び（７）が得られる。
ｐ（７２−６８）＋ｑ（５６−６８）＋ｒ（６４−６８）＝０（６）
ｐ（７２−６８）^２＋ｑ（５６−６８）^２＋ｒ（６４−６８）^２＝２０（７）
式（３）、式（６）及び式（７）より、量子化ステップを小さくすると、増加確率ｐ＝０．５３１２５、減少確率ｑ＝０．０３１２５、維持確率ｒ＝０．４３７５が得られる。この場合、確率計算部１３４は、量子化ステップの変更を変更通知信号で振幅調整部１３５に通知し、振幅調整部１３５は、変更後の量子化ステップを示す量子化ステップ情報を生成部１４に出力する。

＜第三実施形態＞
続いて、本実施形態について、第一実施形態及び第二実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図１と同様である。図４は、本実施形態による量子化・重畳部１３の構成図である。本実施形態において、確率計算部１３４には各周波数帯域の量子化後のサンプルの振幅も入力される。そして、確率計算部１３４は、各周波数帯域について、量子化後のサンプルの振幅の２乗のフレーム内における総和を求め、これを、フレーム内のサンプル数で除することで、当該フレームにおける量子化後の第１信号のパワーを求める。そして求めた第１信号のパワーを、パワー情報が示す当該フレームの雑音成分のパワーと比較する。例えば、求めた第１信号のパワーが、雑音成分信号のパワーより大変小さいと、当該フレームに対応する周波数帯域の信号は、雑音成分信号が支配的であり、周期成分信号については無視しても復号される音声信号の品質はあまり劣化しない。よって、確率計算部１３４は、例えば、当該フレームにおける量子化後の第１信号のパワーに対する雑音成分信号のパワーの比を求め、この比が閾値以上であると、雑音成分信号のパワーとなるサンプル列と、量子化ステップと、を求めて振幅調整部１３５に変更通知信号で通知する。このとき、量子化ステップを、決定部１２が決定した量子化ステップより大きい値に変更する。振幅調整部１３５は、変更通知信号により、サンプル列と量子化ステップが通知されると、当該フレームにおいては、量子化部１３１で量子化されたサンプル列を、確率計算部１３４から通知されたサンプル列に置換して出力する。また、量子化ステップ情報として、確率計算部１３４から通知された量子化ステップを出力する。その他の構成は第一実施形態又は第二実施形態と同様である。なお、本実施形態においては、量子化後の第１信号のパワーと雑音成分信号のパワーとを比較したが、量子化前の第１信号のパワーと雑音成分信号のパワーとを比較する構成であっても良い。

以上、本実施形態では、雑音成分が支配的であるフレームの周波数帯域については、雑音成分のパワーに基づき量子化ステップとサンプルの振幅系列を決定する。この構成により、雑音成分が支配的であるフレームの周波数帯域の量子化ステップを大きくすることができ、よって、符号化で生じるビット数を低減して低ビットレート化を実現することができる。

＜その他＞
ＭＰＥＧオーディオ・レイヤ３では、量子化後のサンプルについて、可変長符号であるハフマン符号化を更に行う。具体的には、内部ループにおいて量子化ステップを調整しながら量子化を行う。その後、外部ループにおいて、符号化歪みが許容範囲内であるかを判定し、許容範囲内でなければ、再度、内部ループについての処理を行う。

したがって、本発明をＭＰＥＧオーディオ・レイヤ３に適用する場合、内部ループにおいて各周波数帯域の第１信号の量子化を行い、総ての量子化後の振幅がハッフマン符号の符号表の範囲内であるか否かを判定し、総ての量子化後の振幅がハッフマン符号の符号表の範囲内であると、上述した様に、量子化雑音のパワーがパワー情報で示されるパワーに近づくように量子化後の振幅を調整すれば良い。

なお、振幅の調整については、上記各実施形態と同様に量子化ステップの整数倍だけ増減させる方法とするが、ＭＰＥＧオーディオ・レイヤ３の様に量子化後の値を可変長符号化する場合には、調整前のサンプルの振幅に対応する符号語より、符号語の長さが短くなる様に変更することができる。つまり、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなる符号語を選択し、選択した符号語に対応する振幅と元の振幅に基づき変更確率ｓを求めて確率的にサンプルの振幅を調整する構成とすることができる。或いは、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなり、かつ、振幅が増加する符号語と、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなり、かつ、振幅が減少する符号語を選択し、式（１）〜式（３）に基づき増加確率ｐ及び減少確率ｑを求めて確率的にサンプルの振幅を調整する構成とすることができる。これにより、ビットレートをより低くすることができる。

なお、本発明による音声符号化装置は、コンピュータを上記音声符号化装置として動作させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。

１１：フィルタバンク、１２：決定部、１３１：量子化部、１３３：パワー判定部、１３５：振幅調整部

Claims

音声信号を符号化する音声符号化装置であって、
前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第１信号を出力する分割手段と、
前記複数の第１信号それぞれの量子化ステップを決定する決定手段と、
前記決定手段が決定した量子化ステップに基づき第１信号の各サンプルを量子化する量子化手段と、
前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定手段と、
前記第１信号の量子化誤差によるパワーが、前記第１信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第１信号のサンプルの振幅を調整する調整手段と、
を備えていることを特徴とする音声符号化装置。
前記判定手段は、所定期間の前記雑音成分信号について、前記複数の周波数帯域それぞれのパワーを判定し、
前記調整手段は、前記所定期間の前記第１信号の量子化誤差によるパワーが、前記所定期間の前記第１信号に対応する周波数帯域での前記雑音成分信号のパワーである第１の値に近づく様に、量子化後の前記第１信号のサンプルの振幅を調整することを特徴とする請求項１に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号の各サンプルそれぞれについて変更確率ｓを求め、当該各サンプルの量子化後の振幅を対応する変更確率ｓで所定値だけ増加又は減少させることで、量子化後の前記第１信号のサンプルの振幅を調整し、
サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率ｓであると、当該サンプルの量子化誤差のパワーの期待値が前記第１の値となる様に、当該サンプルに対応する変更確率ｓは求められ、
前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項２に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号の各サンプルそれぞれについて増加確率ｐ及び減少確率ｑを求め、当該各サンプルの量子化後の振幅を対応する増加確率ｐで所定値だけ増加させ、対応する減少確率ｑで前記所定値だけ減少させることで、量子化後の前記第１信号のサンプルの振幅を調整し、
サンプルの量子化後の振幅を前記所定値だけ増加させる確率が増加確率ｐであり、かつ、当該サンプルの量子化後の振幅を前記所定値だけ減少させる確率が減少確率ｑであると、当該サンプルの量子化誤差のパワーの期待値が前記第１の値となり、かつ、当該サンプルの量子化誤差の期待値が０となる様に、当該サンプルに対応する増加確率ｐ及び減少確率ｑは求められ、
前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項２に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号のサンプルの増加確率ｐ又は減少確率ｑが０より小さいか１より大きい場合、当該サンプルについて変更確率ｓを求め、当該サンプルの量子化後の振幅を求めた変更確率ｓで前記所定値だけ増加又は減少させることで、当該サンプルの振幅を調整し、
当該サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率ｓであると、当該サンプルの量子化誤差のパワーの期待値が前記第１の値となる様に、当該サンプルに対応する前記変更確率ｓは求められることを特徴とする請求項４に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号の各サンプルに対応する増加確率ｐ及び減少確率ｑに０より小さいもの、又は、１より大きいものが含まれる場合、前記所定期間の前記第１信号の各サンプルの増加確率ｐ及び減少確率ｑが０以上、かつ、１以下となるまで前記量子化ステップを小さくすることを特徴とすることを特徴とする請求項４に記載の音声符号化装置。
前記所定値は、前記決定手段が決定した量子化ステップの値であることを特徴とする請求項３から６のいずれか１項に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号のパワーに対する、前記第１信号に対応する周波数帯域における前記所定期間の前記雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第１信号の量子化ステップをより大きい値に変更することを特徴とする請求項２から７のいずれか１項に記載の音声符号化装置。
前記調整手段は、前記所定期間の前記第１信号のパワーに対する、前記第１信号に対応する周波数帯域における前記所定期間の雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第１信号の量子化ステップをより大きい値に変更し、前記所定期間の量子化後の前記第１信号を、前記第１信号に対応する周波数帯域における前記雑音成分信号のパワーに対応する振幅のサンプル列に置換することを特徴とする請求項２から７のいずれか１項に記載の音声符号化装置。
前記調整手段は、量子化後の前記第１信号の少なくとも１つのサンプルの調整後の振幅に対応する符号語の長さが、調整前の振幅に対応する符号語より短くなる様に当該サンプルの振幅を調整することを特徴とする請求項１に記載の音声符号化装置。
前記音声信号を前記周期成分信号と前記雑音成分信号に分離する分離手段を更に備えていることを特徴とする請求項１から１０のいずれか１項に記載の音声符号化装置。
前記周期成分信号及び前記雑音成分信号それぞれを他の装置から受信することを特徴とする請求項１から１０のいずれか１項に記載の音声符号化装置。
音声符号化装置における音声信号の符号化方法であって
前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第１信号を出力する分割工程と、
前記複数の第１信号それぞれの量子化ステップを決定する決定工程と、
前記決定工程で決定した量子化ステップに基づき第１信号の各サンプルを量子化する量子化工程と、
前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定工程と、
前記第１信号の量子化誤差によるパワーが、前記第１信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第１信号のサンプルの振幅を調整する調整工程と、
を含むことを特徴とする符号化方法。
請求項１から１２のいずれか１項に記載の音声符号化装置としてコンピュータを機能させることを特徴とするプログラム。