JP2013174689A

JP2013174689A - オーディオ符号化装置、オーディオ符号化方法、およびプログラム

Info

Publication number: JP2013174689A
Application number: JP2012038434A
Authority: JP
Inventors: Yasuhiro Tokuri; 康裕戸栗; Yuji Maeda; 祐児前田; Shiro Suzuki; 志朗鈴木; Atsushi Matsumoto; 淳松本; Yuki Matsumura; 祐樹松村
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2012-02-24
Filing date: 2012-02-24
Publication date: 2013-09-05

Abstract

【課題】新たな情報を復号側に伝送することなく、符号化による音質劣化を防止することができるようにする。
【解決手段】複数の量子化部は、互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する。選択部は、複数の量子化部により量子化された正規化スペクトルのエネルギーのそれぞれと、量子化前の正規化スペクトルのエネルギーとの差分に基づいて、複数の量子化部のうちの１つの量子化部により量子化された正規化スペクトルを選択する。選択された量子化スペクトルは符号化される。本技術は、例えば、オーディオ符号化装置に適用することができる。
【選択図】図４

Description

本技術は、オーディオ符号化装置、オーディオ符号化方法、およびプログラムに関し、特に、新たな情報を復号側に伝送することなく、符号化による音質劣化を防止することができるようにしたオーディオ符号化装置、オーディオ符号化方法、およびプログラムに関する。

音声や音楽等のオーディオ信号を高能率符号化する手法として、変換符号化が知られている。変換符号化では、まず、時間領域のオーディオ信号が所定の時間単位でブロック化され、ブロックごとに周波数領域のスペクトルに変換される。そして、そのスペクトルが複数の所定の帯域幅の量子化ユニットに分割され、量子化ユニットごとにまとめて量子化され、符号化される。

このとき、量子化の前に、量子化ユニットごとに、周波数領域のスペクトル(以下、周波数スペクトルという)が所定の範囲内（絶対値が１以内など）に収まるように、周波数スペクトルに対して、スケールファクタを用いた正規化を行う場合もある。

また、低ビットレートの変換符号化では、復号側に伝送する情報の量を減らすために、各量子化ユニットに割り当てられるビット数を示すビット割り当て情報が伝送されず、復号側で、スケールファクタなどの情報からビット割り当て情報が復元される場合もある。

以上のような変換符号化が行われる場合、ビットレートが低いと、各量子化ユニットに割り当てられるビット数が少ないため、量子化によって周波数スペクトルのエネルギーに比較的大きい誤差が生じる。

図１は、この誤差を説明する図である。

なお、図１において、横軸は、正規化された周波数スペクトルの番号を表し、縦軸は、正規化された周波数スペクトルのパワーレベルを表している。また、図１の例では、4本の周波数スペクトルで構成される量子化ユニットが、絶対値の最大値が１未満となるように正規化され、正規化された周波数スペクトルが、符号を含めて2ビットに線形量子化されている。

従って、図１の例では、縦軸に付加された黒丸で示すように、量子化ポイント(量子化値)は、0と±2/3であり、各量子化ステップの上限の閾値は、±1/3と1である。そして、図１の左側に示す量子化ユニットは、量子化されると、図１の右側に示すようになる。

図１に示すように、量子化ユニットに割り当てられるビット数が少ない場合、線形量子化のステップ幅は大きくなるため、周波数スペクトルは量子化後にゼロになりやすい。これにより、量子化前後の量子化ユニットのエネルギーに比較的大きい誤差が生じる。

また、量子化後の量子化ユニットのパワーレベルの形状は、図１の右側に示すように、凹凸のある櫛型形状となる。その結果、復号結果に異音や音質劣化が生じる。一般的には、高域の量子化ユニットほど割り当てられるビット数が少ないため、異音や音質劣化は、特に中域から高域で発生しやすい。

そこで、スケールファクタを調整することで量子化により生じた量子化ユニットのエネルギーの誤差を補正する方法が考案されている（例えば、特許文献１参照）。

しかしながら、低ビットレートの変換符号化において、上述したように、復号側で、スケールファクタなどの情報からビット割り当て情報が復元される場合、符号化側でスケールファクタが変更されると、復号側でビット割り当て情報が復元できない。従って、低ビットレートの変換符号化であっても、復号側にビット割り当て情報を伝送する必要がある。

また、各量子化ステップの帰属成分数を初めに決定し、量子化前後の量子化ユニットのエネルギーが同一になるという拘束条件のもとで、設計関数に基づいて量子化ステップを補正する方法が考案されている（例えば、特許文献２参照）。

しかしながら、量子化ステップの閾値を変更しながら繰り返し量子化雑音を評価する必要があるため、処理が複雑化し、演算量が増加する。また、量子化インデックスに対応する量子化ポイントを変更するため、復号側に、各量子化インデックスに対応する量子化ポイントを伝送する必要がある。従って、特許文献２に記載されている方法で符号化されたオーディオ信号を、既存の規格の復号装置において復号することは困難である。

特許４１６８９７６号公報特許４３３５２４５号公報

以上のように、特許文献１および特許文献２の方法では、ビット割り当て情報や各量子化インデックスに対応する量子化ポイントを新たに伝送する必要があるため、既存の復号装置は、変換符号化された周波数スペクトルを復号することができない。

本技術は、このような状況に鑑みてなされたものであり、新たな情報を復号側に伝送することなく、符号化による音質劣化を防止することができるようにするものである。

本技術の一側面のオーディオ符号化装置は、互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化部と、前記複数の量子化部により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する選択部と、前記選択部により選択された前記周波数スペクトルを符号化する符号化部とを備えるオーディオ符号化装置である。

本技術の一側面のオーディオ符号化方法およびプログラムは、本技術の一側面のオーディオ符号化装置に対応する。

本技術の一側面においては、複数の特性で、オーディオ信号の周波数スペクトルが量子化され、前記複数の特性で量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の特性のうちの１つの特性で量子化された前記周波数スペクトルが選択され、選択された前記周波数スペクトルが符号化される。

本技術の一側面によれば、新たな情報を復号側に伝送することなく、符号化による音質劣化を防止することができる。

量子化前後の正規化されたスペクトルのエネルギーの誤差を説明する図である。本技術を適用したオーディオ符号化装置の第１実施の形態の構成例を示すブロック図である。量子化ユニットの例を示す図である。図２の最適量子化部の構成例を示すブロック図である。図４の量子化部の構成例を示すブロック図である。各量子化部の量子化の特性の例を示す図である。量子化部における量子化を説明する図である。量子化スペクトル、エネルギー、および差分の例を示す図である。量子化スペクトル、エネルギー、および差分の例を示す図である。図２のオーディオ符号化装置による符号化処理を説明するフローチャートである。図１０の量子化処理を説明するフローチャートである。オーディオ復号装置の構成例を示すブロック図である。図１２のオーディオ復号装置の復号処理を説明するフローチャートである。本技術を適用したオーディオ符号化装置の第２実施の形態の最適量子化部の構成例を示すブロック図である。差分と差分の平均値の例を示す図である。図１４の最適量子化部の量子化処理を説明するフローチャートである。本技術を適用したオーディオ符号化装置の第３実施の形態の最適量子化部の構成例を示すブロック図である。差分と差分の指数荷重平均の例を示す図である。図１７の最適量子化部の量子化処理を説明するフローチャートである。コンピュータのハードウエアの構成例を示すブロック図である。

＜第１実施の形態＞
［オーディオ符号化装置の第１実施の形態の構成例］
図２は、本技術を適用したオーディオ符号化装置の第１実施の形態の構成例を示すブロック図である。

図２のオーディオ符号化装置１０は、スペクトル変換部１１、正規化部１２、最適量子化部１３、スペクトル符号化部１４、ビット割当計算部１５、スケールファクタ符号化部１６、および多重化部１７により構成される。オーディオ符号化装置１０は、オーディオのデジタル時間信号であるオーディオ信号をフレーム単位で符号化する。

具体的には、スペクトル変換部１１は、外部からフレーム単位のオーディオ信号を受け取り、周波数スペクトルにスペクトル変換する。スペクトル変換としては、例えば、離散フーリエ変換（DFT（Discrete Fourier Transformation））、離散コサイン変換（DCT（Discrete Cosine Transformation）、修正離散コサイン変換（MDCT（Modified Discrete Cosine Transformation））等が用いられる。スペクトル変換部１１は、周波数スペクトルを正規化部１２に供給する。

正規化部１２は、スペクトル変換部１１から供給される周波数スペクトルを、以下の式（１）により、所定の帯域幅の量子化ユニットごとに正規化する。

X_ｎｏｒｍ=X×2^{−ＳＦ（ｑ）}
・・・（１）

なお、式（１）において、X_ｎｏｒｍは、量子化ユニットqの正規化された周波数スペクトルである正規化スペクトルであり、Xは、量子化ユニットqの周波数スペクトルである。また、SF(q)は、正規化スペクトルX_ｎｏｒｍの絶対値の最大値が1を超えないように決定される、量子化ユニットqのスケールファクタである。スケールファクタSF(q)は、整数であるため、正規化のステップ幅は、3dBである。

正規化部１２は、正規化スペクトルX_ｎｏｒｍを最適量子化部１３に供給し、スケールファクタSF(q)をビット割当計算部１５とスケールファクタ符号化部１６に供給する。

最適量子化部１３は、ビット割当計算部１５から供給されるビット割り当て情報に基づいて、Ｋ（Ｋは２以上）種類の特性で、量子化ユニットqごとに、正規化部１２から供給される正規化スペクトルX_ｎｏｒｍを量子化する。このように、最適量子化部１３は、量子化ユニットqごとに量子化を行うことにより、量子化ユニットqごとの量子化雑音を制御することができる。その結果、いわゆる聴覚マスキング効果等の性質を利用して高能率な符号化を行うことができる。

最適量子化部１３は、Ｋ種類の特性で量子化された正規化スペクトルX_ｎｏｒｍのうちの、１種類の特性で量子化された正規化スペクトルX_ｎｏｒｍを選択し、量子化スペクトルとしてスペクトル符号化部１４に供給する。

スペクトル符号化部１４は、最適量子化部１３から供給される量子化スペクトルに対して、ハフマン符号化や算術符号化などのエントロピー符号化を行う。なお、スペクトル符号化部１４は、量子化スペクトルそのものではなく、隣接する量子化ユニットq-1の量子化スペクトルとの差分や、隣接する量子化ユニットq-1から予測される量子化ユニットqの量子化スペクトルとの差分などをエントロピー符号化するようにしてもよい。スペクトル符号化部１４は、エントロピー符号化の結果得られる符号化スペクトルを多重化部１７に供給する。

なお、ここでは、スペクトル符号化部１４は、エントロピー符号化を行うものとするが、等長符号化を行うようにしてもよい。

ビット割当計算部１５は、正規化部１２から供給される量子化ユニットqごとのスケールファクタSF(q)に基づいて、例えば、以下の式（２）により、各量子化ユニットqに割り当てるビット数Nbits(q)を計算する。

Nbits(q)=｛SF(q)-NL(q)｝/m
・・・（２）

なお、式（２）において、NL(q)は、予め設定された所定の許容ノイズレベルを表す整数であり、mは、所定の係数としての正の整数である。

式（２）によれば、スケールファクタSF(q)が大きい量子化ユニットqほど、ビット数Nbits(q)が大きくなる。即ち、ビット数Nbits(q)は、スケールファクタSF(q)、つまり周波数スペクトルXのパワーレベルに適応する。また、係数ｍの値を変更することにより、ビット数Nbits(q)の周波数スペクトルXのパワーレベルへの適応の程度を変更することができる。

また、スケールファクタSF(q)、許容ノイズレベルNL(q)、および係数mが全て整数であるので、式（２）によれば、整数演算によりビット数Nbits(q)を計算することができる。その結果、復号側において、スケールファクタSF(q)から符号化時と完全に同一のビット数Nbits(q)を復元することができる。

なお、式（２）により計算されたビット数Nbits(q)が、量子化ユニットqの所定の最小ビット数（例えば、１ビット）に満たない場合は、ビット割当計算部１５は、ビット数Nbits(q)を最小ビット数にする。

ビット割当計算部１５は、ビット数Nbits(q)を示すビット割り当て情報を最適量子化部１３に供給する。

スケールファクタ符号化部１６は、正規化部１２から供給される量子化ユニットqごとのスケールファクタSF(q)に対してエントロピー符号化を行う。なお、スケールファクタ符号化部１６は、スケールファクタSF(q)そのものではなく、隣接する量子化ユニットq-1のスケールファクタSF(q-1)との差分や、隣接する量子化ユニットq-1から予測されるスケールファクタSF(q)'との差分などをエントロピー符号化するようにしてもよい。

隣接する量子化ユニットq-1のスケールファクタSF(q-1)との差分ΔSF(q)(q≧1)は、以下の式（３）により求められる。

ΔSF(q)=SF(q)-SF(q-1)
・・・（３）

スケールファクタ符号化部１６は、エントロピー符号化の結果得られる符号化スケールファクタを多重化部１７に供給する。なお、ここでは、スケールファクタ符号化部１６は、エントロピー符号化を行うものとするが、等長符号化を行うようにしてもよい。

多重化部１７は、スペクトル符号化部１４から供給される符号化スペクトル、スケールファクタ符号化部１６から供給される符号化スケールファクタ、その他の付加情報などを、所定のフォーマットにしたがって多重化し、出力ビットストリームを生成する。多重化部１７は、出力ビットストリームを復号装置に送信する。

［量子化ユニットの例］
図３は、量子化ユニットqの例を示す図である。

なお、図３において、横軸は、周波数を表し、縦軸は、周波数スペクトルXのパワーレベルを表す。また、図３では、低域からi番目の量子化ユニットqをqiと表す。

図３に示すように、いわゆる聴覚の臨界帯域幅（クリティカルバンド）が考慮されて、量子化ユニットqの帯域幅は高域ほど広くなっている。

[最適量子化部の構成例]
図４は、図２の最適量子化部１３の構成例を示すブロック図である。

図４に示すように、最適量子化部１３は、Ｋ個の量子化部３１−１乃至３１−Ｋ、Ｋ個のエネルギー計算部３２−１乃至３２−Ｋ、エネルギー計算部３３、および選択部３４により構成される。

量子化部３１−１乃至３１−Ｋは、図２の正規化部１２から供給される正規化スペクトルX_ｎｏｒｍを、量子化ユニットqごとに、互いに異なる特性で量子化する。ここで、異なる特性の量子化とは、同一の量子化ポイントに対するステップ幅と閾値が異なる量子化を指す。量子化部３１−１乃至３１−Ｋは、それぞれ、量子化の結果得られる量子化スペクトルを、エネルギー計算部３２−１乃至３２−Ｋと選択部３４に供給する。

エネルギー計算部３２−１乃至３２−Ｋは、それぞれ、量子化部３１−１乃至３１−Ｋから供給される量子化スペクトルのエネルギーを、以下の式（４）により、量子化ユニットqごとに計算し、選択部３４に供給する。

なお、Eq(k)は、量子化部３１−ｋ（ｋ=1,2,・・・,K）により得られる量子化ユニットｑの量子化スペクトルのエネルギーであり、X_ｎは、量子化部３１−ｋ（ｋ=1,2,・・・,K）により得られる量子化スペクトルである。

以下では、量子化部３１−１乃至３１−Ｋを特に区別する必要がない場合、それらをまとめて量子化部３１という。同様に、エネルギー計算部３２−１乃至３２−Ｋをエネルギー計算部３２という。

エネルギー計算部３３は、図２の正規化部１２から供給される正規化スペクトルX_ｎｏｒｍのエネルギーEq(0)を、上述した式（４）と同様の式により、量子化ユニットqごとに計算し、選択部３４に供給する。

選択部３４は、エネルギー計算部３２から供給されるエネルギーEq(k)と、エネルギー計算部３３から供給されるエネルギーEq(0)の差分ΔEq(k)を、量子化ユニットqごとに計算する。選択部３４は、その差分ΔEq(k)に基づいて、量子化部３１−１乃至３１−Ｋのうちの、差分ΔEq(k)の絶対値が最小となるエネルギーEq(k)に対応する量子化部３１から供給される量子化スペクトルX_ｎを量子化ユニットqごとに選択する。

具体的には、選択部３４は、以下の式（５）により、差分ΔEq(k)の絶対値の最小値を与えるkの値sel_quantizer(q)を量子化ユニットqごとに求める。

sel_quantizer(q)=arg min_{１≦ｋ≦Ｋ}(|ΔEq(k)|)
・・・（５）

そして、選択部３４は、量子化ユニットqごとに最小値を与えるsel_quantizer(q)に対応する量子化部３１から供給される量子化スペクトルX_ｎを選択する。選択部３４は、選択された量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給する。

なお、ここでは、量子化部３１が、全ての量子化ユニットqに対して共通に設けられたが、量子化ユニットqごとに複数の量子化部が設けられるようにしてもよい。この場合、量子化ユニットqごとに、量子化部の数や特性が異なるようにすることができる。

例えば、一般的に、高域の量子化ユニットqほど割り当てられるビット数Nbits(q)が少ないため、差分ΔEq(k)が発生しやすい。従って、高域の量子化ユニットqの正規化スペクトルX_ｎｏｒｍを量子化する量子化部の数が、低域の量子化ユニットqの正規化スペクトルX_ｎｏｒｍを量子化する量子化部の数に比べて多くされる。このとき、低域の量子化ユニットqの正規化スペクトルX_ｎｏｒｍを量子化する量子化部の数は1にしてもよい。

また、量子化ステップの閾値の絶対値は小さいほど音質が向上する。従って、エネルギーギャップによるノイズが人に知覚されやすい高域の量子化ユニットqの正規化スペクトルX_ｎｏｒｍを量子化する量子化部の特性としての閾値の絶対値は、低域の量子化ユニットqの正規化スペクトルX_ｎｏｒｍを量子化する量子化部の特性としての閾値の絶対値に比べて小さいものを含むようにしてもよい。

[量子化部の構成例]
図５は、図４の量子化部３１の構成例を示すブロック図である。

図５に示すように、量子化部３１は、非線形変換部５１と線形量子化部５２により構成される。

非線形変換部５１は、図２の正規化部１２から供給される量子化ユニットqごとの正規化スペクトルX_ｎｏｒｍを、以下の式（６）で表される非線形な関数で変換する。

Y_ｎｏｒｍ=sign(X_ｎｏｒｍ)・|X_ｎｏｒｍ|^α（ｋ）
・・・（６）

なお、式（６）において、Y_ｎｏｒｍは、変換後の正規化スペクトルX_ｎｏｒｍである変換スペクトルであり、α(k)は、後述するように、量子化部３１-ｋ（k=1,2,・・・,K）における量子化の各量子化ステップの閾値を変更するパラメータである。また、sign(X_ｎｏｒｍ)はX_ｎｏｒｍの符号であり、|X_ｎｏｒｍ|は、X_ｎｏｒｍの絶対値である。非線形変換部５１は、変換の結果得られる変換スペクトルY_ｎｏｒｍを線形量子化部５２に供給する。

線形量子化部５２は、非線形変換部５１から供給される変換スペクトルY_ｎｏｒｍを、量子化ユニットqごとに均等なステップ幅で線形量子化し、その結果得られる量子化スペクトルX_ｎを図４のエネルギー計算部３２に供給する。

以上のように構成される量子化部３１では、α(k)=1である場合、均等なステップ幅で量子化が行われ、α(k)=1ではない場合、均等ではないステップ幅で量子化が行われる。

具体的には、線形量子化部５２により正規化スペクトルX_ｎｏｒｍが符号を含めて2ビットに線形量子化される場合、α(k)=1であるとき、±(1/3)^１が、その線形量子化の量子化ステップの上限の閾値である±1/3と等しい。従って、量子化部３１における量子化ステップの上限の閾値は±1/3と1であり、量子化部３１における量子化は、均等なステップ幅の線形量子化となる。

一方、例えばα(k)=0.75であるとき、±(0.231)^０．７５が±1/3と略等しい。従って、量子化部３１における量子化の量子化ステップの上限の閾値は±0.231と1であり、量子化部３１における量子化は、均等ではないステップ幅の線形量子化となる。

即ち、正規化スペクトルX_ｎｏｒｍの絶対値が0.231以下である場合、変換スペクトルY_ｎｏｒｍの絶対値が1/3以下となり、量子化スペクトルX_ｎが0になる。一方、正規化スペクトルX_ｎｏｒｍが0.231より大きい場合、変換スペクトルY_ｎｏｒｍは1/3より大きくなり、量子化スペクトルX_ｎが2/3となる。また、正規化スペクトルX_ｎｏｒｍが-0.231より小さい場合、変換スペクトルY_ｎｏｒｍは-1/3より小さくなり、量子化スペクトルX_ｎが-2/3となる。

このように、量子化部３１では、パラメータα(k)によって、線形量子化の量子化ステップの閾値に対応する正規化スペクトルX_ｎｏｒｍの値を変更することにより、量子化ステップの閾値が変更される。

[量子化の特性]
図６は、各量子化部３１の量子化の特性の例を示す図である。

図６の例では、ビット数Nbitsが2ビットであり、量子化ステップ数は3である。また、各量子化ステップに対応する量子化値（量子化ポイント）は、-2/3（=-0.666）,0,2/3（=0.666）である。図６では、各量子化ステップを、対応する量子化値の小さい方から順に、量子化ステップ＃１、量子化ステップ＃２、量子化ステップ＃３と表す。

図６では、量子化部３１−１の量子化ステップ＃１の上限の閾値は-0.231であり、量子化ステップ＃２の上限の閾値は0.231であり、量子化ステップ＃３の上限の閾値は1.0である。即ち、パラメータα(1)は0.75である。

また、量子化部３１−２の量子化ステップ＃１の上限の閾値は-0.333であり、量子化ステップ＃２の上限の閾値は0.333であり、量子化ステップ＃３の上限の閾値は1.0である。即ち、パラメータα(2)は1である。従って、量子化部３１−２による量子化は、図１に示した均等なステップ幅の線形量子化である。

さらに、図示は省略するが、量子化部３１−３乃至３１−（Ｋ−１）においても同様に、量子化ステップ＃１乃至量子化ステップ＃３の上限の閾値が、他の量子化部３１とは異なる値となっている。また、量子化部３１−Ｋの量子化ステップ＃１の上限の閾値は-0.111であり、量子化ステップ＃２の上限の閾値は0.111であり、量子化ステップ＃３の上限の閾値は1.0である。ここで、±(0.111)^０．５が±1/3と略等しい。即ち、パラメータα(K)は0.5である。

なお、図６では、ビット数Nbitsが2ビットである場合についてのみ説明したが、図６と同様のテーブルは、ビット数Nbitsごとに設定される。量子化部３１は、ビット割り当て情報が示すビット数Nbitsに対応する特性に基づいて量子化を行う。

[量子化の説明]
図７は、量子化部３１−１における量子化を説明する図である。

なお、図７において、横軸は、正規化スペクトルの番号を表し、縦軸は、正規化スペクトルのパワーレベルを表している。また、図７の例では、量子化ユニットqが、4本の周波数スペクトルXで構成され、正規化スペクトルX_ｎｏｒｍが符号を含めて2ビットに量子化される。

量子化部３１−１における量子化の特性が、図６で示した特性である場合、図７の縦軸に付加された黒丸で示すように、量子化ポイント(量子化値)は、0と±2/3である。また、図７の左側において、点線で示すように、量子化ステップ＃１の上限の閾値は-0.231であり、量子化ステップ＃２の上限の閾値は0.231である。

従って、-1<X_ｎｏｒｍ≦-0.231である場合、正規化スペクトルX_ｎｏｒｍは-2/3に量子化され、-0.231<X_ｎｏｒｍ<0.231である場合、正規化スペクトルX_ｎｏｒｍは0に量子化され、0.231≦X_ｎｏｒｍ<1である場合、正規化スペクトルX_ｎｏｒｍは2/3に量子化される。その結果、図７の左側に示す量子化ユニットqの正規化スペクトルX_ｎｏｒｍは、図７の右側に示すように、量子化される。

なお、正規化スペクトルX_ｎｏｒｍが±0.231である場合、正規化スペクトルX_ｎｏｒｍは0に量子化されてもよい。

量子化ステップ＃１の上限の閾値を-aとし、量子化ステップ＃２の上限の閾値をaとしたとき、上限の閾値aが小さいほど、正規化スペクトルX_ｎｏｒｍが0になりにくく、上限の閾値aが大きいほど、正規化スペクトルX_ｎｏｒｍが0になりやすい。

［量子化スペクトルの選択の説明］
図８および図９は、量子化スペクトルX_ｎ、エネルギーEq(k)、および差分ΔEq(k)の例を示す図である。

なお、図８および図９の例では、量子化部３１の特性が図６に示した特性である。また、量子化ユニットqを構成する周波数スペクトルXの数は4本であり、量子化ユニットqの4本の正規化スペクトルX_ｎｏｒｍを、それぞれ、X1乃至X4と表す。

図８に示すように、正規化スペクトルX1乃至X4が、それぞれ、0.9,0.8,0.3,0.5である場合、エネルギーEq(0)は、1.79である。また、量子化部３１−１および量子化部３１−Ｋにおいて正規化スペクトルX1乃至X4が量子化されることにより得られる量子化スペクトルX_ｎは、全て0.666である。従って、量子化部３１−１により得られる量子化スペクトルX_ｎのエネルギーEq(1)は1.777であり、差分ΔEq(1)は0.012である。同様に、エネルギーEq(K)も1.777であり、差分ΔEq(K)も0.012である。

一方、量子化部３１−２において正規化スペクトルX1乃至X4が量子化されることにより得られる量子化スペクトルは、それぞれ0.666,0.666,0.0,0.666である。従って、量子化部３１−２により得られる量子化スペクトルX_ｎのエネルギーEq(2)は1.333であり、差分ΔEq(2)は0.457である。

ここで、量子化部３１−３乃至３１−（Ｋ−１）により得られる量子化スペクトルX_ｎの差分ΔEq(3)乃至ΔEq(K-1)が0.012より大きいとすると、選択部３４は、差分ΔEq(k)が最小となる量子化部３１−１または量子化部３１−Ｋにより得られる量子化スペクトルX_ｎを選択する。

また、図９に示すように、正規化スペクトルX1乃至X4が、それぞれ、0.7,0.4,0.3,0.3である場合、エネルギーEq(0)は、0.83である。また、量子化部３１−１および量子化部３１−Ｋにおいて正規化スペクトルX1乃至X4が量子化されることにより得られる量子化スペクトルX_ｎは、全て0.666である。従って、量子化部３１−１により得られる量子化スペクトルX_ｎのエネルギーEq(1)は1.777であり、差分ΔEq(1)は0.948である。同様に、エネルギーEq(K)も1.777であり、差分ΔEq(K)も0.948である。

また、量子化部３１−２において正規化スペクトルX1乃至X4が量子化されることにより得られる量子化スペクトルは、それぞれ0.666,0.666,0.0,0.0である。従って、量子化部３１−２により得られる量子化スペクトルX_ｎのエネルギーEq(2)は0.889であり、差分ΔEq(2)は0.059である。

ここで、量子化部３１−３乃至３１−（Ｋ−１）により得られる量子化スペクトルX_ｎの差分ΔEq(3)乃至ΔEq(K-1)が0.059より大きいとすると、選択部３４は、差分ΔEq(k)が最小となる量子化部３１−２により得られる量子化スペクトルX_ｎを選択する。

以上のように、正規化スペクトルX_ｎｏｒｍによって、差分ΔEq(k)が最小となる量子化部３１は異なり、選択部３４は、差分ΔEq(k)が最小となる量子化部３１により得られる量子化スペクトルX_ｎを選択する。

[オーディオ符号化装置の処理の説明]
図１０は、図２のオーディオ符号化装置１０による符号化処理を説明するフローチャートである。この符号化処理は、例えば、オーディオ符号化装置１０が、外部からフレーム単位のオーディオ信号を受け取るごとに、行われる。

図１０のステップＳ１１において、スペクトル変換部１１は、受け取られたフレーム単位のオーディオ信号を周波数スペクトルXに変換し、周波数スペクトルXを正規化部１２に供給する。

ステップＳ１２において、正規化部１２は、スペクトル変換部１１から供給される周波数スペクトルXを、上述した式（１）により、量子化ユニットqごとに正規化する。正規化部１２は、正規化スペクトルX_ｎｏｒｍを最適量子化部１３に供給し、スケールファクタSF(q)をビット割当計算部１５とスケールファクタ符号化部１６に供給する。

ステップＳ１３において、ビット割当計算部１５は、正規化部１２から供給される量子化ユニットqごとのスケールファクタSF(q)に基づいて、上述した式（２）により、各量子化ユニットqに割り当てるビット数Nbits(q)を計算する。ビット割当計算部１５は、ビット数Nbits(q)を示すビット割り当て情報を最適量子化部１３に供給する。

ステップＳ１４において、スケールファクタ符号化部１６は、正規化部１２から供給される量子化ユニットqごとのスケールファクタをエントロピー符号化し、その結果得られる符号化スケールファクタを多重化部１７に供給する。

ステップＳ１５において、最適量子化部１３は、正規化スペクトルX_ｎｏｒｍを量子化する量子化処理を行う。この量子化処理の詳細は、後述する図１１を参照して説明する。

ステップＳ１６において、スペクトル符号化部１４は、最適量子化部１３から供給される量子化スペクトルをエントロピー符号化し、その結果得られる符号化スペクトルを多重化部１７に供給する。

ステップＳ１７において、多重化部１７は、スケールファクタ符号化部１６から供給される符号化スケールファクタとスペクトル符号化部１４から供給される符号化スペクトルなどを、所定のフォーマットにしたがって多重化し、出力ビットストリームを生成する。そして、多重化部１７は、出力ビットストリームを復号装置に送信する。

図１１は、図１０の量子化処理を説明するフローチャートである。

図１１のステップＳ２１において、最適量子化部１３の量子化部３１−１乃至３１−Ｋは、図２の正規化部１２から供給される正規化スペクトルX_ｎｏｒｍを、量子化ユニットqごとに、互いに異なる特性で量子化する。量子化部３１−１乃至３１−Ｋは、それぞれ、量子化の結果得られる量子化スペクトルを、エネルギー計算部３２−１乃至３２−Ｋと選択部３４に供給する。

ステップＳ２２において、エネルギー計算部３２−１乃至３２−Ｋは、それぞれ、量子化部３１−１乃至３１−Ｋから供給される量子化スペクトルのエネルギーEq(k)を、上述した式（４）により、量子化ユニットqごとに計算し、選択部３４に供給する。また、エネルギー計算部３３は、図２の正規化部１２から供給される正規化スペクトルX_ｎｏｒｍのエネルギーEq(0)を、上述した式（４）と同様の式により、量子化ユニットqごとに計算し、選択部３４に供給する。

ステップＳ２３において、選択部３４は、エネルギー計算部３２−１乃至３２−Ｋから供給されるエネルギーEq(k)のそれぞれと、エネルギー計算部３３から供給されるエネルギーEq(0)との差分ΔEq(k)を、量子化ユニットqごとに計算する。

ステップＳ２４において、選択部３４は、差分ΔEq(k)に基づいて、量子化部３１−１乃至３１−Ｋのうちの、差分ΔEq(k)が最小となるエネルギーEq(k)に対応する量子化部３１から供給される量子化スペクトルX_ｎを、量子化ユニットqごとに選択する。そして、選択部３４は、選択された量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給し、処理を図１０のステップＳ１５に戻し、ステップＳ１６に進む。

以上のように、オーディオ符号化装置１０は、互いに異なる複数の特性で正規化スペクトルを量子化し、その結果得られる量子化スペクトルのエネルギーのそれぞれと、量子化前の正規化スペクトルのエネルギーとの差分に基づいて、複数の特性のうちの１つの特性で量子化された量子化スペクトルを選択する。従って、量子化前の正規化スペクトルとのエネルギーの差分がより少ない量子化スペクトルを生成し、符号化による音質劣化を防止することができる。また、オーディオ符号化装置１０は、量子化ポイント（量子化値）やスケールファクタを変更しないため、新たな情報を復号側に伝送する必要がない。

[オーディオ復号装置]
図１２は、図２のオーディオ符号化装置１０から送信されてくる出力ビットストリームを復号するオーディオ復号装置の構成例を示すブロック図である。

図１２に示すように、オーディオ復号装置７０は、分離部７１、スペクトル復号部７２、スケールファクタ復号部７３、ビット割当計算部７４、逆量子化部７５、逆正規化部７６、およびスペクトル逆変換部７７により構成される。

オーディオ復号装置７０の分離部７１は、図２のオーディオ符号化装置１０から送信されてくる出力ビットストリームを受信する。分離部７１は、受信された出力ビットストリームを、所定のフォーマットにしたがって分離し、その結果得られる符号化スペクトルをスペクトル復号部７２に供給し、符号化スケールファクタをスケールファクタ復号部７３に供給する。

スペクトル復号部７２は、分離部７１から供給される符号化スペクトルをエントロピー復号し、その結果得られる量子化スペクトルX_ｎを逆量子化部７５に供給する。スケールファクタ復号部７３は、分離部７１から供給される符号化スケールファクタをエントロピー復号し、その結果得られるスケールファクタSF(q)をビット割当計算部７４と逆正規化部７６に供給する。

ビット割当計算部７４は、ビット割当計算部１５と同様に、スケールファクタSF(q)に基づいて、上述した式（２）により、各量子化ユニットqに割り当てるビット数Nbits(q)を復元する。ビット割当計算部７４は、ビット数Nbits(q)を示すビット割り当て情報を逆量子化部７５に供給する。

逆量子化部７５は、ビット割当計算部７４から供給されるビット割り当て情報に基づいて、スペクトル復号部７２から供給される量子化スペクトルX_ｎを量子化ユニットqごとに逆量子化し、正規化スペクトルX_ｎｏｒｍを復元する。逆量子化部７５は、復元された正規化スペクトルX_ｎｏｒｍを逆正規化部７６に供給する。

逆正規化部７６は、スケールファクタ復号部７３から供給されるスケールファクタSF(q)に基づいて、逆量子化部７５から供給される正規化スペクトルX_ｎｏｒｍを、量子化ユニットqごとに逆正規化し、周波数スペクトルXを復元する。逆正規化部７６は、復元された周波数スペクトルXをスペクトル逆変換部７７に供給する。

スペクトル逆変換部７７は、逆正規化部７６から供給される周波数スペクトルXをオーディオ信号に逆スペクトル変換し、出力する。

[復号装置の処理の説明]
図１３は、図１２のオーディオ復号装置７０の復号処理を説明するフローチャートである。この復号処理は、オーディオ復号装置７０が、図２のオーディオ符号化装置１０から送信されてくる出力ビットストリームを受信したとき、開始される。

図１３のステップＳ３１において、オーディオ復号装置７０の分離部７１は、受信された出力ビットストリームを、所定のフォーマットにしたがって分離する。分離部７１は、その結果得られる符号化スペクトルをスペクトル復号部７２に供給し、符号化スケールファクタをスケールファクタ復号部７３に供給する。

ステップＳ３２において、スペクトル復号部７２は、分離部７１から供給される符号化スペクトルをエントロピー復号し、その結果得られる量子化スペクトルX_ｎを逆量子化部７５に供給する。

ステップＳ３３において、スケールファクタ復号部７３は、分離部７１から供給される符号化スケールファクタをエントロピー復号し、その結果得られるスケールファクタSF(q)をビット割当計算部７４と逆正規化部７６に供給する。

ステップＳ３４において、ビット割当計算部７４は、スケールファクタSF(q)に基づいて、上述した式（２）により、各量子化ユニットqに割り当てるビット数Nbits(q)を計算する。ビット割当計算部７４は、ビット数Nbits(q)を示すビット割り当て情報を逆量子化部７５に供給する。

ステップＳ３５において、逆量子化部７５は、ビット割当計算部７４から供給されるビット割り当て情報に基づいて、スペクトル復号部７２から供給される量子化スペクトルX_ｎを量子化ユニットqごとに逆量子化し、正規化スペクトルX_ｎｏｒｍを復元する。逆量子化部７５は、復元された正規化スペクトルX_ｎｏｒｍを逆正規化部７６に供給する。

ステップＳ３６において、逆正規化部７６は、スケールファクタ復号部７３から供給されるスケールファクタSF(q)に基づいて、逆量子化部７５から供給される正規化スペクトルX_ｎｏｒｍを、量子化ユニットqごとに逆正規化し、周波数スペクトルXを復元する。逆正規化部７６は、復元された周波数スペクトルXをスペクトル逆変換部７７に供給する。

ステップＳ３７において、スペクトル逆変換部７７は、逆正規化部７６から供給される周波数スペクトルXをオーディオ信号に逆スペクトル変換し、出力する。

＜第２実施の形態＞
［オーディオ符号化装置の第２実施の形態の構成例］
図１４は、本技術を適用したオーディオ符号化装置１０の第２実施の形態の最適量子化部１３の構成例を示すブロック図である。

図１４に示す構成のうち、図４の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図１４の最適量子化部１３の構成は、選択部３４の代わりに誤差演算部９１、平均化部９２、および選択部９３が設けられている点が図４の構成と異なる。図１４の最適量子化部１３は、符号化対象のフレームを含む所定数のフレーム（10秒乃至100秒程度）からなるフレーム区間における差分ΔEq(k)の平均値に基づいて、量子化スペクトルX_ｎを選択する。

具体的には、最適量子化部１３の誤差演算部９１は、エネルギー計算部３２から供給されるエネルギーEq(k)と、エネルギー計算部３３から供給されるエネルギーEq(0)の差分ΔEq(k)を、量子化ユニットqごとに計算し、平均化部９２に供給する。

平均化部９２は、誤差演算部９１から供給される差分ΔEq(k)を保持する。平均化部９２は、フレーム区間の差分ΔEq(k)が保持されるごとに、フレーム区間の差分ΔEq(k)を平均化する。平均化部９２は、その結果得られる差分ΔEq(k)の平均値を選択部９３に供給する。

選択部９３は、平均化部９２から供給される差分ΔEq(k)の平均値に基づいて、量子化部３１−１乃至３１−Ｋのうちの、差分ΔEq(k)の平均値が最小となるエネルギーEq(k)に対応する量子化部３１により得られたフレーム区間の量子化スペクトルX_ｎを、量子化ユニットqごとに選択する。そして、選択部９３は、選択されたフレーム区間の量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給する。

[量子化スペクトルの選択の説明]
図１５は、差分ΔEq(k)と差分ΔEq(k)の平均値の例を示す図である。

なお、図１５において、i番目のフレームをFrm#iと表す。また、図１５の例では、フレーム区間を構成するフレームの数がＮである。

図１５に示すように、フレーム区間の差分ΔEq(1)、差分ΔEq(2)、および差分ΔEq(K)の平均値が、それぞれ、0.5,0.3,0.4である場合、差分ΔEq(3)乃至差分ΔEq(K-1)の平均値が0.3より大きいとき、選択部９３は、最小の差分ΔEq(2)に対応する量子化部３１−２により得られるフレーム区間の量子化スペクトルX_ｎを選択する。即ち、選択部９３は、Frm#1乃至Frm#Nの間、同一の量子化部３１−２により得られる量子化スペクトルX_ｎを選択する。

このように、差分ΔEq(k)の平均値に基づいて量子化スペクトルX_ｎが選択される場合、最適量子化部１３は、量子化の特性の切り替えを頻繁に行わずに済むので、復号結果が不安定な音になったり、復号結果に異音が発生したりすることを抑制することができる。

これに対して、差分ΔEq(k)に基づいて量子化スペクトルX_ｎが選択される場合、量子化の特性は、Frm#1では、最小の差分ΔEq(K)に対応する量子化部３１−Ｋにおける特性となるが、Frm#2では、最小の差分ΔEq(2)に対応する量子化部３１−２における特性となり、Frm#Nでは、最小の差分ΔEq(K)に対応する量子化部３１−Ｋにおける特性となる。

[符号化処理の説明]
オーディオ符号化装置１０の第２実施の形態の符号化処理は、図１０のステップＳ１５の量子化処理と、符号化処理の処理単位を除いて、図１０の符号化処理と同様であるので、量子化処理についてのみ説明する。オーディオ符号化装置１０の第２実施の形態の符号化処理の処理単位は、フレーム単位のオーディオ信号ではなく、フレーム区間単位のオーディオ信号である。

図１６は、図１４の最適量子化部１３の量子化処理を説明するフローチャートである。

図１６のステップＳ５１およびＳ５２の処理は、図１１のステップＳ２１およびＳ２２の処理と同様であるので、説明は省略する。

ステップＳ５３において、最適量子化部１３の誤差演算部９１は、エネルギー計算部３２から供給されるエネルギーEq(k)と、エネルギー計算部３３から供給されるエネルギーEq(0)の差分ΔEq(k)を、量子化ユニットqおよびフレームごとに計算し、平均化部９２に供給する。これにより、平均化部９２は、誤差演算部９１から供給されるフレーム区間分の差分ΔEq(k)を保持する。

ステップＳ５４において、平均化部９２は、保持されているフレーム区間分の差分ΔEq(k)を平均化し、保持している差分ΔEq(k)を削除する。平均化部９２は、差分ΔEq(k)の平均値を選択部９３に供給する。

ステップＳ５５において、選択部９３は、平均化部９２から供給される差分ΔEq(k)の平均値に基づいて、量子化部３１−１乃至３１−Ｋのうちの、差分ΔEq(k)の平均値が最小となるエネルギーEq(k)に対応する量子化部３１により得られたフレーム区間の量子化スペクトルX_ｎを選択する。そして、選択部９３は、選択されたフレーム区間の量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給する。

なお、図１４の最適量子化部１３は、フレーム区間の差分ΔEq(k)の統計量に基づいて、量子化スペクトルX_ｎを選択すればよく、差分ΔEq(k)の平均値ではなく、差分ΔEq(k)の最大値などに基づいて、量子化スペクトルX_ｎを選択するようにしてもよい。

＜第３実施の形態＞
［オーディオ符号化装置の第３実施の形態の構成例］
図１７は、本技術を適用したオーディオ符号化装置１０の第３実施の形態の最適量子化部１３の構成例を示すブロック図である。

図１７に示す構成のうち、図１４の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。

図１７の最適量子化部１３の構成は、平均化部９２の代わりに平均化部１１１が設けられている点、選択部９３の代わりに選択部１１２が設けられている点が図１４の構成と異なる。図１７の最適量子化部１３は、符号化対象のフレームより過去の複数フレームにおける差分ΔEq(k)の指数荷重平均に基づいて、量子化スペクトルX_ｎを選択する。

具体的には、最適量子化部１３の平均化部１１１は、誤差演算部９１から供給される差分ΔEq(k)を保持する。平均化部１１１は、保持されている、符号化対象のフレームより過去の複数フレームの差分ΔEq(k)の指数荷重平均を求める。平均化部１１１は、差分ΔEq(k)の指数荷重平均を選択部１１２に供給する。

選択部１１２は、平均化部１１１から供給される差分ΔEq(k)の指数荷重平均に基づいて、量子化部３１−１乃至３１−Ｋのうちの、差分ΔEq(k)の指数荷重平均が最小となるエネルギーEq(k)に対応する量子化部３１により得られる量子化スペクトルX_ｎを、量子化ユニットqごとに選択する。選択部１１２は、選択された量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給する。

[量子化スペクトルの選択の説明]
図１８は、差分ΔEq(1)と差分ΔEq(2)の指数荷重平均の例を示す図である。

なお、図１８において、横軸は、フレーム番号を表している。また、図１８において、実線は、各フレームの差分ΔEq(1)と差分ΔEq(2)を示し、点線は、自己のフレームより過去の複数フレームの差分ΔEq(1)の指数過重平均ΔEq(1)'と差分ΔEq(2)の指数荷重平均ΔEq(2)’を示す。

図１８に示すように、差分ΔEq(1)と差分ΔEq(2)の大小は頻繁に入れ替わるが、指数荷重平均ΔEq(1)’と指数荷重平均ΔEq(2)’の大小は頻繁に入れ替わらない。例えば、図１８において、指数荷重平均ΔEq(3)’乃至指数荷重平均ΔEq(K)’が、指数荷重平均ΔEq(1)’と指数荷重平均ΔEq(2)’の間の値である場合、フレームTよりも前のフレームでは、最小の指数荷重平均ΔEq(1)’に対応する量子化部３１−１による量子化スペクトルX_ｎが選択され、フレームT以降では、最小の指数荷重平均ΔEq(2)’に対応する量子化部３１−２による量子化スペクトルX_ｎが選択される。

このように、差分ΔEq(k)の指数荷重平均ΔEq(k)'に基づいて量子化スペクトルX_ｎが選択される場合、最適量子化部１３は、量子化の特性の切り替えを頻繁に行わずに済むので、復号結果が不安定な音になったり、復号結果に異音が発生したりすることを抑制することができる。

[符号化処理の説明]
オーディオ符号化装置１０の第３実施の形態の符号化処理は、図１０のステップＳ１５の量子化処理を除いて、図１０の符号化処理と同様であるので、量子化処理についてのみ説明する。

図１９は、図１７の最適量子化部１３の量子化処理を説明するフローチャートである。

図１９のステップＳ８１およびＳ８２の処理は、図１１のステップＳ２１およびＳ２２の処理と同様であるので、説明は省略する。

ステップＳ８３において、最適量子化部１３の誤差演算部９１は、エネルギー計算部３２から供給されるエネルギーEq(k)と、エネルギー計算部３３から供給されるエネルギーEq(0)の差分ΔEq(k)を、量子化ユニットqごとに計算し、平均化部１１１に供給する。これにより、平均化部１１１は、誤差演算部９１から供給される差分ΔEq(k)を保持する。

ステップＳ８４において、平均化部１１１は、保持されている、符号化対象のフレームより過去の複数フレームの差分ΔEq(k)の指数荷重平均ΔEq(k)'を求める。なお、符号化対象のフレームより過去の複数フレームの差分ΔEq(k)がまだ保持されていない場合には、平均化部１１１は、保持されている差分ΔEq(k)の指数荷重平均ΔEq(k)'を求める。平均化部１１１は、差分ΔEq(k)の指数荷重平均ΔEq(k)'を選択部１１２に供給する。

ステップＳ８５において、選択部１１２は、平均化部１１１から供給される差分ΔEq(k)の指数荷重平均ΔEq(k)'に基づいて、量子化部３１−１乃至３１−Ｋのうちの、指数荷重平均ΔEq(k)'が最小となるエネルギーEq(k)に対応する量子化部３１により得られた量子化スペクトルX_ｎを選択する。そして、選択部１１２は、選択された量子化スペクトルX_ｎを図２のスペクトル符号化部１４に供給する。

なお、図１７の最適量子化部１３は、符号化対象のフレームより過去の複数フレームの差分ΔEq(k)の統計量に基づいて量子化スペクトルX_ｎを選択すればよく、差分ΔEq(k)の指数荷重平均ではなく、差分ΔEq(k)の平滑化値などに基づいて量子化スペクトルX_ｎを選択するようにしてもよい。図１７の最適量子化部１３は、差分ΔEq(k)の平滑化値に基づいて量子化スペクトルX_ｎを選択する場合、ローパスフィルタなどを用いて差分ΔEq(k)を平滑化する。

また、最適量子化部１３により得られる量子化スペクトルの出現パターンは、従来の量子化による量子化スペクトルの出現パターンと異なるため、スペクトル符号化部１４がハフマン符号化を行う場合には、最適量子化部１３と同様の方法で量子化されたオーディオ信号の量子化スペクトルを用いて学習したハフマンテーブルが用いられることが望ましい。しかしながら、従来のハフマンテーブルが用いられることでハフマン符号化の効率が若干低下した場合であっても、最適量子化部１３により、量子化前後の正規化スペクトルのエネルギーの誤差が軽減されるので、復号結果の音質は向上する。

＜本技術を適用したコンピュータの説明＞
上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図２０は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）２０１，ROM（Read Only Memory）２０２，RAM（Random Access Memory）２０３は、バス２０４により相互に接続されている。

バス２０４には、さらに、入出力インタフェース２０５が接続されている。入出力インタフェース２０５には、入力部２０６、出力部２０７、記憶部２０８、通信部２０９、及びドライブ２１０が接続されている。

入力部２０６は、キーボード、マウス、マイクロフォンなどよりなる。出力部２０７は、ディスプレイ、スピーカなどよりなる。記憶部２０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部２０９は、ネットワークインタフェースなどよりなる。ドライブ２１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア２１１を駆動する。

以上のように構成されるコンピュータでは、CPU２０１が、例えば、記憶部２０８に記憶されているプログラムを、入出力インタフェース２０５及びバス２０４を介して、RAM２０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU２０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア２１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブルメディア２１１をドライブ２１０に装着することにより、入出力インタフェース２０５を介して、記憶部２０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部２０９で受信し、記憶部２０８にインストールすることができる。その他、プログラムは、ROM２０２や記憶部２０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

なお、本技術は、以下のような構成もとることができる。

（１）
互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化部と、
前記複数の量子化部により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する選択部と、
前記選択部により選択された前記周波数スペクトルを符号化する符号化部と
を備えるオーディオ符号化装置。
（２）
前記複数の量子化部は、前記周波数スペクトルを所定の帯域ごとに量子化し、
前記所定の帯域ごとに、前記周波数スペクトルを量子化する前記量子化部の数は異なる
前記（１）に記載のオーディオ符号化装置。
（３）
前記複数の量子化部は、前記周波数スペクトルを所定の帯域ごとに量子化し、
前記所定の帯域ごとに、前記複数の量子化部の前記特性は異なる
前記（１）または（２）に記載のオーディオ符号化装置。
（４）
前記選択部は、処理対象のフレームを含む複数のフレームにおける前記差分の統計量に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する
前記（１）乃至（３）のいずれかに記載のオーディオ符号化装置。
（５）
前記選択部は、処理対象のフレームより過去の複数のフレームにおける前記差分の統計量に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する
前記（１）乃至（３）のいずれかに記載のオーディオ符号化装置。
（６）
前記複数の量子化部は、それぞれ、
前記特性に対応する変換関数を用いて前記周波数スペクトルを非線形変換する非線形変換部と、
前記非線形変換部により非線形変換された前記周波数スペクトルを、均等の量子化ステップ幅で線形量子化する線形量子化部と
を備える
前記（１）乃至（５）のいずれかに記載のオーディオ符号化装置。
（７）
オーディオ符号化装置が、
互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化ステップと、
前記複数の量子化ステップの処理により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化ステップの処理のうちの１つの量子化ステップの処理により量子化された前記周波数スペクトルを選択する選択ステップと、
前記選択ステップの処理により選択された前記周波数スペクトルを符号化する符号化ステップと
を含むオーディオ符号化方法。
（８）
コンピュータを、
互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化部と、
前記複数の量子化部により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する選択部と、
前記選択部により選択された前記周波数スペクトルを符号化する符号化部と
として機能させるためのプログラム。

１０オーディオ符号化装置，１４スペクトル符号化部，３１−１乃至３１−Ｋ量子化部，３４選択部，５１非線形変換部，５２線形量子化部，９３選択部，１１２選択部

Claims

互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化部と、
前記複数の量子化部により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する選択部と、
前記選択部により選択された前記周波数スペクトルを符号化する符号化部と
を備えるオーディオ符号化装置。
前記複数の量子化部は、前記周波数スペクトルを所定の帯域ごとに量子化し、
前記所定の帯域ごとに、前記周波数スペクトルを量子化する前記量子化部の数は異なる
請求項１に記載のオーディオ符号化装置。
前記複数の量子化部は、前記周波数スペクトルを所定の帯域ごとに量子化し、
前記所定の帯域ごとに、前記複数の量子化部の前記特性は異なる
請求項１に記載のオーディオ符号化装置。
前記選択部は、処理対象のフレームを含む複数のフレームにおける前記差分の統計量に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する
請求項１に記載のオーディオ符号化装置。
前記選択部は、処理対象のフレームより過去の複数のフレームにおける前記差分の統計量に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する
請求項１に記載のオーディオ符号化装置。
前記複数の量子化部は、それぞれ、
前記特性に対応する変換関数を用いて前記周波数スペクトルを非線形変換する非線形変換部と、
前記非線形変換部により非線形変換された前記周波数スペクトルを、均等の量子化ステップ幅で線形量子化する線形量子化部と
を備える
請求項１に記載のオーディオ符号化装置。
オーディオ符号化装置が、
互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化ステップと、
前記複数の量子化ステップの処理により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化ステップの処理のうちの１つの量子化ステップの処理により量子化された前記周波数スペクトルを選択する選択ステップと、
前記選択ステップの処理により選択された前記周波数スペクトルを符号化する符号化ステップと
を含むオーディオ符号化方法。
コンピュータを、
互いに異なる特性で、オーディオ信号の周波数スペクトルを量子化する複数の量子化部と、
前記複数の量子化部により量子化された前記周波数スペクトルのエネルギーのそれぞれと、量子化前の前記周波数スペクトルのエネルギーとの差分に基づいて、前記複数の量子化部のうちの１つの量子化部により量子化された前記周波数スペクトルを選択する選択部と、
前記選択部により選択された前記周波数スペクトルを符号化する符号化部と
として機能させるためのプログラム。