JP6739604B2

JP6739604B2 - 符号化方法、装置、プログラム及び記録媒体

Info

Publication number: JP6739604B2
Application number: JP2019140886A
Authority: JP
Inventors: 守谷　健弘; 健弘守谷; 優鎌本; 登原田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2014-07-28
Filing date: 2019-07-31
Publication date: 2020-08-12
Anticipated expiration: 2035-05-15
Also published as: EP3796314B1; US10629217B2; KR20170024030A; US11043227B2; EP3796314A1; ES2838006T3; CN112992164A; KR20190042773A; US20200176006A1; PL3796314T3; JP2018139004A; KR20190077115A; EP3163571A4; ES2908564T3; JPWO2016017238A1; CN112992165A; CN106796801A; JP6608993B2; CN112992163B; KR101993828B1

Description

本発明は、音響信号の符号化技術に関する。特に、音響信号を周波数領域に変換して符号化する符号化技術に関する。

音声や音楽などの音響信号の符号化には、入力音響信号を周波数領域で符号化する手法が広く用いられている。音響信号の周波数領域での符号化方法としては、例えば非特許文献１や非特許文献２の方法がある。

非特許文献１に記載された符号化方法は、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を行うものである。具体的には、非特許文献１に記載された符号化方法は、入力音響信号から得られる線形予測係数に変換可能な係数を符号化して線形予測係数符号を得て、線形予測係数符号に対応する量子化済みの線形予測係数に変換可能な係数に対応するスペクトル包絡係数列で入力音響信号に対応する周波数領域係数列を正規化して得られる正規化係数列を符号化して正規化係数符号を得るものである。線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数（偏自己相関係数）またはLSPパラメータなどである。

非特許文献２に記載された符号化方法は、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分をとり、差分値可変長符号化を伴う符号化処理を行うものである。具体的には、非特許文献２に記載された符号化方法は、入力音響信号に対応する周波数領域係数列を低域ほどサンプル数が少なく高域ほどサンプル数が多い周波数領域に区分し、区分した周波数領域ごとの平均エネルギーを得て、その平均エネルギーを対数軸で量子化する。量子化した値を隣接する周波数領域の平均エネルギーを同様に対数軸で量子化した値との差分を可変長符号化する。区分した周波数領域ごとの対数軸で量子化された平均エネルギーを使って、各周波数領域係数の量子化ビット数や各周波数領域係数の量子化ステップ幅を適応的に決定し、それに従って各周波数領域係数を量子化し、さらにそれを可変長符号化するものである。

Anthony Vetro, "MPEG Unified Speech and Audio Coding", Industry and Standards, IEEE MultiMedia, April-June, 2013. M. Bosi and R.E. Goldberg, "Introduction to Digital Audio Coding and Standards", Kluwer Academic Publishers, 2003.

非特許文献２の符号化方法によれば、入力音響信号のスペクトル包絡の起伏が大きくない場合やスペクトルの集中度が高くない場合には、平均エネルギーの差分を可変長符号化することにより平均エネルギー符号の符号量を少なくすることができるため、入力音響信号を効率良く符号化することができる。しかし、入力音響信号のスペクトル包絡の起伏が大きい場合やスペクトルの集中度が高い場合には、平均エネルギーの差分を可変長符号化して得られる平均エネルギー符号の符号量が多くなる。

これに対し、非特許文献１の符号化方法によれば、線形予測係数に変換可能な係数によりスペクトル包絡を効率良く符号化できるため、入力音響信号のスペクトル包絡の起伏が大きい場合やスペクトルの集中度が高い場合には、非特許文献２の符号化方法よりも入力音響信号を効率良く符号化することができる。しかし、入力音響信号のスペクトル包絡の起伏が大きくない場合やスペクトルの集中度が高くない場合には、非特許文献２の符号化方法ほどは効率良く符号化することはできない。

このように、従来の符号化方法には、入力音響信号の特性によっては効率良く符号化できない場合がある。

本発明は、入力音響信号の特性によらず効率の良く符号化し、かつ、受聴者が不自然に感じることの少ない復号音響信号を得られるような符号化方法、装置、プログラム及び記録媒体を提供することを目的とする。

本発明の一態様の符号化方法は、入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、現フレームの入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の閾値より大きい場合には、現フレームを第一符号化ステップで符号化することを決定可能とし、現フレームの入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が閾値以下の場合には、現フレームを第二符号化ステップで符号化することを決定可能とする決定ステップとを含む。

本発明の一態様の符号化方法は、入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、現フレームの入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の第一の閾値より大きい場合には、現フレームを第一符号化ステップで符号化することを決定可能とし、現フレームの入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が第一の閾値より小さい所定の第二の閾値以下の場合には、現フレームを第二符号化ステップで符号化することを決定可能とする決定ステップとを含む。

本発明の一態様の符号化方法は、前記の符号化方法であって、決定ステップは、更に、現フレームの入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が第一の閾値以下でありかつ第二の閾値より大きい場合には、前フレームと同じ符号化処理を現フレームの符号化処理として決定可能とする。

フレームごとに周波数領域で符号化を行う複数の符号化処理の何れかを選択可能な構成により、受聴者が不自然に感じることの少ない復号音響信号を得ることが可能となる。

符号化装置の構成を例示したブロック図。復号装置の構成を例示したブロック図。符号化方法の処理の流れの例を示す図。決定部３８０の処理の流れの例を示す図。適合符号化処理判定部３８２の処理の流れの例を示す図。第二実施形態の切替決定部３８３の処理の流れの例を示す図。第三実施形態の適合符号化処理判定部３８２の処理の流れの例を示す図。第一符号化処理及び第二符号化処理の概念図。

［第一実施形態］
以下、本発明の第一実施形態について説明する。第一実施形態は、周波数領域での符号化処理を行う複数の異なる符号化処理の何れかでフレーム毎の入力音響信号に対応する周波数領域の係数列を符号化する構成において、入力音響信号または／および入力音響信号に対応する周波数領域の係数列の高域成分のエネルギーが小さい場合にのみ、符号化処理の切り替えを行う構成である。入力音響信号の高域成分のエネルギーとは、入力音響信号の高域成分のエネルギーの大きさそのものや、入力音響信号に占める高域成分のエネルギーの大きさなどである。

＜符号化装置３００＞
符号化装置３００の構成を図１に示す。符号化装置３００は、周波数領域変換部１１０、決定部３８０、第一符号化部１０１、第二符号化部２０１を備えている。第一符号化部１０１は、例えば、線形予測分析符号化部１２０、スペクトル包絡係数列生成部１３０、包絡正規化部１４０、正規化係数符号化部１５０を備えている。第二符号化部２０１は、例えば、領域分割部２２０、平均対数エネルギー差分可変長符号化部２４０、係数符号化部２５０を備えている。符号化装置３００には、所定の時間区間であるフレーム単位で、時間領域の音声音響ディジタル信号（以下、入力音響信号とする。）が入力され、フレームごとに以下の処理が行われる。以下では、現在の入力音響信号がf番目のフレームであるとして、各部の具体処理を説明する。f番目のフレームの入力音響信号をx_f(n) (n=1, ..., Nt)とする。ここでNtはフレームあたりのサンプル数である。

以下、符号化装置３００の動作について説明する。符号化装置３００により、図３に例示する符号化方法の各ステップの処理が実行される。

＜周波数領域変換部１１０＞
周波数領域変換部１１０は、入力音響信号x_f(n) (n=1, ..., Nt)を周波数領域の係数列、例えば、N点のMDCT係数列X_f(n) (n=1, ..., N)に変換して出力する（ステップＳ１１０）。ただし、Nは、周波数領域でのサンプル数であり、正の整数である。周波数領域への変換は、MDCTではない公知の変換方法により行ってもよい。

また、第一符号化部１０１、第二符号化部２０１、決定部３８０で複数の精度や方法により得られた周波数領域の係数列が必要である場合には、周波数領域変換部１１０で、複数の精度や方法により周波数領域の係数列を得ればよい。例えば、第一符号化部１０１と第二符号化部２０１がMDCT係数列を周波数領域の係数列として用い、決定部３８０がパワースペクトル系列を周波数領域の係数列として用いる場合には、周波数領域変換部１１０が、入力音響信号からMDCT係数列とパワースペクトル系列を求めればよい。また、例えば、第一符号化部１０１と第二符号化部２０１がMDCT係数列を周波数領域の係数列として用い、決定部３８０が周波数帯域ごとのエネルギーの系列を周波数領域の係数列として用いる場合には、周波数領域変換部１１０が、入力音響信号からMDCT係数列と周波数帯域ごとのエネルギーの系列を求めればよい。また、例えば、第一符号化部１０１と第二符号化部２０１がMDCT係数列を周波数領域の係数列として用い、決定部３８０の切替可否判定部３８１が周波数帯域ごとのエネルギーの系列を周波数領域の係数列として用い、決定部３８０の適合符号化処理判定部３８２がパワースペクトル系列を周波数領域の係数列として用いる場合には、周波数領域変換部１１０が、入力音響信号からMDCT係数列と周波数帯域ごとのエネルギーの系列とパワースペクトル系列を求めればよい。

＜決定部３８０＞
決定部３８０は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とする（ステップＳ３８０）。

言い代えれば、決定部３８０は、少なくとも、入力音響信号の高域成分のエネルギーが小さい場合には、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、そうでない場合には前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない判定を行い、その判定結果に従って現フレームの周波数領域の係数列を符号化するように切替制御する。

決定部３８０は、例えば、切替可否判定部３８１、適合符号化処理判定部３８２、切替決定部３８３、切替部３８４を備えている。以下、決定部３８０の一例について説明する。決定部３８０は、図４に例示する各ステップの処理を行う。

＜切替可否判定部３８１＞
切替可否判定部３８１は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、そうでない場合には切り替え不可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない、と判定し、判定結果を出力する（ステップＳ３８１）。

以下、切替可否判定部３８１の動作の例を説明する。まず、入力音響信号の高域成分のエネルギーの大きさとして、MDCT係数列の高域のエネルギーを用いる例を説明する。

切替可否判定部３８１は、まず、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の高域のエネルギーEh_f-1を下記の式(1)により、現フレームのMDCT係数列X_f(n) (n=1, ..., N)の高域のエネルギーEh_fを下記の式(2)により、それぞれ求める（ステップＳ３８１１）。式(1)と式(2)において、MはNより小さい予め定めた正の整数である。

切替可否判定部３８１は、次に、前フレームの高域のエネルギーEh_f-1と現フレームの高域のエネルギーEh_fの少なくとも何れかが予め定めた閾値TH1より小さい場合、すなわち、Eh_f-1<TH1および／またはEh_f<TH1である場合、には切り替え可と判定し、そうでない場合には切り替え不可と判定し、切り替え可否の情報を出力する（ステップＳ３８１２）。

なお、現フレームのステップＳ３８１１で求まる前フレームの高域のエネルギーEh_f-1は、前フレームのステップＳ３８１１で求めた現フレームの高域のエネルギーEh_fと同じである。このため、計算した高域のエネルギーEh_fを少なくとも直後のフレームまで切替可否判定部３８１内に記憶しておけば、前フレームの高域のエネルギーEh_f-1を計算する必要は無い。

次に、入力音響信号の高域成分のエネルギーの大きさとして、MDCT係数列の全エネルギーに対する高域のエネルギーの割合を用いる例を説明する。

切替可否判定部３８１は、まず、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の全エネルギーに対する高域のエネルギーの割合Eh_f-1を下記の式(1A)により、現フレームのMDCT係数列X_f(n) (n=1, ..., N)の全エネルギーに対する高域のエネルギーの割合Eh_fを下記の式(2A)により、それぞれ求める（ステップＳ３８１１）。式(1A)と式(2A)において、Mは予め定めた正の整数である。

切替可否判定部３８１は、次に、前フレームの全エネルギーに対する高域のエネルギーの割合Eh_f-1と現フレームの全エネルギーに対する高域のエネルギーの割合Eh_fの少なくとも何れかが予め定めた閾値TH1より小さい場合、すなわち、Eh_f-1<TH1および／またはEh_f<TH1である場合、には切り替え可と判定し、そうでない場合には切り替え不可と判定し、切り替え可否の情報を出力する（ステップＳ３８１２）。

なお、現フレームのステップＳ３８１１で求まる前フレームの全エネルギーに対する高域のエネルギーの割合Eh_f-1は、前フレームのステップＳ３８１１で求めた現フレームの全エネルギーに対する高域のエネルギーの割合Eh_fと同じである。このため、計算した全エネルギーに対する高域のエネルギーの割合Eh_fを少なくとも直後のフレームまで切替可否判定部３８１内に記憶しておけば、前フレームの全エネルギーに対する高域のエネルギーの割合Eh_f-1を計算する必要は無い。

なお、上述の二つの例では、Eh_f-1<TH1および／またはEh_f<TH1である場合には切り替え可と判定し、そうでない場合には切り替え不可と判定しているが、Eh_f-1<TH1かつEh_f<TH1である場合には切り替え可と判定し、そうでない場合には切り替え不可と判定してもよい。すなわち、前フレームの入力音響信号の高域成分のエネルギーの大きさと現フレームの入力音響信号の高域成分のエネルギーの大きさとの双方が所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、そうでない場合には切り替え不可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない、と判定してもよい。

また、上述の例では、MDCT係数列を用いて高域のエネルギーや全エネルギーに対する高域のエネルギーの割合を求めているが、パワースペクトル系列や周波数帯域ごとのエネルギーの系列を用いて高域のエネルギーや全エネルギーに対する高域のエネルギーの割合を求めてもよい。

＜適合符号化処理判定部３８２＞
適合符号化処理判定部３８２は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れに適しているかを判定し、判定結果を出力する（ステップＳ３８２）。

以下、適合符号化処理判定部３８２の動作の一例を説明する。適合符号化処理判定部３８２は、図５に例示する各ステップの処理を行う。以下の例では、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。

この例では、入力音響信号のスペクトル包絡の起伏が大きいまたは／および集中度が高い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が小さいまたは／および集中度が低い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適していると判定し、判定結果を出力する。

スペクトルの起伏や集中度を推定する方法としては、何れの方法を採用してもよいが、以下の例では、スペクトルまたはその包絡の谷の深さを推定する構成について説明する。この構成では、スペクトルまたはその包絡の谷が浅いときにはスペクトルの起伏が小さく集中度が低いと判定され、スペクトルまたはその包絡の谷が深いときにはスペクトルの起伏が大きく集中度が高いと判定される。スペクトルまたはその包絡の谷が浅いということは、ノイズフロアが高いともいえる。また、スペクトルまたはその包絡の谷が深いということは、ノイズフロアが低いともいえる。

適合符号化処理判定部３８２は、まず、現フレームのMDCT係数列X_f(n) (n=1, ..., N)をPサンプルごとのQ個の部分係数列XS_f(1)(n) (n=1, ..., P), XS_f(2)(n) (n=1, ..., P), ..., XS_f(Q)(n) (n=1, ..., P)に分ける（ステップＳ３８２１）。PおよびQは、P×Q=Nの関係を満たす正の整数である。P=1でもよい。また、ここでは第一符号化部１０１または第二符号化部２０１で符号化処理の対象となる周波数領域の係数列であるMDCT係数列X_f(n) (n=1, ..., N)を適合符号化処理判定部３８２でも用いる構成としているが、MDCT係数列X_f(n) (n=1, ..., N)とは別の精度や方法で周波数領域に変換して得られた周波数領域の係数列、例えば、パワースペクトル系列を適合符号化処理判定部３８２による処理の対象としてもよい。

適合符号化処理判定部３８２は、次に、部分係数列XS_f(1)(n) (n=1, ..., P), XS_f(2)(n) (n=1, ..., P), ..., XS_f(Q)(n) (n=1, ..., P)ごとのパワーの平均値またはその対数値による系列AVE_XS(q) (q=1, …, Q)を求める（ステップＳ３８２２）。パワーの平均値は式(3)により求まるAVE_XS(q)である。また、パワーの平均値の対数値は式(3A)により求まるAVE_XS(q)である。

適合符号化処理判定部３８２は、次に、パワーの平均値またはパワーの平均値の対数値による系列AVE_XS(1), AVE_XS(2) , ..., AVE_XS(Q)の各要素について、隣接する２つの要素のうちのいずれよりも小さいかどうかを判定し、判定された要素数を求める（ステップＳ３８２３）。すなわち、式(4)を満たすqの個数Vallyを求める。

適合符号化処理判定部３８２は、次に、式(4)を満たすqに対応するVally個のAVE_XS(q)の平均値E_V、すなわち、谷の部分領域の平均値E_Vを求める（ステップＳ３８２４）。AVE_XS(q)がパワーの平均値である場合には、ステップＳ３８２４で求まるE_Vは谷の部分における部分領域のパワーの平均値である。AVE_XS(q)がパワーの平均値の対数値である場合には、ステップＳ３８２４で求まるE_Vは部分領域のパワーの平均値の対数値の谷の部分における平均値である。適合符号化処理判定部３８２は、また、すべての部分領域のパワーの平均値またはパワーの平均値の対数値を求める（ステップＳ３８２５）。すべての部分領域のパワーの平均値は、MDCT係数列X_f(n) (n=1, ..., N)のパワーの平均値であり、式(11)により求まるEである。すべての部分領域のパワーの平均値の対数値は、MDCT係数列X_f(n) (n=1, ..., N)のパワーの平均値の対数値であり、式(11A)により求まるEである。

適合符号化処理判定部３８２は、次に、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が所定の閾値TH2以下である場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定する。逆にすべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が閾値TH2より大きい場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理が適合すると判定する。適合符号化処理判定部３８２は、何れの符号化処理が適合するかの情報を出力する（ステップＳ３８２６）。適合する符号化処理の情報は、適合情報ともよぶ。

また、ステップＳ３８２１では、部分係数列ごとに異なるサンプル数としてもよい。例えば、現フレームのMDCT係数列X_f(n) (n=1, ..., N)をQ個の部分係数列XS_f(1)(n) (n=1, ..., P₁), XS_f(2)(n) (n=1, ..., P₂), ..., XS_f(Q)(n) (n=1, ..., P_Q)に分けてもよい。P₁, P₂, ..., P_Qは、P₁+P₂+...+P_Q=Nを満たす正の整数である。また、P₁, P₂, ..., P_Qは、P₁≦P₂≦...≦P_Qを満たすことが好ましい。また、Qは正の整数である。

＜切替決定部３８３＞
切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報と、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報と、から、現フレームの周波数領域の係数列を第一符号化部１０１で符号化するか第二符号化部２０１で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する（ステップＳ３８３）。出力した切替符号は復号装置４００に入力される。ここで、切替決定部３８３は、切り替え不可である場合には、現フレームが適合する符号化処理が何れの符号化処理であったとしても、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切り替え可である場合には、前フレームの符号化処理が何れの符号化処理であったとしても、現フレームが適合する符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。ただし、切り替え可である場合であっても、現フレームが適合する符号化処理ではなく前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化すると決定する場合が含まれていてもよい。

以下、切替決定部３８３の動作の一例を説明する。以下の例では、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。

切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、および／または、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を表す場合、には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を現フレームのMDCT係数列X_f(n) (n=1, ..., N)の符号化処理として決定する。

すなわち、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第一符号化部１０１で符号化すると決定する。また、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第一符号化部１０１の符号化処理を表す場合、にも、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第一符号化部１０１で符号化すると決定する。

また、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第二符号化部２０１で符号化すると決定する。また、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第二符号化部２０１の符号化処理を表す場合、にも、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第二符号化部２０１で符号化すると決定する。

切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表す場合、かつ、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を表す場合、には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を現フレームのMDCT係数列X_f(n) (n=1, ..., N)の符号化処理として決定する。すなわち、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第二符号化部２０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第二符号化部２０１で符号化すると決定する。また、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第一符号化部１０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第一符号化部１０１で符号化すると決定する。

＜切替部３８４＞
切替部３８４は、切替決定部３８３で決定した符号化処理で現フレームのMDCT係数列X_f(n) (n=1, ..., N)が符号化されるように、周波数領域変換部１１０が出力したMDCT係数列X_f(n) (n=1, ..., N)を第一符号化部１０１または第二符号化部２０１に入力するように制御を行う（ステップＳ３８４）。また、現フレームのMDCT係数列X_f(n) (n=1, ..., N)の符号化のために、現フレームの入力音響信号x_f(n) (n=1, ..., Nt)も必要である場合には、現フレームの入力音響信号x_f(n) (n=1, ..., Nt)も第一符号化部１０１または／および第二符号化部２０１に入力する。

例えば、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理である場合には、第一符号化部１０１のみで現フレームの入力音響信号x_f (n) (n=1, ..., Nt)が必要となるため、MDCT係数列X_f(n) (n=1, ..., N)を第一符号化部１０１に入力する場合には現フレームの入力音響信号x_f(n) (n=1, ..., Nt)も第一符号化部１０１に入力する。

＜第一符号化部１０１、第二符号化部２０１＞
第一符号化部１０１と第二符号化部２０１は、共に周波数領域の係数列を符号化する符号化処理を行うものであるが、行う符号化処理は互いに異なる。すなわち、第一符号化部１０１は、第二符号化部２０１とは異なる符号化処理により現フレームの周波数領域の係数列を符号化し、得られた符号である第一符号を出力する（ステップＳ１０１）。また、第二符号化部２０１は、第一符号化部１０１とは異なる符号化処理により現フレームの周波数領域の係数列を符号化し、得られた符号である第二符号を出力する（ステップＳ２０１）。例えば、第一符号化部１０１は線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を行い、第二符号化部２０１は区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理を行う。

以下、第一符号化部１０１と第二符号化部２０１の動作の一例を説明する。以下の例では、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理である。

この例では、第一符号化部１０１による第一符号化処理は、図８の左に例示するように線形予測係数に変換可能な係数で周波数領域のスペクトル包絡形状を表現するものである。一方、第二符号化部２０１による第二符号化処理は、図８の右に例示するようにスケール・ファクタ・バンド（周波数領域係数列の複数の領域への区分）で包絡形状を表現するものである。第二符号化処理によれば、各領域の平均の高さの差分値の可変長符号化を使うため、平均値が滑らかに変化する場合に、非常に効率がよいと言える。

決定部３８０の決定又は選択の結果に基づいて、周波数領域での複数の符号化処理である第一符号化部１０１の処理及び第二符号化部２０１の処理のうちの一方が行われる。

＜第一符号化部１０１＞
第一符号化部１０１は、線形予測分析符号化部１２０、スペクトル包絡係数列生成部１３０、包絡正規化部１４０、正規化係数符号化部１５０を備えている。第一符号化部１０１には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)と入力音響信号x_f(n) (n=1, ..., Nt)が入力され、線形予測係数符号CL_fと正規化係数符号CN_fを含む第一符号が出力される。出力された第一符号は復号装置４００に入力される。なお、第一符号化部１０１は、非特許文献１に記載された符号化処理から入力音響信号を周波数領域の係数列に変換する部分を除いたものである。すなわち、周波数領域変換部１１０と第一符号化部１０１とで行われる符号化処理は、非特許文献１に記載された符号化処理と同様である。

＜線形予測分析符号化部１２０＞
線形予測分析符号化部１２０は、入力音響信号x_f(n) (n=1, ..., Nt)を線形予測分析して線形予測係数に変換可能な係数を求め、線形予測係数に変換可能な係数を符号化して、線形予測係数符号CL_fと、線形予測係数符号CL_fに対応する量子化された線形予測係数に変換可能な係数と、を得て出力する（ステップＳ１２０）。線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数（偏自己相関係数）またはLSPパラメータなどである。

＜スペクトル包絡係数列生成部１３０＞
スペクトル包絡係数列生成部１３０は、線形予測分析符号化部１２０が得た量子化された線形予測係数に変換可能な係数に対応するパワースペクトル包絡係数列W_f(n) (n=1, ..., N)を得て出力する（ステップＳ１３０）。

＜包絡正規化部１４０＞
包絡正規化部１４０は、スペクトル包絡係数列生成部１３０が得たパワースペクトル包絡係数列W_f(n) (n=1, ..., N)を用いて、周波数領域変換部１１０が得たMDCT係数列の各係数X_f(n) (n=1, ..., N)を正規化し、正規化MDCT係数列XN_f(n) (n=1, ..., N)を出力する（ステップＳ１４０）。すなわち、MDCT係数列X_f(n) (n=1, ..., N)の各係数をパワースペクトル包絡係数列W_f(n) (n=1, ..., N)に含まれる対応する係数で除した値による系列を正規化MDCT係数列XN_f(n) (n=1, ..., N)として求める。

＜正規化係数符号化部１５０＞
正規化係数符号化部１５０は、包絡正規化部１４０が得た正規化MDCT係数列XN_f(n) (n=1, ..., N)を符号化して正規化係数符号CN_fを得る（ステップＳ１５０）。

＜第二符号化部２０１＞
また、第二符号化部２０１は、領域分割部２２０、平均対数エネルギー差分可変長符号化部２４０、係数符号化部２５０を備えている。第二符号化部２０１には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)が入力され、平均エネルギー符号ＣＡ_ｆと係数符号CＤ_fを含む第二符号が出力される。出力された第二符号は復号装置４００に入力される。なお、第二符号化部２０１は、非特許文献２に記載された符号化処理から入力音響信号を周波数領域の係数列に変換する部分を除いたものである。すなわち、周波数領域変換部１１０と第二符号化部２０１とで行われる符号化処理は、非特許文献２に記載された符号化処理と同様である。

＜領域分割部２２０＞
領域分割部２２０は、周波数領域変換部１１０が得たMDCT係数列X_f(n) (n=1, ..., N)を低域の部分領域ほどサンプル数が少なく高域の部分領域ほどサンプル数が多い複数の部分領域に分ける（ステップＳ２２０）。部分領域の個数をRとし、各部分領域に含まれるサンプル数をS₁, ..., S_Rとすると、MDCT係数列の各係数X_f(n) (n=1, ..., N)は、最低域のサンプルから順に各部分領域に、XB_f(1)(n) (n=1, ..., S₁), XB_f(2)(n) (n=1, ..., S₂), ..., XB_f(R)(n) (n=1, ..., S_R)と分けられることになる。RおよびS₁, ..., S_Rは正の整数である。S₁, ..., S_Rは、S₁≦S₂≦... ≦S_Rの関係を満たすとする。XB_f(1)(n) (n=1, ..., S₁), XB_f(2)(n) (n=1, ..., S₂), ..., XB_f(R)(n) (n=1, ..., S_R)を部分領域係数列と呼ぶ。

＜平均対数エネルギー差分可変長符号化部２４０＞
平均対数エネルギー差分可変長符号化部２４０は、領域分割部２２０が得た各部分領域について、部分領域に含まれる係数の平均エネルギーを求め、部分領域の平均エネルギーそれぞれについて対数軸で量子化し、隣接する部分領域の平均エネルギーの対数軸での量子化値との差を可変長符号化し、平均エネルギー符号CA_fを得る（ステップＳ２４０）。

平均対数エネルギー差分可変長符号化部２４０は、まず、各部分領域r (r=1, ..., R)の平均エネルギーE_XB(r) (r=1, ..., R)を式(5)により求める（ステップＳ２４０１）。

平均対数エネルギー差分可変長符号化部２４０は、次に、各部分領域について、平均エネルギーE_XB (r) (r=1, ..., R)の対数領域でのスカラ量子化を行い平均エネルギーの対数領域での量子化値Q(log(E_XB (r))) (r=1, ..., R)を得る（ステップＳ２４０２）。平均対数エネルギー差分可変長符号化部２４０は、次に、各部分領域について、平均エネルギーの対数領域での量子化値Q(log(E_XB (r)))と隣接する部分領域に含まれる係数の平均エネルギーの対数領域での量子化値Q(log(E_XB (r-1)))との差DiffE_XB(r)を求める（ステップＳ２４０３）。ただし、r=1の場合は、平均エネルギーE_XB (1)の対数値のスカラ量子化値Q(log(E_XB (r)))そのものをDiffE_XB(1)とする。DiffE_XB(r) (r=1, ..., R)を平均対数エネルギー差分と呼ぶ。すなわち、DiffE_XB(r) (r=1, ..., R)は式(6)により求まる。ただし、Q()を、スカラ量子化関数とし、入力を予め定めた値で正規化（除算）して得られた値の小数部分を四捨五入して得られる整数値を出力する関数とする。

平均対数エネルギー差分可変長符号化部２４０は、次に、平均対数エネルギー差分DiffE_XB(r) (r=1, ..., R)を可変長符号化して平均エネルギー符号CA_fを得る（ステップＳ２４０４）。なお、平均対数エネルギー差分DiffE_XB(r)の絶対値が小さい場合のほうが統計的な出現頻度が高いので、可変長符号は、絶対値が大きい場合よりも符号量が少なくなるように、予め決定されている。すなわち、平均対数エネルギーの領域ごとの変動が小さい場合、すなわちスペクトル包絡の起伏が小さい場合、スペクトル包絡の集中度が低い場合には、平均エネルギー符号CA_fの符号の長さを短くできる傾向がある。

＜係数符号化部２５０＞
係数符号化部２５０は、領域分割部２２０が得た部分領域係数列XB_f(1)(n) (n=1, ..., S₁), XB_f(2)(n) (n=1, ..., S₂), ..., XB_f(R)(n) (n=1, ..., S_R)の各係数を、平均対数エネルギー差分可変長符号化部２４０が得た平均エネルギーの対数領域での量子化値Q(log(E_XB (r)) (r=1, ..., R)を用いて、例えばスカラ量子化して、係数符号CD_fを得る（ステップＳ２５０）。このスカラ量子化に用いる量子化ステップ幅や量子化ビット数は、領域分割部２２０が得た部分領域係数列XB_f(1)(n) (n=1, ..., S₁), XB_f(2)(n) (n=1, ..., S₂), ..., XB_f(R)(n) (n=1, ..., S_R)ごとに平均エネルギーの量子化値Q(E_XB(r)) (r=1, ..., R)から決定する。なお、平均エネルギーの量子化値Q(E_XB(r)) (r=1, ..., R)は、平均エネルギーの対数領域での量子化値Q(log(E_XB (r)) (r=1, ..., R)を式(7)により線形領域の値とすることにより求まる。

係数符号化部２５０は、まず、各領域に対応する平均エネルギーの対数領域での量子化値Q(log(E_XB(r)) (r=1, ..., R)とその値と周波数で推定される聴覚上識別できないスペクトルレベルのエネルギーの対数値の差の値を考慮し、係数符号CD_fの符号量として与えられたビット数を各部分領域係数列の各係数に配分する（ステップＳ２５０１）。

係数符号化部２５０は、次に、各部分領域の平均エネルギーの量子化値Q(E_XB(r)) (r=1, ..., R)と配分されたビット数から、各部分領域係数列の各係数のスカラ量子化のステップ幅を求める（ステップＳ２５０２）。

係数符号化部２５０は、次に、各部分領域係数列の各係数を、決められたステップ幅とビット数で量子化し、さらに量子化された各係数の整数値を可変長符号化して、係数符号CD_fを得る(ステップＳ２５０３）。

＜復号装置４００＞
復号装置４００の構成を図２に示す。復号装置４００は、切替部４８０、第一復号部４０１及び第二復号部５０１を備えている。第一復号部４０１は、例えば、線形予測復号部４２０、スペクトル包絡係数列生成部４３０、正規化係数復号部４５０および包絡逆正規化部４４０を備えている。第二復号部５０１は、例えば、平均対数エネルギー差分可変長復号部５４０及び係数復号部５５０を備えている。復号装置４００には、所定の時間区間であるフレーム単位で、切替符号と入力符号を含む符号が入力される。第一符号化部１０１で符号化されたフレームの場合には入力符号は線形予測係数符号CL_fと正規化係数符号CN_fを含み、第二符号化部２０１で符号化されたフレームの場合には入力符号は平均エネルギー符号CA_fと係数符号CD_fを含む。以下では、現在処理の対象となっているフレームがf番目のフレームであるとして、各部の具体処理を説明する。

以下、復号装置４００の動作について説明する。

＜切替部４８０＞
切替部４８０は、入力された切替符号から、現フレームの入力符号を第一復号部４０１で復号するか第二復号部５０１で復号するかを決定し、決定した復号処理を行えるよう、入力符号を第一復号部４０１または第二復号部５０１に入力するよう制御を行う（ステップＳ４８０）。

具体的には、切替部４８０は、入力された切替符号が、第一符号化部１０１の符号化処理を特定する符号、すなわち、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理を特定する符号である場合には、第一符号化部１０１の符号化処理に対応する復号処理を行う第一復号部４０１に入力符号を入力するよう制御する。また、入力された切替符号が、第二符号化部２０１の符号化処理を特定する符号、すなわち、区分した周波数領域ごとの係数の平均エネルギーを隣接する周波数領域の平均エネルギーとの差分の可変長符号化を伴う符号化処理を特定する符号である場合には、第二符号化部２０１の符号化処理に対応する復号処理を行う第二復号部５０１に入力符号を入力するよう制御する。

＜第一復号部４０１＞
第一復号部４０１は、線形予測復号部４２０、スペクトル包絡係数列生成部４３０、正規化係数復号部４５０、包絡逆正規化部４４０を備えている。第一復号部４０１には、現フレームの線形予測係数符号CL_fと正規化係数符号CN_fが入力され、周波数領域の係数列X_f(n) (n=1, ..., N)が出力される。

＜線形予測復号部４２０＞
線形予測復号部４２０は、入力符号に含まれる線形予測係数符号CL_fを復号して復号された線形予測係数に変換可能な係数を得る。復号された線形予測係数に変換可能な係数は、符号化装置３００の線形予測分析符号化部１２０が得た量子化された線形予測係数に変換可能な係数と同じものである。また、線形予測復号部４２０が行う復号処理は、符号化装置３００の線形予測分析符号化部１２０は行う符号化処理と対応するものである。なお、線形予測係数に変換可能な係数とは、線形予測係数そのもの、PARCOR係数（偏自己相関係数）またはLSPパラメータなどである。

＜スペクトル包絡係数列生成部４３０＞
スペクトル包絡係数列生成部４３０は、線形予測復号部４２０が得た復号された線形予測係数に変換可能な係数に対応するパワースペクトル包絡係数列W_f(n) (n=1, ..., N)を得て出力する。ただし、Nは、周波数領域でのサンプル数であり、正の整数である。

＜正規化係数復号部４５０＞
正規化係数復号部４５０は、入力された正規化係数符号CN_fを復号して復号正規化MDCT係数列^XN_f(n) (n=1, ..., N)を得る（ステップＳ４５０）。ここで、正規化係数復号部４５０が行う復号処理は、符号化装置３００の正規化係数符号化部１５０が行う符号化処理と対応するものである。すなわち、符号化装置３００でMDCTではない周波数領域への変換処理が行われた場合には、^XN_f(n) (n=1, ..., N)は、符号化装置３００の周波数領域への変換処理に対応するMDCTではない領域の周波数領域の係数列である。なお、復号正規化MDCT係数列^XN_f(n) (n=1, ..., N)は、符号化装置３００の正規化係数符号化部１５０に入力された正規化MDCT係数列XN_f(n) (n=1, ..., N)に対応するものであるが、それぞれの係数には量子化誤差が含まれるため、XN_f(n) に"^"を付した^XN_f(n)としてある。

＜包絡逆正規化部４４０＞
包絡逆正規化部４４０は、スペクトル包絡係数列生成部４３０が得たパワースペクトル包絡係数列W_f(n) (n=1, ..., N)を用いて、正規化係数復号部４５０が得た復号正規化MDCT係数列の各係数^XN_f(n) (n=1, ..., N)を逆正規化し、復号MDCT係数列^XN_f(n) (n=1, ..., N)を出力する（ステップＳ４４０）。すなわち、復号正規化MDCT係数列XN_f(n) (n=1, ..., N)の各係数とパワースペクトル包絡係数列W_f(n) (n=1, ..., N) の各係数とを対応する係数同士を乗算して得られる値による系列を復号MDCT係数列^X_f(n) (n=1, ..., N)として求める。

＜第二復号部５０１＞
第二復号部５０１は、平均対数エネルギー差分可変長復号部５４０、係数復号部５５０を備えている。第二復号部５０１には、現フレームの平均エネルギー符号CA_fと係数符号CD_fが入力され、周波数領域の係数列X_f(n) (n=1, ..., N) が出力される。

＜平均対数エネルギー差分可変長復号部５４０＞
平均対数エネルギー差分可変長復号部５４０は、入力された平均エネルギー符号CA_fを復号して部分領域の復号平均エネルギーQ(E_XB(r)) (r=1, ..., R)を得る（ステップＳ５４０）。なお、復号平均エネルギーは、符号化装置３００の係数符号化部２５０で得られる平均エネルギーの量子化値と同じものであるので、同じ記号Q(E_XB(r))を用いている。

平均対数エネルギー差分可変長復号部５４０は、まず、平均エネルギー符号CA_fを復号して各部分領域の対数領域でのエネルギーの差DiffE_XB(r) (r=1, ..., R)を得る（ステップＳ５４０１）。ここで、平均対数エネルギー差分可変長復号部５４０が行う復号処理は、符号化装置３００の平均対数エネルギー差分可変長符号化部２４０は行う符号化処理と対応するものである。なお、各部分領域の対数領域でのエネルギーの差は、符号化装置３００の平均対数エネルギー差分可変長符号化部２４０で得られる各部分領域の対数領域でのエネルギーの差と同じものであるので、同じ記号DiffE_XB(r)を用いている。

平均対数エネルギー差分可変長復号部５４０は、次に、部分領域ごとに、対数領域でのエネルギーの差DiffE_XB(r) (r=1, ..., R)を隣接する部分領域の平均エネルギーの対数領域での復号値Q(log(E_XB (r-1)))に加算して平均エネルギーの対数領域での復号値Q(log(E_XB (r))を得る（ステップＳ５４０２）。なお、平均エネルギーの対数領域での復号値は、符号化装置３００の平均対数エネルギー差分可変長符号化部２４０で得られる平均エネルギーの対数領域での量子化値と同じものであるので、同じ記号Q(log(E_XB (r))を用いている。

平均対数エネルギー差分可変長復号部５４０は、次に、平均エネルギーの対数領域での復号値Q(log(E_XB(r-1))) (r=1, ..., R)を線形領域の値としたものを復号平均エネルギーQ(E_XB(r)) (r=1, ..., R)として得る（ステップＳ５４０３）。

＜係数復号部５５０＞
係数復号部５５０は、平均対数エネルギー差分可変長復号部５４０で得られた復号平均エネルギーQ(E_XB(r)) (r=1, ..., R)を用いて、係数符号CD_fを復号して復号係数列^X_f (n) (n=1, ..., N)を得る(ステップＳ５５０）。ここで、係数復号部５５０が行う復号処理は、符号化装置３００の係数符号化部２５０が行う符号化処理と対応するものである。入力された係数符号CD_fは、符号化装置３００の係数符号化部２５０で各部分領域係数列の各係数を可変長符号化して得られたものであるので、係数符号CD_fのうちの各係数に対応する符号部分の符号長は自動的に復元できる。また、平均対数エネルギー差分可変長復号部５４０で得られた復号平均エネルギーQ(E_XB(r))から各領域の量子化ステップ幅が求まる。これらにより、係数符号CD_fから周波数領域の復号MDCT係数列^X_f(n) (n=1, ..., N)を得ることができる。

＜時間領域変換部４１０＞
時間領域変換部４１０は、N点の復号MDCT係数列^X_f(n) (n=1, ..., N)を時間領域に変換して復号音響信号^x_f(n) (n=1, ..., Nt)を得て出力する（ステップＳ４１０）。ただし、Ntは、時間領域でのサンプル数であり、正の整数である。符号化装置３００の周波数領域変換部１１０でMDCTではない周波数領域への変換が行われた場合には、その変換処理に対応する時間領域への変換処理を行えばよい。

第一実施形態によれば、入力音響信号の高域のエネルギーが小さい場合にのみ符号化処理及び復号処理の切り替えを行うことができるため、高域成分の量子化特性が異なる複数の符号化処理及び復号処理が実装されている場合であっても、受聴者が不自然に感じることの少ない復号音響信号を得ることが可能となる。

第一実施形態によれば、また、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理とのうち入力音響信号に適した符号化処理とを、実際に符号化してみることなく選択することができるため、少ない演算処理量で入力音響信号に適した符号化処理を行うことが可能となる。

第一実施形態によれば、さらに、線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と区分した周波数領域ごとの係数の平均エネルギーを用いた符号化処理とのうちから符号化処理とを選択して符号化できるため、入力音響信号のスペクトルの起伏が大きい場合や集中度が高い場合であってもそうでない場合であっても、入力音響信号の特性によらずに効率の良い符号化処理を行うことが可能となる。

［第二実施形態］
第一実施形態では、入力音響信号の高域成分のエネルギーの大きさが大きい場合には必ず前フレームの符号化処理と同じ符号化処理で現フレームの周波数領域の係数列を符号化していたが、第二実施形態は、入力音響信号の高域成分のエネルギーの大きさが大きい場合であっても、入力音響信号の高域成分が疎である状態次第では、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すものである。

第二実施形態の符号化装置は、入力音響信号の高域成分のエネルギーが小さい場合には、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とし、そうでない場合には、入力音響信号の高域成分が疎である状態に従って、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能とするか、前フレームと同じ符号化処理を現フレームの符号化処理として決定するか、を決定するものである。

第二実施形態の符号化装置の構成は、第一実施形態と同じ図１である。第二実施形態の符号化装置３００は、決定部３８０内の切替可否判定部３８１と切替決定部３８３の処理が異なる部分以外は、第一実施形態の符号化装置３００と同じである。第二実施形態の復号装置の構成は、第一実施形態と同じ図２であり、各部の処理も第一実施形態の復号装置と同じである。以下では、第一実施形態の符号化装置３００と異なる処理を行う決定部３８０内の切替可否判定部３８１と切替決定部３８３について説明する。

＜切替可否判定部３８１＞
切替可否判定部３８１は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値より小さい場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、判定結果を出力する（ステップＳ３８１）。上記以外の場合には、切り替え可であるとも切り替え不可とも判定せず、何れとも判定しなかったことを表す情報を判定結果として出力するか、判定結果を出力しない。入力音響信号の高域成分のエネルギーの大きさとしては、高域のエネルギーを用いてもよいし、全エネルギーに対する高域のエネルギーの割合を用いてもよいのは第一実施形態と同様である。

＜切替決定部３８３＞
切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報と、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報と、入力音響信号から求まる入力音響信号の高域成分が疎であるか否かの状態とから、現フレームの周波数領域の係数列を第一符号化部１０１で符号化するか第二符号化部２０１で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する（ステップＳ３８３Ｂ）。出力した切替符号は復号装置４００に入力される。

切替可否判定部３８１が得た切り替え可否の情報が切り替え可である場合には、すなわち、入力音響信号の高域成分のエネルギーが小さい場合には、切替決定部３８３は第一実施形態の切替決定部３８３と同じ処理を行う。切替可否判定部３８１が得た切り替え可否の情報が何れとも判定しなかったことを表す場合、または、切替可否判定部３８１に判定結果が入力されなかった場合、すなわち、入力音響信号の高域成分のエネルギーが大きい場合には、入力音響信号から求まる入力音響信号の高域成分が疎であるか否かの状態に基づいて、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すか否かを決定する。

以下、切替決定部３８３の動作のうち第一実施形態の切替決定部３８３と異なる部分、すなわち、入力音響信号の高域成分のエネルギーが大きい場合の切替決定部３８３の動作の一例を説明する。以下の例では、第一実施形態と同様に、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。切替決定部３８３は、例えば図６のステップＳ３８３１ＢからＳ３８３６Ｂの処理を行う。

切替決定部３８３は、まず、現フレームのMDCT係数列X_f(n) (n=1, ..., N)をPサンプルごとのQ個の部分係数列XS_f(1)(n) (n=1, ..., P), XS_f(2)(n) (n=1, ..., P), ..., XS_f(Q)(n) (n=1, ..., P)に分ける（ステップＳ３８３１Ｂ）。PおよびQは、P×Q=Nの関係を満たす正の整数である。P=1でもよい。また、ここでは第一符号化部１０１または第二符号化部２０１で符号化処理の対象となる周波数領域の係数列であるMDCT係数列X_f(n) (n=1, ..., N)を切替決定部３８３でも用いる構成としているが、MDCT係数列X_f(n) (n=1, ..., N)とは別の精度や方法で周波数領域に変換して得られた周波数領域の係数列、例えば、パワースペクトル系列を切替決定部３８３による処理の対象としてもよい。

切替決定部３８３は、次に、部分係数列XS_f(1)(n) (n=1, ..., P), XS_f(2)(n) (n=1, ..., P), ..., XS_f(Q)(n) (n=1, ..., P)ごとのパワーの平均値の対数値による系列AVE_XS(q) (q=1, …, Q)を求める（ステップＳ３８３２Ｂ）。部分係数列ごとのパワーの平均値の対数値は式(3A)により求まるAVE_XS(q)である。

切替決定部３８３は、また、MDCT係数列X_f(n) (n=1, ..., N)のパワーの平均値の対数値を求める（ステップＳ３８３３Ｂ）。MDCT係数列のパワーの平均値の対数値は式(9)により求まるAVE_Totalである。

切替決定部３８３は、次に、qがあらかじめ設定したQ_Low（ただし、1<Q_Low）からQ_High（ただし、Q_Low≦Q_High≦Q）の範囲内、すなわち、予め定めた高域側にある１つまたは複数の部分領域の範囲内、で式(10)を満たすAVE_XS(q)の個数、すなわちピークの領域の個数を求める（ステップＳ３８３４Ｂ）。μおよびλは正の定数である。

切替決定部３８３は、次に、ピークの領域の個数が閾値TH3以下である場合には、現フレームの入力音響信号の高域成分が疎であると判定し、ピークの領域の個数が閾値TH3を超える場合には、現フレームの入力音響信号の高域成分が疎でないと判定する（ステップＳ３８３５Ｂ）。ここで、閾値TH3は、現フレームに近い過去のフレームの入力音響信号の高域成分が疎である場合には現フレームに近い過去のフレームの入力音響信号の高域成分が疎でない場合よりも大きな値となるように予め定められた規則により決定される値である。例えば、現フレームに近い過去のフレームの入力音響信号の高域成分が疎である場合には予め定めたTH3_1を閾値TH3とし、現フレームに近い過去のフレームの入力音響信号の高域成分が疎でない場合はTH3_1より小さい値である予め定めたTH3_2を閾値TH3とする。ここで、現フレームに近い過去のフレームとは、例えば前フレームや２つ前のフレームなどである。現フレームの入力音響信号の高域成分が疎であるか否かの判定結果は少なくとも２フレーム後まで切替決定部３８３内に記憶される。

切替決定部３８３は、次に、前フレームの符号化処理と、現フレーム及び現フレームに近い過去のフレームについての入力音響信号の高域成分が疎であるか否かの判定結果と、に基づいて、現フレームの周波数領域の係数列を第一符号化部１０１と第二符号化部２０１の何れで符号化するかを決定する（ステップＳ３８３６Ｂ）。すなわち、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許すか否かを決定する。

例えば、切替決定部３８３は、前のフレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合については、現フレームの高域成分が疎でなく、かつ、前フレームと２つ前のフレームの少なくとも何れかで高域成分が疎である場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)を第二符号化部２０１で符号化することを決定可能とし、それ以外の場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)を第一符号化部１０１で符号化することを決定する。すなわち、切替決定部３８３は、前のフレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合については、現フレームの高域成分が疎でなく、かつ、前フレームと２つ前のフレームの少なくとも何れかで高域成分が疎である場合には、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、それ以外の場合には前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない。

また、切替決定部３８３は、前のフレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合については、(1)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でない場合、または、(2)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でありかつ２つ前のフレームの高域成分が疎でない場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)を第一符号化部１０１で符号化することを決定可能とし、それ以外の場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)を第二符号化部２０１で符号化することを決定する。すなわち、切替決定部３８３は、前のフレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合については、(1)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でない場合、または、(2)現フレームの高域成分が疎でありかつ前フレームの高域成分が疎でありかつ２つ前のフレームの高域成分が疎でない場合、には、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許し、それ以外の場合には前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許さない。

なお、切替決定部３８３は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報に基づいて現フレームの周波数領域の係数列の符号化処理を決定する。例えば、切替決定部３８３は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であっても、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第一符号化部１０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第一符号化部１０１で符号化すると決定する。また、切替決定部３８３は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であっても、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報が第二符号化部２０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第二符号化部２０１で符号化すると決定する。

なお、切替決定部３８３は、前フレームの符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを許した場合であっても、符号化装置３００に図示しない手段が得た他の情報によって前フレームの符号化処理と同じ符号化処理で現フレームの周波数領域の係数列を符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームの符号化処理と同じ符号化処理で符号化してもよい。

また、ステップＳ３８３１Ｂでは、部分係数列ごとに異なるサンプル数としてもよい。例えば、現フレームのMDCT係数列X_f(n) (n=1, ..., N)をQ個の部分係数列XS_f(1)(n) (n=1, ..., P₁), XS_f(2)(n) (n=1, ..., P₂), ..., XS_f(Q)(n) (n=1, ..., P_Q)に分けてもよい。P₁, P₂, ..., P_Qは、P₁+P₂+...+P_Q=Nを満たす正の整数である。また、P₁, P₂, ..., P_Qは、P₁≦P₂≦...≦P_Qを満たすことが好ましい。また、Qは正の整数である。

また、ステップＳ３８３１ＢやステップＳ３８３２ＢやステップＳ３８３３Ｂの処理と同じ処理を適合符号化処理判定部３８２が行った場合には、切替決定部３８３は、ステップＳ３８３１ＢやステップＳ３８３２ＢやステップＳ３８３３Ｂは行わずに、適合符号化処理判定部３８２が行った処理結果を用いてもよい。

［第三実施形態］
第一実施形態及び第二実施形態では１つの閾値を用いて現フレームが適している符号化処理を判定していたが、第三実施形態は２つの閾値を用いた判定を行うものである。

第三実施形態の符号化装置の構成は、第一実施形態と同じ図１である。第三実施形態の符号化装置３００は、決定部３８０内の適合符号化処理判定部３８２と切替決定部３８３の処理が異なる部分以外は、第一実施形態または第二実施形態の符号化装置３００と同じである。第三実施形態の復号装置の構成は、第一実施形態と同じ図２であり、各部の処理も第一実施形態の復号装置と同じである。以下では、第一実施形態の符号化装置３００と異なる処理を行う決定部３８０内の適合符号化処理判定部３８２と切替決定部３８３について説明する。

＜適合符号化処理判定部３８２＞
適合符号化処理判定部３８２は、図７に例示する各ステップの処理を行う。適合符号化処理判定部３８２は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れに適しているか、言い換えれば、何れの符号化処理を行ってもよいものであるか、を判定し、判定結果を出力する（ステップＳ３８２Ａ）。

以下、適合符号化処理判定部３８２の動作の一例を説明する。適合符号化処理判定部３８２は、図７に例示する各ステップの処理を行う。以下の例では、第一符号化部１０１の符号化処理が非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理であり、第二符号化部２０１の符号化処理が非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理である。

この例では、適合符号化処理判定部３８２は、入力音響信号のスペクトル包絡の起伏が大きいまたは／および集中度が高い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が小さいまたは／および集中度が低い場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適していると判定し、入力音響信号のスペクトル包絡の起伏が中程度または／および集中度が中程度である場合には、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理を行ってもよいものである、すなわち、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合する、と判定し、判定結果を出力する。

入力音響信号のスペクトル包絡の起伏が中程度または／および集中度が中程度である場合には、後述するように、切替決定部３８３で前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。すなわち、切替決定部３８３では、前フレームと現フレームとの間で符号化処理が切り替わることにより受聴者が不自然に感じることの少ないように現フレームの符号化処理が決定される。したがって、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理を行ってもよいものである場合や、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合する場合に限らず、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理が適しているともいい難い場合や、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適していない可能性がある場合が、入力音響信号のスペクトル包絡の起伏が中程度または／および集中度が中程度である場合に含まれていてもよい。すなわち、上述した「第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合する」との判定を、「第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理への適性も判別できない」との判定と読み替えてもよい。

スペクトルの起伏や集中度を推定する方法としては、何れの方法を採用してもよいが、スペクトル包絡の谷の深さを推定する構成について説明する。この構成では、スペクトル包絡の谷が浅いときにはスペクトルの起伏が小さく集中度が低いと判定され、スペクトル包絡の谷が深いときにはスペクトルの起伏が大きく集中度が高いと判定され、スペクトル包絡の谷の深さが中程度のときにはスペクトルの起伏が中程度であり集中度が中程度であると判定される。

適合符号化処理判定部３８２は、第一実施形態の適合符号化処理判定部３８２と同じステップＳ３８２１からＳ３８２５、と、第一実施形態の適合符号化処理判定部３８２とは異なるステップＳ３８２６Ａを行う。以下では、第一実施形態の適合符号化処理判定部３８２と異なる部分について説明する。

適合符号化処理判定部３８２は、ステップＳ３８２５の次に、閾値TH2_1,TH2_2を用いた以下の判定処理及び後述する適合情報の出力を行う（ステップＳ３８２６Ａ）。

適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が所定の閾値TH2_1より小さい場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定する。

また、適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が、閾値TH2_1より大きな値である所定の閾値TH2_2より大きい場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理が適合すると判定する。

また、適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が閾値TH2_1以上閾値TH2_2以下である場合には、スペクトルの谷の深さが中程度であり、スペクトル包絡の起伏が中程度か集中度が中程度のスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理を行ってもよいものである。すなわち、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合する、と判定する。

その後、適合符号化処理判定部３８２は、適合する符号化処理の情報である適合情報を出力する。適合情報とは、適合符号化処理判定部３８２の判定結果のことであり、何れのまたは双方の符号化処理が適合するかの情報とも言える。

なお、適合符号化処理判定部３８２は、現フレームの入力音響信号に対応する周波数領域の係数列が、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れかに適していると判定された場合にのみ第一符号化部１０１の符号化処理に適していることを表す情報または第二符号化部２０１の符号化処理に適していることを表す情報を出力し、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理を行ってもよいものである、すなわち、第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合する、と判定された場合には、判定結果を出力しない構成としてもよい。

＜切替決定部３８３＞
切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報と、適合符号化処理判定部３８２が得た何れのまたは双方の符号化処理が適合するかの情報すなわち適合する符号化処理の情報（適合情報）と、から、現フレームの周波数領域の係数列を第一符号化部１０１で符号化するか第二符号化部２０１で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する（ステップＳ３８３Ａ）。出力した切替符号は復号装置４００に入力される。ここで、切替決定部３８３は、切り替え不可である場合には、現フレームが適合する符号化処理が何れの符号化処理であったとしても、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切替決定部３８３は、切り替え可であり、かつ、現フレームが第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合する場合には、前フレームと同じ符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。また、切替決定部３８３は、切り替え可であり、かつ、現フレームが第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れか一方に適合する場合には、前フレームの符号化処理が何れの符号化処理であったとしても、現フレームが適合する符号化処理で現フレームの周波数領域の係数列を符号化することを決定する。

切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、および／または、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を表す場合または第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合することを表す場合、には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と同じ符号化処理を現フレームのMDCT係数列X_f(n) (n=1, ..., N)の符号化処理として決定する。

すなわち、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第一符号化部１０１で符号化すると決定する。また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第一符号化部１０１の符号化処理を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第一符号化部１０１で符号化すると決定する。また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合することを表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第一符号化部１０１で符号化すると決定する。

また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え不可を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第二符号化部２０１で符号化すると決定する。また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第二符号化部２０１の符号化処理を表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第二符号化部２０１で符号化すると決定する。また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合することを表す場合、には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)も第二符号化部２０１で符号化すると決定する。

切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表す場合、かつ、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を表す場合、には、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)の符号化処理と異なる符号化処理を現フレームのMDCT係数列X_f(n) (n=1, ..., N)の符号化処理として決定する。すなわち、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第一符号化部１０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第二符号化部２０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第二符号化部２０１で符号化すると決定する。また、切替決定部３８３は、前フレームのMDCT係数列X_f-1(n) (n=1, ..., N)が第二符号化部２０１で符号化された場合であって、切替可否判定部３８１が得た切り替え可否の情報が切り替え可を表し、適合符号化処理判定部３８２が得た何れの符号化処理が適合するかの情報（適合情報）が第一符号化部１０１の符号化処理を表す場合には、現フレームのMDCT係数列X_f(n) (n=1, ..., N)は第一符号化部１０１で符号化すると決定する。

なお、適合符号化処理判定部３８２を、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理にも適合すると判定された場合に判定結果を出力しない構成とした場合には、切替決定部３８３は、適合する符号化処理の情報が入力されなかった場合に、上述した何れの符号化処理が適合するかの情報（適合情報）が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合することを表す場合の処理を行えばよい。

［第一変形例］
現フレームの入力音響信号が、非特許文献１に例示される線形予測係数に変換可能な係数に基づくスペクトル包絡を用いた符号化処理と、非特許文献２に例示される区分した周波数領域ごとの係数の平均エネルギーの対数値の隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴う符号化処理と、の何れの符号化処理が適合するかの判定には、入力音響信号のスペクトル包絡の起伏の大きさや集中度だけではなく、その他の情報を含めた判定を行ってもよい。

例えば、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１により符号化され、切替可否判定部３８１が切り替え可と判定し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定した場合であっても、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化してもよい。すなわち、符号化装置３００は、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１により符号化され、切替可否判定部３８１が切り替え可と判定し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化することを決定可能とする構成であればよい。

また、逆に、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１により符号化され、切替可否判定部３８１が切り替え可と判定し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適合すると判定した場合であっても、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化してもよい。すなわち、符号化装置３００は、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１により符号化され、切替可否判定部３８１が切り替え可と判定し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化することを決定可能とする構成であればよい。

また、例えば、第三実施形態の符号化装置３００では、前フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１により符号化され、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合であっても、切替可否判定部３８１が切り替え可と判定し、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化してもよい。

また、逆に、前フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１により符号化され、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合であっても、切替可否判定部３８１が切り替え可と判定し、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化してもよい。

すなわち、第三実施形態の符号化装置３００は、切替可否判定部３８１が切り替え可と判定し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームと同じ符号化処理で符号化することを決定可能とする構成であればよい。

［第二変形例］
現フレームの周波数領域の係数列を第一符号化部１０１で符号化するか第二符号化部２０１で符号化するかの決定には、切替可否判定部３８１が得た切り替え可否の情報を用いないでもよい。この場合は、決定部３８０内に切替可否判定部３８１を備えなくてもよい。

この場合は、切替決定部３８３は、切替可否判定部３８１が得た切り替え可否の情報を用いずに、適合符号化処理判定部３８２が得た適合情報から、現フレームの周波数領域の係数列を第一符号化部１０１で符号化するか第二符号化部２０１で符号化するかを決定し、決定した符号化処理を特定可能な符号である切替符号を出力する。

例えば、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適合すると判定した場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化し、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定した場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化すればよい。

この場合も、第一変形例と同様に、その他の情報を含めた判定を行ってもよい。
例えば、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適合すると判定した場合であっても、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化してもよい。

逆に、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定した場合であっても、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化してもよい。

すなわち、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１の符号化処理で符号化することを決定可能とする構成であればよい。また、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１の符号化処理で符号化することを決定可能とする構成であればよい。

また、例えば、第三実施形態の符号化装置３００では、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合のうち、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第一符号化部１０１により符号化してもよい。

また、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合のうち、符号化装置３００に図示しない手段が得た他の情報によって現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１の符号化処理で符号化すべきと判定された場合には、現フレームの入力音響信号に対応する周波数領域の係数列を第二符号化部２０１により符号化してもよい。

すなわち、第三実施形態の符号化装置３００は、適合符号化処理判定部３８２が現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理も適合すると判定した場合に、現フレームの入力音響信号に対応する周波数領域の係数列を前フレームと同じ符号化処理で符号化することを決定可能とする構成であればよい。

なお、上記の各実施形態における、算出した値と閾値との比較においては、算出した値と閾値と同じ値である場合には、閾値を境として隣接する二つの場合の何れか一方に場合分けされるように設定すればよい。すなわち、ある閾値以上の場合としているところを当該閾値より大きい場合とするとともに、当該閾値より小さい場合としているところを当該閾値以下の場合としてもよい。また、ある閾値より大きい場合としているところを当該閾値以上の場合とするとともに、当該閾値以下の場合としているところを当該閾値より小さい場合としてもよい。

例えば、第一実施形態において、決定部３８０は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合に、前フレームと異なる符号化処理を現フレームの符号化処理として決定することを可能としてもよい（ステップＳ３８０）。

また、第二実施形態において、切替可否判定部３８１は、前フレームの入力音響信号の高域成分のエネルギーの大きさと、現フレームの入力音響信号の高域成分のエネルギーの大きさとの少なくとも何れかが所定の閾値以下の場合には、切り替え可、すなわち、前フレームの周波数領域の係数列を符号化した符号化処理と異なる符号化処理で現フレームの周波数領域の係数列を符号化することを可能とする、と判定し、判定結果を出力してもよい。

また、第一実施形態において、適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が所定の閾値TH2より小さい場合には、スペクトルの谷が浅く、スペクトル包絡の起伏の少ないか集中度が低いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第二符号化部２０１の符号化処理に適合すると判定してもよい。逆にすべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が閾値TH2以上である場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理が適合すると判定してもよい。

また、第三実施形態において、適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が、閾値TH2_1より大きな値である所定の閾値TH2_2以上である場合には、スペクトルの谷が深く、スペクトル包絡の起伏が大きいか集中度が高いスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理が適合すると判定してもよい。この場合、適合符号化処理判定部３８２は、すべての部分領域のAVE_XS(q)の平均値Eと谷の部分領域のAVE_XS(q)の平均値E_Vの差が閾値TH2_1以上であり閾値TH2_2より小さい場合には、スペクトルの谷の深さが中程度であり、スペクトル包絡の起伏が中程度か集中度が中程度のスペクトルであると推定されることから、現フレームの入力音響信号に対応する周波数領域の係数列が第一符号化部１０１の符号化処理と第二符号化部２０１の符号化処理の何れの符号化処理を行ってもよいとする。

符号化装置及び符号化方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。

また、符号化方法における各ステップをコンピュータによって実現する場合、符号化方法が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各ステップがコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims

入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、
前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、
前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、
現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の閾値より大きい場合には、現フレームを第一符号化ステップで符号化することを決定可能とし、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記閾値以下の場合には、現フレームを第二符号化ステップで符号化することを決定可能とする決定ステップと
を含むことを特徴とする符号化方法。
入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化方法であって、
前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化ステップと、
前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化ステップと、
現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の第一の閾値より大きい場合には、現フレームを第一符号化ステップで符号化することを決定可能とし、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記第一の閾値より小さい所定の第二の閾値以下の場合には、現フレームを第二符号化ステップで符号化することを決定可能とする決定ステップと
を含むことを特徴とする符号化方法。
前記決定ステップは、更に、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記第一の閾値以下でありかつ前記第二の閾値より大きい場合には、前フレームと同じ符号化処理を現フレームの符号化処理として決定可能とする
ことを特徴とする請求項２に記載の符号化方法。
入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化装置であって、
前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化部と、
前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化部と、
現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の閾値より大きい場合には、現フレームを第一符号化部で符号化することを決定可能とし、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記閾値以下の場合には、現フレームを第二符号化部で符号化することを決定可能とする決定部と
を含むことを特徴とする符号化装置。
入力音響信号を、所定時間区間のフレームごとに、周波数領域での複数の符号化処理のうちの決定された符号化処理で符号化する符号化装置であって、
前記入力音響信号に対応する線形予測係数に変換可能な係数に基づくスペクトル包絡を用いて、前記入力音響信号に対応する周波数領域の係数列を符号化する第一符号化部と、
前記入力音響信号に対応する周波数領域の係数列について、区分した周波数領域ごとの係数の平均エネルギーの対数値を隣接する周波数領域の平均エネルギーの対数値との差分の可変長符号化を伴って符号化する第二符号化部と、
現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が所定の第一の閾値より大きい場合には、現フレームを第一符号化部で符号化することを決定可能とし、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記第一の閾値より小さい所定の第二の閾値以下の場合には、現フレームを第二符号化部で符号化することを決定可能とする決定部と
を含むことを特徴とする符号化装置。
前記決定部は、更に、現フレームの前記入力音響信号のスペクトルの起伏の大きさまたは集中度の高さを示す指標が前記第一の閾値以下でありかつ前記第二の閾値より大きい場合には、前フレームと同じ符号化処理を現フレームの符号化処理として決定可能とする
ことを特徴とする請求項５に記載の符号化装置。
請求項１から３の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラム。
請求項１から３の何れかの符号化方法の各ステップをコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。