JP2013044922A

JP2013044922A - 符号化装置および方法、並びにプログラム

Info

Publication number: JP2013044922A
Application number: JP2011182449A
Authority: JP
Inventors: Yuki Yamamoto; 優樹山本; Toru Chinen; 徹知念
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2011-08-24
Filing date: 2011-08-24
Publication date: 2013-03-04
Anticipated expiration: 2031-08-24
Also published as: CN103765510B; MX2014001871A; RU2586011C2; EP2750131A1; AU2012297804A1; BR112014003672A2; KR20140050050A; JP6037156B2; CN103765510A; ZA201401181B; US9842603B2; US20140200899A1; AU2012297804B2; RU2014105814A; EP2750131A4; WO2013027630A1; CA2840788A1

Abstract

【課題】より少ない符号量で高音質な音声を得ることができるようにする。
【解決手段】区間数決定特徴量算出回路は、入力信号を構成する複数のサブバンドのサブバンド信号に基づいて、処理対象区間を、同じ推定係数が選択されるフレームからなる連続フレーム区間に分割する分割数を定めるための区間数決定特徴量を算出する。擬似高域サブバンドパワー差分算出回路は、区間数決定特徴量に基づいて処理対象区間内の連続フレーム区間数を決定するとともに、各連続フレーム区間について、入力信号の高域成分を推定により求めるための推定係数を選択し、それらの推定係数を得るための係数インデックスを含むデータを生成する。高域符号化回路は、得られたデータを符号化し、高域符号化データを生成する。本技術は、符号化装置に適用することができる。
【選択図】図４

Description

本技術は符号化装置および方法、並びにプログラムに関し、特に、より少ない符号量で高音質な音声を得ることができるようにした符号化装置および方法、並びにプログラムに関する。

従来、音声信号の符号化手法として、HE-AAC（High Efficiency MPEG（Moving Picture Experts Group）4 AAC（Advanced Audio Coding））（国際標準規格ISO／IEC14496-3）や、AAC（MPEG2 AAC）（国際標準規格ISO／IEC13818-7）などが知られている。

例えば音声信号の符号化手法として、低域成分を符号化して得られた低域符号化情報と、低域成分および高域成分から生成された、高域成分の推定値を得るための高域符号化情報とを符号化で得られた符号として出力する手法が提案されている（例えば、特許文献１参照）。この手法では、高域符号化情報には、高域の周波数成分を得るためのスケールファクタ、振幅調整係数、スペクトル残差など、高域成分の推定値を算出するのに必要となる情報が含まれている。

また、復号の際には低域符号化情報を復号して得られる低域成分と、高域符号化情報を復号して得られる情報とに基づいて高域成分が推定され、推定により得られた高域成分と、復号で得られた低域成分とが合成されて復号で得られた音声信号とされる。

このような符号化手法では、高域成分の推定値を得るための情報だけを高域の信号成分に関する情報として符号化するので、音質の劣化を抑えつつ、符号化効率を向上させることができる。

国際公開第ＷＯ２００６／０４９２０５号

しかしながら、上述した技術では復号時に高音質な音声を得ることはできるが、音声信号の処理単位ごとに高域成分の推定値を算出するための情報を生成しなければならず、高域符号化情報の符号量が充分に少ないとはいえなかった。

本技術は、このような状況に鑑みてなされたものであり、より少ない符号量で高音質な音声を得ることができるようにするものである。

本技術の一側面の符号化装置は、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部とを備える。

前記区間数決定特徴量を、前記高域サブバンドパワーの和を示す特徴量とすることができる。

前記区間数決定特徴量を、前記高域サブバンドパワーの和の時間変動を示す特徴量とすることができる。

前記区間数決定特徴量を、前記入力信号の周波数形状を示す特徴量とすることができる。

前記区間数決定特徴量を、複数の特徴量の線形和または非線形和とすることができる。

符号化装置には、前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに設け、前記選択部には、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択させることができる。

決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間を、前記連続フレーム区間とすることができる。

前記選択部には、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択させるとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定させ、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とさせることができる。

符号化装置には、前記データを符号化して高域符号化データを生成する高域符号化部をさらに設け、前記多重化部には、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成させることができる。

前記決定部には、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出させ、前記低域符号化部には、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化させることができる。

本技術の一側面の符号化方法またはプログラムは、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、前記入力信号の低域信号を符号化して低域符号化データを生成し、前記データと前記低域符号化データとを多重化して出力符号列を生成するステップを含む。

本技術の一側面においては、入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とが生成され、前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーが算出され、前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量が算出され、前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数が決定され、決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数が選択され、前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータが生成され、前記入力信号の低域信号を符号化して低域符号化データが生成され、前記データと前記低域符号化データとが多重化されて出力符号列が生成される。

本技術の一側面によれば、より少ない符号量で高音質な音声を得ることができる。

入力信号のサブバンドについて説明するための図である。可変長方式による高域成分の符号化について説明する図である。固定長方式による高域成分の符号化について説明する図である。本技術を適用した符号化装置の構成例を示す図である。符号化処理について説明するフローチャートである。復号装置の構成例を示す図である。符号化処理について説明するフローチャートである。符号化処理について説明するフローチャートである。符号化処理について説明するフローチャートである。符号化処理について説明するフローチャートである。符号化処理について説明するフローチャートである。符号化装置の他の構成例を示す図である。符号化処理について説明するフローチャートである。コンピュータの構成例を示す図である。

以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈本技術の概要〉
［入力信号の符号化について］
本技術は、例えば音楽信号などの音声信号を入力信号として、入力信号の符号化を行なうものである。

入力信号の符号化を行なう符号化装置では、符号化時において図１に示すように、入力信号は所定の帯域幅の複数の周波数帯域（以下、サブバンドと称する）のサブバンド信号に分割される。なお、図１において、縦軸は入力信号の各周波数のパワーを示しており、横軸は入力信号の各周波数を示している。また、曲線Ｃ１１は入力信号の各周波数成分のパワーを示しており、図中、縦方向の点線は各サブバンドの境界位置を示している。

入力信号が各サブバンドのサブバンド信号に分割されると、入力信号の周波数成分のうち、予め定められた周波数以下の低域側の成分が、所定の符号化方式により符号化され、低域符号化データが生成される。

図１の例では、各サブバンドを特定するインデックスがｓｂであるサブバンドｓｂの上限の周波数以下の周波数のサブバンドが入力信号の低域成分とされており、サブバンドｓｂの上限の周波数よりも高い周波数のサブバンドが入力信号の高域成分とされている。

低域符号化データが得られると、次に入力信号の低域成分と高域成分とに基づいて、高域成分の各サブバンドのサブバンド信号を再現するための情報が生成され、その情報が、適宜、所定の符号化方式により符号化されて高域符号化データが生成される。

具体的には、周波数方向に連続して並ぶ低域側の最も周波数が高い４つのサブバンドｓｂ−３乃至サブバンドｓｂの成分と、高域側の連続して並ぶ(eb-(sb+1)+1)個のサブバンドｓｂ＋１乃至サブバンドｅｂの成分とから、高域符号化データが生成される。

ここで、サブバンドｓｂ＋１はサブバンドｓｂに隣接する、最も低域側に位置する高域のサブバンドであり、サブバンドｅｂは、連続して並ぶサブバンドｓｂ＋１乃至サブバンドｅｂのうちの最も周波数が高いサブバンドである。

高域成分の符号化で得られる高域符号化データは、高域側のサブバンドｉｂ（但し、ｓｂ＋１≦ｉｂ≦ｅｂ）のサブバンド信号を推定により生成するための情報であり、高域符号化データには、各サブバンド信号の推定に用いられる推定係数を得るための係数インデックスが含まれている。

すなわち、サブバンドｉｂのサブバンド信号の推定には、低域側の各サブバンドｋｂ（但し、ｓｂ−３≦ｋｂ≦ｓｂ）のサブバンド信号のパワーに乗算される係数Ａ_ｉｂ（ｋｂ）と、定数項である係数Ｂ_ｉｂからなる推定係数が用いられる。高域符号化データに含まれる係数インデックスは、各サブバンドｉｂの係数Ａ_ｉｂ（ｋｂ）と係数Ｂ_ｉｂからなる推定係数のセットを得るための情報、例えば推定係数のセットを特定する情報である。

以上のようにして低域符号化データと高域符号化データが得られると、それらの低域符号化データと高域符号化データが多重化されて出力符号列とされ、出力される。

このように高域符号化データに、推定係数を得るための係数インデックスを含めるようにすることで、フレームごとに高域成分を算出するためのスケールファクタや振幅調整係数などを含める場合と比べて、高域符号化データの符号量を大幅に削減することができる。

また、出力符号列の供給を受けた復号装置は、低域符号化データを復号して低域側の各サブバンドのサブバンド信号からなる復号低域信号を得るとともに、復号低域信号と、高域符号化データを復号して得られた情報とから高域側の各サブバンドのサブバンド信号を推定により生成する。そして、復号装置は、推定により得られた高域側の各サブバンドのサブバンド信号からなる復号高域信号と、復号低域信号とから出力信号を生成する。このようにして得られた出力信号は、符号化された入力信号を復号することで得られた信号である。

［出力符号列について］
ところで、入力信号の符号化では入力信号の所定の時間長の区間ごと、すなわちフレームごとに、予め用意された複数の推定係数のなかから、処理対象となっているフレームに対して適切な推定係数が選択される。

符号化装置では、各フレームの係数インデックスをそのまま高域符号化データに含めるのではなく、時間方向において係数インデックスが変化する時間の情報と、変化した係数インデックスの値を高域符号化データに含めることで更なる符号量の削減が図られている。

特に、入力信号が、各周波数成分の時間方向への変動が少ない定常信号である場合には、選択された推定係数、すなわち係数インデックスは時間方向に同じものが連続して続くことが多い。そこで、高域符号化データに含まれる係数インデックスの時間方向の情報量を削減するために、適宜、可変長方式と固定長方式とが切り替えられながら、入力信号の高域成分の符号化が行なわれる。

［可変長方式について］
以下、可変長方式と固定長方式による高域成分の符号化について説明する。

高域成分の符号化時には、予め定められた所定のフレーム長の区間ごとに、可変長方式と固定長方式の切り替えが行なわれる。例えば、以下では１６フレームごとに可変長方式と固定長方式の切り替えが行なわれるものとして説明を続けることとし、入力信号の１６フレーム分の区間を処理対象区間とも称することとする。つまり、符号化装置では、処理対象区間である１６フレームを単位として、出力符号列が出力される。

まず、可変長方式について説明する。可変長方式による高域成分の符号化では、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータが符号化され、高域符号化データとされる。

なお、方式フラグは、高域符号化データを生成する方式を示す情報、すなわち高域成分の符号化時に可変長方式と固定長方式の何れの方式が選択されたかを示す情報である。

また、区間情報とは、処理対象区間に含まれる連続するフレームからなる区間であって、同じ係数インデックスが選択されたフレームからなる区間（以下、連続フレーム区間とも称する）の長さを示す情報である。また、個数情報とは、処理対象区間に含まれる連続フレーム区間の個数を示す情報である。

例えば、可変長方式では図２に示すように位置ＦＳＴ１から位置ＦＳＥ１までの間に含まれる１６フレームの区間が１つの処理対象区間とされる。なお、図２において、図中、横方向は時間を示しており、１つの四角形は１つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。

可変長方式による高域成分の符号化では、まず、処理対象区間が、同じ係数インデックスが選択される、連続するフレームからなる連続フレーム区間に分割される。すなわち、異なる係数インデックスが選択される、互いに隣接するフレームの境界位置が、各連続フレーム区間の境界位置とされる。

この例では、処理対象区間は、位置ＦＳＴ１から位置ＦＣ１の区間、位置ＦＣ１から位置ＦＣ２の区間、および位置ＦＣ２から位置ＦＳＥ１の区間の３つの区間に分割される。例えば、位置ＦＳＴ１から位置ＦＣ１までの連続フレーム区間では、各フレームにおいて、同じ係数インデックス「２」が選択されている。

このようにして処理対象区間が連続フレーム区間に分割されると、処理対象区間内の連続フレーム区間数を示す個数情報、各連続フレーム区間で選択された係数インデックス、各連続フレーム区間の長さを示す区間情報、および方式フラグからなるデータが生成される。

ここでは、処理対象区間は３つの連続フレーム区間に分割されているので、連続フレーム区間数「３」を示す情報が個数情報とされる。図２では個数情報が「num_length=3」で表されている。

また、例えば処理対象区間内の最初の連続フレーム区間の区間情報は、その連続フレーム区間のフレームを単位とする長さ「５」とされ、図２では「length0=5」で表されている。なお、各区間情報は、処理対象区間の先頭から何番目にある連続フレーム区間の区間情報であるかが特定できるようにされている。換言すれば、区間情報には、処理対象区間内における連続フレーム区間の位置を特定するための情報も含まれている。

このようにして、処理対象区間について個数情報、係数インデックス、区間情報、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。この場合、複数フレームで連続して同じ係数インデックスが選択されるときには、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減し、より効率的に符号化，復号を行なうことができる。

［固定長方式について］
次に、固定長方式による高域成分の符号化について説明する。

固定長方式では図３に示すように、１６フレームからなる処理対象区間が、所定のフレーム数からなる区間（以下、固定長区間と称する）に等分割される。なお、図３において、横方向は時間を示しており、１つの四角形は１つのフレームを表している。また、フレームを表す四角形内の数値は、そのフレームについて選択された推定係数を特定する係数インデックスの値を示している。さらに、図３において、図２における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

固定長方式においては、処理対象区間がいくつかの固定長区間に分割される。このとき、固定長区間の長さは、固定長区間内の各フレームで選択されている係数インデックスが同じであり、かつ固定長区間の長さが最も長くなるように定められる。

図３の例では、固定長区間の長さ（以下、単に固定長とも称する）は、４フレームとされており、処理対象区間は４つの固定長区間に等分されている。すなわち、処理対象区間は、位置ＦＳＴ１から位置ＦＣ２１までの区間、位置ＦＣ２１から位置ＦＣ２２までの区間、位置ＦＣ２２から位置ＦＣ２３までの区間、および位置ＦＣ２３から位置ＦＳＥ１までの区間に分割される。これらの固定長区間における係数インデックスは、処理対象区間の先頭の固定長区間から順番に、係数インデックス「１」，「２」，「２」，「３」とされている。

このようにして、処理対象区間がいくつかの固定長区間に分割されると、処理対象区間内の固定長区間の固定長を示す固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成される。

ここで、切り替わりフラグとは、固定長区間の境界位置、つまり所定の固定長区間の最後のフレームと、その固定長区間の次の固定長区間の先頭のフレームとで、係数インデックスが変化したか否かを示す情報である。例えば、ｉ番目（ｉ＝０，１，２，・・・）の切り替わりフラグgridflg_iは、処理対象区間の先頭から（ｉ＋１）番目と（ｉ＋２）番目の固定長区間の境界位置において、係数インデックスが変化した場合「１」とされ、変化していない場合「０」とされる。

図３の例では、処理対象区間の１番目の固定長区間の境界位置（位置ＦＣ２１）の切り替わりフラグgridflg_0は、１番目の固定長区間の係数インデックス「１」と、２番目の固定長区間の係数インデックス「２」とが異なるため「１」とされている。また、位置ＦＣ２２の切り替わりフラグgridflg_1は、２番目の固定長区間の係数インデックス「２」と、３番目の固定長区間の係数インデックス「２」とが同じであるため「０」とされている。

さらに、固定長インデックスの値は、固定長から求められる値などとされる。具体的には、例えば固定長インデックスlength_idは、固定長fixed_length＝16/2^length_idを満たす値とされる。図３の例では、固定長fixed_length＝４であるので、固定長インデックスlength_id＝２とされる。

処理対象区間が固定長区間に分割され、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータが生成されると、このデータが符号化されて高域符号化データとされる。

図３の例では、位置ＦＣ２１乃至位置ＦＣ２３における切り替わりフラグgridflg_0＝1、gridflg_1＝0、およびgridflg_2＝1と、固定長インデックスlength_id＝2、各固定長区間の係数インデックス「１」，「２」，「３」、および固定長方式である旨の方式フラグとからなるデータが符号化されて、高域符号化データとされる。

ここで、各固定長区間の境界位置の切り替わりフラグは、処理対象区間の先頭から何番目にある境界位置の切り替わりフラグであるかが特定できるようにされている。換言すれば、切り替わりフラグには、処理対象区間内における固定長区間の境界位置を特定するための情報も含まれている。

また、高域符号化データに含まれる各係数インデックスは、それらの係数インデックスが選択された順番、つまり固定長区間が並ぶ順番に並べられている。例えば、図３の例では、係数インデックス「１」，「２」，「３」の順に並べられて、それらの係数インデックスがデータに含められる。

なお、図３の例では、処理対象区間の先頭から２番目と３番目の固定長区間の係数インデックスが「２」であるが、高域符号化データには、係数インデックス「２」が１つだけ含まれるようにされる。連続する固定長区間の係数インデックスが同じである場合、すなわち連続する固定長区間の境界位置における切り替わりフラグが０の場合には、それらの固定長区間の数だけ同じ係数インデックスが高域符号化データに含まれるのではなく、１つの係数インデックスが高域符号化データに含まれることになる。

このように、固定長インデックス、係数インデックス、切り替わりフラグ、および方式フラグからなるデータから高域符号化データを生成すれば、フレームごとに係数インデックスを送信する必要がなくなるので、伝送する出力符号列のデータ量を削減することができる。これにより、より効率的に符号化，復号を行なうことができる。

［連続フレーム区間数について］
また、入力信号の符号化時においては、入力信号の各サブバンドのサブバンド信号に基づいて、処理対象区間を構成する連続フレーム区間の最適な数が定められ、定められた連続フレーム区間数に基づいて各フレームの係数インデックス（推定係数）が選択される。例えば処理対象区間を構成する最適な連続フレーム区間数は、高域側のサブバンドのサブバンドパワーから定まる特徴量（以下、区間数決定特徴量とも称する）に基づいて定められる。

このように、処理対象区間を構成する連続フレーム区間の数を、高域の特徴を示す区間数決定特徴量に基づいて定めることで、フレームごとに選択される係数インデックスが、時間方向に必要以上に変化することを防止することができる。

これにより、処理対象区間の高域符号化データに含まれる係数インデックスの数等を必要最小限に抑えることができ、高域符号化データの符号量をより少なくすることができる。

また、推定係数によって高域成分の推定誤差等の特性が異なるため、係数インデックスの時間方向の変動が必要以上に多いと、復号で得られる音声信号には、復号前の入力信号にはない不自然な周波数包絡の時間変動が生じ、聴感上、音質が劣化してしまう。このような音質の劣化は、高域成分の時間変動が少ない定常的な音声信号ほど顕著である。

しかし、処理対象区間を構成する連続フレーム区間数を適切に定めてから各フレームの係数インデックスを選択すれば、係数インデックスが必要以上に変動することを防止することができる。これにより、復号で得られる音声の高域成分の不自然な時間変動を抑制し、音質を向上させることができる。

〈第１の実施の形態〉
［符号化装置の構成例］
次に、以上において説明した入力信号の符号化技術の具体的な実施の形態について説明する。まず、入力信号の符号化を行なう符号化装置の構成について説明する。図４は、符号化装置の構成例を示す図である。

符号化装置１１は、低域通過フィルタ３１、低域符号化回路３２、サブバンド分割回路３３、特徴量算出回路３４、擬似高域サブバンドパワー算出回路３５、区間数決定特徴量算出回路３６、擬似高域サブバンドパワー差分算出回路３７、高域符号化回路３８、および多重化回路３９から構成される。符号化装置１１では、符号化対象の入力信号が低域通過フィルタ３１およびサブバンド分割回路３３に供給される。

低域通過フィルタ３１は、供給された入力信号を所定の遮断周波数でフィルタリングし、その結果得られた、遮断周波数より低域の信号（以下、低域信号と称する）を、低域符号化回路３２およびサブバンド分割回路３３に供給する。

低域符号化回路３２は、低域通過フィルタ３１からの低域信号を符号化し、その結果得られた低域符号化データを多重化回路３９に供給する。

サブバンド分割回路３３は、低域通過フィルタ３１からの低域信号を複数のサブバンドのサブバンド信号（以下、低域サブバンド信号とも称する）に等分割し、これにより得られた低域サブバンド信号を特徴量算出回路３４および区間数決定特徴量算出回路３６に供給する。低域サブバンド信号は、入力信号の低域側の各サブバンドの信号である。

また、サブバンド分割回路３３は、供給された入力信号を複数のサブバンドのサブバンド信号に等分割し、これにより得られたサブバンド信号のうち、高域側の所定の帯域に含まれる各サブバンドのサブバンド信号を、区間数決定特徴量算出回路３６および擬似高域サブバンドパワー差分算出回路３７に供給する。なお、以下、サブバンド分割回路３３から区間数決定特徴量算出回路３６および擬似高域サブバンドパワー差分算出回路３７に供給される各サブバンドのサブバンド信号を、高域サブバンド信号とも称する。

特徴量算出回路３４は、サブバンド分割回路３３からの低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路３５に供給する。

擬似高域サブバンドパワー算出回路３５は、特徴量算出回路３４からの特徴量に基づいて、高域サブバンド信号のパワーの推定値（以下、擬似高域サブバンドパワーとも称する）を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。なお、擬似高域サブバンドパワー算出回路３５には、統計学習により得られた推定係数のセットが複数記録されており、擬似高域サブバンドパワーは、推定係数と特徴量に基づいて算出される。

区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された低域サブバンド信号および高域サブバンド信号に基づいて、区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。

擬似高域サブバンドパワー差分算出回路３７は、各フレームについて、そのフレームの高域成分を推定するのに適した推定係数を示す係数インデックスを選択する。擬似高域サブバンドパワー差分算出回路３７は、決定部５１、評価値和算出部５２、選択部５３、および生成部５４を備えている。

決定部５１は、区間数決定特徴量算出回路３６から供給された区間数決定特徴量に基づいて、処理対象区間を構成する連続フレーム区間の数を決定する。

擬似高域サブバンドパワー差分算出回路３７は、サブバンド分割回路３３からの高域サブバンド信号のパワー（以下、高域サブバンドパワーとも称する）と、擬似高域サブバンドパワー算出回路３５からの擬似高域サブバンドパワーとに基づいて、各フレームについて推定係数ごとに評価値を算出する。この評価値は、入力信号の実際の高域成分と、推定係数を用いて推定された高域成分との誤差を示す値である。

評価値和算出部５２は、決定部５１により決定された連続フレーム区間数と、各フレームの評価値とに基づいて、連続するフレームの評価値の和を算出する。選択部５３は、評価値和算出部５２により算出された評価値の和に基づいて各フレームの係数インデックスを選択する。

生成部５４は、入力信号の処理対象区間の各フレームにおける係数インデックスの選択結果に基づいて、可変長方式または固定長方式の切り替えを行い、選択された方式で高域符号化データを得るためのデータを生成し、高域符号化回路３８に供給する。

高域符号化回路３８は、擬似高域サブバンドパワー差分算出回路３７から供給されたデータを符号化し、その結果得られる高域符号化データを多重化回路３９に供給する。多重化回路３９は、低域符号化回路３２からの低域符号化データと、高域符号化回路３８からの高域符号化データとを多重化し、出力符号列として出力する。

［符号化処理の説明］
図４に示した符号化装置１１は、入力信号が供給されて、入力信号の符号化が指示されると符号化処理を行なって、復号装置に出力符号列を出力する。以下、図５のフローチャートを参照して、符号化装置１１による符号化処理について説明する。なお、この符号化処理は、予め定められたフレーム数、つまり処理対象区間ごとに行なわれる。

ステップＳ１１において、低域通過フィルタ３１は、供給された処理対象のフレームの入力信号を低域通過フィルタによって所定の遮断周波数でフィルタリングし、その結果得られた低域信号を低域符号化回路３２およびサブバンド分割回路３３に供給する。

ステップＳ１２において、低域符号化回路３２は、低域通過フィルタ３１から供給された低域信号を符号化し、その結果得られた低域符号化データを多重化回路３９に供給する。

ステップＳ１３において、サブバンド分割回路３３は、入力信号および低域信号を所定の帯域幅の複数のサブバンド信号に等分割する。

すなわち、サブバンド分割回路３３は、入力信号を各サブバンドのサブバンド信号に分割し、これにより得られた高域側のサブバンドｓｂ＋１乃至サブバンドｅｂの各サブバンド信号を、区間数決定特徴量算出回路３６および擬似高域サブバンドパワー差分算出回路３７に供給する。

また、サブバンド分割回路３３は、低域通過フィルタ３１からの低域信号を各サブバンドのサブバンド信号に分割し、これにより得られた低域側のサブバンドｓｂ−３乃至サブバンドｓｂの各サブバンド信号を、特徴量算出回路３４および区間数決定特徴量算出回路３６に供給する。

ステップＳ１４において、区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された低域サブバンド信号および高域サブバンド信号の少なくとも何れかに基づいて区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。

例えば、区間数決定特徴量算出回路３６は次式（１）を計算することで、処理対象のフレームＪの推定帯域、つまり高域側の各サブバンドのサブバンド信号のパワーの和であるサブバンドパワー和power_high(J)を算出する。

なお、式（１）において、power_lin(ib,J)は、フレームＪのサブバンドｉｂ（但し、ｓｂ＋１≦ｉｂ≦ｅｂ）のサブバンド信号の各サンプルのサンプル値の二乗平均値を示している。したがって、サブバンドパワー和power_high(J)は、高域側の各サブバンドについて求めた二乗平均値power_lin(ib,J)の和を対数化することにより得られる。

このようにして得られるサブバンドパワー和power_high(J)は、入力信号の高域側の各サブバンドの高域サブバンドパワーの和を示しており、各サブバンドのパワーの和が大きいほどサブバンドパワー和power_high(J)の値も大きくなる。つまり、入力信号の高域成分のパワーが全体的に大きいほど、サブバンドパワー和power_high(J)も大きくなる。

ステップＳ１５において、特徴量算出回路３４は、サブバンド分割回路３３から供給された低域サブバンド信号に基づいて特徴量を算出し、擬似高域サブバンドパワー算出回路３５に供給する。

例えば、特徴量として各低域サブバンド信号のパワーが算出される。なお、以下、低域サブバンド信号のパワーを特に低域サブバンドパワーとも称することとする。また、低域サブバンド信号や高域サブバンド信号など、各サブバンド信号のパワーを、適宜、サブバンドパワーとも称することとする。

具体的には、特徴量算出回路３４は、次式（２）を計算することで、デシベルで表現される処理対象のフレームＪのサブバンドｉｂ（但し、ｓｂ−３≦ｉｂ≦ｓｂ）のサブバンドパワーpower(ib,J)を算出する。

なお、式（２）においてx(ib,n)は、サブバンドｉｂのサブバンド信号の値（サンプルのサンプル値）を示しており、x(ib,n)におけるｎは、離散時間のインデックスを示している。また、式（２）におけるFSIZEは、１フレームを構成するサブバンド信号のサンプル数を示している。

したがって、フレームＪの低域サブバンドパワーpower(ib,J)は、フレームＪを構成する低域サブバンド信号の各サンプルのサンプル値の二乗平均値を対数化することにより算出される。なお、以下では、特徴量算出回路３４において、特徴量として低域サブバンドパワーが算出されるものとして説明を続ける。

ステップＳ１６において、擬似高域サブバンドパワー算出回路３５は、予め記録している推定係数ごとに、特徴量算出回路３４から供給された特徴量としての低域サブバンドパワーと、記録している推定係数とに基づいて擬似高域サブバンドパワーを算出する。

例えば、係数インデックスが１乃至Ｋ（但し、２≦Ｋ）のＫ個の推定係数のセットが予め用意されている場合、Ｋ個の推定係数のセットについて、各サブバンドの擬似高域サブバンドパワーが算出される。

具体的には、擬似高域サブバンドパワー算出回路３５は次式（３）を計算し、処理対象のフレームＪの高域側の各サブバンドの擬似高域サブバンドパワーpower_est(ib,J)（但し、ｓｂ＋１≦ｉｂ≦ｅｂ）を算出する。

なお、式（３）において、係数Ａ_ｉｂ（ｋｂ）および係数Ｂ_ｉｂは、高域側のサブバンドｉｂについて用意された推定係数のセットを示している。すなわち、係数Ａ_ｉｂ（ｋｂ）は、サブバンドｋｂ（但し、ｓｂ−３≦ｋｂ≦ｓｂ）の低域サブバンドパワーpower(kb,J)に乗算される係数であり、係数Ｂ_ｉｂは、低域サブバンドパワーを線形結合するときに用いられる定数項である。

したがって、高域側のサブバンドｉｂの擬似高域サブバンドパワーpower_est(ib,J)は、低域側の各サブバンドの低域サブバンドパワーに、サブバンドごとの係数Ａ_ｉｂ（ｋｂ）を乗算し、係数が乗算された低域サブバンドパワーの和に、さらに係数Ｂ_ｉｂを加算することで得られる。

擬似高域サブバンドパワー算出回路３５は、推定係数のセットごとに高域の各サブバンドの擬似高域サブバンドパワーを算出すると、算出した擬似高域サブバンドパワーを擬似高域サブバンドパワー差分算出回路３７に供給する。

ステップＳ１７において、擬似高域サブバンドパワー差分算出回路３７は、係数インデックスｉｄで特定される推定係数のセット全てについて、処理対象のフレームＪを用いた評価値Res（id,J）を算出する。

具体的には、擬似高域サブバンドパワー差分算出回路３７は、サブバンド分割回路３３から供給された各サブバンドの高域サブバンド信号を用いて、上述した式（２）と同様の演算を行ない、フレームＪにおける高域サブバンドパワーpower(ib,J)を算出する。

高域サブバンドパワーpower(ib,J)が得られると、擬似高域サブバンドパワー差分算出回路３７は、次式（４）を計算し、残差二乗平均値Res_std（id,J）を算出する。

すなわち、高域側の各サブバンドｉｂ（但し、ｓｂ＋１≦ｉｂ≦ｅｂ）について、フレームＪの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpower_est(ib,id,J)の差分が求められ、それらの差分の二乗平均値が残差二乗平均値Res_std（id,J）とされる。

なお、擬似高域サブバンドパワーpower_est(ib,id,J)は、フレームＪにおいて、係数インデックスがｉｄである推定係数について求められた、サブバンドｉｂの擬似高域サブバンドパワーを示している。

続いて、擬似高域サブバンドパワー差分算出回路３７は、次式（５）を計算し、残差最大値Res_max（id,J）を算出する。

なお、式（５）において、max_ib{|power(ib,J)−power_est(ib,id,J)|}は、各サブバンドｉｂの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpower_est(ib,id,J)の差分の絶対値のうちの最大のものを示している。したがって、フレームＪにおける高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpower_est(ib,id,J)の差分の絶対値の最大値が残差最大値Res_max（id,J）とされる。

また、擬似高域サブバンドパワー差分算出回路３７は、次式（６）を計算し、残差平均値Res_ave（id,J）を算出する。

すなわち、高域側の各サブバンドｉｂについて、フレームＪの高域サブバンドパワーpower(ib,J)と擬似高域サブバンドパワーpower_est(ib,id,J)の差分が求められ、それらの差分の総和が求められる。そして、得られた差分の総和を高域側のサブバンド数（eb−sb）で除算して得られる値の絶対値が残差平均値Res_ave（id,J）とされる。この残差平均値Res_ave（id,J）は、符号が考慮された各サブバンドの推定誤差の平均値の大きさを示している。

さらに、残差二乗平均値Res_std（id,J）、残差最大値Res_max（id,J）、および残差平均値Res_ave（id,J）が得られると、擬似高域サブバンドパワー差分算出回路３７は、次式（７）を計算し、最終的な評価値Res（id,J）を算出する。

すなわち、残差二乗平均値Res_std（id,J）、残差最大値Res_max（id,J）、および残差平均値Res_ave（id,J）が重み付き加算されて、最終的な評価値Res（id,J）とされる。なお、式（７）において、W_std、W_maxおよびW_aveは、予め定められた重みであり、例えばW_std＝1、W_max＝0.5、W_ave＝0.5などとされる。

擬似高域サブバンドパワー差分算出回路３７は、以上の処理を行って、Ｋ個の推定係数ごとに、すなわちＫ個の係数インデックスｉｄごとに、評価値Res（id,J）を算出する。

このようにして得られた評価値Res（id,J）は、実際の入力信号から算出された高域サブバンドパワーと、係数インデックスがｉｄである推定係数を用いて算出された擬似高域サブバンドパワーとの類似の度合いを示している。つまり、高域成分の推定誤差の大きさを示している。

したがって、評価値Res（id,J）が小さいほど、推定係数を用いた演算により、実際の入力信号の高域成分により近い信号が得られることになる。

ステップＳ１８において、擬似高域サブバンドパワー差分算出回路３７は、所定フレーム長だけ処理を行ったか否かを判定する。すなわち、処理対象区間を構成する全てのフレームについて、区間数決定特徴量と評価値が算出されたか否かが判定される。

ステップＳ１８において、所定フレーム長だけ処理を行なっていないと判定された場合、処理はステップＳ１１に戻り、上述した処理が繰り返される。すなわち、処理対象区間のまだ処理対象となっていないフレームが、次の処理対象のフレームとされて、そのフレームの区間数決定特徴量と評価値が算出される。

これに対してステップＳ１８において、所定フレーム長だけ処理を行ったと判定された場合、処理はステップＳ１９に進む。

ステップＳ１９において、決定部５１は、区間数決定特徴量算出回路３６から供給された、処理対象区間を構成する各フレームの区間数決定特徴量に基づいて、処理対象区間を構成する連続フレーム区間数を決定する。

具体的には決定部５１は、処理対象区間を構成する各フレームの区間数決定特徴量から、それらの区間数決定特徴量の代表値を求める。例えば、各フレームの区間数決定特徴量のうちの最大値、つまり最も大きい区間数決定特徴量が代表値とされる。

次に、決定部５１は求めた代表値と予め定めた閾値とを比較することで、連続フレーム区間数を決定する。例えば連続フレーム区間数は、代表値が１００以上である場合、１６とされ、代表値が８０以上１００未満である場合、８とされ、代表値が６０以上８０未満である場合、４とされる。また、代表値が４０以上６０未満である場合、連続フレーム区間数は２とされ、代表値が４０未満である場合、連続フレーム区間数は１とされる。

連続フレーム区間数の決定時に閾値処理される区間数決定特徴量（代表値）は、高域サブバンドパワーの和を示している。入力信号等の音声信号において、高域側のサブバンドパワーの和が大きい区間は、サブバンドパワーが小さい区間と比べて聴感上、高域成分がより耳に付く（はっきりと聞こえる）ので、復号時には、より原信号に近い信号が推定により得られるようにする必要がある。

そこで、決定部５１は区間数決定特徴量の代表値が大きい場合には、連続フレーム区間数を多くして、復号側においてより高精度に各フレームの高域成分を推定できるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。

これに対して、代表値が小さい場合には、高域成分のパワーは小さいので、推定係数による高域成分の推定精度がある程度低くても、復号で得られる音声の音質の聴感上の劣化は知覚されにくくなる。そのため、決定部５１は、代表値が小さい場合には、連続フレーム区間数を少なくして、音質を劣化させることなく高域符号化データの符号量を削減する。

ステップＳ２０において、評価値和算出部５２は、各フレームについて係数インデックス（推定係数のセット）ごとに算出した評価値を用いて、連続フレーム区間を構成するフレームの評価値の和を係数インデックスごとに算出する。

例えば、ステップＳ１９で決定された連続フレーム区間数がndivであり、処理対象区間が１６フレームで構成されるものとする。そのような場合、例えば評価値和算出部５２は、処理対象区間をndiv個の区間に等分し、得られた各区間を連続フレーム区間とする。この場合、各連続フレーム区間は、16/ndiv個の連続するフレームから構成されることになる。

さらに、評価値和算出部５２は次式（８）を計算して、係数インデックスごとに各連続フレーム区間を構成するフレームの評価値の和である評価値和Res_sum(id,igp)を算出する。

なお、式（８）において、igpは処理対象区間内の連続フレーム区間を識別するインデックスであり、Res(id,ifr)は、係数インデックスｉｄについて求められた、連続フレーム区間を構成するフレームifrの評価値Res（id,ifr）を示している。

したがって、連続フレーム区間の係数インデックスｉｄについての評価値和Res_sum(id,igp)は、その連続フレーム区間を構成する、同じ係数インデックスｉｄの各フレームの評価値の和を計算することにより算出される。

ステップＳ２１において、選択部５３は、各連続フレーム区間について係数インデックスごとに求められた評価値和に基づいて、各フレームの係数インデックスを選択する。

各フレームの評価値Res（id,J）は、その値が小さいほど推定係数を用いた演算により、実際の高域成分により近い信号が得られるから、評価値和Res_sum(id,igp)が小さい係数インデックスほど、その係数インデックスが連続フレーム区間に適したものであるといえる。

そこで、選択部５３は、複数の係数インデックスのうち、連続フレーム区間について求めた評価値和Res_sum(id,igp)が最小となる係数インデックスを、その連続フレーム区間を構成する各フレームの係数インデックスとして選択する。したがって、連続フレーム区間では、各フレームで同じ係数インデックスが選択されることになる。

このようにして選択部５３は、処理対象区間を構成する連続フレーム区間ごとに、その連続フレーム区間を構成するフレームの係数インデックスを選択する。

なお、連続フレーム区間ごとに評価値和に基づいて係数インデックスを選択すると、場合によっては、互いに隣接する連続フレーム区間で同じ係数インデックスが選択されることもある。そのような場合、符号化装置１１は、同じ係数インデックスが選択されたそれらの連続して並ぶ連続フレーム区間を、１つの連続フレーム区間として扱う。

ステップＳ２２において、生成部５４は、高域符号化データを生成する方式を、固定長方式とするか否かを判定する。

すなわち、生成部５４は、処理対象区間における各フレームの係数インデックスの選択結果に基づいて、固定長方式により生成したときの高域符号化データと、可変長方式により生成したときの高域符号化データとの符号量を比較する。そして、生成部５４は、固定長方式の高域符号化データの符号量が、可変長方式の高域符号化データの符号量よりも少ない場合、固定長方式とすると判定する。

ステップＳ２２において、固定長方式とすると判定された場合、処理はステップＳ２３に進む。ステップＳ２３において、生成部５４は、固定長方式が選択された旨の方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを生成し、高域符号化回路３８に供給する。

例えば、図３の例では、生成部５４は、固定長を４フレームとして、位置ＦＳＴ１から位置ＦＳＥ１までの処理対象区間を、４つの固定長区間に分割する。そして、生成部５４は、固定長インデックス「２」、係数インデックス「１」，「２」，「３」、切り替わりフラグ「１」，「０」，「１」、および方式フラグからなるデータを生成する。

なお、図３では処理対象区間の先頭から２番目と３番目の固定長区間の係数インデックスはともに「２」であるが、これらの固定長区間は連続して並んでいるため、生成部５４から出力されるデータには、係数インデックス「２」が１つだけ含まれるようにされる。

ステップＳ２４において、高域符号化回路３８は、生成部５４から供給された、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグからなるデータを符号化し、高域符号化データを生成する。

例えば、必要に応じて、方式フラグ、固定長インデックス、係数インデックス、および切り替わりフラグのうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。なお、方式フラグや固定長インデックスなどからなるデータが、そのまま高域符号化データとされてもよい。

高域符号化回路３８は、生成した高域符号化データを多重化回路３９に供給し、その後、処理はステップＳ２７に進む。

これに対して、ステップＳ２２において、固定長方式としないと判定された場合、つまり可変長方式とすると判定された場合、処理はステップＳ２５に進む。ステップＳ２５において、生成部５４は、可変長方式が選択された旨の方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを生成し、高域符号化回路３８に供給する。

例えば、図２の例では、位置ＦＳＴ１から位置ＦＳＥ１までの処理対象区間が、３つの連続フレーム区間に分割されている。生成部５４は、可変長方式が選択された旨の方式フラグ、および連続フレーム区間の個数「３」を示す個数情報「num_length=3」と、各連続フレーム区間の長さを示す区間情報「length0=5」、および「length1=7」、並びにそれらの連続フレーム区間の係数インデックス「２」、「５」、および「１」とからなるデータを生成する。

なお、各連続フレーム区間の係数インデックスは、区間情報と対応付けられて、どの連続フレーム区間の係数インデックスかが特定できるようにされる。また、図２の例では、処理対象区間の先頭と、その次の連続フレーム区間の区間情報から、処理対象区間の最後の連続フレーム区間を構成するフレーム数が特定可能であるので、最後の連続フレーム区間については区間情報が生成されていない。

ステップＳ２６において、高域符号化回路３８は、生成部５４から供給された、方式フラグ、係数インデックス、区間情報、および個数情報からなるデータを符号化し、高域符号化データを生成する。

例えば、ステップＳ２６では、方式フラグ、係数インデックス、区間情報、および個数情報のうちの一部または全部の情報に対してエントロピー符号化などが行なわれる。なお、高域符号化データは、推定係数が得られる情報であれば、どのような情報であってもよく、例えば方式フラグ、係数インデックス、区間情報、および個数情報からなるデータがそのまま高域符号化データとされてもよい。

ステップＳ２４またはステップＳ２６において、高域符号化データが生成されると、ステップＳ２７において、多重化回路３９は、低域符号化回路３２から供給された低域符号化データと、高域符号化回路３８から供給された高域符号化データとを多重化する。そして、多重化回路３９は、多重化により得られた出力符号列を出力し、符号化処理は終了する。

以上のようにして符号化装置１１は、入力信号から得られたサブバンド信号に基づいて区間数決定特徴量を算出し、区間数決定特徴量から連続フレーム区間数を定めるとともに、連続フレーム区間ごとに評価値和を算出し、各フレームの係数インデックスを選択する。そして、符号化装置１１は、選択した係数インデックスを含むデータを符号化し、高域符号化データとする。

このように、係数インデックスを含むデータを符号化し、高域符号化データとすることで、スケールファクタ等の高域の推定演算に用いられるデータそのものを符号化する場合と比べて、高域符号化データの符号量をより少なくすることができる。

また、区間数決定特徴量に基づいて連続フレーム区間数を定めることにより、時間方向に対して必要以上に係数インデックスが変動することを抑制し、復号で得られる音声の聴感上の音質を向上させるとともに、出力符号列の符号量を削減することができる。これにより、入力信号の符号化効率を向上させることができる。

さらに、連続フレーム区間ごとに評価値和を算出して係数インデックスを選択することで、連続フレーム区間ごとにより適した推定係数の係数インデックスを得ることができる。特に、処理対象区間を構成する各連続フレーム区間の長さを等しくすることで、演算量を削減し、より迅速に係数インデックスを選択することができる。

［復号装置の構成］
次に符号化装置１１から出力された出力符号列の供給を受け、出力符号列の復号を行なう復号装置について説明する。

そのような復号装置は、例えば図６に示すように構成される。

復号装置８１は、非多重化回路９１、低域復号回路９２、サブバンド分割回路９３、特徴量算出回路９４、高域復号回路９５、復号高域サブバンドパワー算出回路９６、復号高域信号生成回路９７、および合成回路９８から構成される。

非多重化回路９１は、符号化装置１１から受信した出力符号列を入力符号列として、入力符号列を高域符号化データと低域符号化データに非多重化する。また、非多重化回路９１は、非多重化により得られた低域符号化データを低域復号回路９２に供給し、非多重化により得られた高域符号化データを高域復号回路９５に供給する。

低域復号回路９２は、非多重化回路９１からの低域符号化データを復号し、その結果得られた入力信号の復号低域信号を、サブバンド分割回路９３、および合成回路９８に供給する。

サブバンド分割回路９３は、低域復号回路９２からの復号低域信号を、所定の帯域幅を持つ複数の低域サブバンド信号に等分割し、得られた低域サブバンド信号を特徴量算出回路９４および復号高域信号生成回路９７に供給する。

特徴量算出回路９４は、サブバンド分割回路９３からの低域サブバンド信号に基づいて、低域側の各サブバンドの低域サブバンドパワーを特徴量として算出し、復号高域サブバンドパワー算出回路９６に供給する。

高域復号回路９５は、非多重化回路９１からの高域符号化データを復号し、その結果得られたデータと、そのデータに含まれる係数インデックスにより特定される推定係数とを復号高域サブバンドパワー算出回路９６に供給する。すなわち、高域復号回路９５には予め複数の係数インデックスと、その係数インデックスにより特定される推定係数とが対応付けられて記録されており、高域復号回路９５は高域符号化データに含まれる係数インデックスに対応する推定係数を出力する。

復号高域サブバンドパワー算出回路９６は、高域復号回路９５からのデータおよび推定係数と、特徴量算出回路９４からの低域サブバンドパワーとに基づいて、フレームごとに高域側の各サブバンドのサブバンドパワーの推定値である復号高域サブバンドパワーを算出する。例えば、上述した式（３）と同様の演算が行なわれて、復号高域サブバンドパワーが算出される。復号高域サブバンドパワー算出回路９６は、算出した各サブバンドの復号高域サブバンドパワーを復号高域信号生成回路９７に供給する。

復号高域信号生成回路９７は、サブバンド分割回路９３からの低域サブバンド信号と、復号高域サブバンドパワー算出回路９６からの復号高域サブバンドパワーとに基づいて復号高域信号を生成し、合成回路９８に供給する。

具体的には、復号高域信号生成回路９７は、低域サブバンド信号の低域サブバンドパワーを算出し、復号高域サブバンドパワーと低域サブバンドパワーとの比に応じて低域サブバンド信号を振幅変調する。さらに、復号高域信号生成回路９７は、振幅変調された低域サブバンド信号を周波数変調することにより、高域側の各サブバンドの復号高域サブバンド信号を生成する。このようにして得られた復号高域サブバンド信号は、入力信号の高域側の各サブバンドの高域サブバンド信号の推定値である。復号高域信号生成回路９７は、得られた各サブバンドの復号高域サブバンド信号からなる復号高域信号を合成回路９８に供給する。

合成回路９８は、低域復号回路９２からの復号低域信号と、復号高域信号生成回路９７からの復号高域信号とを合成し、出力信号として出力する。この出力信号は、符号化された入力信号を復号して得られる信号であり、高域成分と低域成分からなる信号である。

〈変形例１〉
［符号化処理の説明］
なお、以上においては、区間数決定特徴量として、高域サブバンドパワーの和を求める場合について説明したが、高域サブバンドパワーの和の時間変動を示す特徴量が、区間数決定特徴量とされてもよい。

高域サブバンドパワーの和の時間変動を示す特徴量として、例えば高域サブバンドパワーが時間とともにどの程度大きくなったかを示す特徴量、すなわちアタック性を示す特徴量が区間数決定特徴量とされてもよい。

そのような場合、符号化装置１１は、例えば図７に示す符号化処理を行なう。以下、図７のフローチャートを参照して、符号化装置１１による符号化処理について説明する。

なお、ステップＳ５１乃至ステップＳ５３の処理は、図５のステップＳ１１乃至ステップＳ１３の処理と同様であるので、その説明は省略する。

ステップＳ５４において、区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された高域サブバンド信号に基づいて、アタック性を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。

例えば、区間数決定特徴量算出回路３６は上述した式（１）を計算することで、処理対象のフレームＪの高域サブバンド信号のサブバンドパワー和power_high(J)を算出する。

さらに、区間数決定特徴量算出回路３６は、処理対象のフレームＪを含む直近（Ｌ+１）フレーム分のサブバンドパワー和に基づいて、次式（９）を計算し、アタック性を示す区間数決定特徴量として、特徴量power_attack(J)を算出する。このとき、例えばＬ＝１６などとされる。

なお、式（９）において、MIN{power_high(J), power_high(J-1),・・・power_high(J-L)}は、サブバンドパワー和power_high(J)乃至サブバンドパワー和power_high(J-L)のうちの最小値を出力する関数を示している。したがって、特徴量power_attack(J)は、処理対象のフレームＪのサブバンドパワー和power_high(J)と、処理対象のフレームＪを含む直近（Ｌ+１）フレームのサブバンドパワーの最小値との差分を計算することにより求められる。

このようにして得られた特徴量power_attack(J)は、サブバンドパワー和の時間方向への立ち上がりの速さ、つまり大きくなる速さを示しているので、特徴量power_attack(J)が大きいほど、高域成分のアタック性が強いということができる。

区間数決定特徴量算出回路３６が算出した特徴量power_attack(J)を擬似高域サブバンドパワー差分算出回路３７に供給すると、その後、ステップＳ５５乃至ステップＳ６７の処理が行なわれて符号化処理は終了する。

なお、これらの処理は図５のステップＳ１５乃至ステップＳ２７の処理と同様であるので、その説明は省略する。但しステップＳ５９では、決定部５１は区間数決定特徴量として算出した、アタック性を示す特徴量power_attack(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。

具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が４０以上である場合、連続フレーム区間数は１６とされ、代表値が３０以上４０未満である場合、連続フレーム区間数は８とされる。また、代表値が２０以上３０未満である場合、連続フレーム区間数は４とされ、代表値が１０以上２０未満である場合、連続フレーム区間数は２とされ、代表値が１０未満である場合、連続フレーム区間数は１とされる。

例えば、区間数決定特徴量が大きくアタック性が強い区間は、サブバンドパワー和の時間変動が大きい区間である。つまり、最適な推定係数の時間方向の変動が大きい区間である。そこで、決定部５１は区間数決定特徴量の代表値が大きい区間では連続フレーム区間数を多くすることで、復号側において、より原信号に近い高域サブバンド信号を推定により得られるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。

これに対して、決定部５１は代表値が小さい区間では連続フレーム区間数を少なくすることで、音質を劣化させることなく高域符号化データの符号量を削減する。

このように、アタック性を示す区間数決定特徴量を用いた場合においても、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。

〈変形例２〉
［符号化処理の説明］
また、高域サブバンドパワーの和の時間変動を示す区間数決定特徴量として、ディケイ性を示す特徴量が用いられてもよい。

そのような場合、符号化装置１１は、例えば図８に示す符号化処理を行なう。以下、図８のフローチャートを参照して、符号化装置１１による符号化処理について説明する。なお、ステップＳ９１乃至ステップＳ９３の処理は、図５のステップＳ１１乃至ステップＳ１３の処理と同様であるので、その説明は省略する。

ステップＳ９４において、区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された高域サブバンド信号に基づいて、ディケイ性を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。

さらに、区間数決定特徴量算出回路３６は、処理対象のフレームＪを含む直近（Ｍ+１）フレーム分のサブバンドパワー和に基づいて、次式（１０）を計算し、ディケイ性を示す区間数決定特徴量として特徴量power_decay(J)を算出する。このとき、例えばＭ＝１６などとされる。

なお、式（１０）において、MAX{power_high(J),power_high(J-1),・・・power_high(J-M)}は、サブバンドパワー和power_high(J)乃至サブバンドパワー和power_high(J-M)のうちの最大値を出力する関数を示している。したがって、特徴量power_decay(J)は、処理対象のフレームＪを含む直近（Ｍ+１）フレームのサブバンドパワーの最大値と、処理対象のフレームＪのサブバンドパワー和との差分を計算することにより求められる。

このようにして得られた特徴量power_decay(J)は、サブバンドパワー和の時間方向への立ち下がりの速さ、つまり小さくなる速さを示しているので、特徴量power_decay(J)が大きいほど、高域成分のディケイ性が強いということができる。

区間数決定特徴量算出回路３６が算出した特徴量power_decay(J)を擬似高域サブバンドパワー差分算出回路３７に供給すると、その後、ステップＳ９５乃至ステップＳ１０７の処理が行なわれて符号化処理は終了する。

なお、これらの処理は図５のステップＳ１５乃至ステップＳ２７の処理と同様であるので、その説明は省略する。但しステップＳ９９では、決定部５１はディケイ性を示す区間数決定特徴量として算出した特徴量power_decay(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。

例えば、区間数決定特徴量が大きくディケイ性が強い区間は、サブバンドパワー和の時間変動が大きい区間である。そこで、決定部５１は、アタック性を示す区間数決定特徴量の場合と同様に、区間数決定特徴量の代表値がより大きい区間ほど、連続フレーム区間数をより多くする。これにより、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。

〈変形例３〉
［符号化処理の説明］
また、区間数決定特徴量として、入力信号の周波数形状を示す特徴量が用いられるようにしてもよい。

そのような場合、符号化装置１１は、例えば図９に示す符号化処理を行なう。以下、図９のフローチャートを参照して、符号化装置１１による符号化処理について説明する。なお、ステップＳ１３１乃至ステップＳ１３３の処理は、図５のステップＳ１１乃至ステップＳ１３の処理と同様であるので、その説明は省略する。

ステップＳ１３４において、区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された低域サブバンド信号と高域サブバンド信号に基づいて、周波数形状を示す区間数決定特徴量を算出し、擬似高域サブバンドパワー差分算出回路３７に供給する。

さらに、区間数決定特徴量算出回路３６は次式（１１）を計算し、周波数形状を示す区間数決定特徴量として特徴量power_tilt(J)を算出する。

なお式（１１）において、Σpower_lin(ib,J)は低域側のサブバンドｉｂ（但し、０≦ｉｂ≦ｓｂ）のサブバンド信号の各サンプルのサンプル値の二乗平均値の和を示している。

したがって、特徴量power_tilt(J)は、処理対象のフレームＪについて、低域側のサブバンドのサブバンド信号のサンプルの二乗平均値の和を対数化して得られた値、すなわち低域のサブバンドパワー和を、高域のサブバンドパワー和power_high(J)から減算することで得られる。つまり、特徴量power_tilt(J)は、低域と高域のサブバンドパワー和の差分を求めることで算出される。

このようにして得られた特徴量power_tilt(J)は、処理対象のフレームＪにおける低域のサブバンドパワー和に対する、推定対象となる高域のサブバンドパワー和の割合を示している。したがって、特徴量power_tilt(J)の値が大きいほど、フレームＪにおいては、低域に対する高域の相対的なパワーが大きいことになる。

区間数決定特徴量算出回路３６が算出した特徴量power_tilt(J)を擬似高域サブバンドパワー差分算出回路３７に供給すると、その後、ステップＳ１３５乃至ステップＳ１４７の処理が行なわれて符号化処理は終了する。

なお、これらの処理は図５のステップＳ１５乃至ステップＳ２７の処理と同様であるので、その説明は省略する。但しステップＳ１３９では、決定部５１は周波数形状を示す区間数決定特徴量として算出した特徴量power_tilt(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。

例えば、入力信号の処理対象のフレームが、人の声の子音部や楽器のハイハットの部分などである場合には、低域のサブバンドパワー和よりも高域のサブバンドパワー和が大きくなる。つまり、区間数決定特徴量としての特徴量power_tilt(J)の値が大きくなる。

このような入力信号のフレームでは、比較的高域の符号化による音質劣化が目立ってしまう。そこで、決定部５１は、区間数決定特徴量の代表値が大きい区間では連続フレーム区間数を多くすることで、復号側において、より原信号に近い高域サブバンド信号を推定により得られるようにする。これにより、復号により得られる音声信号の明瞭度を上げることができ、聴感上の音質を向上させることができる。

このように、周波数形状を示す区間数決定特徴量を用いた場合においても、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減し、入力信号の符号化効率を向上させることができる。

〈変形例４〉
［符号化処理の説明］
さらに、上述したサブバンドパワー和、アタック性やディケイ性を示す特徴量、周波数形状を示す特徴量などの複数の特徴量のうちの任意のものの線形和を区間数決定特徴量としてもよい。

そのような場合、符号化装置１１は、例えば図１０に示す符号化処理を行なう。以下、図１０のフローチャートを参照して、符号化装置１１による符号化処理について説明する。なお、ステップＳ１７１乃至ステップＳ１７３の処理は、図５のステップＳ１１乃至ステップＳ１３の処理と同様であるので、その説明は省略する。

ステップＳ１７４において、区間数決定特徴量算出回路３６は、サブバンド分割回路３３から供給された低域サブバンド信号と高域サブバンド信号に基づいて複数の特徴量を算出し、それらの特徴量の線形和を求めることで区間数決定特徴量を算出する。

例えば、区間数決定特徴量算出回路３６は、上述した式（１）、式（９）、式（１０）、および式（１１）を計算することで、サブバンドパワー和power_high(J)、特徴量power_attack(J)、特徴量power_decay(J)、および特徴量power_tilt(J)を算出する。

さらに、区間数決定特徴量算出回路３６は、次式（１２）を計算することで、求めたサブバンドパワー和power_high(J)や特徴量power_attack(J)などの特徴量の線形和を求め、特徴量feature(J)を算出する。

なお式（１２）において、W_high、W_attack、W_decay、およびW_tiltは、それぞれサブバンドパワー和power_high(J)、特徴量power_attack(J)、特徴量power_decay(J)、および特徴量power_tilt(J)に乗算される重みであり、例えばW_high＝１，W_attack＝３，W_decay＝３，W_tilt＝３などとされる。

このようにして得られた特徴量feature(J)の値は、高域のサブバンドパワー和が大きく、そのサブバンドパワー和の時間変動が大きいほど、また低域に対して高域のサブバンドパワーが大きいほど、大きくなる。なお、複数の特徴量の非線形和を区間数決定特徴量として算出してもよい。

区間数決定特徴量算出回路３６が区間数決定特徴量として算出した特徴量feature(J)を擬似高域サブバンドパワー差分算出回路３７に供給すると、その後、ステップＳ１７５乃至ステップＳ１８７の処理が行なわれて符号化処理は終了する。

なお、これらの処理は図５のステップＳ１５乃至ステップＳ２７の処理と同様であるので、その説明は省略する。但しステップＳ１７９では、決定部５１は特徴量feature(J)の代表値と閾値とを比較することで、処理対象区間を構成する連続フレーム区間数を決定する。

具体的には、例えば処理対象区間内の各フレームの区間数決定特徴量の最大値が代表値とされ、代表値が４６０以上である場合、連続フレーム区間数は１６とされ、代表値が３５０以上４６０未満である場合、連続フレーム区間数は８とされる。また、代表値が２４０以上３５０未満である場合、連続フレーム区間数は４とされ、代表値が１３０以上２４０未満である場合、連続フレーム区間数は２とされ、代表値が１３０未満である場合、連続フレーム区間数は１とされる。

区間数決定特徴量として特徴量feature(J)を用いる場合においても、区間数決定特徴量が大きい区間ほど連続フレーム区間数を多くすることで、復号で得られる音声の聴感上の音質を向上させるとともに出力符号列の符号量を削減することができる。これにより、入力信号の符号化効率を向上させることができる。

〈第２の実施の形態〉
［符号化処理の説明］
さらに、以上においては、処理対象区間を等しい区間長のいくつかの連続フレーム区間に分割すると説明したが、処理対象区間を構成する各連続フレーム区間が、互いに異なる長さとなるようにしてもよい。各連続フレーム区間を必要に応じて異なる長さとすれば、より適切に各フレームの係数インデックスを選択することができ、復号で得られる音声の音質をさらに向上させることができるようになる。

このように、各連続フレーム区間を必要に応じて異なる長さとする場合、符号化装置１１は図１１に示す符号化処理を行なう。以下、図１１のフローチャートを参照して、符号化装置１１による符号化処理について説明する。なお、ステップＳ２１１乃至ステップＳ２１９の処理は、図５のステップＳ１１乃至ステップＳ１９の処理と同様であるので、その説明は省略する。

ステップＳ２２０において、評価値和算出部５２は、各フレームについて係数インデックス（推定係数のセット）ごとに算出した評価値を用いて、連続フレーム区間を構成するフレームの評価値の和を係数インデックスごとに算出する。

例えば、ステップＳ２１９で決定された連続フレーム区間数がndivであるとすると、評価値和算出部５２は、処理対象区間をndiv個の任意の長さの連続フレーム区間に分割する。このとき、各連続フレーム区間は、同じ長さであってもよいし、異なる長さであってもよい。

具体的には、連続フレーム区間数ndivが３である場合、例えば図２に示した処理対象区間が、位置ＦＳＴ１から位置ＦＣ１までの区間、位置ＦＣ１から位置ＦＣ２までの区間、および位置ＦＣ２から位置ＦＳＥ１までの区間の合計３つの区間に分割される。そして、それらの３つの区間がそれぞれ連続フレーム区間とされる。

処理対象区間を連続フレーム区間に分割すると、評価値和算出部５２は上述した式（８）の計算を行なって、係数インデックスごとに連続フレーム区間を構成するフレームの評価値和Res_sum(id,igp)を算出する。

例えば、図２の位置ＦＳＴ１から位置ＦＣ１までの区間について、その区間を構成するフレームの評価値の和が係数インデックスごとに算出される。同様に、位置ＦＣ１から位置ＦＣ２までの区間、および位置ＦＣ２から位置ＦＳＥ１までの区間についても、係数インデックスごとに評価値の和が算出される。

これにより、処理対象区間を構成する各連続フレーム区間について、係数インデックスごとに連続フレーム区間の評価値和Res_sum(id,igp)が得られることになる。

評価値和算出部５２は、処理対象区間をndiv個の連続フレーム区間に分割する場合に取り得る全ての分割の組み合わせについて、係数インデックスごとに処理対象区間の各連続フレーム区間の評価値和を算出する。例えば、図２に示した例は、処理対象区間が３つの連続フレーム区間に分割される場合における、１つの分割の組み合わせを示している。

ステップＳ２２１において、選択部５３は、処理対象区間の分割の組み合わせごとに求められた、各係数インデックスの連続フレーム区間の評価値和に基づいて、各フレームの係数インデックスを選択する。

具体的には、選択部５３は、処理対象区間の分割の各組み合わせについて、その組み合わせの連続フレーム区間ごとに、係数インデックスを選択する。すなわち、選択部５３は、複数の係数インデックスのうち、連続フレーム区間について求めた評価値和が最小となる係数インデックスを、その連続フレーム区間の係数インデックスとして選択する。

さらに、選択部５３は、処理対象となっている処理対象区間の分割の組み合わせについて、各連続フレーム区間で選択された係数インデックスの評価値和の和を求める。

例えば、図２に示す例で、位置ＦＳＴ１から位置ＦＣ１までの区間、位置ＦＣ１から位置ＦＣ２までの区間、および位置ＦＣ２から位置ＦＳＥ１までの区間のそれぞれで、係数インデックス「２」、「５」、および「１」が選択されたとする。

この場合、位置ＦＳＴ１から位置ＦＣ１までの区間の係数インデックス「２」の評価値和、位置ＦＣ１から位置ＦＣ２までの区間の係数インデックス「５」の評価値和、および位置ＦＣ２から位置ＦＳＥ１までの区間の係数インデックス「１」の評価値和の和が求められる。

このようにして求められる評価値和の和は、処理対象区間の所定の分割の組み合わせについてフレームごとに係数インデックスを選択した場合における、各フレームの係数インデックスの評価値の和ということができる。したがって、評価値和の和が最小となる分割の組み合わせが、処理対象区間全体でみた場合に、各フレームで最も適切な係数インデックスが選択される組み合わせとなる。

選択部５３は、処理対象区間の分割の組み合わせごとに評価値和の和を求めると、それらの評価値和の和が最小となる組み合わせを特定する。そして、選択部５３は、特定された組み合わせの各連続フレーム区間を最終的な連続フレーム区間とするとともに、それらの連続フレーム区間で選択された係数インデックスを、連続フレーム区間を構成する各フレームの最終的な係数インデックスとして選択する。

このようにして連続フレーム区間ごとに、連続フレーム区間を構成するフレームの係数インデックスが選択されると、その後、ステップＳ２２２乃至ステップＳ２２７の処理が行なわれて符号化処理は終了する。なお、これらの処理は図５のステップＳ２２乃至ステップＳ２７の処理と同様であるので、その説明は省略する。

以上のように、符号化装置１１は区間数決定特徴量を算出し、区間数決定特徴量から連続フレーム区間数を定めるとともに、連続フレーム区間の組み合わせごとに連続フレーム区間の評価値和の和を算出し、評価値和の和から各フレームの係数インデックスを選択する。

このように連続フレーム区間の組み合わせごとに連続フレーム区間の評価値和の和を算出し、最適な連続フレーム区間の組み合わせと、各連続フレーム区間の係数インデックスとを定めることで、復号時により高精度に高域成分を推定することができるようになる。これにより、復号で得られる音声の聴感上の音質を向上させるとともに、出力符号列の符号量を削減することができ、入力信号の符号化効率を向上させることができる。

なお、図１１のステップＳ２１４において、サブバンドパワー和power_high(J)が区間数決定特徴量として算出される場合について説明したが、他の特徴量が区間数決定特徴量として算出されるようにしてもよい。例えば、上述した特徴量power_attack(J)、特徴量power_decay(J)、特徴量power_tilt(J)、特徴量feature(J)などが区間数決定特徴量として求められるようにしてもよい。

〈第３の実施の形態〉
［符号化装置の構成例］
また、本技術は、入力信号の高域符号化データの符号量を考慮して低域成分を符号化する場合に適用すると、より簡単かつ迅速に符号化を行なうことができる。低域成分の符号化時に高域符号化データの符号量が考慮される場合、符号化装置は例えば図１２に示すように構成される。

図１２の符号化装置１３１は、音声信号である入力信号を、例えば１６フレームなどの複数フレームからなる処理対象区間を単位として符号化し、その結果得られた出力符号列を出力するものである。また、以下では、符号化装置１３１が可変長方式で高域符号化データを生成する場合を例として説明する。但し、符号化装置１３１では、可変長方式と固定長方式の切り替えは行なわれないので、高域符号化データには、方式フラグは含まれないものとする。

符号化装置１３１は、サブバンド分割回路１４１、高域符号量算出回路１４２、低域通過フィルタ１４３、低域符号化回路１４４、低域復号回路１４５、サブバンド分割回路１４６、遅延回路１４７、遅延回路１４８、遅延回路１４９、高域符号化回路１５０、符号量調整回路１５１、符号量一時蓄積回路１５２、遅延回路１５３、および多重化回路１５４から構成される。

サブバンド分割回路１４１は、入力信号を複数のサブバンド信号に分割し、得られた低域サブバンド信号を高域符号量算出回路１４２へ供給するとともに、高域サブバンド信号を高域符号量算出回路１４２、および遅延回路１４９に供給する。

高域符号量算出回路１４２は、サブバンド分割回路１４１から供給された低域サブバンド信号および高域サブバンド信号に基づいて、入力信号の高域成分を符号化して得られる高域符号化データの符号量（以下、高域符号量と称する）を算出する。

高域符号量算出回路１４２は、特徴量算出部１６１を備えており、特徴量算出部１６１は、低域サブバンド信号または高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する。また、高域符号量算出回路１４２は、区間数決定特徴量に基づいて処理対象区間の連続フレーム区間数を決定するとともに、連続フレーム区間数から高域符号量を算出する。

高域符号量算出回路１４２は、連続フレーム区間数を遅延回路１４８に供給するとともに、高域符号量を低域符号化回路１４４、および遅延回路１４８に供給する。

低域通過フィルタ１４３は、供給された入力信号をフィルタリングして、その結果得られた、入力信号の低域成分である低域信号を低域符号化回路１４４に供給する。

低域符号化回路１４４は、低域信号を符号化して得られる低域符号化データの符号量が、入力信号の処理対象区間で使用可能な符号量から、高域符号量算出回路１４２から供給された高域符号量を減じた符号量以下となるように、低域通過フィルタ１４３からの低域信号を符号化する。低域符号化回路１４４は、低域信号の符号化により得られた低域符号化データを低域復号回路１４５、および遅延回路１５３に供給する。

低域復号回路１４５は、低域符号化回路１４４から供給された低域符号化データの復号を行い、その結果得られた復号低域信号をサブバンド分割回路１４６に供給する。サブバンド分割回路１４６は、低域復号回路１４５から供給された復号低域信号を、低域側の複数のサブバンドのサブバンド信号（以下、復号低域サブバンド信号と称する）に分割し、遅延回路１４７に供給する。ここで、復号低域サブバンド信号のサブバンドのそれぞれは、低域サブバンド信号のサブバンドのそれぞれと同じ周波数帯域とされる。

遅延回路１４７は、サブバンド分割回路１４６からの復号低域サブバンド信号を遅延させ、高域符号化回路１５０に供給する。遅延回路１４８は、高域符号量算出回路１４２からの高域符号量および連続フレーム区間数を一定期間だけ遅延させ、高域符号化回路１５０に供給する。遅延回路１４９は、サブバンド分割回路１４１からの高域サブバンド信号を遅延させ、高域符号化回路１５０に供給する。

高域符号化回路１５０は、遅延回路１４７からの復号低域サブバンド信号から得られる特徴量と、遅延回路１４８からの連続フレーム区間数とに基づいて、遅延回路１４８からの高域符号量以下の符号量となるように、遅延回路１４９からの高域サブバンド信号のパワーを推定により得るための情報を符号化する。

高域符号化回路１５０は、算出部１６２および選択部１６３を備えている。算出部１６２は、推定係数を示す係数インデックスごとに高域側の各サブバンドの評価値を算出し、選択部１６３は、算出部１６２により算出された評価値に基づいて、各フレームの係数インデックスを選択する。

また、高域符号化回路１５０は、係数インデックスを含むデータを符号化して得られた高域符号化データを多重化回路１５４に供給するとともに、高域符号化データの高域符号量を、符号量調整回路１５１に供給する。

符号量調整回路１５１は、高域符号化回路１５０で得られた実際の高域符号量が、遅延回路１４８を通して得られる高域符号量算出回路１４２の高域符号量未満であった場合、その剰余符号量を符号量一時蓄積回路１５２に供給する。符号量一時蓄積回路１５２は、剰余符号量の蓄積を行なう。この剰余符号量は、次回以降の処理対象区間で適宜使用される。

遅延回路１５３は、低域符号化回路１４４で得られた低域符号化データを一定期間だけ遅延させ、多重化回路１５４に供給する。多重化回路１５４は、遅延回路１５３からの低域符号化データと、高域符号化回路１５０からの高域符号化データを多重化し、その結果得られた出力符号列を出力する。

［符号化処理の説明］
次に、符号化装置１３１の動作について説明する。符号化装置１３１に入力信号が供給され、入力信号の符号化が指示されると、符号化装置１３１は符号化処理を行って、入力信号を符号化する。

以下、図１３のフローチャートを参照して、符号化装置１３１による符号化処理について説明する。なお、この符号化処理は、入力信号の処理対象区間（例えば、１６フレーム）を単位として行なわれる。

ステップＳ２５１において、サブバンド分割回路１４１は、供給された入力信号を、所定の帯域幅を持つ複数のサブバンド信号に等分割する。ここで得られたサブバンド信号のうちの低域側の特定の範囲のサブバンド信号が低域サブバンド信号とされ、高域側の特定の範囲のサブバンド信号が高域サブバンド信号とされる。

サブバンド分割回路１４１は、サブバンド分割により得られた低域サブバンド信号を高域符号量算出回路１４２に供給し、高域サブバンド信号を高域符号量算出回路１４２および遅延回路１４９に供給する。

例えば、高域サブバンド信号のサブバンドの範囲は、入力信号の性質やビットレートなどに応じて符号化装置１３１側で設定される。また、低域サブバンド信号のサブバンド範囲は、高域サブバンド信号のサブバンドの最低域のサブバンドよりも、１つ低域側のサブバンドを低域サブバンド信号の最高域のサブバンドとした、所定数のサブバンドからなる周波数帯域とされる。

なお、低域サブバンド信号と高域サブバンド信号のサブバンドの範囲は、符号化装置１３１と、復号装置側とで同一の範囲とされる。

ステップＳ２５２において、高域符号量算出回路１４２の特徴量算出部１６１は、サブバンド分割回路１４１から供給された低域サブバンド信号または高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する。

例えば、特徴量算出部１６１は、上述した式（９）の演算を行なって、高域のアタック性を示す特徴量power_attack(J)を区間数決定特徴量として算出する。区間数決定特徴量は、処理対象区間を構成するフレームごとに算出される。

なお、区間数決定特徴量として、上述したサブバンドパワー和power_high(J)、特徴量power_decay(J)、特徴量power_tilt(J)、特徴量feature(J)や、複数の特徴量の非線形和などが算出されるようにしてもよい。

ステップＳ２５３において、高域符号量算出回路１４２は、処理対象区間の各フレームの区間数決定特徴量に基づいて、連続フレーム区間数を決定する。

例えば、高域符号量算出回路１４２は、処理対象区間の各フレームの区間数決定特徴量のうちの最大値を、区間数決定特徴量の代表値とし、代表値と予め定めた閾値とを比較することで、連続フレーム区間数を決定する。

具体的には、例えば代表値が４０以上である場合、連続フレーム区間数は１６とされ、代表値が３０以上４０未満である場合、連続フレーム区間数は８とされる。また、代表値が２０以上３０未満である場合、連続フレーム区間数は４とされ、代表値が１０以上２０未満である場合、連続フレーム区間数は２とされ、代表値が１０未満である場合、連続フレーム区間数は１とされる。

ステップＳ２５４において、高域符号量算出回路１４２は決定した連続フレーム区間数に基づいて、高域符号化データの高域符号量を算出する。

符号化装置１３１では、可変長方式で高域符号化データが生成されるので、高域符号化データには、個数情報、区間情報、および係数インデックスが含まれることになる。

現時点において、処理対象区間を構成する連続フレーム区間数が決定されているので、連続フレーム区間数がnDivであるとすると、高域符号化データには、１つの個数情報、（nDiv-1）個の区間情報、およびnDiv個の係数インデックスが含まれることになる。

なお、区間情報が（nDiv-1）個とされるのは、処理対象区間の長さは予め定められており、（nDiv-1）個の連続フレーム区間の長さが分かれば、残りの１つの連続フレーム区間の長さを特定することができるからである。

以上のことから高域符号化データの符号量は、（個数情報の記述に必要なビット数）+（nDiv-1）×（１つの区間情報の記述に必要なビット数）+（nDiv）×（１つの係数インデックスの記述に必要なビット数）により求めることができる。

このように、符号化装置１３１では、実際に入力信号の高域成分を符号化しなくても、少ない演算量で高域符号化データの高域符号量を求めることができるので、より迅速に低域成分の符号化を開始することができる。

すなわち、従来の処理では、高域符号化データに必要な符号量を決定するときに、入力信号の低域サブバンドパワーと高域サブバンドパワーを算出してフレームごとに係数インデックスを選択しなければ、必要となる符号量を求めることができなかった。これに対して、符号化装置１３１では、区間数決定特徴量を算出するだけでよいので、より少ない演算で迅速に高域符号量を決定することができる。

なお、ステップＳ２５４では、可変長方式により高域符号化データが生成される場合を例として説明したが、高域符号化データが固定長方式で生成される場合でも、連続フレーム区間数に基づいて高域符号量を算出することができる。

固定長方式で高域符号化データが生成される場合、高域符号化データには、固定長インデックス、切り替わりフラグ、および係数インデックスが含まれることになる。

この場合、図３から分かるように高域符号化データには、１つの固定長インデックス、（nDiv-1）個の切り替わりフラグ、およびnDiv個の係数インデックスが含まれることになる。したがって、高域符号化データの符号量は、（固定長インデックスの記述に必要なビット数）+（nDiv-1）×（１つの切り替わりフラグの記述に必要なビット数）+（nDiv）×（１つの係数インデックスの記述に必要なビット数）により求めることができる。

高域符号量算出回路１４２は、高域符号量を算出すると、算出した高域符号量を低域符号化回路１４４および遅延回路１４８に供給するとともに、連続フレーム区間数を遅延回路１４８に供給する。

ステップＳ２５５において、低域通過フィルタ１４３は、供給された入力信号を低域通過フィルタでフィルタリングし、その結果得られた低域信号を低域符号化回路１４４に供給する。このフィルタ処理に用いる低域通過フィルタの遮断周波数としては、任意の周波数を設定することが可能であるが、本実施の形態では、上述の低域サブバンド信号の上端の周波数に対応して遮断周波数が設定される。

ステップＳ２５６において、低域符号化回路１４４は、低域符号化データの符号量が低域符号量以下の符号量となるように、低域通過フィルタ１４３からの低域信号を符号化し、その結果得られた低域符号化データを、低域復号回路１４５および遅延回路１５３に供給する。

ここで、低域符号量とは、低域符号化データの目標とする符号量である。低域符号化回路１４４は、予め定められた処理対象区間全体で使用可能な符号量から、高域符号量算出回路１４２から供給された高域符号量を減じ、さらに符号量一時蓄積回路１５２に蓄積されている剰余符号量を加算することで低域符号量を算出する。

低域符号化回路１４４は、実際に低域信号を符号化して得られた低域符号化データの符号量が、低域符号量未満であった場合、低域符号化データの実際の符号量と低域符号量とを符号量調整回路１５１に供給する。

そして、符号量調整回路１５１は、低域符号化回路１４４から供給された低域符号量から、低域符号化データの実際の符号量を減じて得られる符号量を符号量一時蓄積回路１５２に供給して、剰余符号量に加算させる。これにより、符号量一時蓄積回路１５２に記録されている剰余符号量が更新される。

これに対して、低域符号化データの実際の符号量と低域符号量が一致する場合、符号量調整回路１５１は、剰余符号量の増加分を０として符号量一時蓄積回路１５２に剰余符号量の更新を行なわせる。

ステップＳ２５７において、低域復号回路１４５は、低域符号化回路１４４から供給された低域符号化データの復号を行い、これにより得られた復号低域信号をサブバンド分割回路１４６に供給する。なお、符号化装置１３１では、低域信号の符号化および復号を行う符号化方式は様々な方式をとることができ、例えば、ACELP（Algebraic Code Excited Linear Prediction）や、AAC（Advanced Audio Coding）などを採用することができる。

ステップＳ２５８において、サブバンド分割回路１４６は、低域復号回路１４５から供給された復号低域信号を複数のサブバンドの復号低域サブバンド信号に分割し、遅延回路１４７に供給する。このサブバンド分割における、各サブバンドの下端及び上端の周波数は、ステップＳ２５１においてサブバンド分割回路１４１が行うサブバンド分割と同一とされる。つまり、復号低域サブバンド信号の各サブバンドは、低域サブバンド信号の各サブバンドと同じ周波数帯域とされる。

ステップＳ２５９において、遅延回路１４７は、サブバンド分割回路１４６から供給された復号低域サブバンド信号を特定の時間サンプルだけ遅延させ、高域符号化回路１５０に供給する。また、遅延回路１４８および遅延回路１４９も、連続フレーム区間数と高域符号量、および高域サブバンド信号を遅延させ、高域符号化回路１５０に供給する。

遅延回路１４７や遅延回路１４８での遅延量は、高域サブバンド信号、高域符号量、および復号低域サブバンド信号の同期をとるためのものであり、低域、高域それぞれの符号化方式によって、適切な値を設定する必要がある。当然、符号化方式の構成によっては、各遅延回路の遅延量が０である場合もあり得る。なお、遅延回路１５３の機能は、遅延回路１４７が果たす機能と同等であるので、ここではその説明を省略する。

ステップＳ２６０において、高域符号化回路１５０は、遅延回路１４７からの復号低域サブバンド信号、遅延回路１４８からの連続フレーム区間数、および遅延回路１４９からの高域サブバンド信号に基づいて、遅延回路１４８からの高域符号量以下の符号量となるように、入力信号の高域成分を符号化する。

例えば、算出部１６２は、復号低域サブバンド信号に基づいて上述した式（２）と同様の演算を行い、低域の各サブバンドの低域サブバンドパワーpower(ib,J)を算出するとともに、同様の演算を行なって、高域サブバンド信号から高域の各サブバンドの高域サブバンドパワーを算出する。また、算出部１６２は、低域サブバンドパワーと、予め記録している推定係数のセットとに基づいて式（３）の演算を行ない、高域の各サブバンドの擬似高域サブバンドパワーを算出する。

算出部１６２は、高域サブバンドパワーと擬似高域サブバンドパワーとに基づいて、上述した式（４）乃至式（７）の演算を行い、各フレームの評価値Res（id,J）を算出する。なお、評価値Res（id,J）の算出は、低域サブバンドパワーの計算に用いられる推定係数のセットを示す係数インデックスごとに行なわれる。

さらに、算出部１６２は、処理対象区間を連続フレーム区間数により示される数の区間に等分し、分割された各区間を連続フレーム区間とする。算出部１６２は、各フレームについて係数インデックスごとに算出した評価値を用いて上述した式（８）を計算し、係数インデックスごとに評価値和Res_sum(id,igp)を算出する。

また、選択部１６３は、各連続フレーム区間について係数インデックスごとに求められた評価値和に基づいて、図５のステップＳ２１と同様の処理を行い、各フレームの係数インデックスを選択する。すなわち、連続フレーム区間について求めた評価値和Res_sum(id,igp)が最小となる係数インデックスが、その連続フレーム区間を構成する各フレームの係数インデックスとして選択される。

なお、互いに隣接する連続フレーム区間で同じ係数インデックスが選択されることがあるので、そのような場合には、同じ係数インデックスが選択された連続して並ぶ連続フレーム区間が、最終的な１つの連続フレーム区間とされる。

各フレームの係数インデックスが選択されると、高域符号化回路１５０は、図５のステップＳ２５およびステップＳ２６と同様の処理を行なって、区間情報、個数情報、および係数インデックスからなるデータを生成して符号化し、高域符号化データを生成する。

以上のようにして得られた高域符号化データの符号量は、必ず高域符号量以下となる。例えば、連続して並ぶ連続フレーム区間で同じ係数インデックスが選択された場合、最終的な連続フレーム区間の数は、高域符号量算出回路１４２で得られた連続フレーム区間数未満となる。この場合、高域符号化データに含まれる係数インデックスの数が、高域符号量算出回路１４２で得られた連続フレーム区間数未満となるだけでなく、区間情報の数も少なくなる。

したがって、このような場合には、実際の高域符号化データの符号量は、高域符号量算出回路１４２で得られた高域符号量未満となる。

これに対して、連続して並ぶ連続フレーム区間で同じ係数インデックスが選択されなかった場合には、連続フレーム区間の数は、高域符号量算出回路１４２で得られた連続フレーム区間数と一致するので、実際の高域符号化データの符号量も高域符号量と一致する。

なお、ステップＳ２６０においては、処理対象区間が等分割されて連続フレーム区間とされる場合について説明したが、処理対象区間が任意の長さの連続フレーム区間に分割されるようにしてもよい。

そのような場合、ステップＳ２６０では、各フレームの評価値Res（id,J）が算出された後、図１１のステップＳ２２０およびステップＳ２２１と同様の処理が行なわれて、各フレームの係数インデックスが選択される。そして、その後、選択された係数インデックスを、固定長インデックス、および切り替わりフラグからなるデータが符号化されて高域符号化データが生成される。

ステップＳ２６１において、高域符号化回路１５０は、符号化により得られた高域符号化データの符号量が、ステップＳ２５４で算出された高域符号量未満であるか否かを判定する。

ステップＳ２６１において、高域符号量未満でないと判定された場合、つまり高域符号化データの符号量が高域符号量と一致する場合、符号の剰余は発生しないので、処理はステップＳ２６５に進む。このとき、高域符号化回路１５０は、高域の符号化により得られた高域符号化データを多重化回路１５４に供給する。

これに対して、ステップＳ２６１において、高域符号量未満であると判定された場合、ステップＳ２６２において、符号量調整回路１５１は、高域符号化データの符号量と、高域符号量との差分の符号量一時蓄積回路１５２への蓄積を行なう。すなわち、高域符号化データの符号量と高域符号量の差の分の符号量が、符号量一時蓄積回路１５２に蓄積されている剰余符号量に加算されていき、剰余符号量が更新される。このような符号量一時蓄積回路１５２は、AACにおいてもビットリゾルバという名称で使われており、処理フレーム間での符号量の調整が行なわれる。

ステップＳ２６３において、符号量調整回路１５１は、符号量一時蓄積回路１５２に蓄積している剰余符号量が予め定められた上限に達したか否かを判定する。

例えば、符号量一時蓄積回路１５２では、剰余符号量とすることの可能な符号量の上限（以下、上限符号量と称する）が予め定められている。符号量調整回路１５１は、ステップＳ２６２で開始した、高域符号化データの符号量と高域符号量の差分の符号量一時蓄積回路１５２への蓄積時に、剰余符号量が上限符号量に達した場合、ステップＳ２６３において剰余符号量が上限に達したと判定する。

ステップＳ２６３において、剰余符号量が上限に達していないと判定された場合、高域符号化データの符号量と、高域符号量の差分が、全て剰余符号量に加算され、剰余符号量が更新される。そして、その後、高域符号化回路１５０は、高域の符号化により得られた高域符号化データを多重化回路１５４に供給し、処理はステップＳ２６５に進む。

一方、ステップＳ２６３において、剰余符号量が上限に達したと判定された場合、ステップＳ２６４において、高域符号化回路１５０は、高域符号化データに対するゼロ詰めを行なう。

高域符号化データの符号量と、高域符号量との差分を剰余符号量に加算していくときに、剰余符号量が上限符号量に達した場合、高域符号化データの符号量と、高域符号量との差分のうち、まだ剰余符号量への加算が行なわれていない未処理の符号量が余ることになる。この未処理の符号量は、剰余符号量に加算することはできないので、高域符号化回路１５０は、この未処理の符号量の分だけ、高域符号化データの最後尾に符号「０」を付加し、未処理の符号量を見かけ上、高域符号化データの生成に用いたこととする。なお、復号時においては、高域符号化データの最後尾に付加された符号「０」は、入力信号の復号には用いられない。

高域符号化回路１５０は、高域符号化データの最後尾に符号「０」を付加するゼロ詰めを行なうと、ゼロ詰め後の高域符号化データを多重化回路１５４に供給し、処理はステップＳ２６５に進む。

ステップＳ２６１において高域符号量未満でないと判定されたか、ステップＳ２６３において剰余符号量が上限に達していないと判定されたか、またはステップＳ２６４においてゼロ詰めが行なわれると、ステップＳ２６５の処理が行われる。

すなわち、ステップＳ２６５において、多重化回路１５４は、遅延回路１５３からの低域符号化データと、高域符号化回路１５０からの高域符号化データとを多重化して出力符号列を生成し、出力符号列を出力する。このとき、多重化回路１５４は、低域符号化データや高域符号化データとともに、入力信号の低域側の上端と下端のサブバンドを示すインデックスも多重化する。このようにして出力符号列が出力されると、符号化処理は終了する。

以上のように、符号化装置１３１は、高域および低域のサブバンド信号から連続フレーム区間数を算出して高域符号量を算出し、この高域符号量から定まる符号量で低域信号を符号化するとともに、低域符号化データを復号して得られた復号低域信号や高域符号量に基づいて、高域成分の符号化を行なう。

このように、連続フレーム区間数から高域符号量を算出することで、高域成分の符号化を行なうことなく高域の符号化に必要な符号量を算出することができる。したがって、従来の手法と比べて、各フレームの係数インデックスを選択するために必要となる演算の分だけ、高域符号量の算出時の演算量を削減することができる。また、入力信号の特性を考慮して、従来よりも適切に高域符号化データのビット使用量（符号量）を定めることができる。

さらに、以上において説明した符号化技術は、例えば音声符号化方式の１つであるAC-3（ATSC A/52 “Digital Audio Compression Standard(AC-3)”）などにも適用することができる。

AC-3では、音声信号の１フレームが複数のブロックで構成されており、各ブロックで１つ前のブロックにおける、周波数変換後の係数の浮動小数表現における指数部の値をそのまま使うか否かの情報がビットストリームに含まれる。

ここで、１フレーム内で同じ指数部の値を共有する連続するブロックの集合を、連続ブロック区間と呼ぶこととする。一般的なAC-3方式の符号化装置では、フレーム内において符号化対象となる入力信号が定常的、つまり時間変動が少ない場合には、１フレーム内での連続ブロック区間の数は多く構成される。

このような連続ブロック区間数を、以上において説明した本技術を適用して、適切に決定することで、必要最小限の連続ブロック区間、すなわち必要最小限のビット使用量で効率的に符号化を行なうことができるようになる。

なお、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。

図１４は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

コンピュータにおいて、CPU（Central Processing Unit）３０１，ROM（Read Only Memory）３０２，RAM（Random Access Memory）３０３は、バス３０４により相互に接続されている。

バス３０４には、さらに、入出力インターフェース３０５が接続されている。入出力インターフェース３０５には、キーボード、マウス、マイクロホンなどよりなる入力部３０６、ディスプレイ、スピーカなどよりなる出力部３０７、ハードディスクや不揮発性のメモリなどよりなる記録部３０８、ネットワークインターフェースなどよりなる通信部３０９、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア３１１を駆動するドライブ３１０が接続されている。

以上のように構成されるコンピュータでは、CPU３０１が、例えば、記録部３０８に記録されているプログラムを、入出力インターフェース３０５及びバス３０４を介して、RAM３０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU３０１）が実行するプログラムは、例えば、磁気ディスク（フレキシブルディスクを含む）、光ディスク（CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)等）、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア３１１に記録して、あるいは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供される。

そして、プログラムは、リムーバブルメディア３１１をドライブ３１０に装着することにより、入出力インターフェース３０５を介して、記録部３０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部３０９で受信し、記録部３０８にインストールすることができる。その他、プログラムは、ROM３０２や記録部３０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

さらに、本技術は、以下の構成とすることも可能である。

［１］
入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、
前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、
前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、
決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、
前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、
前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
を備える符号化装置。
［２］
前記区間数決定特徴量は、前記高域サブバンドパワーの和を示す特徴量である
［１］に記載の符号化装置。
［３］
前記区間数決定特徴量は、前記高域サブバンドパワーの和の時間変動を示す特徴量である
［１］に記載の符号化装置。
［４］
前記区間数決定特徴量は、前記入力信号の周波数形状を示す特徴量である
［１］に記載の符号化装置。
［５］
前記区間数決定特徴量は、複数の特徴量の線形和または非線形和である
［１］に記載の符号化装置。
［６］
前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに備え、
前記選択部は、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択する
［１］乃至［５］の何れかに記載の符号化装置。
［７］
決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間が、前記連続フレーム区間とされる
［６］に記載の符号化装置。
［８］
前記選択部は、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択するとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定し、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とする
［６］に記載の符号化装置。
［９］
前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
［１］乃至［８］の何れかに記載の符号化装置。
［１０］
前記決定部は、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出し、
前記低域符号化部は、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化する
［９］に記載の符号化装置。

１１符号化装置，３２低域符号化回路，３３サブバンド分割回路，３４特徴量算出回路，３５擬似高域サブバンドパワー算出回路，３６区間数決定特徴量算出回路，３７擬似高域サブバンドパワー差分算出回路，３８高域符号化回路，３９多重化回路，５１決定部，５２評価値算出部，５３選択部，５４生成部

Claims

入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成するサブバンド分割部と、
前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出する擬似高域サブバンドパワー算出部と、
前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出する特徴量算出部と、
前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定する決定部と、
決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択する選択部と、
前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成する生成部と、
前記入力信号の低域信号を符号化して低域符号化データを生成する低域符号化部と、
前記データと前記低域符号化データとを多重化して出力符号列を生成する多重化部と
を備える符号化装置。
前記区間数決定特徴量は、前記高域サブバンドパワーの和を示す特徴量である
請求項１に記載の符号化装置。
前記区間数決定特徴量は、前記高域サブバンドパワーの和の時間変動を示す特徴量である
請求項１に記載の符号化装置。
前記区間数決定特徴量は、前記入力信号の周波数形状を示す特徴量である
請求項１に記載の符号化装置。
前記区間数決定特徴量は、複数の特徴量の線形和または非線形和である
請求項１に記載の符号化装置。
前記推定係数ごとに算出された、前記フレームにおける前記擬似高域サブバンドパワーと前記高域サブバンドパワーの誤差を示す評価値に基づいて、前記推定係数ごとに、前記連続フレーム区間を構成する各フレームの前記評価値の和を算出する評価値和算出部をさらに備え、
前記選択部は、前記推定係数ごとに算出された前記評価値の和に基づいて、前記連続フレーム区間のフレームの前記推定係数を選択する
請求項１に記載の符号化装置。
決定された前記連続フレーム区間の数に前記処理対象区間を等分割して得られた各区間が、前記連続フレーム区間とされる
請求項６に記載の符号化装置。
前記選択部は、決定された前記連続フレーム区間の数に前記処理対象区間を分割するときに取り得る前記処理対象区間の分割の組み合わせごとに、前記評価値の和に基づいて前記連続フレーム区間のフレームの前記推定係数を選択するとともに、各前記組み合わせのうち、前記処理対象区間を構成する全ての前記フレームの選択された前記推定係数の前記評価値の和が最小となる前記組み合わせを特定し、特定された前記組み合わせにおいて、各フレームで選択された前記推定係数を、それらのフレームの前記推定係数とする
請求項６に記載の符号化装置。
前記データを符号化して高域符号化データを生成する高域符号化部をさらに備え、
前記多重化部は、前記高域符号化データと前記低域符号化データとを多重化して前記出力符号列を生成する
請求項１に記載の符号化装置。
前記決定部は、決定された前記連続フレーム区間の数に基づいて、前記処理対象区間の前記高域符号化データの符号量をさらに算出し、
前記低域符号化部は、前記処理対象区間に対して予め定められた符号量と、算出された前記高域符号化データの符号量とから定まる符号量で前記低域信号を符号化する
請求項９に記載の符号化装置。
入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、
前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、
前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、
決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、
前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、
前記入力信号の低域信号を符号化して低域符号化データを生成し、
前記データと前記低域符号化データとを多重化して出力符号列を生成する
ステップを含む符号化方法。
入力信号の低域側のサブバンドの低域サブバンド信号と、前記入力信号の高域側のサブバンドの高域サブバンド信号とを生成し、
前記低域サブバンド信号と所定の推定係数とに基づいて、前記高域サブバンド信号の高域サブバンドパワーの推定値である擬似高域サブバンドパワーを算出し、
前記低域サブバンド信号または前記高域サブバンド信号の少なくとも何れかに基づいて、区間数決定特徴量を算出し、
前記区間数決定特徴量に基づいて、前記入力信号の複数フレームからなる処理対象区間における、同じ前記推定係数が選択されたフレームからなる連続フレーム区間の数を決定し、
決定された前記連続フレーム区間の数に基づいて前記処理対象区間を分割して得られる各前記連続フレーム区間について、前記擬似高域サブバンドパワーと前記高域サブバンドパワーに基づいて、複数の前記推定係数のなかから前記連続フレーム区間を構成するフレームの前記推定係数を選択し、
前記処理対象区間を構成する各前記連続フレーム区間のフレームで選択された前記推定係数を得るためのデータを生成し、
前記入力信号の低域信号を符号化して低域符号化データを生成し、
前記データと前記低域符号化データとを多重化して出力符号列を生成する
ステップを含む処理をコンピュータに実行させるプログラム。