WO2012005212A1

WO2012005212A1 - 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体

Info

Publication number: WO2012005212A1
Application number: PCT/JP2011/065276
Authority: WO
Inventors: 勝宏福井; 茂明佐々木; 祐介日和▲崎▼; 翔一小山; 公孝堤
Original assignee: 日本電信電話株式会社
Priority date: 2010-07-05
Filing date: 2011-07-04
Publication date: 2012-01-12
Also published as: US8711012B2; JP5337305B2; EP2573766B1; ES2536902T3; EP2573766A4; JPWO2012005212A1; CN102959623B; EP2573766A1; CN102959623A; CA2803276A1; US20130106626A1

Abstract

　複数のサンプルをベクトル量子化してベクトル量子化インデックスと量子化値を求め、ベクトル量子化インデックスに対応する符号用に割り当てられたビット数からベクトル量子化インデックスに対応する符号に用いられたビット数を減算して得られる数以下のビット数を、それぞれが複数のサンプル位置からなり聴覚特性に基づく優先順位が与えられた複数のサンプル位置集合のうちの１個以上のサンプル位置集合に、聴覚特性に基づく所定の優先順位に従って割り当て、ビット数が割り当てられたサンプル位置集合それぞれについて、該サンプル位置集合に属するサンプルの値と、該サンプル位置集合に属するサンプルの量子化値とサンプルそれぞれの位置に対応する係数とを乗算した値との間の誤差の該サンプル位置集合に属する全サンプル位置についての和を最小にする係数の組を表すインデックス情報を出力する。

Description

符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体

　この発明は、例えば音声や音楽などの音響、映像等の信号系列をベクトル量子化により符号化又は復号する技術に関する。

　特許文献１に記載された符号化装置では、入力信号はまず正規化値で割算され正規化される。正規化値は量子化され、量子化インデックスが生成される。正規化された入力信号はベクトル量子化され、量子化代表ベクトルのインデックスが生成される。生成された量子化インデックス及び量子化代表ベクトルは、復号装置に出力される。復号装置では、量子化インデックスが復号され正規化値が生成される。また、量子化代表ベクトルのインデックスが復号されてサンプル列が生成される。生成されたサンプル列のそれぞれのサンプルに正規化値を乗算して得られた値の列が復号信号サンプル列となる。

　一方、量子化ノイズの少ない高能率なベクトル量子化手法として、例えばＳＶＱ法（Spherical Vector Quantization、例えば非特許文献１参照）など、予め設定された量子化ビット数の範囲内で、複数の入力信号をまとめて量子化するベクトル量子化手法が広く利用されている。

　ＳＶＱ法では、量子化正規化値を用いてＭＤＣＴ（Modified Discrete Cosine Transform）係数などの入力信号の各サンプルが正規化され、正規化された各サンプルがサブバンドごとにまとめて量子化される。この際、サブバンド毎の聴覚的重要度に応じ、各サブバンドに対応する符号のビット数（量子化ビット数）が動的に割り当てられる。またＳＶＱ法では、入力信号のスパース性が仮定され、入力信号の主要成分が優先的に量子化される。そのため、高調波や母音のように周波数領域でのエネルギーがまばらにしか存在しない入力信号（スパース信号）を高精度に量子化できる。

　しかしながら、多くの周波数にエネルギーが分布する入力信号の各サンプルをＳＶＱ法で量子化した場合、入力信号に存在するはずの周波数成分が量子化値から復元された復号信号には存在しない（復号信号から周波数成分が欠損する）頻度が高くなる。このように復号信号から周波数成分が欠損した場合、復号信号の或る周波数成分の有無が時間的に不連続に変化する頻度が高くなる。人間は、このような周波数成分の有無の時間的に不連続な変化に敏感である。入力信号が例えば音響信号である場合、このような変化はミュージカルノイズと呼ばれるノイズとして知覚される場合がある。また、入力信号が映像信号である場合には、音響信号でいうところのミュージカルノイズに相当するような、ブロックノイズが発生する場合がある。以下、ミュージカルノイズ及びブロックノイズを総称して「ミュージカルノイズ等」と呼ぶ。

　これに対し、ＳＶＱ法と比べ、復号信号から周波数成分が欠損する頻度が比較的低いＡＶＱ法（Algebraic Vector Quantization、例えば非特許文献２参照）というベクトル量子化手法がある。ＡＶＱ法はＳＶＱ法と同様に信号のスパース性を仮定した手法であるが、ＳＶＱ法よりも多くの周波数成分を復元可能な量子化値を得ることができる。

特開平７－２６１８００

Recommendation ITU-T G.729.1, SERIES G: TRANSMISSION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS, Digital terminal equipments - Coding of analogue signals by methods other than PCM, G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729. Recommendation ITU-T G.718, SERIES G: TRANSMISSION SYSTEMS AND MEDIA, DIGITAL SYSTEMS AND NETWORKS, Digital terminal equipments - Coding of voice and audio signals, Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s.

　しかしながら、ＡＶＱ法の振幅の量子化精度はＳＶＱ法と比べて荒い。たとえ復号信号から周波数成分が欠損する頻度が低くても振幅の量子化精度が荒ければ、ミュージカルノイズ等が発生する。このような問題はＡＶＱ法に限られるものではなく、量子化精度に基づいてミュージカルノイズ等が発生する場合に共通する。また、このような問題は入力信号が周波数領域の信号である場合だけではなく、入力信号が時間領域の信号である場合にも生じ得る。

　本発明では、量子化精度に基づいて発生するミュージカルノイズ等を低減する技術が提供される。

　符号化時に、複数のサンプルをまとめてベクトル量子化してベクトル量子化インデックスと複数のサンプルそれぞれの量子化値を求め、ベクトル量子化インデックスに対応する符号用に割り当てられたビット数からベクトル量子化インデックスに対応する符号に用いられたビット数を減算して得られる数以下のビット数を、それぞれが複数のサンプル位置からなり聴覚特性に基づく優先順位が与えられた複数のサンプル位置集合のうちの１個以上のサンプル位置集合に、聴覚特性に基づく所定の優先順位に従って割り当て、ビット数が割り当てられたサンプル位置集合それぞれについて、複数組の、サンプルそれぞれの位置に対応する予め定めた係数による組のうち、該サンプル位置集合に属するサンプルの値と、該サンプル位置集合に属するサンプルの量子化値とサンプルそれぞれの位置に対応する係数とを乗算した値との間の誤差の該サンプル位置集合に属する全サンプル位置についての和を最小にする係数の組を表すインデックス情報を出力する。
　復号時に、入力されたベクトル量子化インデックスに対応する複数の値を複数のサンプル位置それぞれに対応する復号値として求め、サンプル位置を構成する複数のサンプル位置集合のうち、聴覚特性に基づく所定の優先順位に従ってビット数が割り当てられたサンプル位置の集合を処理対象として、入力されたインデックス情報が表す、複数のサンプル位置に対応する予め定めた係数による組を用い、処理対象のサンプル位置集合に含まれる各サンプル位置に対応する、復号値と係数とを乗算した値を出力する。

　符号化においては、複数のサンプルそれぞれの量子化値を修正するために複数個の勾配係数による組を表すインデックス情報を出力するため、復号時の量子化誤差を低減させ、ミュージカルノイズ等を低減させることができる。
　復号においては、インデックス情報が表す複数個の勾配係数による組を用いて複数の復号値を修正するため、量子化誤差を低減でき、ミュージカルノイズ等を低減することができる。

図１は符号化装置及び復号装置の例の機能ブロック図である。図２は符号化方法の例の流れ図である。図３はステップＥ４の例の流れ図である。図４はステップＥ４の例の流れ図である。図５は復号方法の例の流れ図である。図６はステップＤ３の例の流れ図である。図７はステップＤ３の例の流れ図である。図８は入力信号と量子化値と勾配係数（傾き補正ゲイン）との関係を例示した図である。

　以下、この発明の一実施形態を詳細に説明する。
　（構成）
　図１に例示するように、実施形態の符号化装置１１は、正規化値計算部１１２、正規化値量子化部１１３、ベクトル量子化部１１５及び勾配計算部１１６を例えば含む。勾配計算部１１６は、「ビット割当部」及び「係数組選択部」に相当する。
図１に例示するように、実施形態の復号装置１２は、正規化値復号部１２１、ベクトル復号部１２２及び勾配修正部１２４を例えば含む。必要に応じて、符号化装置１１は、周波数領域変換部１１１を例えば含んでいてもよい。復号装置１２は、時間領域変換部１２５、平滑化部１２６を例えば含んでいてもよい。

　（符号化処理）
　符号化装置１１は図２に例示する符号化方法の各ステップを実行する。
　入力信号Ｘ（ｋ）は正規化値計算部１１２、ベクトル量子化部１１５及び勾配計算部１１６に入力される。この例の入力信号Ｘ（ｋ）は、音響信号などの時系列信号である時間領域信号ｘ（ｎ）を周波数領域に変換して得られる周波数領域信号である。周波数領域の入力信号Ｘ（ｋ）が符号化装置１１に直接入力されてもよいし、周波数領域変換部１１１が入力された時間領域の入力信号ｘ（ｎ）を周波数領域に変換して周波数領域の入力信号Ｘ（ｋ）が生成されてもよい。周波数領域変換部１１１が周波数領域の入力信号Ｘ（ｋ）を生成する場合、周波数領域変換部１１１は、入力された時間領域の入力信号ｘ（ｎ）を、例えばＭＤＣＴ（Modified Discrete Cosine Transform）により周波数領域の入力信号Ｘ（ｋ）に変換して出力する。ｎは時間領域での信号の番号（離散時間番号）であり、ｋは周波数領域での信号（サンプル）の番号（離散周波数番号）である。ｎの値が大きいほど遅い時間に対応する。ｋの値が大きいほど高い周波数に対応する。１フレームがＬ個のサンプルで構成されているとして、時間領域信号ｘ（ｎ）はフレームごとに周波数領域に変換され、Ｌ個の周波数成分を構成する周波数領域の入力信号Ｘ（ｋ）（ｋ＝０，１，…，Ｌ－１）が生成される。Ｌは所定の正の数、例えば６４や８０などの１よりも大きな整数である。なお、ＭＤＣＴを用いる場合には、入力された時系列信号であるＬ個のサンプルからなるフレームごとに周波数領域へ変換され、この変換対象となるフレームが１／２フレームずつ、すなわち、Ｌ／２個のサンプルずつシフトされる。

　正規化値計算部１１２は、フレームごとに、入力された入力信号Ｘ（ｋ）のＬ個のサンプルのうちの所定の個数Ｃ_０のサンプルを代表する値である正規化値_τＸ_０ ^－を計算する（ステップＥ１）。_τＸ_０ ^－は、_τＸ_０の上付きバーを意味する。ここで、τは、１フレーム中のＬ個のサンプルのうちの所定の個数Ｃ_０のサンプルにより構成される各サブバンドに対して、一意に割り当てられた０以上の整数とする。

　Ｃ_０は、Ｌ、又は、１及びＬ以外のＬの公約数である。なお、Ｃ_０をＬとすることは、Ｌ個のサンプルごとに正規化値を求めることを意味する。Ｃ_０を１およびＬ以外のＬの公約数にすることは、Ｌ個のサンプルをサブバンド（「サンプル位置集合」に相当）に分割して、各サブバンドを構成するＣ_０個のサンプルごとに正規化値を求めることを意味する。例えば、Ｌ＝６４であり、８個の周波数成分でサブバンドを構成するとした場合には、８個のサブバンドが構成され、各サブバンドの正規化値が計算されることになる。また、Ｃ_０がＬである場合τ＝０であり、正規化値_τＸ_０ ^－はＬ個のサンプルを代表する値である。すなわち、Ｃ_０がＬである場合、フレームごとに１つの正規化値_τＸ_０ ^－が計算される。一方、Ｃ_０が１及びＬ以外のＬの公約数である場合、τは１フレーム中の各サブバンドに対応する整数τ＝０，…，(L/Ｃ_０)-1であり、正規化値_τＸ_０ ^－はτに対応するサブフレームに属するＣ_０個のサンプルを代表する値である。すなわち、Ｃ_０が１及びＬ以外のＬの公約数である場合、フレームごとに(L/Ｃ_０)個の正規化値_τＸ_０ ^－（τ＝０，…，(L/Ｃ_０)-1）が計算される。また、Ｃ_０の値にかかわらずｋ＝τ・Ｃ_０，・・・，（τ＋１）・Ｃ_０－１である。正規化値計算部１１２で計算された_τＸ_０ ^－は、正規化値量子化部１１３に送られる。

　［正規化値_τＸ_０ ^－の具体例］
　正規化値_τＸ_０ ^－は、Ｃ_０個のサンプルを代表する値である。言い換えると、正規化値_τＸ_０ ^－は、Ｃ_０個のサンプルに対応する値である。正規化値_τＸ_０ ^－の例は、以下のようなＣ_０個のサンプルのパワー平均値に対する平方根である。

　正規化値_τＸ_０ ^－の他の例は、以下のようなＣ_０個のサンプルのパワー合計値に対する平方根をＣ_０で除した値である。

　正規化値_τＸ_０ ^－の他の例は、以下のようなＣ_０個のサンプルの平均振幅値である。

　正規化値_τＸ_０ ^－は上記の例に限定されない（［正規化値_τＸ_０ ^－の具体例］の説明終わり）。

　正規化値量子化部１１３は、正規化値_τＸ_０ ^－を量子化した量子化正規化値_τＸ^－及びその量子化正規化値_τＸ^－に対応する正規化値量子化インデックスを求める（ステップＥ２）。_τＸ^－は、Ｘの上付きバーを意味する。量子化正規化値_τＸ^－はベクトル量子化部１１５に送られ、正規化値量子化インデックスに対応する符号（ビットストリーム）が復号装置１２に送られる。

　ベクトル量子化部１１５は、フレームごとに、入力された入力信号Ｘ（ｋ）のＬ個のサンプルのうちの複数のサンプルＸ（ｋ）をまとめてベクトル量子化してベクトル量子化インデックスを生成する。ベクトル量子化インデックスは、量子化代表ベクトルを表わすインデックスである。この例のベクトル量子化部１１５は、量子化正規化値_τＸ^－を用いて複数のＸ（ｋ）を正規化し、正規化された複数のサンプルＸ（ｋ）’を求める。例えば、ベクトル量子化部１１５は、Ｘ（ｋ）を_τＸ^－で除算する、もしくはＸ（ｋ）に_τＸ^－の逆数を乗ずることでＸ（ｋ）’を求める。ベクトル量子化部１１５は、例えば、図示していないベクトルコードブック記憶部に記憶された複数の量子化代表ベクトルの中から、複数のＸ（ｋ）’を成分とするベクトルに最も近い量子化代表ベクトルを選択し、選択された量子化代表ベクトルを表わすベクトル量子化インデックスを出力することにより、ベクトル量子化を行う。ベクトル量子化部１１５は、例えばＣ_０個のＸ（ｋ）’をまとめてベクトル量子化を行う。ベクトル量子化部１１５は、例えばＡＶＱ法（例えば非特許文献２等参照）等のベクトル量子化方法を用いてベクトル量子化を行うが、これ以外のベクトル量子化方法が採用されてもよい。また、Ｃ_０がサブバンドのサンプル数である場合、人間の聴覚特性を考慮した優先順位が低いサブバンドについてベクトル量子化がなされなくてもよい。優先順位は、例えば、人間が知覚しやすい周波数に対応するサブバンドほど高い。例えば、量子化正規化値_τＸ^－が大きいサブバンドほど高い優先順位が与えられる。

　また、ベクトル量子化によって得られる符号のビット数は、入力信号に応じて様々である。入力信号によっては、ベクトル量子化によって得られる符号（ベクトル量子化インデックスなど）のビット数が、ベクトル量子化用に割り当てられたビット数未満となり、ベクトル量子化用に割り当てられたビットの一部が余る場合がある。なお、「ベクトル量子化用に割り当てられたビット」とは、符号化装置１１から復号装置１２に送られる符号のうちで、ベクトル量子化によって得られる符号（ベクトル量子化インデックスに対応する符号）のために割り当てられたビットを意味する。「ベクトル量子化用に割り当てられたビット数」は、ベクトル量子化用に割り当てられたビットのビット数を表す。「ベクトル量子化用に割り当てられたビット数」は、フレームごとに定められたものであってもよいし、サブバンドごとに定められたものであってもよい。また、「ベクトル量子化用に割り当てられたビット数」は、入力信号に応じて変動するものであってもよいし、入力信号にかかわらず固定されたものであってもよい。ベクトル量子化部１１５は、ベクトル量子化用に割り当てられたビットのうち、実際のベクトル量子化で使用されなかったビットのビット数を未使用ビット数Ｕとして計算する。本形態の例では、１フレームごと（Ｌ個のサンプルごと）に未使用ビット数Ｕを計算する。例えば、ベクトル量子化部１１５は、処理対象のフレームでのベクトル量子化用に割り当てられたビット数から、実際にそのフレームに属するＬ個のサンプルのベクトル量子化によって得られたベクトル量子化インデックスのビット数の総数を減じた値を未使用ビット数Ｕとする。Ｕは０以上の整数である。

　さらに、ベクトル量子化部１１５は、ベクトル量子化インデックスをローカルデコードした値である複数の量子化値Ｘ^＾（ｋ）を求めて出力する。例えば、ベクトル量子化部１１５は、ベクトル量子化インデックスによって表される量子化代表ベクトルの各成分Ｘ（ｋ）’を、量子化正規化値_τＸ^－を用いて逆正規化した値をＸ（ｋ）の量子化値Ｘ^＾（ｋ）として出力する。例えば、ベクトル量子化部１１５は、Ｘ（ｋ）’と_τＸ^－との乗算値を量子化値Ｘ^＾（ｋ）として出力する。この例の量子化値Ｘ^＾（ｋ）は復号装置１２で得られる復号値Ｘ^＾（ｋ）と等しい。ベクトル量子化がなされていないサブバンドの量子化値Ｘ^＾（ｋ）は０となる。なお、Ｘ^＾は、Ｘの上付きハットを意味する。

　ベクトル量子化部１１５は、ベクトル量子化インデックス、未使用ビット数Ｕ及び量子化値Ｘ^＾（ｋ）を勾配計算部１１６に送る（ステップＥ３）。
　勾配計算部１１６は、Ｍ_ＭＡＸ組の、Ｃ_０個の勾配係数（傾き補正ゲイン）により構成される組を、例えば図示していない記憶部に保持する。Ｍ_ＭＡＸは２以上の整数である。例えば、勾配計算部１１６は、Ｃ_０個の勾配係数（傾き補正ゲイン）γ_ｍ（ｋ’）（ｋ’＝０,・・・,Ｃ_０－１）を要素とする勾配係数ベクトルγ_ｍ＝［γ_ｍ（０）,・・・,γ_ｍ（Ｃ_０－１）］（複数個の勾配係数による組）をｍ（ｍ＝０,・・・,Ｍ_ＭＡＸ－１）行目の行ベクトルとする式（１）に示す勾配行列γを保持する。

　勾配計算部１１６は、入力されたＣ_０個のサンプルＸ（ｋ）（ｋ＝τ・Ｃ_０,・・・,（τ＋１）・Ｃ_０－１）に対応する値を要素とする第１ベクトルと、入力されたＣ_０個の量子化値Ｘ^＾（ｋ）（ｋ＝τ・Ｃ_０,・・・,（τ＋１）・Ｃ_０－１）のそれぞれに勾配係数ベクトルγ_ｍの各要素γ_ｍ（ｋ’）（ｋ’＝０,・・・,Ｃ_０－１）を乗じて得られるＣ_０個の修正値に対応する値を要素とする第２ベクトルとの誤差を最小化する（例えば最小にする）勾配係数ベクトルの行番号ｍ’を求め、行番号ｍ’を表すインデックス情報ｉｄｘをベクトル量子化用に割り当てられたビットのうちで使用されなかったビットの領域（「未使用ビット領域」と呼ぶ）に書き込む。

　言い換えると、勾配計算部１１６は、複数の勾配係数γ_ｍ（ｋ’）を要素とする勾配係数ベクトルγ_ｍを行ベクトルとする勾配行列γの中から、複数のサンプルＸ（ｋ）に対応する値を要素とする第１ベクトルと、複数の量子化値Ｘ^＾（ｋ）のそれぞれに勾配係数ベクトルγ_ｍの各要素を乗じて得られる修正値に対応する値を要素とする第２ベクトルとの間の誤差を最小化する勾配係数ベクトルの行番号ｍ’を表すインデックス情報ｉｄｘを出力し、ベクトル量子化インデックスに対応する符号（ビットストリーム）の未使用ビット領域に配置する（ステップＥ４）。
　これにより、符号化装置１１は、未使用ビット領域を有効利用して振幅の量子化誤差を修正するための情報を復号装置１２に送ることができ、量子化精度に基づいて発生するミュージカルノイズ等を低減させることができる。

　勾配係数ベクトルγ_ｍの要素であるＣ_０個の勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）は互いに相関を持つ。言い換えると、各勾配係数ベクトルγ_ｍは互いに相関を持つ複数の勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とするベクトルである。Ｘ（τ・Ｃ_０），・・・, Ｘ（（τ＋１）・Ｃ_０－１）は、ｋを第１軸にとり、Ｘ（ｋ）を第２軸にとる（ｋ, Ｘ（ｋ））平面上の直線や曲線に偏って分布する場合が多い。このようなＸ（τ・Ｃ_０），・・・, Ｘ（（τ＋１）・Ｃ_０－１）の特性を考慮した勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とする勾配係数ベクトルγ_ｍを用いることで、量子化誤差を高い精度で修正できる。例えば、同一の行番号ｍに対応する各勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）が、ｋ’（勾配係数γ_ｍ（ｋ’）に対応する周波数に対応する値）を第１軸にとりγ_ｍ（ｋ’）（勾配係数の値）を第２軸にとる（ｋ’, γ_ｍ（ｋ’））平面上の直線又は特定の曲線に偏って分布するものとする。言い換えると、例えばベクトルの要素の順序に対応する値ｋ’を第１軸にとりベクトルの要素の値γ_ｍ（ｋ’）を第２軸にとる（ｋ’, γ_ｍ（ｋ’））平面上の直線又は特定の曲線に偏って分布する複数の勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とするベクトルを勾配係数ベクトルγ_ｍとする。より具体的には、例えば同一の行番号ｍに対応する各勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）が、（ｋ’, γ_ｍ（ｋ’））平面上の直線上又は特定の曲線上に位置するものとする。言い換えると、（ｋ’, γ_ｍ（ｋ’））平面上の直線又は特定の曲線上の各勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とするベクトルを勾配係数ベクトルγ_ｍとした。（ｋ’, γ_ｍ（ｋ’））平面上の直線上又は特定の曲線は、例えば行番号ｍごとに異なる。以下に勾配行列γを例示する。この例は、Ｃ_０＝８、Ｍ_ＭＡＸ＝３の場合のものである。この例では、各勾配係数γ_ｍ（０），・・・, γ_ｍ（７）が行番号ｍ（ｍ＝０,１,２）ごとに定められた直線上に配置される。

　第１ベクトルの例は、Ｃ_０個のＸ（ｋ）を要素とするベクトル、Ｃ_０個のＸ（ｋ）の大きさ｜Ｘ（ｋ）｜を要素とするベクトル、Ｃ_０個のＸ（ｋ）又は｜Ｘ（ｋ）｜に定数や変数を乗じた値を要素とするベクトルなどである。第２ベクトルの例は、Ｃ_０個の修正値を要素とするベクトル、Ｃ_０個の修正値の大きさを要素とするベクトル、Ｃ_０個の修正値又は大きさに定数や変数を乗じた値を要素とするベクトルなどである。修正値の例は、Ｘ^＾（ｋ）とγ_ｍ（ｋ’）との積、Ｘ^＾（ｋ）の大きさ｜Ｘ^＾（ｋ）｜とγ_ｍ（ｋ’）との積、Ｘ^＾（ｋ）とγ_ｍ（ｋ’）との積の大きさ、Ｘ^＾（ｋ）とγ_ｍ（ｋ’）との積の大きさを表す値、その他Ｘ^＾（ｋ）とγ_ｍ（ｋ’）との積に対応する値などである。

　第１ベクトルと第２ベクトルとの間の誤差の例は、第１ベクトルと第２ベクトルとの間の距離である。距離の定義に限定はなく、マンハッタン距離、ユークリッド距離、それらの変形等どのようなものでもよい。第１ベクトルと第２ベクトルとの誤差を最小化する勾配係数ベクトルの例は、第１ベクトルと第２ベクトルとの誤差を最小にする勾配係数ベクトルや、或る探索条件や探索範囲内で第１ベクトルと第２ベクトルとの誤差を最小にする勾配係数ベクトルなどである。

　未使用ビット領域は、例えば、定められた未使用ビット領域の基準位置（例えば先頭アドレス）と入力された未使用ビット数Ｕとによって特定できる。ただし、未使用ビット領域に書き込むことが可能なインデックス情報ｉｄｘのビット数の上限は未使用ビット数Ｕである。よって、必ずしもあらゆる行番号に対応するインデックス情報ｉｄｘを未使用ビット領域に書き込めるとは限らない。そこで勾配計算部１１６は、例えば、未使用ビット領域に書き込むことが可能なインデックス情報ｉｄｘで識別可能な行番号の範囲の行番号のみを探索範囲とする。言い換えると、勾配計算部１１６は、未使用ビット領域に書き込むことが可能なインデックス情報ｉｄｘが表す行番号のみを選択する。例えば、勾配計算部１１６は、未使用ビット領域に書き込むことが可能なインデックス情報ｉｄｘで識別可能なｍ_ＭＡＸ種類の行番号ｍ＝０，・・・,ｍ_ＭＡＸ－１から、以下のような行番号ｍ’を特定し、行番号ｍ’に対応するインデックス情報ｉｄｘを未使用ビット領域に書き込む。

なお、∥・∥は・のノルムであり、ａｒｇｍｉｎ_ｍ∥・∥は∥・∥を最小にするｍをｍ’とすることを意味し、ａｒｇｍｉｎ_ｍはａｒｇｍｉｎの下付きのｍを意味し、χ＝［Ｘ（τ・Ｃ_０），…，Ｘ（（τ＋１）・Ｃ_０－１）］、χ^＾＝［Ｘ^＾（τ・Ｃ_０），…，Ｘ^＾（（τ＋１）・Ｃ_０－１）］であり、Ａ_ｍは以下のような行番号ｍに対応する勾配係数ベクトルγ_ｍ＝［γ_ｍ（０）,・・・,γ_ｍ（Ｃ_０－１）］（ｍ＝０，…，ｍ_ＭＡＸ－１）を対角成分に持つ対角行列を意味する。

に対する

　Ｃ_０がサブバンドのサンプル数である場合（τ＞０の場合）、勾配計算部１１６は、例えばサブバンドごとに勾配係数ベクトルの行番号ｍ’を表すインデックス情報ｉｄｘを未使用ビット領域に配置する。この場合、各サブバンドに対応するインデックス情報ｉｄｘをそれぞれ格納するために未使用ビット領域を各サブバンドに分配しなければならない。勾配計算部１１６は、例えば人間の聴覚特性を考慮した所定の優先順位に従って、各サブバンドのインデックス情報ｉｄｘを配置する未使用ビット領域中のビット領域を決める。

　例えば勾配計算部１１６は、サブバンド（「サンプル位置集合」に相当）のそれぞれに与えられた優先順位に応じてそのサブバンドに対応するインデックス情報ｉｄｘを配置するビット領域の大きさを決める。優先順位は、例えば、人間が知覚しやすい周波数に対応するサブバンドほど高い。例えば勾配計算部１１６は、優先順位が高いサブバンドのインデックス情報ｉｄｘを優先的に未使用ビット領域に配置する。具体的には、例えば勾配計算部１１６は、優先順位が高いサブバンドに対応するインデックス情報ｉｄｘを配置するビット領域を、優先順位が低いサブバンドに対応するインデックス情報ｉｄｘを配置するビット領域よりも大きくする。言い換えると、サブバンドの何れかである第１サブバンドに割り当てられるビット数が、当該第１サブバンドよりも優先順位が低い第２サブバンドに割り当てられるビット数以上とされる。また、例えば勾配計算部１１６は、ベクトル量子化部１１５でベクトル量子化がなされなかったサブバンドに対応するインデックス情報ｉｄｘを配置するためのビット領域を割り当てない。例えばベクトル量子化がなされなかったサブバンドのＸ^＾（ｋ）はすべて０であるため、勾配計算部１１６は、属するＸ^＾（ｋ）の振幅やエネルギーの和が０となるサブバンドについてインデックス情報ｉｄｘを配置するためのビット領域を割り当てない。この場合、ベクトル量子化がなされなかったサブバンドについては、例えばインデックス情報ｉｄｘを特定するための処理を行う必要もない。

　以上のように勾配計算部１１６は、ベクトル量子化インデックスに対応する符号用に割り当てられたビット数のうち実際にベクトル量子化インデックスに対応する符号に用いられなかったビット数の少なくとも一部を聴覚特性に基づく所定の優先順位に従って複数のサンプルに割り当て、当該複数のサンプルに割り当てたビット数のインデックス情報ｉｄｘを出力する。
　言い換えると、勾配計算部１１６は、ベクトル量子化インデックスに対応する符号用に割り当てられたビット数からベクトル量子化インデックスに対応する符号に用いられたビット数を減算して得られる数以下のビット数を、それぞれが複数のサンプル位置からなり聴覚特性に基づく優先順位が与えられた複数のサンプル位置集合のうちの１個以上のサンプル位置集合に、聴覚特性に基づく所定の優先順位に従って割り当て、ビット数が割り当てられたサンプル位置集合それぞれについて、複数組の、サンプルそれぞれの位置に対応する予め定めた係数による組のうち、該サンプル位置集合に属するサンプルの値と、該サンプル位置集合に属するサンプルの量子化値とサンプルそれぞれの位置に対応する係数とを乗算した値との間の誤差の該サンプル位置集合に属する全サンプル位置についての和を最小にする係数の組を表すインデックス情報ｉｄｘを出力する。なお、本形態の「サンプルそれぞれの位置」は、各離散周波数番号ｋに対応する周波数軸上の位置である。
　これにより、未使用ビット領域のみを用いてインデックス情報ｉｄｘを伝送できる。

　［ステップＥ４の具体例１］
　この例の勾配計算部１１６は、図３及び図４に記載された各処理を行い、選択した勾配係数ベクトルの行番号を表すインデックス情報ｉｄｘを、未使用ビット領域に書き込む。

　勾配計算部１１６は、ｉ＝０，ｈ＝Ｈ，ｕ＝Ｕとすることでｉ，ｈ及びｕの値を初期化し、ステップＥ４２に進む（ステップＥ４１）。Ｃ_０がサブバンドのサンプル数を表わす場合、Ｈはベクトル量子化部でベクトル量子化がなされた１フレーム中のサブバンド数を表す。Ｃ_０が１フレーム中のサンプル数Ｌを表わす場合、Ｈは１となる。

　勾配計算部１１６は、ｉとＧ（Ｇ＝Ｌ／Ｃ_０）とを比較し（ステップＥ４２）、ｉ＜ＧであればステップＥ４３に進み、ｉ＜ＧでなければステップＥ４の処理を終える。なお、Ｃ_０がサブバンドのサンプル数を表わす場合、Ｇは１フレーム中のサブバンドの総数を表す。Ｃ_０が１フレーム中のサンプル数Ｌを表わす場合、Ｇ＝１となる。また、「δとηとを比較する」場合の比較方法に限定はなく、δとηとの大小関係を判定できるのであればどのような比較方法を用いてもよい。例えば、δ＜ηを満たすか否かを知るためにδとηとを比較する処理は、δ＜ηを満たすか否かを判定する処理でも、０＜η－δを満たすか否かを判定する処理でも、δ≧ηを満たすか否かを判定する処理でも、０≧η－δを満たすか否かを判定する処理でもよい。

　ステップＥ４３では、勾配計算部１１６は、ｕと０とを比較し（ステップＥ４３）、ｕ＞０でなければステップＥ４の処理を終え、ｕ＞０であれば、ｂ＝ｏ（ｉ）とする（ステップＥ４４）。Ｃ_０がサブバンドのサンプル数を表わす場合、ｏ（ｉ）は、１フレーム中の各サブバンドをそれぞれ識別する０以上の整数のインデックスが優先順位の高い順に配列された集合Ｓのｉ番目（ｉ＝０，...，（Ｌ／Ｃ_０）－１）の要素（インデックス）を表す。例えば、１フレーム中のサブバンドの総数Ｌ／Ｃ_０が８であり、各サブバンドが０，…，７で識別され、集合Ｓ＝｛１，０，３，２，５，４，６，７｝である場合、ｏ（ｉ）は集合Ｓ＝｛１，０，３，２，５，４，６，７｝の先頭からｉ番目の要素を表す。なお、先頭の要素を０番目の要素と表現する。この例では、０で識別されるサブバンドの優先順位が一番高く、７で識別されるサブバンドの優先順位が一番低い。１フレーム中の各サブバンドの優先順位は、入力信号Ｘ（ｋ）に応じて動的に定められてもよいし、固定的に定められてもよい。動的に優先順位を定める方法の一例は、量子化正規化値_τＸ^－が大きいサブバンドほど優先順位を高くする方法である。固定的に優先順位を定める方法の一例は、人間の聴覚特性を考慮して各サブバンドの優先順位を定めておく方法（例えば低い周波数に対応するサブバンドほど優先順位を高くするなど）である。Ｃ_０が１フレーム中のサンプル数Ｌを表わす場合、ｏ（ｉ）＝０である。

　勾配計算部１１６は、ｆｌｇ（ｂ）と０とを比較し（ステップＥ４５）ｆｌｇ（ｂ）＞０でなければ（ｆｌｇ（ｂ）＝０であれば）ｉを１だけインクリメント（ｉ＋１を新たなｉの値とすることでｉの値を更新）し（ステップＥ４２１）、ステップＥ４２に進む。なお、ｆｌｇ（ｂ）は、ｂで識別されるサブバンド（処理対象のサンプル集合）のベクトル量子化がベクトル量子化部１１５で行われたか否かを表す量子化有無フラグである。ベクトル量子化の行われたサブバンドを識別するｂに対してｆｌｇ（ｂ）＝η（η＞０、例えばη＝１）となり、ベクトル量子化のなされていないサブバンドを識別するｂに対してｆｌｇ（ｂ）＝０となる。例えば、ｂで識別されるサブバンドの量子化値Ｘ^＾（ｋ）のエネルギーの総和が０の場合にｆｌｇ（ｂ）＝０とされ、それ以外の場合にｆｌｇ（ｂ）＝１とされる。
　ステップＥ４５でｆｌｇ（ｂ）＞０であれば（ｆｌｇ（ｂ）＝ηであれば）勾配計算部１１６は、ｕ－ｈと０とを比較し（ｕとｈとを比較することと等価）（ステップＥ４６）、ｕ－ｈ＞０であればｍ_ＭＡＸ＝３、ａ＝２とし（ステップＥ４７）、ｕ－ｈ＞０でなければｍ_ＭＡＸ＝１、ａ＝１とする（ステップＥ４８）。すなわち、勾配計算部１１６は、ベクトル量子化インデックスに対応する符号に用いられなかったビット数のうちサブバンドの何れにも割り当てられていない残りのビット数ｕが、ビット数の割り当てが行われていないサブバンドの個数ｈよりも大きくない場合に、ビット数の割り当てが行われていないサブバンドのうち最も優先順位が高いものに第１ビット数（ａ＝１）を割り当て、残りのビット数ｕが、ビット数の割り当てが行われていないサブバンドの個数ｈよりも大きい場合に、ビット数の割り当てが行われていない前サブバンドのうち最も前記優先順位が高いものに前記第１ビット数（ａ＝１）よりも大きな第２ビット数（ａ＝２）を割り当てる。またｍ_ＭＡＸは勾配行列γの探索範囲を定める。すなわち、勾配行列γの行番号ｍ＝０からｍ_ＭＡＸ－１までの勾配係数ベクトルγ_ｍが探索範囲となる。この例では勾配行列γの行番号の最大値Ｍ_ＭＡＸ（式（１））は２以上である。ａはこの探索範囲の勾配係数ベクトルγ_ｍの行番号ｍを表すインデックス情報ｉｄｘのビット数の上限である。なお、ａビットで２^ａ個の値を伝送できるが、２^ａ個の値のうち１個は補正を行わないことを表すｉｄｘ＝０に割り当てられる。

　勾配計算部１１６は、ｈをデクリメント（ｈ－１を新たなｈの値とすることでｈの値を更新）し（ステップＥ４９）、以下の式に表される計算を行う（ステップＥ４１０）。

　勾配計算部１１６は、ｍ＝０，ｉｄｘ＝０とすることでｍ及びｉｄｘの値を初期化し、ステップＥ４１２に進む（ステップＥ４１１）。
　ステップＥ４１２では、勾配計算部１１６は、ｍとｍ_ＭＡＸとを比較し（ステップＥ４１２）、ｍ＜ｍ_ＭＡＸであれば、以下の式に表される計算を行い（ステップＥ４１３）、ｅ_ＭＩＮとｅとを比較し（ステップＥ４１４）、ｅ_ＭＩＮ＞ｅでなければ、ｍを１だけインクリメントし（ステップＥ４１６）、ステップＥ４１２に進む。ｅ_ＭＩＮ＞ｅであれば勾配計算部１１６は、ｉｄｘ＝ｍ＋１及びｅ_ＭＩＮ＝ｅとしてｉｄｘ及びｅ_ＭＩＮを更新し（ステップＥ４１５）、ｍを１だけインクリメントして（ステップＥ４１６）、ステップＥ４１２に進む。

　一方、ステップＥ４１２でｍ＜ｍ_ＭＡＸでないとされた場合、勾配計算部１１６は、未使用ビット領域にｉｄｘを書き込み、ｕ－ａを新たなｕとすることでｕの値を更新し（ステップＥ４１７）、ステップＥ４１８に進む。この例の勾配計算部１１６は、未使用ビット領域の未使用のａビットの領域にｉｄｘを書き込む。この際、復号装置１２が、ａに基づいて、必要なｉｄｘが未使用ビット領域のどこに配置されているのかを特定できるようにしておく。例えば、未使用ビット領域の未使用の領域をどのような順序で割り当てていくかが予め定められており、勾配計算部１１６は、この順序に従ってｉｄｘを格納する領域を決定していく。

　ステップＥ４１８では、勾配計算部１１６は、ｉｄｘ＞０であるか否か（ｉｄｘ＝０であるか否か）を判定し（ステップＥ４１８）、ｉｄｘ＞０であれば（ｉｄｘ＝０でなければ）、複数の量子化値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を以下のように更新し（ステップＥ４１９）、ｉを１だけインクリメントして（ステップＥ４２１）、ステップＥ４２に進む。

　ｉｄｘ＞０でなければ（ｉｄｘ＝０であれば）、以下に示すように、勾配計算部１１６は、ローカルデコード値である複数の量子化値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を更新することなく（ステップＥ４２０）、ｉを１だけインクリメントして（ステップＥ４２１）、ステップＥ４２に進む。

　以上のように、勾配計算部１１６は、処理対象のサブバンド（処理対象のサンプル集合）に割り当てられたビット数で表現可能なインデックス情報ｉｄｘを出力する。

　［ステップＥ４の具体例２］
　ステップＥ４は、図３及び図４に示すように、例えば以下のように実行されてもよい。
　ステップＥ４１～Ｅ４５が実行され、ステップＥ４５でｆｌｇ（ｂ）＞０でない（ｆｌｇ（ｂ）＝０である）と判定されれば勾配計算部１１６は、ｉを１だけインクリメントし（ステップＥ４２１）、ステップＥ４２に進む。ステップＥ４５でｆｌｇ（ｂ）＞０である（ｆｌｇ（ｂ）＝ηである）と判定されれば、勾配計算部１１６は、ｍ_ＭＡＸ＝１、ａ＝１とし（ステップＥ４８’）、ステップＥ４６に進む。

　ステップＥ４６では、勾配計算部１１６は、ｕ－ｈと０とを比較し（ｕとｈとを比較することと等価）（ステップＥ４６）、ｕ－ｈ＞０であればｍ_ＭＡＸ＝３、ａ＝２として（ステップＥ４７）ステップＥ４９に進み、ｕ－ｈ＞０でなければｍ_ＭＡＸ及びａを変更せずにステップＥ４９に進む。その他は[ステップＥ４の具体例１]と同じである。この場合も勾配計算部１１６は、処理対象のサブバンド（処理対象のサンプル集合）に割り当てられたビット数で表現可能なインデックス情報ｉｄｘを出力する。

　［ステップＥ４の具体例３］
　ステップＥ４の具体例１，２において、式（２）の代わりに、以下のような計算が行われてもよい。

また、ステップＥ４の具体例１，２において、式（３）の代わりに、以下のような計算が行われてもよい。

　これで［ステップＥ４の具体例］の説明を終える。

　ベクトル量子化インデックスと未使用ビット領域に書き込まれたインデックス情報ｉｄｘとを含む修正後ベクトル量子化インデックスに対応する符号（ビットストリーム）は復号装置１２に送られる。

　（復号処理）
　復号装置１２は図５に例示する復号方法の各ステップを実行する。
　正規化値復号部１２１は、復号装置１２に入力された正規化値量子化インデックスに対応する復号正規化値_τＸ^－を求める（ステップＤ１）。復号正規化値_τＸ^－は、ベクトル復号部１２２に送られる。

　図示していないコードブック記憶部に複数の正規化値量子化インデックスのそれぞれに対応する正規化値が記憶されているとする。正規化値復号部１２１は、入力された正規化量子化インデックスをキーとしてそのコードブック記憶部を参照して、その正規化量子化インデックスに対応する正規化値を取得して、復号正規化値_τＸ^－とする。

　ベクトル復号部１２２は、復号装置１２に入力された修正後ベクトル量子化インデックスが含むベクトル量子化インデックスに対応する複数の値を求めて複数の復号値Ｘ^＾（ｋ）とする。また、ベクトル復号部１２２は、ベクトル量子化インデックスを用いて未使用ビット数Ｕを計算する（ステップＤ２）。

　本形態では、図示していないベクトルコードブック記憶部に複数のベクトル量子化インデックスのそれぞれに対応する量子化代表ベクトルが記憶されているとする。ベクトル復号部１２２は、入力されたベクトル量子化インデックスに対応する量子化代表ベクトルをキーとしてそのベクトルコードブック記憶部を参照して、そのベクトル量子化インデックスに対応する量子化代表ベクトルを取得する。ベクトル復号部１２２は、量子化代表ベクトルの成分Ｘ（ｋ）’を量子化正規化値_τＸ^－で逆正規化した復号値Ｘ^＾（ｋ）を出力する。例えば、ベクトル復号部１２２は、Ｘ（ｋ）’と_τＸ^－との乗算値を復号値Ｘ^＾（ｋ）として出力する。

　また、ベクトル復号部１２２は、ベクトル量子化用に割り当てられたビットのうち、実際のベクトル量子化で使用されなかったビットのビット数を未使用ビット数Ｕとして計算する。本形態の例では、ベクトル復号部１２２は、１フレームごと（Ｌ個のサンプルごと）に未使用ビット数Ｕを計算する。例えば、ベクトル復号部１２２は、処理対象のフレームでのベクトル量子化用に割り当てられたビット数から、そのフレームに対応するベクトル量子化インデックスのビット数の総数を減じた値を未使用ビット数Ｕとする。

　復号値Ｅ^＾（ｋ）及び未使用ビット数Ｕは、勾配修正部１２４に送られる。
　勾配修正部１２４は、符号化装置１１で使用したのと同じ勾配行列γ（式（１）参照）を、例えば図示していない記憶部に保持する。勾配修正部１２４は、復号装置１２に入力された修正後ベクトル量子化インデックスが含む未使用ビット領域からインデックス情報ｉｄｘを読み出し、ｉｄｘが表す行番号ｍ’の勾配係数ベクトルγ_ｍ’の各要素γ_ｍ’（ｋ’）（ｋ’＝０,・・・,Ｃ_０－１）を用い、Ｃ_０個の復号値Ｘ^＾（ｋ）（ｋ＝τ・Ｃ_０,・・・,（τ＋１）・Ｃ_０－１）を修正する。言い換えると、勾配修正部１２４は、複数の勾配係数γ_ｍ（ｋ’）を要素とする勾配係数ベクトルγ_ｍを行ベクトルとする勾配行列γ中のインデックス情報ｉｄｘが表す行番号ｍ’の勾配係数ベクトルγ_ｍ’の各要素γ_ｍ’（ｋ’）を用い、複数の復号値Ｘ^＾（ｋ）を修正する（ステップＤ３）。例えば、勾配修正部１２４は、インデックス情報ｉｄｘが表す行番号ｍ’の勾配係数ベクトルγ_ｍ’の要素γ_ｍ’（ｋ’）と復号値Ｘ^＾（ｋ）との乗算値を復号値Ｘ^＾（ｋ）の修正値Ｘ^＾ _ＵＤ（ｋ）とする。勾配修正部１２４は修正値Ｘ^＾ _ＵＤ（ｋ）を出力する。すなわち、勾配修正部１２４は、複数個のサンプル位置を構成する複数のサンプル位置集合のうち、聴覚特性に基づく所定の優先順位に従ってビット数が割り当てられたサンプル位置の集合を処理対象として、入力されたインデックス情報ｉｄｘが表す、複数のサンプル位置に対応する予め定めた係数による組を用い、処理対象のサンプル位置集合に含まれる各サンプル位置に対応する、復号値と係数とを乗算した値を出力する。

　［ステップＤ３の具体例１］
　この例の勾配修正部１２４は、図６及び図７に記載された各処理を行い、復号値Ｘ^＾（ｋ）を修正する。
　勾配修正部１２４は、ｉ＝０，ｈ＝Ｈ，ｕ＝Ｕとすることでｉ，ｈ及びｕの値を初期化し、ステップＤ３２に進む（ステップＤ３１）。
　勾配修正部１２４は、ｉとＧ（Ｇ＝Ｌ／Ｃ_０）とを比較し（ステップＤ３２）、ｉ＜ＧであればステップＤ３３に進み、ｉ＜ＧでなければステップＤ３の処理を終える。
　ステップＤ３３では、勾配修正部１２４は、ｕと０とを比較し（ステップＤ３３）、ｕ＞０でなければステップＤ３の処理を終え、ｕ＞０であればｂ＝ｏ（ｉ）とする（ステップＤ３４）。符号化装置１１のｏ（ｉ）と復号装置１２のｏ（ｉ）は同一である。

　勾配修正部１２４は、ｆｌｇ（ｂ）と０とを比較し（ステップＤ３５）、ｆｌｇ（ｂ）＞０でなければ（ｆｌｇ（ｂ）＝０であれば）、勾配修正部１２４は、ｉを１だけインクリメントし（ステップＤ３１５）、ステップＤ３２に進む。なお、ｆｌｇ（ｂ）は、ｂで識別されるサブバンドのベクトル量子化がベクトル量子化部１１５で行われたか否かを表す量子化有無フラグである。ベクトル量子化の行われたサブバンドを識別ｂに対してｆｌｇ（ｂ）＝η（η＞０、例えばη＝１）となり、ベクトル量子化のなされていないサブバンドを識別するｂに対してｆｌｇ（ｂ）＝０となる。例えば、ｂで識別されるサブバンドの復号値Ｘ^＾（ｋ）のエネルギーの総和が０の場合にｆｌｇ（ｂ）＝０とされ、それ以外の場合にｆｌｇ（ｂ）＝１とされる。

　ステップＤ３５でｆｌｇ（ｂ）＞０であれば（ｆｌｇ（ｂ）＝ηであれば）勾配修正部１２４は、ｕ－ｈと０とを比較（ｕとｈとを比較することと等価）（ステップＤ３６）し、ｕ－ｈ＞０であればｍ_ＭＡＸ＝３、ａ＝２とし（ステップＤ３７）、ｕ－ｈ＞０でなければｍ_ＭＡＸ＝１、ａ＝１とする（ステップＤ３８）。

　勾配修正部１２４は、ｈをデクリメントし（ステップＤ３９）、ａに基づき修正後ベクトル量子化インデックスが含む未使用ビット領域からインデックス情報ｉｄｘを読み込む（ステップＤ３１０）。勾配修正部１２４は、ｕ－ａを新たなｕとすることでｕの値を更新する（ステップＤ３１１）。勾配修正部１２４は、ｉｄｘ＞０であるか否か（ｉｄｘ＝０であるか否か）を判定し（ステップＤ３１２）、ｉｄｘ＞０であれば（ｉｄｘ＝０でなければ）、複数の復号値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を以下のように更新し（ステップＤ３１３）、ｉを１だけインクリメントして（ステップＤ３１５）、ステップＤ３２に進む。

　ｉｄｘ＞０でなければ（ｉｄｘ＝０であれば）、以下に示すように、勾配修正部１２４は、複数の復号値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を更新することなく（ステップＤ３１４）、ｉを１だけインクリメントして（ステップＤ３１５）、ステップＤ３２に進む。

　［ステップＤ３の具体例２］
　ステップＤ３は、図６及び図７に示すように、例えば以下のように実行されてもよい。
　ステップＤ３１～Ｄ３５が実行され、ステップＤ３５でｆｌｇ（ｂ）＞０でない（ｆｌｇ（ｂ）＝０である）と判定されれば勾配修正部１２４は、ｉを１だけインクリメントし（ステップＤ３１５）、ステップＤ３２に進む。ステップＤ３５でｆｌｇ（ｂ）＞０である（ｆｌｇ（ｂ）＝ηである）と判定されれば、勾配修正部１２４は、ｍ_ＭＡＸ＝１、ａ＝１とし（ステップＤ３８’）、ステップＤ３６に進む。

　ステップＤ３６では、勾配修正部１２４は、ｕ－ｈと０とを比較し（ｕとｈとを比較することと等価）（ステップＤ３６）、ｕ－ｈ＞０であればｍ_ＭＡＸ＝３、ａ＝２として（ステップＤ３７）ステップＤ３９に進み、ｕ－ｈ＞０でなければｍ_ＭＡＸ及びａを変更せずにステップＤ３９に進む。その他は[ステップＤ３の具体例１]と同じである（［ステップＤ３の具体例］の説明終わり）。

　時間領域での復号信号が必要な場合、勾配修正部１２４から出力された修正値Ｘ^＾ _ＵＤ（ｋ）は時間領域変換部１２５に入力され、時間領域変換部１２５はＸ^＾ _ＵＤ（ｋ）を例えば逆フーリエ変換により時間領域信号ｚ（ｎ）に変換して出力する。

　（本形態の特徴）
　このように本形態では、復号装置１２が符号化装置１１で選択された勾配係数ベクトルを用いて複数の復号値Ｘ^＾（ｋ）を修正するため、量子化誤差に基づくミュージカルノイズ等を軽減できる。

　また本形態では、互いに相関を持つ勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とするベクトルを勾配係数ベクトルγ_ｍとした。例えば、（ｋ, γ_ｍ（ｋ））平面上の直線又は特定の曲線に偏って分布する複数の勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）を要素とするベクトルを勾配係数ベクトルγ_ｍとした。音声信号や音響信号などの入力信号のエンベロープは直線や曲線をなす場合が多く、このような入力信号の特性を反映させた勾配係数ベクトルγ_ｍ用いることにより、インデックス情報ｉｄｘの情報量を抑制しつつ量子化誤差を高精度に修正できる。図８の例の場合、ｋ＝０，…，７のサブバンドでの入力信号の大きさ｜Ｘ（ｋ）｜はｋが大きいほど小さい。そのため、（ｋ, γ_ｍ（ｋ））平面上の傾きが負となる直線に偏って分布する勾配係数γ_ｍ（０），・・・, γ_ｍ（７）を要素とする勾配係数ベクトルγ_ｍを用いて｜Ｘ（０）｜，・・・, ｜Ｘ（７）｜を修正することで、量子化値の大きさ｜Ｘ＾（０）｜，・・・, ｜Ｘ＾（７）｜との誤差を小さくできる。このようにサブバンドごとに入力信号の特性に適した勾配係数ベクトルγ_ｍを用いることで量子化誤差を効率的に削減することができる。
　また、符号化装置１１で選択された勾配係数ベクトルγ_ｍ’を特定するためのインデックス情報ｉｄｘは未使用ビット領域を有効利用して伝送されるため、インデックス情報ｉｄｘを伝送するための付加領域が不要である。

　ただし、未使用ビット領域に書き込み可能なビット数の上限は未使用ビット数Ｕであり、必ずしもすべてのサブバンドに対するインデックス情報ｉｄｘが未使用ビット領域に書き込まれるとは限らない。そこで、本形態では、優先順位の高いサブバンドに対応するインデックス情報ｉｄｘを優先的に未使用ビット領域に書き込む。これにより、例えば、人間の聴覚特性上重要なサブバンドでの量子化誤差を減らし、ミュージカルノイズ等を軽減することができる。

　（実験結果）
　本形態の効果を表す実験結果を示す。
　本実験では、以下の２条件について、入力信号と復号信号との間のＳＮＲ（Signal to Noise Ratio）を求めた。
　条件１：従来技術（特許文献１のように入力信号のベクトル量子化を行って得られた符号が復号されて復号信号が得られる）
　条件２：実施形態技術（上述の実施形態のように入力信号のベクトル量子化と勾配計算とを行って得られた符号が復号されて復号信号が得られる）

　ＳＮＲは、ベクトル量子化の未使用ビット数Ｕが１ビット以上となるフレームのみから算出した。入力信号は、音声、邦楽、洋楽の三種類を用いた。以下に結果を示す。

　このように、実施形態技術では、従来技術に比べ音声、邦楽、洋楽の三種類の入力信号について平均でＳＮＲを約０．３５ｄＢ改善できた。

　変形例：
　なお、本発明は上述の実施の形態に限定されるものではない。例えば、復号装置１２が平滑化部１２６を含む場合、平滑化部１２６は、ステップＤ３（図５）で得られた修正値Ｘ^＾ _ＵＤ（ｋ）を入力とし、修正値Ｘ^＾ _ＵＤ（ｋ）よりも過去の修正値Ｘ^＾ _ＵＤ（ｋ）’が０でない場合、過去の修正値Ｘ^＾ _ＵＤ（ｋ）’と修正値Ｘ^＾ _ＵＤ（ｋ）とを重み付き加算した値を平滑化値Ｘ^＾ _ＰＯＳＴ（ｋ）として出力する。Ｘ^＾ _ＵＤ（ｋ）’が０の場合、平滑化部１２６は、修正値の重み付き加算、すなわち修正値の平滑化を行わず、Ｘ^＾ _ＵＤ（ｋをＸ^＾ _ＰＯＳＴ（ｋ）として出力する（図５／ステップＤ４’）。過去の修正値Ｘ^＾ _ＵＤ（ｋ）’の例は、修正値Ｘ^＾ _ＵＤ（ｋ）に対応するフレームの１フレーム過去のステップＤ３で得られた修正値や、修正値Ｘ^＾ _ＵＤ（ｋ）に対応するフレームの１フレーム過去のステップＤ４’で得られた平滑化値などである。

　Ｘ^＾ _ＰＯＳＴ（ｋ）は次式のように表わされる。αとβは調整係数であり、求める性能及び仕様に応じて適宜決定される。例えば、α＝０．８５、β＝０．１５である。φ（・）は・の正負符号を表す。

　これにより、Ｘ^＾ _ＵＤ（ｋ）の振幅特性の時間軸方向の不連続性によって生じるミュージカルノイズ等を軽減することができる。時間領域での復号信号が必要な場合、平滑化部１２６から出力されたＸ^＾ _ＰＯＳＴ（ｋ）は時間領域変換部１２５に入力され、時間領域変換部１２５はＸ^＾ _ＰＯＳＴ（ｋ）を例えば逆フーリエ変換により時間領域信号ｚ（ｎ）に変換して出力する。

　その他、α、βは、求められる性能及び仕様に応じて適宜変更されてもよい。
　また、入力信号Ｘ（ｋ）は、周波数領域信号である必要はなく、時間領域信号等の任意の信号であってもよい。すなわち、この発明は、周波数領域信号以外の任意の信号に対する符号化、復号に用いることができる。この場合、同一の行番号ｍに対応する各勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）は、例えばｋ’（勾配係数γ_ｍ（ｋ’）に対応する時間に対応する値）を第１軸にとりγ_ｍ（ｋ’）（勾配係数の値）を第２軸にとる（ｋ’, γ_ｍ（ｋ’））平面上の直線又は特定の曲線に偏って分布するものとする。より具体的には、例えば同一の行番号ｍに対応する各勾配係数γ_ｍ（０），・・・, γ_ｍ（Ｃ_０－１）が、（ｋ’, γ_ｍ（ｋ’））平面上の直線上又は特定の曲線上に位置するものとする。なお、この変形例ではｋ，ｋ’が離散時間に対応する離散時間番号であり、「サンプルそれぞれの位置」は、離散時間番号ｋに対応する時間軸上の位置である。ｋ，ｋ’が離散時間番号である場合、ｋ，ｋ’の値が大きいほど遅い時間に対応する。

　また、フレームごとに入力信号Ｘ（ｋ）に対する正規化値Ｆ_ＧＡＩＮが定められ、ベクトル量子化部１１５が入力信号の各サンプルの値Ｘ（ｋ）の代わりにＸ（ｋ）を正規化値Ｆ_ＧＡＩＮで正規化した値を用い、量子化正規化値_τＸ^－の代わりに_τＸ^－を正規化値Ｆ_ＧＡＩＮで正規化した値を用い、ステップＥ３の処理が実行されてもよい。例えば、Ｘ（ｋ）がＸ（ｋ）／Ｆ_ＧＡＩＮに置換され、_τＸ^－が_τＸ^－／Ｆ_ＧＡＩＮに置換されて、ステップＥ３の処理が実行されてもよい。また、この場合、正規化値計算部１１２が存在せず、正規化値量子化部１１３に量子化正規化値_τＸ^－の代わりにＸ（ｋ）を正規化値Ｆ_ＧＡＩＮで正規化した値が入力されてもよい。この場合、ベクトル量子化部１１５が、量子化正規化値_τＸ^－の代わりにＸ（ｋ）を正規化値Ｆ_ＧＡＩＮで正規化した値の量子化値を用いてステップＥ３の処理を行ってもよい。正規化値量子化インデックスが正規化値Ｆ_ＧＡＩＮで正規化した値の量子化値に対応するものであってもよい。

　また、上記実施形態では、符号化装置１０の勾配計算部１１６が、ｉｄｘ＞０であるか否かを判定し、ｉｄｘ＞０であれば複数の量子化値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を更新し、ｉｄｘ＞０でなければ更新しないこととした（図４／ステップＥ４１８～Ｅ４２１）。また、復号装置１２の勾配修正部１２４が、ｉｄｘ＞０であるか否かを判定し、ｉｄｘ＞０であれば複数の量子化値Ｘ^＾（ｂ・Ｃ_０），…，Ｘ^＾（（ｂ＋１）・Ｃ_０－１）を更新し、ｉｄｘ＞０でなければ更新しないこととした（図７／ステップＤ３１２～Ｄ３１４）。これらの変形として、式（１）に示した勾配行列γに１の要素のみからなる行番号ｍ＝－１の行ベクトル（勾配係数ベクトル）γ_－１＝［γ_－１（０）,・・・,γ_－１（Ｃ_０－１）］＝［１,・・・,１］を付加し、ｉｄｘ＞０であるか否かにかかわらず勾配計算部１１６や勾配修正部１２４が、以下のような演算を行ってもよい。

　また、例示した行番号ｍやインデックス情報ｉｄｘの具体的な数値は本発明を限定するものではなく、例示したｍやｉｄｘの番号が繰り上がっても良いし、繰り下がってもよいし、一部の番号が使用されなくてもよい。
　また、上記の実施形態ではインデックス情報ｉｄｘを未使用ビット数Ｕの未使用ビット領域に格納する例を示したが、インデックス情報ｉｄｘが未使用ビット領域に格納されない形態であってもよい。

　また、インデックス情報ｉｄｘが符号に含まれるビット数Ｕのその他の有限ビット領域に格納される形態であってもよい。この場合、上述の「未使用ビット領域」が「有限ビット領域」に置換され、「未使用ビット数Ｕ」が「有限ビット領域のビット数Ｕ」に置換された処理が実行されてもよい。
　また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

　ハードウェア、プログラム及び記録媒体：
　上述した符号化装置１１や復号装置１２は、例えば、CPU(central processing unit)やRAM(random-access memory)などからなる公知又は専用のコンピュータと上述の処理内容が記述された特別なプログラムとから構成される。この場合、特別なプログラムはCPUに読み込まれ、CPUが特別なプログラムを実行することによって各機能が実現される。また、特別なプログラムは、単一のプログラム列によって構成されてもよいし、他のプログラムやライブラリを読み出して目的の機能を達成するものであってもよい。

　このようなプログラムは、コンピュータで読み取り可能記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。コンピュータで読み取り可能な記録媒体の例は非一時的な（non-transitory）記録媒体である。プログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、プログラムを流通させてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。

　また、符号化装置１１や復号装置１２の処理部の少なくとも一部が特別な集積回路によって構成されてもよい。

１１　符号化装置
１１１　周波数領域変換部
１１２　正規化値計算部
１１３　正規化値量子化部
１１５　ベクトル量子化部
１１６　勾配計算部
１２　復号装置
１２１　正規化値復号部
１２２　ベクトル復号部
１２４　勾配修正部
１２５　時間領域変換部
１２６　平滑化部

Claims

　複数のサンプルをまとめてベクトル量子化してベクトル量子化インデックスと前記複数のサンプルそれぞれの量子化値を求めるベクトル量子化ステップと、
　ベクトル量子化インデックスに対応する符号用に割り当てられたビット数から前記ベクトル量子化インデックスに対応する符号に用いられたビット数を減算して得られる数以下のビット数を、それぞれが複数のサンプル位置からなり聴覚特性に基づく優先順位が与えられた複数のサンプル位置集合のうちの１個以上のサンプル位置集合に、前記聴覚特性に基づく所定の優先順位に従って割り当てるビット割当ステップと、
　前記ビット割当ステップでビット数が割り当てられたサンプル位置集合それぞれについて、複数組の、前記サンプルそれぞれの位置に対応する予め定めた係数による組のうち、該サンプル位置集合に属するサンプルの値と、該サンプル位置集合に属するサンプルの量子化値と前記サンプルそれぞれの位置に対応する係数とを乗算した値との間の誤差の該サンプル位置集合に属する全サンプル位置についての和を最小にする係数の組を表すインデックス情報を出力する係数組選択ステップと、
　を有する符号化方法。
　請求項１の符号化方法であって、
　前記サンプル位置集合の何れかである第１サンプル位置集合に割り当てられるビット数は、当該第１サンプル位置集合よりも前記優先順位が低い前記サンプル位置集合の何れかである第２サンプル位置集合に割り当てられるビット数以上である。
　請求項１の符号化方法であって、
　前記ビット割当ステップは、
　前記ベクトル量子化インデックスに対応する符号に用いられなかったビット数のうち前記サンプル位置集合の何れにも割り当てられていない残りのビット数が、前記複数のサンプル位置集合のうちビット数の割り当てが行われていないサンプル位置集合の個数よりも大きくない場合に、ビット数の割り当てが行われていない前記サンプル位置集合のうち最も前記優先順位が高いものに第１ビット数を割り当て、
　前記残りのビット数が、前記複数のサンプル位置集合のうちビット数の割り当てが行われていないサンプル位置集合の個数よりも大きい場合に、ビット数の割り当てが行われていない前記サンプル位置集合のうち最も前記優先順位が高いものに前記第１ビット数よりも大きな第２ビット数を割り当てるステップを含む。
　請求項１から３の何れかの符号化方法であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線上にある係数により構成される。
　請求項１から３の何れかの符号化方法であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線又は特定の曲線に偏って分布する係数により構成される。
　入力されたベクトル量子化インデックスに対応する複数の値を複数のサンプル位置それぞれに対応する復号値として求めるベクトル復号ステップと、
　前記サンプル位置を構成する複数のサンプル位置集合のうち、聴覚特性に基づく所定の優先順位に従ってビット数が割り当てられたサンプル位置の集合を処理対象として、入力されたインデックス情報が表す、複数のサンプル位置に対応する予め定めた係数による組を用い、前記処理対象のサンプル位置集合に含まれる各サンプル位置に対応する、前記復号値と前記係数とを乗算した値を出力する係数乗算ステップと、
　を有する復号方法。
　請求項６の復号方法であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線上にある係数により構成される。
　請求項６の復号方法であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線又は特定の曲線に偏って分布する係数により構成される。
　複数のサンプルをまとめてベクトル量子化してベクトル量子化インデックスと前記複数のサンプルそれぞれの量子化値を求めるベクトル量子化部と、
　ベクトル量子化インデックスに対応する符号用に割り当てられたビット数から前記ベクトル量子化インデックスに対応する符号に用いられたビット数を減算して得られる数以下のビット数を、それぞれが複数のサンプル位置からなり聴覚特性に基づく優先順位が与えられた複数のサンプル位置集合のうちの１個以上のサンプル位置集合に、前記聴覚特性に基づく所定の優先順位に従って割り当てるビット割当部と、
　前記ビット割当部でビット数が割り当てられたサンプル位置集合それぞれについて、複数組の、前記サンプルそれぞれの位置に対応する予め定めた係数による組のうち、該サンプル位置集合に属するサンプルの値と、該サンプル位置集合に属するサンプルの量子化値と前記サンプルそれぞれの位置に対応する係数とを乗算した値との間の誤差の該サンプル位置集合に属する全サンプル位置についての和を最小にする係数の組を表すインデックス情報を出力する係数組選択部と、
　を有する符号化装置。
　請求項９の符号化装置であって、
　前記サンプル位置集合の何れかである第１サンプル位置集合に割り当てられるビット数は、当該第１サンプル位置集合よりも前記優先順位が低い前記サンプル位置集合の何れかである第２サンプル位置集合に割り当てられるビット数以上である。
　請求項９の符号化装置であって、
　前記ビット割当部は、
　前記ベクトル量子化インデックスに対応する符号に用いられなかったビット数のうち前記サンプル位置集合の何れにも割り当てられていない残りのビット数が、前記複数のサンプル位置集合のうちビット数の割り当てが行われていないサンプル位置集合の個数よりも大きくない場合に、ビット数の割り当てが行われていない前記サンプル位置集合のうち最も前記優先順位が高いものに第１ビット数を割り当て、
　前記残りのビット数が、前記複数のサンプル位置集合のうちビット数の割り当てが行われていないサンプル位置集合の個数よりも大きい場合に、ビット数の割り当てが行われていない前記サンプル位置集合のうち最も前記優先順位が高いものに前記第１ビット数よりも大きな第２ビット数を割り当てるように構成される。
　請求項９から１１の何れかの符号化装置であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線上にある係数により構成される。
　請求項９から１１の何れかの符号化装置であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線又は特定の曲線に偏って分布する係数により構成される。
　入力されたベクトル量子化インデックスに対応する複数の値を複数のサンプル位置それぞれに対応する復号値として求めるベクトル復号部と、
　前記サンプル位置を構成する複数のサンプル位置集合のうち、聴覚特性に基づく所定の優先順位に従ってビット数が割り当てられたサンプル位置の集合を処理対象として、入力されたインデックス情報が表す、複数のサンプル位置に対応する予め定めた係数による組を用い、前記処理対象のサンプル位置集合に含まれる各サンプル位置に対応する、前記復号値と前記係数とを乗算した値を出力する係数乗算部と、
　を有する復号装置。
　請求項１４の復号装置であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線上にある係数により構成される。
　請求項１４の復号装置であって、
　前記係数による組は、
　前記係数が対応するサンプル位置に対応する時間又は周波数の値を第１軸にとり前記係数の値を第２軸にとる平面上の直線又は特定の曲線に偏って分布する係数により構成される。
　請求項１の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
　請求項６の復号方法の各ステップをコンピュータに実行させるためのプログラム。
　請求項１の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
　請求項６の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。