JP2018067010A

JP2018067010A - 符号化方法、符号化装置、プログラム及び記録媒体

Info

Publication number: JP2018067010A
Application number: JP2017247615A
Authority: JP
Inventors: 守谷　健弘; Takehiro Moriya; 健弘守谷; 優鎌本; Masaru Kamamoto; 登原田; Noboru Harada; 弘和亀岡; Hirokazu Kameoka; 亮介杉浦; Ryosuke Sugiura
Original assignee: Nippon Telegraph and Telephone Corp; University of Tokyo NUC
Current assignee: Nippon Telegraph and Telephone Corp; University of Tokyo NUC
Priority date: 2014-04-24
Filing date: 2017-12-25
Publication date: 2018-04-26
Anticipated expiration: 2035-02-16
Also published as: CN106233383B; US20170249947A1; KR101872905B1; JPWO2015162979A1; CN110503963B; JP6486450B2; EP3648103A1; US20200043506A1; EP3648103B1; US20190259403A1; ES2713410T3; TR201900472T4; JP2018077501A; US10504533B2; KR101972007B1; CN110503963A; JP6270992B2; US10332533B2; ES2901749T3; JP2019091075A

Abstract

【課題】周波数領域の符号化の符号化歪を従来よりも小さくし、かつ、時間領域の符号化で用いる前フレームの量子化済ＬＳＰパラメータに対応するＬＳＰパラメータを周波数領域の符号化で得られた線形予測係数と等価な係数から得る。
【解決手段】ＬＳＰ線形変換部（３００）は、pを１以上の整数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、ω[1],ω[2],…,ω[p]を線形予測係数列a[1],a[2],…,a[p]に由来する周波数領域パラメータ列とし、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める。
【選択図】図８

Description

この発明は、符号化技術に関し、特に、線形予測係数と等価な周波数領域のパラメータを変換する技術に関する。

音声信号や音響信号の符号化では、入力音響信号を線形予測分析して得た線形予測係数を用いて符号化する手法が広く用いられている。

例えば、非特許文献１や非特許文献２では、フレーム毎の入力音響信号を周波数領域での符号化方法または時間領域での符号化方法により符号化する。周波数領域での符号化方法と時間領域での符号化方法のどちらを用いるかは、各フレームの入力音響信号の特性に応じて決定される。

時間領域での符号化方法でも、周波数領域での符号化方法でも、入力音響信号を線形予測分析して得た線形予測係数をＬＳＰパラメータの列に変換し、ＬＳＰパラメータの列を符号化してＬＳＰ符号を得るとともにＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列を得る。時間領域での符号化方法では、現フレームの量子化済ＬＳＰパラメータ列と前フレームの量子化済ＬＳＰパラメータ列とから得られる線形予測係数を時間領域のフィルタである合成フィルタのフィルタ係数として用い、適応符号帳に含まれる波形と固定符号帳に含まれる波形とを合成した信号に合成フィルタを適用して合成信号を求め、求めた合成信号と入力音響信号との歪みが最小となるように各符号帳のインデックスを決定することで符号化する。

周波数領域での符号化方法では、量子化済ＬＳＰパラメータ列を線形予測係数に変換して量子化済線形予測係数列を求め、求めた量子化済線形予測係数列を平滑化して補正済量子化済線形予測係数列を求め、補正済量子化済線形予測係数に対応する周波数領域の系列であるパワースペクトル包絡系列の各値を用いて、入力音響信号を周波数領域に変換した周波数領域信号系列の各値を正規化することでスペクトル包絡の影響を取り除いた信号を求め、求めた信号をスペクトル包絡情報を考慮して可変長符号化する。

このように、周波数領域での符号化方法と時間領域での符号化方法では、入力音響信号を線形予測分析して得た線形予測係数が共通に用いられる。線形予測係数は、ＬＳＰ（Line Spectrum Pair）パラメータやＩＳＰ（Immittance Spectrum Pairs）パラメータなどの線形予測係数と等価な周波数領域のパラメータの列に変換される。そして、ＬＳＰパラメータ列（もしくはＩＳＰパラメータ列）を符号化して得たＬＳＰ符号（もしくはＩＳＰ符号）が復号装置へ送られる。量子化や補間で使われるＬＳＰパラメータの０からπまでの周波数を特にＬＳＰ周波数（LSP Frequency: LSF）、あるいはＩＳＰ周波数の場合（ISP Frequency: ISF）と区別して表記する場合があるが、本願の説明ではこのような周波数のパラメータをＬＳＰパラメータ、ＩＳＰパラメータと表記して説明する。

図１及び図２を参照して、従来の符号化装置の処理をより具体的に説明する。

以下の説明では、p個のＬＳＰパラメータからなるＬＳＰパラメータ列をθ[1],θ[2],…,θ[p]と表記する。pは１以上の整数の予測次数である。角括弧（[]）内の記号はインデックスを表す。例えば、θ[i]はＬＳＰパラメータ列θ[1],θ[2],…,θ[p]中のi番目のＬＳＰパラメータである。

θの右肩に角括弧で表記されている記号はフレーム番号を表す。例えば、f番目のフレームの音響信号について生成されるＬＳＰパラメータ列をθ^[f][1],θ^[f][2],…,θ^[f][p]と表記する。ただし、多くの処理はフレーム内で閉じて行われることから、現在のフレーム（f番目のフレーム）に対応するパラメータについては右肩のフレーム番号の記載を省略して表記する。フレーム番号の記載が省略されている場合は、現在のフレームについて生成されたパラメータを指すものとする。つまり、
θ[i]=θ^[f][i]
である。

右肩に角括弧なしで表記されている記号はべき乗演算を表す。つまり、θ^k[i]はθ[i]のk乗を表す。

文中で使用する記号「~」「＾」「⁻」等は、本来直後の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直前に記載する。数式中においてはこれらの記号は本来の位置、すなわち文字の真上に記述している。

ステップＳ１００において、従来の符号化装置９に、所定の時間区間であるフレーム単位の時間領域の音声音響ディジタル信号（以下、入力音響信号という）が入力される。符号化装置９は、入力音響信号に対してフレームごとに以下の各処理部の処理を行う。

フレーム単位の入力音響信号は、線形予測分析部１０５、特徴量抽出部１２０、周波数領域符号化部１５０及び時間領域符号化部１７０へ入力される。

ステップＳ１０５において、線形予測分析部１０５は、フレーム単位の入力音響信号を線形予測分析して、線形予測係数列a[1],a[2],…,a[p]を求めて出力する。ここで、a[i]はi次の線形予測係数である。線形予測係数列の各係数a[i]は、入力音響信号ｚを式（１）で表される線形予測モデルによりモデル化したときの係数a[i]（i=1,2,…,p）である。

線形予測分析部１０５から出力された線形予測係数列a[1],a[2],…,a[p]はＬＳＰ生成部１１０へ入力される。

ステップＳ１１０において、ＬＳＰ生成部１１０は、線形予測分析部１０５から出力された線形予測係数列a[1],a[2],…，a[p]に対応するＬＳＰパラメータの系列θ[1],θ[2],…,θ[p]を求めて出力する。以降の説明では、ＬＳＰパラメータの系列θ[1],θ[2],…,θ[p]をＬＳＰパラメータ列と呼ぶ。ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]は、式（２）で定義される和多項式及び式（３）で定義される差多項式の根として定義されるパラメータの系列である。

ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]は、値が小さい順に並んだ系列である。つまり、
0<θ[1]<θ[2]<…<θ[p]<π
を満たす。

ＬＳＰ生成部１１０から出力されたＬＳＰパラメータ列θ[1],θ[2],…,θ[p]はＬＳＰ符号化部１１５へ入力される。

ステップＳ１１５において、ＬＳＰ符号化部１１５は、ＬＳＰ生成部１１０から出力されたＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化し、ＬＳＰ符号C1と、そのＬＳＰ符号C1に対応する量子化されたＬＳＰパラメータの系列^θ[1],^θ[2],…,^θ[p]を求めて出力する。以降の説明では、量子化されたＬＳＰパラメータの系列^θ[1],^θ[2],…,^θ[p]を量子化済ＬＳＰパラメータ列と呼ぶ。

ＬＳＰ符号化部１１５から出力される量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]は、量子化済線形予測係数生成部９００、遅延入力部１６５及び時間領域符号化部１７０へ入力される。また、ＬＳＰ符号化部１１５から出力されるＬＳＰ符号C1は出力部１７５へ入力される。

ステップＳ１２０において、特徴量抽出部１２０は、入力音響信号の時間変動の大きさを特徴量として抽出する。特徴量抽出部１２０は、抽出した特徴量が所定の閾値より小さい場合（すなわち、入力音響信号の時間変動が小さい場合）には量子化済線形予測係数生成部９００が後続の処理を実行するよう制御する。また同時に、周波数領域符号化方法を示す情報を識別符号Cgとして出力部１７５へ入力する。一方、特徴量抽出部１２０は、抽出した特徴量が所定の閾値以上の場合（すなわち、入力音響信号の時間変動が大きい場合）には時間領域符号化部１７０が後続の処理を実行するように制御する。また同時に、時間領域符号化方法を示す情報を識別符号Cgとして出力部１７５へ入力する。

量子化済線形予測係数生成部９００、量子化済線形予測係数補正部９０５、近似平滑化済パワースペクトル包絡系列計算部９１０及び周波数領域符号化部１５０の各処理は、特徴量抽出部１２０で抽出した特徴量が所定の閾値より小さい場合（すなわち、入力音響信号の時間変動が小さい場合）に実行される（ステップＳ１２１）。

ステップＳ９００において、量子化済線形予測係数生成部９００は、ＬＳＰ符号化部１１５から出力された量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]から線形予測係数の系列^a[1],^a[2],…,^a[p]を求めて出力する。以降の説明では、線形予測係数の系列^a[1],^a[2],…,^a[p]を量子化済線形予測係数列と呼ぶ。

量子化済線形予測係数生成部９００から出力された量子化済線形予測係数列^a[1],^a[2],…,^a[p]は量子化済線形予測係数補正部９０５へ入力される。

ステップＳ９０５において、量子化済線形予測係数補正部９０５は、量子化済線形予測係数生成部９００から出力された量子化済線形予測係数列^a[1],^a[2],…,^a[p]のi次の係数^a[i]（i=1,…,p）に補正係数γRのi乗を乗じた値^a[i]×(γR)ⁱの系列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pを求めて出力する。ここで、補正係数γRは予め定めた１以下の正の整数である。以降の説明では、系列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pを補正済量子化済線形予測係数列と呼ぶ。

量子化済線形予測係数補正部９０５から出力された補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pは近似平滑化済パワースペクトル包絡系列計算部９１０へ入力される。

ステップＳ９１０において、近似平滑化済パワースペクトル包絡系列計算部９１０は、量子化済線形予測係数補正部９０５から出力された補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pの各係数^a[i]×(γR)ⁱを用いて、式（４）により、近似平滑化済パワースペクトル包絡系列~W_γR[1],~W_γR[2],…,~W_γR[N]を生成して出力する。ここで、exp(・)はネイピア数を底とする指数関数であり、jは虚数単位であり、σ²は予測残差エネルギーである。

式（４）で定義されている通り、近似平滑化済パワースペクトル包絡系列~W_γR[1],~W_γR[2],…,~W_γR[N]は補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pに対応する周波数領域の系列である。

近似平滑化済パワースペクトル包絡系列計算部９１０から出力される近似平滑化済パワースペクトル包絡系列~W_γR[1],~W_γR[2],…,~W_γR[N]は周波数領域符号化部１５０へ入力される。

以下に、式（４）により定義される値の系列を近似平滑化済パワースペクトル包絡系列と呼ぶ理由を説明する。

全極型モデルであるp次自己回帰過程により、時刻tでの入力音響信号x[t]は、p時点まで遡った過去の自分自身の値x[t-1],…,x[t-p]、予測残差e[t]及び線形予測係数a[1],a[2],…,a[p]によって、式（５）で表される。このとき、入力音響信号のパワースペクトル包絡系列W[1],W[2],…,W[N]の各係数W[n]（n=1,…,N）は式（６）で表される。

ここで、式（６）のa[i]をa[i]×(γR)ⁱに置き換えた

で定義される系列W_γR[1],W_γR[2],…,W_γR[N]は、式（６）で定義される入力音響信号のパワースペクトル包絡系列W[1],W[2],…,W[N]の振幅の凹凸を平滑化したものに相当する。すなわち、線形予測係数a[i]に補正係数γRのi乗を乗じることにより線形予測係数を補正する処理は、周波数領域においてパワースペクトル包絡の振幅の凹凸を鈍らせる処理（パワースペクトル包絡を平滑化する処理）に相当する。したがって、式（７）で定義される系列W_γR[1],W_γR[2],…,W_γR[N]を、平滑化済パワースペクトル包絡系列と呼ぶ。

式（４）で定義される系列~W_γR[1],~W_γR[2],…,~W_γR[N]は式（７）で定義される平滑化済パワースペクトル包絡系列W_γR[1],W_γR[2],…,W_γR[N]の各値の近似値の系列に相当する。したがって、式（４）で定義される系列~W_γR[1],~W_γR[2],…,~W_γR[N]を、近似平滑化済パワースペクトル包絡系列と呼ぶ。

ステップＳ１５０において、周波数領域符号化部１５０は、入力音響信号を周波数領域に変換した周波数領域信号列X[1],X[2],…,X[N]の各値X[n]（n=1,…,N）を近似平滑化済パワースペクトル包絡系列の各値~W_γR[n]の平方根で正規化し、正規化済周波数領域信号列X_N[1],X_N[2],…,X_N[N]を求める。つまり、X_N[n]=X[n]/sqrt(~W_γR[n])である。ここで、sqrt(y)はyの平方根を表す。続いて、周波数領域符号化部１５０は、正規化済周波数領域信号列X_N[1],X_N[2],…,X_N[N]を可変長符号化して周波数領域信号符号を生成する。

周波数領域符号化部１５０から出力される周波数領域信号符号は出力部１７５へ入力される。

遅延入力部１６５及び時間領域符号化部１７０は、特徴量抽出部１２０で抽出した特徴量が所定の閾値以上の場合（すなわち、入力音響信号の時間変動が大きい場合）に実行される（ステップＳ１２１）。

ステップＳ１６５において、遅延入力部１６５は、入力された量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を保持しておき、１フレーム分遅延させて時間領域符号化部１７０に出力する。例えば、現在のフレームがf番目のフレームであれば、f-1番目のフレームの量子化済ＬＳＰパラメータ列^θ^[f-1][1],^θ^[f-1][2],…,^θ^[f-1][p]を時間領域符号化部１７０に出力する。

ステップＳ１７０において、時間領域符号化部１７０では、適応符号帳に含まれる波形及び固定符号帳に含まれる波形を合成した信号に合成フィルタを適用して合成信号を求め、求めた合成信号と入力音響信号との歪みが最小となるように各符号帳のインデックスを決定することで符号化する。合成信号と入力音響信号との歪みが最小となるように各符号帳のインデックスを決定する際には、入力音響信号から合成信号を差し引いた信号に聴覚重み付けフィルタを適用した値が最小となるように各符号帳のインデックスが決定される。聴覚重み付けフィルタは、適応符号帳や固定符号帳を選択する際の歪を求めるためのフィルタである。

合成フィルタ及び聴覚重み付けフィルタのフィルタ係数は、f番目のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]及びf-1番目のフレームの量子化済ＬＳＰパラメータ列^θ^[f-1][1],^θ^[f-1][2],…,^θ^[f-1][p]を用いて生成する。

具体的には、まず、フレームを２つのサブフレームに分割し、以下のように合成フィルタ及び聴覚重み付けフィルタのフィルタ係数を決定する。

後半のサブフレームでは、合成フィルタのフィルタ係数には、f番目のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を線形予測係数に変換した係数列である量子化済線形予測係数列^a[1],^a[2],…,^a[p]の各係数^a[i]を用いる。また、聴覚重み付けフィルタのフィルタ係数には、量子化済線形予測係数列^a[1],^a[2],…,^a[p]の各係数^a[i]に補正係数γRのi乗を乗じた値の系列
^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^p
を用いる。

前半のサブフレームでは、合成フィルタのフィルタ係数には、f番目のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の各値^θ[i]と、f-1番目のフレームの量子化済ＬＳＰパラメータ列^θ^[f-1][1],^θ^[f-1][2],…,^θ^[f-1][p]の各値^θ^[f-1][i]との中間の値の系列、すなわち、各値^θ[i]と^θ^[f-1][i]を補間して得られる値の系列、である補間済量子化済ＬＳＰパラメータ列~θ[1],~θ[2],…,~θ[p]を線形予測係数に変換した係数列である補間済量子化済線形予測係数列~a[1],~a[2],…,~a[p]の各係数~a[i]を用いる。また、聴覚重み付けフィルタのフィルタ係数には、補間済量子化済線形予測係数列~a[1],~a[2],…,~a[p]の各係数~a[i]に補正係数γRのi乗を乗じた値の系列
~a[1]×(γR),~a[2]×(γR)²,…,~a[p]×(γR)^p
を用いる。

これにより、復号装置で生成される復号音響信号において、前のフレームの復号音響信号との繋がりを滑らかにする効果がある。なお、時間領域符号化部１７０で用いられる補正係数γは近似平滑化済パワースペクトル包絡系列計算部９１０で用いられる補正係数γと同じである。

ステップＳ１７５において、符号化装置９は、出力部１７５を介して、ＬＳＰ符号化部１１５の出力するＬＳＰ符号C1と、特徴量抽出部１２０の出力する識別符号Cgと、周波数領域符号化部１５０の出力する周波数領域信号符号または時間領域符号化部１７０の出力する時間領域信号符号のいずれかと、を復号装置へ送信する。

3rd Generation Partnership Project(3GPP), "Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions", Technical Specification (TS) 26.290, Version 10.0.0, 2011-03. M. Neuendorf, et al., "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types", Audio Engineering Society Convention 132, 2012.

補正係数γRは、入力音響信号からパワースペクトル包絡の影響を取り除く際に、高い周波数ほどパワースペクトル包絡の振幅の凹凸を鈍らせることで、より聴感覚を考慮した歪の小さい符号化を実現する役割がある。

周波数領域符号化部において聴感覚を考慮した歪の小さい符号化を実現するためには、近似平滑化済パワースペクトル包絡系列~W_γR[1],~W_γR[2],…,~W_γR[N]が平滑化済パワースペクトル包絡W_γR[1],W_γR[2],…,W_γR[N]を高精度で近似している必要がある。言い換えれば、
a_γR[i]=a[i]×(γR)ⁱ（i=1,…,p）
であるとして、補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pは補正済線形予測係数列a_γR[1],a_γR[2],…,a_γR[p]を高精度で近似する系列であることが望ましい。

ところが、従来の符号化装置のＬＳＰ符号化部では、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]とＬＳＰパラメータ列θ[1],θ[2],…,θ[p]との歪が最小となるように符号化処理が行われる。これは、聴感覚を考慮していない（すなわち、補正係数γRで平滑化していない）パワースペクトル包絡を高精度で近似するように量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を決定していることを意味する。ゆえに、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]から生成される補正済量子化済線形予測係数列^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^pと補正済線形予測係数列a_γR[1],a_γR[2],…,a_γR[p]との歪は最小とはならず、周波数領域符号化部の符号化歪が大きくなってしまう。

この発明の目的は、周波数領域の符号化と時間領域の符号化を入力音響信号の特性に応じて切り替えて用いる符号化技術において、周波数領域の符号化の符号化歪を従来よりも小さくし、かつ、時間領域の符号化で用いる前フレームの量子化済ＬＳＰパラメータに対応するＬＳＰパラメータを周波数領域の符号化で得られた線形予測係数やＬＳＰパラメータなどに代表される線形予測係数と等価な係数から得られるようにした符号化技術を提供することである。この発明の目的はまた、上記の符号化技術で用いられるような、線形予測係数と等価な係数から、平滑化の度合の異なる線形予測係数と等価な係数を生成することである。

上記の課題を解決するために、この発明の第一の態様の符号化方法は、pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、線形予測係数列a[1],a[2],…,a[p]を補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正ステップと、補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成ステップと、補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び補正済ＬＳＰ符号に対応する補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化ステップと、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換ステップと、補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を線形予測係数に変換した補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]を生成する量子化済線形予測係数列生成ステップと、補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]に対応する周波数領域の系列である量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成ステップと、ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及びＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化ステップと、音信号を、前の時間区間のＬＳＰ符号化ステップで得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換ステップで得た近似量子化済ＬＳＰパラメータ列のいずれかと、所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、を含み、パラメータ列変換ステップは、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める。

この発明の第二の態様の符号化方法は、pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、線形予測係数列a[1],a[2],…,a[p]を補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正ステップと、補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成ステップと、補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び補正済ＬＳＰ符号に対応する補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化ステップと、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換ステップと、補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]に基づいて量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成ステップと、ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及びＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化ステップと、音信号を、前の時間区間のＬＳＰ符号化ステップで得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換ステップで得た近似量子化済ＬＳＰパラメータ列のいずれかと、所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、を含み、パラメータ列変換ステップは、変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める。

この発明の符号化技術によれば、周波数領域の符号化の符号化歪を従来よりも小さくし、かつ、時間領域の符号化で用いる前フレームの量子化済ＬＳＰパラメータに対応するＬＳＰパラメータを周波数領域の符号化で得られた線形予測係数やＬＳＰパラメータなどに代表される線形予測係数と等価な係数から得られる。また、上記の符号化技術で用いられるような、線形予測係数と等価な係数から、平滑化の度合の異なる線形予測係数と等価な係数を生成することができる。

図１は、従来の符号化装置の機能構成を例示する図である。図２は、従来の符号化方法の処理フローを例示する図である。図３は、符号化装置と復号装置の関係を例示する図である。図４は、第一実施形態の符号化装置の機能構成を例示する図である。図５は、第一実施形態の符号化方法の処理フローを例示する図である。図６は、第一実施形態の復号装置の機能構成を例示する図である。図７は、第一実施形態の復号方法の処理フローを例示する図である。図８は、第二実施形態の符号化装置の機能構成を例示する図である。図９は、ＬＳＰパラメータの性質を説明するための図である。図１０は、ＬＳＰパラメータの性質を説明するための図である。図１１は、ＬＳＰパラメータの性質を説明するための図である。図１２は、第二実施形態の符号化方法の処理フローを例示する図である。図１３は、第二実施形態の復号装置の機能構成を例示する図である。図１４は、第二実施形態の復号方法の処理フローを例示する図である。図１５は、第二実施形態の変形例の符号化装置の機能構成を例示する図である。図１６は、第二実施形態の変形例の符号化方法の処理フローを例示する図である。図１７は、第三実施形態の符号化装置の機能構成を例示する図である。図１８は、第三実施形態の符号化方法の処理フローを例示する図である。図１９は、第三実施形態の復号装置の機能構成を例示する図である。図２０は、第三実施形態の復号方法の処理フローを例示する図である。図２１は、第四実施形態の符号化装置の機能構成を例示する図である。図２２は、第四実施形態の符号化方法の処理フローを例示する図である。図２３は、第五実施形態の周波数領域パラメータ列生成装置の機能構成を例示する図である。

以下、この発明の実施形態について説明する。なお、以下の説明に用いる図面中において同じ機能を有する構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。

［第一実施形態］
第一実施形態の符号化装置は、時間領域での符号化を行うフレームでは線形予測係数から変換されたＬＳＰパラメータを符号化してＬＳＰ符号を得て、周波数領域での符号化を行うフレームでは補正された線形予測係数から変換された補正済ＬＳＰパラメータを符号化して補正済ＬＳＰ符号を得て、周波数領域での符号化を行ったフレームの次のフレームで時間領域での符号化を行うときには、補正済ＬＳＰ符号に対応するＬＳＰパラメータに対応する線形予測係数を逆補正して得られる線形予測係数をＬＳＰに変換したものを次のフレームの時間領域での符号化で用いるＬＳＰパラメータとするものである。

第一実施形態の復号装置は、時間領域での復号を行うフレームではＬＳＰ符号を復号して得られるＬＳＰパラメータから変換された線形予測係数を得て時間領域での復号に用い、周波数領域での復号を行うフレームでは補正済ＬＳＰ符号を復号して得られる補正されたＬＳＰパラメータを周波数領域での復号に用い、周波数領域での復号を行ったフレームの次のフレームで時間領域での復号を行うときには、補正済ＬＳＰ符号に対応するＬＳＰパラメータに対応する線形予測係数を逆補正して得られる線形予測係数をＬＳＰに変換したものを次のフレームの時間領域での復号で用いるＬＳＰパラメータとするものである。

第一実施形態の符号化装置及び復号装置では、図３に示すように、符号化装置１に入力された入力音響信号が符号列に符号化され、その符号列が符号化装置１から復号装置２へ送られ、復号装置２により符号列が復号音響信号に復号され出力される。

＜符号化装置＞
符号化装置１は、図４に示すように、従来の符号化装置９と同様に、入力部１００、線形予測分析部１０５、ＬＳＰ生成部１１０、ＬＳＰ符号化部１１５、特徴量抽出部１２０、周波数領域符号化部１５０、遅延入力部１６５、時間領域符号化部１７０及び出力部１７５を例えば含み、さらに、線形予測係数補正部１２５、補正済ＬＳＰ生成部１３０、補正済ＬＳＰ符号化部１３５、量子化済線形予測係数生成部１４０、第１量子化済平滑化済パワースペクトル包絡系列計算部１４５、量子化済線形予測係数逆補正部１５５、逆補正済ＬＳＰ生成部１６０を例えば含む。

符号化装置１は、例えば、中央演算処理装置（Central Processing Unit、ＣＰＵ）、主記憶装置（Random Access Memory、ＲＡＭ）などを有する公知または専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。符号化装置１は、例えば、中央演算処理装置の制御のもとで各処理を実行する。符号化装置１に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。また、符号化装置１の各処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。

図４に示すとおり、第一実施形態の符号化装置１は、従来の符号化装置９と比較すると、特徴量抽出部１２０で抽出した特徴量が所定の閾値より小さい場合（すなわち、入力音響信号の時間変動が小さい場合）には、線形予測係数列a[1],a[2],…,a[p]をＬＳＰパラメータに変換した系列であるＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化してＬＳＰ符号C1を出力する代わりに、補正済線形予測係数列a_γR[1],a_γR[2],…,a_γR[p]をＬＳＰパラメータに変換した系列である補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]を符号化して補正済ＬＳＰ符号Cγが出力される点が異なる。

第一実施形態の構成では、前のフレームにおいて特徴量抽出部１２０で抽出した特徴量が所定の閾値より小さかった場合（すなわち、入力音響信号の時間変動が小さかった場合）には、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]が生成されないため、遅延入力部１６５に入力することができない。量子化済線形予測係数逆補正部１５５及び逆補正ＬＳＰ生成部１６０はそのために追加された処理部であり、前のフレームにおいて特徴量抽出部１２０で抽出した特徴量が所定の閾値より小さかった場合（すなわち、入力音響信号の時間変動が小さかった場合）に、補正済量子化済線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]から、時間領域符号化部１７０で用いる前のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の近似値の系列を生成するものである。ここでは、逆補正済ＬＳＰパラメータ列^θ’[1],^θ’[2],…,^θ’[p]が量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の近似値の系列である。

＜符号化方法＞
図５を参照して、第一実施形態の符号化方法を説明する。以下では、上述の従来技術との相違点を中心に説明する。

ステップＳ１２５において、線形予測係数補正部１２５は、線形予測分析部１０５から出力された線形予測係数列a[1],a[2],…，a[p]の各係数a[i]（i=1,…,p）に補正係数γRのi乗を乗じた係数a_γR[i]=a[i]×γRⁱの系列を求めて出力する。以降の説明では、求めた系列a_γR[1],a_γR[2],…,a_γR[p]を補正済線形予測係数列と呼ぶ。

線形予測係数補正部１２５から出力された補正済線形予測係数列a_γR[1],a_γR[2],…,a_γR[p]は補正済ＬＳＰ生成部１３０へ入力される。

ステップＳ１３０において、補正済ＬＳＰ生成部１３０は、線形予測係数補正部１２５から出力された補正済線形予測係数列a_γR[1],a_γR[2],…,a_γR[p]に対応するＬＳＰパラメータの系列である補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]を求めて出力する。補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]は、値が小さい順に並んだ系列である。つまり、
0<θ_γR[1]<θ_γR[2]<…<θ_γR[p]<π
を満たす。

補正済ＬＳＰ生成部１３０から出力された補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]は補正済ＬＳＰ符号化部１３５へ入力される。

ステップＳ１３５において、補正済ＬＳＰ符号化部１３５は、補正済ＬＳＰ生成部１３０から出力された補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]を符号化し、補正済ＬＳＰ符号Cγと、補正済ＬＳＰ符号Cγに対応する量子化された補正済ＬＳＰパラメータの系列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を生成して出力する。以降の説明では、系列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を補正済量子化済ＬＳＰパラメータ列と呼ぶ。

補正済ＬＳＰ符号化部１３５から出力される補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]は量子化済線形予測係数生成部１４０へ入力される。また、補正済ＬＳＰ符号化部１３５から出力される補正済ＬＳＰ符号Cγは出力部１７５へ入力される。

ステップＳ１４０において、量子化済線形予測係数生成部１４０は、補正済ＬＳＰ符号化部１３５から出力された補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から線形予測係数の系列^a_γR[1],^a_γR[2],…,^a_γR[p]を生成して出力する。以降の説明では、系列^a_γR[1],^a_γR[2],…,^a_γR[p]を補正済量子化済線形予測係数列と呼ぶ。

量子化済線形予測係数生成部１４０から出力された補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]は第１量子化済平滑化済パワースペクトル包絡系列計算部１４５及び量子化済線形予測係数逆補正部１５５へ入力される。

ステップＳ１４５において、第１量子化済平滑化済パワースペクトル包絡系列計算部１４５は、量子化済線形予測係数生成部１４０から出力された補正済量子化済線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]の各係数^a_γR[i]を用いて、式（８）により、量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を生成して出力する。

第１量子化済平滑化済パワースペクトル包絡系列計算部１４５から出力される量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]は周波数領域符号化部１５０へ入力される。

周波数領域符号化部１５０の処理は、近似平滑化済パワースペクトル包絡系列~W_γR[1],~W_γR[2],…,~W_γR[N]の代わりに、量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を用いる点を除いては、従来の符号化装置９の周波数領域符号化部１５０の処理と同じである。

ステップＳ１５５において、量子化済線形予測係数逆補正部１５５は、量子化済線形予測係数生成部１４０から出力された補正済量子化済線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]の各値^a_γR[i]を補正係数γRのi乗で除算した値a_γ[i]/(γR)ⁱの系列^a_γ[1]/(γR),^a_γ[2]/(γR)²,…,^a_γ[p]/(γR)^pを求めて出力する。以降の説明では、系列^a_γ[1]/(γR),^a_γ[2]/(γR)²,…,^a_γ[p]/(γR)^pを逆補正済線形予測係数列と呼ぶ。補正係数γRは、線形予測係数補正部１２５で用いた補正係数γRと同じ値とする。

量子化済線形予測係数逆補正部１５５から出力された逆補正済線形予測係数列^a_γ[1]/(γR),^a_γ[2]/(γR)²,…,^a_γ[p]/(γR)^pは逆補正済ＬＳＰ生成部１６０へ入力される。

ステップＳ１６０において、逆補正済ＬＳＰ生成部１６０は、量子化済線形予測係数逆補正部１５５から出力された逆補正済線形予測係数列^a_γ[1]/(γR),^a_γ[2]/(γR)²,…,^a_γ[p]/(γR)^pからＬＳＰパラメータの系列^θ’[1],^θ’[2],…,^θ’[p]を求めて出力する。以降の説明では、ＬＳＰパラメータの系列^θ’[1],^θ’[2],…,^θ’[p]を逆補正済ＬＳＰパラメータ列と呼ぶ。逆補正済ＬＳＰパラメータ列^θ’[1],^θ’[2],…,^θ’[p]は、値が小さい順に並んだ系列である。つまり、
0<^θ’[1]<^θ’[2]<…<^θ’[p]<π
を満たす系列である。

逆補正済ＬＳＰ生成部１６０から出力された逆補正済ＬＳＰパラメータ^θ’[1],^θ’[2],…,^θ’[p]は量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部１６５へ入力される。つまり、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を逆補正済ＬＳＰパラメータ^θ’[1],^θ’[2],…,^θ’[p]で代用する。

ステップＳ１７５において、符号化装置１は、出力部１７５を介して、ＬＳＰ符号化部１１５の出力するＬＳＰ符号C1と、特徴量抽出部１２０の出力する識別符号Cgと、補正済ＬＳＰ符号化部１３５の出力する補正済ＬＳＰ符号Cγと、周波数領域符号化部１５０の出力する周波数領域信号符号または時間領域符号化部１７０の出力する時間領域信号符号のいずれかと、を復号装置２へ送信する。

＜復号装置＞
復号装置２は、図６に示すように、入力部２００、識別符号復号部２０５、ＬＳＰ符号復号部２１０、補正済ＬＳＰ符号復号部２１５、復号線形予測係数生成部２２０、第１復号平滑化済パワースペクトル包絡系列計算部２２５、周波数領域復号部２３０、復号線形予測係数逆補正部２３５、復号逆補正済ＬＳＰ生成部２４０、遅延入力部２４５、時間領域復号部２５０及び出力部２５５を例えば含む。

復号装置２は、例えば、中央演算処理装置（Central Processing Unit、ＣＰＵ）、主記憶装置（Random Access Memory、ＲＡＭ）などを有する公知または専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。復号装置２は、例えば、中央演算処理装置の制御のもとで各処理を実行する。復号装置２に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。また、復号装置２の各処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。

＜復号方法＞
図７を参照して、第一実施形態の復号方法を説明する。

ステップＳ２００において、復号装置２に、符号化装置１が生成した符号列が入力される。符号列には、ＬＳＰ符号C1と、識別符号Cgと、補正済ＬＳＰ符号Cγと、周波数領域信号符号または時間領域信号符号のいずれかと、が含まれる。

ステップＳ２０５において、識別符号復号部２０５は、入力された符号列に含まれる識別符号Cgが周波数領域符号化方法を示す情報に対応する場合には補正済ＬＳＰ符号復号部２１５が次の処理を実行し、識別符号Cgが時間領域符号化方法を示す情報に対応する場合にはＬＳＰ符号復号部２１０が次の処理を実行するよう制御する。

補正済ＬＳＰ符号復号部２１５、復号線形予測係数生成部２２０、第１復号平滑化済パワースペクトル包絡系列計算部２２５、周波数領域復号部２３０、復号線形予測係数逆補正部２３５及び復号逆補正済ＬＳＰ生成部２４０は、入力された符号列に含まれる識別符号Cgが周波数領域符号化方法を示す情報に対応する場合に実行される（ステップＳ２０６）。

ステップＳ２１５において、補正済ＬＳＰ符号復号部２１５は、入力された符号列に含まれる補正済ＬＳＰ符号Cγを復号して復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を得て出力する。すなわち、補正済ＬＳＰ符号Cγに対応するＬＳＰパラメータの列である復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を得て出力する。ここで得られる復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]は、符号化装置１が出力した補正済ＬＳＰ符号Cγが符号誤り等の影響を受けずに正確に復号装置２へ入力された場合には、符号化装置１が生成する補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]と同じであるため同じ記号を用いる。

補正済ＬＳＰ符号復号部２１５から出力された復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]は復号線形予測係数生成部２２０へ入力される。

復号線形予測係数生成部２２０は、補正済ＬＳＰ符号復号部２１５から出力された復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から線形予測係数の系列^a_γR[1],^a_γR[2],…,^a_γR[p]を生成して出力する。以降の説明では、系列^a_γR[1],^a_γR[2],…,^a_γR[p]を復号補正済線形予測係数列と呼ぶ。

復号線形予測係数生成部２２０から出力された復号線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]は第１復号平滑化済パワースペクトル包絡系列計算部２２５及び復号線形予測係数逆補正部２３５へ入力される。

第１復号平滑化済パワースペクトル包絡系列計算部２２５は、復号線形予測係数生成部２２０から出力された復号補正済線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]の各係数^a_γR[i]を用いて、式（８）により、復号平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を生成して出力する。

第１復号平滑化済パワースペクトル包絡系列計算部２２５から出力される復号平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]は周波数領域復号部２３０へ入力される。

ステップＳ２３０において、周波数領域復号部２３０は、入力された符号列に含まれる周波数領域信号符号を復号して復号正規化済周波数領域信号列X_N[1],X_N[2],…,X_N[N]を求める。次に、周波数領域復号部２３０は、復号正規化済周波数領域信号列X_N[1],X_N[2],…,X_N[N]の各値X_N[n]（n=1,…,N）に、復号平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]の各値^W_γR[n]の平方根を乗じることにより、復号周波数領域信号列X[1],X[2],…,X[N]を得て出力する。つまり、X[n]=X_N[n]×sqrt(^W_γR[n])を計算する。そして、復号周波数領域信号列X[1],X[2],…,X[N]を時間領域に変換して復号音響信号を得て出力する。

ステップＳ２３５において、復号線形予測係数逆補正部２３５は、復号線形予測係数生成部２２０から出力された復号補正済線形予測係数列^a_γR[1],^a_γR[2],…,^a_γR[p]の各値^a_γR[i]を補正係数γRのi乗で除算した値^a_γ[i]/(γR)ⁱの系列^a_γR[1]/(γR),^a_γR[2]/(γR)²,…,^a_γR[p]/(γR)^pを求めて出力する。以降の説明では、系列^a_γR[1]/(γR),^a_γR[2]/(γR)²,…,^a_γR[p]/(γR)^pを復号逆補正済線形予測係数列と呼ぶ。補正係数γRは、符号化装置１の線形予測係数補正部１２５で用いた補正係数γRと同じ値とする。

復号線形予測係数逆補正部２３５から出力された復号逆補正済線形予測係数列^a_γR[1]/(γR),^a_γR[2]/(γR)²,…,^a_γR[p]/(γR)^pは復号逆補正済ＬＳＰ生成部２４０へ入力される。

ステップＳ２４０において、復号逆補正済ＬＳＰ生成部２４０は、復号逆補正済線形予測係数列^a_γR[1]/(γR),^a_γR[2]/(γR)²,…,^a_γR[p]/(γR)^pからＬＳＰパラメータの系列^θ’[1],^θ’[2],…,^θ’[p]を求めて出力する。以降の説明では、ＬＳＰパラメータの系列^θ’[1],^θ’[2],…,^θ’[p]を復号逆補正済ＬＳＰパラメータ列と呼ぶ。

復号逆補正済ＬＳＰ生成部２４０から出力された復号逆補正済ＬＳＰパラメータ^θ’[1],^θ’[2],…,^θ’[p]は復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部２４５へ入力される。

ＬＳＰ符号復号部２１０、遅延入力部２４５及び時間領域復号部２５０は、入力された符号列に含まれる識別符号Cgが時間領域符号化方法を示す情報に対応する場合に実行される（ステップＳ２０６）。

ステップＳ２１０において、ＬＳＰ符号復号部２１０は、入力された符号列に含まれるＬＳＰ符号C1を復号して復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を得て出力する。すなわち、ＬＳＰ符号C1に対応するＬＳＰパラメータの列である復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を得て出力する。

ＬＳＰ符号復号部２１０から出力された復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]は遅延入力部２４５及び時間領域復号部２５０へ入力される。

ステップＳ２４５において、遅延入力部２４５は、入力された復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を保持しておき、１フレーム分遅延させて時間領域復号部２５０に出力する。例えば、現在のフレームがf番目のフレームであれば、f-1番目のフレームの復号ＬＳＰパラメータ列^θ^[f-1][1],^θ^[f-1][2],…,^θ^[f-1][p]を時間領域符号化部２５０に出力する。

なお、入力された符号に含まれる識別符号Cgが周波数領域符号化方法を示す情報に対応する場合には、復号逆補正済ＬＳＰ生成部２４０から出力された復号逆補正済ＬＳＰパラメータ列^θ’[1],^θ’[2],…,^θ’[p]が復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部２４５へ入力される。

ステップＳ２５０において、時間領域復号部２５０は、入力された符号列に含まれる時間領域信号符号から、適応符号帳に含まれる波形及び固定符号帳に含まれる波形を特定する。特定された適応符号帳に含まれる波形及び固定符号帳に含まれる波形を合成した信号に合成フィルタを適用してスペクトル包絡の影響を取り除いた合成信号を求め、求めた合成信号を復号音響信号として出力する。

合成フィルタのフィルタ係数は、f番目のフレームの復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]及びf-1番目のフレームの復号ＬＳＰパラメータ列^θ^[f-1][1],^θ^[f-1][2],…,^θ^[f-1][p]を用いて生成する。

具体的には、まず、フレームを２つのサブフレームに分割し、以下のように合成フィルタのフィルタ係数を決定する。

後半のサブフレームでは、合成フィルタのフィルタ係数には、f番目のフレームの復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を線形予測係数に変換した係数列である復号線形予測係数^a[1],^a[2],…,^a[p]の各係数^a[i]に補正係数γRのi乗を乗じた値の系列
^a[1]×(γR),^a[2]×(γR)²,…,^a[p]×(γR)^p
を用いる。

前半のサブフレームでは、合成フィルタのフィルタ係数には、f番目のフレームの復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の各値^θ[i]とf-1番目のフレームの復号ＬＳＰパラメータ列θ^[f-1][1],θ^[f-1][2],…,θ^[f-1][p]の各値^θ^[f-1][i]との中間の値の系列である復号補間済ＬＳＰパラメータ列~θ[1],~θ[2],…,~θ[p]を線形予測係数に変換した係数列である復号補間済線形予測係数~a[1],~a[2],…,~a[p]の各係数~a[i]に補正係数γRのi乗を乗じた値の系列
~a[1]×(γR),~a[2]×(γR)²,…,~a[p]×(γR)^p
を用いる。つまり、
~θ[i]=0.5×^θ^[f-1][i]+0.5×^θ[i]（i=1,…,p）
である。

＜第一実施形態の効果＞
符号化装置１の補正済ＬＳＰ符号化部１３５では、補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]と補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]との量子化歪を最小化するような補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を求める。これにより、聴感覚を考慮した（すなわち、補正係数γRで平滑化した）パワースペクトル包絡系列を高精度で近似するように補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を決定することができる。補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を周波数領域に展開して得られるパワースペクトル包絡系列である量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]は、平滑化済パワースペクトル包絡系列W_γR[1],W_γR[2],…,W_γR[N]を高精度で近似することができる。ＬＳＰ符号C1と補正済ＬＳＰ符号Cγの符号量が同じであれば、第一実施形態の方が従来よりも周波数領域の符号化の符号化歪を小さくできる。また、従来の符号化方法と同じ符号化歪を仮定した場合は、ＬＳＰ符号C1よりも補正済ＬＳＰ符号Cγの方が従来よりも符号量が小さくなる。したがって、従来と同じ符号化歪であれば従来よりも符号量を小さくし、従来と同じ符号量であれば従来よりも符号化歪を小さくすることができる。

［第二実施形態］
第一実施形態の符号化装置１及び復号装置２では、特に逆補正済ＬＳＰ生成部１６０、復号逆補正済ＬＳＰ生成部２４０の計算コストが大きい。そこで、第二実施形態の符号化装置３では、線形予測係数を経由することなく、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の各値の近似値の系列である近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを直接生成する。同様に、第二実施形態の復号装置４では、線形予測係数を経由することなく、復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の各値の近似値の系列である復号近似ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを直接生成する。

＜符号化装置＞
図８に、第二実施形態の符号化装置３の機能構成を示す。

符号化装置３は、第一実施形態の符号化装置１と比較して、量子化済線形予測係数逆補正部１５５、逆補正ＬＳＰ生成部１６０を含まず、代わりにＬＳＰ線形変換部３００を含む点が異なる。

ＬＳＰ線形変換部３００では、ＬＳＰパラメータの性質を利用して、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]に近似的な線形変換を施して、近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを生成する。

まず、ＬＳＰパラメータの性質を説明する。

ＬＳＰ線形変換部３００では量子化されたＬＳＰパラメータの系列を近似変換の対象とするが、量子化されたＬＳＰパラメータの系列の性質は、量子化されていないＬＳＰパラメータ列の性質と基本的に同じであるため、まず、量子化されていないＬＳＰパラメータ列の性質を説明する。

ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]は入力音響信号のパワースペクトル包絡と相関性のある周波数領域のパラメータ列である。ＬＳＰパラメータ列の各値は入力音響信号のパワースペクトル包絡の極値の周波数位置と相関する。θ[i]とθ[i+1]の間の周波数位置にパワースペクトル包絡の極値が存在し、この極値の周りの接線の傾きが急峻であるほどθ[i]とθ[i+1]との間隔（つまり、θ[i+1]-θ[i]の値）が小さくなる。すなわち、パワースペクトル包絡の振幅の凹凸が急峻であるほど、各i（i=1,2,…,p-1）について、θ[i]とθ[i+1]との間隔が不均一になる。逆に、パワースペクトル包絡の凹凸がほとんどない場合は、各iについて、θ[i]とθ[i+1]との間隔が均等間隔に近くなる。

補正係数γが小さいほど、式（７）で定義される平滑化済パワースペクトル包絡系列W_γ[1],W_γ[2],…,W_γ[N]の振幅の凹凸は、式（６）で定義されるパワースペクトル包絡系列W[1],W[2],…,W[N]の振幅の凹凸と比較してなだらかになる。したがって、補正係数γの値が小さいほどθ[i]とθ[i+1]との間隔が均等間隔に近くなると言える。なお、γの影響がない（γ=0の）ときは、パワースペクトル包絡が平坦な場合に相当する。

補正係数γ=0としたときの補正済ＬＳＰパラメータθ_γ=0[1],θ_γ=0[2],…,θ_γ=0[p]は、

となり、すべてのi=1,…,p-1についてθ[i]とθ[i+1]の間隔が等間隔になる。また、γ=1としたとき、補正済ＬＳＰパラメータ列θ_γ=1[1],θ_γ=1[2],…,θ_γ=1[p]とＬＳＰパラメータ列θ[1],θ[2],…,θ[p]は等価である。なお、補正済ＬＳＰパラメータは、
0<θ_γ[1]<θ_γ[2]…<θ_γ[p]<π
の性質を満たす。

図９は、補正係数γと補正済ＬＳＰパラメータθ_γ[i]（i=1,2,…,p）の関係の一例である。横軸は補正係数γの値であり、縦軸は補正済ＬＳＰパラメータの値を表す。予測次数p=16として、下から順にθ_γ[1],θ_γ[2],…,θ_γ[16]の値を図示したものである。各θ_γ[i]の値は、ある音声音響信号を線形予測分析して得た線形予測係数列a[1],a[2],…,a[p]を用いて、線形予測係数補正部１２５と同様の処理により、各γの値ごとに補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を求め、補正済ＬＳＰ生成部１３０と同様の処理により、補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]をＬＳＰパラメータに変換して得たものである。なお、γ=1のときのθ_γ=１[i]はθ[i]と等価である。

図９に示されているように、0<γ<1として、ＬＳＰパラメータθ_γ[i]は、θ_γ=0[i]とθ_γ=1[i]の内分点になる。横軸を補正係数γの値とし、縦軸をＬＳＰパラメータの値とする二次元平面において、各ＬＳＰパラメータθ_γ[i]は、局所的に見ればγの増加または減少に対して線形な関係にある。異なる２つの補正係数γ1、γ2（0<γ1<γ2≦1）として、二次元平面上の点（γ1,θ_γ１[i]）と点（γ2,θ_γ2[i]）を結ぶ直線の傾きの大きさは、ＬＳＰパラメータ列θ_γ１[1],θ_γ１[2],…,θ_γ１[p]中のθ_γ１[i]の前後のＬＳＰパラメータ（つまり、θ_γ１[i-1]とθ_γ１[i+1]）とθ_γ１[i]との相対的な間隔と相関性がある。具体的には、

である場合、

という性質が成り立ち、

である場合、

という性質が成り立つ。

式（９）（１０）は、θ_γ１[i]がθ_γ１[i+1]とθ_γ１[i-1]の中点よりもθ_γ１[i+1]寄りの場合は、θ_γ2[i]はさらにθ_γ2[i+1]寄りの値となることを示す（図１０参照）。このことは、横軸をγの値とし、縦軸をＬＳＰパラメータの値とする二次元平面上における点（0,θ_γ=0[i]）と点（γ1,θ_γ1[i]）を結ぶ直線L1の傾きよりも、点（γ1,θ_γ1[i]）と点（γ2,θ_γ2[i]）を結ぶ直線L2の傾きの方が大きいことを意味する（図１１参照）。

式（１１）（１２）は、θ_γ1[i]がθ_γ1[i+1]とθ_γ1[i-1]の中点よりもθ_γ1[i-1]寄りのときは、θ_γ2[i]はさらにθ_γ2[i-1]寄りの値となることを示す。このことは、横軸をγの値とし、縦軸をＬＳＰパラメータの値とする二次元平面上における点（0,θ_γ=0[i]）と点（γ1,θ_γ1[i]）を結ぶ直線の傾きよりも、点（γ1,θ_γ1[i]）と点（γ2,θ_γ2[i]）を結ぶ直線の傾きの方が小さいことを意味する。

以上の性質に基づけば、θ_γ1[1],θ_γ1[2],…,θ_γ1[p]とθ_γ2[1],θ_γ2[2],…,θ_γ2[p]の関係は、Θ_γ1=(θ_γ1[1],θ_γ1[2],…,θ_γ1[p])^Tとし、Θ_γ2=(θ_γ2[1],θ_γ2[2],…,θ_γ2[p])^Tとし、式（１３）でモデル化することができる。

ただし、Kは式（１４）で定義されるp×p行列である。

ここでは、0<γ1、γ2≦1、かつ、γ1≠γ2である。式（９）〜（１２）ではγ1<γ2と仮定して関係性を記述したが、式（１３）のモデルではγ1とγ2の大小関係に制限はなく、γ1<γ2であってもγ1>γ2であってもよい。

行列Kは対角成分とその近傍の要素のみ非零の値を持つ帯行列であり、対角成分に対応するＬＳＰパラメータとそれに隣接するＬＳＰパラメータとの間に成り立つ上述の相関関係を表現する行列である。なお、式（１４）では帯幅３の帯行列を例示したが、帯幅は３に限定されない。

ここで、

とすれば、
~Θ_γ2=(~θ_γ2[1],~θ_γ2[２],…,~θ_γ2[p])^T
はΘ_γ2の近似値である。

式（１３ａ）を展開すると以下の式（１５）が得られる。

ただし、i=2,…,p-1とする。

横軸をγの値とし、縦軸をＬＳＰパラメータの値とする二次元平面上の点(γ1,θ_γ1[i])と点(0,θ_γ=0[i])を結ぶ直線L1の延線上のγ2に対応する縦軸の値、つまり、θ_γ1[i]とθ_γ=0[i]を結ぶ直線L1の傾きから直線近似したときのγ2に対応する縦軸の値を⁻θ_γ2[i]とする（図１１参照）。すると、

が成り立つ。γ1>γ2ならば直線補間、γ1<γ2ならば直線外挿を意味する。

式（１４）において、

とすれば、~θ_γ2[i]=⁻θ_γ2[i]となり、式（１３ａ）のモデルにより得られる~θ_γ2[i]は、二次元平面上の点(γ1,θ_γ1[i])と点(0,θ_γ=0[i])を結ぶ直線により直線近似した場合のγ2に対応するＬＳＰパラメータの値の推定値⁻θ_γ2[i]と一致する。

u_i,v_iを１以下の正の値として、上述の式（１４）において、

とすれば、式（１５）は以下のように書き換えることができる。

式（１７）は、ＬＳＰパラメータ列θ_γ1[1],θ_γ1[2],…,θ_γ1[p]中のi番目のＬＳＰパラメータθ_γ1[i]の前後のＬＳＰパラメータの値との差（すなわち、θ_γ1[i]-θ_γ1[i-1]とθ_γ1[i+1]-θ_γ1[i]）の重み付けで⁻θ_γ2[i]の値を補正し、~θ_γ2[i]を得ることを意味する。つまり、上述の式（９）〜（１２）のような相関性が式（１３ａ）の行列Kの帯部分の要素（非零要素）に反映されていることになる。

なお、式（１３ａ）により得られる~θ_γ2[1],~θ_γ2[2],…,~θ_γ2[p]は線形予測係数列a[1]×(γ2),…,a[p]×(γ2)^pをＬＳＰパラメータに変換したときのＬＳＰパラメータの値θ_γ2[1],θ_γ2[2],…,θ_γ2[p]の近似値（推定値）である。

また、特にγ2>γ1の場合には、式（１６）（１７）に示されているように、式（１４）の行列Kは対角成分が正の値を持ち、その近傍の要素が負の値を持つ傾向がある。

行列Kは予め設定しておく行列であり、例えば、学習データを用いて予め学習したものを用いる。行列Kの学習方法については後述する。

量子化されたＬＳＰパラメータに対しても、同様の性質が成り立つ。つまり、式（１３）におけるＬＳＰパラメータ列のベクトルΘ_γ1とΘ_γ2を、それぞれ量子化されたＬＳＰパラメータ列のベクトル^Θ_γ1と^Θ_γ2に置き換えることができる。具体的には、^Θ_γ1=(^θ_γ1[1],^θ_γ1[2],…,^θ_γ1[p])^Tとし、^Θ_γ2=(^θ_γ2[1],^θ_γ2[2],…,^θ_γ2[p])^Tとし、

が成り立つ。

行列Kが帯行列であるため、式（１３）（１３ａ）（１３ｂ）の演算に要する計算コストは非常に小さい。

第二実施形態の符号化装置３に含まれるＬＳＰ線形変換部３００は、式（１３ｂ）に基づいて補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを生成する。なお、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を生成する際に用いた補正係数γRは、線形予測係数補正部１２５で用いられる補正係数γRと同じである。

＜符号化方法＞
図１２を参照して、第二実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。

補正済ＬＳＰ符号化部１３５の処理は第一実施形態と同じである。ただし、補正済ＬＳＰ符号化部１３５から出力された補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]は量子化済線形予測係数生成部１４０に加えて、ＬＳＰ線形変換部３００にも入力される。

ＬＳＰ線形変換部３００は、^Θ_γ1=(^θ_γR[1],^θ_γR[2],…,^θ_γR[p])^Tとして、

により近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求めて出力する。つまり、式（１３ｂ）を用いて量子化済ＬＳＰパラメータ列の近似値の系列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求める。なお、γ1とγ2は定数であるので、式（１８）の行列Kに代えて行列Kの各要素に（γ2-γ1）を乗算して得られる行列K'を用い

により近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求めてもよい。

ＬＳＰ線形変換部３００から出力された近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appが、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部１６５へ入力される。つまり、時間領域符号化部１７０では、前のフレームにおいて特徴量抽出部１２０で抽出した特徴量が所定の閾値より小さい場合（すなわち、入力音響信号の時間変動が小さい場合。すなわち、周波数領域での符号化が行われた場合。）には、前のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を前のフレームの近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appで代用する。
＜復号装置＞
図１３に、第二実施形態の復号装置４の機能構成を示す。

復号装置４は、第一実施形態の復号装置２と比較して、復号線形予測係数逆補正部２３５、復号逆補正ＬＳＰ生成部２４０を含まず、代わりに復号ＬＳＰ線形変換部４００を含む点が異なる。

＜復号方法＞
図１４を参照して、第二実施形態の復号方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。

補正済ＬＳＰ符号復号部２１５の処理は第一実施形態と同じである。ただし、補正済ＬＳＰ符号復号部２１５から出力された復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]は復号線形予測係数生成部２２０に加えて、復号ＬＳＰ線形変換部４００にも入力される。

復号ＬＳＰ線形変換部４００は、^Θ_γ1=(^θ_γR[1],^θ_γR[2],…,^θ_γR[p])^Tとして、式（１８）により復号近似ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求めて出力する。つまり、式（１３ｂ）を用いて復号ＬＳＰパラメータ列の近似値の系列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求める。ＬＳＰ線形変換部３００と同様に、式（１８ａ）を用いて復号近似ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを求めてもよい。

復号ＬＳＰ線形変換部４００から出力された復号近似ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appが、復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部２４５へ入力される。つまり、時間領域復号部２５０では、前のフレームの識別符号Cgが周波数領域符号化方法を示す情報に対応する場合には、前のフレームの復号ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を前のフレームの近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appで代用する。

＜変換行列Kの学習方法＞
ＬＳＰ線形変換部３００及び復号ＬＳＰ線形変換部４００で用いる変換行列Kは、以下のような方法により予め求めておき、符号化装置３及び復号装置４内の記憶部（図示せず）に格納しておく。

（ステップ１）予め用意したM個のフレーム単位の音声音響信号のサンプルデータについて、各サンプルデータを線形予測分析して線形予測係数を得る。m番目（1≦m≦M）のサンプルデータを線形予測分析して得た線形予測係数列をa^(m)[1],a^(m)[2],…,a^(m)[p]と表し、m番目のサンプルデータに対応する線形予測係数列a^(m)[1],a^(m)[2],…,a^(m)[p]と呼ぶ。

（ステップ２）各mについて、線形予測係数列a^(m)[1],a^(m)[2],…,a^(m)[p]からＬＳＰパラメータθ_γ=1 ^(m)[1],θ_γ=1 ^(m)[2],…,θ_γ=1 ^(m)[p]を求める。ＬＳＰパラメータθ_γ=1 ^(m)[1],θ_γ=1 ^(m)[2],…,θ_γ=1 ^(m)[p]をＬＳＰ符号化部１１５と同様の方法で符号化して、量子化済ＬＳＰパラメータ列^θ_γ=1 ^(m)[1],^θ_γ=1 ^(m)[2],…,^θ_γ=1 ^(m)[p]を得る。
ここで、
^Θ^(m) _γ1=(^θ_γ=1 ^(m)[1],…,^θ_γ=1 ^(m)[p])^T
とする。

（ステップ３）各mについて、γLを予め定めた１より小さい正の定数（例えば、γL=0.92）として、補正済線形予測係数
a_γ ^(m)[i]=a^(m)[i]×(γL)ⁱ
を計算する。

（ステップ４）各mについて、補正済線形予測係数列a_γL ^(m)[1],…,a_γL ^(m)[p]から補正済ＬＳＰパラメータ列θ_γL ^(m)[1],…,θ_γL ^(m)[p]を求める。補正済ＬＳＰパラメータ列θ_γL ^(m)[1],…,θ_γL ^(m)[p]を補正済ＬＳＰ符号化部１３５と同様の方法で符号化して、量子化済ＬＳＰパラメータ列^θ_γL ^(m)[1],…,^θ_γL ^(m)[p]を得る。
ここで、
^Θ^(m) _γ2=(^θ_γL ^(m)[1],…,^θ_γL ^(m)[p])^T
とする。

ステップ１〜４により、M組の量子化されたＬＳＰパラメータ列の組(^Θ^(m) _γ1,^Θ^(m) _γ2)が得られる。この集合を学習用データ集合Qとする。Q={(^Θ^(m) _γ1,^Θ^(m) _γ2)|m=1,…,M}である。なお、学習用データ集合Qを生成する際に用いる補正係数γLの値はすべて共通の固定値とする。

（ステップ５）学習用データQに含まれる各ＬＳＰパラメータ列の組(^Θ^(m) _γ1,^Θ^(m) _γ2)について、γ1=γL,γ2=1,^Θ_γ1=^Θ^(m) _γ1,^Θ_γ2=^Θ^(m) _γ2として式（１３ｂ）のモデルに代入し、自乗誤差基準で行列Kの係数を学習する。すなわち、行列Kの帯部分の成分を上から順に並べたベクトルを

として、

により、Bを得る。ここで、

である。

なお、行列Kを学習するときにはγLの値を固定して行う。ただし、ＬＳＰ線形変換部３００で用いる行列Kは、符号化装置３内で用いられる補正係数γRと同じ値を用いて学習されたものでなくてもよい。

例として、p=15,γL=0.92として、上記の方法により得た行列Kの帯部分の各要素に（γ2-γ1）を乗算した値、すなわち、行列K'の帯部分の各要素の値、は以下のようになる。すなわち、式（１４）のx₁,x₂,…,x₁₅,y₁,y₂,…,y₁₄,z₂,z₃,…,z₁₅の各値にγ2-γ1を乗算した値が以下のxx₁,xx₂,…,xx₁₅,yy₁,yy₂,…,yy₁₄,zz₂,zz₃,…,zz₁₅である。
xx1 =1.11499, yy1 =-0.54272,
zz2 =-0.83414f,xx2 =1.59810f,yy2 =-0.70966,
zz3 =-0.49432, xx3 =1.38370, yy3 =-0.78076,
zz4 =-0.39319, xx4 =1.23032, yy4 =-0.67921,
zz5 =-0.39166, xx5 =1.18521, yy5 =-0.69088,
zz6 =-0.34784, xx6 =1.04839, yy6 =-0.60619,
zz7 =-0.41279, xx7 =1.13305, yy7 =-0.63247,
zz8 =-0.36450, xx8 =0.95694, yy8 =-0.53039,
zz9 =-0.43984, xx9 =1.01910, yy9 =-0.51707,
zz10=-0.40120, xx10=0.90395, yy10=-0.44594,
zz11=-0.49262, xx11=1.07345, yy11=-0.51892,
zz12=-0.41695, xx12=0.96596, yy12=-0.49247,
zz13=-0.45002, xx13=1.00336, yy13=-0.48790,
zz14=-0.46854, xx14=0.93258, yy14=-0.41927,
zz15=-0.45020, xx15=0.88783

上記のγ1=γL=0.92、γ2=1の例のように、γ2>γ1であれば、行列K'は上記の例のように対角成分が１に近い値を取り、対角成分に隣接する成分が負の値を取る。

逆に、γ1>γ2であれば、行列K'は下記の例のように対角成分が負の値を取り、対角成分に隣接する成分が正の値を取る。p=15、γ1=1、γ2=γL=0.92の場合の行列Kの帯部分の各要素に（γ2-γ1）を乗算した値、すなわち、行列K'の帯部分の各要素の値、は例えば以下のようになる。
xx1 =-0.557012055,yy1 =0.213853042,
zz2 =0.110112745,xx2 =-0.534830085,yy2 =0.2440903,
zz3 =0.149879603,xx3 =-0.522734808,yy3 =0.23494022,
zz4 =0.144479327,xx4 =-0.533013231,yy4 =0.259021145,
zz5 =0.136523255,xx5 =-0.502606738,yy5 =0.248139539,
zz6 =0.138005088,xx6 =-0.478327709,yy6 =0.244219107,
zz7 =0.133771751,xx7 =-0.467186849,yy7 =0.243988642,
zz8 =0.13667916, xx8 =-0.408737408,yy8 =0.192803054,
zz9 =0.160602461,xx9 =-0.427436157,yy9 =0.190554547,
zz10=0.147621742,xx10=-0.383087812,yy10=0.165954888,
zz11=0.18358465, xx11=-0.434034351,yy11=0.183004742,
zz12=0.166249458,xx12=-0.409482196,yy12=0.170107295,
zz13=0.162343147,xx13=-0.409804718,yy13=0.165221097,
zz14=0.178158258,xx14=-0.400869431,yy14=0.123020055,
zz15=0.171958144,xx15=-0.447472325

γ1>γ2の場合、これは、＜変換行列Kの学習方法＞（ステップ２）では^Θ^(m) _γ1を
^Θ^(m) _γ1=(^θ_γL ^(m)[1],…,^θ_γL ^(m)[p])^T
とし、（ステップ４）では^Θ^(m) _γ2を
^Θ^(m) _γ2=(^θ_γ=1 ^(m)[1],…,^θ_γ=1 ^(m)[p])^T
とし、（ステップ５）では学習用データQに含まれる各ＬＳＰパラメータ列の組(^Θ^(m) _γ1,^Θ^(m) _γ2)について、γ1=1,γ2=γL,^Θ_γ1=^Θ^(m) _γ1,^Θ_γ2=^Θ^(m) _γ2として、式（１３ｂ）のモデルに代入し、自乗誤差基準で行列Kの係数を学習した場合に相当する。

＜第二実施形態の効果＞
第二実施形態の符号化装置３は、第一実施形態と同様に、従来の符号化装置９における量子化済線形予測係数生成部９００、量子化済線形予測係数補正部９０５及び近似平滑化済パワースペクトル包絡系列計算部９１０を、線形予測係数補正部１２５、補正済ＬＳＰ生成部１３０、補正済ＬＳＰ符号化部１３５、量子化済線形予測係数生成部１４０及び第１量子化済平滑化済パワースペクトル包絡系列計算部１４５に置き換えた構成であるため、第一実施形態の符号化装置１と同様の効果を有する。すなわち、従来と同じ符号化歪であれば従来よりも符号量を小さくし、従来と同じ符号量であれば従来よりも符号化歪を小さくすることができる。

さらに、第二実施形態の符号化装置３では、式（１８）の計算において、Kが帯行列であるため計算コストが小さい。第一実施形態の量子化済線形予測係数逆補正部１５５及び逆補正済ＬＳＰ生成部１６０をＬＳＰ線形変換部３００に置き換えたことで、第一実施形態よりも少ない演算量で、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]の近似値の系列を生成することができる。

［第二実施形態の変形例]
第二実施形態の符号化装置３では、フレーム毎に、時間領域での符号化を行うか周波数領域での符号化を行うかを、入力音響信号の時間変動の大きさに基づいて決定している。入力音響信号の時間変動が大きく、周波数領域での符号化が選択されたフレームでも、実際には時間領域での符号化によって再構成される音響信号のほうが周波数領域での符号化によって再構成される信号よりも入力音響信号との歪を小さくできる場合も有り得る。また、入力音響信号の時間変動が小さく、時間領域での符号化が選択されたフレームでも、実際には周波数領域での符号化によって再構成される音響信号のほうが時間領域での符号化によって再構成される音響信号よりも入力音響信号との歪を小さくできる場合も有り得る。すなわち、第二実施形態の符号化装置３では、時間領域での符号化と周波数領域での符号化のうちの、入力音響信号との歪が小さくできる符号化方法を必ず選択できているわけではない。そこで、第二実施形態の変形例の符号化装置８では、フレーム毎に、時間領域での符号化と周波数領域での符号化の両方を行って、入力音響信号との歪を小さくできるほうを選択する。

＜符号化装置＞
図１５に、第二実施形態の変形例の符号化装置８の機能構成を示す。

符号化装置８は、第二実施形態の符号化装置３と比較して、特徴量抽出部１２０を含まず、出力部１７５の代わりに符号選択出力部３７５を含む点が異なる。

＜符号化方法＞
図１６を参照して、第二実施形態の変形例の符号化方法を説明する。以下では、第二実施形態との相違点を中心に説明する。

第二実施形態の変形例の符号化方法では、入力部１００と線形予測分析部１０５に加えて、ＬＳＰ生成部１１０、ＬＳＰ符号化部１１５、線形予測係数補正部１２５、補正済ＬＳＰ生成部１３０、補正済ＬＳＰ符号化部１３５、量子化済線形予測係数生成部１４０、第１量子化済平滑化済パワースペクトル包絡系列計算部１４５、遅延入力部１６５、及びＬＳＰ線形変換部３００も、入力音響信号の時間変動が大きいか小さいかに関わらず、全てのフレームについて実行される。これらの各部の動作は、第二実施形態と同じである。ただし、ＬＳＰ線形変換部３００が生成した近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appは遅延入力部１６５へ入力される。

遅延入力部１６５は、ＬＳＰ符号化部１１５から入力された量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]とＬＳＰ線形変換部３００から入力された近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを少なくとも１フレーム分保持しておき、前のフレームにおいて符号選択出力部３７５で周波数領域の符号化方法が選択された場合（すなわち、前のフレームにおいて符号選択出力部３７５が出力した識別符号Cgが周波数領域符号化方法を示す情報である場合）には、ＬＳＰ線形変換部３００から入力された前のフレームの近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを前のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として時間領域符号化部１７０に出力し、前のフレームにおいて符号選択出力部３７５で時間領域の符号化方法が選択された場合（すなわち、前のフレームにおいて符号選択出力部３７５が出力した識別符号Cgが時間領域符号化方法を示す情報である場合）には、ＬＳＰ符号化部１１５から入力された前のフレームの量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を時間領域符号化部１７０に出力する（ステップＳ１６５）。

周波数領域符号化部１５０は、第二実施形態の周波数領域符号化部１５０と同様に周波数領域信号符号を生成して出力するとともに、周波数領域信号符号に対応する音響信号の入力音響信号に対する歪または歪の推定値を求めて出力する。歪やその推定値は、時間領域で求めても周波数領域で求めてもよい。すなわち、周波数領域符号化部１５０は、周波数領域信号符号に対応する周波数領域の音響信号系列の、入力音響信号を周波数領域に変換して得られる周波数領域の音響信号系列に対する歪または歪の推定値を求めてもよい。

時間領域符号化部１７０は、第二実施形態の時間領域符号化部１７０と同様に時間領域信号符号を生成して出力するとともに、時間領域信号符号に対応する音響信号の入力音響信号に対する歪または歪の推定値を求める。

符号選択出力部３７５には、周波数領域符号化部１５０が生成した周波数領域信号符号、周波数領域符号化部１５０が求めた歪または歪みの推定値、時間領域符号化部１７０が生成した時間領域信号符号、時間領域符号化部１７０が求めた歪または歪みの推定値、が入力される。

符号選択出力部３７５は、周波数領域符号化部１５０から入力された歪または歪の推定値ほうが時間領域符号化部１７０から入力された歪または歪の推定値よりも小さい場合には、周波数領域信号符号と、周波数領域符号化方法を示す情報である識別符号Cgを出力し、周波数領域符号化部１５０から入力された歪または歪の推定値のほうが時間領域符号化部１７０から入力された歪または歪の推定値よりも大きい場合には、時間領域信号符号と、時間領域符号化方法を示す情報である識別符号Cgを出力する。周波数領域符号化部１５０から入力された歪または歪の推定値と時間領域符号化部１７０から入力された歪または歪の推定値が同じ場合には、予め定めた規則により、時間領域信号符号と周波数領域信号符号のいずれかを出力するとともに、出力する符号に対応する符号化方法を示す情報である識別符号Cgを出力する。すなわち、周波数領域符号化部１５０から入力された周波数領域信号符号と時間領域符号化部１７０から入力された時間領域信号符号のうち、符号から再構成される音響信号の入力音響信号に対する歪が小さくなるほうを出力するとともに、歪が小さくなる符号化方法を示す情報を識別符号Cgとして出力する（ステップＳ３７５）。

なお、符号から再構成した音響信号の入力音響信号に対する歪が小さいほうを選択する構成としてもよい。この構成では、周波数領域符号化部１５０や時間領域符号化部１７０で、歪または歪の推定値に代えて、符号から音響信号を再構成して出力する。また、符号選択出力部３７５は、周波数領域信号符号と時間領域信号符号のうち、周波数領域符号化部１５０が再構成した音響信号と時間領域符号化部１７０が再構成した音響信号のうち入力音響信号に対する歪が小さいほうを出力するとともに、歪が小さくなる符号化方法を示す情報を識別符号Cgとして出力する。

また、符号量が小さいほうを選択する構成としてもよい。この構成では、周波数領域符号化部１５０は、第二実施形態と同様に、周波数領域信号符号を出力する。また、時間領域符号化部１７０は、第二実施形態と同様に、時間領域信号符号を出力する。また、符号選択出力部３７５は、周波数領域信号符号と時間領域信号符号のうち符号量が小さいほうを出力するとともに、符号量が小さくなる符号化方法を示す情報を識別符号Cgとして出力する。

＜復号装置＞
第二実施形態の変形例の符号化装置８が出力した符号列は、第二実施形態の符号化装置３が出力した符号列と同様に、第二実施形態の復号装置４で復号できる。

＜第二実施形態の変形例の効果＞
第二実施形態の変形例の符号化装置８は、第二実施形態の符号化装置３と同様の効果を奏するものであり、さらに、第二実施形態の符号化装置３よりも出力する符号量を小さくする効果を奏するものである。

［第三実施形態］
第一実施形態の符号化装置１及び第二実施形態の符号化装置３では、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を線形予測係数に一旦変換してから、量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を計算していた。第三実施形態の符号化装置５では、補正済量子化済ＬＳＰパラメータ列を線形予測係数に変換することなく、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を直接計算する。同様に、第三実施形態の復号装置６では、復号補正済ＬＳＰパラメータ列を線形予測係数に変換することなく、復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]から復号平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を直接計算する。

＜符号化装置＞
図１７に、第三実施形態の符号化装置５の機能構成を示す。

符号化装置５は、第二実施形態の符号化装置３と比較して、量子化済線形予測係数生成部１４０、第１量子化済平滑化済パワースペクトル包絡系列計算部１４５を含まず、代わりに第２量子化済平滑化済パワースペクトル包絡系列計算部１４６を含む点が異なる。

＜符号化方法＞
図１８を参照して、第三実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。

ステップＳ１４６において、第２量子化済平滑化済パワースペクトル包絡系列計算部１４６は、補正済ＬＳＰ符号化部１３５から出力された補正済量子化済ＬＳＰパラメータ^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を用いて、式（１９）により量子化済平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を求めて出力する。

＜復号装置＞
図１９に、第三実施形態の復号装置６の機能構成を示す。

復号装置６は、第二実施形態の復号装置４と比較して、復号線形予測係数生成部２２０、第１復号平滑化済パワースペクトル包絡系列計算部２２５を含まず、代わりに第２復号平滑化済パワースペクトル包絡系列計算部２２６を含む。

＜復号方法＞
図２０を参照して、第三実施形態の復号方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。

ステップＳ２２６において、第２復号平滑化済パワースペクトル包絡系列計算部２２６は、第２量子化済平滑化済パワースペクトル包絡系列計算部１４６と同様に、復号補正済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]を用いて、上記の式（１９）により、復号平滑化済パワースペクトル包絡系列^W_γR[1],^W_γR[2],…,^W_γR[N]を求めて出力する。

［第四実施形態］
量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]は、
0<^θ[1]<…<^θ[p]<π
を満たす系列である。つまり、昇順に並んだ系列である。一方、ＬＳＰ線形変換部３００で生成される近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appは近似的な変換により生成したものであるため、昇順にならないことがある。そこで、第四実施形態ではＬＳＰ線形変換部３００から出力される近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appを昇順に並べ替える処理を追加する。

＜符号化装置＞
図２１に、第四実施形態の符号化装置７の機能構成を示す。
符号化装置７は、第二実施形態の符号化装置５と比較して、近似ＬＳＰ系列修正部７００をさらに含む点が異なる。

＜符号化方法＞
図２２を参照して、第四実施形態の符号化方法を説明する。以下では、上述の実施形態との相違点を中心に説明する。

近似ＬＳＰ系列修正部７００は、ＬＳＰ線形変換部３００から出力された近似量子化済ＬＳＰパラメータ列^θ[1]_app,^θ[2]_app,…,^θ[p]_appの各値^θ[i]_appを昇順に並べ替えた系列を修正近似量子化済ＬＳＰパラメータ列^θ’[1]_app,^θ’[2]_app,…,^θ’[p]_appとして出力する。近似ＬＳＰ系列修正部７００から出力された修正第１近似量子化済ＬＳＰパラメータ列^θ’[1]_app,^θ’[2]_app,…,^θ’[p]_appが、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]として遅延入力部１６５へ入力される。

また、単に近似量子化済ＬＳＰパラメータ列の各値を並べ替えるだけでなく、各i=1,…,p-1について|^θ[i+1]_app-^θ[i]_app|が所定の閾値以上となるように、各値^θ[i]_appを補正した値を^θ’[i]_appとしてもよい。

［変形例］
上述の実施形態ではＬＳＰパラメータを前提として説明したが、ＬＳＰパラメータ列の代わりに、ＩＳＰパラメータ列を用いてもよい。ＩＳＰパラメータ列ISP[1],…,ISP[p]は、p-1次のＬＳＰパラメータ列とp次（最高次）のPARCOR係数k_pからなる系列と等価である。つまり、
ISP[i]=θ[i] for i=1,…,p-1
ISP[p]=k_p
である。

第二実施形態において、ＬＳＰ線形変換部３００への入力がＩＳＰパラメータ列である場合を例に、具体的な処理を説明する。

ＬＳＰ線形変換部３００への入力を補正済量子化済ＩＳＰパラメータ列^ISP_γR[1],^ISP_γR[2],…,^ISP_γR[p]とする。ここで、
^ISP_γR[1]=^θ_γR[i]
^ISP_γR[p]=^k_p
である。^k_pはk_pの量子化値である。

ＬＳＰ線形変換部３００では、以下の処理により近似量子化済ＩＳＰパラメータ列^ISP[1]_app,…,^ISP[p]_appを求めて出力する。
（ステップ１）^Θ_γ1=(^ISP_γR[1],…,^ISP_γR[p-1])^Tとし、pをp-1に置き換えて、式（１８）を計算して、^θ[1]_app,…,^θ[p-1]_appを求める。
ここで、
^ISP[i]_app=^θ[i]_app（i=1,…,p-1）
とする。
（ステップ２）以下の式で定義される^ISP[p]_appを求める。
^ISP[p]_app=^ISP_γR[p]・(1/γR)^p
［第五実施形態］
符号化装置３、５、７、８が備えるＬＳＰ線形変換部３００、復号装置４、６が備える復号ＬＳＰ線形変換部４００を、独立した周波数領域パラメータ列生成装置として構成することも可能である。

以下では、符号化装置３、５、７、８が備えるＬＳＰ線形変換部３００、復号装置４、６が備える復号ＬＳＰ線形変換部４００を、独立した周波数領域パラメータ列生成装置として構成する例について説明する。

＜周波数領域パラメータ列生成装置＞
第五実施形態の周波数領域パラメータ列生成装置１０は、図２３に示すように、パラメータ列変換部２０を例えば含み、周波数領域パラメータω[1],ω[2],…,ω[p]を入力とし、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]を出力する。

入力される周波数領域パラメータω[1],ω[2],…,ω[p]は、所定の時間区間の音信号を線形予測分析して得られる線形予測係数a[1],a[2],…,a[p]に由来する周波数領域パラメータ列である。周波数領域パラメータω[1],ω[2],…,ω[p]は、例えば、従来の符号化方法で用いたＬＳＰパラメータ列θ[1],θ[2],…,θ[p]であってもよいし、量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]であってもよい。また、例えば、上述の各実施形態で用いた補正済ＬＳＰパラメータ列θ_γR[1],θ_γR[2],…,θ_γR[p]であってもよいし、補正済量子化済ＬＳＰパラメータ列^θ_γR[1],^θ_γR[2],…,^θ_γR[p]であってもよい。さらに、例えば、上述の変形例で説明したＩＳＰパラメータ列のような、ＬＳＰパラメータと等価な周波数領域パラメータであってもよい。また、線形予測係数a[1],a[2],…,a[p]に由来する周波数領域パラメータ列とは、線形予測係数列a[1],a[2],…,a[p]に由来するＬＳＰパラメータ列、ＩＳＰパラメータ列、ＬＳＦパラメータ列、ＩＳＦパラメータ列、周波数領域パラメータω[1],ω[2],…,ω[p-1]の全てが０からπまでの間に存在し、かつ、線形予測係数列に含まれる全ての線形予測係数が０である場合には周波数領域パラメータω[1],ω[2],…,ω[p-1]が０からπまでの間に均等間隔に存在する周波数領域パラメータ列、等に代表されるような、線形予測係数列に由来する周波数領域の系列であって、予測次数と同じ個数で表されるものである。

パラメータ列変換部２０は、ＬＳＰ線形変換部３００及び復号ＬＳＰ線形変換部４００と同様に、ＬＳＰパラメータの性質を利用して、周波数領域パラメータ列ω[1],ω[2],…,ω[p-1]に近似的な線形変換を施して変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を生成する。パラメータ列変換部２０は、例えば、各i=1,2,…,pについて、以下のいずれかの方法により、変換後周波数領域パラメータ~ω[i]の値を求める。

１．ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により変換後周波数領域パラメータ~ω[i]の値を求める。例えば、周波数領域パラメータ列ω[i]よりも変換後周波数領域パラメータ列~ω[i]のほうが、パラメータ値の間隔が均等間隔に近くなるように、または、均等間隔から遠くなるように、線形変換する。均等間隔に近くなるようにする線形変換は、周波数領域においてパワースペクトル包絡の振幅の凹凸を鈍らせる処理（パワースペクトル包絡を平滑化する処理）に相当する。また、均等間隔から遠くなるようにする線形変換は、周波数領域においてパワースペクトル包絡の振幅の凹凸を強調する処理（パワースペクトル包絡を逆平滑化する処理）に相当する。

２．ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が小さくなるように~ω[i]を求める。また、ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が小さくなるように~ω[i]を求める。これは、周波数領域においてパワースペクトル包絡の振幅の凹凸を強調する処理（パワースペクトル包絡を逆平滑化する処理）に相当する。

３．ω[i]がω[i+1]とω[i-1]との中点よりもω[i+1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i+1]に近く、かつ、ω[i+1]-ω[i]よりも~ω[i+1]-~ω[i]の方が値が大きくなるように~ω[i]を求める。また、ω[i]がω[i+1]とω[i-1]との中点よりもω[i-1]に近い場合には、~ω[i]が~ω[i+1]と~ω[i-1]との中点よりも~ω[i-1]に近く、かつ、ω[i]-ω[i-1]よりも~ω[i]-~ω[i-1]の方が値が大きくなるように~ω[i]を求める。これは、周波数領域においてパワースペクトル包絡の振幅の凹凸を鈍らせる処理（パワースペクトル包絡を平滑化する処理）に相当する。

例えば、パラメータ列変換部２０は、下記の式（２０）により、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]を求めて出力する。

ここで、γ1とγ2は１以下の正の係数である。式（２０）は、ＬＳＰパラメータをモデル化した式（１３）において、Θ_γ1=(ω[1],ω[2],…,ω[p])^Tとし、Θ_γ2=(~ω[1],~ω[2],…,~ω[p])^Tとし、

とすることで、導出することができる。この場合、周波数領域パラメータω[1],ω[2],…,ω[p]は、線形予測係数a[1],a[2],…,a[p]の各係数a[i]に係数γ1のi乗を乗じることにより補正した係数列である
a[1]×(γ1),a[2]×(γ1)²,…,a[p]×(γ1)^p
と等価な周波数領域のパラメータ列、もしくは、その量子化値である。また、変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]は、線形予測係数a[1],a[2],…,a[p]の各係数a[i]に係数γ2のi乗を乗じることにより補正した係数列である
a[1]×(γ2),a[2]×(γ2)²,…,a[p]×(γ2)^p
と等価な周波数領域のパラメータ列を近似する系列となる。

＜第五実施形態の効果＞
第五実施形態の周波数領域パラメータ列生成装置は、符号化装置３、５、７、８や復号装置４、６と同様に、符号化装置１や復号装置２のような周波数領域パラメータから線形予測係数を介して変換後周波数領域パラメータを求める場合よりも少ない演算量で、周波数領域パラメータから変換後周波数領域パラメータを求めることができる。

この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。

［プログラム、記録媒体］
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ−ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正ステップと、
上記補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成ステップと、
上記補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び上記補正済ＬＳＰ符号に対応する補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化ステップと、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換ステップと、
上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を線形予測係数に変換した補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]を生成する量子化済線形予測係数列生成ステップと、
上記補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]に対応する周波数領域の系列である量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、
上記線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成ステップと、
上記ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及び上記ＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化ステップと、
上記音信号を、前の時間区間の上記ＬＳＰ符号化ステップで得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換ステップで得た近似量子化済ＬＳＰパラメータ列のいずれかと、上記所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、
を含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、
ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化方法。
pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正ステップと、
上記補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成ステップと、
上記補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び上記補正済ＬＳＰ符号に対応する補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化ステップと、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換ステップを実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換ステップと、
上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]に基づいて量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算ステップと、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化ステップと、
上記線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成ステップと、
上記ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及び上記ＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化ステップと、
上記音信号を、前の時間区間の上記ＬＳＰ符号化ステップで得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換ステップで得た近似量子化済ＬＳＰパラメータ列のいずれかと、上記所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化ステップと、
を含み、
上記パラメータ列変換ステップは、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、
ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化方法。
請求項１または２に記載の符号化方法であって、
上記周波数領域符号化ステップで生成した周波数領域信号符号と、上記時間領域符号化ステップで生成した時間領域信号符号と、のいずれかを出力する出力ステップ
を更に有し、
上記時間領域符号化ステップは、
前の時間区間の出力ステップにおいて周波数領域信号符号が出力された場合には、前の時間区間のＬＳＰ線形変換ステップで得た近似量子化済ＬＳＰパラメータ列を用いた符号化を行い、
前の時間区間の出力ステップにおいて時間領域信号符号が出力された場合には、前の時間区間のＬＳＰ生成ステップで得た量子化済ＬＳＰパラメータ列を用いた符号化を行う
符号化方法。
請求項１から３のいずれかに記載の符号化方法であって、
上記パラメータ列変換ステップは、
γ1=γとし、γ2=1とし、Kを予め定められた、対角要素と、行方向において対角要素に隣接する要素とが非零の値を持つp×pの帯行列とし、

により定義される上記変換後周波数領域パラメータ~ω[1],~ω[2],…,~ω[p]を求める
符号化方法。
請求項４に記載の符号化方法であって、
上記帯行列Kは、対角要素が正の値であり、行方向において対角要素に隣接する要素が負の値である
符号化方法。
請求項４に記載の符号化方法であって、
上記帯行列Kは、対角要素が負の値であり、行方向において対角要素に隣接する要素が正の値である
符号化方法。
pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正部と、
上記補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成部と、
上記補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び上記補正済ＬＳＰ符号に対応する補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化部と、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換部と、
上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を線形予測係数に変換した補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]を生成する量子化済線形予測係数列生成部と、
上記補正済量子化済線形予測係数列^a_γ[1],^a_γ[2],…,^a_γ[p]に対応する周波数領域の系列である量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算部と、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化部と、
上記線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成部と、
上記ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及び上記ＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化部と、
上記音信号を、前の時間区間の上記ＬＳＰ符号化部で得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換部で得た近似量子化済ＬＳＰパラメータ列のいずれかと、上記所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化部と、
を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、
ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化装置。
pを１以上の整数とし、γを１以下の正の定数である補正係数とし、a[1],a[2],…,a[p]を所定の時間区間の音信号を線形予測分析して得られる線形予測係数列とし、
上記線形予測係数列a[1],a[2],…,a[p]を上記補正係数γを用いてa_γ[i]=a[i]×γⁱにより補正した補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を生成する線形予測係数補正部と、
上記補正済線形予測係数列a_γ[1],a_γ[2],…,a_γ[p]を用いて補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を生成する補正済ＬＳＰ生成部と、
上記補正済ＬＳＰパラメータ列θ_γ[1],θ_γ[2],…,θ_γ[p]を符号化して、補正済ＬＳＰ符号及び上記補正済ＬＳＰ符号に対応する補正済ＬＳＰパラメータ列の各値を量子化した補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]を生成する補正済ＬＳＰ符号化部と、
周波数領域パラメータ列ω[1],ω[2],…,ω[p]を上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]とし、上記周波数領域パラメータ列ω[1],ω[2],…,ω[p]を入力として変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を求めるパラメータ列変換部を実行することにより、上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]を近似量子化済ＬＳＰパラメータ列^θ_app[1],^θ_app[2],…,^θ_app[p]として生成するＬＳＰ線形変換部と、
上記補正済量子化済ＬＳＰパラメータ列^θ_γ[1],^θ_γ[2],…,^θ_γ[p]に基づいて量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を計算する量子化済平滑化済パワースペクトル包絡系列計算部と、
上記音信号に対応する周波数領域サンプル列X[1],X[2],…,X[N]を、上記量子化済平滑化済パワースペクトル包絡系列^W_γ[1],^W_γ[2],…,^W_γ[N]を用いて符号化した周波数領域信号符号を生成する周波数領域符号化部と、
上記線形予測係数列a[1],a[2],…,a[p]を用いてＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を生成するＬＳＰ生成部と、
上記ＬＳＰパラメータ列θ[1],θ[2],…,θ[p]を符号化して、ＬＳＰ符号及び上記ＬＳＰ符号に対応する量子化済ＬＳＰパラメータ列^θ[1],^θ[2],…,^θ[p]を生成するＬＳＰ符号化部と、
上記音信号を、前の時間区間の上記ＬＳＰ符号化部で得た量子化済ＬＳＰパラメータ列と、前の時間区間のＬＳＰ線形変換部で得た近似量子化済ＬＳＰパラメータ列のいずれかと、上記所定の時間区間の量子化済ＬＳＰパラメータ列とを用いて、符号化して時間領域信号符号を生成する時間領域符号化部と、
を含み、
上記パラメータ列変換部は、
上記変換後周波数領域パラメータ列~ω[1],~ω[2],…,~ω[p]における各変換後周波数領域パラメータ~ω[i]（i=1,2,…,p）を、
ω[i]とω[i]に近接する１つまたは複数の周波数領域パラメータとの値の関係に基づく線形変換により求める、
符号化装置。
請求項１から６のいずれかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
請求項１から６のいずれかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。