WO2016121824A1

WO2016121824A1 - パラメータ決定装置、方法、プログラム及び記録媒体

Info

Publication number: WO2016121824A1
Application number: PCT/JP2016/052362
Authority: WO
Inventors: 守谷　健弘; 優鎌本; 登原田; 弘和亀岡; 亮介杉浦
Original assignee: 日本電信電話株式会社; 国立大学法人東京大学
Priority date: 2015-01-30
Filing date: 2016-01-27
Publication date: 2016-08-04
Also published as: EP3252768A1; EP3252768B1; EP3751565B1; EP3252768A4; EP3751565A1; CN107430869A; US20180268843A1; KR20170096136A; US10276186B2; JPWO2016121824A1; JP6499206B2; KR102070145B1; CN107430869B

Abstract

　パラメータ決定装置は、パラメータη_０及びパラメータηを正の数として、所定の方法で定められるパラメータη_０を用いて、時系列信号に対応する周波数領域サンプル列の絶対値のη_０乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定部４２と、スペクトル包絡で周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る白色化スペクトル系列生成部４３と、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列のヒストグラムを近似するパラメータηを求めるパラメータ取得部４４と、を備えている。

Description

パラメータ決定装置、方法、プログラム及び記録媒体

　この発明は、音信号などの時系列信号の符号化技術において、音信号等の時系列信号の特徴を表すパラメータを決定する技術に関する。

　音信号等の時系列信号の特徴を表すパラメータとして、ＬＳＰ等のパラメータが知られている（例えば、非特許文献１参照）。

　ＬＳＰは、複数次なので直接的に音の分類や区間推定に使うのは扱いが難しい場合がある。例えば、ＬＳＰは複数次であるため、ＬＳＰを用いた閾値に基づく処理は容易とは言えない。

　ところで、公知とはなっていないが、発明者によりパラメータηが提案されている。このパラメータηは、例えば３ＧＰＰＥＶＳ（Enhanced Voice Services）規格で使われているような線形予測包絡を利用する周波数領域の係数の量子化値を算術符号化する符号化方式において、算術符号の符号化対象の属する確率分布を定める形状パラメータである。パラメータηは、符号化対象の分布と関連性を有しており、パラメータηを適宜定めると効率の良い符号化及び復号を行うことが可能である。

　また、パラメータηは、時系列信号の特徴を表す指標と成り得る。このため、パラメータηは、上記符号化処理以外の技術、例えば音の分類や音区間の推定等の音声音響関連技術に用いることができる。

　さらに、パラメータηは１次の値であるため、パラメータηを用いた閾値に基づく処理はＬＳＰを用いた閾値に基づく処理と比較すると容易である。このため、パラメータηは、音の分類や区間推定に容易に用いることができる。

守谷健弘，「高圧縮音声符号化の必須技術：線スペクトル対（LSP）」，NTT技術ジャーナル，２０１４年９月，Ｐ．５８－６０

　パラメータηを決定する技術はこれまで提案されていなかった。

　本発明は、パラメータηを決定するパラメータ決定装置、方法、プログラム及び記録媒体を提供することを目的とする。

　本発明の一態様によるパラメータ決定装置によれば、パラメータη_０及びパラメータηを正の数として、所定の方法で定められるパラメータη_０を用いて、時系列信号に対応する周波数領域サンプル列の絶対値のη_０乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定部と、スペクトル包絡で上記周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る白色化スペクトル系列生成部と、パラメータηを形状パラメータとする一般化ガウス分布が上記白色化スペクトル系列のヒストグラムを近似するパラメータηを求めるパラメータ取得部と、を備えている。

　パラメータηを決定することができる。

パラメータ決定装置の例を説明するためのブロック図。パラメータ決定方法の例を説明するためのフローチャート。一般化ガウス分布を説明するための図。符号化装置の例を説明するためのブロック図。符号化方法の例を説明するためのフローチャート。符号化部の処理の例を説明するためのフローチャート。符号化部の例を説明するためのブロック図。符号化部の例を説明するためのブロック図。本発明の復号装置の例を説明するためのブロック図。復号方法の例を説明するためのフローチャート。復号部の処理の例を説明するためのフローチャート。音分類装置の例を説明するためのブロック図。音分類方法の例を説明するためのフローチャート。

　［パラメータ決定装置及び方法］
　パラメータ決定装置の構成例を図１に示す。パラメータ決定装置は、図１に示すように、周波数領域変換部４１と、スペクトル包絡推定部４２と、白色化スペクトル系列生成部４３と、パラメータ取得部４４とを例えば備えている。スペクトル包絡推定部４２は、線形予測分析部４２１及び非平滑化振幅スペクトル包絡系列生成部４２２を例えば備えている。例えばこのパラメータ決定装置により実現されるパラメータ決定方法の各処理の例を図２に示す。

　以下、図１の各部について説明する。

　＜周波数領域変換部４１＞
　周波数領域変換部４１には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。

　周波数領域変換部４１は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。

　得られたMDCT係数列X(0),X(1),…,X(N-1)は、スペクトル包絡推定部４２及び白色化スペクトル系列生成部４３に出力される。

　特に断りがない限り、以降の処理はフレーム単位で行われるものとする。

　このようにして、周波数領域変換部４１は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める（ステップＣ４１）。

　＜スペクトル包絡推定部４２＞
　スペクトル包絡推定部４２には、周波数領域変換部２１が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。

　スペクトル包絡推定部４２は、所定の方法で定められるパラメータη₀に基づいて、時系列信号に対応する周波数領域サンプル列の絶対値のη₀乗をパワースペクトルとして用いたスペクトル包絡の推定を行う（ステップＣ４２）。

　推定されたスペクトル包絡は、白色化スペクトル系列生成部４３に出力される。

　スペクトル包絡推定部４２は、例えば以下に説明する線形予測分析部４２１及び非平滑化振幅スペクトル包絡系列生成部４２２の処理により、非平滑化振幅スペクトル包絡系列を生成することによりスペクトル包絡の推定を行う。

　パラメータη₀は所定の方法で定められるとする。例えば、η₀を０より大きい所定の数とする。例えば、η₀＝１とする。また、現在パラメータηを求めようとしているフレームよりも前のフレームで求まったηを用いてもよい。現在パラメータηを求めようとしているフレーム（以下、現フレームとする。）よりも前のフレームとは、例えば現フレームのよりも前のフレームであって現フレームの近傍のフレームである。現フレームの近傍のフレームは、例えば現フレームの直前のフレームである。

　＜線形予測分析部４２１＞
　線形予測分析部４２１には、周波数領域変換部４１が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。

　線形予測分析部４２１は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式（C1)により定義される~R(0),~R(1),…,~R(N-1)を線形予測分析して線形予測係数β₁,β₂,…,β_pを生成し、生成された線形予測係数β₁,β₂,…,β_pを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β₁,^β₂,…,^β_pとを生成する。

　生成された量子化線形予測係数^β₁,^β₂,…,^β_pは、非平滑化スペクトル包絡系列生成部４２２に出力される。

　具体的には、線形予測分析部４２１は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη₀乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(C1)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部４２１は、求まった擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β₁,β₂,…,β_pを生成する。そして、線形予測分析部４２１は、生成された線形予測係数β₁,β₂,…,β_pを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β₁,^β₂,…,^β_pとを得る。

　線形予測係数β₁,β₂,…,β_pは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη₀乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。

　線形予測分析部４２１による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。

　このようにして、線形予測分析部４２１は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を生成する（ステップＣ４２１）。

　なお、パラメータ決定装置により生成されるパラメータが符号化以外に用いられる場合には、線形予測分析部４２１は線形予測係数符号の生成はしなくてもよい。

　＜非平滑化振幅スペクトル包絡系列生成部４２２＞
　非平滑化振幅スペクトル包絡系列生成部４２２には、線形予測分析部４２１が生成した量子化線形予測係数^β₁,^β₂,…,^β_pが入力される。

　非平滑化振幅スペクトル包絡系列生成部４２２は、量子化線形予測係数^β₁,^β₂,…,^β_pに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。

　生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、白色化スペクトル系列生成部４３に出力される。

　非平滑化振幅スペクトル包絡系列生成部４２２は、量子化線形予測係数^β₁,^β₂,…,^β_pを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(C2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。

　このようにして、非平滑化振幅スペクトル包絡系列生成部４２２は、疑似相関関数信号列に対応する振幅スペクトル包絡の系列を１／η₀乗した系列である非平滑化スペクトル包絡系列を線形予測分析部４２１により生成された線形予測係数に変換可能な係数に基づいて得ることによりスペクトル包絡の推定を行う（ステップＣ４２２）。

　＜白色化スペクトル系列生成部４３＞
　白色化スペクトル系列生成部４３には、周波数領域変換部４１が得たMDCT係数列X(0),X(1),…,X(N-1)及び非平滑化振幅スペクトル包絡生成部４２２が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)が入力される。

　白色化スペクトル系列生成部４３は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値で除算することにより、白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)を生成する。

　生成された白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)は、パラメータ取得部４４に出力される。

　白色化スペクトル系列生成部４３は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値^H(k)で除算することにより、白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)の各値X_W(k)を生成する。すなわち、k=0,1,…,N-1として、X_W(k)=X(k)/^H(k)である。

　このようにして、白色化スペクトル系列生成部４３は、例えば非平滑化振幅スペクトル包絡系列であるスペクトル包絡で例えばMDCT係数列である周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る（ステップＣ４３）。

　＜パラメータ取得部４４＞
　パラメータ取得部４４には、白色化スペクトル系列生成部４３が生成した白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)が入力される。

　パラメータ取得部４４は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)のヒストグラムを近似するパラメータηを求める（ステップＣ４４）。言い換えれば、パラメータ取得部４４は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列X_W(0),X_W(1),…,X_W(N-1)のヒストグラムの分布に近くなるようなパラメータηを決定する。

　パラメータηを形状パラメータとする一般化ガウス分布は、例えば以下のように定義される。Γは、ガンマ関数である。

　一般化ガウス分布は、形状パラメータであるηを変えることにより、図３のようにη＝１の時はラプラス分布、η＝２の時はガウス分布、といったように様々な分布を表現することができるものである。φは分散に対応するパラメータである。

　ここで、パラメータ取得部４４が求めるηは、例えば以下の式(C3)により定義される。F^-1は、関数Fの逆関数である。この式は、いわゆるモーメント法により導出されるものである。

　逆関数F^-1が定式化されている場合には、パラメータ取得部４４は、定式化された逆関数F^-1にm₁/((m₂)^1/2)の値を入力したときの出力値を計算することによりパラメータηを求めることができる。

　逆関数F^-1が定式化されていない場合には、パラメータ取得部４４は、式(C3)で定義されるηの値を計算するために、例えば以下に説明する第一方法又は第二方法によりパラメータηを求めてもよい。

　パラメータηを求めるための第一方法について説明する。第一の方法では、パラメータ取得部４４は、白色化スペクトル系列に基づいてm₁/((m₂)^1/2)を計算し、予め用意しておいた異なる複数の、ηと対応するＦ（η）のペアを参照して、計算されたm₁/((m₂)^1/2)に最も近いＦ（η）に対応するηを取得する。

　予め用意しておいた異なる複数の、ηと対応するＦ（η）のペアは、パラメータ取得部４４の記憶部４４１に予め記憶しておく。パラメータ取得部４４は、記憶部４４１参照して、計算されたm₁/((m₂)^1/2)に最も近いＦ（η）を見つけ、見つかったＦ（η）に対応するηを記憶部４４１から読み込み出力する。

　計算されたm₁/((m₂)^1/2)に最も近いＦ（η）とは、計算されたm₁/((m₂)^1/2)との差の絶対値が最も小さくなるＦ（η）のことである。

　パラメータηを求めるための第二方法について説明する。第二の方法では、逆関数F^-1の近似曲線関数を例えば以下の式(C3’)で表される~F^-1として、パラメータ取得部４４は、白色化スペクトル系列に基づいてm₁/((m₂)^1/2)を計算し、近似曲線関数~F^-1に計算されたm₁/((m₂)^1/2)を入力したときの出力値を計算することによりηを求める。この近似曲線関数~F^-1は使用する定義域において出力が正値となる単調増加関数であればよい。

　なお、パラメータ取得部４４が求めるηは、式(C3)ではなく、式(C3'')のように予め定めた正の整数q1及びq2を用いて（ただしq1<q2）式(C3)を一般化した式により定義されてもよい。

　なお、ηが式(C3'')により定義される場合も、ηが式(C3)により定義されている場合と同様の方法により、ηを求めることができる。すなわち、パラメータ取得部４４が、白色化スペクトル系列に基づいてそのq1次モーメントであるm_q1とそのq2次モーメントであるm_q2とに基づく値m_q1/((m_q2)^q1/q2)を計算した後、例えば上記の第一及び第二の方法と同様、予め用意しておいた異なる複数の、ηと対応するＦ’（η）のペアを参照して、計算されたm_q1/((m_q2)^q1/q2)に最も近いＦ’（η）に対応するηを取得するか、逆関数F’^-1の近似曲線関数を~F’^-1として、近似曲線関数~F^-1に計算されたm_q1/((m_q2)^q1/q2)を入力したときの出力値を計算してηを求めることができる。

　このようにηは次元が異なる２つの異なるモーメントm_q1,m_q2に基づく値であるとも言える。例えば、次元が異なる２つの異なるモーメントm_q1,m_q2のうち、次元が低い方のモーメントの値又はこれに基づく値（以下、前者とする。）と次元が高い方のモーメントの値又はこれに基づく値（以下、後者とする）との比の値、この比の値に基づく値、又は、前者を後者で割って得られる値に基づき、ηを求めてもよい。モーメントに基づく値とは、例えば、そのモーメントをmとしQを所定の実数としてm^Qのことである。また、これらの値を近似曲線関数~F^-1に入力してηを求めてもよい。この近似曲線関数~F’^-1は上記同様、使用する定義域において出力が正値となる単調増加関数であればよい。

　［パラメータ決定装置及び方法を用いた符号化装置、復号装置及びこれらの方法］
　パラメータ決定装置及び方法により求まったパラメータηは、時系列信号の特徴を表す指標と成り得る。このため、パラメータ決定装置及び方法は、例えば符号化処理、復号処理、音の分類や音区間の推定等の音声音響関連技術に用いることができる。

　以下、パラメータ決定装置及び方法を用いた符号化装置、復号及びこれらの方法の例について説明する。

　（符号化）
　符号化装置の構成例を図４に示す。符号化装置は、図４に示すように、周波数領域変換部２１と、線形予測分析部２２と、非平滑化振幅スペクトル包絡系列生成部２３と、平滑化振幅スペクトル包絡系列生成部２４と、包絡正規化部２５と、符号化部２６と、パラメータ決定装置２７とを例えば備えている。この符号化装置により実現される符号化方法の各処理の例を図５に示す。

　以下、図４の各部について説明する。

　＜パラメータ決定装置２７＞
　パラメータ決定装置２７は、上記説明した図１に例示するパラメータ決定装置である。パラメータ決定装置２７には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。

　パラメータ決定装置２７は、入力された時系列信号に基づいて、上記説明した処理により、パラメータηを決定する（ステップＡ７）。決定されたηは、線形予測分析部２２、非平滑化振幅スペクトル包絡推定部２３及び及び平滑化振幅スペクトル包絡推定部２４に出力される。

　また、パラメータ決定装置２７は、決定されたηを符号化することによりパラメータ符号を生成する。生成されたパラメータ符号は、復号装置に送信される。

　＜周波数領域変換部２１＞
　周波数領域変換部２１には、時間領域の時系列信号である音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。

　周波数領域変換部２１は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する（ステップＡ１）。Nは正の整数である。

　得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部２２と包絡正規化部２５に出力される。

　このようにして、周波数領域変換部２１は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。

　＜線形予測分析部２２＞
　線形予測分析部２２には、周波数領域変換部２１が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。

　線形予測分析部２２は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式（A7)により定義される~R(0),~R(1),…,~R(N-1)を線形予測分析して線形予測係数β₁,β₂,…,β_pを生成し、生成された線形予測係数β₁,β₂,…,β_pを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β₁,^β₂,…,^β_pとを生成する（ステップＡ２）。

　生成された量子化線形予測係数^β₁,^β₂,…,^β_pは、非平滑化スペクトル包絡系列生成部２３と平滑化振幅スペクトル包絡系列生成部２４に出力される。なお、線形予測分析処理の過程で予測残差のエネルギーσ²が算出される。この場合、算出された予測残差のエネルギーσ²は、分散パラメータ決定部２６８に出力される。

　また、生成された線形予測係数符号は、復号装置に送信される。

　具体的には、線形予測分析部２２は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(A7)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部２２は、求まった擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β₁,β₂,…,β_pを生成する。そして、線形予測分析部２２は、生成された線形予測係数β₁,β₂,…,β_pを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β₁,^β₂,…,^β_pとを得る。

　線形予測係数β₁,β₂,…,β_pは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。

　線形予測分析部２２による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術は、複数の量子化線形予測係数の候補が予め定められ、各候補が線形予測係数符号と予め対応付けられて記憶されており、候補の何れかが生成された線形予測係数に対する量子化線形予測係数として決定され、量子化線形予測係数と線形予測係数符号とが得られる技術である。

　このようにして、線形予測分析部２２は、例えばMDCT係数列である周波数領域系列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を生成する。

　＜非平滑化振幅スペクトル包絡系列生成部２３＞
　非平滑化振幅スペクトル包絡系列生成部２３には、線形予測分析部２２が生成した量子化線形予測係数^β₁,^β₂,…,^β_pが入力される。

　非平滑化振幅スペクトル包絡系列生成部２３は、量子化線形予測係数^β₁,^β₂,…,^β_pに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する（ステップＡ３）。

　生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、符号化部２６に出力される。

　非平滑化振幅スペクトル包絡系列生成部２３は、量子化線形予測係数^β₁,^β₂,…,^β_pを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(A2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。

　このようにして、非平滑化振幅スペクトル包絡系列生成部２３は、線形予測分析部２２により生成された線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を１／η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う。ここで、ｃを任意の数として、複数の値から構成される系列をｃ乗した系列とは、複数の値のそれぞれをｃ乗した値から構成される系列のことである。例えば、振幅スペクトル包絡の系列を１／η乗した系列とは、振幅スペクトル包絡の各係数を１／η乗した値から構成される系列のことである。

　非平滑化振幅スペクトル包絡系列生成部２３による１／η乗の処理は、線形予測分析部２２で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理に起因するものである。すなわち、非平滑化振幅スペクトル包絡系列生成部２３による１／η乗の処理は、線形予測分析部２２で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理によりη乗された値を元の値に戻すために行われる。

　＜平滑化振幅スペクトル包絡系列生成部２４＞
　平滑化振幅スペクトル包絡系列生成部２４には、線形予測分析部２２が生成した量子化線形予測係数^β₁,^β₂,…,^β_pが入力される。

　平滑化振幅スペクトル包絡系列生成部２４は、量子化線形予測係数^β₁,^β₂,…,^β_pに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)を生成する（ステップＡ４）。

　生成された平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)は、包絡正規化部２５及び符号化部２６に出力される。

　平滑化振幅スペクトル包絡系列生成部２４は、量子化線形予測係数^β₁,^β₂,…,^β_pと補正係数γを用いて、平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)として、式(A3)により定義される平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)を生成する。

　ここで、補正係数γは予め定められた１未満の定数であり非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を平滑化する係数である。

　＜包絡正規化部２５＞
　包絡正規化部２５には、周波数領域変換部２１が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡生成部２４が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)が入力される。

　包絡正規化部２５は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)の各値で正規化することにより、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)を生成する（ステップＡ５）。

　生成された正規化MDCT係数列は、符号化部２６に出力される。

　包絡正規化部２５は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)で除算することにより、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)の各係数X_N(k)を生成する。すなわち、k=0,1,…,N-1として、X_N(k)=X(k)/^H_γ(k)である。

　＜符号化部２６＞
　符号化部２６には、包絡正規化部２５が生成した正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)、非平滑化振幅スペクトル包絡生成部２３が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部２４が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)及び線形予測分析部２２が算出した平均残差のエネルギーσ²が入力される。

　符号化部２６は、図６に示すステップＡ６１からステップＡ６５の処理を例えば行うことにより符号化を行う（ステップＡ６）。

　符号化部２６は、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)に対応するグローバルゲインgを求め（ステップＡ６１）、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を求め（ステップＡ６２）、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数に対応する分散パラメータφ(0),φ(1),…,φ(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)と平均残差のエネルギーσ²とから式(A1)により求め（ステップＡ６３）、分散パラメータφ(0),φ(1),…,φ(N-1)を用いて量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を算術符号化して整数信号符号を得（ステップＡ６４）、グローバルゲインgに対応する利得符号を得る（ステップＡ６５）。

　ここで、上記の式(A1)における正規化振幅スペクトル包絡系列^H_N(0),^H_N(1),…,^H_Nは、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)の各値で除算したもの、すなわち、以下の式(A8)により求まるものである。

　生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、復号装置に出力される。

　符号化部２６は、ステップＡ６１からステップＡ６５により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。

　符号化部２６が行うステップＡ６１からステップＡ６５のうち、の特徴的な処理が含まれるのはステップＡ６３であり、グローバルゲインgと量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献１に記載された技術を含む様々な公知技術が存在する。以下では符号化部２６が行う符号化処理の具体例を２つ説明する。

　［符号化部２６が行う符号化処理の具体例１］
　符号化部２６が行う符号化処理の具体例１として、ループ処理を含まない例について説明する。

　具体例１の符号化部２６の構成例を図７に示す。具体例１の符号化部２６は、図７に示すように、利得取得部２６１と、量子化部２６２と、分散パラメータ決定部２６８と、算術符号化部２６９と、利得符号化部２６５とを例えば備えている。以下、図７の各部について説明する。

　＜利得取得部２６１＞
　利得取得部２６１には、包絡正規化部２５が生成した正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)が入力される。

　利得取得部２６１は、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する（ステップＳ２６１）。利得取得部２６１は、例えば、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。または、利得取得部２６１は、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)のエネルギーの合計と、配分ビット数Bと、グローバルゲインgと、の関係を予めテーブル化しておき、そのテーブルを参照することによりグローバルゲインgを得て出力してもよい。

　このようにして、利得取得部２６１は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。

　得られたグローバルゲインgは、量子化部２６２及び分散パラメータ決定部２６８に出力される。

　＜量子化部２６２＞
　量子化部２６２には、包絡正規化部２５が生成した正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)及び利得取得部２６１が得たグローバルゲインgが入力される。

　量子化部２６２は、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を得て出力する（ステップＳ２６２）。

　このようにして、量子化部２６２は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。

　得られた量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)は、算術符号化部２６９に出力される。

　＜分散パラメータ決定部２６８＞
　分散パラメータ決定部２６８には、利得取得部２６１が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部２３が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部２４が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)及び線形予測分析部２２が得た予測残差のエネルギーσ²が入力される。

　分散パラメータ決定部２６８は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)と、予測残差のエネルギーσ²とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する（ステップＳ２６８）。

　得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部２６９に出力される。

　＜算術符号化部２６９＞
　算術符号化部２６９には、量子化部２６２が得た量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)及び分散パラメータ決定部２６８が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。

　算術符号化部２６９は、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を算術符号化して整数信号符号を得て出力する（ステップＳ２６９）。

　算術符号化部２６９は、算術符号化の際に、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数が一般化ガウス分布f_GG(X|φ(k),η)に従うときに最適になるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。この結果、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数へのビット割り当ての期待値が分散パラメータ系列φ(0),φ(1),…,φ(N-1)で決定されることになる。

　得られた整数信号符号は、復号装置に出力される。

　量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部２６９は、推定されたスペクトル包絡（非平滑化振幅スペクトル包絡）を基に実質的にビット割り当てが変わる符号化を行っていると言える。

　＜利得符号化部２６５＞
　利得符号化部２６５には、利得取得部２６１が得たグローバルゲインｇが入力される。

　利得符号化部２６５は、グローバルゲインｇを符号化して利得符号を得て出力する（ステップＳ２６５）。

　本具体例１のステップＳ２６１，Ｓ２６２，Ｓ２６８，Ｓ２６９，Ｓ２６５がそれぞれ上記のステップＡ６１，Ａ６２，Ａ６３，Ａ６４，Ａ６５に対応する。

　［符号化部２６が行う符号化処理の具体例２］
　符号化部２６が行う符号化処理の具体例２として、ループ処理を含む例について説明する。

　具体例２の符号化部２６の構成例を図８に示す。具体例２の符号化部２６は、図８に示すように、利得取得部２６１と、量子化部２６２と、分散パラメータ決定部２６８と、算術符号化部２６９と、利得符号化部２６５と、判定部２６６と、利得更新部２６７とを例えば備えている。以下、図８の各部について説明する。

　利得取得部２６１は、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する（ステップＳ２６１）。利得取得部２６１は、例えば、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。

　利得取得部２６１が得たグローバルゲインgは、量子化部２６２及び分散パラメータ決定部２６８で用いられるグローバルゲインの初期値となる。

　＜量子化部２６２＞
　量子化部２６２には、包絡正規化部２５が生成した正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)及び利得取得部２６１又は利得更新部２６７が得たグローバルゲインgが入力される。

　ここで、量子化部２６２が初回に実行される際に用いられるグローバルゲインgは、利得取得部２６１が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部２６２が２回目以降に実行される際に用いられるグローバルゲインgは、利得更新部２６７が得たグローバルゲインg、すなわちグローバルゲインの更新値である。

　＜分散パラメータ決定部２６８＞
　分散パラメータ決定部２６８には、利得取得部２６１又は利得更新部２６７が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部２３が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部２４が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)及び線形予測分析部２２が得た予測残差のエネルギーσ²が入力される。

　ここで、分散パラメータ決定部２６８が初回に実行される際に用いられるグローバルゲインgは、利得取得部２６１が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、分散パラメータ決定部２６８が２回目以降に実行される際に用いられるグローバルゲインgは、利得更新部２６７が得たグローバルゲインg、すなわちグローバルゲインの更新値である。

　算術符号化部２６９は、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を算術符号化して、整数信号符号と整数信号符号のビット数である消費ビット数Ｃとを得て出力する（ステップＳ２６９）。

　算術符号化部２６９は、算術符号化の際に、量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数が一般化ガウス分布f_GG(X|φ(k),η)に従うときに最適になるようなビット割り当てを算術符号により行い、行われたビット割り当てに基づく算術符号により符号化を行う。

　得られた整数信号符号及び消費ビット数Ｃは、判定部２６６に出力される。

　＜判定部２６６＞
　判定部２６６には、算術符号化部２６９が得た整数信号符号が入力される。

　判定部２６６は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部２６５に対し利得更新部２６７が得たグローバルゲインｇを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部２６７に対し、算術符号化部２６４が計測した消費ビット数Ｃを出力する（ステップＳ２６６）。

　＜利得更新部２６７＞
　利得更新部２６７には、算術符号化部２６４が計測した消費ビット数Ｃが入力される。

　利得更新部２６７は、消費ビット数Ｃが配分ビット数Ｂより多い場合にはグローバルゲインｇの値を大きな値に更新して出力し、消費ビット数Ｃが配分ビット数Ｂより少ない場合にはグローバルゲインｇの値を小さな値に更新し、更新後のグローバルゲインｇの値を出力する（ステップＳ２６７）。

　利得更新部２６７が得た更新後のグローバルゲインgは、量子化部２６２及び利得符号化部２６５に出力される。

　＜利得符号化部２６５＞
　利得符号化部２６５には、判定部２６６からの出力指示及び利得更新部２６７が得たグローバルゲインｇが入力される。

　利得符号化部２６５は、指示信号に従って、グローバルゲインｇを符号化して利得符号を得て出力する（ステップ２６５）。

　判定部２６６が出力した整数信号符号と、利得符号化部２６５が出力した利得符号は、正規化MDCT係数列に対応する符号として、復号装置に出力される。

　すなわち、本具体例２においては、最後に行われたステップＳ２６７が上記のステップＡ６１に対応し、ステップＳ２６２，Ｓ２６３，Ｓ２６４，Ｓ２６５がそれぞれ上記のステップＡ６２，Ａ６３，Ａ６４，Ａ６５に対応する。

　なお、符号化部２６が行う符号化処理の具体例２については、国際公開公報WO2014/054556などに更に詳細に説明されている。

　［符号化部２６の変形例］
　符号化部２６は、例えば以下の処理を行うことにより、推定されたスペクトル包絡（非平滑化振幅スペクトル包絡）を基にビット割り当てを変える符号化を行ってもよい。

　符号化部２６は、まず、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)に対応するグローバルゲインgを求め、正規化MDCT係数列X_N(0),X_N(1),…,X_N(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)を求める。

　この量子化正規化済係数系列X_Q(0),X_Q(1),…,X_Q(N-1)の各係数に対応する量子化ビットは、X_Q(k)の分布がある範囲内で一様であると仮定して、その範囲を包絡の推定値から決めることができる。複数のサンプルごとの包絡の推定値を符号化することもできるが、符号化部２６は、例えば以下の式(A9)のように線形予測に基づく正規化振幅スペクトル包絡系列の値^H_N(k)を使用してX_Q(k)の範囲を決めることができる。

あるkにおけるX_Q(k)を量子化するときに、X_Q(k)の二乗誤差を最小とするために

の制約のもとに、割り当てるビット数b(k)

を設定することができる。Bは予め定められた正の整数である。この際にb(k)が整数となるように四捨五入するとか、０より小さくなる場合にはb(k)=0とするなどして、b(k)の再調整の処理を符号化部２６は行ってもよい。

　また、符号化部２６は、サンプルごとの割り当てでなく、複数のサンプルをまとめて配分ビット数を決めて、量子化にもサンプルごとのスカラ量子化でなく、複数のサンプルをまとめたベクトルごとの量子化をすることも可能である。

　サンプルkのX_Q(k)の量子化ビット数b(k)が上記で与えられ、サンプルごとに符号化するとすると、X_Q(k)は-2^b(k)-1から2^b(k)-1までの2^b(k)種類の整数を取り得る。符号化部２６は、b(k)ビットで各サンプルを符号化して整数信号符号を得る。

　生成された整数信号符号は、復号装置に出力される。例えば、生成されたX_Q(k)に対応するb(k)ビットの整数信号符号は、k=0から順次復号装置に出力される。

　もし、X_Q(k)が上記の-2^b(k)-1から2^b(k)-1までの範囲をこえる場合には最大値、または最小値に置き換える。

　ｇが小さすぎるとこの置き換えで量子化歪が発生し、ｇが大きすぎると量子化誤差は大きくなり、X_Q(k)のとりうる範囲がb(k)に比べて小さすぎて、情報の有効利用ができないことになる。このため、ｇの最適化を行ってもよい。

　符号化部２６は、グローバルゲインgを符号化して利得符号を得て出力する。

　この符号化部２６の変形例のように、符号化部２６は算術符号化以外の符号化を行ってもよい。

　（復号）
　符号化装置に対応する復号装置の構成例を図９に示す。第三実施形態の復号装置は、図９に示すように、線形予測係数復号部３１と、非平滑化振幅スペクトル包絡系列生成部３２と、平滑化振幅スペクトル包絡系列生成部３３と、復号部３４と、包絡逆正規化部３５と、時間領域変換部３６と、パラメータ復号部３７とを例えば備えている。この復号装置により実現される第三実施形態の復号方法の各処理の例を図１０に示す。

　復号装置には、符号化装置が出力した、パラメータ符号、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。

　以下、図９の各部について説明する。

　＜パラメータ復号部３７＞
　パラメータ復号部３７には、符号化装置が出力したパラメータ符号が入力される。

　パラメータ復号部３７は、パラメータ符号を復号することにより復号パラメータηを求める。求まった復号パラメータηは、非平滑化振幅スペクトル包絡系列生成部３２、平滑化振幅スペクトル包絡系列生成部３３及び復号部３４に出力される。

　＜線形予測係数復号部３１＞
　線形予測係数復号部３１には、符号化装置が出力した線形予測係数符号が入力される。

　線形予測係数復号部３１は、フレームごとに、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^β₁,^β₂,…, ^β_pを得る（ステップＢ１）。

　得られた復号線形予測係数^β₁,^β₂,…, ^β_pは、非平滑化振幅スペクトル包絡系列生成部３２及び非平滑化振幅スペクトル包絡系列生成部３３に出力される。

　ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。

　このようにして、線形予測係数復号部３１は、入力された線形予測係数符号を復号することにより、時系列信号に対応する周波数領域系列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対応する線形予測係数に変換可能な係数を生成する。

　＜非平滑化振幅スペクトル包絡系列生成部３２＞
　非平滑化振幅スペクトル包絡系列生成部３２には、パラメータ復号部３７が求めた復号パラメータη及び線形予測係数復号部３１が得た復号線形予測係数^β₁,^β₂,…,^β_pが入力される。

　非平滑化振幅スペクトル包絡系列生成部３２は、復号線形予測係数^β₁,^β₂,…,^β_pに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を上記の式(A2)により生成する（ステップＢ２）。

　生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、復号部３４に出力される。

　このようにして、非平滑化振幅スペクトル包絡系列生成部３２は、、線形予測係数復号部３１により生成された線形予測係数に変換可能な係数に対応するに対応する振幅スペクトル包絡の系列を１／η乗した系列である非平滑化スペクトル包絡系列を得る。

　＜平滑化振幅スペクトル包絡系列生成部３３＞
　平滑化振幅スペクトル包絡系列生成部３３には、パラメータ復号部３７が求めた復号パラメータη及び線形予測係数復号部３１が得た復号線形予測係数^β₁,^β₂,…,^β_pが入力される。

　平滑化振幅スペクトル包絡系列生成部３３は、復号線形予測係数^β₁,^β₂,…,^β_pに対応する振幅スペクトル包絡の系列の振幅の凹凸を鈍らせた系列である平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)を上記の式A(3)により生成する（ステップＢ３）。

　生成された平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)は、復号部３４及び包絡逆正規化部３５に出力される。

　＜復号部３４＞
　復号部３４には、パラメータ復号部３７が求めた復号パラメータη、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡生成部３２が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡生成部３３が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)が入力される。

　復号部３４は、分散パラメータ決定部３４２を備えている。

　復号部３４は、図１１に示すステップＢ４１からステップＢ４４の処理を例えば行うことにより復号を行う（ステップＢ４）。すなわち、復号部３４は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインｇを得る（ステップＢ４１）。復号部３４の分散パラメータ決定部３４２は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)とから上記の式(A1)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める（ステップＢ４２）。復号部３４は、正規化MDCT係数列に対応する符号に含まれる整数信号符号を分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータに対応する算術復号の構成に従い、算術復号して復号正規化済係数系列^X_Q(0),^X_Q(1),…,^X_Q(N-1)を得（ステップＢ４３）、復号正規化済係数系列^X_Q(0),^X_Q(1),…,^X_Q(N-1)の各係数にグローバルゲインｇを乗算して復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)を生成する（ステップＢ４４）。このように、復号部３４は、非平滑化スペクトル包絡系列に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。

　なお、［符号化部２６の変形例］に記載された処理により符号化が行われた場合には、復号部３４は例えば以下の処理を行う。復号部３４は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインｇを得る。復号部３４の分散パラメータ決定部３４２は、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)とから上記の式(A9)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める。復号部３４は、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータφ(k)に基づいて式(A10)によりb(k)を求めることができ、X_Q(k)の値をそのビット数b(k)で順次復号して、復号正規化済係数系列^X_Q(0),^X_Q(1),…,^X_Q(N-1)を得て、復号正規化済係数系列^X_Q(0),^X_Q(1),…,^X_Q(N-1)の各係数にグローバルゲインｇを乗算して復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)を生成する。このように、復号部３４は、非平滑化スペクトル包絡系列に基づいて変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。

　生成された復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)は、包絡逆正規化部３５に出力される。

　＜包絡逆正規化部３５＞
　包絡逆正規化部３５には、平滑化振幅スペクトル包絡生成部３３が生成した平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)及び復号部３４が生成した復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)が入力される。

　包絡逆正規化部３５は、平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)を用いて、復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する（ステップＢ５）。

　生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部３６に出力される。

　例えば、包絡逆正規化部３５は、k=0,1,…,N-1として、復号正規化MDCT係数列^X_N(0),^X_N(1),…,^X_N(N-1)の各係数^X_N(k)に、平滑化振幅スペクトル包絡系列^H_γ(0),^H_γ(1),…,^H_γ(N-1)の各包絡値^H_γ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^X_N(k)×^H_γ(k)である。

　＜時間領域変換部３６＞
　時間領域変換部３６には、包絡逆正規化部３５が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。

　時間領域変換部３６は、フレームごとに、包絡逆正規化部３５が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号（復号音信号）を得る（ステップＢ６）。

　このようにして、復号装置は、周波数領域での復号により時系列信号を得る。

　［パラメータ決定装置及び方法を用いた音分類装置及び方法］
　以下、パラメータ決定装置及び方法を用いた音分類装置及び方法の例について説明する。

　音分類装置は、図１３に示すように、パラメータ決定装置５１及び判定部５２を例えば備えている。この音分類装置が以下や図１３に例示する処理行うことにより音分類方法が実現される。

　パラメータ決定装置５１は、上記説明したパラメータ装置であり、上記説明した処理によりパラメータηを決定する（ステップＥ１）。決定されたηは判定部５２に出力される。

　判定部５２は、パラメータ決定装置及び方法により決定されたパラメータηが、所定の閾値よりも小さい場合には、そのパラメータηに対応する時系列信号の区間は音楽であると分類し、そうでない場合には音声と分類する（ステップＥ２）。

　この音分類装置及び方法は、パラメータηが小さいほど対応する時系列信号の定常性が大きいという性質に起因するものである。

　［変形例等］
　パラメータ決定装置又は方法は、ループ処理によりパラメータηを求めてもよい。すなわち、パラメータ決定装置又は方法は、パラメータ取得部４４で求まるパラメータηを所定の方法で定められるパラメータη₀とする、スペクトル包絡推定部４２、白色化スペクトル系列生成部４３及びパラメータ取得部４４の処理を更に１回以上行ってもよい。

　この場合、例えば、図１で破線で示すように、パラメータ取得部４４で求まったパラメータηは、スペクトル包絡推定部４２に出力される。スペクトル包絡推定部４２は、パラメータ取得部４４で求まったηに基づいて、上記説明した処理と同様の処理を行いスペクトル包絡の推定を行う。白色化スペクトル系列生成部４３は、新たに推定されたスペクトル包絡に基づいて、上記説明した処理と同様の処理を行い白色化スペクトル系列を生成する。パラメータ取得部４４は、新たに生成された白色化スペクトル系列に基づいて、上記説明した処理と同様の処理を行いパラメータηを求める。

　例えば、スペクトル包絡推定部４２、白色化スペクトル系列生成部４３及びパラメータ取得部４４の処理は、所定の回数であるτ回だけ更に行われてもよい。τは所定の正の整数であり、例えばτ＝１又はτ＝２である。

　また、スペクトル包絡推定部４２は、今回求まったパラメータηと前回求まったパラメータηとの差の絶対値が所定の閾値以下となるまで、スペクトル包絡推定部４２、白色化スペクトル系列生成部４３及びパラメータ取得部４４の処理を繰り返してもよい。

　線形予測分析部２２及び非平滑化振幅スペクトル包絡系列生成部２３を１つのスペクトル包絡推定部２Ａとして捉えると、このスペクトル包絡推定部２Ａは、時系列信号に対応する例えばMDCT係数列である周波数領域系列の絶対値のη乗をパワースペクトルと見做したスペクトル包絡（非平滑化振幅スペクトル包絡系列）の推定を行っていると言える。ここで、「パワースペクトルと見做した」とは、パワースペクトルを通常用いるところに、η乗のスペクトルを用いることを意味する。

　この場合、スペクトル包絡推定部２Ａの線形予測分析部２２は、例えばMDCT係数列である周波数領域系列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得ていると言える。また、スペクトル包絡推定部２Ａの非平滑化振幅スペクトル包絡系列生成部２３は、線形予測分析部２２により得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を１／η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行っていると言える。

　また、平滑化振幅スペクトル包絡系列生成部２４、包絡正規化部２５及び符号化部２６を１つの符号化部２Ｂとして捉えると、この符号化部２Ｂは、スペクトル包絡推定部２Ａにより推定されたスペクトル包絡（非平滑化振幅スペクトル包絡系列）を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を例えばMDCT係数列である周波数領域系列の各係数に対して行っていると言える。

　復号部３４及び包絡逆正規化部３５を１つの復号部３Ａとして捉えると、この復号部３Ａは、非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得ていると言える。

　上記説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。

　また、各方法又は各装置における各種の処理をコンピュータによって実現してもよい。その場合、各方法又は各装置の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各方法又は各装置における各種の処理がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

　パラメータη_０及びパラメータηを正の数として、所定の方法で定められるパラメータη_０を用いて、時系列信号に対応する周波数領域サンプル列の絶対値のη_０乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定部と、
　上記スペクトル包絡で上記周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る白色化スペクトル系列生成部と、
　パラメータηを形状パラメータとする一般化ガウス分布が上記白色化スペクトル系列のヒストグラムを近似するパラメータηを求めるパラメータ取得部と、
　を含むパラメータ決定装置。
　請求項１のパラメータ決定装置であって、
　上記パラメータ取得部で求まるパラメータηを上記所定の方法で定められるパラメータη_０とする、上記スペクトル包絡推定部、上記白色化スペクトル系列生成部及び上記パラメータ取得部の処理を更に１回以上行う、
　パラメータ決定装置。
　請求項１又は２のパラメータ決定装置であって、
　q1、q2を予め定めた異なる正の整数として、上記パラメータ取得部は、上記白色化スペクトル系列のq1次モーメントであるm_q1の値と上記白色化スペクトル系列のq2次モーメントであるm_q2の値とに基づき上記パラメータηを求める、
　パラメータ決定装置。
　請求項３のパラメータ決定装置であって、
　Nを所定の正の数とし、k=0,1,…,N-1とし、上記白色化スペクトル系列の各値をX_W(k)とし、Γをガンマ関数とし、F^-1を関数Fの逆関数として、上記パラメータ取得部が求めるηは、以下の式により定義される、

　パラメータ決定装置。
　請求項４のパラメータ決定装置であって、
　上記パラメータ取得部は、上記白色化スペクトル系列に基づいてm_q1/((m_q2)^q1/q2)を計算し、予め用意しておいた異なる複数の、ηと対応するＦ（η）のペアを参照して、計算されたm_q1/((m_q2)^q1/q2)に最も近いＦ（η）に対応するηを取得する、
　パラメータ決定装置。
　請求項４のパラメータ決定装置であって、
　上記逆関数F^-1の近似曲線関数を~F^-1として、
　上記パラメータ取得部は、上記白色化スペクトル系列に基づいてm_q1/((m_q2)^q1/q2)を計算し、上記近似曲線関数~F^-1に計算されたm_q1/((m_q2)^q1/q2)を入力したときの出力値を計算することによりηを求める、
　パラメータ決定装置。
　請求項１から６の何れかのパラメータ決定装置において、
　上記パラメータ決定装置は、各フレームごとにパラメータηを求めるものであり、
　現在パラメータηを求めようとしているフレームの上記所定の方法で定められるパラメータη_０は、現在パラメータηを求めようとしているフレームよりも前のフレームで求まったηである、
　パラメータ決定装置。
　請求項１から７の何れかのパラメータ決定装置であって、
　上記時系列信号は音信号であり、
　上記パラメータηは、上記音信号の特徴を表すパラメータである、
　パラメータ決定装置。
　パラメータη_０及びパラメータηを正の数として、所定の方法で定められるパラメータη_０を用いて、時系列信号に対応する周波数領域サンプル列の絶対値のη_０乗をパワースペクトルと見做してスペクトル包絡の推定を行うスペクトル包絡推定ステップと、
　上記スペクトル包絡で上記周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る白色化スペクトル系列生成ステップと、
　パラメータηを形状パラメータとする一般化ガウス分布が上記白色化スペクトル系列のヒストグラムを近似するパラメータηを求めるパラメータ取得ステップと、
　を含むパラメータ決定方法。
　請求項９のパラメータ決定方法であって、
　上記パラメータ取得部で求まるパラメータηを上記所定の方法で定められるパラメータη_０とする、上記スペクトル包絡推定部、上記白色化スペクトル系列生成部及び上記パラメータ取得部の処理を更に１回以上行う、
　パラメータ決定方法。
　請求項９又は１０のパラメータ決定方法であって、
　q1、q2を予め定めた異なる正の整数として、上記パラメータ取得部は、上記白色化スペクトル系列のq1次モーメントであるm_q1の値と上記白色化スペクトル系列のq2次モーメントであるm_q2の値とに基づき上記パラメータηを求める、
　パラメータ決定方法。
　請求項１１のパラメータ決定方法であって、
　Nを所定の正の数とし、k=0,1,…,N-1とし、上記白色化スペクトル系列の各値をX_W(k)とし、Γをガンマ関数とし、F^-1を関数Fの逆関数として、上記パラメータ取得部が求めるηは、以下の式により定義される、

　パラメータ決定方法。
　請求項１２のパラメータ決定方法であって、
　上記パラメータ取得部は、上記白色化スペクトル系列に基づいてm_q1/((m_q2)^q1/q2)を計算し、予め用意しておいた異なる複数の、ηと対応するＦ（η）のペアを参照して、計算されたm_q1/((m_q2)^q1/q2)に最も近いＦ（η）に対応するηを取得する、
　パラメータ決定方法。
　請求項１２のパラメータ決定方法であって、
　上記逆関数F^-1の近似曲線関数を~F^-1として、
　上記パラメータ取得部は、上記白色化スペクトル系列に基づいてm_q1/((m_q2)^q1/q2)を計算し、上記近似曲線関数~F^-1に計算されたm_q1/((m_q2)^q1/q2)を入力したときの出力値を計算することによりηを求める、
　パラメータ決定方法。
　請求項９から１４の何れかのパラメータ決定方法において、
　上記パラメータ決定方法は、各フレームごとにパラメータηを求めるものであり、
　現在パラメータηを求めようとしているフレームの上記所定の方法で定められるパラメータη_０は、現在パラメータηを求めようとしているフレームよりも前のフレームで求まったηである、
　パラメータ決定方法。
　請求項９から１４の何れかのパラメータ決定方法であって、
　上記時系列信号は音信号であり、
　上記パラメータηは、上記音信号の特徴を表すパラメータである、
　パラメータ決定方法。
　請求項１から８の何れかのパラメータ決定装置の各部としてコンピュータを機能させるためのプログラム。
　請求項１から８の何れかのパラメータ決定装置の各部としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。