JP4354561B2

JP4354561B2 - オーディオ信号符号化装置及び復号化装置

Info

Publication number: JP4354561B2
Application number: JP00329999A
Authority: JP
Inventors: 峰生津島; 武志則松; 智一石川; 慶昭澤田
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1999-01-08
Filing date: 1999-01-08
Publication date: 2009-10-28
Anticipated expiration: 2019-01-08
Also published as: JP2000206989A

Description

【０００１】
【発明の属する技術分野】
本発明は、オーディオ信号符号化装置及び復号化装置に関し、特に、少ない符号化列で効率的に符号化を行う符号化装置と、少ない情報量から高音質なオーディオ信号を生成する復号化装置に関するものである。
【０００２】
【従来の技術】
従来より、オーディオ信号を効率的に符号化、および復号化する方式には、様々な方式が提案されており、このなかで、音楽信号など２０kHz 以上の周波数帯域を有するオーディオ信号に対する符号化、および復号化方式には、近年ではＭＰＥＧオーディオ方式などがある。
【０００３】
上記ＭＰＥＧ方式に代表される符号化方式は、時間軸のディジタルオーディオ信号を、コサイン変換などの直交変換を用いて周波数軸上のデータに変換し、その周波数軸上の情報を、人間の聴覚的な感度特性を利用して聴覚的に重要な情報から符号化を行い、聴覚的に重要でない情報や冗長な情報の符号化を行わない方式である。このＭＰＥＧオーディオに関することは、ISO/IEC 標準IS-11172-3などに記載されている。
【０００４】
また、源ディジタル信号の情報量に対して、かなり少ない情報量で表現しようとする場合、ベクトル量子化の手法を用いたＴＣ−ＷＶＱなどの符号化方式があり、このＴＣ−ＷＶＱに関することは、T.Moriya,H.Suga:An 8 Kbits transform coder for noisy channels, Proc.ICASSP 89,pp196-199 などに記載されている。
【０００５】
図６は、従来のオーディオ符号化装置７００を示すブロック図である。
符号化装置７００は、ＬＰＣ係数またはＬＳＰ係数などの抽出を行うスペクトル推定手段７０１と、上記ＬＰＣ係数またはＬＳＰ係数の量子化を行う量子化手段７０２と、量子化された上記ＬＰＣ係数またはＬＳＰ係数を用いて、スペクトル包絡の合成を行うスペクトル合成手段７０３と、入力された周波数スペクトルを上記合成されたスペクトル包絡で正規化を行うスペクトル正規化手段７０４と、スペクトル情報の量子化を行うスペクトル量子化手段７０５とを備える。
【０００６】
次に動作について説明する。
スペクトル推定手段７０１へ周波数スペクトルが入力される。
スペクトル推定手段７０１では、入力された周波数スペクトルからＬＰＣ係数またはＬＳＰ係数などの抽出を行い量子化手段７０２へ出力する。
スペクトル量子化手段７０２では、上記スペクトル推定手段７０１で抽出されたＬＰＣ係数またはＬＳＰ係数の量子化を行いスペクトル合成手段７０３へ出力する。
スペクトル合成手段７０３では、量子化されたＬＰＣ係数またはＬＳＰ係数を用いてスペクトル包絡を合成し、スペクトル正規化手段７０４へ出力する。
スペクトル正規化手段７０４では、入力周波数スペクトルを上記合成スペクトル包絡で正規化を行い、正規化したスペクトルをスペクトル量子化手段７０４へ出力する。
スペクトル量子化手段７０５では、上記スペクトル正規化手段７０４が出力した正規化したスペクトルに対してスペクトル情報の量子化を行う。
【０００７】
【発明が解決しようとする課題】
上記のオーディオ信号符号化装置７００は、１つの入力スペクトル列に対して、１つのスペクトル概形を推定して量子化するように構成されているため、一度の計算でスペクトル包絡を求めることができ、計算速度は速い。しかしその反面、周波数を選択し、周波数によって量子化の精度を変えることができない。
【０００８】
具体的には、広帯域な周波数特性をもつ入力スペクトルの量子化を行う場合、この構成では、１つのスペクトル概形しか求めないので、推定したスペクトル包絡は大まかなものとなり、量子化効率の向上が図れない。また狭帯域な周波数特性をもつ入力スペクトルの量子化を行う場合において、高ビットレ−トな低域の周波数分析が細やかに行われないため、推定した低域のスペクトル概形は大まかなものとなってしまい、量子化効率の向上が図れない。さらに、入力スペクトルが低ビットレートである場合においても、情報量が少ないため、１つの入力スペクトル列に対して１つのスペクトル概形を推定するという上記の構成では量子化効率の向上は図れない。
【０００９】
また、上記の構成で、スペクトル量子化手段を何段も設けると、前段のスペクトル量子化手段での量子化誤差を、後段のスペクトル量子化手段が量子化を行うので量子化効率は向上する。また、全帯域のスペクトル包絡を合成するときに消費する情報量は約２５ビットレ−ト程度であるのに対し、量子化時に消費する情報量は約１５００ビットレ−ト程度であり、量子化時に消費する情報量はかなり大きい。また、スペクトル量子化手段は比較的計算量が多いのでスペクトル量子化手段を多く設けるに従い、計算量も莫大なものとなってしまう。
【００１０】
本発明は、上記のような問題点を解決するためになされたもので、これまでの構成と比べて計算量はほとんど増やすことなく、周波数帯域によって量子化の精度を容易に変化させることが可能な、量子化効率の高い、また符号化信号を少ない符号列で表現することが可能なオーディオ信号符号化装置、及び少ない情報量から高音質なオ−ディオ信号に生成可能な復号化装置を提供するものである。
【００１１】
【課題を解決するための手段】
本発明の請求項１に記載の発明に係るオーディオ信号符号化装置は、入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、前記スペクトル分割手段は、前記入力された周波数スペクトル情報から抽出した聴覚的なエントロピーに基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするものである。
【００１７】
また、請求項２に記載の発明に係るオーディオ信号符号化装置は、入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、前記スペクトル分割手段は、前記入力された周波数スペクトル情報から判定した音声非音声の判定結果に基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするものである。
また、請求項３に記載の発明に係るオーディオ信号符号化装置は、請求項１または請求項２に記載のオーディオ信号符号化装置において、前記スペクトル分割手段と、前記スペクトル推定手段、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル帯域量子化手段、及び前記スペクトル量子化手段を有する符号化手段を２段以上設け、前段の符号化手段の量子化による量子化誤差を、後段の符号化手段が量子化する構成であることを特徴とするものである。
【００１９】
また、請求項４に記載の発明に係るオーディオ信号復号化装置は、入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、前記複数の周波数帯域は、周波数スペクトル情報から抽出された聴覚的なエントロピーに基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするものである。
【００２５】
また、請求項５に記載の発明に係るオーディオ信号復号化装置は、入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、前記複数の周波数帯域は、周波数スペクトル情報から判定された音声非音声の判定結果に基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするものである。
また、請求項６に記載の発明に係るオーディオ信号復号化装置は、請求項４または請求項５に記載のオーディオ信号復号化装置において、前記スペクトル帯域逆量子化手段と、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル逆量子化手段、及び前記スペクトル生成手段を有する復号化手段を２段以上設け、また、複数の周波数スペクトル情報を、１つのオーディオ信号の周波数スペクトル情報に合成するスペクトル合成器を備えたことを特徴とするものである。
【００２７】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて説明する。
（実施の形態１）
一般に観測されるオーディオ時系列信号は、ＭＤＣＴ(Modified Discrete Cosine Transform)などの直交変換を用いて、オーディオ信号を、時間軸上の情報から周波数軸上の情報に変換を行ったものである。
本実施の形態では、周波数軸上の情報として、ＭＤＣＴ係数が得られた場合について説明する。また、上記周波数軸上の情報として、ＦＦＴ係数やＤＣＴ係数などを用いてもよい。
【００２８】
図１は本発明の実施の形態１によるオーディオ信号符号化装置１００，及び復号化装置２００の全体の構成を示す図である。
オーディオ信号符号化装置１００において、１０１は、入力された周波数スペクトル情報（ＭＤＣＴ係数）を２つの周波数帯域に分割するスペクトル分割手段である。１０２は、入力された低域成分のＭＤＣＴ係数に対しスペクトル分析を行うスペクトル１推定手段１０２である。１０３は、入力された高域成分のＭＤＣＴ係数に対しスペクトル分析を行うスペクトル２推定手段である。
【００２９】
また１０４は、上記スペクトル１推定手段１０２が算出したＬＰＣ係数に基づいて、低域のスペクトル包絡を合成するスペクトル包絡１合成手段である。１０５は、上記スペクトル２推定手段１０３が算出したＬＰＣ係数に基づいて、高域のスペクトル包絡を合成するスペクトル包絡２合成手段である。
【００３０】
また１０６は、上記低域のスペクトル包絡と、上記高域のスペクトル包絡とを重畳し、全帯域の合成スペクトル包絡を作成するスペクトル重畳手段である。１０７は、入力スペクトルを、上記スペクトル重畳手段１０６からの全帯域の合成スペクトル包絡を用いて、量子化を行うスペクトル量子化手段である。
【００３１】
また１０８は、上記スペクトル１推定手段１０２が算出した低域のＬＰＣ係数の量子化を行い復号化装置２００へ出力するスペクトル帯域１量子化手段である。１０９は、スペクトル２推定手段１０３が算出した高域のＬＰＣ係数の量子化を行い復号化装置２００へ出力するスペクトル帯域２量子化手段である。
【００３２】
また、オーディオ信号復号化装置２００において、２０２は、上記スペクトル帯域１量子化手段１０８が出力した低域のＬＰＣ係数を逆量子化するスペクトル帯域１逆量子化手段２０２である。２０３は、上記スペクトル帯域２量子化手段１０９が出力した高域のＬＰＣ係数を逆量子化するスペクトル帯域２逆量子化手段２０３である。
【００３３】
また２０４は、上記スペクトル帯域１逆量子化手段２０２からの出力に基づいて低域のスペクトル包絡を合成するスペクトル包絡１合成手段である。２０５は、上記スペクトル帯域２逆量子化手段２０３からの出力に基づいて高域のスペクトル包絡を合成するスペクトル包絡２合成手段である。２０６は、上記低域のスペクトル包絡と高域のスペクトル包絡を重畳し、全帯域の合成スペクトル包絡を作成するスペクトル重畳手段である。
【００３４】
また２０７は、スペクトル量子化手段１０７からの出力を逆量子化するスペクトル逆量子化手段である。２０８は、上記逆量子化手段２０７の出力と上記スペクトル重畳手段２０６の出力とを用いて、オーディオ信号の周波数スペクトルの生成を行うスペクトル生成手段である。
【００３５】
また、図２は周波数スペクトルを示す図である。図において、横軸は周波数スペクトルのサンプル値であり、縦軸はスペクトル値である。そして図２は、特に入力周波数スペクトル情報として、１０２４サンプルからなるＭＤＣＴ係数を、低域成分と高域成分に５１２サンプルで均一に分割した場合の例である。
【００３６】
また図２(a) は、スペクトル分割手段１０１に入力された周波数スペクトルを示す。図２(b) は、スペクトル包絡１合成手段１０４にて合成された低域のスペクトル包絡を示す。図２(c) は、スペクトル包絡２合成手段１０５にて合成された高域のスペクトル包絡を示す。図２(d) は、スペクトル重畳手段１０６で合成される全帯域の合成スペクトル包絡を示す。図２(e) は、スペクトル量子化手段１０７にて、図２(a) の入力スペクトルを、図２(d) の全帯域の合成スペクトル包絡で除算したものである。スペクトル量子化手段１０７では、さらにこの除算値を量子化して出力する。
【００３７】
次に動作について説明する。
スペクトル分割手段１０１に、周波数スペクトル情報ａとして、例えば１０２４サンプルからなるＭＤＣＴ係数（図２(a) ）が入力される。すると、スペクトル分割手段１０１では、周波数スペクトル情報ａを低域成分ｂ１と高域成分ｂ２とに、予め設定しておいた値で分割し、低域成分のＭＤＣＴ係数ｂ１をスペクトル１推定手段１０２へ、高域成分のＭＤＣＴ係数ｂ２をスペクトル２推定手段１０３へ、それぞれ出力する。
【００３８】
上記スペクトル分割手段１０１におけるＭＤＣＴ係数の分割は、１０２４サンプルからなるＭＤＣＴ係数を、低域成分５１２サンプル，高域成分５１２サンプルと、低域と高域のサンプル数を均一に分割を行ってもよい。また、低域成分を１２８サンプル，高域成分を８９６サンプルと、低域と高域のサンプル数を不均一に分割を行ってもよい。
【００３９】
また、スペクトル１推定手段１０２では、上記スペクトル分割手段１０１より入力された低域のＭＤＣＴ係数に対してスペクトル分析を行う。スペクトル２推定手段１０３では、上記スペクトル分割手段１０１より入力された高域のＭＤＣＴ係数に対してスペクトル分析を行う。
【００４０】
具体的には、スペクトル１推定手段１０２では、入力された低域のＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することによって、ＬＰＣ係数を取得する。同様にスペクトル２推定手段１０３では、入力された高域のＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することによって、ＬＰＣ係数を取得する。
ＬＰＣ係数の算出の一例としては、スペクトル１推定手段１０２に入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（５１１）｝とすると、
【００４１】
【数１】

【００４２】
を用いて、パワースペクトル｛ｐ（０）〜ｐ（５１１）｝に変換する。
次に数１より取得した上記パワースペクトルと、
【００４３】
【数２】

【００４４】
とを用いて自己相関｛ｒ（０）〜ｒ（Ｍ）｝を得る。ここで、Ｍは線形予測の次数である。そして、Levison-Durbinなどの方法を用いて、上記自己相関関数｛ｒ（０）〜ｒ（Ｍ）｝からＬＰＣ係数｛alpha(0)〜alpha(M)｝を取得する。尚、上記スペクトル１推定手段１０２で得られたＬＰＣ係数は、そのまま用いてもよいし、ＬＳＰ係数などの周波数特性を示す係数に近似的に変換してもよい。
このように、スペクトル１推定手段１０２で算出された上記ＬＰＣ係数ｂ１１は、スペクトル包絡１合成手段１０４およびスペクトル帯域１量子化手段１０８へ出力される。
【００４５】
また、スペクトル２推定手段１０３においても、同様の方法で、スペクトル２推定手段１０３に入力されたＭＤＣＴ係数からＬＰＣ係数を算出し、算出されたＬＰＣ係数ｂ２１は、スペクトル包絡２合成手段１０５およびスペクトル帯域２量子化手段１０９へ出力される。
【００４６】
スペクトル帯域１量子化手段１０８では、スペクトル１推定手段１０２からの出力ｂ１１を量子化し、量子化した符号（ｂ１１）' を復号化装置２００のスペクトル帯域１逆量子化手段２０２へ出力する。また、スペクトル帯域２量子化手段１０９では、スペクトル2 推定手段１０３からの出力ｂ２１を量子化し、量子化した符号（ｂ２１）' を復号化装置２００のスペクトル帯域２逆量子化手段２０３へ出力する。
【００４７】
一方、上記スペクトル包絡１合成手段１０４では、スペクトル１推定手段１０２が出力したＬＰＣ係数ｂ１１を用いて、低域のスペクトル包絡ｂ１２を合成し（図２(b) ）、スペクトル重畳手段１０６へ出力する。同様に、スペクトル包絡２合成手段１０５では、スペクトル２推定手段１０３が出力したＬＰＣ係数ｂ２１を用いて、高域のスペクトル包絡ｂ２２を合成し（図２(c) ）、スペクトル重畳手段１０６へ出力する。
具体的に、上記各周波数帯域のスペクトル包絡を算出する方法は、例えばスペクトル包絡１合成手段１０４への入力が、ＬＰＣ係数｛alpha(0)〜 alpha( Ｍ) ｝の場合において、
【００４８】
【数３】

【００４９】
のような系列｛ｘ（０）〜ｘ（５１１）｝を作成する。そして、該系列｛ｘ（０）〜ｘ（５１１）｝にＦＦＴを施すことによって、パワー情報を取得し、スペクトル包絡１合成手段１０４でのスペクトル包絡が算出される。
【００５０】
またこのとき、低域と高域の各周波数帯域のスペクトル包絡（図２(b) ，(c) ）は、入力スペクトル（図２(a) ）に比べ、スペクトル値は極めて低いことがわかる。つまり、入力周波数スペクトルを低域成分と高域成分の２つに分割し、各周波数帯域毎にスペクトル包絡の算出を行っても、情報量としては極めて少ない線形予測係数（ＬＰＣ係数またはＬＳＰ係数）を用いるため、分割を行わずにスペクトル包絡の算出を行った場合と比べた計算量の増加は微々たるものである。
【００５１】
スペクトル重畳手段１０６では、スペクトル包絡１合成手段１０４の出力ｂ１２である低域のスペクトル包絡と、スペクトル包絡２合成手段１０５の出力ｂ２２である高域のスペクトル包絡を重畳し、上記スペクトル分割手段１０１に入力された周波数スペクトルに対応する全帯域の合成スペクトル包絡ｂを作成する（図２(d) ）。
【００５２】
例えば、スペクトル包絡１合成手段１０４からの出力を、｛ｓｐ（０）〜ｓｐ（５１１）｝とし、また、スペクトル包絡２合成手段１０５からの出力を、｛ｓｐ２（０）〜ｓｐ（５１１）｝とすると、スペクトル重畳手段１０６からの出力のスペクトル包絡｛ｓｐ（０）〜ｓｐ（１０２３）｝は、
【００５３】
【数４】

【００５４】
で表される。
このように、スペクトル重畳手段１０６にて合成された、全帯域の合成スペクトル包絡ｂは、スペクトル量子化手段１０７へ出力される。
スペクトル量子化手段１０７では、入力スペクトルａを、上記スペクトル重畳手段１０６の出力である全帯域の合成スペクトル包絡ｂで除算し（図２(e) ）、次に除算値ａ／ｂの量子化を行い、量子化により取得したパラメタ（ａ／ｂ−ｋ１）' を本発明のオーディオ信号符号化手段１００の出力の１つとし、復号化装置２００におけるスペクトル逆量子化手段２０７へ出力する。尚、上記ｋ１は、量子化の際の量子化誤差である。このように、スペクトル量子化手段１０７が、入力されたＭＤＣＴ係数を全帯域のスペクトル包絡で除算することにより、図２(a) の入力スペクトルは、図２(e) に示すように、平坦な周波数スペクトルとなる。そしてこれを量子化すると、符号化装置１００から出力される符号化信号は、少ない符号列で表現されることとなる。
【００５５】
したがって、本実施の形態１のオーディオ信号符号化手段１００による符号出力は、スペクトル帯域量子化手段１０２および１０３からの、情報量の非常に少ないＬＰＣ係数またはＬＳＰ係数を量子化した符号（ｂ１１）' ，（ｂ２１）' と、スペクトル量子化手段１０７からの入力スペクトルを全帯域の合成スペクトル包絡で除算し、情報量を少なくして量子化した符号（ａ／ｂ−ｋ１）' である。
【００５６】
次にオーディオ信号復号化装置２００の動作について説明する。
スペクトル帯域１逆量子化手段２０２では、スペクトル帯域１量子化手段１０８の出力（ｂ１１）' を逆量子化し、復元したＬＰＣ係数ｂ１１をスペクトル包絡１合成手段２０４へ出力する。またスペクトル帯域２逆量子化手段２０３では、スペクトル帯域２量子化手段１０９の出力（ｂ２１）' を逆量子化し、復元したＬＰＣ係数ｂ２１をスペクトル包絡２合成手段２０５へ出力する。
【００５７】
スペクトル包絡１合成手段２０４は、スペクトル帯域１逆量子化手段２０２より入力されたＬＰＣ係数ｂ１１を用いて低域のスペクトル包絡ｂ１２を合成し、スペクトル重畳手段２０６へ出力する。またスペクトル包絡２合成手段２０５は、スペクトル帯域２逆量子化手段２０３より入力されたＬＰＣ係数ｂ２１を用いて高域のスペクトル包絡ｂ２２を合成し、スペクトル重畳手段２０６へ出力する。
【００５８】
スペクトル重畳手段２０６では、スペクトル包絡１合成手段２０４からの低域のスペクトル包絡ｂ１２と、スペクトル包絡２合成手段２０５からの高域のスペクトル包絡ｂ２２を重畳し、全帯域の合成スペクトル包絡ｂを作成して、スペクトル生成手段２０８へ出力する。
【００５９】
一方、スペクトル逆量子化手段２０７は、スペクトル量子化手段１０７からの出力（ａ／ｂ−ｋ１）' を逆量子化し、復元したスペクトル情報（ａ／ｂ−ｋ１）を、スペクトル生成手段２０８へ出力する。
スペクトル生成手段２０８では、スペクトル重畳手段２０６から出力ｂと、スペクトル逆量子化手段２０７からの出力（ａ／ｂ−ｋ１）とを乗算してオーディオ信号の周波数スペクトル情報ａ' を復元し、出力する。
そして、スペクトル生成手段２０８からの周波数スペクトル情報ａ' （ＭＤＣＴ係数）に、逆ＭＤＣＴ変換などの逆直交変換を行うと、時間軸上のオーディオ信号に復元される。
【００６０】
このように本実施の形態１のオ−ディオ信号符号化装置１００によれば、入力された周波数スペクトルを低域と高域の２つの周波数帯域に分割し、分割した各周波数帯域から情報量としては非常に少ない線形予測係数（ＬＰＣ係数またはＬＳＰ係数）を抽出して低域と高域のスペクトル包絡をそれぞれ算出するので、分割を行わずに全帯域の合成スペクトル包絡を算出する場合と、計算量はほとんど変わらない量で、しかも分割を行わない場合よりも、細やかな全帯域の合成スペクトル包絡を求めることができる。
【００６１】
また、オ−ディオ信号符号化装置１００は、周波数スペクトルを低域と高域の２つの帯域に分割する構成であるため、低域と高域の各周波数帯域で量子化の精度を容易に変え、聴覚的に重要な周波数帯域に対し多くの情報量を配分することが可能となり、狭帯域な音声信号であっても低域の量子化の精度を向上させることができる。また、低ビットレートな音声信号であっても、聴覚的に重要な周波数帯域に対し多くの情報量を配分することにより、量子化の精度を向上させることができ、少ない情報量から高音質な音楽サービスを提供することができる。
【００６２】
さらに、入力された周波数スペクトルの量子化には、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算した値を用いて量子化するので、情報量が大幅に削減され、符号化装置１００から出力される符号化信号は、少ない符号列で表現することができ、効率的に符号化を行うことができる。そして、復号化装置２００では、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算し逆量子化した値に、逆量子化した全帯域の合成スペクトル包絡を乗算し音声信号の生成を行っているので、少ない情報量から、効率的に高音質な音声信号を生成することができる。
【００６３】
（実施の形態２）
一般に観測されるオーディオ信号は、ＭＤＣＴなどの直交変換を用いて、オーディオ信号を時間軸上の情報から周波軸上の情報に変換を行ったものである。
ここでは、周波数軸上の情報として、ＭＤＣＴ係数が得られた場合について説明する。また、周波数軸上の情報として、ＦＦＴ係数やＤＣＴ係数などを用いてもよい。
【００６４】
また、実施の形態２に係るオーディオ信号符号化装置１００のスペクトル分割手段１０１では、実施の形態１と同様に、入力された周波数スペクトル情報を２つの周波数帯域に分割するが、このとき実施の形態２のスペクトル分割手段１０１では、入力された周波数スペクトル情報に基づいて分割する周波数の帯域幅を制御できるように構成されている。その他の構成は、実施の形態１と同様である。
【００６５】
次に動作について説明する。
スペクトル分割手段１０１に、周波数スペクトル情報ａとして、例えば１０２４サンプルからなるＭＤＣＴ係数が入力される。スペクトル分割手段１０１では、ＭＤＣＴ係数が入力されると、ＭＤＣＴ係数を２つの周波数帯域に分割する。このとき、スペクトル分割手段１０１では、入力された周波数スペクトル情報に基づいて、分割する周波数の帯域幅（サンプル数）を制御する。
【００６６】
上記ＭＤＣＴ係数の分割方法には、予め設定された４パターンくらいの分割パターンのなかから周波数帯域幅を選択し分割する方法や、入力されたＭＤＣＴ係数の特徴に基づいて周波数帯域幅を決定し、任意のサンプル数で分割する方法などがある。
【００６７】
具体的に、上記予め設定された分割パターンのなかから周波数帯域幅を選択し分割する方法とは、まずスペクトル分割手段１０１に、低域成分のＭＤＣＴ係数と高域成分のＭＤＣＴ係数のサンプル数をそれぞれ、１２８サンプルと８９６サンプル、２５６サンプルと７６８サンプル、５１２サンプルと５１２サンプル、３４１サンプルと６８３サンプル、のように複数の分割パターンを設定しておく。そして、スペクトル分割手段１０１は、上記複数の分割パタ−ンの中から分割パタ−ンを１つ選択し、選択された分割パタ−ンのサンプル数で、入力されたＭＤＣＴ係数を低域成分と高域成分に分割するという方法である。
【００６８】
また、上記ＭＤＣＴ係数の特徴に基づいて周波数帯域幅を決定し、任意のサンプル数で分割する方法とは、入力されたＭＤＣＴ係数の特徴に基づいて、分割の境界となるサンプル番号Ｒを決定し、ＭＤＣＴ係数をサンプル番号Ｒにて低域成分と高域成分とに分割する方法である。そしてこの分割の境界となるサンプル番号Ｒは、周波数帯域を２つに分割すると、低域のサンプルの総パワーと、高域のサンプルの総パワーとが、等しくなるように境界のサンプル番号Ｒを決定するか、または周波数帯域を２つに分割すると、低域のサンプルの総パワーと、高域のサンプルの総パワーとの比が、所定の値となるように境界のサンプル番号Ｒを決定する。
具体的に分割方法を説明すると、まず、入力されたＭＤＣＴ係数を、｛ｙ（０）〜ｙ（１０２３）｝とした場合、
【００６９】
【数５】

【００７０】
の判定式を用いて、ｐｏｗ１とｐｏｗ２とが最も近い値となるサンプル番号Ｒ、またはｐｏｗ１とｐｏｗ２の比が所定の値となるサンプル番号Ｒを算出する。そして、低域の周波数帯域を、サンプル数で０からＲー１に設定し、また高域の周波数帯域をサンプル数で、Ｒから１０２３に設定し、ＭＤＣＴ係数を低域成分と高域成分に分割する。
【００７１】
または、入力されたＭＤＣＴ係数を、｛ｙ（０）〜ｙ（１０２３）｝とした場合、ＭＰＥＧ１オーディオ符号化方式などに用いられる最小可聴域の値を用いて分割する方法がある。最小可聴域以上の入力スペクトルの値を０とし、数５の判定式を用いて、ｐｏｗ１とｐｏｗ２が最も近い値となるサンプル番号Ｒ、またはｐｏｗ１とｐｏｗ２の比が所定の値となるサンプル番号Ｒを算出する。そして、低域の周波数帯域を、サンプル数で０からＲー１に設定し、高域の周波数帯域を、サンプル数でＲから１０２３に設定し、ＭＤＣＴ係数を低域成分と高域成分に分割する。
【００７２】
または、入力されたＭＤＣＴ係数を、｛ｙ（０）〜ｙ（１０２３）｝とした場合、入力されたＭＤＣＴ係数からピッチ成分を抽出し、音声非音声の判定に基づいて、周波数帯域幅を決定し、分割する方法がある。上記音声非音声の判定結果において、音声と判定された場合は、５kHz 以下のＭＤＣＴ係数の量子化精度が特に向上するように、ピッチ成分で５kHz に相当するＭＤＣＴ係数のサンプル番号Ｒを求め、サンプル番号Ｒを低域成分と高域成分との境界のサンプルとする。そして、低域成分を０Hz〜５kHz 帯域になるように、低域の周波数帯域を、ＭＤＣＴのサンプル数で０からＲー１に設定し、高域成分を５kHz 以上の帯域になるように、高域の周波数帯域を、ＭＤＣＴ係数のサンプル数でＲから１０２３に設定し、ＭＤＣＴ係数を低域成分と高域成分に分割する。
【００７３】
このようにしてスペクトル分割手段では、予め設定された分割パターンの中から選択するか、または分割の境界となるサンプル番号Ｒを算出することにより、スペクトル分割手段に入力されたＭＤＣＴ係数を、任意の周波数帯域幅にて２つに分割する。そして、２つに分割された周波数帯域のうち、低域成分のＭＤＣＴ係数ｂ１はスペクトル１推定手段１０２へ出力する。また、高域成分のＭＤＣＴ係数ｂ２はスペクトル２推定手段１０３へ出力する。
【００７４】
スペクトル１推定手段１０２では、上記スペクトル分割手段１０１より入力された低域成分のＭＤＣＴ係数ｂ１に対してスペクトル分析を行う。またスペクトル２推定手段１０３では、上記スペクトル分割手段１０１より入力された高域成分のＭＤＣＴ係数ｂ２に対してスペクトル分析を行う。
【００７５】
具体的には、スペクトル１推定手段１０２では、入力された低域のＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することによって、ＬＰＣ係数ｂ１１を取得する。同様にスペクトル２推定手段１０３では、入力された高域のＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することによって、ＬＰＣ係数ｂ２１を取得する。
【００７６】
ＬＰＣ係数の算出の一例としては、スペクトル１推定手段１０２に入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（５１１）｝とすると、数１を用いて、パワースペクトル｛ｐ（０）〜ｐ（５１１）｝に変換する。
【００７７】
次に、数１より取得した上記パワースペクトルと、数２とを用いて自己相関｛ｒ（０）〜ｒ（Ｍ）｝を取得する。ここで、Ｍは線形予測の次数である。そして、Levison-Durbinなどの方法を用いて、上記自己相関関数｛ｒ（０）〜ｒ（Ｍ）｝から、ＬＰＣ係数｛alpha(0)〜 alpha(M) ｝を取得する。尚、上記スペクトル１推定手段１０２で得られたＬＰＣ係数は、そのまま用いてもよいし、ＬＳＰ係数などの周波数特性を示す係数に近似的に変換してもよい。
このように、スペクトル１推定手段１０２で算出されたＬＰＣ係数ｂ１１は、スペクトル包絡１合成手段１０４およびスペクトル帯域１量子化手段１０８へ出力される。
【００７８】
また、スペクトル２推定手段１０３においても、同様の方法で、スペクトル２推定手段１０３に入力されたＭＤＣＴ係数から、ＬＰＣ係数ｂ２２を算出し、スペクトル包絡２合成手段１０５およびスペクトル帯域２量子化手段１０９へ出力される。
【００７９】
上記スペクトル帯域１量子化手段１０８では、スペクトル１推定手段１０２からの出力ｂ１１の量子化を行い，量子化した符号（ｂ１１）' を復号化装置２００のスペクトル帯域１逆量子化手段２０２へ出力する。また、上記スペクトル帯域２量子化手段１０９では、スペクトル２推定手段１０３からの出力ｂ２１の量子化を行い，量子化した符号（ｂ２１）' を復号化装置２００のスペクトル帯域２逆量子化手段２０３へ出力する。
【００８０】
一方、上記スペクトル包絡１合成手段１０４では、スペクトル１推定手段１０２が出力した上記ＬＰＣ係数ｂ１１を用いて、低域のスペクトル包絡ｂ１２を算出し、スペクトル重畳手段１０６へ出力する。同様に、スペクトル包絡２合成手段１０５では、スペクトル２推定手段１０３が出力した上記ＬＰＣ係数ｂ２１を用いて、高域のスペクトル包絡ｂ２２を算出し、スペクトル重畳手段１０６へ出力する。
【００８１】
具体的に、上記各周波数帯域のスペクトル包絡を算出する方法は、例えばスペクトル包絡１合成手段１０４への入力が、ＬＰＣ係数｛alpha(0)〜 alpha（Ｍ) ｝の場合において、数３のような系列｛ｘ（０）〜ｘ（５１１）｝を作成する。そして、該系列｛ｘ（０）〜ｘ（５１１）｝にＦＦＴを施すことによって、パワー情報を取得し、スペクトル包絡１合成手段１０４でのスペクトル包絡が算出される。
【００８２】
スペクトル重畳手段１０６では、スペクトル包絡１合成手段１０４の出力ｂ１２である低域のスペクトル包絡と、スペクトル包絡２合成手段１０５の出力ｂ２２である高域のスペクトル包絡を重畳し、上記スペクトル分割手段１０１に入力された周波数スペクトルに対応する全帯域の合成スペクトル包絡ｂを作成する。
【００８３】
例えば、スペクトル包絡１合成手段１０４からの出力を｛ｓｐ（０）〜ｓｐ（５１１）｝とし、またスペクトル包絡２合成手段１０５からの出力を｛ｓｐ２（０）〜ｓｐ２（５１１）｝とすると、スペクトル重畳手段１０６からの出力のスペクトル包絡｛ｓｐ（０）〜ｓｐ（１０２３）｝は、数４で表される。
このように、スペクトル重畳手段１０６にて合成された全帯域のスペクトル包絡ｂは、スペクトル量子化手段１０７へ出力される。
【００８４】
スペクトル量子化手段１０７では、入力された周波数スペクトルａを、上記スペクトル重畳手段１０６の出力である全帯域の合成スペクトル包絡ｂで除算し、次に除算値ａ／ｂの量子化を行い、量子化により取得したパラメタ（ａ／ｂ−ｋ１）' を、オーディオ信号符号化手段１００の出力の１つとし、復号化装置２００におけるスペクトル逆量子化手段２０７へ出力する。尚、上記ｋ１は、量子化の際の量子化誤差である。
【００８５】
したがって、本実施の形態２のオーディオ信号符号化手段１００による符号出力は、スペクトル帯域量子化手段１０２および１０３から出力される、情報量の非常に少ないＬＰＣ係数またはＬＳＰ係数を量子化した符号（ｂ１１）' ，（ｂ２１）' と、スペクトル量子化手段１０７からの入力スペクトルａを全帯域の合成スペクトル包絡ｂで除算して、情報量を少なくしたものを量子化した符号（ａ／ｂ−ｋ１）' である。
【００８６】
次にオーディオ信号復号化装置２００の動作について説明する。
スペクトル帯域１逆量子化手段２０２では、スペクトル帯域１量子化手段１０８からの出力（ｂ１１）' を逆量子化し、復元したＬＰＣ係数ｂ１１をスペクトル包絡１合成手段２０４へ出力する。またスペクトル帯域２逆量子化手段２０３では、スペクトル帯域２量子化手段１０９からの出力（ｂ２１）' を逆量子化し、復元したＬＰＣ係数ｂ２１をスペクトル包絡２合成手段２０５へ出力する。
【００８７】
スペクトル包絡１合成手段２０４は、スペクトル帯域１逆量子化手段２０２からの出力であるＬＰＣ係数ｂ１１を用いて低域のスペクトル包絡ｂ１２を合成し、スペクトル重畳手段２０６へ出力する。またスペクトル包絡２合成手段２０５は、スペクトル帯域２逆量子化手段２０３からの出力であるＬＰＣ係数ｂ２１を用いて高域のスペクトル包絡ｂ２２を合成し、スペクトル重畳手段２０６へ出力する。
【００８８】
スペクトル重畳手段２０６では、スペクトル包絡１合成手段２０４からの低域のスペクトル包絡ｂ１２と、スペクトル包絡２合成手段２０５からの高域のスペクトル包絡ｂ２２とを重畳して全帯域の合成スペクトル包絡ｂを作成し、スペクトル生成手段２０８へ出力する。
【００８９】
一方、スペクトル逆量子化手段２０７は、スペクトル量子化手段１０７からの出力（ａ／ｂ−ｋ１）' を逆量子化し、復元したスペクトル情報（ａ／ｂ−ｋ１）をスペクトル生成手段２０８へ出力する。
【００９０】
スペクトル生成手段２０８では、スペクトル重畳手段２０６からの出力ｂと、スペクトル逆量子化手段２０７からの出力（ａ／ｂ−ｋ１）とを乗算して、オーディオ信号の周波数スペクトル情報ａ' を復元し、出力する。この周波数スペクトル情報ａ' に、逆ＭＤＣＴ変換などの逆直交変換を行うと、時間軸上のオーディオ信号に復元される。
【００９１】
このように本実施の形態２のオ−ディオ信号符号化装置１００によれば、入力された周波数スペクトルに応じて、分割する周波数帯域幅を可変させるので、聴覚的に重要な周波数帯域に対して、多くの情報量を配分することにより、音声信号が低ビットレ−トである場合においても、量子化効率を向上させることができ、少ない情報量から高音質な音楽サ−ビスを提供することができる。
【００９２】
また、オ−ディオ信号符号化装置１００は、情報量としては非常に少ない、線形予測係数（ＬＰＣ係数またはＬＳＰ係数）を用いて、低域と高域のスペクトル包絡をそれぞれ算出するので、分割を行わずに全帯域の合成スペクトル包絡を算出する場合と、計算量はほとんど変わらない量で、しかも分割を行わない場合よりも、細やかな全帯域の合成スペクトル包絡を求めることができる。
【００９３】
さらに、入力された周波数スペクトルの量子化には、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算した値を用いて量子化するので、情報量が大幅に削減され、符号化装置１００から出力される符号化信号は、少ない符号列で表現することができ、効率的に符号化を行うことができる。そして、復号化装置２００では、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算し逆量子化した値に、逆量子化した全帯域の合成スペクトルを乗算し音声信号の生成を行っているので、少ない情報量の符号化信号から、効率的に高音質な音声信号を生成することができる。
【００９４】
（実施の形態３）
一般に観測されるオーディオ信号は、ＭＤＣＴなどの直交変換を用いて、オーディオ信号を時間軸上の情報から周波数軸上の情報に変換を行ったものである。ここでは、周波数軸上の情報として、ＭＤＣＴ係数が得られた場合について説明する。また、周波数軸上の情報として、ＦＦＴ係数やＤＣＴ係数などを用いてもよい。
【００９５】
図３は、本実施の形態３におけるオーディオ信号符号化装置３００，及びオーディオ信号復号化装置４００のブロック図である。
本実施の形態３にかかるオーディオ信号符号化装置３００では、入力された周波数スペクトル情報を２つ以上の周波数帯域に分割し、分割した周波数帯域毎にスペクトル包絡を算出するよう構成されている。そして、上記スペクトル分割手段３０１の分割した周波数帯域の数に応じて、スペクトル推定手段３０２〜３０４，スペクトル帯域量子化手段３１０〜３１２，及びスペクトル包絡合成手段３０５〜３０７とを設けている。その他の構成は、実施の形態１及び２におけるオーディオ信号符号化装置１００と同様である。
【００９６】
またオーディオ信号復号化装置４００では、上記スペクトル分割手段３０１が分割した周波数帯域の数に応じて、スペクトル帯域逆量子化手段４０２〜４０４とスペクトル包絡合成手段４０５〜４０７とを設けている。その他の構成は、実施の形態１及び２におけるオーディオ信号復号化装置２００と同様である。
【００９７】
また、図４は周波数スペクトルを示す図である。横軸は、周波数スペクトルのサンプル値であり、縦軸はスペクトル値である。そして図４は、特に周波数スペクトルを低域、中域及び高域の３つの周波数帯域に分割した場合の例である。
また図４(a) は、スペクトル分割手段３０１に入力された周波数スペクトルを示す。図４(b) は、スペクトル包絡１合成手段３０５にて合成された低域のスペクトル包絡を示す。図４(c) は、スペクトル包絡２合成手段３０６にて合成された中域のスペクトル包絡を示す。図４(d) は、スペクトル包絡Ｎ合成手段（Ｎ＝３）３０４にて合成された高域のスペクトル包絡を示す。図４(e) は、スペクトル重畳手段３０８で合成される全帯域の合成スペクトル包絡を示す。図４(f) は、スペクトル量子化手段３０９にて、図４(a) の入力スペクトルを、図４(e) の全帯域の合成スペクトル包絡で除算したものである。スペクトル量子化手段３０９では、さらにこの除算値を量子化して出力する。
【００９８】
次に、動作について説明する。
スペクトル分割手段３０１へオ−ディオ信号の周波数スペクトル情報ｃ（ＭＤＣＴ係数）が入力される（図４(a) ）。
スペクトル分割手段３０１では、ＭＤＣＴ係数が入力されると、ＭＤＣＴ係数をＮ個の周波数帯域に分割する。
このときＭＤＣＴ係数の分割方法には、予め設定しておいたサンプル数ごとに分割する方法と、入力されたＭＤＣＴ係数の特徴に基づき分割する方法とがあり、以下に入力されたＭＤＣＴ係数の特徴に基づき分割する方法について具体的に説明する。
例えば、入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（１０２３）｝とした場合、初めに
【００９９】
【数６】

【０１００】
を用いて総エネルギーＥall を算出する。
次に、
【０１０１】
【数７】

【０１０２】
を用いて、上記数６で算出した総エネルギーを、分割したい数Ｎで除算する。そして、このときの各総パワ−（Ｅall ／Ｎ）がそれぞれ等しくなるような境界のサンプル（ｋ，ｌ，ｍ等）を求め、算出したサンプル数でＮ個の周波数帯域に分割する。具体的には、
【０１０３】
【数８】

【０１０４】
のように、分割数Ｎを３とすると、このときの各総パワ−（Ｅall ／３）が、それぞれ等しくなるような境界のサンプル（ｋ，ｌ）を求め、算出したサンプル数（ｋ，ｌ）で、３つの周波数帯域に分割する。
または、例えば入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（１０２３）｝とした場合、ＭＰＥＧ１オーディオ符号化方式などで用いられる最小可聴域の値を用いて分割する方法がある。最小可聴域以上のＭＤＣＴ係数の値を０とし、最小可聴域をＮ個の周波数帯域に分割する。このとき、最小可聴域の総パワ−を求め、数７を用いて、総パワ−を分割数Ｎで除算し、各総パワー（Ｅall ／Ｎ）がそれぞれ等しくなるような境界のサンプル（ｋ，ｌ，ｍ等）を算出する。そして、算出されたサンプル数で、最小可聴域をＮ個の周波数帯域に分割する。
【０１０５】
または、例えば入力されたＭＤＣＴ係数からピッチ成分を抽出し、音声非音声の判定に基づき分割する方法がある。上記音声非音声の判定結果において、音声と判定された場合は、５kHz 以下の周波数情報の量子化精度が特に向上するように、ピッチ成分で低域の０Hz〜５kHz 帯域に相当するＭＤＣＴ係数を、Ｎ個の周波数帯域になるよう分割する。
このように、スペクトル分割手段３０１に入力されたＭＤＣＴ係数は、設定されたサンプル数毎に、或いは、入力されたＭＤＣＴ係数の特徴に基づいて、低域成分から順にＮ個の周波数帯域（ｄ１〜ｄｎ）に分割される。
【０１０６】
上記スペクトル分割手段３０１にて、低域成分から順にＮ個に分割されたＭＤＣＴ係数は、分割された周波数情報のうち、１番目に分割された最も低い低域成分ｄ１はスペクトル１推定手段３０２へ入力される。また、低域から２番目に分割されたＭＤＣＴ係数ｄ２は、スペクトル２推定手段３０３へ入力される。同様に低域からＮ番目に分割されたＭＤＣＴ係数ｄｎは、スペクトルＮ推定手段３０４へ入力される。このように、低域成分から順にＮ個に分割されたＭＤＣＴ係数は、スペクトル１推定手段３０２から順にスペクトルＮ推定手段３０４へと入力される。
【０１０７】
スペクトル１推定手段３０２では、上記スペクトル分割手段３０１が、１番目に分割した最も低域のＭＤＣＴ係数ｄ１に対してスペクトル分析を行い、またスペクトル２推定手段３０３では、上記スペクトル分割手段３０１が２番目に分割したＭＤＣＴ係数ｄ２に対してスペクトル分析を行い、同様にスペクトルＮ推定手段３０４では、低域からＮ番目に分割されたＭＤＣＴ係数ｄｎに対してスペクトル分析を行う。
【０１０８】
具体的には、スペクトル１推定手段３０２では、１番目に分割された最も低域のＭＤＣＴ係数ｄ１に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｄ１１を取得する。また、スペクトル２推定手段３０３では、２番目に分割されたＭＤＣＴ係数ｄ２に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｄ２１を取得する。同様に、スペクトルＮ推定手段３０４では、低域よりＮ番目に分割されたＭＤＣＴ係数ｄｎに対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｄｎ１を取得する。
ＬＰＣ係数の算出の一例としては、スペクトル１推定手段３０２に入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（ｋ）｝とすると、
【０１０９】
【数９】

【０１１０】
を用いて、パワースペクトル｛ｐ（０）〜ｐ（ｋ）｝に変換する。
次に、数９より取得した上記パワースペクトルと、
【０１１１】
【数１０】

【０１１２】
とを用いて、自己相関｛ｒ（０）〜ｒ（Ｑ）｝を得る。ここで、Ｑは線形予測の次数である。そして、Levison-Durbinなどの手法を用いて、上記自己相関関数｛ｒ（０）〜ｒ（Ｑ）｝から、ＬＰＣ係数｛alpha(0)〜 alpha( Ｑ) ｝を取得する。尚、上記スペクトル１推定手段３０２で得られたＬＰＣ係数は、そのまま用いてもよいし、ＬＳＰ係数などの周波数特性を示す係数に近似的に変換してもよい。
このように、スペクトル１推定手段３０２で算出された上記ＬＰＣ係数ｄ１１は、スペクトル包絡１合成手段３０５およびスペクトル帯域１量子化手段３１０へ出力される。
【０１１３】
また、スペクトル２推定手段３０３においても、同様の方法で、スペクトル２推定手段３０３に入力されたＭＤＣＴ係数ｄ２から、ＬＰＣ係数ｄ２１を算出し、スペクトル包絡２合成手段３０６およびスペクトル帯域２量子化手段３１１へ出力される。同様に、スペクトルＮ推定手段３０４においても、スペクトルＮ推定手段３０４に入力されたＭＤＣＴ係数ｄｎから、上記ＬＰＣ係数ｄｎ１を算出し、スペクトル包絡Ｎ合成手段３０７およびスペクトル帯域Ｎ量子化手段３１２へ出力される。
【０１１４】
上記スペクトル帯域１量子化手段３１０では、スペクトル１推定手段３０２からの出力ｄ１１の量子化を行い、量子化した符号（ｄ１１）' を復号化装置４００のスペクトル帯域１逆量子化手段４０２へ出力する。また、スペクトル帯域２量子化手段３１１では、スペクトル２推定手段３０３からの出力ｄ２１を量子化し、量子化した符号（ｄ２１）' を復号化装置４００のスペクトル帯域２逆量子化手段４０３へ出力する。同様に、スペクトル帯域Ｎ量子化手段３１２では、スペクトルＮ推定手段３０４からの出力ｄｎ２の量子化を行い、量子化した符号（ｄｎ２）' を復号化装置４００のスペクトル帯域Ｎ逆量子化手段４０４へ出力する。
【０１１５】
一方、上記スペクトル包絡１合成手段３０５では、スペクトル１推定手段３０２が出力した上記ＬＰＣ係数ｄ１１を用いて、低域のスペクトル包絡ｄ１２を算出し（図４(b) ）、スペクトル重畳手段３０８へ出力する。また、スペクトル包絡２合成手段３０６では、スペクトル２推定手段３０３が出力した上記ＬＰＣ係数ｄ２１を用いて、低域から２番目のスペクトル包絡ｄ２２を算出し（図４(c) ）、スペクトル重畳手段３０８へ出力する。同様に、スペクトル包絡Ｎ合成手段３０７では、スペクトルＮ推定手段３０４が出力した上記ＬＰＣ係数ｄｎ１を用いて、低域からＮ番目のスペクトル包絡ｄｎ２を算出し（図４(d) ）、スペクトル重畳手段３０８へ出力する。
具体的に、上記各周波数帯域のスペクトル包絡を算出する方法は、例えばスペクトル包絡１合成手段３０５への入力が、ＬＰＣ係数｛alpha(0)〜 alpha( Ｑ) ｝の場合において、
【０１１６】
【数１１】

【０１１７】
のような系列｛ｘ（０）〜ｘ（ｋ）｝を作成する。そして該系列｛ｘ（０）〜ｘ（ｋ）｝にＦＦＴを施すことによって、パワー情報を取得し、スペクトル包絡１合成手段３０５でのスペクトル包絡が算出される。
またこのとき、図４を参照すると、各周波数帯域のスペクトル包絡（図４(b) ，(c) ，(d) ）は、入力スペクトル（図４(a) ）に比べ、スペクトル値としては極めて低いことがわかる。つまり、入力スペクトルをＮ個の周波数帯域に分割し、各周波数帯域毎にスペクトル包絡の算出を行っても、情報量としては極めて少ない線形予測係数（ＬＰＣ係数またはＬＳＰ係数）を用いるため、分割を行わずにスペクトル包絡の算出を行った場合と比べた計算量の増加は微々たるものである。
【０１１８】
スペクトル重畳手段３０８では、スペクトル包絡１合成手段３０５の出力からスペクトル包絡Ｎ合成手段３０７までの出力（ｄ１２〜ｄｎ２）を、低域から周波数特性の順に重畳し、上記スペクトル分割手段３０１に入力されたスペクトルに対応する全帯域の合成スペクトル包絡ｄを作成する（図４(e) ）。
【０１１９】
例えば、スペクトル包絡１合成手段３０５からの出力を｛ｓｐ１（０）〜ｓｐ１（ｋ）｝とし、またスペクトル包絡２合成手段３０６からの出力を〔ｓｐ２（０）〜ｓｐ２｛ｌ−（ｋ＋１）｝〕とし、またスペクトル包絡Ｎ合成手段３０７からの出力を〔ｓｐＮ（０）〜ｓｐＮ｛１０２３−（ｐ＋１）｝〕とすると、スペクトル重畳手段３０８からの出力のスペクトル包絡｛ｓｐ（０）〜ｓｐ（１０２３）｝は、
【０１２０】
【数１２】

【０１２１】
で表される。
このように、スペクトル重畳手段３０８にて作成された全帯域の合成スペクトル包絡ｄは、スペクトル量子化手段３０９へ出力される。
スペクトル量子化手段３０９では、入力されたＭＤＣＴ係数ｃを、上記スペクトル重畳手段３０８の出力である全帯域の合成スペクトル包絡ｄで除算する（図４(f) ）。そして次に、除算値ｃ／ｄの量子化を行い、量子化により取得したパラメタ（ｃ／ｄ−ｋ２）' をオーディオ信号符号化装置３００の出力の１つとし、復号化装置４００におけるスペクトル逆量子化手段４０９へ出力する。尚、上記ｋ２は、量子化の際の量子化誤差である。このように、スペクトル量子化手段３０９が、入力されたＭＤＣＴ係数を全帯域の合成スペクトル包絡で除算すると、図４(a) の入力スペクトルは、図４(f) に示すように、平坦な周波数スペクトルとなる。そしてこれを量子化すると、符号化装置３００から出力される符号化信号は、少ない符号列で表現されることとなる。
【０１２２】
したがって、本実施の形態３のオーディオ信号符号化手段３００による符号出力は、スペクトル帯域量子化手段３１０から３１２より出力される、情報量の非常に少ないＬＰＣ係数またはＬＳＰ係数を量子化した符号｛（ｄ１１）' 〜（ｄｎ１）' ｝と、スペクトル量子化手段３０９からの、入力ＭＤＣＴ係数を全帯域の合成スペクトル包絡で除算して情報量を少なくしたものを量子化した符号（ｃ／ｄ−ｋ２）' である。
【０１２３】
次にオーディオ信号復号化装置４００の動作について説明する。
スペクトル帯域１逆量子化手段４０２では、スペクトル帯域１量子化手段３１０からの出力（ｄ１１）' を逆量子化し、復元したＬＰＣ係数ｄ１１をスペクトル包絡１合成手段４０５へ出力する。またスペクトル帯域２逆量子化手段４０３では、スペクトル帯域２量子化手段３１１からの出力（ｄ２１）' を逆量子化し、復元したＬＰＣ係数ｄ２１をスペクトル包絡２合成手段４０６へ出力する。同様に、スペクトル帯域Ｎ逆量子化手段４０４では、スペクトル帯域Ｎ量子化手段３１２からの出力（ｄｎ１）' を逆量子化し、復元したＬＰＣ係数ｄｎ１をスペクトル包絡Ｎ合成手段４０７へ出力する。
【０１２４】
スペクトル包絡１合成手段４０５は、スペクトル帯域１逆量子化手段４０２の出力であるＬＰＣ係数ｄ１１を用いて１番低域のスペクトル包絡ｄ１２を合成し、スペクトル重畳手段４０８へ出力する。またスペクトル包絡２合成手段４０６は、スペクトル帯域２逆量子化手段４０３の出力であるＬＰＣ係数ｄ２１を用いて低域から２番目のスペクトル包絡ｄ２２を合成し、スペクトル重畳手段４０８へ出力する。同様にスペクトル包絡Ｎ合成手段４０７は、スペクトル帯域Ｎ逆量子化手段４０４の出力であるＬＰＣ係数ｄｎ１を用いて低域からＮ番目のスペクトル包絡ｄｎ２を合成し、スペクトル重畳手段４０８へ出力する。
【０１２５】
スペクトル重畳手段４０８では、入力された低域から高域の各スペクトル包絡｛ｄ１２〜ｄｎ２｝を、低域から周波数特性の順に重畳して、全帯域の合成スペクトル包絡ｄを作成し、スペクトル生成手段４１０へ出力する。
一方、スペクトル逆量子化手段４０９は、スペクトル量子化手段３０９からの出力（ｃ／ｄ−ｋ２）' を逆量子化し、復元したスペクトル情報（ｃ／ｄ−ｋ２）をスペクトル生成手段４１０へ出力する。
【０１２６】
スペクトル生成手段４１０では、スペクトル重畳手段４０８からの出力ｄと、スペクトル逆量子化手段４０９からの出力（ｃ／ｄ−ｋ２）とを乗算して、オーディオ信号の周波数スペクトル情報ｃ' を復元し、出力する。
そして、スペクトル生成手段４１０からの周波数スペクトル情報ｃ' （ＭＤＣＴ係数）に、逆ＭＤＣＴ変換などの逆直交変換を行うと、時間軸上のオ−ディオ信号に復元される。
【０１２７】
このように本実施の形態３のオ−ディオ信号符号化装置３００では、入力された周波数スペクトルの特徴に基づいて、分割する周波数帯域の数を増やすことによって、広帯域な音声信号の場合であっても、細やかな周波数情報の抽出により、全帯域に渡って細やかなスペクトル包絡を求めることができ、量子化の精度を向上させることができる。また狭帯域な音声信号であっても、高ビットレ−トな低域の周波数を細かく分割し、分析することにより、低域の周波数スペクトル包絡を細やかに求めることが可能となり、量子化の精度を向上させることができる。また低ビットレ−トな音声信号であっても、分割数を増やすことにより、細やかな周波数情報の抽出が可能となるので、量子化の精度を向上させることができ、少ない情報量から高音質な音楽サ−ビスを提供することができる。
【０１２８】
また、オ−ディオ信号符号化装置３００では、情報量としては非常に少ない線形予測係数を用いて、分割した各周波数帯域毎にスペクトル包絡の合成を行っているので、分割を行わずに全帯域の合成スペクトル包絡を算出する場合と計算量はほとんど増やすことなく、分割を行わない場合よりも細やかな全帯域の合成スペクトル包絡を求めることができる。
【０１２９】
さらに、入力された周波数スペクトルの量子化には、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算した値を用いて量子化するので、情報量が大幅に削減され、符号化装置３００から出力される符号化信号は、少ない符号列で表現することができ、効率的に符号化を行うことができる。そして、復号化装置４００では、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算し逆量子化した値に、逆量子化した全帯域の合成スペクトルを乗算し音声信号の生成を行っているので、少ない情報量の符号化信号から、効率的に高音質な音声信号を生成することができる。
【０１３０】
（実施の形態４）
一般に観測されるオーディオ信号は、ＭＤＣＴなどの直交変換を用いて、オーディオ信号を時間軸上の情報から周波数軸上の情報に変換を行ったものである。
ここでは、周波数軸上の情報として、ＭＤＣＴ係数が得られた場合について説明する。また、周波数軸上の情報として、ＦＦＴ係数やＤＣＴ係数などを用いてもよい。
【０１３１】
図５は、本実施の形態４におけるオーディオ信号符号化装置５００及びオーディオ信号復号化装置６００のブロック図である。
本実施の形態４にかかるオーディオ信号符号化装置は、符号化装置５００ａおよび５００ｂの２段を設ける。そして、スペクトル量子化手段５０９は、入力周波数スペクトル情報ｅの量子化結果を符号化信号（ｅ−ｋ３）' として復号化装置６００ａへ出力する以外に、２段目の符号化装置５００ｂへ量子化誤差ｋ３を出力し、２段目の符号化装置５００ｂは、１段目の符号化装置５００ａにおける量子化の際の量子化誤差ｋ３をさらに量子化するように構成されている。
【０１３２】
また、本実施の形態４にかかるオーディオ信号復号化装置は、上記オーディオ信号符号化装置が５００ａおよび５００ｂの２段を設けたのに対応させて、復号化装置６００ａおよび６００ｂの２段を設ける。また、符号化装置５００ａからの符号（ｅ−ｋ３）' は、復号化装置６００a で復号し、符号化装置５００ｂからの量子化誤差ｋ３を量子化した符号は、復号化装置６００ｂで復号する。そしてスペクトル合成器６２０が、復号化装置６００ａからの出力（ｅ−ｋ３）と、復号化装置６００ｂからの出力ｋ３' を合成してオ−ディオ信号の周波数スペクトル情報ｅ' を復元するように構成されている。
その他の構成は、実施の形態３における符号化装置３００及び復号化装置４００と同様である。
【０１３３】
次に、動作について説明する。
スペクトル分割手段５０１へオ−ディオ信号の周波数スペクトル情報ｅ（ＭＤＣＴ係数）が入力される。
スペクトル分割手段５０１では、ＭＤＣＴ係数が入力されると、ＭＤＣＴ係数をＮ個の周波数帯域に分割する。
このときＭＤＣＴ係数の分割方法には、予め設定しておいたサンプル数ごとに分割する方法と、入力信号の特徴に基づき分割する方法とがあり、以下に入力信号の特徴に基づき分割する方法を具体的に説明する。
【０１３４】
例えば、入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（１０２３）｝とした場合、初めに数６を用いて総エネルギーＥall を算出する。
次に、数７を用いて上記数６で算出した総エネルギーを、分割したい数Ｎで除算する。そして、このときの各総パワ−（Ｅall ／Ｎ）がそれぞれ等しくなるような境界のサンプル（ｋ，ｌ，ｍ等）を求め、算出したサンプル数でＮ個の周波数帯域に分割する。具体的には、分割数Ｎを３とすると、数８を用いて、総エネルギ−を３で除算し、このときの各総パワ−（Ｅall ／３）が、それぞれ等しくなるような境界のサンプル（ｋ，ｌ）を求め、算出したサンプル数（ｋ，ｌ）で、３つの周波数帯域に分割する。
【０１３５】
または、例えば入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（１０２３）｝とした場合、ＭＰＥＧ１オーディオ符号化方式などで用いられる最小可聴域の値を用いて分割する方法がある。最小可聴域以上の入力スペクトルの値を０とし、最小可聴域をＮ個の周波数帯域に分割する。このとき、最小可聴域の総パワ−を求め、数７を用いて、総パワ−を分割数Ｎで除算する。そして、このときの各総パワー（Ｅall ／Ｎ）がそれぞれ等しくなるような境界のサンプル（ｋ，ｌ，ｍ等）を求め、算出されたサンプル数で、最小可聴域をＮ個の周波数帯域に分割する。
【０１３６】
または、例えば入力されたＭＤＣＴ係数からピッチ成分を抽出し、音声非音声の判定に基づく方法がある。上記音声非音声の判定結果において、音声と判定された場合は、ピッチ成分で５kHz 以下の周波数情報の量子化精度が特に向上するように、低域の０Hz〜５kHz 帯域に相当するＭＤＣＴ係数を、Ｎ個の周波数帯域に分割する。
このように、入力されたＭＤＣＴ係数は、スペクトル分割手段５０１にて、設定しておいたサンプル数毎か、或いは、入力されたＭＤＣＴ係数の特徴に基づいて、低域成分から順にＮ個の周波数帯域｛ｆ１〜ｆｎ｝に分割される。
【０１３７】
上記スペクトル分割手段５０１にて、低域成分から順にＮ個に分割されたＭＤＣＴ係数は、分割された周波数スペクトルのうち、１番目に分割された最も低い低域成分ｆ１はスペクトル１推定手段５０２へ入力される。また、低域から２番目に分割されたＭＤＣＴ係数ｆ２は、スペクトル２推定手段５０３へ入力される。同様に低域からＮ番目に分割されたＭＤＣＴ係数ｆｎは、スペクトルＮ推定手段５０４へ入力される。このように、低域成分から順にＮ個に分割されたＭＤＣＴ係数は、スペクトル１推定手段５０２から順にスペクトルＮ推定手段５０４へと入力される。
【０１３８】
スペクトル１推定手段５０２では、上記スペクトル分割手段５０１が、１番目に分割した最も低域のＭＤＣＴ係数ｆ１に対してスペクトル分析を行い、またスペクトル２推定手段５０３では、上記スペクトル分割手段５０１が２番目に分割したＭＤＣＴ係数ｆ２に対してスペクトル分析を行い、同様にスペクトルＮ推定手段では、低域からＮ番目に分割されたＭＤＣＴ係数ｆｎに対してスペクトル分析を行う。
【０１３９】
具体的には、スペクトル１推定手段５０２では、１番目に分割された最も低域成分のＭＤＣＴ係数ｆ１に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｆ１１を取得する。また、スペクトル２推定手段５０３では、２番目に分割されたＭＤＣＴ係数ｆ２に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｆ２１を取得する。同様に、スペクトルＮ推定手段５０４では、低域よりＮ番目に分割されたＭＤＣＴ係数ｆｎに対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｆｎ１を取得する。
【０１４０】
ＬＰＣ係数の算出の一例としては、スペクトル１推定手段５０２に入力されたＭＤＣＴ係数を｛ｙ（０）〜ｙ（ｋ）｝とすると、数９を用いて、パワースペクトル｛ｐ（０）〜ｐ（ｋ）｝に変換する。
【０１４１】
次に、数９より取得した上記パワースペクトルと、数１０とを用いて自己相関｛ｒ（０）〜ｒ（Ｑ）｝を得る。ここで、Ｑは線形予測の次数である。そして、Levison-Durbinなどの手法を用いて、上記自己相関関数｛ｒ（０）〜ｒ（Ｑ）｝から、ＬＰＣ係数｛alpha(0)〜 alpha( Ｑ) ｝を得る。尚、上記スペクトル１推定手段５０２で得られたＬＰＣ係数は、そのまま用いてもよいし、ＬＳＰ係数などの周波数特性を示す係数に近似的に変換してもよい。
このように、スペクトル１推定手段５０２で算出された上記ＬＰＣ係数ｆ１１は、スペクトル包絡１合成手段５０５およびスペクトル帯域１量子化手段５１０へ出力される。
【０１４２】
また、スペクトル２推定手段５０３においても、同様の方法で、スペクトル２推定手段５０３に入力されたＭＤＣＴ係数ｆ２から、ＬＰＣ係数ｆ２１を算出し、スペクトル包絡２合成手段５０６およびスペクトル帯域２量子化手段５１１へ出力される。同様に、スペクトルＮ推定手段５０４においても、スペクトルＮ推定手段５０４に入力されたＭＤＣＴ係数ｆｎから、上記ＬＰＣ係数ｆｎ１を算出し、スペクトル包絡Ｎ合成手段５０７およびスペクトル帯域Ｎ量子化手段５１２へ出力される。
【０１４３】
上記スペクトル帯域１量子化手段５１０では、スペクトル１推定手段５０２からの出力ｆ１１を量子化し、量子化した符号（ｆ１１）' を復号化装置６００ａのスペクトル帯域１逆量子化手段６０２へ出力する。また、上記スペクトル帯域２量子化手段５１１では、スペクトル２推定手段５０３からの出力ｆ２１を量子化し、量子化した符号（ｆ２１）' を復号化装置６００ａのスペクトル帯域２逆量子化手段６０３へ出力する。同様に、上記スペクトル帯域Ｎ量子化手段５１２では、スペクトルＮ推定手段５０４からの出力ｆｎ１を量子化し、量子化した符号（ｆｎ１）' を復号化装置６００ａのスペクトル帯域Ｎ逆量子化手段６０４へ出力する。
【０１４４】
一方、上記スペクトル包絡１合成手段５０５では、スペクトル１推定手段５０２が出力した上記ＬＰＣ係数を用いて、一番低域のスペクトル包絡ｆ１２を算出し、スペクトル重畳手段５０８へ出力する。また、スペクトル包絡２合成手段５０６では、スペクトル２推定手段５０３が出力した上記ＬＰＣ係数を用いて、低域から２番目のスペクトル包絡ｆ２２を算出し、スペクトル重畳手段５０８へ出力する。同様に、スペクトル包絡Ｎ合成手段５０７では、スペクトルＮ推定手段５０４が出力した上記ＬＰＣ係数を用いて、低域からＮ番目のスペクトル包絡ｆｎ２を算出し、スペクトル重畳手段５０８へ出力する。
【０１４５】
具体的に、上記各周波数帯域のスペクトル包絡を算出する方法は、例えばスペクトル包絡１合成手段５０５への入力が、ＬＰＣ係数｛alpha(0)〜 alpha( Ｑ) ｝の場合において、数１１のような系列｛ｘ（０）〜ｘ（ｋ）｝を作成する。そして、該系列｛ｘ（０）〜ｘ（ｋ）｝にＦＦＴを施すことによって、パワー情報を取得し、スペクトル包絡１合成手段５０５でのスペクトル包絡が算出される。
【０１４６】
スペクトル重畳手段５０８では、スペクトル包絡１合成手段５０５の出力からスペクトル包絡Ｎ合成手段５０７までの出力（ｆ１２〜ｆｎ２）を、低域から周波数特性の順に重畳し、上記スペクトル分割手段５０１に入力されたＭＤＣＴ係数（周波数スペクトル）に対応する全帯域の合成スペクトル包絡ｆを作成する。
【０１４７】
例えば、スペクトル包絡１合成手段３０５からの出力を｛ｓｐ１（０）〜ｓｐ１（ｋ）｝とし、またスペクトル包絡２合成手段３０６からの出力を〔ｓｐ２（０）〜ｓｐ２｛ｌ−（ｋ＋１）｝〕とし、またスペクトル包絡Ｎ合成手段３０７からの出力を〔ｓｐＮ（０）〜ｓｐＮ｛１０２３−（ｐ＋１）｝〕とすると、スペクトル重畳手段５０８からの出力のスペクトル包絡｛ｓｐ（０）〜ｓｐ（１０２３）｝は、数１２で表される。
このように、スペクトル重畳手段５０８にて作成された全帯域の合成スペクトル包絡ｆは、スペクトル量子化手段５０９へ出力される。
【０１４８】
スペクトル量子化手段５０９では、入力されたＭＤＣＴ係数ｅを、上記スペクトル重畳手段５０８の出力である全帯域の合成スペクトル包絡ｆで除算して、除算値ｅ／ｆの量子化を行い、量子化により取得したパラメタ（ｅ／ｆ−ｋ３）' を符号化装置５００ａの出力の１つとし、復号化装置６００ａにおけるスペクトル逆量子化手段６０９へ出力する。また、上記ｋ３は、量子化時に生じる量子化誤差であり、この量子化誤差ｋ３は、符号化装置５００ｂへ出力される。
【０１４９】
したがって、オーディオ信号符号化手段５００ａによる符号出力は、スペクトル帯域量子化手段５１０〜５１２より出力される、ＬＰＣ係数またはＬＳＰ係数を量子化した符号｛（ｆ１１）' 〜（ｆｎ１）' ｝と、スペクトル量子化手段５０９からスペクトル逆量子化手段６０９へ出力される量子化した符号（ｅ／ｆ−ｋ３）' 、及び量子化の際の量子化誤差ｋ３である。
【０１５０】
次にオーディオ信号復号化装置６００ａの動作について説明する。
スペクトル帯域１逆量子化手段６０２では、スペクトル帯域１量子化手段５１０からの出力（ｆ１１）' を逆量子化し、復元したＬＰＣ係数ｆ１１をスペクトル包絡１合成手段６０５へ出力する。またスペクトル帯域２逆量子化手段６０３では、スペクトル帯域２量子化手段５１１からの出力（ｆ２１）' を逆量子化し、復元したＬＰＣ係数ｆ２１をスペクトル包絡２合成手段６０６へ出力する。同様に、スペクトル帯域Ｎ逆量子化手段６０４では、スペクトル帯域Ｎ量子化手段５１２からの出力（ｆｎ１）' を逆量子化し、復元したＬＰＣ係数ｆｎ１をスペクトル包絡Ｎ合成手段６０７へ出力する。
【０１５１】
スペクトル包絡１合成手段６０５は、スペクトル帯域１逆量子化手段６０２の出力であるＬＰＣ係数ｈ１１を用いて１番低域のスペクトル包絡ｆ１２を合成し、スペクトル重畳手段６０８へ出力する。またスペクトル包絡２合成手段６０６は、スペクトル帯域２逆量子化手段６０３の出力であるＬＰＣ係数ｈ２１を用いて低域から２番目のスペクトル包絡ｆ２２を合成し、スペクトル重畳手段６０８へ出力する。同様にスペクトル包絡Ｎ合成手段６０７は、スペクトル帯域Ｎ逆量子化手段６０４の出力であるＬＰＣ係数ｈｎ１を用いて低域からＮ番目のスペクトル包絡ｆｎ２を合成し、スペクトル重畳手段６０８へ出力する。
【０１５２】
スペクトル重畳手段６０８では、入力された低域から高域の各スペクトル包絡（ｆ１２〜ｆｎ２）を、低域から周波数特性の順に重畳して全帯域の合成スペクトル包絡ｆを作成し、スペクトル生成手段６１０へ出力する。
一方、スペクトル逆量子化手段６０９は、スペクトル量子化手段５０９からの出力（ｅ／ｆ−ｋ３）' を逆量子化し、復元したスペクトル情報（ｅ／ｆ−ｋ３）をスペクトル生成手段６１０へ出力する。
スペクトル生成手段６１０では、スペクトル重畳手段６０８からの出力ｆと、スペクトル逆量子化手段６０９からの出力（ｅ／ｆ−ｋ３）を乗算して、復元した周波数スペクトル情報（ｅ−ｋ３）をスペクトル合成器６２０へ出力する。
【０１５３】
一方、符号化装置５００ａのスペクトル量子化手段５０９から、符号化装置５００ｂのスペクトル分割手段５２１へ、量子化誤差ｋ３によるＭＤＣＴ係数が入力される。
すると、スペクトル分割手段５２１では、１段目のスペクトル分割手段５０１と同様に、入力されたＭＤＣＴ係数ｋ３を、予め設定しておいたサンプル数毎か、或いは、入力されたＭＤＣＴ係数の特徴に基づいて、低域成分から順にＮ個の周波数帯域に分割し、分割した低域成分から順に、スペクトル１推定手段５２２からスペクトルＮ推定手段５２４へ出力する。
【０１５４】
具体的には、１番目に分割された最も低い低域成分ｈ１はスペクトル１推定手段５２２へ入力される。また、低域から２番目に分割されたＭＤＣＴ係数ｈ２は、スペクトル２推定手段５２３へ入力される。同様に低域からＮ番目に分割されたＭＤＣＴ係数ｈｎは、スペクトルＮ推定手段５２４へ入力される。
【０１５５】
スペクトル１推定手段５２２では、上記スペクトル分割手段５２１が、１番目に分割した最も低域のＭＤＣＴ係数ｈ１に対してスペクトル分析を行い、またスペクトル２推定手段５２３では、上記スペクトル分割手段５２１が２番目に分割したＭＤＣＴ係数ｈ２に対してスペクトル分析を行い、同様にスペクトルＮ推定手段５２４では、低域からＮ番目に分割されたＭＤＣＴ係数ｈｎに対してスペクトル分析を行う。
【０１５６】
具体的には、スペクトル１推定手段５２２では、１番目に分割された最も低域のＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｈ１１を取得し、スペクトル包絡１合成手段５２５およびスペクトル帯域１量子化手段５３０へ出力する。また、スペクトル２推定手段５２３では、２番目に分割されたＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｈ２１を取得し、スペクトル包絡２合成手段５２６およびスペクトル帯域２量子化手段５３１へ出力する。同様に、スペクトルＮ推定手段５２４では、低域よりＮ番目に分割されたＭＤＣＴ係数に対して、自己相関を算出し、線形予測係数を算出することで、ＬＰＣ係数ｈｎ１を取得し、スペクトル包絡Ｎ合成手段５２７およびスペクトル帯域Ｎ量子化手段５３２へ出力する。
【０１５７】
スペクトル帯域１量子化手段５３０では、スペクトル１推定手段５２２からの出力ｈ１１の量子化を行い、量子化した符号（ｈ１１）' を復号化装置６００ｂのスペクトル帯域１逆量子化手段６１１へ出力する。また、スペクトル帯域２量子化手段５３１では、スペクトル２推定手段５２３からの出力ｈ２１の量子化を行い、量子化した符号（ｈ２１）' を復号化装置６００ｂのスペクトル帯域２逆量子化手段６１２へ出力する。同様に、スペクトル帯域Ｎ量子化手段５３２では、スペクトルＮ推定手段５２４からの出力ｈｎ１の量子化を行い、量子化した符号（ｈｎ１）' を復号化装置６００ｂのスペクトル帯域Ｎ逆量子化手段６１３へ出力する。
【０１５８】
一方、上記スペクトル包絡１合成手段５２５では、スペクトル１推定手段５２２が出力したＬＰＣ係数を用いて、低域のスペクトル包絡ｈ１２を算出し、スペクトル重畳手段５２８へ出力する。また、スペクトル包絡２合成手段５２６では、スペクトル２推定手段５２３が出力したＬＰＣ係数を用いて、低域から２番目のスペクトル包絡ｈ２２を算出し、スペクトル重畳手段５２８へ出力する。同様に、スペクトル包絡Ｎ合成手段５２７では、スペクトルＮ推定手段５２４が出力した上記ＬＰＣ係数を用いて、低域からＮ番目のスペクトル包絡ｈｎ２を算出し、スペクトル重畳手段５２８へ出力する。
【０１５９】
スペクトル重畳手段５２８では、スペクトル包絡１合成手段５２５の出力からスペクトル包絡Ｎ合成手段５２７までの出力（ｈ１２〜ｈｎ２）を、低域から周波数特性の順に重畳し、全帯域のスペクトル包絡ｈを合成してスペクトル量子化手段５２９へ出力する。
【０１６０】
スペクトル量子化手段５２９では、符号化装置５００ａからの量子化誤差ｋ３を、上記スペクトル重畳手段５２８の出力である全帯域の合成スペクトル包絡ｈで除算する。そして次に、除算値ｋ３／ｈの量子化を行い、量子化により取得したパラメタ（ｋ３／ｈ−ｋ４）' を、本発明のオーディオ信号符号化装置５００ｂの出力の１つとし、復号化装置６００ｂにおけるスペクトル逆量子化手段６１８へ出力する。尚、上記ｋ４は、量子化の際の量子化誤差である。このように、符号化装置５００ｂでは、符号化装置５００ａによる量子化誤差ｋ３の量子化を行う。
【０１６１】
したがって、オーディオ信号符号化装置５００ｂによる符号出力は、スペクトル帯域量子化手段５３０〜５３２より出力される、ＬＰＣ係数またはＬＳＰ係数を量子化した符号｛（ｈ１１）' 〜（ｈｎ１）' ｝と、スペクトル量子化手段５２９からの量子化誤差ｋ３を合成スペクトル包絡で除算し量子化した符号（ｋ３／ｈ−ｋ４）' である。
【０１６２】
次にオーディオ信号復号化装置６００ｂの動作について説明する。
スペクトル帯域１逆量子化手段６１１では、スペクトル帯域１量子化手段５３０からの出力（ｈ１１）' を逆量子化し、復元したＬＰＣ係数ｈ１１をスペクトル包絡１合成手段６１４へ出力する。またスペクトル帯域２逆量子化手段６１２では、スペクトル帯域２量子化手段５３１からの出力（ｈ２１）' を逆量子化し、復元したＬＰＣ係数ｈ２１をスペクトル包絡２合成手段６１５へ出力する。同様に、スペクトル帯域Ｎ逆量子化手段６１３では、スペクトル帯域Ｎ量子化手段５３２からの出力（ｈｎ１）' を逆量子化し、復元したＬＰＣ係数ｈｎ１をスペクトル包絡Ｎ合成手段６１６へ出力する。
【０１６３】
スペクトル包絡１合成手段６１４は、スペクトル帯域１逆量子化手段６１１の出力であるＬＰＣ係数ｈ１１を用いて１番低域のスペクトル包絡ｈ１２を合成し、スペクトル重畳手段６１７へ出力する。またスペクトル包絡２合成手段６１５は、スペクトル帯域２逆量子化手段６１２の出力であるＬＰＣ係数ｈ２１を用いて低域から２番目のスペクトル包絡ｈ２２を合成し、スペクトル重畳手段６１７へ出力する。同様にスペクトル包絡Ｎ合成手段６１６は、スペクトル帯域Ｎ逆量子化手段６１３の出力であるＬＰＣ係数ｈｎ１を用いて低域からＮ番目のスペクトル包絡ｈｎ２を合成し、スペクトル重畳手段６１７へ出力する。
【０１６４】
スペクトル重畳手段６１７では、入力された低域から高域までの各スペクトル包絡（ｈ１２〜ｈｎ２）を、低域から周波数特性の順に重畳して、全帯域の合成スペクトル包絡ｈを作成し、スペクトル生成手段６１９へ出力する。
一方、スペクトル逆量子化手段６１８は、スペクトル量子化手段５２９からの出力（ｋ３／ｈ−ｋ４）' を逆量子化し、復元したスペクトル情報（ｋ３／ｈ−ｋ４）をスペクトル生成手段６１９へ出力する。
【０１６５】
スペクトル生成手段６１９では、スペクトル重畳手段６１７からの出力ｈと、スペクトル逆量子化手段６１８からの出力（ｋ３／ｈ−ｋ４）とを乗算し、復元した量子化誤差ｋ３' をスペクトル合成器６２０へ出力する。
スペクトル合成器６２０では、スペクトル生成手段６１０からの復元した周波数スペクトル情報（ｅ−ｋ３）と、スペクトル生成手段６１９からの復元した量子化誤差ｋ３' とを合成して、オーディオ信号の周波数スペクトル情報ｅ' を復元する。
さらに、上記復元された周波数スペクトル情報ｅ' （ＭＤＣＴ係数）に、逆ＭＤＣＴ変換などの逆直交変換を行うと、時間軸上のオ−ディオ信号に復元される。
【０１６６】
このように本実施の形態４のオ−ディオ信号符号化装置５００では、１段目の符号化手段での量子化誤差を、２段目の符号化手段がさらに量子化する構成であり、しかも情報量としては非常に少ない線形予測係数を用いて量子化誤差の量子化を行うので、符号化手段の段数をたくさん設けても、計算量はほとんど増やすことなく量子化の効率をさらに向上させることができる。また、これにより本実施の形態４のオ−ディオ信号復号化装置６００では、量子化誤差を差し引いて生成された周波数スペクトルと、量子化誤差の量子化によって生成された周波数スペクトルとを合成して、量子化誤差を加味したオ−ディオ信号の周波数スペクトルを復元することができるので、高音質な音楽サ−ビスを提供することができるという効果を有する。
【０１６７】
尚、本実施の形態４では、２段の符号化手段を用いる場合について説明したが、段の数は３段以上でも同様に構成できる。したがって、符号化に必要な情報量に応じて符号化手段の段数を設定することで、情報量に見合った音質を提供することができる。つまり、符号化の情報量であるビットレートが高くても許容できる環境では、段数を増やして、音質を上げることができ、ビットレートが低くしかとれない環境では、音質は段数の多い場合よりも悪いが、少ない段数でビットレートを低くして符号化することができる。
【０１６８】
また、オ−ディオ信号符号化装置５００では、入力された周波数スペクトルの特徴に基づいて、分割する周波数帯域の数を決定する構成であるので、広帯域な音声信号であっても、または狭帯域な音声信号であっても、または低ビットレ−トな音声信号であっても、より細やかな周波数情報を抽出し、全帯域に渡って細やかなスペクトル包絡を求めることが可能となり、量子化の精度を向上させ、少ない情報量から高音質な音楽サ−ビスを提供することができる。
【０１６９】
また、オ−ディオ信号符号化装置５００では、情報量としては非常に少ない線形予測係数を用いて、分割した各周波数帯域毎にスペクトル包絡の合成を行っているので、分割を行わずに全帯域のスペクトル包絡を合成する場合と計算量はほとんど増やすことなく、分割を行わない場合よりも細やかな全帯域の合成スペクトル包絡を求めることができる。
【０１７０】
また、入力された周波数スペクトルの量子化には、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算した値を用いて量子化するので、情報量が大幅に削減され、符号化装置５００から出力される符号化信号は、少ない符号列で表現することができ、効率的に符号化を行うことができる。そして、復号化装置６００では、入力された周波数スペクトルを、全帯域の合成スペクトル包絡で除算し逆量子化した値に、逆量子化した全帯域の合成スペクトル包絡を乗算し音声信号の生成を行っているので、符号列を少なくした符号化信号から、効率的に高音質な音声信号を生成することができる。
【０１７１】
【発明の効果】
請求項１に記載のオーディオ信号符号化装置によれば、入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、前記スペクトル分割手段は、前記入力された周波数スペクトル情報から抽出した聴覚的なエントロピーに基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするものとしたので、入力された周波数スペクトル情報の特徴に応じて、周波数スペクトル情報の分割方法を決定し、分割した各周波数帯域毎にスペクトル概形を推定するので、全帯域に渡って細やかなスペクトル包絡を合成することができ、量子化効率を向上させることができるという効果を有する。
【０１７７】
また、請求項２に記載のオーディオ信号符号化装置によれば、入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、前記スペクトル分割手段は、前記入力された周波数スペクトル情報から判定した音声非音声の判定結果に基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするものとしたので、入力された周波数スペクトル情報の特徴に応じて、周波数スペクトル情報の分割方法を決定し、分割した各周波数帯域毎にスペクトル概形を推定するので、全帯域に渡って細やかなスペクトル包絡を合成することができ、量子化効率を向上させることができるという効果を有する。
また、請求項３に記載の発明に係るオーディオ信号符号化装置によれば、請求項１または請求項２に記載のオーディオ信号符号化装置において、前記スペクトル分割手段と、前記スペクトル推定手段、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル帯域量子化手段、及び前記スペクトル量子化手段を有する符号化手段を２段以上設け、前段の符号化手段の量子化による量子化誤差を、後段の符号化手段が量子化する構成であることを特徴とするものとしたので、符号化に必要な情報量に応じて符号化手段の段数を設けることにより、量子化効率を向上させることができ、しかも情報量としては非常に少ない線形予測係数を用いて量子化誤差の量子化を行うので、符号化手段の段数をたくさん設けても、計算量はほとんど増やすことなく、入力されたオ−ディオ信号の情報量に応じて高音質な音楽サ−ビスを提供することができるという効果を有する。
【０１７９】
また、請求項４に記載のオーディオ信号復号化装置によれば、入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、前記複数の周波数帯域は、周波数スペクトル情報から抽出された聴覚的なエントロピーに基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするものとしたので、合成されるスペクトル包絡は細やかなものとなり、高音質なオーディオ信号を生成することができるという効果を有する。
【０１８５】
また、請求項５に記載の発明に係るオーディオ信号復号化装置によれば、入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、前記複数の周波数帯域は、周波数スペクトル情報から判定された音声非音声の判定結果に基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするものとしたので、合成されるスペクトル包絡は細やかなものとなり、高音質なオーディオ信号を生成することができるという効果を有する。
また、請求項６に記載の発明に係るオーディオ信号復号化装置によれば、請求項４または請求項５に記載のオーディオ信号復号化装置において、前記スペクトル帯域逆量子化手段と、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル逆量子化手段、及び前記スペクトル生成手段を有する復号化手段を２段以上設け、また、複数の周波数スペクトル情報を、１つのオーディオ信号の周波数スペクトル情報に合成するスペクトル合成器を備えたことを特徴とするものとしたので、量子化誤差を差し引いて復元された周波数スペクトル情報と、復元された量子化誤差を合成し、量子化誤差を加味したオ−ディオ信号の周波数スペクトル情報を復元することができ、高音質な音楽サ−ビスを提供することができるという効果を有する。
【図面の簡単な説明】
【図１】本発明の実施の形態１および２におけるオーディオ信号符号化装置と復号化装置の構成を示す図である。
【図２】本発明の実施の形態１における周波数スペクトルを示す図である。
【図３】本発明の実施の形態３におけるオーディオ信号符号化装置と復号化装置の構成を示す図である。
【図４】本発明の実施の形態３における周波数スペクトル示す図であり、特に周波数スペクトルを３つの周波数帯域に分割した場合の例である。
【図５】本発明の実施の形態４におけるオーディオ信号符号化装置と復号化装置の構成を示す図である。
【図６】従来のオーディオ信号符号化装置の構成を示す図である。
【符号の説明】
１００オ−ディオ信号符号化装置
１０１スペクトル分割手段
１０２スペクトル１推定手段
１０３スペクトル２推定手段
１０４スペクトル包絡１合成手段
１０５スペクトル包絡２合成手段
１０６スペクトル重畳手段
１０７スペクトル量子化手段
１０８スペクトル帯域１量子化手段
１０９スペクトル帯域２量子化手段
２００オ−ディオ信号復号化装置
２０２スペクトル帯域１逆量子化手段
２０３スペクトル帯域２逆量子化手段
２０４スペクトル包絡１合成手段
２０５スペクトル包絡２合成手段
２０６スペクトル重畳手段
２０７スペクトル逆量子化手段
２０８スペクトル生成手段
３００オ−ディオ信号符号化装置
３０１スペクトル分割手段
３０２スペクトル１推定手段
３０３スペクトル２推定手段
３０４スペクトルＮ推定手段
３０５スペクトル包絡１合成手段
３０６スペクトル包絡２合成手段
３０７スペクトル包絡Ｎ合成手段
３０８スペクトル重畳手段
３０９スペクトル量子化手段
３１０スペクトル帯域１量子化手段
３１１スペクトル帯域２量子化手段
３１２スペクトル帯域Ｎ量子化手段
４００オ−ディオ信号復号化装置
４０２スペクトル帯域１逆量子化手段
４０３スペクトル帯域２逆量子化手段
４０４スペクトル帯域Ｎ逆量子化手段
４０５スペクトル包絡１合成手段
４０６スペクトル包絡２合成手段
４０７スペクトル包絡Ｎ合成手段
４０８スペクトル重畳手段
４０９スペクトル逆量子化手段
４１０スペクトル生成手段
５００オ−ディオ信号符号化装置
５０１スペクトル分割手段
５０２スペクトル１推定手段
５０３スペクトル２推定手段
５０４スペクトルＮ推定手段
５０５スペクトル包絡１合成手段
５０６スペクトル包絡２合成手段
５０７スペクトル包絡Ｎ合成手段
５０８スペクトル重畳手段
５０９スペクトル量子化手段
５１０スペクトル帯域１量子化手段
５１１スペクトル帯域２量子化手段
５１２スペクトル帯域Ｎ量子化手段
５２１スペクトル分割手段
５２２スペクトル１推定手段
５２３スペクトル２推定手段
５２４スペクトルＮ推定手段
５２５スペクトル包絡１合成手段
５２６スペクトル包絡２合成手段
５２７スペクトル包絡Ｎ合成手段
５２８スペクトル重畳手段
５２９スペクトル量子化手段
５３０スペクトル帯域１量子化手段
５３１スペクトル帯域２量子化手段
５３２スペクトル帯域Ｎ量子化手段
６００オ−ディオ信号復号化装置
６０２スペクトル帯域１逆量子化手段
６０３スペクトル帯域２逆量子化手段
６０４スペクトル帯域Ｎ逆量子化手段
６０５スペクトル包絡１合成手段
６０６スペクトル包絡２合成手段
６０７スペクトル包絡Ｎ合成手段
６０８スペクトル重畳手段
６０９スペクトル逆量子化手段
６１０スペクトル生成手段
６１１スペクトル帯域１逆量子化手段
６１２スペクトル帯域２逆量子化手段
６１３スペクトル帯域Ｎ逆量子化手段
６１４スペクトル包絡１合成手段
６１５スペクトル包絡２合成手段
６１６スペクトル包絡Ｎ合成手段
６１７スペクトル重畳手段
６１８スペクトル逆量子化手段
６１９スペクトル生成手段
６２０スペクトル合成器
７００オ−ディオ信号符号化装置
７０１スペクトル推定手段
７０２量子化手段
７０３スペクトル合成手段
７０４スペクトル正規化手段
７０５スペクトル量子化手段

Claims

入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、
前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、
前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、
前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、
前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、
前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、
前記スペクトル分割手段は、前記入力された周波数スペクトル情報から抽出した聴覚的なエントロピーに基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするオーディオ信号符号化装置。
入力された周波数スペクトル情報を、２つ以上の周波数帯域に分割するスペクトル分割手段と、
前記分割された各周波数帯域の周波数スペクトル情報から、前記周波数帯域毎にスペクトル概形を推定し、複数のパラメタを算出する複数のスペクトル推定手段と、
前記複数のパラメタに基づいて、前記周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、
前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、
前記複数のパラメタの量子化を行う複数のスペクトル帯域量子化手段と、
前記入力された周波数スペクトル情報を、前記スペクトル重畳手段からの全帯域の合成スペクトル包絡で除算し、除算した値を量子化するスペクトル量子化手段とを備え、
前記スペクトル分割手段は、前記入力された周波数スペクトル情報から判定した音声非音声の判定結果に基づいて、周波数スペクトル情報の分割方法を決定するものであることを特徴とするオーディオ信号符号化装置。
請求項１または請求項２に記載のオーディオ信号符号化装置において、
前記スペクトル分割手段と、前記スペクトル推定手段、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル帯域量子化手段、及び前記スペクトル量子化手段を有する符号化手段を２段以上設け、
前段の符号化手段の量子化による量子化誤差を、後段の符号化手段が量子化する構成であることを特徴とするオーディオ信号符号化装置。
入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、
前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、
前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、
前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、
前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、
前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、
前記複数の周波数帯域は、周波数スペクトル情報から抽出された聴覚的なエントロピーに基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするオーディオ信号復号化装置。
入力された符号を復号化して周波数スペクトル情報を生成するオーディオ信号復号化装置であって、
前記符号を用いて逆量子化を行い、スペクトル情報を出力するスペクトル逆量子化手段と、
前記符号を用いて逆量子化を行い、複数のパラメタを出力する複数のスペクトル帯域逆量子化手段と、
前記複数のパラメタを用いて周波数帯域毎のスペクトル包絡を合成する複数のスペクトル包絡合成手段と、
前記複数の周波数帯域毎のスペクトル包絡を重畳して全帯域の合成スペクトル包絡を作成するスペクトル重畳手段と、
前記スペクトル情報と、前記複数のパラメタとを乗算して、オーディオ信号の周波数スペクトル情報の生成を行うスペクトル生成手段とを備え、
前記複数の周波数帯域は、周波数スペクトル情報から判定された音声非音声の判定結果に基づいて、周波数スペクトル情報を分割する方法により分割されたことを特徴とするオーディオ信号復号化装置。
請求項４または請求項５に記載のオーディオ信号復号化装置において、
前記スペクトル帯域逆量子化手段と、前記スペクトル包絡合成手段、前記スペクトル重畳手段、前記スペクトル逆量子化手段、及び前記スペクトル生成手段を有する復号化手段を２段以上設け、
また、複数の周波数スペクトル情報を、１つのオーディオ信号の周波数スペクトル情報に合成するスペクトル合成器を備えたことを特徴とするオーディオ信号復号化装置。