WO1998000837A1

WO1998000837A1 - Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio

Info

Publication number: WO1998000837A1
Application number: PCT/JP1997/002271
Authority: WO
Inventors: Takeshi Norimatsu; Shuji Miyasaka; Yoshihisa Nakato; Mineo Tsushima; Tomokazu Ishikawa
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1996-07-01
Filing date: 1997-07-01
Publication date: 1998-01-08
Also published as: KR100283547B1; ES2205238T3; EP0910067A4; EP0910067A1; US6826526B1; JPH1020898A; EP0910067B1; KR20000010994A; DE69724126T2; DE69724126D1; CN1222997A; CN1156822C; JP3246715B2

Description

明細謇オーディオ信号符号化方法，復号化方法、及びオーディオ信号符号化装置，復号化装置技術分野

本発明は音声信号や音楽信号などのオーディオ信号から得られる特徴量、特にオーディオ信号を直交変換等の手法を用いて、時間領域から周波数領域に変換した信号を用い、その変換した信号を源オーディオ信号と比較して、できるだけ少ない符号列で表現するために効率的に符号化する装 Sおよび方法と、符号化された信号である符号化列のすべて、あるいはその一部のみを用いて高い品質と広帯域なオーディオ信号を復号可能な構成の復号化装置及び方法に関するものである。背景技術

オーディオ信号を効率的に符号化、および復号化する様々な手法が提案されている。音楽信号など 2 0 k H z 以上の周波数帯域を有するォーディォ信号は特に近年、 M P E Gオーディオ方式などがある。 M P E G 方式に代表される符号化方式は、時間軸のディジタルオーディオ信号をコサイン変換などの直交変換を用いて周波数軸上のデータに変換し、その周波数軸上の情報を、人間の聴覚的な感度特性を利用して聴覚的に重要な情報から符号化していく方式であり、聴覚的に重要でない情報や冗長な情報は符号化しない方式である。源ディジタル信号の情報量に対して、かなり少ない情報量で表現しょうとする場合、ベクトル量子化の手法を用いた T C一 W V Qなどの符号化方式がある。 M P E Gオーディオ、および T C一 W V Qはそれぞれ ISO/IEC 標準 IS- 1 1 172- 3、および T.Mori a,H Suga:An 8 Kbits transform coder for noisy channels, Proc.ICASSP 89,ppl96-199 などに述べられている。ここで図 3 7 を用いて従来のオーディオ符号化装 Sの構成について説明する。図 3 7 において、 1 6 0 1 は入力信号を周波数変換する F F T部、 1 6 0 2は周波数変換された入力信号のうちの特定の帯域を符号化する適応ビット割り当て算出部、 1 6 0 3 は入力信号を複数の裕域に分割するサブパンド帯域分割部、 1 6 0 4 は複数に分割された帯域成分を正規化するスケールファクター正規化部、 1 6 0 5 はスカラー量子化部である。

次に動作について説明する。入力信号は、 F F T部 1 6 0 1 と、サブバンド帯域分割部 1 6 0 3 に入力される。 F F T部 1 6 0 1 では、入力信号を周波数変換して、適応ビット割り当て部 1 6 0 2へ入力される。適応ビット割り当て部 1 6 0 2 では、人間の聴覚特性に基づいて定義された最小可聴限と、マスキング特性をもとにある帯域成分に対してどれくらいの情報量を与えるべきかを算出し、その帯域ごとの情報量配分をインデックスに符号化する。

—方、サブバンド帯域分割部 1 6 0 3 では、入力信号を、例えば、 3

2 の帯域に分割し出力する。そしてスケールファクター正規化部 1 6 0 4 では、前記サブバンド帯域分割部 1 6 0 3 で分割されたおのおのの裕域成分に対して、ある代表値をもって正規化を行う。正規化の値はインデックスとして量子化される。スカラー量子化部 1 6 0 5では、前記適応ビット害' jり当て算出部 1 6 0 2で算出されたビット配分をもとに、スケールファクター正規化部 1 6 0 4の出力をスカラー量子化し、その量子化値をインデックスとして符号化する。

また、音響信号を効率的に符号化する様々な手法が提案されている。音楽信号など 2 0 k H z ほどの帯域を有する信号は、特に近年、 M P E Gオーディオ方式などを用いて符号化されることがあげられる。 M P E G方式に代表される方式は、時間軸のディジタルオーディオ信号を直交変換を用いて周波数軸に変換し、その周波数軸上の情報を、人間の聴党的な感度特性を考慮して、聴覚的に重要な情報から優先的に情報量を与えていく方式である。原ディジタル信号の情報量に対して、かなり少ない情報量で信号を表現しょうとする場合、 T C W V Q ( Transform Coding for Weighted Vector Quantization ) などのべクトノレ量子 {ヒの手法を用いた符号化方式がある。 M P E Gオーディオ、および T CWV Qはそれぞれ ISO/IEC 標準 IS-11172-3および T.Moriya,H.Suga:"An 8 Kbits transform coder for noisy channels, "Proc. I C ASS P'89,pp 196 - 199 などに述べられている。

従来のオーディオ信号符号化装置は以上のように構成されており、 M P E Gオーディオ方式は、 1 つのチャンネルあたり、 6 4 0 0 0 ビット /秒以上の情報量で符号化されて、使用される方法が一般で、それ以下の情報量では、再生可能な周波数帯域幅ゃ復号されたオーディオ信号の主観的な品質が著しく劣化する場合がある。図 3 7 に示した例のように、符号化された情報が、大別して、ビット配分，帯域代表値，量子化値の 3つからなり、高い圧縮率の場合、量子化値に十分に配分されないためである。また、従来のオーディオ倌号の符号化装置においては、符号化する情報量と復号化する情報量とを同じにして、符号化装置および復号化装置を構成する方法が一般である。たとえば、 1 秒間に 1 2 8 0 0 0 ビッ卜の情報量に符号化する方法では、その復号化装置では 1 2 8 0 0 0 ビットの情報量を復号化するように構成されている。

しかしながら、以上のようなことから従来のオーディオ信号符号化装置及び復号化装置では、良好な音質を得るためには固定された情報量で符号化及び復号化を行わなければならず、高い圧縮率にて高品質な音質を得ることはできなかった。

この発明は以上のような問題点を解消するためになされたもので、低い情報量で符号化、及び復号化しても、高い品質と広い再生周波数带域が得られ、また符号化及び復号化時の情報量を固定の値ではなくこれを可変とすることのできるオーディオ信号符号化装置および復号化装置，さらにオーディオ信号符号化 *復号化方法を提供することを目的とする。また、従来のオーディオ信号符号化装置では、コードブックが持つ各コードとオーディオ特徴べクトルとの聴党的な距離が最小となるコードに対応したコードインデックスを出力することにより量子化を行うようにしているが、コードブックが有するコードが多い場合、最適なコードを検索する際に計算量が非常に多くなり、また、コードブックのもつデ —タ量が多い場合は、ハードウエアで構成する際に多くの量のメモリが必要となり不経済であるという問題点があった。また、受信側においても、コードインデックスに対応するだけの検索、及びメモリ量を必要とするという問題点があった。

この発明は上記のような問題点に鑑みてなされたもので、コード検索数を削減し、コ一ド数の少ないコードブックで効率的にオーディオ信号を量子化することのできるオーディオ信号符号化装置、及び復号化することのできるオーディオ信号復号化装置を提供することを目的とする。発明の開示

この発明（請求項 1 ) にかかるオーディオ信号符号化方法は、入カオ —ディォ信号を周波数変換して得られた周波数特性信号系列をベクトル量子化する初段のべクトル *子化処理と，前段のべクトル量子化器での量子化誤差成分をべクトル量子化する 2段目以降のべクトル量子化処理と，を有する多段量子化手法を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、上記多段惫子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聴党的な性質である聴覚感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いて、べクトル量子化を行なうものである。また、この発明（請求項 2 ) にかかるオーディオ信号符号化方法は、入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する第 1 のべクトル量子化処理と，第 1 のべクトル量子化処理での量子化誤差成分をべクトル量子化する第 2のべクトル量子化処理と，を有する多段量子化手法を用いてベクトル量子化し、情報量の符号化をするオーディォ信号符号化方法であって、入力オーディオ信号のスぺクトルと人間の聴党的な性質である聴覚感度特性とに基づいて、上記第 1 のべクトル量子化処理での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数ブロックを選択し、上記第 2のべク卜ル量子化処理で、上記選択された周波数ブロックについて上記第 1 の量子化処理の量子化誤差成分の量子化を行なうものである。

またこの発明（請求項 3 ) にかかるオーディオ信号符号化方法は、入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する初段のべクトル量子化処理と，前段のべクトル量子化処理での量子化誤差成分をべクトル量子化する 2段目以降のべクトル量子化処理と，を有する多段量子化手法を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、上記多段量子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聴党的な性質である聴覚感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いてベクトル量子化を行ない、かつ、入カオ一ディォ信号のスペクトルと人間の聴觉的な性質である聴莧感度特性とに基づいて、上記初段のべクトル量子化処理での量子化誤差成分の周波数ブロックのうち量子化する重要度の高い周波数ブロックを選択し、上記 2段目のべクトル量子化処理で、上記選択された周波数ブロックについて上記初段の量子化処理の量子化誤差成分の量子化を行なうものである。また、この発明（請求項 4 ) にかかるオーディオ信号符号化装置は、入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、上記入力されたオーディオ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、上記時間周波数変換部で得られた周波数領域信号を上記スぺクトル包絡算出部で得られたスぺクトル包絡で正規化し残差信号を得る正規化部と、上記残差信号をパワーにより正規化するパワー正規化部と、上記入力されたオーディオ信号のスぺクトルと人間の聴覚的な性質である聴党感度特性とに基づき周波数上の重み付け係数を算出する聴覚重み付け計算部と、上記パワー正規化部により正規化された上記残差信号が入力される、縦列に接続された複数段のベクトル量子化部を有し、そのうちの少なくとも 1 つのべクトル量子化部が上記重み付け部で得られた重み付け係数を用いて量子化を行なう多段量子化部とを備えたものである。

また、この発明（請求項 5 ) にかかるオーディオ信号符号化装置は、上記請求項 4記載のオーディオ信号符号化装置において、上記多段量子化部の上記複数段のうちの複数の量子化部が上記重み付け部で得られた重み付け係数を用いて量子化を行なうものであり、かつ、上記聴覚重み付け計算部は、上記複数の量子化部のそれぞれが用いる個別の重み付け係数を算出するものである。

また、この発明（請求項 6 ) にかかるオーディオ信号符号化装 Sは、上記請求項 5記載のオーディオ信号符号化装置において、上記多段量子化部は、上記スぺクトル包絡算出部で得られたスぺクトル包絡を各周波数領域での重み付け係数として上記パワー正規化部で正規化された上記残差信号の量子化を行なう第 1段の量子化部と、上記スぺクトル包絡と上記第 1 段の量子化部の量子化誤差信号との相関に基づいて算出された重み付け係数を各周波数領域での重み付け係数として上記第 1段の量子化部の量子化誤差信号の量子化を行なう第 2段の量子化部と、上記聴党重み付け計算部において、時間周波数変換部で周波数領域信号に変換された入力信号と聴党特性とにより算出された重み付けを、上記スぺクトル包絡，上記第 2段の量子化部の量子化誤差信号，および上記パワー正規化部で正規化された上記残差信号に基づいて調整して求めた重み付け係数を、各周波数領域での重み付け係数として上記第 2段の量子化部の量子化誤差信号の量子化を行なう第 3段の量子化部とを備えたものである。

また、この発明（請求項 7 ) にかかるオーディオ信号符号化装置は、入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、上記入力されたオーディオ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、上記時間周波数変換部で得られた周波数領域信号を上記スぺクトル包絡算出部で得られたスぺクトル包絡で正規化し残差信号を得る正規化部と、上記残差信号をパワーにより正規化するパワー正規化部と、該パヮ一正規化部で正規化された残差信号の量子化を行なう第 1 のべクトル量子化器と、入力オーディオ信号のスぺクトルと人間の聴觉的な性質である聴梵感度特性とに基づき、上記第 1 のべクトル量子化器での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数プロックを選択する聴党的選択手段と、該聴覚的選択手段で選択された周波数プロックについて上記第 1 のべクトル量子化器の量子化誤差成分の量子化を行なう第 2の量子化器とを備えたものである。また、この発明（請求項 8 ) にかかるオーディオ信号符号化装 gは、上記請求項 7記載のオーディオ信号符号化装置において、上記聴覚的選択手段を、上記第 1 のべクトル量子化器の量子化誤差成分，上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものとしたものである。

また、この発明（請求項 9 ) にかかるオーディオ信号符号化装置は、上記請求項 7記載のオーディオ信号符号化装置において、上記聴覚的選択手段を、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数プロックを選択するものとしたものである。また、この発明（請求項 1 0 ) にかかるオーディオ信号符号化装置は、上記請求項 7記載のオーディオ信号符号化装置において、上記聴覚的選択手段を、上記第 1 のベクトル；！子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号と、最小可聴限特性と入力信号から計算されたマスキング特性とを加算した特性の逆特性とを乗箕した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものとしたものである。

また、この発明（請求項 1 1 ) にかかるオーディオ信号符号化装置は、上記請求項 7記載のオーディオ信号符号化装置において、上記聴覚的選択手段を、上記第 1 のべクトル量子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号と、最小可聴限特性と，入力信号から計算されたマスキング特性に上記パワー正規化部で正規化された残差信号，上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び上記第 1 段の量子化部の量子化誤差信号に基づいて補正をかけた特性と，を加算した特性の逆特性とを乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものとしたものである。

また、この発明（請求項 1 2 ) にかかるオーディオ信号符号化装置は、入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する第 1 のべクトル量子化器と，第 1 のべクトル量子化器での量子化誤差成分をべクトル量子化する第 2 のべクトル量子化器と，を有する多段量子化手段を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化装置であって、上記多段量子化手段は、上記周波数特性信号系列に対して、少なくとも 2つ以上の周波数带域に分割した帯域に相当する係数列に分けたものとするとともに、上記べクトル量子化器をそれぞれの係数列に対応して準備された複数の分割化べクトル量子化器によって独立に量子化するものである。

また、この発明（請求項 1 3 ) にかかるオーディオ信号符号化装置は、上記請求項 1 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列を正規化する正規化手段を備えたものである。

また、この発明（請求項 1 4 ) にかかるオーディオ信号符号化装置は、上記請求項 1 2記载のオーディオ信号符号化装置において、上記量子化手段を、量子化する周波数特性信号系列の周波数帯域を、量子化誤差のエネルギー加算和の大きい帯域を適宜選択して量子化するようにしたものである。

また、この発明（請求項 1 5 ) にかかるオーディオ信号符号化装置は、上記請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段を、量子化する周波数特性信号系列の周波数帯域を、人間の聴党的な性質である聴 ¾感度特性に基づいて、その重要度の高い帯域に大きな値を重み付けた量子化誤差エネルギー加算和の大きな帯域を適宜選択して量子化を行うものとしたものである。

また、この発明（請求項 1 6 ) にかかるオーディオ信号符号化装置は、上記請求項 1 2記載のオーディオ信号符号化装 Sにおいて、上記量子化手段を、量子化する周波数特性信号系列の周波数帯域を、少なくとも 1 度はすべて量子化する全带域量子化部となるベクトル量子化器を有するものとしたものである。

また、この発明（請求項 1 7 ) にかかるオーディオ信号符号化装 gは、上記請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段を、前段のベタトル量子化器がコードブックを用いるべクトル量子化手法を用いてべクトル量子化における量子化誤差を算出し、該算出した量子化誤差に対して後段の量子化部がさらにべクトル量子化を行うよう構成したものである。

また、この発明（請求項 1 8 ) にかかるオーディオ信号符号化装置は、上記請求項 1 7記載のオーディオ信号符号化装 Sにおいて、上記べクトル量子化手法として、べクトルの符号が全てもしくはその一部が反転したコ一ドべクトルをコード検索時に用いるようにしたものである。

また、この発明（請求項 1 9 ) にかかるオーディオ信号符号化装置は、上記請求項 1 7記載のォ一ディォ信号符号化装置において、周波数特性信号系列を正規化する正規化手段を備え、べクトル量子化における最適なコードを検索する際に用いる距離の計算に、上記正規化手段により処理された入力信号の正規化成分を重みとして距離を計算して最小距雕を与えるコードを抽出するものとしたものである。

また、この発明（請求項 2 0 ) にかかるオーディオ信号符号化装置は上記請求項 1 9記載のオーディオ信号符号化装置において、上記正規化手段により処理された周波数特性信号系列の正規化成分と、人間の聴覚的な性質である聴 ¾感度特性を考慮した値の両者を重みとして距離を算出して、最小距離を与えるコードを抽出するものとしたものである。また、この発明（請求項 2 1 ) にかかるオーディオ信号符号化装置は、上記請求項 1 3記載のオーディオ信号符号化装置において、上記正規化手段を、周波数特性信号系列の概形を大まかに正規化する周波数概形正規化部を備えたものとしたものである。

また、この発明（請求項 2 2 ) にかかるオーディオ信号符号化装置は上記請求項 1 3記載のオーディオ信号符号化装置において、上記正規化手段を、周波数特性信号系列を複数の連続した単位带域の成分に分け、それぞれの単位帯域を 1 つの値で除算することにより正規化する帯域振幅規化部を備えたものとしたものである。

また、この発明（請求項 2 3 ) にかかるオーディオ信号符号化装置は、上記請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段を、周波数特性信号系列をそれぞれの係数列を分割化べクトル量子化器によって独立に量子化するべクトル量子化器を有するとともに、量子化する入力信号の周波数帯域を、少なくとも 1 度はすべて量子化する全帯域量子化部となるべクトル量子化器とを備えたものとしたものである。

また、この発明（請求項 2 4 ) にかかるオーディオ信号符号化装置は、上記請求項 2 3記載のオーディオ信号符号化装置において、上記量子化手段を、低域の分割化べクトル量子化器と、中域の分割化べクトル量子化器と、高域の分割化べクトル量子化器とからなる第 1 のべクトル！:子化器と、これの後段に接続される第 2の量子化器と、該第 2のべクトル量子化器の後段に接続される第 3 のべクトル量子化器とを備え、該量子化手段に入力された周波数特性信号系列を 3つの帯域に分割し、該 3つの带域のうちの低い蒂域成分の周波数特性信号系列を上記低域の分割化ベクトル量子化器で量子化し、 3つの帯域のうちの中間の帯域成分の周波数特性信号系列を上記中域の分割化べクトル量子化器で量子化し、 3 つの帯域のうちの高い帯域成分の周波数特性信号系列を上記高域の分割化べクトル S子化器でそれぞれ独立に量子化を行い、上記第 1 のべクトル量子化器を構成するそれぞれの分割化ベクトル量子化器で周波数特性信号系列に対する量子化誤差を算出して、これを後段の上記第 2のべクトル量子化器への入力とし、上記第 2のベクトル量子化器では、該第 2 のべクトル量子化器の量子化する帯域幅分の量子化を行い、該第 2 のべクトル量子化器への入力に対する童子化誤差を算出してこれを上記第 3 のべクトル ft子化器への入力とし、上記第 3のべクトル量子化器では、該第 3のべクトル量子化器の量子化する帯域幅の量子化を行うようにしたものである。

また、この発明（請求項 2 5 ) にかかるオーディオ信号符号化装置は、上記請求項 2 4記載のオーディオ信号符号化装置において、上記量子化手段を構成する第 1 のべクトル量子化器と第 2のべクトル量子化器との間に第 1 の量子化帯域選択部を設けるとともに、上記第 2 のべクトル量子化器と上記第 3のベクトル量子化器との間に第 2の量子化帯域選択部を設け、上記第 1 のべクトル量子化器の出力を上記第 1 の量子化帯域選択部への入力とし、該第 1 の量子化帯域選択部で上記第 2 のべクトル量子化器が量子化すべき帯域を選択し、上記第 2 のベクトル量子化器では、上記第 1 の量子化帯域選択部が決定した上記第 1 の 3 つのべクトル量子化器の量子化誤差に対して、上記第 2のべクトル量子化器の量子化する帯域幅分の！:子化を行い、上記第 2のべクトル量子化器への入力に対する量子化誤差を算出してこれを上記第 2 の量子化帯域選択部への入力とし、上記第 2の量子化帯域選択部では、上記第 3 のべクトル量子化器が量子化すべき帯域を選択し、上記第 3 のべクトル量子化器では、上記第 2 の量子化带域選択部が決定した帯域に対して量子化を行うようにしたものである。

また、この発明（請求項 2 6 ) にかかるオーディオ信号符号化装置は、上記請求項 2 4記載のオーディオ信号符号化装置において、上記第 1 のべクトル量子化器に代えて、上記低域の分割化べクトル量子化器と、中域の分割化べクトル量子化器と、高域の分割化べクトル量子化器を用いて上記第 2 のべクトル量子化器、または第 3 のべクトル量子化器を構成するようにしたものである。

また、この発明（請求項 2 7 ) にかかるオーディオ信号復号化装置は、上記請求項 1 2記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元の入力オーディオ信号に相当する信号を出力するオーディオ信号復号化装 Sであって、上記オーディオ信号符号化装 Sの量子化手段が出力した符号の少なくとも一部を用いて逆量子化を行う逆量子化部と、該逆量子化部の出力である周波数特性信 /00837

13

号系列を用いて、周波数特性信号系列を元のオーディオ入力信号に相当する信号に変換する逆周波数変換部とを備えたものである。

また、この発明（請求項 2 8 ) にかかるオーディオ信号復号化装置は、上記請求項 1 3記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元の入力オーディオ信号に相当する信号を出力するオーディオ信号復号化装置であって、周波数特性信号系列を再生する逆量子化部と、該逆量子化部の出力である周波数特性信号系列を用いて、上記オーディオ信号符号化装置の出力である符号をもとに正規化成分を再生し、上記周波数特性信号系列と正規化成分とを乗算して出力する逆正規化部と、該逆正規化部の出力を受けて、周波数特性信号系列を元のオーディオ信号に相当する信号に変換する逆周波数変換部とを備えたものである。

また、この発明（請求項 2 9 ) にかかるオーディオ信号復号化装置は、上記請求項 2 3記載のオーディオ信号符号化装 Sからの出力である符号をその入力として、これを復号化して元のオーディオ信号に相当する信号を出力するオーディオ信号復号化装置であって、上記オーディオ信号符号化装置における量子化手段を構成するベクトル量子化器のすべて、もしくは一部が符号を出力した場合であっても、出力された符号を用いて逆量子化を行う逆量子化部を備えたものである。

また、この発明（請求項 3 0 ) にかかるオーディオ信号復号化装 Sは、上記請求項 2 9記載のオーディオ信号復号化装置において、上記逆量子化部を、所定の寄域の量子化符号の逆量子化に対して、次段の量子化符号の逆量子化と上記所定の带域とは異なる帯域の量子化符号の逆量子化とを交互に実行するものであり、上記逆量子化時に次段の量子化符号が存在しない場合には、上記異なる帯域の量子化符号の逆量子化を続けて実行し、上記異なる帯域の量子化符号が存在しない場合には上記次段の量子化符号の逆量子化を続けて実行するものとしたものである。また、この発明（請求項 3 1 ) にかかるオーディオ信号復号化装置は、上記請求項 2 4記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元のオーディオ信号に相当する信号を出力するオーディオ信号復号化装置であって、上記オーディオ信号符号化装置における第 1 のべクトル量子化器を構成する 3つの分割化べクトル量子化器からすべて、もしくは一部が符号を出力した場合であつても、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号のみを用いて逆量子化を行う逆量子化部を備えたものである。

また、この発明（請求項 3 2 ) にかかるオーディオ信号復号化装 Sは、上記請求項 3 1記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号に加えて、上記第 2 のべク卜ル量子化器からの符号を用いて逆量子化を行うようにしたものである。

また、この発明（請求項 3 3 ) にかかるオーディオ信号復号化装匱は、上記請求項 3 2記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化部を構成する低域の分割化べクトル量子化器からの符号と、上記第 2 のべクトル量子化器からの符号に加えて、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号を用いて逆量子化を行うようにしたものである。

また、この発明（請求項 3 4 ) にかかるオーディオ信号復号化装置は、上記請求項 3 3記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号と、上記第 2のべクトル量子化器からの符号と、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号とに加えて、上記第 3 のべクトル量子化器からの符号を用いて逆量子化を行うようにしたものである。 O 98/ 37 P

15

また、この発明（請求項 3 5 ) にかかるオーディオ信号復号化装置は、上記請求項 3 4記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号と、上記第 2のベクトル量子化器からの符号と、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号と、上記第 3のべクトル量子化器からの符号に加えて、上記第 1 のべクトル量子化器を構成する高域の分割化べクトル量子化器からの符号とを用いて逆量子化を行うようにしたものである。

また、この発明（請求項 3 9 ) にかかるオーディオ信号符号化装 fiは、入力オーディオ信号を周波数変換して得られた周波数特性信号系列を入力信号とし、該周波数特性信号系列のうちの所定の周波数帯域に属するものの位相情報を抽出する位相情報抽出部と、上記周波数特性信号系列の代表値であるオーディオコードを、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコ一ドブックと、上記周波数特性信号系列と上記コードブック中の各オーディォコードとの聴覚的な距離を算出して、その最小距離を有するオーディォコードを選出するとともに、該最小距離を有するオーディオコ一ドに対する位相情報を上記位相情報抽出部からの出力を補助情報として用いて付加し、該最小距離を有するオーディオコ一ドに対応するコ一ドインデックスをその出力信号として出力するオーディオコ一ド選択部とを備えたものである。

またこの発明（請求項 4 0 ) にかかるオーディオ信号符号化装置は上記請求項 3 9記載のオーディオ信号符号化装置において、上記位相情報抽出部を、入力された周波数特性信号系列のうちの低周波帯域側のもから所定個数の要素の位相情報を抽出するものとしたものである。

また、この発明（請求項 4 1 ) によるオーディオ信号符号化装置は上記請求項 3 9記載のオーディオ信号符号化装置において、人間の聴莧心理特性を考慮した各周波数における相対的な聴覚心理量のテーブルである聴覚心理重みべクトルテーブルを備え、上記位相情報抽出部は、入力された周波数特性信号系列のうち、上記聴覚心理重みべクトルテーブルに格納されたベクトルと一致する要素の位相情報を抽出するようにしたものである。

また、この発明（請求項 4 2 ) にかかるオーディオ信号符号化装置は、上記請求項 3 9記載のオーディオ信号符号化装置において、上記周波数特性信号系列を平滑べクトルを用いてべクトル要素同士の除算により平滑化する平滑化部を備え、上記オーディオコード選択部は、上記最小距離を有するオーディオコードを選出し、該選出されたオーディオコードに位相情報を付加する前に、上記平滑化部から出力される平滑化処理情報を用いて、上記選出されたオーディオコードを、平滑化処理のなされていないオーディオコードに変換し、該オーディオコードに対応するコ ― ドインデックスをその出力信号として出力するようにしたものである, また、この発明（請求項 4 3 ) にかかるオーディオ信号符号化装 Sは、上記請求項 3 9記載のオーディオ信号符号化装置において、人間の聴覚心理特性を考慮した各周波数における相対的な聴宽心理量のテーブルである聴覚心理重みべクトルテーブルと、上記周波数特性信号系列を平滑べクトルを用いて、べクトル要素同士の除算により平滑化する平滑化部と、上記聴党心理重みべクトルテ一ブルの値と上記平滑べクトルテープルの値とを乗じて得られる値を聴覚的重要度の高い順に複数個選出してこれを上記オーディオコ一ド選択部に出力するソ一ト部とを備えたものである。

また、この発明（請求項 4 4 ) にかかるオーディオ信号符号化装置は上記請求項 4 0記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするべクトルを用いるようにしたものである。また、この発明（請求項 4 5 ) にかかるオーディオ信号符号化装置は上記請求項 4 1記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするべクトノレを用レ、るようにしたものである。

また、この発明（請求項 4 6 ) にかかるオーディオ信号符号化装置は上記請求項 4 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするべクトルを用いるようにしたものである。

また、この発明（請求項 4 7 ) にかかるオーディォ信号符号化装は、上記請求項 4 0記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を M D C T変換（変形離散コサイン変換）した係数を要素とするべクトルを用いるようにしたものである。

また、この発明（請求項 4 8 ) にかかるオーディオ信号符号化装 aは、上記請求項 4 1記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を M D C T変換（変形離散コサイン変換）した係数を要素とするベタトルを用いるようにしたものである。

また、この発明（請求項 4 9 ) にかかるオーディオ信号符号化装置は、上記請求項 4 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を M D C T変換（変形離散コサイン変換）した係数を要素とするべクトルを用いるようにしたものである。

また、この発明（請求項 5 0 ) にかかるオーディオ信号符号化装置は、上記請求項 4 2記載のオーディオ信号符号化装置において、上記平滑べクトルとして、オーディオ信号を線形予測して線形予測係数を算出し、該算出された前記線形予測係数から各周波数における相対的な周波数応答を算出し、該各周波数における相対的な周波数応答を要素とするべクトルを用いるようにしたものである。

また、この発明（請求項 5 1 ) にかかるオーディオ信号符号化装は、上記請求項 4 3記載のオーディオ信号符号化装置において、上記平滑べクトルとして、オーディオ信号を線形予測して線形予測係数を算出し、該算出された前記線形予測係数から各周波数における相対的な周波数応答を算出し、該各周波数における相対的な周波数応答を要素とするべクトルを用いるようにしたものである。

また、この発明（請求項 5 2 ) にかかるオーディオ信号復号化装 aは、オーディオ信号の特徴量である周波数特性信号系列を量子化して得られたコ一ドインデックスを入力信号とし、該コードインデックスのうちの所定の周波数帯域に相当する要素の位相情報を抽出する位相情報抽出部と、上記コードインデックスに対応する周波数特性信号系列を、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコードブックと、上記コードインデックスと上記コ ― ドブック中の周波数特性信号系列との聴党的な距離を算出して、その最小距離を有する周波数特性信号系列を選出するとともに、該最小距離を有する周波数特性信号系列に対する位相情報を上記位相情報抽出部からの出力を補助情報として用いて付加し、上記入力信号であるコ一ドィンデッタスに対応する周波数特性信号系列をその出力信号として出力するオーディオコード選択部とを備えたものである。図面の簡単な説明

第 1 図は本発明の実施形態 1 によるオーディォ信号符号化装置及び復号化装置の全体の構成を示す図である。

第 2図は上記オーディオ信号符号化装置を構成する正規化部の一例を示す構成図である。第 3図は上記オーディオ信号符号化装置を構成する周波数概形正規化部の一例を示す構成図である。

第 4図は符号化装置における量子化部の詳細な構成を示す Eである。第 5図は本発明の実施の形態 2によるオーディオ信号符号化装置の構成を示すブロック図である。

第 6図は本発明の実施の形態 3 によるオーディオ信号符号化装置の構成を示すブロック図である。

第 7図は第 6 図に示すオーディオ信号符号化装置の各段の量子化部，及び聴覚的選択部の詳細な構成を示すブロック図である。

第 8 図はべクトル量子化器での量子化の動作を説明するための図である。

第 9 図は誤差信号 zi、スベタトル包絡 11、及び最小可聴限特性 hi を示す図である

第 1 0 図は、第 6図に示すオーディオ信号符号化装置の各量子化部，及び聴覚的選択部の他の例の詳細な構成を示すブロック図である。

第 1 1 図は第 6 図に示すオーディオ信号符号化装置の各量子化部，及び聴覚的選択部のさらに他の例の詳細な構成を示すプロック図である。

第 12 図は第 6 図に示すオーディオ信号符号化装置の各量子化部，及び聴党的選択部のさらに他の例の詳細な構成を示すプロック図である。

第 13 図は重要度が最も高い周波数ブロック（長さ W ) を選択する一例を示す図である。

第 14 図は本発明の実施の形態 4 によるオーディオ信号符号化装 Sの構成を示すプロック図である。

第 15 図は本発明の実施の形態 5 によるオーディオ信号符号化装 aの構成を示すブロック図である。

第 16 図は本発明の実施の形態 6 によるオーディオ信号符号化装置の構成を示すプロック図である。第 17 図は本発明の実施の形態 7によるオーディオ信号符号化装置の構成を示すプロック図である。

第 18 図は本発明の実施の形態 8 によるオーディオ信号符号化装 Sの構成を示すブロック図である。

第 19 図は上記実施の形態 1 ないし 8 の上記符号化装置 1 における各量子化部の量子化方法の詳細な動作について説明するための図である。第 20 図は本発明の実施の形態 9によるオーディオ信号復号化装置について説明するための図である。

第 2 1 図は本発明の実施の形態 9によるオーディオ信号復号化装置について説明するための図である。

第 22 図は本発明の実施の形態 9によるオーディオ信号復号化装置について説明するための図である。

第 23 図は本発明の実施の形態 9によるオーディオ信号復号化装置について説明するための図である。

第 24 図は本発明の実施の形態 9 によるオーディオ信号復号化装 gについて説明するための図である。

第 25 図は本発明の実施の形態 9 によるオーディオ信号復号化装置について説明するための図である。

第 26 図はオーディオ信号復号化装置を構成する逆量子化部の詳細な動作を説明するための図である。

第 27 図はオーディオ信号復号化装置を構成する逆正規化部の詳細な構成を説明するための図である。

第 28 図はオーディオ信号復号化装置を構成する周波数概形逆正規化部の詳細な構成を説明するための図である。

第 29 図は本発明の実施の形態 1 0 におけるオーディオ信号符号化装置の構成を示す図である。

第 30 図は上記実施の形態 1 0におけるオーディオ信号符号化装置のオーディオ特徴ベクトルの構成を説明するための図である。

第 3 1 図は上記実施の形態 1 0 におけるオーディオ信号符号化装置の処理を説明するための図である。

第 3 2図は本発明の実施の形態 1 1 におけるオーディォ信号符号化装置の詳細な構成を示す図、及び聴覚心理重みべクトルテーブルの一例を示す図である。

第 3 3 図は本発明の実施の形態 1 2 におけるオーディオ信号符号化装置の詳細な構成を示す図、及び平滑化部における処理を説明するための図である。

第 3 4 図は本発明の実施の形態 1 3 におけるオーディオ信号符号化装置の詳細な構成を示す図である。

第 3 5 図は本発明の実施の形態 1 4 におけるオーディオ信号符号化装置の詳細な構成を示す図である。

第 3 6図は本発明の実施の形態 1 5 におけるオーディオ信号復号化装置の構成を示す図である。

第 3 7図は従来のオーディォ信号符号化装 fiの構成を示す図である。発明を実施するための最良の形態

実施の形態 1 .

図 1 は本発明の実施形態 1 によるオーディオ信号符号化装置及び復号化装置の全体の構成を示す図である。図 1 において、 1 は符号化装置であり、 2は復号化装置である。符号化装置 1 において、 1 0 1 は入力信号を所定の値のフレーム数となるように分割するフレーム分割部、 1 0 2 は時間軸上で、入力信号と窓関数とを乗じる窓掛け部、 1 0 3 は時間軸上の信号を周波数軸上の信号に時間周波数変換する変形雕散コサイン変換（Modified discrete cosine transform ) を行う M D C T部、 1 0 4はフレーム分割部 1 0 1 からの出力である時間軸の信号と、 M D C T 部 1 0 3 からの出力である M D C丁係数の両者を入力として M D C T係数を正規化する正規化部、 1 0 5 は正規化された MD C T係数を入力として S子化を行う量子化部である。なお、ここでは、時間周波数変換として M D C Tを用いた場合について説明するが、離散フーリエ変換（ D t F ： Discrete Fourier Transiorm) ·≥:用レ、てレ、。

復号化装置 2 において、 1 0 6 は符号化装置 1 から出力された信号を受けてこれを逆量子化する逆量子化部、 1 0 7 は逆量子化部 1 0 6 の出力を逆正規化する逆正規化部、 1 0 8 は逆正規化部 1 0 7 の出力を変形離散コサイン変換する逆 M D C T部、 1 0 9は窓掛け部、 1 1 0 はフレーム重ね合わせ部である。

以上のように構成されたオーディオ信号符号化装置および復号化装置の動作について述べる。

符号化装置 1 に入力される信号は、時間的に連続するディジタル信号系列であるとする。例えば、サンプリング周波数が 4 8 kHz で、 1 6 ビット量子化されたディジタル信号であるとする。この入力信号は、ある一定のサンプル数に達するまでフレーム分割部 1 0 1 で蓄積され、蓄積されたサンプル数が規定のフレーム長に達すると出力を行う。ここで、フレーム分割部 1 0 1 のフレーム長は、例えば、 1 2 8， 2 5 6 , 5 1 2 , 1 0 2 4 , 2 0 4 8 , 4 0 9 6 サンプルなどである。フレーム分割部 1 0 1 では、入力信号の特徴に応じてフレーム長を可変にして出力することも可能である。また、フレーム分割部 1 0 1 は、あるシフト長ごとに出力を行う構成のものであり、例えば、フレーム長を 4 0 9 6 サンプルとした場合において、フレーム長の半分のシフト長を設定すれば、フレーム長が 2 0 4 8サンプルに到達するに相当する時間ごとに最新の 4 0 9 6 サンプルを出力するなどの構成を持つ。当然ながらフレーム長やサンプリング周波数が変わっても、同様にシフト長をフレーム長の半分に設定した構成を持つことは可能である。そしてこのフレーム分割部 1 0 1 からの出力は、後段の窓掛け部 1 0 2 と正規化部 1 0 4へとそれぞれ入力される。窓掛け部 1 0 2 では、前記フレーム分割部 1 0 1 からの出力信号に対して、時間軸上で窓関数を乗じて、窓掛け部 1 0 2の出力とする。この様子は、例えば、式（ 1 ) で示される。 hxi = hi · XI i = 1,2,···，Ν

hi = sin . ( l )

、N ノ

ただし、ここで、 xiはフレーム分割部 1 0 1 からの出力で、 hiは窓関数 hxi は窓掛け部 1 0 2からの出力である。また、 i は時間のサフィックスである。なお、式（ 1 ) で示した窓関数 hiは一例であり、窓関数は必ずしも式（ 1 ) のものである必要はない。窓関数の選択は、窓掛け部 1 0 2 に入力される信号の特徴と、フレーム分割部 1 0 1 のフレーム長と、時間的に前後に位置するフレームにおける窓関数の形状に依存する。例えば、窓掛け部 1 0 2 に入力される信号の特徴として、フレーム分割部 1 0 1 のフレーム長を Nとした場合、 N/ 4 ごとに入力される信号の平均パワーを算出して、その平均パワーが非常に大きく変動する場合は、フレーム長を Nよりも短くして式（ 1 ) に示した演算を実行するなどの選択を行う。また、前の時刻のフレームの窓関数の形状と後ろのフレームの窓関数の形状に応じて、現在の時刻のフレームの窓関数の形状に歪みがないように適宜選出するのが望ましい。

次いで窓掛け部 1 0 2からの出力は、 MD C T部 1 0 3 に入力され、ここで変形雕散コサイン変換が施され、 MD C T係数が出力される。変形離散コサイン変換の一般式は式（ 2 ) で表される。 1 o ,2?r (k+1/2) (Π+Π₀)、

Yk hx_n， cos ( 2 )

V N ノ

n₀- N/4+1/2 (k-0,1，〜，N/2—1) このように M D C T部 1 0 3 の出カでぁる 1^ 0 ( 丁係数は、式（ 2 ) の ykで表せるとすると、 M D C丁部 1 0 3 の出力は周波数特性を示し、 yk の変数 k が 0 に近いほど低い周波数、 0から N/2- 1 に近いほど高い周波数成分に線形に対応する。正規化部 1 0 4 では、フレーム分割部 1 0 1 からの出力である時間軸の信号と、 M D C T部 1 0 3 からの出力である M D C T係数の両者を入力として、幾つかのパラメタを用いて、 M D C T係数を正規化する。ここで MD C T係数の正規化とは、低域成分と高域成分で非常に大きさに違いのある M D C T係数の大きさのばらつきを抑圧することを意味し、例えば、低域成分が、髙域成分に対して非常に大きい場合などは、低域成分では大きな値、高域成分では小さな値となるようなパラメタを選出し、これで除算することにより MD C T係数の大きさのばらつきを抑圧することをさす。また正規化部 1 0 4では、正規化に用いたパラメタを表現するインデックスを符号化する。

量子化部 1 0 5 では、正規化部 1 0 4 で正規化された MD C T係数を入力として、 M D C T係数の量子化を行う。そして量子化部 1 0 5は、量子化に用いたパラメタを表現するインデックスを符号化する。

一方、復号化装置 2では、符号化装置 1 の正規化部 1 0 4 からのインデックスと、量子化部 1 0 5 からのインデックスとを用いて復号を行う。逆量子化部 1 0 6 では、量子化部 1 0 5 からのインデックスを用いて、正規化された M D C T係数の再生を行う。逆量子化部 1 0 6 では、インデンクスのすべてを用いてもよいし、その一部分を用いて M D C T係数の再生を行ってもよい。当然ながら、正規化部 1 0 4からの出力と、逆量子化部 1 0 6の出力は、量子化部 1 0 5による量子化時に量子化誤差を伴うために量子化前の状態と必ずしも一致しない。

逆正規化部 1 0 7では、符号化装置 1 の正規化部 1 0 4からのインデックスから、符号化装置 1 で正規化に用いたパラメタの復元を行い、逆量子化部 1 0 6の出力と該パラメタとを乗算し、 MD C T係数の復元を行う。逆 MD C T部 1 0 8では、逆正規化部 1 0 7からの出力である M D C T係数から、逆 MD C Tを行い、周波数領域の信号から時間領域の信号への復元を行う。上記逆 MD C T計算は、例えば、式（ 3 ) で示される。

( 3 )

n₀ = N/4+1/2 ここで、 y y kは逆正規化部 1 0 7で復元された MD C T係数で、 x x ( k ) は逆 MD C T係数であり、これを逆 MD C T部 1 0 8の出力とする。

窓掛け部 1 0 9 では、逆 MD C T部 1 0 8 力らの出力 x x ( k ) を用いて窓掛けを行う。窓掛けは符号化装置 B 1 の窓掛け部 1 0 2で用いた窓を用い、たとえば、式（ 4 ) で示される処理を行う。

： (i) = xx (ί) · hi ( 4 ) ここで、 ziは窓掛け部 1 0 9の出力である。

フレーム重ね合わせ部 1 1 0では、窓掛け部 1 0 9からの出力を用いて、オーディオ信号を再生する。窓掛け部 1 0 9からの出力は時間的に重複した信号となっているので、フレーム重ね合わせ部 1 1 0では、例えば、式（ 5 ) を用いて復号化装置 B 2の出力信号とする。 out(i) = z_m(i)+z_m.₁(i+SHIFT) (₅) ここで、 zm(i) は m 時刻フレームの i番目の窓掛け部 1 0 9の出力信号 Z(i)で、 zm-l(i) は m-1 時刻フレームの i番目の窓掛け部 1 0 9の出力信号とし、 SHIFT は符号化装置のシフト長に相当するサンプル数、 out(i)はフレーム重ね合わせ部 1 1 0の m時刻フレームにおける復号化装置 2の出力信号とする。

次に図 2を用いて、上記正規化部 1 0 4の詳細な一例を説明する。図 2において、 2 0 1はフレーム分割部 1 0 1 と MD C T部 1 0 3の出力を受ける周波数概形正規化部、 2 0 2は上記周波数概形正規化部 2 0 1 の出力を受け、帯域テーブル 2 0 3を参照して正規化を行う带域振幅正規化部である。

次に動作について説明する。周波数概形正規化部 2 0 1 では、フレーム分割部 1 0 1からの時間軸上のデータ出力を用いて、大まかな周波数の概形である周波数概形を算出し、 MD C T部 1 0 3からの出力である MD C T係数を除算する。周波数概形を表現するのに用いたパラメタはインデックスとして符号化される。帯域振幅正規化部 2 0 2では、周波数概形正規化部 2 0 1 からの出力信号を入力として、帯域テーブル 2 0 3で示された帯域ごとに正規化を行う。例えば、周波数概形正規化部 2 0 1の出力である MD C T係数が、 dct(i)(i = 0〜 2047) とし、帯域テ一ブル 2 0 3が、例えば、表 1 に示されるようなものであるとすると、式 ( 6 ) などを用いて各帯域毎の振幅の平均値を算出する。 (表 1 )

( 6 )

bjlow }≤ bjhigh

ここで、 bjlow, bjhighは帯域テーブル 2 0 3 に示された j 番目の帯域における dct(i)が厲する最も低域のインデックス i と、最も高域のインデックス i をそれぞれ示している。また、 p は距離計算におけるノルムであり 2 などが望ましい。 avej は、各帯域番号 j における振幅の平均値である。带域振幅正規化部 2 0 2では、 avej を量子化して、 qavej を算出して、例えば、式（ 7 ) を用いて正規化する。 n dct(i) = dct(i) / gavei bjlow≤ i≤ bjhiah ( 7 avej の量子化はスカラーの量子化を用いてもよいし、コ一ドブックを用いてべクトル量子化を行ってもよい。帯域振幅正規化部 2 0 2 では、 qavej を表現するに用いたパラメタのインデックスを符号化する。

なお、符号化装 S 1における正規化部 1 0 4 の構成は、図 2 の周波数概形正規化部 2 0 1 と带域振幅正規化部 2 0 2の両者を用いた構成のものを示したが、周波数概形正規化部 2 0 1 のみを用いた構成でもよく、带域振幅正規化部 2 0 2のみを用いた構成でもよい。さらに、 MD C T 部 1 0 3から出力される MD C T係数の低域成分と高域成分で大きなばらつきがない場合は、両者を用いない構成で、 MD C T部 1 0 3の出力信号をそのまま量子化部 1 0 5 に入力する構成としてもよい。

次に図 3 を用いて、図 2の周波数概形正規化都 2 0 1 の詳細について説明する。図 3において、 3 0 1はフレーム分割部 1 0 1 の出力を受け、線形予測分析を行う線形予測分析部、 3 0 2は線形予測分析部 3 0 1で得られた係数を量子化する概形量子化部、 3 0 3は MD C T係数をスべクトル包絡により正規化する包絡特性正規化部である。

次に上記周波数概形正規化部 2 0 1 の動作について説明する。上記線形予測分析部 3 0 1では、フレーム分割部 1 0 1からの時間軸上のォーディォ信号を入力として、線形予測（ L P C： Linear Predictive Coding) 分析を行い、線形予測係数（L P C係数）を算出する。線形予測係数は、ハミング窓などの窓掛けされた信号の自己相関関数を算出し、正規方程式などを解くことで一般に算出可能である。算出された線形予測係数は、線スぺクトル対係数（ L S P係数）などに変換され、概形量子化部 3 0 2で量子化される。ここでの量子化手法としてはべクトル量子化を用いてもよいし、スカラー量子化を用いてもよい。そして概形量子化部 3 0 2で量子化されたパラメタが表現する周波数伝達特性（スベタトル包絡）を包絡特性正規化部 3 0 3で算出し、 1^10 (：丁部 1 0 3からの出カである MD C T係数をこれで除算することによって正規化する。具体的な算出例としては、概形量子化部 3 0 2で量子化されたパラメタと等価な線形予測係数を qlpc(i) とすれば、包絡特性正規化部 3 0 3で算出される上記周波数伝達特性は、式（ 8 ) で求めることができる。 qlpc(i) 0≤ i≤ ORDER

0 ORDER+1≤ iく N ( ⁸ ) env(i) = 1 / fft(li)

ここで ORDER は 1 0〜 4 0 くらいが望ましい。 fft( ) は高速フーリェ変換を意味する。算出された周波数伝達特性 env(i)を用いて包絡特性正規化都 3 0 3では、例えば、下記に示す式（ 9 ) を用いて正規化を行 fact(i) = mdct(i) I env(i) ( 9 ) ここで、 mdct(i) は M D C T部 1 0 3 からの出力信号で、 fdct(i) は正規化された包絡特性正規化部 3 0 3からの出力信号である。以上により、 MD C T係数列の正規化処理は終了する。

次に図 4 を用いて、符号化装置： I における量子化部 1 0 5 の詳細について説明する。 4 0 0 5 は正規化部 1 0 4で平坦化された周波数特性信号系列（ M D C T係数列）をべクトル量子化する多段量子化部である。多段量子化部 4 0 0 5は縦列接続された第 1 段の量子化器 4 0 0 5 1 , 第 2段の量子化器 4 0 0 5 2， ·■·, 第 N段の量子化器 4 0 0 5 3 を含む。

4 0 0 6 は MD C T部 1 0 3 から出力された MD C T係数と包絡特性正規化部 3 0 3 で求めたスぺクトル包絡を入力とし、聴觉感度特性に基づいて、多段量子化部 4 0 0 5での量子化の際に用いる重み付け係数を求める聴覚重み付け計算部である。

聴覚重み付け計算部 4 0 0 6 では、 MD C T部 1 0 3から出力された MD C T係数列と包絡特性正規化部 3 0 3 で求めた L P Cスぺクトル包絡が入力され、 MD C T部 1 0 3から出力された周波数特性信号系列のスぺクトルについて、最小可聴限特性や聴党マスキング特性等の人間の聴党的な性質である聴党感度特性に基づいて、この聴党感度特性を考慮した特性信号を算出し、さらにこの特性信号とスぺクトル包絡に基づいて量子化に用いる重み付け係数を求める。

正規化部 1 0 4 から出力された正規化 MD C T係数は、多段量子化部 4 0 0 5 の第 1段の量子化部 4 0 0 5 1 で聴党重み付け計算部 4 0 0 6 によって求められた重み付け係数を用いて量子化され、第 1 段の量子化部 4 0 0 5 1 での量子化による量子化誤差成分が、多段量子化部 4 0 0 5の第 2段の量子化部 4 0 0 5 2で聴覚重み付け計算部 4 0 0 6 によつて求められた重み付け係数を用いて量子化され、以下同様にして複数段の量子化部のそれぞれにおいて、前段の量子化部での量子化による量子化誤差成分の量子化が行なわれる。そして第 N— 1 段の量子化部での量子化による量子化誤差成分を第 N段の量子化部 4 0 0 5 3 で聴宽重み付け計算部 4 0 0 6 によって求められた重み付け係数を用いて量子化が行なわれることによりオーディオ信号の符号化が完了する。

このように、本実施の形態 1 によるオーディオ信号符号化装置によれば、多段量子化手段 4 0 0 5 の複数段のべクトル量子化部 4 0 0 5 1 ないし 4 0 0 5 3で、聴党重み付け計算部 4 0 0 6 において入力オーディォ信号のスペクトル，人間の聴党的な性質である聴覚感度特性，及び L P Cスぺクトル包絡に基づいて算出された周波数上の重み付け係数を量子化の際の重み付けとして用いてべクトル量子化を行なう構成としたので、人間の聴覚的な性質を利用して効率の良い量子化を行なうことがでさる。

なお、図 4 のオーディオ信号符号化装置では、聴覚重み付け計算部 4 0 0 6が重み付け係数の算出に L P Cスぺクトル包絡も用いる構成としているが、入力オーディオ信号のスぺクトルと人間の聴覚的な性質である聴莧感度特性のみを用いて重み付け係数を算出するようにしてもよい。また、図 4のオーディオ信号符号化装置では、多段量子化手段 4 0 0 5 の複数段のべクトル量子化部の全てが聴覚重み付け計算部 4 0 0 6 において求められた聴覚感度特性に基づく重み付け係数を用いて量子化するようにしているが、多段量子化手段 4 0 0 5の複数段のベタトル量子化器のいずれか 1 つが聴宽感度特性に基づく重み付け係数を用いて量子化を行なうものであれば、このような聴覚感度特性に基づく重み付け係数を用いない場合に比して、効率のよい量子化を行なうことができる。実施の形態 2 .

図 5 は本発明の実施の形態 2 によるオーディオ信号符号化装置の構成を示すブロック図である。本実施の形態では、符号化装置 1 における量子化部 1 0 5の構成のみが上記実施の形態と異なるものであるために、ここでは、量子化部の構成のみについて説明する。 5 0 0 6 1 は入カオ一ディォ信号のスぺクトル，人間の聴覚的な性質である聴党感度特性，及び L P C スぺクトル包絡に基づいて、多段量子化手段 4 0 0 5の第 1 段の量子化部 4 0 0 5 1 が用いる重み付け係数を求める第 1 の聴覚重み付け計算部、 5 0 0 6 2 は同じく入力オーディオ信号のスペクトル，人間の聴党的な性質である聴宽感度特性，及び L P C スぺクトル包絡に基づいて、多段量子化手段 4 0 0 5の第 2段の量子化部 4 0 0 5 2が用いる重み付け係数を求める第 2 の聴党重み付け計算部、 5 0 0 6 3 は同じく入力オーディオ信号のスぺクトル，人間の聴覚的な性質である聴覚感度特性，及び L P C スぺクトル包絡に基づいて、多段量子化手段 5 の第 N段の量子化部 4 0 0 5 3が用いる重み付け係数を求める第 3の聴覚重み付け計算部である。

上記実施の形態 1 によるオーディオ信号符号化装置では、多段量子化手段 4 0 0 5の複数段のべクトル量子化部の全てが聴覚重み付け計算部 4 0 0 6 において求められた同一の重み付け係数を用いて量子化するようにしているのに対し、本実施の形態 2 によるオーディオ信号符号化装置では、多段量子化手段 4 0 0 5の複数段のベクトル量子化部が、それぞれ第 1 ないし第 3の聴党重み付け計算部 5 0 0 6 1 , 5 0 0 6 2 , 5 0 0 6 3 で求められた個別の重み付け係数を用いて量子化する構成としている。このような本実施の形態 2によるオーディオ信号符号化装 Sでは、多段量子化手段 4 0 0 5の各段で量子化による誤差が最小となるように、聴覚重み付け部 5 0 0 6 1 ないし 5 0 0 6 3で求められた聴覚的な性質に基づいた周波数重み付け特性に従った重み付けによる量子化を行なうことができる。たとえば、第 1 の聴宽重み付け部 5 0 0 6 1 ではスぺクトル包絡を主体として重み付け係数を算出し、第 2の聴觉重み付け部 5 0 0 6 2では最小可聴限特性を主体として重み付け係数を算出し第 3の聴覚重み付け部 5 0 0 6 3 では聴覚マスキング特性を主体として重み付け係数を算出するものである。

このように、本実施の形態 2 によるオーディオ信号符号化装置によれば、多段量子化部 4 0 0 5 の上記複数段の量子化部の複数の量子化部 4 0 0 5 1 ないし 4 0 0 5 3 がそれぞれ聴覚重み付け計算部 5 0 0 6 1 ないし 5 0 0 6 3 で得られたそれぞれ個別の重み付け係数を用いて量子化を行なう構成としたので、人間の聴覚的な性質をより有効に利用して効率の良い量子化を行なうことができる。

実施の形態 3 .

図 6 は本発明の実施の形態 3 によるオーディオ信号符号化装置の構成を示すブロック図である。本実施の形態では、符号化装置 1 における量子化部 1 0 5の構成のみが上記実施の形態とことなるものであるために，ここでは、量子化部の構成のみについて説明する。 6 0 0 2 1 は正規化された M D C T信号をベクトル量子化する第 1 段の量子化部、 6 0 0 2 3 は第 1段の量子化部 6 0 0 2 1 における量子化による量子化誤差信号を量子化する第 2段の量子化部、 6 0 0 2 2 は第 1 段の量子化部 6 0 0 2 1 における量子化による量子化誤差のうち、第 2段の量子化部 6 0 0 2 3 で量子化すべき重要度の高い周波数帯域を聴党感度特性を考慮した基準により選択する聴覚的選択手段である。

次に動作について説明する。正規化された M D C T係数は、第 1 段の量子化部 6 0 0 2 1 でべクトル量子化される。聴党的選択手段 6 0 0 2 2では、ベタトル量子化での誤差信号が大きい周波数帯域を聴覚的な尺度に基づき判別し、そのブロックを抽出する。第 2段の量子化部 6 0 0 2 3では選択されたブロック部分の誤差信号に対してべクトル量子化を施す。そして各量子化部の結果がインデックスとして出力される。

図 7 は図 6 に示すオーディオ信号符号化装置の各段の量子化部，及び聴党的選択部の詳細な構成を示すプロック図である。図 7 において 7 0 0 3 1 は正規化された MD C T係数をべクトル量子化する第 1 のべクトル量子化器、 7 0 0 3 2は第 1 の量子化器 7 0 0 3 1 の量子化結果を逆量子化する逆量子化器であり、この逆量子化器 7 0 0 3 2 の出力と残差信号 s i の差分をとることにより第 1 の量子化器 7 0 0 3 1 による量子化の量子化誤差信号 z i が得られる。 7 0 0 3 3 は人間の聴党的な性質を示す聴覚感度特性 h i であり、ここでは最小可聴限特性を用いる。 7 0 0 3 5 は第 1 の量子化器 7 0 0 3 1 による量子化の量子化誤差信号 z i のうち、第 2のべクトル量子化器 7 0 0 3 6 で量子化すべき周波数帯域を選択する選択器である。 7 0 0 3 4 は、誤差信号 z i , L P Cスぺクトル包絡 1 i ，及び聴党感度特性 h i に基づいて選択器 7 0 0 3 5 の選択動作における選択尺度を計算する選択尺度計算部である。

次に、聴覚的選択部による選択動作について詳細に説明する。

第 1 のべクトル量子化器 7 0 0 3 1 では、まず N個の要素により構成される 1 フレーム内の残差信号を、図 8 (a) に示す，第 1 のべクトル量子化器 7 0 0 3 1 内のべクトル分割部で複数個のサブべクトルに分割し第 1 のべクトル量子化器 7 0 0 3 1 内の N個の量子化器 1 〜 Nでサブべクトルのそれぞれをべクトル量子化する。べクトル分割，及び量子化の方法は、例えば図 8 (b) に示すように、周波数の低い方から順に並んでいる N個の要素を N S個のサブブロックに等間隔に分割し、それぞれのサブブロックの第 1 要素のみを集めたサブべクトル、第 2要素を集めたサブべクトルというように NZ N S個の要素で構成される N S個のサブべクトルを作成し、それぞれのサブべクトル毎にベタトル量子化を実行する。分割数等は要求される符号化率に基づき決定される。

ベクトル量子化後、逆量子化器 7 0 0 3 2 により量子化コードを逆量子化して入力信号との差をとることにより、図 9 (a) に示すような、第 1 のべクトル量子化器 7 0 0 3 1 での誤差信号 z i を得る。次に、選択器 7 0 0 3 5 では誤差信号 Z i のうち第 2の量子化器 7 0 0 3 6 によりさらに精密に量子化すべき周波数ブロックを、選択尺度計算部 7 0 0 3 4で選択された結果に基づき選択する。

選択尺度計算部 7 0 0 3 4では、誤算信号 Z i， L P C分析部で得られた、図 9 (b) に示すような L P Cスぺクトル包絡 1 i , 及び聴覚感度特性 h i を用い、周波数軸上で N個の要素に分割されたフレームの各要素毎に、

g = ( z i * l i ) / h i

を計算する。

聴覚感度特性 h i としては、例えば図 9 (c) に示す最小可聴限界特性といわれるものを使う。これは実験的に求められた本来人間には聞こえない領域を表す特性である。従って、この聴凳感度特性 h i の逆数である 1 / h i は人間の聰党的な重要性を表すといえるものである。そして、誤差信号 z i , スペクトル包絡 1 i , 及び聴覚感度特性 h i の逆数を乗算した値 g はその周波数でのさらに精密に量子化する重要度を表すと言える。

また、図 1 0は図 6 に示すオーディオ信号符号化装置の各量子化部，及び聴覚的選択部の他の例の詳細な構成を示すプロック図である。図 1 0 において、図 7 と同一符号は同一または相当部分である。図 1 0 に示す例では、選択尺度（重要度） g を誤差信号 z i を使用せずに、スぺクトル包絡 1 i と聴覚感度特性 h i を用いて、

g = 1 i / h i

を計算して求める。

また、図 1 1 は図 6 に示すオーディオ信号符号化装置の各量子化部，及び聴覚的選択部のさらに他の例の詳細な構成を示すプロック図である。図 1 1 において、図 7 と同一符号は同一または相当部分であり、 1 1 0 0 4 2 は時間周波数変換部で MD C T変換された入力オーディオ周波数のスぺクトルから聴 ¾マスキング特性によりマスキングされる量を算出するマスキング量算出部である。

図 1 1 に示す例では、聴党感度特性 h i は以下のようにしてフレームごとに逐次求める。すなわち、入力信号の周波数スぺクトル分布からマスキング特性を算出し、そのマスキング特性に最小可聴限界特性を加えることにより、そのフレームの聴覚感度特性 h i を求めることができる。選択尺度計算部 7 0 0 3 4 の動作は図 1 0のものと同じである。

また、図 1 2 は図 6 に示すオーディオ信号符号化装置の各量子化部，及び聴党的選択部のさらに他の例の詳細な構成を示すブロック図である , 図において、図 7 と同一符号は同一または相当部分であり、 1 2 0 0 4 3 はマスキング量計算部 1 1 0 0 4 2 で得られたマスキング特性を、スベクトル包絡 1 i , 残差信号 s i , 及び誤差信号 z i を用いて補正するマスキング量補正部である。

図 1 2 に示す例では、聰¾感度特性 h i は以下のようにしてフレームごとに逐次求める。まず、入力信号の周波数スぺクトル分布からマスキング量計算部 1 1 0 0 4 2 でマスキング特性を算出する。次にマスキング量補正部 1 2 0 0 4 3 で、スペクトル包絡 1 i ，残差信号 s i , 及び誤差信号 z 〖に応じて、上記算出されたマスキング特性を補正する。この補正されたマスキング特性に最小可聴限界特性を加えることにより、そのフレームの聴党感度特性 h i を求めることができる。ここで、マスキング特性を補正する方法の一例を示す。

まず、すでに算出されているマスキング量 M i の特性が極大値を示す周波数（ f m) を求める。次にその周波数 f mの信号がどれほどの正確さで再生されるかを、入力時の周波数 i mのスぺクトルの強さと量子化誤差スぺクトルの大きさカら求める。例えば、

y = l - ( i mの量子化誤差のゲイン） / ( f mの入力時のゲイン）とする。この γの値が 1 に近ければ、すでに求めているマスキング特性を変形する必要はないが、 0に近ければ、小さくする方向で補正する。例えば、 hi -W ( 3 1 ) のように、マスキング特性を係数 γでべき乗することで変形することにより補正することができる。

次に、選択器 7 0 0 3 5の動作について説明する。

選択器 7 0 0 3 5ではフレーム内の連続した要素毎に窓（長さ Wとする）を掛け、その窓内での重要度 gの値を累積した値 Gが最大値を示す周波数ブロックを選択する。図 1 3は重要度が最も高い周波数ブロック (長さ W) を選択する一例を示す図である。窓の長さは ffi単のためには

NZN Sの整数倍に設定するのがよい（図 1 3では整数倍でないものを示している）。この窓を N/N S個ずつずらしながら、その窓枠內の重要度 gの累積値 Gを計算しその最大値を与える長さ Wの周波数ブロックを選択する。

選択された窓枠内のブロックに対して、第 2のべクトル量子化器 7 0 0 3 2でべクトル量子化が行われる。第 2のべクトル量子化器 7 0 0 3 2の動作は第 1 のべクトル量子化器 7 0 0 3 1 と同様であるが、上述のように誤差信号 z i のうち、選択器 7 0 0 3 5で選択された周波数プロックのみを量子化するものであるのでべクトル量子化されるフレーム内の要素の数は少ないものである。

最終的にはスぺクトル包絡係数のコード，各べクトル量子化器の量子化結果であるそれぞれのコード，及び図 7 , 図 1 1 , 及び図 1 2に示す構成で求めた選択尺度 gを使用する場合は、選択器 7 0 0 3 5で、どの要素から始まるブロックが選択されたかの情報がインデックスとして出力される。 —方、図 1 0 に示す構成で求めた選択尺度 g を使用する場合は、スぺクトル包絡 I i と聴党感度特性 h i のみを用いているので、逆量子化時に、どの要素から始まるブロックが選択されたかの情報はスぺクトル包絡係数のコードと既知の聴覚慼度特性 h i から求めることが可能であるので、ブロックの選択情報をインデックスとして出力する必要がなく、圧縮率の点で有利となる。

このように、本実施の形態 3 によるオーディオ信号符号化装置によれば、入力オーディオ信号のスぺクトルと人間の聴觉的な性質である聴覚感度特性に基づいて、第 1 のべクトル量子化器での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数プロックを選択し、第 2のべクトル量子化器で、上記選択された周波数ブロックについて上記第 1 の量子化器の量子化誤差成分の量子化を行なうようにしたから、人間の聴！:的な性質を利用して効率の良い量子化を行なうことができる < また、図 7，図 1 1 ，及び図 1 2に示す構成では、量子化する重要度の高い周波数ブロックの選択の際に第 1 のべクトル量子化器での量子化誤差に基づいて重要度を算出するようにしたから、第 1 のべクトル量子化器での量子化が良好である部分が再度量子化されて逆に誤差が生じてしまうことを防止でき、高品質を保持した量子化を行なうことができる。また、図 1 0に示す構成で重要度 g を求める場合は、図 7，図 1 1 ，及び図 1 2 に示す構成で重要度 g を求める場合に比して、出力すべきィンデックスを少なくでき、圧縮率を向上できる。

なお、上記実施の形態 3では、量子化部が第 1段の量子化部 6 0 0 2 1 , 第 2段の量子化部 6 0 0 2 3の 2段構成で、この第 1 段の量子化部 6 0 0 2 1 と第 2段の量子化部 6 0 0 2 3 の間に聴覚的選択手段 6 0 0 2 2 を設けたものについて説明したが、童子化部を 3段以上の複数段構成とし、各量子化部の間にそれぞれ聴覚的選択手段を設ける構成としてもよく、かかる構成とした場合も、上記実施の形態 3 と同様、人間の聴覚的な性質を利用して効率の良い量子化を行なうことができる。

実施の形態 4 .

図 1 4 は本発明の実施の形態 4によるオーディオ信号符号化装置の構成を示すブロック図である。本実施の形態では、符号化装置 1 における量子化部 1 0 5の構成のみが上記実施の形態とことなるものであるために、ここでは、量子化部の構成のみについて説明する。 1 4 0 0 1 1 は正規化都 1 0 4から出力された MD C T信号 s i をスぺクトル包絡の値 1 i を重み係数としてべクトル量子化する第 1 段の量子化器、 1 4 0 0 1 2 は第 1段の量子化器 1 4 0 0 1 1 の量子化結果を逆量子化する逆量子化器であり、この逆量子化器 1 4 0 0 1 2の出力と正規化部 1 0 4 から出力された残差信号の差分をとることにより第 1段の量子化器 1 4 0 0 1 1 による量子化の量子化誤差信号 z i が得られる。 1 4 0 0 1 3 は第 1段の量子化器 1 4 0 0 1 1 による量子化の量子化誤差信号 z i を後述する重み計算部 1 4 0 0 1 7の計算結果を重み係数としてべクトル量子化する第 2段の量子化器、 1 4 0 0 1 4 は第 2段の量子化器 1 4 0 0 1 3 の量子化結果を逆量子化する逆量子化器であり、この逆量子化器 1 4 0 0 1 4 の出力と第 1 段の量子化器 1 4 0 0 1 1 による量子化の i子化誤差信号の差分をとることにより第 2段の量子化器 1 4 0 0 1 3 による量子化の量子化誤差信号 z 2 i が得られる。 1 4 0 0 1 5 は第 2段の量子化器 1 4 0 0 1 3による量子化の量子化誤差信号 2 2 i を聴党重み計算部 4 0 0 6 の計算結果を重み係数としてべクトル量子化する第 3段の量子化器である。 1 4 0 0 1 6 は第 1段の量子化器 1 4 0 0 1 1 による量子化の量子化誤差信号 z i とスぺクトル包絡の値 1 i の相関を計算する相関計算部、 1 4 0 0 1 7は相関計算部の計算結果とスぺクトル包絡の値 1 i に基づいて第 2段の量子化器 1 4 0 0 1 3 による量子化での重み付け係数を算出する重み計算部である。

次に動作について説明する。本実施の形態 4のオーディオ信号符号化装 gは、 3段の量子化器を用い、それぞれの量子化器で異なる重み付けでべクトル量子化を行なうものである。

まず第 1 段の量子化器 1 4 0 0 1 3 において、入力された残差信号 s i が、概形量子化部 3 0 2で求められた L P Cスペクトル包絡の値 1 i を重み係数としてベクトル量子化が実行される。これにより、スぺクトルのエネルギーの大きな（集中した）部分に重み付けを施されることになり、結果として聴覚的に重要な部分をより高精度に量子化させる効果がある。この第 1 段のべクトル量子化器 1 4 0 0 1 3は、例えば実施の形態 3 における第 1 のべクトル量子化器 7 0 0 3 1 と同様のものを使用すればよい。

量子化結果は逆量子化器 1 4 0 0 1 2 で逆量子化され、これともとの入力残差信号 s i の差分により量子化による誤差信号 z i が得られる。この誤差信号 z i は第 2段の量子化器 1 4 0 0 1 3でさらにべクトル量子化される。ここでは、 L P Cスペクトル包絡 1 i と誤差信号 z i との相関をもとに、相関計算部 1 4 0 0 1 6 , 及び重み計算部 1 4 0 0 1 7 において重み係数を算出する。

具体的には相関計算部 1 4 0 0 1 6 で、

a = ( ∑ l i * z i ) / ( ∑ l i * l i )

を計算する。この αは 0 < α < 1 の値をとり、両者の相関度を表す。 α が 0に近い時は，第 1段目の量子化がスぺクトル包絡の重み付けに基づき精度よく行われたことを示しており、 αが 1 に近い時はまだ精度よく量子化できていないことを示す。そこで、この αによりスぺクトル包絡 1 i の重み付け度合いを調整する係数として、を求め、べクトル量子化の際の重み付け係数とする。このように第 1 段目の量子化の精度に応じて再度スぺクトルの包絡で重み付けし、量子化することで、量子化精度が向上する。第 2段目の量子化器 1 4 0 0 1 3 による量子化結果も同様に逆量子化器 1 4 0 0 1 4 で逆量子化され、誤差信号 z 2 i が抽出され、この誤差信号 z 2 i が第 3段の量子化器 1 4 0 0 1 5でべクトル量子化される。この時の聴覚的重み係数は、聴覚重み付け計算部 1 4 0 0 6 の重み計算部 A 1 9 で計算される。たとえば、誤差信号 z 2 i , L P Cスぺクトル包絡 1 i , 及び残差信号 s i を用いて、

N = ∑ z 2 i * 1 i

S = ∑ s i * 1 i

. β = 1 - ( N / S )

を求める。

—方、聴覚重み付け計算部 1 4 0 0 6の聴覚マスキング計算部 1 4 0 0 1 8では、たとえば M P E G (ェムぺグ）オーディオ標準方式の中で用いられている聴覚モデルにより聴党マスキング特性 m i を計算する。これに上述した最小可聴限界特性 h i を重ねあわせて最終的なマスキング特性 M i を求める。

そして、この最終的なマスキング特性 M i を重み計算部 1 4 0 0 1 9 で計算された係数）3でべき乗した値の逆数と 1 との積である。

1/

/Μί^β

( 3 3 )

を第 3段のべクトル量子化の際の重み係数として用いる。

このように、本実施の形態 4によるオーディオ信号符号化装置によれば、複数の量子化器 1 4 0 0 1 1 , 1 4 0 0 1 3 , 1 4 0 0 1 5 が聴覚感度特性を考慮した重み付けを含む，それぞれ異なる重み付け係数を用いて量子化を行なう構成としたので、人間の聴觉的な性質をより有効に利用して効率の良い量子化を行なうことができる。

実施の形態 5 . 図 1 5 は本発明の実施の形態 5 によるオーディオ信号符号化装置の構成を示すプロック図である。

本実施の形態 5 によるオーディオ信号符号化装 gは、図 6 に示す実施の形態 3 と図 4 に示す実施の形態 1 とを組み合わせたものであり、図 6 に示す実施の形態 3 によるオーディオ信号符号化装置において、各量子化部での量子化の際に、聴覚重み付け計算部 4 0 0 6 において聴覚感度特性を用いて求めた重み付け係数を用いるようにしたものである。本実施の形態 5 によるオーディオ信号符号化装置では、かかる構成とすることにより、上記実施の形態 1 と実施の形態 3 により得られる効果の両方を得ることができるものである。

また、同様にして、図 6 に示す実施の形態 3 に実施の形態 2 , または実施の形態 4の構成を組み合わせることも可能であり、それぞれの組み合わせにより得られるオーディオ信号符号化装置は、それぞれ実施の形態 2 と実施の形態 3 により得られる効果の両方，及び実施の形態 4 と実施の形態 3 により得られる効果の両方が得られるものである。

なお、上記実施の形態 1 ないし 5では多段量子化部は量子化部の段数が 2段，または 3段のものを示したが、量子化部の段数を 4段以上の多段構成としてもよいことは言うまでもない。

また、多段量子化部の各段におけるべクトル量子化の際に用いる重み係数の順序は、上記実施の形態に示したものに限られるものではなく、たとえば、第 1 段で聴覚感度特性を考慮した重み付けを用い、 2段目以降で L P Cスぺクトル包絡を用いるようにしてもよい。

実施の形態 6 .

図 1 6 は本発明の実施の形態 6 によるオーディオ信号符号化装置の構成を示すブロック図である。本実施の形態では、符号化装置 1 における量子化部 1 0 5 の構成のみが上記実施の形態とことなるものであるために、ここでは、量子化部の構成のみについて説明する。図 1 6において、 4 0 1は第 1の小量子化部、 4 0 2は第 1の小量子化部 4 0 1 の出力を受ける第 2の小量子化部、 4 0 3は第 2の小量子化部 4 0 2の出力を受ける第 3の小量子化部である。

次に上記量子化部 1 0 5の動作について説明する。上記第 1の小量子化部 4 0 1 に入力される信号は符号化装 *の正規化部 1 0 4からの出力であり、正規化された MD C T係数である。ただし、正規化部 1 0 4 を持たない構成では、 1^0 (：丁部 1 0 3の出カとなる。第 1の小量子化部 4 0 1では、入力された MD C T係数をスカラー量子化、またはべクトル量子化して、量子化に用いたパラメタを表現するインデックスを符号化する。また、量子化による入力 MD C T係数に対する量子化誤差を算出し、それを第 2の小量子化部 4 0 2へと出力する。第 1の小量子化部 4 0 1では、すべての MD C T係数を量子化してもよいし、一部のみを量子化するようにしてもよい。当然ながら、一部のみを量子化した場合は、第 1 の小 S子化部 4 0 1で量子化されない帯域の量子化誤差は、量子化されない帯域の入力 MD C T係数そのものとなる。

次いで、第 2の小量子化部 4 0 2では、第 1 の小量子化部 4 0 1 の M D C T係数の量子化誤差を入力として、それをさらに量子化する。このときの量子化も第 1 の小量子化部 4 0 1 と同様に、スカラー量子化を用いてもよいし、ベタトル量子化を用いてもよい。そして、第 2の小量子化部 4 0 2では、量子化に用いたパラメタを表現するインデックスに符号化する。また、量子化による量子化誤差を算出し、それを第 3の小量子化部 4 0 3へと出力する。この第 3の小量子化部 4 0 3は、上記第 2 の小量子化部と構成は同じである。

ここで、上記第 1の小量子化部 4 0 1 , 第 2の小量子化部 4 0 2，第 3の小量子化部 4 0 3が量子化する MD C T係数の個数、つまり、帯域幅は必ずしも均一である必要はなく、また、量子化する帯域も同じである必要もない。このとき、人間の聴覚特性を考慮すると、望ましくは、第 2の小量子化部 4 0 2 , 第 3 の小量子化部 4 0 3 ともに、低域周波数成分を示す M D C T係数の袼域を量子化するように設定するのが望ましい ₀

このように本実施の形態 6 によれば、量子化を行う際に、量子化部を階層的に設け、前段と後段での量子化部が量子化する帯域幅を変化させることで、入力 M D C T係数のうち、任意の帯域、例えば、人間にとつて聴覚的に重要な低域周波数成分に相当する係数を量子化するようにしたから、低ビットレート、すなわち高い圧縮率でオーディオ信号を符号化しても、受信側に置いて高品位な音声の再生を行うようにすることができる。

実施の形慷 7 .

次に図 1 7 を用いて、本発明の実施の形態 7によるオーディオ信号符号化装 Sについて説明する。本実施の形態では、符号化装置 1 における量子化部 1 0 5の構成のみが上記実施の形態と異なるものであるために、ここでは、量子化部の構成についてのみ説明する。図 1 7 において、 5 0 1 は第 1 の小量子化部（ベクトル量子化器）、 5 0 2 は第 2 の小量子化部、 5 0 3 は第 3の小量子化部である。上記実施形態 6 との構成上の違いは、第 1 の量子化部 5 0 1 が、入力 M D C T係数を 3 つの帯域に分割して独立に量子化を行う点である。一般にべクトル量子化の手法を用いて量子化を行う場合において、入力 M D C T係数から幾つかの要素を抽出して、ベタトルを構成し、べクトル量子化することができる。本実施の形態 7 の第 1 の小:！:子化部 5 0 1 では、入力 M D C T係数から幾つかの要素を抽出してべクトルを構成する際に、低域の量子化は低域のみの要素を用いて量子化する構成で、中域の量子化は中域のみの要素を用いて、高域の量子化は髙域のみの要素を用いて、それぞれべクトル量子化する構成となっており、上記第 1 の小量子化部 5 0 1 が見掛け上、 3 つの分割化べクトル量子化器によって構成されているようになつている。なお、本実施の形態 7では、量子化の際に、低域，中域，髙域の 3つの帯域に分割する方法を一例として説明したが、分割する帯域の数は 3 以外の数であってもよい。また、第 2の小量子化部 5 0 2，第 3 の小量子化部 5 0 3についても、第 1 の量子化部 5 0 1 と同様に带域をいくつかに分割して量子化を行う構成としてもよい。

このように本実施の形態 7 によれば、量子化を行う際に、入力 M D C T係数を 3つの帯域に分割して独立的に量子化を行うようにしたので、聴党的に重要な帯域を優先的に量子化する等の処理を第 1 回目の量子化時に行うことができ、後段の量子化部 5 0 2， 5 0 3 において、さらに段階的に当該帯域の M D C T係数の量子化を行うことにより、量子化誤差をより低減することができ、受信側において、より高品位な音質の再現を可能とすることができる。

実施の形態 8 .

次に図 1 8 を用いて、本発明の実施の形態 8 によるオーディオ信号符号化装置について説明する。本実施の形態 8 では、符号化装置 1 における量子化部 1 0 5の構成のみが上記実施の形態 1 と異なるものであるために、ここでは、量子化部の構成についてのみ説明する。図 1 8 において、 6 0 1 は第 1 の小量子化部、 6 0 2は第 1 の量子化帯域選択部、 6 0 3 は第 2の小量子化部、 6 0 4 は第 2の量子化帯域選択部、 6 0 5 は第 3 の小量子化部である。上記実施の形態 6および 7 との構成上の違いは、第 1 の量子化帯域選択部 6 0 2 と、第 2の量子化帯域選択部 6 0 4 が加わつた点である。

以下動作について説明する。上記第 1 の量子化帯域選択部 6 0 2では、第 1 の小量子化部 6 0 1 の量子化誤差である出力を用いて、第 2 の小量子化部 6 0 2 でどの帯域の: M D C T係数を量子化すべきかを算出する。例えば、式（ 1 0 ) で与える esum (j) を最大とする j を算出し、 j * OFFSET ら j *OFFSET + BANDWIDTHの裕域を量子化すればよい。 j · OFFSET+BANDW1DTH

esum(j) - ∑ fdcterr(i)² ( ^{1 0} )

^U/ i=j . OFFSET ^6rr

ここで、 OFFSETは定数で、 BANDWIDTH は第 2の小量子化部 6 0 3 が量子化する帯域幅に相当する総サンプルである。第 1 の量子化带域選択部 6 0 2では、例えば、式（ 1 0 ) で最大値を与えた j などを符号化してインデックスとする。第 2 の小量子化部 6 0 3では、第 1 の量子化帯域選択部 6 0 2 で選択された帯域を量子化する。第 2 の量子化帯域選択部 6 0 4 は、その入力が第 2 の小量子化部 6 0 3 の量子化誤差である出力であり、第 2 の量子化帯域選択部 6 0 4 の選択した帯域が第 3の小量子化部 6 0 5 に入力されることを除いては、同じ構成で実現可能である。

なお、第 1 の量子化帯域選択部 6 0 2、および第 2 の量子化帯域選択部 6 0 4 では、式（ 1 0 ) を用いて次の量子化部の量子化すべき帯域を選択する構成を説明したが、式（ 1 1 ) の正規化部 1 0 4 で正規化に用いた値、および人間の周波数に対する相対的な聴党感度特性を考慮に入れた値を乗算した値を用いて算出してもよい。 j . OFFSET+BANDWIDTH , esum(j) =∑ { idcterr(i)， env(i) · zxc(i) （ ¹ 丄） i=j · OFFSET ここで、 env(i)は M D C T部 1 0 3 の出力を正規化部 1 0 4 の出力で除算したものであり、 zxc(i)は人間の周波数に対する相対的な聴党感度特性を考慮に入れたテーブルであり、その一例を表 2 に示した。また、式 ( 1 1 ) において zxc(i)はすべて 1 として考慮に入れない構成でもよい。

500 2500

さらに、量子化帯域選択部は祓数設けなくてもよく、上記第 1 の量子化帯域選択部 6 0 2のみを用いた構成や、第 2の量子化裕域選択部 6 0 4 のみを用いた構成としてもよい。

このように本実施の形態 8 によれば、多段的に量子化する際に、全段の量子化部と次段の量子化部との間に量子化带域選択部を設け、量子化する帯域を可変となるようにすることで、入力信号に応じて適宜、量子化する蒂域を変化させることが可能となり、量子化の自由度を向上することができる。以下に、図 1 および図 1 9 を用いて、上記実施の形態 1 ないし 8 の上記符号化装置 1 における各量子化部の量子化方法の詳細な動作について説明する。各小量子化部に入力される正規化された MD C T係数 1 4 0 1 は、その MD C T係数 1 4 0 1 から規則に基づいて幾つかを抜き出して音源サブべクトル 1 4 0 3 を構成する。同様に、正規化部 1 0 4 の入力である MD C T係数を、正規化部 1 0 4 で正規化された MD C T係数 1 4 0 1 で割った係数列を正規化成分 1 4 0 2 とした時、音源サブべクトノレ 1 4 0 3 を MD C丁係数 1 4 0 1 から抜き出したのと同じ規則で、正規化成分 1 4 0 2 から抽出し、重みサブべクトル 1 4 0 4 を構成することができる。音源サブべクトノレ 1 4 0 3および重みサブべクトノレ 1 4 0 4 を MD C T係数 1 4 0 1 および正規化成分 1 4 0 2からそれぞれ抽出する規則は、例えば、式（ 1 4 ) で示す方法などがある。

ヽ

subvecton(j) = i+j

VTOTAL 〜J 1 4 )

~― ~ · i+j < TOTAL

し H

VTOTAL

i+j≥ TOTAL

C闩

ここで、 i 番目の音源サブべクトノレの j 番目の要素は subvector i (j) であり、 MD C T係数 1 4 0 1 は vector( )であり、 MD C T係数 1 4 0 1 の総要素数が TOTAL で、音源サブべクトル 1 4 0 3の要素数が C R VTOTAL は、 TOTAL と同じ値かより大きい値で VT0TAL/CR が整数値になるように設定する。例えば、 TOTAL が 2 0 4 8の時、 C Rが 1 9 で VTOTAL力； 2 0 5 2、 C Rが 2 3で VTOTAL力； 2 0 7 0、 C Rが 2 1 で VTOTALが 2 0 7 9 などである。重みサブべクトノレ 1 9 0 0 1 4 0 4 も式（ 1 4 ) の手順で抽出可能である。べクトル量子化器 1 4 0 5 では、コードブック 1 4 0 9 中のコードべクトノレの中力、ら、音源サブべ

差替え用紙（規則 26) クトル 1 4 0 3 との距離が、重みサブべクトル 1 4 0 4 で重みつけて最も小さくなるものを探し、その最小の距雕を与えたコードべクトルのィンデッタスと、最小の距離を与えたコードべクトルと入力音源サブべクトル 1 4 0 3 との量子化誤差に相当する残差サブべクトル 1 4 1 0 を出力する。実際の計算手順例は、ベクトル量子化器 1 4 0 5が、距離計算手段 1 4 0 6 , コード決定手段 1 4 0' 7 , 残差生成手段 1 4 0 8 の 3つの要素から構成されるものとして説明する。距離計算手段 1 4 0 6 では、例えば、式（ 1 5 ) を用いて、 i 番目の音源サブベクトル 1 4 0 3 と、コードブック 1 4 0 9の k 番目のコードべクトルとの距離を算出する。

dik = ∑ Wi^R(subvectoriO)-C_k(j))^s ( ^{1 5} )

j-o '

ここで wjは重みサブべクトルの j 番目の要素、 ck(j) は k 番目のコ一ドべクトルの〗番目の要素、 R、 Sは距離計算のノルムであり、 R、 S の値としては 1,1.5,2 などが望ましい。なお、このノルム R と Sは同一の値である必要はない。 dik は i 番目の音源サブべクトルに対する k 番目のコードべクトルの距離を意味する。コード決定手段 1 4 0 7 では、式（ 1 5 ) などで算出された距離の中で最小となるコードベクトルを選出し、そのインデックスを符号化する。例えば、 diu が最小値の場合、 i 番目のサブべクトルに対する符号化されるインデックスは u となる。残差生成手段 1 4 0 8では、コード決定手段 1 4 0 7で選出したコードべクトルを用いて、式（ 1 6 ) を用いて、残差サブべクトル 1 4 1 0を生成する。

resj© = subvectori(j)-C_u(j) ^{( 1 6 )} ここで i 番目の残差サブべクトル 1 4 1 0の j 番目の要素は、 resi(j) であり、コード決定手段 1 4 0 7で選出されたコードべクトルの j 番目の要素を、 cu(j) とする。残差サブベクトル 1 4 1 0は式（ 1 4 ) の逆過程などで、それ以降の小量子化部の量子化対象となる MD C T係数として保持される。ただし、ある帯域の量子化がそれ以降の小量子化部に影響を与えない帯域を量子化している場合、つまり以降の小量子化部が量子化をする必要がない場合は、残差生成手段 1 4 0 8 , 残差サブべクトル 1 4 1 0 , M D C T 1 4 1 1の生成は必要ない。なおコードブック

1 4 0 9が持つコードべクトルの個数はいくつでもよいが、メモリ一容量、計算時間等を考慮すると、 6 4程度とすることが好ましい。

なお、上記べクトル量子化器 1 4 0 5の他の実施形態として以下のような構成も可能である。すなわち、距離計算手段 1 4 0 6では、式（ 1

7 ) を用いて距離を算出する。

CR-1

s

dik= ] ∑ Wj^R (subvectori(])-C_k(j)) k < K

( 1 7 )

ただし、 Kはコードブック 1 4 0 9のコ一ド検索に用いるコ一ドべクトルの総数である。

コード決定手段 1 4 0 7では、式（ 1 7 ) で算出された距離 dik の最小値を与える k を選出し、そのインデックスを符号化する。ただし、 k は 0から 2K-1 までの値となる。残差生成手段 1 4 0 8では、式（ 1 8 ) を用いて残差サブべクトル 1 4 1 0を生成する。 resi(j) = subvectorj(j)-Cu(j) 0≤ k < K ( ι s ) subvectoriG)- C_u(j) K≤ k < 2K コードブック 1 4 0 9が持つコードべクトルの個数はいくつでもよいがメモリーの容量、計算時間等を考慮すると、 6 4程度とすることが好ましい。

また、重みサブべクトル 1 4 0 4 として、正規化成分 1 4 0 2のみから生成する構成について述べたが、重みサブべクトル 1 4 0 4 に、人間の聴覚特性を考慮した重みをさらに乗じて重みサブベクトルを生成することも可能である。

実施の形態 9 .

次に図 1 、図 2 0〜図 2 4 を用いて、本発明の実施の形態 9によるォ一ディォ信号復号化装 Sについて説明する。符号化装置 1 からの出力であるインデックスは、正規化部 1 0 4 の出力したインデックスと、量子化部 1 0 5 の出力したインデックスとに大きく分けられる。正規化部 1 0 4 の出力したインデックスは、逆正規化部 1 0 7で復号し、量子化部 1 0 5の出力したインデックスは逆量子化部 B 1 0 6 で復号する。ここで逆量子化部 1 0 6では、量子化部 1 0 5の出力したインデックスの一部分のみを用いて復号することも可能である。

すなわち、量子化部 1 0 5 の構成を図 1 7に示す構成のものとした場合、図 2 0の構成を有する逆量子化部を用いて逆量子化を行う場合について説明する。図 2 0において、 7 0 1 は第 1 の低域成分の逆量子化部である。この第 1 の低域成分の逆量子化部 7 0 1 では、第 1 の小量子化部 5 0 1 の低域成分のインデックスのみを用いて復号化を行う。

このようにすることで、符号化装置 1 から送信されてくる情報量に関わらず、符号化されたオーディオ信号の任意の情報量分を復号化することができ、符号化する情報量と復号化する情報量とを異なる値のものとすることができ、受信者側での通信環境等に応じて、復号する情報量を変化させることができ、例えば、通常の公衆電話網を利用しているような場合においても、安定に髙品位な音質を得ることができるようになる。図 2 1 は逆量子化を 2段階で行う際のオーディオ信号復号化装 Sの逆量子化部の構成を示す図であり、図 2 1 において、 7 0 4は第 2 の逆量子化部である。この第 2 の逆量子化部 7 0 4では、第 2の小量子化部 5 0 2のインデックスを用いて復号化を行う。従って、第 1 の低域成分の逆量子化部 7 0 1 からの出力と、第 2の逆量子化部 7 0 4からの出力の加算値が逆量子化部 1 0 6の出力として出力されることになる。ただし、ここでの加算は量子化時に、それぞれの小量子化部が量子化した带域と同じ帯域に加算していく。

このように、第 1 の小量子化部（低域）のインデックスを第 1 の低域成分の逆量子化部 7 0 1 により復号化するとともに、第 2の小量子化部のインデックスを逆量子化する際に、上記第 1 の低域成分の逆量子化部 7 0 1 の出力を加算して行うようにすることにより、逆量子化を 2段階で行うことができ、多段階で量子化されたオーディオ信号を正確に復号化することができ、より高品質な音質を得ることができるようになる。

また、図 2 2 は逆量子化を 2段階で行う際に、対象となる帯域を拡大して行うようにしたオーディオ信号復号化装置の逆量子化部の構成を示す図であり、図 2 2において、 7 0 2 は第 1 の中域成分の逆量子化部である。この第 1 の中域成分の逆量子化部 7 0 2では、第 1 の小量子化部 5 0 1 の中域成分のインデックスを用いて復号化を行う。従って、第 1 の低域成分の逆量子化部 7 0 1 からの出力と、第 2の逆量子化部 7 0 4 からの出力と、第 1 の中域成分の逆量子化部 7 0 2 からの出力の加算値が逆量子化部 1 0 6の出力として出力されることになる。ただし、ここでの加算は量子化時に、それぞれの小量子化部が量子化した帯域と同じ袼域に加算していく。このようにすることで、再生される音の带域を拡大することができ、より髙品質なオーディオ信号の再生を行うことができるようになる。

また、図 2 3 は、図 2 2 の構成を有する逆量子化部において、逆量子化する段数を 3段階で行う際のオーディオ信号復号化装置の逆量子化部の構成を示す図であり、図 2 3 において、 7 0 5は第 3 の逆量子化部である。第 3の逆量子化部 7 0 5 では、第 3の小量子化部 5 0 3のインデックスを用いて復号化を行う。従って、第 1 の低域成分の逆量子化部 7 0 1 からの出力と、第 2の逆量子化部 7 0 4からの出力と、第 1 の中域成分の逆量子化部 7 0 2からの出力と、第 3 の逆量子化部 7 0 5 からの出力の加算値が、逆量子化部 1 0 6の出力として出力されることになる。ただし、ここでの加算は量子化時に、それぞれの小量子化部が量子化した帯域と同じ帯域に加算していく。

さらに、図 2 4 は、図 2 3の構成を有する逆量子化部において、量子化を 3段階で行う際に、対象となる帯域を拡大して行うようにしたォ一ディォ信号復号化装置の逆量子化部の構成を示す図であり、図 2 4 において、 7 0 3は第 1 の高域成分の逆量子化部である。第 1 の高域成分の逆量子化部 7 0 3では、第 1 の小量子化部 5 0 1 の高域成分のインデックスを用いて復号化を行うのに従って、第 1 の低域成分の逆量子化部 7 0 1 からの出力と、第 2の逆量子化部 7 0 4からの出力と、第 1 の中域成分の逆量子化部 7 0 2からの出力と、第 3 の逆量子化部 7 0 5 からの出力と、第 1 の高域成分の逆量子化部 7 0 3からの出力の加算値が逆量子化部 1 0 6 の出力として出力されることとなる。ただし、ここでの加算は量子化時に、それぞれの小量子化部が量子化した帯域と同じ帯域に加算していく。

なお、上 ΙΞ実施の形態 9では、復号化部 1 0 6が、図 1 7の構成を有する量子化部 1 0 5 によって量子化された情報を逆量子化する場合を例に挙げて説明したが、量子化部 1 0 5の構成は図 1 6や図 1 8 に示した構成でも同様に行うことができる。

また、量子化部として上記図 1 7に示されるような構成の量子化部を用いて符号化を行い、その逆量子化部として図 2 4 に示すような構成を有する逆量子化部を用いて復号化する場合には、図 2 5 に示すように、第 1 の小量子化部の低域のインデックスを逆量子化した後、次段の第 2 の小量子化部 5 0 2のインデックスを逆量子化し、再度第 1 の小量子化部の中域のインデックスを逆:！:子化するというように、帯域を拡大するための逆量子化と量子化誤差を低減するための逆量子化とを交互に繰り返し行うが、図 1 6に示したような構成の量子化部によって符号化された信号を、図 2 4 に示すような構成を有する逆量子化部を用いて復号化する場合には、分割された帯域がないので、順次、次段の逆量子化部にて量子化された係数を復号化する処理を行うことになる。

次に図 1 および図 2 6 を用いて、上記オーディオ信号復号化装置 2 を構成する逆量子化部 1 0 7の詳細な動作について説明する。逆量子化部 1 0 7 は、例えば、図 2 0に示した逆量子化部を有する場合は、第 1 の低域の逆量子化部 7 0 1 から構成され、図 2 1 に示した逆量子化部を有する場合は、第 1 の低域の逆量子化部 7 0 1 と、第 2の逆量子化部 7 0 4の 2つの逆量子化部から構成される。

べクトル逆量子化器 1 5 0 1 は、べクトル量子化部 1 0 5からのインデックスを用いて MD C T係数の再生を行う。小量子化部が図 2 0に示した構成を有するものである場合の逆量子化は、ィンデックス番号を復号化して、その番号のコードべクトルをコードブック 1 5 0 2から選出する。コードブック 1 5 0 2は符号化装置のコードブックと同様の內容のものとする。この選出されたコードべクトルは再生べクトノレ 1 5 0 3 として、式（ 1 4 ) の逆過程で逆量子化された MD C T係数 1 5 0 4 となる。

また、小量子化部が図 2 1 に示した構成を有するものである場合の逆量子化は、インデックス番号 k を復号して、式（ 1 9 ) で算出される番号 u のコードべクトルをコードブック 1 5 0 2 力ら選出する。

再生サブベクトルは、式（ 2 0 ) を用いて生成する resi(j) = Cu ') U = k ( 2 0 )

-C_u{j) u≠ k ここで i 番目の再生サブべクトノレの j 番目の要素は res i (j) とする。次に図 1 、及び図 2 7 を用いて、オーディオ信号復号化装置 B 2 を構成する逆正規化部 1 0 7の詳細な構成について説明する。図 2 7 において、 1 2 0 1 は周波数概形逆正規化部、 1 2 0 2 は帯域振幅逆正規化部、 1 2 0 3 は帯域テーブルである。周波数概形逆正規化部 1 2 0 1 は、周波数概形正規化部 1 2 0 1 からのインデックスを入力として、周波数概形を再生し、逆量子化部 1 0 6からの出力に対して、前記周波数概形を乗算して出力する。帯域振幅逆正規化部 1 2 0 2では、帯域振幅正規化部 2 0 2からのインデックスを入力として、带域テーブル 1 2 0 3 に示された各帯域ごとの振幅値を乗算により復元する。帯域振幅正規化部 B 2 0 2からのインデックスを用いて復元された各帯域ごとの値を、 qavej とすると、裕域振幅逆正規化部 1 2 0 2の演算は、式（ 1 2 ) で与えられる。 dct(i) = n dct(i) ' gavej bjlow≤ i≤ bjhigh ( 1 2 ) ここで、周波数概形逆正規化部 1 2 0 1 の出力を n _ dct(i)、帯域振幅逆正規化部 1 2 0 2の出力を dct(i)とした。また、帯域テーブル 1 2 0 3 と図 2 の帯域テーブル 2 0 3 とは同様である。

次に図 2 8 を用いてオーディオ信号復号化装 S 2 を構成する周波数概形逆正規化部 1 2 0 1 の詳細な構成について説明する。図 2 8 において、 1 3 0 1 は概形逆量子化部、 1 3 0 2は包絡特性逆量子化部である。概形逆量子化部 1 3 0 1 では、符号化装置における概形量子化部 3 0 1 からのインデックスを用いて周波数概形を表すパラメタ、例えば、線形予測係数等を復元する。復元された係数が線形予測係数ならば、例えば、式（ 8 ) と同様に算出することにより、量子化された包絡特性を復元する。復元された係数が線形予測係数でない場合、例えば、 L S P係数などの場合も周波数特性に変換して包絡特性を復元する。包絡特性逆量子化部 1 3 0 2では、式（ 1 3 ) で示されるように復元された包絡特性と、逆量化部 1 0 6 からの出力と乗算して出力とする。 mdct(i) - fdct(i) · env(i) ( 1 3 )

実施の形態 1 0 .

以下、本発明の実施の形態 1 0によるオーディオ信号符号化装置について、図面を参照しながら説明する。図 2 9は本実施の形態 1 0 におけるオーディオ信号符号化装置の詳細な構成を示す図であり、これらの図において、 2 9 0 0 3 はオーディオ信号の特徵量の代表値であるオーディォコ一ドを複数有する送信側コードブック、 2 9 0 0 1 0 2 はオーディォコ一ド選択部、 2 9 0 0 1 0 7 は位相情報抽出部である。

以下、動作について説明する。

ここでは、入力信号として M D C T係数を考えるが、時間周波数変換された信号であれば、 D F T (離散フーリエ変換）係数等を用いてももちろん差し支えない。

図 3 0 に示すように、周波数軸上のデータを 1 つの音源べクトルとみなした場合、その音源べクトルから、いくつかの要素を抜き出したサブベクトルを形成し、これを図 2 9の入力ベクトルとした場合、オーディォコード選択部 2 9 0 0 1 0 2は、送信側コードブック 2 9 0 0 3中の各コードと前記入力べクトルとの距離を算出して、その距離が最小となるコードを選択して、その選択されたコードの送信側コードブック 2 9 0 0 3におけるコードインデックスを出力する。

上記符号化装置の詳細な動作を図 2 9及び図 3 1 を用いて以下に説明する。ここでは、コード化を、 2 0 KH z を対象とするために 1 0 b i tで行う場合を想定する。また、位相情報抽出部 2 9 0 0 1 0 7では、抽出する位相を周波数の低い方から 2番目までの要素に対して、すなわち 2 ビット分とする。上記オーディオコード選択部 1 9 0 0 1 0 2の入力は、 MD C T変換して得た係数を 1つのベクトルとした時に、そのべクトルを分割して幾つかの要素、例えば、 2 0程度の要素を 1つのサブベクトルとしたものである。その際、ベクトルは X0〜X 19 とし、 Xの添え字の数字が小さいサブべクトルの要素ほど、低い周波数成分を有する MD C T係数に対応するものとする。ここで低い周波数成分は人にとつて聴党的に重要な情報であり、従って、これらの要素についてのコ一ド化を優先的に行うことで、再生時に人間にとっては音質の劣化を感じさせにくい。

オーディオコード選択部 2 9 0 0 1 0 2では、前記特徴べクトルと、送信側コードブック 2 9 0 0 3の各々のコ一ドとの距離を算出する。例えば、コードインデックスを i とした場合に、式（ 2 1 ) でコードインデックス i のコードにおける距離 Diが算出できる。

ヽ、

WO/)― abs{Xj)} +∑ ∑{Cy- Xj) ( 2 1 )

,=0 =0 =0ゾ + 1

ここで上記式（ 2 1 ) において、 Nは送信側コードブック 2 9 0 0 3 中の全コードの個数であり、 Cij はコードインデックス I における j 番目の要素の値である。 M は本実施の形態 1 0の場合、 1 9以下の数、例えば、 1などである。 P は距離計算におけるノルムであり、例えば、 2 などである。また、 abs( ) は絶対値演算を意味する。

位相情報抽出部 2 9 0 0 1 0 7では、最小の距離 Di を与えるコードインデックス i と M個の位相情報 Ph(j) j = 0 to Mを出力する。位相情報 Ph(j) は式（ 2 2 ) で示されるように、

, 、 ί 1 atCji*Xi≥0 _/ 、

P h ( j ) = \ ^J 2 2

{-latCji* Xj <0 入力べクトルが音声信号を MD C丁変換したべクトルのサブべクトルである場合などでは、一般に Xj の添え字 j が小さいほど係数の聴党的な重要度が高いため、本構成により、各サブべクトルの低い周波数成分の要素に対応する位相（正負）についてはコード検索時にはこれらの情報については考慮されず、検索後に別途付加されることになる。すなわち、図 3 1 ( a ) に示されるように、サブベクトル化された入力べクトルは、低い周波数側の 2 b i t分の要素の正負符号を無視して、送信側コードブック 2 9 0 0 3の有するコードとパターン比較される。例えば、ここには低い周波数側の 2 b i t分の要素が共に正として格納された 2 5 6個のコ一ドが格納されており、オーディオコード選択部 2 9 0 0 1 0 2では、入力されたサブべクトルと上記送信側コードブック 2 9 0 0 3の有する 2 5 6個のコードとの検索を行う。そして得られたコ一ドに対して、位相情報抽出部 2 9 0 0 1 0 7で抽出された、図 3 1 ( b ) に示される組み合わせのいずれかのものが、当該サブべクトルの低い周波数側の 2 b i t分の正負符号として付加されて、合計 1 0 b i tのコ一ドインデックスとして出力を行う。

このようにすることで、本オーディオ符号化装置から出力されるコードインデックスは、従来と同様に 1 0 b i t ( 1 0 2 4個）のままで、送信側コードブック 3に格納するコードは 8 b i t ( 2 5 6個）とすることができ、位相情報との情報量の和を、式（ 2 3 ) の距離計算のコードインデックスの情報量と同じにした場合に、下記の式（ 2 3 ) で復号された合成音声と本構成の合成音声と比べてみると、ほぼ同等の主観評価結果を得ることができる。

ここで本構成と式（ 2 2 ) を用いた場合の計算！：とメモリ量の関係を表 3 に示す。本実施例の構成の方がコードブックは 4分の 1 で、計算 * も従来では 1 0 2 4通りの検索処理が必要であったのが、 2 5 6通りの検索処理と、検索結果に対して 2符号を付加するという処理を行うだけでよく、計算量ならびにメモリを大幅に削減できることが分かる。

(表 3 )

このように本実施の形態 1 0 によれば、入力べクトルを分割して作成されたサブべクトルと送信側コードブック 2 9 0 0 3 の中の各オーディォコードとの聴党的な距離のうち最小距離を有するオーディオコ — ドを選択するにあたり、聴莧的な重要度が髙ぃサブべクトルの要素に相当する部分については、オーディオコ一ド選択部 2 9 0 0 1 0 2でその位相情報を示す正負符号を無視して取り扱って、送信側コ— ドブック 2 9 0 0 3のオーディオコードとの比較検索を行い、得られた結果に別途、位相情報抽出部 2 9 0 0 1 0 7で抽出した上記サブべクトルの要素部分に対応する位相情報を付加してコードインデックスとして出力するようにしたので、体感的な音質の劣化を招くことなく、オーディオコード選択部 2 9 0 0 1 0 2 における計算量を削減でき、また、コードブック 2 9

0 0 3に必要なコード数をも削減することができる。

実施の形態 1 1 .

以下、本発明の実施の形態 1 1 によるオーディオ信号符号化装置について、図面を参照しながら説明する。図 3 2 ( a ) は本実施の形態 1 1 におけるオーディオ信号符号化装置の構成を示す図であり、図 3 2 において、 3 2 0 0 1 0 3 は人間の聴覚心理特性を考慮した各周波数における相対的な聴党心理量のテーブルを格納する聴覚心理重みベクトルテ一ブルである。

以下、動作について説明する。上記実施の形態 1 0 との違いは、聴党心理重みべクトルテーブル 3 2 0 0 1 0 3 が新たに付加された構成であることである。聴覚心理重みべクトルとは、人間の聴覚心理モデルに基づき、周波数に対する聴覚の感度特性として定義された聴宽感度テ一ブルなどから、本実施の形態の入力べクトルの各要素に対する同じ周波数帯の要素を集めてべクトル化したものである。これは例えば、図 3 2 ( b ) に示されるように、周波数 2 . 5 K H z 程度にピークを有しており、周波数の最も低い位置にあるものが必ずしも人の聴覚的に重要でないものであることがわかる。

すなわち、本実施の形態では、 M D C T係数をオーディオコード選択部 2 9 0 0 1 0 2への入力べクトルとして、聴覚心理重みべクトルテーブル 3 2 0 0 1 0 3 をコード選択時の重みとして、送信側コードブック 2 9 0 0 3 中の各コードと入力べクトルとの聴党的な距離を算出し、最小の距離を与えるコードに対するコードインデックスを出力する。コ一ドインデックスを i とした場合にオーディオコード選択部 2 9 0 0 1 0 2 におけるコード選択時の距雕尺度 D i は、例えば、 N \i

D , = ∑∑lVj{abs(aj)-abs{Xj)} +∑ ∑Wj[Cij - Xj} ( 2 4 )

=0 =0 '0 となる。ここで、 Nは送信側コードブック 2 9 0 0 3 中の全コードの個数であり、 Cij はコードインデックス i における j 番目の要素の値である。 Mは本実施例の場合、 1 9以下の数、例えば、 1 などである。 P は距離計算におけるノルムであり、例えば、 2 などである。 Wj は、聴党心理重みべクトルテーブル 3 2 0 0 1 0 3の j 番目の要素である。また、 abs( ) は絶対値演算を意味する。

位相情報抽出部 2 9 0 0 1 0 7では、聴覚心理重みべクトルテーブル 3 2 0 0 1 0 3から、どの周波数のオーディオ特徴ベクトルに相当する要素の位相情報を抽出するかを判断し、その範囲で最小の Di を与えるコードインデックス I と M個の位相情報 Ph(j) j=0 to M を出力する。位相情報 Ph(j) は、式（ 2 2 ) で同様に定義される。

このように本実施の形態 1 1 によれば、入力べクトルを分割して作成されたサブべクトルと送信側コードブック 2 9 0 0 3 の中の各オーディォコードとの聴党的な距離のうち最小距離を有するオーディオドを選択するにあたり、聴覚的な重要度が高いサブべクトルの要素に相当する部分については、オーディオド選択部 2 9 0 0 1 0 2でその位相情報を示す正負符号を無視して取り扱って、送信側コードブック C 3のオーディオコードとの比較検索を行い、得られた結果に別途、位相情報抽出部 2 9 0 0 1 0 7 で抽出した上記サブべクトルの要素部分に対応する位相情報を付加してドインデックスとして出力するようにしたので、体感的な音質の劣化を招くことなく、オーディオコード選択部 2 9 0 0 1 0 2 における計算量を削減でき、また、コードブック 2 9 0 0 3 に必要なコード数をも削減することができる。

また、上記オーディオド選択部 2 9 0 0 1 0 2 でその位相情報を示す正負符号を無視して取り扱うオーディオ特徴べクトルを、人間の聴党心理特性を考慮した各周波数における相対的な聴覚心理量のテーブルを格納する聴 ¾心理重みべクトルテーブル 3 2 0 0 1 0 3を用いて重み付けして選択することにより、上記実施の形態 1 0のように単に低域から所定個数のベクトルを選択するものに比べて、より体感的に音質の優れた量子化を行うことができる。

実施の形態 1 2.

以下、本発明の実施の形態 1 2によるオーディオ信号符号化装置について、図面を参照しながら説明する。図 3 3 ( a ) は本実施の形態 1 2 におけるオーディオ信号量子化装置の構成を示す図であり、図において、 3 3 0 0 1 0 4は平滑べクトルテーブルであり、実際には除算カーブ等のデータが格納されている。 3 3 0 0 1 0 5は入力べクトルを平滑べクトルテーブル 3 3 0 0 1 0 4に格納された平滑べクトルを用いて、べクトル要素同士の除算により平滑化を行う平滑化部である。

以下、動作について説明する。上記平滑化部 3 3 0 0 1 0 5へは、上記実施の形態 1 0および実施の形態 1 1 におけるオーディオ信号符号化装置と同様、 MD C T係数等が入力ベクトルとして入力され、この平滑化部 3 3 0 0 1 0 5では平滑べクトルテーブル 3 3 0 0 1 0 4に格納された平滑べクトルである除算力一ブを用いて、入力べクトルに平滑演算を行う。この平滑演算は、例えば、入力べクトルを Xとし、平滑べクトル 3 3 0 0 1 0 4を Fとし、平滑化部 3 3 0 0 1 0 5の出力を Yとして、それぞれのべクトルの I 番目の要素を Xi，Fi,Yi とした場合に、式（ 2 5 ) 式で表される処理を行なう。

Y i = X i I F i (2 5 )

平滑べクトルテーブル 3 3 0 0 1 0 4は、入力べクトルが MD C T係数である場合には、 MD C丁係数の分散を小さくするような値である。図 3 3 ( b ) は上記平滑化の処理を模式的に示したものであり、サブべク卜ル化された要素のうちの低域側から 2つ分の要素に対して除算処理を行うことにより、周波数毎の情報量の格差（レンジ）を縮めることができる。

そして、平滑化部 3 3 0 0 1 0 5の出力は、オーディオコード選択部 2 9 0 0 1 0 2の入力となり、コード選択部 2 9 0 0 1 0 2では上述した実施の形態 1 0 と同様に、平滑化された入力ベクトルは、位相惰報抽出部 2 9 0 0 1 0 7にて、周波数の低い方から 2番目までの要素に対して、その位相情報が抽出され、一方、オーディオコード選択部 2 9 0 0 1 0 2では、送信惻コードブック 3 3 0 0 3 1 に格納された 2 5 6個のコードとの検索を行う。このとき、そのまま得られた検索結果に対応するコードインデックス（ 8 b i t ) を出力すると正しい検索結果が得られないので、平滑べクトルテーブル 3 3 0 0 1 0 4 より平滑化処理時の情報を受け取り、スケーリングを調整した上で、該検索結果に対応するコードインデックス（ 8 b i t ) の選択を行い、このようにして得られた結果に 2 ビット分の位相情報を付加して 1 O b i t のコードインデックス I を出力する。

このときの入力べクトルと送信側コードブック 3 3 0 0 3 1 に格納されたコードとの距離 Di は、例えば、平滑べクトルテーブル 3 3 0 0 1 0 4の各 i 番目の要素を Fi として、式（ 2 6 ) のように示される。 ?;= ∑∑ Fj[abs{aj) - abs{Xj)) +∑ ∑ j{Cij - Xj] ( 2 6 )

ここで、 Nは送信側コードブック 3 3 0 0 3 1 中の全コ一ドの個数であり、 Cij はコードインデックス i における j 番目の要素の値である。 M は本実施の形態の場合、 1 9以下の数、例えば、 1 などである。 P は距離計算におけるノルムであり、例えば、 2などである。 Wj は、聴党心理重みべクトルテーブル 3 2 0 0 1 0 3 の j 番目の要素である。また、 abs( ) は絶対値演算を意味する。位相情報抽出部 2 9 0 0 1 0 7では、最小の Di を与えるコードインデックス i と M個の位相情報 Ph(j) j=0 to M を出力する。位相情報 Ph(j) は、式（ 2 2 ) で同様に定義される。

このように本実施の形態 1 2 によれば、入力べクトルを分割して作成されたサブべクトルと送信側コードブック 3 3 0 0 3 1 の中の各オーディォコードとの聴党的な距離のうち最小距離を有するオーディオコードを選択するにあたり、聴党的な重要度が高いサブべクトルの要素に相当する部分については、オーディオコード選択部 2 9 0 0 1 0 2でその位相情報を示す正負符号を無視して取り扱って、送信側コードブック 3 3 0 0 3 1 のオーディオコードとの比較検索を行い、得られた結果に別途、位相情報抽出部 2 9 0 0 1 0 7で抽出した上記サブべクトルの要素部分に対応する位相情報を付加してコードインデックスとして出力するようにしたので、体感的な音質の劣化を招くことなく、オーディオコード選択部 2 9 0 0 1 0 2 における計算量を削減でき、また、送信側コ一ドブック 3 3 0 0 3 1 に必要なコード数をも削減することができる。

また、入力べクトルを平滑化テーブル 3 3 0 0 1 0 4，平滑化部 3 3 0 0 1 0 5 を用いて平滑化するようにしたから、オーディオコード選択部 2 9 0 0 1 0 2で検索を行う際に参照される、送信惻コ一ドブック 3 3 0 0 3 1 に記憶しておくコ一ドブックの周波数毎の情報！:を全体的に少ないものとすることができる。

実施の形態 1 3 .

以下、本発明の実施の形態 1 3 によるオーディオ信号符号化装置について、図面を参照しながら説明する。図 3 4は本発明の実施の形態 1 3 におけるオーディオ信号符号化装 Sの構成を示す図であり、図において、図 3 3 に示した実施の形態 1 2 との違いは、オーディオコード選択部 2

9 0 0 1 0 2でコードを選択する際に、平滑べク卜ルテーブル 3 3 0 0

1 0 4に加えて、実施の形態 1 1 で用いた聴覚心理重みべクトルテープノレ 3 2 0 0 1 0 3 をも使用するようにした点である。

以下、動作について説明する。平滑化部 3 3 0 0 1 0 5へは、上記実施の形態 1 0 と同様、 MD C T係数等が入力べクトルとして入力され、この平滑化部 3 3 0 0 1 0 5の出力は、オーディオコード選択部 2 9 0 0 1 0 2の入力となり、オーディオコード選択部 2 9 0 0 1 0 2では、送信側コードブック 3 3 0 0 3 1 中の各コードと上記平滑化部 3 3 0 0 1 0 5 の出力との距離を、平滑べクトルテーブル 3 3 0 0 1 0 4力ゝら出力される平'滑処理時の情報に基づいて、平滑処理時のスケーリングを考慮しつつ聴覚心理重みべクトルテ一ブル 3 2 0 0 1 0 3 の聴党心理重みベクトルによる重み付けを加味して算出する。上記実施の形態 1 0 , 1 1 と同様の表記を用いて、距離 Di は、例えば、式（ 2 7 ) のように示される。 ( 2 7 )

ここで、 Nは送信側コードブック 3 3 0 0 3 1 中の全コードの個数であり、 Cij はコードインデックス i における j 番目の要素の値である。 M は本実施例の場合、 1 9以下の数、例えば、 1 などである。 P は距離計算におけるノルムであり、例えば、 2 などである。 Wj は、聴覚心理重みべクトノレテーブル 3 2 0 0 1 0 3 の j 番目の要素である。また、 abs( ) は絶対値演算を意味する。位相情報抽出部 2 9 0 0 1 0 7では、最小の Diを与えるコードインデックス I と M個の位相情報 Ph(j) j=0 to M を出力する。位相情報 Ph(j) は、上記式（ 2 2 ) で同様に定義される。

このように本実施の形態 1 3 によれば、入力べクトルを分割して作成されたサブべクトルと送信側コードブック 3 3 0 0 3 1 の中の各オーディォコ一ドとの聴筧的な距離のうち最小距離を有するオーディオコ一ドを選択するにあたり、聴覚的な重要度が高いサブべクトルの要素に相当する部分については、オーディオコード選択部 2 9 0 0 1 0 2 でその位相情報を示す正負符号を無視して取り扱って、送信側コードブック 3 3 0 0 3 1 のオーディオコードとの比較検索を行い、得られた結果に別途、位相情報抽出部 2 9 0 0 1 0 7 で抽出した上記サブべクトルの要素部分に対応する位相情報を付加してコ一ドインデックスとして出力するようにしたので、体感的な音質の劣化を招くことなく、オーディオコード選択部 2 9 0 0 1 0 2 における計算量を削減でき、また、送信側コードブック 3 3 0 0 3 1 に必要なコード数も削減することができる。

また、上記オーディオコード選択部 2 9 0 0 1 0 2でその位相情報を示す正負符号を無視して取り扱う特徴べクトルを、人間の聴覚心理特性を考慮した各周波数における相対的な聴覚心理量のテーブルを格納する聴覚心理重みべクトルテーブル 3 2 0 0 1 0 3 を用いて重み付けして選択することにより、上記実施の形態 1 0のように単に低域から所定個数の特徴べクトルを選択するものに比べて、より体感的に音質の優れた量子化を行うことができる。

さらに、入力ベクトルを平滑化テーブル 3 3 0 0 1 0 4 , 平滑化部 3 3 0 0 1 0 5 を用いて平滑化するようにしたから、オーディオコード選択部 2 9 0 0 1 0 2 で検索を行う際に参照される、送信側コードブック 3 3 0 0 3 1 に記憶しておくコードブックの周波数毎の情報量を全体的に少ないものとすることができる。

実施の形態 1 4 .

以下、本発明の実施の形態 1 4 によるオーディオ信号符号化装について、図面を参照しながら説明する。図 3 5 は本発明の実施の形態 1 4 におけるオーディオ信号符号化装匿の構成を示す図であり、図において、 3 5 0 0 1 0 6 はソート部であり、聴覚心理重みべクトルテーブル 3 2 0 0 1 0 3 の出力と平滑べクトルテーブル 3 3 0 0 1 0 4 の出力とを受け、算出されたべクトルのうちのもっとも大きな要素を複数個選択してこれを出力する。以下、その動作について説明する。本実施の形態 1 4 と上記実施の形態 1 3の構成上の違いは、ソート部 3 5 0 0 1 0 6が付加されたことと、オーディオコード選択部 2 9 0 0 1 0 2のコ一ドインデックスを選択して出力する方法が違う点にある。

すなわち、ソート部 3 5 0 0 1 0 6では、聴覚心理重みべクトルテ一ブル 3 2 0 0 1 0 3 と平滑べクトルテーブル 3 3 0 0 1 0 4の出力とを入力とし、例えば、べクトル WFの j 番目の要素を WF j と定義すると、以下の式（ 2 8 ) で示される。

ゾ ( ゾ * ゾ）（ 2 8 ) そして、このソ一ト部 3 5 0 0 1 0 6では、べクトル WFの各要素 W F j の中から最も大きな R個の要素を算出し、その R個の要素番号をソート部 3 5 0 0 1 0 6の出力とする。オーディオコード選択部 2 9 0 0 1 0 2では、上記各実施の形態と同様、距離 Diを算出する。距離 Diは、例えば、次の式（ 2 9 ) で示される。

( 2 9 )

Wj*Fj* {abs{Cij) - abs{ Xj) at RJ= 1

F U N C W-= =

Wj*Fj*{CiJ-Xj}^P at ここで、 Rj はソート部 3 5 0 0 1 0 6によって、出力された要素番号であるなら Rjは 1であり、出力された要素番号でないなら Rjは 0 とする。 Nは送信側コードブック 3 3 0 0 3 1 中の全コードの個数であり、 Cij はコードインデックス i における j 番目の要素の値である。 M は本実施例の場合、 1 9以下の数、例えば、 1などである。 P は距離計算におけるノルムであり、例えば、 2などである。 Wjは、聴覚心理重みべクトルテーブル 3 2 0 0 1 0 3の i 番目の要素である。また、 abs( ) は絶対値演算を意味する。位相情報抽出部 2 9 0 0 1 0 7では、最小の Di を与えるコードインデックス I と M個の位相情報 Ph(j) j = Oto Rを出力する。位相情報 Ph(j) は、式（ 3 0 ) で定義される。

ただし、 Ph(j) は、ソート部 3 5 0 0 1 0 6で出力された要素番号に対応するもののみについて計算される。本例では（R + 1 ) 個である。本実施の形態 1 4の構成を用いる場合には、このインデックスを復号化する場合にも、ソート部 3 5 0 0 1 0 6 を備えた構成とする必要がある。

このように本実施の形態 1 4 によれば、上記実施の形態 1 3 において、平滑べクトルテーブル 3 3 0 0 1 0 4 の出力と聴覚心理重みべクトルテ —ブル 3 2 0 0 1 0 3の出力とを受け、これらの出力結果から、べクトルのうちのもっとも大きな要素、すなわち、重み絶対値の大きな要素を複数個選択してこれをオーディオコード選択部 2 9 0 0 1 0 2 に出力するようにしたので、人間の聴党特性にとって意味の大きな要素と、物理的に重要な要素とを両方加味してコ一ドインデックスを算出すること力でき、より品質の高いオーディオ信号符号化化を行うことができる。

なお、本実施の形態 1 4 では、平滑べクトル 3 3 0 0 1 0 4 と聰党心理重みべクトル 3 2 0 0 1 0 3 の両者を考慮した重みの絶対値の大きいものから要素を選択する個数を R個としたが、これは、上記実施の形態 1 0 〜 1 3 で使用した Mと同じ数値であってもかまわない。

実施の形態 1 5 .

以下、本発明の実施の形態 1 5 によるオーディオ信号復号化装 Sについて、図面を参照しながら説明する。図 3 6 は本発明の実施の形態 1 5 におけるオーディオ信号復号化装置の構成を示す図であり、図 3 6 において、 3 6 0 0 2 1 は復号化部であり、受信側コードブック 3 6 0 0 6 1 とコード復号部 3 6 0 0 5 1 とから構成され、さらにコード復号化部 3 6 0 0 5 1 は、オーディオコード選択部 2 9 0 0 1 0 2 と位相情報抽出部 2 9 0 0 1 0 7 とから構成されたものとなっている。

以下、その動作について説明する。本実施の形態 1 5では、コードィンデックスを受信してデコードする際に、上記実施の形態 1 0〜 1 4 に示した符号化方式を応用したものであり、すなわち、オーディオコード選択部 2 9 0 0 1 0 2では、例えば、受信した 1 0 b i t のコードインデックスのうち人間の聴党的に重要度の高い低域側から 2 b i t 分の要素を除く、残り 8 b i t 分の要素について、受信側コードブック 3 6 0 0 6 1 に記憶されたコードとの比較検索を行い、上記除外した 2 b i t 分の要素の位相情報については、これを位相情報抽出部 2 9 0 0 1 0 7 を用いて抽出し、上記検索結果に対してこれを付加することで、オーディォ特徴べクトルを再生する、すなわち逆量子化を行う。

このようにすることで、上記受信側コードブックとしては、 8 b i t 分の要素に対応する 2 5 6個のコードを格納すればよく、受信側コードブック 3 6 0 0 6 1 に格納するデータ量を少ないものとすることができ，また、オーディオコード選択部 2 9 0 0 1 0 2での演算は 2 5 6 回のコード検索と、検索結果に対して 2符号を付加する処理となり、大幅に演算量を削減することができる。

なお、本実施の形態 1 5では、実施の形態 1 0 の構成を受信側の構成に応用したものを示したが、実施の形態 2〜 5に示した構成のものを応用することも可能であり、また、受信側に単独で用いるのではなく、上記実施の形態 1 0ないし 1 4のいずれかの実施の形態と組み合わせて用いることにより、オーディオ信号の圧縮、展開をスムーズに行うことができるオーディオデータ送受信システムを構築することができる。産業上の利用可能性

以上のように、本発明の請求項 1 にかかるオーディオ信号符号化方法によれば、入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する初段のべクトル量子化処理と，前段のべクトル量子化器処理の量子化誤差成分をべクトル量子化する 2段目以降のべクトル量子化処理と，を有する多段量子化手法を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、上記多段量子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聰党的な性質である聴觉感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いて、べクトル量子化を行なうようにしたから、人間の聴覚的な性質を利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 2 にかかるオーディオ信号符号化方法によれば、入力オーディオ信号を周波数変換して得られた周波数特性信号系列を、べクトル量子化する第 1 のべクトル量子化処理と，第 1 のべクトル量子化処理での量子化誤差成分をべクトル量子化する第 2のべクトル量子化処理と，を有する多段量子化手法を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、入力オーディオ信号のスペクトルと人間の聴覚的な性質である聴覚感度特性とに基づいて、上記第 1 のべクトル量子化処理での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数ブロックを選択し、上記第 2 のべクトル量子化処理で、上記選択された周波数プロックについて上記第 1 の量子化処理の s子化誤差成分の量子化を行なうようにしたから、人間の聴党的な性質を利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 3 にかかるオーディオ信号符号化方法によれば、入力オーディオ信号を周波数変換して得られた周波数特性信号系列を、ぺクトル量子化する初段のべクトル量子化処理と ' 前段のべクトル量子化処理での量子化誤差成分をべクトル量子化する 2段目以降のべクトル量子化処理と，を有する多段量子化手法を用いてベクトル量子化し、惰報量の符号化をするオーディオ信号符号化方法であって、上記多段量子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聴党的な性質である聴覚感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いてベクトル量子化を行ない、かつ、入力オーディオ信号のスペクトルと人間の聴党的な性質である聴覚感度特性とに基づいて、上記初段のべクトル量子化処理での量子化誤差成分の周波数ブロックのうち量子化する重要度の高い周波数ブロックを選択し、上記 2段目のべクトル量子化処理で、上記選択された周波数ブロックについて上記初段の量子化処理の量子化誤差成分の量子化を行なうようにしたから、人間の聴覚的な性質を利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 4 にかかるオーディオ信号符号化装置によれば、入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、上記入力されたオーディオ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、上記時間周波数変換部で得られた周波数領域信号を上記スぺクトル包絡算出部で得られたスぺクトル包絡で正規化し残差信号を得る正規化部と、上記残差信号をパワーにより正規化するパワー正規化部と、上記入力されたオーディオ信号のスぺクトルと人間の聴覚的な性質である聴覚感度特性とに基づき周波数上の重み付け係数を算出する聴覚重み付け計算部と、上記パワー正規化部により正規化された上記残差信号が入力される、縦列に接続された複数段のべクトル量子化部を有し、そのうちの少なくとも 1 つのべクトル量子化部が上記重み付け部で得られた重み付け係数を用いて量子化を行なう多段量子化部とを備えた構成としたから、人間の聴覚的な性質を利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 5にかかるオーディオ信号符号化装 gによれば、上記請求項 4記載の発明において、上記多段量子化部の上記複数段のうちの複数の量子化部が、上記重み付け計算部で得られた重み付け係数を用いて量子化を行なうものとし、かつ、上記聴覚重み付け部が、上記複数の量子化部のそれぞれが用いる個別の重み付け係数を算出するものとしたから、人間の聴覚的な性質をより有効に利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 6 にかかるオーディオ信号符号化装置によれば、上記請求項 5記載の発明において、上記多段量子化部が、上記スぺクトル包絡算出部で得られたスペクトル包絡を各周波数領域での重み付け係数として上記パワー正規化部で正規化された上記残差信号の量子化を行なう第 1段の量子化部と、上記スぺクトル包絡と上記第 1段の量子化部の量子化誤差信号との相関に基づいて算出された重み付け係数を各周波数領域での重み付け係数として上記第 1 段の量子化部の量子化誤差信号の量子化を行なう第 2段の童子化部と、上記聴党重み付け計算部において、時間周波数変換部で周波数領域信号に変換された入力信号と聴党特性とにより算出された重み付けを、上記スぺクトル包絡，上記第 2段の量子化部の量子化誤差信号，および上記パワー正規化部で正規化された上記残差信号に基づいて調整して求めた重み付け係数を、各周波数領域での重み付け係数として上記第 2段の量子化部の量子化誤差信号の量子化を行なう第 3段の量子化部とを備えた構成としたから、人間の聴覚的な性質を有効に利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 7にかかるオーディオ信号符号化装置によれば、入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、上記入力されたオーディオ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、上記時間周波数変換部で得られた周波数領域信号を上記スぺクトル包絡算出部で得られたスぺクトル包絡で正規化し残差信号を得る正規化部と、上記残差信号をパワーにより正規化するパワー正規化部と、該パワー正規化部で正規化された残差信号の量子化を行なう第 1 のべクトル量子化器と、入力オーディオ信号のスぺクトルと人間の聴覚的な性質である聴覚感度特性とに基づき、上記第 1 のべクトル量子化器での量子化誤差成分の周波数プロックのうち！:子化する重要度の高い周波数ブロックを選択する聴覚的選択手段と、該聴宽的選択手段で選択された周波数プロックについて上記第 1 のべクトル量子化器の量子化誤差成分の量子化を行なう第 2の量子化器とを備えた構成としたから、人間の聴党的な性質を有効に利用して効率の良い量子化を行なうことができる効果がある。

また、本発明の請求項 8にかかるオーディオ信号符号化装置によれば、上記請求項 7記載の発明において、上記聴党的選択手段が、上記聴党的選択手段が、上記第 1 のベクトル量子化器の量子化誤差成分，上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択する構成としたから、人間の聴党的な性質を有効に利用して効率の良い量子化を行なうことができ、かつ第 1 のべクトル量子化器での量子化が良好である部分が再度量子化されて逆に誤差が生じてしまうことを防止でき、高品質を保持した量子化を行なうことができる効果がある。

また、本発明の請求項 9 にかかるオーディオ信号符号化装置によれば、請求項 7記載の発明において、上記聴党的選択手段が、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブ π ックを選択する構成としたから、人間の聴党的な性質を有効に利用して効率の良い量子化を行なうことができ、かつ量子に必要なコ一ドを少なくでき、圧縮率を向上できる効果がある。

また、本発明の請求項 1 0 にかかるオーディオ信号符号化装置によれば、上記請求項 7記載の発明において、上記聴党的選択手段が、上記第 1 のべクトル量子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号と、最小可聴限特性と入力信号から計算されたマスキング特性とを加算した特性の逆特性とを乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択する構成としたから、人間の聴覚的な性質を有効に利用して効率の良い量子化を行なうことができ、かつ第 1 のべクトル量子化器での量子化が良好である部分が再度量子化されて逆に誤差が生じてしまうことを防止でき、髙品質を保持した量子化を行なうことができる効果がある。

また、本発明の請求項 1 1 にかかるオーディオ信号符号化装置によれば、請求項 7記載の発明において、上記聴党的選択手段が、上記第 1 のべクトル量子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号と、最小可聴限特性と，入力信号から計算されたマスキング特性に上記パワー正規化部で正規化された残差信号，上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び上記第 1 段の量子化部の量子化誤差信号に基づいて補正をかけた特性と，を加算した特性の逆特性とを乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択する構成としたから、人間の聴党的な性質を有効に利用して効率の良い量子化を行なうことができ、かつ第 1 のべクトル量子化器での量子化が良好である部分が再度量子化されて逆に誤差が生じてしまうことを防止でき、高品質を保持した量子化を行なうことができる効果がある。

また、本発明の請求項 1 2 ないし 3 8 にかかるオーディオ信号符号化装置および復号化装によれば、量子化にはべクトル量子化の手法を用いるなどして高い情報圧縮率においても量子化可能な構成を有するとともに、量子化時の情報量の配分を、再生帯域の拡張に寄与する情報と品質向上に寄与する情報の両者を交互に配分していくという構成を採用し、まず符号化装置においては、第 1段階として、入力のオーディオ信号を周波数領域の信号に変換し、変換された周波数信号の一部を符号化する，第 2段階では、符号化されていない周波数信号の一部と、第 1段階の符号化誤差信号の符号化し、第 1 段階の符号に付加する，第 3段階では、さらに符号化されていない周波数信号の一部と、第 1 段階および第 2段階の符号化誤差信号の符号化を行い第 1 段階、第 2段階の符号に付加する，同様にさらに段階を重ね符号化を行い、一方、復号化装置では、第 1 段階の符号化された符号のみを用いて復号を行うことも、第 1 段階と第 2段階の復号化された符号を用いて復号を行うことも、第 1 段階から第 1 以上の段階の復号化された符号を用いて復号し、復号化の順は、带域拡張に寄与するものと、品質向上に寄与するものを交互に復号する構成としたので、固定された情報量で符号化、及び復号化を行なわなくとも、良好な音質を得ることができ、また、高い圧縮率にて高品質な音を得ることができるようになる。

また、本発明の請求項 3 9に係るオーディオ信号符号化装置によれば、入力オーディオ信号を周波数変換して得られた周波数特性 ί言号系列を入力信号とし、該周波数特性信号系列のうちの所定の周波数帯域に属するものの位相情報を抽出する位相情報抽出部と、上記周波数特性信号系列の代表値であるオーディオコ一ドを、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコードブックと、上記周波数特性信号系列と上記コードブック中の各オーディォコードとの聴党的な距離を算出して、その最小距離を有するオーディォコードを選出するとともに、該最小距離を有するオーディオコードに対する位相情報を上記位相惰報抽出部からの出力を補助情報として用いて付加し、該最小距離を有するオーディオコ一ドに対応するコ一ドインデックスをその出力信号として出力するオーディオコード選択部とを備えたので、体感的な音質の劣化を招くことなく、オーディオコード選択部における計算量を削滅でき、また、コードブックに記憶すべきコード数をも削滅することができる効果がある。

また、本発明の請求項 4 1 に係るオーディオ信号量子化装置によれば、上記請求項 3 9記載のオーディオ信号量子化装置において、人間の聴覚心理特性を考慮した各周波数における相対的な聴覚心理量のテーブルである聴覚心理重みべクトルテーブルを備え、上記位相情報抽出部は、入力された周波数特性信号系列のうち、上記聴覚心理重みべクトルテープルに格納されたべクトルと一致する要素の位相情報を抽出するしたので、より体感的に音質の優れた量子化を行うことができる効果がある。

また、本発明の請求項 4 2 に係るオーディオ信号量子化装 gによれば、上記請求項 3 9記載のオーディオ信号量子化装置において、上記周波数特性信号系列を平滑べクトルを用いてべクトル要素同士の除算により平滑化する平滑化部を備え、上記オーディオコード選択部を、上記最小距離を有するオーディオコードを選出し、該選出されたオーディオコードに位相情報を付加する前に、上記平滑化部から出力される平滑化処理情報を用いて、上記選出されたオーディオコードを、平滑化処理のなされていないオーディオコードに変換し、該オーディオコードに対応するコ ― ドインデックスをその出力信号として出力するするようにしたので、オーディオコ一ド選択部で検索を行う際に参照される、コードブックに記憶しておくコードブックの周波数毎の情報量を全体的に少ないものとすることができる効果がある。

また、本発明の請求項 4 3 に係るオーディオ信号量子化装置によれば、上記請求項 3 9記載のオーディオ信号量子化装置において、人間の聴党心理特性を考慮した各周波数における相対的な聴党心理量のテーブルである聴觉心理重みべクトルテーブルと、上記周波数特性信号系列を平滑べクトルを用いて、べクトル要素同士の除算により平滑化する平滑化部と、上記聴覚心理重みべクトルテーブルの値と上記平滑べクトルテープルの値とを乗じて得られる値を聴覚的重要度の高い順に複数個選出してこれを上記オーディオコ一ド選択部に出力するソート部とを備えたとしたので、人間の聴覚特性にとって意味の大きな要素と、物理的に重要な要素とを両方加味してコ一ドインデックスを算出することができ、より品質の高いオーディオ信号圧縮化を行うことができるという効果がある。

また、本発明の請求項 4 7 に係るオーディオ信号逆量子化装置によれば、オーディオ信号の特徴量である周波数特性信号系列を量子化して得られたコードインデックスを入力信号とし、該コードインデックスのうちの所定の周波数帯域に相当する要素の位相情報を抽出する位相情報抽出部と、上記コードインデックスに対応する周波数特性信号系列を、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコードブックと、上記コードインデックスと上記コードブック中の周波数特性信号系列との聴覚的な距離を算出して、その最小距離を有する周波数特性信号系列を選出するとともに、該最小距離を有する周波数特性信号系列に対する位相情報を上記位相情報抽出部からの出力を補助情報として用いて付加し、上記入力信号であるコードインデックスに対応する周波数特性信号系列をその出力信号として出力するオーディオコード選択部とを備えたので、受信側で用いるコ一ドブックに格納するデータ量を少ないものとすることができ、また、受信側での演算量を大幅に削減することができるできる効果がある。

Claims

請求の範囲

1 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する初段のべクトル量子化処理と，前段のべクトル量子化処理での £子化誤差成分をべクトル量子化する 2段目以降のべクトル量子化処理と，を有する多段量子化手法を用いてベクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、

上記多段量子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聴觉的な性質である聴党感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いて、ベタトル量子化を行なうことを特徴とするオーディオ信号符号化方法。

2 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する第 1 のべクトル量子化処理と，第 1 のべクトル量子化処理での量子化誤差成分をべクトル量子化する第 2のべクトル量子化処理と，を有する多段量子化手法を用いてべクトル量子化し、倌報量の符号化をするオーディオ信号符号化方法であって、

入力オーディオ信号のスペクトルと人間の聴党的な性質である聴覚感度特性とに基づいて、上記第 1 のべクトル量子化処理での量子化誤差成分の周波数ブロックのうち量子化する重要度の高い周波数ブロックを選択し、上記第 2のべクトル量子化処理では、上記選択された周波数ブロックについて上記第 1 の量子化器の量子化誤差成分の量子化を行なうことを特徴とするオーディオ信号符号化方法。

3 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル； t子化する初段のべクトル量子化処理と，前段のべクトル量子化処理での量子化誤差成分をべクトル量子化する 2段目以降のベタトル量子化処理と，を有する多段量子化手法を用いてベクトル量子化し、情報量の符号化をするオーディオ信号符号化方法であって、

上記多段量子化手法による複数段の量子化処理のうちの少なくとも 1 つのべクトル量子化処理では、入力オーディオ信号のスぺクトルと人間の聴覚的な性質である聴覚感度特性とに基づいて算出された周波数上の重み付け係数を量子化の重み付け係数として用いてべクトル量子化を行ない、

かつ、入力オーディオ信号のスぺクトルと人間の聴覚的な性質である聴党感度特性とに基づいて、上記初段のべクトル量子化処理での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数プロックを選択し、上記 2段目のべクトル量子化処理で、上記選択された周波数ブロックについて上記初段の量子化処理の量子化誤差成分の量子化を行なうことを特徴とするオーディオ信号符号化方法。

- 入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、

上記入力されたオーディオ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、

上記時間周波数変換部で得られた周波数領域信号を上記スペクトル包絡算出部で得られたスペクトル包絡で正規化し残差信号を得る正規化部と、

上記入力されたオーディオ信号のスぺクトルと人間の聴覚的な性質である聴覚感度特性とに基づき周波数上の重み付け係数を算出する聴覚重み付け計算部と、

上記正規化された上記残差信号が入力される、縦列に接続された複数段のべクトル量子化部を有し、そのうちの少なくとも 1 つのべクトル量子化部が上記重み付け部で得られた重み付け係数を用いて量子化を行なう多段量子化部とを備えたことを特徴とするオーディオ信号符号化装置。

5 . 請求項 4記載のオーディオ信号符号化装置において、上記多段量子化部の上記複数段のうちの複数の量子化部が上記重み付け部で得られた重み付け係数を用いて量子化を行なうものであり、かつ、上記聴党重み付け計算部は、上記複数の量子化部のそれぞれが用いる個別の重み付け係数を算出するものであることを特徴とするオーディォ信号符号化装置。

6 . 請求項 5記載のオーディオ信号符号化装置において、

上記多段量子化部は、

上記スぺクトル包絡算出部で得られたスぺクトル包絡を各周波数領域での重み付け係数として上記正規化部で正規化された上記残差信号の量子化を行なう第 1 段の量子化部と、

上記スぺクトル包絡と上記第 1 段の量子化都の量子化誤差信号との相関に基づいて算出された重み付け係数を各周波数領域での重み付け係数として上記第 1 段の量子化部の！:子化誤差信号の量子化を行なう第 2 段の量子化部と、

上記聴覚重み付け計算部において、時間周波数変換部で周波数領域信号に変換された入力信号と聴覚特性とにより算出された重み付けを、上記スペクトル包絡，上記第 2段の量子化部の量子化誤差信号，および上記正規化部で正規化された上記残差信号に基づいて調整して求めた重み付け係数を、各周波数領域での重み付け係数として上記第 2段の量子化部の量子化誤差信号の量子化を行なう第 3段の量子化部とを備えたことを特徴とするオーディオ信号符号化装置。

7 . 入力されたオーディオ信号を周波数領域信号に変換する時間周波数変換部と、

上記入力されたオーディォ信号のスぺクトル包絡を算出するスぺクトル包絡算出部と、

上記時間周波数変換部で得られた周波数領域信号を上記スペクトル包絡算出部で得られたスぺクトル包絡で正規化し残差信号を得る正規化部と、

該正規化部で正規化された残差信号の量子化を行なう第 1 のべクトル量子化器と、

入力オーディオ信号のスペクトルと人間の聴党的な性質である聴觉感度特性とに基づき、上記第 1 のべクトル量子化器での量子化誤差成分の周波数プロックのうち量子化する重要度の高い周波数プロックを選択する聴覚的選択手段と、

該聴覚的選択手段で選択された周波数プロックについて上記第 1 のベクトル量子化器の量子化誤差成分の量子化を行なう第 2の量子化器とを備えたことを特徴とするオーディオ信号符号化装置。

8 . 請求項 7記載のオーディオ信号符号化装置において、

上記聴党的選択手段は、

上記第 1 のべクトル量子化器の量子化誤差成分，上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものであることを特徴とするオーディオ信号符号化装置。

9 . 請求項 7記載のオーディオ信号符号化装置において、

上記聴覚的選択手段は、

上記スぺクトル包絡算出部で得られたスぺクトル包絡信号，及び最小可聴限特性の逆特性を乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものであることを特徴とするオーディォ信号符号化装置。

1 0 . 請求項 7記載のオーディオ信号符号化装置において、

上記聴覚的選択手段は、

上記第 1 のべクトル量子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスぺクトル包絡信号と、最小可聴限特性と入力信号から計算されたマスキング特性とを加算した特性の逆特性とを乗算した値を、量子化すべき重要度の尺度として用いて、周波数ブロックを選択するものであることを特徴とするオーディオ信号符号化装置。

1 1 . 請求項 7記載のオーディオ信号符号化装匱において、

上記聴覚的選択手段は、

上記第 1 のべクトル量子化器の量子化誤差成分と、上記スぺクトル包絡算出部で得られたスペクトル包絡信号と、最小可聴限特性と，入力信号から計算されたマスキング特性に上記正規化部で正規化された残差信号，上記スペクトル包絡算出部で得られたスペクトル包絡信号，及び上記第 1段の量子化部の量子化誤差信号に基づいて補正をかけた特性と，を加算した特性の逆特性とを乗算した値を、 *子化すべき重要度の尺度として用いて、周波数ブロックを選択するものであることを特徴とするオーディオ信号符号化装置。

1 2 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列をべクトル量子化する第 1 のべクトル量子化器と，第 1 のべクトル量子化器での量子化誤差成分をべクトル量子化する第 2のべクトル量子化器と，を有する多段量子化手段を用いてべクトル量子化し、情報量の符号化をするオーディオ信号符号化装置であって、

上記多段量子化手段は、上記周波数特性信号系列に対して、少なくとも 2つ以上の周波数帯域に分割した带域に相当する係数列に分けたものとするとともに、上記べクトル量子化器をそれぞれの係数列に対応して準備された複数の分割化ベクトル量子化器によって独立に i子化するものであることを特徴とするオーディオ信号符号化装置。

1 3 . 請求項 1 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列を正規化する正規化手段を備えたことを特徴とするオーディオ信号符号化装置。

1 4 . 請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段は、量子化する周波数特性信号系列の周波数帯域を、量子化誤差のエネルギー加算和の大きい帯域を適宜選択して量子化することを特徴とするオーディオ信号符号化装置。

1 5 . 請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段は、量子化する周波数特性信号系列の周波数带域を、人間の聴覚的な性質である聴覚感度特性に基づいて、その重要度の高い蒂域に大きな値を重み付けた量子化誤差エネルギー加算和の大きな帯域を適宜選択して量子化を行うことを特徴とするオーディオ信号符号化装置。

1 6 . 請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段は、量子化する周波数特性信号系列の周波数帯域を、少なくとも 1度はすべて量子化する全帯域量子化部となるべクトル量子化器を有することを特徴とするオーディオ信号符号化装置。

1 7 . 請求項 1 2記載のオーディオ信号符号化装 Sにおいて、上記量子化手段は、前段のべクトル量子化器がコードブックを用いるべクトル量子化手法を用いてべクトル量子化における量子化誤差を算出し、該算出した量子化誤差に対して後段の量子化部がさらにべクトル量子化を行うよう構成されていることを特徴とするオーディオ信号符号化装置。

1 8 . 請求項 1 7記載のオーディオ信号符号化装置において、上記べク卜ル量子化手法として、ベタトルの符号が全てもしくはその —部が反転したコードべクトルをコード検索時に用いることを特徴とするオーディオ信号符号化装 s。

1 9 . 請求項 1 7記載のオーディオ信号符号化装置において、周波数特性信号系列を正規化する正規化手段をさらに備え、べクトル量子化における最適なコードを検索する際に用いる距離の計算に、上記正規化手段により処理された入力信号の正規化成分を重みとして距離を計算して最小距離を与えるコードを抽出することを特徴とするオーディォ信号符号化装置。

2 0 . 請求項 1 9記載のオーディオ信号符号化装置において、上記正規化手段により処理された周波数特性信号系列の正規化成分と人間の聴觉的な性質である聴党感度特性を考慮した値の両者を重みとして距離を算出して、最小距離を与えるコードを抽出することを特徴とするオーディォ信母符号化装置。

2 1 . 請求項 1 3記載のオーディオ信号符号化装置において、上記正規化手段は、周波数特性信号系列の概形を大まかに正規化する周波数概形正規化部を備えたものであることを特徴とするオーディオ信号符号化装置。

2 2 . 請求項 1 3記載のオーディオ信号符号化装置において、上記正規化手段は、周波数特性信号系列を複数の連続した単位帯域の成分に分け、それぞれの単位帯域を 1 つの値で除算することにより正規化する寄域振幅規化部を備えたものであることを特徴とするオーディオ信号符号化装置。

2 3 . 請求項 1 2記載のオーディオ信号符号化装置において、上記量子化手段は、周波数特性信号系列をそれぞれの係数列を分割化べクトル量子化器によって独立に量子化するべクトル量子化器を有するとともに、量子化する入力信号の周波数带域を、少なくとも 1 度はすべて量子化する全帯域量子化部となるべクトル量子化器とを備えていることを特徴とするオーディオ信号符号化装置。

2 4 . 請求項 2 3記載のオーディオ信号符号化装において、上記量子化手段は、低域の分割化べクトル量子化器と、中域の分割化べクトル量子化器と、髙域の分割化べクトル量子化器とからなる第 1 のべクトル量子化器と、これの後段に接続される第 2のべクトル量子化器と、該第 2 のべクトル量子化器の後段に接続される第 3 のべクトル量子化器とを備え、該量子化手段に入力された周波数特性信号系列を 3つの帯域に分割し、該 3つの帯域のうちの低い帯域成分の周波数特性信号系列を上記低域の分割化べクトル量子化器で量子化し、 3つの帯域のうちの中間の帯域成分の周波数特性信号系列を上記中域の分割化ベクトル量子化器で量子化し、 3つの帯域のうちの高い苻域成分の周波数特性信号系列を上記高域の分割化ベクトル量子化器でそれぞれ独立に量子化を行い、上記第 1 のべクトル量子化器を構成するそれぞれの分割化べクトル量子化器で周波数特性信号系列に対する量子化誤差を算出して、これを後段の上記第 2のべクトル量子化器への入力とし、

上記第 2 のべクトル量子化器では、該第 2のべクトル量子化器の量子化する帯域幅分の量子化を行い、該第 2のべクトル量子化器への入力に対する量子化誤差を算出してこれを上記第 3のベクトル量子化器への入力とし、

上記第 3 のべクトル量子化器では、該第 3 のべクトル量子化器の量子化する帯域幅の量子化を行うことを特徴とするオーディオ信号符号化装置。

2 5 . 請求項 2 4記載のオーディオ信号符号化装置において、上記量子化手段を構成する第 1 のべクトル量子化器と第 2のべクトル量子化器との間に第 1 の量子化帯域選択部を設けるとともに、上記第 2のべクトル量子化器と上記第 3のべクトル量子化器との間に第 2の量子化帯域選択部を設け、

上記第 1 のべクトル量子化器の出力を上記第 1 の量子化帯域選択部への入力とし、該第 1 の量子化帯域選択部で上記第 2のべクトル量子化器が量子化すべき帯域を選択し、

上記第 2 のべクトル量子化器では、上記第 1 の量子化帯域選択部が決定した上記第 1 の 3 つのべクトル量子化器の量子化誤差に対して、上記第 2のべクトル量子化器の量子化する帯域幅分の量子化を行い、上記第 2のベクトル量子化器への入力に対する量子化誤差を算出してこれを上記第 2の量子化帯域選択部への入力とし、

上記第 2の量子化帯域選択部では、上記第 3 のべクトル量子化器が量子化すべき帯域を選択し、

上記第 3 のべクトル量子化器では、上記第 2 の量子化帯域選択部が決定した帯域に対して量子化を行うことを特徴とするオーディオ信号符号化装置。

2 6 - 請求項 2 4記載のオーディオ信号符号化装置において、

上記第 1 のべクトル量子化器に代えて、上記低域の分割化べクトル量子化器と、中域の分割化ベクトル量子化器と、高域の分割化ベクトル量子化器を用いて上記第 2のべクトル量子化器、または第 3 のべクトル量子化器を構成することを特徴とするオーディオ信号符号化装置。

2 7 . 請求項 1 2記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元の入力オーディオ信号に相当する信号を出力するオーディオ信号復号化装置であって、

上記オーディオ信号符号化装置の量子化手段が出力した符号の少なくとも一部を用いて逆量子化を行う逆量子化部と、

該逆量子化部の出力である周波数特性信号系列を用いて、周波数特性信号系列を元のオーディオ入力信号に相当する信号に変換する逆周波数変換部とを備えたことを特徴とするオーディオ信号復号化装置。

2 8 . 請求項 1 3記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元の入力オーディオ信号に相当する信号を出力するオーディオ信号復号化装置であって、

周波数特性信号系列を再生する逆量子化部と、

該逆量子化部の出力である周波数特性信号系列を用いて、上記オーディォ信号符号化装置の出力である符号をもとに正規化成分を再生し、上記周波数特性信号系列と正規化成分とを乗算して出力する逆正規化部と、該逆正規化部の出力を受けて、周波数特性信号系列を元のオーディオ信号に相当する信号に変換する逆周波数変換部とを備えたことを特徵とするオーディオ信号復号化装置。

2 9 . 請求項 2 3記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元のオーディオ ί言号に相当する信号を出力するオーディオ信号復号化装置であって、

上記オーディオ信号符号化装置における量子化手段を搆成するべクトル量子化器のすべて、もしくは一部が符号を出力した場合であっても、出力された符号を用いて逆量子化を行う逆量子化部を備えたことを特徴とするオーディオ信号復号化装置。

3 0 . 請求項 2 9記載のオーディオ信号復号化装置において、

上記逆量子化部は、所定の帯域の量子化符号の逆量子化に対して、次段の量子化符号の逆量子化と上記所定の帯域とは異なる帯域の量子化符号の逆量子化とを交互に実行するものであり、

上記逆量子化時に次段の量子化符号が存在しない場合には、上記異なる帯域の量子化符号の逆量子化を続けて実行し、

上記異なる帯域の量子化符号が存在しない場合には上記次段の量子化符号の逆量子化を続けて実行するものであることを特徴とするオーディォ信号復号化装置。

3 1 . 請求項 2 4記載のオーディオ信号符号化装置からの出力である符号をその入力として、これを復号化して元のオーディォ信号に相当する信号を出力するオーディオ信号復号化装置であって、

上記オーディオ信号符号化装置における第 1 のベクトル量子化器を構成する 3つの分割化べクトル量子化器からすべて、もしくは一部が符号を出力した場合であっても、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号のみを用いて逆量子化を行う逆量子化都を備えたことを特徴とするオーディオ信号復号化装置。

3 2 . 請求項 3 1記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号に加えて、上記第 2のべクトル量子化器からの符号を用いて逆量子化を行うことを特徴とするオーディオ信号復号化装置。

3 3 . 請求項 3 2記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化部を構成する低域の分割化べクトル量子化器からの符号と、上記第 2のべクトル量子化器からの符号に加えて、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号を用いて逆量子化を行うことを特徴とするオーディォ信号復号化装置。

3 4 . 請求項 3 3記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のべクトル量子化器を構成する低域の分割化べクトル量子化器からの符号と、上記第 2のべクトル量子化器からの符号と、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号とに加えて、上記第 3 のべクトル量子化器からの符号を用いて逆量子化を行うことを特徴とするオーディオ信号復号化装置。

3 5 . 請求項 3 4記載のオーディオ信号復号化装置において、上記逆量子化部が、上記第 1 のベクトル量子化器を構成する低域の分割化べクトル量子化器からの符号と、上記第 2のべクトル量子化器からの符号と、上記第 1 のべクトル量子化器を構成する中域の分割化べクトル量子化器からの符号と、上記第 3のべクトル量子化器からの符号に加えて、上記第 1 のべクトル量子化器を構成する高域の分割化べクトル量子化器からの符号とを用いて逆量子化を行うことを特徴とするオーディオ信号復号化装置。

3 6 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列を受け、これを符号化して出力し、該出力された符号信号を入力として、これを復号化して元の入力オーディオ信号に相当する信号を再生するオーディオ信号符号化 · 復号化方法において、

周波数特性信号系列に対して、少なくとも 2つ以上の周波数帯域に分割した帯域に相当する係数列に分けてそれぞれ独立に量子化して出力し、受信した量子化済みの信号から、上記分割された帯域に相当する任意の蒂域のデータを逆量子化することにより、元のオーディオ入力信号に相当する信号を再生することを特徴とするオーディオ信号符号化 · 復号化方法。

3 7 . 請求項 3 6記載のオーディオ信号符号化 · 復号化方法において、上記量子化は、算出された量子化誤差をさらに量子化するよう段階的に行われ、

上記逆量子化は、帯域を拡張する方向の量子化と、上記量子化時の惫子化段階を深くなる方向の量子化とを操り返して交互に行うものであることを特徴とするオーディオ信号符号化 · 復号化方法。

3 8 . 請求項 3 7記載のオーディオ信号符号化 · 復号化方法において、上記帯域を拡張する方向の逆量子化は、人間の聴覚心理特性を考慮した順にて行うことを特徴とするオーディオ信号符号化 · 復号化方法。 3 9 . 入力オーディオ信号を周波数変換して得られた周波数特性信号系列を入力信号とし、該周波数特性信号系列のうちの所定の周波数帯域に属するものの位相情報を抽出する位相情報抽出部と、

上記周波数特性信号系列の代表値であるオーディオコードを、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコードブックと、

上記周波数特性信号系列と上記コードブック中の各オーディオコ一ドとの聴党的な距雕を算出して、その最小距離を有するオーディオコ一ドを選出するとともに、該最小距離を有するオーディオコードに対する位相情報を上記位相情報抽出部からの出力を補助情報として用いて付加し、該最小距雕を有するオーディオコードに対応するコ一ドインデックスをその出力信号として出力するオーディオコ一ド選択部とを備えたことを特徴とするオーディオ信号符号化装置。

4 0 . 請求項 3 9記載のオーディオ信号符号化装置において、上記位相情報抽出部は、入力された周波数特性信号系列のうちの低周波帯域側のものからなり所定個数の要素の位相情報を抽出するものであることを特徴とするオーディオ信号符号化装置。

4 1 . 請求項 3 9記載のオーディオ信号符号化装置において、人間の聴党心理特性を考慮した各周波数における相対的な聰党心理量のテーブルである聴党心理重みベクトルテーブルを備え、

上記位相情報抽出部は、入力された周波数特性信号系列のうち、上記聴覚心理重みべクトルテーブルに格納されたべクトルと一致する要素の位相情報を抽出するものであることを特徴とするオーディオ信号符号化装置。

4 2 . 請求項 3 9記載のオーディオ信号符号化装置において、上記周波数特性信号系列を平滑べクトルを用いてべクトル要素同士の除算により平滑化する平滑化部を備え、

上記オーディオコード選択部は、上記最小距離を有するオーディオコ — ドを選出し、該選出されたオーディオコードに位相情報を付加する前に、上記平滑化部から出力される平滑化処理情報を用いて、上記選出されたオーディオコードを、平滑化処理のなされていないオーディオコードに変換し、該オーディオコードに対応するコードインデックスをその出力信号として出力することを特徴とするオーディオ信号符号化装置。 4 3 . 請求項 3 9記載のオーディオ信号符号化装置において、人間の聴 ¾心理特性を考慮した各周波数における相対的な聴党心理最のテ一ブルである聴党心理重みべクトルテ一ブルと、上記周波数特性信号系列を平滑べクトルを用いて、べクトル要素同士の除算により平滑化する平滑化部と、

上記聴覚心理重みべクトルテーブルの値と上記平滑べクトルテープルの値とを乗じて得られる値を聴党的重要度の高い順に複数個選出してこれを上記オーディオコード選択部に出力するソート部とを備えたことを特徴とするオーディオ信号符号化装置。

4 4 . 請求項 4 0記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装 g。

4 5 . 請求項 4 1 記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装置。

4 6 . 請求項 4 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、上記オーディオ信号を周波数変換した係数を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装置。

4 7 . 請求項 4 0記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、

上記オーディオ信号を M D C T変換（変形離散コサイン変換）した係数を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装置。

4 8 . 請求項 4 1 記載のオーディオ信号符号化装 Sにおいて、上記周波数特性信号系列として、

4 9 . 請求項 4 2記載のオーディオ信号符号化装置において、上記周波数特性信号系列として、

上記オーディオ信号を M D C T変換（変形雕散コサイン変換）した係数を要素とするべクトルを用いることを特徴とするオーディオ信号符号化装置。

5 0 . 請求項 4 2記載のオーディオ信号符号化装置において、上記平滑べクトルとして、

オーディオ信号を線形予測して線形予測係数を算出し、該算出された前記線形予測係数から各周波数における相対的な周波数応答を算出し、該各周波数における相対的な周波数応答を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装 s。

5 1 . 請求項 4 3記載のオーディオ信号符号化装置において、上記平滑べクトルとして、

オーディオ信号を線形予測して線形予測係数を算出し、該算出された前記線形予測係数から各周波数における相対的な周波数応答を算出し、該各周波数における相対的な周波数応答を要素とするベクトルを用いることを特徴とするオーディオ信号符号化装置。

5 2 . オーディオ信号の特徴量である周波数特性信号系列を量子化して得られたコードインデックスを入力信号とし、該コードインデックスのうちの所定の周波数帯域に相当する要素の位相情報を抽出する位相情報抽出部と、

上記コードインデックスに対応する周波数特性信号系列を、上記抽出した位相情報に対応する要素部分を絶対値化した状態のものとして複数個これを格納するコードブックと、

上記コードインデックスと上記コードブック中の周波数特性信号系列との聴觉的な距離を算出して、その最小距離を有する周波数特性信号系列を選出するとともに、該最小距離を有する周波数特性信号系列に対する位相情報を上記位相情報抽出部からの出力を補助情報として用いて付加し、上記入力信号であるコ一ドインデックスに対応する周波数特性信号系列をその出力信号として出力するオーディオコ — ド選択部とを備えたことを特徴とするオーディオ信号復号化装置。