WO2006001159A1

WO2006001159A1 - 信号符号化装置及び方法、並びに信号復号装置及び方法

Info

Publication number: WO2006001159A1
Application number: PCT/JP2005/009939
Authority: WO
Inventors: Shiro Suzuki
Original assignee: Sony Corporation
Priority date: 2004-06-28
Filing date: 2005-05-31
Publication date: 2006-01-05
Also published as: EP3096316A1; KR101143792B1; KR20070029755A; EP3608908A1; EP1768104A1; JP2006011170A; JP4734859B2; EP1768104B1; CN101010727B; EP3096316B1; EP1768104A4; US8015001B2; US20080015855A1; CN101010727A

Abstract

　信号符号化装置（１）において、周波数正規化部（１１）は、スペクトル信号の各スペクトルをそれぞれ正規化係数を用いて正規化し、スペクトル毎の正規化係数インデックスを量子化精度決定部（１３）に供給する。量子化精度決定部（１３）は、正規化され所定のレンジ変換が施されたレンジ変換スペクトル信号のスペクトル毎の正規化係数インデックスに対して聴覚特性を利用した重み係数を加算し、この加算結果に応じて量子化精度を決定する。そして、量子化部（１４）は、量子化精度決定部（１３）から供給された量子化精度インデックスに応じた量子化精度で量子化を行い、符号化・符号列生成部（１５）は、量子化精度決定部（１３）から供給された重み係数を正規化係数インデックスや量子化スペクトル信号とともに符号化する。

Description

信号符号化装置及び方法、並びに信号復号装置及び方法技術分野

[0001] 本発明は、入力されたディジタルオーディオ信号をいわゆる変換符号ィ匕によって符号化し、得られた符号列を出力する信号符号ィ匕装置及びその方法、並びにその符号列を復号して元のオーディオ信号を復元する信号復号装置及びその方法に関する。

本出願は、日本国において 2004年 6月 28日に出願された日本特許出願番号 200 4—190249を基礎として優先権を主張するものであり、この出願は参照することにより、本出願に援用される。

背景技術

[0002] 従来より、音声や音楽等のオーディオ信号の符号ィ匕手法が種々知られているが、その 1つとして、例えば時間領域のオーディオ信号を周波数領域のスペクトル信号に変換 (スペクトル変換)する、いわゆる変換符号ィ匕手法を挙げることができる。

ここで、上述したスペクトル変換としては、例えば入力されたオーディオ信号を所定単位時間（フレーム）毎にブロックィ匕し、当該ブロック毎に離散フーリエ変換 (Discrete Fourier Transformation； DFl j、離散コサイン変換 (Discrete Lysine Transformation ； DCT)、或いは変形離散コサイン変換 (Modified DCT ; MDCT)などを行うことで時間領域のオーディオ信号を周波数領域のスペクトル信号に変換するものがある。また、このスペクトル変換によって生成されたスペクトル信号を符号ィ匕する際には、スペクトル信号をある一定幅の周波数帯域に分割し、周波数帯域毎に正規ィ匕した後に量子化して符号ィ匕する方法がある。周波数帯域分割を行う際の各周波数帯域の幅は、人間の聴覚特性を考慮して決定されることがある。具体的には、スペクトル信号を臨界帯域 (クリティカルバンド)と呼ばれる高域ほど広くなるような帯域分割幅で複数 (例えば 24や 32)の周波数帯域に分割することがある。また、各周波数帯域毎に適応的なビット割り当て (ビットアロケーション)を行って符号ィ匕することもある。ビット割り当て手法としては、例えば文献「IEEE Transactions of Acoustics, Speech, and Si gnal Processing, Vol.ASSP- 25, No.4, August 1977」（以下、文献 1という。 )に記載されて、る手法が挙げられる。

この文献 1では、周波数帯域毎の各周波数成分の大きさを元にビット割り当てを行つている。この手法では、量子化雑音スペクトルが平坦になり、雑音エネルギが最小になるが、聴覚的にはマスキング効果や等感度曲線が考慮されていないため、実際の雑音感は最小ではない。

また、この文献 1では臨界帯域という概念を利用し、高域ほど広い帯域分割幅でまとめて量子化を行っているため、低域に比べて高域では量子化精度確保に対する情報効率が悪化するという問題がある。し力も、この問題を解消するためには、 1つの周波数帯域の中から特定の周波数成分だけを分離'抽出する方法や、大きな周波数成分を予め時間領域で分離'抽出する方法といった付加的な機能が必要となってしまつ。

発明の開示

発明が解決しょうとする課題

本発明は、このような従来の実情に鑑みて提案されたものであり、臨界帯域に分割することなぐ再生時の雑音感が最小となるようにオーディオ信号を符号ィ匕する信号符号化装置及びその方法、並びにその符号列を復号して元のオーディオ信号を復元する信号復号装置及びその方法を提供することを目的とする。

上述した目的を達成するために、本発明に係る信号符号ィ匕装置は、入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスペクトル信号に変換するスペクトル変換手段と、上記各スペクトル信号に対して、所定のステップ幅を有する複数の正規化係数の何れかを選択し、選択した正規化係数を用いて当該スぺタトル信号を正規化して正規化スペクトル信号を生成する正規化手段と、該正規化に用 V、た正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該カロ算結果に基づいて各正規化スペクトル信号の量子化精度を決定する量子化精度決定手段と、上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子ィ匕スペクトル信号を生成する量子化手段と、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して符号列を生成する符号ィ匕手段とを備えることを特徴とする。

ここで、上記量子化精度決定手段は、上記オーディオ信号又は上記スペクトル信号の特徴に基づ！/ヽて上記重み係数を決定する。

また、本発明に係る信号符号化方法は、入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスペクトル信号に変換するスペクトル変換工程と、上記各スペクトル信号に対して、所定のステップ幅を有する複数の正規化係数の何れかを選択し、選択した正規化係数を用いて当該スペクトル信号を正規化して正規化スペクトル信号を生成する正規化工程と、該正規化に用いた正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該加算結果に基づヽて各正規化スペクトル信号の量子化精度を決定する量子化精度決定工程と、上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子化スペクトル信号を生成する量子化工程と、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して符号列を生成する符号化工程とを有することを特徴とする。

また、本発明に係る信号復号装置は、上述した信号符号化装置及びその方法によつて生成された符号列を復号してオーディオ信号を復元するものであって、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み情報を少なくとも復号する復号手段と、上記正規化係数のインデックスに対してスペクトル信号毎に上記重み情報から決定された重み係数を加算し、該加算結果に基づ!、て各正規化スベクトル信号の量子化精度を復元する量子化精度復元手段と、上記各正規化スぺクトル信号の量子化精度に応じて上記量子化スペクトル信号を逆量子化して正規化スベクトル信号を復元する逆量子化手段と、上記正規化係数を用いて上記各正規化スベクトル信号を逆正規化してスペクトル信号を復元する逆正規化手段と、上記スぺクトル信号を変換して上記所定単位時間毎のオーディオ信号を復元する逆スペクトル変換手段とを備えることを特徴とする。

また、本発明に係る信号復号方法は、同様に上述した信号符号化装置及びその方法によって生成された符号列を復号してオーディオ信号を復元するものであって、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み情報を少なくとも復号する復号工程と、上記正規化係数のインデックスに対してスペクトル信号毎に上記重み情報から決定された重み係数を加算し、該加算結果に基づ！ヽて各正規ィ匕スペクトル信号の量子化精度を復元する量子化精度復元工程と、上記各正規化スベクトル信号の量子化精度に応じて上記量子化スペクトル信号を逆量子化して正規ィ匕スペクトル信号を復元する逆量子化工程と、上記正規化係数を用いて上記各正規ィ匕スペクトル信号を逆正規化してスペクトル信号を復元する逆正規化工程と、上記スベクトル信号を変換して上記所定単位時間毎のオーディオ信号を復元する逆スぺクトル変換工程とを有することを特徴とする。

また、本発明に係る信号復号方法は、入力された符号列を復号して時間領域のォ一ディォ信号を復元するものであって、量子化スペクトル信号、正規化係数のインデックス及び重み情報を少なくとも復号する復号工程と、上記正規化係数のインデックスに対してスペクトル信号毎に上記重み情報力決定された重み係数を加算し、該加算結果に基づいて各正規化スペクトル信号の量子化精度を復元する量子化精度復元工程と、上記各正規化スペクトル信号の量子化精度に応じて上記量子化スぺクトル信号を逆量子化して正規化スペクトル信号を復元する逆量子化工程と、上記正規化係数を用いて上記各正規化スペクトル信号を逆正規化してスペクトル信号を復元する逆正規化工程と、上記スペクトル信号を変換して上記所定単位時間毎のォーディォ信号を復元する逆スペクトル変換工程とを有することを特徴とする。

本発明のさらに他の目的、本発明によって得られる具体的な利点は、以下に説明される実施例の説明から一層明らかにされるであろう。

図面の簡単な説明

[図 1]図 1は、本実施の形態における信号符号化装置の概略構成を示す図である。

[図 2]図 2は、同信号符号ィ匕装置における符号ィ匕処理の手順を説明するフローチヤートである。

[図 3]図 3A及び図 3Bは、同信号符号ィ匕装置の時間—周波数変換部における時間周波数変換処理を説明する図である。

[図 4]図 4は、同信号符号ィ匕装置の周波数正規ィ匕部における正規ィ匕処理を説明する図である。 [図 5]図 5は、同信号符号ィ匕装置のレンジ変換部におけるレンジ変換処理を説明する図である。

[図 6]図 6は、同信号符号化装置の量子化部における量子化処理の一例を説明する図である。

[図 7]図 7は、正規化係数インデックスの重み付けを行わなヽ場合におけるスペクトルの包線及びノイズフロアを示す図である。

[図 8]図 8は、重み係数テーブル Wn[]を決定する方法の一例を説明するフローチヤートである。

[図 9]図 9は、重み係数テーブル Wn[]を決定する方法の他の例を説明するフローチヤートである。

[図 10]図 10は、正規化係数インデックスの重み付けを行う場合におけるスペクトルの包線及びノイズフロアの一例を示す図である。

[図 11]図 11は、従来の量子化精度の決定処理を説明するフローチャートである。

[図 12]図 12は、本実施の形態における量子化精度の決定処理を説明するフローチヤートである。

[図 13]図 13は、図 11に従って量子化精度を決定した場合における符号列と図 12に従って量子化精度を決定した場合における符号列とを示す図である。

[図 14]図 14は、重み係数の規格が変更された場合における後方互換性を確保する方法を説明する図である。

[図 15]図 15は、本実施の形態における信号復号装置の概略構成を示す図である。

[図 16]図 16は、同信号復号装置における復号処理の手順を説明するフローチャートである。

[図 17]図 17は、同信号復号装置の符号列復号部及び量子化精度復元部における処理を説明するフローチャートである。

発明を実施するための最良の形態

以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、入力されたディジタルオーディオ信号をいわゆる変換符号ィ匕によって符号ィ匕し、得られた符号列を出力する信号符号ィ匕装置及びその方法、並びにその符号列を復号して元のオーディオ信号を復元する信号復号装置及びその方法に適用したものである。

先ず、本実施の形態における信号符号ィ匕装置の概略構成を図 1に示す。また、図 1に示す信号符号ィ匕装置 1における符号ィ匕処理の手順を図 2のフローチャートに示す。以下、図 1を参照しながら、図 2のフローチャートについて説明する。

図 2のステップ S 1において、時間周波数変換部 10は、オーディオ信号 (PCM (P ulse Code Modulation)データ等）を所定単位時間（フレーム）毎に入力し、ステップ S 2において、このオーディオ信号を変形離散コサイン変換（Modified Discrete Cosine Transformation； MDCT)によりスペクトル信号に変換する。この結果、図 3Aに示す N本のオーディオ信号は、図 3Bに示す NZ2本の MDCTスペクトル（絶対値表示）に変換される。時間周波数変換部 10は、スペクトル信号を周波数正規化部 11〖こ供給するとともに、スぺ外ルの本数情報を符号ィ匕 ·符号列生成部 15に供給する。次にステップ S3において、周波数正規ィ匕部 11は、図 4に示すように NZ2本の各スベクトルをそれぞれ正規化係数 sf (0) , · · · , sf (N/2— 1)で正規ィ匕し、正規化スぺタトル信号を生成する。ここで、正規化係数 sfは 6dBずつ、すなわち 2倍ずつのステツプ幅を持っているものとする。正規ィ匕に際しては各スペクトルの値よりも 1段階だけ大きな値の正規化係数を用いることにより、正規化スペクトルの値の範囲を ±0. 5〜士 1. 0の範囲に集約することができる。周波数正規ィ匕部 11は、正規化スペクトル毎の正規化係数 sfを例えば以下の表 1に示すように正規化係数インデックス idsfに変換し、正規化スペクトル信号をレンジ変換部 12に供給するとともに、正規化スペクトル毎の正規化係数インデックス id_S 量子化精度決定部 13及び符号化 ·符号列生成部 1 5に供給する。

[表 1]

続いてステップ S4において、レンジ変換部 12は、図 5の左縦軸に示すように ±0. 5 〜士 1. 0の範囲に集約された正規化スペクトルの値を、 ±0. 5の位置を 0. 0と見なすことで、右縦軸に示すように 0. 0〜士 1. 0の範囲にレンジ変換する。本実施の形態の信号符号化装置 1では、このようなレンジ変換を行って力量子化を行うため、量子化精度を向上させることが可能である。レンジ変換部 12は、レンジ変換後のレンジ変換スペクトル信号を量子化精度決定部 13に供給する。

続いてステップ S5において、量子化精度決定部 13は、周波数正規化部 11から供給された正規化係数インデックス idsfに基づいて各レンジ変換スペクトルの量子化精度を決定し、レンジ変換スペクトル信号と後述する量子化精度インデックス idwlとを量子化部 14に供給する。また、量子化精度決定部 13は、量子化精度を決定する際に用、た重み情報を符号化 ·符号列生成部 15に供給するが、重み情報を用、た量子化精度決定処理につ!、ての詳細は後述する。

続いてステップ S6において、量子化部 14は、量子化精度決定部 13から供給された量子化精度インデックス idwlが aである場合に 2"aの量子ィ匕ステップで各レンジ変換スペクトルを量子化して量子化スペクトルを生成し、量子化スペクトル信号を符号化 ·符号列生成部 15に供給する。量子化精度インデックス idwlと量子化ステップ nste psとの関係の一例を以下の表 2に示す。なお、この表 2では、量子化精度インデックス idwlが aである場合の量子化ステップを 2" a— 1としている。

[表 2]

この結果、例えば量子化精度インデックス idwlが 3である場合には、レンジ変換スぺタトルの値を nspecとし、量子化スペクトルの値を q (— 3≤q≤ 3)としたとき、下記の式（ 1)に従って、図 6に示すように量子化される。なお、図 6における黒丸はレンジ変換スベクトルの値を示し、白丸は量子化スペクトルの値を示す。

q = (int)(floor(nspec * 3.5) + 0.5) · · · (1)

続いてステップ S7において、符号化 ·符号列生成部 15は、時間—周波数変換部 1 0から供給されたスペクトルの本数情報、周波数正規化部 11から供給された正規ィ匕係数インデックス idsf、量子化精度決定部 13から供給された重み情報、量子化スぺクトル信号をそれぞれ符号化し、ステップ S8において符号列を生成し、ステップ S9〖こおいて、この符号列を出力する。

最後にステップ S 10において、オーディオ信号の最後のフレームであるか否かが判別され、最後のフレームである場合 (Yes)には符号ィ匕処理を終了し、そうでない場合 (No)にはステップ SIに戻って次のフレームのオーディオ信号を入力する。

ここで、上述した量子化精度決定部 13における処理の詳細について説明する。なお、量子化精度決定部 13は、上述したように重み情報を用いてレンジ変換スぺタトル毎の量子化精度を決定するが、以下では先ず、重み情報を用いずに量子化精度を決定するものとして説明する。

量子化精度決定部 13は、周波数正規ィ匕部 11から供給された正規化スペクトル毎の正規化係数インデックス idsf及び所定の変数 Aから、各レンジ変換スペクトルの量子化精度インデックス idwlを以下の表 3に示すように一意に決定する。

[表 3]

< z

I

r-

«

r

a>

o

<

¾ i

この表 3から分力るように、正規化係数インデックス idsi¾ lつ小さくなると量子化精度インデックス idwlも 1つ小さくなり、ゲインが最大 6dB下がる。これは、正規化係数ィンデッタス idsi¾ Xであり量子化精度が Bである場合の絶対 SNR (Signal to Noise Rati o)を SNRabsとしたとき、正規化係数インデックス idsi¾¾— 1である場合に同等の SN Rabsを得るには略々 B— 1の量子化精度が必要となり、また正規化係数インデックス i dsi¾¾— 2である場合には同様に略々 B— 2の量子化精度が必要となることに着目したものである。具体的に、正規化係数が 4, 2, 1であり、量子化精度インデックス idwl が 3, 4, 5, 6である場合における絶対最大量子化誤差を以下の表 4に示す。

[表 4]

この表 4から分力るように、正規化係数が 4、量子化精度インデックス idwlが 5であるときの絶対最大量子化誤差（ = 0.129)は、正規化係数が 2、量子化精度インデックス i dwl力であるときの絶対最大量子化誤差（ = 0.133)と略々同じ値となっている。なお、量子化精度インデックス idwlが aであるときの量子化ステップ nstepsを 2"aにすれば B 、 B—l、 B— 2は相互に完全に一致する力ここでは上述した表 1と同様に量子化ステツプ nstepsを 2 " a— 1として!/、るため、若干の誤差が生じて、る。

上述した変数 Aとは、最大の正規化係数インデックス idsfに対して割り当てられる最大量子化ビット数 (最大量子化情報)を示しており、この値は付加情報として符号列に含められる。なお、後述するが、この変数 Aとしては先ず規格上とり得る最大の量子化ビット数を設定し、符号化の結果、総使用ビット数が総使用可能ビット数を上回る場合には、順次繰り下げられる。

この変数 Aの値が 17ビットである場合において、レンジ変換スペクトル毎の正規化係数インデックス idsfと量子化精度インデックス idwlとの関係を示すテーブルの一例を以下の表 5に示す。この表 5において丸で囲まれている数字は、レンジ変換スぺタトル毎に決定された量子化精度インデックス idwlを表すものとする。

[表 5]

正規化係数のインデックス

表 5に示すように、正規ィ匕係数インデックス idsf ^最大の 31である場合には最大量子化ビット数である 17ビットで量子化が行われ、例えば正規化係数インデックス idsl^ 最大の正規化係数インデックス idsはり 2だけ小さい 29である場合には 15ビットで量子化が行われる。

ここで、該当する正規化係数インデックス idsfiO最大の正規化係数インデックス idsはりも 17以上小さい場合には量子化ビットがマイナスになってしまうが、その場合は 0ビットと下限を設けることとする。なお、正規化係数インデックス idsfには 5ビットが与えられるため、この表 5で量子化ビット数力 ^ビットとなった場合でも、符号ビットのみ 1ビットで記述することにより平均 SNRとして 3dBの精度でスペクトル情報を記録することも可能であるが、このような符号ビットの記録は必須ではな、。

以上のようにして、正規化係数インデックス idsi¾ら各レンジ変換スペクトルの量子化精度インデックスを一意に決定した場合におけるスペクトルの包線 (a)及びノイズフロア（b)を図 7に示す。図 7に示すように、この場合のノイズフロアは略々平坦になる。すなわち、人間の聴感上重要な低域につ!ヽても聴感上重要でなヽ高域にっヽても一様な量子化精度で量子化を行っているため、雑音感は最小とならない。

そこで、本実施の形態における量子化精度決定部 13は、実際にはレンジ変換スぺタトル毎に正規化係数インデックス idsfに重み付けを行、、この重み付けされた正規ィ匕係数インデックス idsflを用いて上述と同様に量子化精度インデックス idwlを決定する。

具体的には、先ず以下の表 6に示すように、各レンジ変換スペクトルの正規化係数インデックス idsfに対して重み係数 Wn[i] (i=0〜NZ2—l)を加算して、新たな正規ィ匕係数インデックス idsflを生成する。

[表 6]

この表 6の例では、低域の正規化係数インデックス idsfには 4乃至 1の値を加算し、高域の正規化係数インデックス idsfには何も加算していない。この結果、正規化係数インデックス idsfの最大値が 35となるため、表 5のテーブルを正規化係数インデックス i dsfの最大加算数である 4だけ大きい方向へ単純に拡張したとすると、例えば以下の表 7のようになる。この表 7において、破線の丸で囲まれている数字は重み付けを行わない場合にレンジ変換スペクトル毎に決定された量子化精度インデックス idwlを表し、実線の丸で囲まれている数字は重み付けを行う場合にレンジ変換スペクトル毎に決定された量子化精度インデックス idwllを表すものとする。

[表 7]

この表 7の例では、低域の量子化精度が向上するが、最大量子化ビット数 (最大量子化情報）が増力 tlして総使用ビット数が増加するため、総使用ビット数が総使用可能ビット数を超えてしまう可能性がある。そこで、現実的には総使用ビット数が総使用可能ビット数に収まるようにビット調整を行う結果、例えば以下の表 8に示すようなテーブルとなる。この例では、最大量子化ビット数 (最大量子化情報）を表 7の 21から 19 に減少させることで、総使用ビット数を調整してヽる。

[表 8]

表 5で決定される量子化精度インデックスと表 8で決定される量子化精度インデックス idwllとを比較すると以下の表 9のようになる。

[表 9] 1

ο

o

z

1

o

- -

1

m «

+

卜

この表 9から分かるように、インデックスが 0から 3であるレンジ変換スペクトルの量子化精度が向上している一方で、インデックスが 6以上のレンジ変換スペクトルの量子化精度が減少している。このように、正規化係数インデックス idsf〖こ対して重み係数 W n[i]を加算することで、低域にビット^^中させて人間の聴覚に重要な帯域の音質を向上させることができる。

本実施の形態では、この重み係数 Wn[i]をテーブル化した重み係数テーブル Wn []を予め複数持っておくか、又はモデリング数式及びパラメータを複数持っておき逐次重み係数テーブル Wn[]を生成するかし、一定の基準を基に音源の特徴 (周波数エネルギ、過渡特性、ゲイン、マスキング特性など）を判定して、最適と判断される重み係数テーブル Wn[]を利用する。この判定処理のフローチャートを図 8及び図 9に示す。

重み係数テーブル Wn[]を予め複数持っておく場合、先ず図 8のステップ S20において、スペクトル信号又は時間領域のオーディオ信号を解析し、特徴量 (周波数エネルギ、過渡特性、ゲイン、マスキング特性など）を抽出する。次にステップ S21において、この特徴量を元に重み係数テーブル Wn[]を選択し、ステップ S22において、選択した重み係数テーブル Wn[]のインデックスと重み係数 Wn[i] (i=0〜NZ2— 1) とを出力する。

一方、モデリング数式及びパラメータを複数持っておき逐次重み係数テーブル Wn []を生成する場合、先ずステップ S30において、スペクトル信号又は時間領域のォ一ディォ信号を解析し、特徴量 (周波数エネルギ、過渡特性、ゲイン、マスキング特性など）を抽出する。次にステップ S31において、この特徴量を元にモデリング数式 f n (i)を選択し、ステップ S32において、このモデリング数式 fn (i)のパラメータ a, b, c , · · ·を選択する。ここで、モデリング数式 fn (i)とは、レンジ変換スペクトルの順序とパラメータ a, b, c, · · ·とからなる多項式であり、例えば下記の式（2)のように表される。 lh(i)=fa(a,i)+ib(b,i)+fc(c,i).... · · · (2)

続いてステップ S33において、このモデリング数式 fn(i)を計算して重み係数テーブル Wn[]を生成し、モデリング数式 fn (i)のインデックス及びパラメータ a, b, c, . · · と重み係数 Wn[i] (i=0〜NZ2— 1)とを出力する。

なお、この重み係数テーブル Wn[]を選択する際の「一定の基準」は絶対的なものではなぐ各信号符号化装置において任意に設定可能なものである。信号符号化装置では、選択された重み係数テーブル Wn[]のインデックス、又はモデリング数式 fn( i)のインデックス及びパラメータ a, b, c, · · ·を符号列中に含める。信号復号装置では、この重み係数テーブル Wn[]のインデックス、又はモデリング数式 fn (i)のインデックス及びパラメータ a, b, c, …に応じて量子化精度を再計算するため、基準の異なる信号符号ィ匕装置によって生成された符号列との互換性は保たれる。

以上のようにして、正規化係数インデックス idsfに重み付けを行った新たな正規化係数インデックス idsflから各レンジ変換スペクトルの量子化精度インデックスを一意に決定した場合におけるスペクトルの包線 (a)及びノイズフロア (b)の一例を図 10に示す。重み係数 Wn[i]を全く加算しない場合のノイズフロアは直線 ACEであり、重み係数 Wn[i]を加算した場合のノイズフロアは直線 BCDになる。つまり、ノイズフロアを直線 ACEから直線 BCDに変形させるものが重み係数 Wn[i]である。この図 10の例では、三角形 CDEのビットを三角形 ABCに分配した結果、三角形 ABCの SNRが向上し、ノイズフロアが右上がりの直線になっている。なお、この例では簡単のため三角形を用いて説明している力重み係数テーブル Wn[]、又はモデリング数式及びパラメータの持ち方によって、ノイズフロアを任意の形に変形させることが可能である。ここで、従来の量子化精度の決定処理と本実施の形態における量子化精度の決定処理とを図 11及び図 12に示す。

従来では、先ずステップ S40において、正規化係数インデックス idsfに従って量子化精度を決定し、ステップ S41において、スペクトルの本数情報、正規化情報、量子化情報及びスペクトル情報を符号ィ匕する際に必要となる総使用ビット数を計算する。続ヽてステップ S42にお、て、総使用ビット数が総使用可能ビット数以下である力否かを判別し、総使用ビット数が総使用可能ビット数以下である場合 (Yes)には処理を終了し、そうでない場合 (No)にはステップ S40に戻って量子化精度を再度決定する一方、本実施の形態では、先ずステップ S50において、上述のように重み係数テーブル Wn[]を決定し、ステップ S51において、正規化係数インデックス idsf〖こ重み係数 Wn[i]を加算して新たな正規化係数インデックス idsflを生成する。続、てステップ S5 2にお、て、正規化係数インデックス idsflに従って量子化精度インデックス idwllを一意に決定し、ステップ S53において、スペクトルの本数情報、正規化情報、重み情報及びスペクトル情報を符号ィ匕する際に必要となる総使用ビット数を計算する。続、てステップ S54にお、て、総使用ビット数が総使用可能ビット数以下であるか否かを判別し、総使用ビット数が総使用可能ビット数以下である場合 (Yes)には処理を終了し、そうでない場合 (No)にはステップ S50に戻って重み係数テーブル Wn[]を再度決定する。図 11に従って量子化精度を決定した場合における符号列と図 12に従って量子化精度を決定した場合における符号列とをそれぞれ図 13の（a)、（b)に示す。図 13に示すように、重み係数テーブル Wn[]を使用することにより、従来、量子化情報の符号ィ匕に必要であったビット数よりも少な、ビット数で重み情報 (最大量子化情報を含む）を符号ィ匕することができるため、余剰ビットをスペクトル情報の符号ィ匕に使用することができる。

なお、上述した重み係数テーブル Wn[]は、信号復号装置の規格を決定した段階からは変更が利かなくなってしまう。このため、次のような仕組みを予め組み込んでおくこととする。

先ず、上述の例における最大量子化ビット数は最大の正規化係数インデックス idsf に対して与えられる量子化ビット数であり、これは総使用ビット数が総使用可能ビット数を超えない最も近い値が設定される。これを、総使用ビット数が総使用可能ビット数に対して余裕を持つように設定する。例えば表 8を例にとると、最大量子化ビット数は 19ビットである力これを 10ビットといったように小さな値に留めておく。この場合、余剰ビットが多量に発生する符号列が生成されるが、その時点での信号復号装置においてはそのデータは棄却されるだけである。次世代の信号符号化装置、信号復号装置では、この余剰ビットを新たに決められた規格に従って配分して符号化'復号すればよいので、後方互換性は確保できるという利点がある。具体的には、例えば図 1 4の（a)に示すようなどの信号復号装置においても復号可能な符号列に使用するビット数を削減し、余剰ビットを図 14の (b)に示すように新たな重み情報とその重み情報を用いて符号ィ匕した新たなスペクトル情報に分配することができる。

次に、本実施の形態における信号復号装置の概略構成を図 15に示す。また、図 1 5に示す信号復号装置 2における復号処理の手順を図 16のフローチャートに示す。以下、図 15を参照しながら、図 16のフローチャートについて説明する。

図 16のステップ S60において、符号列復号部 20は、所定単位時間（フレーム）毎に符号化された符号列を入力し、ステップ S61において、この符号列を復号する。このとき、符号列復号部 20は、復号したスペクトルの本数情報、正規化情報及び重み情報 (最大量子化情報を含む)を量子化精度復元部 21に供給し、量子化精度復元部 21は、これらの情報に基づいて量子化精度インデックス idwllを復元する。また、符号列復号部 20は、復号した本数情報及び量子化スペクトル信号を逆量子化部 22に供給し、復号した本数情報及び正規化情報を逆正規化部 24に供給する。

このステップ S61における符号列復号部 20及び量子化精度復元部 21の処理について、図 17のフローチャートを用いてさらに詳細に説明する。先ずステップ S70において本数情報を復号し、ステップ S71において正規ィ匕情報を復号し、ステップ S72において重み情報を復号する。次にステップ S 73において、正規化情報を復号して得られた正規化係数インデックス idsf〖こ重み係数 Wnを加算して正規化係数インデックス idsflを生成し、ステップ S74において、この正規化係数インデックス idsfl力量子化精度インデックス idwllを一意に復元する。

図 16に戻ってステップ S62において、逆量子化部 22は、量子化精度復元部 21から供給された量子化精度インデックス idwllに基づヽて量子化スペクトル信号を逆量子化し、レンジ変換スペクトル信号を生成する。逆量子化部 22は、このレンジ変換スベクトル信号を逆レンジ変換部 23に供給する。

続ヽてステップ S63【こお!ヽて、逆レンジ変換咅 23ίま、 0. 0〜士 1. 0の範囲【こレンジ変換されていたレンジ変換スペクトルの値を ±0. 5〜士 1. 0の範囲に逆レンジ変換して正規化スペクトル信号を生成する。逆レンジ変換部 23は、この正規化スぺタトル信号を逆正規化部 24に供給する。

続いてステップ S64において、逆正規ィ匕部 24は、正規化情報を復号して得られた正規化係数インデックス ids 用いて正規化スペクトル信号を逆正規化し、得られたスペクトル信号を周波数一時間変換部 25に供給する。

続いてステップ S65において、周波数—時間変換部 25は、逆正規化部 24から供給さえたスペクトル信号を逆 MDCTにより時間領域のオーディオ信号 (PCMデータ等）に変換し、ステップ S66において、このオーディオ信号を出力する。

最後にステップ S67において、オーディオ信号の最後の符号列であるか否かが判別され、最後の符号列である場合 (Yes)には復号処理を終了し、そうでない場合 (No )にはステップ S60に戻って次のフレームの符号列を入力する。

以上説明したように、本実施の形態における信号符号化装置 1及び信号復号装置 2によれば、信号符号化装置 1において、各スペクトルの値に依存してビットを割り当てる際に聴覚特性を利用した重み係数 Wn[i]を用意し、この重み係数 Wn[i]に関する重み情報を正規化係数インデックス idsf^量子化スペクトル信号とともに符号ィ匕して符号列に含め、信号復号装置 2では、この符号列を復号して得られる重み係数 Wn[i ]を用いて量子化スペクトル毎の量子化精度を復元し、この量子化精度に応じて量子ィ匕スペクトル信号を逆量子化することで、再生時の雑音感を最小化することができるまた、本実施の形態では、臨界帯域という概念を持たず、全てのスぺ外ルをそれぞれ正規化係数で正規化し、その正規化係数を全て符号化して符号列に含める。このように、臨界帯域毎ではなくスペクトル毎に正規化係数の記録が必要となるため、情報効率という点では不利である力絶対精度的には非常に有利である。但し、スぺタトル毎に正規化係数を求めることで、隣接するスペクトル同士の正規化係数に存在する高い相関を利用した効率的な可逆圧縮操作が可能であるため、臨界帯域を用 V、る場合と比較して一方的に情報効率が不利と!/、うことにはならな!、。

なお、本発明は、図面を参照して説明した上述の実施例に限定されるものではなく

、添付の請求の範囲及びその主旨を逸脱することなぐ様々な変更、置換又はその同等のものを行うことができることは当業者にとって明らかである。産業上の利用可能性

上述した本発明によれば、信号符号化装置において、各周波数成分の値に依存してビットを割り当てる際に聴覚特性を利用した重み係数を用意し、この重み係数に関する重み情報を正規化係数のインデックスや量子化スペクトル信号とともに符号化して符号列に含め、信号復号装置では、この符号列を復号して得られる重み係数を用いて周波数成分毎の量子化精度を復元し、この量子化精度に応じて量子化スぺタトルを逆量子化することで、再生時の雑音感を最小化することができる。

Claims

請求の範囲

[1] 1.入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスぺクトル信号に変換するスペクトル変換手段と、

上記各スペクトル信号に対して、所定のステップ幅を有する複数の正規化係数の何れかを選択し、選択した正規化係数を用いて当該スペクトル信号を正規化して正規化スペクトル信号を生成する正規化手段と、

該正規化に用、た正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該加算結果に基づ!/ヽて各正規化スペクトル信号の量子化精度を決定する量子化精度決定手段と、

上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子化スぺクトル信号を生成する量子化手段と、

上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して符号列を生成する符号化手段と

を備えることを特徴とする信号符号化装置。

[2] 2.上記量子化精度決定手段は、上記オーディオ信号又は上記スペクトル信号の特徴に基づいて上記重み係数を決定することを特徴とする請求の範囲第 1項記載の信号符号化装置。

[3] 3.上記量子化精度決定手段は、上記重み係数がテーブル化された重み係数テーブルを複数有しており、上記オーディオ信号又は上記スペクトル信号の特徴に基づいて該複数の重み係数テーブルの何れかを選択して上記重み係数を決定し、上記符号化手段は、選択された重み係数テーブルのインデックスを符号化することを特徴とする請求の範囲第 2項記載の信号符号ィヒ装置。

[4] 4.上記量子化精度決定手段は、上記スペクトル信号毎の重み係数を決定するためのモデリング数式を複数有しており、上記オーディオ信号又は上記スペクトル信号の特徴に基づヽて該複数のモデリング数式の何れかを選択するとともに選択されたモデリング数式のパラメータを決定して上記重み係数を決定し、

上記符号化手段は、選択されたモデリング数式のインデックス及び該モデリング数式のパラメータを符号化することを特徴とする請求の範囲第 2項記載の信号符号ィヒ装置。

[5] 5.上記量子化精度決定手段は、上記加算結果が最大となるスペクトル信号に対する量子化精度が規格上最大の量子化精度となるように上記各正規化スペクトル信号の量子化精度を決定し、上記符号化手段による符号化の結果、総使用ビット数が総使用可能ビット数を上回る場合には、総使用ビット数が総使用可能ビット数以下となるように上記各正規化スペクトル信号の量子化精度を繰り下げることを特徴とする請求の範囲第 1項記載の信号符号化装置。

[6] 6.上記正規化係数のインデックスが 1ずつ増減すると上記量子化精度が 1ビットずつ増減することを特徴とする請求の範囲第 1項記載の信号符号ィヒ装置。

[7] 7.上記正規化係数は 2倍ずつのステップ幅を有しており、

上記正規化手段は、各スペクトル信号の値よりも大きく且つ各スペクトル信号の値に最も近い正規化係数を用いて、各スペクトル信号の値を ±0. 5乃至 ± 1. 0の範囲に正規化する

ことを特徴とする請求の範囲第 1項記載の信号符号ィヒ装置。

[8] 8. ±0. 5乃至 ± 1. 0の範囲に正規化された各正規化スペクトル信号を 0乃至 ± 1.

0の範囲にレンジ変換するレンジ変換手段をさらに備えることを特徴とする請求の範囲第 7項記載の信号符号化装置。

[9] 9.上記量子化精度決定手段は、上記符号化手段による符号化の結果、総使用ビット数が総使用可能ビット数を下回り余剰ビットが発生するように各正規化スペクトル信号の量子化精度を決定するとともに、上記正規化係数のインデックスに対して新たな信号復号装置でのみ復号可能な新たな重み係数をスペクトル信号毎に加算し、該加算結果に基づいて各正規化スペクトル信号の新たな量子化精度を決定し、上記符号化手段は、上記余剰ビットを利用して、上記新たな量子化精度に応じて量子化された量子化スペクトル信号及び上記新たな重み係数をさらに符号ィヒすることを特徴とする請求の範囲第 1項記載の信号符号ィヒ装置。

[10] 10.入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスぺタトル信号に変換するスペクトル変換工程と、

上記各スペクトル信号に対して、所定のステップ幅を有する複数の正規化係数の何れかを選択し、選択した正規化係数を用いて当該スペクトル信号を正規化して正規化スペクトル信号を生成する正規化工程と、

該正規化に用、た正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該加算結果に基づ!ヽて各正規化スペクトル信号の量子化精度を決定する量子化精度決定工程と、

上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子化スぺクトル信号を生成する量子化工程と、

上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して符号列を生成する符号ィ匕工程と

を有することを特徴とする信号符号化方法。

[11] 11.上記量子化精度決定工程では、上記オーディオ信号又は上記スペクトル信号の特徴に基づいて上記重み係数を決定することを特徴とする請求の範囲第 10項記載の信号符号化方法。

[12] 12.入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスぺタトル信号に変換し、所定のステップ幅を有する複数の正規化係数の何れかを用いて、上記各スペクトル信号を正規ィ匕して正規化スペクトル信号を生成し、該正規化〖こ用いた正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該加算結果に基づ!、て各正規化スペクトル信号の量子化精度を決定し、上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子化スペクトル信号を生成し、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して生成した符号列を復号して上記オーディォ信号を復元する信号復号装置であって、

上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み情報を少なくとも復号する復号手段と、

上記正規化係数のインデックスに対してスペクトル信号毎に上記重み情報力決定された重み係数を加算し、該加算結果に基づ！ヽて各正規化スペクトル信号の量子化精度を復元する量子化精度復元手段と、

上記各正規化スペクトル信号の量子化精度に応じて上記量子化スペクトル信号を逆量子化して正規化スペクトル信号を復元する逆量子化手段と、

上記正規化係数を用いて上記各正規化スペクトル信号を逆正規ィ匕してスぺ外ル信号を復元する逆正規化手段と、

上記スペクトル信号を変換して上記所定単位時間毎のオーディオ信号を復元する逆スペクトル変換手段と

を備えることを特徴とする信号復号装置。

[13] 13.上記正規化係数のインデックスが 1ずつ増減すると上記量子化精度が 1ビットずつ増減することを特徴とする請求の範囲第 12項記載の信号復号装置。

[14] 14.上記正規化係数は 2倍ずつのステップ幅を有し、上記正規化では、各スペクトル信号の値よりも大きく且つ各スぺ外ル信号の値に最も近い正規化係数を用いて、各スペクトル信号の値を ±0. 5乃至 ± 1. 0の範囲に正規化し、この ±0. 5乃至 ± 1. 0 の範囲に正規ィ匕された各正規化スペクトル信号を 0乃至士 1. 0の範囲にレンジ変換しており、

上記 0乃至 ± 1. 0の範囲にレンジ変換された各正規化スペクトル信号の値を ±0. 5乃至 ± 1. 0の範囲に復元する逆レンジ変換手段をさらに備える

ことを特徴とする請求の範囲第 12項記載の信号復号装置。

[15] 15.入力された時間領域のオーディオ信号を所定単位時間毎に周波数領域のスぺタトル信号に変換し、所定のステップ幅を有する複数の正規化係数の何れかを用いて、上記各スペクトル信号を正規ィ匕して正規化スペクトル信号を生成し、該正規化〖こ用いた正規化係数のインデックスに対してスペクトル信号毎に重み係数を加算し、該加算結果に基づ!、て各正規化スペクトル信号の量子化精度を決定し、上記量子化精度に応じて上記各正規化スペクトル信号を量子化して量子化スペクトル信号を生成し、上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み係数に関する重み情報を少なくとも符号化して生成した符号列を復号して上記オーディォ信号を復元する信号復号方法であって、

上記量子化スペクトル信号、上記正規化係数のインデックス及び上記重み情報を少なくとも復号する復号工程と、

上記正規化係数のインデックスに対してスペクトル信号毎に上記重み情報力決定された重み係数を加算し、該加算結果に基づ！ヽて各正規化スペクトル信号の量子化精度を復元する量子化精度復元工程と、

上記各正規化スペクトル信号の量子化精度に応じて上記量子化スペクトル信号を逆量子化して正規化スペクトル信号を復元する逆量子化工程と、

上記正規化係数を用いて上記各正規化スペクトル信号を逆正規ィ匕してスぺ外ル信号を復元する逆正規化工程と、

上記スペクトル信号を変換して上記所定単位時間毎のオーディオ信号を復元する逆スペクトル変換工程と

を有することを特徴とする信号復号方法。

[16] 16.入力された符号列を復号して時間領域のオーディオ信号を復元する信号復号方法であって、

量子化スペクトル信号、正規化係数のインデックス及び重み情報を少なくとも復号する復号工程と、

を有することを特徴とする信号復号方法。