JP2002091497A - オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 - Google Patents

オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体

Info

Publication number
JP2002091497A
JP2002091497A JP2000282129A JP2000282129A JP2002091497A JP 2002091497 A JP2002091497 A JP 2002091497A JP 2000282129 A JP2000282129 A JP 2000282129A JP 2000282129 A JP2000282129 A JP 2000282129A JP 2002091497 A JP2002091497 A JP 2002091497A
Authority
JP
Japan
Prior art keywords
audio signal
quantization
decoding
encoding method
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000282129A
Other languages
English (en)
Other versions
JP3557164B2 (ja
Inventor
Naoki Iwagami
直樹 岩上
Takeshi Mori
岳至 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000282129A priority Critical patent/JP3557164B2/ja
Publication of JP2002091497A publication Critical patent/JP2002091497A/ja
Application granted granted Critical
Publication of JP3557164B2 publication Critical patent/JP3557164B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】複雑な形状のスペクトルを有するオーディオ信
号を能率よく符号化し、復号化する。 【解決手段】周波数領域係数を小帯域毎に複数の符号化
方法のいずれにより符号化するかを選択し、選択された
符号化方法により周波数領域係数を符号化して係数符号
を生成し、係数符号を出力する。復号において、入力さ
れた符号から係数符号を抽出し、選択情報により指定さ
れた復号方法により係数符号を復号する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、オーディオ信号を高
能率にディジタル符号にする符号化方法及びそのディジ
タル符号をオーディオ信号に復元する復号化方法及びど
れ等の方法を実施するプログラムが記録された記憶媒体
を提供するものであり、オーディオ信号の録音・再生
や、オーディオ信号の通信路を使った伝送、放送などに
利用できる。
【0002】
【従来の技術】オーディオ信号を高能率に符号化する従
来からの手法として、例えば図1に示す変換符号化方法
がある。符号化装置10Aでは、離散信号サンプル列と
して入力されたオーディオ信号を、一定サンプル数の入
力ごとに時間/周波数変換部11により時間/周波数変
換を行って、周波数領域の一連の係数(以下、周波数領
域係数と呼ぶ)にしてから符号化を行う。図1の例で
は、平坦化部12により周波数領域係数を平坦化処理を
行ってからベクトル量子化部13で量子化を行ない、平
坦化部12で平坦化に使用した平坦化情報を表す符号と
ベクトル量子化部13でのベクトル符号化による符号を
多重化部14で多重化し、出力する。
【0003】復号化装置10Bでは、逆多重化部15で
受信した多重化符号を平坦化情報を表す符号とベクトル
符号に分離し、ベクトル量子化復号化部16でベクトル
符号から平坦化周波数領域係数を得て、平坦化情報を使
って逆平坦化部17により平坦化周波数領域係数を逆平
坦化して周波数領域係数を再生し、周波数/時間変換部
18により再生周波数領域係数を時間領域信号に変換し
て出力する。周波数領域重み付けインタリーブベクトル
量子化(Transform-domain WeightedInterleave Vector
Quantization,TWINVQ)方式はこの例に当てはまる。TWIN
VQ方式は、入力信号を時間/周波数変換した後、2段階
の平坦化の手順を経た後に、ベクトル量子化により符号
化を行っている。ベクトル量子化は、目標ベクトルとの
距離が最小であるコードベクトルをコードブックから選
択し、このコードベクトルを用いて復号化装置側でベク
トルを再生する。このような符号化方法では、再生ベク
トルと目標ベクトルとの距離は小さく高能率に符号化が
できるが、ベクトル中の個々の要素についての目標値か
らの誤差を制御することは困難である。従って、ベクト
ル量子化を用いた符号化方式では、復号化装置側で再生
した信号の周波数特性が、原信号の周波数特性から歪
み、再生音質の劣化を招いてしまうことがある。スペク
トルの形状が複雑な時、例えば入力信号に強いトーン性
成分が含まれるときには、ベクトル量子化に大きな負担
をかけるため、この性質が強く現れやすく、音質劣化の
原因になってしまう。
【0004】この問題を解決するための技術が、特願 2
000-078370「オーディオ信号符号化方法及び復号化方
法、これらの装置及びプログラム記憶媒体」において提
案されている。ここでは、音源のスペクトルが複雑な形
状をしている場合、周波数領域係数を強弱の2系統に分
離し、おのおのの系統ごとに重み付けをしたベクトル量
子化をすることにより、より細かいサンプルごとの量子
化誤差の制御を可能にしている。しかし、この方法で
は、周波数領域係数の分離情報の符号化に比較的多くの
ビット数を必要とし、特に強弱の出現確率が均等に近く
なってくる低周波数領域では非効率を招くことがある。
【0005】別の解決策の手法として、ベクトル量子化
に大きな影響を与える特定のサンプルだけ予め取り除い
て符号化するものがあり、特願平7-261236「音響信号変
換符号化方法及び復号化方法」及び7-248145「変換符号
化方法及び変換復号化方法」において出願されている。
前者の出願では、重要度の高いサンプルを予め取り除
き、残りをベクトル量子化しているが、この方法では、
取り除くサンプルの周波数軸上での位置の情報を符号化
しなくてはならないので符号化の能率が悪い。後者の方
法では、スペクトルに周期的なスパイクが生じるピッチ
性の音源について、スパイクの基本周波数の整数倍に位
置するサンプルを取り除いて別個符号化する。この方法
では、符号化能率は良いが、トライアングルなどの非整
数倍音構造をもつ音源に対しては効果が薄く、汎用性に
乏しい。
【0006】なお、TWINVQ方式については、岩上他「周
波数領域重み付けインタリーブベクトル量子化(TWINVQ)
による楽音符号化」電子情報通信学会論文誌Vol.J80-A,
pp.830〜837及びISO/IEC 標準 1SO/IEC 14496-3 Infor
mation Technology: Codingof Audio-Visual Objects
(MPEG-4 Audio)に詳細が記述されている。また、ベクト
ル量子化技術全般に関する詳細は、古井他著「ベクトル
量子化と情報圧縮」(コロナ社、1998)に述べられてい
る。
【0007】
【発明が解決しようとする課題】この発明は、入力信号
のスペクトルを符号化するオーディオ信号の変換符号化
方法において、複雑な形状を持つスペクトルを、高い汎
用性で能率よく符号化する方法及び復号化方法を提供す
ることを課題とする。
【0008】
【課題を解決するための手段】符号器では、入力された
信号の系列を一定時間ごとに周波数領域に変換し、得ら
れた周波数領域の係数を、近傍同士をまとめた小帯域に
分割する。小帯域ごとに、係数を符号化するモデルを決
定し、その決定された方法で小帯域に属する係数を量子
化及び符号化する。復号器では、符号化モデル決定情報
で決められた符号化方法に基づき小帯域ごとに周波数領
域係数を再生し、得られた周波数領域係数を時間領域の
サンプル列に変換して出力信号を得る。
【0009】
【作用】例えば、符号化のモデルとしてベクトル量子化
を用いた方法とスカラ量子化を用いた方法の2種類を持
つ場合、ベクトル量子化は、少ないビット数でも高能率
に量子化ができる反面、サンプルごとの歪みの制御が困
難である。スカラ量子化は、サンプルごとの独立性は良
いが、量子化ビット数が足りないと能率が大幅に劣化し
てしまう。この発明では、このように、相異なる性質を
持つ符号化モデルを複数持ち、入力スペクトルの各小帯
域ごとに最適なモデルを選択することにより、汎用性が
高く高能率な符号化を可能にしている。
【0010】
【発明の実施の形態】図2に本発明の第1の実施例を示
す。図2の実施例において、符号化装置10Aは時間/
周波数変換部10と、符号化モデル選択部20と、量子
化・符号化部30と、多重化部40とにより構成され、
例えば、オーディオ信号などの離散サンプル列を端子9
に入力して、符号化したビット列を多重化部40から出
力する。即ち、入力信号は時間/周波数変換部10にお
いて例えば変形離散コサイン変換(MDCT)により周
波数領域係数に変換され、この周波数領域係数は符号化
モデル選択部20において一連の周波数領域係数を複数
の係数毎に区切った小帯域毎に予め決めた複数の符号化
方法のどれを使用して符号化を行うかが選択指定され、
その選択情報を量子化・符号化部30に与えると共に、
選択情報の符号を多重化部40に与える。周波数領域係
数は量子化・符号化部30において選択情報により指定
された符号化方法により符号化され、その周波数領域係
数の符号(以下、係数符号と呼ぶ)が多重化部40に与
えられる。多重化部40は選択情報符号と係数符号を多
重化し、ビット列として出力する。
【0011】復号化装置10Bは逆多重化部50と、符
号化モデルの選択情報再生部60と、係数再生部70
と、周波数/時間変換部80とから構成され、入力され
た多重化符号ビット列を復号し、時間領域の離散サンプ
ル列であるオーディオ信号を出力端子91から出力す
る。即ち、入力された多重化符号ビット列は逆多重化部
50において符号化モデルの選択情報符号と係数符号と
に分離され、選択情報符号は復号化モデル選択再生部6
0に与えられて選択情報に再生され、その選択情報は係
数再生部70に与えられる。逆多重化部50からの係数
符号は係数再生部70に与えられ、符号化装置10Aに
おける符号化モデル選択部20により各小帯域に対し選
択された符号化方法に対応する復号化方法が選択情報に
より選択され、係数符号に対する復号化が行われ、周波
数領域係数が再生される。この周波数領域係数は周波数
/時間変換部80により時間領域のサンプル系列に変換
され、復号結果として端子91に出力される。
【0012】次に符号化装置10Aの各部について図5
に示す周波数領域係数に対する処理を参照して詳細に説
明する。時間/周波数変換部10 端子9に入力されたオーディオ信号の離散サンプル列
は、時間/周波数変換部10に入力され、一定数Nの入
力サンプル(1フレームとする)ごとに時間/周波数変
換を行い、周波数領域のN個の係数に変換する。時間/
周波数変換の方法としては、離散コサイン変換(DCT)
や、変形離散コサイン変換(MDCT)を用いることができ
る。図5に示す例では、各丸印が1つの係数値を表し、
ここでは2チャネルオーディオ信号がフレーム毎に交互
に周波数領域係数に変換される場合を示している。
【0013】変換方法として変形離散コサイン変換を用
いる場合には、N個の入力ごとに過去2×N個の入力オー
ディオサンプルを変換してN個の周波数領域の係数を得
る。時間/周波数変換処理を行う直前にハミング窓やハ
ニング窓などの窓関数をかけても良い。Nの値は、時間
/周波数変換アルゴリズムに適用できるどのようなもの
を適用しても良いが、128から2048 の間の値を使うと最
も効果が高い。また、入力信号の性質に応じて適応的に
Nの値を切り替えても良い。例えば、通常時N=2048とし
ておき、入力音が過渡的な時N=512,更に大きく過渡的で
あったときにはN=128 としても良い。適応的に切り替え
る場合、次のフレームのNの値を符号化して復号化装置
に送る。符号化モデル選択部20 時間/周波数変換部10で得られた周波数領域での一連
の係数は、符号化モデル選択部20へ送られる。符号化
モデル選択部20では、一連の周波数領域係数を例えば
図5に示すように複数の係数毎にまとめることによって
構成された小帯域ごとに、予め決めた複数の符号化方法
のうち、どの符号化方法を用いるのが最適かを判断し、
その符号化方法を選択する選択情報を出力する。図5に
示す各小帯域に付けられた番号n(c)(ただしn=0,…,N-1
及びc=0,1)の括弧内の番号cはチャネル番号を表して
いる。この実施例では、符号化モデルとして、ベクトル
量子化を用いるタイプとスカラ量子化を用いるタイプの
2つが選択できる場合を示している。それぞれの符号化
モデルの詳細は、後述する。
【0014】小帯域を構成する周波数領域係数の数は、
一定数でも良いし、その小帯域が属する周波数によって
変化させても良い。後者の場合には、周波数の低い領域
では係数の数を少なく、周波数の高い領域では係数の数
を多くとると、後段での符号化を能率よく行うことがで
きる。符号化モデル選択部20におけるベクトル量子化
タイプとスカラ量子化タイプの選択は、その小帯域の性
質を利用して判断すれば良い。図3A,3B,3C,3
Dのそれぞれに選択アルゴリズムの例を示す。例えば図
3Aに示すように、各小帯域に含まれるM個の周波数領
域係数xi, i=0,…,M-1の平坦度Sを次式
【0015】
【数1】 のように計算し(ステップS11)、平坦度Sを予め決
めた閾値Sth と比較し(ステップS12)、SがSth
りより小さいとき、例えば閾値Sth=0.5 を下回るときに
はスカラ量子化タイプを選択し(ステップS13)、そ
うでない時にはベクトル量子化タイプを選択し(ステッ
プS14)、各小帯域に対し選択されたタイプを表す選
択情報を出力する(ステップS15)。
【0016】あるいは、図3Bに示すように、小帯域に
含まれるM個の周波数領域係数xiを、その大きさで強弱
の2系統xj,j=0,…,J-1及びxk,k=0,…,K-1(ただしj≠
k, J+K=M)に分け(ステップS21)、それぞれの系統
に属する係数のパワーPJ=Σ|x j|2とPK=Σ|xk|2の比PJ/P
K を計算し(ステップS22)、このパワーの比を一定
の値Cと比較し(ステップS23)、例えばC=2.0 を超
えた場合にはスカラ量子化タイプを選択し(ステップS
24)、そうでないときにはベクトル量子化タイプを選
択し(ステップS25)、各小帯域に対し決定した選択
情報を出力する(ステップS26)。
【0017】あるいは、各入力フレームに対して得られ
た周波数領域係数の一連の小帯域のうち、低次側(低周
波数側)の小帯域はスカラ量子化タイプ、高次側(高周
波数側)の小帯域はベクトル量子化タイプで符号化を行
うことを前提とし、低次側小帯域に対するスカラ量子化
に必要なビット数が予め決めたある一定数に達する小帯
域を、ベクトル量子化との切り替わりの点とする方法を
用いても良い。即ち、図3Cに示すように、n=0, B=0を
初期値とし(ステップS31)、n番目の小帯域n(c)に
対しスカラ量子化を選択し、予め決めた量子化精度を満
たすスカラ量子化ビット数bnを割り当て(ステップS3
2)、割り当てたビット数bnを累積し(ステップS3
3)、割り当てビット数の累積値Bが所定値BSより小さ
いか判定し(ステップS34)、小さければnを1増加
させステップS32に戻り(ステップS35)、BがBS
以上であれば残りの小帯域に対しベクトル量子化を選択
する(ステップS36)。この図3Cの例では、選択情
報を送る替わりにどの周波数又はどの小帯域から符号化
方法が変わるかを表す情報を送ればよい。
【0018】更に、小帯域ごとにどちらの符号化モデル
を用いるか予め決めておいても良い。例えば図3Dに示
すように、周波数F=4kHzよりも低い周波数に属する小帯
域に対しスカラ量子化タイプを選択し(ステップS4
1)、それより高い周波数に属する小帯域に対してはベ
クトル量子化タイプを選択する(ステップS42)と予
め決めても良い。この場合は、選択情報を複合化装置に
送る必要はない。なお、上記の選択方法のうち複数の方
法を組み合わせても良い。例えば、図3DのステップS
41に従って2kHzよりも低い周波数に属する小帯域に対
しては必ずスカラ量子化タイプで行うこととし、2kHzか
ら7kHzの間に属する小帯域に対しては、上記図3Bの方
法により量子化方法を選択し、7kHzよりも高い周波数に
属する小帯域に対しては図3DのステップS42に従っ
て必ずベクトル量子化タイプを選択することとする、な
どの方法で決定しても良い。図3A及び3Bの場合は、
各小帯域に対し、2つの符号化モデルのいずれの一方が
適用されるかを指定する選択情報が生成される。
【0019】このようにして決められた符号化モデルの
選択情報は量子化・符号化部30に送るとともに、符号
化されて選択情報符号QMSCとして多重化部40に送られ
る。この実施例では、選択できる符号化モデルは2種類
であるため、選択情報は各小帯域ごとに高々1ビットあ
れば符号化できる。もちろん、符号化モデルは2種類よ
り多くてもよい。また、エントロピー符号化やランレン
グス符号化などを用いて、選択情報を可逆圧縮しても良
い。量子化・符号化部30 量子化・符号化部30では、符号化モデル選択部20で
決定された符号化方法を用いて、小帯域ごとに量子化及
び符号化を行う。
【0020】図4に量子化・符号化部30の詳細を示
す。量子化・符号化部30は重み計算部31と、係数振
り分け部32と、重み振り分け部33と、ベクトル量子
化部34と、スカラ量子化部35と、可逆圧縮部36と
から構成されている。重み計算部31では、入力された
各小帯域の周波数領域係数に対し、量子化の重みを計算
する。重みとしては、線形予測スペクトルを用いる方
法、小帯域ごとに平均値あるいは最大値を求めこれを重
みとする方法、あるいは、その組み合わせなどを用いる
ことができる。
【0021】重み計算部31で計算された重みは、重み
振り分け部33に送られる。また、重みは、復号化装置
10Bでも使用されるため、符号化して重み符号WCを
他の符号と共に多重化部40を介して復号化装置10B
に送られる。線形予測スペクトルは、線形予測係数をL
SP係数に変換し符号化することにより、高能率に符号
化することができる。また、小帯域の代表値は、その値
を量子化することにより符号化できる。量子化の方法と
しては、ベクトル量子化を用いても良いし、スカラ量子
化しても良い。量子化した量子化インデックスはエント
ロピー符号化などの非可逆圧縮を加えて符号化しても良
い。圧縮しない場合の符号は、量子化インデックスを2
進数で表すことにより得られる。
【0022】係数振り分け部32では、小帯域ごとの周
波数領域係数を入力とし、符号化モデル選択部20より
送られた符号化モデル選択情報に基づき、小帯域ごとに
係数をベクトル量子化部34とスカラ量子化部35に振
り分ける。符号化モデル情報は、小帯域ごとに定められ
た2値の値なので、この値に従って対応する符号化モデ
ルに係数を振り分ければよい。図5の例では、選択情報
に従ってチャネル0の小帯域0(0)〜3(0)はスカラ量子化
に振り分けられ、小帯域4(0), 5(0)はベクトル量子化に
振り分けられ、また、チャネル1の小帯域0(1), 1(1),
2(1), 4(1)がスカラ量子化に振り分けられ、小帯域3
(1), 5(1)がベクトル量子化に振り分けられた場合を示
している。
【0023】重み振り分け部33では、係数振り分け部
32と同じ方法で重みを振り分ける。ベクトル量子化部
34では、係数振り分け部32及び重み振り分け部33
より送られた重みを使って係数振り分け部32からの係
数をベクトル量子化する。量子化に先立ち、入力された
係数をまとめ1個以上の量子化ユニットを構成する。量
子化ユニットは、全係数を全て格納して1つだけ構成し
ても良いし、図5で示した例のステレオ符号化の場合に
は、ベクトル量子化ユニットVQ-CU0 で示すようにチャ
ネルごとに1つの量子化ユニットを構成しても良い。ま
た、係数を一定数ごとに分割し、多数の量子化ユニット
を構成しても良い。
【0024】ベクトル量子化は、量子化ユニットごとに
行われるが、量子化ユニットを一括してベクトル量子化
しても良いし、分割してベクトル量子化しても良い。分
割の方法としては、複数の領域に分ける方法、あるいは
入力係数をインタリーブしてから分割する方法などを用
いることができる。最適ベクトルの選択は、コードブッ
ク中のコードベクトルに重み振り分け部33からの重み
を乗算し、目標となる係数ベクトルに最も近くなるもの
を選択することにより行う。ベクトル量子化の形態とし
ては、通常のベクトル量子化の他、2つのコードブック
から選択したコードベクトルの和を用いる共役構造ベク
トル量子化、あるいは多段ベクトル量子化などの形態を
用いても良い。このようにして決定されたコードベクト
ルインデックスを2進数で表すことにより符号化を行
い、ベクトル量子化符号VQC を多重化部40に送る。
【0025】スカラ量子化部35では、重み振り分け部
33からの重みを使って係数振り分け部32からの小帯
域ごとの周波数領域係数をスカラ量子化し、量子化イン
デックスは可逆圧縮部36へ送られる。量子化に先立
ち、入力された係数をまとめ1個以上の量子化ユニット
を構成する。1小帯域ごとに1ユニットを構成すると良
好な結果が得られる。量子化値は、重み振り分け部32
からの重みを掛け合わせて周波数領域係数と最も近づく
ような2進値を所望の量子化精度で決定する。この量子
化の際に、量子化精度(例えばビット数)を決定する必
要があるが、これは量子化ユニットごとに設定する。周
波数領域係数のパワーとスペクトル形状に基づき決定さ
れた、最低限保証する必要がある量子化誤差から決定す
ることが望ましい。
【0026】ここで決定された量子化精度情報も何らか
の形で符号化し復号器に送る必要がある。最も簡単な方
法としては、量子化精度を満たすのに必要な量子化ビッ
ト数を符号化することが挙げられる。その他、可逆圧縮
部36でエントロピー符号化を行う場合には、ハフマン
符号化ならハフマン符号テーブル、算術符号化ならシン
ボルの出現頻度テーブルにより量子化精度を与えること
ができるので、このテーブルの種類を符号化することに
より量子化精度情報を復号器に送ることができる。
【0027】なお、前述のベクトル量子化における重み
付け及び上述のスカラ量子化における重み付けは、図1
で説明した平坦化部12による平坦化と本質的に同じで
ある。即ち、図4に示したベクトル量子化におけるコー
ドベクトル又はスカラ量子化における量子化値に重みを
乗算する代わりに、周波数領域係数を重みで割り算し
(即ち、平坦化し)、その割り算結果をベクトル量子化
又はスカラ量子化しても処理手順が異なるだけで符号化
結果は同じである。
【0028】可逆圧縮部36では、スカラ量子化部35
で得られた量子化インデックスに可逆圧縮符号化を行な
い、圧縮スカラ量子化符合CSQCを多重化部40に供給す
る。可逆圧縮符号化に先立ち、1つ以上の量子化ユニッ
トをまとめ、符号化ユニットを構成する。図5の例で
は、チャネル0の処理において2つの量子化ユニットSQ
U0, SQU1をまとめて1つの符号化ユニットSQCU0 とし、
2つの量子化ユニットSQU2, SQU3をまとめて1つの符号
化ユニットSQCU1 とし、チャネル1についても同様の処
理を行っている。
【0029】符号化ユニットは量子化ユニットを一定数
ずつまとめて構成しても良いし、似た量子化精度をもつ
量子化ユニット同士をまとめて符号化ユニットを構成し
ても良い。後者の場合、符号化ユニットの構成情報を符
号化して復号器に送る必要がある。可逆圧縮の方法とし
ては、ハフマン符号化や算術符号化などのエントロピー
符号化の他、量子化値0が長く続く場合には、ランレン
グス符号化を用いても効果がある。エントロピー符号化
を行う場合、ハフマン符号化なら、ハフマン符号テーブ
ル、算術符号化ならシンボルの出現頻度のテーブルを与
える必要がある。このテーブルは符号化ユニットごとに
与える。
【0030】多重化部40は符号化モデル選択情報符号
QMSC、重み符号WC、ベクトル量子化符号VQC 、圧縮スカ
ラ量子化符号CSQCを多重化し、多重化符号ビット列とし
て出力し、例えば記憶媒体に書き込んだり、あるいは他
の装置に送信する。次にこの発明による復号化装置10
Bについて説明する。図2に示したように、入力された
多重化符号ビット列は逆多重化部50において分離さ
れ、選択情報QMSC、重み符号WC、ベクトル量子化符号VQ
C 、圧縮スカラ量子化符号CSQCを得る。選択情報QMSCは
符号化モデル選択再生部60において選択情報に再生さ
れ、係数再生部70に与えられる。符号化モデル選択再生部60 符号化モデル選択再生部60では、符号化モデル選択符
号QMSCのビット列が入力され、符号化モデル選択情報が
再生される。符号化モデル選択情報が可逆圧縮されてい
る場合、圧縮方法に対する復号化を行い、符号化モデル
選択の2値情報を得る。可逆圧縮がかけられていない場
合には、ビット列を2値の整数化して、符号化モデルの
選択情報とする。このようにして得られた符号化モデル
の選択情報は、係数再生部70に送られる。係数再生部70 係数再生部70では、逆多重化部50から、符号化装置
10Aにおける量子化・符号化部30の符号化出力であ
る係数符号(ベクトル量子化符号VQC と、圧縮スカラ量
子化符号CSQCと、重み符号WC)と選択情報が与えられ、
選択情報により指定された符号化方法に対応する復号化
を行って周波数領域係数を再生し、周波数/時間変換部
80に与える。
【0031】図6に係数再生部70の詳細を示す。係数
再生部70は可逆圧縮復号化部71と、スカラ量子化再
生部72と、周波数領域再構築部73と、ベクトル量子
化再生部74と、重み再生部75と、重み付け部76と
から構成されている。逆多重化部50により分離された
符号ビット列のうち、ベクトル量子化符号VQC のビット
列は、ベクトル量子化再生部74において、2進数を整
数表現することにより量子化インデックスに復元され、
コードブックを参照して対応するベクトルを読み出し、
そのベクトルを重みなし小帯域係数として再生する。符
号化装置10Aにおけるベクトル量子化部34を複数の
ベクトル量子化により構成した場合には、符号化装置1
0Aのベクトル量子化部34と同じ規則を用いて再生さ
れたベクトルをベクトル逆量子化により再構築し、重み
なし小帯域係数を得る。再生された重みなし小帯域係数
は、周波数領域再構築部73に送られる。
【0032】逆多重化部50からの圧縮スカラ量子化符
号CSQCのビット列は、可逆圧縮復号化部71において、
符号化装置側で可逆圧縮符号化した手法に対応する復号
化を行うことによりスカラ量子化インデックスを得、ス
カラ量子化再生部72に送られる。スカラ量子化再生部
72では、可逆圧縮復号化部71より受け取ったスカラ
量子化インデックスを量子化ユニットごとにスカラ逆量
子化して量子化値に復元することにより重みなし小帯域
係数を再生する。再生した重みなし小帯域係数は、周波
数領域再構築部73に送られる。
【0033】周波数領域再構築部73では、スカラ量子
化再生部72及びベクトル量子化再生部73より送られ
た量子化ユニットごとの重みなし小帯域係数を、符号化
モデル選択情報再生部60より受け取った符号化モデル
選択情報に従って重みなし周波数領域係数に再構築す
る。重み再生部75では、逆多重化部50から重み符号
WCのビット列を受け取り、重みを再生する。重み付け部
76では、周波数領域再構築部73で構築した重みなし
周波数領域係数に重み再生部75で得た重みを乗算して
周波数領域係数を得る。周波数/時間変換部80 周波数/時間変換部80では、整数再生部70からの周
波数領域係数に対し周波数/時間変換を行いオーディオ
信号を出力する。周波数/時間変換の方法としては、逆
離散コサイン変換(IDCT)や、逆変形離散コサイン変換(I
MDCT)を用いることができる。変換方法として逆変形離
散コサイン変換を用いる場合には、N個の入力係数を変
換して2N個の時間領域のサンプルを得る。このサンプ
ルに、窓関数を掛けた後、現フレームの前半Nサンプル
と一つ前のフレームの後半Nサンプル同士を加え合わせ
て得られたNサンプルを出力とする。
【0034】Nの値は、時間/周波数変換アルゴリズム
に適用できるどのようなものを適用しても良いが、128
から2048 の間の値を使うと最も効果が高い。また、符
号器で入力信号の性質に応じて適応的にNの値を切り替
えた場合、例えば、通常時N=2048としておき、入力音が
過渡的な時 N=512、更に大きく過渡的であったときには
N=128 とした場合、符号化装置から渡されたNの情報に
従ってNの値を決定する。
【0035】図7はこの発明による符号化方法及び復号
化方法をコンピュータで実施する場合の構成を示し、コ
ンピュータ100は、バス180を介して互いに接続さ
れたCPU110,RAM120、ROM130,入出
力インタフェース140、ハードディスク150を含ん
でいる。ROM130にはコンピュータ100を動作さ
せる基本プログラムが格納されており、ハードディスク
150には前述したこの発明による符号化方法及び復号
化方法を実行するプログラムが予め格納されている。
【0036】例えば符号化時にはCPU110はハード
ディスク150から符号化プログラムをRAM120に
ロードし、インタフェース140から入力されたオーデ
ィオ信号サンプルを符号化プログラムに従って処理する
ことにより符号化し、インタフェース140から出力す
る。復号時には、復号プログラムをハードディスク15
0からRAM120にロードし、入力符号を復号プログ
ラムに従って処理してオーディオ信号サンプルを出力す
る。
【0037】この発明による符号化方法及び復号化方法
を実行するプログラムは、内部バス180に駆動装置1
60を介して接続された外部ディスク装置170に記録
されたものを使用してもよい。あるいは、インタフェー
ス140を介して外部ネットワークからプログラムをダ
ウンロードしてハードディスク150に格納したもので
もよい。この発明による符号化・復号化方法を実行する
プログラムが記録された記憶媒体としては、磁気記録媒
体や、ICメモリや、コンパクトディスクなどのような
形態の記憶媒体であってもよい。
【0038】
【発明の効果】本発明を利用すると、低いビットレート
でのオーディオ信号の符号化において、入力音の特性に
適応した高能率な符号化を可能とする。
【図面の簡単な説明】
【図1】ベクトル量子化利用の変換符号化方法の一般的
な形態を示すブロック図。
【図2】本発明の実施例の構成を示すブロック図。
【図3】Aは符号化モデル選択アルゴリズムの一例を示
すフロー図、Bは他の選択アルゴリズムを示すフロー
図、Cは更に他の選択アルゴリズムを示すフロー図、D
は更に他の選択アルゴリズムを示すフロー図。
【図4】本発明の実施例中の量子化・符号化部の詳細な
構成を示すブロック図。
【図5】入力周波数領域係数と、小帯域と、符号化モデ
ル選択と、量子化ユニットと、符号化ユニットの構成例
を示す図。
【図6】本発明の実施例中の、係数再生部の詳細な構成
を示すブロック図。
【図7】この発明の符号化、復号化方法をプログラムに
より実施するためのコンピュータの構成を示すブロック
図。
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成12年9月20日(2000.9.2
0)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】請求項17
【補正方法】変更
【補正内容】
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA08 DA11 DA20 5J064 AA02 BA08 BA09 BA13 BA16 BB12 BC01 BC09 BC16 BC18 BC21 BC25 BC26 BC29 BD02 BD03 BD04

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】離散オーディオ信号サンプルを入力し、デ
    ィジタル符号を出力する符号化方法であって、 (a) 時間系列の信号を一定数の入力サンプルごとに時間
    /周波数変換し、周波数領域係数を得るステップと、 (b) 上記周波数領域係数を複数の係数毎にまとめた小帯
    域に分割するステップと、 (c) 各上記小帯域に対し予め決めた複数の異なる符号化
    方法のいずれかを選択する選択情報を生成するステップ
    と、 (d) 各上記小帯域を上記選択情報に従って符号化して係
    数符号を生成し、出力するステップ、とを含むことを特
    徴とするオーディオ信号符号化方法。
  2. 【請求項2】請求項1記載のオーディオ信号符号化方法
    にいおいて、上記複数の符号化方法のうちの一つは、ベ
    クトル量子化を利用した符号化方法であることを特徴と
    したオーディオ信号符号化方法。
  3. 【請求項3】請求項1又は2記載のオーディオ信号符号
    化方法において、上記複数の符号化方法のうちの一つ
    は、スカラ量子化を利用した符号化方法であることを特
    徴としたオーディオ信号符号化方法。
  4. 【請求項4】請求項3記載のオーディオ信号符号化方法
    において、上記ステップ(d) における上記スカラ量子化
    を利用した符号化方法は、入力係数をスカラ量子化して
    スカラ量子化インデックスを得るステップと、そのスカ
    ラ量子化インデックスを可逆圧縮して上記係数符号を得
    るステップとを含むことを特徴としたオーディオ信号符
    号化方法。
  5. 【請求項5】請求項1〜4のいずれかに記載のオーディ
    オ信号符号化方法において、上記ステップ(d) における
    上記符号化方法は、重みをつけた量子化を行う符号化方
    法であることを特徴としたオーディオ信号符号化方法。
  6. 【請求項6】請求項5記載のオーディオ信号符号化方法
    において、上記重みを付けた量子化は、複数の方法で求
    めた重みの積により重みを求めることを特徴としたオー
    ディオ信号符号化方法。
  7. 【請求項7】請求項2〜6のいずれかに記載のオーディ
    オ信号符号化方法において、上記ステップ(c) は、入力
    係数の形状の平坦度が所定値より小さい場合にスカラ量
    子化を利用した符号化方法を選択し、そうでない場合に
    ベクトル量子化を利用した符号化方法を選択するステッ
    プであることを特徴としたオーディオ信号符号化方法。
  8. 【請求項8】請求項2〜7のいずれかに記載のオーディ
    オ信号符号化方法において、上記ステップ(c) は、入力
    される小帯域の周波数によって符号化方法の選択を予め
    決定しておくステップであることを特徴としたオーディ
    オ信号符号化方法。
  9. 【請求項9】請求項1〜7のいずれかに記載のオーディ
    オ信号符号化方法において、上記ステップ(c) は上記選
    択情報を符号化して選択情報符号を出力するステップを
    含む。
  10. 【請求項10】ディジタル符号を入力し、オーディオ信
    号を再生する復号化方法であって、 (a) 入力されたディジタル符号から係数符号を抽出する
    ステップと、 (b) 選択情報に従って予め決められた複数の復号化方法
    の1つを選択し、選択した復号化方法により上記ステッ
    プ(a) で得られた係数符号を復号して小帯域に分割され
    た周波数領域係数を得るステップと、 (c) 上記小帯域に分割された周波数領域係数を周波数領
    域の係数に再構成するステップと、 (d) 上記再構成された周波数領域係数を周波数/時間変
    換して再生オーディオ信号を得るステップ、 とを含むことを特徴としたオーディオ信号復号化方法。
  11. 【請求項11】請求項10に記載のオーディオ信号復号
    化方法において、上記複数の復号化方法の1つはベクト
    ル逆量子化に基づいた復号化方法であることを特徴とす
    るオーディオ信号復号化方法。
  12. 【請求項12】請求項10又は11に記載のオーディオ
    信号復号化方法において、上記複数の復号化方法の1つ
    はスカラ逆量子化に基づく復号化方法であることを特徴
    とするオーディオ信号復号化方法。
  13. 【請求項13】請求項12記載のオーディオ信号復号化
    方法において、上記ステップ(b) における上記スカラ逆
    量子化に基づいた復号化方法は上記係数符号を可逆圧縮
    復号化してスカラ量子化インデックスを得るステップ
    と、そのスカラ量子化インデックスを復号して上記周波
    数領域係数を得るステップとを含むことを特徴とするオ
    ーディオ信号復号化方法。
  14. 【請求項14】請求項10〜13のいずれかに記載のオ
    ーディオ信号復号化方法において、上記ステップ(b) に
    おける上記係数符号の復号化方法は、入力された上記デ
    ィジタル符号から再生した重みを使って重み付逆量子化
    を行う復号方法であることを特徴とするオーディオ信号
    復号化方法。
  15. 【請求項15】請求項14記載のオーディオ信号復号化
    方法において、上記ステップ(b) は入力された上記ディ
    ジタル符号から重み符号を抽出するステップと、上記重
    み符号を復号して重みを得るステップと、上記係数符号
    を復号して得た周波数領域係数に上記重みを乗算して上
    記再構成された周波数領域係数を得るステップとを含む
    ことを特徴とするオーディオ信号復号化方法。
  16. 【請求項16】請求項10〜15のいずれかに記載のオ
    ーディオ信号復号化方法において、上記入力されたディ
    ジタル符号から上記選択情報符号を復号して上記選択情
    報を得るステップを更に含む。
  17. 【請求項17】請求項16に記載のオーディオ信号復号
    化方法において、上記選択情報を得るステップは上記選
    択情報を周波数により決めるステップを含む。
  18. 【請求項18】請求項1〜9のいずれかに記載のオーデ
    ィオ信号符号化方法を実施するプログラムが記録された
    記憶媒体。
  19. 【請求項19】請求項10〜17のいずれかに記載のオ
    ーディオ信号復号化方法を実施するプログラムが記録さ
    れた記憶媒体。
JP2000282129A 2000-09-18 2000-09-18 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体 Expired - Fee Related JP3557164B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000282129A JP3557164B2 (ja) 2000-09-18 2000-09-18 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000282129A JP3557164B2 (ja) 2000-09-18 2000-09-18 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体

Publications (2)

Publication Number Publication Date
JP2002091497A true JP2002091497A (ja) 2002-03-27
JP3557164B2 JP3557164B2 (ja) 2004-08-25

Family

ID=18766690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000282129A Expired - Fee Related JP3557164B2 (ja) 2000-09-18 2000-09-18 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体

Country Status (1)

Country Link
JP (1) JP3557164B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
JP2009501944A (ja) * 2005-07-15 2009-01-22 マイクロソフト コーポレーション ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
JP2009524101A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP2010522348A (ja) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
US9349376B2 (en) 2007-06-29 2016-05-24 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding
US9443525B2 (en) 2001-12-14 2016-09-13 Microsoft Technology Licensing, Llc Quality improvement techniques in an audio encoder

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9443525B2 (en) 2001-12-14 2016-09-13 Microsoft Technology Licensing, Llc Quality improvement techniques in an audio encoder
JP2006510922A (ja) * 2002-08-08 2006-03-30 クゥアルコム・インコーポレイテッド 帯域幅適応性量子化方法と装置
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
JP2009501944A (ja) * 2005-07-15 2009-01-22 マイクロソフト コーポレーション ディジタル・メディア・スペクトル・データの効率的コーディングに使用される辞書内のコードワードの変更
KR101330362B1 (ko) 2005-07-15 2013-11-15 마이크로소프트 코포레이션 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스
JP2009524101A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP2009524100A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP2010522348A (ja) * 2007-03-20 2010-07-01 サムスン エレクトロニクス カンパニー リミテッド オーディオ信号のエンコーディング方法及び装置、そしてオーディオ信号のデコーディング方法及び装置
US9349376B2 (en) 2007-06-29 2016-05-24 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding
US9741354B2 (en) 2007-06-29 2017-08-22 Microsoft Technology Licensing, Llc Bitstream syntax for multi-process audio decoding

Also Published As

Publication number Publication date
JP3557164B2 (ja) 2004-08-25

Similar Documents

Publication Publication Date Title
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
JP5200028B2 (ja) 符号化および復号化のための装置
US7689427B2 (en) Methods and apparatus for implementing embedded scalable encoding and decoding of companded and vector quantized audio data
JP5027799B2 (ja) 符号化効率向上のためのパラメータの適応グループ化
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
CN1905010B (zh) 编码音频数据的设备和方法及解码音频数据的设备和方法
US7333929B1 (en) Modular scalable compressed audio data stream
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
EP1047047B1 (en) Audio signal coding and decoding methods and apparatus and recording media with programs therefor
KR20080102027A (ko) 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP3434260B2 (ja) オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体
US20080097757A1 (en) Audio coding
JP4978539B2 (ja) 符号化装置、符号化方法及びプログラム。
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
KR102204136B1 (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
JP3557164B2 (ja) オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体
JPH09106299A (ja) 音響信号変換符号化方法および復号化方法
JP2001044847A (ja) 可逆符号化方法、可逆復号化方法、これらの装置及びその各プログラム記録媒体
JP2001507822A (ja) スピーチ信号のエンコード方法
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
JP4191503B2 (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JPH10276095A (ja) 符号化器及び復号化器

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040420

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040514

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090521

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100521

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110521

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120521

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130521

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140521

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees