JP3344962B2 - オーディオ信号符号化装置、及びオーディオ信号復号化装置 - Google Patents

オーディオ信号符号化装置、及びオーディオ信号復号化装置

Info

Publication number
JP3344962B2
JP3344962B2 JP06533599A JP6533599A JP3344962B2 JP 3344962 B2 JP3344962 B2 JP 3344962B2 JP 06533599 A JP06533599 A JP 06533599A JP 6533599 A JP6533599 A JP 6533599A JP 3344962 B2 JP3344962 B2 JP 3344962B2
Authority
JP
Japan
Prior art keywords
band
unit
audio signal
encoding
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06533599A
Other languages
English (en)
Other versions
JPH11330977A (ja
Inventor
智一 石川
峰生 津島
武志 則松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP06533599A priority Critical patent/JP3344962B2/ja
Publication of JPH11330977A publication Critical patent/JPH11330977A/ja
Application granted granted Critical
Publication of JP3344962B2 publication Critical patent/JP3344962B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号符
号化装置、及びオーディオ信号復号化装置に関し、特
に、音声信号や音楽信号などのオーディオ信号から得ら
れる特徴量、特にオーディオ信号を直交変換等の手法を
用いて、時間領域から周波数領域に変換した信号を用
い、その変換した信号を原オーディオ信号と比較して、
できるだけ少ない符号列で表現するために効率的に符号
化する装置と、符号化された信号である符号化列のすべ
て、あるいはその一部のみを用いて、高い品質と広帯域
なオーディオ信号を、復号可能な構成の復号化装置に関
するものである。
【0002】
【従来の技術】オーディオ信号を効率的に符号化、およ
び復号化する様々な手法が提案されている。音楽信号な
ど、20kHz以上の周波数帯域を有するオーディオ信号
の圧縮符号化式には、MPEGオーディオ方式や、Twin VQ
(TC-WVQ)方式などがある。MPEG方式に代表される
符号化方式は、時間軸のディジタルオーディオ信号を、
コサイン変換などの直交変換を用いて、周波数軸上のデ
ータに変換し、その周波数軸上の情報を、人間の聴覚的
な感度特性を利用して、聴覚的に重要な情報から符号化
していく方式であり、聴覚的に重要でない情報や、冗長
な情報は符号化しない方式である。一方、Twin VQ (TC
-WVQ)方式は、ベクトル量子化手法を用いて、原ディジ
タル信号の情報量に対して、かなり少ない情報量で表現
しようとする符号化方式がある。MPEGオーディオ、
および Twin VQ (TC−WVQ) は、それぞれISO/IEC
標準IS-11172-3、およびT.Moriya,H.Suga:An 8 Kbi
tstransform coder for noisy channels, Proc.IC
ASSP 89,pp196-199、などに述べられている。
【0003】ここで、図10を用いて、一般の、Twin V
Q 方式の概要を説明する。
【0004】原オーディオ信号101を解析長判定部1
02に入力し、解析長を算出する。また同時に、解析長
判定部102は解析長112を量子化し、解析長符号列
111を出力する。次に、その解析長112に従って、
時間周波数変換部103で、原オーディオ信号101を
周波数領域の原オーディオ信号104に変換する。次
に、周波数領域の原オーディオ信号104は、正規化処
理部(平坦化処理部)106で正規化処理(平坦化処
理)され、正規化処理後のオーディオ信号108を得
る。正規化処理は、原オーディオ信号104から周波数
概形105を計算し、原オーディオ信号104を算出し
た周波数概形105で割ることにより行われる。さら
に、正規化処理部106は、正規化処理に用いた周波数
概形情報を量子化し、正規化符号列107を出力する。
次に、正規化処理後のオーディオ信号108を、ベクト
ル量子化部109により量子化し、符号列110が得ら
れる。
【0005】近年、復号器に入力する符号列の一部を用
いても、オーディオ信号を再生することができる構造を
持つものがある。上記の構造を、スケーラブル構造と呼
び、スケーラブル構造を実現できるように符号化するこ
とを、スケーラブルコーディングと呼ぶ。
【0006】図11に一般の、Twin VQ 方式で採用され
ている、固定スケーラブルコーディングの一例を示す。
原オーディオ信号1301から解析長判定部1303に
より判定された解析長1314に従って、時間周波数変
換部1302により、周波数領域の原オーディオ信号1
304を得る。次に、周波数領域の原オーディオ信号1
304を、低域符号化器1305に入力すると、量子化
誤差1306と、低域符号列1311とが出力される。
さらに、量子化誤差1306を中域符号化器1307に
入力すると、量子化誤差1308と、中域符号列131
2とが出力される。さらに、量子化誤差1308を高域
符号化器1309に入力すると、量子化誤差1310
と、高域符号列1313とが出力される。ここで、上記
低域、または中域、または高域符号化器は、正規化処理
部と、ベクトル量子化部とを併せ持ち、その出力は、量
子化誤差、および正規化処理部、ならびにベクトル量子
化部により出力された各符号列を含む、低域、中域、ま
たは高域符号列を、出力するものである。
【0007】
【発明が解決しようとする課題】従来方式の固定スケー
ラブルコーディングでは、図11に示すように、低域、
中域、高域の各帯域量子化器が固定されているため、図
12に示すように、原オーディオ信号の分布に対して、
量子化誤差をできるだけ少なくするように符号化するこ
とが困難であった。それゆえ、多種多様な性質や分布を
持つオーディオ信号の符号化を行う際には、十分な性能
を発揮できず、高音質で高効率なスケーラブルコーディ
ングを行なうことが困難であった。
【0008】本発明は上記の問題点を解消するためにな
されたもので、多種多様なオーディオ信号の符号化に際
して、オーディオ信号を符号化する際、図13に示すよ
うに、多種多様なオーディオ信号を適応的にスケーラブ
ルコーディングすることにより、効率よく、低ビットレ
ートで、かつ、高音質に、符号化を行なうことのできる
オーディオ信号符号化装置、及びオーディオ信号復号化
置を提供することを目的としている。
【0009】
【課題を解決するための手段】この課題を解決するため
に、本発明にかかるオーディオ信号符号化装置、及び
ーディオ信号復号化装置は、固定スケーラブルコーディ
ング手段を用いず、原オーディオ信号の性質,分布にあ
わせて符号化する周波数範囲を変化させる適応スケーラ
ブルコーディングを行なうものとしたものである。
【0010】本発明に係るオーディオ信号符号化装置
は、特性判定部、符号化帯域制御部、符号化部を備え、
時間−周波数変換されたオーディオ信号を符号化列に変
換するオーディオ信号符号化装置であって、符号化列
は、符号化情報と帯域制御符号列とを含み、符号化部
は、複数の符号化器を有し、符号化帯域制御部の制御に
よりオーディオ信号の多段符号化を行い符号化情報を出
力し、特性判定部は、入力されるオーディオ信号を判定
し、符号化する各周波数帯域の重み付けを示す帯域重み
情報を出力し、符号化帯域制御部は、帯域重み情報に基
づいて、多段符号化を構成する各符号化器の量子化帯
域、接続順を決定し、決定した各符号化器の量子化帯
域、接続順に基づいてスケーラブルに構成される多段符
号化を符号化部に行わせ、決定した各符号化器の量子化
帯域、接続順を示す帯域制御符号列を出力するものであ
る。
【0011】本発明に係るオーディオ信号符号化装置
は、前記オーディオ信号符号化装置において、符号化帯
域制御部が、予め定義された多段符号化のいずれかにな
るように、各符号化器の量子化帯域と、各符号化器の接
続順とを決定するものである。
【0012】本発明に係るオーディオ信号符号化装置
は、前記オーディオ信号符号化装置において、符号化部
が、量子化誤差を出力し、符号化帯域制御部が、帯域重
み情報と量子化誤差とに基づいて、各符号化器の量子化
帯域と、各符号化器の接続順とを決定するものである。
【0013】本発明に係るオーディオ信号復号化装置
は、復号化帯域制御部、復号化部を備え、符号化情報と
帯域制御符号列とを含む符号化列をオーディオ信号に復
号するオーディオ信号復号化装置であって、帯域制御符
号列は、符号化情報を多段符号化した際の各符号化器の
量子化帯域、接続順を示し、復号化部は、複数の復号化
器を有し、復号化帯域制御部の制御により符号化情報の
多段復号化を行い、復号化帯域制御部は、帯域制御符号
列に基づいてスケーラブルに構成される多段復号化を復
号化部に行わせるものである。
【0014】
【0015】
【0016】
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】
【0033】
【0034】
【0035】
【0036】
【0037】
【0038】
【0039】
【0040】
【0041】
【0042】
【0043】
【0044】
【0045】
【0046】
【0047】
【0048】
【発明の実施の形態】以下、本発明の実施の形態1につ
いて、図1ないし図9を用いて、また、実施の形態2に
ついて、図14ないし図20を用いて、説明する。
【0049】(実施の形態1)図1は、本発明の実施の
形態1による、適応スケーラブルコーディングを行な
う、オーディオ信号符号化装置のブロック図を示す。図
1において、1001は原オーディオ信号501を符号
化する符号化装置である。該符号化装置1001におい
て、502は上記原オーディオ信号501を解析する際
の解析長504を判定する解析長判定部、503は上記
解析長504の単位で、原オーディオ信号501の時間
軸を周波数軸に変換する時間周波数変換部、504は上
記解析長判定部502で判定された解析長、505は原
オーディオ信号のスペクトル、701は該原オーディオ
信号のスペクトル505が入力されるフィルタ、506
は原オーディオ信号のスペクトル505の特性を判定
し、上記符号化装置1001における複数の各段の各符
号化器511,512,513,511b等、の量子化
するオーディオ信号の周波数帯域を決定する特性判定
部、507は該特性判定部506で決定された各符号化
器の周波数帯域と、上記周波数変換されたオーディオ信
号をその入力とし、複数の各段の各符号化器512,5
13,514,511b等、の接続順を決定し、各符号
化器の量子化帯域、及び接続順を符号列に変換する符号
化帯域制御部、508は、該符号化帯域制御部507よ
り出力される上記符号列である帯域制御符号列、510
は上記解析長判定部502より出力された上記解析長5
04を符号列とした解析長符号列、511,512,5
13は、上述した、それぞれ低域,中域,高域の信号を
符号化する低域符号化器、中域符号化器、高域符号化
器、511bは第1段の低域符号化器511の量子化誤
差518を符号化する第2段低域符号化器、521,5
22,523は該各符号化器511,512,513か
ら出力される符号化信号である低域符号列、中域符号
列、高域符号列、521bは第2段低域符号化器511
bの符号化出力である第2段低域符号列、518,51
9,520は該各符号化器511,512,513から
出力される、符号化される前の信号と上記各符号化信号
との差である量子化誤差、518bは第2段低域符号化
器511bの量子化誤差である第2段量子化誤差であ
る。
【0050】一方、1002は上記符号化装置1001
で符号化された符号化列を復号化する復号化装置であ
る。該復号化装置1002において、5は上記符号化装
置1001における時間周波数変換部503と逆の変換
を行なう周波数時間変換部、6は時間軸上で窓関数を乗
じる窓掛けを行なう窓掛け部、7はフレーム重ねあわせ
部、8は復号信号、9は帯域合成部、1201は復号化
帯域制御部、1202,1203,1204は、それぞ
れ上記低域符号化器、中域符号化器、高域符号化器51
1,512,513に対応して、復号化を行なう低域復
号化器、中域復号化器、高域復号化器、1202bは第
1段低域復号化器1202の出力を復号化する第2段低
域復号化器である。
【0051】ここで、第2段以降の符号化器、復号化器
はさらに他の帯域にも、またさらに、多段にも設けても
よいものであり、これが多段になるほど、必要に応じ
て、符号化、復号化の精度を向上できるものである。
【0052】以下、先ず、符号化装置1001の動作に
ついて説明する。符号化しようとする原オーディオ信号
501は、時間的に連続するディジタル信号系列である
とする。例えば、音声信号を、サンプリング周波数48
kHzで16ビットに量子化したディジタル信号である
とする。
【0053】上記原オーディオ信号501を解析長判定
部502に入力する。上記解析長判定部502は、入力
された上記原オーディオ信号501の特性を判断し、解
析長504を決定し、その結果は解析長符号列510と
して、復号化装置1002に送られる。解析長504と
しては、たとえば256、1024、4096などが用
いられる。例えば、原オーディオ信号501に含まれる
高域周波数成分が所定の値を超える場合には、解析長5
04を256とし、低域周波数成分が所定の値を超え、
かつ高域周波数成分が所定の値より小さい場合には、解
析長504を4096とし、それ以外の場合は、解析長
504を1024とする。こうして決定された解析長5
04に従って、時間周波数変換部503により原オーデ
ィオ信号501のスペクトル505を算出する。
【0054】図2に、本発明の実施の形態1によるオー
ディオ信号符号化装置における、時間周波数変換部50
3のブロック図を示す。上記原オーディオ信号501
は、そのサンプル値が所定のサンプル数に達するまでフ
レーム分割部201で蓄積され、該蓄積されたサンプル
数が、上記解析長判定部502で決定された解析長50
4に達すると、出力を行なう。また、フレーム分割部2
01は、あるシフト長ごとに出力を行う構成のものであ
り、例えば、解析長504を4096サンプルとした場
合において、解析長504の半分のシフト長を設定すれ
ば、解析長504が2048サンプルに達するに相当す
る時間ごとに、最新の4096サンプルを出力するなど
の構成を持つ。当然ながら、解析長504や、サンプリ
ング周波数が変わっても、同様に、シフト長を解析長5
04の半分に設定した構成を持つことは可能である。そ
して、このフレーム分割部201からの出力は、後段の
窓掛け部202へと入力される。窓掛け部202では、
フレーム分割部201からの出力に対して、時間軸上で
窓関数を乗じて、窓掛け部202の出力とする。この様
子は、例えば、(数1)で示される。
【0055】
【数1】 ただし、ここで、xiはフレーム分割部201からの出
力で、hiは窓関数、hxiは窓掛け部202からの出
力である。まだ、iは時間のサフィックスである。な
お、(数1)で示した窓関数hiは一例であり、窓関数
は必ずしも、(数1)のものである必要はない。
【0056】窓関数の選択は、窓掛け部202に入力さ
れる信号の特徴と、フレーム分割部201の解析長50
4と、時間的に前後に位置するフレームにおける窓関数
の形状とに依存する。例えば、窓掛け部202に入力さ
れる信号の特徴として、フレーム分割部201の解析長
504をNとした場合、N/4ごとに入力される信号の
平均パワーを算出して、その平均パワーが非常に大きく
変動する場合は、解析長504をNよりも短くして(数
1)に示した演算を実行する、などの選択を行う。ま
た、前の時刻のフレームの窓関数の形状と、後ろのフレ
ームの窓関数の形状とに応じて、現在の時刻のフレーム
の窓関数の形状に歪みがないように、適宜選択するのが
望ましい。
【0057】次いで、窓掛け部202からの出力は、M
DCT部203に入力され、ここで変形離散コサイン変
換が施され、MDCT係数が出力される。変形離散コサ
イン変換の一般式は、(数2)で表される。
【0058】
【数2】 このようにMDCT部203の出力であるMDCT係数
は、(数2)中の、ykで表せるとすると、MDCT部2
03の出力は周波数特性を示し、ykの変数k が0に近い
ほど、低い周波数成分に、0から増大してN/2-1 に近く
なるほど、高い周波数成分に、線形に対応する。こうし
て算出された上記MDCT係数が、原オーディオ信号の
スペクトル505となる。
【0059】次に、上記原オーディオ信号のスペクトル
505をフィルタ701へと入力する。該フィルタ70
1の入力を、x701(i)、出力を、y701(i)
とすると、例えば、(数3)で表されるフィルタを用い
る。
【0060】
【数3】 ここで、fsは解析長504である。(数3)で表され
るフィルタ701は、一種の移動平均フィルタである
が、当然ながら、移動平均フィルタに限定する必要はな
く、他の、たとえば高域通過フィルタであってもいい
し、帯域抑制フィルタであっても良い。
【0061】フィルタ701の出力と、解析長判定部5
02で算出した解析長504とを、特性判定部506に
入力する。図6に、特性判定部506の詳細を示す。特
性判定部506では、原オーディオ信号501、および
原オーディオ信号のスペクトル505、の聴覚的、物理
的な特性を決定する。原オーディオ信号501、および
該スペクトル505の聴覚的、物理的特性とは、例え
ば、音声か、音楽か、の違いである。音声の場合、たと
えば6kHzより低域に、大半の周波数成分があるもので
ある。
【0062】次に、特性判定部506の動作を、図6を
用いて説明する。特性判定部506に入力された原オー
ディオ信号のスペクトル505をフィルタ701によっ
てフィルタリングした信号を、x506(i)とする
と、このx506(i)を基に、スペクトルパワーp5
06(i)を、(数4)により、スペクトルパワー計算
部803で計算する。
【0063】
【数4】 このスペクトルパワーp506(i)を、符号化帯域制
御部507の入力の一つとし、各符号化器の帯域制御重
み517とする。また、解析長504が小さい場合、例
えば256なるとき、各符号化器を固定的に配置するよ
う、配置決定部804で決定し、符号化帯域制御部50
7へと、符号化帯域配置情報516を、固定配置として
送る。
【0064】解析長504が小さい場合以外の場合、た
とえば4096や1024のときは、各符号化器を動的
に配置するよう、配置決定部804で決定し、符号化帯
域制御部507へと、符号化帯域配置情報516を、動
的配置として送る。
【0065】次に、符号化帯域制御部507の動作を、
図7を用いて説明する。符号化帯域制御部507には、
上記特性判定部506からの出力である帯域制御重み5
17と、符号化帯域配置情報516、および原オーディ
オ信号のスペクトル505をフィルタ701でフィルタ
リングした信号と、各符号化器の出力した量子化誤差5
18、または519、または520が入力される。ただ
し、これらの入力があるのは、各符号化器511、51
2、513、511bと、符号化帯域制御部507と
が、再帰的に動作するためであり、初回の符号化帯域制
御部507の動作においては、量子化誤差がないため、
量子化誤差を除いた3つの入力となる。
【0066】上記のように、解析長504が小さく、符
号化帯域配置情報516が固定配置となる場合は、予め
定義された帯域の固定配置に従って、符号化を、低域か
ら中域、高域へと順に実行するよう、量子化順序決定部
902、および、符号化器数決定部903、帯域幅算出
部901により、符号化器の量子化帯域,個数,接続順
を決定し、符号化を行う。即ち、その時の帯域制御符号
列508には、符号化器の帯域情報、符号化器数、およ
び、その接続順序が、情報として符号化される。
【0067】たとえば、各符号化器の符号化帯域、およ
び符号化器数を、それぞれ0Hz 〜4kHzに1つ、0Hz 〜8k
Hzに1つ、4kHz〜12kHz に1つ、8kHz〜16kHz に2つ、
16kHz 〜24kHz に3つ、となるように、符号化器を配置
し、符号化を行う。
【0068】次に、符号化帯域配置情報516が動的配
置になっている場合の、符号化帯域制御部507の動作
について説明する。符号化帯域制御部507は、各符号
化器の量子化帯域幅を決定する帯域幅算出部901、各
符号化器の量子化順序を決定する量子化順序決定部90
2、さらに各帯域の符号化器の数を決定する符号化器数
決定部903、の3つよりなる。符号化帯域制御部50
7に入力された信号をもとに、各符号化器の帯域幅を決
定する訳であるが、所定の帯域、例えば、0Hz 〜4kHz、
0kHz〜8kHz、4kHz〜12kHz 、8kHz〜16kHz 、16kHz 〜24
kHz の各帯域において、帯域制御重み517、および各
符号化器が符号化した後の量子化誤差、を乗算したもの
の平均値を算出する。ここで、帯域制御重み517を、
weight517(i)、量子化誤差を、err507(i) とすると、
(数5)により、平均値を算出する。
【0069】
【数5】 ここで、jは各帯域のインデックス、Ave901(j) は、帯
域jにおける平均値、fupper(j) 、およびflower(j)
は、帯域jの上限周波数、および下限周波数である。こ
うして得られた平均値 Ave901(j)が最大となるjを検索
し、それが、符号化器が符号化する帯域となる。さら
に、検索されたjの値を、符号化器数決定部903に送
り、jに対応する帯域の符号化器数を一つ増やすように
し、所定の符号化帯域にいくつの符号化器が存在するの
かを記憶しておき、記憶している符号化器数の合計が、
予め決定しておいた符号化器の総数になるまで、符号化
を繰り返す。最後に、符号化器の帯域、および符号化器
数を、帯域制御符号列508として、復号化器へと伝送
する。
【0070】次に、符号化器3の動作について、図3を
用いて説明する。符号化器3は、正規化部301と、量
子化部302とからなる。正規化部301では、フレー
ム分割部201からの出力である時間軸の信号と、MD
CT部203からの出力であるMDCT係数、との両者
を入力として、いくつかのパラメータを用いて、MDC
T係数を正規化する。ここで、MDCT係数の正規化と
は、低域成分と高域成分とで非常に大きさに違いのある
MDCT係数の大きさのばらつきを抑圧することを意味
し、例えば、低域成分が高域成分に対して非常に大きい
場合などは、低域成分では大きな値、高域成分では小さ
な値、となるようなパラメータを選出し、これで上記M
DCT係数を除算することにより、MDCT係数の大き
さのばらつきを抑圧することを指す。また正規化部30
1では、正規化に用いたパラメータを表現するインデッ
クスを、正規化符号列303として符号化する。
【0071】量子化部302では、正規化部301で正
規化されたMDCT係数を入力として、MDCT係数の
量子化を行う。この際、該量子化部302は、該量子化
した値と、コードブック中にある複数のコードインデッ
クスに対応する各量子化出力、との間の差が最も小さく
なるような,そのような該コードイッデックスを出力す
る。この場合、上記量子化部302で量子化した値と、
該量子化部302から出力されるコードインデックスに
対応する値、との差が量子化誤差である。
【0072】次に、図4を用いて、上記正規化部301
の詳細な一例を説明する。図4において、401はフレ
ーム分割部201とMDCT部203の出力を受ける周
波数概形正規化部、402は上記周波数概形正規化部4
01の出力を受け、帯域テーブル403を参照して、正
規化を行う帯域振幅正規化部である。
【0073】次に、動作について説明する。周波数概形
正規化部401では、フレーム分割部201からの時間
軸上のデータ出力を用いて、大まかな周波数の概形であ
る周波数概形を算出し、MDCT部203からの出力で
あるMDCT係数を除算する。周波数概形を表現するの
に用いたパラメータは、正規化符号列303として符号
化される。帯域振幅正規化部402では、周波数概形正
規化部401からの出力信号を入力として、帯域テーブ
ル403で示された帯域ごとに正規化を行う。例えば、
周波数概形正規化部401の出力であるMDCT係数
が、dct(i)(i = 0〜2047) とし、帯域テーブル403
が、例えば、(表1)に示されるようなものであるとす
ると、(数6)などを用いて、各帯域毎の振幅の平均値
を算出する。
【0074】
【表1】
【数6】 ここで、bjlow,bjhighは、帯域テーブル403に示され
たj 番目の帯域におけるdct(i)が属する最も低域のイン
デックスi と、最も高域のインデックスi をそれぞれ示
している。また、p は距離計算におけるノルムであり、
2 などが望ましい。avejは、各帯域番号j における振幅
の平均値である。帯域振幅正規化部402では、avejを
量子化して、qavej を算出して、例えば、(数7)を用
いて正規化する。
【0075】
【数7】 avejの量子化は、スカラーの量子化を用いてもよいし、
コードブックを用いてベクトル量子化を行ってもよい。
帯域振幅正規化部402では、qavej を表現するのに用
いたパラメータのインデックスを、正規化符号列303
として符号化する。
【0076】なお、符号化器における正規化部301の
構成は、図4の周波数概形正規化部401と、帯域振幅
正規化部402、との両者を用いた構成のものを示した
が、周波数概形正規化部401のみを用いた構成でもよ
く、帯域振幅正規化部402のみを用いた構成でもよ
い。さらに、MDCT部203から出力されるMDCT
係数の低域成分と、高域成分とで大きなばらつきがない
場合には、上記両者を用いない構成で、MDCT部20
3の出力信号を、そのまま量子化部302に入力する構
成としてもよい。
【0077】次に、図5を用いて、図4の周波数概形正
規化部401の詳細について説明する。図5において、
601はフレーム分割部201の出力を受ける線形予測
分析部、602は線形予測分析部601の出力を受ける
概形量子化部、603はMDCT部203の出力を受け
る包絡特性正規化部である。
【0078】次に、上記周波数概形正規化部401の動
作について、図5を参照して説明する。上記線形予測分
析部601では、フレーム分割部201からの時間軸上
のオーディオ信号を入力として、線形予測分析(Linear
Predictive Coding)を行う。線形予測分析の線形予
測係数(LPC係数)は、ハミング窓などの窓掛けされ
た信号の自己相関関数を算出し、正規方程式などを解く
ことで、一般に算出可能である。算出された線形予測係
数は、線スペクトル対係数(LSP(Line Spectrum
Pair) 係数)などに変換され、概形量子化部602で量
子化される。ここでの量子化手法としては、ベクトル量
子化を用いてもよいし、スカラー量子化を用いてもよ
い。そして、概形量子化部602で量子化されたパラメ
ータが表現する周波数伝達特性を、包絡特性正規化部6
03で算出し、MDCT部203からの出力であるMD
CT係数を、これで除算することによって正規化する。
具体的な算出例としては、概形量子化部602で量子化
されたパラメータと等価な線形予測係数を、qlpc(i) と
すれば、包絡特性正規化部603で算出される上記周波
数伝達特性は、例えば、(数8)で表すことができる。
【0079】
【数8】 ここで、ORDER は10〜40くらいが望ましい。fft()
は高速フーリエ変換を意味する。算出された周波数伝達
特性env(i)を用いて、包絡特性正規化部603では、例
えば、下記に示す(数9)を用いて、正規化を行う。
【0080】
【数9】 ここで、mdct(i) はMDCT部203からの出力信号
で、fdct(i) は正規化された包絡特性正規化部603か
らの出力信号である。次に図8を用いて、上記符号化装
置1における量子化部302の量子化方法の詳細な動作
について説明する。量子化部302に入力されるMDC
T係数1001は、そのMDCT係数1001から幾つ
かを抜き出して、音源サブベクトル1003を構成す
る。同様に、正規化部301で、正規化部301の入力
であるMDCT係数を、正規化部301の出力であるM
DCT係数で割った係数列を、正規化成分1002とし
た時、この正規化成分1002についても、MDCT係
数1001から音源サブベクトル1003を抜き出した
のと同じ規則で、該正規化成分1002からサブベクト
ルの抽出を行い、重みサブベクトル1004を構成する
ことができる。音源サブベクトル1003、および重み
サブベクトル1004を、MDCT係数1001および
正規化成分1002からそれぞれ抽出する規則は、例え
ば、(数10)で示す方法などがある。
【0081】
【数10】 ここで、i 番目の音源サブベクトルのj 番目の要素はsu
bvector i(j) であり、MDCT係数1001はvector
()であり、MDCT係数1001の総要素数がTOTAL
で、音源サブベクトル1003の要素数がCR、VTOTAL
は、TOTAL と同じ値かより大きい値で、VTOTAL/CR が正
数値になるように設定する。例えば、TOTAL が2048
の時、CRが19で、VTOTALが2052、CRが23
で、VTOTALが2070、CRが21で、VTOTALが207
9などである。重みサブベクトル1004も、数10の
手順で抽出可能である。ベクトル量子化器1005で
は、コードブック1009中のコードベクトルの中か
ら、音源サブベクトル1003との距離が、重みサブベ
クトル1004で重み付けて最も小さくなるものを探
し、その最小の距離を与えたコードベクトルのインデッ
クスと、最小の距離を与えたコードベクトルと入力音源
サブベクトル1003との量子化誤差に相当する残差サ
ブベクトル1010とを出力する。
【0082】実際の計算手順例においては、ベクトル量
子化器1005が、距離計算手段1006,コード決定
手段1007,残差生成手段1008、の3つの構成要
素からなるものとして、説明する。距離計算手段100
6では、例えば、(数11)を用いて、i 番目の音源サ
ブベクトル1003と、コードブック1009のk 番目
のコードベクトル、との距離を算出する。
【0083】
【数11】 ここで、wjは、重みサブベクトルのj 番目の要素、Ck
(j) は、k 番目のコードベクトルのj 番目の要素、R、
Sは、距離計算のノルムであり、R、Sの値としては、
1, 1.5, 2 などが望ましい。なお、このノルムRとS
は、同一の値である必要はない。dik は、i 番目の音源
サブベクトルに対するk 番目のコードベクトルの距離を
意味する。コード決定手段1007では、(数11)な
どで算出された距離の中で、最小となるコードベクトル
を選出し、そのインデックスを符号列304として符号
化する。例えば、複数の上記dik があるうちの,diu が
最小値である場合、i 番目のサブベクトルに対する符号
化されるインデックスは、u となる。残差生成手段10
08では、コード決定手段1007で選出したコードベ
クトルを用いて、(数12)により残差サブベクトル1
010を生成する。
【0084】
【数12】 ここで、i 番目の残差サブベクトル1010のj 番目の
要素は、resi(j) であり、コード決定手段1007で選
出されたコードベクトルのj番目の要素を、Cu(j) とす
る。上記残差サブベクトル1010を用いて(数10)
の逆過程の演算を行ってベクトルを求め、該ベクトル
と、当該符号化器の元々の符号化対象であったベクトル
との差を、それ以降の各符号化器の量子化対象となるM
DCT係数として保持する。ただし、ある帯域の符号化
が、それ以降の符号化器に影響を与えない帯域に対して
符号化を行っている場合、つまり、以降の符号化器が符
号化をすることがない場合は、残差生成手段1008に
よる,残差サブベクトル1010,MDCT1011の
生成は必要ない。なお、コードブック1009が持つコ
ードベクトルの個数はいくつでもよいが、メモリ容量、
計算時間等を考慮すると、64程度とすることが好まし
い。
【0085】なお、上記ベクトル量子化器1005の他
の例としては、以下のような構成も可能である。すなわ
ち、距離計算手段1006では、(数13)を用いて距
離を算出する。
【0086】
【数13】 ただし、Kは、コードブック1009のコード検索に用
いるコードベクトルの総数である。コード決定手段10
07では、(数13)で算出された距離dik の最小値を
与えるk を選出し、そのインデックスを符号化する。た
だし、k は0から2K-1までの値となる。残差生成手段1
008では、(数14)を用いて残差サブベクトル10
10を生成する。
【0087】
【数14】 ここで、コードブック1009が持つコードベクトルの
個数はいくつでもよいが、メモリの容量、計算時間等を
考慮すると、64程度とすることが好ましい。また、上
記では、重みサブベクトル1004を、正規化成分10
02のみから生成する構成について述べたが、重みサブ
ベクトル1004に、人間の聴覚特性を考慮した重みを
さらに乗じて、重みサブベクトルを生成することも可能
である。以上のようにして、複数の各段の各符号化器の
帯域幅、符号化器の個数、及び、接続順序が動的に決定
される。そして、こうして決定された各符号化器の情報
を基に、量子化を行なう。
【0088】一方、復号化装置1002では、各帯域の
符号化器の出力である正規化符号列と、該正規化符号列
に対応した量子化部からの符号列、さらに符号化装置に
おける符号化帯域制御部の出力である帯域制御符号列、
また解析長判定部の出力である解析長符号列、を用い
て、復号を行う。
【0089】図9に、復号化器1202、1203、…
の構成を示す。各復号化器は、正規化されたMDCT係数を
再生する逆量子化部1101と、正規化係数を復号し、
上記再生された正規化されたMDCT係数と、正規化係数と
を乗算する逆正規化部1102とからなる。
【0090】逆正規化部1102では、各符号化器の正
規化部301からの正規化符号列303から、符号化装
置1で正規化に用いたパラメータの復元を行い、逆量子
化部1101の出力と、該パラメータとを乗算し、MD
CT係数の復元を行う。
【0091】復号化帯域制御部1201では、符号化帯
域制御部507の出力である帯域制御符号列508を用
いて、符号化装置で用いた符号化器の配置や、符号化器
の個数の情報を復元し、その情報に基づいて各帯域に各
復号化器1202、1203、1204、1202bを
配置し、符号化装置での各符号化器511、512、5
13、511bの符号化順序とは逆順に帯域を合成する
帯域合成部9により、MDCT係数を得る。こうして得られ
た該MDCT係数を入力とする周波数時間変換部5では、逆
MDCTを行い、周波数領域の信号から時間領域の信号
への復元を行う。上記逆MDCT係数の計算は、例えば、
(数15)で示される。
【0092】
【数15】 ここで、yykは帯域合成部9で復元されたMDCT係
数で、xx(n)は逆MDCT係数であり、これを周波
数時間変換部5の出力とする。窓掛け部6では、周波数
時間変換部5からの出力xx(i)を用いて窓掛けを行
う。窓掛けは、符号化装置1の時間周波数変換部503
にある窓掛け部202で用いた窓を用い、たとえば、
(数16)で示される処理を行う。
【0093】
【数16】 ここで、 z(i) は窓掛け部6の出力である。フレーム重
ね合わせ部7では、窓掛け部6からの出力を用いて、オ
ーディオ信号を再生する。窓掛け部6からの出力は、時
間的に重複した信号となっているので、フレーム重ね合
わせ部7では、例えば、(数17)を用いて、復号化装
置1002の出力信号とする。
【0094】
【数17】 ここで、zm(i) は、第m 時刻フレームの第i番目の窓掛
け部6の出力信号 z(i) で、zm-1(i) は、第m-1 時刻フ
レームの第i番目の窓掛け部6の出力信号とし、SHIFT
は、符号化装置の解析長504に相当するサンプル数、
out m(i)は、フレーム重ね合わせ部7の第m時刻フレー
ムにおける復号化装置1002の出力信号とする。ま
た、本実施の形態1においては、以下のように、符号化
帯域制御部507において、帯域幅算出部901で算出
する量子化可能周波数範囲を、解析長504により制限
することもある。たとえば、解析長504が256の場
合、各符号化器の量子化可能周波数範囲の下限を4kHz
程度、上限を24kHz程度にする。解析長が1024あ
るいは2048の場合、下限を0Hz、上限を16kHz程
度にする。さらに一度、解析長504が256になれ
ば、その後一定時間の間、たとえば20msec程度の
間、各量子化器の量子化可能周波数範囲や、量子化器の
配置を固定するように、量子化順序決定部902により
制御することもできる。この処理を用いることにより、
経時的に量子化器の配置を一定にし、聴感的な帯域の出
入り感(ある瞬間まで高い帯域が中心の音声であったも
のが、突然、低い帯域が中心の音声に変わったときのよ
うに、音声帯域の出入りがあったような感覚)が発生す
るのを抑制することができる。
【0095】このような本実施の形態1によるオーディ
オ信号符号化装置,及び復号化装置では、複数の各段の
符号化器の量子化するオーディオ信号の周波数帯域を決
定する特性判定部と、上記特性判定部で決定された周波
数帯域と、周波数変換された元々のオーディオ信号とを
その入力とし、上記複数の各段の符号化器の接続順を決
定し、符号化器の量子化帯域、及び接続順を符号列に変
換する符号化帯域制御部とを備え、適応的にスケーラブ
ルコーディングを行なう構成としたので、多種多様なオ
ーディオ信号の符号化を行なう際にも、高品質,高効率
の、十分な性能を発揮できる適応スケーラブルコーディ
ングを行なうオーディオ信号符号化装置,及びこれを復
号する復号化装置を得ることができる。
【0096】(実施の形態2)図14に、本発明の実施
の形態2について、図14ないし図20を用いて説明す
る。図14は、本発明の実施の形態2による、適応スケ
ーラブルコーディングを行なう符号化装置2001、及
び復号化装置2002のブロック図を示す。図に示すよ
うに、符号化装置2001において、200105は、
符号化器の個数、ビットレート、入力オーディオ信号の
サンプリング周波数、各符号化器の符号化帯域情報、等
の符号化条件、200107は複数の各段の各符号化器
の量子化するオーディオ信号の周波数帯域を決定する特
性判定部、200109は符号化帯域配置情報、200
110は特性判定部200107で決定された周波数帯
域と、周波数変換されたオーディオ入力信号とを入力と
し、上記複数の各段の符号化器の量子化帯域、及び接続
順を符号列に変換する符号化帯域制御部、200111
は符号化列、200112は伝送符号化列合成器であ
る。
【0097】また、復号化装置2002において、20
0150は伝送符号化列分解器、200151は符号化
列、200153bは符号化列200151を入力と
し、これを復号化する各復号化器の復号化帯域を制御す
る復号化帯域制御部、200154bは復号化スペクト
ルである。
【0098】本発明の実施の形態2による符号化装置2
001は、上記実施の形態1と同じく、適応スケーラブ
ルコーディングを行なうものであるが、実施の形態1に
比し、新たに、符号化装置2001に、復号化帯域制御
部200153を含む符号化帯域制御部200110
を、復号化装置2002に、上記復号化帯域制御部20
0153と同じ処理を行なう復号化帯域制御部2001
53bを追加し、さらに、本実施の形態2の特性判定部
200107においては、上記実施の形態1における特
性判定部506のスペクトルパワー計算部803に代え
て、図16に示すように、聴覚心理モデル計算部200
602を設け、さらに、該特性判定部200107内
に、符号化条件200105と、符号化帯域算出部20
0601より計算される符号化帯域情報200702
と、配置決定部200603より出力される帯域番号2
00606とより、符号化帯域配置情報200109を
生成する符号化帯域配置情報生成手段200604を設
けたものである。
【0099】また、復号化装置2002において、20
0150は伝送符号化列分解器、200151は符号化
列、200153bは符号化列200151を入力と
し、これを復号化する各復号化器の復号化帯域を制御す
る復号化帯域制御部、200154bは復号化スペクト
ルである。
【0100】次に、本実施の形態2の動作について説明
する。本実施の形態2において、符号化しようとする原
オーディオ信号501は、上記実施の形態1と同様、時
間的に連続するディジタル信号系列であるとする。ま
ず、上記実施の形態1と同様な処理によって、原オーデ
ィオ信号のスペクトル505を得る。本実施の形態2で
は、符号化装置2001に対して、符号化器数、ビット
レート、入力オーディオ信号のサンプリング周波数、各
符号器の符号化帯域情報、を含む符号化条件20010
5を、該符号化装置2001における特性判定部200
107に入力する。特性判定部200107は、複数の
各段の各符号化器の量子化帯域、個数、及び接続順の情
報を含む符号化帯域配置情報200109を出力し、こ
れを符号化帯域制御部200110へ入力する。 符号
化帯域制御部200110には、図17に示されるよう
に、符号化帯域配置情報200109以外に、原オーデ
ィオ信号のスペクトル505が入力され、これらを基に
該符号化帯域制御部200110により制御する各符号
化器で符号化を行った符号化列200111を出力し、
これは伝送符号化列合成器200112へ入力されてこ
れにより合成され、その合成された出力が、さらに復号
化装置2002へと送信される。
【0101】復号化装置2002では、符号化装置20
01の伝送符号化列合成器200112の出力を、伝送
符号化列分解器200150で受け取り、符号化列20
0151と解析長符号列200152とに分解する。符
号化列200151は、復号化帯域制御部200153
bへと入力され、該復号化帯域制御部により制御される
各復号化器で復号化された復号化スペクトル20015
4bを得る。そして、該復号化スペクトル200154
bと、上記伝送符号化列分解器200150の出力であ
る解析長符号化列200152とから、上記実施の形態
1と同様に、周波数時間変換部5、窓掛け部6、及びフ
レーム重ね合わせ部7を用いて、復号信号8を得る。
【0102】次に、特性判定部200107の動作を、
図15〜図20を用いて説明する。該特性判定部200
107は、符号化条件200105を用いて 符号化帯
域配置情報200702を算出する符号化帯域算出部2
00601、原オーディオ信号のスペクトル505、及
び差分スペクトル200108などのスペクトル情報、
及び符号化帯域情報200702から、人間の聴覚心理
モデルに基づいて聴覚重み200605を算出する聴覚
心理モデル計算部200602、解析長503を参照し
て、これに応じて聴覚重み200605にさらに重み付
けを行い、各符号化器の帯域の配置を決定して帯域番号
200606を出力する配置決定部200603、及び
符号化条件200105と、符号化帯域算出部2006
01より計算される符号化帯域情報200702と、配
置決定部200603より出力される帯域番号2006
06とより、符号化帯域配置情報200109を生成す
る符号化帯域配置情報生成手段200604から構成さ
れる。
【0103】符号化帯域算出部200601は、符号化
装置2001が動作を開始する前に設定する符号化条件
200105を用いて、図15に示される符号化器20
03が符号化する符号化帯域の上限 fpu(k) 、下限 fpl
(k) を算出し、符号化帯域情報200702として、符
号化帯域配置情報生成手段200604に送られる。こ
こで、kは符号化帯域を扱うための数で、kが0から予
め設定された最大数である pmax になるに従って、周波
数が大きな帯域を示している。 pmax の一例は、4であ
る。符号化帯域算出部200601の動作の一例を、表
2に示す。
【0104】
【表2】 聴覚心理モデル計算部200602は、フィルタ701
からの出力信号、または符号化帯域制御部200110
の出力である差分スペクトル200108,などのスペ
クトル情報、及び、符号化帯域算出部200601の出
力である符号化帯域情報200702から、人間の聴覚
心理モデルに基づいて、聴覚重み200605を算出す
る。該聴覚重み200605は聴覚上重要な帯域が大き
な値で、聴覚上それほど重要でない帯域が小さな値とな
るようなものである。聴覚心理モデル計算部20060
2の一例としては、入力スペクトルのパワーを計算する
方法を用いるものがある。入力されるスペクトルを x60
2(i)としたときに、聴覚重み wpsy(k)は、
【0105】
【数18】 となる。こうして算出された聴覚重み200605は、
配置決定部200603に入力され、該配置決定部20
0603では、解析長503を参照しながら、解析長5
03が小、たとえば128の時には、帯域番号2006
06が大である,たとえば、4,の帯域の聴覚重み20
0605が大きくなるように、たとえば、この帯域番号
が4の帯域の聴覚重みを2倍に重み付けし、また、解析
長503が小でないときには、聴覚重み200605を
そのままとして、該聴覚重み200603が最大となる
帯域を計算し、その帯域番号200606を、符号化帯
域配置情報生成手段200604に送る。
【0106】符号化帯域配置情報生成手段200604
は、上記符号化帯域情報200702、及び帯域番号2
00606、さらには符号化条件200105、を入力
として、符号化帯域配置情報200109を出力するも
のである。即ち、該符号化帯域配置情報生成手段200
604は、符号化条件200105を常に参照しなが
ら、該符号化条件からして、符号化帯域配置情報200
109が必要とされる間は、上記符号化帯域情報200
702と帯域番号200606とを連結してなる符号化
帯域配置情報200109を出力し、これが必要で無く
なるとその出力を止める動作をする。たとえば、符号化
条件200105で指定された符号化器数になるまで、
帯域番号200606を出力する。なお、上記配置決定
部200603において、解析長503が小なるときに
は、出力する帯域番号200606を固定する場合もあ
る。
【0107】次に、図17を用いて、符号化帯域制御部
200110の動作について説明する。符号化帯域制御
部200110は、上記特性判定部200107からの
出力である符号化帯域配置情報200109、および原
オーディオ信号のスペクトル505を入力とし、符号化
列200111、及び差分スペクトル200108をそ
の出力とし、その内部には、符号化帯域配置情報200
109を受け、原オーディオ信号のスペクトル505、
及び、過去の該原オーディオ信号のスペクトル505
と、該スペクトル505を符号化しかつ復号化したスペ
クトル200705との差分スペクトル200108
を、帯域番号200606の帯域にシフトするスペクト
ルシフト手段200701、符号化器2003、上記原
オーディオ信号のスペクトル505と復号化スペクトル
200705との差分をとる差分計算手段20070
3、差分スペクトル保持手段200704、及び、符号
列200111を復号化器2004で復号した合成スペ
クトル2001001を、符号化帯域配置情報2007
02に基づき、スペクトルシフトを行い、これを順次合
成して合成スペクトルを得、復号化スペクトル2007
056を算出する復号化帯域制御部200153を含ん
でいる。スペクトルシフト手段200701の構成は、
図20に示すとおりであるが、入力としては、シフトし
たい元スペクトル2001101と、符号化帯域配置情
報200109とを用いる。符号化帯域制御部2001
10におけるスペクトルシフト手段200701の入力
のうち、シフトしたいスペクトル2001101は、原
オーディオ信号のスペクトル505、または差分スペク
トル200108であり、それらを帯域番号20060
6の帯域にシフトして、シフトされたスペクトル200
1102と、符号化帯域配置情報200109のうちの
符号化帯域情報200702とを出力する。帯域番号2
00606に対応する帯域は、符号化帯域情報2007
02のfpl(k)、及びfpu(k)から求めることができる。シ
フトする手順は、上記fpl(k)とfpu(k)との間のスペクト
ルを、符号化器2003の処理できる帯域まで移動する
ことである。
【0108】こうして、シフトされたスペクトル200
1102を入力とする符号化器2003は、図15に示
すように、正規化符号列303、及び残差符号列304
を出力し、それらと、スペクトルシフト手段20070
1の出力である符号化帯域情報200702とをあわせ
たものが、符号列200111として、伝送符号化合成
器200112、及び復号化帯域制御部200153へ
と送られる。
【0109】上記符号化器2003の出力である上記符
号化列200111は、該符号化帯域制御部20011
0内にある復号化帯域制御部200153へと入力され
る。該復号化帯域制御部200153は、復号化装置2
002内に存在するもの(200153b)と、動作は
同じである。
【0110】次に、上記復号化装置2002内に存在す
る復号化帯域制御部200153bの構成を、図19に
示す。復号化帯域制御部200153bは、伝送符号化
列分解器200150からの符号列200111を入力
として、復号化スペクトル200705bを出力するも
ので、その内部には、復号化器2004、スペクトルシ
フト手段200701、復号化スペクトル算出部200
1003を持つ。
【0111】上記復号化器2004の構成を、図18に
示す。復号化器2004は、逆量子化部1101と逆正
規化部1102とから構成されており、逆量子化部11
01は、符号列200111のうち残差符号列304を
入力として、該残差符号列304をコードインデックス
に変換し、符号化器2003で用いたコードブックを参
照し、そのコードを再生する。再生されたコードは、逆
正規化部1102に送られ、符号列200111内の正
規化符号列303から再生された正規化系数列303a
と乗算され、合成スペクトル2001001を得る。該
合成スペクトル2001001は、スペクトルシフト手
段200701に入力される。
【0112】なお、符号化帯域制御部200110内の
復号化帯域制御部200153の出力は、復号化スペク
トル200705となっているが、これは、復号化装置
2002内の復号化帯域制御部200153bの出力で
ある復号化スペクトル200705bと同じものであ
る。
【0113】復号化器2004によって合成された合成
スペクトル2001001は、スペクトルシフト手段2
00701によりシフトされて、シフトされた合成スペ
クトル2001002が得られ、これは復号化スペクト
ル算出部2001003に入力される。
【0114】復号化スペクトル算出部2001003内
では、入力された合成スペクトルを保持しており、保持
しているスペクトルと、最新の合成スペクトルとを加算
し、復号化スペクトル200705bとして出力する動
作をする。
【0115】符号化帯域制御部200110内の差分計
算手段200703は、原オーディオ信号のスペクトル
505と、復号化スペクトル200705との差分を計
算して、差分スペクトル200108を出力し、これは
特性判定部200107へとフィードバックされる。ま
た同時に、上記差分スペクトル200108は、差分ス
ペクトル保持手段200704により保持されて、スペ
クトルシフト手段200701へも送られ、次の符号化
帯域配置情報200109が入力されるときに備えるよ
うに構成されている。特性判定部200107では、符
号化条件を参照しながら、該符号化条件を満たすまで符
号化帯域配置情報200109を出力しつづけ、それが
無くなった段階で、符号化帯域制御部200110の動
作も停止する。なお、上記符号化帯域制御部20011
0は、差分スペクトル200108を計算するために、
差分スペクトル保持手段200704を持っている。こ
れは、差分スペクトルを保持するために必要な記憶領域
で、たとえば、2048個の数を記憶できるような配列
である。
【0116】以上のように、符号化条件200105を
満たすように、特性判定部200107と、それに続く
符号化帯域制御部200110とによる処理が繰り返さ
れ、逐次、符号化列200111が出力され、それが伝
送符号化列合成器200112へと送られ、解析長符号
列510とともに、伝送符号化列として合成され、復号
化装置2002へと伝送される。
【0117】復号化装置2002では、符号化装置20
01より伝送されてきた伝送符号化列を、伝送符号化列
分解器200150にて、符号化列200151と、解
析長符号列200152とに分解する。該符号化列20
0151と、解析長符号列200152とは、符号化装
置2001内の符号化列200111、及び解析長符号
列510と同じものである。
【0118】分解された符号化列200151は復号化
帯域制御部200153bにおいて復号化スペクトル2
00154bに変換され、該復号化スペクトル2001
54bは、解析長符号列200152の情報を用いて、
周波数時間変換部5、窓掛け部6、及びフレーム重ね合
わせ部7にて、時間領域の信号に変換され、それが復号
化信号8となる。
【0119】このように本実施の形態2によるオーディ
オ信号符号化装置,復号化装置によれば、上記実施の形
態1のように、複数の各段の符号化器の量子化するオー
ディオ信号の周波数帯域を決定する特性判定部と、上記
特性判定部で決定された周波数帯域と、周波数変換され
た元々のオーディオ信号とをその入力とし、上記複数の
各段の符号化器の接続順を決定し、符号化器の量子化帯
域、及び接続順を符号列に変換する符号化帯域制御部と
を備え、適応的にスケーラブルコーディングを行なう構
成において、符号化装置には復号化帯域制御部を含む符
号化帯域制御部を、復号化装置には復号化帯域制御部を
設けるとともに、さらに、特性判定部におけるスペクト
ルパワー計算部を、聴覚心理モデル計算部とし、さら
に、該特性判定部において、符号化帯域配置情報生成手
段を設けた構成としたので、特性判定部のスペクトルパ
ワー計算部にかえて代えて聴覚心理モデル計算部を用い
たことにより、聴覚的に重要な部分の判定を精度よく行
って、その帯域をより選択することができる。また、本
発明が対象とするオーディオ信号符号化装置,復号化装
置では、符号化器の配置を決定する演算を行なっている
際に、符号化条件が満たされれば、符号化の処理がOK
と判定されて符号化帯域配置情報も出ないこととなる
が、この符号化器の配置を決定するための演算におい
て、上記実施の形態1では、符号化器を配置するときの
帯域を選択するときの各帯域幅、及び各帯域の重みが固
定であるのに対し、本実施の形態2では、特性判定部の
判定条件として、入力信号のサンプリング周波数と、圧
縮率、即ち、符号化のビットレート、も入っていること
から、これらに応じて、上記各符号化器の帯域配置を選
択するときの各帯域に対する重み付け度合いを変えられ
るものであり、さらに、特性判定部の判定条件として、
圧縮率の条件も入っていることにより、圧縮率が高いと
き、即ち、ビットレートが低いときには上記各符号化器
の帯域配置を選択するときの各帯域の重み付け度合いを
あまり変化させないようにし、一方、圧縮率が低いと
き、即ち、ビットレートが高いときには、効率をより追
求するために、上記各符号化器の帯域配置を選択すると
きの各帯域の重み付け度合いを、聴覚上、より大事なと
ころを強調するようにし、これにより、圧縮率と品質と
のベストバランスを得ることができるものである。この
ように、多種多様なオーディオ信号の符号化を行なう際
にも、十分な性能を発揮して、高品質、高効率な、適応
スケーラブルコーディングを行なう、オーディオ信号符
号化,復号化装置を得ることができる。
【0120】
【発明の効果】以上のように、本発明にかかるオーディ
オ信号符号化装置、及びオーディオ信号復号化装置によ
れば、符号化部は、複数の符号化器を有し、符号化帯域
制御部の制御によりオーディオ信号の多段符号化を行い
符号化情報を出力し、特性判定部は、入力されるオーデ
ィオ信号を判定し、符号化する各周波数帯域の重み付け
を示す帯域重み情報を出力し、符号化帯域制御部は、帯
域重み情報に基づいて、多段符号化を構成する各符号化
器の量子化帯域、接続順を決定し、決定した各符号化器
の量子化帯域、接続順に基づいてスケーラブルに構成さ
れる多段符号化を符号化部に行わせ、決定した各符号化
器の量子化帯域、接続順を示す帯域制御符号列を出力す
ことにより、多種多様な性質を持つオーディオ信号に
対して、より高音質で、より高効率な、適応スケーラブ
ルコーディングを行なうことができるという、有利な効
果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1によるオーディオ信号符
号化装置における適応スケーラブルコーディングのブロ
ック図
【図2】上記実施の形態1の符号化装置における時間周
波数変換部を示す図
【図3】上記実施の形態1の符号化装置における符号化
器を示す図
【図4】上記実施の形態1の符号化装置における正規化
部を示す図
【図5】上記実施の形態1の符号化装置における周波数
概形正規化部を示す図
【図6】上記実施の形態1の符号化装置における特性判
定部を示す図
【図7】上記実施の形態1の符号化装置における符号化
帯域制御部を示す図
【図8】上記実施の形態1の符号化装置における量子化
部を示す図
【図9】上記実施の形態1の符号化装置における復号化
器を示す図
【図10】一般のTwinVQ方式の概要を示す図
【図11】一般のTwinVQスケーラブルコーディング方式
を示す図
【図12】一般の固定スケーラブルコーディングの短所
を示す図
【図13】一般の適応スケーラブルコーディングの長所
を示す図
【図14】本発明の実施の形態2によるオーディオ信号
符号化装置における適応スケーラブルコーディングのブ
ロック図
【図15】上記実施の形態2の符号化装置における符号
化器を示す図
【図16】上記実施の形態2の符号化装置における特性
判定部を示す図
【図17】上記実施の形態2の符号化装置における符号
化帯域制御部を示す図
【図18】上記実施の形態2の符号化装置における復号
化器を示す図
【図19】上記実施の形態2の符号化装置における復号
化帯域制御部を示す図
【図20】上記実施の形態2の符号化装置におけるスペ
クトルシフト手段を示す図
【符号の説明】
1 符号化装置 2 復号化装置 501 原オーディオ信号 502 解析長判定部 503 時間周波数変換部 504 解析長 505 原オーディオ信号のスペクトル 506 特性判定部 507 符号化帯域制御部 508 帯域制御符号列 510 解析長符号列 511 低域符号化器 512 中域符号化器 513 高域符号化器 511b 第2段低域符号化器 518,519,520,518b 量子化誤差 521 低域符号列 522 中域符号列 523 高域符号列 521b 第2段低域符号列 701 フィルタ 5 周波数時間変換部 6 窓掛け部 7 フレーム重ねあわせ部 8 復号信号 9 帯域合成部 1201 復号化帯域制御部 1202 低域復号化器 1203 中域復号化器 1204 高域復号化器 1202b 第2段低域復号化器 201 フレーム分割部 202 窓掛け部 203 MDCT部 3 符号化器 301 正規化部 302 量子化部 303 正規化符号列 304 符号列 401 周波数概形正規化部 402 帯域振幅正規化部 403 帯域テーブル 601 線形予測分析部 602 概形量子化部 603 包絡特性正規化部 803 スペクトルパワー計算部 804 配置決定部 517 帯域制御重み 516 符号化帯域配置情報 901 帯域幅算出部 902 量子化順序決定部 903 符号化器数決定部 1001 量子化部の量子化する帯域のMDCT 1002 同じ量子化帯域の正規化成分 1003 音源サブベクトル 1004 重みサブベクトル 1005 ベクトル量子化器 1006 距離計算手段 1007 コード決定手段 1008 残差生成手段 1009 コードブック 1010 残差サブベクトル 1011 ある量子化部の量子化する帯域のMDCT
の残差 101 原オーディオ信号 102 解析長判定部 103 時間周波数変換部 104 周波数領域の原オーディオ信号 105 周波数概形 106 正規化処理部 107 正規化符号列 108 正規化処理後の現オーディオ信号 109 ベクトル量子化部 110 符号列 111 解析長符号列 1301 原オーディオ信号 1302 時間周波数変換部 1303 解析長判定部 1304 周波数領域の原オーディオ信号 1305 低域符号化器 1306 量子化誤差 1307 中域符号化器 1308 量子化誤差 1309 高域符号化器 1310 量子化誤差 1311 低域符号列 1312 中域符号列 1313 高域符号列 1314 解析長符号列 2001 符号化装置 2002 復号化装置 200105 符号化条件 200107 特性判定部 200108 差分スペクトル 200109 符号化帯域配置情報 200110 符号化帯域制御部 200111 符号化列 200112 伝送符号化列合成器 200150 伝送符号化列分解器 200151 符号化列 200152 解析長符号化列 200153 復号化帯域制御部 200154 復号化スペクトル 2003 符号化器 200305 符号化帯域情報 200601 符号化帯域算出部 200602 聴覚心理モデル計算部 200603 配置決定部 200604 符号化帯域配置情報生成手段 200605 聴覚重み 200701 スペクトルシフト手段 200702 符号化帯域情報 200703 差分計算手段 200704 差分スペクトル保持手段 2004 復号化器 200901 逆量化部 200902 逆正規化部 2001001 合成スペクトル 2001002 シフトされた合成スペクトル 2001003 復号化スペクトル算出部 2001101 元スペクトル 2001102 シフトされたスペクトル
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/02 G10L 19/00 H03M 7/30 H04B 14/04

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 特性判定部、符号化帯域制御部、符号化
    部を備え、時間−周波数変換されたオーディオ信号を符
    号化列に変換するオーディオ信号符号化装置であって、 符号化列は、符号化情報と帯域制御符号列とを含み、 符号化部は、複数の符号化器を有し、符号化帯域制御部
    の制御によりオーディオ信号の多段符号化を行い符号化
    情報を出力し、 特性判定部は、入力されるオーディオ信号を判定し、符
    号化する各周波数帯域の重み付けを示す帯域重み情報を
    出力し、 符号化帯域制御部は、 帯域重み情報に基づいて、多段符号化を構成する各符号
    化器の量子化帯域、接続順を決定し、 決定した各符号化器の量子化帯域、接続順に基づいてス
    ケーラブルに構成される多段符号化を符号化部に行わ
    せ、 決定した各符号化器の量子化帯域、接続順を示す帯域制
    御符号列を出力する、 オーディオ信号符号化装置。
  2. 【請求項2】 符号化帯域制御部は、予め定義された多
    段符号化のいずれかになるように、各符号化器の量子化
    帯域と、各符号化器の接続順とを決定する、 請求項1記
    載のオーディオ信号符号化装置。
  3. 【請求項3】 符号化部は、量子化誤差を出力し、 符号化帯域制御部は、帯域重み情報と量子化誤差とに基
    づいて、各符号化器の量子化帯域と、各符号化器の接続
    順とを決定する、 請求項1記載の オーディオ信号符号化装置。
  4. 【請求項4】 復号化帯域制御部、復号化部を備え、符
    号化情報と帯域制御符号列とを含む符号化列をオーディ
    オ信号に復号するオーディオ信号復号化装置であって、 帯域制御符号列は、符号化情報を多段符号化した際の各
    符号化器の量子化帯域、接続順を示し、 復号化部は、複数の復号化器を有し、復号化帯域制御部
    の制御により符号化情 報の多段復号化を行い、 復号化帯域制御部は、帯域制御符号列に基づいてスケー
    ラブルに構成される多段復号化を復号化部に行わせる、 オーディオ信号号化装置。
JP06533599A 1998-03-11 1999-03-11 オーディオ信号符号化装置、及びオーディオ信号復号化装置 Expired - Fee Related JP3344962B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06533599A JP3344962B2 (ja) 1998-03-11 1999-03-11 オーディオ信号符号化装置、及びオーディオ信号復号化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-59403 1998-03-11
JP5940398 1998-03-11
JP06533599A JP3344962B2 (ja) 1998-03-11 1999-03-11 オーディオ信号符号化装置、及びオーディオ信号復号化装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002211570A Division JP4327420B2 (ja) 1998-03-11 2002-07-19 オーディオ信号符号化方法、及びオーディオ信号復号化方法

Publications (2)

Publication Number Publication Date
JPH11330977A JPH11330977A (ja) 1999-11-30
JP3344962B2 true JP3344962B2 (ja) 2002-11-18

Family

ID=26400450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06533599A Expired - Fee Related JP3344962B2 (ja) 1998-03-11 1999-03-11 オーディオ信号符号化装置、及びオーディオ信号復号化装置

Country Status (1)

Country Link
JP (1) JP3344962B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007532963A (ja) * 2004-04-15 2007-11-15 ノキア コーポレイション 音声信号の符号化

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4317355B2 (ja) * 2001-11-30 2009-08-19 パナソニック株式会社 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
EP1470550B1 (en) * 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
CN100346392C (zh) 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
AU2004320712B2 (en) 2004-06-07 2010-05-20 Agency For Science, Technology And Research Systems and methods for scalably encoding and decoding data
JP2006126592A (ja) * 2004-10-29 2006-05-18 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
CN101167128A (zh) * 2004-11-09 2008-04-23 皇家飞利浦电子股份有限公司 音频编码和解码
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US8306827B2 (en) 2006-03-10 2012-11-06 Panasonic Corporation Coding device and coding method with high layer coding based on lower layer coding results
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
EP2525354B1 (en) * 2010-01-13 2015-04-22 Panasonic Intellectual Property Corporation of America Encoding device and encoding method
EP2610866B1 (en) * 2010-08-24 2015-04-22 LG Electronics Inc. Method and device for processing audio signals
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007532963A (ja) * 2004-04-15 2007-11-15 ノキア コーポレイション 音声信号の符号化

Also Published As

Publication number Publication date
JPH11330977A (ja) 1999-11-30

Similar Documents

Publication Publication Date Title
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
EP0910067B1 (en) Audio signal coding and decoding methods and audio signal coder and decoder
JP3680380B2 (ja) 音声符号化方法及び装置
JP4005154B2 (ja) 音声復号化方法及び装置
JP3707153B2 (ja) ベクトル量子化方法、音声符号化方法及び装置
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3297749B2 (ja) 符号化方法
JP3237178B2 (ja) 符号化方法及び復号化方法
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3353267B2 (ja) 音響信号変換符号化方法及び復号化方法
JP4274614B2 (ja) オーディオ信号復号方法
JP4327420B2 (ja) オーディオ信号符号化方法、及びオーディオ信号復号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH09127987A (ja) 信号符号化方法及び装置
JP4618823B2 (ja) 信号符号化装置及び方法
JPH10111700A (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JPH03243999A (ja) 音声符号化装置
JPH09127986A (ja) 符号化信号の多重化方法及び信号符号化装置
JPH09127997A (ja) 音声符号化方法及び装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070830

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130830

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees