JP2993324B2 - 音声高能率符号化装置 - Google Patents

音声高能率符号化装置

Info

Publication number
JP2993324B2
JP2993324B2 JP5205721A JP20572193A JP2993324B2 JP 2993324 B2 JP2993324 B2 JP 2993324B2 JP 5205721 A JP5205721 A JP 5205721A JP 20572193 A JP20572193 A JP 20572193A JP 2993324 B2 JP2993324 B2 JP 2993324B2
Authority
JP
Japan
Prior art keywords
band
bandwidth
analysis
sub
critical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5205721A
Other languages
English (en)
Other versions
JPH0746137A (ja
Inventor
徳彦 渕上
昭治 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP5205721A priority Critical patent/JP2993324B2/ja
Publication of JPH0746137A publication Critical patent/JPH0746137A/ja
Application granted granted Critical
Publication of JP2993324B2 publication Critical patent/JP2993324B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、オーディオ信号を複数
の周波数帯域(サブバンド)に分割し、分割された信号
をサブバンド毎に量子化および符号化する音声高能率符
号化装置に関し、特に聴覚心理分析に基づいてサブバン
ド毎の量子化ビット数を決定する音声高能率符号化装置
に関する。
【0002】
【従来の技術】ミニディスク(MD)、ディジタルコン
パクトカセット(DCC)、カラオケCD等における音
声高能率符号化は、オーディオ信号のデータ量を圧縮す
るので音楽圧縮とも呼ばれている。このような符号化方
式では、オーディオ信号がデジタルフィルタまたは直交
変換により複数のサブバンドに分割され、周波数領域に
おける聴覚心理分析に基づいてサブバンド毎の量子化ビ
ット数が決定される。なお、以下の説明では「エンコー
ド」という用語を符号化の他に圧縮の意味で用いる場合
もある。
【0003】さて図10(a)〜(d)はこのような符
号化方式で周波数帯域を直交変換により分割する例を示
している。図10(a)はエンコードの対象となる16
ビットPCMオーディオ信号を512サンプル分切り出
したことを示し、ここでは図の長方形で囲まれる全情報
量が16ビット*512=8192ビットとして説明す
る。もちろん、切り出されるサンプル数やPCMのビッ
ト数はこの値に限定されない。
【0004】図10(b)は図10(a)に示す信号を
DCT(離散コサイン変換)やFFT(高速フーリエ変
換)等の直交変換により周波数変換した信号を示し、図
の曲線が周波数スペクトルのエンベロープを示してい
る。ここで、直交変換により情報量が保存されると仮定
すると、この全情報量も図の長方形領域で表現すること
ができる。一方、聴覚心理モデルによれば、図10
(b)に示す信号が存在したときに、その信号によりマ
スキングされて聞こえなくなる信号レベルをカーブとし
て規定することができ、これは一般にマスキング効果
(詳しくは後述)と言われる。
【0005】図10(b)からマスキングカーブを描く
と図10(c)に示すように表すことができ、ここで、
図10(b)に示す信号を再量子化することを考慮する
と、再量子化により発生する量子化ノイズレベルがマス
キングカーブで規定されるレベル以下であれば、そのノ
イズは人間の耳には聞こえないということができる。そ
こで、図10(d)に示すようにスペクトルを複数デー
タ毎にサブバンドに分割し、各サブバンド毎の最大信号
レベルをSとし、また、図10(c)から許容されるノ
イズレベルをNとしてこのS/Nを満足するビット数で
再量子化すれば、そのときの量子化ノイズはマスキング
されて聞こえない。
【0006】図10(d)の矩形は圧縮時および伸長時
に必要な情報量を示し、特に図の中央の変形矩形は主情
報を、図の下側の細長い矩形は補助情報を示している。
なお、補助情報とはデコード時に必要な各サブバンドの
最大値(スケール値)と量子化ビット数を示す情報等で
ある。したがって、図10(d)において示される全情
報量は主情報量と補助情報量の和であり、図10(a)
や図10(b)における全情報量の数分の1になること
が分かる。以上の処理を所定区間(この例では512サ
ンプル区間)毎に繰り返すことにより音質を殆ど劣化す
ることなくエンコードすることができる。
【0007】次に聴覚心理に基づくマスキングカーブの
計算方法を説明する。マスキング効果とはある周波数ス
ペクトルが存在する場合に、その周辺のある一定レベル
以下の音が検知できなくなることを言い、各種周波数ス
ペクトルに関するマスキングカーブを図11に示す。図
11に示されるようにカーブの傾斜は低域ほど急峻であ
り、高域ほど緩慢である。また、図11の横軸(周波
数)を聴覚の臨界帯域幅に比例したスケールに変換する
と、図12に示すようにこれらのカーブはほぼ同様な形
および傾斜のカーブになることが知られている。また、
この臨界帯域幅は図13に示すように、DC〜20kH
zを25バンドで分割して表すことができ、マスキング
を始めとする聴覚特性は、この臨界帯域幅に比例した振
る舞いをすることが多い、
【0008】さて、図10(b)に示すような一般的な
信号が存在したときのマスキングカーブは、図11また
は図12のように個々の周波数スペクトルに対するマス
キングカーブの和(重ね合わせ)で表して図10(c)
に示すような曲線で表すことができるが、実際の計算で
は図10(c)に示すような滑らかな曲線としてマスキ
ングカーブを算出すると演算量が膨大となるので困難で
ある。そこで、近似としてスペクトルを分析バンド毎の
パワーに置き換え、マスキングカーブを分析バンド毎の
折れ線波形として評価することが行われる。
【0009】次に、図10(d)においてマスキングカ
ーブの各サブバンド区間における最小値をそのサブバン
ドにおいて許容されるノイズレベルNとして、マスキン
グカーブの算出からノイズレベルNを導出する従来例を
説明する。 (1)先ず、直交変換して得られた周波数スペクトルN
本からm個の分析バンドi毎のバンドトータルパワーP
〔i〕を算出する。
【0010】
【数1】
【0011】次に、次式(数2)のように分析バンドに
応じたマスキングの基準カーブBとバンドトータルパワ
ーP〔i〕との畳み込み演算を行うことにより、各分析
バンドiにおけるマスキングレベルM〔i〕を算出す
る。ここで、マスキングの基準カーブBは、分析バンド
i毎に形が異なるカーブを必要とする場合には図14
(b)に示すようなB〔i〕〔k〕(kは整数)で表す
ことができ、また、分析バンドiに依らず一定の形の場
合には図14(a)に示すようなB〔k〕(kは整数)
で表すことができる。
【0012】
【数2】
【0013】(3)分析バンドiとサブバンドsが異な
る場合にはサブバンドsの区間における最小のマスキン
グレベルM〔i〕をそのサブバンドsの許容ノイズレベ
ルN〔s〕とする(サブバンド数nとする)。
【0014】
【数3】N〔s〕=min 〔M〔i〕〕 但し、iはサブバンドsの中に含まれるいずれかの区間
を示す s=0・・・n−1
【0015】分析バンドiとサブバンドsが同一の場合
には
【0016】
【数3】N〔s〕=M〔i〕 但し、s=0・・・n−1
【0017】
【発明が解決しようとする課題】以上の処理(1)〜
(3)により各サブバンドsの許容ノイズレベルN
〔s〕が求まるが、ここで、分析バンドiとサブバンド
sとの関係について説明すると、一般的には次の3通り
の場合のいずれかが多い。 (a)分析バンドiがサブバンドsと等しく、バンド幅
が臨界帯域と等しい(比例関係にある)場合 (b)分析バンドiがサブバンドsと等しく、バンド幅
が臨界帯域と比例しない場合 (c)分析バンドiがサブバンドsと異なり、バンド幅
が臨界帯域と等しい(比例関係にある)場合
【0018】上記(a)の場合には、上記許容ノイズレ
ベルN〔s〕と、バンド幅を充分小さくして計算した場
合のマスキングカーブすなわち真のマスキングカーブか
ら得られる真の許容ノイズレベルNa〔s〕の差は図1
5に例示することができ、各バンドの真の許容ノイズレ
ベルNa〔s〕は、そのバンドの真のマスキングカーブ
の最小値にする必要がある。なお、図15の曲線は真の
マスキングカーブを示し、実線の折れ線が上記許容ノイ
ズレベルN〔s〕を、また、点線の折れ線が真の許容ノ
イズレベルNa〔s〕を示している。
【0019】また、図15(a)は信号スペクトルがフ
ラット(ノイズライク)な場合を示し、図15(b)は
信号スペクトルがピーキー(トーンライク)であって信
号の中心パワーがバンドの中心近くにある場合を示し、
図15(c)は信号スペクトルがピーキーであって信号
の中心パワーがバンドの境界に近い場合を示している。
図15(a)に示す場合には上記許容ノイズレベルN
〔s〕と真の許容ノイズレベルNa〔s〕の差が少ない
が、図15(b)および(c)に示す場合には大きな誤
差がある。この誤差の理由は、図14に示すように一般
にマスキングの基準カーブは臨界帯域当たり10〜20
dBの傾きを有するからであり、したがって、このよう
な許容ノイズレベルN〔s〕でエンコードすると音質が
劣化することがある。
【0020】上記(b)の場合とは、システムの都合上
サブバンド幅を臨界帯域に比例させることができず、分
析バンドをサブバンドと共通にした場合に相当する。こ
の場合、バンド幅がある帯域では臨界帯域よりも広く、
ある帯域では臨界帯域より狭くなるのが殆どである。ま
た、バンド幅が臨界帯域と同一かそれより広い領域では
上記(a)において説明した問題点がさらに悪化する。
【0021】上記(c)の場合にも上記(a)において
説明した問題点がそのまま当てはまる。さらに、サブバ
ンドsが分析バンドiよりも狭い状況が発生する場合に
は、図16に示すように分析バンドiから得られるマス
キングレベルM〔i〕=N〔s〕は、サブバンドsより
周波数の分解能が悪く、真の許容ノイズレベルNa
〔s〕との差が大きくなる。ここで、もし分析バンド幅
をサブバンド幅以下に設定すれば、得られる許容ノイズ
レベルN〔s〕はより真の許容ノイズレベルNa〔s〕
に近くなり、したがって、上記(a)の問題を緩和する
能力があるにもかかわらずその利点を生かすことができ
ない。
【0022】次に、他の問題点を説明する。前述した処
理(1)〜(3)により許容ノイズレベルN〔s〕を求
める一連の処理において、他の重要な役割を果たすのは
図14において説明したマスキングの基準カーブの形状
や傾斜である。図14の横軸には分析バンドの相対イン
デックスkが採られているが、図12からも明らかなよ
うに横軸に臨界帯域を採った場合のマスキング量−臨界
帯域特性は、マスキングの中心がどの臨界帯域にあった
としても一定であると考えられているので、図17に示
すように横軸に相対臨界帯域に採ってパワーPを表す
と、全ての周波数帯域のマスキングカーブを一義的に表
現することができる。この意味では、図14においてマ
スキング基準カーブがB〔i〕と分析バンドiに依るこ
となく表される理由は、分析バンドiが臨界帯域に比例
しているからであり、したがって、B〔i〕〔k〕と表
す必要があるのは、分析バンドiが臨界帯域に比例して
いない場合である。
【0023】しかしながら、上記の如くマスキング量−
臨界帯域特性が一定であるという考え方では、実際にエ
ンコードおよびデコードした場合の音質では、特に低域
側で劣化が検知されることがある。その原因としては、
低域におけるマスキング量−臨界帯域特性のカーブの形
が不適切であることが考えられる。図18(a)(b)
はそれぞれマスキングカーブが広い場合(傾斜が緩やか
な場合)と狭い場合(傾斜が急な場合)における各サブ
バンドの真の許容ノイズレベルNa〔s〕を示す。この
図は信号がピーキー(トーンライク)な場合を想定して
おり、得られる許容ノイズレベルN〔s〕とは大きな違
いがある。したがって、従来の方法では、適切でないマ
スキングカーブによりエンコードするので、音質が劣化
する場合がある。
【0024】本発明は上記従来の問題点に鑑み、聴覚心
理をより満足させて音質を向上させることができる音声
高能率符号化装置を提供することを目的とする。
【0025】
【課題を解決するための手段】本発明は上記目的を達成
するために、各周波数領域においてサブバンド幅以下で
あり、かつ聴覚心理上の臨界帯域幅以下に設定されると
共に少なくとも低域においては帯域幅をそれらに比べ十
分狭く設定するような周波数依存の分析バンド幅でオー
ディオ信号を分析して各サブバンドの量子化ビット数を
決定するようにしている。すなわち、本発明によれば、
オーディオ信号を複数の周波数帯域のサブバンドに分割
する分割手段と、前記分割手段により分割された各サブ
バンドのオーディオ信号を可変の量子化ビット数で量子
化および符号化する量子化・符号化手段と、各周波数領
域においてサブバンド幅以下であり、かつ聴覚心理上の
臨界帯域幅以下の分析バンド幅でオーディオ信号を分析
し、前記量子化および符号化手段の各サブバンドの量子
化ビット数を決定する聴覚心理分析手段とを有する音声
高能率符号化装置が提供される。
【0026】
【0027】
【作用】本発明では、各周波数領域においてサブバンド
幅以下であり、かつ聴覚心理上の臨界帯域幅以下の分析
バンド幅でオーディオ信号が分析されて各サブバンドの
量子化ビット数が決定される。したがって、量子化およ
び符号化の単位であるサブバンドと、周波数領域におけ
る聴覚心理分析(マスキングカーブの算出)の単位であ
る分析バンドとの関係を最適にするので、聴覚心理をよ
り満足させて音質を向上させることができる。
【0028】
【0029】
【実施例】以下、図面を参照して本発明の実施例につい
て説明する。図1は本発明に係る音声高能率符号化装置
の一実施例を示すブロック図、図2は図1の音声高能率
符号化装置の処理を説明するためのフローチャート、図
3は図1の音声高能率符号化装置の変形例を示すブロッ
ク図、図4はサブバンド幅と、臨界帯域幅と分析バンド
幅の関係を示す説明図、図5は分析バンド幅が臨界帯域
幅の1/3の場合の許容ノイズレベルN〔s〕を示す説
明図、図6は分析バンド幅と臨界帯域幅が同一の場合の
許容ノイズレベルN〔s〕を示す説明図である。
【0030】図1に示す音声高能率符号化装置では、例
えば16ビットPCMオーディオ信号が窓掛け切り出し
部1により512サンプル分切り出され、各サンプルの
オーディオ信号が直交変換部2によりDCTやFFT等
により直交変換され、複数のサブバンドsに分割される
(図2のステップS1)。そして、聴覚心理分析部3に
より各サブバンドsの最大値(スケール値)が決定され
るとともに(ステップS2)、各周波数領域における分
析バンド幅がサブバンド幅以下であり、かつ聴覚心理上
の臨界帯域幅以下、理想的には臨界帯域幅の1/2〜1
/3の幅で各サブバンドsが聴覚分析されて、先ず各サ
ブバンドsの許容ノイズレベルN〔s〕が決定され(ス
テップS3)、次いで各サブバンドsに必要なS/N比
が決定され(ステップS4)、次いでこのS/N比から
量子化ビット数が決定される(ステップS5)。
【0031】量子化・符号化部4はこの量子化ビット数
で、直交変換部2により分割された各サブバンドsのオ
ーディオ信号を量子化および符号化し、この量子化・符
号化部4により量子化および符号化されて圧縮されたデ
ータと、聴覚心理分析部3により決定された量子化ビッ
ト数はマルチプレックス部5により多重化されてMDや
DCC等に出力される(ステップS6)。なお、伸長時
には圧縮データは各サブバンドs毎の量子化ビット数に
基づいて復号化および逆量子化される。
【0032】図3に示す音声高能率符号化装置では、入
力オーディオ信号がデジタルフィルタ6によりサブバン
ドsに分割されるように構成されている。ここで、フィ
ルタバンクによるサブバンド分割方法では、本発明が必
要とする低域のバンド分解能を得ることができないの
で、図1に示す場合と同様に、切り出し部1により切り
出された各サンプルのオーディオ信号が直交変換部2に
より複数のサブバンドsに分割され、聴覚心理分析部3
により量子化・符号化部4の量子化ビット数が決定され
ている。
【0033】ここで、上記量子化ビット数の決定方法で
は、実際にはシステムの制約やマスキングカーブを算出
する際に割り当て可能な演算量との兼ね合いで分析バン
ドが決定される。図4は直交変換部2により分割される
サブバンド幅と、聴覚の臨界帯域幅と聴覚心理分析部3
の分析バンド幅の関係を示している。この図は低域側で
はサブバンド幅より臨界帯域幅が狭く、高域側ではサブ
バンド幅より臨界帯域幅が広い例を示し、この場合にも
分析バンド幅はサブバンド幅以下であって臨界帯域幅以
下になるようにして分析される。また、実際のマスキン
グカーブは前述した方法(1)〜(3)で算出される
が、その結果得られるサブバンドs毎の許容ノイズレベ
ルN〔s〕は前述した(a)〜(c)の問題を解決する
ように設定される。
【0034】図5(a)(b)は分析バンド幅を臨界帯
域幅の1/3に設定した場合を示し、また、それぞれ従
来例で説明した図15(b)(c)に対応している。す
なわち、図5(a)は信号スペクトルがピーキー(トー
ンライク)であって信号の中心パワーがバンドの中心近
くにある場合を示し、図5(c)は信号スペクトルがピ
ーキーであって信号の中心パワーがバンドの境界に近い
場合を示している。また、図の実線の折れ線はマスキン
グレベルM〔i〕を、一点鎖線が各サブバンドsの許容
ノイズレベルN〔s〕を、点線が各サブバンドの真の許
容ノイズレベルNa〔s〕を示している。図5と図15
を比較すると明らかなように、本実施例では許容ノイズ
レベルN〔s〕と真の許容ノイズレベルNa〔s〕の差
が少なくなり、したがて、上記(b)の問題を解決する
ことができる。
【0035】図6は分析バンド幅をサブバンド幅と等し
くした場合を示し、分析バンド幅がサブバンド幅より広
い図16に対応している。図6と図16を比較すると明
らかなように、図6においては各サブバンドsの許容ノ
イズレベルN〔s〕が真の許容ノイズレベルNa〔s〕
に近くなり、したがって、上記(c)の問題すなわち周
波数の分解能の問題を解決することができる。
【0036】したがって、上記実施例によれば、量子化
および符号化の単位であるサブバンドと、周波数領域に
おける聴覚心理分析(マスキングカーブの算出)の単位
である分析バンドとの関係を最適にするので、許容ノイ
ズレベルN〔s〕の評価精度を向上させることができ、
聴覚心理特性を利用してエンコードした場合に音質を向
上させることができる。具体的には精度の向上幅は平均
的には1〜3dB、大きい場合には6dB以上になるこ
とも想定される。また、量子化器のS/N比が一般的に
は6dBステップであることを考えるとこの向上幅は大
きな値である。
【0037】本発明の第2実施例について図7〜図9を
参照して説明する。図7は臨界帯域幅とイクイバレント
レクタンギュラノイズバンドウィドゥス(EquivalentRe
ctangular noise Bandwidth)(以下、単にERBと略
す)を比較した説明図、図8はマスキング量−臨界帯域
特性を示す説明図、図9はマスキングカーブ毎のS/N
比特性を示す説明図である。この第2の実施例では聴覚
心理分析で用いられるマスキングカーブのマスキング量
−臨界帯域特性を一定にせず、各臨界帯域に応じて適切
に変更するように構成されている。
【0038】ここで、最近の聴覚心理の研究によれば、
従来言われていた臨界帯域よりもERBの方が解剖学的
にも聴覚分析バンドとして相応しいと言われている。図
7は横軸に周波数(log)、縦軸にバンド幅を採って臨
界帯域幅とERBを比較しており、特に400Hz以下
の低域で臨界帯域幅とERBの差が大きく、100Hz
以下では臨界帯域幅のバンド幅が3〜4倍程度広い。言
い換えると、マスキング量−臨界帯域特性とマスキング
量−ERB特性がほぼ一致するとき、また、何れも周波
数領域に依らず一定としたときには、マスキング量−E
RB特性の傾斜の方がマスキング量−臨界帯域特性の傾
斜より非常に大きいと言うことができる。
【0039】したがって、臨界帯域を横軸に考える場合
にはマスキングカーブを臨界帯域に関して一定ではな
く、可変とするか、またはマスキングカーブを臨界帯域
以外の値に関して一定とすることにより再生音質が良好
となることが予測され、実際例えば図8に示すように傾
斜が異なる3つの(一般には複数の)マスキング量−臨
界帯域特性A〜Cを準備し、周波数帯域に応じて変更す
ることにより音質を向上させることができた。
【0040】図9は図8において400Hz以下で傾斜
が急なマスキングカーブに切り替えた場合とマスキング
カーブが一定の場合のS/N比を示し、400Hz以下
でS/N比が大きく上昇している。図18(a)(b)
において説明したように、マスキングカーブが狭くなる
とその領域では許容ノイズレベルN〔s〕が下がり、し
たがって、信号レベルSが同一の場合にはS/N比は向
上する。なお、その他の領域に割り当てられる情報量が
減少するのでその領域ではS/N比は若干劣化するもの
の、聴感上では低域の音質改善効果の方が大きい。
【0041】
【発明の効果】以上説明したように本発明によれば、各
周波数領域においてサブバンド幅以下であり、かつ聴覚
心理上の臨界帯域幅以下に設定されると共に少なくとも
低域において帯域幅をこれらに比べ十分狭く設定するよ
うな周波数に依存した分析バンド幅、例えば臨界帯域幅
の1/2から1/3に細分化した分析バンド幅でオーデ
ィオ信号を分析し、各サブバンドの量子化ビット数を決
定するので、量子化および符号化の単位であるサブバン
ドと、周波数領域における聴覚心理分析(マスキングカ
ーブの算出)の単位である分析バンドとの関係を最適に
することができ、したがって、聴覚心理をより満足させ
て音質を向上させることができる。
【0042】
【図面の簡単な説明】
【図1】本発明に係る音声高能率符号化装置の第1実施
例を示すブロック図である。
【図2】図1の音声高能率符号化処理を説明するための
フローチャートである。
【図3】図1の音声高能率符号化装置の変形例を示すブ
ロック図である。
【図4】サブバンド幅と、臨界帯域幅と分析バンド幅の
関係を示す説明図である。
【図5】分析バンド幅が臨界帯域幅の1/3の場合の許
容ノイズレベルN〔s〕を示す説明図である。
【図6】分析バンド幅と臨界帯域幅が同一の場合の許容
ノイズレベルN〔s〕を示す説明図である。
【図7】第2実施例において臨界帯域幅とERBを比較
した説明図である。
【図8】第2実施例のマスキング量−臨界帯域特性を示
す説明図である。
【図9】マスキングカーブ毎のS/N比特性を示す説明
図である。
【図10】音声高能率符号化方法を模式的に示す説明図
である。
【図11】各種周波数スペクトルにおけるマスキングカ
ーブの一例を示す説明図である。
【図12】図11の横軸の周波数を臨界帯域に置き換え
たマスキングカーブを示す説明図である。
【図13】25バンドの臨界帯域幅を示す説明図であ
る。
【図14】マスキング基準カーブを示す説明図である。
【図15】分析バンドとサブバンドが等しい場合の従来
の許容ノイズレベルN〔s〕と真の許容ノイズレベルN
a〔s〕を示す説明図である。
【図16】分析バンドよりサブバンドが広い場合の従来
の許容ノイズレベルN〔s〕と真の許容ノイズレベルN
a〔s〕を示す説明図である。
【図17】従来のマスキング量−臨界帯域特性を示す説
明図である。
【図18】図17に示すマスキングカーブの傾斜と許容
ノイズレベルN〔s〕の関係を示す説明図である。
【符号の説明】
1 窓掛け切り出し部 2 直交変換部(分割手段) 3 聴感心理分析部(聴感心理分析手段) 4 量子化および符号化部(量子化・符号化手段) 5 マルチプレックス部 6 サブバンドフィルタ部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を複数の周波数帯域のサ
    ブバンドに分割する分割手段と、 前記分割手段により分割された各サブバンドのオーディ
    オ信号を可変の量子化ビット数で量子化および符号化す
    る量子化・符号化手段と、 各周波数領域においてサブバンド幅以下であり、かつ聴
    覚心理上の臨界帯域幅以下に設定されると共に少なくと
    も低域においては帯域幅をそれらに比べ十分狭く設定す
    るような周波数依存の分析バンド幅でオーディオ信号を
    分析し、前記量子化および符号化手段の各サブバンドの
    量子化ビット数を決定する聴覚心理分析手段とを有する
    音声高能率符号化装置。
JP5205721A 1993-07-28 1993-07-28 音声高能率符号化装置 Expired - Lifetime JP2993324B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5205721A JP2993324B2 (ja) 1993-07-28 1993-07-28 音声高能率符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5205721A JP2993324B2 (ja) 1993-07-28 1993-07-28 音声高能率符号化装置

Publications (2)

Publication Number Publication Date
JPH0746137A JPH0746137A (ja) 1995-02-14
JP2993324B2 true JP2993324B2 (ja) 1999-12-20

Family

ID=16511590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5205721A Expired - Lifetime JP2993324B2 (ja) 1993-07-28 1993-07-28 音声高能率符号化装置

Country Status (1)

Country Link
JP (1) JP2993324B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4021124B2 (ja) 2000-05-30 2007-12-12 株式会社リコー デジタル音響信号符号化装置、方法及び記録媒体
JP4396683B2 (ja) 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム

Also Published As

Publication number Publication date
JPH0746137A (ja) 1995-02-14

Similar Documents

Publication Publication Date Title
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP2906646B2 (ja) 音声帯域分割符号化装置
US7548850B2 (en) Techniques for measurement of perceptual audio quality
US7155383B2 (en) Quantization matrices for jointly coded channels of audio
US5294925A (en) Data compressing and expanding apparatus with time domain and frequency domain block floating
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
US7752041B2 (en) Method and apparatus for encoding/decoding digital signal
JP3186292B2 (ja) 高能率符号化方法及び装置
EP0966108A2 (en) Dynamic bit allocation and apparatus and method for audio coding
AU1448992A (en) High efficiency digital data encoding and decoding apparatus
JPH07336232A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体
US6772111B2 (en) Digital audio coding apparatus, method and computer readable medium
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US7613609B2 (en) Apparatus and method for encoding a multi-channel signal and a program pertaining thereto
US20020173969A1 (en) Method for decompressing a compressed audio signal
JP3254953B2 (ja) 音声高能率符号化装置
JPH08166799A (ja) 高能率符号化方法及び装置
JP2993324B2 (ja) 音声高能率符号化装置
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
JP3465341B2 (ja) オーディオ信号符号化方法
JP2002182695A (ja) 高能率符号化方法及び装置
JP3146121B2 (ja) 符号化復号化装置
JPH11330974A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP2917766B2 (ja) 音声高能率符号化装置
JPH0750589A (ja) サブバンド符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091022

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101022

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111022

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121022

Year of fee payment: 13

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 14

EXPY Cancellation because of completion of term