JP2001184091A - オーディオ信号符号化方法 - Google Patents
オーディオ信号符号化方法Info
- Publication number
- JP2001184091A JP2001184091A JP36961199A JP36961199A JP2001184091A JP 2001184091 A JP2001184091 A JP 2001184091A JP 36961199 A JP36961199 A JP 36961199A JP 36961199 A JP36961199 A JP 36961199A JP 2001184091 A JP2001184091 A JP 2001184091A
- Authority
- JP
- Japan
- Prior art keywords
- level
- quantization
- band
- bits
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
る。 【解決手段】 時間周波数変換ステップ11と聴覚モデ
ルステップ12と量子化符号化ステップ13とビットス
トリーム化ステップ14とを有するオーディオ信号符号
化方法において、量子化符号化ステップは、所定ビット
数に収まるように全帯域レベル変更ステップの初期値レ
ベル推測ステップSTEP1と、聴覚モデルステップからのS
MRと初期レベル推測ステップの出力が供給され量子化、
逆量子化によって算出されるSNRとより求めたMNRに応
じ、周波数スペクトルのレベルのバンドレベル変更ステ
ップSTEP4と、使用ビット数を所定のビット数範囲内に
収めるまで、周波数スペクトルのレベルを全帯域にわた
り初期値以外の変更を繰返し行なう全帯域レベル変更ス
テップSTEP14とを有する手順とした。
Description
周波数領域に変換した後に符号化を行なうオーディオ信
号符号化方法に関する。
には、例えば適応スペクトル聴感制御エントロピー符号
化法(ASPEC, Adaptive Spectral Perceptual Entropy
Coding)、MPEG1オーディオ・レイヤ3、MPEG
2オーディオAAC( AdvancedAudio Coding )があ
る。
のために2重ループを構成して、量子化歪みと、符号量
とを制御している。それぞれのループは、アウタールー
プ、インナーループと呼ばれており、アウターループで
は、量子化歪みが、聴覚心理モデルステップから得られ
た許容ノイズレベル以下になるように制御を行ない、イ
ンナーループでは、量子化を行ない所定のビット数の範
囲内に収まるように制御を行なっている。
イタレーションループ処理のフロー図を示す。従来の処
理では、所定ビット数に収める処理と量子化歪みを所定
量に収める処理とに対して、それぞれ別ループを作るこ
とで実現している。所定ビット数とは、設定されたビッ
トレートより求められる1オーディオフレームにおいて
使用可能なビット数を意味する。
号化により求められる使用ビット数( STEP 11A ) ( STE
P 12A )が所定ビット数に収まっているかどうかの判断
を行なう( STEP 13A ) 。収まっていない場合には、周
波数スペクトルを全ての帯域に対して一様に可変する変
数(global#gain)を調整する( STEP 14A )ことで、所
定のビット数に納める。
められた量子化結果を元に逆量子化を行ない、バンド単
位で量子化歪みを求める( STEP 2A )。求めた量子化歪
みが聴覚モデル部の信号対マスキング率SMRから求めた
許容歪み内に収まっているかどうかを判断し( STEP 3A
)、収まっていない場合、そのバンドのscalefactor (s
fb)を調整する( STEP 4A )。量子化歪みが収まっていな
いバンドが1バンド以上存在する場合には、再びインナ
ーループからやり直す( STEP 1A )。
では、外側に存在するアウターループが満足されない場
合に、再びインナーループを呼び出さねばならないた
め、収束時間の確定が難しいという問題があり、また、
量子化、逆量子化の演算回数が増加するという問題があ
る。これは、DSP等を用いた処理スピードの速いリア
ルタイム処理に不向きである。そこで、本発明は、上記
の問題に鑑み、リアルタイム処理に適したオーディオ信
号符号化装置及びその方法を提供することを目的とす
る。
の手段として、請求項1の発明は、時間周波数変換ステ
ップ11と聴覚モデルステップ12と量子化符号化ステ
ップ13とビットストリーム化ステップ14とを有する
オーディオ信号符号化方法において、前記量子化符号化
ステップ13は、所定ビット数に収まるように全帯域レ
ベル変更ステップの初期値を推測する初期値レベル推測
ステップ(STEP1)と、前記聴覚モデルステップから算出
されるSMR(Signal-to-Mask-Ratio)と前記初期レベル推
測ステップの出力が供給され量子化、逆量子化によって
算出されるSNR(Signal-to-Noise-Ratio)とより求めたMN
R(Mask-to-Noise-Ratio)に応じて、前記時間周波数変換
ステップにて求められた周波数スペクトルのレベルをバ
ンド単位で変更を行なうバンドレベル変更ステップ(STE
P4)と、前記量子化、符号化により求められる使用ビッ
ト数を所定のビット数範囲内に収めるまで、前記時間周
波数変換ステップにて求められた周波数スペクトルのレ
ベルを全帯域にわたり前記初期値以外の変更を繰り返し
行なう前記全帯域レベル変更ステップ(STEP14)とを有す
ることを特徴とするオーディオ信号符号化方法を提供す
るものである。すなわち、請求項1の発明では、従来の
2重ループ処理の構成でなく、アウターループ処理に相
当する第1のブロックと、インナーループに相当する第
2のブロックとより構成するようにし、前記第1のブロ
ックでは、聴覚モデル部12から算出されるSMR( Signa
l-to-Mask-Ratio )と量子化、逆量子化によって算出さ
れるSNR( Signal-to-Noise-Ratio )よりMNR( Mask-to-N
oise-Ratio )を求め( STEP 3 ) 、第1の周波数スペク
トルレベル変更手段のレベルを変更し、周波数スペクト
ルのレベルをバンド単位で変更を行なうようにした( ST
EP 4 )ことにより、従来のイタレーションループにおい
て、(アウターループ×インナーループ)回行なわれて
いる量子化の回数をインナーループの回数だけにするこ
とが出来る。逆量子化については、(アウターループ)
回から1回にすることが出来る。また、1重ループのた
め、イタレーションループ全体の収束度を早めることが
出来るものである。
法の一実施例について、図と共に以下に説明する。図1
に本発明のオーディオ符号化方法の一実施例のイタレー
ションループ処理のフロー図を示す。図2には本発明の
オーディオ符号化方法が適用される装置の一実施例のブ
ロック構成図を示す。図2に示される本発明のオーディ
オ符号化方法が適用される装置の一実施例は、時間周波
数変換部11、聴覚モデル部12、量子化符号化部1
3、及びビットストリーム化部14より構成されてい
る。
変換部11においてFFTやMDCT等を用いて、時間軸から
周波数軸への変換が行なわれ、変換された周波数スペク
トルが量子化符号化部13に送られる。
2にも供給されて、聴覚モデル部12では、聴覚心理に
基づいたマスキングレベルの計算により求められた信号
対マスキング率SMR( Signal-to-Mask-ratio )が量子化
符号化部13に送られる。
でかつ、SMRより求められた許容歪み内に量子化歪みが
収まるように量子化、符号化を行ない( STEP 2 )、ビッ
トストリーム化部14でビットストリームを構成する。
化式(数2)には、量子化符号化部13において量子
化、逆量子化で使用される式の一実施例がそれぞれ示さ
れてある。下記に示される量子化式(数1)、逆量子化
式(数2)において、mdct#line(k)は周波数スペクトル
を示しており、global#gainは、周波数スペクトル全体
のレベルを変更し、scalefactor(sfb)は、バンド単位で
周波数スペクトルのレベルを変更するものである。
実施例のイタレーションループ処理のフロー図を示す。
まず、所定ビット数に収まるような初期global#gain値
の推測を行なう(STEP1)。
設定し、global#gainを先ほど求めた初期global#gain値
に設定して、量子化、逆量子化を行なう(STEP2)。
子化歪みから、SNR(Signal-to-Noise-Ratio)を算出する
(STEP2)。
キング率SMRからマスキング対量子化雑音率MNR( Mask-t
o-Noise-Ratio )を以下の式に基づいて求める(STEP
3)。
っているかを表わす比率である。このMNR値が0[dB]以
上の場合、マスキング効果により量子化雑音が聞こえな
くなる。
actor(sfb)の調整は、MNRが0[dB]より低いバンドに対
して、MNRを0[dB]以上にするために必要なscalefactor
(sfb)の増加量を算出し、それに応じて バンドレベル(s
calefactor)のレベルを増加させることで 周波数スペク
トルのレベルが増幅され、量子化歪が減少する(STE
P4)。
所定ビット数に変化が生じるので、改めてインナールー
プを呼び出して、量子化する(STEP11)。
算出する(STEP12)。
数の範囲内あるかどうかの判定を行なった(STEP1
3)後で、前記所定ビット数に収まるまで全帯域レベルg
lobal#gainの調整により調整して(STEP14)、所定
のビット数に納める(イタレーションループ終了)。
覚モデルステップと量子化符号化ステップとビットスト
リーム化ステップとを有するオーディオ信号符号化方法
において、前記量子化符号化ステップは、所定ビット数
に収まるように全帯域レベル変更ステップの初期値を推
測する初期値レベル推測ステップと、前記聴覚モデルス
テップから算出されるSMRと前記初期レベル推測ステッ
プの出力が供給され量子化、逆量子化によって算出され
るSNRとより求めたMNRに応じて、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルをバン
ド単位で変更を行なうバンドレベル変更ステップと、前
記量子化、符号化により求められる使用ビット数を所定
のビット数範囲内に収めるまで、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルを全帯
域にわたり前記初期値以外の変更を行なう前記全帯域レ
ベル変更ステップとを有する手順とし、量子化符号化部
のイタレーションループ処理において、従来の2重ルー
プ構成はやめ、アウターループに相当する第1のブロッ
クとインナーループに相当する第2のブロックとに分離
して処理することが出来るようにしたので、アウタール
ープ×インナーループ回も行なわれていた量子化の回数
を、インナーループの回数だけに削減することが出来、
逆量子化については、アウターループの分の回数から1
回だけに削減することが出来るので、イタレーションル
ープ全体の収束度を速めることが出来る。
適なオーディオ信号符号化方法を提供することが出来
る。
ローチャートにより手順を示した図である。
置の一実施例のブロック構成を示した図である。
ションループのフローを示した図である。
o) global#gain 第2の周波数スペクトルレベル変更手段
( STEP 14 )のレベル scalefactor (sfb) 第1の周波数スペクトルレベル変
更手段( STEP 4 )のレベル
Claims (1)
- 【請求項1】時間周波数変換ステップと聴覚モデルステ
ップと量子化符号化ステップとビットストリーム化ステ
ップとを有するオーディオ信号符号化方法において、 前記量子化符号化ステップは、 所定ビット数に収まるように全帯域レベル変更ステップ
の初期値を推測する初期値レベル推測ステップと、 前記聴覚モデルステップから算出されるSMR(Signal-to-
Mask-Ratio)と前記初期レベル推測ステップの出力が供
給され量子化、逆量子化によって算出されるSNR(Signal
-to-Noise-Ratio)とより求めたMNR(Mask-to-Noise-Rati
o)に応じて、前記時間周波数変換ステップにて求められ
た周波数スペクトルのレベルをバンド単位で変更を行な
うバンドレベル変更ステップと、 前記量子化、符号化により求められる使用ビット数を所
定のビット数範囲内に収めるまで、前記時間周波数変換
ステップにて求められた周波数スペクトルのレベルを全
帯域にわたり前記初期値以外の変更を繰り返し行なう前
記全帯域レベル変更ステップとを有することを特徴とす
るオーディオ信号符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36961199A JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36961199A JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001184091A true JP2001184091A (ja) | 2001-07-06 |
JP3580485B2 JP3580485B2 (ja) | 2004-10-20 |
Family
ID=18494880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36961199A Expired - Lifetime JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3580485B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613605B2 (en) | 2004-11-18 | 2009-11-03 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
-
1999
- 1999-12-27 JP JP36961199A patent/JP3580485B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7613605B2 (en) | 2004-11-18 | 2009-11-03 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP3580485B2 (ja) | 2004-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9715883B2 (en) | Multi-mode audio codec and CELP coding adapted therefore | |
CN101556800B (zh) | 音频频谱编解码方法和装置、声音信号发送和接收装置 | |
US20060074693A1 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
KR101278546B1 (ko) | 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법 | |
US8391212B2 (en) | System and method for frequency domain audio post-processing based on perceptual masking | |
US20140257827A1 (en) | Generation of a high band extension of a bandwidth extended audio signal | |
JP2012027498A (ja) | 広帯域オーディオ伝送システム | |
JP2005338637A (ja) | オーディオ信号符号化装置及び方法 | |
WO2006075563A1 (ja) | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム | |
WO2009056867A1 (en) | Adaptive tuning of the perceptual model | |
JPH08223052A (ja) | 音声高能率符号化装置 | |
US9691398B2 (en) | Method and a decoder for attenuation of signal regions reconstructed with low accuracy | |
JP2001184091A (ja) | オーディオ信号符号化方法 | |
JP3630082B2 (ja) | オーディオ信号符号化方法及びその装置 | |
JP4409733B2 (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP4354561B2 (ja) | オーディオ信号符号化装置及び復号化装置 | |
JP3863706B2 (ja) | 音声符号化方法 | |
JP2001154697A (ja) | オーディオ信号の符号化方法 | |
Atal et al. | Split-band APC system for low bit-rate encoding of speech | |
JP2002116799A (ja) | オーディオ信号符号化装置 | |
JPH06291679A (ja) | オーディオ信号のためのしきい値制御量子化決定法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040715 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3580485 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |