JP2001184091A

JP2001184091A - オーディオ信号符号化方法

Info

Publication number: JP2001184091A
Application number: JP36961199A
Authority: JP
Inventors: Sadahiro Yasura; 定浩安良
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 1999-12-27
Filing date: 1999-12-27
Publication date: 2001-07-06
Anticipated expiration: 2019-12-27
Also published as: JP3580485B2

Abstract

(57)【要約】（修正有）【課題】インタレーショループ全体の収速度を速め
る。【解決手段】時間周波数変換ステップ１１と聴覚モデ
ルステップ１２と量子化符号化ステップ１３とビットス
トリーム化ステップ１４とを有するオーディオ信号符号
化方法において、量子化符号化ステップは、所定ビット
数に収まるように全帯域レベル変更ステップの初期値レ
ベル推測ステップSTEP1と、聴覚モデルステップからのS
MRと初期レベル推測ステップの出力が供給され量子化、
逆量子化によって算出されるSNRとより求めたMNRに応
じ、周波数スペクトルのレベルのバンドレベル変更ステ
ップSTEP4と、使用ビット数を所定のビット数範囲内に
収めるまで、周波数スペクトルのレベルを全帯域にわた
り初期値以外の変更を繰返し行なう全帯域レベル変更ス
テップSTEP14とを有する手順とした。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、オーディオ信号を
周波数領域に変換した後に符号化を行なうオーディオ信
号符号化方法に関する。

【０００２】

【従来の技術】従来より、オーディオ信号の符号化方法
には、例えば適応スペクトル聴感制御エントロピー符号
化法（ASPEC, Adaptive Spectral Perceptual Entropy
Coding）、ＭＰＥＧ１オーディオ・レイヤ3、ＭＰＥＧ
２オーディオＡＡＣ（ AdvancedAudio Coding ）があ
る。

【０００３】これらは、非線型量子化とハフマン符号化
のために２重ループを構成して、量子化歪みと、符号量
とを制御している。それぞれのループは、アウタールー
プ、インナーループと呼ばれており、アウターループで
は、量子化歪みが、聴覚心理モデルステップから得られ
た許容ノイズレベル以下になるように制御を行ない、イ
ンナーループでは、量子化を行ない所定のビット数の範
囲内に収まるように制御を行なっている。

【０００４】図３には、従来の量子化符号化部における
イタレーションループ処理のフロー図を示す。従来の処
理では、所定ビット数に収める処理と量子化歪みを所定
量に収める処理とに対して、それぞれ別ループを作るこ
とで実現している。所定ビット数とは、設定されたビッ
トレートより求められる１オーディオフレームにおいて
使用可能なビット数を意味する。

【０００５】インナーループでは、量子化とハフマン符
号化により求められる使用ビット数( STEP 11A ) ( STE
P 12A )が所定ビット数に収まっているかどうかの判断
を行なう( STEP 13A ) 。収まっていない場合には、周
波数スペクトルを全ての帯域に対して一様に可変する変
数（global#gain）を調整する( STEP 14A )ことで、所
定のビット数に納める。

【０００６】アウターループでは、インナーループで求
められた量子化結果を元に逆量子化を行ない、バンド単
位で量子化歪みを求める( STEP 2A )。求めた量子化歪
みが聴覚モデル部の信号対マスキング率SMRから求めた
許容歪み内に収まっているかどうかを判断し( STEP 3A
)、収まっていない場合、そのバンドのscalefactor (s
fb)を調整する( STEP 4A )。量子化歪みが収まっていな
いバンドが１バンド以上存在する場合には、再びインナ
ーループからやり直す( STEP 1A )。

【０００７】

【発明が解決しようとする課題】前記２重ループの処理
では、外側に存在するアウターループが満足されない場
合に、再びインナーループを呼び出さねばならないた
め、収束時間の確定が難しいという問題があり、また、
量子化、逆量子化の演算回数が増加するという問題があ
る。これは、ＤＳＰ等を用いた処理スピードの速いリア
ルタイム処理に不向きである。そこで、本発明は、上記
の問題に鑑み、リアルタイム処理に適したオーディオ信
号符号化装置及びその方法を提供することを目的とす
る。

【０００８】

【課題を解決するための手段】上記課題を解決するため
の手段として、請求項１の発明は、時間周波数変換ステ
ップ１１と聴覚モデルステップ１２と量子化符号化ステ
ップ１３とビットストリーム化ステップ１４とを有する
オーディオ信号符号化方法において、前記量子化符号化
ステップ１３は、所定ビット数に収まるように全帯域レ
ベル変更ステップの初期値を推測する初期値レベル推測
ステップ(STEP1)と、前記聴覚モデルステップから算出
されるSMR(Signal-to-Mask-Ratio)と前記初期レベル推
測ステップの出力が供給され量子化、逆量子化によって
算出されるSNR(Signal-to-Noise-Ratio)とより求めたMN
R(Mask-to-Noise-Ratio)に応じて、前記時間周波数変換
ステップにて求められた周波数スペクトルのレベルをバ
ンド単位で変更を行なうバンドレベル変更ステップ(STE
P4)と、前記量子化、符号化により求められる使用ビッ
ト数を所定のビット数範囲内に収めるまで、前記時間周
波数変換ステップにて求められた周波数スペクトルのレ
ベルを全帯域にわたり前記初期値以外の変更を繰り返し
行なう前記全帯域レベル変更ステップ(STEP14)とを有す
ることを特徴とするオーディオ信号符号化方法を提供す
るものである。すなわち、請求項１の発明では、従来の
2重ループ処理の構成でなく、アウターループ処理に相
当する第１のブロックと、インナーループに相当する第
２のブロックとより構成するようにし、前記第１のブロ
ックでは、聴覚モデル部１２から算出されるSMR( Signa
l-to-Mask-Ratio )と量子化、逆量子化によって算出さ
れるSNR( Signal-to-Noise-Ratio )よりMNR( Mask-to-N
oise-Ratio )を求め( STEP 3 ) 、第１の周波数スペク
トルレベル変更手段のレベルを変更し、周波数スペクト
ルのレベルをバンド単位で変更を行なうようにした( ST
EP 4 )ことにより、従来のイタレーションループにおい
て、（アウターループ×インナーループ）回行なわれて
いる量子化の回数をインナーループの回数だけにするこ
とが出来る。逆量子化については、（アウターループ）
回から1回にすることが出来る。また、１重ループのた
め、イタレーションループ全体の収束度を早めることが
出来るものである。

【０００９】

【発明の実施の形態】本発明のオーディオ信号符号化方
法の一実施例について、図と共に以下に説明する。図１
に本発明のオーディオ符号化方法の一実施例のイタレー
ションループ処理のフロー図を示す。図２には本発明の
オーディオ符号化方法が適用される装置の一実施例のブ
ロック構成図を示す。図２に示される本発明のオーディ
オ符号化方法が適用される装置の一実施例は、時間周波
数変換部１１、聴覚モデル部１２、量子化符号化部１
３、及びビットストリーム化部１４より構成されてい
る。

【００１０】まず、入力されたPCM信号は、時間周波数
変換部１１においてFFTやMDCT等を用いて、時間軸から
周波数軸への変換が行なわれ、変換された周波数スペク
トルが量子化符号化部１３に送られる。

【００１１】前記入力されたPCM信号は聴覚モデル部１
２にも供給されて、聴覚モデル部１２では、聴覚心理に
基づいたマスキングレベルの計算により求められた信号
対マスキング率SMR( Signal-to-Mask-ratio )が量子化
符号化部１３に送られる。

【００１２】量子化符号化部１３では、所定のビット数
でかつ、SMRより求められた許容歪み内に量子化歪みが
収まるように量子化、符号化を行ない( STEP 2 )、ビッ
トストリーム化部１４でビットストリームを構成する。

【００１３】下記に示される量子化式（数１）、逆量子
化式（数２）には、量子化符号化部１３において量子
化、逆量子化で使用される式の一実施例がそれぞれ示さ
れてある。下記に示される量子化式（数１）、逆量子化
式（数２）において、mdct#line(k)は周波数スペクトル
を示しており、global#gainは、周波数スペクトル全体
のレベルを変更し、scalefactor(sfb)は、バンド単位で
周波数スペクトルのレベルを変更するものである。

【００１４】

【数１】

【００１5】

【数２】

【００１６】図１に本発明のオーディオ符号化方法の一
実施例のイタレーションループ処理のフロー図を示す。
まず、所定ビット数に収まるような初期global#gain値
の推測を行なう(ＳＴＥＰ１)。

【００１７】つぎに、scalefactor(sfb)をすべてゼロに
設定し、global#gainを先ほど求めた初期global#gain値
に設定して、量子化、逆量子化を行なう(ＳＴＥＰ２)。

【００１８】さらに、量子化、逆量子化により求めた量
子化歪みから、SNR(Signal-to-Noise-Ratio)を算出する
(ＳＴＥＰ２)。

【００１９】聴覚モデル部１２から送られた信号対マス
キング率SMRからマスキング対量子化雑音率MNR( Mask-t
o-Noise-Ratio )を以下の式に基づいて求める(ＳＴＥＰ
３)。

【００２０】MNR = SNR−SMR［dB］前記MNRは、量子化雑音がマスキングレベル以下に収ま
っているかを表わす比率である。このMNR値が０[dB]以
上の場合、マスキング効果により量子化雑音が聞こえな
くなる。

【００２１】前記のSTEP 3で算出した値に応じたscalef
actor(sfb)の調整は、MNRが０[dB]より低いバンドに対
して、MNRを０[dB]以上にするために必要なscalefactor
(sfb)の増加量を算出し、それに応じてバンドレベル(s
calefactor)のレベルを増加させることで周波数スペク
トルのレベルが増幅され、量子化歪が減少する(ＳＴＥ
Ｐ４)。

【００２２】また、scalefactor (sfb)の増加により、
所定ビット数に変化が生じるので、改めてインナールー
プを呼び出して、量子化する(ＳＴＥＰ１１)。

【００２３】ハフマン符号化を行ない、使用ビット数を
算出する(ＳＴＥＰ１２)。

【００２４】ＳＴＥＰ１２による算出結果が所定ビット
数の範囲内あるかどうかの判定を行なった（ＳＴＥＰ１
３)後で、前記所定ビット数に収まるまで全帯域レベルg
lobal#gainの調整により調整して(ＳＴＥＰ１４)、所定
のビット数に納める（イタレーションループ終了）。

【００２５】

【発明の効果】本発明は、時間周波数変換ステップと聴
覚モデルステップと量子化符号化ステップとビットスト
リーム化ステップとを有するオーディオ信号符号化方法
において、前記量子化符号化ステップは、所定ビット数
に収まるように全帯域レベル変更ステップの初期値を推
測する初期値レベル推測ステップと、前記聴覚モデルス
テップから算出されるSMRと前記初期レベル推測ステッ
プの出力が供給され量子化、逆量子化によって算出され
るSNRとより求めたMNRに応じて、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルをバン
ド単位で変更を行なうバンドレベル変更ステップと、前
記量子化、符号化により求められる使用ビット数を所定
のビット数範囲内に収めるまで、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルを全帯
域にわたり前記初期値以外の変更を行なう前記全帯域レ
ベル変更ステップとを有する手順とし、量子化符号化部
のイタレーションループ処理において、従来の２重ルー
プ構成はやめ、アウターループに相当する第１のブロッ
クとインナーループに相当する第２のブロックとに分離
して処理することが出来るようにしたので、アウタール
ープ×インナーループ回も行なわれていた量子化の回数
を、インナーループの回数だけに削減することが出来、
逆量子化については、アウターループの分の回数から1
回だけに削減することが出来るので、イタレーションル
ープ全体の収束度を速めることが出来る。

【００２６】よって、本発明は、リアルタイム処理に好
適なオーディオ信号符号化方法を提供することが出来
る。

【図面の簡単な説明】

【図１】本発明のオーディオ符号化方法の一実施例をフ
ローチャートにより手順を示した図である。

【図２】本発明のオーディオ符号化方法が適用される装
置の一実施例のブロック構成を示した図である。

【図３】従来のオーディオ符号化方法の一例のイタレー
ションループのフローを示した図である。

【符号の説明】

１１時間周波数変換部１２聴覚モデル部１３量子化符号化部１４ビットストリーム化部 MNR マスキング対量子化雑音率 (Mask-to-Noise-Rati
o) global#gain 第２の周波数スペクトルレベル変更手段
( STEP 14 )のレベル scalefactor (sfb) 第１の周波数スペクトルレベル変
更手段( STEP 4 )のレベル

Claims

【特許請求の範囲】

【請求項１】時間周波数変換ステップと聴覚モデルステ
ップと量子化符号化ステップとビットストリーム化ステ
ップとを有するオーディオ信号符号化方法において、前記量子化符号化ステップは、所定ビット数に収まるように全帯域レベル変更ステップ
の初期値を推測する初期値レベル推測ステップと、前記聴覚モデルステップから算出されるSMR(Signal-to-
Mask-Ratio)と前記初期レベル推測ステップの出力が供
給され量子化、逆量子化によって算出されるSNR(Signal
-to-Noise-Ratio)とより求めたMNR(Mask-to-Noise-Rati
o)に応じて、前記時間周波数変換ステップにて求められ
た周波数スペクトルのレベルをバンド単位で変更を行な
うバンドレベル変更ステップと、前記量子化、符号化により求められる使用ビット数を所
定のビット数範囲内に収めるまで、前記時間周波数変換
ステップにて求められた周波数スペクトルのレベルを全
帯域にわたり前記初期値以外の変更を繰り返し行なう前
記全帯域レベル変更ステップとを有することを特徴とす
るオーディオ信号符号化方法。