JP2001184091A - オーディオ信号符号化方法 - Google Patents

オーディオ信号符号化方法

Info

Publication number
JP2001184091A
JP2001184091A JP36961199A JP36961199A JP2001184091A JP 2001184091 A JP2001184091 A JP 2001184091A JP 36961199 A JP36961199 A JP 36961199A JP 36961199 A JP36961199 A JP 36961199A JP 2001184091 A JP2001184091 A JP 2001184091A
Authority
JP
Japan
Prior art keywords
level
quantization
band
bits
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36961199A
Other languages
English (en)
Other versions
JP3580485B2 (ja
Inventor
Sadahiro Yasura
定浩 安良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP36961199A priority Critical patent/JP3580485B2/ja
Publication of JP2001184091A publication Critical patent/JP2001184091A/ja
Application granted granted Critical
Publication of JP3580485B2 publication Critical patent/JP3580485B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 インタレーショループ全体の収速度を速め
る。 【解決手段】 時間周波数変換ステップ11と聴覚モデ
ルステップ12と量子化符号化ステップ13とビットス
トリーム化ステップ14とを有するオーディオ信号符号
化方法において、量子化符号化ステップは、所定ビット
数に収まるように全帯域レベル変更ステップの初期値レ
ベル推測ステップSTEP1と、聴覚モデルステップからのS
MRと初期レベル推測ステップの出力が供給され量子化、
逆量子化によって算出されるSNRとより求めたMNRに応
じ、周波数スペクトルのレベルのバンドレベル変更ステ
ップSTEP4と、使用ビット数を所定のビット数範囲内に
収めるまで、周波数スペクトルのレベルを全帯域にわた
り初期値以外の変更を繰返し行なう全帯域レベル変更ス
テップSTEP14とを有する手順とした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
周波数領域に変換した後に符号化を行なうオーディオ信
号符号化方法に関する。
【0002】
【従来の技術】従来より、オーディオ信号の符号化方法
には、例えば適応スペクトル聴感制御エントロピー符号
化法(ASPEC, Adaptive Spectral Perceptual Entropy
Coding)、MPEG1オーディオ・レイヤ3、MPEG
2オーディオAAC( AdvancedAudio Coding )があ
る。
【0003】これらは、非線型量子化とハフマン符号化
のために2重ループを構成して、量子化歪みと、符号量
とを制御している。それぞれのループは、アウタールー
プ、インナーループと呼ばれており、アウターループで
は、量子化歪みが、聴覚心理モデルステップから得られ
た許容ノイズレベル以下になるように制御を行ない、イ
ンナーループでは、量子化を行ない所定のビット数の範
囲内に収まるように制御を行なっている。
【0004】図3には、従来の量子化符号化部における
イタレーションループ処理のフロー図を示す。従来の処
理では、所定ビット数に収める処理と量子化歪みを所定
量に収める処理とに対して、それぞれ別ループを作るこ
とで実現している。所定ビット数とは、設定されたビッ
トレートより求められる1オーディオフレームにおいて
使用可能なビット数を意味する。
【0005】インナーループでは、量子化とハフマン符
号化により求められる使用ビット数( STEP 11A ) ( STE
P 12A )が所定ビット数に収まっているかどうかの判断
を行なう( STEP 13A ) 。収まっていない場合には、周
波数スペクトルを全ての帯域に対して一様に可変する変
数(global#gain)を調整する( STEP 14A )ことで、所
定のビット数に納める。
【0006】アウターループでは、インナーループで求
められた量子化結果を元に逆量子化を行ない、バンド単
位で量子化歪みを求める( STEP 2A )。求めた量子化歪
みが聴覚モデル部の信号対マスキング率SMRから求めた
許容歪み内に収まっているかどうかを判断し( STEP 3A
)、収まっていない場合、そのバンドのscalefactor (s
fb)を調整する( STEP 4A )。量子化歪みが収まっていな
いバンドが1バンド以上存在する場合には、再びインナ
ーループからやり直す( STEP 1A )。
【0007】
【発明が解決しようとする課題】前記2重ループの処理
では、外側に存在するアウターループが満足されない場
合に、再びインナーループを呼び出さねばならないた
め、収束時間の確定が難しいという問題があり、また、
量子化、逆量子化の演算回数が増加するという問題があ
る。これは、DSP等を用いた処理スピードの速いリア
ルタイム処理に不向きである。そこで、本発明は、上記
の問題に鑑み、リアルタイム処理に適したオーディオ信
号符号化装置及びその方法を提供することを目的とす
る。
【0008】
【課題を解決するための手段】上記課題を解決するため
の手段として、請求項1の発明は、時間周波数変換ステ
ップ11と聴覚モデルステップ12と量子化符号化ステ
ップ13とビットストリーム化ステップ14とを有する
オーディオ信号符号化方法において、前記量子化符号化
ステップ13は、所定ビット数に収まるように全帯域レ
ベル変更ステップの初期値を推測する初期値レベル推測
ステップ(STEP1)と、前記聴覚モデルステップから算出
されるSMR(Signal-to-Mask-Ratio)と前記初期レベル推
測ステップの出力が供給され量子化、逆量子化によって
算出されるSNR(Signal-to-Noise-Ratio)とより求めたMN
R(Mask-to-Noise-Ratio)に応じて、前記時間周波数変換
ステップにて求められた周波数スペクトルのレベルをバ
ンド単位で変更を行なうバンドレベル変更ステップ(STE
P4)と、前記量子化、符号化により求められる使用ビッ
ト数を所定のビット数範囲内に収めるまで、前記時間周
波数変換ステップにて求められた周波数スペクトルのレ
ベルを全帯域にわたり前記初期値以外の変更を繰り返し
行なう前記全帯域レベル変更ステップ(STEP14)とを有す
ることを特徴とするオーディオ信号符号化方法を提供す
るものである。すなわち、請求項1の発明では、従来の
2重ループ処理の構成でなく、アウターループ処理に相
当する第1のブロックと、インナーループに相当する第
2のブロックとより構成するようにし、前記第1のブロ
ックでは、聴覚モデル部12から算出されるSMR( Signa
l-to-Mask-Ratio )と量子化、逆量子化によって算出さ
れるSNR( Signal-to-Noise-Ratio )よりMNR( Mask-to-N
oise-Ratio )を求め( STEP 3 ) 、第1の周波数スペク
トルレベル変更手段のレベルを変更し、周波数スペクト
ルのレベルをバンド単位で変更を行なうようにした( ST
EP 4 )ことにより、従来のイタレーションループにおい
て、(アウターループ×インナーループ)回行なわれて
いる量子化の回数をインナーループの回数だけにするこ
とが出来る。逆量子化については、(アウターループ)
回から1回にすることが出来る。また、1重ループのた
め、イタレーションループ全体の収束度を早めることが
出来るものである。
【0009】
【発明の実施の形態】本発明のオーディオ信号符号化方
法の一実施例について、図と共に以下に説明する。図1
に本発明のオーディオ符号化方法の一実施例のイタレー
ションループ処理のフロー図を示す。図2には本発明の
オーディオ符号化方法が適用される装置の一実施例のブ
ロック構成図を示す。図2に示される本発明のオーディ
オ符号化方法が適用される装置の一実施例は、時間周波
数変換部11、聴覚モデル部12、量子化符号化部1
3、及びビットストリーム化部14より構成されてい
る。
【0010】まず、入力されたPCM信号は、時間周波数
変換部11においてFFTやMDCT等を用いて、時間軸から
周波数軸への変換が行なわれ、変換された周波数スペク
トルが量子化符号化部13に送られる。
【0011】前記入力されたPCM信号は聴覚モデル部1
2にも供給されて、聴覚モデル部12では、聴覚心理に
基づいたマスキングレベルの計算により求められた信号
対マスキング率SMR( Signal-to-Mask-ratio )が量子化
符号化部13に送られる。
【0012】量子化符号化部13では、所定のビット数
でかつ、SMRより求められた許容歪み内に量子化歪みが
収まるように量子化、符号化を行ない( STEP 2 )、ビッ
トストリーム化部14でビットストリームを構成する。
【0013】下記に示される量子化式(数1)、逆量子
化式(数2)には、量子化符号化部13において量子
化、逆量子化で使用される式の一実施例がそれぞれ示さ
れてある。下記に示される量子化式(数1)、逆量子化
式(数2)において、mdct#line(k)は周波数スペクトル
を示しており、global#gainは、周波数スペクトル全体
のレベルを変更し、scalefactor(sfb)は、バンド単位で
周波数スペクトルのレベルを変更するものである。
【0014】
【数1】
【0015】
【数2】
【0016】図1に本発明のオーディオ符号化方法の一
実施例のイタレーションループ処理のフロー図を示す。
まず、所定ビット数に収まるような初期global#gain値
の推測を行なう(STEP1)。
【0017】つぎに、scalefactor(sfb)をすべてゼロに
設定し、global#gainを先ほど求めた初期global#gain値
に設定して、量子化、逆量子化を行なう(STEP2)。
【0018】さらに、量子化、逆量子化により求めた量
子化歪みから、SNR(Signal-to-Noise-Ratio)を算出する
(STEP2)。
【0019】聴覚モデル部12から送られた信号対マス
キング率SMRからマスキング対量子化雑音率MNR( Mask-t
o-Noise-Ratio )を以下の式に基づいて求める(STEP
3)。
【0020】MNR = SNR−SMR[dB] 前記MNRは、量子化雑音がマスキングレベル以下に収ま
っているかを表わす比率である。このMNR値が0[dB]以
上の場合、マスキング効果により量子化雑音が聞こえな
くなる。
【0021】前記のSTEP 3で算出した値に応じたscalef
actor(sfb)の調整は、MNRが0[dB]より低いバンドに対
して、MNRを0[dB]以上にするために必要なscalefactor
(sfb)の増加量を算出し、それに応じて バンドレベル(s
calefactor)のレベルを増加させることで 周波数スペク
トルのレベルが増幅され、量子化歪が減少する(STE
P4)。
【0022】また、scalefactor (sfb)の増加により、
所定ビット数に変化が生じるので、改めてインナールー
プを呼び出して、量子化する(STEP11)。
【0023】ハフマン符号化を行ない、使用ビット数を
算出する(STEP12)。
【0024】STEP12による算出結果が所定ビット
数の範囲内あるかどうかの判定を行なった(STEP1
3)後で、前記所定ビット数に収まるまで全帯域レベルg
lobal#gainの調整により調整して(STEP14)、所定
のビット数に納める(イタレーションループ終了)。
【0025】
【発明の効果】本発明は、時間周波数変換ステップと聴
覚モデルステップと量子化符号化ステップとビットスト
リーム化ステップとを有するオーディオ信号符号化方法
において、前記量子化符号化ステップは、所定ビット数
に収まるように全帯域レベル変更ステップの初期値を推
測する初期値レベル推測ステップと、前記聴覚モデルス
テップから算出されるSMRと前記初期レベル推測ステッ
プの出力が供給され量子化、逆量子化によって算出され
るSNRとより求めたMNRに応じて、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルをバン
ド単位で変更を行なうバンドレベル変更ステップと、前
記量子化、符号化により求められる使用ビット数を所定
のビット数範囲内に収めるまで、前記時間周波数変換ス
テップにて求められた周波数スペクトルのレベルを全帯
域にわたり前記初期値以外の変更を行なう前記全帯域レ
ベル変更ステップとを有する手順とし、量子化符号化部
のイタレーションループ処理において、従来の2重ルー
プ構成はやめ、アウターループに相当する第1のブロッ
クとインナーループに相当する第2のブロックとに分離
して処理することが出来るようにしたので、アウタール
ープ×インナーループ回も行なわれていた量子化の回数
を、インナーループの回数だけに削減することが出来、
逆量子化については、アウターループの分の回数から1
回だけに削減することが出来るので、イタレーションル
ープ全体の収束度を速めることが出来る。
【0026】よって、本発明は、リアルタイム処理に好
適なオーディオ信号符号化方法を提供することが出来
る。
【図面の簡単な説明】
【図1】本発明のオーディオ符号化方法の一実施例をフ
ローチャートにより手順を示した図である。
【図2】本発明のオーディオ符号化方法が適用される装
置の一実施例のブロック構成を示した図である。
【図3】従来のオーディオ符号化方法の一例のイタレー
ションループのフローを示した図である。
【符号の説明】
11 時間周波数変換部 12 聴覚モデル部 13 量子化符号化部 14 ビットストリーム化部 MNR マスキング対量子化雑音率 (Mask-to-Noise-Rati
o) global#gain 第2の周波数スペクトルレベル変更手段
( STEP 14 )のレベル scalefactor (sfb) 第1の周波数スペクトルレベル変
更手段( STEP 4 )のレベル

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】時間周波数変換ステップと聴覚モデルステ
    ップと量子化符号化ステップとビットストリーム化ステ
    ップとを有するオーディオ信号符号化方法において、 前記量子化符号化ステップは、 所定ビット数に収まるように全帯域レベル変更ステップ
    の初期値を推測する初期値レベル推測ステップと、 前記聴覚モデルステップから算出されるSMR(Signal-to-
    Mask-Ratio)と前記初期レベル推測ステップの出力が供
    給され量子化、逆量子化によって算出されるSNR(Signal
    -to-Noise-Ratio)とより求めたMNR(Mask-to-Noise-Rati
    o)に応じて、前記時間周波数変換ステップにて求められ
    た周波数スペクトルのレベルをバンド単位で変更を行な
    うバンドレベル変更ステップと、 前記量子化、符号化により求められる使用ビット数を所
    定のビット数範囲内に収めるまで、前記時間周波数変換
    ステップにて求められた周波数スペクトルのレベルを全
    帯域にわたり前記初期値以外の変更を繰り返し行なう前
    記全帯域レベル変更ステップとを有することを特徴とす
    るオーディオ信号符号化方法。
JP36961199A 1999-12-27 1999-12-27 オーディオ信号符号化方法 Expired - Lifetime JP3580485B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36961199A JP3580485B2 (ja) 1999-12-27 1999-12-27 オーディオ信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36961199A JP3580485B2 (ja) 1999-12-27 1999-12-27 オーディオ信号符号化方法

Publications (2)

Publication Number Publication Date
JP2001184091A true JP2001184091A (ja) 2001-07-06
JP3580485B2 JP3580485B2 (ja) 2004-10-20

Family

ID=18494880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36961199A Expired - Lifetime JP3580485B2 (ja) 1999-12-27 1999-12-27 オーディオ信号符号化方法

Country Status (1)

Country Link
JP (1) JP3580485B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613605B2 (en) 2004-11-18 2009-11-03 Canon Kabushiki Kaisha Audio signal encoding apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613605B2 (en) 2004-11-18 2009-11-03 Canon Kabushiki Kaisha Audio signal encoding apparatus and method

Also Published As

Publication number Publication date
JP3580485B2 (ja) 2004-10-20

Similar Documents

Publication Publication Date Title
US9715883B2 (en) Multi-mode audio codec and CELP coding adapted therefore
CN101556800B (zh) 音频频谱编解码方法和装置、声音信号发送和接收装置
US20060074693A1 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
KR101278546B1 (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
US8391212B2 (en) System and method for frequency domain audio post-processing based on perceptual masking
US20140257827A1 (en) Generation of a high band extension of a bandwidth extended audio signal
JP2012027498A (ja) 広帯域オーディオ伝送システム
JP2005338637A (ja) オーディオ信号符号化装置及び方法
WO2006075563A1 (ja) オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
WO2009056867A1 (en) Adaptive tuning of the perceptual model
JPH08223052A (ja) 音声高能率符号化装置
US9691398B2 (en) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
JP2001184091A (ja) オーディオ信号符号化方法
JP3630082B2 (ja) オーディオ信号符号化方法及びその装置
JP4409733B2 (ja) 符号化装置、符号化方法、及びその記録媒体
JP4354561B2 (ja) オーディオ信号符号化装置及び復号化装置
JP3863706B2 (ja) 音声符号化方法
JP2001154697A (ja) オーディオ信号の符号化方法
Atal et al. Split-band APC system for low bit-rate encoding of speech
JP2002116799A (ja) オーディオ信号符号化装置
JPH06291679A (ja) オーディオ信号のためのしきい値制御量子化決定法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040715

R151 Written notification of patent or utility model registration

Ref document number: 3580485

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080730

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090730

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100730

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110730

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120730

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 9

EXPY Cancellation because of completion of term