JP3580485B2 - オーディオ信号符号化方法 - Google Patents
オーディオ信号符号化方法 Download PDFInfo
- Publication number
- JP3580485B2 JP3580485B2 JP36961199A JP36961199A JP3580485B2 JP 3580485 B2 JP3580485 B2 JP 3580485B2 JP 36961199 A JP36961199 A JP 36961199A JP 36961199 A JP36961199 A JP 36961199A JP 3580485 B2 JP3580485 B2 JP 3580485B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- level
- band
- encoding
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
本発明は、オーディオ信号を周波数領域に変換した後に符号化を行なうオーディオ信号符号化方法に関する。
【0002】
【従来の技術】
従来より、オーディオ信号の符号化方法には、例えば適応スペクトル聴感制御エントロピー符号化法(ASPEC, Adaptive Spectral Perceptual Entropy Coding)、MPEG1オーディオ・レイヤ3、MPEG2オーディオAAC( Advanced Audio Coding )がある。
【0003】
これらは、非線型量子化とハフマン符号化のために2重ループを構成して、量子化歪みと、符号量とを制御している。
それぞれのループは、アウターループ、インナーループと呼ばれており、アウターループでは、量子化歪みが、聴覚心理モデルステップから得られた許容ノイズレベル以下になるように制御を行ない、インナーループでは、量子化を行ない所定のビット数の範囲内に収まるように制御を行なっている。
【0004】
図3には、従来の量子化符号化部におけるイタレーションループ処理のフロー図を示す。
従来の処理では、所定ビット数に収める処理と量子化歪みを所定量に収める処理とに対して、それぞれ別ループを作ることで実現している。
所定ビット数とは、設定されたビットレートより求められる1オーディオフレームにおいて使用可能なビット数を意味する。
【0005】
インナーループでは、量子化とハフマン符号化により求められる使用ビット数( STEP 11A ) ( STEP 12A )が所定ビット数に収まっているかどうかの判断を行なう( STEP 13A ) 。
収まっていない場合には、周波数スペクトルを全ての帯域に対して一様に可変する変数(global#gain)を調整する( STEP 14A )ことで、所定のビット数に納める。
【0006】
アウターループでは、インナーループで求められた量子化結果を元に逆量子化を行ない、バンド単位で量子化歪みを求める( STEP 2A )。
求めた量子化歪みが聴覚モデル部の信号対マスキング率SMRから求めた許容歪み内に収まっているかどうかを判断し( STEP 3A )、収まっていない場合、そのバンドのscalefactor (sfb)を調整する( STEP 4A )。
量子化歪みが収まっていないバンドが1バンド以上存在する場合には、再びインナーループからやり直す( STEP 1A )。
【0007】
【発明が解決しようとする課題】
前記2重ループの処理では、外側に存在するアウターループが満足されない場合に、再びインナーループを呼び出さねばならないため、収束時間の確定が難しいという問題があり、また、量子化、逆量子化の演算回数が増加するという問題がある。
これは、DSP等を用いた処理スピードの速いリアルタイム処理に不向きである。
そこで、本発明は、上記の問題に鑑み、リアルタイム処理に適したオーディオ信号符号化装置及びその方法を提供することを目的とする。
【0008】
【課題を解決するための手段】
上記課題を解決するための手段として、
請求項1の発明は、
時間周波数変換ステップ11と聴覚モデルステップ12と量子化符号化ステップ13とビットストリーム化ステップ14とを有するオーディオ信号符号化方法において、
前記量子化符号化ステップ13は、
所定ビット数に収まるように全帯域レベル変更ステップの初期値を推測する初期値レベル推測ステップ(STEP1)と、
前記聴覚モデルステップから算出されるSMR(Signal-to-Mask-Ratio)と前記初期レベル推測ステップの出力が供給され量子化、逆量子化によって算出されるSNR(Signal-to-Noise-Ratio)とより求めたMNR(Mask-to-Noise-Ratio)に応じて、前記時間周波数変換ステップにて求められた周波数スペクトルのレベルをバンド単位で変更するバンドレベル変更ステップ(STEP2 〜 4)と、
前記バンドレベル変更ステップでの処理後の量子化、符号化により求められる使用ビット数を所定のビット数範囲内に収めるまで、前記時間周波数変換ステップにて求められた周波数スペクトルのレベル変更を全帯域にわたり繰り返し行なう前記全帯域レベル変更ステップ(STEP11 〜 14)と、
を有することを特徴とするオーディオ信号符号化方法を提供するものである。
すなわち、
請求項1の発明では、
従来の2重ループ処理の構成でなく、アウターループ処理に相当する第1のブロックと、インナーループに相当する第2のブロックとより構成するようにし、
前記第1のブロックでは、聴覚モデル部12から算出されるSMR( Signal-to-Mask-Ratio )と量子化、逆量子化によって算出されるSNR( Signal-to-Noise-Ratio )よりMNR( Mask-to-Noise-Ratio )を求め( STEP 3 ) 、第1の周波数スペクトルレベル変更手段のレベルを変更し、周波数スペクトルのレベルをバンド単位で変更を行なうようにした( STEP 4 )ことにより、従来のイタレーションループにおいて、(アウターループ×インナーループ)回行なわれている量子化の回数をインナーループの回数だけにすることが出来る。
逆量子化については、(アウターループ)回から1回にすることが出来る。
また、1重ループのため、イタレーションループ全体の収束度を早めることが出来るものである。
【0009】
【発明の実施の形態】
本発明のオーディオ信号符号化方法の一実施例について、図と共に以下に説明する。
図1に本発明のオーディオ符号化方法の一実施例のイタレーションループ処理のフロー図を示す。
図2には本発明のオーディオ符号化方法が適用される装置の一実施例のブロック構成図を示す。
図2に示される本発明のオーディオ符号化方法が適用される装置の一実施例は、時間周波数変換部11、聴覚モデル部12、量子化符号化部13、及びビットストリーム化部14より構成されている。
【0010】
まず、入力されたPCM信号は、時間周波数変換部11においてFFTやMDCT等を用いて、時間軸から周波数軸への変換が行なわれ、変換された周波数スペクトルが量子化符号化部13に送られる。
【0011】
前記入力されたPCM信号は聴覚モデル部12にも供給されて、聴覚モデル部12では、聴覚心理に基づいたマスキングレベルの計算により求められた信号対マスキング率SMR( Signal−to−Mask−ratio )が量子化符号化部13に送られる。
【0012】
量子化符号化部13では、所定のビット数でかつ、SMRより求められた許容歪み内に量子化歪みが収まるように量子化、符号化を行ない( STEP 2 )、ビットストリーム化部14でビットストリームを構成する。
【0013】
下記に示される量子化式(数1)、逆量子化式(数2)には、量子化符号化部13において量子化、逆量子化で使用される式の一実施例がそれぞれ示されてある。
下記に示される量子化式(数1)、逆量子化式(数2)において、mdct#line(k)は周波数スペクトルを示しており、global#gainは、周波数スペクトル全体のレベルを変更し、scalefactor(sfb)は、バンド単位で周波数スペクトルのレベルを変更するものである。
【0014】
【数1】
【0015】
【数2】
【0016】
図1に本発明のオーディオ符号化方法の一実施例のイタレーションループ処理のフロー図を示す。
まず、所定ビット数に収まるような初期global#gain値の推測を行なう
(STEP1)。
【0017】
つぎに、scalefactor(sfb)をすべてゼロに設定し、global#gainを先ほど求めた初期global#gain値に設定して、量子化、逆量子化を行なう(STEP2)。
【0018】
さらに、量子化、逆量子化により求めた量子化歪みから、SNR(Signal−to−Noise−Ratio)を算出する(STEP2)。
【0019】
聴覚モデル部12から送られた信号対マスキング率SMRからマスキング対量子化雑音率MNR( Mask−to−Noise−Ratio )を以下の式に基づいて求める
(STEP3)。
【0020】
MNR = SNR−SMR[dB]
前記MNRは、量子化雑音がマスキングレベル以下に収まっているかを表わす比率である。
このMNR値が0[dB]以上の場合、マスキング効果により量子化雑音が聞こえなくなる。
【0021】
前記のSTEP 3で算出した値に応じたscalefactor(sfb)の調整は、MNRが0[dB]より低いバンドに対して、MNRを0[dB]以上にするために必要なscalefactor(sfb)の増加量を算出し、それに応じて バンドレベル(scalefactor)のレベルを増加させることで 周波数スペクトルのレベルが増幅され、量子化歪が減少する(STEP4)。
【0022】
また、scalefactor (sfb)の増加により、所定ビット数に変化が生じるので、改めてインナーループを呼び出して、量子化する(STEP11)。
【0023】
ハフマン符号化を行ない、使用ビット数を算出する(STEP12)。
【0024】
STEP12による算出結果が所定ビット数の範囲内あるかどうかの判定を行なった(STEP13)後で、前記所定ビット数に収まるまで全帯域レベルglobal#gainの調整により調整して(STEP14)、所定のビット数に納める
(イタレーションループ終了)。
【0025】
【発明の効果】
本発明は、時間周波数変換ステップと聴覚モデルステップと量子化符号化ステップとビットストリーム化ステップとを有するオーディオ信号符号化方法において、前記量子化符号化ステップは、所定ビット数に収まるように全帯域レベル変更ステップの初期値を推測する初期値レベル推測ステップと、前記聴覚モデルステップから算出されるSMRと前記初期レベル推測ステップの出力が供給され量子化、逆量子化によって算出されるSNRとより求めたMNRに応じて、前記時間周波数変換ステップにて求められた周波数スペクトルのレベルをバンド単位で変更するバンドレベル変更ステップと、前記バンドレベル変更ステップでの処理後の量子化、符号化により求められる使用ビット数を所定のビット数範囲内に収めるまで、前記時間周波数変換ステップにて求められた周波数スペクトルのレベル変更を全帯域にわたり繰り返し行なう前記全帯域レベル変更ステップとを有する手順とし、量子化符号化部のイタレーションループ処理において、従来の2重ループ構成はやめ、アウターループに相当する第1のブロックとインナーループに相当する第2のブロックとに分離して処理することが出来るようにしたので、アウターループ×インナーループ回も行なわれていた量子化の回数を、インナーループの回数だけに削減することが出来、逆量子化については、アウターループの分の回数から1回だけに削減することが出来るので、イタレーションループ全体の収束度を速めることが出来る。
【0026】
よって、本発明は、リアルタイム処理に好適なオーディオ信号符号化方法を提供することが出来る。
【図面の簡単な説明】
【図1】本発明のオーディオ符号化方法の一実施例をフローチャートにより手順を示した図である。
【図2】本発明のオーディオ符号化方法が適用される装置の一実施例のブロック構成を示した図である。
【図3】従来のオーディオ符号化方法の一例のイタレーションループのフローを示した図である。
【符号の説明】
11 時間周波数変換部
12 聴覚モデル部
13 量子化符号化部
14 ビットストリーム化部
MNR マスキング対量子化雑音率 (Mask−to−Noise−Ratio)
global#gain 第2の周波数スペクトルレベル変更手段( STEP 14 )のレベ
ル
scalefactor (sfb) 第1の周波数スペクトルレベル変更手段( STEP 4 )のレ
ベル
Claims (1)
- 時間周波数変換ステップと聴覚モデルステップと量子化符号化ステップとビットストリーム化ステップとを有するオーディオ信号符号化方法において、
前記量子化符号化ステップは、
所定ビット数に収まるように全帯域レベル変更ステップの初期値を推測する初期値レベル推測ステップと、
前記聴覚モデルステップから算出されるSMR(Signal-to-Mask-Ratio)と前記初期レベル推測ステップの出力が供給され量子化、逆量子化によって算出されるSNR(Signal-to-Noise-Ratio)とより求めたMNR(Mask-to-Noise-Ratio)に応じて、前記時間周波数変換ステップにて求められた周波数スペクトルのレベルをバンド単位で変更するバンドレベル変更ステップと、
前記バンドレベル変更ステップでの処理後の量子化、符号化により求められる使用ビット数を所定のビット数範囲内に収めるまで、前記時間周波数変換ステップにて求められた周波数スペクトルのレベル変更を全帯域にわたり繰り返し行なう前記全帯域レベル変更ステップと、
を有することを特徴とするオーディオ信号符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36961199A JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36961199A JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001184091A JP2001184091A (ja) | 2001-07-06 |
JP3580485B2 true JP3580485B2 (ja) | 2004-10-20 |
Family
ID=18494880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36961199A Expired - Lifetime JP3580485B2 (ja) | 1999-12-27 | 1999-12-27 | オーディオ信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3580485B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006054583A1 (ja) | 2004-11-18 | 2006-05-26 | Canon Kabushiki Kaisha | オーディオ信号符号化装置および方法 |
-
1999
- 1999-12-27 JP JP36961199A patent/JP3580485B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2001184091A (ja) | 2001-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102184734B (zh) | 编码装置、解码装置、编码方法及解码方法 | |
JP4212591B2 (ja) | オーディオ符号化装置 | |
CN101556800B (zh) | 音频频谱编解码方法和装置、声音信号发送和接收装置 | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
JP4112027B2 (ja) | 再生成位相情報を用いた音声合成 | |
EP0673013B1 (en) | Signal encoding and decoding system | |
US8391212B2 (en) | System and method for frequency domain audio post-processing based on perceptual masking | |
US20040162720A1 (en) | Audio data encoding apparatus and method | |
DE60128479T2 (de) | Verfahren und vorrichtung zur bestimmung eines synthetischen höheren bandsignals in einem sprachkodierer | |
JP2003514266A (ja) | 広帯域オーディオ伝送システム | |
JP2005338637A (ja) | オーディオ信号符号化装置及び方法 | |
JP5172965B2 (ja) | 知覚モデルの適応的調整 | |
CN112992159B (zh) | 一种lc3音频编解码方法、装置、设备及存储介质 | |
WO2008064577A1 (fr) | Procédé et appareil permettant d'ajuster la qualité de la quantification dans un codeur et décodeur | |
CN105957533B (zh) | 语音压缩方法、语音解压方法及音频编码器、音频解码器 | |
JP3580485B2 (ja) | オーディオ信号符号化方法 | |
KR20130109793A (ko) | 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치 | |
JP3630082B2 (ja) | オーディオ信号符号化方法及びその装置 | |
JP4409733B2 (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP4116628B2 (ja) | オーディオ符号化方法およびオーディオ符号化装置 | |
JP3437421B2 (ja) | 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体 | |
JP2001154697A (ja) | オーディオ信号の符号化方法 | |
JP2002221997A (ja) | オーディオ信号符号化方法 | |
CN110534119B (zh) | 一种基于人耳听觉频率尺度信号分解的音频编解码方法 | |
JP2002182695A (ja) | 高能率符号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040715 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3580485 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080730 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090730 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100730 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110730 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120730 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130730 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |