JP2001154697A - オーディオ信号の符号化方法 - Google Patents
オーディオ信号の符号化方法Info
- Publication number
- JP2001154697A JP2001154697A JP33635099A JP33635099A JP2001154697A JP 2001154697 A JP2001154697 A JP 2001154697A JP 33635099 A JP33635099 A JP 33635099A JP 33635099 A JP33635099 A JP 33635099A JP 2001154697 A JP2001154697 A JP 2001154697A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- frequency division
- ratio
- division band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【課題】 MPEG2 Audio符号化において、リ
アルタイムエンコーダを容易に実現するためには、信号
対マスク比の算出処理が比較的簡素な心理聴覚モデル部
が要求される。 【解決手段】 入力されたデジタルオーディオ信号をM
DCT変換し、MDCT変換されたオーディオ信号を予
め定めた周波数分割帯域毎に符号化する際に、各周波数
分割帯域内のオーディオ信号に割り当てる量子化ビット
数を、入力されたデジタルオーディオ信号をFFT変換
し、FFT変換されたオーディオ信号を用いて各周波数
分割帯域毎に算出した信号レベルとマスキングレベルの
比である信号対マスク比を基に決定する。これにより、
信号対マスク比の演算が比較的簡単になる。
アルタイムエンコーダを容易に実現するためには、信号
対マスク比の算出処理が比較的簡素な心理聴覚モデル部
が要求される。 【解決手段】 入力されたデジタルオーディオ信号をM
DCT変換し、MDCT変換されたオーディオ信号を予
め定めた周波数分割帯域毎に符号化する際に、各周波数
分割帯域内のオーディオ信号に割り当てる量子化ビット
数を、入力されたデジタルオーディオ信号をFFT変換
し、FFT変換されたオーディオ信号を用いて各周波数
分割帯域毎に算出した信号レベルとマスキングレベルの
比である信号対マスク比を基に決定する。これにより、
信号対マスク比の演算が比較的簡単になる。
Description
【0001】
【発明の属する技術分野】本発明は、デジタルオーディ
オ信号の符号化方法に関するものである。
オ信号の符号化方法に関するものである。
【0002】
【従来の技術】近年、デジタルオーディオ信号の符号化
方法の研究開発が活発になり、特に高品質で低ビットレ
ートの符号化方法として、MPEG1オーディオ符号化(IS
O/IEC11172-3)およびMPEG2オーディオ符号化(ISO/IE
C 13818-7)が国際標準として規格化されている。図2
はMPEG2オーディオ符号化装置の構成を示すものであ
る。図2において、入力されたデジタルオーディオ信号
は、心理聴覚モデル部201とゲインコントロール部2
02に入力される。ゲインコントロール部202に入力
されたオーディオ信号は、順次、フィルタバンク部20
3、TNS(Temporal Noise Shaping)部204、イ
ンテンシティ/結合部205、予測部206、M/S
(Mid/Side)部207、スケールファクタ部208、
量子化部209およびノイズレス符号化部210の各ブ
ロックで処理を施され、ビットストリーム合成部211
へ送られて、ビットストリーム部211で符号化オーデ
ィオビットストリームとして出力される。また、量子化
部209は、心理聴覚モデル部201の出力と許容され
るビットレートをもとに、レート/歪み制御処理部21
2が定める量子化ビット数に従って、オーディオ信号を
量子化する。
方法の研究開発が活発になり、特に高品質で低ビットレ
ートの符号化方法として、MPEG1オーディオ符号化(IS
O/IEC11172-3)およびMPEG2オーディオ符号化(ISO/IE
C 13818-7)が国際標準として規格化されている。図2
はMPEG2オーディオ符号化装置の構成を示すものであ
る。図2において、入力されたデジタルオーディオ信号
は、心理聴覚モデル部201とゲインコントロール部2
02に入力される。ゲインコントロール部202に入力
されたオーディオ信号は、順次、フィルタバンク部20
3、TNS(Temporal Noise Shaping)部204、イ
ンテンシティ/結合部205、予測部206、M/S
(Mid/Side)部207、スケールファクタ部208、
量子化部209およびノイズレス符号化部210の各ブ
ロックで処理を施され、ビットストリーム合成部211
へ送られて、ビットストリーム部211で符号化オーデ
ィオビットストリームとして出力される。また、量子化
部209は、心理聴覚モデル部201の出力と許容され
るビットレートをもとに、レート/歪み制御処理部21
2が定める量子化ビット数に従って、オーディオ信号を
量子化する。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の方法では、心理聴覚モデル部201において信号対
マスク比を算出し、この値に基づいてレート/歪み制御
処理部212において量子化ビット数が定められるが、
信号対マスク比を算出する過程が非常に複雑であり、リ
アルタイムエンコーダを実現するのは容易ではないとい
う問題があった。
来の方法では、心理聴覚モデル部201において信号対
マスク比を算出し、この値に基づいてレート/歪み制御
処理部212において量子化ビット数が定められるが、
信号対マスク比を算出する過程が非常に複雑であり、リ
アルタイムエンコーダを実現するのは容易ではないとい
う問題があった。
【0004】本発明は上記従来の問題を解決するもので
あり、信号対マスク比を算出することが比較的簡単で、
リアルタイムエンコーダに適したオーディオ信号の符号
化方法を提供するものである。
あり、信号対マスク比を算出することが比較的簡単で、
リアルタイムエンコーダに適したオーディオ信号の符号
化方法を提供するものである。
【0005】
【課題を解決するための手段】本発明のオーディオ信号
の符号化方法は、入力されたデジタルオーディオ信号を
MDCT変換(Modified Discrete Cosine Transform:
変形離散コサイン変換)し、前記MDCT変換されたオ
ーディオ信号を予め定めた周波数分割帯域毎に符号化す
る際に、前記各周波数分割帯域内のオーディオ信号に割
り当てる量子化ビット数を、前記入力されたデジタルオ
ーディオ信号をFFT変換(Fast Fourier Transform:
高速フーリエ変換)し、前記FFT変換されたオーディ
オ信号を用いて前記各周波数分割帯域毎に算出した信号
レベルとマスキングレベルの比である信号対マスク比を
基に決定することを特徴とするものであり、信号対マス
ク比の演算が比較的簡単になり、リアルタイムエンコー
ダを容易に実現できることとなる。
の符号化方法は、入力されたデジタルオーディオ信号を
MDCT変換(Modified Discrete Cosine Transform:
変形離散コサイン変換)し、前記MDCT変換されたオ
ーディオ信号を予め定めた周波数分割帯域毎に符号化す
る際に、前記各周波数分割帯域内のオーディオ信号に割
り当てる量子化ビット数を、前記入力されたデジタルオ
ーディオ信号をFFT変換(Fast Fourier Transform:
高速フーリエ変換)し、前記FFT変換されたオーディ
オ信号を用いて前記各周波数分割帯域毎に算出した信号
レベルとマスキングレベルの比である信号対マスク比を
基に決定することを特徴とするものであり、信号対マス
ク比の演算が比較的簡単になり、リアルタイムエンコー
ダを容易に実現できることとなる。
【0006】また、本発明のオーディオ信号の符号化方
法は、それぞれ信号対マスク比を、各周波数分割帯域内
のスペクトラムエネルギーの和とマスキングエネルギー
の和の比、または各周波数分割帯域内のスペクトラムエ
ネルギーの平均値と当該周波数分割帯域内のマスキング
エネルギーの最小値との比、または各周波数分割帯域内
のスペクトラムエネルギーの最大値と当該周波数分割帯
域内のマスキングエネルギーの最小値との比とすること
を特徴とするものであり、これらの何れかを選択するか
によって、音質のよいオーディオ信号の符号化が実現で
きることとなる。
法は、それぞれ信号対マスク比を、各周波数分割帯域内
のスペクトラムエネルギーの和とマスキングエネルギー
の和の比、または各周波数分割帯域内のスペクトラムエ
ネルギーの平均値と当該周波数分割帯域内のマスキング
エネルギーの最小値との比、または各周波数分割帯域内
のスペクトラムエネルギーの最大値と当該周波数分割帯
域内のマスキングエネルギーの最小値との比とすること
を特徴とするものであり、これらの何れかを選択するか
によって、音質のよいオーディオ信号の符号化が実現で
きることとなる。
【0007】
【発明の実施の形態】以下、本発明の実施の形態におけ
るオーディオ信号の符号化方法について図面を用いて説
明する。図1は本実施の形態における心理聴覚モデル部
の信号対マスク比の算出手順を示すフロー図である。ま
ず、ステップ101で、予め定めた入力オーディオサン
プル毎にFFT変換を行い、時間から周波数への変換の
計算を行う。次に、ステップ102で、やはり予め定め
た各周波数分割帯域に対する音圧レベルを決定する。こ
の音圧レベルが、信号対マスク比の信号レベルとなる。
次に、ステップ103で、最小可聴値を決定する。最小
可聴値は、量子化のビットレートによって偏位させる。
ビットレートが高いときは、最小可聴値はより小さくす
る。次に、ステップ104で、FFT変換されたオーデ
ィオ信号から純音成分(トーナル成分)および非純音成
分(ノントーナル成分)を検出する。純音成分や非純音
成分がマスカーとなる。次に、ステップ105で、これ
らのマスカーのうち、意味のあるマスカーだけを得るた
めのマスカーの間引きを行う。次に、ステップ106
で、これらの個々のマスカーによって生じるマスキング
しきい値を計算する。マスキングしきい値は、それぞれ
周波数全体に対して求める。次に、ステップ107で、
個々のマスカーによって生じるマスキングしきい値を重
畳させることによって、全体マスキングしきい値を計算
する。次に、ステップ108で、予め定めた各周波数分
割帯域(音圧レベルを決定した際と同じ分割帯域)毎に
マスキングしきい値を決定する。そして、ステップ10
9で、各周波数分割帯域毎に信号対マスク比を計算す
る。
るオーディオ信号の符号化方法について図面を用いて説
明する。図1は本実施の形態における心理聴覚モデル部
の信号対マスク比の算出手順を示すフロー図である。ま
ず、ステップ101で、予め定めた入力オーディオサン
プル毎にFFT変換を行い、時間から周波数への変換の
計算を行う。次に、ステップ102で、やはり予め定め
た各周波数分割帯域に対する音圧レベルを決定する。こ
の音圧レベルが、信号対マスク比の信号レベルとなる。
次に、ステップ103で、最小可聴値を決定する。最小
可聴値は、量子化のビットレートによって偏位させる。
ビットレートが高いときは、最小可聴値はより小さくす
る。次に、ステップ104で、FFT変換されたオーデ
ィオ信号から純音成分(トーナル成分)および非純音成
分(ノントーナル成分)を検出する。純音成分や非純音
成分がマスカーとなる。次に、ステップ105で、これ
らのマスカーのうち、意味のあるマスカーだけを得るた
めのマスカーの間引きを行う。次に、ステップ106
で、これらの個々のマスカーによって生じるマスキング
しきい値を計算する。マスキングしきい値は、それぞれ
周波数全体に対して求める。次に、ステップ107で、
個々のマスカーによって生じるマスキングしきい値を重
畳させることによって、全体マスキングしきい値を計算
する。次に、ステップ108で、予め定めた各周波数分
割帯域(音圧レベルを決定した際と同じ分割帯域)毎に
マスキングしきい値を決定する。そして、ステップ10
9で、各周波数分割帯域毎に信号対マスク比を計算す
る。
【0008】信号対マスク比は、例えば次式のように、
各周波数分割帯域毎にスペクトラムエネルギーの和と、
マスキングエネルギーの和の比として求めることができ
る。
各周波数分割帯域毎にスペクトラムエネルギーの和と、
マスキングエネルギーの和の比として求めることができ
る。
【数1】
【0009】また、信号対マスク比は、次式のように、
各周波数分割帯域毎にスペクトラムエネルギーの平均値
と、当該周波数分割帯域内のマスキングエネルギーの最
小値との比として求めることができる。
各周波数分割帯域毎にスペクトラムエネルギーの平均値
と、当該周波数分割帯域内のマスキングエネルギーの最
小値との比として求めることができる。
【数2】
【0010】また、信号対マスク比は、次式のように、
各周波数分割帯域毎にスペクトラムエネルギーの最大値
と、当該周波数分割帯域内のマスキングエネルギーの最
小値との比として求めることができる。
各周波数分割帯域毎にスペクトラムエネルギーの最大値
と、当該周波数分割帯域内のマスキングエネルギーの最
小値との比として求めることができる。
【数3】
【0011】
【発明の効果】以上のように本発明によれば、入力され
たデジタルオーディオ信号をMDCT変換し、前記MD
CT変換されたオーディオ信号を予め定めた周波数分割
帯域毎に符号化する際に、前記各周波数分割帯域内のオ
ーディオ信号に割り当てる量子化ビット数を、前記入力
されたデジタルオーディオ信号をFFT変換し、前記F
FT変換されたオーディオ信号を用いて前記各周波数分
割帯域毎に算出した信号レベルとマスキングレベルの比
である信号対マスク比を基に決定するようにしたので、
信号対マスク比の演算が比較的簡単になり、リアルタイ
ムエンコーダを容易に実現できるという効果を有する。
たデジタルオーディオ信号をMDCT変換し、前記MD
CT変換されたオーディオ信号を予め定めた周波数分割
帯域毎に符号化する際に、前記各周波数分割帯域内のオ
ーディオ信号に割り当てる量子化ビット数を、前記入力
されたデジタルオーディオ信号をFFT変換し、前記F
FT変換されたオーディオ信号を用いて前記各周波数分
割帯域毎に算出した信号レベルとマスキングレベルの比
である信号対マスク比を基に決定するようにしたので、
信号対マスク比の演算が比較的簡単になり、リアルタイ
ムエンコーダを容易に実現できるという効果を有する。
【0012】また、本発明によれば、それぞれ信号対マ
スク比を、各周波数分割帯域内のスペクトラムエネルギ
ーの和とマスキングエネルギーの和の比、または各周波
数分割帯域内のスペクトラムエネルギーの平均値と当該
周波数分割帯域内のマスキングエネルギーの最小値との
比、または各周波数分割帯域内のスペクトラムエネルギ
ーの最大値と当該周波数分割帯域内のマスキングエネル
ギーの最小値との比としたので、これらの何れかを選択
するかによって、音質のよいオーディオ信号の符号化が
実現できるという効果を有する。
スク比を、各周波数分割帯域内のスペクトラムエネルギ
ーの和とマスキングエネルギーの和の比、または各周波
数分割帯域内のスペクトラムエネルギーの平均値と当該
周波数分割帯域内のマスキングエネルギーの最小値との
比、または各周波数分割帯域内のスペクトラムエネルギ
ーの最大値と当該周波数分割帯域内のマスキングエネル
ギーの最小値との比としたので、これらの何れかを選択
するかによって、音質のよいオーディオ信号の符号化が
実現できるという効果を有する。
【図1】本発明の実施の形態におけるオーディオ信号符
号化方法を示す心理聴覚モデル部における信号対マスク
比の算出手順のフロー図
号化方法を示す心理聴覚モデル部における信号対マスク
比の算出手順のフロー図
【図2】本発明が実施されるMPEG2オーディオ符号
化装置のブロック図
化装置のブロック図
201 心理聴覚モデル部 202 ゲインコントロール部 203 フィルタバンク部 204 TNS部 205 インテンシティ/結合部 206 予測部 207 M/S部 208 スケールファクタ部 209 量子化部 210 ノイズレス符号化部 211 ビットストリーム合成部 212 レート/歪み制御処理部
Claims (4)
- 【請求項1】 入力されたデジタルオーディオ信号をM
DCT変換し、前記MDCT変換されたオーディオ信号
を予め定めた周波数分割帯域毎に符号化する際に、前記
各周波数分割帯域内のオーディオ信号に割り当てる量子
化ビット数を、前記入力されたデジタルオーディオ信号
をFFT変換し、前記FFT変換されたオーディオ信号
を用いて前記各周波数分割帯域毎に算出した信号レベル
とマスキングレベルの比である信号対マスク比を基に決
定することを特徴とするオーディオ信号の符号化方法。 - 【請求項2】 信号対マスク比は、各周波数分割帯域内
のスペクトラムエネルギーの和と、マスキングエネルギ
ーの和の比とすることを特徴とする請求項1記載のオー
ディオ信号の符号化方法。 - 【請求項3】 信号対マスク比は、各周波数分割帯域内
のスペクトラムエネルギーの平均値と、当該周波数分割
帯域内のマスキングエネルギーの最小値との比とするこ
とを特徴とする請求項1記載のオーディオ信号の符号化
方法。 - 【請求項4】 信号対マスク比は、各周波数分割帯域内
のスペクトラムエネルギーの最大値と、当該周波数分割
帯域内のマスキングエネルギーの最小値との比とするこ
とを特徴とする請求項1記載のオーディオ信号の符号化
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33635099A JP2001154697A (ja) | 1999-11-26 | 1999-11-26 | オーディオ信号の符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33635099A JP2001154697A (ja) | 1999-11-26 | 1999-11-26 | オーディオ信号の符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001154697A true JP2001154697A (ja) | 2001-06-08 |
Family
ID=18298226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33635099A Pending JP2001154697A (ja) | 1999-11-26 | 1999-11-26 | オーディオ信号の符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001154697A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006030752A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | 音響処理装置 |
JP2006107687A (ja) * | 2004-10-08 | 2006-04-20 | Sony Corp | 信号再生装置及び方法 |
-
1999
- 1999-11-26 JP JP33635099A patent/JP2001154697A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006030752A1 (ja) * | 2004-09-17 | 2006-03-23 | Matsushita Electric Industrial Co., Ltd. | 音響処理装置 |
JP2006107687A (ja) * | 2004-10-08 | 2006-04-20 | Sony Corp | 信号再生装置及び方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2500043C2 (ru) | Кодер, декодер, способ кодирования и способ декодирования | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
US7613603B2 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
US6766293B1 (en) | Method for signalling a noise substitution during audio signal coding | |
US6725192B1 (en) | Audio coding and quantization method | |
US20040162720A1 (en) | Audio data encoding apparatus and method | |
JP2001053617A (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
JP2000101436A (ja) | オーディオ信号の符号化及び復号方法及び装置 | |
US20080164942A1 (en) | Audio data processing apparatus, terminal, and method of audio data processing | |
EP1259956B1 (en) | Method of and apparatus for converting an audio signal between data compression formats | |
KR100477701B1 (ko) | Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치 | |
JPH09106299A (ja) | 音響信号変換符号化方法および復号化方法 | |
JP2001154697A (ja) | オーディオ信号の符号化方法 | |
JPH09101799A (ja) | 信号符号化方法及び装置 | |
JP3863706B2 (ja) | 音声符号化方法 | |
JPH10149197A (ja) | 符号化装置および方法 | |
JP3580485B2 (ja) | オーディオ信号符号化方法 | |
JP3593201B2 (ja) | オーディオ復号装置 | |
JPH1093441A (ja) | ディジタル化されたオーディオ信号の符号化方法及び装置 | |
JP2001148632A (ja) | 符号化装置、符号化方法、及びその記録媒体 | |
JP2001094432A (ja) | サブバンド符号化・復号方法 | |
KR970006827B1 (ko) | 오디오신호 부호화장치 | |
KR0140681B1 (ko) | 디지탈 오디오 데이타 부호화장치 | |
KR970006825B1 (ko) | 오디오신호 부호화장치 | |
JP2005010337A (ja) | 音声信号圧縮方法及び音声信号圧縮装置 |