JP3353868B2 - 音響信号変換符号化方法および復号化方法 - Google Patents
音響信号変換符号化方法および復号化方法Info
- Publication number
- JP3353868B2 JP3353868B2 JP26123695A JP26123695A JP3353868B2 JP 3353868 B2 JP3353868 B2 JP 3353868B2 JP 26123695 A JP26123695 A JP 26123695A JP 26123695 A JP26123695 A JP 26123695A JP 3353868 B2 JP3353868 B2 JP 3353868B2
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- decoding
- coefficients
- frequency domain
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
特に音楽信号や音声信号などの音響信号を、周波数領域
係数に変換し、その周波数領域係数をできるだけ少ない
情報量でディジタル符号化する符号化方法、およびその
符号化音響信号を復号化する復号化方法に関する。
する方法として、原音をフレームと呼ばれる5〜50m
s 程度の一定間隔の区間に分割し、その1フレームの信
号に時間−周波数変換(フーリエ変換)を行って得た周
波数領域係数(周波数軸上のそれぞれの点におけるサン
プル値)を、その周波数特性の包絡形状(スペクトラム
概形)と、周波数領域係数をスペクトラム概形で平坦化
して得られる残差係数との2つの情報に分離し、それぞ
れを符号化することが提案されている。このような符号
化法として、適応スペクトラム聴感制御エントロピー符
号化法(ASPEC :Adaptive Spectral Perceptual Entrop
y Coding)や、重み付きベクトル量子化による変換符号
化法(TCWVQ : Transform Coding with Weighted Vecto
r Quantization) 、エムペグーオーディオ・レイヤ3方
式(MPEG-Audio Layer lll) などがある。それぞれの技
術については、K.Brandenburg, J.Herre, J.D.Johnston
etal : "ASPEC : Adaptive spectral entropy coding
of high quality music signals", Proc. AES '91 およ
びT.Moriya, H.Suda :"An 8 Kbit/s transform coderfo
r noisychannels," Proc.ICASSP '89, pp196-199および
ISO/IEC 標準IS-11172-3に述べられている。
実現するためには、残差係数はできるだけ周波数特性が
平坦であることが望ましい。このため、上述のASPEC や
MPEG-Audio Layer lllでは、周波数領域係数をいくつか
の小帯域に分割し、小帯域内の信号を、帯域の強さを表
すスケーリングファクタと呼ばれる値で割ることによっ
て正規化する事によって周波数特性の平坦化をはかる。
すなわち、図3に示すように入力端子11から入力され
たディジタル化された音響入力信号は時間−周波数変換
部(変形離散コサイン変換:MDCT)2により周波数
領域係数に変換され、この周波数領域係数は帯域分割部
3により複数の小帯域に分割され、これら小帯域信号は
それぞれ代表値計算・量子化部41 〜4n でその平均値
または最大値などの帯域の強さを表す代表値(スケーリ
ングファクタ)が計算され、かつそのスケーリングファ
クタは量子化されて、全体として周波数領域係数の概形
が得られる。前記分割された各小帯域信号は正規化部5
1 〜5n でそれぞれ対応する帯域の前記量子化されたス
ケーリングファクタで正規化され帯域残差係数とされ、
これら正規化によって得られた帯域残差係数は量子化部
6で帯域合成されスペクトラム残差を得る。その結果、
時間−周波数変換部2により得られた前記周波数領域係
数はその周波数特性の概形が取り除かれ、平坦化された
残差係数となりその残差係数は量子化される。この残差
係数の量子化を示すインデックスIRと、前記各代表値
を量子化したインデックスとがそれぞれ復号器へ送出さ
れる。
平坦化方法として、線形予測分析を用いる方法がある。
周知のように、線形予測係数は入力信号の周波数特性を
平坦化するように動作する線形予測フィルタ(逆フィル
タと呼ばれている)のインパルス応答を表している。こ
の方法では、図4に示すように端子11に与えられたデ
ィジタル音響信号を線形予測分析・予測係数量子化部7
で線形予測し、得られた線形予測係数を線形予測分析フ
ィルタ、いわゆる逆フィルタ8にフィルタ係数として設
定し、この線形予測分析フィルタ8を端子11からの入
力信号で駆動することによって周波数特性の平坦化され
た残差信号を得る。この残差信号を時間−周波数変換部
(離散コサイン変換:DCT)2で周波数領域の信号、
すなわち残差係数に変換し、残差量子化部6で量子化
し、その量子化を表すインデックスIR と線形予測係数
を量子化したインデックスIP とを復号器へ送出する。
この方法は、TCWVQで用いられている。
た全サンプルのうち、聴覚的に重要性の高いサンプルは
一部であり、重要性の低いサンプルは再生しなくても音
質の劣化は小さい。そこで、聴覚的に重要性の高いサン
プルのみに符号化情報を与え、残りのサンプルは再生し
ないようにすれば高い量子化能率が得られる。しかし、
上述の従来の符号化方法では、サンプルごとの再生/非
再生の選択は行われていなかった。
号を少ない情報量で符号化するとき、周波数領域係数の
全サンプルのうち必要なものだけを選択して能率良く符
号化する方法およびその復号化方法を提供することにあ
る。
は、時間−周波数変換して得られた周波数領域係数の全
サンプルのうち、重要度の高い部分、係数(サンプル)
を符号化する。この重要度の高い部分係数とは聴覚的に
重要な係数(サンプル)であり、聴覚的に重要なものと
しては係数値(振幅)の大きい順に所定数、更に係数値
の大きさと、係数の分布状態とを考慮する。
を値の大きい順に並べ替え、その並べ替えた順序情報
(周波数係数番号(位置))を符号化し、かつ抽出され
た部分係数の値を符号化することである。この係数値の
符号化は値の大きい順に符号化してゆき、2番目以降と
その直前の符号化係数を復号し、その復号値で正規化し
たあと符号化する。
毎に周波数領域の部分係数を復号化して周波数領域係数
を得、この周波数領域係数をフレーム単位で時間領域信
号に変換する。周波数領域係数(サンプル)を得るに
は、入力されたサンプル値インデックスより複数の周波
数係数(サンプル)を復号化し、また入力されたサンプ
ル順序インデックスより並べ替え、その係数(サンプ
ル)の番号(位置)を復号化し、この復号化係数番号
に、復号化された複数の周波数領域係数を、その大きい
順に位置させて並べ替えて周波数領域係数を得る。サン
プル値インデックスの復号化は係数値の大きいものから
順に復号化してゆき、2番目以降の復号化は、直前の復
号化結果で現在の復号化結果を逆正規化して係数値(サ
ンプル)を得る。
引いてしまい、情報量を与えないので、情報量の割り当
てを容易にでき、不快なノイズを発生しにくい。また、
符号化する係数(サンプル)を大きい順に並べることに
より、適応的ビット割り当ての効果も得られる。
化方法の実施例を適用した符号器および復号器の構成例
を図1に示す。時間系列である入力信号は変換手段2で
時間−周波数変換が施されて周波数領域係数が生成され
る。この変換方法としては、離散コサイン変換(Discre
te Cosine Transformation,DCT) や変形離散コサイン変
換(Modified Discrete CosineTransformation,MDCT)を
用いることができる。この周波数領域係数はサンプル抽
出手段12で、フレームごとに、重要度の高いサンプル
から順に許されたサンプル数だけ抽出される。この抽出
の方法は、係数値(振幅)の大きいものから順でもよい
し、スペクトル概形を求め、これを0.5程度の係数でべ
き乗して多少強弱を強調し、この強弱を強調したスペク
トル概形で周波数領域係数を平坦化し、その係数値(振
幅)の大きいものから順に抽出してもよい。これは聴覚
的に重要なものは必ずしも係数値の大きい順でないこと
があり、このような平坦化により、小さい係数値が相対
的に大きくされ、平坦化しないで抽出した場合には抽出
されないものが抽出されることがある。なお、スペクト
ル概形で周波数領域係数を平坦化すると、平坦になり過
ぎるので、0.5程度でべき乗したものを用いる。更に係
数値(振幅)の大きい順に抽出する場合に限らず、例え
ば係数値の分布を考慮して抽出してもよい。すなわち通
常に低域にエネルギーが集中し、係数値の大きい順のみ
では低域成分のみしか抽出されない傾向にある。しか
し、周波数領域係数の分布が低域と高域とに離れて分布
している場合は、高域の係数値が可なり小さくても、耳
に聞こえることがある。従って、そのような場合は低域
側抽出数を制限して、高域側から残りの分を抽出する。
要は聴覚的に重要な部分のサンプルを抽出する。抽出す
る数は、例えば1000サンプル中60〜200程度と
する。この数は割り当てられた符号化ビット数により異
なる。このようにして抽出サンプルはサンプル並べ替え
手段13により係数値(振幅)の大きい順に並べ替えら
れる。
サンプル順序符号手段14により符号化される。この符
号化の方法は、各サンプル番号を2進数に変換したもの
を並べ替えられた順に送出してもよく、あるいはサンプ
ル番号列をハフマン符号化して送出しても良い。ハフマ
ン符号化する場合、ハフマン符号テーブルを複数用意
し、符号化ビット数が最小になるテーブルを選択するよ
うにしても良い。
は符号化手段15で符号化される。この符号化方法の一
例を図2Aに示す。この方法では、係数値(振幅)の大
きいサンプルから順に符号化してゆく。まず、第1サン
プルを量子化手段161 で量子化して第1インデックス
IR1を出力し、次にその第1インデックスIR1を復号化
手段171 で復号化し、この復号化値で第2サンプルを
正規化手段181 で正規化し、その正規化された値を量
子化手段162 で量子化し、第2インデックスIR2を出
力する。次にその第2インデックスIR2を復号化手段1
72 で復号化し、その復号化出力を逆正規化手段191
で符号化手段171 の復号化出力により逆正規化して第
2サンプルと対応した復号化出力を得、これにより第3
サンプルを正規化手段182 で正規化し、その正規化出
力を量子化手段163 で量子化して第3インデックスI
R3を出力する。第3インデックスIR3を復号化手段17
3で復号化し、その復号化出力を逆正規化手段192 で
逆正規化手段191 の出力により逆正規化し、その逆正
規化出力で第4サンプルを正規化した後量子化する。以
下同様の処理を全サンプルを量子化するまで繰り返す。
また、複数のサンプル値をまとめてベクトル量子化して
もよい。ベクトル量子化は、1フレーム分のサンプル値
を一括して行っても良い、1フレーム分のサンプル値列
をサブベクトルに分割して行っても良い。
ル順序インデックスIs とサンプル値符号化手段15よ
りのサンプル値インデックスIR とが符号器20より符
号化結果として出力される。復号器21においては入力
されたサンプル値インデックスIR をサンプル値復号化
手段22で復号化されてサンプル値が生成される。図2
Aに示した符号化と対応する復号化方法の一例を図2B
に示す。この方法では、大きいサンプルから順に復号化
してゆく。まず、第1インデックスIR1を復号化手段2
31 で復号化して第1サンプルを得る。次に、第2イン
デックスIR2を復号化手段232 で復号化し、その復号
化出力を復号化された第1サンプルで逆正規化手段24
1 により逆正規化を行い、第2サンプルを得る。この要
領で順次復号化してゆく。符号化側でベクトル量子化を
行った場合には、インデックスIR はベクトル量子化の
復号を行い、サンプル値列を再構成する。サブベクトル
に分割してからベクトル量子化をした場合には、復号ベ
クトルの各係数値(サンプル値)を分割時のルールに従
って順序を並べ直す。なお、図2Aに示した量子化法は
第1サンプルではより多くのビットを割り当てて量子化
を行い、以下第2,第3…サンプルにいくに従い、割り
当てるビット数を少なくする。
れたサンプル順序インデックスIsはサンプル順序復号
化手段25で復号化され、サンプル番号が生成される。
この復号化の方法は、符号化法と対して2進数化された
サンプル番号を復元し、あるいはハフマン符号化された
インデックスを復号化し、複数用意されたハフマン符号
テーブルの中から指定された符号テーブルに従ってイン
デックスを復号化する。テーブル指定の情報は符号器2
0から送られる。
サンプル値は、サンプル順序復号化手段25で得られた
サンプル番号(順序)に従って周波数領域係数再構築手
段26で並べ直され、符号器20のサンプル並べ替え手
段13での並べ替え前の周波数領域係数が再構築され
る。この再生された周波数領域係数は時間−周波数逆変
換手段27により、時間領域の信号に逆変換され、復号
化信号として出力される。この逆変換方法としては、符
号器20の周波数領域の変換法と対応して逆離散コサイ
ン変換(Inverse Discrete Cosine Transformation,IDC
T)や逆変形離散コサイン変換(Inverse Modified Discr
ete Cosine Transformation,IMDCT)が用いられる。
法によれば情報量の割り当てが能率的に実現可能であ
り、これと対応したこの発明の復号化方法によれば不快
なノイズを発生しにくい復号器を構成できる。また、こ
の発明の符号化方法では要求される品質に応じて抽出サ
ンプルを追加することによって階層符号化を容易に構成
できる。
をそれぞれ適用した符号器、復号器の各構成を示すブロ
ック図。
を示すブロック図、Bは図1中のサンプル値復号化手段
22の一例を示すブロック図である。
って平坦化する従来の変換符号器を示すブロック図。
坦化する従来の変換符号器を示すブロック図。
Claims (3)
- 【請求項1】 楽音や音声の音響信号を符号化する方法
であって、 入力音響信号をフレーム単位に、周波数領域に変換する
第1の段階と、 上記第1の段階で得られた周波数領域係数をフレーム単
位に、重要度の高い部分係数のみ符号化する第2の段階
とを備え、 上記第2段階は、抽出された部分係数値の大きい順に並
び替える第3の段階と、その並び替えた順序情報を符号
化する第4の段階と、上記抽出された部分係数の値を符
号化する第5の段階とからなり、 上記第5の段階は、係数値の大きな係数から順に符号化
してゆき、2番目以降を符号化する際、直前に符号化し
た係数を復号化し、この復号値で正規化してから符号化
を行う ことを特徴とした音響信号変換符号化方法。 - 【請求項2】 上記第2の段階における重要度の高い部
分サンプルは、聴覚的に重要な部分係数であることを特
徴とした請求項1記載の音響信号変換符号化方法。 - 【請求項3】楽音や音声の音響信号を復号化する方法で
あって、 フレーム単位に、周波数領域の部分係数を復号化して、
周波数領域係数を得る第1の段階と、 上記周波数領域係数をフレーム単位に時間領域の信号に
変換する第2の段階とを備え、 上記第1の段階は、入力されたサンプル値インデックス
より複数の周波数領域係数を復号化する第3の段階と、
入力されたサンプル順序インデックスより並び替え前の
係数番号を復号化する第4の段階と、上記復号化された
複数の周波数領域係数を、その大きい順に上記復号化さ
れた係数番号の位置に並べ替えて上記周波数領域係数を
得る第5の段階とからなり、 上記第4の段階は、係数値の大きいものから順に復号化
してゆき、2番目以降の復号化では、直前の復号化結果
で現在の復号化結果を逆正規化して、係数値を得る こと
を特徴とした音響信号復号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26123695A JP3353868B2 (ja) | 1995-10-09 | 1995-10-09 | 音響信号変換符号化方法および復号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26123695A JP3353868B2 (ja) | 1995-10-09 | 1995-10-09 | 音響信号変換符号化方法および復号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09106299A JPH09106299A (ja) | 1997-04-22 |
JP3353868B2 true JP3353868B2 (ja) | 2002-12-03 |
Family
ID=17359035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26123695A Expired - Lifetime JP3353868B2 (ja) | 1995-10-09 | 1995-10-09 | 音響信号変換符号化方法および復号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3353868B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2677597C2 (ru) * | 2013-10-09 | 2019-01-17 | Сони Корпорейшн | Способ и устройство кодирования, способ и устройство декодирования и программа |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002374171A (ja) * | 2001-06-15 | 2002-12-26 | Sony Corp | 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム |
JP3463752B2 (ja) | 2001-07-25 | 2003-11-05 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法 |
JP3469567B2 (ja) | 2001-09-03 | 2003-11-25 | 三菱電機株式会社 | 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法 |
JP5576021B2 (ja) * | 2004-11-29 | 2014-08-20 | ナショナル ユニヴァーシティー オブ シンガポール | 携帯用デバイスのための知覚意識型低電力オーディオ・デコーダ |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
DE102007017254B4 (de) * | 2006-11-16 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Kodieren und Dekodieren |
WO2012046685A1 (ja) * | 2010-10-05 | 2012-04-12 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
JP5694751B2 (ja) * | 2010-12-13 | 2015-04-01 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体 |
US9536534B2 (en) | 2011-04-20 | 2017-01-03 | Panasonic Intellectual Property Corporation Of America | Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof |
KR101821532B1 (ko) | 2012-07-12 | 2018-03-08 | 노키아 테크놀로지스 오와이 | 벡터 양자화 |
JP6400590B2 (ja) * | 2013-10-04 | 2018-10-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 |
JP6475273B2 (ja) * | 2017-02-16 | 2019-02-27 | ノキア テクノロジーズ オーユー | ベクトル量子化 |
-
1995
- 1995-10-09 JP JP26123695A patent/JP3353868B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2677597C2 (ru) * | 2013-10-09 | 2019-01-17 | Сони Корпорейшн | Способ и устройство кодирования, способ и устройство декодирования и программа |
Also Published As
Publication number | Publication date |
---|---|
JPH09106299A (ja) | 1997-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3336617B2 (ja) | 信号符号化又は復号化装置,及び信号符号化又は復号化方法,並びに記録媒体 | |
US6675148B2 (en) | Lossless audio coder | |
KR100348368B1 (ko) | 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체 | |
EP2267698B1 (en) | Entropy coding by adapting coding between level and run-length/level modes. | |
EP2479750B1 (en) | Method for hierarchically filtering an input audio signal and method for hierarchically reconstructing time samples of an input audio signal | |
KR101237413B1 (ko) | 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치 | |
KR100368854B1 (ko) | 디지털신호의부호화장치,그의복호화장치및기록매체 | |
JP3203657B2 (ja) | 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体 | |
EP0884850A2 (en) | Scalable audio coding/decoding method and apparatus | |
KR100908117B1 (ko) | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 | |
USRE46082E1 (en) | Method and apparatus for low bit rate encoding and decoding | |
US6011824A (en) | Signal-reproduction method and apparatus | |
JP2006011456A (ja) | 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体 | |
JP2012198555A (ja) | オーディオ信号の重要周波数成分の抽出方法及びその装置、及びこれを利用した低ビット率オーディオ信号の符号化及び/または復号化方法及びその装置 | |
JP3353868B2 (ja) | 音響信号変換符号化方法および復号化方法 | |
KR100968057B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
CA2490064A1 (en) | Audio coding method and apparatus using harmonic extraction | |
JP4657570B2 (ja) | 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体 | |
JPH0846518A (ja) | 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体 | |
EP1249837A2 (en) | A method for decompressing a compressed audio signal | |
US20040083094A1 (en) | Wavelet-based compression and decompression of audio sample sets | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP3475985B2 (ja) | 情報符号化装置および方法、情報復号化装置および方法 | |
WO1999044291A1 (fr) | Dispositif et procede de codage, dispositif et procede de decodage, support d'enregistrement de programme et de donnees | |
JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070927 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080927 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080927 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090927 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090927 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100927 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100927 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110927 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120927 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130927 Year of fee payment: 11 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |