JP2003345398A - オーディオ信号符号化方法 - Google Patents
オーディオ信号符号化方法Info
- Publication number
- JP2003345398A JP2003345398A JP2002151923A JP2002151923A JP2003345398A JP 2003345398 A JP2003345398 A JP 2003345398A JP 2002151923 A JP2002151923 A JP 2002151923A JP 2002151923 A JP2002151923 A JP 2002151923A JP 2003345398 A JP2003345398 A JP 2003345398A
- Authority
- JP
- Japan
- Prior art keywords
- group
- variation index
- spectrum
- maximum
- spectrum variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
クトルデータをグループ化して高能率符号化する時に、
グループ化が適切に行われていないことにより、音質が
劣化することがあるという課題があった。 【解決手段】 グループに属する時間ブロック間のスペ
クトルデータの変動の最大あるいは平均を表すグループ
スペクトル変動指標をグループ毎に算出するステップ
(103)と、前記グループスペクトル変動指標の最大
値を算出するステップ(104)と、前記最大値が第1
の閾値より大きい場合に前記グループスペクトル変動指
標を最大とするグループを分割するステップ(106)
とを備える。
Description
時間ブロック単位でスペクトルデータに変換し、複数の
時間ブロックのスペクトルデータをグループ化して高能
率符号化するオーディオ信号符号化方法に関する。
位でスペクトルデータに変換し、複数の時間ブロックの
スペクトルデータをグループ化して高能率符号化するこ
とにより、符号化効率を改善する手法が提案されてい
る。
AAC(Advanced Audio Coding)の規格書(ISO/IEC 1
3818-7, Information technology - Generic coding of
moving pictures and associated audio information
- Part 7: Advanced AudioCoding (AAC))や日本国特許
番号第2739377号に記載されたものが知られてい
る。
体的なグループ化の決定方法については、記載されてお
らず、このため、例えば、あらかじめ設定した固定のグ
ループ化方法で対応せざるを得なかった。
ACと略す)のローコンプレキシティプロファイル(Lo
w Complexity Profile)を例にとって、複数の時間ブロ
ックのスペクトルデータをグループ化して高能率符号化
する従来例について説明する。
す。図7において、700と701はフィルタバンク、
710と711はブロック長決定部、720はジョイン
トステレオデータ生成部、730は短時間ブロックグル
ープ化決定部、740は量子化及び符号化部である。以
上のように構成されたAACエンコーダについて、その
動作を以下に述べる。
軸のオーディオ信号は、フィルタバンク700において
ブロック長決定部710で決定された長さのブロックに
分割され、MDCT(Modified Discrete Cosine Trans
form,変形離散コサイン変換)によりスペクトルデータ
(MDCT係数)に変換される。この変換は変換ブロッ
クを50%ずつオーバーラップして実行し、例えば20
48サンプルを1024本のMDCT係数に変換する。
同様に、入力された右チャンネル(Rch)の時間軸の
オーディオ信号は、フィルタバンク701においてブロ
ック長決定部711で決定された長さのブロックに分割
され、MDCTによりスペクトルデータに変換される。
DCTのブロック長を決定し、出力する。ブロック長決
定部710と711で、それぞれのチャンネルの信号の
変化に応じてMDCTのブロック長を変化させることに
より、プリエコーと呼ばれる疑似信号の発生による音質
の劣化を防止する。すなわち、定常的な信号の場合に
は、MDCTのブロック長を2048サンプルの長時間
ブロックとし、1024本のスペクトルデータに変換す
る。一方、過渡的な信号の場合には256サンプルの短
時間ブロックとし、128本のスペクトルデータに変換
する。短時間ブロックでは、8個連続で短いブロック長
を用いて変換することにより、出力のスペクトルデータ
の本数を8×128=1024本として、長時間ブロッ
クと一致させる。この1024本のスペクトルデータか
ら成る符号化の単位をフレームと呼ぶ。
例を示す。同図で、第0フレーム(F0)、第2フレー
ム(F2)、第3フレーム(F3)は、長時間ブロック
のフレームであり、これに対して第1フレーム(F1)
は連続した8個の短時間ブロックから成る短時間ブロッ
クのフレームである。
0では、左右のチャンネルの相関を利用して符号化効率
を向上させるため、左右のチャンネルのスペクトルデー
タを入力として、ジョイントステレオ(ミッド/サイド
ステレオあるいはインテンシティステレオ)符号化に必
要なジョイントステレオスペクトルデータを生成する。
ここで、ジョイントステレオスペクトルデータとは、ミ
ッド/サイド(和差)ステレオ符号化に必要な左チャン
ネルと右チャンネルのスペクトルデータの和と差、ある
いはインテンシティステレオ符号化に必要な左チャンネ
ルと右チャンネルのスペクトルデータの和(左右のチャ
ンネルの位相が逆相の場合には差)である。なお、イン
テンシティステレオ符号化の場合、もう一方のチャンネ
ルのスペクトルデータはゼロに設定される。
0では、短時間ブロックの符号化効率を向上するため、
短時間ブロックのグループ化を行う。短時間ブロックの
グループ化では、複数の連続する短時間ブロックをブロ
ック単位でまとめ、スケールファクタバンドと呼ばれる
複数のスペクトルデータから構成されるバンド単位で共
通のステップサイズを用いて量子化することにより、量
子化ステップサイズを表すスケールファクタ等のサイド
情報を削減し、符号化効率を改善する。AACの規格で
は、1フレーム当り、最小1個から最大8個のグループ
にグループ化することが可能である。ここでは、図9に
示すように、8個の短時間ブロックを2個ずつ1グルー
プとして、合計4個のグループ(G0,G1,G2,G
3)にグループ化する。なお、ジョイントステレオスペ
クトルデータの場合には、2つのチャンネルのスペクト
ルデータが対になっているので、グループ化に際して
も、図10に示すように、2つのチャンネルのグループ
化を共通に設定する必要がある。
ャンネルのスペクトルデータ、あるいはジョイントステ
レオデータ生成部720からのジョイントスペクトルデ
ータをスケールファクタバンド毎にまとめ、聴覚モデル
に基づいてスペクトルデータのマスキングレベル、すな
わち許容量子化ノイズレベルを算出し、算出された許容
量子化ノイズレベルに基づいてスケールファクタバンド
毎にスペクトルデータの量子化を行い、ハフマン符号化
等の符号化処理を行い、高能率符号化データを出力す
る。
来の複数の時間ブロックのスペクトルデータのグループ
化では、スペクトルデータに依存しない固定的なグルー
プ化であるため、符号化効率が劣化し、音質が劣化する
ことがあるという課題があった。すなわち、スペクトル
データの時間変化が緩やかなところでは、本来は、より
多くの時間ブロックを1グループとしてスケールファク
タ等のサイド情報を削減し、符号化効率を改善すべきで
あるのにこれができず、また、スペクトルデータの時間
変化が急激なところが、同一のグループにされると、同
一の量子化ステップサイズを用いるため、小さなレベル
の時間ブロックのスペクトルデータを十分表現すること
ができず、このため音質が劣化するという課題があっ
た。
間ブロック間のスペクトルデータの変動に基づく最適な
グループ化により、スペクトルデータとスケールファク
タ等のサイド情報に割り当てるビット数を最適化し、音
質の向上したオーディオ信号高能率符号化方法を提供す
ることを目的とする。
通に設定する必要のあるジョイントステレオスペクトル
データに対しても最適なグループ化を行い、スペクトル
データとスケールファクタ等のサイド情報に割り当てる
ビット数を最適化し、音質の向上したオーディオ信号高
能率符号化方法を提供することを目的とする。
複数の時間ブロックにわたって量子化されないことによ
る音質劣化を抑えたグループ化を行うオーディオ信号の
高能率符号化方法を提供することを目的とする。
対して、音質を大幅に劣化させることがないグループ化
を行うオーディオ信号の高能率符号化方法を提供するこ
とを目的とする。
切なグループ化を行い、従来よりも音質の向上したオー
ディオ信号符号化方法を提供することを目的とする。
に、本発明のオーディオ信号符号化方法は、オーディオ
信号を時間ブロック単位でスペクトルデータに変換し、
複数の時間ブロックのスペクトルデータをグループ化し
て高能率符号化する方法であって、グループに属する時
間ブロック間のスペクトルデータの変動の最大あるいは
平均を表すグループスペクトル変動指標をグループ毎に
算出するステップと、前記グループスペクトル変動指標
の最大値を算出するステップと、前記最大値が第1の閾
値より大きい場合に前記グループスペクトル変動指標を
最大とするグループを分割するステップとを備えたもの
である。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、グル
ープに属する時間ブロック間のスペクトルデータの変動
の最大あるいは平均を表すグループスペクトル変動指標
をグループ毎に算出するステップと、前記グループスペ
クトル変動指標の最大値を算出するステップと、前記最
大値が第1の閾値より大きいかあるいはグループ数が第
2の閾値より小さい場合に、前記グループスペクトル変
動指標を最大とするグループを分割するステップとを備
えたものである。
は、上記本発明のオーディオ信号符号化方法において、
グループを分割するステップが、グループを分割した時
の分割されたグループのグループスペクトル変動指標の
最大あるいは平均を表す分割グループスペクトル変動指
標を算出するステップと、すべての分割の中で前記分割
グループスペクトル変動指標を最小とする分割を実行す
るステップとを備えたものである。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、グ
ループに属する時間ブロック間のスペクトルデータの変
動の最大あるいは平均を表すグループスペクトル変動指
標を複数のチャンネルについてそれぞれグループ毎に算
出するステップと、前記複数のチャンネルのグループス
ペクトル変動指標の最大あるいは平均を複数チャンネル
グループスペクトル変動指標として算出するステップ
と、前記複数チャンネルグループスペクトル変動指標の
最大値を算出するステップと、前記最大値が第1の閾値
より大きい場合に前記複数チャンネルグループスペクト
ル変動指標を最大とするグループを分割するステップと
を備えたものである。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、グ
ループに属する時間ブロック間のスペクトルデータの変
動の最大あるいは平均を表すグループスペクトル変動指
標を複数のチャンネルについてそれぞれグループ毎に算
出するステップと、前記複数のチャンネルのグループス
ペクトル変動指標の最大あるいは平均を複数チャンネル
グループスペクトル変動指標として算出するステップ
と、前記複数チャンネルグループスペクトル変動指標の
最大値を算出するステップと、前記最大値が第1の閾値
より大きいかあるいはグループ数が第2の閾値より小さ
い場合に、前記複数チャンネルグループスペクトル変動
指標を最大とするグループを分割するステップとを備え
たものである。
は、上記本発明のオーディオ信号符号化方法において、
グループを分割するステップが、グループを分割した時
の分割されたグループのグループスペクトル変動指標の
最大あるいは平均を表す分割グループスペクトル変動指
標を複数のチャンネルについてそれぞれ算出するステッ
プと、前記複数のチャンネルの分割グループスペクトル
変動指標の最大あるいは平均を複数チャンネル分割グル
ープスペクトル変動指標として算出するステップと、す
べての分割の中で前記複数チャンネル分割グループスペ
クトル変動指標を最小とする分割を実行するステップと
を備えたものである。
は、上記本発明のオーディオ信号符号化方法において、
グループ数が第3の閾値以上となった場合にグループの
分割を終了するステップを備えたものである。
は、上記本発明のオーディオ信号符号化方法において、
符号化のビットレートに応じて前記第1から第3の閾値
のいずれかを設定するステップを備えたものである。
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムとしたもので
ある。
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体としたものである。
て、図面を用いて説明する。
徴である複数の時間ブロックのスペクトルデータのグル
ープ化の方法について、AACエンコーダに適用した場
合を例として説明する。即ち、オーディオ信号符号化装
置(AACエンコーダ)の構成としては、図7に示した
通りである。
形態1のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
特徴部分としてのグループ化の方法について説明する。
ロックに設定し、1フレームのグループ数を最小の1に
設定する。本実施の形態では、当初の1グループから適
宜グループを分割することにより、グループ化を決定す
る。
う。第1の閾値は、グループを分割するときの分割する
グループに属する時間ブロックのスペクトルデータの変
動を表すグループスペクトル変動指標に対する閾値であ
る。
に属するすべての時間ブロック間のスペクトルデータの
変動の最大を表すところのグループスペクトル変動指標
を以下のようにして算出する。
8)でスケールファクタバンド番号k(0≦k<max
_sfb、ただし、max_sfbは最大スケールファ
クタバンド数)のバンドのスペクトルデータの絶対値の
最大であるmaxspec(i)(k)を算出する。次
にグループに属する2つの時間ブロック、iとjのブロ
ック間のスペクトル変動を表すブロック間スペクトル変
動指標dev(i,j)を(数1)で算出する。
し、また、log10(x)は10を底とするxの対数
を表す。
トル変動指標の算出に時間ブロック番号とスケールファ
クタバンド番号で指定されるバンドのスペクトルデータ
の絶対値の最大を用いる例を示したが、前記スペクトル
データの絶対値の平均や、スペクトルデータの2乗和の
平均の平方根を用いてもよい。また、2つのブロックの
前記スペクトルデータの絶対値の最大の比の対数のスケ
ールファクタバンドに関する総和の絶対値を用いる例を
示したが、前記2つのブロックの前記スペクトルデータ
の絶対値の最大の差の2乗のスケールファクタバンドに
関する総和を用いてもよい。
ック間のブロック間スペクトル変動指標dev(i,
j)の最大を算出し、グループスペクトル変動指標とす
る。
すべてのブロック間スペクトル変動指標の最大を用いた
が、平均を用いてもよい。
の中でのグループスペクトル変動指標の最大値を算出す
る。
算出したグループスペクトル変動指標の最大値と第1の
閾値とを比較し、上記グループスペクトル変動指標の最
大値が第1の閾値より大きい場合にはステップ106に
行き、グループ分割を行う。また、上記グループスペク
トル変動指標の最大値が第1の閾値以下の場合にはグル
ープ化を終了する。したがって、グループ内の時間ブロ
ックのスペクトル変動が大きい場合においてのみグルー
プ分割はなされ、前記時間ブロックのスペクトル変動が
小さい場合にはグループ分割はなされない。
出したグループスペクトル変動指標を最大とするグルー
プを分割する。
ーチャートである。
の分割されたグループのグループスペクトル変動指標の
最大を分割グループスペクトル変動指標として算出す
る。例えば、最初は、1グループ8ブロックに設定され
ているので、次の7通りの分割により、2グループに分
割することが可能である。 (1)[0]と[1,2,3,4,5,6,7] (2)[0,1]と[2,3,4,5,6,7] (3)[0,1,2]と[3,4,5,6,7] (4)[0,1,2,3]と[4,5,6,7] (5)[0,1,2,3,4]と[5,6,7] (6)[0,1,2,3,4,5]と[6,7] (7)[0,1,2,3,4,5,6]と[7] ここで、[]内は同一のグループに属する短時間ブロッ
クの番号を表す。
れぞれに対してグループスペクトル変動指標を算出し、
その最大を分割グループスペクトル変動指標として算出
する。したがって、最初は、7つの分割グループスペク
トル変動指標を算出する。
クトル変動指標として、分割された2つのグループのグ
ループスペクトル変動指標の最大を用いる例を示した
が、前記グループスペクトル変動指標の平均を用いても
よい。
で分割グループスペクトル変動指標を最小とする分割を
算出する。
トル変動指標を最小とする分割を実行する。
プ数を1増加してステップ103に戻る。
内のスペクトルデータの変動を表すグループスペクトル
変動指標に基づき、前記グループスペクトル変動指標が
第1の閾値より大きい場合に、最適な順序で(前記グル
ープスペクトル変動指標の大きいグループから順に)グ
ループ分割を行うことにより、スペクトルデータとスケ
ールファクタ等のサイド情報に割り当てるビット数を最
適化し、音質を向上することができる。
プスペクトル変動指標に基づき、前記分割グループスペ
クトル変動指標を最小とする分割を行うことにより、最
適なグループ分割を行い、音質を向上することができ
る。
形態2のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
は、図1に示したステップと同一である。図3と図1の
相違点は、図3では、ステップ301とステップ302
とステップ303が追加されている点にあるので、以
下、これらのステップの処理内容について説明し、それ
以外のステップについては説明を省略する。
の設定を行う。第2の閾値は、グループ数の下限(最小
グループ数)に関する閾値であり、第3の閾値はグルー
プ数の上限(最大グループ数)に関する閾値である。第
2の閾値は、グループ数が小さくなり過ぎて、小さなレ
ベルのスペクトルデータが複数の時間ブロックにわたっ
て量子化されないことによる音質劣化を抑えるためのも
のである。また、第3の閾値は、時間変化の極めて激し
いフレームでグループ数が大きくなり過ぎて、サイド情
報のビット数が増え、スペクトルデータのビット数が不
足することによる音質劣化を抑えるためのものである。
プ数と第3の閾値を比較し、グループ数が第3の閾値よ
り小さい場合には、ステップ103に行き、グループ毎
にグループスペクトル変動指標を算出する。また、グル
ープ数が第3の閾値以上である場合には、グループ化を
終了する。
閾値を比較し、グループ数が第2の閾値より小さい場合
には、ステップ106に行き、グループを分割する。ま
た、グループ数が第2の閾値以上である場合にはステッ
プ105に行き、グループスペクトル変動指標の最大値
が第1の閾値より大きい場合のみ、ステップ106に行
き、グループを分割する。
化の最小グループ数を第2の閾値で設定することによ
り、グループを構成する時間ブロック数が大きくなり過
ぎ、小さなレベルのスペクトルデータが複数の時間ブロ
ックにわたって量子化されないことによる音質劣化を抑
えることができる。
の閾値で設定することにより、サイド情報に割り当てる
ビット数を制限し、スペクトルデータに割り当てること
により、時間変化の極めて激しいフレームでの大幅な音
質劣化を抑えることができる。
形態3のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
は、図3に示したステップと同一である。図4と図3の
相違点は、図4ではステップ401が追加されている点
にあるので、以下、追加されたステップとそれに関連す
るステップについて説明し、それ以外のステップについ
ては説明を省略する。
する。
で入力されたビットレートに応じて第1の閾値の設定を
行う。すなわち、ビットレートが高い場合には、使用可
能なビット数が増加するので、第1の閾値をより小さい
値に設定することにより、グループ数を増加させ、スペ
クトルデータの時間変化をより正確に表現できるように
する。
01で入力されたビットレートに応じて第2と第3の閾
値の設定を行う。すなわち、ビットレートが高い場合に
は、使用可能なビット数が増加するので、第2の閾値を
より大きな値に設定することにより、最小グループ数を
増加させ、小さなレベルのスペクトルデータをより正確
に表現できるようにする。
の閾値をより大きな値に設定することにより、最大グル
ープ数を増加させ、スペクトルデータの時間変化の激し
い場合にもスペクトルデータをより正確に表現できるよ
うにする。
第3の閾値をビットレートに応じて設定することによ
り、それぞれのビットレートに適したグループ化を行
い、広い範囲のビットレートに対して音質を向上するこ
とができる。
の閾値のすべてをビットレートに応じて設定したが、第
1から第3の閾値のいずれかをビットレートに応じて設
定するようにしてもよい。
形態4のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
ブロックのグループ化を共通に設定する場合のグループ
化の方法である。
2つのチャンネルのスペクトルデータを一対として取り
扱うので、2つのチャンネルの時間ブロックのグループ
化を共通に設定する必要がある。すなわち、実施の形態
4は、例えば、ミッド/サイドステレオ符号化やインテ
ンシティステレオ符号化に対して適用される。ただし、
インテンシティステレオ符号化に関しては、一方のチャ
ンネルのスペクトルデータはゼロに設定されているの
で、ゼロに設定されていないチャンネルのスペクトルデ
ータに対して、例えば、実施の形態1〜3のグループ化
を行い、それを2つのチャンネルに対して共通に適用し
てもよい。
グループ化の方法について説明する。
ブロックに設定し、1フレームのグループ数を最小の1
に設定する。本実施の形態では、当初の1グループから
グループを分割することにより、グループ化を決定す
る。
る。
第1の閾値の設定を行う。第1の閾値は、2つのチャン
ネルで共通にグループを分割するときの前記グループに
属する時間ブロックのスペクトルデータの変動を表す2
チャンネルグループスペクトル変動指標に対する閾値で
ある。
第2と第3の閾値の設定を行う。第2の閾値は、グルー
プ数の下限(最小グループ数)に対する閾値であり、第
3の閾値は、グループ数の上限(最大グループ数)に対
する閾値である。第2の閾値は、グループ数が小さくな
り過ぎて、小さなレベルのスペクトルデータが複数の時
間ブロックにわたって量子化されないことによる音質劣
化を抑えるためのものである。また、第3の閾値は、時
間変化の極めて激しいフレームでグループ数が大きくな
り過ぎて、サイド情報のビット数が増え、スペクトルデ
ータのビット数が不足することによる音質劣化を抑える
ためのものである。
数と第3の閾値を比較し、グループ数が第3の閾値より
小さい場合には、ステップ506に行く。また、グルー
プ数が第3の閾値以上である場合には、グループ化を終
了する。
に属する時間ブロック間のスペクトルデータの変動の最
大を表すグループスペクトル変動指標を2つのチャンネ
ルについてそれぞれ算出する。各チャンネルのグループ
スペクトル変動指標の算出に関しては、実施の形態1の
ステップ103で説明した方法を用いる。
ル変動指標として、グループに属する時間ブロック間の
スペクトルデータの変動の最大を用いたが、グループに
属する時間ブロック間のスペクトルデータの変動の平均
を用いてもよい。
算出した2つのチャンネルのグループスペクトル変動指
標の最大を算出し、2チャンネルグループスペクトル変
動指標とする。
のグループスペクトル変動指標の最大を2チャンネルグ
ループスペクトル変動指標として用いる例を示したが、
前記グループスペクトル変動指標の平均を用いてもよ
い。
の中で2チャンネルグループスペクトル変動指標の最大
値を算出する。
の閾値を比較し、グループ数が第2の閾値より小さい場
合には、ステップ511に行き、グループを分割する。
また、グループ数が第2の閾値以上である場合にはステ
ップ510に行く。
した2チャンネルグループスペクトル変動指標の最大値
と第1の閾値とを比較し、上記2チャンネルグループス
ペクトル変動指標の最大値が第1の閾値より大きい場合
にはステップ511に行き、グループ分割を行う。そう
でない場合にはグループ化を終了する。したがって、グ
ループ内の時間ブロックのスペクトル変動が大きい場合
においてのみグループ分割はなされ、前記時間ブロック
のスペクトル変動が小さい場合にはグループ分割はなさ
れない。
出した2チャンネルグループスペクトル変動指標を最大
とするグループを分割する。
チャートである。
の分割されたグループのグループスペクトル変動指標の
最大を分割グループスペクトル変動指標として、2つの
チャンネルについてそれぞれ算出する。例えば、最初
は、1グループ8ブロックに設定されているので、次の
7通りの分割により、2グループに分割することが可能
である。 (1)[0]と[1,2,3,4,5,6,7] (2)[0,1]と[2,3,4,5,6,7] (3)[0,1,2]と[3,4,5,6,7] (4)[0,1,2,3]と[4,5,6,7] (5)[0,1,2,3,4]と[5,6,7] (6)[0,1,2,3,4,5]と[6,7] (7)[0,1,2,3,4,5,6]と[7] ここで、[]内は同一のグループに属する短時間ブロッ
クの番号を表す。
れぞれに対してグループスペクトル変動指標を算出し、
その最大を分割グループスペクトル変動指標として算出
する。したがって、最初は、7つの分割グループスペク
トル変動指標を2つのチャンネルについてそれぞれ算出
する。
クトル変動指標として、分割された2つのグループのグ
ループスペクトル変動指標の最大を用いる例を示した
が、前記グループスペクトル変動指標の平均を用いても
よい。
割に対する2つのチャンネルの分割グループスペクトル
変動指標の最大を2チャンネル分割グループスペクトル
変動指標として算出する。
の分割グループスペクトル変動指標の最大を2チャンネ
ル分割グループスペクトル変動指標として用いる例を示
したが、2つのチャンネルの分割グループスペクトル変
動指標の平均を用いてもよい。
で2チャンネル分割グループスペクトル変動指標を最小
とする分割を算出する。
グループスペクトル変動指標を最小とする分割を実行す
る。
プ数を1増加してステップ505に戻る。
ャンネルで共通のグループ化を行うのに際して、グルー
プ数が第3の閾値より小さい場合に、2つのチャンネル
で共通なグループのスペクトルデータの変動を表す2チ
ャンネルグループスペクトル変動指標に基づき、グルー
プ数が第2の閾値より小さいかあるいは前記2チャンネ
ルグループスペクトル変動指標が第1の閾値より大きい
ときに、最適な順序で(前記2チャンネルグループスペ
クトル変動指標の大きいグループから順に)グループ分
割を行うことにより、スペクトルデータとスケールファ
クタ等のサイド情報に割り当てるビット数を最適化し、
音質を向上することができる。
ル分割グループスペクトル変動指標に基づき、前記2チ
ャンネル分割グループスペクトル変動指標を最小とする
分割を行うことにより、最適なグループ分割を行い、音
質を向上することができる。
を設定し、第2と第3の閾値とグループ数を比較するス
テップを設ける例を示したが、実施の形態1のように、
これらのステップを省いてもよい。
オ信号符号化方法は、コンピュータまたはデジタルシグ
ナルプロセッサに実行させるためのプログラムとして実
現することができ、これをコンピュータ読み取り可能な
記録媒体に記録してもよい。
内の時間ブロックのスペクトルデータの変動を表すグル
ープスペクトル変動指標に基づき、グループスペクトル
変動指標が第1の閾値より大きい場合に、最適な順序で
(前記グループスペクトル変動指標の大きいグループか
ら順に)グループ分割を行うことにより、スペクトルデ
ータとスケールファクタ等のサイド情報に割り当てるビ
ット数を最適化し、音質を向上することができる。
プスペクトル変動指標に基づき、前記分割グループスペ
クトル変動指標を最小とする分割を行うことにより、最
適なグループ分割を行い、音質を向上することができ
る。
することにより、グループを構成する時間ブロック数が
大きくなり過ぎ、小さなレベルのスペクトルデータが複
数の時間ブロックにわたって量子化されないことによる
音質劣化を抑えることができる。
することにより、サイド情報に割り当てるビット数を制
限し、スペクトルデータに割り当てることにより、時間
変化の極めて激しいフレームに対する大幅な音質劣化を
抑えることができる。
ットレートに応じて設定することにより、それぞれのビ
ットレートに適したグループ化を行い、広い範囲のビッ
トレートに対して音質を向上することができる。
うに2つのチャンネルで共通のグループ化を行う場合に
対して、2チャンネルグループスペクトル変動指標に基
づき、前記2チャンネルグループスペクトル変動指標が
第1の閾値より大きい場合には、最適な順序で(前記2
チャンネルグループスペクトル変動指標の大きいグルー
プから順に)グループ分割を行うことにより、スペクト
ルデータとスケールファクタ等のサイド情報に割り当て
るビット数を最適化し、音質を向上することができる。
ル分割グループスペクトル変動指標に基づき、前記2チ
ャンネル分割グループスペクトル変動指標を最小とする
分割を行うことにより、最適なグループ分割を行い、音
質を向上することができる。
方法における複数の時間ブロックのグループ化の方法の
ステップを示すフローチャート
ップ106の詳細を示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
ップ511の詳細を示すフローチャート
クの例を説明するための説明図
例を説明するための説明図
の短時間ブロックのグループ化の例を説明するための説
明図
Claims (10)
- 【請求項1】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、グループに属する時間ブロック間のスペクトルデ
ータの変動の最大あるいは平均を表すグループスペクト
ル変動指標をグループ毎に算出するステップと、前記グ
ループスペクトル変動指標の最大値を算出するステップ
と、前記最大値が第1の閾値より大きい場合に前記グル
ープスペクトル変動指標を最大とするグループを分割す
るステップとを備えたことを特徴とするオーディオ信号
符号化方法。 - 【請求項2】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、グループに属する時間ブロック間のスペクトルデ
ータの変動の最大あるいは平均を表すグループスペクト
ル変動指標をグループ毎に算出するステップと、前記グ
ループスペクトル変動指標の最大値を算出するステップ
と、前記最大値が第1の閾値より大きいかあるいはグル
ープ数が第2の閾値より小さい場合に、前記グループス
ペクトル変動指標を最大とするグループを分割するステ
ップとを備えたことを特徴とするオーディオ信号符号化
方法。 - 【請求項3】 グループを分割するステップが、グルー
プを分割した時の分割されたグループのグループスペク
トル変動指標の最大あるいは平均を表す分割グループス
ペクトル変動指標を算出するステップと、すべての分割
の中で前記分割グループスペクトル変動指標を最小とす
る分割を実行するステップとを備えたことを特徴とする
請求項1あるいは請求項2記載のオーディオ信号符号化
方法。 - 【請求項4】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、複数のチャンネルのグループ化を共通に設定する
場合に、グループに属する時間ブロック間のスペクトル
データの変動の最大あるいは平均を表すグループスペク
トル変動指標を複数のチャンネルについてそれぞれグル
ープ毎に算出するステップと、前記複数のチャンネルの
グループスペクトル変動指標の最大あるいは平均を複数
チャンネルグループスペクトル変動指標として算出する
ステップと、前記複数チャンネルグループスペクトル変
動指標の最大値を算出するステップと、前記最大値が第
1の閾値より大きい場合に前記複数チャンネルグループ
スペクトル変動指標を最大とするグループを分割するス
テップとを備えたことを特徴とするオーディオ信号符号
化方法。 - 【請求項5】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、複数のチャンネルのグループ化を共通に設定する
場合に、グループに属する時間ブロック間のスペクトル
データの変動の最大あるいは平均を表すグループスペク
トル変動指標を複数のチャンネルについてそれぞれグル
ープ毎に算出するステップと、前記複数のチャンネルの
グループスペクトル変動指標の最大あるいは平均を複数
チャンネルグループスペクトル変動指標として算出する
ステップと、前記複数チャンネルグループスペクトル変
動指標の最大値を算出するステップと、前記最大値が第
1の閾値より大きいかあるいはグループ数が第2の閾値
より小さい場合に、前記複数チャンネルグループスペク
トル変動指標を最大とするグループを分割するステップ
とを備えたことを特徴とするオーディオ信号符号化方
法。 - 【請求項6】 グループを分割するステップが、グルー
プを分割した時の分割されたグループのグループスペク
トル変動指標の最大あるいは平均を表す分割グループス
ペクトル変動指標を複数のチャンネルについてそれぞれ
算出するステップと、前記複数のチャンネルの分割グル
ープスペクトル変動指標の最大あるいは平均を複数チャ
ンネル分割グループスペクトル変動指標として算出する
ステップと、すべての分割の中で前記複数チャンネル分
割グループスペクトル変動指標を最小とする分割を実行
するステップとを備えたことを特徴とする請求項4ある
いは請求項5記載のオーディオ信号符号化方法。 - 【請求項7】 グループ数が第3の閾値以上となった場
合にグループの分割を終了するステップを備えたことを
特徴とする請求項1から請求項6のいずれかに記載のオ
ーディオ信号符号化方法。 - 【請求項8】 符号化のビットレートに応じて前記第1
から第3の閾値のいずれかを設定するステップを備えた
ことを特徴とする請求項1から請求項7のいずれかに記
載のオーディオ信号符号化方法。 - 【請求項9】 請求項1から請求項8のいずれかに記載
のオーディオ信号符号化方法をコンピュータまたはデジ
タルシグナルプロセッサに実行させるためのプログラ
ム。 - 【請求項10】 請求項1から請求項8のいずれかに記
載のオーディオ信号符号化方法をコンピュータまたはデ
ジタルシグナルプロセッサに実行させるためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002151923A JP4062971B2 (ja) | 2002-05-27 | 2002-05-27 | オーディオ信号符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002151923A JP4062971B2 (ja) | 2002-05-27 | 2002-05-27 | オーディオ信号符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003345398A true JP2003345398A (ja) | 2003-12-03 |
JP4062971B2 JP4062971B2 (ja) | 2008-03-19 |
Family
ID=29769371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002151923A Expired - Lifetime JP4062971B2 (ja) | 2002-05-27 | 2002-05-27 | オーディオ信号符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4062971B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201375A (ja) * | 2005-01-19 | 2006-08-03 | Toshiba Corp | オーディオ符号化方法およびオーディオ符号化装置 |
WO2007029304A1 (ja) * | 2005-09-05 | 2007-03-15 | Fujitsu Limited | オーディオ符号化装置及びオーディオ符号化方法 |
JP2007523366A (ja) * | 2004-01-20 | 2007-08-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | ブロック系列化に基づくオーディオコーディング |
WO2008004649A1 (en) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Audio encoding device, audio encoding method, and program thereof |
US7725324B2 (en) | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7822617B2 (en) | 2005-02-23 | 2010-10-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Optimized fidelity and reduced signaling in multi-channel audio encoding |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
-
2002
- 2002-05-27 JP JP2002151923A patent/JP4062971B2/ja not_active Expired - Lifetime
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725324B2 (en) | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
JP2007523366A (ja) * | 2004-01-20 | 2007-08-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | ブロック系列化に基づくオーディオコーディング |
JP2006201375A (ja) * | 2005-01-19 | 2006-08-03 | Toshiba Corp | オーディオ符号化方法およびオーディオ符号化装置 |
JP4550595B2 (ja) * | 2005-01-19 | 2010-09-22 | 株式会社東芝 | オーディオ符号化装置 |
US7822617B2 (en) | 2005-02-23 | 2010-10-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Optimized fidelity and reduced signaling in multi-channel audio encoding |
US7945055B2 (en) | 2005-02-23 | 2011-05-17 | Telefonaktiebolaget Lm Ericcson (Publ) | Filter smoothing in multi-channel audio encoding and/or decoding |
US9626973B2 (en) | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
WO2007029304A1 (ja) * | 2005-09-05 | 2007-03-15 | Fujitsu Limited | オーディオ符号化装置及びオーディオ符号化方法 |
WO2008004649A1 (en) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Audio encoding device, audio encoding method, and program thereof |
JP5093514B2 (ja) * | 2006-07-07 | 2012-12-12 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびそのプログラム |
US8818818B2 (en) | 2006-07-07 | 2014-08-26 | Nec Corporation | Audio encoding device, method, and program which controls the number of time groups in a frame using three successive time group energies |
Also Published As
Publication number | Publication date |
---|---|
JP4062971B2 (ja) | 2008-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
JP3762579B2 (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
US9361900B2 (en) | Encoding device and method, decoding device and method, and program | |
JPH05304479A (ja) | オーディオ信号の高能率符号化装置 | |
KR101803410B1 (ko) | 인코딩 방법 및 장치 | |
JP3900000B2 (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム | |
JP2003233395A (ja) | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム | |
US8593321B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
JP4062971B2 (ja) | オーディオ信号符号化方法 | |
JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
JPH0748698B2 (ja) | 可聴音信号符号化方法 | |
WO2016017238A1 (ja) | 符号化方法、装置、プログラム及び記録媒体 | |
JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
US8601039B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
JPWO2015049820A1 (ja) | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 | |
JP3894722B2 (ja) | ステレオオーディオ信号高能率符号化装置 | |
KR102486258B1 (ko) | 스테레오 신호 인코딩 방법 및 인코딩 장치 | |
JP2003233397A (ja) | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 | |
US7181079B2 (en) | Time signal analysis and derivation of scale factors | |
JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
JP2004325633A (ja) | 信号符号化方法、信号符号化プログラム及びその記録媒体 | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
JP4635400B2 (ja) | オーディオ信号符号化方法 | |
JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
JP2003195894A (ja) | 符号化装置、復号化装置、符号化方法、及び復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050425 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071224 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4062971 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140111 Year of fee payment: 6 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |