JP4635400B2 - オーディオ信号符号化方法 - Google Patents

オーディオ信号符号化方法 Download PDF

Info

Publication number
JP4635400B2
JP4635400B2 JP2001296836A JP2001296836A JP4635400B2 JP 4635400 B2 JP4635400 B2 JP 4635400B2 JP 2001296836 A JP2001296836 A JP 2001296836A JP 2001296836 A JP2001296836 A JP 2001296836A JP 4635400 B2 JP4635400 B2 JP 4635400B2
Authority
JP
Japan
Prior art keywords
integrated
time blocks
spectrum
groups
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001296836A
Other languages
English (en)
Other versions
JP2003108192A (ja
JP2003108192A5 (ja
Inventor
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2001296836A priority Critical patent/JP4635400B2/ja
Publication of JP2003108192A publication Critical patent/JP2003108192A/ja
Publication of JP2003108192A5 publication Critical patent/JP2003108192A5/ja
Application granted granted Critical
Publication of JP4635400B2 publication Critical patent/JP4635400B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化するオーディオ信号符号化方法に関する。
【0002】
【従来の技術】
近年、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化することにより、符号化効率を改善する手法が提案されている。
【0003】
このような提案としては、MPEG−2 AAC(Advanced Audio Coding)の規格書(ISO/IEC 13818-7, Information technology - Generic coding of moving pictures and associated audio information - Part 7: Advanced Audio Coding (AAC))や日本国特許番号第2739377号に記載されたものが知られている。
【0004】
しかしながら、これらの先行文献には、具体的なグループ化の決定方法については、記載されておらず、このため、例えば、あらかじめ設定した固定のグループ化方法で対応せざるを得なかった。
【0005】
以下では、MPEG−2 AAC(以下AACと略す)のローコンプレキシティプロファイル(Low Complexity Profile)を例にとって、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化する従来例について説明する。
【0006】
図5にAACエンコーダのブロック図を示す。図5において、500と501はフィルタバンク、510と511はブロック長決定部、520はジョイントステレオデータ生成部、530は短時間ブロックグループ化決定部、540は量子化及び符号化部である。以上のように構成されたAACエンコーダについて、その動作を以下に述べる。
【0007】
入力された左チャンネル(Lch)の時間軸のオーディオ信号は、フィルタバンク500においてブロック長決定部510で決定された長さのブロックに分割され、MDCT(Modified Discrete Cosine Transform,変形離散コサイン変換)によりスペクトルデータ(MDCT係数)に変換される。この変換は変換ブロックを50%ずつオーバーラップして実行し、例えば2048サンプルを1024本のMDCT係数に変換する。同様に、入力された右チャンネル(Rch)の時間軸のオーディオ信号は、フィルタバンク501においてブロック長決定部511で決定された長さのブロックに分割され、MDCTによりスペクトルデータに変換される。
【0008】
ブロック長決定部510と511では、MDCTのブロック長を決定し、出力する。ブロック長決定部510と511で、それぞれのチャンネルの信号の変化に応じてMDCTのブロック長を変化させることにより、プリエコーと呼ばれる疑似信号の発生による音質の劣化を防止する。すなわち、定常的な信号の場合には、MDCTのブロック長を2048サンプルの長時間ブロックとし、1024本のスペクトルデータに変換する。一方、過渡的な信号の場合には256サンプルの短時間ブロックとし、128本のスペクトルデータに変換する。短時間ブロックでは、8個連続で短いブロック長を用いて変換することにより、出力のスペクトルデータの本数を8×128=1024本として、長時間ブロックと一致させる。この1024本のスペクトルデータから成る符号化の単位をフレームと呼ぶ。
【0009】
図6に短時間ブロックと長時間ブロックの例を示す。同図で、第0フレーム(F0)、第2フレーム(F2)、第3フレーム(F3)は、長時間ブロックのフレームであり、これに対して第1フレーム(F1)は連続した8個の短時間ブロックから成る短時間ブロックのフレームである。
【0010】
次にジョイントステレオデータ生成部520では、左右のチャンネルの相関を利用して符号化効率を向上させるため、左右のチャンネルのスペクトルデータを入力として、ジョイントステレオ(ミッド/サイドステレオあるいはインテンシティステレオ)符号化に必要なジョイントステレオスペクトルデータを生成する。ここで、ジョイントステレオスペクトルデータとは、ミッド/サイド(和差)ステレオ符号化に必要な左チャンネルと右チャンネルのスペクトルデータの和と差、あるいはインテンシティステレオ符号化に必要な左チャンネルと右チャンネルのスペクトルデータの和(左右のチャンネルの位相が逆相の場合には差)である。なお、インテンシティステレオ符号化の場合、もう一方のチャンネルのスペクトルデータはゼロに設定される。
【0011】
次に短時間ブロックグループ化決定部530では、短時間ブロックの符号化効率を向上するため、短時間ブロックのグループ化を行う。短時間ブロックのグループ化では、複数の連続する短時間ブロックをブロック単位でまとめ、スケールファクタバンドと呼ばれる複数のスペクトルデータから構成されるバンド単位で共通のステップサイズを用いて量子化することにより、量子化ステップサイズを表すスケールファクタ等のサイド情報を削減し、符号化効率を改善する。AACの規格では、1フレーム当り、最小1個から最大8個のグループにグループ化することが可能である。ここでは、図7に示すように、8個の短時間ブロックを2個ずつ1グループとして、合計4個のグループ(G0,G1,G2,G3)にグループ化する。なお、ジョイントステレオスペクトルデータの場合には、2つのチャンネルのスペクトルデータが対になっているので、グループ化に際しても、図8に示すように、2つのチャンネルのグループ化を共通に設定する必要がある。
【0012】
量子化及び符号化部540では、左右のチャンネルのスペクトルデータ、あるいはジョイントステレオデータ生成部520からのジョイントスペクトルデータをスケールファクタバンド毎にまとめ、聴覚モデルに基づいてスペクトルデータのマスキングレベル、すなわち許容量子化ノイズレベルを算出し、算出された許容量子化ノイズレベルに基づいてスケールファクタバンド毎にスペクトルデータの量子化を行い、ハフマン符号化等の符号化処理を行い、高能率符号化データを出力する。
【0013】
【発明が解決しようとする課題】
しかしながら、上記従来の複数の時間ブロックのスペクトルデータのグループ化では、スペクトルデータに依存しない固定的なグループ化であるため、符号化効率が劣化し、音質が劣化することがあるという課題があった。すなわち、スペクトルデータの時間変化が緩やかなところでは、本来は、より多くの時間ブロックを1グループとしてスケールファクタ等のサイド情報を削減し、符号化効率を改善すべきであるのにこれができず、また、スペクトルデータの時間変化が急激なところが、同一のグループにされると、同一の量子化ステップサイズを用いるため、小さなレベルの時間ブロックのスペクトルデータを十分表現することができず、このため音質が劣化するという課題があった。
【0014】
本発明は上記問題点を解決するもので、時間ブロック間のスペクトルデータの変動に基づく最適なグループ化により、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質の向上したオーディオ信号高能率符号化方法を提供することを目的とする。
【0015】
また、2つのチャンネルのグループ化を共通に設定する必要のあるジョイントステレオスペクトルデータに対しても最適なグループ化を行い、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質の向上したオーディオ信号高能率符号化方法を提供することを目的とする。
【0016】
また、時間変化の極めて激しいフレームに対して、音質を大幅に劣化させることがないグループ化を行うオーディオ信号の高能率符号化方法を提供することを目的とする。
【0017】
また、広い範囲のビットレートに対して適切なグループ化を行い、従来よりも音質の向上したオーディオ信号符号化方法を提供することを目的とする。
【0018】
【課題を解決するための手段】
この課題を解決するために、本発明のオーディオ信号符号化方法は、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化する方法であって、隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動の最大あるいは平均を表す統合グループスペクトル変動指標を算出するステップと、すべての隣接するグループの統合の中で前記統合グループスペクトル変動指標の最小値を算出するステップと、前記最小値が第1の閾値以下の場合に前記統合グループスペクトル変動指標を最小とするグループを統合するステップとを備えたものである。
【0019】
また、本発明のオーディオ信号符号化方法は、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化する方法であって、隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動の最大あるいは平均を表す統合グループスペクトル変動指標を算出するステップと、すべての隣接するグループの統合の中で前記統合グループスペクトル変動指標の最小値を算出するステップと、前記最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記統合グループスペクトル変動指標を最小とするグループを統合するステップとを備えたものである。
【0020】
また、本発明のオーディオ信号符号化方法は、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化する方法であって、複数のチャンネルのグループ化を共通に設定する場合に、隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動の最大あるいは平均を表す統合グループスペクトル変動指標を複数のチャンネルについてそれぞれ算出するステップと、前記複数のチャンネルの統合グループスペクトル変動指標の最大あるいは平均を複数チャンネル統合グループスペクトル変動指標として算出するステップと、すべての隣接するグループの統合の中で前記複数チャンネル統合グループスペクトル変動指標の最小値を算出するステップと、前記最小値が第1の閾値以下である場合に前記複数チャンネル統合グループスペクトル変動指標を最小とするグループを統合するステップとを備えたものである。
【0021】
また、本発明のオーディオ信号符号化方法は、オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して高能率符号化する方法であって、複数のチャンネルのグループ化を共通に設定する場合に、隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動の最大あるいは平均を表す統合グループスペクトル変動指標を複数のチャンネルについてそれぞれ算出するステップと、前記複数のチャンネルの統合グループスペクトル変動指標の最大あるいは平均を複数チャンネル統合グループスペクトル変動指標として算出するステップと、すべての隣接するグループの統合の中で前記複数チャンネル統合グループスペクトル変動指標の最小値を算出するステップと、前記最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記複数チャンネル統合グループスペクトル変動指標を最小とするグループを統合するステップとを備えたものである。
【0022】
また、本発明のオーディオ信号符号化方法は、上記本発明のオーディオ信号符号化方法において、符号化のビットレートに応じて前記第1あるいは第2の閾値を設定するステップを備えたものである。
【0023】
また、上記記載の本発明に係るオーディオ信号符号化方法をコンピュータまたはデジタルシグナルプロセッサに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体としたものである。
【0024】
また、上記記載の本発明に係るオーディオ信号符号化方法をコンピュータまたはデジタルシグナルプロセッサに実行させるためのプログラムとしたものである。
【0025】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて説明する。
【0026】
以下の実施の形態の説明では、本発明の特徴である複数の時間ブロックのスペクトルデータのグループ化の方法について、AACエンコーダに適用した場合を例として説明する。即ち、オーディオ信号符号化装置(AACエンコーダ)の構成としては、図5に示した通りである。
【0027】
(実施の形態1)
図1は、本発明の実施の形態1のオーディオ信号符号化方法における複数の時間ブロックのスペクトルデータのグループ化の方法のステップを示すフローチャートである。
【0028】
以下、図1を用いて実施の形態1における特徴部分としてのグループ化の方法について説明する。
【0029】
最初にステップ101で、1グループ1ブロックに設定し、1フレームのグループ数を最大の8に設定する。本実施の形態では、当初の8グループから適宜グループを統合することにより、グループ化を決定する。
【0030】
ステップ102で、第1の閾値の設定を行う。第1の閾値は、隣接するグループを統合するときの統合するグループに属する時間ブロックのスペクトルデータの変動を表す統合グループスペクトル変動指標に対する閾値である。
【0031】
ステップ103で、隣接するグループを統合した時の統合したグループに属するすべての時間ブロック間のスペクトルデータの変動の最大を表すところの統合グループスペクトル変動指標を以下のようにして算出する。
【0032】
最初に、時間ブロック番号i(0≦i<8)でスケールファクタバンド番号k(0≦k<max_sfb、ただし、max_sfbは最大スケールファクタバンド数)のバンドのスペクトルデータの絶対値の最大であるmaxspec(i)(k)を算出し、次に統合したグループに属する2つの時間ブロック、iとjのブロック間のスペクトル変動を表すブロック間スペクトル変動指標dev(i,j)を(数1)で算出する。
【0033】
【数1】
Figure 0004635400
【0034】
ここで、abs(x)はxの絶対値を表し、また、log10(x)は10を底とするxの対数を表す。
【0035】
なお、以上の説明では、ブロック間スペクトル変動指標の算出に時間ブロック番号とスケールファクタバンド番号で指定されるバンドのスペクトルデータの絶対値の最大を用いる例を示したが、前記スペクトルデータの絶対値の平均や、スペクトルデータの2乗和の平均の平方根を用いても良い。また、2つのブロックの前記スペクトルデータの絶対値の最大の比の対数スケールファクタバンドに関する総和の絶対値を用いる例を示したが、前記2つのブロックの前記スペクトルデータの絶対値の最大の差の2乗のスケールファクタバンドに関する総和を用いてもよい。
【0036】
次に、統合したグループに属するすべての時間ブロック間のブロック間スペクトル変動指標dev(i,j)の最大を算出し、統合グループスペクトル変動指標とする。
【0037】
なお、以上の説明では、統合するグループに属するすべてのブロック間スペクトル変動指標の最大を用いたが、平均を用いてもよい。
【0038】
次にステップ104で、すべての隣接するグループの統合の中で、統合グループスペクトル変動指標の最小値を算出する。最初は、1グループ1ブロックに設定されているので、[0,1]、[1,2]、[2,3]、[3,4]、[4,5]、[5,6]、[6,7](ここで[]の内は統合する短時間ブロックの番号を表す。)の7通りのグループの統合の中で最小値とそれを与えるグループ統合を算出する。
【0039】
次にステップ105で、ステップ104で算出した統合グループスペクトル変動指標の最小値と第1の閾値とを比較し、上記統合グループスペクトル変動指標の最小値が第1の閾値以下である場合にはステップ106に行き、グループ統合を行い、そうでない場合にはグループ化を終了する。したがって、統合したときのグループ内の時間ブロックのスペクトル変動が小さい場合においてのみグループ統合はなされ、前記時間ブロックのスペクトル変動が大きい場合にはグループ統合はなされない。
【0040】
ステップ106では、ステップ104で算出した統合グループスペクトル変動指標を最小とするグループを統合する。
【0041】
次にステップ107で、グループ数を1減少してステップ103に戻る。
【0042】
以上のように本実施の形態では、隣接するグループを統合した時のグループ内のスペクトルデータの変動を表す統合グループスペクトル変動指標に基づき、前記統合グループスペクトル変動指標が第1の閾値以下の場合には、最適な順序で(上記統合グループスペクトル変動指標の小さいものから順に)グループ化を行うことにより、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質を向上することができる。
【0043】
(実施の形態2)
図2は、本発明の実施の形態2のオーディオ信号符号化方法における複数の時間ブロックのスペクトルデータのグループ化の方法のステップを示すフローチャートである。
【0044】
図2で図1と同一番号を付したステップは、図1に示したステップと同一である。図2と図1の相違点は、図2では、ステップ201とステップ202が追加されている点にあるので、以下、これらのステップの処理内容について説明し、それ以外のステップについては説明を省略する。
【0045】
ステップ201では、第2の閾値の設定を行う。第2の閾値は、グループ数に関する閾値であり、時間変化の極めて激しいフレームでグループ数が大きくなり過ぎて、サイド情報のビット数が増え、スペクトルデータのビット数が不足することによる音質劣化を抑えるためのものである。
【0046】
ステップ202では、その時点でのグループ数と第2の閾値を比較し、グループ数が第2の閾値より大きい場合には、ステップ106に行き、グループを統合する。また、グループ数が第2の閾値以下である場合にはステップ105に行き、統合グループスペクトル変動指標の最小値が第1の閾値以下である場合のみ、ステップ106に行き、グループを統合する。
【0047】
以上のように実施の形態2では、グループ化の最大グループ数を第2の閾値で設定し、グループ数を制限することにより、サイド情報に割り当てるビット数を制限し、スペクトルデータに割り当てることにより、時間変化の極めて激しいフレームでの大幅な音質劣化を抑えることができる。
【0048】
(実施の形態3)
図3は、本発明の実施の形態3のオーディオ信号符号化方法における複数の時間ブロックのスペクトルデータのグループ化の方法のステップを示すフローチャートである。
【0049】
図3で図2と同一番号を付したステップは、図2に示したステップと同一である。図3と図2の相違点は、図3ではステップ301が追加されている点にあるので、以下、追加されたステップとそれに関連するステップについて説明し、それ以外のステップについては説明を省略する。
【0050】
ステップ301では、ビットレートを入力する。
【0051】
次にステップ102では、ステップ301で入力されたビットレートに応じて第1の閾値の設定を行う。すなわち、ビットレートが高い場合には、使用可能なビット数が増加するので、第1の閾値をより小さい値に設定することにより、グループ数を増加させ、スペクトルデータの時間変化をより正確に表現できるようにする。
【0052】
同様に、ステップ201では、ステップ301で入力されたビットレートに応じて第2の閾値の設定を行う。すなわち、ビットレートが高い場合には、使用可能なビット数が増加するので、第2の閾値をより大きな値に設定することにより、最大グループ数を増加させ、スペクトルデータの時間変化の激しい場合にもスペクトルデータをより正確に表現できるようにする。
【0053】
以上のように実施の形態3では、第1あるいは第2の閾値をビットレートに応じて設定することにより、それぞれのビットレートに適したグループ化を行い、広い範囲のビットレートに対して音質を向上することができる。
【0054】
(実施の形態4)
図4は、本発明の実施の形態4のオーディオ信号符号化方法における複数の時間ブロックのスペクトルデータのグループ化の方法のステップを示すフローチャートである。
【0055】
実施の形態4は、2つのチャンネルの時間ブロックのグループ化を共通に設定する場合のグループ化の方法である。
【0056】
例えば、ジョイントステレオ符号化では、2つのチャンネルのスペクトルデータを一対として取り扱うので、2つのチャンネルの時間ブロックのグループ化を共通に設定する必要がある。すなわち、実施の形態4は、例えば、ミッド/サイドステレオ符号化やインテンシティステレオ符号化に対して適用される。ただし、インテンシティステレオ符号化に関しては、一方のチャンネルのスペクトルデータはゼロに設定されているので、ゼロに設定されていないチャンネルのスペクトルデータに対して、例えば、実施の形態1〜3のグループ化を行い、それを2つのチャンネルに対して共通に適用してもよい。
【0057】
以下、図4を用いて実施の形態4におけるグループ化の方法について説明する。
【0058】
最初に、ステップ401で、1グループ1ブロックに設定し、1フレームのグループ数を最大の8に設定する。本実施の形態では、当初の8グループからグループを統合することにより、グループ化を決定する。
【0059】
ステップ402で、ビットレートを入力する。
【0060】
ステップ403で、ビットレートに応じて第1の閾値の設定を行う。第1の閾値は、2つのチャンネルの隣接するグループを統合した時の統合したグループに属する時間ブロックのスペクトルデータの変動を表す2チャンネル統合グループスペクトル変動指標に対する閾値である。
【0061】
ステップ404で、ビットレートに応じて第2の閾値の設定を行う。第2の閾値は、グループ数に対する閾値であり、グループ数が大きくなり過ぎて、サイド情報のビット数が増え、スペクトルデータのビット数が不足することによる音質劣化を抑えるためのものである。
【0062】
ステップ405で、隣接するグループを統合したときの統合したグループに属する時間ブロック間のスペクトルデータの変動の最大を表す統合グループスペクトル変動指標を2つのチャンネルについてそれぞれ算出する。各チャンネルの統合グループスペクトル変動指標の算出に関しては、実施の形態1のステップ103で説明した方法を用いる。
【0063】
次にステップ406で、ステップ405で算出した2つのチャンネルの統合グループスペクトル変動指標の最大を算出し、2チャンネル統合グループスペクトルとする。
【0064】
なお、以上の説明では、2つのチャンネルの統合グループスペクトル変動指標の最大を2チャンネル統合グループスペクトルとして用いる例を示したが、前記統合グループスペクトル変動指標の平均を用いてもよい。
【0065】
次にステップ407で、すべての隣接するグループの統合の中で2チャンネル統合グループスペクトル変動指標の最小値を算出する。最初は、1グループ1ブロックに設定されているので、[0,1]、[1,2]、[2,3]、[3,4]、[4,5]、[5,6]、[6,7](ここで[]の内は統合する短時間ブロックの番号を表す。)の7通りのグループの統合の中で最小値とそれを与えるグループ統合を算出する。
【0066】
次にステップ408で、この時点でのグループ数と第2の閾値を比較し、グループ数が第2の閾値より大きい場合には、ステップ410に行き、グループを統合する。また、グループ数が第2の閾値以下である場合にはステップ409に行く。
【0067】
ステップ409で、ステップ407で算出した2チャンネル統合グループスペクトル変動指標の最小値と第1の閾値とを比較し、上記2チャンネル統合グループスペクトル変動指標の最小値が第1の閾値以下である場合にはステップ410に行き、グループ統合を行う。そうでない場合にはグループ化を終了する。したがって、統合したときのグループ内の時間ブロックのスペクトル変動が小さい場合においてのみグループ統合はなされ、前記時間ブロックのスペクトル変動が大きい場合にはグループ統合はなされない。
【0068】
ステップ410では、ステップ407で算出した2チャンネル統合グループスペクトル変動指標を最小とするグループを統合する。
【0069】
次にステップ411で、グループ数を1減少してステップ405に戻る。
【0070】
以上のように本実施の形態では、2つのチャンネルで共通のグループ化を行う場合に、2つのチャンネルの隣接するグループを統合した時のグループ内のスペクトルデータの変動を表す2チャンネル統合グループスペクトル変動指標に基づき、グループ数が第2の閾値より大きいかあるいは前記2チャンネル統合グループスペクトル変動指標が第1の閾値以下の場合には、最適な順序で(上記2チャンネル統合グループスペクトル変動指標の小さいものから順に)グループ化を行うことにより、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質を向上することができる。
【0071】
なお、以上の説明では、第2の閾値を設定し、第2の閾値とグループ数を比較するステップを設ける例を示したが、実施の形態1のように、これらのステップを省いてもよい。
【0072】
なお、上記各実施の形態におけるオーディオ信号符号化方法は、コンピュータまたはデジタルシグナルプロセッサに実行させるためのプログラムとして実現することができ、これをコンピュータ読み取り可能な記録媒体に記録してもよい。
【0073】
【発明の効果】
以上のように本発明によれば、隣接するグループを統合したときのグループ内の時間ブロックのスペクトルデータの変動を表す統合グループスペクトル変動指標に基づき、統合グループスペクトル変動指標が第1の閾値以下の場合に、最適な順序で(上記統合グループスペクトル変動指標の小さいものから順に)グループ化を行うことにより、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質を向上することができる。
【0074】
また、グループ化の最大グループ数を第2の閾値で設定し、グループ数を制限することにより、サイド情報に割り当てるビット数を制限し、スペクトルデータに割り当てることにより、時間変化の極めて激しいフレームに対する大幅な音質劣化を抑えることができる。
【0075】
また、第1あるいは第2の閾値をビットレートに応じて設定することにより、それぞれのビットレートに適したグループ化を行い、広い範囲のビットレートに対して音質を向上することができる。
【0076】
また、ミッド/サイドステレオ符号化のように2つのチャンネルで共通のグループ化を行う場合に対して、2チャンネル統合グループスペクトル変動指標に基づき、グループ数が第2の閾値より大きいかあるいは前記2チャンネル統合グループスペクトル変動指標が第1の閾値以下の場合には、最適な順序で(上記2チャンネル統合グループスペクトル変動指標の小さいものから順に)グループ化を行うことにより、スペクトルデータとスケールファクタ等のサイド情報に割り当てるビット数を最適化し、音質を向上することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1のオーディオ信号符号化方法における複数の時間ブロックのグループ化の方法のステップを示すフローチャート
【図2】同実施の形態2のオーディオ信号符号化方法における複数の時間ブロックのグループ化の方法のステップを示すフローチャート
【図3】同実施の形態3のオーディオ信号符号化方法における複数の時間ブロックのグループ化の方法のステップを示すフローチャート
【図4】同実施の形態4のオーディオ信号符号化方法における複数の時間ブロックのグループ化の方法のステップを示すフローチャート
【図5】AACエンコーダの構成を示すブロック図
【図6】AACにおける短時間ブロックと長時間ブロックの例を説明するための説明図
【図7】AACにおける短時間ブロックのグループ化の例を説明するための説明図
【図8】AACにおけるジョイントステレオ符号化時の短時間ブロックのグループ化の例を説明するための説明図

Claims (5)

  1. オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して符号化する方法であって、隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動を表す統合グループスペクトル変動指標を算出するステップと、隣接するグループで算出される複数の統合グループスペクトル変動指標のうち最小値を算出するステップと、前記最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記最小値に対応するグループを統合するステップとを備えたことを特徴とするオーディオ信号符号化方法。
  2. オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して符号化する方法であって、複数のチャンネルのグループ化を共通に設定する場合に、同じチャンネルにおいて隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動を表す統合グループスペクトル変動指標をチャンネル毎に算出するステップと、各チャンネルの特定の時間ブロック間で算出された統合グループスペクトル変動指標の代表値を複数チャンネル統合グループスペクトル変動指標として算出するステップと、算出される複数の複数チャンネル統合グループスペクトル変動指標のうち最小値を算出するステップと、前記最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記最小値に対応する各チャンネルのグループを統合するステップとを備えたことを特徴とするオーディオ信号符号化方法。
  3. 符号化のビットレートに応じて前記第1の閾値あるいは第2の閾値を設定するステップを備えたことを特徴とする請求項1から請求項2のいずれかに記載のオーディオ信号符号化方法。
  4. オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して符号化するオーディオ信号符号化装置であって、
    隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動を表す統合グループスペクトル変動指標を算出する算出部と、
    隣接するグループで算出される複数の統合グループスペクトル変動指標のうち最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記最小値に対応するグループを統合する統合部と、
    を備えるオーディオ信号符号化装置。
  5. オーディオ信号を時間ブロック単位でスペクトルデータに変換し、複数の時間ブロックのスペクトルデータをグループ化して符号化するオーディオ信号符号化装置であって、
    複数のチャンネルのグループ化を共通に設定する場合に、同じチャンネルにおいて隣接するグループを統合した時の統合したグループに属する時間ブロック間のスペクトルデータの変動を表す統合グループスペクトル変動指標をチャンネル毎に算出する算出部と、
    各チャンネルの特定の時間ブロック間で算出された統合グループスペクトル変動指標の代表値を複数チャンネル統合グループスペクトル変動指標として算出する代表値算出部と、
    算出される複数の複数チャンネル統合グループスペクトル変動指標のうち最小値が第1の閾値以下であるかあるいはグループ数が第2の閾値より大きい場合に前記最小値に対応する各チャンネルのグループを統合する統合部と、
    を備えるオーディオ信号符号化装置。
JP2001296836A 2001-09-27 2001-09-27 オーディオ信号符号化方法 Expired - Fee Related JP4635400B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001296836A JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001296836A JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Publications (3)

Publication Number Publication Date
JP2003108192A JP2003108192A (ja) 2003-04-11
JP2003108192A5 JP2003108192A5 (ja) 2008-02-21
JP4635400B2 true JP4635400B2 (ja) 2011-02-23

Family

ID=19118004

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001296836A Expired - Fee Related JP4635400B2 (ja) 2001-09-27 2001-09-27 オーディオ信号符号化方法

Country Status (1)

Country Link
JP (1) JP4635400B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP5069909B2 (ja) * 2004-01-20 2012-11-07 ドルビー ラボラトリーズ ライセンシング コーポレイション ブロック系列化に基づくオーディオコーディング
EP2040252A4 (en) 2006-07-07 2013-01-09 Nec Corp AUDIO CODING DEVICE, AUDIO CODING METHOD, AND PROGRAM THEREOF

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137497A (ja) * 1998-10-29 2000-05-16 Ricoh Co Ltd デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000137497A (ja) * 1998-10-29 2000-05-16 Ricoh Co Ltd デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001154698A (ja) * 1999-11-29 2001-06-08 Victor Co Of Japan Ltd オーディオ符号化装置及びその方法

Also Published As

Publication number Publication date
JP2003108192A (ja) 2003-04-11

Similar Documents

Publication Publication Date Title
FI112979B (fi) Digitaalisen datan erittäin tehokas koodauslaite
AU733156B2 (en) Audio coding method and apparatus
TWI515720B (zh) 壓縮數位化音訊信號之方法、解碼已編碼壓縮數位化音訊信號之方法、及機器可讀儲存媒體
US7933417B2 (en) Encoding device and decoding device
EP1072036B1 (en) Fast frame optimisation in an audio encoder
TW201503111A (zh) 從高階保真立體音響信號之係數領域表示產生該高階保真立體音響信號之混合空間或係數領域表示之方法及裝置
KR100695125B1 (ko) 디지털 신호 부호화/복호화 방법 및 장치
JP3900000B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP3434260B2 (ja) オーディオ信号符号化方法及び復号化方法、これらの装置及びプログラム記録媒体
KR100477701B1 (ko) Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
US8593321B2 (en) Computation apparatus and method, quantization apparatus and method, and program
JP4062971B2 (ja) オーディオ信号符号化方法
JP2004199075A (ja) ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置
EP1228576B1 (en) Channel coupling for an ac-3 encoder
JPH03121633A (ja) 可聴音信号符号化方法
JP2004309921A (ja) 符号化装置、符号化方法及びプログラム
US8601039B2 (en) Computation apparatus and method, quantization apparatus and method, and program
JP4635400B2 (ja) オーディオ信号符号化方法
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US7181079B2 (en) Time signal analysis and derivation of scale factors
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
US6775587B1 (en) Method of encoding frequency coefficients in an AC-3 encoder
JP2008129250A (ja) Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
JP4369140B2 (ja) オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071225

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071225

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080115

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20091119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees