JP2003015697A - オーディオ符号化用のビット割当て方法 - Google Patents

オーディオ符号化用のビット割当て方法

Info

Publication number
JP2003015697A
JP2003015697A JP2001198502A JP2001198502A JP2003015697A JP 2003015697 A JP2003015697 A JP 2003015697A JP 2001198502 A JP2001198502 A JP 2001198502A JP 2001198502 A JP2001198502 A JP 2001198502A JP 2003015697 A JP2003015697 A JP 2003015697A
Authority
JP
Japan
Prior art keywords
bit allocation
ratio
bit
calculated
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001198502A
Other languages
English (en)
Inventor
Oei Teo Chun
オエイ・テオ チュン
Hon Neo Sua
ホン・ネオ スア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001198502A priority Critical patent/JP2003015697A/ja
Publication of JP2003015697A publication Critical patent/JP2003015697A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 左チャンネルと右チャンネルとの間で必要と
されるビットの割合を効率的に決定するビット割当て方
法を提供する。 【解決手段】 オーディオ圧縮システムに使用されるビ
ット割当て方法において、ステレオチャンネルの左及び
右チャンネルを別個の4領域に分割し、各領域のスペク
トルエリアを算出し、算出されたスペクトルエリアをス
ケールし、左チャンネルと右チャンネルとの間の類似度
を求め、スペクトルエネルギーに関し、上記左チャンネ
ルと右チャンネルとの間の平衡度を求め、ビット割当て
比をスケールするためのスケーリングファクタを決定
し、算出された各パラメータを用いて、ビット割当て比
を算出し、ビット割当て比の上限値及び下限値を決定
し、ビット割当て比の正負符号を決定し、ビット割当て
比を上限値及び下限値に制限し、左及び右チャンネルに
ついて、最終的なビット割当て比を導出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば伝送及びデ
ジタル蓄積媒体用のデジタルオーディオ信号の符号化及
び処理に適用可能であるビット割当て方法に関する。
【0002】
【従来の技術】オーディオの圧縮アルゴリズムにおい
て、特定フレームのオーディオデータを符号化するのに
利用可能なビット数は限られている。それは、音質を決
定する上で、非常に重要な役割を果たすものである。通
常、一定のビットレートの符号化では、一定数のビット
が、符号化用のステレオフレームの各対に割り当てられ
る。これらのビットがステレオ対の各チャンネルへ割り
当てられる又は分配される手法は、1つのチャネルがよ
り多くのビットを用いた場合には、他のチャンネルが、
不十分なビットによって音質に支障を生じることになる
ことからも、音質の一端を担っている。
【0003】ビット割当ての考え方は、符号化が1チャ
ンネル毎を単位として行なわれ、ビット要求条件の前以
ての知識がない場合に、特に重要である。つまり、1つ
のチャンネルが、他のチャンネルに先立ち、まず符号化
される。各チャンネルについてのビット要求条件の前以
ての知識がない場合には、通常、従来技術の場合と同様
に、等しい数のビットが各チャンネルに割り当てられ
る。しかし、異なるチャンネルは異なる特性を有してい
ることからも、この方法が、常に、最良の解決策である
とは限らない。MPEG−2のAAC(Advanced Audio
Coding)では、幾つかのツールが、実際に信号を変化
させ、左チャンネル及び右チャンネルの信号が大きく違
ってくる。このような例は、ミッド/サイド(Mid/Sid
e)符号化ツールやインテンシティステレオ符号化ツー
ルである。これら2つのツールは、信号の1チャンネル
に、信号の特性に基づき、より少ない又はより多くのビ
ットリソース(資源)を必要とするものである。
【0004】MPEG−2のAACのリファレンスソフ
トウェアに用いられる本発明の従来技術が、図4に示さ
れている。これは、非常に簡単なアルゴリズムである。
任意のビットレートについて、各ステレオフレームで利
用可能なビットの数が、まず、決定される(S10
1)。これは、通常、それらが全てのステレオフレーム
について同じであることから、1度のみ決定される。そ
の後、これらの利用可能なビットは、ステレオチャンネ
ルの左チャンネル及び右チャンネルの間で振り分けられ
る(S102)。このことは、全てのフレームについ
て、ビットが常に均等に割り当てられることから、各チ
ャンネルが、同じ数の使用ビットを有することを意味し
ている。
【0005】例として、96kbps/ステレオのビッ
トレートおよび44.1kHzのサンプリング周波数で
のMPEG−2のAACにおいては、左チャンネル及び
右チャンネルの両方に使用されるのに利用可能なビット
の数は、約2226ビットである。したがって、均等に
割り当てた場合、ステレオチャンネルの各々は、以下に
示されるように、1113ビットを有することになる。 利用可能なビット数 = 2226ビット チャンネル数 = 2 左チャンネルビット = 利用可能なビット数/チャン
ネル数 = 2226/2 = 1113ビット 右チャンネルビット = 利用可能なビット数/チャン
ネル数 = 2226/2 = 1113ビット
【0006】
【発明が解決しようとする課題】従来技術は、ビットリ
ソースを左チャンネルと右チャンネルとの間で割り当て
るための非常に簡単な手法を提供しているが、それは、
使用されるべき各ステレオフレームに利用可能な制限さ
れた数のビットを分配する又は割り当てるには有効な解
決法でない。このことは、左チャンネル及び右チャンネ
ルが、帯域幅,スペクトルエネルギー及びその他につい
て不均衡である場合に、一層当てはまる。2つのチャン
ネルが不均衡である場合、ビットの均等な割当てが行な
われることにより、音質及びサウンドイメージングの問
題において、最良の結果はもたらされない。かかる状況
では、1つのチャンネルが、他のチャンネルと比較して
より多くのビット又はより少ないビットを必要とし、そ
の結果、良好なビットの割当てアルゴリズムは、各ステ
レオチャンネルにより使用される利用可能なビットに制
約がある場合に、各チャンネルにどれだけのビットを与
えるかを決定することを必要とされる。
【0007】オーディオ符号化では、その上、左右のチ
ャンネルで不均衡なサウンドが、音源自体により引き起
こされる可能性があり、また、MPEG−1,MPEG
−2及び他の符号化アルゴリズムにおいては、ミッド/
サイド符号化ツール,インテンシティステレオ符号化ツ
ール等の符号化ツールによって、人為的に引き起こされ
る可能性がある。
【0008】ミッド/サイド符号化ツールが用いられる
場合には、ミッド/サイドアルゴリズムの性質のため、
左チャンネル及び右チャンネルが一致する(例えばスピ
ーチ),厳密に正反対である、若しくは、ほぼ一致する
(例えば擬似モノラルサウンド源)と、スペクトルの不
均衡が生じる。ミッドチャンネルは、左及び右チャンネ
ルの合計の平均を求めることにより算出され、また、一
方、サイドチャンネルは、左及び右チャンネルの差の平
均を求めることにより算出される。左チャンネルのスペ
クトルはミッドスペクトルにより置き換えられ、他方、
右チャンネルのスペクトルは、サイドスペクトルにより
置き換えられる。したがって、一致する左及び右スペク
トル(Li及びRi)の場合には、ミッド(左チャンネ
ル)が平均スペクトル値を保持し、他方、サイド(右チ
ャンネル)が0(又は非常に小さな値)となるであろ
う。 左i=ミッドi=(Li+Ri)/2 右i=サイドi=(Li−Ri)/2
【0009】インテンシティステレオが用いられると、
実際の左チャンネルのスペクトルは、インテンシティス
テレオの開始周波数から始まる、新たに計算されたイン
テンシティステレオスペクトル(インテンシティi)に
より、置き換えられることになる。インテンシティステ
レオスペクトルは、いくつかの公式を用いて、左及び右
チャンネルのスペクトル(Li及びRi),左チャンネ
ルのエネルギー(El),左及び右チャンネルの合計の
エネルギー(Es)から導出される。また、実際の右チ
ャンネルのスペクトルが、インテンシティステレオの開
始周波数以上では、ゼロで置き換えられる。0スペクト
ルの置換えは、帯域幅及び総スペクトルエネルギーにつ
いて、左チャンネル及び右チャンネルに差を生じさせ、
不均衡にする。 左i=インテンシティi=(Li+Ri)(El/E
s)1/2 右i=0 以上の内容より、ビットリソースを左チャンネルと右チ
ャンネルとの間で均等に割り当てることは、1つのチャ
ンネルの特性が他のチャンネルと非常に異なることか
ら、最良の解決法をもたらさない。
【0010】本発明は、上記技術的課題に鑑みてなされ
たもので、左チャンネルと右チャンネルとの間で必要と
されるビットの割合を決定するビット割当て方法を提供
することを目的としてなされたものである。
【0011】
【課題を解決するための手段】本願の請求項1に係る発
明は、制限されたビットリソースを割り当てる割合を求
めるオーディオ符号化用のビット割当て方法であり、
a)ステレオチャンネルの左チャンネル及び右チャンネ
ルを別個の4領域に分割するステップと、b)上記各領
域のスペクトルエリアを算出するステップと、c)上記
算出されたスペクトルエリアをスケールするステップ
と、d)上記左チャンネルと右チャンネルとの間の類似
度をあらわす類似ファクタを求めるステップと、e)ス
ペクトルエネルギーに関し、上記左チャンネルと右チャ
ンネルとの間の平衡度をあらわす平衡ファクタを求める
ステップと、f)ビット割当て比をスケールするための
スケーリングファクタを決定するステップと、g)上記
a)〜f)のステップにて算出されたパラメータを用い
て、ビット割当て比を算出するステップと、h)上記ビ
ット割当て比の上限値及び下限値を決定するステップ
と、i)上記ビット割当て比の正負符号を決定するステ
ップと、j)上記ビット割当て比を上記上限値及び下限
値に制限するステップと、k)上記左チャンネル及び右
チャンネルに関して、最終的なビット割当て比を導出す
るステップとを有していることを特徴としたものであ
る。
【0012】また、本願の請求項2に係る発明は、請求
項1に係る発明において、上記a)に記載のステップに
おいて、上記左チャンネルが2つの領域L1及びL2に
分割される一方、上記右チャンネルが2つの領域R1及
びR2に分割され、該領域を分割するポイントが、スペ
クトルの帯域幅内で任意に決定され得ることを特徴とし
たものである。
【0013】更に、本願の請求項3に係る発明は、請求
項2に係る発明において、上記b)に記載のステップに
おいて、上記スペクトルエリアが、各チャンネルが分割
されてなる各領域のスペクトルの絶対値を合計すること
により算出されることを特徴としたものである。
【0014】また、更に、本願の請求項4に係る発明
は、請求項1〜3に係る発明のいずれか一において、上
記c)に記載のステップにて、上記スケーリングが、算
出されたスペクトルエリアを、1.0より小さく該スペ
クトルエリアの規模を圧縮する効果を有する一定値Kで
累乗することにより、算出されることを特徴としたもの
である。
【0015】また、更に、本願の請求項5に係る発明
は、請求項1〜4に係る発明のいずれか一において、上
記d)に記載のステップにて、上記類似ファクタが、右
チャンネル領域1(R1)のスペクトルエリアに対する
左チャンネル領域1(L1)のスペクトルエリアの比を
求めることにより算出されることを特徴としたものであ
る。
【0016】また、更に、本願の請求項6に係る発明
は、請求項1〜5に係る発明のいずれか一において、上
記e)に記載のステップにおいて、上記平衡ファクタ
は、上記右チャンネルのスペクトルエリアに対する左チ
ャンネルのスペクトルエリアの比を求めることにより算
出されることを特徴としたものである。
【0017】また、更に、本願の請求項7に係る発明
は、請求項1〜6に係る発明のいずれか一において、上
記f)に記載のステップにおいて、上記スケーリングフ
ァクタは、符号化装置のビットレート及び類似ファクタ
の値に基づき、選択されることを特徴としたものであ
る。
【0018】また、更に、本願の請求項8に係る発明
は、請求項1〜7に係る発明のいずれか一において、上
記g)に記載のステップにおいて、上記ビット割当て比
が、上記各領域のスケールスペクトルエリア及びスケー
リングファクタを用いて算出されることを特徴としたも
のである。
【0019】また、更に、本願の請求項9に係る発明
は、請求項1〜8に係る発明のいずれか一において、上
記h)に記載のステップにおいて、上記上限値および下
限値が、上記ビット割当て比を、最大値及び最小値内に
制限するために用いられ、上限値および下限値は、符号
化装置のビットレート,上記類似ファクタの値、およ
び、インテンシティステレオツールのような他の符号化
ツールの存在に基づき、選択されることを特徴としたも
のである。
【0020】また、更に、本願の請求項10に係る発明
は、請求項1〜9に係る発明のいずれか一において、上
記i)に記載のステップにおいて、上記ビット割当て比
の正負符号が、現行の上記ビット割当て比の正負符号及
び平衡ファクタの値に基づくことを特徴としたものであ
る。
【0021】また、更に、本願の請求項11に係る発明
は、請求項1〜10に係る発明のいずれか一において、
上記j)に記載のステップにおいて、上記ビット割当て
比の制限が、上記ビット割当て比を、上記上限値及び下
限値と比較することにより行なわれることを特徴とした
ものである。
【0022】また、更に、本願の請求項12に係る発明
は、請求項1〜11に係る発明のいずれか一において、
上記k)に記載のステップにおいて、上記左チャンネル
ビット比が、上記ビット割当て比に1.0を加算するこ
とにより算出され、また、上記右チャンネルビット比
が、値1.0からビット割当て比を引くことにより算出
されることを特徴としたものである。
【0023】本発明は、ステレオチャンネルの各フレー
ムで利用可能なビットを割り当てるための簡単で且つ有
効なアルゴリズムを用いる。これらのビットは、それに
続く量子化処理での、ビットの割当て用に用いられるこ
とになる。上記アルゴリズムは、オーディオ信号のスペ
クトルに基づいて作用する。左及び右チャンネルのスペ
クトルは、4つの領域に分けられる。各領域について、
それぞれのスペクトルエリアが算出される。スケールさ
れたバージョンのスペクトルエリアが、また、その後の
利用のために算出される。左チャンネルは、スペクトル
特性の違い又は類似度に関して、右チャンネルと比較さ
れる。これらのスケールされたスペクトルエリアは、ビ
ット割当て比と呼ばれる比を算出するのに用いられるこ
とになる。この比は、1つのチャンネルに対して、幾つ
のビットが加えられるか、若しくは、引かれるかを決定
するものである。ビットを加える又は引くという決定
は、実施の形態において詳細に説明される幾つかの条件
及び基準に基づく。算出されたビット割当て比は、ま
た、ビットリソースの過剰な割当て若しくは不十分な割
当ての問題が生じることを回避すべく、上限値及び下限
値で境界をなしている。
【0024】この簡単で且つ有効なビット割当ての方法
は、各チャンネルについて必要とされる所望のビット数
の良好な概算値が、ステレオ符号化に際して各チャンネ
ルに割り当てられることを確実にする。それは、また、
良好な音質の実現および維持の確保を助ける。なお、本
願明細書では、本発明に係るビット割当て方法を、ビッ
ト割当てアルゴリズムと呼ぶ。以下の実施の形態は、限
られた数のビットが任意のステレオフレーム用に用いら
れ得る状況において与えられるビット割当て方法を詳細
に説明する。この方法は、マルチチャンネルの用途に容
易に適用可能である。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につい
て、添付図面を参照しながら説明する。ここでは、ビッ
ト割当て方法の詳細を、MPEG−2のAACを例に用
いて説明する。この方法は、また、同様のアプリケーシ
ョンを用いる他のオーディオ符号化アルゴリズムに適用
可能である。本発明の実施の形態の説明は、図1,2及
び3を参照して行なう。
【0026】図1及び2は、本発明に係るビット割当て
方法のフローチャートである。ステレオスペクトルデー
タのフレームが与えられれば、アルゴリズムは、左チャ
ンネル及び右チャンネルを2つの領域に分割することに
より始まる(S201)。分割の態様を、図3に示す。
左チャンネルは、領域L1及び領域L2からなる2つの
領域に分割される。同様に、右チャンネルもまた、領域
R1及び領域R2からなる2つの領域に分割される。領
域の境界である2つの領域が分かれるポイントは、スペ
クトル周波数における、オーディオフレームの帯域幅ま
でのいかなるポイントであってもよい。インテンシティ
ステレオが適用されるMPEG−2のAACの場合に
は、領域境界が、インテンシティステレオの開始周波数
に設定されることになる。これは、インテンシティステ
レオの場合、インテンシティステレオの開始周波数以降
の右チャンネルのスペクトルが0に置き換えられるの
で、領域境界を設定するのに適した位置であるからであ
る。また、このことは、領域R2のエリア「エリアR
2」、及び、それに伴いスケールされた値「スケールエ
リアR2」が0となる結果をもたらす。
【0027】各領域の決定後、各領域のスペクトルエリ
アが算出される(S202)。領域R2におけるスペク
トルデータは全て0であるため、この領域についての全
ての計算は省略可能である。スペクトルエリアは、次の
ように算出され得る。 Mは、領域境界までのスペクトルデータ数であり、N
は、フレーム内のスペクトルデータの総数である。
【0028】次に、各領域のスペクトルエリアが、S2
03において、一定値Kによりスケールされる。Kは、
1.0より小さな値を有し、Kについての典型的な値
は、0.1875である。スケーリングは、次のように
行なわれる。 スケールエリアL1=(エリアL1) スケールエリアL2=(エリアL2) スケールエリアR1=(エリアR1) スケールエリアR2=(エリアR2) ここで、Kは、1.0より小さい。
【0029】次に、左チャンネルのスペクトルと右チャ
ンネルのスペクトルとの間の類似性の度合いが、概算さ
れる(S204)。これは、類似ファクタ(similar fa
ctor)と呼ばれるパラメータを算出することにより行な
われる。類似ファクタは、領域R1における領域L1の
スペクトルエリアの比を求めることにより得られる。こ
のパラメータは、モノラル,擬似モノラル又はモノラル
に近い信号を検出するために用いられる。かかる場合に
は、ミッド/サイド符号化が適用されると、通常、サイ
ドチャンネルが、ミッドチャンネルに比べて小さい。こ
れにより、高い類似ファクタの値が得られる。類似ファ
クタは、次のように算出される。 類似ファクタ=エリアL1/エリアR1
【0030】S205では、平衡ファクタと呼ばれる他
のパラメータが、また、算出される。これは、実質的
に、右チャンネルのスペクトルエリアにおける左チャン
ネルのスペクトルエリアの比である。この目的は、後の
段階において、どのチャンネルにより多くのビットを与
えるかを決定するために、これら2つのチャンネルの割
合を求めることである。平衡ファクタは、次のように算
出される。 平衡ファクタ=(エリアL1+エリアL2)/(エリア
R1+エリアR2)
【0031】S204にて算出される類似ファクタ,S
205にて算出される平衡ファクタ、及び、現行の符号
化ビットレートに基づき、付加ビット比スケールと呼ば
れるスケーリングファクタが算出される(S206)。
任意の符号化ビットレートに関し、類似ファクタがある
閾値よりも小さい場合には、異なる付加ビット比スケー
ルが、次のように設定される。右チャンネルのスペクト
ルエリアが左チャンネルよりも大きい場合には、付加ビ
ット比スケールが、負の値で上書きされる。これは、次
に示すように、平衡ファクタがある閾値比よりも小さい
場合に対応する。類似ファクタ<SIMILAR_FA
CTOR_THRESHOLD1、且つ、ビットレート
<90000bps/ステレオである場合、 付加ビット比スケール=0.75 類似ファクタ<SIMILAR_FACTOR_THR
ESHOLD2、且つ、ビットレート<120000b
ps/ステレオである場合、 付加ビット比スケール=0.45 類似ファクタ<SIMILAR_FACTOR_THR
ESHOLD3である場合、 付加ビット比スケール=0.35 その他の場合、 付加ビット比スケール=1.0 また、平衡ファクタ<BALANCED_RATIOで
ある場合、 付加ビット比スケール=−0.2 ここで、SIMILAR_FACTOR_THRESH
OLD1=20.0 SIMILAR_FACTOR_THRESHOLD2
=32.0 SIMILAR_FACTOR_THRESHOLD3
=50.0 BALANCED_RATIO=0.9である。
【0032】必要なパラメータが算出されれば、付加ビ
ット比を表すパラメータである「付加ビット比」が決定
され得る(S207)。ステレオチャンネルの各々が、
オーディオデータの任意のフレーム用に使用される、
1.0のビットリソースの比を有しているとすれば、付
加ビット比が、1つのチャンネルに与えられる若しくは
そこから引かれるビットの数を比の観点から決定するの
に用いられる。この付加ビット比は、1.0よりも小さ
い値を有している。付加ビット比が、S216及び21
7並びに次の式において示されるようにして、割り当て
られる。次に、付加ビット比が、予め決定された、左チ
ャンネル,右チャンネルのスケールエリア及び付加ビッ
ト比スケールを用いて、導出される式を示す。 総スケールエリア=スケールエリアL1+スケールエリ
アL2+スケールエリアR1+スケールエリアR2 付加ビット比=(1.0−2.0×(スケールエリアR
1+スケールエリアR2)/総スケールエリア)×付加
ビット比スケール
【0033】通常、付加ビット比は、変更されずに、そ
のまま用いられる。しかし、その符号が反転されなけれ
ばならない状況がある(S211)。この状況は、付加
ビット比が正である(S210)が、平衡ファクタが規
定された閾値より小さい(S209)場合に生じる。こ
のことは、付加ビット比が、より多くのビットが左チャ
ンネルに割り当てられる必要があることをあらわす一方
で、平衡ファクタがその反対の事柄をあらわすことを意
味している。この場合、平衡ファクタは、左チャンネル
及び右チャンネルが不均衡であること、及び、右チャン
ネルが実際に左チャンネルよりもより多くのビット又は
リソースを要することを示している。
【0034】このような状況では、次に示すように、平
衡ファクタが優先され、付加ビット比の符号が反転され
る。 付加ビット比>0、且つ、平衡ファクタ<BALANC
ED_RATIOである場合、 付加ビット比=−付加ビット比
【0035】付加ビット比を過剰に若しくは不足して割
り当てないように、付加ビット比の最大値及び最小値
が、深刻に不十分なビットの問題が生じないように、設
定される必要がある(S208)。ここでは、最大値を
「最大付加ビット比」と呼び、他方、最小値を「最小付
加ビット比」と呼ぶ。これらの制限値は、次に示すよう
に、類似ファクタの値,ビットレート、及び、インテン
シティステレオが存在するか否かに基づいて、設定され
る。類似ファクタ<SIMILAR_FACTOR_T
HRESHOLD1、且つ、ビットレート<90000
bps/ステレオである場合、 最大付加ビット比=0.71 類似ファクタ≧SIMILAR_FACTOR_THR
ESHOLD1、且つ、ビットレート<90000bp
s/ステレオである場合、 最大付加ビット比=0.80 類似ファクタ<SIMILAR_FACTOR_THR
ESHOLD2、且つ、ビットレート<120000b
ps/ステレオである場合、 最大付加ビット比=0.49 類似ファクタ≧SIMILAR_FACTOR_THR
ESHOLD2、且つ、ビットレート<120000b
ps/ステレオである場合、 最大付加ビット比=0.60 類似ファクタ<SIMILAR_FACTOR_THR
ESHOLD3である場合、 最大付加ビット比=0.28 類似ファクタ≧SIMILAR_FACTOR_THR
ESHOLD3である場合、 最大付加ビット比=0.50 一方、「最小付加ビット比」に関しては、インテンシテ
ィステレオが存在する場合、 最小付加ビット比=−0.2 その他の場合、 最小付加ビット比=−0.5
【0036】付加ビット比が算出された後、この値は、
最大値及び最小値と比較される(それぞれS212及び
S214)。付加ビット比が最大値を越えると、最大値
以上は切り捨てられる(S213)。同様に、付加ビッ
ト比が最小値より小さい場合には、最小値以下が切り捨
てられる(S215)。すなわち、付加ビット比≧0で
ある場合、 付加ビット比=最小(付加ビット比,最大付加ビット
比) その他の場合、 付加ビット比=最大(付加ビット比,最小付加ビット
比) ここで、最小(付加ビット比,最大付加ビット比)及び
最大(付加ビット比,最小付加ビット比)は、それぞ
れ、( )内の値の最小値および最大値を表す。
【0037】最後に、各チャンネルに付与されるビット
の数が、比の観点から、次のように算出される。左チャ
ンネルに関して、最終的なビット比を得るために、付加
ビット比が、初期のビット比1.0に加算される(S2
16)。右チャンネルに関して、最終的なビット比を得
るために、付加ビット比が、初期のビット比1.0から
引かれる(S217)。 左ビット比=1.0+付加ビット比 右ビット比=1.0−付加ビット比 =2.0−左ビット比
【0038】例として、96kbps/ステレオのビッ
トレート及び44.1kHzのサンプリング周波数での
MPEG−2のAACにおいては、左チャンネル及び右
チャンネルの両方により使用されるのに利用可能なビッ
トの数は、約2226ビットである。このことは、全て
のステレオフレームについて同様である。最初に、各チ
ャンネルが、均等なビットの割合で割り当てられる、す
なわち、各チャンネルが、使用に適した1113ビット
を有することになる。付加ビット比が0.3と算出され
ると仮定すると、次に示すように、左チャンネルは、
1.3の左ビット比を有し、他方、右チャンネルは、
0.7の右ビット比を有することになる。 左ビット比=1.0+0.3 =1.3 右ビット比=1.0−0.3 =0.7
【0039】その結果、各チャンネルに割り当てられる
ビットの実際の数が、左チャンネルに関して1447ビ
ット、また、右チャンネルに関して779ビットとな
る。 利用可能なビット=2226ビット チャンネル数=2 左チャンネル利用可能ビット=利用可能なビット/チャ
ンネル数 =2226/2 =1113ビット 右チャンネル利用可能ビット=左チャンネル利用可能ビ
ット =1113ビット 左チャンネルビット=左ビット比×左チャンネル利用可
能ビット =1.3×1113 =1447ビット 右チャンネルビット=右ビット比×右チャンネル利用可
能ビット =利用可能ビット−左チャンネルビット =779ビット
【0040】なお、本発明は、例示された実施の形態に
限定されるものでなく、本発明の要旨を逸脱しない範囲
において、種々の改良及び設計上の変更が可能であるこ
とは言うまでもない。
【0041】
【発明の効果】以上の説明から明らかなように、本発明
に開示される方法によれば、利用可能なビットの数が限
られるという制限のもとで、ステレオ符号化処理におい
て、各チャンネルに必要とされるビット数を良好に概算
することができる。これにより、左チャンネルと右チャ
ンネルとの間の音質に釣合いがとられ、一方のチャンネ
ルが他方よりも悪く聞えることはない。また、これによ
って、音質が改良される。ビット割当て方法の実現に必
要な論理は、非常に簡単で且つ有用である。この方法
は、マルチチャンネル及び同様の技術を用いる他のオー
ディオ符号化アルゴリズムに容易に適用され得る。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係るビット割当て処理
についての第1フローチャートである。
【図2】 上記ビット割当て処理についての第2フロー
チャート。
【図3】 周波数スペクトル係数を領域に分割する態様
を示す図。
【図4】 従来技術のビット割当て処理についてのフロ
ーチャート。
【符号の説明】
S201…スペクトル分割ステップ S202…スペクトルエリア算出ステップ S203…スペクトルエリアスケールステップ S204…類似度算出ステップ S205…平衡度算出ステップ S206…スケーリングファクタ決定ステップ S207…ビット割当て比算出ステップ S208…上限値及び下限値決定ステップ S210…ビット割当て比の正負符号決定ステップ S213,S215…ビット割当て比制限ステップ S216,S217…最終ビット割当て比導出ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スア ホン・ネオ シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 Fターム(参考) 5D045 DA20 5J064 AA02 BA15 BB12 BC21 BC23 BC26 BC29 BD02 BD03

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 制限されたビットリソースを割り当てる
    割合を求めるオーディオ符号化用のビット割当て方法に
    おいて、 a)ステレオチャンネルの左チャンネル及び右チャンネ
    ルを別個の4領域に分割するステップと、 b)上記各領域のスペクトルエリアを算出するステップ
    と、 c)上記算出されたスペクトルエリアをスケールするス
    テップと、 d)上記左チャンネルと右チャンネルとの間の類似度を
    あらわす類似ファクタを求めるステップと、 e)上記左チャンネルと右チャンネルとの間の平衡度を
    あらわす平衡ファクタをスペクトルエネルギーに基づい
    て求めるステップと、 f)ビット割当て比をスケールするためのスケーリング
    ファクタを決定するステップと、 g)上記a)〜f)のステップにて算出されたパラメー
    タを用いて、ビット割当て比を算出するステップと、 h)上記ビット割当て比の上限値及び下限値を決定する
    ステップと、 i)上記ビット割当て比の正負符号を決定するステップ
    と、 j)上記ビット割当て比を上記上限値及び下限値に制限
    するステップと、 k)上記左チャンネル及び右チャンネルに関して、最終
    的なビット割当て比を導出するステップとを有している
    ことを特徴とするビット割当て方法。
  2. 【請求項2】 上記a)に記載のステップにおいて、上
    記左チャンネルが2つの領域L1及びL2に分割される
    一方、上記右チャンネルが2つの領域R1及びR2に分
    割され、該領域を分割するポイントが、スペクトルの帯
    域幅内で任意に決定され得ることを特徴とする請求項1
    記載のビット割当て方法。
  3. 【請求項3】 上記b)に記載のステップにおいて、上
    記スペクトルエリアが、各チャンネルが分割されてなる
    各領域のスペクトルの絶対値を合計することにより算出
    されることを特徴とする請求項2記載のビット割当て方
    法。
  4. 【請求項4】 上記c)に記載のステップにおいて、上
    記スケーリングが、算出されたスペクトルエリアを、
    1.0より小さく該スペクトルエリアの大きさを圧縮す
    る効果を有する一定値Kで累乗することにより、算出さ
    れることを特徴とする請求項1〜3のいずれか一に記載
    のビット割当て方法。
  5. 【請求項5】 上記d)に記載のステップにおいて、上
    記類似ファクタが、右チャンネル領域1(R1)のスペ
    クトルエリアに対する左チャンネル領域1(L1)のス
    ペクトルエリアの比を求めることにより算出されること
    を特徴とする請求項1〜4のいずれか一に記載のビット
    割当て方法。
  6. 【請求項6】 上記e)に記載のステップにおいて、上
    記平衡ファクタが、上記右チャンネルのスペクトルエリ
    アに対する左チャンネルのスペクトルエリアの比を求め
    ることにより算出されることを特徴とする請求項1〜5
    のいずれか一に記載のビット割当て方法。
  7. 【請求項7】 上記f)に記載のステップにおいて、上
    記スケーリングファクタが、符号化装置のビットレート
    及び類似ファクタの値に基づき、選択されることを特徴
    とする請求項1〜6のいずれか一に記載のビット割当て
    方法。
  8. 【請求項8】 上記g)に記載のステップにおいて、上
    記ビット割当て比が、スケールされた上記各領域のスペ
    クトルエリア及びスケーリングファクタを用いて算出さ
    れることを特徴とする請求項1〜7のいずれか一に記載
    のビット割当て方法。
  9. 【請求項9】 上記h)に記載のステップにおいて、上
    記上限値および下限値が、上記ビット割当て比を、最大
    値及び最小値内に制限するために用いられ、該上限値お
    よび下限値は、符号化装置のビットレート,上記類似フ
    ァクタの値、および、インテンシティステレオツールの
    ような他の符号化ツールの存在に基づき、選択されるこ
    とを特徴とする請求項1〜8のいずれか一に記載のビッ
    ト割当て方法。
  10. 【請求項10】 上記i)に記載のステップにおいて、
    上記ビット割当て比の正負符号が、現行の上記ビット割
    当て比の正負符号及び平衡ファクタの値に基づくことを
    特徴とする請求項1〜9のいずれか一に記載のビット割
    当て方法。
  11. 【請求項11】 上記j)に記載のステップにおいて、
    上記ビット割当て比の制限が、上記ビット割当て比を、
    上記上限値及び下限値と比較することにより行なわれる
    ことを特徴とする請求項1〜10のいずれか一に記載の
    ビット割当て方法。
  12. 【請求項12】 上記k)に記載のステップにおいて、
    上記左チャンネルビット比が、上記ビット割当て比に
    1.0を加算することにより算出され、また、上記右チ
    ャンネルビット比が、値1.0からビット割当て比を引
    くことにより算出されることを特徴とする請求項1〜1
    1のいずれか一に記載のビット割当て方法。
JP2001198502A 2001-06-29 2001-06-29 オーディオ符号化用のビット割当て方法 Pending JP2003015697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001198502A JP2003015697A (ja) 2001-06-29 2001-06-29 オーディオ符号化用のビット割当て方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001198502A JP2003015697A (ja) 2001-06-29 2001-06-29 オーディオ符号化用のビット割当て方法

Publications (1)

Publication Number Publication Date
JP2003015697A true JP2003015697A (ja) 2003-01-17

Family

ID=19035943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001198502A Pending JP2003015697A (ja) 2001-06-29 2001-06-29 オーディオ符号化用のビット割当て方法

Country Status (1)

Country Link
JP (1) JP2003015697A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019087B2 (en) 2004-08-31 2011-09-13 Panasonic Corporation Stereo signal generating apparatus and stereo signal generating method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019087B2 (en) 2004-08-31 2011-09-13 Panasonic Corporation Stereo signal generating apparatus and stereo signal generating method
JP4832305B2 (ja) * 2004-08-31 2011-12-07 パナソニック株式会社 ステレオ信号生成装置およびステレオ信号生成方法

Similar Documents

Publication Publication Date Title
RU2586011C2 (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
TWI325697B (en) Multi-pass video encoding
JP5583881B2 (ja) オーディオ信号の変換方法及び変換装置、オーディオ信号の適応的符号化方法及び適応的符号化装置
JP4794452B2 (ja) オーディオ符号化におけるmdctデータに基づくウィンドウタイプ決定方法
RU2628898C1 (ru) Неравномерное квантование параметров для усовершенствованной связи
JP2004264810A (ja) マルチチャネルオーディオのエンコーディングおよびデコーディング
JP2001236099A (ja) 知覚品質の一貫性を改善する知覚音声符号器ビット割付けスキーム
JP2019215558A (ja) 符号化方法、装置、プログラム及び記録媒体
US8576910B2 (en) Parameter selection method, parameter selection apparatus, program, and recording medium
JP4750707B2 (ja) オーディオ符号化におけるショートウィンドウグループ化方法
US8593321B2 (en) Computation apparatus and method, quantization apparatus and method, and program
WO2011097912A1 (zh) 一种多声道信号编码方法、解码方法、装置和系统
JP2021081753A (ja) 音場の高次アンビソニックス表現を符号化するために必要とされるサイド情報の符号化を改善する方法および装置
Bauer et al. Joint optimization of scale factors and Huffman code books for MPEG-4 AAC
JP2003015697A (ja) オーディオ符号化用のビット割当て方法
US8601039B2 (en) Computation apparatus and method, quantization apparatus and method, and program
US20090067737A1 (en) Coding apparatus, coding method, decoding apparatus, decoding method, and program
JP4062971B2 (ja) オーディオ信号符号化方法
JP2008160535A (ja) 符号化伝送方法、その装置、そのプログラム、およびその記録媒体
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
US8502708B2 (en) Encoding method and decoding method, and devices, program and recording medium for the same
CN116406471A (zh) 包括主要输入声道和两个或更多个经缩放的非主要输入声道的下混合的多声道音频信号的编码
JP3597750B2 (ja) グループ化方法及びグループ化装置
JP2003195894A (ja) 符号化装置、復号化装置、符号化方法、及び復号化方法
KR20180104220A (ko) 변환블록 분할 정보를 이용한 비디오 압축 디블럭킹 복호화 계산량 균형 방법 및 장치