JP3597750B2 - グループ化方法及びグループ化装置 - Google Patents

グループ化方法及びグループ化装置 Download PDF

Info

Publication number
JP3597750B2
JP3597750B2 JP2000109276A JP2000109276A JP3597750B2 JP 3597750 B2 JP3597750 B2 JP 3597750B2 JP 2000109276 A JP2000109276 A JP 2000109276A JP 2000109276 A JP2000109276 A JP 2000109276A JP 3597750 B2 JP3597750 B2 JP 3597750B2
Authority
JP
Japan
Prior art keywords
window
grouping
spectral
partition
short block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000109276A
Other languages
English (en)
Other versions
JP2001296893A (ja
Inventor
ユエン ロニー・ヤング クム
ホン・ネオ スア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2000109276A priority Critical patent/JP3597750B2/ja
Publication of JP2001296893A publication Critical patent/JP2001296893A/ja
Application granted granted Critical
Publication of JP3597750B2 publication Critical patent/JP3597750B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ディジタルな電送及び格納のためのディジタルオーディオ信号符号化において、短ブロックウィンドウをグループ化するための方法及び装置に関するものである。
【0002】
【従来の技術】
ディジタルオーディオ圧縮技法の目的は、オーディオデータ格納要件を減少させるか、伝送時間を減少させ、同時に知覚情報を保存することである。良質の圧縮技法が使用されると、聞き手は、一般に、元のオーディオシーケンスと圧縮されたオーディオシーケンスを区別するのは難しい。種々のオーディオ符号化規格が豊富に存在する。それらの例としては、ISO/IEC 11172−3 MPEG−1 Audio Layer−2、ISO/IEC 13818−7 MPEG−2 Advanced Audio Coding(AAC)、及びAdvanced Transform Acoustic Coding(ATRAC)がある。以下の背景情報は、MPEG−2 AACのコンテキストにおける短ブロックグループ化の目的と使用を説明する。ここに提供された情報はグループ化を用いる他のオーディオ符号化技法にも適用可能である。
【0003】
オーディオ符号化の過程は、オーディオ情報のストリームを複数のフレームに区分化することを含む。この信号の性質に依存して、オーディオ符号器のブロックサイズ決定モジュールは、異なった変換長の2つのタイプのウィンドウを使用して、データの時間解像度及び周波数解像度を変化させることができる。短い方の変換長のウィンドウは、フレームの持続時間に渉ってオーディオデータの特徴にかなり変化がある場合に使用される。このウィンドウタイプは、周波数解像度を犠牲にして良い時間解像度を提供する。AACのコンテキストにおいて、このウインドウは短ウィンドウと名付けられる。8個の等しい短ウィンドウが一つのオーディオフレームを形成する。他のオーディオ符号化技法においては、この
短い変換長のウィンドウの数はこれとは異なることもある。
【0004】
量子化の後、ビットは尺度係数を符号化するために割り当てられる。グループ化の機構は、引き続く短ブロックウィンドウが尺度係数バンド係数を共有し、その結果符号化ビットの節約を得る事を容易にするために用いられる。言い換えれば、グループ化は、あたかも只一つのウィンドウが存在するかのように、グループ化されたすべてのウィンドウに対して、尺度係数の只一つの集合を使用することを可能にする。これらの尺度係数は、グループ化されたこれらすべてのウィンドウにおける対応するスペクトルデータに適用される。グループサイズは、2個のウィンドウから最大8個のウィンドウに至る。グループ化の機構なしには、8個のウィンドウのそれぞれの副情報は、別々に符号化されなければならない。これは非能率的である。グループ化は符号化されるオーディオビットストリームにおける短ブロック副情報を表現するのに必要なビット数を節約する。
【0005】
短ブロックウィンドウグループ化のファシリティは、ISO/IEC 13818−7 MPEG−2 AACのセクション3(規格部)とアネックスB(通知部)に説明されている。しかし、特定のグループ化戦略は述べられていないし推薦されていない。
【0006】
スペクトルデータの2個又はそれ以上の集合を符号化する際に一つの尺度係数を使用することは、オーディオ符号化システム内のブロック浮動演算のコンテキストにおいて、米国特許No.5,264,846に引用されている。このブロック浮動演算過程は、スペクトルデータを、予め決定された周波数バンドに対応するブロックに分割する。各ブロックはさらに一つ又はそれ以上の部分ブロックに分割される。各部分ブロックにおける標本の最大の絶対値が見つけられる。1つのブロック内の部分ブロックピークの間の差が計算される。もしこれらピークの間の差がある固定された値を超えるならば、別の尺度係数が各部分ブロックに割り当てられる。従って、各部分ブロックはその最適尺度係数を用いて量子化される。このことは、そのブロックにおけるスペクトル成分によって表現される信号部分は高い調子の性質を持っていることを示す。他方、調性が低い時には、前記ピーク間の差は前記固定された値より低い。この場合には、考慮されている部分ブロックの間の最大の尺度係数が量子化のため使用される。
【0007】
従って、ピークスペクトルレヴェルがある固定された値域内にあるような部分ブロックは同じ尺度係数を共有し、それによって、出力ビットストリームに含まれるべき尺度係数の数を減少させ、その結果符号化ビットを節約する。部分ブロックの間で一つの尺度係数の使用を共有することの根拠は、それらのピーク値が前もって決められた範囲内にあることである。もし非常に異なったピーク値を持った部分ブロックが最大のピークの尺度係数を使用して量子化されれば、量子化雑音が生じる。これは、量子化ステップが信号に比べて相対的に大きいという事実に基づく。
【0008】
図1〜図3は、上に述べた従来技術の作用の一例を示す。それは3つのダイアグラムからなる。図1中のダイアグラムは、部分ブロックのピーク差が前記固定値を越え、このブロック内に2個の別の尺度係数の使用が必要とされる場合を示す。図2中のダイアグラムは、ピーク差がこの固定値より小さい場合を図解する。したがって、この場合には、ブロック全体に渉って只一つの尺度計数値が使用される。図3中のダイアグラムに示されている場合には、部分ブロック1と3の間のピーク差は固定値より小さい。従って、これら2個の部分ブロックには同じ尺度係数が割り当てられる。一方部分ブロック2はそれ自身の尺度係数を持つ。図解のため、示されているステップサイズはピーク値を2の3乗で割ることにより決定され、この値は仮説的に割り当てられるビット数3に対応する。
【0009】
前記従来技術においては、同じ様なピークスペクトルを持つ部分ブロックに、同じ尺度係数が割り当てられる。本発明においては、同じようなスペクトルプロファイルを持つ短ブロックウィンドウは同じグループにまとめられる。
【0010】
前記従来技術は、スペクトルデータのグループに最適な尺度係数を割り当てる。それは、尺度係数の割り当て手段として、各グループのスペクトルデータのピーク値を使用する。この方法は、隣接する部分ブロックのスペクトルデータプロファイルを比較するための簡単な接近法を表現する。AACのコンテキストにおいて、同様の概念が短ブロックウィンドウグループ化において用いられる。グループ化は副情報が保存されるように短ブロックウィンドウを合併する。短ブロックウィンドウを合併する決定は、単にピークスペクトル値でなく、各ブロック内のスペクトルデータ内容の性質に基づく。これはスペクトルデータのグループを組み合わせる、従来技術に表現されている方法の拡張である。
【0011】
前記従来技術も本発明もともに、隣接するグループ又はウィンドウのスペクトルデータを比較し、従来技術の場合には尺度係数の共有に、AACの場合には短ブロックウィンドウのグループ化に導く。従来技術は、尺度係数がスペクトルグループの間で共有されるべきかどうかを決定する手段として、単に部分ブロック内のピークスペクトル値をのみ利用する。もしAACグループ化における決定手段として、従来技術の方法が使われるならば、グループ化の性能は貧しいものとなろう。
【0012】
【発明が解決しようとする課題】
引き続く短ブロックにおける尺度係数バンド係数はグループ化を通じて合併することができる。この結果、このグループ内の尺度係数バンドの間で尺度係数が共有される。もしこのグループがいくつかのウィンドウを含めば、副情報のいくつかの集合の代わりに、只一つの集合だけがこれらの係数を表現するため必要となる。この結果、必要な副情報ビットの量が減少する。符号化ビットは、貴重な資源であり、特に低いビットレートにおいてそうである。グループ化が提供するビット節約は実質的であり、特に多くの短ブロックを必要とするオーディオシーケンスにとってそうである。
【0013】
しかし、グループ化が適切に行われなければ、非常に異なった最適尺度係数要件を持ったウィンドウが合併される可能性がある。尺度係数のそのような共有は、ある種のスペクトルの歪みを不必要に下げる効果を持つ。このことは、より多くのビットが、ある歪みレヴェルに要求されるより以上に、量子化の間にこれらのスペクトルに割り当てられなければならないことを意味する。この場合には、より多くの量子化ビットが消費される必要があるかもしれない。副情報ビットの節約と量子化ビットの節約の間には引き替え関係がある。従って、使用されるべきグループ化の戦略はビットの最も能率的な使用をもたらさなければならない。
【0014】
【課題を解決するための手段】
上記の問題を解決する目的のため、適応的スペクトル面積プロファイルグループ化の本アルゴリズムが発明された。スペクトル係数のほとんど同じ分布を持った短ブロックウィンドウは、一つのグループに合併される。言い換えれば、周波数スペクトル上の信号のプロファイルがグループ化の係数を導く手段として使用される。信号のプロファイルとは、異なる周波数における信号の強度のことである。2つのウィンドウがグループに合併されるためには、それらの周波数プロファイルがかなり似ていることが必要である。
【0015】
提案される本方法は、周波数スペクトルをいくつかのパーティションに分割する。パーティションは同じサイズであっても良いし、ある周波数領域を強調する異なったサイズであっても良い。それぞれのパーティションは従って周波数のある小さい範囲を表現する。フレーム内のすべての短ブロックウィンドウは同じようにパーティションに分割される。グループ化決定過程の間、各パーティション内の内容は他のウィンドウにおける対応するパーティションの内容と比較される。パーティションスペクトル面積が、これはこのパーティション内のすべてのスペクトル値の絶対値の和であるが、1つの測度として用いられる。このようにして、短ブロックウィンドウの間の周波数成分の大きさと分布の類似性が容易に決定される。スペクトル面積差の実際のスペクトル面積に対する比が予め決定された比閾値と比較される。もしこの差が相対的に大きい、すなわち、この比が比閾値を越えるならば、それは対応するパーティションのスペクトル内容が異なることを意味する。2つの短ブロックウィンドウが合併されるためには、それらのパーティションがある程度合致しなければならない。この程度は前記予め決定された比閾値によって制御される。
【0016】
本発明は短ブロックウィンドウスペクトルをパーティションに分割する手段、各パーティション内のスペクトル面積を計算する手段、ウィンドウの間で対応するスペクトルを比較する手段、比較される二つのパーティションが類似しているかどうかを判定する手段、異なったパーティションの対の数を数え、この数を閾値と比較する手段、スペクトルの類似性に基づいて、グループ化がウィンドウ間に起こるべきかどうかを判定する手段、及びAACビットストリーム要素を設定し得られたグループ化構成を表現する手段からなる方法を提供する。
【0017】
本発明は、短ブロックウィンドウスペクトルをパーティションに分割する区分化モジュール、パーティションスペクトル面積を計算する計算モジュール、グループ化作用のために検査すべき一対の短ブロックを選択するウィンドウ選択管理部、短ブロックウィンドウの間でパーティションスペクトル面積の差を評価する比較モジュール、グループ化を短ブロックウィンドウの間で実行すべきかどうかを決定するグループ化決定モジュール、及び関連するオーディオビットストリーム要素を設定し、導かれたグループ化の構成を反映させるビットストリームフォーマティング部分モジュールから構成される装置の形態において実現されることができる。
【0018】
本発明は、多用途のスペクトル面積プロファイル比較アルゴリズムを使用して短ブロックウィンドウをグループ化する。それはグループ化のため考慮されているウィンドウのスペクトル面積プロファイルをチェックし比較する方法からなる。能率的な計算のために、各ウィンドウ内のスペクトルデータはパーティションに分割される。各パーティションは周波数スペクトルの一部を表現する。考慮されている2つのウィンドウの間でそれらのすべての対応するパーティション(i番目とi番目)が比較される。もしそれらがかなり類似しているならば、これら2つのウィンドウは1つのグループに合併される。比較演算は、スペクトル面積の計算からなり、この計算は単に各パーティション内におけるスペクトルの大きさの和である。
【0019】
これらの計算された面積の相対的な差は比閾値と比較される。もしこの相対的な差がこの閾値を超えるならば、これら2つのパーティションは非類似的と見なされる。非類似的なパーティションの対の数が知らされる。もしこの数がもう一つの閾値を越えるならば、これらのウィンドウはグループに合併されない。この第2の閾値は使用されるパーティションの数に依存する。この第2の閾値の目的は、パーティションの大多数はある程度まで合致しなければならないが、一部のパーティションは異なることを許容することである。パーティションの数を増加させれば、より多くの比較と判定演算が必要となるので、計算時間が増加する。
【0020】
【発明の実施の形態】
適応的なスペクトル面積プロファイルグループ化法は、ISO/IEC 13818−7 MPEG−2 AAC規格に従ってオーディオデータを複合化する際に使用することができる。本発明の詳細な説明は、図4、図5及び図6に関して提供される。図4は本発明の一般的フローチャートをAAC符号化のコンテキストにおいて示す。短ブロックウィンドウスペクトルのパーティションへの分割は図5に表示されている一方、図6は実際の信号のグループ化の構成を示す。本発明は、他のオーディオ符号化技法においても同様に使用されることができる。以下の説明は、本発明が短ブロックウィンドウのグループ化にどのように関わっているかに言及している。
【0021】
本発明の第一義的機能は、制限されたビット資源の使用を減少させることである。時間領域オーディオデータは最初に複数のフレームに区分化される。オーディオ内容に依存して、各フレームはLONG_WINDOW、LONG_START_WINDOW、LONG_STOP_WINDOW、及びSHORT_WINDOWに分類される。SHORT_WINDOWとして分類されたフレームのみグループ化作用のため考慮される。
【0022】
グループ化は、時間領域データが周波数領域スペクトルデータ300に変換された後行われる。各SHORT_WINDOWフレームは8個の短ブロックウィンドウを含む。各ウィンドウは128個のスペクトル要素からなり、全周波数スペクトルを表現する。これらの要素は8個の等しいパーティション301に分割される(ステップS200)。各パーティションはある周波数領域を覆う。パーティションの数は変化させることができる。パーティションの数を増加させれば、より正確なスペクトル面積プロファイルの照合を得ることができるが、より多くの計算資源を使用しなければならない。更に、ある周波数領域の重要性を強調するため、個々のパーティションのサイズを変化させることもできる。すべてのウィンドウは同じようにパーティションに分割される。
【0023】
次に、前記8個のすべての短ブロックウィンドウにおけるパーティション内部のスペクトル面積を得る(ステップS201)。このスペクトル面積計算は一つのパーティション内のすべてのスペクトル値の絶対値の和を取ることを含む。次のCコードは本実施例を説明する。
【0024】
Figure 0003597750
Figure 0003597750
【0027】
上記コード断片において、windowはフレームにおける短ブロックウィンドウの数を表す。windowOffsetは各ウインドウにおける最初のスペクトル要素のインデックスを格納する。specArea[][]はフレームのすべての短ブロックウィンドウにおけるすべてのパーティションのスペクトル面積を格納するために使用される2次元アレーである。partitionはスペクトル面積が現に計算されているパーティションの番号を追跡するために使用される。PARTITION_COUNTは一つのウィンドウ内のパーティションの数を表す。boundary[]は各パーティションの開始位置のインデックスを含むアレーである。そのサイズは、パーティションの数に依存する。
【0028】
隣接する短ブロックウィンドウのスペクトル面積プロファイルにおける類似性は、グループ化決定のためのベースとして使用される。本方法は、第1から第8ウィンドウまで次々とプロファイルを操作する。第1ウィンドウのプロファイルは第2ウィンドウのプロファイルと比較される。もしそれらのプロファイルが非常に類似しているならば、それらは一つのグループに合併される。この場合に、第1のウィンドウは、他のウィンドウがそれと比較されるウィンドウであるため、参照ウィンドウと名付けられる(ステップS202)。第2ウィンドウは現ウィンドウと名付けられる(ステップS202)。
【0029】
第1と第2ウィンドウがグループ化された後、第3ウィンドウが現ウィンドウになり、第1ウィンドウはそのまま参照ウィンドウとしてとどまる。スペクトルスペクトル面積プロファイルの比較は、それから、第1と第3ウィンドウの間で、すなわち参照ウィンドウと現ウィンドウの間で行われる。もしこれらのウィンドウのプロファイルが互いに密接に合致するならば、グループが行われ(ステップS207)、このグループは3個のウィンドウに拡張する。第4ウィンドウが新しい現ウィンドウになる(ステップS208)。他方もし第1と第3ウィンドウのプロファイルが異なっていれば、グループ化は行われない(ステップS209)。グループ化はそれから、第3ウィンドウを参照ウィンドウとして割り当て、第4ウィンドウを現ウィンドウとして割り当て(ステップS210)、再び始められる。以上のプロセスはフレームの8個のウィンドウすべてが検討されるまで進行する。
【0030】
スペクトル面積プロファイル照合作用は参照及び現ウィンドウの間で、すべてのパーティションスペクトル面積を比較することを含む。前記コードにおいて、diffPartAreaは参照及び現ウィンドウの間で、対応するパーティションのスペクトル面積の差の絶対値を表現する(ステップS203)。この面積差絶対値の、参照ウィンドウにおけるパーティションのスペクトル面積に対する比がAREA_THRESHOLDと比較される(ステップS204)。この閾値はグループ化の決定において使用されるスペクトル面積類似性の程度を決定する。もし面積差が相対的に大きければ、前記比がAREA_THRESHOLDより大きくなり、変数numThresholdViolateが1だけインクリメントされる。このことは、現在比較されている二つのパーティションが互いに充分異なっていることを意味する。numThresholdViolateはそのようなパーティションの対の数を数えるために使用されている(ステップS205)。それは、参照及び現ウィンドウの一対が検討される前に常にリセットされる。
【0031】
すべての対応するパーティションの対が検査された後、numThesholdViolenceの値がVIOLATE_THRESHOLDと比較される(ステップS206)。閾値違反の数を追跡する目的は、1つのウィンドウのいくつかのパーティションがそれぞれ合併されるもう1つのウィンドウの対応するパーティションとかなり異なっていることを許容するためである。グループ化の決定は、スペクトル面積プロファイルが一般に類似しているウィンドウを合併する。もし一つのウィンドウの大多数のパーティションのスペクトル面積がもう1つのウィンドウの対応するパーティションのスペクトル面積とそれぞれ合致すれば実行される。対応するパーティションの一部の対が面積プロファイルの一般的傾向に従わなくても、合併が許容される。この一部を示す小さなパーセント値がVIOLATE_THRESHOLD値の設定に反映される。
【0032】
実験的結果はnumThresholdViolateに小さな許容を与えることはグループ化作用の能率及び効果を妨げないことを示す。このVIOLATE_THRESHOLD値パーティションの数PARTITION_COUNTに依存する。目下のコンテキストにおいては、PARTITION_COUNTの値8に対して、VIOLATE_THRESHOLD値は2である。グループ化はnumThresholdViolate値がVIOLATE_THRESHOLD値より小さいかそれに等しいときに実行される。それ以外の時には、グループ化は実行されない。上記スペクトル面積計算、比率計算、及び閾値チェックの演算はすべてのウィンドウが検査されるまで続けられる(ステップS211)。
【0033】
アルゴリズムの検証及び閾値調整はいくつかの方法で達成される。一つの接近法は、スペクトルデータプロファイル及びグループ化の結果を、表示器において観察し検討することである。SHORT_WINDOWフレームにおけるすべてのスペクトル要素は対数演算20.0*log(スペクトルデータ要素)に従う。この演算は、スペクトルデータの動的領域を圧縮し、観察を容易にする。スペクトルデータが対数形式で表現されれば、求めるグループ化を視覚的に決定するのは易しい。閾値は、行われるグループ化が視覚的な検査結果に対応するように、閾値を調整することができる。
【0034】
グループ化プロセスの間、MPEG−2 AAC要素、num_window_groups及びwindow_group_length[]は各SHORT_WINDOWに対して設定される。num_window_groupsはフレーム内のグループの数を表す。一方window_group_length[]アレーは各グループ内のウィンドウの数を表す。この第1アレー要素は、第1グループのウィンドウ数を表す。前記コードはこれらのAAC要素がグループ化演算の間に設定される様子を示す。
【0035】
グループの数は最初に1に初期化される。第1グループは只一つのウィンドウを含むように設定される。グループ化が行われると、現在のグループにおけるウィンドウの数は1だけインクリメントされる。グループ化が必要とされず、更に別のウィンドウが検討されるときには、現在のグループのサイズは1に設定され、グループカウントは1だけインクリメントされる。グループカウントをインクリメントすれば、もう1つのグループが作られ、このグループは1つ又はそれ以上のウィンドウを含むことができる。
【0036】
図6は、実際の信号に本アルゴリズムが適用されたときにもたらされたグループ化の結果を示す。このグループ化の結果は対数領域におけるスペクトルデータに関して示されている。このダイアグラムの下半分は、短ブロックウィンドウ、グループ、及びフレームの境界を示す。各フレーム内において、かなり類似したスペクトルプロファイルを共有する短ブロックウィンドウのグループを視覚的に特定することができる。これら特定されたグループは本方法によって生成された結果と良好に相関する。
【0037】
【発明の効果】
本発明は短ブロックウィンドウをグループ化する能率的かつ効果的な手段を提供する。それは、副情報ビット要件を下げることによって、短ブロックウィンドウを符号化するために必要とされるビットの量を減少させる。更に、それはまた、非常に異なったスペクトル内容を有するウィンドウが合併され、尺度係数の符号化に際して不必要に多くのビットを使用しなければならないようなグループ化が行われないように保証する。本発明は、符号化ビットをより能率的に使用するようにし、それによってより多くのビットが量子化のために利用できるようにし音質を高めることができる。本方法の複雑性は低い。それは多くのメモリ及び計算資源を必要としない。このことは、本方法がオーディオ符号器の低コストのLSI実施化を許容する。
【0038】
以上は本発明の単に例示的な実施例を開示し説明する。本技術に習熟した者は、このような議論及び、添付の図面と請求項から、種々の変化、変更、及び変動が、本発明の精神と範囲からはずれることなく、為されることができることを容易に理解するであろう。
【図面の簡単な説明】
【図1】従来技術を図解するダイアグラムである。
【図2】従来技術を図解するもう1つのダイアグラムである。
【図3】従来技術を図解するさらなるダイアグラムである。
【図4】本実施例を図解するフローチャート。
【図5】短ブロックウィンドウスペクトルを分割することを示すダイアグラム。
【図6】実際の信号のグループ化構成を示すダイアグラム。

Claims (10)

  1. オーディオ符号器のために複数の短ブロックウィンドウをグループ化するグループ化方法であって、
    前記短ブロックウィンドウのスペクトルデータをパーティションに区分化するステップと、
    前記パーティションのスペクトル面積を計算するステップと、
    前記グループ化のため検査されるべき前記短ブロックウィンドウの対を選択するステップと、
    前記短ブロックウィンドウの前記対の間の前記パーティションの前記スペクトル面積を比較するステップと、
    前記グループ化を決定するステップと、
    分割されたグループ化構成を反映するように、関連するオーディオビットストリーム要素を設定するステップとを含み、
    前記パーティションの前記スペクトル面積を比較するステップは、
    前記グループ化を決定するステップのために考慮されている参照ウィンドウと現ウィンドウの、対応するパーティションにおけるスペクトル面積の差の絶対値を計算するステップと、
    前記スペクトル面積の差の絶対値の、前記参照ウィンドウの対応するパーティションにおけるスペクトル面積に対する、比を計算するステップと、
    前記比をある比閾値と比較するステップと、
    前記参照ウィンドウと前記現ウィンドウにおける前記パーティションのすべての対に対して、以上のステップを繰り返すステップとを含み、
    前記グループ化を決定するステップは、
    前記比が前記比閾値を越える前記パーティションの前記対の数を数えるステップと、
    前記数をある計数閾値と比較するステップと、
    前記数が前記計数閾値以下の時に前記グループ化を実行するステップと、
    前記数が前記計数閾値を超えるときに、前記グループ化のための検査のため、次のウィンドウの対に進むステップとを含むことを特徴とするグループ化方法。
  2. 前記区分化するステップが、前記スペクトルデータを、等しいサイズ又は異なるサイズであり得る前記パーティションに分割し、すべての前記短ブロックウィンドウにおける前記スペクトルデータが同じように区分化されることを特徴とする、請求項1に記載のグループ化方法。
  3. 前記パーティションの前記スペクトル面積のそれぞれは、前記パーティションのそれぞれの内部における、前記スペクトルデータの値の絶対値の合計であることを特徴とする、請求項1に記載のグループ化方法。
  4. 前記短ブロックウィンドウの対を選択するステップが、
    前記短ブロックウィンドウを最初のウィンドウから最後のウィンドウまで時間的に順序づけるステップと、
    前記スペクトル面積を比較するステップのために、参照ウィンドウと現ウィンドウを割り当てるステップと、
    すべての前記短ブロックウィンドウが検査されるまで、前記グループ化を決定するステップの作用の結果に依存して、前記参照ウィンドウと前記現ウィンドウを新しく割り当てるステップとで構成されることを特徴とする、請求項1に記載のグループ化方法。
  5. 前記参照ウィンドウと前記現ウィンドウを割り当てるステップが、
    前記パーティションの前記スペクトル面積を比較するステップのため、前記最初のウィンドウを前記参照ウィンドウとして設定し、第2のウィンドウを前記現ウィンドウとして設定するステップと、
    前記参照ウィンドウと前記現ウィンドウの前記グループ化の状態を得るステップと、
    前記グループ化が成功したときに、前記参照ウィンドウをそのまま維持し、前記現ウィンドウを次の隣接するウィンドウに変更するステップと、
    前記グループ化が不成功であるときに、以前の現ウィンドウを新しい前記参照ウィンドウとして割り当て、前記現ウィンドウを次の隣接するウィンドウに変更するステップと、
    前記グループ化を決定するステップが前記最後のウィンドウを検査したときに、前記割り当て及び前記変更するステップを中止するステップとで構成されることを特徴とする、請求項4に記載のグループ化方法。
  6. オーディオ符号器のために複数の短ブロックウィンドウをグループ化するためのグループ化装置であって、
    前記短ブロックウィンドウのスペクトルデータをパーティションに区分化する区分化モジュールと、
    パーティションスペクトル面積計算モジュールと、
    前記グループ化のため検査されるべき前記短ブロックウィンドウの対を選択するウィンドウ選択管理部と、
    パーティションスペクトル面積比較モジュールと、
    グループ化決定モジュールと、
    分割されたグループ化構成を反映するように、関連するオーディオビットストリーム要素を設定する手段とを含み、
    前記パーティションスペクトル面積比較モジュールは、
    前記グループ化を決定するステップのために考慮されている参照ウィンドウと現ウィンドウの、対応するパーティションにおけるスペクトル面積の差の絶対値を計算する手段と、
    前記スペクトル面積の差の絶対値の、前記参照ウィンドウの対応するパーティションにおけるスペクトル面積に対する、比を計算する手段と、
    前記比をある比閾値と比較する手段と、
    前記参照ウィンドウと前記現ウィンドウにおける前記パーティションのすべての対に対して、以上の作用を繰り返す手段とを含み、
    前記グループ化決定モジュールは、
    前記比が前記比閾値を越える前記パーティションの前記対の数を数える手段と、
    前記数をある計数閾値と比較する手段と、
    前記数が前記計数閾値以下の時に前記グループ化を実行する手段と、
    前記数が前記計数閾値を超えるときに、前記グループ化のための検査のため、次のウィンドウの対に進む手段とを含むことを特徴とするグループ化装置。
  7. 前記区分化モジュールが、前記スペクトルデータを、等しいサイズ又は異なるサイズであり得る前記パーティションに分割し、すべての前記短ブロックウィンドウにおける前記スペクトルデータが同じように区分化されることを特徴とする、請求項に記載のグループ化装置。
  8. 前記パーティションスペクトル面積計算モジュールは、前記パーティションのそれぞれの内部における、前記スペクトルデータの値の絶対値の合計を計算することを特徴とする、請求項に記載のグループ化装置。
  9. 前記ウィンドウ選択管理部が、
    前記短ブロックウィンドウを最初のウィンドウから最後のウィンドウまで時間的に順序づける手段と、
    前記パーティションスペクトル面積比較モジュールのため、参照ウィンドウと現ウィンドウを割り当てる手段と、
    すべての前記短ブロックウィンドウが検査されるまで、前記グループ化決定モジュールの作用の結果に依存して、前記参照ウィンドウと前記現ウィンドウを新しく割り当てる手段とで構成されることを特徴とする、請求項に記載のグループ化装置。
  10. 前記参照ウィンドウと前記現ウィンドウを割り当てる手段が、
    前記パーティションスペクトル面積比較モジュールのため、前記最初のウィンドウを前記参照ウィンドウとして設定し、第2のウィンドウを前記現ウィンドウとして設定する手段と、
    前記参照ウィンドウと前記現ウィンドウの前記グループ化の状態を得る手段と、
    前記グループ化が成功したときに、前記参照ウィンドウをそのまま維持し、前記現ウィンドウを次の隣接するウィンドウに変更する手段と、
    前記グループ化が不成功であるときに、以前の現ウィンドウを新しい前記参照ウィンドウとして割り当て、前記現ウィンドウを次の隣接するウィンドウに変更する手段と、
    前記グループ化を前記グループ化決定モジュールが前記最後のウィンドウを検査したときに、前記割り当て及び前記変更する作用を中止する手段とで構成されることを特徴とする、請求項に記載のグループ化装置。
JP2000109276A 2000-04-11 2000-04-11 グループ化方法及びグループ化装置 Expired - Fee Related JP3597750B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000109276A JP3597750B2 (ja) 2000-04-11 2000-04-11 グループ化方法及びグループ化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000109276A JP3597750B2 (ja) 2000-04-11 2000-04-11 グループ化方法及びグループ化装置

Publications (2)

Publication Number Publication Date
JP2001296893A JP2001296893A (ja) 2001-10-26
JP3597750B2 true JP3597750B2 (ja) 2004-12-08

Family

ID=18621986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000109276A Expired - Fee Related JP3597750B2 (ja) 2000-04-11 2000-04-11 グループ化方法及びグループ化装置

Country Status (1)

Country Link
JP (1) JP3597750B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60208426T2 (de) 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
ES2299998T3 (es) * 2004-01-20 2008-06-01 Dolby Laboratories Licensing Corporation Codificacion de audio basada en agrupamiento de bloques.

Also Published As

Publication number Publication date
JP2001296893A (ja) 2001-10-26

Similar Documents

Publication Publication Date Title
US7181404B2 (en) Method and apparatus for audio compression
US6345246B1 (en) Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
EP2991075B1 (en) Speech coding method and speech coding apparatus
US8744841B2 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
KR101157930B1 (ko) 오디오 인코딩에서 mdct 데이터에 기초한 윈도우 유형의 결정 방법
CN109313908B (zh) 用于对音频信号进行编码的音频编码器以及方法
US6915255B2 (en) Apparatus, method, and computer program product for encoding audio signal
US6772111B2 (en) Digital audio coding apparatus, method and computer readable medium
CN1121620A (zh) 音频信号编码/译码方法
KR20030068716A (ko) 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템
US7283968B2 (en) Method for grouping short windows in audio encoding
JP3597750B2 (ja) グループ化方法及びグループ化装置
JPH05173599A (ja) 音声符号復号化装置
US7650277B2 (en) System, method, and apparatus for fast quantization in perceptual audio coders
Truman et al. Efficient bit allocation, quantization, and coding in an audio distribution system
JP2003345398A (ja) オーディオ信号符号化方法
JP3813025B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2006126372A (ja) オーディオ信号符号化装置、方法及びプログラム
RU2684576C1 (ru) Способ выделения сегментов обработки речи на основе последовательного статистического анализа
Hu et al. An efficient low complexity encoder for MPEG advanced audio coding
Nosirov et al. The fractal method of compression of broadband audio signals
JP2003108192A (ja) オーディオ信号符号化方法
JP2000206990A (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees