JP5379871B2 - オーディオ符号化のための量子化 - Google Patents

オーディオ符号化のための量子化 Download PDF

Info

Publication number
JP5379871B2
JP5379871B2 JP2011552875A JP2011552875A JP5379871B2 JP 5379871 B2 JP5379871 B2 JP 5379871B2 JP 2011552875 A JP2011552875 A JP 2011552875A JP 2011552875 A JP2011552875 A JP 2011552875A JP 5379871 B2 JP5379871 B2 JP 5379871B2
Authority
JP
Japan
Prior art keywords
value
frame
frequency spectrum
scale factor
band scale
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011552875A
Other languages
English (en)
Other versions
JP2012519309A (ja
Inventor
バン・ゼミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Core Logic Inc
Original Assignee
Core Logic Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Core Logic Inc filed Critical Core Logic Inc
Publication of JP2012519309A publication Critical patent/JP2012519309A/ja
Application granted granted Critical
Publication of JP5379871B2 publication Critical patent/JP5379871B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ符号化技術に関するものである。
一般に、MPEG(Moving Picture Experts Group)オーディオ符号化は、高品質及び高能率の符号化のためのISO/IECの標準方式である。MPEGオーディオ符号化方法は、ISO/IEC SC29/WG11に設置されたMPEG内で動画符号化と並行して標準化された。MPEGオーディオ符号化は、高い圧縮率を実現しながらも、主観的な音質の損失を最小化することに重点を置いた符号化標準である。
MPEGオーディオ符号化は、多様な方式を使用して符号化中に生成される量子化雑音を聴取者が知覚できないようにする。例えば、MPEGオーディオ符号化は、人間の知覚特性を反映し、知覚的重複性を除去することによって、符号化後にも良い音質を維持できるように心理音響モデルを使用する。心理音響モデルを使用するオーディオ符号化器は、オーディオ信号を聞く人間の聴覚特性を用いて人間が知覚しにくい詳細な情報は符号化時に省略することによって、符号量を節減し、高能率の圧縮を実現する。
心理音響モデルを使用するオーディオ符号化器は、人間が聞き取れる音の最小レベルである最小可聴限界(Threshold in Quite)、及びいずれかの音によって特定しきい値以下の小さい音が遮られる効果であるマスキング効果を用いる。例えば、心理音響モデルを使用するオーディオ符号化器は、人間が聞き取りにくい非常に低いか非常に高い周波数成分は符号化過程で除外することができ、いずれかの周波数成分によって遮られる周波数成分は本来より低い精度で符号化することもできる。
心理音響モデルを使用するオーディオ符号化器は、このような心理音響モデルを基盤にして計算される値を使用してデータの量子化及び符号化を行う。例えば、MPEGオーディオ符号化器は、時間ドメインのオーディオデータを周波数ドメインのオーディオデータに変換した後、心理音響モデルモジュールを用いて各周波数バンド別最大許容雑音の量、すなわち、最大許容歪を求め、これに基づいて量子化及び符号化を行う。
本発明が解決しようとする技術的課題は、オーディオデータの量子化に使用するための全帯域スケールファクターの初期値を実際の全帯域スケールファクターの値と最大限近接するように予め設定し、量子化時のループ繰り返し回数を大幅に減少できる技術、システム及び装置を提供することにある。
このような技術的課題を解決するために、本発明の一側面では、オーディオ符号化器の量子化方法を提供する。前記オーディオ符号化器の量子化方法は、外部から受信される第1のフレームの周波数スペクトルデータを分析し、前記第1のフレームの最大周波数スペクトル絶対値を算出すること;前記第1のフレームの最大周波数スペクトル絶対値及び以前に算出された第2のフレームの最大周波数スペクトル絶対値に基づいて前記第1のフレームの量子化に使用するための全帯域スケールファクターの初期値を設定すること;及び前記の設定された全帯域スケールファクターの初期値に基づいて前記第1のフレームの周波数スペクトルデータを量子化することを含む。
前記第1のフレームの最大周波数スペクトル絶対値を算出することは、前記第1のフレームの周波数スペクトルデータのうち絶対値が最も大きい部分の絶対値を算出することを含むことができる。
前記全帯域スケールファクターの初期値を設定することは、特定の比較アルゴリズムを使用して、前記第1のフレームの最大周波数スペクトル絶対値を前記第2のフレームの最大周波数スペクトル絶対値と比較すること;及び前記比較の結果値に対応する算出アルゴリズムを使用して、前記第1のフレームの量子化に使用するための全帯域スケールファクターの初期値を算出することを含む。
前記第1のフレームの最大周波数スペクトル絶対値を前記第2のフレームの最大周波数スペクトル絶対値と比較することは、前記第1のフレームの最大周波数スペクトル絶対値に2進ログを適用して第1の2進ログ値を算出すること;前記第2のフレームの最大周波数スペクトル絶対値に2進ログを適用して第2の2進ログ値を算出すること;及び前記第1の2進ログ値と前記第2の2進ログ値との差値を算出することを含むことができる。
前記全帯域スケールファクターの初期値を設定することは、前記第1の2進ログ値と前記第2の2進ログ値との差値に対応する算出アルゴリズムを抽出すること;及び前記の抽出された算出アルゴリズムを使用して前記全帯域スケールファクターの初期値を算出することを含むこともできる。前記算出アルゴリズムを抽出することは、前記第1の2進ログ値と前記第2の2進ログ値との差値を少なくとも一つの定数値と比較することを含むことができる。
前記全帯域スケールファクターの初期値を算出することは、前記第2のフレームの全帯域スケールファクターの値、前記第1の2進ログ値から前記第2の2進ログ値を差し引いた値、特定の定数値のうち少なくともいずれか一つを使用して演算を行うことを含むことができる。
上述したオーディオデータの量子化方法は、前記の算出される前記第1のフレームの最大周波数スペクトル絶対値が0である場合、予め設定された定数値を前記第1のフレームの全帯域スケールファクターの初期値として設定することをさらに含むこともできる。
前記オーディオデータの量子化方法は、前記の量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整することをさらに含むこともできる。前記全帯域スケールファクターを調整することは、前記の量子化されたデータを符号化したデータの使用ビット数を計算すること;前記の計算された使用ビット数と前記可用ビット数とを比較すること;及び前記使用ビット数が前記可用ビット数を超える場合、前記全帯域スケールファクターを調整することを含むことができる。
前記オーディオデータの量子化方法は、前記可用ビット数から前記使用ビット数を差し引いた値が特定しきい値を超えないように前記全帯域スケールファクターを調整することをさらに含むこともできる。
前記オーディオデータの量子化方法は、前記第1のフレームの周波数スペクトルデータの各周波数バンドの歪が前記各周波数バンドの許容歪を超えないように前記各周波数バンドに対応するバンドスケールファクターを調整することをさらに含むこともできる。
一方、本発明の他の側面では、外部から受信される第1のフレームの周波数スペクトルデータの量子化に使用するための全帯域スケールファクターの初期値を設定する方法を提供する。前記方法は、前記第1のフレームのブロックタイプが前記第1のフレームの以前のフレームである第2のフレームのブロックタイプと異なっているかどうかを判断すること;及び前記第1のフレームのブロックタイプが前記第2のフレームのブロックタイプと異なっている場合、特定の定数値を前記全帯域スケールファクターの初期値として設定し、前記第1のフレームのブロックタイプが前記第2のフレームのブロックタイプと同一である場合、前記第1のフレーム及び第2のフレームの最大周波数スペクトル絶対値に基づいて前記全帯域スケールファクターの初期値を算出することを含むことができる。
一方、上述した本発明の技術的課題を解決するために、本発明の更に他の側面では、オーディオ符号化器の量子化装置を提供する。前記量子化装置は、外部から受信されるフレーム単位の周波数スペクトルデータを分析することによって、それぞれのフレームに対する最大周波数スペクトル絶対値を算出し、前記の算出された最大周波数スペクトル絶対値のフレーム間の変化度によって各フレームの全帯域スケールファクターの初期値を設定する初期値設定モジュール;及び前記初期値設定モジュールによって設定された全帯域スケールファクターの初期値に基づいて量子化を行い、前記の量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する少なくとも一つの機能モジュールを含むことができる。
前記初期値設定モジュールは、現在のフレームの最大周波数スペクトル絶対値と以前のフレームの最大周波数スペクトル絶対値を算出し、前記現在のフレームの最大周波数スペクトル絶対値と以前のフレームの最大周波数スペクトル絶対値を特定の比較アルゴリズムを使用して比較する。
前記初期値設定モジュールは、前記現在のフレームの最大周波数スペクトル絶対値に2進ログを適用して第1の2進ログ値を算出し、前記以前のフレームの最大周波数スペクトル絶対値に2進ログを適用して第2の2進ログ値を算出することができる。また、前記初期値設定モジュールは、前記第1の2進ログ値と第2の2進ログ値との差値によって前記現在のフレームの全帯域スケールファクターの初期値を算出するための算出アルゴリズムを抽出することができる。
前記少なくとも一つの機能モジュールは、前記現在のフレームの全帯域スケールファクターの初期値に基づいて前記現在のフレームの周波数スペクトルデータを量子化する量子化モジュール;及び前記量子化モジュールによって量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する内部ループモジュールを含むことができる。前記内部ループモジュールは、前記可用ビット数と前記使用ビット数との差値が特定しきい値を超えないように前記全帯域スケールファクターを調整することができる。
以上説明したように、本発明によると、フレームの周波数スペクトルデータを量子化するための全帯域スケールファクターの初期値を実際の全帯域スケールファクターの値に最大限近接するように予め設定することができる。したがって、量子化時に全帯域スケールファクターを調整するためのループの繰り返し回数を減少させ、オーディオ符号化器の演算量の負担を大幅に減少させることができる。
心理音響モデルを使用するオーディオ符号化器の通常の量子化過程を説明するためのフローチャートである。 本発明の好適な実施例に係る量子化方法を実現するための量子化装置を含むオーディオ符号化器の構成を示すブロック図である。 図2に示されている量子化部の詳細構成を示すブロック図である。 本発明の好適な実施例に係る量子化方法を説明するためのフローチャートである。 フレーム別の最大周波数スペクトル絶対値の2進ログ値とフレーム別に量子化に使用された実際の全帯域スケールファクターの決定値とを比較して示すグラフである。 各フレーム別の周波数スペクトルデータの量子化に使用された実際の全帯域スケールファクターの決定値を示すグラフである。 上述した全帯域スケールファクターの初期値推定方法によって推定された各フレーム別の全帯域スケールファクターの初期値を示すグラフである。 図6に示されている全帯域スケールファクターの値と図7に示されている全帯域スケールファクターの初期値とを比較して示すグラフである。
以下、本発明の属する分野で通常の知識を有する者が本発明を容易に実施できるように本発明の好適な実施例を添付の図面を参照して詳細に説明する。以下で説明する本発明の好適な実施例では、内容の明瞭性のために特定の技術用語を使用する。しかし、本発明は、その選択された特定用語に限定されるものではなく、それぞれの特定用語が類似する目的を達成するために類似する方式で動作する全ての技術同義語を含むことを予め明らかにしておく。
図1は、心理音響モデルを使用するオーディオ符号化器の通常の量子化過程を説明するためのフローチャートである。
従来のオーディオ符号化器は、周波数ドメインのデータを量子化するために多段階ループを行う。前記多段階ループは、内部ループ(Inner Loop、IL)及び外部ループ(Outer Loop、OL)を含むことができる。
内部ループ(IL)では、フレーム単位で受信される周波数ドメインのデータを全帯域スケールファクター及びバンドスケールファクターを使用して量子化し(段階:S1)、量子化されたデータを符号化したときのビット数、すなわち、使用ビット数が可用ビット数を超えないように全帯域スケールファクターを調整する(段階:S2〜S4)。また、外部ループ(OL)では、各周波数バンドの歪が許容歪を超えないようにバンドスケールファクターを調整する(段階:S5〜S7)。
上述したように、量子化過程時、内部ループでは、量子化されたデータを符号化したときの使用ビット数を可用ビット数と比較する過程を行う。このとき、前記使用ビット数は、量子化されたデータを符号化したときに算出可能であるので、毎ループごとに符号化過程が連係されなければならない。その理由は、全帯域スケールファクターの変化によって量子化されたデータはループごとに変わり、その結果、コードワード及びコードワードの長さが変わるためである。
このように、従来のオーディオ符号化器の量子化プロセスは、最適な値を得るまで外部ループと内部ループを複数回繰り返して行い、特に、内部ループは、毎ループごとに量子化データ及びその量子化されたデータを符号化したデータに基づく計算過程を含んでいるので、相当多くの演算が伴う。したがって、このような内部ループのループ繰り返し回数が多くなると、量子化及び符号化回数が増加し、オーディオ符号化器の演算量が過度に増加する。そして、このような演算量の増加は、結局、全体の符号化プロセスの遂行時間を遅延させ、ハードウェア資源にも過度の負担を与える原因となる。
図2は、本発明の好適な実施例に係る量子化方法を実現するための量子化装置を含むオーディオ符号化器の構成を示すブロック図である。
図2に示すように、オーディオ符号化器100は、外部から入力される時間ドメインのオーディオデータ、例えば、PCM(Pulse Code Modulation)データをフレーム単位で受信し、これを処理した後、特定フォーマットの符号化されたビットストリームを出力する。
このようなオーディオ符号化器100は、フィルターバンク部10、MDCT(Modified Discrete Cosine Transform)部20、FFT(Fast Fourier Transform)部30、心理音響モデル部40、量子化部50、符号化部60及びビットストリーム出力部70などを備えることができる。
フィルターバンク部10は、外部から入力される時間ドメインのオーディオデータをフレーム単位で受信し、周波数ドメインのオーディオデータ、すなわち、周波数スペクトルデータに変換し、変換されたフレーム単位の周波数スペクトルデータを多数の周波数バンドに細分化する。例えば、フィルターバンク部10は、オーディオデータの統計的な重複性を除去するために、フレーム単位の周波数スペクトルデータを、例えば、32個のサーブバンドに細分化することができる。
FFT部30は、外部から入力される時間ドメインのオーディオデータを周波数スペクトルデータに変換し、変換された周波数スペクトルデータを心理音響モデル部40に伝送する。
心理音響モデル部40は、人間の聴覚特性による知覚的な重複性を除去するために、FFT部30から伝送される周波数スペクトルデータを受信し、それぞれの周波数バンドに対する許容歪を計算する。このとき、前記許容歪とは、人の聴力が認知できないほどの歪のうち最大に許容可能な歪を意味することができる。心理音響モデル部40は、前記の計算される周波数バンド別の許容歪を量子化部50に提供することができる。
一方、心理音響モデル部40は、知覚エネルギーを計算してウィンドウスイッチングの可否を決定し、ウィンドウスイッチング情報をMDCT部20に伝送することができる。フレームのブロックタイプは、大きく四つに区分することができる。例えば、オーディオ信号が急激に変わる部分のフレームはショートブロック(Short Block)と称し、オーディオ信号の変化が急激でない部分のフレームはロングブロック(Long Block)と称し、ロングブロックからショートブロックに変わる部分のフレームはロングストップブロック(Long Stop Block)と称し、ショートブロックからロングブロックに変わる部分のフレームはロングスタートブロック(Long Start Block)と称することができる。
前記心理音響モデル部40は、現在処理されるフレームのブロックタイプがショートブロックであるか、ロングブロックであるか、ロングストップブロックである、それともロングスタートブロックであるかによってそれぞれショートウィンドウ、ロングウィンドウ、ロングストップウィンドウ、ロングスタートウィンドウを適用することを示すウィンドウスイッチング情報を出力することができる。
MDCT部20は、周波数スペクトルデータの分解能を増加させるために、フィルターバンク部10によって多数の周波数バンドに分割された周波数スペクトルデータを、心理音響モデル部40から受信されるウィンドウスイッチング情報によってさらに細分化して出力する。例えば、MDCT部20は、ウィンドウスイッチング情報がロングウィンドウを示す場合、36ポイントのMDCTを使用して既に分割された32個の周波数バンドよりも細密に周波数スペクトルデータを分割することができる。または、MDCT部20は、ウィンドウスイッチング情報がショートウィンドウを示す場合、例えば、12ポイントのMDCTを使用して32個の周波数バンドよりも細密に周波数スペクトルデータを分割することもできる。
量子化部50は、MDCT部20から伝送されるフレーム単位の周波数スペクトルデータを受信して量子化を行うことができる。また、周波数スペクトルデータを量子化した後、量子化されたデータを符号化したデータの使用ビット数が許容された可用ビット数を超えないように全帯域スケールファクターを調整することができ、周波数スペクトルデータの各周波数バンドの歪が許容歪を超えないようにバンドスケールファクターを調整することができる。
一方、量子化部50は、全帯域スケールファクター及びバンドスケールファクターの調整のためのループの繰り返し回数を減少させるために、周波数スペクトルデータの量子化を行う前に、量子化に実際に使用する全帯域スケールファクターの値とほぼ同じ全帯域スケールファクターの初期値を予め設定する。このとき、量子化部50は、フレーム間の最大周波数スペクトル絶対値の変化度に基づいて全帯域スケールファクターの初期値を推定することによって、全帯域スケールファクターの初期値を予め設定することができる。
符号化部60は、量子化部50によって量子化されたデータを符号化する機能を行うことができる。ビットストリーム出力部70は、符号化部60によって符号化されたデータを特定規格、例えば、MPEG2などによって規定されたビットストリームフォーマットにフォーマッティングした後、ビットストリームを出力することができる。
図3は、図2に示されている量子化部50の詳細構成を示すブロック図である。
図2〜図3を参照すると、量子化部50は、初期値設定モジュール54、量子化モジュール52、内部ループモジュール56及び外部ループモジュール58などを含むことができる。
初期値設定モジュール54は、フレーム間の最大周波数スペクトル絶対値の変化度に基づいて全帯域スケールファクターの初期値を推定し、その値を設定する機能を行う。前記最大周波数スペクトル絶対値とは、フレームの周波数スペクトルデータの絶対値のうち最も大きい値を意味する。例えば、前記最大周波数スペクトル絶対値は、フレームの周波数スペクトルデータに含まれている多数の周波数バンドのうち最も大きい絶対値を有する周波数バンドの絶対値を意味することができる。
初期値設定モジュール54は、MDCT部20から量子化モジュール52に受信されるフレーム単位の周波数スペクトルデータを分析し、該当フレームの最大周波数スペクトル絶対値を求めた後、前記フレームの最大周波数スペクトル絶対値を前記フレームの以前に処理されたフレームの最大周波数スペクトル絶対値と特定アルゴリズムを使用して比較することができる。
例えば、初期値設定モジュール54は、現在MDCT部20から受信されるフレームの周波数スペクトルデータを分析し、現在のフレームの最大周波数スペクトル絶対値を求め、これを予め定められた特定の比較アルゴリズムを使用して以前のフレーム(すなわち、現在のフレームの以前に処理されたフレーム)の最大周波数スペクトル絶対値と比較することができる。このとき、前記以前のフレームの最大周波数スペクトル絶対値は、以前のフレームの量子化を行う前に既に求められたものである。
初期値設定モジュール54は、前記比較アルゴリズムを使用した比較結果値によって特定算出アルゴリズムを使用して現在のフレームの周波数スペクトルデータを量子化するのに使用する全帯域スケールファクターの初期値を算出する。すなわち、初期値設定モジュール54は、現在のフレームの周波数スペクトル絶対値が以前のフレームの周波数スペクトル絶対値に比べてどれだけ変化したかによって該当の算出アルゴリズムを適用し、全帯域スケールファクターの初期値を算出する。
前記初期値設定モジュール54は、前記比較アルゴリズムを使用した比較結果値に対応する算出アルゴリズムを予めテーブルの形態で格納することができる。このような全帯域スケールファクターの初期値を設定する過程は、後で再び詳細に説明することにする。一方、初期値設定モジュール54は、内部ループモジュール56の動作に必要なフラグ(Flag)の初期値をセッティングすることもできる。
量子化モジュール52は、MDCT部20から伝送されるフレーム単位の周波数スペクトルデータを受信して量子化を行うことができる。量子化時、量子化モジュール52は、内部ループモジュール56によって調整される全帯域スケールファクター及び外部ループモジュール58によって調整されるバンドスケールファクターを使用することができる。
内部ループモジュール56は、量子化モジュール52及び符号化部60と連係して全帯域スケールファクターを調整する内部ループを行う。例えば、内部ループモジュール56は、量子化モジュール52を制御して量子化が行われるようにし、量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する過程を行うことができる。前記内部ループモジュール56によって最初に行われる内部ループでは、量子化時に前記初期値設定モジュールによって設定された全帯域スケールファクターの初期値を全帯域スケールファクターとして使用することができる。
一方、内部ループモジュール56は、前記使用ビット数が可用ビット数を超えない場合、可用ビット数と使用ビット数との差が特定しきい値を超えないように全帯域スケールファクターを2次的に調整することもできる。例えば、内部ループモジュール56は、可用ビット数から使用ビット数を差し引いた値を予め設定されたしきい値と比較し、可用ビット数から使用ビット数を差し引いた値が前記しきい値を超える場合、全帯域スケールファクターを調整することができる。
外部ループモジュール58は、周波数スペクトルデータのそれぞれの周波数バンドの歪が該当の周波数バンドの許容歪を超えないようにバンドスケールファクターを調整する機能を行う。例えば、外部ループモジュール58は、周波数スペクトルデータの各周波数バンドの歪を計算し、計算された各周波数バンドの歪を心理音響モデル部40から伝送された許容歪と比較し、計算された歪が許容歪を超える場合、該当のバンドスケールファクターを調整する機能を行うことができる。
以上では、本発明の好適な実施例に係る量子化方法を実現するための装置の各例を説明した。以下では、上述した量子化部50、すなわち、量子化装置を用いて量子化を行う手順について説明する。併せて、以下の説明を通して、上述した量子化部50の機能もより詳細かつ明確になるだろう。
図4は、本発明の好適な実施例に係る量子化方法を説明するためのフローチャートである。
図4に示すように、量子化部50は、まず、外部(例えば、MDCT部)から受信されるフレームの周波数スペクトルデータを量子化するのに使用する全帯域スケールファクターの初期値を推定して設定する(段階:S11)。全帯域スケールファクターの初期値を推定するために、量子化部50は、フレーム間の最大周波数スペクトル絶対値の変化度を用いる。前記最大周波数スペクトル絶対値は、上述したように、フレームの周波数スペクトルデータのサイズに絶対値の演算を行った値のうち最も大きい値を有する部分の絶対値を意味することができる。
具体的に、全帯域スケールファクターの初期値を推定するために、量子化部50は、外部から受信される現在のフレームの周波数スペクトルデータを分析し、現在のフレームの最大周波数スペクトル絶対値を算出する。
続いて、量子化部50は、前記の算出された現在のフレームの最大周波数スペクトル絶対値を以前のフレーム(すなわち、現在のフレームの以前に処理されたフレーム)の最大周波数スペクトル絶対値と所定の比較アルゴリズムを使用して比較する。このとき、前記以前のフレームの最大周波数スペクトル絶対値は、以前のフレームの処理時に既に求められたものでもある。
例えば、量子化部50は、前記の算出された現在のフレームの最大周波数スペクトル絶対値に2進ログ(すなわち、「log2」)を適用して第1の2進ログ値を算出し、これを以前のフレームの最大周波数スペクトル絶対値の2進ログ値、すなわち、第2の2進ログ値と比較することができる。前記第2の2進ログ値は、以前のフレームの全帯域スケールファクターの初期値を算出するときに既に算出されたものでもある。
次に、量子化部50は、前記比較アルゴリズムを使用した比較結果値に基づいて、予め定められた算出アルゴリズムを予め格納された情報から抽出し、抽出された算出アルゴリズムを使用して現在のフレームの量子化に使用する全帯域スケールファクターの初期値を算出することができる。例えば、量子化部50は、二つの2進ログ値、すなわち、第1の2進ログ値と第2の2進ログ値との差値に対応する特定算出アルゴリズムを使用して現在のフレームの量子化に使用する全帯域スケールファクターの初期値を算出することができる。
全帯域スケールファクターの初期値を設定するための算出アルゴリズムは、下記の数学式1に示す通りである。
Figure 0005379871
前記数学式1で使用された各要素を定義すると、次の通りである。
1.i:フレームインデックス。以下では、iを現在のフレームと仮定し、i−1は以前のフレームと仮定する。
2.est_common_scalefac[i]:現在のフレームの量子化を行うために推定された全帯域スケールファクターの初期値
3.CSF[i−1]:以前のフレームの量子化及び符号化過程によって決定された全帯域スケールファクター
4.max_spec[i]:現在のフレームの最大周波数スペクトル絶対値
5.A、B、C、D:定数値。それぞれの値は、実験によって適正な値に決定することができる。
6.diff[i]:現在のフレームの最大周波数スペクトル絶対値、すなわち、max_spec[i]の2進ログ値から以前のフレームの最大周波数スペクトル絶対値、すなわち、max_spec[i−1]の2進ログ値を差し引いた値。このようなdiff[i]を数学式で表現すると、下記の数学式2に示す通りである。
Figure 0005379871
前記数学式1を参照すると、量子化部50は、現在のフレームの全帯域スケールファクターの初期値を推定するために、現在のフレームの最大周波数スペクトル絶対値の2進ログ値(例えば、第1の2進ログ値)から以前のフレームの最大周波数スペクトル絶対値の2進ログ値(例えば、第2の2進ログ値)を差し引いた値の絶対値、すなわち、二つの2進ログ値の差値|diff[i]|によって対応する算出アルゴリズムを適用する。
例えば、前記二つの2進ログ値の差値|diff[i]|が特定の定数であるCより大きく、Dより小さい場合、現在のフレームの全帯域スケールファクターの初期値は、第1の2進ログ値から第2の2進ログ値を差し引いた値diff[i]に特定の定数であるAを掛けた値を以前のフレームの全帯域スケールファクター値CSF[i+1]と加算することによって算出することができる。
また、前記二つの2進ログ値の差値|diff[i]|が特定の定数であるDと同じか、Dより大きい場合、現在のフレームの全帯域スケールファクターの初期値は、前記第1の2進ログ値から第2の2進ログ値を差し引いた値diff[i]に特定の定数であるBを掛けた値を以前のフレームの全帯域スケールファクター値CSF[i+1]と加算することによって算出することができる。
前記二つの2進ログ値の差値|diff[i]|が特定の定数であるCと同じか、Cより小さい場合、現在のフレームの全帯域スケールファクターの初期値は、以前のフレームの全帯域スケールファクター値CSF[i+1]と同一に設定することができる。
一方、現在のフレームの最大周波数スペクトル絶対値が0である場合、現在のフレームの全帯域スケールファクターの初期値は、予め設定された値、例えば、10などに設定することができる。
上述した定数値A、B、C、Dは、システムによって実験値に基づいて適宜設定できる値である。例えば、本実施例では、Aは3.58、Bは1.8、Cは0.4、Dは15に設定すると仮定する。
量子化部50は、前記数学式1及び2に対応する各情報、例えば、比較アルゴリズム、前記二つの2進ログ値の差値|diff[i]|に対応する算出アルゴリズム、フレームの最大周波数スペクトル絶対値が0である場合の算出アルゴリズム(例えば、設定値)などを格納することができ、全帯域スケールファクターの計算時には、前記の格納された情報から必要な情報を抽出することができる。
図5は、フレーム別の最大周波数スペクトル絶対値の2進ログ値とフレーム別に量子化に使用された実際の全帯域スケールファクターの決定値とを比較して示すグラフである。
図5に示すように、符号化器に順次入力される400個のフレームで、フレーム別の最大周波数スペクトル絶対値の2進ログ値は、フレーム別の実際の全帯域スケールファクターの決定値と類似する傾向を示す。
一方、図5に示したA―1、A―2、A―3の地点に該当するフレームは、オーディオデータが急激に変化する部分、すなわち、フレームのブロックタイプが変化する部分を意味することができる。例えば、前記各地点は、ロングブロックからショートブロックに変化したり、ショートブロックからロングブロックに変化する部分に該当するフレームであり得る。
このように、ブロックタイプが急激に変化する部分に該当するフレームの場合、最大周波数スペクトル絶対値の2進ログ値と実際の全帯域スケールファクターの決定値とが異なり得るので、量子化部50は、ブロックタイプが急激に変化する部分のフレームに対しては予め設定された値、例えば、「10」などに全帯域スケールファクターの初期値を設定することができる。
例えば、量子化部50は、現在のフレームのブロックタイプと以前のフレームのブロックタイプとが異なっているかどうかを判断し、現在のフレームのブロックタイプと以前のフレームのブロックタイプとが異なっている場合は、予め設定された値を現在のフレームの全帯域スケールファクターの初期値として設定することができる。一方、現在のフレームのブロックタイプと以前のフレームのブロックタイプとが同一である場合、上述した方式通りに現在のフレームと以前のフレームの最大周波数スペクトル絶対値に基づいて全帯域スケールファクターの初期値を設定することができる。
図6は、各フレーム別の周波数スペクトルデータの量子化に使用された実際の全帯域スケールファクターの決定値を示すグラフで、図7は、上述した全帯域スケールファクターの初期値推定方法によって推定された各フレーム別の全帯域スケールファクターの初期値を示すグラフである。また、図8は、図6に示されている全帯域スケールファクターの値と図7に示されている全帯域スケールファクターの初期値とを比較して示すグラフである。
図6〜図8に示すように、周波数スペクトルデータの量子化に使用された実際の全帯域スケールファクターの決定値は、上述した推定方法によって推定された全帯域スケールファクターの初期値とほぼ一致することが分かる。
したがって、特定フレームの周波数スペクトルデータの量子化を開始する前に、前記量子化に使用する全帯域スケールファクターの初期値を実際の全帯域スケールファクターの決定値とほぼ類似するように推定して設定するので、全帯域スケールファクターを調整するためのループの繰り返し回数を大幅に減少できるようになる。したがって、符号化器の動作において、量子化及び符号化による演算負担を相当減少させることができる。
このように全帯域スケールファクターの初期値が設定されると、図4に示すように、量子化部50は、内部ループの遂行に必要なフラグを第1の値、例えば、0に設定した後(段階:S12)、全帯域スケールファクターを調整する内部ループL1を行うことができる(段階:S13〜S20)。内部ループL1を行うとき、量子化部50は、前記の設定された全帯域スケールファクターの初期値を全帯域スケールファクターの開始値として使用するようになる。
内部ループL1で、まず、量子化部50は、周波数スペクトルデータを量子化する(段階:S13)、例えば、内部ループL1の1番目のループでは、設定された全帯域スケールファクターの初期値に基づいて量子化を行うことができる。
続いて、量子化部50は、量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する(段階:S14、S15、S17、S18)。
前記過程(段階:S14、S15、S17、S18)をより具体的に説明すると、量子化部50は、量子化されたデータを符号化したデータの使用ビット数を計算することができる(段階:S14)。例えば、量子化部50は、量子化されたデータを符号化部60で符号化すると、その符号化されたデータのビット数を計算することができる。
続いて、量子化部50は、計算された使用ビット数と予め設定された可用ビット数とを比較する(段階:S15)。このとき、前記の計算された使用ビット数が可用ビット数を超える場合、量子化部50は、全帯域スケールファクターを調整することができる(段階:S17)。例えば、量子化部50は、全帯域スケールファクターの値を所定値(例えば、1など)だけ増加させることができる。全帯域スケールファクターを調整した後、量子化部50は、フラグを第2の値、例えば、1に設定した後(段階S18)、量子化段階(段階:S13)以前に戻って内部ループL1を再び繰り返す。
一方、前記の計算された使用ビット数が可用ビット数と同じか、可用ビット数より少ない場合、量子化部50は、可用ビット数と使用ビット数との差が特定しきい値を超えないように全帯域スケールファクターを調整する(段階:S16、S19、S20)。
前記過程(段階:S16、S19、S20)を具体的に説明すると、量子化部50は、フラグをチェックし、フラグが第2の値(例えば、1など)であるかどうかを確認し(段階:S16)、第2の値でない場合、可用ビット数から使用ビット数を差し引いた値がしきい値を超えるかどうかを判断する(段階:S19)。
このとき、前記可用ビット数から使用ビット数を差し引いた値がしきい値を超える場合、量子化部50は、全帯域スケールファクターを調整することができる(段階:S20)。例えば、量子化部50は、全帯域スケールファクターの値を所定値(例えば、1など)だけ減少させることができる。量子化部50は、全帯域スケールファクターを調整した後、量子化段階(段階:S13)以前に戻って内部ループL1を再び繰り返す。
一方、前記可用ビット数から使用ビット数を差し引いた値がしきい値と同じか、しきい値より少ない場合、又は、フラグが第1の値である場合、量子化部50は外部ループL2を行うことができる。
外部ループL2で、量子化部50は、まず、周波数スペクトルデータの各周波数バンドの歪を計算することができる(段階:S21)。続いて、量子化部50は、計算された各周波数バンドの歪を該当の周波数バンドの許容歪と比較し、計算された各周波数バンドの歪が該当の周波数バンドの許容歪より少ないかどうかを判断する(段階:S22)。
このとき、各周波数バンドの歪が該当の周波数バンドの許容歪より大きい場合、量子化部50は、該当のバンドスケールファクターを調整した後(段階:S23)、量子化段階(段階:S13)以前に戻る。一方、各周波数バンドの歪が該当の周波数バンドの許容歪より少ないか、それと同じ場合、量子化部50は量子化を完了することができる。
以上、本発明について好適な実施例を参照して説明したが、該当の技術分野で熟練した当業者であれば、下記の特許請求の範囲に記載した本発明の技術的思想及び領域から逸脱しない範囲内で本発明を多様に修正及び変更して実施可能であることを理解できるだろう。したがって、本発明の今後の各実施例の変更は、本発明の技術を逸脱することはできないだろう。
10:フィルターバンク部、20:MDCT部、30:FFT部、40:心理音響モデル部、50:量子化部、52:量子化モジュール、54:初期値設定モジュール、56:内部ループモジュール、58:外部ループモジュール、60:符号化部、70:ビットストリーム出力部

Claims (15)

  1. 外部から受信される第1のフレームの周波数スペクトルデータを分析し、前記第1のフレームの最大周波数スペクトル絶対値を算出すること;
    前記第1のフレームの最大周波数スペクトル絶対値及び以前に算出された第2のフレームの最大周波数スペクトル絶対値に基づいて前記第1のフレームの量子化に使用するための全帯域スケールファクターの初期値を設定すること;及び
    前記の設定された全帯域スケールファクターの初期値に基づいて、前記第1のフレームの周波数スペクトルデータを量子化することを含み、
    前記全帯域スケールファクターの初期値を設定することは、
    特定の比較アルゴリズムを使用して、前記第1のフレームの最大周波数スペクトル絶対値を前記第2のフレームの最大周波数スペクトル絶対値と比較すること;及び
    前記比較の結果値に対応する算出アルゴリズムを使用して、前記第1のフレームの量子化に使用するための全帯域スケールファクターの初期値を算出することを含むことを特徴とするオーディオ符号化器の量子化方法。
  2. 前記第1のフレームの最大周波数スペクトル絶対値を算出することは、
    前記第1のフレームの周波数スペクトルデータのうち絶対値が最も大きい部分の絶対値を算出することを含むことを特徴とする、請求項1に記載のオーディオ符号化器の量子化方法。
  3. 前記第1のフレームの最大周波数スペクトル絶対値を前記第2のフレームの最大周波数スペクトル絶対値と比較することは、
    前記第1のフレームの最大周波数スペクトル絶対値に2進ログを適用して第1の2進ログ値を算出すること;
    前記第2のフレームの最大周波数スペクトル絶対値に2進ログを適用して第2の2進ログ値を算出すること;及び
    前記第1の2進ログ値と前記第2の2進ログ値との差値を算出することを含むことを特徴とする、請求項1に記載のオーディオ符号化器の量子化方法。
  4. 前記全帯域スケールファクターの初期値を設定することは、
    前記第1の2進ログ値と前記第2の2進ログ値との差値に対応する算出アルゴリズムを抽出すること;及び
    前記の抽出された算出アルゴリズムを使用して前記全帯域スケールファクターの初期値を算出することを含むことを特徴とする、請求項3に記載のオーディオ符号化器の量子化方法。
  5. 前記算出アルゴリズムを抽出することは、
    前記第1の2進ログ値と前記第2の2進ログ値との差値を少なくとも一つの定数値と比較することを含むことを特徴とする、請求項4に記載のオーディオ符号化器の量子化方法。
  6. 前記全帯域スケールファクターの初期値を算出することは、
    前記第2のフレームの全帯域スケールファクターの値、前記第1の2進ログ値から前記第2の2進ログ値を差し引いた値、特定の定数値のうち少なくともいずれか一つを使用して演算を行うことを含むことを特徴とする、請求項3に記載のオーディオ符号化器の量子化方法。
  7. 前記の算出される前記第1のフレームの最大周波数スペクトル絶対値が0である場合、予め設定された定数値を前記第1のフレームの全帯域スケールファクターの初期値に設定することをさらに含むことを特徴とする、請求項1に記載のオーディオ符号化器の量子化方法。
  8. 前記の量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整することをさらに含むことを特徴とする、請求項1に記載のオーディオ符号化器の量子化方法。
  9. 前記全帯域スケールファクターを調整することは、
    前記の量子化されたデータを符号化したデータの使用ビット数を計算すること;
    前記の計算された使用ビット数と前記可用ビット数とを比較すること;及び
    前記使用ビット数が前記可用ビット数を超える場合、前記全帯域スケールファクターを調整することを含むことを特徴とする、請求項8に記載のオーディオ符号化器の量子化方法。
  10. 前記可用ビット数から前記使用ビット数を差し引いた値が特定しきい値を超えないように前記全帯域スケールファクターを調整することをさらに含むことを特徴とする、請求項8に記載のオーディオ符号化器の量子化方法。
  11. 前記第1のフレームの周波数スペクトルデータの各周波数バンドの歪が前記各周波数バンドの許容歪を超えないように前記各周波数バンドに対応するバンドスケールファクターを調整することをさらに含むことを特徴とする、請求項1に記載のオーディオ符号化器の量子化方法。
  12. 外部から受信されるフレーム単位の周波数スペクトルデータを分析し、それぞれのフレームに対する最大周波数スペクトル絶対値を算出し、前記の算出された最大周波数スペクトル絶対値のフレーム間の変化度によって各フレームの全帯域スケールファクターの初期値を設定する初期値設定モジュール;及び
    前記初期値設定モジュールによって設定された全帯域スケールファクターの初期値に基づいて量子化を行い、前記の量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する少なくとも一つの機能モジュールを含み、
    前記初期値設定モジュールは、現在のフレームの最大周波数スペクトル絶対値と以前のフレームの最大周波数スペクトル絶対値を算出し、前記現在のフレームの最大周波数スペクトル絶対値と以前のフレームの最大周波数スペクトル絶対値とを特定の比較アルゴリズムを使用して比較し、前記比較の結果値に対応する算出アルゴリズムを使用して前記全帯域スケールファクターの初期値を算出することを特徴とするオーディオ符号化器の量子化装置。
  13. 前記初期値設定モジュールは、前記現在のフレームの最大周波数スペクトル絶対値に2進ログを適用して第1の2進ログ値を算出し、前記以前のフレームの最大周波数スペクトル絶対値に2進ログを適用して第2の2進ログ値を算出した後、前記第1の2進ログ値と第2の2進ログ値との差値によって前記現在のフレームの全帯域スケールファクターの初期値を算出するための算出アルゴリズムを抽出することを特徴とする、請求項12に記載のオーディオ符号化器の量子化装置。
  14. 前記少なくとも一つの機能モジュールは、
    前記現在のフレームの全帯域スケールファクターの初期値に基づいて前記現在のフレームの周波数スペクトルデータを量子化する量子化モジュール;及び
    前記量子化モジュールによって量子化されたデータを符号化したデータの使用ビット数が予め設定された可用ビット数を超えないように全帯域スケールファクターを調整する内部ループモジュールを含むことを特徴とする、請求項12に記載のオーディオ符号化器の量子化装置。
  15. 前記内部ループモジュールは、前記可用ビット数と前記使用ビット数との差値が特定しきい値を超えないように前記全帯域スケールファクターを調整することを特徴とする、請求項14に記載のオーディオ符号化器の量子化装置。
JP2011552875A 2009-03-04 2010-02-02 オーディオ符号化のための量子化 Expired - Fee Related JP5379871B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2009-0018623 2009-03-04
KR1020090018623A KR101078378B1 (ko) 2009-03-04 2009-03-04 오디오 부호화기의 양자화 방법 및 장치
PCT/KR2010/000636 WO2010101354A2 (en) 2009-03-04 2010-02-02 Quantization for audio encoding

Publications (2)

Publication Number Publication Date
JP2012519309A JP2012519309A (ja) 2012-08-23
JP5379871B2 true JP5379871B2 (ja) 2013-12-25

Family

ID=42679017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011552875A Expired - Fee Related JP5379871B2 (ja) 2009-03-04 2010-02-02 オーディオ符号化のための量子化

Country Status (5)

Country Link
US (1) US8600764B2 (ja)
JP (1) JP5379871B2 (ja)
KR (1) KR101078378B1 (ja)
CN (1) CN102341846B (ja)
WO (1) WO2010101354A2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258552B (zh) * 2012-02-20 2015-12-16 扬智科技股份有限公司 调整播放速度的方法
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
US11227615B2 (en) * 2017-09-08 2022-01-18 Sony Corporation Sound processing apparatus and sound processing method

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69522187T2 (de) * 1994-05-25 2002-05-02 Sony Corp Verfahren und vorrichtung zur kodierung, dekodierung und kodierung-dekodierung
KR0183328B1 (ko) * 1994-10-28 1999-04-15 다나까 미노루 부호화 데이터 복호 장치와 그것을 이용한 화상 오디오다중화 데이터 복호 장치
JPH09288498A (ja) * 1996-04-19 1997-11-04 Matsushita Electric Ind Co Ltd 音声符号化装置
JP2001094433A (ja) * 1999-09-17 2001-04-06 Matsushita Electric Ind Co Ltd サブバンド符号化・復号方法
JP2001306095A (ja) * 2000-04-18 2001-11-02 Mitsubishi Electric Corp オーディオ符号化装置及びオーディオ符号化方法
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20040230425A1 (en) * 2003-05-16 2004-11-18 Divio, Inc. Rate control for coding audio frames
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US7983909B2 (en) * 2003-09-15 2011-07-19 Intel Corporation Method and apparatus for encoding audio data
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
KR100682890B1 (ko) * 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
JP4639073B2 (ja) * 2004-11-18 2011-02-23 キヤノン株式会社 オーディオ信号符号化装置および方法
JP4822816B2 (ja) * 2005-11-14 2011-11-24 キヤノン株式会社 オーディオ信号符号化装置および方法
WO2006054583A1 (ja) * 2004-11-18 2006-05-26 Canon Kabushiki Kaisha オーディオ信号符号化装置および方法
CN100539437C (zh) * 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
CN1909066B (zh) * 2005-08-03 2011-02-09 昆山杰得微电子有限公司 音频编码码量控制和调整的方法
JP2007293118A (ja) 2006-04-26 2007-11-08 Sony Corp 符号化方法および符号化装置
JP5224666B2 (ja) * 2006-09-08 2013-07-03 株式会社東芝 オーディオ符号化装置
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
WO2009001874A1 (ja) * 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
TWI374671B (en) * 2007-07-31 2012-10-11 Realtek Semiconductor Corp Audio encoding method with function of accelerating a quantization iterative loop process
US8346547B1 (en) * 2009-05-18 2013-01-01 Marvell International Ltd. Encoder quantization architecture for advanced audio coding

Also Published As

Publication number Publication date
KR20100099997A (ko) 2010-09-15
US8600764B2 (en) 2013-12-03
CN102341846A (zh) 2012-02-01
KR101078378B1 (ko) 2011-10-31
WO2010101354A3 (en) 2010-11-04
JP2012519309A (ja) 2012-08-23
WO2010101354A2 (en) 2010-09-10
US20100228556A1 (en) 2010-09-09
CN102341846B (zh) 2013-09-25

Similar Documents

Publication Publication Date Title
KR100814673B1 (ko) 오디오 부호화
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
US7613603B2 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
US8041563B2 (en) Apparatus for coding a wideband audio signal and a method for coding a wideband audio signal
KR101859246B1 (ko) 허프만 부호화를 실행하기 위한 장치 및 방법
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
KR100813193B1 (ko) 정보 신호의 양자화 방법 및 장치
US20040162720A1 (en) Audio data encoding apparatus and method
JP5633431B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR100848370B1 (ko) 오디오 부호화
EP3826011A1 (en) Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US8595003B1 (en) Encoder quantization architecture for advanced audio coding
US20060004565A1 (en) Audio signal encoding device and storage medium for storing encoding program
JP5379871B2 (ja) オーディオ符号化のための量子化
KR20060063198A (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
JP3886851B2 (ja) オーディオ信号符号化装置
US8626501B2 (en) Encoding apparatus, encoding method, decoding apparatus, decoding method, and program
JP2008026372A (ja) 符号化データの符号化則変換方法および装置
KR20080008897A (ko) 오디오 부호화 방법
JP2003271199A (ja) オーディオ信号の符号化方法及び符号化装置
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치
Nghia et al. A new wavelet-based wide-band speech coder
KR20100050414A (ko) 오디오 신호 처리 방법 및 장치
KR20090100664A (ko) 휴대용 단말기의 대역 확장 기법을 이용한 부호화 장치 및방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130927

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees