JP4673882B2 - 推定値を決定するための方法および装置 - Google Patents

推定値を決定するための方法および装置 Download PDF

Info

Publication number
JP4673882B2
JP4673882B2 JP2007501149A JP2007501149A JP4673882B2 JP 4673882 B2 JP4673882 B2 JP 4673882B2 JP 2007501149 A JP2007501149 A JP 2007501149A JP 2007501149 A JP2007501149 A JP 2007501149A JP 4673882 B2 JP4673882 B2 JP 4673882B2
Authority
JP
Japan
Prior art keywords
energy
band
signal
frequency band
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007501149A
Other languages
English (en)
Other versions
JP2007525715A (ja
Inventor
ミヒャエル シュグ
ジョーハン ヒルペアト
シュテファン ガヤーズベアガー
マクス ノイエンドルフ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2007525715A publication Critical patent/JP2007525715A/ja
Application granted granted Critical
Publication of JP4673882B2 publication Critical patent/JP4673882B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Control Of Ac Motors In General (AREA)
  • Electrical Discharge Machining, Electrochemical Machining, And Combined Machining (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Measurement Of Current Or Voltage (AREA)
  • Measurement Of Resistance Or Impedance (AREA)
  • Branch Pipes, Bends, And The Like (AREA)
  • Manufacture Or Reproduction Of Printing Formes (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

本発明は、オーディオおよび/またはビデオ情報を含む信号を符号化するための符号器に関し、特に、この信号を符号化するための情報ユニットの必要性の推定に関する。
先行技術の符号器について以下に説明する。符号化されるオーディオ信号は、入力部1000に供給される。このオーディオ信号は、最初にスケーリングステージ1002に供給され、そこにおいて、いわゆるAACゲイン制御がオーディオ信号のレベルを確立するために行われる。スケーリングによるサイド情報は、ブロック1002とブロック1004との間に位置する矢印によって表されるように、ビットストリームフォーマッタ1004に供給される。次に、スケーリングされたオーディオ信号は、MDCTフィルタバンク1006に供給される。AAC符号器については、フィルタバンクは、窓長がブロック1008によって決定される、50%オーバラップする窓を有する変形離散コサイン変換を実施する。
一般に言って、ブロック1008は、過渡信号を比較的短い窓で窓掛け処理し、および定常する傾向がある信号を比較的長い窓で窓掛け処理するために存在する。これは、過渡信号の場合、比較的短い窓によって(周波数分解能を犠牲にして)より高いレベルの時間分解能に到達するために役立つが、定常する傾向がある信号の場合、(時間分解能を犠牲にして)より高い周波数分解能がより長い窓によって達成され、より長い窓はより高い符号化ゲインを生じるため、より長い窓が好まれる傾向がある。フィルタバンク1006の出力部では、ブロックが時間的に連続しているスペクトル値のブロックが存在し、これは、フィルタバンクの実施に応じてMDCT係数、フーリエ係数またはサブバンド信号でよく、各サブバンド信号は、フィルタバンク1006における個々のサブバンドチャネルによって指定される特定の限られた帯域幅を有し、各サブバンド信号は、特定数のサブバンドサンプルを有する。
次に、一例として、フィルタバンクが、一般的に、入力部1000で符号化されるオーディオ信号の連続する短期スペクトルを表す、MDCTスペクトル係数の時間的に連続するブロックを、出力する事例を説明する。次に、MDCTスペクトル値のブロックは、TNS処理ブロック1010(TNS=時間領域ノイズ整形)に供給され、時間領域ノイズ整形が実行される。TNS技術は、変換の各窓内の量子化ノイズの時間的なフォームを整形するために使用される。これは、各チャネルのスペクトルデータの部分にフィルタリング処理を適用することによって達成される。符号化は、窓ベースで実行される。特に、以下のステップは、TNSツールをスペクトルデータの窓に、すなわちスペクトル値のブロックに適用するために実行される。
先ず、TNSツールのための周波数範囲が選択される。適切な選択は、最大限可能なスケールファクタバンドまで、1.5kHzの周波数範囲をフィルタでカバーすることを含む。この周波数範囲は、AAC規格(ISO/IEC14496−3:2001(E))に指定されているように、サンプリングレートによって決まることを指摘しておく。
その後、正確には、選択された目標周波数範囲に存在するスペクトルMDCT係数を使用して、LPC計算(LPC=線形予測符号化)が実行される。安定性を高めるために、2.5kHz未満の周波数に対応する係数は、この処理から除外される。スピーチ処理から公知の一般的なLPC手順は、LPC計算、たとえば公知のレビンソン−ダービンアルゴリズムのために使用される。この計算は、ノイズ整形フィルタの最大限許容できる次数のために実行される。
LPC計算の結果として、予想された予測ゲインPGが得られる。さらに、反射係数またはPARCOR係数が得られる。
予測ゲインが特定の閾値を超えない場合、TNSツールは適用されない。この場合、制御情報の一部はビットストリーム内に書き込まれるため、復号器は、TNS処理が実行されなかったことを知る。
しかし、予測ゲインが閾値を超える場合、TNS処理が適用される。
次のステップでは、反射係数が量子化される。使用されるノイズ整形フィルタの次数は、閾値より小さい絶対値を有するすべての反射係数を反射係数のアレイの「後部」から除去することによって決定される。残りの反射係数の数は、ほぼノイズ整形フィルタの大きさ程度である。適切な閾値は0.1である。
残りの反射係数は、一般に、線形予測係数に転換され、この技術は、「変数増加」法としても公知である。
次に、計算されたLPC係数は、符号器のノイズ整形フィルタ係数、すなわち予測フィルタ係数として使用される。FIRフィルタは、指定された目標周波数範囲におけるフィルタリングのために使用される。自己回帰フィルタは復号化に使用されるが、いわゆる移動平均フィルタは符号化に使用される。最終的には、TNSツールのためのサイド情報は、図3におけるTNS処理ブロック1010とビットストリームフォーマッタ1004との間に矢印で表されているように、ビットストリームフォーマッタに供給される。
次に、最終的にミッド/サイド符号器1012に到達するまで、たとえば長期予測ツール、強度/結合ツール、予測ツール、ノイズ置換ツールのように、図3に示されていないいくつかの任意のツールを通過する。ミッド/サイド符号器1012は、符号化されるオーディオ信号がマルチチャネル信号、すなわち左チャネルおよび右チャネルを有するステレオ信号である場合にアクティブである。ここまで、すなわち図3においてブロック1012から上流では、左および右ステレオチャネルは、互いに別々に、処理され、すなわち、スケーリングされ、フィルタバンクによって変換され、TNS処理を受けまたは受けないなどである。
ミッド/サイド符号器では、検証は、最初に、ミッド/サイド符号化が意味を成すかどうか、すなわち、とにかく符号化ゲインを生じるかどうかについて実行される。ミッド/サイド符号化は、左および右チャネルが類似する傾向がある場合、符号化ゲインを生じる。なぜなら、この場合、ミッドチャネル、すなわち左および右チャネルの合計は、1/2のファクタによるスケーリングは別として、殆ど左チャネルまたは右チャネルに等しいが、サイドチャネルは、左および右チャネル間の差に等しいため、非常に小さい値を有するからである。その結果、左および右チャネルがほぼ同じである場合、差はほぼゼロであるか、または非常に小さい値のみを含み、この値は、望ましいことだが、後続の量子化器1014でゼロに量子化され、その結果、エントロピー符号器1016は量子化器1014の下流に接続されるため、非常に効果的な方法で送信されることが分かる。
量子化器1014には、心理音響モデル1020によって、スケールファクタバンドごとに1つの許容できる雑音が供給される。量子化器は反復的な方法で動作し、すなわち、最初に外部反復ループが呼び出され、量子化器は、次に内部反復ループを呼び出す。一般的に、量子化器ステップサイズの初期値から始まって、値のブロックの量子化は、量子化器1014の入力部で最初に実行される。特に、内部ループは、MDCT係数を量子化し、この処理では特定数のビットが消費される。外部ループは、再び内部ループを呼び出すために、スケールファクタを使用して、係数の歪みおよび修正エネルギーを計算する。この処理は、特定の条件節が満たされるまで、このような時間の間にわたって反復される。外部反復ループにおける各反復では、信号は、量子化によって導入される雑音を計算し、この雑音と心理音響モデル1020によって供給される許可された雑音とを比較するように再構築される。さらに、この比較の後にさらに妨げられると考えられるこれらの周波数帯域のスケールファクタは、外部反復ループの各反復にとって正確であるために、反復から反復までの1以上のステージによって拡大される。
量子化によって導入される量子化雑音が、心理音響モデルによって決定される許可された雑音未満であるという状況に到達した後、同時にビット要求が、正確であるために、最大ビットレートを超えない状態を満たす場合、反復、すなわち合成による分析方法は終了され、得られたスケールファクタはブロック1014に示されるように符号化され、ブロック1014とブロック1004との間に描かれている矢印によってマークされるようにビットストリームフォーマッタ1004に、符号化されたフォームで供給される。次に、量子化された値はエントロピー符号器1016に供給され、エントロピー符号器1016は、量子化された値をバイナリフォーマットに翻訳するために、いくつかのハフマン符号テーブルを使用して様々なスケールファクタバンドのためのエントロピー符号化を一般に実行する。周知のとおり、ハフマン符号化の形式におけるエントロピー符号化は、予想された信号統計値に基づいて作成される符号テーブル上におけるフォールバックを伴い、頻繁に生じる値には、比較的頻繁に発生しない値より短い符号語が与えられる。次に、エントロピー符号化値は、実際のメイン情報としてビットストリームフォーマッタ1004に供給され、次に、ビットストリームフォーマッタ1004は、特定のビットストリーム構文に従って出力側で符号化オーディオ信号を出力する。
これまで、オーディオ信号のデータ整理は、一連の国際規格(たとえば、ISO/MPEG−1、MPEG−2 AAC、MPEG−4)の対象である公知の技術である。
上述の方法では、一般に、入力信号は、いわゆる符号器によって、知覚に関連する効果(心理音響学、心理光学)を利用してコンパクトなデータ整理表現に変えられる。このため、通常、信号のスペクトル分析が実行され、知覚モデルを考慮に入れて、対応する信号成分が量子化され、次に、できるだけコンパクトになるように、いわゆるビットストリームとして符号化される。
実際の量子化の前に、符号化される特定の信号部分がいくつのビットを必要とするかを推定するために、いわゆる心理聴覚エントロピー(PE)が使用される。PEは、符号器が特定の信号またはその部分を符号化することがどの程度困難かという基準も提供する。
実際に必要なビット数と比べたPEの偏差は、推定の質のために重要である。
さらに、過渡信号は定常信号に比べて符号化のためにより多くのビットを必要とするため、心理聴覚エントロピーおよび/または信号を符号化するための情報ユニットの必要性の各推定値が、信号が過渡状態であるか定常状態であるかを推定するために使用される。信号の過渡特性の推定は、図3におけるブロック1008に示されるように、たとえば、窓長の決定を実行するために使用される。
図6では、心理聴覚エントロピーは、ISO/IEC IS 13818−7(MPEG−2アドバンストオーディオコーディング(AAC))に従って計算されるように示される。図6に示される方程式は、この心理聴覚エントロピーの計算、すなわち帯域的な心理聴覚エントロピーの計算に使用される。この方程式では、パラメータpeは、心理聴覚エントロピーを表す。さらに、width(b)は、個々の帯域bにおけるスペクトル係数の数を表す。さらに、e(b)は、この帯域における信号のエネルギーである。最後に、nb(b)は、対応するマスキング閾値、または、より一般的には、たとえば量子化によって信号内に導入されることが可能であるが、それにも関わらず人間のリスナーにとってまったく聞こえないかまたはごく微量の雑音としか聞こえない許容できる雑音である。
この帯域は、心理音響モデル(図3におけるブロック1020)の帯域偏差から生じるか、または量子化に使用されるいわゆるスケールファクタバンド(scfb)である。心理音響マスキング閾値は、量子化誤差が超えてはならないエネルギー値である。
したがって、図6に示される図は、このようにして決定された心理聴覚エントロピーが、符号化に必要なビット数の推定として、いかに良好に機能するかを示す。このため、個々の心理聴覚エントロピーは、個々のブロックごとに異なるビットレートでAAC符号器の例において使用されたビットに応じてプロットされた。使用されるテストピースは、音楽、スピーチおよび個々の機器の代表的な混合を含む。
理想的には、これらの点は、ゼロ点を通る直線に沿って収集される。理想線からの偏差を有する点の連続の広がりは、不正確な推定を明確にする。
したがって、図6に示される概念で不利なことは偏差であり、この偏差は、たとえば、心理聴覚エントロピーのためにあまりに高い値が生じるという点で影響を与え、その結果、実際に必要とされるビットより多くのビットが必要とされるということが量子化器に信号で伝えられることを意味する。これは、量子化器があまりに微細に量子化する、すなわち、許容できる雑音の基準を使い果たさず、符号化ゲインの減少を生じるという事実になる。一方、心理聴覚エントロピーのための値があまりに小さいと決定される場合、実際に必要とされるビットより少ないビットが信号を符号化するために必要とされるということが量子化器に信号で伝えられる。その結果、量子化器はあまりに粗雑に量子化し、対策を講じない場合、信号に直ちに可聴雑音がもたらされるという事実が生じる。この対策は、量子化器が1以上のさらなる反復ループを必要とし、符号器の演算時間を増加することである。
心理聴覚エントロピーの計算を改善するために、図7に示されるように、1.5などの定数項を対数式に導入することができる。次に、より良好な結果、すなわちより小さい上方または下方偏差は、以前から得ることができるが、それにも関わらず、対数式における定数項を考慮に入れる場合、心理聴覚エントロピーがビットの必要性をあまりに楽観的に信号で伝えるという状況は確かに減少する。一方、図7から、あまりに多数のビットが意味ありげに信号で伝えられ、その結果、量子化器は常にあまりに微細に量子化する、すなわち、ビットの必要性は、実際に必要であるよりも多く仮定され、その結果、符号化ゲインの減少を生じることが明らかに分かる。対数式における定数は、サイド情報のために必要とされるビットの粗い推定である。
したがって、ある項を対数式に挿入すると、確かに、図6に示されているように、帯域的な心理聴覚エントロピーが改善される。なぜなら、ゼロに量子化されるスペクトル係数の送信のために一定量のビットも必要であるため、エネルギーとマスキング閾値との間の距離が非常に小さい帯域がより考慮に入れられるからである。
さらに、心理聴覚エントロピーの非常に演算時間集約的な計算が図8に示される。図8には、心理聴覚エントロピーが直線的な方法で計算される場合が示される。しかし、この場合の欠点は、直線的な計算のより高い演算費用にある。この場合、エネルギーの代わりに、スペクトル係数X(k)が使用され、kOffset(b)は、帯域bの最初のインデックスを指定する。図8を図7と比較すると、上方「偏位」の減少は、2,000〜3,000ビットの範囲で明確に見られる。したがって、PE推定はより正確になり、すなわち、過度に悲観的に推定することがなく、むしろ最適な状態を保つため、符号化ゲインは、図6および図7に示される計算方法と比べて増加する、および/または量子化器における反復の数が減少する。
しかし、図8に示される方程式を評価するために必要な演算時間は、心理聴覚エントロピーの直線的な計算において不利である。
こうした演算時間の不利な点は、符号器が強力なPCまたは強力なワークステーション上で動作する場合、必ずしも何らかの役割を果たすわけではない。しかし、符号器が携帯UMTS電話などの携帯デバイス内に収容される場合、状況は完全に異なり、符号器は、一方では小型で安価である必要があり、他方では、UMTS接続を解して送信されるオーディオ信号またはビデオ信号の符号化を可能にするために、電流の必要性が低く、さらに迅速に動作しなければならない。
本発明の目的は、信号を符号化するための情報ユニットの必要性の推定値を決定するための効率的かつ正確な概念を提供することである。
この目的は、請求項1の装置、請求項10の方法または請求項11のコンピュータプログラムによって達成される。
本発明は、情報ユニットの必要性の推定値の周波数帯域的な計算は、演算時間の点で維持しなければならないが、推定値の正確な決定を得るために、帯域的な方法で計算される周波数帯域におけるエネルギーの分布を考慮に入れなければならないという発見結果に基づく。
これで、量子化器の後のエントロピー符号器は、ある点では暗に、情報ユニットの必要性の推定値の決定に「引き込」まれる。エントロピー符号化は、より大きいスペクトル値を送信する場合より、より小さいスペクトル値を送信する場合に、より少量のビットが必要になることを可能にする。エントロピー符号器は、ゼロに量子化されるスペクトル値を送信できる場合、特に効果的である。これらは最も頻繁に生じるため、ゼロに量子化されるスペクトルラインを送信するための符号語は最短の符号語であり、次第に大きくなる量子化スペクトルラインを送信するための符号語は次第に長くなる。さらに、ゼロに量子化される一連のスペクトル値を送信するために特に効果的な概念では、同等のランレングス符号化が使用され、その結果、平均的に見て、ゼロに量子化されるスペクトル値ごとにゼロ続きの場合、単一ビットさえ必要ない。
先行技術に使用される情報ユニットの必要性の推定値を決定するための帯域的な心理聴覚エントロピーの計算は、この周波数帯域におけるエネルギーの分布が、完全に均一な分布から逸脱する場合、下流のエントロピー符号器の動作モードを完全に無視する。
したがって、本発明によれば、帯域的な計算の不正確さを減少するために、帯域内でエネルギーがどのように分布するかを考慮に入れる。
実施に応じて、この周波数帯域におけるエネルギーの分布のための基準は、量子化器でゼロに量子化されない周波数ラインの推定によってまたは実際の大きさに基づいて決定される。「nl」とも呼ばれるこの基準は、nlが「有効ラインの数」を表し、演算時間の効率の点で好ましい。しかし、ゼロまたはより微細な再分割に量子化されるスペクトルラインの数が考慮に入れられ、この推定がますます正確になり、下流のエントロピー符号器のより多くの情報が考慮に入れられる。エントロピー符号器がハフマン符号テーブルに基づいて構築される場合、これらの符号テーブルの特性は特によく統合される。なぜなら、符号テーブルは、オンラインで、すなわち信号統計によって計算されるのではなく、符号テーブルは、実際の信号に関係なくとにかく固定されるからである。
しかし、演算時間の制限に応じて、特に効果的な計算の場合、この周波数帯域におけるエネルギーの分布のための基準は、量子化後も存続するラインの決定、すなわち有効ラインの数によって実行される。
本発明は、先行技術より正確かつ効果的な情報のコンテンツの必要性の推定値が決定される際に有利である。
さらに、本発明は、様々なアプリケーションのためにスケーリング可能であり、これは、増加した演算時間のコストを犠牲にするが、エントロピー符号器のより多くの特性を常に推定値の所望の正確さに応じてビットの必要性の推定に考慮することができるからである。
本発明の好ましい実施形態が添付図面を参照して後に詳細に説明されるが、これらの図としては:
図1は、推定値を決定するための本発明の装置のブロック回路図であり、
図2aは、周波数帯域におけるエネルギーの分布のための基準を計算するための手段の好ましい実施態様を示し、
図2bは、ビットの必要性の推定値を計算するための手段の好ましい実施態様を示し、
図3は、公知のオーディオ符号器のブロック回路図であり、
図4は、推定値の決定における帯域内のエネルギー分布の影響を説明するための原理図であり、
図5は、本発明による推定値計算のための図であり、
図6は、ISO/IEC IS 13818−7(AAC)による推定値計算のための図であり、
図7は、定数項を有する推定値計算のための図であり、
図8は、定数項を有する直線的な推定値計算のための図である。
続いて、図1に関して、信号を符号化するための情報ユニットの必要性の推定値を決定するための本発明の装置について説明する。信号は、オーディオおよび/またはビデオ信号であり、入力部100を介して供給される。好ましくは、信号は、スペクトル値を有するスペクトル表現として既に存在する。しかし、これは、時間信号を有するいくらかの計算も、たとえば、対応する帯域通過フィルタリングによって実行されるため、絶対的に必要なわけではない。
信号は、信号の周波数帯域のための許容できる雑音ための基準を提供するための手段102に供給される。許容できる雑音は、図3(ブロック1020)に基づいて説明したように、たとえば心理音響モデルによって決定される。手段102は、この周波数帯域における信号のエネルギーのための基準も提供するように、さらに動作可能である。許容できる雑音または信号エネルギーが示される周波数帯域が、信号のスペクトル表現の少なくとも2以上のスペクトルラインを含むことは、帯域的な計算のために前提条件である。代表的な標準オーディオ符号器では、周波数帯域は、スケールファクタバンドであることが好ましい。なぜなら、ビットの必要性の推定は、行われる量子化がビット基準に適合するかどうかを確認するために、量子化器によって直ちに必要とされるからである。
手段102は、帯域における信号の許容できる雑音nb(b)および信号エネルギーe(b)の両方を、ビットの必要性の推定値を計算するための手段104に供給するために形成される。
本発明によれば、ビットの必要性の推定値を計算するための手段104は、許容できる雑音および信号エネルギーに関係なく、周波数帯域におけるエネルギーの分布のための基準nl(b)を考慮に入れるように形成され、この場合、周波数帯域におけるエネルギーの分布は、完全に均一な分布から逸脱する。帯域のスペクトル分析を実行し、たとえば周波数帯域におけるエネルギーの分布のための基準を得るために、エネルギーの分布のための基準は手段106で計算され、手段106は、少なくとも1つの帯域、すなわち、帯域通過信号としてまたは直接スペクトルラインの結果として、オーディオまたはビデオ信号の考慮された周波数帯域を必要とする。
当然、オーディオまたはビデオ信号は、時間信号として手段106に供給され、手段106は、帯域フィルタリングおよび帯域における分析を実行する。別の方法として、手段106に供給されるオーディオまたはビデオ信号は、たとえばMDCT係数として、または、MDCTフィルタバンクと比べると帯域通過フィルタの数がより少ないフィルタバンクにおける帯域通過信号として、周波数領域に既に存在してもよい。
好ましい実施態様では、計算するための手段106は、推定値を計算するために、周波数帯域におけるスペクトル値の現在の大きさを考慮に入れるために形成される。
さらに、エネルギーの分布のための基準を計算するための手段は、エネルギーの分布のための基準として、その大きさが所定の大きさ閾値より大きい若しくはそれに等しい、または、その大きさがその大きさ閾値より小さい若しくはそれに等しいスペクトル値の数を決定するために形成され、その大きさ閾値は、好ましくは、量子化器において、ゼロに量子化される量子化器ステージより小さいまたはそれに等しい値を生じる、推定された量子化器ステージである。この場合、エネルギーのための基準は、有効ラインの数、すなわち、量子化後に存続しているかまたはゼロに等しくないラインの数である。
図2aは、周波数帯域におけるエネルギーの分布のための基準を計算するための手段106のための好ましい実施態様を示す。周波数帯域におけるエネルギーの分布のための基準は、図2aにnl(b)で示される。フォームファクタffac(b)は、既に周波数帯域におけるエネルギーの分布のための基準である。ブロック106から分かるように、スペクトル分布nlのための基準は、帯域幅width(b)および/またはスケールファクタバンドbにおけるラインの数で除算した信号エネルギーe(b)の4乗根で重み付けすることによって、フォームファクタffac(b)から決定される。これに関連して、フォームファクタは、エネルギーの分布のための基準を示す数量の一例でもあり、nl(b)は、これと対照的に、量子化のために関連したラインの数のための推定値を表す数量の一例であるという事実を指摘しておく。
フォームファクタffac(b)は、スペクトルラインの大きさ形成、それに続くこのスペクトルラインのルート形成およびそれに続く帯域におけるスペクトルラインの大きさの「ルート」の合計によって計算される。
図2bは、推定値peを計算するための手段104の好ましい実施態様を示し、事例の差別化も図2bに導入され、すなわちエネルギー対許容できる雑音の比率の底が2である対数が定数ファクタc1より大きいかまたはその定数ファクタに等しい場合に導入される。この場合、ブロック104の最上位の選択肢が選ばれ、すなわち、スペクトル分布nlのための基準は対数式で乗算される。
一方、信号エネルギー対許容できる雑音の比率の底が2である対数が、値c1より小さいと決定された場合、図2bのブロック104における最下位の選択肢が使用され、これは、加算定数c2も定数c2およびc1から計算された乗算定数c3もさらに有する。
その後、図4aおよび図4bに基づいて、本発明の概念を説明する。図4aは、大きさがすべて等しい4本のスペクトルラインが存在する帯域を示す。したがって、この帯域におけるエネルギーは、帯域全体に均一に分布する。対照的に、図4bは、帯域におけるエネルギーが1本のスペクトルラインに存在し、他の3本のスペクトルラインがゼロに等しいという状況を示す。図4bでゼロに設定されるスペクトルラインが、量子化以前の最初の量子化器ステージより小さく、量子化器によってゼロに設定される、すなわち「存続しない」場合、図4bに示される帯域は、たとえば量子化以前に存在するか、または量子化後に得られる。
したがって、図4bの有効ラインの数は1に等しく、図4bにおけるパラメータnlは2の平方根として計算される。対照的に、値nl、すなわちエネルギーのスペクトル分布のための基準は、図4aで4として計算される。これは、スペクトルエネルギーの分布のための基準がより大きい場合、エネルギーのスペクトル分布がより均一であることを意味する。
先行技術による心理聴覚エントロピーの帯域的な計算は、2つの事例間の相違を確認しないという事実を指摘しておく。特に、図4aおよび4bに示される両方の帯域に同じエネルギーが存在する場合、相違は確認されない。
しかし、ゼロに設定された3本のスペクトルラインは非常に効果的に送信できるため、図4bに示される事例は、明らかに、ビットが少ない1本の関連ラインのみで符号化できる。一般に、図4bに示される事例のより単純な量子化能力は、量子化および可逆符号化後、より小さい値、および特にゼロに量子化される値が、送信のためにより少ないビットを必要とするという事実に基づく。
したがって、本発明によれば、エネルギーが帯域内でどのように分布するかが考慮される。上述のとおり、これは、既知の方程式(図6)における帯域ごとのラインの数を、量子化後ゼロに等しくないラインの数の推定と置き換えることによって行われる。この推定は、図2aに示される。
さらに、図2aに示されるフォームファクタも、符号器の別の時点、たとえば量子化ステップサイズを決定するための量子化ブロック1014内で必要とされる。フォームファクタが、他のある時点で既に計算されている場合、ビット推定のために再度計算してはならないため、所要ビットのための基準の推定を改善するという本発明の概念は、最低限の演算間接費で間に合う。
既に上述のとおり、X(k)は、後に量子化されるスペクトル係数であるが、変数kOffset(b)は、帯域bにおける最初のインデックスを指定する。
図4aおよび4bから分かるように、図4aにおけるスペクトルはnl=4の値を生成し、図4bにおけるスペクトルは1.41の値を生成する。したがって、フォームファクタを用いて、帯域内のスペクトルフィールド構造の量子化のための基準が利用可能である。
したがって、改良された帯域的な心理聴覚エントロピーを計算するための新たな公式は、エネルギーのスペクトル分布のための基準と、信号エネルギーe(b)が分子で生じ、許容できる雑音が分母で生じる対数式との乗算に基づき、項が、図7において既に説明されたように、必要に応じて対数内に挿入される。この項は、図2bに示される事例と同様に、たとえば1.5でよいが、ゼロに等しくてもよく、これは、たとえば実験的に決定される。
この時点で、再び図5に注意する必要があり、本発明に従って計算される心理聴覚エントロピーは図5から明らかであり、すなわち所要ビットに対して描かれている。図6、7および8の比較例とは対照的に、この推定のより高度な正確さは明らかに分かる。本発明に従って修正された帯域的な計算は、少なくとも直線的な計算と同様に行われる。
場合によっては、本発明による方法は、ハードウェアまたはソフトウェアで実施されてもよい。この実施は、その方法が実行されるように、プログラム可能なコンピュータシステムと協働することができ、電子的に読み出すことができる制御信号を有する、デジタル記憶媒体、特に、プロッピーディスクまたはCD上で行うことができる。本発明は、一般に、コンピュータプログラム製品がコンピュータ上で実行されるときに、機械で読み出し可能なキャリアに記憶された本発明の方法を実行するためのプログラムコードを有するコンピュータプログラム製品にも存在する。言い換えれば、本発明は、コンピュータプログラムがコンピュータ上で実行されるときに、この方法を実行するためのプログラムコードを有するコンピュータプログラムとしても実現することができる。
図1は、推定値を決定するための本発明の装置のブロック回路図である。 図2aは、周波数帯域におけるエネルギーの分布のための基準を計算するための手段の好ましい実施態様を示す。 図2bは、ビットの必要性の推定値を計算するための手段の好ましい実施態様を示す。 図3は、公知のオーディオ符号器のブロック回路図である。 図4は、推定値の決定における帯域内のエネルギー分布の影響を説明するための原理図である。 図5は、本発明による推定値計算のための図である。 図6は、ISO/IEC IS 13818−7(AAC)による推定値計算のための図である。 図7は、定数項を有する推定値計算のための図である。 図8は、定数項を有する直線的な推定値計算のための図である。

Claims (11)

  1. オーディオ情報を有する信号を符号化するために必要な情報ビットの推定値(pe)を決定するための装置であって、前記信号はいくつかの周波数帯域を有し、
    前記信号の周波数帯域(b)のための許容できる雑音のための雑音基準(nb(b))および前記周波数帯域における前記信号のエネルギーのためのエネルギー基準(e(b))を提供するための手段(102)であって、前記周波数帯域(b)は前記周波数帯域における異なる周波数インデックスのための前記信号のスペクトル表現の少なくとも2つのスペクトル値を有する手段(102)と、
    前記周波数帯域(b)における前記エネルギー(e(b))の分布のためのエネルギー分布基準(nl(b))を計算するための手段(106)であって、前記周波数帯域における前記エネルギーの前記分布は前記周波数帯域における前記エネルギーの完全に均一な分布とは異なり、前記周波数帯域は少なくとも1つの有効ラインを有する手段(106)と、
    前記エネルギー分布基準(nl(b))を計算するための前記手段(106)は、前記エネルギー分布基準として、所定の大きさ閾値より大きい大きさを有するスペクトル値の数のための推定値であって、所定の大きさ閾値より大きい大きさを有するスペクトル値の前記数は有効ラインの数である推定値、または、前記大きさ閾値より小さい若しくはそれに等しい大きさを有するスペクトル値の数のための推定値を決定するために形成され、前記大きさ閾値の値は、量子化器ステージに対応し、前記量子化器ステージは、前記量子化器ステージより小さいまたはそれに等しい前記が量子化器(1014)に入力された場合にゼロに量子化され
    前記雑音基準(nb(b))、前記エネルギー基準および前記エネルギー分布基準を用いて前記推定値(pe)を計算するための手段(104)とを含む、装置。
  2. 前記エネルギー分布基準を計算するための前記手段(106)は、前記エネルギー分布基準の前記計算のために前記周波数帯域におけるスペクトル値の大きさを考慮に入れるために形成される、請求項1に記載の装置。
  3. 前記エネルギー分布基準を計算するための前記手段(106)は、以下の方程式
    Figure 0004673882
    に従ってフォームファクタを計算するために形成され、
    ここで、X(k)は周波数インデックスkにおけるスペクトル値であり、kOffsetは帯域bにおける最初のスペクトル値であり、ffac(b)は前記フォームファクタである、請求項1および2のいずれかに記載の装置。
  4. 前記エネルギー分布基準を計算するための前記手段(106)は、前記周波数帯域における前記エネルギーと前記周波数帯域の幅または前記周波数帯域における前記スペクトル値の数との間の比率の4乗根を考慮に入れるために形成される、請求項1ないし3のいずれかに記載の装置。
  5. 前記エネルギー分布基準を計算するための前記手段(106)は、以下の方程式
    Figure 0004673882
    に従って前記エネルギー分布基準を計算するために形成され、
    ここで、X(k)は周波数インデックスkにおけるスペクトル値であり、kOffsetは帯域bにおける最初のスペクトル値であり、ffac(b)はフォームファクタであり、nl(b)は前記帯域bにおける前記エネルギー分布基準を表し、e(b)は前記帯域bにおける信号エネルギーであり、width(b)は前記帯域の幅である、請求項1ないし4のいずれかに記載の装置。
  6. 前記推定値を計算するための前記手段(104)は、前記周波数帯域における前記エネルギーと前記周波数帯域における前記雑音との商を用いるために形成される、請求項1ないし5のいずれかに記載の装置。
  7. 前記推定値を計算するための前記手段(104)は、以下の式
    Figure 0004673882
    を用いて前記推定値を計算するために形成され、
    ここで、peは前記推定値であり、nl(b)は前記帯域bにおける前記エネルギー分布基準を表し、e(b)は前記帯域bにおける前記信号のエネルギーであり、nb(b)は前記帯域bにおける前記許容できる雑音であり、sは好ましくは1.5に等しい加算項である、請求項1ないし6のいずれかに記載の装置。
  8. 前記推定値を計算するための前記手段(104)は、以下の式
    Figure 0004673882
    ここで、peは前記推定値であり、nl(b)は前記帯域bにおける前記エネルギー分布基準を表し、e(b)は前記帯域bにおける前記信号のエネルギーであり、nb(b)は前記帯域bにおける前記許容できる雑音であり、sは好ましくは1.5に等しい加算項であり、X(k)は周波数インデックスkにおけるスペクトル値であり、kOffsetは帯域bにおける最初のスペクトル値であり、ffac(b)はフォームファクタであり、width(b)は前記帯域の幅である、請求項1ないし7のいずれかに記載の装置。
  9. 前記信号は、スペクトル値を有するスペクトル表現として与えられる、請求項1ないし8のいずれかに記載の装置。
  10. オーディオ情報を有する信号を符号化するために必要な情報ビットの推定値を決定する方法であって、前記信号はいくつかの周波数帯域を有し、
    前記信号の周波数帯域(b)のための許容できる雑音のための雑音基準(nb(b))および前記周波数帯域(b)における前記信号のエネルギーのためのエネルギー基準(e(b))を提供するステップ(102)であって、前記周波数帯域は、前記周波数帯域における異なる周波数インデックスのための前記信号のスペクトル表現の少なくとも2つのスペクトル値を有するステップ(102)と、
    前記周波数帯域(b)における前記エネルギーの分布のためのエネルギー分布基準(nl(b))を計算するステップ(106)であって、前記周波数帯域における前記エネルギーの前記分布は、前記周波数帯域における前記エネルギーの完全に均一な分布とは異なり、前記周波数帯域は、少なくとも1つの有効ラインを有するステップ(106)と、前記エネルギー分布基準として、所定の大きさ閾値より大きい大きさを有するスペクトル値の数のための推定値であって、所定の大きさ閾値より大きい大きさを有するスペクトル値の前記数は有効ラインの数である推定値、または、前記大きさ閾値より小さい若しくはそれに等しい大きさを有するスペクトル値の数のための推定値が決定され、前記大きさ閾値の値は、量子化器ステージに対応し、前記量子化器ステージは、前記量子化器ステージより小さいまたはそれに等しい前記が量子化器(1014)に入力された場合にゼロに量子化され
    前記雑音基準(nb(b))、前記エネルギー基準(e(b))および前記エネルギー分布基準(nl(b))を用いて前記推定値(pe)を計算するステップ(104)とを含む、方法。
  11. プログラムがコンピュータ上で実行されるときに、請求項10の信号を符号化するために必要な情報ビットの推定値を決定する前記方法を実行するためのプログラムコードを有する、コンピュータプログラム。
JP2007501149A 2004-03-01 2005-02-17 推定値を決定するための方法および装置 Active JP4673882B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004009949A DE102004009949B4 (de) 2004-03-01 2004-03-01 Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
PCT/EP2005/001651 WO2005083680A1 (de) 2004-03-01 2005-02-17 Vorrichtung und verfahren zum ermitteln eines schätzwerts

Publications (2)

Publication Number Publication Date
JP2007525715A JP2007525715A (ja) 2007-09-06
JP4673882B2 true JP4673882B2 (ja) 2011-04-20

Family

ID=34894902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007501149A Active JP4673882B2 (ja) 2004-03-01 2005-02-17 推定値を決定するための方法および装置

Country Status (19)

Country Link
US (1) US7318028B2 (ja)
EP (3) EP2034473B1 (ja)
JP (1) JP4673882B2 (ja)
KR (1) KR100852482B1 (ja)
CN (1) CN1938758B (ja)
AT (1) ATE532173T1 (ja)
AU (1) AU2005217507B2 (ja)
BR (1) BRPI0507815B1 (ja)
CA (1) CA2559354C (ja)
DE (1) DE102004009949B4 (ja)
DK (1) DK1697931T3 (ja)
ES (3) ES2376887T3 (ja)
HK (1) HK1093813A1 (ja)
IL (1) IL176978A (ja)
NO (1) NO338917B1 (ja)
PL (2) PL2034473T3 (ja)
PT (2) PT3544003T (ja)
RU (1) RU2337414C2 (ja)
WO (1) WO2005083680A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2707873B1 (en) 2011-05-09 2015-04-08 Dolby International AB Method and encoder for processing a digital stereo audio signal
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US11232804B2 (en) * 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
CN111405419B (zh) * 2020-03-26 2022-02-15 海信视像科技股份有限公司 音频信号处理方法、装置及可读存储介质
CN116707557B (zh) * 2022-12-20 2024-05-03 荣耀终端有限公司 信道选择方法、接收机及存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0446037B1 (en) * 1990-03-09 1997-10-08 AT&T Corp. Hybrid perceptual audio coding
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
DE69334139T2 (de) * 1992-06-24 2008-01-10 British Telecommunications P.L.C. Testen von Nachrichtenübertragungsgerät
JP2927660B2 (ja) * 1993-01-25 1999-07-28 シャープ株式会社 樹脂封止型半導体装置の製造方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6418408B1 (en) * 1999-04-05 2002-07-09 Hughes Electronics Corporation Frequency domain interpolative speech codec system
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
JP2001166797A (ja) * 1999-12-07 2001-06-22 Nippon Hoso Kyokai <Nhk> オーディオ信号の符号化装置
US6937979B2 (en) * 2000-09-15 2005-08-30 Mindspeed Technologies, Inc. Coding based on spectral content of a speech signal
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US6996523B1 (en) * 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
US6912495B2 (en) * 2001-11-20 2005-06-28 Digital Voice Systems, Inc. Speech model and analysis, synthesis, and quantization methods

Also Published As

Publication number Publication date
PL3544003T3 (pl) 2021-07-12
EP2034473A3 (de) 2015-09-16
ATE532173T1 (de) 2011-11-15
RU2006134638A (ru) 2008-04-10
IL176978A0 (en) 2006-12-10
DE102004009949B4 (de) 2006-03-09
PL2034473T3 (pl) 2019-11-29
CA2559354A1 (en) 2005-09-09
CN1938758B (zh) 2010-11-10
CN1938758A (zh) 2007-03-28
EP2034473B1 (de) 2019-05-15
EP3544003A1 (de) 2019-09-25
NO20064432L (no) 2006-09-29
AU2005217507A1 (en) 2005-09-09
RU2337414C2 (ru) 2008-10-27
JP2007525715A (ja) 2007-09-06
KR20060121978A (ko) 2006-11-29
CA2559354C (en) 2011-08-02
NO338917B1 (no) 2016-10-31
DE102004009949A1 (de) 2005-09-29
DK1697931T3 (da) 2012-02-27
ES2376887T3 (es) 2012-03-20
HK1093813A1 (en) 2007-03-09
IL176978A (en) 2012-08-30
PT3544003T (pt) 2021-02-04
US7318028B2 (en) 2008-01-08
ES2739544T3 (es) 2020-01-31
US20070129940A1 (en) 2007-06-07
BRPI0507815A (pt) 2007-07-10
AU2005217507B2 (en) 2008-08-14
BRPI0507815B1 (pt) 2018-09-11
WO2005083680A1 (de) 2005-09-09
EP1697931A1 (de) 2006-09-06
EP2034473A2 (de) 2009-03-11
ES2847237T3 (es) 2021-08-02
KR100852482B1 (ko) 2008-08-18
EP1697931B1 (de) 2011-11-02
PT2034473T (pt) 2019-08-05
EP3544003B1 (de) 2020-12-23

Similar Documents

Publication Publication Date Title
JP4673882B2 (ja) 推定値を決定するための方法および装置
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
AU2005217508B2 (en) Device and method for determining a quantiser step size
JP5096468B2 (ja) サイド情報なしの時間的ノイズエンベロープの自由な整形
EP2346029B1 (en) Audio encoder, method for encoding an audio signal and corresponding computer program
KR100899141B1 (ko) 인코딩된 신호의 처리
US7983909B2 (en) Method and apparatus for encoding audio data
US20100063826A1 (en) Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program
EP3707713B1 (en) Controlling bandwidth in encoders and/or decoders
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
CN110534119B (zh) 一种基于人耳听觉频率尺度信号分解的音频编解码方法
MXPA06009934A (es) Metodo y aparato para determinar un estimado
MXPA06009932A (en) Device and method for determining a quantiser step size

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100215

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110121

R150 Certificate of patent or registration of utility model

Ref document number: 4673882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140128

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250