JP2011527455A - ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号 - Google Patents

ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号 Download PDF

Info

Publication number
JP2011527455A
JP2011527455A JP2011516997A JP2011516997A JP2011527455A JP 2011527455 A JP2011527455 A JP 2011527455A JP 2011516997 A JP2011516997 A JP 2011516997A JP 2011516997 A JP2011516997 A JP 2011516997A JP 2011527455 A JP2011527455 A JP 2011527455A
Authority
JP
Japan
Prior art keywords
spectral
noise
quantized
representation
noise filling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011516997A
Other languages
English (en)
Other versions
JP5307889B2 (ja
Inventor
ニコラウス レッテルバッハ
ベルンハルト グリル
ギヨーム フックス
シュテファン ガヤーズベアガー
マルクス マルトラス
ハラルド ポップ
ユールゲン ヘレ
シュテファン ヴァブニック
ゲラルド シューラー
イェンス ヒルシュフェルト
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40941986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2011527455(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2011527455A publication Critical patent/JP2011527455A/ja
Application granted granted Critical
Publication of JP5307889B2 publication Critical patent/JP5307889B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズ充填されたスペクトル表現を提供するノイズ充填装置は、入力スペクトル表現の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔している入力スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するように構成されたスペクトル領域識別器と、識別されたスペクトル領域に選択的にノイズを導入し、オーディオ信号のノイズ充填されたスペクトル表現を取得するように構成されたノイズ挿入器を備える。オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供するノイズ充填パラメータ演算装置は、上述のようなスペクトル領域識別器と、ノイズ充填パラメータの演算のために、識別されたスペクトル領域の量子化誤差を選択的に考慮するように構成されたノイズ値演算器を備える。したがって、オーディオ信号を表現する符号化されたオーディオ信号表現を取得することができる。
【選択図】図1

Description

本発明に係る実施形態は、オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズが充填されたスペクトル表現を提供するノイズ充填装置、オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供するノイズ装填パラメータ演算装置、オーディオ信号を表現する符号化されたオーディオ信号表現、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供する方法、および、前記方法を実施するためのコンピュータプログラムに関する。
以下において、本発明に係る実施形態に有効に適用することができるいくつかのシナリオが記載される。多くの周波数ドメインのオーディオ信号エンコーダは、いくつかの周波数領域またはスペクトル領域(例えば、時間ドメインから周波数ドメインへの変換によって提供される周波数ラインまたはスペクトルライン)が他のスペクトル領域よりもより重要であるという考えに基づいている。したがって、音響心理学的に関連性の高いスペクトル領域は、一般的に、音響心理学的に関連性の低いスペクトル領域より高い精度で符号化される。異なるスペクトル領域の音響心理学的関連性は、例えば、隣接する強いスペクトルピークによる弱いスペクトル領域のマスキングを考慮に入れた音響心理学的モデルを用いて算出することができる。
符号化されたオーディオ信号のビットレートを低いレベルに低減したいという願望がある場合、いくつかのスペクトル領域は超低精度(例えば、わずか1ビット精度または2ビット精度)で量子化される。したがって、低い精度で量子化されたスペクトル領域の多くは、ゼロに量子化される。このように、低ビットレートの変換ベースのオーディオコーダは、異なるアーチファクト(人工産物)、特にゼロに量子化された周波数ラインを起源とするアーチファクトを受けやすい。実際、低ビットレートのオーディオ符号化におけるスペクトル値の粗い量子化は、多くのスペクトルラインがゼロに量子化されたかも知れないので、逆量子化の後に非常にまばらなスペクトルに導く可能性がある。復元された信号におけるこれらの周波数ホールは、望ましくないサウンドアーチファクトを生ずる。スペクトルにおける周波数ホールがフレーム毎に移動するとき、それは再生されたサウンドを非常にシャープにまたは不安定に(バーディ)にする。
ノイズ充填は、デコーダ側で、ゼロ量子化されている係数またはバンドをランダムノイズで充填することによってこれらのアーチファクトをマスクする手段である。挿入されるノイズのエネルギーは、エンコーダによって計算されて送信されるパラメータである。
ノイズ充填の異なるコンセプトは知られている。例えば、いわゆるAMR−WR+は、例えば非特許文献1に記載されたように、ノイズ充填と離散フーリエ変換(DFT)を結合する。加えて、国際規格ITU-TのG.729.1は、ノイズ充填と修正された離散コサイン変換(MDCT)を結合するコンセプトを定める。詳細は、非特許文献2に記載されている。
ノイズ充填に関する更なる側面は、特許文献1に記載されている。
しかしながら、従来のノイズ充填のコンセプトは、オーディオ歪に結果としてなる。
この議論をかんがみて、改良された聴覚インプレッションを提供するためのノイズ充填コンセプトを構築することが望まれている。
国際出願番号PCT/IB2002/001388、出願人:KONINKLIJKE PHILIPS ELECTRONICS N.V. [NL/NL];Groenewoudseweg 1 NL-5621 BA Eindhoven (NL)、発明者:TAORI, Rakesh;Prof Holstlaan 6 NL-5656 AA Eindhoven (NL) 、VAN DE PAR, Steven, L., J., D., E.;Prof. Holstlaan 6 NL-5656 AA Eindhoven (NL).
「拡張された適応マルチレートワイドバンド(AMR-WB+)コーデック、3GRP TS 26.290 V6.3.0、2005-06、技術仕様書 Ragot 他、「ITU-T G.729.l :IP上の広帯域電話および音声のためのG.729と相互運用可能な8−32Kbit/s のスケーラブルコーダ」、Vol.4、ICASSP 07、15-20 2007年4月 映画および付随するオーディオの汎用コーディング:アドバースド・オーディオ・コーディング、国際規格 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997年
本発明に係る実施形態は、オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズ装填されたスペクトル表現を提供するノイズ充填装置を構築する。ノイズ充填装置は、入力スペクトル表現の非ゼロスペクトル領域(例えば、スペクトルラインまたはスペクトルビン)から少なくとも一つの中間スペクトル領域によって離隔している入力スペクトル表現のスペクトル領域(例えば、スペクトルラインまたはスペクトルビン)を識別し、識別されたスペクトル領域を取得するように構成されたスペクトル領域識別器を備える。ノイズ充填装置は、また、識別されたスペクトル領域(例えば、スペクトルラインまたはスペクトルビン)に選択的にノイズを導入し、オーディオ信号のノイズ充填されたスペクトル表現を取得するように構成されたノイズ挿入器を備える。
本発明のこの実施形態は、オーディオ信号のスペクトル表現の音の成分が、ノイズ充填がこのような音の成分の直接の近傍に適用される場合に、聴覚インプレッションに関して、通常は劣化するという発見に基づいている。したがって、ノイズ充填がこの種の音の非ゼロスペクトル領域から距離を置いて配置されたスペクトル領域にのみ適用される場合には、ノイズ充填されたオーディオ信号の改善された聴覚インプレッションを取得できることが分かっている。したがって、ノイズ充填装置に入力された量子化スペクトル表現においてゼロに量子化されないオーディオ信号スペクトルの音の成分は、大きなスペクトルホールの存在が依然として効果的に回避されながら、聞き取れる状態に保たれる(すなわち、密接に隣接したノイズで汚されない)。
好ましい実施形態において、スペクトル領域識別器は、識別されるスペクトル領域として、ゼロに量子化され、少なくとも第1の予め定められた数のゼロに量子化されている低い周波数の隣接するスペクトルラインと、少なくとも第2の予め定められた数のゼロに量子化されている高い周波数の隣接するスペクトルラインとを備え、第1の予め定められた数が1より大きいまたは1に等しく、第2の予め定められた数が1より大きいまたは1に等しい、入力スペクトル表現のスペクトルラインを識別するように構成される。本実施形態において、ノイズ挿入器は、非ゼロに量子化されているスペクトルラインおよびゼロに量子化されているスペクトルラインを残し、しかし第1の予め定められた数のゼロに量子化されている低い周波数の隣接するスペクトルライン、または、第2の予め定められた数のゼロに量子化されている高い周波数の隣接するスペクトルラインをノイズ充填によって影響を受けないようにすることなく、識別されたスペクトルラインに選択的にノイズを導入するように構成される。このように、ノイズ充填は、上方のスペクトル方向と下へのスペクトル方向の両方において、例えば第1の予め定められた数のゼロに量子化されている低い周波数の隣接するスペクトルラインおよび第2の予め定められた数のゼロに量子化されている高い周波数の隣接するスペクトルラインによって、ゼロに量子化され、非ゼロに量子化されているラインから離れたスペクトルラインにのみノイズが導入されるという点で選択的である。
好ましい実施形態において、非ゼロ値に量子化されているラインから上方の周波数方向における最小間隔が非ゼロに量子化されているラインから下方の周波数方向における最小間隔に等しいように、第1の予め定められた数は第2の予め定められた数に等しい。
好ましい実施形態において、ノイズ充填装置は、オーディオ信号のスペクトル表現の下部をノイズ充填によって影響を受けないように残しながら、オーディオ信号のスペクトル表現の上部のスペクトル領域にのみノイズを導入するように構成される。このようなコンセプトは、通常高い周波数は低い周波数より知覚的に重要でないので、有用である。ゼロ量子化された値も、大部分はスペクトルの後半において(すなわち高周波に対して)起こる。また、高い周波数におけるノイズの付加は、最終的なノイズの多いサウンドの回復を得やすくはない。
好ましい実施形態において、スペクトル領域識別器は、与えられたスペクトル領域の予め定められた両側のスペクトル近傍(すなわち高い周波数と低い周波数の両方に延びるスペクトル近傍)におけるスペクトル領域の量子化された強度値(例えば、エネルギー値または振幅値)を合計し、合計値を取得し、与えられたスペクトル領域が識別されたスペクトル領域か否かを決定するために合計値を評価するように構成される。与えられたスペクトル領域の両側のスペクトル近傍上の量子化されたスペクトルのエネルギーの合計値は、ノイズ充填を与えられたスペクトル領域に適用すべきかどうかを決定するために意味のある量であることが分かっている。
他の好ましい実施形態において、スペクトル領域識別器は、ゼロに量子化されているスペクトル領域の連続したシーケンスを検出するために入力スペクトル表現のスペクトル領域の範囲をスキャンし、このような検出された連続したシーケンスの一つ以上の中心スペクトル領域(すなわち非境界スペクトル領域)を識別されたスペクトル領域として認識するように構成される。
ゼロに量子化されているスペクトル領域の特定の「ランレングス」の検出は、特に低い計算量によって実施できるタスクであることが分かっている。このようなスペクトル領域の連続したシーケンスを識別するために、スペクトル領域のこのシーケンスの範囲内のすべてのスペクトル領域がゼロに量子化されているかどうかを決定することが可能であり、それは比較的単純なアルゴリズムまたは回路を用いて実行することができる。このようなスペクトル領域の連続したシーケンスがゼロに量子化されていることが分かった場合、シーケンスの一つ以上の内部スペクトル領域(それはスペクトル領域の現在のシーケンスの外側のスペクトル領域から十分遠くに離間している)は、識別されたスペクトル領域とみなされる。このように、スペクトル領域の範囲を通してスキャンすることによって(例えば、スペクトル領域の異なるシフトされたシーケンスを引き続いて選択することによって)、ゼロに量子化され、非ゼロに量子化されているスペクトル領域から予め定められた最小距離だけ離隔しているスペクトル領域を識別するためにスペクトル表現の効率的な解析を行うことができる。
本発明に係る他の実施形態は、オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供するノイズ充填パラメータ演算装置を構築する。ノイズ充填パラメータ演算装置は、量子化スペクトル表現の非ゼロのスペクトル領域から少なくとも一つの中間のスペクトル領域によって離隔している量子化スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するように構成されたスペクトル領域識別器を備える。ノイズ充填パラメータ演算装置は、また、ノイズ充填パラメータの演算に対して、識別されたスペクトル領域の量子化誤差を選択的に考慮するように構成されたノイズ値演算器を備える。ノイズ充填パラメータ演算装置は、デコーダ側のノイズ充填を(非ゼロ値に量子化されている)音のスペクトル領域から離隔しているスペクトル領域に制限することが望ましく、結果的にノイズパラメータはエンコーダ側で算出されるべきであるというキーアイデアに基づいている。したがって、上記のデコーダコンセプトに特によく適合したノイズ充填パラメータが取得される。ゼロに量子化され、非ゼロ値に量子化されているスペクトル領域に非常に近いスペクトル領域は、真にノイズのようなオーディオコンテンツをしばしば反映せず、むしろ隣接した(非ゼロ値に量子化されている)音のスペクトル領域に強く相関していることも分かっている。したがって、ノイズ充填パラメータの演算に対して非ゼロ値に量子化されているスペクトル領域に近いスペクトル領域の量子化誤差を考慮することは、これが通常は強いノイズの過剰評価に結果としてなり、それにより非常にノイズの多い復元されたスペクトル表現に結果としてなるため、一般に望ましくないことが分かっている。
このように、本願明細書に記載されているノイズ充填パラメータ演算コンセプトは、上記のノイズ充填コンセプトとの組み合せにおいて有用であり、従来のノイズ充填コンセプトとの組み合せにおいてさえも有用である。
他の好ましい実施形態では、ノイズ充填装置に関して述べられたスペクトル領域の識別のためのコンセプトは、ノイズ充填パラメータ演算装置と組み合わせて適用することもできる。
別の好ましい実施形態では、ノイズ値演算器は、ノイズ充填パラメータの演算に対して、識別されたスペクトル領域の量子化誤差の実際のエネルギーを考慮するように構成される。実際の量子化誤差は、通常は統計学的に期待される量子化誤差から逸脱するため、(推定された量子化誤差または平均的な量子化誤差よりもむしろ)実際の量子化誤差の考慮が、通常は改良された結果をもたらすことが分かっている。
更なる好ましい実施形態では、ノイズ値演算器は、単一のスペクトル領域に集中された音の量子化誤差エネルギーに対して、複数の識別されたスペクトル領域上に分布した非音の量子化誤差エネルギーを強調するように構成される。このコンセプトは、平均エネルギーが量子化スレショルド以下にあり、それ故にゼロに量子化されている非音の広帯域ノイズが、ゼロに量子化されている非音の広帯域ノイズとゼロに量子化されている音の成分がともにゼロに量子化されている場合であっても、強度が量子化スレショルド以下にある単一の音のオーディオ成分よりも、ノイズ充填装置に知覚的に非常に関連するという発見に基づいている。その理由は、デコーダでランダムノイズを生成することによるノイズ充填装置が、量子化スペクトル表現における非音の広帯域ノイズを見逃し、音の成分を見逃さないことをモデル化できることである。このように、ゼロに量子化されている非音のノイズ成分の、ゼロに量子化されている音の成分上での強調は、より現実的なサウンド復元をもたらす。これは、また、人間の聴覚インプレッションが、ゼロに量子化されている小さいスペクトルピークの欠如によるよりも、スペクトルホールの存在(例えば、ゼロに量子化されている広帯域ノイズの欠如の形での)によって非常に多く劣化されるという事実による。音の成分は、単一のスペクトルラインに集中することができ、またはいくつかのスペクトルの連続するライン(例えば、i−1,i,i+1)上に拡散することができる。スペクトル領域は、例えば、一つ以上のスペクトルラインを備えることができる。
好ましい実施形態において、ノイズ値演算器は、識別されたスペクトル領域の対数化された量子化誤差エネルギーの合計を演算し、ノイズ充填パラメータを取得するように構成される。識別されたスペクトル領域の対数化された量子化誤差エネルギーの合計を演算することによって、上記のゼロに量子化されている音の領域上のゼロに量子化されている非音のスペクトル領域の相対的な強調を効率的な方法で得ることができる。
本発明に係る他の実施形態は、オーディオ信号を表現するための符号化されたオーディオ信号表現を構築する。符号化されたオーディオ信号表現は、オーディオ信号の符号化された量子化スペクトルドメイン表現および符号化されたノイズ充填パラメータを備える。ノイズ充填パラメータは、ゼロに量子化され、非ゼロに量子化されているスペクトルドメイン表現のスペクトル領域から少なくとも予め定められた数の中間スペクトル領域によって離隔しているスペクトルドメイン表現のスペクトル領域の量子化誤差を表わす。上記の符号化されたオーディオ信号表現は、上述のノイズ充填装置に用いることができ、上述のノイズ充填パラメータ演算装置を用いて取得することができる。符号化されたオーディオ信号表現は、ノイズ充填パラメータが、意味のあるノイズ情報が存在し、デコーダ側でノイズ充填に対して選択的に考慮されるべきこのようなスペクトル領域に対して、量子化スペクトルドメイン表現の量子化誤差を選択的に反映するので、特に良好なオーディオ品質を有するオーディオ信号の復元を可能とする。
本発明に係る他の実施形態は、オーディオ信号のノイズ充填された表現を提供する方法を構築する。
本発明に係る更に他の実施形態は、オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供する方法を構築する。
本発明に係るさらにもう一つの実施形態は、上述した方法を実施するためのコンピュータプログラムを構築する。
本発明に係る実施形態は、添付図面を参照して引き続いて記載される。
本発明の一実施形態に係るノイズ充填装置の概略ブロック図を示す。 本発明に係るノイズ充填装置を備えるオーディオ信号デコーダの概略ブロック図を示す。 図1のノイズ充填装置の機能を実施するための疑似プログラムコードを示す。 図1に係るノイズ充填装置において実行することができるスペクトル領域の識別のグラフィック表現を示す。 本発明の一実施形態に係るノイズ充填パラメータ演算装置の概略ブロック図を示す。 図5に係るノイズ充填パラメータ演算装置の機能を実施するための疑似プログラムコードを示す。 オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズ充填されたスペクトル表現を提供する方法のフローチャートを示す。 オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供する方法のフローチャートを示す。 本発明の一実施形態に係るオーディオ信号表現のグラフィック表現を示す。
図1-4に係るノイズ充填装置
図1は、本発明の一実施形態に係るノイズ充填装置100の概略ブロック図を示す。ノイズ充填装置100は、復号化されたスペクトル係数の形(例えば量子化されたまたは逆量子化された)で、オーディオ信号の入力スペクトル表現110を受信するように構成される。ノイズ充填装置100は、また、入力スペクトル表現110に基づいてオーディオ信号のノイズ充填されたスペクトル表現112を提供するように構成される。
ノイズ充填装置100は、入力スペクトル表現110の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔している入力スペクトル表現110のスペクトル領域を識別するように構成されたスペクトル領域識別器120を備え、識別されたスペクトル領域を示す情報122を取得する。ノイズ充填装置100は、また、識別されたスペクトル領域(情報122によって記述された)に選択的にノイズを導入するように構成されたノイズ挿入器130を備え、オーディオ信号のノイズ充填されたスペクトル表現112を取得する。
ノイズ充填装置100の機能に関して、ノイズ充填装置100は、入力スペクトル表現110のスペクトル領域(例えば、スペクトルラインまたはスペクトルビン)に、例えば、ゼロに量子化されているスペクトルラインのスペクトル値をノイズを記述する置換スペクトル値で置換することによって、ノイズを選択的に充填すると一般的に言うことができる。このようにして、例えば入力スペクトル表現110の粗い量子化に起因する入力スペクトル表現110内のスペクトルホールまたはスペクトルギャップを充填することができる。しかしながら、ノイズ充填装置100は、ゼロに量子化されているスペクトルライン(すなわち、ゼロに量子化されているスペクトル値のスペクトルライン)のすべてにノイズを導入するというわけではない。むしろ、ノイズ充填装置100は、非ゼロ値に量子化されているいかなるスペクトルラインからも充分な距離を備えたようなゼロに量子化されているスペクトルラインにノイズを導入するだけであり、ノイズ充填は、スペクトルホールまたはスペクトルギャップを完全に充填するわけではなく、ノイズが導入されたそれらのスペクトルラインと非ゼロに量子化されているスペクトルラインの間で、少なくとも一つのスペクトル領域(または少なくとも他の予め定められた数のスペクトル領域)のスペクトル距離を維持する。このように、スペクトル表現に導入された充填ノイズと非ゼロ値に量子化されているスペクトルラインの間のスペクトル距離は、音響心理学的に関連したスペクトルライン(それは、オーディオ信号の入力スペクトル表現においてゼロに量子化されない)が、ノイズ充填装置によってスペクトルに導入された充填ノイズから(一つ以上のスペクトル領域の予め定められた数のスペクトル距離に起因して)明らかに区別できるように維持される。したがって、音響心理学的に最も関連性のあるオーディオコンテンツ(入力スペクトル表現110において非ゼロスペクトルライン値によって表された)は、大きなスペクトルホールを回避しながら、明らかに知覚することができる。これは、ノイズ充填が、スペクトルホールまたはスペクトルギャップの中心領域において実行されながら、非ゼロ値に量子化されている入力スペクトル表現のスペクトルライン付近において選択的に省略されるという事実に起因する。
以下に、ノイズ充填装置100のアプリケーション環境が、図2を参照して記載される。図2は、本発明の一実施形態に係るオーディオ信号デコーダ200の概略ブロック図を示す。オーディオ信号デコーダ200は、キーコンポーネントとしてノイズ充填装置100を備える。オーディオ信号デコーダ200は、また、符号化されたオーディオ信号表現212を受信し、符号化されたオーディオ信号のスペクトル係数の復号化された、オプションとして逆量子化された表現214を提供するように構成されたスペクトル係数デコーダ210を備える。スペクトル係数デコーダ210は、例えば、エントロピーデコーダ(例えば、算術デコーダまたはランレングスデコーダ)と、オプションとして、符号化されたオーディオ信号表現212からスペクトル係数の復号化された表現214(例えば、逆量子化された係数の形で)を導き出すために、逆量子化器を備えることができる。ノイズ充填装置100は、オーディオ信号の入力スペクトル表現110として、スペクトル係数の復号化された表現214(それは、オプションとして逆量子化される)を受信するように構成される。
オーディオ信号デコーダ200は、また、符号化されたオーディオ信号表現212からノイズファクタ情報222を抽出し、抽出されたノイズファクタ情報222をノイズ充填装置100に提供するように構成されたノイズファクタ抽出器220を備える。オーディオ信号デコーダ200は、また、ノイズ充填装置100から復元されたスペクトル表現232を受信するように構成されたスペクトルリシェーパ230を備える。復元されたスペクトル表現232は、例えば、ノイズ充填装置によって提供されたノイズ充填されたスペクトル表現112に等しくてもよい。オプションと考えることができるスペクトルリシェーパ230は、復元されたスペクトル表現232に基づいてスペクトル情報234を提供するように構成される。オーディオ信号デコーダ200は、スペクトルリシェーパ230によって提供された、または、スペクトルリシェーパ230がない場合には、復元されたスペクトル表現232によって提供されたスペクトル表現234を受信し、それに基づいて時間ドメインオーディオ信号表現242を提供する、スペクトルドメインから時間ドメインへの変換器240を更に備える。スペクトルドメインから時間ドメインへの変換器240は、例えば、逆修正離散コサイン変換(IMDCT)を実行するように構成することができる。
好ましい実施形態において、デコーダ側でのノイズ充填は、以下のステップを備える(または以下のステップに従う)。
1.暗騒音を復号化する。
2.周波数ラインの量子化値を復号化する。
3.ゼロのランレングスが最小ランレングスサイズより高いスペクトルの選択された部分におけるスペクトル領域を検出する。
4.選択された領域内のそれぞれのラインに対する復号化された暗騒音に、ランダムに生成された符号を適用する。
暗騒音は、以下のように復号化される。
nf_decoded = 0.0625 * ( 8 - index )
検出されたスペクトル領域は、例えば、エンコーダ側でなされたのと同じ方法(それは後述される)で選択される。
MDCTドメインにおけるメモリレスのガウスノイズは、すべてのラインに対して同じ振幅を有するがランダムな符号を有するスペクトルによって生成される。そして、選択された領域内の各ラインに対して、デコーダは、ランダムな符号(−1または+1)を生成し、それを復号化された暗騒音に適用する。しかしながら、ノイズ貢献度を提供する他の方法を同様に適用することができる。
以下に、図1、2、3および4を参照していくつかの詳細が記載され、ここで、図3はノイズ充填装置100によって実行することができるデコーダ側でのノイズ充填のアルゴリズムの疑似プログラムコードを示し、図4はノイズ充填のグラフィック表現を示す。
まず第一に、暗騒音の復号化は、ノイズファクタ抽出器220によって実行することができ、それは例えばノイズファクタインデックス(簡単に「インデックス」としても示される)を受信し、それに基づいて復号化されたノイズファクタ値222(「nf_decoded」によっても示される)を提供する。ノイズファクタインデックスは、例えば3または4ビットを用いて符号化することができ、例えば0と7の間の整数値または0と15の間の整数値とすることができる。
周波数ライン(「スペクトルライン」または「スペクトルビン」としても示される)の量子化値は、スペクトル係数デコーダ210によって提供することができる。したがって、量子化された(またはオプションとして逆量子化された)スペクトルライン値(「スペクトル係数」としても示される)が取得され、それは「量子化(x(i))としても示される。ここで、iは、スペクトルライン値の周波数インデックスを示す。
続いて、ノイズ充填装置100によって、ゼロ(すなわち、ゼロに量子化されているスペクトルライン値)のランレングスが最小ランレングスサイズより高いスペクトルの選択された部分において(例えば、予め定められたスペクトルライン周波数インデックスiから始まるスペクトルの上側の部分において)、スペクトル領域が検出される。このようなスペクトル領域の検出は、図3のアルゴリズム300の第1部分310によって実行される。アルゴリズム300の第1部分310に示すように、検出された領域の集合Rは、アルゴリズムの初めにおいて空集合に初期化される(R={};)。
図3のアルゴリズムの実施例において、最小ランレングスは8の固定値にセットされているが、当然、他のいかなる値を選ぶこともできる。
続いて、考慮中の複数のスペクトルライン(実行変数「line index」によって示される)に対して、考慮中のこれらのスペクトルラインの各々が、ゼロに量子化されているスペクトルラインの両側の周囲の状況を備えるかどうか(そして、考慮中のスペクトルラインがゼロに量子化されているそれ自体であるかどうか)が、判定される。例えば、スペクトルの後半のすべてのラインが考慮中のラインとして連続的に考えることができ、現在考慮中のラインは、周波数インデックス「line index」によって示される。「line index」によって示された考慮中のラインに対して、「line index - (MinimalRunLength)/2」のスペクトルライン周波数インデックスから「line index + MinimalRunLength)/2」のスペクトルライン周波数インデックスに及ぶ周囲の状況において、量子化スペクトル係数「量子化(x(i))」の合計が演算される。現在考慮中のスペクトルラインの前記周囲の状況におけるスペクトルライン値(スペクトルライン周波数インデックス「line index」を有する)の合計がゼロであることが分かっている場合、現在考慮中のスペクトルライン(または、より正確に言うと、そのスペクトルライン周波数インデックス「line index」)は、検出された領域(または検出されたスペクトルライン)の集合Rに加えられる。従って、スペクトルラインのスペクトルライン周波数インデックスが集合Rに加えられる場合、これは、「line index - MinimalRunLength)/2」と「line index + MinimalRunLength)/2」の間のラインインデックスを有するスペクトルラインがゼロに量子化されているスペクトルライン値をすべて備えることを意味する。
したがって、疑似プログラムコードの第1部分310において、非ゼロ値に量子化されているいかなるスペクトルラインからも「十分に」(すなわち、少なくともMinimalRunLength/2ラインだけ)離隔している考慮中のスペクトル部分のそれらの(そして、それらのみの)スペクトルラインを列挙するスペクトルライン周波数インデックス「line index」の集合Rが取得される。
このような領域の検出は、スペクトルのグラフィック表現400を示す図4に図示される。横軸410は、スペクトルライン周波数インデックス「line index」に関するスペクトルラインの周波数を記述する。縦軸412は、スペクトルラインの強度(例えば、振幅またはエネルギー)を記述する。図に示すように、グラフィック表現400に図示されたスペクトルの部分は、非ゼロ値に量子化されている4個のスペクトルライン420a、420b、420cおよび420dを備える。更に、スペクトルライン420cと420dの間に、ゼロに量子化されている11個のスペクトルライン422a〜422kがある。更に、スペクトルラインは、現在考慮中のスペクトルラインと非ゼロ値に量子化されている他のいかなるスペクトルラインの間に少なくとも4つのゼロに量子化されているスペクトルラインがある場合に、(そして、当然、現在考慮中のスペクトルラインが、ゼロに量子化されているそれ自身である場合に、)非ゼロ値に量子化されているスペクトルラインから十分に離間していると考慮されるだけであると仮定される。しかしながら、スペクトルライン422aを考慮するとき、スペクトルライン422aは、スペクトルライン422aのスペクトルライン周波数インデックスがアルゴリズム300の最初のパート310によって演算された集合Rの一部にならないように、ゼロに量子化されていないスペクトルライン422cと直接隣接していることが分かる。同様に、スペクトルライン422b、422cおよび422dは、スペクトルライン422b〜422dのスペクトルライン周波数インデックスも集合Rの一部にならないように、非ゼロ値に量子化されているいかなるスペクトルラインからも十分に間隔をおいて配置されていないことが分かる。対照的に、スペクトルライン422eは、すべてゼロに量子化されている9個の連続するスペクトルラインのシーケンスの中心のライン(または、より一般的にいえば、中心線)であるので、スペクトルライン422eは、非ゼロ値に量子化されているいかなるスペクトルラインからも十分に離間していると認識される。したがって、スペクトルライン422eのスペクトルライン周波数インデックスは、アルゴリズム300の第1部分310において演算された集合Rの一部である。スペクトルライン422f、422gは、非ゼロ値に量子化されているいかなる低い周波数のスペクトルライン420a、420bおよび420cからも、非ゼロ値に量子化されているいかなる高い周波数のスペクトルラインからも十分に離間しているので、スペクトルライン422fおよび422gのスペクトルライン周波数インデックスがアルゴリズム300の第1部分310において決定された集合Rの一部であるように、スペクトルライン422fおよび422gに対しても同じことがあてはまる。他方、スペクトルライン422h、422i、422jおよび422kは、周波数に関して、非ゼロ値に量子化されているスペクトルライン420dのそばにあまりに密接に位置するので、これらのスペクトルラインは集合Rの一部でない。
したがって、スペクトルライン420a、420b、420c、420dは、非ゼロ値に量子化されているので、集合Rはこれらのスペクトルラインのスペクトルライン周波数インデックスを含まない。加えて、スペクトルライン422a、422b、422c、422d、422h、422i、422jおよび422kは、スペクトルライン420a、420b、420cおよび420dのそばにあまりに密接に位置するので、これらのスペクトルラインのスペクトルライン周波数インデックスは集合Rの一部でない。対照的に、スペクトルライン422e、422f、422gは、それ自身ゼロに量子化され、いかなる隣接する非ゼロスペクトルラインからも十分に離間しているので、これらのスペクトルラインのスペクトルライン周波数インデックスは集合Rに含まれる。
アルゴリズム300は、また、暗騒音を復号化する第2部分320を備え、ノイズ値インデックス(プログラムコード部320の「index」)は復号化されたノイズファクタ値(プログラムコード300の「nf_decoded」)に変換される。
プログラムコード300は、また、識別されたスペクトルライン、すなわちスペクトルライン周波数インデックスiが集合Rにあるスペクトルラインにノイズを充填する第3部分330を備える。この目的のため、識別されたスペクトルライン(例えば、実行変数iが集合Rに含まれるすべてのスペクトルライン周波数インデックスを引き続いてとるx(i)で示される)のスペクトル値がノイズ充填値にセットされる。ノイズ充填値は、例えば、復号化されたノイズ充填値(nf_decoded)に乱数または疑似乱数(「ランダム(−1、+1)で示す)を掛けることによって取得され、乱数または疑似乱数は、例えば数−1と+1をランダムにまたは疑似ランダムにとることができる。しかしながら、ランダムまたは疑似ランダムノイズの異なる供給は当然可能である。
ノイズ充填は、図4においても図示される。
図4に示すように、スペクトルライン422e、422fおよび422gのゼロスペクトル値は、ノイズ充填値で置き換えられる(図4において点線で図示される)。
図5および6に係るノイズ充填パラメータ演算装置
図5は、ノイズ充填パラメータ演算装置500の概略ブロック図を示す。ノイズ充填パラメータ演算装置は、オーディオ信号の量子化スペクトル表現510を取得し、それに基づいてノイズ充填パラメータ512を提供するように構成される。ノイズ充填パラメータ演算装置500は、オーディオ信号の量子化スペクトル表現510を受信し、量子化スペクトル表現510の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域(例えばスペクトルライン)によって離隔している量子化スペクトル表現510のスペクトル領域(例えばスペクトルライン)を識別し、識別されたスペクトル領域(例えば識別されたスペクトルライン)を記述する情報522を取得するように構成された、スペクトル領域識別器520を備える。ノイズ充填パラメータ演算装置500は、更に、量子化誤差情報532を受信し、ノイズ充填パラメータ512を提供するように構成されたノイズ値演算器530を備える。この目的のため、ノイズ値演算器は、ノイズ充填パラメータ512の演算のために、情報522によって記述された識別されたスペクトル領域の量子化誤差を選択的に考慮するように構成される。
量子化誤差情報532は、例えば、量子化スペクトル表現510においてゼロに量子化されているそれらのスペクトルラインのエネルギー(または強度)を記述するエネルギー情報(または強度情報)と同一とすることができる。
ノイズ充填パラメータ演算装置500は、オプションとして、オーディオ信号の非量子化スペクトル表現542を受信し、オーディオ信号の量子化スペクトル表現510を提供するように構成された量子化器540を備えることができる。量子化器540は、調節可能な量子化分解能を有することができ、それは例えばスペクトルラインについてまたはスペクトルバンドについて(例えば、音響心理学的モデルを用いて取得されたスペクトルラインまたはスペクトルバンドの音響心理学的関連性に依存して)、個別に調節可能とすることができる。可変分解能量子化器の機能は、国際規格ISO/IEC13818-7およびISO/IEC14496-3に記載されている機能と同一とすることができる。特に、量子化器540は、オーディオ信号の量子化スペクトル表現(510)においてスペクトルギャップまたはスペクトルホール、すなわちゼロに量子化されている隣接するスペクトルラインの連続する領域があるように調整することができる。
さらに、非量子化スペクトル表現542は、量子化誤差情報532として役立つことができ、または、量子化誤差情報532は、非量子化スペクトル表現542から導き出すことができる。
以下において、ノイズ充填パラメータ演算装置500によって実行されるノイズ充填パラメータ演算の機能が詳細に記載される。エンコーダ側でのノイズ充填パラメータ演算において、ノイズ充填は、好ましくは量子化ドメインにおいて適用される。このように、導入されたノイズは、音響心理学的に関連する逆フィルタによってその後形づくられる。
デコーダによって導入されるノイズのエネルギーは、次のステップに従ってエンコーダ側で演算され、符号化される。
1.周波数ラインの量子化値を得る。
2.スペクトルの一部のみを選択する。
3.ゼロのランレングスが最小ランレングスサイズより高いスペクトルの選択された部分におけるスペクトル領域を検出する。
4.前に検出された領域上の量子化誤差の幾何平均を演算する。
5.幾何平均を3ビットで一様に量子化する。
第1ステップに関して、周波数ラインの量子化値は、量子化器540を用いて取得することができる。周波数ラインの量子化値は、それ故、量子化スペクトル表現510によって表される。
第2ステップ(それはオプションであると考えることができる)に関して、ノイズ充填の演算は、好ましくはスペクトルの高い周波数部分に基づいて実行される点に留意すべきである。
好ましい実施形態において、ノイズ(暗騒音と呼ばれる)のエネルギーは、スペクトルの後半に関してのみ、すなわち(低周波に対してではなく)高周波に対して、演算される。実際、普通は、高周波(スペクトルの上部)は低周波より知覚的に重要でなく、ゼロに量子化されている値は大抵はスペクトルの後半で起こる。さらにまた、高周波におけるノイズの加算は、最終的なノイズの多い音響回復を得やすくはない。
第3ステップに関して、ノイズ充填をゼロに量子化されている値のランレングスが起こるスペクトル領域に限定することによって、ノイズ充填が非ゼロ値に非常に多く影響することが避けられる。このように、ノイズ充填は、非ゼロ値の近傍において適用されず、これらのラインのオリジナルの音調はよりよく保存される。最小ランレングスサイズは、好ましい実施形態において8に固定される。これは、非ゼロ値を包囲する8本のラインがノイズ充填によって影響されない(従って、ノイズ値の演算のために考慮されない)ことを意味する。
第4ステップに関して、量子化ドメインにおける量子化誤差は、範囲[−0.5、0.5]にあり、一様に分布しているとみなされる。検出された領域の量子化誤差のエネルギーは、対数ドメインの平均(すなわち幾何平均)である。暗騒音nfは、次に以下のように演算される。
nf = power ( 10 , sum ( log10 ( E(x(i)) ) ) / ( 2*n ) )
上記において、sum()は、検出された領域内の個々のラインx(i)の対数エネルギー(log10(E()))の合計であり、nはこれらの領域内のラインの数である。暗騒音nfは、0と0.5の間である。このような演算は、ゼロ値のオリジナルのスペクトル平坦度を考慮に入れ、それらの音調/ノイズ特性に関する情報を得ることを可能とする。
ゼロ値が非常に音的である場合は、暗騒音(装置500において演算された)はゼロに向かい、低暗騒音がデコーダ(例えば、上記デコーダ100、200)において加算される。ゼロ値が本当にノイズが多い場合は、暗騒音は高く、ノイズ充填は、PNS(知覚的ノイズ置換)のような、ゼロスペクトルラインの高度にパラメトリックな符号化としてみることができる(非特許文献3を参照)。
第5ステップに関して、暗騒音の量子化インデックス(「index」)は、次に以下のように演算される。
index = max ( 0 , min ( 7 , int ( 8 - 16 * nf ) ) )
インデックスは、例えば、3ビットで送信される。
以下において、ノイズ充填パラメータを演算するアルゴリズムが、本発明の一実施形態に係るノイズ充填パラメータを取得するこの種のアルゴリズムの疑似プログラムコード600を示す図6を参照して記載される。アルゴリズム600は、ノイズ充填パラメータの演算に対して考慮すべき領域を検出する第1部分610を備える。識別された領域(例えばスペクトルライン)は、集合Rによって記述され、それは例えば、識別されたスペクトルラインのスペクトルライン周波数インデックス(「line index」)を備えることができる。それ自身ゼロに量子化され、更に非ゼロ値に量子化されている他のいかなるスペクトルラインからも十分に離隔しているスペクトルラインを識別することができる。
プログラム600の第1部分610は、プログラム300の第1部分310と同じとすることができる。したがって、アルゴリズム600において用いられる量子化スペクトル表現(「量子化(x(i)」)は、例えば、アルゴリズム300においてデコーダ側で用いられる量子化スペクトル表現(「量子化x(i)」)と同じとすることができる。言い換えれば、エンコーダとデコーダを備える伝送システムにおいて、エンコーダ側で用いられた量子化スペクトル表現は、符号化された形でデコーダに送信することができる。
アルゴリズム600は、暗騒音を演算する第2部分620を備える。暗騒音の演算において、アルゴリズム600の第1部分610において演算された集合Rによって記述されたそれらのスペクトル領域(またはスペクトルライン)のみが考慮される。図に示すように、ノイズ充填値nfは、最初にゼロに初期化される。考慮されたスペクトルラインの数(n)も、最初にゼロに初期化される。引き続いて、ラインインデックスが集合Rに含まれるすべてのスペクトルラインのエネルギーは、合計される前に対数化される。例えば、スペクトルラインのエネルギー(E(x(i)))の基底10の対数(log10)を合計することができる。ここで、量子化の前のスペクトルラインの実際のエネルギー(「Eまたはエネルギー(x(i))で示される)は、対数化された形で合計される点に留意すべきである。考慮されるスペクトルラインの数もまた計数される。このように、アルゴリズム600の第2部分620の実行の後、変数nfは、量子化前の識別されたスペクトルラインのエネルギーの対数合計を示し、変数nは、識別されたスペクトルラインの数を記述する。
アルゴリズム600は、また、値nf、すなわち識別されたスペクトルラインの対数合計を量子化する第3部分630を備える。上述のようなまたは図6に示されるようなマッピング方程式を用いることができる。
図7に係る方法
図7は、オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズ充填されたスペクトル表現を提供する方法のフローチャートを示す。図7の方法700は、入力スペクトル表現の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔しているオーディオ信号の入力スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するステップ710を備える。方法700は、また、識別されたスペクトル領域に選択的にノイズを導入し、オーディオ信号のノイズ充填されたスペクトル表現を取得するステップ720を備える。
方法700は、発明のノイズ充填装置に関して本願明細書に記載された特徴および機能のいずれかによって補足することができる。
図8に係る方法
図8は、オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供する方法のフローチャートを示す。方法800は、量子化スペクトル表現の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔しているオーディオ信号の量子化スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するステップ810を備える。方法800は、また、充填パラメータの演算のために、識別されたスペクトル領域の量子化誤差を選択的に考慮するステップ820を備える。
方法800は、ノイズ充填パラメータ演算装置に関して本願明細書に記載された特徴および機能のいずれかによって補足することができる。
図9に係るオーディオ信号表現
図9は、本発明の一実施形態に係るオーディオ信号表現のグラフィック表現を示す。オーディオ信号表現900は、例えば入力スペクトル表現110の基礎を形成することができる。オーディオ信号表現900は、また、符号化されたオーディオ信号表現212の機能を引き継ぐことができる。オーディオ信号表現900は、ノイズ充填パラメータ演算装置500を用いて取得することができ、オーディオ信号表現900は、オーディオ信号の量子化スペクトル表現510と、ノイズ充填パラメータ512を、例えば両方とも符号化された形で、備えることができる。
言い換えれば、符号化されたオーディオ信号表現900は、オーディオ信号を表現することができる。符号化されたオーディオ信号表現900は、オーディオ信号の符号化された量子化スペクトルドメイン表現と、更には符号化されたノイズ充填パラメータを備える。ノイズ充填パラメータは、ゼロに量子化され、非ゼロ値に量子化されているスペクトルドメイン表現のスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔しているスペクトルドメイン表現のスペクトル領域の量子化誤差を表わす。
当然、オーディオ信号表現900は、上述の情報のいずれかによって補足することができる。
実施変形例
特定の実施態様要件に依存して、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施態様は、その上に格納された電気的に読取可能な制御信号を有し、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを用いて実行することができる。
本発明に係るいくつかの実施形態は、電気的に読取可能な制御信号を有し、本願明細書に記載された方法の一つが実行されるようにプログラム可能なコンピュータシステムと協働することができるデータキャリアを備える。
一般に、本発明の実施形態は、コンピュータプログラム製品がコンピュータ上で動作するときに本願明細書に記載された方法の一つを実行するように動作するプログラムコードを有するコンピュータプログラム製品として実施することができる。プログラムコードは、例えば機械読取可能な媒体に格納することができる。
他の実施形態は、機械読取可能な媒体に格納された、本願明細書に記載された方法の一つを実行するコンピュータプログラムを備える。
言い換えれば、発明の方法の実施形態は、それ故、コンピュータプログラムがコンピュータ上で動作するとき、本願明細書に記載された方法の一つを実行するプログラムコードを有するコンピュータプログラムである。
発明の方法の更なる実施形態は、それ故、本願明細書に記載された方法の一つを実行するためのコンピュータプログラムを備えたデータキャリア(またはデジタル記録媒体)である。
発明の方法の更なる実施形態は、それ故、本願明細書に記載された方法を実行するコンピュータプログラムを表わすデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
更なる実施形態は、本願明細書に記載された方法の一つを実行するように構成され、または適合された処理手段、例えばコンピュータ、またはプログラマブルロジックデバイスを備える。
更なる実施形態は、本願明細書に記載された方法の一つを実行するためのコンピュータプログラムがインストールされたコンピュータを備える。
いくつかの実施形態では、本願明細書に記載された方法の機能のいくつかまたはすべてを実行するために、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)を用いることができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本願明細書に記載された方法の一つを実行するために、マイクロプロセッサと協働することができる。
結 論
上記を要約すると、本発明は、エンコーダ側でノイズ充填パラメータを演算するときとデコーダ側でノイズを適用するときの両方で、入力信号および復号化信号特性を考慮することによって、オーディオ符号化ツール「ノイズ充填」を強化する。本発明の実施形態において、ゼロに量子化されているスペクトルラインの音調/ノイズ性が推定され、暗騒音推定に用いられる。この暗騒音は、次に、スペクトルの特定の領域に起こっているゼロに量子化されている値にノイズ充填を適用するデコーダに送信される。これらの領域は、復号化されたスペクトルの特性に基づいて選択される。
本発明の背景に関して、本発明がMDCT上のスカラ量子化を用いる変換ベースの符号化に適用された点に留意することができる。MDCT係数は、知覚的な手がかりに基づいて算出されたカーブによって先に正規化される。カーブは、AMR−WB+のTCXモードにおいてなされるので、先のLPC(線形予測符号化)解析段階からLPC係数を重み付けすることによって推論される(非特許文献1を参照)。重み付け係数から、知覚的重み付けフィルタが設計され、MDCTの前に適用される。逆フィルタもまた、逆MDCTの後にデコーダ側で適用される。この逆知覚的重み付けフィルタは、知覚されたノイズを最小化またはマスクするような方法で量子化ノイズを整形する。
本発明に係る実施形態において、先行技術の不都合は克服される。ノイズ充填は、従来は、スペクトル包絡ベースのスレショルド、マスキングスレショルド、またはエネルギースレショルドのみを考慮するゼロに量子化されている値の上にシステマチックな方法で適用される。先行技術は、入力信号の特性も復号化信号の特性も考慮しない。このように、従来の装置は、望ましくない付加的なアーチファクト、特にノイズのアートファクトを誘導し、この種のツールの効果をキャンセルする。
対照的に、本発明に係る実施形態は、上述のように、アーチファクトの低減された改良されたノイズ充填を可能とする。

Claims (15)

  1. オーディオ信号の入力スペクトル表現(110)に基づいて、オーディオ信号のノイズ充填されたスペクトル表現(112)を提供するノイズ充填装置であって、
    前記入力スペクトル表現(110)の非ゼロスペクトル領域(420a、420b、420c、420d)から少なくとも一つの中間スペクトル領域(422a、422b、422c、422d、422h、422i、422j、422k)によって離隔している前記入力スペクトル表現(110)のスペクトル領域(422e、422f、422g)を識別し、識別されたスペクトル領域(422e、422f、422g)を取得するように構成された、スペクトル領域識別器(120)と、
    前記識別されたスペクトル領域(422e、422f、422g)に選択的にノイズを導入し、前記オーディオ信号の前記ノイズ充填されたスペクトル表現(112)を取得するように構成された、ノイズ挿入器(130)と、
    を備えた、ノイズ充填装置(100)。
  2. 前記スペクトル領域識別器(120)は、ゼロに量子化され、少なくとも第1の予め定められた数(4)のゼロに量子化されている低い周波数の隣接するスペクトルライン(422a、422b、422c、422d;422b、422c、422d、422e;422c、422d、422e、422f)と、少なくとも第2の予め定められた数(4)のゼロに量子化されている高い周波数の隣接するスペクトルライン(422f、422g、422h、422i;422g、422h、422i、422j;422h、422i、422j、422k)を備えた前記入力スペクトル表現(110)のスペクトルライン(422e、422f、422g)を、識別されたスペクトル領域として識別するように構成され、
    前記第1の予め定められた数(4)は1以上であり、前記第2の予め定められた数(4)は1以上であり、
    前記ノイズ挿入器(130)は、非ゼロ値に量子化されているスペクトルライン(420a、420b、420c、420d)とゼロに量子化されているスペクトルライン(422a、422b、422c、422d、422h、422i、422j、422k)を残しながら、しかし前記第1の予め定められた数(4)のゼロに量子化されている低い周波数の隣接するスペクトルラインまたは前記第2の予め定められた数(4)のゼロに量子化されている高い周波数の隣接するスペクトルラインを前記ノイズ充填によって影響されないようにすることなく、前記識別されたスペクトルライン(422e、422f、422g)に選択的にノイズを導入するように構成された、
    請求項1に記載のノイズ充填装置(100)。
  3. 前記第1の予め定められた数(4)は、前記第2の予め定められた数(4)に等しい、請求項2に記載のノイズ充填装置(100)。
  4. 前記ノイズ充填装置は、前記オーディオ信号の前記入力スペクトル表現(110)の下部を前記ノイズ充填によって影響されないように残しながら、前記オーディオ信号の前記入力スペクトル表現(110)の上部のスペクトル領域にのみノイズを導入するように構成された、請求項1ないし3のいずれかに記載のノイズ充填装置(100)。
  5. 前記スペクトル領域識別器(120)は、与えられたスペクトル領域(i)の予め定められた両側のスペクトル近傍におけるスペクトル領域の量子化された強度値(量子化(x(i))を合計し、合計値(E)を取得し、前記与えられたスペクトル領域(i)が識別されたスペクトル領域か否かを決定するために前記合計値(E)を評価するように構成された、請求項1ないし4のいずれかに記載のノイズ充填装置(100)。
  6. 前記スペクトル領域識別器(120)は、ゼロに量子化されているスペクトル領域の連続したシーケンス(422a〜422i;422b〜422j;422c〜422k)を検出するために前記入力スペクトル表現(110)のスペクトル領域の範囲をスキャンし、前記検出された連続したシーケンスの一つ以上の中心スペクトル領域(422e、422f、422g)を、識別されたスペクトル領域として認識するように構成された、請求項1ないし5のいずれかに記載のノイズ充填装置(100)。
  7. オーディオ信号の量子化スペクトル表現(510)に基づいて、ノイズ充填パラメータ(512)を提供するノイズ充填パラメータ演算装置であって、
    前記量子化スペクトル表現(510)の非ゼロスペクトル領域(420a、420b、420c、420d)から少なくとも一つの中間スペクトル領域(422a、422b、422c、422d、422h、422i、422j、422k)によって離隔している前記量子化スペクトル表現(510)のスペクトル領域(422e、422f、422g)を識別し、識別されたスペクトル領域(422e、422f、422g)を取得するように構成された、スペクトル領域識別器(520)と、
    前記ノイズ充填パラメータ(512、nf)の演算に対して、前記識別されたスペクトル領域(i)の量子化誤差(エネルギー(x(i)))を選択的に考慮するように構成された、ノイズ値演算器(530)と、
    を備えた、ノイズ充填パラメータ演算装置(500)。
  8. 前記スペクトル領域識別器(520)は、ゼロに量子化されて、少なくとも第1の予め定められた数(4)のゼロに量子化されている低い周波数の隣接するスペクトルライン(422a、422b、422c、422d;422b、422c、422d、422e;422c、422d、422e、422f)と、少なくとも第2の予め定められた数(4)のゼロに量子化されている高い周波数の隣接するスペクトルライン(422f、422g、422h、422i;422g、422h、422i、422j;422h、422i、422j、422k)を備える前記入力スペクトル表現(510)のスペクトルライン(422e、422f、422g)を、識別されたスペクトル領域として識別するように構成され、
    前記第1の予め定められた数(4)は、1以上であり、前記第2の予め定められた数(4)は1以上であり、
    前記ノイズ値演算器(530)は、前記ノイズ充填パラメータの演算に対して、非ゼロに量子化されているスペクトルライン(420a、420b、420c、420d)と、ゼロに量子化されているスペクトルライン(422a、422b、422c、422d、422h、422i、422j、422k)を残しながら、しかし前記第1の予め定められた数(4)のゼロに量子化されている低い周波数の隣接するスペクトルラインまたは前記第2の予め定められた数(4)のゼロに量子化されている高い周波数の隣接するスペクトルラインを、前記ノイズ充填パラメータの前記演算に対して考慮しないようにすることなく、前記識別されたスペクトル領域(i)の量子化誤差を選択的に考慮するように構成された、
    請求項7に記載のノイズ充填パラメータ演算装置(500)。
  9. 前記ノイズ値演算器(530)は、前記ノイズ充填パラメータ(512、nf、nf_index)の演算に対して、前記識別されたスペクトル領域(i)の量子化誤差の実際のエネルギー(エネルギー(x(i)))を考慮するように構成された、請求項7または8に記載のノイズ充填パラメータ演算装置(500)。
  10. 前記ノイズ値演算器(530)は、単一のスペクトル領域または複数の隣接するスペクトルラインに集中した音の量子化誤差エネルギーに対して、複数の識別されたスペクトル領域上に分布した非音の量子化誤差エネルギー(エネルギー(x(i)))を強調するように構成された、請求項7ないし9のいずれかに記載のノイズ充填パラメータ演算装置(500)。
  11. 前記ノイズ値演算器(530)は、前記識別されたスペクトル領域(i)の対数化された量子化誤差エネルギー(log10(エネルギー(x(i))))の合計を演算し、前記ノイズ充填パラメータ(512、nf、nf_index)を取得するように構成された、請求項7ないし10のいずれかに記載のノイズ充填パラメータ演算装置(500)。
  12. オーディオ信号を表現する符号化されたオーディオ信号表現であって、
    前記オーディオ信号の符号化された量子化スペクトルドメイン表現と、
    符号化されたノイズ充填パラメータとを備え、
    前記ノイズ充填パラメータは、ゼロに量子化され、非ゼロ値に量子化されている前記スペクトルドメイン表現のスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔している前記スペクトルドメイン表現のスペクトル領域の量子化誤差を表わす、
    符号化されたオーディオ信号表現(900)。
  13. オーディオ信号の入力スペクトル表現に基づいてオーディオ信号のノイズ充填されたスペクトル表現を提供する方法であって、
    前記入力スペクトル表現の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔している前記入力スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するステップ(710)と、
    前記識別されたスペクトル領域に選択的にノイズを導入し、前記オーディオ信号のノイズ充填されたスペクトル表現を取得するステップ(720)と、
    を備えた、ノイズ充填されたスペクトル表現を提供する方法(700)。
  14. オーディオ信号の量子化スペクトル表現に基づいてノイズ充填パラメータを提供する方法であって、
    前記量子化スペクトル表現の非ゼロスペクトル領域から少なくとも一つの中間スペクトル領域によって離隔している前記量子化スペクトル表現のスペクトル領域を識別し、識別されたスペクトル領域を取得するステップ(810)と、
    前記ノイズ充填パラメータの演算に対して、前記識別されたスペクトル領域の量子化誤差を選択的に考慮するステップ(820)と、
    を備えた、ノイズ充填パラメータを提供する方法(800)。
  15. コンピュータプログラムがコンピュータ上で動作するときに、コンピュータに請求項13または14に記載された方法を実行させるための、コンピュータプログラム。
JP2011516997A 2008-07-11 2009-06-26 ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号 Active JP5307889B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7987208P 2008-07-11 2008-07-11
US61/079,872 2008-07-11
US10382008P 2008-10-08 2008-10-08
US61/103,820 2008-10-08
PCT/EP2009/004653 WO2010003565A1 (en) 2008-07-11 2009-06-26 Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal

Publications (2)

Publication Number Publication Date
JP2011527455A true JP2011527455A (ja) 2011-10-27
JP5307889B2 JP5307889B2 (ja) 2013-10-02

Family

ID=40941986

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011516991A Active JP5622726B2 (ja) 2008-07-11 2009-06-25 オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化および復号化する方法、オーディオストリームおよびコンピュータプログラム
JP2011516997A Active JP5307889B2 (ja) 2008-07-11 2009-06-26 ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011516991A Active JP5622726B2 (ja) 2008-07-11 2009-06-25 オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化および復号化する方法、オーディオストリームおよびコンピュータプログラム

Country Status (22)

Country Link
US (9) US9043203B2 (ja)
EP (4) EP4235660A3 (ja)
JP (2) JP5622726B2 (ja)
KR (4) KR101518532B1 (ja)
CN (2) CN102089808B (ja)
AR (2) AR072482A1 (ja)
AT (1) ATE535903T1 (ja)
AU (2) AU2009267459B2 (ja)
BR (6) BRPI0910811B1 (ja)
CA (2) CA2730361C (ja)
CO (2) CO6341671A2 (ja)
EG (1) EG26480A (ja)
ES (5) ES2422412T3 (ja)
HK (2) HK1157045A1 (ja)
MX (2) MX2011000382A (ja)
MY (2) MY178597A (ja)
PL (3) PL2304719T3 (ja)
PT (1) PT2304719T (ja)
RU (2) RU2519069C2 (ja)
TW (2) TWI417871B (ja)
WO (2) WO2010003556A1 (ja)
ZA (2) ZA201100085B (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013539068A (ja) * 2010-08-17 2013-10-17 クゥアルコム・インコーポレイテッド ノイズ注入のためのシステム、方法、装置、および、コンピュータ読取可能媒体
JPWO2012053150A1 (ja) * 2010-10-18 2014-02-24 パナソニック株式会社 音声符号化装置および音声復号化装置
JP2014523548A (ja) * 2011-06-30 2014-09-11 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号生成装置及びその方法
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP2017194705A (ja) * 2012-12-06 2017-10-26 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号を復号するための方法および装置
JP2019074755A (ja) * 2014-07-28 2019-05-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法

Families Citing this family (77)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101518532B1 (ko) 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
EP2686848A1 (en) 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
US9530419B2 (en) * 2011-05-04 2016-12-27 Nokia Technologies Oy Encoding of stereophonic signals
RU2616534C2 (ru) * 2011-10-24 2017-04-17 Конинклейке Филипс Н.В. Ослабление шума при передаче аудиосигналов
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN105122357B (zh) 2013-01-29 2019-04-23 弗劳恩霍夫应用研究促进协会 频域中基于lpc进行编码的低频增强
AU2014211544B2 (en) * 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
MX346732B (es) 2013-01-29 2017-03-30 Fraunhofer Ges Forschung Cuantificación de señales de audio adaptables por tonalidad de baja complejidad.
KR20220140002A (ko) 2013-04-05 2022-10-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법
BR112015025009B1 (pt) * 2013-04-05 2021-12-21 Dolby International Ab Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
EP4290510A3 (en) 2013-05-24 2024-02-14 Dolby International AB Audio encoder
KR101757338B1 (ko) 2013-06-21 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템
EP3014609B1 (en) 2013-06-27 2017-09-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
JP6186503B2 (ja) 2013-10-03 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション アップミキサーにおける適応的な拡散性信号生成
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思
KR101854296B1 (ko) 2013-10-31 2018-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
PT3288026T (pt) 2013-10-31 2020-07-20 Fraunhofer Ges Forschung Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
KR102023138B1 (ko) 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
WO2015136078A1 (en) * 2014-03-14 2015-09-17 Telefonaktiebolaget L M Ericsson (Publ) Audio coding method and apparatus
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
RU2701060C2 (ru) * 2014-09-30 2019-09-24 Сони Корпорейшн Передающее устройство, способ передачи, приемное устройство и способ приема
US9875756B2 (en) 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
AR106308A1 (es) 2015-10-08 2018-01-03 Dolby Int Ab Codificación en capas para representaciones de sonido o campo de sonido comprimidas
ES2903247T3 (es) 2015-10-08 2022-03-31 Dolby Int Ab Codificación en capas y estructura de datos para representaciones comprimidas de campo sonoro o sonido ambisónico de orden superior
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof
CA2985019C (en) * 2016-02-17 2022-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11264014B1 (en) * 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11503548B2 (en) * 2018-10-08 2022-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transmission power determination for an antenna array
WO2020164753A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method selecting an error concealment mode, and encoder and encoding method
EP3939035A4 (en) * 2019-03-10 2022-11-02 Kardome Technology Ltd. LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US20200402522A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
US11545172B1 (en) * 2021-03-09 2023-01-03 Amazon Technologies, Inc. Sound source localization using reflection classification
CN114900246B (zh) * 2022-05-25 2023-06-13 中国电子科技集团公司第十研究所 噪声基底估计方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053891A (ja) * 2002-07-19 2004-02-19 Sony Corp データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP2005530205A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スペクトルホール充填を用いるオーディオコーディングシステム
JP2007240819A (ja) * 2006-03-08 2007-09-20 Sharp Corp デジタルデータ復号化装置

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
US6092041A (en) 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6167133A (en) * 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
JP3804902B2 (ja) 1999-09-27 2006-08-02 パイオニア株式会社 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
WO2002071395A2 (en) * 2001-03-02 2002-09-12 Matsushita Electric Industrial Co., Ltd. Apparatus for coding scaling factors in an audio coder
US6876968B2 (en) * 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US8446947B2 (en) * 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
US7723474B2 (en) 2003-10-21 2010-05-25 The Regents Of The University Of California Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
ES2356492T3 (es) * 2005-07-22 2011-04-08 France Telecom Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
WO2007122614A2 (en) * 2006-04-21 2007-11-01 Galtronics Ltd. Twin ground antenna
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
CN101617362B (zh) * 2007-03-02 2012-07-18 松下电器产业株式会社 语音解码装置和语音解码方法
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
DK3401907T3 (da) * 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US20130173275A1 (en) 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530205A (ja) * 2002-06-17 2005-10-06 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション スペクトルホール充填を用いるオーディオコーディングシステム
JP2004053891A (ja) * 2002-07-19 2004-02-19 Sony Corp データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
JP2007240819A (ja) * 2006-03-08 2007-09-20 Sharp Corp デジタルデータ復号化装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP2013539068A (ja) * 2010-08-17 2013-10-17 クゥアルコム・インコーポレイテッド ノイズ注入のためのシステム、方法、装置、および、コンピュータ読取可能媒体
JP5695074B2 (ja) * 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置
JPWO2012053150A1 (ja) * 2010-10-18 2014-02-24 パナソニック株式会社 音声符号化装置および音声復号化装置
US10037766B2 (en) 2011-06-30 2018-07-31 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwith extension signal
JP2014523548A (ja) * 2011-06-30 2014-09-11 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号生成装置及びその方法
JP2016197271A (ja) * 2011-06-30 2016-11-24 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号の復号化装置
JP2017194705A (ja) * 2012-12-06 2017-10-26 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号を復号するための方法および装置
JP2018194870A (ja) * 2012-12-06 2018-12-06 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. 信号を復号するための方法および装置
US10236002B2 (en) 2012-12-06 2019-03-19 Huawei Technologies Co., Ltd. Method and device for decoding signal
US10971162B2 (en) 2012-12-06 2021-04-06 Huawei Technologies Co., Ltd. Method and device for decoding signal
US11610592B2 (en) 2012-12-06 2023-03-21 Huawei Technologies Co., Ltd. Method and device for decoding signal
US10546589B2 (en) 2012-12-06 2020-01-28 Huawei Technologies Co., Ltd. Method and device for decoding signal
JP2019074755A (ja) * 2014-07-28 2019-05-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
US10885924B2 (en) 2014-07-28 2021-01-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JP2022003397A (ja) * 2014-07-28 2022-01-11 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP6992024B2 (ja) 2014-07-28 2022-01-13 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
US11264042B2 (en) 2014-07-28 2022-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling information which comprises energy information and is included in an input signal
JP2022046504A (ja) * 2014-07-28 2022-03-23 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP2019194704A (ja) * 2014-07-28 2019-11-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
US11705145B2 (en) 2014-07-28 2023-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JP7354193B2 (ja) 2014-07-28 2023-10-02 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP7391930B2 (ja) 2014-07-28 2023-12-05 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
US11908484B2 (en) 2014-07-28 2024-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon

Also Published As

Publication number Publication date
RU2519069C2 (ru) 2014-06-10
ATE535903T1 (de) 2011-12-15
EP2304720A1 (en) 2011-04-06
MX2011000382A (es) 2011-02-25
KR101582057B1 (ko) 2015-12-31
US11024323B2 (en) 2021-06-01
EP2304719A1 (en) 2011-04-06
KR101518532B1 (ko) 2015-05-07
ES2526767T3 (es) 2015-01-15
PL2304719T3 (pl) 2017-12-29
EP4235660A3 (en) 2023-09-13
BR122021003097B1 (pt) 2021-11-03
US8983851B2 (en) 2015-03-17
US11869521B2 (en) 2024-01-09
BR122021003752B1 (pt) 2021-11-09
EP4235660A2 (en) 2023-08-30
TW201007697A (en) 2010-02-16
ES2642906T3 (es) 2017-11-20
EP3246918A1 (en) 2017-11-22
EG26480A (en) 2013-12-02
KR20160004403A (ko) 2016-01-12
EP2304719B1 (en) 2017-07-26
HK1157045A1 (en) 2012-06-22
US20110170711A1 (en) 2011-07-14
US20240096337A1 (en) 2024-03-21
JP5307889B2 (ja) 2013-10-02
KR101706009B1 (ko) 2017-02-22
KR20140036042A (ko) 2014-03-24
BR122021003726B1 (pt) 2021-11-09
TW201007696A (en) 2010-02-16
PL2304720T3 (pl) 2012-04-30
CN102089808B (zh) 2014-02-12
CN102089806A (zh) 2011-06-08
US20110173012A1 (en) 2011-07-14
RU2512103C2 (ru) 2014-04-10
EP3246918C0 (en) 2023-06-14
AR072482A1 (es) 2010-09-01
ZA201100091B (en) 2011-10-26
MX2011000359A (es) 2011-02-25
PL3246918T3 (pl) 2023-11-06
US9449606B2 (en) 2016-09-20
US20150112693A1 (en) 2015-04-23
WO2010003565A1 (en) 2010-01-14
CA2730536A1 (en) 2010-01-14
AU2009267459B2 (en) 2014-01-23
MY155785A (en) 2015-11-30
CN102089808A (zh) 2011-06-08
US20140236605A1 (en) 2014-08-21
CN102089806B (zh) 2012-12-05
ES2955669T3 (es) 2023-12-05
US20170004839A1 (en) 2017-01-05
US20240096338A1 (en) 2024-03-21
TWI492223B (zh) 2015-07-11
AR072497A1 (es) 2010-09-01
US9711157B2 (en) 2017-07-18
BR122021003142B1 (pt) 2021-11-03
AU2009267468A1 (en) 2010-01-14
BRPI0910522A2 (pt) 2020-10-20
KR101251790B1 (ko) 2013-04-08
US9043203B2 (en) 2015-05-26
KR20110039245A (ko) 2011-04-15
MY178597A (en) 2020-10-16
EP2304720B1 (en) 2011-11-30
ZA201100085B (en) 2011-10-26
CA2730361C (en) 2017-01-03
CA2730536C (en) 2014-12-02
US10629215B2 (en) 2020-04-21
ES2374640T3 (es) 2012-02-20
RU2011102410A (ru) 2012-07-27
RU2011104006A (ru) 2012-08-20
ES2422412T3 (es) 2013-09-11
AU2009267468B2 (en) 2012-03-15
AU2009267459A1 (en) 2010-01-14
US20210272577A1 (en) 2021-09-02
CO6280569A2 (es) 2011-05-20
BRPI0910811B1 (pt) 2021-09-21
PT2304719T (pt) 2017-11-03
EP3246918B1 (en) 2023-06-14
BRPI0910811A2 (pt) 2020-11-03
TWI417871B (zh) 2013-12-01
HK1160285A1 (en) 2012-08-10
JP2011527451A (ja) 2011-10-27
CO6341671A2 (es) 2011-11-21
CA2730361A1 (en) 2010-01-14
JP5622726B2 (ja) 2014-11-12
US20170309283A1 (en) 2017-10-26
WO2010003556A1 (en) 2010-01-14
KR20110040829A (ko) 2011-04-20

Similar Documents

Publication Publication Date Title
JP5307889B2 (ja) ノイズ充填装置、ノイズ充填パラメータ演算装置、ノイズ充填パラメータを提供する方法、オーディオ信号のノイズ充填されたスペクトル表現を提供する方法、それに対応するコンピュータプログラムおよび符号化されたオーディオ信号
JP5253565B2 (ja) 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP3762579B2 (ja) デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
CN103765509B (zh) 编码装置及方法、解码装置及方法
US9546924B2 (en) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
TR201902394T4 (tr) Gürültü doldurma konsepti.
AU2003243441C1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
EP1782419A1 (en) Scalable audio coding
CN104170009A (zh) 感知音频编解码器中的谐波信号的相位相干性控制
JP2008518264A (ja) 振幅の包絡線を有するパラメトリックオーディオコーディング
Singh et al. Audio watermarking based on quantization index modulation using combined perceptual masking
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
CN114783449A (zh) 神经网络训练方法、装置、电子设备及介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130212

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130627

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5307889

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250