JP5628163B2 - 帯域幅拡張出力データを生成するための装置および方法 - Google Patents

帯域幅拡張出力データを生成するための装置および方法 Download PDF

Info

Publication number
JP5628163B2
JP5628163B2 JP2011516986A JP2011516986A JP5628163B2 JP 5628163 B2 JP5628163 B2 JP 5628163B2 JP 2011516986 A JP2011516986 A JP 2011516986A JP 2011516986 A JP2011516986 A JP 2011516986A JP 5628163 B2 JP5628163 B2 JP 5628163B2
Authority
JP
Japan
Prior art keywords
data
noise floor
audio signal
frequency band
output data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011516986A
Other languages
English (en)
Other versions
JP2011527448A (ja
Inventor
マクス ノイエンドルフ
マクス ノイエンドルフ
ベルンハルト グリル
ベルンハルト グリル
ウルリヒ クレマー
ウルリヒ クレマー
マルクス マルトラス
マルクス マルトラス
ハラルド ポップ
ハラルド ポップ
ニコラウス レッテルバッハ
ニコラウス レッテルバッハ
フレドリック ナーゲル
フレドリック ナーゲル
マルクス ローバッサー
マルクス ローバッサー
マルク ゲイヤー
マルク ゲイヤー
マーヌエル ヤンダー
マーヌエル ヤンダー
ヴィルジリオ バチガルーポ
ヴィルジリオ バチガルーポ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ, フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2011527448A publication Critical patent/JP2011527448A/ja
Application granted granted Critical
Publication of JP5628163B2 publication Critical patent/JP5628163B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Dental Tools And Instruments Or Auxiliary Dental Instruments (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

本発明は、帯域幅拡張(BWE)出力データ、オーディオエンコーダのための装置および方法に関する。
自然オーディオ符号化および音声符号化は、オーディオ信号の符号化のための2つの主要な種類である。自然オーディオ符号化は、一般に音楽または任意の信号のために中間のビットレートで用いられ、通常、広い音声帯域幅を提供する。音声符号化器は、基本的に音声再生に限られていて、非常に低いビットレートで用いることができる。広帯域音声は、狭帯域音声上の主要な主観的な品質改善を提供する。さらに、マルチメディア分野の驚異的な成長により、記憶装置と同様に、音楽および他の非音声信号の伝送と、例えば、電話システム上の高品質のラジオ/TVのための伝送は、価値のある機能である。
大幅にビットレートを低下させるために、分割帯域知覚的オーディオコーデックを用いることで、音源音符号化を実行することができる。これらのナチュラルオーディオコーデックは、信号の知覚的無関係や統計に基づく冗長度を利用する。上記の開発は、所与のビットレートの制限に関して充分でない場合に備えて、サンプルレートは低減される。また、構成レベルの数を減少させること、時折聞こえる量子化ひずみを許容すること、および、ステレオコーディングの結合を介してステレオ領域の規模縮小を用いることは、一般的である。この種の方法の過剰な使用は、面倒な知覚的低下をもたらす。コーディング性能を高めるために、たとえばスペクトル帯域複製(SBR)などの帯域幅拡張は、符号化をベースにした高周波再構成(HFR)の高周波信号を生成するために効率的な方法として用いられる。
音響信号の記録および伝送において、例えばバックグラウンドノイズなどのノイズフロアは、常に存在している。デコーダ側に関して確実な音響信号を生成するために、ノイズフロアは、伝送または生成されなければならない。後者の場合、オリジナルオーディオ信号のノイズフロアは、決定されなければならない。これは、スペクトル帯域複製において、SBRツールまたはSBR関連モジュールによって実行される。そしてそれは、ノイズフロアを再構成するためにデコーダに伝送される当該ノイズフロアを特性化する(他のもの以外に)パラメータを生成する。
国際公開WO 00/45379には、複合された高い帯域の周波数成分において、充分なノイズ内容を提供する適応ノイズフロアツールが記載されている(例えば、特許文献1参照。)。
国際公開第 WO 00/45379号パンフレット
しかしながら、高い帯域の周波数成分に支障を来たすアーチファクトが発生すると、ベースバンドにおいて短い時間のエネルギー変動またはいわゆるトランジェントが生じる。これらのアーチファクトは知覚的に受け入れられず、そして、先行技術は、容認できる解決策を提供しない(特に帯域幅が制限される場合)。
それゆえに、本発明の目的は、特に、音声信号に対して知覚できるアーチファクトを持たないで効率的な符号化を可能にする装置を提供することである。
この目的は、請求項1〜請求項4に記載の装置、請求項5〜に記載のエンコーダ、請求項7に記載の方法および請求項8に記載のコンピュータープログラムによって達成される。
本発明は、時間部の範囲内のオーディオ信号のエネルギー分布により測定されたノイズフロアの適合がデコーダ側上の合成されたオーディオ信号の知覚的品質を改善することができる研究の成果に基づいている。理論的見地から測定されたノイズフロアの適合または操作が必要でないにもかかわらず、ノイズフロアを発生させるための在来型技術は、多くの欠点を示す。一方においては、従来の方法によってそのまま実行される調性計測に基づくノイズフロアの推定が、常に困難で正確ではない。他方においては、ノイズフロアの目的が、デコーダ側に与える正確な調性印象を再生することである。オリジナルオーディオ信号および復号化信号のための主観的な調性印象がたとえ同じでも、例えば音声信号のために、まだアーチファクトが発生する可能性がある。
主観的な試験は、異なる種類の音声信号が別に処理されなければならないことを示す。有声音声において、計算されたオリジナルのノイズフロアと比較したとき、計算されたノイズフロアの低減はより高い知覚的品質をもたらす。この場合、結果として、話し言葉はより反響していないように聞こえる。オーディオ信号が歯擦音を含む場合、ノイズフロアの人工的な増加は、歯擦音に関連している解決方法の欠点をカバーすることができる。例えば、短い時間のエネルギー変動(トランジエント)は、移されるかまたはより高い周波数帯域に変わるときに、不穏なアーチファクトを引き起こす。また、ノイズフロアの増加は、これらのエネルギー変動をすっかり隠すことができる。
前記トランジェントは、従来の信号の範囲内に一部分として定義することができる。そこにおいて、エネルギーの強い増加は短い時間で現れる。そしてそのことは、特定の周波数領域上に制約されるかまたは制約されなくてもよい。トランジェントについての例はカスタネットや打楽器の打撃であるが、また、人間の特定の音として、例えば手紙で声に出されるP、T、K、…なども同様である。この種のトランジェントの検出は、今までのところ、以前からずっと同様に、または、同じアルゴリズム(一時的な閾値を使用する)によって実施される。そしてそのことは、話し言葉と分類されるかまたは音楽と分類されるかどうか信号から独立している。加えて、有声音および無声音の間のスピーチのあり得る識別は、従来続けられているまたは古典的なトランジェント検出機構に影響しない。
それゆえ、実施例は、例えば有声音声などの信号のためのノイズフロアの減少、および、たとえば歯擦音を含むノイズフロアの増加を提供する。
異なる信号を区別するために、実施例は、エネルギーが大部分はより高い周波数、または、より低い周波数に位置するかどうか、あるいは、言い換えると、オーディオ信号のスペクトル表現がより高い周波数への増加または減少する傾向を示すかどうかを測定するエネルギー分布データ(例えば歯擦音パラメータ)を利用する。また、さらなる実施例は、歯擦音パラメータを生成するために、第1のLPC係数(LPC=線形予測コーディング)を使用する。
ノイズフロアを変えるために、2つの可能性がある。第1の可能性は、ノイズフロア(ノイズフロアの計算に加えて、例えば、ノイズを増加かさせることまたは減少させること)を調整するために、デコーダが歯擦音パラメータを使用することができるように、前記歯擦音パラメータを伝送することである。この歯擦音パラメータは、従来の方法によってノイズフロアパラメータを計算することができるかまたはデコーダ側に計算することができるかに加えて、伝送することができる。第2の可能性は、エンコーダが修正されたノイズフロアデータをデコーダに伝送するように、そして、修正がデコーダ側に必要でない同じデコーダを用いることができるように、ノイズフロアパラメータ(またはエネルギー分布データ)を用いて伝送されたノイズフロアを変えることである。したがって、ノイズフロアの操作は、原則として、デコーダ側にと同様にエンコーダ側にすることができる。
帯域幅拡張のための実施例としてのスペクトル帯域複製は、オーディオ信号が第1の周波数帯域および第2の周波数帯域の成分に分けられる時間部分を特性化するSBRフレームに依存している。ノイズフロアは、全部のSBRフレームのために、測定および/または変換することができる。SBRフレームは、ノイズ・エンベロープに分けられることも可能であり、その結果、ノイズ・エンベロープの各々のために、ノイズフロアの調整を実行することができる。換言すれば、ノイズフロアツールの時間分解能は、SBRフレームの中でいわゆるノイズ―エンベロープによって決定される。標準規格(ISO/IEC 14496―3)によると、各SBRフレームは、最大の2つのノイズ―エンベロープを含み、その結果、ノイズフロアの調整は、部分的なSBRがフレームに基づいて行なうことができる。用途によっては、これは、充分かもしれない。しかしながら、時間的変更調性のモデルを改善するために、ノイズ―エンベロープの数を増加させることも可能である。
それゆえ、実施例は、オーディオ信号のためのBWE出力データを生成するための装置を含む。そこにおいて、オーディオ信号は、第1の周波数帯域および第2の周波数帯域の成分を含み、BWE出力データは、第2の周波数帯域の成分の合成を制御するように構成される。この装置は、オーディオ信号の時間部分のために、第2の周波数帯域のノイズフロアデータを測定するためのノイズフロア測定器を含む。測定されたノイズフロアは、オーディオ信号の調性に影響するので、ノイズフロア測定器は、調性測定器を含み得る。あるいは、ノイズフロア測定器は、ノイズフロアを得るために、信号のノイジネスを測定することを実行することができる。装置は、エネルギー分布データを引き出すための信号エネルギー・キャラクタライザをさらに含む。そこで、エネルギー分布データは、オーディオ信号の時間部分のスペクトルにおいてエネルギー分布を特性化する。そして、最後に、装置は、BWE出力データを得るために、ノイズフロアデータおよびエネルギー分布データを結合するための処理装置を含む。
さらなる実施例において、信号エネルギー・キャラクタライザは、エネルギー分布データとして歯擦音パラメータを使用するのに適合される。そして、歯擦音パラメータは、例えば、第1のLPC係数であり得る。さらなる実施例において、処理装置は、エネルギー分布データを符号化されたオーディオデータのビットストリームに加えるように、あるいは、もう一つの方法として、処理装置は、ノイズフロアがエネルギー分布データ(信号に従属している)に応じて増加されるかまたは減少されるように、ノイズフロアパラメータを調整するように構成される。本実施例において、ノイズフロア測定器は、あとで処理装置によって調整されるかまたは変換されるノイズフロアデータを生成するために、ノイズフロアを最初に測定する。
さらなる実施例において、時間部分はSBRフレームに存在し、そして、信号エネルギー・キャラクタライザは、SBRフレームにつき多くのノイズフロアエンベロープを生成するように構成される。結果として、ノイズフロア測定器は、信号エネルギー・キャラクタライザと同様に、ノイズフロアデータの他にもノイズフロアエンベロープごとに生成されたエネルギー分布データもまた測定するように構成される。ノイズフロアエンベロープの数は、SBRフレームにつき、例えば、1,2,4,・・・であり得る。
また、さらなる実施例は、オーディオ信号の第2の周波数帯域の成分を生成するために、デコーダにおいて用いられるスペクトル帯域複製を含む。この生成スペクトルバンドにおいて、スペクトル帯域複製出力データと、第2の周波数帯域の成分のための未加工のスペクトル表示信号とが用いられる。スペクトル帯域複製ツールは、エネルギー分布データに一致するノイズフロアを計算するように構成されるノイズフロア計算ユニット、および、計算されたノイズフロアを備えた第2の周波数帯域の成分を生成するための未加工のスペクトル表示信号と計算されたノイズフロアを結合する結合手段を備えている。
実施例の効果は、外部の決定(スピーチ/オーディオ)と、内部有声音声検出器、あるいは、デコーダに信号を送ることができるかまたは計算されたノイズフロアを調整することができる付加的なノイズの事象を制御している内部歯擦音検出器(信号エネルギー・キャラクタライザ)との組み合わせにある。通常のノイズフロアの計算は、非音声信号のために実行される。音声信号(外部スイッチング決定に由来する)に対して、付加的な音声分析は、実際の信号の有声化を決定するために実行される。デコーダまたはエンコーダに加えられるノイズの量は、信号の歯擦音(有声化に反して)の程度に応じて増やされる。歯擦音の程度は、例えば、短い信号部分のスペクトル傾斜を測定することによって決定することができる。
本発明は、図解された実施例として、今から説明される。本発明の特徴は、添付図面を参照して考慮されなければならない以下の詳細な説明を参照することで、より直ちに認められ、よりよく理解されるであろう。
本発明の実施例に従ってBWE出力データを生成するための装置のブロック図を示す。 非歯擦音の信号の負のスペクトル傾斜を図解する。 歯擦音のような信号のための正のスペクトル傾斜を図解する。 下位のLPCパラメータに基づいてスペクトル傾斜mの計算を説明する。 エンコーダのブロック図を示す。 デコーダ側上の出力PCMサンプルに符号化された音声ストリームを処理するためのダイアグラムを示す。 実施例に従って従来のノイズフロア計算ツールと修正されたノイズフロア計算ツールとの比較を示す。 実施例に従って従来のノイズフロア計算ツールと修正されたノイズフロア計算ツールとの比較を示す。 多くの時間部分の所定数のSBRフレームの分割を図解する。
図1は、オーディオ信号105のための帯域幅拡張(BWE)出力データ102を生成する装置100を示す。オーディオ信号105は、第1の周波数帯域105aの成分および第2の周波数帯域105bの成分を含む。BWE出力データ102は、第2の周波数帯域105bの成分の合成を制御するように構成される。装置100は、ノイズフロア測定器110、信号エネルギー・キャラクタライザ120および処理装置130を含む。ノイズフロア測定器110は、オーディオ信号105の時間部分のための第2の周波数帯域105bのノイズフロアデータ115を測定するかまたは決定するのに適合している。ベースバンドの測定されたノイズフロアと、上側の帯域の測定されたノイズフロアとを比較することによって、ノイズフロアは、詳細に決定することができる。その結果、補修した後で必要とされるノイズの量は、ナチュラル調性印象を再生するために、決定することができる。信号エネルギー・キャラクタライザ120は、オーディオ信号105の時間部分のスペクトルのエネルギー分布を特性化するエネルギー分布データ125を引き出す。したがって、ノイズフロア測定器110は、例えば、第1のおよび/または第2の周波数帯域105a,bを受信し、また、信号エネルギー・キャラクタライザ120は、例えば、第1のおよび/または第2周波数帯域105a,bを受信する。処理装置130は、ノイズフロアデータ115およびエネルギー分布データ125を受信して、BWE出力データ102を得るために、それらを結合する。スペクトル帯域複製は、帯域幅拡張のための1つの実施例を構成し、そこにおいて、BWE出力データ102は、SBR出力データになる。以下の実施例は、主として、SBRの実施例を記載するが、本発明の装置/方法は、この実施例に制限されない。
エネルギー分布データ125は、第1の周波数帯域に含まれるエネルギーと、それと比較される第2の周波数帯域の中に含まれるエネルギーとの関係を示す。最も簡単な場合には、エネルギー分布データは、SBRバンド(上側の帯域)と比較してより多くのエネルギーがベースバンドに格納されるかまたはその逆と比較して格納されるかどうかを示しているビットによって与えられる。SBRバンド(上側の帯域)は、例えば4kHzにより与えられ得る閾値より上の周波数成分として定義することができ、ベースバンド(下側の帯域)は、この限界周波数(例えば4kHz以下または他の周波数)以下にある信号の成分でもよい。これらの限界周波数のための例は、5kHzまたは6kHzである。
図2aおよび2bは、オーディオ信号105の時間部分のスペクトルにおける2つのエネルギー分布を示す。エネルギー分布は、アナログ信号のように、周波数Fの関数として、レベルPによって示される。そしてそれは、複数のサンプルまたは線(周波数ドメインに変更される)によって与えられる信号のエンベロープでもよい。また、示されたグラフは、スペクトル傾斜概念を視覚化するために、非常に単純化される。下側および上側の周波数帯域は、限界周波数F0(例えば500Hz、1kHzまたは2kHzの交差周波数)より下の、または、より上の周波数として定義することができる。
図2aは、減少するスペクトル傾斜(より高い周波数で減少)を呈しているエネルギー分布を示す。換言すれば、この場合、高周波成分においてよりも低周波成分に格納されるより多くのエネルギーがある。それゆえ、レベルPは、負のスペクトル傾斜(減少関数)を意味しているより高い周波数に対して減少する。それゆえ、信号レベルPは、より少ないエネルギーが下側の帯域(F<F0)より上側の帯域(F>F0)にあることを示す場合、レベルPは負のスペクトル傾斜を含む。この種の信号は、例えば、低いまたは最大限の歯擦音ですらないオーディオ信号のために発生する。
図2bは、レベルPが正のスペクトル傾斜(周波数に応じて増加するレベルPの関数)を意味している周波数Fによって増加する場合を示す。それゆえ、レベルPは、より多くのエネルギーが下側帯(F<F0)と比較して上側帯(F>F0)に信号レベルPがあることを示す場合、正のスペクトル傾斜を含む。この種のエネルギー分布は、例えば、オーディオ信号105が前記歯擦音を含む場合、生成される。
図2aは、負のスペクトル傾斜を有する信号のパワースペクトルを図解する。負のスペクトル傾斜は、減少するスペクトルの傾斜を意味する。それに対して反対で、図2bは正のスペクトル傾斜を有する信号のパワースペクトルを図解する。言い換えれば、前述のこのスペクトル傾斜は、上昇する傾斜を有する。当然、図2aにおいて図解されるスペクトルのような各スペクトルまたは図2bにおいて図解されるスペクトルには、スペクトル傾斜と異なる傾斜を有する局所的規模における変化がある。
直線は、例えば、この直線および実際のスペクトル間の二乗された違いを最小限にすることなどによって、パワースペクトルに適しているときに、スペクトル傾斜が得られる。直線をスペクトルに適合させることは、短い時間スペクトルのスペクトル傾斜を計算するための方法のうちの1つであり得る。しかしながら、むしろLPC係数を使用しているスペクトル傾斜を計算することが好まれる。V.ゴンチャロフ、E.Von CollnおよびR.モーリス、ナバルCommand、ControlおよびOceanサーベイランス・センター(NCCOSC)RDTおよびE部、サンディエゴ、CA 92152―52001による刊行「さまざまなLPCパラメータからのスペクトル傾斜の効率的な計算」は、1996年5月23日に、スペクトル傾斜を計算するいくつかの方法を開示する。
1つの実施において、スペクトル傾斜は、対数パワースペクトルに対する最小二乗法の傾斜として定義される。しかしながら、非対数パワースペクトルないし振幅スペクトル、あるいは他のいかなる種類のスペクトルに適合している直線もまた適用され得る。これは本発明との関連で特に当てはまることである。ここで、好ましい実施例において、1つは主にスペクトル傾斜、すなわち、適合結果が正であるか負であるかどうかの線形の傾斜の符号に関連される。しかしながら、スペクトル傾斜の実際の値は、本発明の高効率の実施例において重要でない。ただし、実際の値はより精巧な実施例において重要でありえる。
話し言葉の線形予測コーディング(LPC)がその短時間スペクトルをモデル化するために用いられる場合、対数パワースペクトルからの代わりにLPCモデル・パラメータから直接にスペクトル傾斜を計算することは計算的により効率的である。図2cは、第n番目の全極型対数パワースペクトルに対応するケプストラム係数ckのための方程式を図解する。この方程式において、kが整数のインデックスであり、pnは、LPCフィルタのz領域伝達関数H(z)の全極の第n番目の極である。図2cの次の方程式は、ケプストラム係数に関するスペクトル傾斜である。具体的には、mはスペクトル傾斜である、kおよびnは整数である、そして、NはH(z)のための全極モデルの最高次数である。図2cの次の方程式は、N次のLPCフィルタの対数パワースペクトルS(ω)を定める。Gはゲイン定数であり、αkは線形予測係数であり、ωは2πfに等しく、ここで、fは周波数である。図2cの一番下の方程式は、LPC係数αkの関数として、直接にケプストラム係数をもたらす。ケプストラム係数ckは、その結果、スペクトル傾斜を計算するために用いられる。通常、この方法は、極値を得るためにLPC多項式を因数分解して、極方程式を使用しているスペクトル傾斜について解くことよって、よりコンピュータ的に効率的である。このように、LPC係数αkを計算した後に、図2cの下の方程式を用いてケプストラム係数ckを計算することができ、そして、それから、図2cの最初の方程式を用いてケプストラム係数から極pnを計算することができる。その結果、極に基づいて、図2cの2番目の方程式において定義したスペクトル傾斜mを計算することができる。
1次のLPC係数α1は、スペクトル傾斜の徴候の良好な目算を有するために、充分であることが分かっている。それゆえに、α1は、c1の良好な推定値である。したがって、c1は、p1の良好な推定値である。p1がスペクトル傾斜mのための方程式に挿入されるときに、スペクトル傾斜mの符号が、図2cのLPC係数の定義において、1次のLPC係数α1の符号に対して逆であることが、図2cの2番目の方程式のマイナスの符号によって、それは明らかになっている。
好ましくは、信号エネルギー・キャラクタライザ120は、エネルギー分布データとして、オーディオ信号の現在の時間部分におけるオーディオ信号のスペクトル傾斜の表示を生成するように構成される。
好ましくは、信号エネルギー・キャラクタライザ120は、エネルギー分布データとして、1つ以上の下位のLPC係数を推定するためのオーディオ信号の時間部分のLPC分析に由来するデータおよび1つ以上の下位のLPC係数から由来するエネルギー分布データを生成するように構成されている。
好ましくは、信号エネルギー・キャラクタライザ120は、第1のLPC係数を計算するだけであり、そして、付加的なLPC係数を計算し、そして、第1のLPC係数の符号からエネルギー分布データを引き出すために構成される。
好ましくは、信号エネルギー・キャラクタライザ120は、第1のLPC係数が正の符号を有するときに、スペクトルエネルギーは、より低い周波数からより高い周波数に減少する負のスペクトル傾斜として、スペクトル傾斜を決定するために構成され、そして、第1のLPC係数が負の符号を有するときに、スペクトルエネルギーは、より低い周波数からより高い周波数に増加する正のスペクトル傾斜としてスペクトル傾斜を検出するために構成される。
他の実施態様において、スペクトル傾斜検出器または信号エネルギー・キャラクタライザ120は、1次のLPC係数を計算するだけでなく、3次または4次またはより高次までのようにいくつかの下位のLPC係数を計算するように構成されている。このような実施例では、スペクトル傾斜は、歯擦音パラメータとして符号を示すだけでなく、実施例の符号においてみられるような2以上の値を有する傾斜に応じて数値データも示すことができるように高精度に計算される。
前記上記の歯擦音は、大量のエネルギーを上の周波数領域に含むが、歯擦音(例えば母音)がないかまたはほんの少ししかない部分に対して、大部分はベースバンド(低周波帯域)の中で分布される。この観測は、拡張された音声信号パートが歯擦音を含むか含まないことを決定するかどうかのために用いることができる。
それゆえ、ノイズフロア測定器110(検出器)は、歯擦音の量についての決定のために、または、信号の範囲内である程度の歯擦音を与えるために、スペクトル傾斜を用いることができる。スペクトル傾斜は、基本的にエネルギー分布の単純なLPC分析から得られることができる。それは、第1のLPC係数から、スペクトル(増加作用か減少作用であろうとなかろうと)の反応は割り出すことができるという理由で、例えば、スペクトル傾斜パラメータ(歯擦音パラメータ)を決定するために、第1のLPC係数を計算するのに十分である。この分析は、信号エネルギー・キャラクタライザ120の範囲内で実行することができる。オーディオデコーダがオーディオ信号をデコードするためのLPCを使用する場合に備えて、第1のLPC係数がデコーダ側上のエネルギー分布データとして用いることができるので、歯擦音パラメータは伝送する必要がない。
実施例において、処理装置130は、修正されたノイズフロアデータを得るために、ネルギー分布データ125(スペクトル傾斜)に応じて、ノイズフロアデータ115を変えるように構成することができる。そして、処理装置130は、BWE出力データ102を含むビットストリームに修正されたノイズフロアデータを加えるように構成することができる。ノイズフロアデータ115の変更は、より少ない歯擦音(図2a)を含むオーディオ信号105と比較して、修正されたノイズフロアがより多くの歯擦音(図2b)を含むオーディオ信号105のために増加するようなものでもよい。
帯域幅拡張(BWE)出力データ102を生成するための装置100は、エンコーダ300の一部であり得る。図3は、BWE関連のモジュール310(それは、例えば、SBR関連のモジュールを含んでもよい)、分析QMFバンク320、ローパス・フィルタ(LPフィルタ)330、AACコア・エンコーダ340およびビットストリーム・ペイロード・フォーマッタ350を含むエンコーダ300のための実施例を示す。加えて、エンコーダ300は、エンベロープデータ・カルキュレータ210を含む。エンコーダ300は、分析QMFバンク320、BWE関連モジュール310およびLPフィルタ330に接続されるPCMサンプルのための入力信号(オーディオ信号105;PCM=パルス符号変調)を含む。分析QMFバンク320は、エンベロープデータ・カルキュレータ210と接続され、第2の周波数帯域105bを分離する高域フィルタを含む。そして、それは、次に、ビットストリーム・ペイロード・フォーマッタ350と接続される。LPフィルタ330は、AACコア・エンコーダ340と接続され、第1の周波数帯域105aを切り離すローパス・フィルタを含む。そして、それは、次に、ビットストリーム・ペイロード・フォーマッタ350と接続される。最後に、BWE関連のモジュール310は、エンベロープデータ・カルキュレータ210およびAACコア・エンコーダ340に接続される。
したがって、エンコーダ300は、コア周波数帯域105a(LPフィルタ330において)の成分を生成するために、オーディオ信号105のダウンサンプリングをする。そしてそれは、AACコア・エンコーダ340に入力される。そしてそれは、オーディオ信号をコア周波数帯域にコード化して、ビットストリーム・ペイロード・フォーマッタ350に符号化信号355を伝送する。そこにおいて、コア周波数帯域の符号化されたオーディオ信号355は、符号化されたオーディオストリーム345(ビットストリーム)に加えられる。一方では、オーディオ信号105は、分析QMFバンク320によって分析される、そして、分析QMFバンクのハイパスフィルタは、高周波帯域105bの周波数成分を抽出して、BWEデータ375を生成するために、この信号をエンベロープデータ・カルキュレータ210に入力する。例えば、64サブバンドQMFバンク320は、入力信号のサブバンドフィルタリングを実行する。このように、フィルタバンク(すなわち、サブバンドサンプル)からの出力は、複合的価値を有し、規則的なQMFバンクと比較して、2倍でオーバーサンプリングされる。
BWE関連のモジュール310は、例えば、BWE出力データ102を生成する装置100を含み得る。当該装置100は、例えば、BWE出力データ102(歯擦音パラメータ)をエンベロープデータ・カルキュレータ210に提供することによって、エンベロープデータ・カルキュレータ210を制御する。分析QMFバンク320によって生成されるオーディオ成分105bを用いて、エンベロープデータ・カルキュレータ210は、BWEデータ375を計算し、ビットストリーム・ペイロード・フォーマッタ350にBWEデータ375を伝送する。そしてそれは、BWEデータ375と、オーディオストリーム345のコア・エンコーダ340によって符号化された成分355とを結合する。加えて、エンベロープデータ・カルキュレータ210は、例えば、ノイズ・エンベロープの中でノイズフロアを調整するために、例えば歯擦音パラメータ125を使用することができる。
あるいは、装置100は、BWE出力データ102を生成するための、エンベロープデータ・カルキュレータ210の一部でもよい。そして、処理装置は、ビットストリーム・ペイロード・フォーマッタ350の一部でもよい。したがって、装置100の異なる構成要素は、図3の異なるエンコーダの構成部品の一部でもよい。
図4は、デコーダ400のための実施例を示す。そこにおいて、符号化されたオーディオストリーム345は、ビットストリーム・ペイロード・デフォーマッタ357に入力される。そしてそれは、符号化されたオーディオ信号355をBWEデータ375から分離する。符号化されたオーディオ信号355は、例えば、AACコア・デコーダ360に入力される、そしてそれは、第1の周波数帯域の復号化されたオーディオ信号105aを生成する。オーディオ信号105a(第1の周波数帯域の成分)は、32個のバンド分析QMFバンク370に入力され、例えば、第1の周波数帯域のオーディオ信号105aから32個の周波数サブバンド105 32 を生成する。周波数サブバンド・オーディオ信号105 32 は、未加工信号スペクトル表示425(パッチ)を生成するために、パッチ・ジェネレータ410に入力される。そしてそれはBWEツールに430aに入力される。BWEツール430aは、例えば、ノイズフロアを生成するために、ノイズフロア計算ユニットを含む。加えて、BWEツール430aは、欠落高調波を再建することができるかまたは逆フィルタ・ステップを実行することができる。BWEツール430aは、パッチ・ジェネレータ410のQMFスペクトルデータ出力に用いられる周知のスペクトル帯域複製方法を実施することができる。周波数ドメインにおいて使用するパッチング・アルゴリズムは、例えば、周波数ドメインの中でスペクトルデータの単純なミラーリングまたは複製を採用することができる。
一方で、BWEデータ375(例えばBWE出力データ102を含む)は、ビットストリーム・パーサ380に入力される。そしてそれは、異なるサブ情報385を取得して、BWEデータ375を分析し、例えば、制御情報412およびスペクトル帯域複製パラメータ102を引き出すために、例えばハフマン復号化および非量子化ユニット390にそれらを入力する。制御情報412は、パッチ・ジェネレータ410(例えば、特定のパッチング・アルゴリズムを使用する)を制御し、また、BWEパラメータ102は、例えば、エネルギー分布データ125(例えば歯擦音パラメータ))を含む。制御情報412は、BWEツール430aに入力され、そして、スペクトル帯域複製パラメータ102は、BWEツール430aおよびエンベロープアジャスタ430bに入力される。エンベロープアジャスタ430bは、生成されたパッチのためのエンベロープを調整するよう作動する。その結果、エンベロープアジャスタ430bは、第2の周波数帯域のために調整された未加工信号105bを生成して、それを合成QMFバンク440に入力する。そしてそれは、第2の周波数帯域105bの成分を周波数ドメイン105 32 のオーディオ信号と結合する。合成QMF―バンク440は、例えば、64個の周波数バンドを含み、両方の信号(第2の周波数帯域105bおよび周波数ドメイン・オーディオ信号105 32 の成分)を結合することによって、合成オーディオ信号が105(例えばPCMサンプルの出力、PCM=パルス符号変調)を生成する。
合成QMFバンク440は、それが時間領域に変わる前に、そして、それがオーディオ信号105として出力される前に、周波数ドメイン信号105 32 と第2の周波数帯域105bを結合する結合手段を含み得る。結合手段は、任意に、周波数ドメインのオーディオ信号105を出力することができる。BWEツール430aは、スペクトル成分105aが、コア・コーダ340によって伝送されて、オリジナル信号の第2の周波数帯域105bの調性を呈する第2の周波数帯域105bの成分を合成するために用いることができるように、修復されたスペクトル(未加工の信号スペクトル表示425)に付加的なノイズを加える従来のノイズフロアツールを含む。しかしながら、特に、有声音声通話路において、従来のノイズフロアツールによって加えられる付加的なノイズは、再生信号の知覚品質に悪影響を与えることがある。
実施例によれば、検出された一定の歯擦音(図2を見よ)に応じて、フロアノズルツールが、エネルギー分布データ125(BWEデータ102の一部)を考慮してノイズフロアを変換するように、ノイズフロアツールは修正され得る。もう一つの方法として、上記のように、デコーダが修正され得ず、その代わりに、エンコーダは、検出されたある程度の歯擦音に応じて、ノイズフロアデータを変換することができる。
図5は、本発明の実施例の修正されたノイズフロア計算ツールと従来のノイズフロア計算ツールとの比較を示す。この修正されたノイズフロアツールは、BWEツール430の一部であり得る。
図5aは、未加工のスペクトル線およびノイズ・スペクトル線を計算するために、スペクトル帯域複製パラメータ102および未加工の信号スペクトル表示425を使用するカルキュレータ433を含む従来のノイズフロア計算ツールを示す。BWEデータ375は、符号化されたオーディオストリーム345の一部としてエンコーダから伝送されるエンベロープデータおよびノイズフロアデータを含み得る。未加工の信号スペクトル表示425は、例えば、上側の周波数帯域(第2の周波数帯域105bの合成された成分)のオーディオ信号の成分を生成するパッチ・ジェネレータから得られる。未加工のスペクトル線およびノイズ・スペクトル線は、さらに、逆フィルタ、エンベロープ調整、欠落した高調波の追加などの必要な処理が行われる。最後に、結合手段434は、未加工のスペクトル線と計算されたノイズ・スペクトル線とを組み合せて第2の周波数帯域105bの成分を形成する。
図5bは、本発明の実施例に従属するノイズフロア計算ツールを示す。図5aで示されるように、従来のノイズフロア計算ツールに加えて、実施例は、例えば、ノイズフロア計算ツール433で必要な処理が行われる前に、エネルギー分布データ125に基づいて、伝送されたノイズフロアデータを修正するように構成されるノイズフロア修正ユニット431を含む。エネルギー分布データ125は、エンコーダからBWEデータ375に加えて伝送することができ、あるいは、その一部として伝送することができる。伝送されたフロアノイズデータの修正は、例えば、ノイズフロアのレベルに対しての正のスペクトル傾斜(図2aを見よ)の増加または負のスペクトル傾斜(図2bを見よ)の減少を含む。一例として、3dBによる増加または3dBによる減少または他のいかなる離散値(例えば、+/−1dB、または、+/−2dB))も含む。離散値は、整数dB値または整数以外のdB値であり得る。関数的従属性(例えば線形関係)は、減少/増加およびスペクトル傾斜の間にもあり得る。
この修正されたノイズフロアデータに基づいて、ノイズフロア計算ツール433は、再び未加工の生のスペクトル線を計算し、未加工の信号スペクトル表示425に基づいてノイズ・スペクトル線を修正した。そして、それはパッチ・ジェネレータから再び得ることができる。図5bのスペクトル帯域複製ツール430は、第2の周波数帯域105bの成分を生成するために、未加工のスペクトル線と計算されたノイズフロア(修正ユニット431からの修正によって)とを結合するための結合手段434もまた含む。
エネルギー分布データ125は、伝送されたノイズフロアデータのレベルの修正を最も単純な場合において示すことができる。前記のように、第1のLPC係数は、また、エネルギー分布データ125として用いられ得る。したがって、さらなる実施例は、符号化オーディオストリーム345によってすでに伝送されているオーディオ信号105がLPCを用いて符号化される場合、エネルギー分布データ125として、第1のLPC係数を使用する。この場合、エネルギー分布データ125を加えて伝送する必要がない。
また、ノイズフロア修正ユニット431が処理装置433を経て配置することができるように、ノイズフロアの修正は、計算の後、カルキュレータ433で行うこともできる。さらなる実施例において、エネルギー分布データ125は、計算パラメータとしてノイズフロアの計算を直接修正しているカルキュレータ433に、直接入力され得る。それゆえ、ノイズフロア修正ユニット431およびカルキュレータ/処理装置433は、ノイズフロア修正ツール433,431に結合され得る。
もう一つの実施例では、ノイズフロア計算ツールは、スイッチを含むBWEツール430を含む。そこにおいて、スイッチは、高レベルのノイズフロア(正のスペクトル傾斜)および低レベルのノイズフロア(負のスペクトル傾斜)の間に切り替わるように構成される。例えば、高レベルは、ノイズのための伝送されたレベルが2倍になる(または要因によって乗算される)場合に相当するのに対して、低レベルは、伝送されたレベルが要因によって低下する場合に相当する。スイッチは、オーディオ信号の正または負のスペクトル傾斜を示している符号化されたオーディオ信号345のビットストリームのビットによって制御することができる。また、スイッチは、復号化されたオーディオ信号105a(第1の周波数帯域の成分)の分析、あるいは、周波数サブバンド・オーディオ信号10532の分析、例えばスペクトル傾斜(スペクトル傾斜が正または負であるかどうか)に関しての分析によっても、作動することができる。また、スイッチは、第1のLPC係数によって制御することもできる。これは、この係数がスペクトル傾斜(上記参照)を示しているためである。
図1,3〜5のいくつかには、装置のブロック図が図解されているにもかかわらず、これらの図は同時に方法の説明図である。ここで、ブロックの機能性は、方法のステップに対応する。
前記したように、SBRタイムユニット(SBRフレーム)または時間部分は、さまざまなデータブロック(いわゆるエンベロープ)に分割することができる。この分割は、SBRフレームを通して均一であってもよく、SBRフレームでオーディオ信号の合成を柔軟に調整することができる。
図6は、エンベロープの数nにおけるSBRフレームのための前記の分割を図解する。SBRフレームは、最初の時間t0および最終の時間tnとの間の時間または時間部分Tをカバーする。例えば、時間部分Tは、8つの時間部分、最初の時間部分T1、2番目の時間部分T2、・・・8番目の時間部分T8に分割される。この実施例では、エンベロープの最大数は、時間部分の数と一致して、n=8によって与えられる。8つの時間部分T1、・・・、T8は、境界1が第1番目および第2番目の時間部分T1およびT2を分離し、境界2が第2番目部分T2および第3番目部分T3の間に位置し、境界7が第7番目部分T7および第8番目部分T8を分離するまでを意味する7つの境界によって、分離される。
さらなる実施例において、SBRフレームは、4つのノイズ・エンベロープ(n=4)に分けられるかまたは2つのノイズ・エンベロープ(n=2)に分けられる。図6で示される実施例において、すべてのエンベロープは、同じ時間的長さを含む。そしてそれは、ノイズ・エンベロープが異なっている時間長さをカバーするように、他の実施例において異なってもよい。詳細には、2つのノイズを有するエンベロープ(n=2)の場合、第1のエンベロープは、時間t0から最初の4つの時間部分(T1、T2、T3およびT4)にわたって延びて、第2のノイズ・エンベロープは、第5番目から第8番目の時間部分(T5、T6、T7およびT8)までカバーする。標準規格ISO/IEC 14496―3によって、エンベロープの最大限度の数は、2に制限される。しかし、実施例は、エンベロープ(例えば2、4または8つのエンベロープ)がいくつでも使用することができる。
さらなる実施例において、エンベロープデータ・カルキュレータ210は、測定されたノイズフロアデータ115の変更に応じてエンベロープの数を変えるように構成される。例えば、測定されたノイズフロアデータ115が変更ノイズフロア(例えば閾値より上)を示す場合、エンベロープの数は増加する可能性があるのに対して、ノイズフロアデータ115が一定のノイズフロアを示す場合に備えて、エンベロープの数は減少する可能性がある。他の実施態様において、信号エネルギー・キャラクタライザ120は、話し言葉の歯擦音を検出するために、言語学的情報に基づくことがあり得る。例えば、音声信号は、国際的な発音から類推されるつづりのような関連したメタ情報に結びつけられ、それから、このメタ情報の分析は、スピーチ部分の歯擦音の検出も提供する。これに関連して、オーディオ信号のメタデータ部分は、分析される。
いくつかの態様が装置との関連で記載されていたにもかかわらず、ブロックまたはデバイスが方法ステップまたは方法ステップの機能に対応する場合には、これらの態様もまた対応する方法の説明を表すことは、明らかである。同様に、態様は、対応するブロック、または、項目、または、対応する装置の機能の説明を表す方法ステップとの関連でも記載されている。
この発明の符号化されたオーディオ信号は、デジタル記憶媒体に保存することができるか、または、例えば無線伝送媒体などの伝送媒体、または、例えばインターネットなどの有線伝送媒体にすることができる。
特定の実現要求に応じて、本発明の実施例は、ハードウェアにおいて、または、ソフトウェアにおいて実現することができる。インプリメンテーションは、その上に格納される電子的に読み込み可能な制御信号を有するデジタル記憶媒体(例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリ)を使用することで、実行することができる。そしてそれは、それぞれの方法が実行されるように、プログラミング可能なコンピュータシステムと協同する(または、協同することができる)。
本発明によるいくつかの実施例は、本願明細書において記載されている方法のうちの1つは実行されるように、プログラミング可能なコンピュータシステムと協同することができる電子的に読み込み可能な制御信号を有するデータ記憶媒体を含む。
通常、本発明の実施例は、プログラムコードを有するコンピュータ・プログラム製品として実装されることができる。そして、コンピュータ・プログラム製品がコンピュータ上で動作するときに、その方法のうちの1つを実行するために、プログラムコードが実施されている。プログラムコードは、機械可読キャリアに例えば格納することができる。
他の実施例は、本願明細書において記載されていて、機械可読キャリアに格納される方法のうちの1つを実行するための計算機プログラムを含む。
したがって、換言すれば、本発明の方法の実施例は、コンピュータ・プログラムがコンピュータで作動するときに、本願明細書において記載されている方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施例において、 データキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)は、本願明細書において記載されている方法のうちの1つを実行するために、その上に記録されるコンピュータプログラムを含む。
したがって、発明の方法のさらなる実施例は、本願明細書において記載されている方法のうちの1つを実行するためのコンピュータプログラムを示すデータストリームまたは一連の信号である。データストリームまたは一連の信号は、データ通信接続によって、例えばインターネットを介して伝送するために構成することができる。
さらなる実施例は、本願明細書において記載されている方法のうちの1つを実行するようにあるいは実行するように適合される、例えばコンピュータまたはプログラム可能論理回路などの処理手段を含む。
さらなる実施例は、本願明細書において記載されている方法のうちの1つを実行するために、コンピュータプログラムがインストールされたコンピュータを含む。
いくつかの実施例において、プログラム可能論理回路(例えばフィールドプログラマブルゲートアレイ)は、本願明細書において記載されている方法の機能性のいくらかまたは全てを実行するために、用いることができる。いくつかの実施例において、フィールドプログラマブルゲートアレイは、本願明細書において記載されている方法のうちの1つを実行するために、マイクロプロセッサと協同することができる。通常、好ましくは、この方法は、いかなるハードウェア装置によっても実行される。
上記した実施例は、単に本発明の原理のために図示するだけである。本願明細書において記載されている配置の修正、変更および詳細は、他の当業者にとって明らかであろうことは理解される。したがって、本発明は、特許請求の範囲によってのみ限定されるものであり、本願明細書の実施例の記述および説明によって提示された特定の細部によって限定されるものではないということが真意である。

Claims (8)

  1. オーディオ信号(105)に対して帯域幅拡張出力データ(102)を生成するための装置(100)であって、
    前記オーディオ信号(105)は、第1の周波数帯域(105a)および第2の周波数帯域(105b)の成分を含み、前記帯域幅拡張出力データ(102)は、前記第2の周波数帯域(105b)の前記成分の合成を制御するように適合され、
    前記装置は、
    前記オーディオ信号の時間部分のための前記第2の周波数帯域のノイズフロアを示す前記オーディオ信号(105)の時間部分(T)のための前記第2の周波数帯域(105b)のノイズフロアデータ(115)を測定するためのノイズフロア測定器(110)、
    前記時間部分(T)のスペクトルにおけるエネルギー分布を特徴づけているエネルギー分布データ(125)を引き出すための信号エネルギー・キャラクタライザ(120)、および
    修正されたノイズフロアを示す修正されたノイズフロアデータを得るために、より多くの歯擦音を含むオーディオ信号(105)については、より少ない歯擦音を含むオーディオ信号(105)に比べると、前記修正されたノイズフロアが増加されるように、前記エネルギー分布データ(125)に従って前記ノイズフロアデータ(115)を変更する処理装置(130)を含み、
    前記処理装置(130)は、前記帯域幅拡張出力データ(102)を得るために、前記修正されたノイズフロアデータをビットストリームに加算するよう構成される、オーディオ信号(105)に対して帯域幅拡張出力データ(102)を生成するための装置(100)。
  2. 前記信号エネルギー・キャラクタライザ(120)は、エネルギー分布データ(125)として、歯擦音パラメータまたはスペクトル傾斜パラメータを用いるように構成され、前記歯擦音パラメータまたは前記スペクトル傾斜パラメータは、周波数(F)を有する前記オーディオ信号(105)の増加レベルまたは減少レベルを特定する、請求項1に記載の装置(100)。
  3. 前記信号エネルギー・キャラクタライザ(120)は、前記歯擦音パラメータとして、第1の線形予測符号化係数を用いるように構成されている、請求項2に記載の装置(100)。
  4. 前記処理装置(130)は、前記ノイズフロアデータ(115)および前記スペクトルエネルギー分布データ(125)を前記帯域幅拡張出力データ(102)としてのビットストリームに加えるように構成されている、請求項1〜請求項3のいずれか1項に記載の装置(100)。
  5. オーディオ信号(105)を符号化するためのエンコーダ(300)であって、
    前記オーディオ信号(105)は、第1の周波数帯域(105a)および第2の周波数帯域(105b)の成分を含み、
    前記エンコーダは、
    前記第1の周波数帯域(105a)の前記成分をコード化するためのコア・コーダ(340)、
    帯域幅拡張出力データ(102)を生成するための請求項1〜請求項4のいずれか1項に記載の装置、および
    前記第2の周波数帯域(105b)の成分に基づいて、帯域幅拡張データ(375)を計算するためのノイズエンベロープデータ・カルキュレータ(210)を含み、
    前記計算された帯域幅拡張データ(375)は、前記帯域幅拡張出力データ(102)を含む、オーディオ信号(105)を符号化するためのエンコーダ(300)。
  6. 前記時間部分(T)は、複数のノイズ・エンベロープを含むSBRフレームをカバーし、
    前記ノイズエンベロープデータ・カルキュレータ(210)は、前記複数のノイズ・エンベロープの異なるノイズ・エンベロープのために、異なる帯域幅拡張データ(375)を計算するように構成されている、請求項5に記載のエンコーダ(300)。
  7. オーディオ信号(105)に対して帯域幅拡張出力データ(102)を生成するための方法であって、
    前記オーディオ信号(105)は、第1の周波数帯域(105a)の成分および第2の周波数帯域(105b)の成分を含み、
    前記帯域幅拡張出力データは、前記第2の周波数帯域(105b)の成分の合成を制御するように適合され、
    前記帯域幅拡張出力データ(102)を生成する工程は、
    前記オーディオ信号の時間部分のための前記第2の周波数帯域のノイズフロアを示す前記オーディオ信号(105)の時間部分(T)のための前記第2の周波数帯域(105b)のノイズフロアデータ(115)を測定すること、
    前記オーディオ信号(105)の前記時間部分(T)のスペクトルにおけるエネルギー分布を特徴づけているエネルギー分布データ(125)を引き出すこと、
    修正されたノイズフロアデータを示す修正されたノイズフロアデータを得るために、より多くの歯擦音を含むオーディオ信号(105)については、より少ない歯擦音を含むオーディオ信号(105)に比べると、前記修正されたノイズフロアが増加されるように、前記エネルギー分布データ(125)に従って前記ノイズフロアデータ(115)を変更すること、および
    前記帯域幅拡張出力データ(102)を得るために、前記修正されたノイズフロアデータをビットストリームに加算することを含む、オーディオ信号(105)に対して帯域幅拡張出力データ(102)を生成するための方法。
  8. 請求項7に記載の方法をコンピュータに実行させるためのコンピュータプログラム。
JP2011516986A 2008-07-11 2009-06-23 帯域幅拡張出力データを生成するための装置および方法 Active JP5628163B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7984108P 2008-07-11 2008-07-11
US61/079,841 2008-07-11
PCT/EP2009/004521 WO2010003544A1 (en) 2008-07-11 2009-06-23 An apparatus and a method for generating bandwidth extension output data

Publications (2)

Publication Number Publication Date
JP2011527448A JP2011527448A (ja) 2011-10-27
JP5628163B2 true JP5628163B2 (ja) 2014-11-19

Family

ID=40902067

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011516986A Active JP5628163B2 (ja) 2008-07-11 2009-06-23 帯域幅拡張出力データを生成するための装置および方法
JP2011516988A Active JP5551694B2 (ja) 2008-07-11 2009-06-23 多くのスペクトルエンベロープを計算するための装置および方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011516988A Active JP5551694B2 (ja) 2008-07-11 2009-06-23 多くのスペクトルエンベロープを計算するための装置および方法

Country Status (20)

Country Link
US (2) US8612214B2 (ja)
EP (2) EP2301028B1 (ja)
JP (2) JP5628163B2 (ja)
KR (5) KR101395252B1 (ja)
CN (2) CN102089817B (ja)
AR (3) AR072480A1 (ja)
AU (2) AU2009267530A1 (ja)
BR (2) BRPI0910517B1 (ja)
CA (2) CA2730200C (ja)
CO (2) CO6341676A2 (ja)
ES (2) ES2539304T3 (ja)
HK (2) HK1156141A1 (ja)
IL (2) IL210196A (ja)
MX (2) MX2011000367A (ja)
MY (2) MY153594A (ja)
PL (2) PL2301027T3 (ja)
RU (2) RU2494477C2 (ja)
TW (2) TWI415115B (ja)
WO (2) WO2010003544A1 (ja)
ZA (2) ZA201009207B (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
CA2792452C (en) 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks
RU2591012C2 (ru) 2010-03-09 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ обработки переходных процессов для аудио сигналов с изменением скорости воспроизведения или высоты тона
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
BR112012026326B1 (pt) * 2010-04-13 2021-05-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V método e codificador e decodificador para representação com amostragem precisa de um sinal de áudio
ES2719102T3 (es) * 2010-04-16 2019-07-08 Fraunhofer Ges Forschung Aparato, procedimiento y programa informático para generar una señal de banda ancha que utiliza extensión de ancho de banda guiada y extensión de ancho de banda ciega
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5633431B2 (ja) * 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9633654B2 (en) 2011-12-06 2017-04-25 Intel Corporation Low power voice detection
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
US9640190B2 (en) * 2012-08-29 2017-05-02 Nippon Telegraph And Telephone Corporation Decoding method, decoding apparatus, program, and recording medium therefor
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
BR112015017632B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
MX347080B (es) 2013-01-29 2017-04-11 Fraunhofer Ges Forschung Llenado con ruido sin informacion secundaria para celp (para codificadores tipo celp).
CA2961336C (en) * 2013-01-29 2021-09-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates
ES2688134T3 (es) 2013-04-05 2018-10-31 Dolby International Ab Codificador y decodificador de audio para codificación de forma de onda intercalada
WO2014161996A2 (en) 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
BR112015031605B1 (pt) * 2013-06-21 2022-03-29 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
EP3040987B1 (en) 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10120067B2 (en) 2014-08-29 2018-11-06 Leica Geosystems Ag Range data compression
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
CN105513601A (zh) * 2016-01-27 2016-04-20 武汉大学 一种音频编码带宽扩展中频带复制的方法及装置
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10084493B1 (en) * 2017-07-06 2018-09-25 Gogo Llc Systems and methods for facilitating predictive noise mitigation
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
US11811686B2 (en) 2020-12-08 2023-11-07 Mediatek Inc. Packet reordering method of sound bar

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2128396C1 (ru) * 1997-07-25 1999-03-27 Гриценко Владимир Васильевич Способ передачи и приема информации и устройство для его осуществления
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6901362B1 (en) * 2000-04-19 2005-05-31 Microsoft Corporation Audio segmentation and classification
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
CA2501368C (en) 2002-10-11 2013-06-25 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
JP2004350077A (ja) * 2003-05-23 2004-12-09 Matsushita Electric Ind Co Ltd アナログオーディオ信号送信装置および受信装置並びにアナログオーディオ信号伝送方法
SE0301901L (sv) 2003-06-26 2004-12-27 Abb Research Ltd Metod för att diagnostisera utrustningsstatus
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
KR101008022B1 (ko) * 2004-02-10 2011-01-14 삼성전자주식회사 유성음 및 무성음 검출방법 및 장치
US20080260048A1 (en) 2004-02-16 2008-10-23 Koninklijke Philips Electronics, N.V. Transcoder and Method of Transcoding Therefore
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US8314694B2 (en) 2004-06-28 2012-11-20 Abb Research Ltd System and method for suppressing redundant alarms
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
US8036394B1 (en) * 2005-02-28 2011-10-11 Texas Instruments Incorporated Audio bandwidth expansion
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
JP5117407B2 (ja) 2006-02-14 2013-01-16 フランス・テレコム オーディオ符号化/復号化で知覚的に重み付けするための装置
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US20070282803A1 (en) * 2006-06-02 2007-12-06 International Business Machines Corporation Methods and systems for inventory policy generation using structured query language
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
WO2008031458A1 (en) 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009081315A1 (en) 2007-12-18 2009-07-02 Koninklijke Philips Electronics N.V. Encoding and decoding audio or speech
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
AU2009220321B2 (en) * 2008-03-03 2011-09-22 Intellectual Discovery Co., Ltd. Method and apparatus for processing audio signal
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing

Also Published As

Publication number Publication date
WO2010003546A2 (en) 2010-01-14
KR20130033468A (ko) 2013-04-03
TWI415115B (zh) 2013-11-11
AR072552A1 (es) 2010-09-08
KR20110040820A (ko) 2011-04-20
CO6341676A2 (es) 2011-11-21
CA2730200A1 (en) 2010-01-14
MY155538A (en) 2015-10-30
EP2301028A2 (en) 2011-03-30
KR20130095841A (ko) 2013-08-28
EP2301027A1 (en) 2011-03-30
WO2010003544A1 (en) 2010-01-14
AU2009267532A1 (en) 2010-01-14
EP2301028B1 (en) 2012-12-05
AR097473A2 (es) 2016-03-16
BRPI0910523B1 (pt) 2021-11-09
AU2009267532B2 (en) 2013-04-04
US8296159B2 (en) 2012-10-23
ZA201009207B (en) 2011-09-28
US20110202352A1 (en) 2011-08-18
TW201007701A (en) 2010-02-16
IL210196A (en) 2015-10-29
JP2011527450A (ja) 2011-10-27
CN102144259B (zh) 2015-01-07
KR101395257B1 (ko) 2014-05-15
BRPI0910517A2 (pt) 2016-07-26
JP2011527448A (ja) 2011-10-27
KR101345695B1 (ko) 2013-12-30
EP2301027B1 (en) 2015-04-08
IL210330A0 (en) 2011-03-31
US20110202358A1 (en) 2011-08-18
KR101395252B1 (ko) 2014-05-15
US8612214B2 (en) 2013-12-17
MX2011000361A (es) 2011-02-25
IL210196A0 (en) 2011-03-31
HK1156141A1 (en) 2012-06-01
TWI415114B (zh) 2013-11-11
HK1156140A1 (en) 2012-06-01
MX2011000367A (es) 2011-03-02
PL2301028T3 (pl) 2013-05-31
RU2011101617A (ru) 2012-07-27
KR20130095840A (ko) 2013-08-28
KR101395250B1 (ko) 2014-05-15
RU2494477C2 (ru) 2013-09-27
CA2729971C (en) 2014-11-04
CO6341677A2 (es) 2011-11-21
CA2730200C (en) 2016-09-27
WO2010003546A3 (en) 2010-03-04
RU2487428C2 (ru) 2013-07-10
ES2539304T3 (es) 2015-06-29
JP5551694B2 (ja) 2014-07-16
AU2009267532A8 (en) 2011-03-17
PL2301027T3 (pl) 2015-09-30
CN102144259A (zh) 2011-08-03
CN102089817A (zh) 2011-06-08
CA2729971A1 (en) 2010-01-14
ES2398627T3 (es) 2013-03-20
MY153594A (en) 2015-02-27
AU2009267530A1 (en) 2010-01-14
TW201007700A (en) 2010-02-16
AR072480A1 (es) 2010-09-01
KR20110038029A (ko) 2011-04-13
ZA201100086B (en) 2011-08-31
BRPI0910523A2 (pt) 2020-10-20
CN102089817B (zh) 2013-01-09
RU2011103999A (ru) 2012-08-20
KR101278546B1 (ko) 2013-06-24
BRPI0910517B1 (pt) 2022-08-23

Similar Documents

Publication Publication Date Title
JP5628163B2 (ja) 帯域幅拡張出力データを生成するための装置および方法
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101224560B1 (ko) 인코드된 오디오 신호를 디코딩하는 장치 및 방법
US9454974B2 (en) Systems, methods, and apparatus for gain factor limiting
KR102039399B1 (ko) 시간 도메인 코딩과 주파수 도메인 코딩 간의 분류 향상
CA2691993C (en) Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
RU2483364C2 (ru) Схема аудиокодирования/декодирования с переключением байпас
KR101145578B1 (ko) 동적 가변 와핑 특성을 가지는 오디오 인코더, 오디오 디코더 및 오디오 프로세서
KR101774541B1 (ko) 스피치 처리를 위한 무성음/유성음 결정
MX2011000383A (es) Esquema de codificacion/decodificacion de audio a baja tasa de bits con pre-procesamiento comun.
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
AU2013257391B2 (en) An apparatus and a method for generating bandwidth extension output data
Fuchs et al. Super-wideband spectral envelope modeling for speech coding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121218

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130313

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130321

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141001

R150 Certificate of patent or registration of utility model

Ref document number: 5628163

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250