JP2016510429A - サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法 - Google Patents

サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法 Download PDF

Info

Publication number
JP2016510429A
JP2016510429A JP2015555674A JP2015555674A JP2016510429A JP 2016510429 A JP2016510429 A JP 2016510429A JP 2015555674 A JP2015555674 A JP 2015555674A JP 2015555674 A JP2015555674 A JP 2015555674A JP 2016510429 A JP2016510429 A JP 2016510429A
Authority
JP
Japan
Prior art keywords
signal
frequency
core
energy
enhancement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015555674A
Other languages
English (en)
Other versions
JP6321684B2 (ja
Inventor
サッシャ ディスヒ
サッシャ ディスヒ
ラルフ ガイガー
ラルフ ガイガー
クリスティアン ヘルムリッヒ
クリスティアン ヘルムリッヒ
マルクス マルトラス
マルクス マルトラス
コンスタンティン シュミット
コンスタンティン シュミット
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ, フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2016510429A publication Critical patent/JP2016510429A/ja
Application granted granted Critical
Publication of JP6321684B2 publication Critical patent/JP6321684B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Superheterodyne Receivers (AREA)
  • Picture Signal Circuits (AREA)
  • Testing Relating To Insulation (AREA)
  • Circuit Arrangements For Discharge Lamps (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Plasma Technology (AREA)
  • Dc-Dc Converters (AREA)
  • Electrotherapy Devices (AREA)
  • Error Detection And Correction (AREA)

Abstract

周波数増強信号(130)を生成する装置であって、コア信号(120、110)から増強信号を生成する信号生成器であって、増強信号はコア信号に含まれない増強周波数レンジを備え、増強信号またはコア信号の現在の時間部分(320、340)は複数のサブバンドに対してサブバンド信号を備える、信号生成器(200)と、増強周波数レンジまたはコア信号の複数のサブバンド信号に対して同じ平滑化情報(802)を計算する制御装置(800)とを備え、信号生成器(200)は、同じ平滑化情報を用いて増強周波数レンジまたはコア信号の複数のサブバンド信号を平滑化するように構成されている。【選択図】図8

Description

本発明は、オーディオ符号化に基づき、特にバンド幅拡張、スペクトルバンド複製または知的ギャップ充填のような周波数増強プロシージャに基づく。
本発明は、特に非ガイド式の、すなわちデコーダ側がサイド情報なしにまたは最小限のサイド情報のみで動作する、周波数増強プロシージャに関する。
知覚的なオーディコーデックは、特に(相対的に)低ビットレートで動作するとき、しばしば音声信号の全知覚可能周波数レンジのローパス部分のみを量子化し、符号化する。
このアプローチは、符号化された低周波信号に対する許容可能な品質を保証するが、多くのリスナーはハイパス部分の欠落を品質劣化として知覚する。この問題を克服するために、欠落する高周波部分を、バンド幅拡張スキームによって合成することができる。
技術水準のコーデックは、低周波信号を符号化するために、AACのような波形保存コーダ、またはスピーチコーダのようなパラメトリックコーダをしばしば用いる。これらのコーダは、特定のストップ周波数まで動作する。この周波数は、クロスオーバー周波数と呼ばれる。クロスオーバー周波数の下の周波数部分は、ローバンドと呼ばれる。バンド幅拡張スキームによって合成されるクロスオーバー周波数より上の信号は、ハイバンドと呼ばれる。
バンド幅拡張は、通常は伝送された信号(ローバンド)と追加のサイド情報によって欠落バンド幅(ハイバンド)を合成する。低ビットレートのオーディオ符号化の分野で適用される場合、追加の情報ができる限り起こりうる追加のビットレートを消費しないようにすべきである。従って、追加の情報に対して、通常はパラメトリック表現が選択される。このパラメトリック表現は、エンコーダから比較的低いビットレートで伝送される(ガイド式のバンド幅拡張)か、デコーダにおいて特定の信号特性に基づいて推定される(非ガイド式のバンド幅拡張)。後者のケースにおいて、パラメータは全くビットレートを消費しない。
ハイバンドの合成は、通常は次の2つのパートからなる。

1.高周波コンテンツの生成
これは、低周波コンテンツ(の一部)をハイバンドにコピーまたは反転させる、またはホワイトノイズまたは整形されたノイズまたは他の人工信号部分をハイバンドに挿入することによってなすことができる。

2.パラメトリック情報に従って生成された高周波コンテンツの調整
これは、パラメトリック表現による形状、調性/ノイジネスおよびエネルギーの操作を含む。
合成プロセスのゴールは、通常は知覚的にオリジナル信号に近い信号を達成することである。このゴールを適合することができない場合、合成された部分はリスナーに対して最も妨害しないものとすべきである。
ガイド式のBWEスキーム以外の、非ガイド式のバンド幅拡張は、ハイバンドの合成に対して追加の情報に依存することができない。その代わりに、通常はローバンドとハイバンドの間の相関を実施する経験則を用いる。多くの音楽ピースや声に出したスピーチセグメントは高低の周波数バンド間で高い相関を呈するが、これは、通常は無声音のまたは摩擦音のスピーチセグメントに対するケースでない。摩擦音のサウンドは、特定の周波数より上に高いエネルギーを持つが、低周波数レンジにおいて極めて少ないエネルギーを持つ。この周波数がクロスオーバー周波数の近くにある場合、ローバンドは関連する信号部分をほとんど含まないので、クロスオーバー周波数より上に人工信号を生成することは問題がある可能性がある。この課題に対処するために、この種のサウンドの良好な検出が有用である。
HE-AACは、ローバンドに対して波形保存コーデック(AAC)およびハイバンドに対してパラメトリックコーデック(SBR)からなる周知のコーデックである。デコーダ側において、ハイバンド信号は、QMFフィルタバンクを用いて復号化されたAAC信号を周波数ドメインに変換することによって生成される。引き続いて、ローバンド信号のサブバンドはハイバンドへコピーされる(高周波コンテンツの生成)。このハイバンド信号は、次に、伝送されたパラメトリックサイド情報に基づいて、スペクトル包絡、調性および暗騒音において調整される(生成された高周波コンテンツの調整)。この方法は、ガイド式のBWEアプローチを用いるので、ハイバンドとローバンドの間の弱い相関は一般に問題とならず、適当なパラメータセットを伝送することによって克服することができる。しかしながら、これは付加的なビットレートを必要とし、それは一定のアプリケーションシナリオに対して受け入れられないかもしれない。
ITU標準G.722.2 は、時間ドメインにおいてのみ動作する、すなわち周波数ドメインにおいていかなる演算も実行しない、スピーチコーデックである。この種のデコーダは、12.8kHzのサンプリングレートで時間ドメイン信号を出力し、引き続いて16kHzまでアップサンプリングされる。高周波コンテンツ(6.4−7.0kHz)の生成は、バンドパスノイズの挿入に基づいている。多くの演算モードにおいて、ノイズのスペクトル整形はいかなるサイド情報も用いることなくなされ、ノイズエネルギーに関して最も高いビットレート情報を有する演算モードにおいてのみ、ビットストリームにおいて伝送される。簡潔のため、そして全てのアプリケーションシナリオが追加のパラメータセットの伝送をもたらすわけではないので、以下において、いかなるサイド情報も用いることのないハイバンド信号の生成のみが記載される。
ハイバンド信号の生成に対して、ノイズ信号は、コアの励起信号と同じエネルギーを持つようにスケーリングされる。信号の無声音部分により多くのエネルギーを与えるために、スペクトル傾斜eが計算される。
Figure 2016510429
ここで、sは、400Hzのカットオフ周波数を有するハイパスフィルタリングされた復号化コア信号である。nは、サンプルインデックスである。高周波においてより少ないエネルギーが存在する有声音セグメントのケースにおいてeは1に近づくが、無声音セグメントに対してeはゼロに近づく。ハイバンド信号においてより多くのエネルギーを持つために、無声音のスピーチに対して、ノイズのエネルギーに(1−e)が掛けられる。最後に、スケーリングされたノイズ信号は、ラインスペクトル周波数(LSF)ドメインにおける外挿によってコア線形予測符号化(LPC)フィルタから導き出されるフィルタによってフィルタリングされる。
完全に時間ドメインで動作するG.722.2 の非ガイド式のバンド幅拡張には、以下の欠点を有する。

1.生成されたHFコンテンツはノイズに基づいている。これは、HF信号が音のハーモニック低周波信号(例えば音楽)と結合される場合に、聞き取れるアーチファクトを創生する。この種のアーチファクトを回避するため、G.722.2 は、生成されたHF信号のエネルギーを強く制限し、それはまたバンド幅拡張の潜在的利益を制限する。従って、残念なことに、サウンドのブライトネスの最大の可能な改善またはスピーチ信号の明瞭度における最大の獲得できる増加も制限される。

2.この非ガイド式のバンド幅拡張は時間ドメインにおいて動作するので、フィルタ演算は付加的なアルゴリズム的遅延を生ずる。この付加的な遅延は、双方向通信シナリオにおけるユーザ経験の品質を下げるか、または所定の通信技術標準の必要条件の項目によって許容されないかもしれない。

3.また、信号処理は時間ドメインにおいて実行されるので、フィルタ演算は不安定の傾向がある。さらに、時間ドメインフィルタは高い計算量を有する。

4.ハイバンド信号のエネルギーのオーバーオール合計のみがコア信号のエネルギーに適合される(そして、更にスペクトル傾斜によって重み付けされる)ので、コア信号の上側周波数レンジ(ちょうどクロスオーバー周波数の下の信号)とハイバンド信号の間のクロスオーバー周波数におけるエネルギーの有意なローカルミスマッチがあるかもしれない。例えば、これは、特に超低周波数レンジにおけるエネルギー集中を呈するが、上側周波数レンジにおいてほとんどエネルギーを含まない音の信号に対するケースになる。

5.さらにまた、時間ドメイン表現においてスペクトル勾配を推定することは演算的に複雑である。周波数ドメインにおいて、スペクトル勾配の外挿は非常に効率的になすことができる。例えば摩擦音の大部分のエネルギーは高い周波数レンジに集中しているので、これらは、保守的なエネルギーとG.722.2 におけるようなスペクトル勾配の推定戦略が適用される場合、鈍く聞こえるかもしれない(1.を参照)。
要約すると、従来技術の非ガイド式のまたはブラインドのバンド幅拡張スキームは、デコーダ側について有意の計算量を必要とし、それにもかかわらず特に摩擦音のような問題があるスピーチサウンドに対して制限されたオーディオ品質に結果としてなるかもしれない。さらにまた、ガイド式のバンド幅拡張スキームは、より良好なオーディオ品質を提供し、時にはデコーダ側についてより少ない計算量でよいが、ハイバンドについての付加的なパラメトリック情報が符号化されたコアオーディオ信号に関して有意の量の付加的なビットレートを必要とする可能性があるという事実により、実質的なビットレートの低減を提供することができない。
それ故に、本発明の目的は、非ガイド式の周波数増強技術の局面におけるオーディオ処理に対する改良されたコンセプトを提供することである。
この目的は、請求項1の周波数増強信号を生成する装置、請求項11の周波数増強信号を生成する方法、請求項12のエンコーダと周波数増強信号を生成する装置を備えるシステム、請求項13の関連する方法、または請求項14のコンピュータプログラムによって達成される。
本発明は、オーディオコーデックに対するバンド幅拡張スキームのような周波数増強スキームを提供する。このスキームは、追加のサイド情報の必要なしに、またはガイド式のバンド幅拡張スキームにおけるような欠落バンドの完全なパラメトリック記述と比較して有意に低減された最小量のみによる、オーディオコーデックの周波数帯域幅を拡張することを意図する。
周波数増強信号を生成する装置は、コア信号における周波数に関するエネルギー分布を記述する値を計算する計算器を含む。コア信号に含まれない増強周波数レンジを備える増強信号を生成する信号生成器は、コア信号を用いて動作し、次に増進信号のスペクトル包絡がエネルギー分布を記述する値に従属するように増強信号またはコア信号の整形を実行する。
従って、増強信号の包絡または増強信号は、エネルギー分布を記述するこの値に基づいて整形される。この値は容易に計算することができ、この値は次に完全な包絡形状または増強信号の完全な形状を定義する。従って、デコーダは低い複雑性で動作することができ、同時に良好なオーディオ品質が得られる。特に、コア信号におけるエネルギー分布は、周波数増強信号のスペクトル整形に対して用いられるとき、コア信号におけるスペクトル重心のようなエネルギー分布についての値を計算する処理やこのスペクトル重心に基づく増強信号の調整が直接的で低い計算資源で実行することができる処理であっても、良好なオーディオ品質に結果としてなる。
さらにまた、このプロシージャは、ハイバンド信号の絶対エネルギーと勾配(ロールオフ)が、それぞれコア信号の絶対エネルギーと勾配(ロールオフ)から導き出されることを可能とする。スペクトル包絡の整形は、単に周波数表現にゲインカーブを掛けることに相当し、このゲインカーブはコア信号における周波数に関するエネルギー分布を記述する値から導き出されるので、演算的に効率的な方法でなされるように、これらの演算は周波数ドメインにおいて実行することが好ましい。
さらにまた、時間ドメインにおいて所定のスペクトル形状を正確に推定し外挿することは、演算的に複雑である。従って、この種の演算は、好ましくは周波数ドメインにおいて実行される。例えば、摩擦音は、通常は低周波で低い量のエネルギーを持ち、高周波で高い量のエネルギーを持つ。エネルギーにおける上昇は、実際の摩擦音に依存し、クロスオーバー周波数以下ではほとんど起きないかもしれない。時間ドメインにおいては、この状況を検知し、それから有効な外挿を得ることは困難であり、演算的に複雑である。非摩擦音に対しては、人工的に生成されたスペクトルのエネルギーは、周波数の上昇によって常に低下することが保証される。
更なる態様において、時間的平滑化プロシージャが適用される。コア信号から増強信号を生成する信号生成器が提供される。増強信号またはコア信号の時間部分は、複数のサブバンドに対してサブバンド信号を備える。増強周波数レンジの複数のサブバンド信号に対して同じ平滑化情報を計算する制御装置が提供され、この平滑化情報は、次に増強周波数レンジの複数のサブバンド信号を、特に同じ平滑化情報を用いて平滑化する信号生成器によって用いられ、または、代替として、平滑化が高周波生成の前に実行されるとき、次にコア信号の複数のサブバンド信号が全て同じ平滑化情報を用いて平滑化される。この時間的平滑化は、小さく速いエネルギー変動の継続を回避し、ローバンドからハイバンドに継承され、従ってより気持ちの良い知覚的印象に導く。ローバンドエネルギーの変動は、不安定性に導くコアコーダの根底をなす量子化誤差によって通常は引き起こされる。平滑化は、信号の(長期の)定常性に依存するので、信号適応である。さらにまた、全ての個々のサブバンドに対して全く同一の平滑化情報を使用することは、サブバンド間のコヒーレンシーが時間的平滑化によって変化しないことを確保する。その代わりに、全てのサブバンドが同じように平滑化され、平滑化情報は全てのサブバンドからまたは増強周波数レンジにおけるサブバンドのみから導き出される。従って、各サブバンド信号の個々の平滑化と比較して、有意に良好なオーディオ品質が得られる。
更なる態様は、好ましくは増強信号を生成する全部のプロシージャの終わりに、エネルギー制限を実行することに関する。コア信号から増強信号を生成する信号生成器が提供され、ここで増強信号はコア信号に含まれない増強周波数レンジを備え、増強信号の時間部分は1つまたは複数のサブバンドに対してサブバンド信号を備える。増強信号を用いて周波数増強信号を生成する合成フィルタバンクが提供され、ここで信号生成器は、合成フィルタバンクによって得られる周波数増強信号が、結果として高いバンドのエネルギーが低いバンドにおけるエネルギーに多くても等しい、または多くても所定の閾値だけ大きいことを確保するため、エネルギー制限を実行するように構成される。これは、単一の拡張バンドに対して適用することができる。次に、比較またはエネルギー制限が最も高いコアバンドのエネルギーを用いてなされる。これは、複数の拡張バンドに対しても適用することができる。次に、最も低い拡張バンドが最も高いコアバンドを用いてエネルギー制限され、最も高い拡張バンドが最も高い拡張バンドから2番目に対してエネルギー制限される。
このプロシージャは、特に非ガイド式のバンド幅拡張スキームに対して有用であるが、非ガイド式のバンド幅拡張スキームは、特に負のスペクトル傾斜を持つセグメントにおいて、不自然に突き出ているスペクトルコンポーネントによって引き起こされるアーチファクトの傾向があるので、ガイド式のバンド幅拡張スキームにおいても役立つ可能性がある。これらのコンポーネントは、高周波ノイズバーストをもたらすかもしれない。この種の状況を回避するため、エネルギー制限は、好ましくは処理の終わりにおいて適用され、周波数上のエネルギーの増加を制限する。実施態様において、QMF(直交ミラーフィルタリング)サブバンドkのエネルギーは、QMFサブバンドk−1におけるエネルギーを超過してはならない。このエネルギー制限は、時間スロットベースについて実行されるようにしてもよく、複雑性についてセーブするためにフレームにつき一度だけ実行されるようにしてもよい。従って、高周波バンドが低周波バンドより多くのエネルギーを持つこと、または高周波バンドのエネルギーが低周波バンドにおけるエネルギーよりも所定の閾値、例えば3dBの閾値以上高いことは非常に不自然であるので、バンド幅拡張スキームにおけるいかなる不自然な状況も回避されることが確保される。通常は、全てのスピーチ/音楽信号は、ローパス特性を持つ、すなわち周波数上でだいたい単調に減少するエネルギーコンテンツを持つ。これは、単一の拡張バンドに対して適用することができる。次に、比較またはエネルギー制限が最も高いコアバンドのエネルギーを用いてなされる。これは、複数の拡張バンドに対しても適用することができる。次に、最も低い拡張バンドは最も高いコアバンドを用いてエネルギー制限され、最も高い拡張バンドは最も高い拡張バンドの次のものに関してエネルギー制限される。
周波数増強信号の整形、周波数増強サブバンド信号の時間的平滑化、およびエネルギー制限の技術は、お互いから分離して個々に実行することができるが、これらのプロシージャは、好ましくは非ガイド式の周波数増強スキーム内で一斉に実行することもできる。
さらにまた、特定の実施形態に関する従属クレームを参照されたい。
本発明の好ましい実施形態は、以下の添付図面について引き続いて記載される。
周波数増強信号の整形、サブバンド信号の平滑化、およびエネルギー制限の技術を備える実施形態を示す。 図1の信号生成器の異なる実施態様を示す。 図1の信号生成器の異なる実施態様を示す。 図1の信号生成器の異なる実施態様を示す。 フレームが長い時間部分を持ち、スロットが短い時間部分を持ち、各フレームが複数のスロットを備える個々の時間部分を示す。 バンド幅拡張アプリケーションの実施態様におけるコア信号と増強信号のスペクトルポジションを表すスペクトルチャートを示す。 コア信号のエネルギー分布を記述する値に基づくスペクトル整形を用いて周波数増強信号を生成する装置を示す。 整形技術の実施態様を示す。 特定のスペクトル重心によって決定される異なるロールオフを示す。 コア信号または周波数増強信号のサブバンド信号を平滑化する同じ平滑化情報を備える、周波数増強信号を生成する装置を示す。 図8の制御装置および信号生成器によって適用される好ましいプロシージャを示す。 図8の制御装置および信号生成器によって適用される更なるプロシージャを示す。 増強信号の高いバンドが隣接する低いバンドと多くとも同じエネルギーを持つか、または多くともエネルギーにおいて所定の閾値だけ高いように、増強信号におけるエネルギー制限プロシージャを実行する、周波数増強信号を生成する装置を示す。 制限前の増強信号のスペクトルを示す。 制限後の図12aのスペクトルを示す。 実施態様における信号生成器によって実行されるプロセスを示す。 フィルタバンクドメイン内の整形、平滑化およびエネルギー制限の技術の共存するアプリケーションを示す。 エンコーダおよび非ガイド式の周波数増強デコーダを備えるシステムを示す。
図1は、整形、時間的平滑化およびエネルギー制限の技術が一斉に実行される好ましい実施態様における周波数増強信号140を生成する装置を示す。しかしながら、これらの技術は、整形技術に対して図5〜7、平滑化技術に対して図8〜10、エネルギー制限技術に対して図11〜13の局面において述べられるように、個々に適用することもできる。
好ましくは、図1の周波数増強信号140を生成する装置は、解析フィルタバンクまたはコアデコーダ100、またはコアデコーダがQMFサブバンド信号を出力するとき、QMFドメインにおけるようなフィルタバンクドメインにおいてコア信号を提供する他のいかなるデバイスを備える。あるいは、解析フィルタバンク100は、コア信号が時間ドメイン信号であるか、またはスペクトルドメインまたはサブバンドドメインの他のいかなるドメインにおいて提供されるときでも、QMFフィルタバンクまたは他の解析フィルタバンクとすることができる。
120において利用可能なコア信号110の個々のサブバンド信号は、次に信号生成器200に入力され、信号生成器200の出力は、増強信号130である。この増強信号130は、コア信号110に含まれない増強周波数レンジを備え、信号生成器は、例えばノイズの整形等(のみ)によってではなく、コア信号110または好ましくはコア信号のサブバンド120を用いて、この増強信号を生成する。合成フィルタバンクは、次にコア信号サブバンド120と増強信号130を結合し、合成フィルタバンク300は、周波数増強信号を出力する。
基本的に、信号生成器200は、「HF生成」(ここでHFは高周波を表す)として表される信号生成ブロック202を備える。しかしながら、図1における周波数増強は、高周波が生成される技術に限定されない。その代わりに、低周波または中間周波を生成することもでき、コア信号が高いバンドと低いバンドを持つとき、および中間バンドの欠落があるとき、例えば知的ギャップ充填(IGF)として知られるような、コア信号におけるスペクトルホールの再生とさえすることもできる。シグナル生成202は、HE-AACにより知られるようなコピーアッププロシージャ、または高い周波数レンジまたは周波数増強レンジを生成するためコア信号がコピーアップされるよりむしろミラーリングされるミラーリングプロシージャを備える。
さらにまた、信号生成器は、整形機能204を備え、コア信号120における周波数に関するエネルギー分布を表す値を計算する演算によって制御される。この整形は、ブロック202によって生成された信号の整形をすることができ、または代替として、図2a〜2cの局面において述べられるように、機能202と204の順序が逆にされるとき、低周波の整形をすることができる。
更なる機能は、平滑化制御装置800によって制御される時間的平滑化機能206である。エネルギー制限208は、好ましくはプロシージャの最後に実行されるが、エネルギー制限は、合成フィルタバンク300による結合信号出力が、高い周波数バンドは隣接する低い周波数バンドより多くのエネルギーを持ってはならない、または高い周波数バンドは隣接する低い周波数バンドと比較してより多くのエネルギー、ここでインクリメントは多くとも3dBのような所定の閾値に限られる、を持ってはならないような、エネルギー制限判定基準を満たすことが確保される限り、処理機能202〜208のチェーンのいかなる他の位置に置くこともできる。
図2aは、HF生成202を実行する前に、整形204が時間的平滑化206およびエネルギー制限208と共に実行される異なる順序を示す。従って、コア信号は整形され/平滑化され/制限され、次に既に完了した整形され/平滑化され/制限された信号が増強周波数レンジにコピーアップまたはミラーリングされる。さらにまた、図2aを図1における対応するブロックの順序と比較したときに見られるように、ブロック204、206、208の順序はいかなる形であれ実行できることを理解することが重要である。
図2bは、時間的平滑化と整形が低周波またはコア信号について実行され、HF生成202がエネルギー制限208の前に実行される状況を示す。さらに、図2cは、増強周波数レンジに対する信号を取得するために、信号の整形が低周波信号に対して実行され、コピーアップまたはミラーリングのような引き続くHF生成が実行され、この信号が次に平滑化206され、エネルギー制限208される状況を示す。
さらにまた、例えば図14に示されるように、サブバンド信号に対して特定の係数を適用することによって、整形、時間的平滑化およびエネルギー制限の機能を全て実行することができることが強調される。整形は、個々のバンドi、i+1、i+2に対して、乗数器1402a、1401aおよび1400aによって実施される。
さらにまた、時間的平滑化は、乗数器1402b、1401bおよび1400bによって実行される。加えて、エネルギー制限は、個々のバンドi+2、i+1およびiに対して、制限係数1402c、1401cおよび1400cによって実行される。これらの機能の全てが、本実施形態において乗算係数によって実施されるという事実により、全てのこれらの機能が、各個々のバンドに対して、単一の乗算係数1402、1401、1400によって個々のサブバンド信号に適用することができ、この単一の「マスター」乗算係数は、バンドi+2に対して個々の係数1402a、1402bおよび1402cの積であり、その状況は他のバンドi+1およびiに対して類似することに留意すべきである。従って、サブバンドに対する実数の/虚数のサブバンドサンプル値は、次に単一の「マスター」乗算係数によって乗算され、出力は、ブロック1402、1401または1400の出力において、乗算された実数の/虚数のサブバンドサンプル値として得られ、次に図1の合成フィルタバンク300に導入される。従って、ブロック1400、1401、1402の出力は、コア信号に含まれない増強周波数レンジを通常はカバーする増強信号1300に対応する。
図3は、信号生成のプロセスにおいて用いられる異なる時間分解能を表すチャートを示す。基本的に、信号はフレームワイズに処理される。これは、解析フィルタバンク100が、好ましくはサブバンド信号の時間的に引き続くフレーム320を生成するように実施されることを意味し、ここでサブバンド信号の各フレーム320は、1つまたは複数のスロットまたはフィルタバンクスロット340を備える。図3はフレーム当たり4つのスロットを示しているが、フレーム当たり2つ、3つまたは4つを超えるスロットとすることもできる。図14に示したように、コア信号のエネルギー分布に基づく増強信号またはコア信号の整形は、フレーム当たり1回実行される。一方、時間的平滑化は、高い時間分解能で、すなわち好ましくはスロット340当たり1回実行され、エネルギー制限は、低い計算量が必要とされるときは再びフレーム当たり1回、または高い計算量が特定の実施に対して問題がないときはスロット当たり1回実行することができる。
図4は、コア信号の周波数レンジにおいて5つのサブバンド1、2、3、4、5を持つスペクトルの表現を示す。さらにまた、図4における実施例は、増強信号レンジにおいて4つのサブバンド信号またはサブバンド6、7、8、9を持ち、コア信号レンジと増強信号レンジはクロスオーバー周波数420によって分離されている。さらにまた、後に述べられるように、整形204の目的に対して、周波数に関するエネルギー分布を記述する値を計算するために用いられるスタート周波数バンド410が示されている。このプロシージャは、より良好な増強信号の調整を得るために、最も低いまたは複数の最も低いサブバンドが周波数に関するエネルギー分布を記述する値の演算に対して用いられないことを確保する。
引き続いて、コア信号を用いたコア信号に含まれない増強周波数レンジの生成202の実施が示される。
クロスオーバー周波数上に人工信号を生成するために、通常はQMF値がクロスオーバー周波数の下の周波数レンジからハイバンドにコピーアップ(「パッチ」)される。このコピー演算は、QMFサンプルを、低い周波数レンジからクロスオーバー周波数の上の領域まで丁度シフトすることによって、またはこれらのサンプルを付加的にミラーリングすることによって、なすことができる。ミラーリングの利点は、クロスオーバー周波数の丁度下の信号と人工的な生成信号が、クロスオーバー周波数において非常に類似したエネルギーとハーモニック構造を持つということである。ミラーリングまたはコピーアップは、コア信号の単一のサブバンドまたはコア信号の複数のサブバンドに適用することができる。
前記QMFフィルタバンクのケースにおいて、ミラーリングされたパッチは、遷移領域におけるサブバンド折り返し歪を最小化するために、好ましくはベースバンドの負の複素共役から成る。
Figure 2016510429
ここで、Qr(t,f)は、時間インデックスtおよびサブバンドインデックスfにおけるQMFの実数値であり、Qi(t,f)は虚数値である。xoverは、クロスオーバー周波数を参照するQMFサブバンドである。nBandsは、外挿される整数のバンドである。実部における負符号は、負の共役複素演算を意味する。
好ましくは、HF生成202または一般的に増強周波数レンジの生成は、ブロック100によって提供されるサブバンド表現に依存する。好ましくは、周波数増強信号を生成する発明の装置は、例えばナローバンド、ワイドバンドおよびスーパーワイドバンド出力をサポートするために、復号化信号110をリサンプルしてサンプリング頻度を変化させることができるマルチバンド幅デコーダとすべきである。それ故に、QMFフィルタバンク100は、入力として復号化時間ドメイン信号をとる。周波数ドメインにおいてゼロをパディングすることによって、QMFフィルタバンクは、復号化信号をリサンプルするために用いることができ、同じQMFフィルタバンクは、好ましくはハイバンド信号を創生するためにも用いることができる。
好ましくは、周波数増強信号を生成する装置は、周波数ドメインにおける全ての演算を実行するために働く。従って、デコーダ側において内部周波数ドメイン表現を既に持つ実存するシステムは、図1において示されたように、例えば既にQMFフィルタバンクドメインの出力信号を提供する「コアデコーダ」として表されたブロック100によって拡張される。
この表現は、好ましくは周波数ドメインにおいてなされるサンプリングレート変換および他の信号操作のような付加的なタスク(例えば整形された快適なノイズの挿入、ハイパス/ローパスフィルタリング)に対して、簡単に再利用される。従って、いかなる付加的な時間-周波数変換も計算される必要がない。
HFコンテンツに対してノイズを用いる代わりに、この実施形態においてのみ、ローバンド信号に基づいてハイバンド信号が生成される。これは、周波数ドメインにおけるコピーアップまたはフォールディングアップ(ミラーリング)演算によって、なすことができる。このように、ローバンド信号と同じハーモニック構造と時間的微細構造によるハイバンド信号が保証される。これは、演算的に高価な時間ドメイン信号のフォールディングと付加的な遅延を回避する。
引き続いて、図1の整形技術204の機能が、図5、6および7の局面において述べられ、ここでは、整形は図1、2a〜2cの局面において実行することができるか、または他のガイド式または非ガイド式の周波数増強技術により知られる他の機能と共に分離して個々に実行することができる。
図5は、コア信号120における周波数に関するエネルギー分布を記述する値を計算する計算器500を備える周波数増強信号140を生成する装置を示す。さらにまた、ライン502で示されるように、信号生成器200は、コア信号から、コア信号に含まれない増強周波数レンジを備える増強信号を生成するように構成される。さらにまた、信号生成器200は、増強信号のスペクトル包絡がエネルギー分布を記述する値に従属するように、図1におけるブロック202による出力または図2aの局面におけるコア信号120のような増強信号を整形するように構成される。
好ましくは、装置は、周波数増強信号140を取得するために、ブロック200によって出力される増強信号130とコア信号120を結合する結合器300を付加的に備える。時間的平滑化206またはエネルギー制限208のような付加的な演算は、整形された信号を更に処理するために好ましいが、特定の実施態様においては必ずしも必要ではない。
信号生成器200は、増強周波数レンジにおける第1の周波数から増強周波数レンジにおける第2の高い周波数への第1のスペクトル包絡の減少が、エネルギー分布を記述する第1の値に対して得られるように、増強信号を整形するように構成される。さらにまた、増強レンジにおける第1の周波数から増強レンジにおける第2の周波数へのスペクトル包絡の減少は、第2のエネルギー分布を記述する第2の値に対して得られる。第2の周波数が第1の周波数より大きく、第2のスペクトル包絡の減少が第1のスペクトル包絡の減少より大きい場合に、第1の値は、コア信号がコア信号の低い周波数レンジにおけるエネルギー集中を記述する第2の値と比較して、コア信号の高い周波数レンジにおいてエネルギー集中を持つことを示す。
好ましくは、計算器500は、エネルギー分布についての情報値として、現在のフレームのスペクトル重心に対する尺度を計算するように構成される。次に、信号生成器200は、高い周波数におけるスペクトル重心が、低い周波数におけるスペクトル重心と比較して、より浅い勾配のスペクトル包絡に結果としてなるように、スペクトル重心に対するこの尺度に従って整形する。
エネルギー分布計算器500によって計算されるエネルギー分布についての情報は、第1の周波数において開始し、第1の周波数より高い第2の周波数において終了するコア信号の周波数部分について計算される。第1の周波数は、例えば図4において410で示されるような、コア信号における最も低い周波数より低い。好ましくは、第2の周波数は、クロスオーバー周波数420でもよく、ケースによってはクロスオーバー周波数420より低い周波数とすることもできる。しかしながら、スペクトル分布に対する尺度を計算するために用いられる第2の周波数を可能な限りクロスオーバー周波数420に拡張することが好ましく、結果として最良のオーディオ品質になる。
実施形態において、図6のプロシージャは、エネルギー分布計算器500と信号生成器200によって適用される。ステップ602において、E(i)で示されるコア信号の各バンドに対するエネルギー値が計算される。次に、増強周波数レンジの全てのバンドの調整に対して用いられるspのような単一のエネルギー分布値が、ブロック604において計算される。次に、ステップ606において、この単一の値に対して用いる増強周波数レンジの全てのバンドに対して重み係数が計算され、ここで重み係数は好ましくはattfである。
次に、信号生成器208によって実行されるステップ608において、重み係数はサブバンドサンプルの実部と虚部に適用される。
摩擦音は、QMFドメインにおける現在のフレームのスペクトル重心を計算することによって検出される。スペクトル重心は、0.0〜1.0の範囲を持つ尺度である。高いスペクトル重心(1に近い値)は、サウンドのスペクトル包絡が上昇する勾配を持つことを意味する。スピーチ信号に対して、これは、現在のフレームがおそらく摩擦音を含むことを意味する。スペクトル重心の値が1に近づくほど、スペクトル包絡の勾配が急である、または、より多くのエネルギーが高い周波数レンジに集中している。
スペクトル重心は、次式により計算される。
Figure 2016510429
ここで、E(i)はQMFサブバンドiのエネルギーであり、startは、1kHzを参照するQMFサブバンドインデックスである。コピーされたQMFサブバンドは、次式のように係数attfによって重み付けられる。
Figure 2016510429
ここで、att=0.5*sp+0.5であり、一般に、attは次式を用いて計算することができる。

att=p(sp)

ここで、pは多項式である。好ましくは、多項式は次式のように次数1を持つ。

att=a*sp+b

ここで、a、b、または一般に多項式の係数は、全て0と1の間である。
上記の式から離れて、相当するパフォーマンスを持つ他の式を適用することができる。
この種の他の式は以下の通りである。
Figure 2016510429
特に、値aiは、高いiに対して値は高くあるべきであり、重要なことに、値biは、少なくともインデックスi >1に対して値aiより低い。従って、上記の式と比較して異なる式によって、類似した結果が得られる。一般に、ai、biは、iによって単調に増加するまたは減少する値である。
さらにまた、図7を参照されたい。図7は、異なるエネルギー分布値spに対する個々の重み係数attfを示す。spが1に等しいとき、コア信号全体のエネルギーは、コア信号の最も高いバンドに集中される。そのとき、attは1に等しく、重み係数attfは700に示すように周波数を通じて一定である。一方、コア信号における全部のエネルギーがコア信号の最も低いバンドに集中されるとき、spは0に等しく、attは0.5に等しく、周波数上の調整係数の対応するコースは706に示される。
702および704に示される周波数上の整形係数のコースは、対応して増加するスペクトル分布値に対するものである。従って、項目704に対するエネルギー分布値は、0より大きいが、パラメータ矢印708で示されるように、項目702に対するエネルギー分布値より小さい。
図8は、時間的平滑化技術を用いて周波数増強信号を生成する装置を示す。装置は、コア信号120、110から増強信号を生成する信号生成器200を備え、ここで、増強信号はコア信号に含まれない増強周波数レンジを備える。フレーム320のような現在の時間部分および好ましくは増強信号またはコア信号のスロット340は、複数のサブバンドに対するサブバンド信号を備える。
制御装置800は、増強周波数レンジまたはコア信号の複数のサブバンド信号に対して同じ平滑化情報802を計算するものである。さらにまた、信号生成器200は、同じ平滑化情報802を用いて増強周波数レンジの複数のサブバンド信号を平滑化するように、または同じ平滑化情報802を用いてコア信号の複数のサブバンド信号を平滑化するように構成される。信号生成器200の出力は、図8において、次に結合器300に入力される平滑化された増強信号である。図2a〜2cの局面で述べられたように、平滑化206は、図1の処理チェーンにおけるいかなる場所でも実行することができる、または他のいかなる周波数増強スキームの局面においても個々に実行することができる。
制御装置800は、コア信号および周波数増強信号の複数のサブバンド信号の結合エネルギーを用いて、または時間部分の周波数増強信号のみを用いて、平滑化情報を計算するように好ましくは構成される。さらにまた、コア信号および周波数増強信号の複数のサブバンド信号の平均エネルギー、または現在の時間部分に先行する1つ以上前の時間部分のみのコア信号の平均エネルギーが用いられる。平滑化情報は、全てのバンドにおける増強周波数レンジの複数のサブバンド信号に対する単一の補正係数であり、それ故に、信号生成器200は、増強周波数レンジの複数のサブバンド信号に補正係数を適用するように構成される。
図1の局面で述べられたように、装置は、フィルタバンク100、または複数の時間的に引き続くフィルタバンクスロットに対してコア信号の複数のサブバンド信号を提供する供給器をさらに備える。さらにまた、信号生成器は、コア信号の複数のサブバンド信号を用いて、複数の時間的に引き続くフィルタバンクスロットに対して増強周波数レンジの複数のサブバンド信号を導き出すように構成され、制御装置800は、各フィルタバンクスロットに対して個々の平滑化情報802を計算するように構成され、平滑化は、次に新しい個々の平滑化情報によって各フィルタバンクスロットに対して実行される。
制御装置800は、現在の時間部分のコア信号または周波数増強信号に基づいて、および1つ以上先行する時間部分に基づいて、平滑化強度制御値を計算するように構成され、制御装置800は、次に、平滑化制御値を用いて、平滑化強度が、現在の時間部分のコア信号または周波数増強信号のエネルギーと1つ以上先行する時間部分のコア信号または周波数増強信号の平均エネルギーとの差分に応じて変化するように、平滑化情報を計算するように構成される。
制御装置800および信号生成器200によって実行されるプロシージャを示す図9を参照されたい。制御装置800によって実行されるステップ900は、例えば現在の時間部分におけるエネルギーと1つ以上先行する時間部分における平均エネルギーとの差分に基づいて探索することができる平滑化強度についての決定の探索を備えるが、平滑化強度について決定する他のいかなるプロシージャも同様に用いることができる。1つの変形例は、その代わりにまたは加えて、将来の時間スロットに用いられる。更なる変形例は、フレーム当り単一の変換のみを持ち、時間的に引き続くフレームにわたって平滑化する。しかしながら、これらの変形例は両方とも遅延を導入する可能性がある。これは、ストリーミングアプリケーションのような遅延が問題でないアプリケーションにおいては全く問題がない可能性がある。例えば携帯電話を用いる双方向通信に対するような遅延が問題のあるアプリケーションに対しては、過去のフレームの使用は遅延を導入しないので、過去のまたは先行するフレームは将来のフレームにわたって好ましい。
次に、ステップ902において、平滑化情報がステップ900の平滑化強度の決定に基づいて計算される。このステップ902も制御装置800によって実行される。次に、信号生成器200は、いくつかのバンドへの平滑化情報の適用を備える904を実行し、ここでコア信号または増強周波数レンジのいずれかにおいて、全く同じ平滑化情報800がこれらのいくつかのバンドに対して適用される。
図10は、図9のステップのシーケンスの実施態様の好ましいプロシージャを示す。ステップ1000において、現在のスロットのエネルギーが計算される。次に、ステップ1020において、1つ以上の前のスロットの平均エネルギーが計算される。次に、ステップ1040において、現在のスロットに対する平滑化係数がブロック1000と1020によって得られた値の差分に基づいて決定される。次に、ステップ1060は現在のスロットに対する補正係数の計算を備え、ステップ1000〜1060は、全て制御装置800によって実行される。次に、信号生成器200によって実行されるステップ1080において実際の平滑化演算が実行される、すなわち、対応する補正係数が1つのスロット内の全てのサブバンド信号に対して適用される。
実施形態において、時間的平滑化が以下の2つのステップにおいて実行される。
平滑化強度についての決定:平滑化強度についての決定に対して、時間上の信号の定常性が評価される。この評価を実行する可能な方法は、現在の短期ウインドウまたはQMF時間スロットのエネルギーを前の短期ウインドウまたはQMF時間スロットの平均エネルギー値と比較することである。煩雑性についてセーブするため、これは、ハイバンド部分のみに対して評価されてもよい。比較されたエネルギー値が近いほど、平滑化の強度は低くあるべきである。これは、平滑化係数a、ここで0<a≦1、において反映される。aが大きいほど、平滑化の強度は高い。
ハイバンドへの平滑化の適用:平滑化は、QMF時間スロットベースのハイバンド部分に対して適用される。それ故に、現在の時間スロットのハイバンドエネルギーEcurrtは、次のように1つまたは多数の前のQMF時間スロットの平均ハイバンドエネルギーEavgtに適合される。
Figure 2016510429
Ecurrは、次のように1つの時間スロットにおけるハイバンドQMFエネルギーの合計として計算される。
Figure 2016510429
Eavgは、次のようにエネルギーの時間上の移動平均である。
Figure 2016510429
ここで、startおよびstopは移動平均の計算に対して用いられるインターバルの境界である。
合成に対して用いられる実数および虚数のQMF値は、次のように補正係数currFacで乗算され、
Figure 2016510429
これは、次のようにEcurrおよびEavgから導き出される。
Figure 2016510429
係数aは、固定としてもよく、またはEcurrとEavgのエネルギーの差分に従属するようにしてもよい。
既に図14で述べられたように、時間的平滑化に対する時間分解能は、整形の時間分解能またはエネルギー制限技術の時間分解能より高くなるようにセットされる。これは、サブバンド信号の時間的に滑らかなコースが得られる一方、同時に、演算的により強い整形がフレーム当り1回のみ実行されることを確保する。しかしながら、これは、これまでに見られたように、主観的なリスニング品質を実質的に低下させるので、1つのサブバンドから他のサブバンドへの、すなわち周波数方向におけるいかなる平滑化も実行されない。
増強レンジにおいて、全てのサブバンドに対する補正係数のような同じ平滑化情報を用いることが好ましい。しかしながら、同じ平滑化情報が全てのサブバンドに対してではなく、少なくとも2つのサブバンドを持つバンドのグループに対して適用される実施態様とすることもできる。
図11は、図1に示されたエネルギー制限技術208に向けられる更なる態様を示す。具体的には、図11は、増強信号を生成する信号生成器200を備える周波数増強信号を生成する装置を示し、増強信号はコア信号に含まれない増強周波数レンジを備える。さらにまた、増強信号の時間部分は複数のサブバンドに対するサブバンド信号を備える。加えて、装置は、増強信号130を用いて周波数増強信号140を生成する合成フィルタバンク300を備える。
エネルギー制限プロシージャを実施するために、信号生成器200は、合成フィルタバンク300によって得られる周波数増強信号140が、高いバンドのエネルギーが低いバンドにおけるエネルギーに多くとも等しい、または低いバンドにおけるエネルギーより多くとも所定の閾値だけ大きいことを確保するため、エネルギー制限を実行するように構成される。
信号生成器は、高いQMFサブバンドkがQMFサブバンドk−1におけるエネルギーを上回ってはならないことを確保するように、好ましくは実施される。それにもかかわらず、信号生成器200は、好ましくは3dBの閾値とすることができる特定の増分の増加を許容するように実施することもでき、閾値は好ましくは2dBとすることができ、より好ましくは1dBまたはさらに小さいものとすることができる。所定の閾値は、各バンドに対して一定とすることができる、または前に計算されたスペクトル重心に従属させることもできる。好ましい従属は、重心が低い周波数に近づくとき、閾値が低くなる、すなわち小さくなることであり、その一方で重心が高い周波数に近づくほどまたはspが1に近づくほど、閾値は大きくなることができる。
更なる実施態様において、信号生成器200は、第1のサブバンドにおける第1のサブバンド信号を検査し、周波数において第1のサブバンドに隣接し、第1のサブバンドの中心周波数より高い中心周波数を持つ第2のサブバンドにおけるサブバンド信号を検査するように構成され、信号生成器は、第2のサブバンド信号のエネルギーが第1のサブバンド信号のエネルギーと等しいとき、または第2のサブバンド信号のエネルギーが第1のサブバンド信号のエネルギーより所定の閾値未満で大きいとき、第2のサブバンド信号を制限しない。
さらにまた、信号生成器は、例えば図1または図2a〜2cにおいて示されたように、シーケンスにおいて複数の処理演算を形成するように構成される。次に、信号生成器は、好ましくはシーケンスの最後においてエネルギー制限を実行し、合成フィルタバンク300に入力される増強信号130を取得する。従って、合成フィルタバンク300は、入力として、エネルギー制限の最終プロセスによってシーケンスの最後に生成される増強信号130を受信するように構成される。
さらにまた、信号生成器は、エネルギー制限の前にスペクトル整形204または時間的平滑化206を実行するように構成される。
好ましい実施形態において、信号生成器200は、コア信号の複数のサブバンドをミラーリングすることによって増強信号の複数のサブバンド信号を生成するように構成される。
ミラーリングに対しては、好ましくは、上述されたように実部または虚部のいずれかを無効にするプロシージャが実行される。
更なる実施形態において、信号生成器は、補正係数limFacを計算するように構成され、この制限係数limFacは次に以下のようにコアまたは増強周波数レンジのサブバンド信号に適用される。
fを、次式のように時間スパンstop−startを通じて平均化された1つのバンドのエネルギーとする。
Figure 2016510429
このエネルギーが前のバンドの平均エネルギーを数レベルだけ超える場合、このバンドのエネルギーは次の補正/制限係数limFacによって乗算され、
Figure 2016510429
実部と虚部のQMF値は、次式によって補正される。
Figure 2016510429
係数または所定の閾値facは、各バンドに対して一定とすることができ、または前に計算されたスペクトル重心に従属させることができる。
Figure 2016510429
他の実施態様において、制限係数limFacは以下の式を用いて計算される。
Figure 2016510429
この式において、Elimは、通常は低いバンドのエネルギーまたは特定の閾値facによって増加する低いバンドのエネルギーである制限エネルギーである。Ef(i)は、現在のバンドfまたはiのエネルギーである。
増強周波数レンジに7つのバンドがある特定の例を示す図12aと12bを参照されたい。バンド1202は、エネルギーに関してバンド1201より大きい。従って、図12bから明らかになるように、バンド1202は、このバンドに対して図12bにおいて1250で示されるようにエネルギー制限される。さらにまた、バンド1205、1204および1206は、全てバンド1203より大きい。従って、全ての3つのバンドは、図12bにおいて1250で示されるようにエネルギー制限される。残された非制限バンドは、バンド1201(これは再構成レンジにおける第1のバンドである)およびバンド1203および1207である。
上述したように、図12a/12bは、制限が、高いバンドが低いバンドより多くのエネルギーを持ってはならない状況を示す。しかしながら、特定の増加が許容された場合に、状況はやや異なるように見えるだろう。
エネルギー制限は、単一の拡張バンドに対して適用することができる。次に、比較またはエネルギー制限が、最も高いコアバンドのエネルギーを用いてなされる。これは、複数の拡張バンドに対して適用することもできる。次に、最も低い拡張バンドは最も高いコアバンドを用いてエネルギー制限され、最も高い拡張バンドは最も高い拡張バンドの次に関してエネルギー制限される。
図15は、伝送システムまたは、一般に、エンコーダ1500およびデコーダ1510を備えるシステムを示す。エンコーダは、好ましくは、バンド幅リダクションを実行する、または一般にオリジナルのオーディオ信号1501において、必ずしも完全な上側周波数レンジまたは上側バンドでなければならない必要がないが、コアの周波数バンド間においていかなる周波数バンドとすることもできる、いくつかの周波数レンジを削除する符号化されたコア信号を生成するエンコーダである。次に、符号化されたコア信号は、エンコーダ1500からデコーダ1510に、いかなるサイド情報もなしに伝送され、デコーダ1510は、次に周波数増強信号140を得るために非ガイド式の周波数増強を実行する。従って、デコーダは、図1〜14のいずれかで述べたように実施することができる。
本発明は、ブロックが現実のまたは論理的なハードウェアコンポーネントを表すブロック図の局面において述べられたが、本発明は、コンピュータで実施される方法によって実施することもできる。後者のケースにおいて、ブロックは対応する方法ステップを表し、ここでこれらのステップは対応する論理的または物理的ハードウェアブロックによって実行される機能を表す。
いくつかの態様が装置の局面において記述されてきたが、これらの態様は対応する方法の記述をも表していることは明らかであり、ここでブロックまたはデバイスは、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップの局面において記述された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の記載をも表す。いくつかの、または全ての方法ステップは、例えばマイクロプロセッサ、プログラム可能なコンピュータまたは電子回路のようなハードウェア装置によって(または用いて)実行することができる。いくつかの実施形態において、いくつかの1つ以上の最も重要な方法ステップは、この種の装置によって実行することができる。
本発明の送信されたまたは符号化された信号は、デジタル記憶媒体に記憶することができ、または例えばインターネットのような無線伝送路または有線伝送路のような伝送路上を送信することができる。
特定の実施要求に依存して、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施は、その上に記憶される電子的に読取可能な制御信号を持ち、それぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(または協働することができる)デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、ブルーレイ、CD、ROM、PROMおよびEPROM、EEPROMまたはフラッシュメモリを用いて実行することができる。それ故に、デジタル記憶媒体はコンピュータ読取可能とすることができる。
本発明によるいくつかの実施形態は、本願明細書に記載された方法の1つが実行されるように、電子的に読取可能な制御信号を持ち、プログラム可能なコンピュータシステムと協働することができるデータキャリアを備える。
一般に、本発明の実施形態は、コンピュータプログラム製品がコンピュータ上で動作するときに発明の方法の1つを実行するように動作するプログラムコードを有するコンピュータプログラム製品として実施することができる。プログラムコードは、例えば機械読取可能なキャリア上に記憶することができる。
他の実施形態は、機械読取可能なキャリア上に記憶され、本願明細書に記載された方法の1つを実行するコンピュータプログラムを備える。
換言すれば、本発明の方法の実施形態は、それ故に、コンピュータプログラムがコンピュータ上で動作するとき、本願明細書に記載された方法の1つを実行するプログラムコードを持つコンピュータプログラムである。
発明の方法の更なる実施形態は、それ故に、その上に記録され、本願明細書に記載された方法の1つを実行するコンピュータプログラムを備えるデータキャリア(またはデジタル記憶媒体またはコンピュータ読取可能媒体のような固定の記憶媒体)である。データキャリア、デジタル記憶媒体または記録媒体は、通常は有形および/または固定である。
本発明の方法の更なる実施形態は、それ故に、本願明細書に記載された方法の1つを実行するコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えばデータ通信接続を介して、例えばインターネットを介して伝送されるように構成することができる。
更なる実施形態は、本願明細書に記載された方法の1つを実行するように構成されたまたは適合された処理手段、例えばコンピュータまたはプログラマブルロジックデバイスを備える。
更なる実施形態は、本願明細書に記載された方法の1つを実行するコンピュータプログラムがその上にインストールされたコンピュータを備える。
本発明による更なる実施形態は、本願明細書に記載された方法の1つを実行するコンピュータプログラムをレシーバに(例えば電子的にまたは光学的に)伝送するように構成された装置またはシステムを備える。レシーバは、例えばコンピュータ、モバイルデバイス、記憶デバイス等とすることができる。装置またはシステムは、例えばコンピュータプログラムをレシーバへ転送するファイルサーバを備えることができる。
いくつかの実施形態において、本願明細書に記載された方法の機能のいくつかまたは全てを実行するために、プログラマブルロジックデバイス(例えばフィールドプログラマブルゲートアレイ)を用いることができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本願明細書に記載された方法の1つを実行するために、マイクロプロセッサと協働することができる。一般に、方法は、好ましくはいかなるハードウェア装置によっても実行される。
上述した実施形態は、単に本発明の原理に対して示したものである。本願明細書に記載された構成および詳細の修正および変更は他の当業者にとって明らかであると理解される。それ故に、本発明は、以下の特許請求の範囲のスコープによってのみ制限され、本願明細書の実施形態の記載および説明によって提供された特定の詳細によっては制限されないことを意図する。

Claims (14)

  1. 周波数増強信号(130)を生成する装置であって、
    コア信号(120,110)から増強信号を生成する信号生成器であって、前記増強信号は前記コア信号に含まれない増強周波数レンジを備え、前記増強信号または前記コア信号の現在の時間部分(320、340)は複数のサブバンドに対してサブバンド信号を備える、信号生成器(200)と、
    前記増強周波数レンジまたは前記コア信号の複数のサブバンド信号に対して、同じ平滑化情報(802)を計算する、制御装置(800)と、
    を備え、
    前記信号生成器(200)は、前記同じ平滑化情報(802)を用いて、前記増強周波数レンジまたは前記コア信号の複数のサブバンド信号を平滑化するように構成された、
    装置。
  2. 前記制御装置(800)は、前記コア信号および前記周波数増強信号の複数のサブバンド信号の結合エネルギーを用いて、または前記現在の時間部分の前記周波数増強信号のみを用いて、および、前記コア信号および前記周波数増強信号の複数のサブバンド信号の平均エネルギー、または前記現在の時間部分に先立つ1つ以上前の時間部分または前記現在の時間部分に引き続く1つ以上後の時間部分のみの前記コア信号の平均エネルギーを用いて、前記平滑化情報(802)を計算するように構成された、請求項1に記載の装置。
  3. 前記平滑化情報(802)は、前記増強周波数レンジの複数のサブバンド信号に対して単一の補正係数(1402b、1401b、1400b)であり、前記信号生成器(200)は、前記補正係数を前記増強周波数レンジの複数のサブバンド信号に適用するように構成された、
    請求項1または2に記載の装置。
  4. 複数の時間的に引き続くフィルタバンクスロット(340)に対して、前記コア信号の複数のサブバンド信号を供給するフィルタバンクまたは供給器(100)を更に備え、
    前記信号生成器(200)は、前記コア信号(120)の複数のサブバンド信号を用いて、前記複数の時間的に引き続くフィルタバンクスロット(340)に対する前記増強周波数レンジの複数のサブバンド信号を導き出すように構成され、
    前記制御装置(800)は、各フィルタバンクスロット(340)に対する個々の平滑化情報を計算するように構成された、
    請求項1〜3のいずれかに記載の装置。
  5. 前記制御装置(800)は、前記現在の時間部分および1つ以上先行する時間部分の前記コア信号または前記周波数増強信号に基づいて、平滑化強度制御値(1040)を計算するように構成され、
    前記制御装置(800)は、前記平滑化制御値(1060)を用いて、前記平滑化強度が、現在の時間部分における前記コア信号または前記周波数増強信号のエネルギーと1つ以上先行する時間部分の前記コア信号または前記周波数増強信号における平均エネルギーとの差分に応じて変化するように、前記平滑化情報(802)を計算するように構成された、
    請求項1〜4のいずれかに記載の装置。
  6. 前記制御装置(800)は、以下の式に基づいて前記平滑化情報を計算するように構成され、
    Figure 2016510429
    ここで、Ecurrtは現在の時間部分のエネルギーであり、Eavgtは1つ以上前のまたは後の平均であり、aは平滑化強度を制御するパラメータであり、
    前記信号生成器は、前記平滑化情報を、前記周波数増強信号の複数のサブバンドの各サブバンドサンプルに適用するように構成された、
    請求項1〜5のいずれかに記載の装置。
  7. 前記信号生成器(200)は、平滑化に加えて、前記コア信号または前記増強信号を整形する(204)ように構成された、請求項1〜6のいずれかに記載の装置。
  8. 前記現在の時間部分と少なくとも1つの更なる時間部分は、フレーム(340)を形成し、
    前記信号生成器(200)は、全てのフレーム(340)に対して同じ整形情報を適用するように構成され、前記信号生成器(200)は、前記フレーム(320)内の各時間部分(340)に対して個々の平滑化情報(802)を用いて平滑化するように構成された、
    請求項7に記載の装置。
  9. 前記信号生成器(200)は、合成フィルタバンク(300)によって得られる信号が、結果として高いバンドのエネルギーが低いバンドのエネルギーに多くとも等しい、または多くとも3dB以下の所定の閾値だけ大きいことを確保するために、前記周波数増強信号または前記にコア信号にエネルギー制限を実行するように構成された、
    請求項1〜8のいずれかに記載の装置。
  10. 前記信号生成器(200)は、前記周波数増強信号の複数のサブバンド信号を計算するとき、前記コア信号の単一のサブバンド信号または前記コア信号の複数のサブバンド信号をミラーリングする(202)ように構成された、
    請求項1〜9のいずれかに記載の装置。
  11. 周波数増強信号(130)を生成する方法であって、
    コア信号(120,110)から増強信号を生成するステップであって、前記増強信号は前記コア信号に含まれない増強周波数レンジを備え、前記増強信号または前記コア信号の現在の時間部分(320、340)は複数のサブバンドに対してサブバンド信号を備える、生成するステップ(200)と、
    前記増強周波数レンジまたは前記コア信号の複数のサブバンド信号に対して、同じ平滑化情報(802)を計算するステップ(800)と、
    を備え、
    前記生成するステップ(200)は、前記同じ平滑化情報(802)を用いて、前記増強周波数レンジまたは前記コア信号の複数のサブバンド信号を平滑化するステップを備えた、
    方法。
  12. オーディオ信号を処理するシステムであって、
    符号化されたコア信号(110)を生成するエンコーダ(1500)と、
    請求項1〜10のいずれかに記載された周波数増強信号を生成する装置と、
    備えた、システム。
  13. オーディオ信号を処理する方法であって、
    符号化されたオーディオ信号(110)を生成するステップ(1500)と、
    請求項11に記載の方法を用いて周波数増強信号を生成するステップと、
    を備えた、方法。
  14. コンピュータプログラムがコンピュータまたは処理装置上で動作するとき、請求項11または13に記載の方法を実行する、コンピュータプログラム。
JP2015555674A 2013-01-29 2014-01-28 サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法 Active JP6321684B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758090P 2013-01-29 2013-01-29
US61/758,090 2013-01-29
PCT/EP2014/051601 WO2014118160A1 (en) 2013-01-29 2014-01-28 Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands

Publications (2)

Publication Number Publication Date
JP2016510429A true JP2016510429A (ja) 2016-04-07
JP6321684B2 JP6321684B2 (ja) 2018-05-09

Family

ID=50029033

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015555673A Active JP6301368B2 (ja) 2013-01-29 2014-01-28 増強信号の整形を用いて周波数増強信号を生成する装置および方法
JP2015555675A Active JP6289507B2 (ja) 2013-01-29 2014-01-28 エネルギー制限演算を用いて周波数増強信号を生成する装置および方法
JP2015555674A Active JP6321684B2 (ja) 2013-01-29 2014-01-28 サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015555673A Active JP6301368B2 (ja) 2013-01-29 2014-01-28 増強信号の整形を用いて周波数増強信号を生成する装置および方法
JP2015555675A Active JP6289507B2 (ja) 2013-01-29 2014-01-28 エネルギー制限演算を用いて周波数増強信号を生成する装置および方法

Country Status (20)

Country Link
US (4) US9552823B2 (ja)
EP (4) EP3136386B1 (ja)
JP (3) JP6301368B2 (ja)
KR (3) KR101762225B1 (ja)
CN (3) CN105103228B (ja)
AR (3) AR094671A1 (ja)
AU (3) AU2014211528B2 (ja)
BR (3) BR112015017866B1 (ja)
CA (3) CA2899078C (ja)
ES (3) ES2905846T3 (ja)
HK (2) HK1218019A1 (ja)
MX (3) MX346945B (ja)
MY (3) MY172161A (ja)
PL (1) PL2951825T3 (ja)
PT (1) PT2951825T (ja)
RU (3) RU2608447C1 (ja)
SG (3) SG11201505908QA (ja)
TW (2) TWI529701B (ja)
WO (3) WO2014118159A1 (ja)
ZA (2) ZA201506265B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX346945B (es) 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
CN109841223B (zh) * 2019-03-06 2020-11-24 深圳大学 一种音频信号处理方法、智能终端及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004010415A1 (ja) * 2002-07-19 2004-01-29 Nec Corporation オーディオ復号装置と復号方法およびプログラム
WO2012012414A1 (en) * 2010-07-19 2012-01-26 Huawei Technologies Co., Ltd. Spectrum flatness control for bandwidth extension
WO2012108680A2 (ko) * 2011-02-08 2012-08-16 엘지전자 주식회사 대역 확장 방법 및 장치

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2009A (en) * 1841-03-18 Improvement in machines for boring war-rockets
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US20020002455A1 (en) 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
WO2002091388A1 (en) * 2001-05-10 2002-11-14 Warner Music Group, Inc. Method and system for verifying derivative digital files automatically
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
WO2005106848A1 (ja) 2004-04-30 2005-11-10 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置および拡張レイヤ消失隠蔽方法
JP4168976B2 (ja) 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
JP4771674B2 (ja) 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8285555B2 (en) 2006-11-21 2012-10-09 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
JP5618826B2 (ja) 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
CN101868821B (zh) * 2007-11-21 2015-09-23 Lg电子株式会社 用于处理信号的方法和装置
US8483854B2 (en) 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
JP5010743B2 (ja) * 2008-07-11 2012-08-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル傾斜で制御されたフレーミングを使用して帯域拡張データを計算するための装置及び方法
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2301028B1 (en) 2008-07-11 2012-12-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for calculating a number of spectral envelopes
JP2010079275A (ja) 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
CN102177426B (zh) 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
FR2938688A1 (fr) 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
PL4231290T3 (pl) * 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
US8153010B2 (en) 2009-01-12 2012-04-10 American Air Liquide, Inc. Method to inhibit scale formation in cooling circuits using carbon dioxide
RU2493618C2 (ru) 2009-01-28 2013-09-20 Долби Интернешнл Аб Усовершенствованное гармоническое преобразование
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
JP4892021B2 (ja) * 2009-02-26 2012-03-07 株式会社東芝 信号帯域拡張装置
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
ES2452569T3 (es) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
ES2400661T3 (es) * 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
CN102257567B (zh) * 2009-10-21 2014-05-07 松下电器产业株式会社 音响信号处理装置、音响编码装置及音响解码装置
EP2502231B1 (en) * 2009-11-19 2014-06-04 Telefonaktiebolaget L M Ericsson (PUBL) Bandwidth extension of a low band audio signal
WO2011133924A1 (en) 2010-04-22 2011-10-27 Qualcomm Incorporated Voice activity detection
WO2011148230A1 (en) * 2010-05-25 2011-12-01 Nokia Corporation A bandwidth extender
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
US8908377B2 (en) * 2011-07-25 2014-12-09 Ibiden Co., Ltd. Wiring board and method for manufacturing the same
US20130259254A1 (en) 2012-03-28 2013-10-03 Qualcomm Incorporated Systems, methods, and apparatus for producing a directional sound field
MX346945B (es) 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004010415A1 (ja) * 2002-07-19 2004-01-29 Nec Corporation オーディオ復号装置と復号方法およびプログラム
WO2012012414A1 (en) * 2010-07-19 2012-01-26 Huawei Technologies Co., Ltd. Spectrum flatness control for bandwidth extension
JP2013531281A (ja) * 2010-07-19 2013-08-01 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 帯域幅拡張のためのスペクトル平坦性制御
WO2012108680A2 (ko) * 2011-02-08 2012-08-16 엘지전자 주식회사 대역 확장 방법 및 장치
JP2014508322A (ja) * 2011-02-08 2014-04-03 エルジー エレクトロニクス インコーポレイティド 帯域拡張方法及び装置

Also Published As

Publication number Publication date
RU2015136799A (ru) 2017-03-13
WO2014118161A1 (en) 2014-08-07
BR112015017866B1 (pt) 2021-12-21
SG11201505908QA (en) 2015-09-29
ES2905846T3 (es) 2022-04-12
TWI529701B (zh) 2016-04-11
SG11201505906RA (en) 2015-08-28
AU2014211527A1 (en) 2015-08-06
CA2899080C (en) 2018-10-02
US20150332707A1 (en) 2015-11-19
ES2899781T3 (es) 2022-03-14
ZA201506265B (en) 2016-07-27
PL2951825T3 (pl) 2022-03-14
CN105103228A (zh) 2015-11-25
EP2951826A1 (en) 2015-12-09
EP2951827A1 (en) 2015-12-09
KR20150108395A (ko) 2015-09-25
CA2899080A1 (en) 2014-08-07
CN105264601A (zh) 2016-01-20
AU2014211528B2 (en) 2016-10-20
HK1218020A1 (zh) 2017-01-27
WO2014118160A1 (en) 2014-08-07
US9552823B2 (en) 2017-01-24
EP2951825B1 (en) 2021-11-24
US20170323651A1 (en) 2017-11-09
AU2014211528A1 (en) 2015-09-03
MX2015009597A (es) 2015-11-25
CA2899072C (en) 2017-12-19
JP6301368B2 (ja) 2018-03-28
AU2014211529B2 (en) 2016-12-22
MY185159A (en) 2021-04-30
AU2014211529A1 (en) 2015-09-17
US10354665B2 (en) 2019-07-16
HK1218019A1 (zh) 2017-01-27
EP2951825A1 (en) 2015-12-09
KR101762225B1 (ko) 2017-07-28
KR101757349B1 (ko) 2017-07-14
EP3136386B1 (en) 2021-10-20
RU2015136768A (ru) 2017-03-10
EP2951826B1 (en) 2022-04-20
CN105229738B (zh) 2019-07-26
MX346944B (es) 2017-04-06
TWI524332B (zh) 2016-03-01
ZA201506268B (en) 2016-11-30
MX351191B (es) 2017-10-04
TW201443887A (zh) 2014-11-16
MX2015009598A (es) 2015-11-25
PT2951825T (pt) 2022-02-02
TW201435860A (zh) 2014-09-16
JP6321684B2 (ja) 2018-05-09
BR112015017632A2 (pt) 2018-05-02
US9741353B2 (en) 2017-08-22
RU2625945C2 (ru) 2017-07-19
MX2015009536A (es) 2015-10-30
CA2899078A1 (en) 2014-08-07
MY172161A (en) 2019-11-15
US9640189B2 (en) 2017-05-02
KR20150114483A (ko) 2015-10-12
SG11201505883WA (en) 2015-08-28
AU2014211527B2 (en) 2017-03-30
CA2899072A1 (en) 2014-08-07
JP2016510428A (ja) 2016-04-07
WO2014118159A1 (en) 2014-08-07
AR094670A1 (es) 2015-08-19
CN105229738A (zh) 2016-01-06
CA2899078C (en) 2018-09-25
MY172710A (en) 2019-12-11
KR101787497B1 (ko) 2017-10-18
BR112015017868A2 (ja) 2017-08-22
CN105103228B (zh) 2019-04-09
MX346945B (es) 2017-04-06
CN105264601B (zh) 2019-05-31
US20150332697A1 (en) 2015-11-19
RU2624104C2 (ru) 2017-06-30
EP3136386A1 (en) 2017-03-01
RU2608447C1 (ru) 2017-01-18
KR20150109416A (ko) 2015-10-01
BR112015017866A2 (pt) 2018-05-08
AR094671A1 (es) 2015-08-19
BR112015017632B1 (pt) 2022-06-07
ES2914614T3 (es) 2022-06-14
AR094672A1 (es) 2015-08-19
JP6289507B2 (ja) 2018-03-07
US20150332706A1 (en) 2015-11-19
BR112015017868B1 (pt) 2022-02-15
JP2016507080A (ja) 2016-03-07

Similar Documents

Publication Publication Date Title
JP6321684B2 (ja) サブバンドの時間的平滑化を用いて周波数増強信号を生成する装置および方法
TWI544482B (zh) 用於使用能量限制操作產生頻率增強信號之裝置及方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161101

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180405

R150 Certificate of patent or registration of utility model

Ref document number: 6321684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250