JP2019191597A - ノイズ変調とゲイン調整とを実行するシステムおよび方法 - Google Patents

ノイズ変調とゲイン調整とを実行するシステムおよび方法 Download PDF

Info

Publication number
JP2019191597A
JP2019191597A JP2019105468A JP2019105468A JP2019191597A JP 2019191597 A JP2019191597 A JP 2019191597A JP 2019105468 A JP2019105468 A JP 2019105468A JP 2019105468 A JP2019105468 A JP 2019105468A JP 2019191597 A JP2019191597 A JP 2019191597A
Authority
JP
Japan
Prior art keywords
value
audio signal
frequency values
spectral frequency
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019105468A
Other languages
English (en)
Other versions
JP6752936B2 (ja
Inventor
ベンカトラマン・スリニバサ・アッティ
Srinivasa Atti Venkatraman
ベンカテシュ・クリシュナン
Krishnan Venkatesh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2019191597A publication Critical patent/JP2019191597A/ja
Application granted granted Critical
Publication of JP6752936B2 publication Critical patent/JP6752936B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • H03G3/301Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers the gain being continuously variable
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0003Backward prediction of gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Circuits Of Receivers In General (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Amplifiers (AREA)
  • Noise Elimination (AREA)

Abstract

【課題】ノイズ変調とゲイン調整とを実行し、アーチファクトを減少させる超広帯域(SWB)技法を提供する。【解決手段】方法は、混合係数の第1の値を受け取る。第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する。方法は、混合係数の第2の値を受け取る。第2の値は、オーディオ信号の第2の部分に対応する。方法はまた、第1の値および第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成し、第3の値に基づいて励振信号を変調されたノイズと混合する。別の方法は、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定することと、このスペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定する。オーディオ信号の少なくとも一部分に対応するゲイン値は、第1のセットと第2のセットの間の差に基づいて調整される。【選択図】図2

Description

関連出願の相互参照
[0001]本出願は、2013年2月8日に出願された本願の譲受人が所有する米国仮特許出願第61/762,810号および2013年8月28日に出願された米国非仮特許出願第14/012,749号の優先権を主張するものであり、これらの出願の内容は、その全体が明示的に参照により本明細書に組み込まれる。
[0002]本開示は、一般に、信号処理に関する。
[0003]技術の進歩の結果、より小型でより強力なコンピューティングデバイスが誕生した。たとえば、現在、ポータブルワイヤレス電話、携帯情報端末(PDA)、および小型軽量でユーザによって容易に持ち運ばれるページングデバイスなどの、ワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー式電話およびインターネットプロトコル(IP)電話などのポータブルワイヤレス電話は、ネットワークワイヤレスを介して音声およびデータパケットを通信することができる。さらに、多数のそのようなワイヤレス電話は、その中に組み込まれる他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤをも含むことができる。
[0004]従来の電話システム(たとえば、公衆交換電話網(PSTN))では、信号帯域幅は、300ヘルツ(Hz)〜3.4キロヘルツ(kHz)の周波数範囲に限定される。セルラー式テレフォニーおよびボイスオーバーインターネットプロトコル(VoIP)などの広帯域(WB)適用例では、信号帯域幅は、50Hzから7kHzの周波数範囲に及ぶことがある。超広帯域(SWB)コーディング技法は、約16kHzまで延びる帯域幅をサポートする。信号帯域幅を3.4kHzにおける狭帯域テレフォニーから16kHzのSWBテレフォニーまで拡張することによって、信号再構成、了解度、および自然度の品質を改善することができる。
[0005]SWBコーディング技法は、通常、信号の低周波数部分(たとえば、50Hz〜7kHz、「ローバンド」とも呼ばれる)を符号化および伝送することを含む。たとえば、ローバンドは、フィルタパラメータおよび/またはローバンド励振信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分(たとえば、7kHz〜16kHz、「ハイバンド」とも呼ばれる)は、完全に符号化および伝送されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用することがある。いくつかの実装形態では、ハイバンドに関連付けられたデータは、予測の助けとなるために受信機に提供され得る。そのようなデータは「サイド情報」と呼ばれることがあり、ゲイン情報、線スペクトル周波数(LSF、線スペクトル対(LSP)とも呼ばれる)などを含むことができる。ローバンド信号がハイバンド信号に十分に相関するとき、信号モデルを使用するハイバンド予測は許容可能に正確であり得る。しかしながら、ノイズの存在下では、ローバンドとハイバンドの相関が弱いことがあり、信号モデルは、もはやハイバンドを正確に表すことができないことがある。この結果、受信機においてアーチファクト(たとえば、歪み語音)が生じる。
[0006]ノイズ変調とゲイン調整とを実行するシステムおよび方法が開示される。たとえば、ハイバンド符号化は、ローバンド分析(たとえば、ローバンド線形予測(LP)分析)を使用して生成されたローバンド励振信号に基づいてハイバンド励振信号を生成することを含むことができる。ハイバンド励振信号は、変換されたローバンド励振信号を変調されたノイズ(たとえば、ホワイトノイズ)と混合することによって生成され得る。変換されたローバンド励振信号と変調されたノイズが混合される比は、信号再構成品質に影響を及ぼすことがある。ローバンドとハイバンドの間の相関を減少させるノイズの存在下で、変換されたローバンド励振信号は、ハイバンド合成に不適切なことがある。たとえば、合成されたハイバンド励振信号は、可聴アーチファクトをもたらすことがある。説明される技法によれば、ノイズ変調および/またはゲイン調整は、そのようなアーチファクトを減少させるために実行され得る。ノイズ変調を実行することは、ローバンド励振とハイバンド合成に使用される変調されたノイズとの比を適応的に平滑化することを含むことができる。ゲイン調整を実行することは、量子化歪みに基づいてハイバンドサイド情報に含めるようにゲインパラメータを決定することを含むことができる。
[0007]特定の一実施形態では、方法は、混合係数の第1の値を受け取ることを含む。この第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する。方法は、混合係数の第2の値を受け取ることを含む。この第2の値は、オーディオ信号の第2の部分に対応する。方法は、第1の値および第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成することを含む。方法は、混合係数の第3の値に基づいて励振信号を変調されたノイズと混合することも含む。
[0008]別の特定の実施形態では、方法は、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定することと、スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定することとを含む。方法は、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整することも含む。
[0009]別の特定の実施形態では、装置は、混合係数の第1の値および混合係数の第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成するように構成されたフィルタを含む。第1の値はオーディオ信号の第1の部分に対応し、第2の値はオーディオ信号の第2の部分に対応する。装置は、第3の値を受け取り、変調されたノイズを生成してこの変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによってオーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するように構成されたミキサも含む。ローバンド励振信号は、オーディオ信号のローバンド部分に対応する。ミキサは、第3の値に基づいて、変調されたノイズとローバンド励振信号の変換されたバージョンとを結合するように構成される。
[0010]別の特定の実施形態では、装置は、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するように構成された分析フィルタを含む。この装置は、スペクトル周波数値の第1のセットに近いスペクトル周波数値の第2のセットを生成するように構成された量子化器を含む。この装置は、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整するように構成されたゲイン回路も含む。
[0011]別の特定の実施形態では、装置は、混合係数の第1の値および混合係数の第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成するための手段を含む。第1の値は、オーディオエンコーダで受け取られたオーディオ信号の第1の部分に対応し、第2の値はオーディオ信号の第2の部分に対応する。装置は、変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによってオーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するための手段を含む。ローバンド励振信号は、オーディオ信号のローバンド部分に対応する。生成するための手段は、第3の値に基づいて変調されたノイズとローバンド励振信号の変換されたバージョンとを結合するように構成される。
[0012]別の特定の実施形態では、装置は、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するための手段を含む。装置は、スペクトル周波数値の第1のセットに近いスペクトル周波数値の第2のセットを生成するための手段も含む。装置は、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整するための手段も含む。
[0013]別の特定の実施形態では、非一時的コンピュータ可読媒体は、コンピュータによって実行されるとき、コンピュータに混合係数の第1の値を受け取らせる命令を備える。この第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する。命令はまた、コンピュータに、混合係数の第2の値を受け取らせるように実行可能である。この第2の値は、オーディオ信号の第2の部分に対応する。命令はまた、コンピュータに、第1の値および第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成させるように実行可能である。命令はまた、コンピュータに、混合係数の第3の値に基づいて励振信号を変調されたノイズと混合させるように実行可能である。
[0014]別の特定の実施形態では、非一時的コンピュータ可読媒体は、コンピュータによって実行されるとき、コンピュータに、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定させる命令を備える。命令はまた、スペクトル周波数値の第1のセットに近いスペクトル周波数値の第2のセットを決定するように実行可能である。命令はまた、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整するように実行可能である。
[0015]開示される実施形態のうち少なくとも1つによって提供される特定の利点としては、ノイズの多い状況を補償するためにノイズ変調および/またはゲイン調整を実行できることがある。たとえば、ノイズ変調は、ハイバンド合成中に使用される混合パラメータの大きい変動を相殺することができる。別の例として、ゲイン調整は、量子化誤差によるスペクトル歪みを補償することができる。本開示の他の態様、利点、および特徴は、以下の節すなわち「図面の簡単な説明」と「発明を実施するための形態」と「特許請求の範囲」とを含む適用例全体の検討の後、明らかになるであろう。
[0016]ノイズ変調とゲイン調整とを実行するように動作可能なシステムの特定の実施形態を示す図。 [0017]図1のシステムの構成要素の特定の実施形態を示す図。 [0018]ゲイン係数とスペクトル歪みの間の写像の特定の実施形態を示すグラフ。 [0019]図1のハイバンド励振発生器の特定の実施形態を示す図。 [0020]変調ノイズを実行する方法の特定の実施形態を示す流れ図。 [0021]ゲイン調整を実行する方法の特定の実施形態を示す流れ図。 [0022]図1〜図6のシステムおよび方法による信号処理動作を実行するように動作可能なデバイスワイヤレスのブロック図。
[0023]図1を参照すると、ノイズ変調とゲイン調整とを実行するように動作可能なシステムの特定の実施形態が示されており、全体的に100と指定されている。特定の一実施形態では、システム100は、符号化システムまたは符号化装置に(たとえば、ワイヤレス電話エンコーダ/デコーダ(CODEC)内に)統合され得る。
[0024]以下の説明では、図1のシステム100によって実行される様々な機能は、ある特定の構成要素またはモジュールによって実行されると説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分割は、説明のためにすぎない。一代替実施形態では、代わりに、特定の構成要素またはモジュールによって実行される機能は、複数の構成要素またはモジュールに分割されることがある。その上、一代替実施形態では、図1の2つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに統合されることがある。図1に示される各構成要素またはモジュールは、ハードウェア(たとえば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、コントローラなど)を使用して実施されてもよいし、ソフトウェア(たとえば、プロセッサによって実行可能な命令)を使用して実施されてもよいし、これらの任意の組合せを使用して実施されてもよい。
[0025]システム100は、入力オーディオ信号102を受信するように構成された分析フィルタバンク110を含む。たとえば、入力オーディオ信号102は、マイクロホンまたは他の入力デバイスによって提供され得る。特定の一実施形態では、入力オーディオ信号102は、発話を含むことができる。入力オーディオ信号は、約50ヘルツ(Hz)から約16キロヘルツ(kHz)の周波数範囲内のデータを含む超広帯域(SWB)信号であってよい。分析フィルタバンク110は、入力オーディオ信号102をフィルタに通し、周波数に基づいて複数の部分を作製することができる。たとえば、分析フィルタバンク110は、ローバンド信号122とハイバンド信号124とを生成することができる。ローバンド信号122およびハイバンド信号124は、等しい帯域幅を有しても等しくない帯域幅を有してもよく、重複してもよいし重複しなくてもよい。一代替実施形態では、分析フィルタバンク110は、3つ以上の出力を生成することができる。
[0026]図1の例では、ローバンド信号122とハイバンド信号124は、重複しない周波数帯域を占有する。たとえば、ローバンド信号122およびハイバンド信号124は、50Hz〜7kHzおよび7kHz〜16kHzの重複しない周波数帯域を占有することがある。一代替実施形態では、ローバンド信号122およびハイバンド信号124は、50Hz〜8kHzおよび8kHz〜16kHzの重複しない周波数帯域を占有することがある。別の代替実施形態では、ローバンド信号122およびハイバンド信号124が重複し(たとえば、50Hz〜8kHzおよび7kHz〜16kHz)、これによって、分析フィルタバンク110のローパスフィルタおよびハイパスフィルタがスムーズなロールオフを有することを可能にすることができ、これによって、設計を単純化し、ハイパスフィルタおよびローパスフィルタのコストを低減することができる。ローバンド信号122とハイバンド信号124が重複することによって、受信機におけるローバンド信号とハイバンド信号スムーズな混合も可能にすることができ、この結果、聞き取れるアーチファクトが減少し得る。
[0027]図1の例はSWB信号の処理を示しているが、これは説明のためにすぎないことに留意されたい。一代替実施形態では、入力オーディオ信号102は、約50Hz〜約8kHzの周波数範囲を有する広帯域(WB)信号であり得る。そのような一実施形態では、ローバンド信号122は約50Hz〜約6.4kHzの周波数範囲に対応し得、ハイバンド信号124は約6.4kHz〜約8kHzの周波数範囲に対応し得る。本明細書の様々なシステムおよび方法は、ハイバンドノイズを検出し、ハイバンドノイズに応答して様々な動作を実行すると説明されることにも留意されたい。しかしながら、これは例にすぎない。図1〜図7を参照しながら示される技法は、ローバンドノイズの状況でも実行され得る。
[0028]システム100は、ローバンド信号122を受信するように構成されたローバンド分析モジュール130を含むことができる。特定の一実施形態では、ローバンド分析モジュール130は、符号励振線形予測(CELP)エンコーダの一実施形態を表すことがある。ローバンド分析モジュール130は、線形予測(LP)分析およびコーディングモジュール132と、線形予測係数(LPC)−線スペクトル対(LSP)変換モジュール134と、量子化器136とを含むことができる。LSPは線スペクトル周波数(LSF)とも呼ばれることがあり、この2つの用語は、本明細書では互換的に使用され得る。LP分析およびコーディングモジュール132は、ローバンド信号122のスペクトル包絡をLPCのセットとして符号化することができる。LPCは、オーディオの各フレーム(たとえば、16kHzのサンプリングレートにおける320サンプルに相当する20ミリ秒(ms)のオーディオ)に対して生成され得、オーディオの各サブフレーム(たとえば、5msのオーディオ)に対して生成され得、これらの任意の組合せに対して生成され得る。各フレームまたはサブフレームに対して生成されるLPCの数は、実行されるLP分析の「次数」によって決定され得る。特定の一実施形態では、LP分析およびコーディングモジュール132は、第10次LP分析に対応する11のLPCのセットを生成し得る。
[0029]LPC−LSP変換モジュール134は、LP分析およびコーディングモジュール132によって生成されたLPCのセットを(たとえば、1対1変換を使用して)対応するLSPのセットに変換することができる。あるいは、LPCのセットは、PARCOR係数、ログ面積比値、イミッタンススペクトル対(ISP)、またはイミッタンススペクトル周波数(ISF)のセットに1対1変換され得る。LPCのセットとLSPのセットの間の変換は、誤差なく可逆的であり得る。
[0030]量子化器136は、変換モジュール134によって生成されたLSPのセットを量子化することができる。たとえば、量子化器136は、複数の項目(たとえば、ベクトル)を含む複数のコードブックを含み得、これに結合され得る。LSPのセットを量子化するために、量子化器136は、LSPのセット「に最も近い」(たとえば、最小2乗または平均2乗誤差などの歪み尺度に基づいて)コードブックの項目を特定することができる。量子化器136は、コードブック内の特定された項目の場所に対応するインデックス値または一連のインデックス値を出力することができる。したがって、量子化器136の出力は、ローバンドビットストリーム142に含まれるローバンドフィルタパラメータを表し得る。
[0031]ローバンド分析モジュール130はまた、ローバンド励振信号144を生成することができる。たとえば、ローバンド励振信号144は、ローバンド分析モジュール130によって実行されるLPプロセス中に生成されるLP残差信号を量子化することによって生成される符号化された信号であり得る。LP残差信号は、予測誤差を表し得る。
[0032]システム100は、分析フィルタバンク110からのハイバンド信号124とローバンド分析モジュール130からのローバンド励振信号144とを受け取るように構成されたハイバンド分析モジュール150をさらに含むことができる。ハイバンド分析モジュール150は、ハイバンド信号124およびローバンド励振信号144に基づいてハイバンドサイド情報172を生成することができる。たとえば、ハイバンドサイド情報172は、本明細書でさらに説明されるように、ハイバンドLSPおよび/またはゲイン情報(たとえば、少なくともハイバンドのエネルギーとローバンドのエネルギーとの比に基づく)を含み得る。
[0033]ハイバンド分析モジュール150は、ハイバンド励振発生器160を含むことができる。ハイバンド励振発生器160は、ローバンド励振信号144のスペクトルをハイバンド周波数範囲(たとえば、7kHz〜16kHz)へと拡張することによって、ハイバンド励振信号161を生成することができる。説明するために、ハイバンド励振発生器160は、変換をローバンド励振信号に適用する(たとえば、絶対値または平方演算などの非線形変換)ことができ、ハイバンド励振信号161を生成するために、変換されたローバンド励振信号をノイズ信号(たとえば、ローバンド信号122のゆっくり変化する時間特性を模倣するローバンド励振信号144に対応する包絡に従って変調されたホワイトノイズ)と混合させることができる。たとえば、混合は、以下の式に従って実行され得る。
High−band excitation
=(α*transformed low−band excitation) +((1−α)*modulated noise)
[0034]変換されたローバンド励振信号と変調されたノイズが混合される比は、受信機におけるハイバンド再構成品質に影響を及ぼすことがある。有声発話信号の場合、混合は、変換されたローバンド励振の方へ偏らされる(たとえば、混合係数は0.5〜1.0の範囲であってよい)。無声信号の場合、混合は、変調されたノイズの方へ偏らされる(たとえば、混合係数は0.0〜0.5の範囲であってよい)。ハイバンド励振発生器160の例示的な一実施形態は、図4を参照しながらさらに詳細に説明される。
[0035]ハイバンド励振信号161は、ハイバンドサイド情報172に含まれる1つまたは複数のハイバンドゲインパラメータを決定するために使用され得る。図示のように、ハイバンド分析モジュール150は、LP分析およびコーディングモジュール152と、LPC−LSP変換モジュール154と、量子化器156も含むことができる。LP分析およびコーディングモジュール152、変換モジュール154、および量子化器156の各々は、ローバンド分析モジュール130の対応する構成要素に関して上記で説明したように機能し得るが、(たとえば、より少数の、各係数に対するビット、LSPなどを使用して)比較的低解像度で機能し得る。LP分析およびコーディングモジュール152は、変換モジュール154によってLSPに変換されコードブック163に基づいて量子化器156によって量子化されるLPCのセットを生成し得る。たとえば、LP分析およびコーディングモジュール152、変換モジュール154、および量子化器156は、ハイバンドサイド情報172に含まれるハイバンドフィルタ情報(たとえば、ハイバンドLSP)を決定するためにハイバンド信号124を使用し得る。特定の一実施形態では、ハイバンドサイド情報172は、ハイバンドLSPならびにハイバンドゲインパラメータを含み得る。本明細書でさらに説明されるように、ある特定のタイプのノイズの存在下で、ハイバンドゲインパラメータは、ゲイン調整モジュール162によって実行されるゲイン調整の結果として生成され得る。
[0036]ローバンドビットストリーム142およびハイバンドサイド情報172は、出力ビットストリーム192を生成するためにマルチプレクサ(MUX)180によって多重化され得る。出力ビットストリーム192は、入力オーディオ信号102に対応する符号化されたオーディオ信号を表すことができる。たとえば、出力ビットストリーム192は、送信され(たとえば、有線チャネル、ワイヤレスチャネル、または光チャネルを介して)および/または保存され得る。受信機では、オーディオ信号(たとえば、スピーカまたは他の出力デバイスに提供される入力オーディオ信号102の再構成バージョン)を生成するために、逆の動作がデマルチプレクサ(DEMUX)、ローバンドデコーダ、ハイバンドデコーダ、およびフィルタバンクによって実行され得る。ローバンドビットストリーム142を表すために使用されるビットの数は、ハイバンドサイド情報172を表すために使用されるビットの数よりも実質的に多くてよい。したがって、出力ビットストリーム192中のビットの大部分は、ローバンドデータを表すことができる。ハイバンドサイド情報172は、信号モデルに従ってローバンドデータからハイバンド励振信号を再生するために受信機で使用され得る。たとえば、この信号モデルは、ローバンドデータ(たとえば、ローバンド信号122)とハイバンドデータ(たとえば、ハイバンド信号124)の関係または相関関係の予測されるセットを表し得る。したがって、異なる種類のオーディオデータ(たとえば、発話、音楽など)に異なる信号モデルが使用されてよく、使用中の特定の信号モデルは、符号化されたオーディオデータの通信の前に、送信機および受信機によって取り決められ得る(または業界標準によって定義されてよい)。信号モデルを使用して、送信機におけるハイバンド分析モジュール150は、出力ビットストリーム192からハイバンド信号124を再構成するために受信機における対応するハイバンド分析モジュールが信号モデルを使用することが可能であるように、ハイバンドサイド情報172を生成することを可能にすることができる。
[0037]変換されたローバンド励振は、ノイズの多いハイバンド信号124とノイズの多いローバンド信号122の相関が不十分であることにより、ハイバンド合成において使用するのに不適切なことがある。たとえば、入力オーディオ信号102が発話を含むとき、ハイバンド信号124は20ミリ秒(ms)フレームで処理され得、LSFおよびゲインパラメータは、フレームごとに推定および量子化され得る。4つの時間的ゲインスロープパラメータがサブフレームごと(たとえば、5msごと)に推定され得、LSFおよび全体的ゲインパラメータとともに送信され得る。したがって、ハイバンド励振は、各サブフレームに対して推定(たとえば、生成)され得る。一般に、混合パラメータαは、ローバンド有声化パラメータに基づいて決定され得る。しかしながら、ノイズの存在下で、そのような様式で混合パラメータαを決定することによって、サブフレームごとに大きな変動が生じることがある。たとえば、ノイズにより、4つの連続するサブフレームに対する混合パラメータαは0.9、0.25、0.8、および0.15であり得、騒音の多い(buzzy)アーチファクトまたは変調アーチファクトが生じることがある。その上、大量の量子化歪みが存在することがある。
[0038]LP分析およびコーディングモジュール152は、変換モジュール154によってLSPに変換されコードブック163に基づいて量子化器156によって量子化されるLPCのセットを生成することができる。ノイズの存在下で、ハイバンドLSP内の量子化歪みは大きいことがある。
[0039]たとえば、量子化器156は、変換モジュール154によって提供されるLSPなどの、スペクトル周波数値のセットを量子化するように構成され得る。他の実施形態では、量子化器156は、LSFまたはLSPに加えて、またはその代わりに、1つまたは複数の他のタイプのスペクトル周波数値のセットを受け取って量子化することができる。たとえば、量子化器156は、LP分析およびコーディングモジュール152によって生成された線形予測係数(LPC)のセットを受け取って量子化することができる。他の例としては、量子化器156において受け取られ量子化され得る、PARCOR係数、ARCOR係数、ログ面積比値、およびイミッタンススペクトル周波数(ISF)のセットがある。量子化器156は、入力ベクトル(たとえば、ベクトル形式のスペクトル周波数値のセット)をコードブック163などの表またはコードブック中の対応するエントリへのインデックスとして符号化するベクトル量子化器を含むことができる。別の例として、量子化器156は1つまたは複数のパラメータを決定するように構成されてよく、疎な(sparse)コードブック実施形態などでは、入力ベクトルは、ストレージから取り出されるのではなく、これらのパラメータからデコーダで動的に生成され得る。説明するために、疎なコードブックの例は、3GPP(登録商標)2(第3世代パートナーシップ2)EVRC(Enhanced Variable Rate Codec)などのCELPおよびコーデックなどのコーディング方式において適用され得る。別の実施形態では、ハイバンド分析モジュール150は、量子化器156を含むことができ、(たとえば、フィルタパラメータのセットに従って)合成信号を生成するためにいくつかのコードブックベクトルを使用し、知覚的に加重された領域などにおいてハイバンド信号124に最も良く適合する合成信号に関連付けられたコードブックベクトルのうち1つを選択するように構成され得る。
[0040]ハイバンド量子化外れ値が、ハイバンド合成と時間的ゲイン推定とに悪影響を及ぼすことがある。たとえば、時間的パラメータおよびゲインパラメータの過大評価により、アーチファクトを生じることがある。そのようなアーチファクトを減少させるために、ハイバンド分析モジュール150はゲイン調整器162を含んでよい。
[0041]ゲイン調整器162は、スペクトル値の第1のセット(たとえば、変換モジュール154によって生成された量子化されていないLSF)とスペクトル値の第2のセット(たとえば、量子化器156によって生成された量子化されたLSF)の間のスペクトル歪みを推定することができる。ゲイン調整器162は、ゲイン係数のスペクトル歪みへの写像に基づいてゲイン係数を推定することができる。図3は、ゲイン係数をスペクトル歪みに写像するグラフ300の一例を示す。図3では、「SD1」および「SD2」はそれぞれ、確率分布関数から計算され得る8%外れ値と2%外れ値とを表す。たとえば、コードブック163のトレーニング中に、大量の発話データ(たとえば、10時間の発話データ)が処理されることがある。処理中、スペクトル歪みの確率分布が生成され得、SD1およびSD2が決定され得る。
[0042]SD1およびSD2は、ゲイン係数の値を決定するために使用され得る。図3の例示的な写像300では、スペクトル歪みがSD1よりも小さい(たとえば、8%外れ値よりも小さい歪み)ように決定されるとき、ゲイン調整は実行されない(たとえば、ゲイン係数は1に設定される)。スペクトル歪みがSD2よりも大きい(たとえば、2%外れ値よりも大きい歪み)ように決定されるとき、ゲイン係数をG2=0.5などの1よりも小さい値G2に設定することによって、減衰が実行され得る。スペクトル歪みがSD1からSD2の範囲にあるとき、ゲイン係数を決定するために、線形関係が使用され得る。たとえば、(G2−1)/(SD2−SD1)の傾きとKの切片とを有する直線が、GainFactor=傾き*SD+切片=SD*(G2−1)/(SD2−SD1)+Kに従ってスペクトル歪み値SDをゲイン係数に写像するために使用され得る。
[0043]例示的な一実施形態では、ゲイン調整器162は、以下の擬似コードにより、(たとえば、ハイバンドサイド情報172に含まれるようにゲインフレームを調整するために)ゲイン係数を決定することができる。
/*最初の量子化されていないLSF、すなわちlsp_shb_origと量子化されたLSF、すなわちlsp_shbの間のスペクトル歪みを初期化する*/
sd_uq_q=0;
LPC_ORDER = 10;/*lpc orderを初期化する*/
for(i=0;i<LPC_ORDER;i++)

/* 量子化されていないLSFと量子化されたLSFの間のスペクトル歪みを見積る */
sd_uq_q+=(lsp_shb[i]−lsp_shb_orig[i])*(lsp_shb[i]−lsp_shb_orig[i]);


/*図3の写像を使用してゲイン係数を見積る*/
GainFactor=sd_uq_q*(G2−1)/(SD2−SD1)+K;
/*ゲイン係数はG2と1.0の間に制限される*/
GainFactor = min(max(GainFactor, G2), 1.0);/*フレーム ゲイン 調整*/
GainFrame=GainFrame*GainFactor;
[0044]上記の擬似コードに示されているように、図3の写像を使用することによって、ゲイン調整器162は、ゲイン係数を決定するとき、スペクトル歪み(たとえば、LSF外れ値)によるアーチファクトを制限し得る。
[0045]上記の擬似コードでは、スペクトル歪みは、量子化による誤差の平方の和として決定される。量子化による誤差は、スペクトル周波数値のセットの各スペクトル周波数値に対する、スペクトル周波数値の量子化されたバージョンとスペクトル周波数値の量子化されていないバージョンの間の差として識別される。各誤差(たとえば、量子化された値と量子化されていない値の間の各差)が2乗され、スペクトル歪みは、2乗された誤差の和として推定される。他の実施形態では、スペクトル歪み推定値は、1つまたは複数の他の技法によって決定され得る。たとえば、スペクトル歪みは、平均2乗誤差(MSE)法によって決定され得る。別の例として、スペクトル歪みは、量子化されていないスペクトル周波数値の第1のセットの値と量子化されたスペクトル周波数値の第2のセットの値の間の差の絶対値(たとえば、大きさ)を使用して決定され得る。
[0046]上記の擬似コードおよび図3の写像は、スペクトル歪み推定値のゲイン係数値への区分的線形写像によってゲイン係数の値を決定するが、他の実施形態では、他の写像が使用されてよい。たとえば、他の写像は、量子化誤差の量に従って、減衰を低減するために比較的低いスペクトル歪み推定値を大きなゲイン係数(たとえば、1)に写像することができ、減衰を増加させるために比較的大きなスペクトル歪み推定値を小さなゲイン係数に写像することができる。いくつかの実施形態では、SD1およびSD2はそれぞれ、8%外れ値および2%外れ値によって決定され得るが、他の実施形態では、SD1および/またはSD2は、1つまたは複数の他の外れ値に基づいて決定されてもよいし、外れ値とは無関係に決定されてもよい。
[0047]図2は、ノイズ変調を調整するように、またスペクトル歪みに基づいてフレームゲインを調整するように構成された、図1のシステム100の構成要素の特定の実施形態を示す。LP分析およびコーディングモジュール152は、図1のハイバンド信号124を受け取り、LSP情報などのスペクトル周波数値を生成するように構成される。量子化器156は、スペクトル周波数値を受け取り、量子化されたLSP情報(LSP_Q)などの量子化されたスペクトル周波数値を生成するように構成される。
[0048]スペクトル歪み計算器201は、スペクトル周波数値のセットと量子化されたスペクトル周波数値のセットとを受け取り、スペクトル歪み202を決定するように構成される。 スペクトル歪み計算器201は、図1のゲイン調整器162に関して説明されたのと同様のやり方で、スペクトル歪み202を推定するように構成される。決定されたスペクトル歪み202は、写像モジュール206に提供され得る。
[0049]写像モジュール206は、スペクトル歪み202を受け取り、スペクトル歪み値のゲイン係数値への写像に基づいてゲイン係数(g)204を決定するように構成され得る。たとえば、写像モジュール206は、図1のゲイン調整器162に関して説明されたのと同様のやり方でゲイン係数204を決定するように構成され得る。説明するために、写像モジュール206は、スペクトル歪み202の受け取った値に基づいてゲイン係数204の値を決定するために図3の写像300を適用することができる。ゲイン係数204は、ゲイン調整器162に提供され得る。
[0050]ハイバンド合成モジュール207は、量子化されたスペクトル周波数値を受け取り、合成されたハイバンド信号を生成するためにハイバンド励振発生器160からハイバンド励振信号161を受け取るように構成され得る。たとえば、ハイバンド合成モジュール207は、ハイバンドLP合成フィルタを構成するためにLPC値を使用して、LSP値のLPC値への変換を適用するように構成され得る。ハイバンド合成モジュール207は、合成されたハイバンド信号を生成するためにハイバンド励振信号161を合成フィルタに適用することができる。
[0051]特定の一実施形態では、ハイバンド励振発生器160は、変換されたローバンド励振408と、変調されたノイズ420と、出力混合係数410とを受け取り、変換されたローバンド励振408と変調されたノイズ420の加重和を計算するために出力混合係数410を適用することによってハイバンド励振信号161を生成するように構成された混合モジュール411を含む。図4を参照してさらに詳細に説明されるように、出力混合係数410は、サブフレームに対して算出された混合係数の加重和に基づいた、図1のオーディオ信号102の連続したサブフレームの間の混合係数の平滑化を示すことができる。
[0052]フレームゲイン計算器208は、図1のハイバンド信号124および合成されたハイバンドモジュール207によって生成される合成されたハイバンド信号に基づいてフレームゲインを決定するように構成され得る。たとえば、フレームゲイン計算器208は、ハイバンド信号124と合成されたハイバンド信号との比較に基づいて、オーディオ信号の特定のフレームに対するフレームゲイン値を決定することができる。フレームゲイン値は、調整されたフレームゲインを生成するようにゲイン係数204に基づいてゲイン調整器162によって調整され得る。
[0053]ハイバンド励振発生器160の一例は、図4を参照しながらさらに説明される。ハイバンド励振発生器160は、包絡計算器402およびホワイトノイズ発生器404に結合された入力を有する結合器406を含む。混合モジュール411は、結合器406の出力および非線形変換モジュール407の出力に結合される。混合係数調整器409は混合係数生成器412に結合され、混合モジュール411にも結合される。混合係数調整器409は、受け取った混合係数413に基づいて出力混合係数410を生成するように構成される。出力混合係数410は、混合平滑化を可能にするために、混合モジュール411によって適用される。
[0054]包絡計算器402は、ローバンド励振信号144を受け取ることができ、ローバンド励振信号144に対応するローバンド時間領域包絡403を計算することができる。たとえば、包絡計算器402は、2乗値の列を生じさせるためにローバンド励振信号144(またはローバンド励振信号144のフィルタリングされたバージョン)のフレームの各サンプルの2乗を計算するように構成され得る。包絡計算器402は、第1次IIRローパスフィルタを2乗値の列に適用することなどによって2乗値の列に対して平滑化演算を実行するように構成され得る。包絡計算器402は、ローバンド時間領域包絡403を生じさせるために平方根関数を平滑化された列の各サンプルに適用するように構成され得る。
[0055]結合器406は、変調されたノイズ信号420を生じさせるために、ローバンド時間領域包絡403をホワイトノイズ発生器404によって生成されたホワイトノイズ405と結合させるように構成され得る。たとえば、結合器406は、ローバンド時間領域包絡403に従ってホワイトノイズ405を振幅変調するように構成され得る。たとえば、結合器406は、混合モジュール411に提供される変調されたノイズ信号420を生じさせるために包絡計算器402によって計算された時間領域の包絡線によってノイズ発生器404の出力を増減するように構成された乗算器として実施され得る。
[0056]混合モジュール411は、結合器406からの変調されたノイズ信号420を、変換されたローバンド励振信号408と混合するように構成され得る。たとえば、変換されたローバンド励振信号408は、ローバンド励振信号144に基づいて非線形変換モジュール407によって生成され得る。特定の一実施形態では、非線形変換は、絶対値(「|x|」)変換であってもよいし、xの2乗(「x2」)変換であってもよい。
[0057]混合モジュール411は、混合係数調整器409から受け取られた混合係数α410の値に基づいて、結合器406からの変調されたノイズ信号420と変換されたローバンド励振信号408とを混合することによって、ハイバンド励振信号161を生成するように構成され得る。たとえば、混合モジュール411は、加重された変換されたローバンド励振信号408と加重された変調されたノイズとを合計する前に、変換されたローバンド励振信号408に混合係数α410を適用し、結合器406から受け取られた変調されたノイズ420に(1−α)という係数を適用することによって加重和としてハイバンド励振信号161を計算するように構成され得る。
[0058]混合係数生成器412は、混合係数413をオーディオ信号の各フレームに対する複数の混合係数として生成するように構成され得る。たとえば、4つの混合係数α1、α2、α3、α4はオーディオ信号のフレームに対して生成されてよく、各混合係数は、フレームのそれぞれのサブフレームに対応してよい。たとえば、混合係数生成器412は、ピッチゲインおよび/または発話モード(たとえば、有声または無声)などの、図1のローバンド信号122またはローバンド励振信号144の周期性に関連する1つまたは複数のパラメータに従って混合係数を計算するように構成され得る。別の例として、混合係数生成器412は、オーディオ信号のフレームまたはサブフレームに関するハイバンド信号124の自己相関係数の最大の決定された値のような、図1のハイバンド信号124の周期性の尺度に従って、混合係数を計算するように構成され得る。
[0059]混合係数調整器409は、4つの出力混合係数α1s、α2s、α3s、α4sなどの出力混合係数410を生成することができる。各混合係数は、オーディオ信号のフレームのそれぞれのサブフレームに対応することができる。混合係数調整器409は、出力混合係数410の変動の出現および/または程度を減少させる目的で単一フレーム内のまたは複数のフレームにまたがって混合係数を適応的に平滑化するために、様々な方法で出力混合係数410を生成することができる。説明するために、混合係数調整器409は、特定のフレームの第1のサブフレームに対応する混合係数αの第1の値(たとえば、α1)を受け取り、特定のフレームの第2のサブフレームに対応する混合係数αの第2の値(たとえば、α2)を受け取るように構成されたフィルタを含むことができる。混合係数調整器409は、混合係数の第1の値α(たとえば、α1)および混合係数の第2の値(たとえば、α2s)に少なくとも部分的に基づいて混合係数の第3の値(たとえば、α2s)を生成するように構成され得る。
[0060]たとえば、第1の手法は、単一フレームの一部分(たとえば、サブフレーム)に対応する混合係数値に基づいて混合係数αの値を生成することを含むことができる。以下の擬似コードは第1の手法に相当する。
/*手法1:フレーム内での値に基づく混合係数*/
mix_factor_new[0]=mix_factor[0]; /*第1のサブフレームの混合係数を初期化する*/
NB_SUBFR=4; /*フレームあたり4つのサブフレーム*/
K1=0.8;
for(i=1;i<NB_SUBFR;i++)

mix_factor_new[i]=K1*mix_factor[i]+(1−K1) *mix_factor[i−1];

[0061]第1の手法のための上記の擬似コードでは、mix_factor[i]は、特定のフレームのために混合係数生成器412によって生成されるi番目の混合係数413に対応し(たとえば、mix_factor[0]はα1に対応することができる)、mix_factor_new[i]はi番目の出力混合係数410に対応する(たとえば、mix_factor_new[0]はα1sに対応することができる)。K1は、サブフレーム間の平滑化の量を決定し、0.8の値を有すると示されている。しかしながら、他の実施形態では、K1は、適用されるべき平滑化の量に従って他の値に設定され得る。たとえば、K1=1のとき平滑化は適用されず、平滑化は、K1の値を減少させるにつれて増加する。
[0062]コーディングタイプ(たとえば、フレームが有声フレームまたは無声フレームに対応するかどうか)などの他の要因も、混合係数の平滑化された値を生成するべきかどうかを決定するために使用されてよい。たとえば、混合係数調整器409は、混合係数を生成するためにコーディングタイプ(coder_type)422の指示に応答することができる。説明するために、混合係数平滑化は、コーディングタイプの指示が有声フレームに対応するとき、使用可能にされ、コーディングタイプの指示が無声フレームに対応するとき、使用不可にされ得る。別の例として、混合係数調整器409は、混合係数を変化させるために図2のスペクトル歪み情報(SD)202に応答することができる。一例として、スペクトル歪みが比較的高い(たとえば、図3のスペクトル歪みに関して説明された8%外れ値または2%外れ値などによって、閾値量よりも大きい)とき、混合係数αの値は0〜0.5の範囲に限定されてよく、変調されたノイズの方へより多くのバイアスが存在する。一方、スペクトル歪み202が比較的低い(たとえば、図3のSD1に関して説明された8%外れ値に対応する閾値量よりも小さい)とき、混合は、変換されたローバンド励振の方へバイアスされ得る。
[0063]第2の手法は、異なるフレームの一部分(たとえば、サブフレーム)に対応する混合係数値に基づいて混合係数αの値を生成することを含むことができる。以下の擬似コードは第2の手法に相当する。
/*手法2:複数のフレームにわたる値に基づく混合係数*/
NB_SUBFR=4;
K1=0.8;
mix_factor_new[0]=K1*mix_factor[0]+(1−K1)*mix_factor_old; //第1のサブフレーム
for(i=1;i<NB_SUBFR;i++)
{
mix_factor_new[i]=K1*mix_factor[i]+(1−K1)*mix_factor[i−1];
}
mix_factor_old=mix_factor_new[i];
[0064]第2の手法のための上記の擬似コードでは、mix_factor[i]は、特定のフレームのために混合係数生成器412によって生成されるi番目の混合係数413に対応し(たとえば、mix_factor[0]はα1に対応することができる)、mix_factor_new[i]は特定のフレームのためのi番目の出力混合係数410に対応する(たとえば、mix_factor_new[0]はα1sに対応することができる)。平滑化は、mix_factor_oldによってフレームにまたがって実行され、これによって、前のフレームの最後のサブフレームに対して決定された混合係数に基づいた現在のフレームの第1のサブフレームに対する平滑化が可能になる。
[0065]第3の手法は、適応値を使用して混合係数αを生成することを含むことができる。以下の擬似コードは第3の手法に相当する。
[0066]
/*手法3:適応的K1を使用した混合係数生成*/
NB_SUBFR=4;
/*現在のハイバンドのエネルギーを推定する。高速で変化する場合、より遅い平滑化係数を使用する*/
if(hb_energy_prev>2*hb_energy_curr||hb_energy_curr>2*hb_energy_prev)
K1=0.8;
else
K1=0.3;
mix_factor_new[0]=K1*mix_factor[0]+(1−K1)*mix_factor_old; //第1のサブフレーム
for(i=1;i<NB_SUBFR;i++)
{
mix_factor_new[i]=K1*mix_factor[i]+(1−K1)*mix_factor[i−1];
}
mix_factor_old=mix_factor_new[i];
[0067]第3の手法のための上記の擬似コードでは、平滑化は、第2の手法と類似のやり方でフレームにわたって使用可能である。さらに、K1の値は、オーディオ信号のハイバンドのエネルギー変動に基づいて決定される。たとえば、第1の値に適用される第1の重み(たとえば、K1)および第2の値に適用される第2の重み(たとえば、1−K1)は、図1のハイバンド信号124のエネルギー変動に基づいて決定される。第1のハイバンドのエネルギー値hb_energy_prevはオーディオ信号の第1の部分(たとえば、前のフレーム)中のハイバンド信号のエネルギーに対応し、第2のハイバンドのエネルギー値hb_energy_currはオーディオ信号の第2の部分(たとえば、現在のフレーム)中のハイバンド信号のエネルギーに対応する。
[0068]フレーム間のハイバンドのエネルギーの変動が比較的大きいように決定されるとき、第1の重み(たとえば、K1)および第2の重み(たとえば、1−K1)は、連続したサブフレームの混合係数間のより大きな変化率とより小さな平滑化とを可能にする値を有するように決定される。たとえば、第3の手法のための擬似コードでは、第1の重み(たとえば、K1=0.8)は、第1の閾値を超える第1のハイバンドのエネルギー値に応答して(たとえば、hb_energy_prevが2*hb_energy_currよりも大きいとき)、または第2の閾値を超える第2のハイバンドのエネルギー値に応答して(たとえば、hb_energy_currが2*hb_energy_prevよりも大きいとき)、第2の重み(たとえば、(1−K1)=0.2)よりも大きいように選択される。第1の閾値は、倍率(たとえば、上記の擬似コードでは2)によって増減された第2のハイバンドのエネルギー値(hb_energy_curr)に対応する。第2の閾値は、倍率によって増減された第1のハイバンドのエネルギー値(hb_energy_prev)に対応する。
[0069]フレーム間のハイバンドのエネルギーの変動が比較的小さいように決定されるとき、第1の重み(たとえば、K1)および第2の重み(たとえば、1−K1)は、連続したサブフレームの混合係数間のより小さな変化率とより大きな平滑化とを可能にする値を有するように決定される。たとえば、第3の手法のための擬似コードでは、第1の重み(たとえば、K1=0.3)は、第1の閾値を超えない第1のハイバンドのエネルギー値に応答して(たとえば、hb_energy_prevが2*hb_energy_curr以下であるとき)、または第2の閾値を超えない第2のハイバンドのエネルギー値に応答して(たとえば、hb_energy_currが2*hb_energy_prev以下であるとき)、第2の重み(たとえば、(1−K1)=0.7)よりも小さいように選択される。
[0070]第3の手法のための擬似コードは、ハイバンドのエネルギー変動に基づいて第1の重みと第2の重みとを決定する例示的な例を提供するが、他の実施形態では、複数のフレーム間でのハイバンドのエネルギー値の代替および/または追加の比較が、第1の重みの値と第2の重みの値とを決定し、混合係数の平滑化を制御するために行われることがある。
[0071]したがって、図4に示されるように、ハイバンド励振発生器160は、平滑化された混合係数410を生成することができ、フレーム間でのハイバンドのエネルギー変動の量に基づいて1つまたは複数の平滑化パラメータ(たとえば、K1)を適応的に決定することができる。
[0072]図5を参照すると、ゲイン制御を実行する方法の特定の実施形態の流れ図が示されており、全体的に500と指定されている。例示的な一実施形態では、方法500は、図1のシステム100によって、ハイバンド励振発生器160などによって、実行され得る。
[0073]502では、混合係数の第1の値が受け取られる。この第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する。504では、混合係数の第2の値が受け取られる。この第2の値は、オーディオ信号の第2の部分に対応する。第1の値はオーディオ信号の第1のサブフレームのローバンド部分に基づいて生成され得、第2の値はオーディオ信号の第2のサブフレームのローバンド部分に基づいて生成され得る。たとえば、図4の混合係数調整器409は、混合係数生成器412から混合係数413の値を受け取る。説明するために、第1の値はα1、α2、α3、またはα4のうち1つに対応してよく、第2の値はα1、α2、α3、またはα4のうち別の値に対応してよい。
[0074]506では、混合係数の第3の値が、第1の値および第2の値に少なくとも部分的に基づいて生成される。たとえば、混合係数調整器409は、混合係数413の複数の受け取られた値の加重和に基づいて、出力混合係数410の値を生成する。
[0075]第3の値を生成することは、第1の値と第2の値の加重和を決定することを含むことができる。たとえば、図4の混合係数調整器409に関して説明する第3の手法では、第1の値に適用される第1の重み(たとえば、K1)および第2の値に適用される第2の重み(たとえば、1−K1)は、オーディオ信号のハイバンドのエネルギー変動に基づいて決定され得る。第1の重みおよび第2の重みは、第1の部分に対応する第1のハイバンドのエネルギー値に基づいて、第2の部分に対応する第2のハイバンドのエネルギー値にさらに基づいて決定され得る(たとえば、第3の手法に対応する擬似コードではそれぞれ、hb_energy_prevおよびhb_energy_currと記載されている)。第1の重みは、第1の閾値を超える第1のハイバンドのエネルギー値(たとえば、hb_energy_prev>第1の閾値)に応答して、または第2の閾値を超える第2のハイバンドのエネルギー値(たとえば、hb_energy_curr>第2の閾値)に応答して、第2の重みよりも大きいように選択され得る。第1の閾値は、倍率によって変倍された第2のハイバンドのエネルギー値に対応することができ(たとえば、第1の閾値=2*hb_energy_curr)、第2の閾値は、倍率によって変倍された第1のハイバンドのエネルギー値に対応することができる(たとえば、第2の閾値=2*hb_energy_prev)。
[0076]第1の部分はオーディオ信号の第1のサブフレームを含むことができ、第2の部分はオーディオ信号の第2のサブフレームを含むことができる。たとえば、第1のサブフレームおよび第2のサブフレームは、オーディオ信号の単一フレーム内にあることがある。説明するために、図4の混合係数調整器409に関して説明された第1の手法、第2の手法、および第3の手法の各々は、特定のフレームの1つのサブフレームに対応する混合係数の第1の値および特定のフレームの別のサブフレームに対応する混合係数の第2の値に基づいて、混合係数の第3の値を生成することができる。
[0077]別の例として、第1のサブフレームおよび第2のサブフレームは、オーディオ信号の異なるフレーム内にあることがある。たとえば、図4の混合係数調整器409に関して説明された第2の手法および第3の手法は、前のフレームの最後のサブフレームに対応する混合係数の第1の値に基づいて、および特定のフレームの第1のサブフレームに対応する混合係数の第2の値に基づいて、(たとえば、特定のフレームの第1のサブフレームのための)混合係数の第3の値を生成することができる。
[0078]508では、励振信号が、混合係数の第3の値に基づいて、変調されたノイズと混合される。たとえば、オーディオ信号のハイバンド部分に対応するハイバンド励振信号が生成され得る。ハイバンド励振信号は、変調されたノイズと励振信号と結合することに基づいて生成され得、ここで、励振信号は、ローバンド励振信号の変換されたバージョンに対応する。たとえば、図4の混合モジュール411は、結合器406からの変調された420ノイズおよびローバンド励振信号144の変換されたバージョン(図1のオーディオ信号102の部分ローバンドに対応する)に基づいてハイバンド励振信号161を生成することができる。混合係数は、変調されたノイズとローバンド励振信号の変換されたバージョンとの比を示すことができる。たとえば、ハイバンド励振信号は、変調されたノイズとローバンド励振信号の変換されたバージョンの加重和として生成され得る。
[0079]特定の実施形態では、図5の方法500は、中央処理装置(CPU)、デジタル信号プロセッサ(DSP)、またはコントローラなどの処理ユニットのハードウェア(たとえば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)など)によって実施されてもよいし、ファームウェアデバイスによって実施されてもよいし、これらの任意の組合せによって実施されてもよい。一例として、図5の方法500は、図7に関して説明された命令などの命令を実行するプロセッサによって実行可能である。
[0080]図6を参照すると、ゲイン制御を実行する方法の特定の実施形態の流れ図が示されており、全体的に600と指定されている。例示的な一実施形態では、方法600は、図1のシステム100によって、ハイバンド分析モジュール160などによって実行され得る。
[0081]602では、オーディオ信号に対応するスペクトル周波数値の第1のセットが決定される。たとえば、スペクトル周波数値の第1のセットは、図1のLP分析およびコーディングモジュール152によって生成され得る。説明するために、スペクトル周波数値の第1のセットは、オーディオ信号のハイバンド部分の各フレームに対するLPフィルタ係数のセットを生じさせるためにLPC分析を実行することによって決定されてよく、LPフィルタ係数の変換を含むことができる。
[0082]604では、スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットが決定される。たとえば、スペクトル値の第2のセットは、図1の量子化器156によって生成され得る。スペクトル周波数値の第2のセットは、スペクトル周波数値の第1のセットに基づいて図1のコードブック163などのコードブックを検索することによって決定され得る。特定の一実施形態では、スペクトル周波数値の第1のセットは線スペクトル周波数(LSF)値を含み、スペクトル周波数値の第2のセットは量子化されたLSF値を含む。他の実施形態では、スペクトル周波数値の第1のセットは、LSF値とは異なる値であってよい。たとえば、スペクトル周波数値の第1のセットは線形予測係数(LPC)値を含むことができ、スペクトル周波数値の第2のセットは量子化されたLPC値を含むことができる。
[0083]606では、オーディオ信号の少なくとも一部分に対応するゲイン値が、第1のセットと第2のセットの差に基づいて調整される。ゲイン値は、オーディオ信号のフレームのフレームゲインに対応することができる。たとえば、フレームゲイン値は、図1のオーディオ信号102のハイバンド部分と、図2の合成フィルタ207などの合成フィルタにハイバンド励振信号161を適用することによって生成された合成されたハイバンド信号に基づいて、生成され得る。特定の一実施形態では、合成フィルタは、スペクトル周波数値の第1のセットに従って構成されてもよいし、(量子化されていない値を生成するために第2のセットを変換した後)スペクトル周波数値の第2のセットに従って構成されてもよい。
[0084]ゲイン値を調整することは、608において、スペクトル周波数値の第1のセットとスペクトル周波数値の第2のセットの間のスペクトル歪みを決定することを含むことができる。たとえば、スペクトル歪みは、図2のスペクトル歪みモジュール201によって生成されるSD202であってよい。第1のセットと第2のセットの間の差に対応するスペクトル歪みは、様々な技法によって推定され得る。たとえば、スペクトル歪みは、スペクトル周波数値の第1のセットにおける値と比較したスペクトル周波数値の第2のセットにおける値の平均2乗誤差に従って決定され得る。別の例として、スペクトル歪みは、スペクトル周波数値の第1のセットにおける値と比較したスペクトル周波数値の第2のセットにおける値の間の絶対差に従って決定され得る。
[0085]ゲイン値を調整することはまた、610において、スペクトル歪みに基づいてゲイン係数を決定することを含むことができる。ゲイン係数は、図3の写像300に従って図2の写像モジュール206によって生成されるゲイン係数204に関して説明されたものなどの、スペクトル歪み値のゲイン係数値への写像に従って決定され得る。説明するために、写像の一部分は、SD1とSD2の間の写像300の傾斜部分によって示されるものなど、スペクトル歪みの増加がゲイン係数値の減少に対応することを定義することができる。写像は、図3のSD1およびSD2に関して説明されたものなどの、確率分布関数の外れ値に対応するスペクトル歪み値に少なくとも部分的に基づいてよい。
[0086]ゲイン値を調整することはまた、612において、ゲイン係数をフレームゲインに適用することによってフレームゲインを調整することを含むことができる。説明するために、ゲイン値は、量子化誤差の量に基づいてハイバンド信号の一部分を減衰させるためにゲイン係数によって乗算され得る。方法600は、図1および図4のハイバンド構成要素に関して説明されているが、方法600は、図1のローバンド信号122に関して適用されてもよいし、エンコーダで受け取られるオーディオ信号102の任意の他の部分に関して適用されてもよい。
[0087]特定の実施形態では、図6の方法600は、中央処理装置(CPU)、デジタル信号プロセッサ(DSP)、またはコントローラなどの処理ユニットのハードウェア(たとえば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)など)によって実施されてもよいし、ファームウェアデバイスによって実施されてもよいし、これらの任意の組合せによって実施されてもよい。一例として、図6の方法600は、図7に関して説明されたように、命令を実行するプロセッサによって実行可能である。
[0088]したがって、図1〜図6は、ノイズによるアーチファクトを減少させるために推定されたスペクトル歪みに基づいてゲイン調整を実行するおよび/または混合係数平滑化を実行するシステムおよび方法を含む例を示す。
[0089]図7を参照すると、ワイヤレス通信デバイスの特定の例示的な実施形態のブロック図が示されており、全体的に700と指定されている。デバイス700は、メモリ732に結合されたプロセッサ710(たとえば、中央処理装置(CPU)、デジタル信号プロセッサ(DSP)など)を含む。メモリ732は、図5〜図6の方法などの本明細書で開示される方法およびプロセスを実行するためにプロセッサ710および/またはコーダ/デコーダ(CODEC)734によって実行可能な命令760を含むことができる。
[0090]CODEC734は、ノイズ変調システム776を含むことができる。特定の一実施形態では、ノイズ変調システム776は、図4のシステム400の1つまたは複数の構成要素を含む。ノイズ変調システム776は、専用ハードウェア(たとえば、回路)を介して実施されてもよいし、1つまたは複数のタスクを実行するために命令を実行するプロセッサによって実施されてもよいし、これらの組合せによって実施されてもよい。一例として、メモリ732またはCODEC734内のメモリは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能なプログラマブル読出し専用メモリ(EPROM)、電気的に消去可能な読出し専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ(CD−ROM)などのメモリデバイスであってよい。メモリデバイスは、コンピュータ(たとえば、CODEC734内のプロセッサおよび/またはプロセッサ710)によって実行されるときにコンピュータにオーディオ信号の第1の部分に対応する混合係数の第1の値を受け取らせ、オーディオ信号の第2の部分に対応する混合係数の第2の値を受け取らせ、第1の値および第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成させ得る命令(たとえば、命令760)を含むことができる。一例として、メモリ732またはCODEC734内のメモリは、コンピュータ(たとえば、CODEC734内のプロセッサおよび/またはプロセッサ710)によって実行されるときにコンピュータに図5の方法500の少なくとも一部分を実行させる命令(たとえば、命令760)を含む非一時的コンピュータ可読媒体であってよい。
[0091]CODEC734は、ゲイン調整システム778を含むことができる。特定の一実施形態では、ゲイン調整システム778は、図1のゲイン調整器162を含む。ゲイン調整システム778は、専用ハードウェア(たとえば、回路)を介して実施されてもよいし、1つまたは複数のタスクを実行するために命令を実行するプロセッサによって実施されてもよいし、これらの組合せによって実施されてもよい。一例として、メモリ732は、コンピュータ(たとえば、CODEC734内のプロセッサおよび/またはプロセッサ710)によって実行されるときにコンピュータにオーディオ信号に対応するスペクトル周波数値の第1のセットを決定させ、スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定させ、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整させる命令(たとえば、命令760)を含むメモリデバイスであってよい。一例として、メモリ732またはCODEC734内のメモリは、コンピュータ(たとえば、CODEC734内のプロセッサおよび/またはプロセッサ710)によって実行されるときにコンピュータに図6の方法600の少なくとも一部分を実行させることができる命令(たとえば、命令760)を含む非一時的コンピュータ可読媒体であってよい。
[0092]図7は、プロセッサ710およびディスプレイ728に結合されたディスプレイコントローラ726も示す。CODEC734は、図示のように、プロセッサ710に結合され得る。スピーカ736およびマイクロホン738はCODEC734に結合可能である。たとえば、マイクロホン738は図1の入力オーディオ信号102を生成することができ、CODEC734は、入力オーディオ信号102に基づいて、受信機への送信のための出力ビットストリーム192を生成することができる。別の例として、スピーカ736は、CODEC734によって再構成された信号を図1の出力ビットストリーム192から出力するために使用されることがあり、出力ビットストリーム192は送信機から受け取られる。図7は、ワイヤレスコントローラ740がプロセッサ710およびワイヤレスアンテナ742に結合可能であることも示す。
[0093]特定の一実施形態では、プロセッサ710、ディスプレイコントローラ726、メモリ732、CODEC734、およびワイヤレスコントローラ740は、システムインパッケージデバイスまたはシステムオンチップデバイス(たとえば、移動局モデム(MSM))722に含まれる。特定の一実施形態では、タッチスクリーンおよび/またはキーパッドなどの入力デバイス730ならびに電源744は、システムオンチップデバイス722に結合される。その上、特定の一実施形態では、図7に示されるように、ディスプレイ728、入力デバイス730、スピーカ736、マイクロホン738、ワイヤレスアンテナ742、および電源744は、システムオンチップデバイス722の外部にある。しかしながら、ディスプレイ728、入力デバイス730、スピーカ736、マイクロホン738、ワイヤレスアンテナ742、および電源744の各々は、インターフェースまたはコントローラなどのシステムオンチップデバイス722の構成要素に結合可能である。
[0094]説明された実施形態に関連して、混合係数の第1の値および混合係数の第2の値に少なくとも部分的に基づいて混合係数の第3の値を生成するための手段を含む装置が開示され、第1の値はオーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応し、第2の値はオーディオ信号の第2の部分に対応する。たとえば、生成するための手段は、図1のハイバンド励振発生器160、図4の混合係数調整器409、図7のノイズ変調システム776もしくはその構成要素、第1の値および第2の値に基づいて第3の値を生成するように構成された、フィルタなどの1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体で命令を実行するプロセッサ)、またはこれらの任意の組合せを含むことができる。
[0095]装置は、変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによってオーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するための手段も含むことができる。ローバンド励振信号は、オーディオ信号のローバンド部分に対応する。生成するための手段は、第3の値に基づいて変調されたノイズとローバンド励振信号の変換されたバージョンとを結合するように構成され得る。たとえば、ハイバンド励振信号を生成するための手段は、図1のハイバンド励振発生器160、図4のミキサ411、図7のノイズ変調システム776もしくはその構成要素、励振信号を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体で命令を実行するプロセッサ)、またはこれらの任意の組合せを含むことができる。
[0096]説明された実施形態に関連して、オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するための手段を含む装置が開示される。たとえば、第1のセットを決定するための手段は、図1のLP分析およびコーディングモジュール152、図7のゲイン調整システム778もしくはその構成要素、オーディオ信号に対応するスペクトル周波数値を生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体で命令を実行するプロセッサ)、またはこれらの任意の組合せを含むことができる。
[0097]装置は、スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するための手段も含むことができる。たとえば、第2のセットを生成するための手段は、図1の量子化器156、図7のゲイン調整システム778もしくはその構成要素、スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体で命令を実行するプロセッサ)、またはこれらの任意の組合せを含むことができる。
[0098]装置は、第1のセットと第2のセットの間の差に基づいてオーディオ信号の少なくとも一部分に対応するゲイン値を調整するための手段も含むことができる。たとえば、調整するための手段は、図1のゲイン調整器162、図7のゲイン調整システム778もしくはその構成要素、ゲイン値を調整するように構成された1つもしくは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体で命令を実行するプロセッサ)、またはこれらの任意の組合せを含むことができる。
[0099]本明細書で開示される実施形態に関して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実施され得ることは、当業者にはさらに諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップは、上記で機能に関して一般的に説明されてきた。そのような機能をハードウェアとして実装するか、実行可能ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[00100]本明細書で開示される実施形態に関して説明された方法またはアルゴリズムのステップは、ハードウェア内で、プロセッサによって実行されるソフトウェアモジュール内で、またはこれら2つの組合せで直接実施され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能なプログラマブル読出し専用メモリ(EPROM)、電気的に消去可能な読出し専用メモリ(EEPROM)、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ(CD−ROM)などのメモリデバイス内に存在してよい。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことが可能であるように、プロセッサに結合される。代替として、メモリデバイスはプロセッサと一体であってよい。プロセッサおよび記憶媒体は、特定用途向け集積回路(ASIC)内に存在してよい。ASICは、コンピューティングデバイスまたはユーザ端末内に存在してよい。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として常駐し得る。
[00101]開示した実施形態の上記の説明は、開示した実施形態を当業者が作成または使用することができるように行ったものである。これらの実施形態に対する様々な修正は、当業者には容易に明らかであり、本明細書で定義される原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示される実施形態に限定されることを意図するものではなく、以下の特許請求の範囲によって定義される原理および新規な特徴と一致する可能な最も広い範囲が与えられることを意図するものである。
[00101]開示した実施形態の上記の説明は、開示した実施形態を当業者が作成または使用することができるように行ったものである。これらの実施形態に対する様々な修正は、当業者には容易に明らかであり、本明細書で定義される原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示される実施形態に限定されることを意図するものではなく、以下の特許請求の範囲によって定義される原理および新規な特徴と一致する可能な最も広い範囲が与えられることを意図するものである。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
混合係数の第1の値を受け取ること、前記第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する、と、
前記混合係数の第2の値を受け取ること、前記第2の値は、前記オーディオ信号の第2の部分に対応する、と、
前記第1の値および前記第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成することと、
前記混合係数の前記第3の値に基づいて励振信号を変調されたノイズと混合することとを備える方法。
[C2]
前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成することをさらに備え、ここにおいて、前記ハイバンド励振信号は、前記変調されたノイズと前記励振信号とを結合することに基づいて生成され、ここにおいて、前記励振信号はローバンド励振信号の変換されたバージョンに対応し、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、C1に記載の方法。
[C3]
前記ハイバンド励振信号は、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンの加重和を備える、C2に記載の方法。
[C4]
前記第1の値は、前記オーディオ信号の第1のサブフレームのローバンド部分に基づいて生成され、前記第2の値は、前記オーディオ信号の第2のサブフレームのローバンド部分に基づいて生成される、C1に記載の方法。
[C5]
前記第3の値を生成することは、前記第1の値と前記第2の値の加重和を決定することを備える、C1に記載の方法。
[C6]
前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、C5に記載の方法。
[C7]
前記第1の重みおよび前記第2の重みは、前記第1の部分に対応する第1のハイバンドのエネルギー値に基づいて、および前記第2の部分に対応する第2のハイバンドのエネルギー値にさらに基づいて、決定される、C6に記載の方法。
[C8]
前記第1の重みは、第1の閾値を超える前記第1のハイバンドのエネルギー値に応答して、または第2の閾値を超える前記第2のハイバンドのエネルギー値に応答して、前記第2の重みよりも大きいように選択され、ここにおいて、前記第1の閾値は、倍率によって変倍された前記第2のハイバンドのエネルギー値に対応し、ここにおいて、前記第2の閾値は、前記倍率によって変倍された前記第1のハイバンドのエネルギー値に対応する、C7に記載の方法。
[C9]
前記第3の値を生成することは、前記オーディオ信号に対応するスペクトル歪みにさらに基づく、C1に記載の方法。
[C10]
前記第3の値を生成することは、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づく、C1に記載の方法。
[C11]
前記第1の部分は、前記オーディオ信号の第1のサブフレームを備え、前記第2の部分は、前記オーディオ信号の第2のサブフレームを備える、C1に記載の方法。
[C12]
前記第1のサブフレームおよび前記第2のサブフレームは前記オーディオ信号の単一フレーム内にある、C11に記載の方法。
[C13]
前記第1のサブフレームおよび前記第2のサブフレームは前記オーディオ信号の異なるフレーム内にある、C11に記載の方法。
[C14]
オーディオ信号に対応するスペクトル周波数値の第1のセットを決定することと、
前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定することと、
前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整することと、を備える方法。
[C15]
前記第1のセットと前記第2のセットの間の前記差に対応するスペクトル歪みを推定することをさらに備える、C14に記載の方法。
[C16]
前記スペクトル歪みが、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の平均2乗誤差に従って決定される、C15に記載の方法。
[C17]
前記スペクトル歪みが、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の間の差の絶対値に従って決定される、C15に記載の方法。
[C18]
前記スペクトル周波数値の第1のセットは線スペクトル周波数(LSF)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLSF値を備える、C14に記載の方法。
[C19]
前記スペクトル周波数値の第1のセットは線形予測係数(LPC)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLPC値を備える、C14に記載の方法。
[C20]
前記スペクトル周波数値の第1のセットに基づいてコードブックを検索することによって前記スペクトル周波数値の第2のセットを決定することをさらに備える、C14に記載の方法。
[C21]
前記ゲイン値は前記オーディオ信号のフレームのフレームゲインに対応し、前記ゲイン値を調整することは、
前記スペクトル周波数値の第1のセットと前記スペクトル周波数値の第2のセットの間のスペクトル歪みを決定することと、
前記スペクトル歪みに基づいてゲイン係数を決定することと、
前記ゲイン係数を前記フレームゲインに適用することによって前記フレームゲインを調整することと、を備える、C14に記載の方法。
[C22]
前記ゲイン係数は、スペクトル歪み値のゲイン係数値への写像に従って決定される、C21に記載の方法。
[C23]
前記写像の一部分は、スペクトル歪み値の増加がゲイン係数値の減少に対応することを定義する、C22に記載の方法。
[C24]
前記写像は、確率分布関数の外れ値に対応するスペクトル歪み値に少なくとも部分的に基づく、C22に記載の方法。
[C25]
混合係数の第1の値および前記混合係数の第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成するように構成されたフィルタ、ここにおいて、前記第1の値はオーディオ信号の第1の部分に対応し、ここにおいて、前記第2の値は前記オーディオ信号の第2の部分に対応する、と、
前記第3の値を受け取り、変調されたノイズを生成して前記変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによって前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するように構成されたミキサ、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、と、を備え、
ここにおいて、前記ミキサは、前記第3の値に基づいて、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンとを結合するように構成される、装置。
[C26]
前記フィルタは、前記第1の値と前記第2の値の加重和を決定するように構成される、C25に記載の装置。
[C27]
前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、C26に記載の装置。
[C28]
前記第1の重みおよび前記第2の重みは、前記第1の部分に対応する第1のハイバンドのエネルギー値に基づいて、および前記第2の部分に対応する第2のハイバンドのエネルギー値にさらに基づいて、決定される、C27に記載の装置。
[C29]
前記第1の重みは、第1の閾値を超える前記第1のハイバンドのエネルギー値に応答して、または第2の閾値を超える前記第2のハイバンドのエネルギー値に応答して、前記第2の重みよりも大きいように選択され、ここにおいて、前記第1の閾値は、倍率によって変倍された前記第2のハイバンドのエネルギー値に対応し、ここにおいて、前記第2の閾値は、前記倍率によって変倍された前記第1のハイバンドのエネルギー値に対応する、C28に記載の装置。
[C30]
前記第3の値を生成することは、前記オーディオ信号に対応するスペクトル歪みにさらに基づく、C25に記載の装置。
[C31]
前記第3の値を生成することは、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づく、C25に記載の装置。
[C32]
混合係数の第1の値および前記混合係数の第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成するための手段、ここにおいて、前記第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応し、ここにおいて、前記第2の値は前記オーディオ信号の第2の部分に対応する、と、
変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによって前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するための手段、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、を備え、と、
ここにおいて、前記生成するための手段は、前記第3の値に基づいて、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンとを結合するように構成される、装置。
[C33]
前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、C32に記載の装置。
[C34]
前記第3の値は、前記オーディオ信号に対応するスペクトル歪みにさらに基づいて生成される、C32に記載の装置。
[C35]
前記第3の値は、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づいて生成される、C32に記載の装置。
[C36]
コンピュータによって実行されるとき、前記コンピュータに、
混合係数の第1の値を受け取らせ、前記第1の値は、オーディオエンコーダで受け取られたオーディオ信号の第1の部分に対応する、
前記混合係数の第2の値を受け取らせ、前記第2の値は、前記オーディオ信号の第2の部分に対応する、
前記第1の値および前記第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成させ、
前記混合係数の前記第3の値に基づいて励振信号を変調されたノイズと混合させる、命令を備える非一時的コンピュータ可読媒体。
[C37]
前記コンピュータによって実行されるとき、前記コンピュータに前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成させる命令をさらに備え、ここにおいて、前記ハイバンド励振信号は、前記変調されたノイズと前記励振信号とを結合することに基づいて生成され、ここにおいて、前記励振信号はローバンド励振信号の変換されたバージョンに対応し、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、C36に記載のコンピュータ可読媒体。
[C38]
前記ハイバンド励振信号は、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンの加重和を備える、C37に記載のコンピュータ可読媒体。
[C39]
前記第1の値は、前記オーディオ信号の第1のサブフレームのローバンド部分に基づいて生成され、ここにおいて、前記第2の値は、前記オーディオ信号の第2のサブフレームのローバンド部分に基づいて生成される、C36に記載のコンピュータ可読媒体。
[C40]
オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するように構成された分析フィルタと、
前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するように構成された量子化器と、
前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整するように構成されたゲイン回路と、を備える装置。
[C41]
スペクトル歪み計算器は、前記第1のセットと前記第2のセットの間の前記差に対応するスペクトル歪みを推定するように構成される、C40に記載の装置。
[C42]
前記スペクトル歪み計算器は、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の平均2乗誤差に従って前記スペクトル歪みを決定するように構成される、C41に記載の装置。
[C43]
前記スペクトル歪み計算器は、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の間の差の絶対値に従って前記スペクトル歪みを決定するように構成される、C41に記載の装置。
[C44]
オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するための手段と、
前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するための手段と、
前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整するための手段と、を備える装置。
[C45]
前記スペクトル周波数値の第1のセットは線スペクトル周波数(LSF)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLSF値を備える、C44に記載の装置。
[C46]
前記スペクトル周波数値の第1のセットは線形予測係数(LPC)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLPC値を備える、C44に記載の装置。
[C47]
前記スペクトル周波数値の第1のセットに基づいてコードブックを検索することによって前記スペクトル周波数値の第2のセットを決定するための手段をさらに備える、C44に記載の装置。
[C48]
コンピュータによって実行されるとき、前記コンピュータに、
オーディオ信号に対応するスペクトル周波数値の第1のセットを決定させ、
前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定させ、
前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整させる、命令を備える、非一時的コンピュータ可読媒体。
[C49]
前記ゲイン値は前記オーディオ信号のフレームのフレームゲインに対応し、ここにおいて、前記コンピュータに前記ゲイン値を調整させる前記命令は、前記コンピュータに、
前記スペクトル周波数値の第1のセットと前記スペクトル周波数値の第2のセットの間のスペクトル歪みを決定させ、
前記スペクトル歪みに基づいてゲイン係数を決定させ、
前記ゲイン係数を前記フレームゲインに適用することによって前記フレームゲインを調整させる、命令を備える、C48に記載のコンピュータ可読媒体。

Claims (49)

  1. 混合係数の第1の値を受け取ること、前記第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応する、と、
    前記混合係数の第2の値を受け取ること、前記第2の値は、前記オーディオ信号の第2の部分に対応する、と、
    前記第1の値および前記第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成することと、
    前記混合係数の前記第3の値に基づいて励振信号を変調されたノイズと混合することとを備える方法。
  2. 前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成することをさらに備え、ここにおいて、前記ハイバンド励振信号は、前記変調されたノイズと前記励振信号とを結合することに基づいて生成され、ここにおいて、前記励振信号はローバンド励振信号の変換されたバージョンに対応し、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、請求項1に記載の方法。
  3. 前記ハイバンド励振信号は、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンの加重和を備える、請求項2に記載の方法。
  4. 前記第1の値は、前記オーディオ信号の第1のサブフレームのローバンド部分に基づいて生成され、前記第2の値は、前記オーディオ信号の第2のサブフレームのローバンド部分に基づいて生成される、請求項1に記載の方法。
  5. 前記第3の値を生成することは、前記第1の値と前記第2の値の加重和を決定することを備える、請求項1に記載の方法。
  6. 前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、請求項5に記載の方法。
  7. 前記第1の重みおよび前記第2の重みは、前記第1の部分に対応する第1のハイバンドのエネルギー値に基づいて、および前記第2の部分に対応する第2のハイバンドのエネルギー値にさらに基づいて、決定される、請求項6に記載の方法。
  8. 前記第1の重みは、第1の閾値を超える前記第1のハイバンドのエネルギー値に応答して、または第2の閾値を超える前記第2のハイバンドのエネルギー値に応答して、前記第2の重みよりも大きいように選択され、ここにおいて、前記第1の閾値は、倍率によって変倍された前記第2のハイバンドのエネルギー値に対応し、ここにおいて、前記第2の閾値は、前記倍率によって変倍された前記第1のハイバンドのエネルギー値に対応する、請求項7に記載の方法。
  9. 前記第3の値を生成することは、前記オーディオ信号に対応するスペクトル歪みにさらに基づく、請求項1に記載の方法。
  10. 前記第3の値を生成することは、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づく、請求項1に記載の方法。
  11. 前記第1の部分は、前記オーディオ信号の第1のサブフレームを備え、前記第2の部分は、前記オーディオ信号の第2のサブフレームを備える、請求項1に記載の方法。
  12. 前記第1のサブフレームおよび前記第2のサブフレームは前記オーディオ信号の単一フレーム内にある、請求項11に記載の方法。
  13. 前記第1のサブフレームおよび前記第2のサブフレームは前記オーディオ信号の異なるフレーム内にある、請求項11に記載の方法。
  14. オーディオ信号に対応するスペクトル周波数値の第1のセットを決定することと、
    前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定することと、
    前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整することと、
    を備える方法。
  15. 前記第1のセットと前記第2のセットの間の前記差に対応するスペクトル歪みを推定することをさらに備える、請求項14に記載の方法。
  16. 前記スペクトル歪みが、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の平均2乗誤差に従って決定される、請求項15に記載の方法。
  17. 前記スペクトル歪みが、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の間の差の絶対値に従って決定される、請求項15に記載の方法。
  18. 前記スペクトル周波数値の第1のセットは線スペクトル周波数(LSF)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLSF値を備える、請求項14に記載の方法。
  19. 前記スペクトル周波数値の第1のセットは線形予測係数(LPC)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLPC値を備える、請求項14に記載の方法。
  20. 前記スペクトル周波数値の第1のセットに基づいてコードブックを検索することによって前記スペクトル周波数値の第2のセットを決定することをさらに備える、請求項14に記載の方法。
  21. 前記ゲイン値は前記オーディオ信号のフレームのフレームゲインに対応し、前記ゲイン値を調整することは、
    前記スペクトル周波数値の第1のセットと前記スペクトル周波数値の第2のセットの間のスペクトル歪みを決定することと、
    前記スペクトル歪みに基づいてゲイン係数を決定することと、
    前記ゲイン係数を前記フレームゲインに適用することによって前記フレームゲインを調整することと、
    を備える、請求項14に記載の方法。
  22. 前記ゲイン係数は、スペクトル歪み値のゲイン係数値への写像に従って決定される、請求項21に記載の方法。
  23. 前記写像の一部分は、スペクトル歪み値の増加がゲイン係数値の減少に対応することを定義する、請求項22に記載の方法。
  24. 前記写像は、確率分布関数の外れ値に対応するスペクトル歪み値に少なくとも部分的に基づく、請求項22に記載の方法。
  25. 混合係数の第1の値および前記混合係数の第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成するように構成されたフィルタ、ここにおいて、前記第1の値はオーディオ信号の第1の部分に対応し、ここにおいて、前記第2の値は前記オーディオ信号の第2の部分に対応する、と、
    前記第3の値を受け取り、変調されたノイズを生成して前記変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによって前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するように構成されたミキサ、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、と、
    を備え、
    ここにおいて、前記ミキサは、前記第3の値に基づいて、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンとを結合するように構成される、
    装置。
  26. 前記フィルタは、前記第1の値と前記第2の値の加重和を決定するように構成される、請求項25に記載の装置。
  27. 前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、請求項26に記載の装置。
  28. 前記第1の重みおよび前記第2の重みは、前記第1の部分に対応する第1のハイバンドのエネルギー値に基づいて、および前記第2の部分に対応する第2のハイバンドのエネルギー値にさらに基づいて、決定される、請求項27に記載の装置。
  29. 前記第1の重みは、第1の閾値を超える前記第1のハイバンドのエネルギー値に応答して、または第2の閾値を超える前記第2のハイバンドのエネルギー値に応答して、前記第2の重みよりも大きいように選択され、ここにおいて、前記第1の閾値は、倍率によって変倍された前記第2のハイバンドのエネルギー値に対応し、ここにおいて、前記第2の閾値は、前記倍率によって変倍された前記第1のハイバンドのエネルギー値に対応する、請求項28に記載の装置。
  30. 前記第3の値を生成することは、前記オーディオ信号に対応するスペクトル歪みにさらに基づく、請求項25に記載の装置。
  31. 前記第3の値を生成することは、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づく、請求項25に記載の装置。
  32. 混合係数の第1の値および前記混合係数の第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成するための手段、ここにおいて、前記第1の値は、オーディオエンコーダで受け取られるオーディオ信号の第1の部分に対応し、ここにおいて、前記第2の値は前記オーディオ信号の第2の部分に対応する、と、
    変調されたノイズとローバンド励振信号の変換されたバージョンとを結合することによって前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成するための手段、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、を備え、と、
    ここにおいて、前記生成するための手段は、前記第3の値に基づいて、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンとを結合するように構成される、
    装置。
  33. 前記第1の値に適用される第1の重みおよび前記第2の値に適用される第2の重みは、前記オーディオ信号のハイバンドのエネルギー変動に基づいて決定される、請求項32に記載の装置。
  34. 前記第3の値は、前記オーディオ信号に対応するスペクトル歪みにさらに基づいて生成される、請求項32に記載の装置。
  35. 前記第3の値は、前記オーディオ信号に対応するコーディングタイプの指示にさらに基づいて生成される、請求項32に記載の装置。
  36. コンピュータによって実行されるとき、前記コンピュータに、
    混合係数の第1の値を受け取らせ、前記第1の値は、オーディオエンコーダで受け取られたオーディオ信号の第1の部分に対応する、
    前記混合係数の第2の値を受け取らせ、前記第2の値は、前記オーディオ信号の第2の部分に対応する、
    前記第1の値および前記第2の値に少なくとも部分的に基づいて前記混合係数の第3の値を生成させ、
    前記混合係数の前記第3の値に基づいて励振信号を変調されたノイズと混合させる、命令を備える非一時的コンピュータ可読媒体。
  37. 前記コンピュータによって実行されるとき、前記コンピュータに前記オーディオ信号のハイバンド部分に対応するハイバンド励振信号を生成させる命令をさらに備え、ここにおいて、前記ハイバンド励振信号は、前記変調されたノイズと前記励振信号とを結合することに基づいて生成され、ここにおいて、前記励振信号はローバンド励振信号の変換されたバージョンに対応し、前記ローバンド励振信号は前記オーディオ信号のローバンド部分に対応する、請求項36に記載のコンピュータ可読媒体。
  38. 前記ハイバンド励振信号は、前記変調されたノイズと前記ローバンド励振信号の前記変換されたバージョンの加重和を備える、請求項37に記載のコンピュータ可読媒体。
  39. 前記第1の値は、前記オーディオ信号の第1のサブフレームのローバンド部分に基づいて生成され、ここにおいて、前記第2の値は、前記オーディオ信号の第2のサブフレームのローバンド部分に基づいて生成される、請求項36に記載のコンピュータ可読媒体。
  40. オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するように構成された分析フィルタと、
    前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するように構成された量子化器と、
    前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整するように構成されたゲイン回路と、
    を備える装置。
  41. スペクトル歪み計算器は、前記第1のセットと前記第2のセットの間の前記差に対応するスペクトル歪みを推定するように構成される、請求項40に記載の装置。
  42. 前記スペクトル歪み計算器は、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の平均2乗誤差に従って前記スペクトル歪みを決定するように構成される、請求項41に記載の装置。
  43. 前記スペクトル歪み計算器は、前記スペクトル周波数値の第1のセット内の値と比較した前記スペクトル周波数値の第2のセット内の値の間の差の絶対値に従って前記スペクトル歪みを決定するように構成される、請求項41に記載の装置。
  44. オーディオ信号に対応するスペクトル周波数値の第1のセットを決定するための手段と、
    前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを生成するための手段と、
    前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整するための手段と、
    を備える装置。
  45. 前記スペクトル周波数値の第1のセットは線スペクトル周波数(LSF)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLSF値を備える、請求項44に記載の装置。
  46. 前記スペクトル周波数値の第1のセットは線形予測係数(LPC)値を備え、前記スペクトル周波数値の第2のセットは量子化されたLPC値を備える、請求項44に記載の装置。
  47. 前記スペクトル周波数値の第1のセットに基づいてコードブックを検索することによって前記スペクトル周波数値の第2のセットを決定するための手段をさらに備える、請求項44に記載の装置。
  48. コンピュータによって実行されるとき、前記コンピュータに、
    オーディオ信号に対応するスペクトル周波数値の第1のセットを決定させ、
    前記スペクトル周波数値の第1のセットの近似値を求めるスペクトル周波数値の第2のセットを決定させ、
    前記第1のセットと前記第2のセットの間の差に基づいて前記オーディオ信号の少なくとも一部分に対応するゲイン値を調整させる、
    命令を備える、非一時的コンピュータ可読媒体。
  49. 前記ゲイン値は前記オーディオ信号のフレームのフレームゲインに対応し、ここにおいて、前記コンピュータに前記ゲイン値を調整させる前記命令は、前記コンピュータに、
    前記スペクトル周波数値の第1のセットと前記スペクトル周波数値の第2のセットの間のスペクトル歪みを決定させ、
    前記スペクトル歪みに基づいてゲイン係数を決定させ、
    前記ゲイン係数を前記フレームゲインに適用することによって前記フレームゲインを調整させる、
    命令を備える、請求項48に記載のコンピュータ可読媒体。
JP2019105468A 2013-02-08 2019-06-05 ノイズ変調とゲイン調整とを実行するシステムおよび方法 Active JP6752936B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361762810P 2013-02-08 2013-02-08
US61/762,810 2013-02-08
US14/012,749 US9601125B2 (en) 2013-02-08 2013-08-28 Systems and methods of performing noise modulation and gain adjustment
US14/012,749 2013-08-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018005516A Division JP6538209B2 (ja) 2013-02-08 2018-01-17 ノイズ変調とゲイン調整とを実行するシステムおよび方法

Publications (2)

Publication Number Publication Date
JP2019191597A true JP2019191597A (ja) 2019-10-31
JP6752936B2 JP6752936B2 (ja) 2020-09-09

Family

ID=51298067

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2015556931A Withdrawn JP2016507783A (ja) 2013-02-08 2013-08-29 ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2018005516A Active JP6538209B2 (ja) 2013-02-08 2018-01-17 ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2019105468A Active JP6752936B2 (ja) 2013-02-08 2019-06-05 ノイズ変調とゲイン調整とを実行するシステムおよび方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2015556931A Withdrawn JP2016507783A (ja) 2013-02-08 2013-08-29 ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP2018005516A Active JP6538209B2 (ja) 2013-02-08 2018-01-17 ノイズ変調とゲイン調整とを実行するシステムおよび方法

Country Status (23)

Country Link
US (2) US9601125B2 (ja)
EP (2) EP3174051B1 (ja)
JP (3) JP2016507783A (ja)
KR (2) KR102447846B1 (ja)
CN (2) CN104956438B (ja)
AU (1) AU2013377891B2 (ja)
BR (1) BR112015019042B1 (ja)
CA (2) CA2896965C (ja)
DK (2) DK3174051T3 (ja)
ES (2) ES2715476T3 (ja)
HK (1) HK1211374A1 (ja)
HU (2) HUE041373T2 (ja)
IL (1) IL239749A (ja)
MX (1) MX2015010225A (ja)
MY (1) MY170595A (ja)
PH (1) PH12015501671B1 (ja)
PL (1) PL3174051T3 (ja)
PT (1) PT3174051T (ja)
RU (1) RU2647666C2 (ja)
SG (1) SG11201505147PA (ja)
SI (1) SI3174051T1 (ja)
UA (2) UA123364C2 (ja)
WO (1) WO2014123585A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
EP3382703A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
JP2024511636A (ja) * 2021-03-31 2024-03-14 ヒョンダイ モーター カンパニー インター予測にディープラーニングベースのインループフィルタを用いるビデオコーディング方法及び装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
ES2249985B1 (es) 2004-06-25 2007-06-16 Universidad De Sevilla Molienda mecanica de polvos activada por radiacion ultravioleta.
JP4977472B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 スケーラブル復号化装置
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101180676B (zh) * 2005-04-01 2011-12-14 高通股份有限公司 用于谱包络表示的向量量化的方法和设备
JP5129117B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US9454974B2 (en) 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
JP5266341B2 (ja) * 2008-03-03 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9601125B2 (en) 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment

Also Published As

Publication number Publication date
MY170595A (en) 2019-08-19
CN110136742B (zh) 2023-05-26
EP3174051A1 (en) 2017-05-31
RU2647666C2 (ru) 2018-03-16
CA3058998C (en) 2021-06-29
EP3174051B1 (en) 2018-12-12
US9899032B2 (en) 2018-02-20
HK1211374A1 (en) 2016-05-20
KR102447846B1 (ko) 2022-09-26
HUE031761T2 (en) 2017-07-28
DK2954525T3 (en) 2017-04-10
PH12015501671A1 (en) 2015-10-19
ES2715476T3 (es) 2019-06-04
SG11201505147PA (en) 2015-08-28
CA3058998A1 (en) 2014-08-14
PL3174051T3 (pl) 2019-05-31
CN104956438A (zh) 2015-09-30
IL239749A0 (en) 2015-08-31
WO2014123585A1 (en) 2014-08-14
JP6538209B2 (ja) 2019-07-03
UA117745C2 (uk) 2018-09-25
DK3174051T3 (en) 2019-03-18
KR20210034103A (ko) 2021-03-29
BR112015019042B1 (pt) 2022-03-15
KR102232095B1 (ko) 2021-03-24
US9601125B2 (en) 2017-03-21
JP6752936B2 (ja) 2020-09-09
CA2896965A1 (en) 2014-08-14
UA123364C2 (uk) 2021-03-24
PT3174051T (pt) 2019-03-25
SI3174051T1 (sl) 2019-04-30
AU2013377891B2 (en) 2018-11-08
RU2015138115A (ru) 2017-03-15
CN110136742A (zh) 2019-08-16
JP2016507783A (ja) 2016-03-10
MX2015010225A (es) 2015-11-25
KR20150115843A (ko) 2015-10-14
IL239749A (en) 2017-04-30
HUE041373T2 (hu) 2019-05-28
EP2954525A1 (en) 2015-12-16
AU2013377891A1 (en) 2015-07-23
JP2018109770A (ja) 2018-07-12
ES2625042T3 (es) 2017-07-18
US20140229172A1 (en) 2014-08-14
EP2954525B1 (en) 2017-02-08
PH12015501671B1 (en) 2015-10-19
US20170148460A1 (en) 2017-05-25
CN104956438B (zh) 2019-06-14
CA2896965C (en) 2020-11-10
BR112015019042A2 (pt) 2017-07-18

Similar Documents

Publication Publication Date Title
JP6752936B2 (ja) ノイズ変調とゲイン調整とを実行するシステムおよび方法
JP6345780B2 (ja) ハイバンドコーディングにおける選択的位相補償
US10410652B2 (en) Estimation of mixing factors to generate high-band excitation signal
JP6262337B2 (ja) ハイバンド時間的特性の改善された追跡のための利得形状推定
JP2016541032A5 (ja)
JP2016541032A (ja) ハイバンド信号モデリング

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190701

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200721

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200819

R150 Certificate of patent or registration of utility model

Ref document number: 6752936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250