JP2016539355A - ハイバンド時間的特性の改善された追跡のための利得形状推定 - Google Patents

ハイバンド時間的特性の改善された追跡のための利得形状推定 Download PDF

Info

Publication number
JP2016539355A
JP2016539355A JP2016521700A JP2016521700A JP2016539355A JP 2016539355 A JP2016539355 A JP 2016539355A JP 2016521700 A JP2016521700 A JP 2016521700A JP 2016521700 A JP2016521700 A JP 2016521700A JP 2016539355 A JP2016539355 A JP 2016539355A
Authority
JP
Japan
Prior art keywords
signal
highband
gain shape
subframes
shape parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016521700A
Other languages
English (en)
Other versions
JP2016539355A5 (ja
JP6262337B2 (ja
Inventor
チェビーヤム、ベンカタ・スブラーマンヤム・チャンドラ・セカー
アッティ、ベンカトラマン・エス.
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2016539355A publication Critical patent/JP2016539355A/ja
Publication of JP2016539355A5 publication Critical patent/JP2016539355A5/ja
Application granted granted Critical
Publication of JP6262337B2 publication Critical patent/JP6262337B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

方法は、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを発話符号器において決定することを含む。この方法は、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定することをさらに含む。この方法は、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、第1の利得パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入することをさらに含む。

Description

優先権の主張
[0001]本出願は、2013年10月10日に出願された「GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH−BAND TEMPORAL CHARACTERISTICS」という名称の米国特許仮出願第61/889,434号および2014年10月7日に出願された「GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH−BAND TEMPORAL CHARACTERISTICS」という名称の米国非仮特許出願第14/508,486号からの優先権を主張し、それらの内容は、全体が参照により組み込まれる。
[0002]本開示は、一般に、信号処理に関する。
[0003]技術の進歩は、より小さくより強力なコンピューティングデバイスをもたらした。たとえば、現在、小さく、軽く、およびユーザによって容易に運ばれるポータブルワイヤレス電話、携帯情報端末(PDA)、およびページングデバイスなどのワイアレスコンピューティングデバイスを含む様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー式電話およびインターネットプロトコル(IP)電話などのポータブルワイヤレス電話は、ワイヤレスネットワークを介して音声およびデータパケットを通信することができる。さらに、多くのそのようなワイヤレス電話は、そこに組み込まれている他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤをさらに含むことができる。
[0004]従来の電話システム(たとえば公衆交換電話網(PSTN))では、信号帯域幅は、300ヘルツ(Hz)から3.4キロヘルツ(kHz)の周波数範囲に制限されている。セルラー式テレフォニーおよびボイスオーバインターネットプロトコル(VoIP)などの広帯域(WB)適用例では、信号帯域幅は50Hzから7kHzの周波数範囲にわたることがある。超広帯域(SWB)コーディング技法は、約16kHzまで延びる帯域幅をサポートする。3.4kHzの狭帯域テレフォニーから16kHzのSWBテレフォニーの信号帯域幅まで拡張することにより、信号再構成、了解度、および自然度の品質を改善することができる。
[0005]SWBコーディング技法は、一般に、信号のより低い周波数部分(たとえば、50Hzから7kHz、「ローバンド」とも呼ばれる)の符号化および送信を含む。たとえば、ローバンドは、フィルタパラメータおよび/またはローバンド励振信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分(たとえば、7kHzから16kHz、「ハイバンド」とも呼ばれる)が、完全には符号化および送信されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用することができる。いくつかの実施態様では、ハイバンドに関連するデータが、予測を支援するために受信機に供給され得る。そのようなデータは、「サイド情報」と呼ばれることがあり、利得情報、線スペクトル周波数(LSF、線スペクトル対(LSP)とも呼ばれる)などを含むことができる。ローバンド信号の属性が、サイド情報を生成するために使用され得るが、しかしながら、ローバンドとハイバンドとの間のエネルギー不均衡が、ハイバンドの特性を不正確に表すサイド情報をもたらすことがある。
[0006]ハイバンド時間的特性の改善された追跡のために二段階利得形状推定を行うためのシステムおよび方法が開示される。発話符号器は、復号器において音声信号のハイバンド部分を再構成するのに使用される情報(たとえば、サイド情報)を生成するために音声信号のローバンド部分(たとえば、高調波的に拡張されたローバンド励振(harmonically extended low-band excitation))を利用することができる。第1の利得形状推定器は、高調波的に拡張されたローバンド励振に存在しないハイバンド残差信号のエネルギー変動を決定することができる。たとえば、利得形状推定器は、高調波的に拡張されたローバンド励振信号と比べてハイバンド残差信号においてシフトされているかまたは存在していないハイバンドの時間的変動または偏り(たとえば、エネルギーレベル)を推定することができる。第1の利得形状調整器(第1の利得形状パラメータに基づく)は、高調波的に拡張されたローバンド励振の時間的展開を、それがハイバンド残差の時間的包絡を精密に模倣するように調整することができる。合成ハイバンド信号は、調整済みおよび/または修正済みの高調波的に拡張されたローバンド励振に基づいて生成され得、第2の利得形状推定器は、合成ハイバンド信号と音声信号のハイバンド部分との間のエネルギー変動を第2の段階で決定することができる。合成ハイバンド信号は、第2の利得形状推定器からのデータ(たとえば、第2の利得形状パラメータ)に基づいて音声信号のハイバンド部分をモデル化するように調整され得る。第1の利得形状パラメータと第2の利得形状パラメータとは、音声信号のハイバンド部分を再構成するために他のサイド情報と一緒に復号器に送信され得る。
[0007]特定の態様では、方法は、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを発話符号器において決定することを含む。別の特定の態様では、第1の利得形状パラメータは、音声信号のハイバンド部分に関連するハイバンド残差信号の時間的展開に基づいて決定される。この方法は、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定することをさらに含む。この方法は、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入することをさらに含む。
[0008]別の特定の態様では、装置は、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを決定するように構成された第1の利得形状推定器を含む。この装置は、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定するように構成された第2の利得形状推定器をさらに含む。この装置は、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入するように構成されたマルチプレクサをさらに含む。
[0009]別の特定の態様では、非一時的コンピュータ可読媒体は、プロセッサによって実行されたとき、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータをプロセッサに決定させる命令を含む。命令は、さらに、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータをプロセッサに決定させるように実行可能である。命令は、さらに、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、プロセッサに第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入させるように実行可能である。
[0010]別の特定の態様では、装置は、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを決定するための手段を含む。この装置は、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定するための手段をさらに含む。この装置は、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入するための手段をさらに含む。
[0011]別の特定の態様では、方法は、発話符号器からの符号化音声信号を発話復号器において受信することを含む。符号化音声信号は、発話符号器において生成された1の高調波的に拡張された信号に基づくおよび/または発話符号器において生成されたハイバンド残差信号に基づく第1の利得形状パラメータを含む。符号化音声信号は、発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータをさらに含む。この方法は、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から音声信号を再生することをさらに含む。
[0012]別の特定の態様では、発話復号器は、発話符号器からの符号化音声信号を受信するように構成される。符号化音声信号は、発話符号器において生成された高調波的に拡張された信号に基づくおよび/または発話符号器において生成されたハイバンド残差信号に基づく第1の利得形状パラメータを含む。符号化音声信号は、発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータをさらに含む。発話復号器は、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から音声信号を再生するようにさらに構成される。
[0013]別の特定の態様では、装置は、発話符号器からの符号化音声信号を受信するための手段を含む。符号化音声信号は、発話符号器において生成された第1の高調波的に拡張された信号に基づくおよび/または発話符号器において生成されたハイバンド残差信号に基づく第1の利得形状パラメータを含む。符号化音声信号は、発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータをさらに含む。この装置は、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から音声信号を再生するための手段をさらに含む。
[0014]別の特定の態様では、非一時的コンピュータ可読媒体は、プロセッサによって実行されたとき、発話符号器からの符号化音声信号をプロセッサに受信させる命令を含む。符号化音声信号は、発話符号器において生成された第1の高調波的に拡張された信号に基づくおよび/または発話符号器において生成されたハイバンド残差信号に基づく第1の利得形状パラメータを含む。符号化音声信号は、発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータをさらに含む。命令は、さらに、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から音声信号をプロセッサに再生させるように実行可能である。
[0015]開示される実施形態のうちの少なくとも1つによって提供される特定の利点は、音声信号の高調波的に拡張されたローバンド励振と音声信号のハイバンド残差との間のエネルギー相関を改善することを含む。たとえば、高調波的に拡張されたローバンド励振は、ハイバンド残差信号の時間的特性を精密に模倣するために利得形状パラメータに基づいて調整され得る。本開示の他の態様、利点、および特徴は、以下のセクション、すなわち、図面の簡単な説明、発明を実施するための形態、および特許請求の範囲を含む明細書全体を検討した後、明らかになるであろう。
[0016]ハイバンド再構成のために2つの段階で利得形状パラメータを決定するように動作可能なシステムの特定の実施形態を示す図。 [0017]高調波的に拡張された信号および/またはハイバンド残差信号に基づいて第1の段階において利得形状パラメータを決定するように動作可能なシステムの特定の実施形態を示す図。 [0018]高調波的に拡張された信号とハイバンド残差信号との間のエネルギー不均衡に基づく利得形状パラメータを示すためのタイミング図。 [0019]合成ハイバンド信号と入力音声信号のハイバンド部分とに基づいて第2の段階において第2の利得形状パラメータを決定するように動作可能なシステムの特定の実施形態を示す図。 [0020]利得形状パラメータを使用して、音声信号を再生するように動作可能なシステムの特定の実施形態を示す図。 [0021]ハイバンド再構成のために利得推定を使用する方法の特定の実施形態を示す流れ図。 [0022]図1〜図6のシステムおよび方法による信号処理動作を行うように動作可能なワイヤレスデバイスのブロック図。
[0023]図1を参照すると、ハイバンド再構成のために2つの段階で利得形状パラメータを決定するように動作可能なシステムの特定の実施形態が示され、全体的に100と称される。特定の実施形態において、システム100は、符号化システムまたは装置(たとえば、ワイヤレス電話、コーダ/復号器(CODEC)、またはデジタルシグナルプロセッサ(DSP)における)に統合され得る。他の特定の実施形態では、システム100は、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに統合され得る。
[0024]次の説明では、図1のシステム100によって行われる様々な機能は、いくつかの構成要素またはモジュールによって行われるとして説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分割は、説明のためにすぎない。一代替実施形態では、代わりに、特定の構成要素またはモジュールによって行われる機能は、複数の構成要素またはモジュールの間で分割され得る。その上、一代替実施形態では、図1の2つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに統合され得る。図1に示された各構成要素またはモジュールは、ハードウェア(たとえば、フィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、DSP、コントローラなど)、ソフトウェア(たとえば、プロセッサによって実行可能な命令)、またはそれらの任意の組合せを使用して実装され得る。
[0025]システム100は、入力音声信号102を受信するように構成された分析フィルタバンク110を含む。たとえば、入力音声信号102は、マイクロホンまたは他の入力デバイスによって供給され得る。特定の実施形態では、入力音声信号102は発話を含むことができる。入力音声信号102は、ほぼ50Hzからほぼ16kHzの周波数範囲のデータを含むSWB信号であり得る。分析フィルタバンク110は、周波数に基づいて入力音声信号102を多数の部分にフィルタ処理することができる。たとえば、分析フィルタバンク110は、ローバンド信号122とハイバンド信号124とを生成することができる。ローバンド信号122とハイバンド信号124とは、等しいかまたは等しくない帯域幅を有することができ、重複することも重複しないこともある。一代替実施形態では、分析フィルタバンク110は、2つを超える出力を生成することができる。
[0026]図1の例では、ローバンド信号122とハイバンド信号124とは、重複しない周波数帯域を占有する。たとえば、ローバンド信号122とハイバンド信号124とは、それぞれ、50Hz〜7kHzと7kHz〜16kHzとの重複しない周波数帯域を占有することができる。一代替実施形態では、ローバンド信号122とハイバンド信号124とは、それぞれ、50Hz〜8kHzと8kHz〜16kHzとの重複しない周波数帯域を占有することができる。別の代替実施形態では、ローバンド信号122とハイバンド信号124とは、重複し(たとえば、それぞれ、50Hz〜8kHzと7kHz〜16kHz)、それは、分析フィルタバンク110のローパスフィルタとハイパスフィルタとが、円滑なロールオフを有することを可能にすることができ、それは、設計を簡単化し、ローパスフィルタとハイパスフィルタとのコストを低減することができる。ローバンド信号122とハイバンド信号124とを重複させると、受信機におけるローバンド信号とハイバンド信号との円滑な混合を可能にすることもでき、それにより、可聴アーチファクトが少なくなり得る。
[0027]図1の例はSWB信号の処理を示しているが、これは説明のためにすぎないことに留意されたい。一代替実施形態では、入力音声信号102は、ほぼ50Hzからほぼ8kHzの周波数範囲を有するWB信号であり得る。そのような実施形態では、ローバンド信号122は、たとえば、ほぼ50Hzからほぼ6.4kHzの周波数範囲に対応することができ、ハイバンド信号124は、ほぼ6.4kHzからほぼ8kHzの周波数範囲に対応することができる。
[0028]システム100は、ローバンド信号122を受信するように構成されたローバンド分析モジュール130を含むことができる。特定の実施形態では、ローバンド分析モジュール130は、コード励振線形予測(CELP)符号器の一実施形態を表すことがある。ローバンド分析モジュール130は、線形予測(LP)分析およびコーディングモジュール132と、線形予測係数(LPC)−LSP変換モジュール134と、量子化器136とを含むことができる。LSPは、LSFと呼ばれることもあり、2つの用語(LSPとLSF)は本明細書では交換可能に使用され得る。LP分析およびコーディングモジュール132は、ローバンド信号122のスペクトル包絡をLPCのセットとして符号化することができる。LPCは、音声の各フレーム(たとえば、16kHzのサンプリングレートにおける320サンプルに対応する20ミリ秒(ms)の音声)、音声の各サブフレーム(たとえば、5msの音声)、またはこれらの任意の組合せに対して生成され得る。各フレームまたはサブフレームに対して生成されるLPCの数は、行われるLP分析の「次数」によって決定され得る。特定の一実施形態では、LP分析およびコーディングモジュール132は、10次LP分析に対応する11個のLPCのセットを生成することができる。
[0029]LPC−LSP変換モジュール134は、LP分析およびコーディングモジュール132によって生成されたLPCのセットを、対応するLSPのセットに変換する(たとえば、1対1変換を使用して)ことができる。あるいは、LPCのセットは、PARCOR係数、ログ面積比値、イミタンススペクトル対(ISP)、またはイミタンススペクトル周波数(ISF)の対応するセットに1対1変換され得る。LPCのセットとLSPのセットとの間の変換は、誤差なしに可逆的であり得る。
[0030]量子化器136は、変換モジュール134によって生成されたLSPのセットを量子化することができる。たとえば、量子化器136は、多数のエントリ(たとえば、ベクトル)を含む多数のコードブックを含むことができ、またはそれらに結合され得る。LSPのセットを量子化するために、量子化器136は、LSPのセット「に最も近い」コードブックのエントリを識別する(たとえば、最小2乗または平均2乗誤差などの歪み尺度に基づいて)ことができる。量子化器136は、コードブック中の識別されたエントリの場所に対応するインデックス値または一連のインデックス値を出力することができる。したがって、量子化器136の出力は、ローバンドビットストリーム142に含まれるローバンドフィルタパラメータを表すことができる。
[0031]ローバンド分析モジュール130は、さらに、ローバンド励振信号144を生成することができる。たとえば、ローバンド励振信号144は、ローバンド分析モジュール130によって行われるLPプロセス中に生成されるLP残差信号を量子化することによって生成される符号化された信号であり得る。LP残差信号は予測誤差を表すことができる。
[0032]システム100は、分析フィルタバンク110からのハイバンド信号124とローバンド分析モジュール130からのローバンド励振信号144とを受信するように構成されたハイバンド分析モジュール150をさらに含むことができる。ハイバンド分析モジュール150は、ハイバンド信号124とローバンド励振信号144とに基づいてハイバンドサイド情報172を生成することができる。たとえば、ハイバンドサイド情報172は、本明細書でさらに説明されるように、ハイバンドLSPおよび/または利得情報(たとえば、少なくともローバンドエネルギーに対するハイバンドエネルギーの比に基づく)を含むことができる。特定の実施形態では、利得情報は、高調波的に拡張された信号および/またはハイバンド残差信号に基づく利得形状パラメータを含むことができる。高調波的に拡張された信号は、ハイバンド信号124とローバンド信号122との間の不十分な相関のためにハイバンド合成で使用するには不十分であることがある。たとえば、ハイバンド信号124のサブフレームは、モデル化されたハイバンド励振信号161において十分に模倣されていないエネルギーレベルの揺らぎを含むことがある。
[0033]ハイバンド分析モジュール150は、第1の利得形状推定器190を含むことができる。第1の利得形状推定器190は、ローバンド信号122に関連する第1の信号に基づいておよび/またはハイバンド信号124のハイバンド残差に基づいて第1の利得形状パラメータを決定することができる。本明細書で説明されるように、第1の信号は、ローバンド信号122の変換された(たとえば、非線形のまたは高調波的に拡張された)ローバンド励振であり得る。ハイバンドサイド情報172は、第1の利得形状パラメータを含むことができる。ハイバンド分析モジュール150は、高調波的に拡張されたローバンド励振を第1の利得形状パラメータに基づいて調整するように構成された第1の利得形状調整器192をさらに含むことができる。たとえば、第1の利得形状調整器192は、ハイバンド信号124の残差の対応するサブフレームのエネルギーレベルに近づくように高調波的に拡張されたローバンド励振の特定のサブフレームを拡大縮小することができる。
[0034]ハイバンド分析モジュール150は、ハイバンド励振発生器160をさらに含むことができる。ハイバンド励振発生器160は、ローバンド励振信号144のスペクトルをハイバンド周波数範囲(たとえば、7kHz〜16kHz)へと拡張することによって、ハイバンド励振信号161を生成することができる。例証すると、ハイバンド励振発生器160は、ハイバンド励振信号161を生成するために、調整済みの高調波的に拡張されたローバンド励振を雑音信号(たとえば、ローバンド信号122のゆっくり変化する時間的特性を模倣するローバンド励振信号144に対応する包絡に従って変調された白色雑音)と混合することができる。たとえば、混合は、次の式に従って行われ得る。
Figure 2016539355
[0035]調整済みの高調波的に拡張されたローバンド励振と変調された雑音とが混合される比は、受信機におけるハイバンド再構成品質に影響を与えることがある。有声発話信号では、混合は、調整済みの高調波的に拡張されたローバンド励振の方に偏らされ得る(たとえば、混合係数αは0.5から1.0の範囲にあり得る)。無声信号では、混合は、変調された雑音の方に偏らされ得る(たとえば、混合係数αは0.0から0.5の範囲にあり得る)。
[0036]図示のように、ハイバンド分析モジュール150は、LP分析およびコーディングモジュール152と、LPC−LSP変換モジュール154と、量子化器156とをさらに含むことができる。LP分析およびコーディングモジュール152、変換モジュール154、および量子化器156の各々は、ローバンド分析モジュール130の対応する構成要素に関して上記で説明されたように機能し得るが、比較的低解像度で(たとえば、各係数、LSPなどに対してより少ないビットを使用して)機能し得る。LP分析およびコーディングモジュール152は、変換モジュール154によってLSPに変換されコードブック163に基づいて量子化器156によって量子化されるLPCのセットを生成することができる。たとえば、LP分析およびコーディングモジュール152、変換モジュール154、および量子化器156は、ハイバンドサイド情報172に含まれるハイバンドフィルタ情報(たとえば、ハイバンドLSP)を決定するためにハイバンド信号124を使用することができる。
[0037]量子化器156は、変換モジュール154によって供給されるLSPなどのスペクトル周波数値のセットを量子化するように構成され得る。他の実施形態では、量子化器156は、LSFまたはLSPに加えて、またはその代わりに、1つまたは複数の他のタイプのスペクトル周波数値のセットを受け取り量子化することができる。たとえば、量子化器156は、LP分析およびコーディングモジュール152によって生成されたLPCのセットを受け取り量子化することができる。他の例は、量子化器156で受け取られ量子化され得るPARCOR係数、ログ面積比値、およびISFのセットを含む。量子化器156は、入力ベクトル(たとえば、ベクトル形式のスペクトル周波数値のセット)をコードブック163などの表またはコードブック中の対応するエントリへのインデックスとして符号化するベクトル量子化器を含むことができる。別の例として、量子化器156は、1つまたは複数のパラメータを決定するように構成することができ、疎な(sparse)コードブック実施形態などでは、入力ベクトルは、ストレージから取り出されるのではなく、これらのパラメータから復号器において動的に生成され得る。例証すると、疎なコードブックの例は、CELPなどのコーディング方式と、3GPP(登録商標)2(第3世代パートナーシップ2)EVRC(強化型可変速コーデック)などの業界標準に従ったコーデックとに適用され得る。別の実施形態では、ハイバンド分析モジュール150は、量子化器156を含むことができ、合成信号を生成する(たとえば、フィルタパラメータのセットに従って)ためにいくつかのコードブックベクトルを使用し、知覚的に重み付けされた領域などにおいてハイバンド信号124に最も良く一致する合成信号に関連するコードブックベクトルのうち1つを選択するように構成され得る。
[0038]特定の実施形態では、ハイバンドサイド情報172は、ハイバンドLSPならびにハイバンド利得パラメータを含むことができる。たとえば、ハイバンド励振信号161は、ハイバンドサイド情報172に含まれる追加の利得パラメータを決定するために使用され得る。ハイバンド分析モジュール150は、第2の利得形状推定器194と第2の利得形状調整器196とを含むことができる。線形予測係数合成演算が、合成ハイバンド信号を生成するためにハイバンド励振信号161に行われ得る。第2の利得形状推定器194は、合成ハイバンド信号とハイバンド信号124とに基づいて第2の利得形状パラメータを決定することができる。ハイバンドサイド情報172は、第2の利得形状パラメータを含むことができる。第2の利得形状調整器196は、第2の利得形状パラメータに基づいて合成ハイバンド信号を調整するように構成され得る。たとえば、第2の利得形状調整器196は、ハイバンド信号124の対応するサブフレームのエネルギーレベルに近づくように、合成ハイバンド信号の特定のサブフレームを拡大縮小することができる。
[0039]ローバンドビットストリーム142とハイバンドサイド情報172とは、出力ビットストリーム199を生成するためにマルチプレクサ(MUX)180によって多重化され得る。出力ビットストリーム199は、入力音声信号102に対応する符号化音声信号を表すことができる。たとえば、出力ビットストリーム199は、送信され(たとえば、有線チャネル、ワイヤレスチャネル、または光チャネルを介して)および/または記憶され得る。したがって、マルチプレクサ180は、入力音声信号102を再生している間のハイバンド励振利得調整を可能にするために、第1の利得形状推定器190によって決定された第1の利得形状パラメータと第2の利得形状推定器194によって決定された第2の利得形状パラメータとを出力ビットストリーム199に挿入することができる。受信機において、音声信号(たとえば、スピーカまたは他の出力デバイスに供給される入力音声信号102の再構成されたバージョン)を生成するために、逆演算がデマルチプレクサ(DEMUX)、ローバンド復号器、ハイバンド復号器、およびフィルタバンクによって行われ得る。ローバンドビットストリーム142を表すために使用されるビットの数は、ハイバンドサイド情報172を表すために使用されるビットの数よりも実質的に多くなり得る。したがって、出力ビットストリーム199中のビットの大部分が、ローバンドデータを表すことがある。ハイバンドサイド情報172は、信号モデルに従ってローバンドデータからハイバンド励振信号を再生するために受信機において使用され得る。たとえば、信号モデルは、ローバンドデータ(たとえば、ローバンド信号122)とハイバンドデータ(たとえば、ハイバンド信号124)との間の関係または相関の予測されるセットを表すことができる。したがって、異なる信号モデルが、異なる種類の音声データ(たとえば、発話、音楽など)に使用され得、使用中の特定の信号モデルは、符号化された音声データの通信の前に、送信機と受信機とによって取り決められ得る(または業界標準によって定義され得る)。信号モデルを使用して、送信機におけるハイバンド分析モジュール150は、出力ビットストリーム199からハイバンド信号124を再構成するために受信機における対応するハイバンド分析モジュールが信号モデルを使用することが可能であるように、ハイバンドサイド情報172を生成することを可能にすることができる。
[0040]システム100は、音声信号102の高調波的に拡張されたローバンド励振と入力音声信号102のハイバンド残差との間のフレームごとのエネルギー相関を改善する(たとえば、時間的展開を改善する)ことができる。たとえば、第1の利得段階の間、第1の利得形状推定器190と第1の利得形状調整器192とは、高調波的に拡張されたローバンド励振を第1の利得パラメータに基づいて調整することができる。高調波的に拡張されたローバンド励振は、フレーム単位でハイバンドの残差に近づくように調整され得る。高調波的に拡張されたローバンド励振を調整することにより、合成ドメインにおける利得形状推定が改善され、入力音声信号102のハイバンド再構成中の可聴アーチファクトが低減され得る。システム100は、ハイバンド信号124とハイバンド信号124の合成されたバージョンとの間のフレームごとのエネルギー相関を改善することもできる。たとえば、第2の利得段階の間、第2の利得形状推定器194と第2の利得形状調整器196とは、ハイバンド信号124の合成されたバージョンを第2の利得パラメータに基づいて調整することができる。ハイバンド信号124の合成されたバージョンは、フレーム単位でハイバンド信号124に近づくように調整され得る。第1および第2の利得形状パラメータは、入力音声信号102のハイバンド再構成中の可聴アーチファクトを低減するために復号器に送信され得る。
[0041]図2を参照すると、高調波的に拡張された信号および/またはハイバンド残差信号に基づいて第1の段階において利得形状パラメータを決定するように動作可能なシステム200の特定の実施形態が示される。システム200は、線形予測分析フィルタ204と、非線形励振発生器207と、フレーム識別モジュール214と、第1の利得形状推定器190と、第1の利得形状調整器192とを含む。
[0042]ハイバンド信号124は、線形予測分析フィルタ204に供給され得る。線形予測分析フィルタ204は、ハイバンド信号124(たとえば、入力音声信号102のハイバンド部分)に基づいてハイバンド残差信号224を生成するように構成され得る。たとえば、線形予測分析フィルタ204は、ハイバンド信号124のスペクトル包絡を、ハイバンド信号124の今後のサンプルを予測する(現在のサンプルに基づいて)ために使用されるLPCのセットとして符号化することができる。ハイバンド残差信号224は、フレーム識別モジュール214と第1の利得形状推定器190とに供給され得る。
[0043]フレーム識別モジュール214は、ハイバンド残差信号224の特定のフレームのコーディングモードを決定し、そのコーディングモードに基づいてコーディングモード表示信号216を生成するように構成され得る。たとえば、フレーム識別モジュール214は、ハイバンド残差信号224の特定のフレームが有声フレームであるかまたは無声フレームであるかを決定することができる。特定の実施形態では、有声フレームは第1のコーディングモード(たとえば、第1のメトリック)に対応することができ、無声フレームは第2のコーディングモード(たとえば、第2のメトリック)に対応することができる。
[0044]ローバンド励振信号144は、非線形励振発生器207に供給され得る。図1に関して説明されたように、ローバンド励振信号144は、ローバンド分析モジュール130を使用してローバンド信号122(たとえば、入力音声信号102のローバンド部分)から生成され得る。非線形励振発生器207は、ローバンド励振信号144に基づいて、高調波的に拡張された信号208を生成するように構成され得る。たとえば、非線形励振発生器207は、高調波的に拡張された信号208を生成するためにローバンド励振信号144のフレーム(またはサブフレーム)に絶対値演算または2乗演算を行うことができる。
[0045]例証すると、非線形励振発生器207は、ほぼ0kHzから16kHzに及ぶ16kHz信号(たとえば、ローバンド励振信号144の帯域幅のほぼ2倍の帯域幅を有する信号)を生成するためにローバンド励振信号144(たとえば、ほぼ0kHzから8kHzに及ぶ信号)をアップサンプリングし、続いて、アップサンプリングされた信号に非線形演算を行うことができる。16kHz信号のローバンド部分(たとえば、ほぼ0kHzから8kHzまで)は、ローバンド励振信号144と実質的に同様の高調波を有することがあり、16kHz信号のハイバンド部分(たとえば、ほぼ8kHzから16kHzまで)は、高調波が実質的にないことがある。非線形励振発生器207は、高調波的に拡張された信号208を生成するために16kHz信号のローバンド部分の「主要な」高調波を16kHz信号のハイバンド部分に拡張することができる。したがって、高調波的に拡張された信号208は、非線形演算(たとえば、2乗演算および/または絶対値演算)を使用して高調波をハイバンドに拡張しているローバンド励振信号144の高調波的に拡張されたバージョンであり得る。高調波的に拡張された信号208は、第1の利得形状推定器190と第1の利得形状調整器192とに供給され得る。
[0046]第1の利得形状推定器190はコーディングモード表示信号216を受信し、そのコーディングモードに基づいてサンプリングレートを決定することができる。たとえば、第1の利得形状推定器190は、第1の複数のサブフレームを生成するために高調波的に拡張された信号208の第1のフレームをサンプリングすることができ、第2の複数のサブフレームを生成するために同様の時間インスタンスでハイバンド残差信号224の第2のフレームをサンプリングすることができる。第1および第2の複数のサブフレームにおけるサブフレーム(たとえば、ベクトル次元)の数は、コーディングモードに基づくことができる。たとえば、第1の(および第2の)複数のサブフレームは、ハイバンド残差信号224の特定のフレームが有声フレームであるとコーディングモードが示しているという決定に応じて第1の数のサブフレームを含むことができる。特定の実施形態では、第1および第2の複数のサブフレームは、各々、ハイバンド残差信号224の特定のフレームが有声フレームであるという決定に応じて16個のサブフレームを含むことができる。代替として、第1の(および第2の)複数のサブフレームは、ハイバンド残差信号224の特定のフレームが有声フレームではないとコーディングモードが示しているという決定に応じて第1の数のサブフレームよりも少ない第2の数のサブフレームを含むことができる。たとえば、第1および第2の複数のサブフレームは、各々、ハイバンド残差信号224の特定のフレームが有声フレームではないとコーディングモードが示しているという決定に応じて8個のサブフレームを含むことができる。
[0047]第1の利得形状推定器190は、高調波的に拡張された信号208および/またはハイバンド残差信号224に基づいて第1の利得形状パラメータ242を決定するように構成され得る。第1の利得形状推定器190は、第1の複数のサブフレームの各サブフレームのエネルギーレベルを評価し、第2の複数のサブフレームの各対応するサブフレームのエネルギーレベルを評価することができる。たとえば、第1の利得形状パラメータ242は、ハイバンド残差信号224の対応するサブフレームよりも低いまたは高いエネルギーレベルを有する高調波的に拡張された信号208の特定のサブフレームを識別することができる。第1の利得形状推定器190は、さらに、コーディングモードに基づいて、高調波的に拡張された信号208の各特定のサブフレームに与えるべきエネルギーの拡大縮小の量を決定することができる。エネルギーの拡大縮小は、ハイバンド残差信号224の対応するサブフレームと比較して低いまたは高いエネルギーレベルを有する高調波的に拡張された信号208のサブフレームレベルで行われ得る。たとえば、コーディングモードが第1のメトリック(たとえば、有声フレーム)を有しているという決定に応じて、高調波的に拡張された信号208の特定のサブフレームは、(ΣRHB 2)/(ΣR’LB 2)倍に拡大され得るが、ここで、(ΣR’LB 2)は、高調波的に拡張された信号208の特定のサブフレームのエネルギーレベルに対応し、(ΣRHB 2)は、ハイバンド残差信号224の対応するサブフレームのエネルギーレベルに対応する。代替として、コーディングモードが第2のメトリック(たとえば、無声フレーム)を有しているという決定に応じて、高調波的に拡張された信号208の特定のサブフレームは、Σ[(RHB)*(R’LB)]/(ΣR’LB 2)倍に拡大され得る。第1の利得形状パラメータ242は、エネルギー拡大縮小を必要とする高調波的に拡張された信号208の各サブフレームを識別することができ、それぞれのサブフレームに対する計算されたエネルギー倍率を識別することができる。第1の利得形状パラメータ242は、第1の利得形状調整器192と、ハイバンドサイド情報172として図1のマルチプレクサ180とに供給され得る。
[0048]第1の利得形状調整器192は、調整済みの高調波的に拡張された信号244を生成するために第1の利得形状パラメータ242に基づいて高調波的に拡張された信号208を調整するように構成され得る。たとえば、第1の利得形状調整器192は、調整済みの高調波的に拡張された信号244を生成するために、計算されたエネルギー拡大縮小に従って高調波的に拡張された信号208の識別されたサブフレームを拡大縮小することができる。調整済みの高調波的に拡張された信号244は、包絡追跡器(envelope tracker)202と、拡大縮小演算を行うために第1の結合器254とに供給され得る。
[0049]包絡追跡器202は、調整済みの高調波的に拡張された信号244を受信し、調整済みの高調波的に拡張された信号244に対応するローバンド時間ドメイン包絡203を計算するように構成され得る。たとえば、包絡追跡器202は、2乗値のシーケンスを生じさせるために、調整済みの高調波的に拡張された信号244のフレームの各サンプルの2乗を計算するように構成され得る。包絡追跡器202は、2乗された値のシーケンスに一次無限インパルス応答(IIR)ローパスフィルタを適用することなどによって2乗値のシーケンスに対して円滑化演算を行うように構成され得る。包絡追跡器202は、ローバンド時間ドメイン包絡203を生じさせるために平方根関数を平滑化されたシーケンスの各サンプルに適用するように構成され得る。包絡追跡器202は、2乗演算の代わりに絶対演算を使用することもできる。ローバンド時間ドメイン包絡203は、雑音結合器240に供給され得る。
[0050]雑音結合器240は、変調された雑音信号220を生じさせるために白色雑音発生器(図示せず)によって生成された白色雑音205にローバンド時間ドメイン包絡203を組み合わせるように構成され得る。たとえば、雑音結合器240は、ローバンド時間ドメイン包絡203に従って白色雑音205を振幅変調するように構成され得る。特定の実施形態では、雑音結合器240は、変調された雑音信号220を生じさせるためにローバンド時間ドメイン包絡203に従って白色雑音205を拡大縮小するように構成された乗算器として実装され得る。変調された雑音信号220は、第2の結合器256に供給され得る。
[0051]第1の結合器254は、第1の拡大縮小された信号を生成するために、調整済みの高調波的に拡張された信号244を混合係数(α)に従って拡大縮小するように構成された乗算器として実装され得る。第2の結合器256は、第2の拡大縮小された信号を生成するために、変調された雑音信号220を混合係数(1−α)に基づいて拡大縮小するように構成された乗算器として実装され得る。たとえば、第2の結合器256は、1から混合係数を引いた差(たとえば、1−α)に基づいて、変調された雑音信号220を拡大縮小することができる。第1の拡大縮小された信号と第2の拡大縮小された信号とは、混合器211に供給され得る。
[0052]混合器211は、混合係数(α)と、調整済みの高調波的に拡張された信号244と、変調された雑音信号220とに基づいてハイバンド励振信号161を生成することができる。たとえば、混合器211は、ハイバンド励振信号161を生成するために第1の拡大縮小された信号と第2の拡大縮小された信号とを組み合わせることができる。
[0053]図2のシステム200は、高調波的に拡張された信号208とハイバンド残差信号224との間のエネルギーの時間的展開を改善することができる。たとえば、第1の利得形状推定器190と第1の利得形状調整器192とは、高調波的に拡張された信号208を第1の利得形状パラメータ242に基づいて調整することができる。高調波的に拡張された信号208は、サブフレーム単位でハイバンド残差信号224のエネルギーレベルに近づくように調整され得る。高調波的に拡張された信号208を調整することにより、図4に関して説明されるように、合成ドメインにおける可聴アーチファクトが低減され得る。システム200は、ピッチ変動性に基づいて利得形状パラメータ242を修正するためにコーディングモードに基づいてサブフレームの数を動的に調整することもできる。たとえば、比較的少数の利得形状パラメータ242(たとえば、比較的少数のサブフレーム)は、フレーム内の時間的展開において比較的低い変動性を有する無声フレームに関して生成され得る。代替として、比較的多数の利得形状パラメータ242は、フレーム内の時間的展開において比較的高い変動性を有する有声フレームに関して生成され得る。一代替実施形態では、高調波的に拡張されたローバンドの時間的展開を調整するように選択されたサブフレームの数は、無声フレームならびに有声フレームの両方に対して同じであり得る。
[0054]図3を参照すると、高調波的に拡張された信号とハイバンド残差信号との間のエネルギー不均衡に基づく利得形状パラメータを示すためのタイミング図300が示されている。タイミング図300は、ハイバンド残差信号224の第1のトレースと、高調波的に拡張された信号208の第2のトレースと、推定された利得形状パラメータ242の第3のトレースとを含む。
[0055]タイミング図300は、ハイバンド残差信号224の特定のフレームと、高調波的に拡張された信号208の対応するフレームとを示している。タイミング図300は、第1のタイミング窓302と、第2のタイミング窓304と、第3のタイミング窓306と、第4のタイミング窓308と、第5のタイミング窓310と、第6のタイミング窓312と、第7のタイミング窓314とを含む。各タイミング窓302〜314は、それぞれの信号224、208のサブフレームを表すことができる。7つのタイミング窓が示されているが、他の実施形態では、追加の(またはより少ない)タイミング窓が存在することがある。たとえば、特定の実施形態では、信号224、208は、それぞれ、4個と少ないタイミング窓または16個と多いタイミング窓(すなわち、4個のサブフレームまたは16個のサブフレーム)を含むことがある。タイミング窓の数は、図2に関して説明されたようにコーディングモードに基づくことができる。
[0056]第1のタイミング窓302におけるハイバンド残差信号224のエネルギーレベルは、第1のタイミング窓302における対応する高調波的に拡張された信号208のエネルギーレベルとほぼ同じであり得る。たとえば、第1の利得形状推定器190は、ハイバンド残差信号224のエネルギーレベルを第1のタイミング窓302で測定し、高調波的に拡張された信号208のエネルギーレベルを第1のタイミング窓302で測定し、差を閾値と比較することができる。差が閾値未満である場合、ハイバンド残差信号224のエネルギーレベルは、高調波的に拡張された信号208のエネルギーレベルとほぼ同じであり得る。したがって、この場合、第1のタイミング窓302の第1の利得形状パラメータ242は、高調波的に拡張された信号208の対応するサブフレームでエネルギー拡大縮小が必要とされないことを示すことができる。第3のタイミング窓306および第4のタイミング窓308のハイバンド残差信号224のエネルギーレベルは、やはり、第3のタイミング窓306および第4のタイミング窓308の対応する高調波的に拡張された信号208のエネルギーレベルとほぼ同じであり得る。したがって、第3のタイミング窓306および第4のタイミング窓308の第1の利得形状パラメータ242は、やはり、高調波的に拡張された信号208の対応するサブフレームでエネルギー拡大縮小が必要とされないことがあることを示すことができる。
[0057]第2のタイミング窓304および第5のタイミング窓310におけるハイバンド残差信号224のエネルギーレベルは揺らぐことがあり、第2のタイミング窓304および第5のタイミング窓310における高調波的に拡張された信号208の対応するエネルギーレベルは、ハイバンド残差信号224の揺らぎを正確に反映しないことがある。図1〜図2の第1の利得形状推定器190は、高調波的に拡張された信号208を調整するために第2のタイミング窓304および第5のタイミング窓310において利得形状パラメータ242を生成することができる。たとえば、第1の利得形状推定器190は、第2のタイミング窓304および第5のタイミング窓310(たとえば、第2のサブフレームおよび第5のサブフレーム)において高調波的に拡張された信号208を「拡大縮小する」ように第1の利得形状調整器192に指示することができる。高調波的に拡張された信号208が調整される量は、ハイバンド残差信号224のコーディングモードに基づくことができる。たとえば、フレームが有声フレームであることをコーディングモードが示している場合、高調波的に拡張された信号208は、(ΣRHB 2)/(ΣR’LB 2)倍に調整され得る。代替として、フレームが無声フレームであることをコーディングモードが示している場合、高調波的に拡張された信号208は、Σ[(RHB)*(R’LB)]/(ΣR’LB 2)倍に調整され得る。
[0058]第6のタイミング窓312および第7のタイミング窓314のハイバンド残差信号224のエネルギーレベルは、第6のタイミング窓312および第7のタイミング窓314の対応する高調波的に拡張された信号208のエネルギーレベルとほぼ同じであり得る。したがって、第6のタイミング窓312および第7のタイミング窓314の第1の利得形状パラメータ242は、高調波的に拡張された信号208の対応するサブフレームでエネルギー拡大縮小が必要とされないことを示すことができる。
[0059]図3に関して説明されたように第1の利得形状パラメータ242を生成すると、高調波的に拡張された信号208とハイバンド残差信号224との間のエネルギーの時間的展開が改善され得る。たとえば、ハイバンド残差信号224のエネルギー揺らぎは、高調波的に拡張された信号208においてそれを第1の利得形状パラメータ242に基づいて調整することによって償われ得る。高調波的に拡張された信号208を調整することにより、図4に関して説明されるように、合成ドメインにおける可聴アーチファクトは低減され得る。
[0060]図4を参照すると、合成ハイバンド信号と入力音声信号のハイバンド部分とに基づいて第2の段階において第2の利得形状パラメータを決定するように動作可能なシステム400の特定の実施形態が示されている。システム400は、線形予測(LP)合成器402と、第2の利得形状推定器194と、第2の利得形状調整器196と、利得フレーム推定器410とを含むことができる。
[0061]線形予測(LP)合成器402は、ハイバンド励振信号161を受信し、合成ハイバンド信号404を生成するためにハイバンド励振信号161に線形予測合成演算を行うように構成され得る。合成ハイバンド信号404は、第2の利得形状推定器194と第2の利得形状調整器196とに供給され得る。
[0062]第2の利得形状推定器194は、合成ハイバンド信号404とハイバンド信号124とに基づいて第2の利得形状パラメータ406を決定するように構成され得る。たとえば、第2の利得形状推定器194は、合成ハイバンド信号404の各サブフレームのエネルギーレベルを評価し、ハイバンド信号124の各対応するサブフレームのエネルギーレベルを評価することができる。たとえば、第2の利得形状パラメータ406は、ハイバンド信号124の対応するサブフレームよりも低いエネルギーレベルを有する合成ハイバンド信号404の特定のサブフレームを識別することができる。第2の利得形状パラメータ406は、合成ドメインにおいて決定され得る。たとえば、第2の利得形状パラメータ406は、合成信号(たとえば、合成ハイバンド信号404)を使用して、励振ドメインの励振信号(たとえば、高調波的に拡張された信号208)とは対照的に決定され得る。第2の利得形状パラメータ406は、第2の利得形状調整器196と、ハイバンドサイド情報172としてマルチプレクサ180とに供給され得る。
[0063]第2の利得形状調整器196は、第2の利得形状パラメータ406に基づいて、調整された合成ハイバンド信号418を生成するように構成され得る。たとえば、第2の利得形状調整器196は、調整された合成ハイバンド信号418を生成するために第2の利得形状パラメータ406に基づいて、合成ハイバンド信号404の特定のサブフレームを「拡大縮小する」ことができる。第2の利得形状調整器196は、図1〜図2の第1の利得形状調整器192が、第1の利得形状パラメータ242に基づいて、高調波的に拡張された信号208の特定のサブフレームを調整するのと同様の方法で、合成ハイバンド信号404のサブフレームを「拡大縮小する」ことができる。調整された合成ハイバンド信号418は、利得フレーム推定器410に供給され得る。
[0064]利得フレーム推定器410は、調整された合成ハイバンド信号404とハイバンド信号124とに基づいて利得フレームパラメータ412を生成することができる。利得フレームパラメータ412は、ハイバンドサイド情報172としてマルチプレクサ180に供給され得る。
[0065]図4のシステム400は、合成ハイバンド信号404のエネルギーレベルとハイバンド信号124の対応するエネルギーレベルとに基づいて第2の利得形状パラメータ406を生成することによって図1の入力音声信号102のハイバンド再構成を改善することができる。第2の利得形状パラメータ406は、入力音声信号102のハイバンド再構成中の可聴アーチファクトを低減することができる。
[0066]図5を参照すると、利得形状パラメータを使用して音声信号を再生するように動作可能なシステム500の特定の実施形態が示されている。システム500は、非線形励振発生器507と、第1の利得形状調整器592と、ハイバンド励振発生器520と、線形予測(LP)合成器522と、第2の利得形状調整器526とを含む。特定の実施形態において、システム500は、復号化システムまたは装置(たとえば、ワイヤレス電話、CODEC、またはDSPにおける)に統合され得る。他の特定の実施形態では、システム500は、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに統合され得る。
[0067]非線形励振発生器507は、図1のローバンド励振信号144を受信するように構成され得る。たとえば、図1のローバンドビットストリーム142は、ローバンド励振信号144を表すデータを含むことができ、ビットストリーム199としてシステム500に送信され得る。非線形励振発生器507は、ローバンド励振信号144に基づいて、第2の高調波的に拡張された信号508を生成するように構成され得る。たとえば、非線形励振発生器507は、第2の高調波的に拡張された信号508を生成するためにローバンド励振信号144のフレーム(またはサブフレーム)に絶対値演算または2乗演算を行うことができる。特定の実施形態では、非線形励振発生器507は、図2の非線形励振発生器207と実質的に同様の方法で動作することができる。第2の高調波的に拡張された信号508は、第1の利得形状調整器592に供給され得る。
[0068]図2の第1の利得形状パラメータ242などの第1の利得形状パラメータが、さらに、第1の利得形状調整器592に供給され得る。たとえば、図1のハイバンドサイド情報172は、第1の利得形状パラメータ242を表すデータを含むことができ、システム500に送信され得る。第1の利得形状調整器592は、第2の調整済みの高調波的に拡張された信号544を生成するために第1の利得形状パラメータ242に基づいて第2の高調波的に拡張された信号508を調整するように構成され得る。特定の実施形態では、第1の利得形状調整器592は、図1〜図2の第1の利得形状調整器192と実質的に同様の方法で動作することができる。第2の調整済みの高調波的に拡張された信号544は、ハイバンド励振発生器520に供給され得る。
[0069]ハイバンド励振発生器520は、第2の調整済みの高調波的に拡張された信号544に基づいて第2のハイバンド励振信号561を生成することができる。たとえば、ハイバンド励振発生器520は、包絡追跡器と、雑音結合器と、第1の結合器と、第2の結合器と、混合器とを含むことができる。特定の実施形態では、ハイバンド励振発生器520の構成要素は、図2の包絡追跡器202、図2の雑音結合器240、図2の第1の結合器254、図2の第2の結合器256、および図2の混合器211と実質的に同様の方法で動作することができる。第2のハイバンド励振信号561は、線形予測合成器522に供給され得る。
[0070]線形予測合成器522は、第2のハイバンド励振信号561を受信し、第2の合成ハイバンド信号524を生成するために第2のハイバンド励振信号561に線形予測合成演算を行うように構成され得る。特定の実施形態では、線形予測合成器522は、図4の線形予測合成器402と実質的に同様の方法で動作することができる。第2の合成ハイバンド信号524は、第2の利得形状調整器526に供給され得る。
[0071]図4の第2の利得形状パラメータ406などの第2の利得形状パラメータは、第2の利得形状調整器526にも供給され得る。たとえば、図1のハイバンドサイド情報172は、第2の利得形状パラメータ406を表すデータを含むことができ、システム500に送信され得る。第2の利得形状調整器526は、第2の調整された合成ハイバンド信号528を生成するために第2の利得形状パラメータ406に基づいて第2の合成ハイバンド信号524を調整するように構成され得る。特定の実施形態では、第2の利得形状調整器526は、図1および図4の第2の利得形状調整器196と実質的に同様の方法で動作することができる。特定の実施形態では、第2の調整された合成ハイバンド信号528は、図1のハイバンド信号124の再生されたバージョンであり得る。
[0072]図5のシステム500は、ハイバンド励振信号144と、第1の利得形状パラメータ242と、第2の利得形状パラメータ406とを使用してハイバンド信号124を再生することができる。利得形状パラメータ242、406を使用することにより、発話符号器において検出されるエネルギーの時間的展開に基づいて第2の高調波的に拡張された信号508と第2の合成ハイバンド信号524とを調整することによって再生の精度が改善され得る。
[0073]図6を参照すると、ハイバンド再構成のために利得推定を使用する方法600、610の特定の実施形態の流れ図が示されている。第1の方法600は、図1〜図2のシステム100〜200および図4のシステム400によって行われ得る。第2の方法610は、図5のシステム500によって行われ得る。
[0074]第1の方法600は、602において、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを発話符号器において決定することを含む。たとえば、図1の第1の利得形状推定器190は、高調波的に拡張された信号(たとえば、図2の高調波的に拡張された信号208)および/またはハイバンド信号124のハイバンド残差に基づいて第1の利得形状パラメータ(たとえば、図2の第1の利得形状パラメータ242)を決定することができる。
[0075]方法600は、604において、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定することをさらに含むことができる。たとえば、第2の利得形状推定器194は、合成ハイバンド信号404とハイバンド信号124とに基づいて第2の利得形状パラメータ406を決定することができる。
[0076]第1の利得形状パラメータと第2の利得形状パラメータとは、606において、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために音声信号の符号化バージョンに挿入され得る。たとえば、図1のハイバンドサイド情報172は、第1の利得形状パラメータ242と第2の利得形状パラメータ406とを含むことができる。マルチプレクサ180は、第1の利得形状パラメータ242と第2の利得形状パラメータ406とをビットストリーム199に挿入することができ、ビットストリーム199は、復号器(たとえば、図5のシステム500)に送信され得る。図5の第1の利得形状調整器592は、第2の調整済みの高調波的に拡張された信号544を生成するために第1の利得形状パラメータ242に基づいて高調波的に拡張された信号508を調整することができる。第2のハイバンド励振信号561は、第2の調整済みの高調波的に拡張された信号544に少なくとも部分的に基づく。追加として、図5の第2の利得形状調整器526は、ハイバンド信号124のバージョンを再生するために第2の利得形状パラメータ406に基づいて合成ハイバンド信号524を調整することができる。
[0077]第2の方法610は、612において、発話符号器からの符号化音声信号を発話復号器において受信することを含むことができる。符号化音声信号は、発話符号器において生成された高調波的に拡張された信号208および/または発話符号器において生成されたハイバンド残差信号224に基づく第1の利得形状パラメータ242を含むことができる。符号化音声信号は、合成ハイバンド信号404とハイバンド信号124とに基づく第2の利得形状パラメータ406をさらに含むことができる。
[0078]音声信号は、614において、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から再生され得る。たとえば、図5の第1の利得形状調整器592は、第2の調整済みの高調波的に拡張された信号544を生成するために第1の利得形状パラメータ242に基づいて高調波的に拡張された信号508を調整することができる。図5のハイバンド励振発生器520は、第2の調整済みの高調波的に拡張された信号544に基づいて第2のハイバンド励振信号561を生成することができる。線形予測合成器522は、第2の合成ハイバンド信号524を生成するために第2のハイバンド励振信号561に線形予測合成演算を行うことができ、第2の利得形状調整器526は、第2の調整された合成ハイバンド信号528(たとえば、再生された音声信号)を生成するために第2の利得形状パラメータ406に基づいて第2の合成ハイバンド信号524を調整することができる。
[0079]図6の方法600、610は、音声信号102の高調波的に拡張されたローバンド励振と入力音声信号102のハイバンド残差との間のサブフレームごとのエネルギー相関を改善する(たとえば、時間的展開を改善する)ことができる。たとえば、第1の利得段階の間、第1の利得形状推定器190と第1の利得形状調整器192とは、高調波的に拡張されたローバンド励振をハイバンドの残差に基づいてモデル化するために高調波的に拡張されたローバンド励振を第1の利得パラメータに基づいて調整することができる。方法600、610は、ハイバンド信号124とハイバンド信号124の合成されたバージョンとの間のサブフレームごとのエネルギー相関を改善することもできる。たとえば、第2の利得段階の間、第2の利得形状推定器194と第2の利得形状調整器196とは、ハイバンド信号124の合成されたバージョンをハイバンド信号124に基づいてモデル化するためにハイバンド信号124の合成されたバージョンを第2の利得パラメータに基づいて調整することができる。
[0080]特定の実施形態では、図6の方法600、610は、中央処理装置(CPU)、デジタル信号プロセッサ(DSP)、またはコントローラなどの処理ユニットのハードウェア(たとえば、FPGAデバイス、ASICなど)を介して、ファームウェアデバイスを介して、またはそれらの任意の組合せで実施され得る。一例として、図6の方法600、610は、図7に関して説明されるように、命令を実行するプロセッサによって行われ得る。
[0081]図7を参照すると、ワイヤレス通信デバイスの特定の例示的な実施形態のブロック図が示されており、全体的に700と称される。デバイス700は、メモリ732に結合されたプロセッサ710(たとえば、CPU)を含む。メモリ732は、図6の方法600、610などの本明細書で開示されている方法およびプロセスを行うためにプロセッサ710および/またはCODEC734で実行可能な命令760を含むことができる。
[0082]特定の実施形態では、CODEC734は、2段階利得推定システム782と2段階利得調整システム784とを含むことができる。特定の実施形態では、2段階利得推定システム782は、図1のシステム100の1つまたは複数の構成要素、図2のシステム200の1つまたは複数の構成要素、および/または図4のシステム400の1つまたは複数の構成要素を含む。たとえば、2段階利得推定システム782は、図2のシステム100〜200と、図4のシステム400と、図6の方法600とに関連する符号化演算を行うことができる。特定の実施形態では、2段階利得調整システム784は、図5のシステム500の1つまたは複数の構成要素を含むことができる。たとえば、2段階利得調整システム784は、図5のシステム500と図6の方法610とに関連する復号化演算を行うことができる2段階利得推定システム782および/または2段階利得調整システム784は、専用ハードウェア(たとえば、回路)を介して、1つまたは複数のタスクを行うための命令を実行するプロセッサによって、またはそれらの組合せで実装され得る。
[0083]一例として、メモリ732またはCODEC734のメモリ790は、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファMRAM(STT−MRAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、電気的消去可能プログラマブル読出し専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ(CD−ROM)などのメモリデバイスであり得る。メモリデバイスは、コンピュータ(たとえば、CODEC734のプロセッサ、および/またはプロセッサ710)によって実行されたとき、コンピュータに図6の方法600、610の一方の少なくとも一部分を行わせることができる命令(たとえば、命令760または命令795)を含むことができる。一例として、メモリ732またはCODEC734のメモリ790は、コンピュータ(たとえば、CODEC734のプロセッサ、および/またはプロセッサ710)によって実行されたとき、コンピュータが行う図6の方法600、610の一方の少なくとも一部分を行うを生じる命令(たとえば、それぞれ、命令760または命令795)を含む非一時的コンピュータ可読媒体であり得る。
[0084]デバイス700は、CODEC734とプロセッサ710とに結合されたDSP796をさらに含むことができる。特定の実施形態では、DSP796は、2段階利得推定システム797と2段階利得調整システム798とを含むことができる。2段階利得推定システム797は、図1のシステム100の1つまたは複数の構成要素、図2のシステム200の1つまたは複数の構成要素、および/または図4のシステム400の1つまたは複数の構成要素を含むことができる。たとえば、2段階利得推定システム797は、図2のシステム100〜200と、図4のシステム400と、図6の方法600とに関連する符号化演算を行うことができる。2段階利得調整システム798は、図5のシステム500の1つまたは複数の構成要素を含むことができる。たとえば、2段階利得調整システム798は、図5のシステム500と図6の方法610とに関連する復号化演算を行うことができる。2段階利得推定システム797および/または2段階利得調整システム798は、専用ハードウェア(たとえば、回路)を介して、1つまたは複数のタスクを行うための命令を実行するプロセッサによって、またはそれらの組合せで実装され得る。
[0085]図7は、さらに、プロセッサ710とディスプレイ728とに結合されるディスプレイコントローラ726を示している。CODEC734は、図示のように、プロセッサ710に結合され得る。スピーカ736とマイクロホン738とはCODEC734に結合され得る。たとえば、マイクロホン738は、図1の入力音声信号102を生成することができ、CODEC734は、入力音声信号102に基づいて、受信機への送信のための出力ビットストリーム199を生成することができる。別の例として、スピーカ736は、図1の出力ビットストリーム199からCODEC734によって再構成された信号を出力するために使用され得、出力ビットストリーム199は送信機から受信される。図7は、さらに、ワイヤレスコントローラ740がプロセッサ710とワイヤレスアンテナ742とに結合され得ることを示している。
[0086]特定の実施形態では、プロセッサ710、ディスプレイコントローラ726、メモリ732、CODEC734、DSP796、およびワイヤレスコントローラ740は、システムインパッケージまたはシステムオンチップデバイス(たとえば、移動局モデム(MSM))722に含まれる。特定の実施形態では、タッチスクリーンおよび/またはキーパッドなどの入力デバイス730と、電源744とが、システムオンチップデバイス722に結合される。その上、特定の実施形態では、図7に示されるように、ディスプレイ728、入力デバイス730、スピーカ736、マイクロホン738、アンテナ742、および電源744は、システムオンチップデバイス722の外部にある。しかしながら、ディスプレイ728、入力デバイス730、スピーカ736、マイクロホン738、アンテナ742、および電源744の各々は、インターフェースまたはコントローラなどのシステムオンチップデバイス722の構成要素に結合され得る。
[0087]説明された実施形態に関連して、高調波的に拡張された信号に基づいておよび/または音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて第1の利得形状パラメータを決定するための手段を含む第1の装置が開示される。たとえば、第1の利得形状パラメータを決定するための手段は、図1〜図2の第1の利得形状推定器190、図2のフレーム識別モジュール214、図7の2段階利得推定システム782、図7の2段階利得推定システム797、第1の利得形状パラメータを決定するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含むことができる。
[0088]第1の装置は、合成ハイバンド信号に基づいておよび音声信号のハイバンド部分に基づいて第2の利得形状パラメータを決定するための手段をさらに含むことができる。たとえば、第2の利得形状パラメータを決定するための手段は、図1および図4の第2の利得形状推定器194、図7の2段階利得推定システム782、図7の2段階利得推定システム797、第2の利得パラメータを決定するように構成された1つまたは複数のデバイス、(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含むことができる。
[0089]第1の装置は、音声信号の符号化バージョンから音声信号を再生している間の利得調整を可能にするために、第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入するための手段をさらに含むことができる。たとえば、第1の利得形状パラメータと第2の利得形状パラメータとを音声信号の符号化バージョンに挿入するための手段は、図1のマルチプレクサ180、図7の2段階利得推定システム782、図7の2段階利得推定システム797、第1の利得パラメータを音声信号の符号化バージョンに挿入するように構成された1つまたは複数のデバイス、(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含むことができる。
[0090]説明された実施形態に関連して、発話符号器からの符号化音声信号を受信するための手段を含む第2の装置が開示される。符号化音声信号は、発話符号器において生成された第1の高調波的に拡張された信号に基づくおよび発話符号器において生成されたハイバンド残差信号に基づく第1の利得形状パラメータを含む。符号化音声信号は、発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータをさらに含む。たとえば、符号化音声信号を受信するための手段は、図5の非線形励振発生器507、図5の第1の利得形状推定器592、図5の第2の利得形状推定器526、図7の2段階利得調整システム784、図7の2段階利得調整システム798、受信、符号化音声信号を決定するように構成された1つまたは複数のデバイス、(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含むことができる。
[0091]第2の装置は、第1の利得形状パラメータに基づいておよび第2の利得形状パラメータに基づいて符号化音声信号から音声信号を再生するための手段をさらに含むことができる。たとえば、音声信号を再生するための手段は、図5の非線形励振発生器507、図5の第1の利得形状推定器592、図5のハイバンド励振発生器520、図5の線形予測係数合成器522、図5の第2の利得形状推定器526、図7の2段階利得調整システム784、図7の2段階利得調整システム798、音声信号を再生するように構成された1つまたは複数のデバイス、(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、またはそれらの任意の組合せを含むことができる。
[0092]本明細書で開示される実施形態に関して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、またはハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実施され得ることを当業者はさらに正しく理解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップは、機能に関して上記で一般的に説明されている。そのような機能が、ハードウェアとして実装されるか、または実行可能なソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約によって決まる。当業者は、説明された機能を特定の適用例ごとに様々な方法で実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0093]本明細書で開示される実施形態に関して説明された方法またはアルゴリズムのステップは、ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、またはこれら2つの組合せで直接具現され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファMRAM(STT−MRAM)、フラッシュメモリ、読出し専用メモリ(ROM)、プログラマブル読出し専用メモリ(PROM)、消去可能プログラマブル読出し専用メモリ(EPROM)、電気的消去可能プログラマブル読出し専用メモリ(EEPROM)、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ(CD−ROM)などのメモリデバイスに存在することができる。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み出し、メモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替として、メモリデバイスはプロセッサに一体化され得る。プロセッサおよび記憶媒体はASICに存在することができる。ASICは、コンピューティングデバイスまたはユーザ端末に存在することができる。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末に個別の構成要素として存在することができる。
[0094]開示された実施形態の先の説明は、開示された実施形態を当業者が製作または使用することができるように行われている。これらの実施形態への様々な変更は当業者には容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示された実施形態に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴に一致する可能な最も広い範囲が与えられるべきである。
[0094]開示された実施形態の先の説明は、開示された実施形態を当業者が製作または使用することができるように行われている。これらの実施形態への様々な変更は当業者には容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示された実施形態に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴に一致する可能な最も広い範囲が与えられるべきである。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
高調波的に拡張された信号に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて、またはそれらの任意の組合せで第1の利得形状パラメータを発話符号器において決定することと、
合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定することと、
前記音声信号の符号化バージョンから前記音声信号を再生している間の利得調整を可能にするために、前記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の前記符号化バージョンに挿入することとを備える方法。
[C2]
前記第1の利得形状パラメータが線形予測残差ドメインにおいて決定される、C1に記載の方法。
[C3]
前記第2の利得形状パラメータが線形予測合成ドメインにおいて決定される、C1に記載の方法。
[C4]
前記高調波的に拡張された信号が、非線形高調波拡張により前記音声信号のローバンド部分から生成される、C1に記載の方法。
[C5]
修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整することと、
ハイバンド励振信号を生成することと、ここにおいて、前記ハイバンド励振信号が、前記修正済みの高調波的に拡張された信号に少なくとも部分的に基づく、をさらに備える、C1に記載の方法。
[C6]
第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングすることと、
第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングすることと、
前記第1の複数のサブフレームのエネルギーレベルに基づいて、前記第2の複数のサブフレームのエネルギーレベルに基づいて、またはそれらの任意の組合せで前記第1の利得形状パラメータを生成することとをさらに備える、C5に記載の方法。
[C7]
前記高調波的に拡張された信号を調整することが、前記第2の複数のサブフレームの対応するサブフレームのエネルギーレベルに近づくように前記第1の複数のサブフレームの特定のサブフレームを拡大縮小することを備える、C6に記載の方法。
[C8]
前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、C6に記載の方法。
[C9]
前記第1の複数のサブフレームと前記第2の複数のサブフレームとが、有声フレームと無声フレームの両方について同数のサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、ローバンドコアサンプルレートが12.8キロヘルツ(kHz)である場合、4つのサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、前記ローバンドコアサンプルレートが16kHzである場合、5つのサブフレームを含む、C6に記載の方法。
[C10]
合成ハイバンド信号を生成するために、前記ハイバンド励振信号に線形予測合成演算を行うことと、
前記合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定することと、
前記第2の利得形状パラメータを前記音声信号の前記符号化バージョンに挿入することとをさらに備える、C5に記載の方法。
[C11]
前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整することをさらに備える、C10に記載の方法。
[C12]
高調波的に拡張された信号に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて、またはそれらの任意の組合せで第1の利得形状パラメータを決定するように構成された第1の利得形状推定器と、
合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定するように構成された第2の利得形状推定器と、
前記音声信号の符号化バージョンから前記音声信号を再生している間の利得調整を可能にするために、前記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の前記符号化バージョンに挿入するように構成された回路とを備える装置。
[C13]
前記第1の利得形状パラメータが線形予測残差ドメインにおいて決定される、C12に記載の装置。
[C14]
前記回路がマルチプレクサを含む、C12に記載の装置。
[C15]
前記高調波的に拡張された信号が、非線形高調波拡張により前記音声信号のローバンド部分から生成される、C12に記載の装置。
[C16]
修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器をさらに備える、C12に記載の装置。
[C17]
前記第1の利得形状推定器が、
第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングし、
第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングし、
前記第1の複数のサブフレームのエネルギーレベルに基づいて、前記第2の複数のサブフレームのエネルギーレベルに基づいて、またはそれらの任意の組合せで前記第1の利得形状パラメータを生成するようにさらに構成される、C16に記載の装置。
[C18]
前記第2の複数のサブフレームの対応するサブフレームのエネルギーレベルに近づくように前記第1の複数のサブフレームの特定のサブフレームを拡大縮小することによって前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器をさらに備える、C17に記載の装置。
[C19]
前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、C17に記載の装置。
[C20]
前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて16個のサブフレームを含む、C17に記載の装置。
[C21]
前記合成ハイバンド信号を生成するためにハイバンド励振信号に線形予測合成演算を行うように構成された線形予測合成器をさらに備える、C16に記載の装置。
[C22]
前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整するように構成された第2の利得形状調整器をさらに備える、C12に記載の装置。
[C23]
発話符号器からの符号化音声信号を発話復号器において受信することと、
ここにおいて、前記符号化音声信号が、
前記発話符号器において生成された第1の高調波的に拡張された信号に基づく、前記発話符号器において生成されたハイバンド残差信号に基づく、またはそれらの任意の組合せによる第1の利得形状パラメータと、
前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータとを含む、
前記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することとを備える方法。
[C24]
前記発話復号器において前記音声信号を再生することが、
前記符号化音声信号のローバンド励振を非直線的に拡張することに基づいて第2の高調波的に拡張された信号を生成することと、
第2の修正済みの高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整することとを備える、C23に記載の方法。
[C25]
前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成することをさらに備える、C24に記載の方法。
[C26]
第2の合成ハイバンド信号を生成するために、前記第2のハイバンド励振信号に線形予測合成演算を行うことをさらに備える、C25に記載の方法。
[C27]
前記第2の利得形状パラメータに基づいて前記第2の合成ハイバンド信号を調整することをさらに備える、C26に記載の方法。
[C28]
発話符号器からの符号化音声信号を受信することと、ここにおいて、前記符号化音声信号が、
前記発話符号器において生成された第1の高調波的に拡張された信号に基づく、前記発話符号器において生成されたハイバンド残差信号に基づく、またはそれらの任意の組合せによる第1の利得形状パラメータと、
前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータとを備える、
前記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することとを行うように構成された発話復号器。
[C29]
前記符号化音声信号のローバンド励振に基づいて第2の高調波的に拡張された信号を生成するように構成された非線形励振発生器と、
第2の修正済みの高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整するように構成された第1の利得形状調整器とを備える、C28に記載の発話復号器。
[C30]
前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成するように構成されたハイバンド励振発生器をさらに備える、C29に記載の発話復号器。

Claims (30)

  1. 高調波的に拡張された信号に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて、またはそれらの任意の組合せで第1の利得形状パラメータを発話符号器において決定することと、
    合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定することと、
    前記音声信号の符号化バージョンから前記音声信号を再生している間の利得調整を可能にするために、前記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の前記符号化バージョンに挿入することと
    を備える方法。
  2. 前記第1の利得形状パラメータが線形予測残差ドメインにおいて決定される、請求項1に記載の方法。
  3. 前記第2の利得形状パラメータが線形予測合成ドメインにおいて決定される、請求項1に記載の方法。
  4. 前記高調波的に拡張された信号が、非線形高調波拡張により前記音声信号のローバンド部分から生成される、請求項1に記載の方法。
  5. 修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整することと、
    ハイバンド励振信号を生成することと、ここにおいて、前記ハイバンド励振信号が、前記修正済みの高調波的に拡張された信号に少なくとも部分的に基づく、
    をさらに備える、請求項1に記載の方法。
  6. 第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングすることと、
    第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングすることと、
    前記第1の複数のサブフレームのエネルギーレベルに基づいて、前記第2の複数のサブフレームのエネルギーレベルに基づいて、またはそれらの任意の組合せで前記第1の利得形状パラメータを生成することと
    をさらに備える、請求項5に記載の方法。
  7. 前記高調波的に拡張された信号を調整することが、前記第2の複数のサブフレームの対応するサブフレームのエネルギーレベルに近づくように前記第1の複数のサブフレームの特定のサブフレームを拡大縮小することを備える、請求項6に記載の方法。
  8. 前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第2の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、請求項6に記載の方法。
  9. 前記第1の複数のサブフレームと前記第2の複数のサブフレームとが、有声フレームと無声フレームの両方について同数のサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、ローバンドコアサンプルレートが12.8キロヘルツ(kHz)である場合、4つのサブフレームを含み、前記第1の複数のサブフレームおよび前記第2の複数のサブフレームは、前記ローバンドコアサンプルレートが16kHzである場合、5つのサブフレームを含む、請求項6に記載の方法。
  10. 合成ハイバンド信号を生成するために、前記ハイバンド励振信号に線形予測合成演算を行うことと、
    前記合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定することと、
    前記第2の利得形状パラメータを前記音声信号の前記符号化バージョンに挿入することと
    をさらに備える、請求項5に記載の方法。
  11. 前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整することをさらに備える、請求項10に記載の方法。
  12. 高調波的に拡張された信号に基づいて、音声信号のハイバンド部分に関連するハイバンド残差信号に基づいて、またはそれらの任意の組合せで第1の利得形状パラメータを決定するように構成された第1の利得形状推定器と、
    合成ハイバンド信号に基づいておよび前記音声信号の前記ハイバンド部分に基づいて第2の利得形状パラメータを決定するように構成された第2の利得形状推定器と、
    前記音声信号の符号化バージョンから前記音声信号を再生している間の利得調整を可能にするために、前記第1の利得形状パラメータと前記第2の利得形状パラメータとを前記音声信号の前記符号化バージョンに挿入するように構成された回路と
    を備える装置。
  13. 前記第1の利得形状パラメータが線形予測残差ドメインにおいて決定される、請求項12に記載の装置。
  14. 前記回路がマルチプレクサを含む、請求項12に記載の装置。
  15. 前記高調波的に拡張された信号が、非線形高調波拡張により前記音声信号のローバンド部分から生成される、請求項12に記載の装置。
  16. 修正済みの高調波的に拡張された信号を生成するために前記第1の利得形状パラメータに基づいて前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器をさらに備える、請求項12に記載の装置。
  17. 前記第1の利得形状推定器が、
    第1の複数のサブフレームを生成するために前記高調波的に拡張された信号のローバンドフレームをサンプリングし、
    第2の複数のサブフレームを生成するために前記ハイバンド残差信号の対応するハイバンドフレームをサンプリングし、
    前記第1の複数のサブフレームのエネルギーレベルに基づいて、前記第2の複数のサブフレームのエネルギーレベルに基づいて、またはそれらの任意の組合せで前記第1の利得形状パラメータを生成する
    ようにさらに構成される、請求項16に記載の装置。
  18. 前記第2の複数のサブフレームの対応するサブフレームのエネルギーレベルに近づくように前記第1の複数のサブフレームの特定のサブフレームを拡大縮小することによって前記高調波的に拡張された信号を調整するように構成された第1の利得形状調整器をさらに備える、請求項17に記載の装置。
  19. 前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて第1の数のサブフレームを含み、前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームではないという決定に応じて前記第1の数のサブフレームよりも少ない第2の数のサブフレームを含む、請求項17に記載の装置。
  20. 前記第1の複数のサブフレームは、前記ハイバンドフレームが有声フレームであるという決定に応じて16個のサブフレームを含む、請求項17に記載の装置。
  21. 前記合成ハイバンド信号を生成するためにハイバンド励振信号に線形予測合成演算を行うように構成された線形予測合成器をさらに備える、請求項16に記載の装置。
  22. 前記第2の利得形状パラメータに基づいて前記合成ハイバンド信号を調整するように構成された第2の利得形状調整器をさらに備える、請求項12に記載の装置。
  23. 発話符号器からの符号化音声信号を発話復号器において受信することと、
    ここにおいて、前記符号化音声信号が、
    前記発話符号器において生成された第1の高調波的に拡張された信号に基づく、前記発話符号器において生成されたハイバンド残差信号に基づく、またはそれらの任意の組合せによる第1の利得形状パラメータと、
    前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータと
    を含む、
    前記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することと
    を備える方法。
  24. 前記発話復号器において前記音声信号を再生することが、
    前記符号化音声信号のローバンド励振を非直線的に拡張することに基づいて第2の高調波的に拡張された信号を生成することと、
    第2の修正済みの高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整することと
    を備える、請求項23に記載の方法。
  25. 前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成することをさらに備える、請求項24に記載の方法。
  26. 第2の合成ハイバンド信号を生成するために、前記第2のハイバンド励振信号に線形予測合成演算を行うことをさらに備える、請求項25に記載の方法。
  27. 前記第2の利得形状パラメータに基づいて前記第2の合成ハイバンド信号を調整することをさらに備える、請求項26に記載の方法。
  28. 発話符号器からの符号化音声信号を受信することと、ここにおいて、前記符号化音声信号が、
    前記発話符号器において生成された第1の高調波的に拡張された信号に基づく、前記発話符号器において生成されたハイバンド残差信号に基づく、またはそれらの任意の組合せによる第1の利得形状パラメータと、
    前記発話符号器において生成された第1の合成ハイバンド信号に基づくおよび音声信号のハイバンドに基づく第2の利得形状パラメータと
    を備える、
    前記第1の利得形状パラメータに基づいておよび前記第2の利得形状パラメータに基づいて前記符号化音声信号から前記音声信号を再生することと
    を行うように構成された発話復号器。
  29. 前記符号化音声信号のローバンド励振に基づいて第2の高調波的に拡張された信号を生成するように構成された非線形励振発生器と、
    第2の修正済みの高調波的に拡張された信号を得るために前記第1の利得形状パラメータに基づいて前記第2の高調波的に拡張された信号を調整するように構成された第1の利得形状調整器と
    を備える、請求項28に記載の発話復号器。
  30. 前記修正済みの第2の高調波的に拡張された信号に基づいて第2のハイバンド励振信号を生成するように構成されたハイバンド励振発生器をさらに備える、請求項29に記載の発話復号器。
JP2016521700A 2013-10-10 2014-10-08 ハイバンド時間的特性の改善された追跡のための利得形状推定 Active JP6262337B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361889434P 2013-10-10 2013-10-10
US61/889,434 2013-10-10
US14/508,486 2014-10-07
US14/508,486 US9620134B2 (en) 2013-10-10 2014-10-07 Gain shape estimation for improved tracking of high-band temporal characteristics
PCT/US2014/059753 WO2015054421A1 (en) 2013-10-10 2014-10-08 Gain shape estimation for improved tracking of high-band temporal characteristics

Publications (3)

Publication Number Publication Date
JP2016539355A true JP2016539355A (ja) 2016-12-15
JP2016539355A5 JP2016539355A5 (ja) 2017-07-13
JP6262337B2 JP6262337B2 (ja) 2018-01-17

Family

ID=52810401

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016521700A Active JP6262337B2 (ja) 2013-10-10 2014-10-08 ハイバンド時間的特性の改善された追跡のための利得形状推定

Country Status (22)

Country Link
US (1) US9620134B2 (ja)
EP (1) EP3055860B1 (ja)
JP (1) JP6262337B2 (ja)
KR (1) KR101828193B1 (ja)
CN (1) CN105593933B (ja)
AU (1) AU2014331903B2 (ja)
BR (1) BR112016007914B1 (ja)
CA (1) CA2925572C (ja)
CL (1) CL2016000819A1 (ja)
DK (1) DK3055860T3 (ja)
ES (1) ES2774334T3 (ja)
HK (1) HK1219344A1 (ja)
HU (1) HUE047305T2 (ja)
MX (1) MX350816B (ja)
MY (1) MY183940A (ja)
NZ (1) NZ717833A (ja)
PH (1) PH12016500470B1 (ja)
RU (1) RU2648570C2 (ja)
SA (1) SA516370898B1 (ja)
SI (1) SI3055860T1 (ja)
TW (1) TWI604440B (ja)
WO (1) WO2015054421A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) * 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2006130221A1 (en) * 2005-04-01 2006-12-07 Qualcomm Incorporated Systems, methods, and apparatus for highband excitation generation
US20060282262A1 (en) * 2005-04-22 2006-12-14 Vos Koen B Systems, methods, and apparatus for gain factor attenuation
WO2013061530A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
WO2001059766A1 (en) 2000-02-11 2001-08-16 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
WO2002023536A2 (en) 2000-09-15 2002-03-21 Conexant Systems, Inc. Formant emphasis in celp speech coding
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6993207B1 (en) 2001-10-05 2006-01-31 Micron Technology, Inc. Method and apparatus for electronic image processing
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101180676B (zh) * 2005-04-01 2011-12-14 高通股份有限公司 用于谱包络表示的向量量化的方法和设备
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
EP2096631A4 (en) 2006-12-13 2012-07-25 Panasonic Corp TONE DECODING DEVICE AND POWER ADJUSTMENT METHOD
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
EP2502229B1 (en) 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
WO2012158157A1 (en) 2011-05-16 2012-11-22 Google Inc. Method for super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2006130221A1 (en) * 2005-04-01 2006-12-07 Qualcomm Incorporated Systems, methods, and apparatus for highband excitation generation
US20060282262A1 (en) * 2005-04-22 2006-12-14 Vos Koen B Systems, methods, and apparatus for gain factor attenuation
WO2013061530A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法

Also Published As

Publication number Publication date
BR112016007914B1 (pt) 2021-12-21
KR20160067207A (ko) 2016-06-13
MY183940A (en) 2021-03-17
SI3055860T1 (sl) 2020-03-31
JP6262337B2 (ja) 2018-01-17
EP3055860A1 (en) 2016-08-17
EP3055860B1 (en) 2019-11-20
DK3055860T3 (da) 2020-02-03
ES2774334T3 (es) 2020-07-20
PH12016500470A1 (en) 2016-05-16
SA516370898B1 (ar) 2019-01-03
MX2016004528A (es) 2016-07-22
RU2016113271A (ru) 2017-11-15
CA2925572A1 (en) 2015-04-16
RU2648570C2 (ru) 2018-03-26
TWI604440B (zh) 2017-11-01
CN105593933A (zh) 2016-05-18
HK1219344A1 (zh) 2017-03-31
PH12016500470B1 (en) 2016-05-16
NZ717833A (en) 2019-01-25
US9620134B2 (en) 2017-04-11
AU2014331903B2 (en) 2018-03-01
CN105593933B (zh) 2019-10-15
MX350816B (es) 2017-09-25
WO2015054421A1 (en) 2015-04-16
CL2016000819A1 (es) 2016-10-14
KR101828193B1 (ko) 2018-02-09
HUE047305T2 (hu) 2020-04-28
CA2925572C (en) 2019-05-21
TW201521020A (zh) 2015-06-01
US20150106102A1 (en) 2015-04-16
BR112016007914A2 (pt) 2017-08-01

Similar Documents

Publication Publication Date Title
JP6262337B2 (ja) ハイバンド時間的特性の改善された追跡のための利得形状推定
JP6345780B2 (ja) ハイバンドコーディングにおける選択的位相補償
AU2019203827B2 (en) Estimation of mixing factors to generate high-band excitation signal
JP6752936B2 (ja) ノイズ変調とゲイン調整とを実行するシステムおよび方法
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
JP6045762B2 (ja) スケーリングされた高帯域励磁を使用する音声信号の帯域幅拡張のための方法、装置、デバイス、コンピュータ可読媒体
EP3248192A1 (en) Scaling for gain shape circuitry
US20150149157A1 (en) Frequency domain gain shape estimation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170526

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170526

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20170526

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20170714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171025

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171213

R150 Certificate of patent or registration of utility model

Ref document number: 6262337

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250