JP2016541032A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016541032A5 JP2016541032A5 JP2016558544A JP2016558544A JP2016541032A5 JP 2016541032 A5 JP2016541032 A5 JP 2016541032A5 JP 2016558544 A JP2016558544 A JP 2016558544A JP 2016558544 A JP2016558544 A JP 2016558544A JP 2016541032 A5 JP2016541032 A5 JP 2016541032A5
- Authority
- JP
- Japan
- Prior art keywords
- group
- signal
- subband
- adjustment parameter
- subbands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005284 excitation Effects 0.000 claims description 136
- 230000005236 sound signal Effects 0.000 claims description 69
- 230000000875 corresponding Effects 0.000 claims description 49
- 230000000051 modifying Effects 0.000 claims description 32
- 238000001914 filtration Methods 0.000 claims description 15
- 238000000034 method Methods 0.000 claims description 12
- 230000003044 adaptive Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 description 67
- 230000001131 transforming Effects 0.000 description 24
- 239000000203 mixture Substances 0.000 description 20
- 230000003595 spectral Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- 230000002194 synthesizing Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000001702 transmitter Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000001413 cellular Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000004301 light adaptation Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 230000003287 optical Effects 0.000 description 1
- 230000002441 reversible Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Description
優先権の主張
[0001]本出願は、その内容全体が参照により組み込まれる、両方とも「HIGH−BAND SIGNAL MODELING」と題する、2014年12月12日に出願された米国特許出願第14/568,359号および2013年12月16日に出願された米国仮特許出願第61/916,697号の優先権を主張する。
[0001]本出願は、その内容全体が参照により組み込まれる、両方とも「HIGH−BAND SIGNAL MODELING」と題する、2014年12月12日に出願された米国特許出願第14/568,359号および2013年12月16日に出願された米国仮特許出願第61/916,697号の優先権を主張する。
[0002]本開示は、一般に信号処理に関する。
[0003]技術の進歩は、より小さく、より強力なコンピューティングデバイスをもたらした。たとえば、現在、小型で、軽量で、ユーザによって容易に持ち運ばれるポータブルワイヤレス電話、携帯情報端末(PDA)、およびページングデバイスなどのワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー電話およびインターネットプロトコル(IP)電話などのポータブルワイヤレス電話は、ワイヤレスネットワークを介して音声およびデータパケットを通信することができる。さらに、多くのそのようなワイヤレス電話は、その中に組み込まれる他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤをも含むことができる。
[0004]旧来の電話システム(たとえば、公衆交換電話網(PSTN))では、信号帯域幅が、300ヘルツ(Hz)〜3.4キロヘルツ(kHz)の周波数範囲に限定される。セルラーテレフォニーおよびボイスオーバーインターネットプロトコル(VoIP)など、広帯域(WB)適用例では、信号帯域幅が、50Hz〜7kHzの周波数範囲にわたり得る。超広帯域(SWB)コーディング技術は、最大約16kHzに及ぶ帯域をサポートする。3.4kHzの狭帯域テレフォニーから16kHzのSWBテレフォニーの信号帯域幅まで拡張することにより、信号再構成、了解度、および自然度の品質を改善し得る。
[0005]SWBコーディング技法は、通常、信号の低周波数部分(たとえば、50Hz〜7kHz、「ローバンド」とも呼ばれる)を符号化および送信することを含む。たとえば、ローバンドは、フィルタパラメータおよび/またはローバンド励振信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分(たとえば、7kHz〜16kHz、「ハイバンド」とも呼ばれる)が、完全には符号化および送信されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用し得る。いくつかの実施態様では、ハイバンドに関連するデータは、予測を支援するために受信機に提供され得る。そのようなデータは、「サイド情報」と呼ばれることがあり、利得情報、線スペクトル周波数(LSF、線スペクトル対(LSP)とも呼ばれる)などを含み得る。ローバンド信号の属性は、サイド情報を生成するために使用され得るが、しかしながら、ローバンドとハイバンドとの間のエネルギー不均衡が、ハイバンドの特性を不正確に特徴づけるサイド情報をもたらすことがある。
[0006]ハイバンド信号モデリングを実施するためのシステムおよび方法が開示される。第1のフィルタ(たとえば、直交ミラーフィルタ(QMF)バンクまたは擬似QMFバンク)は、オーディオ信号を、オーディオ信号のローバンド部分に対応するサブバンドの第1のグループと、オーディオ信号のハイバンド部分に対応するサブバンドの第2のグループとの中にフィルタ処理し得る。オーディオ信号のローバンド部分に対応するサブバンドのグループと、オーディオ信号のハイバンド部分に対応するサブバンドのグループは、共通のサブバンドを有することも、有しないこともある。合成フィルタバンクは、サブバンドの第1のグループを結合してローバンド信号(たとえば、ローバンド残差信号)を生成し得、ローバンド信号はローバンドコーダに提供され得る。ローバンドコーダは、ローバンド励振信号を生成し得る線形予測コーダ(LPコーダ)を使用してローバンド信号を量子化し得る。非線形変換プロセスは、ローバンド励振信号に基づいて高調波拡張信号(a harmonically extended signal)を生成し得る。非線形励振信号の帯域幅は、オーディオ信号のよりローバンド部分よりも大きくなり、オーディオ信号全体の帯域幅程度に大きくさえもなり得る。たとえば、非線形変換生成器は、ローバンド励振信号をアップサンプリングし得、アップサンプリングされた信号を非線形関数を通して処理して、ローバンド励振信号の帯域幅よりも大きい帯域幅を有する高調波拡張信号を生成し得る。
[0007]特定の実施形態では、第2のフィルタは、高調波拡張信号を複数のサブバンドに分割し得る。この実施形態では、サブバンドの第2のグループ(たとえば、高調波拡張信号のハイバンドに対応するサブバンド)に対応するサブバンドの第3のグループを生成するために、高調波拡張信号の複数のサブバンドのうちの各サブバンドに被変調雑音が加算され得る。別の特定の実施形態では、第2のフィルタに提供されるべきであるハイバンド励振信号を生成するために、被変調雑音が高調波拡張信号と混合され得る。この実施形態では、第2のフィルタは、ハイバンド励振信号をサブバンドの第3のグループに分割し得る。
[0008]第1のパラメータ推定器は、サブバンドの第2のグループ中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータを決定し得る。たとえば、第1のパラメータ推定器は、サブバンドの第3のグループ中の第1のサブバンドと、オーディオ信号の対応するハイバンド部分との間のスペクトル関係および/または時間エンベロープ関係を決定し得る。同様にして、第2のパラメータ推定器は、サブバンドの第2のグループ中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定し得る。調整パラメータは、デコーダがオーディオ信号のハイバンド部分を再構成するのを支援するために、量子化され、他のサイド情報とともにデコーダに送信され得る。
[0009]特定の態様では、方法が、スピーチエンコーダにおいて、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することを含む。本方法はまた、サブバンドの第1のグループに基づいて高調波拡張信号を生成することを含む。本方法は、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することをさらに含む。サブバンドの第3のグループはサブバンドの第2のグループに対応する。本方法はまた、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することを含む。第1の調整パラメータはサブバンドの第2のグループ中の第1のサブバンドのメトリックに基づき、第2の調整パラメータはサブバンドの第2のグループ中の第2のサブバンドのメトリックに基づく。
[0010]別の特定の態様では、装置が、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するように構成された第1のフィルタを含む。本装置はまた、サブバンドの第1のグループに基づいて高調波拡張信号を生成するように構成された非線形変換生成器を含む。本装置は、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するように構成された第2のフィルタをさらに含む。サブバンドの第3のグループはサブバンドの第2のグループに対応する。本装置はまた、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するように構成されたパラメータ推定器を含む。第1の調整パラメータはサブバンドの第2のグループ中の第1のサブバンドのメトリックに基づき、第2の調整パラメータはサブバンドの第2のグループ中の第2のサブバンドのメトリックに基づく。
[0011]別の特定の態様では、非一時的コンピュータ可読媒体は、スピーチエンコーダにおけるプロセッサによって実行されたとき、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することをプロセッサに行わせる命令を含む。命令はまた、サブバンドの第1のグループに基づいて高調波拡張信号を生成することをプロセッサに行わせるように実行可能である。命令は、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することをプロセッサに行わせるようにさらに実行可能である。サブバンドの第3のグループはサブバンドの第2のグループに対応する。命令はまた、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することをプロセッサに行わせるように実行可能である。第1の調整パラメータはサブバンドの第2のグループ中の第1のサブバンドのメトリックに基づき、第2の調整パラメータはサブバンドの第2のグループ中の第2のサブバンドのメトリックに基づく。
[0012]別の特定の態様では、装置が、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するための手段を含む。本装置はまた、サブバンドの第1のグループに基づいて高調波拡張信号を生成するための手段を含む。本装置は、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するための手段をさらに含む。サブバンドの第3のグループはサブバンドの第2のグループに対応する。本装置はまた、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するための手段を含む。第1の調整パラメータはサブバンドの第2のグループ中の第1のサブバンドのメトリックに基づき、第2の調整パラメータはサブバンドの第2のグループ中の第2のサブバンドのメトリックに基づく。
[0013]別の特定の態様では、方法が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成されたローバンド励振信号に基づいてスピーチデコーダにおいて高調波拡張信号を生成することを含む。本方法は、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することをさらに含む。本方法はまた、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整することを含む。
[0014]別の特定の態様では、装置が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成されたローバンド励振信号に基づいて高調波拡張信号を生成するように構成された非線形変換生成器を含む。本装置は、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するように構成された第2のフィルタをさらに含む。本装置はまた、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整するように構成された調整器を含む。
[0015]別の特定の態様では、装置が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成されたローバンド励振信号に基づいて高調波拡張信号を生成するための手段を含む。本装置は、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するための手段をさらに含む。本装置はまた、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整するための手段を含む。
[0016]別の特定の態様では、非一時的コンピュータ可読媒体は、スピーチデコーダにおけるプロセッサによって実行されたとき、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成されたローバンド励振信号に基づいて高調波拡張信号を生成することをプロセッサに行わせる命令を含む。命令は、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することをプロセッサに行わせるようにさらに実行可能である。命令はまた、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整することをプロセッサに行わせるように実行可能である。
[0017]開示する実施形態のうちの少なくとも1つによって提供される特定の利点は、オーディオ信号のハイバンド部分の改善された分解能モデリングを含む。本開示の他の態様、利点、および特徴は、図面の簡単な説明と、発明を実施するための形態と、特許請求の範囲とのセクションを含む、本出願全体を再検討した後に明らかになろう。
[0025]図1を参照すると、ハイバンド信号モデリングを実施するように動作可能であるシステムの特定の実施形態が示されており、全体的に100と呼ばれる。特定の実施形態では、システム100は、符号化システムまたは装置に(たとえば、ワイヤレス電話またはコーダ/デコーダ(コーデック)内に)統合され得る。他の実施形態では、システム100は、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに統合され得る。
[0026]以下の説明では、図1のシステム100によって実施される様々な機能は、いくつか構成要素またはモジュールによって実施されると説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分割は、説明のためにすぎない。代替実施形態では、代わりに、特定の構成要素またはモジュールによって実施される機能は、複数の構成要素またはモジュールに分割され得る。その上、代替実施形態では、図1の2つ以上の構成要素またはモジュールが単一の構成要素またはモジュールに統合され得る。図1に示された各構成要素またはモジュールは、ハードウェア(たとえばフィールドプログラマブルゲートアレイ(FPGA)デバイス、特定用途向け集積回路(ASIC)、デジタルシグナルプロセッサ(DSP)、コントローラなど)、ソフトウェア(たとえば、プロセッサによって実行可能な命令)、またはそれらの任意の組合せを使用して実装され得る。
[0027]システム100は、入力オーディオ信号102を受信するように構成された第1の分析フィルタバンク110(たとえば、QMFバンクまたは擬似QMFバンク)を含む。たとえば、入力オーディオ信号102は、マイクロフォンまたは他の入力デバイスによって提供され得る。特定の実施形態では、入力オーディオ信号102はスピーチを含み得る。入力オーディオ信号102は、約50Hz〜約16kHzの周波数範囲内のデータを含むSWB信号であり得る。第1の分析フィルタバンク110は、周波数に基づいて入力音声信号102を複数の部分の中にフィルタ処理し得る。たとえば、第1の分析フィルタバンク110は、第1の周波数範囲内のサブバンドの第1のグループ122と、第2の周波数範囲内のサブバンドの第2のグループ124とを生成し得る。サブバンドの第1のグループ122はM個のサブバンドを含み得、ここで、Mは、0よりも大きい整数である。サブバンドの第2のグループ124はN個のサブバンドを含み得、ここで、Nは、1よりも大きいである整数である。したがって、サブバンドの第1のグループ122は少なくとも1つのサブバンドを含み得、サブバンドの第2のグループ124は2つ以上のサブバンドを含む。特定の実施形態では、MおよびNは同様の値であり得る。別の特定の実施形態では、MおよびNは異なる値であり得る。サブバンドの第1のグループ122およびサブバンドの第2のグループ124は、等しいかまたは等しくない帯域幅を有することがあり、重複するかまたは重複しないことがある。代替実施形態では、第1の分析フィルタバンク110は、サブバンドの3つ以上のグループを生成し得る。
[0028]第1の周波数範囲は第2の周波数範囲よりも低くなり得る。図1の例では、サブバンドの第1のグループ122およびサブバンドの第2のグループ124は、重複しない周波数帯域を占有する。たとえば、サブバンドの第1のグループ122およびサブバンドの第2のグループ124は、それぞれ50Hz〜7kHzおよび7kHz〜16kHzの重複しない周波数帯域を占有し得る。代替実施形態では、サブバンドの第1のグループ122およびサブバンドの第2のグループ124は、それぞれ50Hz〜8kHzおよび8kHz〜16kHzの重複しない周波数帯域を占有し得る。別の代替実施形態では、サブバンドの第1のグループ122およびサブバンドの第2のグループ124は重複し(たとえば、50Hz〜8kHzおよび7kHz〜16kHz)、これにより、第1の分析フィルタバンク110のローパスフィルタおよびハイパスフィルタはスムーズなロールオフを有することが可能になり得、それにより、設計が単純になり、ハイパスフィルタおよびローパスフィルタのコストが低減し得る。サブバンドの第1のグループ122とサブバンドの第2のグループ124を重複させると、受信機におけるローバンド信号とハイバンド信号とのスムーズな混合も可能になり得、それにより、可聴アーティファクトが少なくなり得る。
[0029]図1の例はSWB信号の処理を示しているが、これは説明のためにすぎないことに留意されたい。代替実施形態では、入力オーディオ信号102は、約50Hz〜約8kHzの周波数範囲を有するWB信号であり得る。そのような実施形態では、サブバンドの第1のグループ122は約50Hz〜約6.4kHzの周波数範囲に対応し得、サブバンドの第2のグループ124は約6.4kHz〜約8kHzの周波数範囲に対応し得る。
[0030]システム100は、サブバンドの第1のグループ122を受信するように構成されたローバンド分析モジュール130を含み得る。特定の実施形態では、ローバンド分析モジュール130は、符号励振線形予測(CELP)エンコーダの一実施形態を表し得る。ローバンド分析モジュール130は、線形予測(LP)分析およびコーディングモジュール132と、線形予測係数(LPC)−LSP変換モジュール134と、量子化器136とを含み得る。LSPは、LSFと呼ばれることもあり、2つの用語(LSPとLSF)は本明細書では交換可能に使用され得る。LP分析およびコーディングモジュール132は、サブバンドの第1のグループ122のスペクトルエンベロープをLPCのセットとして符号化し得る。LPCは、オーディオの各フレーム(たとえば、16kHzのサンプリングレートにおける320個のサンプルに対応する、20ミリ秒(ms)のオーディオ)、オーディオの各サブフレーム(たとえば、5msのオーディオ)、またはそれらの任意の組合せについて生成され得る。各フレームまたはサブフレームについて生成されるLPCの数は、実施されるLP分析の「次数」によって決定され得る。特定の実施形態では、LP分析およびコーディングモジュール132は、10次LP分析に対応する11個のLPCのセットを生成し得る。
[0031]LPC−LSP変換モジュール134は、LP分析およびコーディングモジュール132によって生成されたLPCのセットを(たとえば1対1変換を使用して)LSPの対応するセットに変換し得る。代替的に、LPCのセットは、パーコール係数、ログ面積比値、イミッタンススペクトル対(ISP)、またはイミッタンススペクトル周波数(ISF)の対応するセットに1対1に変換され得る。LPCのセットとLSPのセットとの間の変換は、誤差なしに可逆的であり得る。
[0032]量子化器136は、LPC−LSP変換モジュール134によって生成されたLSPのセットを量子化し得る。たとえば、量子化器136は、複数のエントリ(たとえば、ベクトル)を含む複数のコードブックを含むか、またはそれらに結合され得る。LSPのセットを量子化するために、量子化器136は、(たとえば、最小2乗または平均2乗誤差などのひずみ尺度に基づいて)LSPのセット「に最も近い」コードブックのエントリを識別し得る。量子化器136は、コードブック中の識別されたエントリのロケーションに対応するインデックス値または一連のインデックス値を出力し得る。したがって、量子化器136の出力は、ローバンドビットストリーム142中に含まれるローバンドフィルタパラメータを表し得る。
[0033]ローバンド分析モジュール130はまた、ローバンド励振信号144を生成し得る。たとえば、ローバンド励振信号144は、ローバンド分析モジュール130によって実施されるLPプロセス中に生成されるLP残差信号をコーディングすることによって生成される符号化信号であり得る。
[0034]システム100は、第1の分析フィルタバンク110からサブバンドの第2のグループ124を、およびローバンド分析モジュール130からローバンド励振信号144を受信するように構成されたハイバンド分析モジュール150をさらに含み得る。ハイバンド分析モジュール150は、サブバンドの第2のグループ124とローバンド励振信号144とに基づいてハイバンドサイド情報172を生成し得る。たとえば、ハイバンドサイド情報172はハイバンドLPCおよび/または利得情報(たとえば、調整パラメータ)を含み得る。
[0035]ハイバンド分析モジュール150は非線形変換生成器190を含み得る。非線形変換生成器190は、ローバンド励振信号144に基づいて高調波拡張信号を生成するように構成され得る。たとえば、非線形変換生成器190は、ローバンド励振信号144をアップサンプリングし得、アップサンプリングされた信号を非線形関数を通して処理して、ローバンド励振信号144の帯域幅よりも大きい帯域幅を有する高調波拡張信号を生成し得る。
[0036]ハイバンド分析モジュール150はまた、第2の分析フィルタバンク192を含み得る。特定の実施形態では、第2の分析フィルタバンク192は、高調波拡張信号を複数のサブバンドに分割し得る。この実施形態では、サブバンドの第2のグループ124に対応するサブバンドの第3のグループ126(たとえば、ハイバンド励振信号)を生成するために、複数のサブバンドの各サブバンドに被変調雑音が追加され得る。非限定的な例として、サブバンドの第2のグループ124のうちの第1のサブバンド(H1)は、7kHz〜8kHzにわたる帯域幅を有し得、サブバンドの第2のグループ124のうちの第2のサブバンド(H2)は、8kHz〜9kHzにわたる帯域幅を有し得る。同様に、(第1のサブバンド(H1)に対応する)サブバンドの第3のグループ126のうちの第1のサブバンド(図示せず)は、7kHz〜8kHzにわたる帯域幅を有し得、(第2のサブバンド(H2)に対応する)サブバンドの第3のグループ126のうちの第2のサブバンド(図示せず)は、8kHz〜9kHzにわたる帯域幅を有し得る。別の特定の実施形態では、第2の分析フィルタバンク192に提供されるべきであるハイバンド励振信号を生成するために、被変調雑音が高調波拡張信号と混合され得る。この実施形態では、第2の分析フィルタバンク192は、ハイバンド励振信号をサブバンドの第3のグループ126に分割し得る。
[0037]ハイバンド分析モジュール150内のパラメータ推定器194は、サブバンドの第2のグループ124中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ126中の第1のサブバンドのための第1の調整パラメータ(たとえば、LPC調整パラメータおよび/または利得調整パラメータ)を決定し得る。たとえば、特定のパラメータ推定器は、サブバンドの第3のグループ126中の第1のサブバンドと、入力オーディオ信号102の対応するハイバンド部分(たとえば、サブバンドの第2のグループ124中の対応するサブバンド)との間のスペクトル関係および/またはエンベロープ関係を決定し得る。同様にして、別のパラメータ推定器は、サブバンドの第2のグループ124中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ126中の第2のサブバンドのための第2の調整パラメータを決定し得る。本明細書で使用するサブバンドの「メトリック」は、サブバンドを特徴づける任意の値に対応し得る。非限定的な例として、サブバンドのメトリックは、サブバンドの信号エネルギー、サブバンドの残差エネルギー、サブバンドのLP係数などに対応し得る。
[0038]特定の実施形態では、パラメータ推定器194は、サブバンドの第2のグループ124のうちのサブバンド(たとえば、入力オーディオ信号102のハイバンド部分の成分)と、サブバンドの第3のグループ126の対応するサブバンド(たとえば、ハイバンド励振信号の成分)との間の関係に従って、少なくとも2つの利得ファクタ(たとえば、調整パラメータ)を計算し得る。利得ファクタは、フレームまたはフレームの何らかの部分にわたる対応するサブバンドのエネルギー間の差分(または比)に対応し得る。たとえば、パラメータ推定器194は、エネルギーを各サブバンドの各サブフレームのサンプルの2乗の和として計算し得、それぞれのサブフレームの利得ファクタはそれらのエネルギーの比の平方根であり得る。別の特定の実施形態では、パラメータ推定器194は、サブバンドの第2のグループ124のうちのサブバンドとサブバンドの第3のグループ126の対応するサブバンドとの間の時間変動関係に従って利得エンベロープを計算し得る。しかしながら、入力オーディオ信号102(たとえば、ハイバンド信号)のハイバンド部分の時間エンベロープと、ハイバンド励振信号の時間エンベロープは同様である可能性がある。
[0039]別の特定の実施形態では、パラメータ推定器194は、LP分析およびコーディングモジュール152と、LPC−LSP変換モジュール154とを含み得る。LP分析およびコーディングモジュール152とLPC−LSP変換モジュール154との各々は、ローバンド分析モジュール130の対応する構成要素に関して上記で説明したように機能し得るが、(たとえば、各係数、LSPなどについてより少ないビットを使用して)比較的低分解能で機能し得る。LP分析およびコーディングモジュール152は、変換モジュール154によってLSPに変換されコードブック163に基づいて量子化器156によって量子化される、LPCのセットを生成し得る。たとえば、LP分析およびコーディングモジュール152、LPC−LSP変換モジュール154、ならびに量子化器156は、ハイバンドサイド情報172中に含まれるハイバンドフィルタ情報(たとえば、ハイバンドLSPもしくは調整パラメータ)および/またはハイバンド利得情報を決定するためにサブバンドの第2のグループ124を使用し得る。
[0040]量子化器156は、パラメータ推定器194からの調整パラメータをハイバンドサイド情報172として量子化するように構成され得る。量子化器はまた、変換モジュール154によって提供されるLSPなど、スペクトル周波数値のセットを量子化するように構成され得る。他の実施形態では、量子化器156は、LSFまたはLSPに加えて、またはその代わりに、1つまたは複数の他のタイプのスペクトル周波数値のセットを受信し、量子化し得る。たとえば、量子化器156は、LP分析およびコーディングモジュール152によって生成されたLPCのセットを受信し、量子化し得る。他の例としては、量子化器156において受信され量子化され得る、パーコール係数、ログ面積比値、およびISFのセットがある。量子化器156は、入力ベクトル(たとえば、ベクトル形式のスペクトル周波数値のセット)を、コードブック163などのテーブルまたはコードブック中の対応するエントリへのインデックスとして符号化するベクトル量子化器を含み得る。別の例として、量子化器156は、1つまたは複数のパラメータを決定するように構成され得、疎なコードブック実施形態などでは、入力ベクトルは、ストレージから取り出されるのではなく、これらのパラメータからデコーダにおいて動的に生成され得る。例示のために、疎なコードブックの例は、3GPP2(登録商標)(第3世代パートナーシップ2)EVRC(拡張可変レートコーデック)などの業界標準に従うCELPおよびコーデックなどのコーディング方式において適用され得る。別の実施形態では、ハイバンド分析モジュール150は、量子化器156を含み得、(たとえば、フィルタパラメータのセットに従って)合成信号を生成するためにいくつかのコードブックベクトルを使用し、知覚的に加重された領域などにおいてサブバンドの第2のグループ124に最も良く適合する合成信号に関連付けられたコードブックベクトルのうち1つを選択するように構成され得る。
[0041]特定の実施形態では、ハイバンドサイド情報172は、ハイバンドLSPならびにハイバンド利得パラメータを含み得る。たとえば、ハイバンドサイド情報172は、パラメータ推定器194によって生成される調整パラメータを含み得る。
[0042]ローバンドビットストリーム142およびハイバンドサイド情報172は、出力ビットストリーム199を生成するためにマルチプレクサ(MUX)170によって多重化され得る。出力ビットストリーム199は、入力オーディオ信号102に対応する符号化されたオーディオ信号を表し得る。たとえば、マルチプレクサ170は、入力オーディオ信号102の再生中に利得調整(たとえば、エンベロープベースの調整)および/または線形性調整(たとえば、スペクトルベースの調整)を可能にするために、ハイバンドサイド情報172中に含まれる調整パラメータを入力オーディオ信号102の符号化バージョン中に挿入するように構成され得る。出力ビットストリーム199は、送信機198によって(たとえば、ワイヤード、ワイヤレス、もしくは光チャネルを介して)送信および/または記憶され得る。受信機において、オーディオ信号(たとえば、スピーカーまたは他の出力デバイスに提供される入力オーディオ信号102の再構成バージョン)を生成するために、逆演算がデマルチプレクサ(DEMUX)、ローバンドデコーダ、ハイバンドデコーダ、およびフィルタバンクによって実施され得る。ローバンドビットストリーム142を表すために使用されるビットの数は、ハイバンドサイド情報172を表すために使用されるビットの数よりも実質的に多くなり得る。したがって、出力ビットストリーム199中のビットの大部分は、ローバンドデータを表し得る。ハイバンドサイド情報172は、信号モデルに従ってローバンドデータからハイバンド励振信号を再生するために受信機において使用され得る。たとえば、信号モデルは、ローバンドデータ(たとえば、サブバンドの第1のグループ122)とハイバンドデータ(たとえば、サブバンドの第2のグループ124)との間の関係または相関の予想されるセットを表し得る。したがって、異なる信号モデルが、異なる種類のオーディオデータ(たとえば、スピーチ、音楽など)に使用され得、使用中の特定の信号モデルは、符号化されたオーディオデータの通信の前に、送信機と受信機とによってネゴシエートされ得る(または業界標準によって定義され得る)。信号モデルを使用して、送信機におけるハイバンド分析モジュール150は、出力ビットストリーム199からサブバンドの第2のグループ124を再構成するために受信機における対応するハイバンド分析モジュールが信号モデルを使用することが可能であるように、ハイバンドサイド情報172を生成することが可能であり得る。
[0043]図1のシステム100は、合成ハイバンド信号成分(たとえば、サブバンドの第3のグループ126)と、元のハイバンド信号成分(たとえば、サブバンドの第2のグループ124)との間の相関を改善し得る。たとえば、合成ハイバンド信号成分と元のハイバンド信号成分との間のスペクトルおよびエンベロープ近似は、サブバンドごとにサブバンドの第2のグループ124のメトリックをサブバンドの第3のグループのメトリック126と比較することによって、「より微細な」レベルで実施され得る。サブバンドの第3のグループ126は、比較から得られた調整パラメータに基づいて調整され得、これらの調整パラメータは、入力オーディオ信号102のハイバンド再構成中に可聴アーティファクトを低減するためにデコーダに送信され得る。
[0044]図2を参照すると、ハイバンド信号モデリングを実施するように動作可能であるシステム200の特定の実施形態が示されている。システム200は、第1の分析フィルタバンク110と、合成フィルタバンク202と、ローバンドコーダ204と、非線形変換生成器190と、雑音コンバイナ206と、第2の分析フィルタバンク192と、N個のパラメータ推定器294a〜294cとを含む。
[0045]第1の分析フィルタバンク110は、入力オーディオ信号102を受信し得、周波数に基づいて入力オーディオ信号102を複数の部分の中にフィルタ処理するように構成され得る。たとえば、第1の分析フィルタバンク110は、ローバンド周波数範囲内のサブバンドの第1のグループ122と、ハイバンド周波数範囲内のサブバンドの第2のグループ124を生成し得る。非限定的な例として、ローバンド周波数範囲は約0kHz〜6.4kHzであり得、ハイバンド周波数範囲は約6.4kHz〜12.8kHzであり得る。サブバンドの第1のグループ124は合成フィルタバンク202に提供され得る。合成フィルタバンク202は、サブバンドの第1のグループ122を結合することによってローバンド信号212を生成し得るように構成される。ローバンド信号212はローバンドコーダ204に提供され得る。
[0046]ローバンドコーダ204は、図1のローバンド分析モジュール130に対応し得る。たとえば、ローバンドコーダ204は、ローバンド励振信号144を生成するためにローバンド信号212(たとえば、サブバンドの第1のグループ122)を量子化するように構成され得る。ローバンド励振信号144は非線形変換生成器190に提供され得る。
[0047]図1に関して説明したように、ローバンド励振信号144は、ローバンド分析モジュール130を使用してサブバンドの第1のグループ122(たとえば、入力オーディオ信号102のローバンド部分)から生成され得る。非線形変換生成器190は、ローバンド励振信号144(たとえば、サブバンドの第1のグループ122)に基づいて高調波拡張信号214(たとえば、非線形励振信号)を生成するように構成され得る。非線形変換生成器190は、ローバンド励振信号144をアップサンプリングし得、アップサンプリングされた信号を、非線形関数を使用して処理して、ローバンド励振信号144の帯域幅よりも大きい帯域幅を有する高調波拡張信号214を生成し得る。たとえば、特定の実施形態では、ローバンド励振信号144の帯域幅は約0〜6.4kHzであり得、高調波拡張信号214の帯域幅は約6.4kHz〜16kHzであり得る。別の特定の実施形態では、高調波拡張信号214の帯域幅は、振幅が等しい場合はローバンド励振信号の帯域幅よりも高くなり得る。たとえば、ローバンド励振信号144の帯域幅は約0〜6.4kHzであり得、高調波拡張信号214の帯域幅は約6.4kHz〜12.8kHzであり得る。特定の実施形態では、非線形変換生成器190は、高調波拡張信号214を生成するためにローバンド励振信号144のフレーム(またはサブフレーム)に絶対値演算または2乗演算を実施し得る。高調波拡張信号214は雑音コンバイナ206に提供され得る。
[0048]雑音コンバイナ206は、ハイバンド励振信号216を生成するために高調波拡張信号214を被変調雑音と混合するように構成され得る。被変調雑音は、ローバンド信号212のエンベロープと白色雑音とに基づき得る。高調波拡張信号214と混合される被変調雑音の量は、混合ファクタに基づき得る。ローバンドコーダ204は、混合ファクタを決定するために雑音コンバイナ206によって使用される情報を生成し得る。この情報は、サブバンドの第1のグループ122中のピッチラグ、サブバンドの第1のグループ122に関連する適応コードブック利得、サブバンドの第1のグループ122とサブバンドの第2のグループ124との間のピッチ相関、それらの任意の組合せなどを含み得る。たとえば、ローバンド信号212の高調波が有声信号(たとえば、比較的強い有声成分と、比較的弱い雑音様成分とをもつ信号)に対応する場合、混合ファクタの値は増加し得、より少ない量の被変調雑音が高調波拡張信号214と混合され得る。代替的に、ローバンド信号212の高調波が雑音様信号(たとえば、比較的強い雑音様成分と、比較的弱い有声成分とをもつ信号)に対応する場合、混合ファクタの値は減少し得、より大きい量の被変調雑音が高調波拡張信号214と混合され得る。ハイバンド励振信号216は第2の分析フィルタバンク192に提供され得る。
[0049]第2のフィルタ分析フィルタバンク192は、ハイバンド励振信号216を、サブバンドの第2のグループ124に対応するサブバンドの第3のグループ126(たとえば、ハイバンド励振信号)中にフィルタ処理する(たとえば、分割する)ように構成され得る。サブバンドの第3のグループ126の各サブバンド(HE1〜HEN)は、対応するパラメータ推定器294a〜294cに提供され得る。さらに、サブバンドの第2のグループ124の各サブバンド(H1〜HN)は、対応するパラメータ推定器294a〜294cに提供され得る。
[0050]パラメータ推定器294a〜294cは、図1のパラメータ推定器194に対応し得、実質的に同様の様式で動作し得る。たとえば、各パラメータ推定器294a〜294cは、サブバンドの第2のグループ124中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ126中の対応するサブバンドのための調整パラメータを決定し得る。たとえば、第1のパラメータ推定器294aは、サブバンドの第2のグループ124中の第1のサブバンド(H1)のメトリックに基づいて、サブバンドの第3のグループ126中の第1のサブバンド(HE1)のための第1の調整パラメータ(たとえば、LPC調整パラメータおよび/または利得調整パラメータ)を決定し得る。たとえば、第1のパラメータ推定器294aは、サブバンドの第3のグループ126中の第1のサブバンド(HE1)と、サブバンドの第2のグループ124中の第1のサブバンド(H1)との間のスペクトル関係および/またはエンベロープ関係を決定し得る。例示のために、第1のパラメータ推定器294は、第1のサブバンド(H1)のLPCと、第1のサブバンド(H1)の残差とを生成するために、サブバンドの第2のグループ124のうちの第1のサブバンド(H1)上でLP分析を実施し得る。第1のサブバンド(H1)の残差は、サブバンドの第3のグループ126中の第1のサブバンド(HE1)と比較され得、第1のパラメータ推定器294は、サブバンドの第2のグループ124のうちの第1のサブバンド(H1)の残差のエネルギーと、サブバンドの第3のグループ126のうちの第1のサブバンド(HE1)のエネルギーとを実質的に一致させるための利得パラメータを決定し得る。別の例として、第1のパラメータ推定器294は、サブバンドの第2のグループ124のうちの第1のサブバンド(H1)の合成バージョンを生成するために、サブバンドの第3のグループ126のうちの第1のサブバンド(HE1)を使用して合成を実施し得る。第1のパラメータ推定器294は、サブバンドの第2のグループ124のうちの第1のサブバンド(H1)のエネルギーが第1のサブバンド(H1)の合成バージョンのエネルギーに近似するように利得パラメータを決定し得る。同様にして、第2のパラメータ推定器294bは、サブバンドの第2のグループ124中の第2のサブバンド(H2)のメトリックに基づいて、サブバンドの第3のグループ126中の第2のサブバンド(HE2)のための第2の調整パラメータを決定し得る。
[0051]調整パラメータは、量子化器(たとえば、図1の量子化器156)によって量子化され、ハイバンドサイド情報として送信され得る。サブバンドの第3のグループ126はまた、エンコーダ(たとえば、システム200)の他の構成要素(図示せず)によるさらなる処理(たとえば、利得形状調整処理、位相調整処理など)のために調整パラメータに基づいて調整され得る。
[0052]図2のシステム200は、合成ハイバンド信号成分(たとえば、サブバンドの第3のグループ126)と、元のハイバンド信号成分(たとえば、サブバンドの第2のグループ124)との間の相関を改善し得る。たとえば、合成ハイバンド信号成分と元のハイバンド信号成分との間のスペクトルおよびエンベロープ近似は、サブバンドごとにサブバンドの第2のグループ124のメトリックをサブバンドの第3のグループのメトリック126と比較することによって、「より微細な」レベルで実施され得る。サブバンドの第3のグループ126は、比較から得られた調整パラメータに基づいて調整され得、これらの調整パラメータは、入力オーディオ信号102のハイバンド再構成中に可聴アーティファクトを低減するためにデコーダに送信され得る。
[0053]図3を参照すると、ハイバンド信号モデリングを実施するように動作可能であるシステム300の特定の実施形態が示されている。システム300は、第1の分析フィルタバンク110と、合成フィルタバンク202と、ローバンドコーダ204と、非線形変換生成器190と、第2の分析フィルタバンク192と、N個の雑音コンバイナ306a〜306cと、N個のパラメータ推定器294a〜294cとを含む。
[0054]システム300の動作中に、高調波拡張信号214は、(図2の雑音コンバイナ206とは対照的に)第2の分析フィルタバンク192に提供される。第2のフィルタ分析フィルタバンク192は、高調波拡張信号214を複数のサブバンド322中にフィルタ処理する(たとえば、分割する)ように構成され得る。複数のサブバンド322の各サブバンドは、対応する雑音コンバイナ306a〜306cに提供され得る。たとえば、複数のサブバンド322のうちの第1のサブバンドは第1の雑音コンバイナ306aに提供され得、複数のサブバンド322のうちの第2のサブバンドは第2の雑音コンバイナ306bに提供され得る、などである。
[0055]各雑音コンバイナ306a〜306cは、サブバンドの第3のグループ126(たとえば、複数のハイバンド励振信号(HE1〜HEN))を生成するために、複数のサブバンド322のうちの受信されたサブバンドを被変調雑音と混合するように構成され得る。たとえば、被変調雑音は、ローバンド信号212のエンベロープと白色雑音とに基づき得る。複数のサブバンド322の各サブバンドと混合される被変調雑音の量は、少なくとも1つの混合ファクタに基づき得る。特定の実施形態では、サブバンドの第3のグループ126のうちの第1のサブバンド(HE1)は、第1の混合ファクタに基づいて複数のサブバンド322のうちの第1のサブバンドを混合することによって生成され得、サブバンドの第3のグループ126のうちの第2のサブバンド(HE2)は、第2の混合ファクタに基づいて複数のサブバンド322のうちの第2のサブバンドを混合することによって生成され得る。このように、サブバンドの第3のグループ126を生成するために複数の(たとえば、異なる)混合ファクタが使用され得る。
[0056]ローバンドコーダ204は、それぞれの混合ファクタを決定するために各雑音コンバイナ306a〜306cによって使用される情報を生成し得る。たとえば、第1の混合ファクタを決定するために第1の雑音コンバイナ306aに提供される情報は、ピッチラグ、サブバンドの第1のグループ122のうちの第1のサブバンド(L1)に関連する適応コードブック利得、サブバンドの第1のグループ122のうちの第1のサブバンド(L1)とサブバンドの第2のグループ124のうちの第1のサブバンド(H1)との間のピッチ相関、またはそれらの任意の組合せを含み得る。他の雑音コンバイナ306b、306nの混合ファクタを決定するために、それぞれのサブバンドのための同様のパラメータが使用され得る。別の実施形態では、各雑音コンバイナ306a〜306nは、共通の混合ファクタに基づいて混合演算を実施し得る。
[0057]図2に関して説明したように、各パラメータ推定器294a〜294cは、サブバンドの第2のグループ124中の対応するサブバンドのメトリックに基づいて、サブバンドの第3のグループ126中の対応するサブバンドのための調整パラメータを決定し得る。調整パラメータは、量子化器(たとえば、図1の量子化器156)によって量子化され、ハイバンドサイド情報として送信され得る。サブバンドの第3のグループ126はまた、エンコーダ(たとえば、システム300)の他の構成要素(図示せず)によるさらなる処理(たとえば、利得形状調整処理、位相調整処理など)のために調整パラメータに基づいて調整され得る。
[0058]図3のシステム300は、合成ハイバンド信号成分(たとえば、サブバンドの第3のグループ126)と、元のハイバンド信号成分(たとえば、サブバンドの第2のグループ124)との間の相関を改善し得る。たとえば、合成ハイバンド信号成分と元のハイバンド信号成分との間のスペクトルおよびエンベロープ近似は、サブバンドごとにサブバンドの第2のグループ124のメトリックをサブバンドの第3のグループのメトリック126と比較することによって、「より微細な」レベルで実施され得る。さらに、サブバンドの第3のグループ126中の各サブバンド(たとえば、ハイバンド励振信号)は、信号推定を改善するために、サブバンドの第1のグループ122とサブバンドの第2のグループ124との内の対応するサブバンドの特性(たとえば、ピッチ値)に基づいて生成され得る。サブバンドの第3のグループ126は、比較から得られた調整パラメータに基づいて調整され得、これらの調整パラメータは、入力オーディオ信号102のハイバンド再構成中に可聴アーティファクトを低減するためにデコーダに送信され得る。
[0059]図4を参照すると、調整パラメータを使用してオーディオ信号を再構成するように動作可能であるシステム400の特定の実施形態が示されている。システム400は、非線形変換生成器490と、雑音コンバイナ406と、分析フィルタバンク492と、N個の調整器494a〜494cとを含む。特定の実施形態では、システム400は、復号システムまたは装置に(たとえば、ワイヤレス電話またはコーデック内に)統合され得る。他の特定の実施形態では、システム400は、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、PDA、固定ロケーションデータユニット、またはコンピュータに統合され得る。
[0060]非線形変換生成器490は、ビットストリーム199中のローバンドビットストリーム142の一部として受信されるローバンド励振信号144に基づいて高調波拡張信号414(たとえば、非線形励振信号)を生成するように構成され得る。高調波拡張信号414は、図1〜図3の高調波拡張信号214の再構成バージョンに対応し得る。たとえば、非線形変換生成器490は、図1〜図3の非線形変換生成器190と実質的に同様の様式で動作し得る。例示的な実施形態では、高調波拡張信号414は、図2に関して説明したのと同様の様式で雑音コンバイナ406に提供され得る。別の特定の実施形態では、高調波拡張信号414は、図3に関して説明したのと同様の様式で分析フィルタバンク492に提供され得る。
[0061]雑音コンバイナ406は、図2の雑音コンバイナ206または図3の雑音コンバイナ306a〜306c関して説明したように、ローバンドビットストリーム142を受信し、混合ファクタを生成し得る。代替的に、雑音コンバイナ406は、エンコーダ(たとえば、図1〜図3のシステム100〜300)において生成された混合ファクタを含むハイバンドサイド情報172を受信し得る。例示的な実施形態では、雑音コンバイナ406は、混合ファクタに基づいてハイバンド励振信号416(たとえば、図2のハイバンド励振信号216の再構成バージョン)を生成するために、変換ローバンド励振信号414を被変調雑音と混合し得る。たとえば、雑音コンバイナ406は、図2の雑音コンバイナ206と実質的に同様の様式で動作し得る。例示的な実施形態では、ハイバンド励振信号416は分析フィルタバンク492に提供され得る。
[0062]例示的な実施形態では、分析フィルタバンク492は、ハイバンド励振信号416を、ハイバンド励振サブバンド426のグループ(たとえば、図1〜図3のサブバンドの第3のグループ126の第2のグループの再構成バージョン)中にフィルタ処理する(たとえば、分割する)ように構成され得る。たとえば、分析フィルタバンク492は、図2に関して説明した第2の分析フィルタバンク192と実質的に同様の様式で動作し得る。ハイバンド励振サブバンド426のグループは、対応する調整器494a〜494cに提供され得る。
[0063]別の実施形態では、分析フィルタバンク492は、図3に関して説明した第2の分析フィルタバンク192と同様の様式で高調波拡張信号414を複数のサブバンド(図示せず)中にフィルタ処理するように構成され得る。この実施形態では、複数の雑音コンバイナ(図示せず)は、図3の雑音コンバイナ394a〜394cと同様の様式でハイバンド励振サブバンド426のグループを生成するために、(ハイバンドサイド情報として送信される混合ファクタに基づいて)複数のサブバンドの各サブバンドを被変調雑音と結合し得る。ハイバンド励振サブバンド426のグループの各サブバンドは、対応する調整器494a〜494cに提供され得る。
[0064]各調整器494a〜494cは、ハイバンドサイド情報172として、図1のパラメータ推定器194によって生成された対応する調整パラメータを受信し得る。各調整器494a〜494cはまた、ハイバンド励振サブバンド426のグループの対応するサブバンドを受信し得る。調整器494a〜494cは、調整パラメータに基づいてハイバンド励振サブバンド424の調整されたグループを生成するように構成され得る。ハイバンド励振サブバンド424の調整されたグループは、図1〜図3のサブバンドの第2のグループ124を再構成するためのさらなる処理(たとえば、LP合成、利得形状調整処理、位相調整処理など)のために、システム400の他の構成要素(図示せず)に提供され得る。
[0065]図4のシステム400は、図1のローバンドビットストリーム142と調整パラメータ(たとえば、図1のハイバンドサイド情報172)とを使用してサブバンドの第2のグループ124を再構成し得る。調整パラメータを使用すると、サブバンドごとにハイバンド励振信号416の調整を実施することによって再構成の精度を改善し得る(たとえば、微調整された再構成を生成し得る)。
[0066]図5を参照すると、ハイバンド信号モデリングを実施するための方法500の特定の実施形態のフローチャートが示されている。例示的な例として、方法500は、図1〜図3のシステム100〜300のうちの1つまたは複数によって実施され得る。
[0067]方法500は、502において、スピーチエンコーダにおいて、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することを含み得る。たとえば、図1を参照すると、第1の分析フィルタバンク110は、入力オーディオ信号102を第1の周波数範囲内のサブバンドの第1のグループ122と第2の周波数範囲内のサブバンドの第2のグループ124との中にフィルタ処理し得る。第1の周波数範囲は第2の周波数範囲よりも低くなり得る。
[0068]504において、サブバンドの第1のグループに基づいて高調波拡張信号を生成し得る。たとえば、図2〜図3を参照すると、合成フィルタバンク202は、サブバンドの第1のグループ122を結合することによってローバンド信号212を生成し得、ローバンドコーダ204は、ローバンド信号212を符号化してローバンド励振信号144を生成し得る。ローバンド励振信号144は非線形変換生成器407に提供され得る。非線形変換生成器190は、ローバンド励振信号144をアップサンプリングして、ローバンド励振信号144(たとえば、サブバンドの第1のグループ122)に基づいて高調波拡張信号214(たとえば、非線形励振信号)を生成し得る。
[0069]506において、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成し得る。たとえば、図2を参照すると、ハイバンド励振信号216を生成するために、高調波拡張信号214は被変調雑音と混合され得る。第2のフィルタ分析フィルタバンク192は、ハイバンド励振信号216を、サブバンドの第2のグループ124に対応するサブバンドの第3のグループ126(たとえば、ハイバンド励振信号)中にフィルタ処理(たとえば、分割)し得る。代替的に、図3を参照すると、高調波拡張信号214は第2の分析フィルタバンク192に提供される。第2のフィルタ分析フィルタバンク192は、高調波拡張信号214を複数のサブバンド322中にフィルタ処理(たとえば、分割)し得る。複数のサブバンド322の各サブバンドは、対応する雑音コンバイナ306a〜306cに提供され得る。たとえば、複数のサブバンド322のうちの第1のサブバンドは第1の雑音コンバイナ306aに提供され得、複数のサブバンド322のうちの第2のサブバンドは第2の雑音コンバイナ306bに提供され得る、などである。各雑音コンバイナ306a〜306cは、サブバンドの第3のグループ126を生成するために、複数のサブバンド322のうちの受信されたサブバンドを被変調雑音と混合し得る。
[0070]508において、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータを決定し得るか、またはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定し得る。たとえば、図2〜図3を参照すると、第1のパラメータ推定器294aは、サブバンドの第2のグループ124中の対応するサブバンド(H1)のメトリック(たとえば、信号エネルギー、残差エネルギー、LP係数など)に基づいて、サブバンドの第3のグループ126中の第1のサブバンド(HE1)のための第1の調整パラメータ(たとえば、LPC調整パラメータおよび/または利得調整パラメータ)を決定し得る。第1のパラメータ推定器294aは、第1のサブバンド(HE1)と第1のサブバンド(H1)との間の関係に従って第1の利得ファクタ(たとえば、第1の調整パラメータ)を計算し得る。利得ファクタは、フレームまたはフレームの何らかの部分にわたるサブバンド(H1、HE1)のエネルギー間の差分(または比)に対応し得る。同様にして、他のパラメータ推定器294b〜294cは、サブバンドの第2のグループ124中の第2のサブバンド(H2)のメトリック(たとえば、信号エネルギー、残差エネルギー、LP係数など)に基づいて、サブバンドの第3のグループ126中の第2のサブバンド(HE2)のための第2の調整パラメータを決定し得る。
[0071]図5の方法500は、合成ハイバンド信号成分(たとえば、サブバンドの第3のグループ126)と、元のハイバンド信号成分(たとえば、サブバンドの第2のグループ124)との間の相関を改善し得る。たとえば、合成ハイバンド信号成分と元のハイバンド信号成分との間のスペクトルおよびエンベロープ近似は、サブバンドごとにサブバンドの第2のグループ124のメトリックをサブバンドの第3のグループのメトリック126と比較することによって、「より微細な」レベルで実施され得る。サブバンドの第3のグループ126は、比較から得られた調整パラメータに基づいて調整され得、これらの調整パラメータは、入力オーディオ信号102のハイバンド再構成中に可聴アーティファクトを低減するためにデコーダに送信され得る。
[0072]図6を参照すると、調整パラメータを使用してオーディオ信号を再構成するための方法600の特定の実施形態のフローチャートが示されている。例示的な例として、方法600は、図4のシステム400によって実施され得る。
[0073]方法600は、602において、スピーチエンコーダから受信されたローバンド励振信号に基づいて高調波拡張信号を生成することを含む。たとえば、図4を参照すると、ローバンド励振信号444が非線形変換生成器490に提供されて、ローバンド励振信号444に基づいて高調波拡張信号414(たとえば、非線形励振信号)が生成され得る。
[0074]606において、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成し得る。たとえば、図4を参照すると、雑音コンバイナ406は、図4に関して説明したように、ピッチラグ、適応コードブック利得、および/または帯域間のピッチ相関に基づいて混合ファクタを決定し得るか、あるいはエンコーダ(たとえば、図1〜図3のシステム100〜300)において生成された混合ファクタを含むハイバンドサイド情報172を受信し得る。雑音コンバイナ406は、混合ファクタに基づいてハイバンド励振信号416(たとえば、図2のハイバンド励振信号216の再構成バージョン)を生成するために、変換ローバンド励振信号414を被変調雑音と混合し得る。分析フィルタバンク492は、ハイバンド励振信号416を、ハイバンド励振サブバンド426のグループ(たとえば、図1〜図3のサブバンドの第3のグループ126の第2のグループの再構成バージョン)中にフィルタ処理(たとえば、分割)し得る。
[0075]608において、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整し得る。たとえば、図4を参照すると、各調整器494a〜494cは、ハイバンドサイド情報172として、図1のパラメータ推定器194によって生成された対応する調整パラメータを受信し得る。各調整器494a〜494cはまた、ハイバンド励振サブバンド426のグループの対応するサブバンドを受信し得る。調整器494a〜494cは、調整パラメータに基づいてハイバンド励振サブバンド424の調整されたグループを生成し得る。ハイバンド励振サブバンド424の調整されたグループは、図1〜図3のサブバンドの第2のグループ124を再構成するためのさらなる処理(たとえば、利得形状調整処理、位相調整処理など)のために、システム400の他の構成要素(図示せず)に提供され得る。
[0076]図6の方法600は、図1のローバンドビットストリーム142と調整パラメータ(たとえば、図1のハイバンドサイド情報172)とを使用してサブバンドの第2のグループ124を再構成し得る。調整パラメータを使用すると、サブバンドごとにハイバンド励振信号416の調整を実施することによって再構成の精度を改善し得る(たとえば、微調整された再構成を生成し得る)。
[0077]特定の実施形態では、図5〜図6の方法500、600は、中央処理ユニット(CPU)、DSP、またはコントローラなどの処理ユニットのハードウェア(たとえば、FPGAデバイス、ASICなど)を介して、ファームウェアデバイスを介して、またはそれらの任意の組合せで実装され得る。一例として、図5〜図6の方法500、600は、図7に関して説明したように、命令を実行するプロセッサによって実施され得る。
[0078]図7を参照すると、ワイヤレス通信デバイスの特定の例示的な実施形態のブロック図が示されており、全体的に700と呼ばれる。デバイス700は、メモリ732に結合されたプロセッサ710(たとえば、CPU)を含む。メモリ732は、図5〜図6の方法500、600の一方または両方など、本明細書で開示される方法およびプロセスを実施するためにプロセッサ710および/またはコーデック734によって実行可能な命令760を含み得る。
[0079]特定の実施形態では、コーデック734は、符号化システム782と、復号システム784とを含み得る。特定の実施形態では、符号化システム782は、図1〜図3のシステム100〜300の1つまたは複数の構成要素を含む。たとえば、符号化システム782は、図1〜図3のシステム100〜300および図5の方法500に関連する符号化演算を実施し得る。特定の実施形態では、復号システム784は、図4のシステム400の1つまたは複数の構成要素を含み得る。たとえば、復号システム784は、図4のシステム400および図6の方法600に関連する復号動作を実施し得る。
[0080]符号化システム782および/または復号システム784は、専用ハードウェア(たとえば、回路)を介して、1つまたは複数のタスクを実施するために命令を実行するプロセッサによって、またはそれらの組合せで実装され得る。一例として、メモリ732またはコーデック734中のメモリ790は、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM(登録商標))、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイスであり得る。メモリデバイスは、コンピュータ(たとえば、コーデック734中のプロセッサおよび/またはプロセッサ710)によって実行されたとき、コンピュータに図5〜図6の方法500、600の一方の少なくとも一部分を実施させ得る命令(たとえば、命令760または命令785)を含み得る。一例として、メモリ732またはコーデック734中のメモリ790は、コンピュータ(たとえば、コーデック734中のプロセッサおよび/またはプロセッサ710)によって実行されたとき、コンピュータに図5〜図6の方法500、600の一方の少なくとも一部分を実施させる命令(たとえば、それぞれ命令760または命令795)を含む非一時的コンピュータ可読媒体であり得る。
[0081]デバイス700はまた、コーデック734とプロセッサ710とに結合されたDSP796を含み得る。特定の実施形態では、DSP796は、符号化システム797と、復号システム798とを含み得る。特定の実施形態では、符号化システム797は、図1〜図3のシステム100〜300の1つまたは複数の構成要素を含む。たとえば、符号化システム797は、図1〜図3のシステム100〜300および図5の方法500に関連する符号化演算を実施し得る。特定の実施形態では、復号システム798は、図4のシステム400の1つまたは複数の構成要素を含み得る。たとえば、復号システム798は、図4のシステム400および図6の方法600に関連する復号動作を実施し得る。
[0082]図7はまた、プロセッサ710とディスプレイ728とに結合されたディスプレイコントローラ726を示している。コーデック734は、図示のように、プロセッサ710に結合され得る。スピーカー736およびマイクロフォン738はコーデック734に結合され得る。たとえば、マイクロフォン738は図1の入力オーディオ信号102を生成し得、コーデック734は、入力オーディオ信号102に基づいて受信機への送信のために出力ビットストリーム199を生成し得る。たとえば、出力ビットストリーム199は、プロセッサ710、ワイヤレスコントローラ740、およびアンテナ742を介して受信機に送信され得る。別の例として、スピーカー736は、図1の出力ビットストリーム199からコーデック734によって再構成された信号を出力するために使用され得、ここで、出力ビットストリーム199は、(たとえば、ワイヤレスコントローラ740およびアンテナ742を介して)送信機から受信される。
[0083]特定の実施形態では、プロセッサ710、ディスプレイコントローラ726、メモリ732、コーデック734、およびワイヤレスコントローラ740は、システムインパッケージデバイスまたはシステムオンチップデバイス(たとえば、移動局モデム(MSM))722中に含まれる。特定の実施形態では、タッチスクリーンおよび/またはキーパッドなどの入力デバイス730、ならびに電源744は、システムオンチップデバイス722に結合される。その上、特定の実施形態では、図7に示されているように、ディスプレイ728、入力デバイス730、スピーカー736、マイクロフォン738、アンテナ742、および電源744は、システムオンチップデバイス722の外部にある。しかしながら、ディスプレイ728、入力デバイス730、スピーカー736、マイクロフォン738、アンテナ742、および電源744の各々は、インターフェースまたはコントローラなど、システムオンチップデバイス722の構成要素に結合され得る。
[0084]説明する実施形態に関連して、第1の装置が開示され、この第1の装置は、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するための手段を含む。たとえば、オーディオ信号をフィルタ処理するための手段は、図1〜図3の第1の分析フィルタバンク110、図7の符号化システム782、図7の符号化システム797、オーディオ信号をフィルタ処理するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0085]第1の装置はまた、サブバンドの第1のグループに基づいて高調波拡張信号を生成するための手段を含み得る。たとえば、高調波拡張信号を生成するための手段は、図1のローバンド分析モジュール130およびそれの構成要素、図1〜図3の非線形変換生成器190、図2〜図3の合成フィルタバンク202、図2〜図3のローバンドコーダ204、図7の符号化システム782、図7の符号化システム797、高調波拡張信号を生成するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0086]第1の装置はまた、高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するための手段をさらに含み得る。たとえば、サブバンドの第3のグループを生成するための手段は、図1のハイバンド分析モジュール150およびそれの構成要素、図1〜図3の第2の分析フィルタバンク192、図2の雑音コンバイナ206、図3の雑音コンバイナ306a〜306c、図7の符号化システム782、サブバンドの第3のグループを生成するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0087]第1の装置はまた、サブバンドの第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するための手段を含み得る。たとえば、第1および第2の調整パラメータを決定するための手段は、図1のパラメータ推定器194、図2のパラメータ推定器294a〜294c、図7の符号化システム782、図7の符号化システム797、第1および第2の調整パラメータを決定するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0088]説明する実施形態に関連して、第2の装置が開示され、この第2の装置は、スピーチエンコーダから受信されたローバンド励振信号に基づいて高調波拡張信号を生成するための手段を含む。たとえば、高調波拡張信号を生成するための手段は、図4の非線形変換生成器490、図7の復号システム784、図7の復号システム798、高調波拡張信号を生成するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0089]第2の装置はまた、高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するための手段を含み得る。たとえば、ハイバンド励振サブバンドのグループを生成するための手段は、図4の雑音コンバイナ406、図4の分析フィルタバンク492、図7の復号システム784、図7の復号システム798、ハイバンド励振信号のグループを生成するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0090]第2の装置はまた、スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドのグループを調整するための手段を含む。たとえば、ハイバンド励振サブバンドのグループを調整するための手段は、図4の調整器494a〜494c、図7の復号システム784、図7の復号システム798、ハイバンド励振サブバンドのグループを調整するように構成された1つまたは複数のデバイス(たとえば、非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ)、あるいはそれらの任意の組合せを含み得る。
[0091]当業者は、本明細書で開示する実施形態に関して説明した様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムのステップが、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実装され得ることをさらに諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップについて、上記では概して、それらの機能に関して説明した。そのような機能をハードウェアとして実装されるか、実行可能ソフトウェアとして実装されるかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明した機能を特定の適用例ごとに様々な方法で実装し得るが、そのような実装の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。
[0092]本明細書で開示する実施形態に関して説明した方法またはアルゴリズムのステップは、直接ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、またはそれら2つの組合せで具体化され得る。ソフトウェアモジュールは、ランダムアクセスメモリ(RAM)、磁気抵抗ランダムアクセスメモリ(MRAM)、スピントルクトランスファーMRAM(STT−MRAM)、フラッシュメモリ、読取り専用メモリ(ROM)、プログラマブル読取り専用メモリ(PROM)、消去可能プログラマブル読取り専用メモリ(EPROM)、電気消去可能プログラマブル読取り専用メモリ(EEPROM)、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取り専用メモリ(CD−ROM)などのメモリデバイス中に存在し得る。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことができるように、プロセッサに結合される。代替として、メモリデバイスはプロセッサに一体化され得る。プロセッサおよび記憶媒体はASIC中に存在し得る。ASICはコンピューティングデバイスまたはユーザ端末中に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として存在し得る。
[0093]開示する実施形態の上記の説明は、開示する実施形態を当業者が作成または使用することを可能にするために提供された。これらの実施形態への様々な変更は当業者には容易に明らかになり、本明細書で定義される原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示されている実施形態に限定されるものではなく、以下の特許請求の範囲によって定義される原理および新規の特徴に一致する可能な最も広い範囲を与えられるべきである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
スピーチエンコーダにおいて、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成することと、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することと、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える方法。
[C2]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C1に記載の方法。
[C3]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C1に記載の方法。
[C4]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C1に記載の方法。
[C5]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入することをさらに備える、C1に記載の方法。
[C6]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信することをさらに備える、C1に記載の方法。
[C7]
前記第1の周波数範囲は、前記第2の周波数範囲よりも値が低い周波数にわたる、C1に記載の方法。
[C8]
サブバンドの前記第3のグループを生成することは、
ハイバンド励振信号を生成するために前記高調波拡張信号を被変調雑音と混合することと、ここにおいて、前記被変調雑音と前記高調波拡張信号とが混合ファクタに基づいて混合される、
前記ハイバンド励振信号をサブバンドの前記第3のグループ中にフィルタ処理することと
を備える、C1に記載の方法。
[C9]
前記混合ファクタが、ピッチラグ、サブバンドの前記第1のグループに関連する適応コードブック利得、サブバンドの前記第1のグループとサブバンドの前記第2のグループとの間のピッチ相関のうちの少なくとも1つに基づいて決定される、C8に記載の方法。
[C10]
サブバンドの前記第3のグループを生成することは、
前記高調波拡張信号を複数のサブバンド中にフィルタ処理することと、
複数のハイバンド励振信号を生成するために前記複数のサブバンドの各サブバンドを被変調雑音と混合することと、ここにおいて、前記複数のハイバンド励振信号がサブバンドの前記第3のグループに対応する、
を備える、C1に記載の方法。
[C11]
前記被変調雑音と前記複数のサブバンドの第1のサブバンドとが第1の混合ファクタに基づいて混合され、前記被変調雑音と前記複数のサブバンドの第2のサブバンドとが第2の混合ファクタに基づいて混合される、C10に記載の方法。
[C12]
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するように構成された第1のフィルタと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成するように構成された非線形変換生成器と、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するように構成された第2のフィルタと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するように構成されたパラメータ推定器と、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える装置。
[C13]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C12に記載の装置。
[C14]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C12に記載の装置。
[C15]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C12に記載の装置。
[C16]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入するように構成されたマルチプレクサをさらに備える、C12に記載の装置。
[C17]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信するための送信機をさらに備える、C12に記載の装置。
[C18]
前記第1の周波数範囲は、前記第2の周波数範囲よりも値が低い周波数にわたる、C12に記載の装置。
[C19]
サブバンドの前記第3のグループを生成することは、
ハイバンド励振信号を生成するために前記高調波拡張信号を被変調雑音と混合することと、ここにおいて、前記被変調雑音と前記高調波拡張信号とが混合ファクタに基づいて混合される、
前記ハイバンド励振信号をサブバンドの前記第3のグループ中にフィルタ処理することと
を備える、C12に記載の装置。
[C20]
前記混合ファクタが、ピッチラグ、サブバンドの前記第1のグループに関連する適応コードブック利得、サブバンドの前記第1のグループとサブバンドの前記第2のグループとの間のピッチ相関のうちの少なくとも1つに基づいて決定される、C19に記載の装置。
[C21]
サブバンドの前記第3のグループを生成することは、
前記高調波拡張信号を複数のサブバンド中にフィルタ処理することと、
複数のハイバンド励振信号を生成するために前記複数のサブバンドの各サブバンドを被変調雑音と混合することと、ここにおいて、前記複数のハイバンド励振信号がサブバンドの前記第3のグループに対応する、
を備える、C12に記載の装置。
[C22]
前記被変調雑音と前記複数のサブバンドの第1のサブバンドとが第1の混合ファクタに基づいて混合され、前記被変調雑音と前記複数のサブバンドの第2のサブバンドとが第2の混合ファクタに基づいて混合される、C21に記載の装置。
[C23]
スピーチエンコーダにおけるプロセッサによって実行されたとき、
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成することと、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することと、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
[C24]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C25]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C26]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C27]
前記プロセッサによって実行されたとき、前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入することを前記プロセッサに行わせる命令をさらに備える、C23に記載の非一時的コンピュータ可読媒体。
[C28]
前記第1の調整パラメータと前記第2の調整パラメータとがビットストリームの一部としてスピーチデコーダに送信される、C23に記載の非一時的コンピュータ可読媒体。
[C29]
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するための手段と、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成するための手段と、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するための手段と、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するための手段と、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える装置。
[C30]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C29に記載の装置。
[C31]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C29に記載の装置。
[C32]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C29に記載の装置。
[C33]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入するための手段をさらに備える、C29に記載の装置。
[C34]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信するための手段をさらに備える、C29に記載の装置。
[C35]
スピーチデコーダにおいて、ローバンド励振信号に基づいて高調波拡張信号を生成することと、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整することと
を備える方法。
[C36]
前記調整パラメータが、利得調整パラメータ、線形予測係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C35に記載の方法。
[C37]
ローバンド励振信号に基づいて高調波拡張信号を生成するように構成された非線形変換生成器と、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するように構成された第2のフィルタと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整するように構成された調整器と
を備える装置。
[C38]
前記調整パラメータが、利得調整パラメータ、線形プレディケーション係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C37に記載の装置。
[C39]
ローバンド励振信号に基づいて高調波拡張信号を生成するための手段と、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するための手段と、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整するための手段と
を備える装置。
[C40]
前記調整パラメータが、利得調整パラメータ、線形プレディケーション係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C39に記載の装置。
[C41]
スピーチデコーダにおけるプロセッサによって実行されたとき、
ローバンド励振信号に基づいて高調波拡張信号を生成することと、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整することと
を前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1]
スピーチエンコーダにおいて、オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成することと、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することと、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える方法。
[C2]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C1に記載の方法。
[C3]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C1に記載の方法。
[C4]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C1に記載の方法。
[C5]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入することをさらに備える、C1に記載の方法。
[C6]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信することをさらに備える、C1に記載の方法。
[C7]
前記第1の周波数範囲は、前記第2の周波数範囲よりも値が低い周波数にわたる、C1に記載の方法。
[C8]
サブバンドの前記第3のグループを生成することは、
ハイバンド励振信号を生成するために前記高調波拡張信号を被変調雑音と混合することと、ここにおいて、前記被変調雑音と前記高調波拡張信号とが混合ファクタに基づいて混合される、
前記ハイバンド励振信号をサブバンドの前記第3のグループ中にフィルタ処理することと
を備える、C1に記載の方法。
[C9]
前記混合ファクタが、ピッチラグ、サブバンドの前記第1のグループに関連する適応コードブック利得、サブバンドの前記第1のグループとサブバンドの前記第2のグループとの間のピッチ相関のうちの少なくとも1つに基づいて決定される、C8に記載の方法。
[C10]
サブバンドの前記第3のグループを生成することは、
前記高調波拡張信号を複数のサブバンド中にフィルタ処理することと、
複数のハイバンド励振信号を生成するために前記複数のサブバンドの各サブバンドを被変調雑音と混合することと、ここにおいて、前記複数のハイバンド励振信号がサブバンドの前記第3のグループに対応する、
を備える、C1に記載の方法。
[C11]
前記被変調雑音と前記複数のサブバンドの第1のサブバンドとが第1の混合ファクタに基づいて混合され、前記被変調雑音と前記複数のサブバンドの第2のサブバンドとが第2の混合ファクタに基づいて混合される、C10に記載の方法。
[C12]
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するように構成された第1のフィルタと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成するように構成された非線形変換生成器と、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するように構成された第2のフィルタと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するように構成されたパラメータ推定器と、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える装置。
[C13]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C12に記載の装置。
[C14]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C12に記載の装置。
[C15]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C12に記載の装置。
[C16]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入するように構成されたマルチプレクサをさらに備える、C12に記載の装置。
[C17]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信するための送信機をさらに備える、C12に記載の装置。
[C18]
前記第1の周波数範囲は、前記第2の周波数範囲よりも値が低い周波数にわたる、C12に記載の装置。
[C19]
サブバンドの前記第3のグループを生成することは、
ハイバンド励振信号を生成するために前記高調波拡張信号を被変調雑音と混合することと、ここにおいて、前記被変調雑音と前記高調波拡張信号とが混合ファクタに基づいて混合される、
前記ハイバンド励振信号をサブバンドの前記第3のグループ中にフィルタ処理することと
を備える、C12に記載の装置。
[C20]
前記混合ファクタが、ピッチラグ、サブバンドの前記第1のグループに関連する適応コードブック利得、サブバンドの前記第1のグループとサブバンドの前記第2のグループとの間のピッチ相関のうちの少なくとも1つに基づいて決定される、C19に記載の装置。
[C21]
サブバンドの前記第3のグループを生成することは、
前記高調波拡張信号を複数のサブバンド中にフィルタ処理することと、
複数のハイバンド励振信号を生成するために前記複数のサブバンドの各サブバンドを被変調雑音と混合することと、ここにおいて、前記複数のハイバンド励振信号がサブバンドの前記第3のグループに対応する、
を備える、C12に記載の装置。
[C22]
前記被変調雑音と前記複数のサブバンドの第1のサブバンドとが第1の混合ファクタに基づいて混合され、前記被変調雑音と前記複数のサブバンドの第2のサブバンドとが第2の混合ファクタに基づいて混合される、C21に記載の装置。
[C23]
スピーチエンコーダにおけるプロセッサによって実行されたとき、
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理することと、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成することと、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成することと、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定することと、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
[C24]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C25]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C26]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C23に記載の非一時的コンピュータ可読媒体。
[C27]
前記プロセッサによって実行されたとき、前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入することを前記プロセッサに行わせる命令をさらに備える、C23に記載の非一時的コンピュータ可読媒体。
[C28]
前記第1の調整パラメータと前記第2の調整パラメータとがビットストリームの一部としてスピーチデコーダに送信される、C23に記載の非一時的コンピュータ可読媒体。
[C29]
オーディオ信号を第1の周波数範囲内のサブバンドの第1のグループと第2の周波数範囲内のサブバンドの第2のグループとの中にフィルタ処理するための手段と、
サブバンドの前記第1のグループと非線形処理機能とに基づいて高調波拡張信号を生成するための手段と、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンドの第3のグループを生成するための手段と、ここにおいて、サブバンドの前記第3のグループがサブバンドの前記第2のグループに対応する、
サブバンドの前記第3のグループ中の第1のサブバンドのための第1の調整パラメータまたはサブバンドの前記第3のグループ中の第2のサブバンドのための第2の調整パラメータを決定するための手段と、ここにおいて、前記第1の調整パラメータがサブバンドの前記第2のグループ中の第1のサブバンドのメトリックに基づき、およびここにおいて、前記第2の調整パラメータがサブバンドの前記第2のグループ中の第2のサブバンドのメトリックに基づく、
を備える装置。
[C30]
前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、C29に記載の装置。
[C31]
前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、C29に記載の装置。
[C32]
前記第1の調整パラメータと前記第2の調整パラメータとが時間変動エンベロープ調整パラメータに対応する、C29に記載の装置。
[C33]
前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入するための手段をさらに備える、C29に記載の装置。
[C34]
前記第1の調整パラメータと前記第2の調整パラメータとをビットストリームの一部としてスピーチデコーダに送信するための手段をさらに備える、C29に記載の装置。
[C35]
スピーチデコーダにおいて、ローバンド励振信号に基づいて高調波拡張信号を生成することと、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整することと
を備える方法。
[C36]
前記調整パラメータが、利得調整パラメータ、線形予測係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C35に記載の方法。
[C37]
ローバンド励振信号に基づいて高調波拡張信号を生成するように構成された非線形変換生成器と、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するように構成された第2のフィルタと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整するように構成された調整器と
を備える装置。
[C38]
前記調整パラメータが、利得調整パラメータ、線形プレディケーション係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C37に記載の装置。
[C39]
ローバンド励振信号に基づいて高調波拡張信号を生成するための手段と、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成するための手段と、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整するための手段と
を備える装置。
[C40]
前記調整パラメータが、利得調整パラメータ、線形プレディケーション係数調整パラメータ、時間変動エンベロープ調整パラメータ、またはそれらの組合せを含む、C39に記載の装置。
[C41]
スピーチデコーダにおけるプロセッサによって実行されたとき、
ローバンド励振信号に基づいて高調波拡張信号を生成することと、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンドのグループを生成することと、
前記スピーチエンコーダから受信された調整パラメータに基づいてハイバンド励振サブバンドの前記グループを調整することと
を前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
Claims (15)
- スピーチエンコーダにおいて、オーディオ信号を第1の周波数範囲内のサブバンド信号の第1のグループと第2の周波数範囲内のサブバンド信号の第2のグループとの中にフィルタ処理することと、
サブバンド信号の前記第2のグループ中の第1のサブバンドの第1の残差信号を生成することと、
サブバンド信号の前記第1のグループのローバンド励振信号と非線形処理機能とに基づいて高調波拡張信号を生成することと、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンド信号の第3のグループを生成することと、ここにおいて、サブバンド信号の前記第3のグループがサブバンド信号の前記第2のグループに対応する、
サブバンド信号の前記第3のグループ中の第1のサブバンド信号のための第1の調整パラメータと、サブバンド信号の前記第3のグループ中の第2のサブバンド信号のための第2の調整パラメータとを決定することと、ここにおいて、前記第1の調整パラメータがサブバンド信号の前記第1の残差信号に基づき、およびここにおいて、前記第2の調整パラメータがサブバンド信号の前記第2のグループ中の第2のサブバンド信号のメトリックに基づく、
を備える方法。 - 前記高調波拡張信号は、サブバンド信号の前記第1のグループで実施されるプロセスからの第1の信号に基づいて、および前記非線形処理機能を前記第1の信号に適用することに基づいて生成され、およびここにおいて、前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、請求項1に記載の方法。
- 前記高調波拡張信号は、サブバンド信号の前記第1のグループで実施される線形予測プロセス中に生成される線形予測残差信号をコーディングすることに基づいて、および前記非線形処理機能を前記コーディングされた線形予測残差信号に適用することに基づいて生成され、およびここにおいて、前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、請求項1に記載の方法。
- 前記オーディオ信号の符号化バージョンからの前記オーディオ信号の再構成中の調整を可能にするために、前記第1の調整パラメータと前記第2の調整パラメータとを前記オーディオ信号の前記符号化バージョン中に挿入することをさらに備える、請求項1に記載の方法。
- 前記第1の周波数範囲は、前記第2の周波数範囲よりも値が低い周波数にわたる、請求項1に記載の方法。
- サブバンド信号の前記第3のグループを生成することは、
ハイバンド励振信号を生成するために前記高調波拡張信号を被変調雑音と混合することと、ここにおいて、前記被変調雑音と前記高調波拡張信号とが混合ファクタに基づいて混合される、
前記ハイバンド励振信号をサブバンド信号の前記第3のグループ中にフィルタ処理することと
を備える、請求項1に記載の方法。 - 前記混合ファクタが、ピッチラグ、サブバンド信号の前記第1のグループに関連する適応コードブック利得、またはサブバンド信号の前記第1のグループとサブバンド信号の前記第2のグループとの間のピッチ相関のうちの少なくとも1つに基づいて決定される、請求項6に記載の方法。
- サブバンド信号の前記第3のグループを生成することは、
前記高調波拡張信号を複数のサブバンド信号中にフィルタ処理することと、
複数のハイバンド励振信号を生成するために前記複数のサブバンド信号の各サブバンド信号を被変調雑音と混合することと、ここにおいて、前記複数のハイバンド励振信号がサブバンド信号の前記第3のグループに対応する、
を備える、請求項1に記載の方法。 - 前記被変調雑音と前記複数のサブバンド信号の第1のサブバンド信号とが第1の混合ファクタに基づいて混合され、前記被変調雑音と前記複数のサブバンド信号の第2のサブバンド信号とが第2の混合ファクタに基づいて混合される、請求項8に記載の方法。
- オーディオ信号を第1の周波数範囲内のサブバンド信号の第1のグループと第2の周波数範囲内のサブバンド信号の第2のグループとの中にフィルタ処理するための手段と、
サブバンドの前記第2のグループ中の第1のサブバンドの第1の残差信号を生成するための手段と、
サブバンド信号の前記第1のグループのローバンド励振信号と非線形処理機能とに基づいて高調波拡張信号を生成するための手段と、
前記高調波拡張信号に少なくとも部分的に基づいてサブバンド信号の第3のグループを生成するための手段と、ここにおいて、サブバンド信号の前記第3のグループがサブバンド信号の前記第2のグループに対応する、
サブバンド信号の前記第3のグループ中の第1のサブバンド信号のための第1の調整パラメータと、サブバンド信号の前記第3のグループ中の第2のサブバンド信号のための第2の調整パラメータとを決定するための手段と、ここにおいて、前記第1の調整パラメータがサブバンド信号の前記第1の残差信号に基づき、およびここにおいて、前記第2の調整パラメータがサブバンド信号の前記第2のグループ中の第2のサブバンド信号のメトリックに基づく、
を備える装置。 - 前記第1の調整パラメータと前記第2の調整パラメータとが利得調整パラメータに対応する、請求項10に記載の装置。
- 前記第1の調整パラメータと前記第2の調整パラメータとが線形予測係数調整パラメータに対応する、請求項10に記載の装置。
- スピーチデコーダにおいて、ローバンド励振信号に基づいて高調波拡張信号を生成することと、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンド信号のグループを生成することと、
前記スピーチエンコーダから受信された第1の調整パラメータに基づいてハイバンド励振サブバンド信号の前記グループの第1のサブバンドを調整することと、ここにおいて、前記第1の調整パラメータが前記オーディオ信号の第2の周波数範囲内のサブバンド信号の前記グループ中の第1のサブバンドの第1の残差信号に基づく、
前記スピーチエンコーダから受信された第2の調整パラメータに基づいてハイバンド励振サブバンド信号の前記グループの第2のサブバンドを調整することと、ここにおいて、前記第2の調整パラメータが前記オーディオ信号の前記第2の周波数範囲中の第2のサブバンド信号のメトリックに基づく、
を備える方法。 - ローバンド励振信号に基づいて高調波拡張信号を生成するための手段と、ここにおいて、前記ローバンド励振信号が、スピーチエンコーダから受信されたパラメータに基づいて線形予測ベースデコーダによって生成される、
前記高調波拡張信号に少なくとも部分的に基づいてハイバンド励振サブバンド信号のグループを生成するための手段と、
前記スピーチエンコーダから受信された第1の調整パラメータに基づいてハイバンド励振サブバンド信号の前記グループの第1のサブバンドを調整するための手段と、ここにおいて、前記第1の調整パラメータが前記オーディオ信号の第2の周波数範囲内のサブバンド信号の前記グループ中の第1のサブバンドの第1の残差信号に基づく、
前記スピーチエンコーダから受信された第2の調整パラメータに基づいてハイバンド励振サブバンド信号の前記グループの第2のサブバンドを調整するための手段と、ここにおいて、前記第2の調整パラメータが前記オーディオ信号の前記第2の周波数範囲中の第2のサブバンド信号のメトリックに基づく、
を備える装置。 - スピーチエンコーダにおけるプロセッサによって実行されたとき、請求項1乃至9のいずれか一項に記載の任意の方法を前記プロセッサに行わせる、またはスピーチデコーダにおけるプロセッサによって実行されたとき、請求項13に記載の方法を前記プロセッサに行わせる命令を備える非一時的コンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361916697P | 2013-12-16 | 2013-12-16 | |
US61/916,697 | 2013-12-16 | ||
US14/568,359 | 2014-12-12 | ||
US14/568,359 US10163447B2 (en) | 2013-12-16 | 2014-12-12 | High-band signal modeling |
PCT/US2014/070268 WO2015095008A1 (en) | 2013-12-16 | 2014-12-15 | High-band signal modeling |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016541032A JP2016541032A (ja) | 2016-12-28 |
JP2016541032A5 true JP2016541032A5 (ja) | 2018-01-11 |
JP6526704B2 JP6526704B2 (ja) | 2019-06-05 |
Family
ID=53369248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016558544A Active JP6526704B2 (ja) | 2013-12-16 | 2014-12-15 | オーディオ信号を処理するための方法、装置、およびコンピュータ可読媒体 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10163447B2 (ja) |
EP (2) | EP3084762A1 (ja) |
JP (1) | JP6526704B2 (ja) |
KR (2) | KR102424755B1 (ja) |
CN (2) | CN111583955B (ja) |
BR (1) | BR112016013771B1 (ja) |
CA (1) | CA2929564C (ja) |
ES (1) | ES2844231T3 (ja) |
WO (1) | WO2015095008A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
CN106328153B (zh) * | 2016-08-24 | 2020-05-08 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
DE102017105043A1 (de) * | 2017-03-09 | 2018-09-13 | Valeo Schalter Und Sensoren Gmbh | Verfahren zum Bestimmen eines Funktionszustands eines Ultraschallsensors mittels einer Übertragungsfunktion des Ultraschallsensors, Ultraschallsensorvorrichtung sowie Kraftfahrzeug |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
EP3576088A1 (en) * | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US6141638A (en) | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
US7117146B2 (en) | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6449313B1 (en) | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
CA2399706C (en) | 2000-02-11 | 2006-01-24 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
WO2002023536A2 (en) | 2000-09-15 | 2002-03-21 | Conexant Systems, Inc. | Formant emphasis in celp speech coding |
US6766289B2 (en) | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US6993207B1 (en) | 2001-10-05 | 2006-01-31 | Micron Technology, Inc. | Method and apparatus for electronic image processing |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7047188B2 (en) | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7788091B2 (en) | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
UA92742C2 (ru) * | 2005-04-01 | 2010-12-10 | Квелкомм Инкорпорейтед | Способ и устройство для кодирования речевых сигналов с расщеплением полосы |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US8612216B2 (en) * | 2006-01-31 | 2013-12-17 | Siemens Enterprise Communications Gmbh & Co. Kg | Method and arrangements for audio signal encoding |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US9009032B2 (en) | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101375582B1 (ko) * | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
CN100487790C (zh) * | 2006-11-21 | 2009-05-13 | 华为技术有限公司 | 选择自适应码本激励信号的方法和装置 |
BRPI0720266A2 (pt) | 2006-12-13 | 2014-01-28 | Panasonic Corp | Dispositivo de decodificação de aúdio e método de ajuste de potência |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
JP5812998B2 (ja) | 2009-11-19 | 2015-11-17 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
BR112012024360B1 (pt) * | 2010-07-19 | 2020-11-03 | Dolby International Ab | sistema configurado para gerar uma pluralidade de sinais de áudio de sub-banda de alta frequência, decodificador de áudio, codificador, método para gerar uma pluralidade de sinais de sub-banda de alta frequência, método para decodificar um fluxo de bits, método para gerar dados de controle a partir de um sinal de áudio e meio de armazenamento |
ES2938725T3 (es) * | 2010-09-16 | 2023-04-14 | Dolby Int Ab | Transposición armónica basada en bloque de subbanda mejorado de producto cruzado |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2710590B1 (en) | 2011-05-16 | 2015-10-07 | Google, Inc. | Super-wideband noise supression |
CN102802112B (zh) | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
-
2014
- 2014-12-12 US US14/568,359 patent/US10163447B2/en active Active
- 2014-12-15 CA CA2929564A patent/CA2929564C/en active Active
- 2014-12-15 EP EP14824286.0A patent/EP3084762A1/en not_active Withdrawn
- 2014-12-15 CN CN202010353901.4A patent/CN111583955B/zh active Active
- 2014-12-15 JP JP2016558544A patent/JP6526704B2/ja active Active
- 2014-12-15 WO PCT/US2014/070268 patent/WO2015095008A1/en active Application Filing
- 2014-12-15 EP EP18206593.8A patent/EP3471098B1/en active Active
- 2014-12-15 BR BR112016013771-0A patent/BR112016013771B1/pt active IP Right Grant
- 2014-12-15 KR KR1020217029315A patent/KR102424755B1/ko active IP Right Grant
- 2014-12-15 KR KR1020167016998A patent/KR102304152B1/ko active IP Right Grant
- 2014-12-15 ES ES18206593T patent/ES2844231T3/es active Active
- 2014-12-15 CN CN201480067799.4A patent/CN105830153B/zh active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6526704B2 (ja) | オーディオ信号を処理するための方法、装置、およびコンピュータ可読媒体 | |
JP2016541032A5 (ja) | ||
JP6752936B2 (ja) | ノイズ変調とゲイン調整とを実行するシステムおよび方法 | |
JP6345780B2 (ja) | ハイバンドコーディングにおける選択的位相補償 | |
AU2019203827B2 (en) | Estimation of mixing factors to generate high-band excitation signal | |
US20150149157A1 (en) | Frequency domain gain shape estimation |