JP6469664B2

JP6469664B2 - ハイバンド励振信号を生成するための混合係数の推定

Info

Publication number: JP6469664B2
Application number: JP2016521680A
Authority: JP
Inventors: アッティ、ベンカトラマン・エス．; クリシュナン、ベンカテシュ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-10-11
Filing date: 2014-10-09
Publication date: 2019-02-13
Anticipated expiration: 2034-10-09
Also published as: CN105612578B; SG11201601790QA; RU2016116044A3; HUE036838T2; AU2019203827A1; AU2014331890A1; MY182788A; SA516370877B1; ES2660605T3; SI3055861T1; CA2925573C; AU2014331890B2; PH12016500506B1; RU2672179C2; PH12016500506A1; EP3055861A1; CL2016000818A1; DK3055861T3; US20180268839A1; HK1220033A1

Description

優先権の主張
[0001]本出願は、参照によってすべての内容が組み込まれる、２０１３年１０月１１日に出願された「ＥＳＴＩＭＡＴＩＯＮＯＦＭＩＸＩＮＧＦＡＣＴＯＲＳＴＯＧＥＮＥＲＡＴＥＨＩＧＨ−ＢＡＮＤＥＸＣＩＴＡＴＩＯＮＳＩＧＮＡＬ」という名称の米国仮特許出願第６１／８８９，７２７号、および２０１４年１０月８日に出願された「ＥＳＴＩＭＡＴＩＯＮＯＦＭＩＸＩＮＧＦＡＣＴＯＲＳＴＯＧＥＮＥＲＡＴＥＨＩＧＨ−ＢＡＮＤＥＸＣＩＴＡＴＩＯＮＳＩＧＮＡＬ」という名称の米国非仮特許出願第１４／５０９，６７６号の優先権を主張するものである。

[0002]本開示は、一般に、信号処理に関する。

[0003]技術の進歩が、より小さくより強力なコンピューティングデバイスをもたらしている。たとえば、現在、小さく、軽く、ユーザによって容易に持ち運ばれるポータブルワイヤレス電話、携帯情報端末（ＰＤＡ）、およびページングデバイスなどのワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが存在する。より具体的には、セルラー電話およびインターネットプロトコル（ＩＰ）電話などのポータブルワイヤレス電話は、ワイヤレスネットワークを介して音声およびデータパケットを通信することができる。さらに、多くのそのようなワイヤレス電話は、内蔵されている他のタイプのデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラと、デジタルビデオカメラと、デジタルレコーダと、オーディオファイルプレーヤとを含むこともできる。

[0004]従来の電話システム（たとえば、公衆交換電話網（ＰＳＴＮ））では、信号帯域幅は、３００ヘルツ（Ｈｚ）〜３．４キロヘルツ（ｋＨｚ）の周波数範囲に限定される。セルラー式テレフォニーおよびボイスオーバーインターネットプロトコル（ＶｏＩＰ）などの広帯域（ＷＢ）適用例では、信号帯域幅は、５０Ｈｚ〜７ｋＨｚの周波数範囲に及ぶことがある。超広帯域（ＳＷＢ）コーディング技法は、約１６ｋＨｚまで延びる帯域幅をサポートする。信号帯域幅を３．４ｋＨｚにおける狭帯域テレフォニーから１６ｋＨｚのＳＷＢテレフォニーまで拡張することによって、信号再構成、了解度、および自然度の品質を改善することができる。

[0005]ＳＷＢコーディング技法は、通常、信号の低周波数部分（たとえば、５０Ｈｚ〜７ｋＨｚ、「ローバンド」とも呼ばれる）を符号化および伝送することを含む。たとえば、ローバンドは、フィルタパラメータおよび／またはローバンド励振信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分（たとえば、７ｋＨｚ〜１６ｋＨｚ、「ハイバンド」とも呼ばれる）は、完全に符号化および伝送されないことがある。代わりに、受信機は、ハイバンドを予測するために信号モデリングを利用することがある。いくつかの実装形態では、ハイバンドに関連付けられたデータは、予測の助けとなるために受信機に供給され得る。そのようなデータは「サイド情報」と呼ばれることがあり、サブフレーム、利得情報、線スペクトル周波数（ＬＳＦ、線スペクトル対（ＬＳＰ）とも呼ばれる）などの間における発展を平滑化するための混合係数を含み得る。ローバンド信号がハイバンド信号に十分に相関するとき、信号モデルを使用するハイバンド予測は許容可能に正確であり得る。しかしながら、ノイズの存在下では、ローバンドとハイバンドの相関が弱いことがあり、信号モデルは、もはやハイバンドを正確に表すことができないことがある。この結果、受信機においてアーティファクト（たとえば、歪み語音）が生じる。

[0006]閉ループ分析を使用して混合係数を推定するシステムおよび方法が開示される。ハイバンド符号化は、ローバンド分析（たとえば、ローバンド線形予測（ＬＰ）分析）を使用して生成されたローバンド励振信号からハイバンド励振信号を生成することを含み得る。ハイバンド励振信号は、高調波的に拡張された信号を変調されたノイズ（たとえば、ホワイトノイズ）と混合することによって生成され得る。高調波的に拡張された信号と変調されたノイズとが混合される比は、信号再構成品質に影響を及ぼし得る。バックグラウンドノイズの存在下では、ローバンドとハイバンドとの相関が損なわれることがあり、また高調波的に拡張された信号はハイバンド合成に不適切となることがある。たとえば、ハイバンド励振信号は、ハイバンドから独立したフレーム内に、ローバンドの変動を原因とする可聴アーティファクトを導入し得る。説明される技術によれば、高調波的に拡張された信号と変調されたノイズとが混合される比は、ハイバンドを表す信号（たとえばハイバンド残余信号）に基づいて調節され得る。たとえば、本明細書で説明される技術は、高調波的に拡張された信号と変調されたノイズとが混合される比を決定するために使用される混合係数の閉ループ推定を可能にし得る。この閉ループ推定は、ハイバンド励振信号とハイバンド残余信号との差を低減し（たとえば最小化し）、それによって、ローバンドにおける変動をより受けにくく、ハイバンドをよりよく表すハイバンド励振信号を生成し得る。

[0007]特定の実施形態では、ある方法が、音声エンコーダにおいて、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することを含む。この方法はまた、オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することを含む。この方法はさらに、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することを含む。変調されたノイズは、高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく。

[0008]別の特定の実施形態では、ある装置が、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための線形予測分析フィルタを含む。その装置はまた、オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための非線形変換生成器を含む。この装置は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための混合係数計算器をさらに含む。変調されたノイズは、高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく。

[0009]別の特定の実施形態では、非一時的コンピュータ可読媒体が、プロセッサによって実行されたとき、プロセッサに、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することを行わせる命令を含む。この命令はまた、プロセッサに、オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することを行わせるように実行可能である。この命令はまた、プロセッサに、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することを行わせるように実行可能である。変調されたノイズは、高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく。

[0010]別の特定の実施形態では、ある装置が、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための手段を含む。この装置はまた、オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための手段を含む。この装置はさらに、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための手段を含む。変調されたノイズは、高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく。

[0011]別の特定の実施形態では、ある方法が、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することを含む。ハイバンドサイド情報は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定された混合係数を含む。この方法はまた、ハイバンドサイド情報とローバンド励振信号とに基づいてハイバンド励振信号を生成することを含む。

[0012]別の特定の実施形態では、ある装置が、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信するように構成された音声デコーダを含む。ハイバンドサイド情報は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定された混合係数を含む。この音声デコーダは、ハイバンドサイド情報とローバンド励振信号とに基づいてハイバンド励振信号を生成するようにさらに構成される。

[0013]別の特定の実施形態では、ある方法が、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信するための手段を含む。ハイバンドサイド情報は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定された混合係数を含む。この装置はまた、ハイバンドサイド情報とローバンド励振信号とに基づいてハイバンド励振信号を生成するための手段を含む。

[0014]別の特定の実施形態では、非一時的コンピュータ可読媒体が、プロセッサによって実行されたとき、プロセッサに、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することを行わせる命令を含む。ハイバンドサイド情報は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定された混合係数を含む。この命令はまた、プロセッサに、ハイバンドサイド情報とローバンド励振信号とに基づいてハイバンド励振信号を生成することを行わせるように実行可能である。

[0015]開示される実施形態の少なくとも１つによってもたらされる特定の利点には、ハイバンドの特性に基づいてハイバンド合成の間に使用される混合係数を動的に調節する能力が含まれる。たとえば、混合係数は、ハイバンド合成の間に使用されるハイバンド残余信号とハイバンド励振信号との間の誤差を低減するように、閉ループ分析を使用して決定され得る。本開示の他の態様、利点、および特徴は、「図面の簡単な説明」と、「発明を実施するための形態」と、「特許請求の範囲」とを含めて本願全体を再検討した後に明白になる。

[0016]混合係数を推定するように動作可能であるシステムの特定の実施形態を示すための図。 [0017]ハイバンド励振信号を生成するために混合係数を推定するように動作可能であるシステムの特定の実施形態を示すための図。 [0018]ハイバンド励振信号を生成するために閉ループ分析を使用して混合係数を推定するように動作可能であるシステムの特定の実施形態を示すための図。 [0019]混合係数を使用してオーディオ信号を再生するように動作可能であるシステムの特定の実施形態を示すための図。 [0020]混合係数を使用してハイバンド信号を再生するための方法の特定の実施形態を示すためのフローチャート。 [0021]図１〜図５のシステムおよび方法による信号処理動作を実施するように動作可能なワイヤレスデバイスのブロック図。

[0022]図１を参照すると、（たとえば閉ループ分析を使用して）混合係数を推定するように動作可能であるシステムの特定の実施形態が示されており、全体的に１００として示されている。特定の一実施形態では、システム１００は、符号化システムまたは装置（たとえば、ワイヤレス電話またはコーダ／デコーダ（ＣＯＤＥＣ）内）に統合され得る。他の特定の実施形態では、システム１００は、セットトップボックス、音楽プレーヤ、映像プレーヤ、娯楽装置、ナビゲーションデバイス、通信デバイス、ＰＤＡ、固定ロケーションデータユニット、またはコンピュータに統合され得る。

[0023]以下の説明では、図１のシステム１００によって実施される様々な機能は、ある特定の構成要素またはモジュールによって実施されると説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分割は、説明のためにすぎない。代替実施形態では、その代わり、特定のコンポーネントまたはモジュールによって実施される機能が、複数のコンポーネントまたはモジュールに分割されてもよい。その上、代替実施形態では、図１の２つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに統合されてもよい。図１に示される各構成要素またはモジュールは、ハードウェア（たとえば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、コントローラなど）を使用して実施されてもよいし、ソフトウェア（たとえば、プロセッサによって実行可能な命令）を使用して実施されてもよいし、これらの任意の組合せを使用して実施されてもよい。

[0024]システム１００は、入力オーディオ信号１０２を受信するように構成された分析フィルタバンク１１０を含む。たとえば、入力オーディオ信号１０２は、マイクロフォンまたは他の入力デバイスによって供給され得る。特定の一実施形態では、入力オーディオ信号１０２は、発話を含むことができる。入力オーディオ信号１０２は、約５０Ｈｚ〜約１６ｋＨｚの周波数範囲内のデータを含むＳＷＢ信号であってよい。分析フィルタバンク１１０は、周波数に基づいて入力オーディオ信号１０２をフィルタ処理して複数の部分にし得る。たとえば、分析フィルタバンク１１０はローバンド信号１２２とハイバンド信号１２４とを生成し得る。ローバンド信号１２２およびハイバンド信号１２４は、等しい帯域幅を有しても等しくない帯域幅を有してもよく、また重複しても重複しなくてもよい。代替実施形態では、分析フィルタバンク１１０は３つ以上の出力を生成し得る。

[0025]図１の例では、ローバンド信号１２２とハイバンド信号１２４は、重複しない周波数帯域を占有する。たとえば、ローバンド信号１２２とハイバンド信号１２４は、５０Ｈｚ〜７ｋＨｚと７ｋＨｚ〜１６ｋＨｚとの重複しない周波数帯域を占有し得る。代替実施形態では、ローバンド信号１２２およびハイバンド信号１２４は、それぞれ５０Ｈｚ〜８ｋＨｚおよび８ｋＨｚ〜１６ｋＨｚの重複しない周波数帯域を占有し得る。別の代替実施形態では、ローバンド信号１２２とハイバンド信号１２４が重複し（たとえば、５０Ｈｚ〜８ｋＨｚおよび７ｋＨｚ〜１６ｋＨｚ）、これによって、分析フィルタバンク１１０のローパスフィルタおよびハイパスフィルタがスムーズなロールオフを有することを可能にし得、これによって、設計を単純化し、ハイパスフィルタおよびローパスフィルタのコストを低減し得る。ローバンド信号１２２とハイバンド信号１２４とを重複させることは、受信機におけるローバンド信号とハイバンド信号との滑らかな混合をも可能にし得、これは、より少数の可聴アーティファクトをもたらし得る。

[0026]図１の例はＳＷＢ信号の処理を示しているが、これは説明のためのものにすぎないことに留意されたい。代替実施形態では、入力オーディオ信号１０２は、約５０Ｈｚ〜約８ｋＨｚの周波数範囲を有するＷＢ信号であり得る。そのような実施形態では、ローバンド信号１２２は、約５０Ｈｚ〜約６．４ｋＨｚの周波数範囲に対応し得、ハイバンド信号１２４は、約６．４ｋＨｚ〜約８ｋＨｚの周波数範囲に対応し得る。

[0027]システム１００は、ローバンド信号１２２を受信するように構成されたローバンド分析モジュール１３０を含み得る。特定の実施形態では、ローバンド分析モジュール１３０は、符号励振線形予測（ＣＥＬＰ）エンコーダの一実施形態を表し得る。ローバンド分析モジュール１３０は、ＬＰ分析およびコーディングモジュール１３２と、線形予測係数（ＬＰＣ）−ＬＳＰ変換モジュール１３４と、量子化器１３６とを含み得る。ＬＳＰはまたＬＳＦと呼ばれることもあり、２つの用語（ＬＳＰおよびＬＳＦ）が本明細書で互換的に使用され得る。ＬＰ分析およびコーディングモジュール１３２は、ローバンド信号１２２のスペクトルエンベロープをＬＰＣのセットとして符号化し得る。ＬＰＣは、オーディオの各フレーム（たとえば、１６ｋＨｚのサンプリングレートにおける３２０個のサンプルに対応する、オーディオの２０ミリ秒（ｍｓ））、オーディオの各サブフレーム（たとえば、オーディオの５ｍｓ）、またはそれらの任意の組合せについて、生成され得る。各フレームまたはサブフレームに対して生成されるＬＰＣの数は、実施されるＬＰ分析の「次数」によって決定され得る。特定の実施形態では、ＬＰ分析およびコーディングモジュール１３２は、１０次ＬＰ分析に対応する１１個のＬＰＣのセットを生成し得る。

[0028]ＬＰＣ−ＬＳＰ変換モジュール１３４は、ＬＰ分析およびコーディングモジュール１３２によって生成されたＬＰＣのセットを（たとえば１対１変換を使用して）ＬＳＰの対応するセットに変換し得る。あるいは、ＬＰＣのセットは、パーコール係数、ログ面積比値、イミタンススペクトル対（ＩＳＰ）、またはイミタンススペクトル周波数（ＩＳＦ）の対応するセットに一対一に変換され得る。ＬＰＣのセットとＬＳＰのセットとの間の変換は、誤差なしに可逆であり得る。

[0029]量子化器１３６は、変換モジュール１３４によって生成されたＬＳＰのセットを量子化し得る。たとえば、量子化器１３６は、複数のエントリ（たとえば、ベクトル）を含む複数のコードブックを含むかまたはそれらに結合され得る。ＬＳＰのセットを量子化するために、量子化器１３６は、ＬＳＰのセット「に最も近い」（たとえば、最小２乗または平均２乗誤差などの歪み尺度に基づいて）コードブックの項目を特定し得る。量子化器１３６は、コードブック内の特定された項目の場所に対応するインデックス値または一連のインデックス値を出力し得る。したがって、量子化器１３６の出力は、ローバンドビットストリーム１４２に含まれるローバンドフィルタパラメータを表し得る。

[0030]ローバンド分析モジュール１３０はまた、ローバンド励振信号１４４を生成し得る。たとえば、ローバンド励振信号１４４は、ローバンド分析モジュール１３０によって実施されるＬＰプロセス中に生成されるＬＰ残差信号を量子化することによって生成される符号化された信号であってよい。ＬＰ残差信号は、予測誤差を表し得る。

[0031]システム１００は、分析フィルタバンク１１０からのハイバンド信号１２４とローバンド分析モジュール１３０からのローバンド励振信号１４４とを受け取るように構成されたハイバンド分析モジュール１５０をさらに含み得る。ハイバンド分析モジュール１５０は、ハイバンド信号１２４およびローバンド励振信号１４４に基づいてハイバンドサイド情報１７２を生成し得る。たとえば、ハイバンドサイド情報１７２は、本明細書でさらに説明するように、ハイバンドＬＳＰと、利得情報と、混合係数（α）とを含み得る。

[0032]ハイバンド分析モジュール１５０は、ハイバンド励振生成器１６０を含み得る。ハイバンド励振生成器１６０は、ローバンド励振信号１４４のスペクトルをハイバンド周波数範囲（たとえば、７ｋＨｚ〜１６ｋＨｚ）へと拡張することによって、ハイバンド励振信号１６１を生成し得る。説明のために、ハイバンド励振生成器１６０は、変換をローバンド励振信号１４４に適用し（たとえば、絶対値または平方演算などの非線形変換）得、ハイバンド励振信号１６１を生成するために、高調波的に拡張された信号をノイズ信号（たとえば、ローバンド信号１２２のゆっくり変化する時間特性を模倣するローバンド励振信号１４４に対応するエンベロープに従って変調されたホワイトノイズ）と混合し得る。たとえば、混合は、以下の式に従って実施され得る。

[0033]高調波的に拡張された信号と変調されたノイズとが混合される比は、受信機におけるハイバンド再構成品質に影響を及ぼし得る。有声音声信号の場合、混合は、高調波的に拡張されたものの方へ偏らされ得る（たとえば、混合係数αは０．５〜１．０の範囲にあり得る）。無声信号の場合、混合は、変調されたノイズの方へ偏らされ得る（たとえば、混合係数αは０．０〜０．５の範囲にあり得る）。

[0034]状況によっては、高調波的に拡張された信号は、ハイバンド信号１２４とノイズの多いローバンド信号１２２との相関が不十分であることにより、ハイバンド合成において使用するのに不適切となり得る。たとえば、ローバンド信号１２２は（したがって高調波的に拡張された信号は）、ハイバンド信号１２４においては模倣され得ない高頻度の変動を含み得る。一般に、混合係数αは、有声音に関連付けられる特定のフレームの強度と無声音に関連付けられる特定のフレームの強度とを模倣するローバンド有声化パラメータに基づいて決定され得る。しかしながら、ノイズの存在下で、そのような様式で混合係数αを決定することによって、サブフレームごとに大きい変動が生じ得る。たとえば、ノイズにより、４つの連続するサブフレームに対する混合パラメータαは０．９、０．２５、０．８、および０．１５となり、結果として、騒音の多い（ｂｕｚｚｙ）アーティファクトまたは変調アーティファクトが生じ得る。その上、大量の量子化歪みが存在し得る。

[0035]このようにして、ハイバンド励振生成器１６０は、図２〜図３に関して説明したように、混合係数αを推定するための混合係数計算器１６２を含み得る。たとえば、混合係数計算器１６２は、ハイバンド信号１２４の特性に基づいて混合係数（α）を生成し得る。たとえば、混合係数（α）を推定するために、ハイバンド信号１２４の残余が使用され得る。特定の実施形態では、混合係数計算器１６２は、ハイバンド信号１２４の残余とハイバンド励振信号１６１との差の平均２乗誤差を低減する混合係数（α）を生成し得る。ハイバンド信号１２４の残余は、ＬＰＣのセットを生成するためにハイバンド信号１２４に対して線形予測を実施することによって（たとえばハイバンド信号１２４のスペクトルエンベロープを符号化することによって）生成され得る。たとえば、ハイバンド分析モジュール１５０はまた、ＬＰ分析およびコーディングモジュール１５２と、ＬＰＣ−ＬＳＰ変換モジュール１５４と、量子化器１５６とを含み得る。ＬＰ分析およびコーディングモジュール１５２はＬＰＣのセットを生成し得る。ＬＰＣのセットは、変換モジュール１５４によってＬＳＰに変換され、コードブック１６３に基づいて量子化器１５６によって量子化され得る。

[0036]ハイバンド励振信号１６１は、ハイバンドサイド情報１７２に含まれる１つまたは複数のハイバンド利得パラメータを決定するために使用され得る。ＬＰ分析およびコーディングモジュール１５２、変換モジュール１５４、および量子化器１５６の各々は、ローバンド分析モジュール１３０の対応する構成要素に関して上記で説明したように機能し得るが、（たとえば、より少数の、各係数に対するビット、ＬＳＰなどを使用して）比較的低解像度で機能し得る。ＬＰ分析およびコーディングモジュール１５２は、変換モジュール１５４によってＬＳＰに変換されコードブック１６３に基づいて量子化器１５６によって量子化されるＬＰＣのセットを生成し得る。たとえば、ＬＰ分析およびコーディングモジュール１５２、変換モジュール１５４、および量子化器１５６は、ハイバンドサイド情報１７２に含まれるハイバンドフィルタ情報（たとえば、ハイバンドＬＳＰ）を決定するためにハイバンド信号１２４を使用し得る。特定の実施形態では、ハイバンドサイド情報１７２は、ハイバンドＬＳＰ、ハイバンド利得パラメータ、および混合係数（α）を含み得る。

[0037]ローバンドビットストリーム１４２およびハイバンドサイド情報１７２は、出力ビットストリーム１９２を生成するためにマルチプレクサ（ＭＵＸ）１８０によって多重化され得る。出力ビットストリーム１９２は、入力オーディオ信号１０２に対応する符号化されたオーディオ信号を表し得る。たとえば、出力ビットストリーム１９２は（たとえば、ワイヤード、ワイヤレス、または光チャネル上で）送信され、および／または記憶され得る。受信機において、オーディオ信号（たとえば、スピーカーまたは他の出力デバイスに与えられる入力オーディオ信号１０２の再構成されたバージョン）を生成するために、逆方向演算が、デマルチプレクサ（ＤＥＭＵＸ）、ローバンドデコーダ、ハイバンドデコーダ、およびフィルタバンクによって実施され得る。ローバンドビットストリーム１４２を表すために使用されるビット数は、ハイバンドサイド情報１７２を表すために使用されるビット数よりも実質的に大きいことがある。したがって、出力ビットストリーム１９２中のビットの大部分は、ローバンドデータを表し得る。ハイバンドサイド情報１７２は、信号モデルに従ってローバンドデータからハイバンド励振信号を再生するために受信機で使用され得る。たとえば、この信号モデルは、ローバンドデータ（たとえば、ローバンド信号１２２）とハイバンドデータ（たとえば、ハイバンド信号１２４）の関係または相関関係の予測されるセットを表し得る。したがって、異なる種類のオーディオデータ（たとえば、発話、音楽など）に異なる信号モデルが使用されてよく、使用中の特定の信号モデルは、符号化されたオーディオデータの通信の前に、送信機および受信機によって取り決められてよい（または業界標準によって定義されてよい）。その信号モデルを使用して、送信機におけるハイバンド分析モジュール１５０は、受信機における対応するハイバンド分析モジュールが、出力ビットストリーム１９２からハイバンド信号１２４を再構成するためにその信号モデルを使用することが可能であるように、ハイバンドサイド情報１７２を生成することが可能であり得る。

[0038]たとえば、量子化器１５６は、変換モジュール１５４によって供給されるＬＳＰなどの、スペクトル周波数値のセットを量子化するように構成され得る。他の実施形態では、量子化器１５６は、ＬＳＦまたはＬＳＰに加えて、またはその代わりに、１つまたは複数の他のタイプのスペクトル周波数値のセットを受け取って量子化し得る。たとえば、量子化器１５６は、ＬＰ分析およびコーディングモジュール１５２によって生成されたＬＰＣのセットを受け取って量子化し得る。他の例としては、量子化器１５６において受け取られ量子化され得る、パーコール係数、ログ面積比値、およびＩＳＦのセットがある。量子化器１５６は、入力ベクトル（たとえば、ベクトル形式のスペクトル周波数値のセット）をコードブック１６３などの表またはコードブック中の対応するエントリへのインデックスとして符号化するベクトル量子化器を含み得る。別の例として、量子化器１５６は１つまたは複数のパラメータを決定するように構成されてよく、疎な（ｓｐａｒｓｅ）コードブック実施形態などでは、入力ベクトルは、ストレージから取り出されるのではなく、これらのパラメータからデコーダで動的に生成され得る。説明のために、疎なコードブックの例は、３ＧＰＰ（登録商標）２（第３世代パートナーシップ２）ＥＶＲＣ（ＥｎｈａｎｃｅｄＶａｒｉａｂｌｅＲａｔｅＣｏｄｅｃ）などのＣＥＬＰおよびコーデックなどのコーディング方式において適用され得る。別の実施形態では、ハイバンド分析モジュール１５０は、量子化器１５６を含むことができ、（たとえば、フィルタパラメータのセットに従って）合成信号を生成するためにいくつかのコードブックベクトルを使用し、知覚的に加重された領域などにおいてハイバンド信号１２４に最も良く適合する合成信号に関連付けられたコードブックベクトルのうち１つを選択するように構成され得る。

[0039]システム１００は、時間的および利得パラメータの過大評価が原因で起こり得るアーティファクトを低減し得る。たとえば、混合係数計算器１６２は、ハイバンド予測の間のハイバンド推定の精度を改善するために閉ループ分析を使用して混合係数（α）を決定し得る。ハイバンド推定の精度を改善することにより、増大したノイズがローバンドとハイバンドとの相関を低下させるシナリオにおいて、アーティファクトが低減され得る。ハイバンド分析モジュール１５０は、ハイバンドの特性（たとえばハイバンド残余信号）を使用してハイバンドを予測し、そのハイバンド残余信号をモデル化するハイバンド励振信号１６１を発生させるように混合係数（α）を推定し得る。ハイバンド分析モジュール１５０は、他のハイバンドサイド情報１７２とともに混合係数（α）を受信機に送信し得、それによって受信機は、逆の動作を実施して入力オーディオ信号１０２を再構成することが可能となり得る。

[0040]図２を参照すると、ハイバンド励振信号を生成するための混合係数を推定するように動作可能であるシステム２００の特定の例示的な実施形態が示されている。システム２００は、線形予測分析フィルタ２０４と、非線形変換生成器２０７と、混合係数計算器２１２と、混合器２１１とを含んでいる。システム２００は、図１のハイバンド分析モジュール１５０を使用して実装され得る。特定の実施形態では、混合係数計算器２１２は、図１の混合係数計算器１６２に対応し得る。

[0041]合成されたハイバンド信号１２４は時間利得計算器２０４にも与えられ得る。線形予測分析フィルタ２０４は、ハイバンド信号１２４（たとえば入力オーディオ信号１０２のハイバンド部分）に基づいてハイバンド残余信号２２４を生成するように構成され得る。たとえば、線形予測分析フィルタ２０４は、ハイバンド信号１２４のスペクトルエンベロープを、ハイバンド信号１２４の将来のサンプルを予測するために使用されるＬＰＣのセットとして符号化し得る。ハイバンド残余信号２２４は、ハイバンド励振信号１６１の誤差を予測するために使用され得る。ハイバンド残余信号２２４は、混合係数計算器２１２の第１の入力に供給され得る。

[0042]ローバンド励振信号１４４は、非線形変換生成器２０７に供給され得る。図１に関して説明したように、ローバンド励振信号１４４は、ローバンド分析モジュール１３０を使用してローバンド信号１２２（たとえば入力オーディオ信号１０２のローバンド部分）から生成され得る。非線形変換生成器２０７は、ローバンド励振信号１４４に基づいて、高調波的に拡張された信号２０８を生成するように構成され得る。たとえば、非線形変換生成器２０７は、ローバンド励振信号１４４のフレームに対して絶対値演算または平方演算を実施して、高調波的に拡張された信号２０８を生成し得る。

[0043]説明のために、非線形変換生成器２０７は、ローバンド励振信号１４４（たとえば約０ｋＨｚ〜８ｋＨｚに及ぶ８ｋＨｚ信号）をアップサンプリングして、約０ｋＨｚ〜１６ｋＨｚに及ぶ１６ｋＨｚ信号（たとえばローバンド励振信号１４４の約２倍のバンド幅を有する信号）を生成し得る。１６ｋＨｚ信号のローバンド部分（たとえば約０ｋＨｚ〜８ｋＨｚ）が、ローバンド励振信号１４４と実質的に同様の高調波を有してもよく、また１６ｋＨｚ信号のハイバンド部分（たとえば約８ｋＨｚ〜１６ｋＨｚ）が、実質的に高調波を持たなくてもよい。非線形変換生成器２０４は、１６ｋＨｚ信号のローバンド部分における「優勢な」高調波を１６ｋＨｚ信号のハイバンド部分に拡張して、高調波的に拡張された信号２０８を生成し得る。このようにして、高調波的に拡張された信号２０８は、非線形演算（たとえば平方演算および／または絶対値演算）を使用してハイバンドへと拡張する、ローバンド励振信号１４４の高調波的に拡張されたバージョンとなり得る。高調波的に拡張された信号２０８は、エンベロープトラッカー２０２の入力へ、混合係数計算器２１２の第２の入力と、第１の結合器２５４の第１の入力とに供給され得る。

[0044]エンベロープトラッカー２０２は、高調波的に拡張された信号２０８を受信するように、また高調波的に拡張された信号２０８に対応するローバンド時間領域エンベロープ２０３を計算するように構成され得る。たとえば、エンベロープトラッカー２０２は、高調波的に拡張された信号２０８のフレームの各サンプルの平方を計算して２乗値のシーケンスを発生させるように構成され得る。エンベロープトラッカー２０２は、第１次無限インパルス応答（ＩＩＲ）低域フィルタを平方値のシーケンスに適用することなどによって、２乗値のシーケンスに対して平滑化演算を実施するように構成され得る。エンベロープトラッカー２０２は、平滑化されたシーケンスの各サンプルに平方根機能を適用してローバンド時間領域エンベロープ２０３を発生させるように構成され得る。ローバンド時間領域エンベロープ２０３は、ノイズ結合器２４０の第１の入力に供給され得る。

[0045]ノイズ結合器２４０は、変調されたノイズ２２０を発生させるために、ローバンド時間領域エンベロープ２０３をホワイトノイズ生成器（図示せず）によって生成されたホワイトノイズ２０５と結合させるように構成され得る。たとえば、ノイズ結合器２４０は、ローバンド時間領域エンベロープ２０３に従ってホワイトノイズ２０５を振幅変調するように構成され得る。特定の実施形態では、ノイズ結合器２４０は、変調されたノイズ信号２２０を発生させるために、ホワイトノイズ２０５をローバンド時間領域エンベロープ２０３に従ってスケーリングするように構成された乗算器として実装され得る。変調されたノイズ信号２２０は、混合計算器２１２の第３の入力と、第２の結合器２５６の第１の入力とに供給され得る。

[0046]混合係数計算器２１２は、ハイバンド残余信号２２４と、高調波的に拡張された信号２０８と、変調されたノイズ信号２２０とに基づいて混合係数（α）を決定するように構成され得る。混合係数計算器２１２は混合係数（α）を決定し得る。たとえば、混合係数計算器２１２は、ハイバンド残余信号２２４とハイバンド励振信号１６１との差の平均２乗誤差（Ｅ）に基づいて混合係数（α）を決定し得る。ハイバンド励振信号１６１は、以下の式に従って表され得る。

上式で、

はハイバンド励振信号１６１に対応し、αは混合係数に対応し、

は高調波的に拡張された信号２０８に対応し、

は変調されたノイズ信号２２０に対応する。ハイバンド残余信号２２４はＲ_HBと表され得る。

[0047]したがって、誤差（ｅ）は、ハイバンド残余信号２２４とハイバンド励振信号１６１との差に対応し得、以下の式に従って表され得る。

式１で記述されたハイバンド励振信号１６１に対する表現を式２に代入することにより、誤差（ｅ）はハイバンド残余信号２２４とハイバンド励振信号１６１との差として表現され得、以下の式に従って表現され得る。

したがって、ハイバンド残余信号２２４とハイバンド励振信号１６１との差の平均２乗誤差（Ｅ）は、以下の式に従って表現され得る。

[0048]ハイバンド励振信号１６１は、平均２乗誤差（Ｅ）を低減する（たとえば平均２乗誤差（Ｅ）を０に設定する）ことによって、ハイバンド残余信号２２４にほぼ等しくされ得る。式４において平均２乗誤差（Ｅ）を最小化することにより、混合係数（α）は以下の式に従って表現され得る。

特定の実施形態では、ハイバンド残余信号２２４および高調波的に拡張された信号２０８のエネルギーは、式５を使用して混合係数（α）を計算する前に正規化され得る。混合係数（α）は、フレーム（またはサブフレーム）ごとに推定され、図１に関して説明するように、他のハイバンドサイド情報１７２（たとえばハイバンドＬＳＰならびにハイバンド利得パラメータ）とともに出力ビットストリーム１９２で受信機に送信され得る。

[0049]混合計数計算器２１２は、推定された混合計数（α）を第１の結合器２５４の第２の入力と、減算器２５２の入力とに供給し得る。減算器２５２は、１から混合係数（α）を減算し、この差（１−α）を第２の結合器２５６の第２の入力へ供給し得る。第１の結合器２５４は、第１のスケーリングされた信号を生成するための混合係数（α）に従って、高調波的に拡張された信号２０８をスケーリングするように構成された乗算器として実装され得る。第２の結合器２５６は、第２のスケーリングされた信号を生成するための係数（１−α）に基づいて、変調された信号２２０をスケーリングするように構成された乗算器として実装され得る。たとえば、第２の結合器２５６は、減算器２５２で生成された差（１−α）に基づいて、変調されたノイズ信号２２０をスケーリングし得る。第１のスケーリングされた信号および第２のスケーリングされた信号は、混合器２１１に供給され得る。

[0050]混合器２１１は、混合係数（α）と、高調波的に拡張された信号２０８と、変調されたノイズ信号２２０とに基づいて、ハイバンド励振信号１６１を生成し得る。たとえば、混合器２１１は、第１のスケーリングされた信号と第２のスケーリングされた信号とを結合して（たとえば加算して）、ハイバンド励振信号１６１を生成し得る。

[0051]特定の実施形態では、混合係数計算器２１２は、混合係数（α）をオーディオ信号の各フレームに対する複数の混合係数（α）として生成するように構成され得る。たとえば、４つの混合係数α₁、α₂、α₃、α₄はオーディオ信号のフレームに対して生成されてよく、各混合係数（α）は、フレームのそれぞれのサブフレームに対応してよい。

[0052]図２のシステム２００は、ハイバンド予測の間のハイバンド推定の精度を改善するために混合係数（α）を推定し得る。たとえば、混合係数計算器２１２は、ハイバンド残余信号２２４とほぼ同等であるハイバンド励振信号１６１を発生させる混合係数（α）を推定し得る。したがって、増大したノイズがローバンドとハイバンドとの相関を低減させるシナリオにおいて、システム２００は、ハイバンドの特性（たとえばハイバンド残余信号２２４）を使用してハイバンドを予測し得る。他のハイバンドサイド情報１７２とともに混合係数（α）を受信機に送信することにより、受信機は、逆の動作を実施して入力オーディオ信号１０２を再構成することが可能となり得る。

[0053]図３を参照すると、ハイバンド励振信号を生成するために閉ループ分析を使用して混合係数（α）を推定するように動作可能であるシステム３００の、別の特定の例示的な実施形態が示されている。システム３００は、エンベロープトラッカー２０２と、線形予測分析フィルタ２０４と、非線形変換生成器２０７と、ノイズ結合器２４０とを含む。

[0054]図３におけるノイズ結合器２４０の出力は、変調されたノイズ信号２２０を生成するために、ベータ乗算器３０４を使用してノイズスケーリング係数（β）によってスケーリングされ得る。ベータ乗算器３０４は、変調されたホワイトノイズとローバンド励振の高調波拡張との間の電力正規化因子である。変調されたノイズ信号２２０および高調波的に拡張された信号２０８は、ハイバンド励振生成器３０２に供給され得る。たとえば、高調波的に拡張された信号２０８は第１の結合器２５４に供給され得、変調されたノイズ信号２２０は第２の結合器２２０に供給され得る。

[0055]システム３００は、図２に関して説明したように、ハイバンド残余信号２２４とハイバンド励振信号１６１との差の平均２乗誤差（Ｅ）を低減する（たとえば最小化する）混合係数（α）を発見するために、混合係数（α）の値を選択的に増分および／または減分し得る。たとえば、線形予測分析フィルタ２０４は、ハイバンド残余信号２２４を誤差検出回路３０６の第１の入力に供給し得る。ハイバンド励振生成器３０２は、ハイバンド励振信号１６１を誤差検出回路３０６の第２の入力に供給し得る。誤差検出回路３０６は、式３に従ってハイバンド残余信号２２４とハイバンド励振信号１６１との差を決定し得る。この差は誤差信号３６８によって表され得る。誤差信号３６８は、誤差最小化計算器３０８（たとえば誤差制御器）の入力に供給され得る。

[0056]誤差最小化計算器３０８は、混合係数（α）の特定の値に対して、式４に従って平均２乗誤差（Ｅ）を計算し得る。誤差最小化計算器３０８は、より小さい平均２乗誤差（Ｅ）を発生させるために、信号３７０をハイバンド励振生成器３０２に送って混合係数（α）の特定の値を選択的に増分または減分し得る。

[0057]動作の間、誤差最小化計算器３０８は、第１の混合係数（α₁）に基づいて第１の平均２乗誤差（Ｅ₁）を計算し得る。特定の実施形態では、第１の平均２乗誤差（Ｅ₁）を計算すると、誤差最小化計算器３０８は、第２の混合係数（α₂）を生成するために、信号３７０をハイバンド励振生成器３０２に送って第１の混合係数（α₁）を特定の量だけ増分し得る。誤差最小化計算器３０８は、第２の混合係数（α₂）に基づいて第２の平均２乗誤差（Ｅ₂）を計算し得、また、第３の混合係数（α₃）を生成するために、信号３７０をハイバンド励振生成器３０２に送って第２の混合係数（α₂）を特定の量だけ増分し得る。この処理は、平均２乗誤差（Ｅ）の複数の値を生成するために反復され得る。誤差最小化計算器３０８は、平均２乗誤差（Ｅ）のどの値が最小値であるかを決定し得、混合係数（α）は、平均２乗誤差（Ｅ）のより低い値をもたらす特定の値に対応し得る。

[0058]別の特定の実施形態では、第１の平均２乗誤差（Ｅ₁）を計算すると、誤差最小化計算器３０８は、第２の混合係数（α₂）を生成するために、信号３７０をハイバンド励振生成器３０２に送って第１の混合係数（α₁）を特定の量だけ減分し得る。誤差最小化計算器３０８は、第２の混合係数（α₂）に基づいて第２の平均２乗誤差（Ｅ₂）を計算し得、また、第３の混合係数（α₃）を生成するために、信号３７０をハイバンド励振生成器３０２に送って第２の混合係数（α₂）を特定の量だけ減分し得る。この処理は、平均２乗誤差（Ｅ）の複数の値を生成するために反復され得る。誤差最小化計算器３０８は、平均２乗誤差（Ｅ）のどの値が最小値であるかを決定し得、混合係数（α）は、平均２乗誤差（Ｅ）のより低い値をもたらす特定の値に対応し得る。

[0059]特定の実施形態では、複数の混合係数（α）が、オーディオ信号の各フレームに対して使用され得る。たとえば、４つの混合係数α₁、α₂、α₃、α₄はオーディオ信号のフレームに対して生成されてよく、各混合係数（α）は、フレームのそれぞれのサブフレームに対応してよい。混合係数（α）の値は、単一フレーム内でまたは複数のフレームにまたがって混合係数（α）を適応的に平滑化して出力混合係数（α）の変動の出現および／または程度を低減するように増分および／または減分され得る。説明のために、混合係数（α₁）の第１の値は特定のフレームの第１のサブフレームに対応し得、混合係数（α₂）の第２の値は特定のフレームの第２のサブフレームに対応し得る。混合係数（α₃）の第３の値は、混合係数（α₁）の第１の値と混合係数（α₂）の第２の値とに少なくとも部分的に基づき得る。

[0060]図３のシステム３００は、ハイバンド予測の間のハイバンド推定の精度を改善するために閉ループ分析を使用して混合係数（α）を決定し得る。たとえば、誤差検出回路３０６および誤差最小化計算器３０８は、小さい平均２乗誤差（Ｅ）を発生させる（たとえば、ハイバンド残余信号２２４を厳密に模倣するハイバンド励振信号１６１を発生させる）混合係数（α）の値を決定し得る。したがって、増大したノイズがローバンドとハイバンドとの相関を低減させるシナリオにおいて、システム３００は、ハイバンドの特性（たとえばハイバンド残余信号２２４）を使用してハイバンドを予測し得る。他のハイバンドサイド情報１７２とともに混合係数（α）を受信機に送信することにより、受信機は、逆の動作を実施して入力オーディオ信号１０２を再構成することが可能となり得る。

[0061]図４を参照すると、混合係数（α）を使用してオーディオ信号を再生するように動作可能であるシステム４００の特定の例示的な実施形態が示されている。システム４００は、非線形変換生成器４０７と、エンベロープトラッカー４０２と、ノイズ結合器４４０と、第１の結合器４５４と、第２の結合器４５６と、減算器４５２と、混合器４１１とを含む。特定の実施形態では、システム４００は、復号システムまたは装置（たとえば、ワイヤレス電話またはＣＯＤＥＣ内）に統合され得る。他の特定の実施形態では、システム４００は、セットトップボックス、音楽プレーヤ、映像プレーヤ、娯楽装置、ナビゲーションデバイス、通信デバイス、ＰＤＡ、固定ロケーションデータユニット、またはコンピュータに統合され得る。

[0062]非線形変換生成器４０７は、図１のローバンド励振信号１４４を受信するように構成され得る。たとえば、図１のローバンドビットストリーム１４２はローバンド励振信号１４４を含み得、またシステム４００にビットストリーム１９２として送信され得る。非線形変換生成器４０７は、ローバンド励振信号１４４に基づいて、第２の高調波的に拡張された信号４０８を生成するように構成され得る。たとえば、非線形変換生成器４０７は、ローバンド励振信号１４４のフレームに対して絶対値演算または平方演算を実施して、第２の高調波的に拡張された信号４０８を生成し得る。特定の実施形態では、非線形変換生成器４０７は、図２の非線形変換生成器２０７と実質的に同様の方法で動作し得る。第２の高調波的に拡張された信号４０８は、エンベロープトラッカー４０２と第１の結合器４５４とに供給され得る。

[0063]エンベロープトラッカー４０２は、第２の高調波的に拡張された信号４０８を受信するように、また第２の高調波的に拡張された信号４０８に対応する第２のローバンド時間領域エンベロープ４０３を計算するように構成され得る。たとえば、エンベロープトラッカー４０２は、第２の高調波的に拡張された信号４０８のフレームの各サンプルの平方を計算して２乗値のシーケンスを発生させるように構成され得る。エンベロープトラッカー４０２は、第１次ＩＩＲ低域フィルタを平方値のシーケンスに適用することなどによって、２乗値のシーケンスに対して平滑化演算を実施するように構成され得る。エンベロープトラッカー４０２は、平滑化されたシーケンスの各サンプルに平方根機能を適用して第２のローバンド時間領域エンベロープ４０３を発生させるように構成され得る。特定の実施形態では、エンベロープトラッカー４０２は、図２のエンベロープトラッカー２０２と実質的に同様の方法で動作し得る。第２のローバンド時間領域エンベロープ４０３は、ノイズ結合器４４０に供給され得る。

[0064]ノイズ結合器４４０は、第２の変調されたノイズ信号４２０を発生させるために、第２のローバンド時間領域エンベロープ４０３をホワイトノイズ生成器（図示せず）によって生成されたホワイトノイズ４０５と結合させるように構成され得る。たとえば、ノイズ結合器４４０は、第２のローバンド時間領域エンベロープ４０３に従ってホワイトノイズ４０５を振幅変調するように構成され得る。特定の実施形態では、ノイズ結合器４４０は、第２の変調されたノイズ信号４２０を発生させるために、ホワイトノイズ４０５の出力を第２のローバンド時間領域エンベロープ４０３に従ってスケーリングするように構成された乗算器として実装され得る。特定の実施形態では、ノイズ結合器４４０は、図２のノイズ結合器２４０と実質的に同様の方法で動作し得る。第２の変調されたノイズ信号４２０は、送信第２の結合器４５６に供給され得る。

[0065]図２の混合係数（α）は、第１の結合器４５４と減算器４５２とに供給され得る。たとえば、図１のハイバンドサイド情報１７２は混合係数（α）を含み得、またシステム４００に送信され得る。減算器４５２は、１から混合係数（α）を減算し、この差（１−α）を第２の結合器２５６に供給し得る。第１の結合器４５４は、第１のスケーリングされた信号を生成するための混合係数（α）に従って、第２の高調波的に拡張された信号４０８をスケーリングするように構成された乗算器として実装され得る。第２の結合器４５４は、第２のスケーリングされた信号を生成するための係数（１−α）に基づいて、変調されたノイズ信号４２０をスケーリングするように構成された乗算器として実装され得る。たとえば、第２の結合器４５４は、減算器４５２で生成された差（１−α）に基づいて、変調されたノイズ信号４２０をスケーリングし得る。第１のスケーリングされた信号および第２のスケーリングされた信号は、混合器４１１に供給され得る。

[0066]混合器４１１は、混合係数（α）と、第２の高調波的に拡張された信号４０８と、第２の変調されたノイズ信号４２０とに基づいて、第２のハイバンド励振信号４６１を生成し得る。たとえば、混合器４１１は、第１のスケーリングされた信号と第２のスケーリングされた信号とを結合して（たとえば加算して）、第２のハイバンド励振信号４６１を生成し得る。

[0067]図４のシステム４００は、第２のハイバンド励振信号４６１を使用して図１のハイバンド信号１２４を再生し得る。たとえば、システム４００は、ハイバンドサイド情報１７２を介して混合係数（α）を受信することによって、図１〜図２のハイバンド励振信号１６１と実質的に同様である第２のハイバンド励振信号４６１を発生させ得る。第２のハイバンド励振信号４６１は、ハイバンド信号１２４と実質的に同様であるハイバンド信号を生成するために、線形予測係数合成操作を受け得る。

[0068]図５を参照すると、混合係数（α）を使用してハイバンド信号を再生するための方法５００、５１０の特定の実施形態を例示するためのフローチャートが示されている。第１の方法５００は図３のシステム１００〜３００によって実施され得る。第２の方法５１０は図４のシステム４００によって実施され得る。

[0069]第１の方法５００は、５０２においてオーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することを含み得る。たとえば、図２において、線形予測分析フィルタ２０４は、ハイバンド信号１２４（たとえば入力オーディオ信号１２０のハイバンド部分）に基づいてハイバンド残余信号２２４を生成し得る。特定の実施形態では、線形予測分析フィルタ２０４は、ハイバンド信号１２４のスペクトルエンベロープを、ハイバンド信号１２４の将来のサンプルを予測するために使用されるＬＰＣのセットとして符号化し得る。ハイバンド残余信号２２４は、ハイバンド励振信号１６１の誤差を予測するために使用され得る。

[0070]５０４において、高調波的に拡張された信号が、少なくともオーディオ信号のローバンド部分に基づいて生成され得る。たとえば、図１のローバンド励振信号１４４は、ローバンド分析モジュール１３０を使用してローバンド信号１２２（たとえば入力オーディオ信号１０２のローバンド部分）から生成され得る。図２の非線形変換生成器２０７は、ローバンド励振信号１４４に対して絶対値演算または平方演算を実施して、高調波的に拡張された信号２０８を生成し得る。

[0071]５０６において、混合係数が、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズ信号とに基づいて決定され得る。たとえば、図２の混合係数計算器２１２は、ハイバンド残余信号２２４とハイバンド励振信号１６１との差の平均２乗誤差（Ｅ）に基づいて混合係数（α）を決定し得る。閉ループ分析を使用すると、ハイバンド励振信号１６１は、平均２乗誤差（Ｅ）を効果的に最小化する（たとえば平均２乗誤差（Ｅ）を０に設定する）ように、ハイバンド残余信号２２４にほぼ等しくなり得る。図２に関して説明したように、混合係数（α）は以下のように表現され得る。

混合係数（α）は音声デコーダに送信され得る。たとえば、図１のハイバンドサイド情報１７２は混合係数（α）を含み得る。

[0072]５１２において、第２の方法５１０は、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することを含み得る。たとえば、図４の非線形変換生成器４０７は、図１のローバンド励振信号１４４を受信し得る。たとえば、図１のローバンドビットストリーム１４２はローバンド励振信号１４４を含み得、またシステム４００にビットストリーム１９２として送信され得る。第１の結合器４５４および減算器４５２は、ハイバンドサイド情報１７２を受信し得る。ハイバンドサイド情報１７２は、ハイバンド残余信号２２４と、高調波的に拡張された信号２０８と、変調されたノイズ信号２２０とに基づいて決定された混合係数（α）を含み得る。

[0073]５１４において、ハイバンド励振信号が、ハイバンドサイド情報とローバンド励振信号とに基づいて生成され得る。たとえば、図４の混合器４１１は、混合係数（α）と、第２の高調波的に拡張された信号４０８と、変調されたノイズ信号４２０とに基づいて、第２のハイバンド励振信号４６１を生成し得る。

[0074]図５の方法５００、５１０は、ハイバンド予測の間にハイバンド推定の精度を改善するように（たとえば閉ループ分析を使用して）混合係数（α）を推定し得、また混合係数（α）を使用してハイバンド信号１２４を再構成し得る。たとえば、混合係数計算器２１２は、ハイバンド残余信号２２４とほぼ同等であるハイバンド励振信号１６１を発生させる混合係数（α）を推定し得る。したがって、増大したノイズがローバンドとハイバンドとの相関を低減させるシナリオにおいて、方法５００は、ハイバンドの特性（たとえばハイバンド残余信号２２４）を使用してハイバンドを予測し得る。他のハイバンドサイド情報１７２とともに混合係数（α）を受信機に送信することにより、受信機は、逆の動作を実施して入力オーディオ信号１０２を再構成することが可能となり得る。たとえば、図１〜図２のハイバンド励振信号１６１と実質的に同様である第２のハイバンド励振信号４６１が発生され得る。第２のハイバンド励振信号４６１は、ハイバンド信号１２４と実質的に同様である合成されたハイバンド信号を生成するために、線形予測係数合成操作を受け得る。

[0075]特定の実施形態では、図５の方法５００、５１０は、中央処理装置（ＣＰＵ）、ＤＳＰ、またはコントローラなどの処理ユニットのハードウェア（たとえば、ＦＰＧＡデバイス、ＡＳＩＣなど）によって、ファームウェアによって、またはこれらの任意の組合せによって実施されてもよい。一例として、図５の方法５００、５１０は、図６に関して説明したように、命令を実行するプロセッサによって実施され得る。

[0076]図６を参照すると、ワイヤレス通信デバイスの特定の例示的な実施形態のブロック図が示されており、全体的に６００と称されている。デバイス６００は、メモリ６３２に結合されたプロセッサ６１０（たとえば、中央処理装置（ＣＰＵ））を含む。メモリ６３２は、図５の方法５００、５１０などの本明細書で開示される方法およびプロセスを実施するためにプロセッサ６１０および／またはＣＯＤＥＣ６３４によって実行可能な命令６６０を含み得る。

[0077]特定の実施形態では、ＣＯＤＥＣ６３４は、混合係数推定システム６８２と、推定された混合係数に従う復号システム６８４とを含み得る。特定の実施形態では、混合係数推定システム６８２は、図１の混合係数計算器１６２の１つもしくは複数の構成要素、図２のシステム２００の１つもしくは複数の構成要素、および／または図３のシステム３００の１つもしくは複数の構成要素を含む。たとえば、混合係数推定システム６８２は、図１〜図３のシステム１００〜３００および図５の方法５００と関連付けられる符号化操作を実施し得る。特定の実施形態では、復号システム６８４は、図４のシステム４００の１つまたは複数の構成要素を含み得る。たとえば、復号システム６８４は、図４のシステム４００および図５の方法５１０と関連付けられる復号操作を実施し得る。混合係数推定システム６８２および／または復号システム６８４は、専用ハードウェア（たとえば、回路）を介して実施されても、１つまたは複数のタスクを実行するために命令を実行するプロセッサによって実施されても、これらの組合せによって実施されてもよい。

[0078]一例として、メモリ６３２またはＣＯＤＥＣ６３４内のメモリ６９０は、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピントルクトランスファーＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読出し専用メモリ（ＲＯＭ）、プログラマブル読出し専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読出し専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ（ＣＤ−ＲＯＭ）などのメモリデバイスであってよい。メモリデバイスは、コンピュータ（たとえば、ＣＯＤＥＣ６３４内のプロセッサおよび／またはプロセッサ６１０）によって実行されるときにコンピュータに図５の方法５００、５１０の一方の少なくとも一部分を実施させ得る命令（たとえば、命令６６０または命令６９５）を含み得る。一例として、メモリ６３２またはＣＯＤＥＣ６３４内のメモリ６９０は、コンピュータ（たとえば、ＣＯＤＥＣ６３４内のプロセッサおよび／またはプロセッサ６１０）によって実行されるときにコンピュータに図５の方法５００、５１０の一方の少なくとも一部分を実施させる命令（たとえば、それぞれ命令６６０または命令６９５）を含む非一時的コンピュータ可読媒体であってよい。

[0079]デバイス６００はまた、ＣＯＤＥＣ６３４とプロセッサ６１０とに結合されたＤＳＰ６９６を含み得る。特定の実施形態では、ＤＳＰ６９６は、混合係数推定システム６９７と、推定された混合係数に従う復号システム６９８とを含み得る。特定の実施形態では、混合係数推定システム６９７は、図１の混合係数計算器１６２の１つもしくは複数の構成要素、図２のシステム２００の１つもしくは複数の構成要素、および／または図３のシステム３００の１つもしくは複数の構成要素を含む。たとえば、混合係数推定システム６９７は、図１〜図３のシステム１００〜３００および図５の方法５００と関連付けられる符号化操作を実施し得る。特定の実施形態では、復号システム６９８は、図４のシステム４００の１つまたは複数の構成要素を含み得る。たとえば、復号システム６９８は、図４のシステム４００および図５の方法５１０と関連付けられる復号操作を実施し得る。混合係数推定システム６９７および／または復号システム６９８は、専用ハードウェア（たとえば、回路）を介して実施されても、１つまたは複数のタスクを実行するために命令を実行するプロセッサによって実施されても、これらの組合せによって実施されてもよい。

[0080]図６はまた、プロセッサ６１０とディスプレイ６２８とに結合されたディスプレイコントローラ６２６を示している。ＣＯＤＥＣ６３４は、図示のように、プロセッサ６１０に結合され得る。スピーカー６３６およびマイクロフォン６３８はＣＯＤＥＣ６３４に結合可能にされ得る。たとえば、マイクロフォン６３８は図１の入力オーディオ信号１０２を生成し得、ＣＯＤＥＣ６３４は、入力オーディオ信号１０２に基づいて、受信機への送信のための出力ビットストリーム１９２を生成し得る。別の例として、スピーカー６３６は、ＣＯＤＥＣ６３４によって再構成された信号を図１の出力ビットストリーム１９２から出力するために使用されてもよく、出力ビットストリーム１９２は送信機から受け取られる。図６はまた、ワイヤレスコントローラ６４０がプロセッサ６１０とワイヤレスアンテナ６４２とに結合され得ることを示している。

[0081]特定の一実施形態では、プロセッサ６１０、ディスプレイコントローラ６２６、メモリ６３２、ＣＯＤＥＣ６３４、およびワイヤレスコントローラ６４０は、システムインパッケージデバイスまたはシステムオンチップデバイス（たとえば、移動局モデム（ＭＳＭ））６２２に含まれる。特定の一実施形態では、タッチスクリーンおよび／またはキーパッドなどの入力デバイス６３０、ならびに電源６４４は、システムオンチップデバイス６２２に結合される。さらに、特定の実施形態では、図６に示すように、ディスプレイ６２８、入力デバイス６３０、スピーカー６３６、マイクロフォン６３８、ワイヤレスアンテナ６４２、および電源６４４は、システムオンチップデバイス６２２の外部にある。しかしながら、ディスプレイ６２８、入力デバイス６３０、スピーカー６３６、マイクロフォン６３８、ワイヤレスアンテナ６４２、および電源６４４の各々は、インターフェースまたはコントローラなどのシステムオンチップデバイス６２２の構成要素に結合され得る。

[0082]説明した実施形態とともに、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための手段を含んだ第１の装置が開示される。たとえば、ハイバンド残余信号を生成するための手段は、図１の分析フィルタバンク１１０、図１のＬＰ分析およびコーディングモジュール１５２、図２〜図３の線形予測分析フィルタ２０４、図６の混合係数推定システム６８２、図６のＣＯＤＥＣ６３４、図６の混合係数推定システム６９７、図６のＤＳＰ６９６、ハイバンド残余信号を生成するように構成された、フィルタなどの１つもしくは複数のデバイス（たとえば、非一時的コンピュータ可読記憶媒体にて命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。

[0083]第１の装置はまた、オーディオ信号のローバンド部分に少なくとも部分的に基づいて高調波的に拡張された信号を生成するための手段を含み得る。たとえば、高調波的に拡張された信号を生成するための手段は、図１の分析フィルタバンク１１０、図１のローバンド分析フィルタ１３０もしくはその構成要素、図２〜図３の非線形変換生成器２０７、図６の混合係数推定システム６８２、図６の混合係数推定システム６９７、図６のＤＳＰ６９６、高調波的に拡張された信号を生成するように構成された１つもしくは複数のデバイス（たとえば、非一時的コンピュータ可読記憶媒体にて命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。

[0084]第１の装置はまた、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための手段を含む。たとえば、混合係数を決定するための手段は、図１のハイバンド励振生成器１６０、図１の混合係数計算器１６２、図２の混合係数計算器２１２、図３の誤差検出回路３０６，図３の誤差最小化計算器３０８、図３のハイバンド励振生成器３０２、図６の混合係数推定システム６８２、図６のＣＯＤＥＣ６３４、図６の混合係数推定システム６９７、図６のＤＳＰ６９６、混合係数を決定するように構成された１つもしくは複数のデバイス（たとえば、非一時的コンピュータ可読記憶媒体にて命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。

[0085]説明した実施形態とともに、第２の装置は、ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信するための手段を含む。ハイバンドサイド情報は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定された混合係数を含む。たとえば、符号化された信号を受信するための手段は、図４の非線形変換生成器４０７、図４の第１の結合器４５４，図４の減算器４５２、図６のＣＯＤＥＣ６３４、図６の復号システム６８４、図６の復号システム６９８、図６のＤＳＰ６９６、符号化された信号を受信するように構成された１つもしくは複数のデバイス（たとえば、非一時的コンピュータ可読記憶媒体にて命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。

[0086]第２の装置はまた、ハイバンドサイド情報とローバンド励振信号とに基づいてハイバンド励振信号を生成するための手段を含み得る。たとえば、ハイバンド励振信号を生成するための手段は、図４の非線形変換生成器４０７、図４のエンベロープトラッカー４０２、図４のノイズ結合器４４０、図４の第１の結合器４５４、図４の第２の結合器４５６、図４の減算器４５２、図４の混合器４１１、図６のＣＯＤＥＣ６３４、図６の復号システム６８４、図６の復号システム６９８、図６のＤＳＰ６９６、ハイバンド励振信号を生成するように構成された１つもしくは複数のデバイス（たとえば、非一時的コンピュータ可読記憶媒体にて命令を実行するプロセッサ）、またはそれらの任意の組合せを含み得る。

[0087]本明細書で開示される実施形態に関して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとして実施され得ることは、当業者にはさらに諒解されよう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップは、上記で機能に関して一般的に説明されてきた。そのような機能をハードウェアとして実装するか、実行可能ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。

[0088]本明細書で開示される実施形態に関して説明された方法またはアルゴリズムのステップは、ハードウェア内で、プロセッサによって実行されるソフトウェアモジュール内で、またはこれら２つの組合せで直接実施され得る。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピントルクトランスファーＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読出し専用メモリ（ＲＯＭ）、プログラマブル読出し専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読出し専用メモリ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、着脱可能ディスク、またはコンパクトディスク読出し専用メモリ（ＣＤ−ＲＯＭ）などのメモリデバイス内に存在してよい。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことが可能であるように、プロセッサに結合される。代替として、メモリデバイスはプロセッサと一体であってよい。プロセッサおよび記憶媒体は、ＡＳＩＣ内に存在し得る。ＡＳＩＣは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として存在し得る。

[0089]開示されている実施形態を前記のように提示したのは、当業者が開示されている実施形態を製作または使用することができるようにするためである。これらの実施形態に対する様々な修正は、当業者には容易に明らかであり、本明細書で定義されている原理は、本開示の範囲から逸脱することなく、他の実施形態に適用され得る。したがって、本開示は、本明細書に示されている実施形態に限定されることを意図されておらず、以下の特許請求の範囲によって定義される原理および新規な特徴と一致する可能な最も広い範囲を与えられるべきである。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
音声エンコーダにおいて、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える方法。
［Ｃ２］
前記混合係数は、閉ループ分析を使用して調節される、
Ｃ１に記載の方法。
［Ｃ３］
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
Ｃ２に記載の方法。
［Ｃ４］
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成することをさらに備える、
Ｃ１に記載の方法。
［Ｃ５］
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
Ｃ４に記載の方法。
［Ｃ６］
前記ハイバンド励振信号を生成することは、
第１のスケーリングされた信号を生成するために、前記混合係数に従って前記高調波的に拡張された信号をスケーリングすることと、
第２のスケーリングされた信号を生成するために、前記混合係数に基づいて前記変調されたノイズをスケーリングすることと、
前記第１のスケーリングされた信号と前記第２のスケーリングされた信号とを結合することとを備える、
Ｃ４に記載の方法。
［Ｃ７］
前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて調節される、Ｃ４に記載の方法。
［Ｃ８］
前記混合係数は、少なくとも、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、Ｃ７に記載の方法。
［Ｃ９］
第２の混合係数を生成するために、第１の混合係数を選択的に増分または減分することをさらに備え、
前記混合係数は、前記第１の混合係数に基づいた前記平均２乗誤差が前記第２の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第１の混合係数に対応し、
前記混合係数は、前記第２の混合係数に基づいた前記平均２乗誤差が前記第１の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第２の混合係数に対応する、
Ｃ７に記載の方法。
［Ｃ１０］
前記ハイバンド残余信号を生成するために、前記オーディオ信号の前記ハイバンド部分に対して線形予測分析を実施することと、
ローバンド残余信号を生成するために、前記オーディオ信号の前記ローバンド部分に対して線形予測分析を実施することと、
ローバンド励振信号を生成するために前記ローバンド残余信号を量子化することと、
前記高調波的に拡張された信号を生成するために、前記ローバンド励振信号に対して非線形フィルタリング操作を実施することと、をさらに備える、
Ｃ１に記載の方法。
［Ｃ１１］
前記混合係数を受信機にビットストリームの一部として送信することをさらに備える、
Ｃ１に記載の方法。
［Ｃ１２］
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための線形予測分析フィルタと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための非線形変換生成器と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための混合係数計算器と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える装置。
［Ｃ１３］
前記混合係数は閉ループ分析を使用して調節される、
Ｃ１２に記載の装置。
［Ｃ１４］
誤差検出回路と、前記閉ループ分析を使用して前記混合係数を調節するための誤差最小化計算器とをさらに備え、
前記誤差検出回路は、前記ハイバンド残余信号をハイバンド励振信号と比較するように構成され、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成され、
前記誤差最小化計算器は、
前記比較に基づいて誤差信号を生成し、
前記誤差信号に基づいて前記混合係数を調節するように構成される、
Ｃ１３に記載の装置。
［Ｃ１５］
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成するためのハイバンド励振生成器をさらに備える、
Ｃ１４に記載の装置。
［Ｃ１６］
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
Ｃ１５に記載の装置。
［Ｃ１７］
前記ハイバンド励振生成器は、
第１のスケーリングされた信号を生成するために前記混合係数に従って前記高調波的に拡張された信号をスケーリングするための第１の乗算器と、
第２のスケーリングされた信号を生成するために前記混合係数に基づいて前記変調されたノイズをスケーリングするための第２の乗算器と、
前記第１のスケーリングされた信号と前記第２のスケーリングされた信号とを結合するための混合器とを備える、
Ｃ１５に記載の装置。
［Ｃ１８］
前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて調節される、
Ｃ１５に記載の装置。
［Ｃ１９］
前記混合係数は、少なくとも、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、
Ｃ１８に記載の装置。
［Ｃ２０］
第２の混合係数を生成するために第１の混合係数を選択的に増分または減分するように構成された誤差制御器をさらに備え、
前記混合係数は、前記第１の混合係数に基づいた前記平均２乗誤差が前記第２の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第１の混合係数に対応し、
前記混合係数は、前記第２の混合係数に基づいた前記平均２乗誤差が前記第１の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第２の混合係数に対応する、
Ｃ１８に記載の装置。
［Ｃ２１］
さらに、前記ハイバンド残余信号を生成するために、前記オーディオ信号の前記ハイバンド部分に対して第１の線形予測分析を実施するように構成された第１の線形予測分析フィルタと。
ローバンド残余信号を生成するために、前記オーディオ信号の前記ローバンド部分に対して第２の線形予測分析を実施するように構成された第２の線形予測分析フィルタと、
ローバンド励振信号を生成するために前記ローバンド残余信号を量子化するように構成された量子化器と、
前記高調波的に拡張された信号を生成するために、前記ローバンド励振信号に対して非線形フィルタリング操作を実施するための非線形変換生成器と、を備える、
Ｃ１２に記載の装置。
［Ｃ２２］
前記混合係数を受信機にビットストリームの一部として送信するための送信機をさらに備える、
Ｃ１２に記載の装置。
［Ｃ２３］
音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を行わせる命令を備える非一時的コンピュータ可読媒体。
［Ｃ２４］
前記混合係数は閉ループ分析を使用して調節される、
Ｃ２３に記載の非一時的コンピュータ可読媒体。
［Ｃ２５］
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
Ｃ２４に記載の非一時的コンピュータ可読媒体。
［Ｃ２６］
前記プロセッサによって実行されるとき、前記プロセッサに、前記混合係数と、前記高調波的に拡張された信号と、前記変調された信号とに少なくとも部分的に基づいて、ハイバンド励振信号を生成することを行わせる命令をさらに備える、
Ｃ２３に記載の非一時的コンピュータ可読媒体。
［Ｃ２７］
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
Ｃ２６に記載の非一時的コンピュータ可読媒体。
［Ｃ２８］
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための手段と、
前記オーディオ信号のローバンド部分に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための手段と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための手段と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づく、
を備える装置。
［Ｃ２９］
前記混合係数は、閉ループ分析を使用して調節される、Ｃ２８に記載の装置。
［Ｃ３０］
前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、ここにおいて、前記ハイバンド励振信号は、前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに基づいて生成される、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
Ｃ２９に記載の装置。
［Ｃ３１］
前記混合係数と、前記高調波的に拡張された信号と、前記変調されたノイズとに少なくとも部分的に基づいてハイバンド励振信号を生成するための手段をさらに備える、
Ｃ２８に記載の装置。
［Ｃ３２］
前記ハイバンド励振信号の時間特性が前記ハイバンド残余信号の時間特性と厳密に一致する、
Ｃ３１に記載の装置。
［Ｃ３３］
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、
を備える方法。
［Ｃ３４］
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、を行うように構成された音声デコーダを備える装置。
［Ｃ３５］
音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成することと、
を行わせる命令を備える非一時的コンピュータ可読媒体。
［Ｃ３６］
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信するための手段と、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、高調波的に拡張された信号と、変調されたノイズとに基づいて決定される、
前記ハイバンドサイド情報と前記ローバンド励振信号とに基づいてハイバンド励振信号を生成するための手段と、
を備える装置。

Claims

音声エンコーダにおいて、オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成することと、
前記オーディオ信号のローバンド励振信号に少なくとも部分的に基づいて、高調波的に拡張された信号を生成することと、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定することと、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づき、前記混合係数は、閉ループ分析を使用して調節され、前記閉ループ分析を使用して前記混合係数を調節することは、
前記ハイバンド残余信号をハイバンド励振信号と比較することと、
前記比較に基づいて誤差信号を生成することと、
前記誤差信号に基づいて前記混合係数を調節することと、を備える、
前記混合係数に基づいてスケーリングされた前記高調波的に拡張された信号に対応する第１の信号と、前記混合係数に基づいてスケーリングされた前記変調されたノイズに対応する第２の信号とを結合することに基づいて前記ハイバンド励振信号を生成することと、
前記オーディオ信号の前記ローバンド励振信号と前記混合係数を含むハイバンドサイド情報とを含む信号を前記音声エンコーダの出力信号として出力することと、
を備える方法。
前記誤差信号に基づいて前記混合係数を調節することは、前記混合係数が、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて調節されることを備える、請求項１に記載の方法。
前記混合係数は、ローバンド有声化、ローバンドチルト、またはそれらの任意の組合せに基づいてさらに調節される、請求項２に記載の方法。
前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて、第２の混合係数を生成するために、第１の混合係数を選択的に増分または減分することをさらに備え、
前記混合係数は、前記第１の混合係数に基づいた前記平均２乗誤差が前記第２の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第１の混合係数に対応し、
前記混合係数は、前記第２の混合係数に基づいた前記平均２乗誤差が前記第１の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第２の混合係数に対応する、
請求項２に記載の方法。
前記混合係数を受信機にビットストリームの一部として送信することをさらに備える、
請求項１に記載の方法。
オーディオ信号のハイバンド部分に基づいてハイバンド残余信号を生成するための線形予測分析フィルタと、
前記オーディオ信号のローバンド励振信号に少なくとも部分的に基づいて、高調波的に拡張された信号を生成するための非線形変換生成器と、
前記ハイバンド残余信号と、前記高調波的に拡張された信号と、変調されたノイズとに基づいて混合係数を決定するための混合係数計算器と、ここにおいて、前記変調されたノイズは、前記高調波的に拡張された信号とホワイトノイズとに少なくとも部分的に基づき、前記混合係数は閉ループ分析を使用して調節される、
誤差検出回路と、前記閉ループ分析を使用して前記混合係数を調節するための誤差最小化計算器と、ここにおいて、前記誤差検出回路は、前記ハイバンド残余信号をハイバンド励振信号と比較するように構成され、
前記誤差最小化計算器は、
前記比較に基づいて誤差信号を生成し、
前記誤差信号に基づいて前記混合係数を調節するように構成される、
ハイバンド励振信号を生成するためのハイバンド励振生成器と、前記ハイバンド励振生成器は、前記混合係数に基づいてスケーリングされた前記高調波的に拡張された信号に対応する第１の信号と、前記混合係数に基づいてスケーリングされた前記変調されたノイズに対応する第２の信号とを結合するための混合器を含む、
前記オーディオ信号の前記ローバンド励振信号と前記混合係数を含むハイバンドサイド情報とを含む信号は出力信号として出力される、
を備える装置。
前記混合係数は、前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて調節され、前記装置は、
前記ハイバンド残余信号と前記ハイバンド励振信号との差の平均２乗誤差に基づいて、第２の混合係数を生成するために第１の混合係数を選択的に増分または減分するように構成された誤差制御器をさらに備え、
前記混合係数は、前記第１の混合係数に基づいた前記平均２乗誤差が前記第２の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第１の混合係数に対応し、
前記混合係数は、前記第２の混合係数に基づいた前記平均２乗誤差が前記第１の混合係数に基づいた前記平均２乗誤差よりも小さいという決定に応答して、前記第２の混合係数に対応する、
請求項６に記載の装置。
前記混合係数を受信機にビットストリームの一部として送信するための送信機をさらに備える、
請求項６に記載の装置。
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を音声デコーダにて受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、第１の高調波的に拡張された信号と、第１の変調されたノイズとに基づき、
前記ローバンド励振信号に基づく第２の高調波的に拡張された信号に対応する第１の信号と、前記第２の高調波的に拡張された信号とホワイトノイズとに基づく第２の変調されたノイズに対応する第２の信号とを混合することによって、ハイバンド励振信号を生成することと、ここにおいて、前記第２の高調波的に拡張された信号は、前記混合係数に基づいてスケーリングされ、前記第２の変調されたノイズは、前記混合係数に基づいてスケーリングされる、
前記ローバンド励振信号と、前記第１の信号と前記第２の信号と混合することによって生成された前記ハイバンド励振信号に基づいて、オーディオ信号を再構成することと、
を備える方法。
ローバンド励振信号とハイバンドサイド情報とを含む符号化された信号を受信することと、
ここにおいて、前記ハイバンドサイド情報は混合係数を含み、
ここにおいて、前記混合係数は、ハイバンド残余信号と、第１の高調波的に拡張された信号と、第１の変調されたノイズとに基づき、
前記ローバンド励振信号に基づく第２の高調波的に拡張された信号に対応する第１の信号と、前記第２の高調波的に拡張された信号とホワイトノイズとに基づく第２の変調されたノイズに対応する第２の信号とを混合することによって、ハイバンド励振信号を生成することと、ここにおいて、前記第２の高調波的に拡張された信号は、前記混合係数に基づいてスケーリングされ、前記第２の変調されたノイズは、前記混合係数に基づいてスケーリングされる、
前記ローバンド励振信号と、前記第１の信号と前記第２の信号と混合することによって生成された前記ハイバンド励振信号に基づいて、オーディオ信号を再構成することと、
を行うように構成された音声デコーダを備える装置。
音声エンコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、請求項１乃至５のいずれかに記載の方法を行わせる命令を備える非一時的コンピュータ可読媒体。
音声デコーダにおいてプロセッサによって実行されたときに、前記プロセッサに、請求項９に記載の方法を行わせる命令を備える非一時的コンピュータ可読媒体。