JP2017517029A

JP2017517029A - 高帯域励起信号生成

Info

Publication number: JP2017517029A
Application number: JP2016565290A
Authority: JP
Inventors: ラマダス、プラビン・クマー; シンダー、ダニエル・ジェイ．; ビレット、ステファン・ピエール; ラジェンドラン、ビベク
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2014-04-30
Filing date: 2015-03-31
Publication date: 2017-06-22
Anticipated expiration: 2035-03-31
Also published as: HUE041343T2; MX2016013941A; KR20170003592A; RU2016142184A; CN106256000B; SA516380088B1; BR112016024971A8; CL2016002709A1; KR102433713B1; IL248562B; TW201606757A; IL248562A0; MX361046B; RU2683632C2; AR099952A1; ES2711524T3; SG11201607703PA; WO2015167732A1; MY192071A; AU2015253721A1

Abstract

特定の方法が、デバイスで入力信号の発声分類を決定することを含む。入力信号は、オーディオ信号に対応する。方法はまた、発声分類に基づいて、入力信号の表現の包絡の量を制御することを含む。方法はさらに、制御された量の包絡に基づいて、ホワイトノイズ信号を変調することを含む。方法はまた、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することを含む。【選択図】図１

Description

優先権の主張

[0001]本出願は、「HIGH BAND EXCITATION SIGNAL GENERATION」という題名の、２０１４年４月３０日付で出願された米国出願第１４／２６５，６９３号基づく優先権を主張し、その内容は、全体として参照により組み込まれている。

[0002]本開示は概して、高帯域励起信号生成に関する。

関連出願の説明

[0003]技術の進歩は結果として、より小型で、より強力なコンピューティングデバイスをもたらしてきた。例えば、小型で軽量であり、ユーザにより容易に持ち運ばれる、ポータブルワイヤレス電話、携帯情報端末（ＰＤＡ）、ページングデバイスのような、ワイヤレスコンピューティングデバイスを含む、様々なポータブルパーソナルコンピューティングデバイスが現在存在している。より具体的には、セルラ電話およびインターネットプロトコル（ＩＰ）電話のようなポータブルワイヤレス電話は、ワイヤレスネットワークをわたってボイスおよびデータパケットを通信することができる。さらに、多くのこのようなワイヤレス電話は、そこに組み込まれる他のタイプのデバイスを含む。例えば、ワイヤレス電話はまた、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレイヤも含むことができる。

[0004]デジタル技法によるボイスの送信は、特に長距離およびデジタル無線電話アプリケーションにおいて普及している。発話（speech）がサンプリングおよびデジタル化によって送信される場合、毎秒６４キロビット（ｋｂｐｓ）のオーダであるデータレートが、アナログ電話の発話品質を実現するために使用されうる。圧縮技法は、再構築された発話の感知された品質を保ちながらチャネルをわたって送られる情報の量を低減するために使用されうる。コーディング、送信、および受信機における再合成が後に続く発話分析の使用を通じて、データレートの大幅な低減が実現されうる。

[0005]発話を圧縮するためのデバイスは、テレコミュニケーションの多くのフィールドにおける使用を見出すことができる。例えば、ワイヤレス通信は、例えば、コードレス電話、ページング、ワイヤレスローカルループ、セルラおよび個人通信サービス（ＰＣＳ）電話システムのようなワイヤレス電話方式（telephony）、モバイルインターネットプロトコル（ＩＰ）電話方式、および衛星通信システム、を含む多くのアプリケーションを有する。特定のアプリケーションは、モバイル加入者のためのワイヤレス電話方式である。

[0006]様々なオーバザエアインターフェースが、例えば、周波数分割多元接続（ＦＤＭＡ）、時分割多元接続（ＴＤＭＡ）、符号分割多元接続（ＣＤＭＡ）、および時分割同期ＣＤＭＡ（ＴＤ−ＳＣＤＭＡ）、を含むワイヤレス通信システムのために展開されてきた。それと関係して、例えば、アドバンスドモバイル電話サービス（ＡＭＰＳ）、モバイル通信のためのグローバルシステム（ＧＳＭ（登録商標））、およびInterim Standard９５（ＩＳ−９５）を含む、様々な国内および国際的規格が確立されてきた。実例的なワイヤレス電話方式通信システムは、符号分割多元接続（ＣＤＭＡ）システムである。ＩＳ−９５規格およびその派生物、ＩＳ−９５Ａ、ＡＮＳＩＪ−ＳＴＤ−００８、およびＩＳ−９５Ｂ（本明細書では総称してＩＳ−９５と称される）は、セルラまたはＰＣＳ電話方式通信システムに対するＣＤＭＡオーバザエアインターフェースの使用を指定するために米国電気通信工業会（ＴＩＡ）および他の周知の標準化機関によって公表されている。

[0007]ＩＳ−９５規格は続いて、より多くの容量と高スピードパケットデータサービスを提供する、ｃｄｍａ２０００およびＷＣＤＭＡ（登録商標）のような「３Ｇ」システムに発展した。ｃｄｍａ２０００の２つのバリエーションが、ＴＩＡによって発行された、ドキュメントＩＳ−２０００（ｃｄｍａ２０００１ｘＲＴＴ）およびＩＳ−８５６（ｃｄｍａ２０００１ｘＥＶ−ＤＯ）によって提示されている。ｃｄｍａ２０００１ｘＲＴＴ通信システムが１５３ｋｂｐｓのピークデータレートを提供するのに対して、ｃｄｍａ２０００１ｘＥＶ−ＤＯ通信システムは、３８．４ｋｂｐｓから２．４Ｍｂｐｓに及ぶデータレートのセットを定義する。ＷＣＤＭＡ規格は、３世代パートナーシッププロジェクト「３ＧＰＰ（登録商標）」のドキュメント番号３ＧＴＳ２５．２１１、３ＧＴＳ２５．２１２、３ＧＴＳ２５．２１３、および３ＧＴＳ２５．２１４において具体化されている。国際モバイルテレコミュニケーションアドバンスド（ＩＭＴ−アドバンスド）仕様書は、「４Ｇ」規格を定める（set out）。ＩＭＴ−アドバンスド仕様書は、４Ｇサービスのためのピークデータレートを、（例えば、電車および車からの）高モビリティ通信に関しては毎秒１００メガビット（Ｍｂｉｔ／ｓ）に設定し、（例えば、歩行者および固定されたユーザからの）低モビリティ通信に関しては毎秒１ギガビット（Ｇｂｉｔ／ｓ）に設定する。

[0008]人間の発話生成のモデルに関するパラメータを抽出することによって発話を圧縮するための技法を用いるデバイスは、発話コーダと呼ばれる。発話コーダは、エンコーダおよびデコーダを備えることができる。エンコーダは、入ってくる（incoming）発話信号を、時間のブロック、すなわち分析フレームに分割する。時間単位の各セグメントの持続時間（または「フレーム」）（The duration of each segment in time (or “frame”)）は、信号のスペクトル包絡が比較的固定した状態で留まっていると予期されうるほど十分短くなるように選択されうる。例えば、フレーム長は、２０ミリ秒で有り得、これは８キロヘルツ（ｋＨｚ）のサンプリングレートで１６０サンプルに対応するが、特定のアプリケーションに適していると考えられるいずれのフレーム長またはサンプリングレートも使用されうる。

[0009]エンコーダは、ある特定の関連するパラメータを抽出するために入ってくる発話フレームを分析し、その後それらのパラメータを、バイナリ表現、例えばビットのセットまたはバイナリデータパケットに量子化する。データパケットは、受信機およびデコーダに、通信チャネル（すなわち、有線および／またはワイヤレスネットワーク接続）をわたって送信される。デコーダは、データパケットを処理し、それらのパラメータを作り出すために処理されたデータパケットを逆量子化し、逆量子化されたパラメータを使用して発話フレームを再合成する。

[0010]発話コーダの機能は、発話に本来備わっている自然の冗長を取り除くことによって、デジタル化された発話信号を、低ビットレート信号に圧縮することである。デジタル圧縮は、パラメータのセットで入力発話フレームを表現し、ビットのセットでパラメータを表現するために量子化を用いることによって実現されうる。入力発話フレームがビット数Ｎ_ｉを有し、発話コーダによって作り出されたデータパケットがビット数Ｎ_ｏを有する場合、発話コーダによって実現される圧縮係数はＣ_ｒ＝Ｎ_ｉ／Ｎ_ｏである。課題は、復号された発話の高ボイス品質を、ターゲット圧縮ファクタを実現しながら維持することである。発話コーダの性能は、（１）発話モデル、または上で説明された分析および合成プロセスの組み合わせがどれ程良好に機能するか、および（２）パラメータ量子化プロセスが、フレーム毎にＮ_ｏのターゲットビットレートでどれ程良好に実行されるか、に依存する。したがって発話モデルの目的は、フレーム毎にパラメータの小さなセットで、発話信号の骨子、すなわちターゲットボイス品質を捕捉することである。

[0011]発話コーダは一般に、発話信号を説明するために（ベクトルを含む）パラメータのセットを利用する。パラメータの良好なセットは、知覚的に正確な発話信号の再構築のために低システム帯域幅を理想的に提供する。ピッチ、信号電力、スペクトル包絡（またはフォルマント（formants））、振幅、位相スペクトルは、発話コーディングパラメータの例である。

[0012]発話コーダは時間ドメインコーダとして実装され得、これらは、一度に発話の小さなセグメント（例えば、５ミリ秒（ms）サブフレーム）を符号化するために高時間分解能処理を用いることによって、時間ドメイン発話波形を捕捉することを試みる。各サブフレームでは、コードブック空間から高精度の標本（representative）が探索アルゴリズムを用いて発見される。代わりとして、発話コーダは、周波数ドメインコーダとして実装され得、これらは、パラメータのセットを持つ入力発話フレームの短期発話スペクトルを捕捉し（分析）、スペクトルパラメータから発話波形を再現するために対応する合成プロセスを用いることを試みる。パラメータ量子化器は、既知の量子化技法にしたがってパラメータを、コードベクトルの記憶された表現でそれらを表現することによって維持する。

[0013]１つの時間ドメイン発話コーダは、コード励振線形予測（ＣＥＬＰ）コーダである。ＣＥＬＰコーダでは、発話信号における短期相関、すなわち冗長は、短期フォルマントフィルタの係数を発見する、線形予測（ＬＰ）分析によって取り除かれる。入ってくる発話フレームに短期予測フィルタを適用することは、ＬＰ残差信号を生成し、これはさらに、長期予測フィルタパラメータおよび後続の確率コードブックでモデリングおよび量子化される。したがって、ＣＥＬＰコーディングは、時間ドメイン発話波形を符号化するタスクを、ＬＰ短期フィルタ係数を符号化することとＬＰ残差を符号化することの別個のタスクに分割する。時間ドメインコーディングは、固定レートで（すなわち、各フレームに対して同じ数のビットＮ_ｏを使用して）、または（異なるビットレートが異なるタイプのフレームコンテンツに対して使用される）可変レートで、実行されうる。可変レートコーダは、ターゲット品質を取得するのに十分なレベルにパラメータを符号化するために必要なビットの量を使用することを試みる。

[0014]ＣＥＬＰコーダのような時間ドメインコーダは、時間ドメイン発話波形の精度を維持するために、フレーム毎の大きなビット数（a high number of bits）Ｎ_０に依拠しうる。そのようなコーダは、フレーム毎のビット数Ｎ_ｏが相対的に大きい（例えば、８ｋｂｐｓ以上）ならば、極めて優れたボイス品質を送る（deliver）ことができる。低ビットレート（例えば、４ｋｂｐ以下）では、時間ドメインコーダは、限定された利用可能なビット数に起因して、高品質およびロバスト性能を維持できないことがある。低ビットレートで、限定されたコードブック空間は、時間ドメインコーダの波形一致能力をクリップし、それはより高いレートの商業的アプリケーションに配置されている。したがって、低ビットレートで動作する多くのＣＥＬＰコーディングシステムは、ノイズとして特徴付けられる知覚的に大幅な歪みを負う。

[0015]低ビットレートにおけるＣＥＬＰコーダの代替は、「ノイズ励振線形予測」（ＮＥＬＰ）コーダであり、これは、ＣＥＬＰコーダと同様の原理下で動作する。ＮＥＬＰコーダは、コードブックよりもむしろ発話をモデリングするために、フィルタリングされた疑似ランダムノイズ信号を使用する。ＮＥＬＰがコーディングされた発話のためにより簡素なモデルを使用するので、ＮＥＬＰはＣＥＬＰよりも低いビットレートを実現する。ＮＥＬＰは、無声（unvoiced）発話または沈黙を圧縮または表現するために使用されうる。

[0016]２．４ｋｂｐｓのオーダであるレートで動作するコーディングシステムは一般に、本質的にパラメトリックである。つまり、そのようなコーディングシステムは、定期的なインターバルで発話信号のスペクトル包絡（またはフォルマント）およびピッチ期間を説明するパラメータを送信することによって動作する。そのようなパラメトリックコーダを例示しているのは、ＬＰボコーダである。

[0017]ＬＰボコーダは、ピッチ期間毎に単一のパルスを持つ有声発話信号をモデリングする。この基本的な技法は、とりわけ、スペクトル包絡についての送信情報を含むように増強されうる。ＬＰボコーダは、一般に適当な性能を提供するけれども、それらは、バズと特徴付けられる知覚的に大幅な歪みをもたらしうる。

[0018]ここ数年で、波形コーダとパラメトリックコーダの両方のハイブリッドであるコーダが出現してきた。これらのハイブリッドコーダを例示しているのは、プロトタイプ波形補間（ＰＷＩ）発話コーディングシステムである。ＰＷＩ発話コーディングシステムはまた、プロトタイプピッチ期間（ＰＰＰ）発話コーダとしても知られている。ＰＷＩ発話コーディングシステムは、有声発話をコーディングするための効率的な方法を提供する。ＰＷＩの基本概念は、固定インターバルで標本ピッチサイクル（プロトタイプ波形）を抽出し、その記述子を送信し、プロトタイプ波形間で補間することによって発話信号を再構築することである。ＰＷＩ方法は、ＬＰ残差信号上または発話信号上のうちのどちらかで動作しうる。

[0019]従来の電話システム（例えば、公衆交換電話ネットワーク（ＰＳＴＮ））では、信号帯域幅が、３００ヘルツ（Ｈｚ）から３．４キロヘルツ（ｋＨｚ）の周波数範囲に限定される。セルラ電話方式およびボイスオーバインターネットプロトコル（ＶｏＩＰ）のような高帯域（ＷＢ）アプリケーションでは、信号帯域幅は、５０Ｈｚから７ｋＨｚまでの周波数範囲に広がりうる。超高帯域（ＳＷＢ）コーディング技法は、おおよそ１６ｋＨｚまで拡張する帯域幅をサポートする。信号帯域幅を３．４ｋＨｚにおける狭帯域電話方式から１６ｋＨｚのＳＷＢ電話方式まで拡張することは、信号の再構築の品質、明瞭度、自然性を改善することができる。

[0020]高帯域コーディング技法は、信号のより低い周波数部分（例えば、５０Ｈｚから７ｋＨｚ、「低帯域」とも呼ばれる）符号化および送信することを伴う。コーディング効率を改善するために、信号のより高い周波数部分（例えば、７ｋＨｚから１６ｋＨｚ、「高帯域」とも呼ばれる）が完全には符号化および送信されないことがある。低帯域信号の特質は、高帯域信号を生成するために使用されうる。例えば、高帯域励起信号は、非線形モデル（例えば、絶対値関数）を使用して低帯域残差に基づいて生成されうる。低帯域残差がパルスでスパース（sparsely）にコーディングされるとき、スパースコーディングされた残差から生成された高帯域励起信号は結果として、高帯域の無声領域においてアーチファクト（artifacts）をもたらしうる。

[0021]高帯域励起信号生成のためのシステムおよび方法が開示されている。オーディオデコーダは、送信デバイスでオーディオエンコーダによって符号化されたオーディオ信号を受信することができる。オーディオデコーダは、特定のオーディオ信号の発声分類（voicingnclassification）（例えば、強力な有声（strongly voiced）、微力な有声（weakly voiced）、微力な無声（weakly unvoiced）、強力な無声（strongly unvoiced））を決定することができる。例えば、特定のオーディオ信号は、強力な有声（例えば、発話信号）から強力な無声（例えば、ノイズ信号）までの範囲にわたる。オーディオデコーダは、発声分類に基づいて、入力信号の表現の包絡の量を制御することができる。

[0022]包絡の量を制御することは、包絡の特性（例えば、形状、周波数範囲、利得、および／または大きさ）を制御することを含むことができる。例えば、オーディオデコーダは、符号化されたオーディオ信号から低帯域励起信号を生成することができ、発声分類に基づいて、低帯域励起信号の包絡の形状を制御することができる。例えば、オーディオデコーダは、低帯域励起信号に適用されるフィルタのカットオフ周波数に基づいて、包絡の周波数範囲を制御することができる。別の例として、オーディオデコーダは、発声分類に基づいて線形予測コーディング（ＬＰＣ）係数の１つ以上の極点（pole）を調節することによって、包絡の大きさ、包絡の形状、包絡の利得、またはそれらの組み合わせを制御することができる。さらなる例として、オーディオデコーダは、発声分類に基づいてフィルタの係数を調節することによって、包絡の大きさ、包絡の形状、エンベロッパの利得、またはそれらの組み合わせを制御することができ、ここでフィルタは、低帯域励起信号に適用される。

[0023]オーディオデコーダは、制御された量の包絡に基づいて、ホワイトノイズ信号を変調することができる。例えば、変調されたホワイトノイズ信号は、発声分類が強力な無声であるときよりも発声分類が強力な有声であるときの方が、低帯域励起信号により対応しうる。オーディオデコーダは、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することができる。例えば、オーディオデコーダは、低帯域励起信号を拡張することができ、高帯域励起信号を生成するために変調されたホワイトノイズ信号と拡張された低帯域信号とを組み合わせることができる。

[0024]特定の実施形態では、方法が、デバイスで入力信号の発声分類を決定することを含む。入力信号は、オーディオ信号に対応する。方法はまた、発声分類に基づいて、入力信号の表現の包絡の量を制御することを含む。方法はさらに、制御された量の包絡に基づいて、ホワイトノイズ信号を変調することを含む。方法は、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することを含む。

[0025]別の特定の実施形態では、装置が、発声分類器、包絡調節器、変調器、および出力回路を含む。発声分類器は、入力信号の発声分類を決定するように構成される。入力信号は、オーディオ信号に対応する。包絡調整器は、発声分類に基づいて、入力信号の表現の包絡の量を制御するように構成される。変調器は、制御された量の包絡に基づいて、ホワイトノイズ信号を変調するように構成される。出力回路は、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するように構成される。

[0026]別の特定の実施形態では、コンピュータ可読記憶デバイスは、少なくとも１つプロセッサによって実行されるとき、少なくとも１つのプロセッサに、入力信号の発声分類を決定させる命令を記憶する。命令はさらに、少なくとも１つのプロセッサによって実行されるとき、少なくとも１つのプロセッサに、発声分類に基づいて入力信号の表現の包絡の量を制御することと、制御された量の包絡に基づいてホワイトノイズ信号を変調することと、変調されたホワイトノイズ信号に基づいて高帯域励起信号を生成することと、を行わせる。

[0027]開示されている実施形態の少なくとも１つによって提供される特定の利点は、無声オーディオ信号に対応する平滑な（smooth）サウンディング合成されたオーディオ信号を生成することを含む。例えば、無声オーディオ信号に対応する合成されたオーディオ信号は、ほとんど（または全く）アーチファクトを有さないことがある。本開示の他の態様、利点、および特徴は、以下のセクション：図面の簡単な説明、詳細な説明、および特許請求の範囲を含む本願の検討（review）後に明らかとなるだろう。

高帯域励起信号生成を実行するように動作可能であるデバイスを含むシステムの特定の実施形態を例示するための図である。高帯域励起信号生成を実行するように動作可能であるデコーダの特定の実施形態を例示するための図である。高帯域励起信号生成を実行するように動作可能であるエンコーダの特定の実施形態を例示するための図である。高帯域励起信号生成の方法の特定の実施形態を例示するための図である。高帯域励起信号生成の方法の別の実施形態を例示するための図である。高帯域励起信号生成の方法の別の実施形態を例示するための図である。高帯域励起信号生成の方法の別の実施形態を例示するための図である。高帯域励起信号生成の方法の別の実施形態を例示するためのフローチャートである。図１−８のシステムおよび方法にしたがって高帯域励起信号生成を実行するように動作可能なデバイスのブロック図である。

詳細な説明

[0037]本明細書で説明されている原理は、例えば、高帯域励起信号生成を実行するように構成されているヘッドセット、ハンドセット、または他のオーディオデバイスに適用されうる。その文脈によって明示的に限定されない限り、「信号」という用語は、ワイヤ、バス、または他の送信媒体上で表されるようなメモリロケーション（またはメモリロケーションのセット）の状態を含む、その一般的な意味のいずれも示すように本明細書では使用されている。その文脈によって明示的に限定されない限り、「生成する」という用語は、計算する、または違った形で作り出すといった、その一般的な意味のいずれも示すように本明細書では使用されている。その文脈によって明示的に限定されない限り、「算出する」という用語は、計算する、値を求める、平滑化する、および／または複数の値から選択するといった、その一般的な意味のいずれも示すように本明細書では使用されている。その文脈によって明示的に限定されない限り、「取得する」という用語は、算出する、導出する、（例えば、別のコンポーネント、ブロック、またはデバイスから）受信する、および／または、（例えば、メモリレジスタ、または記憶エレメントのアレイから）検索するといった、その一般的な意味のいずれも示すように使用されている。

[0038]その文脈によって明示的に限定されない限り、「作り出す」という用語は、算出する、生成する、および／または提供するといった、その一般的な意味のいずれも示すように使用されている。その文脈によって明示的に限定されない限り、「提供する」という用語は、算出する、生成する、および／または作り出すといった、その一般的な意味のいずれも示すように使用されている。その文脈によって明示的に限定されない限り、「結合される」という用語は、直接的または間接的な電気または物理接続を示すように使用されている。接続が間接的である場合、「結合され」ている構造間に他のブロックまたはコンポーネントが存在しうることは、当業者によって十分に理解される。

[0039]「構成」という用語は、その特定の文脈によって示されているような、方法、装置／デバイス、および／またはシステムに関して使用されうる。本説明および特許請求の範囲において、「備える」という用語が使用されている場合、それは、他のエレメントまたは動作を除外しない。（「ＡはＢに基づく」において見られるような）「に基づく」という用語は、（ｉ）「に少なくとも基づいて」（例えば、「Ａは少なくともＢに基づく」）、および、特定の文脈で適切な場合には（ｉｉ）「に等しい」（例えば、「ＡはＢに等しい」）というケースを含む、その一般的な意味のいずれも示すように使用されている。ＡがＢに基づく、が、少なくとも基づく、を含むケース（ｉ）では、これが、ＡがＢに結合される構成を含むことができる。同様に、「に応答して」という用語は、「に少なくとも応答して」を含む、その一般的な意味のいずれも示すように使用されている。「少なくとも１つ」という用語は、「１つ以上」を含む、その一般的な意味のいずれも示すように使用されている。「少なくとも２つ」という用語は、「２つ以上」を含む、その一般的な意味のいずれも示すように使用されている。

[0040]「装置」および「デバイス」という用語は、特定の文脈によって違った形で示されない限り、包括的に、かつ交換可能に使用されている。違った形で示されない限り、特定の特徴を有する装置の動作のいずれの開示も、類似する特徴を有する方法を開示する（またその逆もまた同じである）ようにも明示的に意図されており、特定の構成にしたがった装置の動作のいずれの開示も、類似する構成にしたがった方法を開示する（またその逆もまた同じである）ようにも明示的に意図されている。「方法」、「プロセス」、「手順」、および、「技法」という用語は、特定の文脈によって違った形で示されない限り、包括的に、かつ交換可能に使用される。通常、「エレメント」および「モジュール」という用語は、より大きな構成の一部を示すように使用されうる。ドキュメントの一部の参照によるいずれの組み込みもまた、その一部内で参照される変数または用語の定義を組み込むように理解されるものとし、ここでそのような定義は、ドキュメント中、ならびに組み込まれた一部で参照されているいずれの図面中の他の場所でも登場する。

[0041]本明細書で使用される場合、「通信デバイス」という用語は、ワイヤレス通信ネットワークをわたるボイス通信および／またはデータ通信のために使用されうる電子デバイスを指す。通信デバイスの例は、セルラ電話、携帯情報端末（ＰＤＡ）、ハンドヘルドデバイス、ヘッドセット、ワイヤレスモデム、ラップトップコンピュータ、パーソナルコンピュータ等を含む。

[0042]図１を参照すると、高帯域励起信号生成を実行するように動作可能であるデバイスを含むシステムの特定の実施形態が図示され、概して１００と指定されている。特定の実施形態では、システム１００の１つ以上のコンポーネントは、（例えば、ワイヤレス電話またはコーダ／デコーダ（ＣＯＤＥＣ）における）復号システムまたは装置に、符号化システムまたは装置に、あるいはそれらの両方に統合されうる。他の実施形態では、システム１００の１つ以上のコンポーネントは、セットトップボックス、音楽プレイヤ、ビデオプレイヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末（ＰＤＡ）、固定ロケーションデータユニット、またはコンピュータに統合されうる。

[0043]以下の説明において、図１のシステム１００によって実行される様々な機能が、ある特定のコンポーネントまたはモジュールによって実行されるとして説明されることは留意されるべきである。コンポーネントおよびモジュールのこの区分は、例示のためだけのものである。代わりの実施形態では、特定のコンポーネントまたはモジュールによって実行される機能は、複数のコンポーネントまたはモジュールの間で分けられうる。さらに代わりの実施形態では、図１の２つ以上のコンポーネントまたはモジュールは、単一のコンポーネントまたはモジュールに統合されうる。図１で例示されている各コンポーネントまたはモジュールは、ハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、コントローラ等）、ソフトウェア（例えば、プロセッサによって実行可能な命令）、またはそれらのあらゆる組み合わせを使用して実装されうる。

[0044]図１−９で描かれている例示的な実施形態は、強化型可変レートコーデック−狭帯域広帯域（ＥＶＲＣ−ＮＷ）で使用されるものと同様の高帯域モデルに関して説明されているけれども、例示的な実施形態のうちの１つ以上は、いずれの他の高帯域モデルも使用することができる。いずれの特定のモデルの使用も例としてのみ説明されていることは理解されるべきである。

[0045]システム１００は、ネットワーク１２０を介して第１のデバイス１０２と通信状態にあるモバイルデバイス１０４を含む。モバイルデバイス１０４は、マイクロフォン１４６に結合されるか、またはマイクロフォン１４６と通信状態にありうる。モバイルデバイス１０４は、励起信号生成モジュール１２２、高帯域エンコーダ１７２、マルチプレクサ（ＭＵＸ）１７４、送信機１７６、またはそれらの組み合わせを含むことができる。第１のデバイス１０２は、スピーカ１４２に結合されるか、またはスピーカ１４２と通信状態にありうる。第１のデバイス１０２は、高帯域合成器１６８を介してＭＵＸ１７０に結合された励起信号生成モジュール１２２を含むことができる。励起信号生成モジュール１２２は、発声分類器１６０、包絡調整器１６２、変調器１６４、出力回路１６６、またはそれらの組み合わせを含むことができる。

[0046]動作中に、モバイルデバイス１０４は、入力信号１３０（例えば、第１のユーザ１５２のユーザ発話信号、無声信号、またはその両方）を受信することができる。例えば、第１のユーザ１５２は、第２のユーザ１５４とのボイス通信に携わりうる。ボイス呼のために、第１のユーザ１５２はモバイルデバイス１０４を使用し得、第２のユーザ１５４は第１のデバイス１０２を使用することができる。ボイス呼中、第１のユーザ１５２は、モバイルデバイス１０４に結合されたマイクロフォン１４６に話しかけることができる。入力信号１３０は、第１のユーザ１５２の発話、背景ノイズ（例えば、音楽、街頭のノイズ、別の人物の発話等）、またはそれらの組み合わせに対応しうる。モバイルデバイス１０４は、マイクロフォン１４６を介して入力信号１３０を受信することができる。

[0047]特定の実施形態では、入力信号１３０は、おおよそ５０ヘルツ（Ｈｚ）からおおよそ１６キロヘルツ（ｋＨｚ）までの周波数範囲にデータを含む超広帯域（ＳＷＢ）信号でありうる。入力信号１３０の低帯域部分および入力信号１３０の高帯域部分は、それぞれ、５０Ｈｚ−７ｋＨｚおよび７ｋＨｚ−１６ｋＨｚの重複しない周波数帯域を占有しうる。代わりの実施形態では、低帯域部分および高帯域部分は、それぞれ、５０Ｈｚ−８ｋＨｚおよび８ｋＨｚ−１６ｋＨｚの重複しない周波数帯域を占有しうる。別の代わりの実施形態では、低帯域部分および高帯域部分は、重複しうる（例えば、５０Ｈｚ−８ｋＨｚおよび７ｋＨｚ−１６ｋＨｚそれぞれ）。

[0048]特定の実施形態では、入力信号１３０は、おおよそ５０Ｈｚからおおよそ８ｋＨｚの周波数範囲を有する高帯域（ＷＢ）信号でありうる。そのような実施形態では、入力信号１３０の低帯域部分は、おおよそ５０Ｈｚからおおよそ６．４ｋＨｚの周波数範囲に対応し得、入力信号１３０の高帯域部分は、おおよそ６．４ｋＨｚからおおよそ８ｋＨｚの周波数範囲に対応しうる。

[0049]特定の実施形態では、マイクロフォン１４６は入力信号１３０を捕捉することができ、モバイルデバイス１０４におけるアナログデジタルコンバータ（ＡＤＣ）は、捕捉された入力信号１３０を、アナログ波形から、デジタルオーディオサンプルから成るデジタル波形にコンバートすることができる。デジタルオーディオサンプルは、デジタルシグナルプロセッサによって処理されうる。利得調整器は、オーディオ信号（例えば、アナログ波形またはデジタル波形）の振幅レベルを増大または低下させることによって、（例えば、アナログ波形またはデジタル波形の）利得を調整することができる。利得調整器は、アナログまたはデジタルドメインのどちらかで動作しうる。例えば、利得調整器は、デジタルドメインで動作し得、アナログデジタルコンバータによって作り出されたデジタルオーディオサンプルを調整することができる。利得調整の後、エコーキャンセラは、スピーカの出力がマイクロフォン１４６に入ることによって生み出されただろういずれのエコーも低減することができる。デジタルオーディオサンプルは、ボコーダ（ボイスエンコーダ−デコーダ）によって「圧縮」されうる。エコーキャンセラの出力は、ボコーダ前処理ブロック（vocoder pre-processing blocks）、例えばフィルタ、ノイズプロセッサ、レートコンバータ等、に結合されうる。ボコーダのエンコーダは、デジタルオーディオサンプルを圧縮し、送信パケット（デジタルオーディオサンプルの圧縮されたビットの表現）を形成することができる。特定の実施形態では、ボコーダのエンコーダは、励起信号生成モジュール１２２を含むことができる。第１のデバイス１０２を参照して説明されているように、励起信号生成モジュール１２２は高帯域励起信号１８６を生成することができる。励起信号生成モジュール１２２は、高帯域エンコーダ１７２に高帯域励起信号１８６を提供することができる。

[0050]高帯域エンコーダ１７２は、高帯域励起信号１８６に基づいて、入力信号１３０の高帯域信号を符号化することができる。例えば、高帯域エンコーダ１７２は、高帯域励起信号１８６に基づいて、高帯域ビットストリーム１９０を生成することができる。高帯域ビットストリーム１９０は、高帯域パラメータ情報を含むことができる。例えば、高帯域ビットストリーム１９０は、高帯域線形予測コーディング（ＬＰＣ）係数、高帯域線スペクトル周波数（ＬＳＦ）、高帯域線スペクトル対（ＬＳＰ）、利得形状（例えば、特定のフレームのサブフレームに対応する時間利得パラメータ）、利得フレーム（例えば、特定のフレームに関する高帯域対低帯域のエネルギー比率に対応する利得パラメータ）、または入力信号１３０の高帯域部分に対応する他のパラメータ、のうちの少なくとも１つを含むことができる。特定の実施形態では、高帯域エンコーダ１７２は、ベクトル量子化器、隠れマルコフモデル（ＨＭＭ）、混合ガウスモデル（ＧＭＭ）のうちの少なくとも１つを使用して高帯域ＬＰＣ係数を決定することができる。高帯域エンコーダ１７２は、ＬＰＣ係数に基づいて、高帯域ＬＳＦ、高帯域ＬＳＰ、またはその両方を決定することができる。

[0051]高帯域エンコーダ１７２は、入力信号１３０の高帯域信号に基づいて高帯域パラメータ情報を生成することができる。例えば、モバイルデバイス１０４のデコーダは、第１のデバイス１０２のデコーダをエミュレートすることができる。第１のデバイス１０２を参照して説明されているように、モバイルデバイス１０４のデコーダは、高帯域励起信号１８６に基づいて合成されたオーディオ信号を生成することができる。高帯域エンコーダ１７２は、合成されたオーディオ信号と入力信号１３０の比較に基づいて、利得値（例えば、利得形状、利得フレーム、または両方）を生成することができる。例えば、利得値は、合成されたオーディオ信号と入力信号１３０との間の差分に対応しうる。高帯域エンコーダ１７２は、ＭＵＸ１７４に高帯域ビットストリーム１９０を提供することができる。

[0052]ＭＵＸ１７４は、ビットストリーム１３２を生成するために、高帯域ビットストリーム１９０を低帯域ビットストリームと組み合わせることができる。モバイルデバイス１０４の低帯域エンコーダは、入力信号１３０の低帯域信号に基づいて、低帯域ビットストリームを生成することができる。低帯域ビットストリームは、低帯域パラメータ情報（例えば、低帯域ＬＰＣ係数、低帯域ＬＳＦ、またはその両方）、および低帯域励起信号（例えば、入力信号１３０の低帯域残差）を含むことができる。送信パケットは、ビットストリーム１３２に対応しうる。

[0053]送信パケットは、モバイルデバイス１０４のプロセッサと共有されうるメモリに記憶されうる。プロセッサは、デジタルシグナルプロセッサと通信状態にある制御プロセッサでありうる。モバイルデバイス１０４は、ネットワーク１２０を介して第１のデバイス１０２にビットストリーム１３２を送信することができる。例えば、送信機１７６は、いくらかの形状の送信パケットを変調し（他の情報が送信パケットに付与され得）、アンテナを介してオーバザエアでその変調された情報を送ることができる。

[0054]第１のデバイス１０２の励起信号生成モジュール１２２は、ビットストリーム１３２を受信することができる。例えば、第１のデバイス１０２のアンテナは、送信パケットを備えるいくらかの形状の入ってくるパケットを受信することができる。ビットストリーム１３２は、パルスコード変調（ＰＣＭ）符号化されたオーディオ信号のフレームに対応しうる。例えば、第１のデバイス１０２におけるアナログデジタルコンバータ（ＡＤＣ）は、ビットストリーム１３２を、アナログ信号から複数のフレームを有するデジタルＰＣＭ信号にコンバートすることができる。

[0055]送信パケットは、第１のデバイス１０２でボコーダのデコーダによって「解凍（uncompressed）」されうる。解凍された波形（またはデジタルＰＣＭ信号）は、再構築されたオーディオサンプルと称されうる。再構築されたオーディオサンプルは、ボコーダ後処理ブロック（vocoder post-processing blocks）によって後処理され得、エコーを除去するためにエコーキャンセラによって使用されうる。明確性のために、ボコーダのデコーダ、およびボコーダ後処理ブロックは、ボコーダデコーダモジュールと称されうる。いくつかの構成では、エコーキャンセラの出力は、励起信号生成モジュール１２２によって処理されうる。代わりとして、他の構成では、ボコーダデコーダモジュールの出力は、励起信号生成モジュール１２２によって処理されうる。

[0056]励起信号生成モジュール１２２は、ビットストリーム１３２から、低帯域パラメータ情報、低帯域励起信号、および高帯域パラメータ情報を抽出することができる。図２を参照して説明されるように、発声分類器１６０は、入力信号１３０の有声／無声性質（例えば、強力な有声、微力な有声、微力な無声、強力な無声）を示す発声分類１８０（例えば、０．０から１．０までの値）を決定することができる。発声分類器１６０は、包絡調整器１６２に発声分類１８０を提供することができる。

[0057]包絡調整器１６２は、入力信号１３０の表現の包絡を決定することができる。包絡は、時間変動包絡でありうる。例えば、包絡は、入力信号１３０のフレーム毎に１回よりも多い回数更新されうる。別の例として、包絡は、包絡調整器１６２が入力信号１３０の各サンプルを受信したことに応答して更新されうる。包絡の形状のバリエーションの程度（extent）は、発声分類が強力な無声に対応するときよりも、発声分類１８０が強力な有声に対応するときの方が、より大きくありうる。入力信号１３０の表現は、入力信号１３０（または入力信号１３０の符号化されたバージョン）の低帯域励起信号、入力信号１３０（または入力信号１３０の符号化されたバージョン）の高帯域励起信号、またはハーモニカルに（harmonically）拡張された励起信号を含むことができる。例えば、励起信号生成モジュール１２２は、入力信号１３０（または入力信号１３０の符号化されたバージョン）の低帯域励起信号を拡張することによってハーモニカルに拡張された励起信号を生成することができる。

[0058]図４−７を参照して説明されるように、包絡調整器１６２は、発声分類１８０に基づいて、包絡の量を制御することができる。包絡調整器１６２は、包絡の特性（例えば、形状、大きさ、利得、および／または周波数範囲）を制御することによって、包絡の量を制御することができる。例えば、図４を参照して説明されるように、包絡調整器１６２は、フィルタのカットオフ周波数に基づいて、包絡の周波数範囲を制御することができる。カットオフ周波数は、発声分類１８０に基づいて決定されうる。

[0059]別の例として、図５を参照して説明されるように、包絡調整器１６２は、発声分類１８０に基づいて高帯域線形予測コーディング（ＬＰＣ）係数の１つ以上の極点を調節することによって、包絡の形状、包絡の大きさ、包絡の利得、またはそれらの組み合わせを制御することができる。さらなる例として、図６を参照して説明されるように、包絡調整器１６２は、発声分類１８０に基づいてフィルタの係数を調整することによって、包絡の形状、包絡の大きさ、包絡の利得、またはそれらの組み合わせを制御することができる。図４−６を参照して説明されるように、包絡の特性は、変換ドメイン（例えば、周波数ドメイン）または時間ドメインにおいて制御されうる。

[0060]包絡調整器１６２は、変調器１６４に信号包絡１８２を提供することができる。信号包絡１８２は、入力信号１３０の表現の制御された量の包絡に対応しうる。

[0061]変調器１６４は、変調されたホワイトノイズ１８４を生成するようにホワイトノイズ１５６を変調するために信号包絡１８２を使用することができる。変調器１６４は、出力回路１６６に変調されたホワイトノイズ１８４を提供することができる。

[0062]出力回路１６６は、変調されたホワイトノイズ１８４に基づいて、高帯域励起信号１８６を生成することができる。例えば、出力回路１６６は、高帯域励起信号１８６を生成するために、変調されたホワイトノイズ１８４を別の信号と組み合わせることができる。特定の実施形態では、他の信号は、低帯域励起信号に基づいて生成された拡張された信号に対応しうる。例えば、出力回路１６６は、低帯域励起信号をアップサンプリングし、アップサンプリングされた信号に絶対値関数を適用し、絶対値関数を適用した結果をダウンサンプリングし、線形予測フィルタ（例えば、４次（fourth order）線形予測フィルタ）を用いてダウンサンプリングされた信号をスペクトル的に平坦にするために適応白色化を使用することによって、拡張された信号を生成することができる。特定の実施形態では、図４−７を参照して説明されるように、出力回路１６６は、ハーモニシティパラメータ（harmonicity parameter）に基づいて、変調されたホワイトノイズ１８４および他の信号をスケーリングすることができる。

[0063]特定の実施形態では、図７を参照して説明されるように、出力回路１６６は、スケーリングされたホワイトノイズを生成するために、変調されたホワイトノイズの第１の比率を変調されていないホワイトノイズの第２の比率と組み合わせることができ、ここで第１の比率および第２の比率は、発声分類１８０に基づいて決定される。この実施形態では、出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされたホワイトノイズを別の信号とを組み合わせることができる。出力回路１６６は、高帯域合成器１６８に高帯域励起信号１８６を提供することができる。

[0064]高帯域合成器１６８は、高帯域励起信号１８６に基づいて、合成された高帯域信号１８８を生成することができる。例えば、高帯域合成器１６８は、特定の高帯域モデルに基づいて高帯域パラメータ情報をモデリングおよび／または復号することができ、合成された高帯域信号１８８を生成するために高帯域励起信号１８６を使用することができる。高帯域合成器１６８は、ＭＵＸ１７０に合成された高帯域信号１８８を提供することができる。

[0065]第１のデバイス１０２の低帯域デコーダは、合成された低帯域信号を生成することができる。例えば、低帯域デコーダは、特定の低帯域モデルに基づいて低帯域パラメータ情報を復号および／またはモデリングすることができ、合成された低帯域信号を生成するために低帯域励起信号を使用することができる。ＭＵＸ１７０は、出力信号１１６（例えば、復号されたオーディオ信号）を生成するために、合成された高帯域信号１８８と合成された低帯域信号とを組み合わせることができる。

[0066]出力信号１１６は、利得調整器によって増幅または抑制されうる。第１のデバイス１０２は、第２のユーザ１５４にスピーカ１４２を介して出力信号１１６を提供することができる。例えば、利得調整器の出力は、デジタルアナログコンバータによってデジタル信号からアナログ信号にコンバートされ、スピーカ１４２を介して再生されうる。

[0067]したがって、システム１００は、合成されたオーディオ信号が無声（または強力な無声）入力信号に対応するとき、「平滑な」サウンディング合成された信号の生成を可能にしうる。合成された高帯域信号は、入力信号の発声分類に基づいて変調されるノイズ信号を使用して生成されうる。変調されたノイズ信号は、入力信号が強力な無声であるときよりも入力信号が強力な有声であるときの方が、入力信号により密接に対応しうる。特定の実施形態では、合成された高帯域信号は、入力信号が強力な無声であるとき、低減されたスパース性を有しうるか、または全くスパース性を有さないことがあり、それにより、より平滑な（例えば、より少ないアーチファクトを有する）合成されたオーディオ信号をもたらす。

[0068]図２を参照すると、高帯域励起信号生成を実行するように動作可能であるデコーダの特定の実施形態が図示され、概して２００と指定されている。特定の実施形態では、デコーダ２００は、図１のシステム１００に対応するか、またはシステム１００に含まれうる。例えば、デコーダ２００は、第１のデバイス１０２、モバイルデバイス１０４、またはその両方に含まれうる。デコーダ２００は、受信デバイス（例えば、第１のデバイス１０２）における符号化されたオーディオ信号の復号を例示することができる。

[0069]デコーダ２００は、低帯域合成器２０４、発声ファクタ生成器２０８、および高帯域合成器１６８に結合されたデマルチプレクサ（ＤＥＭＵＸ）２０２を含む。低帯域合成器２０４および発声ファクタ生成器２０８は、励起信号生成器２２２を介して高帯域合成器１６８に結合されうる。特定の実施形態では、発声ファクタ生成器２０８は、図１の発声分類器１６０に対応しうる。励起信号生成器２２２は、図１の励起信号生成モジュール１２２の特定の実施形態でありうる。例えば、励起信号生成器２２２は、包絡調整器１６２、変調器１６４、出力回路１６６、発声分類器１６０、またはそれらの組み合わせを含むことができる。低帯域合成器２０４および高帯域合成器１６８は、ＭＵＸ１７０に結合されうる。

[0070]動作中に、ＤＥＭＵＸ２０２はビットストリーム１３２を受信することができる。ビットストリーム１３２は、パルスコード変調（ＰＣＭ）符号化されたオーディオ信号のフレームに対応しうる。例えば、第１のデバイス１０２におけるアナログデジタルコンバータ（ＡＤＣ）は、ビットストリーム１３２を、アナログ信号から複数のフレームを有するデジタルＰＣＭ信号にコンバートすることができる。ＤＥＭＵＸ２０２は、ビットストリーム１３２から、ビットストリームの低帯域部分２３２およびビットストリームの高帯域部分２１８を生成することができる。ＤＥＭＵＸ２０２は、低帯域合成器２０４にビットストリームの低帯域部分２３２を提供することができ、高帯域合成器１６８にビットストリームの高帯域部分２１８を提供することができる。

[0071]低帯域合成器２０４は、ビットストリームの低帯域部分２３２から１つ以上のパラメータ２４２（例えば、入力信号１３０の低帯域パラメータ情報）および低帯域励起信号２４４（例えば、入力信号１３０の低帯域残差）を抽出および／または復号することができる。特定の実施形態では、低帯域合成器２０４は、ビットストリームの低帯域部分２３２からハーモニシティパラメータ２４６を抽出することができる。

[0072]ハーモニシティパラメータ２４６は、ビットストリーム２３２の符号化中はビットストリームの低帯域部分２３２に組み込まれ得、入力信号１３０の高帯域におけるハーモニック対ノイズエネルギーの比率（a ratio of harmonic to noise energy）に対応しうる。低帯域合成器２０４は、ピッチ利得値に基づいて、ハーモニシティパラメータ２４６を決定することができる。低帯域合成器２０４は、パラメータ２４２に基づいて、ピッチ利得値を決定することができる。特定の実施形態では、低帯域合成器２０４は、ビットストリームの低帯域部分２３２からハーモニシティパラメータ２４６を抽出することができる。例えば、モバイルデバイス１０４は、図３を参照して説明されるように、ビットストリーム１３２にハーモニシティパラメータ２４６を含むことができる。

[0073]低帯域合成器２０４は、特定の低帯域モデルを使用して、パラメータ２４２および低帯域励起信号２４４に基づいて、合成された低帯域信号２３４を生成することができる。低帯域合成器２０４は、ＭＵＸ１７０に合成された低帯域信号２３４を提供することができる。

[0074]発声ファクタ生成器２０８は、低帯域合成器２０４からパラメータ２４２を受信することができる。モジュールファクタ生成器２０８は、パラメータ２４２、前の発声決定、１つ以上の他のファクタ、またはそれらの組み合わせに基づいて、発声ファクタ２３６（例えば、０．０から１．０までの値）を生成することができる。発声ファクタ２３６は、入力信号１３０の有声／無声性質（例えば、強力な有声、微力な有声、微力な無声、または強力な無声）を示すことができる。パラメータ２４２は、入力信号１３０の低帯域信号のゼロ交差率、第１の反射係数、低帯域励起における適応コードブック寄与のエネルギー対低帯域励起における適応コードブックおよび固定コードブックの寄与の合計のエネルギーの比率、入力信号１３０の低帯域信号のピッチ利得、またはそれらの組み合わせを含むことができる。発声ファクタ生成器２０８は、数式１に基づいて発声ファクタ２３６を決定することができる。

ここにおいて、

であり、ａ_ｉおよびｃは重みであり、ｐ_ｉは特定の測定された信号パラメータに対応し、Ｍは発声ファクタ決定で使用されるパラメータの数に対応する。

[0075]例示的な実施形態では、発声ファクタ=−０．４２３１＊ＺＣＲ＋０．２７１２＊ＦＲ＋０．０４５８＊ＡＣＢ＿ｔｏ＿ｅｘｃｉｔａｔｉｏｎ＋０．１８４９＊ＰＧ＋０．０１３８＊ｐｒｅｖ＿ｖｏｉｃｉｎｇ＿ｄｅｃｉｓｉｏｎ＋０．０６１１であり、ここでＺＣＲはゼロ交差率に対応し、ＦＲは第１の反射係数に対応し、ＡＣＢ＿ｔｏ＿ｅｘｃｉｔａｔｉｏｎは低帯域励起における適応コードブック寄与のエネルギー対低帯域励起における適応コードブックおよび固定コードブックの寄与の合計のエネルギーの比率に対応し、ＰＧはピッチ利得に対応し、ｐｒｅｖｉｏｕｓ＿ｖｏｉｃｉｎｇ＿ｄｅｃｉｓｉｏｎは別のフレームのために以前計算された別の発声係数に対応する。特定の実施形態では、発声ファクタ生成器２０８は、有声としてよりも無声としてフレームを分類するためにより高いしきい値を使用しうる。例えば、発声ファクタ生成器２０８は、フレームを、先行するフレームが無声と分類されており、そのフレームが第１のしきい値（例えば、低しきい値）を満たす発声値を有する場合、無声として分類することができる。発声ファクタ生成器２０８は、入力信号１３０の低帯域信号のレートのゼロ交差率、第１の反射係数、低帯域励起における適応コードブック寄与のエネルギー対低帯域励起における適応コードブックおよび固定コードブック寄与の合計のエネルギーの比率、入力信号１３０の低帯域信号のピッチ利得、またはそれらの組み合わせに基づいて、発声値を決定することができる。代わりとして、発声ファクタ生成器２０８は、フレームを、フレームの発声値が第２のしきい値（例えば、非常に低いしきい値）を満たす場合、無声として分類することができる。特定の実施形態では、発声ファクタ２３６は、図１の発声分類１８０に対応しうる。

[0076]励起信号生成器２２２は、低帯域合成器２０４から低帯域励起信号２４４およびハーモニシティパラメータ２４６を受信することができ、発声ファクタ生成器２０８から発声ファクタ２３６を受信することができる。励起信号生成器２２２は、図１および図４−７を参照して説明されているように、低帯域励起信号２４４、ハーモニシティパラメータ２４６、および発声ファクタ２３６に基づいて、高帯域励起信号１８６を生成することができる。例えば、包絡調整器１６２は、図１および図４−７を参照して説明されているように、発声分類２３６に基づいて、低帯域励起信号２４４の包絡の量を制御することができる。特定の実施形態では、信号包絡１８２は、制御された量の包絡に対応しうる。包絡調整器１６２は、変調器１６４に第２の信号１８２を提供することができる。

[0077]変調器１６４は、図１および４−７を参照して説明されているように、変調されたホワイトノイズ１８４を生成するために信号包絡１８２を使用してホワイトノイズ１５６を変調することができる。変調器１６４は、出力回路１６６に変調されたホワイトノイズ１８４を提供することができる。

[0078]出力回路１６６は、図１および４−７を参照して説明されているように、変調されたホワイトノイズ１８４と別の信号とを組み合わせることによって、高帯域励起信号１８６を生成することができる。特定の実施形態では、図４−７を参照して説明されるように、出力回路１６６は、ハーモニシティパラメータ２４６に基づいて、変調されたホワイトノイズ１８４と他の信号とを組み合わせることができる。

[0079]出力回路１６６は、高帯域合成器１６８に高帯域励起信号１８６を提供することができる。高帯域合成器１６８は、高帯域励起信号１８６およびビットストリームの高帯域部分２１８に基づいて、ＭＵＸ１７０に合成された高帯域信号１８８を提供することができる。例えば、高帯域合成器１６８は、ビットストリームの高帯域部分２１８から入力信号１３０の高帯域パラメータを抽出することができる。高帯域合成器１６８は、特定の高帯域モデルに基づいて合成された高帯域信号１８８を生成するために、高帯域パラメータおよび高帯域励起信号１８６を使用することができる。特定の実施形態では、ＭＵＸ１７０は、出力信号１１６を生成するために、合成された低帯域信号２３４と合成された高帯域信号１８８とを組み合わせることができる。

[0080]したがって図２のデコーダ２００は、合成されたオーディオ信号が無声（または強力な無声）入力信号に対応するとき、「平滑な」サウンディング合成された信号の生成を可能にしうる。合成された高帯域信号は、入力信号の発声分類に基づいて変調されるノイズ信号を使用して生成されうる。変調されたノイズ信号は、入力信号が強力な無声であるときよりも入力信号が強力な有声であるときの方が、入力信号により密接に対応しうる。特定の実施形態では、合成された高帯域信号は、入力信号が強力な無声であるとき、低減されたスパース性を有しうるか、または全くスパース性を有さないことがあり、それにより、より平滑な（例えば、より少ないアーチファクトを有する）合成されたオーディオ信号をもたらす。加えて、前の発声決定に基づいて、発声決定に基づいて発声分類（または発声ファクタ）を決定することは、フレームの誤った分類（misclassification）の作用を軽減することができ、結果として有声フレームと無声フレームとの間のより平滑な遷移をもたらしうる。

[0081]図３を参照すると、高帯域励起信号生成を実行するように動作可能であるエンコーダの特定の実施形態が開示され、概して３００と指定されている。特定の実施形態では、エンコーダ３００は、図１のシステム１００に対応するか、またはシステム１００に含まれうる。例えば、エンコーダ３００は、第１のデバイス１０２、モバイルデバイス１０４、またはその両方に含まれうる。エンコーダ３００は、送信デバイス（例えば、モバイルデバイス１０４）でオーディオ信号の符号化を例示することができる。

[0082]エンコーダ３００は、低帯域エンコーダ３０４に結合されたフィルタバンク３０２、発声ファクタ生成器２０８、および高帯域エンコーダ１７２を含む。低帯域エンコーダ３０４は、ＭＵＸ１７４に結合されうる。低帯域エンコーダ３０４および発声ファクタ生成器２０８は、励起信号生成器２２２を介して高帯域エンコーダ１７２に結合されうる。高帯域エンコーダ１７２は、ＭＵＸ１７４に結合されうる。

[0083]動作中に、フィルタバンク３０２は入力信号１３０を受信することができる。例えば、入力信号１３０は、マイクロフォン１４６を介して図１のモバイルデバイス１０４によって受信されうる。フィルタバンク３０２は、低帯域信号３３４および高帯域信号３４０を含む複数の信号に入力信号１３０を分割することができる。例えば、フィルタバンク３０２は、入力信号１３０のより低い周波数サブ帯域（例えば、５０Ｈｚ−７ｋＨｚ）に対応するローパスフィルタを使用して低帯域信号３３４を生成することができ、入力信号１３０のより高い周波数サブ帯域（例えば、７ｋＨｚ−１６ｋＨｚ）に対応するハイパスフィルタを使用して高帯域信号３４０を生成することができる。フィルタバンク３０２は、低帯域エンコーダ３０４に低帯域信号３３４を提供することができ、高帯域エンコーダ１７２に高帯域信号３４０を提供することができる。

[0084]低帯域エンコーダ３０４は、低帯域信号３３４に基づいて、パラメータ２４２（例えば、低帯域パラメータ情報）および低帯域励起信号２４４を生成することができる。例えば、パラメータ２４２は、低帯域ＬＰＣ係数、低帯域ＬＳＦ、低帯域線スペクトル対（ＬＳＰ）、またはそれらの組み合わせを含むことができる。低帯域励起信号２４４は、低帯域残差信号に対応しうる。低帯域エンコーダ３０４は、特定の低帯域モデル（例えば、特定の線形予測モデル）に基づいて、パラメータ２４２および低帯域励起信号２４４を生成することができる。例えば、低帯域エンコーダ３０４は、低帯域信号３３４のパラメータ２４２（例えば、フォルマントに対応するフィルタ係数）を生成することができ、パラメータ２４２に基づいて低帯域信号３３４を逆フィルタリングすることができ、低帯域励起信号２４４（例えば、低帯域信号３３４の低帯域残差信号）を生成するために低帯域信号３３４から逆フィルタリングされた信号を差し引くことができる。低帯域エンコーダ３０４は、パラメータ２４２および低帯域励起信号２４４を含む低帯域ビットストリーム３４２を生成することができる。特定の実施形態では、低帯域ビットストリーム３４２は、ハーモニシティパラメータ２４６を含むことができる。例えば、低帯域エンコーダ３０４は、図２の低帯域合成器２０４を参照して説明されたように、ハーモニシティパラメータ２４６を決定することができる。

[0085]低帯域エンコーダ３０４は、発声ファクタ生成器２０８にパラメータ２４２を提供することができ、励起信号生成器２２２に低帯域励起信号２４４およびハーモニシティパラメータ２４６を提供することができる。発声ファクタ生成器２０８は、図２を参照して説明されたように、パラメータ２４２に基づいて、発声ファクタ２３６を決定することができる。励起信号生成器２２２は、図２および図４−７を参照して説明されているように、低帯域励起信号２４４、ハーモニシティパラメータ２４６、および発声ファクタ２３６に基づいて、高帯域励起信号１８６を決定することができる。

[0086]励起信号生成器２２２は、高帯域エンコーダ１７２に高帯域励起信号１８６を提供することができる。高帯域エンコーダ１７２は、図１を参照して説明されたように、高帯域信号３４０および高帯域励起信号１８６に基づいて、高帯域ビットストリーム１９０を生成することができる。高帯域エンコーダ１７２は、ＭＵＸ１７４に高帯域ビットストリーム１９０を提供することができる。ＭＵＸ１７４は、ビットストリーム１３２を生成するために、低帯域ビットストリーム３４２と高帯域ビットストリーム１９０とを組み合わせることができる。

[0087]したがってエンコーダ３００は、入力信号の発声分類に基づいて変調されるノイズ信号を使用して合成されたオーディオ信号を生成するデコーダのエミュレーションを受信デバイスで可能にしうる。エンコーダ３００は、入力信号１３０に密接に近似するように合成されたオーディオ信号を生成するために使用される高帯域パラメータ（例えば、利得値）を生成することができる。

[0088]図４−７は、高帯域励起信号生成の方法の特定の実施形態を例示するための図である。図４−７の方法の各々は、図１−３のシステム１００−３００の１つ以上のコンポーネントによって実行されうる。例えば、図４−７の方法の各々は、図１の高帯域励起信号生成モジュール１２２、図２および／または図３の励起信号生成器２２２、図２の発声ファクタ生成器２０８、あるいはそれらの組み合わせのうちの１つ以上のコンポーネントによって実行されうる。図４−７は、変換ドメイン、時間ドメイン、または変換ドメインもしくは時間ドメインのどちらかで表現された高帯域励起信号を生成する方法の代わりの実施形態を例示している。

[0089]図４を参照すると、高帯域励起信号生成の方法の特定の実施形態の図が図示され、概して４００と指定されている。方法４００は、変換ドメインまたは時間ドメインのどちらかで表現された高帯域励起信号を生成することに対応しうる。

[0090]方法４００は、４０４で、発声ファクタを決定することを含む。例えば、図２の発声ファクタ生成器２０８は、標本信号４２２に基づいて発声ファクタ２３６を決定することができる。特定の実施形態では、発声ファクタ生成器２０８は、１つ以上の他の信号パラメータに基づいて、発声ファクタ２３６を決定することができる。特定の実施形態では、いくつかの信号パラメータは、発声ファクタ２３６を決定するために組み合わさって機能しうる。例えば、発声ファクタ生成器２０８は、図２−３を参照して説明されたように、ビットストリームの低帯域部分２３２（または図３の低帯域信号３３４）、パラメータ２４２、前の発声決定、１つ以上の他のファクタ、またそれらの組み合わせに基づいて、発声ファクタ２３６を決定することができる。標本信号４２２は、ビットストリームの低帯域部分２３２、低帯域信号３３４、または低帯域励起信号２４４を拡張することによって生成された拡張された信号を含むことができる。標本信号４２２は、変換（例えば、周波数）ドメインまたは時間ドメインで表現されうる。例えば、励起信号生成モジュール１２２は、図１の入力信号１３０、ビットストリーム１３２、ビットストリームの低帯域部分２３２、低帯域信号３３４、図２の低帯域励起信号２４４を拡張することによって生成された拡張された信号、またはそれらの組み合わせに変換（例えば、フーリエ変換）を適用することによって、標本信号４２２を生成することができる。

[0091]方法４００はまた、４０８におけるローパスフィルタ（ＬＰＦ）カットオフ周波数を計算することと、４０１における信号包絡の量を制御することと、を含む。例えば、図１の包絡調整器１６２は、発声ファクタ２３６に基づいて、ＬＰＦカットオフ周波数４２６を計算することができる。発声ファクタ２３６が強力な有声オーディオを示す場合、ＬＰＦカットオフ周波数４２６はより高くあり得、時間包絡のハーモニックコンポーネントのより高い影響を示す。発声ファクタ２３６が強力な無声オーディオを示すとき、ＬＰＦカットオフ周波数４２６はより低くあり得、時間包絡のハーモニックコンポーネントのより低い影響（または全く無い影響）に対応する。

[0092]包絡調整器１６２は、信号包絡１８２の特性（例えば、周波数範囲）を制御することによって、信号包絡１８２の量を制御することができる。例えば、包絡調整器１６２は、標本信号４２２にローパスフィルタ４５０を適用することによって信号包絡１８２の特性を制御することができる。ローパスフィルタ４５０のカットオフ周波数は、ＬＰＦカットオフ周波数４２６に実質的に等しくありうる。包絡調整器１６２は、ＬＰＦカットオフ周波数４２６に基づいて、標本信号４２２の時間包絡を追跡することによって信号包絡１８２の周波数範囲を制御することができる。例えば、ローパスフィルタ４５０は、フィルタリングされた信号がＬＰＦカットオフ周波数４２６によって定義された周波数範囲を有するように標本信号４２２をフィルタリングすることができる。例示するために、フィルタリングされた信号の周波数範囲は、ＬＰＦカットオフ周波数４２６未満でありうる。特定の実施形態では、フィルタリングされた信号は、ＬＰＦカットオフ周波数４２６未満の標本信号４２２の振幅に一致する振幅を有することができ、ＬＰＦカットオフ周波数４２６を上回る低振幅（例えば、０に実質的に等しい）を有することができる。

[0093]グラフ４７０は、元のスペクトル形状４８２を例示する。元のスペクトル形状４８２は、標本信号４２２の信号包絡１８２を表現することができる。第１のスペクトル形状４８４は、標本信号４２２にＬＰＦカットオフ周波数４２６を有するフィルタを適用することによって生成されたフィルタリングされた信号に対応しうる。

[0094]ＬＰＦカットオフ周波数４２６は追跡速度を決定することができる。例えば、時間包絡は、発声ファクタ２３６が無声を示すときよりも発声ファクタ２３６が有声を示すときにより速く追跡されうる（例えば、より頻繁に更新されうる）。特定の実施形態では、包絡調整器１６２は、時間ドメインにおける信号包絡１８２の特性を制御することができる。代わりの実施形態では、包絡調整器１６２は、サンプル毎に信号包絡１８２の特性を制御することができる。代わりの実施形態では、包絡調整器１６２は、変換ドメインで表現された信号包絡１８２の特性を制御することができる。例えば、包絡調整器１６２は、追跡速度に基づいてスペクトル形状を追跡することによって信号包絡１８２の特性を制御することができる。包絡調整器１６２は、図１の変調器１６４に信号包絡１８２を提供することができる。

[0095]方法４００はさらに、４１２で、信号包絡１８２をホワイトノイズ１５６と乗算することを含む。例えば、図１の変調器１６４は、変調されたホワイトノイズ１８４を生成するようにホワイトノイズ１５６を変調するために信号包絡１８２を使用することができる。信号包絡１８２は、変換ドメインまたは時間ドメインで表現されたホワイトノイズ１５６を変調することができる。

[0096]方法４００はまた、４０６で、混合（mixture）を決定することを含む。例えば、図１の変調器１６４は、ハーモニシティパラメータ２４６および発声ファクタ２３６に基づいて、変調されたホワイトノイズに１８４に適用されるべき第１の利得（例えば、ノイズ利得４３４）および標本信号４２２に適用されるべき第２の利得（例えば、ハーモニクス利得４３６）を決定することができる。例えば、ノイズ利得４３４（例えば、０と１との間）およびハーモニクス利得４３６は、ハーモニシティパラメータによって示されたハーモニック対ノイズエネルギーの比率に一致するように計算されうる。変調器１６４は、発声ファクタ２３６が強力な無声を示すときにノイズ利得４３４を増加させ得、発声ファクタ２３６が強力な有声を示すときにノイズ利得４３４を低減することができる。特定の実施形態では、変調器１６４は、ノイズ利得４３４に基づいてハーモニクス利得４３６を決定することができる。特定の実施形態では、

である。

[0097]方法４００はさらに、４１４で、変調されたホワイトノイズ４３４とノイズ利得４３４とを乗算することを含む。例えば、図１の出力回路１６６は、変調されたホワイトノイズ１８４にノイズ利得４３４を適用することによって、スケーリングされた変調されたホワイトノイズ４３８を生成することができる。

[0098]方法４００はまた、４１６で、標本信号４２２とハーモニクス利得４３６とを乗算することを含む。例えば、図１の出力回路１６６は、標本信号４２２にハーモニクス利得４３６を適用することによって、スケーリングされた標本信号４４０を生成することができる。

[0099]方法４００はさらに、４１８で、スケーリングされた変調されたホワイトノイズ４３８およびスケーリングされた標本信号４４０を加算することを含む。例えば、図１の出力回路１６６は、スケーリングされた変調されたホワイトノイズ４３８とスケーリングされた標本信号４４０とを組み合わせる（例えば、加算すること）によって、高帯域励起信号１８６を生成することができる。代わりの実施形態では、動作４１４、動作４１６、またはその両方は、図１の変調器１６４によって実行されうる。高帯域励起信号１８６は、変換ドメインまたは時間ドメインにありうる。

[0100]したがって方法４００は、信号包絡の量が、発声ファクタ２３６に基づいて包絡の特性を制御することによって制御されることを可能にしうる。特定の実施形態では、変調されたホワイトノイズ１８４と標本信号４２２の割合は、ハーモニシティパラメータ２４６に基づいて利得ファクタ（例えば、ノイズ利得４３４およびハーモニクス利得４３６）によって動的に決定されうる。変調されたホワイトノイズ１８４および標本信号４２２は、高帯域励起信号１８６のハーモニック対ノイズエネルギーの比率が入力信号１３０の高帯域信号のハーモニック対ノイズエネルギーの比率に近似するようにスケーリングされうる。

[0101]特定の実施形態では、図４の方法４００は、中央処理ユニット（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、もしくはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）等）を介して、ファームウェアデバイスを介して、またはそれらのあらゆる組み合わせを介して実装されうる。例として、図４の方法４００は、図９に関連して説明されるように、命令を実行するプロセッサによって実行されうる。

[0102]図５を参照すると、高帯域励起信号生成の方法の特定の実施形態の図が図示され、概して５００と指定されている。方法５００は、変換ドメインで表現された信号包絡の量を制御すること、変換ドメインで表現されたホワイトノイズを変調すること、またはその両方によって、高帯域励起信号を生成することを含むことができる。

[0103]方法５００は、方法４００の動作４０４、４０６、４１２、および４１４を含む。標本信号４２２は、図４を参照して説明されたように、変換（例えば、周波数）ドメインで表現されうる。

[0104]方法５００はまた、５０８で、帯域幅拡大ファクタを計算することを含む。例えば、図１の包絡調整器１６２は、発声ファクタ２３６に基づいて、帯域幅拡大ファクタ５２６を決定することができる。例えば、帯域幅拡大ファクタ５２６は、発声ファクタ２３６がより強力な無声を示すときよりも、発声ファクタ２３６が強力な有声を示すときにより大幅な帯域幅拡大を示すことができる。

[0105]方法５００はさらに、５１０で、高帯域ＬＰＣ極点を調整することによってスペクトルを生成することを含む。例えば、包絡調整器１６２は、標本信号４２２に関連付けられたＬＰＣ極点を決定することができる。包絡調整器１６２は、信号包絡１８２の大きさ、信号包絡１８２の形状、信号包絡１８２の利得、またはそれらの組み合わせを制御することによって信号包絡１８２の特性を制御することができる。例えば、包絡調整器１６２は、帯域幅拡大ファクタ５２６に基づいてＬＰＣ極点を調整することによって、信号包絡１８２の大きさ、信号包絡１８２の形状、信号包絡１８２の利得、またはそれらの組み合わせを制御することができる。特定の実施形態では、ＬＰＣ極点は変換ドメインにおいて調整されうる。包絡調整器１６２は、調整されたＬＰＣ極点に基づいてスペクトルを生成することができる。

[0106]グラフ５７０は、元のスペクトル形状５８２を例示する。元のスペクトル形状５８２は、標本信号４２２の信号包絡１８２を表現することができる。元のスペクトル形状５８２は、標本信号４２２に関連付けられたＬＰＣ極点に基づいて生成されうる。包絡調整器１６２は、発声ファクタ２３６に基づいてＬＰＣ極点を調整することができる。包絡調整器１６２は、第１のスペクトル形状５８４または第２のスペクトル形状５８６を有するフィルタリングされた信号を生成するために、標本信号４２２に、調整されたＬＰＣ極点に対応するフィルタを適用することができる。フィルタリングされた信号の第１のスペクトル形状５８４は、発声ファクタ２３６が強力な有声を示すとき、調整されたＬＰＣ極点に対応しうる。フィルタリングされた信号の第２のスペクトル形状５８６は、発声ファクタ２３６が強力な無声を示すとき、調整されたＬＰＣ極点に対応しうる。

[0107]信号包絡１８２は、生成されたスペクトル、調整されたＬＰＣ極点、調整されたＬＰＣ極点を有する標本信号４２２に関連付けられたＬＰＣ係数、またはそれらの組み合わせに対応しうる。包絡調整器１６２は、図１の変調器１６４に信号包絡１８２を提供することができる。

[0108]変調器１６４は、方法４００の動作４１２を参照して説明されたように、変調されたホワイトノイズ１８４を生成するために信号包絡１８２を使用してホワイトノイズ１５６を変調することができる。変調器１６４は、変換ドメインで表現されたホワイトノイズ１５６を変調することができる。図１の出力回路１６６は、方法４００の動作４１４を参照して説明されたように、変調されたホワイトノイズ１８４およびノイズ利得４３４に基づいて、スケーリングされた変調されたホワイトノイズ４３８を生成することができる。

[0109]方法５００はまた、５１２で、高帯域ＬＰＣスペクトル５４２と標本信号４２２とを乗算することを含む。例えば、図１の出力回路１６６は、フィルタリングされた信号５４４を生成するために、高帯域ＬＰＣスペクトル５４２を使用して標本信号４２２をフィルタリングすることができる。特定の実施形態では、出力回路１６６は、標本信号４２２に関連付けられた高帯域パラメータ（例えば、高帯域ＬＰＣ係数）に基づいて、高帯域ＬＰＣスペクトル５４２を決定することができる。例示するために、出力回路１６６は、図２のビットストリームの高帯域部分２１８に基づいて、または図３の高帯域信号３４０から生成された高帯域パラメータ情報に基づいて、高帯域ＬＰＣスペクトル５４２を決定することができる。

[0110]標本信号４２２は、図２の低帯域励起信号２４４から生成された拡張された信号に対応しうる。出力回路１６６は、フィルタリングされた信号５４４を生成するために、高帯域ＬＰＣスペクトル５４２を使用して拡張された信号を合成することができる。合成は、変換ドメインにありうる。例えば、出力回路１６６は、周波数ドメインにおいて乗算を使用して合成を実行することができる。

[0111]方法５００はさらに、５１６で、フィルタリングされた信号５４４とハーモニクス利得４３６とを乗算することを含む。例えば、図１の出力回路１６６は、スケーリングされたフィルタリングされた信号５４０を生成するために、フィルタリングされた信号５４４をハーモニクス利得４３６と乗算することができる。特定の実施形態では、動作５１２、動作５１６、またはその両方は、図１の変調器１６４によって実行されうる。

[0112]方法５００はまた、５１８で、スケーリングされた変調されたホワイトノイズ４３８およびスケーリングされたフィルタリングされた信号５４０を加算することを含む。例えば、図１の出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされた変調されたホワイトノイズ４３８とスケーリングされたフィルタリングされた信号５４０とを組み合わせることができる。高帯域励起信号１８６は、変換ドメインで表現されうる。

[0113]したがって方法５００は、信号包絡の量が、発声ファクタ２３６に基づいて変換ドメインにおいて高帯域ＬＰＣ極点を調整することによって制御されることを可能にしうる。特定の実施形態では、変調されたホワイトノイズ１８４とフィルタリングされた信号５４４の割合は、ハーモニシティパラメータ２４６に基づいて利得（例えば、ノイズ利得４３４およびハーモニクス利得４３６）によって動的に決定されうる。変調されたホワイトノイズ１８４およびフィルタリングされた信号５４４は、高帯域励起信号１８６のハーモニック対ノイズエネルギーの比率が入力信号１３０の高帯域信号のハーモニック対ノイズエネルギーの比率に近似するようにスケーリングされうる。

[0114]特定の実施形態では、図５の方法５００は、中央処理ユニット（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、もしくはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）等）を介して、ファームウェアデバイスを介して、またはそれらのあらゆる組み合わせを介して実装されうる。例として、図５の方法５００は、図９に関連して説明されるように、命令を実行するプロセッサによって実行されうる。

[0115]図６を参照すると、高帯域励起信号生成の方法の特定の実施形態の図が図示され、概して６００と指定されている。方法６００は、時間ドメインにおいて信号包絡の量を制御することによって、高帯域励起信号を生成することを含むことができる。

[0116]方法６００は、方法４００の動作４０４、４０６、および４１４、ならびに方法５００の動作５０８を含む。標本信号４２２およびホワイトノイズ１５６は、時間ドメインにありうる。

[0117]方法６００はまた、６１０で、ＬＰＣ合成を実行することを含む。例えば、図１の包絡調整器１６２は、帯域幅拡張ファクタ５２６に基づいてフィルタの係数を調整することによって、信号包絡１８２の特性（例えば、形状、大きさ、および／または利得）を制御することができる。特定の実施形態では、ＬＰＣ合成は変換ドメインにおいて実行されうる。フィルタの係数は、高帯域ＬＰＣ係数に対応しうる。ＬＰＣフィルタ係数は、スペクトルピークを表現することができる。ＬＰＣフィルタ係数を調整することによってスペクトルピークを制御することは、発声ファクタ２３６に基づいて、ホワイトノイズ１５６の変調の程度の制御を可能にしうる。

[0118]例えば、スペクトルピークは、発声ファクタ２３６が有声発話を示すとき維持されうる。別の例として、スペクトルピークは、発声ファクタ２３６が無声発話を示すとき、全体のスペクトル形状を維持しながらも平滑化されうる。

[0119]グラフ６７０は、元のスペクトル形状６８２を例示する。元のスペクトル形状６８２は、標本信号４２２の信号包絡１８２を表現ことができる。元のスペクトル形状６８２は、標本信号４２２に関連付けられたＬＰＣフィルタ係数に基づいて生成されうる。包絡調整器１６２は、発声ファクタ２３６に基づいてＬＰＣフィルタ係数を調整することができる。包絡調整器１６２は、第１のスペクトル形状６８４または第２のスペクトル形状６８６を有するフィルタリングされた信号を生成するために、標本信号４２２に、調整されたＬＰＣフィルタ係数に対応するフィルタを適用することができる。フィルタリングされた信号の第１のスペクトル形状６８４は、発声ファクタ２３６が強力な有声を示すとき、調整されたＬＰＣフィルタ係数に対応しうる。第１のスペクトル形状６８４によって例示されているように、発声ファクタ２３６が強力な有声を示すとき、スペクトルピークは維持されうる。第２のスペクトル形状６８６は、発声ファクタ２３６が強力な無声を示すとき、調整されたＬＰＣフィルタ係数に対応しうる。第２のスペクトル形状６８６によって例示されているように、発声ファクタ２３６が強力な無声を示すときは、スペクトルピークが平滑化されながらも全体のスペクトル形状は維持されうる。信号包絡１８２は、調整されたフィルタ係数に対応しうる。包絡調整器１６２は、図１の変調器１６４に信号包絡１８２を提供することができる。

[0120]変調器１６４は、変調されたホワイトノイズ１８４を生成するために、信号包絡１８２（例えば、調整されたフィルタ係数）を使用してホワイトノイズ１５６を変調することができる。例えば、変調器１６４は、変調されたホワイトノイズ１８４を生成するためにホワイトノイズ１５６にフィルタを適用することができ、ここでフィルタは調整されたフィルタ係数を有する。変調器１６４は、図１の出力回路１６６に変調されたホワイトノイズ１８４を提供することができる。出力回路１６６は、図４の動作４１４を参照して説明されているように、スケーリングされた変調されたホワイトノイズ４３８を生成するために、変調されたホワイトノイズ１８４をノイズ利得４３４と乗算することができる。

[0121]方法６００はさらに、６１２で、高帯域ＬＰＣ合成を実行することを含む。例えば、図１の出力回路１６６は、合成された高帯域信号６１４を生成するために標本信号４２２を合成することができる。合成は時間ドメインにおいて実行されうる。特定の実施形態では、標本信号４２２は、低帯域励起信号を拡張することによって生成されうる。出力回路１６６は、標本信号４２２に、高帯域ＬＰＣを使用して同期フィルタを適用することによって、合成された高帯域信号６１４を生成することができる。

[0122]方法６００はまた、６１６で、合成された高帯域信号６１４とハーモニクス利得４３６とを乗算することを含む。例えば、図１の出力回路１６６は、スケーリングされた合成された高帯域信号６４０を生成するために、合成された高帯域信号６１４にハーモニクス利得４３６を適用することができる。代わりの実施形態では、図１の変調器１６４は、動作６１２、動作６１６、またはその両方を実行することができる。

[0123]方法６００はさらに、６１８で、スケーリングされた変調されたホワイトノイズ４３８およびスケーリングされた合成された高帯域信号６４０を加算することを含む。例えば、図１の出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされた変調されたホワイトノイズ４３８とスケーリングされた合成された高帯域信号６４０とを組み合わせることができる。

[0124]したがって方法６００は、信号包絡の量が、発声ファクタ２３６に基づいてフィルタの係数を調整することによって制御されることを可能にしうる。特定の実施形態では、変調されたホワイトノイズ１８４と合成された高帯域信号６１４の割合は、発声ファクタ２３６に基づいて動的に決定されうる。変調されたホワイトノイズ１８４および合成された高帯域信号６１４は、高帯域励起信号１８６のハーモニック対ノイズエネルギーの比率が入力信号１３０の高帯域信号のハーモニック対ノイズエネルギーの比率に近似するようにスケーリングされうる。

[0125]特定の実施形態では、図６の方法６００は、中央処理ユニット（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、もしくはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）等）を介して、ファームウェアデバイスを介して、またはそれらのあらゆる組み合わせを介して実装されうる。例として、図６の方法６００は、図９に関連して説明されるように、命令を実行するプロセッサによって実行されうる。

[0126]図７を参照すると、高帯域励起信号生成の方法の特定の実施形態の図が図示され、概して７００と指定されている。方法７００は、時間ドメインまたは変換（例えば、周波数）ドメインで表現された信号包絡の量を制御することによって、高帯域励起信号を生成することに対応しうる。

[0127]方法７００は、方法４００の動作４０４、４０６、４１２、４１４、および４１６を含む。標本信号４２２は、変換ドメインまたは時間ドメインで表現されうる。方法７００はまた、７１０で、信号包絡を決定することを含む。例えば、図１の包絡調整器１６２は、一定の係数で標本信号４２２にローパスフィルタを適用することによって信号包絡１８２を生成することができる。

[0128]方法７００はまた、７０２で、二乗平均平方根値を決定することを含む。例えば、図１の変調器１６４は、信号包絡１８２の二乗平均平方根エネルギーを決定することができる。

[0129]方法７００はさらに、７１２で、二乗平均平方根値をホワイトノイズ１５６と乗算することを含む。例えば、図１の出力回路１６６は、変調されていないホワイトノイズ７３６を生成するために、二乗平均平方根値をホワイトノイズ１５６と乗算することができる。

[0130]図１の変調器１６４は、方法４００の動作４１２を参照して説明されているように、変調されたホワイトノイズ１８４を生成するために信号包絡１８２をホワイトノイズ１５６と乗算することができる。ホワイトノイズ１５６は、変換ドメインまたは時間ドメインで表現されうる。

[0131]方法７００はまた、７０４で、変調されたホワイトノイズおよび変調されていないホワイトノイズに関する利得の割合を決定することを含む。例えば、図１の出力回路１６６は、ノイズ利得４３４および発声ファクタ２３６に基づいて、変調されていないノイズ利得７３４および変調されたノイズ利得７３２を決定することができる。発声ファクタ２３６が、符号化されたオーディオ信号が強力な有声オーディオに対応することを示す場合、変調されたノイズ利得７３２は、ノイズ利得４３４のより高い割合に対応しうる。発声ファクタ２３６が、符号化されたオーディオ信号が強力な無声オーディオに対応することを示す場合、変調されていないノイズ利得７３４は、ノイズ利得４３４のより高い割合に対応しうる。

[0132]方法７００はさらに、７１４で、変調されていないノイズ利得７３４と変調されていないホワイトノイズ７３６を乗算することを含む。例えば、図１の出力回路１６６は、スケーリングされた変調されていないホワイトノイズ７４２を生成するために、変調されていないホワイトノイズ７３６に変調されていないノイズ利得７３４を適用することができる。

[0133]出力回路１６６は、方法４００の動作４１４を参照して説明されたように、スケーリングされた変調されたホワイトノイズ７４０を生成するために、変調されたホワイトノイズ１８４に変調されたノイズ利得７３２を適用することができる。

[0134]方法７００はまた、７１６で、スケーリングされた変調されていないホワイトノイズ７４２およびスケーリングされたホワイトノイズ７４４を加算することを含む。例えば、図１の出力回路１６６は、スケーリングされたホワイトノイズ７４４を生成するために、スケーリングされた変調されていないホワイトノイズ７４２とスケーリングされた変調されたホワイトノイズ７４０とを組み合わせることができる。

[0135]方法７００はさらに、７１８で、スケーリングされたホワイトノイズ７４４およびスケーリングされた標本信号４４０を加算することを含む。例えば、出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされたホワイトノイズ７４４とスケーリングされた標本信号４４０とを組み合わせることができる。方法７００は、標本信号４２２を使用して変換（または時間）ドメインで表現された高帯域励起信号１８６および変換（または時間）ドメインで表現されたホワイトノイズ１５６を生成することができる。

[0136]したがって方法７００は、発声ファクタ２３６に基づいて、変調されていないホワイトノイズ７３６と変調されたホワイトノイズ１８４の割合が、利得ファクタ（例えば、変調されていないノイズ利得７３４および変調されたノイズ利得７３２）によって動的に決定されることを可能にしうる。強力な無声オーディオに関する高帯域励起信号１８６は、スパースコーディングされた低帯域残差に基づいて変調されたホワイトノイズに対応する高帯域信号よりも少ないアーチファクトを有する変調されていないホワイトノイズに対応しうる。

[0137]特定の実施形態では、図７の方法７００は、中央処理ユニット（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、もしくはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）等）を介して、ファームウェアデバイスを介して、またはそれらのあらゆる組み合わせを介して実装されうる。例として、図７の方法７００は、図９に関連して説明されるように、命令を実行するプロセッサによって実行されうる。

[0138]図８を参照すると、高帯域励起信号生成の方法の特定の実施形態のフローチャートが図示され、概して８００と指定されている。方法８００は、図１−３のシステム１００−３００の１つ以上のコンポーネントによって実行されうる。例えば、方法８００は、図１の高帯域励起信号生成モジュール１２２、図２または図３の励起信号生成器２２２、図２の発声ファクタ生成器２０８、またはそれらの組み合わせのうちの１つ以上のコンポーネントによって実行されうる。

[0139]方法８００は、８０２で、デバイスで入力信号の発声分類を決定することを含む。入力信号は、オーディオ信号に対応しうる。例えば、図１の発声分類器１６０は、図１を参照して説明されたように、入力信号１３０の発声分類１８０を決定することができる。入力信号１３０は、オーディオ信号に対応しうる。

[0140]方法８００はまた、８０４で、発声分類に基づいて入力信号の表現の包絡の量を制御することを含む。例えば、図１の包絡調整器１６２は、図１を参照して説明されているように、発声分類１８０に基づいて、入力信号１３０の表現の包絡の量を制御することができる。入力信号１３０の表現は、ビットストリーム（例えば、図２のビットストリーム２３２）の低帯域部分、低帯域信号（例えば、図３の低帯域信号３３４）、低帯域励起信号（例えば、図２の低帯域励起信号２４４）を拡張することによって生成された拡張された信号、別の信号、またはそれらの組み合わせでありうる。例えば、入力信号１３０の表現は、図４−７の標本信号を含むことができる。

[0141]方法８００はさらに、８０６で、制御された量の包絡に基づいて、ホワイトノイズ信号を変調することを含む。例えば、図１の変調器１６４は、信号包絡１８２に基づいてホワイトノイズ１５６を変調することができる。信号包絡１８２は、制御された量の包絡に対応しうる。例示するために、変調器１６４は、図４および６−７にあるように、時間ドメインにおいてホワイトノイズ１５６を変調することができる。代わりとして、変調器１６４は、図４−７にあるように、時間ドメインで表現されたホワイトノイズ１５６を変調することができる。

[0142]方法８００はまた、８０８で、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することを含む。例えば、図１の出力回路１６６は、図１を参照して説明されたように、変調されたホワイトノイズ１８４に基づいて高帯域励起信号１８６を生成することができる。

[0143]したがって、図８の方法８００は、入力信号の制御された量の包絡に基づく高帯域励起信号の生成を可能にし得、ここで包絡の量は、発声分類に基づいて制御される。

[0144]特定の実施形態では、図８の方法８００は、中央処理ユニット（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、もしくはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）等）を介して、ファームウェアデバイスを介して、またはそれらのあらゆる組み合わせを介して実装されうる。例として、図８の方法８００は、図９に関連して説明されるように、命令を実行するプロセッサによって実行されうる。

[0145]図１−８の実施形態は、低帯域信号に基づいて高帯域励起信号を生成することを説明しているけれども、他の実施形態では、入力信号１３０が、複数の帯域信号を作り出すためにフィルタリングされうる。例えば、複数の帯域信号は、より低い帯域信号、中間帯域信号、より高い帯域信号、１つ以上の追加の帯域信号、またはそれらの組み合わせを含むことができる。中間帯域信号は、より低い帯域信号よりもより高い周波数に対応し得、より高い帯域信号は、中間帯域信号よりも高い周波数範囲に対応しうる。より低い帯域信号および中間帯域信号は、重複する、または重複しない周波数範囲に対応しうる。中間帯域信号およびより高い帯域信号は、重複する、または重複しない周波数範囲に対応しうる。

[0146]励起信号生成モジュール１２２は、第２の帯域信号（例えば、中間帯域信号またはより高い帯域信号）に対応する励起信号を生成するために、第１の帯域信号（例えば、より低い帯域信号または中間帯域信号）を使用することができ、ここで第１の帯域信号は第２の帯域信号より低い周波数範囲に対応する。

[0147]特定の実施形態では、励起信号生成モジュール１２２は、複数の帯域信号に対応する複数の励起信号を生成するために第１の帯域信号を使用することができる。例えば、励起信号生成モジュール１２２は、中間帯域信号に対応する中間帯域信号、より高い帯域信号に対応するより高い帯域励起信号、１つ以上の追加の帯域励起信号、またはそれらの組み合わせを生成するためにより低い帯域信号を使用することができる。

[0148]図９を参照すると、デバイス（例えば、ワイヤレス通信デバイス）の特定の例示的な実施形態のブロック図が描写され、概して９００と指定されている。様々な実施形態では、デバイス９００は、図９で例示されているものよりも少ないか、またはより多いコンポーネントを有することができる。例示的な実施形態では、デバイス９００は、図１のモバイルデバイス１０４またはデバイス１０２に対応しうる。例示的な実施形態では、デバイス９００は、図４−８の方法４００−８００のうちの１つ以上にしたがって動作しうる。

[0149]特定の実施形態では、デバイス９００は、プロセッサ９０６（例えば、中央処理ユニット（ＣＰＵ））を含む。デバイス９００は、１つ以上の追加のプロセッサ９１０（例えば、１つ以上のデジタルシグナルプロセッサ（ＤＰＳ））を含むことができる。プロセッサ９１０は、発話および音楽コーダ−デコーダ（ＣＯＤＥＣ）９０８、およびエコーキャンセラ９１２を含むことができる。発話および音楽ＣＯＤＥＣ９０８は、図１の励起信号生成モジュール１２２、図２の励起信号生成器２２２、発声ファクタ生成器２０８、ボコーダエンコーダ９３６、ボコーダデコーダ９３８、またはその両方を含むことができる。特定の実施形態では、ボコーダエンコーダ９３６は、図１の高帯域エンコーダ１７２、図３の低帯域エンコーダ３０４、またはその両方を含むことができる。特定の実施形態では、ボコーダデコーダ９３８は、図１の高帯域合成器１６８、図２の低帯域合成器２０４、またはその両方を含むことができる。

[0150]例示されているように、励起信号生成モジュール１２２、発声ファクタ生成器２０８、および励起信号生成器２２２は、ボコーダエンコーダ９３６およびボコーダデコーダ９３８によってアクセス可能である、共有されるコンポーネントでありうる。他の実施形態では、励起信号生成モジュール１２２、発声ファクタ生成器２０８、および／または励起信号生成器２２２のうちの１つ以上は、ボコーダエンコーダ９３６およびボコーダデコーダ９３８に含まれうる。

[0151]発話および音楽コデック９０８は、プロセッサ９１０のコンポーネント（例えば、専用回路および／または実行可能なプログラミングコード）として例示されているけれども、他の実施形態では、励起信号生成モジュール１２２のような、発話および音楽コデック９０８のうちの１つ以上のコンポーネントは、プロセッサ９０６、ＣＯＤＥＣ９３４、別の処理コンポーネント、またはそれらの組み合わせに含まれうる。

[0152]デバイス９００は、メモリ９３２およびＣＯＤＥＣ９３４を含むことができる。デバイス９００は、トランシーバ９５０を介してアンテナ９４２に結合されたワイヤレスコントローラ９４０を含むことができる。デバイス９００は、ディスプレイコントローラ９２６に結合されたディスプレイ９２８を含むことができる。スピーカ９４８、マイクロフォン９４６、またはその両方は、ＣＯＤＥＣ９３４に結合されうる。特定の実施形態では、スピーカ９４８は、図１のスピーカ１４２に対応しうる。特定の実施形態では、マイクロフォン９４６は、図１のマイクロフォン１４６に対応しうる。ＣＯＤＥＣ９３４は、デジタルアナログコンバータ（ＤＡＣ）９０２およびアナログデジタルコンバータ（ＡＤＣ）９０４を含むことができる。

[0153]特定の実施形態では、ＣＯＤＥＣ９３４は、マイクロフォン９４６からアナログ信号を受信し、アナログデジタルコンバータ９０４を使用してアナログ信号をデジタル信号にコンバートし、例えばパルスコード変調（ＰＣＭ）フォーマットで、発話および音楽コデック９０８にデジタル信号を提供することができる。発話および音楽コデック９０８は、デジタル信号を処理することができる。特定の実施形態では、発話および音楽コデック９０８は、ＣＯＤＥＣ９３４にデジタル信号を提供することができる。ＣＯＤＥＣ９３４は、デジタルアナログコンバータ９０２を使用してデジタル信号をアナログ信号にコンバートすることができ、スピーカ９４８にアナログ信号を提供することができる。

[0154]メモリ９３２は、図４−８の方法４００−８００のうちの１つ以上のような、本明細書で開示されている方法およびプロセスを実行するために、プロセッサ９０６、プロセッサ９１０、ＣＯＤＥＣ９３４、デバイス９００の別の処理ユニット、またはそれらの組み合わせによって実行可能な命令９５６を含むことができる。

[0155]システム１００−３００の１つ以上のコンポーネントは、１つ以上のタスク、またはそれらの組み合わせを実行するための命令を実行するプロセッサによって、専用ハードウェア（例えば、電気回路）を介して実装されうる。例として、メモリ９３２、またはプロセッサ９０６、プロセッサ９１０、および／もしくはＣＯＤＥＣ９３４のうちの１つ以上のコンポーネントは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ：spin-torque transfer MRAM）、フラッシュメモリ、読み取り専用メモリ（ＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、のようなメモリデバイスでありうる。メモリデバイスは、コンピュータ（例えば、ＣＯＤＥＣ９３４におけるプロセッサ、プロセッサ９０６、および／またはプロセッサ９１０）によって実行されるとき、コンピュータに図４−８の方法４００−８００の１つ以上の少なくとも一部を実行させることができる命令（例えば、命令９５６）を含むことができる。例として、メモリ９３２、またはプロセッサ９０６、プロセッサ９１０、ＣＯＤＥＣ９３４のうちの１つ以上のコンポーネントは、コンピュータ（例えば、ＣＯＤＥＣ９３４におけるプロセッサ、プロセッサ９０６、および／またはプロセッサ９１０）によって実行されるとき、コンピュータに図４−８の方法４００−８００のうちの１つ以上の少なくとも一部を実行させることができる命令（例えば、命令９５６）を含む非一時的なコンピュータ可読媒体でありうる。

[0156]特定の実施形態では、デバイス９００は、システムインパッケージまたはシステムオンチップデバイス（例えば、モバイル局モデム（ＭＳＭ））９２２に含まれうる。特定の実施形態では、プロセッサ９０６、プロセッサ９１０、ディスプレイコントローラ９２６、メモリ９３２、ＣＯＤＥＣ９３４、ワイヤレスコントローラ９４０、およびトランシーバ９５０が、システムインパッケージまたはシステムオンチップデバイス９２２に含まれる。特定の実施形態では、タッチスクリーンおよび／またはキーパッドのような入力デバイス９３０、ならびに電源９４４が、システムオンチップデバイス９２２に結合されている。さらに、特定の実施形態では、図９で例示されるように、ディスプレイ９２８、入力デバイス９３０、スピーカ９４８、マイクロフォン９４６、アンテナ９４２、および電源９４４は、システムオンチップデバイス９２２の外部にある。しかしながら、ディスプレイ９２８、入力デバイス９３０、スピーカ９４８、マイクロフォン９４６、アンテナ９４２、および電源９４４の各々は、インタフェースまたはコントローラのようなシステムオンチップデバイス９２２のコンポーネントに結合されることができる。

[0157]デバイス９００は、モバイル通信デバイス、スマートフォン、セルラ電話、ラップトップ、コンピュータ、タブレット、パーソナルデジタルアシスタント、ディスプレイデバイス、テレビジョン、ゲーム機、音楽プレイヤ、ラジオ、デジタルビデオプレイヤ、デジタルビデオディスク（ＤＶＤ）プレイヤ、チューナ、カメラ、ナビゲーションデバイス、デコーダシステム、エンコーダシステム、またはそれらのあらゆる組み合わせも含むことができる。

[0158]例示的な実施形態では、プロセッサ９１０は、図１−８を参照して説明されている方法または動作のすべてまたは一部を実行するように実行可能でありうる。例えば、マイクロフォン９４６は、オーディオ信号（例えば、図１の入力信号１３０）を捕捉することができる。ＡＤＣ９０４は、捕捉されたオーディオ信号を、アナログ波形からデジタルオーディオサンプルから成るデジタル波形にコンバートすることができる。プロセッサ９１０は、デジタルオーディオサンプルを処理することができる。利得調整器は、デジタルオーディオサンプルを調整することができる。エコーキャンセラ９１２は、スピーカ９４８の出力がマイクロフォン９４６に入ることによって生み出されただろうエコーを低減することができる。

[0159]ボコーダエンコーダ９３６は、処理された発話信号に対応するデジタルオーディオサンプルを圧縮し得、送信パケット（例えば、デジタルオーディオサンプルの圧縮されたビットの表現）を形成することができる。例えば、送信パケットは、図１のビットストリーム１３２の少なくとも一部に対応しうる。送信パケットは、メモリ９３２に記憶されうる。トランシーバ９５０は、送信パケットのいくらかの形態を変調することができ（例えば、他の情報は送信パケットに付与され得）、アンテナ９４２を介してその変調されたデータを送信することができる。

[0160]さらなる例として、アンテナ９４２は、受信パケットを含む、入ってくるパケットを受信することができる。受信パケットは、ネットワークを介して別のデバイスによって送られうる。例えば、受信パケットは、図１のビットストリーム１３２の少なくとも一部に対応しうる。ボコーダデコーダ９３８は、受信パケットを解凍することができる。解凍された波形は、再構築されたオーディオサンプルと称されうる。エコーキャンセラ９１２は、再構築されたオーディオサンプルからエコーを除去することができる。

[0161]発話および音楽コデック９０８を実行するプロセッサ９１０は、図１−８を参照して説明されたように高帯域励起信号１８６を生成することができる。プロセッサ９１０は、高帯域励起信号１８６に基づいて、図１の出力信号１１６を生成することができる。利得調整器は、出力信号１１６を増幅または抑制することができる。ＤＡＣ９０２は、出力信号１１６を、デジタル波形からアナログ波形にコンバートすることができ、スピーカ９４８にそのコンバートされた信号を提供することができる。

[0162]説明されている実施形態と関係して、入力信号の発声分類を決定するための手段を含む装置が開示されている。入力信号は、オーディオ信号に対応しうる。例えば、発声分類を決定するための手段は、図１の発声分類器１６０、入力信号の発声分類を決定するように構成された１つ以上のデバイス（例えば、非一時的なコンピュータ可読記憶媒体で命令を実行するプロセッサ）、またはそれらのあらゆる組み合わせも含むことができる。

[0163]例えば、発声分類器１６０は、入力信号１３０の低帯域信号のゼロ交差率、第１の反射係数、低帯域励起における適応コードブック寄与のエネルギー対低帯域励起における適応コードブックおよび固定コードブック寄与の合計のエネルギーの比率、入力信号１３０の低帯域信号のピッチ利得、またはそれらの組み合わせを含むパラメータ２４２を決定することができる。特定の実施形態では、発声分類器１６０は、図３の低帯域信号３３４に基づいて、パラメータ２４２を決定することができる。代わりの実施形態では、発声分類器１６０は、図２のビットストリーム２３２の低帯域部分からパラメータ２４２を抽出することができる。

[0164]発声分類器１６０は、数式に基づいて、発声分類１８０（例えば、発声ファクタ２３６）を決定することができる。例えば、発声分類器１６０は、数式１およびパラメータ２４２に基づいて、発声分類１８０を決定することができる。例示するために、発声分類器１６０は、図４を参照して説明されたように、ゼロ交差率、第１の反射係数、エネルギーの比率、ピッチ利得、前の発声決定、一定値、またはそれらの組み合わせ、の重み付けされた合計を計算することによって発声分類１８０を決定することができる。

[0165]装置はまた、発声分類に基づいて、入力信号の表現の包絡の量を制御するための手段を含む。例えば、包絡の量を制御するための手段は、図１の発声調整器１６２、発声分類に基づいて入力信号の表現の包絡の量を制御するように構成された１つ以上のデバイス（例えば、非一時的なコンピュータ可読記憶媒体で命令を実行するプロセッサ）、またはそれらのあらゆる組み合わせも含むことができる。

[0166]例えば、包絡調整器１６２は、図１の発声分類１８０（例えば、図２の発声ファクタ２３６）にカットオフ周波数スケーリングファクタを乗算することによって周波数発声分類を生成することができる。カットオフ周波数スケーリングファクタはデフォルト値でありうる。ＬＰＦカットオフ周波数４２６は、デフォルトのカットオフ周波数に対応しうる。包絡調整器１６２は、図４を参照して説明されたように、ＬＰＦカットオフ周波数４２６を調整することによって、信号包絡１８２の量を制御することができる。例えば、包絡調整器１６２は、ＬＰＦカットオフ周波数４２６に周波数発声分類を加算することによってＬＰＦカットオフ周波数４２６を調整することができる。

[0167]別の例として、包絡調整器１６２は、図１の発声分類１８０（例えば、図２の発声ファクタ２３６）に帯域幅スケーリングファクタを乗算することによって帯域幅拡張ファクタ５２６を生成することができる。包絡調整器１６２は、標本信号４２２に関連付けられた高帯域ＬＰＣ極点を決定することができる。包絡調整器１６２は、帯域幅拡張ファクタ５２６に極点スケーリングファクタを乗算することによって極点調整ファクタを決定することができる。極点スケーリングファクタはデフォルト値でありうる。包絡調整器１６２は、図５を参照して説明されたように、高帯域ＬＰＣ極点を調整することによって、信号包絡１８２の量を制御することができる。例えば、包絡調整器１６２は、極点調整ファクタによって原点（origin）に向けて高帯域ＬＰＣ極点を調整することができる。

[0168]さらなる例として、包絡調整器１６２は、フィルタの係数を決定することができる。フィルタの係数はデフォルト値でありうる。包絡調整器１６２は、帯域幅拡張ファクタ５２６にフィルタスケーリングファクタを乗算することによってフィルタ調整ファクタを決定することができる。フィルタスケーリングファクタはデフォルト値でありうる。包絡調整器１６２は、図６を参照して説明されたように、フィルタの係数を調整することによって、信号包絡１８２の量を制御することができる。例えば、包絡調整器１６２は、フィルタ調整ファクタをフィルタの係数の各々に乗算することができる。

[0169]装置はさらに、制御された量の包絡に基づいて、ホワイトノイズ信号を変調するための手段を含む。例えば、ホワイトノイズ信号を変調するための手段は、図１の変調器１６４、制御された量の包絡に基づいてホワイトノイズ信号を変調するように構成された１つ以上のデバイス（例えば、非一時的なコンピュータ可読記憶媒体で命令を実行するプロセッサ）、またはそれらのあらゆる組み合わせも含むことができる。例えば、変調器１６４は、ホワイトノイズ１５６および信号包絡１８２が同じドメインにあるかどうかを決定することができる。ホワイトノイズ１５６が信号包絡１８２とは異なるドメインにある場合、変調器１６４は、ホワイトノイズ１５６を、信号包絡１８２と同じドメインにあることになるようにコンバートすることができるか、または信号包絡１８２を、ホワイトノイズ１５６と同じドメインにあることになるようにコンバートすることができる。変調器１６４は、図４を参照して説明されたように、信号包絡１８２に基づいて、ホワイトノイズ１５６を変調することができる。例えば、変調器１６４は、時間ドメインにおいてホワイトノイズ１５６と信号包絡１８２とを乗算することができる。別の例として、変調器１６４は、周波数ドメインにおいてホワイトノイズ１５６と信号包絡１８２とを畳み込むことができる。

[0170]装置はまた、変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するための手段を含む。例えば、高帯域励起信号を生成するための手段は、図１の出力回路１６６、変調されたホワイトノイズ信号に基づいて高帯域励起信号を生成するように構成された１つ以上のデバイス（例えば、非一時的なコンピュータ可読記憶媒体で命令を実行するプロセッサ）、またはそれらのあらゆる組み合わせも含むことができる。

[0171]特定の実施形態では、出力回路１６６は、図４−７を参照して説明されたように、変調されたホワイトノイズ１８４に基づいて高帯域励起信号１８６を生成することができる。例えば、出力回路１６６は、図４−６を参照して説明されたように、スケーリングされた変調されたホワイトノイズ４３８を生成するために、変調されたホワイトノイズ１８４とノイズ利得４３４とを乗算することができる。出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされた変調されたホワイトノイズ４３８と別の信号（例えば、図４のスケーリングされた標本信号４４０、図５のスケーリングされたフィルタリングされた信号５４０、または図６のスケーリングされた合成された高帯域信号６４０）を組み合わせることができる。

[0172]別の例として、出力回路１６６は、図７を参照して説明されたように、スケーリングされた変調されたホワイトノイズ７４０を生成するために、変調されたホワイトノイズ１８４と図７の変調されたノイズ利得７３２とを乗算することができる。出力回路１６６は、スケーリングされたホワイトノイズ７４４を生成するために、スケーリングされた変調されたホワイトノイズ７４０とスケーリングされた変調されていないホワイトノイズ７４２とを組み合わせる（例えば、加算する）ことができる。出力回路１６６は、高帯域励起信号１８６を生成するために、スケーリングされた標本信号４４０とスケーリングされたホワイトノイズ７４４と組み合わせることができる。

[0173]当業者は、本明細書で開示されている実施形態に関係して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、ハードウェアプロセッサのような処理デバイスによって実行されるコンピュータソフトウェア、またはその両方の組み合わせとして実装されうることをさらに認識するであろう。様々な例示的なコンポーネント、ブロック、構成、モジュール、回路、およびステップは、概してそれらの機能の観点から上で説明されてきた。このような機能が、ハードウェアとして実装されるか、または実行可能なソフトウェアとして実装されるかは、特定のアプリケーションおよびシステム全体に課せられる設計制約に依存する。当業者は、各々の特定のアプリケーションに関して多様な方法で説明された機能を実装することができるが、このような実装の決定が、本開示の範囲からの逸脱を引き起すと解釈されるべきでない。

[0174]本明細書で開示されている実施形態に関係して説明された方法またはアルゴリズムのステップは、直接ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこれら２つの組み合わせにおいて、具現化されうる。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読み取り専用メモリ（ＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）のようなメモリデバイスに存在しうる。実例的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、およびメモリデバイスに情報を書き込むことができるように、プロセッサに結合される。代わりとして、メモリデバイスは、プロセッサと一体化されうる。プロセッサおよび記憶媒体は、特定用途向け集積回路（ＡＳＩＣ）に存在しうる。ＡＳＩＣは、計算デバイスまたはユーザ端末に存在しうる。代わりとして、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末にディスクリートコンポーネントとして存在しうる。

[0175]開示されている実施形態の先の説明は、当業者が開示されている実施形態を製造または使用すること可能にするために提供されている。これらの実施形態への様々な修正は、当業者には容易に明らかになり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用されうる。したがって、本開示は、本明細書で図示されている実施形態に限定されるようには意図されておらず、下記の特許請求の範囲によって定義されるような原理および新規の特徴と一致する最大可能範囲を与えられることとする。

[0175]開示されている実施形態の先の説明は、当業者が開示されている実施形態を製造または使用すること可能にするために提供されている。これらの実施形態への様々な修正は、当業者には容易に明らかになり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用されうる。したがって、本開示は、本明細書で図示されている実施形態に限定されるようには意図されておらず、下記の特許請求の範囲によって定義されるような原理および新規の特徴と一致する最大可能範囲を与えられることとする。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
デバイスで、入力信号の発声分類を決定することと、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御することと、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調することと、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することと、
を備える、方法。
［Ｃ２］
前記包絡の前記量を制御することは、前記包絡の特性を制御することを含む、Ｃ１に記載の方法。
［Ｃ３］
前記包絡の前記特性は、前記包絡の形状、前記包絡の大きさ、前記包絡の利得、または前記包絡の周波数範囲のうちの少なくとも１つを含む、Ｃ２に記載の方法。
［Ｃ４］
前記包絡の前記形状のバリエーションの程度は、前記発声分類が強力な無声に対応するときよりも、前記発声分類が強力な有声に対応するときの方が、より大きい、Ｃ３に記載の方法。
［Ｃ５］
前記包絡の前記周波数範囲は、前記入力信号の前記表現に適用されたフィルタのカットオフ周波数に基づいて制御される、Ｃ３に記載の方法。
［Ｃ６］
前記発声分類に基づいて前記カットオフ周波数を決定することをさらに備える、Ｃ５に記載の方法。
［Ｃ７］
前記フィルタはローパスフィルタを含み、前記カットオフ周波数は、前記発声分類が強力な無声に対応するときよりも、前記発声分類が強力な有声に対応するときの方が、より大きい、Ｃ６に記載の方法。
［Ｃ８］
前記デバイスはデコーダまたはエンコーダである、Ｃ１に記載の方法。
［Ｃ９］
前記包絡は時間変動する包絡である、Ｃ１に記載の方法。
［Ｃ１０］
前記包絡は、前記入力信号のフレーム毎に１回よりも多い回数更新される、Ｃ９に記載の方法。
［Ｃ１１］
前記包絡は、包絡調整器が前記オーディオ信号の各サンプルを受信したことに応答して更新される、Ｃ９に記載の方法。
［Ｃ１２］
前記包絡は、変換ドメインにおいて前記入力信号の前記表現を調整することによって調整される、Ｃ１に記載の方法。
［Ｃ１３］
前記入力信号の前記表現は、前記オーディオ信号の符号化されたバージョンの低帯域励起信号、または前記オーディオ信号の前記符号化されたバージョンの高帯域励起信号を含む、Ｃ１に記載の方法。
［Ｃ１４］
前記入力信号の前記表現は、ハーモニカルに拡張された励起信号を含み、前記ハーモニカルに拡張された励起信号は前記オーディオ信号の符号化されたバージョンの低帯域励起信号から生成される、Ｃ１に記載の方法。
［Ｃ１５］
変調されていないホワイトノイズ信号の第１の比率を前記変調されたホワイトノイズ信号の第２の比率を組み合わせることによってスケーリングされたホワイトノイズ信号を生成することをさらに備え、前記第１の比率および前記第２の比率は、前記発声分類に基づいて決定され、前記高帯域励起信号は前記スケーリングされたホワイトノイズ信号に基づく、Ｃ１に記載の方法。
［Ｃ１６］
入力信号の発声分類を決定するように構成された発声分類器と、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御するように構成された包絡調整器と、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調するように構成された変調器と、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するように構成された出力回路と、
を備える、装置。
［Ｃ１７］
前記包絡調整器は、前記発声分類に基づいて前記包絡の特性を制御するように構成され、前記包絡の前記特性は、前記包絡の形状、前記包絡の大きさ、前記包絡の利得、および前記包絡の周波数範囲のうちの少なくとも１つを含む、Ｃ１６に記載の装置。
［Ｃ１８］
前記包絡の前記形状、前記包絡の前記大きさ、および前記包絡の前記利得のうちの少なくとも１つは、前記発声分類に基づいて線形予測コーディング（ＬＰＣ）係数の１つ以上の極点を調節することによって制御される、Ｃ１７に記載の装置。
［Ｃ１９］
前記包絡の前記形状、前記包絡の前記大きさ、および前記包絡の前記利得のうちの少なくとも１つは、前記発声分類に基づいてフィルタの係数を調整することによって制御され、前記フィルタは、前記変調されたホワイトノイズ信号を生成するために前記ホワイトノイズ信号に前記変調器によって適用される、Ｃ１７に記載の装置。
［Ｃ２０］
前記入力信号の前記表現は、前記入力信号の低帯域励起信号を含む、Ｃ１６に記載の装置。
［Ｃ２１］
前記入力信号の前記表現は、前記入力信号の高帯域励起信号を含む、Ｃ１６に記載の装置。
［Ｃ２２］
前記入力信号の前記表現は、ハーモニカルに拡張された励起信号を含む、Ｃ１６に記載の装置。
［Ｃ２３］
前記ハーモニカルに拡張された励起信号は、前記入力信号の低帯域励起信号から生成される、Ｃ２２に記載の装置。
［Ｃ２４］
前記高帯域励起信号に基づいて、オーディオ信号の高帯域部分を符号化するように構成された高帯域エンコーダと、
別のデバイスに符号化されたオーディオ信号を送信するように構成された送信機と、ここにおいて前記符号化されたオーディオ信号は前記オーディオ信号の符号化されたバージョンである、
をさらに備える、Ｃ１６に記載の装置。
［Ｃ２５］
命令を記憶するコンピュータ可読記憶デバイスであって、前記命令が少なくとも１つのプロセッサによって実行されるとき、前記少なくとも１つのプロセッサに、
入力信号の発声分類を決定することと、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御することと、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調することと、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することと、
行わせる、コンピュータ可読記憶デバイス。
［Ｃ２６］
前記包絡の前記量を制御することは、前記発声分類に基づいて前記包絡の特性を制御することを含む、Ｃ２５に記載のコンピュータ可読記憶デバイス。
［Ｃ２７］
前記包絡の特性は、前記包絡の周波数範囲を含み、前記包絡の前記周波数範囲は、前記入力信号の前記表現に適用されたフィルタのカットオフ周波数に基づいて制御される、Ｃ２６に記載のコンピュータ可読記憶デバイス。
［Ｃ２８］
入力信号の発声分類を決定するための手段と、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御するための手段と、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調するための手段と、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するための手段と、
を備える、装置。
［Ｃ２９］
前記入力信号の表現は、前記入力信号の低帯域励起信号、前記入力信号の高帯域励起信号、またはハーモニカルに拡張された励起信号を含み、前記ハーモニカルに拡張された励起信号は、前記入力信号の前記低帯域励起信号から生成される、Ｃ２８に記載の装置。
［Ｃ３０］
前記決定するための手段、前記制御するための手段、前記変調するための手段、および前記生成するための手段は、モバイル通信デバイス、スマートフォン、セルラ電話、ラップトップコンピュータ、コンピュータ、タブレット、パーソナルデジタルアシスタント、ディスプレイデバイス、テレビジョン、ゲーム機、音楽プレイヤ、ラジオ、デジタルビデオプレイヤ、デジタルビデオディスク（ＤＶＤ）プレイヤ、チューナ、カメラ、ナビゲーションデバイス、コーダ、およびデコーダ、のうちの１つに統合される、Ｃ２８に記載の装置。

Claims

デバイスで、入力信号の発声分類を決定することと、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御することと、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調することと、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することと、
を備える、方法。
前記包絡の前記量を制御することは、前記包絡の特性を制御することを含む、請求項１に記載の方法。
前記包絡の前記特性は、前記包絡の形状、前記包絡の大きさ、前記包絡の利得、または前記包絡の周波数範囲のうちの少なくとも１つを含む、請求項２に記載の方法。
前記包絡の前記形状のバリエーションの程度は、前記発声分類が強力な無声に対応するときよりも、前記発声分類が強力な有声に対応するときの方が、より大きい、請求項３に記載の方法。
前記包絡の前記周波数範囲は、前記入力信号の前記表現に適用されたフィルタのカットオフ周波数に基づいて制御される、請求項３に記載の方法。
前記発声分類に基づいて前記カットオフ周波数を決定することをさらに備える、請求項５に記載の方法。
前記フィルタはローパスフィルタを含み、前記カットオフ周波数は、前記発声分類が強力な無声に対応するときよりも、前記発声分類が強力な有声に対応するときの方が、より大きい、請求項６に記載の方法。
前記デバイスはデコーダまたはエンコーダである、請求項１に記載の方法。
前記包絡は時間変動する包絡である、請求項１に記載の方法。
前記包絡は、前記入力信号のフレーム毎に１回よりも多い回数更新される、請求項９に記載の方法。
前記包絡は、包絡調整器が前記オーディオ信号の各サンプルを受信したことに応答して更新される、請求項９に記載の方法。
前記包絡は、変換ドメインにおいて前記入力信号の前記表現を調整することによって調整される、請求項１に記載の方法。
前記入力信号の前記表現は、前記オーディオ信号の符号化されたバージョンの低帯域励起信号、または前記オーディオ信号の前記符号化されたバージョンの高帯域励起信号を含む、請求項１に記載の方法。
前記入力信号の前記表現は、ハーモニカルに拡張された励起信号を含み、前記ハーモニカルに拡張された励起信号は前記オーディオ信号の符号化されたバージョンの低帯域励起信号から生成される、請求項１に記載の方法。
変調されていないホワイトノイズ信号の第１の比率を前記変調されたホワイトノイズ信号の第２の比率を組み合わせることによってスケーリングされたホワイトノイズ信号を生成することをさらに備え、前記第１の比率および前記第２の比率は、前記発声分類に基づいて決定され、前記高帯域励起信号は前記スケーリングされたホワイトノイズ信号に基づく、請求項１に記載の方法。
入力信号の発声分類を決定するように構成された発声分類器と、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御するように構成された包絡調整器と、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調するように構成された変調器と、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するように構成された出力回路と、
を備える、装置。
前記包絡調整器は、前記発声分類に基づいて前記包絡の特性を制御するように構成され、前記包絡の前記特性は、前記包絡の形状、前記包絡の大きさ、前記包絡の利得、および前記包絡の周波数範囲のうちの少なくとも１つを含む、請求項１６に記載の装置。
前記包絡の前記形状、前記包絡の前記大きさ、および前記包絡の前記利得のうちの少なくとも１つは、前記発声分類に基づいて線形予測コーディング（ＬＰＣ）係数の１つ以上の極点を調節することによって制御される、請求項１７に記載の装置。
前記包絡の前記形状、前記包絡の前記大きさ、および前記包絡の前記利得のうちの少なくとも１つは、前記発声分類に基づいてフィルタの係数を調整することによって制御され、前記フィルタは、前記変調されたホワイトノイズ信号を生成するために前記ホワイトノイズ信号に前記変調器によって適用される、請求項１７に記載の装置。
前記入力信号の前記表現は、前記入力信号の低帯域励起信号を含む、請求項１６に記載の装置。
前記入力信号の前記表現は、前記入力信号の高帯域励起信号を含む、請求項１６に記載の装置。
前記入力信号の前記表現は、ハーモニカルに拡張された励起信号を含む、請求項１６に記載の装置。
前記ハーモニカルに拡張された励起信号は、前記入力信号の低帯域励起信号から生成される、請求項２２に記載の装置。
前記高帯域励起信号に基づいて、オーディオ信号の高帯域部分を符号化するように構成された高帯域エンコーダと、
別のデバイスに符号化されたオーディオ信号を送信するように構成された送信機と、ここにおいて前記符号化されたオーディオ信号は前記オーディオ信号の符号化されたバージョンである、
をさらに備える、請求項１６に記載の装置。
命令を記憶するコンピュータ可読記憶デバイスであって、前記命令が少なくとも１つのプロセッサによって実行されるとき、前記少なくとも１つのプロセッサに、
入力信号の発声分類を決定することと、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御することと、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調することと、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成することと、
行わせる、コンピュータ可読記憶デバイス。
前記包絡の前記量を制御することは、前記発声分類に基づいて前記包絡の特性を制御することを含む、請求項２５に記載のコンピュータ可読記憶デバイス。
前記包絡の特性は、前記包絡の周波数範囲を含み、前記包絡の前記周波数範囲は、前記入力信号の前記表現に適用されたフィルタのカットオフ周波数に基づいて制御される、請求項２６に記載のコンピュータ可読記憶デバイス。
入力信号の発声分類を決定するための手段と、ここにおいて前記入力信号はオーディオ信号に対応する、
前記発声分類に基づいて、前記入力信号の表現の包絡の量を制御するための手段と、
前記制御された量の前記包絡に基づいて、ホワイトノイズ信号を変調するための手段と、
前記変調されたホワイトノイズ信号に基づいて、高帯域励起信号を生成するための手段と、
を備える、装置。
前記入力信号の表現は、前記入力信号の低帯域励起信号、前記入力信号の高帯域励起信号、またはハーモニカルに拡張された励起信号を含み、前記ハーモニカルに拡張された励起信号は、前記入力信号の前記低帯域励起信号から生成される、請求項２８に記載の装置。
前記決定するための手段、前記制御するための手段、前記変調するための手段、および前記生成するための手段は、モバイル通信デバイス、スマートフォン、セルラ電話、ラップトップコンピュータ、コンピュータ、タブレット、パーソナルデジタルアシスタント、ディスプレイデバイス、テレビジョン、ゲーム機、音楽プレイヤ、ラジオ、デジタルビデオプレイヤ、デジタルビデオディスク（ＤＶＤ）プレイヤ、チューナ、カメラ、ナビゲーションデバイス、コーダ、およびデコーダ、のうちの１つに統合される、請求項２８に記載の装置。