JP2017503192A

JP2017503192A - 帯域幅拡張モード選択

Info

Publication number: JP2017503192A
Application number: JP2016538105A
Authority: JP
Inventors: ビレット、ステファン・ピエール; シンダー、ダニエル・ジェイ．
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-12-11
Filing date: 2014-12-05
Publication date: 2017-01-26
Also published as: CN105814629A; WO2015088919A1; US9293143B2; KR20160096119A; EP3080804A1; US20150162008A1

Abstract

デバイスは、抽出器、予測器、セレクタ、およびスイッチを含むデコーダを含む。抽出器は、受信された入力信号から第１の複数のパラメータを抽出するように構成される。入力信号は、符号化されたオーディオ信号に対応する。予測器は、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成される。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。セレクタは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む複数の高帯域モードから特定のモードを選択するように構成される。スイッチは、選択された特定のモードに基づいて、第１の複数のパラメータまたは第２の複数のパラメータを出力するように構成される。【選択図】図２

Description

優先権の主張

[0001] 本願は、２０１４年５月６日に出願された米国特許出願第１４／２７０９６３号、および２０１３年１２月１１日に出願された米国特許仮出願第６１／９１４８４５号の優先権を主張し、これらは両方とも、「BANDWIDTH EXTENSION MODE SELECTION」と題し、それらの内容は、それの全体が参照により組み込まれている。

[0002] 本開示は一般に、帯域幅拡張に関する。

[0003] 技術の進歩は、より小型でよりパワフルなコンピューティングデバイスをもたらした。例えば、小型で、軽量で、かつユーザによって容易に持ち運ばれるポータブルワイヤレス電話、携帯情報端末（ＰＤＡ）、およびページングデバイスのような、ワイヤレスコンピューティングデバイスを含む様々なポータブルパーソナルコンピューティングデバイスが現在存在している。より具体的には、セルラ電話およびインターネットプロトコル（ＩＰ）電話のようなポータブルワイヤレス電話は、ワイヤレスネットワークを通して音声およびデータパケットを通信することができる。さらに、多くのこのようなワイヤレス電話は、そこに組み込まれる他のタイプのデバイスを含む。例えば、ワイヤレス電話は、デジタルスチールカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤも含み得る。

[0004] デジタル技法による音声の送信は、特に、長距離のデジタル無線電話アプリケーションに広まっている。サンプリングおよびデジタル化することでスピーチが送信される場合、アナログ電話のスピーチ品質を達成するために、毎秒６４キロビット（ｋｂｐｓ）程度のデータレートが使用され得る。再構築されたスピーチの知覚品質を維持しつつ、チャネルを通して送られる情報量を低減するために、圧縮技法が使用され得る。コーディング、送信、および受信機での再合成によって後続されるスピーチ分析を使用して、データレートの大幅な低減が達成され得る。

[0005] スピーチを圧縮するためのデバイスは、電気通話の多くの分野に用途が見出され得る。例示的な分野はワイヤレス通信である。ワイヤレス通信の分野は、例えば、コードレス電話、ページング、ワイヤレスローカルループ、セルラおよびパーソナル通信サービス（ＰＣＴ）電話システムといったワイヤレス電話通話、モバイルインターネットプロトコル（ＩＰ）電話通話、および衛星通信システムを含む多くのアプリケーションを含む。特定のアプリケーションは、モバイル加入者のためのワイヤレス電話通話である。

[0006] 様々な無線経由（over-the-air）インターフェースが、例えば、周波数分割多元接続（ＦＤＭＡ）、時分割多元接続（ＴＤＭＡ）、符号分割多元接続（ＣＤＭＡ）、および時分割同期ＣＤＭＡ（ＴＤ−ＳＣＤＭＡ）を含むワイヤレス通信システムのために開発されてきた。それに関連して、例えば、先進移動電話サービス（ＡＭＰＳ）、モバイル通信のためのグローバルシステム（ＧＳＭ（登録商標））、および暫定規格９５（ＩＳ−９５）を含む様々な国内規格および国際規格が確立されてきた。例示的なワイヤレス電話通話通信システムは、符号分割多元接続（ＣＤＭＡ）システムである。ＩＳ−９５規格とその派生物、ＩＳ−９５Ａ、ＡＮＳＩＪ−ＳＴＤ−００８、およびＩＳ−９５Ｂ（本明細書では、総称してＩＳ−９５と呼ばれる）は、セルラまたはＰＣＳ電話通話通信システムに対するＣＤＭＡ無線経由インターフェースの使用を規定するための電気通話産業機構（ＴＩＡ）および他の周知の規格団体によって公表される。

[0007] その後、ＩＳ−９５規格は、より多くの容量と高速のパケットデータシステムを提供するｃｄｍａ２０００およびＷＣＤＭＡ（登録商標）のような「３Ｇ」システムへと発展した。ｃｄｍａ２０００の２つの変形例は、ＴＩＡによって発行されている文書ＩＳ−２０００（ｃｄｍａ２０００１ｘＲＴＴ）およびＩＳ−８５６（ｃｄｍａ２０００１ｘＥＶ−ＤＯ）によって提示されている。ｃｄｍａ２０００１ｘＲＴＴ通信システムが、１５３ｋｂｐｓのピークデータレートを提供するのに対して、ｃｄｍａ２０００１ｘＥＶ−ＤＯ通信システムは、３８．４ｋｂｐｓから２．４Ｍｂｐｓの範囲のデータレートのセットを定義する。ＷＣＤＭＡ規格は、第３世代パートナーシッププロジェクト「３ＧＰＰ（登録商標）」の文書番号３ＧＴＳ２５．２１１、３ＧＴＳ２５．２１２、３ＧＴＳ２５．２１３、および３ＧＴＳ２５．２１４において具現化されている。ＩＭＴアドバンスド（IMT-Advanced：International Mobile Telecommunications Advanced）規格は、「４Ｇ」規格について記載している。ＩＭＴアドバンスド規格は、４Ｇサービスに対するピークデータレートを、高いモビリティ通信（例えば、電車および車からの）については毎秒１００メガビット（Ｍビット／秒）に、低いモビリティ通信（例えば、歩行者および静止しているユーザからの）については毎秒１ギガビット（Ｇビット／秒）に設定する。

[0008] 人のスピーチ生成のモデルに関係のあるパラメータを抽出することでスピーチを圧縮するための技法を用いるデバイスは、スピーチコーダと呼ばれる。スピーチコーダは、エンコーダとデコーダとを備え得る。エンコーダは、着信スピーチ信号を、時間のブロック、すなわち分析フレームへと分割する。各セグメントの時間的な持続時間（すなわち「フレーム」）は、信号のスペクトルエンベロープが比較的静止状態のままであることが見込まれ得るのに十分に短くなるように選択され得る。特定のアプリケーションに適していると考えられる任意のフレーム長またはサンプレイングレートが使用され得るが、例えば、フレーム長は、２０ミリ秒であり得、これは、８キロヘルツ（ｋＨｚ）のサンプリングレートにおける１６０個のサンプルに対応する。

[0009] エンコーダは、着信スピーチフレームを分析して、ある特定の関連パラメータを抽出し、次に、そのパラメータをバイナリ表現へと、例えば、ビットのセットまたはバイナリデータパケットに量子化する。データパケットは、通信チャネル（すなわち、ワイヤードおよび／またはワイヤレスネットワーク接続）を通して、受信機およびデコーダに送信される。デコーダは、このデータパケットを処理し、処理されたデータパケットを逆量子化してパラメータを生成し、この逆量子化されたパラメータを使用してスピーチフレームを再合成する。

[0010] スピーチコーダの機能は、スピーチ固有の自然の冗長性を取り除くことで、デジタル化されたスピーチ信号を、低ビットレート信号へと圧縮することである。デジタル圧縮は、入力スピーチフレームをパラメータのセットで表現し、量子化を用いて、このパラメータをビットのセットで表現することで達成され得る。入力スピーチフレームが、ビット数Ｎ_ｉを有し、スピーチコーダによって生成されるデータパケットがビット数Ｎ_ｏを有する場合、スピーチコーダによって達成される圧縮率（compression factor）は、Ｃ_ｒ＝Ｎ_ｉ／Ｎ_ｏである。課題は、ターゲット圧縮率を達成しつつ、復号されたスピーチの高い音声品質を保持することである。スピーチコーダの性能は、（１）スピーチモデル、すなわち上述された分析と合成プロセスの組み合わせ、がいかにうまく機能するか、および（２）パラメータ量子化プロセスが、１フレームあたりＮｏビットというターゲットビットレートでいかにうまく行われるかに依存する。ゆえに、スピーチモデルの目標は、各フレームに対してパラメータの小さいセットを用いて、スピーチ信号の本質、すなわちターゲット音声品質、を捕えることである。

[0011] スピーチコーダは一般に、スピーチ信号を説明するためにパラメータ（ベクトルを含む）のセットを利用する。良いパラメータのセットは、理想的には、知覚的に正確なスピーチ信号の再構築のために低いシステム帯域幅を提供する。ピッチ、信号電力、スペクトルエンベロープ（または、フォルマント）、振幅、および位相スペクトルは、スピーチコーディングパラメータの例である。

[0012] スピーチコーダは、スピーチの小さいセグメント（例えば、５ミリ秒（ｍｓ）のサブフレーム）を同時に符号化するために高い時間分解能処理を用いることで、時間ドメインスピーチ波形をキャプチャするよう試みる時間ドメインコーダとして実装され得る。サブフレームごとに、コードブック空間からの高精度表現が探索アルゴリズムによって見つけられる。代替的に、スピーチコーダは、パラメータのセット（分析）を用いて、入力スピーチフレームの短期スピーチスペクトルをキャプチャし、スペクトルパラメータからスピーチ波形を再現するために対応する合成プロセスを用いるよう試みる周波数ドメインコーダとして実装され得る。パラメータ量子化器は、知られている量子化技法にしたがって、記憶されているコードベクトルの表現を用いてこれらパラメータを表現することでこれらを保つ（preserve）。

[0013] １つの時間ドメインスピーチコーダは、コード励起線形予想（ＣＥＬＰ）コーダである。ＣＥＬＰコーダでは、スピーチ信号における短期相関または冗長性が、線形予測（ＬＰ）分析によって取り除かれ、これは、短期フォルマントフィルタの係数を見つける。短期予測フィルタを着信スピーチフレームに適用することでＬＰ残差信号が生成され、これは、さらに、長期予測フィルタパラメータと後続の確率コードブックとを用いてモデルおよび量子化される。ゆえに、ＣＥＬＰコーディングは、時間ドメインスピーチ波形を符号化するタスクを、ＬＰ短期フィルタ係数を符号化することと、ＬＰ残差を符号化することという別個のタスクに分割する。時間ドメインコーディングは、固定のレートで（すなわち、各フレームに対して同じビット数Ｎ_ｏを使用して）、または可変レートで（この場合、異なるビットレートが、異なるタイプのフレームコンテンツに対して使用される）行われ得る。可変レートコーダは、ターゲット品質を取得するのに適したレベルにパラメータを符号化するのに必要なビット量を使用するよう試みる。

[0014] ＣＥＬＰコーダのような時間ドメインコーダは、時間ドメインスピーチ波形の正確性を保つために、１フレームあたり高いビット数Ｎ_０に依拠し得る。そのようなコーダは、１フレームあたりのビット数Ｎ_ｏが比較的大きい（例えば、８ｋｂｐｓ以上）という条件で、優れた音声品質を伝達し得る。低いビットレート（例えば、４ｋｂｐｓ以下）では、時間ドメインコーダは、利用可能なビットの限られた数により、高い品質およびロバストな性能を保持することができないだろう。低いビットレートでは、限られたコードブック空間は、時間ドメインコーダの波形整合機能をクリップし、これは、より高いレートの商用アプリケーションで展開される。それゆえ、低いビットレートで動作する多くのＣＥＬＰコーディングシステムは、ノイズと特徴付けられる、知覚的に顕著な歪みから損害を被る。

[0015] 低いビットレートにおけるＣＥＬＰコーダへの代替は、「Noise Excited Linear Predictive」（ＮＥＬＰ）コーダであり、これは、ＣＥＬＰコーダと同様の原理で動作する。ＮＥＬＰコーダは、コードブックというよりはむしろ、スピーチをモデルするために、フィルタリングされた擬似ランダムノイズ信号を使用する。ＮＥＬＰが、コーディングされたスピーチに対してよりシンプルなモデルを使用するため、ＮＥＬＰは、ＣＥＬＰよりも低いビットレートを達成する。ＮＥＬＰは、無声スピーチまたは沈黙（silence）を圧縮または表現するために使用され得る。

[0016] ２．４ｋｂｐｓ程度のレートで動作するコーディングシステムは一般に、事実上、パラメトリックである。すなわち、そのようなコーディングシステムは、規則的なインターバルで、スピーチ信号のピッチ周期およびスペクトルエンベロープ（または、フォルマント）を説明するパラメータを送信することで動作する。そのようなパラメトリックコーダの一例は、ＬＰボコーダである。

[0017] ＬＰボコーダは、１ピッチ周期あたり１パルスで、有声スピーチ信号をモデルする。この基本的な技法は、とりわけ、スペクトルエンベロープについての送信情報を含むように拡大され得る。ＬＰボコーダは一般に合理的な性能を提供するが、それらは、バスと特徴付けられる、知覚的に顕著な歪みをもたらし得る。

[0018] 過去数年、波形コーダおよびパラメトリックコーダのハイブリッドであるコーダが出現してきた。これらのハイブリッドコーダの一例は、プロトタイプ波形補間（ＰＷＩ）スピーチコーディングシステムである。ＰＷＩスピーチコーディングシステムは、プロトタイプピッチ周期（ＰＰＰ）スピーチコーダとしても知られ得る。ＰＷＩスピーチコーディングシステムは、有声スピーチをコーディングするための効率的な方法を提供する。ＰＷＩの基本的な概要は、代表的なピッチ周期（プロトタイプ波形）を、その記述を送信するために、および、プロトタイプ波形間を補間することでスピーチ信号を再構築するために、固定のインターバルで抽出することである。ＰＷＩ方法は、ＬＰ残差信号またはスピーチ信号の何れかに作用し得る。

[0019] 典型的な電話システム（例えば、公衆交換電話網（ＰＳＴＮ））では、信号帯域幅が、３００ヘルツ（Ｈｚ）から３．４キロヘルツ（ｋＨｚ）という周波数範囲に限られている。セルラ電話通話およびボイスオーバーインターネットプロトコル（ＶｏＩＰ）のような広帯域（ＷＢ）アプリケーションでは、信号帯域幅は、５０Ｈｚから７ｋＨｚの周波数範囲に及ぶ。超広帯域（ＳＷＢ）コーディング技法は、約１６ｋＨｚまで拡張する帯域幅をサポートする。信号帯域幅を、３．４ｋＨｚの狭帯域電話通話から１６ｋＨｚのＳＷＢ電話通話に拡張することは、了解度（intelligibility）、自然性および、信号再構築の品質を改善し得る。

[0020] ＳＷＢコーディング技法は典型的に、信号のより低い周波数部分（例えば、５０Ｈｚから７ｋＨｚ、「低帯域」とも呼ばれる）を符号化および送信することを伴う。例えば、低帯域は、フィルタパラメータおよび／または低帯域励起信号を使用して表され得る。しかしながら、コーディング効率を改善するために、信号のより高い周波数部分（例えば、７ｋＨｚから１６ｋＨｚ、「高帯域」とも呼ばれる）は、完全には符号化および送信されないだろう。受信デバイスは、高帯域を予測するために信号モデリングを利用し得る。いくつかの実装形態では、低帯域信号のプロパティは、この予測を支援するための高帯域パラメータ（例えば、利得情報、線スペクトル周波数（ＬＳＦ、線スペクトル対（ＬＳＰ）とも呼ばれる））を生成するために使用され得る。しかしながら、低帯域と高帯域との間のエネルギ格差(disparities)は、高帯域を不正確に特徴付ける予測された高帯域パラメータに帰着し得る。

[0021] 他の実装形態では、高帯域パラメータ情報は、低帯域で送信され得る。高帯域パラメータは、高帯域パラメータ情報から抽出され得る。これらの実装形態では、高帯域パラメータは、高帯域パラメータ情報が受信されない場合生成されず、これは、高帯域から低帯域への遷移に帰着するだろう。例えば、高帯域パラメータは、特定のオーディオ信号については受信され得、後続のオーディオ信号については受信されないだろう。特定の入力信号に関連付けられた高帯域オーディオは、生成され得、後続のオーディオ信号に関連付けられた高帯域オーディオは、生成されないだろう。特定のオーディオ信号に関連付けられた高帯域オーディオを含む特定の出力信号から、後続のオーディオ信号に関連付けられた後続の出力信号への遷移が存在し得る。後続の出力信号は、後続のオーディオ信号に関連付けられた低帯域を含み得、後続のオーディオ信号に関連付けられた高帯域は含まないだろう。高帯域オーディオを含む特定の出力信号から、高帯域オーディオを含まない後続の出力信号への遷移に関連付けられたオーディオ品質における知覚可能な低下があるだろう。

[0022] 帯域幅拡張技法の動的選択のためのシステムおよび方法が開示される。オーディオデコーダは、符号化されたオーディオ信号を受信し得る。符号化されたオーディオ信号のうちのいくつかは、高帯域の再構築を支援し得る高帯域パラメータを含み得る。他の符号化されたオーディオ信号は、高帯域パラメータを含まないか、または高帯域パラメータに関連付けられた送信エラーが存在するだろう。特定の実施形態では、オーディオデコーダは、高帯域パラメータが成功裏に受信されるとき、受信された高帯域パラメータを使用して高帯域を再構築し得る。高帯域パラメータがオーディオデコーダによって成功裏に受信されないとき、オーディオデコーダは、低帯域に基づいて予測を行うことで高帯域パラメータを生成し得、この予測された高帯域パラメータを使用して高帯域を再構築し得る。代替的な実施形態では、制御入力に基づいて、オーディオデコーダは、受信された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとを動的に切り替え得る。

[0023] 特定の実施形態では、デバイスはデコーダを含む。デコーダは、抽出器、予測器、セレクタ、およびスイッチを含む。抽出器は、受信された入力信号から第１の複数のパラメータを抽出するように構成される。入力信号は、符号化されたオーディオ信号に対応する。予測器は、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成される。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第２の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。セレクタは、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成される。複数の高帯域モードは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む。スイッチは、選択されたモードに基づいて、第１の複数のパラメータまたは第２の複数のパラメータを出力するように構成される。

[0024] 別の特定の実施形態では、方法は、デコーダにおいて、受信された入力信号から第１の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応する。方法はまた、デコーダにおいて、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うことを含む。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第２の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。方法はさらに、デコーダにおいて、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することを含む。複数の高帯域モードは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む。方法はさらに、特定のモードの選択に応答して、第１の複数のパラメータまたは第２の複数のパラメータをデコーダの出力ジェネレータに送ることを含む。

[0025] 別の特定の実施形態では、コンピュータ可読記憶デバイスは、プロセッサによって実行されると、プロセッサに動作を行わせる命令を記憶している。動作は、受信された入力信号から第１の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応する。動作はまた、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うことを含む。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第２の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。動作はさらに、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することを含む。複数の高帯域モードは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む。動作はまた、選択されたモードに基づいて、第１の複数のパラメータまたは第２の複数のパラメータを出力することを含む。

[0026] 開示される実施形態のうちの少なくとも１つによって提供される特定の利点は、抽出された高帯域パラメータを使用することと、予測された帯域パラメータを使用することとを動的に切り替えることを含む。例えば、オーディオデコーダは、予測された高帯域パラメータを使用することで、抽出された高帯域パラメータに関連付けられたエラーを隠蔽するか、またはその影響（effect）を低減し得る。例えば、ネットワークコンディションがオーディオ送信中悪化し得、これは、抽出された高帯域パラメータに関連付けられたエラーをもたらす。オーディオデコーダは、ネットワーク送信エラーの影響を低減するために、予測された高帯域パラメータを使用することに切り替わり得る。本開示の他の態様、利点、および特徴は、図面の簡単な説明、発明の詳細な説明、および特許請求の範囲を含む本願全体のレビュー後に明らかになるであろう。

[0027] 図１は、帯域幅拡張モード選択を行うように動作可能なシステムの特定の実施形態を例示する図である。 [0028] 図２は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0029] 図３は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0030] 図４は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0031] 図５は、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態を例示する図である。 [0032] 図６は、帯域幅拡張モード選択の方法の特定の実施形態を例示するフローチャートである。 [0033] 図７は、図１−６のシステムおよび方法にしたがって帯域幅拡張モード選択を行うように動作可能なデバイスのブロック図である。

発明の詳細な説明

[0034] 本明細書で説明される原理は、例えば、ヘッドセット、ハンドセット、または、スピーチ信号置換を行うように構成された他のオーディオデバイスに適用され得る。その文脈によって明示的に限定されない限り、「信号」という用語は、本明細書において、ワイヤ、バス、または他の送信媒体上に表されるようなメモリロケーション（または、メモリロケーションのセット）の状態を含む、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「生成する（generating）」という用語は、本明細書において、計算するまたはそれ以外の方法で生成する（producing）、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「算出する」という用語は、本明細書において、計算する、評価する、平滑化する、および／または複数の値から選択する、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「取得する」という用語は、算出する、導出する、受信する（例えば、別の構成要素、ブロック、またはデバイスから）、および／または取り出す（例えば、メモリレジスタまたは記憶要素のアレイから）、等の、それのあらゆる本来の意味を示すために使用される。

[0035] その文脈によって明示的に限定されない限り、「生成する（producing）」という用語は、算出する、生成する（generating）、および／または提供する、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「提供する」という用語は、算出する、生成する（generating）、および／または生成する（producing）、等の、それのあらゆる本来の意味を示すために使用される。その文脈によって明示的に限定されない限り、「結合される」という用語は、直接的なまたは間接的な電気的または物理的接続を示すために使用される。接続が間接的である場合、「結合」されている構造間に他のブロックまたは構成要素が存在し得ることは、当業者によってよく理解される。

[0036] 「構成」という用語は、それの特定の文脈によって示されているような、方法、装置／デバイス、および／またはシステムに関して使用され得る。本説明および特許請求の範囲において、「備える」という用語が使用されている場合、それは、他の要素または動作を除外しない。「〜に基づいて」という用語（「ＡはＢに基づく」にあるような）は、（ｉ）「少なくとも〜に基づく」（例えば、「Ａは少なくともＢに基づく」）、および、特定の文脈において適切な場合には（ｉｉ）「〜に等しい」（例えば、「ＡはＢに等しい」）というケースを含む、それのあらゆる本来の意味を示すために使用される。ＡがＢに基づく、が、少なくとも基づく、を含むケース（ｉ）では、これは、ＡがＢに結合されている構成を含み得る。同様に、「〜に応答して」という用語は、「少なくとも〜に応答して」を含む、それのあらゆる本来の意味を示すために使用される。「少なくとも１つ」という用語は、「１つまたは複数」を含む、それのあらゆる本来の意味を示すために使用される。「少なくとも２つ」という用語は、「２つ以上」を含む、それのあらゆる本来の意味を示すために使用される。

[0037] 「装置」および「デバイス」という用語は、特定の文脈によって別途示されていない限り、包括的にかつ交換可能に使用される。別途示されていない限り、特定の特徴を有する装置の動作のあらゆる開示はまた、類似する特徴を有する方法を開示するように明示的に意図されており（逆の場合も同じである）、特定の構成に係る装置の動作のあらゆる開示はまた、類似する構成に係る方法を開示するように明示的に意図されている（逆の場合も同じである）。「方法」、「プロセス」、「プロシージャ」、および、「技法」という用語は、特定の文脈によって別途示されていない限り、包括的にかつ交換可能に使用される。「要素」および「モジュール」という用語は、より大きな構成の一部を示すために使用され得る。文書の一部の参照による組み込みはいずれも、また、その一部の内で参照される変数または用語の定義を組み込むものと理解されるものとし、この場合、そのような定義は、この文書の他の箇所だけでなく、組み込まれた一部において参照されているあらゆる図面にも現れる。

[0038] 本明細書で使用される場合、「通信デバイス」という用語は、ワイヤレス通信ネットワークを通した音声および／またはデータ通信のために使用され得る電子デバイスを指す。通信デバイスの例には、セルラ電話、携帯情報端末（ＰＤＡ）、ハンドヘルドデバイス、ヘッドセット、ワイヤレスモデム、ラップトップコンピュータ、パーソナルコンピュータ、等が含まれる。

[0039] 図１を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの特定の実施形態が示されており、概して１００と指定されている。特定の実施形態では、システム１００は、復号システムまたは装置（例えば、ワイヤレス電話またはコーダ／デコーダ（ＣＯＤＥＣ））へと一体化され得る。他の実施形態では、システム１００は、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末（ＰＤＡ）、固定ロケーションデータユニット、またはコンピュータへと一体化され得る
[0040] 以下の説明では、図１のシステム１００によって行われる様々な機能が、ある特定の構成要素またはモジュールによって行われるものとして説明されることに留意されたい。しかしながら、構成要素およびモジュールのこの分担は、例示のためのものでしかない。代替的な実施形態では、特定の構成要素またはモジュールによって行われる機能は、複数の構成要素またはモジュールの間で分けられる。さらに、代替的な実施形態では、図１の２つ以上の構成要素またはモジュールは、単一の構成要素またはモジュールへと一体化され得る。図１に例示される各構成要素またはモジュールは、ハードウェア（例えば、フィールドプログラマブルゲートウェイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、コントローラ、等）、ソフトウェア（例えば、プロセッサによって実行可能な命令）、あるいはそれらの任意の組み合わせを使用して実装され得る。

[0041] 図１−７に描写される実例となる実施形態は、エンハンスド可変レートコーデック−狭帯域広帯域（ＥＶＲＣ−ＮＷ）で使用されるものに類似した高帯域モデルに関連して説明されるが、実例となる実施形態のうちの１つまたは複数は、任意の他の高帯域モデルを使用し得る。任意の特定のモデルの使用が例示のためにのみ説明されることは理解されるべきである。

[0042] システム１００は、ネットワーク１２０を介して、第２のデバイス１０６と通信状態にある第１のデバイス１０４を含む。第１のデバイス１０４は、マイクロフォン１４６に結合され得るか、またはそれと通信状態にあり得る。第１のデバイス１０４は、エンコーダ１１４を含み得る。第２のデバイス１０６は、スピーカ１４２に結合され得るか、またはそれと通信状態にあり得る。第２のデバイス１０６は、デコーダ１１６を含み得る。デコーダ１１６は、帯域幅拡張モジュール１１８を含み得る。

[0043] 動作中、第１のデバイス１０４は、オーディオ信号１３０（例えば、第１のユーザ１５２のユーザスピーチ信号）を受信し得る。例えば、第１のユーザ１５２は、第２のユーザ１５４との音声呼に従事し得る。音声呼のために、第１のユーザ１５２は、第１のデバイス１０４を使用し得、第２のユーザ１５４は、第２のデバイス１０６を使用し得る。音声呼中、第１のユーザ１５２は、第１のデバイス１０４に結合されたマイクロフォン１４６に向かって話し掛け得る。オーディオ信号１３０は、第１のユーザ１５２が話した複数のワード、１つのワード、または１つのワードの一部に対応し得る。オーディオ信号１３０は、背景ノイズ（例えば、音楽、ストリートノイズ、別の人物のスピーチ、等）に対応し得る。第１のデバイス１０４は、マイクロフォン１４６を介してオーディオ信号１３０を受信し得る。

[0044] 特定の実施形態では、マイクロフォン１４６は、オーディオ信号１３０をキャプチャし得、第１のデバイス１０４のアナログ／デジタル変換器（ＡＤＣ）は、キャプチャされたオーディオ信号１３０を、アナログ波形から、デジタルオーディオサンプルから成るデジタル波形へと変換し得る。デジタルオーディオサンプルは、デジタルシグナルプロセッサによって処理され得る。利得調整器は、オーディオ信号（例えば、アナログ波形またはデジタル波形）の振幅レベルを増加または減少させることで、利得（例えば、アナログ波形またはデジタル波形の）を調整し得る。利得調整器は、アナログドメインまたはデジタルドメインのどちらでも動作し得る。例えば、利得調整器は、デジタルドメインにおいて動作し得、アナログ／デジタル変換器によって生成されたデジタルオーディオサンプルを調整し得る。利得調整の後、エコーキャンセラは、スピーカの出力がマイクロフォン１４６に入ったことによって作り出された可能性のあるエコーを低減し得る。デジタルオーディオサンプルは、ボコーダ（音声エンコーダ―デコーダ）によって「圧縮」され得る。エコーキャンセラの出力は、例えば、フィルタ、ノイズプロセッサ、レート変換器、等のボコーダ事前処理ブロックに結合され得る。ボコーダのエンコーダ（例えば、エンコーダ１１４）は、デジタルオーディオサンプルを圧縮し、送信パケット（デジタルオーディオサンプルの圧縮ビットの表現）を形成し得る。例えば、エンコーダは、狭帯域ビットストリームに高帯域情報を「隠蔽する」ためにウォーターマーキングを使用し得る。スピーチコーデックビットストリームへのウォーターマーキングまたはデータ隠蔽は、ネットワークインフラストラクチャに変更を加えることなく、帯域内での追加データの送信を可能にし得る。

[0045] ウォーターマーキングは、新しいコーデックのための新しいインフラストラクチャを展開するコストを負担することなく、ある範囲のアプリケーション（例えば、認証、データ隠蔽、等）に対して使用され得る。１つの可能性のあるアプリケーションは、帯域幅拡張であり得、ここでは、１つのコーデックのビットストリーム（例えば、展開されたコーデック）が、高品質帯域拡張についての情報を含む隠蔽されたビットのためのキャリアとして使用される。キャリアビットストリームおよび隠蔽されたビットを復号することは、キャリアコーデックの帯域幅よりも大きい帯域幅を有するオーディオ信号の合成を可能にし得る（例えば、ネットワークインフラストラクチャを変えることなく、より広い帯域幅が達成され得る）。

[0046] 例えば、狭帯域コーデックは、スピーチの０−４キロヘルツ（ｋＨｚ）の低帯域部分を符号化するために使用され得、スピーチの４−７ｋＨｚの高帯域部分は、個別に符号化され得る。高帯域のためのビットは、狭帯域スピーチビットストリーム内に隠蔽され得る。この例では、広帯域オーディオ信号は、レガシ狭帯域ビットストリームを受信する受信機において復号され得る。別の例では、広帯域コーデックは、スピーチの０−７ｋＨｚの低帯域部分を符号化するために使用され得、スピーチの７−１４ｋＨｚの高帯域部分は、個別に符号化され、広帯域ビットストリームに隠蔽される。この例では、超広帯域オーディオ信号は、レガシ広帯域ビットストリームを受信する受信機において復号され得る。

[0047] ウォーターマークは、適応性があり得る。エンコーダ１１４は、線形予測（ＬＰ）コーディングを使用してオーディオ信号（例えば、スピーチ）を圧縮し得る。エンコーダ１１４は、オーディオ信号の１フレームあたり、特定の数（例えば、８０または１６０個）のオーディオサンプルを受信し得る。特定の実施形態では、エンコーダ１１４は、オーディオ信号を圧縮するために、コード励起線形予測（ＣＥＬＰ）を行い得る。例えば、エンコーダ１１４は、適応型コードブック寄与と固定のコードブック寄与との合計に対応する励起信号を生成し得る。適応型コードブック寄与は、励起信号の周期性（例えば、ピッチ）を提供し得、固定のコードブック寄与は、残りのものを提供し得る。

[0048] オーディオ信号の各フレームは、特定の数のサブフレームに対応し得る。例えば、１６０個のサンプルからなる２０ミリ秒（ｍｓ）フレームは、各々４０個のサンプルからなる４つの５ｍｓサブフレームに対応し得る。各固定のコードブックベクトルは、特定の数（例えば、４０個）のサンプルを有するサブフレームのサブフレーム励起信号に対応する特定の数（例えば、４０個）の成分を有し得る。ベクトルの位置（または、成分）は、０−３９とラベル付けされ得る。

[0049] 各固定のコードブックベクトルは、特定の数（例えば、５個）のパルスを含み得る。例えば、固定のコードブックベクトルは、特定の数（例えば、５個）のインターリーブドトラックの各々に、１つの±１パルスを含み得る。各トラックは、特定の各（例えば、８個）の位置（またはビット）に対応し得る。

[0050] 特定の実施形態では、４０個のサンプルからなる各サブフレームは、１トラックあたり８つの位置を有する５個のインターリーブドトラックに対応し得る。いくつかの構成では、適応型マルチレート狭帯域（ＡＭＲ−ＮＢ）１２．２（この場合、１２．２は、毎秒１２．２キロビット（ｋｂｐｓ）のビットレートを指し得る）が使用され得る。ＡＭＲ−ＮＢ１２．２では、１つの４０サンプルサブフレームあたり８つの位置のトラックが５個存在する。

[0051] 例えば、固定のコードブックベクトルの位置０，５，１０，１５，２０，２５，３０，および３５がトラック０を形成し得る。別の例では、固定のコードブックベクトルの位置１，６，１１，１６，２１，２６，３１，および３６がトラック１を形成し得る。さらに別の例では、固定のコードブックベクトルの位置２，７，１２，１７，２２，２７，３２，および３７がトラック２を形成し得る。別の例では、固定のコードブックベクトルの位置３，８，１３，１８，２３，２８，３３，および３８がトラック３を形成し得る。さらに別の例では、固定のコードブックベクトルの位置４，９，１４，２４，２９，３４，および３９がトラック４を形成し得る。

[0052] エンコーダ１１４は、特定のトラックを符号化するために、特定の数（例えば、２個）の±１パルスおよび１つまたは複数の符号ビットを使用し得る。例えば、エンコーダ１１４は、１トラックあたり２つのパルスと１つの符号ビットとを符号化し得、この場合、これらパルスの順序は、第２のパルスの符号を決定し得る。８個の可能な位置におけるパルスのロケーションは、３ビットを使用して符号化され得る。この例では、エンコーダ１１４は、各トラックを符号化するために、７（すなわち、３＋３＋１）ビットを使用し得、各サブフレームを符号化するために３５（すなわち、７×５）ビットを使用し得る。

[0053] エンコーダ１１４は、サブフレームのどのトラック（例えば、トラック０、トラック１、トラック２、トラック３、および／またはトラック４）がより高い優先度を有するかを決定し得る。例えば、エンコーダ１１４は、特定の数（例えば、２個）のより高い優先度のトラックを、復号されたサブフレームの知覚的オーディオ品質に対するそれらトラックのインパクトに基づいて識別し得る。エンコーダ１１４は、より高い優先度のトラックを示す情報が追加的にまたは個別に送信される必要がないように、エンコーダ１１４およびデコーダ１１６の両方にある情報を使用して、より高い優先度のトラックを識別し得る。一構成では、長期予測（ＬＴＰ）寄与は、ウォーターマークから、より高い優先度のトラックを保護するために使用され得る。例えば、ＬＴＰ寄与は、特定のトラックに対応する主要なピッチパルスにおいてピークを示し得、エンコーダ１１４およびデコーダ１１６の両方において利用可能であり得る。例えば、エンコーダ１１４は、ＬＴＰ寄与の２つの最も高い絶対値に対応する２つのより高い優先度のトラックを識別し得る。エンコーダ１１４は、３つの残りのトラックをより低い優先度のトラックとして識別し得る。

[0054] エンコーダ１１４は、２つのより高い優先度のトラックをウォーターマークせず、より低い優先度のトラックをウォーターマークし得る。例えば、ウォーターマークを符号化するために、エンコーダ１１４は、より低い優先度のトラックの各々に対応するビット（例えば、７ビット）のうち特定の数（例えば、２個）の最下位ビットを使用し得る。例えば、エンコーダ１１４は、主要のピッチパルスに対して低減された（例えば、最小の）インパクトを有するウォーターマークで搬送される１つの５ｍｓサブフレームあたり６（すなわち、２×３）ビット、合計で毎秒１．２キロビット（ｋｂｐｓ）、のウォーターマークを生成し得る。

[0055] ＬＴＰ信号は、エラーおよびパケット損失に敏感であり得、エラーは、ある時間にわたって伝播し得、結果として、デコーダ１１６によって受信された、符号化されたオーディオ信号における抹消またはビットエラーの後、長期間の間、エンコーダ１１４およびデコーダ１１６は同期がずれることになる。特定の実施形態では、エンコーダ１１４およびデコーダ１１６は、より高い優先度のトラックを識別するために、メモリ制限付きＬＴＰ寄与を使用し得る。ＬＴＰのメモリ制限付きバージョンは、特定のフレームのおよびこの特定のフレームに先行する特定の数（例えば２個）のフレームのコードブック寄与および量子化されたピッチ値に基づいて構築され得る。利得は、１（unity）に設定され得る。エンコーダ１１４およびデコーダ１１６によるＬＴＰ寄与のメモリ制限付きバージョンの使用は、エラー（例えば、送信エラー）がある場合の性能を大幅に改善し得る。特定の実施形態では、オリジナルのＬＴＰ寄与は、低帯域コーディングに使用され得、メモリ制限付きＬＴＰ寄与は、ウォーターマークする目的で、より高い優先度のトラックを識別するために使用され得る。

[0056] すべてのトラックにわたってではなく、知覚的オーディオ品質に対してより低いインパクトを有するトラックにおいてウォーターマークを符号化することは、復号されるオーディオ信号の品質の改善に帰着し得る。具体的には、主要のピッチパルスは、主要のピッチパルスに対応するより高い優先度のトラック内にウォーターマークを符号化しないことで、保たれ得る。主要のピッチパルスを保護することは、復号されるオーディオ信号のスピーチ品質に対して肯定的なインパクトを有し得る。

[0057] いくつかの構成では、本明細書で開示されるシステムおよび方法は、ＡＭＲ−ＮＢ１２．２の後方相互運用バージョンであるコーデックを提供するために使用され得る。このコーデックは、異なる用語を使用して呼ばれる可能性があるが、便宜上、このコーデックは、本明細書では「ｅＡＭＲ」と呼ばれ得る。ｅＡＭＲは、狭帯域ビットストリーム内に隠蔽された広帯域情報の「薄い」レイヤをトランスポートする能力を有し得る。ｅＡＭＲは、ウォーターマーキング（例えば、ステガノグラフィ）技術を使用し得、帯域外シグナリングに依拠しない。使用されるウォーターマークは、狭帯域品質（レガシの相互運用の場合）に対してわずかなインパクトを有し得る。ウォーターマークを用いると、狭帯域品質は、例えば、ＡＭＲ１２．２と比べて、わずかに劣化し得る。いくつかの構成では、エンコーダ１１４のようなエンコーダは、受信デバイスのレガシデコーダを検出し得（例えば、戻りチャネル上でウォーターマークを検出しないことを通じて）、ウォーターマークを追加することを停止し得、レガシＡＭＲ１２．２動作に戻る。

[0058] エンコーダ１１４は、圧縮ビット（例えば、１サブフレームあたり３５ビット）に対応する送信パケットを生成し得る。エンコーダ１１４は、第１のデバイス１０４に結合されているかまたはそれと通信状態にあるメモリに、送信パケットを記憶し得る。例えば、メモリは、第１のデバイス１０４のプロセッサによってアクセス可能であり得る。プロセッサは、デジタルシグナルプロセッサと通信状態にある制御プロセッサであり得る。第１のデバイス１０４は、入力信号１０２（例えば、符号化されたオーディオ信号）を、ネットワーク１２０を介して第２のデバイス１０６に送信し得る。入力信号１０２は、オーディオ信号１３０に対応し得る。特定の実施形態では、第１のデバイス１０４は、トランシーバを含み得る。トランシーバは、何らかの形式の送信パケット（他の情報は、送信パケットに添付され得る）を変調し得、変調された情報を、アンテナを介して無線経由で送り得る。

[0059] 第２のデバイス１０６の帯域幅拡張モジュール１１８は、入力信号１０２を受信し得る。例えば、第２のデバイス１０６のアンテナは、送信パケットを備える何らかの形式の着信パケットを受信し得る。送信パケットは、第２のデバイス１０６のボコーダのデコーダ（例えば、デコーダ１１６）によって「解凍される（uncompressed）」だろう。解凍された信号は、再構築されたオーディオサンプルと呼ばれ得る。再構築されたオーディオサンプルは、ボコーダ事後処理ブロックによって事後処理され得、エコーを取り除くためにエコーキャンセラによって使用され得る。明確さのために、ボコーダのデコーダおよびボコーダ事後処理ブロックは、ボコーダデコーダモジュールと呼ばれ得る。いくつかの構成では、エコーキャンセラの出力は、帯域幅拡張モジュール１１８によって処理され得る。代替的に、他の構成では、ボコーダデコーダモジュールの出力は、帯域幅拡張モジュール１１８によって処理され得る。

[0060] 帯域幅拡張モジュール１１８は、入力信号１０２から第１の複数のパラメータを抽出するための抽出器を含み得、入力信号１０２内の高帯域情報から独立して第２の複数のパラメータを予測するための予測器も含み得る。例えば、帯域幅拡張モジュール１１８は、入力信号１０２からウォーターマークデータを抽出し得、このウォーターマークデータに基づいて第１の複数のパラメータを決定し得る。特定の実施形態では、ボコーダデコーダモジュールは、ｅＡＭＲデコーダモジュールであり得る。例えば、デコーダ１１６は、ｅＡＭＲデコーダであり得る。帯域幅拡張モジュール１１８は、入力信号１０２の高帯域情報から独立した第２の複数のパラメータを生成するために、予測器を使用することでブラインド帯域幅拡張を行い得る。

[0061] 帯域幅拡張モジュール１１８は、図２−５に関連して説明されるように、オーディオ信号１３０の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択し得、この特定のモードに基づいて出力信号１２８を生成し得る。例えば、複数の高帯域モードは、抽出された高帯域パラメータを使用する第１のモード、予測された高帯域パラメータを使用する第２のモード、高帯域パラメータから独立した第３のモード、またはそれらの組み合わせを含み得る。帯域幅拡張モジュール１１８は、選択されたモードに基づいて、抽出された高帯域パラメータを使用して、予測された高帯域パラメータを使用して、または高帯域パラメータから独立した出力信号１２８を生成し得る。

[0062] 出力信号１２８は、利得調整器によって増幅または抑制され得る。第２のデバイス１０６は、スピーカ１４２を介して、出力信号１２８を第２のユーザ１５４に提供し得る。例えば、利得調整器の出力は、デジタル／アナログ変換器によってデジタル信号からアナログ信号に変換され得、スピーカ１４２を介して再生され得る。

[0063] システム１００は、出力信号を生成するために、抽出された複数のパラメータを使用すること、生成された複数のパラメータを使用すること、またはいずれの高帯域パラメータも使用しないことの切替えを可能にし得る。生成された複数のパラメータを使用することは、抽出された複数のパラメータに関連付けられたエラーがあるときに、高帯域オーディオ信号の生成を可能にし得る。ゆえに、システム１００は、入力信号１０２で発生するエラーがあるときに、エンハンスドオーディオ信号再生を可能にし得る。

[0064] 図２を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの実例となる実施形態が示されており、概して２００と指定されている。特定の実施形態では、システム２００は、図１のシステム１００（または、システム１００の１つまたは複数の構成要素）に対応し得るか、またはそれに含まれ得る。例えば、システム２００の１つまたは複数の構成要素は、図１の帯域幅拡張モジュール１１８に含まれ得る。

[0065] システム２００は、受信機２０４を含む。受信機２０４は、抽出器２０６および予測器２０８に結合され得るか、またはそれらと通信状態にあり得る。抽出器２０６、予測器２０８、およびセレクタ２１０は、スイッチ２１２に結合され得る。受信機２０４およびスイッチ２１２は、信号ジェネレータ２１４に結合され得る。

[0066] 動作中、受信機２０４は、入力信号（例えば、図１の入力信号１０２）を受信し得る。入力信号１０２は、入力ビットストリームに対応し得る。受信機２０４は、入力信号１０２を、抽出器２０６に、予測器２０８に、および信号ジェネレータ２１４に提供し得る。入力信号１０２は、オーディオ信号１３０の高帯域部分に関連付けられた高帯域パラメータ情報を含む場合も含まない場合もある。例えば、第１のデバイス１０４のエンコーダ１１４は、高帯域パラメータ情報を含む入力信号１０２を生成する場合も生成しない場合もある。例えば、エンコーダ１１４は、高帯域パラメータ情報を生成するように構成されない場合がある。エンコーダ１１４が、高帯域パラメータ情報を含めるように入力信号１０２を生成する場合であっても、この高帯域パラメータ情報は、受信機２０４によって受信されない場合がある（例えば、送信エラーにより）。特定の実施形態では、入力信号１０２は、高帯域パラメータ情報に対応するウォーターマークデータ２３２を含み得る。例えば、エンコーダ１１４は、ウォーターマークデータ２３２を、帯域内で、オーディオ信号１３０の低帯域部分に対応する低帯域ビットストリームに埋め込み得る。

[0067] 抽出器２０６は、入力信号１０２から第１の複数のパラメータ２２０を抽出し得る。第１の複数のパラメータ２２０は、高帯域パラメータ情報に対応し得る。例えば、第１の複数のパラメータ２２０は、線スペクトル周波数（ＬＳＦ）、利得形状（例えば、特定のフレームのサブフレームに対応する時間的利得パラメータ）、利得フレーム（例えば、特定のフレームについての低帯域に対する高帯域のエネルギ比に対応する利得パラメータ）、または高帯域部分に対応する他のパラメータのうちの少なくとも１つを含み得る。特定の実施形態では、第１の複数のパラメータ２２０のうちの１つまたは複数は、特定の高帯域モデルに対応し得る。例えば、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、ＬＳＦ、時間的利得、またはそれらの組み合わせを使用し得る。

[0068] 抽出器２０６は、入力信号１０２が高帯域パラメータ情報を含む場合、高帯域パラメータ情報が埋め込まれているだろう、入力信号１０２のロケーションを決定し得る。例えば、高帯域パラメータ情報は、入力信号１０２内の低帯域パラメータ情報２３８に埋め込まれ得る。低帯域パラメータ情報２３８は、入力信号１０２の低帯域部分に関連付けられた低帯域パラメータに対応し得る。別の例として、入力信号１０２は、高帯域パラメータ情報（例えば、第１の複数のパラメータ２２０）を符号化するウォーターマークデータ２３２を含み得る。特定の実施形態では、抽出器２０６は、コードブック（例えば、固定のコードブック（ＦＣＢ））に基づいてロケーションを決定し得る。例えば、コードブックは、入力信号１０２のオーディオ符号化プロセスにおいて使用されるトラックの数でインデックス付けされ得る。抽出器２０６は、最大の長期予測（ＬＴＰ）寄与を有するある数（例えば、２個）のトラックを、高い優先度のトラックとして決定（または、指定）し得、他のトラックは、低い優先度のトラックとして決定（または、指定）され得る。特定の実施形態では、低い優先度のトラックは、入力信号１０２の低優先度部分２３４に対応し得、高い優先度のトラックは、高優先度部分２３６に対応し得る。抽出器２０６は、決定されたロケーションから第１の複数のパラメータ２２０を抽出し得る。例えば、抽出器２０６は、低優先度部分２３４から第１の複数のパラメータ２２０を抽出し得る。第１の複数のパラメータ２２０は、入力信号１０２が高帯域パラメータ情報を含む場合、高帯域パラメータに対応し得る。入力信号１０２が、高帯域パラメータ情報を含まない場合、第１の複数のパラメータ２２０は、ランダムデータに対応し得る。抽出器２０６は、スイッチ２１２に第１の複数のパラメータ２２０を提供し得る。

[0069] 予測器２０８は、受信機２０４から入力信号１０２を受信し得、第２の複数のパラメータ２２２を生成し得る。第２の複数のパラメータ２２２は、入力信号１０２の高帯域部分に対応し得る。予測器２０８は、入力信号１０２から抽出された低帯域パラメータ情報に基づいて、第２の複数のパラメータ２２２を生成し得る。予測器２０８は、図３に関連してさらに説明されるように、低帯域パラメータ情報に基づいてブラインド帯域幅拡張を行うことで、第２の複数のパラメータ２２２を生成し得る。特定の実施形態では、予測器２０８は、特定の高帯域モデルに基づいて、第２の複数のパラメータ２２２を生成し得る。例えば、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、ＬＳＦ、時間的利得、またはそれらの組み合わせを使用し得る。

[0070] 予測器２０８は、スイッチ２１２に第２の複数のパラメータ２２２を提供し得る。特定の実施形態では、第１の複数のパラメータ２２０は、予測器２０８が第２の複数のパラメータ２２２を生成するのと同時に、抽出器２０６によって抽出され得る。

[0071] セレクタ２１０は、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択し得る。複数の高帯域モードは、抽出された高帯域パラメータ（例えば、第１の複数のパラメータ２２０）を使用する第１のモードと、予測された高帯域パラメータ（例えば、第２の複数のパラメータ２２２）を使用する第２のモードとを含み得る。セレクタ２１０は、制御入力２３０（例えば、制御入力信号）に基づいて特定のモードを選択し得る。制御入力２３０は、ユーザ入力に対応し得、ユーザセッティングまたはプリファレンスを示し得る。特定の実施形態では、制御入力２３０は、プロセッサによってセレクタ２１０に提供され得る。プロセッサは、他のデバイスからエンコーダに関する情報を受信すること、または、１つまたは複数の他のデバイスから通信ネットワークに関する受信することに応答して制御入力２３０を生成し得る。例えば、制御入力２３０は、プロセッサが、エンコーダが入力信号１０２中に高帯域パラメータを含めていないことを示す情報を受信すること、通信ネットワークが送信エラーを経験していることを示す情報を受信すること、またはその両方に応答して、予測された高帯域パラメータを使用することを示し得る。制御入力２３０は、デフォルト値（例えば、１または２）を有し得る。セレクタ２１０は、制御入力２３０が第１の値（例えば、１）を示すことに応答して第１のモードを選択し得、制御入力２３０が第２の値（例えば、２）を示すことに応答して第２のモードを選択し得る。セレクタ２１０は、パラメータモード２２４をスイッチ２１２に送り得る。パラメータモード２２４は、選択されたモード（例えば、第１のモードまたは第２のモード）を示し得る。

[0072] 特定の実施形態では、複数の高帯域モードは、任意の高帯域パラメータから独立した第３のモードも含み得る。セレクタ２１０は、制御入力２３０が第１の値（例えば、１）を示すことに応答して第１のモードを選択し得、制御入力２３０が第２の値（例えば、２）を示すことに応答して第２のモードを選択し得、制御入力２３０が第３の値（例えば、０）を示すことに応答して第３のモードを選択し得る。セレクタ２１０は、選択されたモード（例えば、第１のモード、第２のモード、または第３のモード）を示すパラメータモード２２４をスイッチ２１２に送り得る。

[0073] スイッチ２１２は、抽出器２０６から第１の複数のパラメータ２２０を、予測器２０８から第２の複数のパラメータ２２２を、そしてセレクタ２１０からパラメータモード２２４を受信し得る。スイッチ２１２は、パラメータモード２２４に基づいて、選択されたパラメータ２２６（例えば、第１の複数のパラメータ２２０、第２の複数のパラメータ２２２、または高帯域パラメータなし）を、信号ジェネレータ２１４に提供し得る。例えば、スイッチ２１２は、パラメータモード２２４が第１のモードを示すことに応答して、第１の複数のパラメータ２２０を信号ジェネレータ２１４に提供し得る。スイッチ２１２は、パラメータモード２２４が第２のモードを示すことに応答して、第２の複数のパラメータ２２２を信号ジェネレータ２１４に提供し得る。スイッチ２１２は、パラメータモード２２４が第３のモードを示すことに応答して、いずれの高帯域パラメータも信号ジェネレータ２１４によって使用されないように、いずれの高帯域パラメータも信号ジェネレータ２１４に提供しないだろう。

[0074] 信号ジェネレータ２１４は、受信機２０４から入力信号１０２を受信し得、スイッチ２１２から、選択されたパラメータ２２６を受信し得る。信号ジェネレータ２１４は、選択されたパラメータ２２６および入力信号１０２に基づいて、出力高帯域部分を生成し得る。例えば、選択されたパラメータ２２６が、高帯域パラメータ（例えば、第１の複数のパラメータ２２０または第２の複数のパラメータ２２２）に対応する場合、信号ジェネレータ２１４は、出力高帯域部分を生成するために、選択されたパラメータ２２６をモデルおよび／または復号し得る。例えば、信号ジェネレータ２１４は、出力高帯域部分を生成するために、特定の高帯域モデルを使用し得る。実例となる例として、特定の高帯域モデルは、周波数ドメインにおける高帯域拡張、ＬＳＦ、時間的利得、またはそれらの組み合わせを使用し得る。より高い周波数帯域に対して使用される特定の高帯域モデルは、復号されたより低い帯域信号に依存し得る。信号ジェネレータ２１４は、入力信号１０２に基づいて、出力低帯域部分を生成し得る。例えば、信号ジェネレータ２１４は、出力低帯域部分を生成するために、入力信号１０２から低帯域パラメータを抽出、モデル、および／または復号し得る。出力低帯域部分は、出力高帯域部分を生成するために使用され得る。信号ジェネレータ２１４は、出力低帯域部分と出力高帯域部分とを組み合せることで、出力信号１２８（例えば、復号されたオーディオ信号）を生成し得る。信号ジェネレータ２１４は、出力信号１２８を再生デバイス（例えば、スピーカ）に送信し得る。

[0075] いずれの高帯域パラメータも信号ジェネレータ２１４に提供されない場合、信号ジェネレータ２１４は、出力低帯域部分を生成し得、出力高帯域部分を生成することを控え得る。このケースでは、出力信号１２８は、低帯域オーディオにのみ対応し得る。

[0076] 特定の実施形態では、入力信号１０２は、略５０ヘルツ（Ｈｚ）から略１６キロヘルツ（ｋＨｚ）の周波数範囲のデータを含む超広帯域（ＳＷＢ）信号であり得る。入力信号１０２の低帯域部分はおよび入力信号１０２の高帯域部分は、それぞれ５０Ｈｚ〜７ｋＨｚおよび７ｋＨｚ〜１６ｋＨｚという重複していない周波数帯域を占有し得る。代替的な実施形態では、低帯域部分および高帯域部分は、それぞれ、５０Ｈｚ〜８ｋＨｚおよび８ｋＨｚ〜１６ｋＨｚという重複していない周波数帯域を占有し得る。別の代替的な実施形態では、低帯域部分および高帯域部分は重複し得る（例えば、それぞれ、５０Ｈｚ〜８ｋＨｚおよび７ｋＨｚ〜１６ｋＨｚ）。

[0077] 特定の実施形態では、入力信号１０２は、略５０Ｈｚ〜略８ｋＨｚの周波数範囲を有する広帯域（ＷＢ）信号であり得る。そのような実施形態では、入力信号１０２の低帯域部分は、略５０Ｈｚ〜略６．４ｋＨｚの周波数範囲に対応し得、入力信号１０２の高帯域部分は、略６．４ｋＨｚ〜略８ｋＨｚの周波数範囲に対応し得る。

[0078] 図２のシステム２００は、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととを、制御入力（例えば、制御入力２３０）に基づいて動的に切り替えることを可能にし得る。特定の実施形態では、制御入力２３０は、システム２００のリソース（例えば、バッテリ、プロセッサ、または両方）を節約するために変化し得る。例えば、制御入力２３０は、リソースが節約されるべきであることを示すユーザ入力に基づいて、または、リソース利用性（例えば、バッテリ、プロセッサ、または両方に関連付けられた）が特定の閾値レベルを満たさないことを検出することに基づいて、いずれの高帯域パラメータも使用されるべきでないことを示し得る。システム２００のリソースは、制御入力２３０がいずれの高帯域パラメータも使用されるべきでないことを示すとき、高帯域オーディオを生成しないことで節約され得る。別の実施形態では、制御入力２３０は、プロセッサが、エンコーダが入力信号１０２中に高帯域パラメータを含めていないことを示す情報を受信すること、通信ネットワークが送信エラーを経験していることを示す情報を受信すること、またはその両方に応答して、予測された高帯域パラメータを使用することを示し得る。予測された高帯域パラメータを使用することは、高帯域パラメータが存在しないこと、または、それに関連付けられたエラーを隠蔽し得る。ゆえに、システム２００は、リソース節約、エラー隠蔽、またはその両方を可能にし得る。

[0079] 図３を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して３００と指定されている。特定の実施形態では、システム３００は、図１のシステム１００（または、システム１００の１つまたは複数の構成要素）に対応し得るか、またはそれに含まれ得る。例えば、システム３００の１つまたは複数の構成要素は、図１の帯域幅拡張モジュール１１８に含まれ得る。システム３００は、受信機２０４、抽出器２０６、予測器２０８、セレクタ２１０、スイッチ２１２、および信号ジェネレータ２１４を含む。図３では、抽出器２０６は、予測器２０８に結合される。予測器２０８は、ブラインド帯域幅拡張器（ＢＢＥ）３０４およびチューナ３０２を含み得る。

[0080] 動作中、抽出器２０６は、予測器２０８に第１の複数のパラメータ２２０を提供し得る。ＢＢＥ３０４は、入力信号１０２の低帯域部分に基づいてブラインド帯域幅拡張を行うことで、第２の複数のパラメータ２２２を生成し得る。例えば、ＢＢＥ３０４は、入力信号１０２内のどの高帯域情報からも独立した第２の複数のパラメータ２２２を生成し得る。ＢＢＥ３０４は、特定の低帯域パラメータに対応する特定の高帯域パラメータを示すパラメータデータへのアクセスを有し得る。パラメータデータは、トレーニングオーディオサンプルに基づいて生成され得る。例えば、各トレーニングオーディオサンプルは、低帯域オーディオおよび高帯域オーディオを含み得る。特定の低帯域パラメータと特定の高帯域パラメータとの間の相関は、トレーニングオーディオサンプルの低帯域オーディオおよび高帯域オーディオに基づいて決定され得る。パラメータデータは、特定の低帯域パラメータと特定の高帯域パラメータとの間の相関を示し得る。ＢＢＥ３０４は、第２の複数のパラメータ２２２を予測するために、パラメータデータと、入力信号１０２の低帯域パラメータとを使用し得る。ＢＢＥ３０４は、ユーザ入力を介してパラメータデータを受信し得る。代替的に、パラメータデータは、デフォルト値を有し得る。

[0081] 特定の実施形態では、ＢＢＥ３０４は、分析データに基づいて、第２の複数のパラメータ２２２を生成し得る。分析データは、第１の複数のパラメータ２２０に関連付けられたデータ（例えば、第１の利得フレームおよび／または第１の平均線スペクトル周波数（ＬＳＦ））を含み得る。分析データは、以前に受信された入力信号に関連付けられた履歴データ（例えば、予測利得フレームおよび／または履歴平均線スペクトル周波数（ＬＳＦ））を含み得る。例えば、ＢＢＥ３０４は、予測利得フレームに基づいて第２の複数のパラメータ２２２を生成し得る。チューナ３０２は、第２の複数のパラメータ２２２の第２の利得フレームに対する第１の複数のパラメータ２２０の第１の利得フレームの比に基づいて、予測利得フレームを調整し得る。

[0082] 別の例として、入力信号（例えば、入力信号１０２）に関連付けられた平均ＬＳＦは、スペクトル傾斜を示し得る。ＢＢＥ３０４は、履歴平均ＬＳＦによって示されるスペクトル傾斜により良くマッチするように、第２の複数のパラメータ２２２をバイアスするために履歴平均ＬＳＦを使用し得る。チューナ３０２は、入力信号１０２の現在のフレームのために抽出された平均ＬＳＦに基づいて履歴平均ＬＳＦを調整し得る。例えば、チューナ３０２は、第１の平均ＬＳＦに基づいて履歴平均ＬＳＦを調整し得る。特定の実施形態では、ＢＢＥ３０４は、現在のフレームのために抽出された平均ＬＳＦに基づいて第２の複数のパラメータ２２２を生成し得る。例えば、ＢＢＥ３０４は、第１の平均ＬＳＦに基づいて第２の複数のパラメータ２２２をバイアスし得る。

[0083] システム３００は、制御入力（例えば、制御入力２３０）に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととの動的な切替えを可能にし得る。加えて、システム３００は、受信された高帯域パラメータに関連付けられた分析データに基づいて予測された高帯域パラメータを適応することで、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとを切り替えるとき、アーティファクトを低減し得る。

[0084] 図４を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して４００と指定されている。特定の実施形態では、システム４００は、図１のシステム１００（または、システム１００の１つまたは複数の構成要素）に対応し得るか、またはそれに含まれ得る。例えば、システム４００の１つまたは複数の構成要素は、図１の帯域幅拡張モジュール１１８に含まれ得る。

[0085] システム４００は、受信機２０４、抽出器２０６、予測器２０８、セレクタ２１０、スイッチ２１２、信号ジェネレータ２１４、チューナ３０２、およびＢＢＥ３０４を含む。システム４００はまた、抽出器２０６、予測器２０８、およびセレクタ２１０に結合されたバリデータ４０２（例えば、パラメータ有効性チェッカ）を含む。

[0086] 動作中、バリデータ４０２は、抽出器２０６から第１の複数のパラメータ２２０を受信し得、予測器２０８から第２の複数のパラメータ２２２を受信し得る。バリデータ４０２は、第１の複数のパラメータ２２０と第２の複数のパラメータ２２２との比較に基づいて第１の複数のパラメータ２２０の「信頼性」を決定し得る。例えば、バリデータ４０２は、第１の複数のパラメータ２２０と第２の複数のパラメータ２２２との間の差分（例えば、絶対値、標準偏差、等）に基づいて第１の複数のパラメータ２２０の信頼性を決定し得る。例えば、信頼性は、この差分に逆相関し得る。バリデータ４０２は、決定された信頼性を示す有効性データ４０４を生成し得る。バリデータ４０２は、有効性データ４０４をセレクタ２１０に提供し得る。

[0087] セレクタ２１０は、第１の複数のパラメータ２２０が、信号再構築に使用するのに信頼性があるかそれとも信頼性がなさすぎるかを、有効性データ４０４が信頼性閾値を満たす（例えば、超える）かどうかに基づいて決定し得る。例えば、第１の複数のパラメータ２２０と第２の複数のパラメータ２２２との間の差分は、高帯域パラメータ情報の送信に関連付けられたエラー（例えば、破損／欠如データ）が存在することを示し得る。別の例として、この差分は、第１の複数のパラメータ２２０が、ランダムデータに対応することを示し得る（例えば、入力信号１０２が、高帯域パラメータを含まないようにエンコーダによって生成されるとき）。

[0088] セレクタ２１０は、ユーザ入力を介して信頼性閾値を受信し得る。信頼性閾値は、ユーザ設定および／またはプリファレンスに対応し得る。代替的に、信頼性閾値は、デフォルト値を有し得る。特定の実施形態では、制御入力２３０は、信頼性閾値に対応する値を含み得る。

[0089] セレクタ２１０は、有効性データ４０４に基づいて、複数の高帯域モードから特定のモードを選択し得る。例えば、セレクタ２１０は、有効性データ４０４が信頼性閾値を満たす（例えば、超える）ことに応答して、第１の複数のパラメータ２２０を使用する第１のモードを選択し得る。セレクタ２１０は、有効性データ４０４が信頼性閾値を満たさない（例えば、超えない）ことに応答して、第２の複数のパラメータ２２２を使用する第２のモードを選択し得る。代替的に、セレクタ２１０は、有効性データ４０４が信頼性閾値を満たさないことに応答して、第３のモードを選択し得る。

[0090] 特定の実施形態では、セレクタ２１０は、有効性データ４０４と制御入力２３０とに基づいて特定のモードを選択し得る。例えば、セレクタ２１０は、有効性データ４０４が信頼性閾値を満たすとき、第１のモードを選択し得る。セレクタ２１０は、有効性データ４０４が信頼性閾値を満たさず、かつ、制御入力２３０が第１の値（例えば、真）を示すとき、第２のモードを選択し得る。セレクタ２１０は、有効性データ４０４が信頼性閾値を満たさず、かつ、制御入力２３０が第２の値（例えば、偽）を示すとき、第３のモードを選択し得る。

[0091] システム４００は、受信された入力信号内の高帯域パラメータ情報の信頼性に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないことの動的な切替えを可能にし得る。受信された高帯域パラメータ情報に信頼性があるとき、抽出された高帯域パラメータが使用され得る。受信された高帯域パラメータ情報に信頼性がないとき、受信された高帯域パラメータ情報に関連付けられたエラーを隠蔽するために、予測された高帯域パラメータが使用され得る。特定の実施形態では、システム４００は、入力信号１０２内の高帯域パラメータ情報が、受信機２０４への送信に先立ち、少量の冗長性およびエラー検出を使用して符号化されることを可能にし得る。エンコーダは、抽出された高帯域パラメータの信頼性を決定するための比較用の予測された高帯域パラメータへのアクセスを有するためにシステム４００に依拠し得る。

[0092] 図５を参照すると、帯域幅拡張モード選択を行うように動作可能なシステムの別の特定の実施形態が開示されており、概して５００と指定されている。特定の実施形態では、システム５００は、図１のシステム１００（または、システム１００の１つまたは複数の構成要素）に対応し得るか、またはそれに含まれ得る。例えば、システム５００の１つまたは複数の構成要素は、図１の帯域幅拡張モジュール１１８に含まれ得る。

[0093] システム５００は、受信機２０４、抽出器２０６、予測器２０８、セレクタ２１０、スイッチ２１２、信号ジェネレータ２１４、チューナ３０２、ＢＢＥ３０４、およびバリデータ４０２を含む。システム５００はまた、抽出器２０６よびセレクタ２１０に結合されたエラー検出器５０２を含む。

[0094] 動作中、抽出器２０６は、エラー検出データ５０４をエラー検出器５０２に提供し得る。例えば、抽出器２０６は、入力信号１０２からエラー検出データ５０４を抽出し得る。エラー検出データ５０４は、高帯域パラメータ情報に関連付けられ得る。例えば、エラー検出データ５０４は、高帯域パラメータ情報に関連付けられた周期的冗長検査（ＣＲＣ）データに対応し得る。

[0095] エラー検出器５０２は、高帯域パラメータ情報に関連付けられたエラーがあるかどうかを決定するために、エラー検出データ５０４を分析し得る。例えば、エラー検出器５０２は、ＣＲＣデータ（例えば、４ビット）が無効データを示すと決定することに応答してエラーを検出し得る。エラー検出器５０２は、ＣＲＣデータが有効データを示すと決定することに応答していずれのエラーも検出しないだろう。エラー検出データ５０４を表すために追加のビットを使用することは、高帯域パラメータ情報の送信に関連付けられたエラーを検出する可能性を増加させ得るが、高帯域情報の送信に使用されるビット数を増加させ得る。

[0096] 特定の実施形態では、エラー検出器５０２は、履歴エラーレート（例えば、ＣＲＣチェックに基づいた、エラーのあるフレームの平均エラーレート）を示す状態を維持し得る。この履歴エラーレートは、入力信号１０２が有効な高帯域パラメータ情報を含むかどうかを決定するために使用され得る。例えば、履歴エラーレートは、入力信号１０２に関連付けられたＣＲＣデータが誤検出を示すかどうかを決定するために使用され得る。例えば、入力信号１０２に関連付けられたＣＲＣデータは、入力信号１０２が高帯域パラメータ情報を含まず、かつ、第１の複数のパラメータ２２０がランダムデータを表すときであっても有効データを示し得る。エラー検出器５０２は、平均エラーレートが閾値エラーレートを満たす（例えば、超える）と決定することに応答してエラーを検出し得る。例えば、エラー検出器５０２は、履歴エラーレートが閾値エラーレートを満たす（例えば、超える）ことに基づいて、エンコーダが高帯域パラメータ情報を送信していないと決定し得る。例えば、エラー検出器５０２は、平均エラーレートが、ある数（例えば、１６個）の最も最近受信されたフレームのうち閾値数（例えば、６個）よりも多くのフレームに関連付けられたエラーを示すと決定することに応答して、エラーを検出し得る。エラー検出器５０２は、ユーザ設定またはプリファレンスに対応する閾値エラーレートを、ユーザ入力を介して受信し得る。代替的に、閾値エラーレートは、デフォルト値を有し得る。

[0097] エラー検出器５０２は、エラーが検出されたかどうかを示すエラー出力５０６をセレクタ２１０に提供し得る。例えば、エラー出力５０６は、エラー検出器５０２によっていずれのエラーも検出されないことを示す第１の値（例えば、０）を有し得る。エラー出力５０６は、エラー検出器５０２によって少なくとも１つのエラーが検出されることを示す第２の値（例えば、１）を有し得る。例えば、エラー出力５０６は、エラー検出データ５０４（例えば、ＣＲＣデータ）が無効データを示すと決定することに応答して、第２の値（例えば、１）を有し得る。別の例として、エラー出力５０６は、平均エラーレートが閾値エラーレートを満たさないと決定することに応答して、第２の値（例えば、１）を有し得る。

[0098] セレクタ２１０は、エラー出力５０６に基づいて高帯域モードを選択し得る。例えば、セレクタ２１０は、エラー出力５０６が第１の値（例えば、０）を有すると決定することに応答して、第１の複数のパラメータ２２０を使用する第１のモードを選択し得る。セレクタ２１０は、エラー出力５０６が第２の値（例えば、１）を有すると決定することに応答して、第２のモードまたは第３のモードを選択し得る。

[0099] 特定の実施形態では、セレクタ２１０は、エラー出力５０６と有効性データ４０４とに基づいて高帯域モードを選択し得る。例えば、セレクタ２１０は、エラー出力５０６が第１の値（例えば、０）を有すること、かつ、有効性データ４０４が信頼性閾値を満たす（例えば、超える）ことを決定することに応答して、第１のモードを選択し得る。セレクタ２１０は、エラー出力５０６が第２の値（例えば、１）を有すること、または、有効性データ４０４が信頼性閾値を満たさない（例えば、超えない）ことを決定することに応答して、第２のモードまたは第３のモードを選択し得る。

[0100] 特定の実施形態では、セレクタ２１０は、エラー出力５０６と、有効性データ４０４と、制御入力２３０とに基づいて高帯域モードを選択し得る。例えば、セレクタ２１０は、制御入力２３０が第１の値（例えば、真）を示すこと、エラー出力５０６が第１の値（例えば、０）を有すること、かつ、有効性データ４０４が信頼性閾値を満たす（例えば、超える）ことを決定することに応答して、第１のモードを選択し得る。別の例として、セレクタ２１０は、制御入力２３０が第１の値（例えば、真）を示すと決定すること、かつ、エラー出力５０６が第２の値（例えば、１）を有するか、または、有効性データ４０４が信頼性閾値を満たさない（例えば、超えない）と決定することに応答して、第２のモードを選択し得る。セレクタは、制御入力２３０が第２の値（例えば、偽）を示すと決定することに応答して第３のモードを選択し得る。

[0101] システム５００は、制御入力（例えば、制御入力２３０）、受信された高帯域パラメータ情報の信頼性（例えば、有効性データ４０４によって示されるような）、および／または受信されたエラー検出データ（例えば、エラー検出データ５０４）に基づいた、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することと、いずれの高帯域パラメータも使用しないこととの切替えを可能にし得る。システム５００は、いずれの高帯域パラメータも使用されるべきでないことを制御入力が示すとき、高帯域オーディオの生成を控えることでリソースの節約を可能にし得る。高帯域オーディオが生成されるとき、システム５００は、受信された高帯域パラメータに関連付けられたエラーを検出するか、または、受信された高帯域パラメータは信頼性がないと決定することに応答して、予測された高帯域パラメータを使用して高帯域オーディオを生成することで、受信された高帯域パラメータ情報に関連付けられたエラーを隠蔽し得る。

[0102] 図６を参照すると、帯域幅拡張モード選択の方法の特定の実施形態のフローチャートが示されており、概して６００と指定されている。方法６００は、図１−５のシステム１００−５００の１つまたは複数の構成要素によって行われ得る。例えば、方法６００は、デコーダにおいて、例えば、図１のデコーダ１１６の帯域幅拡張モジュール１１８の１つまたは複数の構成要素によって行われ得る。

[0103] 方法６００は、６０２において、受信された入力信号から第１の複数のパラメータを抽出することを含む。入力信号は、符号化されたオーディオ信号に対応し得る。例えば、図２−５の抽出器２０６は、図２に関連してさらに説明されたように、入力信号１０２から第１の複数のパラメータ２２０を抽出し得る。入力信号１０２は、符号化されたオーディオ信号に対応し得る。

[0104] 方法６００はまた、６０４において、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することで、ブラインド帯域幅拡張を行うことを含む。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第２の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され得る。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられ得る。例えば、図２−５の予測器２０８は、図２−３に関連してさらに説明されたように、第２の複数のパラメータ２２２を生成し得る。第２の複数のパラメータ２２２は、入力信号１０２の高帯域部分に対応し得る。予測器２０８は、入力信号１０２の低帯域パラメータに対応する低帯域パラメータ情報に基づいて第２の複数のパラメータ２２２を生成し得る。

[0105] 方法６００は、６０６において、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択することをさらに含む。例えば、図２−５のセレクタ２１０は、図２−５に関連してさらに説明されたように、複数の高帯域モードから特定のモードを選択し得る。複数の高帯域モードは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む。

[0106] 方法６００はまた、６０８において、特定のモードの選択に応答して、デコーダの出力ジェネレータに第１の複数のパラメータまたは第２の複数のパラメータを送ることを含み得る。例えば、図２−５のスイッチ２１２は、図２−５に関連してさらに説明されたように、特定のモードの選択に応答して、選択されたパラメータ２２６を信号ジェネレータ２１４に送り得る。選択されたパラメータ２２６は、第１の複数のパラメータ２２０または第２の複数のパラメータ２２２に対応し得る。

[0107] 図６の方法６００は、抽出された高帯域パラメータを使用することと、予測された高帯域パラメータを使用することとの動的な切替えを可能にし得る
[0108] 特定の実施形態では、図６の方法６００は、中央処理装置（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）、またはコントローラのような処理ユニットのハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、等）を介して、ファームウェアデバイスを介して、またはこれらの任意の組み合わせによって実装され得る。一例として、図６の方法６００は、図７に関して説明されるように、命令を実行するプロセッサによって行われ得る。

[0109] 図７を参照すると、デバイス（例えば、ワイヤレス通信デバイス）の特定の実例となる実施形態のブロック図が描写されており、概して７００と指定されている。様々な実施形態では、デバイス７００は、図７に例示されたものよりも少ないまたは多くの数の構成要素を有し得る。実例となる実施形態では、デバイス７００は、図１の第１のデバイス１０４または第２のデバイス１０６に対応し得る。実例となる実施形態では、デバイス７００は、図６の方法６００にしたがって動作し得る。

[0110] 特定の実施形態では、デバイス７００は、プロセッサ７０６（例えば、中央処理装置（ＣＰＵ））を含む。デバイス７００は、１つまたは複数の追加のプロセッサ７１０（例えば、１つまたは複数のデジタルシグナルプロセッサ（ＤＳＰ））を含み得る。プロセッサ７１０は、スピーチおよびミュージックコーダ―デコーダ（ＣＯＤＥＣ）７０８およびエコーキャンセラ７１２を含み得る。スピーチおよびミュージックＣＯＤＥＣ７０８は、ボコーダエンコーダ７１４、ボコーダデコーダ７１６、または両方を含み得る。特定の実施形態では、ボコーダエンコーダ７１４は、図１のエンコーダ１１４に対応し得る。特定の実施形態では、ボコーダデコーダ７１６は、図１のデコーダ１１６に対応し得る。

[0111] デバイス７００は、メモリ７３２およびＣＯＤＥＣ７３４を含み得る。デバイス７００は、アンテナ７４２に結合されたワイヤレスコントローラ７４０を含み得る。デバイス７００は、ディスプレイコントローラ７２６に結合されたディスプレイ７２８を含み得る。スピーカ７３６、マイクロフォン７３８、または両方は、ＣＯＤＥＣ７３４に結合され得る。特定の実施形態では、スピーカ７３６は、図１のスピーカ１４２に対応し得る。特定の実施形態では、マイクロフォン７３８は、図１のマイクロフォン１４６に対応し得る。ＣＯＤＥＣ７３４は、デジタル／アナログ変換器（ＤＡＣ）７０２およびアナログ／デジタル変換器（ＡＤＣ）７０４を含み得る。

[0112] 特定の実施形態では、ＣＯＤＥＣ７３４は、マイクロフォン７３８からアナログ信号を受信し、アナログ／デジタル変換器７０４を使用してこのアナログ信号をデジタル信号に変換し、このデジタル信号をスピーチおよびミュージックコーデック７０８に提供し得る。スピーチおよびミュージックコーデック７０８は、このデジタル信号を処理し得る。特定の実施形態では、スピーチおよびミュージックコーデック７０８は、デジタル信号をＣＯＤＥＣ７３４に提供し得る。ＣＯＤＥＣ７３４は、デジタル／アナログ変換器７０２を使用してこのデジタル信号をアナログ信号に変換し得、そのアナログ信号をスピーカ７３６に提供し得る。

[0113] デバイス７００は、図１の帯域幅拡張モジュール１１８を含み得る。特定の実施形態では、帯域幅拡張モジュール１１８の１つまたは複数の構成要素は、プロセッサ７０６、プロセッサ７１０、スピーチおよびミュージックコーデック７０８、ボコーダデコーダ７１６、ＣＯＤＥＣ７３４、またはそれらの組み合わせに含まれ得る。

[0114] メモリ７３２は、図６の方法６００のような、本明細書で開示された方法およびプロセスを行うために、プロセッサ７０６、プロセッサ７１０、ＣＯＤＥＣ７３４、デバイス７００の１つまたは複数の他の処理ユニット、またはそれらの組み合わせによって実行可能な命令７６０を含み得る。

[0115] システム１００−５００の１つまたは複数の構成要素は、専用ハードウェア（例えば、回路）を介して、１つまたは複数のタスク行うための命令を実行するプロセッサによって、またはその組み合わせで実装され得る。例として、メモリ７３２またはスピーチおよびミュージックＣＯＤＥＣ７０８の１つまたは複数の構成要素は、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピントルク転送ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読取専用メモリ（ＲＯＭ）、プログラマブル読取専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読取専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読取専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバルディスク、またはコンパクトディスク読取専用メモリ（ＣＤ−ＲＯＭ）のようなメモリデバイスであり得る。メモリデバイスは、コンピュータ（例えば、ＣＯＤＥＣ７３４内のプロセッサ、プロセッサ７０６、および／またはプロセッサ７１０）によって実行されると、図６の方法６００のうちの１つの少なくとも一部をコンピュータに行わせ得る命令（例えば、命令７６０）を含み得る。例として、スピーチおよびミュージックＣＯＤＥＣ７０８のメモリ７３２または１つまたは複数の構成要素は、コンピュータ（例えば、ＣＯＤＥＣ７３４内のプロセッサ、プロセッサ７０６、および／またはプロセッサ７１０）によって実行されると、図６の方法６００の少なくとも一部をコンピュータに行わせる命令（例えば、命令７６０）を含む非一時的なコンピュータ可読媒体であり得る。

[0116] 特定の実施形態では、デバイス７００は、システムインパッケージまたはシステムオンチップデバイス（例えば、モバイル局モデム（ＭＳＭ））７２２に含まれ得る。特定の実施形態では、プロセッサ７０６、プロセッサ７１０、ディスプレイコントローラ７２６、メモリ７３２、ＣＯＤＥＣ７３４、帯域幅拡張モジュール１１８、およびワイヤレスコントローラ７４０は、システムインパッケージまたはシステムオンチップデバイス７２２に含まれる。特定の実施形態では、タッチスクリーンおよび／またはキーパッドのような入力デバイス７３０および電源７４４は、システムオンチップデバイス７２２に結合される。さらに、特定の実施形態では、図７に例示されるように、ディスプレイ７２８、入力デバイス７３０、スピーカ７３６、マイクロフォン７３８、アンテナ７４２、および電源７４４は、システムオンチップ７２２に外付けである。しかしながら、ディスプレイ７２８、入力デバイス７３０、スピーカ７３６、マイクロフォン７３８、アンテナ７４２、および電源７４４の各々は、インターフェースまたはコントローラのような、システムオンチップデバイス７２２の構成要素に結合され得る。

[0117] デバイス７００は、モバイル通信デバイス、スマートフォン、セルラ電話、ラップトップコンピュータ、コンピュータ、タブレット、携帯情報端末、ディスプレイデバイス、テレビジョン、ゲームコンソール、ミュージックプレーヤ、ラジオ、デジタルビデオプレーヤ、デジタルビデオディスク（ＤＶＤ）プレーヤ、チューナ、カメラ、ナビゲーションデバイス、デコーダシステム、またはそれらの任意の組み合わせを含み得る。

[0118] 実例となる実施形態では、プロセッサ７１０は、図１−６に関連して説明された方法または動作のすべてまたは一部を実行するように動作可能であり得る。例えば、マイクロフォン７３８は、オーディ信号（例えば、図１のオーディオ信号１３０）をキャプチャし得る。ＡＤＣ７０４は、キャプチャされたオーディオ信号を、アナログ波形から、デジタルオーディオサンプルから成るデジタル波形へと変換し得る。プロセッサ７１０は、デジタルオーディオサンプルを処理し得る。利得調整器は、デジタルオーディオサンプルを調整し得る。エコーキャンセラ７１２は、スピーカ７３６の出力がマイクロフォン７３８に入ることで作り出されたであろうエコーを低減し得る。

[0119] ボコーダエンコーダ７１４は、処理されたスピーチ信号に対応するデジタルオーディオサンプルを圧縮し得、送信パケット（例えば、デジタルオーディオサンプルの圧縮ビットの表現）を形成し得る。例えば、送信パケットは、図１−２に関連して説明されたように、図２のウォーターマークデータ２３２を含み得る。送信パケットは、メモリ７３２に記憶され得る。トランシーバは、何らかの形式の送信パケット（例えば、他の情報は、送信パケットに添付され得る）を変調し得、変調されたデータを、アンテナ７４２を介して送信し得る。

[0120] さらなる例として、アンテナ７４２は、受信パケットを含む着信パケットを受信し得る。受信パケットは、ネットワークを介して別のデバイスによって送られ得る。例えば、受信パケットは、図１の入力信号１０２に対応し得る。ボコーダデコーダ７１６は、受信パケットを解凍するだろう。解凍された受信パケットは、再構築されたオーディオサンプルと呼ばれ得る。エコーキャンセラ７１２は、この再構築されたオーディオサンプルからエコーを取り除き得る。

[0121] プロセッサ７１０は、図２−５に関連して説明されるように、受信パケットから第１の複数のパラメータ２２０を抽出し得、第２の複数のパラメータを生成し得、第１の複数のパラメータ２２０または第２の複数のパラメータ２２２を選択するかあるいはいずれの高帯域パラメータも選択せず、そして選択されたパラメータに基づいて出力信号１２８を生成し得る。利得調整器は、出力信号１２８を増幅または抑制し得る。ＤＡＣ７０２は、この出力信号１２８をデジタル信号からアナログ信号に変換し得、この変換された信号をスピーカ７３６に提供し得る。特定の実施形態では、スピーカ７３６は、図１のスピーカ１４２に対応し得る。

[0122] 説明された実施形態と関連して、受信された入力信号から第１の複数のパラメータを抽出するための手段を含む装置が開示される。入力信号は、符号化されたオーディオ信号に対応し得る。例えば、抽出するための手段は、図２−５の抽出器２０６、第１の複数のパラメータを抽出するように構成された１つまたは複数のデバイス（例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ）、またはそれらの任意の組み合わせを含み得る。

[0123] 装置はまた、入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段を含む。第２の複数のパラメータは、符号化されたオーディオ信号の高帯域部分に対応する。第２の複数のパラメータは、入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成される。低帯域パラメータは、符号化されたオーディオ信号の低帯域部分に関連付けられる。例えば、行うための手段は、図２−５の予測器２０８、第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された１つまたは複数のデバイス（例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ）、またはそれらの任意の組み合わせを含み得る。

[0124] 装置は、符号化されたオーディオ信号の高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段をさらに含み、複数の高帯域モードは、第１の複数のパラメータを使用する第１のモードと、第２の複数のパラメータを使用する第２のモードとを含む。例えば、選択するための手段は、図２−５のセレクタ２１０、特定のモードを選択するように構成された１つまたは複数のデバイス（例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ）、またはそれらの任意の組み合わせを含み得る。

[0125] 装置はまた、選択された特定のモードに基づいて、第１の複数のパラメータまたは第２の複数のパラメータを出力するための手段を含む。例えば、出力するための手段は、図２−５のスイッチ２１２、出力するように構成された１つまたは複数のデバイス（例えば、非一時的なコンピュータ可読記憶媒体において命令を実行するプロセッサ）、またはそれらの任意の組み合わせを含み得る。

[0126] 当業者は、本明細書で開示された実施形態に関連して説明された実例となる様々な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップが、電子ハードウェア、ハードウェアプロセッサのような処理デバイスによって実行されるコンピュータソフトウェア、または両方の組み合わせとして実装され得ることをさらに認識するだろう。実例となる様々な構成要素、ブロック、構成、モジュール、回路、およびステップは一般に、それらの機能の観点から上に説明されている。そのような機能性がハードウェアとして実装されるか実行可能なソフトウェアとして実装されるかは、特定の用途とシステム全体に課される設計の制約とに依存する。当業者は、説明された機能性を特定の用途ごとに様々な方法で実装し得るが、このような実装の決定は、本開示の範囲からの逸脱を引き起こすものとして解釈されるべきでない。

[0127] 本明細書で開示された実施形態に関連して説明されたアルゴリズムまたは方法のステップは、直接ハードウェアで、プロセッサによって実行されるソフトウェアモジュールで、または両者の組み合わせで具現化され得る。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入磁化反転型ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読取専用メモリ（ＲＯＭ）、プログラマブル読取専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読取専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読取専用メモリ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取専用メモリ（ＣＤ−ＲＯＭ）のようなメモリデバイスに存在し得る。例示的なメモリデバイスは、プロセッサがこのメモリデバイスから情報を読み取り、このメモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替的に、メモリデバイスは、プロセッサに一体化され得る。プロセッサおよび記憶媒体は、特定用途向け集積回路（ＡＳＩＣ）内に存在し得る。ＡＳＩＣは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替において、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末内にディスクリート構成要素として存在し得る。

[0128] 開示された実施形態の先の説明は、開示された実施形態を製造または使用することを当業者に可能にするために提供される。これらの実施形態への様々な修正は、当業者にとって容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。ゆえに、本開示は、本明細書で示された実施形態に限定されるようには意図されず、以下の特許請求の範囲によって定義されるような原理および新規な特徴と一致する可能である最も広い範囲が与えられるべきである。

[0128] 開示された実施形態の先の説明は、開示された実施形態を製造または使用することを当業者に可能にするために提供される。これらの実施形態への様々な修正は、当業者にとって容易に明らかであり、本明細書で定義された原理は、本開示の範囲から逸脱することなく他の実施形態に適用され得る。ゆえに、本開示は、本明細書で示された実施形態に限定されるようには意図されず、以下の特許請求の範囲によって定義されるような原理および新規な特徴と一致する可能である最も広い範囲が与えられるべきである。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
デバイスであって、
デコーダ
を備え、前記デコーダは、
受信された入力信号から、第１の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力するように構成されたスイッチと
を備えるデバイス。
［Ｃ２］
前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第２の複数のパラメータを生成するのと同時に、前記第１の複数のパラメータを抽出するように構成される、Ｃ１に記載のデバイス。
［Ｃ３］
前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、Ｃ１に記載のデバイス。
［Ｃ４］
前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第１の複数のパラメータを抽出するように構成される、Ｃ１に記載のデバイス。
［Ｃ５］
前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第１の複数のパラメータを符号化する、Ｃ１に記載のデバイス。
［Ｃ６］
前記抽出器は、前記第１の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、Ｃ１に記載のデバイス。
［Ｃ７］
前記抽出器および前記セレクタに結合されたエラー検出器
をさらに備え、前記エラー検出器は、
前記エラー検出データを受信することと、
前記エラー検出データに基づいてエラー出力を生成することと
を行うように構成され、
前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
Ｃ６に記載のデバイス。
［Ｃ８］
前記第１の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
をさらに備え、
ここにおいて、前記有効性データは、前記第１の複数のパラメータおよび前記第２の複数のパラメータに少なくとも部分的に基づき、
前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
Ｃ７に記載のデバイス。
［Ｃ９］
前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第１の複数のパラメータを使用する前記第１のモードを選択するように構成される、Ｃ８に記載のデバイス。
［Ｃ１０］
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第２の複数のパラメータを使用する前記第２のモードを選択するようにさらに構成される、Ｃ９に記載のデバイス。
［Ｃ１１］
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第３のモードを選択するようにさらに構成され、前記スイッチは、前記第３のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、Ｃ９に記載のデバイス。
［Ｃ１２］
前記デコーダは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダである、Ｃ１に記載のデバイス。
［Ｃ１３］
前記予測器は、
分析データに基づいて前記第２の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
前記第１の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
を備える、Ｃ１に記載のデバイス。
［Ｃ１４］
前記第１の複数のパラメータは、線スペクトル周波数（ＬＳＦ）、利得形状、または利得フレームのうちの少なくとも１つを含む、Ｃ１に記載のデバイス。
［Ｃ１５］
前記予測器は、予測利得フレームに基づいて前記第２の複数のパラメータを生成するように構成される、Ｃ１に記載のデバイス。
［Ｃ１６］
前記予測器は、前記第１の複数のパラメータの第１の利得フレームと、前記第２の複数のパラメータの第２の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、Ｃ１５に記載のデバイス。
［Ｃ１７］
前記予測器は、平均線スペクトル周波数（ＬＳＦ）に基づいて前記第２の複数のパラメータを生成するように構成される、Ｃ１に記載のデバイス。
［Ｃ１８］
前記予測器は、前記第１の複数のパラメータの第１のＬＳＦに基づいて前記平均ＬＳＦを調整するようにさらに構成される、Ｃ１７に記載のデバイス。
［Ｃ１９］
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
を行うように構成された出力ジェネレータ
をさらに備える、Ｃ１に記載のデバイス。
［Ｃ２０］
方法であって、
デコーダにおいて、受信された入力信号から第１の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記特定のモードの選択に応答して、前記第１の複数のパラメータまたは前記第２の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
を備える方法。
［Ｃ２１］
前記第２の複数のパラメータは、前記第１の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、Ｃ２０に記載の方法。
［Ｃ２２］
前記第１の複数のパラメータに関連付けられた周期的冗長検査（ＣＲＣ）が無効データを示すと決定することに応答して、前記エラーが検出される、Ｃ２１に記載の方法。
［Ｃ２３］
前記デコーダは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダである、Ｃ２０に記載の方法。
［Ｃ２４］
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
受信された入力信号から第１の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力することと
を備える動作を行わせる、コンピュータ可読記憶デバイス。
［Ｃ２５］
前記動作は、
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードが前記第１のモードまたは前記第２のモードであると決定することに応答して、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
前記特定のモードが前記複数の高帯域モードのうちの第３のモードであると決定することに応答して、
前記出力高帯域部分を生成することを控えることと、
前記出力低帯域部分に基づいて前記出力信号を生成することと
をさらに備える、Ｃ２４に記載のコンピュータ可読記憶デバイス。
［Ｃ２６］
前記動作は、前記第１の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第３のモードを選択することをさらに備える、Ｃ２５に記載のコンピュータ可読記憶デバイス。
［Ｃ２７］
前記動作は、前記第１の複数のパラメータと前記第２の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第３のモードを選択することをさらに備える、Ｃ２５に記載のコンピュータ可読記憶デバイス。
［Ｃ２８］
前記プロセッサは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダへと一体化される、Ｃ２４に記載のコンピュータ可読記憶デバイス。
［Ｃ２９］
装置であって、
受信された入力信号から第１の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力するための手段と
を備える装置。
［Ｃ３０］
前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末（ＰＤＡ）、固定ロケーションデータユニット、またはコンピュータへと一体化される、Ｃ２９に記載の装置。

Claims

デバイスであって、
デコーダ
を備え、前記デコーダは、
受信された入力信号から、第１の複数のパラメータを抽出するように構成された抽出器、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うように構成された予測器、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するように構成されたセレクタ、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力するように構成されたスイッチと
を備えるデバイス。
前記入力信号は、入力ビットストリームに対応し、前記抽出器は、前記予測器が前記第２の複数のパラメータを生成するのと同時に、前記第１の複数のパラメータを抽出するように構成される、請求項１に記載のデバイス。
前記セレクタは、制御入力信号を受信するようにさらに構成され、前記特定のモードは、前記制御入力信号に基づいて選択される、請求項１に記載のデバイス。
前記抽出器は、前記入力信号内の前記低帯域パラメータ情報内に埋め込まれる前記第１の複数のパラメータを抽出するように構成される、請求項１に記載のデバイス。
前記抽出器は、前記入力信号内のウォーターマークを検出するように構成され、前記ウォーターマークは、前記第１の複数のパラメータを符号化する、請求項１に記載のデバイス。
前記抽出器は、前記第１の複数のパラメータに関連付けられたエラー検出データを抽出するようにさらに構成される、請求項１に記載のデバイス。
前記抽出器および前記セレクタに結合されたエラー検出器
をさらに備え、前記エラー検出器は、
前記エラー検出データを受信することと、
前記エラー検出データに基づいてエラー出力を生成することと
を行うように構成され、
前記セレクタは、前記エラー出力に少なくとも部分的に基づいて、前記特定のモードを選択するように構成される、
請求項６に記載のデバイス。
前記第１の複数のパラメータの信頼性を示す有効性データを生成するように構成されたパラメータ有効性チェッカ
をさらに備え、
ここにおいて、前記有効性データは、前記第１の複数のパラメータおよび前記第２の複数のパラメータに少なくとも部分的に基づき、
前記セレクタは、前記有効性データに基づいて前記特定のモードを選択するように構成される、
請求項７に記載のデバイス。
前記セレクタは、前記有効性データが信頼性閾値を満たすこと、かつ、エラーが検出されないと前記エラー出力が示すことを決定することに応答して、前記第１の複数のパラメータを使用する前記第１のモードを選択するように構成される、請求項８に記載のデバイス。
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されると前記エラー出力が示すことを決定することに応答して、前記第２の複数のパラメータを使用する前記第２のモードを選択するようにさらに構成される、請求項９に記載のデバイス。
前記セレクタは、前記有効性データが信頼性閾値を満たさないこと、または、前記エラーが検出されることを前記エラー出力が示すことを決定することに応答して、前記複数の高帯域モードのうちの第３のモードを選択するようにさらに構成され、前記スイッチは、前記第３のモードが選択されると決定することに応答して、いずれの高帯域パラメータも出力しないように構成される、請求項９に記載のデバイス。
前記デコーダは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダである、請求項１に記載のデバイス。
前記予測器は、
分析データに基づいて前記第２の複数のパラメータを生成するために、前記ブラインド帯域幅拡張を行うように構成されたブラインド帯域幅拡張器と、
前記第１の複数のパラメータに少なくとも部分的に基づいて前記分析データを修正するように構成されたチューナと
を備える、請求項１に記載のデバイス。
前記第１の複数のパラメータは、線スペクトル周波数（ＬＳＦ）、利得形状、または利得フレームのうちの少なくとも１つを含む、請求項１に記載のデバイス。
前記予測器は、予測利得フレームに基づいて前記第２の複数のパラメータを生成するように構成される、請求項１に記載のデバイス。
前記予測器は、前記第１の複数のパラメータの第１の利得フレームと、前記第２の複数のパラメータの第２の利得フレームとの比に基づいて、前記予測利得フレームを調整するようにさらに構成される、請求項１５に記載のデバイス。
前記予測器は、平均線スペクトル周波数（ＬＳＦ）に基づいて前記第２の複数のパラメータを生成するように構成される、請求項１に記載のデバイス。
前記予測器は、前記第１の複数のパラメータの第１のＬＳＦに基づいて前記平均ＬＳＦを調整するようにさらに構成される、請求項１７に記載のデバイス。
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
を行うように構成された出力ジェネレータ
をさらに備える、請求項１に記載のデバイス。
方法であって、
デコーダにおいて、受信された入力信号から第１の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記デコーダにおいて、前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記デコーダにおいて、前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記特定のモードの選択に応答して、前記第１の複数のパラメータまたは前記第２の複数のパラメータを前記デコーダの出力ジェネレータに送ることと
を備える方法。
前記第２の複数のパラメータは、前記第１の複数のパラメータに関連付けられたエラーを検出することに応答して選択される、請求項２０に記載の方法。
前記第１の複数のパラメータに関連付けられた周期的冗長検査（ＣＲＣ）が無効データを示すと決定することに応答して、前記エラーが検出される、請求項２１に記載の方法。
前記デコーダは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダである、請求項２０に記載の方法。
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
受信された入力信号から第１の複数のパラメータを抽出すること、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うこと、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択すること、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力することと
を備える動作を行わせる、コンピュータ可読記憶デバイス。
前記動作は、
前記低帯域パラメータに基づいて、出力低帯域部分を生成することと、
前記特定のモードが前記第１のモードまたは前記第２のモードであると決定することに応答して、
前記特定のモードに基づいて、出力高帯域部分を生成することと、
前記出力低帯域部分と前記出力高帯域部分とを組み合せることで出力信号を生成することと
前記特定のモードが前記複数の高帯域モードのうちの第３のモードであると決定することに応答して、
前記出力高帯域部分を生成することを控えることと、
前記出力低帯域部分に基づいて前記出力信号を生成することと
をさらに備える、請求項２４に記載のコンピュータ可読記憶デバイス。
前記動作は、前記第１の複数のパラメータに関連付けられたエラーレートが閾値エラーレートよりも大きいと決定することに応答して前記第３のモードを選択することをさらに備える、請求項２５に記載のコンピュータ可読記憶デバイス。
前記動作は、前記第１の複数のパラメータと前記第２の複数のパラメータとの差分が特定の閾値よりも大きいと決定することに応答して前記第３のモードを選択することをさらに備える、請求項２５に記載のコンピュータ可読記憶デバイス。
前記プロセッサは、エンハンスド適応型マルチレート（ｅＡＭＲ）デコーダへと一体化される、請求項２４に記載のコンピュータ可読記憶デバイス。
装置であって、
受信された入力信号から第１の複数のパラメータを抽出するための手段、ここにおいて、前記入力信号は、符号化されたオーディオ信号に対応する、と、
前記入力信号内の高帯域情報から独立した第２の複数のパラメータを生成することでブラインド帯域幅拡張を行うための手段、ここにおいて、前記第２の複数のパラメータは、前記符号化されたオーディオ信号の高帯域部分に対応し、前記第２の複数のパラメータは、前記入力信号内の低帯域パラメータに対応する低帯域パラメータ情報に基づいて生成され、前記低帯域パラメータは、前記符号化されたオーディオ信号の低帯域部分に関連付けられる、と、
前記符号化されたオーディオ信号の前記高帯域部分の再生のために、複数の高帯域モードから特定のモードを選択するための手段、ここで、前記複数の高帯域モードは、前記第１の複数のパラメータを使用する第１のモードと、前記第２の複数のパラメータを使用する第２のモードとを含む、と、
前記選択された特定のモードに基づいて、前記第１の複数のパラメータまたは前記第２の複数のパラメータを出力するための手段と
を備える装置。
前記抽出するための手段、前記生成するための手段、前記選択するための手段、および前記出力するための手段は、デコーダ、セットトップボックス、ミュージックプレーヤ、ビデオプレーヤ、エンターテイメントユニット、ナビゲーションデバイス、通信デバイス、携帯情報端末（ＰＤＡ）、固定ロケーションデータユニット、またはコンピュータへと一体化される、請求項２９に記載の装置。