JP2016174383A

JP2016174383A - クリティカリティ閾値制御のためのシステム、方法、装置、およびコンピュータ可読媒体

Info

Publication number: JP2016174383A
Application number: JP2016089359A
Authority: JP
Inventors: ベンカテシュ・クリシュナン; Krishnan Venkatesh; ダニエル・ジェイ．・シンダー; J Sinder Daniel; ビベク・ラジェンドラン; Rajendran Vivek
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2012-01-12
Filing date: 2016-04-27
Publication date: 2016-09-29
Anticipated expiration: 2032-12-19
Also published as: US20130185062A1; BR112014017119A2; US20130185084A1; BR112014017120A8; WO2013106181A1; EP2803065B1; SI2803065T1; EP2812895B1; US9047863B2; KR101585367B1; CN104040622A; KR20140111035A; BR112014017120B1; HUE037362T2; TW201338468A; JP5996670B2; ES2621417T3; BR112014017119A8; DK2812895T3; US9053702B2

Abstract

【課題】音声フレーム内の情報のロスに対処するためのシステムおよび方法を提供する。【解決手段】タスクＴ１００は、オーディオ信号内で第２のフレームに先行する第１のフレームのコーディング従属性の推定を計算し、タスクＴ２００は、送信チャネルの状態に関連する情報に基づいて閾値を計算し、タスクＴ３００において、計算された推定と計算された閾値とを比較し、その結果に基づいて、タスクＴ３５０は、第１のフレームの冗長コピーを送信することを決定する。【選択図】図４Ａ

Description

米国特許法第１１９条に基づく優先権の主張
[0001]本特許出願は、２０１２年１月１２日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＢＩＴＡＬＬＯＣＡＴＩＯＮＦＯＲＲＥＤＵＮＤＡＮＴＴＲＡＮＳＭＩＳＳＩＯＮ」と題する仮出願第６１／５８６，００７号の優先権を主張する。本特許出願はまた、２０１２年１月１７日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＣＲＩＴＩＣＡＬＩＴＹＴＨＲＥＳＨＯＬＤＣＯＮＴＲＯＬ」と題する仮出願第６１／５８７，５０７号の優先権を主張する。本特許出願はまた、２０１２年５月１日に出願され、本出願の譲受人に譲渡された「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＰＰＡＲＡＴＵＳ，ＡＮＤＣＯＭＰＵＴＥＲ−ＲＥＡＤＡＢＬＥＭＥＤＩＡＦＯＲＢＩＴＡＬＬＯＣＡＴＩＯＮＦＯＲＲＥＤＵＮＤＡＮＴＴＲＡＮＳＭＩＳＳＩＯＮ」と題する仮出願第６１／６４１，０９３号の優先権を主張する。

[0002]本開示は、オーディオ通信に関する。

[0003]デジタルオーディオ通信は、回線交換ネットワーク上で実行されてきた。回線交換ネットワークは、物理パスが呼の持続時間の間に２つの端末間に確立されるネットワークである。回線交換アプリケーションでは、送信端末が、オーディオ（たとえば、音声）情報を含む一連のパケットを物理パスを介して受信端末に送る。受信端末は、パケット内に含まれるオーディオ情報（たとえば、音声情報）を使用して、対応するオーディオ信号（たとえば、音声信号）を合成する。

[0004]デジタルオーディオ通信は、パケット交換ネットワーク上で実行されるように開始している。パケット交換ネットワークは、パケットが宛先アドレスに基づいてネットワークを介してルーティングされるネットワークである。パケット交換通信を用いて、ルータは、各パケットのためのパスを個別に決定し、その宛先に達するように、任意の利用可能なパスを通して各パケットを送る。その結果、パケットは、同時にまたは同じ順序で受信端末に到達することはない。パケットを元の順序に戻してそれらを連続的逐次方式で送り出す（play out）ために、受信端末内でデジッタバッファが使用され得る。

[0005]時として、パケットは、送信端末から受信端末に伝送中に失われる。失われたパケットは、合成オーディオ信号の品質を劣化させることがある。したがって、フレーム内（たとえば、音声フレーム内）の情報のロスに対処するためのシステムおよび方法を提供することによる利益が実現され得る。

[0006]一般的構成によるオーディオ信号処理の方法は、オーディオ信号内で第２のフレームに先行する第１のフレームに対するオーディオ信号の第２のフレームのコーディング従属性の推定を計算することを含む。この方法はまた、送信チャネルの状態に関連する情報に基づいて閾値を計算することを含む。この方法はまた、計算された推定と計算された閾値とを比較することと、前記比較することの結果に基づいて第１のフレームの冗長コピーを送信することを決定することとを含む。また、特徴を読み取る機械にそのような方法を実行させる有形特徴を有するコンピュータ可読記憶媒体（たとえば、非一時的媒体）が開示される。

[0007]一般的構成によるオーディオ信号処理のための装置は、オーディオ信号内で第２のフレームに先行する第１のフレームに対するオーディオ信号の第２のフレームのコーディング従属性の推定を計算するための手段を含む。この装置はまた、送信チャネルの状態に関連する情報に基づいて閾値を計算するための手段と、計算された推定と計算された閾値とを比較するための手段と、前記比較することの結果に基づいて第１のフレームの冗長コピーを送信することを決定するための手段とを含む。

[0008]別の一般的構成によるオーディオ信号処理のための装置は、オーディオ信号内で第２のフレームに先行する第１のフレームに対するオーディオ信号の第２のフレームのコーディング従属性の推定を計算するように構成された第１の計算器を含む。この装置はまた、送信チャネルの状態に関連する情報に基づいて閾値を計算するように構成された第２の計算器を含む。この装置はまた、（Ａ）計算された推定と計算された閾値とを比較することと、（Ｂ）前記比較することの結果に基づいて第１のフレームの冗長コピーを送信することを決定することとを行うように構成されたモード選択器を含む。

[0009]ネットワークＮＷ１０を介して通信している送信端末１０２および受信端末１０４の一例を示すブロック図。 [0010]様々な端末デバイスを有するネットワークＮＷ１０の実装形態ＮＷ２０のブロック図。 [0011]オーディオエンコーダＡＥ１０の実装形態ＡＥ２０のブロック図。 [0012]フレームエンコーダＦＥ１０の実装形態ＦＥ２０のブロック図。 [0013]一般的構成による方法Ｍ１００のフローチャート。 [0014]方法Ｍ１００の実装形態Ｍ１１０のフローチャート。 [0015]本明細書で説明する、チャネル状態情報と他のシステムパラメータとの間の関係の例を示す図。本明細書で説明する、チャネル状態情報と他のシステムパラメータとの間の関係の例を示す図。 [0016]オーディオ信号の一連のフレームの一例を示す図。 [0017]方法Ｍ１００の実装形態Ｍ１２０のフローチャート。 [0018]タスクＴ２００の実装形態Ｔ２１０のフローチャート。 [0019]方法Ｍ１００の実装形態Ｍ２００のフローチャート。 [0020]方法Ｍ２００の実装形態Ｍ２１０のフローチャート。 [0021]方法Ｍ１１０、Ｍ１２０、およびＭ２１０の実装形態Ｍ３００のフローチャート。 [0022]ＩＰｖ４パケットの図。 [0023]ＩＰｖ６パケットの図。 [0024]通信デバイスＤ１０のブロック図。 [0025]ＲＴＰパケットのペイロードの一例を示す図。 [0026]オーディオデコーダＡＤ１０の実装形態ＡＤ２０のブロック図。 [0027]一般的構成による装置ＭＦ１００のブロック図。 [0028]装置ＭＦ１００の実装形態ＭＦ１１０のブロック図。 [0029]装置ＭＦ１００の実装形態ＭＦ１２０のブロック図。 [0030]装置ＭＦ１００の実装形態ＭＦ２００のブロック図。 [0031]手段Ｆ２００の実装形態Ｆ２１０のブロック図。 [0032]装置ＭＦ１００の実装形態ＭＦ２１０のブロック図。 [0033]装置ＭＦ１１０、ＭＦ１２０およびＭＦ２１０の実装形態ＭＦ３００のブロック図。 [0034]一般的構成による装置ＡＰ１００のブロック図。 [0035]装置ＡＰ１００の実装形態ＡＰ１１０のブロック図。 [0036]第２の計算器Ａ２００の実装形態Ａ２１０のブロック図。 [0037]装置ＡＰ１００の実装形態ＡＰ１２０のブロック図。 [0038]第２の計算器Ａ２００の実装形態の一例Ａ２２０のブロック図。 [0039]装置ＡＰ１００の実装形態ＡＰ２００のブロック図。 [0040]装置ＡＰ１００の実装形態ＡＰ２１０のブロック図。 [0041]装置ＡＰ２１０実装形態ＡＰ２２０のブロック図。 [0042]装置ＡＰ１１０、ＡＰ１２０およびＡＰ２１０の実装形態ＡＰ３００のブロック図。 [0043]ワイヤレスデバイス１１０２のブロック図。 [0044]装置ＡＰ３００の実装形態ＡＰ４００のブロック図。 [0045]ハンドセットＨ１００の正面図と、背面図と、側面図。

[0046]本明細書で開示するシステム、方法および装置は、閾値が音声フレームの再送信の頻度を制御するために使用される音声コーディング適用例のために、チャネル状態に基づいて１つまたは複数のクリティカリティ閾値を調節するように実施され得る。

[0047]文脈によって明確に限定されない限り、「信号」という用語は、本明細書では、ワイヤ、バス、または他の伝送媒体上に表された記憶場所（または記憶場所のセット）の状態を含む、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「発生（generating）」という用語は、本明細書では、計算（computing）または別様の生成（producing）など、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「計算（calculating）」という用語は、本明細書では、複数の値からの計算（computing）、評価、平滑化、および／または選択など、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「得る（obtaining）」という用語は、計算、導出、（たとえば、外部デバイスからの）受信、および／または（たとえば、記憶素子のアレイからの）取り出しなど、その通常の意味のいずれをも示すのに使用される。文脈によって明確に限定されない限り、「選択（selecting）」という用語は、２つ以上のセットのうちの少なくとも１つ、かつすべてよりも少数を識別、指示、適用、および／または使用することなど、その通常の意味のいずれをも示すのに使用される。「備える（comprising）」という用語は、本明細書と特許請求の範囲とにおいて使用される場合、他の要素または動作を除外するものではない。「に基づく」（「ＡはＢに基づく」など）という用語は、（ｉ）「から導出される」（たとえば、「ＢはＡの前の形である」）、（ｉｉ）「少なくとも〜に基づく」（たとえば、「Ａは少なくともＢに基づく」）、および特定の文脈で適当な場合に、（ｉｉｉ）「に等しい」（たとえば、「ＡはＢに等しい」）という場合を含む、その通常の意味のいずれをも示すのに使用される。同様に、「に応答して」という用語は、「少なくとも〜に応答して」を含む、その通常の意味のいずれをも示すのに使用される。別段に規定されていない限り、「Ａ、ＢおよびＣのうちの少なくとも１つ」および「Ａ、ＢおよびＣのうちの１つまたは複数」という用語は、「Ａおよび／またはＢおよび／またはＣ」を示す。

[0048]別段に規定されていない限り、「一連」という用語は、２つ以上のアイテムのシーケンスを示すのに使用される。「対数」という用語は、１０を底とする対数を示すのに使用されるが、他の底へのそのような演算の拡張は本開示の範囲内である。「周波数成分」という用語は、（たとえば、高速フーリエ変換またはＭＤＣＴによって生成される）信号の周波数領域表現のサンプル、あるいは信号のサブバンド（たとえば、バーク尺度またはメル尺度サブバンド）など、信号の周波数または周波数帯域のセットのうちの１つを示すのに使用される。

[0049]別段に規定されていない限り、特定の特徴を有する装置の動作のいかなる開示も、類似の特徴を有する方法を開示する（その逆も同様）ことをも明確に意図し、特定の構成による装置の動作のいかなる開示も、類似の構成による方法を開示する（その逆も同様）ことをも明確に意図する。「構成」という用語は、その具体的な文脈によって示されるように、方法、装置、および／またはシステムに関して使用され得る。「方法」、「処理」、「手順」、および「技法」という用語は、具体的な文脈によって別段に規定されていない限り、一般的、互換的に使用される。複数のサブタスクを有する「タスク」もまた一方法である。「装置」および「デバイス」という用語も、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「要素」および「モジュール」という用語は、一般に、より大きい構成の一部分を示すのに使用される。文脈によって明確に限定されない限り、「システム」という用語は、本明細書では、「共通の目的を果たすために相互作用する要素のグループ」を含む、その通常の意味のいずれをも示すのに使用される。「複数の」という用語は、「２つ以上の」を意味する。また、文書の一部分の参照によるいかなる組込みも、その部分内で参照される用語または変数の定義が、その文書中の他の場所、ならびに組み込まれた部分中で参照される図に現れた場合、そのような定義を組み込んでいることを理解されたい。

[0050]別段の指示がない限り、「コーデック」、「ボコーダ」、「オーディオコーダ」、および「音声コーダ」という用語は、オーディオエンコーダと対応するオーディオデコーダとの組合せを指す。別段の指示がない限り、「コーディング」という用語は、符号化および後続の復号を含めて、コーデックを介するオーディオ信号の転移（transfer）を示す。別段の指示がない限り、「送信」という用語は、送信チャネルへの（たとえば、信号の）伝搬を示す。

[0051]本明細書で説明するコーディング方式は、（たとえば非音声オーディオを含む）任意のオーディオ信号をコーディングするために適用され得る。あるいは、そのようなコーディング方式を音声にのみ使うのが望ましいことがある。そのような場合、そのコーディング方式を分類方式とともに使って、音声信号の各フレームの内容の種類を判定し、適切なコーディング方式を選択することができる。

[0052]本明細書で説明されるコーディング方式は、主要なコーデックとして、またはマルチレイヤ内のレイヤもしくはステージとして、またはマルチステージコーデックとして使われ得る。１つのそのような例では、音声信号の周波数成分の一部（たとえば、低域または高域）をコーディングするのにそのようなコーディング方式が使われ、信号の周波数成分の別の部分をコーディングするのに別のコーディング方式が使われる。別のそのような例では、そのようなコーディング方式は、線形予測コーディング（ＬＰＣ）分析動作の残差など、別のコーディングレイヤの残差（すなわち、元の信号と符号化された信号との間の誤差）であるオーディオ信号をコーディングするために使用される。

[0053]本明細書で説明する方法、システム、および装置は、オーディオ信号を一連のセグメントとして処理するように構成され得る。典型的なセグメント長は約５または１０ミリ秒から約４０または５０ミリ秒にわたり、セグメントは、重複しても（たとえば、隣接するセグメントが２５％または５０％だけ重複する）、重複しなくてもよい。１つの特定の例では、オーディオ信号は、１０ミリ秒の長さをそれぞれ有する一連の重複しないセグメントまたは「フレーム」に分割される。別の特定の例では、各フレームは２０ミリ秒の長さを有する。オーディオ信号に対するサンプリングレートの例は、８、１２、１６、３２、４４．１、４８および１９２キロヘルツを（制限なしに）含む。

[0054]オーディオ通信アプリケーションは、パケット交換ネットワーク内で実装され得る。たとえば、オーディオ通信アプリケーションは、ボイスオーバインターネットプロトコル（ＶｏＩＰ）ネットワーク内で実装され得る。パケットは、符号化されたオーディオ信号の１つまたは複数のフレームを含み、オーディオ（たとえば、音声）情報を有するパケットは、ネットワーク上で第１のデバイスから第２のデバイスに送信され得る。しかしながら、パケットのうちのいくつかは、パケットの送信中に失われることがある。たとえば、複数のパケットのロス（ときに、バースト的パケットロスと呼ばれる）が、受信デバイスにおける知覚的音声品質の劣化の理由となることがある。

[0055]ＶｏＩＰネットワーク内のパケットロスによって引き起こされる知覚的音声品質の劣化を緩和するために、２つのタイプの解法が存在する。第１の解法は、受信側ベースのパケットロス隠蔽（ＰＬＣ：packet loss concealment）手法である。ＰＬＣ法は、ＶｏＩＰ通信におけるパケットロスの影響をマスキングするために使用され得る。たとえば、ＰＬＣ法は、送信中に失われたパケットの代わりに代替パケットを生成するように実施され得る。そのようなＰＬＣ法は、失われたパケットに可能な限り類似するパケットを生成することを試行し得る。受信側ベースのＰＬＣ法は、代替パケットを生成するために、送信側からの追加のリソースまたは支援をまったく必要としない。しかしながら、重要な音声フレームが失われるときは、ＰＬＣ法は、パケットロスの影響をマスキングするには不十分であることがある。

[0056]第２の解法は、送信側ベースのパケットロス復元手法（packet loss resilient approach）である。そのような手法は、各パケットとともにいくつかの追加のデータを送ることを含み得る前方誤り訂正（ＦＥＣ）法を含む。追加のデータは、送信中のデータのロスによって引き起こされる誤りを修復するために使用され得る。たとえば、ＦＥＣ方式は、冗長オーディオフレームを送信し得る。言い換えれば、オーディオフレームの２つ以上のコピー（典型的には２つ）が、送信側によって送信される。これら２つのフレームは、主コピーおよび冗長コピーと呼ばれることがある。

[0057]送信側ベースのパケットロス復元方式は、復号された音声の知覚品質を改善し得るが、これらの方式はまた、音声の送信中に使用される帯域幅を増加させることがある。従来からのＦＥＣ方式はまた、実時間の会話にとって許容できないエンドツーエンド遅延を増加させることがある。たとえば、従来の送信側ベースの方式は、２つ異なる時間期間において２回、同じ音声フレームを送る。この手法は、データレートを少なくとも二倍にする。いくつかの従来の方式は、データレートを低減するために、冗長コピーに対して低ビットレートコーデックを使用することがある。しかしながら、低ビットレートコーデックの使用は、エンコーダの複雑さを増すことがある。加えて、いくつかの従来の方式は、フレームの主コピーとフレームの冗長コピーの両方に対して同じ低ビットレートコーデックを使用することがある。この手法は、エンコーダの複雑さを低減するだけでなく、データレートも低減し得るが、基本的な音声品質（すなわち、フレームが失われないときの音声品質）が、大幅に低下することがある。さらに、従来の送信側ベースの方式は、一般に、少なくとも１つのフレーム間隔の追加の遅延を前提として動作する。

[0058]本明細書で説明するシステム、方法、および装置は、音声品質と、遅延およびデータレートとの間の最適なトレードオフを得るために、ソース制御およびチャネル制御ＦＥＣ方式を提供するように実施され得る。ＦＥＣ方式は、追加の遅延が導入されないように構成され得る。適度のデータレート増の下で音声品質の高い品質改善が達成され得る。本明細書で説明するＦＥＣ方式はまた、任意の目標データレートにおいて動作することができる。一例では、ＦＥＣ方式および目標データレートは、送信チャネルの条件ならびに外部制御に基づいて適応的に調節され得る。提案されるＦＥＣ方式はまた、レガシー通信デバイス（たとえば、レガシーハンドセット）と互換性があるように実施され得る。

[0059]オーディオ（たとえば、音声）通信のためのいくつかのコーデックに対して、各フレームを符号化するのに使用されるビットの総数は、所定の定数である。そのようなコーデックの例には、適応マルチレート（ＡＭＲ）音声コーデック（たとえば、３ＧＰＰ（登録商標）技術仕様（ＴＳ）２６．０７１、バージョン１１．０．０、２０１２年９月、欧州電気通信標準化機構（ＥＴＳＩ）、ｗｗｗ−ｄｏｔ−ｅｓｔｉ−ｄｏｔ−ｏｒｇ、フランス、ソフィア・アンティポリスから入手可能、に記載されている）と、ＡＭＲ広帯域音声コーデック（たとえば、ＩＴＵ−Ｔ勧告Ｇ．７２２．２、２００３年７月、国際電気通信連合、ｗｗｗ−ｄｏｔ−ｉｔｕ−ｄｏｔ−ｉｎｔ、および／または３ＧＰＰ技術仕様２６．１９０ｖ１１．０．０（２０１２年９月）、ＥＴＳＩから入手可能、に記載されている）とが含まれ、ビット数は、フレームに対して選択されたコーディングモードによって決定される。そのような場合には、過去のフレームの冗長コピーを送信することは、現在フレーム内の信号情報をコーディングするために利用可能なビット数において、対応する低減を必要とすることがある。この低減は、復号された音声の知覚品質に悪影響を及ぼすことがある。

[0060]冗長コピーがクリティカルフレームに対してのみ送信される、柔軟性のある手法を実施することが望ましい。「クリティカルフレーム」は、そのロスが、復号された信号の知覚品質に重大な影響を及ぼすことが予測されるフレームである。その上、冗長コピーを現在のフレーム上にピギーバッキングする影響が最小であると予測される場合だけ、そのような冗長コピーを送信することが望ましい。固定ビットレートシステムに対して、現在のフレームをコーディングするために使用されるビット数および過去のフレームの冗長コピー（たとえば、部分コピー）をコーディングするために使用されるビット数の合計が、目標の固定ビットレートＴと適合するように、現在のフレームをコーディングするために使用されるビット数を決定することが望ましい。

[0061]図１は、送信チャネルＴＣ１０およびＲＣ１０を介してネットワークＮＷ１０上で通信する送信端末１０２および受信端末１０４の一例を示すブロック図である。端末１０２および１０４の各々は、本明細書で説明する方法を実行するように、および／または本明細書で説明する装置を含むように実装され得る。送信端末１０２および受信端末１０４は、電話（たとえば、スマートフォン）、コンピュータ、オーディオブロードキャストおよび受信機器、ビデオ会議機器などを含む、音声通信をサポートすることが可能な任意のデバイスであり得る。送信端末１０２および受信端末１０４は、たとえば、符号分割多元接続（ＣＤＭＡ）機能など、ワイヤレス多元接続技術を用いて実装され得る。ＣＤＭＡは、スペクトラム拡散通信に基づく変調および多元接続方式である。

[0062]送信端末１０２はオーディオエンコーダＡＥ１０を含み、受信端末１０４はオーディオデコーダＡＤ１０を含む。オーディオエンコーダＡＥ１０は、人間音声発生モデルに従ってパラメータ値を抽出することによって、第１のユーザインターフェースＵＩ１０（たとえば、マイクロフォンおよびオーディオフロントエンド）からのオーディオ情報（たとえば、音声）を圧縮するために使用され得る。チャネルエンコーダＣＥ１０は、パラメータ値をパケットにアセンブルし、送信機ＴＸ１０は、これらのパラメータ値を含むパケットをネットワークＮＷ１０上で送信し、ＮＷ１０は、送信チャネルＴＣ１０を介する、インターネットまたは企業イントラネットなどのパケットベースネットワークを含み得る。送信チャネルＴＣ１０は、ワイヤードおよび／またはワイヤレス送信チャネルであってよく、チャネルの品質が、いかにしてどこで決定されるかに応じて、ネットワークＮＷ１０のエントリポイント（たとえば、基地局コントローラ）、ネットワークＮＷ１０の別のエンティティ（たとえば、チャネル品質分析器）、および／または受信端末１０４の受信機ＲＸ１０まで延びるものと考えられ得る。

[0063]受信端末１０４の受信機ＲＸ１０は、送信チャネルを介してネットワークＮＷ１０からのパケットを受信するために使用される。チャネルデコーダＣＤ１０は、パラメータ値を得るためにパケットを復号し、オーディオデコーダＡＤ１０は、パケットからのパラメータ値を使用してオーディオ情報を合成する。合成されたオーディオ（たとえば、音声）は、受信端末１０４上の第２のユーザインターフェースＵＩ２０（たとえば、オーディオ出力ステージおよび拡声器）に供給される。図示しないが、様々な信号処理機能が、チャネルエンコーダＣＥ１０およびチャネルデコーダＣＤ１０内で（たとえば、サイクリック冗長検査（ＣＲＣ）機能、インターリービングを含む畳み込みコーディングを）、また、送信機ＴＸ１０および受信機ＲＸ１０内で（たとえば、デジタル変調および対応する復調、スペクトラム拡散処理、アナログデジタル変換およびデジタルアナログ変換を）実行され得る。

[0064]通信に対する各パーティーは、送信だけでなく受信もでき、各端末はオーディオエンコーダＡＥ１０およびデコーダＡＤ１０のインスタンスを含み得る。オーディオエンコーダおよびデコーダは、個別のデバイスであってよく、または「ボイスコーダ」もしくは「ボコーダ」として知られる単一のデバイスに組み込まれてもよい。図１に示すように、端末１０２、１０４は、ネットワークＮＷ１０の一端末におけるオーディオエンコーダＡＥ１０と、他の端末におけるオーディオデコーダＡＤ１０とともに説明されている。

[0065]送信端末１０２の少なくとも１つの構成では、オーディオ信号（たとえば、音声）は、第１のユーザインターフェースＵＩ１０からオーディオエンコーダＡＥ１０にフレームで入力され得、各フレームはサブフレームにさらに区分される。そのような任意のフレーム境界は、何らかのブロック処理が実行される場合に使用され得る。しかしながら、そのようにオーディオサンプルをフレーム（およびサブフレーム）に区分することは、ブロック処理ではなく連続処理が実施される場合は省略され得る。説明する例では、ネットワークＮＷ１０上で送信された各パケットは、特定の適用例および全体的な設計制約に応じて１つまたは複数のフレームを含み得る。

[0066]オーディオエンコーダＡＥ１０は、可変レートまたは単一固定レートのエンコーダであってよい。可変レートエンコーダは、オーディオコンテンツに応じて（たとえば、音声が存在するかどうかおよび／またはどのタイプの音声が存在するかに応じて）、複数のエンコーダモード（たとえば、異なる固定レート）の間でフレームからフレームに動的に切り替え得る。オーディオデコーダＡＤ１０はまた、対応する方式において、対応するデコーダモードの間でフレームからフレームに動的に切り替え得る。受信端末１０４において許容できる信号再生品質を維持しながら、可能な最低のビットレートを各フレームが達成するために、特定のモードが選択され得る。

[0067]受信端末１０４はまた、チャネル状態情報１２０を送信端末１０２にフィードバックすることができる。１つのそのような例では、受信端末１０４は、送信端末１０２からパケットを搬送する送信チャネルの品質に関連する情報を収集するように構成される。受信端末１０４は、収集された情報を使用してチャネルの品質を推定する。次いで、収集された情報および／またはチャネル品質推定は、チャネル状態情報１２０として送信端末１０２にフィードバックされ得る。図１に示すように、たとえば、チャネルエンコーダＣＥ１０のインスタンスＣＥ１１は、（たとえば、オーディオデコーダＡＤ１０から）収集された情報および／または品質推定を、送信機ＴＸ１０のインスタンスＴＸ１１および送信端末１０２に戻る送信チャネルＲＣ１０を介する送信用のパケットにアセンブルし得、送信端末１０２で、パケットは受信機ＲＸ１０のインスタンスＲＸ１１によって受信され、チャネルデコーダＣＤ１０のインスタンスＣＤ１１によって逆アセンブルされ、情報および／または推定がオーディオエンコーダＡＥ１０に供給される。送信端末１０２（たとえば、オーディオエンコーダＡＥ１０）は、チャネル状態情報１２０を使用して、本明細書で説明する送信側ベースのパケットロス復元方式に関連する１つまたは複数の機能（たとえば、クリティカリティ閾値）に適合させ得る。

[0068]図２Ａは、無線アップリンクおよびダウンリンク送信チャネル上で移動局と通信するトランシーバ基地局ＢＴＳ１〜ＢＴＳ３を含むネットワークＮＷ１０の実装形態ＮＷ２０の一例を示す。ネットワークＮＷ２０はまた、公衆交換電話網ＰＳＴＮおよびインターネットＩＮＴに接続されたコアネットワークＣＮＷ１と、やはりインターネットＩＮＴに接続されたコアネットワークＣＮＷ２とを含む。ネットワークＮＷ２０はまた、トランシーバ局をコアネットワークとインターフェース接続する基地局コントローラＢＳＣ１〜ＢＳＣ３を含む。ネットワークＮＷ２０は、端末デバイス間にパケット交換通信を提供するように実施され得る。コアネットワークＣＮＷ１はまた、トランシーバ基地局ＢＴＳ１、ＢＴＳ２を介して端末デバイスＭＳ１とＭＳ２との間、および／またはそのような端末デバイスとＰＳＴＮ上の端末デバイスとの間に回線交換通信を提供し得る。

[0069]図２Ａはまた、ネットワークＮＷ２０を介して（たとえば、パケット交換通信リンク上で）互いに通信し得る異なる端末デバイスの例、すなわち、移動局ＭＳ１〜ＭＳ３、ボイスオーバＩＰ（ＶｏＩＰ）電話ＶＰ、および電気通信プログラム（たとえば、マイクロソフトスカイプ部門、ＬＵからのスカイプソフトウェア）を実行するように構成されるコンピュータＣＰを示す。端末デバイスＭＳ１〜ＭＳ３、ＶＰ、およびＣＰのいずれかは、送信端末１０２のインスタンスと受信端末１０４のインスタンスとを含むように実施され得る。移動デバイスＭＳ１〜ＭＳ３は、ワイヤレス無線アップリンクおよびダウンリンク送信チャネルを介してネットワークと通信する。端末ＶＰおよびＣＰは、ワイヤード送信チャネル（たとえば、イーサネット（登録商標）ケーブル）および／またはワイヤレス送信チャネル（たとえば、ＩＥＥＥ８０２．１１または「ＷｉＦｉ」リンク）を介してネットワークと通信する。ネットワークＮＷ２０はまた、ゲートウェイおよび／またはＴＲＡＵ（トランスコーダおよびレートアダプタユニット）など、中間エンティティを含み得る。

[0070]オーディオエンコーダＡＥ１０は、一般に、入力信号を一連の重複しない時間のセグメントすなわち「フレーム」として処理し、新しい符号化されたフレームが、各フレームに対して計算される。フレーム期間は、概して、信号が局所的に静止していることが予測され得る期間であり、一般的な例は、２０ミリ秒（１６ｋＨｚのサンプリングレートで３２０サンプル、１２．８ｋＨｚのサンプリングレートで２５６サンプル、または８ｋＨｚのサンプリングレートで１６０サンプルに相当）と１０ミリ秒とを含む。また、入力信号を一連の重複するフレームとして処理するようにオーディオエンコーダＡＥ１０を実装することが可能である。

[0071]図２Ｂは、フレームエンコーダＦＥ１０を含むオーディオエンコーダＡＥ１０の実装形態ＡＥ２０のブロック図を示す。フレームエンコーダＦＥ１０は、入力信号の一連のフレームＣＦ（「コアオーディオフレーム」）の各々を符号化して、一連の符号化されたオーディオフレームＥＦのうちの対応する１つを作成するように構成される。オーディオエンコーダＡＥ１０はまた、入力信号をフレームに分割すること、およびフレームエンコーダＦＥ１０に対するコーディングモードを選択すること（たとえば、タスクＴ４００に関して本明細書で説明するように、初期ビット割振りの再割振りを選択すること）など、追加のタスクを実行するように実施され得る。コーディングモード（たとえば、レート制御）を選択することは、音声活動検出（ＶＡＤ）を実行することおよび／またはそれ以外にフレームのオーディオコンテンツを分類することを含むことがある。この例では、オーディオエンコーダＡＥ２０はまた、コアオーディオフレームＣＦを処理して、音声活動検出信号ＶＳ（たとえば、３ＧＰＰＴＳ２６．１９４ｖ１１．０．０、２０１２年９月、ＥＴＳＩで入手可能、に記載されている）を作成するように構成された音声活動検出器ＶＡＤ１０を含む。

[0072]フレームエンコーダＦＥ１０は、一般に、（Ａ）フィルタを記述するパラメータのセット、および（Ｂ）記述されたフィルタを駆動してオーディオフレームの合成された再生を作成するためにデコーダにおいて使用される励振信号、として入力オーディオ信号の各フレームを符号化するソースフィルタモデルに従って実装される。音声信号のスペクトルエンベロープは、一般に、声道（たとえば、喉および口の）の共鳴を表し、ホルマントと呼ばれるピークによって特徴づけられる。たいていの音声コーダは、少なくともこの粗いスペクトル構造をフィルタ係数などのパラメータのセットとして符号化する。残りの残留信号は、フィルタを駆動して音声信号を作成し、一般にその強度およびピッチによって特徴づけられるソース（たとえば、声帯によって作成される）としてモデル化され得る。

[0073]フレームエンコーダＦＥ１０は、一般に、コードブックベース方式（たとえば、コードブック励振線形予測すなわちＣＥＬＰ）および／またはプロトタイプ波形補間（ＰＷＩ）方式（たとえば、プロトタイプピッチ期間すなわちＰＰＰ）を実行するように実施されるが、フレームエンコーダＦＥ１０はまた、他の方式（たとえば、正弦曲線音声コーディングおよび／または変換ベースコーディング）を実行するように実施され得る。符号化されたフレームＦＥを作成するためにフレームエンコーダＦＥ１０によって使用され得る符号化方式の特定の例は、制限なしに、Ｇ．７２６、Ｇ．７２８、Ｇ．７２９Ａ、ＡＭＲ、ＡＭＲ−ＷＢ、ＡＭＲ−ＷＢ＋（たとえば、３ＧＰＰＴＳ２６．２９０ｖ１１．０．０、２０１２年９月（ＥＴＳＩから入手可能）に記載されている）と、ＶＭＲ−ＷＢ（たとえば、第３世代パートナーシッププロジェクト２（３ＧＰＰ２）文書Ｃ．Ｓ００５２−Ａｖ１．０、２００５年４月（www-dot-3gpp2-dot-orgにおいてオンラインで入手可能）に記載されている）と、拡張可変レートコーデック（ＥＶＲＣ：Enhanced Variable Rate Codec、３ＧＰＰ２文書Ｃ．Ｓ００１４−Ｅｖ１．０、２０１１年１２月（www-dot-3gpp2-dot-orgにおいてオンラインで入手可能）に記載されている）と、選択可能モードボコーダ音声コーデック（３ＧＰＰ２文書Ｃ．Ｓ００３０−０，ｖ３．０、２００４年１月（www-dot-3gpp2-dot-orgにおいてオンラインで入手可能）に記載されている）と、拡張型音声サービスコーデック（ＥＶＳ：Enhanced Voice Service codec、たとえば、３ＧＰＰＴＲ２２．８１３ｖ１０．０．０（２０１０年３月）、ＥＴＳＩから入手可能、に記載されている）とを含む。

[0074]図３は、前処理モジュールＰＰ１０と、線形予測コーディング（ＬＰＣ）分析モジュールＬＡ１０と、開ループピッチ探索モジュールＯＬ１０と、適応コードブック（ＡＣＢ：adaptive codebook）探索モジュールＡＳ１０と、固定コードブック（ＦＣＢ：fixed codebook）探索モジュールＦＳ１０と、利得ベクトル量子化（ＶＱ）モジュールＧＶ１０とを含むフレームエンコーダＦＥ１０の基本的実装形態ＦＥ２０のブロック図を示す。前処理モジュールＰＰ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．１節に記載されているように実装され得る。１つのそのような例では、前処理モジュールＰＰ１０は、コアオーディオフレーム（たとえば、１６ｋＨｚから１２．８ｋＨｚまで）のダウンサンプリングすることと、ダウンサンプリングされたフレームを（たとえば、５０Ｈｚの遮断周波数で）ハイパスフィルタ処理することと、フィルタ処理されたフレームのプリエンファシス（たとえば、一次ハイパスフィルタを使用）とを実行するように実装される。

[0075]線形予測コーディング（ＬＰＣ）分析モジュールＬＡＮ１０が、各コアオーディオフレームのスペクトルエンベロープを線形予測（ＬＰ）係数（たとえば、全極型フィルタ１／Ａ（ｚ）の係数）のセットとして符号化する。一例では、ＬＰＣ分析モジュールＬＡ１０は、各２０ミリ秒フレームのホルマント構造を特徴づけるための１６個のＬＰフィルタ係数のセットを計算するように構成される。分析モジュールＬＡ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．２節に記載されているように実装され得る。

[0076]分析モジュールＬＡ１０は、各フレームのサンプルを直接分析するように構成され得、またはサンプルは、最初に、ウィンドウイング関数（たとえば、ハミングウィンドウ）に従って重み付けされ得る。また、分析は、３０ミリ秒ウィンドウなど、フレームよりも大きいウィンドウにわたって実行され得る。このウィンドウは、対称（たとえば、このウィンドウが、２０ミリ秒フレームの直前および直後に５ミリ秒を含むように、５−２０−５）であるか、または非対称（たとえば、このウィンドウが、先行するフレームの最後の１０ミリ秒を含むように、１０−２０）であり得る。ＬＰＣ分析モジュールは、一般に、Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ再帰またはＬｅｒｏｕｘ−Ｇｕｅｇｕｅｎアルゴリズムを使用してＬＰフィルタ係数を計算するように構成される。ＬＰＣ符号化は音声に好適であるが、それはまた、一般的なオーディオ信号（たとえば、音楽などの非音声を含む）を符号化するためにも使用され得る。別の実装形態では、分析モジュールは、ＬＰフィルタ係数のセットの代わりに、各フレームについてケプストラム係数のセットを計算するように構成され得る。

[0077]線形予測フィルタ係数は、一般に、効率的に量子化することが困難であり、通常、量子化および／またはエントロピー符号化のために、線スペクトル対（ＬＳＰ）もしくは線スペクトル周波数（ＬＳＦ）、またはイミッタンススペクトル対（ＩＳＰ）もしくはイミッタンススペクトル周波数（ＩＳＦ）など、別の表示にマッピングされる。一例では、分析モジュールＬＡ１０は、ＬＰフィルタ係数のセットを対応するＩＳＦのセットに変換する。ＬＰフィルタ係数の他の１対１の表現は、ＰＡＲＣＯＲ係数とログ面積比（log-area-ratio）の値とを含む。一般に、ＬＰフィルタ係数のセットとＬＳＦ、ＬＳＰ、ＩＳＦ、またはＩＳＰの対応するセットとの間の変換は可逆であるが、実施形態は、変換が可逆でなく誤差がない分析モジュールＬＡ１０の実装形態をも含む。

[0078]分析モジュールＬＡ１０は、ＩＳＦ（またはＬＳＦもしくは他の係数表示）のセットを量子化するように構成され、また、フレームエンコーダＦＥ２０は、この量子化の結果をＬＰＣインデックスＸＬとして出力するように構成される。そのような量子化器は、一般に、入力ベクトルをテーブルまたはコードブック中の対応するベクトルエントリへのインデックスとして符号化するベクトル量子化器を含む。

[0079]フレームエンコーダＦＥ２０はまた、適応コードブック探索モジュールＡＳ１０においてピッチ分析を簡素化し、閉ループピッチ探索の範囲を縮小するために使用され得る、随意の開ループピッチ探索モジュールＯＬ１０を含む。モジュールＯＬ１０は、量子化されないＬＰフィルタ係数に基づく重み付けフィルタを介して入力信号をフィルタ処理し、重み付けされた信号を２つまで間引きし、（現在のレートに応じて）フレーム当たり１回または２回、ピッチ推定を作成するように実施され得る。モジュールＯＬ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．４節に記載されているように実装され得る。

[0080]適応コードブック（ＡＣＢ）探索モジュールＡＳ１０は、ピッチフィルタの遅延と利得とを作成するために（過去の励振に基づく、「ピッチコードブック」とも呼ばれる）適応コードブックを探索するように構成される。モジュールＡＳ１０は、（たとえば、量子化されたおよび量子化されないＬＰフィルタ係数に基づいて重み付けされた合成フィルタを介してＬＰ残差をフィルタ処理することによって得られるような）目標信号上のサブフレームベースで開ループピッチ推定周りの閉ループピッチ探索を実行し、次いで、示されたわずかなピッチラグにおいて過去の励振を内挿することによって適応コードベクトルを計算し、ＡＣＢ利得を計算するように実装され得る。モジュールＡＳ１０はまた、（特に６４サンプルのサブフレームサイズより小さい遅延に対して）ＬＰ残差を使用して過去の励振バッファを拡大し、閉ループピッチ探索を簡素化するように実装され得る。モジュールＡＳ１０は、（たとえば、各サブフレームに対する）ＡＣＢ利得と、第１のサブフレームのピッチ遅延（または現在のレートに応じて第１および第３のサブフレームのピッチ遅延）および他のサブフレームの相対的ピッチ遅延を示す量子化されたインデックスとを作成するように実装され得る。モジュールＡＳ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．７節に記載されているように実装され得る。

[0081]固定コードブック（ＦＣＢ）探索モジュールＦＳ１０は、適応コードベクトルによってモデル化されない励振の部分を表す固定コードブック（「革新コードブック」、「革新的コードブック」、「確率論的コードブック」、または「代数的コードブック」とも呼ばれる）のベクトルを示すインデックスを作成するように構成される。モジュールＦＳ１０は、コードブックが必要でないように、（たとえば、パルスの位置および符号を表す）ＦＣＢベクトルを再生するのに必要なすべての情報を含むコード語としてコードブックインデックスを作成するように実装され得る。モジュールＦＳ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．８節に記載されているように実装され得る。

[0082]利得ベクトル量子化モジュールＧＶ１０は、各サブフレームに対する利得を含み得るＦＣＢおよびＡＣＢの利得を量子化するように構成される。モジュールＧＶ１０は、たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の５．９節に記載されているように実装され得る。

[0083]コードブックベースの手法の代替として、変換ベースの手法が、ＬＰＣ残留信号を符号化するために使用され得る。たとえば、変形離散コサイン変換（ＭＤＣＴ）は、残差を符号化して、Ｃａｌｌｉｏｐｅ超広帯域コーデック（ＱＵＡＬＣＯＭＭ社、カリフォルニア州サンディエゴ）およびＡＭＲ−ＷＢ＋コーデックのＴＣＸオプションにおけるような、ＭＤＣＴ係数のセットを含むパラメータにするために使用され得る。別の例では、変換ベースの手法は、ＬＰＣ分析を実行することなくオーディオ信号を符号化するために使用される。

[0084]１つまたは複数のパケット交換ネットワーク上で、端末Ａ（たとえば、端末１０２などの送信ユーザ機器すなわちＵＥ）と端末Ｂ（たとえば、端末１０４などの受信ＵＥ）との間の実時間音声通信を実行することが望ましい。ＡＭＲおよびＡＭＲ−ＷＢなど、前の解法は、ビットレートを低減すること（「レート適合」とも呼ばれる）によって悪いチャネル状態に適合する。ＶｏＩＰ（ボイスオーバインターネットプロトコル）で使用するための次世代コーデックに対して、ビットレートの低減は、ネットワーク内の輻輳を十分に低減することを支援し得ない（たとえば、ＲＴＰオーバーヘッドに起因するため。ここで、ＲＴＰは、たとえばＲＦＣ３５５０、基準６４（２００３年７月）、インターネットエンジニアリングタスクフォース（ＩＥＴＦ）に記載の実時間トランスポートプロトコルである）。本明細書で開示する方法は、ボコーダにより大きいロバスト性を与え、および／またはチャネル障害によるコーデック性能問題を解決することができる。

[0085]送信端末Ａから受信端末Ｂへの送信チャネルの品質は、ネットワーク内の１つまたは複数のエンティティによって（たとえば、アップリンク無線チャネルのネットワークの終端におけるトランシーバ基地局によって、コアネットワーク内のトラフィック分析器によって）および／または受信端末Ｂによって（たとえば、パケットロス率を分析することによって）推定され得る。受信端末Ｂおよび／または１つまたは複数のそのようなエンティティが、制御信号（たとえば、ＲＦＣ１８８９（１９９６年１月、ＩＥＴＦ）に記載されているＲＴＰ制御プロトコル（ＲＴＣＰ）を使用する制御パケット）を介して、および／または別のサービス品質（ＱｏＳ）フィードバック機構を介して、帯域内メッセージングを使用して、そのようなチャネル状態情報１２０を送信ＵＥに伝達して戻すことが望ましい。送信端末Ａは、障害のあるチャネルの下で良好な性能のために最適化される動作モード（すなわち、「チャネル認識」モード）に切り替えることによって、そのような情報を適用するように実施され得る。また、送信ＵＥは、悪いチャネル状態が予測され得る（たとえば、管理されないネットワーク）場合、呼設定時にチャネル認識動作モードを選択するように構成され得る。

[0086]ボコーダは、悪いチャネル状態（たとえば、パケットエラー、高いジッタなど）の表示に応答して、「チャネル障害ロバストモード」に切り替えるように実施され得る。「チャネル障害ロバストモード」において、音声コーデックは、入力信号のいくつかのクリティカルフレームを、部分的または全体的のいずれかで再送信することを選択することができる。たとえば、「チャネル障害ロバストモード」で動作する音声コーダは、フレームのクリティカリティが一定の所定の閾値を超える場合、フレームの冗長コピーを送信するように構成され得る。特定のフレームのクリティカリティは、そのフレームのロスが、エンコーダで推定されるときに復号された音声に及ぼす知覚的影響の関数として決定され得る。チャネル認識コーデックは、チャネル状態の表示に応答して、チャネル障害ロバストモードと正常な動作モード（すなわち、冗長コピーは送られない）との間を切り替えるように構成され得る。

[0087]本明細書で開示するシステム、方法、および装置は、再送信決定に対する閾値を、チャネル品質推定の関数として設定するように実施され得る。この閾値は、たとえば、フレームが、オーディオ信号の後続フレームのコーディングに関してクリティカルであるかどうかを判断するために使用され得る。非常に良好なチャネルに対して、閾値は非常に高く設定され得る。チャネル品質が劣化するにつれて、閾値は引き下げられて、より多くのフレームがクリティカルであると見なされるようなる。

[0088]図４Ａは、タスクＴ１００と、Ｔ２００と、Ｔ３００と、Ｔ３５０とを含む、一般的構成によってオーディオ信号Ｍ１００を処理する方法のフローチャートを示す。タスクＴ１００は、オーディオ信号内で第２のフレームに先行する第１のフレーム（「モデル」フレーム、潜在的に「クリティカル」フレーム）上のオーディオ信号の第２のフレーム（「従属」フレーム）のコーディング従属性の推定を計算する。タスクＴ２００は、送信チャネルの状態に関連する情報に基づいて閾値を計算する。タスクＴ３００は、計算された推定と計算された閾値とを比較する。タスクＴ３００における比較することの結果に基づいて、タスクＴ３５０は、第１のフレームの冗長コピーを送信することを決定する。冗長フレームを送信することを決定することは、第１のフレームがクリティカルフレームであることを示すことを含み得る。いくつかの場合、方法Ｍ１００は、フレームを再送信するか否かを判断するために、追加の符号化遅延が必要でないように実施され得る。

[0089]従属フレームもまたクリティカルフレーム（すなわち、それに後続する別のフレームに対してクリティカル）となる尤度を低減することが望ましい。一般に、この尤度は、モデルフレームの直後にくるフレームに対して最高であり、後続の諸フレームに対して急速に低下する。有声音声に対して、トークスパートにおけるオンセットフレームがクリティカルであること、およびそれの直後にくるフレームもまた、（たとえば、オンセットフレームが失われた場合にカバーするために）クリティカルであることが一般的である。しかしながら、トークスパートにおける別のフレームが（たとえば、ピッチラグ（pitch lag）が変動する場合に）クリティカルとなることも起こり得る。

[0090]フレームオフセットｋは、モデルフレームと従属フレームとの間の距離を示すために使用され得る。そのような一例では、フレームオフセットｋの値は、モデルフレームｎと従属フレーム（ｎ＋ｋ）との間のフレーム数の差（たとえば、介在するフレームの数より１多い）である。図５Ｃは、ｋの値が３である典型的な例を示す。別の例では、ｋの値は４である。他のあり得る値は、１、２、３、５、および５より大きい整数を含む。

[0091]方法Ｍ１００は、（たとえば、システム実装の間または呼設定の間）オフセットｋが固定されるように実施され得る。ｋの値は、元の時間領域信号および最大許容遅延内の（たとえば、ミリ秒の単位の）フレームの長さに従って選択され得る。たとえば、ｋの値は、（たとえば、フレーム遅延を制限するために）最大許容値によって制約され得る。最大許容遅延が８０または１００ミリ秒の値を有することが望ましい。そのような場合、ｋは、２０ミリ秒フレームを使用するスキームに対して４もしくは５の最大値、または１０ミリ秒フレームを使用するスキームに対して８、９もしくは１０の最大値を有し得る。

[0092]オフセットｋの値はまた、（たとえば、受信機からのフィードバックによって示される）チャネル状態に従って、呼の間に選択されおよび／または更新され得る。たとえば、連続するフレームの頻繁なロスを（たとえば、長いフェードによって）引き起こしている環境において、より大きいｋの値を使用することが望ましい。

[0093]タスクＴ１００が、モデルフレームおよび／または従属フレームの概略的特性評価から特定のロス影響評価までに及ぶ１つまたは複数の規準に基づいて、従属フレームのモデルフレームに対するコーディング従属性の推定（「クリティカリティ尺度」とも呼ばれる）を計算するように実施され得る。そのような推定は、モデルフレームおよび／または従属フレーム内の情報に基づいてよく、また、入力信号内のモデルフレームに隣接する１つまたは複数のフレームからの情報に基づいてもよい。

[0094]クリティカルフレームは、失われたときに、重大な品質劣化を引き起こすことがあるフレームであってよい。異なるモデルフレームは、異なるレベルのクリティカルな状態を有し得る。たとえば、２つのモデルフレームｎ１およびｎ２に対して、フレーム（ｎ１＋１）（すなわち、フレームｎ１の次のフレーム）がフレームｎ１から高度に予測可能であり、フレーム（ｎ２＋１）（すなわち、フレームｎ２の次のフレーム）がフレームｎ２にまったく依存しない場合、フレームｎ１を失うことが２つ以上のフレームにわたって品質劣化を引き起こすことがあるので、フレームｎ１はフレームｎ２よりクリティカルであり得る。

[0095]タスクＴ１００は、モデルフレームのコーディングタイプ（すなわち、フレームを符号化するために使用されるコーディングプロセス）、および場合によっては従属フレームおよび／またはモデルフレームに隣接する１つまたは複数のフレームの各々のコーディングタイプの表示に基づいて、コーディング従属性の推定を計算するように実施され得る。そのようなコーディングタイプの例は、コード励起線形予測（ＣＥＬＰ：code excited linear prediction）、雑音励起線形予測（ＮＥＬＰ：noise excited linear prediction）、プロトタイプ波形補間（ＰＷＩ：prototype waveform interpolation）、またはプロトタイプピッチ周期（ＰＰＰ：prototype pitch period）を含み得る。この規準の下で、たとえば、ＣＥＬＰモデルフレームは、ＮＥＬＰモデルフレームよりクリティカルであると見なされ得る。

[0096]追加または代替として、タスクＴ１００は、モデルフレームの音声モード（すなわち、フレームの音声コンテンツの分類）、および場合によっては従属フレームおよび／またはモデルフレームに隣接する１つまたは複数のフレームの各々の音声モードに基づいて、コーディング従属性の推定を計算するように実施され得る。音声モードの例は、有声と、非有声と、沈黙と、過渡的とを含み得る。「有声」の分類は、さらに、オンセットと静止とに分割され得る。過渡的の分類は、さらに、オントランジェント（on-transient）とオフトランジェント（off-transient）とに分割され得る。トークスパート内の後続フレームの符号化は、オンセットフレーム内の情報に大きく依存することがあるので、この規準の下で、たとえば、音声オンセットフレーム（トークスパート内の初期フレーム）は、静止有声フレームよりもクリティカルであり得る。一例では、タスクＴ１００は、モデルフレームが音声オンセットフレームであり、従属フレームが静止有声フレームであることの表示に応答して高度の依存を示すために、コーディング従属性の推定を計算するように実施される。

[0097]追加または代替として、タスクＴ１００は、モデルフレームの（および場合によっては従属フレームおよび／またはモデルフレームに隣接する１つまたは複数のフレームの各々の）１つまたは複数の他の特性に基づいて、コーディング従属性の推定を計算するように構成され得る。たとえば、モデルフレームに対するいくつかの重要なパラメータの値が前のフレームに対する対応する値と著しく（たとえば、何らかの所定の閾値より大きく）異なる場合、モデルフレームは、モデルフレームの前のフレームから容易に予測され得ず、モデルフレームのロスは、前のフレームよりもモデルフレームにより類似する後続フレームに悪影響を及ぼすことがあるので、モデルフレームはクリティカルフレームであり得る。

[0098]そのような特性の１つの例は、適応コードブック（ＡＣＢ）利得である。モデルフレームに対する低ＡＣＢ利得値は、そのフレームが、そのフレームに先行するフレームと著しく異なることを示し得る一方で、従属フレームに対する高ＡＣＢ利得値は、そのフレームが、モデルフレームに非常に従属していることを示し得る。図４Ｂに、タスクＴ５０とＴ６０とを含む方法Ｍ１００の実装形態Ｍ１１０のフローチャートを示す。タスクＴ５０は、モデルフレームからの情報（たとえば、励振信号）を使用して、従属フレームに対する適応コードベクトルを生成し、タスクＴ６０は、従属フレームの符号化されたバージョンに対するＡＣＢ利得値を計算する。この例では、タスクＴ１００は、少なくとも計算されたＡＣＢ利得値に基づいてコーディング従属性の推定を計算するように実施される。

[0099]そのような特性の別の例は、この場合は、

として表現され得る、知覚的に重み付けされたＳＮＲ（信号対雑音比）である。

ここで、Ｌはサンプル内のフレーム長であり、ｃはモデルフレームｎの復号されたバージョンを知覚的に重み付けするフィルタＷ（ｚ）でフィルタ処理することによって得られる知覚的に重み付けされた信号であり、ｅは知覚的に重み付けされた誤りである。誤りｅは、たとえば、（Ａ）Ｗ（ｚ）フィルタ処理されたモデルフレームｎの復号バージョンと（Ｂ）Ｗ（ｚ）フィルタ処理された、フレームｎの誤り隠蔽（error-concealed）バージョン（すなわち、フレームはデコーダで利用可能ではないものと仮定する）との間の差として計算され得る。誤り隠蔽バージョンは、フレーム誤り隠蔽アルゴリズムに従って前のフレームからの情報に基づいて計算され得る。たとえば、誤り隠蔽バージョンは、３ＧＰＰ
ＴＳ２６．０９１、ｖ．１１．０．０（２０１２年９月、「Ｅｒｒｏｒｃｏｎｃｅａｌｍｅｎｔｏｆｌｏｓｔｆｒａｍｅｓ」、ＥＴＳＩから入手可能）に記載されている手順に従って計算され得る。一例では、Ｗ（ｚ）＝Ａ（ｚ／γ）Ｈ（ｚ）であり、ここで、

であり、ａ₁〜ａ_pはモデルフレームｎに対するＬＰＣフィルタ係数であり、γ＝０．９２であり、Ｈ（ｚ）＝１／（１−０．６８ｚ^-1）である。代替例では、誤りｅは、フィルタＷ（ｚ）を、復号バージョンと誤り隠蔽バージョンとの間の差に適用することによって計算される。

[00100]追加または代替として、タスクＴ１００は、コーディング従属性の推定を、モデルフレームのロスが１つまたは複数の後続フレーム（たとえば、従属フレーム）のコーディング品質に及ぼす影響の推定として計算するように構成され得る。たとえば、クリティカリティ尺度は、従属フレームおよび場合によってはモデルフレームに後続する１つまたは複数の他のフレームの符号化バージョンからの情報（たとえば、モデルフレームおよび／または後続フレームのうちの１つまたは複数、の適応コードブック利得）に基づくことができる。追加または代替として、そのような尺度は、従属フレームおよび場合によってはモデルフレームに後続する１つまたは複数の他のフレームの各々の復号バージョンの情報（たとえば、復号バージョンの知覚的に重み付けされたＳＮＲ）に基づくことができ、ここで、従属フレームおよび／または他の後続フレームは、モデルフレームの情報を使用せずに符号化されていた。

[00101]モデルフレームｎに対する従属フレーム（ｎ＋ｋ）のそのような尺度の一例は、

として表現され得、ここで、Ｌはサンプル内のフレーム長であり、ｃは従属フレーム（ｎ＋ｋ）の復号バージョンを知覚的に重み付けするフィルタＷ（ｚ）でフィルタ処理することによって得られる知覚的に重み付けされた信号であり、ｅは知覚的に重み付けされた誤りである。誤りｅは、この場合、たとえば、（Ａ）モデルフレームｎのロスなしにＷ（ｚ）フィルタ処理された従属フレーム（ｎ＋ｋ）の復号バージョンと（Ｂ）モデルフレームｎの誤り隠蔽バージョンを仮定してＷ（ｚ）フィルタ処理されたフレーム（ｎ＋ｋ）の復号バージョンとの間の差として計算され得る。フィルタＷ（ｚ）は、従属フレーム（ｎ＋ｋ）に対するＬＰＣフィルタ係数を使用して上記で説明したように計算され得る。代替例では、誤りｅは、フィルタＷ（ｚ）を、従属フレーム（ｎ＋ｋ）の、正常に復号されたバージョンとロスを仮定して復号されたバージョンとの間の差に適用することによって計算される。

[00102]タスクＴ２００が閾値を計算するために使用する情報は、以下の尺度、すなわち、パケットロス率、パケットロス比、予測されるパケット数、ロス率毎秒、受信されたパケットカウント、ロス推定妥当性（たとえば、間隔に対して予測されるパケット数など、サンプルサイズの尺度に基づく重み尺度）、見かけのスループット、およびジッタのうちの１つまたは複数を含み得、それらは、一連の時間間隔の各々に対して更新され得る。上述のように、受信機および／または（たとえば、送信チャネルに沿った）ネットワーク内の他のエンティティは、制御信号（ＲＴＣＰメッセージングが１つのそのような制御シグナリング方法の一例である）を介して、および／または別のサービス品質（ＱｏＳ）フィードバック機構を介して、帯域内メッセージングを使用して、そのようなチャネル状態情報１２０を送信ＵＥに伝達して戻すように構成され得る。ＲＴＣＰメッセージング（たとえばＩＥＴＦ仕様ＲＦＣ３５５０に規定される、実時間トランスポート制御プロトコル）を介して提供され得る情報の例は、送信されたオクテットカウントと、送信されたパケットカウントと、予測されるパケットカウントと、失われたパケットの数および／または比率と、ジッタ（たとえば、遅延における変動）と、ラウンドトリップ遅延とを含む。図６Ａは、本明細書で説明するチャネル状態情報を受信するタスクＴ７０を含む方法Ｍ１００の実装形態Ｍ１２０のフローチャートを示す。

[00103]タスクＴ２００はまた、送信チャネルの状態に関連する情報１２０に基づいて、２つ以上の閾値を計算するように構成され得る。そのような場合、決定タスクＴ３００は、フレーム（および／または１つまたは複数の隣接フレーム）からの情報を使用して、適切な更新された閾値を選択するように構成され得る。たとえば、１つのクリティカリティ閾値を使用して、音声を含むものと判断されるフレームを再送信するかどうかを判断し、別のクリティカリティ閾値を使用して、雑音を含むものと判断されるフレームを再送信するかどうかを判断することが望ましい。別の例では、過渡的（たとえば、オンセット）および静止的音声フレームに対して、ならびに／あるいは有声音声フレームおよび無声音声フレームに対して、異なる閾値が使用される。２つ以上のクリティカリティ閾値が使用される場合に対して、タスクＴ２００は、モデルフレームに対して使用されるべき閾値に対応するクリティカリティ尺度を、２つ以上のクリティカリティ尺度の中から選択するように構成され得る。

[00104]Ｔ３００は、計算された推定と計算された閾値とを比較するように構成される。タスクＴ３５０は、比較の結果に基づいてモデルフレームの冗長コピーを送信するかどうかを決定する。たとえば、タスクＴ３００は、計算された推定が計算された閾値を超える（代替として、よりも小さくない）ときに再送信することを決定するように実施され得る。

[00105]方法Ｍ１００は、従属フレームがアクティブ音声フレームであるときだけ、タスクＴ３５０（および場合によってはタスクＴ１００および／またはＴ２００）が実行されるように実施され得る。代替として、方法Ｍ１００は、潜在的クリティカルフレームとして非音声フレームを考慮するように実施され得る。一般に、双方向の会話では、各当事者は、しばらくの間話をし、その間に通信システムは当事者の音声を（たとえば、その時間の半分未満で）送信し、他の時間の間休止し、その間に通信システムは沈黙または背景雑音を送信する。沈黙（または背景雑音）期間中の希発送信または不連続送信（ＤＴＸ）は、会話の知覚品質にほとんど影響を及ぼさないが、セル内／セル間干渉を低減し（したがって、システム能力を潜在的に向上させ）、会話に使用されるモバイルユニットのバッテリー電源を節約する利益をもたらす。

[00106]一般的なＤＴＸ方式は、音声活動検出（ＶＡＤ）を使用する音声エンコーダによって実現される。ＶＡＤを使用して、エンコーダは、背景雑音からアクティブ音声を区別することができる。エンコーダは、各アクティブ音声セグメント（一般に２０ｍｓの長さ）を送信のための目標ビットレートパケットで符号化し、クリティカルな背景雑音セグメント（やはり一般に２０ｍｓの長さ）を比較的小さいサイズのパケットで表す。この小さいパケットは、沈黙を示す沈黙記述子（ＳＩＤ）であってよい。クリティカル背景雑音セグメントは、トークスパートに直ちに続く背景雑音セグメント、またはその特性がそれの前の雑音セグメントと著しく異なる背景雑音セグメントであり得る。他のタイプの背景雑音セグメント（または非クリティカル背景雑音セグメント）は、ゼロビットで表示されるか、削除される（blanked）か、送信されないか、または送信を抑制されることがある。出力パケットのそのようなパターン（すなわち、アクティブセグメント、次にクリティカル背景雑音セグメント、次に非クリティカル背景雑音セグメント）が、純粋に音声エンコーダの入力、またはソースに依存するとき、そのようなＤＴＸ方式は、ソース制御ＤＴＸ方式と呼ばれる。

[00107]図５Ａおよび図５Ｂは、チャネル状態情報、その情報に基づくクリティカリティ閾値、および再送信の決定がもたらされる尤度の間の関係の例を示す。図５Ｂの例では、報告されたチャネル品質は、図５Ａの報告されたチャネル品質より低い。したがって、図５Ｂのクリティカリティ閾値は、図５Ａのクリティカリティ閾値より選択性が小さく、再送信の決定がもたらされる尤度は、より高い。報告されるチャネル品質が低くなりすぎると、再送信の決定がもたらされる尤度は、高くなりすぎることがある。

[00108]方法Ｍ１００を実施して再送信され得るフレームの数または割合を制限することが望ましい。たとえば、悪いチャネル状態の下で元の音声コーディング品質を保存する性能を改良すること、および／または過度に包括的なクリティカリティ判断によってトリガされ得る再送信による能力ロスを阻むことをバランスさせることが望ましい。

[00109]再送信頻度を制限するための１つの手法は、閾値が、低いキャップ値（low cap value）（すなわち、低い境界値、またはフロア値）の影響を受けるようにタスクＴ２００を実施することであり、キャップ値が、フレームが再送信され得る数に対する制限を設定する。たとえば、タスクＴ２００は、計算される閾値に対して最小値を強制するように実施され得る。図６Ｂに、サブタスクＴ２１０ａと、Ｔ２１０ｂと、Ｔ２１０ｃとを含むタスクＴ２００のそのような実装形態Ｔ２１０のフローチャートを示す。タスクＴ２１０ａは、本明細書で説明するように（すなわち、チャネル状態情報に基づいて）候補閾値を計算する。タスクＴ２１０ｂは、計算された候補閾値と、境界値（たとえば、低いキャップ値）とを比較する。この比較の結果に基づいて、タスクＴ２１０ｃは、（Ａ）計算された候補閾値および（Ｂ）境界値の中の一方を選択し、それにより、タスクＴ２１０は、計算された閾値として選択された値を作成する。たとえば、タスクＴ２１０ｃは、計算された候補値が境界値より大きい（代替として、より小さくはない）場合に計算された候補値を選択し、そうでない場合に境界値を選択するように実施され得る。そのような様式で、タスクＴ２１０は、計算された閾値がキャップ値を超える部分をクリップするように構成され得る。タスクＴ２１０はまた、比較が失敗すると（たとえば、クリッピングが発生すると）、タスクＴ２１０はそのような状態を、（たとえば、状態を記録すること、状態を基地局に報告すること、および／または別の是正措置を実行することのために）別のモジュールに示すように構成され得る。

[00110]もちろん、代替として、クリティカリティ尺度の計算された値がクリティカリティに逆比例するようにタスクＴ１００を実施することも可能である。そのような場合には、タスクＴ３５０は、クリティカリティ尺度が計算された閾値より低い（代替として、超えることができない）ときにフレームを再送信することを決定するように構成されてよく、タスクＴ２１０は、計算された閾値と高いキャップ値（すなわち、高い境界値、または天井値）とを比較（および場合によってはクリップ）するように構成され得る。

[00111]図７Ａに、タスクＴ４００を含む方法Ｍ１００の実装形態Ｍ２００のフローチャートを示す。タスクＴ４００は、モデルフレームの冗長コピーを作成する。冗長コピーは、一般に、符号化された信号（すなわち、正常に符号化されたモデルフレームのコピー）でのモデルフレームの主コピーより少ないビット数を有し、主コピーの部分的または全体的ロスによってもたらされる誤りを訂正するための前方誤り訂正（ＦＥＣ）動作を実行するために、デコーダによって使用され得る。タスクＴ４００は、決定タスクＴ３５０の前に、または代替として冗長コピーを送信することをタスクＴ３５０によって決定されることに応答して、冗長コピーを作成するように実施され得る。

[00112]一般に、冗長コピーが、後続フレームを復号するために使用され得る良好な基準（たとえば、良好な適応コードブック）を提供することが望ましい。モデルフレームの冗長コピーは、モデルフレームの主コピーのパラメータの一部またはすべてを含み得る。タスクＴ４００は、モデルフレームの主コピーの縮小バージョンとして冗長コピーを作成するように実施され得る。たとえば、主コピーは、周波数エンベロープ情報（たとえば、ＬＰＣまたはＭＤＣＴ係数）および／またはテンポラルエンベロープ情報（たとえば、固定コードブックインデックス、固定コードブック利得、適応コードブック利得、ピッチラグ、および／またはＣＥＬＰコーデックに対するピッチ利得；プロトタイプパラメータおよび／またはＰＷＩまたはＰＰＰコーデックに対するピッチ情報）などの構成要素を含むモデルフレームの符号化されたバージョンであってよい。タスクＴ４００は、１つまたは複数のそのような構成要素の各々の一部または全部のコピーを含む冗長コピーを作成するように実施され得る。たとえば、タスクＴ４００は、量子化されたＬＰＣフィルタパラメータおよび／または量子化されたテンポラルエンベロープ（たとえば、励振信号）パラメータを識別する１つまたは複数のコードブックインデックスを含む冗長コピーを作成するように実施され得る。

[00113]そのような場合には、タスクＴ４００は、すでに計算されているモデルフレームの主コピーの構成要素を使用して（たとえば、複製および／または圧縮して）冗長コピーをアセンブルするように実施され得る。タスクＴ４００は、ビット制約を満足するような方式で、またはレート制約に関連する構造に従って冗長コピーを作成するように実施され得る。そのような構造は、フレームに対してまたはフレームの１つまたは複数のサブフレームの各々に対して、上述のパラメータ（すなわち、ＬＰＣフィルタ情報、ピッチ遅延、固定／適応コードブックインデックス／利得など）などの複数のパラメータの各々に対して、指定されたビット数を含み得る。

[00114]追加または代替として、タスクＴ４００は、モデルフレームの主コピーを作成するために使用されものとは異なるコーディング方法を使用してモデルフレームを符号化することによって、冗長コピーの一部または全部を作成するように実施され得る。そのような場合には、この異なるコーディング方法は、一般に、モデルフレームの主コピーを作成するために使用される方法（たとえば、低次のＬＰＣ分析を使用する、広帯域コーデックではなく狭帯域コーデックを使用する、など）より低いレートを有する。そのような異なるコーディング方法は、異なるビットレートおよび／または異なるコーディング方式であってよい（たとえば、主コピーに対するＣＥＬＰおよび冗長コピーに対するＰＰＰまたはＰＷＩ）。一例では、タスクＴ４００は、フレームエンコーダ（たとえば、フレームエンコーダＦＥ２０）にモデルフレームと、（たとえば、ビット数としてまたはビットレートとして）示された割振りＮ_mとを供給するように実施される。

[00115]冗長コピーのサイズは、ビット数としてまたはビットレートとして示され得、固定型または適応型であってよい。一例では、冗長コピーのサイズは、オーディオ信号内でモデルフレームに後続し、オーディオ信号上に冗長コピーがピギーバックされるべきフレーム（「キャリア」フレーム）に対する初期ビット割振りＴの再分配の一部として示される。キャリアフレームは、従属フレームと同じであってよく、または従属フレームおよびキャリアフレームが異なることができるように、方法Ｍ２００が実施されてもよい。Ｔの値に対する特定の例は、２５３ビット（たとえば、１２．６５ｋｂｐｓ（キロビット毎秒）のビットレートおよび２０ミリ秒のフレーム長に対応する）と、１９２ビット（たとえば、９．６ｋｂｐｓのビットレートおよび２０ミリ秒のフレーム長に対応する）とを含む。

[00116]１つのそのような場合、選択された再割振り分配Ｎ_mは、キャリアフレームに対する初期ビット割振りＴを、モデルフレームの冗長コピーへのＮ_mビットの割振りとキャリアフレームのコピーへの（Ｔ−Ｎ_m）ビットの割振りとに分離することを示す。Ｔビットの割振りの分配のセットの中の１つの選択が、選択されたキャリアフレームのビットレートの変更、およびモデルフレームの冗長コピーを符号化するための低ビットレート方式の選択として実施され得る。たとえば、Ｔビットの割振りを、モデルフレームの冗長コピーを搬送するためのサイズＮ_mビットの部分とキャリアフレームの主コピーを搬送するためのサイズ（Ｔ−Ｎ_m）ビットの部分として分配すること（ここで、Ｔ＝２５３およびＮ_m＝６１）が、キャリアフレームのビットレートを１２．６５ｋｂｐｓの開始ビットレートから９．６ｋｂｐｓの低減されたビットレートに変更することと、既存の９．６ｋｂｐｓ方式に従ってキャリアフレームを符号化することと、モデルフレームの冗長コピーを符号化するために３．０５ｋｂｐｓ方式を使用することとによって、（たとえば、ＡＭＲコーデック内で）実施され得る。

[00117]各冗長符号化が分配のセットの中の異なる分配に対応する冗長符号化に対して、いくつかのそのような低ビットレート方式を実施することが望ましい。他の開始ビットレートの例は、８．８５、８．５５、６．６、６．２、４、２．７、および２ｋｂｐｓを含み、それらは、それぞれ、（たとえば、２０ミリ秒のフレーム長に対して）１７７、１７１、１３２、１２４、８０、５４および４０のＴの値に対応する。他の開始ビットレートのさらなる例は、２３．８５、２３．０５、１９．８５、１８．２５、１５．８５、１４．２５、および１２．６５ｋｂｐｓを含み、それらは、それぞれ、（たとえば、２０ミリ秒のフレーム長に対して）４７７、４６１、３９７、３６５、３１７、２８５および２５３のＴの値に対応する。フレームは、たとえば、（たとえば、ＣＥＬＰコーディングモデルを使用して）本明細書で参照されるＡＭＲ−ＷＢコーデックのリリース１０に記載されている、そのようなレートに従って符号化され得る。

[00118]タスクＴ４００は、キャリアフレームの圧縮率の尺度の値に従って、冗長コピーのサイズを選択する（たとえば、Ｔの特定の再割振りを選択する）ように実施され得る。たとえば、そのようなタスクは、高い圧縮率を示す値に応答して冗長コピーに対してより大きいサイズを選択すること（たとえば、対応する再割振りを選択すること）と、低い圧縮率を示す値に応答して冗長コピーに対してより小さいサイズを選択すること（たとえば、対応する再割振りを選択すること）とを行うように構成され得る。圧縮率の静的尺度の一例は、キャリアフレームのサブフレームの、互いに対する相関（たとえば、サブフレームのすべての可能なラグ値およびすべての対（またはすべての隣接する対））にわたる最大相関、またはサブフレームの各対に対する（または各隣接する対に対する）すべての可能なラグ値にわたる最大相関の平均値）として計算され得る開ループメトリックである。圧縮率の動的尺度の一例は、複数の冗長コピーサイズ候補および／またはキャリアフレーム候補の各々に対して、キャリアフレームの知覚品質における関連する変化（たとえば、減少）の尺度を示す閉ループメトリックである。たとえば、そのようなメトリックは、（Ａ）すべての初期ビット割振りＴを使用して符号化されるときのキャリアフレームの知覚品質の尺度と（Ｂ）冗長コピーサイズ候補が加えられた後に残留する初期ビット割振りの部分だけを使用して符号化されるときのキャリアフレームの知覚品質の尺度との差（たとえば、絶対値の差）または比として計算され得る。

[00119]タスクＴ４００は、選択された再割振り候補に従って後続フレームに対する初期ビット割振りＴを第１の部分と第２の部分とに再割振りすることと、キャリアフレームのコピーを第１の部分に符号化することと、モデルフレームの冗長コピーを第２の部分に符号化することとを含み得る。タスクＴ４００は、（たとえば、再割振り決定メトリック計算に対する入力パラメータとして）再割振り候補の選択の前に、または再割振り候補の選択に応答して、キャリアフレームのコピーを作成するように実施され得る。

[00120]固定ビットレート方式に対して本明細書で説明する原理の適用例は上記のとおりである（たとえば、各フレームは同じ初期ビット割振りＴを受信する）が、Ｔビットの全フレーム割振りがフレームごとに変わり得る方式に対して、そのような原理を適用することも可能である。たとえば、キャリアフレームを符号化するために利用可能なビット数Ｔは、キャリアフレームが音声または雑音を含むかどうか、またはキャリアフレームが有声音声または無声音声を含むかどうか、などに従って変化し得る。

[00121]冗長コピーを符号化するためにビットを再割振りすることの追加または代替として、悪いチャネル状態の下で、クリティカルフレームの冗長コピーを符号化するために使用されるビット数を増加させることが望ましい。チャネル状態に関する入力（たとえば、タスクＴ７０に関して本明細書で説明するチャネル状態情報）に応答して、たとえば、方法２００は、障害チャネル上で送信され得る冗長性の程度と頻度とを調節するように実施され得る。冗長コピーを符号化するためにタスクＴ４００内で使用されるビット数は、悪いチャネル状態の下で性能を改善することと元の音声コーディング品質の保存との間のバランス、および／または再送信による能力ロスを低減することを反映する、高いキャップの影響を受けることがある。そのような場合、冗長コピーを符号化するために使用されるビット数は、後続フレームから（すなわち、キャリアフレームから）再割振りされるのではなく、主フレームに追加され得る。たとえば、冗長コピーに対するビット数は、主フレームに対して使用されるビット数に無関係であり得、チャネル容量および／またはネットワーク状態（たとえば、輻輳）など、（たとえば、送信チャネルを介して）受信された情報に関連して決定され得る。

[00122]方法Ｍ２００はまた、モデルフレームの冗長コピーを含む符号化された信号を作成するタスクＴ５００を含む。たとえば、タスクＴ５００は、上記で説明したように、１つまたは複数のキャリアフレーム（たとえば、元の信号内でモデルフレームに後続するフレームに対応する符号化された信号内のフレーム）上に、冗長コピーをピギーバックするように実施され得る。１つのそのような例では、冗長コピーは、入力オーディオ信号内のモデルフレームに後続するキャリアフレームに割り当てられたパケット内に含まれる。そのような場合、タスクＴ５００は、モデルフレームと元の信号内のキャリアフレームとの間のフレーム数を示すことによって冗長コピーを搬送すべき後続フレームを識別する、キャリアオフセットｐの値を決定することを含み得る。代替または追加として、タスクＴ４００は、後続フレームを符号化することから冗長コピーを符号化することに再割振りするためのビット数を選択することを含み得、その選択は、復号されるときにもたらされる後続フレームの知覚品質の尺度に基づくことがある。また、オフセットの値および／または再割振りされたビット数を示す情報を、符号化された信号内に含めるように、タスクＴ５００を実施することも望ましい。代替として、そのような情報は、符号化された信号の中の他の情報からデコーダによって抽出可能であり得る。

[00123]キャリアオフセットｐの値は、モデルフレームｎとキャリアフレーム（ｎ＋ｐ）との間の距離を示す。オフセットｐの値は、オフセットｋの値と同じ（すなわち、従属フレームがキャリアフレームであるように）であってよく、または方法Ｍ２００は、従属オフセットｋがキャリアオフセットｐと異なる値を有することを可能にするように実施されてもよい。方法Ｍ２００は、モデルフレームとキャリアフレームとの間のオフセットｐ（たとえば、フレーム数の差の表示、または介在フレームの数より１多い数）が固定されるように実施されてもよい。典型的な例では、ｐの値は３である。別の例では、ｐの値は４である。他のあり得る値は、１、２、３、５、および５より大きい整数を含む。

[00124]図７Ｂに、タスクＴ５００の実装形態Ｔ５１０を含む方法Ｍ２００の実装形態Ｍ２１０のフローチャートを示す。タスクＴ５１０は、モデルフレームｎの主コピーを含む第１のパケットを作成するサブタスクＴ５１０ａを含む。タスクＴ５１０はまた、タスクＴ４００によって作成された、キャリアフレーム（ｎ＋ｐ）のコピーとモデルフレームｎの冗長コピーとを含む第２のパケットを作成するサブタスクＴ５１０ｂを含む。第２のパケットが、モデルフレームの冗長コピーを搬送していることを示す情報、オフセットｐの値を示す情報、および／または再割振りされたビットの数Ｎ_mを示す情報を含むために、第２のパケットを作成するように、タスクＴ５１０ｂを実施することが望ましい。代替として、そのような情報は、符号化された信号の中の他の情報からデコーダによって抽出可能であり得る。タスクＴ５１０は、決定Ｔ３５０を再送信することに応答して、タスクＴ５１０ｂを実行するように実施され得る。図８は、方法Ｍ１１０、Ｍ１２０およびＭ２１０の実装形態Ｍ３００のフローチャートを示す。

[00125]タスクＴ５００は、キャリアフレーム（たとえば、フレーム（ｎ＋ｐ））もまたクリティカルフレームとなることが推定される尤度に基づいて、キャリアフレームを選択するように（たとえば、キャリアオフセットｐの値を選択するように）実施されてよい。というのは、別のクリティカルフレームの主コピーからのビットを再割振りすることを回避することが望ましいからである。一般に、そのような尤度は、クリティカルフレームの直後にくるフレーム（すなわち、フレーム（ｎ＋１））に対して最高であり、ｐが増加するにつれて急速に低下する。有声音声に対して、オンセットフレームおよびそれの直後にくるフレームが、（たとえば、オンセットフレームが失われる場合をカバーするために）一般的にクリティカルである。しかしながら、別の後続フレームが（たとえば、ピッチラグ（pitch lag）が変動する場合に）クリティカルとなることも起こり得る。

[00126]追加または代替として、タスクＴ５００は、元の時間領域信号および最大許容遅延におけるフレーム長（たとえば、ミリ秒）に従ってキャリアフレームを選択する（たとえば、キャリアオフセットｐの値を選択する）ように実施され得る。たとえば、ｐの値は、（たとえば、フレーム遅延を制限するために）最大許容値によって制約され得る。最大許容遅延が８０または１００ミリ秒の値を有することが望ましい。そのような場合、ｐは、２０ミリ秒フレームを使用するスキームに対して４もしくは５の最大値、または１０ミリ秒フレームを使用するスキームに対して８、９もしくは１０の最大値を有し得る。

[00127]追加または代替として、タスクＴ５００は、（たとえば、本明細書で説明するような、受信機からのフィードバックおよび／または他のチャネル状態情報によって示される）チャネル状態に従ってキャリアフレームを選択する（たとえば、キャリアオフセットｐの値を選択する）ように実施され得る。たとえば、キャリアオフセットｐの値は、フレームの主コピーの送信時刻とそのフレームの冗長コピーの送信時刻との間の間隔の長さを示し、連続するフレームの頻繁なロスを（たとえば、長いフェードによって）引き起こしている環境において、より高いｐの値を使用することが望ましい。通常、パケット交換ネットワーク内のパケットロスはバースト的であり、バースト長は、異なるネットワーク状態の下で異なることがある。したがって、動的に調節されるキャリアオフセット値を使用することが、よりよい誤り保護性能をもたらし得る。最適なキャリアオフセット値は、（たとえば、受信機および／または別のエンティティによって送られる）チャネル状態情報を使用して推定され得る。たとえば、キャリアオフセット値は、チャネル状態に基づいて、（たとえば、実行時に）適応的に調節され得る。代替として、キャリアオフセット値はあらかじめ決定されてもよい。

[00128]追加または代替として、タスクＴ５００は、圧縮率の関連する尺度の値に基づいてキャリアフレームを選択する（たとえば、キャリアオフセットｐの値を選択する）ように実施され得る。たとえば、タスクＴ５００は、入力オーディオ信号内でモデルフレームに後続するフレームの複数のＰの中からキャリアフレームを選択する（たとえば、ｐの対応する値を選択する、ここで、１＜ｐ＜Ｐである）ように実施され得る。そのような場合、タスクＴ５００は、Ｐ個のフレームの各々に対して圧縮率尺度の対応する値によって示される、Ｐ個の候補フレームの中の最も圧縮可能なフレームとしてキャリアフレームを選択するように実施され得る。そのようなフレーム選択のために使用され得る圧縮率尺度の例は、上記で説明したように、静的尺度（たとえば、開ループメトリック）と動的尺度（たとえば、閉ループメトリック）とを含む。

[00129]方法Ｍ２００は、Ｔビットを使用してキャリアフレーム候補（たとえば、ノンキャリアフレーム）の複数のＰのうちの少なくとも１つを符号化することを含むように実施され得る。そのような方法は、さらに、Ｔビットを使用して複数のＰ個の候補フレームのうちのノンキャリアのフレームの各々を符号化することを含み得る。しかしながら、信号が、２つの隣接するクリティカルフレームまたは場合によっては互いに接近する２つのクリティカルフレームを含むことも可能であり、それにより、１つのクリティカルフレームに関連するＰ個のキャリアフレーム候補のセットが、他のクリティカルフレームに関連するＰ個のキャリアフレーム候補のセットと重なる（すなわち、少なくとも１つのフレームを共通に有する）。そのような場合には、共通の後続フレームのうちの１つが、１つのクリティカルフレームの冗長コピーを搬送するために選択され得、共通の後続フレームのうちの別の１つが、他のクリティカルフレームの冗長コピーを搬送するために選択され得、それにより、これら２つの後続フレームの各々は、Ｔビットより少ないビットを使用して符号化される。選択された後続フレームはそれ自体がクリティカルフレームであることも可能である。いくつかの場合には、たとえば、クリティカルフレームに関連するＰ個のキャリアフレーム候補のセットは、少なくとも１つの他のクリティカルフレームを、約２０パーセントの時間に含み得ることが予測され得る。

[00130]パケットは、１つまたは複数のフレームを含み得る。パケット長を２０ミリ秒に制限することが、（たとえば、ラグを短縮するために）望ましい。図９Ａは、インターネットプロトコルバージョン４（ＩＰｖ４：Internet Protocol version 4）と、ユーザデータグラムプロトコル（ＵＤＰ：User Datagram Protocol）と、ＲＴＰとを含むＶｏＩＰ通信に対して一般的なプロトコルスタックを使用して符号化されたパケットに対するオーバーヘッドの一例を示す。図９Ｂは、ＩＰバージョン６（ＩＰｖ６）パケットに対する類似の例を示す。ペイロードサイズの例は、Ｇ．７１１コーデックに対する１６０バイトと、Ｇ．７２９コーデックに対する２０バイトと、Ｇ．７２３．１コーデックに対する２４バイトとを含む。本明細書で説明する適応クリティカリティ表示の方法とともに使用され得る他のコーデックは、制限なしに、上述のように、Ｇ．７２６と、Ｇ．７２８と、Ｇ．７２９Ａと、ＡＭＲと、ＡＭＲ−ＷＢと、ＡＭＲ−ＷＢ＋と、ＶＭＲ−ＷＢと、ＥＶＲＣと、ＳＭＶと、ＥＶＳとを含む。

[00131]図１０は、モデルフレームの冗長コピーとモデルフレームに後続するフレームのコピーとを搬送するＲＴＰパケットに対するペイロードの一例を示す。対応するフレームタイプインジケータＦＴに対して１の値で示されるとき、冗長コピー（ビットｒ（０）〜ｒ（１７６））は、ＡＭＲ−ＷＢ８．８５ｋｂｐｓモードで符号化され、対応するフレームタイプインジケータＦＴに対して０の値で示されるとき、キャリアフレームのコピー（ビットｐ（０）〜ｐ（１３１））は、ＡＭＲ−ＷＢ６．６ｋｂｐｓモードで符号化される。この例では、コーデックモード要求インジケータＣＭＲは、受信端末におけるエンコーダに、８．８５ｋｂｐｓモードを採用するように要求し、ペイロードは、最後のオクテットを書き込むために、３つのパディングビットＰで終了する。別の例では、ペイロードは、３つ以上の符号化されたフレームを含み得、および／または冗長コピーはキャリアフレームのコピーより少ないビットを有し得（すなわち、より低いレートで符号化され得）、および／または冗長コピーのビットはパケット内のキャリアフレームのコピーのビットに先行し得る（コピーに対する対応するコンテンツ表のエントリの順序は、それに応じて切り替えられる）。

[00132]たとえば、ＲＴＰヘッダを１２バイトから４バイトに圧縮するために、タスクＴ５１０を実施してヘッダ圧縮を使用することが望ましい。ＲＴＰヘッダは、送信時間を計算するために使用され得るタイムスタンプと、順序が乱れて受信されたパケットを正しく提示するため、および／またはパケットロスを検出するために使用され得るシーケンス番号とを含む。ロバストヘッダ圧縮（ＲＯＨＣ：Robust Header Compression、ＩＥＴＦ
ＲＦＣ３０９５、ＲＦＣ３８４３、および／またはＲＦＣ４８１５に記載されている）は、より大きい圧縮率（たとえば、１つまたは複数の、場合によってはすべてのパケットヘッダの、１〜４バイトへの圧縮）をサポートするために使用され得る。

[00133]一構成では、タスクＴ５１０ｂは、キャリアフレーム（すなわち、現在の音声フレーム（ｎ＋ｐ））のコピーとモデル音声フレームｎの冗長コピーとを、受信端末への送信のための実時間プロトコル（ＲＴＰ）パケットにパケット化するように実施される。タスクＴ５１０ｂの別の構成では、後続フレーム（ｎ＋ｐ）のコピーおよびモデル音声フレームｎの冗長コピーは、同時に生成されるが、異なる対応するＲＴＰパケットに詰め込まれて受信端末に送信される。どのフォーマットを使用するかの決定は、両端末の能力に基づくことがある。両フォーマットがそれぞれの端末内でサポートされる場合、より低いデータレートをもたらすフォーマットが使用され得る。

[00134]図１１は、オーディオデコーダＡＤ１０の実装形態ＡＤ２０のブロック図である。オーディオデコーダＡＤ２０は、ボコーダの一部として、スタンドアローンエンティティとして、または受信端末１０４内の１つまたは複数のエンティティにわたって分配されて実装され得る。オーディオデコーダＡＤ２０はまた、ＶｏＩＰクライアントの一部として実装され得る。

[00135]オーディオデコーダＡＤ２０は、それの機能に関して以下で説明される。オーディオデコーダＡＤ２０は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組合せとして実装され得、それが実装される方式は、特定の適用例および全体的なシステムに課された設計制約に応じて決まる。例として、オーディオデコーダＡＤ２０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、プログラマブルロジック、専用ハードウェア、あるいは任意の他のハードウェアおよび／またはソフトウェアベースの処理エンティティで実装され得る。

[00136]この例では、オーディオデコーダＡＤ２０は、デジッタバッファＤＢ１０（「ジッタバッファ」とも呼ばれる）を含む。デジッタバッファＤＢ１０は、（たとえば、ネットワーク輻輳、タイミング変動、および／またはルート変更による）パケット到着時間の変動によって引き起こされるジッタを低減または除去するハードウェアデバイスまたはソフトウェアプロセスであってよい。デジッタバッファＤＢ１０は、パケット内のオーディオフレームを受信し得る。デジッタバッファＤＢ１０は、前に到着したパケットのフレームが、正しい順序（たとえば、パケットのタイムスタンプによって示される）でフレームデコーダＦＤ２０に連続的に供給され、オーディオひずみがほとんどないきれいな接続をもたらすことができるように、新しく到着するパケットを遅延させるように実施され得る。デジッタバッファＤＢ１０は、固定型または適応型であってよい。固定デジッタバッファは、パケットに固定遅延をもたらし得る。一方、適応デジッタバッファは、ネットワークの遅延の変化に適応し得る。デジッタバッファＤＢ１０は、符号化されたオーディオフレーム（たとえば、インデックスＸＬ、ＸＦ、ＸＧおよびＸＰを含む）を適切な順序でフレームデコーダＦＤ２０に供給し得る。

[00137]フレームのコピーがデジッタバッファによって受信されない場合、フレームロスが、ＦＥＣが使用されない場合に引き起こされることがある。ＦＥＣが使用され、現在実行されるべきフレームのコピーが失われると、デジッタバッファＤＢ１０は、バッファ内にフレームの冗長コピーがあるかどうかを判断し得る。現在のフレームに対する冗長コピーが利用可能である場合、復号してオーディオサンプルを生成するために、冗長コピーがフレームデコーダＦＤ２０に供給され得る。

[00138]加えて、デジッタバッファＤＢ１０は、主フレーム（すなわち、元のクリティカルフレーム）と冗長フレーム（すなわち、元のクリティカルフレームの一部または全部のコピー）とを別様に処理するために修正され得る。バッファＤＢ１０は、本明細書で説明するＦＥＣ動作を実施することに関連する平均遅延が、ＦＥＣ動作が実施されないときの平均遅延より大きくならないように、これら２つのフレームを別様に処理し得る。たとえば、バッファＤＢ１０は、到来パケットが冗長コピーを含むこと（たとえば、パケットが２つのフレームを含むこと）を検出し、この検出に応答して冗長コピーの復号を開始するように実施され得る。

[00139]デジッタバッファＤＢ１０からリリースされたオーディオフレームは、フレームデコーダＦＤ２０に供給されて、復号されたコアオーディオフレームＤＦ（たとえば、合成音声）を生成し得る。概して、フレームデコーダＦＤ２０は、音声を復号して合成音声にする、当業界で知られている任意の方法を実行するように実施され得る。図１１の例では、フレームデコーダＦＤ２０は、図３を参照して上記で説明した符号化方法に対応するＣＥＬＰ復号方法を使用する。この例では、固定コードベクトル生成器ＶＧ１０は、ＦＣＢインデックスＸＦと、利得インデックスＸＧの対応する部分とを復号して、各サブフレームに対する固定コードベクトルを作成し、逆量子化器ＩＡ１０およびベクトル生成器Ａ５０は、ＡＣＢインデックスＸＰと、利得インデックスＸＧの対応する部分とを復号して、各サブフレームに対する適応コードベクトルを作成し、加算器ＡＤ１０は、対応するコードベクトルを組み合わせて、励振信号を作成し、メモリＭＥ１０を更新する（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の６．１節のステップ１〜８に記載されている）。逆量子化器ＩＬ１０および逆変換モジュールＩＭ１０は、ＬＰＣインデックスＸＬを復号してＬＰフィルタ係数ベクトルを作成し、そのベクトルは、合成フィルタＳＦ１０によって励振に加えられて、合成信号を作成する（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の６．１節の最初の段落およびステップ４に記載されている）。生の合成信号は、ポストフィルタＰＦ１０に供給され、ＰＦ１０は、ハイパスフィルタ処理、アップスケーリング、および内挿などの動作を実行し（たとえば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０の６．２節に記載されている）、復号されたコアオーディオフレームＤＦを作成するように実施され得る。代替として、制限なしに、フレームデコーダＦＤ２０は、ＮＥＬＰまたはＰＰＰフルフレーム復号方法を使用し得る。

[00140]主コピーのパラメータ値のいくつか（すなわち、部分セット）を含むフレームの冗長コピーは、デジッタバッファＤＢ１０から部分フレーム復号モジュールに送られ得る。たとえば、フレームデコーダＦＤ２０は、冗長コピーが利用可能になる前に、（たとえば、上述の３ＧＰＰＴＳ２６．０９１ｖ１１．０．０に記載されている誤り隠蔽手順に従って）クリティカルフレームに対応するフレームを生成するように実施され得る。この場合、フレームデコーダＦＤ２０は、キャリアフレーム（ｎ＋ｐ）を復号する前に、（たとえば、固定および適応コードブックインデックスならびに冗長コピーからの利得に従って）メモリＭＥ１０を更新するように構成された部分フレーム復号モジュールを含み得る。

[00141]受信機の側では、音声フレームは、デジッタバッファＤＢ１０内に記憶され得、ＤＢ１０は適応型であってよい。前述のように、デジッタバッファＤＢ１０は、音声フレームに対する平均遅延がＦＥＣ技法なしの平均遅延より大きくならないように設計され得る。フレームは、デジッタバッファＤＢ１０から適切な順序でフレームデコーダ（たとえば、デコーダＦＤ２０）に送られ得る。冗長コピーが主コピーのパラメータの部分セットである場合、部分フレーム復号モジュールが使用され得る。

[00142]本明細書で説明するソース制御およびチャネル制御ＦＥＣ方式は、パケットロスの数を低減させ得、ロスのバースト性（burstiness）は、データレートの増加をほとんどまたはまったく伴わない。クリティカルフレーム識別は、音声知覚品質とデータレートとの間の良好なトレードオフを確実にするのを助け得る。そのようなＦＥＣ方式は、利用可能な帯域幅を効率的に使用するように、また、レガシー通信デバイスとの後方互換性があるように実施され得る。

[00143]オーディオエンコーダＡＥ１０は、動的レート制御モジュールを含むように実施され得る。そのようなモジュールは、所定の目標レートに接近するために２つのステップを実施し得る。第１のステップでは、２つの隣接動作点が決定される。これら２つの隣接動作点は、データレートであってよく、目標データレートの値が２つの動作点の値の間にあるように選択される。目標データレートは、能力要求に基づいて外部で指定されてよい。代替として、目標データレートは、たとえば、チャネル状態情報に基づいて内部で指定されてもよい。そのようなレート制御は、事業者が能力要求に基づいてデータレートを決定し得るように、本明細書で説明するＦＥＣ方式が、任意の指定されたデータレートで遂行されることを可能にするように実施され得る。

[00144]図１２Ａに、一般的構成による信号処理ＭＦ１００のための装置のブロック図を示す。装置ＭＦ１００は、（たとえば、タスクＴ１００に関して本明細書で説明するように）オーディオ信号内で第２のフレームに先行する第１のフレームに対するオーディオ信号の第２のフレームのコーディング従属性の推定を計算するための手段Ｆ１００を含む。装置ＭＦ１００はまた、（たとえば、タスクＴ２００に関して本明細書で説明するように）送信チャネルの状態に関連する情報に基づいて閾値を計算するための手段Ｆ２００を含む。装置ＭＦ１００はまた、（たとえば、タスクＴ３００に関して本明細書で説明するように）計算された推定と計算された閾値とを比較するための手段Ｆ３００を含む。装置ＭＦ１００はまた、（たとえば、タスクＴ３５０に関して本明細書で説明するように）比較することの結果に基づいて第１のフレームの冗長コピーを送信することを決定するための手段Ｆ３５０を含む。

[00145]図１２Ｂは、（たとえば、タスクＴ５０に関して本明細書で説明するように）第２のフレームに対する適応コードベクトルを生成するために第１のフレームからの情報を使用するための手段Ｆ５０と、（たとえば、タスクＴ６０に関して本明細書で説明するように）第２のフレームの符号化されたバージョンに対するＡＣＢ利得値を計算するための手段Ｆ６０とを同様に含む装置ＭＦ１００の実装形態ＭＦ１１０のブロック図を示す。この場合、手段Ｆ１００は、適応コードベクトルおよびＡＣＢ利得値に基づいて計算される推定を計算するように構成される。

[00146]図１３Ａは、（たとえば、タスクＴ７０に関して本明細書で説明するように）チャネル状態情報を受信するための手段Ｆ７０を同様に含む装置ＭＦ１００の実装形態ＭＦ１２０のブロック図を示す。図１３Ｂは、（たとえば、タスクＴ４００に関して本明細書で説明するように）第１のフレームの冗長コピーを作成するための手段Ｆ４００と、（たとえば、タスクＴ５００に関して本明細書で説明するように）冗長コピーを含む符号化された信号を作成するための手段Ｆ５００とを同様に含む装置ＭＦ１００の実装形態ＭＦ２００のブロック図を示す。

[00147]図１４Ａは、本明細書で説明するように、装置ＭＦ１００の任意の実装形態内で随意に使用され得る手段Ｆ２００の実装形態の一例Ｆ２１０のブロック図を示す。手段Ｆ２１０は、（たとえば、タスクＴ２１０ａに関して本明細書で説明するように）送信チャネルの状態に関連する情報に基づく計算された値と境界値とを比較するための手段Ｆ２１０ａと、（たとえば、タスクＴ２１０ｂおよびＴ２１０ｃに関して本明細書で説明するように）境界値と前記比較することの結果に応答して、計算された閾値として境界値を選択するための手段Ｆ２１０ｂとを含む。

[00148]図１４Ｂに、手段Ｆ５００の実装形態Ｆ５１０を含む装置ＭＦ２００の実装形態ＭＦ２１０のブロック図を示す。手段Ｆ５１０は、（たとえば、タスクＴ５１０ａに関して本明細書で説明するように）第１のフレームの主コピーを含む第１のパケットを作成するための手段Ｆ５１０ａと、（たとえば、タスクＴ５１０ｂに関して本明細書で説明するように）前記決定することに応答して第１のフレームの冗長コピーと第２のフレームのコピーとを含む第２のパケットを作成するための手段Ｆ５１０ｂとを含む。図１５は、装置ＭＦ１１０、ＭＦ１２０およびＭＦ２１０の実装形態ＭＦ３００のブロック図を示す。

[00149]図１６Ａに、第１の計算器Ａ１００と、第２の計算器Ａ２００と、モード選択器Ａ３００とを含む、一般的構成による装置ＡＰ１００のブロック図を示す。第１の計算器Ａ１００は、（たとえば、タスクＴ１００に関して本明細書で説明するように）オーディオ信号内で第２のフレームに先行する第１のフレームに対するオーディオ信号の第２のフレームのコーディング従属性の推定を計算するように構成される。第２の計算器Ａ２００は、（たとえば、タスクＴ２００に関して本明細書で説明するように）送信チャネルの状態に関連する情報に基づいて閾値を計算するように構成される。モード選択器Ａ３００は、（たとえば、タスクＴ３００およびＴ３５０に関して本明細書で説明するように）計算することの結果に基づいて、（Ａ）計算された推定と計算された閾値とを比較することと、（Ｂ）比較することの結果に基づいて第１のフレームの冗長コピーを送信することを決定することとを行うように構成される。

[00150]図１６Ｂは、（たとえば、タスクＴ５０に関して本明細書で説明するように）第１のフレームからの情報を使用して第２のフレームに対する適応コードベクトルを生成するように構成されたベクトル生成器Ａ５０と、（たとえば、タスクＴ６０に関して本明細書で説明するように）第２のフレームの符号化されたバージョンに対するＡＣＢ利得値を計算するように構成された適応コードブック利得計算器Ａ６０とを同様に含む装置ＡＰ１００の実装形態ＡＰ１１０のブロック図を示す。この場合、第１の計算器Ａ１００は、適応コードベクトルおよびＡＣＢ利得値に基づいて計算される推定を計算するように構成される。

[00151]図１６Ｃは、本明細書で説明するように、装置ＡＰ１００の任意の実装形態内で随意に使用され得る第２の計算器Ａ２００の実装形態の一例Ａ２１０のブロック図を示す。計算器Ａ２１０は、（たとえば、タスクＴ２１０ａに関して本明細書で説明するように）送信チャネルの状態に関連する情報に基づく計算された値と境界値とを比較するように構成された比較器Ａ２１０ａと、（たとえば、タスクＴ２１０ｂおよびＴ２１０ｃに関して本明細書で説明するように）境界値と前記比較することの結果に応答して、計算された閾値として境界値を選択するように構成された選択器Ａ２１０ｂとを含む。

[00152]図１６Ｄは、（たとえば、タスクＴ７０に関して本明細書で説明するように）チャネル状態情報を受信するように構成されたチャネルデコーダＣＤ１１を同様に含む装置ＡＰ１００の実装形態ＡＰ１２０のブロック図を示す。図１６Ｅは、本明細書で説明するように、装置ＡＰ１００の任意の実装形態内で随意に使用され得る第２の計算器Ａ２００の実装形態の一例Ａ２２０のブロック図を示す。第２の計算器Ａ２２０は、（たとえば、タスクＴ２００に関して本明細書で説明するように）チャネル状態情報と、第１の閾値と、第２の閾値とに基づいて計算するように構成された閾値計算器Ａ２１０ｃと、第１のフレームおよびオーディオ信号内で第１のフレームに隣接するフレームの中の少なくとも１つからの情報に基づいて、第１および第２の閾値の中から計算された閾値を選択するように構成された閾値選択器Ａ２１０ｄとを含む。第２の計算器Ａ２００は、（たとえば、閾値選択器Ａ２１０ｄが、選択された値を計算された値として比較器Ａ２１０ａに供給するように）計算器Ａ２１０とＡ２２０の両方の実装形態として実装され得る。

[00153]図１７Ａは、（たとえば、タスクＴ４００に関して本明細書で説明するように）第１のフレームの冗長コピーを作成するように構成されたフレームエンコーダＦＥ１０の（たとえば、フレームエンコーダＦＥ２０の）実装形態Ａ４００を同様に含む装置ＡＰ１００の実装形態ＡＰ２００と、（たとえば、タスクＴ５００に関して本明細書で説明するように）冗長コピーを含む符号化された信号を作成するように構成されたチャネルエンコーダＣＥ１０の実装形態Ａ５００とのブロック図を示す。フレームエンコーダＡ４００は、（たとえば、タスクＴ４００に関して本明細書で説明するように）冗長コピーのサイズを選択すること、またはそのような選択を実行するように構成された装置ＡＰ２００の別のモジュールからサイズの表示を受信することを行うように構成され得る。

[00154]図１７Ｂに、チャネルエンコーダＡ５００の実装形態Ａ５１０を含む装置ＡＰ２００の実装形態ＡＰ２１０のブロック図を示す。チャネルエンコーダＡ５１０は、（たとえば、タスクＴ５１０ａに関して本明細書で説明するように）第１のフレームの主コピーを含む第１のパケットを作成することと、（たとえば、タスクＴ５１０ｂに関して本明細書で説明するように）前記決定することに応答して第１のフレームの冗長コピーと第２のフレームのコピーとを含む第２のパケットを作成することとを行うように構成されたパケットアセンブラＡ５１０ａを含む。図１７Ｃは、（たとえば、チャネル状態情報および／または第２のフレーム圧縮率に基づくなど、タスクＴ５００に関して本明細書で説明するように）第１のフレームと第２のフレームとの間のオーディオ信号の総フレーム数を示すオフセットの値を決定するように構成されたオフセット計算器Ａ５２０を含む装置ＡＰ２１０の実装形態ＡＰ２２０のブロック図を示す。

[00155]図１８Ａは、装置ＡＰ１１０、ＡＰ１２０およびＡＰ２１０の実装形態ＡＰ３００のブロック図を示す。図１９は、第１のユーザインターフェースＵＩ１０のインスタンスを含む装置ＡＰ３００の実装形態ＡＰ４００と、装置ＡＰ１１０のインスタンスを含み、インターフェースＵＩ１０からのオーディオ情報を圧縮するように配列されたオーディオエンコーダＡＥ１０（たとえば、オーディオエンコーダＡＥ２０）の実装形態ＡＥ３０とのブロック図を示す。この場合、フレームエンコーダＡ４００は、（たとえば、タスクＴ４００に関して本明細書で説明するように）冗長コピーのサイズを選択すること、またはそのような選択を実行するように構成されたオーディオエンコーダＡＥ３０の別のモジュールからサイズの表示を受信することを行うように構成され得る。

[00156]図９Ｃは、本明細書で説明するように、装置ＡＰ１００（またはＭＦ１００）の実装形態のうちの任意の１つまたは複数の要素を統合するために実装され得るチップまたはチップセットＣＳ１０（たとえば、移動局モデム（ＭＳＭ）チップセット）を含む通信デバイスＤ１０のブロック図を示す。チップ／チップセットＣＳ１０は、装置Ａ１００またはＭＦ１００のソフトウェアおよび／またはファームウェア部を（たとえば、命令として）実行するように構成され得る、１つまたは複数のプロセッサを含み得る。送信端末１０２は、デバイスＤ１０の実装形態として実現され得る。

[00157]チップ／チップセットＣＳ１０は、無線周波数（ＲＦ）通信信号を受信し、ＲＦ信号の中に符号化されたオーディオ信号（およびチャネル状態情報）を復号して再生するように構成された無線受信機（たとえば、ＲＸ１０の実装形態）と、（たとえば、第１のユーザインターフェースＵＩ１０に関して本明細書で説明するように）マイクロフォンＭＶ１０−１および／またはＭＶ１０−３を介して受信されたオーディオ情報に基づく符号化されたオーディオ信号（たとえば、タスクＴ５００によって作成された）を、符号化されたオーディオ信号を記載するＲＦ通信信号として送信チャネルに送信するように構成された無線送信機（たとえば、ＴＸ１０の実装形態）とを含む。そのようなデバイスは、本明細書で参照されるコーデックのうちの任意の１つまたは複数を介して音声通信データをワイヤレスに送信および受信するように構成され得る。

[00158]デバイスＤ１０は、アンテナＣ３０を介してＲＦ通信信号を受信および送信するように構成される。デバイスＤ１０はまた、アンテナＣ３０への経路中にダイプレクサと１つまたは複数の電力増幅器とを含み得る。また、チップ／チップセットＣＳ１０は、キーパッドＣ１０を介してユーザ入力を受信し、ディスプレイＣ２０を介して情報を表示するように構成される。この例では、デバイスＤ１０はまた、全地球測位システム（ＧＰＳ）位置サービス、および／またはワイヤレス（たとえば、Ｂｌｕｅｔｏｏｔｈ（登録商標））ヘッドセットなどの外部デバイスとの短距離通信をサポートするための、１つまたは複数のアンテナＣ４０を含む。別の例では、そのような通信デバイスは、それ自体がＢｌｕｅｔｏｏｔｈ（登録商標）ヘッドセットであり、キーパッドＣ１０、ディスプレイＣ２０、およびアンテナＣ３０がない。

[00159]通信デバイスＤ１０は、スマートフォンおよびラップトップおよびタブレットコンピュータを含む、様々な通信デバイスに組み込まれ得る。図２０は、１つのそのような例の正面図、背面図、および側面図を示しており、ハンドセットＨ１００（たとえば、スマートフォン）は前面に配列された２つの音声マイクロフォンＭＶ１０−１およびＭＶ１０−３を有し、音声マイクロフォンＭＶ１０−２は背面上に配列され、別のマイクロフォンＭＥ１０（たとえば、強化された方向選択性のためおよび／またはアクティブ雑音消去動作への入力のためにユーザの耳元の音響誤差をキャプチャするため）は正面の上隅に配置され、別のマイクロフォンＭＲ１０（たとえば、強化された方向選択性のためおよび／または背景雑音の基準をキャプチャするため）は背面上に配置される。拡声器ＬＳ１０が、誤差マイクロフォンＭＥ１０の近くの、正面の上側の中心に配置され、（たとえばスピーカーフォンアプリケーションで）拡声器ＬＳ２０Ｌ、ＬＳ２０Ｒも設けられる。そのようなハンドセットのマイクロフォン間の最大距離は、一般に約１０または１２センチメートルである。

[00160]図１８Ｂは、本明細書で説明する方法（たとえば、方法Ｍ１００、Ｍ１１０、Ｍ１２０、Ｍ２００、Ｍ２１０およびＭ３００のうちの任意の１つまたは複数）を実行するように実施され得るワイヤレスデバイス１１０２のブロック図を示す。送信端末１０２は、ワイヤレスデバイス１１０２の実装形態として実現され得る。ワイヤレスデバイス１１０２は、遠隔局、アクセス端末、ハンドセット、携帯情報端末（ＰＤＡ）、セルラー電話などであってよい。

[00161]ワイヤレスデバイス１１０２は、デバイスの動作を制御するプロセッサ１１０４を含む。プロセッサ１１０４は中央処理装置（ＣＰＵ）とも呼ばれることもある。読取り専用メモリ（ＲＯＭ）とランダムアクセスメモリ（ＲＡＭ）の両方を含むことができるメモリ１１０６は、命令とデータとをプロセッサ１１０４に与える。メモリ１１０６の一部は不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）をも含むことができる。プロセッサ１１０４は一般に、メモリ１１０６内に記憶されたプログラム命令に基づいて、論理および演算動作を実行する。メモリ１１０６中の命令は、本明細書で説明する方法（複数可）を実施するために実行可能である。

[00162]ワイヤレスデバイス１１０２は、ワイヤレスデバイス１１０２と遠隔地との間のデータの送信および受信を可能にするために送信機１１１０と受信機１１１２とを含むことができるハウジング１１０８を含む。送信機１１１０と受信機１１１２とを組み合わせてトランシーバ１１１４を形成することができる。アンテナ１１１６は、ハウジング１１０８に取り付けられ、トランシーバ１１１４に電気的に結合される。ワイヤレスデバイス１１０２は、複数の送信機、複数の受信機、複数のトランシーバ、および／または複数のアンテナをも含む（図示せず）ことができる。

[00163]この例では、ワイヤレスデバイス１１０２は、トランシーバ１１１４によって受信された信号のレベルを検出し、量子化するために使用され得る、信号検出器１１１８をも含み得る。信号検出器１１１８は、総エネルギー、擬似ノイズ（ＰＮ）チップ当たりのパイロットエネルギー、電力スペクトル密度、および他の信号などの信号を検出できる。ワイヤレスデバイス１１０２はまた、信号を処理する際に使用するためのデジタル信号プロセッサ（ＤＳＰ）１１２０を含む。

[00164]ワイヤレスデバイス１１０２の様々な構成要素は、データバスに加えて、電力バスと、制御信号バスと、ステータス信号バスとを含み得る、バスシステム１１２２によって互いに結合される。明確にするために、様々なバスが、バスシステム１１２２として図１８Ｂにおいて示されている。

[00165]本明細書で開示した方法および装置は、概して任意の送受信および／または音声感知アプリケーション、特にそのようなアプリケーションのモバイル事例または他の持ち運び可能事例において適用され得る。たとえば、本明細書で開示する構成の範囲は、符号分割多元接続（ＣＤＭＡ）無線インターフェースを採用するように構成されたワイヤレス電話通信システムに常駐する、通信デバイスを含む。しかし、本明細書で説明した特徴を有する方法および装置は、有線および／またはワイヤレス（たとえば、ＣＤＭＡ、ＴＤＭＡ、ＦＤＭＡ、および／またはＴＤ−ＳＣＤＭＡ）送信チャネルを介したボイスオーバＩＰ（ＶｏＩＰ）を採用するシステムなど、当業者に知られている広範囲の技術を採用する様々な通信システムのいずれにも常駐し得ることが、当業者には理解されよう。

[00166]本明細書で開示した通信デバイスは、パケット交換式であるネットワーク（たとえば、ＶｏＩＰなどのプロトコルに従ってオーディオ送信を搬送するように構成されたワイヤードおよび／またはワイヤレスネットワーク）および／または回線交換式であるネットワークにおける使用に適応され得ることが明確に企図され、本明細書によって開示される。また、本明細書で開示した通信デバイスは、狭帯域コーディングシステム（たとえば、約４または５キロヘルツの可聴周波数レンジを符号化するシステム）での使用、ならびに／あるいは全帯域広帯域コーディングシステムおよびスプリットバンド広帯域コーディングシステムを含む、広帯域コーディングシステム（たとえば、５キロヘルツを超える可聴周波数を符号化するシステム）での使用に適応され得ることが明確に企図され、本明細書によって開示される。

[00167]説明した構成の提示は、本明細書で開示する方法および他の構造物を当業者が製造または使用できるように与えたものである。本明細書で図示および説明したフローチャート、ブロック図、および他の構造は例にすぎず、これらの構造の他の変形形態も開示の範囲内である。これらの構成に対する様々な変更が可能であり、本明細書で提示した一般的な原理は他の構成にも同様に適用できる。したがって、本開示は、上に示した構成に限定されるものではなく、原開示の一部をなす、出願した添付の特許請求の範囲を含む、本明細書において任意の方法で開示される原理および新規の特徴に一致する最も広い範囲が与えられるべきである。

[00168]情報および信号は、多種多様な技術および技法のいずれかを使用して表され得ることを当業者なら理解されよう。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、およびシンボルは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。

[00169]本明細書で開示した構成の実装形態の重要な設計要件は、圧縮されたオーディオもしくはオーディオビジュアル情報（たとえば、本明細書で識別される例のうちの１つなど、圧縮形式に従って符号化されるファイルまたはストリーム）の再生などの計算集約的適用例、または広帯域通信（たとえば、１２、１６、３２、４４．１、４８、または１９２ｋＨｚなど、８キロヘルツよりも高いサンプリングレートにおけるボイス通信）の適用例では特に、（一般に百万命令毎秒またはＭＩＰＳで測定される）処理遅延および／または計算複雑さを最小にすることを含み得る。

[00170]本明細書で開示した装置（たとえば、装置ＭＦ１００、ＭＦ１１０、ＭＦ１２０、ＭＦ２００、ＭＦ２１０、ＭＦ３００、ＡＰ１００、ＡＰ１１０、ＡＰ１２０、ＡＰ２００、ＡＰ２１０、ＡＰ３００およびＡＰ４００の中の任意の装置）は、意図された適用例に好適と見なされる、ソフトウェアとの、および／またはファームウェアとのハードウェアの任意の組合せで実装され得る。たとえば、そのような装置の要素は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ間に常駐する電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。これらの要素のうちの任意の２つ以上、さらにはすべてが、同じ１つまたは複数のアレイ内に実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。

[00171]本明細書で開示した装置（たとえば、装置ＭＦ１００、ＭＦ１１０、ＭＦ１２０、ＭＦ２００、ＭＦ２１０、ＭＦ３００、ＡＰ１００、ＡＰ１１０、ＡＰ１２０、ＡＰ２００、ＡＰ２１０、ＡＰ３００およびＡＰ４００の中の任意の装置）の様々な実装形態の１つまたは複数の要素は、全体または一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＡＳＳＰ（特定用途向け標準製品）、およびＡＳＩＣ（特定用途向け集積回路）など、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとして実装され得る。本明細書で開示した装置の実装形態の様々な要素のいずれも、１つまたは複数のコンピュータ（たとえば、「プロセッサ」とも呼ばれる、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）としても実施され得、これらの要素のうちの任意の２つ以上、さらにはすべてが、同じそのような１つまたは複数のコンピュータ内に実装され得る。

[00172]本明細書で開示したプロセッサまたは処理するための他の手段は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ上に常駐する、１つまたは複数の電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたは論理ゲートなどの論理要素の固定アレイまたはプログラマブルアレイであり、これらの要素のいずれも１つまたは複数のそのようなアレイとして実装され得る。そのような１つまたは複数のアレイは、１つまたは複数のチップ内（たとえば、２つ以上のチップを含むチップセット内）に実装され得る。そのようなアレイの例には、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、ＤＳＰ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の固定アレイまたはプログラマブルアレイがある。本明細書で開示したプロセッサまたは処理するための他の手段は、１つまたは複数のコンピュータ（たとえば、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）あるいは他のプロセッサとしても実施され得る。本明細書で説明したプロセッサは、プロセッサが組み込まれているデバイスまたはシステム（たとえば、オーディオ感知デバイス）の別の演算に関係するタスクなど、方法Ｍ１００の実装形態のプロシージャに直接関係しないタスクを実施するかまたは命令の他のセットを実行するために使用することが可能である。また、本明細書で開示した方法の一部はオーディオ感知デバイスのプロセッサによって実行され、その方法の別の一部は１つまたは複数の他のプロセッサの制御下で実行されることが可能である。

[00173]本明細書で開示した構成に関して説明した様々な例示的なモジュール、論理ブロック、回路、およびテストならびに他の動作は、電子ハードウェア、コンピュータソフトウェア、またはその両方の組合せとして実装され得ることを、当業者なら諒解されよう。そのようなモジュール、論理ブロック、回路、および動作は、本明細書で開示した構成を生成するように設計された、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣまたはＡＳＳＰ、ＦＰＧＡまたは他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア構成要素、あるいはそれらの任意の組合せを用いて実装または実行され得る。たとえば、そのような構成は、少なくとも部分的に、ハードワイヤード回路として、特定用途向け集積回路へと作製された回路構成として、あるいは不揮発性記憶装置にロードされるファームウェアプログラム、または汎用プロセッサもしくは他のデジタル信号処理ユニットなどの論理要素のアレイによって実行可能な命令である機械可読コードとしてデータ記憶媒体からロードされるかもしくはデータ記憶媒体にロードされるソフトウェアプログラムとして実装され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であり得る。プロセッサは、コンピューティングデバイスの組合せ、たとえば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、あるいは任意の他のそのような構成として実装することもできる。ソフトウェアモジュールは、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（読取り専用メモリ）、フラッシュＲＡＭなどの不揮発性ＲＡＭ（ＮＶＲＡＭ）、消去可能プログラマブルＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラマブルＲＯＭ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバブルディスク、またはＣＤ−ＲＯＭなど、非一時的記憶媒体中に、あるいは当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサに一体化することができる。プロセッサおよび記憶媒体はＡＳＩＣ中に常駐することができる。ＡＳＩＣは、ユーザ端末内に常駐することができる。代替として、プロセッサおよび記憶媒体は、ユーザ端末内に個別構成要素として常駐することもできる。

[00174]本明細書で開示する様々な方法（たとえば、方法Ｍ１００、Ｍ１１０、Ｍ１２０、Ｍ２００、Ｍ２１０およびＭ３００の中の任意の方法）は、プロセッサなどの論理要素のアレイによって実行され得、本明細書で説明する装置の様々な要素は、そのようなアレイ上で実行するように設計されたモジュールとして実装され得ることに留意されたい。本明細書で使用する「モジュール」または「サブモジュール」という用語は、ソフトウェア、ハードウェアまたはファームウェアの形態でコンピュータ命令（たとえば、論理式）を含む任意の方法、装置、デバイス、ユニットまたはコンピュータ可読データ記憶媒体を指すことができる。複数のモジュールまたはシステムを１つのモジュールまたはシステムに結合することができ、１つのモジュールまたはシステムを、同じ機能を実行する複数のモジュールまたはシステムに分離することができることを理解されたい。ソフトウェアまたは他のコンピュータ実行可能命令で実装した場合、プロセスの要素は本質的に、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを用いて関連するタスクを実行するコードセグメントである。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の１つまたは複数のセットまたはシーケンス、およびそのような例の任意の組合せを含むことを理解されたい。プログラムまたはコードセグメントは、プロセッサ可読媒体に記憶され得、あるいは搬送波に埋め込まれたコンピュータデータ信号によって伝送媒体または通信リンクを介して送信され得る。

[00175]本明細書で開示した方法、方式、および技法の実装形態は、（たとえば、本明細書に記載する１つまたは複数のコンピュータ可読記憶媒体の有形のコンピュータ可読特徴において）論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械によって実行可能な命令の１つまたは複数のセットとしても有形に実施され得る。「コンピュータ可読媒体」という用語は、情報を記憶または転送することができる、揮発性の、不揮発性の、取外し可能な、および取外し不可能な記憶媒体を含む、任意の媒体を含み得る。コンピュータ可読媒体の例には、電子回路、半導体メモリデバイス、ＲＯＭ、フラッシュメモリ、消去可能ＲＯＭ（ＥＲＯＭ）、フロッピー（登録商標）ディスケットもしくは他の磁気ストレージ、ＣＤ−ＲＯＭ／ＤＶＤもしくは他の光ストレージ、ハードディスクもしくは所望の情報を記憶するために使用され得る任意の他の媒体、光ファイバー媒体、高周波（ＲＦ）リンク、または、所望の情報を搬送するために使用されアクセスされ得る任意の他の媒体がある。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバー、無線リンク、電磁リンク、ＲＦリンクなどの伝送媒体を介して伝播することができる、任意の信号を含み得る。コードセグメントは、インターネットまたはイントラネットなどのコンピュータネットワークを介してダウンロードされ得る。いずれの場合も、本開示の範囲は、そのような実施形態によって限定されると解釈すべきではない。

[00176]本明細書で説明した方法のタスクの各々は、ハードウェアで直接実施されてもよく、プロセッサによって実行されるソフトウェアモジュールで実施されてもよく、またはその２つの組合せで実施されてもよい。本明細書で開示する方法の実装形態の典型的な適用例では、論理要素のアレイ（たとえば、論理ゲート）は、この方法の様々なタスクのうちの１つ、複数、さらにはすべてを実行するように構成される。タスクの１つまたは複数（場合によってはすべて）は、論理要素のアレイ（たとえば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械（たとえば、コンピュータ）によって読取り可能および／または実行可能である、コンピュータプログラム製品（たとえば、ディスク、フラッシュもしくは他の不揮発性メモリカード、半導体メモリチップなどの１つまたは複数のデータ記憶媒体など）に埋め込まれたコード（たとえば、命令の１つまたは複数のセット）としても実装され得る。本明細書で開示した方法の実装形態のタスクは、２つ以上のそのようなアレイまたは機械によっても実行され得る。これらまたは他の実装形態では、タスクは、セルラー電話など、ワイヤレス通信用のデバイス、またはそのような通信機能を有する他のデバイス内で実行され得る。そのようなデバイスは、（たとえば、ＶｏＩＰなどの１つまたは複数のプロトコルを使用して）回線交換および／またはパケット交換ネットワークと通信するように構成され得る。たとえば、そのようなデバイスは、符号化フレームを受信および／または送信するように構成されたＲＦ回路を含み得る。

[00177]本明細書で開示した様々な方法は、ハンドセット、ヘッドセット、または携帯情報端末（ＰＤＡ）などのポータブル通信デバイスによって実行されてよく、本明細書で説明した様々な装置は、そのようなデバイス内に含まれ得ることが明確に開示される。典型的なリアルタイム（たとえば、オンライン）アプリケーションは、そのようなモバイルデバイスを使用して行われる、電話による会話である。

[00178]１つまたは複数の例示的な実施形態では、本明細書で説明した動作は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せで実施され得る。ソフトウェアで実施される場合、そのような動作は、１つまたは複数の命令またはコードとしてコンピュータ可読媒体に記憶され得るか、あるいはコンピュータ可読媒体を介して送信され得る。「コンピュータ可読媒体」という用語は、コンピュータ可読記憶媒体と通信（たとえば、伝送）媒体の両方を含む。限定ではなく、例として、コンピュータ可読記憶媒体は、（限定はしないが、ダイナミックＲＡＭもしくはスタティックＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、および／またはフラッシュＲＡＭを含み得る）半導体メモリ、または強誘電体メモリ、磁気抵抗メモリ、オボニックメモリ、高分子メモリ、または相変化メモリなどの記憶要素のアレイ、ＣＤ−ＲＯＭもしくは他の光ディスクストレージ、および／または、磁気ディスクストレージもしくは他の磁気ストレージデバイスを備え得る。そのような記憶媒体は、コンピュータによってアクセスされ得る命令またはデータ構造の形態で情報を記憶し得る。通信媒体は、ある場所から別の場所へのコンピュータプログラムの転送を可能にする任意の媒体を含む、命令またはデータ構造の形態の所望のプログラムコードを搬送するために使用されコンピュータによってアクセスされ得る、任意の媒体を備え得る。同様に、いかなる接続も適切にコンピュータ可読媒体と称される。たとえば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線（ＤＳＬ）、または、赤外線、無線、および／もしくはマイクロ波のようなワイヤレス技術を使用して、ウェブサイト、サーバ、または他のリモートソースから送信される場合、同軸ケーブル、光ファイバケーブル、ツイストペア、ＤＳＬ、または、赤外線、無線、および／もしくはマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク（disk）およびディスク（disc）は、コンパクトディスク（disc）（ＣＤ）、レーザーディスク（登録商標）（disc）、光ディスク（disc）、デジタル多用途ディスク（disc）（ＤＶＤ）、フロッピーディスク（disk）およびブルーレイ（登録商標）ディスク（disc）（Ｂｌｕ−Ｒａｙ（登録商標）ＤｉｓｃＡｓｓｏｃｉａｔｉｏｎ、カリフォルニア州ユニヴァーサルシティー）を含み、ディスク（disk）は、通常、データを磁気的に再生し、ディスク（disc）はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。

[00179]本明細書で説明した音響信号処理装置は、いくつかの動作を制御するために音声入力を受容し、あるいは背景雑音から所望の雑音を分離することから利益を得ることがある、通信デバイスなどの電子デバイスに組み込まれ得る。多くの適用例では、複数の方向から発生した背景音から明瞭な所望の音を強調または分離することから利益を得ることがある。そのような適用例は、ボイス認識および検出、音声強調および分離、ボイスアクティブ化制御などの機能を組み込んだ電子デバイスまたはコンピューティングデバイスにおけるヒューマンマシンインターフェースを含み得る。そのような音響信号処理装置を、限定された処理機能のみを与えるデバイスに適するように実装するのが望ましいことがある。

[00180]本明細書で説明したモジュール、要素、およびデバイスの様々な実装形態の要素は、たとえば、同じチップ上に、またはチップセット中の２つ以上のチップ上に常駐する、電子デバイスおよび／または光デバイスとして作製され得る。そのようなデバイスの一例は、トランジスタまたはゲートなど、論理要素の固定アレイまたはプログラマブルアレイである。本明細書で説明した装置の様々な実装形態の１つまたは複数の要素は、全体または一部が、マイクロプロセッサ、組込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ、ＡＳＳＰ、およびＡＳＩＣなど、論理要素の１つまたは複数の固定アレイまたはプログラマブルアレイ上で実行するように構成された命令の１つまたは複数のセットとしても実装され得る。

[00181]本明細書で説明した装置の一実装形態の１つまたは複数の要素は、装置が組み込まれているデバイスまたはシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施し、あるいは装置の動作に直接関係しない命令の他のセットを実行するために使用することが可能である。また、そのような装置の実装形態の１つまたは複数の要素は、共通の構造（たとえば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、あるいは、異なる要素向けの動作を異なる時間に実行する電子デバイスおよび／または光デバイスの構成）を有することが可能である。

[00181]本明細書で説明した装置の一実装形態の１つまたは複数の要素は、装置が組み込まれているデバイスまたはシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施し、あるいは装置の動作に直接関係しない命令の他のセットを実行するために使用することが可能である。また、そのような装置の実装形態の１つまたは複数の要素は、共通の構造（たとえば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、あるいは、異なる要素向けの動作を異なる時間に実行する電子デバイスおよび／または光デバイスの構成）を有することが可能である。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
オーディオ信号処理の方法であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算することと、
送信チャネルの状態に関連する情報に基づいて、閾値を計算することと、
前記計算された推定と前記計算された閾値とを比較することと、
前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定することと
を備える、方法。
［Ｃ２］
前記計算された推定が、前記第１のフレームからの情報に基づく、Ｃ１に記載の方法。
［Ｃ３］
前記第１のフレームからの前記情報を使用して適応コードベクトルを生成することを含み、
前記計算された推定が、前記適応コードベクトルからの情報に基づく、Ｃ２に記載の方法。
［Ｃ４］
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ１から３のいずれか一項に記載の方法。
［Ｃ５］
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、Ｃ１から３のいずれか一項に記載の方法。
［Ｃ６］
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、Ｃ１に記載の方法。
［Ｃ７］
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、Ｃ１から６のいずれか一項に記載の方法。
［Ｃ８］
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、Ｃ１から７のいずれか一項に記載の方法。
［Ｃ９］
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信することを含む、Ｃ１から８のいずれか一項に記載の方法。
［Ｃ１０］
前記閾値を前記計算することが、前記計算された閾値に対して最小値を強制することを備える、Ｃ１から９のいずれか一項に記載の方法。
［Ｃ１１］
前記閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記計算された閾値として選択することとを備える、Ｃ１から９のいずれか一項に記載の方法。
［Ｃ１２］
前記第１のフレームを符号化して前記第１のフレームの主コピーを作成することと、
前記第１のフレームの前記冗長コピーを作成することと、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成することとを備える、Ｃ１から１１のいずれか一項に記載の方法。
［Ｃ１３］
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、Ｃ１２に記載の方法。
［Ｃ１４］
前記符号化された信号を前記作成することが、
前記第１のフレームの前記主コピーを含む第１のパケットを作成することと、
前記決定することに応答して、前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットを作成することとを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、Ｃ１２または１３に記載の方法。
［Ｃ１５］
前記符号化された信号を前記送信チャネルに送信することを含む、Ｃ１２から１４のいずれか一項に記載の方法。
［Ｃ１６］
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定することを含む、Ｃ１から１５のいずれか一項に記載の方法。
［Ｃ１７］
前記閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算することと、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択することとを備える、Ｃ１から１６のいずれか一項に記載の方法。
［Ｃ１８］
オーディオ信号処理のための装置であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算するための手段と、
送信チャネルの状態に関連する情報に基づいて閾値を計算するための手段と、
前記計算された推定と前記計算された閾値とを比較するための手段と、
前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定するための手段と
を備える、装置。
［Ｃ１９］
前記計算された推定が、前記第１のフレームからの情報に基づく、Ｃ１８に記載の装置。
［Ｃ２０］
前記第１のフレームからの前記情報を使用して適応コードベクトルを生成するための手段を含み、
前記計算された推定が、前記適応コードベクトルからの情報に基づく、Ｃ１９に記載の装置。
［Ｃ２１］
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ１８から２０のいずれか一項に記載の装置。
［Ｃ２２］
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、Ｃ１８から２０のいずれか一項に記載の装置。
［Ｃ２３］
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、Ｃ１８に記載の装置。
［Ｃ２４］
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、Ｃ１８から２３のいずれか一項に記載の装置。
［Ｃ２５］
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、Ｃ１８から２４のいずれか一項に記載の装置。
［Ｃ２６］
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信するための手段を含む、Ｃ１８から２５のいずれか一項に記載の装置。
［Ｃ２７］
前記閾値を計算するための前記手段が、前記計算された閾値に対して最小値を強制するように構成される、Ｃ１８から２６のいずれか一項に記載の装置。
［Ｃ２８］
前記閾値を計算するための前記手段が、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較するための手段と、
前記境界値と前記比較することの結果に応答して、前記計算された閾値として前記境界値を選択するための手段とを備える、Ｃ１８から２６のいずれか一項に記載の装置。
［Ｃ２９］
前記第１のフレームを符号化して前記第１のフレームの主コピーを作成するための手段と、
前記第１のフレームの前記冗長コピーを作成するための手段と、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成するための手段とを備える、Ｃ１８から２８のいずれか一項に記載の装置。
［Ｃ３０］
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、Ｃ２９に記載の装置。
［Ｃ３１］
前記符号化された信号を作成するための前記手段が、
前記第１のフレームの前記主コピーを含む第１のパケットを作成するための手段と、
前記決定することに応答して、前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットを作成するための手段とを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、Ｃ２９または３０に記載の装置。
［Ｃ３２］
前記符号化された信号を前記送信チャネルに送信するための手段を含む、Ｃ２９から３１のいずれか一項に記載の装置。
［Ｃ３３］
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定するための手段を含む、Ｃ１８から３２のいずれか一項に記載の装置。
［Ｃ３４］
前記閾値を計算するための前記手段が、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算するための手段と、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択するための手段とを備える、Ｃ１８から３３のいずれか一項に記載の装置。
［Ｃ３５］
オーディオ信号処理のための装置であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算するように構成された第１の計算器と、
送信チャネルの状態に関連する情報に基づいて、閾値を計算するように構成された第２の計算器と、
（Ａ）前記計算された推定と前記計算された閾値とを比較することと、（Ｂ）前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定することとを行うように構成されたモード選択器とを備える、装置。
［Ｃ３６］
前記計算された推定が、前記第１のフレームからの情報に基づく、Ｃ３５に記載の装置。
［Ｃ３７］
前記第１のフレームからの前記情報が励振信号を含み、
前記装置が、前記励振信号からの情報を使用して適応コードベクトルを作成するように構成されたベクトル生成器を含み、
前記計算された推定が、前記適応コードベクトルに基づく、Ｃ３６に記載の装置。
［Ｃ３８］
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、Ｃ３５から３７のいずれか一項に記載の装置。
［Ｃ３９］
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、Ｃ３５から３７のいずれか一項に記載の装置。
［Ｃ４０］
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、Ｃ３５に記載の装置。
［Ｃ４１］
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、Ｃ３５から４０のいずれか一項に記載の装置。
［Ｃ４２］
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、Ｃ３５から４１のいずれか一項に記載の装置。
［Ｃ４３］
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信するように構成されたチャネルデコーダを含む、Ｃ３５から４２のいずれか一項に記載の装置。
［Ｃ４４］
前記第２の計算器が、前記計算された閾値に対して最小値を強制するように構成される、Ｃ３５から４３のいずれか一項に記載の装置。
［Ｃ４５］
前記第２の計算器が、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較するように構成された比較器と、
前記境界値と前記比較することの結果に応答して、前記計算された閾値として前記境界値を選択するように構成された選択器とを備える、Ｃ３５から４３のいずれか一項に記載の装置。
［Ｃ４６］
前記第１のフレームを符号化して、（Ａ）前記第１のフレームの主コピーと（Ｂ）前記第１のフレームの前記冗長コピーとを作成するように構成されたフレームエンコーダと、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成するように構成されたチャネルエンコーダとを備える、Ｃ３５から４５のいずれか一項に記載の装置。
［Ｃ４７］
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、Ｃ４６に記載の装置。
［Ｃ４８］
前記チャネルエンコーダが、（Ａ）前記第１のフレームの前記主コピーを含む第１のパケットと（Ｂ）前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットとを作成するように構成されたパケットアセンブラを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、Ｃ４６または４７に記載の装置。
［Ｃ４９］
前記符号化された信号を前記送信チャネルに送信するように構成された無線送信機を含む、Ｃ４６から４８のいずれか一項に記載の装置。
［Ｃ５０］
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定するように構成されたオフセット計算器を含む、Ｃ３５から４９のいずれか一項に記載の装置。
［Ｃ５１］
前記第２の計算器が、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算するように構成された閾値計算器と、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択するように構成された閾値計算器とを備える、Ｃ３５から５０のいずれか一項に記載の装置。
［Ｃ５２］
有形な特徴を有する非一時的コンピュータ可読データ記憶媒体であって、前記有形な特徴が、前記特徴を読み取る機械に、Ｃ１から１７のいずれか一項に記載の方法を実行させる、非一時的コンピュータ可読データ記憶媒体。

Claims

オーディオ信号処理の方法であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算することと、
送信チャネルの状態に関連する情報に基づいて、閾値を計算することと、
前記計算された推定と前記計算された閾値とを比較することと、
前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定することとを備える、方法。
前記計算された推定が、前記第１のフレームからの情報に基づく、請求項１に記載の方法。
前記第１のフレームからの前記情報を使用して適応コードベクトルを生成することを含み、
前記計算された推定が、前記適応コードベクトルからの情報に基づく、請求項２に記載の方法。
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、請求項１から３のいずれか一項に記載の方法。
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、請求項１から３のいずれか一項に記載の方法。
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、請求項１に記載の方法。
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、請求項１から６のいずれか一項に記載の方法。
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、請求項１から７のいずれか一項に記載の方法。
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信することを含む、請求項１から８のいずれか一項に記載の方法。
前記閾値を前記計算することが、前記計算された閾値に対して最小値を強制することを備える、請求項１から９のいずれか一項に記載の方法。
前記閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較することと、
前記境界値と前記比較することの結果に応答して、前記境界値を前記計算された閾値として選択することと
を備える、請求項１から９のいずれか一項に記載の方法。
前記第１のフレームを符号化して前記第１のフレームの主コピーを作成することと、
前記第１のフレームの前記冗長コピーを作成することと、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成することとを備える、請求項１から１１のいずれか一項に記載の方法。
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、請求項１２に記載の方法。
前記符号化された信号を前記作成することが、
前記第１のフレームの前記主コピーを含む第１のパケットを作成することと、
前記決定することに応答して、前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットを作成することとを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、請求項１２または１３に記載の方法。
前記符号化された信号を前記送信チャネルに送信することを含む、請求項１２から１４のいずれか一項に記載の方法。
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定することを含む、請求項１から１５のいずれか一項に記載の方法。
前記閾値を前記計算することが、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算することと、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択することとを備える、請求項１から１６のいずれか一項に記載の方法。
オーディオ信号処理のための装置であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算するための手段と、
送信チャネルの状態に関連する情報に基づいて閾値を計算するための手段と、
前記計算された推定と前記計算された閾値とを比較するための手段と、
前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定するための手段と
を備える、装置。
前記計算された推定が、前記第１のフレームからの情報に基づく、請求項１８に記載の装置。
前記第１のフレームからの前記情報を使用して適応コードベクトルを生成するための手段を含み、
前記計算された推定が、前記適応コードベクトルからの情報に基づく、請求項１９に記載の装置。
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、請求項１８から２０のいずれか一項に記載の装置。
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、請求項１８から２０のいずれか一項に記載の装置。
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、請求項１８に記載の装置。
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、請求項１８から２３のいずれか一項に記載の装置。
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、請求項１８から２４のいずれか一項に記載の装置。
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信するための手段を含む、請求項１８から２５のいずれか一項に記載の装置。
前記閾値を計算するための前記手段が、前記計算された閾値に対して最小値を強制するように構成される、請求項１８から２６のいずれか一項に記載の装置。
前記閾値を計算するための前記手段が、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較するための手段と、
前記境界値と前記比較することの結果に応答して、前記計算された閾値として前記境界値を選択するための手段とを備える、請求項１８から２６のいずれか一項に記載の装置。
前記第１のフレームを符号化して前記第１のフレームの主コピーを作成するための手段と、
前記第１のフレームの前記冗長コピーを作成するための手段と、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成するための手段とを備える、請求項１８から２８のいずれか一項に記載の装置。
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、請求項２９に記載の装置。
前記符号化された信号を作成するための前記手段が、
前記第１のフレームの前記主コピーを含む第１のパケットを作成するための手段と、
前記決定することに応答して、前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットを作成するための手段とを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、請求項２９または３０に記載の装置。
前記符号化された信号を前記送信チャネルに送信するための手段を含む、請求項２９から３１のいずれか一項に記載の装置。
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定するための手段を含む、請求項１８から３２のいずれか一項に記載の装置。
前記閾値を計算するための前記手段が、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算するための手段と、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択するための手段とを備える、請求項１８から３３のいずれか一項に記載の装置。
オーディオ信号処理のための装置であって、
オーディオ信号内で第２のフレームに先行する第１のフレームに対する前記オーディオ信号の前記第２のフレームのコーディング従属性の推定を計算するように構成された第１の計算器と、
送信チャネルの状態に関連する情報に基づいて、閾値を計算するように構成された第２の計算器と、
（Ａ）前記計算された推定と前記計算された閾値とを比較することと、（Ｂ）前記比較することの結果に基づいて、前記第１のフレームの冗長コピーを送信することを決定することとを行うように構成されたモード選択器とを備える、装置。
前記計算された推定が、前記第１のフレームからの情報に基づく、請求項３５に記載の装置。
前記第１のフレームからの前記情報が励振信号を含み、
前記装置が、前記励振信号からの情報を使用して適応コードベクトルを作成するように構成されたベクトル生成器を含み、
前記計算された推定が、前記適応コードベクトルに基づく、請求項３６に記載の装置。
前記計算された推定が、前記第２のフレームの符号化されたバージョンからの情報に基づく、請求項３５から３７のいずれか一項に記載の装置。
前記計算された推定が、前記第２のフレームの符号化されたバージョンの適応コードブック利得値に基づく、請求項３５から３７のいずれか一項に記載の装置。
前記計算された推定が、前記第２のフレームの第１の符号化されたバージョンからの情報と、前記第２のフレームの第２の符号化されたバージョンからの情報とに基づき、
前記第１の符号化されたバージョンが、前記第１のフレームの符号化されたバージョンからの情報を使用して符号化され、
前記第２の符号化されたバージョンが、前記第１のフレームの前記符号化されたバージョンからの前記情報を使用しないで符号化される、請求項３５に記載の装置。
前記送信チャネルの前記状態に関連する前記情報が、失われたパケットの数を含み、
前記計算された閾値が、前記失われたパケットの数に基づく、請求項３５から４０のいずれか一項に記載の装置。
前記送信チャネルの前記状態に関連する前記情報が、受信されたパケットの移動時間に基づくジッタ値を含み、
前記計算された閾値が、前記ジッタ値に基づく、請求項３５から４１のいずれか一項に記載の装置。
ワイヤレス送信チャネルを介する前記送信チャネルの前記状態に関連する前記情報を受信するように構成されたチャネルデコーダを含む、請求項３５から４２のいずれか一項に記載の装置。
前記第２の計算器が、前記計算された閾値に対して最小値を強制するように構成される、請求項３５から４３のいずれか一項に記載の装置。
前記第２の計算器が、
前記送信チャネルの前記状態に関連する前記情報に基づく計算された値と境界値とを比較するように構成された比較器と、
前記境界値と前記比較することの結果に応答して、前記計算された閾値として前記境界値を選択するように構成された選択器とを備える、請求項３５から４３のいずれか一項に記載の装置。
前記第１のフレームを符号化して、（Ａ）前記第１のフレームの主コピーと（Ｂ）前記第１のフレームの前記冗長コピーとを作成するように構成されたフレームエンコーダと、
前記主コピーと前記冗長コピーとを含む符号化された信号を作成するように構成されたチャネルエンコーダとを備える、請求項３５から４５のいずれか一項に記載の装置。
前記第１のフレームの前記主コピーが、長さＬの第１の代数的コードベクトルの単位パルスの総数Ｐ１の各々に対する位置を示す第１のコード語を含み、
前記第１のフレームの前記冗長コピーが、長さＬの第２の代数的コードベクトルの単位パルスの総数Ｐ２の各々に対する位置を示す第２のコード語を含み、
Ｐ１がＰ２より大きい、請求項４６に記載の装置。
前記チャネルエンコーダが、（Ａ）前記第１のフレームの前記主コピーを含む第１のパケットと（Ｂ）前記第１のフレームの前記冗長コピーと前記第２のフレームのコピーとを含む第２のパケットとを作成するように構成されたパケットアセンブラを備え、
前記符号化された信号が前記第１のパケットおよび前記第２のパケットを含む、請求項４６または４７に記載の装置。
前記符号化された信号を前記送信チャネルに送信するように構成された無線送信機を含む、請求項４６から４８のいずれか一項に記載の装置。
前記第１のフレームと前記第２のフレームとの間の前記オーディオ信号のフレームの総数を示すオフセットの値を決定するように構成されたオフセット計算器を含む、請求項３５から４９のいずれか一項に記載の装置。
前記第２の計算器が、
前記送信チャネルの前記状態に関連する前記情報に基づいて、第１の閾値と第２の閾値とを計算するように構成された閾値計算器と、
前記第１のフレームと、前記オーディオ信号内で前記第１のフレームに隣接するフレームとのうちの少なくとも１つからの情報に基づいて、前記第１の閾値と前記第２の閾値とのうちから前記計算された閾値を選択するように構成された閾値計算器とを備える、請求項３５から５０のいずれか一項に記載の装置。
有形な特徴を有する非一時的コンピュータ可読データ記憶媒体であって、前記有形な特徴が、前記特徴を読み取る機械に、請求項１から１７のいずれか一項に記載の方法を実行させる、非一時的コンピュータ可読データ記憶媒体。