JP5405659B2

JP5405659B2 - 消去されたスピーチフレームを再構成するためのシステムおよび方法

Info

Publication number: JP5405659B2
Application number: JP2012514141A
Authority: JP
Inventors: ファン、ジェン; シンダー、ダニエル・ジェイ．; カンドハダイ、アナンサパドマナブハン・アラサニパライ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-06-04
Filing date: 2010-06-03
Publication date: 2014-02-05
Anticipated expiration: 2030-06-03
Also published as: KR101290425B1; US20100312553A1; ES2401171T3; CN102449690B; WO2010141755A1; TWI436349B; CN102449690A; JP2012529082A; KR20120019503A; TW201126510A; EP2438592A1; US8428938B2; EP2438592B1

Description

本システムおよび本方法は、通信および無線関連技術に関する。詳細には、本システムおよび本方法は、消去されたスピーチフレームを再構成するためのシステムおよび方法に関する。

デジタル音声通信は、回線交換ネットワークを介して実行されている。回線交換ネットワークは、呼の期間の間、２つの端末間で物理的パスが確立されるネットワークである。回線交換アプリケーションでは、送信端末は、物理的パスを介して、音声情報を含むパケットのシーケンスを受信端末に送る。受信端末は、スピーチを合成するために、パケット内に含まれた音声情報を使用する。

デジタル音声通信は、パケット交換ネットワークを介して実行され始めた。パケット交換ネットワークは、パケットが宛先アドレスに基づいて、その中でそのネットワークの一定のルートで送られるネットワークである。パケット交換通信の場合、ルータは、それぞれのパケットに関するパスを個々に決定して、それをその宛先に至るまで任意の利用可能なパスに送る。結果として、パケットは、同時にまたは同じ順序で受信端末に到着しない。パケットを順序よく戻し、それらのパケットを連続的な順序で再生するために、デジッタバッファを受信端末内で使用できる。

場合によっては、パケットは、送信端末から受信端末への伝送途中に失われる。失われたパケットは、合成スピーチの品質を劣化させる可能性がある。したがって、失われたパケットを再構成するためのシステムおよび方法を提供することによって、利益を実現することが可能である。ＵＳ２００６／０１７３６８７Ａ１は、フレームのシーケンスを受信するように構成された音声復号器を開示する。フレーム消去補償モジュールは、１つまたは複数の先のフレームの音声パラメータおよび１つまたは複数の後に続くフレームの音声パラメータからフレームのシーケンスの消去されたフレームのための音声パラメータを再構成する。ＥＰ１７４６５８０Ａ１は、アコースティック信号パケット通信方法を開示する。送信ユニットは、フレームアコースティック信号および異なるフレームのためのデータに対応するアコースティック信号の両方の同じパケットに包含されるパケットを送信する。フレームが失われた場合、失われたフレームは、データに対応するアコースティック信号を使用することによって取得する。本願発明は、参照がここで行われるべき添付の請求項で定義される。

伝送媒体を介した送信端末および受信端末の一例を示すブロック図。受信端末のさらなる構成を例示するブロック図。エンハンストパケットロス補償（enhanced packet loss concealment）（ＰＬＣ）モジュールを備えた受信端末の１つの構成を例示するブロック図。将来のフレーム（future frame）を使用して、スピーチフレームを再構成するための方法の一例を示すフローチャート。図４に示された方法に対応するミーンズプラスファンクション（means plus function）ブロックを例示する図。スピーチフレームのロスを補償する（conceal）ための方法のさらなる構成を例示するフローチャート。スピーチフレームのロスを補償するための方法のさらなる例を示すフローチャート。ワイヤレスデバイスにおいて使用可能な様々なコンポーネントを例示する図。

音声アプリケーションは、パケット交換ネットワーク内で実装可能である。音声情報を伴うパケットは、ネットワーク上で第１のデバイスから第２のデバイスに送信可能である。しかしながら、パケットのうちのいくつかは、パケットの伝送の間に失われる可能性がある。１つの構成では、音声情報（すなわち、スピーチ）は、スピーチフレーム内で編成可能である。パケットは、１つまたは複数のスピーチフレームを含み得る。それぞれのスピーチフレームは、サブフレームにさらに区分化できる。何らかのブロック処理が実行されている場合、任意のフレーム境界を使用できる。しかしながら、ブロック処理ではなく連続的な処理が実施される場合、スピーチサンプルは、フレーム（および、サブフレーム）に区分化されなくてよい。（バースト的なロスと呼ばれることがある）複数のスピーチフレームのロスは、受信デバイスにおいて認知されたスピーチ品質の劣化の原因であり得る。説明された例では、第１のデバイスから第２のデバイスに送信されたそれぞれのパケットは、特定の用途および全体的な設計制約に応じて、１つまたは複数のフレームを含み得る。

データアプリケーションは、回線交換ネットワーク内で実施可能であり、データを伴うパケットは、ネットワーク上で第１のデバイスから第２のデバイスに送信可能である。データパケットは、データの伝送の間に失われる可能性もある。回線交換システムにおいてデータパケット内のフレームのロスを補償する従来の方法は、若干の減衰を伴う先のフレームからの外挿を介して、失われたフレームのパラメータを再構成することである。従来のシステムによって使用されるパケット（または、フレーム）ロス補償方式は、従来のパケットロス補償（ＰＬＣ：packet loss concealment）と呼ばれる場合がある。外挿は、失われたフレームを再構成するために、先のフレームのフレームパラメータまたはピッチ波形を使用することを含み得る。パケット交換ネットワークにおいて音声通信（すなわち、ボイスオーバインターネットプロトコル（ＶｏＩＰ））の使用は増大しているが、パケット交換ネットワークにおいてパケットロス補償方式）を実施するために、回線交換ネットワークで使用される従来のＰＬＣも使用される。

従来のＰＬＣは、安定した音声領域内に単一のフレームロスが存在する場合、適度に有効であるが、伝送フレームのロスを補償するには適さない場合がある。加えて、従来のＰＬＣは、バースト的なフレームロスにもあまり有効でない場合がある。しかしながら、パケット交換ネットワークでは、高いリンク負荷および高いジッタなど、様々な理由により、パケットロスはバースト的な場合がある。例えば、パケット交換ネットワーク内において、３つ以上の連続的なパケットは失われる場合がある。この場合、従来のＰＬＣアプローチは、適度に良好な知覚品質をユーザに提供するためには十分頑強でない可能性がある。

パケット交換ネットワークにおいて改善された知覚品質を提供するために、エンハンストパケットロス補償方式を使用できる。この補償方式は、将来のフレームアルゴリズムを利用したエンハンストＰＬＣと呼ばれる場合がある。エンハンストＰＬＣアルゴリズムは、失われたパケットのパラメータのうちのいくつかまたはすべてを補間するために、（デジッタバッファ内に格納された）将来のフレームを利用することが可能である。一例では、エンハンストＰＬＣアルゴリズムは、システム容量に影響を及ぼさずに、認知されたスピーチ品質を改善することが可能である。下で説明される本システムおよび本方法は、数々のタイプのスピーチコーデックと共に使用できる。

消去されたスピーチフレームを再構成するための方法が開示される。この方法は、バッファから第２のスピーチフレームを受信することを含み得る。第２のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも高い場合がある。この方法は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定することを含むことも可能である。第３のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも低い場合がある。この方法は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方から、消去されたスピーチフレームを再構成することを含むことも可能である。

消去されたスピーチフレームを再構成するためのワイヤレスデバイスが開示される。このワイヤレスデバイスは、スピーチフレームのシーケンスを受信するように構成されたバッファを含み得る。このワイヤレスデバイスは、スピーチフレームのシーケンスを復号するように構成された音声復号器を含むことも可能である。この音声復号器は、以下のタイプ、すなわち、後続フレームおよび先のフレームのうちの１つのものである１つまたは複数のフレームから、消去されたスピーチフレームを再構成するように構成されたフレーム消去補償モジュール（frame erasure concealment module）を含み得る。後続フレームは、バッファ内の消去されたスピーチフレームのインデックス位置よりも高いインデックス位置を含み得る。先のフレームは、バッファ内の消去されたスピーチフレームのインデックス位置よりも低いインデックス位置を含み得る。

消去されたスピーチフレームを再構成するための装置が開示される。この装置は、バッファから第２のスピーチフレームを受信するための手段を含み得る。第２のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも高い場合がある。この装置は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定するための手段を含むことも可能である。第３のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも低い場合がある。この装置は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方から、消去されたスピーチフレームを再構成するための手段を含むことも可能である。

消去されたスピーチフレームを再構成するためのコンピュータプログラム製品が開示される。このコンピュータプログラム製品は、命令を有するコンピュータ可読媒体を含み得る。これらの命令は、バッファから第２のスピーチフレームを受信するためのコードを含み得る。第２のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも高い場合がある。これらの命令は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定するためのコードを含むことも可能である。第３のスピーチフレームのインデックス位置は、消去されたスピーチフレームのインデックス位置よりも低い場合がある。これらの命令は、第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方から、消去されたスピーチフレームを再構成するためのコードを含むことも可能である。

図１は、伝送媒体を介した送信端末１０２および受信端末１０４の一例を示すブロック図１００である。送信端末１０２および受信端末１０４は、電話、コンピュータ、音声ブロードキャストおよび受信装置、ビデオ会議装置などを含む音声通信をサポートすることが可能な任意のデバイスであってよい。１つの構成では、送信端末１０２および受信端末１０４は、符号分割多元接続（ＣＤＭＡ）機能など、ワイヤレス多元接続技術を用いて実施可能である。ＣＤＭＡは、スペクトル拡散通信に基づく変調および多元接続方式である。

送信端末１０２は、音声符号器１０６を含むことが可能であり、受信端末１０４は、音声復号器１０８を含むことが可能である。音声符号器１０６は、人の発話生成のモデルに基づいてパラメータを抽出することによって、第１のユーザインターフェース１１０からスピーチを圧縮するために使用可能である。送信機１１２は、伝送媒体１１４を通してこれらのパラメータを含むパケットを送信するために使用可能である。伝送媒体１１４は、インターネット、もしくは企業イントラネット、または任意のその他の伝送媒体などパケットベースのネットワークであってよい。伝送媒体１１４のもう一方の終端の受信機１１６は、パケットを受信するために使用可能である。音声復号器１０８は、パケット内のパラメータを使用して、スピーチを合成できる。合成スピーチは、受信端末１０４上の第２のユーザインターフェース１１８に提供され得る。図示されないが、巡回冗長検査（ＣＲＣ）機能、インタリーブ、デジタル変調、スペクトル拡散処理、ジッタバッファリングなどを含む、畳み込み符号化など、様々な信号処理機能を送信機１１２と受信機１１６の両方において実行することが可能である。

通信に対するそれぞれの当事者は、送信、ならびに受信が可能である。それぞれの端末は、音声符号器と音声復号器とを含み得る。音声符号器および音声復号器は、別個のデバイスであってよく、または「ボコーダ」として知られている、単一のデバイス内に統合されてもよい。以下の詳細な説明では、端末１０２、１０４は、伝送媒体１１４の一方の終端における音声符号器１０６と、もう一方の終端における音声復号器１０８とを用いて説明される。

送信端末１０２の少なくとも１つの構成では、スピーチは、それぞれがサブフレームにさらに区分化された状態で、フレーム内の第１のユーザインターフェース１１０から音声符号器１０６への入力であってよい。何らかのブロック処理が実行される場合、これらの任意のフレーム境界を使用できる。しかしながら、ブロック処理ではなく連続的な処理が実施される場合、音声サンプルは、フレーム（および、サブフレーム）に区分化されなくてもよい。説明される例では、伝送媒体１１４を通して送信されるそれぞれのパケットは、特定の用途、および全体的な設計制約に応じて、１つまたは複数のフレームを含み得る。

音声符号器１０６は、可変レート符号器、または固定レート符号器であってもよい。可変レート符号器は、スピーチコンテンツに応じて、フレームからフレームに複数の符号器モード間で動的に切り替えることが可能である。音声復号器１０８も、フレームからフレームに対応する復号器モード間で動的に切り替えることが可能である。受信端末１０４において許容信号再生を維持しながら、それぞれのフレームが利用可能な最低のビットレートを達成するために特定のモードを選ぶことが可能である。例として、アクティブスピーチは、アクティブスピーチフレームに関する符号化モードを使用して符号化され得る。バックグラウンドノイズは、無音フレームに関する符号化モードを使用して符号化され得る。

音声符号器１０６および音声復号器１０８は、線形予測符号（ＬＰＣ）を使用できる。ＬＰＣ符号化の場合、スピーチは、その強度とピッチとによって特徴付けられるスピーチソース（声帯）によってモデル形成され得る。声帯からのスピーチは、「フォルマント」と呼ばれるその共振によって特徴付けられる声道（喉および口）を介して移動する。ＬＰＣ音声符号器は、フォルマントを推定して、スピーチからその効果を除去し、残差スピーチの強度とピッチとを推定することによってスピーチを解析できる。受信終端におけるＬＰＣ音声復号器は、このプロセスを反転することによって、そのスピーチを合成することが可能である。詳細には、ＬＰＣ音声復号器は、スピーチソースを作成するために残差スピーチを使用して、（声道を表す）フィルタを作成するためにフォルマントを使用し、そのスピーチを合成するために、そのフィルタを介してそのスピーチソースを実行することが可能である。

図２は、受信端末２０４のブロック図である。この構成では、ＶｏＩＰクライアント２３０は、下でより十分議論されるデジッタバッファ２０２を含む。受信端末２０４は、さらに１つまたは複数の音声復号器２０８を含む。一例では、受信端末２０４は、ＬＰＣベースの復号器と、２つの他のタイプのコーデック（例えば、ボイススピーチ符号化方式と非ボイススピーチ符号化方式）とを含み得る。復号器２０８は、フレームエラー検出器２２６と、フレーム消去補償モジュール２０６と、スピーチ生成器２３２とを含み得る。音声復号器２０８は、ボコーダの一部として実装可能であり、独立型のエンティティとして実装可能であり、または受信端末２０４内の１つもしくは複数のエンティティを通して分散することも可能である。音声復号器２０８は、ハードウェア、ファームウェア、ソフトウェア、またはそれらの任意の組合せとして実装可能である。例として、音声復号器２０８は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ）、プログラマブル論理、専用ハードウェア、または任意のその他のハードウェアベースおよび／もしくはソフトウェアベースの処理エンティティを用いて実装可能である。音声復号器２０８は、下でその機能性の点から説明される。音声復号器２０８が実装される様式は、その特定の用途と、システム全体に課された設計制約とに依存する。

デジッタバッファ２０２は、ネットワーク輻輳、タイミングドリフト、およびルート変更に起因するパケット到着時間の変動によって引き起こされるジッタを除去するハードウェアデバイスまたはソフトウェアプロセスであってよい。デジッタバッファ２０２は、音声パケット内でスピーチフレーム２４２を受信することが可能である。加えて、デジッタバッファ２０２は、後で到着したパケットがスピーチ生成器２３２に正しい順序で継続的に提供され、その結果、音声ひずみをほとんど伴わずにクリアな接続をもたらすことができるように、新しく到着したパケットを遅延させることが可能である。デジッタバッファ２０２は、固定されてよく、または適応型であってもよい。固定デジッタバッファは、パケットに固定遅延をもたらすことができる。他方で、適応型デジッタバッファは、ネットワークの遅延内の変化に適応できる。デジッタバッファ２０２は、下で議論されるように、フレーム情報２４０をフレーム消去補償モジュール２０６に提供することが可能である。

先に述べたように、巡回冗長検査（ＣＲＣ）機能、インタリーブ、デジタル変調、スペクトル拡散処理を含めて、畳み込み符号化など、様々な信号処理機能を送信端末１０２によって実行することが可能である。フレームエラー検出器２２６は、ＣＲＣ検査機能を実行するために使用可能である。あるいは、または加えて、チェックサムとパリティビットとを含めて、その他のフレームエラー検出技法を使用できる。一例では、フレームエラー検出器２２６は、フレーム消去が発生したかどうかを決定することが可能である。「フレーム消去」は、フレームが失われたこと、またはフレームが破損されたことのいずれかを意味する可能性がある。フレームエラー検出器２２６が現在のフレームが消去されていないことを決定した場合、フレーム消去補償モジュール２０６は、デジッタバッファ２０２内に格納されたスピーチフレーム２４２を開放できる。スピーチフレーム２４２のパラメータは、フレーム消去補償モジュール２０６に渡されるフレーム情報２４０であってよい。フレーム情報２４０は、スピーチ生成器２３２に通信されて、スピーチ生成器２３２によって処理されることが可能である。

他方で、フレームエラー検出器２２６が現在のフレームが消去されていることを決定した場合、フレームエラー検出器２２６は、「フレーム消去フラグ」をフーム消去補償モジュール２０６に提供できる。後でより詳細に説明されるように、消去されたフレームに関する音声パラメータを再構成するために、フレーム消去補償モジュール２０６を使用できる。

デジッタバッファ２０２から解放されようと、またはフレーム消去補償モジュール２０６によって再構成されようと、音声パラメータは、合成スピーチ２４４を生成するために、スピーチ生成器２３２に提供可能である。スピーチ生成器２３２は、合成スピーチ２４４を生成するためのいくつかの機能を含み得る。一例では、逆コードブック（inverse codebook）２１２は、固定コードブックパラメータ２３８を使用できる。例えば、固定コードブックインデックスを残差スピーチに変換して、固定コードブック利得をその残差スピーチに適用するために、逆コードブック２１２を使用できる。ピッチ情報を残差スピーチに追加し戻す２１８ことが可能である。ピッチ情報は、「遅延」からピッチ復号器２１４によって計算できる。ピッチ復号器２１４は、スピーチサンプルの先のフレームを作成した情報のメモリであり得る。適応コードブック利得など、適応コードブックパラメータ２３６は、残差スピーチに追加される（２１８）前に、ピッチ復号器２１４によってそれぞれのサブフレーム内のメモリ情報に適用され得る。残差スピーチは、フォルマントをスピーチに追加するために、逆変換２２２からのＬＰＣ係数など、線スペクトル対２３４を使用して、フィルタ２２０を通じて実行可能である。未処理の合成スピーチは、次いで、フィルタ２２０からポストフィルタ２２４に提供可能である。ポストフィルタ２２４は、スピーチを平滑化して、帯域外成分を削減することができる音声帯域内のデジタルフィルタであってよい。もう１つの構成では、（ＰＰＰなどの）ボイススピーチ符号化方式および（ＮＥＬＰなどの）非ボイススピーチ符号化方式を、フレーム消去補償モジュール２０６によって実装することが可能である。

フレーム消去補償処理の品質は、音声パラメータを再構成する際の精度に伴って改善する。再構成されたスピーチパラメータのより高い精度は、フレームのスピーチコンテンツがより高いときに達成され得る。一例では、無音フレームは、スピーチコンテンツを含まない場合があり、したがって、何の音声品質利得も提供しない可能性がある。したがって、音声復号器２０８の少なくとも１つの構成では、フレームレートが音声品質利得を達成するために十分高いとき、将来のフレーム内の音声パラメータを使用できる。例として、先のフレームと将来のフレームの両方が無音符号化モード以外のモードで符号化される場合、音声復号器２０８は、消去されたフレーム内の音声パラメータを再構成するために、先のフレームと将来のフレームの両方の中の音声パラメータを使用できる。すなわち、先のフレームと将来のフレームの両方がアクティブスピーチ符号化モードで符号化されるとき、エンハンストパケットロス補償が使用されることになる。そうでない場合、消去されたフレーム内の音声パラメータは、先のフレームから再構成され得る。このアプローチは、音声品質利得の尤度が低いとき、フレーム消去補償プロセスの複雑さを低減する。フレーム消去の先のフレームと将来のフレームとに関する符号化モードを表示するために、（下でより十分に議論される）フレームエラー検出器２２６からの「レート決定」を使用できる。もう１つの構成では、２つ以上の将来のフレームがバッファ内に存在し得る。２つ以上の将来のフレームがバッファ内に存在するとき、そのより高いレートのフレームが、より低いレートのフレームよりも消去されたフレームからさらに離れている場合ですら、より高いレートのフレームを選ぶことが可能である。

図３は、本システムおよび本方法による、エンハンストパケットロス補償（ＰＬＣ）モジュール３０６を備えた受信端末３０４の１つの構成を例示するブロック図である。受信端末３０４は、ＶｏＩＰクライアント３３０と復号器３０８とを含み得る。ＶｏＩＰクライアント３３０は、デジッタバッファ３０２を含むことが可能であり、復号器３０８は、エンハンストＰＬＣモジュール３０６を含むことが可能である。デジッタバッファ３０２は、ＶｏＩＰクライアント３３０によって受信された１つまたは複数のスピーチフレームをバッファリングできる。

一例では、ＶｏＩＰクライアント３３０は、リアルタイムプロトコル（ＲＴＲ）パケットを受信する。リアルタイムプロトコル（ＲＴＰ）は、インターネットなど、ネットワークの音声およびビデオを配信するための標準化されたパケットフォーマットを画定する。１つの構成では、ＶｏＩＰクライアント３３０は、受信されたＲＴＰパケットをカプセル解除して、スピーチフレームにすることが可能である。加えて、ＶｏＩＰクライアント３３０は、デジッタバッファ３０２内のスピーチフレームを再順序付けることが可能である。さらに、ＶｏＩＰクライアント３３０は、適切なスピーチフレームを復号器３０８に供給することが可能である。１つの構成では、復号器３０８は、特定のスピーチフレームに関する要求をＶｏＩＰクライアント３３０に提供する。ＶｏＩＰクライアント３３０は、いくつかの復号されたパルス符号変調（ＰＣＭ）サンプル３１２を復号器３０８から受信することも可能である。一例では、ＶｏＩＰクライアント３３０は、デジッタバッファ３０２の行動を調整するために、ＰＣＭサンプル３１２によって提供された情報を使用できる。

１つの構成では、デジッタバッファ３０２は、スピーチフレームを格納する。バッファ３０２は、先のスピーチフレーム３２１と、現在のスピーチフレーム３２２と、１つまたは複数の将来スピーチフレーム３１０とを格納することが可能である。前述のように、ＶｏＩＰクライアント３３０は、順序が乱れたパケットを受信することが可能である。パケットのスピーチフレームを格納して、正確な順序に再順序付けるために、デジッタバッファ３０２を使用できる。スピーチフレームが消去された場合（例えば、フレーム消去）、デジッタバッファ３０２は、１つまたは複数の将来のフレーム（すなわち、消去されたフレームの後に発生するフレーム）を含み得る。フレームは、そのフレームに関連するインデックス位置を有し得る。例えば、将来のフレーム３１０は、現在のフレーム３２２よりもより高いインデックス位置を有し得る。同様に、現在のフレーム３２２は、先のフレーム３２１よりもより高いインデックス位置を有し得る。

上述のように、復号器３０８は、エンハンストＰＬＣモジュール３０６を含み得る。１つの構成では、復号器３０８は、非広帯域スピーチコーデック復号器であってよく、または広帯域スピーチコーデック復号器であってもよい。フレーム消去が発生して、少なくとも１つの将来のフレーム３１０が利用可能であるとき、エンハンストＰＬＣモジュール３０６は、補間ベースのパケットロス補償技法を使用して、消去されたフレームを再構成することが可能である。２つ以上の将来のフレーム３１０が利用可能である場合、より正確な将来のフレームを選択することが可能である。１つの構成では、将来のフレームのより高い精度は、より高いビットレートによって表示できる。あるいは、将来のフレームのより高い精度は、フレームの時間的な近接性によって表示できる。一例では、スピーチフレームが消去されるとき、フレームは重要なデータを含まない場合がある。例えば、現在のフレーム３２２は、消去されたスピーチフレームを表す場合がある。フレーム３２２は、復号器３０８がフレーム３２２を適切に復号することを可能にするデータを含まない場合があるため、フレーム３２２は、消去されたフレームと見なされる場合がある。フレーム消去が発生し、バッファ３０２内に少なくとも１つの将来のフレーム３１０が利用可能であるとき、ＶｏＩＰクライアント３３０は、将来のフレーム３１０と任意の関連情報とを復号器３０８に送ることができる。この関連情報は、重要なデータを含む現在のフレーム３２２であってよい。この関連情報は、現在の消去されたフレームと利用可能な将来のフレームとの間の相対ギャップを含むことも可能である。一例では、エンハンストＰＬＣモジュール３０６は、将来のフレーム３１０を使用して、現在のフレーム３２２を再構成することが可能である。スピーチフレームは、ＰＣＭデータ３２０として、音声インターフェース３１８に通信可能である。

エンハンストＰＬＣ機能を伴わないシステムでは、ＶｏＩＰクライアント３３０は、現在のフレーム３２２と、現在のフレーム３２２のレートと、位相整合を行うべきかどうか、タイムワープを行うべきかどうか、およびタイムワープをどのように行うべきかなど、その他の関連情報とを送ることによって、スピーチ復号器３０８とインターフェースを取ることが可能である。消去が発生するとき、復号器３０８に送られるとき、現在のフレーム３２２のレートを、フレーム消去など、ある値に設定することが可能である。エンハンストＰＬＣ機能性を可能にして、ＶｏＩＰクライアント３３０は、将来のフレーム３１０と、将来のフレーム３１０のレートと、（下でさらに説明される）ギャップインジケータとを復号器３０８に送ることも可能である。

図４は、将来のフレームを使用して、スピーチフレームを再構成するための方法４００の一例を示すフローチャートである。方法４００は、エンハンストＰＬＣモジュール２０６によって実施可能である。１つの構成では、インジケータを受信することが可能である（４０２）。このインジケータは、第１のフレームのインデックス位置と第２のフレームのインデックス位置との間の差を表示できる。例えば、第１のフレームは、「４」のインデックス位置を有してよく、第２のフレームは「７」のインデックス位置を有してよい。この例から、インジケータは「３」であり得る。

一例では、第２のフレームを受信することが可能である（４０４）。第２のフレームは、第１のフレームよりもより高いインデックス位置を有し得る。すなわち、第２のフレームは、第１のフレームの再生の後の時点で再生可能である。加えて、第２のフレームに関するフレームレートを受信することが可能である（４０６）。このフレームレートは、第２のフレームを符号化するために使用される符号器のレートを表示できる。フレームレートに関するさらなる詳細は、下で議論される。

１つの構成では、第１のフレームのパラメータを補間することが可能である（４０８）。このパラメータは、第２のフレームのパラメータと第３のフレームのパラメータとを使用して補間され得る。第３のフレームは、第１のフレームおよび第２のフレームよりも低いインデックス位置を含み得る。すなわち、第３のフレームは現在のフレームおよび将来のフレームの再生の前に再生されるという点で、第３のフレームは、「先のフレーム」と見なすことができる。

上で説明された図４の方法は、図５に例示されるミーンズプラスファンクションブロックに対応する、様々な（１つもしくは複数の）ハードウェアコンポーネントおよび／または（１つもしくは複数の）ソフトウェアコンポーネント、ならびに／あるいは（１つもしくは複数の）ハードウェアモジュールおよび／または（１つもしくは複数の）ソフトウェアモジュールによって実行可能である。すなわち、図４に例示されるブロック４０２から４０８は、図５に例示されるミーンズプラスファンクションブロック５０２から５０８に対応する。

図６は、パケット内のスピーチフレームのロスを補償するための方法６００のさらなる構成を例示するフローチャートである。この方法は、受信端末１０４の復号器６０８内のエンハンストＰＬＣモジュール６０６によって実装可能である。現在のフレームレート６１２は、復号器６０８によって受信可能である。現在のフレームレート６１２が現在のフレーム６２０が消去されたことを表示するある値を含むか否かについて決定６０２することができる。一例では、現在のフレームレート６１２がフレーム消去値に等しいか否かについて決定６０２することができる。現在のフレームレート６１２がフレーム消去に等しくないことが決定された場合（６０２）、現在のフレーム６２０は、復号モジュール６１８に通信される。復号モジュール６１８は、現在のフレーム６２０を復号できる。

しかしながら、現在のフレームレート６１２が、現在のフレームが消去されたことを示唆する場合、ギャップインジケータ６２２は、復号器６０８に通信される。ギャップインジケータ６２２は、将来のフレーム６１０のフレームインデックスと現在のフレーム６２０（すなわち、消去されたフレーム）のフレームインデックスとの間の差を示す変数であり得る。例えば、現在の消去されたフレーム６２０がパケット内の第１００番目のフレームであり、将来のフレーム６１０がパケット内の第１０３番目のフレームである場合、ギャップインジケータ６２２は、３に等しい可能性がある。ギャップインジケータ６２２があるしきい値よりも高いか否かについて決定することが可能である（６０４）。ギャップインジケータ６２２があるしきい値よりも高くない場合、これは、デジッタバッファ２０２内に将来のフレームが利用可能でないことを意味し得る。従来のＰＬＣモジュール６１４は、上述の技法を使用して、現在のフレーム６２０を再構成するために使用可能である。

一例では、ギャップインジケータ６２２がゼロよりも大きい場合、これは、デジッタバッファ２０２内に将来のフレーム６１０が利用可能であることを意味し得る。前述のように、現在のフレーム６２０の消去されたパラメータを再構成するために、将来のフレーム６１０を使用できる。将来のフレーム６１０は、デジッタバッファ２０２（図示せず）からエンハンストＰＬＣモジュール６０６に渡すことができる。加えて、将来のフレーム６１０に関連する将来のフレームレート６１６を、エンハンストＰＬＣモジュール６０６に渡すことも可能である。将来のフレームレート６１６は、将来のフレーム６１０のレートまたはフレームタイプを表示できる。例えば、将来のフレームレート６１６は、その将来のフレームがアクティブスピーチフレームに関する符号化モードを使用して符号化されたことを表示できる。エンハンストＰＬＣモジュール６０６は、現在のフレーム６２０の消去されたパラメータを再構成するために、将来のフレーム６１０と先のフレームとを使用できる。そのインデックス位置が現在のフレーム６２０のインデックス位置よりもより低い可能性があるため、フレームは先のフレームであり得る。すなわち、先のフレームは、現在のフレーム６２０の前にデジッタバッファ２０２から解放される。

図７は、パケット内のスピーチフレームのロスを補償するための方法７００のさらなる例を示すフローチャートである。一例では、現在の消去されたフレームは、パケット内の第ｎ番目のフレームであってよい。将来のフレーム７１０は、第（ｎ＋ｍ）番目のフレームであってよい。現在の消去されたフレームのインデックス位置と将来のフレーム７１０のインデックス位置との間の差を表示するギャップインジケータ７０８は、ｍであってよい。１つの構成では、先のフレーム（第（ｎ−１）番目のフレーム）と将来のフレーム７１０（すなわち、第（ｎ＋ｍ）番目のフレーム）との間で消去された第ｎ番目のフレームを再構成するための補間を実行できる。

一例では、将来のフレーム７１０が「悪いレート」を含むか否かについて決定することができる（７０２）。伝送の間のデータ破壊を回避するために、将来のフレーム７１０に関して悪いレート検出を実行することが可能である。将来のフレーム７１０が悪いレート検出決定７０２に合格しないことが決定された場合、消去されたフレームのパラメータを再構成するために、従来のＰＬＣモジュール７１４を使用できる。従来のＰＬＣモジュール７１４は、消去されたフレームを再構成するために、先に説明された先行技法を実施することが可能である。

将来のフレーム７１０が悪いレート検出決定７０２に合格した場合、将来のフレーム内のパラメータは、逆量子化モジュール７０６によって逆量子化され得る。１つの構成では、消去されたフレームを再構成するためにエンハンストＰＬＣモジュールによって使用されないパラメータは、逆量子化されなくてよい。例えば、将来のフレーム７１０が符号励起線形予測（ＣＥＬＰ）フレームである場合、固定コードブックインデックスは、エンハンストＰＬＣモジュールによって使用されなくてよい。したがって、固定コードブックインデックスは逆量子化されなくてよい。

エンハンストＰＬＣモジュール３０６を含む復号器１０８の場合、フレーム消去が発生したとき、実施可能な様々なタイプのパケットロス補償方法が存在し得る。これらの様々な方法の例は、１）従来のＰＬＣ方法、２）線スペクトル対（ＬＳＰ）エンハンストＰＬＣ方法、線形予測係数（ＬＰＣ）方法、イミッタンススペクトル周波数（immittance spectral frequencies）（ＩＳＦ）方法など、スペクトル包絡パラメータ（spectral envelop parameters）を決定するための方法、３）ＣＥＬＰエンハンストＰＬＣ方法、および４）ボイス符号化モードに関するエンハンストＰＬＣ方法である。

一例では、スペクトル包絡パラメータ−エンハンストＰＬＣ方法は、消去されたフレームのスペクトル包絡パラメータを補間することを必要とする。従来のＰＬＣ方法によって実行されるように、外挿によって他のパラメータを推定できる。ＣＥＬＰエンハンストＰＬＣ方法では、補間アルゴリズムを使用して、欠けているフレームの励起関連パラメータのうちのいくつかまたはすべてをＣＥＬＰフレームとして推定することも可能である。同様に、ボイススピーチ符号化方式エンハンストＰＬＣ方法では、補間アルゴリズムを使用して、消去されたフレームの励起関連パラメータのうちのいくつかまたはすべてをボイススピーチ符号化方式フレームとして推定することも可能である。１つの構成では、ＣＥＬＰエンハンストＰＬＣ方法およびボイススピーチ符号化方式エンハンストＰＬＣ方法は、「マルチプルパラメータ−エンハンストＰＬＣ方法」と呼ばれる場合もある。一般に、マルチプルパラメータ−エンハンストＰＬＣ方法は、励起関連パラメータおよび／またはスペクトル包絡パラメータのうちのいくつかもしくはすべてを補間することを必要とする。

将来のフレーム７１０のパラメータが逆量子化された後で、マルチプルパラメータ−エンハンストＰＬＣ方法が実施されるか否かについて決定を行うことが可能である（７３２）。決定７３２は、好ましくないアーティファクトを回避するために使用される。決定７３２は、先のフレームと将来のフレームの両方のタイプとレートとに基づいて行うことができる。決定７３２は、先のフレームと将来のフレームとの間の類似性に基づいて行うことも可能である。類似性インジケータは、そのスペクトル包絡パラメータ、そのピッチラグまたは波形に基づいて計算可能である。

マルチプルパラメータ−エンハンストＰＬＣ方法の信頼性は、フレーム間のショートスピーチ区分がどの程度安定しているかに依存し得る。例えば、将来のフレーム７１０および先のフレーム７２０は、マルチプルパラメータ−エンハンストＰＬＣ方法を経由して、信頼性の高い再構成されたフレームを提供するために十分に類似すべきである。先のフレーム７２０のＬＰＣ利得に対する将来のフレーム７１０のＬＰＣ利得の比率は、これら２つのフレーム間の類似性の良好な測度であり得る。ＬＰＣ利得比率が小さすぎる場合または大きすぎる場合、マルチプルパラメータ−エンハンストＰＬＣ方法を使用することは、結果として、アーティファクトを伴ってフレームを再構成させる可能性がある。

一例では、フレーム内の非ボイス領域は、本質的にランダムになる傾向がある。したがって、エンハンストＰＬＣベースの方法は、結果として、バジー音（buzzy sound）を生み出すフレームを再構成させる可能性がある。したがって、先のフレーム７２０が非ボイスフレームである場合、マルチプルパラメータ−エンハンストＰＬＣ方法（ＣＥＬＰエンハンストＰＬＣおよびボイススピーチ符号化方式エンハンストＰＬＣ）は使用できない。１つの構成では、フレームの特性、すなわち、フレームがボイスフレームであるか非ボイスフレームであるかを決定するために、いくつかの基準を使用できる。フレームを分類するための基準は、フレームタイプ、フレームレート、第１の反射係数、ゼロ交差レートなどを含む。

先のフレーム７２０と将来のフレーム７１０とが十分に類似しないとき、または先のフレーム７２０が非ボイスフレームであるとき、マルチプルパラメータ−エンハンストＰＬＣ方法は使用できない。これらの場合、従来のＰＬＣまたはスペクトル包絡パラメータ−エンハンストＰＬＣ方法を使用できる。これらの方法は、（それぞれ）従来のＰＬＣモジュール７１４と、ＬＳＰエンハンストＰＬＣモジュール７０４など、スペクトル包絡パラメータ−エンハンストＰＬＣモジュールとによって実施可能である。先のフレームのＬＰＣ利得に対する将来のフレームのＬＰＣ利得の比率が非常に小さいとき、スペクトル包絡パラメータ−エンハンストＰＬＣ方法を選ぶことができる。そのような状況において従来のＰＬＣ方法を使用することは、消去されたフレームと、その後の良好なフレームとの間の境界にアーティファクトを出現させる可能性がある。

消去されたフレームのパラメータを再構成するために、マルチプルパラメータ−エンハンストＰＬＣ方法を使用できることが決定された場合（７３２）、どのタイプのエンハンストＰＬＣ方法（ＣＥＬＰ−エンハンストＰＬＣまたはボイススピーチ符号化方式エンハンストＰＬＣ）を使用すべきかについて決定７２２することができる。従来のＰＬＣ方法およびスペクトル包絡パラメータ−エンハンストＰＬＣ方法の場合、再構成されたフレームのフレームタイプは、再構成されたフレームの前の、先のフレームと同じである。しかしながら、これは、マルチプルパラメータ−エンハンストＰＬＣ方法に関していつも当てはまるとは限らない。これまでのシステムでは、現在の消去されたフレームを補償する際に使用される符号化モードは、先のフレームの符号化モードと同じである。しかしながら、本システムおよび本方法では、消去されたフレームに関する符号化モード／符号化タイプは、先のフレームおよび将来のフレームの符号化モード／符号化タイプとは異なる場合がある。

将来のフレーム７１０が正確でない場合（すなわち、低レートの符号化モード）、将来のフレーム７１０は、エンハンストＰＬＣ方法を実行するために、有用な情報を提供しない可能性がある。したがって、将来のフレーム７１０が精度の低いフレームである場合、エンハンストＰＬＣは使用できない。代わりに、フレーム消去を補償するために、従来のＰＬＣ技法を使用できる。

現在の消去されたフレームの前の先のフレーム７２０が安定したボイスフレームであるとき、これは、先のフレーム７２０が安定したボイス領域に位置していることを意味し得る。したがって、従来のＰＬＣアルゴリズムは、欠けているフレームの再構成を積極的に試みることができる。従来のＰＬＣは、バジーアーティファクトを生成する可能性がある。したがって、先のフレーム７２０が安定したボイスフレームであり、将来のフレーム７１０がＣＥＬＰフレームであるか、または非ボイススピーチ符号化フレームである場合、フレーム消去に関して、エンハンストＰＬＣアルゴリズムを使用できる。次いで、バジーアーティファクトを回避するために、ＣＥＬＰエンハンストＰＬＣアルゴリズムを使用できる。ＣＥＬＰエンハンストＰＬＣアルゴリズムは、ＣＥＬＰエンハンストＰＬＣモジュール７２４によって実施可能である。

将来のフレーム７１０がアクティブスピーチプロトタイプピッチ期間（active speech prototype pitch period）（ＦＰＰＰ）フレームである場合、ボイススピーチ符号化方式エンハンストＰＬＣアルゴリズムを使用できる。ボイススピーチ符号化方式エンハンストＰＬＣアルゴリズムは、（プロトタイプピッチ期間（ＰＰＰ）エンハンストＰＬＣモジュールなど）ボイススピーチ符号化方式エンハンストＰＬＣモジュール７２６によって実施可能である。

１つの構成では、逆方向外挿（backward extrapolation）を行うために将来のフレームを使用できる。例えば、非ボイススピーチ符号化フレームの前に消去が発生する場合、これらのパラメータは、将来の非ボイススピーチ符号化フレームから推定可能である。これは、パラメータが現在の消去されたフレームの前のフレームから推定される従来のＰＬＣとは異なる。

ＣＥＬＰエンハンストＰＬＣモジュール７２４は、欠けているフレームをＣＥＬＰフレームとして処理できる。ＣＥＬＰエンハンストＰＬＣ方法では、現在の消去されたフレーム（フレームｎ）のスペクトル包絡パラメータと、遅延と、適応コードブック（ＡＣＢ）利得と、固定コードブック（ＦＣＢ）利得とは、先のフレーム、すなわち、フレーム（ｎ−１）と、将来のフレーム、すなわち、フレーム（ｎ＋ｍ）との間の補間によって推定可能である。固定コードブックインデックスは、ランダムに生成可能であり、次いで、これらの推定された値に基づいて、現在の消去されたフレームを再構成することが可能である。

将来のフレーム７１０がアクティブスピーチ符号励起線形予測（ＦＣＥＬＰ）フレームであるとき、将来のフレーム７１０は、そこから将来のフレーム７１０の前のフレームのピッチラグ（すなわち、フレーム（ｎ＋ｍ−１）を決定できるデルタ遅延フィールドを含み得る。現在の消去されたフレームの遅延は、第（ｎ−１）番目のフレームの遅延値と第（ｎ＋ｍ−１）番目のフレームの遅延値との間の補間によって推定可能である。遅延値の補間の前に、ピッチ２倍増／ピッチ３倍増を検出して、それを処理することが可能である。

先のフレーム７２０／将来のフレーム７１０がボイススピーチ符号化フレームまたは非ボイススピーチ符号化フレームであるとき、適応コードブック利得および固定コードブック利得などのパラメータは存在しない場合がある。そのような場合、これらのパラメータに関するいくつかの人工値を生成することが可能である。非ボイススピーチ符号化フレームの場合、ＡＣＢ利得とＦＣＢ利得とはゼロに設定できる。ボイススピーチ符号化フレームの場合、ＦＣＢ利得はゼロに設定でき、ＡＣＢ利得は、先のフレームの前のフレームと先のフレームとの間の残差領域内のピッチサイクル波形エネルギーの比率に基づいて決定可能である。例えば、先のフレームがＣＥＬＰフレームではなく、現在の消去されたフレームを補償するためにＣＥＬＰモードが使用される場合、それがＣＥＬＰフレームでない場合ですら、先のフレームのパラメータからａｃｂ＿ｇａｉｎを推定するためにモジュールを使用できる。

任意の符号化方法の場合、エンハンストＰＬＣを実行するために、先のフレームと将来のフレームとに基づいて、パラメータを補間することが可能である。先のフレームと将来のフレームとの間の類似性を表すために、類似のインジケータを計算できる。そのインジケータが何らかのしきい値よりもより低い（すなわち、あまり類似しない）場合、何らかのパラメータをエンハンストＰＬＣから推定することはできない。代わりに、従来のＰＬＣを使用できる。

ＣＥＬＰフレームと非ボイススピーチ符号化フレームとの間に１つまたは複数の消去が存在するとき、ＣＥＬＰ消去処理の間の減衰により、最後に補償されたフレームのエネルギーは非常に低い場合がある。これは、最後に補償されたフレームとその後の良好な非ボイススピーチ符号化フレームとの間にエネルギー断絶を引き起こす可能性がある。この最後の消去されたフレームを補償するために、前述のような非ボイススピーチ復号方式を使用できる。

１つの構成では、消去されたフレームを非ボイススピーチ符号化フレームとして処理することが可能である。パラメータは、将来非ボイススピーチ符号化フレームから複写され得る。再構成された残差信号に関する平滑化動作を除いて、復号は、正規の非ボイススピーチ復号と同じであってよい。この平滑化は、エネルギー継続性を達成するために、先のＣＥＬＰフレーム内の残差信号のエネルギーと現在のフレーム内の残差信号のエネルギーとに基づいて行われる。

１つの構成では、ギャップインジケータ７０８を補間係数（ＩＦ）計算機７３０に提供することが可能である。ＩＦ７２９は以下のように計算できる。

消去されたフレームｎのパラメータは、先のフレーム（ｎ−１）と将来のフレーム７１０（ｎ＋ｍ）のパラメータから補間できる。消去されたパラメータ、Ｐは、

として補間できる。

広帯域スピーチコーデックの形でエンハンストＰＬＣ方法を実装することは、非広帯域スピーチコーデックの形でエンハンストＰＬＣ方法を実装することからの拡張であり得る。広帯域スピーチコーデックの低帯域内のエンハンストＰＬＣ処理は、非広帯域スピーチコーデック内のエンハンストＰＬＣ処理と同じであり得る。広帯域スピーチコーデック内の高広域パラメータの場合、以下を適用できる。マルチプルパラメータ−エンハンストＰＬＣ方法（すなわち、ＣＥＬＰエンハンストＰＬＣまたはボイススピーチ符号化方式エンハンストＰＬＣ）によって低帯域パラメータが推定されるとき、補間によって、広帯域パラメータを推定できる。

フレーム消去が発生し、バッファ２０２内に少なくとも１つの将来のフレームが存在するとき、デジッタバッファ２０２は、将来のフレームを送るかどうかを決定する役目を果たすことができる。１つの構成では、バッファ内の第１の将来のフレームが無音フレームでないとき、かつギャップインジケータ７０８がある値以下であるとき、デジッタバッファ２０２は、第１の将来のフレームを復号器１０８に送ることになる。例えば、このある値は「４」であってよい。しかしながら、先のフレーム７２０が従来のＰＬＣ方法によって再構成され、先のフレーム７２０が連続して第２の従来のＰＬＣフレームである状況において、ギャップインジケータがある値以下である場合、デジッタバッファ２０２は、将来のフレーム７１０を送ることができる。例えば、このある値は「２」であってよい。加えて、先のフレーム７２０が従来のＰＬＣ方法によって再構成され、かつ先のフレーム７２０が連続して少なくとも第３の従来のＰＬＣフレームである状況において、バッファ２０２は、将来のフレーム７１０を復号器に供給しない場合がある。

一例では、バッファ２０２内に２つ以上のフレームが存在する場合、エンハンストＰＬＣ方法の間に使用されるように、第１の将来のフレームを復号器１０８に送ることができる。２つ以上の将来のフレームがバッファ内に存在する場合、そのより高いレートのフレームが、より低いレートのフレームよりも、消去されたフレームからさらに離れている場合ですら、より高いレートのフレームを選ぶことが可能である。あるいは、２つ以上の将来のフレームがバッファ内に存在する場合、その時間的に最も近接するフレームが、別の将来のフレームよりもより低いレートのフレームであるかどうかにかかわらず、消去されたフレームに時間的に最も近接するフレームを復号器１０８に送ることができる。

図８は、ワイヤレスデバイス８０２内で利用可能な様々なコンポーネントを例示する。ワイヤレスデバイス８０２は、本明細書で説明される様々な方法を実施するように構成され得るデバイスの一例である。ワイヤレスデバイス８０２は、遠隔局であってよい。

ワイヤレスデバイス８０２は、ワイヤレスデバイス８０２の動作を制御するプロセッサ８０４を含み得る。プロセッサ８０４は、中央処理装置（ＣＰＵ）と呼ばれる場合もある。読出し専用メモリ（ＲＯＭ）とランダムアクセスメモリ（ＲＡＭ）の両方を含み得るメモリ８０６は、命令とデータとをプロセッサ８０４に提供する。メモリ８０６の一部は、不揮発性ランダムアクセスメモリ（ＮＶＲＡＭ）を含むことも可能である。プロセッサ８０４は、通常、メモリ８０６内に格納されたプログラム命令に基づいて、論理演算と算術演算とを実行する。メモリ８０６内の命令は、本明細書で説明される方法を実施するために実行可能であり得る。

ワイヤレスデバイス８０２は、ワイヤレスデバイス８０２と遠隔位置との間のデータの送受信を可能にするために、送信機８１０と受信機８１２とを含み得るハウジング８０８を含むことも可能である。送信機８１０と受信機８１２とを組み合わせてトランシーバ８１４にすることができる。アンテナ８１６は、ハウジング８０８に取り付け可能であり、トランシーバ８１４に電気的に結合可能である。ワイヤレスデバイス８０２は、（図示されないが）複数の送信機、複数の受信機、複数のトランシーバ、および／または複数のアンテナを含むことも可能である。

ワイヤレスデバイス８０２は、トランシーバ８１４によって受信された信号のレベルを検出して、定量化するために使用可能な信号検出器８１８を含むことも可能である。信号検出器８１８は、全エネルギー、擬似雑音（ＰＮ）当たりのパイロットエネルギーチップ（pilot energy per pseudonoise（PN）chips）、電力スペクトル密度（power spectral density）、およびその他の信号などの信号を検出することが可能である。ワイヤレスデバイス８０２は、信号を処理する際に使用するためのデジタル信号プロセッサ（ＤＳＰ）８２０を含むことも可能である。

ワイヤレスデバイス８０２の様々なコンポーネントは、データバスに加えて、電力バスと、制御信号バスと、状態信号バスとを含み得るバスシステム８２２によって一緒に結合され得る。しかしながら、分かりやすくするために、様々なバスは、図８においてバスシステム８２２として例示される。

本明細書で使用される場合、用語「決定すること」は幅広い様々な動作を包含しており、したがって、「決定すること」は、計算すること、演算すること、処理すること、導出すること、調査すること、調べること（例えば、表、データベース、または別のデータ構造の中を調べること）、確認することなどを含み得る。また、「決定すること」は、受信すること（例えば、情報を受信すること）、アクセスすること（例えば、メモリ中のデータにアクセスすること）などを含み得る。また、「決定すること」は、解決すること、選択すること、選ぶこと、確立することなどを含み得る。

「基づいて」という句は、特に具体的にその他の指定がない限り、「だけに基づいて」を意味しない。すなわち、「基づいて」という句は、「だけに基づいて」と「に少なくとも基づいて」の両方を表す。

本開示に関して説明された様々な例示的な論理ブロック、モジュール、および回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ信号（ＦＰＧＡ）もしくはその他のプログラマブル論理デバイス、ディスクリートゲートもしくはトランジスタロジック、ディスクリートハードウェアコンポーネント、または本明細書で説明された機能を実行するように設計されたそれらの任意の組合せを用いて実施あるいは実行されることが可能である。汎用プロセッサはマイクロプロセッサであってよいが、代替では、プロセッサは任意の市販のプロセッサ、コントローラ、マイクロコントローラ、または状態機械であってもよい。プロセッサはまた、コンピューティングデバイスの組合せ、例えば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと共に１つもしくは複数のマイクロプロセッサ、または任意のその他のそのような構成として実施されることも可能である。

本開示に関して説明される方法またはアルゴリズムのステップは、ハードウェアの形で直接的に、プロセッサによって実行されるソフトウェアモジュールの形で、またはそれら２つの組合せの形で具体化されることが可能である。ソフトウェアモジュールは、技術分野において知られている任意の形態の記憶媒体の中に常駐することが可能である。使用され得る記憶媒体のいくつかの例は、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、着脱可能ディスク、ＣＤ−ＲＯＭなどを含む。ソフトウェアモジュールは、単一の命令、または多くの命令を備えてよく、いくつかの異なるコード区分上、異なるプログラム間、および複数の記憶媒体の全域で分散されてもよい。記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことが可能であるようにプロセッサに結合される。代替では、記憶媒体は、プロセッサと一体であってもよい。

本明細書で開示された方法は、説明された方法を達成するための１つもしくは複数のステップまたは動作を備える。これらの方法ステップおよび／または方法動作は、請求項の範囲から逸脱することなく互いに交換可能である。すなわち、ステップまたは動作の特定の順序が指定されていない限り、特定のステップおよび／もしくは動作の順序ならびに／または使用は、請求項の範囲から逸脱せずに修正可能である。

説明された機能は、ハードウェア、ソフトウェア、ファームウェア、またはそれらの任意の組合せの形で実装可能である。ソフトウェアの形で実装される場合、これらの機能は、コンピュータ可読媒体上の１つもしくは複数の命令として格納可能である。コンピュータ可読媒体は、コンピュータによってアクセス可能な任意の利用可能な媒体であってよい。限定ではなく、例として、コンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭもしくはその他の光ディスク記憶装置、磁気ディスク記憶装置もしくはその他の磁気記憶デバイス、あるいは所望されるプログラムコードを命令もしくはデータ構造の形で搬送または格納するために使用可能であり、コンピュータによってアクセス可能な任意のその他の媒体を備えることが可能である。本明細書で使用される場合、ディスク（Ｄｉｓｋ）およびディスク（ｄｉｓｃ）は、コンパクトディスク（ＣＤ）と、レーザディスクと、光ディスクと、デジタル多用途ディスク（ＤＶＤ）と、フロッピー（登録商標）ディスクと、Ｂｌｕ−ｒａｙ（登録商標）ディスクとを含み、この場合、ディスク（ｄｉｓｋｓ）は、通常、データを磁気的に再生し、一方、ディスク（ｄｉｓｃｓ）は、レーザを用いて、データを光学的に再生する。

ソフトウェアまたは命令は、伝送媒体上で送信されることも可能である。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者線（ＤＳＬ）、もしくは赤外線、無線、およびマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、またはその他の遠隔ソースから送信される場合、その同軸ケーブル、光ファイバケーブル、より対線、ＤＳＬ、または赤外線、無線、およびマイクロ波などのワイヤレス技術は、伝送媒体の定義の中に含まれる。

さらに、図４〜７によって例示された方法および技法など、本明細書で説明された方法および技法を実行するためのモジュールならびに／またはその他の適切な手段は、適用可能な場合、モバイルデバイスおよび／もしくは基地局によってダウンロード可能でありかつ／または取得可能である点を理解されたい。例えば、かかるデバイスは、本明細書で説明された方法を実行するための手段の転送を円滑にするためにサーバに結合できる。あるいは、本明細書で説明された様々な方法は、デバイスに記憶手段を結合または提供するとすぐに、モバイルデバイスおよび／または基地局が様々な方法を取得できるように、記憶手段（例えば、ランダムアクセスメモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、コンパクトディスク（ＣＤ）またはフロッピーディスクなどの物理的記憶媒体など）を経由して提供可能である。さらに、本明細書で説明された方法および技法をデバイスに提供するための任意のその他の適切な技法を利用することも可能である。

特許請求の範囲は、上で例示されたまさにその構成およびコンポーネントに限定されない点を理解されたい。請求項の範囲から逸脱せずに、本明細書で説明されたシステム、方法、および装置の構成、動作、および詳細に様々な修正、変更、ならびに改変を行うことが可能である。
以下に本願出願の当初の特許請求の範囲について記載された発明を付記する。
［１］
消去されたスピーチフレームを再構成するための方法であって、
バッファから第２のスピーチフレームを受信することと、ここで、前記第２のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定することと、ここで、前記第３のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成することと
を備える方法。
［２］
インジケータを受信することをさらに備え、前記インジケータは、前記消去されたスピーチフレームのインデックス位置と前記第２のスピーチフレームのインデックス位置との間の差を表示する、
［１］に記載の方法。
［３］
前記第２のスピーチフレームに関連するフレームレートとフレームタイプとを受信することをさらに備える、
［１］に記載の方法。
［４］
前記第２のスピーチフレームのパラメータと前記第３のスピーチフレームのパラメータとを使用して、前記消去されたスピーチフレームのパラメータを補間することをさらに備える、
［１］に記載の方法。
［５］
前記消去されたスピーチフレームを検出することをさらに備える、
［１］に記載の方法。
［６］
前記インジケータをしきい値と比較することをさらに備える、
［２］に記載の方法。
［７］
前記インジケータから補間係数を計算することをさらに備える、
［２］に記載の方法。
［８］
前記補間係数は、

として計算され、ＩＦは、前記補間係数であり、ｍは、前記インジケータである、
［７］に記載の方法。
［９］
前記消去されたスピーチフレームを再構成するために、複数の技法のうちの１つを選択することをさらに備える、
［１］に記載の方法。
［１０］
前記消去されたスピーチフレームは、符号励起線形予測（ＣＥＬＰ）フレームである、
［９］に記載の方法。
［１１］
前記消去されたスピーチフレームは、プロトタイプピッチ期間（ＰＰＰ）フレームである、
［９］に記載の方法。
［１２］
前記バッファは、２つ以上のスピーチフレームを備え、前記スピーチフレームのうちのいくつかのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも高く、他のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも低い、
［１］に記載の方法。
［１３］
前記バッファ内の前記スピーチフレームのうちの１つを選択することをさらに備え、前記スピーチフレームは、前記スピーチフレームの符号化レート、符号化タイプ、または時間的な近接性に基づいて選択される、
［１２］に記載の方法。
［１４］
前記バッファ内の前記スピーチフレームのうちの１つを選択することをさらに備え、前記スピーチフレームが前記バッファ内の前記フレームのサイズに基づいて選択される、
［１２］に記載の方法。
［１５］
前記第２のスピーチフレームの完全性を確認するために、悪いレート検査を適用することをさらに備える、
［１］に記載の方法。
［１６］
前記第３のスピーチフレームのフレームタイプが前記第２のスピーチフレームのフレームタイプとは異なる、
［１］に記載の方法。
［１７］
エンハンストパケットロス補償アルゴリズムを実施するかまたは従来のパケットロス補償アルゴリズムを実施するかを決定することをさらに備える、
［１］に記載の方法。
［１８］
エンハンストパケットロス補償アルゴリズムが実施され、前記エンハンストパケットロス補償アルゴリズムからアーティファクトが生み出されるかどうかを決定することをさらに備える、
［１７］に記載の方法。
［１９］
前記決定することは、前記第２のスピーチフレームおよび前記第３のスピーチフレームのうちの１つまたは両方のフレームレートとフレームタイプとに基づく、
［１７］に記載の方法。
［２０］
前記決定することは、前記第２のスピーチフレームおよび前記第３のスピーチフレームの類似性に基づく、
［１７］に記載の方法。
［２１］
前記スペクトル包絡推定またはピッチ波形に基づいて類似性を計算することをさらに備える、
［２０］に記載の方法。
［２２］
前記第２のスピーチフレームおよび前記第３のスピーチフレームの特性に基づいて、補間係数を選択することをさらに備える、
［１］に記載の方法。
［２３］
逆方向外挿を使用して、前記消去されたスピーチフレームのパラメータを推定することをさらに備える、［１］に記載の方法。
［２４］
前記第２のスピーチフレームおよび前記第３のスピーチフレームのフレームタイプと特性とに基づいて、逆方向外挿を使用するかどうかを決定することをさらに備える、
［２３］に記載の方法。
［２５］
前記消去されたスピーチフレームを再構成するために、前記第２のフレームのパラメータの一部を補間することをさらに備える、
［１］に記載の方法。
［２６］
消去されたスピーチフレームを再構成するためのワイヤレスデバイスであって、
スピーチフレームのシーケンスを受信するように構成されたバッファと、
スピーチフレームの前記シーケンスを復号するように構成された音声復号器と
を備え、前記音声復号器は、
後続フレームおよび先のフレームのうちの１つのものである１つまたは複数のフレームから、前記消去されたスピーチフレームを再構成するように構成されたフレーム消去補償モジュールを備え、前記後続フレームは、前記バッファ内の前記消去されたスピーチフレームのインデックス位置よりも高いインデックス位置を備え、前記先のフレームは、前記バッファ内の前記消去されたスピーチフレームのインデックス位置よりも低いインデックス位置を備える、
ワイヤレスデバイス。
［２７］
前記フレーム消去補償モジュールは、前記１つまたは複数の後続フレームのパラメータと前記１つまたは複数の先のフレームのパラメータとを使用して、前記消去されたスピーチフレームのパラメータを補間するようにさらに構成される、
［２６］に記載のワイヤレスデバイス。
［２８］
前記音声復号器は、前記消去されたスピーチフレームを検出するようにさらに構成される、
［２６］に記載のワイヤレスデバイス。
［２９］
前記フレーム消去補償モジュールは、インジケータを受信するようにさらに構成され、前記インジケータは、前記バッファ内の前記消去されたスピーチフレームのインデックス位置と第２のスピーチフレームのインデックス位置との間の差を表示する、
［２６］に記載のワイヤレスデバイス。
［３０］
前記フレーム消去補償モジュールは、前記インジケータがしきい値を超えるかどうかを決定するようにさらに構成される、
［２９］に記載のワイヤレスデバイス。
［３１］
前記フレーム消去補償モジュールは、前記インジケータから補間係数を計算するようにさらに構成される、
［２９］に記載のワイヤレスデバイス。
［３２］
前記ワイヤレスデバイスは、ハンドセットである、
［２６］に記載のワイヤレスデバイス。
［３３］
消去されたスピーチフレームを再構成するための装置であって、
バッファから第２のスピーチフレームを受信するための手段と、ここで、前記第２のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定するための手段と、前記第３のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置より低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成するための手段と
を備える装置。
［３４］
消去されたスピーチフレームを再構成するためのコンピュータプログラム製品であって、命令を有するコンピュータ可読媒体を備え、前記命令は、
バッファから第２のスピーチフレームを受信するためのコードと、ここで、前記第２のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレームと第３のスピーチフレームのうちの１つまたはそれら両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定するためのコードと、ここで、前記第３のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成するためのコードと
を備えるコンピュータプログラム製品。

Claims

消去されたスピーチフレームに関連するインデックス位置を有する前記消去されたスピーチフレームを再構成するための方法であって、
バッファから第２のスピーチフレームを受信することと、ここで、前記第２のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレーム、または前記第２のスピーチフレームと第３のスピーチフレームの両方に基づいて、どのタイプのパケットロス補償、ＰＬＣ、方法を使用するかを決定することと、ここで、前記第３のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成することと、
前記第２のスピーチフレームに関連するフレームレートとフレームタイプとを受信することと
を備え、前記決定することは、
前記消去されたスピーチフレームのインデックス位置と前記第２のスピーチフレームのインデックス位置との間の差を表示するインジケータを受信することと、
前記インジケータがしきい値よりも高いかどうかを決定することと
を備える方法。
消去されたスピーチフレームに関連するインデックス位置を有する前記消去されたスピーチフレームを再構成するための方法であって、
バッファから第２のスピーチフレームを受信することと、ここで、前記第２のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレーム、または前記第２のスピーチフレームと第３のスピーチフレームの両方に基づいて、どのタイプのパケットロス補償、ＰＬＣ、方法を使用するかを決定することと、ここで、前記第３のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成することと
を備え、前記決定することは、
前記消去されたスピーチフレームのインデックス位置と前記第２のスピーチフレームのインデックス位置との間の差を表示するインジケータを受信することと、
前記インジケータがしきい値よりも高いかどうかを決定することと
を備える方法。
前記第２のスピーチフレームのパラメータと前記第３のスピーチフレームのパラメータとを使用して、前記消去されたスピーチフレームのパラメータを補間することをさらに備える、
請求項１または２に記載の方法。
前記消去されたスピーチフレームを検出することをさらに備える、
請求項１または２に記載の方法。
前記インジケータから補間係数を計算することをさらに備える、
請求項１または２に記載の方法。
前記補間係数は、

として計算され、ＩＦは、前記補間係数であり、ｍは、前記インジケータである、
請求項５に記載の方法。
前記消去されたスピーチフレームは、符号励起線形予測（ＣＥＬＰ）フレームである、
請求項６に記載の方法。
前記消去されたスピーチフレームは、プロトタイプピッチ期間（ＰＰＰ）フレームである、
請求項６に記載の方法。
前記バッファは、２つ以上のスピーチフレームを備え、前記スピーチフレームのうちのいくつかのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも高く、他のスピーチフレームのインデックス位置は、前記消去されたスピーチフレームのインデックス位置よりも低い、
請求項１または２に記載の方法。
前記バッファ内の前記スピーチフレームのうちの１つを選択することをさらに備え、前記スピーチフレームは、前記消去フレームに対する前記スピーチフレームの符号化レート、符号化タイプ、または時間的な近接性に基づいて選択される、
請求項９に記載の方法。
前記バッファ内の前記スピーチフレームのうちの１つを選択することをさらに備え、前記スピーチフレームが前記バッファ内の前記フレームのサイズに基づいて選択される、
請求項９に記載の方法。
前記第３のスピーチフレームは、前記第２のスピーチフレームのフレームタイプと異なるフレームタイプを有する、
請求項１または２に記載の方法。
前記失われたパケットのパラメータのうちいくつかまたはすべてを補間するために将来のフレームを利用することをさらに備える、
請求項１または２に記載の方法。
使用するパケットロス補償方法のタイプについて前記決定することは、前記第２のスピーチフレームおよび前記第３のスピーチフレームのうちの１つまたは両方のフレームレートとフレームタイプとに基づく、
請求項１または２に記載の方法。
使用するパケットロス補償方法のタイプについて前記決定することは、前記第２のスピーチフレームおよび前記第３のスピーチフレームの類似性に基づく、
請求項１または２に記載の方法。
前記類似性は、スペクトル包絡推定またはピッチ波形推定に基づいて計算される、
請求項１５に記載の方法。
前記第２のスピーチフレームおよび前記第３のスピーチフレームの特性に基づいて、補間係数を選択することをさらに備える、
請求項１または２に記載の方法。
逆方向外挿を使用して、前記消去されたスピーチフレームのパラメータを推定することをさらに備える、請求項１または２に記載の方法。
前記第２のスピーチフレームおよび前記第３のスピーチフレームのフレームタイプと特性とに基づいて、逆方向外挿を使用するかどうかを決定することをさらに備える、
請求項１８に記載の方法。
前記消去されたスピーチフレームを再構成するために、前記第２のスピーチフレームのパラメータの一部を補間することをさらに備える、
請求項１または２に記載の方法。
消去されたスピーチフレームを再構成するための装置であって、
バッファから第２のスピーチフレームを受信するための手段と、ここで、前記第２のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも高い、
前記第２のスピーチフレーム、または前記第２のスピーチフレームと第３のスピーチフレームの両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定するための手段と、ここで、前記第３のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置より低い、
前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成するための手段と
を備え、前記決定するための手段は、
インジケータを受信するための手段と、ここで、前記インジケータは、前記バッファ内の前記消去されたスピーチフレームのインデックス位置と第２のスピーチフレームのインデックス位置との間の差を表示する、
前記インジケータがしきい値を超えるかどうかを決定するための手段と
を備える、装置。
前記１つまたは複数の後続フレームのパラメータと前記１つまたは複数の先のフレームのパラメータとを使用して、前記消去されたスピーチフレームのパラメータを補間するための手段をさらに備える、
請求項２１に記載の装置。
前記消去されたスピーチフレームを検出するための手段をさらに備える、
請求項２１に記載の装置。
前記インジケータから補間係数を計算するための手段をさらに備える、
請求項２１に記載の装置。
前記装置は、ハンドセットである、
請求項２１に記載の装置。
消去されたスピーチフレームを再構成するためのコンピュータプログラムであって、
少なくとも１つのコンピュータに、バッファから第２のスピーチフレームを受信させるためのコードと、ここで、前記第２のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも高い、
前記少なくとも１つのコンピュータに、前記第２のスピーチフレーム、または前記第２のスピーチフレームと第３のスピーチフレームの両方に基づいて、どのタイプのパケットロス補償（ＰＬＣ）方法を使用するかを決定させるためのコードと、ここで、前記第３のスピーチフレームのインデックス位置が前記消去されたスピーチフレームのインデックス位置よりも低い、
前記少なくとも１つのコンピュータに、前記第２のスピーチフレームと前記第３のスピーチフレームのうちの１つまたはそれら両方から、前記消去されたスピーチフレームを再構成させるためのコードと
を備え、前記決定させるためのコードは、
前記少なくとも１つのコンピュータに、前記消去されたスピーチフレームのインデックス位置と前記第２のスピーチフレームのインデックス位置との間の差を表示するインジケータを受信するためのコードと、
前記少なくとも１つのコンピュータに、前記インジケータがしきい値を超えるかどうかを決定するためのコードと
を備える、コンピュータプログラム。