JP2013210659A

JP2013210659A - 音声信号に関連するパケットに識別子を含めるためのシステムおよび方法

Info

Publication number: JP2013210659A
Application number: JP2013108189A
Authority: JP
Inventors: Rajendran Vivek; ビベク・ラジェンドラン; Ananthapadmanabhan A Kandhadai; アナンサパドマナブハン・エー．・カンドハダイ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2006-07-31
Filing date: 2013-05-22
Publication date: 2013-10-10
Also published as: EP2047461A2; WO2008016947A2; KR20090035727A; CA2657424C; JP5437067B2; EP2047461B1; US8135047B2; US20080027711A1; KR101058760B1; CA2657424A1; BRPI0714825A2; RU2421828C2; TWI384807B; WO2008016947A3; TW200816716A; CN104123946A; RU2009107164A; CN104123946B; JP2010501080A

Abstract

【課題】音声信号に関連するパケットに識別子を含める可変レート音声符号化方法を提供する。
【解決手段】受信される信号は、複数のフレームに分割される。この信号のフレームは、パケット内に符号化される。このパケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定する。この決定に基づいて、識別子がパケットの中にパックされ、このパケットが伝送される。Ｎビットパラメータから、少なくとも２つの不正な値がもたらされ、Ｎビットパラメータからの少なくとも１つのビットを使用して、情報が伝送される。情報を伝送するのに使用されるＮビットパラメータからのビットの数は、ｌｏｇ_２（Ｘ）と等しく、Ｘは、Ｎビットパラメータからもたらされる不正な値の数である。
【選択図】図３８

Description

米国法典第３５編１１９条の下における優先権の主張

本特許出願は、本特許出願の譲受人に譲渡され、参照により本明細書に明確に組み込まれている、２００６年７月３１日に出願された「SPECIAL HALF-RATE IDENTIFIER PACKET GENERATION AND DECODING」という名称の仮出願第６０／８３４，６１７号の優先権を主張するものである。

本システムおよび本方法は、一般には音声処理技術に関する。より具体的には、本システムおよび本方法は、音声信号に関連するパケットに識別子を含めることに関する。

ディジタル技術による音声の伝送が、特に長距離アプリケーションおよびディジタル無線電話アプリケーションにおいて普及してきている。このことにより、再構成された音声の知覚される品質を維持しながら通信路を介して送信されることが可能な最少量の情報を特定することへの関心が生じた。音声を圧縮するためのデバイスは、電気通信の多くの分野に用途が見出される。電気通信の例が、無線通信である。無線通信の分野は、例えば、コードレス電話機、ポケットベル、無線ローカルループ、セルラー及びポータブル通信システム（ＰＣＳ）電話システムなどの無線電話、移動ＩＰ（インターネットプロトコル）電話および衛星通信システムを含む多くのアプリケーションを有する。特に重要なアプリケーションが、移動体加入者のための無線電話である。

ある構成による広帯域音声符号器Ａ１００を示すブロック図。広帯域音声符号器Ａ１００の実施形態Ａ１０２を示すブロック図。ある構成による広帯域音声符号器Ｂ１００を示すブロック図。広帯域音声復号器Ｂ１００の実施形態Ｂ１０２を示すブロック図。フィルタバンクＡ１１０の実施形態Ａ１１２を示すブロック図。フィルタバンクＢ１２０の実施形態Ｂ１２２を示すブロック図。フィルタバンクＡ１１０の一例に関する低い帯域および高い帯域の帯域幅カバレッジを示す図。フィルタバンクＡ１１０の別の例に関する低い帯域および高い帯域の帯域幅カバレッジを示す図。フィルタバンクＡ１１２の実施形態Ａ１１４を示すブロック図。フィルタバンクＢ１２２の実施形態Ｂ１２４を示すブロック図。音声信号に関する周波数対ｌｏｇ振幅の例示的なプロット。基本線形予測符号化システムを示すブロック図。狭帯域符号器Ａ１２０の実施形態Ａ１２２を示すブロック図。狭帯域復号器Ｂ１１０の実施形態Ｂ１１２を示すブロック図。有声音声に関する残差信号に関する周波数対ｌｏｇ振幅の例示的なプロット。有声音声に関する残差信号に関する時間対ｌｏｇ振幅の例示的なプロット。長期予測も実行する基本線形予測符号化システムを示すブロック図。高帯域符号器Ａ２００の実施形態Ａ２０２を示すブロック図。高帯域励振発生器Ａ３００の実施形態Ａ３０２を示すブロック図。スペクトルエクステンダＡ４００の実施形態Ａ４０２を示すブロック図。スペクトル拡張操作の一例において様々なポイントにおける信号スペクトルを示すプロット。スペクトル拡張操作の別の例において様々なポイントにおける信号スペクトルを示すプロット。高帯域励振発生器Ａ３０２の実施形態Ａ３０４を示すブロック図。高帯域励振発生器Ａ３０２の実施形態Ａ３０６を示すブロック図。エンベロープ計算タスクＴ１００に関する流れ図。結合器４９０の実施形態４９２を示すブロック図。高帯域信号Ｓ３０の周期性の測定値を計算するアプローチを示す図。高帯域励振発生器Ａ３０２の実施形態Ａ３１２を示すブロック図。高帯域励振発生器Ａ３０２の実施形態Ａ３１４を示すブロック図。高帯域励振発生器Ａ３０２の実施形態Ａ３１６を示すブロック図。利得計算タスクＴ２００に関する流れ図。利得計算タスクＴ２００の実施形態Ｔ２１０に関する流れ図。窓関数を示す図。図２３ａに示される窓関数の、音声信号のサブフレームへの適用を示す図。高帯域復号器Ｂ２００の実施形態Ｂ２０２を示すブロック図。広帯域音声符号器Ａ１００の実施形態ＡＤ１０を示すブロック図。遅延ラインＤ１２０の実施形態Ｄ１２２を示す概略図。遅延ラインＤ１２０の実施形態Ｄ１２４を示す概略図。遅延ラインＤ１２０の実施形態Ｄ１３０を示す概略図。広帯域音声符号器ＡＤ１０の実施形態ＡＤ１２を示すブロック図。ある構成による信号処理ＭＤ１００の方法を示す流れ図。ある構成による方法Ｍ１００を示す流れ図。ある構成による方法Ｍ２００を示す流れ図。方法Ｍ２００の実施形態Ｍ２１０を示す流れ図。ある構成による方法Ｍ３００を示す流れ図。無線通信システムの一構成を示す図。信号伝送環境の一構成を示すブロック図。音声信号に関連するパケットに識別子を含めるための方法の一構成を示す流れ図。パケットを復号する方法の一構成を示す流れ図。マルチモード復号器と通信するマルチモード符号器の一構成を示すブロック図。可変レート音声符号化方法の一構成を示す流れ図。通常の狭帯域１／２レートパケット、および広帯域１／２レートパケットの一構成を示すブロック図。様々なタイプのパケットに割り当てられたビットの数を示すチャート。通信デバイスの一構成におけるいくつかの構成要素のブロック図。

詳細な説明

音声信号に関連するパケットに識別子を含めるための方法について記載する。信号が受信される。この信号は、複数のフレームに分割される。この信号のフレームは、パケット内に符号化される。このパケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかの決定が行われる。この決定に基づいて、識別子がパケットの中にパックされる。このパケットが伝送される。Ｎビットパラメータから、少なくとも２つの不正な(illegal)値がもたらされ、Ｎビットパラメータからの少なくとも１つのビットを使用して、情報が伝送される。情報を伝送するのに使用されるＮビットパラメータからのビットの数は、ｌｏｇ_２（Ｘ）と等しく、Ｘは、Ｎビットパラメータからもたらされる不正な値の数である。

また、音声信号に関連するパケットに識別子を含めるための装置についても記載する。この装置は、プロセッサと、このプロセッサと電子通信するメモリとを含む。命令が、メモリの中に格納される。これらの命令は、信号を受信し、この信号を複数のフレームに分割し、この信号のフレームをパケット内に符号化し、このパケットが広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、この決定に基づいて識別子をパケットの中にパックし、このパケットを伝送するように実行可能である。

また、音声信号に関連するパケットに識別子を含めるように構成されたシステムについても記載する。このシステムは、処理するための手段と、信号を受信するための手段とを含む。この信号を複数のフレームに分割するための手段と、この信号のフレームをパケット内に符号化するための手段とについて記載する。このパケットが広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定するための手段について記載する。この決定に基づいてパケットの中に識別子をパックするための手段と、このパケットを伝送するための手段とについて記載する。

また、コンピュータ可読媒体についても記載する。この媒体は、信号を受信し、この信号を複数のフレームに分割し、この信号のフレームをパケット内に符号化し、このパケットが広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、この決定に基づいて識別子をパケットの中にパックし、このパケットを伝送するように実行可能である命令のセットを格納するように構成される。

また、パケットを復号するための方法についても記載する。パケットが受信される。このパケットの中に含められた識別子が分析される。このパケットが、広帯域コーダによって符号化された、または狭帯域コーダによって符号化されたかの判定が行われる。この判定に基づいて、このパケットに関する復号モードが選択される。

また、パケットを復号するための装置についても記載する。この装置は、プロセッサと、このプロセッサと電子通信するメモリとを含む。命令が、このメモリの中に格納される。これらの命令は、パケットを受信し、このパケットの中に含められた識別子を分析し、このパケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、この判定に基づいて、このパケットに関する復号モードを選択するように実行可能である。

また、パケットを復号するように構成されたシステムについても記載する。このシステムは、処理するための手段と、パケットを受信するための手段とを含む。このパケットの中に含められた識別子を分析するための手段と、このパケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定するための手段とについて記載する。この判定に基づいて、このパケットに関する復号モードを選択するための手段について記載する。

また、コンピュータ可読媒体についても記載する。この媒体は、パケットを受信し、このパケットの中に含められた識別子を分析し、このパケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、この判定に基づいて、このパケットに関する復号モードを選択するように実行可能である命令のセットを格納するように構成される。

次に、システムおよび方法の様々な構成が、図を参照して説明され、図では、同様の符号が、同一の要素、または機能的に類似した要素を示す。本明細書の図において全体的に説明され、例示される本システムおよび本方法の特徴は、多種多様な異なる構成で配置され、設計されることが可能である。このため、以下の詳細な説明は、主張されるとおり、本システムおよび本方法の範囲を限定することは意図しておらず、本システムおよび本方法の構成を単に代表するものである。

本明細書で開示される構成の多くの特徴は、コンピュータソフトウェアとして、電子ハードウェアとして、またはこの両方の組み合わせとして実施されることが可能である。ハードウェアとソフトウェアの、この互換性を明確に示すのに、様々な構成要素が、一般に、それらの構成要素の機能の点で説明される。そのような機能が、ハードウェアとして実施されるか、ソフトウェアとして実施されるかは、その特定のアプリケーション、ならびに全体的なシステムに課せられた設計上の制約に依存する。当業者は、説明される機能を、それぞれの特定のアプリケーションに関して様々な仕方で実施することができるが、そのような実施上の決定は、本システムおよび本方法の範囲からの逸脱を生じさせるものと解釈されてはならない。

説明される機能が、コンピュータソフトウェアとして実施される場合、そのようなソフトウェアは、メモリ装置内に配置される、さらに／またはシステムバスまたはネットワークを介して電子信号として伝送される、任意のタイプのコンピュータ命令またはコンピュータ実行可能コードを含むことが可能である。本明細書で説明される構成要素に関連する機能を実施するソフトウェアは、単一の命令、または複数の命令を備えることが可能であり、さらに、異なるいくつかのコードセグメントにわたって、異なるプログラムの間で、さらにいくつかのメモリ装置にわたって分散させられることが可能である。

本明細書で使用される「ある構成」、「構成」、「複数の構成」、「この構成」、「これらの構成」、「１つまたは複数の構成」、「一部の構成」、「いくつかの構成」、「一構成」、「別の構成」などの用語は、特に明記しない限り、「開示されるシステムおよび方法の１つまたは複数の（ただし、必ずしもすべてではない）構成」を意味する。

「決定すること」という用語（およびこの用語の文法上の変種）は、極めて広い意味で使用される。「決定すること」という用語は、多種多様なアクションを包含し、したがって、「決定すること」には、計算すること、算出すること、処理すること、導き出すこと、調査すること、ルックアップすること（例えば、テーブル、データベース、または別のデータ構造の中でルックアップすること）、確認することなどが含まれることが可能である。また、「決定すること」には、受け取ること（例えば、情報を受け取ること）、アクセスすること（例えば、メモリの中のデータにアクセスすること）などが含まれることも可能である。また、「決定すること」には、解決すること、選択すること、選ぶこと、確立することなどが含まれることも可能である。

「〜に基づいて」という句は、特に明記しない限り、「〜だけに基づいて」を意味しない。つまり、「〜に基づいて」という句は、「〜だけに基づいて」と「少なくとも〜に基づいて」の両方を意味する。

セルラー網には、固定の送信機によるサービスをそれぞれが受けるいくつかのセルから構成された無線網が含まれることが可能である。これらの複数の送信機は、セルサイトまたは基地局と呼ばれることが可能である。セルは、通信路を介して基地局に音声信号を伝送することによってネットワーク内の他のセルと通信することができる。セルは、音声信号を複数のフレーム（例えば、２０ｍｓ（ミリ秒）の音声信号）に分割することができる。各フレームが、パケット内に符号化されることが可能である。パケットは、ある量のビットを含むことが可能であり、すると、これらのビットが、通信路を介して、受信する基地局、または受信するセルに伝送される。受信する基地局、または受信するセルは、このパケットをアンパック(unpack)し、様々なフレームを復号して、信号を再構築することができる。

パケットは、完全レートパケット（１７１ビット）として、１／２レートパケット（８０ビット）として、１／４レートパケット（４０ビット）として、または１／８レートパケット（１６ビット）として符号化されることが可能である。さらに、パケットは、狭帯域コーダまたは広帯域コーダを利用して符号化されることが可能である。広帯域コーダによって符号化されるパケットは、完全レートパケット、１／２レートパケット、または１／８レートパケットとして符号化されることが可能である。狭帯域コーダによって符号化されるパケットは、完全レートパケット、１／２レートパケット、１／４レートパケット、または１／８レートパケットとして符号化されることが可能である。広帯域コーダは、ＣＥＬＰ（符号励振線形予測：code excited linear prediction）パケットおよびＮＥＬＰ（雑音励振線形予測：noise-excited linear prediction）パケットを含め、様々なタイプのパケットに関して実施されることが可能である。狭帯域コーダは、ＣＥＬＰパケット、ＰＰＰ（プロトタイプピッチ周期：prototype pitch period）パケット、およびＮＥＬＰパケットに関して実施されることが可能である。

パケットを符号化した後、そのパケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを復号器に示すために、識別子が、そのパケットの中に含められることが可能である。識別子に含められる情報は、そのパケットが、広帯域復号器を使用して復号されるべきか、または狭帯域復号器を使用して復号されるべきかを復号器に示すことが可能である。例えば、４ＧＶ（第４世代ボコーダ）ＷＢ（広帯域）コーダが、１／２レート（８０ビット）パケットを符号化することが可能である。このパケットは、さらなるタイプのパケットを識別する明示的なビットをまったく有さない可能性がある。このため、７ビットピッチ遅れを含む無効なビットパターンを使用して、７３ビット（または７３ビット未満）を含む１つまたは複数のパケットが識別されることが可能である。しかし、４ＧＶ−ＷＢの１／２レートパケットは、７４ビットを必要とする可能性があり、このため、４ＧＶ−ＷＢの１／２レートパケットのために７ビットピッチ遅れ識別子を利用することは、可能でないことがあり得る（この例において１／２レートに関して利用可能なビットの総数は、８０であるので）。一態様では、互いに１ビットだけ異なる７ビットピッチ遅れ識別子の２つの無効なパターンを使用して、４ＧＶ−ＷＢの１／２レートパケットが識別されることが可能である。（７ビットのうちの）６ビットが、識別子として使用されることが可能であり、したがって、この異なる１ビットが、７３ビットに加えて、４ＧＶ−ＷＢの１／２レートパケットによって使用されるように解放され、このことにより、４ＧＶ−ＷＢの１／２レートパケットに関して７４ビットがもたらされる。

本明細書で説明される構成には、約８００ｂｐｓ（ビット／秒）ないし１０００ｂｐｓの帯域幅増加で広帯域音声信号の伝送および／または格納をサポートする拡張を狭帯域音声コーダに提供するように構成されることが可能なシステム、方法、および装置が含まれる。そのような実施形態の潜在的な利点には、狭帯域システムとの互換性をサポートする埋込み符号化、狭帯域符号化通信路と高帯域符号化通信路の間でビットの割当ておよび再割当てが比較的容易であること、計算リソースを多く使用する広帯域合成操作が回避されること、および計算リソースを多く使用する波形符号化ルーチンによって処理されるべき信号に関して、低いサンプリングレートが維持されることが含まれる。

文脈によって明確に限定されない限り、「計算すること」という用語は、本明細書で、算出すること、生成すること、および値のリストから選択することなどの、通常の意味のいずれを示すようにも使用される。「備えること」という用語が、この説明、および特許請求の範囲において使用される場合、この用語は、他の要素、または他の動作を排除しない。「Ａは、Ｂに基づく」という言い方は、（ｉ）「Ａは、Ｂと等しい」という事例、および（ｉｉ）「Ａは、少なくともＢに基づく」という事例を含め、通常の意味のいずれを示すようにも使用される。「インターネットプロトコル」という用語には、ＩＥＴＦ（Internet Engineering Task Force）RCF（Request for Comments）７９１において説明されるバージョン４、ならびにバージョン６などの後続のバージョンが含まれる。

図１ａは、ある構成による広帯域音声符号器Ａ１００のブロック図を示す。フィルタバンクＡ１１０が、広帯域音声信号Ｓ１０を濾波して、狭帯域信号Ｓ２０および高帯域信号Ｓ３０をもたらすように構成される。狭帯域符号器Ａ１２０が、狭帯域信号Ｓ２０を符号化して、ＮＢ（狭帯域）フィルタパラメータＳ４０および狭帯域残差信号Ｓ５０をもたらすように構成される。本明細書でさらに詳細に説明されるとおり、狭帯域符号器Ａ１２０は、狭帯域フィルタパラメータＳ４０、および符号化された狭帯域励振信号Ｓ５０を、コードブックインデックスとして、または別の量子化された形態でもたらすように通常、構成される。高帯域符号器Ａ２００が、符号化された狭帯域励振信号Ｓ５０の中の情報に従って高帯域信号Ｓ３０を符号化して、高帯域符号化パラメータＳ６０をもたらすように構成される。本明細書でさらに詳細に説明されるとおり、高帯域符号器Ａ２００は、高帯域符号化パラメータＳ６０を、コードブックインデックスとして、または別の量子化された形態でもたらすように通常、構成される。広帯域音声符号器Ａ１００の１つの特定の例が、約８．５５ｋｂｐｓ（キロビット／秒）のレートで広帯域音声信号Ｓ１０を符号化するように構成され、約７．５５ｋｂｐｓが、狭帯域フィルタパラメータＳ４０、および符号化された狭帯域励振信号Ｓ５０のために使用され、約１ｋｂｐｓが、高帯域符号化パラメータＳ６０のために使用される。

符号化された狭帯域信号と、符号化された高帯域信号を組み合わせて、単一のビットストリームにすることが所望されることが可能である。例えば、符号化された信号を、伝送（例えば、有線伝送路、光伝送路、または無線伝送路を介した）のために、または格納のために、符号化された広帯域音声信号として一緒に多重化することが所望されることが可能である。図１ｂは、狭帯域フィルタパラメータＳ４０、符号化された狭帯域励振信号Ｓ５０、および高帯域フィルタパラメータＳ６０を組み合わせて、多重化された信号Ｓ７０にするように構成された多重化装置Ａ１３０を含む広帯域音声符号器Ａ１００の実施形態Ａ１０２のブロック図を示す。

符号器Ａ１０２を含む装置は、多重化された信号Ｓ７０を、有線通信路、光通信路、または無線通信路などの伝送路に送り込むように構成された回路を含むことも可能である。また、そのような装置は、誤り訂正符号化（例えば、レート適合畳み込み符号化）および／または誤り検出符号化（例えば、巡回冗長符号化）、および／または１つまたは複数の層のネットワークプロトコル符号化（例えば、イーサネット（登録商標）、ＴＣＰ／ＩＰ、ｃｄｍａ２０００）などの１つまたは複数の通信路符号化操作を、この信号に対して実行するように構成されることも可能である。

多重化装置Ａ１３０が、符号化された狭帯域信号（狭帯域フィルタパラメータＳ４０、および符号化された狭帯域励振信号Ｓ５０を含む）を、多重化された信号Ｓ７０の分離可能なサブストリームとして埋め込んで、符号化された狭帯域信号が、高帯域信号および／または低帯域信号などの多重化された信号Ｓ７０の別の部分とは独立に回復され、復号されることが可能であるようにすることが、望ましい可能性がある。例えば、多重化された信号Ｓ７０は、符号化された狭帯域信号が、高帯域フィルタパラメータＳ６０を取り除くことによって回復されることが可能であるように構成されることが可能である。そのような特徴の１つの可能な利点は、符号化された広帯域信号を、狭帯域信号の復号はサポートするが、高帯域部分の復号はサポートしないシステムに送るのに先立って、トランスコードする必要性が回避されることである。

図２ａは、ある構成による広帯域音声復号器Ｂ１００のブロック図である。狭帯域復号器Ｂ１１０が、狭帯域フィルタパラメータＳ４０、および符号化された狭帯域励振信号Ｓ５０を復号して、狭帯域信号Ｓ９０をもたらすように構成される。高帯域復号器Ｂ２００が、符号化された狭帯域励振信号Ｓ５０に基づいて、狭帯域励振信号Ｓ８０に従って高帯域符号化パラメータＳ６０を復号して、高帯域信号Ｓ１００をもたらすように構成される。この例では、狭帯域復号器Ｂ１１０は、狭帯域励振信号Ｓ８０を高帯域復号器Ｂ２００に供給するように構成される。フィルタバンクＢ１２０が、狭帯域信号Ｓ９０と高帯域信号Ｓ１００を組み合わせて、広帯域音声信号Ｓ１１０をもたらすように構成される。

図２ｂは、多重化された信号Ｓ７０から、符号化された信号Ｓ４０、Ｓ５０、およびＳ６０をもたらすように構成された逆多重化装置Ｂ１３０を含む広帯域音声復号器Ｂ１００の実施形態Ｂ１０２のブロック図である。復号器Ｂ１０２を含む装置は、有線通信路、光通信路、または無線通信路などの伝送路から、多重化された信号Ｓ７０を受信するように構成された回路を含むことが可能である。また、そのような装置は、誤り訂正復号（例えば、レート適合畳み込み復号）および／または誤り検出復号（例えば、巡回冗長復号）、および／または１つまたは複数の層のネットワークプロトコル復号（例えば、イーサネット、ＴＣＰ／ＩＰ、ｃｄｍａ２０００）などの１つまたは複数の通信路復号操作を、この信号に対して実行するように構成されることも可能である。

フィルタバンクＡ１１０が、分割帯域スキームに従って入力信号を濾波して、低周波数副帯域および高周波数副帯域をもたらすように構成される。この特定のアプリケーションに関する設計基準に依存して、出力される副帯域は、等しい帯域幅を有することも、等しくない帯域幅を有することも可能であり、重なり合うことも、重なり合わないことも可能である。また、２つより多くの副帯域をもたらすフィルタバンクＡ１１０の構成も可能である。例えば、そのようなフィルタバンクは、狭帯域信号Ｓ２０の周波数範囲（５０〜３００Ｈｚの範囲などの）を下回る周波数範囲内の成分を含む１つまたは複数の低帯域信号をもたらすように構成されることが可能である。また、そのようなフィルタバンクが、高帯域信号Ｓ３０の周波数範囲（１４〜２０ｋＨｚ、１６〜２０ｋＨｚ、または１６〜３２ｋＨｚの範囲などの）を超える周波数範囲内の成分を含む１つまたは複数のさらなる高帯域信号をもたらすように構成されることも可能である。そのような事例において、広帯域音声符号器Ａ１００が、この信号、またはこれらの信号を別個に符号化するように実施されることが可能であり、さらに、多重化装置Ａ１３０が、多重化された信号Ｓ７０の中に、このさらなる符号化された信号、またはこれらのさらなる符号化された信号を含める（例えば、分離可能な部分として）ように構成されることが可能である。

図３ａは、低減されたサンプリングレートを有する２つの副帯域信号をもたらすように構成されたフィルタバンクＡ１１０の実施形態Ａ１１２のブロック図を示す。フィルタバンク１１０は、高周波数（つまり、高帯域）部分と、低周波数（つまり、低帯域）部分とを有する広帯域音声信号Ｓ１０を受け取るように構成される。フィルタバンクＡ１１２は、広帯域音声信号Ｓ１０を受け取って、狭帯域音声信号Ｓ２０をもたらすように構成された低帯域処理パスと、広帯域音声信号Ｓ１０を受け取って、高帯域音声信号Ｓ３０をもたらすように構成された高帯域処理パスとを含む。ローパスフィルタ１１０が、広帯域音声信号Ｓ１０を濾波して、選択された低周波数副帯域を通過させ、ハイパスフィルタ１３０が、広帯域音声信号Ｓ１０を濾波して、選択された高周波数副帯域を通過させる。両方の副帯域信号とも、広帯域音声信号Ｓ１０より狭い帯域幅を有するため、これらの信号のサンプリングレートは、情報の損失なしに、ある程度、低減されることが可能である。ダウンサンプラ１２０が、所望されるデシメーション率(decimation factor)に従ってローパス信号のサンプリングレートを低減し（例えば、信号のサンプルを取り除くこと、および／またはサンプルを平均値で置き換えることによって）、ダウンサンプラ１４０が同様に、別の所望されるデシメーション率に従ってハイパス信号のサンプリングレートを低減する。

図３ｂは、フィルタバンクＢ１２０の対応する実施形態Ｂ１２２のブロック図を示す。アップサンプラ１５０が、狭帯域信号Ｓ９０のサンプリングレートを高め（例えば、ゼロの詰め込みによって、さらに／またはサンプルを重複させることによって）、ローパスフィルタ１６０が、アップサンプリングされた信号を濾波して、低帯域部分を通過させる（例えば、エイリアシングを防止するように）。同様に、アップサンプラ１７０が、高帯域信号Ｓ１００のサンプリングレートを高め、ハイパスフィルタ１８０が、アップサンプリングされた信号を濾波して、高帯域部分を通過させる。次に、２つの通過帯域信号が合計されて、広帯域音声信号Ｓ１１０が形成される。復号器Ｂ１００の一部の実施形態において、フィルタバンクＢ１２０が、高帯域復号器Ｂ２００によって受け取られ、さらに／または計算された１つまたは複数の重みに応じて、この２つの通過帯域信号の加重和をもたらすように構成される。また、２つを超える通過帯域信号を組み合わせるフィルタバンクＢ１２０の構成も、企図される。

フィルタ１１０、１３０、１６０、１８０のそれぞれが、ＦＩＲ（有限インパルス応答）フィルタとして、またはＩＩＲ（無限インパルス応答）フィルタとして実施されることが可能である。符号器フィルタ１１０および１３０の周波数応答は、阻止帯域と通過帯域の間に対称的な形状の遷移領域を有することも、相違する形状の遷移領域を有することも可能である。同様に、復号器フィルタ１６０および１８０の周波数応答は、阻止帯域と通過帯域の間に対称的な形状の遷移領域を有することも、相違する形状の遷移領域を有することも可能である。ローパスフィルタ１１０が、ローパスフィルタ１６０と同一の応答を有し、ハイパスフィルタ１３０が、ハイパスフィルタ１８０と同一の応答を有することが、望ましい可能性がある。一例では、この２つのフィルタペア１１０、１３０、および１６０、１８０は、ＱＭＦ（直交ミラーフィルタ）バンクであり、フィルタペア１１０、１３０は、フィルタペア１６０、１８０と同一の係数を有する。

通常の例において、ローパスフィルタ１１０は、３００〜３４００Ｈｚの限られたＰＳＴＮ範囲（例えば、０ｋＨｚから４ｋＨｚまでの帯域）を含む通過帯域を有する。図４ａおよび図４ｂは、２つの異なる実施例において広帯域音声信号Ｓ１０、狭帯域信号Ｓ２０、および高帯域信号Ｓ３０の相対的な帯域幅を示す。これらの特定の例の両方において、広帯域音声信号Ｓ１０は、１６ｋＨｚというサンプリングレート（０ｋＨｚから８ｋＨｚまでの範囲内の周波数成分を表す）を有し、狭帯域信号Ｓ２０は、８ｋＨｚというサンプリングレート（０ｋＨｚから４ｋＨｚまでの範囲内の周波数成分を表す）を有する。

図４ｂの例では、２つの副帯域の間に大きな重なり合いは、存在しない。この例に示される高帯域信号Ｓ３０は、４〜８ｋＨｚの通過帯域を有するハイパスフィルタ１３０を使用して獲得されることが可能である。そのような事例では、濾波された信号を１／２にダウンサンプリングすることによって、８ｋＨｚまでサンプリングレートを低減することが望ましい可能性がある。信号に対するさらなる処理操作の計算の複雑度を大幅に低減するものと見込まれることが可能である、そのような操作は、情報の損失なしに、０ｋＨｚないし４ｋＨｚの範囲にまで通過帯域エネルギーを低下させる。

図４ｂの代替の例では、上側の副帯域と下側の副帯域が、相当の重なり合いを有して、３．５ｋＨｚないし４ｋＨｚの領域が、両方の副帯域信号によって記述されるようになっている。この例における高帯域信号Ｓ３０は、３．５〜７ｋＨｚの通過帯域を有するハイパスフィルタ１３０を使用して獲得されることが可能である。そのような事例では、濾波された信号を１６／７にダウンサンプリングすることによって、７ｋＨｚまでサンプリングレートを低減することが望ましい可能性がある。信号に対するさらなる処理操作の計算の複雑度を大幅に低減するものと見込まれることが可能である、そのような操作は、情報の損失なしに、０ｋＨｚないし３．５ｋＨｚの範囲にまで通過帯域エネルギーを低下させる。

電話通信のための通常のハンドセットにおいて、トランスデューサ（すなわち、マイクロホン、およびイヤホンもしくはスピーカ）の１つまたは複数が、７〜８ｋＨｚの周波数範囲にわたって相当の応答を欠いている。図４ｂの例では、７ｋＨｚから８ｋＨｚまでの間の広帯域音声信号Ｓ１０の部分は、符号化された信号の中に含められない。ハイパスフィルタ１３０の他の特定の例は、３．５〜７．５ｋＨｚおよび３．５〜８ｋＨｚという通過帯域を有する。

一部の実施形態では、図４ｂの例における副帯域の間の重なり合いを提供することにより、重なり合った領域にわたる平滑なロールオフを有するローパスフィルタおよび／またはハイパスフィルタの使用が可能になる。そのようなフィルタは、通常、設計するのがより容易であり、計算がそれほど複雑でなく、さらに／または、より尖鋭な応答、または「ブリックウォール（brick-wall）」応答を有するフィルタと比べて、それほど遅延を生じさせない。尖鋭な遷移領域を有するフィルタは、平滑なロールオフを有する同様な次数のフィルタと比べて、より高いサイドローブ（エイリアシングを生じさせる可能性がある）を有する傾向にある。また、尖鋭な遷移領域を有するフィルタは、リンギングアーチファクト(ringing artifact)を生じさせる可能性がある長いインパルス応答を有する可能性もある。１つまたは複数のＩＩＲフィルタを有するフィルタバンク実施形態に関して、重なり合った領域にわたる平滑なロールオフを可能にすることにより、極が単位円からより離れたフィルタ、または複数のフィルタの使用が可能になる可能性があり、このことは、安定した不動点実施(fixed-point implementation)を確実にするのに重要である可能性がある。

副帯域の重なり合いは、聞こえるアーチファクトが、より少なくなること、エイリアシングが低減されること、および／または一方の帯域から他方の帯域への遷移がそれほど目立たなくなることにつながる可能性がある低帯域と高帯域の平滑な混合を可能にする。さらに、狭帯域符号器Ａ１２０（例えば、波形コーダ）の符号化効率は、周波数が高くなるにつれて低下する可能性がある。例えば、狭帯域コーダの符号化品質は、特に背景雑音が存在する状態において、低いビットレートで低下する可能性がある。そのような事例において、副帯域の重なり合いをもたらすことにより、重なり合った領域における再現される周波数成分の品質が向上する可能性がある。

さらに、副帯域の重なり合いは、聞こえるアーチファクトが、より少なくなること、エイリアシングが低減されること、および／または一方の帯域から他方の帯域への遷移がそれほど目立たなくなることにつながる可能性がある低帯域と高帯域の平滑な混合を可能にする。そのような特徴は、狭帯域符号器Ａ１２０と高帯域符号器Ａ２００が、異なる符号化方法に従って動作する実施形態に関して特に望ましい可能性がある。例えば、異なる符号化技術は、極めて異なって聞こえる信号を生成する可能性がある。コードブックインデックスの形態でスペクトルエンベロープを符号化するコーダは、代わりに振幅スペクトルを符号化するコーダとは異なるサウンドを有する信号を生成する可能性がある。時間領域コーダ（例えば、パルス符号変調コーダ、つまり、ＰＣＭコーダ）は、周波数領域コーダとは異なるサウンドを有する信号を生成する可能性がある。スペクトルエンベロープの表現、および対応する残差信号を使用して信号を符号化するコーダは、スペクトルエンベロープの表現を使用して信号を符号化するコーダとは異なるサウンドを有する信号を生成する可能性がある。波形の表現として信号を符号化するコーダは、正弦波コーダからの出力とは異なるサウンドを有する出力を生成する可能性がある。そのような事例において、尖鋭な遷移領域を有するフィルタを使用して、重なり合わない副帯域を規定することは、合成された広帯域信号における副帯域の間で急激な、知覚的に目立つ遷移につながる可能性がある。

補完的な重なり合う周波数応答を有するＱＭＦフィルタバンクが、しばしば、副帯域技術において使用されるものの、そのようなフィルタは、本明細書で説明される広帯域符号化実施形態の少なくともいくつかには適していない。符号器におけるＱＭＦフィルタバンクは、復号器における対応するＱＭＦフィルタバンクにおいて除去される相当な程度のエイリアシングを生じさせるように構成される。そのような構成は、信号が、これらのフィルタバンク間で相当な量の歪みを被るアプリケーションに関して、この歪みが、エイリアス除去特性の有効性を減じる可能性があるので、適していない可能性がある。例えば、本明細書で説明されるアプリケーションは、非常に低いビットレートで動作するように構成された符号化実施形態を含む。非常に低いビットレートの結果、復号された信号は、元の信号と比べて大きく歪んでいるように見える可能性が高く、したがって、ＱＭＦフィルタバンクの使用は、除去されないエイリアシングにつながる可能性がある。ＱＭＦフィルタバンクを使用するアプリケーションは、通常、より高いビットレート（例えば、ＡＭＲの場合、１２ｋｂｐｓを超え、Ｇ．７２２の場合６４ｋｂｐｓを超える）を有する。

さらに、コーダが、元の信号と知覚的に似通っているが、実際には、元の信号とは相当に異なる合成された信号を生成するように構成されることが可能である。例えば、本明細書で説明されるとおり、狭帯域残差から高帯域励振を導き出すコーダが、実際の高帯域残差は、復号された信号には完全に欠如している可能性があるので、そのような信号を生成することが可能である。そのようなアプリケーションにおけるＱＭＦフィルタバンクの使用は、除去されないエイリアシングによって生じる相当な程度の歪みにつながる可能性がある。

ＱＭＦエイリアシングによって生じる歪みの量は、影響を受ける副帯域が狭い場合、エイリアシングの影響が、この副帯域の幅と等しい帯域幅に限定されるので、低減される可能性がある。しかし、各副帯域が広帯域幅の約半分を含む、本明細書で説明される例の場合、除去されないエイリアシングによって生じる歪みは、信号の相当な部分に影響を与える可能性がある。また、この信号の品質が、除去されないエイリアシングが生じる周波数帯域の場所によって影響を受ける可能性もある。例えば、広帯域音声信号の中心近く（例えば、３ｋＨｚから４ｋＨｚまでの間）で生じた歪みは、この信号の端近く（例えば、６ｋＨｚより上）で生じた歪みよりもはるかに不快である可能性がある。

ＱＭＦフィルタバンクの複数のフィルタの応答は、互いに厳密に関係しているが、フィルタバンクＡ１１０およびＢ１２０の低帯域パスと高帯域パスは、この２つの副帯域の重なり合いのほかは、完全に無関係であるスペクトルを有するように構成されることが可能である。この２つの副帯域の重なり合いを、高帯域フィルタの周波数応答が、−２０ｄＢまで低下するポイントから、低帯域フィルタの周波数応答が、−２０ｄＢまで低下するポイントまでの距離と定義する。フィルタバンクＡ１１０および／またはＢ１２０の様々な例において、この重なり合いは、約２００Ｈｚから約１ｋＨｚまでの範囲に及ぶ。約４００Ｈｚから約６００Ｈｚまでの範囲が、符号化効率と知覚的な平滑度の間の望ましいトレードオフを表すことが可能である。前述した１つの特定の例では、重なり合いは、約５００Ｈｚである。

図４ａおよび図４ｂに示される操作をいくつかの段階で実行するようにフィルタバンクＡ１１２および／またはＢ１２２を実施することが、望ましい可能性がある。例えば、図４ｃは、一連の補間、再サンプリング、デシメーション、およびその他の操作を使用してハイパスフィルタリング操作およびダウンサンプリング操作と機能的に等価な操作を実行するフィルタバンクＡ１１２の実施形態Ａ１１４のブロック図を示す。そのような実施形態は、設計するのがより容易である可能性があり、さらに／またはロジックおよび／またはコードの機能ブロックの再使用を可能にし得る。例えば、同一の機能ブロックを使用して、図４ｃに示されるとおり、１４ｋＨｚまでのデシメーション、および７ｋＨｚまでのデシメーションの操作が実行されることが可能である。スペクトル反転操作が、信号に、値が＋１と−１の間で交替する、関数ｅｊｎπまたは数列（−１）ｎを掛けることによって実施されることが可能である。スペクトル整形操作は、所望される全体的なフィルタ応答を得るように信号を整形するように構成されたローパスフィルタとして実施されることが可能である。

スペクトル反転操作の結果、高帯域信号Ｓ３０のスペクトルが、反転させられることに留意されたい。符号器、および対応する復号器における後続の操作が、これに相応して構成されることが可能である。例えば、本明細書で説明される高帯域励起発生器Ａ３００が、スペクトルが反転された形態も有する高帯域励振信号Ｓ１２０を生成するように構成されることが可能である。

図４ｄは、一連の補間、再サンプリング、およびその他の操作を使用してアップサンプリング操作およびハイパスフィルタリング操作と機能的に等価な操作を実行するフィルタバンクＢ１２２の実施形態Ｂ１２４のブロック図を示す。フィルタバンクＢ１２４は、例えば、フィルタバンクＡ１１４などの符号器のフィルタバンクにおいて実行されるのと同様の操作を逆にする、高帯域におけるスペクトル反転操作を含む。この特定の例では、フィルタバンクＢ１２４は、７１００Ｈｚにおける信号の成分を減衰させる低帯域および高帯域におけるノッチフィルタも含むが、そのようなフィルタは、オプションであり、含められなくてもよい。

狭帯域符号器Ａ１２０が、入力音声信号を（Ａ）フィルタを記述するパラメータのセット、および（Ｂ）この記述されたフィルタを駆動して、入力音声信号の合成された再現をもたらす励振信号として符号化するソース・フィルタモデルに従って実施される。図５ａは、音声信号のスペクトルエンベロープの例を示す。このスペクトルエンベロープを特徴付けるピークは、声道の共鳴を表し、フォルマントと呼ばれる。ほとんどの音声コーダは、少なくともこの粗いスペクトル構造を、フィルタ係数などのパラメータのセットとして符号化する。

図５ｂは、狭帯域信号Ｓ２０のスペクトルエンベロープの符号化に適用される基本的なソース・フィルタ構成の例を示す。分析モジュールが、ある期間（通常２０ミリ秒）にわたる音声サウンドに対応する、フィルタを特徴付けるパラメータのセットを計算する。それらのフィルタパラメータに従って構成された白色化フィルタ（分析フィルタまたは予測誤差フィルタとも呼ばれる）が、スペクトルエンベロープを除去して、信号をスペクトルに関して平坦化する。もたらされる白色化された信号（残差とも呼ばれる）は、より小さいエネルギーを有し、このため、より少ない変動を有し、元の音声信号より符号化するのが容易である。また、残差信号の符号化からもたらされる誤差が、スペクトルにわたってより均等に拡散されることも可能である。フィルタパラメータおよび残差は、通信路を介した効率的な伝送のために、通常、量子化される。復号器において、これらのフィルタパラメータに従って構成された合成フィルタが、残差に基づいて信号によって励起されて、元の音声サウンドの合成されたバージョンをもたらす。合成フィルタは、白色化フィルタの伝達関数の逆である伝達関数を有するように、通常、構成される。

図６は、狭帯域符号器Ａ１２０の基本的な実施形態Ａ１２２のブロック図を示す。この例では、ＬＰＣ（線形予測符号化）分析モジュール２１０が、ＬＰ（線形予測）係数（例えば、全極フィルタ１／Ａ（ｚ）の係数）のセットとして、狭帯域信号Ｓ２０のスペクトルエンベロープを符号化する。分析モジュールは、通常、一連の重なり合わないフレームとして入力信号を処理し、新たな係数セットが、各フレームに関して計算される。フレーム周期は、一般に、信号が、局所的に静止しているものと見込まれることが可能な周期であり、一例は、２０ミリ秒（８ｋＨｚのサンプリングレートで１６０のサンプルに相当する）である。一例では、ＬＰＣ分析モジュール２１０は、各２０ミリ秒フレームのフォルマント構造を特徴付ける１０のＬＰフィルタ係数のセットを計算するように構成される。また、入力信号を一連の重なり合うフレームとして処理する分析モジュールを実施することも可能である。

分析モジュールは、各フレームのサンプルを直接に分析するように構成されることが可能であり、あるいはサンプルにまず、窓関数（例えば、ハミング窓）に従って重み付けされることが可能である。また、この分析は、３０ミリ秒の窓などの、フレームより大きい窓にわたって実行されることも可能である。この窓は、対称的である（例えば、５−２０−５であり、したがって、２０ミリ秒のフレームの直前と直後に５ミリ秒を含む）ことも、非対称的である（例えば、１０−２０であり、したがって、先行するフレームの後の１０ミリ秒を含む）ことも可能である。ＬＰＣ分析モジュールは、Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ再帰またはＬｅｒｏｕｘ−Ｇｕｅｇｕｅｎアルゴリズムを使用してＬＰフィルタ係数を計算するように、通常、構成される。別の実施形態において、分析モジュールは、ＬＰフィルタ係数のセットの代わりに、各フレームに関するケプストラム係数のセットを計算するように構成されることが可能である。

符号器Ａ１２０の出力レートは、フィルタパラメータを量子化することによって、再現品質に比較的わずかな影響しか与えずに、大幅に低減されることが可能である。線形予測フィルタは、効率的に量子化することが困難であり、量子化および／またはエントロピー符号化のために、ＬＳＰ（線スペクトル対）またはＬＳＦ（線スペクトル周波数）などの別の表現に、通常、マップされる。図６の例では、ＬＰフィルタ係数−ＬＳＦ変換２２０が、ＬＰフィルタ係数のセットを、対応するＬＳＦセットに変換する。ＬＰフィルタ係数の他の１対１表現には、ＰＡＲＣＯＲ係数、対数断面積比の値、ＩＳＰ（イミタンススペクトル対）、ならびにＧＳＭ（登録商標）（Global System for Mobile Communications）ＡＭＲ−ＷＢ（適応マルチレート広帯域）コーデックにおいて使用されるＩＳＦ（イミタンススペクトル周波数）が含まれる。通常、ＬＰフィルタ係数セットと、対応するＬＳＦセットの間の変換は、可逆であるが、構成は、この変換が、誤りなしに可逆ではない符号器Ａ１２０の実施形態も含む。

量子化器２３０が、狭帯域ＬＳＦのセット（または他の係数表現）を量子化するように構成され、狭帯域符号器Ａ１２２が、この量子化の結果を狭帯域フィルタパラメータＳ４０として出力するように構成される。そのような量子化器には、入力ベクトルを、テーブルまたはコードブックの中の対応するベクトルエントリに対するインデックスとして符号化するベクトル量子化器が、通常、含まれる。
また、図６に示されるとおり、狭帯域符号器Ａ１２２は、フィルタ係数のセットに従って構成された白色化フィルタ２６０（分析フィルタまたは予測誤差フィルタとも呼ばれる）に狭帯域信号Ｓ２０を通すことによって、残差信号の生成も行う。この特定の例では、白色化フィルタ２６０は、ＦＩＲフィルタとして実施されるが、ＩＩＲ実施形態が使用されることも可能である。この残差信号は、通常、狭帯域フィルタパラメータＳ４０の中で表現されていない、ピッチと関係する長期構造などの、音声フレームの知覚的に重要な情報を、通常、含む。量子化器２７０が、符号化された狭帯域励振信号Ｓ５０として出力するために、この残差信号の量子化された表現を計算するように構成される。そのような量子化器には、入力ベクトルを、テーブルまたはコードブックの中の対応するベクトルエントリに対するインデックスとして符号化するベクトル量子化器が、通常、含まれる。代替として、そのような量子化器は、１つまたは複数のパラメータを送るように構成されることが可能であり、ベクトルは、スパースコードブック方法の場合と同様に、ストレージから取り出されるのではなく、これらのパラメータから復号器において動的に生成されることが可能である。そのような方法は、代数ＣＥＬＰ（コードブック励起線形予測）などの符号化スキーム、および３ＧＰＰ２（第３世代パートナーシップ２）ＥＶＲＣ（拡張可変レートコーデック）などの符号化スキームにおいて使用される。

狭帯域符号器Ａ１２０が、対応する狭帯域復号器が利用できるのと同一のフィルタパラメータ値に従って、符号化された狭帯域励振信号を生成することが望ましい。このようにして、もたらされる符号化された狭帯域励振信号は、量子化誤差などの、それらのパラメータ値における非理想性をある程度、既に見込むことが可能である。したがって、復号器が利用できるのと同一の係数値を使用して、白色化フィルタを構成することが望ましい。図６に示される符号器Ａ１２２の基本的な例において、逆量子化器２４０が、狭帯域符号化パラメータＳ４０を逆量子化し、ＬＳＦ−ＬＰフィルタ係数変換２５０が、もたらされた値を、対応するＬＰフィルタ係数セットに逆にマップし、この係数セットを使用して、量子化器２７０によって量子化された残差信号を生成するように白色化フィルタ２６０が構成される。

狭帯域符号器Ａ１２０の一部の実施形態は、コードブックベクトルのセットの中から、残差信号と最もよく合致するベクトルを識別することによって、符号化された狭帯域励振信号Ｓ５０を計算するように構成される。しかし、狭帯域符号器Ａ１２０は、残差信号を実際に生成することなしに、残差信号の量子化された表現を計算するように実施されることも可能であることに留意されたい。例えば、狭帯域符号器Ａ１２０は、いくつかのコードブックベクトルを使用して、対応する合成された信号を生成し（例えば、現在のフィルタパラメータセットに従って）、知覚的に重み付けされた領域内で元の狭帯域信号Ｓ２０と最もよく合致する、生成された信号に関連するコードブックベクトルを選択するように構成されることが可能である。

図７は、狭帯域復号器Ｂ１１０の実施形態Ｂ１１２のブロック図を示す。逆量子化器３１０が、狭帯域フィルタパラメータＳ４０を逆量子化し（この事例では、ＬＳＦのセットに）、ＬＳＦ−ＬＰフィルタ係数変換３２０が、ＬＳＦをフィルタ係数のセットに変換する（例えば、狭帯域符号器Ａ１２２の逆量子化器２４０および変換２５０に関連して前述したとおり）。逆量子化器３４０が、狭帯域残差信号Ｓ４０を逆量子化して、狭帯域励振信号Ｓ８０を生成する。フィルタ係数および狭帯域励振信号Ｓ８０に基づいて、狭帯域合成フィルタ３３０が、狭帯域信号Ｓ９０を量子化する。つまり、狭帯域合成フィルタ３３０は、逆量子化されたフィルタ係数に従って狭帯域励振信号Ｓ８０をスペクトルに関して整形して、狭帯域信号Ｓ９０をもたらすように構成される。また、狭帯域復号器Ｂ１１２は、狭帯域励振信号Ｓ８０を高帯域符号器Ａ２００に供給し、符号器Ａ２００は、本明細書で説明されるとおり、この信号Ｓ８０を使用して高帯域励振信号Ｓ１２０を導き出す。後段で説明される一部の実施形態では、狭帯域復号器Ｂ１１０が、スペクトル傾斜、ピッチ利得およびピッチ遅れ、ならびに音声モードなどの、狭帯域信号と関係するさらなる情報を高帯域復号器Ｂ２００に供給するように構成されることが可能である。

狭帯域符号器Ａ１２２と狭帯域復号器Ｂ１１２のシステムは、合成による分析音声コーデックの基本的な例である。ＣＥＬＰ（コードブック励起線形予測）符号化は、合成による分析符号化の普及した一系統であり、そのようなコーダの実施形態は、固定の適応コードブックからのエントリの選択、誤差最小化操作、および／または知覚的重み付け操作などの操作を含め、残差の波形符号化を実行することができる。合成による分析符号化の他の実施形態には、ＭＥＬＰ（混合励振線形予測）符号化、ＡＣＥＬＰ（代数ＣＥＬＰ）符号化、ＲＣＥＬＰ（緩和ＣＥＬＰ）符号化、ＲＰＥ（規則的パルス励振）符号化、ＭＰＥ（マルチパルスＣＥＬＰ）符号化、およびＶＳＥＬＰ（ベクトル和励振線形予測）符号化が含まれる。関連する符号化方法には、ＭＢＥ（多帯域励振）符号化およびＰＷＩ（プロトタイプ波形補間）符号化が含まれる。標準化された合成による分析音声コーデックの例には、ＲＥＬＰ（残差励振線形予測）を使用するＥＴＳＩ（欧州電気通信標準化協会）−ＧＳＭ（登録商標）フルレートコーデック（ＧＳＭ（登録商標）０６．１０）、ＧＳＭ（登録商標）強化フルレートコーデック（ＥＴＳＩ−ＧＳＭ（登録商標）０６．６０）、ＩＴＵ（国際電気通信連合）標準１１．８ｋｂ／秒Ｇ．７２９ＡｎｎｅｘＥ符号器、ＩＳ−１３６（時間分割多元接続スキーム）に関するＩＳ（暫定標準）−６４１コーデック、ＧＳＭ（登録商標）−ＡＭＲ（ＧＳＭ（登録商標）適応マルチレート）コーデック、および４ＧＶＴＭ（ＦｏｒｔｈＧｅｎｅｒａｔｉｏｎＶｏｃｏｄｅｒ）コーデック（カリフォルニア州サンディエゴ所在のＱＵＡＬＣＯＭＭ社）が含まれる。狭帯域符号器Ａ１２０、および対応する復号器Ｂ１１０は、これらの技術のいずれか、あるいは音声信号を、（Ａ）フィルタを記述するパラメータのセット、および（Ｂ）この記述されるフィルタを駆動して、音声信号を再現するのに使用される励振信号として音声信号を表現する他の任意の音声符号化技術（知られているか、開発されるかにかかわらず）に従って実施されることが可能である。

白色化フィルタが、狭帯域信号Ｓ２０から粗いスペクトルエンベロープを除去した後でさえ、相当な量の細かい調波構造、特に有声音声に関して、残る可能性がある。図８ａは、母音などの有声信号に関して、白色化フィルタによってもたらされる可能性があるような、残差信号の一例のスペクトルプロットを示す。この例において目に見える周期構造は、ピッチと関係し、同一の話者によって発話される異なる有声サウンドは、異なるフォルマント構造を有するが、類似したピッチ構造を有することが可能である。図８ｂは、ピッチパルスのシーケンスを時間的に示す、そのような残差信号の例の時間領域プロットを示す。

符号化効率および／または音声品質は、１つまたは複数のパラメータ値を使用して、ピッチ構造の特性を符号化することによって向上させられることが可能である。ピッチ構造の１つの重要な特性は、通常、６０Ｈｚから４００Ｈｚまでの範囲内にある、最初の調波の周波数（基本周波数とも呼ばれる）である。この特性は、通常、ピッチ遅れとも呼ばれる、基本周波数の逆として、通常、符号化される。ピッチ遅れは、１ピッチ周期内のサンプルの数を示し、１つまたは複数のコードブックインデックスとして符号化されることが可能である。男性の話者からの音声信号は、女性の話者からの音声信号と比べて、より大きいピッチ遅れを有する傾向にある。

ピッチ構造と関係する別の信号特性が、周期性であり、周期性は、調波構造の強度を示し、つまり、信号が調和性である、または非調和性である度合いを示す。周期性の２つの通常の指標が、ゼロ交差およびＮＡＣＦ（正規化された自己相関関数）である。また、周期性は、コードブック利得（例えば、量子化された適応コードブック利得）として符号化されるピッチ利得によって示されることも可能である。

狭帯域符号器Ａ１２０が、狭帯域信号Ｓ２０の長期調波構造を符号化するように構成された１つまたは複数のモジュールを含むことが可能である。図９に示されるとおり、使用されることが可能な１つの通常のＣＥＬＰパラダイムは、短期特性、つまり、粗いスペクトルエンベロープを符号化する開ループＬＰＣ分析モジュールと、その後に続く、細かいピッチ、つまり、調波構造を符号化する閉ループ長期予測分析段階を含む。短期特性は、フィルタ係数として符号化され、長期特性は、ピッチ遅れやピッチ利得などのパラメータの値として符号化される。例えば、狭帯域符号器Ａ１２０が、１つまたは複数のコードブックインデックス（例えば、固定のコードブックインデックスおよび適応コードブックインデックス）、および対応する利得値を含む形態で、符号化された狭帯域励振信号Ｓ５０を出力するように構成されることが可能である。狭帯域残差信号の、この量子化された表現の計算（例えば、量子化器２７０による）には、そのようなインデックスを選択すること、およびそのような値を計算することが含まれることが可能である。また、ピッチ構造の符号化には、ピッチプロトタイプ波形の補間が含まれることも可能であり、この操作には、連続するピッチパルス間の差を計算することが含まれることが可能である。長期構造のモデル化は、通常、雑音様であり、構造化されていない無声音声に対応するフレームに関して無効にされることが可能である。

図９に示されるパラダイムによる狭帯域復号器Ｂ１１０の実施形態が、長期構造（ピッチ構造または調波構造）が復元された後、高帯域復号器Ｂ２００に狭帯域励振信号Ｓ８０を出力するように構成されることが可能である。例えば、そのような復号器は、符号化された狭帯域励振信号Ｓ５０の逆量子化されたバージョンとして、狭帯域励振信号Ｓ８０を出力するように構成されることが可能である。もちろん、高帯域復号器Ｂ２００が、符号化された狭帯域励振信号Ｓ５０の逆量子化を実行して、狭帯域励振信号Ｓ８０を得るように、狭帯域復号器Ｂ１１０を実施することも可能である。

図９に示されるパラダイムによる高帯域音声符号器Ａ１００の実施形態において、高帯域符号器Ａ２００は、短期分析フィルタまたは白色化フィルタによってもたらされる狭帯域励振信号を受け取るように構成されることが可能である。つまり、狭帯域符号器Ａ１２０が、長期構造を符号化するのに先立って、高帯域符号器Ａ２００に狭帯域励振信号を出力するように構成されることが可能である。しかし、高帯域符号器Ａ２００が、狭帯域通信路から、広帯域復号器Ｂ２００によって受け取られるのと同一の符号化情報を受け取り、高帯域符号器Ａ２００によって生成される符号化パラメータが、その情報における非理想性をある程度、既に見込んでいることが可能であるようにすることが望ましい。このため、高帯域符号器Ａ２００が、広帯域音声符号器Ａ１００によって出力されるのと同一のパラメータ化され、さらに／または量子化された、符号化された狭帯域励振信号Ｓ５０から狭帯域励振信号Ｓ８０を再構築することが、好ましい可能性がある。このアプローチの１つの潜在的な利点は、後段で説明される高帯域利得率Ｓ６０ｂのより正確な計算である。

狭帯域信号Ｓ２０の短期構造および／または長期構造を特徴付けるパラメータに加えて、狭帯域符号器Ａ１２０は、狭帯域信号Ｓ２０の他の特性と関係するパラメータ値を生成することも可能である。広帯域音声符号器Ａ１００による出力のために適切に量子化されることが可能な、これらの値は、狭帯域フィルタパラメータＳ４０のなかに含められても、別個に出力されてもよい。また、高帯域符号器Ａ２００が、これらのさらなるパラメータの１つまたは複数に従って、高帯域符号化パラメータＳ６０を計算する（例えば、逆量子化後に）ように構成されることも可能である。広帯域音声復号器Ｂ１００において、高帯域復号器Ｂ２００が、狭帯域復号器Ｂ１１０を介して、これらのパラメータ値を受け取る（例えば、逆量子化後に）ように構成されることが可能である。代替として、高帯域復号器Ｂ２００が、これらのパラメータ値を直接に受け取る（さらに、場合により、逆量子化する）ように構成されてもよい。

さらなる狭帯域符号化パラメータの一例では、狭帯域符号器Ａ１２０が、各フレームに関するスペクトル傾斜パラメータおよび音声モードパラメータの値を生成する。スペクトル傾斜は、通過帯域にわたるスペクトルエンベロープの形状と関係し、通常、量子化された最初の反射係数によって表される。ほとんどの有声サウンドの場合、スペクトルエネルギーは、周波数が高くなるにつれて低下し、したがって、最初の反射係数は、負であり、−１に近づくことが可能である。ほとんどの無声サウンドは、平坦なスペクトルを有し、したがって、最初の反射係数が、０に近いか、または高い周波数においてより大きいエネルギーを有し、したがって、最初の反射係数は、正であり、＋１に近づくことが可能である。

音声モード（発声モードとも呼ばれる）は、現在のフレームが、有声音声を表すか、無声音声を表すかを示す。このパラメータは、フレームに関する周期性（例えば、ゼロ交差、ＮＡＣＦ、ピッチ利得）および／または音声活動の１つまたは複数の測定値に基づくバイナリ値、例えばそのような測定値としきい値との関係などを有することが可能である。他の実施形態において、音声モードパラメータは、沈黙または背景雑音などのモード、あるいは沈黙と有声音声の間の遷移を示す他の１つまたは複数の状態を有する。

高帯域符号器Ａ２００が、ソース・フィルタモデルに従って高帯域信号Ｓ３０を符号化するように構成され、このフィルタに関する励振は、符号化された狭帯域励振信号に基づく。図１０は、高帯域フィルタパラメータＳ６０ａおよび高帯域利得率Ｓ６０ｂを含む高帯域符号化パラメータＳ６０のストリームを生成するように構成された高帯域符号器Ａ２００の実施形態Ａ２０２のブロック図を示す。高帯域励振発生器Ａ３００が、符号化された狭帯域励振信号Ｓ５０から高帯域励振信号Ｓ１２０を導き出す。分析モジュールＡ２１０が、高帯域信号Ｓ３０のスペクトルエンベロープを特徴付けるパラメータ値のセットを生成する。この特定の例では、分析モジュールＡ２１０は、高帯域信号Ｓ３０の各フレームに関してＬＰＣ分析を実行して、ＬＰフィルタ係数のセットをもたらすように構成される。線形予測フィルタ係数−ＬＳＦ変換４１０が、ＬＰフィルタ係数のセットを、対応するＬＳＦセットに変換する。分析モジュール２１０および変換２２０を参照して前述したとおり、分析モジュールＡ２１０および／または変換４１０は、他の係数セット（例えば、ケプストラム係数）および／または他の係数表現（例えば、ＩＳＰ）を使用するように構成されることも可能である。

量子化器４２０が、高帯域ＬＳＦ（またはＩＳＰなどの、他の係数表現）のセットを量子化するように構成され、高帯域符号器Ａ２０２が、この量子化の結果を、高帯域フィルタパラメータＳ６０ａとして出力するように構成される。そのような量子化器には、入力ベクトルを、テーブルまたはコードブックの中の対応するベクトルエントリに対するインデックスとして符号化するベクトル量子化器が、通常、含まれる。

また、高帯域符号器Ａ２０２は、高帯域励振信号Ｓ１２０、ならびに分析モジュールＡ２１０によって生成された、符号化されたスペクトルエンベロープ（例えば、ＬＰフィルタ係数のセット）に従って、合成された高帯域信号Ｓ１３０をもたらすように構成された合成フィルタＡ２２０も含む。合成フィルタＡ２２０は、通常、ＩＩＲフィルタとして実施されるが、ＦＩＲ実施形態が使用されることも可能である。ある特定の例では、合成フィルタＡ２２０は、６次線形自己回帰フィルタとして実施される。

高帯域利得率計算器Ａ２３０が、元の高帯域信号Ｓ３０のレベルと、合成された高帯域信号Ｓ１３０のレベルとの１つまたは複数の差を計算して、フレームに関する利得エンベロープを指定する。入力ベクトルを、テーブルまたはコードブックの中の対応するベクトルエントリに対するインデックスとして符号化するベクトル量子化器として実施されることが可能な量子化器４３０が、利得エンベロープを指定する１つまたは複数の値を量子化し、高帯域符号器Ａ２０２が、この量子化の結果を高帯域利得率Ｓ６０ｂとして出力するように構成される。

図１０に示される実施形態において、合成フィルタＡ２２０が、分析モジュールＡ２１０からフィルタ係数を受け取るように構成される。高帯域符号器Ａ２０２の代替の実施形態が、高帯域フィルタパラメータＳ６０ａからのフィルタ係数を復号するように構成された逆量子化器および逆変換を含み、この事例では、合成フィルタＡ２２０は、代わりに、復号されたフィルタ係数を受け取るように構成される。そのような代替の構成は、高帯域利得計算器Ａ２３０による利得エンベロープの、より正確な計算をサポートすることができる。

１つの特定の例では、分析モジュールＡ２１０および高帯域利得計算器Ａ２３０は、１フレーム当たり６つのＬＳＦのセット、および５つの利得値のセットをそれぞれ出力し、したがって、狭帯域信号Ｓ２０の広帯域拡張が、１フレーム当たり１１のさらなる値を使用して達せられることが可能である。耳は、高い周波数における周波数誤差にそれほど敏感でない傾向があり、したがって、低いＬＰＣ次数における高帯域符号化は、より高いＬＰＣ次数における狭帯域符号化と同等の知覚的品質を有する信号をもたらすことが可能である。広帯域符号器Ａ２００の通常の実施形態は、スペクトルエンベロープの高品質の再構築に関して、１フレーム当たり８ビットないし１２ビットを出力し、時間エンベロープの高品質の再構築に関して、１フレーム当たり８ビットないし１２ビットをさらに出力するように構成されることが可能である。別の特定の例では、分析モジュールＡ２１０は、１フレーム当たり８つのＬＳＦのセットを出力する。

高帯域符号器Ａ２００の一部の実施形態は、高帯域周波数成分を有するランダム雑音信号を生成し、この雑音信号を、狭帯域信号Ｓ２０、狭帯域励振信号Ｓ８０、または広帯域信号Ｓ３０の時間領域エンベロープに従って振幅変調することによって、高帯域励振信号Ｓ１２０を生成するように構成される。そのような雑音ベースの方法は、無声サウンドに関して十分な結果をもたらすことが可能であるが、残差が、通常、調和性であり、したがって、何らかの周期構造を有する有声サウンドに関しては、望ましくない可能性がある。

高帯域励振発生器Ａ３００が、狭帯域励振信号Ｓ８０のスペクトルを高帯域周波数範囲に入り込むように拡張することによって、高帯域励振信号Ｓ１２０を生成するように構成される。図１１は、高帯域励振発生器Ａ３００の実施形態Ａ３０２のブロック図を示す。逆量子化器４５０が、符号化された狭帯域励振信号Ｓ５０を逆量子化して、狭帯域励振信号Ｓ８０をもたらすように構成される。スペクトルエクステンダＡ４００が、狭帯域励振信号Ｓ８０に基づいて調和的に拡張された（harmonically extended）信号Ｓ１６０をもたらすように構成される。結合器４７０が、雑音発生器４８０によって生成されたランダム雑音信号と、エンベロープ計算器４６０によって計算された時間領域エンベロープとを組み合わせて、変調された雑音信号Ｓ１７０をもたらすように構成される。結合器４９０は、調和的に拡張された信号Ｓ６０と、変調された雑音信号Ｓ１７０とをミキシングして、高帯域励振信号Ｓ１２０をもたらすように構成される。

一例では、スペクトルエクステンダＡ４００は、狭帯域励振信号Ｓ８０に対してスペクトル折り返し操作（ミラーリングとも呼ばれる）を実行して、調和的に拡張された信号Ｓ１６０をもたらすように構成される。スペクトル折り返しは、励振信号Ｓ８０にゼロを詰め込み、次に、エイリアスを保持するようにハイパスフィルタを適用することによって実行されることが可能である。別の例では、スペクトルエクステンダＡ４００は、狭帯域励振信号Ｓ８０をスペクトルに関して広帯域に平行移動させることによって（例えば、アップサンプリングの後に、一定周波数のコサイン信号を掛けることを介して）、調和的に拡張された信号Ｓ１６０をもたらすように構成される。

スペクトル折り返し方法およびスペクトル平行移動方法は、調波構造の位相および／または周波数が、狭帯域励振信号Ｓ８０の元の調波構造と不連続である、スペクトルに関して拡張された（spectrally extended）信号をもたらす可能性がある。例えば、そのような方法は、再構築された音声信号において金属的な響きのアーチファクトを生じさせる可能性がある、基本周波数の倍数に一般に位置しないピークを有する信号をもたらす可能性がある。また、これらの方法には、不自然に強い音の特性を有する高周波数の調波をもたらす傾向もある。さらに、ＰＳＴＮ信号が、８ｋＨｚでサンプリングされるが、３４００Ｈｚを超えないように帯域制限される可能性があるため、狭帯域励振信号Ｓ８０の上側のスペクトルは、ほとんど、またはまったくエネルギーを含まないことが可能であり、したがって、スペクトル折り返し操作またはスペクトル平行移動操作に従って生成された、拡張された信号は、３４００Ｈｚを超えると、スペクトルの穴を有する可能性がある。

調和的に拡張された信号Ｓ１６０を生成する他の方法には、狭帯域励振信号Ｓ８０の１つまたは複数の基本周波数を識別して、その情報に従って調和音を生成することが含まれる。例えば、励振信号の調波構造は、基本周波数とともに、振幅および位相の情報によって特徴付けられることが可能である。高帯域励振発生器Ａ３００の別の実施形態は、基本周波数および振幅（例えば、ピッチ遅れおよびピッチ利得によって示される）に基づいて、調和的に拡張された信号Ｓ１６０を生成する。しかし、調和的に拡張された信号が、狭帯域励振信号Ｓ８０と位相コヒーレントでない限り、もたらされる復号された音声の品質は、許容できない可能性がある。

非線形関数を使用して、狭帯域励振と位相コヒーレントであり、位相の不連続なしに調波構造を保つ高帯域励振信号が作られることが可能である。また、非線形関数は、スペクトル折り返しやスペクトル平行移動などの方法によってもたらされる純音の高周波数の調波と比べて、より自然に聞こえる傾向にある、高周波数の調波間の、より高い雑音レベルをもたらすことも可能である。スペクトルエクステンダＡ４００の様々な実施形態によって適用されることが可能な通常の、メモリのない(memoryless)非線形関数には、絶対値関数（全波整流とも呼ばれる）、半波整流、２乗、３乗、およびクリッピングが含まれる。スペクトルエクステンダＡ４００の他の実施形態は、メモリを有する非線形関数を適用するように構成されることが可能である。

図１２は、狭帯域励振信号Ｓ８０のスペクトルを拡張する非線形関数を適用するように構成されたスペクトルエクステンダＡ４００の実施形態Ａ４０２のブロック図である。アップサンプラ５１０が、狭帯域励振信号Ｓ８０をアップサンプリングするように構成される。信号を十分にアップサンプリングして、非線形関数が適用された際、エイリアシングが最小限に抑えられるようにすることが望ましい可能性がある。１つの特定の例では、アップサンプラ５１０が、信号を８倍にアップサンプリングする。アップサンプラ５１０は、入力信号にゼロを詰め込み、その結果をローパスフィルタにかけることによって、このアップサンプリング操作を実行するように構成されることが可能である。非線形関数計算器５２０が、アップサンプリングされた信号に非線形関数を適用するように構成される。２乗などの、スペクトル拡張のための他の非線形関数に優る絶対値関数の１つの潜在的な利点は、エネルギー正規化が必要とされないことである。一部の実施形態では、絶対値関数は、各サンプルの符号ビットを除去する、またはクリアすることによって、効率的に適用されることが可能である。また、非線形関数計算器５２０は、アップサンプリングされた、またはスペクトルに関して拡張された信号の振幅ワーピングを実行するように構成されることも可能である。

ダウンサンプラ５３０が、非線形関数を適用したことの、スペクトルに関して拡張された結果をダウンサンプリングするように構成される。ダウンサンプラ５３０が、バンドパスフィルタリング操作を実行して、スペクトルに関して拡張された信号の所望される周波数帯域を選択してから、サンプリングレートを低減する（例えば、不要なイメージによるエイリアシングまたは破損を低減する、または回避するように）ことが、望ましい可能性がある。また、ダウンサンプラ５３０が、複数の段階でサンプリングレートを低減することが望ましい可能性もある。

図１２ａは、周波数スケールが様々なプロットにわたって同一であるスペクトル拡張操作の一例において、様々なポイントにおける信号スペクトルを示す図である。プロット（ａ）は、狭帯域励振信号Ｓ８０の一例のスペクトルを示す。プロット（ｂ）は、信号Ｓ８０が８倍にアップサンプリングされた後のスペクトルを示す。プロット（ｃ）は、非線形関数の適用後の拡張されたスペクトルの例を示す。プロット（ｄ）は、ローパスフィルタリングの後のスペクトルを示す。この例では、通過帯域は、高帯域信号Ｓ３０の周波数上限（例えば、７ｋＨｚまたは８ｋＨｚ）まで広がる。

プロット（ｅ）は、サンプリングレートが４分の１に低減されて、広帯域信号が得られるダウンサンプリングの第１の段階後のスペクトルを示す。プロット（ｆ）は、拡張された信号の高帯域部分を選択するハイパスフィルタリング操作後のスペクトルを示し、プロット（ｇ）は、サンプリングレートが２分の１に低減されるダウンサンプリングの第２の段階後のスペクトルを示す。１つの特定の例では、ダウンサンプラ５３０は、フィルタバンクＡ１１２のハイパスフィルタ１３０およびダウンサンプラ１４０（または同一の応答を有する他の構造、もしくは他のルーチン）に広帯域信号を通して、高帯域信号Ｓ３０の周波数範囲およびサンプリングレートを有する、スペクトルに関して拡張された信号をもたらすことによって、ハイパスフィルタリング、およびダウンサンプリングの第２の段階を実行する。

プロット（ｇ）で見て取ることができるとおり、プロット（ｆ）に示されるハイパス信号のダウンサンプリングは、この信号のスペクトルの反転を生じさせる。この例では、ダウンサンプラ５３０は、信号に対するスペクトル反転操作を実行するようにも構成される。プロット（ｈ）は、信号に、値が＋１と−１の間で交替する関数ｅｊｎπまたは数列（−１）ｎを掛けることによって実行されることが可能である、スペクトル反転操作を適用したことの結果を示す。そのような操作は、信号のディジタルスペクトルを周波数領域においてπという距離だけ偏移させることと等価である。同一の結果が、ダウンサンプリング操作およびスペクトル反転操作を異なる順序で適用することによっても得られることが可能であることに留意されたい。アップサンプリングおよび／またはダウンサンプリングの操作は、高帯域信号Ｓ３０のサンプリングレート（例えば、７ｋＨｚ）を有する、スペクトルに関して拡張された信号を得る再サンプリングを含むように構成されることも可能である。

前述したとおり、フィルタバンクＡ１１０およびＢ１２０は、狭帯域信号Ｓ２０と高帯域信号Ｓ３０のいずれか、または両方が、フィルタバンクＡ１１０の出力において、スペクトルに関して反転された形態を有し、スペクトルに関して反転された形態で符号化および復号を行われ、フィルタバンクＢ１２０において再びスペクトルに関して反転されてから、広帯域音声信号Ｓ１１０において出力されるように実施されることが可能である。そのような事例では、もちろん、図１２ａに示されるスペクトル反転操作は、高帯域励振信号Ｓ１２０もスペクトルに関して反転された形態を有することが望ましいので、実施されないことが可能である。

スペクトルエクステンダＡ４０２によって実行されるスペクトル拡張操作のアップサンプリングおよびダウンサンプリングの様々なタスクは、多くの異なる仕方で構成され、並べられることが可能である。例えば、図１２ｂは、周波数スケールが様々なプロットにわたって同一であるスペクトル拡張操作の別の例において、様々なポイントにおける信号スペクトルを示す図である。プロット（ａ）は、狭帯域励振信号Ｓ８０の一例のスペクトルを示す。プロット（ｂ）は、信号Ｓ８０が２倍にアップサンプリングされた後のスペクトルを示す。プロット（ｃ）は、非線形関数の適用後の拡張されたスペクトルの例を示す。この事例では、より高い周波数において生じることが可能なエイリアシングは、許容される。

プロット（ｄ）は、スペクトル反転操作の後のスペクトルを示す。プロット（ｅ）は、サンプリングレートが２分の１に低減されて、所望される、スペクトルに関して拡張された信号が得られるダウンサンプリングの単一の段階の後のスペクトルを示す。この例では、信号は、スペクトルに関して反転された形態になっており、そのような形態で広帯域信号Ｓ３０を処理した高帯域符号器Ａ２００の実施形態において使用されることが可能である。

非線形関数計算器５２０によって生成される、スペクトルに関して拡張された信号は、周波数が高くなるにつれ、振幅の、顕著な減少を有する可能性が高い。スペクトルエクステンダＡ４０２が、ダウンサンプリングされた信号に対して白色化操作を実行するように構成されたスペクトルフラットナ（flattener）５４０を含む。スペクトルフラットナ５４０は、固定白色化操作を実行するように、または適応白色化操作を実行するように構成されることが可能である。適応白色化のある特定の例では、スペクトルフラットナ５４０は、ダウンサンプリングされた信号から４つのフィルタ係数のセットを計算するように構成されたＬＰＣ分析モジュールと、それらの係数に従って信号を白色化するように構成された４次分析フィルタとを含む。スペクトルエクステンダＡ４００の他の実施形態は、スペクトルフラットナ５４０が、ダウンサンプラ５３０より前に、スペクトルに関して拡張された信号に作用する構成を含む。

高帯域励振信号Ｓ１２０として、調和的に拡張された信号Ｓ１６０を出力する高帯域励振発生器Ａ３００が、実施されることが可能である。しかし、一部の事例では、調和的に拡張された信号を高帯域励振として使用することは、聞こえるアーチファクトをもたらす可能性がある。音声の調波構造は、低帯域と比べて高帯域では、一般に、それほど顕著ではなく、高帯域励振信号において余りにも多く調波構造を使用することは、バズ音の多いサウンドをもたらす可能性がある。このアーチファクトは、女性の話者からの音声信号において特に目立つ可能性がある。

構成には、調和的に拡張された信号Ｓ１６０を雑音信号とミキシングするように構成された高帯域励振発生器Ａ３００の実施形態が含まれる。図１１に示されるとおり、高帯域励振発生器Ａ３０２は、ランダム雑音信号を生成するように構成された雑音発生器４８０を含む。一例では、雑音発生器４８０は、分散１の白色擬似雑音信号を生成するように構成されるが、他の実施形態では、雑音信号は、白色でなくてもよく、周波数とともに変化するパワー密度を有することが可能である。雑音発生器４８０が、決定論的関数として雑音信号を出力するように構成されて、雑音信号の状態が、復号器において再現され得るようにすることが、望ましい可能性がある。例えば、雑音発生器４８０は、狭帯域フィルタパラメータＳ４０および／または符号化された狭帯域励振信号Ｓ５０などの、同一のフレーム内で先に符号化されている情報の決定論的関数として、雑音信号を出力するように構成されることが可能である。

調和的に拡張された信号Ｓ１６０とミキシングされる前に、雑音発生器４８０によって生成されたランダム雑音信号は、狭帯域信号Ｓ２０、高帯域信号Ｓ３０、狭帯域励振信号Ｓ８０、または調和的に拡張された信号Ｓ１６０の時間にわたるエネルギー分布を近似する時間領域エンベロープを有するように振幅変調されることが可能である。図１１に示されるとおり、高帯域励振発生器Ａ３０２は、エンベロープ計算器４６０によって計算された時間領域エンベロープに従って雑音発生器４８０によって生成された雑音信号を振幅変調するように構成された結合器４７０を含む。例えば、結合器４７０は、エンベロープ計算器４６０によって計算された時間領域エンベロープに従って雑音発生器４８０の出力を基準化して、変調された雑音信号Ｓ１７０を生成するように構成された乗算器として実施されることが可能である。

図１３のブロック図に示される高帯域励振発生器Ａ３０２の実施形態Ａ３０４では、エンベロープ計算器４６０は、調和的に拡張された信号Ｓ１６０のエンベロープを計算するように構成される。図１４のブロック図に示される高帯域励振発生器Ａ３０２の実施形態Ａ３０６では、エンベロープ計算器４６０は、狭帯域励振信号Ｓ８０のエンベロープを計算するように構成される。高帯域励振発生器Ａ３０２のさらなる実施形態は、狭帯域ピッチパルスの時間的な位置に従って、調和的に拡張された信号Ｓ１６０に雑音を加えるように別の仕方で構成されることが可能である。

エンベロープ計算器４６０は、エンベロープ計算を、一連のサブタスクを含むタスクとして実行するように構成されることが可能である。図１５は、そのようなタスクの例Ｔ１００の流れ図を示す。サブタスクＴ１１０が、２乗された値のシーケンスをもたらすようにエンベロープがモデル化されるべき信号（例えば、狭帯域励振信号Ｓ８０、または調和的に拡張された信号Ｓ１６０）のフレームの各サンプルの２乗を計算する。サブタスクＴ１２０が、２乗された値のシーケンスに対して平滑化操作を実行する。一例では、サブタスクＴ１２０は、以下の式

に従って、このシーケンスに１次ＩＩＲローパスフィルタを適用し、ただし、ｘは、フィルタ入力であり、ｙは、フィルタ出力であり、ｎは、時間領域インデックスであり、ａは、０．５から１までの範囲内の値を有する平滑化係数である。平滑化係数の値は、固定であることが可能であり、あるいは、代替の実施形態では、入力信号における雑音の示度に応じて適応性であることが可能であり、したがって、ａは、雑音が存在しない状態で１により近く、雑音が存在する状態で０．５により近い。サブタスクＴ１３０が、平滑化されたシーケンスの各サンプルに平方根関数を適用して、時間領域エンベロープを生成する。

エンベロープ計算器４６０のそのような実施形態は、タスクＴ１００の様々なサブタスクを逐次に、さらに／または並行に実行するように構成されることが可能である。タスクＴ１００のさらなる実施形態では、サブタスクＴ１１０には、３〜４ｋＨｚの範囲などの、エンベロープがモデル化されるべき信号の所望される周波数部分を選択するように構成されたバンドパス操作が先行することが可能である。

結合器４９０が、調和的に拡張された信号Ｓ１６０と、変調された雑音信号Ｓ１７０とをミキシングして、高帯域励振信号Ｓ１２０をもたらすように構成される。結合器４９０の実施形態は、高帯域励振信号Ｓ１２０を、例えば、調和的に拡張された信号Ｓ１６０と変調された雑音信号Ｓ１７０との和として計算するように構成されることが可能である。結合器４９０のそのような実施形態は、加算に先立って、調和的に拡張された信号Ｓ１６０、および／または変調された雑音信号Ｓ１７０に重み係数を適用することによって、高帯域励振信号Ｓ１２０を加重和として計算するように構成されることが可能である。そのような各重み係数は、１つまたは複数の基準に従って計算されることが可能であり、固定値であることが可能であり、あるいは、代替として、フレームごとに、またはサブフレームごとに計算される適応値である可能性がある。

図１６は、高帯域励振信号Ｓ１２０を、調和的に拡張された信号Ｓ１６０と、変調された雑音信号Ｓ１７０との加重和として計算するように構成された結合器４９０の実施形態４９２のブロック図を示す。結合器４９２は、調波重み係数Ｓ１８０に従って、調和的に拡張された信号Ｓ１６０に重みを付け、雑音重み係数Ｓ１９０に従って、変調された雑音信号Ｓ１７０に重みを付け、高帯域励振信号Ｓ１２０を、これらの重み付けされた信号の和として出力するように構成される。この例では、結合器４９２は、調波重み係数Ｓ１８０および雑音重み係数Ｓ１９０を計算するように構成された重み係数計算器５５０を含む。

重み係数計算器５５０は、高帯域励振信号Ｓ１２０における調波成分対雑音成分の所望される比に従って重み係数Ｓ１８０およびＳ１９０を計算するように構成されることが可能である。例えば、結合器４９２が、高帯域信号Ｓ３０の調波エネルギー対雑音エネルギーの比と同様の調波エネルギー対雑音エネルギーの比を有するように高帯域励振信号Ｓ１２０を生成することが望ましい可能性がある。重み係数計算器５５０の一部の実施形態では、重み係数Ｓ１８０、Ｓ１９０は、ピッチ利得および／または音声モードなどの、狭帯域信号Ｓ２０または狭帯域残差信号の周期性と関係する１つまたは複数のパラメータに従って計算される。重み係数計算器５５０のそのような実施形態は、例えば、調波重み係数Ｓ１８０に、ピッチ利得に比例する値を割り当て、さらに／または無声音声信号に関する雑音重み係数Ｓ１９０に、有声音声信号の場合より高い値を割り当てるように構成されることが可能である。

他の実施形態では、重み係数計算器５５０は、高帯域信号Ｓ３０の周期性の測度に従って調波重み係数Ｓ１８０および／または雑音重み係数Ｓ１９０の値を計算するように構成される。１つのそのような例では、重み係数計算器５５０は、調波重み係数Ｓ１８０を、現在のフレーム、または現在のサブフレームに関する高帯域信号Ｓ３０の自己相関係数の最大値として計算し、ただし、自己相関は、１ピッチ遅れの遅延を含み、ゼロサンプルの遅延を含まない探索範囲にわたって実行される。図１７は、１ピッチ遅れの遅延を中心とし、１ピッチ遅れを超えない幅を有する、長さｎサンプルの、そのような探索範囲の例を示す。

また、図１７は、重み係数計算器５５０が、高帯域信号Ｓ３０の周期性の測度をいくつかの段階で計算する、別のアプローチの例も示す。第１の段階で、現在のフレームが、いくつかのサブフレームに分割され、自己相関係数が最大である遅延が、各サブフレームに関して別個に識別される。前述したとおり、自己相関は、１ピッチ遅れの遅延を含み、ゼロサンプルの遅延を含まない探索範囲にわたって実行される。

第２の段階で、遅延されたフレームが、識別された対応する遅延を各サブフレームに適用し、もたらされるサブフレームを連結して、最適に遅延されたフレームを構築し、元のフレームと、最適に遅延されたフレームとの間の相関係数として、調波重み係数Ｓ１８０を計算することによって構築される。さらなる代替では、重み係数計算器５５０は、調波重み係数Ｓ１８０を、各サブフレームに関して第１の段階で得られた最大自己相関係数の平均として計算する。また、重み係数計算器５５０の実施形態は、相関係数を基準化し、さらに／または相関係数を別の値と組み合わせて、調波重み係数Ｓ１８０の値を計算するように構成されることも可能である。

フレームにおける周期性の存在が、別の仕方で示される事例において、重み係数計算器５５０が、高帯域信号Ｓ３０の周期性の測度を計算することが望ましい可能性がある。例えば、重み係数計算器５５０は、ピッチ利得などの、現在のフレームの周期性の別の指標と、あるしきい値との間の関係に従って、高帯域信号Ｓ３０の周期性の測度を計算するように構成されることが可能である。一例では、重み係数計算器５５０は、フレームのピッチ利得（例えば、狭帯域残差の適応コードブック利得）が、０．５を超える（代替として、少なくとも０．５の）値を有する場合、高帯域信号Ｓ３０に対して自己相関操作を実行するように構成される。別の例では、重み係数計算器５５０は、特定の音声モード状態（例えば、有声信号に関する）を有するフレームに関する高帯域信号Ｓ３０に対して、自己相関操作を実行するように構成される。そのような事例では、重み係数計算器５５０は、その他の音声モード状態、および／またはより小さいピッチ利得値を有するフレームに、デフォルトの重み係数を割り当てるように構成されることが可能である。

構成には、周期性以外の、または周期性に加えた特性に従って重み係数を計算するように構成された重み係数計算器５５０のさらなる実施形態が含まれる。例えば、そのような実施形態は、大きいピッチ遅れを有する音声信号に関する雑音利得率Ｓ１９０に、小さいピッチ遅れを有する音声信号の場合よりも高い値を割り当てるように構成されることが可能である。重み係数計算器５５０の別のそのような実施形態は、他の周波数成分における信号のエネルギーを基準とした、基本周波数の倍数における信号のエネルギーの測度に従って、広帯域音声信号Ｓ１０、または高帯域信号Ｓ３０の調波性の測度を算出するように構成される。

広帯域音声符号器Ａ１００の一部の実施形態は、本明細書で説明されるとおり、ピッチ利得、および／または周期性もしくは調波性の別の測度に基づいて、周期性または調波性の指示（例えば、フレームが調波性であるか、非調波性であるかを示す１ビットフラグ）を出力するように構成される。一例では、対応する広帯域音声復号器Ｂ１００が、この指示を使用して、重み係数計算などの操作を構成する。別の例では、そのような指示は、符号器および／または復号器において、音声モードパラメータの値を計算する際に使用される。

高帯域励振発生器Ａ３０２が、高帯域励振信号Ｓ１２０を、この励振信号のエネルギーが、重み係数Ｓ１８０およびＳ１９０の特定の値による影響を実質的に受けないように生成することが望ましい可能性がある。そのような事例では、重み係数計算器５５０は、調波重み係数Ｓ１８０または雑音重み係数Ｓ１９０の値を計算し（または高帯域符号器Ａ２００の記憶要素または別の要素からそのような値を受け取り）、以下のような式

に従って、その他の重み係数の値を導き出すように構成されることが可能であり、ただし、Ｗｈａｒｍｏｎｉｃは、調波重み係数Ｓ１８０を表し、Ｗｎｏｉｓｅは、雑音重み係数Ｓ１９０を表す。代替として、重み係数計算器５５０は、現在のフレーム、または現在のサブフレームに関する周期性測度の値に従って、重み係数Ｓ１８０、Ｓ１９０の複数のペアのなかの対応するペアを選択するように構成されることが可能であり、これらのペアは、式（２）などの定エネルギー比を満たすように事前計算される。式（２）が観察される重み係数計算器５５０の実施形態に関して、調波重み係数Ｓ１８０の通常の値は、約０．７から約１．０までの範囲に及び、雑音重み係数Ｓ１９０の通常の値は、約０．１から約０．７までの範囲に及ぶ。重み係数計算器５５０の他の実施形態は、調和的に拡張された信号Ｓ１６０と、変調された雑音信号Ｓ１７０との間の所望されるベースライン重み付けに従って変更された式（２）のバージョンに従って動作するように構成されることが可能である。

スパースコードブック（エントリが、大部分、０の値であるコードブック）を使用して、残差の量子化された表現が計算されている場合、合成された音声信号においてアーチファクトが生じる可能性がある。コードブックスパース性(codebook sparseness)は、特に、狭帯域信号が低いビットレートで符号化される場合に生じる。コードブックスパース性によって生じるアーチファクトは、通常、時間的に準周期的であり、大抵、３ｋＨｚより上で生じる。人間の耳は、より高い周波数において、より良好な時間分解能を有するため、これらのアーチファクトは、高帯域において、より目立つ可能性がある。

構成には、スパース性防止フィルタリングを実行するように構成された高帯域励振発生器Ａ３００の実施形態が含まれる。図１８は、逆量子化器４５０によってもたらされる逆量子化された狭帯域励振信号を濾波するように構成されたスパース性防止フィルタ６００を含む高帯域励振発生器Ａ３０２の実施形態Ａ３１２のブロック図を示す。図１９は、スペクトルエクステンダＡ４００によってもたらされた、スペクトルに関して拡張された信号を濾波するように構成されたスパース性防止フィルタ６００を含む高帯域励振発生器Ａ３０２の実施形態Ａ３１４のブロック図を示す。図２０は、結合器４９０の出力を濾波して、高帯域励振信号Ｓ１２０をもたらすように構成されたスパース性防止フィルタ６００を含む高帯域励振発生器Ａ３０２の実施形態Ａ３１６のブロック図を示す。もちろん、実施形態Ａ３０４と実施形態Ａ３０６のいずれかの実施形態の特徴と、実施形態Ａ３１２、実施形態Ａ３１４、および実施形態Ａ３１６のいずれかの実施形態の特徴とを兼ね備えた高帯域励振発生器Ａ３００の実施形態も、企図されており、本明細書で明確に開示される。スパース性防止フィルタ６００は、スペクトルエクステンダＡ４００内部に、つまり、例えば、スペクトルエクステンダＡ４０２内の要素５１０、５２０、５３０、および５４０のいずれかの後に配置されることも可能である。スパース性防止フィルタ６００は、スペクトル折り返し、スペクトル平行移動、または調波拡張を実行するスペクトルエクステンダＡ４００の実施形態で使用されることも可能であることも明記される。

スパース性防止フィルタ６００は、入力信号の位相を変えるように構成されることが可能である。例えば、高帯域励振信号Ｓ１２０の位相が、ランダム化される、または別の仕方で、時間にわたって、より均等に分布するようにスパース性防止フィルタ６００が構成され、整えられることが、望ましい可能性がある。また、スパース性防止フィルタ６００の応答が、スペクトルに関して平坦であり、したがって、濾波された信号の振幅スペクトルがそれほど変化しないことも望ましい可能性がある。一例では、スパース性防止フィルタ６００は、以下の式による伝達関数を有するオールパス（all-pass）フィルタとして実施される。すなわち、

そのようなフィルタの１つの効果は、入力信号のエネルギーを拡散させて、このエネルギーがもはや、いくつかのサンプルに集中していないようにすることである。

コードブックスパース性によって生じるアーチファクトは、通常、残差がそれほどピッチ情報を含まない雑音様の信号に関して、より目立ち、また、背景雑音における音声に関しても、より目立つ。スパース性は、励振が長期構造を有する事例において、通常、それほどアーチファクトを生じさせず、実際、位相変更は、有音信号において雑音の多さを生じさせる可能性がある。このため、有声信号を濾波し、変更のない少なくともいくつかの有音信号を通過させるようにスパース性防止フィルタ６００を構成することが、望ましい可能性がある。有声信号は、低いピッチ利得（例えば、量子化された狭帯域適応コードブック利得）と、平坦である、または周波数が高くなるにつれて上向きに傾斜するスペクトルエンベロープを示す、０または正に近いスペクトル傾斜（例えば、量子化された第１の反射係数）とによって特徴付けられる。スパース性防止フィルタ６００の通常の実施形態は、有音サウンド（例えば、スペクトル傾斜の値によって示される）を濾波し、ピッチ利得が、あるしきい値を下回る（代替として、そのしきい値を超えない）場合、有声サウンドを濾波し、さらに、別の仕方で、変更のない信号を通過させるように構成される。

スパース性防止フィルタ６００のさらなる実施形態は、異なる最大位相変更角度（例えば、１８０度までの）を有するように構成された２つ以上のフィルタを含む。そのような事例において、スパース性防止フィルタ６００は、ピッチ利得（例えば、量子化された適応コードブック利得またはＬＴＰ利得）の値に応じて、これらのコンポーネントフィルタの間で選択を行い、より低いピッチ利得値を有するフレームに関して、より大きい最大位相変更角度が使用されるようにするように構成されることが可能である。また、スパース性防止フィルタ６００のある実施形態は、周波数スペクトルのより多くの部分、またはより少ない部分にわたって位相を変更するように構成された、異なるコンポーネントフィルタを含んで、より低いピッチ利得値を有するフレームに関して、入力信号のより広い周波数範囲にわたって位相を変更するように構成されたフィルタが使用されるようにすることも可能である。

符号化された音声信号の正確な再現のために、合成された広帯域音声信号Ｓ１００の高帯域部分のレベルと狭帯域部分のレベルとの比が、元の広帯域信号Ｓ１０における比と同様であることが望ましい可能性がある。高帯域符号化パラメータＳ６０ａによって表されるスペクトルエンベロープに加えて、高帯域符号器Ａ２００は、時間エンベロープまたは利得エンベロープを指定することによって高帯域信号Ｓ３０を特徴付けるように構成されることが可能である。図１０に示されるとおり、高帯域符号器Ａ２０２は、あるフレームにわたる、またはあるフレームのいくらかの部分にわたる高帯域信号Ｓ３０のエネルギーと、合成された高帯域信号Ｓ１３０のエネルギーとの差または比などの、この２つの信号の間の関係に従って、１つまたは複数の利得率を計算するように構成され、整えられた高帯域利得率計算器Ａ２３０を含む。高帯域符号器Ａ２０２の他の実施形態では、高帯域利得計算器Ａ２３０は、同様に構成されるが、高帯域信号Ｓ３０と、狭帯域励振信号Ｓ８０または高帯域励振信号Ｓ１２０との間の、そのような時間につれ変化する関係に従って、代わりに、利得エンベロープを計算するように整えられる。

狭帯域励振信号Ｓ８０の時間エンベロープと高帯域信号Ｓ３０の時間エンベロープは、同様である可能性が高い。したがって、高帯域信号Ｓ３０と、狭帯域励振信号Ｓ８０（または高帯域励振信号Ｓ１２０または合成された高帯域信号Ｓ１３０などの、狭帯域励振信号Ｓ８０から導き出された信号）との間の関係に基づく利得エンベロープを符号化することは、高帯域信号Ｓ３０に基づく利得エンベロープを符号化することと比べて、一般に、より効率的である。通常の実施形態では、高帯域符号器Ａ２０２は、各フレームに関して５つの利得率を指定する８ビットないし１２ビットの量子化されたインデックスを出力するように構成される。

高帯域利得率計算器Ａ２３０が、１つまたは複数のサブタスクシリーズを含むタスクとして利得率計算を実行するように構成されることが可能である。図２１は、高帯域信号Ｓ３０と合成された高帯域信号Ｓ１３０の相対的エネルギーに従って、対応するサブフレームに関する利得値を計算する、そのようなタスクの例Ｔ２００の流れ図を示す。タスク２２０ａおよび２２０ｂが、それぞれの信号の対応するサブフレームのエネルギーを計算する。例えば、タスク２２０ａおよび２２０ｂは、このエネルギーを、それぞれのサブフレームのサンプルの２乗の和として計算するように構成されることが可能である。タスクＴ２３０が、サブフレームに関する利得率を、それらのエネルギーの比の平方根として計算する。この例では、タスクＴ２３０は、この利得率を、サブフレームにわたる、高帯域信号Ｓ３０のエネルギー対合成された高帯域信号Ｓ１３０の比の平方根として計算する。

高帯域利得率計算器Ａ２３０が、窓関数に従ってサブフレームエネルギーを計算するように構成されることが望ましい可能性がある。図２２は、利得率計算タスクＴ２００の、そのような実施形態Ｔ２１０の流れ図を示す。タスクＴ２１５ａは、高帯域信号Ｓ３０に窓関数を適用し、タスクＴ２１５ｂは、合成された高帯域信号Ｓ１３０に同一の窓関数を適用する。タスク２２０ａおよび２２０ｂの実施形態２２２ａおよび２２２ｂが、それぞれの窓のエネルギーを計算し、タスクＴ２３０が、サブフレームに関する利得率を、エネルギーの比の平方根として計算する。

隣接するサブフレームに部分的に重なる窓関数を適用することが望ましい可能性がある。例えば、オーバラップ加算の仕方で適用されることが可能な利得率をもたらす窓関数が、サブフレーム間の不連続を減らす、または回避するのに役立つ可能性がある。一例では、高帯域利得率計算器Ａ２３０は、窓が、隣接する２つのサブフレームのそれぞれに１ミリ秒だけ重なる、図２３ａに示されるとおりの台形窓関数を適用するように構成される。図２３ｂは、２０ミリ秒フレームの５つのサブフレームのそれぞれに対する、この窓関数の適用を示す。高帯域利得率計算器Ａ２３０の他の実施形態は、異なる重複期間、および／または対称的であることも、非対称的であることも可能な、異なる窓形状（例えば、長方形、ハミング）を有する窓関数を適用するように構成されることが可能である。また、高帯域利得率計算器Ａ２３０の実施形態が、フレーム内の異なるサブフレームに、異なる窓関数を適用するように構成されること、および／またはフレームが、様々な長さのサブフレームを含むことも可能である。

限定なしに、以下の値は、特定の実施形態に関する例として提示される。２０ミリ秒フレームが、これらの事例に関して想定されるが、他の任意の持続時間が、使用されることが可能である。７ｋＨｚでサンプリングされる高帯域信号に関して、各フレームは、１４０のサンプルを有する。そのようなフレームが、等しい長さの５つのサブフレームに分割された場合、各サブフレームは、２８のサンプルを有し、図２３ａに示される窓は、４２サンプル幅である。８ｋＨｚでサンプリングされる高帯域信号に関して、各フレームは、１６０のサンプルを有する。そのようなフレームが、等しい長さの５つのサブフレームに分割された場合、各サブフレームは、３２のサンプルを有し、図２３ａに示される窓は、４８サンプル幅である。他の実施形態では、任意の幅のサブフレームが使用されることが可能であり、高帯域利得計算器Ａ２３０のある実施形態が、フレームの各サンプルに関して異なる利得率をもたらすことさえ可能である。

図２４は、高帯域復号器Ｂ２００の実施形態Ｂ２０２のブロック図を示す。高帯域復号器Ｂ２０２は、狭帯域励振信号Ｓ８０に基づいて高帯域励振信号Ｓ１２０をもたらすように構成された高帯域励振発生器Ｂ３００を含む。特定のシステム設計選択に応じて、高帯域励振発生器Ｂ３００は、本明細書で説明される高帯域励振発生器Ａ３００の実施形態のいずれに従って実施されてもよい。通常、特定の符号化システムの高帯域符号器の広帯域励振発生器と同一の応答を有するように高帯域励振発生器Ｂ３００を実施することが望ましい。しかし、狭帯域復号器Ｂ１１０が、通常、符号化された狭帯域励振信号Ｓ５０の逆量子化を実行するので、ほとんどの事例では、高帯域励振発生器Ｂ３００は、狭帯域復号器Ｂ１１０から狭帯域励振信号Ｓ８０を受け取るように実施され、符号化された狭帯域励振信号Ｓ５０を逆量子化するように構成された逆量子化器を含む必要がない可能性がある。また、狭帯域復号器Ｂ１１０が、フィルタ３３０などの狭帯域合成フィルタに、逆量子化された狭帯域励振信号が入力される前に、この信号を濾波するように配置されたスパース性防止フィルタ６００のインスタンスを含むように実施されることも可能である。

逆量子化器５６０が、高帯域フィルタパラメータＳ６０ａを逆量子化する（この例では、ＬＳＦのセットに）ように構成され、ＬＳＦ−ＬＰフィルタ係数変換５７０が、これらのＬＳＦを、フィルタ係数のセットに変換するように構成される（例えば、狭帯域符号器Ａ１２２の逆量子化器２４０および変換２５０に関連して前述したとおり）。他の実施形態では、前述したとおり、異なる係数セット（例えば、ケプストラム係数）および／または異なる係数表現（例えば、ＩＳＰ）が、使用されることが可能である。高帯域合成フィルタＢ２００が、高帯域励振信号Ｓ１２０、およびフィルタ係数のセットに従って、合成された高帯域信号をもたらすように構成される。高帯域符号器が合成フィルタを含む（例えば、前述した符号器Ａ２０２の例の場合のように）システムに関して、その合成フィルタと同一の応答（例えば、同一の伝達関数）を有するように高帯域合成フィルタＢ２００を実施することが望ましい可能性がある。

また、高帯域復号器Ｂ２０２は、高帯域利得率Ｓ６０ｂを逆量子化するように構成された逆量子化器５８０、および合成された高帯域信号に、逆量子化された利得率を適用して、高帯域信号Ｓ１００をもたらすように構成され、整えられた利得制御要素５９０（例えば、乗算器または増幅器）も含む。フレームの利得エンベロープが、複数の利得率によって規定される事例に関して、利得制御要素５９０は、場合により、対応する高帯域符号器の利得計算器（例えば、高帯域利得計算器Ａ２３０）によって適用されるのと同一の窓関数であることも、異なる窓関数であることも可能な窓関数に従って、それぞれのサブフレームに利得率を適用するように構成されたロジックを含むことが可能である。高帯域復号器Ｂ２０２の他の実施形態では、利得制御要素５９０は、同様に構成されるが、代わりに、狭帯域励振信号Ｓ８０または高帯域励振信号Ｓ１２０に、逆量子化された利得率を適用するように整えられる。

前述したとおり、高帯域符号器と高帯域復号器において同一の状態を得ること（例えば、符号化中に、逆量子化された値を使用することによって）ことが望ましい可能性がある。このため、そのような実施形態による符号化システムにおいて、高帯域励振発生器Ａ３００内、および高帯域励振発生器Ｂ３００内の対応する雑音発生器に関して、同一の状態を確実にすることが望ましい可能性がある。例えば、そのような実施形態の高帯域励振発生器Ａ３００およびＢ３００は、雑音発生器の状態が、同一のフレーム内で既に符号化されている情報（例えば、狭帯域フィルタパラメータＳ４０もしくはパラメータＳ４０の一部分、および／または符号化された狭帯域励振信号Ｓ５０もしくは信号Ｓ５０の一部分）の決定論的関数であるように構成されることが可能である。

本明細書で説明される要素の量子化器の１つまたは複数（例えば、量子化器２３０、４２０、または４３０）は、分類されたベクトル量子化を実行するように構成されることが可能である。例えば、そのような量子化器は、狭帯域通信路および／または高帯域通信路における同一のフレーム内で既に符号化されている情報に基づいて、コードブックのセットの１つのコードブックを選択するように構成されることが可能である。そのような技術は、通常、さらなるコードブック格納を犠牲にして、より高い符号化効率をもたらす。

例えば、図８および図９を参照して前述したとおり、狭帯域音声信号Ｓ２０から粗いスペクトラムエンベロープを除去した後、相当な量の周期構造が、残差信号の中に残る可能性がある。例えば、残差信号は、時間につれて、おおまかに周期的なパルスまたはスパイクのシーケンスを含む可能性がある。通常、ピッチと関係するそのような構造は、特に、有声音声信号において生じる可能性が高い。狭帯域残差信号の量子化された表現の計算は、例えば、１つまたは複数のコードブックによって表される長期の周期性のモデルによるこのピッチ構造の符号化を含む。

実際の残差信号のピッチ構造は、周期性モデルに厳密に合致しない可能性がある。例えば、残差信号は、ピッチパルスの位置の規則性に小さいジッタを含む可能性があり、したがって、フレームの中の連続するピッチ間の距離は、厳密に等しくはなく、構造は、完全に規則的ではない。これらの不規則性によって、符号化効率が低下する傾向がある。

狭帯域符号器Ａ１２０のいくつかの実施形態は、量子化前に、または量子化中に残差に適応時間ワーピングを適用することによって、または符号化された励振信号の中に適応時間ワーピングを別の仕方で含めることによって、ピッチ構造の規則化を実行するように構成される。例えば、そのような符号化は、時間的なワーピングの度合いを選択し、またはそれ以外で計算して（例えば、１つまたは複数の知覚的重み付けおよび／または誤差最小化基準に従って）、もたらされる励振信号が、長期の周期性のモデルに最適に合うようにするように構成されることが可能である。ピッチ構造の規則化は、ＲＣＥＬＰ（弛緩符号励起線形予測）符号器と呼ばれるＣＥＬＰ符号器によって実行される。

ＲＣＥＬＰ符号器は、時間ワーピングを適応タイムシフトとして実行するように通常、構成される。このタイムシフトは、負に数ミリ秒から正に数ミリ秒までの範囲の遅延であることが可能であり、聞こえる不連続を回避するように、通常、平滑に変化させられる。一部の実施形態では、そのような符号器は、各フレームまたは各サブフレームが、対応する固定のタイムシフトだけワーピングされる、区分的な仕方で規則化を適用するように構成される。他の実施形態では、符号器は、規則化を連続ワーピング関数として適用するように構成され、したがって、フレームまたはサブフレームは、ピッチ外形（ピッチ軌道とも呼ばれる）に応じてワーピングされる。一部の事例では、符号器は、符号化された励振信号を計算するのに使用される知覚的に重み付けされた入力信号にシフトを適用することによって、符号化された励振信号の中に時間ワーピングを含めるように構成される。

符号器は、規則化され、量子化された、符号化された励振信号を計算し、復号器は、この符号化された励振信号を逆量子化して、復号された音声信号を合成するのに使用される励振信号を得る。このため、復号された出力信号は、規則化によって、符号化された励振信号の中に含められたのと同一の変化する遅延を示す。通常、規則化量を指定する情報は、復号器にまったく伝送されない。

規則化は、残差信号を符号化するのを、より容易にする傾向があり、このことにより、長期予測子からの符号化利得が向上し、このため、全体的な符号化効率が、一般に、アーチファクトを生じさせることなしに、押し上げられる。有声であるフレームに対して規則化を実行することが望ましい可能性がある。例えば、狭帯域符号器Ａ１２４が、有声信号などの、長期構造を有するフレームまたはサブフレームをシフトするように構成されることが可能である。ピッチパルスエネルギーを含むサブフレームに対して規則化を実行することが望ましい可能性さえある。ＲＣＥＬＰコーダの既存の実施形態には、ＴＩＡ（米国電気通信工業会）ＩＳ−１２７において説明されるＥＶＲＣ（拡張可変レートコーデック）、および３ＧＰＰ２（第３世代パートナーシップ２）ＳＭＶ（選択可能モードボコーダ）が含まれる。

残念ながら、規則化は、高帯域励振が、符号化された狭帯域励振信号から導き出される広帯域音声コーダ（広帯域音声符号器Ａ１００および広帯域音声復号器Ｂ１００を含むシステムなどの）に関して問題を生じさせる可能性がある。時間ワーピングされた信号から導き出されることにより、高帯域励振信号は、一般に、元の高帯域音声信号の時間プロファイルとは異なる時間プロファイルを一般に、有する。つまり、高帯域励振信号は、元の高帯域音声信号ともはや同期していない。

ワーピングされた高帯域励振信号と元の高帯域音声信号の間の時間的なずれが、いくつかの問題を生じさせる可能性がある。例えば、ワーピングされた高帯域励振信号は、元の高帯域音声信号から抽出されたフィルタパラメータに従って構成された合成フィルタに適切なソース励振をもはや与えない可能性がある。その結果、合成された高帯域信号は、復号された広帯域音声信号の知覚される品質を低下させる、聞こえるアーチファクトを含む可能性がある。

また、この時間的なずれは、利得エンベロープ符号化における非効率を生じさせる可能性もある。前述したとおり、狭帯域励振信号Ｓ８０の時間エンベロープと、高帯域信号Ｓ３０の時間エンベロープとの間に相関が存在する可能性が高い。これら２つの時間エンベロープ間の関係に応じて高帯域信号の利得エンベロープを符号化することにより、この利得エンベロープを直接に符号化することと比べて、符号化効率の向上が、実現されることが可能である。しかし、符号化された狭帯域励振信号が規則化されると、この相関は、弱められる可能性がある。狭帯域励振信号Ｓ８０と高帯域信号Ｓ３０の間の時間的なずれは、高帯域利得率Ｓ６０ｂに変動を生じさせる可能性があり、符号化効率が低下する可能性がある。

構成には、対応する符号化された狭帯域励振信号の中に含められた時間ワーピングに従って高帯域音声信号の時間ワーピングを実行する広帯域音声符号化の方法が含まれる。そのような方法の潜在的な利点には、復号された広帯域音声信号の品質を向上させること、および／または高帯域利得エンベロープを符号化することの効率を向上させることが含まれる。

図２５は、広帯域音声符号器Ａ１００の実施形態ＡＤ１０のブロック図を示す。符号器ＡＤ１０は、符号化された狭帯域励振信号Ｓ５０の計算中に規則化を実行するように構成された狭帯域符号器Ａ１２０の実施形態Ａ１２４を含む。例えば、狭帯域符号器Ａ１２４は、前述したＲＣＥＬＰ実施形態の１つまたは複数に従って構成されることが可能である。

また、狭帯域符号器Ａ１２４は、適用される時間ワーピングの度合いを指定する規則化データ信号ＳＤ１０を出力するようにも構成される。狭帯域符号器Ａ１２４が、各フレーム、または各サブフレームに固定のタイムシフトを適用するように構成される様々な事例に関して、規則化データ信号ＳＤ１０は、各タイムシフト量を、サンプル数、ミリ秒数、または他の何らかの時間インクリメントに関する整数値または非整数値として示す、一連の値を含むことが可能である。狭帯域符号器Ａ１２４が、フレームまたは他のサンプルシーケンスの時間尺度を別の仕方で変更する（例えば、１つの部分を圧縮し、他の部分を伸張することによって）ように構成された事例に関して、規則化情報信号ＳＤ１０は、関数パラメータのセットなどの、この変更の対応する記述を含むことが可能である。１つの特定の例において、狭帯域符号器Ａ１２４は、フレームを３つのサブフレームに分割し、各サブフレームに関する固定のタイムシフトを計算するように構成され、したがって、規則化データ信号ＳＤ１０は、符号化された狭帯域信号の規則化されるフレームごとに、３つのタイムシフト量を示す。

広帯域音声符号器ＡＤ１０は、入力信号によって示される遅延量に従って高帯域音声信号Ｓ３０の諸部分を先に進め、または遅らせて、時間ワーピングされた高帯域音声信号Ｓ３０ａをもたらすように構成された遅延ラインＤ１２０を含む。図２５に示される例では、遅延ラインＤ１２０は、規則化データ信号ＳＤ１０によって示されるワーピングに従って高帯域音声信号Ｓ３０を時間ワーピングするように構成される。そのような仕方で、符号化された狭帯域励振信号Ｓ５０の中に含められたのと同一の量の時間ワーピングが、分析の前に高帯域音声信号Ｓ３０の対応する部分にも適用される。この例は、遅延ラインＤ１２０を、高帯域符号器Ａ２００とは別個の要素として示すものの、他の実施形態では、遅延ラインＤ１２０は、高帯域符号器の一部として構成される。

高帯域符号器Ａ２００のさらなる実施形態は、高帯域利得パラメータＳ６０ｂの計算より前に、ワーピングされていない高帯域音声信号Ｓ３０のスペクトル分析（例えば、ＬＰＣ分析）を実行し、高帯域音声信号Ｓ３０の時間ワーピングを実行するように構成されることが可能である。そのような符号器は、例えば、時間ワーピングを実行するように構成された遅延ラインＤ１２０の実施形態を含むことが可能である。しかし、そのような事例では、ワーピングされていない信号Ｓ３０の分析に基づく高帯域フィルタパラメータＳ６０ａが、高帯域励振信号Ｓ１２０と時間的にずれているスペクトルエンベロープを記述することが可能である。

遅延ラインＤ１２０は、所望される時間ワーピング操作を高帯域音声信号Ｓ３０に適用するのに適した論理要素と格納要素の任意の組み合わせに従って構成されることが可能である。例えば、遅延ラインＤ１２０は、所望されるタイムシフトに従ってバッファから高帯域音声信号Ｓ３０を読み取るように構成されることが可能である。図２６ａは、シフトレジスタＳＲ１を含む遅延ラインＤ１２０のそのような実施形態Ｄ１２２の概略図を示す。シフトレジスタＳＲ１は、高帯域音声信号Ｓ３０の最新のｍ個のサンプルを受け取り、格納するように構成された、何らかの長さｍのバッファである。値ｍは、サポートされるべき最大の正の（つまり、「進み」）タイムシフトと最大の負の（つまり、「遅れ」）タイムシフトの少なくとも和と等しい。値ｍが、高帯域信号Ｓ３０のフレームまたはサブフレームの長さと等しいことが、好都合である可能性がある。

遅延ラインＤ１２２は、シフトレジスタＳＲ１のオフセットロケーションＯＬから、時間ワーピングされた高帯域信号Ｓ３０ａを出力するように構成される。オフセットロケーションＯＬの位置は、例えば、規則化データ信号ＳＤ１０によって示される現在のタイムシフトに従って、基準位置（０タイムシフト）付近で変化する。遅延ラインＤ１２２は、等しい進み限度と遅れ限度をサポートするように、あるいは、代替として、一方が、他方より大きい限度をサポートして、一方の方向で、他方の方向より大きいシフトが実行され得るようにするよう、構成されることが可能である。図２６ａは、負のタイムシフトより大きい正のタイムシフトをサポートするある特定の例を示す。遅延ラインＤ１２２は、ある時点で１つまたは複数のサンプル（例えば、出力バス幅に依存する）を出力するように構成されることが可能である。

数ミリ秒を超える大きさを有する規則化タイムシフトは、復号された信号において聞こえるアーチファクトを生じさせる可能性がある。通常、狭帯域符号器Ａ１２４によって実行される規則化タイムシフトの大きさは、数ミリ秒を超えず、したがって、規則化データ信号ＳＤ１０によって示されるタイムシフトは、制限される。しかし、そのような事例において、遅延ラインＤ１２２が、正の方向および／または負の方向でタイムシフトに最大限度を課すように（例えば、狭帯域符号器によって課せられるよりも厳しい限度を守るように）構成されることが望ましい可能性がある。

図２６ｂは、シフト窓ＳＷを含む遅延ラインＤ１２２の実施形態Ｄ１２４の概略図を示す。この例では、オフセットロケーションＯＬの位置は、シフト窓ＳＷによって制限される。図２６ｂは、バッファ長ｍが、シフト窓ＳＷの幅より大きい事例を示すものの、遅延ラインＤ１２４は、シフト窓ＳＷの幅がｍと等しいように実施されることも可能である。

他の実施形態において、遅延ラインＤ１２０は、所望されるタイムシフトに従ってバッファに高帯域音声信号Ｓ３０を書き込むように構成される。図２７は、高帯域音声信号Ｓ３０を受け取り、格納するように構成された２つのシフトレジスタＳＲ２およびＳＲ３を含む遅延ラインＤ１２０のそのような実施形態Ｄ１３０の概略図を示す。遅延ラインＤ１３０は、例えば、規則化データ信号ＳＤ１０によって示されるタイムシフトに従って、シフトレジスタＳＲ２らかシフトレジスタＳＲ３にフレームまたはサブフレームを書き込むように構成される。シフトレジスタＳＲ３は、時間ワーピングされた高帯域信号Ｓ３０を出力するように整えられたＦＩＦＯバッファとして構成される。

図２７に示される特定の例では、シフトレジスタＳＲ２は、フレームバッファ部分ＦＢ１と、遅延バッファ部分ＤＢとを含み、シフトレジスタＳＲ３は、フレームバッファ部分ＦＢ２と、進みバッファ部分ＡＢと、遅れバッファ部分ＲＢとを含む。進みバッファＡＢの長さと、遅れバッファＲＢの長さとは、等しいことも、一方が、他方より長いことも可能であり、したがって、一方向において他方の方向より大きいシフトが、サポートされる。遅延バッファＤＢと遅れバッファ部分ＲＢは、同一の長さを有するように構成されることが可能である。代替として、遅延バッファＤＢは、シフトレジスタＳＲ３に格納するのに先立つ、サンプルのワーピングなどの他の処理操作を含むことが可能な、フレームバッファＦＢ１からシフトレジスタＳＲ３へのサンプルの転送に利用される時間間隔を見込んで、遅れバッファＲＢより短いことも可能である。

図２７の例では、フレームバッファＦＢ１は、高帯域信号Ｓ３０の１つのフレームの長さと等しい長さを有するように構成される。別の例では、フレームバッファＦＢ１は、高帯域信号Ｓ３０の１つのサブフレームの長さと等しい長さを有するように構成される。そのような事例では、遅延ラインＤ１３０は、シフトされるべきフレームのサブフレームに同一の（例えば、平均）遅延を適用するロジックを含むように構成されることが可能である。また、遅延ラインＤ１３０は、フレームバッファＦＢ１からの値を、遅れバッファＲＢまたは進みバッファＡＢの中で上書きされるべき値と平均するロジックを含むことも可能である。さらなる例では、シフトレジスタＳＲ３が、フレームバッファＦＢ１を介して高帯域信号Ｓ３０の値を受け取るように構成されることが可能であり、そのような事例では、遅延ラインＤ１３０は、シフトレジスタＳＲ３に書き込まれる連続するフレーム間、または連続するサブフレーム間の間隙にわたって補間するロジックを含むことが可能である。他の実施形態では、遅延ラインＤ１３０は、フレームバッファＦＢ１からのサンプルに対してワーピング操作を実行してから、これらのサンプルをシフトレジスタＳＲ３に書き込む（例えば、規則化データ信号ＳＤ１０によって記述される関数に従って）ように構成されることが可能である。

遅延ラインＤ１２０が、規則化データ信号ＳＤ１０によって指定されたワーピングに基づくが、このワーピングと同一ではない時間ワーピングを適用することが望ましい可能性がある。図２８は、遅延値マッパＤ１１０を含む広帯域音声符号器ＡＤ１０の実施形態ＡＤ１２のブロック図を示す。遅延値マッパＤ１１０は、規則化データ信号ＳＤ１０によって示されるワーピングを、マップされた遅延値ＳＤ１０ａにマップするように構成される。遅延ラインＤ１２０は、マップされた遅延値ＳＤ１０ａによって指定されたワーピングに従って、時間ワーピングされた高帯域音声信号Ｓ３０ａをもたらすように構成される。

狭帯域符号器によって適用されるタイムシフトは、時とともに平滑に展開するものと見込まれることが可能である。したがって、音声のフレーム中にサブフレームに適用される平均狭帯域タイムシフトを計算し、この平均に応じて高帯域音声信号Ｓ３０の対応するフレームをシフトするだけで、通常、十分である。１つのそのような例では、遅延値マッパＤ１１０は、各フレームに関してサブフレーム遅延値の平均を計算するように構成され、遅延ラインＤ１２０は、この計算された平均を、高帯域信号Ｓ３０の対応するフレームに適用するように構成される。他の例では、より短い期間（２つのサブフレーム、またはフレームの１／２などの）にわたる平均、またはより長い期間（２つのフレームなどの）にわたる平均が、計算されて、適用されることも可能である。この平均が、サンプルの非整数値である事例では、遅延値マッパＤ１１０は、この値を整数のサンプル数に丸めてから、遅延ラインＤ１２０に出力するように構成されることが可能である。

狭帯域符号器Ａ１２４は、非整数のサンプル数の規則化タイムシフトを、符号化された狭帯域励振信号の中に含めるように構成されることが可能である。そのような事例では、遅延値マッパＤ１１０が、狭帯域タイムシフトを整数のサンプル数に丸めるように構成されること、および遅延ラインＤ１２０が、この丸められたタイムシフトを高帯域音声信号Ｓ３０に適用することが望ましい可能性がある。

広帯域音声符号器ＡＤ１０の一部の実施形態では、狭帯域音声信号Ｓ２０のサンプリングレートと、高帯域音声信号Ｓ３０のサンプリングレートとは、異なる可能性がある。そのような事例では、遅延値マッパＤ１１０は、狭帯域音声信号Ｓ２０（または狭帯域励振信号Ｓ８０）のサンプリングレートと、高帯域音声信号Ｓ３０のサンプリングレートとの差を見込むように、規則化データ信号ＳＤ１０の中で示されるタイムシフト量を調整するように構成されることが可能である。例えば、遅延値マッパＤ１１０は、これらのサンプリングレートの比に応じてタイムシフト量を基準化するように構成されることが可能である。前述した１つの特定の例では、狭帯域音声信号Ｓ２０は、８ｋＨｚでサンプリングされ、高帯域音声信号Ｓ３０は、７ｋＨｚでサンプリングされる。この事例では、遅延値マッパＤ１１０は、各シフト量に７／８を掛けるように構成される。また、遅延値マッパＤ１１０の実施形態は、そのような基準化操作を、本明細書で説明される整数に丸める操作および／またはタイムシフト平均操作と一緒に実行するように構成されることも可能である。

さらなる実施形態では、遅延ラインＤ１２０は、フレームまたは他のサンプルシーケンスの時間尺度を別の仕方で変更する（例えば、１つの部分を圧縮し、他の部分を伸張することによって）ように構成される。例えば、狭帯域符号器Ａ１２４が、ピッチ外形またはピッチ軌道などの関数に応じて規則化を実行するように構成されることが可能である。そのような事例では、規則化データ信号ＳＤ１０は、パラメータのセットなどの、関数の対応する記述を含むことが可能であり、遅延ラインＤ１２０は、この関数に従って高帯域音声信号Ｓ３０のフレームまたはサブフレームをワーピングするように構成されたロジックを含むことが可能である。他の実施形態では、遅延値マッパＤ１１０が、関数が、遅延ラインＤ１２０によって高帯域音声信号Ｓ３０に適用されるのに先立って、この関数を平均する、基準化する、および／または丸めるように構成される。例えば、遅延値マッパＤ１１０は、サンプルの数をそれぞれが示す１つまたは複数の遅延値を、関数に従って計算するように構成されることが可能であり、これらの遅延値が、次に、遅延ラインＤ１２０によって、高帯域音声信号Ｓ３０の対応する１つまたは複数のフレームまたはサブフレームに適用される。

図２９は、対応する符号化された狭帯域励振信号の中に含められた時間ワーピングに従って高帯域音声信号を時間ワーピングする方法ＭＤ１００に関する流れ図を示す。タスクＴＤ１００が、広帯域音声信号を処理して、狭帯域音声信号および高帯域音声信号を得る。例えば、タスクＴＤ１００は、フィルタバンクＡ１１０の実施形態などの、ローパスフィルタと、ハイパスフィルタとを有するフィルタバンクを使用して、広帯域音声信号を濾波するように構成されることが可能である。タスクＴＤ２００は、狭帯域音声信号を、少なくとも、符号化された狭帯域励振信号、および複数の狭帯域フィルタパラメータの中に符号化する。符号化された狭帯域励振信号、および／または符号化されたフィルタパラメータは、量子化されることが可能であり、符号化された狭帯域音声信号は、音声モードパラメータなどの他のパラメータを含むことも可能である。また、タスクＴＤ２００は、符号化された狭帯域励振信号の中に時間ワーピングも含める。

タスクＴＤ３００が、狭帯域励振信号に基づいて高帯域励振信号を生成する。この事例では、狭帯域励振信号は、符号化された狭帯域励振信号に基づく。少なくとも高帯域励振信号に従って、タスクＴＤ４００が、高帯域音声信号を、少なくとも複数の高帯域フィルタパラメータの中に符号化する。例えば、タスクＴＤ４００は、高帯域音声信号を、複数の量子化されたＬＳＦの中に符号化するように構成されることが可能である。タスクＴＤ５００が、符号化された狭帯域励振信号の中に含められた時間ワーピングと関係する情報に基づく高帯域音声信号に、タイムシフトを適用する。

タスクＴＤ４００は、高帯域音声信号に対してスペクトル分析（ＬＰＣ分析などの）を実行し、さらに／または高帯域音声信号の利得エンベロープを計算するように構成されることが可能である。そのような事例では、タスクＴＤ５００は、この分析および／または利得エンベロープ計算に先立って、高帯域音声信号にタイムシフトを適用するように構成されることが可能である。

広帯域音声符号器Ａ１００の他の実施形態は、符号化された狭帯域励振信号の中に含められた時間ワーピングによって生じさせられる高帯域励振信号Ｓ１２０の時間ワーピングを逆にするように構成される。例えば、高帯域励振発生器Ａ３００が、規則化データ信号ＳＤ１０、またはマップされた遅延値ＳＤ１０ａを受け取り、この信号Ｄ１０またはＳＤ１０ａに基づいて、狭帯域励振信号Ｓ８０に、さらに／または調和的に拡張された信号Ｓ１６０、または高帯域励振信号Ｓ１２０などの、その後の信号に、対応する逆タイムシフトを適用するように構成された遅延ラインＤ１２０の実施形態を含むように実施されることが可能である。

さらなる広帯域音声符号器実施形態は、狭帯域音声信号Ｓ２０と高帯域音声信号Ｓ３０を、互いに無関係に符号化するように構成されることが可能であり、したがって、高帯域音声信号Ｓ３０は、高帯域スペクトルエンベロープおよび高帯域励振信号の表現として符号化される。そのような実施形態は、符号化された狭帯域励振信号の中に含められた時間ワーピングと関係する情報に従って、符号化された高帯域残差信号の時間ワーピングを実行する、または、時間ワーピングを、符号化された高帯域励振信号の中に別の仕方で含めるように構成されることが可能である。例えば、高帯域符号器は、高帯域残差信号に時間ワーピングを適用するように構成された、本明細書で説明される遅延ラインＤ１２０および／または遅延値マッパＤ１１０の実施形態を含むことが可能である。そのような操作の潜在的な利点には、高帯域残差信号の、より効率的な符号化、ならびに合成された狭帯域音声信号と、高帯域音声信号との間の、より良好な合致が含まれる。

前述したとおり、本明細書で説明される構成には、狭帯域システムとの互換性をサポートし、トランスコードの必要性を回避する、埋込み符号化を実行するのに使用されることが可能な実施形態が含まれる。また、高帯域符号化のサポートは、後方互換性を伴う広帯域サポートを有するチップ、チップセット、デバイス、および／またはネットワーク、ならびに狭帯域サポートを有するチップ、チップセット、デバイス、および／またはネットワークを、費用ベースで区別するのにも役立つ可能性がある。また、本明細書で説明される高帯域符号化のサポートは、低帯域符号化をサポートするための技術と併せて使用されることも可能であり、そのような構成によるシステム、方法、または装置は、例えば、約５０Ｈｚまたは１００Ｈｚから約７ｋＨｚまたは８ｋＨｚまでの周波数成分の符号化をサポートすることが可能である。

前述したとおり、音声コーダに高帯域サポートを追加することにより、特に、摩擦音の区別に関して、了解度が向上する可能性がある。そのような区別は、通常、特定の文脈から人間のリスナによって導き出されることが可能であるものの、高帯域サポートは、自動化された音声メニューナビゲーションおよび／または自動呼処理のためのシステムなどの、音声認識アプリケーション、および他のマシン解釈アプリケーションにおける、能力を与えるフィーチャの役割をすることが可能である。

ある構成による装置は、セルラー電話機またはＰＤＡ（パーソナルディジタルアシスタント）などの無線通信のためのポータブルデバイスに組み込まれることが可能である。代替として、そのような装置は、ＶｏＩＰハンドセット、ＶｏＩＰ通信をサポートするように構成されたパーソナルコンピュータ、または電話通信もしくはＶｏＩＰ通信をルーティングするように構成されたネットワークデバイスなどの、別の通信デバイスの中に含められてもよい。例えば、ある構成による装置は、通信デバイスのためのチップまたはチップセットにおいて実施されることが可能である。特定のアプリケーションに依存して、そのようなデバイスは、音声信号のアナログ・ディジタル変換および／またはディジタル・アナログ変換、音声信号に対して増幅操作および／または他の信号処理操作を実行するための回路、および／または符号化された音声信号の送信および／または受信のための無線周波数回路などのフィーチャを含むことも可能である。

構成が、米国特許出願第６０／６６７，９０１号および米国特許出願第６０／６７３，９６５号において開示される、その他のフィーチャの任意の１つまたは複数を含み、さらに／またはそのような任意の１つまたは複数のフィーチャと一緒に使用されることが可能であることが、明確に企図され、開示される。そのようなフィーチャには、高帯域において生じ、狭帯域には実質的に存在しない、短い持続時間の高エネルギーのバーストの除去が含まれる。そのようなフィーチャには、高帯域ＬＳＦなどの係数表現の固定の平滑化、または適応平滑化が含まれる。そのようなフィーチャには、ＬＳＦなどの係数表現の量子化に関連する雑音の固定の整形または適応整形が含まれる。また、そのようなフィーチャには、利得エンベロープの固定の平滑化または適応平滑化、および利得エンベロープの適応減衰も含まれる。

高帯域励振発生器Ａ３００およびＢ３００、高帯域符号器Ａ１００、高帯域復号器Ｂ２００、広帯域音声符号器Ａ１００、および広帯域音声復号器Ｂ１００の実施形態の様々な要素は、例えば、同一のチップ上に、またはチップセット内の２つ以上のチップの間に存在する電子デバイスおよび／または光デバイスとして実施されることが可能であるが、そのような限定なしに、他の構成も企図される。そのような装置の１つまたは複数の要素は、マイクロプロセッサ、組み込みプロセッサ、ＩＰコア、ディジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレー）、ＡＡＳＰ（特定用途向け標準製品）、およびＡＳＩＣ（特定用途向け集積回路）などの論理要素（例えば、トランジスタ、ゲート）の１つまたは複数の固定アレーまたはプログラマブルアレーを実行するように構成された１つまたは複数の命令セットとして、全体が、または部分的に実施されることが可能である。また、１つまたは複数のそのような要素が、構造（例えば、異なる時点で異なる要素に対応するコードの部分を実行するのに使用されるプロセッサ、異なる時点で異なる要素に対応するタスクを実行するように実行される命令のセット、または異なる時点で異なる要素に関する動作を実行する電子デバイスおよび／または光デバイスの構成）を共有することも可能である。さらに、１つまたは複数のそのような要素が、装置が組み込まれたデバイスまたはシステムの別の動作と関係するタスクなどの、装置の動作と直接に関係しないタスクを実行する、またはそのような他の命令セットを実行するのに使用されることも可能である。

図３０は、狭帯域部分と、高帯域部分とを有する音声信号の高帯域部分を符号化する、ある構成による方法Ｍ１００の流れ図を示す。タスクＸ１００が、高帯域部分のスペクトルエンベロープを特徴付けるフィルタパラメータのセットを計算する。タスクＸ２００が、狭帯域部分から導き出された信号に非線形関数を適用することによって、スペクトルに関して拡張された信号を計算する。タスクＸ３００が、（Ａ）フィルタパラメータのセット、および（Ｂ）スペクトルに関して拡張された信号に基づく高帯域励振信号に従って、合成された高帯域信号を生成する。タスクＸ４００が、（Ｃ）高帯域部分のエネルギーと、（Ｄ）狭帯域部分から導き出された信号のエネルギーとの間の関係に基づいて、利得エンベロープを計算する。

図３１ａは、ある構成による、高帯域励振信号を生成する方法Ｍ２００の流れ図を示す。タスクＹ１００が、音声信号の狭帯域部分から導き出された狭帯域励振信号に非線形関数を適用することによって、調和的に拡張された信号を計算する。タスクＹ２００が、調和的に拡張された信号を、変調された雑音信号とミキシングして、高帯域励振信号を生成する。図３１ｂは、タスクＹ３００およびＹ４００を含む別の構成による、高帯域励振信号を生成する方法Ｍ２１０の流れ図を示す。タスクＹ３００は、狭帯域励振信号と、調和的に拡張された信号とのいずれかの信号の時間にわたるエネルギーに応じて、時間領域エンベロープを計算する。タスクＹ４００は、時間領域エンベロープに応じて雑音信号を変調して、変調された雑音信号をもたらす。

図３２は、狭帯域部分と、高帯域部分とを有する音声信号の高帯域部分を復号する、ある構成による方法Ｍ３００の流れ図を示す。タスクＺ１００が、高帯域部分のスペクトルエンベロープを特徴付けるフィルタパラメータのセットと、高帯域部分の時間エンベロープを特徴付ける利得率のセットとを受け取る。タスクＺ２００が、狭帯域部分から導き出された信号に非線形関数を適用することによって、スペクトルに関して拡張された信号を計算する。タスクＺ３００が、（Ａ）フィルタパラメータのセット、および（Ｂ）スペクトルに関して拡張された信号に基づく高帯域励振信号に従って、合成された高帯域信号を生成する。タスクＺ４００が、利得率のセットに基づいて、合成された高帯域信号の利得エンベロープを変調する。例えば、タスクＺ４００は、狭帯域部分から導き出された励振信号、スペクトルに関して拡張された信号、高帯域励振信号、または合成された高帯域信号に利得率のセットを適用することによって、合成された高帯域信号の利得エンベロープを変調するように構成されることが可能である。

図３３は、複数の移動局３３０２と、複数の基地局３３０４と、ＢＳＣ（基地局コントローラ）３３０６と、ＭＳＣ（移動交換局）３３０８とを含むことが可能なＣＤＭＡ（符号分割多元接続）無線電話システム３３００を示す。ＭＳＣ３３０８は、ＰＳＴＮ（公衆交換電話網）３３１０とインターフェースをとるように構成されることが可能である。また、ＭＳＣ３３０８は、ＢＳＣ３３０６とインターフェースをとるように構成されることも可能である。システム３３００内に複数のＢＳＣ３３０６が存在することが可能である。各基地局３３０４は、少なくとも１つのセクタ（図示せず）を含むことが可能であり、各セクタは、全方向性アンテナ、または基地局３３０４から径方向に離れるある方向に向けられたアンテナを有することが可能である。代替として、各セクタは、ダイバーシティ受信のための２つのアンテナを含んでもよい。各基地局３３０４は、複数の周波数割当てをサポートするように設計されることが可能である。セクタと周波数割当ての交わりが、ＣＤＭＡ通信路と呼ばれることが可能である。移動局３３０２には、セルラー電話機またはＰＣＳ（ポータブル通信システム）電話機が含まれることが可能である。

セルラー電話システム３３００の動作中、基地局３３０４は、移動局３３０２のセットから逆方向リンク信号のセットを受信することが可能である。移動局３３０２は、電話呼または他の通信を行っていることが可能である。所与の基地局３３０４によって受信された各逆方向リンク信号は、その基地局３３０４内で処理されることが可能である。もたらされるデータは、ＢＳＣ３３０６に転送されることが可能である。ＢＳＣ３３０６は、呼リソース割当て、ならびに基地局３３０４間のソフトハンドオフの調整を含む移動性管理機能を提供することが可能である。また、ＢＳＣ３３０６は、受信されたデータをＭＳＣ３３０８にルーティングすることもでき、ＭＳＣ３３０８は、ＰＳＴＮ３３１０とインターフェースをとるためのさらなるルーティングサービスを提供する。同様に、ＰＳＴＮ３３１０が、ＭＳＣ３３０８とインターフェースをとることが可能であり、ＭＳＣ３３０８が、ＢＳＣ３３０６とインターフェースをとることが可能であり、ＢＳＣ３３０６は、順方向リンク信号のセットを基地局３３０２のセットに伝送するように基地局３３０４を制御することが可能である。

図３４は、符号器３４０２と、復号器３４０４と、伝送媒体３４０６とを含む信号伝送環境３４００を示す。符号器３４０２は、移動局３３０２内に、または基地局３３０４において実装されることが可能である。復号器３４０４は、基地局３３０４において、または移動局３３０２において実装されることが可能である。符号器３４０２は、音声信号ｓ（ｎ）３４１０を符号化し、符号化された音声信号ｓｅｎｃ（ｎ）３４１２を形成することが可能である。符号化された音声信号３４１２は、伝送媒体３４０６を介して復号器３４０４に伝送されることが可能である。復号器３４０４は、ｓｅｎｃ（ｎ）３４１２を復号して、合成された音声信号

を生成することが可能である。

本明細書で説明される「符号化」という用語は、符号化と復号の両方を包含する方法を一般に指すことが可能である。一般に、符号化システム、符号化方法、および符号化装置は、許容できる音声再現（すなわち、

）を維持しながら、伝送媒体を介して伝送されるビットの数を最小限に抑えよう（すなわち、ｓｅｎｃ（ｎ）３４１２の帯域幅を最小限に抑えよう）と努める。この装置は、移動電話機、ＰＤＡ（パーソナルディジタルアシスタント）、ラップトップコンピュータ、デジタルカメラ、音楽プレーヤ、ゲームデバイス、基地局、またはプロセッサを有する他の任意のデバイスであることが可能である。符号化された音声信号３４１２の構成は、符号器３４０２によって利用される特定の音声符号化モードに応じて異なることが可能である。様々な符号化モードが、以下に説明される。

以下に説明される符号器３４０２および復号器３４０４の構成要素は、電子ハードウェアとして、コンピュータソフトウェアとして、またはその両方の組み合わせとして実施されることが可能である。これらの構成要素は、これらの構成要素の機能の点で以下に説明される。機能が、ハードウェアとして実施されるか、ソフトウェアとして実施されるかは、システム全体に課せられた特定の応用上の制約、および設計上の制約に依存する可能性がある。伝送媒体３４０６は、陸上ベースの通信線、基地局と衛星の間のリンク、セルラー電話機と基地局の間、またはセルラー電話機と衛生の間の無線通信を含むが、以上には限定されない、多くの異なる伝送媒体を表すことが可能である。

通信の各パーティが、データを送信することとともに、データを受信することができる。各パーティが、符号器３４０２および復号器３４０４を利用することができる。しかし、信号伝送環境３４００は、伝送媒体３４０６の一方の終端において符号器３４０２を含み、他方の終端において復号器３４０４を含むものとして、以下に説明される。

この説明では、ｓ（ｎ）３４１０が、様々な音声サウンドと、沈黙の期間とを含む通常の会話中に得られたディジタル音声信号を含むことが可能である。音声信号ｓ（ｎ）３４１０は、フレームに分割されることが可能であり、各フレームは、サブフレームにさらに分割されることが可能である。これらの恣意的に選択されたフレーム／サブフレーム境界は、何らかのブロック処理が実行される場合に使用されることが可能である。フレームに対して実行されるものとして説明される操作は、サブフレームに対して実行されることも可能であり、この意味で、フレームとサブフレームは、本明細書で交換可能なように使用される。しかし、ｓ（ｎ）３４１０は、ブロック処理ではなく、連続処理が実施される場合、フレーム／サブフレームに分割されない可能性がある。このため、以下に説明されるブロック技術は、連続処理に拡張されることが可能である。

符号器３４０２は、ＮＢ（狭帯域）コーダまたはＷＢ（広帯域）コーダとして実施されることが可能である。ＮＢコーダは、信号ｓ（ｎ）３４１０を８ｋＨｚで、ディジタルでサンプリングし、５０Ｈｚ〜４ｋＨｚの帯域幅に存在する信号情報を符号化することができる。ＮＢコーダの例には、拡張可変レートコーダ（ＥＶＲＣ−Ｂ）が含まれることが可能である。ＷＢコーダは、信号ｓ（ｎ）３４１０を１６ｋＨｚで、ディジタルでサンプリングし、ＮＢコーダの帯域幅に存在する情報に加え、４〜８ｋＨｚの範囲の間に存在する情報を符号化することができる。ＷＢコーダの例には、ＥＶＲＣ−ＷＢコーダが含まれることが可能である。一態様では、ＥＶＲＣ−ＷＢは、ＥＶＲＣ−Ｂの広帯域拡張である。信号ｓ（ｎ）３４１０から分割された各フレームが、２０ｍｓ（ミリ秒）のデータ、つまり、１６０のサンプルを含むことが可能である。各サブフレームは、５３または５４のデータサンプルを含むことが可能である。これらのパラメータは、音声符号化に関して適切であり得るが、単に例にすぎず、他の適切な代替のパラメータが使用されることも可能である。

符号器３４０２が、ＮＢコーダとして実施される場合、フレームは、狭帯域パケット３４１８としてパックされることが可能である。狭帯域パケット３４１８は、狭帯域識別子３４２２を含むことが可能である。識別子３４２２は、狭帯域パケット３４１８が、ＮＢコーダを使用して符号化されていることを、復号器３４０４に示すことが可能である。符号器３４０２が、ＷＢコーダとして実施される場合、フレームは、広帯域パケット３４２０としてパックされることが可能である。広帯域パケット３４２０は、広帯域識別子３４２４を含むことが可能である。識別子３４２４は、広帯域パケット３４２０が、ＷＢコーダを使用して符号化されていることを、復号器３４０４に示すことが可能である。復号器３４０４は、識別子３４２２または３４２４を認識して、ＮＢ復号器を実施して、パケット３４１８が復号されるべきか、またはＷＢ復号器を実施して、パケット３４２０が復号されるべきかを決定することができるパケット識別モジュール３４１４を含むことが可能である。

図３５は、音声信号に関連するパケットに識別子を含めるための方法３５００の一構成を示す流れ図である。一態様では、この識別子は、パケットが、ＮＢコーダによって符号化されたか、またはＷＢコーダによって符号化されたかを示すことが可能である。方法３５００は、符号器３４０２などの符号器によって実施されることが可能である。

ある信号が、符号器３４０２によって受け取られる（３５０２）ことが可能である。一態様では、この信号は、あるタイプの音声信号である。この信号が、分析されて、複数のフレームに分割される（３５０４）ことが可能である。この信号の分割されたフレームが、ある特定の符号化スキーム（例えば、ＣＥＬＰ、ＰＰＰ、ＮＥＬＰ）を使用して、１／２レートで符号化される（３５０６）ことが可能である。一態様では、パケットは、８０ビットを使用して符号化されることが可能である。「１／２レート」という用語は、８０ビットを有するパケットを表すのに使用されることが可能である。フレームが、８０ビットを含む広帯域１／２レートフレームであるかどうかの判定３５０８が、行われる。つまり、符号器３４０２が、ＷＢコーダとして機能して、そのフレームをＷＢ−ＨＲ（広帯域１／２レート）フレームとして符号化したかどうかの判定３５０８が、行われる。フレームが、ＷＢ−ＨＲフレームである場合、広帯域識別子が、パケットの中にパックされる（３５１０）ことが可能である。一態様では、広帯域識別子は、２進数形式における１０進数、「１２６」および「１２７」の最初の６桁を含む。２進数形式における１０進数、「１２６」は、「１１１１１１０」であり、「１２７」の２進数形式は、「１１１１１１１」である。このため、広帯域識別子は、６つの１の列（例えば、「１１１１１１」）を含むことが可能である。

３５０８において、フレームがＷＢ−ＨＲフレームではないと判定された場合、狭帯域識別子が、パケットの中にパックされる（３５１２）ことが可能である。一態様では、この狭帯域識別子は、遅延パラメータに関連付けられることが可能である。例えば、遅延パラメータを表すのに使用されるビットが、狭帯域識別子として使用されることも可能である。このパケットが、伝送される（３５１４）ことが可能である。一態様では、このパケットは、復号器に伝送される（３５１４）。

図３６は、パケットを復号する方法３６００の一構成を示す流れ図である。方法３６００は、復号器３４０４によって実施されることが可能である。一態様では、１／２レートパケットが、受信される（３６０２）。１／２レートパケットに含められた識別子が、分析される（３６０４）ことが可能である。この識別子は、１／２レートパケットが、ＷＢコーダによって符号化されたか、またはＮＢコーダによって符号化されたかを示すことが可能である。一態様では、この識別子は、無効／不正な遅れである特殊なパケットＩＤ（識別子）である。この識別子の分析に基づいて、パケットが、ＷＢ−ＨＲパケットであるかどうかの判定（３６０６）が行われる。パケットが、ＷＢ−ＨＲパケットである場合、パケットは、広帯域復号スキームを使用して復号される（３６０８）。一構成において、復号器３４０４は、ＷＢ復号器として機能する。しかし、パケットが、ＷＢ−ＨＲではないと判定（３６０６）された場合、パケットは、狭帯域復号スキームを使用して復号される（３６１０）。復号器３４０４は、ＮＢ復号器として機能することが可能である。復号された１つまたは複数のパケットから、信号が再構築される（３６１２）ことが可能である。

図３７は、通信路３７０６を介してマルチモード復号器３７０４と通信するマルチモード符号器３７０２の一構成を示すブロック図である。通信路３７０６は、ＲＦ（無線周波数）インターフェースを含むことが可能である。符号器３７０２は、関連する復号器（図示せず）を含むことが可能である。符号器３７０２と、関連する復号器とは、第１の音声コーダを形成することが可能である。復号器３７０４は、関連する符号器（図示せず）を含むことが可能である。復号器３７０４と、関連する符号器とは、第２の音声コーダを形成することが可能である。

符号器３７０２は、初期パラメータ計算モジュール３７１８と、レート決定モジュール３７２０と、モード分類モジュール３７２２と、複数の符号化モード３７２４、３７２６、３７２８と、パケット形成モジュール３７３０とを含むことが可能である。パケット形成モジュール３７３０は、パケット識別子３７０８を挿入することが可能である。符号化モード３７２４、３７２６、３７２８の数が、任意の数の符号化モード３７２４、３７２６、３７２８を意味することが可能である、Ｎとして示される。簡明のため、３つの符号化モード３７２４、３７２６、３７２８が示され、破線が、他の符号化モードの存在を示している。

復号器３７０４は、パケット逆アセンブラモジュール３７３２と、複数の復号モード３７３４、３７３６、３７３８と、ポストフィルタ３７４０とを含むことが可能である。パケット逆アセンブラモジュール３７３２は、パケット識別モジュール３７１４を含むことが可能である。復号モード３７３４、３７３６、３７３８の数が、任意の数の復号モード３７３４、３７３６、３７３８を意味することが可能である、Ｎとして示される。簡明のため、３つの復号モード３７３４、３７３６、３７３８が示され、破線が、他の復号モードの存在を示している。

音声信号、ｓ（ｎ）３７１０が、初期パラメータ計算モジュール３７１８に与えられることが可能である。音声信号ｓ（ｎ）３７１０は、フレームと呼ばれるサンプルのブロックに分割されることが可能である。値ｎは、フレーム番号を示すことが可能であり、あるいは値ｎは、フレーム内のサンプル番号を示すことが可能である。代替の構成では、ＬＰ（線形予測）残差信号が、音声信号３７１０の代わりに使用されることが可能である。このＬＰ残差信号は、ＣＥＬＰ（符号励振線形予測）コーダなどの音声コーダによって使用されることが可能である。

初期パラメータ計算モジュール３７１８は、現在のフレームに基づいて、様々なパラメータを導き出すことができる。一態様では、これらのパラメータには、以下の少なくとも１つが含まれる。すなわち、ＬＰＣ（線形予測符号化）フィルタ係数、ＬＳＰ（線スペクトル対）係数、ＮＡＣＦ（正規化された自己相関関数）、開ループ遅れ、ゼロ交差レート、帯域エネルギー、およびフォルマント残差信号である。

初期パラメータ計算モジュール３７１８は、モード分類モジュール３７２２に結合されることが可能である。モード分類モジュール３７２２は、符号化モード３７２４、３７２６、３７２８の間で動的に切り替わることが可能である。初期パラメータ計算モジュール３７１８は、モード分類モジュール３７２２にパラメータを供給する。モード分類モジュール３７２２は、レート決定モジュール３７２０に結合されることが可能である。レート決定モジュール３７２０は、レートコマンド信号を受け入れることができる。レートコマンド信号は、ある特定のレートで音声信号３７１０を符号化するよう、符号器３７０２に指示することが可能である。一態様では、この特定のレートには、音声信号３７１０が、１７１ビットを使用して符号化されるべきことを示すことが可能な完全レートが含まれる。別の例では、この特定のレートには、音声信号３７１０が、８０ビットを使用して符号化されるべきことを示すことが可能な１／２レートが含まれる。さらなる例では、この特定のレートには、音声信号３７１０が、１６ビットを使用して符号化されるべきことを示すことが可能な１／８レートが含まれる。

前述したとおり、モード分類モジュール３７２２は、現在のフレームに関して最も適切な符号化モード３７２４、３７２６、３７２８を選択するために、フレームごとに符号化モード３７２４、３７２６、３７２８の間で動的に切り替わるように結合されることが可能である。モード分類モジュール３７２２は、パラメータを、事前定義されたしきい値および／または最高限度値と比較することによって、現在のフレームに関する特定の符号化モード３７２４、３７２６、３７２８を選択することができる。さらに、モード分類モジュール３７２２は、レート決定モジュール３７２０から受け取られたレートコマンド信号に基づいて、特定の符号化モード３７２４、３７２６、３７２８を選択することができる。例えば、符号化モードＡ３７２４が、１７１ビットを使用して音声信号３７１０を符号化することが可能であるのに対して、符号化モードＢ３７２６は、８０ビットを使用して音声信号３７１０を符号化することが可能である。

フレームのエネルギー含有量に基づき、モード分類モジュール３７２２は、フレームを、非音声もしくは非活性の音声（例えば、沈黙、背景雑音、または語の合間の休止）として、または音声として分類することができる。フレームの周期性に基づき、モード分類モジュール３７２２は、音声フレームを、ある特定のタイプの音声、例えば、有声、無声、または遷移として分類することができる。

有声音声には、比較的高い度合いの周期性を示す音声が含まれることが可能であり、母音サウンドが含まれることが可能である。ピッチ周期が、フレームの内容を分析し、再構築するのに使用されることが可能な音声フレームの成分であることが可能である。無声音声には、子音サウンドが含まれることが可能である。遷移音声フレームには、有声音声と無声音声の間の遷移が含まれることが可能である。有声音声としても、無声音声としても分類されないフレームは、遷移音声として分類されることが可能である。

音声モード（発声モードとも呼ばれる）が、現在のフレームが、有声音声であるか、または無声音声であるかを示す。このパラメータは、周期性の１つまたは複数の測度（例えば、ゼロ交差、ＮＡＣＦ、ピッチ利得）、および／またはそのような測度としきい値の間の関係などの、フレームに関する音声活動に基づくバイナリ値を有することが可能である。他の実施形態では、音声モードパラメータは、沈黙または背景雑音、あるいは沈黙と有声音声の間の遷移などのモードを示す、他の１つまたは複数の状態を有する。

音声フレームを分類することは、異なるタイプの音声を符号化するのに、異なる符号化モード３７２４、３７２６、３７２８が使用されることを許して、通信路３７０６などの共有される通信路における帯域幅の、より効率的な使用をもたらすことが可能である。例えば、有声音声は、周期的であり、このため、非常に予測的であるので、低いビットレートの、非常に予測的な符号化モード３７２４、３７２６、３７２８を使用して、有声音声が符号化されることが可能である。

モード分類モジュール３７２２は、現在のフレームに関する符号化モード３７２４、３７２６、３７２８を、そのフレームの分類に基づいて選択することができる。これらの様々な符号化モード３７２４、３７２６、３７２８は、並行に結合されることが可能である。符号化モード３７２４、３７２６、３７２８の１つまたは複数が、任意の所与の時点で機能可能であり得る。一構成では、１つの符号化モード３７２４、３７２６、３７２８が、現在のフレームの分類に従って選択される。

これらの異なる符号化モード３７２４、３７２６、３７２８は、異なる符号化ビットレート、異なる符号化スキーム、または符号化ビットレートと符号化スキームの異なる組み合わせに従って機能することが可能である。前述したとおり、使用される様々な符号化レートは、完全レート、１／２レート、１／４レート、および／または１／８レートであることが可能である。使用される様々な符号化スキームは、ＣＥＬＰ符号化、ＰＰＰ（プロトタイプピッチ周期）符号化（またはＷＩ（波形補間）符号化）、および／またはＮＥＬＰ（雑音励振線形予測）符号化であることが可能である。このため、例えば、ある特定の符号化モード３７２４、３７２６、３７２８が、完全レートＣＥＬＰであることが可能であり、別の符号化モード３７２４、３７２６、３７２８が、１／２レートＣＥＬＰであることが可能であり、別の符号化モード３７２４、３７２６、３７２８が、完全レートＰＰＰであることが可能であり、さらに、別の符号化モード３７２４、３７２６、３７２８が、ＮＥＬＰであることが可能である。

ＣＥＬＰ符号化モード３７２４、３７２６、３７２８によれば、線形予測声道モデルが、ＬＰ残差信号の量子化されたバージョンで励振させられることが可能である。ＣＥＬＰ符号化モードにおいて、現在のフレーム全体が、量子化されることが可能である。ＣＥＬＰ符号化モード３７２４、３７２６、３７２８は、音声の比較的正確な再現をもたらすことが可能であるが、比較的高い符号化ビットレートという犠牲を払う。ＣＥＬＰ符号化モード３７２４、３７２６、３７２８は、遷移音声として分類されたフレームを符号化するのに使用されることが可能である。

ＮＥＬＰ符号化モード３７２４、３７２６、３７２８によれば、濾波された擬似ランダム雑音信号を使用して、ＬＰ残差信号がモデル化されることが可能である。ＮＥＬＰ符号化モード３７２４、３７２６、３７２８は、低いビットレートを実現する比較的単純な技術であることが可能である。ＮＥＬＰ符号化モード３７２４、３７２６、３７２８は、無声音声として分類されたフレームを符号化するのに使用されることが可能である。

ＰＰＰ符号化モード３７２４、３７２６、３７２８によれば、各フレーム内のピッチ周期のサブセットが、符号化されることが可能である。音声信号の残りの周期は、これらのプロトタイプ周期の合間を補間することによって再構築されることが可能である。ＰＰＰ符号化の時間領域実施形態において、前のプロトタイプ周期をどのように変更して、現在のプロトタイプ周期を近似すべきかを記述する第１のパラメータセットが、計算されることが可能である。合計されると、現在のプロトタイプ周期と、変更された前のプロトタイプ周期との差を近似する１つまたは複数の符号ベクトルが、選択されることが可能である。第２のパラメータセットが、これらの選択された符号ベクトルを記述する。ＰＰＰ符号化の周波数領域実施形態において、プロトタイプの振幅スペクトルと位相スペクトルを記述するパラメータのセットが、計算されることが可能である。ＰＰＰ符号化の実施形態によれば、復号器３７０４が、振幅と位相を記述するパラメータのセットに基づいて現在のプロトタイプを再構築することによって、出力音声信号３７１６を合成することが可能である。過去のプロトタイプ周期が、現在のプロトタイプ周期の振幅および／または位相の予測子として使用されることが可能である。この音声信号が、現在の再構築されたプロトタイプ周期と、前の再構築されたプロトタイプ周期との間の領域にわたって補間されることが可能である。プロトタイプは、復号器３７０４において音声信号３７１０またはＬＰ残差信号を再構築するために、フレーム内で同様の位置にあった、前のフレームからのプロトタイプを使用して直線補間される、現在のフレームの部分を含むことが可能である。

音声フレーム全体ではなく、プロトタイプ周期を符号化することにより、符号化ビットレートが低減されることが可能である。有声音声として分類されたフレームは、ＰＰＰ符号化モード３７２４、３７２６、３７２８を使用して符号化されることが可能である。有声音声の周期性を活用することによって、ＰＰＰ符号化モード３７２４、３７２６、３７２８は、ＣＥＬＰ符号化モード３７２４、３７２６、３７２８より低いビットレートを実現することができる。

選択された符号化モード３７２４、３７２６、３７２８は、パケットフォーマットモジュール３７３０に結合されることが可能である。選択された符号化モード３７２４、３７２６、３７２８は、現在のフレームを符号化または量子化して、量子化されたフレームパラメータ３７１２をパケットフォーマットモジュール３７３０に供給することができる。パケットフォーマットモジュール３７３０は、量子化されたフレームパラメータ３７１２を組み立てて、フォーマットされたパケット３７１３にすることができる。パケットフォーマットモジュール３７３０は、このパケットを、広帯域パケットとして、または狭帯域パケットとしてフォーマットすることができる。パケット識別子３７０８が、このパケットの中に含められることが可能である。前述したとおり、パケット識別子３７０８は、復号器３７０４に、パケットが広帯域パケットであるか、または狭帯域パケットであるかを示すことができる。パケットフォーマットモジュール３７３０は、フォーマットされたパケット３７１３を、通信路３７０６を介して受信機（図示せず）に供給することができる。受信機は、フォーマットされたパケット３７１３を受信し、復調し、ディジタル化して、そのパケット３７１３を復号器３７０４に供給することができる。

復号器３７０４において、パケット逆アセンブラモジュール３７３２が、受信機からパケット３７１３を受け取る。パケット逆アセンブラモジュール３７３２は、パケット３７１３をアンパックすることができ、パケット識別モジュール３７１４が、パケット３７１３の中に含められたパケット識別子３７０８を認識することができる。パケット識別モジュール３７１４は、パケット３７１３が、ＷＢ−ＨＲパケットであること、または狭帯域１／２レートパケットであることを見出すことが可能である。パケット逆アセンブラモジュール３７３２は、パケットごとに復号モード３７３４、３７３６、３７３８の間で動的に切り替わるように構成されることも可能である。復号モード３７３４、３７３６、３７３８の数は、符号化モード３７２４、３７２６、３７２８の数と同一であることが可能である。番号が付けられた各符号化モード３７２４、３７２６、３７２８が、同一の符号化ビット、および同一の符号化スキームを使用するように構成された、同様に番号が付けられたそれぞれの復号モード３７３４、３７３６、３７３８に関連付けられることが可能である。

パケット逆アセンブラモジュール３７３２が、パケット３７１３を検出した場合、パケット３７１３は、分解されて、該当する復号モード３７３４、３７３６、３７３８に供給される。該当する復号モード３７３４、３７３６、３７３８は、パケット識別子３７０８の分析に基づいて広帯域復号技術または狭帯域復号技術を実施することができる。パケット逆アセンブラモジュール３７３２が、パケットを検出しない場合、パケット損失が宣言され、消去復号器（図示せず）が、フレーム消去処理を実行することができる。復号モード３７３４、３７３６、３７３８の並行アレーは、ポストフィルタ３７４０に結合されることが可能である。該当する復号モード３７３４、３７３６、３７３８は、パケット３７１３を復号して、または逆量子化して、その情報をポストフィルタ３７４０に供給することができる。ポストフィルタ３７４０は、音声フレームを再構築し、または合成し、合成された音声フレーム、

を出力する。

一構成では、量子化されたパラメータ自体は、伝送されない。代わりに、復号器３７０４における様々なＬＵＴ（ルックアップテーブル）（図示せず）の中のアドレスを指定するインデックスであるコードブックが、伝送される。復号器３７０４は、コードブックインデックスを受け取り、様々なコードブックＬＵＴの中で適切なパラメータ値を探す。したがって、例えば、ピッチ遅れ、適応コードブック利得、およびＬＳＰなどのパラメータに関するコードブックインデックスが、伝送されることが可能であり、関連する３つのコードブックＬＵＴの中で復号器３７０４によって検索が行われることが可能である。

ＣＥＬＰ符号化モードによれば、ピッチ遅れ、ピッチ利得、コードブックパラメータ、およびＬＳＰパラメータが、伝送されることが可能である。ＬＳＰコードブックインデックスは、ＬＰ残差信号が、復号器３７０４において合成されることが可能であるため、伝送される。さらに、現在のフレームに関するピッチ遅れ値と、前のフレームに関するピッチ遅れ値との差が、伝送されることが可能である。

音声信号３７１０が復号器３７０４において合成されるべきＰＰＰ符号化モードによれば、ピッチ遅れパラメータ、振幅パラメータ、および位相パラメータが、伝送される。ＰＰＰ音声符号化技術によって使用される、より低いビットレートは、絶対ピッチ遅れ情報と相対ピッチ遅れ差分値をともに伝送することは許さない可能性がある。

一例によれば、有声音声フレームなどの非常に周期的なフレームが、現在のフレームに関するピッチ遅れ値と、前のフレームに関するピッチ遅れ値の差を伝送のために量子化し、現在のフレームに関する絶対ピッチ遅れ値を伝送のために量子化することはしない、低ビットレートのＰＰＰ符号化モードを使用して伝送される。有声フレームは、非常に周期的な性質があるため、絶対ピッチ遅れ値ではなく、差分値を伝送することにより、より低い符号化ビットレートが実現されることが可能になり得る。一態様では、この量子化は、前のフレームに関するパラメータ値の加重和が計算されるように一般化され、これらの重みの和は、１であり、この加重和が、現在のフレームに関するパラメータ値から引かれる。次に、この差が、量子化されることが可能である。

図３８は、可変レート音声符号化方法３８００の一例を示す流れ図である。一態様では、方法３８００は、パケットを広帯域パケットまたは狭帯域パケットとして符号化する能力を与えられることが可能な単一の移動局３３０２によって実施される。他の態様では、方法３８００は、複数の移動局３３０２によって実施されることが可能である。つまり、１つの移動局３３０２が、広帯域パケットまたは狭帯域パケットを符号化する符号器を含むことが可能である一方で、別の移動局３３０２が、広帯域復号技術または狭帯域復号技術を使用して、そのパケットを復号する復号器を含むことが可能である。現在のフレームの初期パラメータが、計算される（３８０２）ことが可能である。一構成では、初期パラメータ計算モジュール３７１８が、これらのパラメータを計算する（３８０２）。これらのパラメータには、以下の１つまたは複数が含まれることが可能である。すなわち、ＬＰＣ（線形予測符号化）フィルタ係数、ＬＰＳ（線スペクトル対）係数、ＮＡＣＦ（正規化された自己相関関数）、開ループ遅れ、帯域エネルギー、ゼロ交差レート、およびフォルマント残差信号である。

現在のフレームは、活性として、または非活性として分類される（３８０４）ことが可能である。一構成では、分類モジュール３７２２が、現在のフレームを、「活性」の音声、または「非活性」の音声を含むものとして分類する。前述したとおり、ｓ（ｎ）３７１０は、音声の周期と、沈黙の周期とを含むことが可能である。活性の音声は、発話された語を含むことが可能であるのに対して、非活性の音声は、背景雑音、沈黙、休止などを含むことが可能である。

現在のフレームが、活性として分類されていたか、非活性として分類されていたかの判定３８０６が、行われる。現在のフレームが、活性として分類される場合、この活性の音声は、有声フレームとして、無声フレームとして、または遷移フレームとしてさらに分類される（３８０８）。人間の音声は、多くの異なる仕方で分類されることが可能である。音声の２つの分類には、有声サウンドと無声サウンドが含まれることが可能である。有声でない、すなわち無声である音声は、遷移音声として分類されることが可能である。

符号器／復号器モードが、ステップ３８０６および３８０８で行われたフレーム分類に基づいて選択される（３８１０）ことが可能である。様々な符号器／復号器モードが、図３７に示されるとおり、並行に接続されることが可能である。これらの異なる符号器／復号器モードは、異なる符号化スキームに従って動作する。いくつかのモードは、ある特性を示す音声信号ｓ（ｎ）３７１０の符号化部分において、より効果的である可能性がある。

前述したとおり、ＣＥＬＰモードが、遷移音声として分類されたフレームを符号化するのに選択されることが可能である。ＰＰＰモードが、有声音声として分類されたフレームを符号化するのに選択されることが可能である。ＮＥＬＰモードが、無声音声として分類されたフレームを符号化するのに選択されることが可能である。同一の符号化技術が、異なるビットレートにおいて、様々なレベルのパフォーマンスで、しばしば、機能させられることが可能である。図３７の、異なる符号器／復号器モードは、異なる符号化技術、または異なるビットレートで機能する同一の符号化技術、あるいは以上の組み合わせを表すことが可能である。

選択された符号器モードは、現在のフレームを符号化し（３８１２）、この符号化されたフレームを、あるビットレートに従ってパケットにフォーマットする（３８１４）。パケット識別子が、パケットの中に含められる（３８１６）ことが可能である。パケット識別子は、パケットが、広帯域パケットとして符号化されたか、または狭帯域パケットとして符号化されたかを示すことができる。このパケットが、復号器に送信される（３８１８）。

図３９は、通常の狭帯域１／２レートパケット３９０２および広帯域１／２レートパケット３９０４の一構成を示すブロック図である。一態様では、各パケットは、パケット識別子Ａ３９０６およびパケット識別子Ｂ３９０７などのパケット識別子を含むことが可能である。パケット識別子Ａ３９０６は、正当な遅れ値３９０８を含むことが可能であり、パケット識別子Ｂ３９０７は、不正な遅れ値３９１４を含むことが可能である。不正な遅れ値３９１４は、あるパケットが、広帯域１／２レートパケット３９０４であるか、または特別狭帯域１／２レートパケットであるかを復号器に示す値であることが可能である。正当な遅れ値は、あるパケットが、通常の（特別でない）狭帯域１／２レートＣＥＬＰパケット３９０２であるかどうかを復号器に示すことが可能である。他の構成では、正当な遅れ値は、あるパケットが、［０：１００］の範囲内のピッチ遅れ値を含む、他のいずれかの１／２レートパケットであるかどうかを復号器に示すことが可能である。［０：１００］の範囲内のピッチ遅れ値は、単に例として使用される。本システムおよび本方法は、有効である（ある特定の符号化スキームに関連する）値セット、および不正／無効である別の値セットを有する所与のＮビットフィールドに適用されることが可能である。

一構成では、通常の狭帯域１／２レートパケット３９０２は、パケット３９０２の中に含められる８０ビットのそれぞれを利用する。このため、着信するパケットが、通常の（特別でない）狭帯域１／２レートＣＥＬＰであることを復号器に示すことが可能な、正当な遅れ値３９０８を格納する遅延パラメータが、使用されることが可能である。一態様では、この遅延パラメータは、７ビットを含む。この遅延パラメータは、「１０１」から「１２７」までの１０進数の範囲内の値３９１０であることが可能である。この７ビットフィールドの中の正当な（有効な）遅れ値は、「０」から「１００」までの１０進数の範囲内の値３９１０であることが可能である。「０」から「１００」までの範囲内の値３９１０は、２進数形式（例えば、７ビットの２進数）で通常の（特別でない）狭帯域1／２レートＣＥＬＰパケット３９０２の中に含められることが可能である。

一態様では、広帯域コーダが、ＮＥＬＰ符号化スキームを実施して、無声サウンドを符号化する。無声サウンドに関する信号は、８０ビットを有するパケットとして広帯域１／２レートパケット３９０４の中にパックされることが可能である。しかし、無声サウンドを有するパケットは、遅延を含まないことが可能である。一構成では、無声サウンドに関する信号の許容できる再現が、遅延なしに達せられることが可能であるため、無声サウンドに関して、符号器によって遅延の分析は行われない可能性がある。広帯域１／２レートパケット３９０４は、８０ビットのうち７４ビットを利用して、６ビットを空いたままにすることが可能である。広帯域１／２レートパケット３９０４に関連するパケット識別子Ｂ３９０７は、６つの１の列３９１２（例えば、「１１１１１１」）を含むことが可能である。一構成では、列３９１２は、「１２６」および「１２７」という１０進数にマップされることが可能であり（７ビットで）、広帯域１／２レートパケット３９０４のための識別子として予約されることが可能である。

一構成では、Ｎビットパラメータからの少なくとも２つの不正な値が、利用されることが可能である。２つの不正な値が使用される場合、Ｎビットパラメータからの１ビットが、情報を伝送するように空けられることが可能である。さらなる構成では、情報を伝送するように空けられることが可能なＮビットパラメータからのビットの数は、ｌｏｇ_２（Ｘ）と等しいことが可能であり、ただし、Ｘは、Ｎビットパラメータからもたらされる不正な値の数である。例えば、８つの不正な値が、他の情報を伝送するための３ビットを空けることが可能である。

図４０は、様々なタイプのパケットに割り当てられたビットの数を示すチャート４０００である。チャート４０００は、複数のパラメータ４００２を含む。この複数のパラメータ４００２内の各パラメータが、ある数のビットを利用することが可能である。チャート４０００に示される様々なパケットタイプは、前述した様々な符号化モードの１つを利用して符号化されていることが可能である。これらのパケットタイプには、ＦＣＥＬＰ（完全レートＣＥＬＰ）４００４、ＨＣＥＬＰ（１／２レートＣＥＬＰ）４００６、ＳＰＬＨＣＥＬＰ（特別１／２レートＣＥＬＰ）４００８、ＦＰＰＰ（完全レートＰＰＰ）４０１０、ＳＰＬＨＰＰＰ（特別１／２レートＰＰＰ）４０１２、ＱＰＰＰ（１／４レートＰＰＰ）４０１４、ＳＰＬＨＮＥＬＰ（特別１／２レートＮＥＬＰ）４０１６、ＱＮＥＬＰ（１／４レートＮＥＬＰ）４０１８、および沈黙符号器４０２０が含まれることが可能である。

ＦＣＥＬＰ４００４およびＦＰＰＰ４０１０は、合計で１７１ビットを有するパケットであることが可能である。ＦＣＥＬＰ４００４パケットは、ＳＰＬＨＣＥＬＰ４００８パケットに変換されることが可能である。一態様では、ＦＣＥＬＰ４００４パケットは、ＦＣＢインデックス（固定コードブックインデックス）やＦＣＢ利得（固定コードブック利得）などのパラメータにビットを割り当てる。図示されるとおり、ＦＣＥＬＰ４００４パケットが、ＳＰＬＨＣＥＬＰ４００８パケットに変換されると、ＦＣＢインデックス、ＦＣＢ利得、およびデルタ遅れなどのパラメータに０のビットが割り当てられる。つまり、ＳＰＬＨＣＥＬＰ４００８パケットは、これらのビットなしに復号器に伝送される。ＳＰＬＨＣＥＬＰ４００８パケットは、ＬＳＰ（線スペクトル対）、ＡＣＢ（適応コードブック）利得、特別１／２レートＩＤ（識別）、特別パケットＩＤ、ピッチ遅れ、およびモードビット情報などのパラメータに割り当てられたビットを含む。復号器に伝送されるビットの総数は、１７１から８０に減らされることが可能である。

同様に、ＦＰＰＰ４０１０パケットは、ＳＰＬＨＰＰＰ４０１２パケットに変換されることが可能である。図示されるとおり、ＦＰＰＰ４０１０パケットは、帯域整列パラメータにビットを割り当てる。ＦＰＰＰ４０１０パケットが、ＳＰＬＨＰＰＰ４０１２パケットに変換されることが可能である。帯域整列に割り当てられたビットは、破棄されることが可能である。つまり、ＳＰＬＨＰＰＰ４０１２パケットは、これらのビットなしに復号器に伝送される。復号器に伝送されるビットの総数は、１７１から８０に減らされることが可能である。一構成では、振幅パラメータおよび大域整列パラメータに割り当てられたビットが、ＳＰＬＨＰＰＰ４０１２パケットの中に含められることが可能である。振幅パラメータは、信号ｓ（ｎ）３７１０のスペクトルの振幅を示すことが可能であり、大域整列パラメータは、最大限の整列を確実にすることが可能な直線位相偏移を表すことが可能である。

さらに、様々なタイプのパケットが、遅れ／特別パケットＩＤパラメータに割り当てられたビットを含むことが可能である。遅れ／特別パケットＩＤパラメータは、ある特定のパケットが、狭帯域符号化技術を使用して符号化されたか、または広帯域符号化技術を使用して符号化されたかを、復号器が認識することを可能にするパケット識別子を表すことが可能である。

本明細書の様々な構成は、異なるパラメータ、および異なるパケットに関して異なる数のビットを使用して示される。本明細書の各パラメータに関連するビットの特定の数は、例示的であり、限定することを意図していない。パラメータは、本明細書で使用される例より多いビット、または少ないビットを含んでもよい。

図４１は、ある構成による、通信デバイス４１０８において利用されることが可能である様々な構成要素を示す。通信デバイス４１０８は、デバイス４１０８の動作を制御するプロセッサ４１０２を含むことが可能である。プロセッサ４１０２は、ＣＰＵと呼ばれることも可能である。ＲＯＭ（読み取り専用メモリ）とＲＡＭ（ランダムアクセスメモリ）の両方を含むことが可能なメモリ４１０４が、命令およびデータをプロセッサ４１０２に供給する。また、メモリ４１０４の一部分が、ＮＶＲＡＭ（不揮発性ランダムアクセスメモリ）を含むことも可能である。

また、通信デバイス４１０８は、アクセス端末装置４１０８と遠隔ロケーションとの間でデータを送受信することを可能にする送信機４１１０と受信機４１１２とを含む筐体４１２２を含むことも可能である。送信機４１１０と受信機４１１２が組み合わされて、トランシーバ４１２０にされることも可能である。アンテナ４１１８が、筐体４１２２に取り付けられて、トランシーバ４１２０に電気的に結合される。

また、通信デバイス４１０８は、トランシーバ４１２０によって受信される信号を検出し、そのような信号のレベルを定量化するのに使用される信号検出器４１０６も含む。信号検出器４１０６は、そのような信号を、総エネルギー、ＰＮ（擬似雑音当たりのパイロットエネルギー）チップ、パワースペクトル密度、およびその他の信号として検出する。

通信デバイス４１０８のステートチェンジャ（state changer）４１１４が、現在の状態、ならびにトランシーバ４１２０によって受信され、信号検出器４１０６によって検出された、さらなる信号に基づいて、通信デバイス４１０８の状態を制御する。デバイス４１０８は、いくつかの状態のいずれかの状態で動作することができることが可能である。

また、通信デバイス４１０８は、デバイス４１０８を制御し、現在のサービスプロバイダシステムが不十分であるとデバイス４１０８が判定した際に、デバイス４１０８が、いずれのサービスプロバイダに移行すべきかを決定するのに使用されるシステムディターミナ４１２４も含む。

通信デバイス４１０８の様々な構成要素は、データバスに加えて、電力バス、制御信号バス、およびステータス信号バスを含むことが可能なバスシステム４１１８によって一緒に結合される。しかし、簡明のため、様々なバスは、図４１に、バスシステム４１１８として示される。通信デバイス４１０８は、信号を処理する際に使用するためのＤＳＰ（ディジタル信号プロセッサ）４１１６を含むことも可能である。

情報および信号は、様々な異なる技術および技法のいずれかを使用して表されることが可能である。例えば、以上の説明全体にわたって言及されることが可能なデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界もしくは磁気粒子、光の場もしくは粒子、または以上の任意の組み合わせによって表現されることが可能である。

本明細書で開示される構成に関連して説明される様々な例示的な論理ブロック、モジュール、回路、およびアルゴリズムステップは、電子ハードウェアとして実施されても、コンピュータソフトウェアとして実施されても、あるいはその両方の組み合わせとして実施されてもよい。ハードウェアとソフトウェアの、この互換性を明確に示すのに、様々な例示的な構成要素、ブロック、モジュール、回路、およびステップが、概ね機能の点で以上に説明されてきた。そのような機能が、ハードウェアとして実施されるか、ソフトウェアとして実施されるかは、全体的なシステムに課される特定の応用上の制約、および設計上の制約に依存する。当業者は、説明される機能を、それぞれの特定の応用例に関して、様々な仕方で実施することができるが、そのような実施上の決定は、本システムおよび本方法の範囲からの逸脱を生じさせるものと解釈されてはならない。

本明細書で開示される構成に関連して説明される様々な例示的な論理ブロック図、モジュール、および回路は、汎用プロセッサ、ＤＳＰ（ディジタル信号プロセッサ）、ＡＳＩＣ（特定用途向け集積回路）、ＦＰＧＡ（フィールドプログラマブルゲートアレー）信号もしくは他のプログラマブルロジックデバイス、ディスクリートのゲートもしくはトランジスタロジック、ディスクリートのハードウェア構成要素、あるいは本明細書で説明される機能を実行するように設計された以上の任意の組み合わせを使用して、実施される、または実行されることが可能である。汎用プロセッサは、マイクロプロセッサであることが可能であるが、代替として、プロセッサは、任意のプロセッサ、コントローラ、マイクロコントローラ、または状態マシンであってもよい。また、プロセッサは、コンピューティングデバイスの組み合わせとして、例えば、ＤＳＰとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、ＤＳＰコアと連携する１つまたは複数のマイクロプロセッサ、または他の任意のそのような構成として実施されることも可能である。

本明細書で開示される構成に関連して説明される方法またはアルゴリズムのステップは、ハードウェアにおいて直接に、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこの２つの組み合わせで実施されることが可能である。ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭ（消去可能なプログラマブル読み取り専用メモリ）、ＥＥＰＲＯＭ（電気的に消去可能なプログラマブル読み取り専用メモリ）、レジスタ、ハードディスク、リムーバブルなディスク、ＣＤ−ＲＯＭ（コンパクトディスク読み取り専用メモリ）、または当技術分野で知られている他の任意の記憶媒体の中に存在することが可能である。記憶媒体は、プロセッサが、その記憶媒体から情報を読み取ること、およびその記憶媒体に情報を書き込むことができるように、プロセッサに結合されることが可能である。代替として、記憶媒体は、プロセッサと一体化していてもよい。プロセッサと記憶媒体は、ＡＳＩＣの中に存在することが可能である。このＡＳＩＣは、端末装置内に存在することが可能である。代替として、プロセッサと記憶媒体は、端末装置内のディスクリートの構成要素として存在してもよい。

本明細書で開示される方法は、説明される方法を実現するための１つまたは複数のステップまたはアクションを備える。方法ステップおよび／または方法アクションは、本システムおよび本方法の範囲を逸脱することなく、互いに入れ替えられることが可能である。つまり、ステップまたはアクションの特定の順序が、構成の適切な動作のために指定されない限り、特定のステップおよび／または特定のアクションの順序および／または使用は、本システムおよび本方法の範囲を逸脱することなく、変更されることが可能である。本明細書で開示される方法は、ハードウェアで、ソフトウェアで、またはその両方で実施されることが可能である。ハードウェアおよびメモリの例には、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ、光ディスク、レジスタ、ハードディスク、リムーバブルなディスク、ＣＤ−ＲＯＭ、または他の任意のタイプのハードウェアおよびメモリが含まれることが可能である。

本システムおよび本方法の特定の構成および応用例が例示され、説明されてきたが、本システムおよび本方法は、本明細書で開示される構成および構成要素そのものに限定されないものと理解されたい。当業者には明白となる様々な変形、変更、および変化が、主張されるシステムおよび方法の趣旨および範囲を逸脱することなく、本明細書で開示される方法およびシステムの構成、動作、および詳細において行われることが可能である。

本システムおよび本方法の特定の構成および応用例が例示され、説明されてきたが、本システムおよび本方法は、本明細書で開示される構成および構成要素そのものに限定されないものと理解されたい。当業者には明白となる様々な変形、変更、および変化が、主張されるシステムおよび方法の趣旨および範囲を逸脱することなく、本明細書で開示される方法およびシステムの構成、動作、および詳細において行われることが可能である。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
［１］音声信号に関連するパケットの中に識別子を含めるための方法であって、
信号を受信すること、
前記信号を複数のフレームに分割すること、
前記信号のフレームをパケット内に符号化すること、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定すること、
前記決定に基づいて前記パケットの中に識別子をパックすること、および
前記パケットを伝送することを備える方法。
［２］前記パケットは、広帯域１／２レートパケットとして符号化される［１］に記載の方法。
［３］前記広帯域１／２レートパケットは、８０ビットを含む［２］に記載の方法。
［４］前記広帯域１／２レートパケットは、広帯域識別子を含む［２］に記載の方法。
［５］前記広帯域識別子は、１０進数で１２６を２進数形式で備える［４］に記載の方法。
［６］前記広帯域識別子は、１０進数で１２７を２進数形式で備える［４］に記載の方法。
［７］前記広帯域識別子は、６つの１を備える［４］に記載の方法。
［８］前記広帯域１／２レートパケットは、ＮＥＬＰ（雑音励振線形予測）符号化スキームを使用して符号化される［２］に記載の方法。
［９］前記フレームは、移動局上の広帯域コーダによって符号化される［１］に記載の方法。
［１０］前記フレームを、移動局上の広帯域復号器によって復号することをさらに備える［１］に記載の方法。
［１１］第１の移動局から第２の移動局に前記パケットを伝送することをさらに備える［１］に記載の方法。
［１２］Ｎビットパラメータから少なくとも２つの不正な値をもたらすことをさらに備え、前記Ｎビットパラメータからの少なくとも１ビットは、情報を伝送するのに使用される［１］に記載の方法。
［１３］情報を伝送するのに使用される前記Ｎビットパラメータからのビットの数は、ｌｏｇ _２（Ｘ）と等しく、Ｘは、前記Ｎビットパラメータからもたらされる不正な値の数である［１２］に記載の方法。
［１４］音声信号に関連するパケットの中に識別子を含めるための装置であって、
プロセッサと、
前記プロセッサと電子通信するメモリと、
前記メモリの中に格納された命令とを具備し、
前記命令は、信号を受信し、前記信号を複数のフレームに分割し、前記信号のフレームをパケット内に符号化し、前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、前記決定に基づいて前記パケットの中に識別子をパックし、前記パケットを伝送するように実行可能である装置。
［１５］前記パケットは、広帯域１／２レートパケットとして符号化される［１４］に記載の装置。
［１６］前記広帯域１／２レートパケットは、８０ビットを含む［１５］に記載の装置。
［１７］前記広帯域１／２レートパケットは、広帯域識別子を含む［１５］に記載の装置。
［１８］前記広帯域識別子は、１０進数で１２６を２進数形式で備える［１７］に記載の装置。
［１９］前記広帯域識別子は、１０進数で１２７を２進数形式で備える［１７］に記載の装置。
［２０］前記広帯域識別子は、６つの１を備える［１７］に記載の装置。
［２１］音声信号に関連するパケットの中に識別子を含めるように構成されたシステムであって、
処理するための手段と、
信号を受信するための手段と、
前記信号を複数のフレームに分割するための手段と、
前記信号のフレームをパケット内に符号化するための手段と、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定するための手段と、
前記決定に基づいて前記パケットの中に識別子をパックするための手段と、
前記パケットを伝送するための手段とを備えるシステム。
［２２］信号を受信し、
前記信号を複数のフレームに分割し、
前記信号のフレームをパケット内に符号化し、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、
前記決定に基づいて前記パケットの中に識別子をパックし、
前記パケットを伝送するように実行可能である命令のセットを格納するように構成されたコンピュータ可読媒体。
［２３］パケットを復号するための方法であって、
パケットを受信すること、
前記パケットの中に含められた識別子を分析すること、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定すること、および
前記判定に基づいて前記パケットに関する復号モードを選択することを備える方法。
［２４］パケットを復号するための装置であって、
プロセッサと、
前記プロセッサと電子通信するメモリと、
前記メモリの中に格納され、
パケットを受信し、
前記パケットの中に含められた識別子を分析し、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、
前記判定に基づいて前記パケットに関する復号モードを選択するように実行可能である命令とを備える装置。
［２５］パケットを復号するように構成されたシステムであって、
処理するための手段と、
パケットを受信するための手段と、
前記パケットの中に含められた識別子を分析するための手段と、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定するための手段と、
前記判定に基づいて前記パケットに関する復号モードを選択するための手段とを備えるシステム。
［２６］パケットを受信し、
前記パケットの中に含められた識別子を分析し、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、
前記判定に基づいて前記パケットに関する復号モードを選択するように実行可能である命令のセットを格納するように構成されたコンピュータ可読媒体。

Claims

音声信号に関連するパケットの中に識別子を含めるための方法であって、
信号を受信すること、
前記信号を複数のフレームに分割すること、
前記信号のフレームをパケット内に符号化すること、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定すること、
前記決定に基づいて前記パケットの中に識別子をパックすること、および
前記パケットを伝送することを備える方法。
前記パケットは、広帯域１／２レートパケットとして符号化される請求項１に記載の方法。
前記広帯域１／２レートパケットは、８０ビットを含む請求項２に記載の方法。
前記広帯域１／２レートパケットは、広帯域識別子を含む請求項２に記載の方法。
前記広帯域識別子は、１０進数で１２６を２進数形式で備える請求項４に記載の方法。
前記広帯域識別子は、１０進数で１２７を２進数形式で備える請求項４に記載の方法。
前記広帯域識別子は、６つの１を備える請求項４に記載の方法。
前記広帯域１／２レートパケットは、ＮＥＬＰ（雑音励振線形予測）符号化スキームを使用して符号化される請求項２に記載の方法。
前記フレームは、移動局上の広帯域コーダによって符号化される請求項１に記載の方法。
前記フレームを、移動局上の広帯域復号器によって復号することをさらに備える請求項１に記載の方法。
第１の移動局から第２の移動局に前記パケットを伝送することをさらに備える請求項１に記載の方法。
Ｎビットパラメータから少なくとも２つの不正な値をもたらすことをさらに備え、前記Ｎビットパラメータからの少なくとも１ビットは、情報を伝送するのに使用される請求項１に記載の方法。
情報を伝送するのに使用される前記Ｎビットパラメータからのビットの数は、ｌｏｇ_２（Ｘ）と等しく、Ｘは、前記Ｎビットパラメータからもたらされる不正な値の数である請求項１２に記載の方法。
音声信号に関連するパケットの中に識別子を含めるための装置であって、
プロセッサと、
前記プロセッサと電子通信するメモリと、
前記メモリの中に格納された命令とを具備し、
前記命令は、信号を受信し、前記信号を複数のフレームに分割し、前記信号のフレームをパケット内に符号化し、前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、前記決定に基づいて前記パケットの中に識別子をパックし、前記パケットを伝送するように実行可能である装置。
前記パケットは、広帯域１／２レートパケットとして符号化される請求項１４に記載の装置。
前記広帯域１／２レートパケットは、８０ビットを含む請求項１５に記載の装置。
前記広帯域１／２レートパケットは、広帯域識別子を含む請求項１５に記載の装置。
前記広帯域識別子は、１０進数で１２６を２進数形式で備える請求項１７に記載の装置。
前記広帯域識別子は、１０進数で１２７を２進数形式で備える請求項１７に記載の装置。
前記広帯域識別子は、６つの１を備える請求項１７に記載の装置。
音声信号に関連するパケットの中に識別子を含めるように構成されたシステムであって、
処理するための手段と、
信号を受信するための手段と、
前記信号を複数のフレームに分割するための手段と、
前記信号のフレームをパケット内に符号化するための手段と、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定するための手段と、
前記決定に基づいて前記パケットの中に識別子をパックするための手段と、
前記パケットを伝送するための手段とを備えるシステム。
信号を受信し、
前記信号を複数のフレームに分割し、
前記信号のフレームをパケット内に符号化し、
前記パケットが、広帯域パケットとして符号化されるか、または狭帯域パケットとして符号化されるかを決定し、
前記決定に基づいて前記パケットの中に識別子をパックし、
前記パケットを伝送するように実行可能である命令のセットを格納するように構成されたコンピュータ可読媒体。
パケットを復号するための方法であって、
パケットを受信すること、
前記パケットの中に含められた識別子を分析すること、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定すること、および
前記判定に基づいて前記パケットに関する復号モードを選択することを備える方法。
パケットを復号するための装置であって、
プロセッサと、
前記プロセッサと電子通信するメモリと、
前記メモリの中に格納され、
パケットを受信し、
前記パケットの中に含められた識別子を分析し、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、
前記判定に基づいて前記パケットに関する復号モードを選択するように実行可能である命令とを備える装置。
パケットを復号するように構成されたシステムであって、
処理するための手段と、
パケットを受信するための手段と、
前記パケットの中に含められた識別子を分析するための手段と、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定するための手段と、
前記判定に基づいて前記パケットに関する復号モードを選択するための手段とを備えるシステム。
パケットを受信し、
前記パケットの中に含められた識別子を分析し、
前記パケットが、広帯域コーダによって符号化されたか、または狭帯域コーダによって符号化されたかを判定し、
前記判定に基づいて前記パケットに関する復号モードを選択するように実行可能である命令のセットを格納するように構成されたコンピュータ可読媒体。