JP2009541797A

JP2009541797A - 種々の音声フレーム・レートの混合励振線形予測（ｍｅｌｐ）ボコーダ間でトランスコーディングするボコーダ及び関連した方法

Info

Publication number: JP2009541797A
Application number: JP2009516670A
Authority: JP
Inventors: ダブリュチャンバーレイン，マーク
Original assignee: Harris Corp
Current assignee: Harris Corp
Priority date: 2006-06-21
Filing date: 2007-06-19
Publication date: 2009-11-26
Also published as: CN101506876A; US20070299659A1; US8589151B2; EP2038883A1; EP2038883B1; IL196093A0; CA2656130A1; IL196093A; WO2007149840B1; WO2007149840A1

Abstract

ボコーダ及び方法は、別々の音声フレーム・レートで使用するために、混合励振線形予測（ＭＥＬＰ）符号化データをトランスコーディングする。入力データは、ＭＥＬＰパラメータ（第１のＭＥＬＰボコーダによって使用されるものなど）に変換される（１００）。前述のパラメータをバッファリングし（１０２）、時間補間（１０４）をパラメータに対して量子化によって行って離間点を予測する。符号化機能（１０６）を、ブロックとしての補間データに対して行って、第１のＭＥＬＰボコーダとは異なる音声フレーム・レートの第２のＭＥＬＰボコーダによって使用されるビット・レートにおける削減をもたらす。

Description

本発明は、通信に関し、特に、本発明は、通信において使用される音声コーダ（ボコーダ）に関する。

音声コーダ（ボコーダとも呼ばれる）は、音声信号が占める帯域幅を（例えば、音声圧縮手法を使用することによって）削減し、電子的に合成されたインパルスにより、音声信号を置き換える回路である。例えば、一部のボコーダでは、電子音声解析器又は合成器は、音声波形を、いくつかの同時アナログ信号に変換する。電子音声合成器は、アナログ制御信号に応じ、人工的な音を生成することが可能である。音声解析器は、アナログ波形を狭帯域ディジタル信号に変換することが可能である。前述の手法の一部を使用すれば、ボコーダを鍵生成器及び変調器／復調器装置とともに使用して、通常の狭帯域音声通信チャネルを介して、ディジタル形式で暗号化された音声信号を伝送することが可能である。その結果、ディジタル化された音声信号を伝送するための帯域幅要件は軽減される。

新たな軍事技術標準のボコーダ（ＭＩＬ−ＳＴＤ−３００５）のアルゴリズムは、２．４Ｋｂｐｓで動作する混合励振線形予測（ＭＥＬＰ）として表される。ボコーダは、前述のアルゴリズムを使用して動作させると、良性の誤りチャネルの下で好適な音声品質を有する。しかし、ボコーダを、マンパック無線機（ＭＰＲ）の通常の電力出力を有するＨＦチャネルにさらすと、ボコーダの音声品質は劣化する。６００ｂｐｓのボコーダは、２．４Ｋｂｐｓのボコーダよりも、セキュアな音声の利用可能性がかなり高いことが明らかになっている。

通常の２．４Ｋｂｐｓの線形予測符号化（ＬＰＣ１０ｅ）ベースのシステムのものと比較して同じか、又はより好適な音声品質及び了解度を備えた低レートの音声ボコーダに対する必要性が存在している。６００ｂｐｓでのＭＥＬＰ音声ボコーダは、現在の２．４ｋｂｐｓのＬＰＣ１０ｅの技術標準よりもロバストでかつビット・レートが低い波形を利用し、ＭＥＬＰボコーダ・パラメトリック・モデルのより良好な音声品質の便益も受ける。タクティカル・マンパック無線機（ＭＰＲ）は通常、ディジタル音声を使用した、２４時間の接続性を確実にするために、より低いビット・レートの波形を必要とする。ＨＦユーザが、高信頼度の、好適な品質のディジタル音声を受信すると、広く受け入れられることにより、全てのユーザのよるセキュリティが向上する。更に、ＨＦユーザは、ディジタル音声に固有のディジタル・スケルチ、及び、受信オーディオにおける大気雑音の除去の恩恵も受ける。

ＬＰＣ１０ｅの技術標準を使用した現在の２．４Ｋｂｐｓのボコーダは、ＨＦチャネル上で、暗号化音声システム内で広く使用されている。しかし、２．４ｋｂｐｓシステムでは、狭帯域ＨＦチャネル上での通信を首尾良く行うことができる可能性は限定的である。通常の３ｋＨｚチャネルは、標準的な２．４Ｋｂｐｓビット・レートでの高信頼度でセキュアな通信を可能にするためには比較的高い信号対雑音比（ＳＮＲ）を必要とする。２４００ｂｐｓでのＭＩＬ−ＳＴＤ−１８８−１１０Ｂを使用しても、通常のフェージング・チャネルを介した使用可能な通信リンクを設けるために、＋１２ｄＢを超える３ｋＨｚＳＮＲがなお必要になる。

ＨＦチャネルにより、通常、ＬＰＣ１０ｅを使用した２４００ｂｐｓチャネルが比較的誤りがない状態が可能になる一方、音声品質はなお最低限のものである。前述のシステムの音声の了解度及び受容性は、マイクにおける背景雑音レベルの量に制限される。了解度は、軍事用Ｈ−２５０などの通信用受話器のローエンドの周波数応答により、更に劣化する。ＭＥＬＰ音声モデルは、背景雑音及びローエンドの周波数ロールオフに対する、ボコーダにおける感度を改善する一体化された雑音前置処理器を有する。６００ｂｐｓのＭＥＬＰボコーダは、このタイプの雑音前置処理器、及びＭＥＬＰモデルのローエンド周波数の低感度の向上の恩恵を受ける。

一部のシステムでは、ボコーダは縦続接続され、それにより、音声の了解度が低下する。いくつかの縦続接続により、了解度が、使用可能なレベル（例えば、ＲＦ６０１０標準）未満に低下し得る。縦続接続間のトランスコーディングにより、アナログの代わりにディジタル手法が使用される了解度損失が大きく削減される。しかし、フレーム・レート及び手法が異なるボコーダ間のトランスコーディングは困難であることが明らかになっている。「同様な」ボコーダ間でのトランスコーディングを行ってビット・レートを変える既知のシステムも存在している。先行技術の提案の１つにより、ＬＰＣ１０とＭＥＬＰｅとの間のトランスコーディングが提供されている。ソース・コードは、ＭＥＬＰ１２００システム及びＭＥＬＰ２４００システム間のＭＥＬＰトランスコーディングも提供することが可能である。

ボコーダ、及び関連した方法は、別々の音声フレーム・レートで使用するために、混合励振線形予測（ＭＥＬＰ）符号化データのトランスコーディングを行う。入力データは、第１のＭＥＬＰボコーダによって使用されるＭＥＬＰパラメータに変換される。前述のパラメータがバッファリングされ、時間補間をパラメータに対して量子化によって行って、離間点を予測する。符号化機能を、ブロックとしての補間データに対して行って、第１のＭＥＬＰボコーダとは異なる音声フレーム・レートで第２のＭＥＬＰボコーダによって使用されるビット・レートを削減する。

更に別の局面は、ビット・レートは、ＭＥＬＰ２４００ボコーダにより、ＭＥＬＰ６００ボコーダで使用されるビット・レートへのトランスコーディングが行われる。ＭＥＬＰパラメータは、ブロック内の連続した複数のフレームの非量子化ＭＥＬＰパラメータから、音声データ・ブロックについて量子化することが可能である。符号化機能は、非量子化ＭＥＬＰパラメータを取得し、フレームを合成して、一ＭＥＬＰ６００ＢＰＳフレームを形成し、非量子化ＭＥＬＰパラメータを生成し、ＭＥＬＰ６００ＢＰＳフレームのＭＥＬＰパラメータを量子化し、これらをシリアル・データ・ストリームに符号化することによって行うことが可能である。入力データはＭＥＬＰ２４００パラメータに変換することが可能である。ＭＥＬＰ２４００パラメータは、一遅延フレームを使用してバッファリングすることが可能である。２５ミリ秒の離間点を予測することが可能であり、一局面では、ビット・レートは１／４に削減される。

更に別の局面では、ボコーダ及び関連した方法は、異なる音声フレーム・レートで第２のＭＥＬＰボコーダによって使用されるパラメータに応じて、入力データに対する復号化機能を行うことにより、混合励振線形予測（ＭＥＬＰ）符号化データをトランスコーディングする。サンプリングされた音声パラメータは、補間され、バッファリングされ、補間パラメータに対する符号化機能を行ってビット・レートを増加させる。補間は、２２．５ミリ秒でサンプリングされた音声パラメータで生じ得、補間パラメータのバッファリングは、約１フレームで生じ得る。ビット・レートは、４倍に増加することが可能である。

本発明に用いることが可能な通信システムの例のブロック図である。ＭＥＬＰ２４００からＭＥＬＰ６００への下方トランスコーディングに使用される基本工程を示す概略レベルのフロー図である。ＭＥＬＰ２４００からＭＥＬＰ６００への下方トランスコーディングに使用される基本工程を示す更に詳細なフロー図である。ＭＥＬＰ６００からＭＥＬＰ２４００への上方トランスコーディングに使用される基本工程を示す概略レベルのフロー図である。ＭＥＬＰ６００からＭＥＬＰ２４００への上方トランスコーディングに使用される工程の更なる詳細を示す詳細なフロー図である。信号対雑音比に対するビット・レートについての、６００ｂｐｓ波形と２４００ｂｐｓ標準との比較を示すグラフである。劣悪なＣＣＩＲの場合の、図６と同様な別のグラフである。

本発明の他の目的、特徴及び利点は、添付図面に照らして検討すると、本発明の以下の詳細な説明から明らかになるであろう。

次に、添付図面を参照して本発明を以下に更に詳細に説明する。本発明の好ましい実施例を示す。しかし、本発明は、種々の多くの形態において実施することができ、本明細書及び特許請求の範囲記載の実施例に限定されるものとして解されるべきでない。むしろ、前述の実施例は、本願の開示が詳細かつ完全であり、当業者に本発明の範囲を詳細に伝えるように記載される。同じ符号は、図を通して同じ構成要素を表す。

本発明を理解する目的での一般的な背景として、線形予測符号化（ＬＰＣ）は、低ビット・レートで音声を符号化し、計算するために、音声パラメータの正確な推定値を提供する音声解析システム及び方法である。ＬＰＣは、音声音の品質の特徴成分としてのフォルマントを推定することにより、音声信号を解析することが可能である。例えば、いくつかの共鳴帯域は、時長価値のエネルギ集中特性を求める手助けをする。前述の影響は、音声信号から除去され、残りのブンブンいう音の強度及び周波数が推定される。フォルマントの除去を逆フィルタリングと呼び、残りの信号をレジデューと呼ぶことが可能である。フォルマント及びレジデューを表す数は、記憶するか、又は別の所に伝送することが可能である。

ＬＰＣは、処理を逆にし、レジデューを使用してソース信号を生成し、フォルマントを使用して、管を表すフィルタを生成し、フィルタを介してソースを流し、それにより、音声を生成することにより、音声信号を合成することが可能である。音声信号は時間とともに変動し、処理は、通常、毎秒３０乃至５０フレームの、フレームと呼ばれる、音声信号の小部分に対して行って、好適な圧縮により、高了解度の音声を生成する。

差分方程式は、音声信号からフォルマントを求めて、線形予測器（すなわち、線形予測符号化（ＬＰＣ））を使用して、先行サンプルの線形の組合せとして信号の各サンプルを表すために使用することが可能である。予測信号と実際の信号との間の二乗平均誤差を最小にすることにより、ＬＰＣシステムが係数を推定することが可能であるように、予測係数としての、差分方程式の係数はフォルマントを特徴付けることが可能である。よって、係数値の行列の計算は、線形式の組の解で実現することが可能である。自己相関、共分散、又は再帰的格子定式化の手法を使用して、解への収束を確実にすることが可能である。

しかし、側枝を有する管には問題がある。例えば、通常母音の場合、声道は単一の管で表されるが、鼻音の場合、側岐が存在している。よって、鼻音の場合、より複雑なアルゴリズムが必要である。一部の子音は、乱流気流によって生成され、「ヒス」音を生じるが、ＬＰＣ符号化器は通常、音源が、ブンブンいう音又はヒス音であるかを決定し、周波数及び強度を決定し、復号化器が工程をもとに戻すことが可能であるように情報を符号化しなければならない。ＬＰＣ−１０ｅアルゴリズムは、１つの数を使用してブンブンいう音の周波数を表し、０という数を使用してヒス音を表す。ＬＰＣ−１０ｅに加え、通常のレジデュー信号のテーブルとしてコードブックを使用することも可能である。解析器は、レジデューを、コードブック中のエントリと比較し、近い一致を有するエントリを選び、そのエントリのコードを送出することが可能である。これは、コード励振線形予測（ＣＥＬＰ）と呼ぶことが可能である。ＬＰＣ−１０ｅアルゴリズムは、連邦政府標準１０１５に開示されており、ＣＥＬＰアルゴリズムは連邦政府標準１０１６に開示されており、これらの開示は、その内容全体を本明細書及び特許請求の範囲に援用する。

混合励振線形予測（ＭＥＬＰ）ボコーダ・アルゴリズムは、米国国防総省（ＤＯＤ）ディジタル音声処理コンソーシアム（ＤＤＶＰＣ）によって選択された２４００ｂｐｓの連邦政府技術標準の音声符号化器である。これは、ブンブンいう機械的な音がする高了解度音声を非常に低いビット・レートでボコーダが生成する、励振の夾雑（ｆｏｒｅｉｇｎ）全極性合成フィルタとして周期ポスト列又は白色雑音を使用する伝統的なピッチ励振ＬＰＣボコーダとは多少異なる。これは通常、単純なパルス列が有声音声を再生することができないことによって生じる。

ＭＥＬＰボコーダは、伝統的なＬＰＣパラメトリック・モデルに基づいた混合励振モデルを使用するが、混合励振、周期パルス、パルス分散、及びスペクトル強調という更なる特徴を含む。混合励振は、固定フィルタ・バンクに基づいた適応的フィルタリングで、周波数依存性発声強度をシミュレートして、ブンブンいう音を低減させるマルチバンド混合モデルを使用する。入力音声により、ＭＥＬＰボコーダは、周期パルス又は非周期パルスを使用して音声を合成する。パルス分散は、ピッチにより、励振エネルギを分散させる、スペクトルが平坦化された三角形パルスに基づいた固定パルス分散フィルタを使用して実現される。ＬＰＣ声道フィルタの極に基づいた適応スペクトル強調フィルタは、合成音声におけるフォーマント構造を強調することが可能である。フィルタは、合成帯域通過波形と自然帯域通過波形との間の一致を改善し、音声出力に対して、より自然な特性をもたらすことが可能である。ＭＥＬＰ符号化器は、音声品質及びベクトル量子化手法を改善してＬＰＣ及びフーリエ情報を符号化するために予測残差のフーリエ振幅符号化を使用することが可能である。

本発明の限定的でない例によれば、ボコーダは、ＭＥＬＰｅ２４００の解析を行うことなく、６００ｂｐｓの固定ビット・レートに、２４００ｂｐｓの、ＭＩＬ−ＳＴＤ−３００５に規定された米国国防総省の軍事用ボコーダの技術標準をトランスコーディングする。この処理は、ＭＥＬＰｅ６００をＭＥＬＰｅ２４００にトランスコーディングすることが可能であるように逆にすることが可能である。マルチホップ・ネットワークを使用する場合に、複数レートのビット・レート変更が必要な場合、電話システムの動作を改善することが可能である。別々のビット・レートのボコーダを縦続接続する場合の通常のアナログ・レートの変更により、音声品質はすばやく劣化し得る。本明細書及び特許請求の範囲記載の本発明は、ディジタル音声を激しく劣化させることなく、複数のレート変更（２４００−＞６００−＞２４００−＞６００−＞．．．）を可能にする。本明細書及び特許請求の範囲を通して、混乱を避けるために、末尾が「ｅ」のＭＥＬＰは、「ｅ」なしのＭＥＬＰと同義である。

ボコーダ及び関連した方法は、２４００ｂｐｓ又は６００ｂｐｓのビット・レートで動作する電話システムの音声の了解度及び品質を向上させることが可能である。ボコーダは、声道のパラメトリック混合励振線形予測モデルを使用した符号化処理を含む。結果として生じる６００ｂｐｓの音声は、同様なビット・レートでのボコーダよりも非常に高い同韻診断テスト（ＤＲＴ、音声了解度の尺度）及び診断受入可能性尺度（ＤＡＭ、音声品質の尺度）を達成する。結果として生じる６００ｂｐｓのボコーダは、非常に劣悪な信号対雑音比の下で、かつ／又は、低い送信電力状態の下で、高周波（ＨＦ）無線チャネル上の通信を可能にするセキュアな通信システムにおいて使用される。結果として生じるＭＥＬＰ６００ｂｐｓのボコーダにより、ＭＥＬＰ２４００ベースのシステムよりも、一日の間に、より頻繁に、より多くの無線リンクを介して、セキュアな音声無線トラフィックが転送されることを可能にする通信システムがもたらされる。後方互換性は、より高いレートで実行するか、又はＭＥＬＰ６００をサポートしないシステムについて、ＭＥＬＰ６００をＭＥＬＰ２４００にトランスコーディングすることにより、生じ得る。

本発明の限定的でない例によれば、ディジタル・トランスコーダは、異なるアプリケーション形式又はビット・レート間の符号化又は復号化の処理としてのトランスコーディングを使用して、ＭＥＬＰｅ２４００及びＭＥＬＰｅ６００において動作する。これは、ボコーダの縦続接続とはみなされない。本発明の限定的でない一例によれば、ボコーダ及び関連した方法は、レートの４倍への増加又はレートの４分の１への減少により、ＭＥＬＰ２４００データ形式及びＭＥＬＰ６００データ形式間で、リアルタイムで変換する。トランスコーダは、符号化ビットストリームを使用することが可能である。処理は、最初のレート変更後に、複数のレート変更が、音声品質をすばやく低下させない場合にのみ、当初のレート変更の間、非可逆である。これは、ＭＥＬＰｅ２４００のみに対応するシステムが、高周波（ＨＦ）ＨＦＭＥＬＰｅ６００に対応するシステムとともに動作することを可能にする。

上記ボコーダ及び方法は、ＲＦ６０１０マルチホップＨＦ−ＶＨＦリンク音声品質を向上させる。これは、上方／下方変換（レート変更）の数にかかわらず、リンク毎に一度実行されるボコーダ解析及び合成を備えた完全なディジタル・システムを使用することが可能である。音声歪みは最初のレート変更に最小化することが可能であり、音声歪みにおける最小の増加は、レート変更の数により、生じ得る。ネットワーク負荷は、６４Ｋから２．４Ｋに減少し、ネットワークを介して圧縮音声を使用することが可能である。Ｆ２−Ｈは、トラスコーディングＳＷを必要とし、トランスコーディング中に、オーディオ遅延における、２５ｍｓの増加を必要とする。

システムは、Ｆ２−Ｈ及びＦ２−Ｆ／Ｆ２−Ｖの無線のディジタル−ＶＨＦ−ＨＦのセキュアな音声再伝送を有し得、米国国防総省ＭＥＬＰｅベースのＶＯＩＰシステムへの、ＭＥＬＰｅ６００の動作を可能にする。システムは、ＭＥＬＰｅ６００ボコーダ（ハリス社（本社：フロリダ州メルボルン））によって製造されたものなど）との互換性を米国国防総省／ＮＡＴＯＭＥＬＰ２４００に与え得る。例証の目的で、ＲＦ６０１０の音声の例を下に示す。

ＡＮＡＬＯＧ − トランスコーディングなし（４つの無線回路）
− ＣＶＳＤ−＞ＣＶＳＤ−＞ｕｌａｗ−＞ＲＦ６０１０−＞ｕｌａｗ−＞Ｍ６−＞Ｍ６
−＞Ｍ６−＞Ｍ６−＞ｕｌａｗ−＞ＲＦ６０１０−＞ＣＶＳＤ−＞ＣＶＳＤ
ＤＩＧＩＴＡＬ − トランスコーディングあり（４つの無線回路）
−＞Ｍ２４−＞バイパス−＞ＲＦ６０１０−＞Ｍ２４から６−＞Ｍ６
−＞Ｍ６−＞Ｍ６から２４−＞ＲＦ６０１０−＞バイパス−＞Ｍ２４
バイパス−＞データ・バイパスにおけるボコーダ。ディジタル・システムではｕｌａｗは使用されない。

ボコーダ及び関連した方法は、ＭＩＬ−ＳＴＤ／ＮＡＴＯＭＥＬＰｅ２４００ボコーダとの間でデータを送受信するために、ＭＥＬＰ６００のボコーダの改良されたアルゴリズムを使用する。改良されたＲＦ６０１０システムは、トランスコーディング基本システムＭＥＬＰ解析を使用して、より好適な音声品質を可能にし得、合成は、マルチホップ・ネットワークを介して一度のみ、行われる。

本発明の限定的でない一例によれば、２４００から６００に下方トランスコーディングし、入力データをＭＥＬＰ２４００パラメータにトランスコーディングすることが可能である。バッファ・パラメータには、一フレーム遅延があり、システム及び方法は、量子化により、パラメータの時間補間を行って２５ｍｓの「離間点」を予測することが可能である。よって、４のブロックにより、補間データに対してＭＥＬＰ６００の解析を行うことが可能である。これは、１／４への削減をもたらし、ＭＥＬＰ２４００データが受信され、ＭＥＬＰ６００のデータがシステムから送信されるようにＭＥＬＰ６００のボコーダと互換であるビット・レートをもたらす。

６００から２４００に上方トランスコーディングし、入力データに対するＭＥＬＰｅ６００合成を行うことも可能である。ボコーダは、一フレームにおいて、２２．５ｍｓでサンプリングされた音声パラメータ、及びバッファ補間されたパラメータを補間する。ＭＥＬＰ２４００の解析は、補間パラメータに対して行うことが可能である。これにより、ビット・レートは４倍に増加する。これは、ＭＥＬＰ６００データを受信し、ＭＥＬＰ２４００データを送信することを可能にするためにＭＩＬ−ＳＴＤ／ＮＡＴＯＭＥＬＰ２４００と互換である。

本発明の限定的でない局面によるボコーダ及び関連した方法は、音声フレーム・レートが異なるボコーダ間でビット・レートをトランスコーディングすることが可能である。解析ウィンドウは、異なるサイズであり得、レート変更間にロックしなくてよい。フレーム・レートが変更されても、初期レート変更後、更なる歪みは生じない。アルゴリズムは、ＲＦ６０１０のクロスネット・リンク上で、より良好な品質のディジタル音声を有することが可能である。ＡＮ／ＰＲＣ−１１７Ｆは、ＭＥＬＰｅ６００をサポートしないが、このアルゴリズムを使用して、ＲＦ６０１０システムを使用して無線で、ＭＥＬＰｅ６００を実行するＡＮ／ＰＲＣ−１５０Ｃと通信する。ＡＮ／ＰＲＣ−１５０Ｃはトランスコーディングを実行し、ＡＮ／ＰＲＣ−１５ＯＣは、本発明の限定的でない一局面によるアルゴリズムを使用して送信トランスコーディング及び受信トランスコーディングを行うことができる。

次に、本発明とともに使用することが可能な通信システムの例を、図１に関して説明する。

前述のシステム及び方法とともに使用することが可能な無線機の例には、ハリス社（本社：フロリダ州メルボルン）が製造・販売するファルコン（商標）ＩＩＩ無線機がある。
相対的に標準的なプロセッサ及びハードウェア構成部分で通常、実現することが可能なソフトウェア定義無線機を含む種々の無線機を使用することが可能である。１つの特定のクラスのソフトウェア無線機には、相対的に標準的な無線機及び処理ハードウェア、並びに、無線機が使用する通信波形を実現するために適切な波形ソフトウェアモジュールを含むジョイント・タクティカル無線機（ＪＴＲ）がある。ＪＴＲ無線機は、ソフトウェア通信アーキテクチャ（ＳＣＡ）技術標準（ｗｗｗ．ｉｔｒｓ．ｓａａｌｔ．ｍｉｌ。その内容全体を本明細書及び特許請求の範囲に援用する）に準拠したオペレーティング・システム・ソフトウェアも使用する。ＳＣＡは、種々の製造業者及び開発業者がそれぞれの構成部分を単一の装置に容易に一体化することが可能であるようにハードウェア構成部分及びソフトウェア構成部分がどのようにして相互作用するかを規定する開放型アーキテクチャ・フレームワークである。

ジョイント・タクティカル無線機システム（ＪＴＲＳ）ソフトウェア構成部分アーキテクチャ（ＳＣＡ）は、ソフトウェア定義無線機（ＳＤＲ）を実現するために、共通オブジェクト・リクエスト・ブローカ・アーキテクチャ（ＣＯＲＢＡ）に、多くの場合、基づいたインタフェース及びプロトコルの組を定義する。部分的には、ＪＴＲＳ及びそのＳＣＡは、ソフトウェアによって再プログラム可能な無線機のファミリーに使用される。そういうものとして、ＳＣＡは、ソフトウェア再プログラム可能なディジタル無線機を実現するための特定の規則、手法及び開発基準の組である。

ＪＴＲＳＳＣＡ技術仕様は、ＪＴＲＳジョイント・プログラム・オフィス（ＪＰＯ）によって公表されている。ＪＴＲＳＳＣＡは、種々のＪＴＲＳＳＣＡ実現形態間でアプリケーション・ソフトウェアを移植することを可能にし、商用の技術標準を活用して開発費用を削減し、設計モジュールを再使用することができることにより、新たな波形の開発期間を削減し、進展する商用のフレームワーク及びアーキテクチャに基礎をおくよう構成されている。

ＪＴＲＳＳＣＡは、実現形態と無関係であることが意図されているのでシステム技術仕様でないが、所望のＪＴＲＳの目的を達成するようシステムの設計を制約する規則の組である。ＪＴＲＳＳＣＡのソフトウェア・フレームワークは、オペレーティング環境（ＯＥ）を定義し、その環境からアプリケーションが使用するサービス及びインタフェースを規定する。ＳＣＡＯＥは、関連したボード・サポート・パッケージとのポータブル・システム・インタフェース（ＰＯＳＩＸ）に基づいたオペレーティング・システム（ＯＳ）、コア・フレームワーク（ＣＦ）及びＣＯＲＢＡミドルウェアを含む。ＪＴＲＳＳＣＡは、アプリケーション・ソフトウェア構成部分間のアプリケーション・プログラム・インタフェース（ＡＰＩ）を定義するためのビルディング・ブロック構造（ＡＰＩＳｕｐｐｌｅｍｅｎｔにおいて定義されている）も提供する。

ＪＴＲＳＳＣＡコア・フレームワーク（ＣＦ）は、組み込み型の分散計算機通信システムにおけるソフトウェア・アプリケーション構成部分の展開、管理、相互接続及び相互通信を可能にする重要な、「コア」の組のオープン・ソフトウェア・インタフェース及びプロファイルを定義するアーキテクチャ概念である。インタフェースは、ＪＴＲＳＳＣＡ技術仕様において定義され得る。しかし、開発業者はその一部を実現することができ、一部は非コア・アプリケーション（すなわち、波形等）によって実現することができ、一部は、ハードウェア装置提供者によって実現することができる。

説明の目的のみで、本発明の恩恵を受ける通信システムの例の簡単な説明を、図１に示す、限定的でない例に関して説明する。通信システム５０のこの概要レベルのブロック図は、本発明に使用するために修正することが可能な無線メッセージ端末、及び基地局部分５２を含む。基地局部分５２は、ＶＨＦネット６４又はＨＦネット６６（それぞれは、それぞれのＶＨＦ無線機６８及びＨＦ無線機７０をいくつか含み、無線機６８、７０に接続されたパソコン・ワークステーション７２を含む）に無線リンクを介して音声又はデータを通信し、送信する。アドホック通信ネットワーク７３は、例証する種々の構成部分と相互運用する。よって、ＨＦネットワーク又はＶＨＦネットワークは、インフラがなく、アドホック通信ネットワークとして動作するＨＦネット部分及びＶＨＦネット部分を含む。ＵＨＦ無線機及びネット部分は図示していないが、これらを含めることが可能である。

ＨＦ無線機は、復調器回路６２ａ及び適切な畳込符号化器回路６２ｂと、ブロック・インタリーブ器６２ｃと、データ・ランダム化器回路６２ｄと、データ及びフレーミング回路６２ｅと、変調回路６２ｆと、マッチド・フィルタ回路６２ｇと、適切なクランピング装置を備えたブロック又はシンボル等化器回路６２ｈと、デインタリーバ及び復号化器回路６２ｉと、モデム６２ｊと、電力適合化回路６２ｋとを限定的でない例として含み得る。ボコーダ回路６２１は、記載された種々の回路の組合せ、又は別個の回路であり得る変換装置、並びに、復号化機能及び符号化機能を組み入れることが可能である。前述及び他の回路は、本発明に必要な機能、及び、当業者が考え出す他の機能を行うよう動作する。例証された他の無線機（ＶＨＦ移動体無線機、及び送信局及び受信局を含む）は同様な機能別回路を有し得る。

基地局部分５２は、ＰＡＢＸ８２に接続する公衆交換電話網（ＰＳＴＮ）８０への地上通信線接続を含む。衛星地上局などの衛星インタフェース８４はＰＡＢＸ８２に接続し、ＰＡＢＸ８２は、無線ゲートウェイ８６ａ、８６ｂを形成するプロセッサに接続する。これらは、ＶＨＦ無線機６０又はＨＦ無線機６２それぞれに相互接続する。プロセッサはローカル・エリア・ネットワークを介してＰＡＢＸ８２及び電子メール・クライアント９０に接続される。無線機は、適切な信号生成器及び変調器を含む。

イーサネット（登録商標）／ＴＣＰ−ＩＰローカル・エリア・ネットワークは「無線」電子メール・サーバとして動作することが可能である。電子メール・メッセージは、無線リンク及びローカル・エア・ネットワークを介して、第２世代プロトコル／波形としてのＳＴＡＮＡＧ−５０６６（この開示はその全体を本明細書及び特許請求の範囲に援用する）を用いて、かつ、当然、好ましくは、第３世代の相互運用性標準によって送出することが可能である。相互運用性標準（ＦＥＤ−ＳＴＤ−１０５２。この開示はその全体を本明細書及び特許請求の範囲に援用する）は、レガシー無線装置に用いることが可能である。本発明において使用することが可能な機器の例には、ハリス社（本社：フロリダ州メルボルン）によって製造された種々の無線ゲートウェイ及び無線機がある。前述の機器は、限定的でない例として、ＲＦ５８００、５０２２、７２１０、５７１０、５２８５、並びに、ＰＲＣ１１７及び１３８シリーズの機器及び装置を含み得る。

前述のシステムは、ＲＦ−５７１０Ａ高周波（ＨＦ）モデムにより、かつ、ＳＴＡＮＡＧ４５３９（この開示は、その内容全体を本明細書及び特許請求の範囲に援用する）として知られているＮＡＴＯ標準によって動作可能である。これにより、最大９６００ｂｐｓのレートでの、長距離ＨＦ無線回路の伝送を可能にする。モデム技術に加えて、前述のシステムは、高ストレス・タクティカル・チャネル（ＳＴＡＮＡＧ４５３８やＳＴＡＮＡＧ５０６６など。この開示はその全体を本明細書及び特許請求の範囲に援用する）のために設計され、改良されたデータリンク・プロトコル・スイートを使用する無線電子メール製品を使用することが可能である。無線機をＩＳＢモードにセットし、ＨＦモデムを固定データ・レートにセットして、最高１９２００ｂｐｓの固定の非適応的データ・レートを使用することも可能である。符号合成法及びＡＲＱを使用することも可能である。

図２は、ＭＥＬＰ２４００からＭＥＬＰ６００に下方トランスコーディングするための基本的な細部、及び復号化として、２４００パラメータなどのＭＥＬＰパラメータに入力データを変換する基本工程を示す参照符号の１００シリーズで始まる概要レベルのフロー図である。工程１０２に示すように、一フレームの遅延などを伴ってバッファリングされる。ＭＥＬＰパラメータの時間補間が、ブロック１０４に示す量子化によって行われる。ビット・レートが削減され、補間データに対して符号化が行われる（ブロック１０６）。この工程では、符号化は、本発明の出願人に譲渡された米国特許第６９１７９１４号明細書記載のものなどのＭＥＬＰ６００符号化アルゴリズム（この開示はその全体を本明細書及び特許請求の範囲に援用する）を使用して実現することが可能である。

図３は、本発明の限定的でない例による、ＭＥＬＰ２４００からＭＥＬＰ６００への下方トランスコーディングの更なる詳細を示す。

図３に表す工程に示すように、対抗手段に電子的に対抗する手段（ＥＣＣＯＭ）により、ＭＥＬＰ２４００チャネル・パラメータが復号化される（ブロック１１０）。線スペクトル周波数（ＬＳＦ）から予測係数が生成される（ブロック１１２）。知覚逆電力スペクトル重みが生成される（ブロック１１４）。現在のＭＥＬＰ２４００パラメータが指し示される（ブロック１１６）。フレーム数が２以上の場合（ブロック１１８）、補間値の更新が行われる（ブロック１２０）。新たなパラメータの補間は、ピッチ、線スペクトル周波数、利得、ジッタ、帯域通過音声、無声並びに有声のデータ及び重みを含む（ブロック１２２）。ブロック１１８の工程で回答がいいえの場合、ブロック１２０及び１２２の工程を飛ばす。フレーム数が求められ（ブロック１２４）、ＭＥＬＰ６００符号化処理が行われる（ブロック１２６）。好ましくは、上記「９１４特許」において開示されたものなどのＭＥＬＰ６００のアルゴリズムが使用される。先行入力パラメータが保存され（ブロック１２８）、状態が進められ（ブロック１３０）、リターンが行われる（ブロック１３２）。

図４は、ＭＥＬＰ６００からＭＥＬＰ２４００への上方トランスコーディングを示し、基本的な概要レベルの機能を示す概要レベルのフロー図である。ブロック１５０に示すように、入力データは、内容を本明細書及び特許請求の範囲に援用する「９１４特許」に開示された処理などのＭＥＬＰボコーダのパラメータを使用して復号化される。ブロック１５２では、サンプリングされた音声パラメータは補間され、補間されたパラメータは、ブロック１５４に示すようにバッファリングされる。ビット・レートを、ブロック１５６に示すように、補間パラメータに対する符号化によって増加させる。

ＭＥＬＰ６００からＭＥＬＰ２４００への上方トランスコーディングの更なる詳細は、限定的でない例として図５に示す。

ＭＥＬＰｅ６００の復号化機能は、「９１４特許」に開示された処理などのデータに対して行われる（ブロック１７０）。現在のフレーム復号化パラメータが指し示され（ブロック１７２）、２２．５ミリ秒のフレームの数がこの反復について求められる（ブロック１７４）。

このフレームの補間値が得られ（ブロック１７６）、新たなパラメータが補間される（ブロック１７８）。最小線連続周波数（ＬＳＦ）は最小値に強いられ（ブロック１８０）、ＭＥＬＰ２４００の符号化が行われる（ブロック１８２）。符号化ＥＣＣＭＭＥＬＰ２４００ビットストリームが書き込まれ（ブロック１８４）、フレーム・カウントが更新される（ブロック１８６）。この反復において、より多くの２２．５ミリ秒のフレームが存在している場合（ブロック１８８）、処理はもう一度、ブロック１７６で始まる。否定の場合、比較が行われ（ブロック１９０）、２５ミリ秒のフレームのカウンタが更新される（ブロック１９２）。リターンが行われる（ブロック１９４）。

前述のアルゴリズムの擬似コードの例を以下に記載する。

ＳＩＧ＿ＬＥＮＧＴＨ＝３２７
ＢＵＦＳＩＺＥ２４＝７
Ｘ０２５＿Ｑ１５＝８１９２
ＬＰＣ＿ＯＲＤ＝１０
ＮＵＭ＿ＧＡＩＮＦＲ＝２
ＮＵＭ＿ＢＡＮＤＳ＝５
ＮＵＭ＿ＨＡＲＭ＝１０
ＢＷＭＩＮ＿Ｑ１５＝５０．０

／／ｍｅｌｐ＿ｐａｒａｍｆｏｒｍａｔ
／／ｓｔｒｕｃｔｕｒｅｍｅｌｐ＿ｐａｒａｍ｛／^＊ＭＥＬＰｐａｒａｍｅｔｅｒｓ ^＊／
／／ｖａｒｐｉｔｃｈ；
／／ｖａｒｌｓｆ［ＬＰＣ＿ＯＲＤ］；
／／ｖａｒｇａｉｎ［ＮＵＭ＿ＧＡＩＮＦＲ］；
／／ｖａｒｊｉｔｔｅｒ；
／／ｖａｒｂｐｖｃ［ＮＵＭ＿ＢＡＮＤＳ］；
／／ｖａｒｕｖ＿ｆｌａｇ；
／／ｖａｒｆｓ＿ｍａｇ［ＮＵＭ＿ＨＡＲＭ］；
／／ｖａｒｗｅｉｇｈｔｓ［ＬＰＣ＿ＯＲＤ］；
／／｝；

ｓｔｒｕｃｔｕｒｅｍｅｌｐ＿ｐａｒａｍｃｕｒ＿ｐａｒ，ｐｒｅｖ＿ｐａｒ
ｖａｒｔｏｐ＿ｌｐｃ［ＬＰＣ＿ＯＲＤ］

ｖａｒｉｎｔｅｒｐ６００＿ｄｏｗｎ［１０］［２］＝
｛／／ｐｒｅｖ，ｃｕｒ
｛０．００００，１．００００｝，
｛０．００００，０．００００｝，
｛０．８８８８，０．１１１１），
｛０．７７７７，０．２２２２｝，
｛０．６６６６，０．３３３３｝，
｛０．５５５５，０．４４４４｝，
｛０．４４４４，０．５５５５｝，
｛０．３３３３，０．６６６６｝，
｛０．２２２２，０．７７７７｝，
｛０．１１１１，０．８８８８｝
｝

ｖａｒｉｎｔｅｒｐ６００＿ｕｐ［１０］［２］＝
｛／／ｐｒｅｖ，ｃｕｒ
｛０．１０００，０．９０００｝，
｛０．２０００，０．８０００｝，
｛０．３０００，０．７０００｝，
｛０．４０００，０．６０００｝，
｛０．５０００，０．５０００｝，
｛０．６０００，０．４０００｝，
｛０．７０００，０．３０００｝，
｛０．８０００，０．２０００｝，
｛０．９０００，０．１０００｝，
｛０．００００，１．００００｝
｝

／＊ｃｏｎｖｅｒｔＭＥＬＰｅ２４００ｅｎｃｏｄｅｄｄａｔａｔｏＭＥＬＰｅ６００ｅｎｃｏｄｅｄｄａｔａ＊／ｆｕｎｃｔｉｏｎｔｒａｎｓｃｏｄｅ６００＿ｄｏｗｎ（）
｛ｖａｒｎｕｍｆｒａｍｅｓ＝０
ｖａｒｌｓｐ［１０］
ｖａｒｌｐｃ［ｌｌ］
ｖａｒｉ，ａｌｐｈａ＿ｃｕｒ，ａｌｐｈａ＿ｐｒｅｖ，ｎｕｍＢｉｔｓ

１．ＭＥＬＰｅ２４００符号化データを読み出し、復号化する

ｍｅｌｐ＿ｃｈｎ＿ｒｅａｄ（＆ｑｕａｎｔ＿ｐａｒ，＆ｍｅｌｐ＿ｐａｒ［０］，＆ｐｒｅｖ＿ｐａｒ，＆ｃｈｂｕｆ［０］）

２．復号化パラメータから知覚逆電力スペクトル重みを生成する

ｌｓｐ［ｉ］＝ｍｅｌｐ＿ｐａｒ−＞ｌｓｆ［ｉ］ｉ＝０，．．，９
ｌｐｃ＿ｌｓｐ２ｐｒｅｄ（ｌｓｐ，ｌｐｃ，ＬＰＣ＿ＯＲＤ）
ｖｑ＿ｌｓｐｗ（＆ｍｅｌｐ＿ｐａｒ−＞ｗｅｉｇｈｔｓ［Ｏ］，ｌｓｐ，ｌｐｃ，ＬＰＣ＿ＯＲＤ）

３．現行フレーム・パラメータを指し示す

ｃｕｒ＿ｐａｒ＝ｍｅｌｐ＿ｐａｒ［０］

４．ｉｆｎｕｍｆｒａｍｅｓ＜２ｇｏｔｏｓｔｅｐ７
ｉｆ（ｎｕｍ＿ｆｒａｍｅｓ＜２）ｇｏｔｏｓｔｅｐ７

５．この反復の補間値を得る

ａｌｐｈａｃｕｒ＝ｉｎｔｅｒｐ６００＿ｄｏｗｎ［ｎｕｍ＿ｆｒａｍｅｓ］［ｌ］
ａｌｐｈａ＿ｐｒｅｖ＝ｉｎｔｅｒｐ６００＿ｄｏｗｎ［ｎｕｍ＿ｆｒａｍｅｓ］［０］

６．ＭＥＬＰｅ音声パラメータを補間する

ｍｅｌｐ＿ｐａｒ−＞ｐｉｔｃｈ＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｐｉｔｃｈ
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｐｉｔｃｈ
ｍｅｌｐ＿ｐａｒ−＞ｌｓｆ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｌｓｆ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｌｓｆ［ｉ］ｉ＝０，．．，９
ｍｅｌｐ＿ｐａｒ−＞ｇａｉｎ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｇａｉｎ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｇａｉｎ［ｉ］ｉ＝０，．．，ｌ
ｍｅｌｐ＿ｐａｒ−＞ｊｉｔｔｅｒ＝０

ｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｂｐｖｃ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｂｐｖｃ［ｉ］ｉ＝０，．．，４

ｉｆ（ｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＞＝８１９２）ｔｈｅｎｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝１６３８４ｉ＝０，．．，４
ｅｌｓｅｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝０

ｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｕｖ＿
ｆｌａｇ
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｕｖ＿ｆｌａｇ

ｉｆ（ｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＞＝１６３８４）ｔｈｅｎｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝１
ｅｌｓｅｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝０

ｍｅｌｐ＿ｐａｒ−＞ｆｓ＿ｍａｇ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｆｓ＿ｍａｇ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｆｓ＿ｍａｇ［ｉ］ｉ＝０，．．，９

ｍｅｌｐ＿ｐａｒ−＞ｗｅｉｇｈｔｓ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｗｅｉｇｈｔｓ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｗｅｉｇｈｔｓ［ｉ］ｉ＝０，．．，９

７．ｎｕｍ＿ｆｒａｍｅｓ＜＞１の場合、Ｍｅｌｐ６００をコールし、符号化ビット・カウントｎｕｍＢｉｔｓを戻す

ｉｆ（ｎｕｍ＿ｆｒａｍｅｓ＜＞１）ｔｈｅｎｎｕｍＢｉｔｓ＝Ｍｅｌｐ６００Ｅｎｃｏｄｅ（）
ｅｌｓｅｎｕｍＢｉｔｓ＝０

８．次回使用するために現行パラメータを保存する

ｐｒｅｖ＿ｐａｒ＝ｃｕｒ＿ｐａｒ

９．ｎｕｍ＿ｆｒａｍｅｓを更新する

ｎｕｍ＿ｆｒａｍｅｓ＝ｎｕｍ＿ｆｒａｍｅ＋１
ｉｆ（ｎｕｍ＿ｆｒａｍｅｓ＝＝１０）ｔｈｅｎｎｕｍ＿ｆｒａｍｅｓ＝０

１０．符号化ＭＥＬＰｅ６００の数を戻す。このブロックはｎｕｍＢｉｔｓを戻す

１１．次の入力ブロックを処理する

ｆｕｎｃｔｉｏｎｔｒａｎｓｃｏｄｅ６００＿ｕｐ（）
｛
ｖａｒｆｒａｍｅ，ｉ，ｆｒａｍｅ＿ｃｎｔ
ｖａｒｌｐｃ［ＬＰＣ＿ＯＲＤ＋１］，ｗｅｉｇｈｔｓ［ＬＰＣ＿ＯＲＤ］
ｖａｒｌｓｐ［１０］
ｖａｒｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ＝０，ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ＝０
ｖａｒＦｒａｍｅ２２Ｐ５ＭＳＣｏｕｎｔ［９］＝｛ｌ，ｌ，ｌ，ｌ，ｌ，ｌ，ｌ，ｌ，２｝
ｖａｒａｌｐｈａ＿ｃｕｒ，ａｌｐｈａ＿ｐｒｅｖ

１．ＭＥＬＰｅ６００符号化パラメータを復号化する

Ｍｅｌｐ６００Ｄｅｃｏｄｅ（）

２．このフレームのＭＥＬＰｅ６００音声パラメータを指し示す

ｃｕｒ＿ｐａｒ＝ｍｅｌｐ＿ｐａｒ［０］

３．処理する対象のこの反復フレーム数を得る

ｆｒａｍｅ＿ｃｎｔ＝Ｆｒａｍｅ２２Ｐ５ＭＳＣｏｕｎｔ［ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ］
ｆｒａｍｅ＝０

４．このフレーム補間値を得る

ａｌｐｈａ＿ｃｕｒ＝ｉｎｔｅｒｐ６００＿ｕｐ［ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ］［ｌ］
ａｌｐｈａ＿ｐｒｅｖ＝ｉｎｔｅｒｐ６ＯＯ＿ｕｐ［ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ］［０］

５．（Ｍｅｌｐ６００復号化から）新たなＭＥＬＰｅ音声パラメータを補間する

ｍｅｌｐ＿ｐａｒ−＞ｐｉｔｃｈ＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｐｉｔｃｈ
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｐｉｔｃｈ

ｍｅｌｐ＿ｐａｒ−＞ｌｓｆ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｌｓｆ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｌｓｆ［ｉ］ｉ＝０，．．，９

ｍｅｌｐ＿ｐａｒ−＞ｇａｉｎ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｇａｉｎ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｇａｉｎ［ｉ］ｉ＝０，．．，ｌ

ｍｅｌｐ＿ｐａｒ−＞ｊｉｔｔｅｒ＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｊｉｔｔｅｒ
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｊｉｔｔｅｒ

ｉｆ（ｍｅｌｐ＿ｐａｒ−＞ｊｉｔｔｅｒ＞＝４０９６）ｔｈｅｎｍｅｌｐ＿ｐａｒ−＞ｊｉｔｔｅｒ＝８１９２
ｅｌｓｅｍｅｌｐ＿ｐａｒ−＞ｊｉｔｔｅｒ＝０

ｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｂｐｖｃ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｂｐｖｃ［ｉ］ｉ＝０，．．，４

ｉｆ（ｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＞＝８１９２）ｔｈｅｎｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝１６３８４ｉ＝０，．．，４
ｅｌｓｅｍｅｌｐ＿ｐａｒ−＞ｂｐｖｃ［ｉ］＝０

ｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｕｖ＿ｆｌａｇ
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｕｖ＿ｆｌａｇ

ｉｆ（ｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＞＝１６３８４）ｔｈｅｎｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝１
ｅｌｓｅｍｅｌｐ＿ｐａｒ−＞ｕｖ＿ｆｌａｇ＝０

ｍｅｌｐ＿ｐａｒ−＞ｆｓ＿ｍａｇ［ｉ］＝ａｌｐｈａ＿ｃｕｒ^＊ｃｕｒ＿ｐａｒ．ｆｓ＿ｍａｇ［ｉ］
＋ａｌｐｈａ＿ｐｒｅｖ^＊ｐｒｅｖ＿ｐａｒ．ｆｓ＿ｍａｇ［ｉ］ｉ＝０，．．，９

６．新たな補間ＬＳＦの最小帯域幅を制限する

ｌｐｃ＿ｃｌａｍｐ（ｍｅｌｐ＿ｐａｒ−＞ｌｓｆ，ＢＷＭＩＮ＿Ｑ１５，ＬＰＣ＿ＯＲＤ）

７．新たなＬＳＦを使用して、新たな知覚逆電力スペクトル重みを生成する

ｌｓｐ［ｉ］＝ｍｅｌｐ＿ｐａｒ−＞ｌｓｆ［ｉ］ｉ＝０，．．，９
Ｉｐｃ＿ｌｓｐ２ｐｒｅｄ（ｌｓｐ，ｌｐｃ，ＬＰＣＯＲＤ）
ｖｑ＿ｌｓｐｗ（ｗｅｉｇｈｔｓ，ｌｓｐ，ｌｐｃ，ＬＰＣ＿ＯＲＤ）

８．解析を行うことなく、新たなＭＥＬＰｅ音声パラメータを符号化する

ｍｅｌｐ２４００＿ｅｎｃｏｄｅ（）

１０．符号化ＭＥＬＰｅ２４００ビットストリームを書き込む

ｍｅｌｐ＿ｃｈｎ＿ｗｒｉｔｅ（＆ｑｕａｎｔ＿ｐａｒ，＆ｃｈｂｕｆ［ｆｒａｍｅ＊ＢＵＦＳＩＺＥ２４］）

１１．２２．５ｍｓフレーム・カウンタを更新する

ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ＝ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ＋１
ｉｆ（ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ＝＝１０）ｎｕｍ＿ｆｒａｍｅｓ２２Ｐ５ｍｓ＝０

１２．フレームを１増やす

ｆｒａｍｅ＝ｆｒａｍｅ＋１

１３．ｆｒａｍｅ＜＞ｆｒａｍｅ＿ｃｎｔの場合、ステップ４に進む

Ｉｆｆｒａｍｅ＜＞ｆｒａｍｅ＿ｃｎｔｔｈｅｎｇｏｔｏｓｔｅｐ４

１４．先行する反復からの現行パラメータを保存する

ｐｒｅｖ＿ｐａｒ＝ｃｕｒ＿ｐａｒ

１５．２５ｍｓのフレーム・カウンタを更新する

ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ＝ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ＋１
ｉｆ（ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ＝＝９）ｎｕｍ＿ｆｒａｍｅｓ２５ｍｓ＝０

１６．このフレームのＭＥＬＰ２４００ビットの正しい数を戻す

ｉｆ（ｆｒａｍｅ＿ｃｎｔ＝＝２）ｔｈｅｎｒｅｔｕｒｎ（１０８）
ｅｌｓｅｒｅｔｕｒｎ（５４）

１７．次の入力ブロックを処理する

ＭＥＬＰ２４００ボコーダは、音声品質及びベクトル量子化手法を向上させてＬＰＣフーリエ情報を符号化するために予測残差のフーリエ振幅符号化を使用することが可能である。ＭＥＬＰ２４００ボコーダは、２２．５ミリ秒のフレーム・サイズ及び８ｋＨｚのサンプリング・レートを含み得る。解析器は、約６０Ｈｚのカットオフ周波数及び約３０ｄＢの阻止域減衰量を有する４次チェビシェフ・タイプＩＩフィルタなどの高域通過フィルタを有し得る。バターワース・フィルタは、帯域通過音声解析に使用することが可能である。解析器は、ハミング符号による誤り保護及び線形予測解析を含み得る。合成器は、フィルタリング・パルス及び雑音励振の和による混合励振生成を使用することが可能である。雑音、及び長さが一ピッチ周期の逆離散フーリエ変換を使用することが可能であり、一様な乱数の生成器を使用することが可能である。パルス・フィルタは、有声周波数帯域の帯域通過フィルタ係数の和を有し得、雑音フィルタは、無声周波数帯域の帯域通過フィルタ係数の和を有し得る。適応スペクトル強調フィルタを使用することが可能である。直接表現型フィルタ及びパルス分散による線形予測合成も存在し得る。

次に、ＭＥＬＰパラメータの継承（ｉｎｈｅｒｉｔ）フレーム間冗長度を利用することが可能な６００ｂｐｓＭＥＬＰボコーダ・アルゴリズムを説明する。これは、本発明の、限定的でない例による前述のアルゴリズムとともに使用することが可能である。ＭＩＬ−ＳＴＤ−１８８−１１０Ｂ波形でボコーダを使用する場合の通常のＨＦチャネル上の信号対雑音比（ＳＮＲ）に関する診断受入可能性尺度（ＤＡＭ）及び同韻診断テスト（ＤＴＲ）における利点を示すデータの一部を提示する。このタイプのボコーダを、本発明のシステム及び方法に使用することが可能である。

６００ｂｐｓシステムは、通常のＭＥＬＰボコーダのフロントエンド、ＭＥＬＰパラメータの複数のフレームを蓄積するブロック・バッファ、及びＭＥＬＰパラメータの個別ブロック・ベクトル量子化器を使用する。ＭＥＬＰの低レート実現形態は、２５ｍｓフレーム長、及びブロック持続時間が１００ｍｓの、４フレームのブロック・バッファを使用する。これにより、持続時間が１００ｍｓのブロック毎に合計６０ビット（すなわち、毎秒６００ビット）がもたらされる。符号化される通常のＭＥＬＰパラメータの例を表１に示す。

個々のパラメータ符号化手法の詳細を以下に示し、続いて、本発明の、限定的でない一例におけるＭＥＬＰ６００ｂｐｓボコーダに対する、ベクトル量子化された６００ｂｐｓのＬＰＣ１０ｅベースのボコーダのビットエラー性能の比較を示す。別々のいくつかの条件下でのＭＥＬＰ２４００及びＭＥＬＰ６００の同韻診断テスト（ＤＲＴ）及び診断受入可能性尺度（ＤＡＭ）からの結果を説明し、同様な条件下でのＬＰＣ１０ｅベースのシステムの結果と比較する。ＤＲＴ及びＤＡＭの結果は、ハリス社及び国家安全保障局（ＮＳＡ）によって行われるテストを表す。

ＬＰＣ音声モデルというものが存在している。ＬＰＣ１０ｅが普及しているが、これは、了解度情報の大半を維持するからであり、パラメータが、声道の人間の音声生成に密接に関係し得るからである。ＬＰＣ１０ｅは、周波数領域ではなく時間領域において音声スペクトルを表すよう規定することが可能である。ＬＰＣ１０ｅ解析処理又は送信側は、先行音声サンプルの線形の組合せとして人間の声道フィルタをモデル化した予測子係数を生成する。前述の予測子係数は、反射係数に変換して、量子化、補間、並びに、安定度の評価及び補正の向上を可能にすることができる。ＬＰＣ１０ｅからの合成出力音声は、有声音声部分について、推定されたピッチ・レートで反復される予め準備された（ｃａｎｎｅｄ）声帯パルス、又は、無声音を表すランダム・ノイズとの畳込を有する前述の予測子係数の利得スケーリングされた畳込であり得る。

ＬＰＣ１０ｅ音声モデルは、２つの半フレーム・ボイシング決定、現在の２２．５ｍｓのフレーム・ピッチ・レートの推定、フレームのＲＭＳエネルギ、及び、１０次予測フィルタによって表す短時間スペクトルを使用している。フレームのより重要なビットの小部分は単純なハミング符号とともに符号化して、一定の度合いの、ビット誤りに対する耐性を可能にすることができる。無声フレームの間、より多くのビットが空き状態であり、より多くのフレームをチャネル誤りから保護するために使用される。

ＬＰＣ１０ｅモデルは、高い度合いの了解度をもたらす。しかし、音声は、非常に人工的な音のように聞こえ得、多くの場合、ブンブンいう音を含み得る。より低いレートへのこのモデルのベクトル量子化はなお、人工的な音のように聞こえる同じ音声を含む。合成音声は通常、レートが低減されるにつれ、劣化するに過ぎない。ＭＥＬＰ音声モデルに基づいたボコーダは、ＬＰＣ１０ｅに基づいたものよりも、好適な音のように聞こえる品質の音声を提供することができる。ＭＥＬＰモデルのベクトル量子化が可能である。

ＭＥＬＰ音声モデルも存在している。ＭＥＬＰは、狭帯域のセキュアな音声符号化の次の標準として、米国政府ＤｏＤ（国防総省）ディジタル音声処理コンソーシアム（ＤＤＶＰＣ）によって開発された。この新たな音声モデルは、２．４ｋｂｐｓのデータ・レートでの音声品質及び了解度における改良を表す。アルゴリズムは、ＨＭＭＶ、ヘリコプタ、戦車などの耳障りな音響雑音においてうまく機能する。通常、ＬＰＣ１０ｅモデルのブンブンいう音に聞こえる音声は、受入可能なレベルに低減される。ＭＥＬＰモデルは、帯域が制約されたチャネルにおける音声処理の次世代を表す。

ＭＩＬ−ＳＴＤ−３００５に規定されたＭＥＬＰモデルは、伝統的なＬＰＣ１０ｅパラメトリック・モデルに基づくが、更なる５つの特徴も含む。これらは、有声励振のフーリエ振幅スケーリング、混合励振、非周期パルス、パルス分散、及び適応スペクトル強調である。

混合励振は、５帯域混合モデルを使用して実現される。モデルは、固定フィルタ・バンクを使用して周波数依存性発声強度をシミュレートすることが可能である。このマルチバンド混合励振の主たる効果は、ＬＰＣ１０ｅボコーダに通常関連したブンブンいう音を低減させるというものである。音声は多くの場合、有声信号及び無声信号の複合である。ＭＥＬＰは、複合信号の、ＬＰＣ１０ｅの有声／無声のブーリアン決定よりも好適な近似を行う。

ＭＥＬＰボコーダは、周期パルス又は非周期パルスを使用して有声音声を合成することが可能である。非周期パルスは、音声信号の有声部分と非有声部分との間の遷移領域中で最も多く使用される。この特徴は、トーナルな雑音をもたらすことなく、不規則な声帯パルスを合成器が再生することを可能にする。

パルス分散は、スペクトルが平坦化された三角パルスに基づいた固定パルス分散フィルタを使用して実現することが可能である。フィルタは、固定の有限インパルス応答（ＦＩＲ）フィルタとして実現される。フィルタは、ピッチ周期内に励振エネルギを分散させる効果を有する。パルス分散フィルタは、ピッチ・パルス間の信号をより緩慢に減衰させることにより、フォルマントなしの領域における元の音声と合成音声との間のより好適な一致をもたらすことを目的とする。フィルタは、合成音声の耳障りな特性を低減させる。

適応スペクトル強調フィルタは、ＬＰＣ声道フィルタの極に基づき、合成音声におけるフォルマントを強調するために使用される。フィルタは、合成帯域通過波形と自然帯域通過波形との間の一致を改善し、音声出力に対して、より自然な特性をもたらすことが可能である。

最初の１０個のフーリエ振幅は、ＬＰＣ残差信号のＦＦＴにおけるピークを位置特定することによって得られる。前述の係数に実施された情報は、知覚的に重要な、より低い周波数における音声生成モデルの精度を向上させる。振幅を使用して、１０次ＬＰＣ処理において失われたエネルギの一部を回復するよう有声励振をスケーリングする。これにより、符号化音声の知覚品質が、特に、男性の場合、及び背景雑音の存在下で向上する。

ＭＥＬＰ２４００のパラメータ・エントロピも存在している。エントロピ値は、ＭＥＬＰボコーダ音声モデルにおける既存の冗長度を示し得る。ＭＥＬＰのエントロピは以下の表２に示す。ビット数でのエントロピは、マサチューセッツ工科大学（ＭＩＴ）、ＳＲＩインターナショナル社、及びテキサス・インスツルメンツ（ＴＩ）社によって開発された音韻バランス文のＴＩＭＩＴ音声データベースを使用して測定された。ＴＩＭＩＴは、音韻の豊富な１０個の文をそれぞれが発話する、米語の８つの主要方言による、６３０名の発話者からの音声を含む。６００ｂｐｓでのブロック量子化についてブロック長の好適な選択肢を求めるために、連続した数のフレームのエントロピも調査された。パラメータ毎に選ばれるブロック長は、以下の部分で説明する。

ベクトル量子化は、ソース出力をグループ化し、それを単一ブロックとして符号化する処理である。ソース値のブロックは、ベクトルとしてみることが可能である（よって、ベクトル量子化と呼ぶ）。入力ソース・ベクトルは、コードブックと呼ばれる参照ベクトルの組と比較される。特定の適切な歪み尺度を最小にするベクトルが、量子化ベクトルとして選択される。レートの低減は、チャネルを介して、量子化参照ベクトルの代わりに、コードブック係数を送出した結果として生じる。

音声パラメータのベクトル量子化は、現在の研究において、非常に広範囲にわたって研究されているテーマである。低い量子化レートでは、できる限り少ないビットを使用したパラメータの効率的な量子化は必須である。適切なコードブック構造を使用すれば、メモリの複雑度も計算量の複雑度も低減させることが可能である。魅力的なコードブック構造の１つには、複数段階コードブックの使用がある。更に、コードブック構造は、ビット誤りへのコードブック係数の効果を最小にするよう選択することが可能である。コードブックは、ＴＩＭＩＴ音声データベースを訓練ベクトルとして使用して平均加重二乗平均誤りを最小にするための一般化されたロイド・アルゴリズムを使用して設計することが可能である。一般化されたロイド・アルゴリズムは、特定のセントロイドの組についての決定領域に訓練組を反復的に区分する工程を含む。新たなセントロイドは次いで、特定の決定領域にわたる歪みを最小にするよう再最適化される。一般化されたロイド・アルゴリズムは以下の通りであり得る。

初期のコードブック値の組（Ｙｉ^（０））_{ｉ＝１，Ｍ}及び訓練ベクトルの組｛Ｘ_ｎ｝_{ｎ＝１，Ｎ}、
ｋ＝０、Ｄ^（０）＝０が使用され、閾値εが選択される。

量子化領域｛Ｖ_ｉ ^（ｋ）｝_{ｉ＝１，Ｍ}は、Ｖｉ^（ｋ）＝｛Ｘ_ｎ：ｄ（Ｘ_ｎ，Ｙ_ｉ）＜ｄ（Ｘ_ｎ，Ｙ_ｊ）ｊ≠ｉ｝ｉ＝ｌ，２，．．，Ｍ；
訓練ベクトルと代表的なコードブック値との間の平均歪みＤ^（ｋ）が計算される；
（Ｄ^（ｋ）−Ｄ^{（ｋ−ｌ）}）／Ｄ^（ｋ）＜ εの場合、プログラムは停止する；さもなければ、プログラムは続行し；
ｋ＝ｋ＋ｌである。各量子化領域Ｖ_ｉ ^{（ｋ−ｌ）}の要素の平均値である新たなコードブック値（Ｙ_ｉ ^（ｋ））_{ｉ＝１，Ｍ}が求められる。

非周期パルスは、再構成された音声における孤立した短音のＬＰＣ合成アーチファクトを除去するよう設計される。これは主に、再構成音声が純粋に周期的である場合、わずかに発話された音声の領域において生じる。非周期フラグは、ブルブル震えた発声の状態が音声フレーム内に存在していることを示す。発声がブルブル震えている場合、励振のパルス位置は、純粋に周期的な平均位置付近の一様な分布に基づいて合成中にランダム化される。

非周期状態のランレングスの調査により、ランレングスは通常、ＴＩＭＩＴ音声データベースにわたり、かつ、検査されるいくつかの雑音条件の下で、３フレームよりも少ない旨が示される。更に、非周期発声フレームのランが生じている場合、同じ４フレーム・ブロック内で第２のランが生じる可能性は低い。音声品質に対する影響は、残りのＭＥＬＰパラメータをよりうまく量子化するほど大きくなかったので、チャネルを介して非周期ビットを送出しない旨が決定された。

帯域通過発声（ＢＰＶ）強度は、励振の５つの帯域のうちのどれがＭＥＬＰモデルにおいて有声又は無声であるかを制御する。最下位ビットがピッチとともに符号化されている間、ＭＥＬＰ標準は最上位の４ビットを個々に送出する。表３は、５つの帯域通過発声ビットの確率密度関数の例を示す。前述の５ビットは容易に、通常、可聴の歪みがわずかな状態で２ビットのみに下方量子化することが可能である。更なる削減は、発声決定のフレーム間冗長度を利用することにより、得ることが可能である。現在の低レート符号化器は、４ビットのコードブックを使用して、４フレームのブロックにわたって生じる、最も確率の高い発声遷移を量子化することが可能である。５ビットの帯域通過発声強度の４フレームからのレート削減を４ビットに削減することが可能である。４ビットでは、特定の可聴差が量子化音声において聴かれる。しかし、帯域通過発声による歪みは不快でない。

ＭＥＬＰのエネルギ・パラメータは、かなりのフレーム間冗長度を表す。これは、種々のブロック量子化手法によって活用することが可能である。連続したフレームからのエネルギ値の系列をグループ化して、いかなる次元のベクトルも生成することが可能である。ＭＥＬＰ６００ｂｐｓモデルでは、４フレームのベクトル長（フレーム毎に２つの利得値）を、限定的でない例として使用することが可能である。エネルギ・コードブックは、Ｋ−平均ベクトル量子化アルゴリズムを使用して生成することが可能である。コードブックは、音声入力レベルに対する感度を抑制するよう複数のレベルでスケーリングされた訓練データを使用して訓練されている。コードブック訓練処理中、ブロック内の考えられる４つの位置それぞれにおいてエネルギ遷移が表されるように４つのエネルギ値の新たなブロックが、新たなフレーム毎に作成される。結果として生じるコードブックがサーチされ、その結果、二乗平均誤りを最小にするコードブック・ベクトルが生じる。

ＭＥＬＰ２４００の場合、２つの個々の利得値がフレーム周期毎に送信される。第１の利得値は、１０．０乃至７７．０ｄＢに及ぶ３２値の一様な量子化器を使用して５ビットに量子化される。第２の利得値は、適応アルゴリズムを使用して３ビットに量子化される。ＭＥＬＰ６００ｂｐｓモデルでは、４フレームにわたり、ＭＥＬＰの利得値の両方のベクトルが量子化される。２０４８個の要素のコードブックを使用すれば、フレーム毎のエネルギ・ビットは、ＭＥＬＰ２４００のフレーム毎の８ビットから、ＭＥＬＰ６００のフレーム毎の２．９０９ビットに削減される。エネルギのフレーム毎の２．９０９ビット未満の量子化値が調査されているが、量子化歪みは、合成出力音声において可聴になり、単語の開始及び終了（ｏｆｆｓｅｔ）における了解度に影響を及ぼしている。

励振情報は、ＬＰＣ残差信号のフーリエ係数を含めることによって補われる。前述の係数又は振幅は、ＬＰＣパラメータによってモデリングされない励振のスペクトル形状をもたらしている。前述のフーリエ振幅は、ＬＰＣ残差信号に対するＦＦＴを使用して推定される。ＦＦＴは、ピッチ周波数の高調波でサンプリングされる。現在のＭＩＬ−ＳＴＤ−３００５では、より低い１０個の高調波は、より重要とみなされ、２２．５ｍｓフレームの８ビット・ベクトル量子化器を使用して符号化される。

フーリエ振幅ベクトルは、２つのベクトルのうちの１つに量子化される。無声フレームの場合、送信されたフーリエ振幅を表すよう、スペクトルが平坦なベクトルが選択される。有声フレームの場合、単一のベクトルを使用して、有声フレーム全てを表す。有声フレーム・ベクトルは、低レート・ボコーダに残っている耳障りな特性の一部を低減させるよう選択することが可能である。残りのＭＥＬＰパラメータのレート低減により、フーリエ振幅に対する、より高いデータ・レートにおいてみられる影響が軽減される。上記量子化を行うために、ビットは必要でない。

ＭＥＬＰモデルは、１ｋＨｚ低域通過フィルタリングされた音声のエネルギ正規化相関を使用してフレームのピッチを推定する。ＭＥＬＰモデルは、分数のピッチ値を補間することにより、ピッチを更に精緻化する。精緻化された分数ピッチ値を次いで、実際のピッチ値の倍数から生じるピッチ誤りについて検査する。ベクタ量子化のためにＭＥＬＰ６００ボコーダが使用するのはこの最終ピッチ値である。

ＭＥＬＰの最終ピッチ値は、ピッチ輪郭の低レート表現が、より自然な音に聞こえることを可能にするよう遷移の一部が平滑化されるように、まずメジアン・フィルタリング（３次）される。平滑化されたピッチ値の連続した４つのフレームが、１２８個の要素を有するコードブックを使用してベクトル量子化される。コードブックは、Ｋ平均手法を使用して訓練することが可能である。結果として生じるコードブックがサーチされ、ピッチの発声フレームの二乗平均誤りを最小にするベクトルが生じる。

ＭＥＬＰのＬＰＣスペクトルは、ＬＰＣスペクトルの、より普及している高集約性表現の１つである線スペクトル（ＬＳＦ）に変換される。ＬＳＦは、４段階ベクトル量子化アルゴリズムによって量子化される。第１の段階は７ビットを有する一方、残りの３つの段階は、それぞれ６ビットを使用する。結果として生じる量子化ベクトルは、４つの段階それぞれからのベクトルと、平均ベクトルとの和である。サーチ処理中の各段階で、ＶＱサーチは、知覚加重ユークリッド距離を使用して、元のものとの「Ｍ個の最善の」最も近い一致を位置特定する。前述のＭ個の最善のベクトルは、次の段階を求めるサーチにおいて使用される。４つの段階それぞれの最後の最善のものの係数により、最終の量子化ＬＳＦが求められる。

スペクトルの低レート量子化は、ＬＳＦの４つのフレームを順次、４段階のベクトル量子化処理を使用して量子化する。コードブックの最初の２つの段階は１０ビットを使用する一方、残りの２段階はそれぞれ、９ビットを使用する。最善のベクトルを求めるサーチは、ＭＩＬ−ＳＴＤ−３００５ボコーダに使用されるものと同様な知覚重み付けを備えた同様な「Ｍ個の最善の」手法を使用する。４つのスペクトル・フレームは、３８ビットのみに量子化される。

コードブック生成処理は、Ｋ平均及び一般化されたロイド手法を使用する。Ｋ平均コードブックは、一般化されたロイド処理への入力として使用される。スライディング・ウィンドウを、訓練音声の選択された組に対して使用して、４フレーム・ブロックにわたるスペクトル遷移が最終コードブックに適切に表されることを可能にすることができる。コードブックを訓練する処理には、入力音声コンテンツの正しいバランスの選択においてかなりの努力を必要とし得る。訓練データの選択は、コードブックを反復的に生成し、上記平均歪みにより、ベクトルをロギングすることにより、生成することが可能である。この処理は、歪み全体を、受入可能でないレベルに増加させることなく、遷移フレームで表すことが可能な低確率遷移及び固定フレームを除去することが可能である。

診断受入可能性尺度（ＤＡＭ）及び同韻診断テスト（ＤＲＴ）を使用して、ＭＥＬＰボコーダの性能を既存のＬＰＣベースのシステムと比較する。何れのテストも、音声符号化器の性能を数量化するために米国政府によって広範囲に使用されている。ＤＡＭは、信号自体の基本知覚特性及び高度知覚特性の多様性の検出可能性を聴取者が判断することを必要とする。ＤＲＴは、音声中の、了解度に適切な情報が、わずかな数の弁別的特徴によって収容されるという原理に基づいた、２つの選択肢の了解度テストである。ＤＲＴは、２値の６つの弁別的特徴（発声、鼻音性、持続性、歯擦音性、低音調性、及び集約性）の状態に関する情報が、試験されている通信システムにより、どの程度よく維持されているかを測定するよう企図されている。

両方のＭＥＬＰベースのボコーダのＤＲＴ性能は、大半のテスト条件の場合、ＬＰＣボコーダの了解度を超える。６００ｂｐｓのＭＥＬＰＤＲＴは、より高いビット・レートのＭＥＬＰシステムのわずか３．５ポイント以内にある。ＭＥＬＰのベクトル量子化によるレート低減は、モデルの了解度にあまり影響を与えていない。ＨＭＭＷＶのＤＲＴスコアは、ＭＥＬＰボコーダの雑音前置処理装置が、音響雑音が存在している状態において、より好適な了解度を可能にすることを明らかにしている。

ＭＥＬＰモデルのＤＡＭ性能は、新たな音声モデルの強みを明らかにしている。６００ｂｐｓでのＭＥＬＰの音声の受入可能性は、無騒音のテスト条件におけるＬＰＣ１０ｅ２４００よりも、４．９ポイントを超えるポイントだけ良く、これは、両方のボコーダ間の最も顕著な差である。ＭＥＬＰ２４００の話者認識は、ＬＰＣ１０ｅ２４００よりもずっと良い。ＭＥＬＰベースのボコーダでは、ブンブンする音に聞こえる音声がずっと少なく、人工的な音に聞こえる音声がずっと少ない。ＭＥＬＰのオーディオは、ＬＰＣ１０ｅと比較すれば、より鮮やかであり、より大きなローエンド・エネルギ及びハイエンド・エネルギを有していると認識される。

セキュアな音声の利用可能性は、ボコーダのデータを転送するために使用される波形のビット誤りレート性能、及びビット誤りに対するボコーダの耐性に直接関係する。１％のビット誤りレートにより、表５の例で分かるように、ＭＥＬＰベースの符号化器及びＬＰＣベースの符号化器の音声の了解度及び品質が低下する。したがって、有用な範囲は、ＭＥＬＰベースのボコーダの場合、ビット誤りレートが約３％未満であり、ＬＰＣベースのボコーダの場合、約１％未満である。

ＭＩＬ−ＳＴＤ−１８８―１１０Ｂ波形の１％のビット誤りレートは、図６及び図７それぞれに示すグラフにおけるガウシアン・チャネル、及びＣＣＩＲが劣悪なチャネルについて分かり得る。曲線は、２４００ｂｐｓの標準に対して６００ｂｐｓの波形を使用することにより、約７ｄＢの利得を達成することが可能である旨を示す。一日のより長い部分の間、ＨＦリンクが機能することを可能にするのは、ＳＮＲがより低いこの領域においてである。実際に、多くの２４００ｂｐｓのリンクは、伝搬及び電力レベルに基づいて、日中は何れの時点でも、１％ビット誤りレート未満で機能することは可能でない。１０−２０Ｗの電力レベルを使用する通常のマンパック無線機は、ボコーダ・レートにおける選択を更にミッション・クリティカルにする。

限定的でない一例によるＭＥＬＰボコーダは、１６ビット固定小数点のテキサス・インスツルメント社のＴＭＳ３２０ＶＣ５４１６ディジタル信号プロセッサ上などで、リアルタイムで実行することが可能である。低電力ハードウェア設計は、ハリス社のＲＦ−５８００Ｈ／ＰＲＣ−１５０マンパック無線機に存在し得、いくつかの音声符号化器、並びに種々のデータ関連のインタフェース及びプロトコルを実行する役割を果たすことが可能である。ＤＳＰハードウェア設計は、１５０ＭＨｚにおけるオンチップ・コアを実行させること（ゼロ待ち状態）が可能である一方、オフチップ・アクセスは、５０ＭＨｚに制限すること（２待ち状態）が可能である（前述の限定的でない例による）。データ・メモリ・アーキテクチャは、３２Ｋバンクにページングされた２待ち状態の外部メモリの２５６Ｋ、６４Ｋのゼロ待ち状態、及びオンチップ・メモリを有し得る。プログラム・メモリの場合、システムは、ＤＳＰによって完全にアドレス指定することが可能な、外部メモリの２５６Ｋ、更なる６４Ｋのゼロ待ち状態、及びオンチップ・メモリを有し得る。

２４００ｂｐｓのＭＥＬＰソース・コードの例は、ハリス社によって製造されたＭＥＬＰ６００ボコーダと組み合わせたテキサス・インスツルメント社の５４Ｘアセンブリ言語ソース・コードを含み得る。限定的でない一例におけるこのコードは、ＦＡＲＣＡＬＬＩＮＧランタイム環境を使用してＴＭＳ３２０ＶＣ５４１６上で実行するよう修正されている。これにより、ＤＳＰプログラムが、６４Ｋ超に及ぶ。コードは、ＭＥＬＰの変数を初期化するためのＴＦＣ初期化機構を使用したＣコール環境に一体化され、ハリス社固有のＤＳＰオペレーティング・システムと組み合わせられている。

ＭＥＬＰ２４００標的システム上へのランタイム・ローディングは、解析が２４．４％ロード状態で実行され、雑音前置処理器が１２．４４％ロード状態で実行され、合成が８．８８％ロード状態で実行されることを可能にする。非常にわずかなロードの増加が、ＭＥＬＰ６００合成の一部として生じるが、それは、処理が、テーブル・ルックアップに過ぎないからである。ＭＥＬＰ６００ボコーダの更なるサイクルは、スペクトル解析のベクトル量子化に含まれる。

新たなＭＩＬ−ＳＴＤ−３００５ボコーダの音声品質は、より旧いＦＥＤ−ＳＴＤ−１０１５よりも良好である。ベクトル量子化手法を、米国ＭＩＬ−ＳＴＤ−１８８−１１０Ｂに規定されているように、６００ｂｐｓ波形の使用と組み合わせた新たな標準のボコーダ上で使用することが可能である。ＨＦ性能における５乃至７ｄＢの向上が、一部のフェージング・チャネル上で可能であり得る旨を結果が示しているようである。更に、６００ｂｐｓボコーダの音声品質は通常、いくつかのテスト条件に対して、既存の２４００ｂｐｓのＬＰＣ１０ｅ標準よりも良好である。提示されたシミュレーション結果を検証するために、更なるオンエア・テストが必要になる。オンエア・テストにより、結果が確認された場合、ＭＥＬＰの低レート符号化を、ＭＩＬ−ＳＴＤ−３００５とともに、困難なＨＦリンクを介した、マンパック無線機に対する通信の改良、及び利用可能性の拡張のために使用することが可能である。

Claims

第２のＭＥＬＰボコーダにおける別の音声フレーム・レートで使用するために、第１のＭＥＬＰ音声符号化器（ボコーダ）からの音声フレーム・レートとして、混合励振線形予測（ＭＥＬＰ）符号化音声データをトランスコーディングする方法であって、
前記第１のＭＥＬＰボコーダによって使用されるＭＥＬＰ音声パラメータに、音声を表す入力データを変換する工程と、
前記ＭＥＬＰパラメータをバッファリングする工程と、
量子化により、音声データ・フレームからの前記ＭＥＬＰパラメータの時間補間を行う工程と、
音声データ・フレームに対応するビット・ブロックとしての補間データに対して符号化機能を行って、前記第１のＭＥＬＰボコーダとは別の音声フレーム・レートでの前記第２のＭＥＬＰボコーダによって使用されるビット・レートの低減を行う工程とを含む方法。
請求項１記載の方法であって、ＭＥＬＰ２４００ボコーダで使用されるビット・レートを、ＭＥＬＰ６００ボコーダで使用されるビット・レートに下方トランスコーディングする工程を更に含む方法。
請求項１記載の方法であって、
ブロック内の連続した複数のフレームの非量子化ＭＥＬＰパラメータから、音声データ・ブロックについてＭＥＬＰパラメータを量子化する工程を更に含む方法。
請求項１記載の方法であって、符号化機能を行う工程は、非量子化ＭＥＬＰパラメータを取得し、フレームを合成して、１つのＭＥＬＰ６００ｂｐｓフレームを形成する工程と、非量子化ＭＥＬＰパラメータを作成する工程と、前記ＭＥＬＰ６００ｂｐｓフレームの前記ＭＥＬＰパラメータを量子化する工程と、それらをシリアル・データ・ストリームに符号化する工程とを含む方法。
請求項１記載の方法であって、一遅延フレームを使用して前記ＭＥＬＰパラメータをバッファリングする工程を更に含む方法。
請求項１記載の方法であって、２５ミリ秒の離間点を予測する工程を更に含む方法。
第２のＭＥＬＰボコーダにおける別の音声フレーム・レートで使用するために、第１のＭＥＬＰ音声符号化器（ボコーダ）からの音声フレーム・レートとして符号化された混合励振線形予測（ＭＥＬＰ）音声データをトランスコーディングするボコーダであって、
前記第１のＭＥＬＰボコーダによって使用されるＭＥＬＰ音声パラメータに、音声を表す入力データを復号化する復号化器回路と、
前記ＭＥＬＰパラメータをバッファリングし、量子化により、音声データ・フレームからの前記ＭＥＬＰパラメータの時間補間を行う変換装置と、
音声データ・フレームに対応するビット・ブロックとしての補間データを符号化して、別の音声フレーム・レートでの前記第２のＭＥＬＰボコーダによって使用されるビット・レートの低減を行う符号化器回路とを備えるボコーダ。
請求項７記載の復号化器であって、前記符号化器回路は、ブロック内の連続した複数のフレームの非量子化ＭＥＬＰパラメータから、音声データ・ブロックについてＭＥＬＰパラメータを量子化するよう動作する復号化器。
請求項７記載のボコーダであって、前記符号化器回路は、非量子化ＭＥＬＰパラメータを取得し、フレームを合成してＭＥＬＰ６００ｂｐｓフレームを形成し、非量子化ＭＥＬＰパラメータを作成し、前記ＭＥＬＰ６００ｂｐｓフレームの前記ＭＥＬＰパラメータを量子化し、それらをシリアル・データ・ストリームに符号化するよう動作するボコーダ。
請求項９記載のボコーダであって、ＭＥＬＰ２４００符号化データがＭＥＬＰ６００符号化データに下方トランスコーディングされるボコーダ。