JP2004526213A

JP2004526213A - 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム

Info

Publication number: JP2004526213A
Application number: JP2002590143A
Authority: JP
Inventors: レメ、アンシ
Original assignee: ノキアコーポレーション
Priority date: 2001-05-16
Filing date: 2002-05-10
Publication date: 2004-08-26
Also published as: PT1388144T; BR0208635A; CN1509469A; CN1241170C; WO2002093551A3; EP1388144A2; CA2443443C; EP1388144A4; KR20040028750A; AU2002302874A1; US20030014249A1; WO2002093551A2; ES2649237T3; EP1388144B1; US7003454B2; CA2443443A1

Abstract

過去に復号された出力値に基づく予測されたＬＳＦ値が、残差コードブックベクトルおよびＬＳＦ係数とともに、スペクトル歪みを評価するために使用される、音声コーダでＬＳＦベクトルを量子化する方法および装置。この方法は、それぞれの予測されたＬＳＦ値および残差コードブックベクトルから複数の量子化されたＬＳＦ係数を獲得する工程、量子化されたＬＳＦ係数を周波数ドメイン内で規則正しく配列し直す工程、および配列し直された量子化済みのＬＳＦ係数およびそれぞれのＬＳＦ係数からスペクトル歪みを獲得する工程を含む。最適コードベクトルは、スペクトル歪みに基づき選択される。

Description

【技術分野】
【０００１】
本発明は、一般的には音声信号およびオーディオ信号の符号化に関し、とくに線スペクトル周波数ドメインにおける線形予測係数（linear prediction coefficients）の量子化に関する。
【背景技術】
【０００２】
音声およびオーディオの符号化アルゴリズムは、通信システム、マルチメディアシステム、および記憶システムにおいて多岐にわたる用途がある。符号化アルゴリズムの開発は、合成された信号の高い品質を維持しつつ、伝送および記憶の容量を節約するというニーズにより後押しされている。コーダの複雑さは、アプリケーションの実行環境（プラットホーム）の処理能力によって制限されている。音声記憶などのいくつかのアプリケーションでは、エンコーダはきわめて複雑であってもよいが、デコーダは可能な限り簡略でなければならない。
【０００３】
典型的な音声コーダでは、入力音声信号はフレームと呼ばれるセグメントで処理される。通常、フレームの長さは10msから30msであり、つぎのフレームの5msから15msの予測セグメントも使用できる。フレームはさらに多くのサブフレームに分割されてよい。フレームごとに、エンコーダは入力信号のパラメータ表現を決定する。パラメータは量子化され、通信チャネルを通して送信されるか、またはデジタル形式で記憶媒体に記憶される。受信端では、デコーダが受信されたパラメータに基づき合成された信号を構築する。
【０００４】
大部分の現在の音声コーダは、励起信号が発生する線形予測（LP）フィルタを含む。LPフィルタは、典型的には、以下の方程式により指定されるように全極型構造を有しており、
【０００５】
【数１】

ここでA（z）は、量子化されていないLP係数a₁、a₂、...a_pを備える反転フィルタ（inverse filter）であり、pは予測値の次数であり、通常8から12である。
【０００６】
入力音声信号はフレーム単位で処理される。音声フレームごとに、エンコーダは、たとえばレビンソン・ダービン・アルゴリズム（「AMR音声コーデック、トランス符号化関数（AMR Speech Codec; Transcoding functions）」3G TS 26.090 v3.1.0、1999年−12月を参照のこと）を使用して、LP係数を求める。結果として生じる安定したフィルタが次数ベクトルで表現される線スペクトルペア（LSP）、イミタンススペクトル周波数（ISF）およびイミタンススペクトルペア（ISP）などの線スペクトル周波数（LSF）表現または他の類似する表現は、それらが優れた量子化特性を有するため、係数の量子化に利用される。中間サブフレームの場合、係数は、LSF表現を使用して線形補間される。
【０００７】
LSFを定義するためには、反転LPフィルタA（z）多項式が使用され、以下の2つの多項式を構築する。
P(z)=A(z)+z^-(p+1)A(z^-1),
=(1-z^-1)κ(1-2z^-1cosω_i+z^-2),i=2,4, ...,p （２）
および
Q(z)=A(z)-z^-(p+1)A(z^-1)
=(1-z^-1)κ(1-2z^-1cosω_i+z^-2),i=1,3, ...,p-1. （３）
多項式P（z）とQ（z）の累乗根がLSF係数と呼ばれる。これらの多項式のすべての累乗根は単位円e^j ^ω ⁱの上にあり、i＝1,2,...pである。多項式P（z）とQ（z）は以下の特性を有する。1）多項式のすべてのゼロ（累乗根）が単位円の上にある、2）P（z）とQ（z）のゼロは互いに交互に組み合わされる。さらに具体的には、つねに以下の関係が満たされている。
０＝ω₀＜ω₁＜ω₂＜ ... ＜ω_p-1＜ω_p＜ω_p+1＝π （４）
【０００８】
この昇順の順序は、多くの場合音声符号化の用途で必要とされるフィルタの安定性を保証する。最初のパラメータと最後のパラメータがそれぞれつねに0とπであり、p値だけが送信されなければならないことに注意する必要がある。
【０００９】
音声コーダではLSF情報を記憶するために効率的な表現が必要とされる一方、LSFは、多くの場合予測（図1を参照すること）ともにベクトル量子化（VQ）を使用して量子化される。通常、予測される値は、過去に復号された出力値（AR（自己回帰）−予測値）または過去に量子化された値（MA（移動平均）−予測値）に基づいて推定される。
【００１０】
【数２】

この場合、A_jとB_jは予測値行列であり、mとnは予測子の次数である。pLSF_k、qLSF_kおよびCB_kは、それぞれフレームkの予測LSF、量子化LSFおよびコードブックベクトルである。mLSFは平均LSFベクトルである。
【００１１】
予測値が計算されたのち、量子化されたLSF値を得ることができ、
【００１２】
【数３】

この場合、CB_kはフレームkの最適コードブックエントリである。
【００１３】
実際には、予測量子化または制限されたVQを使用するとき、結果として生じるqLSF_kの安定性は、LP係数への変換前にチェックしなければならない。直接VQ（非予測、単一段階、未分割）の場合にだけ、コードブックは、結果として生じる量子化されたベクトルがつねに順序正しくなるように設計できる。
【００１４】
従来の技術による解決策ではフィルタの安定性は、量子化とコードブック選択ののち、LSFベクトルを並べることによって保証される。
【００１５】
最良のコードブックベクトルを検索する一方で、多くの場合すべてのベクトルが試され（完全検索）、いくつかの知覚的に重要な優秀性の指標がすべてのケースについて計算される。一般的に使用される検索手順のブロック図は図1aに示される。
【００１６】
最適には、選択は以下のようにスペクトル歪みSDⁱにづく。
【００１７】
【数４】

この場合
［外１］

は、それぞれ量子化が行なわれた、および量子化が行なわれなかった音声フレームのスペクトルである。これは計算上非常に大がかりであるため、さらに簡略な方法が代わりに使用される。
【００１８】
一般的に使用される方法は、LSF誤差（rLSFⁱ _k）を重み（W_k）で重み付けることである。たとえば、以下の重みが使用され（「AMR音声コーデック；コード変換関数）（AMR Speech Codec; Transcoding functions）」3G TS 26.090 v3.1.0、1999年−12月を参照のこと）。
【００１９】
【数５】

この場合、d_k＝LSF_k+1-LSF_k-1であり、LSF₀＝0Hz、およびLSF₁₁＝4000Hzである。
【００２０】
基本的には、この歪み測定はLSF周波数間の距離に依存する。LSFが互いに近いほど、それらはより大きな重みを獲得する。知覚的には、これは、フォルマント領域がより正確に量子化されることを意味する。
【００２１】
歪み値に基づき、最小の値を示すコードブックベクトルが最良のコードブック指数として選択される。通常、基準は以下のとおりである。
【００２２】
【数６】

図1aより分かるように、ターゲットLSF係数LSF_kとそれぞれの予測されたLSF係数pLSF_kの差異は、最初に加算装置12で求められ、該差異はさらに別の加算装置14の中のj番目のコードブックエントリのそれぞれの残留コードブックベクトルCB^j _1kで調整される。式9は、以下に変形することができ、
【００２３】
【数７】

さらに以下に変形できる。
【００２４】
【数８】

式10と11に示される変形の工程は、図1bに示されるようにエンコーダでさらに容易に視覚化できる。図1bに示されるように、加算装置16は、量子化されたLSF係数を計算するために使用される。それ以後、LSF誤差は量子化されたLSF係数とターゲットLSF係数から加算装置18によって計算される。
【００２５】
量子化されたLSF係数qLSFⁱ _kがkに関して昇順ではない場合、従来技術の解法は必ずしも最適コードブック指数を検出しない。図2aから図2eはこのような問題を説明している。簡略化のために、最初の3つのLSF係数だけが図示されている（k＝1,2,3）。しかしながら、この簡略化された表現は、分割VQの場合のやや通常の最初の分割を適切に表わしている。ターゲットLSFベクトルはLSF₁...LSF₃と記され、過去のフレームのLSFに基づく予測値も示されている（pLSF₁...pLSF₃）。図2aに示されるように、いくつかの予測値はそれぞれのターゲットベクトルより大きいが、いくつかは小さい。ベクトル量子化器残差コードブックの中の最初のコードブックエントリは、図2bに示されるように、コードブックベクトルのように見える可能性がある。qLSF¹ _1-3＝pLSF_1-3＋CB¹ _1-3にしたがって、量子化されたLSF係数が計算され、図2cに示される。簡略のため、重みは使用されない、つまりW_k＝1であり、スペクトル歪みはターゲット値と量子化値（量子化済みのLSF係数）間の二乗された距離または絶対距離に正比例している。ターゲット値と量子化値のあいだの距離はrLSFⁱ _kである。したがって、第1の分割の総歪みは、
【００２６】
【数９】

である。第2のコードブックエントリ（図示されていない）は、図2dに示されるように量子化されたLSFベクトル（qLSF² _1-3）およびスペクトル歪み（SD² _1-3）を生じるであろう。図2dが図2cと比較されるとき、結果として生じるqLSFベクトルはきわめて異なるが、総歪みは略同じである、つまり（SD¹≒SD²）である。最初の2つのコードブックエントリを用いると、結果として生じる量子化されたLSF係数は順序正しくなる。
【００２７】
従来技術による量子化方法にまつわる問題を示すために、図2eに示されるように、第3のコードブックエントリ（図示されていない）から生じた量子化されたLSF係数（qLSF³ _1-3）および対応するスペクトル歪み（SD³ _1-3）が分散されると仮定される。図2eに示されるように、スペクトル歪みに従った総歪み（SD³＝ΣSD³ _k、kは1から3まで）は非常に大きな値である。つまり、従来技術の方法によれば、この第1分割からの最良のコードブック指数はSD¹とSD²の小さい方である。しかしながら、この選択された「最良の」コードブック指数は、のちに図4aに示されるように、最適コードベクトルを生じない。これは、結果として生じる量子化されたLSFベクトルが第3コードブックエントリに関して順序が狂っているためである。
【００２８】
一般的には、音声コーダは、そこで使用される線形予測（LP）フィルタが安定していることを必要とする。図1aに示されるもののような従来技術によるコードブック検索ルーチンは、結果として生じる量子化済みのLSFベクトルの順序を狂わせ、不安定にする。従来技術では、ベクトルの安定化は量子化後のLSFベクトルの並べ替えにより達成される。ただし、獲得されるベクトルが最適ではない可能性がある。
【００２９】
線形予測係数を表す線スペクトルペア（LSP）ベクトル、イミタンススペクトル周波数（ISF）ベクトルおよびイミタンススペクトルペア（ISP）ベクトルなどのスペクトル（ペア）パラメータベクトルも安定となるように並べられなければならないことに注意する必要がある。
【００３０】
獲得されたコードベクトルが最適化されている、スペクトルパラメータ（または表現）量子化のための方法およびシステムを提供することは、有利でありかつ望ましい。
【００３１】
［発明の要約］
元のビットの割り当てを維持する一方で、最適化されたコードベクトルがスペクトル歪みに関してスペクトルパラメータ量子化性能を改善するために選択される、スペクトルパラメータ量子化のための方法および装置を提供することが本発明の第1の目的である。この目的は、コードベクトルがスペクトル歪みに基づいて選択される前に周波数ドメインで規則正しく量子化済みのスペクトルパラメータベクトルを配列し直すことによって達成できる。
【００３２】
このようにして、本発明の第1の態様によれば、線形予測フィルタが周波数ドメインで複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づく複数の予測されたスペクトルパラメータ値、および前記複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルがスペクトル歪みを計算するために使用され、最適コードベクトルがスペクトル歪みに基づき選択される、音声コーダでスペクトルパラメータベクトルを量子化する方法が提供される。該方法は、
それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得すること、
量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく配列し直すこと、および
配列し直された量子化済みのスペクトルパラメータ係数およびそれぞれの線スペクトル周波数係数からスペクトル歪みを獲得すること
を含むことを特徴としている。
【００３３】
好ましくは、スペクトル歪みは、配列し直されたスペクトルパラメータ係数のそれぞれとそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算され、該誤差はスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けされる。
【００３４】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が単一分割で実行されるときに適用可能である。
【００３５】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行されるときにも適用可能である。その場合、最適コードベクトルは各分割でのスペクトル歪みに基づいて選択される。
【００３６】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、多段式量子化の場合に1つの段階または複数の段階で実施されるときにも適用可能である。その場合、最適コードベクトルは各段階のスペクトル歪みに基づいて選択される。各段階は並べ替えるか、または並べ替えない場合がある。どの段階が並べ替えられるのか、およびどの段階が並び替えられないのか、という選択がが事前に決定されていることが好ましい。それ以外の場合、並べ替え情報は副情報として受信機に送信されなければならない。
【００３７】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、事前に選択されたすべてのベクトルに対する最適化段階として実行されるときに適用可能である。用意されたベクトルが並べ替えられ、最終的な指数の選択は開示された方法を使用して当該事前に選択されたベクトルの集合から行なわれる。
【００３８】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、最適化段階として実行され、（段階または分割のための）コードブックに対する初期指数が再配列なしに選択され、最終的な選択が、開示された並べ替え方法を用いて最良の事前に選択されたベクトルの選択だけに基づき実行される場合に適用可能である。
【００３９】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【００４０】
本発明の第2の態様によれば、音声コーダでスペクトルパラメータベクトルを量子化する装置が提供され、線形予測フィルタは周波数ドメインでの複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づいた複数の予測されたスペクトルパラメータ値、および複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルは、スペクトル歪みに基づき最適コードベクトルを選択できるようにするためのスペクトル歪みを推定するために使用される。該装置は、
量子化されたスペクトルパラメータ係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得する手段と、
再配列された量子化されたスペクトルパラメータ係数を示す一連の第2信号を提供するために、量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
再配列された量子化されたスペクトルパラメータ係数およびそれぞれのスペクトルパラメータ係数からスペクトル歪みを獲得する、第2の信号に応える手段と
を備えたことを特徴としている。
【００４１】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【００４２】
本発明の第3の態様によれば、ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号、およびスペクトル表現パラメータを示す第2伝送信号を含み、励起検索モジュールがコードパラメータ、利得パラメータおよびピッチパラメータを提供するために使用され、線形予測分析モジュールが周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、ビットストリームをデコーダに提供する音声エンコーダが提供される。該エンコーダは、
量子化されたスペクトル表現係数を示す一連の第1の信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルに基づいた複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2の信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
一連の第3の信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現係数からスペクトル歪みを獲得する、第2の信号に応える手段と、
スペクトル歪みに基づきスペクトル表現パラメータを表す複数の最適コードベクトルを選択し、最適コードベクトルを示す第2の伝送信号を提供する、第3の信号に応える手段と
を備えたことを特徴としている。
【００４３】
本発明の第4の態様によれば、該ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号と、スペクトル表現パラメータを示す第2伝送信号を含み、励起検索モードが事前処理された入力信号から第1伝送信号を提供するために使用され、線形予測モジュールが、事前処理された入力信号に基づき、周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、無線通信網内の少なくとも1つの基地局にビットストリームを提供するために、入力音声を受信し、事前処理することができる移動局が提供される。該移動局は、
量子化されたスペクトル表現係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルから複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、一連の第1信号に応える手段と、
一連の第3信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現からスペクトル歪みを獲得する、一連の第2信号に応える手段と、
第2伝送信号を提供するために、スペクトル歪みからスペクトル表現パラメータを表す複数の最適コードベクトルを選択する手段と
を備えたことを特徴としている。
【００４４】
本発明は、図3〜6に関連してなされる説明を読むと明らかになるであろう。
【発明を実施するための最良の形態】
【００４５】
スペクトル（ペア）パラメータベクトルは、安定したスペクトル（ぺア）ベクトルがつねに正しい順序に並べられるように線形予測係数を表現するベクトルである。このような表現は線スペクトル周波数（LSF）、線スペクトルペア（LSP）、イミタンススペクトル周波数（ISF）、イミタンススペクトルペア（ISP）などを含む。簡略化のために、本発明はLSF表現に関して説明される。
【００４６】
本発明のLSF量子化システム40が図3に示されている。図1aに示されるようなシステム構成要素に加えて、加算装置16と加算装置18のあいだに並べ替え機構20が具現化されている。該並べ替え機構20は、量子化されたLSF係数qLSFⁱ _kが周波数に関して昇順で配置されるようにそれらを再配列するために使用される。たとえば、図2aと図2bに示されるような量子化されたLSF係数qLSF¹ _kとqLSF² _kは、すでに昇順、つまりqLSFⁱ ₁＜qLSFⁱ ₂＜qLSFⁱ ₃であり、並べ替え機能20の機能はこれらの量子化されたLSF係数の配置に影響をおよぼさない。この場合、量子化されたLSFベクトルqLSFⁱは、適切な順序であると言われる。しかしながら、図2eに示されるように、量子化されたLSFベクトルqLSF³は、qLF³ ₁＜qLSF³ ₃＜qLSF³ ₂であるため順序が狂っている。配列されたのち、量子化されたLSF係数は、図4aに示されるように昇順で分散される。
【００４７】
ベクトル配列後、総スペクトル歪みSD³（図4a）はSD¹またはSD²のどちらかより小さい。したがって、選択される最初の3つのフレームを含む第1分割からの最良のコードブック指数はi=3である。復号されたコードブック（1 3 2）の正しい順序も、並べ替えのためにデコーダ内で自動的に検出され、特別な情報は必要とされない。
【００４８】
並べ替え機構20によって実行されるような並べ替え関数は以下のように表現できる。
【００４９】
【数１０】

式13は、さらに、以下に変形でき、
【００５０】
【数１１】

ここではs（k）は、現在のk番目のLSF成分の正しい配列を与える並べかえ関数であり、その結果すべてのLSFⁱ _kはSDⁱの計算の前に昇順となる。本発明によれば、無効に配列されたLSFベクトルを生じさせる可能性がある残差ベクトルを比較する代わりに、スペクトル歪み値は量子化されたベクトルが順序正しく並べられたのちに計算される。
【００５１】
従来技術の検索方法を使用して、昇順で配列されていない量子化されたLSF係数から最小のスペクトル歪みSDⁱを獲得することが可能な場合もあることに注意する必要がある。たとえば第1のコードブックエントリと第2のコードブックエントリは、図2fと図2gに示されるように、量子化されたLSF係数の2つの異なる集合qLSF¹ _kとqLSF² _kを生じさせるが、第3の量子化されたLSF係数qLSF³ _kは図2eに示されるものと同じである。その場合、量子化されたLSF係数qLSF³ _kは昇順ではないが、最小のスペクトル歪みは第3のコードブックエントリから生じる。このようにして、最小の総スペクトル歪みに基づいて選択された量子化されたLSFベクトルは不安定である。従来技術によるコーダでは、不安定な量子化されたLSFベクトルは、コードブック選択後に量子化されたLSF係数を並べ替えることによって安定化できる。この特定の場合には、従来技術による音声コーデックおよび本発明による音声コーデックの結果は同じである。
【００５２】
一般的に、やはり誤った順序である別の量子化されたベクトルがある可能性があるため、従来技術による方法に従った結果は最適ではない可能性がある。たとえば、第4のコードブック入力が、図2hに示されるように量子化されたLSF係数qLSF⁴ _kの集合を生じさせる場合、この量子化されたLSFベクトルは図2e、図2f、図2gおよび図2hに示されるように、量子化されたベクトルのあいだで最大のスペクトル歪みを有する。従来技術によるコードブック検索ルーチンを用いると、最小の総スペクトル歪みは第3のコードブックエントリ（図2g）から生じる。
【００５３】
本発明のLSF量子化方法によれば、図2eと図2hの量子化されたLSF係数は、並べ替え機構20によって再配列される。図2hに示されるように量子化されたLSF係数qLSF⁴ _kが、量子化されたLSF係数を昇順にするために再配列されたのち、結果は図4bに示される。図2f、図2g、および図4aに示されるように、量子化されたLSFベクトルに比べて、図4bに示されるような量子化されたLSFベクトルは最小の総スペクトル歪みを有する。
【００５４】
前記の例は、従来技術によるコードブック検索ルーチンに従った（LSFベクトルを並べ替えることによる）量子化後のベクトルの安定化が、スペクトル歪みという点で必ずしも最良のベクトルを生じさせないことを示した。
【００５５】
本発明のLSF量子化方法を用いると、LSFベクトルは、それらが伝送のために選択される前に順序正しく並べられる。この方法は、つねに最良のベクトルを検出する。ベクトル量子化器コードブックが1つの分割にあり、最良のベクトルの選択が単一の段階で実行される場合、検出されるベクトルは大局的に最適である。つまり、つねに、フレームに大局的に最小の誤差を提供する指数iが検出される。制限されたベクトル量子化器が使用されると、必ずしも大局的な最適は検出されない。しかしながら、本発明が分割または段階の中だけで使用されるとしても、性能は依然として向上する。分割VQになおさらに大局的な最適を検出するために、以下のアプローチが使用できる。
1）本発明による事前並べ替え方法を使用して第1の分割に最良のコードブック指数を検出する。および
2）同じようにして第2の分割、第3の分割などに最良のコードブック指数を別個に検出する。
【００５６】
しかしながら、分割ごとに最良の分割された量子化器指数を保存する代わりに、さらに最適な解を検出するためには、多くのさらに優れた指数を保存できる。したがって、保存された指数に基づく分割のためのすべての指数の組み合わせが試され、結果として生じる並べ替えられた量子化済みのLSFベクトル（qLF₁...qLSF_p）が生成され、SDⁱが計算される。最後に、コードブック指数の最良の組み合わせが選択される。
【００５７】
以下のように、多段式ベクトル量子化器のために、類似したアプローチが使用できる。多くの最良の第1段階量子化器が、いわゆるM最良検索（M-best search）で選択され、のちの段階はこれらの1番上に加えられる。各段階では、そのように所望される場合には、結果として生じるqLSFが並べ替えられ、SDⁱが計算される。再び、コードブック指数の最良の組み合わせが受信機に送信される。並べ替えは1つまたは複数の内部段階のために使用できる。その場合、デコーダは、正しく復号するために同じ段階で並べ替えを実行しなければならない（並べ替えがある段階は、設計段階のあいだに決定できる）。
分割ベクトル量子化器の場合、以下の手順を使用できる。
1）第1の分割のために、最適コードブック検索を実行する。
2）最後の係数の誤差を、通常行なわれるよりわずかに少なく重み付ける。
3）つぎの段階で使用するために多くのさらに優れた指数を記憶する。
4）分割の内側で誤差を計算する代わりに次の分割に移動し、第1の分割の値と（言うまでもなく配列後の）現在のベクトルのすべての組み合わせを含む誤差を計算する。
5）すべての分割が計算されるまで同じ手順を繰り返す。
この方法は、これまでの最良の検出値である量子化された値の選択を含むように連続的に試みる。新しい分割が加えられたのち、結果として生じるさらに長いベクトルが配列され、歪みに基づき、過去の分割の指数を決定できる。このようにして、分割上で配列する制限的な影響はいくぶん考慮に入れられる。最後の係数にさらに低く重み付けするのは、配列が実行されたのちに、最後の係数をのちの分割からの値で置換できることを意味する。
【００５８】
図5は、本発明の音声コーデック1を示すブロック図である。音声コーデック1は、エンコーダ4およびデコーダ6を備える。エンコーダ4は、入力音声信号を高域フィルタリングするための事前処理装置22を備える。事前処理された入力信号に基づき、線形予測係数（LPC）分析装置26がLPフィルタ係数の推定を実行するために使用される。LP係数はLPC量子化装置28によって量子化される。励起検索装置30は、やはり事前に処理された入力信号に基づいて、コードパラメータ、利得パラメータおよびピッチパラメータをデコーダ6に提供するために使用される。事前処理装置22、LPC分析装置26、LPC量子化装置28、および励起検索装置30およびそれらの機能は当該技術分野において知られている。本発明のエンコーダ4の特異な特徴は、LSFパラメータをデコーダ6に送信する前に、スペクトル歪み推定で使用するために量子化されたLSF係数を再配列するために使用される並べ替え機構20である。同様に、デコーダ6の中のLPC量子化装置40は、LPC補間装置44によるLPC補間の前に受信されたLSF係数を再配列するための並べ替え機構42を有する。LPC補間装置44、励起発生装置46、LPC合成装置48、および事後処理装置50も当該技術分野において知られている。
【００５９】
図6は、本発明の移動電話2を示す線図での説明である。図6に示されるように、移動電話は入力音声を受信し、該入力音声をエンコーダ4に伝達するためのマイクロフォン60を有する。エンコーダ4は、アンテナ80を介した伝送のために、コードパラメータ、利得パラメータ、ピッチパラメータおよびLSFパラメータ（図5）をビットストリーム82に変換する手段（図示されていない）を有する。移動電話2は、量子化されたベクトルを配列する並べ替え機構20を有する。
【００６０】
要約すると、本発明は、つねに安定した量子化されたLSFベクトルを提供するための方法および装置を提供する。本発明による該方法および装置は、ビット割り当てを変更するニーズを回避する一方で、スペクトル歪みという点でLSF量子化性能を改善する。該方法および装置は、予測および非予測分割（区分された）ベクトル量子化器と多段式ベクトル量子化器の両方に拡張できる。本発明の方法および装置は、高次LPCモデル（p＞10）が使用される場合にはLSFは互いにさらに近くなり、無効配列がさらに起こりやすくなるため、音声コーダの性能を改善する上でより効果的である。しかしながら、同じ方法および装置は、低位LPCモデル（p≦10）に基づく音声コーダで使用することもできる。
【００６１】
LSFにしたがって説明されるような量子化方法／装置は、LSP、ISF、ISPおよび他の類似したスペクトルパラメータまたはスペクトル表現などの線形予測係数の他の表現にも適用可能であることに注意する必要がある。
【００６２】
したがって、本発明はその好適な実施の形態に関して説明されてきたが、その形式および詳細における前記のおよび多様な変更、省略および逸脱が、本発明の精神および範囲を離れることなく加えられてよいことが当業者により理解されるであろう。
【図面の簡単な説明】
【００６３】
【図１ａ】従来の技術によるLSF量子化システムを示すブロック図である。
【図１ｂ】システム構成要素の配列が異なる従来の技術によるLSF量子化システムを示すブロック図である。
【図２ａ】ターゲットLSFベクトルおよび予測されたLSF値の周波数ドメイン内での分散を示す線図である。
【図２ｂ】ベクトル量子化器残留コードブックの第1コードブックエントリを示す線図である。
【図２ｃ】ターゲットLSFベクトルに比較される量子化されたLSF係数、および第1コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図２ｄ】量子化されたLSF係数および第2コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図２ｅ】量子化されたLSF係数および第3コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図２ｆ】量子化されたLSF係数および第4コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図２ｇ】量子化されたLSF係数および図2cに示されるものとは異なる第1のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図２ｈ】量子化されたLSF係数および図2dに示されるものとは異なる第2のエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図３】本発明のLSF量子化システムを示すブロック図である。
【図４ａ】本発明のLSF量子化システムによって再配列されたのちに、図2eに示されるように、量子化されたLSF係数および第3のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図４ｂ】本発明のLSF量子化システムによって再配列されたのちに、図2fに示されるように、量子化されたLSF係数および第4のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図５】本発明の音声符号化用にエンコーダおよびデコーダを備える音声コーデックを示すブロック図である。
【図６】本発明の移動無線通信網で使用するための移動局を示す線図である。

Claims

線形予測フィルタが周波数ドメインで複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づく複数の予測されたスペクトルパラメータ値、および前記複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルがスペクトル歪みを計算するために使用され、最適コードベクトルがスペクトル歪みに基づき選択される、音声コーダでスペクトルパラメータベクトルを量子化する方法であって、
それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得すること、
量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく配列し直すこと、および
配列し直された量子化済みのスペクトルパラメータ係数およびそれぞれの線スペクトル周波数係数からスペクトル歪みを獲得すること
を含むことを特徴とする音声コーダでスペクトルパラメータベクトルを量子化する方法。
前記スペクトル歪みが、配列し直されたスペクトルパラメータ係数のそれぞれとそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算される請求項１記載の方法。
前記誤差がスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けされる請求項２記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が単一分割で実行される請求項１記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行され、最適コードベクトルが各分割でのスペクトル歪みに基づいて選択される請求項１記載の方法。
前記スペクトルパラメータが線スペクトル周波数からなる請求項１記載の方法。
前記スペクトルパラメータが線スペクトルペアからなる請求項１記載の方法。
前記スペクトルパラメータがイミタンススペクトル周波数からなる請求項１記載の方法。
前記スペクトルパラメータがイミタンススペクトルペアからなる請求項１記載の方法。
前記再配列のステップが１つの段階で実行される請求項１記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階のうちの１つで実施され、当該１つの段階が事前に決定され、前記最適コードベクトルの選択が、前記１つの段階のスペクトル歪みに基づく請求項１記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階のうちの数個で実施され、当該数個の段階が事前に決定され、前記最適コードベクトルの選択が、前記数個の段階のスペクトル歪みに基づく請求項１記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階で実施され、当該複数の段階が事前に決定され、前記最適コードベクトルの選択が、前記複数の段階のスペクトル歪みに基づく請求項１記載の方法。
前記量子化されたスペクトルパラメータ係数の再配列が、事前に選択されたベクトルに基づく最適コードベクトルの選択のために事前に選択されたベクトルの量のための最適化段階として実行される請求項１記載の方法。
線形予測フィルタが周波数ドメインでの複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づいた複数の予測されたスペクトルパラメータ値、および複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルが、スペクトル歪みに基づき最適コードベクトルを選択できるようにするためのスペクトル歪みを推定するために使用される、音声コーダでスペクトルパラメータベクトルを量子化する装置であって、
量子化されたスペクトルパラメータ係数を示す一連の第１信号を提供するために、それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得する手段と、
再配列された量子化されたスペクトルパラメータ係数を示す一連の第２信号を提供するために、量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく再配列する、第１の信号に応える手段と、
再配列された量子化されたスペクトルパラメータ係数およびそれぞれのスペクトルパラメータ係数からスペクトル歪みを獲得する、第２の信号に応える手段
とを備えたことを特徴とする、音声コーダでスペクトルパラメータベクトルを量子化する装置。
前記スペクトル歪みが、配列し直されたスペクトルパラメータ係数のそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算され、前記スペクトル歪みを獲得する手段が、前記誤差をスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けする請求項１５記載の装置。
前記量子化されたスペクトルパラメータ係数の再配列が単一分割で実行される請求項１５記載の装置。
前記量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行され、最適コードベクトルが各分割でのスペクトル歪みに基づいて選択される請求項１５記載の装置。
ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第１伝送信号、およびスペクトル表現パラメータを示す第２伝送信号を含み、励起検索モジュールがコードパラメータ、利得パラメータおよびピッチパラメータを提供するために使用され、線形予測分析モジュールが周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、ビットストリームをデコーダに提供する音声エンコーダであって、
量子化されたスペクトル表現係数を示す一連の第１の信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルに基づいた複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第２の信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、第１の信号に応える手段と、
一連の第３の信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現係数からスペクトル歪みを獲得する、第２の信号に応える手段と、
スペクトル歪みに基づきスペクトル表現パラメータを表す複数の最適コードベクトルを選択し、最適コードベクトルを示す第２の伝送信号を提供する、第３の信号に応える手段と
を備えたことを特徴とする音声エンコーダ。
ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第１伝送信号と、スペクトル表現パラメータを示す第２伝送信号を含み、励起検索モジュールが事前処理された入力信号から第１伝送信号を提供するために使用され、線形予測モジュールが、事前処理された入力信号に基づき、周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、無線通信網内の少なくとも１つの基地局にビットストリームを提供するために、入力音声を受信し、事前処理することができる移動局であって、
量子化されたスペクトル表現係数を示す一連の第１信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルから複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第２信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、一連の第１信号に応える手段と、
スペクトル歪みを示す一連の第３信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現からスペクトル歪みを獲得する、一連の第２信号に応える手段と、
最適コードベクトルを示す第２伝送信号を提供するために、スペクトル歪みからスペクトル表現パラメータを表す複数の最適コードベクトルを選択する手段と
を備えたことを特徴とする移動局。