JP2004526213A - 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム - Google Patents
音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム Download PDFInfo
- Publication number
- JP2004526213A JP2004526213A JP2002590143A JP2002590143A JP2004526213A JP 2004526213 A JP2004526213 A JP 2004526213A JP 2002590143 A JP2002590143 A JP 2002590143A JP 2002590143 A JP2002590143 A JP 2002590143A JP 2004526213 A JP2004526213 A JP 2004526213A
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- coefficients
- quantized
- parameter
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 188
- 239000013598 vector Substances 0.000 title claims abstract description 121
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000013139 quantization Methods 0.000 title description 25
- 238000001228 spectrum Methods 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000005192 partition Methods 0.000 claims description 16
- 230000008707 rearrangement Effects 0.000 claims description 14
- 230000005284 excitation Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 16
- 230000001174 ascending effect Effects 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
過去に復号された出力値に基づく予測されたLSF値が、残差コードブックベクトルおよびLSF係数とともに、スペクトル歪みを評価するために使用される、音声コーダでLSFベクトルを量子化する方法および装置。この方法は、それぞれの予測されたLSF値および残差コードブックベクトルから複数の量子化されたLSF係数を獲得する工程、量子化されたLSF係数を周波数ドメイン内で規則正しく配列し直す工程、および配列し直された量子化済みのLSF係数およびそれぞれのLSF係数からスペクトル歪みを獲得する工程を含む。最適コードベクトルは、スペクトル歪みに基づき選択される。
Description
【技術分野】
【0001】
本発明は、一般的には音声信号およびオーディオ信号の符号化に関し、とくに線スペクトル周波数ドメインにおける線形予測係数(linear prediction coefficients)の量子化に関する。
【背景技術】
【0002】
音声およびオーディオの符号化アルゴリズムは、通信システム、マルチメディアシステム、および記憶システムにおいて多岐にわたる用途がある。符号化アルゴリズムの開発は、合成された信号の高い品質を維持しつつ、伝送および記憶の容量を節約するというニーズにより後押しされている。コーダの複雑さは、アプリケーションの実行環境(プラットホーム)の処理能力によって制限されている。音声記憶などのいくつかのアプリケーションでは、エンコーダはきわめて複雑であってもよいが、デコーダは可能な限り簡略でなければならない。
【0003】
典型的な音声コーダでは、入力音声信号はフレームと呼ばれるセグメントで処理される。通常、フレームの長さは10msから30msであり、つぎのフレームの5msから15msの予測セグメントも使用できる。フレームはさらに多くのサブフレームに分割されてよい。フレームごとに、エンコーダは入力信号のパラメータ表現を決定する。パラメータは量子化され、通信チャネルを通して送信されるか、またはデジタル形式で記憶媒体に記憶される。受信端では、デコーダが受信されたパラメータに基づき合成された信号を構築する。
【0004】
大部分の現在の音声コーダは、励起信号が発生する線形予測(LP)フィルタを含む。LPフィルタは、典型的には、以下の方程式により指定されるように全極型構造を有しており、
【0005】
【数1】
ここでA(z)は、量子化されていないLP係数a1、a2、...apを備える反転フィルタ(inverse filter)であり、pは予測値の次数であり、通常8から12である。
【0006】
入力音声信号はフレーム単位で処理される。音声フレームごとに、エンコーダは、たとえばレビンソン・ダービン・アルゴリズム(「AMR音声コーデック、トランス符号化関数(AMR Speech Codec; Transcoding functions)」3G TS 26.090 v3.1.0、1999年−12月を参照のこと)を使用して、LP係数を求める。結果として生じる安定したフィルタが次数ベクトルで表現される線スペクトルペア(LSP)、イミタンススペクトル周波数(ISF)およびイミタンススペクトルペア(ISP)などの線スペクトル周波数(LSF)表現または他の類似する表現は、それらが優れた量子化特性を有するため、係数の量子化に利用される。中間サブフレームの場合、係数は、LSF表現を使用して線形補間される。
【0007】
LSFを定義するためには、反転LPフィルタA(z)多項式が使用され、以下の2つの多項式を構築する。
P(z)=A(z)+z-(p+1)A(z-1),
=(1-z-1)κ(1-2z-1cosωi+z-2),i=2,4, ...,p (2)
および
Q(z)=A(z)-z-(p+1)A(z-1)
=(1-z-1)κ(1-2z-1cosωi+z-2),i=1,3, ...,p-1. (3)
多項式P(z)とQ(z)の累乗根がLSF係数と呼ばれる。これらの多項式のすべての累乗根は単位円ej ω iの上にあり、i=1,2,...pである。多項式P(z)とQ(z)は以下の特性を有する。1)多項式のすべてのゼロ(累乗根)が単位円の上にある、2)P(z)とQ(z)のゼロは互いに交互に組み合わされる。さらに具体的には、つねに以下の関係が満たされている。
0=ω0<ω1<ω2< ... <ωp-1<ωp<ωp+1=π (4)
【0008】
この昇順の順序は、多くの場合音声符号化の用途で必要とされるフィルタの安定性を保証する。最初のパラメータと最後のパラメータがそれぞれつねに0とπであり、p値だけが送信されなければならないことに注意する必要がある。
【0009】
音声コーダではLSF情報を記憶するために効率的な表現が必要とされる一方、LSFは、多くの場合予測(図1を参照すること)ともにベクトル量子化(VQ)を使用して量子化される。通常、予測される値は、過去に復号された出力値(AR(自己回帰)−予測値)または過去に量子化された値(MA(移動平均)−予測値)に基づいて推定される。
【0010】
【数2】
この場合、AjとBjは予測値行列であり、mとnは予測子の次数である。pLSFk、qLSFkおよびCBkは、それぞれフレームkの予測LSF、量子化LSFおよびコードブックベクトルである。mLSFは平均LSFベクトルである。
【0011】
予測値が計算されたのち、量子化されたLSF値を得ることができ、
【0012】
【数3】
この場合、CBkはフレームkの最適コードブックエントリである。
【0013】
実際には、予測量子化または制限されたVQを使用するとき、結果として生じるqLSFkの安定性は、LP係数への変換前にチェックしなければならない。直接VQ(非予測、単一段階、未分割)の場合にだけ、コードブックは、結果として生じる量子化されたベクトルがつねに順序正しくなるように設計できる。
【0014】
従来の技術による解決策ではフィルタの安定性は、量子化とコードブック選択ののち、LSFベクトルを並べることによって保証される。
【0015】
最良のコードブックベクトルを検索する一方で、多くの場合すべてのベクトルが試され(完全検索)、いくつかの知覚的に重要な優秀性の指標がすべてのケースについて計算される。一般的に使用される検索手順のブロック図は図1aに示される。
【0016】
最適には、選択は以下のようにスペクトル歪みSDiにづく。
【0017】
【数4】
この場合
[外1]
は、それぞれ量子化が行なわれた、および量子化が行なわれなかった音声フレームのスペクトルである。これは計算上非常に大がかりであるため、さらに簡略な方法が代わりに使用される。
【0018】
一般的に使用される方法は、LSF誤差(rLSFi k)を重み(Wk)で重み付けることである。たとえば、以下の重みが使用され(「AMR音声コーデック;コード変換関数)(AMR Speech Codec; Transcoding functions)」3G TS 26.090 v3.1.0、1999年−12月を参照のこと)。
【0019】
【数5】
この場合、dk=LSFk+1-LSFk-1であり、LSF0=0Hz、およびLSF11=4000Hzである。
【0020】
基本的には、この歪み測定はLSF周波数間の距離に依存する。LSFが互いに近いほど、それらはより大きな重みを獲得する。知覚的には、これは、フォルマント領域がより正確に量子化されることを意味する。
【0021】
歪み値に基づき、最小の値を示すコードブックベクトルが最良のコードブック指数として選択される。通常、基準は以下のとおりである。
【0022】
【数6】
図1aより分かるように、ターゲットLSF係数LSFkとそれぞれの予測されたLSF係数pLSFkの差異は、最初に加算装置12で求められ、該差異はさらに別の加算装置14の中のj番目のコードブックエントリのそれぞれの残留コードブックベクトルCBj 1kで調整される。式9は、以下に変形することができ、
【0023】
【数7】
さらに以下に変形できる。
【0024】
【数8】
式10と11に示される変形の工程は、図1bに示されるようにエンコーダでさらに容易に視覚化できる。図1bに示されるように、加算装置16は、量子化されたLSF係数を計算するために使用される。それ以後、LSF誤差は量子化されたLSF係数とターゲットLSF係数から加算装置18によって計算される。
【0025】
量子化されたLSF係数qLSFi kがkに関して昇順ではない場合、従来技術の解法は必ずしも最適コードブック指数を検出しない。図2aから図2eはこのような問題を説明している。簡略化のために、最初の3つのLSF係数だけが図示されている(k=1,2,3)。しかしながら、この簡略化された表現は、分割VQの場合のやや通常の最初の分割を適切に表わしている。ターゲットLSFベクトルはLSF1...LSF3と記され、過去のフレームのLSFに基づく予測値も示されている(pLSF1...pLSF3)。図2aに示されるように、いくつかの予測値はそれぞれのターゲットベクトルより大きいが、いくつかは小さい。ベクトル量子化器残差コードブックの中の最初のコードブックエントリは、図2bに示されるように、コードブックベクトルのように見える可能性がある。qLSF1 1-3=pLSF1-3+CB1 1-3にしたがって、量子化されたLSF係数が計算され、図2cに示される。簡略のため、重みは使用されない、つまりWk=1であり、スペクトル歪みはターゲット値と量子化値(量子化済みのLSF係数)間の二乗された距離または絶対距離に正比例している。ターゲット値と量子化値のあいだの距離はrLSFi kである。したがって、第1の分割の総歪みは、
【0026】
【数9】
である。第2のコードブックエントリ(図示されていない)は、図2dに示されるように量子化されたLSFベクトル(qLSF2 1-3)およびスペクトル歪み(SD2 1-3)を生じるであろう。図2dが図2cと比較されるとき、結果として生じるqLSFベクトルはきわめて異なるが、総歪みは略同じである、つまり(SD1≒SD2)である。最初の2つのコードブックエントリを用いると、結果として生じる量子化されたLSF係数は順序正しくなる。
【0027】
従来技術による量子化方法にまつわる問題を示すために、図2eに示されるように、第3のコードブックエントリ(図示されていない)から生じた量子化されたLSF係数(qLSF3 1-3)および対応するスペクトル歪み(SD3 1-3)が分散されると仮定される。図2eに示されるように、スペクトル歪みに従った総歪み(SD3=ΣSD3 k、kは1から3まで)は非常に大きな値である。つまり、従来技術の方法によれば、この第1分割からの最良のコードブック指数はSD1とSD2の小さい方である。しかしながら、この選択された「最良の」コードブック指数は、のちに図4aに示されるように、最適コードベクトルを生じない。これは、結果として生じる量子化されたLSFベクトルが第3コードブックエントリに関して順序が狂っているためである。
【0028】
一般的には、音声コーダは、そこで使用される線形予測(LP)フィルタが安定していることを必要とする。図1aに示されるもののような従来技術によるコードブック検索ルーチンは、結果として生じる量子化済みのLSFベクトルの順序を狂わせ、不安定にする。従来技術では、ベクトルの安定化は量子化後のLSFベクトルの並べ替えにより達成される。ただし、獲得されるベクトルが最適ではない可能性がある。
【0029】
線形予測係数を表す線スペクトルペア(LSP)ベクトル、イミタンススペクトル周波数(ISF)ベクトルおよびイミタンススペクトルペア(ISP)ベクトルなどのスペクトル(ペア)パラメータベクトルも安定となるように並べられなければならないことに注意する必要がある。
【0030】
獲得されたコードベクトルが最適化されている、スペクトルパラメータ(または表現)量子化のための方法およびシステムを提供することは、有利でありかつ望ましい。
【0031】
[発明の要約]
元のビットの割り当てを維持する一方で、最適化されたコードベクトルがスペクトル歪みに関してスペクトルパラメータ量子化性能を改善するために選択される、スペクトルパラメータ量子化のための方法および装置を提供することが本発明の第1の目的である。この目的は、コードベクトルがスペクトル歪みに基づいて選択される前に周波数ドメインで規則正しく量子化済みのスペクトルパラメータベクトルを配列し直すことによって達成できる。
【0032】
このようにして、本発明の第1の態様によれば、線形予測フィルタが周波数ドメインで複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づく複数の予測されたスペクトルパラメータ値、および前記複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルがスペクトル歪みを計算するために使用され、最適コードベクトルがスペクトル歪みに基づき選択される、音声コーダでスペクトルパラメータベクトルを量子化する方法が提供される。該方法は、
それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得すること、
量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく配列し直すこと、および
配列し直された量子化済みのスペクトルパラメータ係数およびそれぞれの線スペクトル周波数係数からスペクトル歪みを獲得すること
を含むことを特徴としている。
【0033】
好ましくは、スペクトル歪みは、配列し直されたスペクトルパラメータ係数のそれぞれとそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算され、該誤差はスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けされる。
【0034】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が単一分割で実行されるときに適用可能である。
【0035】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行されるときにも適用可能である。その場合、最適コードベクトルは各分割でのスペクトル歪みに基づいて選択される。
【0036】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、多段式量子化の場合に1つの段階または複数の段階で実施されるときにも適用可能である。その場合、最適コードベクトルは各段階のスペクトル歪みに基づいて選択される。各段階は並べ替えるか、または並べ替えない場合がある。どの段階が並べ替えられるのか、およびどの段階が並び替えられないのか、という選択がが事前に決定されていることが好ましい。それ以外の場合、並べ替え情報は副情報として受信機に送信されなければならない。
【0037】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、事前に選択されたすべてのベクトルに対する最適化段階として実行されるときに適用可能である。用意されたベクトルが並べ替えられ、最終的な指数の選択は開示された方法を使用して当該事前に選択されたベクトルの集合から行なわれる。
【0038】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、最適化段階として実行され、(段階または分割のための)コードブックに対する初期指数が再配列なしに選択され、最終的な選択が、開示された並べ替え方法を用いて最良の事前に選択されたベクトルの選択だけに基づき実行される場合に適用可能である。
【0039】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【0040】
本発明の第2の態様によれば、音声コーダでスペクトルパラメータベクトルを量子化する装置が提供され、線形予測フィルタは周波数ドメインでの複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づいた複数の予測されたスペクトルパラメータ値、および複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルは、スペクトル歪みに基づき最適コードベクトルを選択できるようにするためのスペクトル歪みを推定するために使用される。該装置は、
量子化されたスペクトルパラメータ係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得する手段と、
再配列された量子化されたスペクトルパラメータ係数を示す一連の第2信号を提供するために、量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
再配列された量子化されたスペクトルパラメータ係数およびそれぞれのスペクトルパラメータ係数からスペクトル歪みを獲得する、第2の信号に応える手段と
を備えたことを特徴としている。
【0041】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【0042】
本発明の第3の態様によれば、ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号、およびスペクトル表現パラメータを示す第2伝送信号を含み、励起検索モジュールがコードパラメータ、利得パラメータおよびピッチパラメータを提供するために使用され、線形予測分析モジュールが周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、ビットストリームをデコーダに提供する音声エンコーダが提供される。該エンコーダは、
量子化されたスペクトル表現係数を示す一連の第1の信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルに基づいた複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2の信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
一連の第3の信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現係数からスペクトル歪みを獲得する、第2の信号に応える手段と、
スペクトル歪みに基づきスペクトル表現パラメータを表す複数の最適コードベクトルを選択し、最適コードベクトルを示す第2の伝送信号を提供する、第3の信号に応える手段と
を備えたことを特徴としている。
【0043】
本発明の第4の態様によれば、該ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号と、スペクトル表現パラメータを示す第2伝送信号を含み、励起検索モードが事前処理された入力信号から第1伝送信号を提供するために使用され、線形予測モジュールが、事前処理された入力信号に基づき、周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、無線通信網内の少なくとも1つの基地局にビットストリームを提供するために、入力音声を受信し、事前処理することができる移動局が提供される。該移動局は、
量子化されたスペクトル表現係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルから複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、一連の第1信号に応える手段と、
一連の第3信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現からスペクトル歪みを獲得する、一連の第2信号に応える手段と、
第2伝送信号を提供するために、スペクトル歪みからスペクトル表現パラメータを表す複数の最適コードベクトルを選択する手段と
を備えたことを特徴としている。
【0044】
本発明は、図3〜6に関連してなされる説明を読むと明らかになるであろう。
【発明を実施するための最良の形態】
【0045】
スペクトル(ペア)パラメータベクトルは、安定したスペクトル(ぺア)ベクトルがつねに正しい順序に並べられるように線形予測係数を表現するベクトルである。このような表現は線スペクトル周波数(LSF)、線スペクトルペア(LSP)、イミタンススペクトル周波数(ISF)、イミタンススペクトルペア(ISP)などを含む。簡略化のために、本発明はLSF表現に関して説明される。
【0046】
本発明のLSF量子化システム40が図3に示されている。図1aに示されるようなシステム構成要素に加えて、加算装置16と加算装置18のあいだに並べ替え機構20が具現化されている。該並べ替え機構20は、量子化されたLSF係数qLSFi kが周波数に関して昇順で配置されるようにそれらを再配列するために使用される。たとえば、図2aと図2bに示されるような量子化されたLSF係数qLSF1 kとqLSF2 kは、すでに昇順、つまりqLSFi 1<qLSFi 2<qLSFi 3であり、並べ替え機能20の機能はこれらの量子化されたLSF係数の配置に影響をおよぼさない。この場合、量子化されたLSFベクトルqLSFiは、適切な順序であると言われる。しかしながら、図2eに示されるように、量子化されたLSFベクトルqLSF3は、qLF3 1<qLSF3 3<qLSF3 2であるため順序が狂っている。配列されたのち、量子化されたLSF係数は、図4aに示されるように昇順で分散される。
【0047】
ベクトル配列後、総スペクトル歪みSD3(図4a)はSD1またはSD2のどちらかより小さい。したがって、選択される最初の3つのフレームを含む第1分割からの最良のコードブック指数はi=3である。復号されたコードブック(1 3 2)の正しい順序も、並べ替えのためにデコーダ内で自動的に検出され、特別な情報は必要とされない。
【0048】
並べ替え機構20によって実行されるような並べ替え関数は以下のように表現できる。
【0049】
【数10】
式13は、さらに、以下に変形でき、
【0050】
【数11】
ここではs(k)は、現在のk番目のLSF成分の正しい配列を与える並べかえ関数であり、その結果すべてのLSFi kはSDiの計算の前に昇順となる。本発明によれば、無効に配列されたLSFベクトルを生じさせる可能性がある残差ベクトルを比較する代わりに、スペクトル歪み値は量子化されたベクトルが順序正しく並べられたのちに計算される。
【0051】
従来技術の検索方法を使用して、昇順で配列されていない量子化されたLSF係数から最小のスペクトル歪みSDiを獲得することが可能な場合もあることに注意する必要がある。たとえば第1のコードブックエントリと第2のコードブックエントリは、図2fと図2gに示されるように、量子化されたLSF係数の2つの異なる集合qLSF1 kとqLSF2 kを生じさせるが、第3の量子化されたLSF係数qLSF3 kは図2eに示されるものと同じである。その場合、量子化されたLSF係数qLSF3 kは昇順ではないが、最小のスペクトル歪みは第3のコードブックエントリから生じる。このようにして、最小の総スペクトル歪みに基づいて選択された量子化されたLSFベクトルは不安定である。従来技術によるコーダでは、不安定な量子化されたLSFベクトルは、コードブック選択後に量子化されたLSF係数を並べ替えることによって安定化できる。この特定の場合には、従来技術による音声コーデックおよび本発明による音声コーデックの結果は同じである。
【0052】
一般的に、やはり誤った順序である別の量子化されたベクトルがある可能性があるため、従来技術による方法に従った結果は最適ではない可能性がある。たとえば、第4のコードブック入力が、図2hに示されるように量子化されたLSF係数qLSF4 kの集合を生じさせる場合、この量子化されたLSFベクトルは図2e、図2f、図2gおよび図2hに示されるように、量子化されたベクトルのあいだで最大のスペクトル歪みを有する。従来技術によるコードブック検索ルーチンを用いると、最小の総スペクトル歪みは第3のコードブックエントリ(図2g)から生じる。
【0053】
本発明のLSF量子化方法によれば、図2eと図2hの量子化されたLSF係数は、並べ替え機構20によって再配列される。図2hに示されるように量子化されたLSF係数qLSF4 kが、量子化されたLSF係数を昇順にするために再配列されたのち、結果は図4bに示される。図2f、図2g、および図4aに示されるように、量子化されたLSFベクトルに比べて、図4bに示されるような量子化されたLSFベクトルは最小の総スペクトル歪みを有する。
【0054】
前記の例は、従来技術によるコードブック検索ルーチンに従った(LSFベクトルを並べ替えることによる)量子化後のベクトルの安定化が、スペクトル歪みという点で必ずしも最良のベクトルを生じさせないことを示した。
【0055】
本発明のLSF量子化方法を用いると、LSFベクトルは、それらが伝送のために選択される前に順序正しく並べられる。この方法は、つねに最良のベクトルを検出する。ベクトル量子化器コードブックが1つの分割にあり、最良のベクトルの選択が単一の段階で実行される場合、検出されるベクトルは大局的に最適である。つまり、つねに、フレームに大局的に最小の誤差を提供する指数iが検出される。制限されたベクトル量子化器が使用されると、必ずしも大局的な最適は検出されない。しかしながら、本発明が分割または段階の中だけで使用されるとしても、性能は依然として向上する。分割VQになおさらに大局的な最適を検出するために、以下のアプローチが使用できる。
1)本発明による事前並べ替え方法を使用して第1の分割に最良のコードブック指数を検出する。および
2)同じようにして第2の分割、第3の分割などに最良のコードブック指数を別個に検出する。
【0056】
しかしながら、分割ごとに最良の分割された量子化器指数を保存する代わりに、さらに最適な解を検出するためには、多くのさらに優れた指数を保存できる。したがって、保存された指数に基づく分割のためのすべての指数の組み合わせが試され、結果として生じる並べ替えられた量子化済みのLSFベクトル(qLF1...qLSFp)が生成され、SDiが計算される。最後に、コードブック指数の最良の組み合わせが選択される。
【0057】
以下のように、多段式ベクトル量子化器のために、類似したアプローチが使用できる。多くの最良の第1段階量子化器が、いわゆるM最良検索(M-best search)で選択され、のちの段階はこれらの1番上に加えられる。各段階では、そのように所望される場合には、結果として生じるqLSFが並べ替えられ、SDiが計算される。再び、コードブック指数の最良の組み合わせが受信機に送信される。並べ替えは1つまたは複数の内部段階のために使用できる。その場合、デコーダは、正しく復号するために同じ段階で並べ替えを実行しなければならない(並べ替えがある段階は、設計段階のあいだに決定できる)。
分割ベクトル量子化器の場合、以下の手順を使用できる。
1)第1の分割のために、最適コードブック検索を実行する。
2)最後の係数の誤差を、通常行なわれるよりわずかに少なく重み付ける。
3)つぎの段階で使用するために多くのさらに優れた指数を記憶する。
4)分割の内側で誤差を計算する代わりに次の分割に移動し、第1の分割の値と(言うまでもなく配列後の)現在のベクトルのすべての組み合わせを含む誤差を計算する。
5)すべての分割が計算されるまで同じ手順を繰り返す。
この方法は、これまでの最良の検出値である量子化された値の選択を含むように連続的に試みる。新しい分割が加えられたのち、結果として生じるさらに長いベクトルが配列され、歪みに基づき、過去の分割の指数を決定できる。このようにして、分割上で配列する制限的な影響はいくぶん考慮に入れられる。最後の係数にさらに低く重み付けするのは、配列が実行されたのちに、最後の係数をのちの分割からの値で置換できることを意味する。
【0058】
図5は、本発明の音声コーデック1を示すブロック図である。音声コーデック1は、エンコーダ4およびデコーダ6を備える。エンコーダ4は、入力音声信号を高域フィルタリングするための事前処理装置22を備える。事前処理された入力信号に基づき、線形予測係数(LPC)分析装置26がLPフィルタ係数の推定を実行するために使用される。LP係数はLPC量子化装置28によって量子化される。励起検索装置30は、やはり事前に処理された入力信号に基づいて、コードパラメータ、利得パラメータおよびピッチパラメータをデコーダ6に提供するために使用される。事前処理装置22、LPC分析装置26、LPC量子化装置28、および励起検索装置30およびそれらの機能は当該技術分野において知られている。本発明のエンコーダ4の特異な特徴は、LSFパラメータをデコーダ6に送信する前に、スペクトル歪み推定で使用するために量子化されたLSF係数を再配列するために使用される並べ替え機構20である。同様に、デコーダ6の中のLPC量子化装置40は、LPC補間装置44によるLPC補間の前に受信されたLSF係数を再配列するための並べ替え機構42を有する。LPC補間装置44、励起発生装置46、LPC合成装置48、および事後処理装置50も当該技術分野において知られている。
【0059】
図6は、本発明の移動電話2を示す線図での説明である。図6に示されるように、移動電話は入力音声を受信し、該入力音声をエンコーダ4に伝達するためのマイクロフォン60を有する。エンコーダ4は、アンテナ80を介した伝送のために、コードパラメータ、利得パラメータ、ピッチパラメータおよびLSFパラメータ(図5)をビットストリーム82に変換する手段(図示されていない)を有する。移動電話2は、量子化されたベクトルを配列する並べ替え機構20を有する。
【0060】
要約すると、本発明は、つねに安定した量子化されたLSFベクトルを提供するための方法および装置を提供する。本発明による該方法および装置は、ビット割り当てを変更するニーズを回避する一方で、スペクトル歪みという点でLSF量子化性能を改善する。該方法および装置は、予測および非予測分割(区分された)ベクトル量子化器と多段式ベクトル量子化器の両方に拡張できる。本発明の方法および装置は、高次LPCモデル(p>10)が使用される場合にはLSFは互いにさらに近くなり、無効配列がさらに起こりやすくなるため、音声コーダの性能を改善する上でより効果的である。しかしながら、同じ方法および装置は、低位LPCモデル(p≦10)に基づく音声コーダで使用することもできる。
【0061】
LSFにしたがって説明されるような量子化方法/装置は、LSP、ISF、ISPおよび他の類似したスペクトルパラメータまたはスペクトル表現などの線形予測係数の他の表現にも適用可能であることに注意する必要がある。
【0062】
したがって、本発明はその好適な実施の形態に関して説明されてきたが、その形式および詳細における前記のおよび多様な変更、省略および逸脱が、本発明の精神および範囲を離れることなく加えられてよいことが当業者により理解されるであろう。
【図面の簡単な説明】
【0063】
【図1a】従来の技術によるLSF量子化システムを示すブロック図である。
【図1b】システム構成要素の配列が異なる従来の技術によるLSF量子化システムを示すブロック図である。
【図2a】ターゲットLSFベクトルおよび予測されたLSF値の周波数ドメイン内での分散を示す線図である。
【図2b】ベクトル量子化器残留コードブックの第1コードブックエントリを示す線図である。
【図2c】ターゲットLSFベクトルに比較される量子化されたLSF係数、および第1コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2d】量子化されたLSF係数および第2コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2e】量子化されたLSF係数および第3コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2f】量子化されたLSF係数および第4コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2g】量子化されたLSF係数および図2cに示されるものとは異なる第1のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2h】量子化されたLSF係数および図2dに示されるものとは異なる第2のエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図3】本発明のLSF量子化システムを示すブロック図である。
【図4a】本発明のLSF量子化システムによって再配列されたのちに、図2eに示されるように、量子化されたLSF係数および第3のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図4b】本発明のLSF量子化システムによって再配列されたのちに、図2fに示されるように、量子化されたLSF係数および第4のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図5】本発明の音声符号化用にエンコーダおよびデコーダを備える音声コーデックを示すブロック図である。
【図6】本発明の移動無線通信網で使用するための移動局を示す線図である。
【0001】
本発明は、一般的には音声信号およびオーディオ信号の符号化に関し、とくに線スペクトル周波数ドメインにおける線形予測係数(linear prediction coefficients)の量子化に関する。
【背景技術】
【0002】
音声およびオーディオの符号化アルゴリズムは、通信システム、マルチメディアシステム、および記憶システムにおいて多岐にわたる用途がある。符号化アルゴリズムの開発は、合成された信号の高い品質を維持しつつ、伝送および記憶の容量を節約するというニーズにより後押しされている。コーダの複雑さは、アプリケーションの実行環境(プラットホーム)の処理能力によって制限されている。音声記憶などのいくつかのアプリケーションでは、エンコーダはきわめて複雑であってもよいが、デコーダは可能な限り簡略でなければならない。
【0003】
典型的な音声コーダでは、入力音声信号はフレームと呼ばれるセグメントで処理される。通常、フレームの長さは10msから30msであり、つぎのフレームの5msから15msの予測セグメントも使用できる。フレームはさらに多くのサブフレームに分割されてよい。フレームごとに、エンコーダは入力信号のパラメータ表現を決定する。パラメータは量子化され、通信チャネルを通して送信されるか、またはデジタル形式で記憶媒体に記憶される。受信端では、デコーダが受信されたパラメータに基づき合成された信号を構築する。
【0004】
大部分の現在の音声コーダは、励起信号が発生する線形予測(LP)フィルタを含む。LPフィルタは、典型的には、以下の方程式により指定されるように全極型構造を有しており、
【0005】
【数1】
ここでA(z)は、量子化されていないLP係数a1、a2、...apを備える反転フィルタ(inverse filter)であり、pは予測値の次数であり、通常8から12である。
【0006】
入力音声信号はフレーム単位で処理される。音声フレームごとに、エンコーダは、たとえばレビンソン・ダービン・アルゴリズム(「AMR音声コーデック、トランス符号化関数(AMR Speech Codec; Transcoding functions)」3G TS 26.090 v3.1.0、1999年−12月を参照のこと)を使用して、LP係数を求める。結果として生じる安定したフィルタが次数ベクトルで表現される線スペクトルペア(LSP)、イミタンススペクトル周波数(ISF)およびイミタンススペクトルペア(ISP)などの線スペクトル周波数(LSF)表現または他の類似する表現は、それらが優れた量子化特性を有するため、係数の量子化に利用される。中間サブフレームの場合、係数は、LSF表現を使用して線形補間される。
【0007】
LSFを定義するためには、反転LPフィルタA(z)多項式が使用され、以下の2つの多項式を構築する。
P(z)=A(z)+z-(p+1)A(z-1),
=(1-z-1)κ(1-2z-1cosωi+z-2),i=2,4, ...,p (2)
および
Q(z)=A(z)-z-(p+1)A(z-1)
=(1-z-1)κ(1-2z-1cosωi+z-2),i=1,3, ...,p-1. (3)
多項式P(z)とQ(z)の累乗根がLSF係数と呼ばれる。これらの多項式のすべての累乗根は単位円ej ω iの上にあり、i=1,2,...pである。多項式P(z)とQ(z)は以下の特性を有する。1)多項式のすべてのゼロ(累乗根)が単位円の上にある、2)P(z)とQ(z)のゼロは互いに交互に組み合わされる。さらに具体的には、つねに以下の関係が満たされている。
0=ω0<ω1<ω2< ... <ωp-1<ωp<ωp+1=π (4)
【0008】
この昇順の順序は、多くの場合音声符号化の用途で必要とされるフィルタの安定性を保証する。最初のパラメータと最後のパラメータがそれぞれつねに0とπであり、p値だけが送信されなければならないことに注意する必要がある。
【0009】
音声コーダではLSF情報を記憶するために効率的な表現が必要とされる一方、LSFは、多くの場合予測(図1を参照すること)ともにベクトル量子化(VQ)を使用して量子化される。通常、予測される値は、過去に復号された出力値(AR(自己回帰)−予測値)または過去に量子化された値(MA(移動平均)−予測値)に基づいて推定される。
【0010】
【数2】
この場合、AjとBjは予測値行列であり、mとnは予測子の次数である。pLSFk、qLSFkおよびCBkは、それぞれフレームkの予測LSF、量子化LSFおよびコードブックベクトルである。mLSFは平均LSFベクトルである。
【0011】
予測値が計算されたのち、量子化されたLSF値を得ることができ、
【0012】
【数3】
この場合、CBkはフレームkの最適コードブックエントリである。
【0013】
実際には、予測量子化または制限されたVQを使用するとき、結果として生じるqLSFkの安定性は、LP係数への変換前にチェックしなければならない。直接VQ(非予測、単一段階、未分割)の場合にだけ、コードブックは、結果として生じる量子化されたベクトルがつねに順序正しくなるように設計できる。
【0014】
従来の技術による解決策ではフィルタの安定性は、量子化とコードブック選択ののち、LSFベクトルを並べることによって保証される。
【0015】
最良のコードブックベクトルを検索する一方で、多くの場合すべてのベクトルが試され(完全検索)、いくつかの知覚的に重要な優秀性の指標がすべてのケースについて計算される。一般的に使用される検索手順のブロック図は図1aに示される。
【0016】
最適には、選択は以下のようにスペクトル歪みSDiにづく。
【0017】
【数4】
この場合
[外1]
は、それぞれ量子化が行なわれた、および量子化が行なわれなかった音声フレームのスペクトルである。これは計算上非常に大がかりであるため、さらに簡略な方法が代わりに使用される。
【0018】
一般的に使用される方法は、LSF誤差(rLSFi k)を重み(Wk)で重み付けることである。たとえば、以下の重みが使用され(「AMR音声コーデック;コード変換関数)(AMR Speech Codec; Transcoding functions)」3G TS 26.090 v3.1.0、1999年−12月を参照のこと)。
【0019】
【数5】
この場合、dk=LSFk+1-LSFk-1であり、LSF0=0Hz、およびLSF11=4000Hzである。
【0020】
基本的には、この歪み測定はLSF周波数間の距離に依存する。LSFが互いに近いほど、それらはより大きな重みを獲得する。知覚的には、これは、フォルマント領域がより正確に量子化されることを意味する。
【0021】
歪み値に基づき、最小の値を示すコードブックベクトルが最良のコードブック指数として選択される。通常、基準は以下のとおりである。
【0022】
【数6】
図1aより分かるように、ターゲットLSF係数LSFkとそれぞれの予測されたLSF係数pLSFkの差異は、最初に加算装置12で求められ、該差異はさらに別の加算装置14の中のj番目のコードブックエントリのそれぞれの残留コードブックベクトルCBj 1kで調整される。式9は、以下に変形することができ、
【0023】
【数7】
さらに以下に変形できる。
【0024】
【数8】
式10と11に示される変形の工程は、図1bに示されるようにエンコーダでさらに容易に視覚化できる。図1bに示されるように、加算装置16は、量子化されたLSF係数を計算するために使用される。それ以後、LSF誤差は量子化されたLSF係数とターゲットLSF係数から加算装置18によって計算される。
【0025】
量子化されたLSF係数qLSFi kがkに関して昇順ではない場合、従来技術の解法は必ずしも最適コードブック指数を検出しない。図2aから図2eはこのような問題を説明している。簡略化のために、最初の3つのLSF係数だけが図示されている(k=1,2,3)。しかしながら、この簡略化された表現は、分割VQの場合のやや通常の最初の分割を適切に表わしている。ターゲットLSFベクトルはLSF1...LSF3と記され、過去のフレームのLSFに基づく予測値も示されている(pLSF1...pLSF3)。図2aに示されるように、いくつかの予測値はそれぞれのターゲットベクトルより大きいが、いくつかは小さい。ベクトル量子化器残差コードブックの中の最初のコードブックエントリは、図2bに示されるように、コードブックベクトルのように見える可能性がある。qLSF1 1-3=pLSF1-3+CB1 1-3にしたがって、量子化されたLSF係数が計算され、図2cに示される。簡略のため、重みは使用されない、つまりWk=1であり、スペクトル歪みはターゲット値と量子化値(量子化済みのLSF係数)間の二乗された距離または絶対距離に正比例している。ターゲット値と量子化値のあいだの距離はrLSFi kである。したがって、第1の分割の総歪みは、
【0026】
【数9】
である。第2のコードブックエントリ(図示されていない)は、図2dに示されるように量子化されたLSFベクトル(qLSF2 1-3)およびスペクトル歪み(SD2 1-3)を生じるであろう。図2dが図2cと比較されるとき、結果として生じるqLSFベクトルはきわめて異なるが、総歪みは略同じである、つまり(SD1≒SD2)である。最初の2つのコードブックエントリを用いると、結果として生じる量子化されたLSF係数は順序正しくなる。
【0027】
従来技術による量子化方法にまつわる問題を示すために、図2eに示されるように、第3のコードブックエントリ(図示されていない)から生じた量子化されたLSF係数(qLSF3 1-3)および対応するスペクトル歪み(SD3 1-3)が分散されると仮定される。図2eに示されるように、スペクトル歪みに従った総歪み(SD3=ΣSD3 k、kは1から3まで)は非常に大きな値である。つまり、従来技術の方法によれば、この第1分割からの最良のコードブック指数はSD1とSD2の小さい方である。しかしながら、この選択された「最良の」コードブック指数は、のちに図4aに示されるように、最適コードベクトルを生じない。これは、結果として生じる量子化されたLSFベクトルが第3コードブックエントリに関して順序が狂っているためである。
【0028】
一般的には、音声コーダは、そこで使用される線形予測(LP)フィルタが安定していることを必要とする。図1aに示されるもののような従来技術によるコードブック検索ルーチンは、結果として生じる量子化済みのLSFベクトルの順序を狂わせ、不安定にする。従来技術では、ベクトルの安定化は量子化後のLSFベクトルの並べ替えにより達成される。ただし、獲得されるベクトルが最適ではない可能性がある。
【0029】
線形予測係数を表す線スペクトルペア(LSP)ベクトル、イミタンススペクトル周波数(ISF)ベクトルおよびイミタンススペクトルペア(ISP)ベクトルなどのスペクトル(ペア)パラメータベクトルも安定となるように並べられなければならないことに注意する必要がある。
【0030】
獲得されたコードベクトルが最適化されている、スペクトルパラメータ(または表現)量子化のための方法およびシステムを提供することは、有利でありかつ望ましい。
【0031】
[発明の要約]
元のビットの割り当てを維持する一方で、最適化されたコードベクトルがスペクトル歪みに関してスペクトルパラメータ量子化性能を改善するために選択される、スペクトルパラメータ量子化のための方法および装置を提供することが本発明の第1の目的である。この目的は、コードベクトルがスペクトル歪みに基づいて選択される前に周波数ドメインで規則正しく量子化済みのスペクトルパラメータベクトルを配列し直すことによって達成できる。
【0032】
このようにして、本発明の第1の態様によれば、線形予測フィルタが周波数ドメインで複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づく複数の予測されたスペクトルパラメータ値、および前記複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルがスペクトル歪みを計算するために使用され、最適コードベクトルがスペクトル歪みに基づき選択される、音声コーダでスペクトルパラメータベクトルを量子化する方法が提供される。該方法は、
それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得すること、
量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく配列し直すこと、および
配列し直された量子化済みのスペクトルパラメータ係数およびそれぞれの線スペクトル周波数係数からスペクトル歪みを獲得すること
を含むことを特徴としている。
【0033】
好ましくは、スペクトル歪みは、配列し直されたスペクトルパラメータ係数のそれぞれとそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算され、該誤差はスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けされる。
【0034】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が単一分割で実行されるときに適用可能である。
【0035】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行されるときにも適用可能である。その場合、最適コードベクトルは各分割でのスペクトル歪みに基づいて選択される。
【0036】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、多段式量子化の場合に1つの段階または複数の段階で実施されるときにも適用可能である。その場合、最適コードベクトルは各段階のスペクトル歪みに基づいて選択される。各段階は並べ替えるか、または並べ替えない場合がある。どの段階が並べ替えられるのか、およびどの段階が並び替えられないのか、という選択がが事前に決定されていることが好ましい。それ以外の場合、並べ替え情報は副情報として受信機に送信されなければならない。
【0037】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、事前に選択されたすべてのベクトルに対する最適化段階として実行されるときに適用可能である。用意されたベクトルが並べ替えられ、最終的な指数の選択は開示された方法を使用して当該事前に選択されたベクトルの集合から行なわれる。
【0038】
本発明の方法は、量子化されたスペクトルパラメータ係数の再配列が、最適化段階として実行され、(段階または分割のための)コードブックに対する初期指数が再配列なしに選択され、最終的な選択が、開示された並べ替え方法を用いて最良の事前に選択されたベクトルの選択だけに基づき実行される場合に適用可能である。
【0039】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【0040】
本発明の第2の態様によれば、音声コーダでスペクトルパラメータベクトルを量子化する装置が提供され、線形予測フィルタは周波数ドメインでの複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づいた複数の予測されたスペクトルパラメータ値、および複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルは、スペクトル歪みに基づき最適コードベクトルを選択できるようにするためのスペクトル歪みを推定するために使用される。該装置は、
量子化されたスペクトルパラメータ係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得する手段と、
再配列された量子化されたスペクトルパラメータ係数を示す一連の第2信号を提供するために、量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
再配列された量子化されたスペクトルパラメータ係数およびそれぞれのスペクトルパラメータ係数からスペクトル歪みを獲得する、第2の信号に応える手段と
を備えたことを特徴としている。
【0041】
スペクトルパラメータは、線スペクトル周波数、線スペクトルペア、イミタンススペクトル周波数、イミタンススペクトルペアなどである場合がある。
【0042】
本発明の第3の態様によれば、ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号、およびスペクトル表現パラメータを示す第2伝送信号を含み、励起検索モジュールがコードパラメータ、利得パラメータおよびピッチパラメータを提供するために使用され、線形予測分析モジュールが周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、ビットストリームをデコーダに提供する音声エンコーダが提供される。該エンコーダは、
量子化されたスペクトル表現係数を示す一連の第1の信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルに基づいた複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2の信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
一連の第3の信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現係数からスペクトル歪みを獲得する、第2の信号に応える手段と、
スペクトル歪みに基づきスペクトル表現パラメータを表す複数の最適コードベクトルを選択し、最適コードベクトルを示す第2の伝送信号を提供する、第3の信号に応える手段と
を備えたことを特徴としている。
【0043】
本発明の第4の態様によれば、該ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号と、スペクトル表現パラメータを示す第2伝送信号を含み、励起検索モードが事前処理された入力信号から第1伝送信号を提供するために使用され、線形予測モジュールが、事前処理された入力信号に基づき、周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、無線通信網内の少なくとも1つの基地局にビットストリームを提供するために、入力音声を受信し、事前処理することができる移動局が提供される。該移動局は、
量子化されたスペクトル表現係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルから複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、一連の第1信号に応える手段と、
一連の第3信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現からスペクトル歪みを獲得する、一連の第2信号に応える手段と、
第2伝送信号を提供するために、スペクトル歪みからスペクトル表現パラメータを表す複数の最適コードベクトルを選択する手段と
を備えたことを特徴としている。
【0044】
本発明は、図3〜6に関連してなされる説明を読むと明らかになるであろう。
【発明を実施するための最良の形態】
【0045】
スペクトル(ペア)パラメータベクトルは、安定したスペクトル(ぺア)ベクトルがつねに正しい順序に並べられるように線形予測係数を表現するベクトルである。このような表現は線スペクトル周波数(LSF)、線スペクトルペア(LSP)、イミタンススペクトル周波数(ISF)、イミタンススペクトルペア(ISP)などを含む。簡略化のために、本発明はLSF表現に関して説明される。
【0046】
本発明のLSF量子化システム40が図3に示されている。図1aに示されるようなシステム構成要素に加えて、加算装置16と加算装置18のあいだに並べ替え機構20が具現化されている。該並べ替え機構20は、量子化されたLSF係数qLSFi kが周波数に関して昇順で配置されるようにそれらを再配列するために使用される。たとえば、図2aと図2bに示されるような量子化されたLSF係数qLSF1 kとqLSF2 kは、すでに昇順、つまりqLSFi 1<qLSFi 2<qLSFi 3であり、並べ替え機能20の機能はこれらの量子化されたLSF係数の配置に影響をおよぼさない。この場合、量子化されたLSFベクトルqLSFiは、適切な順序であると言われる。しかしながら、図2eに示されるように、量子化されたLSFベクトルqLSF3は、qLF3 1<qLSF3 3<qLSF3 2であるため順序が狂っている。配列されたのち、量子化されたLSF係数は、図4aに示されるように昇順で分散される。
【0047】
ベクトル配列後、総スペクトル歪みSD3(図4a)はSD1またはSD2のどちらかより小さい。したがって、選択される最初の3つのフレームを含む第1分割からの最良のコードブック指数はi=3である。復号されたコードブック(1 3 2)の正しい順序も、並べ替えのためにデコーダ内で自動的に検出され、特別な情報は必要とされない。
【0048】
並べ替え機構20によって実行されるような並べ替え関数は以下のように表現できる。
【0049】
【数10】
式13は、さらに、以下に変形でき、
【0050】
【数11】
ここではs(k)は、現在のk番目のLSF成分の正しい配列を与える並べかえ関数であり、その結果すべてのLSFi kはSDiの計算の前に昇順となる。本発明によれば、無効に配列されたLSFベクトルを生じさせる可能性がある残差ベクトルを比較する代わりに、スペクトル歪み値は量子化されたベクトルが順序正しく並べられたのちに計算される。
【0051】
従来技術の検索方法を使用して、昇順で配列されていない量子化されたLSF係数から最小のスペクトル歪みSDiを獲得することが可能な場合もあることに注意する必要がある。たとえば第1のコードブックエントリと第2のコードブックエントリは、図2fと図2gに示されるように、量子化されたLSF係数の2つの異なる集合qLSF1 kとqLSF2 kを生じさせるが、第3の量子化されたLSF係数qLSF3 kは図2eに示されるものと同じである。その場合、量子化されたLSF係数qLSF3 kは昇順ではないが、最小のスペクトル歪みは第3のコードブックエントリから生じる。このようにして、最小の総スペクトル歪みに基づいて選択された量子化されたLSFベクトルは不安定である。従来技術によるコーダでは、不安定な量子化されたLSFベクトルは、コードブック選択後に量子化されたLSF係数を並べ替えることによって安定化できる。この特定の場合には、従来技術による音声コーデックおよび本発明による音声コーデックの結果は同じである。
【0052】
一般的に、やはり誤った順序である別の量子化されたベクトルがある可能性があるため、従来技術による方法に従った結果は最適ではない可能性がある。たとえば、第4のコードブック入力が、図2hに示されるように量子化されたLSF係数qLSF4 kの集合を生じさせる場合、この量子化されたLSFベクトルは図2e、図2f、図2gおよび図2hに示されるように、量子化されたベクトルのあいだで最大のスペクトル歪みを有する。従来技術によるコードブック検索ルーチンを用いると、最小の総スペクトル歪みは第3のコードブックエントリ(図2g)から生じる。
【0053】
本発明のLSF量子化方法によれば、図2eと図2hの量子化されたLSF係数は、並べ替え機構20によって再配列される。図2hに示されるように量子化されたLSF係数qLSF4 kが、量子化されたLSF係数を昇順にするために再配列されたのち、結果は図4bに示される。図2f、図2g、および図4aに示されるように、量子化されたLSFベクトルに比べて、図4bに示されるような量子化されたLSFベクトルは最小の総スペクトル歪みを有する。
【0054】
前記の例は、従来技術によるコードブック検索ルーチンに従った(LSFベクトルを並べ替えることによる)量子化後のベクトルの安定化が、スペクトル歪みという点で必ずしも最良のベクトルを生じさせないことを示した。
【0055】
本発明のLSF量子化方法を用いると、LSFベクトルは、それらが伝送のために選択される前に順序正しく並べられる。この方法は、つねに最良のベクトルを検出する。ベクトル量子化器コードブックが1つの分割にあり、最良のベクトルの選択が単一の段階で実行される場合、検出されるベクトルは大局的に最適である。つまり、つねに、フレームに大局的に最小の誤差を提供する指数iが検出される。制限されたベクトル量子化器が使用されると、必ずしも大局的な最適は検出されない。しかしながら、本発明が分割または段階の中だけで使用されるとしても、性能は依然として向上する。分割VQになおさらに大局的な最適を検出するために、以下のアプローチが使用できる。
1)本発明による事前並べ替え方法を使用して第1の分割に最良のコードブック指数を検出する。および
2)同じようにして第2の分割、第3の分割などに最良のコードブック指数を別個に検出する。
【0056】
しかしながら、分割ごとに最良の分割された量子化器指数を保存する代わりに、さらに最適な解を検出するためには、多くのさらに優れた指数を保存できる。したがって、保存された指数に基づく分割のためのすべての指数の組み合わせが試され、結果として生じる並べ替えられた量子化済みのLSFベクトル(qLF1...qLSFp)が生成され、SDiが計算される。最後に、コードブック指数の最良の組み合わせが選択される。
【0057】
以下のように、多段式ベクトル量子化器のために、類似したアプローチが使用できる。多くの最良の第1段階量子化器が、いわゆるM最良検索(M-best search)で選択され、のちの段階はこれらの1番上に加えられる。各段階では、そのように所望される場合には、結果として生じるqLSFが並べ替えられ、SDiが計算される。再び、コードブック指数の最良の組み合わせが受信機に送信される。並べ替えは1つまたは複数の内部段階のために使用できる。その場合、デコーダは、正しく復号するために同じ段階で並べ替えを実行しなければならない(並べ替えがある段階は、設計段階のあいだに決定できる)。
分割ベクトル量子化器の場合、以下の手順を使用できる。
1)第1の分割のために、最適コードブック検索を実行する。
2)最後の係数の誤差を、通常行なわれるよりわずかに少なく重み付ける。
3)つぎの段階で使用するために多くのさらに優れた指数を記憶する。
4)分割の内側で誤差を計算する代わりに次の分割に移動し、第1の分割の値と(言うまでもなく配列後の)現在のベクトルのすべての組み合わせを含む誤差を計算する。
5)すべての分割が計算されるまで同じ手順を繰り返す。
この方法は、これまでの最良の検出値である量子化された値の選択を含むように連続的に試みる。新しい分割が加えられたのち、結果として生じるさらに長いベクトルが配列され、歪みに基づき、過去の分割の指数を決定できる。このようにして、分割上で配列する制限的な影響はいくぶん考慮に入れられる。最後の係数にさらに低く重み付けするのは、配列が実行されたのちに、最後の係数をのちの分割からの値で置換できることを意味する。
【0058】
図5は、本発明の音声コーデック1を示すブロック図である。音声コーデック1は、エンコーダ4およびデコーダ6を備える。エンコーダ4は、入力音声信号を高域フィルタリングするための事前処理装置22を備える。事前処理された入力信号に基づき、線形予測係数(LPC)分析装置26がLPフィルタ係数の推定を実行するために使用される。LP係数はLPC量子化装置28によって量子化される。励起検索装置30は、やはり事前に処理された入力信号に基づいて、コードパラメータ、利得パラメータおよびピッチパラメータをデコーダ6に提供するために使用される。事前処理装置22、LPC分析装置26、LPC量子化装置28、および励起検索装置30およびそれらの機能は当該技術分野において知られている。本発明のエンコーダ4の特異な特徴は、LSFパラメータをデコーダ6に送信する前に、スペクトル歪み推定で使用するために量子化されたLSF係数を再配列するために使用される並べ替え機構20である。同様に、デコーダ6の中のLPC量子化装置40は、LPC補間装置44によるLPC補間の前に受信されたLSF係数を再配列するための並べ替え機構42を有する。LPC補間装置44、励起発生装置46、LPC合成装置48、および事後処理装置50も当該技術分野において知られている。
【0059】
図6は、本発明の移動電話2を示す線図での説明である。図6に示されるように、移動電話は入力音声を受信し、該入力音声をエンコーダ4に伝達するためのマイクロフォン60を有する。エンコーダ4は、アンテナ80を介した伝送のために、コードパラメータ、利得パラメータ、ピッチパラメータおよびLSFパラメータ(図5)をビットストリーム82に変換する手段(図示されていない)を有する。移動電話2は、量子化されたベクトルを配列する並べ替え機構20を有する。
【0060】
要約すると、本発明は、つねに安定した量子化されたLSFベクトルを提供するための方法および装置を提供する。本発明による該方法および装置は、ビット割り当てを変更するニーズを回避する一方で、スペクトル歪みという点でLSF量子化性能を改善する。該方法および装置は、予測および非予測分割(区分された)ベクトル量子化器と多段式ベクトル量子化器の両方に拡張できる。本発明の方法および装置は、高次LPCモデル(p>10)が使用される場合にはLSFは互いにさらに近くなり、無効配列がさらに起こりやすくなるため、音声コーダの性能を改善する上でより効果的である。しかしながら、同じ方法および装置は、低位LPCモデル(p≦10)に基づく音声コーダで使用することもできる。
【0061】
LSFにしたがって説明されるような量子化方法/装置は、LSP、ISF、ISPおよび他の類似したスペクトルパラメータまたはスペクトル表現などの線形予測係数の他の表現にも適用可能であることに注意する必要がある。
【0062】
したがって、本発明はその好適な実施の形態に関して説明されてきたが、その形式および詳細における前記のおよび多様な変更、省略および逸脱が、本発明の精神および範囲を離れることなく加えられてよいことが当業者により理解されるであろう。
【図面の簡単な説明】
【0063】
【図1a】従来の技術によるLSF量子化システムを示すブロック図である。
【図1b】システム構成要素の配列が異なる従来の技術によるLSF量子化システムを示すブロック図である。
【図2a】ターゲットLSFベクトルおよび予測されたLSF値の周波数ドメイン内での分散を示す線図である。
【図2b】ベクトル量子化器残留コードブックの第1コードブックエントリを示す線図である。
【図2c】ターゲットLSFベクトルに比較される量子化されたLSF係数、および第1コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2d】量子化されたLSF係数および第2コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2e】量子化されたLSF係数および第3コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2f】量子化されたLSF係数および第4コードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2g】量子化されたLSF係数および図2cに示されるものとは異なる第1のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図2h】量子化されたLSF係数および図2dに示されるものとは異なる第2のエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図3】本発明のLSF量子化システムを示すブロック図である。
【図4a】本発明のLSF量子化システムによって再配列されたのちに、図2eに示されるように、量子化されたLSF係数および第3のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図4b】本発明のLSF量子化システムによって再配列されたのちに、図2fに示されるように、量子化されたLSF係数および第4のコードブックエントリを用いた結果として生じるスペクトル歪みを示す線図である。
【図5】本発明の音声符号化用にエンコーダおよびデコーダを備える音声コーデックを示すブロック図である。
【図6】本発明の移動無線通信網で使用するための移動局を示す線図である。
Claims (20)
- 線形予測フィルタが周波数ドメインで複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づく複数の予測されたスペクトルパラメータ値、および前記複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルがスペクトル歪みを計算するために使用され、最適コードベクトルがスペクトル歪みに基づき選択される、音声コーダでスペクトルパラメータベクトルを量子化する方法であって、
それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得すること、
量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく配列し直すこと、および
配列し直された量子化済みのスペクトルパラメータ係数およびそれぞれの線スペクトル周波数係数からスペクトル歪みを獲得すること
を含むことを特徴とする音声コーダでスペクトルパラメータベクトルを量子化する方法。 - 前記スペクトル歪みが、配列し直されたスペクトルパラメータ係数のそれぞれとそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算される請求項1記載の方法。
- 前記誤差がスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けされる請求項2記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が単一分割で実行される請求項1記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行され、最適コードベクトルが各分割でのスペクトル歪みに基づいて選択される請求項1記載の方法。
- 前記スペクトルパラメータが線スペクトル周波数からなる請求項1記載の方法。
- 前記スペクトルパラメータが線スペクトルペアからなる請求項1記載の方法。
- 前記スペクトルパラメータがイミタンススペクトル周波数からなる請求項1記載の方法。
- 前記スペクトルパラメータがイミタンススペクトルペアからなる請求項1記載の方法。
- 前記再配列のステップが1つの段階で実行される請求項1記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階のうちの1つで実施され、当該1つの段階が事前に決定され、前記最適コードベクトルの選択が、前記1つの段階のスペクトル歪みに基づく請求項1記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階のうちの数個で実施され、当該数個の段階が事前に決定され、前記最適コードベクトルの選択が、前記数個の段階のスペクトル歪みに基づく請求項1記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が、最適コードベクトル選択のための複数の段階で実施され、当該複数の段階が事前に決定され、前記最適コードベクトルの選択が、前記複数の段階のスペクトル歪みに基づく請求項1記載の方法。
- 前記量子化されたスペクトルパラメータ係数の再配列が、事前に選択されたベクトルに基づく最適コードベクトルの選択のために事前に選択されたベクトルの量のための最適化段階として実行される請求項1記載の方法。
- 線形予測フィルタが周波数ドメインでの複数のスペクトルパラメータ係数を計算するために使用され、過去に復号された出力値に基づいた複数の予測されたスペクトルパラメータ値、および複数のスペクトルパラメータ係数とともに複数の残差コードブックベクトルが、スペクトル歪みに基づき最適コードベクトルを選択できるようにするためのスペクトル歪みを推定するために使用される、音声コーダでスペクトルパラメータベクトルを量子化する装置であって、
量子化されたスペクトルパラメータ係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトルパラメータ値および残差コードブックベクトルから複数の量子化されたスペクトルパラメータ係数を獲得する手段と、
再配列された量子化されたスペクトルパラメータ係数を示す一連の第2信号を提供するために、量子化されたスペクトルパラメータ係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
再配列された量子化されたスペクトルパラメータ係数およびそれぞれのスペクトルパラメータ係数からスペクトル歪みを獲得する、第2の信号に応える手段
とを備えたことを特徴とする、音声コーダでスペクトルパラメータベクトルを量子化する装置。 - 前記スペクトル歪みが、配列し直されたスペクトルパラメータ係数のそれぞれのスペクトルパラメータ係数の差異を示す誤差に基づき計算され、前記スペクトル歪みを獲得する手段が、前記誤差をスペクトルパラメータ係数に基づいてスペクトル歪みを計算する前に重み付けする請求項15記載の装置。
- 前記量子化されたスペクトルパラメータ係数の再配列が単一分割で実行される請求項15記載の装置。
- 前記量子化されたスペクトルパラメータ係数の再配列が複数の分割で実行され、最適コードベクトルが各分割でのスペクトル歪みに基づいて選択される請求項15記載の装置。
- ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号、およびスペクトル表現パラメータを示す第2伝送信号を含み、励起検索モジュールがコードパラメータ、利得パラメータおよびピッチパラメータを提供するために使用され、線形予測分析モジュールが周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、ビットストリームをデコーダに提供する音声エンコーダであって、
量子化されたスペクトル表現係数を示す一連の第1の信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルに基づいた複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2の信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、第1の信号に応える手段と、
一連の第3の信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現係数からスペクトル歪みを獲得する、第2の信号に応える手段と、
スペクトル歪みに基づきスペクトル表現パラメータを表す複数の最適コードベクトルを選択し、最適コードベクトルを示す第2の伝送信号を提供する、第3の信号に応える手段と
を備えたことを特徴とする音声エンコーダ。 - ビットストリームがコードパラメータ、利得パラメータおよびピッチパラメータを示す第1伝送信号と、スペクトル表現パラメータを示す第2伝送信号を含み、励起検索モジュールが事前処理された入力信号から第1伝送信号を提供するために使用され、線形予測モジュールが、事前処理された入力信号に基づき、周波数ドメイン内の複数のスペクトル表現係数、過去に復号された出力値に基づく複数の予測されたスペクトル表現値、および複数の残差コードブックベクトルを提供するために使用される、無線通信網内の少なくとも1つの基地局にビットストリームを提供するために、入力音声を受信し、事前処理することができる移動局であって、
量子化されたスペクトル表現係数を示す一連の第1信号を提供するために、それぞれの予測されたスペクトル表現値および残差コードブックベクトルから複数の量子化されたスペクトル表現係数を獲得する手段と、
再配列された量子化されたスペクトル表現係数を示す一連の第2信号を提供するために、量子化されたスペクトル表現係数を周波数ドメイン内で規則正しく再配列する、一連の第1信号に応える手段と、
スペクトル歪みを示す一連の第3信号を提供するために、再配列された量子化されたスペクトル表現係数およびそれぞれのスペクトル表現からスペクトル歪みを獲得する、一連の第2信号に応える手段と、
最適コードベクトルを示す第2伝送信号を提供するために、スペクトル歪みからスペクトル表現パラメータを表す複数の最適コードベクトルを選択する手段と
を備えたことを特徴とする移動局。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/859,225 US7003454B2 (en) | 2001-05-16 | 2001-05-16 | Method and system for line spectral frequency vector quantization in speech codec |
PCT/IB2002/001608 WO2002093551A2 (en) | 2001-05-16 | 2002-05-10 | Method and system for line spectral frequency vector quantization in speech codec |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004526213A true JP2004526213A (ja) | 2004-08-26 |
Family
ID=25330384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002590143A Withdrawn JP2004526213A (ja) | 2001-05-16 | 2002-05-10 | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム |
Country Status (11)
Country | Link |
---|---|
US (1) | US7003454B2 (ja) |
EP (1) | EP1388144B1 (ja) |
JP (1) | JP2004526213A (ja) |
KR (1) | KR20040028750A (ja) |
CN (1) | CN1241170C (ja) |
AU (1) | AU2002302874A1 (ja) |
BR (1) | BR0208635A (ja) |
CA (1) | CA2443443C (ja) |
ES (1) | ES2649237T3 (ja) |
PT (1) | PT1388144T (ja) |
WO (1) | WO2002093551A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
WO2008047795A1 (fr) * | 2006-10-17 | 2008-04-24 | Panasonic Corporation | Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé |
JP2017504829A (ja) * | 2013-12-17 | 2017-02-09 | ノキア テクノロジーズ オサケユイチア | オーディオ信号エンコーダ |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004502204A (ja) * | 2000-07-05 | 2004-01-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ラインスペクトル周波数をフィルタ係数に変換する方法 |
US8214204B2 (en) * | 2004-07-23 | 2012-07-03 | Telecom Italia S.P.A. | Method for generating a vector codebook, method and device for compressing data, and distributed speech recognition system |
KR100647290B1 (ko) * | 2004-09-22 | 2006-11-23 | 삼성전자주식회사 | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 |
KR100612889B1 (ko) * | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
US8510105B2 (en) * | 2005-10-21 | 2013-08-13 | Nokia Corporation | Compression and decompression of data vectors |
CN100421370C (zh) * | 2005-10-31 | 2008-09-24 | 连展科技(天津)有限公司 | 一种amr语音编码的源控制速率中降低sid帧传输速率的方法 |
US8392176B2 (en) * | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
US7805292B2 (en) * | 2006-04-21 | 2010-09-28 | Dilithium Holdings, Inc. | Method and apparatus for audio transcoding |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
US20090192742A1 (en) * | 2008-01-30 | 2009-07-30 | Mensur Omerbashich | Procedure for increasing spectrum accuracy |
PT2301021T (pt) * | 2008-07-10 | 2017-09-22 | Voiceage Corp | Dispositivo e método para quantizar e quantizar de modo inverso filtros lpc num super-frame |
EP2304722B1 (en) * | 2008-07-17 | 2018-03-14 | Nokia Technologies Oy | Method and apparatus for fast nearest-neighbor search for vector quantizers |
CN101630510B (zh) * | 2008-07-18 | 2012-03-28 | 上海摩波彼克半导体有限公司 | Amr语音编码中lsp系数量化的快速码本搜索的方法 |
EP2398149B1 (en) * | 2009-02-13 | 2014-05-07 | Panasonic Corporation | Vector quantization device, vector inverse-quantization device, and associated methods |
US9076442B2 (en) | 2009-12-10 | 2015-07-07 | Lg Electronics Inc. | Method and apparatus for encoding a speech signal |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
KR101747917B1 (ko) | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
CN104620315B (zh) * | 2012-07-12 | 2018-04-13 | 诺基亚技术有限公司 | 一种矢量量化的方法及装置 |
CN102867516B (zh) * | 2012-09-10 | 2014-08-27 | 大连理工大学 | 一种采用高阶线性预测系数分组矢量量化的语音编解方法 |
CN102903365B (zh) * | 2012-10-30 | 2014-05-14 | 山东省计算中心 | 一种在解码端细化窄带声码器参数的方法 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
EP3621074B1 (en) * | 2014-01-15 | 2023-07-12 | Samsung Electronics Co., Ltd. | Weight function determination device and method for quantizing linear prediction coding coefficient |
KR101972087B1 (ko) * | 2014-04-24 | 2019-04-24 | 니폰 덴신 덴와 가부시끼가이샤 | 주파수 영역 파라미터열 생성 방법, 부호화 방법, 복호 방법, 주파수 영역 파라미터열 생성 장치, 부호화 장치, 복호 장치, 프로그램 및 기록 매체 |
CN104269176B (zh) * | 2014-09-30 | 2017-11-24 | 武汉大学深圳研究院 | 一种isf系数矢量量化的方法与装置 |
EP3429230A1 (en) * | 2017-07-13 | 2019-01-16 | GN Hearing A/S | Hearing device and method with non-intrusive speech intelligibility prediction |
CN115831130A (zh) * | 2018-06-29 | 2023-03-21 | 华为技术有限公司 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
CN110660400B (zh) * | 2018-06-29 | 2022-07-12 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5651026A (en) * | 1992-06-01 | 1997-07-22 | Hughes Electronics | Robust vector quantization of line spectral frequencies |
DE4236315C1 (de) * | 1992-10-28 | 1994-02-10 | Ant Nachrichtentech | Verfahren zur Sprachcodierung |
CN1051392C (zh) * | 1993-03-26 | 2000-04-12 | 摩托罗拉公司 | 矢量量化器方法 |
US5704001A (en) * | 1994-08-04 | 1997-12-30 | Qualcomm Incorporated | Sensitivity weighted vector quantization of line spectral pair frequencies |
US5675701A (en) * | 1995-04-28 | 1997-10-07 | Lucent Technologies Inc. | Speech coding parameter smoothing method |
US5754733A (en) * | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
KR100198476B1 (ko) * | 1997-04-23 | 1999-06-15 | 윤종용 | 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법 |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
US6141640A (en) * | 1998-02-20 | 2000-10-31 | General Electric Company | Multistage positive product vector quantization for line spectral frequencies in low rate speech coding |
US6148283A (en) * | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
-
2001
- 2001-05-16 US US09/859,225 patent/US7003454B2/en not_active Expired - Lifetime
-
2002
- 2002-05-10 KR KR10-2003-7014370A patent/KR20040028750A/ko not_active Application Discontinuation
- 2002-05-10 WO PCT/IB2002/001608 patent/WO2002093551A2/en active Application Filing
- 2002-05-10 AU AU2002302874A patent/AU2002302874A1/en not_active Abandoned
- 2002-05-10 ES ES02730559.8T patent/ES2649237T3/es not_active Expired - Lifetime
- 2002-05-10 PT PT2730559T patent/PT1388144T/pt unknown
- 2002-05-10 CN CNB028098293A patent/CN1241170C/zh not_active Expired - Lifetime
- 2002-05-10 BR BR0208635-2A patent/BR0208635A/pt not_active Application Discontinuation
- 2002-05-10 JP JP2002590143A patent/JP2004526213A/ja not_active Withdrawn
- 2002-05-10 EP EP02730559.8A patent/EP1388144B1/en not_active Expired - Lifetime
- 2002-05-10 CA CA2443443A patent/CA2443443C/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
WO2008047795A1 (fr) * | 2006-10-17 | 2008-04-24 | Panasonic Corporation | Dispositif de quantification vectorielle, dispositif de quantification vectorielle inverse et procédé associé |
JP2017504829A (ja) * | 2013-12-17 | 2017-02-09 | ノキア テクノロジーズ オサケユイチア | オーディオ信号エンコーダ |
Also Published As
Publication number | Publication date |
---|---|
PT1388144T (pt) | 2017-12-01 |
BR0208635A (pt) | 2004-03-30 |
CN1509469A (zh) | 2004-06-30 |
CN1241170C (zh) | 2006-02-08 |
WO2002093551A3 (en) | 2003-05-01 |
EP1388144A2 (en) | 2004-02-11 |
CA2443443C (en) | 2012-10-02 |
EP1388144A4 (en) | 2007-08-08 |
KR20040028750A (ko) | 2004-04-03 |
AU2002302874A1 (en) | 2002-11-25 |
US20030014249A1 (en) | 2003-01-16 |
WO2002093551A2 (en) | 2002-11-21 |
ES2649237T3 (es) | 2018-01-11 |
EP1388144B1 (en) | 2017-10-18 |
US7003454B2 (en) | 2006-02-21 |
CA2443443A1 (en) | 2002-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004526213A (ja) | 音声コーデックにおける線スペクトル周波数ベクトル量子化のための方法およびシステム | |
JP4731775B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
KR100487136B1 (ko) | 음성복호화방법및장치 | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
US7209878B2 (en) | Noise feedback coding method and system for efficiently searching vector quantization codevectors used for coding a speech signal | |
US5602961A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
KR100469224B1 (ko) | 음성부호화방법및장치 | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
JPH0736118B2 (ja) | セルプを使用した音声圧縮装置 | |
JPH08263099A (ja) | 符号化装置 | |
KR20070038041A (ko) | 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
KR20080074234A (ko) | Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP3905706B2 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
EP1334485B1 (en) | Speech codec and method for generating a vector codebook and encoding/decoding speech signals | |
KR100389898B1 (ko) | 음성부호화에 있어서 선스펙트럼쌍 계수의 양자화 방법 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 | |
JPH09127997A (ja) | 音声符号化方法及び装置 | |
JPH09127993A (ja) | 音声符号化方法及び音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050802 |