JP3593839B2 - ベクトルサーチ方法 - Google Patents
ベクトルサーチ方法 Download PDFInfo
- Publication number
- JP3593839B2 JP3593839B2 JP07861597A JP7861597A JP3593839B2 JP 3593839 B2 JP3593839 B2 JP 3593839B2 JP 07861597 A JP07861597 A JP 07861597A JP 7861597 A JP7861597 A JP 7861597A JP 3593839 B2 JP3593839 B2 JP 3593839B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- code
- codebook
- equation
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims description 145
- 238000000034 method Methods 0.000 title claims description 37
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 239000002131 composite material Substances 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 description 22
- 238000013139 quantization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 230000003321 amplification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/135—Vector sum excited linear prediction [VSELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、音声信号や音響信号を圧縮して符号化する際のベクトル量子化において、最適な音源ベクトルを得るベクトルサーチ方法に関する。
【0002】
【従来の技術】
音声信号や音響信号を、その時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して圧縮するための符号化方法が種々知られている。このような符号化方法は、時間領域での符号化、周波数領域での符号化、分析合成符号化等に大別される。
【0003】
音声信号等を圧縮符号化するためのの高能率符号化方法としては、ハーモニック(Harmonic)符号化、MBE(Multiband Excitation;マルチバンド励起)符号化等のサイン波分析符号化や、SBC(Sub−Band Coding; 帯域分割符号化)、LPC(Linear Predictive Coding;線形予測符号化)、あるいはDCT(離散コサイン変換)、MDCT(モデファイドDCT)、FFT(高速フーリエ変換)等が知られている。
【0004】
音声信号を符号化する際には、隣接するサンプル値の間に相関があることを利用して、過去のサンプル値から現在のサンプル値を予測することができる。APC(Adaptive Predictive Coding;適応予測符号化)は、この性質を利用して予測値と入力信号の差分(予測残差)を符号化する方法である。
【0005】
この適応予測符号化は、音声信号がほぼ定常とみなせる符号化単位、例えば20ms程度のフレーム単位で入力信号を取り込んで、LPC(線形予測符号化)分析により求めた予測係数に基づいて線形予測を行い、入力信号との差分を求める。そして、この差分を量子化すると共に予測係数と量子化ステップ幅を補助情報符号として多重化してフレーム単位で伝送する方法である。
【0006】
次に、代表的な予測符号化方法であるCELP(Code Excited Linear Prediction;符号励起線形予測)符号化について説明する。
【0007】
CELP符号化は、符号帳(Codebook;コードブック)と呼ばれる雑音系列の辞書の中から、入力された音声信号を表現する音源として最適なものを選び、その番号(インデックス)を伝送する符号化方法であり、合成による分析(Analysis by Synthesis ;AbS)法を用いた閉ループサーチにより時間軸波形のベクトル量子化を行って、音源のパラメータを符号化する方法である。
【0008】
図1は、音声信号をCELPにより符号化するための符号化装置の主要部の構成例を示すブロック図である。以下では、この符号化装置の構成を参照しながらCELP符号化について説明する。
【0009】
入力端子10から入力された音声信号は、まず、LPC分析部20でLPC(線形予測符号化)分析され、求められた予測係数が合成フィルタ30に送られる。また、この予測係数は多重化部130にも送られる。
【0010】
合成フィルタ30では、LPC分析部20からの予測係数と、後述する適応符号帳40および雑音符号帳60からそれぞれ増幅部50,70、加算部80を介して供給される符号ベクトルとが合成される。
【0011】
そして、加算部90では、入力端子10から入力された音声信号と、合成フィルタ30からの予測値との差分が求められ、聴覚重み付け部100に送られる。
【0012】
聴覚重み付け部100では、加算部90で求められた差分に対して、人間の聴感上の特性を考慮した聴覚重み付けが行われる。そして、誤差計算部110では、聴覚重み付けされた差分のひずみ、すなわち合成フィルタ30からの予測値と入力された音声信号との誤差が最小になる符号ベクトルと増幅部50,70のゲインが探索される。この結果は、インデックスとして適応符号帳40,雑音符号帳60およびゲイン符号帳120に送られると共に、多重化部130に送られて出力端子140から伝送路符号として出力される。
【0013】
これにより、入力された音声信号を表現するために最適な符号ベクトルが適応符号帳40および雑音符号帳60から選択されると共に、それらを合成する際の最適なゲインが決定される。なお、入力端子10から入力された音声信号に対して聴覚重み付けを行った後に上記の処理を行うようにしてもよく、各符号帳に蓄えられる符号ベクトルが聴覚重み付けされたものであってもよい。
【0014】
次に、前述した適応符号帳40,雑音符号帳60およびゲイン符号帳120について説明する。
【0015】
CELP符号化では、入力された音声信号を表現するための音源ベクトルが、適応符号帳40に蓄えられている符号ベクトルと、雑音符号帳60に蓄えられている符号ベクトルの線形和として構成される。このとき、入力信号ベクトルとの間の聴覚重み付けされた誤差が最小である音源ベクトルを表現する各符号帳のインデックスは、蓄えられている全符号ベクトルに対して合成フィルタ30の出力ベクトルを計算して、誤差計算部110で誤差計算を行うことにより決定される。
【0016】
また、増幅部50における適応符号帳のゲインと増幅部70における雑音符号帳のゲインも、同様の探索により符号化される。
【0017】
雑音符号帳60には、分散が1であるガウス雑音の系列ベクトルが符号帳ベクトルとして2のビット数乗個だけ蓄えられているものが多い。そして、これらの符号帳ベクトルに適当なゲインを与えて合成したベクトルである音源ベクトルのひずみが最小になるように符号帳ベクトルの組み合わせが選択されるのが通常である。
【0018】
選択された符号帳ベクトルを量子化する際の量子化ひずみは、符号帳の次元数を大きくするほど小さくできる。このため、例えば40次元,2の9(ビット数)乗個すなわち512個の符号帳が用いられる。
【0019】
このCELP符号化を用いると、比較的高い圧縮率と良好な音質を得ることができる。しかし、次元数が大きい符号帳を用いると、合成フィルタの演算量や符号帳に必要とされるメモリ量が大きくなるため実時間処理が困難になり、高い音声品質を確保しようとすると遅延が大きくなってしまうという問題があった。また、符号に1ビットの誤りがあっても再生されるベクトルは全く異なるものになるため、符号誤りに対して弱いという問題もあった。
【0020】
上述したCELP符号化の問題点を改善するために、VSELP(Vector Sum Excited Linear Prediction;ベクトル加算励起線形予測)符号化が用いられる。以下では、このVSELP符号化について図2および図3を参照しながら説明する。
【0021】
図2は、音声信号をVSELPにより符号化するための符号化装置に用いられる雑音符号帳の構成を示すブロック図である。
【0022】
VSELP符号化では、予め与えられた複数の基底ベクトルにより構成される雑音符号帳260が用いられる。この雑音符号帳260に蓄えられているM個の基底ベクトルの各々には、符号付加部270−1〜270−Mで、復号部210で復号されるインデックスに基づいて+1または−1の因子が乗算される。そして、+1または−1の因子が乗算されたM個の基底ベクトルを加算部280で組み合わせることにより、2M 個の雑音符号ベクトルが生成される。
【0023】
この結果、M個の基底ベクトルに対してたたみ込み演算を行えば、その加減算により全ての雑音符号ベクトルに対するたたみ込みの演算結果を得ることができることになり、後段の合成フィルタの演算量を大幅に削減できる。また、雑音符号帳260にはM個の基底ベクトルのみを蓄積すればよいため、メモリ量を削減できる。しかも、生成される2M 個の雑音符号ベクトルは、基底ベクトルの加減算で表される冗長な構成であるため、符号誤りに対する耐性も向上する。
【0024】
図3は、上述したような雑音符号帳を備えるVSELP符号化装置の主要部の構成例を示すブロック図である。このVSELP符号化装置は、通常のCELP符号化装置が512個備えている雑音符号帳を9個に減らし、各符号ベクトル(基底ベクトル)に、符号付加部365で+1または−1の符号を付加し、加算部370でこれらの線形和を求めることにより、29 =512通りの雑音符号ベクトルを生成する。
【0025】
VSELP符号化の大きな特徴は、上述したように雑音符号ベクトルが基底ベクトルの線形和で構成されることと、適応符号帳のゲインと雑音符号帳のゲインが一括してベクトル量子化されるという点である。
【0026】
このようなVSELP符号化の基本構成は、ピッチ周期成分と雑音成分とを励起源として線形予測合成を行う、合成による分析(AbS)形の符号化方法である。すなわち、入力音声信号のピッチ周期に依存する適応符号帳340と、雑音符号帳360から、ベクトル単位で波形を選択して線形予測合成を行い、入力音声信号の波形との間の誤差が最も小さくなるような符号ベクトルおよびゲインを選択する。
【0027】
VSELP符号化では、入力音声信号のピッチ成分を表現する適応符号帳からの符号ベクトルと、雑音成分を表現する雑音符号帳からの符号ベクトルを、共にベクトル量子化して、2つのパラメータの組として同時に最適化する。
【0028】
このとき、基底ベクトルは、付加される+1または−1の符号の自由度しかなく、適応符号帳のベクトルと基底ベクトルとは直交していないため、適応符号帳のベクトルと雑音符号ベクトルのゲインを逐次決めるCELPと同様の手順によると符号化効率が低下してしまう。これに対処するため、VSELPにおける基底ベクトルの符号は以下の手順で決められる。
【0029】
まず、入力音声信号のピッチ周期を探索し、適応符号帳の符号ベクトルを決定する。次に、適応符号帳の符号ベクトルと直交する空間に雑音基底ベクトルを射影して、入力ベクトルと間の内積を計算することで雑音符号帳の符号ベクトルを決定する。
【0030】
次に、決定された2つの符号ベクトルに基づいて、合成されたベクトルの、入力音声信号との誤差を最小化するゲインβおよびゲインγの組み合わせを、符号帳を探索して決定する。この2つのゲインの量子化に当たっては、2つの等価変換されたパラメータの組を用いる。ここで、βは長期予測利得係数に相当し、γは符号ベクトルのスカラ利得に相当する。
【0031】
【発明が解決しようとする課題】
ところが、VSELP符号化における符号帳探索の際の演算量は、CELP符号化における演算量よりは削減されているものの、処理速度を向上させて遅延をさらに短縮することが要求されている。
【0032】
本発明は、このような課題を解決するために行われたものであり、音声信号等の符号化を行う際のベクトル量子化における符号帳探索を簡略にして、ベクトルサーチ速度を向上させることを目的とする。
【0033】
【課題を解決するための手段】
上述の課題を解決するために、本発明に係るベクトルサーチ方法は、複数の基底ベクトルの各々に+1または−1の因子を乗算したものを合成して得られる合成ベクトルに基づいて得られる予測ベクトルのうちの、与えられた入力ベクトルに対する誤差が最小になる予測ベクトルを、複数の基底ベクトルに各々乗算される上記因子の組み合わせをグレイコードに従って変化させて求めるベクトルサーチ方法において、上記グレイコードの符号語uに基づいて生成される合成ベクトルの演算により得られる変数Gu を、上記符号語uの所定のビット位置vのみが異なることで隣合う符号語iに基づいて生成される合成ベクトルの演算により得られる変数Gi とグレイコードの性質を利用して計算される変化分ΔGu とを加え合わせることにより求めるステップと、上記グレイコードの他の符号語u’に基づく変数Gu'と、上記符号語u’と上記所定のビット位置vのみが異なることで隣合う符号語i’に基づく変数Gi'との変化分ΔGu'を、既に求められた上記変化分ΔGu を用いて求めるステップと、上記変化分ΔGuとΔGu'を用いて上記入力ベクトルに対する誤差が最小になる予測ベクトルを求めるステップとを有することを特徴としている。
【0034】
上記のベクトルサーチ方法によれば、グレイコードの性質を利用して、既に行われた誤差演算または内積演算の結果を用いて次の誤差演算または内積演算を行うようにしたため、ベクトルサーチ速度を向上できる。
【0035】
【発明の実施の形態】
本発明のベクトルサーチ方法の好ましい実施の形態について説明する。
【0036】
以下では、まず、前述したVSELP符号化装置においてベクトル量子化を行う場合を例として説明する。
【0037】
波形符号化や分析合成系において、波形やスペクトル包絡パラメータを各サンプル値毎に量子化せずに、複数の値の組(ベクトル)をまとめて一つの符号で表現する量子化方法をベクトル量子化と呼ぶ。波形のベクトル量子化による符号化では、標本化した後の波形を一定の時間を符号化単位として切り出し、その区間の波形パターンを1つの符号で表現する。このため、種々の波形のパターンを予めメモリに蓄えておき、それぞれに符号を与えておく。この符号とパターン(符号ベクトル)との対応を示す表が符号帳である。
【0038】
音声信号波形に対しては、一定の時間区間毎に符号帳に蓄えられている各パターンと比較して、類似度が最も高い波形の符号により、その区間の波形を表現する。従って、符号帳には、種々の入力音声を限られた数のパターンを用いて現したときに、全体のひずみが最も小さくなるように適切なパターンを、パターンの分布の偏り等を考慮して蓄えておく必要がある。
【0039】
これは、音声波形の一定の区間の標本点の相互間に相関があって、しかも滑らかにつながっているなど、実現するパターンに特殊性があることに基づいて、ベクトル量子化が高能率符号化になり得るからである。
【0040】
次に、このような符号帳から選択される複数個のベクトルの最適な組み合わせを求めることにより構成される合成ベクトルと、入力ベクトルとの間の誤差を最小にするVSELP符号化の量子化における符号ベクトルを探索するベクトルサーチについて説明する。
【0041】
まず、聴覚重み付けされた入力音声信号をp(n)とし、聴覚重み付けされた長期予測ベクトルに直交する基底ベクトルをq’m(n)とする(1≦m≦M)。
【0042】
(1)式は、符号帳から選択された複数個のベクトルを組み合わせた合成ベクトルと入力ベクトルとの内積を与える式である。すなわち、(1)式を最大にするθijを求めることにより、合成ベクトルと入力ベクトルとの間の内積が最大になる。
【0043】
なお、θijの組は、符号語iのビットjが0であるときに−1となり、符号語iのビットjが1であるときに1となる(0≦i≦2M −1,1≦m≦M)。
【0044】
【数1】
【0045】
(1)式の分母項を展開すると(2)式を得る。
【0046】
【数2】
【0047】
ここで、(3)式により与えられる変数Rm と、(4)式により与えられる変数Dmjを導入する。
【0048】
【数3】
【0049】
これらの変数Rm ,Dmjを(1)式に代入すると(5)式を得る。
【0050】
【数4】
【0051】
ここで、(6)式により与えられる変数Ci と、(7)式により与えられる変数Gi をさらに導入する。
【0052】
【数5】
【0053】
これらの変数Ci ,Gi を用いると(1)式は(8)式のようになる。すなわち、(8)式を最大にする変数Ci ,Gi を求めることにより、合成ベクトルと入力ベクトルとの間の誤差が最小になる。
【0054】
Ci 2/Gi → Max. (8)
ところで、符号語iとビット位置vだけが異なる符号語uがあるとき、Ci,Gi が既知であれば、Cu,Guは(9),(10)式のように表される。
【0055】
【数6】
【0056】
このことを利用して、符号語iを2進グレイコード(Gray Code )を用いて変化させれば、符号帳から選択される複数個の符号ベクトルの最適な組み合わせを効率よく計算できる。なお、グレイコードについては後述する。
【0057】
(10)式のGi からのGu の変化分をΔGu とおくと、(11)式のように表される。
【0058】
【数7】
【0059】
ここで、あるビット位置Vだけが符号語iと異なる2進グレイコードの符号語u’は、同じビット位置Vが変化する1つ前の符号語uとはビット位置v以外の1ビットが異なるのみであるという性質を利用する。
【0060】
いま、上記のビット位置V以外の異なるビットがwであるとすると、θuvの符号は反転しているので、(11)式から(12)式の関係を得る。
【0061】
ΔGu’= −ΔGu+2θuwθuvDwv (12)
これより、2進グレイコードで、あるビット位置Vが最初に変化したときの変化分ΔGu を(11)式より求め、それ以降の同じビット位置Vが変化するものを(12)式を用いて求めれば、ベクトルサーチ速度を向上できることが分かる。
【0062】
図4は、M=4の場合の2進グレイコードを示している。このように、グレイコードは、隣合う2つの符号語どうしが一つのビットのみ異なっている巡回符号の一種である。
【0063】
ここで例えば、ビット位置V=3に注目すると、指示符号425で示されるようにNが3から4に変化するときと、指示符号426で示されるようにNが11から12に変化するときに値が変化している。すなわち、N=4のときのグレイコードと、N=12のときのグレイコードとを比較すると、ビットv(V=3)を除く1つのビットw(W=4)が異なっているだけである。
【0064】
ここで、N=4のときのグレイコードをu,N=12のときのグレイコードをu’とすると、
となる。これから、(11) 式より、
を得る。
【0065】
前述したように、ビット位置V=1,2は同符号、ビット位置V=3,4は異符号なので、
が成り立つ。すなわち、(15a)式が、(15b)式のように簡略化できることになる。
【0066】
図5は、以上説明した本発明のベクトルサーチ方法の手順を示すフローチャートである。
【0067】
ステップST1では、まず(3)式から変数Rm を、(4)式から変数Dmjをそれぞれ計算する。
【0068】
ステップST2では、(6)式から変数C0 を、(7)式から変数G0 をそれぞれ計算する。
【0069】
ステップST3では、(9)式からCi (1≦i≦2M−1)を計算する。
【0070】
ステップST4では、ビットV=1とする。
【0071】
そして、ステップST5では、あるビットVが最初に変化するときのGu の変化分ΔGu を(11)式から計算する。
【0072】
ステップST6では、残りのビットVが変化するときのΔGu を(12)式から計算する。
【0073】
ステップST7では、ビットVをV+1とする。
【0074】
ステップST8では、VがM以下であるかどうかが判断される。VがM以下であるときにはステップST5に戻り、上記の手順を繰り返す。一方、VがMより大きいときにはステップST9に進む。
【0075】
ステップST9では、Gu =Gi +ΔGu (ただし、1≦u≦2M−1)を計算し、ベクトルサーチを終了する。
【0076】
図6は、従来のベクトルサーチ方法によるGi 計算の処理量に対する本発明のベクトルサーチ方法による処理量の比を示している。
【0077】
図6(a)は、乗算が行われる場合の計算回数の比較結果を示している。また、図6(b)は、加減算が行われる場合の計算回数の比較結果を示している。これらの結果から、Mが大きくなるに従って、計算回数が削減される効果が大きく現れることが分かる。
【0078】
また、図6(c)は、メモリへの書き込み回数の比較結果を示している。この結果から、メモリへの書き込み回数は、Mの値によらず、従来のベクトルサーチ方法に対して2倍になることが分かる。
【0079】
次に、本発明のベクトルサーチ方法の別の実施の形態として、PSI−CELP符号化におけるベクトル量子化に適用した場合について説明する。
【0080】
PSI−CELP(Pitch Synchronous Innovation CELP )符号化は、雑音符号帳からの符号ベクトルを適応符号帳のピッチ周期(ピッチラグ)で周期化することにより、有声部の音声品質を改善する高能率音声符号化である。
【0081】
図7は、雑音符号帳からの符号ベクトルのピッチを周期化する様子を模式的に示す図である。前述したCELP符号化では、周期的なピッチ成分を含む音声信号を効率よく表現するために、適応符号帳が用いられている。しかし、ビットレートが低くなって4kbps程度になると、音源の符号化に割り当てられるビット数が少なくなるため、適応符号帳だけでは周期的なピッチ成分を含む音声信号を十分に表現することができなくなってしまう。
【0082】
そこで、PSI−CELP符号化方式では、雑音符号帳からの符号ベクトルのピッチを周期化する処理を行う。これにより、適応符号帳だけでは十分に表現できなかった周期的なピッチ成分を含む音声信号を精度良く表現できるようにしている。なお、ラグ(ピッチラグ)Lは、ピッチ周期をサンプル数で表したものである。
【0083】
図8は、PSI−CELP符号化装置の主要部の構成例を示すブロック図である。以下では、このPSI−CELP符号化について図8を参照しながら説明する。
【0084】
PSI−CELP符号化の特徴は、雑音符号帳のピッチ周期化を行う点である。このピッチ周期化は、音声信号の基本周期であるピッチ周期分だけをとり出して、繰り返すように変形するものである。
【0085】
入力端子710から入力された音声信号は、まず、線形予測分析部720で線形予測分析され、求められた予測係数が線形予測合成フィルタ730に送られる。合成フィルタ730では、LPC分析部720からの予測係数と、適応符号帳640および雑音符号帳660,760,761からそれぞれ増幅部650,770、加算部780を介して供給される符号ベクトルとが合成される。
【0086】
雑音符号帳660からの雑音符号ベクトルは、32個の基底ベクトルのなかからセレクタ655により選択されたものに、符号付加部657で+1または−1の因子を乗算したものである。そして、+1または−1の因子が乗算された雑音符号ベクトルと、適応符号帳640からの符号ベクトルは、セレクタ652で選択され、増幅部650で所定のゲインg0 が与えられて加算部780に供給される。
【0087】
一方、雑音符号帳760,761からの雑音符号ベクトルは、それぞれ16個の基底ベクトルのなかからセレクタ755,756により選択されたものに、ピッチ周期化部750,751でピッチ周期化が行われた後に、符号付加部740,741で+1または−1の因子が乗算されて加算部765に供給される。そして、増幅部770で所定のゲインg1 が与えられて加算部780に供給される。
【0088】
そして、増幅部650および増幅部770でそれぞれゲインが与えられた符号ベクトルは、加算部780で加算され、線形予測合成フィルタ730に供給される。
【0089】
加算部790では、入力端子710から入力された音声信号と、線形予測合成フィルタ730からの予測値との差分が求められる。
【0090】
聴覚重み付きひずみ最小化部800では、加算部790で求められた差分に対して、人間の聴感上の特性を考慮した聴覚重み付けが行われ、聴覚重み付けされた差分のひずみ、すなわち線形予測合成フィルタ730からの予測値と入力された音声信号との誤差が最小になる符号ベクトルとゲインとが決定される。この結果は、インデックスとして適応符号帳640,雑音符号帳660,760,761に送られると共に、伝送路符号として出力される。
【0091】
ところで、LSP中域2段目量子化において、(16)式は、符号帳から選択された複数個のベクトルを組み合わせた合成ベクトルと入力中域LSP誤差ベクトルとのユークリッド距離を与える式である。すなわち、ここでの誤差計算は、(16)式で与えられるユークリッド距離D(k)2 を最小にするθ(k,i)の組を求めることにより行われる。ただし、0≦k≦MM−1,0≦i≦7とする。
【0092】
【数8】
【0093】
この(16)式を以下の(17)式のように展開する。
【0094】
【数9】
【0095】
ここで、以下の(18)式で与えられる変数R(k,i)(0≦k≦MM−1,0≦i≦7)と、(19)式で与えられる変数D(i,m)(0≦i,m≦7)を導入する。
【0096】
【数10】
【0097】
(17)式の右辺の第1項は常に一定なので無視し、上記の変数Rと変数Dを代入して、以下の(20)式で与えられる関係を満足するθ(k,i)の組を求めればよいことになる。
【0098】
【数11】
【0099】
ここで、以下の(21)式で与えられる変数CI と、(22)式で与えられる変数GI をさらに導入する(ただし、0≦I≦28 −1)。
【0100】
【数12】
【0101】
上記の変数CI ,GI を(20)式に代入すると、
−2*CI +GI → Min. (23)
を得る。すなわち、(23)式を最小にする変数CI ,GI を求めることにより誤差を最小化できる。
【0102】
以上説明したPSI−CELP符号化におけるベクトルサーチにおいて、(21),(22)式は、前述したVSELP符号化のベクトルサーチにおける(9),(10)式と同じ形である。従って、PSI−CELPに対しても前述した本発明に係るベクトルサーチ方法を同様に適用して、ベクトルサーチ速度を向上できる。
【0103】
【発明の効果】
本発明のベクトルサーチ方法は、グレイコードの性質を利用して、既に行われた誤差演算の結果を用いて次の誤差演算を行うようにしたため、合成ベクトルの誤差演算が簡略化され、ベクトルサーチ速度を向上できる。
【図面の簡単な説明】
【図1】CELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【図2】VSELP符号化に用いられる雑音符号帳の構成を示すブロック図である。
【図3】VSELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【図4】2進グレイコードの一例を示す図である。
【図5】本発明のベクトルサーチ方法の手順を示すフローチャートである。
【図6】本発明のベクトルサーチ方法および従来のベクトルサーチにおける計算量とメモリ書き込み量を比較する図である。
【図7】PSI−CELPについて説明するための図である。
【図8】PSI−CELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【符号の説明】
210 復号部、 260 雑音符号帳、 270 符号付加部、 280 加算部
Claims (2)
- 複数の基底ベクトルの各々に+1または−1の因子を乗算したものを合成して得られる合成ベクトルに基づいて得られる予測ベクトルのうちの、与えられた入力ベクトルに対する誤差が最小になる予測ベクトルを、複数の基底ベクトルに各々乗算される上記因子の組み合わせをグレイコードに従って変化させて求めるベクトルサーチ方法において、
上記グレイコードの符号語uに基づいて生成される合成ベクトルの演算により得られる変数Gu を、上記符号語uの所定のビット位置vのみが異なることで隣合う符号語iに基づいて生成される合成ベクトルの演算により得られる変数Gi とグレイコードの性質を利用して計算される変化分ΔGu とを加え合わせることにより求めるステップと、
上記グレイコードの他の符号語u’に基づく変数G u'と、上記符号語u’と上記所定のビット位置vのみが異なることで隣合う符号語i’に基づく変数G i'との変化分ΔGu'を、既に求められた上記変化分ΔGu を用いて求めるステップと、
上記変化分ΔG u とΔG u' を用いて上記入力ベクトルに対する誤差が最小になる予測ベクトルを求めるステップと
を有することを特徴とするベクトルサーチ方法。 - 上記予測ベクトルは、上記合成ベクトルと過去の音源信号に基づくベクトルと合成されて予測合成フィルタを介して生成されることを特徴とする請求項1記載のベクトルサーチ方法。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07861597A JP3593839B2 (ja) | 1997-03-28 | 1997-03-28 | ベクトルサーチ方法 |
SG1998000605A SG71098A1 (en) | 1997-03-28 | 1998-03-24 | Vector search method |
KR1019980010207A KR100556278B1 (ko) | 1997-03-28 | 1998-03-25 | 벡터탐색방법 |
EP98302329A EP0867863B1 (en) | 1997-03-28 | 1998-03-26 | Method and apparatus of vector searching for VSELP data compression |
TW087104557A TW371342B (en) | 1997-03-28 | 1998-03-26 | Vector search method |
US09/048,076 US7464030B1 (en) | 1997-03-28 | 1998-03-26 | Vector search method |
DE69808687T DE69808687T2 (de) | 1997-03-28 | 1998-03-26 | Verfahren und Anordnung zur Vektorsuche für VSELP Datenkompression |
CN98109402A CN1120472C (zh) | 1997-03-28 | 1998-03-28 | 矢量搜索方法 |
AU59706/98A AU757927B2 (en) | 1997-03-28 | 1998-03-30 | Vector search method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07861597A JP3593839B2 (ja) | 1997-03-28 | 1997-03-28 | ベクトルサーチ方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10276096A JPH10276096A (ja) | 1998-10-13 |
JP3593839B2 true JP3593839B2 (ja) | 2004-11-24 |
Family
ID=13666802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07861597A Expired - Fee Related JP3593839B2 (ja) | 1997-03-28 | 1997-03-28 | ベクトルサーチ方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7464030B1 (ja) |
EP (1) | EP0867863B1 (ja) |
JP (1) | JP3593839B2 (ja) |
KR (1) | KR100556278B1 (ja) |
CN (1) | CN1120472C (ja) |
AU (1) | AU757927B2 (ja) |
DE (1) | DE69808687T2 (ja) |
SG (1) | SG71098A1 (ja) |
TW (1) | TW371342B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100318336B1 (ko) * | 2000-01-14 | 2001-12-22 | 대표이사 서승모 | G.723.1 mp-mlq 코드북 검색 시간 단축 방법. |
CN1898720B (zh) * | 2004-07-09 | 2012-01-25 | 日本电信电话株式会社 | 音响信号检测系统、音响信号检测服务器、影像信号搜索装置、影像信号搜索方法、影像信号搜索程序与记录介质、信号搜索装置、信号搜索方法、及信号搜索程序与记录介质 |
CN101266795B (zh) * | 2007-03-12 | 2011-08-10 | 华为技术有限公司 | 一种格矢量量化编解码的实现方法及装置 |
CN102474267B (zh) * | 2009-07-02 | 2015-04-01 | 西门子企业通讯有限责任两合公司 | 用于特征向量的向量量化的方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
US4896361A (en) * | 1988-01-07 | 1990-01-23 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
JP2776050B2 (ja) | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
JPH06138896A (ja) | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
JP3056339B2 (ja) * | 1992-10-16 | 2000-06-26 | 沖電気工業株式会社 | ベクトル量子化の基準ベクトルへの符号ビット割当方法 |
JPH06186998A (ja) * | 1992-12-15 | 1994-07-08 | Nec Corp | 音声符号化装置のコードブック探索方式 |
JPH07170192A (ja) * | 1993-12-16 | 1995-07-04 | Toshiba Corp | ベクトル量子化装置 |
CA2136891A1 (en) * | 1993-12-20 | 1995-06-21 | Kalyan Ganesan | Removal of swirl artifacts from celp based speech coders |
JPH07199994A (ja) * | 1993-12-28 | 1995-08-04 | Nec Corp | 音声符号化方式 |
JPH0863198A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | ベクトル量子化器 |
JPH08137495A (ja) * | 1994-11-07 | 1996-05-31 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
-
1997
- 1997-03-28 JP JP07861597A patent/JP3593839B2/ja not_active Expired - Fee Related
-
1998
- 1998-03-24 SG SG1998000605A patent/SG71098A1/en unknown
- 1998-03-25 KR KR1019980010207A patent/KR100556278B1/ko not_active IP Right Cessation
- 1998-03-26 EP EP98302329A patent/EP0867863B1/en not_active Expired - Lifetime
- 1998-03-26 US US09/048,076 patent/US7464030B1/en not_active Expired - Fee Related
- 1998-03-26 TW TW087104557A patent/TW371342B/zh not_active IP Right Cessation
- 1998-03-26 DE DE69808687T patent/DE69808687T2/de not_active Expired - Lifetime
- 1998-03-28 CN CN98109402A patent/CN1120472C/zh not_active Expired - Fee Related
- 1998-03-30 AU AU59706/98A patent/AU757927B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
JPH10276096A (ja) | 1998-10-13 |
US7464030B1 (en) | 2008-12-09 |
SG71098A1 (en) | 2000-03-21 |
KR19980080612A (ko) | 1998-11-25 |
TW371342B (en) | 1999-10-01 |
KR100556278B1 (ko) | 2006-06-29 |
EP0867863B1 (en) | 2002-10-16 |
DE69808687D1 (de) | 2002-11-21 |
AU5970698A (en) | 1998-10-01 |
DE69808687T2 (de) | 2003-06-12 |
CN1203411A (zh) | 1998-12-30 |
CN1120472C (zh) | 2003-09-03 |
AU757927B2 (en) | 2003-03-13 |
EP0867863A1 (en) | 1998-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6427135B1 (en) | Method for encoding speech wherein pitch periods are changed based upon input speech signal | |
JP4550289B2 (ja) | Celp符号変換 | |
US7149683B2 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
EP1619664B1 (en) | Speech coding apparatus, speech decoding apparatus and methods thereof | |
TWI605448B (zh) | 產生帶寬延伸訊號的裝置 | |
CN1890714B (zh) | 一种优化的复合编码方法 | |
US20090112607A1 (en) | Method and apparatus for generating an enhancement layer within an audio coding system | |
WO2001015144A1 (fr) | Vocodeur et procede correspondant | |
JPH08272395A (ja) | 音声符号化装置 | |
JP3275247B2 (ja) | 音声符号化・復号化方法 | |
JP3593839B2 (ja) | ベクトルサーチ方法 | |
US20100049508A1 (en) | Audio encoding device and audio encoding method | |
JP2003044099A (ja) | ピッチ周期探索範囲設定装置及びピッチ周期探索装置 | |
JP3268750B2 (ja) | 音声合成方法及びシステム | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JP3916934B2 (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置 | |
JP2613503B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JPH05113799A (ja) | コード励振線形予測符号化方式 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
Li et al. | Basic audio compression techniques | |
JP3232728B2 (ja) | 音声符号化方法 | |
JP3192051B2 (ja) | 音声符号化装置 | |
WO2005045808A1 (en) | Harmonic noise weighting in digital speech coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040810 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040823 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080910 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |