JP3593839B2 - ベクトルサーチ方法 - Google Patents

ベクトルサーチ方法 Download PDF

Info

Publication number
JP3593839B2
JP3593839B2 JP07861597A JP7861597A JP3593839B2 JP 3593839 B2 JP3593839 B2 JP 3593839B2 JP 07861597 A JP07861597 A JP 07861597A JP 7861597 A JP7861597 A JP 7861597A JP 3593839 B2 JP3593839 B2 JP 3593839B2
Authority
JP
Japan
Prior art keywords
vector
code
codebook
equation
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07861597A
Other languages
English (en)
Other versions
JPH10276096A (ja
Inventor
祐児 前田
修一 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP07861597A priority Critical patent/JP3593839B2/ja
Priority to SG1998000605A priority patent/SG71098A1/en
Priority to KR1019980010207A priority patent/KR100556278B1/ko
Priority to TW087104557A priority patent/TW371342B/zh
Priority to EP98302329A priority patent/EP0867863B1/en
Priority to US09/048,076 priority patent/US7464030B1/en
Priority to DE69808687T priority patent/DE69808687T2/de
Priority to CN98109402A priority patent/CN1120472C/zh
Priority to AU59706/98A priority patent/AU757927B2/en
Publication of JPH10276096A publication Critical patent/JPH10276096A/ja
Application granted granted Critical
Publication of JP3593839B2 publication Critical patent/JP3593839B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号や音響信号を圧縮して符号化する際のベクトル量子化において、最適な音源ベクトルを得るベクトルサーチ方法に関する。
【0002】
【従来の技術】
音声信号や音響信号を、その時間領域や周波数領域における統計的性質と人間の聴感上の特性を利用して圧縮するための符号化方法が種々知られている。このような符号化方法は、時間領域での符号化、周波数領域での符号化、分析合成符号化等に大別される。
【0003】
音声信号等を圧縮符号化するためのの高能率符号化方法としては、ハーモニック(Harmonic)符号化、MBE(Multiband Excitation;マルチバンド励起)符号化等のサイン波分析符号化や、SBC(Sub−Band Coding; 帯域分割符号化)、LPC(Linear Predictive Coding;線形予測符号化)、あるいはDCT(離散コサイン変換)、MDCT(モデファイドDCT)、FFT(高速フーリエ変換)等が知られている。
【0004】
音声信号を符号化する際には、隣接するサンプル値の間に相関があることを利用して、過去のサンプル値から現在のサンプル値を予測することができる。APC(Adaptive Predictive Coding;適応予測符号化)は、この性質を利用して予測値と入力信号の差分(予測残差)を符号化する方法である。
【0005】
この適応予測符号化は、音声信号がほぼ定常とみなせる符号化単位、例えば20ms程度のフレーム単位で入力信号を取り込んで、LPC(線形予測符号化)分析により求めた予測係数に基づいて線形予測を行い、入力信号との差分を求める。そして、この差分を量子化すると共に予測係数と量子化ステップ幅を補助情報符号として多重化してフレーム単位で伝送する方法である。
【0006】
次に、代表的な予測符号化方法であるCELP(Code Excited Linear Prediction;符号励起線形予測)符号化について説明する。
【0007】
CELP符号化は、符号帳(Codebook;コードブック)と呼ばれる雑音系列の辞書の中から、入力された音声信号を表現する音源として最適なものを選び、その番号(インデックス)を伝送する符号化方法であり、合成による分析(Analysis by Synthesis ;AbS)法を用いた閉ループサーチにより時間軸波形のベクトル量子化を行って、音源のパラメータを符号化する方法である。
【0008】
図1は、音声信号をCELPにより符号化するための符号化装置の主要部の構成例を示すブロック図である。以下では、この符号化装置の構成を参照しながらCELP符号化について説明する。
【0009】
入力端子10から入力された音声信号は、まず、LPC分析部20でLPC(線形予測符号化)分析され、求められた予測係数が合成フィルタ30に送られる。また、この予測係数は多重化部130にも送られる。
【0010】
合成フィルタ30では、LPC分析部20からの予測係数と、後述する適応符号帳40および雑音符号帳60からそれぞれ増幅部50,70、加算部80を介して供給される符号ベクトルとが合成される。
【0011】
そして、加算部90では、入力端子10から入力された音声信号と、合成フィルタ30からの予測値との差分が求められ、聴覚重み付け部100に送られる。
【0012】
聴覚重み付け部100では、加算部90で求められた差分に対して、人間の聴感上の特性を考慮した聴覚重み付けが行われる。そして、誤差計算部110では、聴覚重み付けされた差分のひずみ、すなわち合成フィルタ30からの予測値と入力された音声信号との誤差が最小になる符号ベクトルと増幅部50,70のゲインが探索される。この結果は、インデックスとして適応符号帳40,雑音符号帳60およびゲイン符号帳120に送られると共に、多重化部130に送られて出力端子140から伝送路符号として出力される。
【0013】
これにより、入力された音声信号を表現するために最適な符号ベクトルが適応符号帳40および雑音符号帳60から選択されると共に、それらを合成する際の最適なゲインが決定される。なお、入力端子10から入力された音声信号に対して聴覚重み付けを行った後に上記の処理を行うようにしてもよく、各符号帳に蓄えられる符号ベクトルが聴覚重み付けされたものであってもよい。
【0014】
次に、前述した適応符号帳40,雑音符号帳60およびゲイン符号帳120について説明する。
【0015】
CELP符号化では、入力された音声信号を表現するための音源ベクトルが、適応符号帳40に蓄えられている符号ベクトルと、雑音符号帳60に蓄えられている符号ベクトルの線形和として構成される。このとき、入力信号ベクトルとの間の聴覚重み付けされた誤差が最小である音源ベクトルを表現する各符号帳のインデックスは、蓄えられている全符号ベクトルに対して合成フィルタ30の出力ベクトルを計算して、誤差計算部110で誤差計算を行うことにより決定される。
【0016】
また、増幅部50における適応符号帳のゲインと増幅部70における雑音符号帳のゲインも、同様の探索により符号化される。
【0017】
雑音符号帳60には、分散が1であるガウス雑音の系列ベクトルが符号帳ベクトルとして2のビット数乗個だけ蓄えられているものが多い。そして、これらの符号帳ベクトルに適当なゲインを与えて合成したベクトルである音源ベクトルのひずみが最小になるように符号帳ベクトルの組み合わせが選択されるのが通常である。
【0018】
選択された符号帳ベクトルを量子化する際の量子化ひずみは、符号帳の次元数を大きくするほど小さくできる。このため、例えば40次元,2の9(ビット数)乗個すなわち512個の符号帳が用いられる。
【0019】
このCELP符号化を用いると、比較的高い圧縮率と良好な音質を得ることができる。しかし、次元数が大きい符号帳を用いると、合成フィルタの演算量や符号帳に必要とされるメモリ量が大きくなるため実時間処理が困難になり、高い音声品質を確保しようとすると遅延が大きくなってしまうという問題があった。また、符号に1ビットの誤りがあっても再生されるベクトルは全く異なるものになるため、符号誤りに対して弱いという問題もあった。
【0020】
上述したCELP符号化の問題点を改善するために、VSELP(Vector Sum Excited Linear Prediction;ベクトル加算励起線形予測)符号化が用いられる。以下では、このVSELP符号化について図2および図3を参照しながら説明する。
【0021】
図2は、音声信号をVSELPにより符号化するための符号化装置に用いられる雑音符号帳の構成を示すブロック図である。
【0022】
VSELP符号化では、予め与えられた複数の基底ベクトルにより構成される雑音符号帳260が用いられる。この雑音符号帳260に蓄えられているM個の基底ベクトルの各々には、符号付加部270−1〜270−Mで、復号部210で復号されるインデックスに基づいて+1または−1の因子が乗算される。そして、+1または−1の因子が乗算されたM個の基底ベクトルを加算部280で組み合わせることにより、2 個の雑音符号ベクトルが生成される。
【0023】
この結果、M個の基底ベクトルに対してたたみ込み演算を行えば、その加減算により全ての雑音符号ベクトルに対するたたみ込みの演算結果を得ることができることになり、後段の合成フィルタの演算量を大幅に削減できる。また、雑音符号帳260にはM個の基底ベクトルのみを蓄積すればよいため、メモリ量を削減できる。しかも、生成される2 個の雑音符号ベクトルは、基底ベクトルの加減算で表される冗長な構成であるため、符号誤りに対する耐性も向上する。
【0024】
図3は、上述したような雑音符号帳を備えるVSELP符号化装置の主要部の構成例を示すブロック図である。このVSELP符号化装置は、通常のCELP符号化装置が512個備えている雑音符号帳を9個に減らし、各符号ベクトル(基底ベクトル)に、符号付加部365で+1または−1の符号を付加し、加算部370でこれらの線形和を求めることにより、2 =512通りの雑音符号ベクトルを生成する。
【0025】
VSELP符号化の大きな特徴は、上述したように雑音符号ベクトルが基底ベクトルの線形和で構成されることと、適応符号帳のゲインと雑音符号帳のゲインが一括してベクトル量子化されるという点である。
【0026】
このようなVSELP符号化の基本構成は、ピッチ周期成分と雑音成分とを励起源として線形予測合成を行う、合成による分析(AbS)形の符号化方法である。すなわち、入力音声信号のピッチ周期に依存する適応符号帳340と、雑音符号帳360から、ベクトル単位で波形を選択して線形予測合成を行い、入力音声信号の波形との間の誤差が最も小さくなるような符号ベクトルおよびゲインを選択する。
【0027】
VSELP符号化では、入力音声信号のピッチ成分を表現する適応符号帳からの符号ベクトルと、雑音成分を表現する雑音符号帳からの符号ベクトルを、共にベクトル量子化して、2つのパラメータの組として同時に最適化する。
【0028】
このとき、基底ベクトルは、付加される+1または−1の符号の自由度しかなく、適応符号帳のベクトルと基底ベクトルとは直交していないため、適応符号帳のベクトルと雑音符号ベクトルのゲインを逐次決めるCELPと同様の手順によると符号化効率が低下してしまう。これに対処するため、VSELPにおける基底ベクトルの符号は以下の手順で決められる。
【0029】
まず、入力音声信号のピッチ周期を探索し、適応符号帳の符号ベクトルを決定する。次に、適応符号帳の符号ベクトルと直交する空間に雑音基底ベクトルを射影して、入力ベクトルと間の内積を計算することで雑音符号帳の符号ベクトルを決定する。
【0030】
次に、決定された2つの符号ベクトルに基づいて、合成されたベクトルの、入力音声信号との誤差を最小化するゲインβおよびゲインγの組み合わせを、符号帳を探索して決定する。この2つのゲインの量子化に当たっては、2つの等価変換されたパラメータの組を用いる。ここで、βは長期予測利得係数に相当し、γは符号ベクトルのスカラ利得に相当する。
【0031】
【発明が解決しようとする課題】
ところが、VSELP符号化における符号帳探索の際の演算量は、CELP符号化における演算量よりは削減されているものの、処理速度を向上させて遅延をさらに短縮することが要求されている。
【0032】
本発明は、このような課題を解決するために行われたものであり、音声信号等の符号化を行う際のベクトル量子化における符号帳探索を簡略にして、ベクトルサーチ速度を向上させることを目的とする。
【0033】
【課題を解決するための手段】
上述の課題を解決するために、本発明に係るベクトルサーチ方法は、複数の基底ベクトルの各々に+1または−1の因子を乗算したものを合成して得られる合成ベクトルに基づいて得られる予測ベクトルのうちの、与えられた入力ベクトルに対する誤差が最小になる予測ベクトルを、複数の基底ベクトルに各々乗算される上記因子の組み合わせをグレイコードに従って変化させて求めるベクトルサーチ方法において、上記グレイコードの符号語uに基づいて生成される合成ベクトルの演算により得られる変数Gu を、上記符号語uの所定のビット位置vのみが異なることで隣合う符号語iに基づいて生成される合成ベクトルの演算により得られる変数Gi とグレイコードの性質を利用して計算される変化分ΔGu とを加え合わせることにより求めるステップと、上記グレイコードの他の符号語u’に基づく変数Gu'と、上記符号語u’と上記所定のビット位置vのみが異なることで隣合う符号語i’に基づく変数Gi'との変化分ΔGu'を、既に求められた上記変化分ΔGu を用いて求めるステップと、上記変化分ΔGuとΔGu'を用いて上記入力ベクトルに対する誤差が最小になる予測ベクトルを求めるステップとを有することを特徴としている。
【0034】
上記のベクトルサーチ方法によれば、グレイコードの性質を利用して、既に行われた誤差演算または内積演算の結果を用いて次の誤差演算または内積演算を行うようにしたため、ベクトルサーチ速度を向上できる。
【0035】
【発明の実施の形態】
本発明のベクトルサーチ方法の好ましい実施の形態について説明する。
【0036】
以下では、まず、前述したVSELP符号化装置においてベクトル量子化を行う場合を例として説明する。
【0037】
波形符号化や分析合成系において、波形やスペクトル包絡パラメータを各サンプル値毎に量子化せずに、複数の値の組(ベクトル)をまとめて一つの符号で表現する量子化方法をベクトル量子化と呼ぶ。波形のベクトル量子化による符号化では、標本化した後の波形を一定の時間を符号化単位として切り出し、その区間の波形パターンを1つの符号で表現する。このため、種々の波形のパターンを予めメモリに蓄えておき、それぞれに符号を与えておく。この符号とパターン(符号ベクトル)との対応を示す表が符号帳である。
【0038】
音声信号波形に対しては、一定の時間区間毎に符号帳に蓄えられている各パターンと比較して、類似度が最も高い波形の符号により、その区間の波形を表現する。従って、符号帳には、種々の入力音声を限られた数のパターンを用いて現したときに、全体のひずみが最も小さくなるように適切なパターンを、パターンの分布の偏り等を考慮して蓄えておく必要がある。
【0039】
これは、音声波形の一定の区間の標本点の相互間に相関があって、しかも滑らかにつながっているなど、実現するパターンに特殊性があることに基づいて、ベクトル量子化が高能率符号化になり得るからである。
【0040】
次に、このような符号帳から選択される複数個のベクトルの最適な組み合わせを求めることにより構成される合成ベクトルと、入力ベクトルとの間の誤差を最小にするVSELP符号化の量子化における符号ベクトルを探索するベクトルサーチについて説明する。
【0041】
まず、聴覚重み付けされた入力音声信号をp(n)とし、聴覚重み付けされた長期予測ベクトルに直交する基底ベクトルをq’(n)とする(1≦m≦M)。
【0042】
(1)式は、符号帳から選択された複数個のベクトルを組み合わせた合成ベクトルと入力ベクトルとの内積を与える式である。すなわち、(1)式を最大にするθijを求めることにより、合成ベクトルと入力ベクトルとの間の内積が最大になる。
【0043】
なお、θijの組は、符号語iのビットjが0であるときに−1となり、符号語iのビットjが1であるときに1となる(0≦i≦2 −1,1≦m≦M)。
【0044】
【数1】
Figure 0003593839
【0045】
(1)式の分母項を展開すると(2)式を得る。
【0046】
【数2】
Figure 0003593839
【0047】
ここで、(3)式により与えられる変数R と、(4)式により与えられる変数Dmjを導入する。
【0048】
【数3】
Figure 0003593839
【0049】
これらの変数R ,Dmjを(1)式に代入すると(5)式を得る。
【0050】
【数4】
Figure 0003593839
【0051】
ここで、(6)式により与えられる変数C と、(7)式により与えられる変数G をさらに導入する。
【0052】
【数5】
Figure 0003593839
【0053】
これらの変数C ,G を用いると(1)式は(8)式のようになる。すなわち、(8)式を最大にする変数C ,G を求めることにより、合成ベクトルと入力ベクトルとの間の誤差が最小になる。
【0054】
/G → Max. (8)
ところで、符号語iとビット位置vだけが異なる符号語uがあるとき、C,G が既知であれば、C,Gは(9),(10)式のように表される。
【0055】
【数6】
Figure 0003593839
【0056】
このことを利用して、符号語iを2進グレイコード(Gray Code )を用いて変化させれば、符号帳から選択される複数個の符号ベクトルの最適な組み合わせを効率よく計算できる。なお、グレイコードについては後述する。
【0057】
(10)式のG からのG の変化分をΔG とおくと、(11)式のように表される。
【0058】
【数7】
Figure 0003593839
【0059】
ここで、あるビット位置Vだけが符号語iと異なる2進グレイコードの符号語u’は、同じビット位置Vが変化する1つ前の符号語uとはビット位置v以外の1ビットが異なるのみであるという性質を利用する。
【0060】
いま、上記のビット位置V以外の異なるビットがwであるとすると、θuvの符号は反転しているので、(11)式から(12)式の関係を得る。
【0061】
ΔGu’= −ΔG+2θuwθuvwv (12)
これより、2進グレイコードで、あるビット位置Vが最初に変化したときの変化分ΔG を(11)式より求め、それ以降の同じビット位置Vが変化するものを(12)式を用いて求めれば、ベクトルサーチ速度を向上できることが分かる。
【0062】
図4は、M=4の場合の2進グレイコードを示している。このように、グレイコードは、隣合う2つの符号語どうしが一つのビットのみ異なっている巡回符号の一種である。
【0063】
ここで例えば、ビット位置V=3に注目すると、指示符号425で示されるようにNが3から4に変化するときと、指示符号426で示されるようにNが11から12に変化するときに値が変化している。すなわち、N=4のときのグレイコードと、N=12のときのグレイコードとを比較すると、ビットv(V=3)を除く1つのビットw(W=4)が異なっているだけである。
【0064】
ここで、N=4のときのグレイコードをu,N=12のときのグレイコードをu’とすると、
Figure 0003593839
となる。これから、(11) 式より、
Figure 0003593839
を得る。
【0065】
前述したように、ビット位置V=1,2は同符号、ビット位置V=3,4は異符号なので、
Figure 0003593839
が成り立つ。すなわち、(15a)式が、(15b)式のように簡略化できることになる。
【0066】
図5は、以上説明した本発明のベクトルサーチ方法の手順を示すフローチャートである。
【0067】
ステップST1では、まず(3)式から変数R を、(4)式から変数Dmjをそれぞれ計算する。
【0068】
ステップST2では、(6)式から変数C を、(7)式から変数G をそれぞれ計算する。
【0069】
ステップST3では、(9)式からC (1≦i≦2M−1)を計算する。
【0070】
ステップST4では、ビットV=1とする。
【0071】
そして、ステップST5では、あるビットVが最初に変化するときのG の変化分ΔG を(11)式から計算する。
【0072】
ステップST6では、残りのビットVが変化するときのΔG を(12)式から計算する。
【0073】
ステップST7では、ビットVをV+1とする。
【0074】
ステップST8では、VがM以下であるかどうかが判断される。VがM以下であるときにはステップST5に戻り、上記の手順を繰り返す。一方、VがMより大きいときにはステップST9に進む。
【0075】
ステップST9では、G =G +ΔG (ただし、1≦u≦2M−1)を計算し、ベクトルサーチを終了する。
【0076】
図6は、従来のベクトルサーチ方法によるG 計算の処理量に対する本発明のベクトルサーチ方法による処理量の比を示している。
【0077】
図6(a)は、乗算が行われる場合の計算回数の比較結果を示している。また、図6(b)は、加減算が行われる場合の計算回数の比較結果を示している。これらの結果から、Mが大きくなるに従って、計算回数が削減される効果が大きく現れることが分かる。
【0078】
また、図6(c)は、メモリへの書き込み回数の比較結果を示している。この結果から、メモリへの書き込み回数は、Mの値によらず、従来のベクトルサーチ方法に対して2倍になることが分かる。
【0079】
次に、本発明のベクトルサーチ方法の別の実施の形態として、PSI−CELP符号化におけるベクトル量子化に適用した場合について説明する。
【0080】
PSI−CELP(Pitch Synchronous Innovation CELP )符号化は、雑音符号帳からの符号ベクトルを適応符号帳のピッチ周期(ピッチラグ)で周期化することにより、有声部の音声品質を改善する高能率音声符号化である。
【0081】
図7は、雑音符号帳からの符号ベクトルのピッチを周期化する様子を模式的に示す図である。前述したCELP符号化では、周期的なピッチ成分を含む音声信号を効率よく表現するために、適応符号帳が用いられている。しかし、ビットレートが低くなって4kbps程度になると、音源の符号化に割り当てられるビット数が少なくなるため、適応符号帳だけでは周期的なピッチ成分を含む音声信号を十分に表現することができなくなってしまう。
【0082】
そこで、PSI−CELP符号化方式では、雑音符号帳からの符号ベクトルのピッチを周期化する処理を行う。これにより、適応符号帳だけでは十分に表現できなかった周期的なピッチ成分を含む音声信号を精度良く表現できるようにしている。なお、ラグ(ピッチラグ)Lは、ピッチ周期をサンプル数で表したものである。
【0083】
図8は、PSI−CELP符号化装置の主要部の構成例を示すブロック図である。以下では、このPSI−CELP符号化について図8を参照しながら説明する。
【0084】
PSI−CELP符号化の特徴は、雑音符号帳のピッチ周期化を行う点である。このピッチ周期化は、音声信号の基本周期であるピッチ周期分だけをとり出して、繰り返すように変形するものである。
【0085】
入力端子710から入力された音声信号は、まず、線形予測分析部720で線形予測分析され、求められた予測係数が線形予測合成フィルタ730に送られる。合成フィルタ730では、LPC分析部720からの予測係数と、適応符号帳640および雑音符号帳660,760,761からそれぞれ増幅部650,770、加算部780を介して供給される符号ベクトルとが合成される。
【0086】
雑音符号帳660からの雑音符号ベクトルは、32個の基底ベクトルのなかからセレクタ655により選択されたものに、符号付加部657で+1または−1の因子を乗算したものである。そして、+1または−1の因子が乗算された雑音符号ベクトルと、適応符号帳640からの符号ベクトルは、セレクタ652で選択され、増幅部650で所定のゲインg が与えられて加算部780に供給される。
【0087】
一方、雑音符号帳760,761からの雑音符号ベクトルは、それぞれ16個の基底ベクトルのなかからセレクタ755,756により選択されたものに、ピッチ周期化部750,751でピッチ周期化が行われた後に、符号付加部740,741で+1または−1の因子が乗算されて加算部765に供給される。そして、増幅部770で所定のゲインg が与えられて加算部780に供給される。
【0088】
そして、増幅部650および増幅部770でそれぞれゲインが与えられた符号ベクトルは、加算部780で加算され、線形予測合成フィルタ730に供給される。
【0089】
加算部790では、入力端子710から入力された音声信号と、線形予測合成フィルタ730からの予測値との差分が求められる。
【0090】
聴覚重み付きひずみ最小化部800では、加算部790で求められた差分に対して、人間の聴感上の特性を考慮した聴覚重み付けが行われ、聴覚重み付けされた差分のひずみ、すなわち線形予測合成フィルタ730からの予測値と入力された音声信号との誤差が最小になる符号ベクトルとゲインとが決定される。この結果は、インデックスとして適応符号帳640,雑音符号帳660,760,761に送られると共に、伝送路符号として出力される。
【0091】
ところで、LSP中域2段目量子化において、(16)式は、符号帳から選択された複数個のベクトルを組み合わせた合成ベクトルと入力中域LSP誤差ベクトルとのユークリッド距離を与える式である。すなわち、ここでの誤差計算は、(16)式で与えられるユークリッド距離D(k) を最小にするθ(k,i)の組を求めることにより行われる。ただし、0≦k≦MM−1,0≦i≦7とする。
【0092】
【数8】
Figure 0003593839
【0093】
この(16)式を以下の(17)式のように展開する。
【0094】
【数9】
Figure 0003593839
【0095】
ここで、以下の(18)式で与えられる変数R(k,i)(0≦k≦MM−1,0≦i≦7)と、(19)式で与えられる変数D(i,m)(0≦i,m≦7)を導入する。
【0096】
【数10】
Figure 0003593839
【0097】
(17)式の右辺の第1項は常に一定なので無視し、上記の変数Rと変数Dを代入して、以下の(20)式で与えられる関係を満足するθ(k,i)の組を求めればよいことになる。
【0098】
【数11】
Figure 0003593839
【0099】
ここで、以下の(21)式で与えられる変数C と、(22)式で与えられる変数G をさらに導入する(ただし、0≦I≦2 −1)。
【0100】
【数12】
Figure 0003593839
【0101】
上記の変数C ,G を(20)式に代入すると、
−2*C +G → Min. (23)
を得る。すなわち、(23)式を最小にする変数C ,G を求めることにより誤差を最小化できる。
【0102】
以上説明したPSI−CELP符号化におけるベクトルサーチにおいて、(21),(22)式は、前述したVSELP符号化のベクトルサーチにおける(9),(10)式と同じ形である。従って、PSI−CELPに対しても前述した本発明に係るベクトルサーチ方法を同様に適用して、ベクトルサーチ速度を向上できる。
【0103】
【発明の効果】
本発明のベクトルサーチ方法は、グレイコードの性質を利用して、既に行われた誤差演算の結果を用いて次の誤差演算を行うようにしたため、合成ベクトルの誤差演算が簡略化され、ベクトルサーチ速度を向上できる。
【図面の簡単な説明】
【図1】CELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【図2】VSELP符号化に用いられる雑音符号帳の構成を示すブロック図である。
【図3】VSELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【図4】2進グレイコードの一例を示す図である。
【図5】本発明のベクトルサーチ方法の手順を示すフローチャートである。
【図6】本発明のベクトルサーチ方法および従来のベクトルサーチにおける計算量とメモリ書き込み量を比較する図である。
【図7】PSI−CELPについて説明するための図である。
【図8】PSI−CELP符号化について説明するための符号化装置の構成例を示すブロック図である。
【符号の説明】
210 復号部、 260 雑音符号帳、 270 符号付加部、 280 加算部

Claims (2)

  1. 複数の基底ベクトルの各々に+1または−1の因子を乗算したものを合成して得られる合成ベクトルに基づいて得られる予測ベクトルのうちの、与えられた入力ベクトルに対する誤差が最小になる予測ベクトルを、複数の基底ベクトルに各々乗算される上記因子の組み合わせをグレイコードに従って変化させて求めるベクトルサーチ方法において、
    上記グレイコードの符号語uに基づいて生成される合成ベクトルの演算により得られる変数Gu を、上記符号語uの所定のビット位置vのみが異なることで隣合う符号語iに基づいて生成される合成ベクトルの演算により得られる変数Gi とグレイコードの性質を利用して計算される変化分ΔGu とを加え合わせることにより求めるステップと、
    上記グレイコードの他の符号語u’に基づく変数G u'と、上記符号語u’上記所定のビット位置vのみが異なることで隣合う符号語i’に基づく変数G i'との変化分ΔGu'を、既に求められた上記変化分ΔGu を用いて求めるステップと、
    上記変化分ΔG u とΔG u' を用いて上記入力ベクトルに対する誤差が最小になる予測ベクトルを求めるステップと
    を有することを特徴とするベクトルサーチ方法。
  2. 上記予測ベクトルは、上記合成ベクトルと過去の音源信号に基づくベクトルと合成されて予測合成フィルタを介して生成されることを特徴とする請求項1記載のベクトルサーチ方法。
JP07861597A 1997-03-28 1997-03-28 ベクトルサーチ方法 Expired - Fee Related JP3593839B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP07861597A JP3593839B2 (ja) 1997-03-28 1997-03-28 ベクトルサーチ方法
SG1998000605A SG71098A1 (en) 1997-03-28 1998-03-24 Vector search method
KR1019980010207A KR100556278B1 (ko) 1997-03-28 1998-03-25 벡터탐색방법
EP98302329A EP0867863B1 (en) 1997-03-28 1998-03-26 Method and apparatus of vector searching for VSELP data compression
TW087104557A TW371342B (en) 1997-03-28 1998-03-26 Vector search method
US09/048,076 US7464030B1 (en) 1997-03-28 1998-03-26 Vector search method
DE69808687T DE69808687T2 (de) 1997-03-28 1998-03-26 Verfahren und Anordnung zur Vektorsuche für VSELP Datenkompression
CN98109402A CN1120472C (zh) 1997-03-28 1998-03-28 矢量搜索方法
AU59706/98A AU757927B2 (en) 1997-03-28 1998-03-30 Vector search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07861597A JP3593839B2 (ja) 1997-03-28 1997-03-28 ベクトルサーチ方法

Publications (2)

Publication Number Publication Date
JPH10276096A JPH10276096A (ja) 1998-10-13
JP3593839B2 true JP3593839B2 (ja) 2004-11-24

Family

ID=13666802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07861597A Expired - Fee Related JP3593839B2 (ja) 1997-03-28 1997-03-28 ベクトルサーチ方法

Country Status (9)

Country Link
US (1) US7464030B1 (ja)
EP (1) EP0867863B1 (ja)
JP (1) JP3593839B2 (ja)
KR (1) KR100556278B1 (ja)
CN (1) CN1120472C (ja)
AU (1) AU757927B2 (ja)
DE (1) DE69808687T2 (ja)
SG (1) SG71098A1 (ja)
TW (1) TW371342B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318336B1 (ko) * 2000-01-14 2001-12-22 대표이사 서승모 G.723.1 mp-mlq 코드북 검색 시간 단축 방법.
CN1898720B (zh) * 2004-07-09 2012-01-25 日本电信电话株式会社 音响信号检测系统、音响信号检测服务器、影像信号搜索装置、影像信号搜索方法、影像信号搜索程序与记录介质、信号搜索装置、信号搜索方法、及信号搜索程序与记录介质
CN101266795B (zh) * 2007-03-12 2011-08-10 华为技术有限公司 一种格矢量量化编解码的实现方法及装置
CN102474267B (zh) * 2009-07-02 2015-04-01 西门子企业通讯有限责任两合公司 用于特征向量的向量量化的方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
JP2776050B2 (ja) 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
JPH06138896A (ja) 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法
JP3056339B2 (ja) * 1992-10-16 2000-06-26 沖電気工業株式会社 ベクトル量子化の基準ベクトルへの符号ビット割当方法
JPH06186998A (ja) * 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
JPH07170192A (ja) * 1993-12-16 1995-07-04 Toshiba Corp ベクトル量子化装置
CA2136891A1 (en) * 1993-12-20 1995-06-21 Kalyan Ganesan Removal of swirl artifacts from celp based speech coders
JPH07199994A (ja) * 1993-12-28 1995-08-04 Nec Corp 音声符号化方式
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
JPH08137495A (ja) * 1994-11-07 1996-05-31 Matsushita Electric Ind Co Ltd 音声符号化装置

Also Published As

Publication number Publication date
JPH10276096A (ja) 1998-10-13
US7464030B1 (en) 2008-12-09
SG71098A1 (en) 2000-03-21
KR19980080612A (ko) 1998-11-25
TW371342B (en) 1999-10-01
KR100556278B1 (ko) 2006-06-29
EP0867863B1 (en) 2002-10-16
DE69808687D1 (de) 2002-11-21
AU5970698A (en) 1998-10-01
DE69808687T2 (de) 2003-06-12
CN1203411A (zh) 1998-12-30
CN1120472C (zh) 2003-09-03
AU757927B2 (en) 2003-03-13
EP0867863A1 (en) 1998-09-30

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
JP4550289B2 (ja) Celp符号変換
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
EP1619664B1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
TWI605448B (zh) 產生帶寬延伸訊號的裝置
CN1890714B (zh) 一种优化的复合编码方法
US20090112607A1 (en) Method and apparatus for generating an enhancement layer within an audio coding system
WO2001015144A1 (fr) Vocodeur et procede correspondant
JPH08272395A (ja) 音声符号化装置
JP3275247B2 (ja) 音声符号化・復号化方法
JP3593839B2 (ja) ベクトルサーチ方法
US20100049508A1 (en) Audio encoding device and audio encoding method
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP3268750B2 (ja) 音声合成方法及びシステム
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPH05113799A (ja) コード励振線形予測符号化方式
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
Li et al. Basic audio compression techniques
JP3232728B2 (ja) 音声符号化方法
JP3192051B2 (ja) 音声符号化装置
WO2005045808A1 (en) Harmonic noise weighting in digital speech coders

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040823

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100910

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110910

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110910

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120910

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees