JPWO2011048810A1 - ベクトル量子化装置及びベクトル量子化方法 - Google Patents

ベクトル量子化装置及びベクトル量子化方法 Download PDF

Info

Publication number
JPWO2011048810A1
JPWO2011048810A1 JP2011537141A JP2011537141A JPWO2011048810A1 JP WO2011048810 A1 JPWO2011048810 A1 JP WO2011048810A1 JP 2011537141 A JP2011537141 A JP 2011537141A JP 2011537141 A JP2011537141 A JP 2011537141A JP WO2011048810 A1 JPWO2011048810 A1 JP WO2011048810A1
Authority
JP
Japan
Prior art keywords
vector
signal
search
impulse response
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011537141A
Other languages
English (en)
Inventor
利幸 森井
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Publication of JPWO2011048810A1 publication Critical patent/JPWO2011048810A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3082Vector coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

広帯域のディジタル信号を符号化する場合に、音声品質を劣化させることなく、音声コーデックの計算量を削減することができるベクトル量子化装置。ベクトル量子化装置(112)は、聴感重み付き合成フィルタのインパルス応答が畳み込まれた、符号帳を構成する複数のコードベクトルと、ターゲットベクトルとを用いて符号帳の探索を行う。フィルタリング部(201)は、インパルス応答に、ローパス特性及びハイパス特性の一方または双方を有するフィルタを掛け、短縮部(202)は、フィルタがハイパス特性を有する場合、フィルタリング後のインパルス応答の次数を短縮し、畳込部(203)は、複数のコードベクトルそれぞれに、フィルタリング後のインパルス応答を畳み込み、探索部(204)は、フィルタがローパス特性を有する場合、インパルス応答が畳み込まれた複数のコードベクトルそれぞれの要素、及び、ターゲットベクトルの要素を間引いて探索を行う。

Description

本発明は、ベクトル量子化装置及びベクトル量子化方法に関する。
移動体通信においては伝送帯域の有効利用のために音声または画像のディジタル情報の圧縮符号化が必須である。その中でも携帯電話で広く利用されている音声コーデック(符号化/復号)技術に対する期待は大きく、圧縮率の高い従来の高効率符号化に更によりよい音質の要求が強まっている。また、音声通信は公衆で使用されるため、標準化が必須であり、それに伴う知的財産権の価値の大きさゆえに世界各国の企業において研究開発が盛んに行われている。
近年、多層構造を持つスケーラブルコーデックは、ITU−T(International Telecommunication Union - Telecommunication Standardization Sector)およびMPEG(Moving Picture Experts Group)で標準化が検討されており、より効率的で高品質の音声コーデックが求められている。
20年前に確立された音声の発声機構をモデル化してベクトル量子化を応用した基本方式であるCELP(Code Excited Linear Prediction)によって大きく性能を向上させた音声符号化技術は、ITU−T標準G.729またはETSI標準AMR(Adaptive Multi-Rate)等の標準方式として広く使用されている(例えば、非特許文献1参照)。また、3GPP2標準VMR−WB(Variable-Rate Multimode Wideband)では、電話帯域(Narrow Band:200Hz〜3.4kHz)以上の広帯域(Wide Band:0Hz〜7kHz)の音声を、CELPを用いて符号化する方式が標準化されている(例えば、非特許文献2参照)。
しかしながら、広帯域のディジタル信号をCELPで符号化すると、従来の電話帯域の信号よりもサンプリングレートが高い分だけ計算量が増加してしまう。特に、CELPにおける適応符号帳の探索は、固定符号帳の探索と比較して計算量削減が進んでいない。例えば、VMR−WBの規格書(非特許文献2)に記載されている適応符号帳探索(式(5.16.1-1)および式(5.16.1-2))は、VMR−WBの規格書よりも以前に標準化されたITU−T標準G.729の規格書(非特許文献1)に記載されている適応符号帳探索(3.7章:式(37)および式(38))とほぼ同一である。すなわち、VMR−WBは、ITU−T標準G.729と比較して倍近くのサンプル数を扱うアルゴリズムでありながら、適応符号帳探索において技術的進歩がほとんど無かったことがわかる。
そのため、広帯域化により音声品質は向上するものの、適応符号帳探索に必要となる計算量が大きいため、コーデックの計算量が多くなり、実用化のコストが格段に大きくなるという重大な問題を有している。
本発明の目的は、広帯域のディジタル信号を符号化する場合に、音声品質を劣化させることなく、音声コーデックの計算量を削減することができるベクトル量子化装置及びベクトル量子化方法を提供することである。
本発明のベクトル量子化装置は、複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化装置であって、聴感重み付き合成フィルタのインパルス応答を入力し、ローパス特性およびハイパス特性の一方または双方を有するフィルタを前記インパルス応答に掛けて第1信号を生成するフィルタリング手段と、前記複数のコードベクトルそれぞれに前記第1信号を畳み込んで第2信号を生成する畳込手段と、前記第2信号とターゲットベクトルとを用いて前記探索を行う探索手段と、を具備する構成を採る。
本発明のベクトル量子化方法は、複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化方法であって、ローパス特性およびハイパス特性の一方または双方を有するフィルタを、聴感重み付き合成フィルタのインパルス応答に掛けて第1信号を生成するフィルタリングステップと、前記複数のコードベクトルそれぞれに前記第1信号を畳み込んで第2信号を生成する畳込ステップと、前記第2信号とターゲットベクトルとを用いて前記探索を行う探索ステップと、を具備するようにした。
本発明によれば、音声品質をほとんど劣化させることなく、音声コーデックの計算量を削減することができる。
本発明の実施の形態1に係るCELP符号化装置の構成を示すブロック図 本発明の実施の形態1に係るベクトル量子化装置の構成を示すブロック図 本発明の実施の形態1に係るベクトル量子化装置の探索部の構成を示すブロック図 本発明の実施の形態1に係るバンドパスフィルタの周波数特性を示す図 本発明の実施の形態1に係る符号化シミュレーション結果の一例を示す図 本発明の実施の形態1に係る符号化シミュレーション結果の一例を示す図 本発明の実施の形態2に係るベクトル量子化装置の構成を示すブロック図 本発明の実施の形態2に係るベクトル量子化装置の探索部の構成を示すブロック図 本発明の実施の形態2に係る符号化シミュレーション結果の一例を示す図 本発明の実施の形態2に係る試聴実験結果の一例を示す図(被験者毎の結果) 本発明の実施の形態2に係る試聴実験結果の一例を示す図(環境条件毎の結果)
以下、本発明の実施の形態について、図面を参照して詳細に説明する。以下の実施の形態においては、本発明のベクトル量子化装置を適応符号帳の量子化装置として用いた音声符号化装置の一例として、CELP符号化装置を用いる。
(実施の形態1)
図1は、本実施の形態に係るCELP符号化装置100の構成を示すブロック図である。
図1において、CELP符号化装置100は、声道情報と音源情報とからなる音声信号を、声道情報については、LPCパラメータ(線形予測係数)を求めることにより符号化し、音源情報については、予め記憶されている音声モデルのいずれを用いるかを特定するインデックスを求めることにより符号化する。すなわち、音源情報については、適応符号帳103および固定符号帳104でどのような音源ベクトル(コードベクトル)を生成するかを特定するインデックス(符号)を求めることにより符号化する。
具体的には、CELP符号化装置100の各部は以下の動作を行う。
LPC分析部101は、音声信号に対して線形予測分析を施し、スペクトル包絡情報であるLPCパラメータを求め、求めたLPCパラメータをLPC量子化部102および聴感重み付け部111に出力する。
LPC量子化部102は、LPC分析部101から出力されたLPCパラメータを量子化し、得られた量子化LPCパラメータをLPC合成フィルタ109に出力し、量子化LPCパラメータのインデックスをCELP符号化装置100の外部へ出力する。
一方、適応符号帳103は、LPC合成フィルタ109で使用された過去の駆動音源を記憶しており、後述する歪み最小化部112から指示されたインデックスに対応する適応符号帳ラグに従って、記憶している駆動音源から1サブフレーム分の音源ベクトルを生成する。この音源ベクトルは、適応符号帳ベクトルとして乗算器106に出力される。
固定符号帳104は、所定形状の音源ベクトルを複数個予め記憶しており、歪み最小化部112から指示されたインデックスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器107に出力する。ここで、固定符号帳104は代数的音源であり、代数的符号帳を用いた場合について説明する。代数的音源とは、多くの標準コーデックに採用されている音源である。
なお、上記の適応符号帳103は、有声音のように周期性の強い成分を表現するために使われ、一方、固定符号帳104は、白色雑音のように周期性の弱い成分を表現するために使われる。
ゲイン符号帳105は、歪み最小化部112からの指示に従って、適応符号帳103から出力される適応符号帳ベクトル用のゲイン(適応符号帳ゲイン)、および固定符号帳104から出力される固定符号帳ベクトル用のゲイン(固定符号帳ゲイン)を生成し、それぞれ乗算器106、107に出力する。
乗算器106は、ゲイン符号帳105から出力された適応符号帳ゲインを、適応符号帳103から出力された適応符号帳ベクトルに乗じ、乗算後の適応符号帳ベクトルを加算器108に出力する。
乗算器107は、ゲイン符号帳105から出力された固定符号帳ゲインを、固定符号帳104から出力された固定符号帳ベクトルに乗じ、乗算後の固定符号帳ベクトルを加算器108に出力する。
加算器108は、乗算器106から出力された適応符号帳ベクトルと、乗算器107から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源としてLPC合成フィルタ109に出力する。
LPC合成フィルタ109は、LPC量子化部102から出力された量子化LPCパラメータをフィルタ係数とし、適応符号帳103および固定符号帳104で生成される音源ベクトルを駆動音源としたフィルタ関数、すなわち、LPC合成フィルタを用いて合成信号を生成する。この合成信号は、加算器110に出力される。
加算器110は、LPC合成フィルタ109で生成された合成信号を音声信号から減算することによって誤差信号を算出し、この誤差信号を聴感重み付け部111に出力する。なお、この誤差信号が符号化歪みに相当する。
聴感重み付け部111は、加算器110から出力された符号化歪みに対して聴感的な重み付けを施し、歪み最小化部112に出力する。
歪み最小化部112は、聴感重み付け部111から出力された符号化歪みが最小となるような、適応符号帳103、固定符号帳104およびゲイン符号帳105の各インデックス(符号)をサブフレームごとに求め、これらのインデックスを符号化情報としてCELP符号化装置100の外部に出力する。より詳細には、上記の適応符号帳103および固定符号帳104に基づいて合成信号を生成し、この信号の符号化歪みを求める一連の処理は閉ループ制御(帰還制御)となっており、歪み最小化部112は、各符号帳に指示するインデックスを1サブフレーム内において様々に変化させることによって各符号帳を探索し、最終的に得られる、符号化歪みを最小とする各符号帳のインデックスを出力する。
なお、符号化歪みが最小となる際の駆動音源は、サブフレームごとに適応符号帳103へフィードバックされる。適応符号帳103は、このフィードバックにより、記憶されている駆動音源を更新する。
ここで、適応符号帳103の探索方法について説明する。一般的に、適応符号帳ベクトルと固定符号帳ベクトルとはオープンループで(別々のループで)探索され、音源ベクトルの探索とインデックス(符号)の導出とは以下の式(1)の符号化歪を最小化する音源ベクトルを探索することにより行われる。
Figure 2011048810
E:符号化歪、x:符号化ターゲット(聴感重み付き音声信号)、p:適応符号帳ベクトル、H:聴感重み付き合成フィルタ(インパルス応答の行列)、g:適応符号帳ベクトルの理想ゲイン
ここで、ゲインgが理想ゲインであるとすると、上式(1)をgで偏微分した式が0になることからgを消去でき、上式(1)は、以下の式(2)のコスト関数に変形できる。なお、式(2)において添字tはベクトルの転置を示す。
Figure 2011048810
つまり、上式(1)の符号化歪Eを最小にする適応符号帳ベクトルpは、上式(2)のコスト関数を最大にするものである。ただし、符号化ターゲットxと、インパルス応答Hが畳み込まれた適応符号帳ベクトル(合成された適応符号帳ベクトル)Hpとが正の相関を持つ場合に限定するために、式(2)の分子項を2乗せずに、分母項の平方根を取ることとする。すなわち、式(2)の分子項は、符号化ターゲットxと、合成された適応符号帳ベクトルHpとの相関値を表し、式(2)の分母項は、合成された適応符号帳ベクトルHpのパワの平方根を表す。
よって、適応符号帳103の探索の際、CELP符号化装置100は、上式(2)に示すコスト関数を最大にする適応符号帳ベクトルpを探索し、コスト関数を最大にする適応符号帳ベクトルのインデックス(符号)を、CELP符号化装置100の外部へ出力する。
次に、図2は、本実施の形態に係る歪み最小化部112の内部構成のうち、適応符号帳探索に係る構成を示すブロック図である。つまり、図2は、本発明に係るベクトル量子化装置(適応符号帳の量子化装置)を内部構成の一部として備えた歪み最小化部112の一例を示すブロック図である。
図2に示すベクトル量子化装置には、聴感重み付け部111において聴感的な重み付けが施された符号化歪み(適応符号帳探索のターゲットベクトル)、および、聴感重み付け部111における合成フィルタ(聴感重み付き合成フィルタ)のインパルス応答が入力される。
図2において、フィルタリング部201は、聴感重み付き合成フィルタのインパルス応答に、バンドパスフィルタを掛ける。具体的には、フィルタリング部201は、インパルス応答に、FIR(Finite Impulse Response)フィルタの係数を畳み込む。そして、フィルタリング部201は、フィルタリング後の聴感重み付き合成フィルタのインパルス応答(第1信号)を短縮部202に出力する。ここで、本実施の形態で使用するバンドパスフィルタの伝達関数の一例を以下の式(3)に示し、式(3)に示す伝達関数の周波数特性を図4に示す。
Figure 2011048810
図4に示す周波数特性では、2kHz付近から0Hzに向かってハイパス特性が有ることが分かる。また、図4に示す周波数特性では、4kHz付近から8kHzに向かってローパス特性が有ることが分かる。つまり、フィルタリング部201におけるバンドパスフィルタは、ローパス特性およびハイパス特性の双方を有する。なお、聴感重み付き合成フィルタのインパルス応答にバンドパスフィルタを掛ける際の計算量をできるだけ少なくするべく、低次元(4次)のバンドパスフィルタとしたため、図4に示す周波数特性において6kHzから8kHzまでの間に透過特性が有る。しかし、聴感重み付き合成フィルタのインパルス応答には、この周波数帯域(6kHz〜8kHz)の成分があまり含まれていないため、透過特性による大きな影響は受けない。
ここで、有声性の有る信号では低周波数領域で周期性を安定して分析することができる。従って、フィルタリング部201がインパルス応答にバンドパスフィルタ(式(3)、図4)を掛けることで、フィルタのローパス特性により、音声品質をほとんど劣化させずにダウンサンプリングを行うことが可能となる。これにより、ターゲットベクトルと、インパルス応答が畳み込まれた適応符号帳ベクトル(合成された適応符号帳ベクトル)との相関値、および、合成された適応符号帳ベクトルのパワをより少ない積和数で求めることができる。このため、適応符号帳探索における計算量を、音声品質をほとんど劣化させずに削減することができる。
また、聴感重み付き合成フィルタのインパルス応答には低周波の大きな波が存在し、高次数成分に低周波数領域の大きな振幅を有する。そこで、フィルタリング部201がインパルス応答にバンドパスフィルタ(式(3)、図4)を掛けることで、フィルタのハイパス特性により、インパルス応答の成分を低次数成分に集めることができる。よって、インパルス応答の成分を低次の部分のみに短縮することにより、インパルス応答と適応符号帳ベクトルとの畳み込みに要する計算量を削減することが可能となる。
短縮部202は、フィルタリング部201から入力される、フィルタリング後の聴感重み付き合成フィルタのインパルス応答の成分を、低次の部分のみに短縮する。例えば、聴感重み付け部111から入力されるインパルス応答の次数を、フレームの次数と同一の64次(0番目〜63番目)とする。このとき、短縮部202は、フィルタリング部201から入力されるインパルス応答を、0番目〜23番目までの24次のみに短縮する。以下の説明では、低次の部分のみに短縮されたインパルス応答を「改良インパルス応答(または、短縮信号)」と呼ぶ。そして、短縮部202は、改良インパルス応答(短縮信号)を、畳込部203および探索部204に出力する。
畳込部203は、以下の式(4)に従って、適応符号帳103から入力される適応符号帳ベクトル(適応符号帳のコードベクトル)全体に対して、短縮部202から入力される改良インパルス応答(短縮信号)を畳み込む。
Figure 2011048810
(n):合成された最初の適応符号帳ベクトル
u(Tstart+i):適応符号帳ベクトル(適応符号帳のコードベクトル)
start:コードベクトルとして最初に用いられるラグ(ピッチディレイ)
H(n−i):改良インパルス応答
そして、畳込部203は、得られる、合成された最初の適応符号帳ベクトルy(n)(第2信号)を、探索部204に出力する。
探索部204には、様々な適応符号帳ベクトルが適応符号帳103から入力される。図3は、図2における探索部204の内部構成の一例を示すブロック図である。探索部204は、計算部205、比較部206および更新部207の3つの構成部から成り、各構成部における3つの過程により、適応符号帳ベクトルの量子化(符号化)を行う。
探索部204の計算部205は、畳込部203から入力される、合成された適応符号帳ベクトル(第2信号)、および、聴感重み付け部111から入力されるターゲットベクトルを用いて、以下の式(5)に示すコスト関数E(k:適応符号帳ベクトルの番号)を算出する。ただし、ターゲットベクトルと、合成された適応符号帳ベクトルとが正の相関を持つ場合に限定するために、式(5)の分子項を2乗せずに、分母項の平方根を取ることとする。すなわち、式(5)の分子項は、ターゲットベクトルxと、合成された適応符号帳ベクトルyとの相関値を表し、式(5)の分母項は、合成された適応符号帳ベクトルyのパワの平方根を表す。
Figure 2011048810
x(2n):ターゲットベクトル
(2n):合成された適応符号帳ベクトル
ここで、合成された適応符号帳ベクトルy(2n)は、改良インパルス応答で合成されているので、上式(5)では積和計算を間引くことができる。つまり、計算部205は、式(5)に示すように、適応符号帳ベクトル(コードベクトル)yの要素およびターゲットベクトルxの要素を間引いて、コスト関数を計算する。本実施の形態では、1サンプル置き(つまり、2n(n=0,1,…,31))に積和を取ることとする。すなわち、積和数は、1サンプル毎(n=0,1,…,63)に積和を取る場合、つまり、積和計算を間引かない場合の1/2(つまり、間引き率が1/2)となる。VMR−WBの規格書(非特許文献2)に記載されている関数Tの式(5.16.1-1)と比較すると、本発明におけるコスト関数Eの積和計算の対象(n=0〜31のみ)が削減されていることが明らかである。
探索部204の比較部206は、計算部205で順次算出されるコスト関数Eを比較し、算出されたコスト関数の中で最も大きい値Eおよびその係数kを保持する。そして、比較部206は、適応符号帳探索の結果、最も大きいコスト関数Eの係数kを、最適な適応符号帳ベクトルの番号kとする。
探索部204の更新部207は、以下の式(6)に従って、合成された適応符号帳ベクトルy(n)を更新する。すなわち、更新部207は、式(6)に示すようにして、1つ前の番号(k−1)の合成された適応符号帳ベクトルyk−1(n−1)との差分(u(−k)H(n))だけを計算することにより、合成された適応符号帳ベクトルy(n)を更新する。本実施の形態では、64次から24次に短縮された改良インパルス応答Hを用いるため、式(6)に示すように、積和計算はn=0〜23のみで行われる。ここで、VMR−WBの規格書(非特許文献2)に記載されている式(5.16.1-2)と比較すると、本発明の式(6)では積和計算の対象(n=0〜23のみ)が削減されていることが明らかである。
Figure 2011048810
以上のようにして、探索部204は、インデックス(符号、つまり、最適な適応符号帳ベクトルの番号k)を求め、出力する。
次に、本発明の効果を示す符号化シミュレーションの結果を図5に示す。図5では、様々な環境騒音が付加された16個の音声データの平均値を示す。また、図5に示すオリジナル(従来方法)のコーデックは、ITU−T標準G.718準拠の浮動小数点シミュレータであり、ビットレートを12kbpsとする。また、図5に示す計算量(WMOPS:Weighted Mega Operation Per Second)は、適応符号帳探索に係る部分のみのオペレーションを集計したものである。
図5に示すように、本発明に係る符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質(S/N比)の劣化は見られない(若干向上している)のに対して、計算量は約2/3と大きく削減されている。すなわち、インパルス応答に対してフィルタリングを適用して、インパルス応答の次数を短縮(改良インパルス応答の使用)し、かつ、適応符号帳探索時のコスト関数の積和計算を間引くことで、音声品質を劣化させずに、適応符号帳探索時の計算量を大幅に削減できることが検証された。
また、音声の環境条件によって音声品質の劣化が生じないことを検証するための符号化シミュレーションの結果を図6に示す。図6に示すオリジナル(従来方法)のコーデックは、図5と同様、ITU−T標準G.718準拠の浮動小数点シミュレータであり、ビットレートを12kbpsとする。また、図6では、環境条件として、図5と同様の様々な環境騒音が付加された16個の音声データの平均値(条件:16音声平均)、ノイズ無しの音声データ(条件:クリーン)、走行中の車の騒音が付加された音声データ(条件:カーノイズ)およびバブルノイズ(有色ノイズ)が付加された音声データ(条件:バブルノイズ)を用いる。
図6に示すように、(条件:カーノイズ)では、本発明の符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質(S/N比)が僅かに下回るものの、全体的に音声品質の劣化はほとんど見られない。すなわち、いずれの環境条件においても音声品質の劣化が見られず、本発明の頑健性が検証された。
以上のように本実施の形態によれば、有声性のある信号では低周波数領域で安定して周期性を分析できることから、インパルス応答にローパス特性を有するフィルタを掛けることで、ローパス特性により、音声品質をほとんど落とさずにダウンサンプリングを行うことが可能となる。これにより、符号帳探索時の積和計算に要する計算量を削減することができる。また聴感重み付き合成フィルタのインパルス応答は低周波の大きな波により高次数成分まで大きな振幅を持つ。このことから、インパルス応答にハイパス特性を有するフィルタを掛けることで、ハイパス特性により、インパルス応答の成分を低次数成分に集めることができ、インパルス応答を低次の部分だけに短縮することができる。これにより、インパルス応答と符号帳ベクトルとの畳み込みに要する計算量を削減することができる。つまり、前記2つの計算量の削減により音声コーデックの計算量の大幅な削減が可能となる。
具体的には、本実施の形態によれば、聴感重み付き合成フィルタのインパルス応答に対して、ローパス特性およびハイパス特性を有するフィルタを畳み込む。これにより、CELP符号化装置では、フィルタのローパス特性によりダウンサンプリングを行うことで、コスト関数(式(5))の積和計算において積和を取る対象を間引くことができるため、適応符号帳探索時の計算量を削減することができる。さらに、CELP符号化装置では、フィルタのハイパス特性によりインパルス応答の次数を短縮することで、合成された適応符号帳ベクトルを算出する際(式(6))の積和を取る対象を削減できるため、適応符号帳探索時の計算量を削減することができる。よって、本実施の形態によれば、広帯域のディジタル信号をCELPで符号化する場合でも、音声品質を劣化させることなく、音声コーデックの計算量を削減することができる。
なお、本実施の形態では、フレームの次数を64次とし、インパルス応答の短縮数(短縮後の次数)を24次とし、積和計算の間引き率を1/2とする場合について説明した。しかし、これらの数値は一例であり、他のどのような仕様においても本発明を適用することができる。
また、本実施の形態では、ローパス特性およびハイパス特性を有するバンドパスフィルタを用いる場合について説明したが、バンドパスフィルタの代わりに、ローパスフィルタとハイパスフィルタとを組み合わせて用いてもよい。また、本実施の形態では、ローパス特性およびハイパス特性の双方を有するフィルタを用いる場合について説明したが、ローパス特性およびハイパス特性のいずれか一方を有するフィルタを用いてもよい。つまり、図2に示す短縮部202は、フィルタリング部201のフィルタがハイパス特性を有する場合、フィルタリング後のインパルス応答の次数を短縮すればよい。同様に、図2に示す探索部204(計算部205)は、フィルタリング部201のフィルタがローパス特性を有する場合、コスト関数(式(5))において、適応符号帳ベクトルの要素およびターゲットベクトルの要素を間引いて適応符号帳探索を行えばよい。また、本実施の形態では、バンドパスフィルタの次数を、式(3)に示すように4次としたが、本発明はこれに限らず、バンドパスフィルタの次数を他の次数としてもよい。
また、探索部204の計算部205において式(5)に示すコスト関数の分子を相関値とし、分母をパワの平方根とした場合について説明した。しかし、本発明では、コスト関数の分子を相関値の2乗とし、分母をパワとしてもよい。さらに、正の相関を持つ場合にアドバンテージを持たせる場合には、コスト関数において、相関値の2乗に相関値の極性(+−)を乗ずればよい。また、この場合には、コスト関数において平方根を取らないため、計算量をさらに削減することができる。
また、本実施の形態では、適応符号帳の量子化(符号化)に本発明を適用する場合について説明した。しかし、適応符号帳に限らず、例えば、固定符号帳に対しても本発明を適用することができる。また、ローパス特性を持つフィルタ(本実施の形態では図4に示す特性を有するバンドパスフィルタ)の使用、および、探索部204の計算部205におけるコスト関数の計算方法(積和計算を間引くアルゴリズム)は、CELPにおける適応符号帳探索のピッチの限定における前処理として行われるオープンループピッチ探索に用いることができる。
(実施の形態2)
まず、本実施の形態に係るCELP符号化装置100の適応符号帳103(図1)の探索方法について説明する。実施の形態1と同様、適応符号帳ベクトルと固定符号帳ベクトルとはオープンループで(別々のループで)探索され、音源ベクトルの探索とインデックス(符号)の導出は式(1)の符号化歪を最小化する音源ベクトルを探索することにより行われる。
また、式(1)において、ゲインgが理想ゲインであるとすると、式(1)をgで偏微分した式が0になることからgを消去でき、式(1)は、式(2)のコスト関数に変形できる。つまり、式(1)の符号化歪Eを最小にする適応符号帳ベクトルpは、式(2)のコスト関数を最大にするものである。
ここで、実施の形態1では、符号化ターゲットxと、インパルス応答Hが畳み込まれた適応符号帳ベクトル(合成された適応符号帳ベクトル)Hpとが正の相関を持つ場合に限定するために、式(2)の分子項を2乗せずに、分母項の平方根を取ることとした。
これに対して、本実施の形態では、次式(7)に示すように、式(2)のような平方根の計算を行わない。具体的には、式(7)に示すコスト関数の分子項では、聴感重み付き合成フィルタのインパルス応答を用いて求められる探索用畳み込みベクトルMが畳み込まれた適応符号帳ベクトル(合成ベクトル)Mpが計算される。そして、式(7)に示すコスト関数の分子項は、合成ベクトル(Mp)と符号化ターゲット(x)とを乗じた相関値(xMp)に、その相関値の絶対値(|xMp|)を乗じることにより得られる。また、式(7)に示すコスト関数の分母項は、合成ベクトル(Mp)のパワ(pMp)を計算することにより得られる。
Figure 2011048810
M:探索用畳み込みベクトルの畳み込みマトリクス
式(7)に示すコスト関数の計算により、式(2)に示すコスト関数のように「平方根」という特殊関数を計算することなく、かつ、符号化ターゲットxと合成ベクトルMpとが正の相関を持つ場合に限定することができる。
そして、適応符号帳103の探索の際、CELP符号化装置100は、上式(7)に示すコスト関数を最大にする適応符号帳ベクトルpを探索し、コスト関数を最大にする適応符号帳ベクトルのインデックス(符号)を、CELP符号化装置100の外部へ出力する。
次に、図7は、本実施の形態に係るCELP符号化装置100(図1)の歪み最小化部112の内部構成のうち、適応符号帳探索に係る構成を示すブロック図である。つまり、図7は、本発明に係るベクトル量子化装置(適応符号帳の量子化装置)を内部構成の一部として備えた歪み最小化部112の一例を示すブロック図である。なお、図7において、実施の形態1(図2)と同一の構成要素には同一の符号を付しその説明を省略する。
図7に示すベクトル量子化装置には、聴感重み付け部111(図1)において聴感的な重み付けが施された符号化歪み(適応符号帳探索のターゲットベクトル)、および、聴感重み付け部111における合成フィルタ(聴感重み付き合成フィルタ)のインパルス応答が入力される。
図7において、探索用畳み込みベクトル計算部301は、フィルタリング部302及び切出部303で構成され、聴感重み付き合成フィルタのインパルス応答を用いて、探索用畳み込みベクトルの畳み込みマトリクス(式(7)に示すM)を計算する。
具体的には、探索用畳み込みベクトル計算部301のフィルタリング部302は、聴感重み付き合成フィルタのインパルス応答に、フィルタを掛ける。具体的には、フィルタリング部302は、インパルス応答に、FIRフィルタの係数を畳み込む。そして、フィルタリング部301は、フィルタリング後の聴感重み付き合成フィルタのインパルス応答(第1信号)を切出部302に出力する。ここで、本実施の形態で使用するフィルタの伝達関数の一例を以下の式(8)に示す。なお、式(8)に示す伝達関数の周波数特性は、実施の形態1の式(3)(図4)に示す周波数特性よりも特性(ローパス特性又はハイパス特性)が弱い。
Figure 2011048810
フィルタリング部302において、インパルス応答に式(8)に示す伝達関数を有するフィルタを掛けることで、フィルタのハイパス特性により、出力ベクトルの成分を低次数成分に集めることができる。よって、探索用畳み込みベクトルを低次部分のみに短く限定することにより、インパルス応答と適応符号帳ベクトルとの畳み込みに要する計算量を削減することが可能となる。
切出部303は、フィルタリング部302から入力される、フィルタリング後の聴感重み付き合成フィルタのインパルス応答(第1信号)の低次部分を切り出して、切り出した部分を探索用畳み込みベクトル(M)(または、部分信号と呼ぶ。)とする。例えば、聴感重み付け部111から入力されるインパルス応答の次数を、フレームの次数と同一の64次(0番目〜63番目)とする。このとき、切出部303は、例えば、フィルタリング部302から入力されるインパルス応答のうち0番目〜23番目までの24次を切り出し、0番目〜23番目までの24次を探索用畳み込みベクトル(部分信号)とする。そして、切出部303は、探索用畳み込みベクトル(部分信号)を、畳込部203および探索部204に出力する。
畳込部203は、以下の式(9)に従って、適応符号帳103から入力される適応符号帳ベクトル(適応符号帳のコードベクトル)全体に対して、切出部303から入力される探索用畳み込みベクトル(部分信号)を畳み込む。つまり、畳込部203は、切出部303において切り出された、フィルタリング後の聴感重み付き合成フィルタのインパルス応答の低次部分を用いて畳み込みを行う。
Figure 2011048810
(n):合成された最初の適応符号帳ベクトル(合成ベクトルの初期ベクトル)
u(Tstart+i):適応符号帳ベクトル(適応符号帳のコードベクトル)
start:コードベクトルとして最初に用いられるラグ(ピッチディレイ)
M(n−i):探索用畳み込みベクトル
そして、畳込部203は、得られる、合成された最初の適応符号帳ベクトルy(n)(第2信号)を、探索部204に出力する。
探索部204には、様々な適応符号帳ベクトルが適応符号帳103から入力される。図8は、図7における探索部204の内部構成の一例を示すブロック図である。探索部204は、計算部304、比較部206および更新部305の3つの構成部から成り、各構成部における3つの過程により、適応符号帳ベクトルの量子化(符号化)を行う。
探索部204の計算部304は、畳込部203から入力される、合成された適応符号帳ベクトル、および、聴感重み付け部111から入力されるターゲットベクトルを用いて、コスト関数E(k:適応符号帳ベクトルの番号)を算出する。ただし、ターゲットベクトルと、合成ベクトルとが正の相関を持つ場合に限定する必要がある。そこで、本実施の形態では、計算部304は、式(7)を用いてコスト関数Eの分子項及び分母項を計算する。
つまり、探索部204は、畳込部203においてフィルタリング後の聴感重み付き合成フィルタのインパルス応答(低次部分)が畳み込まれた適応符号帳ベクトル(複数のコードベクトル)とターゲットベクトルとの相関値(xMp)で表される分子項、および、畳込部203においてフィルタリング後の聴感重み付き合成フィルタのインパルス応答(低次部分)が畳み込まれた適応符号帳ベクトル(複数のコードベクトル)のパワ(pMp)で表される分母項、から成るコスト関数を用いて、適応符号帳の探索を行う。また、上記コスト関数において、分子項は相関値(xMp)と相関値の絶対値(|xMp|)との乗算により得られ、分母項はパワ(pMp)の計算により得られる。
また、本実施の形態では、適応符号帳の探索ループにおいて2回に1回の割合(つまり、1つ置きの適応符号帳ベクトル)でコスト関数の分母項(合成ベクトルのパワ)を計算することで、コスト関数の分母項の積和計算を間引く。つまり、分母項を求めるための積和の数は、積和計算を間引かない場合の1/2(つまり、間引き率が1/2)となる。また、計算部304は、式(10)に従って、コスト関数の計算において積和計算が行われない適応符号帳ベクトルにおけるコスト関数の分母項(パワ)を、その適応符号帳ベクトルの前後の適応符号帳ベクトルにおけるコスト関数の分母項を用いた補間により求める。
Figure 2011048810
:コスト関数の分子項
:コスト関数の分母項の逆数
x(n):ターゲットベクトル
(n):合成ベクトル
式(10)に示すように、適応符号帳の探索ループにおけるループカウンタであり、適応符号帳ベクトルの番号とタイムラグとに同期する係数kが偶数または探索ループにおける最後の値である場合、計算部304は、コスト関数の分子項および分母項を計算する。なお、式(10)に示すようにコスト関数の分母項としては、分母項の逆数Lが計算される。そして、計算部304は、式(10)に示すように、分子項Uおよび分母項の逆数Lを用いて、コスト関数Eを計算する。
また、このとき、式(10)において係数kが最初の値でない場合には、kの1つ前の(k−1)において分母項(つまり、分母項の逆数)Lk−1が計算されなかった(間引かれた)ことになる。そこで、計算部304は、(k−1)の前後の、(k−2)における分母項の逆数Lk−2とkにおける分母項の逆数Lとを用いた補間により、(k−1)における分母項の逆数Lk−1を求める。式(10)では、分母項の逆数Lk−1は、(k−1)の前後(つまり、(k−2)とk)の分母項の逆数の平均値となる。そして、計算部304は、式(10)に従って、積和計算により得られた分子項Uk−1および補間により得られた分母項(逆数)Lk−1を用いて、(k−1)におけるコスト関数Ek−1を計算する。
また、式(10)において係数kが奇数の場合、計算部304は、コスト関数の分子項Uのみを計算して格納しておく。
換言すると、探索部204は、適応符号帳ベクトル(複数のコードベクトル)にそれぞれ付された係数(番号)であって、タイムラグに同期する係数kが偶数または探索ループの最後に対応する値の場合、係数kに対応するコードベクトルにおけるコスト関数の分母項を計算により求め、係数kが奇数の場合、係数kに対応するコードベクトルにおけるコスト関数の分母項を、係数(k−1)に対応するコードベクトルにおけるコスト関数の分母項および係数(k+1)に対応するコードベクトルにおけるコスト関数の分母項を用いた補間により求める。すなわち、探索部204は、適応符号帳ベクトル(複数のコードベクトル)のうち、一部のコードベクトルではコスト関数の分母項を計算により求め、コスト関数の分母項が計算により求められた一部のコードベクトル以外のコードベクトルでは、コスト関数の分母項を、上記一部のコードベクトルで計算された分母項を用いた補間により求める。
ここで、着目すべき点は、計算部304において、コスト関数Eの分母項の計算が1つおきの適応符号帳ベクトル(式(10)ではkが偶数の場合)に対して行われることでコスト関数Eの分母項(パワ)計算のための積和計算回数が半分となること、および、コスト関数Eの分母項の逆数を平均して分母項の補間を行うことにより、コスト関数Eの分母項の逆数を計算する回数も半分になっていることである。一般(つまり、分母項の間引きを行わない場合)には、コスト関数Eの分母項(パワ)に対して上述したような補間方法が行われることはない。しかし、本発明の発明者は、適応符号帳の探索ループにおいて各ラグが推移していくとコスト関数の分母項が十分に緩慢に変化していくことに着目し、コスト関数の計算において上述した分母項の補間方法を用いることが可能であることを発見した。本発明の発明者は、この分母項の補間方法を用いることによる特別な不都合が無いことを確認してある。
探索部204の比較部206は、計算部304で順次算出されるコスト関数Eを比較し、算出されたコスト関数の中で最も大きい値Eおよびその係数kを保持する。そして、比較部206は、適応符号帳探索の結果、最も大きいコスト関数Eの係数kを、最適な適応符号帳ベクトルの番号kとする。
探索部204の更新部305は、以下の式(11)に従って、合成ベクトルy(n)を更新する。すなわち、更新部305は、式(11)に示すようにして、1つ前の番号(k−1)の合成ベクトルyk−1(n−1)との差分(u(−k)M(n))だけを計算することにより、合成ベクトルy(n)を更新する。本実施の形態では、64次から24次に短縮された探索用畳み込みベクトルMを用いるため、式(11)に示すように、積和計算はn=0〜23のみで行われる。ここで、VMR−WBの規格書(非特許文献2)に記載されている式(5.16.1-2)と比較すると、本発明の式(11)では積和計算の対象(n=0〜23のみ)が削減されていることが明らかである。
Figure 2011048810
以上のようにして、探索部204は、インデックス(符号、つまり、最適な適応符号帳ベクトルの番号k)を求め、出力する。
次に、本発明の効果を示す符号化シミュレーションの結果を図9に示す。図9では、様々な環境騒音が付加された、サンプリングレート16kHzの16個の音声データの平均値を示す。また、図9に示すオリジナル(従来方法)のコーデックは、ITU−T標準G.718準拠の浮動小数点シミュレータであり、ビットレートを8kbpsとする。また、図9に示す計算量(WMOPS:Weighted Mega Operation Per Second)は、適応符号帳探索に係る部分のみのオペレーションを集計したものである。
図9に示すように、本発明に係る符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質(S/N比及びセグメンタルS/N比)の劣化はほぼ見られないのに対して、計算量は約3/5と大きく削減されている。すなわち、インパルス応答に対するフィルタリングの適用、インパルス応答の次数の短縮(探索用畳み込みベクトルの使用)、適応符号帳探索時のコスト関数における平方根の不使用、及び、適応符号帳探索時のコスト関数の分母項(パワ)計算の間引きにより、音声品質を大幅に劣化させずに、適応符号帳探索時の計算量を大幅に削減できることが検証された。
さらに、本発明の発明者は、音声の環境条件によって聴感的に音声品質の劣化が生じないことを検証するための試聴実験を行った。試聴実験の環境条件として、ノイズ無しの音声データ(条件:クリーン)、オフィスでの騒音が付加された音声データ(条件:オフィスノイズ)、背景に音楽が付加された音声データ(条件:背景音楽)、バブルノイズ(有色ノイズ)が付加された音声データ(条件:バブルノイズ)、及び、対象となる音声データに対して干渉となる音声が付加された音声データ(条件:干渉話者)の5つの環境条件を用いる。また、評価対象は、「条件:クリーン」の8個の音声データ、「条件:オフィスノイズ」の2個の音声データ、「条件:背景音楽」の2個の音声データ、「条件:バブルノイズ」の2個の音声データ、及び、「条件:干渉話者」の2個の音声データの16データとする。また、評価方法は、一対比較試験(被験者がオリジナル及び本発明を試聴してどちらがどれだけ良いかを比較する方法)を用いた。また、評価段階は5つ(1:オリジナルが良い、2:オリジナルが僅かに良い、3:どちらとも言えない、4:本発明が僅かに良い、5:本発明が良い)である。また、被験者は3人(被験者A,B,C)である。
被験者A,B,C毎の評価結果を図10に示す。図10に示すように、各被験者ともにオリジナルと本発明とで全体的にほとんど優劣がない。また、環境条件毎の各被験者の評価結果を図11に示す。図11に示すように、各環境条件においてもオリジナルと本発明とで全体的にほとんど優劣がない。
すなわち、図10及び図11に示すように、本発明を用いる場合でも、オリジナルと比較して、音声の環境条件によって聴感的に音声品質の劣化が生じないことが検証された。つまり、いずれの環境条件においても音声品質の劣化が見られず、本発明の頑健性が検証された。
以上のように本実施の形態によれば、実施の形態1と同様、インパルス応答にローパス特性を有するフィルタを掛けることで、ローパス特性により、音声品質をほとんど落とさずにダウンサンプリングを行うことが可能となる。これにより、符号帳探索時の積和計算に要する計算量を削減することができる。
また聴感重み付き合成フィルタのインパルス応答は低周波の大きな波により高次数成分まで大きな振幅を持つ。このことから、実施の形態1と同様、インパルス応答にハイパス特性を有するフィルタを掛けることで、ハイパス特性により、インパルス応答の成分を低次数成分に集めることができる。よって、本実施の形態によれば、インパルス応答の低次の部分だけを切り出すことにより、インパルス応答と符号帳ベクトルとの畳み込みに要する計算量を削減することができる。
また、本実施の形態によれば、符号帳探索時に用いるコスト関数の分母項(パワ)計算を間引き、かつ、間引かれた分母項の値を前後に計算された分母項で補間する。これにより、符号帳探索時のコスト関数の精度を劣化させることなく、分母項の計算量を削減することができる。
また、本実施の形態によれば、符号帳探索時に用いるコスト関数(式(7))において平方根(特殊関数)を使用しない。これにより、特殊関数の計算に必要な計算を省略することができ、符号帳探索時に要する計算量を削減することができる。
つまり、前記4つの計算量の削減により音声コーデックの計算量の大幅な削減が可能となる。よって、本実施の形態によれば、音声品質をほとんど劣化させることなく、音声コーデックの計算量を、実施の形態1よりもさらに削減することができる。
なお、本実施の形態では、フレームの次数を64次とし、探索用畳み込みベクトル長を24次とし、積和計算の間引き率を1/2とする場合について説明した。しかし、これらの数値は一例であり、他のどのような仕様においても本発明を適用することができる。
また、本実施の形態では、実施の形態1と比較して特性(ローパス特性およびハイパス特性)が弱いバンドパスフィルタを用いる場合について説明したが、バンドパスフィルタの代わりに、ローパスフィルタとハイパスフィルタとを組み合わせて用いてもよい。また、本実施の形態では、バンドパスフィルタの次数を、式(8)に示すように3次としたが、本発明はこれに限らず、バンドパスフィルタの次数を他の次数としてもよい。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態ではCELPにおける適応符号帳の探索を一例として説明したが、CELPに限らず、ベクトル量子化を用いたスペクトルの量子化方法であれば本発明を適用することができる。例えば、MDCT(Modified Discrete Cosine Transform)またはQMF(Quadrature Mirror Filter)を用いたスペクトル量子化方法に対して本発明を適用してもよい。また、帯域拡張技術における低周波数領域のスペクトルの中から類似するスペクトル形状を探索するアルゴリズムに対して本発明を適用することで、そのアルゴリズムの計算量削減に応用することもできる。
また、上記実施の形態におけるベクトル量子化装置、あるいは、これを含む音声符号化装置を、基地局装置あるいは端末装置に適用することも可能である。
また、上記実施の形態においては、ハードウェアで構成する場合を例に説明したが、本発明はこれに限らず、ソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るベクトル量子化装置あるいは音声符号化装置等と同様の機能を実現することができる。
また、上記実施の形態の各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。ここで、LSIは、集積度の違いによって、IC、システムLSI、スーパーLSIまたはウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2009年10月20日出願の特願2009−241616および2010年5月14日出願の特願2010−112374の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明にかかるベクトル量子化装置およびベクトル量子化方法は、特にCELPを用いた音声コーデックに好適である。
100 CELP符号化装置
101 LPC分析部
102 LPC量子化部
103 適応符号帳
104 固定符号帳
105 ゲイン符号帳
106、107 乗算器
108、110 加算器
109 LPC合成フィルタ
111 聴感重み付け部
112 歪み最小化部
201,302 フィルタリング部
202 短縮部
203 畳込部
204 探索部
205,304 計算部
206 比較部
207,305 更新部
301 探索用畳み込みベクトル計算部
303 切出部

Claims (12)

  1. 複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化装置であって、
    聴感重み付き合成フィルタのインパルス応答を入力し、ローパス特性およびハイパス特性の一方または双方を有するフィルタを前記インパルス応答に掛けて第1信号を生成するフィルタリング手段と、
    前記複数のコードベクトルそれぞれに前記第1信号を畳み込んで第2信号を生成する畳込手段と、
    前記第2信号とターゲットベクトルとを用いて前記探索を行う探索手段と、
    を具備するベクトル量子化装置。
  2. 前記第1信号の次数を短縮して短縮信号を生成する短縮手段を、さらに具備し、
    前記畳込手段は、
    前記第1信号の代わりに前記短縮信号を入力し、前記短縮信号を畳み込みに用いて前記第2信号を生成する、
    請求項1記載のベクトル量子化装置。
  3. 前記探索手段は、
    前記第2信号の要素、および、前記ターゲットベクトルの要素を間引いて前記探索を行う、
    請求項1記載のベクトル量子化装置。
  4. 前記フィルタリング手段は、
    CELPにおける適応符号帳の前記探索において、前記フィルタを、前記インパルス応答に掛ける、
    請求項1記載のベクトル量子化装置。
  5. 前記第1信号の低次部分を切り出して部分信号を生成する切出し手段を、さらに具備し、
    前記畳込手段は、
    前記第1信号の代わりに前記部分信号を入力し、前記部分信号を畳み込みに用いて前記第2信号を生成する、
    請求項1記載のベクトル量子化装置。
  6. 前記探索手段は、
    前記第2信号と前記ターゲットベクトルとの相関値で表される分子項、および、前記第2信号のパワで表される分母項、から成る関数を用いて前記探索を行い、
    前記関数において、
    前記分子項は前記相関値と前記相関値の絶対値との乗算により得られ、前記分母項は前記パワの計算により得られる、
    請求項5記載のベクトル量子化装置。
  7. 前記探索手段は、
    前記複数のコードベクトルのうち、一部のコードベクトルでは前記分母項を計算により求め、前記一部のコードベクトル以外のコードベクトルでは、前記分母項を、前記一部のコードベクトルで計算された前記分母項を用いた補間により求める、
    請求項6記載のベクトル量子化装置。
  8. 前記探索手段は、
    前記複数のコードベクトルにそれぞれ付された係数であって、タイムラグに同期する係数kが偶数または前記探索の最後に対応する値の場合、前記係数kに対応するコードベクトルにおける前記分母項を計算により求め、前記係数kが奇数の場合、前記係数kに対応するコードベクトルにおける前記分母項を、係数(k−1)に対応するコードベクトルにおける前記分母項および係数(k+1)に対応するコードベクトルにおける前記分母項を用いた補間により求める、
    請求項6記載のベクトル量子化装置。
  9. 請求項1記載のベクトル量子化装置を有する音声符号化装置。
  10. 請求項9記載の音声符号化装置を有する通信端末装置。
  11. 請求項9記載の音声符号化装置を有する基地局装置。
  12. 複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化方法であって、
    ローパス特性およびハイパス特性の一方または双方を有するフィルタを、聴感重み付き合成フィルタのインパルス応答に掛けて第1信号を生成するフィルタリングステップと、
    前記複数のコードベクトルそれぞれに前記第1信号を畳み込んで第2信号を生成する畳込ステップと、
    前記第2信号とターゲットベクトルとを用いて前記探索を行う探索ステップと、
    を具備するベクトル量子化方法。
JP2011537141A 2009-10-20 2010-10-20 ベクトル量子化装置及びベクトル量子化方法 Pending JPWO2011048810A1 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2009241616 2009-10-20
JP2009241616 2009-10-20
JP2010112374 2010-05-14
JP2010112374 2010-05-14
PCT/JP2010/006225 WO2011048810A1 (ja) 2009-10-20 2010-10-20 ベクトル量子化装置及びベクトル量子化方法

Publications (1)

Publication Number Publication Date
JPWO2011048810A1 true JPWO2011048810A1 (ja) 2013-03-07

Family

ID=43900054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011537141A Pending JPWO2011048810A1 (ja) 2009-10-20 2010-10-20 ベクトル量子化装置及びベクトル量子化方法

Country Status (3)

Country Link
US (1) US20120203548A1 (ja)
JP (1) JPWO2011048810A1 (ja)
WO (1) WO2011048810A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5789816B2 (ja) * 2012-02-28 2015-10-07 日本電信電話株式会社 符号化装置、この方法、プログラム及び記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE466824B (sv) * 1990-08-10 1992-04-06 Ericsson Telefon Ab L M Foerfarande foer kodning av en samplad talsignalvektor
US5195168A (en) * 1991-03-15 1993-03-16 Codex Corporation Speech coder and method having spectral interpolation and fast codebook search
JPH0588699A (ja) * 1991-09-30 1993-04-09 Toshiba Corp 音声駆動信号のベクトル量子化方式
EP0654909A4 (en) * 1993-06-10 1997-09-10 Oki Electric Ind Co Ltd PREDICTIVE LINEAR ENCODER-ENCODER WITH CODES EXCITATION.
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP4871501B2 (ja) * 2004-11-04 2012-02-08 パナソニック株式会社 ベクトル変換装置及びベクトル変換方法
JP2009241616A (ja) 2008-03-28 2009-10-22 Jtekt Corp 車輪用軸受装置
KR101610765B1 (ko) * 2008-10-31 2016-04-11 삼성전자주식회사 음성 신호의 부호화/복호화 방법 및 장치
US8128344B2 (en) 2008-11-05 2012-03-06 General Electric Company Methods and apparatus involving shroud cooling

Also Published As

Publication number Publication date
WO2011048810A1 (ja) 2011-04-28
US20120203548A1 (en) 2012-08-09

Similar Documents

Publication Publication Date Title
EP2234104B1 (en) Vector quantizer, vector inverse quantizer, and methods therefor
EP3511935B1 (en) Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
US20110004469A1 (en) Vector quantization device, vector inverse quantization device, and method thereof
JP2012163981A (ja) オーディオコーデックポストフィルタ
EP2128858B1 (en) Encoding device and encoding method
WO2008072701A1 (ja) ポストフィルタおよびフィルタリング方法
RU2469421C2 (ru) Векторный квантователь, инверсный векторный квантователь и способы
US20110035214A1 (en) Encoding device and encoding method
US11114106B2 (en) Vector quantization of algebraic codebook with high-pass characteristic for polarity selection
US20100049508A1 (en) Audio encoding device and audio encoding method
WO2011048810A1 (ja) ベクトル量子化装置及びベクトル量子化方法
JPWO2008018464A1 (ja) 音声符号化装置および音声符号化方法
JP2013101212A (ja) ピッチ分析装置、音声符号化装置、ピッチ分析方法および音声符号化方法
JP2004252477A (ja) 広帯域音声復元装置
WO2012053149A1 (ja) 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法