JP6462104B2 - 復号装置、及びその方法、プログラム、記録媒体 - Google Patents
復号装置、及びその方法、プログラム、記録媒体 Download PDFInfo
- Publication number
- JP6462104B2 JP6462104B2 JP2017247954A JP2017247954A JP6462104B2 JP 6462104 B2 JP6462104 B2 JP 6462104B2 JP 2017247954 A JP2017247954 A JP 2017247954A JP 2017247954 A JP2017247954 A JP 2017247954A JP 6462104 B2 JP6462104 B2 JP 6462104B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- decoding
- decoded
- correction
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 91
- 239000013598 vector Substances 0.000 claims description 691
- 238000012937 correction Methods 0.000 claims description 311
- 230000000875 corresponding effect Effects 0.000 description 126
- 238000004364 calculation method Methods 0.000 description 76
- 238000001228 spectrum Methods 0.000 description 75
- 238000013139 quantization Methods 0.000 description 49
- 238000007792 addition Methods 0.000 description 39
- 230000005540 biological transmission Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 12
- 241000209094 Oryza Species 0.000 description 9
- 235000007164 Oryza sativa Nutrition 0.000 description 9
- 235000009566 rice Nutrition 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
本発明は、線形予測係数やこれに変換可能な係数の符号化技術及び復号技術に関する。
音声や音楽などの音響信号の符号化では、入力音響信号を線形予測分析して得た線形予測係数を用いて符号化する手法が広く用いられている。
符号化処理で用いた線形予測係数の情報を復号装置側で復号できるように、符号化装置は、線形予測係数を符号化し、線形予測係数に対応する符号を復号装置に送る。非特許文献1では、符号化装置は、線形予測係数を線形予測係数と等価な周波数領域のパラメータであるLSP(Line Spectrum Pair)パラメータの列に変換し、LSPパラメータの列を符号化して得たLSP符号を復号装置へ送る。
非特許文献1では、LSP符号の符号量を小さくするために、移動平均予測(MA予測)を用いたベクトル符号化及び復号技術が用いられている。
まず、符号化処理の流れを説明する。
<線形予測係数符号化装置80>
図1は、従来の線形予測係数符号化装置80の構成を示す。
図1は、従来の線形予測係数符号化装置80の構成を示す。
線形予測係数符号化装置80にはフレームごとのLSP(Line Spectrum Pairs)パラメータθf[1],θf[2],…,θf[p]が入力され、線形予測係数符号化装置80は、フレームごとに以下の予測対応減算部83、ベクトル符号化部84、遅延入力部87の処理を行い、LSP符号Cfを得て出力する。なお、fはフレーム番号を、pは予測次数を表す。
線形予測係数符号化装置80に入力音響信号Xfが入力される場合には、線形予測係数符号化装置80に線形予測分析部81とLSP計算部82も備え、フレーム単位の入力音響信号Xfが連続して入力され、フレームごとに以下の処理が行われる。
以下では、各部の具体処理を説明する。
<線形予測分析部81>
線形予測分析部81は、入力音響信号Xfを受け取り、入力音響信号Xfを線形予測分析して、線形予測係数af[1],af[2],…,af[p]を求めて出力する。ここで、af[i]はf番目のフレームの入力音響信号Xfを線形予測分析して得られるi次の線形予測係数を表す。
線形予測分析部81は、入力音響信号Xfを受け取り、入力音響信号Xfを線形予測分析して、線形予測係数af[1],af[2],…,af[p]を求めて出力する。ここで、af[i]はf番目のフレームの入力音響信号Xfを線形予測分析して得られるi次の線形予測係数を表す。
<LSP計算部82>
LSP計算部82は、線形予測係数af[1],af[2],…,af[p]を受け取り、線形予測係数af[1],af[2],…,af[p]からLSPパラメータθf[1],θf[2],…,θf[p]を求め、求めたLSPパラメータを要素とするベクトルであるLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tを出力する。ここで、θf[i]はf番目のフレームの入力音響信号Xfに対応するi次のLSPパラメータである。
LSP計算部82は、線形予測係数af[1],af[2],…,af[p]を受け取り、線形予測係数af[1],af[2],…,af[p]からLSPパラメータθf[1],θf[2],…,θf[p]を求め、求めたLSPパラメータを要素とするベクトルであるLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tを出力する。ここで、θf[i]はf番目のフレームの入力音響信号Xfに対応するi次のLSPパラメータである。
<予測対応減算部83>
予測対応減算部83は、例えば、所定の係数αを記憶した記憶部83c、予測対応平均ベクトルVを記憶した記憶部83d、乗算部88、減算部83a及び83bを含んで構成される。
予測対応減算部83は、例えば、所定の係数αを記憶した記憶部83c、予測対応平均ベクトルVを記憶した記憶部83d、乗算部88、減算部83a及び83bを含んで構成される。
予測対応減算部83は、LSPパラメータベクトルΘfと、前フレーム量子化差分ベクトル^Sf-1とを受け取る。
予測対応減算部83は、LSPパラメータベクトルΘfから予測対応平均ベクトルVと、ベクトルα^Sf-1を減算したベクトルである差分ベクトルSf=Θf−V-α×^Sf-1=(sf[1],sf[2],…,sf[p])Tを生成して出力する。
なお、予測対応平均ベクトルV=(v[1],v[2],…,v[p])Tは、記憶部83dに記憶された予め定めたベクトルであり、例えば、予め学習用の音響信号から求めておけばよい。例えば、線形予測係数符号化装置80において、符号化の対象となる音響信号と、同じ環境(例えば、話者、収音装置、場所)で収音した音響信号を学習用の入力音響信号として用いて、多数のフレームのLSPパラメータベクトルを求め、その平均を予測対応平均ベクトルとする。
乗算部88は、記憶部83cに記憶された所定の係数αを前フレームの復号差分ベクトル^Sf-1に乗じてベクトルα×^Sf-1を得る。
なお、図1では、2つの減算部83a及び83bを用いて、まず、減算部83aにおいて、LSPパラメータベクトルΘfから記憶部83dに記憶された予測対応平均ベクトルVを減算した後、減算部83bにおいて、ベクトルα×^Sf-1を減算しているが、この順序は逆であってもよい。あるいは、予測対応平均ベクトルVとベクトルα×^Sf-1を加算したベクトルV+α×^Sf-1を、LSPパラメータベクトルΘfから減算することで差分ベクトルSfを生成してもよい。
現在のフレームの差分ベクトルSfは、現在のフレームの複数次の線形予測係数に変換可能な係数によるベクトル(LSPパラメータベクトルΘf)から、少なくとも過去のフレームからの予測を含むベクトルを減算して得られるベクトルといってもよい。
<ベクトル符号化部84>
ベクトル符号化部84は、差分ベクトルSfを受け取り、差分ベクトルSfを符号化して、LSP符号CfとLSP符号Cfに対応する量子化差分ベクトル^Sf=(^sf[1], ^sf [2],…, ^sf[p])Tとを得て出力する。差分ベクトルSfの符号化には、差分ベクトルSfをベクトル量子化する方法、差分ベクトルSfを複数のサブベクトルに分けてサブベクトルそれぞれをベクトル量子化する方法、差分ベクトルSfまたはサブベクトルを多段ベクトル量子化する方法、ベクトルの要素をスカラ量子化する方法、これらを組み合わせた方法、などの周知の何れの符号化方法を用いてもよい。
ベクトル符号化部84は、差分ベクトルSfを受け取り、差分ベクトルSfを符号化して、LSP符号CfとLSP符号Cfに対応する量子化差分ベクトル^Sf=(^sf[1], ^sf [2],…, ^sf[p])Tとを得て出力する。差分ベクトルSfの符号化には、差分ベクトルSfをベクトル量子化する方法、差分ベクトルSfを複数のサブベクトルに分けてサブベクトルそれぞれをベクトル量子化する方法、差分ベクトルSfまたはサブベクトルを多段ベクトル量子化する方法、ベクトルの要素をスカラ量子化する方法、これらを組み合わせた方法、などの周知の何れの符号化方法を用いてもよい。
ここでは、差分ベクトルSfをベクトル量子化する方法を用いる場合の例を説明する。
ベクトル符号化部84は、ベクトル符号帳86に記憶されている複数の候補差分ベクトルの中から、差分ベクトルSfに最も近い候補差分ベクトルを探索して量子化差分ベクトル^Sfとして出力するとともに、量子化差分ベクトル^Sfに対応する差分ベクトル符号をLSP符号Cfとして出力する。なお、量子化差分ベクトル^Sfは後述する復号差分ベクトルに対応する。
<ベクトル符号帳86>
ベクトル符号帳86には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。
ベクトル符号帳86には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。
<遅延入力部87>
遅延入力部87は、量子化差分ベクトル^Sfを受け取り、量子化差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム量子化差分ベクトル^Sf-1として出力する。つまり、f番目のフレームの量子化差分ベクトル^Sfに対して予測対応減算部83が処理を行っているときには、f-1番目のフレームについての量子化差分ベクトル^Sf-1を出力する。
遅延入力部87は、量子化差分ベクトル^Sfを受け取り、量子化差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム量子化差分ベクトル^Sf-1として出力する。つまり、f番目のフレームの量子化差分ベクトル^Sfに対して予測対応減算部83が処理を行っているときには、f-1番目のフレームについての量子化差分ベクトル^Sf-1を出力する。
<線形予測係数復号装置90>
図2は、従来の線形予測係数復号装置90の構成を示す。線形予測係数復号装置90には、フレーム単位のLSP符号Cfが連続して入力され、フレーム単位でLSP符号Cfを復号して復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])を得る。
図2は、従来の線形予測係数復号装置90の構成を示す。線形予測係数復号装置90には、フレーム単位のLSP符号Cfが連続して入力され、フレーム単位でLSP符号Cfを復号して復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])を得る。
以下では、各部の具体処理を説明する。
<ベクトル復号部91>
ベクトル復号部91は、LSP符号Cfを受け取り、LSP符号Cfを復号して、LSP符号Cfに対応する復号差分ベクトル^Sfを得て出力する。LSP符号Cfの復号には、符号化装置のベクトル符号化部84の符号化方法に対応する復号方法を用いる。
ベクトル復号部91は、LSP符号Cfを受け取り、LSP符号Cfを復号して、LSP符号Cfに対応する復号差分ベクトル^Sfを得て出力する。LSP符号Cfの復号には、符号化装置のベクトル符号化部84の符号化方法に対応する復号方法を用いる。
ここでは、ベクトル符号化部84の差分ベクトルSfをベクトル量子化する方法に対応する復号方法を用いる場合の例を説明する。
ベクトル復号部91は、ベクトル符号帳92に記憶されている差分ベクトル符号の中から、LSP符号Cfに対応する複数の差分ベクトル符号を探索し、その差分ベクトル符号に対応する候補差分ベクトルを復号差分ベクトル^Sfとして出力する。なお、復号差分ベクトル^Sfは前述の量子化差分ベクトル^Sfに対応し、伝送誤りや符号化、復号の過程で誤り等がなければ、対応する要素は同じ値となる。
<ベクトル符号帳92>
ベクトル符号帳92には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。なお、ベクトル符号帳92は、前述の線形予測係数符号化装置80のベクトル符号帳86と共通の情報を含む。
ベクトル符号帳92には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。なお、ベクトル符号帳92は、前述の線形予測係数符号化装置80のベクトル符号帳86と共通の情報を含む。
<遅延入力部93>
遅延入力部93は、復号差分ベクトル^Sfを受け取り、復号差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム復号差分ベクトル^Sf-1として出力する。つまり、f番目のフレームの復号差分ベクトル^Sfに対して予測対応加算部95が処理を行っているときには、f-1番目のフレームの復号差分ベクトル^Sf-1を出力する。
遅延入力部93は、復号差分ベクトル^Sfを受け取り、復号差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム復号差分ベクトル^Sf-1として出力する。つまり、f番目のフレームの復号差分ベクトル^Sfに対して予測対応加算部95が処理を行っているときには、f-1番目のフレームの復号差分ベクトル^Sf-1を出力する。
<予測対応加算部95>
予測対応加算部95は、例えば、所定の係数αを記憶した記憶部95c、予測対応平均ベクトルVを記憶した記憶部95d、乗算部94、加算部95a及び95bを含んで構成される。
予測対応加算部95は、例えば、所定の係数αを記憶した記憶部95c、予測対応平均ベクトルVを記憶した記憶部95d、乗算部94、加算部95a及び95bを含んで構成される。
予測対応加算部95は、現在のフレームの復号差分ベクトル^Sfと前フレーム復号差分ベクトル^Sf-1を受け取る。
予測対応加算部95は、復号差分ベクトル^Sfと、予測対応平均ベクトルV=(v[1],v[2],…,v[N])Tと、ベクトルα×^Sf-1とを加算したベクトルである復号予測対応LSPパラメータベクトル^Θf(=^Sf+V+α^Sf-1)を生成して出力する。
乗算部94は、記憶部95cに記憶された所定の係数αを前フレーム復号差分ベクトル^Sf-1に乗じてベクトルα×^Sf-1を得る。
図2では、2つの加算部95a及び95bを用いて、まず、加算部95aにおいて、現在のフレームの復号差分ベクトル^Sfに、ベクトルα×^Sf-1を加算した後、加算部95bにおいて予測対応平均ベクトルVを加算しているが、この順序は逆であってもよい。あるいは、ベクトルα×^Sf-1と予測対応平均ベクトルVとを加算したベクトルを、復号差分ベクトル^Sfに加算することで復号予測対応LSPパラメータベクトル^Θfを生成してもよい。
なお、ここで用いる予測対応平均ベクトルVは、前述の線形予測係数符号化装置80の予測対応減算部83で用いた予測対応平均ベクトルVと同じものとする。
<復号予測対応線形予測係数計算部96>
線形予測係数が必要な場合には、線形予測係数復号装置90に復号予測対応線形予測係数計算部96を備えてもよい。この場合は、復号予測対応線形予測係数計算部96は、復号予測対応LSPパラメータベクトル^Θfを受け取り、復号予測対応LSPパラメータベクトル^Θfを復号予測対応線形予測係数^af[1],^af[2],…,^af[p]に変換して出力する。
線形予測係数が必要な場合には、線形予測係数復号装置90に復号予測対応線形予測係数計算部96を備えてもよい。この場合は、復号予測対応線形予測係数計算部96は、復号予測対応LSPパラメータベクトル^Θfを受け取り、復号予測対応LSPパラメータベクトル^Θfを復号予測対応線形予測係数^af[1],^af[2],…,^af[p]に変換して出力する。
"ITU-T Recommendation G.729", ITU, 1996
非特許文献1の線形予測係数復号装置では、f−1番目のフレームの復号結果である復号差分ベクトル^Sf-1を用いてf番目のフレームの復号処理を行うため、現フレームのLSP符号に伝送誤りが生じた場合だけではなく、1つ前のフレームのLSP符号に伝送誤りが生じた場合にも、現フレームのLSPパラメータも正しく復号できなくなってしまうという問題がある。
非特許文献1の線形予測係数復号装置では、復号により得られたLSPパラメータは線形予測合成のみに用いられるため、LSPパラメータが正しく復号できなかったとしても、連続する複数のフレームで復号音響信号の音質が劣化する程度の問題で済む。すなわち、非特許文献1の線形予測係数符号化装置と線形予測係数復号装置は、LSPパラメータが正しく復号できなかった場合の問題よりも、LSPパラメータを少ない符号量で表すことを優先した構成であると言える。
しかし、線形予測係数符号化装置及び線形予測係数復号装置は、LSPパラメータを、線形予測分析及び合成に用いるだけではなく、LSPパラメータから求まるスペクトル包絡を構成する各振幅値に依存した可変長符号化及び復号にも用いる符号化装置及び復号装置にも利用される。この場合は、1つのフレームでLSPパラメータが正しく復号できなかったときには、そのフレームを含む連続する複数のフレームで可変長復号を正しく行うことができず復号音響信号を得ることができない、という問題が生じる。
このような問題に鑑み、本発明では、例えば線形予測分析及び合成に用いるような、線形予測係数に変換可能な係数を少ない符号量で精度良く表せる符号化方法及び復号方法である予測対応の符号化方法及び復号方法と、例えばLSPパラメータから求まるスペクトル包絡を構成する各振幅値に依存した可変長符号化/復号に用いるような、前のフレームの線形予測係数に変換可能な係数に対応する符号である線形予測係数符号(例えば、LSP符号)が線形予測係数復号装置へ正しく入力されなかったとしても、現フレームの線形予測係数符号が線形予測係数復号装置へ正しく入力されれば、現フレームの線形予測係数に変換可能な係数を正しく復号できるような符号化方法及び復号方法と、を併用可能な、線形予測係数に変換可能な係数の復号方法を提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、復号装置は、第一符号を復号して復号差分ベクトルを得て、復号差分ベクトルと、少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号部と、第二符号を復号して復号補正ベクトルを得て、復号補正ベクトルと、少なくとも復号差分ベクトルとの対応する次数の要素同士を加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号部とを含む。
上記の課題を解決するために、本発明の他の態様によれば、復号装置は、第一符号を復号して復号差分ベクトルを得て、復号差分ベクトルと、少なくとも過去のフレームからの予測と予め定めたベクトルとからなる予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号部と、第二符号を復号して復号補正ベクトルを得て、復号補正ベクトルに、少なくとも復号差分ベクトルと予め定めたベクトルとを対応する次数の要素毎に加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号部とを含む。
上記の課題を解決するために、本発明の他の態様によれば、復号方法は、第一符号を復号して復号差分ベクトルを得て、復号差分ベクトルと、少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号ステップと、第二符号を復号して復号補正ベクトルを得て、復号補正ベクトルと、少なくとも復号差分ベクトルとの対応する次数の要素同士を加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号ステップとを含む。
上記の課題を解決するために、本発明の他の態様によれば、復号方法は、第一符号を復号して復号差分ベクトルを得て、復号差分ベクトルと、少なくとも過去のフレームからの予測と予め定めたベクトルとからなる予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号ステップと、第二符号を復号して復号補正ベクトルを得て、復号補正ベクトルに、少なくとも復号差分ベクトルと予め定めたベクトルとを対応する次数の要素毎に加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号ステップとを含む。
本発明によれば、線形予測係数に変換可能な係数を少ない符号量で精度良く表せる符号化方法及び復号方法である予測対応の符号化方法及び復号方法と、前のフレームの線形予測係数符号が線形予測係数復号装置へ正しく入力されなかったとしても、現フレームの線形予測係数符号が線形予測係数復号装置へ正しく入力されれば、現フレームの線形予測係数に変換可能な係数を正しく復号できるような符号化方法及び復号方法と、を併用できるという効果を奏する。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」、「~」、「−」等は、本来直後の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直前に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
以下、従来の線形予測係数符号化装置及び線形予測係数復号装置と異なる点を中心に説明する。
以下、従来の線形予測係数符号化装置及び線形予測係数復号装置と異なる点を中心に説明する。
<第一実施形態に係る線形予測係数符号化装置100>
図3は第一実施形態に係る線形予測係数符号化装置100の機能ブロック図を、図4はその処理フローの例を示す。
図3は第一実施形態に係る線形予測係数符号化装置100の機能ブロック図を、図4はその処理フローの例を示す。
線形予測係数符号化装置100は、線形予測分析部81とLSP計算部82と予測対応符号化部120と非予測対応符号化部110とを含む。線形予測分析部81とLSP計算部82とにおける処理は、従来技術で説明した内容と同じであり、図4のs81〜s82に対応する。
線形予測係数符号化装置100は、音響信号Xfを受け取り、LSP符号Cf及び補正LSP符号Dfを得て出力する。線形予測係数符号化装置100から出力された符号は線形予測係数復号装置200に入力される。なお、音響信号Xfに由来するLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tが別の装置により生成されており、線形予測係数符号化装置1
00の入力がLSPパラメータベクトルΘfである場合には、線形予測係数符号化装置100は、線形予測分析部81とLSP計算部82とを含まなくともよい。
00の入力がLSPパラメータベクトルΘfである場合には、線形予測係数符号化装置100は、線形予測分析部81とLSP計算部82とを含まなくともよい。
<予測対応符号化部120>
予測対応符号化部120は、予測対応減算部83とベクトル符号化部84とベクトル符号帳86と遅延入力部87とを含み、各部における処理は、従来技術で説明した内容と同じである。予測対応減算部83とベクトル符号化部84と遅延入力部87とにおける処理はそれぞれ、図4のs83〜s87に対応する。ただし、ベクトル符号化部84は、量子化差分ベクトル^Sfを遅延入力部87だけでなく、非予測対応符号化部110にも出力する。
予測対応符号化部120は、予測対応減算部83とベクトル符号化部84とベクトル符号帳86と遅延入力部87とを含み、各部における処理は、従来技術で説明した内容と同じである。予測対応減算部83とベクトル符号化部84と遅延入力部87とにおける処理はそれぞれ、図4のs83〜s87に対応する。ただし、ベクトル符号化部84は、量子化差分ベクトル^Sfを遅延入力部87だけでなく、非予測対応符号化部110にも出力する。
予測対応符号化部120は、LSPパラメータベクトルΘfを受け取り、LSPパラメータベクトルΘfと、少なくとも過去のフレームからの予測を含む予測ベクトルとの差分からなる差分ベクトルSfを符号化して、LSP符号CfとLSP符号Cfに対応する量子化差分ベクトル^Sfを得て(s120)出力する。なお、LSP符号Cfに対応する量子化差分ベクトル^Sfは、差分ベクトルSfの各要素値に対応する量子化値からなるベクトルである。
ここで、少なくとも過去のフレームからの予測を含む予測ベクトルとは、例えば、予め定めた予測対応平均ベクトルVと、1つ前のフレームの量子化差分ベクトル(前フレーム量子化差分ベクトル)^Sf-1の各要素に予め定めたαを乗算して得られるベクトルと、を加算して得られるベクトルV+α×^Sf-1である。この例では、予測ベクトルに含まれる過去のフレームからの予測分を表すベクトルは、前フレーム量子化差分ベクトル^Sf-1のα倍であるα×^Sf-1である。
なお、予測対応符号化部120は、LSPパラメータベクトルΘf以外に外部からの入力を必要としないので、LSPパラメータベクトルΘfを符号化してLSP符号Cfを得ていると言ってもよい。
また、予測対応符号化部120では生成していないが、予測対応符号化部120におけるLSPパラメータベクトルΘfの各要素を量子化して得られる予測対応量子化LSPパラメータベクトル^Θfは、量子化差分ベクトル^Sfに予測ベクトルV+α×^Sf-1を加算したものであると言える。すなわち、予測対応量子化LSPパラメータベクトルは^Θf=^Sf+V+α×^Sf-1である。また、予測対応符号化部120における量子化誤差ベクトルはΘf-^Θf=Θf-(^Sf+V+α×^Sf-1)である。
<非予測対応符号化部110>
非予測対応符号化部110は、非予測対応減算部111と補正ベクトル符号化部112と補正ベクトル符号帳113とを含む。
非予測対応符号化部110は、非予測対応減算部111と補正ベクトル符号化部112と補正ベクトル符号帳113とを含む。
非予測対応符号化部110は、LSPパラメータベクトルΘfと量子化差分ベクトル^Sfとを受け取り、LSPパラメータベクトルΘfと量子化差分ベクトル^Sfとの差分である補正ベクトルを符号化して補正LSP符号Dfを得て(s110)出力する。
ここで、補正ベクトルはΘf-^Sfであり、予測対応符号化部120の量子化誤差ベクトルはΘf-^Θf=Θf-(^Sf+V+α×^Sf-1)であるので、補正ベクトルは予測対応符号化部120の量子化誤差ベクトルΘf-^Θfと予測対応平均ベクトルVとα倍を乗算した前フレーム量子化差分ベクトルα×^Sf-1とを加算したものである。すなわち、非予測対応符号化部110は、量子化誤差ベクトルΘf-^Θfと予測ベクトルV+α×^Sf-1とを加算したものを符号化して補正LSP符号Dfを得ているとも言える。
補正ベクトルΘf-^Sfの符号化には周知の符号化方法の何れを用いてもよいが、以下の説明では、補正ベクトルΘf-^Sfから非予測対応平均ベクトルYを減算したものをベクトル量子化する方法について説明する。なお、以下の説明では、補正ベクトルΘf-^Sfから非予測対応平均ベクトルYを減算して得られるベクトルであるUf=Θf-Y-^Sfを、便宜的に補正ベクトルと呼んでいる。
以下、各部の処理について説明する。
<非予測対応減算部111>
非予測対応減算部111は、例えば、非予測対応平均ベクトルYを記憶した記憶部111c、減算部111a及び111bを含んで構成される。
非予測対応減算部111は、例えば、非予測対応平均ベクトルYを記憶した記憶部111c、減算部111a及び111bを含んで構成される。
非予測対応減算部111は、LSP計算部82から出力されたLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tと、量子化差分ベクトル^Sfとを受け取る。
非予測対応減算部111は、LSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tから、量子化差分ベクトル^Sf=(^sf[1], ^sf [2],…, ^sf[p])Tと、非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと、を減算して得られるベクトルである補正ベクトルUf=Θf-Y-^Sfを生成して(s111)出力する。
なお、図3では、2つの減算部111a及び111bを用いて、まず、減算部111aにおいてLSPパラメータベクトルΘfから記憶部111cに記憶された非予測対応平均ベクトルYを減算した後、減算部111bにおいて量子化差分ベクトル^Sfを減算しているが、これらの減算の順序は逆であってもよい。あるいは、非予測対応平均ベクトルYと量子化差分ベクトル^Sfを加算したベクトルを、LSPパラメータベクトルΘfから減算することで補正ベクトルUfを生成してもよい。
なお、非予測対応平均ベクトルYは、予め定めたベクトルであり、例えば、予め学習用の音響信号から求めておけばよい。例えば、対応する線形予測係数符号化装置100において、符号化の対象となる音響信号と、同じ環境(例えば、話者、収音装置、場所)で収音した音響信号を学習用の入力音響信号として用いて、多数のフレームの、LSPパラメータベクトルとそのLSPパラメータベクトルに対する量子化差分ベクトルとの差分を求め、その差分の平均を非予測対応平均ベクトルとする。
<補正ベクトル符号帳113>
補正ベクトル符号帳113には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
補正ベクトル符号帳113には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
<補正ベクトル符号化部112>
補正ベクトル符号化部112は、補正ベクトルUfを受け取り、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s112)出力する。例えば、補正ベクトル符号化部112は、補正ベクトル符号帳113に記憶されている複数の候補補正ベクトルの中から、補正ベクトルUfに最も近い候補補正ベクトルを探索し、その候補補正ベクトルに対応する補正ベクトル符号を補正LSP符号Dfとして出力する。なお、補正ベクトル符号化部112では実際には生成しないでよいが、補正ベクトルUfに最も近い候補補正ベクトルを量子化済補正ベクトル^Ufとして以下の説明を行う。
補正ベクトル符号化部112は、補正ベクトルUfを受け取り、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s112)出力する。例えば、補正ベクトル符号化部112は、補正ベクトル符号帳113に記憶されている複数の候補補正ベクトルの中から、補正ベクトルUfに最も近い候補補正ベクトルを探索し、その候補補正ベクトルに対応する補正ベクトル符号を補正LSP符号Dfとして出力する。なお、補正ベクトル符号化部112では実際には生成しないでよいが、補正ベクトルUfに最も近い候補補正ベクトルを量子化済補正ベクトル^Ufとして以下の説明を行う。
なお、前述の通り、補正ベクトルは、予測対応符号化部120の前フレームからの予測分である前フレーム量子化差分ベクトル^Sf-1を少なくとも含むので、補正ベクトル符号化部112は少なくとも予測対応符号化部120の前フレームからの予測分を符号化するともいえる。
また、非予測対応符号化部110では生成しないでよいが、非予測対応符号化部110におけるLSPパラメータベクトルΘfの各要素を量子化して得られる非予測対応量子化LSPパラメータベクトル^Φfは、非予測対応平均ベクトルYと量子化差分ベクトル^Sfと量子化済補正ベクトル^Ufを加算したものである。すなわち、^Φf=^Uf+Y+^Sfである。
<第一実施形態に係る線形予測係数復号装置200>
以下、従来と異なる点を中心に説明する。
以下、従来と異なる点を中心に説明する。
図5は第一実施形態に係る線形予測係数復号装置200の機能ブロック図を、図6はその処理フローの例を示す。
線形予測係数復号装置200は、予測対応復号部220と非予測対応復号部210とを含む。
線形予測係数復号装置200は、LSP符号Cfと補正LSP符号Dfとを受け取り、復号予測対応LSPパラメータベクトル^Θ=(^θf[1],^θf[2],…,^θf[p])と復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])とを生成して出力する。また、必要に応じて、復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]と復号非予測対応LSPパラメータ^φf[1],^φf[2],…,^φf[p]のそれぞれを線形予測係数に変換して得られる復号予測対応線形予測係数^af[1],^af[2],…,^af[p]と復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]とを生成して出力する。
<予測対応復号部220>
予測対応復号部220は、従来技術の線形予測係数復号装置90と同様の構成であり、ベクトル符号帳92とベクトル復号部91と遅延入力部93と予測対応加算部95とを含み、必要に応じて復号予測対応線形予測係数計算部96も含む。ベクトル復号部91と遅延入力部93と予測対応加算部95と復号予測対応線形予測係数計算部96における処理は、それぞれ図6のs91〜s96に対応する。
予測対応復号部220は、従来技術の線形予測係数復号装置90と同様の構成であり、ベクトル符号帳92とベクトル復号部91と遅延入力部93と予測対応加算部95とを含み、必要に応じて復号予測対応線形予測係数計算部96も含む。ベクトル復号部91と遅延入力部93と予測対応加算部95と復号予測対応線形予測係数計算部96における処理は、それぞれ図6のs91〜s96に対応する。
予測対応復号部220は、LSP符号Cfを受け取り、LSP符号Cfを復号して復号差分ベクトル^Sfを得て、復号差分ベクトル^Sfと少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、LSPパラメータベクトルの各要素の復号値^θf[1],^θf[2],…,^θf[p]からなる復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])を生成して(s220)出力する。予測対応復号部220は、必要に応じて、さらに、復号予測対応LSPパラメータベクトル^Θfを復号予測対応線形予測係数^af[1],^af[2],…,^af[p]に変換して(s220)出力する。
本実施形態では、予測ベクトルは、予め定めた予測対応平均ベクトルVと、過去のフレームの復号差分ベクトル^Sf-1のα倍とを加算して得られるベクトル(V+α×^Sf-1)である。
なお、ベクトル復号部91は、復号差分ベクトル^Sfを遅延入力部93、予測対応加算部95に加えて、非予測対応復号部210の非予測対応加算部213にも出力する。
<非予測対応復号部210>
非予測対応復号部210は、補正ベクトル符号帳212と補正ベクトル復号部211と非予測対応加算部213とを含み、必要に応じて復号非予測対応線形予測係数計算部214も含む。
非予測対応復号部210は、補正ベクトル符号帳212と補正ベクトル復号部211と非予測対応加算部213とを含み、必要に応じて復号非予測対応線形予測係数計算部214も含む。
非予測対応復号部210には、補正LSP符号Dfと復号差分ベクトル^Sfとが入力される。非予測対応復号部210は、補正LSP符号Dfを復号して復号補正ベクトル^Uf=(^uf[1], ^uf [2],…, ^uf[p])Tを得る。非予測対応復号部210は、さらに、復号補正ベクトル^Ufに、少なくとも復号差分ベクトル^Sfを加算して、現在のフレームのLSPパラメータベクトルの各要素の復号値^φf[1],^φf[2],…,^φf[p]からなる復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])を生成して(s210)出力する。非予測対応復号部210は、必要に応じて、さらに、復号非予測対応LSPパラメータベクトル^Φfを復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]に変換して(s210)出力する。
本実施形態では、復号非予測対応LSPパラメータベクトル^Φfは、補正LSP符号Dfを復号して得られる復号補正ベクトル^Ufに、LSP符号Cfを復号して得られる復号差分ベクトル^Sfと、予め定めた非予測対応平均ベクトルYを、加算して得られるベクトルである。すなわち、非予測対応復号部210では、現フレームで入力された符号のみから現フレームのLSPパラメータベクトルの復号ベクトル^Φfを得ていることになる。
以下、各部の処理内容を説明する。
<補正ベクトル符号帳212>
補正ベクトル符号帳212は、線形予測係数符号化装置100内の補正ベクトル符号帳113と同じ内容の情報を記憶している。つまり、補正ベクトル符号帳212には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
補正ベクトル符号帳212は、線形予測係数符号化装置100内の補正ベクトル符号帳113と同じ内容の情報を記憶している。つまり、補正ベクトル符号帳212には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
<補正ベクトル復号部211>
補正ベクトル復号部211は、補正LSP符号Dfを受け取り、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得て(s211)出力する。例えば、補正ベクトル復号部211は、補正ベクトル符号帳212に記憶されている複数の補正ベクトル符号の中から、線形予測係数復号装置200に入力された補正LSP符号Dfに対応する補正ベクトル符号を探索し、探索された補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして出力する。
補正ベクトル復号部211は、補正LSP符号Dfを受け取り、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得て(s211)出力する。例えば、補正ベクトル復号部211は、補正ベクトル符号帳212に記憶されている複数の補正ベクトル符号の中から、線形予測係数復号装置200に入力された補正LSP符号Dfに対応する補正ベクトル符号を探索し、探索された補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして出力する。
<非予測対応加算部213>
非予測対応加算部213は、例えば、非予測対応平均ベクトルYを記憶した記憶部213c、加算部213a及び213bを含んで構成される。
非予測対応加算部213は、例えば、非予測対応平均ベクトルYを記憶した記憶部213c、加算部213a及び213bを含んで構成される。
非予測対応加算部213は、復号補正ベクトル^Ufと復号差分ベクトル^Sfとを受け取る。非予測対応加算部213は、復号補正ベクトル^Ufと復号差分ベクトル^Sfと記憶部213cに記憶された非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=^Uf+Y+^Sf=(^φf[1],^φf[2],…,^φf[p])を生成して(s213)出力する。なお、図5では、2つの加算部213a及び213bを用いて、まず、加算部213aにおいて復号補正ベクトル^Ufに復号差分ベクトル^Sfを加算した後、加算部213bにおいて記憶部213cに記憶された非予測対応平均ベクトルYを加算しているが、これらの加算の順序は逆であってもよい。あるいは、非予測対応平均ベクトルYと復号差分ベクトル^Sfを加算したベクトルを、復号補正ベクトル^Ufに加算することで復号非予測対応LSPパラメータベクトル^Φfを生成してもよい。
なお、ここで用いる非予測対応平均ベクトルYは、前述の線形予測係数符号化装置100の非予測対応減算部111で用いた非予測対応平均ベクトルYと同じものとする。
<復号非予測対応線形予測係数計算部214>
復号非予測対応線形予測係数計算部214は、復号非予測対応LSPパラメータベクトル^Φfを受け取る。復号非予測対応線形予測係数計算部214は、復号非予測対応LSPパラメータベクトル^Φfを復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]に変換して(s214)出力する。
復号非予測対応線形予測係数計算部214は、復号非予測対応LSPパラメータベクトル^Φfを受け取る。復号非予測対応線形予測係数計算部214は、復号非予測対応LSPパラメータベクトル^Φfを復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]に変換して(s214)出力する。
<第一実施形態の効果>
第一実施形態の線形予測係数復号装置によれば、f-1番目のフレームのLSP符号Cf-1に伝送誤りが生じて復号差分ベクトル^Sf-1が正しく復号できなかったとしても、非予測対応復号部210で復号差分ベクトル^Sf-1に依存しないLSPパラメータベクトルの復号値である復号非予測対応LSPパラメータベクトル^Φfを得られるので、f-1番目のフレームのLSP符号Cf-1の伝送誤りをf番目のフレームの復号非予測対応LSPパラメータベクトル^Φfに影響させなくすることができる。例えば、LSPパラメータベクトルから求まるスペクトル包絡を構成する各振幅値に依存した可変長符号化/復号に用いるLSPパラメータベクトルとして非予測対応量子化LSPパラメータベクトル/復号非予測対応LSPパラメータベクトル^Φfを用いる場合であれば、f-1番目のフレームで正しい復号非予測対応LSPパラメータベクトル^Φfが得られずに可変長復号を正しく行うことができなかったとしても、f番目のフレームでは正しい復号非予測対応LSPパラメータベクトル^Φfが得られ、可変長復号を正しく行うことができる。
第一実施形態の線形予測係数復号装置によれば、f-1番目のフレームのLSP符号Cf-1に伝送誤りが生じて復号差分ベクトル^Sf-1が正しく復号できなかったとしても、非予測対応復号部210で復号差分ベクトル^Sf-1に依存しないLSPパラメータベクトルの復号値である復号非予測対応LSPパラメータベクトル^Φfを得られるので、f-1番目のフレームのLSP符号Cf-1の伝送誤りをf番目のフレームの復号非予測対応LSPパラメータベクトル^Φfに影響させなくすることができる。例えば、LSPパラメータベクトルから求まるスペクトル包絡を構成する各振幅値に依存した可変長符号化/復号に用いるLSPパラメータベクトルとして非予測対応量子化LSPパラメータベクトル/復号非予測対応LSPパラメータベクトル^Φfを用いる場合であれば、f-1番目のフレームで正しい復号非予測対応LSPパラメータベクトル^Φfが得られずに可変長復号を正しく行うことができなかったとしても、f番目のフレームでは正しい復号非予測対応LSPパラメータベクトル^Φfが得られ、可変長復号を正しく行うことができる。
なお、補正ベクトルは、LSPパラメータベクトルほど精度よく(量子化誤差が小さくなるように)量子化される必要はないため、補正ベクトル符号帳113に用意しておく候補補正ベクトルの種類は少なくともよい。例えば、補正ベクトル符号のビット長は、2bitであり、補正ベクトル符号帳113には、4種類の補正ベクトル符号(「00」「01」「10」「11」)に対応する4種類の候補補正ベクトルが格納されている。
そのため、補正ベクトル符号帳に用意しておく候補補正ベクトルの種類を少なくすることができ、小さい符号量の符号を割り当てることができる。よって、少ない符号量の増加で、従来よりも歪の小さい符号化及び復号を実現することができる。
<変形例>
本実施形態では、LSPパラメータについて記載しているが、複数次の線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。PARCOR係数や、LSPパラメータまたはPARCOR係数を変形した係数、さらには、線形予測係数自体を対象としてもよい。これら全ての係数は、音声符号化の技術分野では、互いに変換可能なものであり、何れの係数を用いても第一実施形態の効果を得ることができる。なお、LSP符号CfまたはLSP符号Cfに対応する符号を第一符号ともいい、予測対応符号化部を第一符号化部ともいう。同様に、補正LSP符号または補正LSP符号に対応する符号を第二符号ともいい、非予測対応符号化部を第二符号化部ともいう。また、復号予測対応LSPパラメータベクトル^Θfまたは復号予測対応LSPパラメータベクトル^Θfに対応するベクトルを第一復号ベクトルともいい、予測対応復号部を第一復号部ともいう。また、復号非予測対応LSPパラメータベクトル^Φfまたは復号非予測対応LSPパラメータベクトル^Φfに対応するベクトルを第二復号ベクトルともいい、非予測対応復号部を第二復号部ともいう。
本実施形態では、LSPパラメータについて記載しているが、複数次の線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。PARCOR係数や、LSPパラメータまたはPARCOR係数を変形した係数、さらには、線形予測係数自体を対象としてもよい。これら全ての係数は、音声符号化の技術分野では、互いに変換可能なものであり、何れの係数を用いても第一実施形態の効果を得ることができる。なお、LSP符号CfまたはLSP符号Cfに対応する符号を第一符号ともいい、予測対応符号化部を第一符号化部ともいう。同様に、補正LSP符号または補正LSP符号に対応する符号を第二符号ともいい、非予測対応符号化部を第二符号化部ともいう。また、復号予測対応LSPパラメータベクトル^Θfまたは復号予測対応LSPパラメータベクトル^Θfに対応するベクトルを第一復号ベクトルともいい、予測対応復号部を第一復号部ともいう。また、復号非予測対応LSPパラメータベクトル^Φfまたは復号非予測対応LSPパラメータベクトル^Φfに対応するベクトルを第二復号ベクトルともいい、非予測対応復号部を第二復号部ともいう。
本実施形態では、「過去のフレーム」として1フレーム分のみを利用しているが、必要に応じて適宜、2フレーム分以上を利用してもよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態と異なる部分を中心に説明する。
本実施形態では、補正ベクトルを符号化するか否か、及び、補正LSP符号を復号するか否かを、スペクトル包絡の振幅の凹凸の変化が大きさ、言い換えると、スペクトル包絡の山谷の大きさを利用して決定する。
スペクトル包絡の振幅の凹凸の変化の大きさに関わらずLSPパラメータを同じ符号量で符号化すると、スペクトル包絡の振幅の凹凸の変化が大きいのほうがスペクトル包絡の振幅の凹凸の変化が小さいときよりも量子化誤差は大きい。そこで、LSPの量子化誤差が大きいと思われる場合にのみ、線形予測係数符号化装置は補正ベクトル符号化部を実行して補正LSP符号Dfを出力し、線形予測係数復号装置は補正LSP符号Dfを復号することで、第一実施形態よりも全体として符号量を削減しつつ、従来技術よりは符号の伝送誤りによる音質劣化が少ない符号化及び復号処理を行うことができる。
<第二実施形態に係る線形予測係数符号化装置300>
図7は第二実施形態に係る線形予測係数符号化装置300の機能ブロック図を、図8はその処理フローの例を示す。
<第二実施形態に係る線形予測係数符号化装置300>
図7は第二実施形態に係る線形予測係数符号化装置300の機能ブロック図を、図8はその処理フローの例を示す。
第二実施形態の線形予測係数符号化装置300は、非予測対応符号化部110に代えて、非予測対応符号化部310を含む。第一実施形態の線形予測係数符号化装置100と同様に、音響信号Xfに由来するLSPパラメータθが別の装置により生成されており、線形予測係数符号化装置300の入力がLSPパラメータθf[1],θf[2],…,θf[p]である場合には、線形予測係数符号化装置300は、線形予測分析部81とLSP計算部82とを含まなくてよい。
非予測対応符号化部310は、非予測対応減算部311と補正ベクトル符号化部312と補正ベクトル符号帳113と予測対応加算部314と指標計算部315とを含む。指標計算部315の計算結果に応じて、非予測対応減算部311において減算処理を実行するか否か、及び、補正ベクトル符号化部312において符号化処理を実行するか否かが決定される点が異なる。
なお、予測対応符号化部120は、量子化差分ベクトル^Sfに加えて、乗算部88の出力値であるベクトルα×^Sf-1を出力する。
<予測対応加算部314>
予測対応加算部314は、例えば、予測対応平均ベクトルVを記憶した記憶部314c、加算部314a及び314bを含んで構成される。
予測対応加算部314は、例えば、予測対応平均ベクトルVを記憶した記憶部314c、加算部314a及び314bを含んで構成される。
予測対応加算部314は、現在のフレームの量子化差分ベクトル^Sf、及び前フレーム量子化差分ベクトル^Sf-1に所定の係数αを乗じたベクトルα×^Sf-1を受け取る。
予測対応加算部314は、量子化差分ベクトル^Sfと、予測対応平均ベクトルVと、ベクトルα×^Sf-1とを加算したベクトルである予測対応量子化LSPパラメータベクトル^Θf(=^Sf+V+α^Sf-1)=(^θf[1],^θf[2],…,^θf[p])Tを生成して(s314)出力する。
図7では、2つの加算部314a及び314bを用いて、まず、加算部314bにおいて、現在のフレームの量子化差分ベクトル^Sfに、ベクトルα×^Sf-1を加算した後、加算部314aにおいて予測対応平均ベクトルVを加算しているが、この順序は逆であってもよい。あるいは、ベクトルα×^Sf-1と予測対応平均ベクトルVとを加算したベクトルを、量子化差分ベクトル^Sfに加算することで予測対応量子化LSPパラメータベクトル^Θfを生成してもよい。
なお、予測対応加算部314に入力される現在のフレームの量子化差分ベクトル^Sf、前フレーム量子化差分ベクトル^Sf-1に所定の係数αを乗じたベクトルα×^Sf-1は共に予測対応符号化部120でも生成されたものであり、予測対応加算部314内の記憶部314cに記憶されている予測対応平均ベクトルVは予測対応符号化部120内の記憶部83dに記憶されている予測対応平均ベクトルVと同じであるので、予測対応加算部314が行う処理を予測対応符号化部120が行って予測対応量子化LSPパラメータベクトル^Θfを生成して非予測対応符号化部310に出力し、非予測対応符号化部310には予測対応加算部314を備えない構成としてもよい。
<指標計算部315>
指標計算部315は、予測対応量子化LSPパラメータベクトル^Θfを受け取る。指標計算部315は、予測対応量子化LSPパラメータベクトル^Θfを用いて、予測対応量子化LSPパラメータベクトル^Θfに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、及び/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s315)。指標計算部315は、指標Q及び/またはQ’の大きさに応じて、補正ベクトル符号化部312に符号化処理を実行するように、または、所定のビット数で符号化処理を実行するように制御信号Cを出力する。また、指標計算部315は、指標Q及び/またはQ’の大きさに応じて、非予測対応減算部311に減算処理を実行するように制御信号Cを出力する。以下に、制御信号Cの生成方法を説明する。
指標計算部315は、予測対応量子化LSPパラメータベクトル^Θfを受け取る。指標計算部315は、予測対応量子化LSPパラメータベクトル^Θfを用いて、予測対応量子化LSPパラメータベクトル^Θfに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、及び/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s315)。指標計算部315は、指標Q及び/またはQ’の大きさに応じて、補正ベクトル符号化部312に符号化処理を実行するように、または、所定のビット数で符号化処理を実行するように制御信号Cを出力する。また、指標計算部315は、指標Q及び/またはQ’の大きさに応じて、非予測対応減算部311に減算処理を実行するように制御信号Cを出力する。以下に、制御信号Cの生成方法を説明する。
一般に、LSPパラメータは入力音響信号のパワースペクトル包絡と相関性のある周波数領域のパラメータ列であり、LSPパラメータの各値は入力音響信号のパワースペクトル包絡の極値の周波数位置と相関する。LSPパラメータをθ[1],θ[2],…,θ[p]としたとき、θ[i]とθ[i+1]の間の周波数位置にパワースペクトル包絡の極値が存在し、この極値の周りの接線の傾きが急峻であるほどθ[i]とθ[i+1]との間隔(つまり、(θ[i+1]-θ[i])の値)が小さくなる。すなわち、パワースペクトル包絡の振幅の凹凸が急峻であるほど、各iについて、θ[i]とθ[i+1]との間隔が不均一になる、すなわち、LSPパラメータの間隔の分散が大きくなる。逆に、パワースペクトル包絡の凹凸がほとんどない場合は、各iについて、θ[i]とθ[i+1]との間隔が均等間隔に近くなる、すなわち、LSPパラメータの間隔の分散が小さくなる。
よって、LSPパラメータの間隔の分散に対応する指標が大きいことは、パワースペクトル包絡の振幅の凹凸の変化が大きいことを意味する。また、LSPパラメータの間隔の最小値に対応する指標が小さいことは、パワースペクトル包絡の振幅の凹凸の変化が大きいことを意味する。
予測対応量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]はLSPパラメータθf[1],θf[2],…,θf[p]を量子化して得られたものであり、復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]はLSP符号Cfが線形予測符号化装置から線形予測復号装置に誤りなく入力されていれば予測対応量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]と同じであるので、予測対応量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]や復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]についてもLSPパラメータθf[1],θf[2],…,θf[p]と同様の性質が成り立つ。
そのため、予測対応量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の間隔の分散に対応する値をスペクトル包絡の山谷が大きいほど大きくなる指標Qとして、予測対応量子化LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])中の次数が隣接する予測対応量子化LSPパラメータの差分(^θf[i+1]-^θf[i])の最小値をスペクトル包絡の山谷が大きいほど小さくなる指標Q’として、それぞれ用いることができる。
スペクトル包絡の山谷が大きいほど大きくなる指標Qは、例えば、所定の次数T(T≦p)以下の予測対応量子化LSPパラメータベクトル^Θfの要素である予測対応量子化LSPパラメータの間隔の分散を表す指標Q、すなわち、
により計算する。
により計算する。
また、スペクトル包絡の山谷が大きいほど小さくなる指標Q’は、例えば、所定の次数T(T≦p)以下の予測対応量子化LSPパラメータベクトル^Θfの次数が隣接する予測対応量子化LSPパラメータの間隔の最小値を表す指標Q’、すなわち、
あるいは、予測対応量子化LSPパラメータベクトル^Θfの次数が隣接する予測対応量子化済LSPパラメータの間隔、および、最低次の予測対応量子化LSPパラメータの値、のうちの最小値を表す指標Q’
により計算する。LSPパラメータは0からπの間に次数順に存在するパラメータであるので、この式の最低次の予測対応量子化LSPパラメータ^θf[1]は、^θf[1]と0との間隔(^θf[1]-0)を意味する。
により計算する。LSPパラメータは0からπの間に次数順に存在するパラメータであるので、この式の最低次の予測対応量子化LSPパラメータ^θf[1]は、^θf[1]と0との間隔(^θf[1]-0)を意味する。
指標計算部315は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、非予測対応減算部311および補正ベクトル符号化部312に補正符号化処理を実行することを示す制御信号Cを出力し、それ以外の場合に、非予測対応減算部311および補正ベクトル符号化部312に補正符号化処理を実行しないことを示す制御信号Cを出力する。ここで、「(A-1)の場合、および/または、(B-1)の場合」は、指標Qだけを求めて(A-1)の条件をみたす場合、指標Q’だけを求めて(B-1)の条件をみたす場合、指標Qと指標Q’の両方を求めて(A-1)と(B-1)の両方の条件をみたす場合、の3つの場合を含む表現である。もちろん、(A-1)の条件をみたすか否かを判定する場合であっても指標Q’を求めてもよいし、(B-1)の条件をみたすか否かを判定する場合であっても指標Qを求めてもよい。以下の記載中の「および/または」についても同様である。
また、指標計算部315は、(A-1)および/または(B-1)の場合に、所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、非予測対応減算部311において、制御信号Cを受け取ったときに減算処理を実行し、補正ベクトル符号化部312において、制御信号Cを受け取ったときに符号化処理を実行する構成としている場合には、(A-1)および/または(B-1)以外の場合に、指標計算部315は制御信号Cを出力しない構成としてもよい。
<非予測対応減算部311>
非予測対応減算部311は、制御信号CとLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tと量子化差分ベクトル^Sfとを受け取る。
非予測対応減算部311は、制御信号CとLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tと量子化差分ベクトル^Sfとを受け取る。
非予測対応減算部311は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、LSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tから、量子化差分ベクトル^Sf-1と、非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと、を減算して得られるベクトルである補正ベクトルUf=Θf-Y-^Sfを生成し(s311)て出力する。
<補正ベクトル符号化部312>
補正ベクトル符号化部312は、制御信号Cと補正ベクトルUfを受け取る。補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル符号化部312は、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s312)出力する。補正ベクトルUfを符号化する符号化処理自体は、補正ベクトル符号化部112と同様である。
補正ベクトル符号化部312は、制御信号Cと補正ベクトルUfを受け取る。補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル符号化部312は、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s312)出力する。補正ベクトルUfを符号化する符号化処理自体は、補正ベクトル符号化部112と同様である。
補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正ベクトル符号化部312は、補正ベクトルUfの符号化を行わず、補正LSP符号Dfを得ず出力しない。
<第二実施形態に係る線形予測係数復号装置400>
図9は第二実施形態に係る線形予測係数復号装置400の機能ブロック図を、図10はその処理フローの例を示す。
図9は第二実施形態に係る線形予測係数復号装置400の機能ブロック図を、図10はその処理フローの例を示す。
第二実施形態の線形予測係数復号装置400は、非予測対応復号部210に代えて、非予測対応復号部410を含む。
非予測対応復号部410は、補正ベクトル符号帳212と補正ベクトル復号部411と非予測対応加算部413と指標計算部415とを含み、必要に応じて復号非予測対応線形予測係数計算部214も含む。
指標計算部415の計算結果に応じて、非予測対応加算部413において加算処理を実行するか否か、及び、補正ベクトル復号部411において復号処理を実行するか否かが決定される点が異なる。
<指標計算部415>
指標計算部415は、復号予測対応LSPパラメータベクトル^Θfを受け取り、復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])Tに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、及び/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s415)。指標計算部415は、指標Q及び/またはQ’の大きさに応じて、補正ベクトル復号部411および非予測対応加算部413に補正復号処理を実行する/しないことを示す制御信号Cを、または、所定のビット数で補正復号処理を実行することを示す制御信号Cを出力する。指標Q及びQ’は、指標計算部315で説明したものと同様であり、予測対応量子化LSPパラメータベクトル^Θfの代わりに復号予測対応LSPパラメータベクトル^Θfを用いて、指標計算部315と同様の方法で計算すればよい。
指標計算部415は、復号予測対応LSPパラメータベクトル^Θfを受け取り、復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])Tに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、及び/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s415)。指標計算部415は、指標Q及び/またはQ’の大きさに応じて、補正ベクトル復号部411および非予測対応加算部413に補正復号処理を実行する/しないことを示す制御信号Cを、または、所定のビット数で補正復号処理を実行することを示す制御信号Cを出力する。指標Q及びQ’は、指標計算部315で説明したものと同様であり、予測対応量子化LSPパラメータベクトル^Θfの代わりに復号予測対応LSPパラメータベクトル^Θfを用いて、指標計算部315と同様の方法で計算すればよい。
指標計算部415は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、非予測対応加算部413および補正ベクトル復号部411に補正復号処理を実行することを示す制御信号Cを出力し、それ以外の場合に、非予測対応加算部413および補正ベクトル復号部411に補正復号処理を実行しないことを示す制御信号Cを出力する。
また、指標計算部415は、(A-1)および/または(B-1)の場合に、所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、補正ベクトル復号部411および非予測対応加算部413において、制御信号Cを受け取ったときに、補正復号処理を実行することを識別する構成としている場合には、(A-1)および/または(B-1)以外の場合に、指標計算部415は制御信号Cを出力しない構成としてもよい。
<補正ベクトル復号部411>
補正ベクトル復号部411は、補正LSP符号Dfと制御信号Cとを受け取る。補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル符号帳212を参照して、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得て(s411)出力する。補正LSP符号Dfを復号する復号処理自体は、補正ベクトル復号部211と同様である。
補正ベクトル復号部411は、補正LSP符号Dfと制御信号Cとを受け取る。補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル符号帳212を参照して、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得て(s411)出力する。補正LSP符号Dfを復号する復号処理自体は、補正ベクトル復号部211と同様である。
補正ベクトル復号部411は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正LSP符号Dfの復号を行わず、復号補正ベクトル^Ufを得ず出力しない。
<非予測対応加算部413>
非予測対応加算部413は、例えば、非予測対応平均ベクトルYを記憶した記憶部413c、加算部413a及び413bを含んで構成される。
非予測対応加算部413は、例えば、非予測対応平均ベクトルYを記憶した記憶部413c、加算部413a及び413bを含んで構成される。
非予測対応加算部413は、制御信号Cと復号差分ベクトル^Sfとを受け取る。補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、(A-1)および/または(B-1)の場合には、さらに復号補正ベクトル^Ufも受け取る。そして、非予測対応加算部413は、復号補正ベクトル^Ufに、復号差分ベクトル^Sfと、記憶部413cに記憶された非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=^Uf+Y+^Sfを生成して(s413)出力する。なお、図9では、2つの加算部413a及び413bを用いて、まず、加算部413aにおいて復号補正ベクトル^Ufに復号差分ベクトル^Sfを加算した後、加算部413bにおいて記憶部413cに記憶された非予測対応平均ベクトルYを加算しているが、これらの加算の順序は逆であってもよい。あるいは、非予測対応平均ベクトルYと復号差分ベクトル^Sfを加算したベクトルを、復号補正ベクトル^Ufに加算することで復号非予測対応LSPパラメータベクトル^Φfを生成してもよい。
非予測対応加算部413は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合、すなわち、復号補正ベクトル^Ufを受け取らなかった場合には、復号非予測対応LSPパラメータベクトル^Φf=Y+^Sfを生成して(s413)出力する。
なお、ここで用いる非予測対応平均ベクトルYは、前述の線形予測係数符号化装置300の非予測対応減算部311で用いた非予測対応平均ベクトルYと同じものとする。
<第二実施形態の効果>
このような構成により、f-1番目のフレームのLSP符号Cf-1の伝送誤りをf番目のフレームの復号非予測対応LSPパラメータベクトル^Φfに影響させなくすることに加えて、スペクトル包絡の山谷が大きい場合には、非予測対応平均ベクトルYと復号差分ベクトル^Sfに補正LSP符号Dfを復号して得られる復号補正ベクトル^Ufを加えることで量子化誤差の少ない復号非予測対応LSPパラメータベクトル^Φfを得るとともに、スペクトル包絡の山谷が大きくない場合には、補正LSP符号Dfが不要である非予測対応平均ベクトルYと復号差分ベクトル^Sfを加えたものを復号非予測対応LSPパラメータベクトル^Φfとすることで、補正LSP符号Df分の符号量を少なくすることができる。すなわち、第一実施形態の符号化及び復号よりは全体として符号量を削減しつつ、従来技術よりは前のフレームの符号の伝送誤りによる音質劣化が少ない符号化及び復号処理を行うことができる。
このような構成により、f-1番目のフレームのLSP符号Cf-1の伝送誤りをf番目のフレームの復号非予測対応LSPパラメータベクトル^Φfに影響させなくすることに加えて、スペクトル包絡の山谷が大きい場合には、非予測対応平均ベクトルYと復号差分ベクトル^Sfに補正LSP符号Dfを復号して得られる復号補正ベクトル^Ufを加えることで量子化誤差の少ない復号非予測対応LSPパラメータベクトル^Φfを得るとともに、スペクトル包絡の山谷が大きくない場合には、補正LSP符号Dfが不要である非予測対応平均ベクトルYと復号差分ベクトル^Sfを加えたものを復号非予測対応LSPパラメータベクトル^Φfとすることで、補正LSP符号Df分の符号量を少なくすることができる。すなわち、第一実施形態の符号化及び復号よりは全体として符号量を削減しつつ、従来技術よりは前のフレームの符号の伝送誤りによる音質劣化が少ない符号化及び復号処理を行うことができる。
<変形例>
第一実施形態の変形例で説明したように、LSPパラメータに代えて、線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。PARCOR係数や、LSPパラメータやPARCOR係数の何れかを変形した係数、さらには、線形予測係数自体を対象としてもよい。以下、PARCOR係数kf[1],kf[2],…,kf[p]を用いた場合について説明する。
第一実施形態の変形例で説明したように、LSPパラメータに代えて、線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。PARCOR係数や、LSPパラメータやPARCOR係数の何れかを変形した係数、さらには、線形予測係数自体を対象としてもよい。以下、PARCOR係数kf[1],kf[2],…,kf[p]を用いた場合について説明する。
LSPパラメータベクトルΘfに対応するスペクトル包絡の山谷の大きさが大きいほど、PARCOR係数により求まる
の値が小さくなることが分かっている。よって、PARCOR係数を用いる場合には、指標計算部315は、量子化されたPARCOR係数^kf[1],^kf[2],…,^kf[p]を受け取り、スペクトル包絡の山谷の小ささに対応する指標Q’を
により計算する(s315)。指標計算部315は、指標Q’の大きさに応じて、補正ベクトル符号化部312および非予測対応減算部311に補正符号化処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号Cを出力する。指標計算部415も同様に、指標Q’の大きさに応じて、補正ベクトル復号部411および非予測対応加算部413に補正復号処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号Cを出力する。
の値が小さくなることが分かっている。よって、PARCOR係数を用いる場合には、指標計算部315は、量子化されたPARCOR係数^kf[1],^kf[2],…,^kf[p]を受け取り、スペクトル包絡の山谷の小ささに対応する指標Q’を
により計算する(s315)。指標計算部315は、指標Q’の大きさに応じて、補正ベクトル符号化部312および非予測対応減算部311に補正符号化処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号Cを出力する。指標計算部415も同様に、指標Q’の大きさに応じて、補正ベクトル復号部411および非予測対応加算部413に補正復号処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号Cを出力する。
指標計算部315及び指標計算部415は、制御信号Cに代えて指標Qおよび/または指標Q’を出力する構成としてもよい。その場合、指標Qおよび/または指標Q’の大きさに応じて、補正ベクトル符号化部312及び補正ベクトル復号部411でそれぞれ符号化処理及び復号処理を実行するか否かを判断すればよい。また、同様に、指標Qおよび/または指標Q’の大きさに応じて、非予測対応減算部311及び非予測対応加算部413でそれぞれ減算処理を実行するか否か、どのような加算処理を実行するかを判断すればよい。補正ベクトル符号化部312、補正ベクトル復号部411、非予測対応減算部311及び非予測対応加算部413における判断は、上記の指標計算部315及び指標計算部415において説明したのと同じ判断である。
<第三実施形態>
第二実施形態と異なる部分を中心に説明する。
第二実施形態と異なる部分を中心に説明する。
補正ベクトル符号帳に格納されている候補補正ベクトルの数が多いことは、その分高い近似精度で符号化を行えることを意味する。そこで、本実施形態では、LSP符号の伝送誤りに起因する復号精度の低下の影響が大きいほど、より高い精度の補正ベクトル符号帳を用いて補正ベクトル符号化部及び補正ベクトル復号部を実行する。
<第三実施形態に係る線形予測係数符号化装置500>
図11は第三実施形態の線形予測係数符号化装置500の機能ブロック図を、図8はその処理フローの例を示す。
図11は第三実施形態の線形予測係数符号化装置500の機能ブロック図を、図8はその処理フローの例を示す。
第三実施形態の線形予測係数符号化装置500は、非予測対応符号化部310に代えて、非予測対応符号化部510を含む。
非予測対応符号化部510は、非予測対応減算部311と補正ベクトル符号化部512と補正ベクトル符号帳513A及び513Bと予測対応加算部314と指標計算部315とを含む。第一、二実施形態の線形予測係数符号化装置100、300と同様に、音響信号Xfに由来するLSPパラメータθが別の装置により生成されており、線形予測係数符号化装置500の入力がLSPパラメータθf[1],θf[2],…,θf[p]である場合には、線形予測係数符号化装置500は、線形予測分析部81とLSP計算部82とを含まなくてよい。
第三実施形態の線形予測係数符号化装置500は、複数の補正ベクトル符号帳を備え、補正ベクトル符号化部512では、指標計算部315で計算された指標Qおよび/またはQ’に応じていずれか1つの補正ベクトル符号帳を選択して符号化を行う点が第二実施形態と異なる。
以下では、二種類の補正ベクトル符号帳513A及び513Bを有する場合を例に説明する。
補正ベクトル符号帳513A及び513Bは、格納されている候補補正ベクトルの総数が異なる。候補補正ベクトルの総数が多いことは、対応する補正ベクトル符号のビット数が大きいことを意味する。逆に言えば、補正ベクトル符号のビット数を大きくすれば、より多くの候補補正ベクトルを用意することができる。例えば、補正ベクトル符号のビット数をAとすると最大2A個の候補補正ベクトルを用意することができる。
以下では、補正ベクトル符号帳513Aの方が、補正ベクトル符号帳513Bよりも格納されている候補補正ベクトルの総数が多いものとして説明を行う。言い換えれば、補正ベクトル符号帳513Aに記憶されている符号の符号長(平均符号長)の方が、補正ベクトル符号帳513Bに記憶されている符号の符号長(平均符号長)よりも大きい。例えば、補正ベクトル符号帳513Aには符号長がAビットの補正ベクトル符号と候補補正ベクトルとの組が2A個格納されており、補正ベクトル符号帳513Bには符号長がBビット(B<A)の補正ベクトル符号と候補補正ベクトルとの組が2B個(2B<2A)格納されている。
なお、本実施形態では、第二実施形態の変形例の部分で説明したように、指標計算部は、制御信号Cに代えて指標Qおよび/または指標Q’を出力し、指標Qおよび/または指標Q’の大きさに応じて、補正ベクトル符号化部及び補正ベクトル復号部でそれぞれどのような符号化及び復号を行うかを判断する。ただし、第二実施形態のように、指標計算部が、どのような符号化及び復号を行うかを判断し、制御信号Cを出力する構成としてもよい。なお、非予測対応減算部311及び非予測対応加算部413では、第二実施形態の変形例の部分で説明したように、指標Qおよび/または指標Q’の大きさに応じて、それぞれ減算処理を行うか否か、どのような加算処理を行うか、を判断する。
<補正ベクトル符号化部512>
補正ベクトル符号化部512は、指標Qおよび/または指標Q’と補正ベクトルUfとを受け取る。補正ベクトル符号化部512は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、ビット数の多い(符号長が大きい)補正LSP符号Dfを得て(s512)出力する。例えば、所定の閾値Th2、および/または、所定の閾値Th2'を用いて、以下のように符号化を行う。なお、補正ベクトル符号化部512が符号化処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
補正ベクトル符号化部512は、指標Qおよび/または指標Q’と補正ベクトルUfとを受け取る。補正ベクトル符号化部512は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、ビット数の多い(符号長が大きい)補正LSP符号Dfを得て(s512)出力する。例えば、所定の閾値Th2、および/または、所定の閾値Th2'を用いて、以下のように符号化を行う。なお、補正ベクトル符号化部512が符号化処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
(A-5)指標Qが所定の閾値Th2以上である場合、および/または、(B-5)指標Q’が所定の閾値Th2’以下である場合、補正LSP符号Dfのビット数として正の整数であるAが設定されるものとし、補正ベクトル符号化部512は、ビット数(符号長)Aの補正ベクトル符号と候補補正ベクトルとの組を2A個記憶している補正ベクトル符号帳513Aを参照して、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s512)出力する。
(A-6)指標Qが所定の閾値Th2より小さく、かつ、指標Qが所定の閾値Th1以上である場合、および/または、(B-6)指標Q’が所定の閾値Th2’より大きく、かつ、指標Q’が所定の閾値Th1’以下である場合、補正LSP符号Dfのビット数としてビット数A未満の正の整数であるBが設定されるものとし、補正ベクトル符号化部512は、ビット数(符号長)Bの補正ベクトル符号と候補補正ベクトルとの組を2B個記憶している補正ベクトル符号帳513Bを参照して、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s512)出力する。
(C-6)それ以外の場合、補正LSP符号Dfのビット数として0が設定されるものとし、補正ベクトル符号化部512は、補正ベクトルUfを符号化せず、補正LSP符号Dfを得ず出力しない。
よって、第三実施形態の補正ベクトル符号化部512は、指標計算部315で計算された指標Qが所定の閾値Th1より大きい場合、および/または、指標Q’が所定の閾値Th1’より小さい場合、に実行される。
<第三実施形態に係る線形予測係数復号装置600>
図12は第三実施形態に係る線形予測係数復号装置600の機能ブロック図を、図10はその処理フローの例を示す。
図12は第三実施形態に係る線形予測係数復号装置600の機能ブロック図を、図10はその処理フローの例を示す。
第三実施形態の線形予測係数復号装置600は、非予測対応復号部410に代えて、非予測対応復号部610を含む。
非予測対応復号部610は、非予測対応加算部413と補正ベクトル復号部611と補正ベクトル符号帳612A及び612Bと指標計算部415とを含み、必要に応じて復号非予測対応線形予測係数計算部214も含む。
第三実施形態の線形予測係数復号装置600は、複数の補正ベクトル符号帳を備え、補正ベクトル復号部611では、指標計算部415で計算された指標Qおよび/またはQ’に応じていずれか1つの補正ベクトル符号帳を選択して復号を行う点が第二実施形態の線形予測係数復号装置400と異なる。
以下では、二種類の補正ベクトル符号帳612A及び612Bを有する場合を例に説明する。
補正ベクトル符号帳612A及び612Bは、それぞれ線形予測係数符号化装置500の補正ベクトル符号帳513A及び513Bと共通の内容を記憶している。つまり、補正ベクトル符号帳612A及び612Bには、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されており、補正ベクトル符号帳612Aに記憶されている符号の符号長(平均符号長)の方が、補正ベクトル符号帳612Bに記憶されている符号の符号長(平均符号長)よりも大きい。例えば、補正ベクトル符号帳612Aには符号長がAビットの補正ベクトル符号と候補補正ベクトルとの組が2A個格納されており、補正ベクトル符号帳612Bには符号長がBビット(B<A)の補正ベクトル符号と候補補正ベクトルとの組が2B個(2B<2A)格納されている。
<補正ベクトル復号部611>
補正ベクトル復号部611は、指標Qおよび/または指標Q’と補正LSP符号Dfとを受け取る。補正ベクトル復号部611は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、多くのビット数を有する補正LSP符号Dfを復号して、多くの候補補正ベクトルから復号補正ベクトル^Ufを得る(s611)。例えば、所定の閾値Th2、および/または、Th2'を用いて、以下のように復号を行う。なお、補正ベクトル復号部611が復号処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
補正ベクトル復号部611は、指標Qおよび/または指標Q’と補正LSP符号Dfとを受け取る。補正ベクトル復号部611は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、多くのビット数を有する補正LSP符号Dfを復号して、多くの候補補正ベクトルから復号補正ベクトル^Ufを得る(s611)。例えば、所定の閾値Th2、および/または、Th2'を用いて、以下のように復号を行う。なお、補正ベクトル復号部611が復号処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
(A-5)指標Qが所定の閾値Th2以上である場合、および/または、(B-5)指標Q’が所定の閾値Th2’以下である場合、補正LSP符号Dfのビット数として正の整数であるAが設定されるものとし、補正ベクトル復号部611は、ビット数(符号長)Aの補正ベクトル符号と候補補正ベクトルとの組を2A個記憶している補正ベクトル符号帳612Aを参照して、補正LSP符号Dfと一致する補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして得て(s611)出力する。
(A-6)指標Qが所定の閾値Th2より小さく、かつ、指標Qが所定の閾値Th1以上である場合、および/または、(B-6)指標Q’が所定の閾値Th2’より大きく、かつ、指標Q’が所定の閾値Th1’以下である場合、補正LSP符号Dfのビット数としてビット数A未満の正の整数であるBが設定されるものとし、補正ベクトル復号部611は、ビット数(符号長)Bの補正ベクトル符号と候補補正ベクトルとの組を2B個記憶している補正ベクトル符号帳612Bを参照して、補正LSP符号Dfと一致する補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして得て(s611)出力する。
(C-6)それ以外の場合、補正LSP符号Dfのビット数として0が設定されるものとし、補正ベクトル復号部611は、補正LSP符号Dfを復号せず、復号補正ベクトル^Ufを生成しない。
よって、第三実施形態の補正ベクトル復号部611は、指標計算部415で計算された指標Qが所定の閾値Th1より大きい場合、および/または、指標Q’が所定の閾値Th1’より小さい場合、に実行される。
<第三実施形態の効果>
このような構成により、第二実施形態と同様の効果を得ることができる。さらに、LSP符号の伝送誤りに起因する復号精度の低下の影響の大きさに応じて、近似精度を変更することで、第一実施形態の符号化及び復号よりは全体として符号量を抑えつつ、第二実施形態の符号化及び復号よりも音質の良い符号化及び復号処理を行うことができる。
このような構成により、第二実施形態と同様の効果を得ることができる。さらに、LSP符号の伝送誤りに起因する復号精度の低下の影響の大きさに応じて、近似精度を変更することで、第一実施形態の符号化及び復号よりは全体として符号量を抑えつつ、第二実施形態の符号化及び復号よりも音質の良い符号化及び復号処理を行うことができる。
<変形例>
補正ベクトル符号帳の個数は、必ずしも2個でなくてもよく、3個以上であってもよい。補正ベクトル符号帳毎に異なるビット数(ビット長)の補正ベクトル符号が記憶されており、その補正ベクトル符号に対応する補正ベクトルが記憶されている。補正ベクトル符号帳の個数に応じて、閾値を設定すればよい。指標Qに対する閾値は、閾値の値が大きくなるほど、その閾値以上の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。同様に、指標Q’に対する閾値は、閾値の値が小さくなるほど、その閾値以下の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。このような構成とすることで、全体として符号量を抑えつつ、より精度の高い符号化及び復号処理を行うことができる。
補正ベクトル符号帳の個数は、必ずしも2個でなくてもよく、3個以上であってもよい。補正ベクトル符号帳毎に異なるビット数(ビット長)の補正ベクトル符号が記憶されており、その補正ベクトル符号に対応する補正ベクトルが記憶されている。補正ベクトル符号帳の個数に応じて、閾値を設定すればよい。指標Qに対する閾値は、閾値の値が大きくなるほど、その閾値以上の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。同様に、指標Q’に対する閾値は、閾値の値が小さくなるほど、その閾値以下の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。このような構成とすることで、全体として符号量を抑えつつ、より精度の高い符号化及び復号処理を行うことができる。
<第四実施形態にかかる符号化装置700>
第四実施形態にかかる符号化装置700は、第一実施形態の線形予測係数符号化装置100及び線形予測係数復号装置200を周波数領域での符号化方法であるTCX(transform coded excitation)符号化方法に応用したものである。
第四実施形態にかかる符号化装置700は、第一実施形態の線形予測係数符号化装置100及び線形予測係数復号装置200を周波数領域での符号化方法であるTCX(transform coded excitation)符号化方法に応用したものである。
図13は第四実施形態の符号化装置700の機能ブロック図を、図14はその処理フローの例を示す。
第四実施形態の符号化装置700は、線形予測係数符号化装置100と線形予測係数復号装置200とパワースペクトル包絡系列計算部710と第一平滑化パワースペクトル包絡系列計算部720Aと第二平滑化パワースペクトル包絡系列計算部720Bと周波数領域変換部730と包絡正規化部740と可変長符号化パラメータ計算部750と可変長符号化部760とを含む。なお、線形予測係数符号化装置100と線形予測係数復号装置200に代えて、第二、第三実施形態の線形予測係数符号化装置300,500及び線形予測係数復号装置400,600を用いてもよい。
第四実施形態の符号化装置700は、入力音響信号Xfを受け取り、周波数領域信号符号を出力する。
<線形予測係数符号化装置100>
線形予測係数符号化装置100は、音響信号Xfを受け取り、LSP符号Cf及び補正LSP符号Dfを得て(s100)出力する。
線形予測係数符号化装置100は、音響信号Xfを受け取り、LSP符号Cf及び補正LSP符号Dfを得て(s100)出力する。
<線形予測係数復号装置200>
線形予測係数復号装置200は、LSP符号Cfと補正LSP符号Dfとを受け取り、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]と非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]とを得て(s200)出力する。
線形予測係数復号装置200は、LSP符号Cfと補正LSP符号Dfとを受け取り、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]と非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]とを得て(s200)出力する。
なお、符号化装置700の線形予測係数符号化装置100が、LSP符号Cfと補正LSP符号Dfを得る際に、LSP符号Cfに対応する予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]とLSP符号Cfと補正LSP符号Dfに対応する非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を得る構成としてもよい。この場合は、符号化装置700は線形予測係数復号装置200を備えなくてよい。
<パワースペクトル包絡系列計算部710>
パワースペクトル包絡系列計算部710は、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を受け取る。パワースペクトル包絡系列計算部710は、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を用いて、N点の入力音響信号のパワースペクトル包絡系列Z[1],…,Z[N]を計算して(s710)出力する。例えば、パワースペクトル包絡系列の各値Z[n]は、次式で求めることができる。
ここで、nは1≦n≦Nの整数、exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
パワースペクトル包絡系列計算部710は、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を受け取る。パワースペクトル包絡系列計算部710は、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を用いて、N点の入力音響信号のパワースペクトル包絡系列Z[1],…,Z[N]を計算して(s710)出力する。例えば、パワースペクトル包絡系列の各値Z[n]は、次式で求めることができる。
ここで、nは1≦n≦Nの整数、exp(・)はネイピア数を底とする指数関数、jは虚数単位、σ2は予測残差エネルギーである。
<第一平滑化パワースペクトル包絡系列計算部720A>
第一平滑化パワースペクトル包絡系列計算部720Aは、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]を受け取る。第一平滑化パワースペクトル包絡系列計算部720Aは、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]と予め与えられた1以下の正の定数である補正係数γiを用いて、
により、第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]を計算して(s720A)出力する。
第一平滑化パワースペクトル包絡系列計算部720Aは、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]を受け取る。第一平滑化パワースペクトル包絡系列計算部720Aは、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]と予め与えられた1以下の正の定数である補正係数γiを用いて、
により、第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]を計算して(s720A)出力する。
第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]は、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]により求まるパワースペクトル包絡系列W[1],W[2],…,W[N]の振幅の凹凸を鈍らせた(平滑化した)系列に相当する。γiは、平滑化の度合いを定める正の定数である。
<第二平滑化パワースペクトル包絡系列計算部720B>
第二平滑化パワースペクトル包絡系列計算部720Bは、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を受け取る。第二平滑化パワースペクトル包絡系列計算部720Bは、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]と予め与えられた1以下の正の定数である補正係数γiを用いて、
により、第二平滑化済パワースペクトル包絡系列~Z[1],~Z[2],…,~Z[N]を計算して(s720B)出力する。
第二平滑化パワースペクトル包絡系列計算部720Bは、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]を受け取る。第二平滑化パワースペクトル包絡系列計算部720Bは、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]と予め与えられた1以下の正の定数である補正係数γiを用いて、
により、第二平滑化済パワースペクトル包絡系列~Z[1],~Z[2],…,~Z[N]を計算して(s720B)出力する。
第二平滑化済パワースペクトル包絡系列~Z[1],~Z[2],…,~Z[N]は、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]により求まるパワースペクトル包絡系列Z[1],Z[2],…,Z[N]の振幅の凹凸を鈍らせた(平滑化した)系列に相当する。γiは、平滑化の度合いを定める正の定数である。
<周波数領域変換部730>
周波数領域変換部730は、所定の時間区間であるフレーム単位で、入力された時間領域の入力音響信号Xfを周波数領域のN点のMDCT係数列X[1],…,X[N]に変換して(s730)出力する。ただし、Nは正整数である。
周波数領域変換部730は、所定の時間区間であるフレーム単位で、入力された時間領域の入力音響信号Xfを周波数領域のN点のMDCT係数列X[1],…,X[N]に変換して(s730)出力する。ただし、Nは正整数である。
<包絡正規化部740>
包絡正規化部740は、MDCT係数列X[1],…,X[N]と第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]とを受け取り、MDCT係数列X[1],…,X[N]の各係数X[i]を第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]の各値~W[i]の平方根で正規化した系列である、正規化済MDCT係数列XN[1],…,XN[N]を求めて(s740)出力する。つまり、
XN[i]=X[i]/sqrt(~W[i])
である。ただし、sqrt(・)は1/2乗を示す記号である。
包絡正規化部740は、MDCT係数列X[1],…,X[N]と第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]とを受け取り、MDCT係数列X[1],…,X[N]の各係数X[i]を第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]の各値~W[i]の平方根で正規化した系列である、正規化済MDCT係数列XN[1],…,XN[N]を求めて(s740)出力する。つまり、
XN[i]=X[i]/sqrt(~W[i])
である。ただし、sqrt(・)は1/2乗を示す記号である。
<可変長符号化パラメータ計算部750>
可変長符号化パラメータ計算部750は、パワースペクトル包絡系列Z[1],…,Z[N]と第二平滑化済パワースペクトル包絡系列~Z[1],…,~Z[N]とMDCT係数列X[1],…,X[N]と正規化済MDCT係数列XN[1],…,XN[N]とを受け取る。これらの値を用いて、正規化済MDCT係数列XN[1],…,XN[N]を可変長符号化するためのパラメータである可変長符号化パラメータriを計算して(s750)出力する。可変長符号化パラメータriは、符号化対象の正規化済MDCT係数列XN[1],…,XN[N]の振幅が取り得る範囲を特定するパラメータである。ライス符号化の場合にはライスパラメータが可変長符号化パラメータに相当し、算術符号化の場合は符号化対象の振幅の取りうる範囲が可変長符号化パラメータに相当する。
可変長符号化パラメータ計算部750は、パワースペクトル包絡系列Z[1],…,Z[N]と第二平滑化済パワースペクトル包絡系列~Z[1],…,~Z[N]とMDCT係数列X[1],…,X[N]と正規化済MDCT係数列XN[1],…,XN[N]とを受け取る。これらの値を用いて、正規化済MDCT係数列XN[1],…,XN[N]を可変長符号化するためのパラメータである可変長符号化パラメータriを計算して(s750)出力する。可変長符号化パラメータriは、符号化対象の正規化済MDCT係数列XN[1],…,XN[N]の振幅が取り得る範囲を特定するパラメータである。ライス符号化の場合にはライスパラメータが可変長符号化パラメータに相当し、算術符号化の場合は符号化対象の振幅の取りうる範囲が可変長符号化パラメータに相当する。
1サンプルごとに可変長符号化を行う場合には、正規化済MDCT係数列の各係数XN[i]について可変長符号化パラメータが計算される。複数のサンプルからなるサンプル群ごとに(例えば2サンプルずつ)まとめて可変長符号化を行う場合には、サンプル群ごとに可変長符号化パラメータが計算される。つまり、可変長符号化パラメータ計算部750は、正規化済MDCT係数列の一部である正規化済部分係数列ごとに、可変長符号化パラメータを計算する。ここで、正規化済部分係数列は複数個あり、複数個の正規化済部分係数列には正規化済MDCT係数列の係数が重複されずに含まれるものとする。
以下では、1サンプルごとにライス符号化を行う場合を例に、可変長符号化パラメータの計算方法を説明する。
(step1)例えば、次式により、正規化済MDCT係数列XN[1],XN[2],…,XN[N]の各係数の振幅の平均の対数を基準となるライスパラメータsbとして算出する。
sbはフレームごとに1度だけ符号化されて、基準となるライスパラメータに対応する符号として復号装置に伝送される。あるいは復号装置に伝送される別の情報からX[i]の振幅を推定できる場合は、符号化装置700と復号装置で共通にX[i]の振幅の推定値からsbを近似的に決定する方法をきめておいてもよい。この場合は、sbを符号化し、基準となるライスパラメータに対応する符号を復号装置へ出力しなくてもよい。
sbはフレームごとに1度だけ符号化されて、基準となるライスパラメータに対応する符号として復号装置に伝送される。あるいは復号装置に伝送される別の情報からX[i]の振幅を推定できる場合は、符号化装置700と復号装置で共通にX[i]の振幅の推定値からsbを近似的に決定する方法をきめておいてもよい。この場合は、sbを符号化し、基準となるライスパラメータに対応する符号を復号装置へ出力しなくてもよい。
(step3)|sqrt(Z[i])/sqrt(~Z[i])|がθより大きいほど、ライスパラメータriをsbよりも大きな値として方法で決定する。|sqrt(Z[i])/sqrt(~Z[i])|がθより小さいほど、ライスパラメータriをsbよりも小さな値として決定する。
(step4)step3の処理を全てのi=1,2,…,Nについて繰り返して、各正規化済MDCT係数XN[i]についてのライスパラメータriを求める。
<可変長符号化部760>
可変長符号化部760は、可変長符号化パラメータriを受け取り、この値を用いて正規化済係数列XN(1),…,XN(N)を可変長符号化し、可変長符号CXを出力する(s760)。
可変長符号化部760は、可変長符号化パラメータriを受け取り、この値を用いて正規化済係数列XN(1),…,XN(N)を可変長符号化し、可変長符号CXを出力する(s760)。
<第四実施形態の効果>
第四実施形態は、MDCT係数列X[1],X[2],…,X[N]を平滑化パワースペクトル包絡系列で正規化して得られる正規化済MDCT係数列XN[1],…,XN[N]を、可変長符号化パラメータを用いて符号化する構成である。
第四実施形態は、MDCT係数列X[1],X[2],…,X[N]を平滑化パワースペクトル包絡系列で正規化して得られる正規化済MDCT係数列XN[1],…,XN[N]を、可変長符号化パラメータを用いて符号化する構成である。
可変長符号化の対象である正規化済MDCT係数列は、なるべく正確なパワースペクトル包絡系列を用いて求める必要があることから、包絡正規化部740では、平滑化線形予測係数により求まるパワースペクトル包絡系列との誤差が少ない、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]により求まる第一平滑化済パワースペクトル包絡系列~W[1],~W[2],…,~W[N]、を用いて正規化済MDCT係数列を生成している。
可変長符号化パラメータ計算部750では、可変長符号化パラメータを求めるためにパワースペクトル包絡系列や平滑化パワースペクトル包絡系列を利用する。したがって、可変長符号化パラメータ計算部750で用いるパワースペクトル包絡系列や平滑化パワースペクトル包絡系列についても、線形予測係数により求まるパワースペクトル包絡系列や平滑化線形予測係数により求まるパワースペクトル包絡系列との誤差が小さいほうが望ましい。しかし、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]は、現在のフレームのLSP符号に伝送誤りが生じた場合のみならず前フレームのLSP符号に伝送誤りが生じた場合にも復号側で正しい値を得られない。すなわち、予測対応量子化線形予測係数^af[1],^af[2],…,^af[p]から求まるパワースペクトル包絡系列や平滑化パワースペクトル包絡系列から可変長符号化パラメータを求めると、現在のフレームのLSP符号に伝送誤りが生じた場合のみならず前フレームのLSP符号に伝送誤りが生じた場合にも可変長復号を正しく行えなくなってしまう。
そこで、第四実施形態では、非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]から求まるパワースペクトル包絡系列や平滑化パワースペクトル包絡系列を利用して可変長符号化パラメータを求める。これにより、前のフレームのLSP符号に伝送誤りが生じたとしても、現在のフレームのLSP符号に伝送誤りが生じなければ、現在のフレームでは符号化側と同じ非予測対応量子化線形予測係数^bf[1],^bf[2],…,^bf[p]、パワースペクトル包絡系列Z[1],Z[2],…,Z[N]及び第二平滑化パワースペクトル包絡系列~Z[1],~Z[2],…,~Z[N]を得ることができるため、現在のフレームでは符号化側と同じ可変長符号化パラメータを求めることができ、LSP符号の伝送誤りへの耐性が向上する。
なお、第四実施形態では、第一平滑化パワースペクトル包絡系列~W[1],~W[2],…,~W[N]を用いて得た正規化済MDCT係数列XN[1],…,XN[N]を可変長符号化の対象としている。ゆえに、現フレームのLSP符号に伝送誤りが生じた場合のみならず、前のフレームのLSP符号に伝送誤りが生じた場合にも、復号側で正規化済MDCT係数列XN[1],…,XN[N]に乗算する平滑化済パワースペクトル包絡系列の各値の平方根に誤りが生じ、復号により得られるMDCT係数列に歪みが生じるという問題はある。しかし、この問題は、可変長符号化パラメータの誤りのように可変長復号そのものを不正確にしてしまうような問題よりは小さい。
<変形例1>
以上の第一〜第四実施形態において、図3の線形予測係数符号化装置100の非予測対応符号化部110、図7の線形予測係数符号化装置300の非予測対応符号化部310、図11の線形予測係数符号化装置500の非予測対応符号化部510で行われる処理(非予測対応符号化処理)を実行する対象を、予測次数p未満の所定の次数TL以下のLSPパラメータ(低次のLSPパラメータ)のみとしてもよく、復号側でもこれらに対応する処理を行ってもよい。
以上の第一〜第四実施形態において、図3の線形予測係数符号化装置100の非予測対応符号化部110、図7の線形予測係数符号化装置300の非予測対応符号化部310、図11の線形予測係数符号化装置500の非予測対応符号化部510で行われる処理(非予測対応符号化処理)を実行する対象を、予測次数p未満の所定の次数TL以下のLSPパラメータ(低次のLSPパラメータ)のみとしてもよく、復号側でもこれらに対応する処理を行ってもよい。
まず、非予測対応符号化部110、310、510の各部について説明する。
<非予測対応減算部111、311>
非予測対応減算部111、311は、入力されたLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])TのうちのTL次以下のLSPパラメータからなる低次LSPパラメータベクトルΘ’f=(θf[1],θf[2],…,θf[TL])Tから、記憶部111cに記憶された非予測対応低次平均ベクトルY’=(y[1],y[2],…,y[TL])Tと、入力された量子化差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])TのうちのTL次以下の要素からなる低次量子化差分ベクトル^S’f=(^sf[1],^sf[2],…,^sf[TL])Tと、を減算したベクトルである低次補正ベクトルU’f=Θ’f-Y’-^S’fを生成して出力する。すなわち、非予測対応減算部111、311は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを生成して出力する。
非予測対応減算部111、311は、入力されたLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])TのうちのTL次以下のLSPパラメータからなる低次LSPパラメータベクトルΘ’f=(θf[1],θf[2],…,θf[TL])Tから、記憶部111cに記憶された非予測対応低次平均ベクトルY’=(y[1],y[2],…,y[TL])Tと、入力された量子化差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])TのうちのTL次以下の要素からなる低次量子化差分ベクトル^S’f=(^sf[1],^sf[2],…,^sf[TL])Tと、を減算したベクトルである低次補正ベクトルU’f=Θ’f-Y’-^S’fを生成して出力する。すなわち、非予測対応減算部111、311は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを生成して出力する。
ここで、非予測対応低次平均ベクトルY'=(y[1],y[2],…,y[TL])Tは、予め定めたベクトルであり、変形例1の復号装置で用いる非予測対応平均ベクトルY=(y[1],y[2],…,y[p])TのうちのTL次以下の要素からなるベクトルである。
なお、LSP計算部82からLSPパラメータベクトルΘfのうちのTL次以下のLSPパラメータからなる低次LSPパラメータベクトルΘ’fを出力して、非予測対応減算部111、311に入力してもよい。また、ベクトル符号化部84から量子化差分ベクトル^SfのうちのTL次以下の要素からなる低次量子化差分ベクトル^S’fを出力して、非予測対応減算部111、311に入力してもよい。
<補正ベクトル符号化部112、312、512>
補正ベクトル符号化部112、312及び512は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを補正ベクトル符号帳113、513A、513Bを参照して符号化する。補正ベクトル符号帳113、513A、513Bに記憶しておく各候補補正ベクトルはTL次のベクトルとしておけばよい。
補正ベクトル符号化部112、312及び512は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを補正ベクトル符号帳113、513A、513Bを参照して符号化する。補正ベクトル符号帳113、513A、513Bに記憶しておく各候補補正ベクトルはTL次のベクトルとしておけばよい。
次に、変形例1の線形予測係数復号装置200、400、600について説明する。
変形例1の線形予測係数復号装置200の非予測対応復号部210、線形予測係数復号装置400の非予測対応復号部410、線形予測係数復号装置600の非予測対応復号部610で行われる処理(非予測対応復号処理)について説明する。
<補正ベクトル復号部211、411、611>
補正ベクトル復号部211,411、611は、補正LSP符号Dfを受け取り、補正ベクトル符号帳212、612A、612Bを参照して、補正LSP符号Dfを復号して復号低次補正ベクトル^U’fを得て出力する。復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])TはTL次のベクトルである。補正ベクトル符号帳212、612A、612Bに記憶しておく各候補補正ベクトルは、補正ベクトル符号帳113、513A、513Bと同様に、TL次のベクトルとしておけばよい。
補正ベクトル復号部211,411、611は、補正LSP符号Dfを受け取り、補正ベクトル符号帳212、612A、612Bを参照して、補正LSP符号Dfを復号して復号低次補正ベクトル^U’fを得て出力する。復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])TはTL次のベクトルである。補正ベクトル符号帳212、612A、612Bに記憶しておく各候補補正ベクトルは、補正ベクトル符号帳113、513A、513Bと同様に、TL次のベクトルとしておけばよい。
<非予測対応加算部213>
非予測対応加算部213は、復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])Tと非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと復号差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとを受け取る。
非予測対応加算部213は、復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])Tと非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと復号差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとを受け取る。
非予測対応加算部213は、TL次以下の各次については復号低次補正ベクトル^U’fと復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算し、p次以下のTL次を超える各次については復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算して得られる復号非予測対応LSPパラメータベクトル^Φfを生成して出力する。すなわち、復号非予測対応LSPパラメータベクトル^Φfは、^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])である。
<非予測対応加算部413>
非予測対応加算部413は、復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])Tと非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと復号差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとを受け取る。
非予測対応加算部413は、復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])Tと非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tと復号差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとを受け取る。
非予測対応加算部413は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、(A-1)および/または(B-1)の場合には、TL次以下の各次については復号低次補正ベクトル^U’fと復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算し、p次以下のTL次を超える各次については復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算して得られる復号非予測対応LSPパラメータベクトル^Φfを生成して出力する。すなわち、復号非予測対応LSPパラメータベクトル^Φfは、^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])である。
非予測対応加算部413は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合には、復号差分ベクトル^Sfと非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=Y+^Sfを生成して出力する。
これにより、近似精度の高さが後述の信号処理の効率により大きな影響を与える可能性のある低次LSPパラメータを優先して符号化歪を低減させることで、歪の増大を抑えつつ第一〜第三実施形態の方法よりも符号量を削減することができる。
<変形例2>
第一〜第四実施形態では、LSP計算部の入力を線形予測係数af[1],af[2],…,af[p]としていたが、例えば、線形予測係数の各係数af[i]にγのi乗を乗じた係数の系列af[1]×γ,af[2]×γ2,…,af[p]×γpをLSP計算部の入力としてもよい。
第一〜第四実施形態では、LSP計算部の入力を線形予測係数af[1],af[2],…,af[p]としていたが、例えば、線形予測係数の各係数af[i]にγのi乗を乗じた係数の系列af[1]×γ,af[2]×γ2,…,af[p]×γpをLSP計算部の入力としてもよい。
また、第一〜第四実施形態では線形予測係数符号化装置の符号化や線形予測係数復号装置の復号の対象をLSPパラメータとしていたが、線形予測係数そのものやISPパラメータなどの線形予測係数に変換可能な係数であれば何れの係数を符号化や復号の対象としてもよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (10)
- 第一符号を復号して復号差分ベクトルを得て、前記復号差分ベクトルと、少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号部と、
第二符号を復号して復号補正ベクトルを得て、前記復号補正ベクトルと、少なくとも前記復号差分ベクトルとの対応する次数の要素同士を加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号部とを含む、
復号装置。 - 第一符号を復号して復号差分ベクトルを得て、前記復号差分ベクトルと、少なくとも過去のフレームからの予測と予め定めたベクトルとからなる予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号部と、
第二符号を復号して復号補正ベクトルを得て、前記復号補正ベクトルに、少なくとも前記復号差分ベクトルと予め定めたベクトルとを対応する次数の要素毎に加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号部とを含む、
復号装置。 - 請求項1または2の復号装置であって、
αを正の定数とし、前記予測ベクトルは、予め定めた予測対応平均ベクトルと、過去のフレームの復号差分ベクトルのα倍とを加算して得られるベクトルであり、
前記第二復号ベクトルは、前記復号補正ベクトルと、前記復号差分ベクトルと、予め定めた非予測対応平均ベクトルと、の対応する次数の要素同士を加算して得られるベクトルである、
復号装置。 - 請求項1から3の何れかの復号装置であって、
前記第二符号を復号して得られる復号補正ベクトルの要素数TLは、前記予測対応復号部の前記各ベクトルの要素数p未満であり、
前記非予測対応復号部が生成する第二復号ベクトルの要素数はpである
復号装置。 - 第一符号を復号して復号差分ベクトルを得て、前記復号差分ベクトルと、少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号ステップと、
第二符号を復号して復号補正ベクトルを得て、前記復号補正ベクトルと、少なくとも前記復号差分ベクトルとの対応する次数の要素同士を加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号ステップとを含む、
復号方法。 - 第一符号を復号して復号差分ベクトルを得て、前記復号差分ベクトルと、少なくとも過去のフレームからの予測と予め定めたベクトルとからなる予測ベクトルとを加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第一復号ベクトルを生成する予測対応復号ステップと、
第二符号を復号して復号補正ベクトルを得て、前記復号補正ベクトルに、少なくとも前記復号差分ベクトルと予め定めたベクトルとを対応する次数の要素毎に加算して、現在のフレームの複数次の線形予測係数に変換可能な係数の復号値からなる第二復号ベクトルを生成する非予測対応復号ステップとを含む、
復号方法。 - 請求項5または6の復号方法であって、
αを正の定数とし、前記予測ベクトルは、予め定めた予測対応平均ベクトルと、過去のフレームの復号差分ベクトルのα倍とを加算して得られるベクトルであり、
前記第二復号ベクトルは、前記復号補正ベクトルと、前記復号差分ベクトルと、予め定めた非予測対応平均ベクトルと、の対応する次数の要素同士を加算して得られるベクトルである、
復号方法。 - 請求項5から7の何れかの復号方法であって、
前記第二符号を復号して得られる復号補正ベクトルの要素数TLは、前記予測対応復号ステップの前記各ベクトルの要素数p未満であり、
前記非予測対応復号ステップで生成される第二復号ベクトルの要素数はpである
復号方法。 - 請求項5から請求項8の何れかの復号方法をコンピュータに実行させるためのプログラム。
- 請求項5から請求項8の何れかの復号方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014094758 | 2014-05-01 | ||
JP2014094758 | 2014-05-01 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016515896A Division JP6270993B2 (ja) | 2014-05-01 | 2015-03-16 | 符号化装置、及びその方法、プログラム、記録媒体 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018011829A Division JP6490846B2 (ja) | 2014-05-01 | 2018-01-26 | 復号装置、及びその方法、プログラム、記録媒体 |
JP2018011828A Division JP6484358B2 (ja) | 2014-05-01 | 2018-01-26 | 符号化装置、及びその方法、プログラム、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018077502A JP2018077502A (ja) | 2018-05-17 |
JP6462104B2 true JP6462104B2 (ja) | 2019-01-30 |
Family
ID=54358473
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016515896A Active JP6270993B2 (ja) | 2014-05-01 | 2015-03-16 | 符号化装置、及びその方法、プログラム、記録媒体 |
JP2017247954A Active JP6462104B2 (ja) | 2014-05-01 | 2017-12-25 | 復号装置、及びその方法、プログラム、記録媒体 |
JP2018011828A Active JP6484358B2 (ja) | 2014-05-01 | 2018-01-26 | 符号化装置、及びその方法、プログラム、記録媒体 |
JP2018011829A Active JP6490846B2 (ja) | 2014-05-01 | 2018-01-26 | 復号装置、及びその方法、プログラム、記録媒体 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016515896A Active JP6270993B2 (ja) | 2014-05-01 | 2015-03-16 | 符号化装置、及びその方法、プログラム、記録媒体 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018011828A Active JP6484358B2 (ja) | 2014-05-01 | 2018-01-26 | 符号化装置、及びその方法、プログラム、記録媒体 |
JP2018011829A Active JP6490846B2 (ja) | 2014-05-01 | 2018-01-26 | 復号装置、及びその方法、プログラム、記録媒体 |
Country Status (8)
Country | Link |
---|---|
US (6) | US10418042B2 (ja) |
EP (4) | EP3706121B1 (ja) |
JP (4) | JP6270993B2 (ja) |
KR (4) | KR101855945B1 (ja) |
CN (4) | CN110444216B (ja) |
ES (4) | ES2744904T3 (ja) |
PL (4) | PL3859734T3 (ja) |
WO (1) | WO2015166733A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10418042B2 (en) | 2014-05-01 | 2019-09-17 | Nippon Telegraph And Telephone Corporation | Coding device, decoding device, method, program and recording medium thereof |
US11809869B2 (en) | 2017-12-29 | 2023-11-07 | Intel Corporation | Systems and methods to store a tile register pair to memory |
US11816483B2 (en) | 2017-12-29 | 2023-11-14 | Intel Corporation | Systems, methods, and apparatuses for matrix operations |
US11789729B2 (en) | 2017-12-29 | 2023-10-17 | Intel Corporation | Systems and methods for computing dot products of nibbles in two tile operands |
US11093247B2 (en) | 2017-12-29 | 2021-08-17 | Intel Corporation | Systems and methods to load a tile register pair |
US11669326B2 (en) | 2017-12-29 | 2023-06-06 | Intel Corporation | Systems, methods, and apparatuses for dot product operations |
US11023235B2 (en) | 2017-12-29 | 2021-06-01 | Intel Corporation | Systems and methods to zero a tile register pair |
CN109688409B (zh) * | 2018-12-28 | 2021-03-02 | 北京奇艺世纪科技有限公司 | 一种视频编码方法及装置 |
US11281470B2 (en) * | 2019-12-19 | 2022-03-22 | Advanced Micro Devices, Inc. | Argmax use for machine learning |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
JP3255189B2 (ja) * | 1992-12-01 | 2002-02-12 | 日本電信電話株式会社 | 音声パラメータの符号化方法および復号方法 |
CA2154911C (en) * | 1994-08-02 | 2001-01-02 | Kazunori Ozawa | Speech coding device |
TW408298B (en) * | 1997-08-28 | 2000-10-11 | Texas Instruments Inc | Improved method for switched-predictive quantization |
CN1737903A (zh) * | 1997-12-24 | 2006-02-22 | 三菱电机株式会社 | 声音译码方法以及声音译码装置 |
JP3478209B2 (ja) * | 1999-11-01 | 2003-12-15 | 日本電気株式会社 | 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体 |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP3590342B2 (ja) * | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
JP3472279B2 (ja) * | 2001-06-04 | 2003-12-02 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ符号化方法及び装置 |
KR100487719B1 (ko) * | 2003-03-05 | 2005-05-04 | 한국전자통신연구원 | 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기 |
EP1662667B1 (en) * | 2003-09-02 | 2015-11-11 | Nippon Telegraph And Telephone Corporation | Floating point signal reversible encoding method, decoding method, device thereof, program, and recording medium thereof |
BRPI0510303A (pt) * | 2004-04-27 | 2007-10-02 | Matsushita Electric Ind Co Ltd | dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método |
EP1939862B1 (en) * | 2004-05-19 | 2016-10-05 | Panasonic Intellectual Property Corporation of America | Encoding device, decoding device, and method thereof |
US7970605B2 (en) * | 2005-01-12 | 2011-06-28 | Nippon Telegraph And Telephone Corporation | Method, apparatus, program and recording medium for long-term prediction coding and long-term prediction decoding |
CN101273404B (zh) * | 2005-09-30 | 2012-07-04 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
JPWO2008007698A1 (ja) * | 2006-07-12 | 2009-12-10 | パナソニック株式会社 | 消失フレーム補償方法、音声符号化装置、および音声復号装置 |
BRPI0718300B1 (pt) * | 2006-10-24 | 2018-08-14 | Voiceage Corporation | Método e dispositivo para codificar quadros de transição em sinais de fala. |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
WO2009004227A1 (fr) * | 2007-06-15 | 2009-01-08 | France Telecom | Codage de signaux audionumériques |
JP5006774B2 (ja) * | 2007-12-04 | 2012-08-22 | 日本電信電話株式会社 | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
WO2009075326A1 (ja) * | 2007-12-11 | 2009-06-18 | Nippon Telegraph And Telephone Corporation | 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体 |
US8724734B2 (en) * | 2008-01-24 | 2014-05-13 | Nippon Telegraph And Telephone Corporation | Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium |
JP5013293B2 (ja) * | 2008-02-29 | 2012-08-29 | 日本電信電話株式会社 | 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体 |
JP5236005B2 (ja) * | 2008-10-10 | 2013-07-17 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
JP4848049B2 (ja) * | 2008-12-09 | 2011-12-28 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
JP4735711B2 (ja) * | 2008-12-17 | 2011-07-27 | ソニー株式会社 | 情報符号化装置 |
JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
CN101521013B (zh) * | 2009-04-08 | 2011-08-17 | 武汉大学 | 空间音频参数双向帧间预测编解码装置 |
WO2010140546A1 (ja) * | 2009-06-03 | 2010-12-09 | 日本電信電話株式会社 | 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体 |
GB0917417D0 (en) * | 2009-10-05 | 2009-11-18 | Mitsubishi Elec R&D Ct Europe | Multimedia signature coding and decoding |
US9613630B2 (en) * | 2009-11-12 | 2017-04-04 | Lg Electronics Inc. | Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual |
US8892428B2 (en) * | 2010-01-14 | 2014-11-18 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude |
MX2012011532A (es) * | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
RU2571561C2 (ru) * | 2011-04-05 | 2015-12-20 | Ниппон Телеграф Энд Телефон Корпорейшн | Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи |
JP6160072B2 (ja) * | 2012-12-06 | 2017-07-12 | 富士通株式会社 | オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置 |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
CN105745705B (zh) * | 2013-10-18 | 2020-03-20 | 弗朗霍夫应用科学研究促进协会 | 编码和解码音频信号的编码器、解码器及相关方法 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
MX362490B (es) * | 2014-04-17 | 2019-01-18 | Voiceage Corp | Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo. |
US10418042B2 (en) * | 2014-05-01 | 2019-09-17 | Nippon Telegraph And Telephone Corporation | Coding device, decoding device, method, program and recording medium thereof |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
-
2015
- 2015-03-16 US US15/307,059 patent/US10418042B2/en active Active
- 2015-03-16 KR KR1020167030130A patent/KR101855945B1/ko active IP Right Grant
- 2015-03-16 CN CN201910644410.2A patent/CN110444216B/zh active Active
- 2015-03-16 CN CN201910644404.7A patent/CN110444215B/zh active Active
- 2015-03-16 PL PL21158838T patent/PL3859734T3/pl unknown
- 2015-03-16 PL PL19174056T patent/PL3544004T3/pl unknown
- 2015-03-16 ES ES15786812T patent/ES2744904T3/es active Active
- 2015-03-16 PL PL15786812T patent/PL3139382T3/pl unknown
- 2015-03-16 ES ES21158838T patent/ES2911527T3/es active Active
- 2015-03-16 ES ES19174056T patent/ES2822127T3/es active Active
- 2015-03-16 EP EP20167742.4A patent/EP3706121B1/en active Active
- 2015-03-16 EP EP15786812.6A patent/EP3139382B1/en active Active
- 2015-03-16 EP EP19174056.2A patent/EP3544004B1/en active Active
- 2015-03-16 EP EP21158838.9A patent/EP3859734B1/en active Active
- 2015-03-16 CN CN201910644499.2A patent/CN110444217B/zh active Active
- 2015-03-16 CN CN201580022683.3A patent/CN106415715B/zh active Active
- 2015-03-16 PL PL20167742T patent/PL3706121T3/pl unknown
- 2015-03-16 WO PCT/JP2015/057727 patent/WO2015166733A1/ja active Application Filing
- 2015-03-16 JP JP2016515896A patent/JP6270993B2/ja active Active
- 2015-03-16 KR KR1020187012384A patent/KR101870957B1/ko active IP Right Grant
- 2015-03-16 ES ES20167742T patent/ES2876184T3/es active Active
- 2015-03-16 KR KR1020187012387A patent/KR101870962B1/ko active IP Right Grant
- 2015-03-16 KR KR1020187012383A patent/KR101870947B1/ko active IP Right Grant
-
2017
- 2017-12-25 JP JP2017247954A patent/JP6462104B2/ja active Active
-
2018
- 2018-01-26 JP JP2018011828A patent/JP6484358B2/ja active Active
- 2018-01-26 JP JP2018011829A patent/JP6490846B2/ja active Active
-
2019
- 2019-07-31 US US16/527,160 patent/US11120809B2/en active Active
-
2021
- 2021-07-07 US US17/369,056 patent/US11670313B2/en active Active
- 2021-07-08 US US17/370,060 patent/US11694702B2/en active Active
-
2023
- 2023-05-09 US US18/195,015 patent/US12051430B2/en active Active
-
2024
- 2024-06-14 US US18/743,662 patent/US20240339119A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6462104B2 (ja) | 復号装置、及びその方法、プログラム、記録媒体 | |
JP6495492B2 (ja) | 復号装置、及びその方法、プログラム、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6462104 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |