JP6633787B2 - 線形予測復号装置、方法、プログラム及び記録媒体 - Google Patents
線形予測復号装置、方法、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP6633787B2 JP6633787B2 JP2019009389A JP2019009389A JP6633787B2 JP 6633787 B2 JP6633787 B2 JP 6633787B2 JP 2019009389 A JP2019009389 A JP 2019009389A JP 2019009389 A JP2019009389 A JP 2019009389A JP 6633787 B2 JP6633787 B2 JP 6633787B2
- Authority
- JP
- Japan
- Prior art keywords
- linear prediction
- coefficient
- unit
- converted
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 127
- 238000001228 spectrum Methods 0.000 claims description 275
- 238000006243 chemical reaction Methods 0.000 claims description 238
- 230000009466 transformation Effects 0.000 claims description 49
- 230000003595 spectral effect Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 85
- 238000012545 processing Methods 0.000 description 53
- 239000006185 dispersion Substances 0.000 description 43
- 238000013139 quantization Methods 0.000 description 34
- 230000008569 process Effects 0.000 description 30
- 230000002087 whitening effect Effects 0.000 description 23
- 230000006978 adaptation Effects 0.000 description 22
- 238000009826 distribution Methods 0.000 description 19
- 238000010606 normalization Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 17
- 230000005236 sound signal Effects 0.000 description 16
- 108010076504 Protein Sorting Signals Proteins 0.000 description 15
- 238000005314 correlation function Methods 0.000 description 12
- 230000001131 transforming effect Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0016—Codebook for LPC parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
以下、線形予測符号化装置、線形予測復号装置及びこれらの方法を用いた符号化装置、復号装置及びこれらの方法の例について説明する。
(符号化)
第一実施形態の線形予測符号化装置及び方法の一例について説明する。
周波数領域変換部220には、時系列信号である時間領域の音信号が入力される。
線形予測分析部221には、例えばMDCT係数列X(0),X(1),…,X(N-1)である周波数領域サンプル列及びその周波数領域サンプル列に対応するパラメータη1が入力される。
符号帳記憶部222には、パラメータη2に対応する線形予測係数に変換可能な係数の候補が複数個格納された符号帳が記憶されている。
線形変換部225には、線形予測分析部221が得た線形予測係数に変換可能な係数と、その線形予測係数に変換可能な係数に対応するパラメータη1とが入力される。パラメータη1は、例えば、後述するパラメータ決定部27,27’により決定される。
この場合、線形変換部225の第一線形変換部2251は、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対し、少なくとも入力されたパラメータη1に応じた第一線形変換を行う(ステップDE2)。
この場合、線形変換部225の第二線形変換部2252は、線形予測分析部221で得られた線形予測係数に変換可能な係数に対し、少なくとも入力されたパラメータη1に応じた第二線形変換を行う(ステップDE2)。
この場合、線形変換部225の第一線形変換部2251は、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対し、少なくともパラメータη3に応じた第一線形変換を行う。パラメータη3は、正の値であり、パラメータη2とは異なる値を予め定めておくか、線形予測係数符号化装置の外部から入力されるものである。
符号化部224の処理は、線形変換部225の構成に応じて異なる。このため、線形変換部225が(1)第1の場合、(2)第2の場合及び(3)第3の場合のそれぞれ場合の符号化部224の処理について以下に説明する。
線形変換部22が(1)第1の場合には、符号化部224には、線形予測分析部221が得た線形予測係数に変換可能な係数と、線形変換部225の第一線形変換部2251が得た第一線形変換後の線形予測係数に変換可能な係数の候補とが入力される。
線形変換部22が(2)第2の場合には、符号化部224には、線形予測分析部221の第二線形変換部2252が得た線形予測係数に変換可能な係数と、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補とが入力される。
線形変換部22が(3)第3の場合には、符号化部224には、線形予測分析部221の第二線形変換部2252が得た線形予測係数に変換可能な係数と、線形予測分析部221の第一線形変換部2251が得た線形予測係数に変換可能な係数の候補とが入力される。
第一実施形態の線形予測復号装置及び方法の一例について説明する。
符号帳記憶部311には、符号帳記憶部222に記憶されている符号帳と同じ符号帳が記憶されている。すなわち、符号帳記憶部311には、パラメータη2に対応する線形予測係数に変換可能な係数の候補が複数個格納された符号帳が記憶されている。
復号部313には、線形予測符号化装置が出力した線形予測係数符号が入力される。
線形変換部314には、復号部313で得られたパラメータη2に対応する線形予測係数に変換可能な係数と、パラメータη1とが入力される。このパラメータη1は、例えば線形予測符号化装置から受信したパラメータ符号を復号することにより得られるものである。
得られたパラメータη1に対応する線形予測係数に変換可能な係数は、線形予測復号装置又は方法による復号結果として出力される。
以下、第一線形変換及び第二線形変換等の線形変換の例について説明する。
(符号化)
第二実施形態の線形予測符号化装置及び方法の一例について説明する。
周波数領域変換部220には、時系列信号である時間領域の音信号が入力される。
線形予測分析部221には、例えばMDCT係数列X(0),X(1),…,X(N-1)である周波数領域サンプル列及びその周波数領域サンプル列に対応するパラメータηが入力される。
符号帳記憶部222には、複数の符号帳が記憶されている。
符号帳選択部223には、パラメータηが入力される。
第一の方法では、符号帳記憶部222には、線形予測係数に変換可能な係数の候補数が異なる複数の符号帳が記憶されている。また、符号帳選択部223は、パラメータηが大きいほど、符号帳記憶部222に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補数が多い符号帳を選択する。
第二の方法では、符号帳記憶部222には、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列の平坦度合いが異なる複数の符号帳が記憶されている。また、符号帳選択部223は、ηが小さいほど、符号帳記憶部222に記憶された複数の符号帳の中から、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列がより平坦である符号帳を選択する。
線形予測係数に変換可能な係数がPARCOR係数の場合には、パラメータηが小さいほど、PARCOR係数である線形予測係数に変換可能な係数は全体的に値が小さくなる傾向がある。
第二の方法においても、適切な符号帳の選択を閾値に基づいて行ってもよい。例えば、第一符号帳の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列の方が、第二符号帳の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列よりも平坦であるとする。この場合、パラメータηの閾値を1つ予め定めておき、入力されたパラメータηが閾値よりも小さい場合はパラメータηが小さいと判断し第一符号帳を選択する。入力されたパラメータηが閾値以上である場合はパラメータηが大きいと判断し第二符号帳を選択する。符号帳の数が3以上である場合には、符号帳の数から1を減算した値の個数の閾値を用いてこれと同様に符号帳を選択すればよい。
第三の方法では、符号帳記憶部222には、線形予測係数に変換可能な係数の候補間の間隔が異なる複数の符号帳が記憶されている。また、符号帳選択部223は、ηが小さいほど、符号帳記憶部222に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補間の間隔が狭い符号帳を選択する。
この例のように、また、線形予測係数に変換可能な係数の候補間の間隔は、その符号帳に含まれる、隣接する2個の線形予測係数に変換可能な係数の候補の距離の平均値であってもよい。
符号化部224には、線形予測分析部221が得た線形予測係数に変換可能な係数及び符号帳選択部223が得た選択された符号帳についての情報が入力される。
第二実施形態の線形予測復号装置及び方法の一例について説明する。
符号帳記憶部311には、複数の符号帳が記憶されている。
符号帳選択部312には、パラメータηが入力される。パラメータηは、パラメータ符号を復号することにより得られる。パラメータηは、符号化装置及び復号装置で予め定められた同一の数であってもよい。
復号部313には、符号化装置が出力した線形予測係数符号及び符号帳選択部312が得た選択された符号帳についての情報が入力される。また、復号部313は、選択された符号帳についての情報により特定される符号帳を符号帳記憶部311により読み込む。
図1から図3、図21及び図25から図27に一点鎖線で示すように、適合部22Aが符号帳選択部223及び線形変換部225の少なくとも一方から構成されているとすると、適合部22Aは、入力されたη1に基づいて、符号帳記憶部222に記憶された符号帳と、線形予測分析部221により生成された線形予測係数に変換可能な係数との少なくとも一方を適合させていると言える。言い換えれば、適合部22Aは、符号帳記憶部22に記憶された符号帳に格納された線形予測係数に変換可能な係数の複数個の候補と、線形予測分析部221が得た線形予測係数に変換可能な係数と、のηの値を適合させていると言える。適合部22Aは、例えば、適合前の「符号帳記憶部222に記憶されている符号帳、つまり線形予測係数に変換可能な係数の複数個の候補に対応するパラメータηの値と、線形予測分析部221により生成された線形予測係数に変換可能な係数に対応するパラメータηの値との差」に比べて、適合後の2つのパラメータηの値の差が小さくなるように、少なくとも一方の線形予測係数に変換可能な係数を変形しているとも言える。なお、適合部22Aは、適合後には2つのパラメータηの値がほぼ同じ値になるように適合を行っているとも言える。。第一実施形態で説明した線形変換部225の第一線形変換部2251の処理及び第二実施形態で説明した符号帳選択部223の処理は、符号帳記憶部222に記憶された符号帳の適合の一例である。第二実施形態で説明した線形変換部225の第二線形変換部2252の処理は、線形予測分析部221により生成された線形予測係数に変換可能な係数の適合の一例である。
以下、線形予測符号化装置、線形予測復号装置及びこれらの方法を用いた符号化装置、復号装置及びこれらの方法の例について説明する。
(符号化)
第一実施形態の符号化装置の構成例を図8に示す。第一実施形態の符号化装置は、図8に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27とを例えば備えている。この符号化装置により実現される第一実施形態の符号化方法の各処理の例を図9に示す。
第一実施形態では、所定の時間区間ごとに複数のパラメータηの何れかがパラメータ決定部27により選択可能とされている。
周波数領域変換部21には、時間領域の時系列信号である音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が算出した予測残差のエネルギーσ2が入力される。
符号化部26が行う符号化処理の具体例1として、ループ処理を含まない例について説明する。
利得取得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261が得たグローバルゲインgが入力される。
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη1、利得取得部261が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
算術符号化部269には、パラメータ決定部27が読み出したパラメータη1、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
利得符号化部265には、利得取得部261が得たグローバルゲインgが入力される。
符号化部26が行う符号化処理の具体例2として、ループ処理を含む例について説明する。
利得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261又は利得更新部267が得たグローバルゲインgが入力される。
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη1、利得取得部261又は利得更新部267が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
算術符号化部269には、パラメータ決定部27が読み出したパラメータη1、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
判定部266には、算術符号化部269が得た整数信号符号が入力される。
利得更新部267には、算術符号化部264が計測した消費ビット数Cが入力される。
利得符号化部265には、判定部266からの出力指示及び利得更新部267が得たグローバルゲインgが入力される。
符号化部26は、例えば以下の処理を行うことにより、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基にビット割り当てを変える符号化を行ってもよい。
ステップA1からステップA6の処理により、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータη1ごとに生成された符号(この例では、線形予測係数符号、利得符号及び整数信号符号)は、パラメータ決定部27に入力される。
符号化装置に対応する復号装置の構成例を図13に示す。第一実施形態の復号装置は、図13に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36と、パラメータ復号部37とを例えば備えている。この復号装置により実現される第一実施形態の復号方法の各処理の例を図14に示す。
パラメータ復号部37には、符号化装置が出力したパラメータ符号が入力される。
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号及びパラメータ復号部37により得られた復号パラメータηが入力される。
非平滑化振幅スペクトル包絡系列生成部32には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部33には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
復号部34には、パラメータ復号部37が求めた復号パラメータη、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡生成部32が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
包絡逆正規化部35には、平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
第一実施形態の符号化装置及び方法は、複数のパラメータηのそれぞれについて符号化を行い符号を生成し、パラメータηごとに生成された符号の中から最適な符号を選択し、選択された符号及び選択された符号に対応するパラメータ符号を出力するものであった。
第二実施形態の符号化装置の構成例を図16に示す。符号化装置は、図16に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27’とを例えば備えている。この符号化装置により実現される符号化方法の各処理の例を図17に示す。
パラメータ決定部27’には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部41には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
スペクトル包絡推定部42には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部421には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
非平滑化振幅スペクトル包絡系列生成部422には、線形予測分析部421が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
白色化スペクトル系列生成部43には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)及び非平滑化振幅スペクトル包絡生成部422が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)が入力される。
パラメータ取得部44には、白色化スペクトル系列生成部43が生成した白色化スペクトル系列XW(0),XW(1),…,XW(N-1)が入力される。
第二実施形態の復号装置及び方法は、第一実施形態と同様であるため重複説明を省略する。
線形予測分析部22及び非平滑化振幅スペクトル包絡系列生成部23を1つのスペクトル包絡推定部2Aとして捉えると、このスペクトル包絡推定部2Aは、時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做したスペクトル包絡(非平滑化振幅スペクトル包絡系列)の推定を行っていると言える。ここで、「パワースペクトルと見做した」とは、パワースペクトルを通常用いるところに、η1乗のスペクトルを用いることを意味する。
また、各装置又は各方法における各部をコンピュータによって実現してもよい。その場合、各装置又は各方法の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置又は各方法における各部がコンピュータ上で実現される。
Claims (14)
- 符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
上記復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、
上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
を含む線形予測復号装置。 - 複数の符号帳が記憶された符号帳記憶部と、
上記符号帳記憶部に記憶された複数の符号帳の中からη2(ただし、η2は正の数)に応じて符号帳を選択する符号帳選択部と、
上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
上記復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、
上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
を含む線形予測復号装置。 - 請求項1又は2の線形予測復号装置において、
上記線形変換部は、上記η1が小さいほど上記線形変換後の線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列が平坦になるように上記線形変換を行う、
線形予測復号装置。 - 請求項1から3の何れかの線形予測復号装置において、
pを線形予測係数に変換可能な係数の次数とし、上記復号部で得られた線形予測係数に変換可能な係数を^ω[k][k=1,2,…,p]とし、上記線形変換後の線形予測係数に変換可能な係数を~ω[k][k=1,2,…,p]とし、x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpを所定の非負の数とし、y1,y2,…yp-1,z2,z3,…zpの少なくとも1つは所定の正の数であるとし、Kをx1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外の要素が0である行列として、
上記線形変換部は、下記式により線形変換を行う、
線形予測復号装置。 - 請求項1又は2の線形予測復号装置において、
上記線形変換部は、上記η1が小さいほど上記線形変換後の線形予測係数に変換可能な係数の次数が小さくなるように上記線形変換を行う、
線形予測復号装置。 - 複数の符号帳が記憶された符号帳記憶部と、
上記符号帳記憶部に記憶された複数の符号帳の中からη1(ただし、η1は正の数)に応じて符号帳を選択する符号帳選択部と、
上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
を含む線形予測復号装置。 - 請求項6の線形予測復号装置において、
上記符号帳記憶部には、線形予測係数に変換可能な係数の候補数が異なる複数の符号帳が記憶されており、
上記符号帳選択部は、上記η1が大きいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補数が多い符号帳を選択する、
線形予測復号装置。 - 請求項6又は7の線形予測復号装置において、
上記符号帳記憶部には、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列の平坦度合いが異なる複数の符号帳が記憶されており、
上記符号帳選択部は、上記η1が小さいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列が平坦である符号帳を選択する、
線形予測復号装置。 - 請求項6又は7の何れかの線形予測復号装置において、
上記符号帳記憶部には、線形予測係数に変換可能な係数の候補間の間隔が異なる複数の符号帳が記憶されており、
上記符号帳選択部は、上記η1が小さいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補間の間隔が狭い符号帳を選択する、
線形予測復号装置。 - 復号部が、符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
線形変換部が、上記復号ステップで得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換ステップと、
スペクトル包絡系列生成部が、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
を含む線形予測復号方法。 - 符号帳選択部が、符号帳記憶部に記憶された複数の符号帳の中からη2(ただし、η2は正の数)に応じて符号帳を選択する符号帳選択ステップと、
復号部が、上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
線形変換部が、上記復号ステップで得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換ステップと、
スペクトル包絡系列生成部が、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
を含む線形予測復号方法。 - 符号帳選択部が、符号帳記憶部に記憶された複数の符号帳の中からη1(ただし、η1は正の数)に応じて符号帳を選択する符号帳選択ステップと、
復号部が、上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
スペクトル包絡系列生成部が、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
を含む線形予測復号方法。 - 請求項1から9の何れかの線形予測復号装置の各部としてコンピュータを機能させるためのプログラム。
- 請求項1から9の何れかの線形予測復号装置の各部としてコンピュータを機能させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015081746 | 2015-04-13 | ||
JP2015081746 | 2015-04-13 | ||
JP2015081747 | 2015-04-13 | ||
JP2015081747 | 2015-04-13 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017512523A Division JP6517924B2 (ja) | 2015-04-13 | 2016-04-11 | 線形予測符号化装置、方法、プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079069A JP2019079069A (ja) | 2019-05-23 |
JP6633787B2 true JP6633787B2 (ja) | 2020-01-22 |
Family
ID=57126589
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017512523A Active JP6517924B2 (ja) | 2015-04-13 | 2016-04-11 | 線形予測符号化装置、方法、プログラム及び記録媒体 |
JP2019009389A Active JP6633787B2 (ja) | 2015-04-13 | 2019-01-23 | 線形予測復号装置、方法、プログラム及び記録媒体 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017512523A Active JP6517924B2 (ja) | 2015-04-13 | 2016-04-11 | 線形予測符号化装置、方法、プログラム及び記録媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10325609B2 (ja) |
EP (1) | EP3270376B1 (ja) |
JP (2) | JP6517924B2 (ja) |
KR (1) | KR102061300B1 (ja) |
CN (1) | CN107408390B (ja) |
WO (1) | WO2016167215A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107430869B (zh) * | 2015-01-30 | 2020-06-12 | 日本电信电话株式会社 | 参数决定装置、方法及记录介质 |
CN107210042B (zh) * | 2015-01-30 | 2021-10-22 | 日本电信电话株式会社 | 编码装置、编码方法以及记录介质 |
CN112350760B (zh) * | 2019-08-09 | 2021-07-23 | 大唐移动通信设备有限公司 | 一种预编码码本选择的方法及装置 |
KR20210133554A (ko) * | 2020-04-29 | 2021-11-08 | 한국전자통신연구원 | 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기 |
CN111901004B (zh) * | 2020-08-04 | 2022-04-12 | 三维通信股份有限公司 | 平坦度的补偿方法和装置、存储介质和电子设备 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6253028A (ja) * | 1985-09-02 | 1987-03-07 | Nec Corp | 適応形符号化復号化方式とその装置 |
JP3186013B2 (ja) * | 1995-01-13 | 2001-07-11 | 日本電信電話株式会社 | 音響信号変換符号化方法及びその復号化方法 |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
CA2429832C (en) * | 2000-11-30 | 2011-05-17 | Matsushita Electric Industrial Co., Ltd. | Lpc vector quantization apparatus |
JP4365610B2 (ja) * | 2003-03-31 | 2009-11-18 | パナソニック株式会社 | 音声復号化装置および音声復号化方法 |
CN100507485C (zh) * | 2003-10-23 | 2009-07-01 | 松下电器产业株式会社 | 频谱编码装置和频谱解码装置 |
JP4493030B2 (ja) * | 2005-10-12 | 2010-06-30 | 月島機械株式会社 | ろ過装置 |
JP5058152B2 (ja) | 2006-03-10 | 2012-10-24 | パナソニック株式会社 | 符号化装置および符号化方法 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
CN102449689B (zh) * | 2009-06-03 | 2014-08-06 | 日本电信电话株式会社 | 编码方法、编码装置、编码程序、以及它们的记录介质 |
JP5314771B2 (ja) * | 2010-01-08 | 2013-10-16 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 |
CN102714040A (zh) * | 2010-01-14 | 2012-10-03 | 松下电器产业株式会社 | 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法 |
FR2961937A1 (fr) * | 2010-06-29 | 2011-12-30 | France Telecom | Codage/decodage predictif lineaire adaptatif |
JP2012163919A (ja) * | 2011-02-09 | 2012-08-30 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
CN105244034B (zh) * | 2011-04-21 | 2019-08-13 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
JP6053196B2 (ja) * | 2012-05-23 | 2016-12-27 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体 |
WO2014021318A1 (ja) * | 2012-08-01 | 2014-02-06 | 独立行政法人産業技術総合研究所 | 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム |
PL3252762T3 (pl) * | 2012-10-01 | 2019-07-31 | Nippon Telegraph And Telephone Corporation | Sposób kodowania, koder, program i nośnik zapisu |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
CN103824561B (zh) * | 2014-02-18 | 2015-03-11 | 北京邮电大学 | 一种语音线性预测编码模型的缺失值非线性估算方法 |
JP6270992B2 (ja) * | 2014-04-24 | 2018-01-31 | 日本電信電話株式会社 | 周波数領域パラメータ列生成方法、周波数領域パラメータ列生成装置、プログラム及び記録媒体 |
EP3226243B1 (en) * | 2014-11-27 | 2022-01-05 | Nippon Telegraph and Telephone Corporation | Encoding apparatus, decoding apparatus, and method and program for the same |
CN107430869B (zh) * | 2015-01-30 | 2020-06-12 | 日本电信电话株式会社 | 参数决定装置、方法及记录介质 |
CN107210042B (zh) * | 2015-01-30 | 2021-10-22 | 日本电信电话株式会社 | 编码装置、编码方法以及记录介质 |
CN107851442B (zh) * | 2015-04-13 | 2021-07-20 | 日本电信电话株式会社 | 匹配装置、判定装置、它们的方法、程序及记录介质 |
-
2016
- 2016-04-11 EP EP16780006.9A patent/EP3270376B1/en active Active
- 2016-04-11 WO PCT/JP2016/061682 patent/WO2016167215A1/ja active Application Filing
- 2016-04-11 JP JP2017512523A patent/JP6517924B2/ja active Active
- 2016-04-11 CN CN201680021332.5A patent/CN107408390B/zh active Active
- 2016-04-11 KR KR1020177028710A patent/KR102061300B1/ko active IP Right Grant
- 2016-04-11 US US15/562,689 patent/US10325609B2/en active Active
-
2019
- 2019-01-23 JP JP2019009389A patent/JP6633787B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2019079069A (ja) | 2019-05-23 |
WO2016167215A1 (ja) | 2016-10-20 |
EP3270376B1 (en) | 2020-03-18 |
EP3270376A1 (en) | 2018-01-17 |
JPWO2016167215A1 (ja) | 2018-02-01 |
KR20170127533A (ko) | 2017-11-21 |
CN107408390A (zh) | 2017-11-28 |
US10325609B2 (en) | 2019-06-18 |
EP3270376A4 (en) | 2018-08-29 |
KR102061300B1 (ko) | 2020-02-11 |
CN107408390B (zh) | 2021-08-06 |
US20180096694A1 (en) | 2018-04-05 |
JP6517924B2 (ja) | 2019-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6633787B2 (ja) | 線形予測復号装置、方法、プログラム及び記録媒体 | |
JP6422813B2 (ja) | 符号化装置、復号装置、これらの方法及びプログラム | |
JP6270993B2 (ja) | 符号化装置、及びその方法、プログラム、記録媒体 | |
JP6457552B2 (ja) | 符号化装置、復号装置、これらの方法及びプログラム | |
JP6595687B2 (ja) | 符号化方法、符号化装置、プログラム、および記録媒体 | |
JP6499206B2 (ja) | パラメータ決定装置、方法、プログラム及び記録媒体 | |
JP6387117B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム及び記録媒体 | |
JP5336942B2 (ja) | 符号化方法、復号方法、符号化器、復号器、プログラム | |
JP6668532B2 (ja) | 復号装置、及びその方法、プログラム、記録媒体 | |
JP2011009868A (ja) | 符号化方法、復号方法、符号化器、復号器およびプログラム | |
JP5635213B2 (ja) | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6633787 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |