JP6633787B2 - 線形予測復号装置、方法、プログラム及び記録媒体 - Google Patents

線形予測復号装置、方法、プログラム及び記録媒体 Download PDF

Info

Publication number
JP6633787B2
JP6633787B2 JP2019009389A JP2019009389A JP6633787B2 JP 6633787 B2 JP6633787 B2 JP 6633787B2 JP 2019009389 A JP2019009389 A JP 2019009389A JP 2019009389 A JP2019009389 A JP 2019009389A JP 6633787 B2 JP6633787 B2 JP 6633787B2
Authority
JP
Japan
Prior art keywords
linear prediction
coefficient
unit
converted
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019009389A
Other languages
English (en)
Other versions
JP2019079069A (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
弘和 亀岡
弘和 亀岡
亮介 杉浦
亮介 杉浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Publication of JP2019079069A publication Critical patent/JP2019079069A/ja
Application granted granted Critical
Publication of JP6633787B2 publication Critical patent/JP6633787B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、線形予測係数に変換可能な係数を符号化又は復号する技術に関する。
線形予測係数に変換可能な係数の1つであるLSPパラメータの量子化技術として、ベクトル量子化等の手法が知られている(例えば、非特許文献1参照)。
ところで、公知とはなっていないが、発明者によりパラメータηが提案されている。このパラメータηは、例えば3GPP EVS(Enhanced Voice Services)規格で使われているような線形予測包絡を利用する周波数領域の係数の量子化値を算術符号化する符号化方式において、算術符号の符号化対象の属する確率分布を定める形状パラメータである。パラメータηは、符号化対象の分布と関連性を有しており、パラメータηを適宜定めると効率の良い符号化及び復号を行うことが可能である。
また、パラメータηは、時系列信号の特徴を表す指標と成り得る。このため、パラメータηを適宜用いると、LSPパラメータ等の線形予測係数に変換可能な係数を効率良く符号化及び復号を行うことが可能である。
守谷健弘,「高圧縮音声符号化の必須技術:線スペクトル対(LSP)」,NTT技術ジャーナル,2014年9月,P.58−60
しかしながら、パラメータηを用いた線形予測係数に変換可能な係数の符号化及び復号技術は知られていなかった。
本発明は、パラメータηを用いて線形予測係数に変換可能な係数の符号化又は復号を行う線形予測符号化装置、線形予測復号装置、これらの方法、プログラム及び記録媒体を提供することを目的とする。
この発明の一態様による線形予測復号装置は、符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、を備えている。
この発明の一態様による線形予測復号装置は、複数の符号帳が記憶された符号帳記憶部と、符号帳記憶部に記憶された複数の符号帳の中からη(ただし、η2は正の数)に応じて符号帳を選択する符号帳選択部と、選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、を備えている。
この発明の一態様による線形予測復号装置は、複数の符号帳が記憶された符号帳記憶部と、符号帳記憶部に記憶された複数の符号帳の中からη(ただし、ηは正の数)に応じて符号帳を選択する符号帳選択部と、選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、を備えている。
パラメータηを用いて線形予測係数に変換可能な係数の符号化又は復号を行うことができる。
線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化方法の例を説明するためのフローチャート。 LSPパラメータとηとの関係の例を説明するための図。 線形予測復号装置の例を説明するためのブロック図。 線形予測復号方法の例を説明するためのフローチャート。 符号化装置の例を説明するためのブロック図。 符号化方法の例を説明するためのフローチャート。 符号化部の例を説明するためのブロック図。 符号化部の例を説明するためのブロック図。 符号化部の処理の例を説明するためのフローチャート。 復号装置の例を説明するためのブロック図。 復号方法の例を説明するためのフローチャート。 復号部の処理の例を説明するためのフローチャート。 符号化装置の例を説明するためのブロック図。 符号化方法の例を説明するためのフローチャート。 パラメータ決定装置の例を説明するためのブロック図。 パラメータ決定方法の例を説明するためのフローチャート。 一般化ガウス分布を説明するための図。 線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化方法の例を説明するためのフローチャート。 線形予測復号装置の例を説明するためのブロック図。 線形予測復号方法の例を説明するためのフローチャート。 線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化装置の例を説明するためのブロック図。 線形予測符号化装置の例を説明するためのブロック図。 線形予測復号装置の例を説明するためのブロック図。
[線形予測符号化装置、線形予測復号装置及びこれらの方法]
以下、線形予測符号化装置、線形予測復号装置及びこれらの方法を用いた符号化装置、復号装置及びこれらの方法の例について説明する。
[線形予測符号化装置、線形予測復号装置及びこれらの方法の第一実施形態]
(符号化)
第一実施形態の線形予測符号化装置及び方法の一例について説明する。
第一実施形態の線形予測符号化装置は、図1、図2又は図3に示すように、線形予測分析部221、符号帳記憶部222、符号化部224及び線形変換部225を例えば備えている。図1、図2又は図3の例では線形予測符号化装置の外部に周波数領域変換部220が設けられているが、線形予測符号化装置が周波数領域変換部220を更に備えていてもよい。線形予測符号化装置の各部が、図4に例示する各処理を行うことにより線形予測符号化方法が実現される。
<周波数領域変換部220>
周波数領域変換部220には、時系列信号である時間領域の音信号が入力される。
周波数領域変換部41は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部221に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部220は、時系列信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部221>
線形予測分析部221には、例えばMDCT係数列X(0),X(1),…,X(N-1)である周波数領域サンプル列及びその周波数領域サンプル列に対応するパラメータη1が入力される。
パラメータη1は、正の数である。パラメータη1は、例えば、後述するパラメータ決定部27,27’により決定される。パラメータη1は、例えば3GPP EVS(Enhanced Voice Services)規格で使われているような線形予測包絡を利用する周波数領域の係数の量子化値を算術符号化する符号化方式において、算術符号の符号化対象の属する確率分布を定めるパラメータηである。パラメータηは、時系列信号の特徴を表す指標と成り得るものである。後に出てくるパラメータη23も、パラメータηである。η123は、パラメータηの所定の値とも言える。
なお、パラメータη1についての情報は、線形予測復号装置に送信されるとする。例えば、パラメータη1を表すパラメータ符号が線形予測復号装置に送信される。
線形予測分析部221は、MDCT係数列X(0),X(1),…,X(N-1)及びη1を用いて、以下の式(A7)により定義される~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って線形予測係数に変換可能な係数を生成する(ステップDE1)。
生成された線形予測係数に変換可能な係数は、符号化部224に出力される。
具体的には、線形予測分析部22は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη1乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(A7)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη1乗に対応する時間領域の信号列である疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部22は、求まった疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数に変換可能な係数を生成する。
このようにして、線形予測分析部221は、η1を正の数として、時系列信号に対応する周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得る。
線形予測係数に変換可能な係数とは、例えばLSP、PARCOR係数、ISP等である。線形予測係数に変換可能な係数は、線形予測係数自体であってもよい。
pを所定の正の数とし、線形予測係数に可能な係数の次数をp次とする。
<符号帳記憶部222>
符号帳記憶部222には、パラメータη2に対応する線形予測係数に変換可能な係数の候補が複数個格納された符号帳が記憶されている。
以下、線形予測係数に変換可能な係数の候補と、その線形予測係数に変換可能な係数の候補に対応する符号とのペアを、候補符号ペアと呼ぶことにする。符号帳には、複数個の候補符号ペアが記憶されている。言い換えると、Nを所定の2以上の数とすると、符号帳には、N個の候補ペアが記憶されている。線形予測係数に変換可能な係数の候補に対応する符号のそれぞれには、所定の数のビットが割り当てられている。各符号は、割り当てられた所定の数のビットで表現される。
線形予測係数に変換可能な係数の次数がpであるため、線形予測係数に変換可能な係数の各候補はp個の値から構成される。
パラメータη2に対応する線形予測係数に変換可能な係数の候補とは、パラメータηの値がη2である周波数領域サンプル列に対応する線形予測係数に変換可能な係数を符号化するために最適化された線形予測係数に変換可能な係数の候補である。
<線形変換部225>
線形変換部225には、線形予測分析部221が得た線形予測係数に変換可能な係数と、その線形予測係数に変換可能な係数に対応するパラメータη1とが入力される。パラメータη1は、例えば、後述するパラメータ決定部27,27’により決定される。
線形変換部225は、第一線形変換部2251及び第二線形変換部2252の少なくとも一方を備えている。
以下、(1)図1に示すように線形変換部225が第一線形変換部2251を備えている場合を第1の場合とし、(2)図2に示すように線形変換部225が第二線形変換部2252を備えている場合を第2の場合とし、(3)図3に示すように線形変換部225が第一線形変換部2251及び第二線形変換部2252を備えている場合を第3の場合として、各場合について説明する。
(1)第1の場合
この場合、線形変換部225の第一線形変換部2251は、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対し、少なくとも入力されたパラメータη1に応じた第一線形変換を行う(ステップDE2)。
例えば、第一線形変換部2251は、入力されたパラメータη1と符号帳記憶部222に格納された線形予測係数に変換可能な係数の候補に対応するパラメータη2とに応じた第一線形変換により、符号帳記憶部222から読み込んだパラメータη2に対応する線形予測係数に変換可能な係数の候補を、パラメータη1に対応する線形予測係数に変換可能な係数の候補に変換する。
パラメータη1に対応する線形予測係数に変換可能な係数の候補とは、パラメータηの値がη1である周波数領域サンプル列に対応する線形予測係数に変換可能な係数を符号化するために最適化された線形予測係数に変換可能な係数の候補である。
第一線形変換後の線形予測係数に変換可能な係数の候補は、符号化部224に出力される。
なお、パラメータη1の値とパラメータη2の値とが同一である場合には、第一線形変換部2251は、第一線形変換をしなくてもよい。
また、例えば、線形変換部225の第一線形変換部2251は、入力されたパラメータη1に応じて、入力されたパラメータη1が小さいほど、第一線形変換後の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列が平坦になるように、符号帳記憶部222から読み込んだ線形予測係数に変換可能な係数の候補に対して第一線形変換を行い、変換後の線形予測係数に変換可能な係数の候補を出力する。
一般にパラメータηが小さいほど、非平滑化スペクトル包絡系列は平坦になる傾向があり、線形予測係数に変換可能な係数はより同じような値を取る傾向がある。例えば線形予測係数に変換可能な係数がLSPである場合には、パラメータηが小さいほど、LSPである線形予測係数に変換可能な係数は0からπまでを均等分割した値により近づく傾向がある。
図5に、パラメータηが各値を取るときのLSPパラメータの値の例を示す。図5の横軸はパラメータηであり、縦軸はLSPパラメータである。図5をみると、パラメータηが小さいほどLSPパラメータは0からπまでを均等分割した値に近づく傾向があることがわかる。
この傾向を用いて、パラメータηが小さいほど、非平滑化スペクトル包絡系列がより平坦な場合に対応するように線形予測係数に変換可能な係数の候補を変換したものを用いて符号化及び復号を行うことにより量子化性能を向上させることができる。
(2)第2の場合
この場合、線形変換部225の第二線形変換部2252は、線形予測分析部221で得られた線形予測係数に変換可能な係数に対し、少なくとも入力されたパラメータη1に応じた第二線形変換を行う(ステップDE2)。
例えば、第二線形変換部2252は、線形予測分析部221で得られたパラメータη1に対応する線形予測係数に変換可能な係数を、符号帳記憶部222に格納された線形予測係数に変換可能な係数の候補に対応するようにするために、パラメータη2に対応する線形予測係数に変換可能な係数に、第二線形変換する。
第二線形変換後の線形予測係数に変換可能な係数は、符号化部224に出力される。
なお、パラメータη1の値とパラメータη2の値とが同一である場合には、第二線形変換部2252は、第二線形変換をしなくてもよい。
または、例えば、線形変換部225の第二線形変換部2252は、入力されたパラメータη1に応じて、入力されたパラメータη1が小さいほど、第二線形変換後の線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列が平坦になるように、入力された線形予測係数に変換可能な係数に対して第二線形変換を行い、変換後の線形予測係数に変換可能な係数を出力する。
(3)第3の場合
この場合、線形変換部225の第一線形変換部2251は、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対し、少なくともパラメータη3に応じた第一線形変換を行う。パラメータη3は、正の値であり、パラメータη2とは異なる値を予め定めておくか、線形予測係数符号化装置の外部から入力されるものである。
例えば、第一線形変換部2251は、パラメータη3と符号帳記憶部222に格納された線形予測係数に変換可能な係数の候補に対応するパラメータη2とに応じた第一線形変換により、符号帳記憶部222から読み込んだパラメータη2に対応する線形予測係数に変換可能な係数の候補を、パラメータη3に対応する線形予測係数に変換可能な係数の候補に変換する。
パラメータη3に対応する線形予測係数に変換可能な係数の候補とは、パラメータηの値がη3である周波数領域サンプル列に対応する線形予測係数に変換可能な係数を符号化するために最適化された線形予測係数に変換可能な係数の候補である。
第一線形変換後の線形予測係数に変換可能な係数の候補は、符号化部224に出力される。
なお、パラメータη2の値とパラメータη3の値とが同一である場合には、第一線形変換部2251は、第一線形変換をしなくてもよい。
また、例えば、線形変換部225の第一線形変換部2251は、パラメータη3が小さいほど、第一線形変換後の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡が平坦になるように、符号帳記憶部222から読み込んだ線形予測係数に変換可能な係数の候補に対して第一線形変換を行い、変換後の線形予測係数に変換可能な係数の候補を出力する。
また、この第3の場合、線形変換部225の第二線形変換部2252は、線形予測分析部221で得られた線形予測係数に変換可能な係数に対し、少なくともパラメータη1に応じた第二線形変換を行う。
例えば、第二線形変換部2252は、線形予測分析部221で得られたパラメータη1に対応する線形予測係数に変換可能な係数を、パラメータη3に対応する線形予測係数に変換可能な係数に、第二線形変換する。
第二線形変換後の線形予測係数に変換可能な係数の候補は、符号化部224に出力される。
なお、パラメータη1の値とパラメータη3の値とが同一である場合には、第二線形変換部2252は、第二線形変換をしなくてもよい。
または、例えば、線形変換部225の第二線形変換部2252は、入力されたパラメータη1に応じて、入力されたパラメータη1が小さいほど、第二線形変換後の線形予測係数に変換可能な係数に対応する振幅スペクトル包絡が平坦になるように、入力された線形予測係数に変換可能な係数に対して第二線形変換を行い、変換後の線形予測係数に変換可能な係数を出力する。
このようにして、(3)第3の場合には、線形変換部225は、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対する、η3に応じた第一線形変換と、線形予測分析部221で得られた線形予測係数に変換可能な係数に対する、η3に応じた第二線形変換との少なくとも一方を行う(ステップDE2)。
<符号化部224>
符号化部224の処理は、線形変換部225の構成に応じて異なる。このため、線形変換部225が(1)第1の場合、(2)第2の場合及び(3)第3の場合のそれぞれ場合の符号化部224の処理について以下に説明する。
(1)第1の場合
線形変換部22が(1)第1の場合には、符号化部224には、線形予測分析部221が得た線形予測係数に変換可能な係数と、線形変換部225の第一線形変換部2251が得た第一線形変換後の線形予測係数に変換可能な係数の候補とが入力される。
符号化部224は、線形予測係数に変換可能な係数について、第一線形変換後の線形予測係数に変換可能な係数の候補を用いて符号化して線形予測係数符号を得る(ステップDE3)。
具体的には、符号化部224は、複数個の、第一線形変換後の線形予測係数に変換可能な係数の候補の中で、線形予測係数に変換可能な係数に最も近いものを選択し、その選択された候補に対応する符号を線形予測係数符号とする。
得られた線形予測係数符号は、復号装置に出力される。
(2)第2の場合
線形変換部22が(2)第2の場合には、符号化部224には、線形予測分析部221の第二線形変換部2252が得た線形予測係数に変換可能な係数と、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補とが入力される。
符号化部224は、第二線形変換後の線形予測係数に変換可能な係数について、線形予測係数に変換可能な係数の候補を用いて符号化して線形予測係数符号を得る(ステップDE3)。
具体的には、符号化部224は、複数個の、線形予測係数に変換可能な係数の候補の中で、第二線形変換後の線形予測係数に変換可能な係数に最も近いものを選択し、その選択された候補に対応する符号を線形予測係数符号とする。
得られた線形予測係数符号は、復号装置に出力される。
(3)第3の場合
線形変換部22が(3)第3の場合には、符号化部224には、線形予測分析部221の第二線形変換部2252が得た線形予測係数に変換可能な係数と、線形予測分析部221の第一線形変換部2251が得た線形予測係数に変換可能な係数の候補とが入力される。
符号化部224は、第二線形変換後の線形予測係数に変換可能な係数について、第一線形変換後の線形予測係数に変換可能な係数の候補を用いて符号化して線形予測係数符号を得る(ステップDE3)。
具体的には、符号化部224は、複数個の、第一線形変換後の線形予測係数に変換可能な係数の候補の中で、第二線形変換後の線形予測係数に変換可能な係数に最も近いものを選択し、その選択された候補に対応する符号を線形予測係数符号とする。
得られた線形予測係数符号は、復号装置に出力される。
このように、線形予測係数に変換可能な係数を線形予測係数に変換可能な係数の候補を用いて符号化する際に、線形予測係数に変換可能な係数に対応するパラメータηと線形予測係数に変換可能な係数の候補に対応するパラメータηとが同じ値または近い値となるように、線形予測係数に変換可能な係数と線形予測係数に変換可能な係数の候補の少なくとも何れかに対して線形変換を行ったものを符号化に用いることにより、符号化歪を小さくすることができる及び/又は線形予測係数符号の符号量を小さくすることができる。
(復号)
第一実施形態の線形予測復号装置及び方法の一例について説明する。
第一実施形態の線形予測復号装置は、図6に示すように、符号帳記憶部311、復号部313及び線形変換部314を例えば備えている。線形予測復号装置の各部が、図7に例示する各処理を行うことにより線形予測復号方法が実現される。
<符号帳記憶部311>
符号帳記憶部311には、符号帳記憶部222に記憶されている符号帳と同じ符号帳が記憶されている。すなわち、符号帳記憶部311には、パラメータη2に対応する線形予測係数に変換可能な係数の候補が複数個格納された符号帳が記憶されている。
<復号部313>
復号部313には、線形予測符号化装置が出力した線形予測係数符号が入力される。
復号部313は、符号帳記憶部311に記憶された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る(ステップDD1)。
得られた線形予測係数に変換可能な係数は、線形変換部314に出力される。
得られた線形予測係数に変換可能な係数は、符号帳記憶部311に記憶されたパラメータη2に対応する複数個の線形予測係数に変換可能な係数の候補の何れか1つである。このため、復号部313で得られた線形予測係数に変換可能な係数は、パラメータη2に対応する線形予測係数に変換可能な係数となる。
<線形変換部314>
線形変換部314には、復号部313で得られたパラメータη2に対応する線形予測係数に変換可能な係数と、パラメータη1とが入力される。このパラメータη1は、例えば線形予測符号化装置から受信したパラメータ符号を復号することにより得られるものである。
線形変換部314は、パラメータη2に対応する線形予測係数に変換可能な係数に対して、少なくともパラメータη1に応じた線形変換をして線形変換後の線形予測係数に変換可能な係数を得る。
例えば、線形変換部314は、入力されたパラメータη1と線形予測係数に変換可能な係数に対応するパラメータη2とに応じた線形変換により、パラメータη2に対応する線形予測係数に変換可能な係数を、パラメータη1に対応する線形予測係数に変換可能な係数に変換する。
得られた線形変換後の線形予測係数に変換可能な係数は、線形予測復号装置又は方法による復号結果として出力される。
なお、パラメータη1の値とパラメータη2の値とが同一である場合には、線形変換部314は、線形変換をしなくてもよい。
また、線形変換部314は、パラメータη2に対応する線形予測係数に変換可能な係数を線形変換してパラメータη1に対応する線形予測係数に変換可能な係数を得る際に、パラメータη1ともパラメータη2とも異なるパラメータη4を用いて、線形変換を複数回行う構成としてもよい。
例えば、線形変換を2回行う場合について説明する。この場合、線形変換部314は、パラメータη2に対応する線形予測係数に変換可能な係数を線形変換してパラメータη4に対応する線形予測係数に変換可能な係数を得る。また、線形変換部314は、得られたパラメータη4に対応する線形予測係数に変換可能な係数を線形変換してパラメータη1に対応する線形予測係数に変換可能な係数を得る。ここで、パラメータη4を線形予測係数符号化装置が用いたパラメータη3と同一の値とすれば、2つの線形変換に、線形予測係数符号化装置の線形変換部225の第3の場合におけるパラメータη2に対応する線形予測係数に変換可能な係数の候補からパラメータη3に対応する線形予測係数に変換可能な係数の候補を得る線形変換と、線形予測係数符号化装置の線形変換部225の第3の場合におけるパラメータη1に対応する線形予測係数に変換可能な係数をパラメータη3に対応する線形予測係数に変換可能な係数を得る線形変換と、同一の線形変換を用いることができる。
なお、線形変換部314は、パラメータη2からパラメータη3への線形変換と、パラメータη3からパラメータη1への線形変換とを合成した1つの線形変換を、パラメータη2に対応する線形予測係数に変換可能な係数に対してすることにより、パラメータη1に対応する線形予測係数に変換可能な係数を得てもよい。
得られたパラメータη1に対応する線形予測係数に変換可能な係数は、線形予測復号装置又は方法による復号結果として出力される。
また、例えば、線形変換部314は、線形予測符号化装置の線形変換部225と同様に、入力されたη1が小さいほど、線形変換後の線形予測係数に変換可能な係数に対応する振幅スペクトル包絡が平坦になるように、復号部313で得られた線形予測係数に変換可能な係数を線形変換して線形変換後の線形予測係数に変換可能な係数を得てもよい。
これは、一般にパラメータηが小さいほど、非平滑化スペクトル包絡系列は平坦になるという傾向に基づくものである。
線形変換部314で得られた線形変換後の線形予測係数に変換可能な係数は、線形変換部314で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列を得るために用いられる。
[線形変換]
以下、第一線形変換及び第二線形変換等の線形変換の例について説明する。
線形変換前の線形予測係数に変換可能な係数又は線形予測係数に変換可能な係数の候補を^ω[k][k=1,2,…,p]とし、線形変換後の線形予測係数に変換可能な係数又は上記線形予測係数に変換可能な係数の候補を~ω[k][k=1,2,…,p]とする。また、線形変換前の線形予測係数に変換可能な係数はLSPであるとする。このとき、第一線形変換部2251、第二線形変換部2252、逆線形変換部226及び線形変換部314は、例えば以下の式に示される線形変換を行う。
ここで、x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpを所定の非負の数とし、y1,y2,…yp-1,z2,z3,…zpの少なくとも1つは所定の正の数であるとし、Kをx1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外の要素が0である行列とする。
x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpの具体的な値は、線形変換前の線形予測係数に変換可能な係数又は線形予測係数に変換可能な係数の候補に対応するパラメータη(以下、線形変換前パラメータηAとする)の値と、線形変換後の線形予測係数に変換可能な係数又は線形予測係数に変換可能な係数の候補に対応するパラメータη(以下、線形変換後パラメータηBとする)の値とに基づいて適宜定まるものである。
異なる複数の、線形変換前パラメータηAと線形変換後パラメータηBとの組に対応するx1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpの具体的な値を図示していない記憶部に予め記憶しておく。第一線形変換部2251、第二線形変換部2252、逆線形変換部226及び線形変換部314は、線形変換をするときに、その線形変換における線形変換前パラメータηAと線形変換後パラメータηBとの組に対応するx1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpの具体的な値を読み込み、読み込んだこれらの値を用いて上記式による線形変換を行えばよい。
ところで、パラメータη1が大きい場合には、線形予測係数に変換可能な係数を使って計算したスペクトル包絡の変動は大きい傾向がある。このため、次数が大きい線形予測係数に変換可能な係数の候補を用いて符号化及び復号をすることが望ましい。
逆に、パラメータη1が小さい場合には、線形予測係数に変換可能な係数を使って計算したスペクトル包絡の変動は小さい傾向がある。このため、次数が小さい線形予測係数に変換可能な係数の候補を用いて符号化及び復号をしても量子化歪は小さいため符号化及び復号の精度はそれほど悪くならない。
このため、線形変換部225の第一線形変換部2251は、パラメータη1が小さいほど第一線形変換後の線形予測係数に変換可能な係数の候補の次数が小さくなるように第一線形変換を行ってもよい。
同様に、線形変換部314は、パラメータη1が小さいほど線形変換後の線形予測係数に変換可能な係数の次数が小さくなるように線形変換を行ってもよい。
このように、線形変換前の線形変換前の線形予測係数に変換可能な係数又は線形予測係数に変換可能な係数の候補の次数と、線形変換後の線形予測係数に変換可能な係数又は線形予測係数に変換可能な係数の候補の次数とが異なるように線形変換が行われてもよい。
なお、第一線形変換部2251は、線形変換前の次数と線形変換後の次数とが同じである線形変換を行った後に線形変換後の線形予測係数に変換可能な係数の候補の次数を減らしてもよい。また、第一線形変換部2251は、線形変換後の線形予測係数に変換可能な係数の候補の次数を減らした後に線形変換前の次数と線形変換後の次数とが同じである線形変換を行ってもよい。
同様に、線形変換部314は、線形変換前の次数と線形変換後の次数とが同じである線形変換を行った後に線形変換後の線形予測係数に変換可能な係数の次数を減らしてもよい。また、線形変換部314は、線形変換後の線形予測係数に変換可能な係数の次数を減らした後に線形変換前の次数と線形変換後の次数とが同じである線形変換を行ってもよい。
また、第一線形変換部2251は、パラメータη1が小さい場合には、線形変換後の線形予測係数に変換可能な係数の複数の候補を統合することにより、パラメータη1が小さいほど線形変換後の線形予測係数に変換可能な係数の複数の候補数を減らしてもよい。
[線形予測符号化装置、線形予測復号装置及びこれらの方法の第二実施形態]
(符号化)
第二実施形態の線形予測符号化装置及び方法の一例について説明する。
第二実施形態の線形予測符号化装置は、図21に示すように、線形予測分析部221、符号帳記憶部222、符号帳選択部223及び符号化部224を例えば備えている。図21の例では線形予測符号化装置の外部に周波数領域変換部220が設けられているが、線形予測符号化装置が周波数領域変換部220を更に備えていてもよい。線形予測符号化装置の各部が、図22に例示する各処理を行うことにより線形予測符号化方法が実現される。
第二実施形態では、「パラメータη1」のことを「パラメータη」と表記する。
<周波数領域変換部220>
周波数領域変換部220には、時系列信号である時間領域の音信号が入力される。
周波数領域変換部41は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部221に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部220は、時系列信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部221>
線形予測分析部221には、例えばMDCT係数列X(0),X(1),…,X(N-1)である周波数領域サンプル列及びその周波数領域サンプル列に対応するパラメータηが入力される。
パラメータηは、正の数である。パラメータηは、例えば、後述するパラメータ決定部27,27’により決定される。パラメータηは、例えば3GPP EVS(Enhanced Voice Services)規格で使われているような線形予測包絡を利用する周波数領域の係数の量子化値を算術符号化する符号化方式において、算術符号の符号化対象の属する確率分布を定める形状パラメータである。パラメータηは、時系列信号の特徴を表す指標と成り得るものである。
線形予測分析部221は、線形予測分析部22は、MDCT係数列X(0),X(1),…,X(N-1)及びηを用いて、以下の式(A7)により定義される~R(0),~R(1),…,~R(N-1)を用いて線形予測分析行って線形予測係数に変換可能な係数を生成する(ステップDE1)。
生成された線形予測係数に変換可能な係数は、符号化部224に出力される。
具体的には、線形予測分析部22は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(A7)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部22は、求まった疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数に変換可能な係数を生成する。
このようにして、線形予測分析部221は、ηを正の数として、時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得る。
線形予測係数に変換可能な係数とは、例えばLSP,PARCOR係数、ISP等である。線形予測係数に変換可能な係数は、線形予測係数自体であってもよい。
pを所定の正の数とし、線形予測係数に可能な係数の次数をp次とする。
<符号帳記憶部222>
符号帳記憶部222には、複数の符号帳が記憶されている。
以下、線形予測係数に変換可能な係数の候補と、その線形予測係数に変換可能な係数の候補に対応する符号とのペアを、候補符号ペアと呼ぶことにする。各符号帳には、複数の候補符号ペアが記憶されている。言い換えると、Iを所定の2以上の数として、Niをiに応じて定まる所定の2以上の数とすると、符号帳i(i=1,2,…,I)のそれぞれには、Ni個の候補ペアが記憶されている。線形予測係数に変換可能な係数の候補に対応する符号のそれぞれには、所定の数のビットが割り当てられている。各符号は、割り当てられた所定の数のビットで表現される。
線形予測係数に変換可能な係数の次数がpであるため、、線形予測係数に変換可能な係数の各候補はp個の値から構成される。
符号帳記憶部222に記憶されている複数の符号帳は、符号帳選択部223の符号帳の選択方法によって異なる。このため、符号帳記憶部222に記憶されている複数の符号帳の例は、後述する符号帳選択部223の例と合わせて説明する。
<符号帳選択部223>
符号帳選択部223には、パラメータηが入力される。
符号帳選択部223は、符号帳記憶部222に記憶された複数の符号帳の中から入力されたηに応じて符号帳を選択する(ステップDE2)。選択された符号帳についての情報は、符号化部224に出力される。
以下、符号帳記憶部222に記憶された複数の符号帳の例及び符号帳選択部223による符号帳の選択基準の例について説明する。
(1)第一の方法
第一の方法では、符号帳記憶部222には、線形予測係数に変換可能な係数の候補数が異なる複数の符号帳が記憶されている。また、符号帳選択部223は、パラメータηが大きいほど、符号帳記憶部222に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補数が多い符号帳を選択する。
パラメータηが大きい場合には、線形予測係数に変換可能な係数の取り得る範囲は広い傾向があるため、線形予測係数に変換可能な係数を表現するために必要な線形予測係数に変換可能な係数の候補数は多くなる。このため、パラメータηが大きい場合には、線形予測係数に変換可能な係数の候補数が多い符号帳を用いて符号化及び復号をすることが望ましい。
逆に、パラメータηが小さい場合には、線形予測係数に変換可能な係数の取り得る範囲は狭い傾向があるため、少ない個数の線形予測係数に変換可能な係数の候補で線形予測係数に変換可能な係数を表現することができる。このため、パラメータが小さい場合には、線形予測係数に変換可能な係数の候補数が少ない符号帳を用いて符号化及び復号をしても量子化歪は小さいため符号化及び復号の精度はそれほど悪くならない。
このため、第一の方法では、符号帳選択部223は、パラメータηが大きいほど、符号帳記憶部222に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補数が多い符号帳を選択する。
パラメータηの大きさについての判断は、言い換えれば適切な符号帳の選択は、閾値に基づいて行うことができる。例えば、第一符号帳の線形予測係数に変換可能な係数の候補数の方が、第二符号帳の線形予測係数に変換可能な係数の候補数よりもよりも少ないとする。この場合、パラメータηの閾値を1つ予め定めておき、入力されたパラメータηが閾値よりも小さい場合はパラメータηが小さいと判断し第一符号帳を選択する。入力されたパラメータηが閾値以上である場合はパラメータηが大きいと判断し第二符号帳を選択する。符号帳の数が3以上である場合には、符号帳の数から1を減算した値の個数の閾値を用いてこれと同様に符号帳を選択すればよい。
なお、符号帳が多層構造を有しており、パラメータηに応じてどの層まで用いるのかを決定してもよい。例えば、p=16であり、16次の線形予測係数に変換可能な係数を2層の符号帳で符号化する例について説明する。この符号帳の第一層には10ビット、第二層には5ビットの量子化ビット数が割り当てられているとする。これにより、第一層には210=1024個の、線形予測係数に変換可能な係数の候補である16次元ベクトルとその候補に対応する符号とのペアが格納され、第二層には25=32個の、線形予測係数に変換可能な係数の候補である16次元ベクトルとその候補に対応する符号とのペアが格納されているとする。
この場合、パラメータηが大きい場合には、第一層及び第二層を用いることにし、パラメータηが小さい場合には第一層のみを用いることにする。パラメータηが大きいか小さいかの判断は、上記と同様に閾値に基づいて行うことができる。
パラメータηが大きい場合には、まず第一層の線形予測係数に変換可能な係数の候補の中で、入力された線形予測係数に変換可能な係数に最も近いもの及び対応する符号を選択する。次に選択された線形予測係数に変換可能な係数の候補の値を入力された線形予測係数に変換可能な係数から減算し、第二層の線形予測係数に変換可能な係数の候補の中で、その減算値と最も近いもの及び対応する符号を選択する。この場合、第一層及び第二層で選択された2個の符号が線形予測係数符号となる。すなわち、線形予測係数符号は15ビットで表現される。また、第一層及び第二層で選択された線形予測係数に変換可能な係数の候補の和が、入力された線形予測係数に変換可能な係数の量子化結果となる。
パラメータηが小さい場合には、第一層の線形予測係数に変換可能な係数の候補の中で、入力された線形予測係数に変換可能な係数に最も近いもの及び対応する符号を選択する。この場合、第一層で選択された符号が線形予測係数符号となる。すなわち、線形予測係数符号は10ビットで表現される。また、第一層で選択された線形予測係数に変換可能な係数の候補が、入力された線形予測係数に変換可能な係数の量子化結果となる。
第一層から構成される符号帳と、第一層及び第二層から構成される符号帳とを異なる符号帳と考えると、この例も(1)第一の方法の一例と言える。
この多層構造を有する符号帳の例にように、1つの符号帳の中の候補符号ペアの数が可変である場合には、言い換えれば1つの符号帳の中の候補符号ペアの探索範囲が可変である場合には、パラメータηが小さいほど、候補符号ペアの探索範囲を狭くしてもよい。探索範囲が異なる候補符号ペアの集合を異なる符号帳と考えれば、この例も(1)第一の方法の一例と言える。
(2)第二の方法
第二の方法では、符号帳記憶部222には、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列の平坦度合いが異なる複数の符号帳が記憶されている。また、符号帳選択部223は、ηが小さいほど、符号帳記憶部222に記憶された複数の符号帳の中から、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列がより平坦である符号帳を選択する。
一般にパラメータηが小さいほど、非平滑化スペクトル包絡系列は平坦になる傾向があり、線形予測係数に変換可能な係数はより同じような値を取る傾向がある。例えば線形予測係数に変換可能な係数がLSPである場合には、パラメータηが小さいほど、LSPパラメータである線形予測係数に変換可能な係数は0からπまでを均等分割した値により近づく傾向がある。
図5に、パラメータηが各値を取るときのLSPパラメータの値の例を示す。図5の横軸はパラメータηであり、縦軸はLSPパラメータである。図5をみると、パラメータηが小さいほどLSPパラメータは0からπまでを均等分割した値に近づく傾向があることがわかる。
線形予測係数に変換可能な係数がISPパラメータの場合にも、同様の傾向がある。すなわち、線形予測係数に変換可能な係数がISPパラメータの場合、パラメータηが小さいほど、ISPパラメータである線形予測係数に変換可能な係数は0からπまでを均等分割した値により近づく傾向がある。
線形予測係数に変換可能な係数がPARCOR係数の場合には、パラメータηが小さいほど、PARCOR係数である線形予測係数に変換可能な係数は全体的に値が小さくなる傾向がある。
第二の方法は、これらの傾向を用いて、パラメータηが小さいほど、非平滑化スペクトル包絡系列がより平坦な場合に対応する線形予測係数に変換可能な係数の候補を用いて符号化及び復号を行うことにより量子化性能を向上させようとするものである。
線形予測係数に変換可能な係数がLSP又はPARCOR係数であるとして、符号帳i(i=1,2,…,I)の線形予測係数に変換可能な係数の候補を^ωn[1],^ωn[2],…,^ωn[p](n=1,2,…,Ni)と表記する。また、非平滑化スペクトル包絡が最も平坦な場合に対応する線形予測係数に変換可能な係数をωF[1],ωF[2],…,ωF[p]と表記する。
この場合、第二の方法は、例えば、符号帳記憶部222には、以下のSi 1の値が異なる複数の符号帳i(i=1,2,…,I)が記憶されているとし、符号帳選択部223が、ηが小さいほど、以下のSi 1の値が小さい符号帳iを選択することにより実現される。
Si 1=(1/pNin=1 NiΣk=1 p|^ωn[k]-ωF[k]|
第二の方法においても、適切な符号帳の選択を閾値に基づいて行ってもよい。例えば、第一符号帳の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列の方が、第二符号帳の線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列よりも平坦であるとする。この場合、パラメータηの閾値を1つ予め定めておき、入力されたパラメータηが閾値よりも小さい場合はパラメータηが小さいと判断し第一符号帳を選択する。入力されたパラメータηが閾値以上である場合はパラメータηが大きいと判断し第二符号帳を選択する。符号帳の数が3以上である場合には、符号帳の数から1を減算した値の個数の閾値を用いてこれと同様に符号帳を選択すればよい。
(3)第三の方法
第三の方法では、符号帳記憶部222には、線形予測係数に変換可能な係数の候補間の間隔が異なる複数の符号帳が記憶されている。また、符号帳選択部223は、ηが小さいほど、符号帳記憶部222に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補間の間隔が狭い符号帳を選択する。
線形予測係数に変換可能な係数の候補間の間隔とは、その符号帳に含まれる線形予測係数に変換可能な係数の候補間の間隔の広さを表す指標であればどのようなものであってもよい。例えば、線形予測係数に変換可能な係数の候補間の間隔は、その符号帳に含まれる、ある線形予測係数に変換可能な係数の候補と、別のある線形予測係数に変換可能な係数の候補との距離の平均値であってもよいし、その距離の最大値、最小値又は中央値であってもよい。
第一の方法で述べたように、パラメータηが大きい場合には、線形予測係数に変換可能な係数の変動は大きい傾向がある。このため、線形予測係数に変換可能な係数の候補間の間隔が広い符号帳を用いて符号化及び復号をすることが望ましい。
逆に、パラメータηが小さい場合には、線形予測係数に変換可能な係数の変動は小さい傾向がある。このため、線形予測係数に変換可能な係数の候補間の間隔が狭い符号帳を用いて符号化及び復号をしても量子化歪は小さいため符号化及び復号の精度はそれほど悪くならない。
第三の方法は、この傾向を利用したものである。
符号帳i(i=1,2,…,I)の線形予測係数に変換可能な係数の候補を^ωn[1],^ωn[2],…,^ωn[p](n=1,2,…,Ni)と表記する。
この場合、第三の方法は、例えば、符号帳記憶部222には、以下のSi 2の値が異なる複数の符号帳i(i=1,2,…,I)が記憶されているとし、符号帳選択部223が、ηが小さいほど、以下のSi 2の値が小さい符号帳iを選択することにより実現される。
Si 2=(1/Nin=1 Ni-1k=1 p(^ωn[k]-^ωn+1[k])|2)1/2
この例のように、また、線形予測係数に変換可能な係数の候補間の間隔は、その符号帳に含まれる、隣接する2個の線形予測係数に変換可能な係数の候補の距離の平均値であってもよい。
第三の方法においても、適切な符号帳の選択を閾値に基づいて行ってもよい。例えば、第一符号帳の線形予測係数に変換可能な係数の候補間の間隔の方が、第二符号帳の線形予測係数に変換可能な係数の候補間の間隔よりも狭いとする。この場合、パラメータηの閾値を1つ予め定めておき、入力されたパラメータηが閾値よりも小さい場合はパラメータηが小さいと判断し第一符号帳を選択する。入力されたパラメータηが閾値以上である場合はパラメータηが大きいと判断し第二符号帳を選択する。符号帳の数が3以上である場合には、符号帳の数から1を減算した値の個数の閾値を用いてこれと同様に符号帳を選択すればよい。
<符号化部224>
符号化部224には、線形予測分析部221が得た線形予測係数に変換可能な係数及び符号帳選択部223が得た選択された符号帳についての情報が入力される。
符号化部224は、選択された符号帳を用いて、線形予測係数に変換可能な係数を符号化して線形予測係数符号を得る(ステップDE3)。得られた線形予測係数符号は、復号装置に出力される。
(復号)
第二実施形態の線形予測復号装置及び方法の一例について説明する。
第二実施形態の線形予測復号装置は、図23に示すように、符号帳記憶部311、符号帳選択部312及び復号部313を例えば備えている。線形予測復号装置の各部が、図24に例示する各処理を行うことにより線形予測復号方法が実現される。
第二実施形態では、「パラメータη1」のことを「パラメータη」と表記する。
<符号帳記憶部311>
符号帳記憶部311には、複数の符号帳が記憶されている。
以下、線形予測係数に変換可能な係数の候補と、その線形予測係数に変換可能な係数の候補に対応する符号とのペアを、候補符号ペアと呼ぶことにする。各符号帳には、複数の候補符号ペアが記憶されている。言い換えると、Iを所定の2以上の数として、Niをiに応じて定まる所定の2以上の数とすると、符号帳i(i=1,2,…,I)には、Ni個の候補ペアが記憶されている。線形予測係数に変換可能な係数の候補に対応する符号のそれぞれには、所定の数のビットが割り当てられている。各符号は、割り当てられた所定の数のビットで表現される。
pを所定の正の数とし、線形予測係数に変換可能な係数の次数がpであるとすると、各線形予測係数に変換可能な係数の候補はp個の値から構成される。
符号帳記憶部311に記憶されている複数の符号帳は、符号帳選択部312の符号帳の選択方法によって異なる。このため、符号帳記憶部311に記憶されている複数の符号帳の例は、後述する符号帳選択部312の例と合わせて説明する。
なお、符号帳記憶部311には、符号帳記憶部222に記憶されている複数の符号帳と同じ符号帳が記憶されている。
<符号帳選択部312>
符号帳選択部312には、パラメータηが入力される。パラメータηは、パラメータ符号を復号することにより得られる。パラメータηは、符号化装置及び復号装置で予め定められた同一の数であってもよい。
符号帳選択部312は、符号帳記憶部311に記憶された複数の符号帳の中から入力されたηに応じて符号帳を選択する(ステップDD1)。選択された符号帳についての情報は、復号部313に出力される。
符号帳記憶部311には、符号帳記憶部222に記憶された複数の符号帳と同じ符号帳が記憶されているとする。また、符号帳選択部312には、符号化装置の符号帳選択部223による符号帳の選択基準と同じ選択基準が予め定められているとする。これにより、符号側で選択される符号帳と同じ内容の符号帳が復号側でも選択されることになる。
符号帳の選択基準については、符号化側で説明したため、ここでは重複説明を省略する。
<復号部313>
復号部313には、符号化装置が出力した線形予測係数符号及び符号帳選択部312が得た選択された符号帳についての情報が入力される。また、復号部313は、選択された符号帳についての情報により特定される符号帳を符号帳記憶部311により読み込む。
復号部313は、選択された符号帳を用いて、線形予測係数符号を復号して線形予測係数に変換可能な係数を得る(ステップDD2)。
線形予測係数に変換可能な係数は、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得るために用いられる。
[線形予測符号化装置、線形予測復号装置及びこれらの方法の変形例]
図1から図3、図21及び図25から図27に一点鎖線で示すように、適合部22Aが符号帳選択部223及び線形変換部225の少なくとも一方から構成されているとすると、適合部22Aは、入力されたη1に基づいて、符号帳記憶部222に記憶された符号帳と、線形予測分析部221により生成された線形予測係数に変換可能な係数との少なくとも一方を適合させていると言える。言い換えれば、適合部22Aは、符号帳記憶部22に記憶された符号帳に格納された線形予測係数に変換可能な係数の複数個の候補と、線形予測分析部221が得た線形予測係数に変換可能な係数と、のηの値を適合させていると言える。適合部22Aは、例えば、適合前の「符号帳記憶部222に記憶されている符号帳、つまり線形予測係数に変換可能な係数の複数個の候補に対応するパラメータηの値と、線形予測分析部221により生成された線形予測係数に変換可能な係数に対応するパラメータηの値との差」に比べて、適合後の2つのパラメータηの値の差が小さくなるように、少なくとも一方の線形予測係数に変換可能な係数を変形しているとも言える。なお、適合部22Aは、適合後には2つのパラメータηの値がほぼ同じ値になるように適合を行っているとも言える。。第一実施形態で説明した線形変換部225の第一線形変換部2251の処理及び第二実施形態で説明した符号帳選択部223の処理は、符号帳記憶部222に記憶された符号帳の適合の一例である。第二実施形態で説明した線形変換部225の第二線形変換部2252の処理は、線形予測分析部221により生成された線形予測係数に変換可能な係数の適合の一例である。
この場合、符号化部224は、適合部22Aにより適合された少なくとも一方の符号帳及び線形予測係数に変換可能な係数を用いて、符号化を行っていると言える。言い換えれば、符号化部224は、符号帳選択部223で選択された符号帳又は適合部22Aにより適合された符号帳を用いて、線形予測分析部221により線形予測係数に変換可能な係数又は適合部22Aにより適合された線形予測係数に変換可能な係数を符号化していると言える。さらに、言い換えれば、符号化部224は、ηの値が適合された線形予測係数に変換可能な係数の複数個の候補と線形予測係数に変換可能な係数とを用いて、線形予測分析部221が得た線形予測係数に変換可能な係数に対応する線形予測係数符号を得ていると言える。
第一実施形態の(1)第1の場合の適合部22Aは、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の候補に対して、η1に応じた第一線形変換を行い、第一線形変換後の線形予測係数に変換可能な係数の複数個の候補を得る線形変換部225を備えていると言える。この場合、符号化部224は、線形予測分析部221が得た線形予測係数に変換可能な係数と、適合部22Aが得た第一線形変換後の線形予測係数に変換可能な係数の複数個の候補と、を用いて、線形予測分析部221が得た線形予測係数に変換可能な係数に対応する線形予測係数符号を得ていると言える。
第一実施形態の(2)第2の場合の適合部22Aは、線形予測分析部221が得た線形予測係数に変換可能な係数に対して、η1に応じた第二線形変換を行い、第二線形変換後の線形予測係数に変換可能な係数を得る線形変換部225を備えていると言える。この場合、符号化部224は、適合部22Aが得た第二線形変換後の線形予測係数に変換可能な係数と、符号帳に格納された線形予測係数に変換可能な係数の複数個の候補と、を用いて、線形予測分析部221が得た線形予測係数に変換可能な係数に対応する線形予測係数符号を得ていると言える。
第一実施形態の(3)第3の場合の適合部22Aは、符号帳記憶部222には、η2に対応する符号帳が記憶されているとして、符号帳記憶部222に記憶された線形予測係数に変換可能な係数の複数個の候補に対して、η3に応じた第一線形変換を行い、第一線形変換後の線形予測係数に変換可能な係数の複数個の候補を得、線形予測分析部221が得た線形予測係数に変換可能な係数に対して、η3に応じた第二線形変換を行い、第二線形変換後の線形予測係数に変換可能な係数を得ていると言える。この場合、符号化部224は、適合部22Aが得た第二線形変換後の線形予測係数に変換可能な係数と、適合部22Aが得た第一線形変換後の線形予測係数に変換可能な係数の複数個の候補と、を用いて、線形予測分析部が得た線形予測係数に変換可能な係数に対応する線形予測係数符号を得ていると言える。
適合部22Aは、例えば図25に示す符号帳選択部223及び第二線形変換部2252により、符号帳の適合を行ってもよい。例えば、パラメータη2は所定のパラメータηであるとして、符号帳選択部223は、符号帳記憶部222に記憶された複数の符号帳の中からパラメータη2に応じて符号帳を選択する。そして、第二線形変換部2252は、線形予測分析部221で得られた線形予測係数に変換可能な係数に対する、η2に応じた第二線形変換を行う。この場合、符号化部224は、第二線形変換後の線形予測係数に変換可能な係数について、選択された符号帳を用いて符号化して線形予測係数符号を得る。
適合部22Aは、例えば図26に示す符号帳選択部223及び第一線形変換部2251により、符号帳の適合を行ってもよい。例えば、パラメータη2は所定のパラメータηであるとして、符号帳選択部223は、符号帳記憶部222に記憶された複数の符号帳の中からパラメータη2に応じて符号帳を選択する。そして、第一線形変換部2251は、選択された符号帳に格納された線形予測係数に変換可能な係数の複数個の候補に対する、η1に応じた第一線形変換を行う。この場合、符号化部224は、線形予測分析部221で得られた線形予測係数に変換可能な係数について、第一線形変換後の線形予測係数に変換可能な係数の候補を用いて符号化して線形予測係数符号を得る。
適合部22Aは、例えば図27に示す符号帳選択部223、第一線形変換部2251及び第二変換部2252により、符号帳の適合を行ってもよい。例えば、パラメータη23は所定のパラメータηであるとして、符号帳選択部223は、符号帳記憶部222に記憶された複数の符号帳の中からパラメータη3に応じて符号帳を選択する。そして、第一線形変換部2251は、選択された符号帳に格納された線形予測係数に変換可能な係数の複数個の候補に対する、η2に応じた第一線形変換を行う。そして、第二線形変換部2252は、線形予測分析部221で得られた線形予測係数に変換可能な係数に対する、η2に応じた第二線形変換を行う。この場合、符号化部224は、第二線形変換後の線形予測係数に変換可能な係数について、第一線形変換後の線形予測係数に変換可能な係数の候補を用いて符号化して線形予測係数符号を得る。
図6、図23及び図28に一点鎖線で示すように、適合部31Aが符号帳選択部312及び線形変換部314の少なくとも一方と、復号部313とから構成されているとすると、適合部31Aは、η1を正の数として、入力されたη1に基づいて、符号帳記憶部311に記憶された符号帳と、符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補との少なくとも一方を適合させていると言える。
適合部31Aは、例えば図28に示す符号帳選択部312及び線形変換部314の両方において適合の処理を行ってもよい。例えば、η2を正の数として、符号帳選択部312は、符号帳記憶部311に記憶された複数の符号帳の中からパラメータηに応じて符号帳を選択する。そして、線形変換部314は、復号部313で得られた線形予測係数に変換可能な係数に対して、所定の正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る。
[符号化装置、復号装置及びこれらの方法]
以下、線形予測符号化装置、線形予測復号装置及びこれらの方法を用いた符号化装置、復号装置及びこれらの方法の例について説明する。
[符号化装置、復号装置及びこれらの方法の第一実施形態]
(符号化)
第一実施形態の符号化装置の構成例を図8に示す。第一実施形態の符号化装置は、図8に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27とを例えば備えている。この符号化装置により実現される第一実施形態の符号化方法の各処理の例を図9に示す。
以下、図8の各部について説明する。
<パラメータ決定部27>
第一実施形態では、所定の時間区間ごとに複数のパラメータηの何れかがパラメータ決定部27により選択可能とされている。
パラメータ決定部27には、複数のパラメータηがパラメータηの候補として記憶されているとする。パラメータ決定部27は、複数のパラメータの中の1つのパラメータηを順次読み出し、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23及び復号化部26に出力する(ステップA0)。
周波数領域変換部21、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26は、パラメータ決定部27が順次読み出した各パラメータηに基づいて、例えば以下に説明するステップA1からステップA6の処理を行い同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して符号を生成する。一般に、パラメータηを所与として、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して2個以上の符号が得られる場合がある。この場合、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する符号は、これらの得られた2個以上の符号をまとめたものである。この例では、符号は、線形予測係数符号と、利得符号と、整数信号符号とを合わせたものである。これにより、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する各パラメータηごとの符号が得られる。
ステップA6の処理の後に、パラメータ決定部27は、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータηごとに得られた符号の中から1つの符号を選択し、選択された符号に対応するパラメータηを決定する(ステップA7)。この決定されたパラメータηが、その同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対するパラメータηとなる。そして、パラメータ決定部27は、選択された符号及び決定されたパラメータηを表す符号を復号装置に出力する。パラメータ決定部27によるステップA7の処理の詳細については後述する。
以下では、パラメータ決定部27により1つのパラメータη1が読み出されており、この読み出された1つのパラメータη1について処理が行われるとする。
<周波数領域変換部21>
周波数領域変換部21には、時間領域の時系列信号である音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部21は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する(ステップA1)。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部22と包絡正規化部25に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部21は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
<線形予測分析部22>
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部22は、[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した図1から図3、図21の何れかの線形予測符号化装置である。[符号化装置、復号装置及びこれらの方法]及び図8では、[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した図1から図3、図21の何れかの線形予測符号化装置のことを「線形予測分析部22」と表記する。なお、線形予測分析部22は、図25から図27の何れかの線形予測符号化装置であってもよい。
線形予測分析部22は、[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した処理と同様の処理により、例えばMDCT係数列である周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得て、得られた線形予測係数に変換可能な係数を符号化して線形予測係数符号を得る。
得られた線形予測係数符号は、パラメータ決定部27及び復号装置に出力される。
また、線形予測符号化装置の線形変換部225が(1)第1の場合には、符号化部224で得られた線形予測係数符号に対応する、パラメータη1に対応する線形予測係数に変換可能な係数が量子化線形予測係数^β1,^β2,…,^βpとして、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。
線形予測符号化装置の線形変換部225が(2)第2の場合には、符号化部224で得られた線形予測係数符号に対応する、パラメータη2に対応する線形予測係数に変換可能な係数が、図2に破線で示す逆線形変換部226に入力される。逆線形変換部226は、線形予測係数符号に対応する、パラメータη2に対応する線形予測係数に変換可能な係数に対して第二線形変換部2252が行った第二線形変換の逆の線形変換を行い、パラメータη1に対応する線形予測係数に変換可能な係数とする。このパラメータη1に対応する線形予測係数に変換可能な係数が、量子化線形予測係数^β1,^β2,…,^βpとして、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。なお、パラメータη1の値とパラメータη2の値とが同一である場合には、逆線形変換部226は、線形変換をしなくてもよい。
線形予測符号化装置の線形変換部225が(3)第3の場合には、符号化部224で得られた線形予測係数符号に対応する、パラメータη3に対応する線形予測係数に変換可能な係数が、図3に破線で示す逆線形変換部226に入力される。逆線形変換部226は、線形予測係数符号に対応する、パラメータη3に対応する線形予測係数に変換可能な係数に対して第二線形変換部2252が行った第二線形変換の逆の線形変換を行い、パラメータη1に対応する線形予測係数に変換可能な係数とする。このパラメータη1に対応する線形予測係数に変換可能な係数が、量子化線形予測係数^β1,^β2,…,^βpとして、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。なお、パラメータη1の値とパラメータη3の値とが同一である場合には、逆線形変換部226は、線形変換をしなくてもよい。
なお、線形予測分析処理の過程で予測残差のエネルギーσ2が算出される。この場合、算出された予測残差のエネルギーσ2は、符号化部26の分散パラメータ決定部268に出力される。
<非平滑化振幅スペクトル包絡系列生成部23>
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する(ステップA3)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、符号化部26に出力される。
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(A2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
このようにして、非平滑化振幅スペクトル包絡系列生成部23は、線形予測分析部22により生成された線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う。ここで、cを任意の数として、複数の値から構成される系列をc乗した系列とは、複数の値のそれぞれをc乗した値から構成される系列のことである。例えば、振幅スペクトル包絡の系列を1/η1乗した系列とは、振幅スペクトル包絡の各係数を1/η1乗した値から構成される系列のことである。
非平滑化振幅スペクトル包絡系列生成部23による1/η1乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做した処理に起因するものである。すなわち、非平滑化振幅スペクトル包絡系列生成部23による1/η1乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做した処理によりη1乗された値を元の値に戻すために行われる。
<平滑化振幅スペクトル包絡系列生成部24>
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する(ステップA4)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、包絡正規化部25及び符号化部26に出力される。
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpと補正係数γを用いて、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)として、式(A3)により定義される平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する。
ここで、補正係数γは予め定められた1未満の定数であり非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を平滑化する係数である。
<包絡正規化部25>
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
包絡正規化部25は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する(ステップA5)。
生成された正規化MDCT係数列は、符号化部26に出力される。
包絡正規化部25は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)で除算することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数XN(k)を生成する。すなわち、k=0,1,…,N-1として、XN(k)=X(k)/^Hγ(k)である。
<符号化部26>
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が算出した予測残差のエネルギーσ2が入力される。
符号化部26は、図12に示すステップA61からステップA65の処理を例えば行うことにより符号化を行う(ステップA6)。
符号化部26は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め(ステップA61)、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求め(ステップA62)、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータφ(0),φ(1),…,φ(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と平均残差のエネルギーσ2とから式(A1)により求め(ステップA63)、分散パラメータφ(0),φ(1),…,φ(N-1)を用いて量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得(ステップA64)、グローバルゲインgに対応する利得符号を得る(ステップA65)。
ここで、上記の式(A1)における正規化振幅スペクトル包絡系列^HN(0),^HN(1),…,^HNは、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で除算したもの、すなわち、以下の式(A8)により求まるものである。
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
符号化部26は、ステップA61からステップA65により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。
符号化部26が行うステップA61からステップA65のうち、の特徴的な処理が含まれるのはステップA63であり、グローバルゲインgと量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献1に記載された技術を含む様々な公知技術が存在する。以下では符号化部26が行う符号化処理の具体例を2つ説明する。
[符号化部26が行う符号化処理の具体例1]
符号化部26が行う符号化処理の具体例1として、ループ処理を含まない例について説明する。
具体例1の符号化部26の構成例を図10に示す。具体例1の符号化部26は、図10に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265とを例えば備えている。以下、図10の各部について説明する。
<利得取得部261>
利得取得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。または、利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計と、配分ビット数Bと、グローバルゲインgと、の関係を予めテーブル化しておき、そのテーブルを参照することによりグローバルゲインgを得て出力してもよい。
このようにして、利得取得部261は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。
得られたグローバルゲインgは、量子化部262及び分散パラメータ決定部268に出力される。
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261が得たグローバルゲインgが入力される。
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
このようにして、量子化部262は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
<分散パラメータ決定部268>
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη1、利得取得部261が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
<算術符号化部269>
算術符号化部269には、パラメータ決定部27が読み出したパラメータη1、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得て出力する(ステップS269)。
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η1)に従うときに最適になるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。この結果、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数へのビット割り当ての期待値が分散パラメータ系列φ(0),φ(1),…,φ(N-1)で決定されることになる。
得られた整数信号符号は、パラメータ決定部27に出力される。
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
<利得符号化部265>
利得符号化部265には、利得取得部261が得たグローバルゲインgが入力される。
利得符号化部265は、グローバルゲインgを符号化して利得符号を得て出力する(ステップS265)。
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
本具体例1のステップS261,S262,S268,S269,S265がそれぞれ上記のステップA61,A62,A63,A64,A65に対応する。
[符号化部26が行う符号化処理の具体例2]
符号化部26が行う符号化処理の具体例2として、ループ処理を含む例について説明する。
具体例2の符号化部26の構成例を図11に示す。具体例2の符号化部26は、図11に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265と、判定部266と、利得更新部267とを例えば備えている。以下、図11の各部について説明する。
<利得取得部261>
利得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。
得られたグローバルゲインgは、量子化部262及び分散パラメータ決定部268に出力される。
利得取得部261が得たグローバルゲインgは、量子化部262及び分散パラメータ決定部268で用いられるグローバルゲインの初期値となる。
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261又は利得更新部267が得たグローバルゲインgが入力される。
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
ここで、量子化部262が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部262が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
<分散パラメータ決定部268>
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη1、利得取得部261又は利得更新部267が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
ここで、分散パラメータ決定部268が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、分散パラメータ決定部268が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
<算術符号化部269>
算術符号化部269には、パラメータ決定部27が読み出したパラメータη1、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して、整数信号符号と整数信号符号のビット数である消費ビット数Cとを得て出力する(ステップS269)。
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η1)に従うときに最適になるようなビット割り当てを算術符号により行い、行われたビット割り当てに基づく算術符号により符号化を行う。
得られた整数信号符号及び消費ビット数Cは、判定部266に出力される。
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
<判定部266>
判定部266には、算術符号化部269が得た整数信号符号が入力される。
判定部266は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部265に対し利得更新部267が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部267に対し、算術符号化部264が計測した消費ビット数Cを出力する(ステップS266)。
<利得更新部267>
利得更新部267には、算術符号化部264が計測した消費ビット数Cが入力される。
利得更新部267は、消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する(ステップS267)。
利得更新部267が得た更新後のグローバルゲインgは、量子化部262及び利得符号化部265に出力される。
<利得符号化部265>
利得符号化部265には、判定部266からの出力指示及び利得更新部267が得たグローバルゲインgが入力される。
利得符号化部265は、指示信号に従って、グローバルゲインgを符号化して利得符号を得て出力する(ステップ265)。
判定部266が出力した整数信号符号と、利得符号化部265が出力した利得符号は、正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
すなわち、本具体例2においては、最後に行われたステップS267が上記のステップA61に対応し、ステップS262,S263,S264,S265がそれぞれ上記のステップA62,A63,A64,A65に対応する。
なお、符号化部26が行う符号化処理の具体例2については、国際公開公報WO2014/054556などに更に詳細に説明されている。
[符号化部26の変形例]
符号化部26は、例えば以下の処理を行うことにより、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基にビット割り当てを変える符号化を行ってもよい。
符号化部26は、まず、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求める。
この量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する量子化ビットは、XQ(k)の分布がある範囲内で一様であると仮定して、その範囲を包絡の推定値から決めることができる。複数のサンプルごとの包絡の推定値を符号化することもできるが、符号化部26は、例えば以下の式(A9)のように線形予測に基づく正規化振幅スペクトル包絡系列の値^HN(k)を使用してXQ(k)の範囲を決めることができる。
あるkにおけるXQ(k)を量子化するときに、XQ(k)の二乗誤差を最小とするために
の制約のもとに、割り当てるビット数b(k)
を設定することができる。Bは予め定められた正の整数である。この際にb(k)が整数となるように四捨五入するとか、0より小さくなる場合にはb(k)=0とするなどして、b(k)の再調整の処理を符号化部26は行ってもよい。
また、符号化部26は、サンプルごとの割り当てでなく、複数のサンプルをまとめて配分ビット数を決めて、量子化にもサンプルごとのスカラ量子化でなく、複数のサンプルをまとめたベクトルごとの量子化をすることも可能である。
サンプルkのXQ(k)の量子化ビット数b(k)が上記で与えられ、サンプルごとに符号化するとすると、XQ(k)は-2b(k)-1から2b(k)-1までの2b(k)種類の整数を取り得る。符号化部26は、b(k)ビットで各サンプルを符号化して整数信号符号を得る。
生成された整数信号符号は、復号装置に出力される。例えば、生成されたXQ(k)に対応するb(k)ビットの整数信号符号は、k=0から順次復号装置に出力される。
もし、XQ(k)が上記の-2b(k)-1から2b(k)-1までの範囲をこえる場合には最大値、または最小値に置き換える。
gが小さすぎるとこの置き換えで量子化歪が発生し、gが大きすぎると量子化誤差は大きくなり、XQ(k)のとりうる範囲がb(k)に比べて小さすぎて、情報の有効利用ができないことになる。このため、gの最適化を行ってもよい。
符号化部26は、グローバルゲインgを符号化して利得符号を得て出力する。
この符号化部26の変形例のように、符号化部26は算術符号化以外の符号化を行ってもよい。
<パラメータ決定部27>
ステップA1からステップA6の処理により、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータη1ごとに生成された符号(この例では、線形予測係数符号、利得符号及び整数信号符号)は、パラメータ決定部27に入力される。
パラメータ決定部27は、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータη1ごとに得られた符号の中から1つの符号を選択し、選択された符号に対応するパラメータηを決定する(ステップA7)。この決定されたパラメータηが、その同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対するパラメータηとなる。そして、パラメータ決定部27は、選択された符号及び決定されたパラメータηを表すパラメータ符号を復号装置に出力する。符号の選択は、符号の符号量及び符号に対応する符号化歪の少なくとも一方に基づいて行われる。例えば、符号量が最も小さい符号又は符号化歪が最も小さい符号が選択される。
ここで、符号化歪みとは、入力信号から得られる周波数領域サンプル列と、生成された符号をローカルデコードすることにより得られる周波数領域サンプル列との誤差のことである。符号化装置は、符号化歪みを計算するための符号化歪計算部を備えていてもよい。この符号化歪計算部は、以下に述べる復号装置と同様の処理を行う復号部を備え、この復号部が生成された符号をローカルデコードする。その後、符号化歪計算部は、入力信号から得られる周波数領域サンプル列と、ローカルデコードすることにより得られた周波数領域サンプル列との誤差を計算し、符号化歪とする。
(復号)
符号化装置に対応する復号装置の構成例を図13に示す。第一実施形態の復号装置は、図13に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36と、パラメータ復号部37とを例えば備えている。この復号装置により実現される第一実施形態の復号方法の各処理の例を図14に示す。
復号装置には、符号化装置が出力した、パラメータ符号、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。
以下、図13の各部について説明する。
<パラメータ復号部37>
パラメータ復号部37には、符号化装置が出力したパラメータ符号が入力される。
パラメータ復号部37は、パラメータ符号を復号することにより復号パラメータηを求める。求まった復号パラメータηは、線形予測係数復号部31、非平滑化振幅スペクトル包絡系列生成部32、平滑化振幅スペクトル包絡系列生成部33及び復号部34に出力される。パラメータ復号部37には、複数の復号パラメータηが候補として記憶されている。パラメータ復号部37は、パラメータ符号に対応する復号パラメータηの候補を復号パラメータηとして求める。パラメータ復号部37に記憶されている複数の復号パラメータηは、符号化装置のパラメータ決定部27に記憶された複数のパラメータηと同じである。
<線形予測係数復号部31>
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号及びパラメータ復号部37により得られた復号パラメータηが入力される。
線形予測係数復号部31は、[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した図6、図21を用いて上記説明した線形予測復号装置である。[符号化装置、復号装置及びこれらの方法]及び図13では、[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した図6、図21の線形予測符号化装置のことを「線形予測係数復号部31」と表記する。なお、線形予測係数復号部31は、図28の線形予測復号装置であってもよい。
線形予測係数復号部31は、復号パラメータηをパラメータη1とする[線形予測符号化装置、線形予測復号装置及びこれらの方法]で説明した処理と同様の処理により、入力された線形予測係数符号を復号することにより、復号された線形予測係数に変換可能な係数である復号線形予測係数^β1,^β2,…, ^βpを得る(ステップB1)。
得られた復号線形予測係数^β1,^β2,…, ^βpは、非平滑化振幅スペクトル包絡系列生成部32及び非平滑化振幅スペクトル包絡系列生成部33に出力される。
<非平滑化振幅スペクトル包絡系列生成部32>
非平滑化振幅スペクトル包絡系列生成部32には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部32は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を上記の式(A2)により生成する(ステップB2)。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、復号部34に出力される。
このようにして、非平滑化振幅スペクトル包絡系列生成部32は、線形予測係数復号部31により生成された線形予測係数に変換可能な係数に対応するに対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る。
<平滑化振幅スペクトル包絡系列生成部33>
平滑化振幅スペクトル包絡系列生成部33には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
平滑化振幅スペクトル包絡系列生成部33は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凹凸を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を上記の式A(3)により生成する(ステップB3)。
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、復号部34及び包絡逆正規化部35に出力される。
<復号部34>
復号部34には、パラメータ復号部37が求めた復号パラメータη、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡生成部32が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)及び平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
復号部34は、分散パラメータ決定部342を備えている。
復号部34は、図15に示すステップB41からステップB44の処理を例えば行うことにより復号を行う(ステップB4)。すなわち、復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る(ステップB41)。復号部34の分散パラメータ決定部342は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とパラメータηとから上記の式(A1)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める(ステップB42)。復号部34は、正規化MDCT係数列に対応する符号に含まれる整数信号符号を分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータに対応する算術復号の構成に従い、算術復号して復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得(ステップB43)、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する(ステップB44)。このように、復号部34は、非平滑化スペクトル包絡系列に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。
なお、[符号化部26の変形例]に記載された処理により符号化が行われた場合には、復号部34は例えば以下の処理を行う。復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る。復号部34の分散パラメータ決定部342は、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とから上記の式(A9)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める。復号部34は、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータφ(k)に基づいて式(A10)によりb(k)を求めることができ、XQ(k)の値をそのビット数b(k)で順次復号して、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得て、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する。このように、復号部34は、非平滑化スペクトル包絡系列に基づいて変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。
生成された復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)は、包絡逆正規化部35に出力される。
<包絡逆正規化部35>
包絡逆正規化部35には、平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
包絡逆正規化部35は、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を用いて、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する(ステップB5)。
生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部36に出力される。
例えば、包絡逆正規化部35は、k=0,1,…,N-1として、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)の各係数^XN(k)に、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各包絡値^Hγ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^XN(k)×^Hγ(k)である。
<時間領域変換部36>
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
時間領域変換部36は、フレームごとに、包絡逆正規化部35が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号(復号音信号)を得る(ステップB6)。
このようにして、復号装置は、周波数領域での復号により時系列信号を得る。
[符号化装置、復号装置及びこれらの方法の第二実施形態]
第一実施形態の符号化装置及び方法は、複数のパラメータηのそれぞれについて符号化を行い符号を生成し、パラメータηごとに生成された符号の中から最適な符号を選択し、選択された符号及び選択された符号に対応するパラメータ符号を出力するものであった。
これに対して、第二実施形態の符号化装置及び方法は、まずパラメータ決定部27がパラメータηを決定し、決定されたパラメータηに基づいて符号化を行い符号を生成し出力するものである。第二実施形態では、所定の時間区間ごとにパラメータηがパラメータ決定部27により可変とされている。ここで、所定の時間区間ごとにパラメータηが可変とは、所定の時間区間が変わればパラメータηも変わり得ることを意味し、同一の時間区間ではパラメータηの値は変わらないとする。
以下、第一実施形態と異なる部分を中心に説明する。第一実施形態と同様の部分については重複説明を省略する。
(符号化)
第二実施形態の符号化装置の構成例を図16に示す。符号化装置は、図16に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27’とを例えば備えている。この符号化装置により実現される符号化方法の各処理の例を図17に示す。
以下、図16の各部について説明する。
<パラメータ決定部27’>
パラメータ決定部27’には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
パラメータ決定部27’は、入力された時系列信号に基づいて、後述する処理により、パラメータηを決定する(ステップA7’)。以下、パラメータ決定部27’により決定されたパラメータηをパラメータη1とする。
パラメータ決定部27’により決定されたη1は、線形予測分析部22、非平滑化振幅スペクトル包絡推定部23、及び平滑化振幅スペクトル包絡推定部24及び符号化部26に出力される。
また、パラメータ決定部27’は、決定されたη1を符号化することによりパラメータ符号を生成する。生成されたパラメータ符号は、復号装置に送信される。
パラメータ決定部27’の詳細については後述する。
周波数領域変換部21、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26は、パラメータ決定部27が決定したパラメータη1に基づいて、第一実施形態と同様の処理により符号を生成する(ステップA1からステップA6)。この例では、符号は、線形予測係数符号と、利得符号と、整数信号符号とを合わせたものである。生成された符号は、復号装置に送信される。
パラメータ決定部27’の構成例を図18に示す。パラメータ決定部27’は、図18に示すように、周波数領域変換部41と、スペクトル包絡推定部42と、白色化スペクトル系列生成部43と、パラメータ取得部44とを例えば備えている。スペクトル包絡推定部42は、線形予測分析部421及び非平滑化振幅スペクトル包絡系列生成部422を例えば備えている。例えばこのパラメータ決定部27’により実現されるパラメータ決定方法の各処理の例を図19に示す。
以下、図18の各部について説明する。
<周波数領域変換部41>
周波数領域変換部41には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
周波数領域変換部41は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。
得られたMDCT係数列X(0),X(1),…,X(N-1)は、スペクトル包絡推定部42及び白色化スペクトル系列生成部43に出力される。
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。
このようにして、周波数領域変換部41は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める(ステップC41)。
<スペクトル包絡推定部42>
スペクトル包絡推定部42には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
スペクトル包絡推定部42は、所定の方法で定められるパラメータη0に基づいて、時系列信号に対応する周波数領域サンプル列の絶対値のη0乗をパワースペクトルとして用いたスペクトル包絡の推定を行う(ステップC42)。
推定されたスペクトル包絡は、白色化スペクトル系列生成部43に出力される。
スペクトル包絡推定部42は、例えば以下に説明する線形予測分析部421及び非平滑化振幅スペクトル包絡系列生成部422の処理により、非平滑化振幅スペクトル包絡系列を生成することによりスペクトル包絡の推定を行う。
パラメータη0は所定の方法で定められるとする。例えば、η0を0より大きい所定の数とする。例えば、η0=1とする。また、現在パラメータηを求めようとしているフレームよりも前のフレームで求まったηを用いてもよい。現在パラメータηを求めようとしているフレーム(以下、現フレームとする。)よりも前のフレームとは、例えば現フレームのよりも前のフレームであって現フレームの近傍のフレームである。現フレームの近傍のフレームは、例えば現フレームの直前のフレームである。
<線形予測分析部421>
線形予測分析部421には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
線形予測分析部421は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(C1)により定義される~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行った線形予測係数β12,…,βpを生成し、生成された線形予測係数β12,…,βpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β1,^β2,…,^βpとを生成する。
生成された量子化線形予測係数^β1,^β2,…,^βpは、非平滑化スペクトル包絡系列生成部422に出力される。
具体的には、線形予測分析部421は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη0乗をパワースペクトルと見做した逆フーリエ変換に相当する演算、すなわち式(C1)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη0乗に対応する時間領域の信号列である疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部421は、求まった疑似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β12,…,βpを生成する。そして、線形予測分析部421は、生成された線形予測係数β12,…,βpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β1,^β2,…,^βpとを得る。
線形予測係数β12,…,βpは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη0乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。
線形予測分析部421による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。
このようにして、線形予測分析部421は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη0乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を生成する(ステップC421)。
なお、線形予測分析部421は、[線形予測符号化装置、線形予測復号装置及びこれらの方法]の欄で説明した方法により、線形予測係数符号を得て、得られた線形予測係数符号に対応する線形予測係数に変換可能な係数を量子化線形予測係数^β1,^β2,…,^βpとしてもよい。
<非平滑化振幅スペクトル包絡系列生成部422>
非平滑化振幅スペクトル包絡系列生成部422には、線形予測分析部421が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
非平滑化振幅スペクトル包絡系列生成部422は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、白色化スペクトル系列生成部43に出力される。
非平滑化振幅スペクトル包絡系列生成部422は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(C2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
このようにして、非平滑化振幅スペクトル包絡系列生成部422は、疑似相関関数信号列に対応する振幅スペクトル包絡の系列を1/η0乗した系列である非平滑化スペクトル包絡系列を線形予測分析部421により生成された線形予測係数に変換可能な係数に基づいて得ることによりスペクトル包絡の推定を行う(ステップC422)。
<白色化スペクトル系列生成部43>
白色化スペクトル系列生成部43には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)及び非平滑化振幅スペクトル包絡生成部422が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)が入力される。
白色化スペクトル系列生成部43は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値で除算することにより、白色化スペクトル系列XW(0),XW(1),…,XW(N-1)を生成する。
生成された白色化スペクトル系列XW(0),XW(1),…,XW(N-1)は、パラメータ取得部44に出力される。
白色化スペクトル系列生成部43は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値^H(k)で除算することにより、白色化スペクトル系列XW(0),XW(1),…,XW(N-1)の各値XW(k)を生成する。すなわち、k=0,1,…,N-1として、XW(k)=X(k)/^H(k)である。
このようにして、白色化スペクトル系列生成部43は、例えば非平滑化振幅スペクトル包絡系列であるスペクトル包絡で例えばMDCT係数列である周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る(ステップC43)。
<パラメータ取得部44>
パラメータ取得部44には、白色化スペクトル系列生成部43が生成した白色化スペクトル系列XW(0),XW(1),…,XW(N-1)が入力される。
パラメータ取得部44は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列XW(0),XW(1),…,XW(N-1)のヒストグラムを近似するパラメータηを求める(ステップC44)。言い換えれば、パラメータ取得部44は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列XW(0),XW(1),…,XW(N-1)のヒストグラムの分布に近くなるようなパラメータηを決定する。
パラメータηを形状パラメータとする一般化ガウス分布は、例えば以下のように定義される。Γは、ガンマ関数である。
一般化ガウス分布は、形状パラメータであるηを変えることにより、図20のようにη=1の時はラプラス分布、η=2の時はガウス分布、といったように様々な分布を表現することができるものである。ηは、0より大きい所定の数である。ηは、0より大きい2以外の所定の数であってもよい。具体的には、ηは、2未満の所定の正の数であってよい。φは分散に対応するパラメータである。
ここで、パラメータ取得部44が求めるηは、例えば以下の式(C3)により定義される。F-1は、関数Fの逆関数である。この式は、いわゆるモーメント法により導出されるものである。
逆関数F-1が定式化されている場合には、パラメータ取得部44は、定式化された逆関数F-1にm1/((m2)1/2)の値を入力したときの出力値を計算することによりパラメータηを求めることができる。
逆関数F-1が定式化されていない場合には、パラメータ取得部44は、式(C3)で定義されるηの値を計算するために、例えば以下に説明する第一方法又は第二方法によりパラメータηを求めてもよい。
パラメータηを求めるための第一方法について説明する。第一の方法では、パラメータ取得部44は、白色化スペクトル系列に基づいてm1/((m2)1/2)を計算し、予め用意しておいた異なる複数の、ηと対応するF(η)のペアを参照して、計算されたm1/((m2)1/2)に最も近いF(η)に対応するηを取得する。
予め用意しておいた異なる複数の、ηと対応するF(η)のペアは、パラメータ取得部44の記憶部441に予め記憶しておく。パラメータ取得部44は、記憶部441参照して、計算されたm1/((m2)1/2)に最も近いF(η)を見つけ、見つかったF(η)に対応するηを記憶部441から読み込み出力する。
計算されたm1/((m2)1/2)に最も近いF(η)とは、計算されたm1/((m2)1/2)との差の絶対値が最も小さくなるF(η)のことである。
パラメータηを求めるための第二方法について説明する。第二の方法では、逆関数F-1の近似曲線関数を例えば以下の式(C3’)で表される~F-1として、パラメータ取得部44は、白色化スペクトル系列に基づいてm1/((m2)1/2)を計算し、近似曲線関数~F-1に計算されたm1/((m2)1/2)を入力したときの出力値を計算することによりηを求める。この近似曲線関数~F-1は使用する定義域において出力が正値となる単調増加関数であればよい。
なお、パラメータ取得部44が求めるηは、式(C3)ではなく、式(C3'')のように予め定めた正の整数q1及びq2を用いて(ただしq1<q2)式(C3)を一般化した式により定義されてもよい。
なお、ηが式(C3'')により定義される場合も、ηが式(C3)により定義されている場合と同様の方法により、ηを求めることができる。すなわち、パラメータ取得部44が、白色化スペクトル系列に基づいてそのq1次モーメントであるmq1とそのq2次モーメントであるmq2とに基づく値mq1/((mq2)q1/q2)を計算した後、例えば上記の第一及び第二の方法と同様、予め用意しておいた異なる複数の、ηと対応するF’(η)のペアを参照して、計算されたmq1/((mq2)q1/q2)に最も近いF’(η)に対応するηを取得するか、逆関数F’-1の近似曲線関数を~F’-1として、近似曲線関数~F-1に計算されたmq1/((mq2)q1/q2)を入力したときの出力値を計算してηを求めることができる。
このようにηは次数が異なる2つの異なるモーメントmq1,mq2に基づく値であるとも言える。例えば、次数が異なる2つの異なるモーメントmq1,mq2のうち、次数が低い方のモーメントの値又はこれに基づく値(以下、前者とする。)と次数が高い方のモーメントの値又はこれに基づく値(以下、後者とする)との比の値、この比の値に基づく値、又は、前者を後者で割って得られる値に基づき、ηを求めてもよい。モーメントに基づく値とは、例えば、そのモーメントをmとしQを所定の実数としてmQのことである。また、これらの値を近似曲線関数~F-1に入力してηを求めてもよい。この近似曲線関数~F’-1は上記同様、使用する定義域において出力が正値となる単調増加関数であればよい。
パラメータ決定部27’は、ループ処理によりパラメータηを求めてもよい。すなわち、パラメータ決定部27’は、パラメータ取得部44で求まるパラメータηを所定の方法で定められるパラメータη0とする、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理を更に1回以上行ってもよい。
この場合、例えば、図18で破線で示すように、パラメータ取得部44で求まったパラメータηは、スペクトル包絡推定部42に出力される。スペクトル包絡推定部42は、パラメータ取得部44で求まったηをパラメータη0として用いて、上記説明した処理と同様の処理を行いスペクトル包絡の推定を行う。白色化スペクトル系列生成部43は、新たに推定されたスペクトル包絡に基づいて、上記説明した処理と同様の処理を行い白色化スペクトル系列を生成する。パラメータ取得部44は、新たに生成された白色化スペクトル系列に基づいて、上記説明した処理と同様の処理を行いパラメータηを求める。
例えば、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理は、所定の回数であるτ回だけ更に行われてもよい。τは所定の正の整数であり、例えばτ=1又はτ=2である。
また、スペクトル包絡推定部42は、今回求まったパラメータηと前回求まったパラメータηとの差の絶対値が所定の閾値以下となるまで、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理を繰り返してもよい。
(復号)
第二実施形態の復号装置及び方法は、第一実施形態と同様であるため重複説明を省略する。
[符号化装置、復号装置及びこれらの方法の変形例]
線形予測分析部22及び非平滑化振幅スペクトル包絡系列生成部23を1つのスペクトル包絡推定部2Aとして捉えると、このスペクトル包絡推定部2Aは、時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做したスペクトル包絡(非平滑化振幅スペクトル包絡系列)の推定を行っていると言える。ここで、「パワースペクトルと見做した」とは、パワースペクトルを通常用いるところに、η1乗のスペクトルを用いることを意味する。
この場合、スペクトル包絡推定部2Aの線形予測分析部22は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη1乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列を用いて線形予測分析を行い線形予測係数に変換可能な係数を得ていると言える。また、スペクトル包絡推定部2Aの非平滑化振幅スペクトル包絡系列生成部23は、線形予測分析部22により得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行っていると言える。
また、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26を1つの符号化部2Bとして捉えると、この符号化部2Bは、スペクトル包絡推定部2Aにより推定されたスペクトル包絡(非平滑化振幅スペクトル包絡系列)を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の各係数に対して行っていると言える。
復号部34及び包絡逆正規化部35を1つの復号部3Aとして捉えると、この復号部3Aは、非平滑化スペクトル包絡系列に基づいて変わるビット割り当て又は実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得ていると言える。
符号化部2Bは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)を基にビット割り当てを変える又は実質的にビット割り当てが変わる符号化を行うのであれば、上記説明した算術符号化以外の符号化処理を行ってもよい。この場合、復号部3Aは、符号化部2Bが行った符号化処理に対応する復号処理を行う。
例えば、符号化部2Bは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)に基づいて決定されたRiceパラメータを用いて周波数領域サンプル列をGolomb-Rice符号化してもよい。この場合、復号部3Aは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)に基づいて決定されたRiceパラメータを用いてGolomb-Rice復号してもよい。
第一実施形態において、符号化装置は、パラメータηを決定する際に符号化処理を最後まで行わなくてもよい。言い換えれば、パラメータ決定部27は、推定符号量に基づいてパラメータηを決定してもよい。この場合、符号化部2Bは、複数のパラメータηのそれぞれを用いて同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する上記と同様の符号化処理により得られる符号の推定符号量を得る。パラメータ決定部27は、得られた推定符号量に基づいて複数のパラメータηの何れか1つを選択する。例えば、推定符号量が最も小さいパラメータηを選択する。符号化部2Bは、選択されたパラメータηを用いて上記と同様の符号化処理を行うことにより符号を得て出力する。
上記説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[プログラム及び記録媒体]
また、各装置又は各方法における各部をコンピュータによって実現してもよい。その場合、各装置又は各方法の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置又は各方法における各部がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (14)

  1. 符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
    上記復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、
    上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
    を含む線形予測復号装置。
  2. 複数の符号帳が記憶された符号帳記憶部と、
    上記符号帳記憶部に記憶された複数の符号帳の中からη(ただし、η2は正の数)に応じて符号帳を選択する符号帳選択部と、
    上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
    上記復号部で得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換部と、
    上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換部で得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
    を含む線形予測復号装置。
  3. 請求項1又は2の線形予測復号装置において、
    上記線形変換部は、上記η1が小さいほど上記線形変換後の線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列が平坦になるように上記線形変換を行う、
    線形予測復号装置。
  4. 請求項1から3の何れかの線形予測復号装置において、
    pを線形予測係数に変換可能な係数の次数とし、上記復号部で得られた線形予測係数に変換可能な係数を^ω[k][k=1,2,…,p]とし、上記線形変換後の線形予測係数に変換可能な係数を~ω[k][k=1,2,…,p]とし、x1,x2,…xp,y1,y2,…yp-1,z2,z3,…zpを所定の非負の数とし、y1,y2,…yp-1,z2,z3,…zpの少なくとも1つは所定の正の数であるとし、Kをx1,x2,…xp,y1,y2,…yp-1,z2,z3,…zp以外の要素が0である行列として、
    上記線形変換部は、下記式により線形変換を行う、

    線形予測復号装置。
  5. 請求項1又は2の線形予測復号装置において、
    上記線形変換部は、上記η1が小さいほど上記線形変換後の線形予測係数に変換可能な係数の次数が小さくなるように上記線形変換を行う、
    線形予測復号装置。
  6. 複数の符号帳が記憶された符号帳記憶部と、
    上記符号帳記憶部に記憶された複数の符号帳の中からη(ただし、ηは正の数)に応じて符号帳を選択する符号帳選択部と、
    上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号部と、
    上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成部と、
    を含む線形予測復号装置。
  7. 請求項6の線形予測復号装置において、
    上記符号帳記憶部には、線形予測係数に変換可能な係数の候補数が異なる複数の符号帳が記憶されており、
    上記符号帳選択部は、上記η1が大きいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補数が多い符号帳を選択する、
    線形予測復号装置。
  8. 請求項6又は7の線形予測復号装置において、
    上記符号帳記憶部には、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列の平坦度合いが異なる複数の符号帳が記憶されており、
    上記符号帳選択部は、上記η1が小さいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、符号帳に記憶された線形予測係数に変換可能な係数の候補に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列が平坦である符号帳を選択する、
    線形予測復号装置。
  9. 請求項6又は7の何れかの線形予測復号装置において、
    上記符号帳記憶部には、線形予測係数に変換可能な係数の候補間の間隔が異なる複数の符号帳が記憶されており、
    上記符号帳選択部は、上記η1が小さいほど、上記符号帳記憶部に記憶された複数の符号帳の中から、線形予測係数に変換可能な係数の候補間の間隔が狭い符号帳を選択する、
    線形予測復号装置。
  10. 復号部が、符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
    線形変換部が、上記復号ステップで得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換ステップと、
    スペクトル包絡系列生成部が、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
    を含む線形予測復号方法。
  11. 符号帳選択部が、符号帳記憶部に記憶された複数の符号帳の中からη(ただし、η2は正の数)に応じて符号帳を選択する符号帳選択ステップと、
    復号部が、上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
    線形変換部が、上記復号ステップで得られた線形予測係数に変換可能な係数に対して、正の数であるη1に応じた線形変換をして線形予測係数に変換可能な係数を得る線形変換ステップと、
    スペクトル包絡系列生成部が、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形変換ステップで得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
    を含む線形予測復号方法。
  12. 符号帳選択部が、符号帳記憶部に記憶された複数の符号帳の中からη(ただし、ηは正の数)に応じて符号帳を選択する符号帳選択ステップと、
    復号部が、上記選択された符号帳に格納された複数個の線形予測係数に変換可能な係数の候補のうち、入力された線形予測係数符号に対応する線形予測係数に変換可能な係数の候補を線形予測係数に変換可能な係数として得る復号ステップと、
    スペクトル包絡系列生成部が、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η1乗した系列である非平滑化スペクトル包絡系列と、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列の凹凸を鈍らせた系列を1/η1乗した系列である平滑化スペクトル包絡系列と、の少なくとも何れかを得るスペクトル包絡系列生成ステップと、
    を含む線形予測復号方法。
  13. 請求項1から9の何れかの線形予測復号装置の各部としてコンピュータを機能させるためのプログラム。
  14. 請求項1から9の何れかの線形予測復号装置の各部としてコンピュータを機能させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
JP2019009389A 2015-04-13 2019-01-23 線形予測復号装置、方法、プログラム及び記録媒体 Active JP6633787B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2015081747 2015-04-13
JP2015081746 2015-04-13
JP2015081747 2015-04-13
JP2015081746 2015-04-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2017512523A Division JP6517924B2 (ja) 2015-04-13 2016-04-11 線形予測符号化装置、方法、プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2019079069A JP2019079069A (ja) 2019-05-23
JP6633787B2 true JP6633787B2 (ja) 2020-01-22

Family

ID=57126589

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017512523A Active JP6517924B2 (ja) 2015-04-13 2016-04-11 線形予測符号化装置、方法、プログラム及び記録媒体
JP2019009389A Active JP6633787B2 (ja) 2015-04-13 2019-01-23 線形予測復号装置、方法、プログラム及び記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2017512523A Active JP6517924B2 (ja) 2015-04-13 2016-04-11 線形予測符号化装置、方法、プログラム及び記録媒体

Country Status (6)

Country Link
US (1) US10325609B2 (ja)
EP (1) EP3270376B1 (ja)
JP (2) JP6517924B2 (ja)
KR (1) KR102061300B1 (ja)
CN (1) CN107408390B (ja)
WO (1) WO2016167215A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102070145B1 (ko) 2015-01-30 2020-01-28 니폰 덴신 덴와 가부시끼가이샤 파라미터 결정 장치, 방법, 프로그램 및 기록 매체
KR101996307B1 (ko) * 2015-01-30 2019-07-04 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
CN112350760B (zh) * 2019-08-09 2021-07-23 大唐移动通信设备有限公司 一种预编码码本选择的方法及装置
KR20210133554A (ko) * 2020-04-29 2021-11-08 한국전자통신연구원 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
CN111901004B (zh) * 2020-08-04 2022-04-12 三维通信股份有限公司 平坦度的补偿方法和装置、存储介质和电子设备

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6253028A (ja) * 1985-09-02 1987-03-07 Nec Corp 適応形符号化復号化方式とその装置
JP3186013B2 (ja) * 1995-01-13 2001-07-11 日本電信電話株式会社 音響信号変換符号化方法及びその復号化方法
GB2326572A (en) * 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
CA2733453C (en) * 2000-11-30 2014-10-14 Panasonic Corporation Lpc vector quantization apparatus
JP4365610B2 (ja) * 2003-03-31 2009-11-18 パナソニック株式会社 音声復号化装置および音声復号化方法
EP2221808B1 (en) * 2003-10-23 2012-07-11 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
JP4493030B2 (ja) * 2005-10-12 2010-06-30 月島機械株式会社 ろ過装置
WO2007105586A1 (ja) 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
US8909521B2 (en) * 2009-06-03 2014-12-09 Nippon Telegraph And Telephone Corporation Coding method, coding apparatus, coding program, and recording medium therefor
RU2510974C2 (ru) * 2010-01-08 2014-04-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, устройство кодера, устройство декодера, программа и носитель записи
JP5602769B2 (ja) * 2010-01-14 2014-10-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
FR2961937A1 (fr) * 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
JP2012163919A (ja) * 2011-02-09 2012-08-30 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
WO2012144877A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
WO2013176177A1 (ja) * 2012-05-23 2013-11-28 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
WO2014021318A1 (ja) * 2012-08-01 2014-02-06 独立行政法人産業技術総合研究所 音声分析合成のためのスペクトル包絡及び群遅延の推定システム及び音声信号の合成システム
PL3525208T3 (pl) * 2012-10-01 2021-12-13 Nippon Telegraph And Telephone Corporation Sposób kodowania, koder, program i nośnik zapisu
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
CN103824561B (zh) * 2014-02-18 2015-03-11 北京邮电大学 一种语音线性预测编码模型的缺失值非线性估算方法
KR101972087B1 (ko) * 2014-04-24 2019-04-24 니폰 덴신 덴와 가부시끼가이샤 주파수 영역 파라미터열 생성 방법, 부호화 방법, 복호 방법, 주파수 영역 파라미터열 생성 장치, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
CN107004422B (zh) * 2014-11-27 2020-08-25 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
KR101996307B1 (ko) * 2015-01-30 2019-07-04 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체
KR102070145B1 (ko) * 2015-01-30 2020-01-28 니폰 덴신 덴와 가부시끼가이샤 파라미터 결정 장치, 방법, 프로그램 및 기록 매체
JP6392450B2 (ja) * 2015-04-13 2018-09-19 日本電信電話株式会社 マッチング装置、判定装置、これらの方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
CN107408390B (zh) 2021-08-06
WO2016167215A1 (ja) 2016-10-20
KR20170127533A (ko) 2017-11-21
EP3270376B1 (en) 2020-03-18
JP6517924B2 (ja) 2019-05-22
EP3270376A1 (en) 2018-01-17
US20180096694A1 (en) 2018-04-05
CN107408390A (zh) 2017-11-28
US10325609B2 (en) 2019-06-18
JP2019079069A (ja) 2019-05-23
JPWO2016167215A1 (ja) 2018-02-01
KR102061300B1 (ko) 2020-02-11
EP3270376A4 (en) 2018-08-29

Similar Documents

Publication Publication Date Title
JP6633787B2 (ja) 線形予測復号装置、方法、プログラム及び記録媒体
JP6422813B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JP6270993B2 (ja) 符号化装置、及びその方法、プログラム、記録媒体
JP6457552B2 (ja) 符号化装置、復号装置、これらの方法及びプログラム
JP6595687B2 (ja) 符号化方法、符号化装置、プログラム、および記録媒体
JP6499206B2 (ja) パラメータ決定装置、方法、プログラム及び記録媒体
JP6387117B2 (ja) 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
JP6668532B2 (ja) 復号装置、及びその方法、プログラム、記録媒体
JP5635213B2 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190131

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191212

R150 Certificate of patent or registration of utility model

Ref document number: 6633787

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250