JP6668531B2 - 符号化装置、及びその方法、プログラム、記録媒体 - Google Patents

符号化装置、及びその方法、プログラム、記録媒体 Download PDF

Info

Publication number
JP6668531B2
JP6668531B2 JP2019040750A JP2019040750A JP6668531B2 JP 6668531 B2 JP6668531 B2 JP 6668531B2 JP 2019040750 A JP2019040750 A JP 2019040750A JP 2019040750 A JP2019040750 A JP 2019040750A JP 6668531 B2 JP6668531 B2 JP 6668531B2
Authority
JP
Japan
Prior art keywords
vector
unit
encoding
correction
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019040750A
Other languages
English (en)
Other versions
JP2019113859A (ja
Inventor
守谷 健弘
健弘 守谷
優 鎌本
優 鎌本
登 原田
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JP2019113859A publication Critical patent/JP2019113859A/ja
Application granted granted Critical
Publication of JP6668531B2 publication Critical patent/JP6668531B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、線形予測係数やこれに変換可能な係数の符号化技術及び復号技術に関する。
音声や音楽などの音響信号の符号化では、入力音響信号を線形予測分析して得た線形予測係数を用いて符号化する手法が広く用いられている。
符号化処理で用いた線形予測係数の情報を復号装置側で復号できるように、符号化装置は、線形予測係数を符号化し、線形予測係数に対応する符号を復号装置に送る。非特許文献1では、符号化装置は、線形予測係数を線形予測係数と等価な周波数領域のパラメータであるLSP(Line Spectrum Pair)パラメータの列に変換し、LSPパラメータの列を符号化して得たLSP符号を復号装置へ送る。
従来の線形予測係数の符号化装置及び復号装置を備える音響信号の符号化装置60及び復号装置70の概略を説明する。
<従来の符号化装置60>
従来の符号化装置60の構成を図1に示す。
符号化装置60は、線形予測分析部61、LSP計算部62、LSP符号化部63、係数変換部64、線形予測分析フィルタ部65、残差符号化部66を含む。このうち、LSPパラメータを受け取り、LSPパラメータを符号化して、LSP符号を出力するLSP符号化部63が、線形予測係数の符号化装置である。
符号化装置60には、所定の時間区間であるフレーム単位の入力音響信号が連続して入力され、フレームごとに以下の処理が行われる。以下では、現在の処理対象の入力音響信号がf番目のフレームであるとして、各部の具体処理を説明する。f番目のフレームの入力音響信号をXfとする。
<線形予測分析部61>
線形予測分析部61は、入力音響信号Xfを受け取り、入力音響信号Xfを線形予測分析して、線形予測係数af[1],af[2],…,af[p](pは予測次数)を求めて出力する。ここで、af[i]はf番目のフレームの入力音響信号Xfを線形予測分析して得られるi次の線形予測係数を表す。
<LSP計算部62>
LSP計算部62は、線形予測係数af[1],af[2],…,af[p]を受け取り、線形予測係数af[1],af[2],…,af[p]からLSP(Line Spectrum Pairs)パラメータθf[1],θf[2],…,θf[p]を求めて出力する。ここで、θf[i]はf番目のフレームの入力音響信号Xfに対応するi次のLSPパラメータである。
<LSP符号化部63>
LSP符号化部63は、LSPパラメータθf[1],θf[2],…,θf[p]を受け取り、LSPパラメータθf[1],θf[2],…,θf[p]を符号化して、LSP符号CLfと、LSP符号に対応する量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]と、を得て出力する。なお、量子化LSPパラメータは、LSPパラメータを量子化したものである。非特許文献1では、LSPパラメータθf[1],θf[2],…,θf[p]の過去のフレームからの重み付き差分ベクトルを求め、重み付き差分ベクトルを低次側と高次側の2つのサブベクトルに分け、各サブベクトルが2つの符号帳からのサブベクトルの和となるように符号化する方法で符号化しているが、符号化方法には様々な従来技術がある。したがって、LSPパラメータの符号化には、非特許文献1に記載された方法、多段でベクトル量子化する方法、スカラ量子化する方法、これらを組み合わせた方法、などの様々な周知の符号化方法が採用されることがある。
<係数変換部64>
係数変換部64は、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]を受け取り、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]から線形予測係数を求めて出力する。なお、出力された線形予測係数は量子化済みのLSPパラメータに対応するものであるため、量子化線形予測係数と呼ぶ。ここで、量子化線形予測係数を^af[1],^af[2],…,^af[p]とする。
<線形予測分析フィルタ部65>
線形予測分析フィルタ部65は、入力音響信号Xfと量子化線形予測係数^af[1],^af[2],…,^af[p]を受け取り、入力音響信号Xfの量子化線形予測係数^af[1],^af[2],…,^af[p]による線形予測残差である線形予測残差信号を得て出力する。
<残差符号化部66>
残差符号化部66は、線形予測残差信号を受け取り、線形予測残差信号を符号化して残差符号CRfを得て出力する。
<従来の復号装置70>
従来の復号装置70の構成を図2に示す。復号装置70には、フレーム単位のLSP符号CLfと残差符号CRfが入力され、フレーム単位で復号処理を行って復号音響信号^Xfを得る。
復号装置70は、残差復号部71、LSP復号部72、係数変換部73、線形予測合成フィルタ部74を含む。このうち、LSP符号を受け取り、LSP符号を復号して、復号LSPパラメータを得て出力するLSP復号部72が、線形予測係数の復号装置である。
以下では、現在の復号処理対象のLSP符号と残差符号のそれぞれがf番目のフレームに対応するLSP符号CLfと残差符号CRfであるとして、各部の具体処理を説明する。
<残差復号部71>
残差復号部71は、残差符号CRfを受け取り、残差符号CRfを復号して復号線形予測残差信号を得て出力する。
<LSP復号部72>
LSP復号部72は、LSP符号CLfを受け取り、LSP符号CLfを復号して復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を得て出力する。符号化装置60が出力したLSP符号CLfが誤りなく復号装置70に入力されていれば、LSP復号部72で得られる復号LSPパラメータは、符号化装置60のLSP符号化部63で得られた量子化LSPパラメータと同じになる。
<係数変換部73>
係数変換部73は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を受け取り、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を線形予測係数に変換して出力する。出力された線形予測係数は復号により得られたLSPパラメータに対応するものであるため、復号線形予測係数と呼び^af[1],^af[2],…,^af[p]と表す。
<線形予測合成フィルタ部74>
線形予測合成フィルタ部74は、復号線形予測係数^af[1],^af[2],…,^af[p]と復号線形予測残差信号とを受け取り、復号線形予測残差信号に対して復号線形予測係数^af[1],^af[2],…,^af[p]による線形予測合成を行って復号音響信号^Xfを生成して出力する。
従来技術では、すべてのフレームで同じ符号化方法でLSPパラメータを符号化している。そのため、スペクトル変動が大きい場合には、スペクトル変動が小さい場合ほど精度良く符号化できないという問題がある。
本発明は、全体として符号量の増大を抑えつつ、スペクトルの変動が大きいフレームについても線形予測係数に変換可能な係数を精度良く符号化及び復号する技術を提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、符号化装置は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、(A-1)複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、量子化誤差は、複数次のうちの低次の量子化誤差である。
上記の課題を解決するために、本発明の他の態様によれば、符号化装置は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、(A-1)複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、第二符号化部は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、ビット数の多い第二符号を得る。
上記の課題を解決するために、本発明の他の態様によれば、符号化装置は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、線形予測係数に変換可能な係数は、線スペクトル対のパラメータであり、 指標Q’は、第一符号に対応する全次または低次の量子化済みの線スペクトル対のパラメータの隣り合うパラメータ間の差分と、最低次の量子化済みの線スペクトル対のパラメータと、のうちの最小値である。
上記の課題を解決するために、本発明の他の態様によれば、符号化方法は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、(A-1)複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、量子化誤差は、複数次のうちの低次の量子化誤差である。
上記の課題を解決するために、本発明の他の態様によれば、符号化方法は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、(A-1)複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、第二符号化ステップは、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、ビット数の多い第二符号を得る。
上記の課題を解決するために、本発明の他の態様によれば、符号化装置は、複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、線形予測係数に変換可能な係数は、線スペクトル対のパラメータであり、 指標Q’は、第一符号に対応する全次または低次の量子化済みの線スペクトル対のパラメータの隣り合うパラメータ間の差分と、最低次の量子化済みの線スペクトル対のパラメータと、のうちの最小値である。
本発明によれば、全体として符号量の増大を抑えつつ、スペクトルの変動が大きいフレームについても線形予測係数に変換可能な係数を精度良く符号化及び復号することができるという効果を奏する。
従来の符号化装置の構成を示す図。 従来の復号装置の構成を示す図。 第一実施形態に係る符号化装置の機能ブロック図。 第一実施形態に係る符号化装置の処理フローの例を示す図。 第一実施形態に係る復号装置の機能ブロック図。 第一実施形態に係る復号装置の処理フローの例を示す図。 第二実施形態に係る線形予測係数符号化装置の機能ブロック図。 第二、第三実施形態に係る線形予測係数符号化装置の処理フローの例を示す図。 第二実施形態に係る線形予測係数符号化装置の予測対応符号化部の機能ブロック図。 第二実施形態に係る線形予測係数復号装置の機能ブロック図。 第二、第三実施形態に係る線形予測係数復号装置の処理フローの例を示す図。 第二実施形態に係る線形予測係数復号装置の予測対応復号部の機能ブロック図。 第三実施形態に係る線形予測係数符号化装置の機能ブロック図。 第三実施形態に係る線形予測係数復号装置の機能ブロック図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」、「~」、「」等は、本来直後の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直前に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
以下、従来と異なる点を中心に説明する。
<第一実施形態に係る符号化装置100>
図3は第一実施形態に係る線形予測係数の符号化装置100を備える音響信号の符号化装置の機能ブロック図を、図4はその処理フローの例を示す。
符号化装置100は、線形予測分析部61とLSP計算部62とLSP符号化部63と係数変換部64と線形予測分析フィルタ部65と残差符号化部66とを含み、さらに、指標計算部107と補正符号化部108と加算部109とを含む。このうち、LSPパラメータを受け取り、LSPパラメータを符号化して、LSP符号CLfと補正LSP符号CL2fを出力する部分、すなわち、LSP符号化部63と指標計算部107と補正符号化部108を含む部分が、線形予測係数の符号化装置150である。
線形予測分析部61とLSP計算部62とLSP符号化部63と係数変換部64と線形予測分析フィルタ部65と残差符号化部66とにおける処理は、従来技術で説明した内容と同じであり、それぞれ図4のs61〜s66に対応する。
符号化装置100は、音響信号Xfを受け取り、LSP符号CLf、補正符号CL2f及び残差符号CRfを得る。
<指標計算部107>
指標計算部107は、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]を受け取り、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]を用いて、スペクトルの変動の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、および/または、スペクトルの変動の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を算出する(s107)。指標計算部107は、指標Qおよび/またはQ’の大きさに応じて、補正符号化部108に符号化処理を実行するように、または、所定のビット数で符号化処理を実行するように制御信号Cを出力する。また、指標計算部107は、指標Qおよび/またはQ’の大きさに応じて、加算部109に加算処理を実行するように制御信号Cを出力する。
本実施形態では、LSP符号化部63の量子化誤差、すなわち、LSPパラメータθf[1],θf[2],…,θf[p]と量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の対応する次数ごとの差分値による列、を符号化するか否かを、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]から算出されるスペクトルの変動の大きさを利用して決定する。「スペクトルの変動の大きさ」は、「スペクトル包絡の山谷の大きさ」、または、「パワースペクトル包絡の振幅の凹凸の変化の大きさ」と言い換えてもよい。
以下に、制御信号Cの生成方法を説明する。
一般に、LSPパラメータは入力音響信号のパワースペクトル包絡と相関性のある周波数領域のパラメータ列であり、LSPパラメータの各値は入力音響信号のパワースペクトル包絡の極値の周波数位置と相関する。LSPパラメータをθ[1],θ[2],…,θ[p]としたとき、θ[i]とθ[i+1]の間の周波数位置にパワースペクトル包絡の極値が存在し、この極値の周りの接線の傾きが急峻であるほどθ[i]とθ[i+1]との間隔(つまり、(θ[i+1]-θ[i])の値)が小さくなる。すなわち、パワースペクトル包絡の振幅の凹凸が急峻であるほど、各iについて、θ[i]とθ[i+1]との間隔が不均一になる、すなわち、LSPパラメータの間隔の分散が大きくなる。逆に、パワースペクトル包絡の凹凸がほとんどない場合は、各iについて、θ[i]とθ[i+1]との間隔が均等間隔に近くなる。
よって、LSPパラメータの間隔の分散に対応する指標が大きいことは、パワースペクトル包絡の振幅の凹凸の変化が大きいことを意味する。また、LSPパラメータの間隔の最小値に対応する指標が小さいことは、パワースペクトル包絡の振幅の凹凸の変化が大きいことを意味する。
量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]はLSPパラメータθf[1],θf[2],…,θf[p]を量子化して得られたものであり、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]はLSP符号が符号化装置から復号装置に誤りなく入力されていれば量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]と同じであるので、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]や復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]についてもLSPパラメータθf[1],θf[2],…,θf[p]と同様の性質が成り立つ。
そのため、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の間隔の分散に対応する値をスペクトル包絡の山谷が大きいほど大きくなる指標Qとして、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の次数が隣接する(隣り合う)量子化LSPパラメータの差分(^θf[i+1]-^θf[i])の最小値をスペクトル包絡の山谷が大きいほど小さくなる指標Q’として、それぞれ用いることができる。
スペクトル包絡の山谷が大きいほど大きくなる指標Qは、例えば、所定の次数T(T≦p)以下の量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の間隔の分散を表す指標Q、すなわち、
Figure 0006668531
により計算する。
また、スペクトル包絡の山谷が大きいほど小さくなる指標Q’は、例えば、所定の次数T(T≦p)以下の量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の次数が隣接する量子化LSPパラメータの間隔の最小値を表す指標Q’、すなわち、
Figure 0006668531
あるいは、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の次数が隣接する量子化LSPパラメータの間隔、および、最低次の量子化LSPパラメータの値、のうちの最小値を表す指標Q’、すなわち、
Figure 0006668531
により計算する。LSPパラメータは0からπの間に次数順に存在するパラメータであるので、この式の最低次の量子化LSPパラメータ^θf[1]は、^θf[1]と0との間隔(^θf[1]-0)を意味する。
指標計算部107は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、補正符号化部108および加算部109に補正符号化処理を実行することを示す制御信号Cを出力し、それ以外の場合に、補正符号化部108および加算部109に補正符号化処理を実行しないことを示す制御信号Cを出力する。ここで、「(A-1)の場合、および/または、(B-1)の場合」は、指標Qだけを求めて(A-1)の条件をみたす場合、指標Q’だけを求めて(B-1)の条件をみたす場合、指標Qと指標Q’の両方を求めて(A-1)と(B-1)の両方の条件をみたす場合、の3つの場合を含む表現である。もちろん、(A-1)の条件をみたすか否かを判定する場合であっても指標Q’を求めてもよいし、(B-1)の条件をみたすか否かを判定する場合であっても指標Qを求めてもよい。以下の記載中の「および/または」についても同様である。
また、指標計算部107は、(A-1)および/または(B-1)の場合に、所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、加算部109において、制御信号Cを受け取ったときに加算処理を実行し、補正符号化部108において、制御信号Cを受け取ったときに、符号化処理を実行する構成としている場合には、指標計算部107は、(A-1)および/または(B-1)以外の場合に、制御信号Cを出力しない構成としてもよい。
<補正符号化部108>
補正符号化部108は、制御信号Cと、LSPパラメータθf[1],θf[2],…,θf[p]と、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]とを受け取る。補正符号化部108は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、LSP符号化部63の量子化誤差、すなわち、LSPパラメータθf[1],θf[2],…,θf[p]と量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]との各次の差分であるθf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p]を符号化して、補正LSP符号CL2fを得て(s108)出力する。また、補正符号化部108は、補正LSP符号に対応する量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]を得て出力する。符号化する方法としては、例えば、周知のベクトル量子化を用いればよい。
例えば、補正符号化部108は、図示しない補正ベクトル符号帳に記憶されている複数の候補補正ベクトルの中から、差分θf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p]に最も近い候補補正ベクトルを探索し、その候補補正ベクトルに対応する補正ベクトル符号を補正LSP符号CL2fとし、その候補補正ベクトルを量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]とする。なお、図示しない補正ベクトル符号帳は符号化装置内に記憶されており、補正ベクトル符号帳には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正符号化部108は、θf[1]-^θf[1],θf[2]-^θf[2],…,θf[p]-^θf[p]の符号化を行わず、補正LSP符号CL2f、量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]を出力しない。
<加算部109>
加算部109は、制御信号Cと、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]とを受け取る。さらに、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]も受け取る。
加算部109は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]と量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]とを加算して(s109)得られる^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[p]+^θdifff[p]を係数変換部64で用いる量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]として出力する。
加算部109は、補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、受け取った量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]をそのまま係数変換部64に出力する。このため、LSP符号化部63が出力した各次の量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]がそのまま係数変換部64で用いる量子化LSPパラメータとなる。
<第一実施形態に係る復号装置200>
以下、従来と異なる点を中心に説明する。
図5は第一実施形態に係る線形予測係数の復号装置200を備える音響信号の復号装置の機能ブロック図を、図6はその処理フローの例を示す。
復号装置200は、残差復号部71とLSP復号部72と係数変換部73と線形予測合成フィルタ部74とを含み、さらに、指標計算部205と補正復号部206と加算部207とを含む。このうち、LSP符号CLfと補正LSP符号CL2fを受け取り、LSP符号CLfと補正LSP符号CL2fを復号して、復号LSPパラメータを得て出力する部分、すなわち、LSP復号部72と指標計算部205と補正復号部206と加算部207とを含む部分が、線形予測係数の復号装置250である。
復号装置200は、LSP符号CLfと補正LSP符号CL2fと残差符号CRfとを受け取り、復号音響信号^Xfを生成して出力する。
<指標計算部205>
指標計算部205は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を受け取り、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を用いて、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]に対応するスペクトルの変動の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、および/または、スペクトルの変動の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を算出する(s205)。指標計算部205は、指標Qおよび/またはQ’の大きさに応じて、補正復号部206に復号処理を実行するように、または、所定のビット数で復号処理を実行するように制御信号Cを出力する。また、指標計算部205は、指標Qおよび/またはQ’の大きさに応じて、加算部207に加算処理を実行するように制御信号Cを出力する。指標Q及びQ’は、指標計算部107で説明したものと同様であり、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の代わりに復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を用いて、同様の方法で計算すればよい。
指標計算部205は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、補正復号部206および加算部207に補正復号処理を実行することを示す制御信号Cを出力し、それ以外の場合に、補正復号部206および加算部207に補正復号処理を実行しないことを示す制御信号Cを出力する。
また、指標計算部205は、(A-1)および/または(B-1)の場合に、所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、加算部207において、制御信号Cを受け取ったときに加算処理を実行し、補正復号部206において、制御信号Cを受け取ったときに、復号処理を実行する構成としている場合には、指標計算部205は、(A-1)および/または(B-1)以外の場合に、制御信号Cを出力しない構成としてもよい。
<補正復号部206>
補正復号部206は、補正LSP符号CL2fと制御信号Cとを受け取る。補正復号部206は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正LSP符号CL2fを復号して、復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]を得て(s206)出力する。復号する方法としては、符号化装置100の補正符号化部108における符号化方法に対応する復号方法を用いる。
例えば、補正復号部206は、図示しない補正ベクトル符号帳に記憶されている複数の補正ベクトル符号の中から、復号装置200に入力された補正LSP符号CL2fに対応する補正ベクトル符号を探索し、探索された補正ベクトル符号に対応する候補補正ベクトルを復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]として出力する。なお、図示しない補正ベクトル符号帳は復号装置内に記憶されており、補正ベクトル符号帳には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正復号部206は、補正LSP符号CL2fの復号を行わず、復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]を出力しない。
<加算部207>
加算部207は、制御信号Cと、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]とを受け取る。さらに、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]により求まるスペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]も受け取る。
加算部207は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]により求まるスペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]と復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]とを加算して(s207)得られる^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[p]+^θdifff[p]を係数変換部73で用いる復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]として出力する。
加算部207は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]により求まるスペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、受け取った復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]をそのまま係数変換部73に出力する。このため、LSP復号部72が出力した各次の復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]がそのまま係数変換部73で用いる復号LSPパラメータとなる。
<第一実施形態の効果>
このような構成により、全体として符号量の増大を抑えつつ、スペクトルの変動が大きいフレームについても線形予測係数に変換可能な係数を精度良く符号化及び復号することができる。
<第一実施形態の変形例1>
本実施形態では、LSPパラメータについて記載しているが、線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。PARCOR係数や、LSPパラメータまたはPARCOR係数を変形した係数、さらには、線形予測係数自体を対象としてもよい。これら全ての係数は、音声符号化の技術分野では、互いに変換可能なものであり、何れの係数を用いても第一実施形態の効果を得ることができる。なお、LSP符号CLfまたはLSP符号CLfに対応する符号を第一符号ともいい、LSP符号化部を第一符号化部ともいう。同様に、補正LSP符号CL2fまたは補正LSP符号CL2fに対応する符号を第二符号ともいい、補正符号化部を第二符号化部ともいう。また、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]を第一の復号値ともいい、LSP復号部を第一復号部ともいう。また、復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[p]を第二の復号値ともいい、補正復号部を第二復号部ともいう。
前述の通り、LSPパラメータに代えて、線形予測係数に変換可能な係数であれば、他の係数を用いてもよい。以下、PARCOR係数kf[1],kf[2],…,kf[p]を用いた場合について説明する。
LSPパラメータθ [1],θ[2],…,θ[p]に対応するスペクトル包絡の山谷の大きさが大きいほど、PARCOR係数により求まる
Figure 0006668531
の値が小さくなることが分かっている。よって、PARCOR係数を用いる場合には、指標計算部107は、量子化されたPARCOR係数^kf[1],^kf[2],…,^kf[p]を受け取り、スペクトル包絡の山谷の小ささに対応する指標Q’を
Figure 0006668531
により計算する(s107)。指標計算部107は、指標Q’の大きさに応じて、補正符号化部108および加算部109に補正符号化処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号C、を出力する。指標計算部205も同様に、指標Q’の大きさに応じて、補正復号部206および加算部207に補正復号処理を実行する/しないことを示す制御信号C、または、所定のビット数を表す正の整数または0である制御信号C、を出力する。
<第一実施形態の変形例2>
指標計算部107及び指標計算部205は、制御信号Cに代えて指標Qおよび/または指標Q’を出力する構成としてもよい。その場合、指標Qおよび/または指標Q’の大きさに応じて、補正符号化部108及び補正復号部206でそれぞれ符号化及び復号するか否かを判断すればよい。また、同様に、指標Qおよび/または指標Q’の大きさに応じて、加算部109及び加算部207でそれぞれ加算処理を実行するか否かを判断すればよい。補正符号化部108、補正復号部206、加算部109及び加算部207における判断は、上記の指標計算部107及び指標計算部205において説明したのと同じ判断である。
<第二実施形態>
以下、第一実施形態と異なる点を中心に説明する。
<第二実施形態に係る線形予測係数符号化装置300>
図7は第二実施形態に係る線形予測係数符号化装置300の機能ブロック図を、図8はその処理フローの例を示す。
線形予測係数符号化装置300は、線形予測分析部301とLSP計算部302と予測対応符号化部320と非予測対応符号化部310とを含む。
線形予測係数符号化装置300は、音響信号Xfを受け取り、LSP符号Cf及び補正LSP符号Dfを得て出力する。
なお、音響信号Xfに由来するLSPパラメータθf[1],θf[2],…,θf[p]が別の装置により生成されており、線形予測係数符号化装置300の入力がLSPパラメータθf[1],θf[2],…,θf[p]である場合には、線形予測係数符号化装置300は、線形予測分析部301とLSP計算部302とを含まなくてよい。
<線形予測分析部301>
線形予測分析部301は、入力音響信号Xfを受け取り、入力音響信号Xfを線形予測分析して、線形予測係数af[1],af[2],…,af[p]を求めて(s301)出力する。ここで、af[i]はf番目のフレームの入力音響信号Xfを線形予測分析して得られるi次の線形予測係数を表す。
<LSP計算部302>
LSP計算部302は、線形予測係数af[1],af[2],…,af[p]を受け取り、線形予測係数af[1],af[2],…,af[p]からLSP(Line Spectrum Pairs)パラメータθf[1],θf[2],…,θf[p]を求め(s302)、LSPパラメータを並べたベクトルであるLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tを出力する。ここで、θf[i]はf番目のフレームの入力音響信号Xfに対応するi次のLSPパラメータである。
<予測対応符号化部320>
図9は、予測対応符号化部320の機能ブロック図を示す。
予測対応符号化部320は、予測対応減算部303とベクトル符号化部304とベクトル符号帳306と遅延入力部307とを含む。
予測対応符号化部320は、LSPパラメータベクトルΘff[1],θf[2],…,θf[p]を受け取り、LSPパラメータベクトルΘfと、少なくとも過去のフレームからの予測を含む予測ベクトルと、の差分からなる差分ベクトルSfを符号化して、LSP符号CfとLSP符号Cfに対応する量子化差分ベクトル^Sfを得て(s320)出力する。さらに、予測対応符号化部320は、予測ベクトルに含まれる過去のフレームからの予測分を表すベクトルを得て出力する。なお、LSP符号Cfに対応する量子化差分ベクトル^Sfは、差分ベクトルSfの各要素値に対応する量子化値からなるベクトルである。
ここで、少なくとも過去のフレームからの予測を含む予測ベクトルとは、例えば、予め定めた予測対応平均ベクトルVと、1つ前のフレームの量子化差分ベクトル(前フレーム量子化差分ベクトル)^Sf-1の各要素に予め定めたαを乗算して得られるベクトルと、を加算して得られるベクトルV+α×^Sf-1である。この例では、予測ベクトルに含まれる過去のフレームからの予測分を表すベクトルは、前フレーム量子化差分ベクトル^Sf-1のα倍であるα×^Sf-1である。
なお、予測対応符号化部320は、LSPパラメータベクトルΘf以外に外部からの入力を必要としないので、LSPパラメータベクトルΘfを符号化してLSP符号Cfを得ていると言ってもよい。
予測対応符号化部320内の各部の処理について説明する。
<予測対応減算部303>
予測対応減算部303は、例えば、所定の係数αを記憶した記憶部303c、予測対応平均ベクトルVを記憶した記憶部303d、乗算部308、減算部303a及び303bを含んで構成される。
予測対応減算部303は、LSPパラメータベクトルΘfと、前フレーム量子化差分ベクトル^Sf-1を受け取る。
予測対応減算部303は、LSPパラメータベクトルΘfから予測対応平均ベクトルVとベクトルα×^Sf-1とを減算したベクトルである差分ベクトルSff−V-α×^Sf-1を生成して(s303)出力する。
なお、予測対応平均ベクトルV=(v[1],v[2],…,v[p])Tは、記憶部303dに記憶された予め定めたベクトルであり、例えば、予め学習用の音響信号から求めておけばよい。例えば、線形予測係数符号化装置300において、符号化の対象となる音響信号と、同じ環境(例えば、話者、収音装置、場所)で収音した音響信号を学習用の入力音響信号として用いて、多数のフレームのLSPパラメータベクトルを求め、その平均を予測対応平均ベクトルとする。
乗算部308は、記憶部303cに記憶された所定の係数αを前フレーム量子化差分ベクトル^Sf-1に乗じてベクトルα×^Sf-1を得る。
なお、図9では、2つの減算部303a及び303bを用いて、まず、減算部303aにおいて、LSPパラメータベクトルΘfから記憶部303dに記憶された予測対応平均ベクトルVを減算した後、減算部303bにおいて、ベクトルα×^Sf-1を減算しているが、この順序は逆であってもよい。あるいは、予測対応平均ベクトルVとベクトルα×^Sf-1とを加算したベクトルV+α×^Sf-1を、LSPパラメータベクトルΘfから減算することで差分ベクトルSfを生成してもよい。
現在のフレームの差分ベクトルSfは、現在のフレームの複数次の線形予測係数に変換可能な係数(LSPパラメータベクトルΘf)から、少なくとも過去のフレームからの予測を含むベクトルを減算して得られるベクトルといってもよい。
<ベクトル符号化部304>
ベクトル符号化部304は、差分ベクトルSfを受け取り、差分ベクトルSfを符号化して、LSP符号CfとLSP符号Cfに対応する量子化差分ベクトル^Sfとを得て出力する。差分ベクトルSfの符号化には、差分ベクトルSfをベクトル量子化する方法、差分ベクトルSfを複数のサブベクトルに分けてサブベクトルそれぞれをベクトル量子化する方法、差分ベクトルSfまたはサブベクトルを多段ベクトル量子化する方法、ベクトルの要素をスカラ量子化する方法、これらを組み合わせた方法、などの周知の何れの符号化方法を用いてもよい。
ここでは、差分ベクトルSfをベクトル量子化する方法を用いる場合の例を説明する。
ベクトル符号帳306に記憶されている複数の候補差分ベクトルの中から、差分ベクトルSfに最も近い候補差分ベクトルを探索して量子化差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとして出力するとともに、量子化差分ベクトル^Sfに対応する差分ベクトル符号をLSP符号Cfとして出力する(s304)。なお、量子化差分ベクトル^Sfは後述する復号差分ベクトルに対応する。
<ベクトル符号帳306>
ベクトル符号帳306には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。
<遅延入力部307>
遅延入力部307は、量子化差分ベクトル^Sfを受け取り、量子化差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム量子化差分ベクトル^Sf-1として出力する(s307)。つまり、f番目のフレームの量子化差分ベクトル^Sfに対して予測対応減算部303が処理を行っているときには、f-1番目のフレームについての量子化差分ベクトル^Sf-1を出力する。
なお、予測対応符号化部320では生成していないが、予測対応符号化部320におけるLSPパラメータベクトルΘfの各要素を量子化して得られる予測対応量子化LSPパラメータベクトル^Θfは、量子化差分ベクトル^Sfに予測ベクトルV+α×^Sf-1を加算したものであると言える。すなわち、予測対応量子化LSPパラメータベクトルは^Θf=^Sf+V+α×^Sf-1である。また、予測対応符号化部320における量子化誤差ベクトルはΘf-^Θf=Θf-(^Sf+V+α×^Sf-1)である。
<非予測対応符号化部310>
非予測対応符号化部310は、非予測対応減算部311と補正ベクトル符号化部312と補正ベクトル符号帳313と予測対応加算部314と指標計算部315とを含む。指標計算部315の計算結果に応じて、非予測対応減算部311において減算処理を実行するか否か、及び、補正ベクトル符号化部312において処理を実行するか否かが決定される。指標計算部315は、第一実施形態の指標計算部107に対応する。
非予測対応符号化部310は、LSPパラメータベクトルΘfと量子化差分ベクトル^Sfとベクトルα×^Sf-1とを受け取る。非予測対応符号化部310は、LSPパラメータベクトルΘfと量子化差分ベクトル^Sfとの差分である補正ベクトルを符号化して補正LSP符号Dfを得て(s310)出力する。
ここで、補正ベクトルはΘf-^Sfであり、予測対応符号化部320の量子化誤差ベクトルはΘf-^Θf=Θf-(^Sf+V+α×^Sf-1)であるので、補正ベクトルΘf-^Sfは予測対応符号化部320の量子化誤差ベクトルΘf-^Θfと予測対応平均ベクトルVとα倍を乗算した前フレーム量子化差分ベクトルα×^Sf-1とを加算したものである(Θf-^Sf=Θf-^Θf+V+α×^Sf-1)。すなわち、非予測対応符号化部310は、量子化誤差ベクトルΘf-^Θfと予測ベクトルV+α×^Sf-1とを加算したものを符号化して補正LSP符号Dfを得ているとも言え、予測対応符号化部320の量子化誤差ベクトルΘf-^Θfを少なくとも符号化して補正LSP符号Dfを得ていると言える。
補正ベクトルΘf-^Sfの符号化には周知の符号化方法の何れを用いてもよいが、以下の説明では、補正ベクトルΘf-^Sfから非予測対応平均ベクトルYを減算したものをベクトル量子化する方法について説明する。なお、以下の説明では、補正ベクトルΘf-^Sfから非予測対応平均ベクトルYを減算して得られるベクトルであるUff-Y-^Sfを、便宜的に補正ベクトルと呼んでいる。
以下、各部の処理について説明する。
<予測対応加算部314>
予測対応加算部314は、例えば、予測対応平均ベクトルVを記憶した記憶部314c、加算部314a及び314bを含んで構成される。記憶部314cに記憶されている予測対応平均ベクトルVは、予測対応符号化部320内の記憶部303dに記憶されている予測対応平均ベクトルVと同じである。
予測対応加算部314は、現在のフレームの量子化差分ベクトル^Sf、前フレーム量子化差分ベクトル^Sf-1に所定の係数αを乗じたベクトルα×^Sf-1を受け取る。
予測対応加算部314は、量子化差分ベクトル^Sfと、予測対応平均ベクトルVと、ベクトルα×^Sf-1とを加算したベクトルである予測対応量子化LSPパラメータベクトル^Θf(=^Sf+V+α^Sf-1)=(^θf[1],^θf[2],…,^θf[p])Tを生成して(s314)出力する。
図7では、2つの加算部314a及び314bを用いて、まず、加算部314bにおいて、現在のフレームの量子化差分ベクトル^Sfに、ベクトルα×^Sf-1を加算した後、加算部314aにおいて予測対応平均ベクトルVを加算しているが、この順序は逆であってもよい。あるいは、ベクトルα×^Sf-1と予測対応平均ベクトルVとを加算したベクトルを、量子化差分ベクトル^Sfに加算することで予測対応量子化LSPパラメータベクトル^Θfを生成してもよい。
なお、予測対応加算部314に入力される現在のフレームの量子化差分ベクトル^Sf、前フレーム量子化差分ベクトル^Sf-1に所定の係数αを乗じたベクトルα×^Sf-1は共に予測対応符号化部320で生成されたものであり、予測対応加算部314内の記憶部314cに記憶されている予測対応平均ベクトルVは予測対応符号化部320内の記憶部303dに記憶されている予測対応平均ベクトルVと同じであるので、予測対応加算部314が行う処理を予測対応符号化部320が行って予測対応量子化LSPパラメータベクトル^Θfを生成して非予測対応符号化部310に出力し、非予測対応符号化部310は予測対応加算部314を備えない構成としてもよい。
<指標計算部315>
指標計算部315は、予測対応量子化LSPパラメータベクトル^Θfを受け取り、予測対応量子化LSPパラメータベクトル^Θfに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、および/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s315)。指標計算部315は、指標Qおよび/またはQ’の大きさに応じて、補正ベクトル符号化部312に符号化処理を実行するように、または、所定のビット数で符号化処理を実行するように制御信号Cを出力する。また、指標計算部315は、指標Qおよび/またはQ’の大きさに応じて、非予測対応減算部311に減算処理を実行するように制御信号Cを出力する。指標Q及びQ’は、指標計算部107で説明したものと同様であり、量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]の代わりに予測対応量子化LSPパラメータベクトル^Θfの各要素である予測対応量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]を用いて、同様の方法で計算すればよい。
スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、指標計算部315は、非予測対応減算部311及び補正ベクトル符号化部312に補正符号化処理を実行することを示す制御信号Cを出力し、それ以外の場合に、非予測対応減算部311及び補正ベクトル符号化部312に補正符号化処理を実行しないことを示す制御信号Cを出力する。
また、(A-1)および/または(B-1)の場合に、指標計算部315は所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、非予測対応減算部311において、制御信号Cを受け取ったときに減算処理を実行し、補正ベクトル符号化部312において、制御信号Cを受け取ったときに符号化処理を実行する構成としている場合には、(A-1)および/または(B-1)以外の場合に、指標計算部315は制御信号Cを出力しない構成としてもよい。
<非予測対応減算部311>
非予測対応減算部311は、例えば、非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tを記憶した記憶部311c、減算部311a及び311bを含んで構成される。
非予測対応減算部311は、制御信号CとLSPパラメータベクトルΘfと量子化差分ベクトル^Sfとを受け取る。
非予測対応減算部311は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、LSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])Tから、量子化差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tと非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tとを減算して得られるベクトルである補正ベクトルUff-Y-^Sf=(uf[1],uf[2],…,uf[p])を生成して(s311)出力する。
なお、図7では、2つの減算部311a及び311bを用いて、まず、減算部311aにおいてLSPパラメータベクトルΘfから記憶部311cに記憶された非予測対応平均ベクトルYを減算した後、減算部311bにおいて量子化差分ベクトル^Sfを減算しているが、これらの減算の順序は逆であってもよい。あるいは、非予測対応平均ベクトルYと量子化差分ベクトル^Sfを加算したベクトルを、LSPパラメータベクトルΘfから減算することで補正ベクトルUfを生成してもよい。
なお、非予測対応平均ベクトルYは、予め定めたベクトルであり、例えば、予め学習用の音響信号から求めておけばよい。例えば、線形予測係数符号化装置300において、符号化の対象となる音響信号と、同じ環境(例えば、話者、収音装置、場所)で収音した音響信号を学習用の入力音響信号として用いて、多数のフレームの、LSPパラメータベクトルとそのLSPパラメータベクトルに対する量子化差分ベクトルとの差分を求め、その差分の平均を非予測対応平均ベクトルとする。
なお、補正ベクトルUfは、以下のように表される。
Uff-Y-^Sf
=(Θf-^Θf)-Y+α×^Sf-1+V
よって、補正ベクトルUfは、予測対応符号化部320の符号化の量子化誤差(Θf-^Θf)を少なくとも含む。
非予測対応減算部311は、補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合には、補正ベクトルUfを生成しないでよい。
<補正ベクトル符号帳313>
補正ベクトル符号帳313には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
<補正ベクトル符号化部312>
補正ベクトル符号化部312は、制御信号Cと補正ベクトルUfを受け取る。補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル符号化部312は、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s312)出力する。例えば、補正ベクトル符号化部312は、補正ベクトル符号帳313からに記憶されている複数の候補補正ベクトルの中から補正ベクトルUfに最も近い候補補正ベクトルを探索し、その候補補正ベクトルに対応する補正ベクトル符号を補正LSP符号Dfとする。
なお、前述の通り、補正ベクトルUfは、予測対応符号化部320の符号化の量子化誤差(Θf-^Θf)を少なくとも含むので、補正ベクトル符号化部312は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、少なくとも予測対応符号化部320の量子化誤差(Θf-^Θf)を符号化するともいえる。
補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正ベクトル符号化部312は、補正ベクトルUfの符号化を行わず、補正LSP符号Dfを得ず出力しない。
<第二実施形態に係る線形予測係数復号装置400>
図10は第二実施形態に係る線形予測係数復号装置400の機能ブロック図を、図11はその処理フローの例を示す。
第二実施形態の線形予測係数復号装置400は、予測対応復号部420と非予測対応復号部410とを含む。
線形予測係数復号装置400は、LSP符号Cfと補正LSP符号Dfとを受け取り、復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]と復号非予測対応LSPパラメータ^φf[1],^φf[2],…,^φf[p]とを生成して出力する。また、必要に応じて、復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]と復号非予測対応LSPパラメータ^φf[1],^φf[2],…,^φf[p]のそれぞれを線形予測係数に変換して得られる復号予測対応線形予測係数^af[1],^af[2],…,^af[p]と復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]とを生成して出力する。
<予測対応復号部420>
図12は、予測対応復号部420の機能ブロック図を示す。
予測対応復号部420は、ベクトル符号帳402とベクトル復号部401と遅延入力部403と予測対応加算部405とを含み、必要に応じて予測対応線形予測係数計算部406もを含む。
予測対応復号部420は、LSP符号Cfを受け取り、LSP符号Cfを復号して復号差分ベクトル^Sfを得て出力する。さらに、予測対応復号部420は、復号差分ベクトル^Sfと少なくとも過去のフレームからの予測を含む予測ベクトルとを加算して、LSPパラメータベクトルΘfの復号値からなる復号予測対応LSPパラメータベクトル^Θfを生成して(s420)出力する。予測対応復号部420は、必要に応じて、さらに、復号予測対応LSPパラメータベクトル^Θfを復号予測対応線形予測係数^af[1],^af[2],…,^af[p]に変換して出力する。
本実施形態では、予測ベクトルは、予め定めた予測対応平均ベクトルVと、過去のフレームの復号差分ベクトル^Sf-1のα倍とを加算して得られるベクトルV+α×^Sf-1である。
<ベクトル符号帳402>
ベクトル符号帳402には、各候補差分ベクトルとその各候補差分ベクトルに対応する差分ベクトル符号とが予め記憶されている。なお、ベクトル符号帳402は、前述の線形予測係数符号化装置300のベクトル符号帳306と共通の情報を含む。
<ベクトル復号部401>
ベクトル復号部401は、LSP符号Cfを受け取り、LSP符号Cfを復号して、LSP符号Cfに対応する復号差分ベクトル^Sfを得て出力する。LSP符号Cfの復号には、符号化装置のベクトル符号化部304の符号化方法に対応する復号方法を用いる。
ここでは、ベクトル符号化部304の差分ベクトルSfをベクトル量子化する方法に対応する復号方法を用いる場合の例を説明する。ベクトル復号部401は、ベクトル符号帳402に記憶されている複数の差分ベクトル符号の中から、LSP符号Cfに対応する差分ベクトル符号を探索し、その差分ベクトル符号に対応する候補差分ベクトルを復号差分ベクトル^Sfとして出力する(s401)。なお、復号差分ベクトル^Sfは前述のベクトル符号化部304が出力する量子化差分ベクトル^Sfに対応し、伝送誤りや符号化、復号の過程で誤り等がなければ、量子化差分ベクトル^Sfと同じ値となる。
<遅延入力部403>
遅延入力部403は、復号差分ベクトル^Sfを受け取り、復号差分ベクトル^Sfを保持し、1フレーム分遅らせて、前フレーム復号差分ベクトル^Sf-1として出力する(s403)。つまり、f番目のフレームの復号差分ベクトル^Sfに対して予測対応加算部405が処理を行っているときには、f-1番目のフレームの復号差分ベクトル^Sf-1を出力する。
<予測対応加算部405>
予測対応加算部405は、例えば、所定の係数αを記憶した記憶部405c、予測対応平均ベクトルVを記憶した記憶部405d、乗算部404、加算部405a及び405bを含んで構成される。
予測対応加算部405は、現在のフレームの復号差分ベクトル^Sf、及び、前フレーム復号差分ベクトル^Sf-1を受け取る。
予測対応加算部405は、復号差分ベクトル^Sfと、予測対応平均ベクトルV=(v[1],v[2],…,v[N])Tと、ベクトルα×^Sf-1とを加算したベクトルである復号予測対応LSPパラメータベクトル^Θf(=^Sf+V+α^Sf-1)=^θf[1],^θf[2],…,^θf[p]を生成して(s405)出力する。
乗算部404は、記憶部405cに記憶された所定の係数αを前フレーム復号差分ベクトル^Sf-1に乗じてベクトルα×^Sf-1を得る。
図12では、2つの加算部405a及び405bを用いて、まず、加算部405aにおいて、現在のフレームの復号差分ベクトル^Sfに、ベクトルα×^Sf-1を加算した後、加算部405bにおいて予測対応平均ベクトルVを加算しているが、この順序は逆であってもよい。あるいは、ベクトルα×^Sf-1と予測対応平均ベクトルVとを加算したベクトルを、復号差分ベクトル^Sfに加算することで復号予測対応LSPパラメータベクトル^Θfを生成してもよい。
なお、ここで用いる予測対応平均ベクトルVは、前述の線形予測係数符号化装置300の予測対応符号化部320で用いた予測対応平均ベクトルVと同じものとする。
<予測対応線形予測係数計算部406>
予測対応線形予測係数計算部406は、復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])を受け取り、復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])を復号予測対応線形予測係数^af[1],^af[2],…,^af[p]に変換して(s406)出力する。
<非予測対応復号部410>
非予測対応復号部410は、補正ベクトル符号帳412と補正ベクトル復号部411と非予測対応加算部413と指標計算部415とを含み、必要に応じて非予測対応線形予測係数計算部414も含む。指標計算部415は、第一実施形態の指標計算部205に対応する。
非予測対応復号部410には、補正LSP符号Dfと復号差分ベクトル^Sfと復号予測対応LSPパラメータベクトル^Θfとが入力される。非予測対応復号部410は、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得る。さらに、非予測対応復号部410は、復号補正ベクトル^Ufに、少なくとも復号差分ベクトル^Sfを加算して、現在のフレームのLSPパラメータの復号値からなる復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])を生成して(s410)出力する。ここで、復号差分ベクトル^Sfは、少なくとも過去のフレームからの予測を含む予測ベクトルである。非予測対応復号部410は、必要に応じて、さらに、復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])を復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]に変換して(s410)出力する。
以下、各部の処理内容を説明する。
<指標計算部415>
指標計算部415は、復号予測対応LSPパラメータベクトル^Θfを受け取り、復号予測対応LSPパラメータベクトル^Θf=(^θf[1],^θf[2],…,^θf[p])Tに対応するスペクトル包絡の山谷の大きさに対応する指標Q、すなわち、スペクトル包絡の山谷が大きいほど大きくなる指標Q、および/または、スペクトル包絡の山谷の小ささに対応する指標Q’、すなわち、スペクトル包絡の山谷が大きいほど小さくなる指標Q’、を計算する(s415)。指標計算部415は、指標Qおよび/またはQ’の大きさに応じて、補正ベクトル復号部411及び非予測対応加算部413に補正復号処理を実行する/しないことを示す制御信号C、または、所定のビット数で補正復号処理を実行することを示す制御信号Cを出力する。指標Q及びQ’は、指標計算部205で説明したものと同様であり、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]の代わりに復号予測対応LSPパラメータベクトル^Θfの各要素である復号予測対応LSPパラメータ^θf[1],^θf[2],…,^θf[p]を用いて、同様の方法で計算すればよい。
スペクトル包絡の山谷が所定の基準より大きい場合、すなわち、上記の例では(A-1)指標Qが所定の閾値Th1以上である場合、および/または、(B-1)指標Q’が所定の閾値Th1’以下である場合、指標計算部415は、非予測対応加算部413及び補正ベクトル復号部411に補正復号処理を実行することを示す制御信号Cを出力し、それ以外の場合に、非予測対応加算部413及び補正ベクトル復号部411に補正復号処理を実行しないことを示す制御信号Cを出力する。
また、(A-1)および/または(B-1)の場合に、指標計算部415は所定のビット数を表す正の整数(または正の整数を表す符号)を制御信号Cとして出力し、それ以外の場合に、0を制御信号Cとして出力する構成としてもよい。
なお、補正ベクトル復号部411および非予測対応加算部413において、制御信号Cを受け取ったときに、補正復号処理を実行することを識別する構成としている場合には、(A-1)および/または(B-1)以外の場合に、指標計算部415は制御信号Cを出力しない構成としてもよい。
<補正ベクトル符号帳412>
補正ベクトル符号帳412は、線形予測係数符号化装置300内の補正ベクトル符号帳313と同じ内容の情報を記憶している。つまり、補正ベクトル符号帳412には、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されている。
<補正ベクトル復号部411>
補正ベクトル復号部411は、補正LSP符号Dfと制御信号Cとを受け取る。補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、補正ベクトル復号部411は、補正LSP符号Dfを復号して復号補正ベクトル^Ufを得て(s411)出力する。例えば、補正ベクトル復号部411は、補正ベクトル符号帳412に記憶されている複数の補正ベクトル符号の中から、補正LSP符号Dfに対応する補正ベクトル符号を探索し、探索された補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして出力する。
補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、補正ベクトル復号部411は、補正LSP符号Dfの復号を行わず、復号補正ベクトル^Ufを得ず出力しない。
<非予測対応加算部413>
非予測対応加算部413は、例えば、非予測対応平均ベクトルY=(y[1],y[2],…,y[p])Tを記憶した記憶部413c、加算部413a及び413bを含んで構成される。
非予測対応加算部413は、制御信号Cと復号差分ベクトル^Sfとを受け取る。非予測対応加算部413は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、(A-1)および/または(B-1)の場合には、さらに復号補正ベクトル^Ufも受け取る。そして、非予測対応加算部413は、復号補正ベクトル^Ufと復号差分ベクトル^Sfと非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=^Uf+Y+^Sfを生成して(s413)出力する。なお、図10では、2つの加算部413a及び413bを用いて、まず、加算部413aにおいて復号補正ベクトル^Ufに復号差分ベクトル^Sfを加算した後、加算部413bにおいて記憶部413cに記憶された非予測対応平均ベクトルYを加算しているが、これらの加算の順序は逆であってもよい。あるいは、非予測対応平均ベクトルYと復号差分ベクトル^Sfを加算したベクトルを、復号補正ベクトル^Ufに加算することで復号非予測対応LSPパラメータベクトル^Φfを生成してもよい。
非予測対応加算部413は、補正ベクトル復号部411が補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合には、復号補正ベクトル^Ufを受け取らない。そして、非予測対応加算部413は、復号差分ベクトル^Sfと非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=Y+^Sfを生成して(s413)出力する。
<非予測対応線形予測係数計算部414>
非予測対応線形予測係数計算部414は、復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])を受け取り、復号非予測対応LSPパラメータベクトル^Φf=(^φf[1],^φf[2],…,^φf[p])を復号非予測対応線形予測係数^bf[1],^bf[2],…,^bf[p]に変換して(s414)出力する。
<第二実施形態の効果>
第二実施形態は、スペクトル包絡の山谷が大きい場合には非予測対応平均ベクトルYと復号差分ベクトル^Sfに補正LSP符号Dfを復号して得られる復号補正ベクトル^Ufを加えたものを復号非予測対応LSPパラメータベクトル^Φfとする構成である。このような構成により、第一実施形態と同様の、全体として符号量の増大を抑えつつ、スペクトルの山谷が大きいフレームについても線形予測係数に変換可能な係数を精度良く符号化及び復号する効果を得ることができる。
なお、例えば、補正ベクトル符号のビット長は、2bitであり、補正ベクトル符号帳313には、4種類の補正ベクトル符号(「00」「01」「10」「11」)に対応する4種類の候補補正ベクトルが格納されている。
<第二実施形態の変形例1>
第一実施形態の変形例1と同様の変形が可能である。
LSP符号CfまたはLSP符号Cfに対応する符号を第一符号ともいい、予測対応符号化部を第一符号化部ともいう。同様に、補正LSP符号Dfまたは補正LSP符号Dfに対応する符号を第二符号ともいい、非予測対応符号化部のうちの非予測対応減算部と補正ベクトル符号化部とによる処理部を第二符号化部ともいい、非予測対応符号化部のうちの予測対応加算部と指標計算部とによる処理部を指標計算部ともいう。また、復号予測対応LSPパラメータベクトル^Θfまたは復号予測対応LSPパラメータベクトル^Θfに対応するベクトルを第一復号ベクトルともいい、予測対応復号部を第一復号部ともいう。また、復号非予測対応LSPパラメータベクトル^Φfまたは復号非予測対応LSPパラメータベクトル^Φfに対応するベクトルを第二復号ベクトルともいい、非予測対応復号部のうちの補正ベクトル復号部と非予測対応加算部とによる処理部を第二復号部ともいう。
本実施形態では、「過去のフレーム」として1フレーム分のみを利用しているが、必要に応じて適宜、2フレーム分以上を利用してもよい。
<第三実施形態>
第二実施形態と異なる部分を中心に説明する。
補正ベクトル符号帳に格納されている候補補正ベクトルの数が多いことは、その分高い近似精度で符号化を行えることを意味する。そこで、本実施形態では、LSP符号の伝送誤りに起因する復号精度の低下の影響が大きいほど、より高い精度の補正ベクトル符号帳を用いて補正ベクトル符号化部及び補正ベクトル復号部を実行する。
<第三実施形態に係る線形予測係数符号化装置500>
図13は第三実施形態の線形予測係数符号化装置500の機能ブロック図を、図8はその処理フローの例を示す。
第三実施形態の線形予測係数符号化装置500は、非予測対応符号化部310に代えて、非予測対応符号化部510を含む。第二実施形態の線形予測係数符号化装置300と同様に、音響信号Xfに由来するLSPパラメータθが別の装置により生成されており、線形予測係数符号化装置500の入力がLSPパラメータθf[1],θf[2],…,θf[p]である場合には、線形予測係数符号化装置500は、線形予測分析部301とLSP計算部302とを含まなくてよい。
非予測対応符号化部510は、非予測対応減算部311と補正ベクトル符号化部512と補正ベクトル符号帳513A及び513Bと予測対応加算部314と指標計算部315とを含む。
第三実施形態の線形予測係数符号化装置500は、複数の補正ベクトル符号帳を備え、補正ベクトル符号化部512では、指標計算部515で計算された指標Qおよび/またはQ’に応じていずれか1つの補正ベクトル符号帳513A及び513Bを選択して符号化を行う点が第二実施形態と異なる。
以下では、二種類の補正ベクトル符号帳513A及び513Bを有する場合を例に説明する。
補正ベクトル符号帳513A及び513Bは、格納されている候補補正ベクトルの総数が異なる。候補補正ベクトルの総数が多いことは、対応する補正ベクトル符号のビット数が大きいことを意味する。逆に言えば、補正ベクトル符号のビット数を大きくすれば、より多くの候補補正ベクトルを用意することができる。例えば、補正ベクトル符号のビット数をAとすると最大2個の候補補正ベクトルを用意することができる。
以下では、補正ベクトル符号帳513Aの方が、補正ベクトル符号帳513Bよりも格納されている候補補正ベクトルの総数が多いものとして説明を行う。言い換えれば、補正ベクトル符号帳513Aに記憶されている符号の符号長(平均符号長)の方が、補正ベクトル符号帳513Bに記憶されている符号の符号長(平均符号長)よりも大きい。例えば、補正ベクトル符号帳513Aには符号長がAビットの補正ベクトル符号と候補補正ベクトルとの組が2個格納されており、補正ベクトル符号帳513Bには符号長がBビット(B<A)の補正ベクトル符号と候補補正ベクトルとの組が2個(2<2)格納されている。
なお、本実施形態では、第一実施形態の変形例2で説明したように、指標計算部は、制御信号Cに代えて指標Qおよび/または指標Q’を出力し、指標Qおよび/または指標Q’の大きさに応じて、補正ベクトル符号化部及び補正ベクトル復号部でそれぞれどのような符号化及び復号を行うかを判断する。非予測対応減算部311は、指標Qおよび/または指標Q’の大きさに応じて、減算処理を行うか否かを判断する。非予測対応加算部413は、指標Qおよび/または指標Q’の大きさに応じて、どのような加算処理を行うかを判断する。非予測対応減算部311及び非予測対応加算部413における判断は、上記の指標計算部315及び指標計算部415において説明したのと同じ判断である。
ただし、第二実施形態のように、指標計算部が、補正ベクトル符号化部及び補正ベクトル復号部でそれぞれどのような符号化及び復号を行うかの判断と、非予測対応減算部311が減算を行うか否かの判断と、非予測対応加算部413でどのような加算処理を行うかの判断と、を行い、その判断結果に対応する制御信号Cを出力する構成としてもよい。
<補正ベクトル符号化部512>
補正ベクトル符号化部512は、指標Qおよび/または指標Q’と補正ベクトルUfとを受け取る。補正ベクトル符号化部512は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、ビット数の多い(符号長が大きい)補正LSP符号Dfを得て(s512)出力する。例えば、所定の閾値Th2、および/または、所定の閾値Th2'を用いて、以下のように符号化を行う。なお、補正ベクトル符号化部512が符号化処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
(A-5)指標Qが所定の閾値Th2以上である場合、および/または、(B-5)指標Q’が所定の閾値Th2’以下である場合、補正LSP符号Dfのビット数として正の整数であるAが設定されるものとし、補正ベクトル符号化部512は、ビット数(符号長)Aの補正ベクトル符号と候補補正ベクトルとの組を2個記憶している補正ベクトル符号帳513Aを参照して、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s512)出力する。
(A-6)指標Qが所定の閾値Th2より小さく、かつ、所定の閾値Th1以上である場合、および/または、(B-6)指標Q’が所定の閾値Th2’より大きく、かつ、指標Q’が所定の閾値Th1’以下である場合、補正LSP符号Dfのビット数としてビット数A未満の正の整数であるBが設定されるものとし、補正ベクトル符号化部512は、ビット数(符号長)Bの補正ベクトル符号と候補補正ベクトルとの組を2個記憶している補正ベクトル符号帳513Bを参照して、補正ベクトルUfを符号化して補正LSP符号Dfを得て(s512)出力する。
(C-6)それ以外の場合、補正LSP符号Dfのビット数として0が設定されるものとし、補正ベクトル符号化部512は、補正ベクトルUfを符号化せず、補正LSP符号Dfを得ず出力しない。
よって、第三実施形態の補正ベクトル符号化部512は、指標計算部315で計算された指標Qが所定の閾値Th1より大きい場合、および/または、指標Q’が所定の閾値Th1’より小さい場合、に実行される。
<第三実施形態に係る線形予測係数復号装置600>
図14は第三実施形態に係る線形予測係数復号装置600の機能ブロック図を、図11はその処理フローの例を示す。
第三実施形態の線形予測係数復号装置600は、非予測対応復号部410に代えて、非予測対応復号部610を含む。
非予測対応復号部610は、非予測対応加算部413と補正ベクトル復号部611と補正ベクトル符号帳612A及び612Bと指標計算部415とを含み、必要に応じて復号非予測対応線形予測係数計算部414も含む。
第三実施形態の線形予測係数復号装置600は、複数の補正ベクトル符号帳を備え、補正ベクトル復号部611では、指標計算部415で計算された指標Qおよび/またはQ’に応じていずれか1つの補正ベクトル符号帳を選択して復号を行う点が第二実施形態の線形予測係数復号装置400と異なる。
以下では、二種類の補正ベクトル符号帳612A及び612Bを有する場合を例に説明する。
補正ベクトル符号帳612A及び612Bは、それぞれ線形予測係数符号化装置500の補正ベクトル符号帳513A及び513Bと共通の内容を記憶している。つまり、補正ベクトル符号帳612A及び612Bには、各候補補正ベクトルとその各候補補正ベクトルに対応する補正ベクトル符号とが記憶されており、補正ベクトル符号帳612Aに記憶されている符号の符号長(平均符号長)の方が、補正ベクトル符号帳612Bに記憶されている符号の符号長(平均符号長)よりも大きい。例えば、補正ベクトル符号帳612Aには符号長がAビットの補正ベクトル符号と候補補正ベクトルとの組が2個格納されており、補正ベクトル符号帳612Bには符号長がBビット(B<A)の補正ベクトル符号と候補補正ベクトルとの組が2個(2<2)格納されている。
<補正ベクトル復号部611>
補正ベクトル復号部611は、指標Qおよび/または指標Q’と補正LSP符号Dfとを受け取る。補正ベクトル復号部611は、(A-2)指標Qが大きいほど、および/または、(B-2)指標Q’が小さいほど、多くのビット数を有する補正LSP符号Dfを復号して、多くの候補補正ベクトルから復号補正ベクトル^Ufを得る(s611)。例えば、所定の閾値Th2、および/または、Th2'を用いて、以下のように復号を行う。なお、補正ベクトル復号部611が復号処理を実行するのは指標Qが所定の閾値Th1以上である場合、および/または、指標Q’が所定の閾値Th1'以下である場合であるので、Th2はTh1よりも大きな値であり、Th2'はTh1'よりも小さな値である。
(A-5)指標Qが所定の閾値Th2以上である場合、および/または、(B-5)指標Q’が所定の閾値Th2’以下である場合、補正LSP符号Dfのビット数として正の整数であるAが設定されるものとし、補正ベクトル復号部611は、ビット数(符号長)Aの補正ベクトル符号と候補補正ベクトルとの組を2個記憶している補正ベクトル符号帳612Aを参照して、補正LSP符号Dfと一致する補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして得て(s611)出力する。
(A-6)指標Qが所定の閾値Th2より小さく、かつ、所定の閾値Th1以上である場合、および/または、(B-6)指標Q’が所定の閾値Th2’より大きく、かつ、指標Q’が所定の閾値Th1’以下である場合、補正LSP符号Dfのビット数としてビット数A未満の正の整数であるBが設定されるものとし、補正ベクトル復号部611は、ビット数(符号長)Bの補正ベクトル符号と候補補正ベクトルとの組を2個記憶している補正ベクトル符号帳612Bを参照して、補正LSP符号Dfと一致する補正ベクトル符号に対応する候補補正ベクトルを復号補正ベクトル^Ufとして得て(s611)出力する。
(C-6)それ以外の場合、補正LSP符号Dfのビット数として0が設定されるものとし、補正ベクトル復号部611は、補正LSP符号Dfを復号せず、復号補正ベクトル^Ufを生成しない。
よって、第三実施形態の補正ベクトル復号部611は、指標計算部415で計算された指標Qが所定の閾値Th1より大きい場合、および/または、指標Q’が所定の閾値Th1’より小さい場合、に実行される。
<第三実施形態の効果>
このような構成により、第二実施形態と同様の効果を得ることができる。さらに、スペクトルの変動の大きさに応じて、線形予測係数に変換可能な係数の符号化の精度を変更することで、全体として符号量の増大を抑えつつ、より精度の高い符号化及び復号処理を行うことができる。
<第三実施形態の変形例1>
補正ベクトル符号帳の個数は、必ずしも2個でなくてもよく、3個以上であってもよい。補正ベクトル符号帳毎に異なるビット数(符号長)の補正ベクトル符号が記憶されており、その補正ベクトル符号に対応する補正ベクトルが記憶されている。補正ベクトル符号帳の個数に応じて、閾値を設定すればよい。指標Qに対する閾値は、閾値の値が大きくなるほど、その閾値以上の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。同様に、指標Q’に対する閾値は、閾値の値が小さくなるほど、その閾値以下の場合に用いられる補正ベクトル符号帳に記憶される補正ベクトル符号のビット数が大きくなるように設定すればよい。このような構成とすることで、全体として符号量の増大を抑えつつ、より精度の高い符号化及び復号処理を行うことができる。
<全実施形態の変形例1>
以上の第一〜第三実施形態において、図3の補正符号化部108と加算部109、図7、図13の非予測対応符号化部310、510で行われる処理(非予測対応符号化処理)、を実行する対象を、予測次数p未満の所定の次数TL以下のLSPパラメータ(低次のLSPパラメータ)のみとしてもよく、復号側でもこれらに対応する処理を行ってもよい。
まず、第一実施形態の符号化装置100と復号装置200に対する変形について説明する。
<補正符号化部108>
補正符号化部108は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、LSP符号化部63の量子化誤差のうちの低次の量子化誤差、すなわち、入力されたLSPパラメータθf[1],θf[2],…,θf[p]のうちのTL次以下のLSPパラメータである低次LSPパラメータθf[1],θf[2],…,θf[TL]と、入力された量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]のうちのTL次以下の量子化LSPパラメータである低次量子化LSPパラメータ^θf[1],^θf[2],…,^θf[TL]との各次の差分であるθf[1]-^θf[1],θf[2]-^θf[2],…,θf[TL]-^θf[TL]を符号化して補正LSP符号CL2fを得て出力する。また、補正符号化部108は、補正LSP符号CL2fに対応する低次量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[TL]を得て出力する。
補正符号化部108は、補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、θf[1]-^θf[1],θf[2]-^θf[2],…,θf[TL]-^θf[TL]の符号化を行わず、補正LSP符号CL2f、低次量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[TL]を出力しない。
<加算部109>
加算部109は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、TL次以下の各次については量子化LSPパラメータ^θf[1],^θf[2],…,^θf[TL]と量子化LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[TL]とを加算して得られる^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[TL]+^θdifff[TL]を係数変換部64で用いる量子化LSPパラメータ^θf[1],^θf[2],…,^θf[TL]とし、p次以下のTL次を超える各次については受け取った量子化LSPパラメータをそのまま係数変換部64で用いる量子化LSPパラメータ^θf[TL+1],^θf[TL+2],…,^θf[p]として出力する。
加算部109は、補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、受け取った量子化LSPパラメータ^θf[1],^θf[2],…,^θf[p]をそのまま係数変換部64に出力する。
<補正復号部206>
補正復号部206は、補正LSP符号CL2fを受け取り、補正LSP符号CL2fを復号して復号低次LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[TL]を得て出力する。
<加算部207>
加算部207は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]により求まるスペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合には、TL次以下の各次については復号LSPパラメータ^θf[1],^θf[2],…,^θf[TL]と復号LSPパラメータ差分値^θdifff[1],^θdifff[2],…,^θdifff[TL]とを加算して得られる^θf[1]+^θdifff[1],^θf[2]+^θdifff[2],…,^θf[TL]+^θdifff[TL]を係数変換部73で用いる復号LSPパラメータ^θf[1],^θf[2],…,^θf[TL]とし、p次以下のTL次を超える各次については受け取った復号LSPパラメータ^θf[TL+1],^θf[TL+2],…,^θf[p]をそのまま係数変換部73に出力する。
加算部207は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]により求まるスペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合に、受け取った復号LSPパラメータ^θf[1],^θf[2],…,^θf[p]をそのまま係数変換部73に出力する。
次に、第二実施形態と第三実施形態の線形予測係数符号化装置300、500と線形予測係数復号装置400、600に対する変形について説明する。
<非予測対応減算部311>
非予測対応減算部311は、補正符号化処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、すなわち上記の例では(A-1)および/または(B-1)の場合に、入力されたLSPパラメータベクトルΘf=(θf[1],θf[2],…,θf[p])TのうちのTL次以下のLSPパラメータからなる低次LSPパラメータベクトルΘ’f=(θf[1],θf[2],…,θf[TL])Tから、記憶部311cに記憶された非予測対応低次平均ベクトルY’=(y[1],y[2],…,y[TL])Tと、入力された量子化差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])TのうちのTL次以下の要素からなる低次量子化差分ベクトル^S’f=(^sf[1],^sf[2],…,^sf[TL])Tと、を減算したベクトルである低次補正ベクトルU’f=Θ’f-Y’-^S’fを生成して出力する。すなわち、非予測対応減算部311は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを生成して出力する。
ここで、非予測対応低次平均ベクトルY'=(y[1],y[2],…,y[TL])Tは、予め定めたベクトルであり、復号装置で用いる非予測対応平均ベクトルY=(y[1],y[2],…,y[p])TのうちのTL次以下の要素からなるベクトルである。
なお、LSP計算部302からLSPパラメータベクトルΘfのうちのTL次以下のLSPパラメータからなる低次LSPパラメータベクトルΘ’fを出力して、非予測対応減算部311に入力してもよい。また、ベクトル符号化部304から量子化差分ベクトル^SfのうちのTL次以下の要素からなる低次量子化差分ベクトル^S’fを出力して、非予測対応減算部311に入力してもよい。
非予測対応減算部311は、補正符号化処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合には、低次補正ベクトルU’fを生成しないでよい。
<補正ベクトル符号化部312,512>
補正ベクトル符号化部312及び512は、補正ベクトルUfの要素の一部からなるベクトルである低次補正ベクトルU’fを補正ベクトル符号帳313、513A、513Bを参照して符号化して補正LSP符号Dfを得て出力する。補正ベクトル符号帳313、513A、513Bに記憶しておく各候補補正ベクトルはTL次のベクトルとしておけばよい。
<補正ベクトル復号部411、611>
補正ベクトル復号部411、611は、補正LSP符号Dfを受け取り、補正ベクトル符号帳412、612A、612Bを参照して、補正LSP符号Dfを復号して復号低次補正ベクトル^U’fを得て出力する。復号低次補正ベクトル^U’f=(uf[1],uf[2],…,uf[TL])TはTL次のベクトルである。補正ベクトル符号帳412、612A、612Bに記憶しておく各候補補正ベクトルは、補正ベクトル符号帳313、513A、513Bと同様に、TL次のベクトルとしておけばよい。
<非予測対応加算部413>
非予測対応加算部413は、制御信号Cと復号差分ベクトル^Sf=(^sf[1],^sf[2],…,^sf[p])Tとを受け取る。
非予測対応加算部413は、補正復号処理を実行することを示す制御信号Cや、正の整数(または正の整数を表す符号)を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きい場合、(A-1)および/または(B-1)の場合には、さらに復号低次補正ベクトル^U’fも受け取る。そして、非予測対応加算部413は、TL次以下の各次については復号低次補正ベクトル^U’fと復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算し、p次以下のTL次を超える各次については復号差分ベクトル^Sfと非予測対応平均ベクトルYの要素を加算して得られる復号非予測対応LSPパラメータベクトル^Φfを生成して出力する。すなわち、復号非予測対応LSPパラメータベクトル^Φfは、^Φf=(uf[1]+y[1]+^sf[1],uf[2]+y[2]+^sf[2],…,uf[TL]+y[TL]+^sf[TL],y[TL+1]+^sf[TL+1],…,y[p]+^sf[p])である。
非予測対応加算部413は、補正復号処理を実行しないことを示す制御信号Cや、0を制御信号Cとして受け取った場合、要は、スペクトル包絡の山谷が所定の基準より大きくない場合、すなわち上記の例では(A-1)および/または(B-1)以外の場合には、復号低次補正ベクトル^U’fを受け取らない。そして、非予測対応加算部413は、復号差分ベクトル^Sfと非予測対応平均ベクトルYとを加算して得られる復号非予測対応LSPパラメータベクトル^Φf=Y+^Sfを生成して出力する。
これにより、低次LSPパラメータを優先して符号化歪を低減させることで、歪の増大を抑えつつ第一〜第三実施形態の方法よりも符号量の増大を抑えることができる。
<全実施形態の変形例2>
第一〜第三実施形態では、LSP計算部の入力を線形予測係数af[1],af[2],…,af[p]としていたが、例えば、線形予測係数の各係数af[i]にγのi乗を乗じた係数の系列af[1]×γ,af[2]×γ2,…,af[p]×γpをLSP計算部の入力としてもよい。
また、第一〜第三実施形態では符号化や復号の対象をLSPパラメータとしていたが、線形予測係数そのものやISPパラメータなどの線形予測係数に変換可能な係数であれば何れの係数を符号化や復号の対象としてもよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、
    (A-1)前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)前記スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、
    前記量子化誤差は、前記複数次のうちの低次の量子化誤差である、
    符号化装置。
  2. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、
    (A-1)前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)前記スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、
    前記第二符号化部は、(A-2)前記指標Qが大きいほど、および/または、(B-2)前記指標Q’が小さいほど、ビット数の多い前記第二符号を得る、
    符号化装置。
  3. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化部と、
    前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化部の量子化誤差を符号化して第二符号を得る第二符号化部とを含み、
    前記線形予測係数に変換可能な係数は、線スペクトル対のパラメータであり、
    前記指標Q’は、前記第一符号に対応する全次または低次の量子化済みの線スペクトル対のパラメータの隣り合うパラメータ間の差分と、最低次の量子化済みの線スペクトル対のパラメータと、のうちの最小値である、
    符号化装置。
  4. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、
    (A-1)前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)前記スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、
    前記量子化誤差は、前記複数次のうちの低次の量子化誤差である、
    符号化方法。
  5. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、
    (A-1)前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の大きさに対応する指標Qが所定の閾値Th1以上である場合、および/または、(B-1)前記スペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、
    前記第二符号化ステップは、(A-2)前記指標Qが大きいほど、および/または、(B-2)前記指標Q’が小さいほど、ビット数の多い前記第二符号を得る、
    符号化方法。
  6. 複数次の線形予測係数に変換可能な係数を符号化して第一符号を得る第一符号化ステップと、
    前記複数次の線形予測係数に変換可能な係数に対応するスペクトル包絡の山谷の小ささに対応する指標Q’が所定の閾値Th1’以下である場合、少なくとも前記第一符号化ステップの量子化誤差を符号化して第二符号を得る第二符号化ステップとを含み、
    前記線形予測係数に変換可能な係数は、線スペクトル対のパラメータであり、
    前記指標Q’は、前記第一符号に対応する全次または低次の量子化済みの線スペクトル対のパラメータの隣り合うパラメータ間の差分と、最低次の量子化済みの線スペクトル対のパラメータと、のうちの最小値である、
    符号化方法。
  7. 請求項4から請求項6の何れかの符号化方法をコンピュータに実行させるためのプログラム。
  8. 請求項4から請求項6の何れかの符号化方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2019040750A 2014-05-01 2019-03-06 符号化装置、及びその方法、プログラム、記録媒体 Active JP6668531B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014094759 2014-05-01
JP2014094759 2014-05-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018011731A Division JP6495492B2 (ja) 2014-05-01 2018-01-26 復号装置、及びその方法、プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2019113859A JP2019113859A (ja) 2019-07-11
JP6668531B2 true JP6668531B2 (ja) 2020-03-18

Family

ID=54358474

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2016515897A Active JP6301452B2 (ja) 2014-05-01 2015-03-16 符号化装置、及びその方法、プログラム、記録媒体
JP2018011731A Active JP6495492B2 (ja) 2014-05-01 2018-01-26 復号装置、及びその方法、プログラム、記録媒体
JP2019040751A Active JP6668532B2 (ja) 2014-05-01 2019-03-06 復号装置、及びその方法、プログラム、記録媒体
JP2019040750A Active JP6668531B2 (ja) 2014-05-01 2019-03-06 符号化装置、及びその方法、プログラム、記録媒体

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2016515897A Active JP6301452B2 (ja) 2014-05-01 2015-03-16 符号化装置、及びその方法、プログラム、記録媒体
JP2018011731A Active JP6495492B2 (ja) 2014-05-01 2018-01-26 復号装置、及びその方法、プログラム、記録媒体
JP2019040751A Active JP6668532B2 (ja) 2014-05-01 2019-03-06 復号装置、及びその方法、プログラム、記録媒体

Country Status (8)

Country Link
US (5) US10074376B2 (ja)
EP (4) EP3786949B1 (ja)
JP (4) JP6301452B2 (ja)
KR (3) KR101883823B1 (ja)
CN (4) CN110875047B (ja)
ES (4) ES2912595T3 (ja)
PL (4) PL3786949T3 (ja)
WO (1) WO2015166734A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102372369B1 (ko) 2021-04-02 2022-03-10 주식회사 강림퓨얼테크 친환경 가탄제 조성물

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06118998A (ja) * 1992-10-01 1994-04-28 Matsushita Electric Ind Co Ltd ベクトル量子化装置
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
US5913446A (en) 1994-06-21 1999-06-22 Von Holdt, Sr.; John W. Plastic bucket and lid
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP3283152B2 (ja) * 1995-02-27 2002-05-20 松下電器産業株式会社 音声パラメータ量子化装置およびベクトル量子化装置
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
EP0921491A1 (en) * 1997-12-05 1999-06-09 Datalogic S.P.A. Method of estimating the mid-points of bar code elements"
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US7167828B2 (en) * 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
JP3590342B2 (ja) * 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP3806344B2 (ja) * 2000-11-30 2006-08-09 松下電器産業株式会社 定常雑音区間検出装置及び定常雑音区間検出方法
KR100910282B1 (ko) * 2000-11-30 2009-08-03 파나소닉 주식회사 Lpc 파라미터의 벡터 양자화 장치, lpc 파라미터복호화 장치, 기록 매체, 음성 부호화 장치, 음성 복호화장치, 음성 신호 송신 장치, 및 음성 신호 수신 장치
US6947551B2 (en) * 2001-03-26 2005-09-20 Tellabs Operations, Inc. Apparatus and method of time delay estimation
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3472279B2 (ja) * 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
DE10133945A1 (de) * 2001-07-17 2003-02-06 Bosch Gmbh Robert Verfahren und Vorrichtung zum Austausch und zur Verarbeitung von Daten
US8442276B2 (en) * 2006-03-03 2013-05-14 Honeywell International Inc. Invariant radial iris segmentation
BRPI0510303A (pt) * 2004-04-27 2007-10-02 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método
RU2404506C2 (ru) * 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
KR20060067016A (ko) * 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
CN101273404B (zh) * 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
AU2007318506B2 (en) * 2006-11-10 2012-03-08 Iii Holdings 12, Llc Parameter decoding device, parameter encoding device, and parameter decoding method
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5006774B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
WO2009075326A1 (ja) * 2007-12-11 2009-06-18 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
ES2629453T3 (es) * 2007-12-21 2017-08-09 Iii Holdings 12, Llc Codificador, descodificador y procedimiento de codificación
JP5013293B2 (ja) * 2008-02-29 2012-08-29 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体
JP5038995B2 (ja) * 2008-08-25 2012-10-03 株式会社東芝 声質変換装置及び方法、音声合成装置及び方法
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
FR2943875A1 (fr) * 2009-03-31 2010-10-01 France Telecom Procede et dispositif de classification du bruit de fond contenu dans un signal audio.
CN102422540B (zh) * 2009-05-20 2015-08-26 日本电信电话株式会社 编码方法、编码装置、解码方法、解码装置、程序以及记录介质
EP2511904A4 (en) * 2009-12-10 2013-08-21 Lg Electronics Inc METHOD AND APPARATUS FOR ENCODING A SPEECH SIGNAL
CN102959871B (zh) * 2010-07-05 2016-09-21 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置、程序及记录介质
RU2571561C2 (ru) * 2011-04-05 2015-12-20 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
JP5663461B2 (ja) * 2011-12-06 2015-02-04 日本電信電話株式会社 符号化方法、符号化装置、プログラム、記録媒体
CN103093757B (zh) * 2012-01-17 2014-10-29 大连理工大学 一种窄带码流转换为宽带码流的转换方法
EP2887349B1 (en) * 2012-10-01 2017-11-15 Nippon Telegraph and Telephone Corporation Coding method, coding device, program, and recording medium
CN103325375B (zh) * 2013-06-05 2016-05-04 上海交通大学 一种极低码率语音编解码设备及编解码方法

Also Published As

Publication number Publication date
PL3139383T3 (pl) 2020-03-31
CN106463137B (zh) 2019-12-10
PL3594945T3 (pl) 2021-05-04
JP2019113859A (ja) 2019-07-11
EP3594945B1 (en) 2020-11-04
US10074376B2 (en) 2018-09-11
ES2761681T3 (es) 2020-05-20
PL3594946T3 (pl) 2021-03-08
EP3139383A1 (en) 2017-03-08
US10529350B2 (en) 2020-01-07
US20200090673A1 (en) 2020-03-19
JP2018063457A (ja) 2018-04-19
EP3594946A1 (en) 2020-01-15
US20190287545A1 (en) 2019-09-19
JP6301452B2 (ja) 2018-03-28
JPWO2015166734A1 (ja) 2017-04-20
JP2019109542A (ja) 2019-07-04
EP3139383B1 (en) 2019-09-25
KR20180058846A (ko) 2018-06-01
JP6495492B2 (ja) 2019-04-03
CN110534122B (zh) 2022-10-21
EP3139383A4 (en) 2017-10-11
CN110875048A (zh) 2020-03-10
PL3786949T3 (pl) 2022-05-02
US20180330741A1 (en) 2018-11-15
EP3594945A1 (en) 2020-01-15
CN110875048B (zh) 2023-06-09
KR20160138558A (ko) 2016-12-05
EP3594946B1 (en) 2020-10-28
KR101860888B1 (ko) 2018-05-28
CN110875047B (zh) 2023-06-09
ES2843300T3 (es) 2021-07-16
CN110875047A (zh) 2020-03-10
KR20180059561A (ko) 2018-06-04
US10381015B2 (en) 2019-08-13
KR101883817B1 (ko) 2018-07-31
WO2015166734A1 (ja) 2015-11-05
CN106463137A (zh) 2017-02-22
US10811021B2 (en) 2020-10-20
ES2840349T3 (es) 2021-07-06
US20190304476A1 (en) 2019-10-03
EP3786949A1 (en) 2021-03-03
US10553229B2 (en) 2020-02-04
EP3786949B1 (en) 2022-02-16
JP6668532B2 (ja) 2020-03-18
KR101883823B1 (ko) 2018-08-01
CN110534122A (zh) 2019-12-03
US20170047075A1 (en) 2017-02-16
ES2912595T3 (es) 2022-05-26

Similar Documents

Publication Publication Date Title
JP6490846B2 (ja) 復号装置、及びその方法、プログラム、記録媒体
JP6668531B2 (ja) 符号化装置、及びその方法、プログラム、記録媒体
JP5663461B2 (ja) 符号化方法、符号化装置、プログラム、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200226

R150 Certificate of patent or registration of utility model

Ref document number: 6668531

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150