JP6122961B2 - 自己相関ドメインにおけるacelpを用いたスピーチ信号の符号化装置 - Google Patents

自己相関ドメインにおけるacelpを用いたスピーチ信号の符号化装置 Download PDF

Info

Publication number
JP6122961B2
JP6122961B2 JP2015534940A JP2015534940A JP6122961B2 JP 6122961 B2 JP6122961 B2 JP 6122961B2 JP 2015534940 A JP2015534940 A JP 2015534940A JP 2015534940 A JP2015534940 A JP 2015534940A JP 6122961 B2 JP6122961 B2 JP 6122961B2
Authority
JP
Japan
Prior art keywords
matrix
autocorrelation matrix
determining
codebook vector
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015534940A
Other languages
English (en)
Other versions
JP2015532456A5 (ja
JP2015532456A (ja
Inventor
ベックストレム,トム
ムルトルス,マルクス
フッハス,ギローム
ヘルムリッヒ,クリスチャン
ディーツ,マルチン
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2015532456A publication Critical patent/JP2015532456A/ja
Publication of JP2015532456A5 publication Critical patent/JP2015532456A5/ja
Application granted granted Critical
Publication of JP6122961B2 publication Critical patent/JP6122961B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、オーディオ信号符号化に関し、特に、自己相関(autocorrelation)ドメインにおけるACELPを用いたスピーチ信号の符号化装置に関する。
CELP(Code Excited Linear Prediction:符号励振線形予測)によるスピーチ符号化において、スピーチ信号のスペクトル包絡(又は等価的に短時間の時間構造)は線形予測(LP)モデルによって表され、予測残余は長時間予測子(LTP,適応型コードブックとしても知られている)によってモデル化され、残余信号はコードブック(固定コードブックとしても知られている)によって表現される。後者、つまり固定コードブックは、一般に代数コードブックとして適用され、ここではそのコードブックが代数公式又はアルゴリズムによって表現されるため、そのアルゴリズムを除いて全体のコードブックを記憶しておく必要がない。また同時に、速やかな探索アルゴリズムを可能にする。残余に対して代数コードブックを適用するCELPコーデックは、代数符号励振線形予測(ACELP)コーデック(非特許文献1、2、3、4を参照)として知られている。
スピーチ符号化において、代数残余コードブックを用いることは、例えば非特許文献17、13、18のように、主流のコーデックの中で選択された一手法と言える。ACELPは、線形予測(LP)フィルタによるスペクトル包絡のモデリングと、長時間予測子(LTP)による音声の基本周波数のモデリングと、代数コードブックによる予測残余のモデリングとに基づいている。LTPと代数コードブックパラメータは、ある知覚ドメインにおいて最小二乗アルゴリズムによって最適化され、その知覚ドメインはあるフィルタによって規定される。
ACELP型アルゴリズムの演算的に最も複雑な部分つまりボトルネックは、残余コードブックの最適化である。現在知られている唯一の最適なアルゴリズムは、各サブフレームについてサイズNpのスペースの全数探索(exhaustive search)であろう。そこでは、全てのポイントで
Figure 0006122961
の複雑性の評価が求められる。代表的な値はP=8パルスを持つサブフレーム長さN=64(すなわち、5ms)であるから、このことは毎秒当り1020回以上の演算を意味している。明らかに、このことは実行可能な選択肢ではない。ハードウエアの条件によって設定される複雑性の制限内に止めるために、コードブックの最適化手法は、非最適な反復的アルゴリズムで作動する必要がある。最適化プロセスへの多数のそのようなアルゴリズム及び改善が、例えば非特許文献17、19、20、21、22等によって過去に提案されてきた。
明らかに、ACELP最適化は、線形予測モデルの出力としてスピーチ信号x(n)を記述することに基づいており、その場合、推定されたスピーチ信号は、
Figure 0006122961
となり、ここで、a(k)はLP係数であり、
Figure 0006122961
は残余信号である。ベクトル形式では、この式は以下のように表すことができる。
Figure 0006122961
ここで、行列Hは対角要素h(0)と下対角要素h(1),...,h(39)とを持つ下三角のテプリッツ畳み込み行列(lower triangular Toeplitz convolution matrix)として定義され、ベクトルh(k)はLPモデルのインパルス応答である。この表記法では、知覚モデル(通常は重み付きLPモデルと対応している)は省略されている点に注意すべきであるが、知覚モデルはインパルス応答h(k)内に含まれていると考えられる。この省略により、一般的な結果に影響を及ぼすことなく、表記を簡素化できる。この知覚モデルの包含は非特許文献1内で適用されている。
モデルの適合性は二乗誤差によって測定される。すなわち、
Figure 0006122961
この二乗誤差は最適なモデルパラメータを発見するために使用される。ここで、LTPとパルスコードブックは共にベクトルeをモデル化するために使用されると考えられる。実際の適用は、対応する文献(非特許文献1〜4参照)の中で見ることができる。
実際のところ、上述の適合性の尺度は以下のように簡略化され得る。行列B=HTHがh(n)の相関を含み、ckがk番目の固定コードブックベクトルであり、
Figure 0006122961
と設定する。ここで、gはゲインファクタである。gが最適に選択されると仮定すると、コードブックは次式の探索基準を最大化することによって、探索される。
Figure 0006122961
ここで、d = HTxは目標ベクトルとインパルス応答h(n)との間の相関を含むベクトルであり、上付き文字Tは転置を示す。ベクトルdと行列Bはコードブック探索の前に計算される。この公式は、LTPとパルスコードブックの両方の最適化において共通に使用される。
上記公式の使用を最適化するにあたり、多くの研究がなされてきた。例えば、
1)探索アルゴリズムによって実際にアクセスされる行列Bの要素だけが計算される。又は、
2)パルス探索の試行錯誤アルゴリズムは、以前の予備選別(例えば非特許文献1、5参照)に基づいて、高い成功確率を持つコードブックベクトルだけを試すように、削減される。
ACELPアルゴリズムの実際の詳細は、ゼロインパルス応答(ZIR)の概念に関連している。この概念は、合成された残余に対比してオリジナル領域の合成信号を考慮するときに現れる。残余はフレーム又はサブフレームサイズに対応したブロック内に符号化される。しかし、式1のLPモデルを用いてオリジナル領域信号を合成する際に、固定長の残余は、LPフィルタのインパルス応答に対応した無限長の「テール」を持つであろう。すなわち、残余コードブックベクトルは有限長であるが、現在のフレーム又はサブフレームをはるかに超えて、合成信号に影響を及ぼすであろう。1つのフレームの将来に対する影響は、コードブックベクトルをゼロで拡張し、この拡張信号について式1の合成出力を計算することによって、計算され得る。合成された信号のこの拡張は、ゼロインパルス応答として知られている。次に、現在のフレームを符号化する際に以前のフレームの影響を考慮するために、以前のフレームのZIRが現在のフレームの目標値から減算される。よって、現在のフレームを符号化する際、その信号の、以前のフレームによって既にモデル化されていなかった部分だけが考慮される。
実際上、ZIRは次のようにして考慮される。(サブ)フレームN−1の符号化が完了したとき、量子化された残余は次の(サブ)フレームNの長さまでゼロで拡張されている。拡張された量子化済み残余はLPによってフィルタリングされ、量子化済み信号のZIRが取得される。量子化済み信号のZIRは、次にオリジナル(量子化されていない)信号から減算され、この修正済み信号が(サブ)フレームNを符号化する際に目標信号を形成する。このようにして、(サブ)フレームN−1内に形成された全ての量子化誤差は、(サブ)フレームNを量子化する際に考慮されるであろう。このやり方は、出力信号の知覚的品質をかなり改善できる。
しかしながら、オーディオ符号化にとってさらに改善された概念が提供されるならば、一層望ましい。
[1] Salami, R. and Laflamme, C. and Bessette, B. and Adoul, J.P., "ITU-T G. 729 Annex A: reduced complexity 8 kb/s CS-ACELP codec for digital simultaneous voice and data", Communications Magazine, IEEE, vol 35, no 9, pp 56-63, 1997. [2] 3GPP TS 26.190 V7.0.0 , "Adaptive Multi-Rate (AMR-WB) speech codec", 2007. [3] ITU-T G.718, "Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s", 2008. [4] Schroeder, M. and Atal, B., "Code-excited linear prediction (CELP): High-quality speech at very low bit rates", Acoustics, Speech, and Signal Processing, IEEE Int Conf, pp 937-940, 1985. [5] Byun, K.J. and Jung, H.B. and Hahn, M. and Kim, K.S., "A fast ACELP codebook search method", Signal Processing, 2002 6th International Conference on, vol 1, pp 422-425, 2002. [6] G. H. Golub and C. F. van Loan, "Matrix Computations", 3rd Edition, John Hopkins University Press, 1996. [7] Boley, D.L. and Luk, F.T. and Vandevoorde, D., "Vandermonde factorization of a Hankel matrix", Scientific computing, pp 27-39, 1997. [8] Baeckstroem, T. and Magi, C., "Properties of line spectrum pair polynomials - A review", Signal processing, vol. 86, no. 11, pp. 3286-3298, 2006. [9] A. Haermae, M. Karjalainen, L. Savioja, V. Vaelimaeki, U. Laine, and J. Huopaniemi, "Frequencywarped signal processing for audio applications," J. Audio Eng. Soc, vol. 48, no. 11, pp. 1011-1031, 2000. [10] T. Laakso, V. Vaelimaeki, M. Karjalainen, and U. Laine, "Splitting the unit delay [FIR/all pass filters design]," IEEE Signal Process. Mag.,vol. 13, no. 1, pp. 30-60, 1996. [11] J. Smith III and J. Abel, "Bark and ERB bilinear transforms," IEEE Trans. Speech Audio Process., vol. 7, no. 6, pp. 697-708, 1999. [12] R. Schappelle, "The inverse of the confluent Vandermonde matrix," IEEE Trans. Autom. Control, vol. 17, no. 5, pp. 724-725, 1972. [13] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Jarvinen, "The adaptive multirate wideband speech codec (AMR-WB)," Speech and Audio Processing, IEEE Transactions on, vol. 10, no. 8, pp. 620-636, 2002. [14] M. Bosi and R. E. Goldberg, Introduction to Digital Audio Coding and Standards. Dordrecht, The Netherlands: Kluwer Academic Publishers, 2003. [15] B. Edler, S. Disch, S. Bayer, G. Fuchs, and R. Geiger, "A time-warped MDCT approach to speech transform coding," in Proc 126th AES Convention, Munich, Germany, May 2009. [16] J. Makhoul, "Linear prediction: A tutorial review," Proc. IEEE, vol. 63, no. 4, pp. 561-580, April 1975. [17] J.-P. Adoul, P. Mabilleau, M. Delprat, and S. Morissette, "Fast CELP coding based on algebraic codes," in Acoustics, Speech, and Signal Processing, IEEE Int Conf (ICASSP’87), April 1987, pp. 1957-1960. [18] ISO/IEC 23003-3:2012, "MPEG-D (MPEG audio technologies), Part 3: Unified speech and audio coding," 2012. [19] F.-K. Chen and J.-F. Yang, "Maximum-take-precedence ACELP: a low complexity search method," in Acoustics, Speech, and Signal Processing, 2001. Proceedings.(ICASSP’01). 2001 IEEE International Conference on, vol. 2. IEEE, 2001, pp. 693-696. [20] R. P. Kumar, "High computational performance in code exited linear prediction speech model using faster codebook search techniques," in Proceedings of the International Conference on Computing: Theory and Applications. IEEE Computer Society, 2007, pp. 458-462. [21] N. K. Ha, "A fast search method of algebraic codebook by reordering search sequence," in Acoustics, Speech, and Signal Processing, 1999. Proceedings., 1999 IEEE International Conference on, vol. 1. IEEE, 1999, pp. 21-24. [22] M. A. Ramirez and M. Gerken, "Efficient algebraic multipulse search," in Telecommunications Symposium, 1998. ITS’98 Proceedings. SBT/IEEE International. IEEE, 1998, pp. 231-236. [23] ITU-T Recommendation G.191, "Software tool library 2009 user’s manual," 2009. [24] ITU-T Recommendation P.863, "Perceptual objective listening quality assessment," 2011. [25] T. Thiede, W. Treurniet, R. Bitto, C. Schmidmer, T. Sporer, J. Beerends, C. Colomes, M. Keyhl, G. Stoll, K. Brandeburg et al., "PEAQ - the ITU standard for objective measurement of perceived audio quality," Journal of the Audio Engineering Society, vol. 48, 2012. [26] ITU-R Recommendation BS.1534-1, "Method for the subjective assessment of intermediate quality level of coding systems," 2003.
本発明の目的は、オーディオオブジェクト符号化についてそのような改善された概念を提供することである。
本発明の目的は、請求項1に係る装置と、請求項15に係る方法と、請求項16に係る復号器と、請求項17に係る復号化方法と、請求項18に係るシステムと、請求項19に係る方法と、請求項20に係るコンピュータプログラムとによって達成される。
スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する装置が提供される。この装置は、自己相関行列Rを決定する行列決定部と、自己相関行列Rに依存してコードブックベクトルを決定するコードブックベクトル決定部とを含む。行列決定部は、ベクトルrのベクトル係数を決定することによって、自己相関行列Rを決定するよう構成され、自己相関行列Rは複数の行と複数の列とを含み、ベクトルrは自己相関行列Rの列の1つ又は行の1つを示し、R(i , j) = r(|i− j|)であり、R(i , j)は自己相関行列Rの係数を示し、iは自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは自己相関行列Rの複数の列の1つを示す第2インデックスである。
この装置は、スピーチ信号を符号化するためにコードブックベクトルを使用するよう構成されている。例えば、この装置は符号化済みスピーチ信号を生成することができ、この符号化済みスピーチ信号は、複数の線形予測係数と、有声音の基本周波数の指示(例えばピッチパラメータ)と、コードブックベクトルの指示、例えばコードブックベクトルのインデックスとを含む。
さらに、上述の実施形態に従う装置によって符号化された符号化済みスピーチ信号を復号化して復号化済みスピーチ信号を得る復号器が提供される。
さらに、あるシステムが提供される。このシステムは、上述の実施形態に従い入力スピーチ信号を符号化して符号化済みスピーチ信号を得る装置を含む。さらに、このシステムは、上述の実施形態に従い符号化済みスピーチ信号を復号化して復号化済みスピーチ信号を得る復号器を含む。
スピーチ符号化アルゴリズムACELPの目的関数についての改善された概念が提供され、そこでは、現在のフレームのパラメータを最適化するに際し、以前のフレームのインパルス応答の現在のフレームに対する影響だけでなく、現在のフレームのインパルス応答の次のフレームに対する効果をも考慮に入れる。幾つかの実施形態が、相関行列を変更することによって、このような改善を達成でき、その相関行列は自己相関行列への従来のACELP最適化の中核にあり、エルミート・テプリッツ構造(Hermitian Toeplitz structure)を有する。この構造を用いることにより、演算上の複雑さとメモリ要求の観点からみてACELP最適化をさらに効率化することができる。同時に、適用される知覚モデルはさらに一貫性がよくなり、フレーム間依存性が回避され得るので、パケットロスの影響下での性能を改善できる。
ACELP方式を用いたスピーチ符号化は、知覚ドメインでの最小二乗アルゴリズムに基づいており、その知覚ドメインはフィルタによって特定される。本発明の実施形態によれば、最小二乗問題の従来の定義の演算上の複雑さは、ゼロインパルス応答の次のフレームへの影響を考慮することで軽減され得る。提案の修正法では、目的関数の中で現れる相関行列にテプリッツ構造を導入し、その目的関数とは構造を簡素化し演算量を削減するものである。提案の概念は、知覚的品質を低下させずに17%まで演算上の複雑さを低減できる。
本発明の実施形態は、目的関数のわずかな修正によって、残余コードブックの最適化における演算量をさらに削減できるという知見に基づいている。この演算量の削減は、知覚的品質における低下を招かずに達成される。代替法として、ACELP残余最適化は反復的な探索アルゴリズムに基づいていることから、提案の修正法を用いて、演算量を増加させずに反復回数を増加させることが可能となり、この方法によって改善された知覚的品質を得ることも可能になる。
既存、及び修正された目的関数は、知覚をモデル化し、知覚歪みを最小化するよう努めるものである。しかし、従来の手法に対する最適解は修正された目的関数に関して必ずしも最適ではなく、逆もまた然りである。このことだけで、1つの手法が他の手法より優れていることを意味するものではないが、分析的な議論によると、修正された目的関数の方が一層一貫性を有することが示されている。具体的には、従来の目的関数とは対照的に、提案の概念は、1つのサブフレーム内の全てのサンプルを、一貫しかつ良好に定義された知覚的及び信号モデルを用いて、同等に取り扱う。
いくつかの実施形態において、提案の修正法は、残余コードブックの最適化だけを変更するように適用可能である。したがって、この方法はビットストリーム構造を変更せず、既存のACELPコーデックに対する後方互換性をもって適用可能である。
さらに、スピーチ符号化アルゴリズムのコードブックベクトルを決定することにより、スピーチ信号を符号化する方法が提案される。この方法は、
−自己相関行列Rを決定するステップと、
−自己相関行列Rに依存してコードブックベクトルを決定するステップと、を含む。
自己相関行列Rを決定するステップは、ベクトルrのベクトル係数を決定するステップを含む。自己相関行列Rは複数の行と複数の列とを含む。ベクトルrは自己相関行列Rの前記列の1つ又は前記行の1つを示し、ここで
R(i , j) = r(|i− j|)
である。
R(i,j)は自己相関行列Rの係数を示し、iは自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは自己相関行列Rの複数の列の1つを示す第2インデックスである。
さらに、上述の実施形態に従ってスピーチ信号を符号化する方法に従って符号化された符号化済みスピーチ信号を復号化し、復号化済みスピーチ信号を得る方法が提案される。
さらに、次の方法が提案される。この方法は、
−スピーチ信号を符号化する上述の方法に従って入力スピーチ信号を符号化し、符号化済みスピーチ信号を得るステップと、
−スピーチ信号を復号化する上述の方法に従って符号化済みスピーチ信号を復号化して復号化済みスピーチ信号を得るステップと、を含む。
さらに、コンピュータ又は信号プロセッサ上で実行されたとき、上述の方法を実行するためのコンピュータプログラムが提供される。
好適な実施形態は従属項において提供される。
以下に、本発明の好ましい実施形態について図面を参照しながら説明する。
一実施形態に従い、スピーチ符号化アルゴリズムのコードブックベクトルを決定することにより、スピーチ信号を符号化する装置を示す。 一実施形態に従う復号器を示す。 一実施形態に従ってスピーチ信号を符号化する装置と復号器とを含むシステムを示す。
図1は、一実施形態に従いスピーチ符号化アルゴリズムのコードブックベクトルを決定することにより、スピーチ信号を符号化する装置を示す。
この装置は、自己相関行列Rを決定するための行列決定部(110)と、自己相関行列Rに依存してコードブックベクトルを決定するためのコードブックベクトル決定部(120)とを備えている。
行列決定部(110)は、ベクトルrのベクトル係数を決定することにより、自己相関行列Rを決定するよう構成されている。
自己相関行列Rは複数の行と複数の縦列とを含み、ベクトルrは自己相関行列Rの列の1つと行の1つとを示し、R(i , j) = r(|i− j|)である。
R(i,j)は自己相関行列Rの係数を示し、iは自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは自己相関行列Rの複数の列の1つを示す第2インデックスである。
この装置は、スピーチ信号を符号化するためにコードブックベクトルを使用するよう構成されている。例えば、この装置は符号化済みスピーチ信号を生成することができ、この符号化済みスピーチ信号は、複数の線形予測係数と、有声音の基本周波数の指示(例えばピッチパラメータ)と、コードブックベクトルの指示とを含む。
例えば、スピーチ信号を符号化する特定の実施形態によれば、本装置は、スピーチ信号に依存して複数の線形予測係数(a(k))を決定するよう構成されてもよい。さらに、本装置は、複数の線形予測係数(a(k))に依存して残余信号を決定するよう構成される。さらに加えて、行列決定部110は、残余信号に依存して自己相関行列Rを決定するよう構成されてもよい。
以下では、本願発明の幾つかのさらなる実施形態について説明する。
式3と式4とに戻って、式3は次のように知覚モデルの適合性を示す二乗誤差を定義しており、
Figure 0006122961
式4は最大化されるべき探索基準を示している。
Figure 0006122961
ACELPアルゴリズムは、式4に中心を合わせたものであり、一方、式4は式3に基づいている。
幾つかの実施形態は、これら式の分析により、量子化された残余値e(k)が、インデックスkに依存して誤差エネルギーε2に対して非常に異なる効果を持つことが明らかである、という知見に基づいている。例えば、インデックスk=1及びk=Nの場合を考慮した場合、もし残余コードブックの唯一の非ゼロ値がk=1のときに現れたならば、次に誤差エネルギーε2は次式のようになり、
Figure 0006122961
一方、k=Nの場合には、誤差エネルギーε2は次式のようになる。
Figure 0006122961
換言すれば、e(1)は範囲1〜Nのインパルス応答h(k)で重み付けられ、一方e(N)はh(1)だけで重み付けられる。スペクトル重みの点からみれば、このことは、極端な場合にはe(N)が線形的に重み付けられるように、各e(k)が異なるスペクトル重み関数で重み付けられることを意味している。知覚的モデリングの観点からみれば、1つのフレームの中の全てのサンプルに対して同じ知覚的重みを適用することは、有意義であろう。よって、式3はZIRを次のフレームの中へと考慮するように拡張されるべきである。ここで、特に、先行技術との違いは、前のフレームからのZIRと次のフレーム内へのZIRとの両方が考慮されるという点に注目すべきである。
e(k)をオリジナルの量子化されていない残余とし、
Figure 0006122961
を量子化された残余と仮定する。さらに、両方の残余を1〜Nの範囲内で非ゼロとし、その他の範囲ではゼロと仮定する。そこで、次式となる。
Figure 0006122961
同様に、同じ関係式を行列形式で次のように表すことができる。
Figure 0006122961
ここで、
Figure 0006122961
はインパルス応答h(k)に対応した無限次元の畳み込み行列である。これを式3に代入すると、
Figure 0006122961
となり、ここで
Figure 0006122961
はh(n)の自己相関に対応した有限サイズのエルミート・テプリッツ行列である。式4についても同様の導出により、次の目的関数が得られる。
Figure 0006122961
この目的関数は、式4と非常に似ている。主たる相違は、相関行列Bに代えてエルミート・テプリッツ行列Rを分母に用いた点である。
上述の通り、この新規な公式化は、1つのフレーム内の残余eの全てのサンプルが同じ知覚的重み付けを受けることになる、という利点を有する。しかしながら、重要なことは、この公式化は演算上の複雑さと共にメモリ要求についても、かなりの利点をもたらすことである。Rはエルミート・テプリッツ行列であるから、第1列r(0)...r(N−1)はこの行列を完全に定義している。換言すれば、完全なN×Nの行列を記憶する代わりに、N×1のベクトルr(k)を記憶するだけで十分であるから、メモリ割り当てにおいてかなりの節約になるということである。さらに、全てのN×N要素を決定する必要がないだけでなく、第1のN×1列を決定するだけでよいので、演算上の複雑さも同様に低減される。また、要素(i,j)がR(i , j) = r(|i− j|)によって発見できるので、その行列内での指標付けも簡易になる。
式10における目的関数が式4と非常に類似しているので、一般のACELPの構造は維持され得る。特に、以下の如何なる演算もいずれかの目的関数を用いて、アルゴリズムのわずかな修正だけで実行できる。
1.LTP遅れ(適応型コードブック)の最適化
2.残余のモデル化のためのパルスコードブック(固定されたコードブック)の最適化
3.個別的又は連帯的な、LTPとパルスのゲインの最適化
4.性能が式3の二乗誤差によって測定される他のパラメータの最適化
従来のACELPアプリケーションにおいて修正されるべき唯一の部分は、行列Rで置き換えられる相関行列Bと、次のフレームへZIRを包含させなければならない目標値との取り扱いである。
幾つかの実施例では、相関行列BがACELPアルゴリズム内のどの箇所に表れるかに拘わらず、相関行列Bを自己相関行列Rによって置き換えることにより、本発明の概念を利用する。行列Bの全ての出現が無くなれば、その値を計算することが回避され得る。
例えば、自己相関行列Rは、自己相関行列Rの第1列r(0), .., r(N-1)の係数を決定することによって、決定される。
行列Rは式9においてR=HTHによって定義される。従って、その要素Rij=r(i−j)は次式によって計算され得る。
Figure 0006122961
すなわち、系列r(k)はh(k)の自己相関である。
しかしながら、r(k)は、さらに効率的な手段によって取得され得る場合も多い。特に、AMRやG.718などのスピーチ符号化標準では、系列h(k)は、プリエンファシスを含めるべく用いられる知覚的重み関数W(z)によってフィルタリングされた線形予測フィルタA(z)のインパルス応答である。換言すれば、h(k)は線形予測モデルの知覚的に重み付けられたインパルス応答を示している。
フィルタA(z)は、通常、スピーチ信号rX(k)の自己相関から推定され、ここで、rX(k)は既知である。H(z)=A-1(u)W(z)であるから、自己相関系列r(k)は次式によりw(k)の自己相関を計算することによって決定され得る。
Figure 0006122961
そのため、h(k)の自己相関は次式のようになる。
Figure 0006122961
幾つかの実施例では、これら式は全体システムの設計に依存して修正されてもよい。
次に、コードブックのコードブックベクトルは、例えば自己相関行列Rに基づいて決定されてもよい。特に、幾つかの実施例に従えば、式10はコードブックのコードブックベクトルを決定するために使用されてもよい。
この文脈において、式10は、
Figure 0006122961
の形式で目的関数を定義しており、ここでは行列Rが対称的なテプリッツ構造を有するという点を除けば、この形式はスピーチ符号化標準AMRやG.718におけるのと同様な形式である。目的関数は、基本的に、目標ベクトルdとコードブックベクトル
Figure 0006122961
との間の正規化された相関であり、最も良好な可能性のあるコードブックベクトルは、正規化された相関
Figure 0006122961
について最も高い値を与える、つまり正規化された相関
Figure 0006122961
を最大化するものである。
よって、コードブックベクトルは上述の標準における幾つかの手法と同様の手法を用いて最適化され得る。特に、以下に説明するように、例えば残余に対して最良の代数コードブック(即ち固定のコードブック)ベクトル
Figure 0006122961
を発見する非常に簡素なアルゴリズムが適用され得る。しかしながら、効率的な探索アルゴリズムの設計にかなりの努力が投下されてきたこと(AMR及びG.718を参照)、及びこの探索アルゴリズムが唯一の例示し得る適用例であることに注目すべきである。
1.初期コードブックベクトル
Figure 0006122961
を定義し、パルス数をp=0に設定する。
2.初期コードブックベクトル品質尺度をf0=0に設定する。
3.一時的コードブック品質尺度を
Figure 0006122961
に設定する。
4.コードブックベクトルの各位置kについて、
(i)pを1ずつ増加する
(ii)もし位置kが負のパルスを既に含んでいる場合には、ステップ(vii)を続ける
(iii)一時的コードブックベクトル
Figure 0006122961
を生成して、位置kにおいて正のパルスを追加する
(iv)その一時的コードブックベクトルの品質をf(εp +)によって評価する
(v)その一時的コードブックベクトルがそれ以前の如何なるコードブックよりも良好である場合
Figure 0006122961
には、そのコードブックベクトルを保存し、
Figure 0006122961
に設定し、次の反復へと続く
(vi)もし位置kが正のパルスを既に含んでいる場合には、次の反復へと続く
(vii)一時的コードブックベクトル
Figure 0006122961
を生成し、位置kにおいて負のパルスを追加する
(viii)その一時的コードブックベクトルの品質をf(εp -)によって評価する
(ix)その一時的コードブックベクトルがそれ以前の如何なるコードブックよりも良好である場合
Figure 0006122961
には、このコードブックベクトルを保存し、
Figure 0006122961
に設定し、次の反復へと続く
5.コードブックベクトル
Figure 0006122961
を、保存されたコードブックベクトルの中で最後(つまり最良)であると定義する。
6.もしパルスpの数が所望のパルスの数に到達すれば、次に出力ベクトルを
Figure 0006122961
と定義し、停止する。もしそうでなければ、ステップ4を継続する。
既に指摘したように、従来のACELPアプリケーションと比べて、幾つかの実施例では、ZIRを次のフレームに含めるように目標値が修正される。
式1は、ACELP型コーデックにおいて使用される線形予測モデルを表している。現在のフレーム(及び全ての将来のフレーム)の残余がゼロに設定された場合に、ゼロインパルス応答(ZIR、またゼロ入力応答としても知られている)は線形予測モデルの出力に当てはまる。このZIRは、位置Nから前方(将来)へゼロである残余を次式のように定義することによって、容易に計算され得る。
Figure 0006122961
これにより、ZIRは次のように定義され得る。
Figure 0006122961
このZIRを入力信号から差し引くことにより、現在のフレームより前方へのみからの残余に依存する信号が得られる。
等価的に、ZIRは過去の入力信号を次式のようにフィルタリングすることにより決定し得る。
Figure 0006122961
ZIRが取り除かれている入力信号は、目標値としてよく知られており、位置Kで始まるフレームについてd(n)=x(n)−ZIRK(n)として定義され得る。この目標値は、原則としてAMR及びG.718標準における目標値と完全に等しい。信号を量子化する際、量子化された信号
Figure 0006122961
はフレームの持続時間K≦n<K+Nについてd(n)と比較される。
逆に、現在のフレームの残余は後続のフレームに対して影響を及ぼすので、信号を量子化する際には、その影響を考慮することが有用である。つまり、現在のフレームを超えてn>K+Nにおいても偏差
Figure 0006122961
を評価したいと望む可能性がある。しかしながら、それを実行するために、後続のフレームの残余をゼロに設定することによってのみ、現在のフレームの残余の影響を考慮したいと望む可能性もある。そのため、次のフレーム内への
Figure 0006122961
のZIRが比較されてもよい。換言すれば、修正された目標値が次式で得られる。
Figure 0006122961
等価的に、A(z)のインパルス応答h(n)を使用することで、次式となる。
Figure 0006122961
この式は、簡便な行列形式d'=Heで記載することができ、ここでH及びeは式2と同様に定義される。修正された目標値は、式2の正にxであると見なすことができる。
行列Rの計算において、理論上、インパルス応答h(k)は無限数列であり、現実のシステムでは実現性のないものであることに留意されたい。
しかしながら、次のいずれかが可能である。
1)インパルス応答を有限長まで切り詰め又は窓掛けし、切り詰められたインパルス応答の自己相関を決定すること。
2)関連するLP及び知覚フィルタのフーリエスペクトルを使用してインパルス応答のパワースペクトルを計算し、逆フーリエ変換によって自己相関を得ること。
ここで、LTPを用いた拡張方法について説明する。
長時間予測子(LTP:long-time predictor)は、また事実上、線形予測子である。
ある実施形態によれば、行列決定部110は知覚的に重み付けされた線形予測子、例えば長時間予測子に基づいて、自己相関行列Rを決定するよう構成されてもよい。
LP及びLTPは1つの結合予測子へと畳み込まれることができ、その結合予測子はスペクトル包絡形状とハーモニック構造との両方を含んでいる。そのような予測子のインパルス応答は非常に長くなるであろうし、そのため従来技術では取り扱うことが非常に難しいものである。しかしながら、線形予測子の自己相関が既知であれば、結合予測子の自己相関は、LTPを用いて前方及び後方に単に自己相関をフィルタリングすること、又は周波数領域での同様なプロセスによって、計算することができる。
LTPを用いる従来方法では、LTP遅れがフレーム長さより短い場合に、問題があることに注意すべきである。なぜなら、LTPがそのフレーム内でフィードバック・ループを引き起こす恐れがあるからである。前記目的関数内にLTPが含まれる長所は、LTPの遅れがフレーム長さよりも短い場合に、このフィードバックが最適化において明確に考慮される点である。
以下では、非相関領域における高速最適化のための拡張について説明する。
ACELPシステムの設計における中心的な課題は、演算上の複雑性を削減することである。ACELPシステムは、LPによるフィルタリングが残余サンプル同士間の複雑な相関を引き起こすために複雑であり、それら残余サンプルとは行列B又は現在の文脈においては行列Rによって記述されるものである。e(n)のサンプル同士が相関しているので、e(n)を所望の精度で正確に量子化することは不可能である。しかし、式3又は式10の目的関数に関してそれぞれ最適な量子化を発見するために、試行錯誤の手法を用いて異なる量子化の多くの組合せが試されなければならない。
行列Rの導入によって、これら相関に対する新たな視点が得られる。すなわち、Rはエルミート・テプリッツ構造を有するので、ハンケル行列の特異値分解、コレスキー分解(Cholesky decomposition)、ファンデルモンド分解(Vandermonde decomposition)などの複数の効率的な行列分解が適用され得る(非特許文献6及び7参照)(ハンケル行列はテプリッツ行列を逆転したものであり、そのため同じ分解がテプリッツ及びハンケル行列に適用され得る)。R=EDEHをRの分解とし、DがRと同じサイズ、同じランクの対角行列とする。その場合、式9は次に以下のように修正され得る。
Figure 0006122961
ここで、
Figure 0006122961
である。Dは対角であるから、f(k)の各サンプルの誤差は他のサンプルf(i)に対して独立している。式10において、コードブックベクトルは最適ゲインによってスケールされ、それにより新たな目的関数は次のようになると考えられる。
Figure 0006122961
ここでも、(1つのラインの量子化を変更することは、全てのラインについて最適なゲインを変化させるので)サンプル同士は相関しているが、しかし、式10と比較すれば、相関の影響はここでは限定されている。しかしながら、たとえ相関が考慮されても、この目的関数の最適化は式3又は式10の最適化に比べてずっと簡単である。
この分解手法を使用して次のことが可能になる。
1.所望の精度で任意の通常のスカラー又はベクトル量子化技術を適用すること。
2.任意の従来のACELPパルス探索アルゴリズムを用いて、目的関数として式12を使用すること。
両方の手法が、式12について最適に近い量子化を与える。従来の量子化技術が一般にいかなる強引な方法(可能なレートループを除いて)を必要とせず、かつ行列DがBとRのいずれよりも簡素であるから、両方の量子化方法は従来のACELPパルス探索アルゴリズムに比べてより複雑性が低い。そのため、この手法における演算上の複雑性の主な原因は、行列分解の演算となる。
幾つかの実施例では、コードブックのコードブックベクトルを決定するために式12を用いる。
例えば、R=EHDEの形式のRについて、幾つかの行列因数分解が存在する。例えば、
(a)例えばGNU Scientific Library (http://www.gnu.org/software/gsl/manual/html_node/Real-Symmetric-Matrices.html)を用いることで、固有値分解が計算され得る。行列Rは実数でかつ対称形(テプリッツと同様に)であり、それにより関数“gsl_eigen_symm()”が行列EとDを決定するために使用され得る。同じ固有値分解の他の構成は非特許文献6において容易に取得できる。
(b)非特許文献8に記載されたアルゴリズムを用いて、テプリッツ行列のファンデルモンド因数分解(非特許文献7)が使用され得る。このアルゴリズムは、行列EとDとをもたらすものであり、Eはファンデルモンド行列であり、そのファンデルモンド行列は不均一な周波数分布を持つ離散フーリエ変換と等価である。
このような因数分解を使用することで、残余ベクトルeはf=EHe又はf'=D1/2Heによって変換領域へ変換されることができる。この領域においてはいかなる一般的な量子化も適用可能であり、例えば
1.ベクトルf’はACELPの一般的な構成とまさに同様に代数コードブックによって量子化され得る。しかし、f’の成分同士は非相関であるから、ACELPにおけるような複雑な探索関数は不要であり、以下のような単純なアルゴリズムが適用され得る。
(a)初期ゲインをg=1に設定する。
(b)f’を
Figure 0006122961
によって量子化する。
(c)f’におけるパルスの数が所定の値pより大きく、
Figure 0006122961
の場合には、ゲインgを増加させ、ステップbに戻る。
(d)その他の場合、すなわち
Figure 0006122961
におけるパルスの数が所定の値pより小さく、
Figure 0006122961
の場合には、ゲインgを減少させ、ステップbに戻る。
(e)その他の場合、すなわち
Figure 0006122961
におけるパルスの数が所定の値pと等しく、
Figure 0006122961
の場合には、処理を停止させ得る。
2.標準AMR−WB+又はMPEG USACのTCXにおいてスペクトルラインの量子化に使用されているのと同様に、算術符号器が使用され得る。
f’の要素が対角(式12から分かるように)であり、それら要素が式12の目的関数において同じ重みを持つので、それら要素は個別にかつ同じ量子化ステップサイズで量子化されることができる、という点に注意すべきである。その量子化は、式12における目的関数の最適な(最大の)値を自動的に発見するであろうし、その量子化精度をもつことも可能である。換言すると、上述の量子化アルゴリズムは、共に式12に関して最適な量子化をもたらすことになるであろう。
最適化のこの利点は、f’の要素が別々に処理され得るという事実につながっている。もしあるコードブック手法が使用され、そこではコードブックベクトルckが非自明(1つ以上の非ゼロ要素を持つ)であるならば、これらコードブックベクトルはもはや独立した要素を持たず、行列因数分解の利点が失われるであろう。
テプリッツ行列のファンデルモンド因数分解が選択されることができ、そのファンデルモンド行列がフーリエ変換行列ではあるが、偏在する周波数を持つ点に注目されたい。換言すると、ファンデルモンド行列は周波数ワープされたフーリエ変換に対応する。つまりこの場合には、ベクトルfはワープされた周波数スケール(非特許文献8の“root-exchange property”を参照)上での残余信号の周波数領域表現に対応する。
重要な点は、この結果は周知ではないということである。実際上、この結果は、もし信号xが畳み込み行列Cを用いてフィルタリングされた場合に、次式となることを示し、
Figure 0006122961
ここで、Vは(例えばワープされた)フーリエ変換(これは単位円上の要素を持つファンデルモンド行列である)であり、Dは対角行列である。すなわち、フィルタリングされた信号のエネルギーを測定することが必要ならば、周波数ワープされた信号のエネルギーが等価的に測定され得ることになる。逆に、ワープされたフーリエ領域においてなされるべき如何なる評価も、フィルタリングされた時間領域でも等価的に実行され得る。時間と周波数の二重性により、時間領域窓掛けと時間ワーピングとの間の等価性もまた存在する。しかし、実際上の問題は、上述の関係を満足する畳み込み行列Cを発見することが数値的に敏感な問題であり、それにより、畳み込み行列Cに代えて近似解
Figure 0006122961
を発見する方が容易であるという点である。
関係式||Cx||2=||DVx||2は、コードブックのコードブックベクトルを決定するために用いられ得る。
そのため、ここでHによって、式2における畳み込み行列と同様の行列がCに代えて示されるであろうということにまず注目すべきである。次に、もし量子化ノイズ
Figure 0006122961
を最小化したいと望む場合には、そのエネルギーは次式で求められる。
Figure 0006122961
次に、フレーム独立性についての拡張を説明する。
符号化されたスピーチ信号が、ラジオ電波のような不完全な伝送ラインを用いて不変に伝送された場合、データのパケットは時折消失するであろう。もしパケットN−1を完全に復号するためにはパケットNが必要となるように、フレーム同士が互いに依存性を有するならば、パケットN−1の損失はパケットN−1とNの両方の合成を損なうであろう。一方、もしフレーム同士が独立しているならば、パケットN−1の損失はパケットN−1の合成だけを損なうであろう。そのため、フレーム間依存性の影響を受けない装置および方法は重要である。
従来のACELPシステムでは、フレーム間依存性の主たる原因はLTPであり、ある程度までLPにも関係している。特に、両者は無限インパルス応答(IIR)フィルタであるから、損傷されたフレームは損傷サンプルの「無限の」テールをもたらすであろう。実際のところ、そのようなテールは幾つかのフレーム長を持ち得るので、知覚的に煩わしいものである。
本発明の枠組みを使用することで、フレーム間依存性が生成される経路が、現在のフレームから次のフレームへとZIRによって定量化されうる。このフレーム間依存性を回避するため、従来のACELPに対する3つの修正法を実行する必要がある。
1.前のフレームから現在の(サブ)フレームまでのZIRを計算する際、量子化された残余ではなく、ゼロで拡張されたオリジナル(量子化されていない)残余から、ZIRが計算されるべきである。このようにして、前の(サブ)フレームからの量子化誤差は現在の(サブ)フレームに対して伝播しない。
2.現在のフレームを量子化する際、オリジナル信号と量子化された信号との間の、次のフレームへのZIRにおける誤差が考慮されなければならない。このことは、上述のように相関行列Bを自己相関行列Rによって置き換えることによってなし得る。これにより、次のフレームへのZIRにおける誤差が現在のフレーム内の誤差と共に最小化されることを確実にする。
3.誤差伝播がLPとLTPとに起因しているので、両成分はZIRに含まれていなければならない。これは、ZIRがLPだけのために計算される従来の手法とは異なる点である。
もし、現在のフレームを量子化する際に前のフレームの量子化誤差が考慮されなければ、出力の知覚的品質における効率が低下する。したがって、誤差伝播の恐れがないときには、前の誤差を考慮するよう選択することが可能である。例えば、従来のACELPシステムは、全ての20msフレームが4個又は5個のサブフレームにサブ分割されるフレーミングを適用する。LTPと残余は、各サブフレームについて個別に量子化され、符号化されるが、全体のフレームはデータの1つのブロックとして伝送される。したがって、個別のサブフレームは消失されることはないが、完全なフレームが消失することはあり得る。さらに、フレーム境界においてのみフレーム独立性のZIRを使用する必要があるが、残りのサブフレーム間ではZIRがフレーム間依存性を持って使用され得る、ということになる。
幾つかの実施形態では、現在のフレームのインパルス応答の効果を次のフレーム内、つまり現在のフレームの目的関数内に含めることによって、従来のACELPアルゴリズムを修正する。最適化問題の目的関数において、この修正は相関行列を、エルミート・テプリッツ構造を有する自己相関行列に置き換えることに相当する。この修正は次のような利点がある。
1.自己相関行列の追加されたエルミート・テプリッツ構造に起因して、演算の複雑性とメモリ要求とが低減される。
2.同じ知覚モデルが全てのサンプルに適用されるであろう。よって、知覚モデルの設計と調整がより簡易となり、その適用がより効率的にかつ一貫性を有することになる。
3.前のフレームからの量子化されていないインパルス応答と、次のフレームへの量子化されたインパルス応答とだけを考慮することにより、現在のフレームの量子化におけるフレーム間相関を完全に回避できる。このことは、パケットロスが予想されるようなシステムのロバスト性を改善できる。
図2は、上記実施例に従う装置によって符号化された符号化済みスピーチ信号を復号化して、復号化済みスピーチ信号を得るための復号器220を示す。この復号器220は、符号化済みスピーチ信号を受信するよう構成され、この符号化済みスピーチ信号は、上記実施例の1つに従いスピーチ信号を符号化する装置によって決定された、コードブックベクトルの指示、例えば決定されたコードブックベクトルのインテックスを含む。さらに、復号器220は符号化済みスピーチ信号を復号化して、前記コードブックベクトルに依存して復号化済みスピーチ信号を得るよう構成されている。
図3は、一実施例に従うシステムを示す。このシステムは、入力スピーチ信号を符号化して符号化済みスピーチ信号を得る上記実施例の1つに従う装置210を含む。符号化済みスピーチ信号は、スピーチ信号を符号化する装置210によって決定された決定済みコードブックベクトルの指示、例えばコードブックベクトルのインデックスを含む。さらに、このシステムは、符号化済みスピーチ信号を復号化して、復号化済みスピーチ信号を得る上記実施例に従う復号器220を含む。復号器220は符号化済みスピーチ信号を受信するよう構成されている。さらに、復号器220は符号化済み信号を復号化して、前記決定済みコードブックベクトルに依存して復号化済み信号を得るよう構成されている。
これまで装置の文脈で幾つかの態様を説明してきたが、これらの態様は対応する方法の説明でもあることは明らかであり、そのブロック又は装置が方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロック、項目又は特徴を表している。
本発明の分解された信号は、デジタル記憶媒体に格納されてもよく、またインターネットのような無線伝送媒体や有線伝送媒体のような伝送媒体によって伝送されてもよい。
構成要件にも依るが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働可能な)、デジタル記憶媒体、例えばフレキシブルディスク,DVD,CD,ROM,PROM,EPROM,EEPROM又はフラッシュメモリなどを使用して実行することができる。
本発明に従う幾つかの実施形態は、上述した方法の1つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有する非一時的データキャリアを含んでも良い。
一般的に、本発明の実施例は、プログラムコードを有するコンピュータプログラム製品として構成することができ、このプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法の一つを実行するよう作動する。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されても良い。
本発明の他の実施形態は、上述した方法の1つを実行するための、機械読み取り可能なキャリアに格納されたコンピュータプログラムを含む。
換言すれば、本発明の方法の一実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の1つを実行するためのプログラムコードを有する、コンピュータプログラムである。
本発明の他の実施形態は、上述した方法の1つを実行するために記録されたコンピュータプログラムを含む、データキャリア(又はデジタル記憶媒体又はコンピュータ読み取り可能な媒体)である。
本発明の他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号列である。そのデータストリーム又は信号列は、例えばインターネットを介するデータ通信接続を介して伝送されるように構成されても良い。
他の実施形態は、上述した方法の1つを実行するように構成又は適用された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。
他の実施形態は、上述した方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
幾つかの実施形態において、(例えば書換え可能ゲートアレイのような)プログラム可能な論理デバイスは、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態において、書換え可能ゲートアレイは、上述した方法の1つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には任意のハードウエア装置によって実行される。
上述した実施形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。

Claims (21)

  1. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する装置であって、
    自己相関行列Rを決定する行列決定部(110)と、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するコードブックベクトル決定部(120)とを含み、
    前記行列決定部(110)は、ベクトルrのベクトル係数を決定することによって前記自己相関行列Rを決定するよう構成され、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記コードブックベクトル決定部(120)は、次式を適用することにより前記コードブックベクトルを決定するよう構成され、
    Figure 0006122961
    ここで、Rは自己相関行列であり、
    Figure 0006122961
    は前記スピーチ符号化アルゴリズムのコードブックベクトルの1つであり、
    Figure 0006122961
    は正規化された相関であり、dTは次式に従って定義され、
    Figure 0006122961
    eはオリジナルの量子化されていない残余信号である、装置。
  2. 請求項1に記載の装置において、
    前記コードブックベクトル決定部(120)は、前記正規化された相関
    Figure 0006122961
    を最大化するスピーチ符号化アルゴリズムのコードブックベクトル
    Figure 0006122961
    を決定するよう構成されている、装置。
  3. 請求項1又は2に記載の装置において、
    前記行列決定部(110)は次式を適用することによって前記ベクトルrのベクトル係数を決定するよう構成され、
    Figure 0006122961
    ここで、h(k)は線形予測モデルの知覚的に重み付けられたインパルス応答を示し、kは整数であるインデックスであり、lは整数であるインデックスである、装置。
  4. 請求項1乃至3のいずれかに記載の装置において、
    前記行列決定部(110)は知覚的に重み付けられた線形予測子に依存して、前記自己相関行列Rを決定するよう構成されている、装置。
  5. 請求項1乃至4のいずれかに記載の装置において、
    前記コードブックベクトル決定部(120)は、行列分解を行うことによって前記自己相関行列Rを分解するよう構成されている、装置。
  6. 請求項5に記載の装置において、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための対角行列Dを決定するために、前記行列分解を行うよう構成されている、装置。
  7. 請求項6に記載の装置において、
    前記コードブックベクトル決定部(120)は、次式を用いることによって前記コードブックベクトルを決定するよう構成され、
    Figure 0006122961
    ここで、Dは前記対角行列であり、
    Figure 0006122961
    であり、f=E H eである、装置。
  8. 請求項6又は7に記載の装置において、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための前記対角行列Dを決定する前記行列分解として、前記自己相関行列Rを分解するために前記自己相関行列Rに対してファンデルモンド因数分解を行うよう構成されている、装置。
  9. 請求項6乃至8のいずれかに記載の装置において、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するために次式を用いるよう構成され、
    Figure 0006122961
    ここで、Cは畳み込み行列を示し、Vはフーリエ変換を示し、xはスピーチ信号を示す、装置 。
  10. 請求項6乃至9のいずれかに記載の装置において、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための前記対角行列Dを決定する前記行列分解として、前記自己相関行列Rを分解するために前記自己相関行列Rに対して特異値分解を行うよう構成されている、装置。
  11. 請求項6乃至9のいずれかに記載の装置において、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための前記対角行列Dを決定する前記行列分解として、前記自己相関行列Rを分解するために前記自己相関行列Rに対してコレスキー分解を行うよう構成されている、装置。
  12. 請求項1乃至11のいずれかに記載の装置において、
    前記コードブックベクトル決定部(120)は、前記スピーチ信号のゼロインパルス応答に依存して前記コードブックベクトルを決定するよう構成されている、装置。
  13. 請求項1乃至12のいずれかに記載の装置において、
    前記装置は代数符号励振線形予測スピーチ符号化を用いて前記スピーチ信号を符号化する符号器であり、
    前記コードブックベクトル決定部(120)は、代数コードブックのコードブックベクトルとして、前記自己相関行列Rに基づいて前記コードブックベクトルを決定するよう構成されている、装置。
  14. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する装置であって、
    自己相関行列Rを決定する行列決定部(110)と、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するコードブックベクトル決定部(120)とを含み、
    前記行列決定部(110)は、ベクトルrのベクトル係数を決定することによって前記自己相関行列Rを決定するよう構成され、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記コードブックベクトル決定部(120)は、行列分解を行うことによって前記自己相関行列Rを分解するよう構成され、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための対角行列Dを決定するために、前記行列分解を行うよう構成され、
    前記コードブックベクトル決定部(120)は、次式を用いることによって前記コードブックベクトルを決定するよう構成され、
    Figure 0006122961
    ここで、Dは対角行列であり、
    Figure 0006122961
    であり、f=E H eであり、eはオリジナルの量子化されていない残余信号であり、
    Figure 0006122961
    は前記スピーチ符号化アルゴリズムのコードブックベクトルの1つである、装置。
  15. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する装置であって、
    自己相関行列Rを決定する行列決定部(110)と、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するコードブックベクトル決定部(120)とを含み、
    前記行列決定部(110)は、ベクトルrのベクトル係数を決定することによって前記自己相関行列Rを決定するよう構成され、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記コードブックベクトル決定部(120)は、行列分解を行うことによって前記自己相関行列Rを分解するよう構成され、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための対角行列Dを決定するために、前記行列分解を行うよう構成され、
    前記コードブックベクトル決定部(120)は、前記コードブックベクトルを決定するための前記対角行列Dを決定する前記行列分解として、前記自己相関行列Rを分解するために前記自己相関行列Rに対してファンデルモンド因数分解を行うよう構成されている、装置。
  16. 入力スピーチ信号を符号化して、符号化済みスピーチ信号を得る請求項1乃至15のいずれかに記載の装置(210)と、
    前記符号化済みスピーチ信号を復号化して、復号化済みスピーチ信号を得る復号器(220)と、を含み、
    前記復号器(220)は、前記符号化済みスピーチ信号を受信するよう構成され、前記符号化済みスピーチ信号は、請求項1乃至15のいずれかに記載の装置(210)によって決定された前記コードブックベクトルの指示を含み、
    前記復号器(220)は、前記コードブックベクトルに依存して前記符号化済みスピーチ信号を復号化し、前記復号化済みスピーチ信号を得るよう構成されている、システム。
  17. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する方法であって、
    自己相関行列Rを決定するステップと、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するステップとを含み、
    前記自己相関行列Rを決定するステップは、ベクトルrのベクトル係数を決定するステップを含み、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記コードブックベクトルを決定するステップは、次式を適用することにより前記コードブックベクトルを決定するよう実行され、
    Figure 0006122961
    ここで、Rは自己相関行列であり、
    Figure 0006122961
    は前記スピーチ符号化アルゴリズムのコードブックベクトルの1つであり、
    Figure 0006122961
    は正規化された相関であり、dTは次式に従って定義され、
    Figure 0006122961
    eはオリジナルの量子化されていない残余信号である、方法。
  18. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する方法であって、
    自己相関行列Rを決定するステップと、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するステップとを含み、
    前記自己相関行列Rを決定するステップは、ベクトルrのベクトル係数を決定するステップを含み、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記自己相関行列Rを決定するステップは、行列分解を行うことによって前記自己相関行列Rを分解するよう実行され、
    前記行列分解は、前記コードブックベクトルを決定するための対角行列Dを決定するために実行され、
    前記コードブックベクトルを決定するステップは、次式を用いることによって前記コードブックベクトルを決定するよう実行され、
    Figure 0006122961
    ここで、Dは対角行列であり、
    Figure 0006122961
    であり、f=E H eであり、eはオリジナルの量子化されていない残余信号であり、
    Figure 0006122961
    は前記スピーチ符号化アルゴリズムのコードブックベクトルの1つである、方法。
  19. スピーチ符号化アルゴリズムのコードブックベクトルを決定することによって、スピーチ信号を符号化する方法であって、
    自己相関行列Rを決定するステップと、
    前記自己相関行列Rに依存して前記コードブックベクトルを決定するステップとを含み、
    前記自己相関行列Rを決定するステップは、ベクトルrのベクトル係数を決定するステップを含み、前記自己相関行列Rは複数の行と複数の列とを含み、前記ベクトルrは前記自己相関行列Rの列の1つ又は行の1つを示し、
    R(i , j) = r(|i− j|)
    であり、ここでR(i,j)は前記自己相関行列Rの係数を示し、iは前記自己相関行列Rの複数の行の1つを示す第1インデックスであり、jは前記自己相関行列Rの複数の列の1つを示す第2インデックスであり、
    前記自己相関行列Rを決定するステップは、行列分解を行うことによって前記自己相関行列Rを分解するよう実行され、
    前記行列分解は、前記コードブックベクトルを決定するための対角行列Dを決定するために実行され、
    前記コードブックベクトルを決定するための前記対角行列Dを決定する前記行列分解は、前記自己相関行列Rを分解するために前記自己相関行列Rに対してファンデルモンド因数分解を行うよう実行される、方法。
  20. 請求項17乃至19のいずれかに記載の方法に従って入力スピーチ信号を符号化し、符号化済みスピーチ信号を得るステップであって、前記符号化済みスピーチ信号は前記コードブックベクトルの指示を含む、ステップと、
    前記コードブックベクトルに依存して前記符号化済みスピーチ信号を復号化し、復号化済みスピーチ信号を得るステップと、を含む方法。
  21. コンピュータ又は信号プロセッサ上で実行されたとき、請求項17乃至20のいずれかに記載の方法を実行するためのコンピュータプログラム。
JP2015534940A 2012-10-05 2013-07-31 自己相関ドメインにおけるacelpを用いたスピーチ信号の符号化装置 Active JP6122961B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261710137P 2012-10-05 2012-10-05
US61/710,137 2012-10-05
PCT/EP2013/066074 WO2014053261A1 (en) 2012-10-05 2013-07-31 An apparatus for encoding a speech signal employing acelp in the autocorrelation domain

Publications (3)

Publication Number Publication Date
JP2015532456A JP2015532456A (ja) 2015-11-09
JP2015532456A5 JP2015532456A5 (ja) 2015-12-17
JP6122961B2 true JP6122961B2 (ja) 2017-04-26

Family

ID=48906260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015534940A Active JP6122961B2 (ja) 2012-10-05 2013-07-31 自己相関ドメインにおけるacelpを用いたスピーチ信号の符号化装置

Country Status (22)

Country Link
US (4) US10170129B2 (ja)
EP (3) EP4213146A1 (ja)
JP (1) JP6122961B2 (ja)
KR (1) KR101691549B1 (ja)
CN (1) CN104854656B (ja)
AR (1) AR092875A1 (ja)
AU (1) AU2013327192B2 (ja)
BR (1) BR112015007137B1 (ja)
CA (3) CA2979948C (ja)
ES (2) ES2701402T3 (ja)
FI (1) FI3444818T3 (ja)
HK (1) HK1213359A1 (ja)
MX (1) MX347921B (ja)
MY (1) MY194208A (ja)
PL (2) PL2904612T3 (ja)
PT (2) PT3444818T (ja)
RU (1) RU2636126C2 (ja)
SG (1) SG11201502613XA (ja)
TR (1) TR201818834T4 (ja)
TW (1) TWI529702B (ja)
WO (1) WO2014053261A1 (ja)
ZA (1) ZA201503025B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TR201818834T4 (tr) 2012-10-05 2019-01-21 Fraunhofer Ges Forschung Otokorelasyon alanında acelp kullanan bir konuşma sinyalinin şifrelenmesine ilişkin bir ekipman.
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
MX362490B (es) * 2014-04-17 2019-01-18 Voiceage Corp Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo.
CN110491402B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
AU2016312404B2 (en) * 2015-08-25 2020-11-26 Dolby International Ab Audio decoder and decoding method

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4815135A (en) * 1984-07-10 1989-03-21 Nec Corporation Speech signal processor
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
FR2700632B1 (fr) * 1993-01-21 1995-03-24 France Telecom Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués.
JP3209248B2 (ja) * 1993-07-05 2001-09-17 日本電信電話株式会社 音声の励振信号符号化法
US5854998A (en) * 1994-04-29 1998-12-29 Audiocodes Ltd. Speech processing system quantizer of single-gain pulse excitation in speech coder
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US5751901A (en) * 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
DE69712537T2 (de) * 1996-11-07 2002-08-29 Matsushita Electric Industrial Co., Ltd. Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
KR100319924B1 (ko) * 1999-05-20 2002-01-09 윤종용 음성 부호화시에 대수코드북에서의 대수코드 탐색방법
GB9915842D0 (en) * 1999-07-06 1999-09-08 Btg Int Ltd Methods and apparatus for analysing a signal
US6704703B2 (en) * 2000-02-04 2004-03-09 Scansoft, Inc. Recursively excited linear prediction speech coder
US7103537B2 (en) * 2000-10-13 2006-09-05 Science Applications International Corporation System and method for linear prediction
US7206739B2 (en) * 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
DE10140507A1 (de) * 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
US7003461B2 (en) * 2002-07-09 2006-02-21 Renesas Technology Corporation Method and apparatus for an adaptive codebook search in a speech processing system
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
EP1854095A1 (en) * 2005-02-15 2007-11-14 BBN Technologies Corp. Speech analyzing system with adaptive noise codebook
KR20080015878A (ko) * 2005-05-25 2008-02-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수 채널 신호의 예측 엔코딩
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
JP5188990B2 (ja) * 2006-02-22 2013-04-24 フランス・テレコム Celp技術における、デジタルオーディオ信号の改善された符号化/復号化
JP5264913B2 (ja) * 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
US20100011041A1 (en) * 2008-07-11 2010-01-14 James Vannucci Device and method for determining signals
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
US20100153100A1 (en) * 2008-12-11 2010-06-17 Electronics And Telecommunications Research Institute Address generator for searching algebraic codebook
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8315204B2 (en) * 2009-07-06 2012-11-20 Intel Corporation Beamforming using base and differential codebooks
EP2474098A4 (en) * 2009-09-02 2014-01-15 Apple Inc CODING SYSTEMS AND METHODS USING A REDUCED CODE BOOK WITH ADAPTIVE RESET
US9112591B2 (en) 2010-04-16 2015-08-18 Samsung Electronics Co., Ltd. Apparatus for encoding/decoding multichannel signal and method thereof
TR201818834T4 (tr) * 2012-10-05 2019-01-21 Fraunhofer Ges Forschung Otokorelasyon alanında acelp kullanan bir konuşma sinyalinin şifrelenmesine ilişkin bir ekipman.
EP3503095A1 (en) * 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding

Also Published As

Publication number Publication date
KR101691549B1 (ko) 2016-12-30
BR112015007137A2 (pt) 2017-07-04
CA2979948A1 (en) 2014-04-10
US11264043B2 (en) 2022-03-01
US10170129B2 (en) 2019-01-01
CA2979857A1 (en) 2014-04-10
PL3444818T3 (pl) 2023-08-21
CA2979948C (en) 2019-10-22
RU2015116458A (ru) 2016-11-27
FI3444818T3 (fi) 2023-06-22
TW201415457A (zh) 2014-04-16
HK1213359A1 (zh) 2016-06-30
PT3444818T (pt) 2023-06-30
RU2636126C2 (ru) 2017-11-20
EP2904612A1 (en) 2015-08-12
US20220223163A1 (en) 2022-07-14
EP3444818A1 (en) 2019-02-20
PL2904612T3 (pl) 2019-05-31
BR112015007137B1 (pt) 2021-07-13
CN104854656A (zh) 2015-08-19
AR092875A1 (es) 2015-05-06
AU2013327192A1 (en) 2015-04-30
AU2013327192B2 (en) 2016-06-09
US20150213810A1 (en) 2015-07-30
US12002481B2 (en) 2024-06-04
US20240321284A1 (en) 2024-09-26
ZA201503025B (en) 2016-01-27
PT2904612T (pt) 2018-12-17
CN104854656B (zh) 2017-12-19
US20190115035A1 (en) 2019-04-18
MX347921B (es) 2017-05-17
SG11201502613XA (en) 2015-05-28
EP4213146A1 (en) 2023-07-19
MX2015003927A (es) 2015-07-23
WO2014053261A1 (en) 2014-04-10
MY194208A (en) 2022-11-21
EP2904612B1 (en) 2018-09-19
CA2887009A1 (en) 2014-04-10
US20180218743A9 (en) 2018-08-02
TWI529702B (zh) 2016-04-11
TR201818834T4 (tr) 2019-01-21
ES2701402T3 (es) 2019-02-22
EP3444818B1 (en) 2023-04-19
JP2015532456A (ja) 2015-11-09
ES2948895T3 (es) 2023-09-21
CA2979857C (en) 2019-10-15
KR20150070200A (ko) 2015-06-24
CA2887009C (en) 2019-12-17

Similar Documents

Publication Publication Date Title
CN106415716B (zh) 编码器、解码器以及用于编码和解码的方法
US12002481B2 (en) Apparatus for encoding a speech signal employing ACELP in the autocorrelation domain
JP4539988B2 (ja) 音声符号化のための方法と装置
JP7123911B2 (ja) オーディオコーデックにおける長期予測のためのシステム及び方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160628

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170403

R150 Certificate of patent or registration of utility model

Ref document number: 6122961

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250