JP5264913B2 - 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 - Google Patents
話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 Download PDFInfo
- Publication number
- JP5264913B2 JP5264913B2 JP2010524321A JP2010524321A JP5264913B2 JP 5264913 B2 JP5264913 B2 JP 5264913B2 JP 2010524321 A JP2010524321 A JP 2010524321A JP 2010524321 A JP2010524321 A JP 2010524321A JP 5264913 B2 JP5264913 B2 JP 5264913B2
- Authority
- JP
- Japan
- Prior art keywords
- pulse
- algebraic codebook
- reference signal
- pulses
- calculator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 119
- 239000013598 vector Substances 0.000 claims description 118
- 230000005284 excitation Effects 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008685 targeting Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 description 26
- 230000005236 sound signal Effects 0.000 description 20
- 239000010410 layer Substances 0.000 description 18
- 238000004891 communication Methods 0.000 description 17
- 238000003786 synthesis reaction Methods 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 14
- 238000013459 approach Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000012792 core layer Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 108090000841 L-Lactate Dehydrogenase (Cytochrome) Proteins 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 241001237745 Salamis Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 235000015175 salami Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
適応符号帳検索は当業者に公知であると考えられるため、CELPベースのコーデック内の適応符号帳検索については、以下の段落で簡単に記載する。
CELPベースのコーデック内の固定(革新的)符号帳(FCB)の寄与分の検索の目的は、適応符号帳の利用後の残差を最小化することである。残差は、以下の関係(図2aの減算器256を参照)で与えられる。
符号帳の構造は、インターリーブされた単一パルス置換(ISPP)の設計に基づいてもよい。この構造において、パルス位置は、インターリーブされた位置のいくつかのトラックに分割される。例えば、インターリーブされた位置の4つのトラック、T0、T1、T2およびT3に分割される64位置符号ベクトルは、以下の表Iで示されるように、各トラックで16個の位置が生じる。以下の例にこの構造を使用する。
FCB(固定符号帳)検索手順を簡略化するための通常の手法は、自己相関法[9]を使用することである。この手法に従い、以下の要素を有する式(12)からの相関関係Φの行列は、
例えば、固定符号帳において高速代数符号帳検索を実行するための方法および装置について、次に説明する。高速代数符号帳検索を実行するための方法および装置の一般的な概念は、いくつかの反復においてパルスを逐次的に検索するということである。以下の非制限的な例示的実施形態では、自己相関手法が使用される。しかし、より普通の共分散手法[8]も使用可能である。該方法および装置の根本的な原理は、各新規パルス決定後の固定符号帳利得gcおよび逆フィルタされた標的ベクトルd(n)の更新ということである。基本的な検索を、以下のステップで概説する。
2.各反復の第1の段階において、第1のパルス位置m0は、典型的に、逆フィルタされた標的ベクトルd(n)の絶対最大値に設定され、nは、長さNのサブフレーム内のサンプルインデックスである(または共分散手法の場合、d2(m0)/φ(m0、m0)を最大化することで設定される)。パルス符号は、d(m0)の符号で与えられる。
3.以降の段階(各新規パルスの決定後)において、代数固定符号帳利得gcが再び算出され、次に、逆フィルタされた標的ベクトルd(n)を更新するために利得gcを使用する。
4.各新規パルスmjの位置は、更新された逆フィルタされた標的ベクトルd(n)の絶対最大値として求められ、パルス符号は、サンプルd(mj)の符号によって与えられる。
5.より高い符号化の効率性を得るために、m0の異なる位置から始めて、上記のステップ2〜4を反復することが可能である(例えば、2回目の反復において、d(n)の2番目に大きい絶対最大値、3回目の反復において、d(n)の3番目に大きい絶対最大値、等)。式(12)の検索基準を最大化する反復が、最終的に、パルス位置選択のために使用される。
高速代数符号帳検索を実行するため、4つのパルストラック位置を有し、トラック毎に1つのパルスを有する固定符号帳を検索するための、方法および装置の実施例を次に説明する。
2.各反復は、M(パルス数に対応)段階で構成される。パルスは、1つずつ、一回につき1つのトラックで検索される。
3.逆フィルタされた標的ベクトルd(n)およびベクトルα(n)は、共に、検索手順の反復部分に入る前に、式(14)および(17)を用いて、事前に算出される。
4.各反復中に、第1段階は、第1のパルス位置m0の決定より成る。これは、典型的には、最初のトラックで逆フィルタされた標的ベクトルd(n)の絶対最大値に設定される。パルス符号は、d(m0)の符号で与えられる。
5.以下の段階において、固定符号帳利得gcは、各新規パルスの決定後に再び算出され、さらに、逆フィルタされた標的ベクトルd(n)を更新するために用いられる。
6.新規パルスmjの位置は、更新された逆フィルタされた標的ベクトルd(n)の絶対最大値として求められ、パルス符号は、d(mj)の符号によって求められる。
7.手順の上記の演算4〜6はそれぞれ、異なるトラックで開始され、L回繰り返される。式(12)の検索基準を最大化する反復が、最終的にパルス位置および符号の選択として使用される。
上で記載されるように、高速代数符号帳検索を実行するための方法および装置は、さらに、以下のように、M個のパルスについて一般化できる。この例において、トラック数は検索するパルス数と等しく、すなわちM=Lである。
1.逆フィルタされた標的ベクトルd(n)(この実施形態では、代数固定符号帳の検索のために使用される参照信号)および相関ベクトルα(n)を算出する。
2.第1の反復を実行する。パルス位置m0をトラックT0に、パルス位置m1をトラックT1に、パルス位置m2をトラックT2に、パルス位置m3をトラックT3に、...、パルス位置mM−1をトラックTM−1に割り当てる(トラック毎に1つのパルスと仮定する)。
3.
6.それぞれ、式(10)および(11)を用いて、固定符号ベクトルck(n)およびフィルタされた固定符号ベクトルy2 (k)(n)を算出する。
7.異なるトラックにパルスを割り当てることで、工程2から手順を繰り返す。反復数はLと等しい。
8.式(46)の基準を最大化する反復に対応する一組のパルスを選択する。
上記の手順を、多数のM個のパルスを多数のL個のトラックで検索する状況に、さらに拡張可能である。MはLを整数で乗じた数である。この例において、トラック毎にいくつかのパルスが存在する。この状況は、1つのトラックのみが使用される場合(つまり、ISPP手法が使用されない一般的なケース)のケースを含む。
検索手順の効率性をさらに高めるために、パルスの振幅および符号を、固定参照信号b(n)を基にして決定できる。例えばAMR−WB[8]において使用された信号選択されたパルス振幅手法において、位置nにおける固定パルスの符号は、その位置の参照信号の符号と等しくなるよう設定される。さらに、参照信号b(n)は、非常に大きい代数符号帳の場合、いくつかのパルス位置を設定するように使用可能である。示された手順における、信号選択されたパルス振幅手法の応用例を以下に示す。この非制限的な例示的実施形態において、参照信号b(n)は、逆フィルタされた標的ベクトルd(n)および理想的な励起信号r(n)の組み合わせとして定義される。
1.工程301で、計算器は、逆フィルタされた標的ベクトルd(n)、相関ベクトルα(n)および参照信号b(n)を算出する。
2.工程302で、計算器は、以下の関係式を用いて、第1のパルスの位置および符号を計算する。
3.工程303では、パルスインデックスjは、1に設定される。
4.計算器は、式(49)から(52)を計算して、第1のパルス(演算304)の固定符号帳利得gcを決定し、工程305において、逆フィルタされた標的ベクトルd(n)および参照信号b(n)を更新し、最終的に第2のパルスの位置および符号を計算する(工程306)。
検索をさらに簡略化するために、参考文献[10]に記載される信号選択されたパルス振幅方法を使用可能である。次に、特定の位置のパルス符号を、その位置における式(62)からの参照信号b(n)の符号に設定する。その目的のために、元の参照信号b(n)の符号を含むベクトルzb(n)が構成される。ベクトルzb(n)は、符号帳検索プロセスの開始時、つまり、反復ループに入る前に、算出される。このようにして、検索されるパルスの符号が事前選択され、式(64)および(65)は、以下の式に変更される。
上述のとおり、検索手順は、トラック毎に、逐次的にパルスを検索する。トラックの順序は、トラック番号に従って逐次的に選択可能である、つまり、20ビットの代数固定符号帳では、第1の反復では、トラックをT0−T1−T2−T3の順序で、第2の反復はT1−T2−T3−T0等の順序等で検索する。しかし、トラックの逐次的な順序は最適ではなく、別のトラックの順序が有用である可能性がある。考えられる解決法として、各トラックにおける参照信号b(n)の絶対最大値に従って、トラックの順序を決定することである。
2.工程402では、計算器は、トラックの順序を決定する。
3.工程403では、反復インデックスiは、1に設定される。
4.工程404では、各反復において、計算器は、異なるトラックで各反復を開始し、ステップ2からのトラック決定に関して、残りのトラックの順序を決定し、トラックへパルスの割り当てを決定する。
5.工程405では、第1段階において、計算器は、参照信号b(i)の最大絶対値のインデックスとして、第1のパルスの位置を決定する。iは適切なトラックに対応する。第1のパルスの符号は、符号ベクトルzb(i)によって求めることができる。所定のトラックにおいてiについて、
6.工程406では、パルスインデックスは、j=1に設定される。
7.工程407では、計算器は、第1のパルスの固定符号帳利得gcを算出する。以前に見出されたパルス(パルスm0、...、mj−1)の固定符号帳利得は、以下の関係で与えられる。
8.工程408において、トラックが変更される。
9.工程409において、計算器は、元の標的信号x2(n)から見出されたパルスの寄与分を減算することで、標的信号を更新する。式(11)を使うと、これは、適切なトラックに対応するiについて、以下のように示され得る。
10.工程410において、計算器は、以下のように、式(76)および(77)と同様に、第2のパルスの位置および符号を算出する。
12.工程411では、パルスのインデックスjがM−1と等しい場合、計算器は、演算413において、それぞれ、式(10)および(11)を用いて固定符号ベクトルck(n)およびフィルタされた固定符号ベクトル
13.工程414では、反復のインデックスiが反復数Lよりも小さい場合、インデックスiは、演算415で1増加され、工程404〜413に戻ることで、次の反復を行う。全ての反復が完了するまでこれを繰り返す。
14.工程414では、反復のインデックスiがLと等しい場合、セレクタは、検索された(最良の)符号ベクトルck(n)およびフィルタされた固定符号ベクトルy2 (k)(n)として、演算416の式(46)の基準を最大化する、異なるL回の反復のうちの1回で計算された、一組のパルス位置および符号を選択する。
上記の高速代数固定符号帳検索方法および装置は、最近標準化されたITU−T推奨G.718(以前はG.EV−VBRとして公知であった)コーデックのベースラインで実施および試験された。G.718コーデックの高速代数固定符号帳検索の実施例は、図4を参照する、上記の実施例に対応している。G.718コーデックは、低位の層の復号化に影響を与えずに高位の層ビットストリームを破棄できる、5つの層を含む、埋め込みコーデックである。第1の層(L1)は、分類ベースのACELP技術を使用し、第2の層(L2)は第1の層からの誤差信号を符号化するための代数符号帳技術を使用し、これより上位の層は、下位層から誤差信号をさらに符号化するためのMDCT技術を使用する。コーデックはさらに、12.65kbit/sでのITU−T推奨G.722.2コーデックによる相互運用性を可能にするためのオプションを備えている。符号化器で呼び出される場合、このオプションは、第1および第2の層L1およびL2を置換するために、G.722.2モード2(12.65kbit/s)の使用を有効化する。代数FCB検索は、第1の2つの層、または、G.722.2オプションの場合、G.722.2コア層で使用される。これら全ては、狭帯域および広帯域入力信号の両方で内部サンプリング周波数12.8kHz、および20msのフレーム長を使用する。各フレームは、N=64サンプルで4つのサブフレームに分割される。
[1] R. Salami, C. Laflamme, J−P. Adoul, and D. Massaloux, ”A toll quality 8 kb/s speech codec for the personal communications system (PCS)”, IEEE Trans, on Vehicular Technology, Vol. 43, No. 3, pp. 808−816, August 1994.
[2] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola−Pukkila, J. Vainio H. Mikkola, and K. Jarvinen, ”The Adaptive Multi−Rate Wideband Speech Codec (AMR−WB)”, Special Issue of IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 8, pp. 620−636, November 2002.
[3] S. Singhal and B. S. Atal, ”Amplitude optimization and pitch prediction in multipulse coders”. IEEE Trans. ASSP, vol.37, no.3, pp. 317−327, March 1989
[4] ITU−T Recommendation G.729 (1/2007), ”Coding of Speech at 8 kbit/s using Conjugate−Structure Algebraic−Code−Excited Linear Prediction (CS− ACELP),” January 2007.
[5] ITU−T Recommendation G.729 Annex A (11/96), ”Reduced complexity 8 kbit/s CS−ACELP speech codec”, November 1996.
[6] ITU−T Recommendation G.729.1 (05/2006), ”G.729 based Embedded Variable bit−rate coder: An 8−32 kbit/s scalable wideband coder bitstream interoperable with G.729,” May 2006.
[7] ITU−T Recommendation G.723.1 (05/2006), ”Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s”, May 2006.
[8] 3GPP Technical Specification 26.190, ”Adaptive Multi−Rate − Wideband (AMR−WB) speech codec; Transcoding functions,” July 2005; http://www.3qpp.org.
[9] I. M. Trancoso and B. S. Atal, ”Efficient procedures for finding the optimum innovation in stochastic coders”. Proc. ICASSP’86, pp. 2375−2378, 1986.
[10] US Patent 5754976: Algebraic codebook with signal−selected pulse amplitude/position combinations for fast coding of speech.
[11] ITU−T Recommendation G.718 ”Frame error robust narrowband and wideband embedded variable bit−rate coding of speech and audio from 8− 32 kbit/s”Approved in September 2008.
101 通信チャネル
102 マイクロフォン
103,114 アナログ音声信号
104 アナログ/デジタル(A/D)変換器
105,113 デジタル音声信号
106 音声符号化器
107 符号化パラメータ
108 チャネル符号化器
109 チャネル復号化器
110 音声復号化器
115 デジタル/アナログ(D/A)変換器
116 ラウドスピーカユニット
Claims (33)
- 音声信号の符号化中に代数符号帳を検索する方法であって、
前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
前記代数符号帳の検索方法は、
前記代数符号帳の検索で使用するための参照信号を計算するステップと、
第1の段階において、(a)前記参照信号に関連して、かつ前記多数のパルス位置の中で、第1のパルスの位置を決定するステップと、
前記第1の段階以降の多数の段階のそれぞれにおいて、(a)代数符号帳利得を再算出するステップと、(b)前記再算出した代数符号帳利得を用いて、前記参照信号を更新するステップと、(c)前記更新された参照信号に関連して、かつ前記多数のパルス位置の中で、別のパルス位置を決定するステップと、
前記第1およびそれ以降の段階で決定される前記パルスの符号および位置を用いて、前記代数符号帳の符号ベクトルを算出するステップであって、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトルの前記パルスの数に対応する、ステップとを含む、方法。 - 前記多数のパルス位置は、一組のパルス位置のトラックに分割される、請求項1に記載の代数符号帳の検索方法。
- 第1の反復で、(a)前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの第1の割り当てを決定するステップと、(b)前記第1の段階および前記多数の以降の段階と、この第1の割り当てを用いた、前記代数符号帳の前記符号ベクトルの算出とを実行するステップと、
前記第1の反復以降の多数の反復のそれぞれで、(a)前記第1およびそれ以降の段階のために、前記第1および他のパルスの前記位置の、前記パルス位置トラックへの別の割り当てを決定するステップと、(b)前記第1の段階および前記多数の以降の段階と、前記他の割り当てを用いた、前記代数符号帳の前記符号ベクトルの前記算出とを実行するステップとを含む、請求項2に記載の代数符号帳の検索方法。 - 前記パルス位置は前記パルス位置トラックでインターリーブされる、請求項2に記載の代数符号帳の検索方法。
- 所定の選択基準を用いて、前記第1およびそれ以降の反復で算出される前記符号ベクトルのうちの1つを選択するステップを含む、請求項3に記載の代数符号帳の検索方法。
- 前記第1の段階において、前記参照信号に関連して、前記第1のパルスの符号を決定するステップと、
前記第1の段階以降の前記多数の段階のそれぞれにおいて、前記更新された参照信号に関連して、前記他のパルスの符号を決定するステップと、を含む、請求項1に記載の代数符号帳の検索方法。 - 前記参照信号の計算は、逆フィルタされた標的ベクトルを計算するステップを含む、請求項1に記載の代数符号帳の検索方法。
- 前記参照信号の計算は、逆フィルタされた標的ベクトルと理想的な励起信号との組み合わせとして前記参照信号を計算するステップを含む、請求項1に記載の代数符号帳の検索方法。
- スケーリング係数によって、逆フィルタされた標的ベクトルへの前記参照信号の依存性を制御するステップを含む、請求項1に記載の代数符号帳の検索方法。
- 前記以降の段階のそれぞれにおいて、前記スケーリング係数を変更するステップを含む、請求項9に記載の代数符号帳の検索方法。
- 前記第1の段階において、前記第1のパルスの位置を決定するステップは、前記第1のパルスの位置を、前記参照信号の最大値に設定するステップを含み、
前記多数の以降の段階のそれぞれにおいて、前記他のパルスの位置を決定するステップは、前記他のパルスの位置を、前記更新された参照信号の最大値に設定するステップを含む、請求項1に記載の代数符号帳の検索方法。 - 異なるトラックで各反復を開始するステップを含む、請求項3に記載の代数符号帳の検索方法。
- 前記第1および他のパルスの符号を事前選択するステップを含む、請求項1に記載の代数符号帳の検索方法。
- 各反復について、前記パルス位置トラックの順序を決定するステップを含む、請求項3に記載の代数符号帳の検索方法。
- 前記第1および他のパルスの符号の事前選択は、前記最初に計算された更新されていない参照信号の符号を含むベクトルを構成するステップを含む、請求項13に記載の代数符号帳の検索方法。
- 前記他のパルスの位置を決定するステップは、前記他のパルスの位置を、前記更新された参照信号と前記符号を含む前記ベクトルとの積の最大値に設定するステップを含む、請求項15に記載の代数符号帳の検索方法。
- 音声信号の符号化中に代数符号帳を検索するための装置であって、
前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
前記代数符号帳の検索装置は、
前記代数符号帳の検索で使用するための参照信号を計算するための手段と、
第1の段階において、前記参照信号に関連して、かつ前記多数のパルス位置の中で、第1のパルスの位置を決定する手段と、
前記第1の段階以降の多数の段階のそれぞれで、代数符号帳利得を再算出するための手段と、前記以降の段階のそれぞれにおいて、前記再算出した代数符号帳利得を用いて前記参照信号を更新するための手段と、前記以降の段階のそれぞれにおいて、前記更新された参照信号に関連して、かつ前記多数のパルス位置の中で、別のパルスの位置を決定するための手段と、
前記第1およびそれ以降の段階で決定される前記パルスの符号と位置とを用いて、前記代数符号帳の符号ベクトルを算出するための手段であって、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトル内の前記パルスの数に対応する、手段と、を含む、装置。 - 音声信号の符号化中に代数符号帳を検索するための装置であって、
前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
前記代数符号帳の検索装置は、
前記代数符号帳の検索で使用するための参照信号の第1の計算器と、
第1の段階において、前記参照信号に関して、かつ前記多数のパルス位置の中で、第1のパルス位置を決定するための第2の計算器と、
前記第1の段階以降の多数の段階のそれぞれにおいて、代数符号帳利得を再算出するための第3の計算器と、前記以降の段階のそれぞれにおいて、前記再算出した代数符号帳利得を用いて前記参照信号を更新するための第4の計算器と、前記以降の段階のそれぞれにおいて、前記更新された参照信号に関して、かつ前記多数のパルス位置の中で、別のパルス位置を決定するための第5の計算器と、
前記第1およびそれ以降の段階で決定される前記パルスの符号と位置とを用いる、前記代数符号帳の符号ベクトルの第6の計算器と、を含み、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトル内の前記パルス数に対応する、装置。 - 前記多数のパルス位置は、一組のパルス位置トラックに分割される、請求項18に記載の代数符号帳の検索装置。
- 第1の反復において、(a)第7の計算器は、前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの第1の割り当てを決定し、(b)前記第2、第3、第4および第5の計算器は、前記第1の段階および前記多数の以降の段階を実行し、前記第6の計算器は、この第1の割り当てを用いて、前記代数符号帳の前記符号ベクトルを算出し、
前記第1の反復以降の多数の反復のそれぞれにおいて、(a)第8の計算器は、前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの別の割り当てを決定し、(b)前記第2の、第3、第4および第5の計算器は、前記第1の段階と、前記多数の以降の段階とを実行し、前記第5の計算器は、前記他の割り当てを用いて、前記代数符号帳の前記符号ベクトルを算出する、請求項18に記載の代数符号帳の検索装置。 - 前記パルス位置は、前記パルス位置トラックでインターリーブされる、請求項19に記載の代数符号帳の検索装置。
- 所定の選択基準を用いる、前記第1およびそれ以降の反復で算出される前記符号ベクトルのうちの1つの選択器を含む、請求項20に記載の代数符号帳の検索装置。
- 前記第1の段階において、前記第2の計算器は、前記参照信号に関して、前記第1のパルスの符号を決定し、
前記第1の段階以降の前記多数の段階のそれぞれにおいて、前記第5の計算器は、前記更新された参照信号に関して、前記他のパルスの符号を決定する、請求項18に記載の代数符号帳の検索装置。 - 前記第1の計算器は、逆フィルタされた標的ベクトルを前記参照信号として計算する、請求項18に記載の代数符号帳の検索装置。
- 前記第1の計算器は、逆フィルタされた標的ベクトルと理想的な励起信号との組み合わせとして前記参照信号を計算する、請求項18に記載の代数符号帳の検索装置。
- 前記第1の計算器は、スケーリング係数によって、逆フィルタされた標的ベクトルへの前記参照信号の依存性を制御する、請求項18に記載の代数符号帳の検索装置。
- 前記第1の計算器は、前記以降の段階のそれぞれにおいて、前記スケーリング係数を変更する、請求項26に記載の代数符号帳の検索装置。
- 前記第1の段階において、前記第2の計算器は、前記第1のパルス位置を、前記参照信号の最大値に設定することで、前記第1のパルスの位置を決定し、
前記以降の段階数のそれぞれにおいて、前記第5の計算器は、前記他のパルスの位置を、前記更新された参照信号の最大値に設定することで、前記他のパルスの位置を決定する、請求項18に記載の代数符号帳の検索装置。 - 異なるトラックで各反復を開始するための手段を含む、請求項18に記載の代数符号帳の検索装置。
- 前記第1および他のパルスの符号を事前選択するための第9の計算器を含む、請求項18に記載の代数符号帳の検索装置。
- 各反復について、前記パルス位置トラックの順序を決定するための第9の計算器を含む、請求項20に記載の代数符号帳の検索装置。
- 前記第9の計算器は、前記最初に算出された更新されていない参照信号の符号を含むベクトルを構成することで、前記第1および他のパルスの符号を事前選択する、請求項30に記載の代数符号帳の検索装置。
- 前記第5の計算器は、前記他のパルスの位置を、前記更新された参照信号および前記符号を含む前記ベクトルの積の最大値に設定する、請求項32に記載の代数符号帳の検索装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96000607P | 2007-09-11 | 2007-09-11 | |
US60/960,006 | 2007-09-11 | ||
PCT/CA2008/001620 WO2009033288A1 (en) | 2007-09-11 | 2008-09-11 | Method and device for fast algebraic codebook search in speech and audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010539528A JP2010539528A (ja) | 2010-12-16 |
JP5264913B2 true JP5264913B2 (ja) | 2013-08-14 |
Family
ID=40451528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010524321A Expired - Fee Related JP5264913B2 (ja) | 2007-09-11 | 2008-09-11 | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8566106B2 (ja) |
JP (1) | JP5264913B2 (ja) |
CN (1) | CN101842833B (ja) |
WO (1) | WO2009033288A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7993626B2 (en) * | 2007-01-11 | 2011-08-09 | Immunomedics, Inc. | Methods and compositions for F-18 labeling of proteins, peptides and other molecules |
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CN101931414B (zh) | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US20110153337A1 (en) * | 2009-12-17 | 2011-06-23 | Electronics And Telecommunications Research Institute | Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
AR085221A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada |
EP2550653B1 (en) | 2011-02-14 | 2014-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Information signal representation using lapped transform |
CN103493129B (zh) | 2011-02-14 | 2016-08-10 | 弗劳恩霍夫应用研究促进协会 | 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法 |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
CA2903681C (en) | 2011-02-14 | 2017-03-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
PL3239978T3 (pl) | 2011-02-14 | 2019-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio |
AR085218A1 (es) | 2011-02-14 | 2013-09-18 | Fraunhofer Ges Forschung | Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio |
BR112013020592B1 (pt) | 2011-02-14 | 2021-06-22 | Fraunhofer-Gellschaft Zur Fôrderung Der Angewandten Forschung E. V. | Codec de áudio utilizando síntese de ruído durante fases inativas |
NO2669468T3 (ja) * | 2011-05-11 | 2018-06-02 | ||
WO2012172750A1 (ja) * | 2011-06-15 | 2012-12-20 | パナソニック株式会社 | パルス位置探索装置、符号帳探索装置、及びこれらの方法 |
US9263053B2 (en) * | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
WO2013180164A1 (ja) * | 2012-05-30 | 2013-12-05 | 日本電信電話株式会社 | 符号化方法、符号化装置、プログラム、および記録媒体 |
CN103456309B (zh) * | 2012-05-31 | 2016-04-20 | 展讯通信(上海)有限公司 | 语音编码器及其代数码表搜索方法和装置 |
CN104854656B (zh) * | 2012-10-05 | 2017-12-19 | 弗劳恩霍夫应用研究促进协会 | 在自相关域中利用acelp编码语音信号的装置 |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
MX362490B (es) | 2014-04-17 | 2019-01-18 | Voiceage Corp | Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo. |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5701392A (en) * | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
FR2729245B1 (fr) * | 1995-01-06 | 1997-04-11 | Lamblin Claude | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
DE69516522T2 (de) * | 1995-11-09 | 2001-03-08 | Nokia Mobile Phones Ltd., Salo | Verfahren zur Synthetisierung eines Sprachsignalblocks in einem CELP-Kodierer |
US5867814A (en) * | 1995-11-17 | 1999-02-02 | National Semiconductor Corporation | Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method |
US5751901A (en) | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
US5924062A (en) * | 1997-07-01 | 1999-07-13 | Nokia Mobile Phones | ACLEP codec with modified autocorrelation matrix storage and search |
US6161086A (en) * | 1997-07-29 | 2000-12-12 | Texas Instruments Incorporated | Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US7117146B2 (en) * | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
AU1615100A (en) * | 1998-11-09 | 2000-05-29 | Broadcom Corporation | Forward error corrector |
US6295520B1 (en) * | 1999-03-15 | 2001-09-25 | Tritech Microelectronics Ltd. | Multi-pulse synthesis simplification in analysis-by-synthesis coders |
WO2001020595A1 (en) * | 1999-09-14 | 2001-03-22 | Fujitsu Limited | Voice encoder/decoder |
AU2003207498A1 (en) | 2002-01-08 | 2003-07-24 | Dilithium Networks Pty Limited | A transcoding scheme between celp-based speech codes |
US7363218B2 (en) * | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US7860710B2 (en) | 2004-09-22 | 2010-12-28 | Texas Instruments Incorporated | Methods, devices and systems for improved codebook search for voice codecs |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
SG123639A1 (en) * | 2004-12-31 | 2006-07-26 | St Microelectronics Asia | A system and method for supporting dual speech codecs |
US20070150266A1 (en) | 2005-12-22 | 2007-06-28 | Quanta Computer Inc. | Search system and method thereof for searching code-vector of speech signal in speech encoder |
-
2008
- 2008-09-11 JP JP2010524321A patent/JP5264913B2/ja not_active Expired - Fee Related
- 2008-09-11 US US12/676,004 patent/US8566106B2/en active Active
- 2008-09-11 WO PCT/CA2008/001620 patent/WO2009033288A1/en active Application Filing
- 2008-09-11 CN CN2008801137837A patent/CN101842833B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101842833A (zh) | 2010-09-22 |
WO2009033288A1 (en) | 2009-03-19 |
CN101842833B (zh) | 2012-07-18 |
US8566106B2 (en) | 2013-10-22 |
US20100280831A1 (en) | 2010-11-04 |
JP2010539528A (ja) | 2010-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5264913B2 (ja) | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 | |
RU2462769C2 (ru) | Способ и устройство кодирования кадров перехода в речевых сигналах | |
TW497335B (en) | Method and apparatus for variable rate coding of speech | |
JP4390803B2 (ja) | 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置 | |
AU2014320881B2 (en) | Adaptive bandwidth extension and apparatus for the same | |
CN1890714B (zh) | 一种优化的复合编码方法 | |
JP5374418B2 (ja) | 音声符号化用適応符号帳ゲインの制御 | |
JP6392409B2 (ja) | 音声符号化のための混合コードブック励振のためのシステムおよび方法 | |
KR100464369B1 (ko) | 음성 부호화 시스템의 여기 코드북 탐색 방법 | |
JP2002202799A (ja) | 音声符号変換装置 | |
JP2004514182A (ja) | 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法 | |
JP2006525533A5 (ja) | ||
Kim et al. | An efficient transcoding algorithm for G. 723.1 and EVRC speech coders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120605 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130430 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5264913 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |