JP5264913B2 - 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 - Google Patents

話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 Download PDF

Info

Publication number
JP5264913B2
JP5264913B2 JP2010524321A JP2010524321A JP5264913B2 JP 5264913 B2 JP5264913 B2 JP 5264913B2 JP 2010524321 A JP2010524321 A JP 2010524321A JP 2010524321 A JP2010524321 A JP 2010524321A JP 5264913 B2 JP5264913 B2 JP 5264913B2
Authority
JP
Japan
Prior art keywords
pulse
algebraic codebook
reference signal
pulses
calculator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010524321A
Other languages
English (en)
Other versions
JP2010539528A (ja
Inventor
レドワン・サラミ
ヴァクラヴ・エクスラー
ミラン・イェリネク
Original Assignee
ヴォイスエイジ・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヴォイスエイジ・コーポレーション filed Critical ヴォイスエイジ・コーポレーション
Publication of JP2010539528A publication Critical patent/JP2010539528A/ja
Application granted granted Critical
Publication of JP5264913B2 publication Critical patent/JP5264913B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、代数構造を有する固定符号帳の検索のための方法および装置に関する。本発明に従う符号帳検索方法および装置は、音声信号(話声およびオーディオ信号を含む)を符号化および復号化するための技術に使用可能である。
オーディオ/映像による電話会議、マルチメディア、およびワイヤレスアプリケーション等の多数の用途や、インターネットおよびパケットネットワークアプリケーションのために、良好な主観的品質/ビットレートのトレードオフを備える、効率的なデジタル広帯域話声/オーディオ符号化技術への需要が高まっている。最近まで、200〜3400Hzの範囲でフィルタされた電話帯域幅は、主に音声符号化の用途で使用されていた。しかし、音声信号の了解度および自然らしさを向上させるために、広帯域音声の用途への受容が高まっている。50〜7000Hzの範囲の帯域幅が、一対一の話声の質を提供するために十分であることがわかっている。オーディオ信号の場合、この範囲で、十分な音質が得られるが、それでも、20〜20000Hzの範囲で動作するCD(コンパクトディスク)の音質よりも低い。
音声符号化器は、音声信号を、通信チャネル上を伝送される(または記憶媒体に格納される)デジタルビットストリームに変換する。音声信号はデジタル化され(サンプル当たり通常16ビットで抽出および量子化され)、音声符号化器は、良好な主観的音質を維持しながら、より少ないビット数で、これらのデジタルサンプルを表現する役割を有する。音声復号化器または合成装置は、伝送または格納されたビットストリームで動作し、これを音声信号に再び変換する。
良好な品質/ビットレートのトレードオフを実現可能な最良の先行技術の1つに、いわゆる、CELP(符号励起線形予測)技術がある。この技術によると、抽出された音声信号は、通常、フレームと呼ばれるL個のサンプルの連続ブロックで処理される(ここで、Lは、ある既定の数である(10〜30msの話声に対応))。CELPにおいて、LP(線形予測)合成フィルタが、フレーム毎に算出および伝送される。L個のサンプルフレームは、次に、N個のサンプルの、サブフレームと呼ばれるより小さなブロックに分割される(ここで、L=kNであり、kは、フレーム内のサブフレーム数である(Nは通常、4〜10msの話声に対応))。各サブフレームで励起信号が決定され、これは、通常、2つのコンポーネントから構成される。1つは過去の励起によるものであり(ピッチの寄与分または適応符号帳とも呼ばれる)、もう1つは、革新的符号帳(固定符号帳とも呼ばれる)によるものである。この励起信号は伝送され、合成音声を得るために、LP合成フィルタの入力として復号化器で使用される。
CELP技術によって話声を合成するために、話声信号のスペクトル特性をモデリングする時間依存性フィルタによって、革新的符号帳から適切な符号ベクトルをフィルタすることで、N個のサンプルの各ブロックが合成される。これらのフィルタは、ピッチ合成フィルタ(通常、過去の励起信号を含む適応符号帳として実施される)およびLP合成フィルタで構成される。符号化器側において、合成出力は、革新的符号帳(符号帳検索)からの符号ベクトルの全て、またはサブセットについて、算出される。この保持される革新的符号ベクトルは、知覚的に重み付けされた歪み測度による、元の話声信号に最も近い合成出力を生成する符号ベクトルである。この知覚的重み付けは、通常、LP合成フィルタから得られる、いわゆる知覚的重み付けフィルタを用いて実行される。
CELPのコンテクストにおいて、革新的符号帳は、N次元の符号ベクトルとして参照される、インデックス付けされた一組のNサンプル長のシーケンスである。各符号帳シーケンスは、0乃至M−1の範囲の整数kによってインデックス付けされ、ここで、Mは、ビット数bとして表されることが多い、革新的符号帳のサイズを表し、ここで、M=2である。
符号帳は、物理メモリ、例えば、ルックアップテーブル(確率的符号帳)に格納可能であり、または、インデックスを対応する符号ベクトルに関連付けるためのメカニズム、例えば、式(代数符号帳)を指し得る。
第1の種類の符号帳である、確率的符号帳の難点は、これらが多くの場合、相当な物理的ストレージを伴なうということである。これらは、確率的、すなわち、インデックスから関連付けられた符号ベクトルへのパスが、大きな話声トレーニングセットに適用されるランダムに生成された数または統計的技術の結果であるルックアップテーブルを伴なうという意味で、ランダムである。確率的符号帳のサイズは、ストレージおよび/または検索の複雑性によって制限される傾向がある。
第2の種類の符号帳は、代数符号帳である。確率的符号帳とは対照的に、代数符号帳は、ランダムではなく、大きなストレージは不要である。代数符号帳は、物理的ストレージを全くまたは最小限しか必要としない規則によって、k番目の符号ベクトルのパルスの振幅および位置を、対応するインデックスkから得ることができる、一組のインデックスされた符号ベクトルである。したがって、代数符号帳のサイズは、ストレージ要件に制限されない。代数符号帳は、さらに、効率的な検索を行うように設計できる。
CELPモデルは、電話帯域音声信号の符号化において非常に役立っており、広範囲の用途において、特にデジタル携帯電話の用途において、いくつかのCELPベース標準が存在する。電話帯域において、音声信号は200〜3400Hzに帯域制限され、8000サンプル/秒で抽出される。広帯域話声/オーディオの用途において、音声信号は50〜7000Hzに帯域制限され、1600サンプル/秒で抽出される。
広帯域信号の符号化において生じる重要な課題に、非常に大きな励起符号帳の使用の必要性がある。したがって、最小限のストレージのみを必要とする、高速検索が可能な効率的な符号帳構成が非常に重要になる。代数符号帳はその効率性で知られており、現在、様々な話声符号化標準に広く使用されている。より多数のビットを有する代数符号帳は、非全数検索方法を使用して、効率的な検索が可能である。この例には、入れ子ループ検索[4]、パルスのサブセットにおいてパルスを検索する深さ優先ツリー検索[5]、および全体パルス置換[6]がある。ITU−T推奨G.723.1[7]ではマルチパルス逐次検索[3]に類似した単純検索が使用された。参考文献[7]において、励起は、全パルスの固定利得を有する、(ACELPと同様、トラック構成を持たない)フレーム内のいくつかの符号付きのパルスで構成される。パルスは、いわゆる逆フィルタされた標的信号d(n)を更新し、信号d(n)の絶対最大値に新規パルスを設定することにより、逐次的に検索される。いくつかの利得値で検索を繰り返すが、利得は、各反復中、一定であると想定される。
より具体的には、本発明に従い、音声信号の符号化中に代数符号帳を検索する方法を提供し、代数符号帳は、多数のパルス位置と、それぞれ符号を有し、パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含む。代数符号帳の検索方法は、代数符号帳の検索で使用するための参照信号の計算と、第1の段階における、(a)参照信号に関連する、かつ多数のパルス位置の中での、第1のパルスの位置決定と、第1の段階以降の多数の段階のそれぞれにおける、(a)代数符号帳利得の再算出と、(b)再算出した代数符号帳利得を用いた、参照信号の更新と、(c)更新された参照信号に関連する、かつ多数のパルス位置の中での、別のパルスの位置の決定と、第1およびそれ以降の段階で決定されるパルスの符号および位置を用いた、代数符号帳の符号ベクトルの算出とを含み、第1およびそれ以降の段階の数は、代数符号帳の符号ベクトルのパルスの数に対応する。
本発明はさらに、音声信号の符号化中に代数符号帳を検索するための装置に関し、代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつパルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、代数符号帳の検索装置は、代数符号帳の検索で使用するための参照信号を計算するための手段と、第1の段階において、参照信号に関連して、かつ多数のパルス位置の中で、第1のパルスの位置を決定する手段と、第1の段階以降の多数の段階のそれぞれで、代数符号帳利得を再算出するための手段と、以降の段階のそれぞれにおいて、再算出した代数符号帳利得を用いて参照信号を更新するための手段と、以降の段階のそれぞれにおいて、更新された参照信号に関連して、かつ多数のパルス位置の中で、別のパルスの位置を決定するための手段と、第1およびそれ以降の段階で決定されるパルスの符号と位置とを用いて、代数符号帳の符号ベクトルを算出するための手段とを含み、第1およびそれ以降の段階の数は、代数符号帳の符号ベクトル内のパルスの数に対応する。
本発明はさらに、音声信号の符号化中に代数符号帳を検索するための装置に関し、代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、代数符号帳検索装置は、代数符号帳の検索で使用するための参照信号の第1の計算器と、第1の段階において、参照信号に関して、かつ多数のパルス位置の中で、第1のパルス位置を決定するための第2の計算器と、第1の段階以降の多数の段階のそれぞれにおいて、代数符号帳利得を再算出するための第3の計算器と、以降の段階のそれぞれにおいて、再算出した代数符号帳利得を用いて参照信号を更新するための第4の計算器と、以降の段階のそれぞれにおいて、更新された参照信号に関して、かつ多数のパルス位置の中で、別のパルスの位置を決定するための第5の計算器と、第1およびそれ以降の段階で決定される符号とパルス位置とを用いる、代数符号帳の符号ベクトルの第6の計算器とを含み、第1およびそれ以降の段階の数は、代数符号帳の符号ベクトル内のパルス数に対応する。
添付の図面を参照しながら、例示のためにのみ示される、以下のその例示的実施形態の非制限的な説明を一読することにより、本発明の上記および他の目的、利点および特徴がより明らかになるであろう。
音声符号化および復号化装置の使用を示す、通信システムの略ブロック図である。 CELPベースの符号化器および復号化器の構成を示す、略ブロック図である。 CELPベースの符号化器および復号化器の構成を示す、略ブロック図である。 本発明に従う、代数固定符号帳の検索方法および装置の実施形態を示すブロック図である。 本発明に従う、代数固定符号帳の検索方法および装置の別の実施形態を示すブロック図である。
本発明の非制限的な例示的実施形態は、CELPベースの符号化器における高速符号帳検索のための方法および装置に関する。符号帳検索方法および装置は、話声およびオーディオ信号を含む、任意の音声信号と共に使用可能である。符号帳検索方法および装置は、さらに、任意のレートで抽出された狭帯域、広帯域、または全帯域信号に適用可能である。
図1は、音声符号化および復号化の使用例を表す、音声通信システム100の略ブロック図である。音声通信システム100は、通信チャネル101上の音声信号の伝送および再生をサポートする。これは、例えば、ワイヤ、光またはファイバーリンクを含む場合もあるが、通信チャネル101は典型的には、少なくとも一部分は、高周波リンクを含む。高周波リンクは、多くの場合、携帯電話通信で見ることができる、共有帯域幅リソースを必要とする、複数の、話声同時通信をサポートする。図示されていないが、通信チャネル101は、後で再生するために、符号化された音声信号を記録および格納する通信システム101の単一装置実施形態における格納装置で代用してもよい。
図1を再び参照すると、例えば、マイクロフォン102は、固定デジタル音声信号105に変換するために、アナログ/デジタル(A/D)変換器104に送られるアナログ音声信号103を生成する。音声符号化器106はデジタル音声信号105を符号化し、これにより、2進数形式に符号化され、チャネル符号化器108に配信される一組の符号化パラメータ107を生成する。オプションのチャネル符号化器108は、通信チャネル101上で伝送される前に、符号化パラメータの2進数表現に冗長を追加する。受信機側では、チャネル復号化器109は、通信チャネル101上の伝送の際に生じたチャネル誤差を検知および修正するために、受信したビットストリーム内の上記の冗長情報を利用する。音声復号化器110は、合成されたデジタル音声信号113を作成するために、チャネル復号化器110から受信したビットストリームを、一組の符号化パラメータに再び変換する。音声復号化器110内で再構成される合成されたデジタル音声信号113は、デジタル/アナログ(D/A)変換器115でアナログ音声信号114に変換され、ラウドスピーカユニット116で再生される。
図2aおよび図2bに図示されるように、音声コーデックは、2つの基本的な部分、音声符号化器210および音声復号化器212で構成される。符号化器210は音声信号をデジタル化し、音声信号を表す制限された数のパラメータを選択し、これらのパラメータを、通信チャネル、例えば、図1の通信チャネル101を用いて、復号化器212へ伝送されるデジタルビットストリームに変換する。音声復号化器212は、元の音声信号と可能な限り同様になるよう、音声信号を再構成する。
現在、最も普及している話声符号化技術は、線形予測(LP)、特にCELPを基にしている。LPベースの符号化において、音声信号230は、伝達関数1/A(z)を有するLP合成フィルタ216により、励起214をフィルタすることで合成される。CELPにおいて、励起214は、典型的には2つの部分から構成される。つまり、適応符号帳218から選択され、適応符号帳利得g226によって増幅される第1段階の適応符号帳の寄与分222、および、固定符号帳220から選択され、固定符号帳利得g228で増幅される、第2段階の符号帳の寄与分224である。概して、適応符号帳の寄与分222は、励起の周期的部分をモデリングし、固定符号帳の寄与分224は、音声信号の展開をモデリングするために追加される。
音声信号は、典型的には20msのフレームで処理され、LPフィルタ係数はフレーム毎に一度伝送される。CELPにおいて、フレームはさらに、励起を符号化するために、いくつかのサブフレームに分割される。サブフレーム長は典型的には、5msである。
CELPの基礎となる主な原理は、Analysis−by−Synthesis(合成による分析)と呼ばれ、考えられる復号化器出力が符号化プロセス中に既に試行(合成)され、次に元の音声信号と比較される。検索は、知覚的に重み付けされたドメインにおいて、入力音声信号s(n)211および合成された音声s’(n)230の間の平均2乗誤差232を最小にさせる(離散時間インデックスn=0,1,...,N−1であり、Nはサブフレーム長である)。知覚的重み付けフィルタ233は周波数マスク効果を活用し、典型的には、LPフィルタA(z)から得られる。知覚的重み付けフィルタ233の例は、式(1)に示される。
Figure 0005264913
式中、因数γおよびγは知覚的重み付けの大きさを制御し、0<γ<γ≦1である。式(1)の従来の知覚的重み付けフィルタは、NB(狭帯域、200〜3400Hzの帯域幅)信号で有用である。WB(広帯域、50〜7000Hzの帯域幅)信号の知覚的重み付けフィルタの例は、参考文献[2]に見ることができる。
LP合成フィルタ1/A(z)および重み付けフィルタW(z)のメモリは検索された符号ベクトルに依存しないため、このメモリは、固定符号帳検索の前に、入力音声信号s(n)から差し引くことができるできる。候補符号ベクトルのフィルタは、図1のH(z)で表されるフィルタ1/A(z)およびW(z)のカスケードのインパルス応答との畳み込みによって実行できる。
符号化器210から復号化器212へ伝送されたビットストリームは、典型的には以下のパラメータ、つまり、LP合成フィルタA(z)の量子化されたパラメータ、適応および固定符号帳インデックス、ならびに適応および固定符号帳の利得gおよびgを含む。記載したパラメータを含む符号化器210および復号化器212のブロック図を、図2aおよび図2bに示す。
§適応符号帳検索
適応符号帳検索は当業者に公知であると考えられるため、CELPベースのコーデック内の適応符号帳検索については、以下の段落で簡単に記載する。
CELPベースのコーデック内の適応符号帳検索は、遅延(ピッチ期間)tおよびピッチ利得(または適応符号帳利得)gを決定し、励起の適応符号帳の寄与分を構成するために、重み付けされた話声ドメインで実行される。ピッチ期間tは特定の話者に大幅に依存し、その正確な決定は、合成された話声の品質に大きく影響する。
昨今のCELPコーデックにおいて、ピッチ期間tを決定するために3段階の手順を使用する。第1の段階では、開ループピッチ期間の推定Topが、各フレームで算出される。開ループピッチ期間は、典型的には、重み付けされた音声信号s(n)および正規化された相関関係演算処理を用いて検索され、重み付けされた音声信号s(n)は、重み付けフィルタW(z)233による入力音声信号s(n)211の重み付けによって、図2に示されるように、計算される。第2の段階において、各サブフレーム5msで、推定された開ループピッチ期間Topの整数ピッチ期間で、閉ループピッチ検索が実行される。最適整数ピッチ期間が見つかると、第3の段階は、その最適整数ピッチ期間の前後の分数に対して実行される。閉ループピッチ検索は、元の音声信号および合成された音声信号の間の平均2乗重み付けされた誤差232を最小化することにより実行される。これは、以下の項を最大化することで実行できる。
Figure 0005264913
式中、x(n)は標的信号であり、y(n)はフィルタされた適応符号ベクトルである。図2aに示されるように、フィルタされた適応符号ベクトルy(n)は、重み付けされた合成フィルタH(z)238のインパルス応答h(n)により、ピッチ期間tの、適応符号帳242からの過去の励起信号v(n)を畳み込むことで、算出される。
Figure 0005264913
フィルタH(z)238は、LP合成フィルタ1/A(z)および知覚的重み付けフィルタW(z)のカスケードによって形成される。標的信号x(n)は、フィルタH(z)のゼロ入力応答を減算した後の、知覚的に重み付けされた入力音声信号s(n)に対応する(減算器236を参照)。
ピッチ利得g240は、信号x(n)およびy(n)の間の平均2乗誤差を最小化することで求められ、以下の関係で与えられる。
Figure 0005264913
ピッチ利得gは通常、0≦g≦1.2で境界される。ほとんどのCELP実施例において、ピッチ利得gは、革新的符号ベクトルが見つかると、固定符号帳利得で量子化される。
適応符号帳の寄与分250は、フィルタされた適応符号ベクトルy(n)をピッチ利得gで乗算することで計算される。
§固定符号帳検索
CELPベースのコーデック内の固定(革新的)符号帳(FCB)の寄与分の検索の目的は、適応符号帳の利用後の残差を最小化することである。残差は、以下の関係(図2aの減算器256を参照)で与えられる。
Figure 0005264913
式中、gは固定符号帳利得であり、y (k)(n)は、フィルタされた革新的符号ベクトルである。kは、固定符号帳インデックスであり、フィルタされた革新的符号ベクトルy (k)(n)は、重み付けされた合成フィルタH(z)246のインパルス応答h(n)によって畳み込まれたインデックスkにおける、固定符号帳244からの符号ベクトルc(n)である。
固定符号帳の寄与分252は、フィルタされた革新的符号ベクトルy (k)(n)を固定符号帳利得g248で乗算することによって算出される。
代数固定符号帳の標的信号x(n)は、適応符号帳の標的信号x(n)から適応符号帳の寄与分250を減算することで算出される(減算器254を参照)。
Figure 0005264913
式(5)からEを最小化することにより、固定符号帳利得gが最適化され、
Figure 0005264913
式(5)からの最小誤差は、以下のようになる。
Figure 0005264913
したがって、以下の項を最大化することで検索が実行される。
Figure 0005264913
固定符号帳は、いくつかの方法で実施できる。最もよく使われる例の1つは、一組のパルスが各サブフレームに配置される代数符号帳[1]の使用で構成される。かかる代数符号帳の効率性は、パルスの数、その符号、位置および振幅に依存する。符号化の高い主観的な質を保証するために、大きな符号帳が使用されるため、効率的な符号帳検索も実行される。
代数CELP(ACELP(代数符号励起線形予測))コーデックにおいて、代数固定符号帳ベクトル(以降、固定符号ベクトルと称する)c(n)は、符号sおよび位置mのそれぞれを有するM個のユニットパルスを含み、これは以下の関係で与えられる。
Figure 0005264913
ここで、n=0の場合、s=±1およびδ(n)=1であり、n≠0の場合、δ(n)=0である。フィルタ246によってフィルタした後の固定符号ベクトルは、以下の形式で表し得る。
Figure 0005264913
概して、パルスMの数は、ビットレート可用性によって制限される。固定符号帳インデックス(または符号語)kは、各サブフレームにおけるパルスの位置および符号を表す。したがって、ルックアップテーブルなしでインデックスkそのものに含まれる情報によって、選択された符号ベクトルは復号化器において再構成可能であるため、符号帳の格納が不要である。マルチパルス手法[3]とは異なり、代数固定符号帳利得gは、全てのパルスで同じである。
符号帳インデックスkにおける代数符号ベクトルをc、フィルタH(z)246によってフィルタされた対応する符号ベクトルをy (k)と表す(図2a)。式(9)の代数符号帳検索は、次に、以下の基準の最大化として、行列表記を用いて記述可能である[1]。
Figure 0005264913
式中、Tはベクトル転置を示し、Hは、対角h(0)および下対角h(1),...,h(N−1)を持つ下三角テプリッツ(Toeplitz)畳み込み行列である。
Figure 0005264913
ベクトルd=Hは、x(n)およびh(n)の相関関係であり、逆フィルタされた標的ベクトルとしても知られる。それは、以下の重み付けされた合成フィルタによる、x(n)の時間反転フィルタを用いて算出可能であり、
Figure 0005264913
行列Φ=HHは、h(n)の相関行列であるからである。dおよびΦは共に、通常、符号帳検索の前に算出される。代数符号帳が非ゼロのパルスを少数のみ含む場合、全ての考えられるインデックスkの最大化基準の算出は非常に高速である[1]。
より多数のビットを有する代数符号帳は、非全数検索方法を用いて効率的に検索可能である。例えば、入れ子ループ検索[4]、パルスのサブセット内のパルスを検索する深さ優先ツリー検索[5]、および全体パルス置換[6]がある。ITU−T推奨G.723.1[7]では、マルチパルス逐次検索[3]と類似した、単純検索が使用されていた。参考文献[7]において、励起は、全てのパルスの固定利得を有するフレーム(ACELPと同様、トラック構成は存在しない)内のいくつかの符号付きパルスで構成される。パルスは、逆フィルタされた標的ベクトルd(n)を更新し、新規パルスをd(n)の絶対最大値に設定することによって、逐次的に検索される。いくつかの利得値で検索を繰り返すが、各反復中に利得は一定であると仮定する。本明細書中に開示される本発明の実施形態は、フレームをパルス位置のインターリーブされたトラックに分割可能であり、各トラックにいくつかのパルスを配置する、代数符号帳の検索のための方法および装置に関する。開示される符号帳検索方法および装置は、最大の尤度信号に基づく一定の基準を最大化することで、パルスの逐次検索の利用を実施する。次に固定符号帳利得を各段階で再算出する。検索されるトラックの順序を変更することで、いくつかの反復を使用可能である。
符号帳検索方法および装置のいくつかの非制限的な実施形態を、本発明の説明のために、以下に開示する。
§代数固定符号帳の構造
符号帳の構造は、インターリーブされた単一パルス置換(ISPP)の設計に基づいてもよい。この構造において、パルス位置は、インターリーブされた位置のいくつかのトラックに分割される。例えば、インターリーブされた位置の4つのトラック、T、T、TおよびTに分割される64位置符号ベクトルは、以下の表Iで示されるように、各トラックで16個の位置が生じる。以下の例にこの構造を使用する。
Figure 0005264913
単一の符号付きのパルスを各トラック(M=4)に配置する場合、パルス位置は4ビットで符号化され、その符号は1ビットで符号化されて、20ビットの符号帳となる。2つの符号付きのパルスを各トラックに配置する場合、この2つのパルス位置は8ビットで符号化され、その対応する符号は、パルスの順序付けを活用することで、1ビットのみで符号化できる。つまり、この特定の代数符号帳構造のためにパルス位置および符号を特定するには、合計、4×(4+4+1)=36ビットが必要である。他の符号帳構造は、例えば、各トラックT、T、TおよびTにおいて、3、4、5または6個のパルスを配置することで、設計できる。各トラックのパルスの符号化は、参考文献[8]に記載されている。
符号帳構造の別の例には、インターリーブされた位置の2つのトラックTおよびTに分割される64位置の符号ベクトルがあり、これにより、表IIに示されるように、各トラックで32位置が生じる。単一の符号付きのパルスを各トラックに配置する場合、パルス位置は5ビットで符号化され、その符号は1ビットで符号化され、12ビットの符号帳となる。さらに、各トラックにより多くのパルスを配置する、またはいくつかのパルスの符号を固定することによって、他の符号帳構造も設計可能である。
Figure 0005264913
トラック数およびトラック毎のパルス数の他の組み合わせも使用可能である。ITU−T推奨G.718コーデック実施例フレームワークで使用されるため(本明細書中、以下に概説される)、上記の12ビットおよび20ビット符号帳について詳細に示されている。
前述したように、表Iで示される構成を有する20ビット符号帳において、1つのトラックの各パルス位置を4ビットで符号化し、パルスの符号を1ビットで符号化する。位置インデックスは、サブフレーム内のパルス位置をトラック数で除する(整数分割)ことによって求められる。剰余により、トラックインデックスが求められる。例えば、位置31におけるパルスは、31/4=7の位置インデックスを有し、インデックス3を有するトラック(第4のトラック)に属する。この例示的実施形態において、符号インデックスは、正の符号について0、負の符号について1に設定される。したがって、符号付きのパルスのインデックスは、以下の関係で示される。
Figure 0005264913
式中、mは位置インデックス、sは符号インデックス、P=4は、トラック毎のビット数である。
§自己相関の手法
FCB(固定符号帳)検索手順を簡略化するための通常の手法は、自己相関法[9]を使用することである。この手法に従い、以下の要素を有する式(12)からの相関関係Φの行列は、
Figure 0005264913
式(16)で総和の上限、下限を修正することにより、
Figure 0005264913
となるようにテプリッツ形式に誘導され、ここで、以下のようになる。
Figure 0005264913
自己相関の手法により、NxN(13)の畳み込み行列式の修正から、以下の形式の(2N−1)xNの行列になる。
Figure 0005264913
この行列を用いるHcの畳み込みにより、それぞれ長さNの2つのセグメントを畳み込む際に取得される、2N−1の長さの符号ベクトルが生じる。共分散手法では、畳み込みの最初のN個のサンプルのみが考慮され、このサブフレーム限度を越えるサンプルは考慮されない。この手法は、本発明の技術で使用可能である。
自己相関手法を用いるということは、平均2乗重み付けされた誤差が、2N−1個のサンプルで最小化されるということを意味する。これは、N個の音声サンプルの後のゼロ値サンプルを重み付けされた合成フィルタH(z)246へ入力することで、2N−1個のサンプルで標的信号x(n)を算出することを必要とする。この結果、d=Hで与えられる信号x(n)の演算処理は、新規行列の次元を考慮するように修正される。近似として、信号x(n)およびd(n)の演算処理は従来の手法で実行可能であるが、フィルタされた固定符号ベクトルy (k)(n)のエネルギーの演算処理は、自己相関手法を用いて実行可能である。
式(10)〜(12)から、M個のパルスを有する代数固定符号帳では、最大化される基準は以下のように表すことができる。
Figure 0005264913
自己相関手法を使うと、これは以下の式で表される。
Figure 0005264913
式(7)から、代数符号帳利得は、以下の式で表すことができる。
Figure 0005264913
自己相関手法の場合は、以下の式になる。
Figure 0005264913
単一のパルスに対して、d(n)の絶対最大値にパルスが設定されるように検索基準が下がるため、自己相手法は、逐次マルチパルス検索[3]で使用されている。
§高速代数固定符号帳検索
例えば、固定符号帳において高速代数符号帳検索を実行するための方法および装置について、次に説明する。高速代数符号帳検索を実行するための方法および装置の一般的な概念は、いくつかの反復においてパルスを逐次的に検索するということである。以下の非制限的な例示的実施形態では、自己相関手法が使用される。しかし、より普通の共分散手法[8]も使用可能である。該方法および装置の根本的な原理は、各新規パルス決定後の固定符号帳利得gおよび逆フィルタされた標的ベクトルd(n)の更新ということである。基本的な検索を、以下のステップで概説する。
1.式(14)および(17)を使用して、事前に(つまり、検索手順の反復部分が入力される前に)、逆フィルタされた標的ベクトルd(n)(この実施形態では、代数固定符号帳の検索に使用される参照信号)およびベクトルα(n)(または共分散手法の場合には行列Φ)の両方を算出する。
2.各反復の第1の段階において、第1のパルス位置mは、典型的に、逆フィルタされた標的ベクトルd(n)の絶対最大値に設定され、nは、長さNのサブフレーム内のサンプルインデックスである(または共分散手法の場合、d(m)/φ(m、m)を最大化することで設定される)。パルス符号は、d(m)の符号で与えられる。
3.以降の段階(各新規パルスの決定後)において、代数固定符号帳利得gが再び算出され、次に、逆フィルタされた標的ベクトルd(n)を更新するために利得gを使用する。
4.各新規パルスmの位置は、更新された逆フィルタされた標的ベクトルd(n)の絶対最大値として求められ、パルス符号は、サンプルd(m)の符号によって与えられる。
5.より高い符号化の効率性を得るために、mの異なる位置から始めて、上記のステップ2〜4を反復することが可能である(例えば、2回目の反復において、d(n)の2番目に大きい絶対最大値、3回目の反復において、d(n)の3番目に大きい絶対最大値、等)。式(12)の検索基準を最大化する反復が、最終的に、パルス位置選択のために使用される。
以下の説明は、インターリーブされた位置のいくつかのトラックで構成される固定符号帳で高速代数符号帳検索を実行するための方法および装置の使用について説明する。ここで、Mはパルス数、Lはトラック数、Nはサブフレーム長である。まず、M=L=4である特定の状況の説明について示す。次に、M個のパルス(これもM=Lである場合)の場合の手順が一般化され、さらに、M≠Lである場合に拡張される。
§開示された検索方法および装置の一般的な手順
高速代数符号帳検索を実行するため、4つのパルストラック位置を有し、トラック毎に1つのパルスを有する固定符号帳を検索するための、方法および装置の実施例を次に説明する。
FCB検索手順は、式(14)で定義される逆フィルタされた標的ベクトルd(n)(この実施形態においては、代数固定符号帳の検索のために使用される参照信号)および式(17)で定義されるベクトルα(k)(または式(16)で定義される行列φ(i,j))の算出で開始される。以下の説明において、インデックスiは、トラック内のパルスの位置を示し(表Iまたは表IIを参照)、インデックスnは、サブフレーム内のサンプルの数を示す(ここで、n=0,...,N−1)。
第1の反復において、mは、トラックTで決定されるパルス位置、mはトラックTで決定されるパルス位置、mはトラックTで決定されるパルス位置、およびmはトラックTで決定されるパルス位置を指定する。
単一のパルスの場合、式(19)の基準は、以下のように誘導される。
Figure 0005264913
かつ、自己相関手法の場合、式(20)は、以下のように誘導される。
Figure 0005264913
式(24)に示され得るように、第1のパルス位置は、
Figure 0005264913
について、逆フィルタされた標的ベクトルd(i)の最大絶対値のインデックスとして求められる。すなわち、
Figure 0005264913
である。かつ、その符号は、d(m)の符号によって求められる。すなわち、
Figure 0005264913
である。
式(22)から、第1のパルスの利得は、以下の関係により与えられる。
Figure 0005264913
または、自己相関手法の場合、以下の関係により与えられる。
Figure 0005264913
第2の段階(第2のパルス検索)において、標的信号は、以下の式のように、標的信号x(n)から第1のパルスの寄与分を減算することで更新される。
Figure 0005264913
上で使用される括弧内の上位インデックスは、[0,...,M-1]の範囲からのものであり、検索されたパルス番号jに対応する。なお、符号帳インデックスkは、信号y (k)(n)を表すために、便宜上、省略している。
式(11)を使うと、式(29)は以下のように表すことができる。
Figure 0005264913
第2のパルス位置および利得を見出すには、
Figure 0005264913
について、逆フィルタされた標的ベクトルd(i)が、以下のように更新される。
Figure 0005264913
自己相関手法の場合、逆フィルタされた標的ベクトルd(n)は、以下のように更新される。
Figure 0005264913
式(25)および(26)と同様に、第2のパルスの位置および符号は、
Figure 0005264913
について、以下の関係式を用いて求められる。
Figure 0005264913
第3段階は、第2段階と同様に実行される。唯一の違いは、第3のパルスの位置および符号を見出すために、第1および第2のパルスの両方の寄与分を考慮するということである。
式(21)から、2つのパルスの後の利得gが、以下の関係式を用いて再び算出される。
Figure 0005264913
かつ、自己相関手法の式(22)から、次のように計算できる。
Figure 0005264913
標的信号の更新は、以下の関係式を用いて行われる。
Figure 0005264913
かつ、
Figure 0005264913
について、ベクトルd(i)の更新が、以下の関係式を用いて行われる。
Figure 0005264913
以下の関係による自己相関手法を用いると、次のようになる。
Figure 0005264913
式(25)および(26)と同様に、第3のパルスの位置および符号は、
Figure 0005264913
について、以下のように求められる。
Figure 0005264913
同様に、第4段階において、自己相関手法を用いて、以下のように、
Figure 0005264913
について、逆フィルタされた標的ベクトルd(n)の更新を行う。
Figure 0005264913
ここで、第3のパルスの固定符号帳利得g (2)は、以下の式で与えられる。
Figure 0005264913
第4のパルスの位置および符号は、以下の関係式を用いて、
Figure 0005264913
について与えられる。
Figure 0005264913
上記の手順を用いて、4パルス全ての位置および符号を求める。
上記の手順を、異なるトラックで各反復を開始することで、L=4回繰り返す。例えば、第2の反復において、パルス位置mは、トラックTへ割り当てられ、パルス位置mはトラックTへ割り当てられ、パルス位置mは、トラックTへ割り当てられ、パルス位置mは、トラックTに割り当てられる。最終的に、平均2乗重み付けされた誤差を最小化する反復の選択されたパルス位置および符号を選択し、最終的な固定符号ベクトルおよびフィルタされた固定符号ベクトルを形成する。より具体的には、全ての反復後、最良の一組のパルス位置および符号を、以下の基準を最大化するものとして選択する。
Figure 0005264913
式中、y (k)(n)は、最適な符号帳インデックスkについて、式(11)によって与えられる。
この手順は、4を超えるパルスに対して、および反復を実行する異なる方法に対して、容易に拡張できる。さらに、この手順は、いくつかのパルスが各パルストラック位置に配置される場合にも拡張できる。
4つのトラック内の4つのパルスの場合、以下の前提を用いて、以下のように手順を概説することができる。パルスは逐次的に検索され、逆フィルタされた標的ベクトルd(n)(この実施形態では、代数固定符号帳の検索のために使用される参照信号)が各段階で更新される。段階の数は、パルスMの数と等しい。反復の数は、トラックLの数と等しい。また、自己相関手法が使用される。
1.各反復において異なるトラックで開始して、L(パルス位置トラックの数に対応)回の反復において、手順を繰り返す。
2.各反復は、M(パルス数に対応)段階で構成される。パルスは、1つずつ、一回につき1つのトラックで検索される。
3.逆フィルタされた標的ベクトルd(n)およびベクトルα(n)は、共に、検索手順の反復部分に入る前に、式(14)および(17)を用いて、事前に算出される。
4.各反復中に、第1段階は、第1のパルス位置mの決定より成る。これは、典型的には、最初のトラックで逆フィルタされた標的ベクトルd(n)の絶対最大値に設定される。パルス符号は、d(m)の符号で与えられる。
5.以下の段階において、固定符号帳利得gは、各新規パルスの決定後に再び算出され、さらに、逆フィルタされた標的ベクトルd(n)を更新するために用いられる。
6.新規パルスmの位置は、更新された逆フィルタされた標的ベクトルd(n)の絶対最大値として求められ、パルス符号は、d(m)の符号によって求められる。
7.手順の上記の演算4〜6はそれぞれ、異なるトラックで開始され、L回繰り返される。式(12)の検索基準を最大化する反復が、最終的にパルス位置および符号の選択として使用される。
§M個のトラックにおけるM個のパルスの検索のための手順
上で記載されるように、高速代数符号帳検索を実行するための方法および装置は、さらに、以下のように、M個のパルスについて一般化できる。この例において、トラック数は検索するパルス数と等しく、すなわちM=Lである。
手順は、以下の工程に要約できる。
1.逆フィルタされた標的ベクトルd(n)(この実施形態では、代数固定符号帳の検索のために使用される参照信号)および相関ベクトルα(n)を算出する。
2.第1の反復を実行する。パルス位置mをトラックTに、パルス位置mをトラックTに、パルス位置mをトラックTに、パルス位置mをトラックTに、...、パルス位置mをトラックTM−1に割り当てる(トラック毎に1つのパルスと仮定する)。
3.
Figure 0005264913
について以下の式を算出することにより、第1のパルスの位置および符号を決定する。
Figure 0005264913
4.
Figure 0005264913
について以下の式を算出することにより、第2のパルスの位置および符号を決定する。
Figure 0005264913
5.j=2からM−1について算出することにより、他のパルスの位置および符号を決定する。
Figure 0005264913
ここで、
Figure 0005264913
である。
6.それぞれ、式(10)および(11)を用いて、固定符号ベクトルc(n)およびフィルタされた固定符号ベクトルy (k)(n)を算出する。
7.異なるトラックにパルスを割り当てることで、工程2から手順を繰り返す。反復数はLと等しい。
8.式(46)の基準を最大化する反復に対応する一組のパルスを選択する。
§L個のトラック内のM個のパルスの検索手順
上記の手順を、多数のM個のパルスを多数のL個のトラックで検索する状況に、さらに拡張可能である。MはLを整数で乗じた数である。この例において、トラック毎にいくつかのパルスが存在する。この状況は、1つのトラックのみが使用される場合(つまり、ISPP手法が使用されない一般的なケース)のケースを含む。
同じトラック内のパルスを、式(47)から(60)を用いて、逐次的に検索する。トラックのパルスは、全てのトラック位置で検索される。2つ以上のパルスが同じ位置を占める、いくつかの状況が考えられる。これらのパルスが同じ符号を有する場合、これらは、この位置における符号帳の寄与分を追加および強化する。パルスが反対の符号を有することは許されない。
トラック毎の複数パルスの逐次検索では、検索パルスの順序に影響を受ける。利用可能な2つの基本的な逐次検索手法が存在する。第1の手法は、他のトラックを検索する前に、1つのトラック内のその全パルスを検索すると想定するものである。第2の手法は、トラックTにおいて第1のパルスを、トラックTにおいて第2のパルスを、というように検索することを想定するものである。必要な場合、パルスは、以下のトラックにおいて、トラックTL−1まで、1トラックにつき1つのパルスで、等のように、再び検索される。これらの2つの手法の例を、表IIIに示す。実験で観察すると、第2の手法は、より良い結果をもたらす。したがって、第2の方法が以下の実施例で使用される。さらなる複雑な設定が可能な場合には、両方の手法を使用することが可能であるが、さらなる反復が生じることになる。
Figure 0005264913
さらに別の手法は、パルスを次に検索するトラックを選択するために、いくつかの基準に基づいてもよい。こうした基準は、例えば、逆フィルタされた標的ベクトルd(n)の絶対最大値、または更新値とすることができる。この基準は、全てのパルスがまだ割り当てられていないトラックを選択するためにのみ、使用可能である。
§参照信号内の検索
検索手順の効率性をさらに高めるために、パルスの振幅および符号を、固定参照信号b(n)を基にして決定できる。例えばAMR−WB[8]において使用された信号選択されたパルス振幅手法において、位置nにおける固定パルスの符号は、その位置の参照信号の符号と等しくなるよう設定される。さらに、参照信号b(n)は、非常に大きい代数符号帳の場合、いくつかのパルス位置を設定するように使用可能である。示された手順における、信号選択されたパルス振幅手法の応用例を以下に示す。この非制限的な例示的実施形態において、参照信号b(n)は、逆フィルタされた標的ベクトルd(n)および理想的な励起信号r(n)の組み合わせとして定義される。
参照信号は、以下の式で表し得る。
Figure 0005264913
これは、正規化された逆フィルタされた標的ベクトルd(n)および理想的な励起信号r(n)の固定重み付けされた和である。E=ddは、逆フィルタされた標的ベクトルのエネルギーであり、E=rrは、理想的な励起信号のエネルギーである。δの値は、少数のパルスでは1に近く、多数のパルスでは0に近い。参照信号は、以下の式でも表すことができる。
Figure 0005264913
式中、スケーリング係数β=δ/(1−δ)である。典型的な実施形態において、2パルス(δ=0.8)ではβ=4、4パルス(δ=0.66)ではδ=2、8パルス(δ=0.5)ではδ=1である。
理想的な励起信号r(n)は、ゼロ状態で重み付けされた合成フィルタH(z)の逆フィルタに通すことによって、標的信号x(n)をフィルタすることで得られる。これは、ゼロの状態のフィルタH(z)の逆フィルタに通すことによって、標的信号x(n)をまずフィルタし、r(n)を得ることでも行うことができる。次に、信号r(n)を、選択された適応ベクトルの寄与分を減算することにより更新する。すなわち、n=0,・・・,N−1について、r(n)=r(n)−gv(n)である。
信号r(n)またはこの信号の一部分は、複雑さを軽減するために、LP残差信号によって近似できる。例示的な本実施例において、信号r(n)は、サブフレーム前半においてのみ、フィルタH(z)の逆フィルタに通すことによって、標的信号x(n)をフィルタすることにより算出される。LP残差信号は、サブフレームの後半で使用される。このLP残差信号は、以下の関係式で計算される。
Figure 0005264913
式中、
Figure 0005264913
は量子化されたLPフィルタ係数であり、s(n)は入力音声信号である。
上述のように、式(62)のスケーリング係数βは、逆フィルタされた標的ベクトルd(n)に対する参照信号b(n)の依存を制御し、さらに、パルス数が増加するにつれて、一般的に低くなる。この手法は、考えられる位置について、知的に推定を行う。パルス位置を決定するために、式(62)で定義される参照信号b(n)が使用される。
図3に関し、参照信号b(n)を用いた検索パルスの手順は、以下の工程によって要約できる。ISSP手法はここでは使用されていないと仮定する。前の節の式とは異なる式のみを示す。
1.工程301で、計算器は、逆フィルタされた標的ベクトルd(n)、相関ベクトルα(n)および参照信号b(n)を算出する。
2.工程302で、計算器は、以下の関係式を用いて、第1のパルスの位置および符号を計算する。
Figure 0005264913
参照信号b(n)は、全てのN値のサブフレーム全体で算出されるエネルギーEおよびEにより、式(62)を用いて算出される。
3.工程303では、パルスインデックスjは、1に設定される。
4.計算器は、式(49)から(52)を計算して、第1のパルス(演算304)の固定符号帳利得gを決定し、工程305において、逆フィルタされた標的ベクトルd(n)および参照信号b(n)を更新し、最終的に第2のパルスの位置および符号を計算する(工程306)。
Figure 0005264913
5.演算304〜306において、式(55)〜(58)を使用して、j=2からM−1の他のパルスの位置を決定する(演算307および308)。
Figure 0005264913
6.工程309では、計算器は、式(10)および(11)をそれぞれ使い、代数符号ベクトルc(n)およびフィルタされた代数符号ベクトルy (k)(n)を算出する。
ISSP手法を使用する場合、上記の手順は以下のように変わる。上記のステップ1の後、反復プロセスを開始する。第1の反復において、パルス位置mはトラックTに対して、パルス位置mはトラックTに対して、パルス位置mはトラックTに対して、パルス位置mはトラックTに対して、...、パルス位置mM−1はトラックTM−1に対して割り当てられ、ここで、トラック毎に1つのパルス(M=L)が仮定される。手順は、ステップ6まで継続される。次に、パルスを異なるトラックに割り当てることで、工程302から309へ手順を繰り返す。この反復数はLと等しい。最後に、式(46)の基準を最大化する一組のパルス位置および符号を選択する。
全ての検索手順中で、Eの値は一定であり、したがって、検索手順の最初において、一度のみで算出可能である。Eの値は、更新された逆フィルタされた標的ベクトルd(1)(i)の値を使用するため、各反復の各段階で再算出する必要がある。さらに、ステップ4に関して、全N値でのエネルギーEおよびEを算出可能であるが、複雑さを軽減するために、対応するトラックの値のみで、これらをさらに算出可能である。次に、Eは更新された信号d(1)(i)のエネルギーを示し、同様に、Eは、対応するトラックのみのiの信号r(i)のエネルギーを表す。ステップ5と同様に、エネルギーEおよびEは、d(1)(i)およびr(i)のみのN/Lサンプルに、再び対応する。
前の式で使用されるスケーリング係数βの値は、全ての段階で一定である。しかし、その値は、検索段階によって、変化可能であり、スケーリング係数の値を適応可能にさせる。この概念は、その後の段階でその値を増加させるということである。これは、決定するべきパルスの数が低下している後の段階で、参照信号b(n)における、更新された逆フィルタされた標的ベクトルd(n)の寄与分を強調する。実際に、後の段階では、参照信号b(n)は、更新された逆フィルタされた標的ベクトルd(n)のみによって近似することができ、前のセクションからの手順を、後の段階で利用可能である。例を、さらに式(87)および(88)に示す。適応スケーリング係数は、図3では、β、j=0、...,M−1によって示される。
§符号の事前選択
検索をさらに簡略化するために、参考文献[10]に記載される信号選択されたパルス振幅方法を使用可能である。次に、特定の位置のパルス符号を、その位置における式(62)からの参照信号b(n)の符号に設定する。その目的のために、元の参照信号b(n)の符号を含むベクトルz(n)が構成される。ベクトルz(n)は、符号帳検索プロセスの開始時、つまり、反復ループに入る前に、算出される。このようにして、検索されるパルスの符号が事前選択され、式(64)および(65)は、以下の式に変更される。
Figure 0005264913
他の段階では、同じ原則が使用され、以下の関係式を用いて、j=1からM−1について、パルスの位置および符号が決定される。
Figure 0005264913
符号事前選択の同じ原則を、ベクトルz(n)が元の逆フィルタされた標的ベクトルd(n)の符号を含む、逆フィルタされた標的ベクトルd(n)を使用した検索に関して使用可能である。
§トラック順序の決定
上述のとおり、検索手順は、トラック毎に、逐次的にパルスを検索する。トラックの順序は、トラック番号に従って逐次的に選択可能である、つまり、20ビットの代数固定符号帳では、第1の反復では、トラックをT−T−T−Tの順序で、第2の反復はT−T−T−T等の順序等で検索する。しかし、トラックの逐次的な順序は最適ではなく、別のトラックの順序が有用である可能性がある。考えられる解決法として、各トラックにおける参照信号b(n)の絶対最大値に従って、トラックの順序を決定することである。
トラックの順序付けの例として、20ビットの代数固定符号帳を考える。さらに、
Figure 0005264913
は、トラックT内の参照信号b(n)の絶対最大値、
Figure 0005264913
は、トラックTのb(n)の絶対最大値、
Figure 0005264913
は、トラックTのb(n)の絶対最大値、および
Figure 0005264913
は、トラックTのb(n)の絶対最大値として定義される。検索手順において反復ループに入る前に、各トラックのb(n)の絶対最大値が、降順に編成される。上記の例では
Figure 0005264913
とする。次に、第1の反復は、T-T−T−Tの順序で、第2の反復はT−T−T−Tの順序で、第3の反復はT-T-T−Tの順序で、および第4の反復はT-T−T−Tの順序で、トラックを検索する。
上記の例のトラックの順序の決定は、パルスの考えられる位置をより正確に推定するために役立つ。このトラックの順序の決定は、ITU−T推奨G.718コーデックで実施される。逆フィルタされた標的ベクトルd(n)を用いて検索を実行する場合、トラックの順序を編成するために同じ原則を使用可能である。
§検索手順の概要
高速代数符号帳検索方法および装置は、参照信号b(n)、自己相関手法、トラックの順序付けおよびパルスの符号の事前選択で検索を用いる場合、図4を参照して、以下のように概説できる。ここではISPP手法を使用する。
1.工程401では、計算器は、逆フィルタされた標的ベクトルd(n)、相関ベクトルα(n)、参照信号b(n)、および符号ベクトルz(n)を算出する。
2.工程402では、計算器は、トラックの順序を決定する。
3.工程403では、反復インデックスiは、1に設定される。
4.工程404では、各反復において、計算器は、異なるトラックで各反復を開始し、ステップ2からのトラック決定に関して、残りのトラックの順序を決定し、トラックへパルスの割り当てを決定する。
5.工程405では、第1段階において、計算器は、参照信号b(i)の最大絶対値のインデックスとして、第1のパルスの位置を決定する。iは適切なトラックに対応する。第1のパルスの符号は、符号ベクトルz(i)によって求めることができる。所定のトラックにおいてiについて、
Figure 0005264913
なお、式(76)において、さらなる演算的に複雑な絶対値の代わりに符号ベクトルを使用して、参照信号b(i)の最大値を求める。
6.工程406では、パルスインデックスは、j=1に設定される。
7.工程407では、計算器は、第1のパルスの固定符号帳利得gを算出する。以前に見出されたパルス(パルスm、...、mj−1)の固定符号帳利得は、以下の関係で与えられる。
Figure 0005264913
ここで、分子および分母を以下のように表す。
Figure 0005264913
によって初期化を行う。
8.工程408において、トラックが変更される。
9.工程409において、計算器は、元の標的信号x(n)から見出されたパルスの寄与分を減算することで、標的信号を更新する。式(11)を使うと、これは、適切なトラックに対応するiについて、以下のように示され得る。
Figure 0005264913
次に、式(81)からの
Figure 0005264913
を、式(14)に代入し、式(17)を用いて、計算器は、逆フィルタされた標的ベクトルd(i)の更新を以下のように決定する。
Figure 0005264913
次に、参照信号b(i)は、以下の関係式を用いて更新される。
Figure 0005264913
式(83)におけるβは、適応スケーリング係数値である。
10.工程410において、計算器は、以下のように、式(76)および(77)と同様に、第2のパルスの位置および符号を算出する。
Figure 0005264913
11.工程411において、パルスのインデックスjがM−1未満である場合、インデックスjは、次のパルスの位置および符号を決定するために、演算407〜410に戻る前に、工程412において1が加算される。反復i=1の全ての段階が完了するまで、つまり、全てのパルスの位置および符号が見つかるまで、これを繰り返す。
12.工程411では、パルスのインデックスjがM−1と等しい場合、計算器は、演算413において、それぞれ、式(10)および(11)を用いて固定符号ベクトルc(n)およびフィルタされた固定符号ベクトル
Figure 0005264913
を計算する。
13.工程414では、反復のインデックスiが反復数Lよりも小さい場合、インデックスiは、演算415で1増加され、工程404〜413に戻ることで、次の反復を行う。全ての反復が完了するまでこれを繰り返す。
14.工程414では、反復のインデックスiがLと等しい場合、セレクタは、検索された(最良の)符号ベクトルc(n)およびフィルタされた固定符号ベクトルy (k)(n)として、演算416の式(46)の基準を最大化する、異なるL回の反復のうちの1回で計算された、一組のパルス位置および符号を選択する。
§G.718コーデックにおける高速符号帳検索の実施例
上記の高速代数固定符号帳検索方法および装置は、最近標準化されたITU−T推奨G.718(以前はG.EV−VBRとして公知であった)コーデックのベースラインで実施および試験された。G.718コーデックの高速代数固定符号帳検索の実施例は、図4を参照する、上記の実施例に対応している。G.718コーデックは、低位の層の復号化に影響を与えずに高位の層ビットストリームを破棄できる、5つの層を含む、埋め込みコーデックである。第1の層(L1)は、分類ベースのACELP技術を使用し、第2の層(L2)は第1の層からの誤差信号を符号化するための代数符号帳技術を使用し、これより上位の層は、下位層から誤差信号をさらに符号化するためのMDCT技術を使用する。コーデックはさらに、12.65kbit/sでのITU−T推奨G.722.2コーデックによる相互運用性を可能にするためのオプションを備えている。符号化器で呼び出される場合、このオプションは、第1および第2の層L1およびL2を置換するために、G.722.2モード2(12.65kbit/s)の使用を有効化する。代数FCB検索は、第1の2つの層、または、G.722.2オプションの場合、G.722.2コア層で使用される。これら全ては、狭帯域および広帯域入力信号の両方で内部サンプリング周波数12.8kHz、および20msのフレーム長を使用する。各フレームは、N=64サンプルで4つのサブフレームに分割される。
第1の層L1の符号化は、信号分類ベースの符号化を利用する。4つの異なる信号分類は、各フレームの異なる符号化、つまり、無声符号化、有声符号化、移行符号化、および標準的符号化のために、ITU−T推奨G.718コーデックで考慮される。L1内の代数FCB検索は、20ビットおよび12ビット符号帳を利用する。異なるサブフレームでのその使用は、符号化モードに依存する。層L2におけるFCB検索は、2つのサブフレームで20ビット符号帳、標準的及び有声符号化フレーム内の他の2つのサブフレームで12ビット符号帳、3つのサブフレーム内で20ビット符号帳、および移行および無声符号化フレーム内の1つのサブフレームで12ビット符号帳を利用する。G.722.2オプション内のFCB検索は、4つ全てのサブフレーム内の36ビット符号帳を使用する。これらの符号帳設定を表IVに示す。
Figure 0005264913
スケーリング係数βの値は、以下のように、一定(全段階で同じ)として設定できる。
Figure 0005264913
しかしながら、上述のように、スケーリング係数βの値は、各段階で異なってもよい。実施例において、スケーリング係数βのその最適値は、20ビット代数固定符号帳では、以下のようであることが見出された。
Figure 0005264913
および、12ビット符号帳の場合、
Figure 0005264913
値β=∞は、その更新された参照信号b(n)は、この段階において、更新された逆フィルタされた標的ベクトルd(n)と等しいことを意味する。
式(12)の基準を、上述のようにコーデックで使用可能である。しかし、2つの候補値の間で比較する際に除算を避けるために、基準は、乗算を使用するのみで実行される。詳細については、例えば、参考文献[8]を参照されたい。
§高速符号帳検索の性能
上記の高速代数固定符号帳検索方法および装置の性能は、元のFCB検索[8]を上記のものに代えたG.718コーデックで試験された。この目的は、複雑性を低減させて、同様の合成音声品質を実現させることであった。
表V〜Xは、セグメント信号対雑音比(セグメントSNR)値を用いて測定された新規高速FCB検索性能を示す。表において、「FCB1」は参考文献[8]で示される技術を表し、「FCB2」は、参考文献[6]で示される技術を表し、このレポートに示される技術は「新規FCB」と呼ばれる。男性および女性の英語話者の両方を含む、公称レベルでのはっきりした音声文のデータベースが、話声材料として使用された。データベースの長さは約456秒であった。G.718コーデック内の方法の性能は、代数固定符号帳検索が使用される層、つまり、層L1、L2およびG.722.2オプションコア層で評価された。これによって、3グループの試験を行った。すなわち、8kbpsの試験(層L1のみ)、12kbpsの試験(層L1およびL2を使用する)、および12.65kbpsでの、G.722.2オプションの試験である。上記のアルゴリズムを用いて、12ビットFCBおよび20ビットFCBで、上記の技術を共に実行した。G.722.2のオプションでは、上記の技術を36ビットFCBで実行した。
FCB検索の複雑性および全G.718符号化器複雑性を、表VIIおよび表IXに示す。最悪の場合について、wMOPS(weighted Million Operations Per Second)で複雑性が示される。
Figure 0005264913
表V−VIIから分かるように、表されるアルゴリズムは、参考文献[8]で提示される技術と比較して、わずかにセグメントSNRが低下するという犠牲が伴うが、演算処理の要件を大幅に低減させる。したがって、SNR低下がわずかであるG.718での第2の層(L2)においてのみ、提示されたアルゴリズムを使用することが決定された。したがって、推奨G.718は、層2で高速代数固定符号帳検索を使用する。実施例は、図4を参照する上記の実施例と対応している。
元のFCB検索[6]を高速代数固定符号帳検索方法および上記の装置に代えた、8kbpsでのITU−T推奨G.729.1コーデック[6]で、性能をさらに試験した。G.729.1コーデックは、40サンプルの4つのサブフレームを使用する。パルスm、mおよびmの位置はそれぞれ3ビットで符号化され、一方で、パルスmの位置は4ビットで符号化される。各パルス符号の符号は1ビットで符号化される。これにより、4パルスでは合計17ビットとなる。
Figure 0005264913
本発明を、その非制限的な例示の実施形態に関連して、上述の明細書内に記載するが、これらの実施形態は、本発明の精神および本質から逸脱することなく、添付の請求項の範囲内において、随意に修正が可能である。
§参考文献
[1] R. Salami, C. Laflamme, J−P. Adoul, and D. Massaloux, ”A toll quality 8 kb/s speech codec for the personal communications system (PCS)”, IEEE Trans, on Vehicular Technology, Vol. 43, No. 3, pp. 808−816, August 1994.
[2] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola−Pukkila, J. Vainio H. Mikkola, and K. Jarvinen, ”The Adaptive Multi−Rate Wideband Speech Codec (AMR−WB)”, Special Issue of IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 8, pp. 620−636, November 2002.
[3] S. Singhal and B. S. Atal, ”Amplitude optimization and pitch prediction in multipulse coders”. IEEE Trans. ASSP, vol.37, no.3, pp. 317−327, March 1989
[4] ITU−T Recommendation G.729 (1/2007), ”Coding of Speech at 8 kbit/s using Conjugate−Structure Algebraic−Code−Excited Linear Prediction (CS− ACELP),” January 2007.
[5] ITU−T Recommendation G.729 Annex A (11/96), ”Reduced complexity 8 kbit/s CS−ACELP speech codec”, November 1996.
[6] ITU−T Recommendation G.729.1 (05/2006), ”G.729 based Embedded Variable bit−rate coder: An 8−32 kbit/s scalable wideband coder bitstream interoperable with G.729,” May 2006.
[7] ITU−T Recommendation G.723.1 (05/2006), ”Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s”, May 2006.
[8] 3GPP Technical Specification 26.190, ”Adaptive Multi−Rate − Wideband (AMR−WB) speech codec; Transcoding functions,” July 2005; http://www.3qpp.org.
[9] I. M. Trancoso and B. S. Atal, ”Efficient procedures for finding the optimum innovation in stochastic coders”. Proc. ICASSP’86, pp. 2375−2378, 1986.
[10] US Patent 5754976: Algebraic codebook with signal−selected pulse amplitude/position combinations for fast coding of speech.
[11] ITU−T Recommendation G.718 ”Frame error robust narrowband and wideband embedded variable bit−rate coding of speech and audio from 8− 32 kbit/s”Approved in September 2008.
100 音声通信システム
101 通信チャネル
102 マイクロフォン
103,114 アナログ音声信号
104 アナログ/デジタル(A/D)変換器
105,113 デジタル音声信号
106 音声符号化器
107 符号化パラメータ
108 チャネル符号化器
109 チャネル復号化器
110 音声復号化器
115 デジタル/アナログ(D/A)変換器
116 ラウドスピーカユニット

Claims (33)

  1. 音声信号の符号化中に代数符号帳を検索する方法であって、
    前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
    前記代数符号帳の検索方法は、
    前記代数符号帳の検索で使用するための参照信号を計算するステップと、
    第1の段階において、(a)前記参照信号に関連して、かつ前記多数のパルス位置の中で、第1のパルスの位置を決定するステップと、
    前記第1の段階以降の多数の段階のそれぞれにおいて、(a)代数符号帳利得を再算出するステップと、(b)前記再算出した代数符号帳利得を用いて、前記参照信号を更新するステップと、(c)前記更新された参照信号に関連して、かつ前記多数のパルス位置の中で、別のパルス位置を決定するステップと、
    前記第1およびそれ以降の段階で決定される前記パルスの符号および位置を用いて、前記代数符号帳の符号ベクトルを算出するステップであって、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトルの前記パルスの数に対応する、ステップとを含む、方法。
  2. 前記多数のパルス位置は、一組のパルス位置のトラックに分割される、請求項1に記載の代数符号帳の検索方法。
  3. 第1の反復で、(a)前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの第1の割り当てを決定するステップと、(b)前記第1の段階および前記多数の以降の段階と、この第1の割り当てを用いた、前記代数符号帳の前記符号ベクトルの算出とを実行するステップと、
    前記第1の反復以降の多数の反復のそれぞれで、(a)前記第1およびそれ以降の段階のために、前記第1および他のパルスの前記位置の、前記パルス位置トラックへの別の割り当てを決定するステップと、(b)前記第1の段階および前記多数の以降の段階と、前記他の割り当てを用いた、前記代数符号帳の前記符号ベクトルの前記算出とを実行するステップとを含む、請求項2に記載の代数符号帳の検索方法。
  4. 前記パルス位置は前記パルス位置トラックでインターリーブされる、請求項2に記載の代数符号帳の検索方法。
  5. 所定の選択基準を用いて、前記第1およびそれ以降の反復で算出される前記符号ベクトルのうちの1つを選択するステップを含む、請求項3に記載の代数符号帳の検索方法。
  6. 前記第1の段階において、前記参照信号に関連して、前記第1のパルスの符号を決定するステップと、
    前記第1の段階以降の前記多数の段階のそれぞれにおいて、前記更新された参照信号に関連して、前記他のパルスの符号を決定するステップと、を含む、請求項1に記載の代数符号帳の検索方法。
  7. 前記参照信号の計算は、逆フィルタされた標的ベクトルを計算するステップを含む、請求項1に記載の代数符号帳の検索方法。
  8. 前記参照信号の計算は、逆フィルタされた標的ベクトルと理想的な励起信号との組み合わせとして前記参照信号を計算するステップを含む、請求項1に記載の代数符号帳の検索方法。
  9. スケーリング係数によって、逆フィルタされた標的ベクトルへの前記参照信号の依存性を制御するステップを含む、請求項1に記載の代数符号帳の検索方法。
  10. 前記以降の段階のそれぞれにおいて、前記スケーリング係数を変更するステップを含む、請求項9に記載の代数符号帳の検索方法。
  11. 前記第1の段階において、前記第1のパルスの位置を決定するステップは、前記第1のパルスの位置を、前記参照信号の最大値に設定するステップを含み、
    前記多数の以降の段階のそれぞれにおいて、前記他のパルスの位置を決定するステップは、前記他のパルスの位置を、前記更新された参照信号の最大値に設定するステップを含む、請求項1に記載の代数符号帳の検索方法。
  12. 異なるトラックで各反復を開始するステップを含む、請求項3に記載の代数符号帳の検索方法。
  13. 前記第1および他のパルスの符号を事前選択するステップを含む、請求項1に記載の代数符号帳の検索方法。
  14. 各反復について、前記パルス位置トラックの順序を決定するステップを含む、請求項3に記載の代数符号帳の検索方法。
  15. 前記第1および他のパルスの符号の事前選択は、前記最初に計算された更新されていない参照信号の符号を含むベクトルを構成するステップを含む、請求項13に記載の代数符号帳の検索方法。
  16. 前記他のパルスの位置を決定するステップは、前記他のパルスの位置を、前記更新された参照信号と前記符号を含む前記ベクトルとの積の最大値に設定するステップを含む、請求項15に記載の代数符号帳の検索方法。
  17. 音声信号の符号化中に代数符号帳を検索するための装置であって、
    前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
    前記代数符号帳の検索装置は、
    前記代数符号帳の検索で使用するための参照信号を計算するための手段と、
    第1の段階において、前記参照信号に関連して、かつ前記多数のパルス位置の中で、第1のパルスの位置を決定する手段と、
    前記第1の段階以降の多数の段階のそれぞれで、代数符号帳利得を再算出するための手段と、前記以降の段階のそれぞれにおいて、前記再算出した代数符号帳利得を用いて前記参照信号を更新するための手段と、前記以降の段階のそれぞれにおいて、前記更新された参照信号に関連して、かつ前記多数のパルス位置の中で、別のパルスの位置を決定するための手段と、
    前記第1およびそれ以降の段階で決定される前記パルスの符号と位置とを用いて、前記代数符号帳の符号ベクトルを算出するための手段であって、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトル内の前記パルスの数に対応する、手段と、を含む、装置。
  18. 音声信号の符号化中に代数符号帳を検索するための装置であって、
    前記代数符号帳は、多数のパルス位置と、それぞれ符号を有し、かつ前記パルス位置にわたって分布される多数のパルスとで形成される一組の符号ベクトルを含み、
    前記代数符号帳の検索装置は、
    前記代数符号帳の検索で使用するための参照信号の第1の計算器と、
    第1の段階において、前記参照信号に関して、かつ前記多数のパルス位置の中で、第1のパルス位置を決定するための第2の計算器と、
    前記第1の段階以降の多数の段階のそれぞれにおいて、代数符号帳利得を再算出するための第3の計算器と、前記以降の段階のそれぞれにおいて、前記再算出した代数符号帳利得を用いて前記参照信号を更新するための第4の計算器と、前記以降の段階のそれぞれにおいて、前記更新された参照信号に関して、かつ前記多数のパルス位置の中で、別のパルス位置を決定するための第5の計算器と、
    前記第1およびそれ以降の段階で決定される前記パルスの符号と位置とを用いる、前記代数符号帳の符号ベクトルの第6の計算器と、を含み、前記第1およびそれ以降の段階の数は、前記代数符号帳の前記符号ベクトル内の前記パルス数に対応する、装置。
  19. 前記多数のパルス位置は、一組のパルス位置トラックに分割される、請求項18に記載の代数符号帳の検索装置。
  20. 第1の反復において、(a)第7の計算器は、前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの第1の割り当てを決定し、(b)前記第2、第3、第4および第5の計算器は、前記第1の段階および前記多数の以降の段階を実行し、前記第6の計算器は、この第1の割り当てを用いて、前記代数符号帳の前記符号ベクトルを算出し、
    前記第1の反復以降の多数の反復のそれぞれにおいて、(a)第8の計算器は、前記第1およびそれ以降の段階のために、前記第1および他のパルスの位置の、前記パルス位置トラックへの別の割り当てを決定し、(b)前記第2の、第3、第4および第5の計算器は、前記第1の段階と、前記多数の以降の段階とを実行し、前記第5の計算器は、前記他の割り当てを用いて、前記代数符号帳の前記符号ベクトルを算出する、請求項18に記載の代数符号帳の検索装置。
  21. 前記パルス位置は、前記パルス位置トラックでインターリーブされる、請求項19に記載の代数符号帳の検索装置。
  22. 所定の選択基準を用いる、前記第1およびそれ以降の反復で算出される前記符号ベクトルのうちの1つの選択器を含む、請求項20に記載の代数符号帳の検索装置。
  23. 前記第1の段階において、前記第2の計算器は、前記参照信号に関して、前記第1のパルスの符号を決定し、
    前記第1の段階以降の前記多数の段階のそれぞれにおいて、前記第5の計算器は、前記更新された参照信号に関して、前記他のパルスの符号を決定する、請求項18に記載の代数符号帳の検索装置。
  24. 前記第1の計算器は、逆フィルタされた標的ベクトルを前記参照信号として計算する、請求項18に記載の代数符号帳の検索装置。
  25. 前記第1の計算器は、逆フィルタされた標的ベクトルと理想的な励起信号との組み合わせとして前記参照信号を計算する、請求項18に記載の代数符号帳の検索装置。
  26. 前記第1の計算器は、スケーリング係数によって、逆フィルタされた標的ベクトルへの前記参照信号の依存性を制御する、請求項18に記載の代数符号帳の検索装置。
  27. 前記第1の計算器は、前記以降の段階のそれぞれにおいて、前記スケーリング係数を変更する、請求項26に記載の代数符号帳の検索装置。
  28. 前記第1の段階において、前記第2の計算器は、前記第1のパルス位置を、前記参照信号の最大値に設定することで、前記第1のパルスの位置を決定し、
    前記以降の段階数のそれぞれにおいて、前記第5の計算器は、前記他のパルスの位置を、前記更新された参照信号の最大値に設定することで、前記他のパルスの位置を決定する、請求項18に記載の代数符号帳の検索装置。
  29. 異なるトラックで各反復を開始するための手段を含む、請求項18に記載の代数符号帳の検索装置。
  30. 前記第1および他のパルスの符号を事前選択するための第9の計算器を含む、請求項18に記載の代数符号帳の検索装置。
  31. 各反復について、前記パルス位置トラックの順序を決定するための第9の計算器を含む、請求項20に記載の代数符号帳の検索装置。
  32. 前記第9の計算器は、前記最初に算出された更新されていない参照信号の符号を含むベクトルを構成することで、前記第1および他のパルスの符号を事前選択する、請求項30に記載の代数符号帳の検索装置。
  33. 前記第5の計算器は、前記他のパルスの位置を、前記更新された参照信号および前記符号を含む前記ベクトルの積の最大値に設定する、請求項32に記載の代数符号帳の検索装置
JP2010524321A 2007-09-11 2008-09-11 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 Expired - Fee Related JP5264913B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US96000607P 2007-09-11 2007-09-11
US60/960,006 2007-09-11
PCT/CA2008/001620 WO2009033288A1 (en) 2007-09-11 2008-09-11 Method and device for fast algebraic codebook search in speech and audio coding

Publications (2)

Publication Number Publication Date
JP2010539528A JP2010539528A (ja) 2010-12-16
JP5264913B2 true JP5264913B2 (ja) 2013-08-14

Family

ID=40451528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010524321A Expired - Fee Related JP5264913B2 (ja) 2007-09-11 2008-09-11 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置

Country Status (4)

Country Link
US (1) US8566106B2 (ja)
JP (1) JP5264913B2 (ja)
CN (1) CN101842833B (ja)
WO (1) WO2009033288A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7993626B2 (en) * 2007-01-11 2011-08-09 Immunomedics, Inc. Methods and compositions for F-18 labeling of proteins, peptides and other molecules
DK2827327T3 (da) 2007-04-29 2020-10-12 Huawei Tech Co Ltd Fremgangsmåde til excitationsimpulskodning
CN101931414B (zh) 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US20110153337A1 (en) * 2009-12-17 2011-06-23 Electronics And Telecommunications Research Institute Encoding apparatus and method and decoding apparatus and method of audio/voice signal processing apparatus
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
AR085221A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Aparato y metodo para codificar y decodificar una señal de audio utilizando una porcion alineada anticipada
EP2550653B1 (en) 2011-02-14 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Information signal representation using lapped transform
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
AR085218A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Aparato y metodo para ocultamiento de error en voz unificada con bajo retardo y codificacion de audio
BR112013020592B1 (pt) 2011-02-14 2021-06-22 Fraunhofer-Gellschaft Zur Fôrderung Der Angewandten Forschung E. V. Codec de áudio utilizando síntese de ruído durante fases inativas
NO2669468T3 (ja) * 2011-05-11 2018-06-02
WO2012172750A1 (ja) * 2011-06-15 2012-12-20 パナソニック株式会社 パルス位置探索装置、符号帳探索装置、及びこれらの方法
US9263053B2 (en) * 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9070356B2 (en) * 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
WO2013180164A1 (ja) * 2012-05-30 2013-12-05 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
CN104854656B (zh) * 2012-10-05 2017-12-19 弗劳恩霍夫应用研究促进协会 在自相关域中利用acelp编码语音信号的装置
US10499176B2 (en) 2013-05-29 2019-12-03 Qualcomm Incorporated Identifying codebooks to use when coding spatial components of a sound field
MX362490B (es) 2014-04-17 2019-01-18 Voiceage Corp Metodos codificador y decodificador para la codificacion y decodificacion predictiva lineal de señales de sonido en la transicion entre cuadros teniendo diferentes tasas de muestreo.
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
DE69516522T2 (de) * 1995-11-09 2001-03-08 Nokia Mobile Phones Ltd., Salo Verfahren zur Synthetisierung eines Sprachsignalblocks in einem CELP-Kodierer
US5867814A (en) * 1995-11-17 1999-02-02 National Semiconductor Corporation Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
US5751901A (en) 1996-07-31 1998-05-12 Qualcomm Incorporated Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
US6161086A (en) * 1997-07-29 2000-12-12 Texas Instruments Incorporated Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
AU1615100A (en) * 1998-11-09 2000-05-29 Broadcom Corporation Forward error corrector
US6295520B1 (en) * 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
AU2003207498A1 (en) 2002-01-08 2003-07-24 Dilithium Networks Pty Limited A transcoding scheme between celp-based speech codes
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US7860710B2 (en) 2004-09-22 2010-12-28 Texas Instruments Incorporated Methods, devices and systems for improved codebook search for voice codecs
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
SG123639A1 (en) * 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
US20070150266A1 (en) 2005-12-22 2007-06-28 Quanta Computer Inc. Search system and method thereof for searching code-vector of speech signal in speech encoder

Also Published As

Publication number Publication date
CN101842833A (zh) 2010-09-22
WO2009033288A1 (en) 2009-03-19
CN101842833B (zh) 2012-07-18
US8566106B2 (en) 2013-10-22
US20100280831A1 (en) 2010-11-04
JP2010539528A (ja) 2010-12-16

Similar Documents

Publication Publication Date Title
JP5264913B2 (ja) 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
RU2462769C2 (ru) Способ и устройство кодирования кадров перехода в речевых сигналах
TW497335B (en) Method and apparatus for variable rate coding of speech
JP4390803B2 (ja) 可変ビットレート広帯域通話符号化におけるゲイン量子化方法および装置
AU2014320881B2 (en) Adaptive bandwidth extension and apparatus for the same
CN1890714B (zh) 一种优化的复合编码方法
JP5374418B2 (ja) 音声符号化用適応符号帳ゲインの制御
JP6392409B2 (ja) 音声符号化のための混合コードブック励振のためのシステムおよび方法
KR100464369B1 (ko) 음성 부호화 시스템의 여기 코드북 탐색 방법
JP2002202799A (ja) 音声符号変換装置
JP2004514182A (ja) 広帯域信号コーディング用の代数コードブック中のパルス位置と符号の索引付け方法
JP2006525533A5 (ja)
Kim et al. An efficient transcoding algorithm for G. 723.1 and EVRC speech coders

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130430

R150 Certificate of patent or registration of utility model

Ref document number: 5264913

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees