JP2013534328A - ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体 - Google Patents

ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体 Download PDF

Info

Publication number
JP2013534328A
JP2013534328A JP2013523225A JP2013523225A JP2013534328A JP 2013534328 A JP2013534328 A JP 2013534328A JP 2013523225 A JP2013523225 A JP 2013523225A JP 2013523225 A JP2013523225 A JP 2013523225A JP 2013534328 A JP2013534328 A JP 2013534328A
Authority
JP
Japan
Prior art keywords
bit allocation
vectors
vector
allocation
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013523225A
Other languages
English (en)
Other versions
JP5694532B2 (ja
Inventor
ドゥニ、イーサン・アール.
クリシュナン、ベンカテシュ
ラジェンドラン、ビベク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2013534328A publication Critical patent/JP2013534328A/ja
Application granted granted Critical
Publication of JP5694532B2 publication Critical patent/JP5694532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ダイナミックなビット割り当て動作は、複数のベクトルのそれぞれに対するビット割り当てを、対応する複数の利得係数に基づいて決定し、各割り当てを、ベクトルの次元に基づいているしきい値と比較する。

Description

合衆国法典第35部第119条に基づく優先権の主張
特許に対する本出願は、2010年7月30日に出願され、“オーディオ信号の効率的な変換領域コーディングのためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/369,662号に対する優先権を主張する。特許に対する本出願は、2010年7月31日に出願され、“ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/369,705号に対する優先権を主張する。特許に対する本出願は、2010年8月1日に出願され、“マルチステージ形状ベクトル量子化のためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/369,751号に対する優先権を主張する。特許に対する本出願は、2010年8月17日に出願され、“汎用型オーディオコーディングのためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/374,565号に対する優先権を主張する。特許に対する本出願は、2010年9月17日に出願され、“汎用型オーディオコーディングのためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/384,273号に対する優先権を主張する。特許に対する本出願は、2011年3月31日に出願され、“ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体”と題する仮出願第61/470,438号に対する優先権を主張する。
分野
本開示は、オーディオ信号処理の分野に関する。
背景
修正離散コサイン変換(MDCT)に基づくコーディングスキームが、通常、一般化されたオーディオ信号をコード化するために使用されている。一般化されたオーディオ信号は、スピーチ、および/または、音楽のような非スピーチコンテンツを含んでもよい。MDCTコーディングを使用する既存のオーディオコーデックの例は、MPEG−1オーディオレイヤ3(MP3)、ドルビーデジタル(登録商標)(ドルビーラボラトリーズ、英国、ロンドン;AC−3とも呼ばれ、ATSC A/52として標準化されている)、ボルビス(ザイフォドットオルグファンデーション、マサチューセッツ、サマヴィル)、ウィンドウズ(登録商標)メディアオーディオ(WMA、マイクロソフト株式会社、ワシントン、レドモンド)、Adaptive Transform Acoustic Coding(ATRAC、ソニー株式会社、日本、東京)およびAdvanced Audio Coding(AAC、ISO/IEC 14496−3において最も最近標準化されている:2009)を含む。MDCTコーディングはまた、Enhanced Variable Rate Codec(EVRC、第3世代パートナーシッププロジェクト2(3GPP2)文書C.S0014−D v2.0 2010年1月25日において標準化されている)のような、いくつかの電気通信標準規格の構成要素である。G.718コーデック(“フレーム誤りにロバストな8−32kビット/秒の狭帯域/広帯域エンベデッド可変ビットレート音声/オーディオコーディング”、電気通信標準化部門(ITU−T)、スイス、ジュネーブ、2008年6月、2008年11月および2009年8月に訂正され、2009年3月および2010年3月に修正されている)は、MDCTコーディングを使用するマルチレイヤコーデックの1つの例である。
概要
一般的な構成にしたがった、ビット割り当ての方法は、複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算することを含む。この方法はまた、複数のベクトルのうちのそれぞれに対して、利得係数に基づいている対応するビット割り当てを計算することを含む。この方法はまた、複数のベクトルのうちの少なくとも1つに対して、対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定することを含む。この方法はまた、前記決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、対応するビット割り当てを変更することとを含む。具体的な特徴を有し、特徴を読み取る機械に、このような方法を実行させるコンピュータ読取り可能記憶媒体(例えば、非一時的な媒体)もまた開示される。
一般的な構成にしたがった、ビット割り当てのための装置は、複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算する手段と、複数のベクトルのうちのそれぞれに対して、利得係数に基づいている対応するビット割り当てを計算する手段とを備える。この装置はまた、複数のベクトルのうちの少なくとも1つに対して、対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定する手段と、前記決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、対応するビット割り当てを変更する手段とを備える。
別の一般的な構成にしたがった、ビット割り当てのための装置は、複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算するように構成されている利得係数計算器と、複数のベクトルのうちのそれぞれに対して、利得係数に基づいている対応するビット割り当てを計算するように構成されているビット割り当て計算器とを備える。この装置はまた、複数のベクトルのうちの少なくとも1つに対して、対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定するように構成されている比較器と、決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、対応するビット割り当てを変更するように構成されている割り当て調整モジュールとを備える。
図1Aは、一般的な構成にしたがった、方法M100に対するフローチャートを示す。 図1Bは、タスクT200の実現T210に対するフローチャートを示す。 図1Cは、タスクT210の実現T220に対するフローチャートを示す。 図1Dは、タスクT220の実現T230に対するフローチャートを示す。 図2は、ローバンドオーディオ信号における、選択されたサブバンドの例を示す。 図3は、ハイバンドオーディオ信号における、選択されたサブバンドおよび残差成分の例を示す。 図4Aは、参照フレームおよびターゲットフレームにおけるサブバンドの位置間の関係の例を示す。 図4Bは、タスクT230の実現T240に対するフローチャートを示す。 図5Aは、利得−形状ベクトルの量子化構造の例を示す。 図5Bは、利得−形状ベクトルの量子化構造の例を示す。 図5Cは、利得−形状ベクトルの量子化構造の例を示す。 図5Dは、利得−形状ベクトルの量子化構造の例を示す。 図6Aは、タスクT230の実現T250に対するフローチャートを示す。 図6Bは、タスクT250の実現T255に対するフローチャートを示す。 図7Aは、タスクT250の実現T260のフローチャートを示す。 図7Bは、ダイナミックな割り当てタスクT260の実現T265に対するフローチャートを示す。 図8Aは、ダイナミックなビット割り当てタスクT230の実現TA270のフローチャートを示す。 図8Bは、ダイナミックなビット割り当てタスクT220の実現T280のブロックダイヤグラムを示す。 図8Cは、方法M100の実現M110のフローチャートを示す。 図9は、パルスコーディングの例を示す。 図10Aは、タスクT280の実現T290のブロックダイヤグラムを示す。 図10Bは、ダイナミックな割り当てタスクT290の実現T295に対するフローチャートを示す。 図11Aは、ダイナミックな割り当てタスクT220の実現T225に対するフローチャートを示す。 図11Bは、1組のソートされたスペクトル係数におけるサブセットの例を示す。 図12Aは、一般的な構成にしたがった、ビット割り当てに対する装置MF100のブロックダイヤグラムを示す。 図12Bは、一般的な構成にしたがった、ビット割り当てに対する装置A100のブロックダイヤグラムを示す。 図13Aは、一般的な構成にしたがった、エンコーダE100のブロックダイヤグラムを示す。 図13Bは、エンコーダE100の実現E110のブロックダイヤグラムを示す。 図13Cは、エンコーダE110の実現E120のブロックダイヤグラムを示す。 図13Dは、エンコーダE100に対応するデコーダD100のブロックダイヤグラムを示す。 図13Eは、デコーダD100の、エンコーダE110に対応する実現D110のブロックダイヤグラムを示す。 図13Fは、デコーダD100の、エンコーダE120に対応する実現D120のブロックダイヤグラムを示す。 図14AないしEは、エンコーダE100に対する適用の範囲を示す。 図15Aは、信号分類の方法MZ100のブロックダイヤグラムを示す。 図15Bは、通信デバイスD10のブロックダイヤグラムを示す。 図16は、ハンドセットH100の正面図、背面図および側面図を示す。 図17は、マルチバンドコーダの例のブロックダイヤグラムを示す。 図18は、マルチバンドコーディングに対する方法の例のフローチャートを示す。 図19は、エンコーダE200のブロックダイヤグラムを示す。 図20は、回転行列の例を示す。
詳細な説明
エンコーダからデコーダにサイド情報の明示的な送信をせずにスキームを実行してもよいように、エンコーダおよびデコーダの両方に知られているコード化された利得パラメータに基づくダイナミックなビット割り当てスキームを使用することが望ましいかもしれない。
その文脈によって明白に限定されない限り、用語“信号”は、ワイヤ、バスまたは他の送信媒体上で表現されるような記憶場所の状態(または記憶場所の組)を含む、その通常の意味のいずれかを示すように、ここでは使用される。その文脈によって明白に限定されない限り、用語“発生させること”は、コンピュータで計算すること、または、そうでなければ、生成させることのような、その通常の意味のいずれかを示すように、ここでは使用される。その文脈によって明白に限定されない限り、用語“計算すること”は、コンピュータで計算すること、評価すること、平滑化すること、および/または、複数の値から選択することのような、その通常の意味のいずれかを示すように、ここでは使用される。その文脈によって明白に限定されない限り、用語“取得すること”は、計算すること、導出すること、(例えば、外部デバイスから)受信すること、および/または、(例えば、記憶素子のアレイから)検索することのような、その通常の意味のいずれかを示すように使用される。その文脈によって明白に限定されない限り、用語“選択すること”は、識別すること、示すこと、適用すること、ならびに/あるいは、2以上の組のうちの、少なくとも1つ、および、すべてよりも少ないものを使用することのような、その通常の意味のいずれかを示すように使用される。用語“含む”が、本説明および特許請求の範囲中で使用されるとき、それは、他の要素または動作を除外しない。用語(“AはBに基づく”のように)“基づく”は、(i)“〜から導出される”(例えば、“BはAの先行モデルである”)、(ii)“少なくとも基づく”(例えば、“Aは少なくともBに基づく”)、および、特定の文脈において適切な場合、(iii)“〜に等しい”(例えば、“AはBに等しい”)、のケースを含む、その通常の意味のいずれかを示すように使用される。同様に、用語“〜に応答して”は、“少なくとも〜に応答して”を含む、その通常の意味のいずれかを示すように使用される。
特に示されていない限り、用語“連続”は、2以上のアイテムのシーケンスを示すように使用される。用語“対数”は、底が10の対数を示すように使用されるが、他の底への、そのような演算の拡張は、本開示の範囲内である。用語“周波数成分”は、(例えば、高速フーリエ変換によって生成されるような)信号の周波数領域表現のサンプルまたは信号のサブバンド(例えば、バーク尺度またはメル尺度のサブバンド)のような、信号の1組の周波数または周波数帯域のうちの1つを示すように使用される。
特に示されていない限り、特定の特徴を有する装置の動作の何らかの開示はまた、類似の特徴を有する方法を開示するように明白に向けられており(逆も成り立つ)、特定の構成にしたがった装置の動作の何らかの開示はまた、類似の構成にしたがった方法を開示するように明白に向けられている(逆も成り立つ)。用語“構成”は、その特定の文脈によって示されるような方法、装置および/またはシステムへの参照において使用され得る。特定の文脈によって示されていない限り、用語“方法”、“プロセス”、“手続き”および“技術”は、包括的に、および、区別なく使用される。複数のサブタスクを有する“タスク”もまた方法である。用語“装置”および“デバイス”もまた、特定の文脈によって示されていない限り、包括的に、および、区別なく使用される。用語“エレメント”および“モジュール”は、通常、より大きな構成の一部を示すように使用される。その文脈によって明白に限定されない限り、用語“システム”は、“共通の目的を果たすように相互作用するエレメントのグループ”を含む、その通常の意味のいずれかを示すように、ここでは使用される。文書の一部の参照による何らかの組み込みは、その部分内で参照される用語または変数の定義を組み込むことが理解され、そのような定義は、文書中の他の場所だけでなく、組み込まれている部分において参照される図においても現れる。
ここで記述するシステム、方法および装置は、一般に、周波数領域におけるオーディオ信号の表現をコード化するのに適用可能である。そのような表現の典型的な例は、変換領域における一連の変換係数である。適切な変換の例は、シヌソイドユニタリ変換のような、離散直交変換を含む。適切なシヌソイドユニタリ変換の例は、離散三角変換を含み、離散三角変換は、限定ではないが、離散コサイン変換(DCT)、離散サイン変換(DST)および離散フーリエ変換(DFT)を含む。適切な変換の他の例は、そのような変換の重複バージョンを含む。適切な変換の特定の例は、先に紹介した修正DCT(MDCT)である。
この開示全体を通して、オーディオ周波数範囲の“ローバンド”および“ハイバンド”(言い換えると、“上位バンド”)に対して、ならびに、ゼロないし4キロヘルツ(kHz)のローバンドおよび3.5ないし7kHzのハイバンドの特定の例に対して、参照が成されている。ここで開示した原理は、そのような限定が明確に述べられていないかぎり、決してこの特定の例に限定されないことが特に注目される。エンコーディング、デコーディング、割り当て、量子化および/または他の処理に関する、これらの原理の適用が、特に熟慮され、ここで開示される周波数範囲の(再度、限定ではない)他の例は、0、25、50、100、150、200Hzのいずれかにおける下限と3000、3500、4000、4500Hzのいずれかにおける上限とを有するローバンド、および、3000、3500、4000、4500、5000Hzのいずれかにおける下限と6000、6500、7000、7500、8000、8500、9000Hzのいずれかにおける上限とを有するハイバンドを含む。3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000Hzのいずれかにおける下限と、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16kHzのいずれかにおける上限とを有するハイバンドへの(再度、限定ではない)そのような原理の適用もまた、特に熟慮され、ここに開示されている。ハイバンド信号は通常、(例えば、再サンプリングおよび/またはデシメーションによって)コーディングプロセスのより早い段階でより低いサンプリングレートに変換されるが、それはハイバンド信号のままであり、それが搬送する情報は、ハイバンドオーディオ周波数範囲を表し続けることが、特に注目される。
ここで記述するダイナミックなビット割り当てを含むコーディングスキームは、(例えば、スピーチを含む)何らかのオーディオ信号をコード化するのに適用されてもよい。代わりに、非スピーチオーディオ(例えば、音楽)に対してのみ、そのようなコーディングスキームを使用するのが望ましいかもしれない。そのようなケースでは、コーディングスキームは、オーディオ信号の各フレームのコンテンツのタイプを決定して、適切なコーディングスキームを選択する分類スキームとともに使用されてもよい。
ここで記述するダイナミックなビット割り当てを含むコーディングスキームは、主要なコーデックとして、あるいは、マルチレイヤまたはマルチステージコーデックにおけるレイヤまたはステージとして使用されてもよい。そのような1つの例において、そのようなコーディングスキームは、オーディオ信号の周波数コンテンツの一部(例えば、ローバンドまたはハイバンド)をコード化するために使用され、別のコーディングスキームが、信号の周波数コンテンツの別の部分をコード化するために使用される。そのような別の例において、そのようなコーディングスキームは、別のコーディングレイヤの残差(すなわち、オリジナル信号およびエンコードされた信号の間の誤差)をコード化するために使用される。
オーディオ信号の低ビットレートコーディングは、オーディオ信号フレームのコンテンツをコード化するのに利用可能なビットの最適な利用を要求することが多い。オーディオ信号フレームのコンテンツは、信号のPCM(パルスコード変調)サンプルまたは信号の変換領域表現のいずれかであってもよい。各フレームのエンコーディングは、通常、フレームを複数のサブバンドに分割すること(すなわち、ベクトルとしてのフレームを複数のサブベクトルに分割すること)、ビット割り当てを各サブベクトルに割り当てること、各サブベクトルを、対応する、割り当てられた数のビットにエンコードすることを含む。通常のオーディオコーディングの適用において、例えば、各フレームに対する多数の(例えば、10、20、30または40の)異なるサブバンドベクトルに関してベクトル量子化を実行することが望ましいかもしれない。フレームサイズの例は、(限定ではない)100、120、140、160および180の値(例えば、変換係数)を含み、サブバンドの長さの例は、(限定ではない)5、6、7、8、9、10、11、12および16を含む。
ビット割り当てへの1つのアプローチは、サブベクトルの間で一様に総ビット割り当てを分配することである。例えば、各サブベクトルに割り当てられるビットの数は、フレームごとに固定されていてもよい。このケースでは、デコーダは、ビット割り当てスキームの知識とともにすでに構成されており、それにより、エンコーダがこの情報を送信する必要がない。しかしながら、ビットの最適な利用の目標は、オーディオ信号フレームのさまざまな構成要素が、それらの知覚の重要性に関連する(例えば、比例する)ビット数によりコード化されるのを保証することであるかもしれない。入力サブバンドベクトルのうちのいくつかは、あまり重要ではないかもしれず(例えば、ほとんどエネルギーを取り込まないかもしれない)、それにより、これらのベクトルをエンコード化するのにより少ないビットを、および、より重要なサブバンドのベクトルをエンコードするのにより多くのビットを割り当てることによって、より良好な結果が取得され得る。
固定された割り当てスキームは、サブベクトルの相対的な知覚の重要性における変化に対処しないことから、代わりに、ダイナミックな割り当てスキームを使用することが望ましく、それにより、各サブベクトルに割り当てられるビットの数は、フレームごとに変化してもよい。このケースでは、各フレームに対して使用される特定のビット割り当てスキームに関する情報は、フレームがデコードされるようにデコーダに提供される。
ほとんどのオーディオエンコーダは、サイド情報として、そのようなビット割り当て情報をデコーダに明示的に提供する。例えば、AACのようなオーディオコーディングアルゴリズムは、通常、ビット割り当て情報を伝達するために、サイド情報またはハフマンコーディングのようなエントロピーコーディングスキームを使用する。もっぱらビット割り当てを伝達する情報の使用は、このサイド情報が信号をコード化するのに直接使用されないとき、非効率的である。ハフマンコーディングまたは算術コーディングのような可変長コードワードは、何らかの利益を提供するかもしれないが、コーディングの効率を低減させる長いコードワードに出会うかもしれない。
代わりに、エンコーダおよびデコーダの両方に知られているコード化された利得パラメータに基づいているダイナミックなビット割り当てスキームを使用し、それにより、エンコーダからデコーダにサイド情報の明示的な送信なくスキームを実行することが望ましいかもしれない。そのような効率は、セルラ電話機のような、低ビットレートのアプリケーションに対して特に重要である。1つの例において、そのようなダイナミックな割り当ては、関係する利得の値にしたがって、形状ベクトル量子化に対してビットを割り当てることによって、サイド情報なく実現されてもよい。
図1Aは、分割タスクT100およびビット割り当てタスクT200を含む、一般的な構成にしたがった方法M100のフローチャートを示す。タスクT100は、エンコードされることになるベクトル(例えば、フレームの複数の変換領域係数)を受け取り、それを1組のサブベクトルに分割する。サブベクトルは、オーバーラップする必要はなく、さらに、互いに分離していてもよい(ここで記述する特定の例において、サブベクトルは、オーバーラップしない)。この分割は、予め定められていてもよく(例えば、ベクトルのコンテンツから独立している)、それにより、各入力ベクトルは、同じ方法で分割される。予め定められている分割の1つの例は、100の要素の各入力ベクトルを、それぞれの長さ(25、35、40)のサブベクトルに分割する。予め定められている分割の別の例は、140の要素の入力ベクトルを、長さ7の、1組の20個のサブベクトルに分割する。予め定められている分割のさらなる例は、280の要素の入力ベクトルを、長さ7の、1組の40個のサブベクトルに分割する。
代わりに、この分割は、可変であってもよく、それにより、入力ベクトルは、(例えば、何らかの知覚基準にしたがって)1つのフレームから次のフレームに異なって分割される。例えば、信号の高調波成分の、検出およびターゲットとされるコーディングにより、オーディオ信号の効率的な変換領域コーディングを実行するのが望ましいかもしれない。図2は、大きさ対周波数のグラフであり、このグラフにおいて、ローバンドの線形予測コーディング(LPC)残差信号の調和的に間隔を置いたピークに対応する、長さ7の8個の選択されたサブバンドが、周波数軸の近くのバーによって示されている。図3は、選択されたサブバンドの間と外側に横たわる残差成分を示すハイバンドLPC残差信号に対する類似の例を示す。このようなケースでは、1組のサブバンドと全残差との間でダイナミックな割り当てを実行すること、1組のサブバンド間でダイナミックな割り当てを実行すること、および/または、残差成分の間でダイナミックな割り当てを実行することが望ましいかもしれない。ハーモニックモデリングおよびハーモニックモードコーディングの追加の記述は、本出願が優先権を主張する先にリストにした出願において見出される。
可変分割スキームの別の例は、前のフレームであってもよい別のフレーム(参照フレームとも呼ばれる)のコード化バージョンにおける知覚的に重要なサブバンドの位置に基づいて、現在のフレーム(ターゲットフレームとも呼ばれる)における1組の知覚的に重要なサブバンドを識別する。図4Aは、そのようなコーディングスキーム(依存モードコーディングとも呼ばれる)におけるサブバンド選択動作の例を示す。依存モードコーディングの追加の記述は、本出願が優先権を主張する先にリストにした出願において見出される。
残差信号の別の例は、1組の選択されたサブバンドをコード化し、オリジナル信号から、コード化された組を減算することによって取得される。このケースでは、結果として生じる残差を(例えば、予め定められている分割にしたがって)1組のサブベクトルに分割して、サブベクトル間でダイナミックな割り当てを実行することが望ましいかもしれない。
選択されたサブバンドは、ベクトル量子化スキーム(例えば、利得−形状ベクトル量子化スキーム)を使用してコード化してもよく、残差信号は、階乗パルスコーディング(FPC)スキームまたは組合せパルスコーディングスキームを使用してコード化してもよい。
複数のベクトル間で割り当てられることになるビットの総数から、タスクT200は、さまざまなベクトルのそれぞれに、ビット割り当てを割り当てる。この割り当ては、ダイナミックであってもよく、それにより、各ベクトルに割り当てられるビット数は、フレームごとに変化してもよい。
方法M100は、タスクT200によって生成されるビット割り当てを、記憶または送信のためにサブベクトルをエンコードする動作にパスするように構成されていてもよい。そのような動作の1つのタイプは、ベクトル量子化(VQ)スキームであり、VQスキームは、ベクトルを(デコーダにも知られている)1つ以上のコードブックのそれぞれにおけるエントリに整合させ、ベクトルを表すためにこれらのエントリのインデックスを使用することによって、ベクトルをエンコードする。コードブック中のエントリの最大数を決定する、コードブックインデックスの長さは、アプリケーションに適切であると考えられる任意の整数であってもよい。デコーダにおいて実行されるような方法M100の実現は、タスクT200によって生成されるビット割り当てを、エンコードされたオーディオ信号の再生のためにサブベクトルをデコードする動作にパスするように構成されていてもよい。
複数のベクトルのうちの2つ以上が異なる長さを有するケースに対して、タスクT200は、ベクトルの次元の数(すなわち、長さ)に基づいて、各ベクトルm(ここで、m=1,2,...,M)に対してビット割り当てを計算するように実現されてもよい。このケースにおいて、タスクT200は、B×(Dm/Dh)として、各ベクトルmに対してビット割り当てBmを計算するように構成されていてもよく、ここでBは、割り当てられることになるビットの総数であり、Dmは、ベクトルmの次元であり、Dhは、すべてのベクトルの次元の合計である。いくつかのケースでは、タスクT100は、1組のモデルパラメータに基づいて、1組のサブバンドのそれぞれに対する位置を決定することによって、ベクトルの次元を決定するように実現されてもよい。ハーモニックモードコーディングに対して、モデルパラメータは、(現在のフレーム内の、または別のバンドのフレーム内の)基本周波数F0と、隣接するサブバンドのピーク間のハーモニック間隔dとを含んでいてもよい。ハーモニックモデルに対するパラメータはまた、サブバンドのうちの1つ以上のそれぞれに対する、対応するジッター値を含んでいてもよい。依存モードコーディングに対して、モデルパラメータは、サブバンドのうちの1つ以上のそれぞれに対して、コード化された前のフレームの対応する重要なバンドの位置を基準として、ジッター値を含んでいてもよい。フレームの残差成分の位置および次元は、次に、サブバンドの位置に基づいて決定されてもよい。サブバンド間にある、および/または、サブバンドの外側にあるスペクトルの部分を含んでいてもよい残差成分は、1つ以上のより大きなベクトルに連結されてもよい。
図1Bは、サブタスクTA200およびTA300を含む、ダイナミックなビット割り当てタスクT200の実現T210のフローチャートを示す。タスクTA200は、ベクトルに対してビット割り当てを計算し、タスクTA300は、割り当てを、最小の割り当て値と比較する。タスクTA300は、各割り当てを、同じ最小の割り当て値と比較するように実現されてもよい。代わりに、タスクTA300は、各割り当てを、複数のベクトル中の2以上に対して異なっていてもよい最小の割り当て値と比較するように実現されてもよい。
タスクTA300は、(例えば、割り当てを最小の割り当て値に変更することによって)最小の割り当て値よりも小さいビット割り当てを増加させるように実現されてもよい。代わりに、タスクTA300は、最小の割り当て値よりも小さい(代わりに、最小の割り当て値よりも大きくない)ビット割り当てをゼロに低減させるように実現されてもよい。
図1Cは、割り当てタスクTA200のサブタスクTA100および実現TA210を含む、ダイナミックなビット割り当てタスクT200の実現T220のフローチャートを示す。タスクTA100は、複数のベクトルのそれぞれに対する対応する利得係数を計算し、タスクTA210は、対応する利得係数に基づいて、各ベクトルに対してビット割り当てを計算する。通常、エンコーダが、デコーダと同じ利得係数を使用して、ビット割り当てを計算するのが望ましい。例えば、デコーダにおいて実行される利得係数計算タスクTA100が、エンコーダにおいて実行されるタスクTA100と同じ結果を生成させるのが望ましいかもしれない。その結果、エンコーダにおいて実行されるタスクTA100が、利得係数を逆量子化することを含むことが望ましいかもしれない。
利得−形状ベクトル量子化は、利得係数によって表されるベクトルエネルギーを、形状によって表されるベクトル方向から切り離すことによって、(例えば、サウンドまたは画像データを表す)信号ベクトルを効率的にエンコードするために使用してもよいコーディング技術である。このような技術は、スピーチおよび/または音楽のようなオーディオ信号のコーディングのような、信号のダイナミックレンジが大きいアプリケーションに対して特に適していてもよい。
利得−形状ベクトル量子化器(GSVQ)は、別々に、入力ベクトルxの形状および利得をエンコードする。図5Aは、利得−形状ベクトル量子化動作の例を示す。この例において、形状量子化器SQ100は、入力ベクトルxに対して、コードブック中の最も近いベクトル(例えば、2乗平均誤差の意味において最も近い)としてコードブックから量子化された形状ベクトルS^を選択して、インデックスをコードブック中のベクトルS^に出力することによって、ベクトル量子化(VQ)スキームを実行するように構成されている。別の例において、形状量子化器SQ100は、入力ベクトルxに最も近い(例えば、2乗平均誤差の意味において最も近い)、単位パルスの単位ノルムパターンを選択し、コードブックインデックスをそのパターンに出力することによって、パルスコーディング量子化スキームを実行するように構成されている。ノルム計算器NC10は、入力ベクトルxのノルム||x||を計算するように構成されており、利得量子化器GQ10は、ノルムを量子化して、量子化された利得係数を生成させるように構成されている。利得量子化器GQ10は、ベクトル量子化に対して、スカラーとしてノルムを量子化するか、または、ノルムを他の利得(例えば、複数のベクトルのうちの他のベクトルからのノルム)と結合して利得ベクトルにするように構成されていてもよい。
形状量子化器SQ100は通常、コードブックベクトルが単位ノルムを有する(すなわち、単位超球上のすべての点である)制約を伴うベクトル量子化器として実現される。この制約は、コードブックサーチ(例えば、2乗平均誤差の計算から内積演算まで)を簡単にする。例えば、形状量子化器SQ100は、arg maxk(xTk)のような演算にしたがって、K個の単位ノルムベクトルSk、k=0,1,...,K−1のコードブックの中からベクトルS^を選択するように構成されていてもよい。このようなサーチは、しらみ潰しであってもよく、または、最適化されてもよい。例えば、ベクトルは、特定のサーチ戦略をサポートするようにコードブック内に配置されていてもよい。
いくつかのケースでは、(例えば、特定のコードブックサーチ戦略を可能にするために)形状量子化器SQ100への入力を単位ノルムであるようにさせることが望ましいかもしれない。図5Bは、利得−形状ベクトル量子化動作の、そのような例を示す。この例では、ノーマライザNL10が、入力ベクトルxをノーマライズして、ベクトルノルム||x||および単位ノルム形状ベクトルS=x/||x||をもたらすように構成されており、形状量子化器SQ100は、その入力として、形状ベクトルSを受け取るように構成されている。そのようなケースでは、形状量子化器SQ100は、arg maxk(STk)のような演算にしたがって、K個の単位ノルムベクトルSk、k=0,1,...,K−1のコードブックの中からベクトルS^を選択するように構成されていてもよい。
代わりに、形状量子化器SQ100は、単位パルスのパターンのコードブックの中からベクトルS^を選択するように構成されていてもよい。このケースでは、量子化器SQ100は、ノーマライズされたときに、形状ベクトルSに最も近い(例えば、2乗平均誤差の意味において最も近い)パターンを選択するように構成されていてもよい。そのようなパターンは通常、パルスの数およびパターン中の占有されている各位置に対する符号とを示すコードブックインデックスとしてエンコードされる。パターンを選択することは、入力ベクトルをスケーリングすることと、それをパターンに整合させることとを含んでいてもよく、量子化されたベクトルS^は、選択されたパターンをノーマライズすることによって生成される。このようなパターンをエンコードするために形状量子化器SQ100によって実行してもよいパルスコーディングスキームの例は、階乗パルスコーディングおよび組合せパルスコーディングを含む。
利得量子化器GQ10は、ベクトル量子化に対して、利得のスカラー量子化を実行するか、または、利得を他の利得と結合して利得ベクトルにするように構成されていてもよい。図5Aおよび5Bの例において、利得量子化器GQ10は、ノルム||x||(“開ループ利得”とも呼ばれる)として入力ベクトルxの利得を受け取って量子化するように構成されている。他のケースでは、利得は、オリジナルの形状との、量子化された形状ベクトルS^の相関に基づいている。このような利得は、“閉ループ利得”と呼ばれる。図5Cは、内積計算器IP10と、量子化された形状ベクトルS^を生成させる、形状量子化器SQ100の実現SQ110とを含む、そのような利得−形状ベクトル量子化動作の例を示す。計算器IP10は、量子化された形状ベクトルS^およびオリジナルの入力ベクトルの内積(例えば、S^Tx)を計算するように構成されており、利得量子化器GQ10は、閉ループ利得として、この積を受け取って量子化するように構成されている。形状量子化器SQ110が乏しい形状量子化結果を生成させる限りでは、閉ループ利得は、より低くなるだろう。形状量子化器が形状を正確に量子化する限りでは、閉ループ利得は、より高くなるだろう。形状量子化が完全であるとき、閉ループ利得は、開ループ利得に等しい。図5Dは、入力ベクトルxをノーマライズして、形状量子化器SQ110への入力として単位ノルム形状ベクトルS=x/||x||を生成させるように構成されているノーマライザNL20を含む、類似の利得−形状ベクトル量子化動作の例を示す。
ソースコーディングの意味において、閉ループ利得は、それが開ループ利得とは異なって、特定の形状量子化誤差を考慮に入れることから、より最適であると考えられ得る。しかしながら、この利得値(開ループ利得)に基づいて、アップストリームの処理を実行することは望ましいかもしれない。特に、この利得係数を使用して、形状を量子化する(例えば、形状間でビットをダイナミックに割り当てる)方法を決定することが望ましいかもしれない。利得に関する形状コーディング動作のそのような依存性は、開ループ利得計算を使用すること(例えば、サイド情報を回避すること)を望ましいものにさせる。このケースでは、利得はビット割り当てを制御することから、形状量子化は、エンコーダおよびデコーダの両方において利得に明確に依存し、それにより、形状に依存しない開ループ利得計算が使用される。ここで記述するダイナミックな割り当てスキームと共に使用してもよい、マルチステージ形状量子化構造を含む、利得−形状ベクトル量子化の追加の記述は、本出願が優先権を主張する先にリストにした出願中に見出される。
利得コーディングに対して、予測利得コーディング構造(例えば、差分パルスコード変調スキーム)を変換構造と結合することが望ましいかもしれない。このような1つの例において、1つの平面上のサブバンド利得のベクトル(例えば、複数のベクトルの利得係数のベクトル)が、平均および差分の成分を取得するために変換コーダに入力され、予測コーディング動作は、(例えば、フレームごとに)平均の成分に対してのみ実行される。このような1つの例において、長さMの入力利得ベクトルの各成分mは、10log10||xm||2のような表現にしたがって計算され、ここで、xmは、対応するサブバンドベクトルを表す。ここで記述するダイナミックな割り当てタスクT210と共にこのような方法を使用することが望ましいかもしれない。平均の成分は、ベクトル間のダイナミックな割り当てに影響を及ぼさないことから、(例えば、前のフレームの消失に起因する)予測コーディング動作の失敗に耐性のある動作を取得するために、ダイナミックな割り当てタスクT210の実現における利得係数として、(過去に依存せずにコード化される)差分成分を使用してもよい。図20は、回転行列の1つの例を示し(ここでSは、列ベクトル[111...1]T/sqrt(M)である)、回転行列は、第1の要素において平均の成分と、他の要素において対応する差分成分とを有する回転されたベクトルを取得するために、変換コーダによって、利得係数の長さMのベクトルに適用されてもよい。このケースでは、平均の成分によって占有される要素に対する差分成分は、平均の成分および他の差分成分から再構築されてもよい。
タスクTA210は、割り当てが、ベクトルの次元Dmの数およびエネルギーEmに(例えば、ベクトルの次元当たりのエネルギーに)基づくように、各ベクトルmに対してビット割り当てBmを計算するように構成されていてもよい。このような1つの例において、各ベクトルmに対するビット割り当てBmは、値B×(Dm/Dh)+alog2(Em/Dm)−bFzに初期化され、ここでFzは、すべてのベクトルmに対する合計Σ[(Dm/Dh)×log2(Em/Dm)]として計算される。係数aおよびbのそれぞれに対する例示的な値は、0.5を含む。ベクトルmが、単位ノルムベクトル(例えば、形状ベクトル)であるケースに対して、タスクTA210における各ベクトルのエネルギーEmは、対応する利得係数である。
図1Dは、比較タスクTA300の実現TA310を含む、ダイナミックな割り当てタスクT200の実現T230に対するフローチャートを示す。タスクTA310は、各ベクトルmに対する現在の割り当てを、ベクトルの次元Dmの数に基づいているしきい値Tmと比較する。各ベクトルmに対して、しきい値Tmは、次元Dmの対応する数の単調非減少関数として計算される。しきい値Tmは、例えば、Dmおよび値Vの最小値として計算される。このような1つの例において、Dmの値は、5から32の範囲にわたり、Vの値は12である。このケースでは、5次元のベクトルは、その現在の割り当てが5ビットより小さい場合、比較に失敗し、一方、24次元のベクトルは、その現在の割り当てが少なくとも12ビットである限り、比較をパスするだろう。
タスクT230は、タスクTA310において比較に失敗するベクトルに対する割り当てがゼロにリセットされるように構成されていてもよい。このケースでは、これらのベクトルに以前に割り当てられたビットを使用して、1つ以上の他のベクトルに対する割り当てを増加させてもよい。図4Bは、(例えば、割り当てが依然として変更を受けているベクトルに対して、割り当てに対して利用可能な変更されたビット数にしたがって、タスクTA210を繰り返すことによって)このような分配を実行するサブタスクTA400を含む、タスクT230の実現T240に対するフローチャートを示す。
タスクTA210は、知覚基準(例えば、次元当たりのエネルギー)に基づいてダイナミックな割り当てを実行するように実現されてもよいが、方法M100の対応する実現は、入力利得値およびベクトル次元だけに依存する結果を生成させるように構成されてもよいことが、特に注目される。その結果、同じ逆量子化された利得値およびベクトル次元の知識を有するデコーダが、対応するエンコーダが何らかのサイド情報を送信することを必要とせずに、方法M100を実行して、同じビット割り当てを取得してもよい。
タスクTA200(例えば、タスクTA210)によって計算されたビット割り当てに最大値を課すようにダイナミックなビット割り当てタスクT200を構成することが望ましいかもしれない。図6Aは、タスクTA210において計算されたビット割り当てを最大割り当て値および/または最小割り当て値と比較する、サブタスクTA300の実現TA305を含む、タスクT230のこのような実現T250のフローチャートを示す。タスクTA305は、各割り当てを同じ最大割り当て値と比較するように実現されてもよい。代わりに、タスクTA305は、各割り当てを、複数のベクトルの中の2以上に対して異なっていてもよい最大割り当て値と比較するように実現されてもよい。
タスクTA305は、ベクトルのビット割り当てを最大割り当て値Bmax(上限とも呼ばれる)に変更し、アクティブな割り当てからベクトルを取り除く(例えば、そのベクトルの割り当てに対するさらなる変更を防ぐ)ことによって、値Bmaxを超える割り当てを訂正するように構成されていてもよい。代わりに、または、追加として、タスクTA305は、最小割り当て値Bmin(下限とも呼ばれる)よりも小さい(代わりに、最小割り当て値Bminよりも大きくない)ビット割り当てをゼロに低減させるか、または、ベクトルのビット割り当てを値Bminに変更し、アクティブな割り当てからベクトルを取り除く(例えば、そのベクトルの割り当てに対するさらなる変更を防ぐ)ことによって、値Bminよりも小さい割り当てを訂正するように構成されていてもよい。パルスコード化されることになるベクトルに対して、パルスの整数に対応するBminおよび/またはBmaxの値を使用するか、または、そのようなベクトルに対してタスクTA305をスキップすることが望ましいかもしれない。
タスクTA305は、制限違反が残らなくなるまで、最悪の現在の過大および/または過少の割り当てを繰り返し訂正するように構成されていてもよい。タスクTA305は、すべての制限違反を訂正した後に、追加の動作を実行するように、例えば、DhおよびFzの値を更新し、誤りを訂正するための再割り当てに対処する利用可能なビット数Bavを計算し、(例えば、Dm×(Bav/Dh)+alog2(Em/Dm)−bFzのような表現にしたがって)現在アクティブな割り当て中のベクトルmに対して割り当てBmを再計算するように、実現されてもよい。
図6Bは、タスクTA310の具体例を含む、ダイナミックな割り当てタスクT250の実現T255に対するフローチャートを示す。
ビット割り当てのそれぞれに整数制約を課すように、ダイナミックな割り当てタスクT200を構成することが望ましいかもしれない。図7Aは、タスクTA400と、サブタスクTA500およびTA600との具体例を含む、タスクT250のこのような実現T260のフローチャートを示す。
割り当て解除されたビットが、タスクTA400において分配された後、タスクTA500は、各割り当てBmを、Bmよりも大きくない最大整数に打ち切ることによって、ビット割り当てBmに整数制約を課す。パルスコード化されることになるベクトルに対して、対応する割り当てBmを、パルスの整数に対応する、Bmよりも大きくない最大整数に打ち切ることが望ましいかもしれない。タスクTA500はまた、利用可能なビット数Bavを更新する。更新は、例えば、次の表現にしたがう。
Figure 2013534328
タスクTA500はまた、(例えば、タスクTA600における後の使用のために)各ベクトルに対する打ち切られた残りを記憶するように構成されていてもよい。このような1つの例において、タスクTA500は、誤差アレイΔBの対応する要素における、各ベクトルに対する打ち切られた残りを記憶する。
タスクTA600は、割り当てるために残っている何らかのビットを分配する。1つの例において、残りのビット数Bavが、現在アクティブな割り当てにおけるベクトルの数に少なくとも等しい場合、タスクTA600は、この状態がもはや成り立たなくなるまで、各ベクトルに対する割り当てをインクリメントし、割り当てがBmaxに達するベクトルをアクティブな割り当てから取り除き、Bavを更新する。Bavが、現在アクティブな割り当てにおけるベクトルの数よりも小さい場合、タスクTA600は、タスクTA500からの最大の打ち切られた残りを有するベクトル(例えば、誤差アレイΔB中の最も高い値に対応するベクトル)に、残りのビットを分配する。パルスコード化されることになるベクトルに対して、パルスの整数に対応する値だけまで、それらの割り当てを増やすことが望ましいかもしれない。
図7Bは、タスクTA310の具体例をさらに含む、ダイナミックな割り当てタスクT260の実現T265に対するフローチャートを示す。
図8Aは、刈込み(pruning)サブタスクTA150を含む、ダイナミックなビット割り当てタスクT230の実現TA270のフローチャートを示す。タスクTA150は、計算された利得係数に基づいて、量子化すべきベクトル(例えば、形状ベクトル)の組Svの最初の刈込みを実行する。例えば、タスクTA150は、低いエネルギーのベクトルを考慮から取り除くように実現されてもよく、ここで、ベクトルのエネルギーは、2乗開ループ利得として計算されてもよい。タスクTA150は、例えば、エネルギーがしきい値Tsよりも小さい(代わりに、しきい値Tsよりも大きくない)ベクトルを刈込むように構成されていてもよい。1つの特定の例において、Tsの値は、316である。タスクTA150はまた、ベクトル当たりの平均エネルギーが些細なものである(例えば、100よりも大きくない)場合に、タスクT270を終了させるように構成されていてもよい。
タスクTA150は、何らかの1つのベクトルに割り当てられるビットの最大数Bmaxによって除算した、組Svに割り当てられるビットの総数Bに基づいて、刈込むベクトルの最大数Pmaxを計算するように構成されていてもよい。1つの例において、タスクTA150は、Mからceil(B/Bmax)を減算することによって、Pmaxを計算する。ここでMは、Sv中のベクトルの数である。非常に多くのベクトルが刈込まれるケースに対して、タスクTA150は、ベクトルの最大数を超えて刈込まれなくなるまで、現在刈込まれているベクトルの中で最大のエネルギーを有するベクトルを刈込まないように構成されていてもよい。
図8Bは、刈込みタスクTA150、整数制約タスクTA500および分配タスクTA600を含む、ダイナミックなビット割り当てタスクT220の実現T280のブロック図を示す。タスクT280は、入力利得値だけに依存する結果を生成させるように実現されてもよく、それにより、エンコーダおよびデコーダは、何らかのサイド情報を送信することなく、同じビット割り当てを取得するために同じ逆量子化された利得値に対してタスクT280を実行してもよいことが特に注目される。タスクT280は、ここで記述したタスクTA310および/またはTA400の具体例を含むように実現されてもよく、さらに、あるいは、代わりに、タスクTA300は、タスクTA305として実現されもよいことも注目される。付録A中でリストにしている擬似コードは、タスクT280の特定の実現を記述する。
ダイナミックな割り当てスキームをサポートするために、形状量子化器(および対応する形状逆量子化器)を実現して、量子化すべき各形状に対して割り当てられる特定のビット数に応答して、異なるサイズのコードブックの中から(すなわち、異なるインデックスの長さを有するコードブックの中から)選択することが望ましいかもしれない。このような例において、形状量子化器SQ100(またはSQ110)は、開ループ利得が低いサブバンドベクトルの形状をエンコードするために、より短いインデックス長を有するコードブックを使用し、開ループ利得が高いサブバンドベクトルの形状をエンコードするために、より長いインデックス長を有するコードブックを使用するように実現されてもよい。このようなダイナミックな割り当てスキームは、ベクトル利得と、固定されているか、またはさもなければ決定論的な形状コードブックインデックス長との間のマッピングを使用するように構成されていてもよく、それにより、対応する逆量子化器は、何らかの追加のサイド情報なく、同じスキームを適用してもよい。
別のタイプのベクトルエンコーディング動作は、パルスコーディングスキーム(例えば、階乗パルスコーディングまたは組合せパルスコーディング)であり、これは、ベクトルを単位パルスのパターンに整合させ、ベクトルを表すためにそのパターンを識別するインデックスを使用することによって、ベクトルをエンコードする。図9は、各次元における値が実線によって示されている30の次元のベクトルが、点によって示されるパルスのパターン(0,0,−1,−1,+1,+2,−1,0,0,+1,−1,−1,+1,−1,+1,−1,−1,+2,−1,0,0,0,0,−1,+1,+1,0,0,0,0)によって表される例を示す。このパルスのパターンは通常、30ビットよりもはるかに少ないインデックスによって表すことができる。(例えば、残差の)一般的なベクトル量子化に対して、および/または、形状量子化に対して、パルスコーディングスキームを使用することが望ましいかもしれない。
1ビットのインクリメントで量子化ビット割り当てを変更すること(すなわち、1ビットの固定された量子化粒度または“整数粒度”を課すこと)は、通常、任意の整数コードブックベクトル長に適応できる、従来のVQにおいて比較的単純である。しかしながら、量子化領域のサイズが、コードブックベクトル長によってではなく、むしろ、所定の入力ベクトル長に対してエンコードされてもよいパルスの最大数によって決定されるという点で、パルスコーディングは、異なるように動作する。このパルスの最大数が1だけ変化するとき、コードブックベクトル長は、1より大きい整数だけ(すなわち、量子化の粒度が可変であるように)変化してもよい。その結果、1ビットのステップでパルスコーディング量子化ビット割り当てを変更すること(すなわち、整数粒度を課すこと)は、有効でない割り当てを結果として生じさせるかもしれない。パルスコーディングスキームに対する量子化粒度は、低ビットレートにおいてより大きく、ビットレートが増価するにつれて整数粒度まで低下する傾向がある。
パルスコーディングインデックスの長さは、対応するパターンにおけるパルスの最大数を決定する。先に注目したように、1だけパルスコーディングインデックスの長さを増加させることは、対応するパターンによって表されてもよいパルスの数を必ずしも増加させないことから、すべての整数インデックス長が有効であるわけではない。その結果、ダイナミックな割り当てタスクT200のパルスコーディングの適用が、(パルスコーディングスキームにおいて必ずしも有効でない)タスクT200によって生成されるビット割り当てをパルス割り当てに翻訳するタスクを含むことが望ましいかもしれない。図8Cは、ここのようなタスクT300を含む、方法M100の実現M110のフローチャートを示し、M110は、割り当てがパルスコードブックにおける有効なインデックス長であるかどうかを確認し、無効な割り当てよりも小さい、最も大きい有効なインデックス長まで無効な割り当てを低減させるように実現されてもよい。
従来のVQおよびパルスコーディングVQの両方を使用するケースに対して方法M100を使用することも考えられる(例えば、ベクトルの組のうちのいくつかが、従来のVQスキームを使用してエンコードされることになり、ベクトルのうちの少なくとも1つが、代わりにパルスコーディングスキームを使用してエンコードされることになる)。
図10Aは、それぞれ、タスクTA300、TA500およびTA600の実現TA320、TA510およびTA610を含む、タスクT280の実現T290のブロックダイヤグラムを示す。この例において、割り当ての下でm個のサブバンドのうちの最後のもの(擬似コードにおいて使用されるゼロベースのインデックス付け慣習において、サブバンドは、インデックスm−1を有する)は、パルスコーディングスキーム(例えば、階乗パルスコーディングまたは組合せパルスコーディング)を使用してエンコードされ、一方、最初の(m−1)個のサブバンドは、従来のVQを使用してエンコードされるように、入力ベクトルは配置される。従来の(例えば、非パルス)VQを使用してエンコードされるサブバンドに対して、ビット割り当ては、上述したような整数制約にしたがって計算される。パルスコード化されるサブバンドに対して、ビット割り当ては、エンコードすべきパルスの最大数に対する整数制約にしたがって計算される。このようなスキームの適用の1つの例において、知覚的に重要なサブバンドの選択された組は、従来のVQを使用してエンコードされ、対応する残り(例えば、選択されないサンプルの連結、または、オリジナルのフレームと、選択されコード化されたサブバンドとの間の差異)は、パルスコーディングを使用してエンコードされる。T280は、1つのベクトルのパルスコーディングに関して記述しているが、タスクT280は、複数のベクトル(例えば、図3中で示したような、残りの複数のサブベクトル)のパルスコーディングに対して実現されてもよいことが理解される。
タスクTA320は、タスクTA300およびTA305に関して上述したように、上限および/または下限を最初のビット割り当てに課すように実現されてもよい。このケースでは、パルスコード化されるサブバンドは、過大および/または過少の割り当てに対するテストから除外される。タスクTA320はまた、各訂正の後に実行される再割り当てからこのサブバンドを除外するように実現されてもよい。
タスクTA510は、各割り当てBmを、Bmよりも大きくない最大整数に打ち切ることによって、従来のVQサブバンドに対するビット割り当てBmに整数制約を課す。タスクTA510はまた、エンコードされるパルスの最大数に整数制約を適用することによって、必要に応じて、パルスコード化されるサブバンドに対して最初のビット割り当てBmを低減させる。タスクTA510は、最初のビット割り当てBmによりエンコードされてもよいパルスの最大数を計算し、パルスコード化されるサブバンドベクトルの長さが与えられると、このようなベクトル長に対してパルスのその最大数をエンコードするのに必要な実際のビット数に、最初のビット割り当てBmを置き換えることによって、このパルスコーディング整数制約を適用するように構成されていてもよい。
タスクTA510はまた、次の表現にしたがって、Bavの値を更新する。
Figure 2013534328
タスクTA510は、Bavが、少なくとも、パルスコーディング量子化におけるパルスの最大数を1だけ増加させるのに必要なビット数の大きさであるかどうかを決定し、それに応じて、擬似コーディングビット割り当ておよびBavを調節するように構成されていてもよい。タスクTA510は、誤差アレイΔBの対応する要素における、従来のVQを使用してエンコードされる各サブバンドベクトルに対する打ち切られた残りを記憶するように構成されていてもよい。
タスクTA610は、残りのBav個のビットを分配する。タスクTA610は、誤差アレイΔB中の最も高い値に相当する、従来のVQを使用してコード化されるサブバンドベクトルに、残りのビットを分配するように構成されていてもよい。タスクTA610はまた、従来のすべてのVQビット割り当てがBmaxであるケースに対して、可能なら、パルスコード化されるサブバンドに対してビット割り当てを増加させるために、何らかの残りのビットを使用するように構成されていてもよい。
付録B中でリストにしている擬似コードは、ヘルパー関数find_fpc_pulsesを含む、タスクT280の特定の実現を記述する。所定のベクトル長およびビット割り当て制限に対して、この関数は、コード化され得るパルスの最大数、パルスのその数をエンコードするのに必要なビット数、パルスの最大数がインクリメントされる場合に必要とされる追加のビット数を戻す。
図10Bは、タスクTA310の具体例を含む、ダイナミックな割り当てタスクT290の実現T295に対するフローチャートを示す。
スパース信号は、いくつかのパラメータ(または係数)が信号の情報のほとんどを含むことから、コード化するのに容易であることが多い。スパース成分および非スパース成分の両方を有する信号をコード化する際に、スパース成分よりも非スパース成分をコード化するのにより多くのビットを割り当てることが望ましいかもしれない。信号の非スパース成分を強調して、これらの成分のコーディング性能を向上させることが望ましいかもしれない。このようなアプローチは、ベクトルによるエネルギーの分布の測度(例えば、スパース性の測度)に焦点を当てて、他と比べて特定の信号クラスに対するコーディング性能を向上させ、これは、非スパース信号が十分に表されることを保証し、全コーディング性能を持ち上げるのを支援するだろう。
より多くのエネルギーを有する信号は、コード化するのにより多くのビットを取る。同様に、あまりスパースでない信号は、同じエネルギーを有するがよりスパースである信号よりも、コード化するのにより多くのビットを取るかもしれない。非常にスパースである信号(例えば、ただの単一のパルス)は通常、コード化するのに非常に容易である一方、非常に分布される信号(例えば、ノイズのような)は通常、2つの信号が同じエネルギーを有する場合でさえ、コード化するのにはるかに困難である。サブバンドの相対的なスパースの、それらのそれぞれの相対的なコーディングの困難性への影響に対処するように、ダイナミックな割り当て動作を構成することが望ましいかもしれない。例えば、このようなダイナミックな割り当て動作は、同じエネルギーを有する、よりスパースである信号に対する割り当てよりも、あまりスパースでない信号に対する割り当てに、より重く重みをかけるように構成されてもよい。
モデルにより誘導されるコーディングに適用される例において、サブバンドにおけるエネルギーの集中は、モデルが入力信号への良好な適合であることを示し、それにより、良好なコーディング品質が、低ビット割り当てから期待される。ここで記述し、ハイバンドに適用されるような、ハーモニックモデルコーディングに対して、このようなケースは、単一の機器音楽信号により生じるかもしれない。このような信号は、“スパース”と呼ばれることもある。代わりに、エネルギーのフラットな分布は、モデルが、信号の構造を同様に捕えないことを示し、それにより、望ましい知覚品質を維持するために、より高いビット割り当てを使用することが望ましいかもしれない。このような信号は、“非スパース”と呼ばれることもある。
図11Aは、サブタスクTB100と、割り当て計算タスクTA210の実現TA215とを含む、ダイナミックな割り当てタスクT220の実現T225に対するフローチャートを示す。複数のベクトルのそれぞれに対して、タスクTB100は、ベクトル内のエネルギーの分布の測度の対応する値(すなわち、スパース性係数)を計算する。タスクTB100は、サブバンドの総エネルギーと、サブバンドの係数のサブセットの総エネルギーとの間の関係に基づいて、スパース性係数を計算するように構成されていてもよい。1つのこのような例において、サブセットは、(例えば、図11B中で示したような)サブバンドのLc個の最も大きい(すなわち、最大のエネルギー)係数である。Lcに対する値の例は、5、10、15および20(例えば、サブバンドにおける係数の総数の5、7、10、15または20パーセント)を含む。このケースでは、これらの値間の関係[例えば、(サブセットのエネルギー)/(総サブバンドエネルギー)]は、サブバンドのエネルギーが集中または分散されている程度を示すことが理解される。同様に、タスクTB100は、総サブバンドエネルギーの指定された部分(例えば、5、10、12、15、20、25または30パーセント)であるエネルギー合計に達するのに十分であるサブバンドの最大の係数の数に基づいて、スパース性係数を計算するように構成されていてもよい。タスクTB100は、サブバンドの係数のエネルギーをソートすることを含んでいてもよい。
タスクTA215は、対応する利得係数およびスパース性係数に基づいて、ベクトルに対するビット割り当てを計算する。タスクTA215は、より多くのビットが、より少なく集中されているサブバンドに割り当てられるように、サブバンドの対応するスパース性係数の値に比例して、サブバンド間で、利用可能な総ビット割り当てを分割するように実現されてもよい。このような1つの例において、タスクTA215は、しきい値sLよりも小さいスパース性係数を1にマッピングし、しきい値sHよりも大きいスパース性係数を、1よりも小さい値R(例えば、R=0.7)にマッピングし、sLからsHまでのスパース性係数を、1ないしRの範囲に直線的にマッピングするように構成されている。このようなケースでは、タスクTA215は、各ベクトルmに対するビット割り当てBmを、値v×B×(Dm/Dh)+alog2(Em/Dm)−bFzとして計算するように実現されてもよく、ここでFzは、すべてのベクトルmに対する合計Σ[(Dm/Dh)×log2(Em/Dm)]として計算される。係数aおよびbのそれぞれに対する例示的な値は、0.5を含む。ベクトルmが、単位ノルムベクトル(例えば、形状ベクトル)であるケースに対して、タスクTA210における各ベクトルのエネルギーEmは、対応する利得係数である。
ここで記述したタスクTA210の具体例のいくつかは、(例えば、スパース性係数を計算タスクTB100の対応する具体例とともに)タスクTA215の具体例として実現されてもよいことが、特に注目される。このようなダイナミックな割り当てタスクを実行するエンコーダは、スパース性係数および利得係数の指示を送信するように構成されていてもよく、それにより、デコーダは、これらの値からビット割り当てを導出してもよい。さらなる例において、ここで記述したタスクTA210の実現は、LPC動作からの情報に基づいて(例えば、ベクトルの次元および/またはスパース性に加えて、あるいは、ベクトルの次元および/またはスパース性の代わりに)、ビット割り当てを計算するように構成されていてもよい。例えば、タスクTA210のこのような実現は、スペクトル傾斜(すなわち、第1の反射係数)に比例する重み係数にしたがってビット割り当てを生成させるように構成されていてもよい。このような1つのケースにおいて、低周波数バンドに対応するベクトルに対する割り当ては、フレームに対するスペクトル傾斜に基づいて、より多くまたはより少なく重みづけられてもよい。
代わりに、または、追加として、ここで記述するスパース性係数を使用して、対応するサブバンドに対する変調率の値を選択するか、または、そうでなければ、計算してもよい。変調率を次に使用して、サブバンドの係数を変調(例えば、スケーリングする)してもよい。特定の例において、このようなスパース性に基づく変調スキームは、ハイバンドのエンコーディングに適用される。
開ループ利得コーディングのケースにおいて、開ループ利得を、形状をエンコードするために使用されたビット数(例えば、形状コードブックベクトルへのインデックスの長さ)の関数である係数γと乗算するようにデコーダ(例えば、利得逆量子化器)を構成するのが望ましいかもしれない。非常に少ないビットが形状を量子化するために使用されるとき、形状量子化器は、大きな誤差を生成させ、それにより、ベクトルSおよびS^があまり整合しない確率が高いことから、デコーダにおいて、その誤差を反映する利得を低減させることが望ましいかもしれない。補正係数γは、平均の意味においてのみ、この誤差を表し:それは、コードブック(特に、コードブックにおけるビット数)にのみ依存し、入力ベクトルxの特定の詳細に依存しない。補正係数γが送信されず、むしろ、どのくらいのビットがベクトルS^を量子化するために使用されたかにしたがって、デコーダによって単にテーブルから読み出されるように、コーデックが構成されてもよい。
この補正係数γは、ビットレートに基づいて、ベクトルS^が平均して、真の形状Sにどれくらい近づくことが予期されるかを示す。ビットレートが上がるにつれて、平均の誤差は減少し、補正係数γの値は1に近づき、ビットレートが非常に低くなるにつれて、SおよびベクトルS^間の相関(例えば、ベクトルS^TおよびSの内積)は減少し、補正係数γの値もまた減少するだろう。閉ループ利得においても同じ効果(例えば、実際の入力ごとに、適応できる意味に)を取得するのが望ましいかもしれないが、開ループのケースに対して、補正は通常、平均の意味においてのみ利用可能である。
代わりに、開ループ利得および閉ループ利得の間で一種の補間を実行してもよい。このようなアプローチは、単なる長さベースの平均の量子化誤差の代わりに、特定の形状量子化の品質に依存するダイナミックな補正係数で、開ループ利得の表現を補う。このような係数は、量子化された形状と、量子化されていない形状とのドット積に基づいて計算されてもよい。この補正係数の値が非常に少ないビットで送信されるように、この補正係数の値を非常に粗く(例えば、4エントリまたは8エントリのコードブックへのインデックスとして)エンコードするのが望ましいかもしれない。
図12Aは、一般的な構成にしたがった、ビット割り当てのための装置MF100のブロックダイヤグラムを示す。装置MF100は、(例えば、タスクTA100の実現に関してここで記述したような、)複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算する手段FA100を含む。装置MF100はまた、(タスクTA210の実現に関してここで記述したような、)複数のベクトルのうちのそれぞれに対して、利得係数に基づいている対応するビット割り当てを計算する手段FA210を含む。装置MF100はまた、(例えば、タスクTA300の実現に関してここで記述したような、)複数のベクトルのうちの少なくとも1つに対して、対応するビット割り当てが最小の割り当て値よりも大きくないことを決定する手段FA300を含む。装置MF100はまた、(例えば、タスクTA300の実現に関してここで記述したような、)前記少なくとも1つのベクトルのそれぞれに対して、前記決定に応答して、対応するビット割り当てを変更する手段FB300を含む。
図12Bは、一般的な構成にしたがった、ビット割り当てのための装置A100のブロックダイヤグラムを示し、装置A100は、利得係数計算器100と、ビット割り当て計算器210と、比較器300と、割り当て調整モジュール300Bとを含む。利得係数計算器100は、(例えば、タスクTA100の実現に関してここで記述したように、)複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算するように構成されている。ビット割り当て計算器210は、(タスクTA210の実現に関してここで記述したように、)複数のベクトルのうちのそれぞれに対して、利得係数に基づいている対応するビット割り当てを計算するように構成されている。比較器300は、(例えば、タスクTA300の実現に関してここで記述したように、)複数のベクトルのうちの少なくとも1つに対して、対応するビット割り当てが最小の割り当て値よりも大きくないことを決定するように構成されている。割り当て調整モジュール300Bは、(例えば、タスクTA300の実現に関してここで記述したように、)前記少なくとも1つのベクトルのそれぞれに対して、前記決定に応答して、対応するビット割り当てを変更するように構成されている。装置A100はまた、(例えば、タスクT100の実現に関してここで記述したように、)フレームを複数のサブベクトルに分割するように構成された分割器を含むように実現されてもよい。
図13Aは、装置A100およびサブバンドエンコーダSE10の具体例を含む、一般的な構成にしたがったエンコーダE100のブロックダイヤグラムを示す。サブバンドエンコーダSE10は、装置A100によって計算された対応する割り当てにしたがって、複数のベクトル(または、対応する複数の形状ベクトルのような、それに基づく複数のベクトル)を量子化するように構成されている。例えば、サブバンドエンコーダSE10は、ここで記述したような、従来のVQコーディング動作および/またはパルスコーディングVQ動作を実行するように構成されていてもよい。図13Dは、装置A100およびサブバンドデコーダSD10の具体例を含む対応するデコーダD100のブロックダイヤグラムを示す。サブバンドデコーダSD10は、装置A100によって計算された対応する割り当てにしたがって、複数のベクトル(または、対応する複数の形状ベクトルのような、それに基づく複数のベクトル)を逆量子化するように構成されている。図13Bは、ここで記述したような1つ以上のコーデック(例えば、EVRC、AMR−WB)に準拠しているフレームに、エンコードされたサブバンドをパックするように構成されているビットパッカーBP10を含む、エンコーダ100の実現E110のブロックダイヤグラムを示す。図13Eは、対応するビットアンパッカーU10を含む、デコーダ100の対応する実現D110のブロックダイヤグラムを示す。図13Cは、装置A100の具体例A100aおよび100bと、残差エンコーダSE20とを含む、エンコーダE110の実現E120のブロックダイヤグラムを示す。このケースでは、サブバンドエンコーダSE10は、装置A100aによって計算された対応する割り当てにしたがって、第1の複数のベクトル(または、対応する複数の形状ベクトルのような、それに基づく複数のベクトル)を量子化するように構成されており、残差エンコーダSE20は、装置A100bによって計算された対応する割り当てにしたがって、第2の複数のベクトル(または、対応する複数の形状ベクトルのような、それに基づく複数のベクトル)を量子化するように構成されている。図13Fは、対応する残差デコーダSD20を含む、デコーダD100の対応する実現D120のブロックダイヤグラムを示す。SD20は、装置A100bによって計算された対応する割り当てにしたがって、第2の複数のベクトル(または、対応する複数の形状ベクトルのような、それに基づく複数のベクトル)を逆量子化するように構成されている。
図14AないしEは、ここで記述したエンコーダE100に対する適用の範囲を示す。図14Aは、変換モジュールMM1(例えば、高速フーリエ変換またはMDCTモジュール)と、変換領域におけるサンプルとして(すなわち、変換領域係数として)オーディオフレームSA10を受け取って、対応する、エンコードされたフレームSE10を生成させるように構成されているエンコーダE100の具体例とを含む、オーディオ処理パスのブロックダイヤグラムを示す。
図14Bは、変換モジュールMM1がMDCT変換モジュールを使用して実現される、図14Aのパスの実現のブロックダイヤグラムを示す。修正DCTモジュールMM10は、各オーディオフレームに対してMDCT動作を実行して、1組のMDCT領域係数を生成させる。
図14Cは、線形予測コーディング分析モジュールAM10を含む、図14Aのパスの実現のブロックダイヤグラムを示す。線形予測コーディング(LPC)分析モジュールAM10は、分類されたフレームに対してLPC分析動作を実行して、1組のLPCパラメータ(例えば、フィルタ係数)と、LPC残差信号とを生成させる。1つの例において、LPC分析モジュールAM10は、ゼロから4000Hzまでの帯域幅を有するフレームに対して10次LPC分析を実行するように構成されている。別の例において、LPC分析モジュールAM10は、3500から7000Hzまでのハイバンド周波数範囲を表すフレームに対して6次LPC分析を実行するように構成されている。修正DCTモジュールMM10は、LPC残差信号に対してMDCT動作を実行して、1組の変換領域係数を生成させる。対応するデコーディングパスは、エンコードされたフレームSE10をデコードし、デコードされたフレームに対して逆MDCT変換を実行して、LPC合成フィルタへの入力に対する励振信号を取得するように構成されていてもよい。
図14Dは、信号分類器SC10を含む処理パスのブロックダイヤグラムを示す。信号分類器SC10は、オーディオ信号のフレームSA10を受け取って、各フレームを、少なくとも2つのカテゴリのうちの1つに分類する。例えば、信号分類器SC10は、スピーチまたは音楽としてフレームSA10を分類するように構成されていてもよく、それにより、フレームが音楽として分類された場合、図14D中で示されているパスの残りは、それをエンコードするために使用され、フレームがスピーチとして分類された場合、異なる処理パスが、それをエンコードするために使用される。このような分類は、信号アクティビティ検出、ノイズ検出、周期性検出、時間領域スパース性検出、および/または、周波数領域スパース性検出を含んでもよい。
図15Aは、(例えば、オーディオフレームSA10のそれぞれに対して)信号分類器SC10によって実行してもよい、信号分類の方法MZ100のブロックダイヤグラムを示す。方法MC100は、タスクTZ100、TZ200、TZ300、TZ400、TZ500およびTZ600を含む。タスクTZ100は、信号中のアクティビティのレベルを定量化する。アクティビティのレベルがしきい値を下回る場合、タスクTZ200が、(例えば、低ビットレートのノイズ励振線形予測(NELP)スキームおよび/または不連続送信(DXT)スキームを使用して)サイレンスとして信号をエンコードする。アクティビティのレベルが、十分に高い(例えば、しきい値を上回る)場合、タスクTZ300は、信号の周期性の程度を定量化する。タスクTZ300が、信号が周期的でないことを決定した場合、タスクTZ400が、NELPスキームを使用して信号をエンコードする。タスクTZ300が、信号が周期的であることを決定した場合、タスクTZ500が、時間および/または周波数領域における信号のスパース性の程度を定量化する。タスクTZ500が、信号が時間領域においてスパースであることを決定した場合、タスクTZ600が、リラックスドCELP(RCELP)または代数CELP(ACELP)のような、コード励振線形予測(CELP)スキームを使用して信号をエンコードする。タスクTZ500が、信号が周波数領域においてスパースであることを決定した場合、タスクTZ700が、(例えば、図14D中の処理パスの残りに信号をパスすることによって)ハーモニックモデルを使用して信号をエンコードする。
図14D中で示されているように、処理パスは、知覚刈込モジュールPM10を含んでいてもよく、知覚刈込モジュールPM10は、時間マスキング、周波数マスキング、および/または、聴覚しきい値のような、音響心理学の基準を適用することによって、MDCT領域信号を簡単にする(例えば、エンコードされることになる変換領域係数の数を低減させる)ように構成されている。モジュールPM10は、知覚モデルをオリジナルのオーディオフレームSA10に適用することによって、このような基準に対する値を計算するように実現されてもよい。この例において、エンコーダE100は、刈込まれたフレームをエンコードして、対応するエンコードされたフレームSE10を生成させるように構成されている。
図14Eは、図14Cおよび14Dのパスの両方の実現のブロック図を示し、図14Eにおいて、エンコーダE100は、LPC残差をエンコードするように構成されている。
図15Bは、装置A100の実現を含む通信デバイス10のブロックダイヤグラムを示す。デバイスD10は、装置A100(またはMF100)のエレメント、および、ことによると、装置D100(またはDF100)のエレメントを実現する、チップまたはチップセットCS10(例えば、移動局モデム(MSM)チップセット)を含む。チップ/チップセットCS10は、(例えば、命令のような、)装置A100またはMF100のソフトウェアおよび/またはファームウェアの部分を実行するように構成されている1つ以上のプロセッサを含んでいてもよい。
チップ/チップセットCS10は、無線周波数(RF)通信信号を受信し、RF信号内でエンコードされているオーディオ信号をデコードして再生するように構成されている受信機と、マイクロフォンMV10によって生成された信号に基づいているエンコードされたオーディオ信号(例えば、装置A100によって生成されるようなコードブックインデックスを含む)を記述するRF通信信号を送信するように構成されている送信機とを含む。このようなデバイスは、1つ以上のエンコーディングおよびデコーディングスキーム(“コーデック”とも呼ばれる)を介して、ワイヤレスに音声通信データを送受信するように構成されていてもよい。このようなコーデックの例は、“ワイドバンド拡散スペクトルデジタルシステムに対する、エンハンスド可変レートコーデック、スピーチサービスオプション3、68および70”(2007年2月(www−dot−3gpp−dot−orgにおいてオンラインで利用可能))と題する第3世代パートナーシッププロジェクト2(3GPP2)文書C.S0014−C、v1.0中で記述されているようなエンハンスド可変レートコーデックと、“ワイドバンド拡散スペクトル通信システムに対する、選択可能なモードボコーダ(SMV)サービスオプション”(2004年1月(www−dot−3gpp−dot−orgにおいてオンラインで利用可能))と題する3GPP2文書C.S0030−0、v3.0中で記述されているような選択可能なモードボコーダスピーチコーデックと、文書ETSI TS 126 092 V6.0.0(欧州電気通信標準化機構(ETSI)、ソフィアアンチポリス、Cedex、フランス、2004年12月)中で記述されているような、適応型マルチレート(AMR)スピーチコーデックと、文書ETSI TS 126 192 V6.0.0(ETSI、2004年12月)中で記述されているような、AMRワイドバンドスピーチコーデックとを含む。例えば、チップまたはチップセットCS10は、このような1つ以上のコーデックに準拠されるエンコードされたフレームを生成させるように構成されていてもよい。
デバイスD10は、アンテナC30を介してRF通信信号を受信および送信するように構成されている。デバイスD10はまた、アンテナC30へのパス中に、ダイプレクサーおよび1つ以上の電力増幅器を含んでいてもよい。チップ/チップセットCS10はまた、キーパッドC10を介してユーザ入力を受け取り、ディスプレイC20を介して情報を表示するように構成されている。この例では、デバイスD10はまた、グローバルポジショニングシステム(GPS)ロケーションサービス、および/または、ワイヤレス(例えば、ブルートゥース(登録商標))ヘッドセットのような外部デバイスとの短距離通信をサポートする1つ以上のアンテナC40を含む。別の例では、このような通信デバイスは、ブルートゥースヘッドセットそのものであり、キーパッドC10、ディスプレイC20およびアンテナC30を欠く。
通信デバイスD10は、スマートフォン、ラップトップおよびタブレットコンピュータを含む、さまざまな通信デバイスにおいて具現されてもよい。図16は、ハンドセットH100(例えば、スマートフォン)の、正面図、背面図および側面図を示し、ハンドセットH100は、正面に配置された2つの音声マイクロフォンMV10−1およびMV10−3と、背面に配置された音声マイクロフォンMV10−2と、正面の上部角に位置しているエラーマイクロフォンME10と、背面上に位置しているノイズ参照マイクロフォンMR10とを有する。ラウドスピーカーLS10が、エラーマイクロフォンME10の近くの正面の上部中央に配置されており、他の2つのラウドスピーカーLS20L、LS20Rもまた(例えば、スピーカーフォン適用のために)提供されている。このようなハンドセットのマイクロフォン間の最大距離は、通常、約10または12センチメートルである。
(例えば、図17中で示されているような)マルチバンドコーダでは、ローバンドにおいて(例えば、ここでの他の箇所において記述したような、依存モードまたはハーモニックモードのコーダにおいて)閉ループ利得GSVQを実行し、ハイバンドにおける形状の間で、(例えば、タスクT210の実現にしたがって)利得ベースのダイナミックなビット割り当てにより開ループ利得GSVQを実行することが望ましいかもしれない。この例において、ローバンドフレームは、オーディオ周波数入力フレームから分析フィルタバンクによって生成されるような、ローバンドに対する10次LPC分析動作の残差であり、ハイバンドフレームは、オーディオ周波数入力フレームから分析フィルタバンクによって生成されるような、ハイバンドに対する6次LPC分析動作の残差である。図18は、マルチバンドコーディングの対応する方法のフローチャートを示し、示されたコーディング(すなわち、UB−MDCTスペクトルのパルスコーディング、ハーモニックサブバンドのGSVQエンコーディング、および/または、残差のパルスコーディング)のうちの1つ以上に対するビット割り当てが、タスクT210の実現にしたがって実行されてもよい。
上述したように、マルチバンドコーディングスキームは、ローバンドおよびハイバンドのそれぞれが、独立コーディングモードまたは依存(代わりに、ハーモニック)コーディングモードのいずれかを使用してエンコードされるように構成されてもよい。ローバンドが独立コーディングモード(例えば、1組の固定されたサブバンドに適用されるGSVQ)を使用してエンコードされるケースに対して、上述したようなダイナミックな割り当てを(例えば、タスクT210の実現にしたがって)実行して、対応する利得にしたがって、ローバンドおよびハイバンドの間で、(固定されていてもよく、またはフレームごとに異なっていてもよい、)フレームに対する総ビット割り当てを割り当ててもよい。このようなケースでは、上述したような別のダイナミックな割り当てを(例えば、タスクT210の実現にしたがって)実行して、ローバンドのサブバンド間で、結果として生じるローバンドのビット割り当てを割り当ててもよく、および/または、上述したような別のダイナミックな割り当てを(例えば、タスクT210の実現にしたがって)実行して、ハイバンドのサブバンド間で、結果として生じるハイバンドのビット割り当てを割り当ててもよい。
ローバンドが、依存(代わりに、ハーモニック)コーディングモードを使用してエンコードされるケースに対して、(固定されていてもよく、またはフレームごとに異なっていてもよい)フレームに対する総ビット割り当てから、コーディングモードによって選択されたサブバンドにビットを最初に割り当てることが望ましいかもしれない。この割り当てに対して、ローバンドに対するLPCスペクトルからの情報を使用することが望ましいかもしれない。このような1つの例において、(例えば、最初の反射係数によって示されるような)LPC傾斜スペクトルが、最も高いLPC重みを有するサブバンドを決定するために使用され、最大数のビット(例えば、10ビット)が、(例えば、形状量子化に対して)そのサブバンドに割り当てられ、それに対応して、より低い割当てが、より低いLPC重みを有するサブバンドに与えられる。上述したようなダイナミックな割り当てを(例えば、タスクT210の実現にしたがって)実行して、ローバンドの残差とハイバンドとの間で、フレーム割り当てにおいて残っているビットを割り当ててもよい。このようなケースでは、上述したような別のダイナミックな割り当てを(例えば、タスクT210の実現にしたがって)実行して、ハイバンドのサブバンド間で、結果として生じるハイバンドのビット割り当てを割り当ててもよい。
図18中で示されているようなコーディングモード選択は、マルチバンドのケースに対して拡張されてもよい。このような1つの例において、ローバンドおよびハイバンドのそれぞれは、独立コーディングモードおよび依存コーディングモード(代わりに、独立コーディングモードおよびハーモニックコーディングモード)の両方を使用してエンコードされ、それにより、4つの異なるモードの組み合わせが、フレームに対して最初に検討される。次に、ローバンドモードのそれぞれに対して、対応する最良のハイバンドモードが、(例えば、ハイバンドに対して知覚メトリックを使用する2つのオプション間の比較にしたがって)選択される。2つの残りのオプション(すなわち、対応する最良のハイバンドモードを有するローバンド独立モード、および、対応する最良のハイバンドモードを有するローバンド依存(またはハーモニック)モード)のうち、これらのオプション間の選択は、ローバンドおよびハイバンドの両方をカバーする知覚メトリックを参照して実施される。このようなマルチバンドのケースの1つの例において、ローバンド独立モードは、GSVQを使用して、1組の固定されたサブバンドをエンコードし、ハイバンド独立モードは、パルスコーディングスキーム(例えば、階乗パルスコーディング)を使用して、ハイバンド信号をエンコードする。
図19は、一般的な構成にしたがった、エンコーダE200のブロックダイヤグラムを示し、エンコーダE200は、MDCT領域中のサンプルとして(すなわち、変換領域係数として)オーディオフレームを受け取るように構成されている。エンコーダ200は、独立モードエンコーダIM10を含み、独立モードエンコーダIM10は、独立コーディングモードにしたがってMDCT領域信号SM10のフレームをエンコードして、独立モードによりエンコードされたフレームSI10を生成させるように構成されている。独立コーディングモードは、予め定められている(すなわち、固定されている)サブバンド分割にしたがって、変換領域係数をサブバンドにグループ化し、ベクトル量子化(VQ)スキームを使用して、サブバンドをエンコードする。独立コーディングモードに対するコーディングスキームの例は、パルスコーディング(例えば、階乗パルスコーディングおよび組合せパルスコーディング)を含む。エンコーダE200はまた、高速フーリエ変換(FFT)領域のような、別の変換領域におけるサンプルとしてオーディオフレームを受け取るように、同じ原理にしたがって構成されていてもよい。
エンコーダE200はまた、ハーモニックモードエンコーダHM10(代わりに、依存モードエンコーダ)を含み、ハーモニックモードエンコーダHM10は、ハーモニックモデルにしたがってMDCT領域信号SM10のフレームをエンコードして、ハーモニックモードによりエンコードされたフレームSD10を生成させるように構成されている。エンコーダIM10およびHM10の両方のうちのいずれもが、ここで記述したようなダイナミックな割り当てスキームにしたがって、対応するエンコードされたフレームが生成されるように、装置A100の対応する具体例を含むように実現されてもよい。エンコーダE200はまた、コーディングモード選択器SEL10を含み、コーディングモード選択器SEL10は、歪み測度を使用して、エンコードされたフレームSE10として、独立モードによりエンコードされたフレームSI10およびハーモニックモードによりエンコードされたフレームSD10の中から1つを選択するように構成されている。図14Aないし14E中で示されているエンコーダE100は、エンコーダE200の実現として実現されてもよい。エンコーダE200はまた、図17中で示されているようなマルチバンドコーデックにおいて、MDCT領域におけるローバンド(例えば、0ないし4kHz)LPC残差をエンコードするために、および/または、MDCT領域におけるハイバンド(例えば、3.5ないし7kHz)LPC残差をエンコードするために使用されてもよい。
ここで開示した方法および装置は、一般に、任意の送受信アプリケーションおよび/またはオーディオ感知アプリケーション、特に、このようなアプリケーションの、移動またはそうでなければポータブルの具体例において適用され得る。例えば、ここで開示した構成の範囲は、エアインターフェースによってコード分割多元接続(CDMA)を用いるように構成されているワイヤレス電話通信システム中に存在する通信デバイスを含む。しかしながら、ここで記述した特徴を有する方法および装置は、ワイヤードおよび/またはワイヤレスの(例えば、CDMA、TDMA、FDMA、および/またはTD−SCDMA)送信チャネルによってボイスオーバIP(VoIP)を用いるシステムのような、当業者に知られている広範囲の技術を用いるさまざまな通信システムのいずれかに存在してもよいことが、当業者によって理解されるだろう。
ここで開示した通信デバイスは、パケット交換であるネットワーク(例えば、VoIPのようなプロトコルにしたがって、オーディオ送信を搬送するように構成されているワイヤードおよび/またはワイヤレスのネットワーク)および/または回路交換であるネットワークにおける使用に適合されていてもよいことが、特に考察され、ここに開示されている。ここで開示した通信デバイスは、全バンドのワイドバンドコーディングシステムおよび分割バンドのワイドバンドコーディングシステムを含む、ナローバンドコーディングシステム(例えば、約4または5キロヘルツのオーディオ周波数範囲エンコードするシステム)における使用に対して、および/または、ワイドバンドコーディングシステム(例えば、5キロヘルツよりも大きいオーディオ周波数をエンコードするシステム)における使用に対して適合されていてもよい。
記述した構成の提示は、当業者が、ここで開示した方法および他の構造を実施または使用できるように提供されている。ここで示し、記述したフローチャート、ブロックダイヤグラムおよび他の構造は、例に過ぎず、これらの構造の他の変形もまた、本開示の範囲内である。これらの構成へのさまざまな修正が可能であり、ここで与えた一般的な原理を、同様に他の構成に適用してもよい。したがって、本開示は、先に示した構成に限定されるように向けられておらず、むしろ、元の開示の一部を形成する添付の特許請求の範囲におけるものを含む、ここでの何らかの型で開示した原理および新規な特徴に一致する最も広い範囲に一致すべきである。
さまざまな異なる技術および技法のいずれかを使用して情報および信号を表わしてもよいことを、当業者は理解するであろう。例えば、電圧、電流、電磁波、磁界または磁気粒子、光領域または光粒子、あるいはそれらの任意の組み合わせにより、上の記述を通して参照されているデータ、命令、コマンド、情報、信号、ビットおよびシンボルを表わしてもよい。
ここで開示したような構成の実現に対する重要な設計要件は、特に、圧縮されたオーディオまたはオーディオヴィジュアル情報(例えば、ここで識別された例のうちの1つのような、圧縮フォーマットにしたがってエンコードされるファイルまたはストリーム)の再生のような、計算集約型のアプリケーション、あるいは、ワイドバンド通信に対するアプリケーション(例えば、12、16、44.1、48または192kHzのような、8キロヘルツよりも高いサンプリングレートでの音声通信)に対して、(通常、秒当たりの百万命令すなわちMIPSで測定される)処理の遅延および/または計算の複雑さを最小化することを含む。
ここで開示したような装置(例えば、装置A100およびMF100)は、意図された適用に適していると思われる、ソフトウェアとハードウェアの任意の組み合わせおよび/またはファームウェアとハードウェアの任意の組み合わせにおいて、実現されてもよい。例えば、このような装置のエレメントは、例えば、同じチップ上にまたはチップセット中の2つ以上のチップ間に存在する、電子デバイスならびに/あるいは光デバイスとして組み立てられてもよい。このようなデバイスの1つの例は、トランジスタまたは論理ゲートのような、論理エレメントの固定アレイまたはプログラム可能アレイであり、これらのエレメントのうちの任意のものが、1つ以上のこのようなアレイとして実現されてもよい。これらのエレメントのうちの任意の2つ以上が、または、これらのエレメントのすべてでさえも、同じアレイ内で実現されてもよい。このようなアレイは、1つ以上のチップ内で(例えば、2つ以上のチップを含むチップセット内で)実現されてもよい。
ここで開示した装置(例えば、装置A100およびMF100)のさまざまな実現の1つ以上のエレメントは、その全体または一部が、マイクロプロセッサと、埋め込みプロセッサと、IPコアと、デジタル信号プロセッサと、FPGA(フィールドプログラム可能ゲートアレイ)と、ASSP(特定用途向け標準品)と、ASIC(特定用途向け集積回路)とのような、論理エレメントの1つ以上の固定アレイまたはプログラム可能アレイ上で実行するように構成されている1つ以上の組の命令として実現されてもよい。ここで開示したような装置の実現のさまざまなエレメントの任意のものはまた、1つ以上のコンピュータ(例えば、“プロセッサ”とも呼ばれる、1つ以上の組の命令または1つ以上のシーケンスの命令を実行するようにプログラムされている1つ以上のアレイを含むマシン)として具現化されてもよく、これらのエレメントのうちの2つ以上、または、これらのエレメントのすべてでさえも、このような同じコンピュータ内で実現されてもよい。
ここで開示したように処理するプロセッサまたは他の手段は、例えば、同じチップ上にまたはチップセット中の2つ以上のチップ間に存在する、1つ以上の電子デバイスならびに/あるいは光デバイスとして組み立てられてもよい。このようなデバイスの1つの例は、トランジスタまたは論理ゲートのような、論理エレメントの固定アレイまたはプログラム可能アレイであり、このようなエレメントの任意のものが、1つ以上のこのようなアレイとして実現されてもよい。このようなアレイは、1つ以上のチップ内で(例えば、2つ以上のチップを含むチップセット内で)実現されてもよい。このようなアレイの例は、マイクロプロセッサと、埋め込みプロセッサと、IPコアと、DSPと、FPGAと、ASSPと、ASICとのような、論理エレメントの固定アレイまたはプログラム可能アレイを含む。ここで開示したように処理するプロセッサまたは他の手段はまた、1つ以上のコンピュータ(例えば、1つ以上の組の命令または1つ以上のシーケンスの命令を実行するようにプログラムされている1つ以上のアレイを含むマシン)あるいは他のプロセッサとして具現化されてもよい。タスクを実行するために、あるいは、プロセッサがその中に組み込まれているデバイスまたはシステム(例えば、オーディオセンシングデバイス)の別の動作に関連するタスクのような、方法M100またはMD100の実現の手順に直接関連しない他の組の命令を実行するために、ここで説明したようなプロセッサを使用することが可能である。ここで開示したような方法の一部を、オーディオセンシングデバイスのプロセッサによって実行し、方法の別の部分を、1つ以上の他のプロセッサの制御下で実行することも可能である。
さまざまな例示的なモジュール、論理ブロック、回路、および、テスト、ならびに、ここで開示したコンフィギュレーションに関連して説明した他の動作が、電子ハードウェア、コンピュータソフトウェア、あるいは、双方の組み合わせたものとして実現されてもよいことを当業者は正しく認識するだろう。このようなモジュール、論理ブロック、回路、および、動作は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、ASICまたはASSP、FPGAまたは他のプログラム可能論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、あるいは、ここで開示したようなコンフィギュレーションを生成させるように設計されたこれらの任意の組み合わせによって、実現または実行されてもよい。例えば、このようなコンフィギュレーションは、ハードワイヤード回路として、特定用途向け集積回路中に組み立てられる回路コンフィギュレーションとして、あるいは、不揮発性記憶装置中にロードされるファームウェアプログラムまたは機械読取可能コードとしてデータ記憶媒体からロードされるか、機械読取可能コードとしてデータ記憶媒体中にロードされるソフトウェアプログラムとして、少なくとも部分的に実現されてもよく、このようなコードは、汎用プロセッサまたは他のデジタル信号処理ユニットのような、論理エレメントのアレイによって実行可能な命令である。汎用プロセッサは、マイクロプロセッサであってもよいが、代替実施形態では、プロセッサは、何らかの従来のプロセッサ、制御装置、マイクロ制御装置、または、状態機械であってもよい。プロセッサはまた、コンピューティングデバイスの組み合わせとして、例えば、DSPとマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、DSPコアを備えた1つ以上のマイクロプロセッサ、または、このようなコンフィギュレーションの他の何らかのものとして実現されてもよい。ソフトウェアモジュールは、RAM(ランダムアクセスメモリ)、ROM(リードオンリーメモリ)、フラッシュRAMのような不揮発性RAM(NVRAM)、消去可能プログラム可能ROM(EPROM)、電気的消去可能プログラム可能ROM(EEPROM)、レジスタ、ハードディスク、リムーバブルディスク、または、CD−ROM、あるいは、技術的に知られている他の何らかの形態の記憶媒体のような、一時的でない記憶媒体に存在してもよい。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合されてもよい。代替実施形態では、記憶媒体はプロセッサと一体化されてもよい。プロセッサおよび記憶媒体は、ASICに存在してもよい。ASICは、ユーザ端末に存在してもよい。代替実施形態では、プロセッサおよび記憶媒体は、ユーザ端末中にディスクリートコンポーネントとして存在してもよい。
プロセッサのような論理エレメントのアレイによって、ここで開示したさまざまな方法(例えば、ここで説明したさまざまな装置の動作を参照して開示した方法M100および他の方法の実現)が、実行されてもよいことに、ならびに、ここで説明したような装置のさまざまなエレメントが、このようなアレイ上で実行するように設計されているモジュールとして実現されてもよいことに、留意されたい。ここで使用したような、“モジュール”または“サブモジュール”という用語は、ソフトウェアの形で、ハードウェアの形で、または、ファームウェアの形で、コンピュータ命令(例えば、論理式)を含む、任意の方法、装置、デバイス、ユニット、または、コンピュータ読取可能データ記憶媒体のことを指すことができる。複数のモジュールまたはシステムを組み合わせて1つのモジュールまたはシステムにすることができ、1つのモジュールまたはシステムを、同じ機能を実行する複数のモジュールまたはシステムに分けることができることを理解すべきである。ソフトウェアまたは他のコンピュータ実行可能命令で実現されるときに、プロセスのエレメントは、本質的に、例えば、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造、および、これらに類似するものによって、関連するタスクを実行するコードセグメントである。“ソフトウェア”という用語は、ソースコードと、アセンブリ言語コードと、マシンコードと、バイナリコードと、ファームウェアと、マクロコードと、マイクロコードと、論理エレメントのアレイによって実行可能な任意の1つ以上の組の命令または1つ以上のシーケンスの命令と、このような例の任意の組み合わせとを含むことを理解すべきである。プログラムまたはコードセグメントは、プロセッサ読取可能媒体に記憶することができ、送信媒体または通信リンクを通して、搬送波で具現化されるコンピュータデータ信号によって送信することができる。
ここで開示した、方法、スキーム、および、技術の実現はまた、論理エレメントのアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロ制御装置、または、他の有限状態マシン)を含むマシンによって実行可能な1つ以上の組の命令として、有体的に(例えば、ここでリストアップしたような1つ以上のコンピュータ読取可能媒体の有体的なコンピュータ読取可能機能で)具現化されてもよい。“コンピュータ読取可能媒体”という用語は、揮発性記憶媒体と、不揮発性記憶媒体と、リムーバブル記憶媒体と、ノンリムーバル記憶媒体とを含む、情報を記憶または転送できる任意の媒体を含んでもよい。コンピュータ読取可能媒体の例は、電子回路、半導体メモリデバイス、ROM、フラッシュメモリ、消去可能ROM(EROM)、フロッピー(登録商標)ディスケットまたは他の磁気記憶装置、CD−ROM/DVDまたは他の光記憶装置、ハードディスクまたは所望の情報を記憶するために使用できる他の何らかの媒体、光ファイバ媒体、無線周波数(RF)リンク、あるいは、所望の情報を搬送するために使用でき、アクセスすることができる他の何らかの媒体を含んでいる。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバ、無線、電磁気、RFリンク等のような送信媒体を通して伝搬できる、何らかの信号を含んでもよい。コードセグメントは、インターネットまたはイントラネットのようなコンピュータネットワークを介してダウンロードされてもよい。任意のケースでは、本開示の範囲は、このような実施形態によって限定されるものとして解釈すべきではない。
ここで説明した方法のタスクのそれぞれは、直接、ハードウェアで、プロセッサにより実行されるソフトウェアモジュールで、または、2つを組み合わせたもので、具現化されてもよい。ここで開示したような方法の実現の典型的な適用において、論理エレメント(例えば、論理ゲート)のアレイは、方法のさまざまなタスクのうちの1つ、1つより多いもの、または、すべてでさえ実行するように構成されている。タスクのうちの1つ以上(場合によってはすべて)は、コード(例えば、1つ以上の組の命令)として実現されてもよく、論理エレメントのアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロ制御装置、または、他の有限状態マシン)を含むマシン(例えば、コンピュータ)によって読取可能および/また実行可能であるコンピュータプログラムプロダクト(例えば、ディスク、フラッシュ、または、他の不揮発性メモリカード、半導体メモリチップ等のような、1つ以上のデータ記憶媒体)で具現化されてもよい。ここで開示したような方法の実現のタスクはまた、1つより多いこのようなアレイまたはマシンによって実行されてもよい。これらの実現または他の実現において、セルラ電話機またはこのような通信能力を有する他のデバイスのような、ワイヤレス通信用のデバイス内で、タスクを実行してもよい。このようなデバイスは、(例えば、VoIPのような1つ以上のプロトコルを使用する)回路交換ネットワークおよび/またはパケット交換ネットワークと通信するように構成されていてもよい。例えば、このようなデバイスは、エンコードされたフレームを受信および/または送信するように構成されているRF回路を備えてもよい。
ここで開示したさまざまな方法が、ハンドセット、ヘッドセット、または、ポータブルデジタルアシスタント(PDA)のような、ポータブル通信デバイスによって実行されてもよいこと、ならびに、ここで説明するさまざまな装置がこのようなデバイス内に含まれてもよいことを明確に開示した。典型的なリアルタイム(例えば、オンライン)適用は、このような移動デバイスを使用して行われる電話機での会話である。
1つ以上の例示的な実施形態では、ここで説明した動作が、ハードウェアで、ソフトウェアで、ファームウェアで、または、これらのものを組み合わせた任意のもので実現されてもよい。ソフトウェアで実現された場合に、このような動作は、1つ以上の命令またはコードとして、コンピュータ読取可能媒体上に記憶されてもよく、あるいは、1つ以上の命令またはコードとして、コンピュータ読取可能媒体上に送信されてもよい。“コンピュータ読取可能媒体”という用語は、コンピュータ読取可能記憶媒体と通信(例えば、送信)媒体の双方を含む。一例として、これらに限定されないが、コンピュータ読取可能記憶媒体は、(これらに限定されないが、ダイナミックまたはスタティックな、RAM、ROM、EEPROMならびに/あるいはフラッシュRAMを含んでもよい)半導体メモリ、あるいは、強誘電体メモリ、磁気抵抗メモリ、オーボニックメモリ、高分子(polymeric)メモリ、または、相変化メモリのような、記憶エレメントのアレイ、CD−ROMまたは他の光ディスク記憶装置、ならびに/あるいは、磁気ディスク記憶装置または他の磁気記憶デバイスを含むことができる。このような記憶媒体は、コンピュータによってアクセスできる命令またはデータ構造の形で、情報を記憶してもよい。通信媒体は、1つの場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む、コンピュータによってアクセスできる命令またはデータ構造の形で、所望のプログラムコードを搬送するために使用できる任意の媒体を含むことができる。また、あらゆる接続は、コンピュータ読取可能媒体と適切に呼ばれる。例えば、同軸ケーブル、光ファイバケーブル、撚り対、デジタル加入者線(DSL)、あるいは、赤外線、無線、および/または、マイクロ波のようなワイヤレス技術を使用しているウェブサイト、サーバ、または、他の遠隔ソースから、ソフトウェアが送信される場合には、同軸ケーブル、光ファイバケーブル、撚り対、DSL、あるいは、赤外線、無線、および/またはマイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ここで使用したようなディスク(diskおよびdisc)は、コンパクトディスク(CD)、レーザディスク(登録商標)、光ディスク、デジタル多用途ディスク(DVD)、フロッピーディスク、および、ブルーレイ(登録商標)ディスク(ブルーレイディスクアソシエーション、universal city、CA)を含むが、一般的に、ディスク(disk)は、データを磁気的に再生する一方で、ディスク(disc)はデータをレーザによって光学的に再生する。先のものを組み合わせたものもまた、コンピュータ読取可能媒体の範囲内に含められるべきである。
ここで説明したような音響信号処理装置は、通信デバイスのような、ある動作を制御するためにスピーチ入力を受け入れ、または、そうでなければ、バックグラウンドノイズから所望のノイズを分離することによって恩恵を受けてもよい電子デバイス中に組み込まれてもよい。多くの適用は、クリアーな所望のサウンドを向上させること、または、複数の方向から発生するバックグラウンドサウンドからクリアーな所望のサウンドを分離することによって恩恵を受けてもよい。このような適用は、音声の認識および検出と、スピーチの向上および分離と、音声起動制御と、これらに類似するものとのような能力を組み込んでいる電子デバイス中あるいはコンピューティングデバイス中に、ヒューマン−マシンインターフェース含めてもよい。限定された処理能力のみを提供するデバイスにおいて適切であるように、このような音響信号処理装置を実現することが望ましいことがある。
例えば、ここで説明したモジュール、エレメント、および、デバイスのさまざまな実現のエレメントは、例えば、同じチップ上にまたはチップセット中の2つ以上のチップ間に存在する、電子デバイスおよび/または光デバイスとして組み立てられてもよい。このようなデバイスの1つの例は、トランジスタまたはゲートのような、論理エレメントの固定アレイあるいはプログラム可能アレイである。ここで説明した装置のさまざまな実現のうちの1つ以上のエレメントもまた、その全体または一部が、マイクロプロセッサと、埋め込みプロセッサと、IPコアと、デジタル信号プロセッサと、FPGAと、ASSPと、ASICとのような、論理エレメントの1つ以上の固定アレイまたはプログラム可能アレイ上で実行するように構成されている1つ以上の組の命令として実現されてもよい。
タスクを実行するために、あるいは、装置がその中に組み込まれているデバイスまたはシステムの別の動作に関連するタスクのような、装置の動作に直接関連しない他の組の命令を実行するために、ここで説明したような装置の実現のうちの1つ以上のエレメントを使用することが可能である。このような装置の実現のうちの1つ以上のエレメントが、共通の構造(例えば、異なる時間において、異なるエレメントに対応するコードの一部を実行するために使用されるプロセッサ、異なる時間において、異なるエレメントに対応するタスクを実行するように実行される1組の命令、あるいは、異なる時間において、異なるエレメントに対する動作を実行する、電子デバイスおよび/または光デバイスの構成)を有することも可能である。
Figure 2013534328
Figure 2013534328
Figure 2013534328
Figure 2013534328
Figure 2013534328
Figure 2013534328
Figure 2013534328

Claims (31)

  1. ビット割り当ての方法において、
    前記方法は、
    複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算することと、
    前記複数のベクトルのうちのそれぞれに対して、前記利得係数に基づいている対応するビット割り当てを計算することと、
    前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定することと、
    前記決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、前記対応するビット割り当てを変更することとを含む方法。
  2. 前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記ベクトルの長さに基づいている請求項1記載のビット割り当ての方法。
  3. 前記少なくとも1つのベクトルのそれぞれに対して、前記最小の割り当て値は、前記ベクトルの長さに基づいている請求項1および2のいずれか1項記載のビット割り当ての方法。
  4. 前記方法は、前記少なくとも1つのベクトルのそれぞれに対して、前記ベクトルの長さの単調非減少関数にしたがって、前記最小の割り当て値を計算することを含む請求項3記載のビット割り当ての方法。
  5. 前記方法は、前記複数のベクトルのうちのそれぞれに対して、前記ベクトル内のエネルギーの分布の測度の値を計算することを含み、
    前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記計算された値に基づいている請求項1ないし4のいずれか1項記載のビット割り当ての方法。
  6. 前記方法は、前記複数のベクトルのうちの少なくとも1つに対して、
    前記対応するビット割り当てが、有効なコードブックインデックス長に対応しないことを決定することと、
    前記決定に応答して、前記対応する割り当てを低減させることとを含む請求項1ないし5のいずれか1項記載のビット割り当ての方法。
  7. 前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当ては、それぞれがn個の単位パルスを有するパターンのコードブックのインデックス長であり、前記方法は、前記対応するビット割り当てと、それぞれが(n+1)個の単位パルスを有するパターンのコードブックのインデックス長との間のビット数を計算することを含む請求項1ないし6のいずれか1項記載のビット割り当ての方法。
  8. 前記方法は、前記複数のベクトルのうちのそれぞれから、対応する利得係数と、対応する形状ベクトルとを計算することを含む請求項1ないし7のいずれか1項記載のビット割り当ての方法。
  9. 前記方法は、前記複数のベクトルのそれぞれの長さを決定することを含み、
    前記複数の長さを決定することは、第2の複数のベクトルの位置に基づいており、
    オーディオ信号のフレームが、前記複数のベクトルと、前記第2の複数のベクトルとを含む請求項1ないし8のいずれか1項記載のビット割り当ての方法。
  10. 前記複数の利得係数を計算することは、対応する量子化された利得ベクトルを逆量子化することを含む請求項1ないし9のいずれか1項記載のビット割り当ての方法。
  11. ビット割り当てのための装置において、
    前記装置は、
    複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算する手段と、
    前記複数のベクトルのうちのそれぞれに対して、前記利得係数に基づいている対応するビット割り当てを計算する手段と、
    前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定する手段と、
    前記決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、前記対応するビット割り当てを変更する手段とを具備する装置。
  12. 前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記ベクトルの長さに基づいている請求項11記載のビット割り当てのための装置。
  13. 前記少なくとも1つのベクトルのそれぞれに対して、前記最小の割り当て値は、前記ベクトルの長さに基づいている請求項11および12のいずれか1項記載のビット割り当てのための装置。
  14. 前記装置は、前記少なくとも1つのベクトルのそれぞれに対して、前記ベクトルの長さの単調非減少関数にしたがって、前記最小の割り当て値を計算する手段を具備する請求項13記載のビット割り当てのための装置。
  15. 前記装置は、前記複数のベクトルのうちのそれぞれに対して、前記ベクトル内のエネルギーの分布の測度の値を計算する手段を具備し、
    前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記計算された値に基づいている請求項11ないし14のいずれか1項記載のビット割り当てのための装置。
  16. 前記装置は、前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当てが、有効なコードブックインデックス長に対応しないことを決定し、前記決定に応答して、前記対応する割り当てを低減させる手段を具備する請求項11ないし15のいずれか1項記載のビット割り当てのための装置。
  17. 前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当ては、それぞれがn個の単位パルスを有するパターンのコードブックのインデックス長であり、前記装置は、前記対応するビット割り当てと、それぞれが(n+1)個の単位パルスを有するパターンのコードブックのインデックス長との間のビット数を計算する手段を具備する請求項11ないし16のいずれか1項記載のビット割り当てのための装置。
  18. 前記装置は、前記複数のベクトルのうちのそれぞれから、対応する利得係数と、対応する形状ベクトルとを計算する手段を具備する請求項11ないし17のいずれか1項記載のビット割り当てのための装置。
  19. 前記装置は、前記複数のベクトルのそれぞれの長さを決定する手段を具備し、
    前記複数の長さを決定することは、第2の複数のベクトルの位置に基づいており、
    オーディオ信号のフレームが、前記複数のベクトルと、前記第2の複数のベクトルとを含む請求項11ないし18のいずれか1項記載のビット割り当てのための装置。
  20. 前記複数の利得係数を計算する手段は、対応する量子化された利得ベクトルを逆量子化する手段を備える請求項11ないし19のいずれか1項記載のビット割り当てのための装置。
  21. ビット割り当てのための装置において、
    前記装置は、
    複数のベクトルのうちのそれぞれに対して、複数の利得係数のうちの対応する1つを計算するように構成されている利得係数計算器と、
    前記複数のベクトルのうちのそれぞれに対して、前記利得係数に基づいている対応するビット割り当てを計算するように構成されているビット割り当て計算器と、
    前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当てが、最小の割り当て値よりも大きくないことを決定するように構成されている比較器と、
    前記決定に応答して、前記少なくとも1つのベクトルのそれぞれに対して、前記対応するビット割り当てを変更するように構成されている割り当て調整モジュールとを具備する装置。
  22. 前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記ベクトルの長さに基づいている請求項21記載のビット割り当てのための装置。
  23. 前記少なくとも1つのベクトルのそれぞれに対して、前記最小の割り当て値は、前記ベクトルの長さに基づいている請求項21および22のいずれか1項記載のビット割り当てのための装置。
  24. 前記装置は、前記少なくとも1つのベクトルのそれぞれに対して、前記ベクトルの長さの単調非減少関数にしたがって、前記最小の割り当て値を計算するように構成されている計算器を具備する請求項23記載のビット割り当てのための装置。
  25. 前記方法は、前記複数のベクトルのうちのそれぞれに対して、前記ベクトル内のエネルギーの分布の測度の値を計算するように構成されているスパース性係数計算器を具備し、
    前記複数のベクトルのうちのそれぞれに対して、前記対応するビット割り当ては、前記計算された値に基づいている請求項21ないし24のいずれか1項記載のビット割り当てのための装置。
  26. 前記装置は、前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当てが、有効なコードブックインデックス長に対応しないことを決定し、前記決定に応答して、前記対応する割り当てを低減させるように構成されている検証モジュールを具備する請求項21ないし25のいずれか1項記載のビット割り当てのための装置。
  27. 前記複数のベクトルのうちの少なくとも1つに対して、前記対応するビット割り当ては、それぞれがn個の単位パルスを有するパターンのコードブックのインデックス長であり、前記装置は、前記対応するビット割り当てと、それぞれが(n+1)個の単位パルスを有するパターンのコードブックのインデックス長との間のビット数を計算するように構成されているモジュールを具備する請求項21ないし26のいずれか1項記載のビット割り当てのための装置。
  28. 前記装置は、前記複数のベクトルのうちのそれぞれから、対応する利得係数と、対応する形状ベクトルとを計算するように構成されているノーマライザを具備する請求項21ないし27のいずれか1項記載のビット割り当てのための装置。
  29. 前記装置は、前記複数のベクトルのそれぞれの長さを決定するように構成されているフレーム分割器を具備し、
    前記複数の長さを決定することは、第2の複数のベクトルの位置に基づいており、
    オーディオ信号のフレームが、前記複数のベクトルと、前記第2の複数のベクトルとを含む請求項21ないし28のいずれか1項記載のビット割り当てのための装置。
  30. 前記利得係数計算器は、対応する量子化された利得ベクトルを逆量子化することによって、前記複数の利得係数を計算するように構成されている請求項21ないし29のいずれか1項記載のビット割り当てのための装置。
  31. 有体的な機能を読み出す機械に、請求項1ないし10のいずれか1項記載の方法を実行させる前記機能を有するコンピュータ読取り可能記憶媒体。
JP2013523225A 2010-07-30 2011-07-29 ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体 Active JP5694532B2 (ja)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US36966210P 2010-07-30 2010-07-30
US61/369,662 2010-07-30
US36970510P 2010-07-31 2010-07-31
US61/369,705 2010-07-31
US36975110P 2010-08-01 2010-08-01
US61/369,751 2010-08-01
US37456510P 2010-08-17 2010-08-17
US61/374,565 2010-08-17
US38423710P 2010-09-17 2010-09-17
US61/384,237 2010-09-17
US201161470438P 2011-03-31 2011-03-31
US61/470,438 2011-03-31
US13/193,529 US9236063B2 (en) 2010-07-30 2011-07-28 Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US13/193,529 2011-07-28
PCT/US2011/045862 WO2012016126A2 (en) 2010-07-30 2011-07-29 Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Publications (2)

Publication Number Publication Date
JP2013534328A true JP2013534328A (ja) 2013-09-02
JP5694532B2 JP5694532B2 (ja) 2015-04-01

Family

ID=45527629

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2013523227A Ceased JP2013537647A (ja) 2010-07-30 2011-07-29 オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
JP2013523220A Active JP5694531B2 (ja) 2010-07-30 2011-07-29 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
JP2013523223A Active JP5587501B2 (ja) 2010-07-30 2011-07-29 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体
JP2013523225A Active JP5694532B2 (ja) 2010-07-30 2011-07-29 ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2013523227A Ceased JP2013537647A (ja) 2010-07-30 2011-07-29 オーディオ信号の従属モードコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
JP2013523220A Active JP5694531B2 (ja) 2010-07-30 2011-07-29 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体
JP2013523223A Active JP5587501B2 (ja) 2010-07-30 2011-07-29 複数段階の形状ベクトル量子化のためのシステム、方法、装置、およびコンピュータ可読媒体

Country Status (10)

Country Link
US (4) US8831933B2 (ja)
EP (5) EP2599082B1 (ja)
JP (4) JP2013537647A (ja)
KR (4) KR20130069756A (ja)
CN (4) CN103038821B (ja)
BR (1) BR112013002166B1 (ja)
ES (1) ES2611664T3 (ja)
HU (1) HUE032264T2 (ja)
TW (1) TW201214416A (ja)
WO (4) WO2012016122A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014091694A1 (ja) * 2012-12-13 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
KR20170035827A (ko) 2014-07-25 2017-03-31 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
JP2019124947A (ja) * 2013-10-18 2019-07-25 テレフオンアクチーボラゲット エルエム エリクソン(パブル) スペクトルピーク位置の符号化及び復号化

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE490454T1 (de) * 2005-07-22 2010-12-15 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
EP2573942B1 (en) * 2010-07-05 2015-12-16 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, device, program, and recording medium
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9008811B2 (en) 2010-09-17 2015-04-14 Xiph.org Foundation Methods and systems for adaptive time-frequency resolution in digital data coding
US9711158B2 (en) * 2011-01-25 2017-07-18 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
US9009036B2 (en) * 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US9015042B2 (en) 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
PL2772913T3 (pl) 2011-10-28 2018-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie kodujące i sposób kodowania
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)
WO2013147666A1 (en) * 2012-03-29 2013-10-03 Telefonaktiebolaget L M Ericsson (Publ) Transform encoding/decoding of harmonic audio signals
DE202013005408U1 (de) * 2012-06-25 2013-10-11 Lg Electronics Inc. Mikrophonbefestigungsanordnung eines mobilen Endgerätes
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
EP2685448B1 (en) * 2012-07-12 2018-09-05 Harman Becker Automotive Systems GmbH Engine sound synthesis
CN104620315B (zh) 2012-07-12 2018-04-13 诺基亚技术有限公司 一种矢量量化的方法及装置
US8885752B2 (en) * 2012-07-27 2014-11-11 Intel Corporation Method and apparatus for feedback in 3D MIMO wireless systems
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
ES2753228T3 (es) * 2012-11-05 2020-04-07 Panasonic Ip Corp America Dispositivo de codificación de audio de voz, dispositivo de decodificación de audio de voz, procedimiento de codificación de audio de voz y procedimiento de decodificación de audio de voz
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US9577618B2 (en) * 2012-12-20 2017-02-21 Advanced Micro Devices, Inc. Reducing power needed to send signals over wires
HUE032831T2 (en) 2013-01-08 2017-11-28 Dolby Int Ab Model-based prediction in a critically sampled filter block
PT2951818T (pt) * 2013-01-29 2019-02-25 Fraunhofer Ges Forschung Conceito de preenchimento de ruído
US9489959B2 (en) 2013-06-11 2016-11-08 Panasonic Intellectual Property Corporation Of America Device and method for bandwidth extension for audio signals
CN104282308B (zh) * 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN104347082B (zh) * 2013-07-24 2017-10-24 富士通株式会社 弦波帧检测方法和设备以及音频编码方法和设备
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US8879858B1 (en) * 2013-10-01 2014-11-04 Gopro, Inc. Multi-channel bit packing engine
WO2015049820A1 (ja) * 2013-10-04 2015-04-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
EP3074970B1 (en) 2013-10-21 2018-02-21 Dolby International AB Audio encoder and decoder
MX365684B (es) * 2013-11-12 2019-06-11 Ericsson Telefon Ab L M Codificacion de vector de ganancia y forma dividida.
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
CN110808056B (zh) * 2014-03-14 2023-10-17 瑞典爱立信有限公司 音频编码方法和装置
CN104934032B (zh) * 2014-03-17 2019-04-05 华为技术有限公司 根据频域能量对语音信号进行处理的方法和装置
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9672838B2 (en) 2014-08-15 2017-06-06 Google Technology Holdings LLC Method for coding pulse vectors using statistical properties
US9620136B2 (en) 2014-08-15 2017-04-11 Google Technology Holdings LLC Method for coding pulse vectors using statistical properties
US9336788B2 (en) * 2014-08-15 2016-05-10 Google Technology Holdings LLC Method for coding pulse vectors using statistical properties
EP3210207A4 (en) 2014-10-20 2018-09-26 Audimax LLC Systems, methods, and devices for intelligent speech recognition and processing
US20160232741A1 (en) * 2015-02-05 2016-08-11 Igt Global Solutions Corporation Lottery Ticket Vending Device, System and Method
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TW202242853A (zh) * 2015-03-13 2022-11-01 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
DE102015104864A1 (de) 2015-03-30 2016-10-06 Thyssenkrupp Ag Lagerelement für einen Stabilisator eines Fahrzeugs
WO2017005296A1 (en) * 2015-07-06 2017-01-12 Nokia Technologies Oy Bit error detector for an audio signal decoder
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US11531695B2 (en) * 2017-08-23 2022-12-20 Google Llc Multiscale quantization for fast similarity search
CN111133510B (zh) * 2017-09-20 2023-08-22 沃伊斯亚吉公司 用于在celp编解码器中高效地分配比特预算的方法和设备
CN108153189B (zh) * 2017-12-20 2020-07-10 中国航空工业集团公司洛阳电光设备研究所 一种民机显示控制器的电源控制电路及方法
US11367452B2 (en) 2018-03-02 2022-06-21 Intel Corporation Adaptive bitrate coding for spatial audio streaming
CN118038881A (zh) * 2018-04-05 2024-05-14 瑞典爱立信有限公司 支持生成舒适噪声的方法和设备
CN110704024B (zh) * 2019-09-28 2022-03-08 中昊芯英(杭州)科技有限公司 一种矩阵处理装置、方法及处理设备
US20210209462A1 (en) * 2020-01-07 2021-07-08 Alibaba Group Holding Limited Method and system for processing a neural network
CN111681639B (zh) * 2020-05-28 2023-05-30 上海墨百意信息科技有限公司 一种多说话人语音合成方法、装置及计算设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358500A (ja) * 1986-08-25 1988-03-14 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 副帯域音声コ−ダ用ビツト割振り方法
JPH09288498A (ja) * 1996-04-19 1997-11-04 Matsushita Electric Ind Co Ltd 音声符号化装置
JP2001044844A (ja) * 1999-07-26 2001-02-16 Matsushita Electric Ind Co Ltd サブバンド符号化方式
JP2002542522A (ja) * 1999-04-16 2002-12-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
JP2004246038A (ja) * 2003-02-13 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2010518422A (ja) * 2007-02-02 2010-05-27 フランス・テレコム 改良形デジタルオーディオ信号符号化/復号化方法

Family Cites Families (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3978287A (en) 1974-12-11 1976-08-31 Nasa Real time analysis of voiced sounds
US4516258A (en) 1982-06-30 1985-05-07 At&T Bell Laboratories Bit allocation generator for adaptive transform coder
JPS6333935A (ja) 1986-07-29 1988-02-13 Sharp Corp ゲイン/シエイプ・ベクトル量子化器
JPH01205200A (ja) 1988-02-12 1989-08-17 Nippon Telegr & Teleph Corp <Ntt> 音声符号化方式
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
US5388181A (en) 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5630011A (en) 1990-12-05 1997-05-13 Digital Voice Systems, Inc. Quantization of harmonic amplitudes representing speech
US5222146A (en) * 1991-10-23 1993-06-22 International Business Machines Corporation Speech recognition apparatus having a speech coder outputting acoustic prototype ranks
EP0551705A3 (en) 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
CA2088082C (en) 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
IT1257065B (it) 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
KR100188912B1 (ko) * 1992-09-21 1999-06-01 윤종용 서브밴드코딩의 비트재할당 방법
US5664057A (en) 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
JP3228389B2 (ja) 1994-04-01 2001-11-12 株式会社東芝 利得形状ベクトル量子化装置
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
US5751905A (en) 1995-03-15 1998-05-12 International Business Machines Corporation Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5692102A (en) 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US5692949A (en) 1995-11-17 1997-12-02 Minnesota Mining And Manufacturing Company Back-up pad for use with abrasive articles
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5781888A (en) 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP3240908B2 (ja) 1996-03-05 2001-12-25 日本電信電話株式会社 声質変換方法
JP3707153B2 (ja) 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
KR20030096444A (ko) 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
FR2761512A1 (fr) 1997-03-25 1998-10-02 Philips Electronics Nv Dispositif de generation de bruit de confort et codeur de parole incluant un tel dispositif
US6064954A (en) 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
CN1231050A (zh) 1997-07-11 1999-10-06 皇家菲利浦电子有限公司 具有改进谐波语音编码器的发射机
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
JPH11224099A (ja) 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3515903B2 (ja) 1998-06-16 2004-04-05 松下電器産業株式会社 オーディオ符号化のための動的ビット割り当て方法及び装置
US6094629A (en) 1998-07-13 2000-07-25 Lockheed Martin Corp. Speech coding system and method including spectral quantizer
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6766288B1 (en) 1998-10-29 2004-07-20 Paul Reed Smith Guitars Fast find fundamental method
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6952671B1 (en) 1999-10-04 2005-10-04 Xvd Corporation Vector quantization with a non-structured codebook for audio compression
JP2001242896A (ja) 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd 音声符号化/復号装置およびその方法
JP3404350B2 (ja) 2000-03-06 2003-05-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ取得方法、音声復号方法及び装置
CA2359260C (en) 2000-10-20 2004-07-20 Samsung Electronics Co., Ltd. Coding apparatus and method for orientation interpolator node
GB2375028B (en) 2001-04-24 2003-05-28 Motorola Inc Processing speech signals
JP3636094B2 (ja) 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
DE60209888T2 (de) 2001-05-08 2006-11-23 Koninklijke Philips Electronics N.V. Kodieren eines audiosignals
JP3601473B2 (ja) 2001-05-11 2004-12-15 ヤマハ株式会社 ディジタルオーディオ圧縮回路および伸長回路
KR100347188B1 (en) 2001-08-08 2002-08-03 Amusetec Method and apparatus for judging pitch according to frequency analysis
US7027982B2 (en) 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7310598B1 (en) 2002-04-12 2007-12-18 University Of Central Florida Research Foundation, Inc. Energy based split vector quantizer employing signal representation in multiple transform domains
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100728428B1 (ko) 2002-09-19 2007-06-13 마츠시타 덴끼 산교 가부시키가이샤 오디오 디코딩 장치 및 오디오 디코딩 방법
JP4657570B2 (ja) 2002-11-13 2011-03-23 ソニー株式会社 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
FR2849727B1 (fr) 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
WO2005020210A2 (en) 2003-08-26 2005-03-03 Sarnoff Corporation Method and apparatus for adaptive variable bit rate audio encoding
US7613607B2 (en) 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1998045A (zh) 2004-07-13 2007-07-11 松下电器产业株式会社 音调频率估计装置以及音调频率估计方法
US20060015329A1 (en) 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
JP4977471B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP4599558B2 (ja) 2005-04-22 2010-12-15 国立大学法人九州工業大学 ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
JP4950210B2 (ja) 2005-11-04 2012-06-13 ノキア コーポレイション オーディオ圧縮
CN101030378A (zh) 2006-03-03 2007-09-05 北京工业大学 一种建立增益码书的方法
KR100770839B1 (ko) 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
US8712766B2 (en) 2006-05-16 2014-04-29 Motorola Mobility Llc Method and system for coding an information signal using closed loop adaptive bit allocation
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8374857B2 (en) * 2006-08-08 2013-02-12 Stmicroelectronics Asia Pacific Pte, Ltd. Estimating rate controlling parameters in perceptual audio encoders
US20080059201A1 (en) 2006-09-03 2008-03-06 Chih-Hsiang Hsiao Method and Related Device for Improving the Processing of MP3 Decoding and Encoding
JP4396683B2 (ja) 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
WO2008045846A1 (en) 2006-10-10 2008-04-17 Qualcomm Incorporated Method and apparatus for encoding and decoding audio signals
US20080097757A1 (en) 2006-10-24 2008-04-24 Nokia Corporation Audio coding
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
CN101548316B (zh) 2006-12-13 2012-05-23 松下电器产业株式会社 编码装置、解码装置以及其方法
EP2101322B1 (en) 2006-12-15 2018-02-21 III Holdings 12, LLC Encoding device, decoding device, and method thereof
KR101299155B1 (ko) * 2006-12-29 2013-08-22 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
DE602007004943D1 (de) 2007-03-23 2010-04-08 Honda Res Inst Europe Gmbh Tonhöhenextraktion mit Hemmung der Harmonischen und Subharmonischen der Grundfrequenz
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8005023B2 (en) 2007-06-14 2011-08-23 Microsoft Corporation Client-side echo cancellation for multi-party audio conferencing
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8111176B2 (en) 2007-06-21 2012-02-07 Koninklijke Philips Electronics N.V. Method for encoding vectors
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
CN101842833B (zh) 2007-09-11 2012-07-18 沃伊斯亚吉公司 语音和音频编码中快速代数码本搜索的方法和设备
WO2009048239A2 (en) * 2007-10-12 2009-04-16 Electronics And Telecommunications Research Institute Encoding and decoding method using variable subband analysis and apparatus thereof
US8527265B2 (en) 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8139777B2 (en) 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
CN101465122A (zh) 2007-12-20 2009-06-24 株式会社东芝 语音的频谱波峰的检测以及语音识别方法和系统
US20090319261A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
PL2304719T3 (pl) 2008-07-11 2017-12-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, sposoby dostarczania strumienia audio oraz program komputerowy
US8300616B2 (en) 2008-08-26 2012-10-30 Futurewei Technologies, Inc. System and method for wireless communications
WO2010053287A2 (en) 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
CA3162807C (en) 2009-01-16 2024-04-23 Dolby International Ab Cross product enhanced harmonic transposition
US8493244B2 (en) 2009-02-13 2013-07-23 Panasonic Corporation Vector quantization device, vector inverse-quantization device, and methods of same
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
US9117458B2 (en) 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
AU2011226143B9 (en) * 2010-03-10 2015-03-19 Dolby International Ab Audio signal decoder, audio signal encoder, method for decoding an audio signal, method for encoding an audio signal and computer program using a pitch-dependent adaptation of a coding context
WO2011141772A1 (en) 2010-05-12 2011-11-17 Nokia Corporation Method and apparatus for processing an audio signal based on an estimated loudness
US8831933B2 (en) 2010-07-30 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6358500A (ja) * 1986-08-25 1988-03-14 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 副帯域音声コ−ダ用ビツト割振り方法
JPH09288498A (ja) * 1996-04-19 1997-11-04 Matsushita Electric Ind Co Ltd 音声符号化装置
JP2002542522A (ja) * 1999-04-16 2002-12-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声符号化のための利得−適応性量子化及び不均一符号長の使用
JP2001044844A (ja) * 1999-07-26 2001-02-16 Matsushita Electric Ind Co Ltd サブバンド符号化方式
JP2004246038A (ja) * 2003-02-13 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
JP2010518422A (ja) * 2007-02-02 2010-05-27 フランス・テレコム 改良形デジタルオーディオ信号符号化/復号化方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2014091694A1 (ja) * 2012-12-13 2017-01-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
JP2019124947A (ja) * 2013-10-18 2019-07-25 テレフオンアクチーボラゲット エルエム エリクソン(パブル) スペクトルピーク位置の符号化及び復号化
KR20170035827A (ko) 2014-07-25 2017-03-31 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
EP3413307A1 (en) 2014-07-25 2018-12-12 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio signal coding apparatus, audio signal decoding device, and methods thereof
US10311879B2 (en) 2014-07-25 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
US10643623B2 (en) 2014-07-25 2020-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
KR102165403B1 (ko) 2014-07-25 2020-10-14 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
US11521625B2 (en) 2014-07-25 2022-12-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method

Also Published As

Publication number Publication date
WO2012016110A3 (en) 2012-04-05
KR20130037241A (ko) 2013-04-15
HUE032264T2 (en) 2017-09-28
CN103038821B (zh) 2014-12-24
US20120029925A1 (en) 2012-02-02
KR20130036364A (ko) 2013-04-11
KR20130036361A (ko) 2013-04-11
CN103038820A (zh) 2013-04-10
EP3021322A1 (en) 2016-05-18
US9236063B2 (en) 2016-01-12
JP2013532851A (ja) 2013-08-19
EP2599081A2 (en) 2013-06-05
CN103038822B (zh) 2015-05-27
WO2012016126A3 (en) 2012-04-12
BR112013002166B1 (pt) 2021-02-02
US20120029924A1 (en) 2012-02-02
EP2599082B1 (en) 2020-11-25
WO2012016128A3 (en) 2012-04-05
BR112013002166A2 (pt) 2016-05-31
KR101445509B1 (ko) 2014-09-26
TW201214416A (en) 2012-04-01
EP2599081B1 (en) 2020-12-23
JP5587501B2 (ja) 2014-09-10
US20120029926A1 (en) 2012-02-02
EP2599082A2 (en) 2013-06-05
KR20130069756A (ko) 2013-06-26
CN103038822A (zh) 2013-04-10
US8924222B2 (en) 2014-12-30
EP3852104A1 (en) 2021-07-21
WO2012016122A2 (en) 2012-02-02
WO2012016126A2 (en) 2012-02-02
JP5694531B2 (ja) 2015-04-01
ES2611664T3 (es) 2017-05-09
EP3852104B1 (en) 2023-08-16
JP2013537647A (ja) 2013-10-03
EP2599080A2 (en) 2013-06-05
CN103052984A (zh) 2013-04-17
US8831933B2 (en) 2014-09-09
EP3021322B1 (en) 2017-10-04
CN103052984B (zh) 2016-01-20
CN103038821A (zh) 2013-04-10
EP2599080B1 (en) 2016-10-19
JP2013539548A (ja) 2013-10-24
WO2012016110A2 (en) 2012-02-02
WO2012016128A2 (en) 2012-02-02
WO2012016122A3 (en) 2012-04-12
JP5694532B2 (ja) 2015-04-01
KR101442997B1 (ko) 2014-09-23
KR101445510B1 (ko) 2014-09-26
US20120029923A1 (en) 2012-02-02

Similar Documents

Publication Publication Date Title
JP5694532B2 (ja) ダイナミックなビット割り当てのためのシステム、方法、装置およびコンピュータ読取り可能媒体
JP5680755B2 (ja) ノイズ注入のためのシステム、方法、装置、および、コンピュータ読取可能媒体
CN104937662B (zh) 用于线性预测译码中的自适应共振峰锐化的系统、方法、设备和计算机可读媒体
EP2599079A2 (en) Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150204

R150 Certificate of patent or registration of utility model

Ref document number: 5694532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250