JP2014502366A - 低ビットレート信号コーダおよびデコーダ - Google Patents
低ビットレート信号コーダおよびデコーダ Download PDFInfo
- Publication number
- JP2014502366A JP2014502366A JP2013536900A JP2013536900A JP2014502366A JP 2014502366 A JP2014502366 A JP 2014502366A JP 2013536900 A JP2013536900 A JP 2013536900A JP 2013536900 A JP2013536900 A JP 2013536900A JP 2014502366 A JP2014502366 A JP 2014502366A
- Authority
- JP
- Japan
- Prior art keywords
- model
- data
- parameters
- frame
- complete
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 199
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000003860 storage Methods 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims 7
- 238000009499 grossing Methods 0.000 claims 2
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000005236 sound signal Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 53
- 230000005284 excitation Effects 0.000 abstract description 26
- 230000006835 compression Effects 0.000 abstract description 7
- 238000007906 compression Methods 0.000 abstract description 7
- 238000001514 detection method Methods 0.000 abstract description 3
- 230000006872 improvement Effects 0.000 abstract description 3
- 230000006837 decompression Effects 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 16
- 230000001934 delay Effects 0.000 description 13
- 238000013139 quantization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 241000668842 Lepidosaphes gloverii Species 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000018084 Garcinia livingstonei Nutrition 0.000 description 1
- 240000007471 Garcinia livingstonei Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000005477 standard model Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
【選択図】図1
Description
本PCT特許出願は、2010年10月29日付けで出願され、「Very Low Bit Rate Signal Coder and Decoder」と題する米国特許出願第12/915,989号の優先権の利益を主張する。この関連する特許出願の内容は、その主題が本明細書と矛盾しない、または本明細書を制限していない限り、参照により本明細書に組み込まれる。
適用なし
この特許書類の開示の一部分は、著作権の保護を受けている資料を含む。この著作権の保有者は、この特許文書または特許開示のいずれかによるファクシミリ複製に対して、それが特許商標庁の特許ファイルまたは記録内に見られるとき、異議がないが、そうでなければ、著作権のすべての権利を留保する。
図1に、本発明の一実施形態による、COMPLETEベースの分析/コーディングシステムの3つの基本的な構成要素を示す例示的なブロック図を示す。図1は、完全発振器+外部励起(COMPLETE)ベースの符号化システム10の基本ブロックの図を示す。COMPLETE10は、Lサンプル入力フレームを構築し、たとえば、ウィンドウ化およびフィルタ処理によって入力を変換することができるプリプロセッサ120を含み得る。また、前処理動作は、アナログ入力をデジタル信号に変換することができユニット90において実行される任意選択のアナログサンプリングを含むことができる。COMPLETE10は、メインCOMPLETEコード生成モジュールであるCOMPLETEジェネレータモジュール170と、導出されたコードパラメータを構成/記憶/送信することができ、これらのパラメータを分析/変換することもできるポストプロセッサ160とをさらに含むことができる。入力は、時間的に発展する信号、または2D画像から抽出されたデータシーケンスのような空間ベクトルとすることができる。図1の前処理モジュールには、デジタル入力またはアナログ入力を供給することができる。アナログ入力は、最初にユニット90でサンプリングしてからプリプロセッサ120にパスされ得、デジタル信号入力は、プリプロセッサ120によって直接的に受信され得る。
図2の記憶ユニット110は、現在のフレームをモデル化するために使用され得る参照情報を記憶する。ユニット110が記憶することができる情報の1つのタイプは、現在のフレームXkより前に受信された入力から導出されたデータ履歴である。そのような履歴値は、COMPLETEのための参照データの一部を提供することができる。図2に示す好ましい実施形態では、記憶ユニット110は、復元された以前の入力フレーム[Yk−p,・・・,Yk−1]を蓄積し、s=(l,...,p)であるYk−sは、入力フレームXk−sの復元された値を示し、前述のように、下付き文字「k−s」はフレームが収集された順序を示す。110に記憶されたYk−sは各々、デコーダ150によって、以下により詳しく記載する方法を使用して、対応するフレーム「k−s」についての導出されたCOMPLETEパラメータから合成される。他の実施形態では、記憶ユニット110は、プリプロセッサ120において上述したように任意選択で変換される何らかの形式の実際の以前の入力を記憶することができる。重複フレームが使用される場合、適切に重み付けされた実際の/復元された重複フレームを、110において組み合わせて、重複内の実際の/復元された入力シーケンスを再生することができる。
推定器/評価器ユニット140は、COMPLETEモデル推定機能を実行する。以下の説明は、バッファRB中のシーケンス中に参照が配置される図2に示した実施形態を参照する。モデル推定のプロセスは、130のRB中のN長−Lブロック(Bd(i),i=1,・・・,N}のセットを識別し、それにより、入力フレームXkが{Bd(i)}の何らかの特定の関数としてモデル化される。
Xk=G(Bd(i)),i=1,・・・,N (1)
ただし、
Gは、線形または非線形の特定の関数形式を示し、
Nは、が式(1)において使用されるBd(i)ブロックの数であり、
iは、1番目のデータブロックBdを特定するインデックスであり、
Bd(i)は、i番目「タップ」と呼ばれるi番目のブロックであり、RBのエントリd(i)から始まる130中のRBから引き出される。ここで、
d(i)は、i番目の遅延をしめし(便宜上、diと記載されることもある)、ブロックBd(i)中の第1の要素であるRB130中のエントリに対する指針である。可能な遅延値の範囲は、整数セット1≦di≦maxd、maxd=m−L+1であり、ただし、mはRB中の点の総数である。
N、di、Bd(i)は、上記式(1)に定義されており、
aiは、対応するブロックBd(i)の相対スケーリング(重み)である。
式(2)で推定する必要があるパラメータは、{ai}と{di}とのセット(i=1,・・・,N)と、項数Nとを含む。COMPLETEの効率を理由に、多くの信号クラスを、N=2の線形COMPLETEモデルを用いて正確に符号化することができることを留意されたい。高度に複雑な信号の場合であっても、N=4で十分とすることができる。さらに、Nの選定は、所与の適用例について知られていることが多い。このような場合、式(2)の推定モデルを推定することは、パラメータセット{ai,di}だけを推定することに低減する。パラメータ{ai,di}を推定するためのいくつかの方法について以下に記載する。モデルタームの数Nも推定しなければならない場合、以下に提供される同じ方法を、Nの様々な値についてパラメータセット{ai,di}を推定するために使用することができ、タームNの最適数を選択するために、当技術分野で知られている方法、たとえば、赤池情報量規準を採用することができる。式(1)の非線形COMPLETEに対する上述の方法の適応については、セクション2の最後に提供する。
データにパラ指標モデルを適合させるためのいくつかの知られている方法のうちの1つを適応させることによって、パラメータ{ai,di}をCOMPLETE推定器/評価器140中で推定することができる。ここで説明する実施形態は、一般に、2つの基本的なプロシージャを実行する。第1のプロシージャは、多数の候補モデルを生成する。次いで、その結果を第2のプロシージャにパスし、予め選択された指標(測定基準)を使用して推定候補モデルの性能を評価すると、「最もよく機能する」モデルが分かる。「最もよく機能する」モデルとは、プリセットされたクリテリア(基準)によって測定される最良の結果を提供するモデルとして定義される。各プロシージャのいくつかの実施形態について以下に説明する。これらの説明は例を提供するものであり、COMPLETEとそのパラメータとを推定するための手段を網羅するものではないことを理解されたい。基本原理に基づく他の方法を使用することは、本発明における特許請求の範囲をいかなる方法でも減少させるべきものではない。
ここで提供される候補モデルを生成するため方法は、3つの基本ステップを実行する。第1のステップは、1つまたは複数の候補遅延{dt ^}を選ぶ。ここで、t=1,・・・,Dであり、D<Nであり、上付き文字は、これが考えられる候補値であることを示すために使用され、RB130から対応する遅延タップ{Bd ^ (t)}を取り出す。第2のステップは、係数{at ^}に対応する{Bd ^ (t)}を計算する。これは、知られている手段により代数学上の最小2乗の問題を解くことによって行うことができる。
[a1 ^,・・・,at ^]’=inv[B^ d(t)]X’k (3)
ただし、
[B^ d(t)]は、列が130から選択されるブロックB^ d(t)である行列であり、
inv[B^ d(t)]は、知られている方法、たとえば、特異値分解法を使用して計算される[B^ d(t)]行列の擬逆元であり、
[a1 ^,・・・,at ^]’は、係数{at ^}で構成される列ベクトルであり、
X’kは、入力Xkの要素で構成される列ベクトルである。
多数の候補パラメータセット{at ^dt ^}jを作成するために、上記の2つのステップを繰り返し、ここで、下付き文字j=1,・・・,Jは、特定の候補セットをインデックス付けするために使用され、そのようなセットが各々、第1のステップで選択された{dt ^}の特定の選定のために導出される。追加のステップとして、所与の適用例に適している場合、以下に記載する手段によって、COMPLETEパラメータを量子化することができる。第3のステップは、各候補セット{at ^,dt ^}jについて、後で詳細に定義するCOMPLETEモデル出力を計算する。
候補パラメータセットを生成するための3つの方法について以下に説明するが、これらの方法は、候補遅延セットを生成するために全数探索、逐次探索および制約付き探索を対応して使用することができる。すべての3つの方法は、範囲[1 maxd]から構築される整数セットDから遅延値を引き出す。〔1 maxd〕セット中のいくつかの値は有意な遅延を提供するものではなく、Dの一部として含まれる必要もない。詳細には、〔Yk−p,・・・,Yk−1〕で構成されるシーケンス中のすべての点は、典型的には、意味のある参照を提供し、したがって、典型的には、これらの点のBd(i)個のブロックをインデックス付けする遅延がDに含まれる。一方、2つの外部参照、たとえばEiとΕi+1、または外部参照EhとYk−pにわたるブロックBd(i)は、典型的には、意味のある参照を提供せず、したがって、それらのブロックをインデックス付けする遅延がDには含まれない。
上述の第1のプロシージャは、式(2)にしたがって導出されたパラメータ化された候補モデルのセットを出力する。次に、これらの候補モデルの品質を評価することを目的として、推定器/評価器140により使用され得る様々な方法の適応について説明する。典型的には、式によってモデルが定義されると、この式を使用してその出力を計算する。詳細には、式(2)の場合、t=1,・・・,D,D≦Nであるj番目の候補パラメータ{at ^,dt ^}jの場合をここでは仮定すると、標準的なモデル出力は、Xk ^(j)=Σi Dai ^Bd ^ (i)と定義され、他の表記は、上記に規定したもの同じである。典型的には、そのような標準的な出力Xk ^(j)は、モデル品質を評価するために使用される。この点についての共通の測度は、j番目の候補パラメータセット{a^、d^}jの場合を仮定すると、平均2乗誤差(MSE)である。
fsは、サンプリング周波数であり、
Fは、フーリエ変換を示し、
fは、[0、fs]に及ぶ対象範囲の周波数ビンであり、
jは、候補パラメータセット{ai ^、di ^}jのインデックスである。
fs,F[.]およびjは、式(6)において上記で定義されており、
|.|は、絶対値スペクトルを示し、
W(z)は、下記のように求められる重み付けフィルタである。
図3に、本発明の一実施形態による、受信したCOMPLETEパラメータから信号を復元するCOMPLETEシンセサイザ/デコーダの例示的なブロック図を示す。復号化とは、図2のシンセサイザ150において、また、図3のユニット250において実行される動作を指す。シンセサイザ(デコーダ)150/250は、元の入力フレームを供給されたパラメータから何らかの精度まで復元する。図2のシンセサイザ150の場合、合成されたパラメータは、推定器/評価器140から入力さら、図3のスタンドアロン復号システムの場合、パラメータは、送信されたコード/記憶されたコードから取得される。
図4に、本発明の一実施形態による、一般的なマルチモードCOMPLETE/KAMシステムの構成要素を示す例示的なブロック図を示す。図4は、ハイブリッドマルチモードCOMPLETE/KAMシステム400の一般的な構造を示し、このシステム400は、COMPLETEユニット10a、10b、10n、および従来技術の様々な方法(KAM)405a、405b、・・・、405n、ならびにそれらの組合せの様々な形態の中から選定することによって、入力フレームを符号化し、その様々なブロックおよびユニットは、ハードウェア、ソフトウェアまたはそれらの組合せにおいて実装され得る。システム400の実施形態は、2つの実用的な機能、1)COMPLETEの初期化、2)KAMの性能、あるいは代替的には、COMPLETE自体が所望のレベルの性能を提供しない適用例ではCOMPLETEの性能を改善することを提供することができる。発明の概要において論じたように、非構造化エネルギー中の有意な立上り、不連続性、および信号において進行中のパターンが進化するスケールに対して短い時間スケールで生じる過渡信号など、入力信号におけるパターンブレークイベントは、COMPLETE性能に悪影響を及ぼすことがある。そのような場合、KAMまたはCOMPLETEが単独で提供することができるものを上回るように性能全体を向上させるために、信号のいくつかの部分を符号化するためにKAM405を使用することができ、他の部分を符号化するためにCOMPLETEを使用することができる。
すべてのCOMPLETE/KAM実施形態では、デコーダは、受信したモデル識別子コードを評価し、それに応じて、Xkを符号化するために使用される方法に対応する方法を使用して、出力信号Ykを再構成する。コーダによって使用されるそのような方法は、COMPLETEまたはKAMでも、あるいはCOMPLETEおよび/またはKAMの組合せでもよい。KAMによって符号化された信号の各部分は、そのKAMのための知られている復号方法を使用して復号される。COMPLETEによって符号化された信号の各部分は、モード1に記載した対応するCOMPLETE復号方法を使用して復号される。復元されたフレームは、コーダ側の記憶装置420中の復元されたフレームの蓄積をミラーリングする方法で、デコーダの記憶ユニットに蓄積され、必要に応じて、将来のフレームを復元する際に使用される。
モード3は、モード1およびモード2で論じた実施形態のいくつかの具体的な例を提供する。図5に、本発明の一実施形態による、マルチモードCOMPLETE/PACT実装を利用する音声分析(符号化)システムの一例を示す例示的なブロック図を示す。図5は、現代のコーデックのビットレートに匹敵するビットレートでトール品質音声を生成することが可能であり、本発明のモード2に記載した混合COMPLETE/KAMストラテジを使用して実装される音声コーダ50の必須の部分のブロック図を示している。重要なポイントのうちのいくつかをより簡単に示すことができるように、モード3は、COMPLETEモデルの完全発振器(COM:Complete Oscillator)部分を使用する。モデルのCOM部分は、データ履歴および現在のフレームからのみ導出された参照を使用し、外部参照を使用しない。記載を簡単にするために、モード3に使用されるモデルをCOMと呼ぶ。図5の音声コーダは、プリプロセッサモジュール500と、初期化プロセスを制御するプリセレクタユニット510と、1つのCOM推定ユニット525および1つのKAM推定ユニット535を含むCOM/PACT符号化モジュール515とを含み、以下に詳述するパルス型自己回帰コンペンセータ(PACT:Pulsed Autoregressive Compensator)法を実装する。音声コーダ50は、COM525がアクセスすることができる復元された以前の入力[Yk−p,・・・,Yk−i]を含む記憶ユニット520と、標準(非初期化)モードでモデル選択プロセスを制御し、以下に記載する関連情報をユニット520およびポストプロセッサ540にルーティングすることによって「最良の」モデルが発見された後に出力プロセスを開始するポストセレクタ530とをさらに含むことができる。ポストプロセッサ540は、モード2に記載した図4のポストプロセッサ440と同様に動作し、したがって、その説明は省略する。
p(v)は、現在のフレーム内のパルスvの位置を示し、
cvは、パルスvの利得を示し、
Pは、近似において使用されるパルス数であり、所与の実施形態ではP=8である。
モード3の場合、音声フレームは、上述のモード1およびモード2の復号方法を使用してデコーダにおいて再構成される。
別段に明記されていない限り、同じ目的または等価の目的または同様の目的を果たす代替的特徴によって交換することができる。したがって、別段に明記されていない限り、開示した特徴は各々、包括的な一連の同等の特徴または同様の特徴の1つの例に過ぎない。
Claims (19)
- 実行可能プログラムがその上に記憶された非一時的なコンピュータ読取可能記憶媒体であって、データ信号を分析し、モデル化するための前記プログラムが、プロセッサに対し、
データフレームを生成するために前記データ信号を前処理するステップであって、前記前処理するステップが、前記データ信号をサンプリングすること、前記データ信号を変換すること、前記データ信号を平滑化すること、ならびに、前記データ信号を、別個の入力としてモデル化すべき1つまたは複数の成分に分解することが可能である、前処理するステップと、
モデルパラメータを決定するために、前記データフレームを、参照バッファから引き出される波形の固定長ブロックの組合せとしてモデル化するステップであって、前記参照バッファが、現在のフレームの最も最近のデータポイントを除くすべてを備える、モデル化するステップと、
最適モデルを選択するために、複数のモデルの品質を評価するステップと、
計算された前記モデルパラメータを処理するステップであって、前記処理するステップが、前記データ信号を記憶し、送信し、分析し、分類することが可能である、処理するステップと
を含む方法を実行するように命令する、非一時的なコンピュータ読取可能記憶媒体。 - 前記現在のデータフレームを参照することなく、前記最適モデルのパラメータから復元された前記波形、
前記最適モデルのパラメータのサブセットから復元された前記波形、
すべての利用可能なデータを使用して前記最適モデルから推定された出力、および
モデル化されている前記データフレーム
のうちの少なくとも1つを記憶し、それらを将来の計算のために利用可能にするステップをさらに含む、請求項1に記載の方法。 - 前記参照バッファが、
予めモデル化されたデータ、および/または
予めモデル化されたデータの前記モデルパラメータから復元されたフレーム
のうちの少なくとも1つから導出された追加の参照を備える、請求項2に記載の方法。 - 前記参照バッファが、記憶された波形自体の辞書またはそれらのパラメータから取り出され、および/または現在のデータフレームから導出される2つの手段のうちの少なくとも1つ手段によって導出された追加の参照をさらに備える、請求項3に記載の方法。
- モデル品質の前記評価が1つまたは複数の指標を使用し、前記指標が、参照するすべての前記利用可能なデータポイントを使用して計算されたモデル出力、ならびに前記入力フレームについての復元された値を使用して合成されたモデル出力のうちの1つまたは複数の関数であり、前記合成が、評価される前記モデルの実際のパラメータまたは近似パラメータを使用する、請求項1に記載の方法。
- 前記モデルパラメータを変換する、および/または量子化するステップをさらに含む、請求項1に記載の方法。
- 実行可能プログラムがその上に記憶された非一時的なコンピュータ読取可能記憶媒体であって、モデルパラメータからデータフレームを復号するための前記プログラムが、プロセッサに対し、
前記データフレームを符号化するために使用されるパラメータを含むコードを収集するステップと、
参照波形を合成するためのパラメータを前記コードが含んでいるかどうかを判断し、含んでいる場合には、前記参照波形を合成するステップと、
前記パラメータのいずれかが、復号される前記フレーム内に含まれているデータをインデックス付けするかどうかを判断するステップと、
前記パラメータが、復号される前記フレームの外側に含まれているデータのみをインデックス付けするときに、前記データフレーム全体を一度に合成するステップであって、前記合成が、前記収集されたコード中の前記パラメータの値を使用して、エンコーダが使用する分析式を評価することによって実行される、前記データフレーム全体を一度に合成するステップと、
パラメータが、復号される前記フレーム内に含まれている少なくとも1つのデータポイントをインデックス付けするときに、前記フレームの個々の点を逐次合成するステップであって、前記合成が、前記エンコーダによって使用されるパラメータ化された分析式中のブロックの代わりに、単一ポイントを代入することによって実行される、前記フレームの個々の点を逐次合成するステップと
を含む方法を実行するように命令する、非一時的なコンピュータ読取可能記憶媒体。 - 実行可能プログラムがその上に記憶された非一時的なコンピュータ読取可能記憶媒体であって、データ信号を分析し、モデル化するため前記プログラムが、プロセッサに対し、
前記データ信号を収集するステップと、
データフレームを生成するために前記データ信号を前処理するステップであって、前記前処理するステップが、前記データ信号をサンプリングすること、前記データ信号を変換すること、前記データ信号を平滑化すること、ならびに、前記データ信号を、前記分析において別個の入力フレームとして処理すべき1つまたは複数の成分に分解することが可能である、前処理するステップと、
複数のモデル化法の中から選択するステップであって、前記選択するステップが、入力信号のプロパティおよび前記モデル化された出力のプロパティを選択的に評価し、前記評価の結果に基づいて、前記モデル化法を指示することが可能である、選択するステップと、
前記データフレームの一部または全部の特徴を、参照バッファから引き出される波形の固定長ブロックの組合せとして選択的にモデル化するステップと、
前記データフレームの残りの特徴を選択的にモデル化するステップと、
最適モデルを選択するために、複数の推定候補モデルの品質を評価するステップと、
計算されたモデルパラメータを処理するステップであって、前記処理するステップが、前記データ信号を記憶するための手段、送信するための手段、分析するための手段、また分類するための手段を提供する、処理するステップと
を含む方法を実行するように命令する、非一時的なコンピュータ読取可能記憶媒体。 - 前記現在のデータフレームを参照することなく、前記最適モデルのパラメータから復元された波形、
前記最適モデルのパラメータのサブセットから復元された前記波形、
すべての利用可能なデータを使用して前記最適モデルから推定された出力、および
モデル化されている前記データフレーム
のうちの少なくとも1つを記憶し、それらを将来の計算のために利用可能にするステップをさらに含む、請求項8に記載の方法。 - 前記データフレーム全体が、1つの方法のみを使用してモデル化される、請求項8に記載の方法。
- モデル品質の前記評価が、1つまたは複数の指標を使用し、前記指標が、参照するすべての前記利用可能なデータポイントを使用して計算されたモデル出力、ならびに前記入力フレームについて復元された値を使用して合成されたモデル出力うちの1つまたは複数の関数であり、前記合成が、評価される前記モデルの実際のパラメータまたは近似パラメータを使用する、請求項8に記載の方法。
- 前記モデルパラメータを変換する、および/または量子化するステップをさらに含む、請求項8に記載の方法。
- 記信号が、オーディオ信号を含む、請求項11に記載の方法。
- 前記データ信号が、2D画像から抽出されたシーケンスを含む、請求項11に記載の方法。
- 実行可能プログラムがその上に記憶された非一時的なコンピュータ読取可能記憶媒体であって、モデルパラメータからデータフレームを復号するための前記プログラムが、プロセッサに対し、
前記データフレームを符号化するために使用されるパラメータを含むコードを収集するステップと、
任意の参照波形を合成するためのパラメータを前記コードが含んでいるかどうかを判断し、前記参照波形を合成し、それを参照バッファに入れるステップと、
前記コードから、前記データフレームを符号化する際に使用された特定の方法およびモデルを識別するステップと、
前記コードを生成するために使用されるモデル化ステップを反転させることによって、前記受信したコードからデータフレームを合成するステップと、
を含む方法を実行するように命令する、非一時的なコンピュータ読取可能記憶媒体。 - 処理デバイスによって実行されたとき、請求項1に記載の方法を実行するように構成された命令のセットを含む非一時的なコンピュータ読取可能記憶媒体を備えるコンピュータ実装システム。
- 処理デバイスによって実行されたとき、請求項7に記載の方法を実行するように構成された命令のセットを含む非一時的なコンピュータ読取可能記憶媒体を備えるコンピュータ実装システム。
- 処理デバイスによって実行されたとき、請求項8に記載の方法を実行するように構成された命令のセットを含む非一時的なコンピュータ読取可能記憶媒体を備えるコンピュータ実装システム。
- 処理デバイスによって実行されたとき、請求項15に記載の方法を実行するように構成された命令のセットを含む非一時的なコンピュータ読取可能記憶媒体を備えるコンピュータ実装システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/915,989 US8620660B2 (en) | 2010-10-29 | 2010-10-29 | Very low bit rate signal coder and decoder |
US12/915,989 | 2010-10-29 | ||
PCT/US2011/058479 WO2012058650A2 (en) | 2010-10-29 | 2011-10-28 | Low bit rate signal coder and decoder |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014502366A true JP2014502366A (ja) | 2014-01-30 |
JP2014502366A5 JP2014502366A5 (ja) | 2015-05-07 |
JP5815723B2 JP5815723B2 (ja) | 2015-11-17 |
Family
ID=45994838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013536900A Expired - Fee Related JP5815723B2 (ja) | 2010-10-29 | 2011-10-28 | 低ビットレート信号コーダおよびデコーダ |
Country Status (11)
Country | Link |
---|---|
US (3) | US8620660B2 (ja) |
EP (1) | EP2633625A4 (ja) |
JP (1) | JP5815723B2 (ja) |
KR (1) | KR101505341B1 (ja) |
CN (1) | CN103348597B (ja) |
AU (1) | AU2011320141B2 (ja) |
BR (1) | BR112013010518A2 (ja) |
IL (1) | IL226045A (ja) |
MX (1) | MX337311B (ja) |
RU (1) | RU2565995C2 (ja) |
WO (1) | WO2012058650A2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8620660B2 (en) * | 2010-10-29 | 2013-12-31 | The United States Of America, As Represented By The Secretary Of The Navy | Very low bit rate signal coder and decoder |
EP2731377A4 (en) * | 2012-03-02 | 2014-09-10 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR IDENTIFYING AND OBTAINING AMBE CODING PERFORMANCE AND DECODING INFORMATION IN SDP |
FR3023646A1 (fr) * | 2014-07-11 | 2016-01-15 | Orange | Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame |
US9456075B2 (en) * | 2014-10-13 | 2016-09-27 | Avaya Inc. | Codec sequence detection |
CN107113357B (zh) * | 2014-12-23 | 2021-05-28 | 杜比实验室特许公司 | 与语音质量估计相关的改进方法和设备 |
US10542961B2 (en) | 2015-06-15 | 2020-01-28 | The Research Foundation For The State University Of New York | System and method for infrasonic cardiac monitoring |
RU2610285C1 (ru) * | 2016-02-15 | 2017-02-08 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Способ распознавания протоколов низкоскоростного кодирования |
RU2667462C1 (ru) * | 2017-10-24 | 2018-09-19 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Способ распознавания протоколов низкоскоростного кодирования речи |
CN110768680B (zh) * | 2019-11-04 | 2024-03-29 | 重庆邮电大学 | 一种scl剪枝技术联合球型列表译码的方法及装置 |
CN116110409B (zh) * | 2023-04-10 | 2023-06-20 | 南京信息工程大学 | 一种ASIP架构的大容量并行Codec2声码器系统及编解码方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002062899A (ja) * | 2000-08-23 | 2002-02-28 | Sony Corp | データ処理装置およびデータ処理方法、学習装置および学習方法、並びに記録媒体 |
WO2007132750A1 (ja) * | 2006-05-12 | 2007-11-22 | Panasonic Corporation | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1179803B (it) * | 1984-10-30 | 1987-09-16 | Cselt Centro Studi Lab Telecom | Metodo e dispositivo per la correzione di errori causati da rumore di tipo impulsivo su segnali vocali codificati con bassa velocita di ci fra e trasmessi su canali di comunicazione radio |
JP3343965B2 (ja) | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
US5701390A (en) | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
US5717819A (en) * | 1995-04-28 | 1998-02-10 | Motorola, Inc. | Methods and apparatus for encoding/decoding speech signals at low bit rates |
US6014622A (en) | 1996-09-26 | 2000-01-11 | Rockwell Semiconductor Systems, Inc. | Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
JP2001507822A (ja) | 1997-09-30 | 2001-06-12 | シーメンス・アクチエンゲゼルシャフト | スピーチ信号のエンコード方法 |
DE60001904T2 (de) * | 1999-06-18 | 2004-05-19 | Koninklijke Philips Electronics N.V. | Audio-übertragungssystem mit verbesserter kodiereinrichtung |
WO2001041451A1 (en) * | 1999-11-29 | 2001-06-07 | Sony Corporation | Video/audio signal processing method and video/audio signal processing apparatus |
SE517156C2 (sv) * | 1999-12-28 | 2002-04-23 | Global Ip Sound Ab | System för överföring av ljud över paketförmedlade nät |
DE60113034T2 (de) * | 2000-06-20 | 2006-06-14 | Koninkl Philips Electronics Nv | Sinusoidale kodierung |
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
JP3876781B2 (ja) * | 2002-07-16 | 2007-02-07 | ソニー株式会社 | 受信装置および受信方法、記録媒体、並びにプログラム |
CN1846253B (zh) * | 2003-09-05 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 低比特率音频编码 |
US7337108B2 (en) * | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
RU2260032C1 (ru) * | 2004-04-13 | 2005-09-10 | Глущенко Виктор Николаевич | Способ разрушения водонефтяной ловушечной эмульсии |
CA2596341C (en) * | 2005-01-31 | 2013-12-03 | Sonorit Aps | Method for concatenating frames in communication system |
DE602006016017D1 (de) * | 2006-01-09 | 2010-09-16 | Nokia Corp | Steuerung der dekodierung binauraler audiosignale |
JP5749462B2 (ja) * | 2010-08-13 | 2015-07-15 | 株式会社Nttドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
US8620660B2 (en) * | 2010-10-29 | 2013-12-31 | The United States Of America, As Represented By The Secretary Of The Navy | Very low bit rate signal coder and decoder |
US9275644B2 (en) * | 2012-01-20 | 2016-03-01 | Qualcomm Incorporated | Devices for redundant frame coding and decoding |
-
2010
- 2010-10-29 US US12/915,989 patent/US8620660B2/en not_active Expired - Fee Related
-
2011
- 2011-10-28 EP EP11837236.6A patent/EP2633625A4/en not_active Withdrawn
- 2011-10-28 US US13/882,195 patent/US10084475B2/en active Active
- 2011-10-28 AU AU2011320141A patent/AU2011320141B2/en not_active Ceased
- 2011-10-28 KR KR1020137013787A patent/KR101505341B1/ko active IP Right Grant
- 2011-10-28 JP JP2013536900A patent/JP5815723B2/ja not_active Expired - Fee Related
- 2011-10-28 MX MX2013004802A patent/MX337311B/es active IP Right Grant
- 2011-10-28 BR BR112013010518A patent/BR112013010518A2/pt not_active IP Right Cessation
- 2011-10-28 WO PCT/US2011/058479 patent/WO2012058650A2/en active Application Filing
- 2011-10-28 RU RU2013124363/08A patent/RU2565995C2/ru not_active IP Right Cessation
- 2011-10-28 CN CN201180063393.5A patent/CN103348597B/zh not_active Expired - Fee Related
-
2013
- 2013-04-29 IL IL226045A patent/IL226045A/en active IP Right Grant
-
2018
- 2018-07-24 US US16/044,329 patent/US10686465B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002062899A (ja) * | 2000-08-23 | 2002-02-28 | Sony Corp | データ処理装置およびデータ処理方法、学習装置および学習方法、並びに記録媒体 |
WO2007132750A1 (ja) * | 2006-05-12 | 2007-11-22 | Panasonic Corporation | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 |
Also Published As
Publication number | Publication date |
---|---|
US20120109653A1 (en) | 2012-05-03 |
US10686465B2 (en) | 2020-06-16 |
BR112013010518A2 (pt) | 2016-08-02 |
KR101505341B1 (ko) | 2015-03-23 |
KR20130086234A (ko) | 2013-07-31 |
CN103348597A (zh) | 2013-10-09 |
WO2012058650A3 (en) | 2012-09-27 |
EP2633625A2 (en) | 2013-09-04 |
IL226045A (en) | 2016-05-31 |
JP5815723B2 (ja) | 2015-11-17 |
MX2013004802A (es) | 2014-05-09 |
US20180358981A1 (en) | 2018-12-13 |
AU2011320141B2 (en) | 2015-06-04 |
AU2011320141A1 (en) | 2013-06-27 |
IL226045A0 (en) | 2013-06-27 |
RU2013124363A (ru) | 2014-12-10 |
CN103348597B (zh) | 2017-01-18 |
EP2633625A4 (en) | 2014-05-07 |
MX337311B (es) | 2016-02-25 |
WO2012058650A2 (en) | 2012-05-03 |
US20130214943A1 (en) | 2013-08-22 |
US10084475B2 (en) | 2018-09-25 |
US8620660B2 (en) | 2013-12-31 |
RU2565995C2 (ru) | 2015-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5815723B2 (ja) | 低ビットレート信号コーダおよびデコーダ | |
ES2433043T3 (es) | Conmutación del modo de codificación ACELP a TCX | |
JP5719941B2 (ja) | オーディオ信号の効率的なエンコーディング/デコーディング | |
KR102626320B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
JP2011518345A (ja) | スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング | |
CN104969290A (zh) | 用于对音频帧丢失隐藏进行控制的方法和设备 | |
KR102593442B1 (ko) | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 | |
JP2017156767A (ja) | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 | |
CN105074820A (zh) | 用于确定内插因数组的系统和方法 | |
Vali et al. | End-to-end optimized multi-stage vector quantization of spectral envelopes for speech and audio coding | |
EP0950238B1 (en) | Speech coding and decoding system | |
Giacobello | Sparsity in linear predictive coding of speech | |
Kassim et al. | Compressive sensing based low bit rate speech encoder | |
RU2823081C1 (ru) | Способы и система для кодирования на основе формы сигналов аудиосигналов с помощью порождающей модели | |
Ramadass et al. | Textless NLP--Zero Resource Challenge with Low Resource Compute | |
JP2023175767A (ja) | 1つ以上の畳み込みネットワークおよび/またはリカレントネットワークを使用したエンドツーエンドの敵対的ブラインド帯域幅拡張のための装置および方法 | |
EP4046155A1 (en) | Methods and system for waveform coding of audio signals with a generative model | |
Lupini | Harmonic coding of speech at low bit rates | |
Merazka et al. | Robust split vector quantization of LSP parameters at low bit rates | |
Purnhagen | Very low bit rate parametric audio coding | |
Gibson et al. | Source models and rate distortion bounds for speech | |
Raol et al. | EFFICIENT VECTOR QUANTIZATION OF LSF PARAMETERS | |
Mikhael et al. | A new linear predictor employing vector quantization in nonorthogonal domains for high quality speech coding | |
Merazka | Codebook Design Using Simulated Annealing Algorithm for Vector Quantization of Line Spectrum Pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141028 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150226 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20150226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150306 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20150323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150924 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5815723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |