JP5149198B2 - 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス - Google Patents
音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス Download PDFInfo
- Publication number
- JP5149198B2 JP5149198B2 JP2008547818A JP2008547818A JP5149198B2 JP 5149198 B2 JP5149198 B2 JP 5149198B2 JP 2008547818 A JP2008547818 A JP 2008547818A JP 2008547818 A JP2008547818 A JP 2008547818A JP 5149198 B2 JP5149198 B2 JP 5149198B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- erasure
- sound signal
- pulse
- concealment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 98
- 230000005236 sound signal Effects 0.000 claims description 137
- 230000005284 excitation Effects 0.000 claims description 125
- 238000011084 recovery Methods 0.000 claims description 59
- 230000004044 response Effects 0.000 claims description 44
- 230000007704 transition Effects 0.000 claims description 36
- 230000003044 adaptive effect Effects 0.000 claims description 28
- 230000005540 biological transmission Effects 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 25
- 230000000737 periodic effect Effects 0.000 claims description 25
- 230000001174 ascending effect Effects 0.000 claims description 5
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 239000010410 layer Substances 0.000 description 56
- 238000003786 synthesis reaction Methods 0.000 description 29
- 230000015572 biosynthetic process Effects 0.000 description 28
- 239000013598 vector Substances 0.000 description 26
- 238000013139 quantization Methods 0.000 description 24
- 230000003595 spectral effect Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 14
- 230000007774 longterm Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000000670 limiting effect Effects 0.000 description 10
- 239000002131 composite material Substances 0.000 description 9
- 239000012792 core layer Substances 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005279 excitation period Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
サンプリングされた音声信号は、図2の符号化デバイス200によってブロックごとの基礎で符号化され、符号化デバイス200は、201から211までの番号を付けられた11個のモジュールに分解される。
W(z) = A(z/y1)/A(z/y2)、ただし、0 < y2 < y1 ≦ 1
e = ‖x - by‖2
を最小にする利得bを見つけることからなる。
によって与えられる。
x' = x - byT
ここで、bは、ピッチ利得であり、yTは、フィルタリングされたピッチコードブックベクトル(インパルス応答hを用いて畳み込まれた遅延Tでの過去の励起)である。
E = ‖x' - gHck‖2
を最小にする利得gとを見つけるために革新コードブック内で実行され、ここで、Hは、インパルス応答ベクトルhから導出された下三角畳み込み行列である。見つかった最適のコードベクトルckおよび利得gに対応する革新コードブックのインデックスkが、通信チャネルを介する伝送のためにマルチプレクサ213に供給される。
図3の音声デコーダ300は、ディジタル入力322 (デマルチプレクサ317への入力ビットストリーム)と出力のサンプリングされた音声信号soutとの間で実行されるさまざまなステップを示す。
-フレームあたり1回作られる、短期予測(STP)パラメータとも呼ばれる、量子化され補間されたLP係数
-長期予測(LTP)パラメータTおよびb (サブフレームごとの)、および
-革新的コードブックインデックスkおよび利得g (サブフレームごとの)。
u = gck + bvT
として計算される。
G.729コーデックは、上で説明した代数CELP (ACELP)コーディングパラダイムに基づく。8kビット/sでのG.729コーデックのビット割振りを、表1に示す。
フレームの消去は、特に無線環境およびパケット交換網で動作する時に、ディジタル音声通信システムの合成された音声の品質に大きい影響を有する。無線セルラシステムでは、受信信号のエネルギが、頻繁な激しいフェードを示し、高いビットエラーレートを示す可能性があり、これは、セル境界でより明白になる。この場合に、チャネルデコーダは、受信フレーム内のエラーを訂正することができず、その結果、通常はチャネルデコーダの後で使用されるエラー検出器は、そのフレームを消去されたものと宣言する。Voice over Internet Protocol (VoIP)などのvoice over packetネットワークアプリケーションでは、音声信号がパケット化され、ここで、通常は、1つの20msフレームが各パケットに配置される。パケット交換通信では、パケット脱落は、パケット数が非常に多くなる場合にルータで発生する可能性があり、あるいは、パケットは、長い遅延の後に受信器に達する可能性があり、遅延が受信器側でのジッタバッファの長さより長い場合には失われたものとして宣言されなければならない。これらのシステムでは、コーデックは、通常、3から5%のフレーム消去レートにさらされる。
消去フレームの存在下での信号再構成に音声の分類を使用することの背後にある基本的な発想は、理想的な隠蔽戦略が、擬似静止音声セグメントとすばやく変化する特性を有する音声セグメントとで異なるという事実からなる。非静止音声セグメント内の消去フレームの最良の処理は、音声符号化パラメータの環境雑音特性へのすばやい収束として要約することができるが、擬似静止信号の場合に、音声符号化パラメータは、劇的には変化せず、減衰される前に、複数の隣接する消去フレーム中に事実上変化しないままに保つことができる。また、フレームの消去されたブロックに続く信号回復の最適な方法は、音声信号の分類に伴って変化する。
ビットストリームに、分類情報を含めるのに使用可能な帯域幅がある場合には、分類をエンコーダで行うことができる。これは、複数の利益を有する。1つは、しばしば、音声エンコーダにルックアヘッドがあることである。このルックアヘッドは、後続フレームでの信号の進展を推定することを可能にし、その結果、分類を、将来の信号挙動を考慮に入れることによって行うことができる。一般に、ルックアヘッドが長ければ長いほど、分類をよりよいものにすることができる。さらなる利益は、複雑さの低下である。というのは、フレーム消去隠蔽に必要な信号処理のほとんどが、いずれにせよ音声符号化に必要であるからである。最後に、合成された信号ではなくオリジナルの信号を扱うという利益もある。
・UNVOICED(無声音)クラスは、すべての無声音音声フレームおよびアクティブ音声を含まないすべてのフレームを含む。有声音オフセットフレームは、その終りが無声音になる傾向があり、無声音フレーム用に設計された隠蔽を、そのフレームが失われた場合に次のフレームのために使用できる場合に、UNVOICEDとして分類することもできる。
・UNVOICED TRANSITION(無声音遷移)クラスは、その終りに可能な有声音開始を有する無声音フレームを含む。しかし、開始は、それでも、有声音フレーム用に設計された隠蔽を使用するのには短すぎるか、それに十分に良く作られてはいない。UNVOICED TRANSITIONクラスは、UNVOICEDまたはUNVOICED TRANSITIONとして分類されるフレームに続くことだけができる。
・VOICED TRANSITION(有声音遷移)クラスは、比較的弱い有声音特性を有する有声音フレームを含む。これらは、通常、すばやく変化する特性(母音の間の遷移)またはフレーム全体に続く有声音オフセットを有する有声音フレームである。VOICED TRANSITIONクラスは、VOICED TRANSITION、VOICED、またはONSETとして分類されるフレームに続くことだけができる。
・VOICED(有声音)クラスは、安定した特性を有する有声音フレームを含む。このクラスは、VOICED TRANSITION、VOICED、またはONSETとして分類されるフレームに続くことだけができる。
・ONSET(開始)クラスは、UNVOICEDまたはUNVOICED TRANSITIONとして分類されるフレームに続く、安定した特性を有するすべての有声音フレームを含む。ONSETとして分類されるフレームは、その開始が、失われた有声音フレーム用に設計された隠蔽の使用について既に十分に良く作られている有声音開始フレームに対応する。ONSETクラスに続くフレーム消去に使用される隠蔽技法は、VOICEDクラスに続く場合と同一である。相違は、回復戦略にある。あるONSETクラスフレームが失われる(すなわち、VOICEDのよいフレームが消去の後に到着するが、消去の前の最後のよいフレームがUNVOICEDであった)場合には、特殊な技法を使用して、失われた開始を人工的に再構成することができる。このシナリオを、図6に見ることができる。人工的開始再構成技法は、後続の説明でより詳細に説明する。その一方で、ONSETのよいフレームが消去の後に到着し、消去の前の最後のよいフレームがUNVOICEDであった場合には、この特殊な処理は不要である。というのは、開始が、失われていない(失われたフレームに含まれない)からである。
et = -0.5(k1 (1) + k1 (2)) (3)
であり、ここで、k1 (j)は、半フレームjでのLP分析からの最初の反射係数である。
pc = |p3 - p2| + |p2 - p1| (5)
値p1、p2、およびp3は、最後の3つのサブフレームからの閉ループピッチラグに対応する。
Es = Ef - Elt (6)
ここで、フレームエネルギEfは、dB単位のウィンドウイングされた入力信号のエネルギ
Elt = 0.99Elt + 0.01Ef (8)
最後のパラメータは、ゼロ交差計算モジュール702によって音声信号の1フレームで計算されるゼロ交差パラメータzcである。この例示的実施形態では、ゼロ交差カウンタzcは、信号の符号がそのインターバル中に正から負に変化する回数をカウントする。
ps = kp ・ px + cp (9)
を使用して入手され、0と1との間でクリッピングされる(相対エネルギを除く。相対エネルギは、0.5と1との間でクリッピングされる)。関数係数kpおよびcpが、パラメータのそれぞれについて経験的に見つけられており、その結果、FERの存在下で使用される隠蔽技法および回復技法に起因する信号ひずみが、最小になる。この例示的実施態様で使用される値を、表2に要約する。
Evar = 0.05(Es - Eprev) + 0.95Evar
として更新され、ここで、Eprevは、前のフレームからのEsの値である。
If (|Es - Eprev| < (|Evar| + 6)) AND (classold = UNVOICED) fE = 0.8
Else
If ((Es - Eprev) > (Evar + 3)) AND (classold = UNVOICED or TRANSITION) fE = 1.1
Else
If ((Es - Eprev) < (Evar - 5)) AND (classold = VOICED or ONSET) fE = 0.6.
ここで、classoldは、前のフレームのクラスである。
アプリケーションが、クラス情報の伝送を許容しない(余分のビットを輸送できない)場合に、それでも、分類をデコーダで実行することができる。この例示的実施形態では、分類ビットは、層2で伝送され、したがって、分類は、コア層1だけが受信される場合にもデコーダで実行される。
pc = |p3 + p2 - p1 - p0| (13)
値p0、p1、p2、およびp3は、4つのサブフレームからの閉ループピッチラグに対応する。
Elt = 0.99Elt + 0.01Ef (16)
最後のパラメータは、合成信号の1フレームで計算されるゼロ交差パラメータzcである。この例示的実施形態では、ゼロ交差カウンタzcは、信号の符号がそのインターバル中に正から負に変化する回数をカウントする。
ps = kp ・ px + cp (17)
を使用して入手される。スケーリングされたピッチコヒーレンスパラメータは、0と1との間でクリッピングされ、スケーリングされた正規化された相関パラメータは、正である場合に2倍にされる。関数係数kpおよびcpが、パラメータのそれぞれについて経験的に見つけられており、その結果、FERの存在下で使用される隠蔽技法および回復技法に起因する信号ひずみが、最小になる。この例示的実施態様で使用される値を、表4に要約する。
FERが発生する時の迷惑なアーティファクトを避けるために注意深く制御される少数のパラメータがある。少数の余分なビットを伝送できる場合に、これらのパラメータを、エンコーダで推定し、量子化し、伝送することができる。そうでない場合に、これらの一部を、デコーダで推定することができる。これらのパラメータには、信号分類、エネルギ情報、位相情報、および発声情報を含めることができる。
エネルギ情報は、LP残差領域または音声信号領域のいずれかで推定し、送信することができる。残差領域での情報の送信は、LP合成フィルタの影響を考慮に入れていないという不利益を有する。これは、複数の失われた有声音フレームの後の有声音回復の場合(FERが有声音音声セグメント中に発生する時)に、特に注意を要する。FERが有声音フレームの後に到着する時には、最後のよいフレームの励起が、通常、ある減衰戦略と共に隠蔽中に使用される。新しいLP合成フィルタが、消去の後の最初のよいフレームと共に到着する時には、励起エネルギとLP合成フィルタの利得との間に不一致がある可能性がある。新しい合成フィルタは、そのエネルギが最後に合成された消去フレームのエネルギともオリジナルの信号エネルギとも非常に異なる合成信号を作る可能性がある。この理由から、エネルギは、信号領域で計算され、量子化される。
位相制御は、前のセクションで説明したものに類似する理由で、有声音音声の失われたセグメントの後の回復の間に使用される。消去フレームのブロックの後に、デコーダメモリは、エンコーダメモリと非同期化された状態になる。デコーダを再同期化するために、いくつかの位相情報を伝送することができる。非限定的な例として、前のフレーム内の最後の声門パルスの位置および符号を、位相情報として送信することができる。この位相情報は、その後、後で説明するように、失われた有声音開始の後の回復に使用される。また、後で開示するように、この情報は、正しく受信された連続するフレームでの収束を改善する(伝搬されるエラーを減らす)ために、消去フレームの励起信号を再同期化するのにも使用される。
rLP(n) = 0.25r(n - 1) + 0.5r(n) + 0.25r(n + 1) (22)
によって与えられる。声門パルス検索および量子化モジュール707は、最大の絶対振幅を有するサンプルを探すことによって、フレーム内の低域フィルタリングされた残差のT0個の最後のサンプルの中で最後の声門パルスの位置τを検索する(τは、フレームの終りに対する相対的な位置である)。
この例示的実施形態のFER隠蔽技法は、ACELPタイプのコーデックで説明される。しかし、これらの技法は、励起信号をLP合成フィルタを介してフィルタリングすることによって合成信号が生成される任意の音声コーデックに簡単に適用することができる。隠蔽戦略は、信号エネルギおよびスペクトルエンベロープの、背景雑音の推定されたパラメータへの収束として要約することができる。信号の周期数は、0に収束される。収束の速度は、最後のよい受信されたフレームクラスのパラメータと、連続する消去フレームの個数とに依存し、減衰係数αによって制御される。係数αは、さらに、UNVOICEDフレームに関するLPフィルタの安定性に依存する。一般に、収束は、最後のよい受信されたフレームが安定したセグメント内にある場合には遅く、そのフレームが遷移セグメント内にある場合には速い。αの値を、表6に要約する。
- classnewがVOICEDであり、classoldがONSETである場合には、classlostにVOICEDをセットする。
- classnewがVOICEDであり、最後のよいフレームの前のフレームのクラスがONSETまたはVOICEDである場合には、classlostにVOICEDをセットする。
- classnewがUNVOICEDであり、classoldがVOICEDである場合には、classlostにUNVOICED TRANSITIONをセットする。
- classnewがVOICEDまたはONSETであり、classoldがUNVOICEDである場合には、classlostにSIN ONSET (開始再構成)をセットする。
そのクラスにUNVOICEDまたはUNVOICED TRANSITIONがセットされている消去フレームの隠蔽について、励起信号の周期的部分は、生成されない。他のクラスについて、励起信号の周期的部分は、次の形で構成される。
if ((T3 < 1.8 Ts) AND (T3 > 0.6Ts)) OR (Tcnt ≧ 30), then Tc = T3, else Tc = Ts
ここで、T3は、最後のよい受信されたフレームの第4サブフレームの丸められたピッチ周期であり、Tsは、コヒーレントピッチ推定値を有する最後のよい安定した有声音フレームの第4サブフレームの丸められた予測されたピッチ周期である。安定した有声音フレームは、ここでは、有声音タイプ(VOICED TRANSITION、VOICED、ONSET)が先行するVOICEDフレームと定義される。ピッチのコヒーレンスは、この実施態様では、閉ループピッチ推定値が適度に近いかどうか、すなわち、前のフレームの最後のサブフレームピッチと2番目のサブフレームピッチと最後のサブフレームピッチとの間の比が区間(0.7, 1.4)内にあるかどうかを検査することによって検証される。代替案では、複数の失われたフレームがある場合に、T3は、最後の隠蔽されるフレームの第4サブフレームの丸められた推定されたピッチ周期である。
u(n) = 0.18u(n - Tc - 1) + 0.64u(n - Tc) + 0.18u(n - Tc + 1), n = 0, …, Tc - 1
u(n) = u(n - Tc), n = Tc, …, L + N - 1 (26)
ここで、u(n)は、励起信号であり、Lは、フレームサイズであり、Nは、サブフレームサイズである。最初の消去フレームではない場合には、隠蔽される励起は、単純に、
u(n) = u(n - Tc), n = 0, …, L + N - 1 (27)
として作成される。隠蔽される励起が、下で示すように、再同期化において助けるために余分のサブフレームについても計算されることに留意されたい。
Plast = L - P0
によって与えられる。次に、復号された符号情報に類似する符号を有するフレームの始めからの隠蔽される励起の最大パルスの位置を、低域フィルタリングされた励起に基づいて判定する(図9の動作912)。すなわち、復号された最大パルス位置が正である場合に、フレームの始めからの隠蔽される励起の最大の正パルスが判定され、そうでない場合には、負の最大パルスが判定される。隠蔽される励起の最初の最大パルスをT(0)と表すものとする。他の最大パルスの位置は、
T(i) = T(0) + iTc, i = 1, …, Np - 1 (28)
によって与えられ(図9の動作914)、ここで、Npは、パルスの個数である(将来のフレーム内の最初のパルスを含む)。
Te = Plast - T(k)、ただし、kは、Plastに最も近いパルスのインデックスである
によって与えられる。Te = 0の場合には、再同期化は不要である(図9の動作918)。Teの値が正である(T(k) < Plast)場合には、Te個のサンプルを挿入する必要がある(図10の動作1002)。Teの値が負である(T(k) > Plast)場合には、Te個のサンプルを除去する必要がある(図10の動作1002)。さらに、再同期化は、Te < NかつTe < Np × Tdiffの場合に限って実行され、ここで、Nは、サブフレームサイズであり、Tdiffは、Tcと将来のフレームの最初のサブフレームのピッチラグとの間の絶対差である(図9の動作918)。
f = 2 × 11 / 16 = 1.375
R(0) = round(f / 2) = 1
R(1) = round(2f - 1) = 2
R(2) = round(4.5f - 1 - 2) = 3
R(3) = round(8f - 1 - 2 - 3) = 5
u(Tmin(3) + i) = -u(Tmin(3) + i - R(3))/20, i = 0, …, 4 (30)
上で開示した手順を使用すると、隠蔽される励起の最後の最大パルスは、将来のフレームで伝送されるフレームの終りの実際の最大パルス位置に強制的に位置合せされる(図9の動作920および図10の動作1010)。
Plast = L + P0 - Tnew
によって与えられ、ここで、Tnewは、新しいフレームの最初のピッチサイクルであり、P0は、現在のフレームの最初の最大声門パルスの復号された位置である。
励起信号の革新(非周期的)部分は、ランダムに生成される。この部分は、ランダム雑音として、またはランダムに生成されるベクトルインデックスを有するCELP革新コードブックを使用することによって、生成することができる。この例示的実施形態では、ほぼ一様分布を有する単純なランダムジェネレータが使用された。革新利得を調整する前に、ランダムに生成された革新が、ここでは、サンプルあたり単一エネルギに固定される、ある基準値に対してスケーリングされる。
gs = 0.1g(0) + 0.2g(1) + 0.3g(2) + 0.4g(3) (31)
ここで、g(0)、g(1)、g(2)、およびg(3)は、最後に正しく受信されたフレームの4つのサブフレームの固定コードブック利得または革新利得である。励起のランダム部分の減衰戦略は、ピッチ励起の減衰とは多少異なる。その理由は、ピッチ励起(したがって、励起周期数)が、0に収束しつつあるが、ランダム励起が、コンフォートノイズ生成(comfort noise generation、CNG)励起エネルギに収束しつつあるからである。革新利得減衰は、
復号された音声を合成するために、LPフィルタパラメータを入手しなければならない。
I1(j) = αI0(j) + (1 - α)In(j), j = 0, …, p - 1 (33)
式(33)では、I1(j)は、現在のフレームのj番目のLSFの値であり、I0(j)は、前のフレームのj番目のLSFの値であり、In(j)は、推定されたコンフォートノイズエンベロープのj番目のLSFの値であり、pは、LPフィルタの次数である(LSFが周波数領域にあることに留意されたい)。代替案では、消去フレームのLSFパラメータを、最後のフレームからのパラメータと等しくなるように単純にセットすることができる(I1(j) = I0(j))。
LSP(1) = 0.4LSF(0) + 0.6 LSP(2) (34)
ここで、LSP(1)は、消去フレームの推定されたLSPであり、LSP(0)は、過去のフレームのLSPであり、LSP(2)は、将来のフレームのLSPである。
LSP(1,i) = ((5 - i)LSP(0) + (i + 1)LSF(2))/6, i = 0, …, 3 (35)
として見つけることができ、ここで、iはサブフレームインデックスである。LSPは、コサイン領域(-1から1まで)にある。
フレームの消去されたブロックの後の回復の問題は、基本的に、事実上すべての現代の音声エンコーダで使用される強い予測に起因する。具体的に言うと、CELPタイプの音声コーダは、現在のフレームの励起を符号化するのに過去の励起信号を使用している(長期予測またはピッチ予測)という事実に起因して、有声音音声に関する高い信号対雑音比を達成する。また、ほとんどの量子化器(LP量子化器、利得量子化器など)は、予測を利用する。
CELPエンコーダでの長期予測の使用に関係する最も複雑な状況は、有声音開始が失われる時である。失われた開始は、有声音音声開始が、消去されたブロック中のどこかで発生したことを意味する。この場合に、最後のよい受信されたフレームは、無声音であり、したがって、周期的励起は、励起バッファ内で見つからない。しかし、消去されたブロックの後の最初のよいフレームは、有声音であり、エンコーダの励起バッファは、非常に周期的であり、適応励起は、この周期的な過去の励起を使用して符号化されている。励起のこの周期的部分は、デコーダでは完全に失われているので、この消失から回復するには、数フレームを要する可能性がある。
フレームの消去されたブロックの後の回復での1つの作業が、合成音声信号のエネルギを正しく制御することである。合成エネルギ制御が必要なのは、現代の音声コーダで通常使用される強い予測のゆえである。エネルギ制御は、消去フレームのブロックが有声音セグメント中に発生する時にも実行される。フレーム消去が有声音フレームの後に到着する時には、最後のよいフレームの励起は、通常、ある減衰戦略と共に隠蔽中に使用される。新しいLPフィルタが、消去の後の最初のよいフレームと共に到着する時には、励起エネルギと新しいLP合成フィルタの利得との間に不一致がある可能性がある。新しい合成フィルタは、最後に合成された消去フレームのエネルギともオリジナルの信号エネルギとも非常に異なるエネルギを有する合成信号を作る可能性がある。
us(i) = gAGC(i) ・ u(i), i = 0, …, L - 1 (37)
ここで、us(i)は、スケーリングされた励起であり、u(i)は、スケーリングの前の励起であり、Lは、フレーム長であり、gAGC(i)は、g0から始まり、g1に指数関数的に収束する利得であり、
gAGC(i) = fAGCgAGC(i - 1) + (1 - fAGC)g1 i = 0, …, L - 1 (38)
であり、gAGC(-1) = g0の初期化を伴い、ここで、fAGCは、この実施形態では0.98の値をセットされる減衰係数である。この値は、一方では前の(消去された)フレームからの滑らかな遷移を有することと、他方ではできる限り現在のフレームの最後のピッチ周期を正しい(伝送された)値にスケーリングすることとの妥協として経験的に見つけられたものである。これが行われるのは、伝送されたエネルギ値が、フレームの終りにピッチ同期式に推定されるからである。利得g0およびg1は、
上で述べたように、上で開示した本発明の例示的実施形態は、ITU-Tによる組込み可変ビットレートコーデックの標準化の候補アルゴリズムにも使用されている。この候補アルゴリズムでは、コア層は、AMR-WB (ITU-T勧告G.722.2)に類似する広帯域コーディング技法に基づく。コア層は、8kビット/sで動作し、12.8kHzの内部サンプリング周波数を用いて6400Hzまでの帯域幅を符号化する(AMR-WBに類似する)。第2の4kビット/s CELP層が使用され、ビットレートを12kビット/sまで高める。次に、MDCTを使用して、16kビット/sから32kビット/sまでの上位層を得る。
101 通信チャネル
102 マイクロホン
103 アナログ音声信号
104 アナログディジタル(A/D)変換器
105 ディジタル音声信号
106 音声エンコーダ
107 信号符号化パラメータ
108 チャネルエンコーダ
109 チャネルデコーダ
110 音声デコーダ
111 受信されたビットストリーム
112 ビットストリーム
113 ディジタル合成された音声信号
114 アナログ形式
115 ディジタルアナログ(D/A)変換器
116 ラウドスピーカユニット
200 符号化デバイス
201 前処理モジュール
204 LP分析、量子化、および補間モジュール
205 知覚加重フィルタ
206 開ループピッチ検索モジュール
207 閉ループピッチ検索モジュール
208 ゼロ入力応答カリキュレータ
209 インパルス応答ジェネレータ
210 革新的励起検索モジュール
211 メモリ更新モジュール
212 入力音声信号
213 マルチプレクサ
300 音声デコーダ
301 ピッチコードブック
303 メモリ
306 LP合成フィルタ
307 ポストプロセッサ
317 デマルチプレクサ
318 革新コードブック
320 加算器
322 ディジタル入力
324 増幅器
325 信号線
326 増幅器
401 オリジナルの広帯域信号x
402 モジュール
403 ロウ帯域のxLF
404 ハイ帯域のxHF
405 変更された版のG.729エンコーダ
406 加算器
407 モジュール
408 モジュール
409 モジュール
410 モジュール
500 組込みデコーダ
501 ビットストリーム
502 モジュール
503 変更されたG.729デコーダ
504 逆量子化器
505 逆変換モジュール
506 パラメトリックデコーダ
507 コンバイナ
508 コンバイナ
509 合成QMFフィルタバンク
600 組込みエンコーダ
602 閉ループピッチおよび革新コードブック検索モジュール
702 ゼロ交差計算モジュール
703 追加されたモジュール
704 SNR計算モジュール
705 信号分類モジュール
706 エネルギ推定および量子化モジュール
707 声門パルス検索および量子化モジュール
802 UNVOICED
804 UNVOICED TRANSITION
806 VOICED TRANSITION
808 VOICED
810 ONSET
900 隠蔽手順
1000 同期化手順
Claims (72)
- エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復する方法であって、前記デコーダ内で、
位相情報を少なくとも含む隠蔽/回復パラメータを前記エンコーダから受信するステップを含み、前記位相情報は、前記符号化されたサウンド信号のフレームに関係し、前記位相情報は、前記符号化されたサウンド信号の各フレーム内の声門パルスの位置を含み、
前記受信された隠蔽/回復パラメータに応答してフレーム消去隠蔽を行うステップを含み、前記フレーム消去隠蔽は、前記受信された位相情報に応答して、前記消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化することを含み、
前記消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化することは、
前記消去-隠蔽されるフレーム内において、最大振幅パルスの位置を判定することと、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスの位置を前記符号化されたサウンド信号の前記対応するフレームの声門パルスの位置に位置合せすることとを含む、方法。 - 前記エンコーダ内で前記隠蔽/回復パラメータを判定するステップと、
前記エンコーダ内で判定され、かつ前記デコーダによって受信される前記隠蔽/回復パラメータを前記デコーダに伝送するステップとを含む、請求項1に記載の方法。 - 前記位相情報は、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を含む、請求項1に記載の方法。
- 前記声門パルスの前記位置を前記デコーダに伝送する前に、前記声門パルスの前記位置を量子化するステップをさらに含む、請求項2に記載の方法。
- 前記隠蔽/回復パラメータを判定するステップは、前記位相情報として、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を判定するステップを含み、前記方法は、前記最後の声門パルスの前記位置および符号を前記デコーダに伝送する前に、前記最後の声門パルスの前記位置および符号を量子化するステップをさらに含む、請求項2に記載の方法。
- 前記符号化されたサウンド信号の将来のフレームに、前記声門パルスの前記量子化された位置を符号化するステップをさらに含む、請求項4に記載の方法。
- 前記符号化されたサウンド信号の各フレームの所定のピッチサイクル内の最大振幅のパルスを測定するとともに、
前記符号化されたサウンド信号のフレーム内における最大振幅の前記パルスの位置を判定することによって、
前記声門パルスの前記位置を判定するステップ
を含む、請求項2に記載の方法。 - 前記符号化されたサウンド信号のフレーム内の前記最大振幅パルスの符号を測定することによって、前記声門パルスの符号を位相情報として判定するステップをさらに含む、請求項7に記載の方法。
- 前記隠蔽/回復パラメータを判定するステップは、前記位相情報として、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を判定するステップを含み、
前記最後の声門パルスの前記位置を判定するステップは、
前記符号化されたサウンド信号の各フレーム内の最大振幅のパルスを測定するステップと、
前記符号化されたサウンド信号のフレーム内における最大振幅の前記パルスの位置を判定するステップと
を含む、請求項2に記載の方法。 - 前記最後の声門パルスの前記符号を判定するステップは、
前記符号化されたサウンド信号のフレーム内の前記最大振幅パルスの符号を測定するステップ
を含む、請求項9に記載の方法。 - 前記消去-隠蔽されるフレーム内の最大振幅パルスは、前記符号化されたサウンド信号の前記対応するフレームの前記声門パルスの前記符号に類似する符号を有する、請求項1に記載の方法。
- 前記消去-隠蔽されるフレーム内の最大振幅パルスの位置は、前記符号化されたサウンド信号の前記対応するフレームの前記声門パルスの前記位置に最も近い最大振幅パルスの位置である、請求項1に記載の方法。
- 前記消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置を、前記符号化されたサウンド信号の前記対応するフレーム内の前記声門パルスの前記位置に位置合せするステップは、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置と前記符号化されたサウンド信号の前記対応するフレーム内の前記声門パルスの前記位置との間のオフセットを判定するステップと、
前記消去-隠蔽されるフレーム内で、前記判定されたオフセットに対応する複数のサンプルを挿入/除去するステップと
を含む、請求項1に記載の方法。 - 前記複数のサンプルを挿入/除去するステップは、
前記消去-隠蔽されるフレーム内の最小エネルギの少なくとも1つの領域を判定するステップと、
挿入/除去される前記複数のサンプルを、最小エネルギの前記少なくとも1つの領域の前後で分配するステップと
を含む、請求項13に記載の方法。 - 挿入/除去される前記複数のサンプルを、最小エネルギの前記少なくとも1つの領域の前後で分配するステップは、関係
を使用して最小エネルギの前記少なくとも1つの領域の前後で前記複数のサンプルを分配するステップを含み、ここで、
- R(i)は、挿入/削除されるサンプルの大部分が前記消去-隠蔽されるフレームの終りに向かって追加/除去されるようにするために、昇順である、請求項15に記載の方法。
- 前記受信された隠蔽/回復パラメータに応答してフレーム消去隠蔽を行うステップは、有声音消去フレームについて、
前記受信された隠蔽/回復パラメータに応答して、前記消去-隠蔽されるフレーム内の励起信号の周期的部分を構成するステップと、
非周期的革新的信号をランダムに生成することによって、前記励起信号のランダム革新的部分を構成するステップと
を含む、請求項1に記載の方法。 - 前記受信された隠蔽/回復パラメータに応答してフレーム消去隠蔽を行うステップは、無声音消去フレームについて、非周期的革新的信号をランダムに生成することによって、励起信号のランダム革新的部分を構成するステップを含む、請求項1に記載の方法。
- 前記隠蔽/回復パラメータは、さらに、信号分類を含む、請求項1に記載の方法。
- 前記信号分類は、前記符号化されたサウンド信号の連続するフレームを、無声音、無声音遷移、有声音遷移、有声音、または有声音音声の開始として分類するステップを含む、請求項19に記載の方法。
- 失われたフレームの前記分類は、将来のフレームおよび最後の受信されたよいフレームの前記分類に基づいて推定される、請求項20に記載の方法。
- 前記失われたフレームの前記分類には、前記将来のフレームが有声音であり、前記最後の受信されたよいフレームが有声音音声の開始である場合に、有声音がセットされる、請求項21に記載の方法。
- 前記失われたフレームの前記分類には、前記将来のフレームが無声音であり、前記最後の受信されたよいフレームが有声音である場合に、無声音遷移がセットされる、請求項22に記載の方法。
- 前記サウンド信号は、音声信号であり、
前記エンコーダ内で隠蔽/回復パラメータを判定するステップは、前記符号化されたサウンド信号の連続するフレームの前記位相情報および信号分類を判定するステップを含み、
前記隠蔽/回復パラメータに応答してフレーム消去隠蔽を行うステップは、
フレーム消去に続く有声音フレームおよびフレーム消去の前の無声音フレームの存在によって示される、有声音音声の開始フレームが失われる時に、前記失われた有声音音声の開始フレームを再構成するステップと、
前記消去-隠蔽される失われた有声音音声の開始フレームを、前記位相情報に応答して、前記符号化されたサウンド信号の前記対応する有声音音声の開始フレームに再同期化するステップと
を含む
請求項1に記載の方法。 - 前記失われた有声音音声の開始フレームを再構成するステップは、前記失われた有声音音声の開始フレーム内の最後の声門パルスを、低域フィルタリングされたパルスとして再構成するステップを含む、請求項24に記載の方法。
- 前記再構成された失われた有声音音声の開始フレームを利得によってスケーリングするステップをさらに含む、請求項24に記載の方法。
- 前記位相情報が消去フレームの隠蔽の時に使用可能ではない時に、次の受信された非消去フレームを復号する前に使用可能な時に前記位相情報を用いて前記デコーダの適応コードブックの内容を更新するステップを含む、請求項1に記載の方法。
- 前記適応コードブックを更新するステップは、前記適応コードブック内の前記声門パルスを再同期化するステップを含む
請求項27に記載の方法。 - エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復する方法であって、前記デコーダ内で、
前記エンコーダから前記デコーダへの伝送中に消去された前記符号化されたサウンド信号の各フレームの位相情報を推定するステップと、
前記推定された位相情報に応答してフレーム消去隠蔽を行うステップとを含み、前記フレーム消去隠蔽は、前記推定された位相情報に応答して、各消去-隠蔽されるフレームを前記符号化されたサウンド信号の前記対応するフレームに再同期化することを含み、
前記推定された位相情報は、消去された前記符号化されたサウンド信号の各フレームの声門パルスの推定された位置であり、
前記消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化することは、前記消去-隠蔽されるフレーム内の最大振幅パルスを判定することと、前記消去-隠蔽されるフレーム内の前記最大振幅パルスを前記声門パルスの推定された位置に位置合せすることとを含む、方法。 - 前記位相情報を推定するステップは、消去された前記符号化されたサウンド信号の各フレームの最後の声門パルスの位置を推定するステップを含む、請求項29に記載の方法。
- 消去された前記符号化されたサウンド信号の各フレームの前記最後の声門パルスの前記位置を推定するステップは、
過去のピッチ値から声門パルスを推定するステップと、
推定されたピッチラグを判定するために前記過去のピッチ値を用いて前記推定された声門パルスを補間するステップと
を含む、請求項30に記載の方法。 - 前記消去-隠蔽されるフレーム内の前記最大振幅パルスを前記推定された声門パルスに位置合せするステップは、
前記消去-隠蔽されるフレーム内のピッチサイクルを計算するステップと、
前記推定されたピッチラグと前記消去-隠蔽されるフレーム内の前記ピッチサイクルとの間のオフセットを判定するステップと、
前記消去-隠蔽されるフレーム内で、前記判定されたオフセットに対応する複数のサンプルを挿入/除去するステップと
を含む、請求項31に記載の方法。 - 前記複数のサンプルを挿入/除去するステップは、
前記消去-隠蔽されるフレーム内の最小エネルギの少なくとも1つの領域を判定するステップと、
挿入/除去される前記複数のサンプルを最小エネルギの前記少なくとも1つの領域の前後で分配するステップと
を含む、請求項32に記載の方法。 - 挿入/除去される前記複数のサンプルを最小エネルギの前記少なくとも1つの領域の前後で分配するステップは、関係
を使用して最小エネルギの前記少なくとも1つの領域の前後で前記複数のサンプルを分配するステップを含み、ここで、
- R(i)は、挿入/削除されるサンプルの大部分が前記消去-隠蔽されるフレームの終りに向かって追加/除去されるようにするために、昇順である、請求項34に記載の方法。
- 各消去-隠蔽されるフレームの利得を、線形の形で、前記消去-隠蔽されるフレームの始めから終りへ減衰させるステップを含む、請求項29に記載の方法。
- 各消去-隠蔽されるフレームの利得は、αに達するまで減衰され、αは、フレーム消去の後の前記デコーダ回復の収束速度を制御する係数である、請求項36に記載の方法。
- 前記係数αは、無声音フレームに関するLPフィルタの安定性に依存する、請求項37に記載の方法。
- 前記係数αは、有声音セグメントのエネルギ進展をさらに考慮に入れる、請求項38に記載の方法。
- エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復するデバイスであって、前記デコーダ内で、
位相情報を少なくとも含む隠蔽/回復パラメータを受信する手段とを含み、前記位相情報は、前記符号化されたサウンド信号のフレームに関係し、前記位相情報は、前記符号化されたサウンド信号の各フレーム内の声門パルスの位置を含み、
前記デバイスは、
前記受信された隠蔽/回復パラメータに応答してフレーム消去隠蔽を行う手段を含み、
前記フレーム消去隠蔽を行う手段は、前記受信された位相情報に応答して、前記消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化する手段を含み、
前記消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化する手段は、
前記消去-隠蔽されるフレーム内において、最大振幅パルスの位置を判定する手段と、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスの位置を前記符号化されたサウンド信号の前記対応するフレームの声門パルスの位置に位置合せする手段とを含む、デバイス。 - エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復するデバイスであって、前記デコーダ内で、
位相情報を少なくとも含む隠蔽/回復パラメータのレシーバを含み、前記位相情報は、前記符号化されたサウンド信号のフレームに関係し、前記位相情報は、前記符号化されたサウンド信号の各フレーム内の声門パルスの位置を含み、
前記デバイスは、
前記受信された隠蔽/回復パラメータを供給されるフレーム消去隠蔽モジュールを含み、
前記フレーム消去隠蔽モジュールは、前記受信された位相情報に応答する、前記消去-隠蔽されるフレームと前記符号化されたサウンド信号の対応するフレームとのシンクロナイザを含み、
前記シンクロナイザは、消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに同期化するために、前記消去-隠蔽されるフレーム内において、最大振幅パルスの位置を判定するとともに、前記消去-隠蔽されるフレーム内の前記最大振幅パルスの位置を前記符号化されたサウンド信号の前記対応するフレームの声門パルスの位置に位置合せする、デバイス。 - 前記エンコーダ内に、前記隠蔽/回復パラメータのジェネレータと、
前記エンコーダ内で判定された前記隠蔽/回復パラメータを前記デコーダに伝送する通信リンクとを含む、請求項41に記載のデバイス。 - 前記位相情報は、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を含む、請求項41に記載のデバイス。
- 前記通信リンクを介して前記声門パルスの前記位置を前記デコーダに伝送する前における、前記声門パルスの前記位置の量子化器をさらに含む、請求項42に記載のデバイス。
- 前記隠蔽/回復パラメータのジェネレータは、前記位相情報として、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を判定し、前記デバイスは、前記通信リンクを介して前記最後の声門パルスの前記位置および符号を前記デコーダに伝送する前における、前記最後の声門パルスの前記位置および符号の量子化器をさらに含む、請求項42に記載のデバイス。
- 前記符号化されたサウンド信号の将来のフレームへの前記声門パルスの前記量子化された位置のエンコーダをさらに含む、請求項44に記載のデバイス。
- 前記ジェネレータは、前記声門パルスの前記位置として、前記符号化されたサウンド信号の各フレーム内の最大振幅パルスの位置を判定する、請求項42に記載のデバイス。
- 前記隠蔽/回復パラメータのジェネレータは、前記位相情報として、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を判定し、前記ジェネレータは、前記最後の声門パルスの前記位置および符号として、前記符号化されたサウンド信号の各フレーム内の最大振幅パルスの位置および符号を判定する、請求項42に記載のデバイス。
- 前記ジェネレータは、位相情報として、前記符号化されたサウンド信号のフレーム内の前記最大振幅パルスの符号としての前記声門パルスの符号を判定する、請求項47に記載のデバイス。
- 前記シンクロナイザは、
各消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置と前記符号化されたサウンド信号の前記対応するフレーム内の前記声門パルスの前記位置との間のオフセットを判定し、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置を前記符号化されたサウンド信号の前記対応するフレーム内の前記声門パルスの前記位置に位置合せするために、各消去-隠蔽されるフレーム内で前記判定されたオフセットに対応する複数のサンプルを挿入/除去する
請求項41に記載のデバイス。 - 前記シンクロナイザは、
各消去-隠蔽されるフレーム内で、前記最後の声門パルスの前記符号に類似する符号を有し、前記符号化されたサウンド信号の対応するフレーム内の前記最後の声門パルスの前記位置に最も近い、最大振幅パルスの位置を判定し、
各消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置と前記符号化されたサウンド信号の前記対応するフレーム内の前記最後の声門パルスの前記位置との間のオフセットを判定し、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスの前記位置を前記符号化されたサウンド信号の前記対応するフレーム内の前記最後の声門パルスの前記位置に位置合せするために、各消去-隠蔽されるフレーム内で前記判定されたオフセットに対応する複数のサンプルを挿入/除去する
請求項43に記載のデバイス。 - 前記シンクロナイザは、さらに、
スライディングウィンドウを使用することによって、各消去-隠蔽されるフレーム内の最小エネルギの少なくとも1つの領域を判定し、
挿入/除去される前記複数のサンプルを、最小エネルギの前記少なくとも1つの領域の前後で分配する
請求項50に記載のデバイス。 - 前記シンクロナイザは、挿入/除去される前記複数のサンプルを最小エネルギの前記少なくとも1つの領域の前後で分配するのに関係
を使用し、ここで、
- R(i)は、挿入/削除されるサンプルの大部分が前記消去-隠蔽されるフレームの終りに向かって追加/除去されるようにするために、昇順である、請求項53に記載のデバイス。
- 前記受信された隠蔽/回復パラメータを供給される前記フレーム消去隠蔽モジュールは、有声音消去フレームについて、
前記受信された隠蔽/回復パラメータに応答する、各消去-隠蔽されるフレーム内の励起信号の周期的部分のジェネレータと、
前記励起信号の非周期的革新的部分のランダムジェネレータと
を含む、請求項41に記載のデバイス。 - 前記受信された隠蔽/回復パラメータを供給される前記フレーム消去隠蔽モジュールは、無声音消去フレームについて、励起信号の非周期的革新的部分のランダムジェネレータを含む、請求項41に記載のデバイス。
- 前記デコーダは、前記位相情報が消去フレームの隠蔽の時に使用可能ではない時に、次の受信された非消去フレームを復号する前に使用可能な時に前記位相情報を用いて前記デコーダの適応コードブックの内容を更新する、請求項41に記載のデバイス。
- 前記デコーダは、前記適応コードブックを更新するために、前記適応コードブック内の前記声門パルスを再同期化する
請求項57に記載のデバイス。 - 前記シンクロナイザは、各消去-隠蔽されるフレーム内において、前記符号化されたサウンド信号の前記対応するフレームの前記声門パルスの前記位置に最も近く、前記声門パルスの前記符号に類似する符号を有する最大振幅パルスの位置を判定する、請求項41に記載のデバイス。
- エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復するデバイスであって、
前記デコーダで、前記エンコーダから前記デコーダへの伝送中に消去された前記符号化されたサウンド信号の各フレームの位相情報を推定する手段と、
前記推定された位相情報に応答してフレーム消去隠蔽を行う手段であって、フレーム消去隠蔽を行う前記手段は、各消去-隠蔽されるフレームを前記符号化されたサウンド信号の前記対応するフレームに再同期化する手段を含み、
前記推定された位相情報は、消去された前記符号化されたサウンド信号の各フレームの声門パルスの推定された位置であり、
各消去-隠蔽されるフレームを前記符号化されたサウンド信号の対応するフレームに再同期化する手段は、前記消去-隠蔽されるフレーム内の最大振幅パルスを判定する手段と、前記消去-隠蔽されるフレーム内の前記最大振幅パルスを前記声門パルスの推定された位置に位置合せする手段とを含む、デバイス。 - エンコーダからデコーダへの伝送中に消去された符号化されたサウンド信号のフレームによって引き起こされるフレーム消去を隠蔽し、フレーム消去の後に前記デコーダを回復するデバイスであって、
前記デコーダにある、前記エンコーダから前記デコーダへの伝送中に消去された前記符号化された信号の各フレームの位相情報のエスティメータと、
前記推定された位相情報を供給される消去隠蔽モジュールとを含み、前記消去隠蔽モジュールは、前記推定された位相情報に応答して、各消去-隠蔽されるフレームを前記符号化されたサウンド信号の前記対応するフレームに再同期化するシンクロナイザを含み、
前記推定された位相情報は、消去された前記符号化されたサウンド信号の各フレームの声門パルスの推定された位置であり、
前記シクロナイザは、前記消去-隠蔽されるフレーム内の最大振幅パルスを判定するとともに、前記消去-隠蔽されるフレーム内の前記最大振幅パルスを前記声門パルスの推定された位置に位置合せする、デバイス。 - 前記位相情報の前記エスティメータは、過去のピッチ値から、前記符号化されたサウンド信号の各フレーム内の最後の声門パルスの位置および符号を推定し、推定されたピッチラグを判定するために前記過去のピッチ値を用いて前記推定された声門パルスを補間する、請求項61に記載のデバイス。
- 前記シンクロナイザは、
各消去-隠蔽されるフレーム内の最大振幅パルスおよびピッチサイクルを判定し、
各消去-隠蔽されるフレーム内の前記ピッチサイクルと前記符号化されたサウンド信号の前記対応するフレーム内の前記推定されたピッチラグとの間のオフセットを判定し、
前記消去-隠蔽されるフレーム内の前記最大振幅パルスを前記推定された最後の声門パルスに位置合せするために、各消去-隠蔽されるフレーム内で前記判定されたオフセットに対応する複数のサンプルを挿入/除去する
請求項62に記載のデバイス。 - 前記シンクロナイザは、さらに、
スライディングウィンドウを使用することによって、最小エネルギの少なくとも1つの領域を判定し、
前記複数のサンプルを、最小エネルギの前記少なくとも1つの領域の前後で分配する
請求項63に記載のデバイス。 - 前記シンクロナイザは、最小エネルギの前記少なくとも1つの領域の前後で前記複数のサンプルを分配するのに関係
を使用し、ここで、
- R(i)は、挿入/削除されるサンプルの大部分が前記消去-隠蔽されるフレームの終りに向かって追加/除去されるようにするために、昇順である、請求項65に記載のデバイス。
- 各消去-隠蔽されるフレームの利得を、線形の形で、前記消去-隠蔽されるフレームの始めから終りへ減衰させる減衰器を含む、請求項62に記載のデバイス。
- 前記減衰器は、各消去-隠蔽されるフレームの利得をαまで減衰させ、αは、フレーム消去の後の前記デコーダ回復の収束速度を制御する係数である、請求項67に記載のデバイス。
- 前記係数αは、無声音フレームに関するLPフィルタの安定性に依存する、請求項68に記載のデバイス。
- 前記係数αは、有声音セグメントのエネルギ進展をさらに考慮に入れる、請求項69に記載のデバイス。
- 前記エスティメータは、消去された前記符号化されたサウンド信号の各フレームの最後の声門パルスの推定された位置を推定する、請求項61に記載のデバイス。
- 前記消去-隠蔽されるフレーム内の最大振幅パルスの位置は、前記符号化されたサウンド信号の前記対応するフレームの前記声門パルスの前記位置に最も近い最大振幅パルスの位置である、請求項41に記載のデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US75418705P | 2005-12-28 | 2005-12-28 | |
US60/754,187 | 2005-12-28 | ||
PCT/CA2006/002146 WO2007073604A1 (en) | 2005-12-28 | 2006-12-28 | Method and device for efficient frame erasure concealment in speech codecs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009522588A JP2009522588A (ja) | 2009-06-11 |
JP5149198B2 true JP5149198B2 (ja) | 2013-02-20 |
Family
ID=38217654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008547818A Active JP5149198B2 (ja) | 2005-12-28 | 2006-12-28 | 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス |
Country Status (16)
Country | Link |
---|---|
US (1) | US8255207B2 (ja) |
EP (1) | EP1979895B1 (ja) |
JP (1) | JP5149198B2 (ja) |
KR (1) | KR20080080235A (ja) |
CN (1) | CN101379551A (ja) |
AU (1) | AU2006331305A1 (ja) |
BR (1) | BRPI0620838A2 (ja) |
CA (1) | CA2628510C (ja) |
DK (1) | DK1979895T3 (ja) |
ES (1) | ES2434947T3 (ja) |
NO (1) | NO20083167L (ja) |
PL (1) | PL1979895T3 (ja) |
PT (1) | PT1979895E (ja) |
RU (1) | RU2419891C2 (ja) |
WO (1) | WO2007073604A1 (ja) |
ZA (1) | ZA200805054B (ja) |
Families Citing this family (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8370138B2 (en) * | 2006-03-17 | 2013-02-05 | Panasonic Corporation | Scalable encoding device and scalable encoding method including quality improvement of a decoded signal |
US9159333B2 (en) * | 2006-06-21 | 2015-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
EP2080194B1 (fr) * | 2006-10-20 | 2011-12-07 | France Telecom | Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information |
KR101292771B1 (ko) * | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
SG179433A1 (en) * | 2007-03-02 | 2012-04-27 | Panasonic Corp | Encoding device and encoding method |
JP5489711B2 (ja) * | 2007-03-02 | 2014-05-14 | パナソニック株式会社 | 音声符号化装置及び音声復号装置 |
WO2008151408A1 (en) * | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
CN101325537B (zh) * | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
US8386246B2 (en) * | 2007-06-27 | 2013-02-26 | Broadcom Corporation | Low-complexity frame erasure concealment |
US8185388B2 (en) * | 2007-07-30 | 2012-05-22 | Huawei Technologies Co., Ltd. | Apparatus for improving packet loss, frame erasure, or jitter concealment |
JP2009063928A (ja) * | 2007-09-07 | 2009-03-26 | Fujitsu Ltd | 補間方法、情報処理装置 |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
KR101228165B1 (ko) * | 2008-06-13 | 2013-01-30 | 노키아 코포레이션 | 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체 |
WO2010000303A1 (en) * | 2008-06-30 | 2010-01-07 | Nokia Corporation | Speech decoder with error concealment |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
CA2681988C (en) * | 2008-10-08 | 2016-01-12 | Research In Motion Limited | Method and system for supplemental channel request messages in a wireless network |
US8706479B2 (en) * | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
CN101958119B (zh) * | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US9269366B2 (en) * | 2009-08-03 | 2016-02-23 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
US9058818B2 (en) * | 2009-10-22 | 2015-06-16 | Broadcom Corporation | User attribute derivation and update for network/peer assisted speech coding |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
WO2012044066A1 (ko) * | 2010-09-28 | 2012-04-05 | 한국전자통신연구원 | 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치 |
KR20120032444A (ko) | 2010-09-28 | 2012-04-05 | 한국전자통신연구원 | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 |
WO2012044067A1 (ko) * | 2010-09-28 | 2012-04-05 | 한국전자통신연구원 | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
US9026813B2 (en) | 2010-11-22 | 2015-05-05 | Qualcomm Incorporated | Establishing a power charging association on a powerline network |
US9767822B2 (en) * | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
SG192745A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
MX2013009304A (es) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
CA2827335C (en) | 2011-02-14 | 2016-08-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
TWI488177B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 使用頻譜域雜訊整形之基於線性預測的編碼方案 |
ES2639646T3 (es) | 2011-02-14 | 2017-10-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio |
SG192721A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
SG185519A1 (en) | 2011-02-14 | 2012-12-28 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
US9021278B2 (en) * | 2011-08-10 | 2015-04-28 | Qualcomm Incorporated | Network association of communication devices based on attenuation information |
JP6265903B2 (ja) * | 2011-10-19 | 2018-01-24 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 信号雑音減衰 |
EP2774145B1 (en) | 2011-11-03 | 2020-06-17 | VoiceAge EVS LLC | Improving non-speech content for low rate celp decoder |
EP2784777A4 (en) * | 2011-11-22 | 2015-07-01 | Pioneer Corp | AUDIO SIGNAL CORRECTION DEVICE AND AUDIO SIGNAL CORRECTION METHOD |
US8909539B2 (en) * | 2011-12-07 | 2014-12-09 | Gwangju Institute Of Science And Technology | Method and device for extending bandwidth of speech signal |
PT2795613T (pt) * | 2011-12-21 | 2018-01-16 | Huawei Tech Co Ltd | Deteção e codificação de diferencial de altura de som muito curto |
US9047863B2 (en) * | 2012-01-12 | 2015-06-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for criticality threshold control |
US9985855B2 (en) * | 2012-06-28 | 2018-05-29 | Dolby Laboratories Licensing Corporation | Call quality estimation by lost packet classification |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
CN103888630A (zh) * | 2012-12-20 | 2014-06-25 | 杜比实验室特许公司 | 用于控制声学回声消除的方法和音频处理装置 |
PL3098811T3 (pl) * | 2013-02-13 | 2019-04-30 | Ericsson Telefon Ab L M | Ukrywanie błędu ramki |
US9842598B2 (en) | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
EP2965315B1 (en) | 2013-03-04 | 2019-04-24 | Voiceage Evs Llc | Device and method for reducing quantization noise in a time-domain decoder |
US9437203B2 (en) * | 2013-03-07 | 2016-09-06 | QoSound, Inc. | Error concealment for speech decoder |
FR3004876A1 (fr) * | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
EP3007374B1 (en) | 2013-06-05 | 2018-08-08 | LG Electronics Inc. | Method and apparatus for transmitting channel state information in wireless communication system |
KR101788484B1 (ko) | 2013-06-21 | 2017-10-19 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | Tcx ltp를 이용하여 붕괴되거나 붕괴되지 않은 수신된 프레임들의 재구성을 갖는 오디오 디코딩 |
CN105453173B (zh) | 2013-06-21 | 2019-08-06 | 弗朗霍夫应用科学研究促进协会 | 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
SG11201510463WA (en) * | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation |
MY169132A (en) * | 2013-06-21 | 2019-02-18 | Fraunhofer Ges Forschung | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
CN104301064B (zh) * | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
JP6306177B2 (ja) * | 2013-10-31 | 2018-04-04 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間ドメイン励振信号を修正するエラーコンシールメントを用いて、復号化されたオーディオ情報を提供する、オーディオデコーダおよび復号化されたオーディオ情報を提供する方法 |
PT3285255T (pt) | 2013-10-31 | 2019-08-02 | Fraunhofer Ges Forschung | Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo |
US9437211B1 (en) * | 2013-11-18 | 2016-09-06 | QoSound, Inc. | Adaptive delay for enhanced speech processing |
CN104751849B (zh) * | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
CN107369453B (zh) | 2014-03-21 | 2021-04-20 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
JP6170575B2 (ja) * | 2014-07-28 | 2017-07-26 | テレフオンアクチーボラゲット エルエム エリクソン(パブル) | ピラミッドベクトル量子化器形状サーチ |
TWI602172B (zh) * | 2014-08-27 | 2017-10-11 | 弗勞恩霍夫爾協會 | 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法 |
EP3230980B1 (en) | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
DE102016101023A1 (de) * | 2015-01-22 | 2016-07-28 | Sennheiser Electronic Gmbh & Co. Kg | Digitales Drahtlos-Audioübertragungssystem |
EP3057097B1 (en) * | 2015-02-11 | 2017-09-27 | Nxp B.V. | Time zero convergence single microphone noise reduction |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
JP6797187B2 (ja) | 2015-08-25 | 2020-12-09 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ・デコーダおよびデコード方法 |
US9894687B2 (en) | 2015-11-20 | 2018-02-13 | Hughes Network Systems, Llc | Methods and apparatuses for providing random access communication |
WO2017129665A1 (en) * | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
WO2017129270A1 (en) | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
KR102332153B1 (ko) | 2017-05-18 | 2021-11-26 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 네트워크 디바이스 관리 |
CN109496333A (zh) * | 2017-06-26 | 2019-03-19 | 华为技术有限公司 | 一种丢帧补偿方法及设备 |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
CN111064547A (zh) * | 2019-12-30 | 2020-04-24 | 华南理工大学 | 一种基于自适应频率选择的抗干扰隐蔽信道通信方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4539684A (en) * | 1983-01-07 | 1985-09-03 | Motorola, Inc. | Automatic frame synchronization recovery utilizing a sequential decoder |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5701392A (en) | 1990-02-23 | 1997-12-23 | Universite De Sherbrooke | Depth-first algebraic-codebook search for fast coding of speech |
US5754976A (en) | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
WO1995028046A1 (en) * | 1994-04-08 | 1995-10-19 | Echelon Corporation | Method and apparatus for robust communications based upon angular modulation |
US5732389A (en) | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
US6680987B1 (en) * | 1999-08-10 | 2004-01-20 | Hughes Electronics Corporation | Fading communications channel estimation and compensation |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
US20030103582A1 (en) * | 2001-12-04 | 2003-06-05 | Linsky Stuart T. | Selective reed-solomon error correction decoders in digital communication systems |
JP3946087B2 (ja) * | 2002-05-23 | 2007-07-18 | 三菱電機株式会社 | 通信システム、受信機および通信方法 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7215705B2 (en) * | 2003-03-17 | 2007-05-08 | Intel Corporation | Reducing phase noise in phase-encoded communications signals |
-
2006
- 2006-12-27 US US12/095,224 patent/US8255207B2/en active Active
- 2006-12-28 ES ES06840572T patent/ES2434947T3/es active Active
- 2006-12-28 PL PL06840572T patent/PL1979895T3/pl unknown
- 2006-12-28 KR KR1020087018581A patent/KR20080080235A/ko not_active Application Discontinuation
- 2006-12-28 RU RU2008130674/09A patent/RU2419891C2/ru active
- 2006-12-28 EP EP06840572.9A patent/EP1979895B1/en active Active
- 2006-12-28 JP JP2008547818A patent/JP5149198B2/ja active Active
- 2006-12-28 PT PT68405729T patent/PT1979895E/pt unknown
- 2006-12-28 BR BRPI0620838-0A patent/BRPI0620838A2/pt not_active IP Right Cessation
- 2006-12-28 WO PCT/CA2006/002146 patent/WO2007073604A1/en active Search and Examination
- 2006-12-28 AU AU2006331305A patent/AU2006331305A1/en not_active Abandoned
- 2006-12-28 CA CA2628510A patent/CA2628510C/en active Active
- 2006-12-28 CN CNA200680050130XA patent/CN101379551A/zh active Pending
- 2006-12-28 DK DK06840572.9T patent/DK1979895T3/da active
-
2008
- 2008-06-10 ZA ZA200805054A patent/ZA200805054B/xx unknown
- 2008-07-16 NO NO20083167A patent/NO20083167L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
WO2007073604A8 (en) | 2007-12-21 |
JP2009522588A (ja) | 2009-06-11 |
EP1979895A1 (en) | 2008-10-15 |
RU2419891C2 (ru) | 2011-05-27 |
AU2006331305A1 (en) | 2007-07-05 |
PL1979895T3 (pl) | 2014-01-31 |
CN101379551A (zh) | 2009-03-04 |
BRPI0620838A2 (pt) | 2011-11-29 |
RU2008130674A (ru) | 2010-02-10 |
ES2434947T3 (es) | 2013-12-18 |
US8255207B2 (en) | 2012-08-28 |
EP1979895A4 (en) | 2009-11-11 |
KR20080080235A (ko) | 2008-09-02 |
NO20083167L (no) | 2008-09-26 |
CA2628510C (en) | 2015-02-24 |
ZA200805054B (en) | 2009-03-25 |
PT1979895E (pt) | 2013-11-19 |
CA2628510A1 (en) | 2007-07-05 |
WO2007073604A1 (en) | 2007-07-05 |
EP1979895B1 (en) | 2013-10-09 |
DK1979895T3 (da) | 2013-11-18 |
US20110125505A1 (en) | 2011-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5149198B2 (ja) | 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス | |
KR101032119B1 (ko) | 선형 예측 기반 음성 코덱에서 효율적인 프레임 소거 은폐방법 및 장치 | |
KR101295729B1 (ko) | 비트 레이트규모 가변적 및 대역폭규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법 | |
JP5173939B2 (ja) | Cdma無線システム用可変ビットレート広帯域音声符号化時における効率のよい帯域内ディム・アンド・バースト(dim−and−burst)シグナリングとハーフレートマックス処理のための方法および装置 | |
EP2202726B1 (en) | Method and apparatus for judging dtx | |
Chibani | Increasing the robustness of CELP speech codecs against packet losses. | |
Lefebvre et al. | Speech coders | |
Ogunfunmi et al. | Scalable and Multi-Rate Speech Coding for Voice-over-Internet Protocol (VoIP) Networks | |
MX2008008477A (es) | Metodo y dispositivo para ocultamiento eficiente de borrado de cuadros en codec de voz | |
Unver | Advanced Low Bit-Rate Speech Coding Below 2.4 Kbps |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090902 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120406 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5149198 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |