JP5618826B2 - Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 - Google Patents
Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 Download PDFInfo
- Publication number
- JP5618826B2 JP5618826B2 JP2010511454A JP2010511454A JP5618826B2 JP 5618826 B2 JP5618826 B2 JP 5618826B2 JP 2010511454 A JP2010511454 A JP 2010511454A JP 2010511454 A JP2010511454 A JP 2010511454A JP 5618826 B2 JP5618826 B2 JP 5618826B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- compensation signal
- erasure compensation
- erasure
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000007704 transition Effects 0.000 claims description 28
- 239000002131 composite material Substances 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 12
- 238000012952 Resampling Methods 0.000 claims description 8
- 230000001360 synchronised effect Effects 0.000 claims description 7
- 239000004606 Fillers/Extenders Substances 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 claims description 4
- 230000000875 corresponding effect Effects 0.000 claims 8
- 238000011084 recovery Methods 0.000 claims 7
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000006837 decompression Effects 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 22
- 230000000670 limiting effect Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 238000005311 autocorrelation function Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012886 linear function Methods 0.000 description 5
- 230000001427 coherent effect Effects 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Storage Device Security (AREA)
Description
−ピッチおよびエネルギー追跡、信号分類、ならびにエネルギー減衰に基づくパケット損失補償アルゴリズムと、
−デコーダにおいて、一連の損失フレーム後の音声信号の遷移を平滑化するために適用される信号再同期方法と
を使用し得る。
本発明の非制限的で例示的な実施形態は、多層埋め込みG.711相互運用可能なコーデックでの消失フレームの補償に関する。このコーデックには、伝送中に失われたパケットのためのフレーム消失補償(FEC)メカニズムが備えられている。FECはデコーダにおいて実施され、フレーム単位で動作し、1フレーム先読みを利用する。
デコーダ内の新しいあらゆる合成フレームを使用して、ピッチ解析が実行され、FECに使用される開ループ(OL)ピッチが推定される。OLピッチ解析は、狭帯域信号に対して実行される。非制限的な例として、このOLピッチ解析は、300サンプル窓を使用する。OLピッチアルゴリズムは、ピッチラグの4つの間隔、すなわち[13,20]、[21,39]、[40,76]、および[77,144]内で行われる相関解析に基づく(8000Hzサンプリングレートで)。各間隔内の合算長は、
セクション[13,20]の場合、Lsec=50
セクション[21,39]の場合、Lsec=50
セクション[40,76]の場合、Lsec=78
セクション[77,144]の場合、Lsec=144 (1)
により与えられる。
適切なFEC戦略を選ぶために、デコーダにおいて、信号の分類が過去の合成信号に対して実行される。この目的は、単一のフレームを以下の5つのクラスのうちの1つに分類することである。
クラス0:UNVOICED
クラス1:UNVOICED TRANSITION
クラス2:VOICED TRANSITION
クラス3:VOICED
クラス4:ONSET
pS=k.p+c (9)
を使用して得られ、式中、定数kおよびcは、表1に従って変化する。ピッチコヒーレンスパラメータをスケーリングしたものは、<0;1>により制限される。
If(last_clasがONSET、VOICED、またはVOICED TRANSITIONであった)
If(fm<0.39)clas=UNVOICED
If(0.39≦fm<0.63)clas=VOICED TRANSITION
If(0.63≦fm)clas=VOICED
Else
If(fm≦0.45)clas=UNVOICED
If(0.45<fm≦0.56)clas=UNVOICED TRANSITION
If(0.56<fm)clas=ONSET
End
を使用して実行される。
パケット損失により現在のフレームを合成できない場合、FECアルゴリズムは、代わりに補償信号を生成し、最後に正確に合成されたフレームと補償信号の冒頭との間の平滑な遷移を保証する。これは、冒頭の前に補償信号を外挿し、重なった部分に重複加算(OLA)演算を行うことにより達成される。しかし、OLAは、最後のフレームが有声のような場合、すなわち、(clas>UNVOICED TRANSITION)の場合のみ適用される。
sx(n)=s(n+N−TOL), n=0,1,...,N−1 (11)
により与えられる。
sX(n)=s(n+N−TOL), n=−LOLA,...,−1,0,1,...,N−1 (12)
により反映される。
s(n+N−LOLA)=s(n+N−LOLA)fOLA(n)++sx(n−LOLA)[1−fOLA(n)] n=0,1,...,LOLA−1 (14)
のように変更され、外挿された補償フレームの先頭セグメントが、
sfOLA(n−LOLA)=sf(n−LOLA)(1−fOLA(n)), n=0,1,...,LOLA (15)
として変更される。
有声のような信号の場合、すなわち、clas>UNVOICED TRANSITIONの場合、合成信号の最後のピッチ周期は繰り返され、最後の正確な合成フレームの末尾において推定されるピッチ発展を尊重するように変更される。ピッチ発展の推定は、OLピッチ追跡アルゴリズムの一環である。ピッチが有意なように発展するか否かを検証するために使用されるピッチコヒーレンスフラグを計算することで開始される。ピッチコヒーレンスフラグcoh_flag(i)は、以下の2つの条件が満たされた場合に設定される。
Np=|delta_pit| (18)
である。
nLE=arg min(sf2(n)+sf2(n+1)) (19)
として定義される。
前のセクションにおいて述べたように、有声のような信号の場合、すなわち、clas>UNVOICED TRANSITIONの場合、合成信号の最後のピッチ周期は繰り返される。無声のような信号の場合、ピッチ発展は重要ではなく、尊重されない。
x(n)=31821.x(n−1)+13849, n=1,2,...,N (20)
により与えられる。
sf(n)=gasSYN(n), n=0,1,...,N−1 (22)
であり、式中、gaは、過去のフレームエネルギーとランダム合成フレームのエネルギーとの比の平方根として定義される。すなわち、
両方の種類の信号、すなわち、有声および無声について、補償信号のエネルギーは、消失の数が増えるにつれて徐々に減衰する。減衰アルゴリズムには、有声オフセットの検出器が備えられ、有声オフセット中に、減衰アルゴリズムは低減するエネルギー傾向を尊重しようとする。これは、発展が不適切であったいくつかのオンセットを検出することも可能であり、異なる減衰戦略を適用する。減衰アルゴリズムのパラメータは、補償信号の高い主観的品質を提供するように手調整されている。
gatt=[1,g(0),g(1),...,g(NATT)=0] (24)
により与えられ、NATT=20は、一連の長さである。一連は1で開始され、0で終わる。これは、補償フレームの冒頭のエネルギーが減衰されず、末尾のエネルギーが0に減衰することを示す。表2に、様々な信号クラスの減衰係数を示す。
fE(i)=k.t(i)+q (26)
式中、t=[4N,3N,2N,N,0]は時間インデックスのベクトルであり、i=0,1,...,4およびfE(i)は近似されたエネルギー値である。係数kおよびqは、
Etrend=k.N (29)
により与えられる。
(Etrend<−0.1)AND(err<0.6) (30)
gatt=[1,w(0),w(1),...,w(NATT)=0] (32)
により与えられ、式中、w(.)はw(0)=1により初期化された線形関数であり、
sfATT(n)=sf(n)fATT(n) n=0,1,...,N−1 (34)
で乗算され、式中、fATT(.)は、各フレームの終わりにおいて、
有声フレームの補償中、式(11)でのように、過去の信号が、推定されたピッチラグを使用して繰り返される。一連の消失後の最初の良好なフレームが受信されると、ピッチの不連続性が現れ、気に障るアーチファクトが生じ得る。非制限的な実施形態は、この問題を回避するための信号再同期方法を含む。
[(last_clas==VOICED)AND(CRSX>0.7)AND(rRSX<2.0)]
として定義される。但し、last_clasは、補償周期の前の信号の分類である。この条件が満たされる場合、補償信号は、先に見つけられたサンプルの数に応じて伸展または短縮(圧縮)される。これが補償信号sx(n)全体に対して、すなわち、
n=−N,...,0,1,...,N−1
に対して行われることに留意されたい。
p(k)=kΔ(k=0,...,2N−1) (42)
により与えられる位置における元の信号の値から計算される。
sRx(n), n=_−N,...,−1 (45)
により与えられ、現在のフレームは、復号化信号s(n)、n=0,...,N−1および再同期された補償信号sRx(n)をクロスフェーディング(重複加算)することにより与えられる。補償された過去のフレームおよびクロスフェーディングされた現在のフレームを出力する前に、さらなる処理を再同期された補償信号に適用できることに留意されたい。
補償段階が終了すると、復元段階が開始される。復元を行う理由は、補償の末尾と通常通りの合成の冒頭との間の平滑な遷移を保証することである。復元段階の長さは、信号クラスおよび補償中に使用されたピッチ周期、式(39)において計算された正規化相関、ならびに式(40)において計算されたエネルギー比に依存する。
これまで、説明したFECアルゴリズムは、過去の合成狭帯域信号(レイヤ1またはレイヤ1およびレイヤ2)に対して実行されてきた。フレームが失われた場合、狭帯域拡張部分(レイヤ2)は復号化もされず、補償もされなかった。これは、補償段階中および復元段階中(一連のフレーム消失後に最初に正確に受信した2つのフレーム)、レイヤ2情報が使用されないことを意味する。FEC後に最初の正確に受信した2つのフレームは、十分なデータが、レイヤ2合成の一体部分である、行われるLP解析に利用できない(120個のサンプルが必要)ため、通常の演算から省かれる。
[1] Pulse code modulation (PCM) of voice frequencies, ITU-T Recommendation G.711, November 1988, (http://www.itu.int)
[2] Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service Options 62 and 63 for Spread Spectrum Systems, 3GPP2 Technical Specification C.S0052-A v1.0, April 2005 (http://www.3gpp2.org)
402 補償信号拡張器
403 相互相関器
404 復号化信号
405 前のフレーム内の補償信号
406 現在のフレーム内の補償信号
406 補償信号
407 遅延
408 同期器
409 前のフレームに対応するリサンプリングされた補償信号の部分
410、413 2フレームバッファ
411 現在のフレームに対応するリサンプリングされた補償信号の部分
412 前のフレームおよび現在のフレームの連結に対応する補償信号
414 復元ユニット
415 合成信号
416 リサンプリング信号
Claims (35)
- 符号化音声信号のフレーム消失補償後に再同期し復元する方法であって、
フレーム消失の後、現在のフレームにおいて正確に受信された信号を復号化すること、
前のフレームからの消失補償信号の続きを使用して、前記現在のフレーム内のフレーム消失補償を拡張して、拡張消失補償信号を生成すること、
前記拡張消失補償信号を前記現在のフレーム内の復号化信号と相関付け、前記相関付けに応答して、前記拡張消失補償信号を前記復号化信号に同期させること、および
前記現在のフレームにおいて、前記同期された拡張消失補償信号から前記復号化信号への平滑な遷移を生み出すこと
を含み、
前記拡張消失補償信号を前記復号化信号と相関付けることは、前記相関付けに対応する遅延を計算することを含み、
前記拡張消失補償信号を前記復号化信号と同期させることは、前記計算された遅延に応
答して、前記拡張消失補償信号をリサンプリングすることを含み、
前記計算された遅延に応答して、前記拡張消失補償信号をリサンプリングすることは、前記計算された遅延が正であるか、それとも負であるかに応じて前記拡張消失補償
信号を圧縮または伸展することを含む、再同期し復元する方法。 - 前記相関付けに応答して、前記前のフレームからの前記消失補償信号を前記復号化信号と同期させることをさらに含む、請求項1に記載の再同期し復元する方法。
- 前記拡張消失補償信号を前記復号化信号と相関付けることは、前記拡張消失補償信号と前記復号化信号との相互相関を最大化することを含む、請求項1に記載の再同期し復元する方法。
- 前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号に連結して、連結された消失補償信号を生成することをさらに含む、請求項1に記載の再同期し復元する方法。
- 2つのフレームに対応する周期を前記連結された消失補償信号で覆うことを含む、請求項4に記載の再同期し復元する方法。
- 前記方法は、前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号に連結して、連結された消失補償信号を生成することを含み、前記拡張消失補償信号を前記現在のフレーム内の前記復号化信号と同期させること、および前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記復号化信号と同期させることは、前記計算された遅延に応答して、前記連結された消失補償信号をリサンプリングすることを含む、請求項2に記載の再同期し復元する方法。
- 前記計算された遅延に応答して、前記連結された消失補償信号をリサンプリングすることは、前記計算された遅延が正であるか、それとも負であるかに応じて前記連結された消失補償信号を圧縮または伸展することを含む、請求項6に記載の再同期し復元する方法。
- 前記連結された消失補償信号を圧縮することは、前記計算された遅延の値に対応するいくつかのサンプルを除去することを含む、請求項7に記載の再同期し復元する方法。
- 前記連結された消失補償信号を伸展することは、前記計算された遅延の値に対応するいくつかのサンプルを挿入することを含む、請求項7に記載の再同期し復元する方法。
- 前記相関付けに応答して前記拡張消失補償信号を前記復号化信号と同期させることは、前記拡張消失補償信号の位相を前記復号化信号と位置合わせすることを含む、請求項1に記載の再同期し復元する方法。
- 前記前のフレームから前記消失補償信号を抽出して、前記前のフレーム内の合成信号を生成することを含む、請求項1に記載の再同期し復元する方法。
- 平滑な遷移を生成することは、前記拡張消失補償信号および前記現在のフレーム内の前記復号化信号に対してクロスフェーディング演算を実行することを含む、請求項1に記載の再同期し復元する方法。
- 平滑な遷移を生成することは、前記連結された消失補償信号および前記現在のフレーム内の前記復号化信号の重複部分に対して重複加算演算を実行することを含む、請求項4に記載の再同期し復元する方法。
- 前記重複加算演算を実行することは、前記現在のフレーム内に合成信号を生成することを含む、請求項13に記載の再同期し復元する方法。
- 前記重複加算演算を実行することは、三角窓を使用することを含む、請求項13に記載の再同期し復元する方法。
- 前記重複加算演算を実行することは、前記重複加算演算の長さを計算することを含む、請求項13に記載の再同期し復元する方法。
- 前記符号化音声信号の信号分類を決定することをさらに含む、請求項1に記載の再同期し復元する方法。
- 前記符号化音声信号の前記信号分類を決定することは、前記符号化音声信号を無声信号、無声遷移信号、有声遷移信号、有声信号、およびオンセット信号からなる群に分類することを含む、請求項17に記載の再同期し復元する方法。
- 前記信号分類を決定することは、前記符号化音声信号に関連するピッチコヒーレンス、ゼロ交差率、相関、スペクトル傾斜、およびエネルギー差からなる群から選択されたパラメータを計算して、前記符号化音声信号の前記信号分類を決定することを含む、請求項17に記載の再同期し復元する方法。
- 有声信号の場合のみ、前記拡張消失補償信号の前記復号化信号との同期を実行することを含む、請求項1に記載の再同期し復元する方法。
- 前記エネルギー差を計算することは、前記拡張消失補償信号と前記現在のフレーム内の前記復号化信号とのエネルギーの比を計算することを含む、請求項19に記載の再同期し復元する方法。
- 符号化音声信号のフレーム消失補償後に再同期し復元する装置であって、
フレーム消失の後、現在のフレームにおいて正確に受信された信号を復号化するデコーダと、
前のフレームからの消失補償信号の続きを使用して、前記現在のフレームにおいて拡張消失補償信号を生成する補償信号拡張器と、
前記拡張消失補償信号と前記現在のフレーム内の復号化信号との相関器および相関に応答する、前記復号化信号との前記拡張消失補償信号の同期器と、
同期された拡張消失補償信号が供給され、前記同期された拡張消失補償信号から前記復号化信号への平滑な遷移を前記現在のフレーム内で生成するように構成された復元ユニットと
を備え、
前記相関器は、前記相関に対応する遅延を計算し、
前記同期器は、前記計算された遅延に応答する、前記拡張消失補償信号のリサンプラを備え、
前記リサンプラは、前記計算された遅延が正であるか、それとも負であるかに応じる、前記拡張消失補償信号の圧縮器または伸展器を備える、再同期し復元する装置。 - 前記同期器は、前記相関に応答して、前記前のフレームからの前記消失補償信号も符号化信号に同期させる、請求項22に記載の再同期し復元する装置。
- 前記相関器は、前記拡張消失補償信号と前記復号化信号との相互相関を最大化することを含む、請求項22に記載の再同期し復元する装置。
- 前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号と連結して、連結された消失補償信号を生成する手段を備える、請求項22に記載の再同期し復元する装置。
- 前記相関器は、前記相関に対応する遅延を計算し、前記装置は、前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号と連結して、連結された消失補償信号を生成する手段を備え、前記同期器は、前記計算された遅延に応答して、前記連結された消失補償信号のリサンプラを備える、請求項23に記載の再同期し復元する装置。
- 前記計算された遅延に応答する前記連結された消失補償信号のリサンプラは、前記計算された遅延が正であるか、それとも負であるかに応じて、前記連結された消失補償信号の圧縮器または伸展器を備える、請求項26に記載の再同期し復元する装置。
- 前記連結された消失補償信号の圧縮器は、前記計算された遅延の値に対応するいくつかのサンプルを除去する、請求項27に記載の再同期し復元する装置。
- 前記連結された消失補償信号の伸展器は、前記計算された遅延の値に対応するいくつかのサンプルを挿入する、請求項27に記載の再同期し復元する装置。
- 前記相関に応答する前記拡張消失補償信号と前記復号化信号との同期器は、前記拡張消失補償信号の位相を前記復号化信号と位置合わせする、請求項22に記載の再同期し復元する装置。
- 前記前のフレームから前記消失補償信号を抽出して、前記前のフレームにおいて合成信号を生成する手段を備える、請求項22に記載の再同期し復元する装置。
- 前記復元ユニットは、前記拡張消失補償信号および前記現在のフレーム内の前記復号化信号に対して重複加算演算を実行する、請求項22に記載の再同期し復元する装置。
- 前記復元ユニットは、前記連結された消失補償信号および前記現在のフレーム内の前記復号化信号の重複部分に対して重複加算演算を実行して、前記現在のフレームにおいて合成信号を生成する、請求項25に記載の再同期し復元する装置。
- 前記復元ユニットは、三角窓を使用して前記重複加算演算を実行する、請求項32に記載の再同期し復元する装置。
- 前記符号化音声信号の信号分類を決定することをさらに含む、請求項22に記載の再同期し復元する装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US92912407P | 2007-06-14 | 2007-06-14 | |
US60/929,124 | 2007-06-14 | ||
US96005707P | 2007-09-13 | 2007-09-13 | |
US60/960,057 | 2007-09-13 | ||
PCT/CA2007/002357 WO2008151408A1 (en) | 2007-06-14 | 2007-12-24 | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010530078A JP2010530078A (ja) | 2010-09-02 |
JP5618826B2 true JP5618826B2 (ja) | 2014-11-05 |
Family
ID=40129163
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010511454A Expired - Fee Related JP5618826B2 (ja) | 2007-06-14 | 2007-12-24 | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP2009518697A Expired - Fee Related JP5161212B2 (ja) | 2007-06-14 | 2007-12-28 | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009518697A Expired - Fee Related JP5161212B2 (ja) | 2007-06-14 | 2007-12-28 | Itu−tg.711規格と相互動作が可能なマルチレイヤ埋め込みコーデックにおける雑音成形デバイスおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US20110022924A1 (ja) |
EP (1) | EP2160733A4 (ja) |
JP (2) | JP5618826B2 (ja) |
CN (1) | CN101765879B (ja) |
WO (2) | WO2008151408A1 (ja) |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE490454T1 (de) * | 2005-07-22 | 2010-12-15 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
US20090259672A1 (en) * | 2008-04-15 | 2009-10-15 | Qualcomm Incorporated | Synchronizing timing mismatch by data deletion |
BRPI0910511B1 (pt) * | 2008-07-11 | 2021-06-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para decodificar e codificar um sinal de áudio |
JP5551694B2 (ja) * | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
US20100017196A1 (en) * | 2008-07-18 | 2010-01-21 | Qualcomm Incorporated | Method, system, and apparatus for compression or decompression of digital signals |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
WO2010137300A1 (ja) * | 2009-05-26 | 2010-12-02 | パナソニック株式会社 | 復号装置及び復号方法 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
FR2969360A1 (fr) * | 2010-12-16 | 2012-06-22 | France Telecom | Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique |
US9026434B2 (en) | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
ES2565394T3 (es) * | 2011-12-15 | 2016-04-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, método y programa informático para evitar artefactos de recorte |
US9325544B2 (en) * | 2012-10-31 | 2016-04-26 | Csr Technology Inc. | Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame |
AU2014211520B2 (en) | 2013-01-29 | 2017-04-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-frequency emphasis for LPC-based coding in frequency domain |
RU2625945C2 (ru) | 2013-01-29 | 2017-07-19 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии |
FR3001593A1 (fr) * | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
FR3004876A1 (fr) * | 2013-04-18 | 2014-10-24 | France Telecom | Correction de perte de trame par injection de bruit pondere. |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
PL3011555T3 (pl) | 2013-06-21 | 2018-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Rekonstrukcja ramki sygnału mowy |
MX371425B (es) * | 2013-06-21 | 2020-01-29 | Fraunhofer Ges Forschung | Aparato y metodo para la ocultacion mejorada del libro de codigo adaptativo en la ocultacion similar a acelp mediante la utilizacion de una estimacion mejorada del retardo de tono. |
CN107818789B (zh) | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
PL3012835T3 (pl) * | 2013-07-18 | 2019-02-28 | Nippon Telegraph And Telephone Corporation | Urządzenie, sposób i program do analizy predykcji liniowej, oraz nośnik zapisu |
US9570093B2 (en) * | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
KR101805630B1 (ko) * | 2013-09-27 | 2017-12-07 | 삼성전자주식회사 | 멀티 디코딩 처리 방법 및 이를 수행하기 위한 멀티 디코더 |
EP2980793A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder, system and methods for encoding and decoding |
US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
US9706317B2 (en) * | 2014-10-24 | 2017-07-11 | Starkey Laboratories, Inc. | Packet loss concealment techniques for phone-to-hearing-aid streaming |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
US9712348B1 (en) * | 2016-01-15 | 2017-07-18 | Avago Technologies General Ip (Singapore) Pte. Ltd. | System, device, and method for shaping transmit noise |
WO2017129665A1 (en) * | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
WO2017129270A1 (en) * | 2016-01-29 | 2017-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal |
MX2018010756A (es) | 2016-03-07 | 2019-01-14 | Fraunhofer Ges Forschung | Unidad de ocultamiento de error, decodificador de audio, y método relacionado y programa de computadora que usa características de una representación decodificada de una trama de audio decodificada apropiadamente. |
CA3016837C (en) * | 2016-03-07 | 2021-09-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Hybrid concealment method: combination of frequency and time domain packet loss concealment in audio codecs |
KR102192998B1 (ko) * | 2016-03-07 | 2020-12-18 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 상이한 주파수 대역에 대한 상이한 감쇠 인자에 따라 은닉된 오디오 프레임을 페이드 아웃하는 에러 은닉 유닛, 오디오 디코더, 및 관련 방법과 컴퓨터 프로그램 |
CN107356521B (zh) * | 2017-07-12 | 2020-01-07 | 湖北工业大学 | 一种针对多电极阵列腐蚀传感器微小电流的检测装置及方法 |
EP3704863B1 (en) * | 2017-11-02 | 2022-01-26 | Bose Corporation | Low latency audio distribution |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483886A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3553777B1 (en) * | 2018-04-09 | 2022-07-20 | Dolby Laboratories Licensing Corporation | Low-complexity packet loss concealment for transcoded audio signals |
WO2020169754A1 (en) * | 2019-02-21 | 2020-08-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods for phase ecu f0 interpolation split and related controller |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4704730A (en) * | 1984-03-12 | 1987-11-03 | Allophonix, Inc. | Multi-state speech encoder and decoder |
US5550544C1 (en) * | 1994-02-23 | 2002-02-12 | Matsushita Electric Ind Co Ltd | Signal converter noise shaper ad converter and da converter |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
JP3017715B2 (ja) * | 1997-10-31 | 2000-03-13 | 松下電器産業株式会社 | 音声再生装置 |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
US20070055498A1 (en) * | 2000-11-15 | 2007-03-08 | Kapilow David A | Method and apparatus for performing packet loss or frame erasure concealment |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
JP4574320B2 (ja) * | 2004-10-20 | 2010-11-04 | 日本電信電話株式会社 | 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体 |
CN1783701A (zh) * | 2004-12-02 | 2006-06-07 | 中国科学院半导体研究所 | 一种高阶σδ噪声整形直接数字频率合成器 |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
JP4758687B2 (ja) * | 2005-06-17 | 2011-08-31 | 日本電信電話株式会社 | 音声パケット送信方法、音声パケット受信方法、それらの方法を用いた装置、プログラム、および記録媒体 |
US20070174047A1 (en) * | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
JP2007114417A (ja) * | 2005-10-19 | 2007-05-10 | Fujitsu Ltd | 音声データ処理方法及び装置 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP4693185B2 (ja) * | 2007-06-12 | 2011-06-01 | 日本電信電話株式会社 | 符号化装置、プログラム、および記録媒体 |
JP5014493B2 (ja) * | 2011-01-18 | 2012-08-29 | 日本電信電話株式会社 | 符号化方法、符号化装置、およびプログラム |
-
2007
- 2007-12-24 JP JP2010511454A patent/JP5618826B2/ja not_active Expired - Fee Related
- 2007-12-24 US US12/664,024 patent/US20110022924A1/en not_active Abandoned
- 2007-12-24 WO PCT/CA2007/002357 patent/WO2008151408A1/en active Application Filing
- 2007-12-28 CN CN2007801000736A patent/CN101765879B/zh not_active Expired - Fee Related
- 2007-12-28 JP JP2009518697A patent/JP5161212B2/ja not_active Expired - Fee Related
- 2007-12-28 WO PCT/CA2007/002373 patent/WO2008151410A1/en active Application Filing
- 2007-12-28 US US12/664,010 patent/US20110173004A1/en not_active Abandoned
- 2007-12-28 EP EP07855653A patent/EP2160733A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CN101765879B (zh) | 2013-10-30 |
WO2008151408A1 (en) | 2008-12-18 |
US20110022924A1 (en) | 2011-01-27 |
JP2010530078A (ja) | 2010-09-02 |
JP2009541815A (ja) | 2009-11-26 |
WO2008151408A8 (en) | 2009-03-05 |
US20110173004A1 (en) | 2011-07-14 |
EP2160733A4 (en) | 2011-12-21 |
JP5161212B2 (ja) | 2013-03-13 |
WO2008151410A1 (en) | 2008-12-18 |
CN101765879A (zh) | 2010-06-30 |
EP2160733A1 (en) | 2010-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5618826B2 (ja) | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 | |
EP2277172B1 (fr) | Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique | |
JP4658596B2 (ja) | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 | |
TWI389099B (zh) | 用於在語音合成儀中藉由修改剩餘量之時間規整訊框之方法及處理器可讀媒體 | |
JP4063670B2 (ja) | 広帯域信号伝送システム | |
KR101940740B1 (ko) | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
EP1086451B1 (en) | Method for performing frame erasure concealment | |
KR101957905B1 (ko) | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
KR101455915B1 (ko) | 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더 | |
KR20030009515A (ko) | 결정된 신호 타입들로 한정된 기술들을 사용하는 신호들의시간 스케일 변경 | |
KR101398189B1 (ko) | 음성수신장치 및 음성수신방법 | |
KR20080080235A (ko) | 음성 코덱에서 효율적인 프레임 소거 은폐를 위한 방법 및장치 | |
JP2010507121A (ja) | ピッチ周期訂正を用いたデジタルオーディオ信号の損失ブロックの合成 | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
MX2008008477A (es) | Metodo y dispositivo para ocultamiento eficiente de borrado de cuadros en codec de voz | |
MXPA00012580A (en) | Method and apparatus for performing packet loss or frame erasure concealment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130319 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130619 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130718 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140513 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140818 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5618826 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |