JP2012098740A - 音声通信におけるフレーム消失キャンセル - Google Patents
音声通信におけるフレーム消失キャンセル Download PDFInfo
- Publication number
- JP2012098740A JP2012098740A JP2011270440A JP2011270440A JP2012098740A JP 2012098740 A JP2012098740 A JP 2012098740A JP 2011270440 A JP2011270440 A JP 2011270440A JP 2011270440 A JP2011270440 A JP 2011270440A JP 2012098740 A JP2012098740 A JP 2012098740A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- frames
- speech
- delay
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 36
- 230000003044 adaptive effect Effects 0.000 claims description 63
- 238000001228 spectrum Methods 0.000 claims description 28
- 239000000872 buffer Substances 0.000 claims description 24
- 230000001934 delay Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】それぞれが音声パラメータを有するフレームのシーケンスを受信する音声デコーダ108は、音声パラメータからスピーチを生成するスピーチジェネレータ308を含んでいる。フレーム消失キャンセルモジュール306は、前のフレームの1つにおける音声パラメータ、及び、後のフレームの1つにおける音声パラメータから、フレームシーケンスにおけるフレーム消失の音声パラメータを再構築する。
【選択図】図3
Description
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[発明1]
それぞれが音声パラメータを有するフレームのシーケンスを受信し、かつ、前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータ、及び1又は複数の後のフレームの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールと
を備えるデコーダ。
[発明2]
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームの1つを含む複数の前記後のフレームからの音声パラメータとから、前記フレーム消失の音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明3]
前記フレーム消失キャンセルモジュールは、前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームの1つにおける音声パラメータと、前記後のフレームの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明4]
前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを更に備える発明1に記載の音声デコーダ。
[発明5]
前記ジッタバッファは更に、前記前のフレームの1又は複数からの音声パラメータと、前記後のフレームの1又は複数からの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された発明4に記載の音声デコーダ。
[発明6]
前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える発明1に記載の音声デコーダ。
[発明7]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された発明1に記載の音声デコーダ。
[発明8]
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された発明1に記載の音声デコーダ。
[発明9]
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明8に記載の音声デコーダ。
[発明10]
前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明8に記載の音声デコーダ。
[発明11]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームの前記適応コードブック利得を再構築するように構成された発明1に記載の音声デコーダ。
[発明12]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された発明1に記載の音声デコーダ。
[発明13]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された発明1に記載の音声デコーダ。
[発明14]
それぞれが音声パラメータを有するフレームのシーケンスを受信することと、
少なくとも1つの前のフレームにおける音声パラメータ、及び少なくとも1つの後のフレームからの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと、
前記フレームのシーケンスの音声パラメータからスピーチを生成することと
を備える音声復号方法。
[発明15]
前記フレーム消失の音声パラメータは、前記前のフレームのうちの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームのうちの1つを含む複数の前記後のフレームにおける音声パラメータとから再構築される発明14に記載の方法。
[発明16]
前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値より上にあることを判定することと、
その判定に応じて、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと
を備える発明14に記載の方法。
[発明17]
正確なシーケンスで受信されるように、前記フレームを再調整することを更に備える発明14に記載の方法。
[発明18]
前記フレーム消失を検出することを更に備える発明14に記載の方法。
[発明19]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記消失したフレームのラインスペクトルペアは、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって再構築される発明14に記載の方法。
[発明20]
前記後のフレームの1つは、前記消失したフレームに続く次のフレームであり、
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、前記後のフレームの1つにおける前記差分値が範囲内であるとの判定に応じて、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延が再構築される発明14に記載の方法。
[発明21]
前記後のフレームの1つは、前記消失したフレームに続く次のフレームではなく、前記フレームの各々における音声パラメータは、遅延を含み、前記消失したフレームの遅延は、前記前のフレームの1つの遅延と、前記後のフレームの1つの遅延との間を補間することによって再構築される発明14に記載の方法。
[発明22]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記消失したフレームの前記適応コードブック利得は、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより再構築される発明14に記載の方法。
[発明23]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得が再構築される発明14に記載の方法。
[発明24]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記消失したフレームの音声パラメータは、前記消失したフレームの固定コードブック利得をゼロに設定することによって再構築される発明14に記載の方法。
[発明25]
それぞれが音声パラメータを有するフレームのシーケンスを受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成する手段と、
少なくとも1つの前のフレームにおける音声パラメータと、少なくとも1つの後のフレームにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築する手段と
を備える音声デコーダ。
[発明26]
前記フレームを前記スピーチ生成手段へ正確なシーケンスで提供する手段を更に備える発明25に記載の音声デコーダ。
[発明27]
受信機と、
それぞれが音声パラメータを有するフレームのシーケンスを前記受信機から受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータと、1又は複数の後のフレームの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールとを備える音声デコーダとを備える通信端末。
[発明28]
前記フレーム消失キャンセルモジュールは、前記前のフレームのうちの1つと、前記後のフレームのうちの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームのうちの1つにおける音声パラメータと、前記後のフレームのうちの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された発明27に記載の通信端末。
[発明29]
前記音声デコーダは更に、前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを備える発明27に記載の通信端末。
[発明30]
前記ジッタバッファは更に、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された発明29に記載の通信端末。
[発明31]
前記音声デコーダは、前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える発明27に記載の通信端末。
[発明32]
前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された発明27に記載の通信端末。
[発明33]
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された発明27に記載の通信端末。
[発明34]
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明33に記載の通信端末。
[発明35]
前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された発明33に記載の通信端末。
[発明36]
前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームのための前記適応コードブック利得を再構築するように構成された発明27に記載の通信端末。
[発明37]
前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された発明27に記載の通信端末。
[発明38]
前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された発明27に記載の通信端末。
Claims (38)
- それぞれが音声パラメータを有するフレームのシーケンスを受信し、かつ、前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータ、及び1又は複数の後のフレームの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールと
を備えるデコーダ。 - 前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームの1つを含む複数の前記後のフレームからの音声パラメータとから、前記フレーム消失の音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。
- 前記フレーム消失キャンセルモジュールは、前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームの1つにおける音声パラメータと、前記後のフレームの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。
- 前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを更に備える請求項1に記載の音声デコーダ。
- 前記ジッタバッファは更に、前記前のフレームの1又は複数からの音声パラメータと、前記後のフレームの1又は複数からの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された請求項4に記載の音声デコーダ。
- 前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える請求項1に記載の音声デコーダ。
- 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された請求項1に記載の音声デコーダ。 - 前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された請求項1に記載の音声デコーダ。 - 前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項8に記載の音声デコーダ。
- 前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項8に記載の音声デコーダ。
- 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームの前記適応コードブック利得を再構築するように構成された請求項1に記載の音声デコーダ。 - 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された請求項1に記載の音声デコーダ。 - 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された請求項1に記載の音声デコーダ。 - それぞれが音声パラメータを有するフレームのシーケンスを受信することと、
少なくとも1つの前のフレームにおける音声パラメータ、及び少なくとも1つの後のフレームからの音声パラメータから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと、
前記フレームのシーケンスの音声パラメータからスピーチを生成することと
を備える音声復号方法。 - 前記フレーム消失の音声パラメータは、前記前のフレームのうちの1つを含む複数の前記前のフレームにおける音声パラメータと、前記後のフレームのうちの1つを含む複数の前記後のフレームにおける音声パラメータとから再構築される請求項14に記載の方法。
- 前記前のフレームの1つと、前記後のフレームの1つとから、フレームレートが、しきい値より上にあることを判定することと、
その判定に応じて、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築することと
を備える請求項14に記載の方法。 - 正確なシーケンスで受信されるように、前記フレームを再調整することを更に備える請求項14に記載の方法。
- 前記フレーム消失を検出することを更に備える請求項14に記載の方法。
- 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記消失したフレームのラインスペクトルペアは、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって再構築される請求項14に記載の方法。 - 前記後のフレームの1つは、前記消失したフレームに続く次のフレームであり、
前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、前記後のフレームの1つにおける前記差分値が範囲内であるとの判定に応じて、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延が再構築される請求項14に記載の方法。 - 前記後のフレームの1つは、前記消失したフレームに続く次のフレームではなく、前記フレームの各々における音声パラメータは、遅延を含み、前記消失したフレームの遅延は、前記前のフレームの1つの遅延と、前記後のフレームの1つの遅延との間を補間することによって再構築される請求項14に記載の方法。
- 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記消失したフレームの前記適応コードブック利得は、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより再構築される請求項14に記載の方法。 - 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得が再構築される請求項14に記載の方法。 - 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記消失したフレームの音声パラメータは、前記消失したフレームの固定コードブック利得をゼロに設定することによって再構築される請求項14に記載の方法。 - それぞれが音声パラメータを有するフレームのシーケンスを受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成する手段と、
少なくとも1つの前のフレームにおける音声パラメータと、少なくとも1つの後のフレームにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築する手段と
を備える音声デコーダ。 - 前記フレームを前記スピーチ生成手段へ正確なシーケンスで提供する手段を更に備える請求項25に記載の音声デコーダ。
- 受信機と、
それぞれが音声パラメータを有するフレームのシーケンスを前記受信機から受信するように構成された音声デコーダであって、
前記音声パラメータからスピーチを生成するように構成されたスピーチジェネレータと、
1又は複数の前のフレームの音声パラメータと、1又は複数の後のフレームの音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成されたフレーム消失キャンセルモジュールとを備える音声デコーダとを備える通信端末。 - 前記フレーム消失キャンセルモジュールは、前記前のフレームのうちの1つと、前記後のフレームのうちの1つとから、フレームレートが、しきい値よりも上にあるとの判定に応じて、前記前のフレームのうちの1つにおける音声パラメータと、前記後のフレームのうちの1つにおける音声パラメータとから、前記フレームのシーケンスにおけるフレーム消失の音声パラメータを再構築するように構成された請求項27に記載の通信端末。
- 前記音声デコーダは更に、前記フレームを前記スピーチジェネレータに正確なシーケンスで提供するように構成されたジッタバッファを備える請求項27に記載の通信端末。
- 前記ジッタバッファは更に、前記前のフレームの1つからの音声パラメータと、前記後のフレームの1つからの音声パラメータとを前記フレーム消失キャンセルモジュールへ提供し、前記フレーム消失の音声パラメータを再構築するように構成された請求項29に記載の通信端末。
- 前記音声デコーダは、前記フレーム消失を検出するように構成されたフレーム誤り検出器を更に備える請求項27に記載の通信端末。
- 前記フレームの各々における音声パラメータは、ラインスペクトルペアを含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおけるラインスペクトルペアと、前記後のフレームの1つにおけるラインスペクトルペアとの間を補間することによって、前記消失したフレームのラインスペクトルペアを再構築するように構成された請求項27に記載の通信端末。 - 前記フレームの各々における音声パラメータは、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差分を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが次のフレームであり、かつ、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける差分値が範囲内であると判定した場合には、前記後のフレームの1つにおける差分値から、前記消失したフレームの遅延を再構築するように構成された請求項27に記載の通信端末。 - 前記フレーム消失キャンセルモジュールは更に、前記後のフレームの1つが前記次のフレームではない場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項33に記載の通信端末。
- 前記フレーム消失キャンセルモジュールは更に、前記フレーム消失キャンセルモジュールが、前記後のフレームの1つにおける遅延値が、範囲外であると判定した場合には、前記前のフレームの1つにおける遅延と、前記後のフレームの1つにおける遅延との間を補間することによって、前記消失したフレームの遅延を再構築するように構成された請求項33に記載の通信端末。
- 前記フレームの各々における音声パラメータは、適応コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記前のフレームの1つにおける適応コードブック利得と、前記後のフレームの1つにおける適応コードブック利得との間を補間することにより、前記消失したフレームのための前記適応コードブック利得を再構築するように構成された請求項27に記載の通信端末。 - 前記フレームの各々における音声パラメータは、適応コードブック利得、遅延、及び、前記遅延と最も最近の前のフレームの遅延との差を示す差分値を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの遅延が、前記後のフレームの1つにおける差分値から決定できるのであれば、前記適応コードブック利得を、前記前のフレームの1つと前記後のフレームの1つとの間で補間された適応コードブック利得よりも大きい値に設定することによって、前記消失したフレームの適応コードブック利得を再構築するように構成された請求項27に記載の通信端末。 - 前記フレームの各々における音声パラメータは、固定コードブック利得を含み、
前記フレーム消失キャンセルモジュールは更に、前記消失したフレームの固定コードブック利得をゼロに設定することによって、前記消失したフレームの音声パラメータを再構築するように構成された請求項27に記載の通信端末。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/047,884 | 2005-01-31 | ||
US11/047,884 US7519535B2 (en) | 2005-01-31 | 2005-01-31 | Frame erasure concealment in voice communications |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007553348A Division JP2008529423A (ja) | 2005-01-31 | 2006-01-30 | 音声通信におけるフレーム消失キャンセル |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012098740A true JP2012098740A (ja) | 2012-05-24 |
JP5362808B2 JP5362808B2 (ja) | 2013-12-11 |
Family
ID=36217009
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007553348A Withdrawn JP2008529423A (ja) | 2005-01-31 | 2006-01-30 | 音声通信におけるフレーム消失キャンセル |
JP2011270440A Active JP5362808B2 (ja) | 2005-01-31 | 2011-12-09 | 音声通信におけるフレーム消失キャンセル |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007553348A Withdrawn JP2008529423A (ja) | 2005-01-31 | 2006-01-30 | 音声通信におけるフレーム消失キャンセル |
Country Status (8)
Country | Link |
---|---|
US (1) | US7519535B2 (ja) |
EP (1) | EP1859440A1 (ja) |
JP (2) | JP2008529423A (ja) |
KR (1) | KR100956522B1 (ja) |
CN (1) | CN101147190B (ja) |
MY (1) | MY144724A (ja) |
TW (1) | TW200703234A (ja) |
WO (1) | WO2006083826A1 (ja) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100612889B1 (ko) * | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
US7395202B2 (en) * | 2005-06-09 | 2008-07-01 | Motorola, Inc. | Method and apparatus to facilitate vocoder erasure processing |
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US8798172B2 (en) * | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
JP2008058667A (ja) * | 2006-08-31 | 2008-03-13 | Sony Corp | 信号処理装置および方法、記録媒体、並びにプログラム |
JP2008076847A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | 復号器及び信号処理システム |
CN101207468B (zh) * | 2006-12-19 | 2010-07-21 | 华为技术有限公司 | 丢帧隐藏方法、系统和装置 |
EP2112653A4 (en) * | 2007-05-24 | 2013-09-11 | Panasonic Corp | AUDIO DEODICATION DEVICE, AUDIO CODING METHOD, PROGRAM AND INTEGRATED CIRCUIT |
CN101321033B (zh) * | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及系统 |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR100899810B1 (ko) | 2007-12-17 | 2009-05-27 | 한국전자통신연구원 | 가변대역 멀티코덱을 위한 고정 지연 발생 장치 및 그 방법 |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
WO2011065741A2 (ko) * | 2009-11-24 | 2011-06-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8428959B2 (en) * | 2010-01-29 | 2013-04-23 | Polycom, Inc. | Audio packet loss concealment by transform interpolation |
PL2676265T3 (pl) | 2011-02-14 | 2019-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób do kodowania sygnału audio z stosowaniem zrównanej części antycypacji |
PL2676264T3 (pl) | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
KR101551046B1 (ko) * | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
ES2639646T3 (es) | 2011-02-14 | 2017-10-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio |
KR101525185B1 (ko) | 2011-02-14 | 2015-06-02 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 |
BR112013020482B1 (pt) | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
MY166394A (en) | 2011-02-14 | 2018-06-25 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
US9026434B2 (en) | 2011-04-11 | 2015-05-05 | Samsung Electronic Co., Ltd. | Frame erasure concealment for a multi rate speech and audio codec |
JP6037184B2 (ja) * | 2012-09-28 | 2016-12-07 | 国立研究開発法人産業技術総合研究所 | 多孔質媒体を利用したアッセイ装置 |
CN104751849B (zh) | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US9672833B2 (en) * | 2014-02-28 | 2017-06-06 | Google Inc. | Sinusoidal interpolation across missing data |
US10157620B2 (en) | 2014-03-04 | 2018-12-18 | Interactive Intelligence Group, Inc. | System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
CN107369455B (zh) | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US10217466B2 (en) * | 2017-04-26 | 2019-02-26 | Cisco Technology, Inc. | Voice data compensation with machine learning |
WO2019000178A1 (zh) * | 2017-06-26 | 2019-01-03 | 华为技术有限公司 | 一种丢帧补偿方法及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01248200A (ja) * | 1988-03-30 | 1989-10-03 | Toshiba Corp | 音声復号化装置 |
JPH02282299A (ja) * | 1989-04-24 | 1990-11-19 | Matsushita Electric Ind Co Ltd | 音声復号化装置 |
JPH0588697A (ja) * | 1991-09-26 | 1993-04-09 | Kokusai Denshin Denwa Co Ltd <Kdd> | 欠落音声補間方式 |
JPH07311597A (ja) * | 1994-03-14 | 1995-11-28 | At & T Corp | 音声信号合成方法 |
JPH07325594A (ja) * | 1994-03-14 | 1995-12-12 | At & T Corp | 復号器において使用されるパラメータ信号アダプタの動作方法 |
JPH08227300A (ja) * | 1994-10-14 | 1996-09-03 | At & T Corp | 符号化システムの性能を改善する方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04149600A (ja) * | 1990-10-12 | 1992-05-22 | Fujitsu Ltd | 音声復号化方式 |
US5699478A (en) * | 1995-03-10 | 1997-12-16 | Lucent Technologies Inc. | Frame erasure compensation technique |
US6205130B1 (en) * | 1996-09-25 | 2001-03-20 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
US5907822A (en) * | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
JPH10336147A (ja) * | 1997-06-03 | 1998-12-18 | Oki Electric Ind Co Ltd | Cdma送受信装置および送信レート可変方法 |
JP2000081898A (ja) * | 1998-09-03 | 2000-03-21 | Denso Corp | ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置 |
WO2000063885A1 (en) | 1999-04-19 | 2000-10-26 | At & T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
US6952668B1 (en) * | 1999-04-19 | 2005-10-04 | At&T Corp. | Method and apparatus for performing packet loss or frame erasure concealment |
US6597961B1 (en) * | 1999-04-27 | 2003-07-22 | Realnetworks, Inc. | System and method for concealing errors in an audio transmission |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US7027989B1 (en) * | 1999-12-17 | 2006-04-11 | Nortel Networks Limited | Method and apparatus for transmitting real-time data in multi-access systems |
GB2360178B (en) * | 2000-03-06 | 2004-04-14 | Mitel Corp | Sub-packet insertion for packet loss compensation in Voice Over IP networks |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
JP2002162998A (ja) * | 2000-11-28 | 2002-06-07 | Fujitsu Ltd | パケット修復処理を伴なう音声符号化方法 |
US6564580B2 (en) | 2001-06-29 | 2003-05-20 | Exxonmobil Upstream Research Company | Process for recovering ethane and heavier hydrocarbons from methane-rich pressurized liquid mixture |
EP1433164B1 (en) | 2001-08-17 | 2007-11-14 | Broadcom Corporation | Improved frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
JP3722366B2 (ja) * | 2002-02-22 | 2005-11-30 | 日本電信電話株式会社 | パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム |
JP4331928B2 (ja) * | 2002-09-11 | 2009-09-16 | パナソニック株式会社 | 音声符号化装置、音声復号化装置、及びそれらの方法 |
JP2005077889A (ja) * | 2003-09-02 | 2005-03-24 | Kazuhiro Kondo | 音声パケット欠落補間方式 |
-
2005
- 2005-01-31 US US11/047,884 patent/US7519535B2/en active Active
-
2006
- 2006-01-30 WO PCT/US2006/003343 patent/WO2006083826A1/en active Application Filing
- 2006-01-30 CN CN2006800089998A patent/CN101147190B/zh active Active
- 2006-01-30 KR KR1020077019859A patent/KR100956522B1/ko active IP Right Grant
- 2006-01-30 JP JP2007553348A patent/JP2008529423A/ja not_active Withdrawn
- 2006-01-30 EP EP06719940A patent/EP1859440A1/en not_active Ceased
- 2006-02-03 MY MYPI20060465A patent/MY144724A/en unknown
- 2006-02-03 TW TW095103838A patent/TW200703234A/zh unknown
-
2011
- 2011-12-09 JP JP2011270440A patent/JP5362808B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01248200A (ja) * | 1988-03-30 | 1989-10-03 | Toshiba Corp | 音声復号化装置 |
JPH02282299A (ja) * | 1989-04-24 | 1990-11-19 | Matsushita Electric Ind Co Ltd | 音声復号化装置 |
JPH0588697A (ja) * | 1991-09-26 | 1993-04-09 | Kokusai Denshin Denwa Co Ltd <Kdd> | 欠落音声補間方式 |
JPH07311597A (ja) * | 1994-03-14 | 1995-11-28 | At & T Corp | 音声信号合成方法 |
JPH07325594A (ja) * | 1994-03-14 | 1995-12-12 | At & T Corp | 復号器において使用されるパラメータ信号アダプタの動作方法 |
JPH08227300A (ja) * | 1994-10-14 | 1996-09-03 | At & T Corp | 符号化システムの性能を改善する方法 |
Also Published As
Publication number | Publication date |
---|---|
MY144724A (en) | 2011-10-31 |
US20060173687A1 (en) | 2006-08-03 |
CN101147190A (zh) | 2008-03-19 |
US7519535B2 (en) | 2009-04-14 |
CN101147190B (zh) | 2012-02-29 |
KR20070099055A (ko) | 2007-10-08 |
WO2006083826A1 (en) | 2006-08-10 |
JP5362808B2 (ja) | 2013-12-11 |
JP2008529423A (ja) | 2008-07-31 |
KR100956522B1 (ko) | 2010-05-07 |
EP1859440A1 (en) | 2007-11-28 |
TW200703234A (en) | 2007-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5362808B2 (ja) | 音声通信におけるフレーム消失キャンセル | |
JP5405659B2 (ja) | 消去されたスピーチフレームを再構成するためのシステムおよび方法 | |
TWI464734B (zh) | 用於在一語音訊框內避免資訊流失的系統與方法 | |
KR101009561B1 (ko) | 패킷 손실 은폐를 위한 피치 예측 | |
US20070150262A1 (en) | Sound packet transmitting method, sound packet transmitting apparatus, sound packet transmitting program, and recording medium in which that program has been recorded | |
WO2007143953A1 (fr) | Dispositif et procédé pour dissimulation de trames perdues | |
Sanneck et al. | Speech-property-based FEC for Internet telephony applications | |
US8996389B2 (en) | Artifact reduction in time compression | |
US10614818B2 (en) | Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information | |
CN1302513A (zh) | 用于发送多媒体信号的传输系统 | |
Ogunfunmi et al. | Speech over VoIP networks: Advanced signal processing and system implementation | |
Johansson et al. | Bandwidth efficient AMR operation for VoIP | |
JP3566931B2 (ja) | 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体 | |
CN1929355B (zh) | 语音包丢失恢复系统以及方法 | |
JP4093174B2 (ja) | 受信装置および方法 | |
JP4135621B2 (ja) | 受信装置および方法 | |
Rodbro et al. | Time-scaling of sinusoids for intelligent jitter buffer in packet based telephony | |
Le | Development of a loss-resilient internet speech transmission method | |
Mertz et al. | Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP. | |
JP2016105168A (ja) | Adpcmコーデックでのパケット損失隠蔽方法及びplc回路を備えるadpcm復号器 | |
Ho et al. | Improved lost frame recovery techniques for ITU-T G. 723.1 speech coding system | |
JPH10161696A (ja) | 音声符号化装置および音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130312 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130612 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130904 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5362808 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |