JP2009545779A - 信号変化検出のためのシステム、方法、および装置 - Google Patents
信号変化検出のためのシステム、方法、および装置 Download PDFInfo
- Publication number
- JP2009545779A JP2009545779A JP2009523024A JP2009523024A JP2009545779A JP 2009545779 A JP2009545779 A JP 2009545779A JP 2009523024 A JP2009523024 A JP 2009523024A JP 2009523024 A JP2009523024 A JP 2009523024A JP 2009545779 A JP2009545779 A JP 2009545779A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- sequence
- values
- spectral tilt
- spectral
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 143
- 230000008859 change Effects 0.000 title claims abstract description 80
- 238000001514 detection method Methods 0.000 title description 5
- 230000003595 spectral effect Effects 0.000 claims abstract description 229
- 230000005540 biological transmission Effects 0.000 claims abstract description 57
- 230000005236 sound signal Effects 0.000 claims description 78
- 238000012545 processing Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 12
- 238000009499 grossing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 29
- 206010019133 Hangover Diseases 0.000 description 26
- 230000007704 transition Effects 0.000 description 15
- 238000005311 autocorrelation function Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 7
- 238000003491 array Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Abstract
Description
本出願は、2006年7月31日に出願された「SPECTRAL TILT BASED DTX SCHEME」という名称の米国仮特許出願第60/834,689号、代理人整理番号061657P1の利益を主張するものである。
Claims (46)
- 音声信号を処理する方法であって、前記方法は、
前記音声信号の複数の非アクティブフレームに基づくスペクトル傾斜値のシーケンスを生成することと、
スペクトル傾斜値の前記シーケンスの少なくとも2つの値の間の変化を計算することと、
前記複数の非アクティブフレームのうちの1つの非アクティブフレームについて、前記フレームの記述を伝送すべきかどうかを決定することと、を備え、
前記フレームの記述を伝送すべきかどうかを前記決定することは、前記計算された変化に基づく方法。 - スペクトル傾斜値のシーケンスを前記生成することは、スペクトル傾斜値の前記シーケンスを生成するためにスペクトル傾斜値の別のシーケンスを平滑化することを備え、
前記別のシーケンスの前記スペクトル傾斜値の各々は、前記複数の非アクティブフレームのうちの対応する1つのスペクトル傾斜を指示する請求項1に記載の音声信号を処理する方法。 - 前記スペクトル傾斜値の各々は、前記音声信号の対応する非アクティブフレームの少なくとも1つの反射係数に基づく請求項1に記載の音声信号を処理する方法。
- 複数の前記スペクトル傾斜値の各々は、スペクトル傾斜値の前記シーケンス内の前記別のスペクトル傾斜値の少なくとも1つに基づく請求項1に記載の音声信号を処理する方法。
- 複数の前記スペクトル傾斜値の各々は、(A)前記複数の非アクティブフレームの対応する1つのスペクトル傾斜、および(B)スペクトル傾斜値の前記シーケンス内の前記別のスペクトル傾斜値の少なくとも1つに基づく請求項1に記載の音声信号を処理する方法。
- 前記計算された変化は、スペクトル傾斜値の前記シーケンス内の連続する値の間の差異に基づく請求項1に記載の音声信号を処理する方法。
- 変化を前記計算することは、スペクトル傾斜値の前記シーケンス内の隣接する値の間の距離を計算することを備える請求項1に記載の音声信号を処理する方法。
- 前記フレームの記述を伝送すべきかどうかを前記決定することは、前記計算された変化をしきい値と比較することを備える請求項1に記載の音声信号を処理する方法。
- 前記フレームの記述を伝送すべきかどうかを前記決定することの結果は、(A)前記計算された変化の絶対値と(B)しきい値との間の関係に基づく請求項1に記載の音声信号を処理する方法。
- 前記方法は、前記フレームの記述を伝送すべきかどうかを前記決定することの結果が、前記フレームの記述を伝送する決定である場合、スペクトル包絡線記述およびエネルギー包絡線記述のうちの少なくとも1つを含む無音記述を伝送することを備える請求項1に記載の音声信号を処理する方法。
- 前記方法は、(A)複数の非アクティブフレームの各々のスペクトル包絡線記述、および(B)複数の非アクティブフレームの各々のエネルギー包絡線記述のうちの少なくとも1つに基づいて前記無音記述を計算することを備える請求項10に記載の音声信号を処理する方法。
- 前記フレームの記述を伝送すべきかどうかを前記決定することは、(A)前記フレームのスペクトル包絡線を記述するベクトル、(B)前記フレームの残留エネルギー、(C)非アクティブフレームの記述の最新の伝送までの時間の距離、(D)最新のアクティブフレームまでの時間の距離、(E)前記フレームのエネルギー包絡線の記述、(F)前記フレームの平均絶対値、および(G)前記フレームのエネルギー値のうちの少なくとも1つに基づく請求項1に記載の音声信号を処理する方法。
- 前記方法は、前記フレームの記述を伝送すべきかどうかを前記決定することの結果が、前記フレームの記述を伝送する決定である場合、スペクトル包絡線記述およびエネルギー包絡線記述のうちの少なくとも1つを含む無音記述を伝送することを備える請求項12に記載の音声信号を処理する方法。
- 前記フレームの記述を伝送すべきかどうかを前記決定することは、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、前記フレームの記述を伝送しないと決定することを備える請求項1に記載の音声信号を処理する方法。
- 符号化利得の前記尺度の各値は、前記音声信号の対応する非アクティブフレームの複数の反射係数の値に基づく請求項14に記載の音声信号を処理する方法。
- 前記方法は、スペクトル傾斜値の前記シーケンス内の複数の前記スペクトル傾斜値の各々について、前記スペクトル傾斜値とスペクトル傾斜値の前記シーケンス内の少なくとも1つの他のスペクトル傾斜値との間の変化を計算することを備え、
前記方法は、前記音声信号の別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかを決定することを備え、
前記別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかを前記決定することの結果は、前記計算された変化のうちの少なくとも1つに基づく請求項1に記載の音声信号を処理する方法。 - 前記別の複数の非アクティブフレームの少なくとも一部の各々について、前記フレームの記述を伝送すべきかどうかを前記決定することの前記結果は、前記フレームの記述を伝送しない決定である請求項16に記載の音声信号を処理する方法。
- 前記別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかを前記決定することは、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、前記フレームの記述を伝送しないと決定することを備える請求項16に記載の音声信号を処理する方法。
- 前記別の複数の非アクティブフレームの各々について、符号化利得の尺度の前記変化は、(A)前記フレームに先行する前記音声信号の第1の非アクティブフレームの符号化利得の前記尺度の値、および(B)前記フレームに先行し前記第1の非アクティブフレームとは異なる前記音声信号の第2の非アクティブフレームの符号化利得の前記尺度の値に基づく請求項18に記載の音声信号を処理する方法。
- スペクトル傾斜値のシーケンスを前記生成することは、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の距離に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを生成することを備える請求項1に記載の音声信号を処理する方法。
- スペクトル傾斜値の前記シーケンスのうちの対応する1つを前記生成することは、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の前記距離がしきい値未満である場合に、前記スペクトル傾斜値をスペクトル傾斜値の前記シーケンスのうちの以前の1つに設定することを備える請求項20に記載の音声信号を処理する方法。
- スペクトル傾斜値のシーケンスを前記生成することは、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記非アクティブフレームの符号化利得の尺度に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを計算することを備える請求項1に記載の音声信号を処理する方法。
- スペクトル傾斜値のシーケンスを前記生成することは、スペクトル傾斜値の前記シーケンスのうちの少なくとも1つの各々について、前記スペクトル傾斜値を、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、スペクトル傾斜値の前記シーケンスのうちの以前の1つに設定することを備える請求項1に記載の音声信号を処理する方法。
- コンピュータ可読媒体を備えるコンピュータプログラム製品であって、前記媒体は、
少なくとも1つのコンピュータに、音声信号の複数の非アクティブフレームに基づくスペクトル傾斜値のシーケンスを生成させるためのコードと、
少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンスの少なくとも2つの値の間の変化を計算させるためのコードと、
少なくとも1つのコンピュータに、前記複数の非アクティブフレームのうちの1つの非アクティブフレームについて、前記計算された変化に基づいて、前記フレームの記述を伝送すべきかどうかを決定させるためのコードと、を備えるコンピュータプログラム製品。 - 少なくとも1つのコンピュータにスペクトル傾斜値のシーケンスを生成させるための前記コードは、前記少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンス内の別のスペクトル傾斜値の少なくとも1つに基づいて、複数の前記スペクトル傾斜値の各々を生成させるように構成される請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータに変化を計算させるための前記コードは、前記少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンス内の連続する値の間の差異に基づいて、前記変化を計算させるように構成される請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータに前記フレームの記述を伝送すべきかどうかを決定させるための前記コードは、前記少なくとも1つのコンピュータに、(A)前記計算された変化の絶対値、および(B)しきい値の関係に基づいて、前記フレームの記述を伝送すべきかどうかを決定させるように構成される請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータに前記フレームの記述を伝送すべきかどうかを決定させるための前記コードは、前記少なくとも1つのコンピュータに、しきい値を超える符号化利得の尺度の変化に応じて、前記フレームの記述を伝送しないと決定させるためのコードを含む請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータに変化を計算させるための前記コードは、前記少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンス内の複数の前記スペクトル傾斜値の各々について、前記スペクトル傾斜値とスペクトル傾斜値の前記シーケンス内の少なくとも1つの別のスペクトル傾斜値の間の変化を計算させるように構成され、
少なくとも1つのコンピュータに前記フレームの記述を伝送すべきかどうかを決定させるための前記コードは、前記少なくとも1つのコンピュータに、前記音声信号の別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかを決定させるように構成され、
少なくとも1つのコンピュータに前記フレームの記述を伝送すべきかどうかを決定させるための前記コードは、前記別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかの前記決定が前記計算された変化の少なくとも1つに基づくように構成される請求項24に記載のコンピュータプログラム製品。 - 少なくとも1つのコンピュータにスペクトル傾斜値のシーケンスを生成させるための前記コードは、前記少なくとも1つのコンピュータに、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の距離に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを生成させるためのコードを備える請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータにスペクトル傾斜値のシーケンスを生成させるための前記コードは、前記少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンスのうちの少なくとも1つの各々について、前記スペクトル傾斜値を、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、スペクトル傾斜値の前記シーケンスのうちの以前の1つに設定させるように構成される請求項24に記載のコンピュータプログラム製品。
- 少なくとも1つのコンピュータにスペクトル傾斜値のシーケンスを生成させるための前記コードは、前記少なくとも1つのコンピュータに、スペクトル傾斜値の前記シーケンスを生成するためにスペクトル傾斜値の別のシーケンスを平滑化させるように構成され、
前記別のシーケンスの前記スペクトル傾斜値の各々は、前記複数の非アクティブフレームのうちの対応する1つのスペクトル傾斜を指示する請求項24に記載のコンピュータプログラム製品。 - 音声信号を処理する装置であって、前記装置は、
前記音声信号の複数の非アクティブフレームに基づくスペクトル傾斜値のシーケンスを生成するように構成されたシーケンス発生器と、
スペクトル傾斜値の前記シーケンスの少なくとも2つの値の間の変化を計算するように構成された計算器と、
前記複数の非アクティブフレームのうちの1つの非アクティブフレームについて、前記計算された変化に基づいて、前記フレームの記述を伝送すべきかどうかを決定するように構成された比較器と、を備える装置。 - 前記比較器は、(A)前記計算された変化の絶対値と(B)しきい値との間の関係に基づいて前記フレームの記述を伝送すべきかどうかを決定するように構成される請求項33に記載の音声信号を処理する装置。
- 前記装置は、前記シーケンス発生器、前記計算器、および前記比較器を含む無線通信のためのデバイスを備え、
前記デバイスは、前記比較器による前記フレームの記述を伝送する決定に応じて、スペクトル包絡線記述およびエネルギー包絡線記述のうちの少なくとも1つを含む無音記述を伝送するように構成される請求項33に記載の音声信号を処理する装置。 - 前記比較器は、しきい値を超える符号化利得の尺度の変化に応じて、前記フレームの記述を伝送しないと決定するように構成される請求項33に記載の音声信号を処理する装置。
- 前記計算器は、スペクトル傾斜値の前記シーケンス内の複数の前記スペクトル傾斜値の各々について、前記スペクトル傾斜値とスペクトル傾斜値の前記シーケンス内の少なくとも1つの他のスペクトル傾斜値との間の変化を計算するように構成され、
前記比較器は、前記音声信号の別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかを決定するように構成され、
前記比較器は、前記別の複数の非アクティブフレームの各々について、前記フレームの記述を伝送すべきかどうかの前記決定が前記計算された変化のうちの少なくとも1つに基づくように構成される請求項33に記載の音声信号を処理する装置。 - 前記シーケンス発生器は、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の距離に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを生成するように構成される請求項33に記載の音声信号を処理する装置。
- 前記シーケンス発生器は、スペクトル傾斜値の前記シーケンスのうちの少なくとも1つの各々について、前記スペクトル傾斜値を、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、スペクトル傾斜値の前記シーケンスのうちの以前の1つに設定するように構成される請求項33に記載の音声信号を処理する装置。
- 前記シーケンス発生器は、スペクトル傾斜値の別のシーケンスを平滑化することによりスペクトル傾斜値の前記シーケンスを生成するように構成され、
前記別のシーケンスの前記スペクトル傾斜値の各々は、前記複数の非アクティブフレームのうちの対応する1つのスペクトル傾斜を指示する請求項33に記載の音声信号を処理する装置。 - 音声信号を処理する装置であって、前記装置は、
前記音声信号の複数の非アクティブフレームに基づくスペクトル傾斜値のシーケンスを生成するための手段と、
スペクトル傾斜値の前記シーケンスの少なくとも2つの値の間の変化を計算するための手段と、
前記複数の非アクティブフレームのうちの1つの非アクティブフレームについて、前記計算された変化に基づいて、前記フレームの記述を伝送すべきかどうかを決定するための手段と、を備える装置。 - 前記装置は、前記フレームの記述を伝送すべきかどうかを決定するための前記手段による決定に応じて、スペクトル包絡線記述およびエネルギー包絡線記述のうちの少なくとも1つを含む無音記述を伝送するための手段を備える請求項41に記載の音声信号を処理する装置。
- スペクトル傾斜値のシーケンスを生成するための前記手段は、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の距離に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを生成するように構成される請求項41に記載の音声信号を処理する装置。
- スペクトル傾斜値のシーケンスを生成するための前記手段は、スペクトル傾斜値の前記シーケンスのうちの少なくとも1つの各々について、前記スペクトル傾斜値を、符号化利得の尺度の変化がしきい値を超えると検出することに応じて、スペクトル傾斜値の前記シーケンスのうちの以前の1つに設定するように構成される請求項41に記載の音声信号を処理する装置。
- スペクトル傾斜値のシーケンスを生成するための前記手段は、スペクトル傾斜値の別のシーケンスを平滑化することによりスペクトル傾斜値の前記シーケンスを生成するように構成され、
前記別のシーケンスの前記スペクトル傾斜値の各々は、前記複数の非アクティブフレームのうちの対応する1つのスペクトル傾斜を指示する請求項41に記載の音声信号を処理する装置。 - 音声信号を処理する方法であって、前記方法は、
前記音声信号の複数の非アクティブフレームに基づくスペクトル傾斜値のシーケンスを生成することと、
スペクトル傾斜値の前記シーケンスの少なくとも2つの値の間の変化を計算することと、
前記複数の非アクティブフレームのうちの1つの非アクティブフレームについて、前記フレームの記述を伝送すべきかどうかを決定することと、を備え、
前記フレームの記述を伝送すべきかどうかを前記決定することは、前記計算された変化に基づき、
スペクトル傾斜値のシーケンスを前記生成することは、前記複数の非アクティブフレームのうちの少なくとも一部の各々について、前記音声信号の前記非アクティブフレームと先行のアクティブフレームとの間の時間の距離に従って、スペクトル傾斜値の前記シーケンスのうちの対応する1つを生成することを備える方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83468906P | 2006-07-31 | 2006-07-31 | |
US60/834,689 | 2006-07-31 | ||
US11/830,548 | 2007-07-30 | ||
US11/830,548 US8725499B2 (en) | 2006-07-31 | 2007-07-30 | Systems, methods, and apparatus for signal change detection |
PCT/US2007/074895 WO2008016942A2 (en) | 2006-07-31 | 2007-07-31 | Systems, methods, and apparatus for signal change detection |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009545779A true JP2009545779A (ja) | 2009-12-24 |
JP4995913B2 JP4995913B2 (ja) | 2012-08-08 |
Family
ID=38812761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009523024A Active JP4995913B2 (ja) | 2006-07-31 | 2007-07-31 | 信号変化検出のためのシステム、方法、および装置 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8725499B2 (ja) |
EP (1) | EP2047457B1 (ja) |
JP (1) | JP4995913B2 (ja) |
KR (1) | KR101060533B1 (ja) |
BR (1) | BRPI0715063B1 (ja) |
CA (1) | CA2657420C (ja) |
ES (1) | ES2733099T3 (ja) |
HU (1) | HUE042959T2 (ja) |
RU (1) | RU2417456C2 (ja) |
WO (1) | WO2008016942A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017062512A (ja) * | 2011-12-30 | 2017-03-30 | 華為技術有限公司Huawei Technologies Co.,Ltd. | オーディオ・データを処理するための方法、装置、及びシステム |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8032359B2 (en) | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
EP2153439B1 (en) * | 2007-02-21 | 2018-01-17 | Telefonaktiebolaget LM Ericsson (publ) | Double talk detector |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
DE102008009718A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
US8463603B2 (en) * | 2008-09-06 | 2013-06-11 | Huawei Technologies Co., Ltd. | Spectral envelope coding of energy attack signal |
WO2010044713A1 (en) * | 2008-10-16 | 2010-04-22 | Telefonaktiebolaget L M Ericsson (Publ) | Apparatus and method of controlling sporadic transmissions of silence insertion descriptor (sid) |
CN102804260B (zh) * | 2009-06-19 | 2014-10-08 | 富士通株式会社 | 声音信号处理装置以及声音信号处理方法 |
JP5870476B2 (ja) * | 2010-08-04 | 2016-03-01 | 富士通株式会社 | 雑音推定装置、雑音推定方法および雑音推定プログラム |
CN103325386B (zh) | 2012-03-23 | 2016-12-21 | 杜比实验室特许公司 | 用于信号传输控制的方法和系统 |
PT2951819T (pt) * | 2013-01-29 | 2017-06-06 | Fraunhofer Ges Forschung | Aparelho, método e meio computacional para sintetizar um sinal de áudio |
MY180912A (en) * | 2013-01-29 | 2020-12-11 | Fraunhofer Ges Forschung | Noise filling without side information for celp-like coders |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
US9179404B2 (en) | 2013-03-25 | 2015-11-03 | Qualcomm Incorporated | Method and apparatus for UE-only discontinuous-TX smart blanking |
US9263061B2 (en) * | 2013-05-21 | 2016-02-16 | Google Inc. | Detection of chopped speech |
CN106169297B (zh) | 2013-05-30 | 2019-04-19 | 华为技术有限公司 | 信号编码方法及设备 |
US9570093B2 (en) | 2013-09-09 | 2017-02-14 | Huawei Technologies Co., Ltd. | Unvoiced/voiced decision for speech processing |
US9479272B2 (en) | 2014-05-14 | 2016-10-25 | Samsung Electronics Co., Ltd | Method and apparatus for processing a transmission signal in communication system |
CN106533391A (zh) * | 2016-11-16 | 2017-03-22 | 上海艾为电子技术股份有限公司 | 无限冲激响应滤波器及其控制方法 |
EP3382704A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal |
EP3815082B1 (en) | 2018-06-28 | 2023-08-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive comfort noise parameter determination |
WO2020146870A1 (en) * | 2019-01-13 | 2020-07-16 | Huawei Technologies Co., Ltd. | High resolution audio coding |
CN117436712B (zh) * | 2023-12-21 | 2024-04-12 | 山东铁鹰建设工程有限公司 | 一种施工挂篮运行风险实时监测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999044191A1 (en) * | 1998-02-27 | 1999-09-02 | At & T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
JP2002237785A (ja) * | 2000-10-31 | 2002-08-23 | Telogy Networks Inc | 人間の聴覚補償によりsidフレームを検出する方法 |
JP2006502427A (ja) * | 2002-10-11 | 2006-01-19 | ノキア コーポレイション | 適応マルチレート広帯域(amr−wb)コーデックとマルチモード可変ビットレート広帯域(vmr−wb)コーデック間における相互運用方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5511073A (en) | 1990-06-25 | 1996-04-23 | Qualcomm Incorporated | Method and apparatus for the formatting of data for transmission |
US5341456A (en) * | 1992-12-02 | 1994-08-23 | Qualcomm Incorporated | Method for determining speech encoding rate in a variable rate vocoder |
US5704003A (en) | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
JPH09152894A (ja) * | 1995-11-30 | 1997-06-10 | Denso Corp | 有音無音判別器 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6415252B1 (en) * | 1998-05-28 | 2002-07-02 | Motorola, Inc. | Method and apparatus for coding and decoding speech |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
WO2000030075A1 (en) | 1998-11-13 | 2000-05-25 | Qualcomm Incorporated | Closed-loop variable-rate multimode predictive speech coder |
US6691084B2 (en) | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6330532B1 (en) | 1999-07-19 | 2001-12-11 | Qualcomm Incorporated | Method and apparatus for maintaining a target bit rate in a speech coder |
US6687668B2 (en) * | 1999-12-31 | 2004-02-03 | C & S Technology Co., Ltd. | Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
US7013269B1 (en) * | 2001-02-13 | 2006-03-14 | Hughes Electronics Corporation | Voicing measure for a speech CODEC system |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US20040098255A1 (en) | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
KR20050049103A (ko) | 2003-11-21 | 2005-05-25 | 삼성전자주식회사 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
US8102872B2 (en) | 2005-02-01 | 2012-01-24 | Qualcomm Incorporated | Method for discontinuous transmission and accurate reproduction of background noise information |
US7231348B1 (en) * | 2005-03-24 | 2007-06-12 | Mindspeed Technologies, Inc. | Tone detection algorithm for a voice activity detector |
NZ562188A (en) | 2005-04-01 | 2010-05-28 | Qualcomm Inc | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
US8892448B2 (en) | 2005-04-22 | 2014-11-18 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor smoothing |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
-
2007
- 2007-07-30 US US11/830,548 patent/US8725499B2/en active Active
- 2007-07-31 CA CA2657420A patent/CA2657420C/en active Active
- 2007-07-31 HU HUE07813616A patent/HUE042959T2/hu unknown
- 2007-07-31 WO PCT/US2007/074895 patent/WO2008016942A2/en active Application Filing
- 2007-07-31 KR KR1020097001886A patent/KR101060533B1/ko active IP Right Grant
- 2007-07-31 JP JP2009523024A patent/JP4995913B2/ja active Active
- 2007-07-31 BR BRPI0715063A patent/BRPI0715063B1/pt active IP Right Grant
- 2007-07-31 RU RU2009107181/09A patent/RU2417456C2/ru active
- 2007-07-31 ES ES07813616T patent/ES2733099T3/es active Active
- 2007-07-31 EP EP07813616.5A patent/EP2047457B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999044191A1 (en) * | 1998-02-27 | 1999-09-02 | At & T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
JP2002237785A (ja) * | 2000-10-31 | 2002-08-23 | Telogy Networks Inc | 人間の聴覚補償によりsidフレームを検出する方法 |
JP2006502427A (ja) * | 2002-10-11 | 2006-01-19 | ノキア コーポレイション | 適応マルチレート広帯域(amr−wb)コーデックとマルチモード可変ビットレート広帯域(vmr−wb)コーデック間における相互運用方法 |
JP2006502426A (ja) * | 2002-10-11 | 2006-01-19 | ノキア コーポレイション | ソース制御された可変ビットレート広帯域音声の符号化方法および装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017062512A (ja) * | 2011-12-30 | 2017-03-30 | 華為技術有限公司Huawei Technologies Co.,Ltd. | オーディオ・データを処理するための方法、装置、及びシステム |
US10529345B2 (en) | 2011-12-30 | 2020-01-07 | Huawei Technologies Co., Ltd. | Method, apparatus, and system for processing audio data |
US11183197B2 (en) | 2011-12-30 | 2021-11-23 | Huawei Technologies Co., Ltd. | Method, apparatus, and system for processing audio data |
US11727946B2 (en) | 2011-12-30 | 2023-08-15 | Huawei Technologies Co., Ltd. | Method, apparatus, and system for processing audio data |
Also Published As
Publication number | Publication date |
---|---|
US8725499B2 (en) | 2014-05-13 |
KR20090033461A (ko) | 2009-04-03 |
EP2047457B1 (en) | 2019-03-27 |
WO2008016942A3 (en) | 2008-04-10 |
JP4995913B2 (ja) | 2012-08-08 |
RU2009107181A (ru) | 2010-09-10 |
CA2657420A1 (en) | 2008-02-07 |
WO2008016942A2 (en) | 2008-02-07 |
ES2733099T3 (es) | 2019-11-27 |
RU2417456C2 (ru) | 2011-04-27 |
BRPI0715063B1 (pt) | 2019-12-24 |
BRPI0715063A2 (pt) | 2013-05-28 |
EP2047457A2 (en) | 2009-04-15 |
HUE042959T2 (hu) | 2019-07-29 |
KR101060533B1 (ko) | 2011-08-30 |
CA2657420C (en) | 2015-12-15 |
US20080027716A1 (en) | 2008-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4995913B2 (ja) | 信号変化検出のためのシステム、方法、および装置 | |
KR101092167B1 (ko) | 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩 | |
KR100986957B1 (ko) | 토널 컴포넌트들을 감지하는 시스템들, 방법들, 및 장치들 | |
JP5265553B2 (ja) | フレーム消去回復のシステム、方法、および装置 | |
US8990074B2 (en) | Noise-robust speech coding mode classification | |
KR101034453B1 (ko) | 비활성 프레임들의 광대역 인코딩 및 디코딩을 위한 시스템, 방법, 및 장치 | |
TWI467979B (zh) | 用於信號改變偵測之系統、方法及裝置 | |
KR20160045917A (ko) | 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치 | |
AU2013377884B2 (en) | Systems and methods of performing gain control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111101 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111109 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111201 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111208 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120104 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120510 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150518 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4995913 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |