JPH07509792A - 定常信号と非定常信号との識別 - Google Patents
定常信号と非定常信号との識別Info
- Publication number
- JPH07509792A JPH07509792A JP7500526A JP50052695A JPH07509792A JP H07509792 A JPH07509792 A JP H07509792A JP 7500526 A JP7500526 A JP 7500526A JP 50052695 A JP50052695 A JP 50052695A JP H07509792 A JPH07509792 A JP H07509792A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- energy
- stationary
- estimated
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 49
- 239000000872 buffer Substances 0.000 claims description 37
- 230000008859 change Effects 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 6
- 238000012360 testing method Methods 0.000 description 19
- 230000005284 excitation Effects 0.000 description 14
- 210000003127 knee Anatomy 0.000 description 10
- 239000003607 modifier Substances 0.000 description 10
- 238000012986 modification Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 8
- 206010019133 Hangover Diseases 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 241000307676 Diploprion bifasciatum Species 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 1
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 240000006413 Prunus persica var. persica Species 0.000 description 1
- 241001237745 Salamis Species 0.000 description 1
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 235000015175 salami Nutrition 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 235000021419 vinegar Nutrition 0.000 description 1
- 239000000052 vinegar Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Complex Calculations (AREA)
- Circuits Of Receivers In General (AREA)
- Radar Systems Or Details Thereof (AREA)
- Inspection Of Paper Currency And Valuable Securities (AREA)
- Transmission And Conversion Of Sensor Element Output (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
定常信号と非定常信号との識別
技術分野
本発明は、定常信号と非定常信号との1111方法に関する。この方法は、例え
ば、移動無線通信システムにおいて黄帝を表す信号が、定常であるか否かを検出
するために用いられつる。本発明はまた、定常背量を検出し、かつエンコード/
デコードするために、この方法を用いる方法および装置に関する。
発明の背景
多くの現代の音声コーグは、LPC(線型予測コーグ)として知られる音声コー
グの大きい部類に属する。この部類に属するコーグの例には、米国国防省による
4、8Kbit/5CELPコーダ、欧州ディジタル・セルラ移動電話システム
GSM(7)RPE−LTP:I−ダ、対応する米国システムADC(7)VS
ELPコーダ、およびパシフィック・ディジクル・セルラ・システムPDCのV
SELPコーダがある。
これらのコーグは全て、信号発生プロセスにおいて信号源−フィルタ概念を用い
ている。フィルタは、再生されるべき信号の短時間スペクトルをモデル化するた
めに用いられ、一方、信号源は、全ての他の信号変化を操作するものと仮定され
る。
これらの信号源−フィルタ・モデルの共通の特徴は、再生されるべき信号が、信
号源の出力信号を定めるパラメータと、フィルタを定めるフィルタパラメータと
によって表されることである。「線型予測」という用語は、フィルタパラメータ
を推定するために一般的に用いられる方法に関するものである。すなわち、再生
されるべき信号は、フィルタパラメータの組によって部分的に表される。
信号モデルとして信号源−フィルタの組合せを用いる方法は、音声信号に対し比
較的に良く働くことが立証された。しかし、移動電話の使用者が沈黙していて、
入力信号が周囲音を含む時、現在公知のコーグがこの状況に対処するのは困難で
ある。そのわけは、それらは音声信号に対して最適化されているからである。通
信リンクの他の側にいる聴取者は、聞きなれた黄帝がコーグにより「誤処理」さ
れたために認識されえない時、当惑しやすい。
ここで参照して、その内容を本明細書に取込む、スウェーデン国特許出願第93
00290−5号によれば、この問題は、コーグが受信した信号内の黄帝の存
在を検出し、もし信号が黄帝によって支配されていれば、ある、いわゆるアンチ
スワール・アルゴリズム(anti−swirling algorithm)
によりフィルタパラメータの計算を修正することによって解決される。
しかし、異なる黄帝は同じ統計的特徴番もたないことが判明した。自動車の雑音
のような、1つの形式の黄帝は、定常であるとして特徴づけられうる。バックグ
ラウンドバブルのような、もう1つの形式のものは、非定常であるとして特徴づ
けられうる。実験は、上述のアンチスワール・アルゴリズムが、定常背量に対し
ては良く働くが、非定常背合に対しては良く働かないことを示した。従って、定
常背量と非定常背合とを識別して、もし黄帝が非定常なものならばアンチスワー
ル・アルゴリズムをバイパスしうるようにすることが望ましい。
発明の要約
従って、本発明は、移動無線通信システムにおける黄帝を表す信号などの、定常
信号と非定常信号とを識別する方法を提供することを目的とする。
本発明によれば、この方法は、
(a)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサブ
ウィンドウT1のそれぞれにおける信号の統計的モーメントの1つを推定するス
テップと、
(b)ステップ(a)において前記信号の定常性の手段として得られた前記推定
値の変化を推定するステップと、
(C)ステップ(b)において得られた前記推定された変化が所定の定常性限度
γを超えているか否かを決定するステップと、を特徴とする。
本発明のもう工つの目的は、フィルタに接続された信号源を含む、ディジタルフ
レームに基づく音声エンコーダおよび/またはデコーダにおいて、定常背量を検
出し、かつエンコードおよび/またはデコードする方法であって、前記フィルタ
が、エンコードおよび/またはデコードされるべき信号を再生するための、それ
ぞれのフレームに対するフィルタパラメータの組によって定められる、前記方法
を提供することである。
本発明によれば、この方法は、
(a)前記エンコーダ/デコーダへ送られた信号が、主として音声または黄帝の
いずれを表しているかを検出するステップと、(b)前記エンコーダ/デコーダ
へ送られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否
かを検出するステップと、(c)前記信号が定常である時、連続するフレーム間
の時間的変化および/または前記組内の少なくともあるフィルタパラメータの領
域を制限するステップと、を含む。
本発明のもう1つの目的は、フィルタに接続された信号源を含む、ディジタルフ
レームに基づく音声コーグおよび/またはデコーダにおいて、定常背量をエンコ
ードおよび/またはデコードする装置であって、前記フィルタが、エンコードお
よび/またはデコードされるべき信号を再生するための、それぞれのフレームに
対するフィルタパラメータの組によって定められる、前記装置を提供することで
ある。
本発明によれば、この装置は、
(a)前記エンコーダ/デコーダへ送られた信号が、主として音声または黄帝の
いずれを表しているかを検出する手段と、(b)前記エンコーダ/デコーダへ送
られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否かを
検出する手段と、(C)前記エンコーダ/デコーダへ送られた前記信号が定常背
量を表す時、連続するフレーム間の時間的変化および/または前記組内の少なく
ともあるフィルタパラメータの領域を制限する手段と、図面の簡単な説明
本発明、および本発明の他の諸口的および諸利点は、添付図面と共に以下の説明
を参照することにより最も良く理解されつる。添付図面において、第1図は、本
発明の方法を行う手段を備えた音声エンコーダのブロック図であり、
第2図は、本発明の方法を行う手段を倫えた音声デコーダのブロック図であり、
第3図は、第1図の音声エンコーダ内に用いられうる信号識別器のブロック図で
あり、
゛ 第4図は、第1図の音声エンコーダ内に用いられつる好ましい信号識別器の
ブロック図である。
実施例の詳細な説明
本発明は、定常信号と非定常信号とを識別するために一般的に用いられうるが、
以下においては本発明を、移動無線通信システムにおける黄帝を表す信号の定常
性の検出に関して説明する。
第1図の音声コーグを参照すると、入力線lO上において入力信号s (n)が
フィルタ推定器12へ送られ、フィルタ推定器12は標準化されたプロシージャ
によりフィルタパラメータを推定する(レビンソンーダービン(Levinso
n−Durbin)アルゴリズム、バーブ(Burg)アルゴリズム、コレスキ
ー(Cholesky)分解(1978年、プレンティス−ホール(Prent
ice−Hal l)発行、ラビナー(Rabiner)、シエイフ7 (Sc
hafer)著、「音声信号のディジタル処理(Digi talProces
sing of 5peech Signals) J 、第8章)、ジュール
(Schur)アルゴリズム(1991年1月、アイイーイーイー・エスピー−
マガジン(IEEE SP Magazine)、第12頁ないし第36頁に所
載の、ストロバッハ(Sけobach)著、「レビンソンおよびジュールのアル
ゴリズムの新形式(New Form of Levinson and Sc
hurAlgorithns) 」) 、ル・ルーーゲゲン(Le Roux−
Gueguen)アルゴリズム(1977年、アイイーイーイー・トランザクシ
ョンズ・オブ・アカウスティクス(+[+BETransactions of
Acoustics入音声および信号処理(Speech and Sign
alProcessing) J 、第ASSP−26巻、第3号、第257頁
ないし第259頁に所載の、ル・ルー(Le Roux)、ゲーゲン(Gueg
uen)著r部分相関係数の固定点計算(A Fixed Po1nt Com
putation of Partial Correlation Coef
ficientsjJ )、
モトローラ社(MoLorola Inc、)を権利者とする米国特許第4 5
44 919号に説明されている、いわゆるFLATアルゴリズム)。フィルタ
推定器12は、それぞれのフレームに対するフィルタパラメータを出力する。こ
れらのフィルタパラメータは励振解析器14へ送られ、励振解析器14はまた線
10上の入力信号をも受ける。励振解析器14は、標準的プロシージャにより最
良の信号源または励振パラメータを決定する。そのようなプロシージャの例には
、VSELP(1991年、クルワー・アカデミツク・パブリッシャーズ(Kl
uwer AcademicPubl 1shers)発行、アタル(ALal
)外編、「音声コーディングにおける進歩(Advances in 5pee
ch Coding)J 、第69頁ないじ第79頁に所載の、ジャーリン(G
erson) 、ジャンラフQasiuk)著[ベクトル和により励振される線
形予測(Vector Su+++ Excited Linear Pred
iction) (VS EL P) J ) 、TB P E i前
記参照文献の第145頁ないし第156頁に所載の、サラミ(Salami)著
「2進パルス励振:低複雑性CELPコーディングへの新しいアプローチ(Bi
naryPulse Excitation : A Novel Appro
ach to Low Complexity C[!LP Cod奄獅■jJ
)、
確率コードブック(前記参照文献の第121頁ないし第134頁に所載の、カン
ブベル(Campbe l I )外著、rDoD4.8KBPS規格(提案合
衆国規格1016) (The DoD4. 8KBPS 5tandard
(Proposed Federal 5tandard 1 016)’I
J )、ACELP (1987年、音響、音声および信号処理に関する国際会
議会報(Proc、 International Conference o
n Acoustics、 5peech andSignal Proces
sing 1987 ) 、第1953頁ないし第1956頁に所載の、アダウ
ル(Adoul)、ランプリン(Lamblin)著、[音声のCELP:l−
ディングのためのある代数的構造の比較(A Comparison of S
ome Algeblaic 5tructure forCELP Codi
ng of 5peech)J )がある。これらの励振パラメータ、フィルタ
パラメータ、および線lO上の入力信号は、音声検出器16へ送られる。この検
出器16は、入力信号が、主として音声または黄帝のいずれを含むかを決定する
。可能な検出器は、例えば、GSMシステムにおいて定められた音声活動検出器
(音声活動検出(Voise Activity Detection) 、0
3M勧告06.32、ETSI/PT 12)である。適切な検出器は、EP、
A、335 521 (ブリティシュ・テレコム・ピーエルンー(BRITIS
)I 置EC0M PLC))に説明されている。検出器16は、コーグの入力
信号が主として音声を含むか否かを示す出力信号S/Bを発生する。この出力信
号は信号推定器24を経て、フィルタパラメータと共にパラメータ修正器18へ
送られる。
上述のスウェーデン国特許出願によれば、パラメータ修正器18は、エンコーダ
への入力信号内に音声信号が存在しない場合に、決定されたフィルタパラメータ
を修正する。もし音声信号が存在すれば、フィルタパラメータは、変更なくパラ
メータ修正器工8を通過する。ことによると変更されたフィルタパラメータおよ
び励振パラメータが、チャネルコーグ20へ送られ、チャネルコーグ20は、線
22上のチャネルを経て送られるビット流を発生する。
パラメータ修正器18によるパラメータ修正は、いくつかの方法で行われつる。
1つの可能な修正は、フィルタの帯域幅拡大である。これは、フィルタの極が複
素平面の原点に向かって移動せしめられることを意味する。原フィルタH(z)
−1/A (z)は、次式によって与えられるものと仮定する。
極が、因子r、0≦r≦l、により移動せしめられる時は、帯域幅の拡大バージ
ョンは、A(z/r)、すなわち、
により定められる。
もう1つの可能な修正は、時間領域におけるフィルタパラメータの低域フィルタ
リングである。すなわち、フレームからフレームへのフィルタパラメータの速い
変化を、該パラメータの少なくともあるものを低域フィルタリングすることによ
り減衰せしめる。この方法の特殊な場合は、いくつかのフレーム、例えば4ない
し5フレームにおいて、フィルタパラメータを平均する。
パラメータ修正器18はまた、これらの2方法の組合せを用い、例えば、帯域幅
の拡大に続いて低域フィルタリングを行うこともできる。また、低域フィルタリ
ングから始め、次に帯域幅の拡大を追加することもできる。
以上の説明においては、信号識別器24を無視した。しかし、上述のように、黄
帝は同じ統計的特徴をもつとは限らないので、信号を、音声を表す信号と、黄帝
を表す信号とに分割するのでは不十分であることが判明した。従って、黄帝を表
す信号を、第3図および第4図に関連してさらに後述するように、信号識別器2
4において定常信号と非定常信号とに分割する。従って、信号識別器24から線
26上への出力信号は、コーディングされるべきフレームが、定常背量または音
声/非定常背量のいずれを含むかを示し、前者を含む場合はパラメータ修正器1
8が上述のパラメータ修正を行い、後者を含む場合は修正を行わない。
以上の説明においては、パラメータ修正は送信機内のコーグにおいて行われるも
のと仮定した。しかし、同様のプロシージャは受信機のデコーダにおいても行わ
れうろことを認識すべきである。これは、第2図の実施例により示されている。
第2図において、チャネルからのビット流は、入力線30上に受信される。この
ビット流は、チャネルデコーダ32によりデコードされる。チャネルデコーダ3
2は、フィルタパラメータおよび励振パラメータを出力する。この場合、これら
のパラメータは、送信機のコーグにおいて修正されていないものと仮定する。
フィルタパラメータおよび励振パラメータは音声検出器34へ送られ、音声検出
器34は、これらのパラメータを解析して、これらのパラメータにより再生され
るへき信号が、音声信号を含むか否かを決定する。音声検出器34の出力信号S
/Bは、信号識別器24′を経て、パラメータ修正器36へ送られ、パラメータ
修正器36はさらにフィルタパラメータをも受ける。
上述のスウェーデン国特許出願によれば、もし音声検出器34が、受けた信号内
に音声信号が存在しないことを決定すれば、パラメータ修正器36は、第2図の
パラメータ修正器18が行う修正と同様の修正を行う。もし音声信号が存在すれ
ば、修正は行われない。ことによると修正されたフィルタパラメータおよび励振
パラメータが音声デコーダ38へ送られ、音声デコーダ38は、線40上へ合成
出力信号を発生する。音声デコーダ38は、励振パラメータを用いて上述の信号
源信号を発生し、またことによると修正されたフィルタパラメータを用いて信号
源−フィルタモデルにおけるフィルタを定める。
第1図のコーグにおけると同様に、信号識別器24′は、定常背合と非定常背合
とを識別する。このようにして、定常背合を含むフレームのみが、パラメータ修
正器36を作動させる。しかし、この場合、信号識別器24“は、音声信号5(
n)に対するアクセスはもたず、その信号を定める励振パラメータに対してのみ
アクセスを有する。識別プロセスは、第3図および第4図に関連してさらに後述
される。
第3図は、第1図の信号識別器24のブロック図を示す。識別器24は、入力信
号s (n)と、音声検出器16からの出力信号S/Bと、を受ける。信号S/
BはスイッチSWへ送られる。もし音声検出器16が、信号s (n)が主とし
て音声を含むことを決定すれば、スイッチSWは上部位置をとり、その場合、信
号S/Bは識別器24の出力へ直接送られる。
もし信号s (n)が主として背合を含めば、スイッチSWは下部位置をとり、
信号S/Bおよびs (n)は共に計算器手段50へ送られ、計算器手段5oは
、それぞれのフレームのエネルギーE (T、 )を推定する。ここでT1は、
フレームlの時間の長さを示しうる。しかし、実施例においては、T1は2つの
連続するフレームのサンプルを含み、E (T、 )はこれらのフレームの全エ
ネルギーを示す。この実施例においては、次のウィンドウTI+1は1音声フレ
ームシフトされて、それが1つの新しいフレームと、前ウィンドウT、からの1
つのフレームとを含むようにされる。従って、これらのウィンドウは、lフレー
ム重なり合うことになる。前記エネルギーは、例えば次式により推定されつる。
ただし、s (n) =s (t、 )である。
エネルギーの推定値E (T、 )は、バッファ52内に記憶される。このバッ
ファは、例えば、100ないし200フレームからの100ないし200エネル
ギー推定値を含有しうる。新しい推定値がバッファ52に入ると、最も古い推定
値はバッファから削除される。従って、バッファ52は、Nをバッファのサイズ
とすると、常に最後のN個のエネルギー推定値を含む。
次に、バッファ52のエネルギー推定値は計算器手段54へ送られ、計算器手段
54は次式によって試験変数■7を計算する。
ただし、Tは、全ての(ことによると重なり合っている)タイムウィンドウT1
の累算された時間の長さである。Tは通常、例えば100ないし200音声フレ
ームまたは2ないし4秒の、固定された長さを有する。言葉で表現すれば、vT
は、期間T内における最大エネルギー推定値を、同じ期間内における最小エネル
ギー推定値で割ったものである。この試験変数■1は、最後のNフレーム内にお
けるエネルギーの変化の推定値である。この推定値は後に、信号の定常性を決定
するのに用いられる。もし信号が定常であれば、そのエネルギーはフレームから
フレームへと極めて僅かしか変化せず、それは試験変数VTが1に近いことを意
味する。非定常信号の場合は、エネルギーはフレームからフレームへとがなり変
化し、それは推定値が1よりかなり大きいことを意味する。
試験変数VTは比較器56へ送られ、そこで試験変数VTは定常性限度γと比較
される。もしvTがγを超えていれば、非定常信号が出力線26上に示される。
これは、フィルタパラメータが修正されるべきでないことを示す。γに対する適
切な値は2ないし5、特に3ないし4であることがわかっている。
以上の説明から、フレームが音声を含むか否かを検出するためには、その特定の
フレームを考慮しさえすればよいことは明らかであり、それは音声検出器16に
おいて行われる。しかし、もしフレームが音声を含まないことが決定されれば、
定常性の識別を行うために、そのフレームの周囲のフレームからのエネルギー推
定値を蓄積することが必要になる。従って、N>2であり通常は100ないし2
00程度であるN個の記憶位置を有するバッファが必要となる。このバッファは
また、それぞれのエネルギー推定値に対するフレーム番号をも記憶しつる。
試験変数V、が試験され終わり、比較器56において決定がなされ終わると、次
のエネルギー推定値が計算器手段50において発生せしめられ、バッファ52内
ヘンフトされて、その後、新しい試験変数V、が計算され、比較器56において
γと比較される。このようにして、タイムウィンドウTは、時間的に1フレーム
前方ヘシフトされる。
以上の説明においては、音声検出器16が背合を含むフレームを検出し終わると
、それは後続のフレーム内における背合の検出を続けて、試験変数■、を形成す
るために十分なエネルギー推定値を、バッファ52内に蓄積するものと仮定した
。しかし、音声検出器16が、背合を含む少数のフレームを検出した後、音声を
含むいくらかのフレームに続いて、新しい背合を含むフレームを検出する場合が
ある。この理由のために、バッファ52は「有効時」においてエネルギー値を記
憶し、これは、背合を含むフレームに対してのみエネルギー値が計算され、記憶
されることを意味する。これはまた、それぞれのエネルギー推定値がなぜ対応す
るフレーム番号と共に記憶されるかの理由でもある。そのわけは、これが、長時
間にわたって背合がなかった時、エネルギー値が関連を有するためには古すぎる
ことを決定する機構を与えるからである。
起こりうるもう1つの場合は、計算されるエネルギー値が少ない、短時間の背合
が存在し、極めて長期間の間に、その外に背合がない時である。この場合、バッ
ファ52は、適度の時間内に有効な試験変数の計算を行うのに十分なエネルギー
値を含まない。このような場合に対する解決法は、タイムアウト限度を整定し、
その後は、定常性の決定のための十分な基礎がないので、背合を含むフレームが
音声として処理されるよ・う4こ定めることである。
さらに、あるフレームが非定常背合を含むことが決定された時、ある場合には定
常性限度γを、例えば3.5から3.3へ低下させて、後のフレームに対する決
定が「定常」と「非定常」との間であちこちにスイッチすることを防止するとよ
い。このようにすると、もし非定常フレームが発見されれば、後続のフレームも
同様に非定常として分類されやすくなる。結局、定常フレームが発見された時は
、定常性限度γは再び増加せしめられる。この技術は、 「ヒステリシス」と呼
ばれる。
もう1つの好ましい技術は「延期(hangover) Jである。延期とは、
信号識別器24によるある決定が最終的なものになるまでに、少なくともある数
のフレーム、例えば、5フレームの間、持続しなくてはならないことを意味する
。好ましくは、 「ヒステリシス」と「延期」とは組合わされる。
以上から、第3図の実施例が、典型的な場合において100ないし200(もし
フレーム番号も記憶されるとすれば200ないし400)メモリ位置を有する、
かなりのサイズのバッファ52を必要とすることは明らかである。このバッファ
は、メモリリソースが極めて少ない信号プロセッサ内に通常存在するので、バッ
ファのサイズを減少させることが望ましい。従って、第4図は、バッファの使用
方法が、バッファ52°を制御するバッファ制御器58によって修正された、信
号識別器24の実施例を示す。
バッファ制御器58の目的は、不必要なエネルギー推定値E (T、 )が記憶
されないように、バッファ52°を管理することである。このアプローチは、最
も極端なエネルギー推定値のみが実際にVTの算出に関連していることの観察に
基づいている。従って、僅かだけの大きい、また僅かだけの小さいエネルギー推
定値のみをバッファ52′内に記憶させれば良い近似になるはずである。従って
、バッファ52゛ を、2つのバッファMAXBUFおよびMINBUFに分割
する。
古いエネルギー推定値は、ある時間の後にバッファから消失しなくてはならない
ので、対応するエネルギー値のフレーム番号もMAXBUFおよびMINBUF
内に記憶する必要がある。バッファ制御器58が行う、バッファ52°内に値を
記憶するための1つの可能なアルゴリズムは、添付されている付録のパスカルプ
ログラムに詳述されている。
第4図の実施例は、第3図の実施例に比較すると、準最適なものである。その理
由は、例えば、大きいフレームエネルギーが、より大きくより古いフレームエネ
ルギーがMAXBUF内に存在する時に、MAXBUFに入りえないからである
。この場合、その特定のフレームエネルギーは、たとえ、それが事実上もっと遅
(なりえたとしても、前の大きい(しかし古い)フレームエネルギーがシフトア
ウトされ終わった時失われる。従って、実際に計算されるのはV工ではなく、次
式のように定義されるV′1である。
しかし実際的な観点からは、この実施例は「十分に良<」、必要なバッファサイ
ズの、100ないし200エネルギー推定値の記憶から、約10推定値(MAX
BUFに対して5、MINBUFに対して5)への激減を可能ならしめる。
第2図の説明に関連して上述したように、信号識別器24゛ は信号s (n)
に対するアクセスをもたない。しかし、フィルタパラメータまたは励振パラメー
タは通常、フレームエネルギーを表すパラメータを含むので、エネルギー推定値
はこのパラメータから得られうる。このようにして、米国規格l5−54により
、フレームエネルギーは励振パラメータr(0)によって表される。(もちろん
、第1図の信号識別器24において、「(0)をエネルギー推定値として用いる
ことも可能である。)もう1つのアプローチは、第2図において、信号識別器2
4゛およびパラメータ修正器36を、音声デコーダ38の右側へ移動させること
である。このようにすれば、信号識別器24゛ は、デコードされた信号を表す
、すなわち第1図の信号s (n)と同じ形式の、信号40に対しアクセスしう
る。
しかし、このアプローチは、パラメータ修正器36の後に、修正された信号を再
生するためのもう1つの音声デコーダを必要とする。
信号識別器24.24°の上述の説明においては、定常性の決定がエネルギーの
計算に基つくものと仮定されていた。しかし、エネルギーは、定常性の決定のた
めに用いられつる異なる次数の統計的モーメントの単なる1つに過ぎない。この
ようにして、(信号のエネルギーまたは分散に対応する)2次のモーメント以外
の統計的モーメントを用いることは、本発明の範囲内にある。定常性のために異
なる次数のいくつかの統計的モーメントを試験すること、および最終的な統計的
決定をこれらの試験の結果に基づかせることもまた可能である。
さらに、定められた試験変数■、のみが可能な試験変数ではない。例えば、もう
1つの試験変数は、次式のように定められうる。
ただし、式<dE (T、)/d t>は、フレームからフレームへのエネルギ
ーの変化速度の推定値を表す。例えば、前式内の推定値を計算するために、例え
ば、線形傾向モデルによって、カルマンフィルタが適用されつる(1988年、
エムアイティー・プレス(MIT Press)発行、エイ・ゲルブ(んGe1
b)著、「応用最適推定(Applied optiml estimtion
) J参照)。しかし、本明細書において前に定義した試験変数VTは、信号識
別器を背量のレベルに感じないようにする、スケール因子に無関係な望ましい特
徴を有する。
明の精神および範囲から逸脱することなく、本発明に対してさまざまな改変およ
び変更を行いうろことを理解しつるはずである。
付録
PROCEDURE FLsCatDet(zpbact : realAcf
VeceorTypei(入力 )ZFLsp : Boolean; (入力
)ZFLnrMinFrames : Ineegeri (入力 )ZFL
nrFrames 、工nee(ier; (入力 )ZFLrraxThre
sh : Real; (入力 )ZFLminThresh : Real;
(入力 )VARZFLpowOld 二Real; (入力l出力)VAR
ZFLnrSaved : Integer; (入力/出力)VARzFLr
IIaxBut : realstaI−BufType; (入力l出力)V
ARzFヒ宸Cime : integerseaeBufType; (入力
/出力)VARZFLminBuf : reals!aeBufType;
(入力/出力)VARZFLminTime : ineegerseaセBu
fTyp!; (入力/出力)VARZFLpralNO5しat : Boo
lean); (入力l出力)VAR
1:工nte9eri
maxinvum、m1ni+wm : Real;powNowルestva
r + Real;o1dNoseaセ : Boolean;replace
’Nr : 工nteq@rjABEL
staeEnd;
BEGIN
oldNost、at ニー ZFLprelNOSeaJZFLprelNo
Sl:ae ニー ZFLsp;XF NOT ZFLsp AND (ZFL
acf[O] > 01 THEN BEGIN(もし音声でなければ)
ZFI、prelNostat ニー True;ZFLnrSaved 二=
ZFLnrSaved + l;powNow ニー ZFLacf[O]
+ ZFLpowOld;ZFLpowOld ニー ZFLaCf[O];工
F ZFLnrSaved < 2 TI(ENGOTO5eat−End;
工F ZFLnrSaved > ZFLnrFrameS THENZFLn
rSaved :m ZFLnrFrames;(最大値バッファ内に古い要素
があるか否かをチェックする)FORi : −ITo stajBuffer
Lengt、h Do BEG工NZFLmaxTime[il :wa ZF
LmaxTime[il + 1;工F ZFLmaxTime[il > Z
FLnrFrames THEN BEG工NZFLmaxBuf[il :I
−pOWNOw;ZFLmaxTime[1] : ! 1rEND。
END;
(最小値バッファ内に古い要素があるか否かをチェックする)FORi ニー
I TC)6しatBufferLength Do BTAINZFLani
nTime[il :x ZFLrainTime[il + l;工F ZF
LminTime[il > ZFLnrFrames THEN BEG工N
ZFLminBuf[il :冨powNow;ZFLminTime[il
:! l;1:ND;
END。
ff1a!imum :m −1E38;n’ll!’limufn :m −
maximum;replacaNr :w= O;
(最大値バッファ内の要素が置換されるべきか否かをチェックし、最大値を見出
す
FORi :m l To sl−atBufferLengeh Do BE
G工N工F powNow >m ZFLmaxBuf[il THENrep
laceNr :m i;
エF ZFL、maxBuf[il )旗 maximum THENmaxi
mum :! ZFLmaxBuf[il ;END。
IF replaceNr > OTHEN BEG工NZFLmaXT1me
[replaCeNrl :lII’L;ZFLmaxBuf[replace
Nrl :w powNow;工F ZFLmaxBuf[replaceNr
l >z maximum THENmaximum :雪 ZFLmaxBu
f[replaceNrl;END。
replaceNr :z O;
(最小値バッファ内の要素が置換されるべきか否かをチェックし、FORi +
−I To stahBufferLengeh Do BEG工N工F p
owNow <w ZFLminBuf[il THENreplacaNr
:x i;
工F ZFIxinBuf[il <m minimum THENminim
um : w ZFLminBuf [il ;END;
工F replacaNr > OTHEN BEGINZFLminTirn
e[replaCeNrl :爾1;ZFLminBuf[replaceNr
l := powNow;工F ZFLminBuf[replaceNrl
)m minimum THENminimum :m ZFLminBuf
[replaceNrl ;END。
工F ZFLnrSaved >w ZFLnrMinFrames THEN
BEGIN工F minimum > l THEN BEG工N(試験変数
を計算する)
しestVar := maximum/minimum;(もし試験変数がm
axThreshより大ならば、音声と決定するもし試験変数がm1nThre
shより小ならば、バブルと決定するもし試験変数が中間のものならば、前決定
を保持するZFL、prelNoseae ニーt oldNosセaLi工F
tesevar > ZFLmaxThresh ’n(ENZFLprel
NoSこat := True;工F testvar < ZFLminTh
resh THENZFLprelNoSLam := False;END。
END;
END、’
5L21jEnd:
DrD;
PROCEDURE FLhangHandler(ZFLmaxFrames
: Integer; (入力 )ZFLhangFrames : 工ne
eger; (入力 )ZFLvad : Boolean; (入力 )VA
RZFLelapsedFrames : 工n仁eger; (入力/出カシ
VARZFLspHangover : 工nteget; (入力/出力)V
ARZFLvac!01cl : Boolean; (入力l出力)VARz
yLsp : Boolean) ; (出力 )EGIN
(音声から無音声への決定の変更をhangFrames個のフレーム数だけ遅
延させる
しかし、もし音声がmaxFrames個より少ないフレームしか持続しなかっ
たら、これを行わない
ZFLsp := ZFLvad;
IF t ZFLelapsedPrames < ZFLmaxFrames
) THENZFLelapsedPrames ニー ZFLelapse
dFrames + l;IF ZFLvadOld AND NOT ZFL
vad rHENZFLspHangOver ニー IHIF (ZFLsp
HangOver < ZFLhangFraxsl AND NOT ZFL
vad THEN BE(JNZFLspHangOver ニー ZFLsp
HangOver + 1;ZFLSp :m Trlle:
END;
IF NOT ZFLvad AND (ZFLelapsedFrames
< ZF−Frames l TKENZFLsp :e ’False;
IF NOT ZFLsp AND (ZFLspHangOver > ZF
LhangFrames−11THENZFLelapsedFrames :
* O;ZFLvadOld ニー ZFLvad;覆の。
Claims (24)
- 1.(a)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイム サブウィンドウTlのそれぞれにおける信号の統計的モーメントの1つを推定す るステップと、 (b)ステップ(a)において前記信号の定常性の手段として得られた前記推定 値の変化を推定するステップと、 (c)ステップ(b)において得られた前記推定された変化が所定の定常性限度 γを超えているか否かを決定するステップと、を特徴とする、移動無線通信シス テムにおける背音を表す信号などの、定常信号と非定常信号との識別方法。
- 2.ステップ(a)において2次の統計的モーメントを推定することを特徴とす る、請求項第1項記載の方法。
- 3.ステップ(a)においてそれぞれのタイムサブウィンドウT1における前記 信号のエネルギーE(T1)を推定することを特徴とする、請求項第1項または 第2項記載の方法。
- 4.前記信号が離散時間信号であることを特徴とする、請求項第3項記載の方法 。
- 5.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第4項記載の方法。
- 6.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、MAXBUFは最も大きい最近のエネルギー 推定値のみを含むバッファであり、MINBUFは最も小さい最近のエネルギー 推定値のみを含むバッファであることを特徴とする、請求項第4項記載の方法。
- 7.前記タイムウィンドウTを集合的に覆う、重なり合うタイムサブウィンドウ T1を特徴とする、請求項第5項または第6項記載の方法。
- 8.等しいサイズのタイムサブウィンドウT1を特徴とする、請求項第7項記載 の方法。
- 9.それぞれのタイムサブウィンドウT1が2つの連続する音声フレームを含む ことを特徴とする、請求項第8項記載の方法。
- 10.フィルタに接続された信号源を含む、ディジタルフレームに基づく音声エ ンコーダおよび/またはデコーダにおいて、定常背音を検出し、かつエンコード および/またはデコードする方法であって、前記フィルタが、エンコードおよび /またはデコードされるべき信号を再生するための、それぞれのフレームに対す るフィルタパラメータの組によって定められる、前記方法が、(a)前記エンコ ーダ/デコーダへ送られた信号が、主として音声または背音のいずれを表してい るかを検出するステップと、(b)前記エンコーダ/デコーダへ送られた前記信 号が、主として背音を表している時、該背音が定常であるか否かを検出するステ ップと、(c)前記信号が定常である時、連続するフレーム間の時間的変化およ び/または前記組内の少なくともあるフィルタパラメータの領域を制限するステ ップと、を含む、音声エンコーダおよび/またはデコーダにおいて、定常背音を 検出し、かつエンコードおよび/またはデコードする方法。
- 11.前記定常性検出ステップが、 (b1)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサ ブウィンドウT1のそれぞれにおける前記背音の統計的モーメントの1つを推定 するステップと、 (b2)ステップ(b1)において前記背音の定常性の手段として得られた前記 推定値の変化を推定するステップと、(b3)ステップ(b2)において得られ た前記推定された変化が所定の定常性限度γを超えているか否かを決定するステ ップと、を含むことを特徴とする、請求項第10項記載の方法。
- 12.ステップ(b1)においてそれぞれのタイムサブウィンドウT1における 前記背音のエネルギーE(T1)を推定することを特徴とする、請求項第11項 記載の方法。
- 13.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第12項記載の方法。
- 14.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、MAXBUFは最も大きい最近のエネルギー 推定値のみを含むバッファであり、MINBUFは最も小さい最近のエネルギー 推定値のみを含むバッファであることを特徴とする、請求項第12項記載の方法 。
- 15.前記タイムウィンドウTを集合的に覆う、重なり合うタイムサブウィンド ウT1を特徴とする、請求項第13項または第14項記載の方法。
- 16.等しいサイズのタイムサブウィンドウT1を特徴とする、請求項第15項 記載の方法。
- 17.それぞれのタイムサブウィンドウT1が2つの連続する音声フレームを含 むことを特徴とする、請求項第16項記載の方法。
- 18.フィルタに接続された信号源を含む、ディジタルフレームに基づく音声コ ーダおよび/またはデコーダにおいて、定常背音をエンコードおよび/またはデ コードする装置であって、前記フィルタが、エンコードおよび/またはデコード されるべき信号を再生するための、それぞれのフレームに対するフィルタパラメ ータの組によって定められる、前記装置が、(a)前記エンコーダ/デコーダへ 送られた信号が、主として音声または背音のいずれを表しているかを検出する手 段(16、34)と、(b)前記エンコーダ/デコーダへ送られた前記信号が、 主として背音を表している時、該背音が定常であるか否かを検出する手段(24 、24′)と、(c)前記エンコーダ/デコーダへ送られた前記信号が定常背音 を表す時、連続するフレーム間の時間的変化および/または前記組内の少なくと もあるフィルタパラメータの領域を制限する手段(18、36)と、を含む、音 声エンコーダおよび/またはデコーダにおいて、定常背音をエンコードおよび/ またはデコードする装置。
- 19.前記定常性検出手段が、 (b1)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサ ブウィンドウT1のそれぞれにおける前記背音の統計的モーメントの1つを推定 する手段(50)と、 (b2)前記背音の定常性の手段としての前記推定値の変化を推定する手段(5 4)と、 (b3)前記推定された変化が所定の定常性限度γを超えているか否かを決定す る手段(56)と、 を含むことを特徴とする、請求項第18項記載の装置。
- 20.それぞれのタイムサブウィンドウT1における前記背音のエネルギーE( T1)を推定する手段(50)を特徴とする、請求項第19項記載の装置。
- 21.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第20項記載の装置。
- 22.最近の大きいエネルギー推定値および最近の小さいエネルギー推定値のみ をそれぞれ記憶するための第1バッファMAXBUFおよび第2バッファMIN BUFを制御する手段(58)を特徴とする、請求項第20項記載の装置。
- 23.前記バッファMINBUF、MAXBUFのそれぞれが、エネルギー推定 値のほかに、それぞれのバッファ内のそれぞれのエネルギー推定値に対応する前 記タイムサブウィンドウT1を識別するラベルを記憶することを特徴とする、請 求項第22項記載の装置。
- 24.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第23項記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9301798-6 | 1993-05-26 | ||
SE9301798A SE501305C2 (sv) | 1993-05-26 | 1993-05-26 | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
PCT/SE1994/000443 WO1994028542A1 (en) | 1993-05-26 | 1994-05-11 | Discriminating between stationary and non-stationary signals |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07509792A true JPH07509792A (ja) | 1995-10-26 |
Family
ID=20390059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7500526A Pending JPH07509792A (ja) | 1993-05-26 | 1994-05-11 | 定常信号と非定常信号との識別 |
Country Status (19)
Country | Link |
---|---|
US (1) | US5579432A (ja) |
EP (1) | EP0653091B1 (ja) |
JP (1) | JPH07509792A (ja) |
KR (1) | KR100220377B1 (ja) |
CN (2) | CN1046366C (ja) |
AU (2) | AU670383B2 (ja) |
CA (1) | CA2139628A1 (ja) |
DE (1) | DE69421498T2 (ja) |
DK (1) | DK0653091T3 (ja) |
ES (1) | ES2141234T3 (ja) |
FI (1) | FI950311A (ja) |
GR (1) | GR3032107T3 (ja) |
HK (1) | HK1013881A1 (ja) |
NZ (1) | NZ266908A (ja) |
RU (1) | RU2127912C1 (ja) |
SE (1) | SE501305C2 (ja) |
SG (1) | SG46977A1 (ja) |
TW (1) | TW324123B (ja) |
WO (1) | WO1994028542A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996034382A1 (en) * | 1995-04-28 | 1996-10-31 | Northern Telecom Limited | Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals |
AUPO170196A0 (en) * | 1996-08-16 | 1996-09-12 | University Of Alberta | A finite-dimensional filter |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
DE10026872A1 (de) | 2000-04-28 | 2001-10-31 | Deutsche Telekom Ag | Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector) |
EP1279164A1 (de) | 2000-04-28 | 2003-01-29 | Deutsche Telekom AG | Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector) |
JP3812887B2 (ja) * | 2001-12-21 | 2006-08-23 | 富士通株式会社 | 信号処理システムおよび方法 |
CA2420129A1 (en) * | 2003-02-17 | 2004-08-17 | Catena Networks, Canada, Inc. | A method for robustly detecting voice activity |
EP2945158B1 (en) | 2007-03-05 | 2019-12-25 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for smoothing of stationary background noise |
WO2008108721A1 (en) | 2007-03-05 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for controlling smoothing of stationary background noise |
CN101308651B (zh) * | 2007-05-17 | 2011-05-04 | 展讯通信(上海)有限公司 | 音频暂态信号的检测方法 |
CN101546556B (zh) * | 2008-03-28 | 2011-03-23 | 展讯通信(上海)有限公司 | 用于音频内容识别的分类系统 |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
EP3023985B1 (en) | 2010-12-29 | 2017-07-05 | Samsung Electronics Co., Ltd | Methods for audio signal encoding and decoding |
US10230346B2 (en) | 2011-01-10 | 2019-03-12 | Zhinian Jing | Acoustic voice activity detection |
US10325588B2 (en) | 2017-09-28 | 2019-06-18 | International Business Machines Corporation | Acoustic feature extractor selected according to status flag of frame of acoustic signal |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
GB2137791B (en) * | 1982-11-19 | 1986-02-26 | Secr Defence | Noise compensating spectral distance processor |
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
DE68929442T2 (de) * | 1988-03-11 | 2003-10-02 | British Telecomm | Vorrichtung zur Erfassung von Sprachlauten |
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
GB2239971B (en) * | 1989-12-06 | 1993-09-29 | Ca Nat Research Council | System for separating speech from background noise |
EP0538536A1 (en) * | 1991-10-25 | 1993-04-28 | International Business Machines Corporation | Method for detecting voice presence on a communication line |
SE470577B (sv) * | 1993-01-29 | 1994-09-19 | Ericsson Telefon Ab L M | Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
-
1993
- 1993-05-26 SE SE9301798A patent/SE501305C2/sv not_active IP Right Cessation
-
1994
- 1994-05-11 NZ NZ266908A patent/NZ266908A/en unknown
- 1994-05-11 TW TW083104232A patent/TW324123B/zh active
- 1994-05-11 JP JP7500526A patent/JPH07509792A/ja active Pending
- 1994-05-11 ES ES94917227T patent/ES2141234T3/es not_active Expired - Lifetime
- 1994-05-11 CN CN94190318A patent/CN1046366C/zh not_active Expired - Fee Related
- 1994-05-11 AU AU69016/94A patent/AU670383B2/en not_active Ceased
- 1994-05-11 EP EP94917227A patent/EP0653091B1/en not_active Expired - Lifetime
- 1994-05-11 WO PCT/SE1994/000443 patent/WO1994028542A1/en active IP Right Grant
- 1994-05-11 RU RU95107694A patent/RU2127912C1/ru active
- 1994-05-11 SG SG1996000608A patent/SG46977A1/en unknown
- 1994-05-11 KR KR1019950700299A patent/KR100220377B1/ko not_active IP Right Cessation
- 1994-05-11 DE DE69421498T patent/DE69421498T2/de not_active Expired - Fee Related
- 1994-05-11 CA CA002139628A patent/CA2139628A1/en not_active Abandoned
- 1994-05-11 DK DK94917227T patent/DK0653091T3/da active
- 1994-05-25 US US08/248,714 patent/US5579432A/en not_active Expired - Fee Related
-
1995
- 1995-01-24 FI FI950311A patent/FI950311A/fi unknown
-
1996
- 1996-03-14 AU AU48112/96A patent/AU681551B2/en not_active Ceased
-
1997
- 1997-01-06 CN CN97101022A patent/CN1218945A/zh active Pending
-
1998
- 1998-12-23 HK HK98115224A patent/HK1013881A1/xx not_active IP Right Cessation
-
1999
- 1999-12-13 GR GR990403198T patent/GR3032107T3/el unknown
Also Published As
Publication number | Publication date |
---|---|
SE9301798L (sv) | 1994-11-27 |
SE9301798D0 (sv) | 1993-05-26 |
FI950311A0 (fi) | 1995-01-24 |
WO1994028542A1 (en) | 1994-12-08 |
CN1218945A (zh) | 1999-06-09 |
HK1013881A1 (en) | 1999-09-10 |
KR100220377B1 (ko) | 1999-09-15 |
CN1110070A (zh) | 1995-10-11 |
EP0653091B1 (en) | 1999-11-03 |
FI950311A (fi) | 1995-01-24 |
DE69421498T2 (de) | 2000-07-13 |
GR3032107T3 (en) | 2000-03-31 |
TW324123B (en) | 1998-01-01 |
ES2141234T3 (es) | 2000-03-16 |
AU681551B2 (en) | 1997-08-28 |
CN1046366C (zh) | 1999-11-10 |
AU6901694A (en) | 1994-12-20 |
DK0653091T3 (da) | 2000-01-03 |
AU4811296A (en) | 1996-05-23 |
SE501305C2 (sv) | 1995-01-09 |
DE69421498D1 (de) | 1999-12-09 |
NZ266908A (en) | 1997-03-24 |
SG46977A1 (en) | 1998-03-20 |
RU2127912C1 (ru) | 1999-03-20 |
CA2139628A1 (en) | 1994-12-08 |
KR950702732A (ko) | 1995-07-29 |
US5579432A (en) | 1996-11-26 |
AU670383B2 (en) | 1996-07-11 |
EP0653091A1 (en) | 1995-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07509792A (ja) | 定常信号と非定常信号との識別 | |
Salami et al. | Design and description of CS-ACELP: A toll quality 8 kb/s speech coder | |
CN102089803B (zh) | 用以将信号的不同段分类的方法与鉴别器 | |
EP1747554B1 (en) | Audio encoding with different coding frame lengths | |
EP1316087B1 (fr) | Dissimulation d'erreurs de transmission dans un signal audio | |
US5060269A (en) | Hybrid switched multi-pulse/stochastic speech coding technique | |
US5579435A (en) | Discriminating between stationary and non-stationary signals | |
US20050251387A1 (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
JP2007534020A (ja) | 信号符号化 | |
KR20080083719A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
SE470577B (sv) | Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud | |
US20130054230A1 (en) | Estimation of speech energy based on code excited linear prediction (celp) parameters extracted from a partially-decoded celp-encoded bit stream and applications of same | |
US20220180884A1 (en) | Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack | |
WO2012153165A1 (en) | A pitch estimator | |
KR20070017379A (ko) | 오디오 신호를 부호화하기 위한 부호화 모델들의 선택 | |
NZ286953A (en) | Speech encoder/decoder: discriminating between speech and background sound | |
Miki et al. | Pitch synchronous innovation code excited linear prediction (PSI‐CELP) | |
Motlíček et al. | Optimal pitch path tracking for more reliable pitch detection | |
Serizawa et al. | A Fast Method of Calculating High-Order Backward LP Coefficients for Wideband CELP Coders | |
JPS63237100A (ja) | 音声検出器 | |
Kibey et al. | A fast LSF search algorithm based on interframe correlation in G. 723.1 |