JPH07509792A - 定常信号と非定常信号との識別 - Google Patents

定常信号と非定常信号との識別

Info

Publication number
JPH07509792A
JPH07509792A JP7500526A JP50052695A JPH07509792A JP H07509792 A JPH07509792 A JP H07509792A JP 7500526 A JP7500526 A JP 7500526A JP 50052695 A JP50052695 A JP 50052695A JP H07509792 A JPH07509792 A JP H07509792A
Authority
JP
Japan
Prior art keywords
signal
energy
stationary
estimated
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7500526A
Other languages
English (en)
Inventor
ヴィグレン,カール,トルビョルン
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン filed Critical テレフオンアクチーボラゲツト エル エム エリクソン
Publication of JPH07509792A publication Critical patent/JPH07509792A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Complex Calculations (AREA)
  • Circuits Of Receivers In General (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Inspection Of Paper Currency And Valuable Securities (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 定常信号と非定常信号との識別 技術分野 本発明は、定常信号と非定常信号との1111方法に関する。この方法は、例え ば、移動無線通信システムにおいて黄帝を表す信号が、定常であるか否かを検出 するために用いられつる。本発明はまた、定常背量を検出し、かつエンコード/ デコードするために、この方法を用いる方法および装置に関する。
発明の背景 多くの現代の音声コーグは、LPC(線型予測コーグ)として知られる音声コー グの大きい部類に属する。この部類に属するコーグの例には、米国国防省による 4、8Kbit/5CELPコーダ、欧州ディジタル・セルラ移動電話システム GSM(7)RPE−LTP:I−ダ、対応する米国システムADC(7)VS ELPコーダ、およびパシフィック・ディジクル・セルラ・システムPDCのV SELPコーダがある。
これらのコーグは全て、信号発生プロセスにおいて信号源−フィルタ概念を用い ている。フィルタは、再生されるべき信号の短時間スペクトルをモデル化するた めに用いられ、一方、信号源は、全ての他の信号変化を操作するものと仮定され る。
これらの信号源−フィルタ・モデルの共通の特徴は、再生されるべき信号が、信 号源の出力信号を定めるパラメータと、フィルタを定めるフィルタパラメータと によって表されることである。「線型予測」という用語は、フィルタパラメータ を推定するために一般的に用いられる方法に関するものである。すなわち、再生 されるべき信号は、フィルタパラメータの組によって部分的に表される。
信号モデルとして信号源−フィルタの組合せを用いる方法は、音声信号に対し比 較的に良く働くことが立証された。しかし、移動電話の使用者が沈黙していて、 入力信号が周囲音を含む時、現在公知のコーグがこの状況に対処するのは困難で ある。そのわけは、それらは音声信号に対して最適化されているからである。通 信リンクの他の側にいる聴取者は、聞きなれた黄帝がコーグにより「誤処理」さ れたために認識されえない時、当惑しやすい。
ここで参照して、その内容を本明細書に取込む、スウェーデン国特許出願第93  00290−5号によれば、この問題は、コーグが受信した信号内の黄帝の存 在を検出し、もし信号が黄帝によって支配されていれば、ある、いわゆるアンチ スワール・アルゴリズム(anti−swirling algorithm) によりフィルタパラメータの計算を修正することによって解決される。
しかし、異なる黄帝は同じ統計的特徴番もたないことが判明した。自動車の雑音 のような、1つの形式の黄帝は、定常であるとして特徴づけられうる。バックグ ラウンドバブルのような、もう1つの形式のものは、非定常であるとして特徴づ けられうる。実験は、上述のアンチスワール・アルゴリズムが、定常背量に対し ては良く働くが、非定常背合に対しては良く働かないことを示した。従って、定 常背量と非定常背合とを識別して、もし黄帝が非定常なものならばアンチスワー ル・アルゴリズムをバイパスしうるようにすることが望ましい。
発明の要約 従って、本発明は、移動無線通信システムにおける黄帝を表す信号などの、定常 信号と非定常信号とを識別する方法を提供することを目的とする。
本発明によれば、この方法は、 (a)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサブ ウィンドウT1のそれぞれにおける信号の統計的モーメントの1つを推定するス テップと、 (b)ステップ(a)において前記信号の定常性の手段として得られた前記推定 値の変化を推定するステップと、 (C)ステップ(b)において得られた前記推定された変化が所定の定常性限度 γを超えているか否かを決定するステップと、を特徴とする。
本発明のもう工つの目的は、フィルタに接続された信号源を含む、ディジタルフ レームに基づく音声エンコーダおよび/またはデコーダにおいて、定常背量を検 出し、かつエンコードおよび/またはデコードする方法であって、前記フィルタ が、エンコードおよび/またはデコードされるべき信号を再生するための、それ ぞれのフレームに対するフィルタパラメータの組によって定められる、前記方法 を提供することである。
本発明によれば、この方法は、 (a)前記エンコーダ/デコーダへ送られた信号が、主として音声または黄帝の いずれを表しているかを検出するステップと、(b)前記エンコーダ/デコーダ へ送られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否 かを検出するステップと、(c)前記信号が定常である時、連続するフレーム間 の時間的変化および/または前記組内の少なくともあるフィルタパラメータの領 域を制限するステップと、を含む。
本発明のもう1つの目的は、フィルタに接続された信号源を含む、ディジタルフ レームに基づく音声コーグおよび/またはデコーダにおいて、定常背量をエンコ ードおよび/またはデコードする装置であって、前記フィルタが、エンコードお よび/またはデコードされるべき信号を再生するための、それぞれのフレームに 対するフィルタパラメータの組によって定められる、前記装置を提供することで ある。
本発明によれば、この装置は、 (a)前記エンコーダ/デコーダへ送られた信号が、主として音声または黄帝の いずれを表しているかを検出する手段と、(b)前記エンコーダ/デコーダへ送 られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否かを 検出する手段と、(C)前記エンコーダ/デコーダへ送られた前記信号が定常背 量を表す時、連続するフレーム間の時間的変化および/または前記組内の少なく ともあるフィルタパラメータの領域を制限する手段と、図面の簡単な説明 本発明、および本発明の他の諸口的および諸利点は、添付図面と共に以下の説明 を参照することにより最も良く理解されつる。添付図面において、第1図は、本 発明の方法を行う手段を備えた音声エンコーダのブロック図であり、 第2図は、本発明の方法を行う手段を倫えた音声デコーダのブロック図であり、 第3図は、第1図の音声エンコーダ内に用いられうる信号識別器のブロック図で あり、 ゛ 第4図は、第1図の音声エンコーダ内に用いられつる好ましい信号識別器の ブロック図である。
実施例の詳細な説明 本発明は、定常信号と非定常信号とを識別するために一般的に用いられうるが、 以下においては本発明を、移動無線通信システムにおける黄帝を表す信号の定常 性の検出に関して説明する。
第1図の音声コーグを参照すると、入力線lO上において入力信号s (n)が フィルタ推定器12へ送られ、フィルタ推定器12は標準化されたプロシージャ によりフィルタパラメータを推定する(レビンソンーダービン(Levinso n−Durbin)アルゴリズム、バーブ(Burg)アルゴリズム、コレスキ ー(Cholesky)分解(1978年、プレンティス−ホール(Prent ice−Hal l)発行、ラビナー(Rabiner)、シエイフ7 (Sc hafer)著、「音声信号のディジタル処理(Digi talProces sing of 5peech Signals) J 、第8章)、ジュール (Schur)アルゴリズム(1991年1月、アイイーイーイー・エスピー− マガジン(IEEE SP Magazine)、第12頁ないし第36頁に所 載の、ストロバッハ(Sけobach)著、「レビンソンおよびジュールのアル ゴリズムの新形式(New Form of Levinson and Sc hurAlgorithns) 」) 、ル・ルーーゲゲン(Le Roux− Gueguen)アルゴリズム(1977年、アイイーイーイー・トランザクシ ョンズ・オブ・アカウスティクス(+[+BETransactions of  Acoustics入音声および信号処理(Speech and Sign alProcessing) J 、第ASSP−26巻、第3号、第257頁 ないし第259頁に所載の、ル・ルー(Le Roux)、ゲーゲン(Gueg uen)著r部分相関係数の固定点計算(A Fixed Po1nt Com putation of Partial Correlation Coef ficientsjJ )、 モトローラ社(MoLorola Inc、)を権利者とする米国特許第4 5 44 919号に説明されている、いわゆるFLATアルゴリズム)。フィルタ 推定器12は、それぞれのフレームに対するフィルタパラメータを出力する。こ れらのフィルタパラメータは励振解析器14へ送られ、励振解析器14はまた線 10上の入力信号をも受ける。励振解析器14は、標準的プロシージャにより最 良の信号源または励振パラメータを決定する。そのようなプロシージャの例には 、VSELP(1991年、クルワー・アカデミツク・パブリッシャーズ(Kl uwer AcademicPubl 1shers)発行、アタル(ALal )外編、「音声コーディングにおける進歩(Advances in 5pee ch Coding)J 、第69頁ないじ第79頁に所載の、ジャーリン(G erson) 、ジャンラフQasiuk)著[ベクトル和により励振される線 形予測(Vector Su+++ Excited Linear Pred iction) (VS EL P) J ) 、TB P E i前 記参照文献の第145頁ないし第156頁に所載の、サラミ(Salami)著 「2進パルス励振:低複雑性CELPコーディングへの新しいアプローチ(Bi naryPulse Excitation : A Novel Appro ach to Low Complexity C[!LP Cod奄獅■jJ  )、 確率コードブック(前記参照文献の第121頁ないし第134頁に所載の、カン ブベル(Campbe l I )外著、rDoD4.8KBPS規格(提案合 衆国規格1016) (The DoD4. 8KBPS 5tandard  (Proposed Federal 5tandard 1 016)’I  J )、ACELP (1987年、音響、音声および信号処理に関する国際会 議会報(Proc、 International Conference o n Acoustics、 5peech andSignal Proces sing 1987 ) 、第1953頁ないし第1956頁に所載の、アダウ ル(Adoul)、ランプリン(Lamblin)著、[音声のCELP:l− ディングのためのある代数的構造の比較(A Comparison of S ome Algeblaic 5tructure forCELP Codi ng of 5peech)J )がある。これらの励振パラメータ、フィルタ パラメータ、および線lO上の入力信号は、音声検出器16へ送られる。この検 出器16は、入力信号が、主として音声または黄帝のいずれを含むかを決定する 。可能な検出器は、例えば、GSMシステムにおいて定められた音声活動検出器 (音声活動検出(Voise Activity Detection) 、0 3M勧告06.32、ETSI/PT 12)である。適切な検出器は、EP、 A、335 521 (ブリティシュ・テレコム・ピーエルンー(BRITIS )I 置EC0M PLC))に説明されている。検出器16は、コーグの入力 信号が主として音声を含むか否かを示す出力信号S/Bを発生する。この出力信 号は信号推定器24を経て、フィルタパラメータと共にパラメータ修正器18へ 送られる。
上述のスウェーデン国特許出願によれば、パラメータ修正器18は、エンコーダ への入力信号内に音声信号が存在しない場合に、決定されたフィルタパラメータ を修正する。もし音声信号が存在すれば、フィルタパラメータは、変更なくパラ メータ修正器工8を通過する。ことによると変更されたフィルタパラメータおよ び励振パラメータが、チャネルコーグ20へ送られ、チャネルコーグ20は、線 22上のチャネルを経て送られるビット流を発生する。
パラメータ修正器18によるパラメータ修正は、いくつかの方法で行われつる。
1つの可能な修正は、フィルタの帯域幅拡大である。これは、フィルタの極が複 素平面の原点に向かって移動せしめられることを意味する。原フィルタH(z)  −1/A (z)は、次式によって与えられるものと仮定する。
極が、因子r、0≦r≦l、により移動せしめられる時は、帯域幅の拡大バージ ョンは、A(z/r)、すなわち、 により定められる。
もう1つの可能な修正は、時間領域におけるフィルタパラメータの低域フィルタ リングである。すなわち、フレームからフレームへのフィルタパラメータの速い 変化を、該パラメータの少なくともあるものを低域フィルタリングすることによ り減衰せしめる。この方法の特殊な場合は、いくつかのフレーム、例えば4ない し5フレームにおいて、フィルタパラメータを平均する。
パラメータ修正器18はまた、これらの2方法の組合せを用い、例えば、帯域幅 の拡大に続いて低域フィルタリングを行うこともできる。また、低域フィルタリ ングから始め、次に帯域幅の拡大を追加することもできる。
以上の説明においては、信号識別器24を無視した。しかし、上述のように、黄 帝は同じ統計的特徴をもつとは限らないので、信号を、音声を表す信号と、黄帝 を表す信号とに分割するのでは不十分であることが判明した。従って、黄帝を表 す信号を、第3図および第4図に関連してさらに後述するように、信号識別器2 4において定常信号と非定常信号とに分割する。従って、信号識別器24から線 26上への出力信号は、コーディングされるべきフレームが、定常背量または音 声/非定常背量のいずれを含むかを示し、前者を含む場合はパラメータ修正器1 8が上述のパラメータ修正を行い、後者を含む場合は修正を行わない。
以上の説明においては、パラメータ修正は送信機内のコーグにおいて行われるも のと仮定した。しかし、同様のプロシージャは受信機のデコーダにおいても行わ れうろことを認識すべきである。これは、第2図の実施例により示されている。
第2図において、チャネルからのビット流は、入力線30上に受信される。この ビット流は、チャネルデコーダ32によりデコードされる。チャネルデコーダ3 2は、フィルタパラメータおよび励振パラメータを出力する。この場合、これら のパラメータは、送信機のコーグにおいて修正されていないものと仮定する。
フィルタパラメータおよび励振パラメータは音声検出器34へ送られ、音声検出 器34は、これらのパラメータを解析して、これらのパラメータにより再生され るへき信号が、音声信号を含むか否かを決定する。音声検出器34の出力信号S /Bは、信号識別器24′を経て、パラメータ修正器36へ送られ、パラメータ 修正器36はさらにフィルタパラメータをも受ける。
上述のスウェーデン国特許出願によれば、もし音声検出器34が、受けた信号内 に音声信号が存在しないことを決定すれば、パラメータ修正器36は、第2図の パラメータ修正器18が行う修正と同様の修正を行う。もし音声信号が存在すれ ば、修正は行われない。ことによると修正されたフィルタパラメータおよび励振 パラメータが音声デコーダ38へ送られ、音声デコーダ38は、線40上へ合成 出力信号を発生する。音声デコーダ38は、励振パラメータを用いて上述の信号 源信号を発生し、またことによると修正されたフィルタパラメータを用いて信号 源−フィルタモデルにおけるフィルタを定める。
第1図のコーグにおけると同様に、信号識別器24′は、定常背合と非定常背合 とを識別する。このようにして、定常背合を含むフレームのみが、パラメータ修 正器36を作動させる。しかし、この場合、信号識別器24“は、音声信号5( n)に対するアクセスはもたず、その信号を定める励振パラメータに対してのみ アクセスを有する。識別プロセスは、第3図および第4図に関連してさらに後述 される。
第3図は、第1図の信号識別器24のブロック図を示す。識別器24は、入力信 号s (n)と、音声検出器16からの出力信号S/Bと、を受ける。信号S/ BはスイッチSWへ送られる。もし音声検出器16が、信号s (n)が主とし て音声を含むことを決定すれば、スイッチSWは上部位置をとり、その場合、信 号S/Bは識別器24の出力へ直接送られる。
もし信号s (n)が主として背合を含めば、スイッチSWは下部位置をとり、 信号S/Bおよびs (n)は共に計算器手段50へ送られ、計算器手段5oは 、それぞれのフレームのエネルギーE (T、 )を推定する。ここでT1は、 フレームlの時間の長さを示しうる。しかし、実施例においては、T1は2つの 連続するフレームのサンプルを含み、E (T、 )はこれらのフレームの全エ ネルギーを示す。この実施例においては、次のウィンドウTI+1は1音声フレ ームシフトされて、それが1つの新しいフレームと、前ウィンドウT、からの1 つのフレームとを含むようにされる。従って、これらのウィンドウは、lフレー ム重なり合うことになる。前記エネルギーは、例えば次式により推定されつる。
ただし、s (n) =s (t、 )である。
エネルギーの推定値E (T、 )は、バッファ52内に記憶される。このバッ ファは、例えば、100ないし200フレームからの100ないし200エネル ギー推定値を含有しうる。新しい推定値がバッファ52に入ると、最も古い推定 値はバッファから削除される。従って、バッファ52は、Nをバッファのサイズ とすると、常に最後のN個のエネルギー推定値を含む。
次に、バッファ52のエネルギー推定値は計算器手段54へ送られ、計算器手段 54は次式によって試験変数■7を計算する。
ただし、Tは、全ての(ことによると重なり合っている)タイムウィンドウT1 の累算された時間の長さである。Tは通常、例えば100ないし200音声フレ ームまたは2ないし4秒の、固定された長さを有する。言葉で表現すれば、vT は、期間T内における最大エネルギー推定値を、同じ期間内における最小エネル ギー推定値で割ったものである。この試験変数■1は、最後のNフレーム内にお けるエネルギーの変化の推定値である。この推定値は後に、信号の定常性を決定 するのに用いられる。もし信号が定常であれば、そのエネルギーはフレームから フレームへと極めて僅かしか変化せず、それは試験変数VTが1に近いことを意 味する。非定常信号の場合は、エネルギーはフレームからフレームへとがなり変 化し、それは推定値が1よりかなり大きいことを意味する。
試験変数VTは比較器56へ送られ、そこで試験変数VTは定常性限度γと比較 される。もしvTがγを超えていれば、非定常信号が出力線26上に示される。
これは、フィルタパラメータが修正されるべきでないことを示す。γに対する適 切な値は2ないし5、特に3ないし4であることがわかっている。
以上の説明から、フレームが音声を含むか否かを検出するためには、その特定の フレームを考慮しさえすればよいことは明らかであり、それは音声検出器16に おいて行われる。しかし、もしフレームが音声を含まないことが決定されれば、 定常性の識別を行うために、そのフレームの周囲のフレームからのエネルギー推 定値を蓄積することが必要になる。従って、N>2であり通常は100ないし2 00程度であるN個の記憶位置を有するバッファが必要となる。このバッファは また、それぞれのエネルギー推定値に対するフレーム番号をも記憶しつる。
試験変数V、が試験され終わり、比較器56において決定がなされ終わると、次 のエネルギー推定値が計算器手段50において発生せしめられ、バッファ52内 ヘンフトされて、その後、新しい試験変数V、が計算され、比較器56において γと比較される。このようにして、タイムウィンドウTは、時間的に1フレーム 前方ヘシフトされる。
以上の説明においては、音声検出器16が背合を含むフレームを検出し終わると 、それは後続のフレーム内における背合の検出を続けて、試験変数■、を形成す るために十分なエネルギー推定値を、バッファ52内に蓄積するものと仮定した 。しかし、音声検出器16が、背合を含む少数のフレームを検出した後、音声を 含むいくらかのフレームに続いて、新しい背合を含むフレームを検出する場合が ある。この理由のために、バッファ52は「有効時」においてエネルギー値を記 憶し、これは、背合を含むフレームに対してのみエネルギー値が計算され、記憶 されることを意味する。これはまた、それぞれのエネルギー推定値がなぜ対応す るフレーム番号と共に記憶されるかの理由でもある。そのわけは、これが、長時 間にわたって背合がなかった時、エネルギー値が関連を有するためには古すぎる ことを決定する機構を与えるからである。
起こりうるもう1つの場合は、計算されるエネルギー値が少ない、短時間の背合 が存在し、極めて長期間の間に、その外に背合がない時である。この場合、バッ ファ52は、適度の時間内に有効な試験変数の計算を行うのに十分なエネルギー 値を含まない。このような場合に対する解決法は、タイムアウト限度を整定し、 その後は、定常性の決定のための十分な基礎がないので、背合を含むフレームが 音声として処理されるよ・う4こ定めることである。
さらに、あるフレームが非定常背合を含むことが決定された時、ある場合には定 常性限度γを、例えば3.5から3.3へ低下させて、後のフレームに対する決 定が「定常」と「非定常」との間であちこちにスイッチすることを防止するとよ い。このようにすると、もし非定常フレームが発見されれば、後続のフレームも 同様に非定常として分類されやすくなる。結局、定常フレームが発見された時は 、定常性限度γは再び増加せしめられる。この技術は、 「ヒステリシス」と呼 ばれる。
もう1つの好ましい技術は「延期(hangover) Jである。延期とは、 信号識別器24によるある決定が最終的なものになるまでに、少なくともある数 のフレーム、例えば、5フレームの間、持続しなくてはならないことを意味する 。好ましくは、 「ヒステリシス」と「延期」とは組合わされる。
以上から、第3図の実施例が、典型的な場合において100ないし200(もし フレーム番号も記憶されるとすれば200ないし400)メモリ位置を有する、 かなりのサイズのバッファ52を必要とすることは明らかである。このバッファ は、メモリリソースが極めて少ない信号プロセッサ内に通常存在するので、バッ ファのサイズを減少させることが望ましい。従って、第4図は、バッファの使用 方法が、バッファ52°を制御するバッファ制御器58によって修正された、信 号識別器24の実施例を示す。
バッファ制御器58の目的は、不必要なエネルギー推定値E (T、 )が記憶 されないように、バッファ52°を管理することである。このアプローチは、最 も極端なエネルギー推定値のみが実際にVTの算出に関連していることの観察に 基づいている。従って、僅かだけの大きい、また僅かだけの小さいエネルギー推 定値のみをバッファ52′内に記憶させれば良い近似になるはずである。従って 、バッファ52゛ を、2つのバッファMAXBUFおよびMINBUFに分割 する。
古いエネルギー推定値は、ある時間の後にバッファから消失しなくてはならない ので、対応するエネルギー値のフレーム番号もMAXBUFおよびMINBUF 内に記憶する必要がある。バッファ制御器58が行う、バッファ52°内に値を 記憶するための1つの可能なアルゴリズムは、添付されている付録のパスカルプ ログラムに詳述されている。
第4図の実施例は、第3図の実施例に比較すると、準最適なものである。その理 由は、例えば、大きいフレームエネルギーが、より大きくより古いフレームエネ ルギーがMAXBUF内に存在する時に、MAXBUFに入りえないからである 。この場合、その特定のフレームエネルギーは、たとえ、それが事実上もっと遅 (なりえたとしても、前の大きい(しかし古い)フレームエネルギーがシフトア ウトされ終わった時失われる。従って、実際に計算されるのはV工ではなく、次 式のように定義されるV′1である。
しかし実際的な観点からは、この実施例は「十分に良<」、必要なバッファサイ ズの、100ないし200エネルギー推定値の記憶から、約10推定値(MAX BUFに対して5、MINBUFに対して5)への激減を可能ならしめる。
第2図の説明に関連して上述したように、信号識別器24゛ は信号s (n) に対するアクセスをもたない。しかし、フィルタパラメータまたは励振パラメー タは通常、フレームエネルギーを表すパラメータを含むので、エネルギー推定値 はこのパラメータから得られうる。このようにして、米国規格l5−54により 、フレームエネルギーは励振パラメータr(0)によって表される。(もちろん 、第1図の信号識別器24において、「(0)をエネルギー推定値として用いる ことも可能である。)もう1つのアプローチは、第2図において、信号識別器2 4゛およびパラメータ修正器36を、音声デコーダ38の右側へ移動させること である。このようにすれば、信号識別器24゛ は、デコードされた信号を表す 、すなわち第1図の信号s (n)と同じ形式の、信号40に対しアクセスしう る。
しかし、このアプローチは、パラメータ修正器36の後に、修正された信号を再 生するためのもう1つの音声デコーダを必要とする。
信号識別器24.24°の上述の説明においては、定常性の決定がエネルギーの 計算に基つくものと仮定されていた。しかし、エネルギーは、定常性の決定のた めに用いられつる異なる次数の統計的モーメントの単なる1つに過ぎない。この ようにして、(信号のエネルギーまたは分散に対応する)2次のモーメント以外 の統計的モーメントを用いることは、本発明の範囲内にある。定常性のために異 なる次数のいくつかの統計的モーメントを試験すること、および最終的な統計的 決定をこれらの試験の結果に基づかせることもまた可能である。
さらに、定められた試験変数■、のみが可能な試験変数ではない。例えば、もう 1つの試験変数は、次式のように定められうる。
ただし、式<dE (T、)/d t>は、フレームからフレームへのエネルギ ーの変化速度の推定値を表す。例えば、前式内の推定値を計算するために、例え ば、線形傾向モデルによって、カルマンフィルタが適用されつる(1988年、 エムアイティー・プレス(MIT Press)発行、エイ・ゲルブ(んGe1 b)著、「応用最適推定(Applied optiml estimtion ) J参照)。しかし、本明細書において前に定義した試験変数VTは、信号識 別器を背量のレベルに感じないようにする、スケール因子に無関係な望ましい特 徴を有する。
明の精神および範囲から逸脱することなく、本発明に対してさまざまな改変およ び変更を行いうろことを理解しつるはずである。
付録 PROCEDURE FLsCatDet(zpbact : realAcf VeceorTypei(入力 )ZFLsp : Boolean; (入力  )ZFLnrMinFrames : Ineegeri (入力 )ZFL nrFrames 、工nee(ier; (入力 )ZFLrraxThre sh : Real; (入力 )ZFLminThresh : Real;  (入力 )VARZFLpowOld 二Real; (入力l出力)VAR ZFLnrSaved : Integer; (入力/出力)VARzFLr IIaxBut : realstaI−BufType; (入力l出力)V ARzFヒ宸Cime : integerseaeBufType; (入力 /出力)VARZFLminBuf : reals!aeBufType;  (入力/出力)VARZFLminTime : ineegerseaセBu fTyp!; (入力/出力)VARZFLpralNO5しat : Boo lean); (入力l出力)VAR 1:工nte9eri maxinvum、m1ni+wm : Real;powNowルestva r + Real;o1dNoseaセ : Boolean;replace ’Nr : 工nteq@rjABEL staeEnd; BEGIN oldNost、at ニー ZFLprelNOSeaJZFLprelNo Sl:ae ニー ZFLsp;XF NOT ZFLsp AND (ZFL acf[O] > 01 THEN BEGIN(もし音声でなければ) ZFI、prelNostat ニー True;ZFLnrSaved 二=  ZFLnrSaved + l;powNow ニー ZFLacf[O]  + ZFLpowOld;ZFLpowOld ニー ZFLaCf[O];工 F ZFLnrSaved < 2 TI(ENGOTO5eat−End; 工F ZFLnrSaved > ZFLnrFrameS THENZFLn rSaved :m ZFLnrFrames;(最大値バッファ内に古い要素 があるか否かをチェックする)FORi : −ITo stajBuffer Lengt、h Do BEG工NZFLmaxTime[il :wa ZF LmaxTime[il + 1;工F ZFLmaxTime[il > Z FLnrFrames THEN BEG工NZFLmaxBuf[il :I −pOWNOw;ZFLmaxTime[1] : ! 1rEND。
END; (最小値バッファ内に古い要素があるか否かをチェックする)FORi ニー  I TC)6しatBufferLength Do BTAINZFLani nTime[il :x ZFLrainTime[il + l;工F ZF LminTime[il > ZFLnrFrames THEN BEG工N ZFLminBuf[il :冨powNow;ZFLminTime[il  :! l;1:ND; END。
ff1a!imum :m −1E38;n’ll!’limufn :m − maximum;replacaNr :w= O; (最大値バッファ内の要素が置換されるべきか否かをチェックし、最大値を見出 す FORi :m l To sl−atBufferLengeh Do BE G工N工F powNow >m ZFLmaxBuf[il THENrep laceNr :m i; エF ZFL、maxBuf[il )旗 maximum THENmaxi mum :! ZFLmaxBuf[il ;END。
IF replaceNr > OTHEN BEG工NZFLmaXT1me [replaCeNrl :lII’L;ZFLmaxBuf[replace Nrl :w powNow;工F ZFLmaxBuf[replaceNr l >z maximum THENmaximum :雪 ZFLmaxBu f[replaceNrl;END。
replaceNr :z O; (最小値バッファ内の要素が置換されるべきか否かをチェックし、FORi +  −I To stahBufferLengeh Do BEG工N工F p owNow <w ZFLminBuf[il THENreplacaNr  :x i; 工F ZFIxinBuf[il <m minimum THENminim um : w ZFLminBuf [il ;END; 工F replacaNr > OTHEN BEGINZFLminTirn e[replaCeNrl :爾1;ZFLminBuf[replaceNr l := powNow;工F ZFLminBuf[replaceNrl  )m minimum THENminimum :m ZFLminBuf  [replaceNrl ;END。
工F ZFLnrSaved >w ZFLnrMinFrames THEN  BEGIN工F minimum > l THEN BEG工N(試験変数 を計算する) しestVar := maximum/minimum;(もし試験変数がm axThreshより大ならば、音声と決定するもし試験変数がm1nThre shより小ならば、バブルと決定するもし試験変数が中間のものならば、前決定 を保持するZFL、prelNoseae ニーt oldNosセaLi工F  tesevar > ZFLmaxThresh ’n(ENZFLprel NoSこat := True;工F testvar < ZFLminTh resh THENZFLprelNoSLam := False;END。
END; END、’ 5L21jEnd: DrD; PROCEDURE FLhangHandler(ZFLmaxFrames  : Integer; (入力 )ZFLhangFrames : 工ne eger; (入力 )ZFLvad : Boolean; (入力 )VA RZFLelapsedFrames : 工n仁eger; (入力/出カシ VARZFLspHangover : 工nteget; (入力/出力)V ARZFLvac!01cl : Boolean; (入力l出力)VARz yLsp : Boolean) ; (出力 )EGIN (音声から無音声への決定の変更をhangFrames個のフレーム数だけ遅 延させる しかし、もし音声がmaxFrames個より少ないフレームしか持続しなかっ たら、これを行わない ZFLsp := ZFLvad; IF t ZFLelapsedPrames < ZFLmaxFrames  ) THENZFLelapsedPrames ニー ZFLelapse dFrames + l;IF ZFLvadOld AND NOT ZFL vad rHENZFLspHangOver ニー IHIF (ZFLsp HangOver < ZFLhangFraxsl AND NOT ZFL vad THEN BE(JNZFLspHangOver ニー ZFLsp HangOver + 1;ZFLSp :m Trlle: END; IF NOT ZFLvad AND (ZFLelapsedFrames  < ZF−Frames l TKENZFLsp :e ’False; IF NOT ZFLsp AND (ZFLspHangOver > ZF LhangFrames−11THENZFLelapsedFrames : * O;ZFLvadOld ニー ZFLvad;覆の。

Claims (24)

    【特許請求の範囲】
  1. 1.(a)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイム サブウィンドウTlのそれぞれにおける信号の統計的モーメントの1つを推定す るステップと、 (b)ステップ(a)において前記信号の定常性の手段として得られた前記推定 値の変化を推定するステップと、 (c)ステップ(b)において得られた前記推定された変化が所定の定常性限度 γを超えているか否かを決定するステップと、を特徴とする、移動無線通信シス テムにおける背音を表す信号などの、定常信号と非定常信号との識別方法。
  2. 2.ステップ(a)において2次の統計的モーメントを推定することを特徴とす る、請求項第1項記載の方法。
  3. 3.ステップ(a)においてそれぞれのタイムサブウィンドウT1における前記 信号のエネルギーE(T1)を推定することを特徴とする、請求項第1項または 第2項記載の方法。
  4. 4.前記信号が離散時間信号であることを特徴とする、請求項第3項記載の方法 。
  5. 5.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第4項記載の方法。
  6. 6.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、MAXBUFは最も大きい最近のエネルギー 推定値のみを含むバッファであり、MINBUFは最も小さい最近のエネルギー 推定値のみを含むバッファであることを特徴とする、請求項第4項記載の方法。
  7. 7.前記タイムウィンドウTを集合的に覆う、重なり合うタイムサブウィンドウ T1を特徴とする、請求項第5項または第6項記載の方法。
  8. 8.等しいサイズのタイムサブウィンドウT1を特徴とする、請求項第7項記載 の方法。
  9. 9.それぞれのタイムサブウィンドウT1が2つの連続する音声フレームを含む ことを特徴とする、請求項第8項記載の方法。
  10. 10.フィルタに接続された信号源を含む、ディジタルフレームに基づく音声エ ンコーダおよび/またはデコーダにおいて、定常背音を検出し、かつエンコード および/またはデコードする方法であって、前記フィルタが、エンコードおよび /またはデコードされるべき信号を再生するための、それぞれのフレームに対す るフィルタパラメータの組によって定められる、前記方法が、(a)前記エンコ ーダ/デコーダへ送られた信号が、主として音声または背音のいずれを表してい るかを検出するステップと、(b)前記エンコーダ/デコーダへ送られた前記信 号が、主として背音を表している時、該背音が定常であるか否かを検出するステ ップと、(c)前記信号が定常である時、連続するフレーム間の時間的変化およ び/または前記組内の少なくともあるフィルタパラメータの領域を制限するステ ップと、を含む、音声エンコーダおよび/またはデコーダにおいて、定常背音を 検出し、かつエンコードおよび/またはデコードする方法。
  11. 11.前記定常性検出ステップが、 (b1)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサ ブウィンドウT1のそれぞれにおける前記背音の統計的モーメントの1つを推定 するステップと、 (b2)ステップ(b1)において前記背音の定常性の手段として得られた前記 推定値の変化を推定するステップと、(b3)ステップ(b2)において得られ た前記推定された変化が所定の定常性限度γを超えているか否かを決定するステ ップと、を含むことを特徴とする、請求項第10項記載の方法。
  12. 12.ステップ(b1)においてそれぞれのタイムサブウィンドウT1における 前記背音のエネルギーE(T1)を推定することを特徴とする、請求項第11項 記載の方法。
  13. 13.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第12項記載の方法。
  14. 14.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、MAXBUFは最も大きい最近のエネルギー 推定値のみを含むバッファであり、MINBUFは最も小さい最近のエネルギー 推定値のみを含むバッファであることを特徴とする、請求項第12項記載の方法 。
  15. 15.前記タイムウィンドウTを集合的に覆う、重なり合うタイムサブウィンド ウT1を特徴とする、請求項第13項または第14項記載の方法。
  16. 16.等しいサイズのタイムサブウィンドウT1を特徴とする、請求項第15項 記載の方法。
  17. 17.それぞれのタイムサブウィンドウT1が2つの連続する音声フレームを含 むことを特徴とする、請求項第16項記載の方法。
  18. 18.フィルタに接続された信号源を含む、ディジタルフレームに基づく音声コ ーダおよび/またはデコーダにおいて、定常背音をエンコードおよび/またはデ コードする装置であって、前記フィルタが、エンコードおよび/またはデコード されるべき信号を再生するための、それぞれのフレームに対するフィルタパラメ ータの組によって定められる、前記装置が、(a)前記エンコーダ/デコーダへ 送られた信号が、主として音声または背音のいずれを表しているかを検出する手 段(16、34)と、(b)前記エンコーダ/デコーダへ送られた前記信号が、 主として背音を表している時、該背音が定常であるか否かを検出する手段(24 、24′)と、(c)前記エンコーダ/デコーダへ送られた前記信号が定常背音 を表す時、連続するフレーム間の時間的変化および/または前記組内の少なくと もあるフィルタパラメータの領域を制限する手段(18、36)と、を含む、音 声エンコーダおよび/またはデコーダにおいて、定常背音をエンコードおよび/ またはデコードする装置。
  19. 19.前記定常性検出手段が、 (b1)N>2とするとき、所定の長さのタイムウィンドウTのN個のタイムサ ブウィンドウT1のそれぞれにおける前記背音の統計的モーメントの1つを推定 する手段(50)と、 (b2)前記背音の定常性の手段としての前記推定値の変化を推定する手段(5 4)と、 (b3)前記推定された変化が所定の定常性限度γを超えているか否かを決定す る手段(56)と、 を含むことを特徴とする、請求項第18項記載の装置。
  20. 20.それぞれのタイムサブウィンドウT1における前記背音のエネルギーE( T1)を推定する手段(50)を特徴とする、請求項第19項記載の装置。
  21. 21.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第20項記載の装置。
  22. 22.最近の大きいエネルギー推定値および最近の小さいエネルギー推定値のみ をそれぞれ記憶するための第1バッファMAXBUFおよび第2バッファMIN BUFを制御する手段(58)を特徴とする、請求項第20項記載の装置。
  23. 23.前記バッファMINBUF、MAXBUFのそれぞれが、エネルギー推定 値のほかに、それぞれのバッファ内のそれぞれのエネルギー推定値に対応する前 記タイムサブウィンドウT1を識別するラベルを記憶することを特徴とする、請 求項第22項記載の装置。
  24. 24.前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第23項記載の装置。
JP7500526A 1993-05-26 1994-05-11 定常信号と非定常信号との識別 Pending JPH07509792A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9301798-6 1993-05-26
SE9301798A SE501305C2 (sv) 1993-05-26 1993-05-26 Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
PCT/SE1994/000443 WO1994028542A1 (en) 1993-05-26 1994-05-11 Discriminating between stationary and non-stationary signals

Publications (1)

Publication Number Publication Date
JPH07509792A true JPH07509792A (ja) 1995-10-26

Family

ID=20390059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7500526A Pending JPH07509792A (ja) 1993-05-26 1994-05-11 定常信号と非定常信号との識別

Country Status (19)

Country Link
US (1) US5579432A (ja)
EP (1) EP0653091B1 (ja)
JP (1) JPH07509792A (ja)
KR (1) KR100220377B1 (ja)
CN (2) CN1046366C (ja)
AU (2) AU670383B2 (ja)
CA (1) CA2139628A1 (ja)
DE (1) DE69421498T2 (ja)
DK (1) DK0653091T3 (ja)
ES (1) ES2141234T3 (ja)
FI (1) FI950311A (ja)
GR (1) GR3032107T3 (ja)
HK (1) HK1013881A1 (ja)
NZ (1) NZ266908A (ja)
RU (1) RU2127912C1 (ja)
SE (1) SE501305C2 (ja)
SG (1) SG46977A1 (ja)
TW (1) TW324123B (ja)
WO (1) WO1994028542A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1996034382A1 (en) * 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
AUPO170196A0 (en) * 1996-08-16 1996-09-12 University Of Alberta A finite-dimensional filter
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
DE10026872A1 (de) 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
EP1279164A1 (de) 2000-04-28 2003-01-29 Deutsche Telekom AG Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector)
JP3812887B2 (ja) * 2001-12-21 2006-08-23 富士通株式会社 信号処理システムおよび方法
CA2420129A1 (en) * 2003-02-17 2004-08-17 Catena Networks, Canada, Inc. A method for robustly detecting voice activity
EP2945158B1 (en) 2007-03-05 2019-12-25 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
WO2008108721A1 (en) 2007-03-05 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise
CN101308651B (zh) * 2007-05-17 2011-05-04 展讯通信(上海)有限公司 音频暂态信号的检测方法
CN101546556B (zh) * 2008-03-28 2011-03-23 展讯通信(上海)有限公司 用于音频内容识别的分类系统
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP3023985B1 (en) 2010-12-29 2017-07-05 Samsung Electronics Co., Ltd Methods for audio signal encoding and decoding
US10230346B2 (en) 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
US10325588B2 (en) 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
DE68929442T2 (de) * 1988-03-11 2003-10-02 British Telecomm Vorrichtung zur Erfassung von Sprachlauten
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
EP0538536A1 (en) * 1991-10-25 1993-04-28 International Business Machines Corporation Method for detecting voice presence on a communication line
SE470577B (sv) * 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise

Also Published As

Publication number Publication date
SE9301798L (sv) 1994-11-27
SE9301798D0 (sv) 1993-05-26
FI950311A0 (fi) 1995-01-24
WO1994028542A1 (en) 1994-12-08
CN1218945A (zh) 1999-06-09
HK1013881A1 (en) 1999-09-10
KR100220377B1 (ko) 1999-09-15
CN1110070A (zh) 1995-10-11
EP0653091B1 (en) 1999-11-03
FI950311A (fi) 1995-01-24
DE69421498T2 (de) 2000-07-13
GR3032107T3 (en) 2000-03-31
TW324123B (en) 1998-01-01
ES2141234T3 (es) 2000-03-16
AU681551B2 (en) 1997-08-28
CN1046366C (zh) 1999-11-10
AU6901694A (en) 1994-12-20
DK0653091T3 (da) 2000-01-03
AU4811296A (en) 1996-05-23
SE501305C2 (sv) 1995-01-09
DE69421498D1 (de) 1999-12-09
NZ266908A (en) 1997-03-24
SG46977A1 (en) 1998-03-20
RU2127912C1 (ru) 1999-03-20
CA2139628A1 (en) 1994-12-08
KR950702732A (ko) 1995-07-29
US5579432A (en) 1996-11-26
AU670383B2 (en) 1996-07-11
EP0653091A1 (en) 1995-05-17

Similar Documents

Publication Publication Date Title
JPH07509792A (ja) 定常信号と非定常信号との識別
Salami et al. Design and description of CS-ACELP: A toll quality 8 kb/s speech coder
CN102089803B (zh) 用以将信号的不同段分类的方法与鉴别器
EP1747554B1 (en) Audio encoding with different coding frame lengths
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
US5060269A (en) Hybrid switched multi-pulse/stochastic speech coding technique
US5579435A (en) Discriminating between stationary and non-stationary signals
US20050251387A1 (en) Method and device for gain quantization in variable bit rate wideband speech coding
JP2007534020A (ja) 信号符号化
KR20080083719A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
US8078457B2 (en) Method for adapting for an interoperability between short-term correlation models of digital signals
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
US20130054230A1 (en) Estimation of speech energy based on code excited linear prediction (celp) parameters extracted from a partially-decoded celp-encoded bit stream and applications of same
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
WO2012153165A1 (en) A pitch estimator
KR20070017379A (ko) 오디오 신호를 부호화하기 위한 부호화 모델들의 선택
NZ286953A (en) Speech encoder/decoder: discriminating between speech and background sound
Miki et al. Pitch synchronous innovation code excited linear prediction (PSI‐CELP)
Motlíček et al. Optimal pitch path tracking for more reliable pitch detection
Serizawa et al. A Fast Method of Calculating High-Order Backward LP Coefficients for Wideband CELP Coders
JPS63237100A (ja) 音声検出器
Kibey et al. A fast LSF search algorithm based on interframe correlation in G. 723.1