JPH03504283A - 音声の動作特性検出 - Google Patents

音声の動作特性検出

Info

Publication number
JPH03504283A
JPH03504283A JP1503772A JP50377289A JPH03504283A JP H03504283 A JPH03504283 A JP H03504283A JP 1503772 A JP1503772 A JP 1503772A JP 50377289 A JP50377289 A JP 50377289A JP H03504283 A JPH03504283 A JP H03504283A
Authority
JP
Japan
Prior art keywords
value
detection device
signal
conversation
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1503772A
Other languages
English (en)
Other versions
JP3321156B2 (ja
Inventor
フリーマン,ダニエル・ケネス
ボイド,イヴン
Original Assignee
ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB888805795A external-priority patent/GB8805795D0/en
Priority claimed from GB888813346A external-priority patent/GB8813346D0/en
Priority claimed from GB888820105A external-priority patent/GB8820105D0/en
Application filed by ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー filed Critical ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー
Publication of JPH03504283A publication Critical patent/JPH03504283A/ja
Application granted granted Critical
Publication of JP3321156B2 publication Critical patent/JP3321156B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】 音声の動作特性検出 音声の動作特性検出器(voice  activitydetector)は 、会話の期間、又はノイズのみを含む期間を検出する目的を有する信号が供給さ れる装置である。
この発明はこれらの応用に限るものではなく、そのような検出器に関するこの発 明の特定な実施例には、移動ラジオ電話システムがあり、このシステムにおいて 会話は会話コーグ(coder)によって利用され、電波スペクトルの有効な利 用法を改善し、又、それらのシステムではノイズレベル(車に搭載されたユニッ トからの)は一般に大きい。
音声の動作特性検出の本質は、会話と会話ではない期間の間で異なる分量を探す ことである。会話コーグを含む装置において、一つコーグから、又は他のステー ジから、多くのパラメータを容易に用いることができ、従ってそのようなパラメ ータを利用することによって、必要な処理を経済的に簡素にすることが望まれる 。多くの状況において、主要なノイズはある周波数スペクトルの限られた領域内 に発生する。例えば移動する車のノイズ(例えばエンジンノイズ)は、低い周波 数帯域スペクトルである。ノイズスペクトルのそのような位置に関する認識が利 用できる場合は、比較的少ないノイズを含むスペクトル部分から得られた測定量 について、会話が存在するかどうかの判断の基準を置くのが望ましい。勿論、会 話の動作特性を検出して分析する前に、信号を濾波することが実際に可能である が、音声の動作特性検出器が会話コーグの出力に依存している場合、この前段濾 波はコード化される音声信号を妨害する。
この発明の第1の局面によれば、入力信号を受信する手段と、入力信号のノイズ 信号成分を概算する手段と、入力信号とノイズ信号成分の間のスペクトル的類似 性の測定値Mを連続的に形成する手段と、測定値Mから得られたパラメータをス レショルド値(threshold  value)Tと比較する手段と、前記 値が超過されたかどうかに依存して、会話が存在するかどうかを示す出力を発生 する手段を具備する音声の動作特性検出器が提供される。
この発明の第2の局面によれば、入力信号部分と以前の入力信号部分の間の類似 性を示すスペクトル的歪み値を連続的に形成する手段と、連続する測定値の間の 変化程度をスレショルド値と比較し、前記値が越えられたかどうかに依存して、 会話が存在するかどうかを示す出力を生成する手段を具備する音声の動作特性検 出装置が提供される。
その測定値は、板金・斎藤による歪み値であることが望ましい。
この発明の他の局面は特許請求の範囲に含まれる。
この発明の幾つかの実施例が添付図面を参照してこれより説明される。
第1図はこの発明の第1実施例を示すブロック図;第3図はこの発明の好適な第 3実施例を示す。
この発明による音声の動作特性検出器の第1実施例を特徴付ける一般原則か次に 示される。
n個の信号サンプル (SO’   1’  2’  3’  4     n−1)は・パルス応答 (1,ho、h2.h3)の概念上の4次有限パルス応答(F I R)デジタ ルフィルタを通過するとき、濾波された信号となり(以前のフレームからのサン プルを無視する)、0次の自己相関係数は、各項の2乗の合計値であり、それは 正規化され、即ち項の全数によって分割され(一定フレーム長に関し、その分割 を省略するのが容易である)、従って濾波された信号の合計値は、 従ってこれは、論理的に濾波された信号S゛の電力量、即ち概念的フィルタの通 過帯域内の信号Sの部分の電力量である。
最初の4項を無視して拡張すると、 + hoS4S3  ” hoSo   ” hohlS3S2  + hoh 2S3Sl、  ” hoh3535゜+ hIS4S2  ” hohIS3 S2  ÷hls2” h1h2S2Sx  ” hxh3s25゜従って、R −oは、値R′。が応答する周波数帯域を決定する括弧でくくった定数によって 重み付けされた自己相関係数R6の結合によって得られる。実際、括弧でくくっ た項は論環フィルタのパルス応答の自己相関係数であり、従って上記表現は次の ように簡単に現すことができる。
ここで、Nはフィルタの次数、Hlはフィルタのパルス応答の(正規化されてい ない)自己相関係数。
即ち、信号濾波の信号自己相関係数に関する効果は、要求されるフィルタが有す るパルス応答を用い、(濾波されていない)信号の自己相関係数の合計を生成す ることによってシミュレー) (s imu la t e)することができる 。
従って、乗算動作の小さい数を含む比較的簡単なアルゴリズムは、この数の10 0回の乗算動作を一般に必要とするデジタルフィルタのシミュレーションを行う ことができる。
一方、この濾波動作は、信号スペクトルが参照スペクトルに対して整合している (matched)状態で(論理フィルタの逆相応答)、スペクトル比較の形式 として見ることができる。この応用における論理フィルタはノイズスペクトルの 逆を概算するように選択されるので、この動作は、スペクトル間の非類似性をを 示す値のような、会話及びノイズのスペクトルと、生成される0次自己相関係数 (即ち逆濾波された(M号のエネルギ)とのスペクトル的比較として見ることが できる。板倉・斎藤による歪み値が、予測フィルタ(predistor  f ilter)と入カスベクトルの整合を評価するLPC内に用いられ、一つの形 式は次のように示される。
ここで、AoなどはLPGパラメータ・セットの自己相関係数である。これは前 記得られた関係に非常に類似していることが判り、LPC係数が入力信号の逆ス ペクト応答を有するFIRのタップ(taps)であり、それによってLPG係 数セットは逆LPGフィルタのパルス応答であることを考えれば、実際、板倉・ 斎藤による歪み値は単に式1の一形式であり、そこでフィルタ応答Hは入力信号 の全ポールモデル(all−pole  model)であることは明らかであ る。
事実、試験スペクトルのLPC係数と参照スペクトルの自己相関係数を用いて、 転換し、スペクトル的類似性の異なる値を得ることができる。
I−3による歪み値は、”ベクトル量子化に基づく会話の符号イ’C”  (” 5peech  Coding  based  upon  Vector   Quantisation”byA   Buzo、A  HGray、RM   Gray   and   J   D  Markel、  IEE   Trans   on   ASSP、Vol   ASSP−28,No5, 0ctober1980)に更に詳細に説明されている。
信号のフレ−ムは単に有限鎖長を有し、項の数(N、ここでNはフィルタ次数) は無視されるので、前述の結果は単に概算である。しかし、それは会話がある可 動かを非常に良く示し、従って会話報告の値Mとして用いられる。ノイズスペク トルが既知であり、それが静的ノイズの場合、固定のho、hlなどの係数を逆 ノイズフィルタに適用することは十分可能である。
しかし、異なるノイズ状況に適合することができる装置は更に有益でゐる。
第1図にはこの発明の第1実施例が示され、マイクロホン(図示されず)からの 信号Sは入力−に受信され、アナログ・デジタルコンバータ2によって、適切な サンプリングレート(sampl ing  rate)でデジタルサンプルに 変換される。LPG分析ユニット3(一般的なLPCコーダ[coder])は 、n個(例えば160個)のサンプルの連続するフレームについて、入力の会話 を示すために送信されるN個(例えば8又は12個)のLPCフィルタ係数り。
の−組を得る。会話信号Sは又、相関ユニット(correlator  un it)4’(通常これはLPCコーダ3の一部分である。なぜならば、ここで分 離相関器[5eparate  crrelator]を供給することが評価で きるが、会話の自己相関ベクトルR6は通常LPG分析の1ステップとして生成 されるからである)に入力される。相関器4は自己相関ベクトルR3を発生し、 ベクトルR2は0次相関係数I Ro、及び少なくとも更に2つの自己相関係数R1、R2、R3を含む。これら はマルチプライアユニット(multiplier  unit)5に供給され る。
第2人力11はスピーカから離れて配置される第2マイクロホンに接続され、背 景ノイズのみが受信される。このマイクロホンからの入力は、ADコンバーター 2によってデジタル入力サンプル列に変換され、LPGアナライザ13によりて LPC分析される。アナライザ13から発生した”ノイズ′LPG係数は相関ユ ニット14を通過し、それによって発生した自己相関ベクトルは、マルチプライ ア5の会話マイクロホンからの入力信号の自己相関係数R4によって項ごとに乗 算され、それによって生成された重み係数は等式1に従って加算器6によって加 算され、それによってノイズのみのマイクロホンからのノイズスペクトルの逆相 形状を有するフィルタを提供しく実際は信号・パルス・ノイズ・マイクロホンに おけるノイズスペクトルと同一形状である)、従って殆どのノイズを濾波する。
その結果的測定値Mはスレショルダ(thresholder)7によってスレ ショルド値(threshold)と比較され、会話が存在するかどうかを示す ロジック出力8を発生する。ここでMが大きい場合、会話が存在すると考えられ る。
この実施例では2つのマイクロホンと2つのLPCアナライザを使用するが、費 用と複雑性が増大するが、必要であればこれらを増やすことができる。
一方、他の実施例では、ノイズマイクロホン11からの自己相関、及びメインマ イクロホン1からのLPC係数を使用して形成される対応する値を使用する。そ の場合、LPCアナライザではなく、更に他の自己相関器が必要となる。
従ってこれらの実施例は、異なる周波数のノイズを有する異なる状況、又は与え られた一つの状況において、変化するノイズスペクトルの存在する所で動作する ことが可能である。
第2図の好適実施例においては、LPC係数の一組(又はその−組の自己相関ベ クトル)を格納するバッファ15が提供され、これらの値は、”ノンスピーチ( non−speech)(即ちノイズのみ)”として定義される期間に、マイク ロホン人力−から得られる。これらの値は等式1による値を得るために使用され 、勿論この測定は、板倉・斎藤による歪み測定法に対応するが、LPC係数の現 在のフレームではなく、逆相ノイズスペクトルの概算値に一致する、LPC係数 の格納された単一フレームが使用されるところが異なる。
アナライザ3によって出力されるLPG係数ベクトルL。
■ も又、相関器14に導かれ、それによってLPC係数ベクトルの自己相関ベクト ルを発生する。バッファメモリー5はスレショルダ7のスピーチ/ノンスピーチ 出力によって制御され、 “スピーチ′フレームの間、バッファは“ノイズ”自 己相関係数を保持するが、”ノイズ”フレームの間は、LPC係数の新たな一組 が、例えば複合スイッチ16によってバッファを更新するのに使用することかで き、このスイ、ノチ16を介して、各自己相関係数を伝送する相関器14の出力 かバッファ15に接続される。相関器14かバッファ15の後に配置されてもよ い。更に、係数更新のためのスピーチ/ノンスピーチの決定は出力8からである 必要はなく、(好適に)他の方法で得ることができる。
会話の無い期間がしばしば発生するので、バッファに格納されたLPC係数は時 折更新され、それによって装置はノイズスペクトル内の変化に追随することがで きる。ノイズスペクトルが時間的に比較的安定している場合(多くの場合そうで あるが)、そのようなバッファの更新は、極く希に、又は検出器の初期の動作の みに必要とされると考えられが、移動する(車の)ラジオのような状況のときに は、しばしば更新するのが望ましい。
この実施例の変更例として、簡単な固定バイパス・フィルタに一致する係数項を 有する等式1をシステムは適用し、次に″ノイズ期間″LPC係数を使用して切 り替わることによってシステムは適合を開始する。幾つかの理由によって会話検 出が失敗した場合、システムは簡単なバイパスフィルタを再び用いることができ る。
上記値をRoで割ることによって正規化することができ、スレショルドと比較さ れる表現は、 ト この値はフレームの総合信号電力とは独立しており、従って総合信号レベル変化 に関しては補償されるが、“ノイズと”会話“レベルの間の著しい対比を与えず 、従ってノイズの大きな環境では好適に使用されることはない。
(後述されるように)ノイズスペクトルが徐々に変化するとき、(前述の様々な 実施例におけるノイズマイクロホン又はノイズのみの期間から得られる)ノイズ 信号の逆フイルタ係数を得るためにLPC分析を用いる代わりに、一般的な適合 性フィルタ(adaptive  filter)を用いて逆相ノイズスペクト ルの原型を生成することができ、そのようなフィルタに共通する比較的低速な適 合率を得ることができる。第1図に一致する実施例において、LPG分析ユニッ ト13は容易に適合性フィルタ(例えばトランスバーサル(transvers al)FIR又はラティスフィルタ(lattice  filter))と交 換することができ、そのフィルタは、逆フィルタの原型を生成することによって 、ノイズ入力をホワイトノイズに転換するためにシステムに接続され、その係数 は前述のように自己相関器14に供給される。
第2図に示される第2実施例において、LPG分析手段3は、そのような適合器 フィルタと置換され、バッファ手段15は省略される。しかし、スイッチ16は 、適合性フィルタこの発明の他の局面に対応する第2の音声の動作特性検出器が これより説明される。
以下の説明において、LPG係数ベクトルは、FIRフィルタの単にパルス応答 であり、FIRフィルタは入力信号の逆位相スペクトル形状であることは明らか である。隣接するフレームの間に板倉・斎藤による歪み値が形成されるとき、以 前のフレームのLPGフィルタによって濾波されているので、実際にその値は信 号の電力に等しい。従って隣接するフレームのスペクトルに違いが殆どない場合 、フレームの対応する僅かなスペクトル電力は濾波を免れ、その値は小さいであ ろう。同時に、フレーム間の大きなスペクトルの相違は大きな板倉・斎藤歪み値 を発生し、それによってその値は隣接するフレームのスペクトルの類似性を反映 する。スピーチコーダに関して、データレートを最小とすることによって、フレ ーム長をできるだけ長くするのが望ましい。即ち、フレーム長が十分長ければ、 会話信号はフレームからフレームへの重要なスペクトル変化を示す(もしそうで なければコード化は冗長である)。一方、ノイズはフレームからフレームへ徐々 に変化するスペクトル形状を有し、会話が信号に存在しない期間において、以前 のフレームから逆相LPCフィルタを適用し、殆どのノイズ電力を′フィルタア ウト(filter  out)“するので、板倉・斎藤による歪み値はそれに 対応して少ない。
断続的な会話を含み、ノイズの多い信号の隣接するフレーム間の板金°斎藤歪み 値は、一般にノイズの期間より会話の期間の方が大きく、変化の程度(標準偏倚 によって示されるように)は大きく、断続的な変化は少ない。
ここで、Mの標準偏差(standard  deviation)も信頼でき る値であり、各標準偏差をとる効果は本質的に値を円滑にすることである。
音声の動作特性検出器のこの第2の形態において、会話が存在するかどうかを判 断するのに用いる測定されたパラメータは、板倉・斎藤歪み値の標準偏差である ことが望ましいが、変化を測定する他の方法、及び(例えばFFT分析に基づく )スペクトル歪みを測定する他の方法を適用することができる。
音声の動作特性検出に適合性スレショルド(adaptive  thresh old)を用いることにも利点がある。
そのようなスレショルドは、会話期間の間は調整されるべきではなく、調整され ると会話信号はスレショルドアウト(threshold  out)される。
従ってスピーチ/ノンスピーチ制御信号を用いてスレショルド・アダプタを制御 する必要があり、この制御信号はスレショルド・アダプタの出力から独立してい るのが望ましい。スレショルドTは、ノイズのみが存在するとき、値Mのレベル 以上のレベルに保たれるように調整される。その値はノイズが存在するとき一般 にランダムに変化するので、多くのブロックについての平均しベルを決定し、ス レショルドをこの平均レベルに比例するレベルに設定することによって、スレシ ョルドが変化する。しかし、これはノイズの多い状況では一般に十分ではなく、 幾っかのブロックについてのパラメータの変化程度に関する査定か考慮される。
従ってスレショルド値Tは次式に従って計算される。
ここでMは、連続する多くのフレームについての測定値の平均値であり、dはそ れらフレームについてのml定値の標準偏差であり、Kは定数である(代表的に は2である)。
実際的に、会話の存在しないことが示された直後に再び適合動作を開始すべきで はなく、(適合及び非適合状態の間に繰り返される急速なスイッチングを避ける ために)降下が安定したことを確認するまで待つべきである。
第3図は前述の事柄を具備するこの発明の好適実施例であり、入力1はアナログ ・デジタルコンバータ(ADC)2+、:よってサンプルされ、デジタル化され た信号を受信し、逆相フィルタアナライザ3の入力に信号を供給し、逆相フィル タアナライザ3は実際に音声の動作特性検出器が動作するスピーチコーグの一部 であり、又、入力信号スペクトルの逆相に一致するフィルタの係数り、(代表的 に8)を発生する。デジタル信号は又、(アナライザ3の一部である)自己相関 器4に供給され、自己相関器4は入力信号(又は少なくともそれらがLPC係数 と同じ(らい多くの低次項)の自己相関ベクトルR1を発生する。装置のこれら の部分の動作は第1図及び第2図に示される。自己相関係数R1は好適に、連続 する幾つかのスピーチフレーム(代表的に5〜20m5)について平均値がとら れ、それらの信頼度が改善される。この平均化は、バッファ4a内の自己相関器 4によって出力される自己相関係数の各組を格納し、平均器(averager )4bを用いて、現在の自己相関係数R5、及びバッファ4aに格納されバッフ ァ4aから供給される以前のフレームからの係数の重み付けされた加算値を生成 することによって達成される。それによって得られた平均化された自己相関係数 Ra、は重み付は及び加算手段5.6に供給され、この手段は又、バッファ15 を介して自己相関器14から格納されたノイズ期間の逆相フィルタ係数り、の自 己相関ベクトルA、を受信し、Ra、及びA、から次式により定義される値Mを 形成する。
この値はスレショルダ7によって、スレショト値と比較され、会話が存在するか しないかを示す論理結果が出力8に発生する。
逆相フィルタ係数り、がノイズスペクトルの逆相の適切な概算に一致するために 、これらの係数をノイズの期間に更新するのが望ましい(勿論、会話の期間には 更新しない)。しかし、その更新に基づくスピーチ/ノンスピーチの決定はその 更新の結果に影響されず、又は誤って確認された信号の単一フレームによって、 音声の動作特性検出器は結果的に“ロックはずれ(out  of  1ock )″となり、次のフレームを誤って認識する。従って制御信号発生回路20、即 ち分離音声の動作特性検出器が提供され、この検出器は会話が存在するかどうか を示す独立制御信号を形成し、逆相フィルタアナライザ3(又はバッファ8)を 制御し、それによって値Mを形成するのに用いられる逆相フィルタ自己相関係数 A、は”ノイズ”期間にのみ更新される。制御信号発生回路2OはLPGアナラ イザ21を含み(これは再び会話コーグの一部であり、特にアナライザ3によっ て実行される)、このアナライザは、入力信号及び自己相関器21a(自己相関 器3aによって実行することができる)に一致する一組のLPC係数M、を発生 し、自己相関器21aはM の自己相関係数B、を得る。アナライザ3がアナラ イザ3によって実行された場合は、M、−L、、及びB 、 −A 、である。
これら自己相関係数は、重み付は及び加算手段22.23(5,6に同等)に供 給され、この手段も自己相関器4からの入力信号の自己相関ベクトルR3を受信 する。従って、入力スピーチフレームと以前のスピーチフレームの間のスペクト ル的類似性が計算される。これは前記したように、現在のフレームのR1と以前 のフレームのBiの間の板倉・斎藤歪み値、又は現在のフレームのRiとB、に 関する板倉・斎藤歪み値を計算することによって得られ、又は対応する値をバッ ファ24に格納された以前のフレームに関して減算することによって得られ、ス ペクトル的に異なる信号を発生する(それぞれの場合、その値はRoで分割する ことによってエネルギ・正規化されるのが望ましい)。勿論ここでバッファ24 は更新される。このスペクトル的に異なる信号は、スレショルダ26話が存在す るかどうかを示す。音声とはならない会話からのノイズを区別するためにこの方 法は優れているが(従来のシステムにおいて可能なタスク(task))、音声 となった会話からノイズを区別する能力は一般に少ないことが発見された。従っ て、回路20には、ピッチアナライザ(pitch  analyser)27  (実際にスピーチコーグの一部として動作することができ、特にマルチパルス LPCコーダ内に生成される算定器(predictor)の長い遅延値測定す ることができる)を具備する音声の会話検出回路が提供されるのが望ましい。ピ ッチアナライザ27は、音声となった会話が検出されたとき”真理(true) ’であるロジック信号を発生し、この信号は、スレショルダ26(音声とはなら ない会話が存在するとき、一般に′真理′である)から得られるスレショルド値 と結合され、NORゲート28の入力に供給され、会話が存在するとき“誤り( false)”であり、ノイズが存在するとき′真理“である信号を発生する。
この信号はバッファ8(又は逆相フィルタアナライザ3)に供給され、それによ って逆相フィルタ係数Liは、ノイズ期間のみに更新される。
スレショルドアダプタ29も又接続され、制御信号発生回路20のノンスピーチ 信号制御出力を受信する。スレショルドアダプタ29の出力はスレショルダ7に 供給される。スレショルドアダプタ29の出力はスレショルダ7に供給される。
スレショルドアダプタは、スレショルドがノイズ電力レベルに近付くまで(これ は、例えば回路22.23の加算及び重み付けすることによって容易に得られる )、瞬時スレショルドレベルに比例するステップに、スレショルドをインクリメ ント(inc remen t)又はデクリメント(decrement)する ように動作する。入力信号が非常に小さいとき、スレショルドは自動的にローレ ベルに設定されるのか望ましい。なぜならば、小さい信号レベルのとき、ADC 2によって生成される信号量は信頼できる結果を生成できないからである。
更に″ハングオーバ(hangover)”発生手段30が提供され、これはス レショルダ7の後の会話を示す期間を測定し、所定時定数を越える期間の間、会 話の存在が示されたとき、その出力は短い″ハングオーバの間、ハイに維持され る。このようにして、ローレベルな会話バーストの中間の欠損(c l ipp  ing)が避けられ、適切な時定数の選択によって、会話のときに誤って示さ れた短いスパイクノイズによりハングオーバ発生器30の起動を防ぐことができ る。
のデジタル処理手段、例えば、LPGコーデックの一部として構成され(これは 所望される構成である)、又は関連するメモリ装置を有する適切にプログラムさ れたマイクロコンピュータやマイクロコントローラチップとして構成されるデジ タル信号処理チップ(DSP)などのような手段によって実行することができる 。
前述したように、音声検出装置はLPGコーデックの一部として容易に構成され ることができる。一方、信号の自己相関係数、又はそれに関連する値(部分相関 又は゛パルコール(parcor)”係数)が離れたステーションに送信される 場合、音声検出はコーデックから離れて行われる。
FI6.3゜ 補正書の翻訳文提出書(特許法第184条の8)1、国際出願番号 PCT/GB89100247 2、発明の名称 音声の動作特性検出 3、特許出願人 住所 イギリス国 イー・シー1ニー、7エイ・ジエイ。
ロンドン、ニューゲイト・ストリート81国籍 イギリス国 4、代理人 東京都千代田区霞が関3丁目7番2号 〒ioo  電話 03 (502)3181 (大代表)(5847)  弁 理士  鈴  江  武  彦(ほか3名) 5、補正書の提出年月日 1920年2月−)?日 /920キJ8と日 6、添付書類の目録 (1)補正書の翻訳文      1通合話の動作特性を検出して分析する前に 、信号を濾波することが実際に可能であるが、音声の動作特性検出器が会話コー グの出力に依存している場合、この前段濾波はコード化される音声信号を妨害す る。
この発明によれば、入力信号を受信する手段と、入力信号のノイズ信号成分を適 合して周期的に概算する手段と、入力信号とノイズ信号成分の間のスペクトル的 類似性の測定値Mを周期的に形成する手段と、測定値Mから得られたパラメータ をスレショルド値(threshold  value)Tと比較する手段と、 前記値が超過されたかどうかに依存して、会話が存在するかどうかを示す出力を 発生する手段を具備する音声の動作特性検出器が提供される。
その測定値は、板金・斎藤による歪み値であることが望ましい。
この発明の他の局面は特許請求の範囲に含まれる。
この発明の幾つかの実施例が添付図面を膠照してこれより説明される。
第1図はこの発明の第1実施例を示すブロック図;第2図はこの発明の第2実施 例を示し:この値はフレームの総合信号電力とは独立しており、従って総合信号 レベル変化に関しては補償されるが、″ノイズと”会話″レベルの間の著しい対 比を与えず、従ってノイズの大きな環境では好適に使用されることはない。
(後述されるように)ノイズスペクトルが徐々に変化するとき、(前述の様々な 実施例におけるノイズマイクロホン又はノイズのみの期間から得られる)ノイズ 信号の逆フイルタ係数を得るためにLPC分析を用いる代わりに、一般的な適合 性フィルタ(adaptive  filter)を用いて逆相ノイズスペクト ルの原型を生成することができ、そのようなフィルタに共通する比較的低速な適 合率を得ることができる。第1図に一致する実施例において、LPG分析ユニッ ト13は容易に適合性フィルタ(例えばトランスバーサル(t ransver sal)FIR又はラティスフィルタ(lattice  filter))と 交換することができ、そのフィルタは、逆フィルタの原型を生成することによっ て、ノイズ入力をホワイトノイズに転換するためにシステムに接続され、その係 数は前述のように自己相関器14に供給される。
第2図に示される第2実施例において、LPC分析手段3は、そのような適合性 フィルタと置換され、バッファ手段15は省略される。しかし、スイッチ16は 、適合性フィルタが会話期間の間、その係数を適合するのを防止するために動作 する。
この発明の他の実施例に使用される第2の音声の動作特性検出器がこれより説明 される。
以下の説明において、LPG係数ベクトルは、FIRフィルタの単にパルス応答 であり、FIRフィルタは入力信号の逆位相スペクトル形状であることは明らか である。隣接するフレームの間に板倉・斎藤による歪み値が形成されるとき、以 前のフレームのLPGフィルタによって濾波されているので、実際にその値は信 号の電力に等しい。従って隣接するフレームのスペクトルに違いが殆どない場合 、フレームの対応する僅かなスペクトル電力は濾波を免れ、その値は小さいであ ろう。同時に、フレーム間の大きなスペクトルの相違は大きな板倉・斎藤歪み値 を発生し、それによってその値は隣接するフレームのスペクトルの類似性を反映 する。スピーチコーグに関して、データレートを最小とする二とによって、フレ ーム長をできるだけ長くするのが望ましい。即ち、フレーム長が十分長ければ、 会話信号はフレームからフレームへの重要なスペクトル変化を示す(もしそうで なければコード化は冗長である)。一方、ノイズはフレームからフレームへ徐々 に変化するスペクトル形状を有し、会話か信号に存在しない期間において、以前 のフレームから逆相LPCフィルタを適用し、殆どのノイズ電力を“フィルタア ウト(filter  out)“するので、板倉・斎藤による歪み値はそれに 対応して少ない。
断続的な会話を含み、ノイズの多い信号の隣接するフレーム間の板倉・斎藤歪み 値は、一般にノイズの期間より会話の期間の方が大きく、変化の程度(標準偏倚 によって示されるヨウニ)モ大きく、断続的な変化は少ない。
ここで、Mの標準偏差(standard  deviation)も信頼でき る値であり、各標準偏差をとる効果は本質的に値を円滑にすることである。
音声の動作特性検出器のこの第2の形態において、会話が存在するかどうかを判 断するのに用いる測定されたパラメータは、板倉・斎藤歪み値の標準偏差である ことが望ましいが、変化を測定する他の方法、及び(例えばFFT分析に基づく )スペクトル歪みを測定する他の方法を適用することができる。
音声の動作特性検出に適合性スレショルド(adaptive  thresh old)を用いることにも利点がある。
そのようなスレショルドは、会話期間の間は調整されるべきではなく、調整され ると会話信号はスレショルドアウト(threshold  out)される。
従ってスピーチ/ノンスピーチ制御信号を用いてスレショルド・アダプタを制御 する必要があり、この制御信号はスレショルド・アダプタの出力から独立してい るのが望ましい。スレショルドTは、ノイズのみが存在するとき、値Mのレベル 以上のレベルに保たれるように調整される。その値はノイズが存在するとき一般 にランダムに変化するので、多くのブロックについての平均しれらがLPG係数 と同じくらい多くの低次項)の自己相関ベクトルR1を発生する。装置のこれら の部分の動作は第1図及び第2図に示される。自己相関係数R1は好適に、連続 すす る幾つかのスピーチフレーム(代表的に5〜20m5)について平均値がとられ 、それらの信頼度が改善される。この平均化は、バッファ4a内の自己相関器4 によって出力される自己相関係数の各組を格納し、平均器(averager) 4bを用いて、現在の自己相関係数R4、及びバッファ4aに格納されバッファ 4aから供給される以前のフレームからの係数の重み付けされた加算値を生成す ることによって達成される。それによって得られた平均化された自己相関係数R a、は重み付は及び加算手段5.6に供給され、この手段は又、バッファ15を 介して自己相関器14から格納されたノイズ期間の逆相フィルタ係数り、の自己 相関ベクトルA、を受信し、Ra、及びA、から次式により定義される値Mを形 成する。
この値はスレショルダ7によって、スレショト値と比較され、会話が存在するか しないかを示す論理結果が出力8に発生ずる。
逆相フィルタ係数り、がノイズスペクトルの逆相の適切な概算に一致するために 、これらの係数をノイズの期間に更新するのが望ましい(勿論、会話の期間には 更新しない)。しかし、その更新に基づくスピーチ/ノンスピーチの決定はその 更新の結果に影響されず、又は誤って確認された信号の単一フレームによって、 音声の動作特性検出器は結果的1ごロックはずれ(out  of  1ock )”となり、次のフレームを誤って認識する。従って制御信号発生回路20、即 ち分離音声の動作特性検出器が提供され、この検出器は会話が存在するかどうか を示す独立制御信号を形成し、逆相フィルタアナライザ3(又はバッファ8)を 制御し、それによって値Mを形成するのに用いられる逆相フィルタ自己相関係数 A、は”ノイズ′期間にのみ更新される。制御信号発生回路2OはLPGアナラ イザ21を含み(これは再び会話コーグの一部であり、特にアナライザ3によっ て実行される)、このアナライザは、入力信号及び自己相関器21a(自己相関 器3aによって実行することができる)に一致する一組のLPC係数M、を発生 し、自己相関器21aはM、の自己相関係数B、を得る。アナライザ21がアナ ライザ3によって実荷重 された場合は、M、−L、、及びB 、 −A 、である。これら自己相関係数 は、重み付は及び加算手段22.23(5,6に同等)に供給され、この手段も 自己相関器4からの入力信号の自己相関ベクトルR1を受信する。従って、入カ スピーチフレームと以前のスピーチフレームの間のスペクトル的類似性が計算さ れる。これは前記したように、現在のフレームのR1と以前のフレームのB、の 間の板倉・斎藤歪み値、又は 鵜゛1匁′特許請求の範囲 1、入力信号を受信する手段と、入力信号のノイズ信号成分を概算する手段と、 入力信号とノイズ信号成分のスペクトル的類似性を示す値Mを周期的に発生する 手段と、値Mから得られたパラメータをスレショルド値Tと比較し、前記値が越 えられたかどうかに依存して、会話が存在するかどうかを示す出力を生成する手 段を具備することを特徴とする音声の動作特性検出装置。
2、前記ノイズ概算手段は、前記ノイズ信号成分の短時間スペクトルの逆を概算 する応答を有するFIRフィルタのパルス応答の自己相関係数A、をコンピュー タにより計算する手段と、及び前記信号の自己相関係数Riをコンピュータによ り計算する手段とR1及びA、の受信に接続され、それらからMを計算する手段 とを有する値形成手段を具備し、前記パラメータはMの値であるを特徴とする請 求項1記載の検出装置。
3、前記装置は、 であるを特徴とする請求項2記載の検出装置。
4、前記装置は、 であるを特徴とする請求項2記載の検出装置。
5、同様にノイズの影響下にあり会話の存在しない第2信号を受信するように構 成される入力であって、A、計算手段は前記第2信号からA、の値を得るLPG 分析手段を有する入力を更に具備することを特徴とする請求項2乃至4記載の検 出装置。
6、前記装置は、前記フィルタ応答の自己相関係数Aiが得られる格納されたデ ータに接続されるバッファであって、前記フィルタ応答はLPG分析手段によっ て前記信号から周期的に計算されるバッファを更に具備し、値Mは前記格納され たデータを用いて計算され、前記格納されたデータは会話が存在しないことが示 される期間からのみ更新されることを特徴とする請求項2乃至4記載の検出装置 。
7、前記ノイズ概算手段は適合性フィルタを更に具備することを特徴とする請求 項2乃至4記載の検出装置。
8、前記信号の前記自己相関係数を計算する前記手段は、前記信号の幾つかの連 続する部分の自己相関係数に基づいて計算するように構成されることを特徴とす る請求項2乃至6記載の検出装置B0 9、前記値Mはスペクトル歪み値であることを特徴とする請求項1記載の検出装 置。
10、前記値Mは板金・斎藤による歪み値であることを特徴とする請求項9記載 の検出装置。
11、前記装置は、会話の存在しないことが示される期間に、前記所定スレショ ルドTを調節する手段を更に具備することを特徴とする請求項1乃至10記載の 検出装置。
12、前記装置は、会話が存在するとき、前記スレショルド値の調節を禁止する ように構成される第2の音声の動作特性検出手段を更に具備することを特徴とす る請求項11記載の検出装置。
13、前記スレショルド値Tは、調節されるときは、前記値と、前記値の標準偏 差の関数である項の和の平均値に等しくなるように調節されることを特徴とする 請求項11又は12記載の検出装置。
14(補正後)、前記装置は、前記格納されたデータの更新を制御するために会 話の存在しないことを示す手段であって、前記会話の存在しないことを示す手段 は、第2の音声の動作特性検出手段であることを特徴とする請求項6記載の検出 装置。
15(補正後)、前記第2の音声の動作特性検出手段は、スレショルド調整とデ ータ更新の両方を制御することを特徴とする請求項14及び、12又は13記載 の検出装置。
16(補正後)、前記第2の音声検出手段は、前記入力信号部分と以前の前記入 力部分の間のスペクトル的類似性を示す値を生成する手段を具備することを特徴 とする請求項12.13に従属する14又は15記載の検出装置。
17(補正後)、前記類似性を示す値を生成する手段は、現在の前記入力部分に 関係する自己相関データとLPCフィルタデータから得られる現在の歪み値を供 給する手段と、以前の信号部分に一致する同等な過去のフレーム歪み値を供給す る手段と、及び会話が存在するかどうかを示す指示装置として、それらの間の類 似性の程度を示す信号を生成する手段を具備することを特徴とする請求項16記 載の検出装置。
18(補正後)、前記第2の音声の動作特性検出手段は、会話音声の存在を示す 信号を生成するピッチ分析手段を有する出手段の出力は前記会話音声検出手段に 依存することを特徴とする請求項16又は17記載の検出装置。
19(補正後)、信号内の会話の動作特性を検出する方法であって、前記信号の ノイズスペクトルを周期的に再度概算するステップと、前記信号のスペクトルを 前記概算されたノイズスペクトルと比較するステップと、それらスペクトルの間 のスペクトル的類似性を示す可変値を形成するステップと、及び前記値をスレシ ョルドと比較するステップを有することを特徴とする方法。
20(補正後)、請求項1乃至18記載の装置を有することを特徴とする会話信 号を符号化する装置。
21(補正後)、請求項1乃至18、又は20記載の装置を有することを特徴と する自動車電話装置。
22(補正後)、第1図、又は第2図、又は第3図を参照して、本明細書に説明 された装置と実質的に同一の音声の動作特性検出装置。
23(補正後)1本明細書に説明された方法と実質的に同一の方法。
国際調査報告 +m、、、+mml A1.、、に#lle、8゜PCT/GB 891002 47国際調査報告

Claims (24)

    【特許請求の範囲】
  1. 1.入力信号を受信する手段と、入力信号のノイズ信号成分を概算する手段と、 入力信号とノイズ信号成分のスペクトル的類似性を示す値Mを周期的に発生する 手段と、値Mから得られたパラメータをスレショルド値Tと比較し、前記値が越 えられたかどうかに依存して、会話が存在するかどうかを示す出力を生成する手 段を具備することを特徴とする音声の動作特性検出装置。
  2. 2.前記ノイズ概算手段は、前記ノイズ信号成分の短時間スペクトルの逆を概算 する応答を有するFIRフィルタのパルス応答の自己相関係数Aiをコンピュー タにより計算する手段と、及び前記信号の自己相関係数Riをコンピュータによ り計算する手段とRi及びAiの受信に接続され、それらからMを計算する手段 とを有する値形成手段を具備し、前記パラメータはMの値であるを特徴とする請 求項1記載の検出装置。
  3. 3.前記装置は、 ▲数式、化学式、表等があります▼ であるを特徴とする請求項2記載の検出装置。
  4. 4.前記装置は、 ▲数式、化学式、表等があります▼ であるを特徴とする請求項2記載の検出装置。
  5. 5.同様にノイズの影響下にあり会話の存在しない第2信号を受信するように構 成される入力であって、Ai計算手段は前記第2信号からAiの値を得るLPC 分析手段を有する入力を更に具備することを特徴とする請求項2乃至4記載の検 出装置。
  6. 6.前記装置は、前記フィルタ応答の自己相関係数Aiが得られる格納されたデ ータに接続されるバッファであって、前記フィルタ応答はLPC分析手段によっ て前記信号から周期的に計算されるバッファを更に具備し、値Mは前記格納され たデータを用いて計算され、前記格納されたデータは会話が存在しないことが示 される期間からのみ更新されることを特徴とする請求項2乃至4記載の検出装置 。
  7. 7.前記ノイズ概算手段は適合性フィルタを更に具備することを特徴とする請求 項2乃至4記載の検出装置。
  8. 8.前記信号の前記自己相関係数を計算する前記手段は、前記信号の幾つかの連 続する部分の自己相関係数に基づいで計算するように構成されることを特徴とす る請求項2乃至6記載の検出装置。
  9. 9.前記値Mはスペクトル歪み値であることを特徴とする請求項1記載の検出装 置。
  10. 10.前記値Mは板倉・斎藤による歪み値であることを特徴とする請求項9記載 の検出装置。
  11. 11.前記装置は、会話の存在しないことが示される期間に、前記所定スレショ ルドTを調節する手段を更に具備することを特徴とする請求項1乃至10記載の 検出装置。
  12. 12.前記装置は、会話が存在するとき、前記スレショルド値の調節を禁止する ように構成される第2の音声の動作特性検出手段を更に具備することを特徴とす る請求項11記載の検出装置。
  13. 13.前記スレショルド値Tは、調節されるときは、前記値と、前記値の標準偏 差の関数である項の和の平均値に等しくなるように調節されることを特徴とする 請求項11又は12記載の検出装置。
  14. 14.入力信号部分と以前の入力信号部分の間の類似性を示すスペクトル的歪み 値を連続的に形成する手段と、連続する測定値の間の変化程度をスレショルド値 と比較し、前記値が越えられたかどうかに依存して、会話が存在するかどうかを 示す出力を生成する手段を具備することを特徴とする音声の動作特性検出装置。
  15. 15.前記変化程度は、連続する測定値のブロックの標準偏差として測定される ことを特徴とする請求項14記載の検出装置。
  16. 16.前記装置は、前記格納されたデータの更新を制御するために会話の存在し ないことを示す手段であって、前記会話の存在しないことを示す手段は、第2の 音声の動作特性検出手段であることを特徴とする請求項6記載の検出装置。
  17. 17.前記第2の音声の動作特性検出手段は、スレショルド調整とデータ更新の 両方を制御することを特徴とする請求項16及び、13記載の検出装置。
  18. 18.前記第2の音声検出手段は、請求項14又は15に従うことを特徴とする 請求項13又は16又は17記載の検出装置。
  19. 19.前記信号のスペクトルを、概算されたノイズスペクトルと比較するステッ プと、それらスペクトル間のスペクトル的類似性を示す可変値を形成するステッ プと、連続する測定値間の変化程度をスレショルドと比較するステップを有する ことを特徴とする方法。
  20. 20.信号内の会話の動作特性を検出する方法であって、前記信号スペクトルを 前記信号の以前の部分と比較するステップと、それらスペクトルの間のスペクト ル的類似性を示す可変値を形成するステップと、及び連続する測定値の間の変化 程度をスレショルドと比較するステップを有することを特徴とする方法。
  21. 21.第1図、又は第2図、又は第3図を参照して、本明細書に説明された装置 と実質的に同一の音声の動作特性検出装置。
  22. 22.請求項1乃至18記載の装置を有することを特徴とする会話信号を符号化 する装置。
  23. 23.請求項1乃至18、又は20記載の装置を有することを特徴とする自動車 電話装置。
  24. 24.本明細書に説明された方法と実質的に同一の方法。
JP50377289A 1988-03-11 1989-03-10 音声の動作特性検出 Expired - Lifetime JP3321156B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GB888805795A GB8805795D0 (en) 1988-03-11 1988-03-11 Voice activity detector
GB8805795 1988-03-11
GB888813346A GB8813346D0 (en) 1988-06-06 1988-06-06 Voice activity detection
GB8813346.7 1988-06-06
GB8820105.8 1988-08-24
GB888820105A GB8820105D0 (en) 1988-08-24 1988-08-24 Voice activity detection

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP32819899A Division JP3423906B2 (ja) 1988-03-11 1999-11-18 音声の動作特性検出装置および検出方法

Publications (2)

Publication Number Publication Date
JPH03504283A true JPH03504283A (ja) 1991-09-19
JP3321156B2 JP3321156B2 (ja) 2002-09-03

Family

ID=27263821

Family Applications (2)

Application Number Title Priority Date Filing Date
JP50377289A Expired - Lifetime JP3321156B2 (ja) 1988-03-11 1989-03-10 音声の動作特性検出
JP32819899A Expired - Lifetime JP3423906B2 (ja) 1988-03-11 1999-11-18 音声の動作特性検出装置および検出方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP32819899A Expired - Lifetime JP3423906B2 (ja) 1988-03-11 1999-11-18 音声の動作特性検出装置および検出方法

Country Status (16)

Country Link
EP (2) EP0548054B1 (ja)
JP (2) JP3321156B2 (ja)
KR (1) KR0161258B1 (ja)
AU (1) AU608432B2 (ja)
BR (1) BR8907308A (ja)
CA (1) CA1335003C (ja)
DE (2) DE68910859T2 (ja)
DK (1) DK175478B1 (ja)
ES (2) ES2188588T3 (ja)
FI (2) FI110726B (ja)
HK (1) HK135896A (ja)
IE (1) IE61863B1 (ja)
NO (2) NO304858B1 (ja)
NZ (1) NZ228290A (ja)
PT (1) PT89978B (ja)
WO (1) WO1989008910A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008504587A (ja) * 2004-06-30 2008-02-14 モトローラ・インコーポレイテッド 吸入ノイズを特性化し、その特性化に基づきパラメータを算出する方法と装置
JP2008505356A (ja) * 2004-06-30 2008-02-21 モトローラ・インコーポレイテッド 通信システムの吸気ノイズを検出して減衰させる方法及び装置

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2643593B2 (ja) * 1989-11-28 1997-08-20 日本電気株式会社 音声・モデム信号識別回路
CA2040025A1 (en) * 1990-04-09 1991-10-10 Hideki Satoh Speech detection apparatus with influence of input level and noise reduced
US5241692A (en) * 1991-02-19 1993-08-31 Motorola, Inc. Interference reduction system for a speech recognition device
FR2697101B1 (fr) * 1992-10-21 1994-11-25 Sextant Avionique Procédé de détection de la parole.
SE470577B (sv) * 1993-01-29 1994-09-19 Ericsson Telefon Ab L M Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
SE501305C2 (sv) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
EP0633658A3 (en) * 1993-07-06 1996-01-17 Hughes Aircraft Co Automatic gain control circuit coupled to the transmission and activated by speech.
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FR2727236B1 (fr) * 1994-11-22 1996-12-27 Alcatel Mobile Comm France Detection d'activite vocale
WO1996034382A1 (en) * 1995-04-28 1996-10-31 Northern Telecom Limited Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
GB2306010A (en) * 1995-10-04 1997-04-23 Univ Wales Medicine A method of classifying signals
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
WO1998001847A1 (en) * 1996-07-03 1998-01-15 British Telecommunications Public Limited Company Voice activity detector
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
DE10052626A1 (de) * 2000-10-24 2002-05-02 Alcatel Sa Adaptiver Geräuschpegelschätzer
CN1617606A (zh) * 2003-11-12 2005-05-18 皇家飞利浦电子股份有限公司 一种在语音信道传输非语音数据的方法及装置
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
US8708702B2 (en) * 2004-09-16 2014-04-29 Lena Foundation Systems and methods for learning using contextual feedback
US8775168B2 (en) * 2006-08-10 2014-07-08 Stmicroelectronics Asia Pacific Pte, Ltd. Yule walker based low-complexity voice activity detector in noise suppression systems
US8175871B2 (en) 2007-09-28 2012-05-08 Qualcomm Incorporated Apparatus and method of noise and echo reduction in multiple microphone audio systems
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8275136B2 (en) 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8611556B2 (en) 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
ES2371619B1 (es) * 2009-10-08 2012-08-08 Telefónica, S.A. Procedimiento de detección de segmentos de voz.
CN102576528A (zh) * 2009-10-19 2012-07-11 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
CN108985277B (zh) * 2018-08-24 2020-11-10 广东石油化工学院 一种功率信号中背景噪声滤除方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3509281A (en) * 1966-09-29 1970-04-28 Ibm Voicing detection system
US4052568A (en) * 1976-04-23 1977-10-04 Communications Satellite Corporation Digital voice switch
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS5636246A (en) * 1979-08-31 1981-04-09 Nec Corp Stereo signal demodulating circuit
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
JPS6196817A (ja) * 1984-10-17 1986-05-15 Sharp Corp フイルタ−

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008504587A (ja) * 2004-06-30 2008-02-14 モトローラ・インコーポレイテッド 吸入ノイズを特性化し、その特性化に基づきパラメータを算出する方法と装置
JP2008505356A (ja) * 2004-06-30 2008-02-21 モトローラ・インコーポレイテッド 通信システムの吸気ノイズを検出して減衰させる方法及び装置

Also Published As

Publication number Publication date
EP0335521A1 (en) 1989-10-04
FI115328B (fi) 2005-04-15
JP2000148172A (ja) 2000-05-26
AU608432B2 (en) 1991-03-28
DK215690A (da) 1990-09-07
NO316610B1 (no) 2004-03-08
KR900700993A (ko) 1990-08-17
AU3355489A (en) 1989-10-05
EP0335521B1 (en) 1993-11-24
FI110726B (fi) 2003-03-14
NO982568D0 (no) 1998-06-04
CA1335003C (en) 1995-03-28
ES2188588T3 (es) 2003-07-01
FI20010933A (fi) 2001-05-04
BR8907308A (pt) 1991-03-19
KR0161258B1 (ko) 1999-03-20
NO304858B1 (no) 1999-02-22
IE61863B1 (en) 1994-11-30
WO1989008910A1 (en) 1989-09-21
DE68910859T2 (de) 1994-12-08
JP3321156B2 (ja) 2002-09-03
DE68929442D1 (de) 2003-01-23
EP0548054A2 (en) 1993-06-23
NO903936D0 (no) 1990-09-10
DK175478B1 (da) 2004-11-08
EP0548054B1 (en) 2002-12-11
DE68929442T2 (de) 2003-10-02
NO982568L (no) 1990-11-09
PT89978A (pt) 1989-11-10
IE890774L (en) 1989-09-11
PT89978B (pt) 1995-03-01
NO903936L (no) 1990-11-09
HK135896A (en) 1996-08-02
JP3423906B2 (ja) 2003-07-07
FI904410A0 (fi) 1990-09-07
ES2047664T3 (es) 1994-03-01
DK215690D0 (da) 1990-09-07
NZ228290A (en) 1992-01-29
EP0548054A3 (ja) 1994-01-12
DE68910859D1 (de) 1994-01-05

Similar Documents

Publication Publication Date Title
JPH03504283A (ja) 音声の動作特性検出
JP4764118B2 (ja) 帯域制限オーディオ信号の帯域拡大システム、方法及び媒体
KR101785885B1 (ko) 적응적 대역폭 확장 및 그것을 위한 장치
US6263307B1 (en) Adaptive weiner filtering using line spectral frequencies
Harma et al. A comparison of warped and conventional linear predictive coding
KR101613673B1 (ko) 불활성 위상 동안에 잡음 합성을 사용하는 오디오 코덱
US5276765A (en) Voice activity detection
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US10692510B2 (en) Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding
KR100388387B1 (ko) 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템
US20050154584A1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
Habets Multi-channel speech dereverberation based on a statistical model of late reverberation
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JP2002516420A (ja) 音声コーダ
KR20090100494A (ko) 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치
CN101106405A (zh) 回声消除器、回声消除方法及其双端通话检测系统
De Lamare et al. Strategies to improve the performance of very low bit rate speech coders and application to a variable rate 1.2 kb/s codec
Habets Single-channel speech dereverberation based on spectral subtraction
JPH11513813A (ja) 反復的な音の圧縮システム
Vahatalo et al. Voice activity detection for GSM adaptive multi-rate codec
Jones et al. Spatial coding for microphone arrays using ipnlms-based rtf estimation
EP0984433A2 (en) Noise suppresser speech communications unit and method of operation
JP2892462B2 (ja) コード励振線形予測符号化器
Park Signal Enhancement of a Variable Rate Vocoder with a Hybrid domain SNR Estimator
Horna Novel identification algorithm for adaptive FIR filters

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080621

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090621

Year of fee payment: 7

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090621

Year of fee payment: 7