JPH11500277A - 音声活性度検出 - Google Patents

音声活性度検出

Info

Publication number
JPH11500277A
JPH11500277A JP8524768A JP52476896A JPH11500277A JP H11500277 A JPH11500277 A JP H11500277A JP 8524768 A JP8524768 A JP 8524768A JP 52476896 A JP52476896 A JP 52476896A JP H11500277 A JPH11500277 A JP H11500277A
Authority
JP
Japan
Prior art keywords
signal
language
function
return loss
voice activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8524768A
Other languages
English (en)
Inventor
ブリッジイズ、ジェイムズ・アンソニー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of JPH11500277A publication Critical patent/JPH11500277A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

(57)【要約】 音声活性度検出器(26)は言語システム(2)から使用者へ送られる送出される言語信号を受ける入力と、使用者から到来する信号を受ける入力とを含んでいる。手段(263)は到来する信号の各フレームからの特徴を計算し、計算した特徴としきい値との関数を作るために備えられている。この関数に基いて、到来する信号が言語を含んでいるかいないかを判定する。対話形言語システムから送り出される言語の間にエコーリターンロスを判断し、かつ測定されたエコーリターンロスに依存してしきい値を制御するための手段が備えられている。

Description

【発明の詳細な説明】 音声活性度検出 この発明は音声活性度検出に関する。 動作のためには言語検出に依存している自動化システムが多数存在し、例えば 、自動言語システムやセルラ無線符号化システムがある。この種のシステムは言 語の発生について使用者の装置からの伝送経路を監視して、言語発生時には適切 な動作をとる。不運なことに、伝送経路は雑音がないということは稀である。そ こで経路上の活性度を検出するために簡単に設置されるようなシステムは、雑音 があるとすると正しくない動作をしてしまう。 通常存在する雑音はライン雑音(すなわち、信号が伝送されていると否とに無 関係に存在する雑音)と、電話会社からの背景雑音であり、犬の鳴き声、テレビ ジョンの音響、車のエンジンの雑音などである。 通信システム内の別の雑音源はエコーである。例えば、公衆交換電話網(PS TN)内のエコーは、本質的には電気的及び/又は音響的接続、例えば通常の交 換機ボックスの4線と2線とのインターフェースにおけるもの;あるいは受話器 からマイクロホンへの電話ハンドセット内での音響的接続が原因している。音響 的エコーは空中経路の変動が原因してある呼の中でも時間とともに変動する。す なわち、話者がその者の頭の位置をマイクロホン及びラウドスピーカの間で変え ると変る。同じように、電話ボックス(キオスク)内では、ボックスの内部が制 限されたダンピング特性をもち、かつ反響性があり、それが共鳴性質をもたらし ている。これがまた話者がボックス内を動き回ったり、実際に空気の動きをもた らすときは、音響的エコー経路を変動させる。 音響的エコーは、手を使わない電話機の使用が増大したことがあって、今日で はそれがますます重要な問題となってきている。全体のエコーもしくは反射経路 のもたらす効果は信号を減衰させ、遅延させ、かつフィルタをかけることになっ ている。 エコー経路はライン、スイッチングルート及び電話の形式に依存する。この意 味は、反射経路の伝達関数を呼毎に違えることができるということであり、その 理由は、ライン、スイッチングルート及びハンドセットのいずれかを、接続をす るために選ばれるスイッチ機械を呼ごとに違えることにより、変えてよいことに なるからである。 人間同志の言語通信システムでのエコー制御を改良するためのいろいろな技術 が知られている。三つの主な技術がある。第1に、挿入損失を話者の伝送経路に 加えて、出て行く信号のレベルを減らすようにする。しかし、挿入損失は受けた 信号が聴者には許容できないほど低いものとしてしまう原因となる。 第2に、エコーサプレッサを送り用経路と受け用経路内の信号レベルを検出す る原理に従って動作させ、次に、レベルを比較して切換え可能な挿入損失パッド をどのように動作させるかを決めるのである。言語が受け経路内で検出されたと きに大減衰量が送り経路内に加えられる。エコーサプレッサは通常は長い方の遅 延を有する接続で使用され、例えば国際電話リンクのような適当な固定挿入損失 では十分でない場合に使われる。 エコーキャンセラは音声で作動する装置であり、適応性信号処理を用いて、エ コー経路伝達関数を推定することによってエコーを低減または除去する。送り出 される信号がこの装置に加えられて、結果として得られた出力信号が受けた信号 から差し引かれる。このモデルが実際のエコー経路を表わしているとすれば、エ コーは理論的には打消されるはずである。しかし、エコーキャンセラは安定性問 題をかかえていて、計算上は高価なものとなる。エコーキャンセラは学習中には 雑音バーストに非常に敏感なものでもある。 自動言語システムの一例は、電話応答機であり、これは呼者が残したメッセー ジを記録する。一般に、使用者が自動言語システムを呼出すと、助言(プロンプ ト)が使用者に働きかけ、この助言は普通は答えを求めるものである。こうして 、言語システムから出て行く信号は伝送ラインに沿って使用者の電話機のラウド スピーカへ送られる。そこで使用者は助言への応答を用意し、それが言語システ ムに送られて、次にそこでは適切な動作が行なわれる。 自動言語システムへの呼者に、システムから発せられる助言に割込をかけるこ とを許すことは、このシステムの言葉使いに親しんでいる呼者達にとってシステ ムの使い勝手をよくするとして提案されてきた。この機能はときに“バージ・イ ン(会話への割込み、口出し;barge in)”とか“オーバーライダブル・ガイダ ンス(自動装置に対する人手の補助的誘導;over-ridable guidance)”とか呼ば れている。 助言の間に使用者が話をすると、発声された単語が送出する助言のエコーによ って先行され、もしくは変造されうるし、また本質的には、使用者からの隔離さ れた(前後が静寂の)汚れ(エコーによる変造)のない単語の話声が埋め込まれ た用語発声に変換される(基本的には言語システムへの入力は使用者の話した単 語と送出助言とエコーとで成り、用語発声は言語システムの信号入力に埋め込ま れている)。自動言語認識を含む自動言語システムでは、現状の言語認識技術の もつ制約の故に、この結果は認識性能の低下をもたらす。 もし使用者が自動言語システムによって用意されるサービスを全く使ったこと がなければ、使用者は言語生成器によって用意された助言をその全部について聞 く必要があろう。しかし、使用者がサービスと各段階で必要とされる情報とに慣 れてしまうと、使用者は助言が終る前に求められている応答を提供したくなるこ とがある。言語認識機器又は記録手段が助言が完了するまでは同調が外れている と、使用者がする早い応答を認識しないことになる。これに対して、もし言語認 識機器又は記録手段がいつも同調していると、入力は送出される助言と使用者に より提供された応答との両方を含むことになる。このような信号は言語認識器に よって認識できそうもない。音声活性度検出器(VAD:Voice Activity Detect or)はそこで経路上の音声活性度を検出するために開発された。 既知の音声活性度検出器は到来信号内の雑音の推定を生成し、その推定(固定 とするか、話声のない期間内で更新するかのいずれか)と到来する信号とを比較 することに依存している。この種の音声活性化システムは米合衆国特許No.5, 155,760及び同4,410,763に記載されている。 音声活性度検出器は到来する信号内の言語を検出するためと、そのような言語 が検出されるときは送出される助言に割込みをかけて認識器をオンに切換えるた めとに使用される。使用者が割込み(バージ・イン)をした場合にこれはよしと される。しかし、もし音声活性度検出器が誤って言語を検出した場合は使用者は クリップ(切除)された助言を聞くことになり、このシステムをどのように進行 させるかについての何の指示も受けないことになる。これは明らかに望ましくな いことである。 この発明は言語システムと一緒に使用するための音声活性度検出器を提供する 。この音声活性度検出器は、言語システムから使用者へ送られる送出(出て行く )言語信号を受けるための入力と、その使用者からの到来信号を受けるための入 力とを含み、出て行く信号と到来する信号との両方は限定されたフレーム内に分 けられており、また到来する信号の各フレームからの特徴を計算するための手段 と、計算された特徴としきい値との関数を作るための手段と、この関数に基づい て到来する信号が言語を含むか含まないかを判断するための手段とを備え、さら に対話形言語システムからの送出される言語信号の間にエコーリターンロスを判 断して、測定されたエコーリターンロスに依存して前記しきい値を制御するため の手段を備えていることを特徴とする。 エコーリターンロスは送出される信号のレベルと、音声活性度検出器によって 受けられた送出される信号のエコーのレベルとの差から求められる。エコーリタ ーンロスは伝送経路による送出されている助言の減衰の尺度である。 測定されたエコーリターンロスに基づいたしきい値を制御することはエコーが 原因で音声活性度検出器によりトリガされる誤りの数を減らすだけでなく、使用 者が大量のエコーを有するライン上で応答する場合に音声活性度検出器をトリガ する数も減らしている。これは魅力あるものでないように見えるが、評価したい ことは、音声活性度検出器にとっては使用者が割込むときにトリガしない方が、 使用者が割込まなかったときにトリガする(これは切除した助言を使用者に残し 、それ以上の援助をしないことになる)よりも望ましいことである。 しきい値はエコーリターンロスと送出されている信号の最大可能パワー(電力 )との関係であってよい。この両者はラインの長期間特性である(もっともエコ ーリターンロスを適時測定することができることではある)。好ましいのは、し きい値が最大パワーとエコーリターンロスとの差であることである。しきい値は エコーリターンロスと送出されている言語信号の各フレームから計算された特徴 との関数であるのが好ましい(すなわち、しきい値が送出されている信号の各フ レームの減衰を表わしているのが好ましい)。 フレームエネルギーといった他の特徴を使うこともできるが、できれば、計算 された特徴が信号の各フレームの平均パワーであるとよい。到来する信号の1つ ならず複数の特徴を計算して各種の機能を作ることができる。 音声活性度検出器は、さらに、実質的に雑音のない言語と雑音をもつ信号とを 含む少くとも1つの信号に対する計算された特徴を表わす統計的なモデルに関す るデータを含むことができ、計算された特徴としきい値との関数がこの統計的モ デルと比較される。この雑音をもつ統計的なモデルはライン雑音、及び/又は典 型的な背景雑音、及び/又は送出されている信号のエコーを表わすことができる 。 この発明によると、音声活性度検出の方法も用意されており、その構成は、言 語システムから使用者へ送られる出て行く言語信号を受け、また使用者から到来 する信号を受ける段階と;ここでは出て行く信号と到来する信号とが時間制限さ れたフレームに分けられており、到来する信号の各フレームから特徴を計算する 段階と;この計算された特徴としきい値との関数を形成する段階と;この関数に 基づいて到来する信号が言語を含むか否かを判断する段階と;さらに特徴として 言語システムから出て行く言語信号の間にエコーリターンロスを測定する段階と 、測定したエコーリターンロスに依存してしきい値を制御する段階とを備えてい る。 しきい値はエコーリターンロスと出て行く信号の最大可能パワー(電力)との 関数であるのがよい。上述のように、しきい値はエコーリターンロスと、出て行 く言語信号のフレームから計算された同じ特徴との関数であってよい。この計算 された特徴は信号の各フレームの平均パワーであってもよい。 この発明は添付の図面を参照して例についてさらに記述して行く。 図1はこの発明の音声活性度検出器を含む自動言語システムを示す; 図2はこの発明の音声活性度検出器の部品を示す; 図1は自動言語システム2を示し、そこにはこの発明による音声活性度検出器 を含み、それが公衆交換電話網(PSTN)を経て普通は電話機4である使用者 端末に接続されている。自動言語システム2は送出用ライン8と到来用ライン1 0とを経てハイブリッド変成器6に接続されている。使用者の電話は2ウエイラ イン12を経てハイブリッドに接続されている。 PSTN内のエコーは本質的には電気的及び/又は音響的接続、例えば4線と 2線とのハイブリッド変成器6におけるインターフェース(矢印7で示す)であ る。音響的接続で、受話器からマイクロホン(送話器)への電話機4のハンドセ ット内のものは音響的エコー(矢印9で示す)を生じさせる。 自動言語システム2は言語生成器22、言語認識器24及び音声活性度検出器 (VAD)26で成る。言語生成器22と言語認識器24とはこの発明の部品を 構成するものではないからこれ以上は触れない。当業者であれば、適当な言語生 成器で例えば言語技術向けのテキストを用いたり、予め記録したメッセージを用 いるものを使用できることは分ると思われる。さらに、言語認識器24の適当な 形式のものを使うこともできる。 使用にあたっては、使用者が自動化された言語システムを呼出すときは、言語 生成器22が使用者に対する助言の役割をつとめ、助言は応答を通常は求める。 したがって、言語システムから送り出される言語信号は伝送ライン8を通ってハ イブリッド変成器6を通って送られ、変成器6はこの信号を使用者の電話4のラ ウドスピーカへ切換える。助言の終りには、使用者は応答を用意し、それがハイ ブリッド6と到来ライン10を通って言語認識器24へ送られる。言語認識器2 4は次に応答を認識して、その結果に応じて適当な動作をとるようにする。 ある使用者がこれまでに自動言語システムによって提供されたサービスを使っ たことがないときは、この使用者は言語生成器22によって提供された助言を全 部聞きとる必要があろう。しかし、ある使用者が一度このサービスと各段階で必 要とされる情報とに親しんでしまうと、使用者は助言が終る前に必要とされる応 答を用意したいとすることになる。言語認識器24が助言が終わるまでにオフに されると、使用者の先にした応答を認識するための試みがされないことになる。 これに対して、もし言語認識器24が常にオンとされていると、言語認識器への 入力は送り出される助言と、使用者により用意された応答との両方のエコーを含 むことになる。このような信号は言語認識器によっては認識できるものとはなり そうもない。 音声活性度検出器26は到来する信号内にある言語(すなわち使用者からの言 語)を直接検出するために用意されている。言語認識器24は、言語が音声活性 度検出器26によって検出されるまでは不動作モードで維持される。音声活性度 検出器26からの出力信号は言語生成器22へ送られ、そこでは次に割込みがか けられ(助言が切除され)て、言語認識器24は応答して活性となる。 図2は音声活性度検出器26でこの発明のものをもっと詳細に示している。こ の音声活性度検出器26は言語生成器22から送り出される助言信号を受けるた めの入力260と到来ライン10を経て受ける信号を受けるための入力261と を備えている。各信号に対して、音声活性度検出器はフレームシーケンサ262 を含み、そこで到来する信号が256の連続するサンプルで成るデータのフレー ムに分けられる。言語のエネルギーは15ミリ秒の間、比較的定常であるから、 32msのフレームが望まれ、隣接するフレーム間で16msの重なりをもつよ うにする。これはVADをインパルス性雑音に対して一層丈夫なものとする効果 がある。 データのフレームは次に特徴生成器263に送られ、そこで各フレームの平均 パワーが計算される。ある信号のフレームの平均パワーは次の式で判断される。 ここでNはあるフレーム内のサンプル数で、今の場合は256である。 エコーリターンロスは減衰の尺度であり、言い換えれば送り出される信号と反 射した信号との間の差(デシベル表示)である。このエコーリターンロス(ER L)は送り出される助言と戻って来るエコーとに対して計算された特徴の間の差 であり、言い換えると、 ここでNは平均パワーPiが計算されることになるサンプルの数である。Nはで きるだけ大きくするのが実用的である。 図2から分るように、エコーリターンロスは送り出される助言の1フレームの 平均パワーを到来するエコーの1フレームの平均パワーから減算して決定される 。これは伝送経路8,10をシステムからのある助言、例えば歓迎の助言で励起 す ることで行なわれる。送り出される助言と戻って来るエコーとの信号レベルは次 にフレームシーケンサ262と特徴生成器263とによって上述のように計算さ れる。結果として得られる信号レベルは減衰器264によって減算されてエコー リターンロスを生じさせる。 エコーリターンロスは次に減衰器265で伝送経路に対する最大可能パワーか ら差し引かれる。すなわち減衰器265はしきい値信号を計算する: 典型的なエコーリターンロスは、その範囲は6〜30dBではあるが、約12 dBである。A法則信号に対する電話ライン上の最大可能パワーは約72dBで ある。 ERLは最初の50くらいの送出される助言のフレームから計算されるが、フ レーム数としてその前後の値を使うこともできる。 ひとたびERLが計算されると、スイッチ267が到来ラインに関するデータ を減算器266に送るように切換える。しきい値信号が、次に、呼の残りの間に 減算器266によって到来する信号の各フレームの平均パワーから減算される。 こうして減算器266の出力は 減算器266の出力は比較器268に送られ、そこでこの結果としきい値とが 比較される。もしこの結果がしきい値を超えていると、到来する信号は使用者か らの直接の言語を含んでいると思われ、またある信号が音声活性度検出器から出 力されて言語生成器22を不活性とし、かつ言語認識器24を活性化する。もし 結果がしきい値よりも下であれば、音声活性度検出器からは何も信号が出力され ず、かつ言語認識器は不動作状態のままである。 この発明の別な実施例では、減算器266の出力は分類器(図示せず)に送ら れ、そこでは到来する信号を言語か非言語かに分類する。これは減算器266の 出力を統計的モデルで典型的な言語と非言語とについての同じ特徴を表わしてい るものと比較して行なわれる。 さらに別な実施例では、しきい値信号は次式に従って作られる: 結果として得られるしきい値信号は減算器266に入力されて次の結果を得る : エコーリターンロスはともかくも言語システムからの最初の助言の始まりで計 算される。エコーリターンロスは必要であれば単一のフレームから計算でき、そ の理由は、エコーリターンロスがフレームごとに計算されることによる。こうし て、使用者がほとんどすぐに話をする場合でもなおエコーリターンロスが計算で きることになる。 フレームシーケンサ262と特徴生成器263とは音声活性度検出器の一体化 された部分として記述してきた。当業者であればこのことが発明の本質的な特徴 でないことは当然のことと分るであろうし、これらの一方又は両方を別個部品と することができる。同様に各信号を送出するためには分離されたフレームシーケ ンサと特徴生成器とを必要とすることもない。一個のフレームシーケンサ兼特徴 生成器でも各信号から特徴を生成するのは十分である。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,LS,MW,SD,SZ,U G),UA(AZ,BY,KG,KZ,RU,TJ,TM ),AL,AM,AT,AU,AZ,BB,BG,BR ,BY,CA,CH,CN,CZ,DE,DK,EE, ES,FI,GB,GE,HU,IS,JP,KE,K G,KP,KR,KZ,LK,LR,LS,LT,LU ,LV,MD,MG,MK,MN,MW,MX,NO, NZ,PL,PT,RO,RU,SD,SE,SG,S I,SK,TJ,TM,TR,TT,UA,UG,US ,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.言語システムとともに使用される音声活性度検出器であって、言語システ ムから送られた送出言語信号を受ける入力と使用者から到来する信号を受ける入 力とを備え、ここで前記送出及び到来信号は時間制限されたフレームに分けられ ており、また到来信号の各フレームから特徴を計算するための手段と、計算され た特徴としきい値の関数を作り、この関数に基づいて到来信号が言語を含むか否 かを判断するための手段とを含み、 言語システムからの送出言語信号の間にエコーリターンロスを判断し、判断し たエコーリターンロスに依存してしきい値を制御するための手段を備えたことを 特徴とする音声活性度検出器。 2.前記しきい値がエコーリターンロスと送出信号の最大可能パワーとの関数 である請求項1記載の音声活性度検出器。 3.前記しきい値がエコーリターンロスと送出言語信号のフレームから計算さ れた特徴との関数である請求項1記載の音声活性度検出器。 4.前記計算された特徴は信号の各フレームの平均パワーである請求項1、2 、3のいずれか一つに記載の音声活性度検出器。 5.前記音声活性度検出器は、実質的に雑音のない言語と雑音性信号とを含む 信号に対する計算された特徴を表わす統計的モデルに関するデータを備えており 、計算された特徴としきい値との関数はこの統計的モデルと比較されるようにさ れている請求項1ないし4のいずれか1記載の音声活性度検出器。 6.前記雑音性信号統計的モデルはライン雑音、一般的な背景雑音又は送出信 号のエコーのいずれかもしくはそれらの組合せを表わすものである請求項5記載 の音声活性度検出器。 7.音声活性度検出の方法であって、言語システムから使用者へ送られた送出 信号を受け、また使用者から到来信号を受け、この送出及び到来両信号は時間制 限されたフレームに分けられており、また到来信号の各フレームから特徴を計算 し、この計算された特徴としきい値との関数を作り、この関数に基づいて到来信 号が言語を含むか否かを判断し、さらに言語システムからの送出言語信号の間に エコーリターンロスを測定し、測定したエコーリターンロスに依存してしきい値 を制御することを特徴とする方法。 8.前記しきい値はエコーリターンロスと送出信号の最大可能パワーとの関数 であることを特徴とする請求項7記載の方法。 9.前記しきい値はエコーリターンロスと送出言語信号のフレームから計算さ れた同じ特徴の関数であることを特徴とする請求項7記載の方法。 10.前記計算された特徴は信号の各フレームの平均パワーである請求項7な いし9のいずれか1記載の方法。
JP8524768A 1995-02-15 1996-02-15 音声活性度検出 Pending JPH11500277A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB95300975.0 1995-02-15
EP95300975 1995-02-15
PCT/GB1996/000344 WO1996025733A1 (en) 1995-02-15 1996-02-15 Voice activity detection

Publications (1)

Publication Number Publication Date
JPH11500277A true JPH11500277A (ja) 1999-01-06

Family

ID=8221085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8524768A Pending JPH11500277A (ja) 1995-02-15 1996-02-15 音声活性度検出

Country Status (14)

Country Link
US (1) US5978763A (ja)
EP (1) EP0809841B1 (ja)
JP (1) JPH11500277A (ja)
KR (1) KR19980701943A (ja)
CN (1) CN1174623A (ja)
AU (1) AU707896B2 (ja)
CA (1) CA2212658C (ja)
DE (1) DE69612480T2 (ja)
ES (1) ES2157420T3 (ja)
FI (1) FI973329A (ja)
HK (1) HK1005520A1 (ja)
NO (1) NO973756L (ja)
NZ (1) NZ301329A (ja)
WO (1) WO1996025733A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems
WO1998024225A1 (en) * 1996-11-28 1998-06-04 British Telecommunications Public Limited Company Interactive apparatus
DE29622029U1 (de) * 1996-12-18 1998-04-16 Patra Patent Treuhand Elektrische Lampe
DE19702117C1 (de) * 1997-01-22 1997-11-20 Siemens Ag Echosperre für ein Spracheingabe Dialogsystem
GB2325110B (en) * 1997-05-06 2002-10-16 Ibm Voice processing system
GB2325112B (en) 1997-05-06 2002-07-31 Ibm Voice processing system
US6574601B1 (en) * 1999-01-13 2003-06-03 Lucent Technologies Inc. Acoustic speech recognizer system and method
GB2348035B (en) 1999-03-19 2003-05-28 Ibm Speech recognition system
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
GB2352948B (en) * 1999-07-13 2004-03-31 Racal Recorders Ltd Voice activity monitoring apparatus and methods
GB2353887B (en) 1999-09-04 2003-09-24 Ibm Speech recognition system
GB9929284D0 (en) 1999-12-11 2000-02-02 Ibm Voice processing apparatus
GB9930731D0 (en) 1999-12-22 2000-02-16 Ibm Voice processing apparatus
US6744885B1 (en) * 2000-02-24 2004-06-01 Lucent Technologies Inc. ASR talkoff suppressor
US6606595B1 (en) * 2000-08-31 2003-08-12 Lucent Technologies Inc. HMM-based echo model for noise cancellation avoiding the problem of false triggers
US6725193B1 (en) * 2000-09-13 2004-04-20 Telefonaktiebolaget Lm Ericsson Cancellation of loudspeaker words in speech recognition
US20030091162A1 (en) * 2001-11-14 2003-05-15 Christopher Haun Telephone data switching method and system
US6952472B2 (en) * 2001-12-31 2005-10-04 Texas Instruments Incorporated Dynamically estimating echo return loss in a communication link
US7746797B2 (en) * 2002-10-09 2010-06-29 Nortel Networks Limited Non-intrusive monitoring of quality levels for voice communications over a packet-based network
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US7392188B2 (en) * 2003-07-31 2008-06-24 Telefonaktiebolaget Lm Ericsson (Publ) System and method enabling acoustic barge-in
WO2006104576A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US7877255B2 (en) * 2006-03-31 2011-01-25 Voice Signal Technologies, Inc. Speech recognition using channel verification
EP2107553B1 (en) 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
US8411847B2 (en) * 2008-06-10 2013-04-02 Conexant Systems, Inc. Acoustic echo canceller
EP2148325B1 (en) * 2008-07-22 2014-10-01 Nuance Communications, Inc. Method for determining the presence of a wanted signal component
JP5156043B2 (ja) * 2010-03-26 2013-03-06 株式会社東芝 音声判別装置
US9042535B2 (en) * 2010-09-29 2015-05-26 Cisco Technology, Inc. Echo control optimization
JP2013019958A (ja) * 2011-07-07 2013-01-31 Denso Corp 音声認識装置
CN104508737B (zh) 2012-06-10 2017-12-05 纽昂斯通讯公司 用于具有多个声学区域的车载通信系统的噪声相关的信号处理
CN104704560B (zh) 2012-09-04 2018-06-05 纽昂斯通讯公司 共振峰依赖的语音信号增强
WO2014070139A2 (en) 2012-10-30 2014-05-08 Nuance Communications, Inc. Speech enhancement
GB2521881B (en) 2014-04-02 2016-02-10 Imagination Tech Ltd Auto-tuning of non-linear processor threshold
GB2519392B (en) 2014-04-02 2016-02-24 Imagination Tech Ltd Auto-tuning of an acoustic echo canceller
EP4270381A3 (en) * 2014-12-28 2024-04-17 Silentium Ltd. Apparatus, system and method of controlling noise within a noise-controlled volume
US10332543B1 (en) * 2018-03-12 2019-06-25 Cypress Semiconductor Corporation Systems and methods for capturing noise for pattern recognition processing
CN109831733B (zh) * 2019-02-26 2020-11-24 北京百度网讯科技有限公司 音频播放性能的测试方法、装置、设备和存储介质
CN109965764A (zh) * 2019-04-18 2019-07-05 科大讯飞股份有限公司 马桶控制方法和马桶
JP7167357B2 (ja) * 2019-05-06 2022-11-08 グーグル エルエルシー 自動通話システム
US11521643B2 (en) * 2020-05-08 2022-12-06 Bose Corporation Wearable audio device with user own-voice recording

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4192979A (en) * 1978-06-27 1980-03-11 Communications Satellite Corporation Apparatus for controlling echo in communication systems utilizing a voice-activated switch
US4410763A (en) * 1981-06-09 1983-10-18 Northern Telecom Limited Speech detector
SE8205840L (sv) * 1981-10-23 1983-04-24 Western Electric Co Ekoeliminator
US4914692A (en) * 1987-12-29 1990-04-03 At&T Bell Laboratories Automatic speech recognition using echo cancellation
JPH01183232A (ja) * 1988-01-18 1989-07-21 Oki Electric Ind Co Ltd 有音検出装置
US4897832A (en) * 1988-01-18 1990-01-30 Oki Electric Industry Co., Ltd. Digital speech interpolation system and speech detector
US5125024A (en) * 1990-03-28 1992-06-23 At&T Bell Laboratories Voice response unit
US5155760A (en) * 1991-06-26 1992-10-13 At&T Bell Laboratories Voice messaging system with voice activated prompt interrupt
GB2268669B (en) * 1992-07-06 1996-04-03 Kokusai Electric Co Ltd Voice activity detector
JPH07123236B2 (ja) * 1992-12-18 1995-12-25 日本電気株式会社 双方向通話状態検出回路
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
US5475791A (en) * 1993-08-13 1995-12-12 Voice Control Systems, Inc. Method for recognizing a spoken word in the presence of interfering speech
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
US5577097A (en) * 1994-04-14 1996-11-19 Northern Telecom Limited Determining echo return loss in echo cancelling arrangements
US5765130A (en) * 1996-05-21 1998-06-09 Applied Language Technologies, Inc. Method and apparatus for facilitating speech barge-in in connection with voice recognition systems

Also Published As

Publication number Publication date
DE69612480D1 (de) 2001-05-17
ES2157420T3 (es) 2001-08-16
EP0809841B1 (en) 2001-04-11
EP0809841A1 (en) 1997-12-03
CA2212658C (en) 2002-01-22
US5978763A (en) 1999-11-02
HK1005520A1 (en) 1999-01-15
NO973756L (no) 1997-10-15
NO973756D0 (no) 1997-08-14
WO1996025733A1 (en) 1996-08-22
MX9706033A (es) 1997-11-29
NZ301329A (en) 1998-02-26
FI973329A0 (fi) 1997-08-14
AU4672196A (en) 1996-09-04
CN1174623A (zh) 1998-02-25
FI973329A (fi) 1997-08-14
CA2212658A1 (en) 1996-08-22
AU707896B2 (en) 1999-07-22
DE69612480T2 (de) 2001-10-11
KR19980701943A (ko) 1998-06-25

Similar Documents

Publication Publication Date Title
JPH11500277A (ja) 音声活性度検出
US5646991A (en) Noise replacement system and method in an echo canceller
JP4624503B2 (ja) 音声源を検出する装置及び方法
US5619566A (en) Voice activity detector for an echo suppressor and an echo suppressor
CA2546530C (en) A downlink activity and double talk probability detector and method for an echo canceler circuit
KR100623410B1 (ko) 에코 제거기 회로 및 방법
US5390244A (en) Method and apparatus for periodic signal detection
JP2002501336A (ja) 通信システムにおけるエコー抑圧制御方法および装置
JP2512418B2 (ja) 音声コンデイシヨニング装置
JP3009647B2 (ja) 音響反響制御システム、音響反響制御システムの同時通話検出器及び音響反響制御システムの同時通話制御方法
CA2225203C (en) Hands-free telephone
JP4317222B2 (ja) ネットワークにおける通信リンクの送話品質の測定
JPH08335977A (ja) 拡声通話装置
JPH08335976A (ja) 拡声通話装置
JP3761473B2 (ja) ハンズフリー通話用アダプタ装置
JP3903933B2 (ja) 通話装置
MXPA97006033A (en) Detection of activity of
Dobler et al. A voice dialling device for mobile radio.
WO1994000944A1 (en) Method and apparatus for ringer detection
JPH036712B2 (ja)
JPH08335975A (ja) 拡声通話装置