JPH11168791A - 音声源を検出する装置及び方法 - Google Patents
音声源を検出する装置及び方法Info
- Publication number
- JPH11168791A JPH11168791A JP10249875A JP24987598A JPH11168791A JP H11168791 A JPH11168791 A JP H11168791A JP 10249875 A JP10249875 A JP 10249875A JP 24987598 A JP24987598 A JP 24987598A JP H11168791 A JPH11168791 A JP H11168791A
- Authority
- JP
- Japan
- Prior art keywords
- arrival
- source
- signal
- audio
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 21
- 230000005236 sound signal Effects 0.000 claims abstract description 9
- 238000001228 spectrum Methods 0.000 claims description 29
- 230000003595 spectral effect Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 abstract description 19
- 230000000694 effects Effects 0.000 description 39
- 230000001052 transient effect Effects 0.000 description 24
- 239000013598 vector Substances 0.000 description 22
- 230000003044 adaptive effect Effects 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006978 adaptation Effects 0.000 description 5
- 230000002238 attenuated effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 239000000843 powder Substances 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 238000003909 pattern recognition Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
(2;2a,2b,2M)と、受信した音声信号から音
声を検出するための検出手段とからなる音声源を検出す
る装置である。この装置は受信した信号の到達方向を判
定する手段(15,17)と、ある特定の源の音声の推
定された到達方向を記憶する手段(17)と、前記受信
した信号の到達方向と前記推定された到達方向とを比較
する手段(18)とを備えている。この装置は更に、前
記比較によって前記受信した信号の到達方向が前記推定
された到達方向とある許容差の範囲内で一致することが
判明した場合には、前記音声源が前記ある特定の源であ
ることを表示する手段(18)とを備えている。
Description
ためのマイクロフォン手段と、受信した音声信号内の音
声を検出する検出手段とを備えてなる音声源検出方法と
検出装置に関する。
ることが多い。これは特に、以下の異なる4通りの、す
なわち、アイドル、近端(near−end)通話、遠
端(far−end)通話、およびダブルトーク(do
uble−talk)の通話状態を有する全二重電話の
場合である。エコーは通常は、通話が遠端から入り、受
信した遠端信号がスピーカで再生され、マイクロフォン
を介して遠端に戻される場合に発生する。エコー問題は
特に、スピーカが高音量の音声を周囲に対して再生し、
そのようにしてスピーカからの音声がマイクロフォンに
容易に戻されるようなハンドフリーの通話方法で発生す
る。
処理が採用される。ハンドフリーの移動電話の応用例で
は、公知のエコーキャンセラおよびエコー抑制器を使用
して、スピーカからマイクロフォンへの妨害が多い音響
フィードバック、すなわち音響エコーを有効に除去する
ことが可能である。エコーキャンセラは、出信号からの
エコー信号、すなわち受信側に遠端信号が存在する場合
に、通常は遠端から来た信号を抑制する適応ディジタル
・フィルタを利用して実施することができる。このよう
にして、遠端信号が遠端に戻ることを防止するための努
力がなされている。適応フィルタの各パラメータは通常
は、何らかの状況の条件をできる限り正確に考慮に入れ
るために、遠端通話が生じた時に常に更新される。エコ
ー抑制器については、送信される近端信号を減衰するた
めに使用される。
状況はダブルトーク状況と呼ばれている。ダブルトーク
中、エコーキャンセラはエコー信号を有効に除去するこ
とができない。その理由は、エコー信号は送信される近
端信号内で加算され、その場合、エコーキャンセラは除
去されるべきエコー信号の正確なモデルを形成できない
からである。このような場合、エコーキャンセラの適応
フィルタはスピーカとマイクロフォンとの間の空間の音
響応答に適正に適応することができず、従って、近端通
話信号が存在する場合は、送信される信号から音響エコ
ーを除去することができない。そのため、エコーキャン
セラに対するダブルトークの妨害作用を除去するため
に、ダブルトーク検出器が使用されることが多い。通常
は、ダブルトーク状況は遠端通話と同時に近端通話が存
在しているか否かを検出することによって検知される。
ダブルトーク中、エコーキャンセラの適応フィルタの各
パラメータは更新されないが、適応フィルタの更新は近
端の人が通話している間は中断されなければならない。
エコー抑制器はまた、近端の人が通話している間に送信
される信号を不適切に(過度に)減衰しないように、近
端の通話者の通話活性に関する情報が必要である。
な送信にはエコーキャンセリングおよび抑制に加えて、
近端通話活性に関する情報が必要である。割り込み可能
な送信の概念とは、通話活動中だけに通話信号を送信す
ること、すなわち、近端の通話者が休止している間は、
電力を節減するために近端信号は送信されないというこ
とである。割り込み可能な送信に起因するバックグラウ
ンドノイズ・レベルが過度に変動することを避けるた
め、アイドル状態である種の快適なノイズを送信し、し
かも送信中に必要なビットを節減することが可能であ
る。そのために、GSMの割り込み可能な送信によって
送信される通話の音質を低下させないようにするため、
近端通話活性は正確、迅速かつ確実に検知されなければ
ならない。
トーク検出のための従来から公知の構成1を示してい
る。近端信号3はマイクロフォン2から届き、近端通話
活性検出器4,VAD(音声活性検出器)を用いてそれ
が検出される。遠端信号5は入力接続部Iから届き(こ
れはハンドフリーの装置では入力コネクタ、定置電話の
場合はワイヤ・コネクタ、および移動電話の場合はアン
テナから電話の受信ブランチへの経路でよい)、遠端通
話活性検出器6,VAD内で検出され、最後にスピーカ
7で再生される。近端信号3と遠端信号5は双方ともダ
ブルトークを検出するためのダブルトーク検出器8と、
エコー経路13の音響応答に適応するための適応フィル
タ9とに送られる。ダブルトーク中にフィルタに適応し
ないため(パラメタが更新されないため)に、適応フィ
ルタ9は入力としてダブルトーク検出器8の出力をも受
ける。エコーキャンセリングを行うために、適応フィル
タによって形成されるモデル10は加算/減算装置11
で近端信号3から減算される。(ハンドフリーの装置で
は出力コネクタ、定置電話ではワイヤ・コネクタ、およ
び移動電話では送信ブランチからアンテナへの経路でよ
い)出力接続部Oには、エコーキャンセラ出力信号12
が送られ、そこからエコー(のある部分)は既にキャン
セルされている。図1に示したエコーキャンセラを(例
えばハンドフリーのスピーカ呼出し用にスピーカとマイ
クロフォンとからなる)電話に統合してもよく、又は別
個のハンドフリー装置で実施することもできる。
か提案されている。しかし、それらの多くは極めて単純
であり、一部は信頼性に欠ける。ほとんどのダブルトー
ク検出器はスピーカ信号及び/又はマイクロフォン信号
及び/又はエコーキャンセラの後の信号相互間のパワー
比に基づいている。これらの検出器の利点は簡略さと迅
速さであり、それらの欠点は信頼性に欠けることであ
る。
号及び/又はエコーキャンセラの後の信号相互間を相関
させることに基づく検出器も公知である。これらの検出
器は、スピーカおよびマイクロフォン内の単なるエコー
信号(エコーキャンセラを経た後の信号)が強く相関さ
れるという構想に基づくものであるが、近端信号がマイ
クロフォン信号に加算されると相関関係は低減する。こ
れらの検出器の欠点は検出速度が遅いこと、近端信号と
遠端信号との(一部は正しくない)非相関関係が想定さ
れること、エコー経路に起因するスピーカ信号に変化の
影響があること、近端信号がない場合でも相関関係が低
下することである。
ブルトーク検出器も公知であり、この場合は検出器が近
端信号内の音声を認識し、ひいては近端信号の存在を検
出することができる。このような検出器の計算に要する
パワーは少ないが、検出器が相関に基づいているので上
記と同じ問題点が生ずる。
「大規模ビデオ会議用の音響エコーを消去するマイクロ
フォン・システム」ICSPAT’94会報、1994
年刊、7−12ページでは、ノイズおよび音響エコーを
除去し、冒頭に述べた異なる通話状況を認識するための
反対方向に向けられた2個のマイクロフォンを使用して
いる。しかし、上記の方法は単にエコーキャンセラの出
力パワーによってのみ実施されるダブルトークの認識に
特別の改善をもたらすものではない。
著の文献「ダブルトーク状況のためのマイクロフォンの
音源サブスペース・トラッキングアレイ」,ICSPA
T’96会報,第2巻,1996年刊,909−912
ページでは、マイクロフォン・ベクトル構造のエコーお
よびバックグラウンドノイズキャンセラが提案されてい
る。提案されているエコーキャンセラは所望の方向から
到達する信号を保持しつつ、空間的に選択された方向か
ら到達する信号を濾波するものである。上記のエコーキ
ャンセラはダブルトーク状況の間も動作することができ
る。しかし、上記の文献は(マイクロフォン・ベクトル
とも呼ばれる)多重マイクロフォンによる解決方法を利
用した近端通話活性の検出も、ダブルトーク検出も提示
していない。
検出し、かつダブルトーク状況を認識するための方法と
装置の発明がなされた。
到達する方向に基づいてその信号を検出する構想に基づ
いている。スピーカ信号が近端の通話者の通話信号の方
向とは明確に異なる方向から到達するハンドフリーの応
用例では、近端通話信号をその到達角度に基づいてスピ
ーカ信号と区別することができる。本発明では、異なる
方向及び/又は異なる地点からの音声をピックアップす
る幾つかのマイクロフォン(マイクロフォン・ベクト
ル)を利用して検出が行われる。
域フィルタにかけられて狭帯域信号にされ、濾波された
信号によって形成される信号マトリクス上で到達方向の
角度が推定される。この推定によって空間スペクトルが
復元され、そこからスペクトル内に生ずるピークに基づ
いて到達方向のトラッキングが行われる。近端通話信号
の到達方向とスピーカ信号の到達方向とは得られた(判
明した)到達方向に基づいて更新される。到達方向のこ
れらの推定値によって最終的なVADの決定がより容易
になる。到達方向推定装置が近端通話信号の推定到達方
向に充分に近い到達方向に充分に強いスペクトル・ピー
クを検出すると、近端通話者は通話しているものと見な
される。すなわち近端通話活性を検出することができ
る。
加えて、遠端通話活性に関する情報が必要である。この
情報は、例えばパワーレベルに基づく音声活性検出器の
ような公知の音声活性検出器を用いて検出することがで
きる。
方向を判定する手段と、ある特定の源の音声の推定され
た到達方向を記憶する手段と、前記受信した信号の到達
方向と前記推定された到達方向とを比較する手段と、前
記比較によって前記受信した信号の到達方向が前記推定
された到達方向とある許容差の範囲内で一致した場合に
は、前記音声が前記ある特定の源で発生されたことを表
示する手段とを備えてなることを特徴としている。
に説明する。
トークを認識するための、本発明による検出器のブロッ
ク図を示している。本発明ではマイクロフォン2として
幾つかのマイクロフォン2a,2b,...,2Mが使
用され、それらのマイクロフォンは好適にはいわゆるマ
イクロフォン・ベクトル2として接続されている。ベク
トルは少なくとも2個のマイクロフォンを有している
が、3個または4個またはそれ以上であることが好適で
ある。各マイクロフォンは単一の信号3a,3
b,...,3Mを発生し、M個のマイクロフォン(M
は整数)が使用される場合、時間領域内で変化可能なM
個の信号が得られ、これらが時間領域内で変化可能なM
個の要素からなる1つの信号ベクトルを形成する。
3b,...,3Mは先ず帯域フィルタ14内で帯域濾
波されて狭帯域信号19a,19b,...,19Mに
される。超分解能のスペクトルの正確な推定方法は狭帯
域信号にのみ作用するので、方向角度の推定のために帯
域濾波が行われる。帯域濾波は例えば急速フーリエ変換
(FFT)、ウインドゥイング及びインタリービングを
利用して実現することができる。帯域フィルタの周波数
範囲はマイクロフォン・ベクトル内の各マイクロフォン
間の距離に基づいて判定される。ナイキスト・サンプリ
ング理論に従って、空間サンプリング周波数は信号の空
間周波数の少なくとも2倍でなければならないので、帯
域フィルタ14の帯域周波数(ポイント周波数)として
下記が得られる:f=C/2d,但し、Cは空中での音
の速度(20℃で343m/s)であり、dは各マイク
ロフォン間の距離である。
19Mによって形成される信号マトリクス上の方向角度
(すなわち到達方向)の推定は、例えばMUSIC(多
重信号分類(Multiple Signal Classification))のよ
うなある種の公知の推定方法を利用して推定装置15で
行われる。
そこからスペクトル内に生ずるピークに基づいて信号の
到達方向が判定される。図3はそのようなマイクロフォ
ン・ベクトル信号の空間スペクトルの例を示している。
到達方向は例えばスペクトル曲線の微分係数を吟味する
ことによって図3に示したスペクトル図から判定するこ
とができる。微分係数のそのようなゼロ点は到達方向と
して復元される。ゼロ点では微分係数は正から負に変化
し、それは公知のように、曲線内の各ピーク位置を示
す。このように図3では、2つの信号がマイクロフォン
・ベクトルに到達する。すなわち1つは10°の方向か
ら、またはもう1つは40°の方向からの信号である。
更に、到達方向であると見なされるスペクトル・ピーク
がある特定の最小振幅(例えば5dB)を有することを
要求できる。図面では、スペクトルの有効範囲(カバレ
ージ)は90°として示されている。実際には、±90
°の範囲で検出することができる。微分係数の計算と、
振幅の最小条件が満たされているか否かのチェックは好
適には、ディジタル信号プロセッサを利用して(プログ
ラミングによって)実施されなければならない。推定装
置15はその出力として信号の到達方向16を付与(推
定)する。
達方向は得られた(判明した)到達方向に基づいてブロ
ック17で更新される。可能性がある到達方向はスペク
トル・ピークから得られた到達方向を平均化することに
よって評価される。どの方向から信号が到達したのかが
ほぼ判明した場合は、その時点で空間スペクトルに生ず
るエラー・ピークの影響を最小限にすることができる。
エラー・ピークが推定到達方向で生じない限り、それが
注記されることはない。図4は車内での通常のハンドフ
リー装置のマイクロフォン2とスピーカ7の配置を示し
ており、スピーカは通常は0°±40°の方向でむしろ
マイクロフォン・ベクトル2の直前にある。スピーカの
位置はマイクロフォン・ベクトルに対して大幅に変更し
てもよい。マイクロフォン・ベクトル2のマイクロフォ
ン2a,2b,...,2Mは互いにある特定の方向に
ある特定の距離を隔てて配置される。距離と方向は以下
に説明する到達方向推定アルゴリズムによって判定され
なければならない。以下に、信号源位置、方向判定ブロ
ック17で実行される遠端と近端の双方の到達方向の平
均化についてより詳細に説明する。
15から得られる到達角度16の平均化に基づいて行わ
れる。平均化は、遠端に通話がある場合にのみ行われ、
これはその出力が判定ブロック17に送られる遠端VA
D6の出力を用いて判定される。平均化は好適には例え
ばIIR−濾波を用いて時間領域内で実行される。異な
る方向から到達する2つの信号源、すなわち近端信号3
と遠端信号5が存在するということが基本的に想定され
ている。更に、前記信号の到達方向は実行される観測の
頻度と比較して比較的ゆっくりと変化すると想定されて
いる。スペクトル推定装置15がその出力として到達方
向ベクトルdoa(度での)を発すると、遠端到達方向
ベクトルの推定値fdoa(度での)は平均化によっ
て、各々の新たな方向推定値が最も近いfdoaの成分
に影響を及ぼすように更新される。更新には、関連する
成分に近いほど検出された方向がfdoa成分を更新す
るように重み付けが行われる。スピーカ信号の方向及び
それによってスペクトル内に誘発される残響(reve
rberation)信号の方向は極めて僅かしか変化
せず、その場合、上記の重み付けによってスペクトル内
の偶発的な、エラー・ピークの影響が低減される。同時
に問題のfdoa成分が発生する確率、pdoaは、当
該の方向推定値に新たな値が近いければ近いほど更新さ
れる。加えて、当該のfdoa成分の強さ、powdo
aは、それに対応するスペクトル・ピークのパワーに基
づいて更新される。この場合、遠端到達方向推定ベクト
ルfdoaは(M−1)個の信号の到達角度の方向を有
する。成分pdoaは、範囲〔0,1〕での対応する到
達方向の確率と、powdoaに対応する範囲〔0,
1〕での標準化された強度からなっている。
応する確率と強度が最高であり、一方、最後に判定され
た遠端信号到達方向に最も近い遠端到達方向ベクトル推
定値fdoaの成分であるものと想定することができ
る。推定は通話が遠端に存在する場合にのみ更新される
ので、近端信号3(この場合はダブルトーク)が時間の
50%未満で発生するものと想定することができる。従
って基本的に想定されることは、ダブルトークが遠端通
話活性時間の半分未満で発生するということである。遠
端信号到達方向(スピーカの方向)は、到達方向に対応
するスペクトル・ピークのパワーに基づいて残響される
スピーカ信号の到達方向から分離されうる。マイクロフ
ォンに直接到達する信号によって通常は残響経路で減衰
される信号よりも強いピークが空間スペクトル内に生ず
る。
アルゴリズムの説明である。段階100では、以下を判
定することからなる初期化が行われる。fdoa,pd
oa及びpowdoaが(M−1)個の成分を含んでい
る。doaがL個の成分(1≦L≦M−1)を含んでい
る。fdoa成分が異なる値を用いて初期化される。 fdoa(n)=−90+n* 180/M;(1≦n≦
M−1)
a)に対応して以下のように推定値(fdoaの各成
分)をトラッキングする。各推定値からの各到達方向の
距離を計算する。距離が最短の推定値doa(i)及び
それに対応する最も近い推定値fdoa(n)を選択す
る。
値にどれだけ近いかに応じて推定値fdoa(n)を更
新する。近ければ近いほど、検出された方向は推定値を
変更する。すなわち、fdoa(n)=α0 * fdoa
(n)+(1−α0 ) * doa(i),但しα0 は例え
ば距離の一次関数、または指数関数である(一次(線
形)の依存性については図5を参照)。更新係数α0 及
び距離dの上限と下限、α0 _max,α 0 min及
びd max,d minを調整することによって、更
新の迅速さだけではなく、どの距離に位置するピークが
推定値に影響を与えるかにも影響を及ぼすことができ
る。例えば、距離の最大値が40°に保たれ(d mi
n=0°,d max=40°)、更新係数の最大値が
1に保たれている場合(α 0 min=0.99,α 0
max=1.0)、40°以上遠いスペクトル・エラー
のピーク値は推定値を更新せず、ひいてはエラーを全く
誘発しない。このようにして、推定値に及ぼす上記の偽
信号の影響を除去することが可能である。
程度近いかに応じて推定値の発生の確率、pdoaを高
める。以下では、距離の関数は一次関数であるものと想
定されている。例えば指数関数のようなその他の関数で
も可能である。 pdoa(n)=α1 * pdoa(n)+(1−α1)
(1−dist/180) 但し、α1 は例えば0.9であり、distは〔0,1
80〕の範囲内での観測値と推定値との間の距離であ
る。
クトル・ピークのパワーを用いて推定値のパワーpow
doaをも更新する。 powdoa(n)=α3 * powdoa(n)+(1
−α3 ) * Pow/Powmax 但し、α3 は例えば0.9であり、Powはスペクトル
・ピークのパワーであり、Powmaxは最大のパワー
である。
値を見出しうるか否かが判定され、イエスである場合は
残りの到達方向と推定値のペアについて段階101−1
04を繰り返す。 段階106:例えばdist=180及びPow=0に
設定することによって、到達方向が検出されなかった推
定値の発生頻度とパワーを低減する。
最大にすることによって、スピーカの方向に関して、そ
の方向が最大の発生確率とパワーを有し、かつスピーカ
の方向の最新の評定値に最も近い推定値の方向を選択す
る。 a* pdoa(k)+b* powdoa(k)+c* distance(k) ;K=1...M−1, (1) 但し、a,bおよびcは重み付け係数、例えば1/3で
あり、distance(k)は推定値fdoa(k)
とそれまで(以前に)評定されたスピーカの方向との間
の「度」で表した距離である。
ついて説明してきた。以下に近端通話信号の到達方向の
推定について説明する。近端信号の到達方向の推定は上
記に説明した手順とアルゴリズムに従って行われ、従っ
て近端の到達方向の推定値ndoaは上記アルゴリズム
でfdoaをndoaと置き換えることによって得られ
る。遠端通話活性検出器6が、遠端から到達する通話が
ないことを表示した場合に推定は行われる。推定装置1
5内でこのスペクトルを検出する場合、予期されるピー
ク(到達角度の方向)がないか、又は近端信号及び/又
は偽信号及び残響の方向に従って1から(M−1)個の
ピークがある。近端の通話者の方向として、前述のよう
に最も頻繁に反復され、かつ最も強力である空間スペク
トルによって示される方向が選択される。更に、近端の
通話者はマイクロフォン・ベクトルに対して約0°±3
0°の方向に座っているものと想定され、その場合、近
端の通話者の方向推定値の初期値を0°と設定でき、方
向の選択に際してはそれまでに(以前に)評定された方
向が強力に重み付けされることができる。
ndoaは最終的な検出を行う検出ブロック18に採り
入れられる。そのピークが近端通話信号の想定到達方向
に充分に近い到達方向での充分に強いスペクトル・ピー
クを到達方向推定装置15が検出すると、近端の通話者
が通話していることが判明する。すなわち、近端通話活
性が検出される。この比較はブロック15及び17から
到達する信号に基づいて検出器18で行われる。近端通
話活性の最終的な決定は、スペクトル・ピーク及び到達
方向の推定(平均化)を利用して行われる。いずれかの
スペクトル・ピークが遠端の推定値よりも近端の到達方
向の推定値(又はその残響の推定値)に近く、更に所定
のエラー許容差よりも近端推定値に近い場合は、近端に
通話が存在することが検出される。許容差の値は例えば
10度である。
加えて、遠端通話活性に関する情報が必要である。この
情報は遠端通話活性検出器6からダブルトーク検出器1
8へと送られ、このようにしてこの検出器18は、(前
述の)近端通話活性検出器が通話を検出し、かつ遠端通
話活性検出器6が同時に通話を検出すると、ダブルトー
ク状況を検出する。遠端信号に関する限り、通話活性の
検出にはどのVADアルゴリズムを用いてもよい。ダブ
ルトークの結果は、近端および遠端通話活性の値につい
ての簡単なAND演算、すなわち、1(通話中)及び0
(非通話中)を用いて得られる。
移)検出器TDの機能を説明する。この検出器は本発明
による通話活性検出器/ダブルトーク検出器ではオプシ
ョンであり、従って図面では点線を用いて示してある。
到達方向の推定は狭帯域信号で行われるので、急激な近
端信号の変化(過渡状態)の検出は困難である。そのた
め、過渡状態の検出用に最適化された並列の検出器TD
を使用することが可能である。各々の過渡位置が検出さ
れた後、判定の正確さをチェックするために到達方向検
出器が使用される。本発明による検出器が例えば20m
s未満の充分に急激な信号変化を検出するならば、過渡
状態検出器TDを使用する必要はない。
ADを使用することができる。しかし、多重マイクロフ
ォン構造によってある特定の到達方向角度を減衰させる
ことが可能であるので、推定されたスピーカ信号の方向
が減衰されるような態様で過渡状態検出器TDを実現す
ることができる。この場合、検出された過渡状態が近端
信号に結びついている確率が高くなる。スピーカ方向で
の減衰は多くの異なる方法で実現できる。最も容易な方
法は2個の適応性マイクロフォン構造を使用することで
ある。原則的に、これらの2個のマイクロフォンとし
て、例えば互いに最も遠く離れたマイクロフォンのよう
な、マイクロフォン・ベクトル2のマイクロフォン2
a,2b,...,2Mのうちの任意の2個を使用する
ことができる。減衰を実現するためには、2個のマイク
ロフォン信号があれば充分である。到達方向推定装置の
判定を利用して適応化が制御される場合(すなわち、遠
端信号だけがある場合だけ適応化が行われる)、所望の
方向での減衰が得られる。(例えば1KHz−2KHz
のような)ある特定の周波数範囲で検出が行われれば、
適応はより容易になる。過渡状態検出器内で、例えばF
FT又は帯域フィルタを使用して、マイクロフォンから
得られる信号に対して直接周波数分割を実施することが
できる。
る信号の瞬間パワーP(n)をノイズ推定値N(n)と
比較する。但し、P(n)はマイクロフォン信号のパワ
ー(又はスピーカ信号の方向が減衰されたマイクロフォ
ン信号のパワー)であり、ノイズ推定値N(n)はその
以前の値を用いて平均化され、通話が全くない場合には
システム全体の判定によって制御される、対応するパワ
ーである。通話がない瞬間に関する情報はブロック18
から過渡状態検出器TDへと取り出すことができる(点
線の矢印)。関連する値P(n)及びN(n)はマイク
ロフォンから到達する信号に基づいて過渡状態検出器を
用いて計算することができる。(信号出力値P(n)と
N(n)の計算方法は公知であり、例えばIIR(無限
インパルス応答)フィルタを用いて過渡状態検出器TD
内で実行できる。その差が充分に大きい場合は、過渡状
態が検出されたものと判定される。ノイズ推定値N
(n)を更新するには反復的平均化、N(n+1)=α
N(n)+(1−α)P(n)が用いられる。但しαは
平均化を制御する時定数(一般的には約0.9)であ
る。
の機能を補足するものである。過渡状態検出器TDで近
端の通話そのものを検出することも可能であるが、確実
な検出は到達方向推定装置15による方向判定によって
得られる。単なるエコー源(近端信号ではない)での正
しくない過渡状態の検出は到達方向推定装置15での方
向によって修正することができる。方向の減衰が充分に
有効に動作するならば、近端通話中にエコーによって誘
発される過渡状態に留意する必要はない。エコー中に開
始される近端通話は再び明確な過渡状態として検出する
ことができ、その結果を到達方向検出器を用いてチェッ
クすることができる。過渡状態検出器TDの出力はブロ
ック18に採り入れられる(点線)。
向推定装置15の出力に基づいて統計的パターン認識ア
プローチによっても判定することができる。このアプロ
ーチによれば、到達方向(DOA)角度推定に基づく通
話活性の検出は、統計的情報を利用して改良することが
できよう。ニューラル・ネットワークおよびヒドン・マ
ルコフ・モデル(HMM)のようなパターン認識技術は
これまで多くの類似の課題に適用されて成果が上げられ
ている。パターン認識方法の強みはトレーニングが可能
なことである。充分な量のトレーニング・データが与え
られると、システムの各々の状態(近端通話、遠端通
話、ダブルトーク、無音)に対するモデルを推定するこ
とができる。次にこれらのモデルを利用して、システム
の状態を最適に検出することができる。検出プロセスは
モデリングの想定が適正である場合に限り最適であるこ
とは言うまでもない。
活性の検出に利用する態様を概略的に説明する。システ
ムへの入力は依然として空間スペクトルから導出される
ので、信号(単数または複数)のDOA角度は依然とし
て本発明に基づく決定的な要因である。その上、上記に
説明した過渡状態検出部品(基準TD)をこれまでと同
様に利用することができる。
テップはモデル・ネットワークを規定することである。
前述したように、全二重電話システムには4つの状態
(モデル)、すなわち近端通話、遠端通話、ダブルトー
ク、無音がある。各モデルは多重状態HMMでモデリン
グすることができるが、出発点としては単一状態のHM
Mを使用できる。その他の改良の可能性としては、各状
態間での発振を防止するため、各状態上での最小限の強
制期間を使用することがある。
間に生じ得るが、実際には、無音とダブルトークモデル
との間、及び近端モデルと遠端モデルとの間の直接的な
過渡状態は無視することができるので、実際の過渡状態
は図8に示したとおりである。
類の確率分布を用いるかを決定しなければならない。音
声認識の標準的なアプローチはガウス確率密度関数(p
df)によって各状態をモデリングすることであり、こ
れは本実施例においても好ましい出発点である。その代
わりに任意のpdfを用いることもできよう。モデルp
dfのトレーニングは図9に示すような(システムが所
定の瞬間にどの状態にあるかを知ることができる)ラベ
ルを付されたトレーニング・データから公算が最も高い
パラメータを推定することによって理想的に行われる。
代替方法としては、ある特定の基本モデルから出発し、
非監視トレーニング(unsupervised tr
aining)と呼ばれるオンラインにシステムを適応
させる方法がある。再び音声認識に言及すると、これに
適用できるオンライン通話者適応技術が幾つかある。要
約すると、現行のデータを用いて、最大の公算を生ずる
状態が最大の重み付けで適応される。適応データが多い
ほど、更新に際してより多くの重み付けが加えられる。
非監視トレーニングの明確な問題点は、分類ミスの場合
に正しくないモデルを適応する危険があることである。
初期パラメタを少数の監視トレーニング・サンプルで推
定することができれば、適応がより良好に行われる公算
が高くなる。更に、遠端チャネル(スピーカ)が残りの
チャネルから分離され、この情報を利用することができ
る。遠端活性がある場合は、遠端及びダブルトークモデ
ルだけを適応することができ、以下同様である。
公算が最も高いモデルを随時選択するだけである。勿
論、遠端通話活性のような追加情報を利用して、検出性
能を更に高めることができる。この代替アプローチの論
理的な改良方法は、幾つかの状態でHMMを利用するこ
とである。例えば、各システム状態を表すHMMは3つ
の状態からなっている。すなわち、モデルへの過渡状
態、モデルの静止部分を表す状態、及びモデルから外れ
る過渡状態である。また、pdfモデリングの精度を高
めるためにガウスpdfsを併用することもできよう。
の用途に使用する場合、信号の最終の残響の方向を考慮
に入れるような方法で過渡状態検出器を変更することが
できる。そのような場合は、過渡状態の検出はスピーカ
の1つの推定到達方向ではなく、スピーカの幾つかの推
定到達方向を減衰させることによって改良することがで
きる。
方法と比較した利点は、ダブルトーク状況と近端通話活
性の双方を認識することができること、その迅速さ及び
信頼性にある。通話信号の到達方向に基づく本発明の検
出器はその主要な特徴によって極めて信頼性が高い。各
通話信号のパワーレベル間の相違は結果に大きな影響を
及ぼさないが、検出器はスピーカ信号よりもパワーが大
幅に低い近端通話信号をも認識する。それに加えて、決
定の結果は適応性エコーキャンセラの動作のような、別
個の装置の動作による影響を受けない。ダブルトーク検
出器では、通話信号及び周囲のノイズレベルに応じたし
きい値レベルがしばしば存在し、そのしきい値レベルに
基づいてダブルトーク状況があるか否かが判定される。
この検出器のパラメータは主要部分では一定であり、従
って上記のような問題点は存在しない。オプションの過
渡状態検出器を使用することによって、認識の迅速さを
高めることができる。
本発明による空間検出器に必要な、遠端通話活性の検出
及び周囲ノイズの推定のような多くの動作が実施され、
従って既に実施された計算動作を本発明による検出器で
利用することができる。
に、例えば移動電話の車内搭載キット又は自動車電話の
ハンドフリー設備に(例えばエコーキャンセラ及び伝送
論理の一部として)使用することができる。本発明はま
た、ハンドフリー設備が電話内に含まれている、いわゆ
るハンドフリー電話の応用例などで使用するにも適して
いる。
ルトーク検出器80が使用されている、本発明に基づく
移動局を一例として示している。マイクロフォン・ベク
トル2から出て送信されるべき通話信号はA/D変換器
20でサンプリングされ、その後で(例えば音声の符号
化、チャネルの符号化、インタリービングのような)ベ
ース周波数信号の処理、無線周波数へのミキシングと変
調、及びブロックTXへの送信が行われる。ブロックT
Xから、信号はデュプレックスフィルタDPLX及びア
ンテナANTを経て空中経路へと発信される。例えばエ
コーキャンセラを制御し、又は断続的な送信で送信TX
を制御するために検出器80を利用することができる。
受信側では復調、インタリーブのキャンセル、チャネル
復号、及び音声復号のような受信機ブランチRXの通常
の動作が行われ、その後、検出器6で遠端通話活性が検
出され、信号はD/A変換器23でアナログ形式に変換
され、スピーカ7によって再生される。図6に記載のブ
ロック2,7,20,23及び80を入力、出力及び制
御信号(30,50,近端VAD,DT)用の移動局用
の接続を有するセパレート形のハンドフリー装置に設置
することによって、本発明をセパレート形のハンドフリ
ー装置で実施することが可能である。本発明は更に、会
議での発呼用に卓上での1個以上のマイクロフォンとス
ピーカとを備えた会議での発呼装置に、または例えば、
マンクロフォンとスピーカを例えばビデオ表示装置に内
蔵できる、インターネット回線網を介して発呼するため
のコンピュータと接続して使用することができる。この
ように、本発明はあらゆる種類のハンドフリー形式の装
置に適している。
と実施態様を説明してきた。本発明は上記に提示した実
施例の細部に限定されるものではなく、かつ本発明はそ
の特徴から逸脱することなく他の実施例でも実現できる
ことは当業者には自明であろう。開示した実施例は例示
的のものであり、限定的なものではないものと見なされ
るべきである。従って、本発明を実施し、利用する可能
性は特許請求の範囲の各請求項によってのみ限定される
ものである。従って、各請求項によって特定された本発
明の異なる実施例、及び同等の実施例は本発明の範囲に
含まれるものである。
である。
ル図である。
置図である。
定するために用いられる更新係数を示す図である。
る。
示す図である。
図である。
Claims (10)
- 【請求項1】 音声信号を受信するマイクロフォン手段
(2;2a,2b,2M)と、受信した音声信号から音
声を検出するための手段とからなる音声源を検出する装
置において、受信した信号の到達方向を判定する手段
(15,17)と、ある特定の音声の源の推定された到
達方向を記憶する手段(17)と、前記受信した信号の
到達方向と前記推定された到達方向とを比較する手段
(18)と、前記比較によって前記受信した信号の到達
方向が前記推定された到達方向とある許容差の範囲内で
一致することが判明した場合には、前記音声の源が前記
ある特定の源であることを表示する手段(18)とを備
えてなることを特徴とする音声源を検出する装置。 - 【請求項2】 前記マイクロフォン手段(2;2a,2
b,2M)がM(個の)マイクロフォン(2a,2b)
を備えてなり、ここでMは整数であり、前記マイクロフ
ォンが出力としてM個のマイクロフォン信号を生成する
ように配置されるとともに、前記装置が前記マイクロフ
ォン信号に基づいて空間スペクトルを形成し、かつ前記
スペクトル内で生ずるピークに基づいて前記スペクトル
内での前記到達方向を判定するための手段(15)を備
えてなることを特徴とする請求項1に記載の装置。 - 【請求項3】 前記スペクトル曲線の微分係数を計算
し、かつ該微分係数が正から負に変化する微分係数のゼ
ロ点を復元することによって前記到達方向を判定する手
段(15)を備えてなることを特徴とする請求項2に記
載の装置。 - 【請求項4】 前記マイクロフォン手段(2;2a,2
b,2M)に対するある方向で音声を再生するための音
声再生手段(7)を備えてなるとともに、ある源の推定
された到達方向を記憶する前記手段(17)は、第1の
源が装置のユーザであり、第2の源が前記音声再生手段
(7)である場合に、少なくとも2つの異なる源からの
前記音声の推定された到達方向を記憶するように構成さ
れ、その場合、第1の推定された到達方向は第1の源か
らの音声の推定された到達方向であり、第2の推定され
た到達方向は第2の源からの音声の推定された到達方向
であり、かつ、音声源を検出する手段(18)は、前記
比較の結果、前記受信した信号の到達方向が前記第2の
推定された到達方向よりも第1の推定された到達方向に
近いことが判明した場合には、前記装置のユーザが前記
音声源であることを表示するように構成されたことを特
徴とする請求項2に記載の装置。 - 【請求項5】 音声源を検出する前記手段は、音声が前
記第1の源及び前記第2の源から同時に入るような状況
を表示するように構成されたことを特徴とする請求項4
に記載の装置。 - 【請求項6】 双方向音声伝送のための手段を備えてな
り、その際に前記第1の源からの音声は伝送されるべき
近端通話であり、前記第2の源からの音声は音声再生手
段(7)を用いて再生されるように構成された受信され
た遠端通話であることを特徴とする請求項4又は5に記
載の装置。 - 【請求項7】 音声信号が受信され、受信された音声信
号から音声が検出されるようにした音声源を検出する方
法において、受信した信号の到達方向が判定され、ある
特定の源からの音声の推定された到達方向が記憶され、
前記受信した信号の到達方向と前記推定された到達方向
とが比較され、前記比較の結果、前記受信した信号の到
達方向が前記推定された到達方向とある許容差の範囲内
で一致することが判明した場合には、前記音声源が前記
ある特定の源であるものと表示されることを特徴とする
音声源を検出する方法。 - 【請求項8】 音声信号がM個のマイクロフォン(2
a,2b)から受信され、ここでMは整数であり、M個
のマイクロフォン信号が各マイクロフォンの出力として
供給され、前記マイクロフォン信号に基づいて到達方向
の空間スペクトルが生成され、かつ前記スペクトル内で
生ずるピークに基づいて前記スペクトルから前記到達方
向が判定されることを特徴とする請求項7に記載の方
法。 - 【請求項9】 前記到達方向が前記スペクトル曲線の微
分係数を計算し、かつ該微分係数が正から負に変化する
微分係数のゼロ点を復元することによって判定されるこ
とを特徴とする請求項7に記載の方法。 - 【請求項10】 空間スペクトルの各ピークが前記源の
到達方向を記述するパラメータ(fdoa)と、前記到
達方向が出現する確率を記述するパラメータ(pdo
a)及びパラメータ(powdoa)からなり、前記源
からの音声の強度と前記源の前記到達方向とが各パラメ
ータ(fdoa,pdoa,powdoa)を個々に平
均化することによって判定されることを特徴とする請求
項8に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI973596 | 1997-09-04 | ||
FI973596A FI114422B (fi) | 1997-09-04 | 1997-09-04 | Lähteen puheaktiviteetin tunnistus |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11168791A true JPH11168791A (ja) | 1999-06-22 |
JP4624503B2 JP4624503B2 (ja) | 2011-02-02 |
Family
ID=8549474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24987598A Expired - Fee Related JP4624503B2 (ja) | 1997-09-04 | 1998-09-03 | 音声源を検出する装置及び方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6707910B1 (ja) |
EP (1) | EP0901267B1 (ja) |
JP (1) | JP4624503B2 (ja) |
DE (1) | DE69840119D1 (ja) |
FI (1) | FI114422B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245382A (ja) * | 2000-01-13 | 2001-09-07 | Nokia Mobile Phones Ltd | スピーカをトラッキングする方法およびシステム |
JP2008216273A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 通話区間検出装置、その方法、プログラム及び記録媒体 |
JP2009031604A (ja) * | 2007-07-27 | 2009-02-12 | Nippon Telegr & Teleph Corp <Ntt> | 音声区間検出装置、方法、プログラムおよびこれを記録した記録媒体 |
JP2015019185A (ja) * | 2013-07-10 | 2015-01-29 | 日本電信電話株式会社 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
JP2015059794A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社小野測器 | 音源探査装置 |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2358557B (en) * | 2000-01-18 | 2002-05-08 | Motorola Ltd | Digital communications system |
US6993126B1 (en) | 2000-04-28 | 2006-01-31 | Clearsonics Pty Ltd | Apparatus and method for detecting far end speech |
GB2364121B (en) * | 2000-06-30 | 2004-11-24 | Mitel Corp | Method and apparatus for locating a talker |
US8019091B2 (en) * | 2000-07-19 | 2011-09-13 | Aliphcom, Inc. | Voice activity detector (VAD) -based multiple-microphone acoustic noise suppression |
US8280072B2 (en) | 2003-03-27 | 2012-10-02 | Aliphcom, Inc. | Microphone array with rear venting |
US20030004720A1 (en) * | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
JP4195267B2 (ja) | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
US6987992B2 (en) * | 2003-01-08 | 2006-01-17 | Vtech Telecommunications, Limited | Multiple wireless microphone speakerphone system and method |
US9066186B2 (en) | 2003-01-30 | 2015-06-23 | Aliphcom | Light-based detection for acoustic applications |
US9099094B2 (en) | 2003-03-27 | 2015-08-04 | Aliphcom | Microphone array with rear venting |
US7343284B1 (en) * | 2003-07-17 | 2008-03-11 | Nortel Networks Limited | Method and system for speech processing for enhancement and detection |
US10218853B2 (en) * | 2010-07-15 | 2019-02-26 | Gregory C. Burnett | Wireless conference call telephone |
WO2005109951A1 (en) | 2004-05-05 | 2005-11-17 | Deka Products Limited Partnership | Angular discrimination of acoustical or radio signals |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US20060147063A1 (en) * | 2004-12-22 | 2006-07-06 | Broadcom Corporation | Echo cancellation in telephones with multiple microphones |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
US20060245601A1 (en) * | 2005-04-27 | 2006-11-02 | Francois Michaud | Robust localization and tracking of simultaneously moving sound sources using beamforming and particle filtering |
US7362654B2 (en) * | 2005-05-24 | 2008-04-22 | Charly Bitton | System and a method for detecting the direction of arrival of a sound signal |
ATE497327T1 (de) * | 2005-07-06 | 2011-02-15 | Koninkl Philips Electronics Nv | Vorrichtung und verfahren zur schallstrahlformung |
US7689248B2 (en) * | 2005-09-27 | 2010-03-30 | Nokia Corporation | Listening assistance function in phone terminals |
DE102005050790A1 (de) * | 2005-10-24 | 2007-04-26 | Robert Bosch Gmbh | Fahrerinformationssystem mit Freisprecheinrichtung für Funkgeräte, insbesondere Mobiltelefone |
US8295475B2 (en) * | 2006-01-13 | 2012-10-23 | Microsoft Corporation | Selective glitch detection, clock drift compensation, and anti-clipping in audio echo cancellation |
US7831035B2 (en) * | 2006-04-28 | 2010-11-09 | Microsoft Corporation | Integration of a microphone array with acoustic echo cancellation and center clipping |
US7773743B2 (en) * | 2006-04-28 | 2010-08-10 | Microsoft Corporation | Integration of a microphone array with acoustic echo cancellation and residual echo suppression |
JP4912036B2 (ja) * | 2006-05-26 | 2012-04-04 | 富士通株式会社 | 指向性集音装置、指向性集音方法、及びコンピュータプログラム |
US8103011B2 (en) * | 2007-01-31 | 2012-01-24 | Microsoft Corporation | Signal detection using multiple detectors |
US8494177B2 (en) | 2007-06-13 | 2013-07-23 | Aliphcom | Virtual microphone array systems using dual omindirectional microphone array (DOMA) |
CN101394679B (zh) * | 2007-09-17 | 2012-09-19 | 深圳富泰宏精密工业有限公司 | 声源定位系统及方法 |
TWI404967B (zh) * | 2007-10-19 | 2013-08-11 | Chi Mei Comm Systems Inc | 聲源定位系統及方法 |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
US8380253B2 (en) * | 2008-02-15 | 2013-02-19 | Microsoft Corporation | Voice switching for voice communication on computers |
JP2009290825A (ja) * | 2008-06-02 | 2009-12-10 | Yamaha Corp | 音響エコーキャンセラ |
US8369251B2 (en) * | 2008-06-20 | 2013-02-05 | Microsoft Corporation | Timestamp quality assessment for assuring acoustic echo canceller operability |
JP5274130B2 (ja) | 2008-07-15 | 2013-08-28 | キヤノン株式会社 | 像振れ補正装置及び光学機器、撮像装置並びに像振れ補正装置の制御方法 |
US8392185B2 (en) * | 2008-08-20 | 2013-03-05 | Honda Motor Co., Ltd. | Speech recognition system and method for generating a mask of the system |
FR2948484B1 (fr) * | 2009-07-23 | 2011-07-29 | Parrot | Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
KR101251045B1 (ko) * | 2009-07-28 | 2013-04-04 | 한국전자통신연구원 | 오디오 판별 장치 및 그 방법 |
US8442198B2 (en) * | 2009-10-20 | 2013-05-14 | Broadcom Corporation | Distributed multi-party conferencing system |
EP3217653B1 (en) | 2009-12-24 | 2023-12-27 | Nokia Technologies Oy | An apparatus |
JP5668553B2 (ja) * | 2011-03-18 | 2015-02-12 | 富士通株式会社 | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム |
US20120245927A1 (en) * | 2011-03-21 | 2012-09-27 | On Semiconductor Trading Ltd. | System and method for monaural audio processing based preserving speech information |
GB2491173A (en) * | 2011-05-26 | 2012-11-28 | Skype | Setting gain applied to an audio signal based on direction of arrival (DOA) information |
FR2976111B1 (fr) * | 2011-06-01 | 2013-07-05 | Parrot | Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres" |
US9258653B2 (en) | 2012-03-21 | 2016-02-09 | Semiconductor Components Industries, Llc | Method and system for parameter based adaptation of clock speeds to listening devices and audio applications |
CN104781880B (zh) * | 2012-09-03 | 2017-11-28 | 弗劳恩霍夫应用研究促进协会 | 用于提供通知的多信道语音存在概率估计的装置和方法 |
US10049658B2 (en) * | 2013-03-07 | 2018-08-14 | Nuance Communications, Inc. | Method for training an automatic speech recognition system |
US9312826B2 (en) | 2013-03-13 | 2016-04-12 | Kopin Corporation | Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction |
US10306389B2 (en) | 2013-03-13 | 2019-05-28 | Kopin Corporation | Head wearable acoustic system with noise canceling microphone geometry apparatuses and methods |
US8787836B1 (en) | 2013-03-15 | 2014-07-22 | DGS Global Systems, Inc. | Systems, methods, and devices having databases and automated reports for electronic spectrum management |
US10257728B2 (en) | 2013-03-15 | 2019-04-09 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management |
US8805292B1 (en) | 2013-03-15 | 2014-08-12 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management for identifying signal-emitting devices |
US10299149B2 (en) | 2013-03-15 | 2019-05-21 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management |
US10231206B2 (en) | 2013-03-15 | 2019-03-12 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management for identifying signal-emitting devices |
US10257729B2 (en) | 2013-03-15 | 2019-04-09 | DGS Global Systems, Inc. | Systems, methods, and devices having databases for electronic spectrum management |
US9078162B2 (en) | 2013-03-15 | 2015-07-07 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management |
US10122479B2 (en) | 2017-01-23 | 2018-11-06 | DGS Global Systems, Inc. | Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum |
US10237770B2 (en) | 2013-03-15 | 2019-03-19 | DGS Global Systems, Inc. | Systems, methods, and devices having databases and automated reports for electronic spectrum management |
US8750156B1 (en) | 2013-03-15 | 2014-06-10 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management for identifying open space |
US11646918B2 (en) | 2013-03-15 | 2023-05-09 | Digital Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management for identifying open space |
US10257727B2 (en) | 2013-03-15 | 2019-04-09 | DGS Global Systems, Inc. | Systems methods, and devices having databases and automated reports for electronic spectrum management |
US10271233B2 (en) | 2013-03-15 | 2019-04-23 | DGS Global Systems, Inc. | Systems, methods, and devices for automatic signal detection with temporal feature extraction within a spectrum |
US10219163B2 (en) | 2013-03-15 | 2019-02-26 | DGS Global Systems, Inc. | Systems, methods, and devices for electronic spectrum management |
US8798548B1 (en) | 2013-03-15 | 2014-08-05 | DGS Global Systems, Inc. | Systems, methods, and devices having databases for electronic spectrum management |
US10244504B2 (en) | 2013-03-15 | 2019-03-26 | DGS Global Systems, Inc. | Systems, methods, and devices for geolocation with deployable large scale arrays |
KR102282366B1 (ko) * | 2013-06-03 | 2021-07-27 | 삼성전자주식회사 | 음성 향상 방법 및 그 장치 |
EP2911149B1 (en) * | 2014-02-19 | 2019-04-17 | Nokia Technologies OY | Determination of an operational directive based at least in part on a spatial audio property |
US9716946B2 (en) | 2014-06-01 | 2017-07-25 | Insoundz Ltd. | System and method thereof for determining of an optimal deployment of microphones to achieve optimal coverage in a three-dimensional space |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US9930462B2 (en) | 2014-09-14 | 2018-03-27 | Insoundz Ltd. | System and method for on-site microphone calibration |
US11631421B2 (en) * | 2015-10-18 | 2023-04-18 | Solos Technology Limited | Apparatuses and methods for enhanced speech recognition in variable environments |
US9813810B1 (en) * | 2016-01-05 | 2017-11-07 | Google Inc. | Multi-microphone neural network for sound recognition |
US10269375B2 (en) * | 2016-04-22 | 2019-04-23 | Conduent Business Services, Llc | Methods and systems for classifying audio segments of an audio signal |
US10459020B2 (en) | 2017-01-23 | 2019-10-29 | DGS Global Systems, Inc. | Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within a spectrum |
US10700794B2 (en) | 2017-01-23 | 2020-06-30 | Digital Global Systems, Inc. | Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time within an electromagnetic spectrum |
US10498951B2 (en) | 2017-01-23 | 2019-12-03 | Digital Global Systems, Inc. | Systems, methods, and devices for unmanned vehicle detection |
US10529241B2 (en) | 2017-01-23 | 2020-01-07 | Digital Global Systems, Inc. | Unmanned vehicle recognition and threat management |
US11133036B2 (en) | 2017-03-13 | 2021-09-28 | Insoundz Ltd. | System and method for associating audio feeds to corresponding video feeds |
CN109859749A (zh) | 2017-11-30 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 一种语音信号识别方法和装置 |
US11172319B2 (en) | 2017-12-21 | 2021-11-09 | Insoundz Ltd. | System and method for volumetric sound generation |
CN110164423B (zh) * | 2018-08-06 | 2023-01-20 | 腾讯科技(深圳)有限公司 | 一种方位角估计的方法、设备及存储介质 |
US10943461B2 (en) | 2018-08-24 | 2021-03-09 | Digital Global Systems, Inc. | Systems, methods, and devices for automatic signal detection based on power distribution by frequency over time |
CN110261816B (zh) * | 2019-07-10 | 2020-12-15 | 苏州思必驰信息科技有限公司 | 语音波达方向估计方法及装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1458663A (en) | 1972-12-15 | 1976-12-15 | Ard Anstalt | Microphone circuits |
US5299148A (en) * | 1988-10-28 | 1994-03-29 | The Regents Of The University Of California | Self-coherence restoring signal extraction and estimation of signal direction of arrival |
FI83576C (fi) | 1989-02-10 | 1991-07-25 | Nokia Mobira Oy | Foerfarande och kopplingsarrangemang foer reglering av ljudstyrkan vid en mobiltelefon. |
FR2687496B1 (fr) * | 1992-02-18 | 1994-04-01 | Alcatel Radiotelephone | Procede de reduction de bruit acoustique dans un signal de parole. |
US5410595A (en) * | 1992-11-12 | 1995-04-25 | Motorola, Inc. | Apparatus and method for noise reduction for a full-duplex speakerphone or the like |
FI108830B (fi) | 1993-12-23 | 2002-03-28 | Nokia Corp | Menetelmä ja laite kaiun vaimentamiseksi puhelinlaitteessa |
FI98163C (fi) | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
US5828997A (en) * | 1995-06-07 | 1998-10-27 | Sensimetrics Corporation | Content analyzer mixing inverse-direction-probability-weighted noise to input signal |
WO1997007624A1 (en) | 1995-08-21 | 1997-02-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Echo cancelling using signal preprocessing in an acoustic environment |
US6002776A (en) * | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5959667A (en) * | 1996-05-09 | 1999-09-28 | Vtel Corporation | Voice activated camera preset selection system and method of operation |
US5867574A (en) * | 1997-05-19 | 1999-02-02 | Lucent Technologies Inc. | Voice activity detection system and method |
-
1997
- 1997-09-04 FI FI973596A patent/FI114422B/fi not_active IP Right Cessation
-
1998
- 1998-08-26 DE DE69840119T patent/DE69840119D1/de not_active Expired - Lifetime
- 1998-08-26 EP EP98660083A patent/EP0901267B1/en not_active Expired - Lifetime
- 1998-09-02 US US09/145,764 patent/US6707910B1/en not_active Expired - Lifetime
- 1998-09-03 JP JP24987598A patent/JP4624503B2/ja not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001245382A (ja) * | 2000-01-13 | 2001-09-07 | Nokia Mobile Phones Ltd | スピーカをトラッキングする方法およびシステム |
JP4694700B2 (ja) * | 2000-01-13 | 2011-06-08 | ノキア コーポレーション | 話者の方向をトラッキングする方法およびシステム |
JP2008216273A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 通話区間検出装置、その方法、プログラム及び記録媒体 |
JP2009031604A (ja) * | 2007-07-27 | 2009-02-12 | Nippon Telegr & Teleph Corp <Ntt> | 音声区間検出装置、方法、プログラムおよびこれを記録した記録媒体 |
JP2015019185A (ja) * | 2013-07-10 | 2015-01-29 | 日本電信電話株式会社 | 音声スイッチ装置、音声スイッチ方法、及びそのプログラム |
JP2015059794A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社小野測器 | 音源探査装置 |
Also Published As
Publication number | Publication date |
---|---|
EP0901267A2 (en) | 1999-03-10 |
FI114422B (fi) | 2004-10-15 |
FI973596A0 (fi) | 1997-09-04 |
EP0901267A3 (en) | 2000-05-17 |
US6707910B1 (en) | 2004-03-16 |
FI973596A (fi) | 1999-03-05 |
DE69840119D1 (de) | 2008-11-27 |
JP4624503B2 (ja) | 2011-02-02 |
EP0901267B1 (en) | 2008-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4624503B2 (ja) | 音声源を検出する装置及び方法 | |
KR100836522B1 (ko) | 에코 소거 회로용 다운링크 활동 및 더블 토크 확률 검출기및 방법 | |
CN110741434B (zh) | 用于具有可变麦克风阵列定向的耳机的双麦克风语音处理 | |
EP1879180B1 (en) | Reduction of background noise in hands-free systems | |
US9589556B2 (en) | Energy adjustment of acoustic echo replica signal for speech enhancement | |
KR100790770B1 (ko) | 에코 소거기 회로 및 이중 대화 활동 검출 방법 | |
US7003099B1 (en) | Small array microphone for acoustic echo cancellation and noise suppression | |
EP0914721B1 (en) | Echo canceler for non-linear circuits | |
JP4568439B2 (ja) | エコー抑圧装置 | |
US6192126B1 (en) | Double talk detector, method for double talk detection and device incorporating such a detector | |
US8116448B2 (en) | Acoustic echo canceler | |
US10978086B2 (en) | Echo cancellation using a subset of multiple microphones as reference channels | |
US5734715A (en) | Process and device for adaptive identification and adaptive echo canceller relating thereto | |
US5764753A (en) | Half-duplex controller | |
WO2008041878A2 (en) | System and procedure of hands free speech communication using a microphone array | |
EP2101480B1 (en) | Echo canceller and echo cancelling method | |
KR20070050058A (ko) | 향상된 잡음 억제를 구비한 전화통신 디바이스 | |
JP2003500936A (ja) | エコー抑止システムにおけるニアエンド音声信号の改善 | |
CN110995951A (zh) | 基于双端发声检测的回声消除方法、装置及系统 | |
JP3047300B2 (ja) | ハンズフリー会話機能を有する通話装置 | |
US8009825B2 (en) | Signal processing | |
WO2019169272A1 (en) | Enhanced barge-in detector | |
US5621724A (en) | Echo cancelling device capable of coping with deterioration of acoustic echo condition in a short time | |
Hamidia et al. | A new structure for acoustic echo cancellation in double-talk scenario using auxiliary filter | |
JPH01198155A (ja) | 拡声電話機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050721 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050729 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20050729 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080414 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080509 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080603 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080930 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20081016 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20081107 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131112 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |