JP4191518B2 - 直交円形マイクアレイシステム及びこれを用いた音源の3次元方向検出方法 - Google Patents
直交円形マイクアレイシステム及びこれを用いた音源の3次元方向検出方法 Download PDFInfo
- Publication number
- JP4191518B2 JP4191518B2 JP2003086679A JP2003086679A JP4191518B2 JP 4191518 B2 JP4191518 B2 JP 4191518B2 JP 2003086679 A JP2003086679 A JP 2003086679A JP 2003086679 A JP2003086679 A JP 2003086679A JP 4191518 B2 JP4191518 B2 JP 4191518B2
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- microphone array
- sound source
- signal
- microphones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
【発明の属する技術分野】
本発明は音源の3次元方向を検出するシステム及び方法に関する。
【0002】
【従来の技術】
本発明への理解のために、以下では、本発明の方向推定の対象である音源を話者と指称して例示的に説明する。
【0003】
一般にマイクは音響信号を全ての方向で受信する特性を有する。このような特性を有するマイクは、通常、無指向性(全方向性)マイクと呼ばれ、使用されているが、受信しようとする音声信号以外に周りの雑音及び反響まで受信してしまい、所望の音声信号が歪められるという問題がある。かかる通常のマイクの問題点を解決するために使われるのが指向性マイクである。
【0004】
指向性マイクはマイクの軸方向から一定の角度(指向角)内に受信される音響だけを受信する特性を有するので、話者が指向性マイクの指向角内でマイクに向かって話をすれば、話者の音声が周りの雑音に比べて大きくマイクを介して受信され、指向角内に存在しない雑音は受信されない。
【0005】
最近、このような指向性マイクは、遠隔会議においてよく使われる。しかし、指向性マイクを遠隔会議に使う場合、指向性マイクの特性のゆえに、話者はマイクの指向角内でマイクに向かって話さなければならないという制約がある。すなわち、話者は自分の席に座って話す場合にも設けられたマイクの指向角から外れる方向に話せず、指向角から外れて会議室内を移動しつつ話せないため、話者が自由に話せないという不具合が招かれる。
【0006】
上述した問題点を解決するために、マイクを一定の間隔にて配列して一定の空間内で移動する話者の音声信号を受信するマイクアレイシステムが考案されている。
【0007】
図1Aに示すように、平面形マイクアレイシステムは、受音しようとする空間の一側面に設けられて前方で移動する話者の音声を受信する。すなわち、平面形マイクアレイシステムは前方180°ほどの範囲内で移動する話者の音声を受信することができる。しかし、話者がマイクアレイシステムの後方で移動する場合には話者の音声が受信できなくなるという制限が依然として残る。
【0008】
平面形マイクアレイシステムの上述した制限を克服した円形マイクアレイを図1Bに示す。円形マイクアレイシステムは、マイクが設けられた平面内においてその中心から360°の範囲内で移動する話者の音声を受信することができる。しかし、円形マイクアレイは、マイクが設けられた平面をXY平面とした時、XY平面上の話者の位置は考慮するとはいえ、Z軸上の話者の位置は考慮しておらず、全ての方向から発せられる信号を受信することになり、話者の位置とは関係ないZ軸上の方向からの雑音及び反響まで受信してしまうため、音声の歪みを引き起こすという問題点が依然として存在する。
【0009】
【発明が解決しようとする課題】
本発明は、平面的に移動する話者の位置だけではなく、話者の3次元空間上の動きまで考慮して、話者がいかなる方向で発音しても話者の音声を受信することのできるマイクアレイシステム及び方法を提供することを課題とする。
【0010】
本発明が解決しようとする他の課題は、受信される話者の音声を最大化し、且つ、話者の音声を除いた周りの雑音及び反響を最小化して話者の音声を明確に認識させることにより、音声認識の性能を向上させることのできるマイクアレイシステム及び方法を提供することである。
【0011】
【課題を解決するための手段】
前記課題を達成するために、本発明は、音源の3次元方向を検出する直交円形マイクアレイシステムであって、前記音源より音声信号を受信する指向性マイクと、前記音源より音声信号を受信する所定数のマイクが前記指向性マイクの周りに配列された第1マイクアレイと、前記第1マイクアレイと直交するように、前記音源より音声信号を受信する所定数のマイクが前記指向性マイクの周りに配列された第2マイクアレイと、前記第1及び第2マイクアレイより信号を受信し、前記信号が音声信号であるか否かを識別して音源位置を推定する方向検出部と、前記方向検出部において推定された前記音源位置に応じて前記第1マイクアレイ、第2マイクアレイ及び前記指向性マイクの方向を変える回転制御部と、前記指向性マイクより受信された音声信号と前記第1または第2マイクアレイより受信された音声信号とに対して演算を行い、演算の行われた音声信号を出力する音声信号処理部と、を備えることを特徴とする直交円形マイクアレイシステムを提供する。
【0012】
前記直交円形マイクアレイシステムは、好ましくは、前記方向検出部より入力される音声信号であって、前記第1マイクアレイより入力される受信信号または前記第2アレイマイクより入力される受信信号を前記方向検出部の制御信号に応じて選択するスイッチをさらに備える。また、前記方向検出部は、好ましくは、前記第1及び第2マイクアレイより受信された信号から音声信号を識別する音声信号識別部と、前記音声信号識別部より受信された音声信号から、前記第1及び第2マイクアレイに設けられたマイクに受信される音声信号の受信角に応じて音源の方向を推定する音源方向推定部と、前記音源方向推定部において推定された方向に前記第1及び第2マイクアレイを回転させるように制御信号を出力する制御信号生成部と、を備える。
【0013】
さらに、前記目的を達成するために、本発明は、(a)第1マイクアレイより入力される信号から音声信号を識別する段階と、(b)前記第1マイクアレイに設けられたマイクに音声信号が受信される角度に応じて音源の方向を推定し、前記第1マイクアレイと直交する前記第2マイクアレイに設けられたマイクが推定された方向に向かうように前記第2マイクアレイを回転させる段階と、(c)前記第2マイクアレイに設けられたマイクに音声信号が入力される角度に応じて前記音源の方向を推定する段階と、(d)前記超指向性マイクを(b)及び(c)段階において推定された音源の方向に移動させて音声信号を受信し、受信された音声信号を出力する段階と、(e)音源の位置変化及び音源の音声発話が終了したか否かを検出する段階と、を含む音源の3次元方向検出方法を提供する。
【0014】
前記直交円形マイクアレイシステム及び音源の3次元方向検出方法において、前記第1及び第2マイクアレイのうち少なくとも何れか一方は円形であり、前記第1及び第2マイクアレイに設けられたマイクは互いに一定の間隔を保持し、前記第1及び第2マイクアレイに設けられたマイクは指向性マイクであることが望ましい。
【0015】
前記直交円形マイクアレイシステムにおける音源方向推定部において行われる前記音源の3次元方向検出方法における前記(b)及び(c)段階は、好ましくは、前記第1または第2マイクアレイに設けられたマイクに入力される所定レベル以上の音声信号の出力値を合計して周波数領域に変換した後、周波数領域に変換された前記音声信号の出力値の合計値を音声信号の前記マイクにおける受信角を変数として変換し、最高の電力値を示す角度を音源の方向として推定するものである。
【0016】
前記所定レベル以上の音声信号の出力値の合計値y(t)は、好ましくは、アレイマイクの数がMであり、cが媒質内における音速であり、アレイの中心から前記マイクまでの距離がrであるとき、
である。
【0017】
前記直交円形マイクアレイシステムにおける音声信号処理部において行われる前記音源の3次元方向検出方法における(d)段階は、好ましくは、前記第1または第2マイクアレイに設けられたマイクの各々より受信された音声信号を前記各マイク間の位置差により生じた最大遅延時間だけ遅延させて合計し、前記指向性マイクより受信された音声信号を前記最大遅延時間だけ遅延させて前記合計値に加えて所望の音声信号の音質を改善する段階を含む。
【0018】
【発明の実施の形態】
以下、添付した図面に基づき、本発明の好適な実施形態について説明する。
【0019】
図2Aは、本発明による直交円形マイクアレイの構造を示す図面であり、図2Bは、図2Aの直交円形マイクアレイの構造をロボットに対して適用し具現した例である。
【0020】
本発明において、緯度型マイクアレイ201と経度型マイクアレイ202とは物理的に互いと直交するように配され、図2Aに示すように、3次元の形構造を有する。また、マイクアレイシステムは、図2Bに示すように、ロボットや人形などの様々な形態のものに対して応用可能である。
【0021】
各円形マイクアレイ201、202は、本発明に用いられる指向性マイクの指向角及びマイクアレイが具現される物体の大きさを考慮して所定数のマイクが円形に配列されてなる。図2Cに示すように、XYまたはYZ平面の話者の位置を推定するマイクアレイ構造に取り付けられる指向性マイクの指向角σ1が90°であり、円形マイクアレイ構造の半径がRであるとした時、4個の指向性マイクが設けられた場合、表示された話者はマイクの指向角から外れて位置するため、話者の音声はマイクアレイに取り付けられたマイクにより受信されなくなる。
【0022】
一方、マイクの指向角が90°より大きい(指向角がσ2である場合)か、あるいはマイクアレイの半径がより小さい時(半径がrである場合)には、同じ位置の話者により発音される音声がマイクアレイに取り付けられたマイクにより受信される。図2Cに示すところから明らかなように、アレイに取り付けられるマイクの指向角、話者との距離及びアレイが実装される物体の大きさを考慮してマイクアレイを構成しなければならない。マイクアレイは、指向性マイクの指向角σに応じて少なくとも(2π/σ+1)個のマイクを備えれば全体360°の範囲内に存在する話者の位置が検出可能になるが、マイクアレイが実装された物体と話者との間には一定の距離を保持する必要がある。
【0023】
図2に示すマイクアレイシステムにおいて、緯度型マイクアレイ201は、XY平面上において話者より音声を受信するので、話者のXY平面上の2次元位置が推定可能である。XY平面上において話者の2次元位置が推定されると、経度型マイクアレイ202は、推定された2次元位置に向かって回転して話者より音声を受信し、話者の3次元位置が推定可能となる。
【0024】
図3を参照し、直交円形マイクアレイを用いて話者の位置を推定し、話者の音声を受信する本発明によるシステム構成について説明する。
【0025】
本発明によるシステムは、話者の音声をXY平面上において2次元的に受信する緯度型マイクアレイ201と、推定された話者の2次元的位置に向かって話者の音声をYZ平面上において3次元的に受信する経度型マイクアレイ202と、マイクアレイ201、202より受信された信号から話者の位置を推定し、それによる制御信号を出力する方向検出部304と、緯度型マイクアレイ201より入力される音声信号と経度型マイクアレイ202より入力される音声信号とを選択的に方向検出部304に伝えるスイッチ303と、推定された話者の位置から音声を受信する超指向性マイク308と、超指向性マイク308及び経度型アレイマイク202より受信された音質を改善する音声処理部305と、経度型マイクアレイ202の回転方向及び角度を制御する第1回転制御部306及び超指向性マイク308の回転方向及び角度を制御する第2回転制御部307を備える。
【0026】
また、方向検出部304は、緯度型マイクアレイ201及び経度型マイクアレイ202に受信された信号から音声信号を識別する音声信号識別部3041と、音声信号識別部3041より受信された音声信号から、緯度型マイクアレイ201及び経度型マイクアレイ202より入力される音声信号の受信角に応じて音源の方向を推定する音源方向推定部3042と、音源方向推定部3042において推定された方向に経度型マイクアレイ202を回転させるように制御信号を出力し、スイッチ303に入力されるマイクアレイ信号をいつ切り換えるかを決定する制御信号を出力し、音声処理部305に音質改善された音声信号をいつ出力するかを決定する制御信号を出力する制御信号生成部3043を備える。
【0027】
以下、図3及び図4を参照し、本発明による話者の位置推定方法について説明する。
【0028】
本発明によるマイクアレイシステムが通電されると、まず、緯度型マイクアレイ201が作動して周りから信号を受信する(第400段階)。緯度型マイクアレイ201に設けられた指向性マイクは指向角度内で入力される信号を受信し、受信されたアナログ信号はA/D変換器310によりデジタル信号に変換されてスイッチ303に出力される。最初の動作時に、スイッチ303は、緯度型マイクアレイ201より入力される信号を方向検出部304に伝える。
【0029】
方向検出部304に組み込まれた音声信号識別部3041は、スイッチ303を介して入力されたデジタル信号中に音声信号が存在するか否かを識別する(第410段階)。マイクアレイを介して話者の音声をできる限りきれいに受信して音声認識の性能を向上させることが本発明の目的であるという点に鑑みるとき、音声信号識別部3041が現在マイク301より入力された信号のうち音声区間だけを正確に検出して音声処理部305を介して音声認識部320に入力することは、音声認識の性能と関連して極めて重要である。
【0030】
音声認識は、音声のない区間が続いていて音声が入り始めたときにその瞬間をいかに正確に把握して音声信号が開始する瞬間を知らせるかという機能と、音声が続いていて音声のない区間が始まったときにこれをいかに正確に把握して音声信号が終了する瞬間を知らせるかという機能とに大きく分けられる。これら2つの機能を実現するものとして下記のような技術が公知である。
【0031】
まず、音声信号終了の瞬間を知らせる機能を実現するための方法として、マイクを介して入力される信号を一定のフレーム区間(例えば、30ms)に合わせて分割し、これら信号のエネルギーを計算した後にこのエネルギー値が以前のエネルギー値に比べて格段に下がったときに、音声信号がそれ以降発せられないと判断して音声信号終了の瞬間として処理する方法が知られている。この時、エネルギーが格段に小さくなることを判別する臨界値として一つの固定値を用いれば、大きく発音された音声と小さく発音された音声との差を無視できるので、過去の音声区間を観察してその臨界値を適応的に変え、この臨界値を用いて現在入力された信号が音声であるか否かを検出する方法が提案されている(R.ハリハラン(Hariharan, R.),J.ハッキネン(Hakkinen, J.),K.ローリラ(Laurila, K.)共著,「ロウバスト・エンド−オブ−アタランス・デテクション・フォー・リアルタイム・スピーチ・レコグニション・アプリケーションズ(Robust end-of-utterance detection for real-time speech recognition applications)」,2001年度アイトリプリー・インターナショナル・コンファレンス・オン・アコースティックス・スピーチ・アンド・シグナルプロセッシング、論集(2001 IEEE International Conference on Acoustics, Speech, and Signal Processing, Proceedings),2001年,第1巻,249−252頁参照)。
【0032】
音声認識に関する他の方法としては、OOV(Out-Of-Vocabulary)に該当する語彙に対してガーベージ(非音声)モデルを予め構成しておいて、実際に使う時にマイクを介して入った信号がこのモデルにいかほど適しているかを判断してガーベージであるか、それとも音声信号であるかを判別する方法が公知である。この方法は、音声ではない音にを前もって学習することによってガーベージモデルを構成し、現在入力された信号がこのガーベージモデルにいかほど適しているかを判断して音声/ガーベージ区間を決定する方法である。また、雑音入り音声と雑音の入っていない音声との関係を神経網や線形回帰分析を用いて推定した後、変換により雑音を除去する方法を用いることもある(J.カミネロ(Caminero, J.)、D.デラトッレ(De La Torre, D.),L.ヴィラルビア(Villarrubia, L.),C.マーチン(Martin, C.),L.エルナンデス(Hernandez, L.)共著,「オンライン・ガーベージ・モデリング・ウィズ・ディスクリミナント・アナリシス・フォー・アタランス・ベリフィケーション(On-line Garbage Modeling with Discriminant Analysis for Utterance Verification)」,第4回インターナショナル・コンファレンス・オン・スポークン・ランゲージ、ICSLP96論集(Fourth International Conference on Spoken Language, ICSLP 96 Proceedings)」,1996年,第4巻,2111〜2114頁参照)。
【0033】
前述した方法などを用い、音声信号識別部3041は、緯度型マイクアレイ201を介して一定レベル以上の音声信号値が入力されなければ現在音声が入力されていないと見なす。緯度型マイクアレイ201に設けられたマイク301のうち一部、例えば、n個のマイクから一定レベル以上の音声信号値が検出され、他のマイクからは信号値が入力されない場合には音声信号が検出されると判断し、話者が(n+1)×σ(ここで、σは指向角)内に存在すると判断して入力された信号を音源方向推定部3042に出力する。
【0034】
図5A及び図5Bを参照し、話者の方向を推定する方法について説明する。話者から本発明によるマイクアレイへと入力される音声信号は、マイクアレイ201、202に設けられた各マイク301、302に達する時、音声信号が最初に達したマイクに比べて一定の遅延時間をもって受信される。この遅延時間はマイクの指向角σ及び話者の位置、すなわち、音声信号が入力される角度θに応じて決定される。
【0035】
本実施形態では指向性マイクの特性を考慮し、音が一定の信号レベル未満に受信されるマイクの場合には、話者が各該当マイクの指向角内にないと判断し、これらマイクが担当する角度は話者の位置推定角度から除外される。
【0036】
音源方向推定部3042は、話者の位置を推定するために、図5Aに示されたように、まず、ある指向性マイクを基準マイクとして選択し、アレイの中心から基準となる指向性マイクをつなぐ仮想の線(基準線)から話者の音声が受信される角度θを測定する。基準となるマイク以外のマイクに対しては基準線と平行な仮想の線からマイクに受信される角度を測定する。もし、アレイの実装された物体が音源よりかなり大きくなければ、音声を受信する各マイクにおける音声受信角θは実質的に同じでありうる。
【0037】
一定レベル以上の音が受信されるマイクにおいて受信された全ての音を合計し、これを高速フーリエ変換(FFT)を通じて周波数領域に変換した後にこれを再びθの領域に変換した時、最大の電力値を有するθが話者の位置する方向を表わす。
【0038】
ある時間領域において一定の遅延時間をもってn番目のマイクに入力される受信音声信号をxn(t)とし、各々のマイクの音声信号値を合計した出力信号をy(t)とした時、y(t)は下記式により得られる。
【0039】
【数1】
【0040】
y(t)を周波数領域に変換して得られたY(f)は、下記の通りである。
【0041】
【数2】
【0042】
この時、cは音源から音声が伝えられる媒質における音速を表わし、δはマイクアレイに設けられたマイク間の間隔を表わし、Mはアレイに設けられたマイクの数を表わし、θはマイクに受信される音声信号の入射角を各々表わし、δ=2π/Mが成立つ。
【0043】
周波数領域に変換されたY(f)を変数θにより表わし、すなわち、Y(f)を再びθの領域に変換し、θの領域において受信された音声信号のエネルギーを求めれば、下記の通りである。
【0044】
【数3】
【0045】
但し、θは0からπの値を有し、Y(f)を再びθの領域に変換する時、周波数領域における負の最大値がθの領域における0°に、周波数領域における0°がθの領域における(n+1)×δ/2に、周波数領域における正の最大値がθの領域における(n+1)×δにマッピングされるように周波数領域をθの領域に変換する。
【0046】
マイクアレイの出力であるP(θ,k;m)によりθによる出力エネルギーの大きさが分かり、最大出力時のθを決定できるので、受信される音声から音声信号の直声強度が分かる。この式を全ての周波数kに対してまとめれば、電力スペクトル値P(θ;m)は下記の通りである。
【0047】
【数4】
【0048】
結論的に、全ての周波数領域において最大エネルギーを有する話者の方向をθSとした時、θS=argmaxθP(θ;m)のように話者の方向を決定することができる(第420段階)。
【0049】
上述したように、緯度型マイクアレイ201より入力された音声信号から話者の緯度方向の2次元位置が推定されれば、音源方向推定部3042は制御信号生成部3043に検出された話者の方向θSを出力し、制御信号生成部3043は第1回転制御部306に話者の方向であるθSだけ経度型マイクアレイ202が回転するように制御信号を出力する。第1回転制御部306は経度型マイクアレイ202をθSだけ回転させて経度型マイクアレイ202が2次元上の話者に正面から向かうように配置される。経度型マイクアレイ202を話者の方向に回転させる場合、経度型マイクアレイ202だけが回転することも可能であるが、緯度型マイクアレイ201と経度型マイクアレイ202とが共に回転することが好ましい。この場合には、緯度型マイクアレイ201と経度型マイクアレイ202とにより共用されるマイクが話者に向かえば適当に回転されたと判断できる(第430段階)。
【0050】
一方、経度型マイクアレイ202の回転が終了すれば、制御信号生成部3043はスイッチ303に制御信号を出力し、経度型マイクアレイ202より入力される話者の音声信号を音声信号識別部3041に伝える。方向検出部304は経度型マイクアレイ202より入力される音声信号を用い、第420段階における方法と同様にして話者の3次元空間上の位置を推定し、結果的に、話者の3次元空間における位置が、図5Bに示すように決定される。
【0051】
話者の3次元方向が決定されれば、制御信号生成部3043は第2回転制御部307に制御信号を出力し、超指向性マイク308を話者の3次元方向に直接的に向かうように回転させる(第450段階)。
【0052】
超指向性マイク308を介して受信された話者の音声信号はA/D変換器309によりデジタル信号に変換された後、音声処理部305に入力される。入力された超指向性マイク信号は音声処理部305において経度型マイクアレイより受信された話者の音声信号と共に音質改善の過程に適用できる(第460段階)。
【0053】
本発明が適用される環境を示す図6及び音質改善の過程を示す図7を参照し、第460段階の音質改善過程について説明する。
【0054】
図6に示すように、本発明によるシステムには、マイクアレイを介して話者の音声信号だけではなく、壁体などの反射体からの反響信号及び機械などの雑音源からの雑音が受信される。本発明においては、超指向性マイク308により感知された信号とアレイマイクにより処理された音声信号とを共に処理して音質改善の効果を最大限に高めることができる。
【0055】
併せて、本発明においては、いったん話者の方向を決定し、話者の方向に超指向性マイク308を向かわせて超指向性マイク308により話者の音声信号を受信すれば、経度型マイクアレイ202または緯度型マイクアレイ201に受信された雑音や反響が音声処理部305に入力されることを防ぐために超指向性マイク308より受信された信号のみを処理することも可能である。但し、話者が位置を突然変えた場合、前述した段階を再び行って話者の変わった位置を決定するのに時間がかかり、その期間中には話者の音声が処理されない場合がある。
【0056】
このような状況に対応し、本発明によるシステムは、図7に示すブラインド分離回路に緯度型マイクアレイ201または経度型マイクアレイ202より受信された話者の音声信号と超指向性マイク308より受信された音声信号とを入力することにより、各マイクより入力された話者の音声信号と周りの雑音信号とを分離し、受信された音声信号の音質を向上させる。
【0057】
図7に示すように、マイクアレイに受信された信号だけではなく、超指向性マイク308に受信された音声信号が遅延時間をもって話者の音声信号を受信するアレイマイクの遅延時間まで遅延されて合計され、また処理される。
【0058】
図7に示す回路の動作について説明すれば、音声処理部305は、ブラインド分離回路にマイクアレイより入力される信号xarray(t)と超指向性マイクより入力される信号xdirection(t)とを入力する。これら2つの入力信号には話者の音声成分と周りの雑音成分との2種類が存在する。これが図7のブラインド分離回路に入力されると、雑音成分と話者の音声成分とを分離してy1(t)及びy2(t)を出力する。出力されるy1(t)及びy2(t)は、下記式の通りである。
【0059】
【数5】
【0060】
前記式はΔwarray,j(k)=−μtanh(y1(t))yj(t−k)、Δwdirection,j(k)=−μtanh(y2(t))y1(t−k)により決定され、ウェートwは最尤(ML:Maximum Likelihood)推定法に基づくものであり、相異なる信号成分が統計的に分離されるように学習された値が使われる。この時、tanh()は非線形的なシグモイド(Sigmoid)関数を意味し、μは収束定数であって、ウェートが最適の値を推定する度合いを決定する。
【0061】
話者の音声が出力される間に、音源方向推定部3042は、緯度型マイクアレイ201及び経度型マイクアレイ202に受信される話者の音声から話者の位置が変わったか否かをチェックする。もし、話者の位置が変わったならば、第420段階へ進んで再び話者のXY平面上の位置とYZ平面上の位置とを推定する。但し、本発明の実施形態により話者のYZ平面上の位置のみが変わったならば、第440段階へ直ちに進んでも良い(第470段階)。
【0062】
話者の位置が変わっていない場合には、音声信号識別部3041は、第410段階における方法と同様にして話者の音声発話が終了したか否かを検出する。ここで、話者の音声発話が終了していなければ、再び話者の位置が変わったか否かを検出する(第480段階)。
【0063】
【発明の効果】
上述したように、本発明によれば、指向性マイクが円形に一定の間隔をもって配置された緯度型マイクアレイと経度型マイクアレイとを互いと直交するように配置することにより、平面的に移動する話者の位置だけではなく話者の3次元空間上の動きまで考慮でき、話者がいかなる方向で発音しても話者の音声を受信できる効果がある。
【0064】
併せて、3次元的な話者の位置が決定されれば、超指向性マイクを話者の方向に向かわせて話者の音声信号を受信することにより、受信される話者の音声を最大化し、話者が発音する時に生じる反響や周辺雑音の影響を最小化して話者の音声を明確に認識させることにより、音声認識の性能を向上させられる。
【0065】
さらに、超指向性マイクより受信される話者の音声信号だけではなく緯度型マイクアレイまたは経度型マイクアレイより受信されてから各マイクごとに一定の遅延間隔をもって遅延されて合計された信号を超指向性マイクより受信された信号と共に出力することにより、出力効率を高められる効果がある。
【0066】
上述した本発明の好適な実施形態は例示的なものであり、これに対するあらゆる変形及び変更は特許請求の範囲に属すると理解さるべきである。
【図面の簡単な説明】
【図1A】従来の技術による平面形マイクアレイシステムの構造を示す図面である。
【図1B】従来の技術による円形マイクアレイシステムの構造を示す図面である。
【図2A】本発明による直交円形マイクアレイの構造を示す図面である。
【図2B】本発明によるマイクアレイを具体的に適用した例を示す図面である。
【図2C】マイクアレイ上にマイクを配置する時の考慮事項を説明するための図面である。
【図3】本発明による直交円形マイクアレイシステムの構成を示すブロック図である。
【図4】本発明による音源の3次元方向検出方法を示すフローチャートである。
【図5A】本発明により音源の方向を推定するために音源の角度を分析する例を示す図面である。
【図5B】最終的に決定された話者の位置を示す図面である。
【図6】本発明によるシステムが適用される環境を示す図面である。
【図7】音源より受信された音声信号を分離して音質の向上を図るブラインド分離回路を示す図面である。
【符号の説明】
201 緯度型マイクアレイ
202 経度型マイクアレイ
304 方向検出部
Claims (16)
- 音源の3次元方向を検出する直交円形マイクアレイシステムであって、
前記音源より音声信号を受信する指向性マイクと、
前記音源より音声信号を受信する所定数のマイクが前記指向性マイクの周りに配列された第1マイクアレイと、
前記第1マイクアレイと直交するように、前記音源より音声信号を受信する所定数のマイクが前記指向性マイクの周りに配列された第2マイクアレイと、
前記第1及び第2マイクアレイより信号を受信し、前記信号が音声信号であるか否かを識別して音源の位置を推定する方向検出部と、
前記方向検出部において推定された前記音源の位置に応じて前記第1マイクアレイ、第2マイクアレイ及び前記指向性マイクの方向を変える回転制御部と、
前記指向性マイクより受信された音声信号と前記第1または第2マイクアレイより受信された音声信号とに対して演算を行い、演算の行われた音声信号を出力する音声信号処理部と、を備えることを特徴とする直交円形マイクアレイシステム。 - 前記第1及び第2マイクアレイのうち少なくとも何れか一方は円形であることを特徴とする請求項1に記載の直交円形マイクアレイシステム。
- 前記第1及び第2マイクアレイに設けられたマイクは互いに一定の間隔を保持することを特徴とする請求項1に記載の直交円形マイクアレイシステム。
- 前記第1及び第2マイクアレイに設けられたマイクは指向性マイクであることを特徴とする請求項1に記載の直交円形マイクアレイシステム。
- 前記第1マイクアレイより入力される受信信号または前記第2アレイマイクより入力される受信信号を前記方向検出部の制御信号に応じて選択するスイッチをさらに備えることを特徴とする請求項1に記載の直交円形マイクアレイシステム。
- 前記方向検出部は、前記第1及び第2マイクアレイより受信された信号から音声信号を識別する音声信号識別部と、
前記音声信号識別部より受信された音声信号から、前記第1及び第2マイクアレイに設けられたマイクに受信される音声信号の受信角に応じて音源の方向を推定する音源方向推定部と、
前記音源方向推定部において推定された方向に前記第1及び第2マイクアレイを回転させるように制御信号を出力する制御信号生成部と、を備えることを特徴とする請求項1ないし請求項5のうち何れか1項に記載の直交円形マイクアレイシステム。 - 前記音源方向推定部は、前記第1または第2マイクアレイに設けられたマイクに入力される所定レベル以上の音声信号の出力値を合計して周波数領域に変換した後、周波数領域に変換された前記音声信号の出力値の合計値を音声信号の前記マイクにおける受信角を変数として変換し、最高の電力値を示す角度を音源の方向として推定することを特徴とする請求項6に記載の直交円形マイクアレイシステム。
- 前記音声信号処理部は、前記第1または第2マイクアレイに設けられたマイクの各々より受信された音声信号を前記各マイク間の位置差により生じた最大遅延時間まで遅延させて合計し、前記指向性マイクより受信された音声信号を前記最大遅延時間だけ遅延させて前記合計値に加えて所望の音声信号の音質を改善することを特徴とする請求項1ないし請求項5のうち何れか1項に記載の直交円形マイクアレイシステム。
- 所定数のマイクが配列された第1及び第2マイクアレイと指向性マイクとを用いて音源の3次元方向を検出する方法であって、
(a)第1マイクアレイより入力される信号から音声信号を識別する段階と、
(b)前記第1マイクアレイに設けられたマイクに音声信号が受信される角度に応じて音源の方向を推定し、前記第1マイクアレイと直交する前記第2マイクアレイに設けられたマイクが推定された方向に向かうように前記第2マイクアレイを回転させる段階と、
(c)前記第2マイクアレイに設けられたマイクに音声信号が入力される角度に応じて前記音源の方向を推定する段階と、
(d)前記指向性マイクを(b)及び(c)段階において推定された音源の方向に移動させて音声信号を受信し、受信された音声信号を出力する段階と、
(e)音源の位置変化及び音源の音声発話が終了したか否かを検出する段階と、を含むことを特徴とする音源の3次元方向検出方法。 - 前記第1及び第2マイクアレイのうち少なくとも何れか一方は円形であることを特徴とする請求項10に記載の音源の3次元方向検出方法。
- 前記第1及び第2マイクアレイに設けられたマイクは互いに一定の間隔を保持することを特徴とする請求項10に記載の音源の3次元方向検出方法。
- 前記第1及び第2マイクアレイに設けられたマイクは指向性マイクであることを特徴とする請求項10に記載の音源の3次元方向検出方法。
- 前記(b)及び(c)段階は、前記第1または第2マイクアレイに設けられたマイクに入力される所定レベル以上の音声信号の出力値を合計して周波数領域に変換した後、周波数領域に変換された前記音声信号の出力値の合計値を音声信号の前記マイクにおける受信角を変数として変換し、最高の電力値を示す角度を音源の方向として推定することを特徴とする請求項10ないし請求項13のうち何れか1項に記載の音源の3次元方向検出方法。
- 前記(d)段階は、前記第1または第2マイクアレイに設けられたマイクの各々より受信された音声信号を前記各マイク間の位置差により生じた最大遅延時間だけ遅延させて合計し、前記指向性マイクより受信された音声信号を前記最大遅延時間だけ遅延させて前記合計値に加えて所望の音声信号の音質を改善する段階を含むことを特徴とする請求項10ないし請求項13のうち何れか1項に記載の音源の3次元方向検出方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0016692A KR100499124B1 (ko) | 2002-03-27 | 2002-03-27 | 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법 |
KR2002-016692 | 2002-03-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003304589A JP2003304589A (ja) | 2003-10-24 |
JP4191518B2 true JP4191518B2 (ja) | 2008-12-03 |
Family
ID=36089199
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003086679A Expired - Fee Related JP4191518B2 (ja) | 2002-03-27 | 2003-03-27 | 直交円形マイクアレイシステム及びこれを用いた音源の3次元方向検出方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7158645B2 (ja) |
EP (1) | EP1349419B1 (ja) |
JP (1) | JP4191518B2 (ja) |
KR (1) | KR100499124B1 (ja) |
DE (1) | DE60303338T2 (ja) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8724822B2 (en) | 2003-05-09 | 2014-05-13 | Nuance Communications, Inc. | Noisy environment communication enhancement system |
US7643641B2 (en) * | 2003-05-09 | 2010-01-05 | Nuance Communications, Inc. | System for communication enhancement in a noisy environment |
JP4797330B2 (ja) * | 2004-03-08 | 2011-10-19 | 日本電気株式会社 | ロボット |
WO2005125267A2 (en) * | 2004-05-05 | 2005-12-29 | Southwest Research Institute | Airborne collection of acoustic data using an unmanned aerial vehicle |
KR100589446B1 (ko) * | 2004-06-29 | 2006-06-14 | 학교법인연세대학교 | 음원의 위치정보를 포함하는 오디오 부호화/복호화 방법및 장치 |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
DE602006012030D1 (de) * | 2005-03-30 | 2010-03-18 | Audiogravity Holdings Ltd | Vorrichtung zur Unterdrückung von Windgeräuschen |
JP2006311104A (ja) * | 2005-04-27 | 2006-11-09 | Star Micronics Co Ltd | マイクロホンシステム |
KR100827080B1 (ko) * | 2007-01-09 | 2008-05-06 | 삼성전자주식회사 | 사용자 인식 기반의 빔 포밍 장치 및 방법 |
DE102007016433A1 (de) * | 2007-01-11 | 2008-07-17 | Rheinmetall Defence Electronics Gmbh | Mikrofonanordnungen in kleinen akustischen Antennen |
KR100877914B1 (ko) * | 2007-01-25 | 2009-01-12 | 한국과학기술연구원 | 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법 |
US7953233B2 (en) * | 2007-03-20 | 2011-05-31 | National Semiconductor Corporation | Synchronous detection and calibration system and method for differential acoustic sensors |
KR100873000B1 (ko) * | 2007-03-28 | 2008-12-09 | 경상대학교산학협력단 | 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법 |
US8098842B2 (en) * | 2007-03-29 | 2012-01-17 | Microsoft Corp. | Enhanced beamforming for arrays of directional microphones |
JP4332753B2 (ja) * | 2007-06-13 | 2009-09-16 | ソニー株式会社 | 音声レコーダ |
US8526632B2 (en) * | 2007-06-28 | 2013-09-03 | Microsoft Corporation | Microphone array for a camera speakerphone |
US8330787B2 (en) | 2007-06-29 | 2012-12-11 | Microsoft Corporation | Capture device movement compensation for speaker indexing |
JP5228407B2 (ja) * | 2007-09-04 | 2013-07-03 | ヤマハ株式会社 | 放収音装置 |
JP5034819B2 (ja) * | 2007-09-21 | 2012-09-26 | ヤマハ株式会社 | 放収音装置 |
KR100921368B1 (ko) * | 2007-10-10 | 2009-10-14 | 충남대학교산학협력단 | 이동형 마이크로폰 어레이를 이용한 소음원 위치 판별정밀도 개선 시스템 및 방법 |
KR100936587B1 (ko) | 2007-12-10 | 2010-01-13 | 한국항공우주연구원 | 3차원 마이크로폰 어레이 구조 |
JP5293305B2 (ja) * | 2008-03-27 | 2013-09-18 | ヤマハ株式会社 | 音声処理装置 |
US8189807B2 (en) * | 2008-06-27 | 2012-05-29 | Microsoft Corporation | Satellite microphone array for video conferencing |
KR101021800B1 (ko) | 2009-03-27 | 2011-03-17 | 서강대학교산학협력단 | 음향 채널 추정에 기반한 음원 위치 탐지 방법 |
KR101090182B1 (ko) | 2009-11-17 | 2011-12-06 | 경희대학교 산학협력단 | 음원 방향의 동적 탐지 장치 및 방법 |
KR101081752B1 (ko) | 2009-11-30 | 2011-11-09 | 한국과학기술연구원 | 인공귀 및 이를 이용한 음원 방향 검지 방법 |
KR101633380B1 (ko) * | 2009-12-08 | 2016-06-24 | 삼성전자주식회사 | 휴대용 단말기에서 블로우 방향을 인식하기 위한 장치 및 방법 |
JP5423370B2 (ja) * | 2009-12-10 | 2014-02-19 | 船井電機株式会社 | 音源探査装置 |
EP2410769B1 (en) * | 2010-07-23 | 2014-10-22 | Sony Ericsson Mobile Communications AB | Method for determining an acoustic property of an environment |
TW201208335A (en) * | 2010-08-10 | 2012-02-16 | Hon Hai Prec Ind Co Ltd | Electronic device |
EP2509337B1 (en) * | 2011-04-06 | 2014-09-24 | Sony Ericsson Mobile Communications AB | Accelerometer vector controlled noise cancelling method |
GB2494849A (en) * | 2011-04-14 | 2013-03-27 | Orbitsound Ltd | Microphone assembly |
JP6179081B2 (ja) * | 2011-09-15 | 2017-08-16 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
US9031259B2 (en) * | 2011-09-15 | 2015-05-12 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
JP5958218B2 (ja) * | 2011-09-15 | 2016-07-27 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
EP2850611B1 (en) | 2012-06-10 | 2019-08-21 | Nuance Communications, Inc. | Noise dependent signal processing for in-car communication systems with multiple acoustic zones |
CN103634721A (zh) | 2012-08-20 | 2014-03-12 | 联想(北京)有限公司 | 一种数据处理方法以及一种电子设备 |
KR101987966B1 (ko) * | 2012-09-03 | 2019-06-11 | 현대모비스 주식회사 | 차량용 어레이 마이크의 음성 인식 향상 시스템 및 그 방법 |
CN104704560B (zh) | 2012-09-04 | 2018-06-05 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
US9613633B2 (en) | 2012-10-30 | 2017-04-04 | Nuance Communications, Inc. | Speech enhancement |
KR101345774B1 (ko) * | 2012-12-12 | 2014-01-06 | 한국과학기술연구원 | 회전형 마이크로폰 어레이를 이용한 3차원 음원의 방향 검지 장치 및 방법 |
CN103152672B (zh) * | 2013-04-03 | 2015-04-15 | 南京工程学院 | 一种微麦克风阵列接收信号压缩编码及信号恢复方法 |
KR101502788B1 (ko) | 2013-08-21 | 2015-03-16 | 한국과학기술원 | 복수개의 3차원 인텐시티 프로브를 이용한 음원위치추정시스템 |
CN104768099B (zh) * | 2014-01-02 | 2018-02-13 | 中国科学院声学研究所 | 用于圆环形阵的模态波束形成器及频域宽带实现方法 |
KR101673579B1 (ko) * | 2014-04-30 | 2016-11-07 | 광주과학기술원 | 이동체의 위치감지장치, 이동체의 위치감지방법, 조명장치, 공조장치, 보안장치, 및 주차장관리장치 |
US10009676B2 (en) | 2014-11-03 | 2018-06-26 | Storz Endoskop Produktions Gmbh | Voice control system with multiple microphone arrays |
EP3079375A1 (en) * | 2015-04-10 | 2016-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Differential sound reproduction |
US9788109B2 (en) | 2015-09-09 | 2017-10-10 | Microsoft Technology Licensing, Llc | Microphone placement for sound source direction estimation |
CN105551495A (zh) * | 2015-12-15 | 2016-05-04 | 青岛海尔智能技术研发有限公司 | 一种声音滤噪装置及方法 |
JP6485370B2 (ja) * | 2016-01-14 | 2019-03-20 | トヨタ自動車株式会社 | ロボット |
JP6529451B2 (ja) * | 2016-02-23 | 2019-06-12 | 日本電信電話株式会社 | 音源定位装置、方法、及びプログラム |
US10492000B2 (en) | 2016-04-08 | 2019-11-26 | Google Llc | Cylindrical microphone array for efficient recording of 3D sound fields |
US10531210B2 (en) * | 2016-09-29 | 2020-01-07 | Walmart Apollo, Llc | Systems, devices, and methods for detecting spills using audio sensors |
KR20180037543A (ko) * | 2016-10-04 | 2018-04-12 | 삼성전자주식회사 | 음성 인식 전자 장치 |
US10276161B2 (en) * | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10535360B1 (en) * | 2017-05-25 | 2020-01-14 | Tp Lab, Inc. | Phone stand using a plurality of directional speakers |
CN107422305B (zh) * | 2017-06-06 | 2020-03-13 | 歌尔股份有限公司 | 一种麦克风阵列声源定位方法和装置 |
PL236718B1 (pl) * | 2017-07-20 | 2021-02-08 | Politechnika Gdanska | Sonda natężeniowa wraz z układem korekcji |
JP6879144B2 (ja) * | 2017-09-22 | 2021-06-02 | 沖電気工業株式会社 | 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム |
CN108172236B (zh) * | 2018-01-12 | 2021-08-20 | 歌尔科技有限公司 | 一种拾音降噪方法以及智能电子设备 |
CN110495185B (zh) * | 2018-03-09 | 2022-07-01 | 深圳市汇顶科技股份有限公司 | 语音信号处理方法及装置 |
US10847162B2 (en) * | 2018-05-07 | 2020-11-24 | Microsoft Technology Licensing, Llc | Multi-modal speech localization |
CN110491376B (zh) * | 2018-05-11 | 2022-05-10 | 北京国双科技有限公司 | 一种语音处理方法及装置 |
US10951859B2 (en) | 2018-05-30 | 2021-03-16 | Microsoft Technology Licensing, Llc | Videoconferencing device and method |
US10206036B1 (en) * | 2018-08-06 | 2019-02-12 | Alibaba Group Holding Limited | Method and apparatus for sound source location detection |
WO2020034095A1 (zh) | 2018-08-14 | 2020-02-20 | 阿里巴巴集团控股有限公司 | 音频信号处理装置及方法 |
KR102097641B1 (ko) * | 2018-08-16 | 2020-04-06 | 국방과학연구소 | 구형 마이크로폰 어레이를 이용한 음원의 입사 방향 추정방법 |
JP6908636B2 (ja) * | 2019-01-30 | 2021-07-28 | 富士ソフト株式会社 | ロボットおよびロボットの音声処理方法 |
CN111050266B (zh) * | 2019-12-20 | 2021-07-30 | 朱凤邹 | 一种基于耳机检测动作进行功能控制的方法及系统 |
US11514892B2 (en) * | 2020-03-19 | 2022-11-29 | International Business Machines Corporation | Audio-spectral-masking-deep-neural-network crowd search |
US11425496B2 (en) * | 2020-05-01 | 2022-08-23 | International Business Machines Corporation | Two-dimensional sound localization with transformation layer |
CN112630730B (zh) * | 2020-11-13 | 2024-04-02 | 清华大学苏州汽车研究院(相城) | 一种基于tdoa多声源定位的虚假声源消除方法 |
CN113126028B (zh) * | 2021-04-13 | 2022-09-02 | 上海盈蓓德智能科技有限公司 | 一种基于多个麦克风阵列的噪声源定位方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4003016A (en) * | 1975-10-06 | 1977-01-11 | The United States Of America As Represented By The Secretary Of The Navy | Digital beamforming system |
JPS6090499A (ja) | 1983-10-24 | 1985-05-21 | Nippon Telegr & Teleph Corp <Ntt> | 集音装置 |
US4696043A (en) * | 1984-08-24 | 1987-09-22 | Victor Company Of Japan, Ltd. | Microphone apparatus having a variable directivity pattern |
WO1994026075A1 (en) | 1993-05-03 | 1994-11-10 | The University Of British Columbia | Tracking platform system |
US5581620A (en) * | 1994-04-21 | 1996-12-03 | Brown University Research Foundation | Methods and apparatus for adaptive beamforming |
US5490599A (en) * | 1994-12-23 | 1996-02-13 | Tohidi; Fred F. | Long multi-position microphone support stand |
JP3797751B2 (ja) * | 1996-11-27 | 2006-07-19 | 富士通株式会社 | マイクロホンシステム |
US6041127A (en) * | 1997-04-03 | 2000-03-21 | Lucent Technologies Inc. | Steerable and variable first-order differential microphone array |
JP3344647B2 (ja) * | 1998-02-18 | 2002-11-11 | 富士通株式会社 | マイクロホンアレイ装置 |
KR100387271B1 (ko) * | 1998-08-06 | 2003-08-21 | 주식회사 싸이시스 | 수동식음원원격측정시스템및그방법 |
US6845163B1 (en) * | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
CN1436436A (zh) * | 2000-03-31 | 2003-08-13 | 克拉里提有限公司 | 用于话音信号提取的方法和设备 |
JP2002008189A (ja) * | 2000-06-22 | 2002-01-11 | Matsushita Electric Ind Co Ltd | 車両検出装置および車両検出方法 |
AU2000267447A1 (en) | 2000-07-03 | 2002-01-14 | Nanyang Technological University | Microphone array system |
KR20020066475A (ko) * | 2001-02-12 | 2002-08-19 | 이성태 | 음원의 입사각 결정 시스템 및 그 방법 |
-
2002
- 2002-03-27 KR KR10-2002-0016692A patent/KR100499124B1/ko not_active IP Right Cessation
-
2003
- 2003-03-25 US US10/395,104 patent/US7158645B2/en active Active
- 2003-03-27 JP JP2003086679A patent/JP4191518B2/ja not_active Expired - Fee Related
- 2003-03-27 EP EP03251959A patent/EP1349419B1/en not_active Expired - Lifetime
- 2003-03-27 DE DE60303338T patent/DE60303338T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR20030077797A (ko) | 2003-10-04 |
EP1349419B1 (en) | 2006-01-25 |
DE60303338D1 (de) | 2006-04-13 |
EP1349419A2 (en) | 2003-10-01 |
US7158645B2 (en) | 2007-01-02 |
EP1349419A3 (en) | 2003-11-05 |
KR100499124B1 (ko) | 2005-07-04 |
JP2003304589A (ja) | 2003-10-24 |
DE60303338T2 (de) | 2006-10-12 |
US20030185410A1 (en) | 2003-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4191518B2 (ja) | 直交円形マイクアレイシステム及びこれを用いた音源の3次元方向検出方法 | |
Vecchiotti et al. | End-to-end binaural sound localisation from the raw waveform | |
EP1983799B1 (en) | Acoustic localization of a speaker | |
US11190900B2 (en) | Spatial audio array processing system and method | |
EP1489596B1 (en) | Device and method for voice activity detection | |
Ishi et al. | Evaluation of a MUSIC-based real-time sound localization of multiple sound sources in real noisy environments | |
EP1856948B1 (en) | Position-independent microphone system | |
CN110140359B (zh) | 使用波束形成的音频捕获 | |
US8116478B2 (en) | Apparatus and method for beamforming in consideration of actual noise environment character | |
CN106663445A (zh) | 声音处理装置、声音处理方法及程序 | |
US20220201421A1 (en) | Spatial audio array processing system and method | |
Ince et al. | Assessment of general applicability of ego noise estimation | |
EP4004905B1 (en) | Normalizing features extracted from audio data for signal recognition or modification | |
Zhao et al. | A robust real-time sound source localization system for olivia robot | |
Okuno et al. | Robot audition: Missing feature theory approach and active audition | |
JP2005303574A (ja) | 音声認識ヘッドセット | |
Nakadai et al. | Sound source separation and automatic speech recognition for moving sources | |
Shujau et al. | Using in-air acoustic vector sensors for tracking moving speakers | |
US20220086592A1 (en) | Spatial audio array processing system and method | |
Gong et al. | Parameter selection methods of delay and beamforming for cochlear implant speech enhancement | |
US11205438B1 (en) | Autonomously motile device with acoustic echo cancellation | |
Takahashi et al. | Improvement in listening capability for humanoid robot hrp-2 | |
Itoyama et al. | Assessment of von Mises-Bernoulli Deep Neural Network in Sound Source Localization. | |
Braun et al. | Directional interference suppression using a spatial relative transfer function feature | |
Nishiura et al. | Speech enhancement by multiple beamforming with reflection signal equalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060210 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20061101 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20061107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080811 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080918 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130926 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |