JP2006304124A - 音源方向確定装置および音源方向確定方法 - Google Patents

音源方向確定装置および音源方向確定方法 Download PDF

Info

Publication number
JP2006304124A
JP2006304124A JP2005125924A JP2005125924A JP2006304124A JP 2006304124 A JP2006304124 A JP 2006304124A JP 2005125924 A JP2005125924 A JP 2005125924A JP 2005125924 A JP2005125924 A JP 2005125924A JP 2006304124 A JP2006304124 A JP 2006304124A
Authority
JP
Japan
Prior art keywords
microphone
phase difference
microphone group
sound source
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005125924A
Other languages
English (en)
Inventor
Satoru Ichimura
哲 市村
Takeshi Tomino
剛 冨野
Takahiro Yamada
貴弘 山田
Akifumi Inoue
亮文 井上
Atsushi Matsushita
温 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CUBE Inc V
V Cube Inc
Original Assignee
CUBE Inc V
V Cube Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CUBE Inc V, V Cube Inc filed Critical CUBE Inc V
Priority to JP2005125924A priority Critical patent/JP2006304124A/ja
Publication of JP2006304124A publication Critical patent/JP2006304124A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 全周360°方向での話者方位特定が可能であり、一般的に用いられているパーソナルコンピュータと一般に利用されているサウンドデバイスを利用して実現可能な音声信号の入力方向確定装置およびその方法を提供する。
【解決手段】
一対のマイクロフォン21a、21bからなる第1のマイクロフォン群21の入力信号、および、第1のマイクロフォン群21に交差するように設ける一対のマイクロフォン22a、22bからなる第2のマイクロフォン群22の入力信号、それぞれを受領してそれぞれのマイクロフォン群の入力信号間の位相差を検出し、
第1のマイクロフォン群21の位相差から音源の方向を求めると共に、第2のマイクロフォン群22の位相差から音源の方向を求め、第1のマイクロフォン群21および第2のマイクロフォン群22がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向に決定する。
【選択図】 図1

Description

この発明は、音声信号の入力方向確定装置およびその方法にかかり、詳細には、マイクロフォン等の音圧取得手段に入力された音声信号の方向を判別可能な音源方向確定装置および音源方向確定方法に関する。
音声信号の入力される方向は、音楽鑑賞時のスピーカによる音源再生などには重要な意味を有する。即ち、音楽再生に際し、スピーカから発生させる音は、例えばボーカルの音声であれば、録音時に左右一対のマイクロフォン群に対してボーカルがどの位置にいて録音されたかを確定するが、左右方向のずれは、スピーカからの音を聞いている人間が自身の左右の耳から入ってきた音圧(音の大きさ)を感じ取ってボーカルの音声が聞こえてくる方向を確定している。
このような音源からの音の方向を確定することは一般的にはステレオマイクロフォンを用いて行なわれており、ステレオマイクロフォンそれぞれへの入力信号(音圧)の大きさによって算出することが可能である。
そして、このような音圧を発生する音源の方向を確定することは、例えばテレビ会議システムや会議を撮像して中継する際に、複数の参加者から発言者を自動的に特定するのに都合が良く、発言者を特定して撮像装置の撮像方向を自動的に制御することで、発言者と他者とを区別して表示できる等の効果がある。
ところで、音源の方向を確定するには、最も単純なものとしては、左右一対で構成するマイクロフォン群に入力される音圧の差異を計測し、入力された音圧の差異によって、大きな音圧を示したマイクロフォン側にその大きさの差異に見合った角度を算出して行うことが出来る。この場合には、マイクロフォン群の設置されている位置に対して180°方向の範囲で音源の方向を確定できる。
但し、左右一対のマイクロフォン群による計測では、マイクロフォン群の左右方向を0°から180°とした場合には、第1象限および第2象限内に音源があるか第3象限および第4象限に音源があるかまでは確定不可能であった。また、音源が0°あるいは180°に近付くほど、即ち、マイクロフォン群の設置方向に近付くほど角度変化に対する音源からの音圧の差異が少なく、方向確定の差異の確度を欠くことになった。
また、第1象限から第4象限までの全周をカバー可能なマイクロフォン群による音源の方向の確定には、最低3つのマイクロフォンを用意し、3つからなるマイクロフォン群に入力された同一音源からの音圧を計測し、その音圧の差異から入力される音源の方向を確定する方法が考えられる。あるいは、更に複数のマイクロフォンからなるマイクロフォン源によって、各マイクロフォンに入力される音圧を計測し、同様に音源の方向を確定することでも可能である。そしてマイクロフォン数が多数の方が、音源方向確定の精度が向上する。しかしながら、マイクロフォン数が多くなればなるほど、入力される音圧計測の処理が膨大となり、確定までに多くの時間を費やしてしまうので、テレビ会議等には不向きとなる。
そこで、以下にテレビ会議システムの従来例を説明する。
従来、インターネットを利用して行われるテレビ会議システムでは、インターネットを利用しての画像データおよび音声データの通信であるため、通信速度による制限等から、撮像画像の画質や画像の表示サイズに一拠点当り1人乃至3人程度で利用できるものしかなかった。従って、会議参加者の表情を捉えにくく発言者の特定が困難となり、的確な意思の伝達が行われにくかった。
そこで、発言者を特定して、該発言者の映像を大きく捉える等して、各会議参加者に対して発言者の意思が的確に伝達できるようにしたものがある。
例えば、『テレビ会議システム及びテレビ会議システムに於けるカメラの制御装置並びにカメラの制御方法』(特開2001−339703、以下、従来例1という。)である。
従来例1は、『(請求項1)複数個の集音手段、少なくとも一つの発言者撮像手段、画像表示手段、及び当該集音手段から得られる発言者の音声方向情報に基づいて、当該発言者を撮像する撮像手段の撮像方向を変更する撮像制御手段とから構成されているテレビ会議システムに於いて、当該集音手段により推定された発言者の推定所在位置に向けて当該撮像制御手段が当該撮像手段の撮像方向を指向せしめる様に構成すると共に、当該撮像画像から動き画素を抽出して、その動き画素の分布を求める事によって当該発言者の画像領域上の位置を特定し、当該発言者の位置情報に基づいて、当該発言者が画像領域の所定の部位に表示される様に、当該撮像制御手段を更に制御する様に構成した事を特徴とするテレビ会議システム。』他にかかり、詳細には、図10に表すように複数のマイクロフォン100を用意し、各マイクロフォン100に入力された音声信号を発言者位置検出手段101がそれぞれのマイクロフォン100の信号の位相差から発言者の方向を特定している。
しかしながら、マイクロフォン100の設置数や位相差から発言者方向を特定する手法についての詳細は開示されていない。
そこで、従来例1の中で従来技術として取り上げられている『カメラ撮影制御装置』(特開平7−140527、以下、従来例2という。)を見ると、従来例2は『(請求項1)話者の発音を感知する複数のマイクと、これらのマイク間の音の位相差を検出する位相差検出回路と、位相差検出回路により各マイク間の位相差が零となるように制御されカメラおよび複数のマイク全体の方向を制御するカメラ方向制御装置とを備えたことを特徴とするカメラ撮影制御装置。』他からなる。そして、従来例2では、図11に表すように、マイクロフォン117Aおよびマイクロフォン117Bに対してそれぞれ異なる位置にいる話者Aおよび話者Bの方向を決定する。即ち、位相差検出回路118によって話者Aおよび話者Bからの音声がマイクロフォン117Aあるいはマイクロフォン117Bに到達するのに要する時間の差から生ずる位相差を求めることで行う。例えば話者Aでは、話者Aの発生した音声は、話者Aからの距離がマイクロフォン117Aでは近くマイクロフォン117Bでは遠いので、図12に表すように、マイクロフォン117Aでは図中上図のような波形で検出された音声が、マイクロフォン117Bでは下図のように波形は相似形であるものの到達が遅れるために横軸である時間が上図に比して若干遅れて表れる所謂位相のずれを生ずる。この位相のずれが話者Aの方向を決定する。この場合には、マイクロフォン117Bの方が到達が遅れているため話者Aはマイクロフォン117Bよりマイクロフォン117Aに近いことが判り、しかも位相差の大小からその方向を決定することが出来る。そしてこの位相差検出回路118が算出した結果に基づいてカメラ方向制御装置119がカメラ120の方向を制御する。また、話者Bでは、マイクロフォン117Aおよびマイクロフォン117Bからの距離が同じため、図13に表すように、上図であるマイクロフォン117Aに到達した音声波形および下図であるマイクロフォン117Bに到達した音声波形は共に同じ波形をなすこととなるので、位相差検出回路118ではちょうど中間位置であることを算出し、カメラ方向制御装置119が位相差検出回路118が算出した結果からカメラ120の方向を制御する。
また、従来例2では、図14に表すように、マイクロフォン117Dを設け、話者Bと話者Cとの距離を算出可能とし、話者の距離によってカメラ方向制御装置119がカメラ120を制御可能にしている。即ち、話者Bおよび話者Cの音声は、マイクロフォン117Aおよびマイクロフォン117Bでは同じ波形となって表れるが、マイクロフォン117Dでは話者Bより話者Cの音声の方が早く到達するので、位相差を生ずる。この位相差からカメラ方向制御装置119がその距離を算出可能とする。
しかし発明者は、上記のような3以上のマイクロフォンを用いる場合、一般的に普及しているパーソナルコンピュータを用いて各マイクロフォンから入力された音声を処理するに際しては、該コンピュータが標準的に備えているモノラルマイクロフォン入力およびステレオライン入力を用いて行うと、モノラルマイクロフォン入力とステレオライン入力とからの入力信号はサウンドボード上で合成処理されてしまうので、これら入力を用いて3つのマイクロフォンからの入力を独立処理することができないことを知見した。
更に発明者は、上記知見に基づき、一般的に利用されているパーソナルコンピュータに標準的に備えられているインターフェースで独立して利用可能なユニバーサルシリアルバス(以下、USBと略する)を利用することを思いつき、複数のマイクロフォンからの入力をUSB変換アダプタによって一旦USBの仕様に変換してUSBポートからパーソナルコンピュータへ入力させ処理させた。しかしながら、複数のマイクロフォンから同時に入力した音声信号をパーソナルコンピュータに入力し、位相を実測してみたところ、同時に入力されているにも拘らず、マイクロフォン間で平均780μsecの位相が生じていることを知見した。この誤差は、上記従来例のような位相差の検出によれば、話者の位置認識結果として数度から数十度のずれとして表れてしまい、正確な話者位置の検出が困難であることを知見した。これらの誤差は、パーソナルコンピュータのオペレーションシステムが各USBデバイスからの信号を処理する際に生ずる時間差や個々のUSBデバイスが持つ個体差などによるものと思われる。
特開2001−339703(従来例1) 特開平7−140527(従来例2)
しかしながら、従来例1では各マイクロフォン100が入力した音声信号からの位相差の検出の具体例は明示されておらず、また、従来例2に表すマイクロフォン117A乃至マイクロフォン117Dによる話者の位置特定では、マイクロフォン117Aおよびマイクロフォン117Bの方向をX軸とし、カメラ120と話者Bと方向をY軸とした時に第1象限および第2象限内での方向の決定は可能であるが、例えば話者Aが第1象限に位置しているのか第4象限に位置しているのかの特定が出来ず、従来例2では180°方向の何れに話者が位置しているかは特定できるが360°方向では特定できないという問題点を有した。
従って、円卓を囲んでの会議室等では到底利用できず、利用範囲が限られてしまうという問題点を有した。
また、マイクロフォン117Aおよびマイクロフォン117Bに加えてマイクロフォン117Cおよびマイクロフォン117Dを付加し、方向および距離の算出を行うことが可能であり且つより精度の高い方向の算出が可能となるが、やはり360°全周に亙って方向を決定することが出来ないという問題点を有した。
更にまた、2つのマイクロフォンの延長線上に近い角度、即ち、0°あるいは180°の近辺では、僅かな角度差では入力信号の位相差が小さくなり0°あるいは180°近辺では話者の方向に誤差が生じ、これに比し、90°近辺では角度差が僅かでも位相差が大きいので90°近辺では話者の方位が比較的正確となるので、0°から180°の範囲で均質な方位の確定が出来ないという問題点を有した。
更にまた、前記発明者の知見によれば、これら従来例1および従来例2は一般に利用されているパーソナルコンピュータに標準的に備えられている機能や一般的に入手可能なサウンドデバイスであるサウンドカードなどによって処理する場合の例が記載されておらず、マイクロフォンからの入力信号の処理はそれぞれ専用の変換装置等を利用することとなり、一般的に普及しているパーソナルコンピュータを用いては行えないという問題点を有した。
一方発明者は、パーソナルコンピュータに標準的に装備されているステレオライン入力のそれぞれでは左右それぞれの入力信号の処理に遅延誤差を生じないことを知見した。更に、音声入力をサウンドデバイスと呼ばれるステレオタイプのサウンドカードを用いて位相差の検出を試みた時には、該サウンドカードに入力される左右各マイクロフォンからの音声信号の入力に遅延等の誤差を生じないことを知見した。従って、パーソナルコンピュータに標準的に装備されているステレオライン入力の左右それぞれのチャンネル間、および、サウンドカードの左右それぞれのチャンネル間では、入力される信号処理の遅延誤差を生じないことに注目した。
この発明は、上記問題点に鑑み、全周360°方向での話者方位の特定が可能であると共に、一般的に用いられているパーソナルコンピュータと一般に利用されているサウンドデバイスを利用して実現可能な音声信号の入力方向確定装置およびその方法を提供する。
そこで発明者は、従来例に比し、360°全周方向で話者方位を特定可能とするため、
一対のマイクロフォンからなる第1のマイクロフォン群と、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向に決定する方向決定手段とからなり、
第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置、
を提供する。この音源方向確定装置によれば、第1のマイクロフォン群および第2のマイクロフォン群に音源からの音声信号が入力される。
すると、位相差検出手段では、第1のマイクロフォン群の一対のマイクロフォンに入力された音源からの音声信号入力による位相差を検出すると共に、第2のマイクロフォン群の一対のマイクロフォンに入力された音源からの音声信号入力による位相差を検出する。
検出された位相差は、方向決定手段に入力される。方向決定手段では、第1のマイクロフォン群の位相差から第1のマイクロフォン群に対する音源の方向を決定する。この場合に決定される方向は、第1のマイクロフォン群の方向を軸とした場合、軸の両側に音源の方向が決定される。即ち、音源の方向の候補が該軸の両側に存在する。
同様に、方向決定手段では、第2のマイクロフォン群の位相差から第2のマイクロフォン群に対する音源の方向を決定する。この場合に決定される方向は、第2のマイクロフォン群の方向を軸とした場合、第1のマイクロフォン群同様に、軸の両側に音源の方向が決定される。即ち、音源の方向の候補が該軸の両側に存在する。
方向決定手段では、第1のマイクロフォン群の位相差から求める2方向と、第2のマイクロフォン群の位相差から求める2方向とから、第1のマイクロフォン群および第2のマイクロフォン群の位相差から求めた同一の方向となる方向を音源の方向と決定する。従って、決定された方向に、例えばビデオカメラの位置制御装置によってビデオカメラを回動させれば、発言者が音源であればビデオカメラによって該発言者を撮像することができる。
またこの発明では、音源の方向の確度を良くするため、
一対のマイクロフォンからなる第1のマイクロフォン群と、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、第1のマイクロフォン群の位相差および第2のマイクロフォン群の位相差のうち位相差の小さなマイクロフォン群の位相差によって求まる方向を音源の方向に決定する方向決定手段とからなり、
第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置、
を提供する。従って、この発明によれば、音源からの音声信号が第1のマイクロフォン群および第2のマイクロフォン群に入力される。
すると、位相差検出手段では、第1のマイクロフォン群の一対のマイクロフォンに入力された音源からの音声信号入力による位相差を検出すると共に、第2のマイクロフォン群の一対のマイクロフォンに入力された音源からの音声信号入力による位相差を検出する。
検出された位相差は、方向決定手段に入力される。方向決定手段では、第1のマイクロフォン群の位相差から第1のマイクロフォン群に対する音源の方向を決定する。この場合に決定される方向は、第1のマイクロフォン群の方向を軸とした場合、軸の両側に音源の方向が決定される。即ち、音源の方向の候補が該軸の両側に存在する。
同様に、方向決定手段では、第2のマイクロフォン群の位相差から第2のマイクロフォン群に対する音源の方向を決定する。この場合に決定される方向は、第2のマイクロフォン群の方向を軸とした場合、第1のマイクロフォン群同様に、軸の両側に音源の方向が決定される。即ち、音源の方向の候補が該軸の両側に存在する。
方向決定手段では、第1のマイクロフォン群の位相差から求める2方向と、第2のマイクロフォン群の位相差から求める2方向とから、第1のマイクロフォン群および第2のマイクロフォン群の位相差から求めた同一の方向となる方向を求める。そして、一対のマイクロフォンの設置方向に近いほど、角度変化(音源の方向の変化)に対する位相差の変化が少ないので、言い換えれば、一対のマイクロフォンによる音声信号の位相差が大きいほど方向決定時に誤差が多くなるので、位相差の少なかった方のマイクロフォン群によって求めた方向を音源の方向と決定する。従って、決定された音源の方向は、より確度の高いデータに基づいた音源方向の決定が出来る。
更にこの発明では、音源の方向を決定する際に、更に確度を高くするため、
一対のマイクロフォンからなる第1のマイクロフォン群と、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、位相差が予め定める閾値以内であれば、両マイクロフォン群の位相差を採用して音源の方向を決定し、位相差が予め定める閾値を越えている場合には、位相差が該閾値を越えていない方のマイクロフォン群から求まる方向を音源の方向に決定する方向決定手段とからなり、
第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置、
を提供する。従って、この音源方向確定装置によれば、方向決定手段が音源の方向を確定する際、一対のマイクロフォンによる音声信号の位相差が大きいほど方向決定時に誤差が多くなるので、予め閾値を設け、閾値より位相差の小さな(確度の高い)値は、第1のマイクロフォン群および第2のマイクロフォン群ともに採用して平均をとる等の作業により、決定される音源の方向の確度を高くすることができる。一方、マイクロフォン群の位相差が閾値より大きい(確度の低い)値の場合には、大きな位相差を示すマイクロフォン群の値は、他方のマイクロフォン群によって示される2方向のうちのどちらであるかを決定するために用い、最終的に音源の方向を決定する際には他方のマイクロフォン群の位相差を採用して音源の方向と決定する。従って、決定された音源の方向は、位相差が閾値以内であれば確度が高いので、両データを採用でき、閾値を越える位相差では閾値を越えない方の位相差が示す2つの方向のうちの何れを採用するかを決定するためだけに採用するので、確度のよい位相差によって示される音源の方向に影響を与えず、より確度の高いデータに基づいた音源方向の決定が出来る。
そして、上記各マイクロフォン群はパーソナルコンピュータに標準的に装備されているステレオライン入力あるいは標準的に用いられているステレオタイプのサウンドカードを用いて位相差を求める処理を行うことで、各マイクロフォン群での位相差に誤差を生じずに処理可能である。
更にこの発明では、
一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向に決定することで、音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定方法、
および、
一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、第1のマイクロフォン群の位相差および第2のマイクロフォン群の位相差のうち位相差の小さなマイクロフォン群の位相差によって求まる方向を音源の方向に決定することで、音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定方法、
および、
一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、位相差が予め定める閾値以内であれば、両マイクロフォン群の位相差を採用して音源の方向を決定し、位相差が予め定める閾値を越えている場合には、位相差が該閾値を越えていない方のマイクロフォン群から求まる方向を音源の方向に決定することを特徴とする音源方向確定方法、
を提供する。従って、この方法によれば、先に挙げた各装置同様、第1のマイクロフォン群および第2のマイクロフォン群によって音源の方向を決定できる。
従って、この発明によれば、第2のマイクロフォン群および第2のマイクロフォン群それぞれの位相差をもって音源の方向を360°全周方向で決定出来るので、4本という少ない本数のマイクロフォン数と、一般的にパーソナルコンピュータに標準的に備えられているステレオライン入力、並びに標準的に用いられているステレオタイプのサウンドカードを用いて2つのマイクロフォン群それぞれでの位相差を遅延誤差等無く処理可能であり、特別な装置を用いずとも安価に音源の方向を360°全周方向に亘って決定可能とすることが出来る。
更にこの発明では、第1のマイクロフォン群および第2のマイクロフォン群それぞれの位相差のうち、位相差の少ないマイクロフォン群のデータを採用して音源の方向を決定できるので、位相差の大きなマイクロフォン群、即ち方向決定に際して誤差の大きなマイクロフォン群の位相差は、他方のマイクロフォン群によって求められた2つの方向から音源の方向を決定するためだけに用いるので、決定される音源の方向の誤差を少なくすることが可能となる。
更にこの発明では、第1のマイクロフォン群および第2のマイクロフォン群それぞれの位相差のうち、予め定める閾値によって位相差が音源の方向を決定するに相応しい位相差の場合には両方のマイクロフォン群によって求まる位相差からの方向を平均する等してより確度の高い(正確な)音源の方向の決定が出来る。また、該閾値以下である場合、即ち音源の方向を決定する際に誤差が大きくなってしまう位相差をもったマイクロフォン群の位相差は、他方のマイクロフォン群によって求められた2つの方向から音源の方向を決定するためだけに用いるので、決定される音源の方向の誤差を少なくすることが可能となる。
第1のマイクロフォン群の左右一対のマイクロフォンそれぞれを適宜距離だけ離して設けると共に、第1のマイクロフォン群の左右一対のマイクロフォンそれぞれを第1のマイクロフォン群のそれぞれのマイクロフォンと同距離だけ離し、第1のマイクロフォン群の中心と第2のマイクロフォン群の中心とを一致させ、且つ両マイクロフォン群が直角をなすように設置させ、第1のマイクロフォン群および第2のマイクロフォン群からなるマイクロフォンアレイを設ける。
説明のため、マイクロフォンアレイに設けた第1のマイクロフォン群の左右マイクロフォンの方向をX軸、X軸に直交する第2のマイクロフォン群の左右マイクロフォンの方向をY軸とし、各軸の交点を0としてそれぞれの軸によって表される領域をそれぞれ第1象限から第4象限として説明する。
一方、パーソナルコンピュータには2枚のサウンドカードを設置し、サウンドカードからの出力信号をパーソナルコンピュータの中央演算装置(CPU、以下単にCPUと表す。)で処理可能にさせる。サウンドカードは、マイクロフォンアレイから入力する音声信号をパーソナルコンピュータで処理可能な音声データに変換可能であり、左右一対の入力を持ってそれぞれの入力信号をパーソナルコンピュータのCPUで処理させる。
マイクロフォンアレイからの各マイクロフォンは、第1のマイクロフォン群の左右一対を一方のサウンドカードの左右入力に接続して音声信号を左右一対の音声信号として信号処理させ、第2のマイクロフォン群の左右一対を他のサウンドカードの左右入力に接続して音声信号を左右一対の音声信号として信号処理させる。
パーソナルコンピュータは、サウンドカードによって変換された音声データを受領可能なインターフェースを備えると共に、パーソナルコンピュータが標準的に備えるメモリ、バッファ、CPU、キーボードやマウス等の入出力手段を備え、各手段によってサウンドカードが変換した音声データを信号処理可能である。
パーソナルコンピュータでは、CPU、バッファ、メモリを初めとする各手段が、一方のサウンドカードから入力する第1のマイクロフォン群の音声信号を受領して左右それぞれの音声信号の位相差を算出すると共に他方のサウンドカードから入力する第2のマイクロフォン群の音声信号を受領して左右それぞれの音声信号の位相差を検出する位相差検出手段を構成する。
更に、パーソナルコンピュータでは、CPU、バッファ、メモリを初めとする各手段が、位相差検出手段が検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を検出し、各マイクロフォン群から検出された4つの方向のうち、両マイクロフォン群の同一象限に表れる音源の方向を選択する方向決定手段を構成する。
そして、方向決定手段では、同一象限に表れた第1のマイクロフォン群から検出した音源方向、第2のマイクロフォン群から検出した音源方向のうち、マイクロフォン群の軸方向により遠い方向結果、即ち例えば第2象限に音源の方向が表れた時に第2象限を構成する90°・180°の2軸のうち求められた角度から遠い側の軸を構成しているマイクロフォン群(例えば110°であれば、90°より180°側の軸が遠いので、第1のマイクロフォン群)から求めた方向を音声信号の方向として決定する。そして、該決定は、所定時間内に行った複数のサンプリングの平均値を採用する等する。
以下にこの発明の実施例を、図面に基づき説明する。図1はこの発明の実施例を表す説明図であり、図2は会議室の状態を表す説明図であり、図3はこの発明の実施例の詳細を表す説明図であり、図4は同一波形且つ位相差をもって入力される信号を表す説明図であり(a)は近距離、(b)は遠距離での波形を表し、図5は音源の方向の決定の手法を説明するための説明図であり、図6は位相差を決定するための説明図であり、図7は位相差を説明するための説明図であり、図8は位相差算出の式を表し、図9は位相差の方向を説明する説明図である。
1はこの発明にかかる音源方向確定装置を用いたテレビ会議システムであり、テレビ会議システム1は、マイクロフォンアレイ2と、マイクロフォンアレイからの音量を調整するステレオタイプのマイクロフォンミキサー3と、位相差検出手段および方向検出手段を構成するパーソナルコンピュータ4とからなる。
マイクロフォンアレイ2は、第1のマイクロフォン群21および第2のマイクロフォン群22とからなり、第1のマイクロフォン群21は1対のマイクロフォン21a、22bとから、第2のマイクロフォン群22は1対のマイクロフォン22a、22bとからそれぞれなる。そして、第1のマイクロフォン群21のマイクロフォン22aおよびマイクロフォン21bは所定の間隔をもって設置固定され、第2のマイクロフォン群22のマイクロフォン22aおよびマイクロフォン22bも同様に所定の間隔をもって設置固定される。更に、第1のマイクロフォン群21および第2のマイクロフォン群22はそれぞれのマイクロフォン21a、21bの間隔の中心とマイクロフォン22a、22bの間隔の中心とで交差され、且つ直交するように設置する。従って、図1に表すように、マイクロフォン21aが0°の方向に設置され、マイクロフォン21bが180°の方向に設置され、マイクロフォン22aが90°の方向に設置され、マイクロフォン22bが270°の方向に設置される。
マイクロフォンミキサー3はステレオタイプのマイクロフォンミキサーであり、2チャンネルのマイクロフォン入力を持ち、入力されたそれぞれの音声信号の音量を調整可能であり、更に音量調整した音声信号をそれぞれに出力可能であり、マイクロフォンミキサー3からの出力はパーソナルコンピュータ4に各マイクロフォン21a、21b、22a、22bの音声信号として入力される。従ってマイクロフォンミキサー3は2台設け、一方のマイクロフォンミキサー3には第1のマイクロフォン群21から出力される1対の音声信号が入力され、他方には第2のマイクロフォン群22から出力される1対の音声信号が入力される。尚、この実施例ではマイクロフォンミキサー3はステレオタイプのものを利用したが、4チャンネルあるいはそれ以上のチャンネルを有するもの1台でもよい。
そして、第1のマイクロフォン群21が入力されるマイクロフォンミキサー3では、マイクロフォン21aおよびマイクロフォン21bの音量を揃える調整が行われる。即ち、第1のマイクロフォン群21の中心(第1のマイクロフォン群21および第2のマイクロフォン群22の交点位置)に音源があり音声信号が発生した場合に、マイクロフォン21aおよびマイクロフォン21bの入力音量が同じになるように調整してある。同様に第2のマイクロフォン群22が入力されるマイクロフォンミキサー3でも、マイクロフォン22aおよびマイクロフォン22bの入力音量が同じになるように調整してある。尚、望ましくは、各マイクロフォン21a、21b、22a、22bの各マイクロフォンの入力音が同じになるように調整する。
パーソナルコンピュータ4は、図1に表すような一般的に用いられているコンピュータであり、詳説はしないが、CPUを中心として演算処理するためのメモリやバッファを備えると共に記憶装置であるハードディスクを備え、且つ、ディスプレイ、キーボード、マウス、プリンターなどの入出力装置からなる。そして、図3に表すように、パーソナルコンピュータ4は、サウンドデバイスとしてのサウンドカード41を備える。
サウンドカード41は、左右2チャンネルの音声信号を入力してパーソナルコンピュータ4でデジタル処理可能とするサウンドデバイスであり、第1のマイクロフォン群21および第2のマイクロフォン群22で使用する4本のマイクロフォン21a、21b、22a、22bからの信号を処理するので、2枚のサウンドカード41aおよび41bとから構成する。そして、第1のサウンドカード41aには、第1のマイクロフォン群21のマイクロフォン21aおよびマイクロフォン21bからの音声信号をマイクロフォンミキサー3を介して入力し、第2のサウンドカード41bには、第2のマイクロフォン群22のマイクロフォン22aおよびマイクロフォン22bからの音声信号をマイクロフォンミキサー3を介して入力する。そして、サウンドカード41でアナログ音声信号がデジタル音声信号に変換され、パーソナルコンピュータ4による音声処理が可能になる。
更にパーソナルコンピュータ4には位相差検出手段42を備える。相差検出手段42は、実質的にはパーソナルコンピュータ4に備えるCPU、メモリ、バッファ等により構成する。位相差検出手段42は、入力する2つの音声信号の位相差を検出する手段であり、以下に検出の具体例を説明する。
図4は、音源Sからの距離が、マイクロフォン21aで50cm、マイクロフォン21bで100cmの場合の入力波形を表しており、(a)の波形S1がマイクロフォン21aで音源Sの音声信号を入力した信号を表し、(b)の波形S2がマイクロフォン21bで音源Sの音声信号を入力した信号を表し、横軸が時間を表し、縦軸が音声信号の振幅を表している。図4に表す波形は、音源Sにおいて手を叩いた時の音声信号である。尚、マイクロフォン21a、21bの入力感度は、予めミキサー3によって調整してあり、音源からの距離が同距離の場合には同じ振幅を表すように調整されている。
図4から判るとおり、音源からの距離が遠くなるほどに信号の振幅は減衰してゆく。しかしながらその波形には略相似形を成し、それぞれの波形のピーク点S3も同波形中の同じ位置に存在している。また、ピーク時の存在する箇所は、音源Sから遠いマイクロフォン21bの方がマイクロフォン21aに比べ若干遅れて検出されている。この到達時間の差が位相差である。
そしてこの位相差を求めるに当っては、パターンマッチングによる時間差算出法を採用する。即ち、縦軸を信号の大きさ(振幅)、横軸を1秒間あたりのサンプリング周波数の回数でデジタルデータに変換したサンプル数として表す図6のように、マイクロフォン21aからの入力波形S1は(a)のように現れる。また、マイクロフォン21bからの入力波形S2は(b)のように現れる。そこで、入力波形S1の所定時刻における波形の一つをサンプル数方向(時間軸方向)へずらして比較を重ね、入力波形S2と相似した形状で重なった時の移動サンプル数Nを求めることで、移動サンプル数Nをサンプリング周波数で割ることによって遅延時間に変換する。この遅延時間が位相差として取扱う。
従って、図6に表す例では、移動サンプリング数Nが22でありサンプリング周波数が音楽データなどに採用される44.1kHzであるとすれば、その遅延時間は約0.000499秒として求められる。
この実施例では、マイクロフォン21aとマイクロフォン21bとの入力波形のずれから遅延時間を算出しこれを位相差として取扱うが、位相差は遅延時間によってのみ表されるものではなく、波形を取扱うに際しては遅延している角度差によっても表すことができ、必ずしも時間差によって位相差を表さずに遅延角度等他の計測量を採用して位相差を表してもよい。
そして、上記のような位相差の算出を、第2のマイクロフォン群22のマイクロフォン22aおよびマイクロフォン22bにおいても同様に行う。
このような位相差の算出を位相差検出手段42では、0.05秒毎に行いその都度位相差を求める。従って、第1のマイクロフォン群21および第2のマイクロフォン群22における位相差はそれぞれ0.05秒毎に算出されて出力する。勿論必ずしも0.05秒毎に行う必要はなく、求める位相差の品質によってサンプリング周波数やサンプリングする時間も適宜設定すれば足りる。
尚、図6のようなパターンマッチングによる時間差の算出にあたり、第1のマイクロフォン群21および第2のマイクロフォン群22に入力される音声波形には、会議中に資料である紙をめくる音や、会議室の環境による反響音、会議室や周囲の環境により定在する定在波や暗騒音等、発言者の音声信号の位相差を算出するのに適さない波形も重畳しているため、これらの不要波形を予め取除いて得た波形に基づき上記のような位相差を検出することで、更に位相差の品質向上が図れる。
即ち、発明者は会議室においてマイクロフォン21a等で得られる音声波形を高速フーリエ変換等によって周波数解析を行う等して周波数の特性を考察した結果、90Hz乃至3500Hzが人間の声の周波数として取扱う周波数帯域であることを知見した。そして、このうち低域の周波数帯域では電源ノイズの存在を知見し、更に会議中にめくる紙の発生する紙ノイズは高域の周波数帯域の成分として発生している音を知見したので、位相差を求める際に使用する周波数帯域を300Hz乃至2500Hz程度にすると、良好な位相差の検出が可能であるので、該帯域以外の周波数成分を除去して行う。ただし、これら周波数成分の除去も必ずしも行わなければならないものではなく、低域の周波数帯域のみあるいは高域の周波数帯域のみ等を除去する、あるいは除去を行わない等適宜処理すれば足りる。
更にパーソナルコンピュータ4には方向決定手段43を備える。方向決定手段43は、実質的にはパーソナルコンピュータ4に備えるCPU、メモリ、バッファ等により構成する。方向決定手段43は、位相差検出手段42が検出した第1のマイクロフォン群21および第2のマイクロフォン群22の位相差を入力し、該入力した位相差からマイクロフォンアレイ2に対する音源の方向を検出し決定する手段である。
方向決定手段43が行う方向決定の原理は図7の原理による。
即ち、図7は第1のマイクロフォン群21のマイクロフォン21aおよびマイクロフォン21bに入力される音声信号の方向決定の原理を表しており、マイクロフォン21aおよびマイクロフォン21b間の距離をd、音源からの音波をS0とする。
音源から発生された音波S0は、マイクロフォン21aおよびマイクロフォン21b間の距離に対して第1のマイクロフォン群21から十分に遠い場合には、略同じ角度でマイクロフォン21aおよびマイクロフォン21bへ到達する。この時の到達角度は第1のマイクロフォン群21の方向に垂直な方向に対してθsである。マイクロフォン21aおよびマイクロフォン21bそれぞれからS0に垂直な方向に線分を引くと、第1のマイクロフォン群21の方向である線分dとマイクロフォン21aからS0に垂直に引いた線分との成す角度は角度θsとなるが、このマイクロフォン21aおよびマイクロフォン21bそれぞれからS0に垂直な方向に引いた線分間の距離ξが、マイクロフォン21bに到達するためにマイクロフォン21aより余分に掛る距離、即ち遅延距離となって現れる。
そして遅延距離ξは、『ξ=dsinθs』によって求めることができる。そして音速vは温度条件によって若干の差異はあるものの同一条件下では一定なので、遅延時間をτで表せば遅延時間は遅延距離ξを用いて『τ=ξ/v』なので、『τ=d/sinθs』によって求めることができるので、音源の方向θsは、遅延時間τあるいは遅延距離ξから(距離dと音速vは既知量である。)図8に表す式によって求めることができる。
そこで方向決定手段43では、位相差検出手段42から入力した第1のマイクロフォン群21の位相差である遅延時間によって方向θsを検出する。検出された音源の方向θsのは、図5に表すように、第1のマイクロフォン群21および第2のマイクロフォン群22によって区切られる領域M1乃至領域M4のうち領域M1および領域M2のいずれかの方向θ1である。これは、音源Sが領域M2に存在していたとしても、図8に表す式からは角度のみが決定できることに起因している。
また、方向決定手段43では同様の方向検出作業を第2のマイクロフォン群22においても行うので、第1のマイクロフォン群21同様に第2のマイクロフォン群22の位相差によって検出される音源の方向θsは、方向θ2として検知されるので、図5において領域M2および領域M3のいずれかの方向である。
そこで、方向決定手段43では、第1のマイクロフォン群21の位相差によって検出されたθ1が0°乃至90°、90°乃至180°のいずれであるかと、第2のマイクロフォン群22の位相差によって検出されたθ2が90°乃至180°、180°乃至270°のいずれであるかとにより組合わせ、同一の領域に現れた方向、図5に表す例では領域M2に現れた方向に音源があることを求める。
更に方向決定手段43では、第1のマイクロフォン群21から検出した方向θ1が0°あるいは180°と成す大きさ(第1のマイクロフォン群21の方向と成す角度)と、第2のマイクロフォン群22から検出した方向θ2が90°あるいは270°と成す大きさ(第2のマイクロフォン群22の方向と成す角度)とを比較し、その大きさが大きい方の方向を音源の方向θsと決定する。このように方向決定手段43がθ1あるいはθ2の何れかを採用するように構成するのは、一対のマイクロフォンの設置方向に近いほど、角度変化(音源の方向の変化)に対する位相差の変化が少ないので、言い換えれば、一対のマイクロフォンによる音声信号の位相差が大きいほど方向決定時に誤差が多くなるので、位相差の少なかった方のマイクロフォン群によって求めた方向を音源の方向と決定する方が誤差が少なくなることに起因しており、より誤差の少ない音源の方向θsを検知することが可能となる。
尚、方向決定手段43の音源の方向θsの決定に際しては、それぞれのマイクロフォン群21、22からの角度が45°付近では、それぞれのマイクロフォン群21、22の位相差から算出した方向θ1あるいはθ2はいずれも比較的正確な値となるので、45°付近の例えば30°を閾値として予め定めておき、いずれの検出した方向θ1あるいはθ2も当該マイクロフォン群からの角度が大きい場合には、両方の方向θ1およびθ2の値の平均値を用い、何れかがこの閾値より当該マイクロフォン群の方向に近い場合には(この場合、必ず他方はこの閾値より大きくなるので)、他方の方向を用いるように構成し、音源の方向θsの正確度を向上させるように構成する他の実施例としてもよい。
更にパーソナルコンピュータ4には、ビデオカメラ制御装置5に対して方向決定手段43で決定された音源の方向θsを数値に変換して、ビデオカメラ制御装置5でビデオカメラ6の制御を可能等させる音源方向出力装置44を設ける。
音源方向出力装置44は、音源の方向θsをビデオカメラ制御装置5に制御させる方向指示信号に変換して出力可能である。
更にパーソナルコンピュータ4には、音声出力装置45を備える。音声出力装置45は、サウンドカード41の入力した音声信号を増幅して出力する装置であり、パーソナルコンピュータ4に備えるインターフェース(図示せず)を介してスピーカシステム8と接続され、音声信号を出力してスピーカシステム8から発言者の音声を出力させる。
ビデオカメラ制御装置5は、音源方向出力装置44とパーソナルコンピュータ4に備えるインターフェース(図示せず)を介して接続されビデオカメラによる撮像が可能であると共に、撮像する方向を入力する音源の方向θsに基づいて変更可能である。
従って、ビデオカメラ制御装置5では、音源の方向θsを撮像するので、発言者の映像を撮像可能である。
更にビデオカメラ制御装置5は、撮像した映像信号を映像通信用PC6へ出力可能に接続され、撮像した映像を映像通信用PC6へ出力する。
このビデオカメラ制御装置5は、360°全域に回転させて撮像するための装置としては高価となってしまうので、ビデオカメラ制御装置5を複数のビデオカメラおよび所定角度回動可能な回転制御装置とから構成させ、予めテレビ会議室の撮像範囲を割当てて決めておき、音源方向出力装置44の出力する音源の方向θsによって撮像するカメラ映像を切替えて撮像させるように構成してもよい。また、音源の方向θsによって撮像するカメラを切替える信号を音源方向出力装置44が出力するように構成してもよい。
映像通信用PC6は、インターネット環境と接続可能に構成され、インターネット環境を通じて他所に存在するテレビ会議システムと通信可能であり、ビデオカメラ制御装置5の撮像した映像を該テレビ会議システムに送信可能であると共に、他所のテレビ会議システムから、他所のテレビ会議室を撮像した映像信号を受信可能である。また映像通信用PC6は、テレビ会議システム1に参加している各会議者毎に設置されるディスプレイ装置7と接続され、ディスプレイ装置7に他所の会議の映像およびビデオカメラ制御装置5によって撮像した映像を適宜切替えてあるいは適宜場所に表示させるよう信号出力可能である。
上記実施例では、マイクロフォンアレイ2を第1のマイクロフォン群21および第2のマイクロフォン群22の2対のマイクロフォン群から構成した例を説明したが、マイクロフォン群は必ずしも2対である必要はなく、精度を向上させる目的でその数を増やしても構わない。マイクロフォン群を3対(マイクロフォン数を6)とし、サウンドカードを3枚とした場合には、それぞれのマイクロフォン対の中心を一致させ、かつ、各マイクロフォン対がそれぞれ60度の角度をなすように配置する。そして、3対のマイクロフォン対によって得られた音声入力信号の位相差が、最も小さいマイクロフォン対の位相差を採用するように構成する。
また、上記実施例においては、0.05秒間に入力された音声信号のピーク値に着目した処理を行っているが、この音声信号分割時間は0.05秒に限らず、装置の性能等によっては更に小さく分割した時間あるいは大きく分割した時間を用いても良い。
この発明は、遠隔地相互において行うテレビ会議システムの発言者を撮像させるために利用することができ、発言者の方向を確定することでビデオカメラ等の撮像装置の方向制御を可能とできるので、テレビ会議システムのみにかかわらず、特定の範囲に音源、例えば顧客等その領域利用者、あるいは動物など、音源となる対称が多数存在する時に、該音源の方向が特定可能なので、複数のビデオカメラ装置によってそれぞれの音源を追いかけながら撮像させる場合や、ビデオカメラ装置の回動できる範囲が限られているときに回動できない範囲を撮像可能な他のビデオカメラ装置へスイッチングさせるときの境界範囲決定等に利用でき、音源の方向を360°の範囲で特定する必要があるシステムに対して利用可能である。
この発明の実施例を表す説明図 会議室の状態を表す説明図 この発明の実施例の詳細を表す説明図 同一波形且つ位相差をもって入力される信号を表す説明図であり(a)は近距離、(b)は遠距離での波形を表す 音源の方向の決定の手法を説明するための説明図 位相差を決定するための説明図 位相差を説明するための説明図 位相差算出の式を表す 位相差の方向を説明する説明図 従来例1の構成を表す説明図 従来例2の構成を表す説明図 従来例2の波形が遅延している状態を表す説明図 従来例2の遅延していない状態を表す説明図 従来例2の他の構成を表す説明図
符号の説明
1 テレビ会議システム
2 マイクロフォンアレイ
21 第1のマイクロフォン群
22 第2のマイクロフォン群
3 マイクロフォンミキサー
4 パーソナルコンピュータ
41 サウンドカード
41a 第1のサウンドカード
41b 第2のサウンドカード
42 位相差検出手段
43 方向決定手段
44 音源方向出力装置
45 音声出力装置
5 ビデオカメラ制御装置
6 映像通信用PC
7 ディスプレイ装置

Claims (6)

  1. 一対のマイクロフォンからなる第1のマイクロフォン群と、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
    第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
    位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向に決定する方向決定手段とからなり、
    第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置。
  2. 一対のマイクロフォンからなる第1のマイクロフォン群と、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
    第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
    位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、第1のマイクロフォン群の位相差および第2のマイクロフォン群の位相差のうち位相差の小さなマイクロフォン群の位相差によって求まる方向を音源の方向に決定する方向決定手段とからなり、
    第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置。
  3. 一対のマイクロフォンからなる第1のマイクロフォン群と、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群と、
    第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出すると共に、第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出する位相差検出手段と、
    位相差検出手段から入力した第1のマイクロフォン群の位相差から音源の方向を求めると共に、第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、位相差が予め定める閾値以内であれば、両マイクロフォン群の位相差を採用して音源の方向を決定し、位相差が予め定める閾値を越えている場合には、位相差が該閾値を越えていない方のマイクロフォン群から求まる方向を音源の方向に決定する方向決定手段とからなり、
    第1のマイクロフォン群および第2のマイクロフォン群から検出した位相差によって音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定装置。
  4. 一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向に決定することで、音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定方法。
  5. 一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、第1のマイクロフォン群の位相差および第2のマイクロフォン群の位相差のうち位相差の小さなマイクロフォン群の位相差によって求まる方向を音源の方向に決定することで、音源の方向を360°方向に亙って検出可能なことを特徴とする音源方向確定方法。
  6. 一対のマイクロフォンからなる第1のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    第1のマイクロフォン群に交差するように設ける一対のマイクロフォンからなる第2のマイクロフォン群の入力信号を受領してそれぞれのマイクロフォン入力信号間の位相差を検出し、
    検出した第1のマイクロフォン群の位相差から音源の方向を求めると共に、検出した第2のマイクロフォン群の位相差から音源の方向を求め、第1のマイクロフォン群および第2のマイクロフォン群がそれぞれ示す4つの方向のうち同一方向を示す方向を音源の方向とし、位相差が予め定める閾値以内であれば、両マイクロフォン群の位相差を採用して音源の方向を決定し、位相差が予め定める閾値を越えている場合には、位相差が該閾値を越えていない方のマイクロフォン群から求まる方向を音源の方向に決定することを特徴とする音源方向確定方法。
JP2005125924A 2005-04-25 2005-04-25 音源方向確定装置および音源方向確定方法 Pending JP2006304124A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005125924A JP2006304124A (ja) 2005-04-25 2005-04-25 音源方向確定装置および音源方向確定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005125924A JP2006304124A (ja) 2005-04-25 2005-04-25 音源方向確定装置および音源方向確定方法

Publications (1)

Publication Number Publication Date
JP2006304124A true JP2006304124A (ja) 2006-11-02

Family

ID=37471854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005125924A Pending JP2006304124A (ja) 2005-04-25 2005-04-25 音源方向確定装置および音源方向確定方法

Country Status (1)

Country Link
JP (1) JP2006304124A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO20093605A1 (no) * 2009-12-30 2011-07-01 Tandberg Telecom As Fremgangsmate og system for a bestemme retningen mellom et deteksjonspunkt og en akustisk kilde
WO2012056041A1 (de) * 2010-10-29 2012-05-03 Sennheiser Electronic Gmbh & Co. Kg Mikrofon
US20140267704A1 (en) * 2013-03-14 2014-09-18 Pelco, Inc. System and Method For Audio Source Localization Using Multiple Audio Sensors
WO2017129990A1 (en) * 2016-01-29 2017-08-03 University Of Exeter Estimating animal locations from call interferometry
CN107040843A (zh) * 2017-03-06 2017-08-11 联想(北京)有限公司 通过两个麦克风获取同一个音源的方法及采集设备
CN108063890A (zh) * 2016-11-09 2018-05-22 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
CN113196794A (zh) * 2018-12-21 2021-07-30 索尼集团公司 声响再现装置
CN115881125A (zh) * 2023-01-19 2023-03-31 小米汽车科技有限公司 车载多音区语音交互方法、装置、电子设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57125366A (en) * 1981-01-27 1982-08-04 Chubu Electric Power Co Inc Sound source survey device
JPS59105575A (ja) * 1982-12-08 1984-06-18 Matsushita Electric Ind Co Ltd 音方向検出方式
JPH0792988A (ja) * 1993-09-27 1995-04-07 Matsushita Electric Ind Co Ltd 音声検出装置と映像切り替え装置
JP2001359185A (ja) * 2000-06-13 2001-12-26 Matsushita Electric Ind Co Ltd ハンズフリー装置とその音声信号処理方法
JP2002271885A (ja) * 2001-03-07 2002-09-20 Sony Corp マイクロホン装置
JP2004257877A (ja) * 2003-02-26 2004-09-16 Seiko Epson Corp 音源検出方法、音源検出装置及びロボット
JP2005049153A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 音声方向推定装置及びその方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57125366A (en) * 1981-01-27 1982-08-04 Chubu Electric Power Co Inc Sound source survey device
JPS59105575A (ja) * 1982-12-08 1984-06-18 Matsushita Electric Ind Co Ltd 音方向検出方式
JPH0792988A (ja) * 1993-09-27 1995-04-07 Matsushita Electric Ind Co Ltd 音声検出装置と映像切り替え装置
JP2001359185A (ja) * 2000-06-13 2001-12-26 Matsushita Electric Ind Co Ltd ハンズフリー装置とその音声信号処理方法
JP2002271885A (ja) * 2001-03-07 2002-09-20 Sony Corp マイクロホン装置
JP2004257877A (ja) * 2003-02-26 2004-09-16 Seiko Epson Corp 音源検出方法、音源検出装置及びロボット
JP2005049153A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 音声方向推定装置及びその方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8848030B2 (en) 2009-12-30 2014-09-30 Cisco Technology, Inc. Method and system for determining a direction between a detection point and an acoustic source
WO2011081527A1 (en) * 2009-12-30 2011-07-07 Tandberg Telecom As Method and system for determining the direction between a detection point and an acoustic source
EP2519831A1 (en) * 2009-12-30 2012-11-07 Cisco Systems International Sarl Method and system for determining the direction between a detection point and an acoustic source
CN102834728A (zh) * 2009-12-30 2012-12-19 思科系统国际公司 用于确定检测点和声源之间的方向的方法和系统
EP2519831A4 (en) * 2009-12-30 2013-11-20 Cisco Systems Int Sarl METHOD AND SYSTEM FOR DETERMINING THE DIRECTION BETWEEN A DETECTION POINT AND AN ACOUSTIC SOURCE
NO20093605A1 (no) * 2009-12-30 2011-07-01 Tandberg Telecom As Fremgangsmate og system for a bestemme retningen mellom et deteksjonspunkt og en akustisk kilde
WO2012056041A1 (de) * 2010-10-29 2012-05-03 Sennheiser Electronic Gmbh & Co. Kg Mikrofon
US20140267704A1 (en) * 2013-03-14 2014-09-18 Pelco, Inc. System and Method For Audio Source Localization Using Multiple Audio Sensors
US10750132B2 (en) * 2013-03-14 2020-08-18 Pelco, Inc. System and method for audio source localization using multiple audio sensors
WO2017129990A1 (en) * 2016-01-29 2017-08-03 University Of Exeter Estimating animal locations from call interferometry
CN108063890A (zh) * 2016-11-09 2018-05-22 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
CN107040843A (zh) * 2017-03-06 2017-08-11 联想(北京)有限公司 通过两个麦克风获取同一个音源的方法及采集设备
CN107040843B (zh) * 2017-03-06 2021-05-18 联想(北京)有限公司 通过两个麦克风获取同一个音源的方法及采集设备
CN113196794A (zh) * 2018-12-21 2021-07-30 索尼集团公司 声响再现装置
CN115881125A (zh) * 2023-01-19 2023-03-31 小米汽车科技有限公司 车载多音区语音交互方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
JP2006304124A (ja) 音源方向確定装置および音源方向確定方法
US10206030B2 (en) Microphone array system and microphone array control method
Donley et al. Easycom: An augmented reality dataset to support algorithms for easy communication in noisy environments
US8233352B2 (en) Audio source localization system and method
US6185152B1 (en) Spatial sound steering system
CN111445920B (zh) 一种多声源的语音信号实时分离方法、装置和拾音器
GB2540226A (en) Distributed audio microphone array and locator configuration
CN102045618A (zh) 自动调整的麦克风阵列、方法和携带麦克风阵列的装置
US20110058683A1 (en) Method & apparatus for selecting a microphone in a microphone array
CN110322892B (zh) 一种基于麦克风阵列的语音拾取系统和方法
US9756421B2 (en) Audio refocusing methods and electronic devices utilizing the same
Nakadai et al. Sound source tracking with directivity pattern estimation using a 64 ch microphone array
WO2022062531A1 (zh) 一种多通道音频信号获取方法、装置及系统
RU174044U1 (ru) Аудиовизуальный многоканальный детектор наличия голоса
JP5515728B2 (ja) 端末装置、処理方法および処理プログラム
JP3531084B2 (ja) 指向性マイクロフォン装置
KR101542647B1 (ko) 화자 검출을 이용한 오디오 신호 처리 방법 및 장치
CA2485728C (en) Detecting acoustic echoes using microphone arrays
WO2023056905A1 (zh) 声源定位方法、装置及设备
CN109920442B (zh) 一种麦克风阵列语音增强的方法和系统
JP2011033369A (ja) 会議装置
KR20190016683A (ko) 마이크로폰 어레이를 이용한 회의록 자동작성장치
JP2005049153A (ja) 音声方向推定装置及びその方法
JP6881267B2 (ja) 制御装置、変換装置、制御方法、変換方法、およびプログラム
US20040170289A1 (en) Audio conference system with quality-improving features by compensating sensitivities microphones and the method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101102