JP2009239500A - マイクロホン装置 - Google Patents

マイクロホン装置 Download PDF

Info

Publication number
JP2009239500A
JP2009239500A JP2008081370A JP2008081370A JP2009239500A JP 2009239500 A JP2009239500 A JP 2009239500A JP 2008081370 A JP2008081370 A JP 2008081370A JP 2008081370 A JP2008081370 A JP 2008081370A JP 2009239500 A JP2009239500 A JP 2009239500A
Authority
JP
Japan
Prior art keywords
microphones
sound source
sound
delay
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008081370A
Other languages
English (en)
Inventor
Shoji Onofuji
祥司 尾野藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2008081370A priority Critical patent/JP2009239500A/ja
Publication of JP2009239500A publication Critical patent/JP2009239500A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】マイクロホンと遅延部との間のバッファを削減することができるマイクロホン装置を提供する。
【解決手段】出力信号を生成するために用いる第1マイクロホン10a,10bとは別に、音源方向を判定するための第2マイクロホン14a,14bを設け、第1マイクロホン10a,10bよりも音源Aに近い位置に第2マイクロホン14a,14bを設ける。そして、第1マイクロホン10a,10bに音源Aからの音が到達する前に、音源の方向を判定し、この判定結果に基づいて、遅延部12a,12bの遅延時間を設定する。
【選択図】図1

Description

本発明は、マイクロホン装置に関する。さらに詳細には、音源に対する感度を高めた遅延和アレー型のマイクロホン装置に関する。
従来より、人の発する音をマイクロホンで集音して発話内容を認識する音声認識装置や、マイクロホンとスピーカにより拡声通話形態で遠隔地間での会話を可能とする遠隔会議装置などが広く知られている。
このように音声を処理する装置においては、集音器であるマイクロホンが発話者から離れた位置にあるときでも、発話者の音声を高品質で受音することが望ましい。
そこで、発話者から離れた位置にあるマイクロホンでも発話者の音声を高音質に受音する技術として、遅延和アレーがある(例えば、特許文献1参照)。この技術は、音源から発せられる音を複数のマイクロホンのそれぞれで集音し、これらのマイクロホンで各々得られた音響信号を、音源の方向に基づいた遅延量で遅延させて同位相化し加算することで、音源の方向から到達する音を強調し、音源に対する感度を高めるものである。
図6に従来の遅延和アレー型のマイクロホン装置の概略構成を示す。同図に示すように、従来のマイクロホン装置100は、マイクロホン101a,101bと、アナログデジタル変換器(A/D)102a,102bと、FIFO(First In First Out)103a,103bと、バッファ(BUF)104a,104bと、遅延部105a,105bと、加算部106と、音源方向判定部110と、遅延時間設定部111とを有している。また、音源方向判定部110には、メモリ(MEM)120a,120bと、判定手段121とが設けられる。なお、以下においては、マイクロホン101a,101bのうちの任意の一つをマイクロホン101とし、遅延部105a,105bのうち任意の一つを遅延部105とする。
音源Aから発せられる音は複数のマイクロホン101a,101bで集音され、このマイクロホン101a,101bでそれぞれ集音レベルに応じた電気的なアナログ信号(以下、「アナログ音響信号」とする。)に変換される。各アナログ音響信号はアナログデジタル変換器102a,102bでそれぞれデジタル信号(以下、「デジタル音響信号」とする。)に変換され、FIFO103a、103bを介して、バッファ104a,104bと音源方向判定部110のメモリ120a,120bとに入力される。
音源方向判定部110の判定手段121は、メモリ120a,120bに蓄積されたデジタル音響信号の情報に基づいて複数のマイクロホン101a,101bから出力される各アナログ音響信号の位相差(時間ずれ)を検出し、当該位相差から音源Aの方向(音源Aのマイクロホン101a,101bに対する方向)を判定する。なお、メモリ120a,120bには、判定手段121によりアナログ音響信号の位相差を検出するために必要な数だけデジタル音響信号の情報を記憶する記憶容量を有している。
遅延時間設定部111は、音源方向判定部110によって判定された音源Aの方向に基づいて、複数の遅延部105a,105bの各々の遅延時間を決定し、当該決定した遅延時間を複数の遅延部105a,105bに設定する。これにより、音源Aから発せられる音がマイクロホン101aとマイクロホン101bとに到達するまでの時間差分だけの遅延処理が行われる。すなわち、音の到達時間が早いマイクロホン101に対応するデジタル音響信号がその時間差分だけ遅延部105により遅延される。その結果、各マイクロホン101a,101bに対応するデジタル音響信号が同位相化される。
そして、遅延部105a,105bを介して同位相化されたデジタル音響信号を加算部106により加算することで、音源Aの方向から到達する音を強調した強調信号を出力するようにしている。
特開2001−313992号公報
しかしながら、上記従来の遅延和アレー型のマイクロホン装置100においては、音源方向判定部110による音源方向判定処理に時間を要し、その時間分だけデジタル音響信号の情報をバッファ104a,104bに蓄積させていた。
これは、音源Aの方向が変動した場合でも感度を低減させないために、音源方向判定部110で判定するために使用した音響信号と同等のタイミングでマイクロホン101により得られた音響信号を用いているからである。
しかし、バッファ104a,104bとして大きな記憶容量が必要であり、小型化やコスト面での課題があった。
そこで、本発明は、マイクロホンと遅延部との間のバッファを削減することができる遅延和アレー型のマイクロホン装置及びそれを備えた音声認識装置を提供することを目的とする。
上記目的を達成するために、請求項1に記載の発明は、音源から発せられる音を集音する複数の第1マイクロホンと、前記複数の第1マイクロホンから出力される音響信号を各々独立な遅延時間で遅延可能な複数の遅延部と、前記複数の遅延部から出力される各遅延信号を加算して出力する加算部と、前記複数の第1マイクロホンよりも前記音源に近い位置に配置され、前記音源から発せられる音を集音する複数の第2マイクロホンと、前記複数の第2マイクロホンで各々得られた音響信号に基づいて、前記音源の方向を判定する音源方向判定部と、前記音源方向判定部によって判定された前記音源の方向に基づいて、前記複数の遅延部の各々の遅延時間を決定し、当該決定した遅延時間を前記複数の遅延部に設定する遅延時間設定部とを備えたマイクロホン装置を提供するものである。
請求項2に記載の発明は、請求項1に記載の発明において、前記複数の第1マイクロホンは第1直線上に、前記複数の第2マイクロホンは第2直線上にそれぞれ配置され、前記第1直線と前記第2直線とが平行となる関係であることを特徴とする。
請求項3に記載の発明は、請求項1又は請求項2に記載の発明において、前記複数の第1マイクロホンは、2つのマイクロホンで構成され、前記複数の第2マイクロホンは、2つのマイクロホンで構成されたことを特徴とする。
請求項4に記載の発明は、請求項3に記載の発明において、前記第2マイクロホン同士の間隔を、前記第1マイクロホン同士の間隔よりも大きくしたことを特徴とする。
請求項5に記載の発明は、請求項1〜4のいずれか1項に記載のマイクロホン装置と、前記マイクロホン装置からの出力信号に基づいて音声認識を行う音声認識部と、を備えた音声認識装置とした。
請求項1に記載の発明によれば、マイクロホンと遅延部との間のバッファを削減することができる遅延和アレー型のマイクロホン装置を提供することができる。
また、請求項2に記載の発明によれば、第2マイクロホン同士を結ぶ直線と、第1マイクロホン同士を結ぶ直線とが平行である関係であるため、複数の第1マイクロホンに対する音源方向と、複数の第2マイクロホンに対する音源方向とが同じになり、遅延時間の換算が容易になる。
また、請求項3に記載の発明によれば、第1マイクロホン及び第2マイクロホンの数をそれぞれ2つとしたため、簡単な構成で音源への感度を高めることができる。
また、請求項4に記載の発明によれば、第2マイクロホン同士の間隔を、第1マイクロホン同士の間隔よりも大きくしたので、指向性を広くすることができる。
請求項5に記載の発明によれば、マイクロホンと遅延部との間のバッファを削減することができる遅延和アレー型のマイクロホン装置を備えた音声認識装置を提供することができる。
以下、本発明にかかるマイクロホン装置及びそれを備えた音声認識装置の一実施形態について説明する。
[1.マイクロホン装置の概要]
本実施形態におけるマイクロホン装置は、音源から発せられる音を集音する複数の第1マイクロホンと、これらの第1マイクロホンから出力される音響信号を各々独立な遅延時間で遅延可能な複数の遅延部と、これらの遅延部から出力される各遅延信号を加算して出力する加算部とを備えている。
また、音源の方向に基づいて、複数の遅延部の各々の遅延時間を決定し、当該決定した遅延時間を複数の遅延部に設定する遅延時間設定部を備えている。遅延時間設定部で設定する遅延時間は、音源Aから発せられる音が各マイクロホンに到達する時間のずれ分(以下、「時間ずれ」とする。)に基づいて設定される。例えば、第1マイクロホンとして、2つのマイクロホンがあるとき、これらのマイクロホンの間で音源から到達する音の時間ずれΔtaがあると、音源からの音の到達が早いマイクロホンの音響信号が入力される遅延部にΔtaが設定される。その結果、これらのマイクロホンから出力されるアナログ音響信号に対応するデジタル音響信号が同位相化され、遅延部から出力される。そして、加算部によってこのように同位相化されたデジタル音響信号が加算されて、音源が発する音が強調された信号(以下、「強調信号」とする。)が出力される。
しかも、本実施形態におけるマイクロホン装置では、複数の第1マイクロホンよりも音源に近い位置に配置され、音源から発せられる音を集音する複数の第2マイクロホンと、複数の第2マイクロホンで各々得られた音響信号に基づいて、音源の方向を判定する音源方向判定部とを備えている。
従って、複数の第1マイクロホンに音源から発せられた特定の音(以下、「音B」とする。)が到達する前に、複数の第2マイクロホンで音源からの音Bが集音される。このように集音した音Bに基づいて、音源方向判定部により、音Bを発したタイミングの音源の方向が判定される。
その結果、複数の第1マイクロホンに音源からの音Bが到達する前に、音Bを発したタイミングの音源の方向を判定することが可能となり、発話者の音声を強調して出力しつつも、第1マイクロホンと遅延部との間のバッファを削減することができる。
なお、第1マイクロホンと第2マイクロホンとの間隔を十分離して配置できないときや音源の方向によっては、第2マイクロホンで集音した音Bに基づいて音源の方向を特定した時に、第1マイクロホンでは音Bの次に音源から発せられた音(以下、「音C」とする。)が既に集音されていることも考えられる。このときは、音Bを発したタイミングの音源の方向に基づいて、音Cの強調信号が出力されることになる。しかしながら、第1マイクロホンと第2マイクロホンとを一直線上に並べて同様の処理をした時よりも、第1マイクロホンで集音した音を発した音源への方向に近い方向で、強調信号を出力することができる。
このマイクロホン装置は、音声認識装置やテレビ会議装置などの各種の音声処理装置で利用することができる。
[2.マイクロホン装置の具体例]
次に、本実施形態におけるマイクロホン装置の具体例を図面を参照して説明する。図1は本実施形態におけるマイクロホン装置の構成図、図2は音源に対する第1マイクロホン及び第2マイクロホンの位置関係を示す図、図3は音源に対する最大検出範囲を説明するための図、図4は音源方向と第1マイクロホン及び第2マイクロホンの位置関係を示す図である。
図1に示すように、本実施形態のマイクロホン装置1は、第1マイクロホン10a,10bと、アナログ/デジタル変換器(A/D)11a,11bと、遅延部12a,12bと、加算器13とを備えている。
第1マイクロホン10a,10bは、音源Aから発せられる音を集音して電気的なアナログ信号(以下、「アナログ音響信号」とする。)S1a,S1bに変換して出力するものであり、これらの第1マイクロホン10a,10bは、所定間隔を有して配置される。
各第1マイクロホン10a,10bから出力されるアナログ音響信号S1a,S1bは、アナログ/デジタル変換器11a,11bによりデジタル信号(以下、「デジタル音響信号」とする。)S2a,S2bに変換されて出力される。
ここで、マイクロホン装置1では、音源Aの発する音として発話者の音声を対象としており、アナログ/デジタル変換器11a,11bは、例えば、44.1kHzでアナログ音響信号S1a,S1bをサンプリングして、デジタル音響信号S2a,S2bを生成する。
このように生成されたデジタル音響信号S2a,S2bは、それぞれ遅延部12a,12bへ入力される。遅延部12a,12bは、それぞれ独立な遅延時間で遅延可能な遅延部であり、リングバッファなどから構成される。遅延部12a,12bは、設定された遅延時間だけデジタル音響信号S2a,S2bを遅延させた信号(以下、「遅延信号」とする。)S3a,S3bを出力する。
例えば、音源Aの発する音が一方の第1マイクロホン10aに到達してからΔta経過して他方の第1マイクロホン10bに到達するとき、遅延部12aに遅延時間Δtaが設定され、遅延部12aに遅延時間0が設定される。このような遅延時間が遅延部12a,12bに設定されたとき、デジタル音響信号S2aは遅延部12aにより遅延時間Δtaだけ遅延されて遅延信号S3aとして出力され、デジタル音響信号S2bは遅延部12bにより遅延なしで遅延信号S3bとして出力される。
従って、音源Aの発する音が第1マイクロホン10a,10bに到達する時間がずれたときに、遅延部12a,12bによって、その時間ずれが調整され、位相差のあるデジタル音響信号S2a,S2bが同位相化されて遅延信号S3a,S3bとして出力される。
そして、これらの遅延信号S3a、S3bは、加算器13に入力されて加算されて出力される。上述のように遅延信号S3a、S3bは音源Aの発する音に対して同位相化されて位相ずれがないことから、これらの遅延信号S3a、S3bを加算することにより、音源Aの発する音が強調された信号(以下、「強調信号」とする。)S4が生成される。
ここで、本実施形態のマイクロホン装置1は、遅延部12a,12bへの遅延時間の設定を行うために、第2マイクロホン14a,14bと、アナログ/デジタル変換器(A/D)15a,15bと、FIFO(First In First Out)16a,16bと、音源方向判定部17と、遅延時間設定部18とを有している。
上述した従来のマイクロホン装置100では、強調信号を生成するために音源からの音を集音するマイクロホンと音源方向を判定するために音源からの音を集音するマイクロホンとを同一のマイクロホン101a,101bとしていたが、本実施形態のマイクロホン装置1ではそれぞれ別個のマイクロホンを用いることとしている。
すなわち、強調信号S4を生成するために音源Aからの音を集音する第1マイクロホン10a,10bとは別に、音源方向θを判定するために音源Aからの音を集音する第2マイクロホン14a,14bを設けている。
図2は音源Aに対する第1マイクロホン10a,10b及び第2マイクロホン14a,14bの位置関係を示す図である。同図に示すように、第2マイクロホン14a,14bは、音源Aの発する音が第1マイクロホン10a,10bよりも早く到達するように、第1マイクロホン10a,10bよりも音源Aに近い位置に配置される。
従って、第1マイクロホン10a,10bに音源Aからの音が到達する前(図2に示す例では、音源Aからの音の波面位置a3に到達する前)に、複数の第2マイクロホン14a,14bで音源Aからの音の波面位置a1,a2でそれぞれ集音される。このように集音した音の第2マイクロホン14a,14b間の時間ずれ(音源Aからの音が波面位置a1から波面位置a2へ到達する時間)が音源方向判定部17により検出され、これにより音源方向θが判定される。
その結果、複数の第1マイクロホン10a,10bに音源Aからの音が到達する前に、音源Aの方向を判定することが可能となり、第1マイクロホン10a,10bと遅延部12a,12bとの間のバッファを削減することができる。
ここで、第2マイクロホン14a,14b同士を結ぶ直線と、第1マイクロホン10a,10b同士を結ぶ直線とが平行である関係とし、第2マイクロホン14a,14b同士の間隔を、第1マイクロホン10a,10b同士の間隔よりも大きくしたとする。このとき、図3に示すように、第2マイクロホン14aと第1マイクロホン10bとを結ぶ線と第2マイクロホン14a,14b同士を結ぶ線とがなす角をαとすると、第1マイクロホン10a,10bよりも早く第2マイクロホン14a,14bに到達する音源方向の最大範囲はπ−2αとなる。
このように第1マイクロホン10a,10b及び第2マイクロホン14a,14bを配置することで、第1マイクロホン10a,10bに音源Aからの音が到達する前に、複数の第2マイクロホン14a,14bで音源Aからの音を集音することができる。
ここで、第2マイクロホン14a,14bは、互いに所定間隔を有して配置され、音源Aから発せられる音を集音してアナログ音響信号S5a,S5bに変換して出力する。そして、各第2マイクロホン14a,14bから出力されるアナログ音響信号S5a,S5bは、アナログ/デジタル変換器15a,15bによりデジタル音響信号S6a,S6bに変換されて出力される。
このように生成されたデジタル音響信号S6a,S6bは、FIFO16a、16bを介して、順次音源方向判定部17にデジタル音響信号S7a,S7bとして入力される。なお、このFIFO16a,16bは、アナログ/デジタル変換器15a,15bと音源方向判定部17の動作タイミングの相違を調整するために設けられるものである。
音源方向判定部17は、メモリ(MEM)20a,20b及び判定手段21を有し、音源方向θを判定する。
メモリ20a,20bには、アナログ/デジタル変換器15a,15bから出力されるデジタル音響信号のうち最新のデジタル音響信号の信号レベルの情報を所定数N(例えば、256個とする)以上記憶しており、アナログ/デジタル変換器15a,15bから出力されるデジタル音響信号をFIFO16a,16bを介して順次記憶する。
第2マイクロホン14a,14b同士の間隔及び音速は既知であり、音源方向判定部17の判定手段21は、これらの情報とデジタル音響信号S7a,S7bとに基づいて音源方向θを判定している。
以下、音源方向判定部17の判定手段21による音源方向θの判定処理について、具体的に説明する。
第2マイクロホン14a側のデジタル音響信号S7aの信号レベルをX1(i)、第2マイクロホン14b側のデジタル音響信号S7bの信号レベルをX2(i)とすると、音源Aからの音に対する2つの第2マイクロホン14a,14bによる集音の時間ずれτは以下の式(1),(2)から導き出すことができる。なお、0≦j≦N−1(jは整数)、0≦i≦N−1(iは整数)であり、最新のデジタル音響信号をi=0,j=0とし、メモリ20a,20bに記憶したN個のデジタル音響信号のうち最も古いデジタル音響信号をi=N−1,j=N−1とする。
判定手段21は、まず、上記式(1)による演算を行う。すなわち、判定手段21は、メモリ20aから所定のX1(i)を取り出し、また、メモリ20bからX2(0)〜X2(N−1)を取り出す。そして、判定手段21は、所定のX1(i)に対して、X2(0)〜X2(N−1)をそれぞれ積算した値の和を演算する。判定手段21は、この処理を、メモリ20aに記憶したX1(0)〜X1(N−1)のすべてについて行う。
次に、判定手段21は、式(2)に示すように、RX1X2(0)〜RX1X2(N−1)までのうち、最も値が大きいもの(以下、「最大値RX1X2(γ)」とする)を判定する。
ここで、アナログ/デジタル変換器15a,15bのサンプリング周波数を44.1kHzとすると、1サンプリング当たり22.676μsとなる。一方で、上記判定したγは、時間ずれをサンプリング数で表したものとなる。そこで、音源方向判定部17の判定手段21は、下記式(3)の演算を行うことで、時間ずれτを検出している。
次に、判定手段21は、音源Aに対する第2マイクロホン14a,14b間の位置ずれD(図4参照)を演算する。音速をcと規定すると、位置ずれDは、下記式(4)に示すように、時間ずれτに音速cを積算したものとなり、判定手段21は、この式(4)に基づいた演算を行う。
次に、判定手段21は、音源方向θを判定する。音源方向θ、位置ずれD、第2マイクロホン14a,14b間の距離L0の関係は、下記式(5)に示す関係であり判定手段21は、この式(5)に基づいた演算を行う。
このように判定手段21では、第2マイクロホン14a,14bの出力に基づいて音源方向θを判定するようにしており、この音源方向θの情報は、遅延時間設定部18へ通知される。
遅延時間設定部18は、遅延量テーブルが設定されており、音源方向判定部17から通知される音源方向θの情報に基づいて、遅延部12a,12bへの遅延時間を決定する。この遅延量テーブルは、音源方向θのそれぞれの値に対して、遅延部12a,12bへの遅延時間がそれぞれ関係づけられたテーブルであり、下記式(6)〜(8)に基づいて、演算される位置ずれDiffに基づいた遅延時間が設定される。なお、この位置ずれDiffは、図4に示すように、音源Aに対する第1マイクロホン10a,10b間の位置ずれである。
ここで、第1マイクロホン10a,10b同士を結ぶ線と第2マイクロホン14a,14b同士を結ぶ線とが平行であり、音源方向θが+30°、距離L1が10cmのとき、距離Diffは5cmとなる。また、アナログ/デジタル変換器11a,11bのサンプリング周波数が44.1kHzであり、音速を340m/sとすると、1サンプリング期間は22.676μsとなり、1サンプリング期間での音源Aからの音の進行距離は、7.710mmとなる。従って、遅延時間としては、5/0.771=6.4サンプリング時間となる。
このとき、遅延時間設定部18は、音源Aからの音が早く到達する第1マイクロホン10a側のデジタル音響信号S2aを遅延させる遅延部12aに遅延時間として6.4サンプリング時間を設定する。一方、第1マイクロホン10b側のデジタル音響信号S2bを遅延させる遅延部12bの遅延時間として0サンプリング時間を設定する。
そして、各遅延部12a,12bはこのように設定された遅延時間に応じてデジタル音響信号S2a,S2bを遅延させて、遅延信号S3a,S3bとして加算部106に出力する。この遅延信号S3a,S3bは音源Aの発する音に対して同位相化されて互いに位相が一致した信号であり、加算部106により、これらの遅延信号S3a、S3が加算され、音源Aからの音が強調された強調信号S4が生成される。
ところで、複数の第1マイクロホン10a,10bは第1直線上に、複数の第2マイクロホン14a,14bは第2直線上にそれぞれ配置され、この第1直線と第2直線とが平行となる関係であることが望ましい。例えば、図4に示すように、第2マイクロホン14a,14b同士を結ぶ直線と、第1マイクロホン10a,10b同士を結ぶ直線とが平行である関係とする。このようにすることで、複数の第1マイクロホン10a,10bに対する音源方向θと、複数の第2マイクロホン14a,14bに対する音源方向θとが同じになるので、遅延時間の換算が容易になる。
また、第2マイクロホン14a,14b同士の間隔を、第1マイクロホン10a,10b同士の間隔よりも大きくすることが望ましい。第1マイクロホン10a,10b同士の間隔よりも第2マイクロホン14a,14b同士の間隔が狭いときには、指向性が狭くなってしまうからである。
広い指向性が必要な場合、第2マイクロホン14a,14b同士の間隔を第1マイクロホン10a,10b同士の間隔よりも大きくし、さらに、第1マイクロホン10a,10b同士がなす線と第2マイクロホン14a,14b同士がなす線との間隔を大きくする。
また、上述においては、第1マイクロホン及び第2マイクロホンの数をそれぞれ2つとしたため、簡単な構成で音源Aへの感度を高めたマイクロホン装置を製造することができる。
ここで、第2マイクロホン14a,14b同士を結ぶ直線と、第1マイクロホン10a,10b同士を結ぶ直線とが平行である関係とし、第2マイクロホン14a,14b同士の間隔を、第1マイクロホン10a,10b同士の間隔よりも大きくしたとする。このとき、図3に示すように、第2マイクロホン14aと第1マイクロホン10bとを結ぶ線と第2マイクロホン14a,14b同士を結ぶ線とがなす角をαとし、第2マイクロホン14aと第1マイクロホン10aとを結ぶ線と第2マイクロホン14a,14b同士を結ぶ線とがなす角をβとしたとき、音源方向θ、角α及び角βは、以下の式(9),(10)で規定される。従って、第1マイクロホン10a,10bよりも早く第2マイクロホン14a,14bに到達するように、音源方向θを調整するためには、下記式(9),(10)を満たすように角α及び角βを変更することになる。
なお、第1マイクロホン10a,10bの数を2つとしたが、さらに多数のマイクロホンであってもよい。第1マイクロホンを多数設けることで多数の音響信号が加算され、音源方向θからの音がより強調された強調信号を出力することができるからである。また、第2マイクロホン14a,14bも同様に2つではなく、多数のマイクロホンであってもよい。それにより、平面の波面だけではなく、立体の波面に対しても対応することができる。
上述したように本実施形態におけるマイクロホン装置1では、強調信号を出力するために用いる複数の第1マイクロホンよりも音源に近い位置に複数の第2マイクロホンを設け、この第2マイクロホンで得られた音響信号に基づいて音源の方向を判定するようにしている。従って、複数の第1マイクロホンに音源からの音が到達する前に、音源の方向を判定することが可能となり、第1マイクロホンと遅延部との間のバッファを削減することができる。
[3.マイクロホン装置を適用した装置の例]
上述のマイクロホン装置1を適用した装置として、音声認識装置を備えた音声対話装置を例にとり図面を参照して説明する。図5は、音声認識装置を備えた音声対話装置の構成図である。この音声対話装置は、音声により利用者と対話を行うことにより、利用者が要求する情報やサービスを提供する装置である。
図5に示すように、音声対話装置30は、制御部41、記憶部42、デコーダ部43、画像処理部44、表示装置45、音声処理部46、スピーカ47、入力I/F(インターフェイス)部48と、入力操作器49、音声認識装置50とを有している。なお、制御部41、記憶部42、デコーダ部43、入力I/F部48及び音声認識装置50は、システムバス51を介して相互に接続されている。
制御部41は、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)から構成され、音声対話装置30全体を制御する。
記憶部42は、ハードディスク装置などによって構成され、利用者と対話するための対話シナリオなどを記憶する。
デコーダ部43は、記憶部42に記憶した対話シナリオに基づいた画像データや音声データをデコードする。このデコーダ部43によってデコードされた画像データは、画像処理部44により表示装置45で表示可能な情報に変換処理され、表示装置45に表示される。また、デコーダ部43によってデコードされた音声データは、スピーカ47で音波として出力可能な情報に音声処理部46により変換処理され、スピーカ47から出力される。
入力I/F部48は、入力操作器49へのユーザの操作を検出して、制御部41へ通知する。制御部41は、この入力操作に応じた処理を行う。
音声認識装置50は、利用者の発する音声を認識するための装置であり、マイクロホン装置60とマイクロホン装置60からの出力信号に基づいて音声認識を行う音声認識部61が設けられている。この音声認識装置50は、制御部41によってその稼動が制御される。そして、稼動状態の音声認識装置50によって認識した利用者の発話内容を認識して文字情報として制御部41へ通知する。
音声認識装置50に用いるマイクロホン装置60として、上述したマイクロホン装置1を適用することにより、利用者が発する音声に応じた信号であって、音源Aの方向が変動した場合に感度の低減を抑制した信号を音声認識部61に入力することができる。従って、利用者の発する音声を認識する割合を高くすることができ、高認識率の音声認識装置が実現できる。
この音声対話装置30は、制御部41によって記憶部42に記憶した対話シナリオに基づいた情報を表示装置45やスピーカ47から利用者に提示し、このよう提示された情報に対して利用者が発する音声を音声認識装置50で認識し、この認識した情報と対話シナリオとに基づいて、制御部41が次に提示する情報を決定するものであり、最終的に利用者が要求する情報やサービスを提供する。
以上、本発明の実施の形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
本発明の一実施形態におけるマイクロホン装置の構成図を示す図である。 音源に対する第1マイクロホン及び第2マイクロホンの位置関係を示す図である。 音源に対する最大検出範囲を説明するための図である。 音源方向と第1マイクロホン及び第2マイクロホンの位置関係を示す図である。 図1のマイクロホン装置を有する音声認識装置を備えた音声対話装置の構成図である。 従来の遅延和アレー型のマイクロホン装置の概略構成である。
符号の説明
1,60 マイクロホン装置
10a,10b 第1マイクロホン
11a,11b,15a,15b デジタル/アナログ変換器(A/D)
12a,12b 遅延部
13 加算部
14a,14b 第2マイクロホン
16a,16b FIFO
17 音源方向判定部
18 遅延時間設定部
20a,21b メモリ
21 判定手段
30 音声対話装置
50 音声認識装置
61 音声認識部

Claims (5)

  1. 音源から発せられる音を集音する複数の第1マイクロホンと、
    前記複数の第1マイクロホンから出力される音響信号を各々独立な遅延時間で遅延可能な複数の遅延部と、
    前記複数の遅延部から出力される各遅延信号を加算して出力する加算部と、
    前記複数の第1マイクロホンよりも前記音源に近い位置に配置され、前記音源から発せられる音を集音する複数の第2マイクロホンと、
    前記複数の第2マイクロホンで各々得られた音響信号に基づいて、前記音源の方向を判定する音源方向判定部と、
    前記音源方向判定部によって判定された前記音源の方向に基づいて、前記複数の遅延部の各々の遅延時間を決定し、当該決定した遅延時間を前記複数の遅延部に設定する遅延時間設定部と、を備えたマイクロホン装置。
  2. 前記複数の第1マイクロホンは第1直線上に、前記複数の第2マイクロホンは第2直線上にそれぞれ配置され、前記第1直線と前記第2直線とが平行となる関係であることを特徴とする請求項1に記載のマイクロホン装置。
  3. 前記複数の第1マイクロホンは、2つのマイクロホンで構成され、
    前記複数の第2マイクロホンは、2つのマイクロホンで構成されたことを特徴とする請求項1又は請求項2に記載のマイクロホン装置。
  4. 前記第2マイクロホン同士の間隔を、前記第1マイクロホン同士の間隔よりも大きくしたことを特徴とする請求項3に記載のマイクロホン装置。
  5. 請求項1〜4のいずれか1項に記載のマイクロホン装置と、前記マイクロホン装置からの出力信号に基づいて音声認識を行う音声認識部と、を備えた音声認識装置。
JP2008081370A 2008-03-26 2008-03-26 マイクロホン装置 Pending JP2009239500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008081370A JP2009239500A (ja) 2008-03-26 2008-03-26 マイクロホン装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008081370A JP2009239500A (ja) 2008-03-26 2008-03-26 マイクロホン装置

Publications (1)

Publication Number Publication Date
JP2009239500A true JP2009239500A (ja) 2009-10-15

Family

ID=41252951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008081370A Pending JP2009239500A (ja) 2008-03-26 2008-03-26 マイクロホン装置

Country Status (1)

Country Link
JP (1) JP2009239500A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017056781A1 (ja) * 2015-09-30 2017-04-06 ソニー株式会社 信号処理装置、信号処理方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017056781A1 (ja) * 2015-09-30 2017-04-06 ソニー株式会社 信号処理装置、信号処理方法、及びプログラム
CN108028980A (zh) * 2015-09-30 2018-05-11 索尼公司 信号处理装置、信号处理方法及程序
JPWO2017056781A1 (ja) * 2015-09-30 2018-07-19 ソニー株式会社 信号処理装置、信号処理方法、及びプログラム
US10440475B2 (en) 2015-09-30 2019-10-08 Sony Corporation Signal processing device, signal processing method, and program

Similar Documents

Publication Publication Date Title
US9269367B2 (en) Processing audio signals during a communication event
US7158645B2 (en) Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same
JP5857674B2 (ja) 画像処理装置、及び画像処理システム
EP3002753B1 (en) Speech enhancement method and apparatus for same
US20120109632A1 (en) Portable electronic device
US9437188B1 (en) Buffered reprocessing for multi-microphone automatic speech recognition assist
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
JP2016146547A (ja) 収音システム及び収音方法
WO2016112113A1 (en) Utilizing digital microphones for low power keyword detection and noise suppression
ATE527829T1 (de) Binaurales hörhilfesystem mit koordinierter schallverarbeitung
JP2005250397A (ja) ロボット
JP2011027825A (ja) 音声処理装置、音声処理方法およびプログラム
JP4825552B2 (ja) 音声認識装置、周波数スペクトル取得装置および音声認識方法
JP2006194700A (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
US10015592B2 (en) Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
JP2005227512A (ja) 音信号処理方法及びその装置、音声認識装置並びにプログラム
KR101160071B1 (ko) 다중인식 음성 인터페이스장치 및 그 방법
JP5045938B2 (ja) 音源方向検出方法、装置及びプログラム
WO2004084187A1 (ja) 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置
CN113223544B (zh) 音频的方向定位侦测装置及方法以及音频处理系统
JP4840082B2 (ja) 音声通信装置
JP2009239500A (ja) マイクロホン装置
JP2005303574A (ja) 音声認識ヘッドセット
JP5105336B2 (ja) 音源分離装置、プログラム及び方法