JP2004012151A - 音源方向推定装置 - Google Patents

音源方向推定装置 Download PDF

Info

Publication number
JP2004012151A
JP2004012151A JP2002162030A JP2002162030A JP2004012151A JP 2004012151 A JP2004012151 A JP 2004012151A JP 2002162030 A JP2002162030 A JP 2002162030A JP 2002162030 A JP2002162030 A JP 2002162030A JP 2004012151 A JP2004012151 A JP 2004012151A
Authority
JP
Japan
Prior art keywords
signal
time window
sound source
noise ratio
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002162030A
Other languages
English (en)
Inventor
Minoru Matsui
松井 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002162030A priority Critical patent/JP2004012151A/ja
Publication of JP2004012151A publication Critical patent/JP2004012151A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

【課題】レベルの大きな反射音や雑音と共に入力された音の音源位置の方向の推定精度の劣化を防止することが可能な音源方向推定装置を提供すること。
【解決手段】音源が発した音を検知して音響信号を生成する複数のマイクロホン1101、1102、1103等を備えたマイクロホンアレイ1100と、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段1400と、複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、信号対雑音比の情報に基づいて時間窓長情報を選択する時間窓長選択手段1600と、選択された時間窓長情報に応じて特定されたマイクロホン毎の音響信号の信号処理対象部分に基づいて音源位置の方向を推定する音源方向推定手段1900とからなる構成を有する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、複数のマイクロホンによって入力された音響信号に基づいて音源位置の方向を推定する音源方向推定装置に関するものである。
【0002】
【従来の技術】
従来、複数のマイクロホンによって入力された音響信号に基づいて音源位置の方向を推定する装置としては、例えば、特開2001−166025号公報に開示されたものが知られている。
【0003】
図21に示す従来の音源方向推定装置9000は、複数のマイクロホンからなるマイクロホンアレイ9100、複数のマイクロホンによって出力される音響信号を処理するマイクロホン毎の信号処理手段、およびマイクロホン毎の信号処理手段によって出力された情報に基づいて音源位置の方向を推定する推定方向算出手段9930によって構成される。
【0004】
ここで、マイクロホン毎の信号処理手段は、例えば、所定の時間長である時間窓に基づいてマイクロホン9101によって生成された音響信号から解析対象の音響信号を抽出する信号切出し手段9911と抽出された音響信号を分析して周波数毎の複素振幅を算出する周波数分析手段9921とを含む構成をしている。
【0005】
この構成により、音源方向推定装置9000は、予め決められ固定された時間長の時間窓を介して、定期的に抽出された音響信号と、マイクロホンアレイ9100を構成する各マイクロホンの位置情報等に基づいて音源位置の方向を推定していた。
【0006】
【発明が解決しようとする課題】
しかし、このような従来の音源方向推定装置9000では、物体に反射して検出される音の音圧レベルの高低や雑音の影響を考慮して推定していないため、室内のように反射音の音圧レベルが高くなる場合や雑音が多い場合には、音源位置の方向の推定精度が低下するという問題があった。
【0007】
本発明は、このような問題を解決するためになされたもので、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能な音源方向推定装置を提供するものである。
【0008】
【課題を解決するための手段】
本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えた構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓長を相互に異なる所定の値の中から選択するため、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0009】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段と、前記信号対雑音比算出手段によって算出された信号対雑音比に基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長選択手段によって選択された時間窓長情報とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて前記時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0010】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えた構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓長を算出するため、時間窓長をより細かく定められ、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0011】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段と、前記信号対雑音比算出手段によって算出された信号対雑音比に基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長算出手段によって算出された時間窓の時間長とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて前記時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0012】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を選択する入力信号選択手段を備え、前記信号対雑音比算出手段は、前記入力信号選択手段によって選択された音響信号の信号対雑音比を算出する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比のうち1つの信号対雑音比を選択し、選択された信号対雑音比に基づいて時間窓長を算出するため、入力された音響信号に応じた反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0013】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記複数のマイクロホンによって生成された音響信号の信号対雑音比を算出し、前記信号対雑音比の最も高い音響信号を選択する入力信号選択手段を備え、前記信号対雑音比算出手段は、前記選択された音響信号の信号対雑音比を算出する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比のうち最も高い信号対雑音比に基づいて前記時間窓長を得るため、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0014】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えた構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号を周波数帯域で分割し、分割された周波数帯域毎の音響信号の信号対雑音比を算出し、算出された信号対雑音比のうち高い値を示す信号対雑音比に基づいて前記時間窓を相互に異なる所定の値の中から選択するため、信号対雑音比の低い周波数帯域の音響信号を除いた前記音源位置の方向の推定が可能であり、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0015】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段と、前記信号対雑音比算出手段によって算出された信号対雑音比の何れかに基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長選択手段によって選択された時間窓長情報とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて前記時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0016】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えた構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号を周波数帯域で分割し、分割された周波数帯域毎の音響信号の信号対雑音比を算出し、算出された信号対雑音比のうち高い値を示す信号対雑音比に基づいて前記時間窓を算出するため、信号対雑音比の低い周波数帯域の音響信号を除いた前記音源位置の方向の推定が可能であり、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0017】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段と、前記信号対雑音比算出手段によって算出された信号対雑音比の何れかに基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長算出手段によって算出された時間窓の時間長とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて前記時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0018】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を選択する入力信号選択手段を備え、前記帯域分割手段は、前記入力信号選択手段によって選択された音響信号を複数の周波数帯域の音響信号に分割する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比のうち1つの信号対雑音比を選択し、選択された信号対雑音比に基づいて時間窓長を算出するため、入力された音響信号に応じた反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0019】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記複数のマイクロホンによって生成された音響信号の信号対雑音比を算出し、前記信号対雑音比の最も高い音響信号を選択する入力信号選択手段を備え、前記帯域分割手段は、前記入力信号選択手段によって選択された音響信号を複数の周波数帯域の音響信号に分割する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比のうち最も高い信号対雑音比に基づいて前記時間窓長を得るため、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0020】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記音源方向推定手段は、前記時間窓に応じて特定された前記マイクロホン毎の音響信号を周波数毎に抽出し、前記周波数毎に抽出された音響信号のうち、前記信号対雑音比算出手段によって算出された信号対雑音比が所定の値以上の周波数帯域内の周波数の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する構成を有している。この構成により、複数のマイクロホンの各々が検知して生成した音響信号から得られた信号対雑音比の低い周波数帯域の音響信号を除いた音の音源位置の方向の推定がなされ、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0021】
また、本発明の音源方向推定装置は、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、または、音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備え、さらに、前記音源方向推定手段は、前記時間窓に応じて特定された前記マイクロホン毎の音響信号を周波数毎に抽出し、前記周波数毎に抽出された音響信号に基づいて推定された前記音源位置の方向を平均化することによって前記音源位置の方向を推定する構成を有している。この構成により、複数の周波数から得られる前記音源位置の方向を平均化するため、前記音源位置の方向の推定精度を向上させることができる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて説明する。
(第1の実施の形態)
図1に示すように、本発明の第1の実施の形態の音源方向推定装置1000は、マイクロホン1101、1102、1103等の複数のマイクロホンからなるマイクロホンアレイ1100、複数のマイクロホンによって出力される音響信号を後述の信号対雑音比算出手段1400に出力するか否かを切り替えるスイッチ1201、1202、1203等の複数のスイッチ、複数のスイッチを制御するスイッチ制御手段1300、音響信号の信号対雑音比を算出する信号対雑音比算出手段1400、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間長である、相互に異なる所定の長さの複数の時間窓長を示す情報を含む情報を格納する記憶手段1500、記憶手段1500に格納された情報から1つの時間窓長を示す情報を選択する時間窓長選択手段1600、および、選択された時間窓長を示す情報とマイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出する音源方向推定手段1900を備えている。
【0023】
また、音源方向推定手段1900は、マイクロホンアレイ1100に含まれる複数のマイクロホンによって生成された音響信号を時間窓長選択手段1600によって選択された情報に示される時間窓長の範囲で前記音響信号を抽出する信号切出し手段1911、1912、1913等の信号切出し手段および、各信号切出し手段によって抽出された信号の周波数毎の複素振幅を算出する周波数分析手段1921、1922、1923などの周波数分析手段を有した構成を複数備え、さらに、周波数分析手段1921等の複数の周波数分析手段によって算出された複素振幅に基づいて音源位置の方向の推定値を算出する推定方向算出手段1930を備えている。
【0024】
マイクロホンアレイ1100は、マイクロホン1101等の複数のマイクロホンを有し、マイクロホン1101は、音を入力して得られた音響信号をスイッチ1201と信号切出し手段1911とに出力する手段である。
【0025】
スイッチ1201は、マイクロホン1101によって出力された音響信号とスイッチ制御手段1300によって出力された制御信号を入力とし、入力された制御信号に応じて入力された音響信号を信号対雑音比算出手段1400に出力する手段である。
【0026】
スイッチ制御手段1300は、スイッチ1201等の複数のスイッチのうち1つのスイッチを選択し、選択されたスイッチに信号対雑音比算出手段1400へ音響信号を出力することを許可する旨の制御信号を生成し、生成された制御信号をスイッチ1201等の複数のスイッチに出力する手段である。
【0027】
ここで、スイッチ制御手段1300は、スイッチ1201等の複数のスイッチのうち、何れのスイッチを選択してもよい。例えば、スイッチ1201等の複数のスイッチによって出力された音響信号の信号対雑音比を算出し、算出された信号対雑音比の最も高い音響信号を出力したスイッチを選択する。
【0028】
なお、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンのうち、所定の1つのマイクロホンによって得られた音響信号を信号対雑音比算出手段1400に出力する構成とした場合、スイッチ1201等の複数のスイッチおよびスイッチ制御手段1300は、除くことが可能である。
【0029】
スイッチ1201等の複数のスイッチおよびスイッチ制御手段1300を除く場合、例えば、マイクロホン1101は、音を入力して得られた音響信号を信号切出し手段1911と信号対雑音比算出手段1400とに出力し、他のマイクロホン1102等の複数のマイクロホンは、音を入力して得られた音響信号を信号切出し手段1912等の複数の信号切出し手段にそれぞれ出力する。
以上に説明した、スイッチ1201等の複数のスイッチとスイッチ制御手段1300とによって入力信号選択手段を構成する。
【0030】
信号対雑音比算出手段1400は、スイッチ1201等の何れかのスイッチによって出力された音響信号を入力とし、入力された音響信号の信号対雑音比を算出し、算出した信号対雑音比を示す情報を生成し、生成された信号対雑音比を示す情報を時間窓長選択手段1600に出力する手段である。
【0031】
図2は、信号対雑音比算出手段1400のブロック構成を示す図である。
信号対雑音比算出手段1400は、所定の時間範囲に入力された音響信号に基づいて雑音レベルを算出する雑音レベル算出手段1410、および信号対雑音比を算出する信号レベル差分算出手段1420を有している。
【0032】
雑音レベル算出手段1410は、スイッチ1201等の何れかのスイッチによって出力された音響信号を入力とし、所定の時間範囲に入力された音響信号の雑音レベルを算出し、算出された雑音レベルを示す情報を生成し、生成された雑音レベルを示す情報を信号レベル差分算出手段1420に出力する手段である。
【0033】
信号レベル差分算出手段1420は、スイッチ1201等の何れかのスイッチによって出力された音響信号と、雑音レベル算出手段1410によって出力された雑音レベルを示す情報とを入力とし、入力された音響信号と雑音レベルとの差分によって信号対雑音比を算出し、算出された信号対雑音比を示す情報を生成し、生成された信号対雑音比を示す情報を時間窓長選択手段1600に出力する手段である。
【0034】
以上説明したように、信号対雑音比算出手段1400は、入力された音響信号に基づいて信号対雑音比を算出する。
記憶手段1500は、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間長である時間窓長を示す情報を含む情報を予め格納する手段である。
記憶手段1500に格納された情報に示される時間窓長には、相互に異なる所定の値が割り当てられている。
【0035】
時間窓長選択手段1600は、信号対雑音比算出手段1400によって出力された信号対雑音比を示す情報と、記憶手段1500に格納されている複数の時間窓長を示す情報とを入力とし、入力された信号対雑音比を示す情報に基づいて、入力された複数の時間窓長を示す情報のうち1つの時間窓長を示す情報を選択し、選択された時間窓長を示す情報を信号切出し手段1911等の複数の信号切出し手段に出力する手段である。
【0036】
ここで、時間窓長選択手段1600で選択される時間窓長を示す情報と信号対雑音比との関係について説明する。
図3は、音源方向推定装置1000に入力された音と時間窓との関係の例を示す図である。
【0037】
図3において、縦軸は音の波の振幅、横軸は時間を示し、手を叩いた場合のような短い発音時間の直接音が入力され、続いて直接音の反射音が入力され、入力された音は、例えば信号対雑音比が15dB以上と、信号対雑音比が高い音である。
【0038】
図3に示された例の場合、直接音が入力された時間範囲を示す時間窓310と、直接音と反射音とが入力された時間範囲を示す時間窓320を比較したとき、時間窓310の範囲で抽出された音響信号に基づいて音源位置の方向を推定する方が反射音の影響が少ないため、音源位置の方向の推定精度が向上する。
【0039】
図4は、図3と同様に音源方向推定装置1000に入力された音と時間窓との関係の例を示す図である。
図4において、縦軸は音の波の振幅、横軸は時間を示し、入力された音は、例えば信号対雑音比が15dB未満と、信号対雑音比が低い音である。
【0040】
図4に示された例の場合、反射音による影響が雑音による影響に対して少ないため、短い時間範囲を示す時間窓410と、長い時間範囲を示す時間窓420とを比較した場合、時間窓420の範囲で抽出された音響信号に基づいて音源位置の方向を推定する方が、より多くの標本を得ることができるため、音源位置の方向の推定精度が向上する。
【0041】
以上説明したように、時間窓長選択手段1600は、信号対雑音比に応じた時間窓長を示す情報を記憶手段1500から検索し、例えば、信号対雑音比が高い場合は短い時間窓長を示す情報を取得し、信号対雑音比が低い場合は長い時間窓長を示す情報を取得する。
【0042】
信号切出し手段1911は、マイクロホン1101によって出力された音響信号と、時間窓長選択手段1600によって出力された時間窓長を示す情報とを入力とし、入力された情報に示される時間窓長の範囲に入力された音響信号を抽出し、抽出された音響信号を周波数分析手段1921に出力するための手段である。
【0043】
周波数分析手段1921は、信号切出し手段1911によって入力された音響信号を入力とし、入力された音響信号を分析して周波数毎の複素振幅を算出し、算出された複素振幅を示す情報を生成し、生成された複素振幅を示す情報を推定方向算出手段1930に分析した周波数毎に順次出力する手段である。
【0044】
推定方向算出手段1930は、周波数分析手段1921等の複数の周波数分析手段によって出力された複素振幅を示す情報を入力とし、入力された複素振幅を示す情報と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出し、算出された音源位置の方向の推定値を示す情報を生成し、生成された音源位置の方向の推定値を示す情報を外部の装置に出力する手段である。
【0045】
なお、周波数分析手段1921で処理される音響信号に基づいた複素振幅の算出、および推定方向算出手段1930で処理される複素振幅と、マイクロホンの位置の情報とに基づいた音源位置の方向の推定値の算出については公知であり、例えば、特開2001−166025号公報に記載されているため説明は省略する。
【0046】
また、推定方向算出手段1930は、周波数分析手段1921等の複数の周波数分析手段によって出力された複素振幅を示す情報を順次入力し、入力された複素振幅を示す情報に基づいて得られた音源位置の方向の推定値の平均値を算出することによって音源位置の方向の推定値を算出するのでもよい。
【0047】
図5は、本発明の第1の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。
以下で説明する処理に先立って、記憶手段1500には、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間長である、あらかじめ定められた相互に異なる所定の時間窓長を示す情報を含む情報があらかじめ複数格納されている。
【0048】
マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンは、音を入力して音響信号を得る(S110)。
スイッチ制御手段1300は、入力された音響信号のうち1つの音響信号を選択する(S120)。
【0049】
信号対雑音比算出手段1400は、ステップS120で選択された1つの音響信号の信号対雑音比を算出する(S130)。
時間窓長選択手段1600は、算出された信号対雑音比に基づいて記憶手段1500に格納された時間窓長を示す情報のうち1つの時間窓長を示す情報を取得する(S140)。
【0050】
音源方向推定手段1900は、ステップS140で得られた情報に示された時間窓長の範囲にマイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響信号と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出する(S160)。
【0051】
以上説明したように、本発明の第1の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓長を相互に異なる所定の値の中から選択するため、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0052】
(第2の実施の形態)
図6は、本発明の第2の実施の形態の音源方向推定装置2000のブロック構成を示す図である。
音源方向推定装置2000は、本発明の第1の実施の形態の音源方向推定装置1000に、さらに、信号対雑音比算出手段1400によって算出された信号対雑音比に基づいて、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段2700を設けた点が相違する。
【0053】
また、音源方向推定手段2900は、信号切出し手段2911等の信号切出し手段が、本発明の第1の実施の形態の音源方向推定装置1000の音源方向推定手段1900の信号切出し手段1911等の信号切出し手段が行う音響信号の抽出処理に時間窓開始点を考慮する点が相違する。
【0054】
なお、本発明の第2の実施の形態の音源方向推定装置2000を構成する構成手段のうち、上記本発明の第1の実施の形態の音源方向推定装置1000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0055】
時間窓開始点算出手段2700は、信号対雑音比算出手段1400によって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出し、算出された時間窓開始点を示す情報を生成し、生成された時間窓開始点を示す情報を信号切出し手段2911等の複数の信号切出し手段に出力する手段である。
【0056】
図7は、音源方向推定装置2000に入力された音と時間窓との関係の例を示す図である。
図7において、縦軸は音の波の振幅、横軸は時間を示し、入力された音は、例えば信号対雑音比が15dB未満と、信号対雑音比が低い音である。
【0057】
図4に示された例の場合、周期的に定められた時間窓720および時間窓730と、信号対雑音比が高い時間を中心として定められた時間窓710とを比較したとき、時間窓710の範囲で抽出された音響信号に基づいて音源位置の方向を推定する方が、雑音の影響が少ないため、音源位置の方向の推定精度が向上する。
【0058】
以上説明したように、時間窓長開始点算出手段2700は、信号対雑音比の高い時間を中心とした時間窓となるように時間窓開始点を算出する。
【0059】
信号切出し手段2911は、マイクロホン1101によって出力された音響信号と、時間窓長選択手段1600によって出力された時間窓長を示す情報と、時間窓長開始点算出手段2700によって出力された時間窓開始点を示す情報とを入力とし、入力された情報に示される時間窓開始点から入力された情報に示される時間窓長の範囲に入力された音響信号を抽出し、抽出された音響信号を周波数分析手段1921に出力する手段である。
【0060】
図8は、本発明の第2の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第2の実施の形態の音源方向推定方法の処理のうち、上記本発明の第1の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0061】
ステップS140で時間窓長を示す情報を得た後、時間窓長開始点算出手段2700は、ステップS130で算出された信号対雑音比に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する(S250)。
【0062】
音源方向推定手段2900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS140で得られた時間窓長を示す情報と、ステップS250で得られた時間窓開始点と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S260)。
【0063】
以上説明したように、本発明の第2の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0064】
(第3の実施の形態)
図9は、本発明の第3の実施の形態の音源方向推定装置3000のブロック構成を示す図である。
音源方向推定装置3000は、マイクロホン1101、1102、1103等の複数のマイクロホンからなるマイクロホンアレイ1100、複数のマイクロホンによって出力される音響信号を後述の信号対雑音比算出手段1400に出力するか否かを切り替えるスイッチ1201、1202、1203等の複数のスイッチ、複数のスイッチを制御するスイッチ制御手段1300、音響信号の信号対雑音比を算出する信号対雑音比算出手段1400、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓長を算出する時間窓長算出手段3650、および、選択された時間窓長を示す情報とマイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出する音源方向推定手段1900を備えている。
【0065】
なお、本発明の第3の実施の形態の音源方向推定装置3000を構成する構成手段のうち、上記本発明の第1の実施の形態の音源方向推定装置1000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0066】
時間窓長算出手段3650は、信号対雑音比算出手段1400によって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて時間窓長を算出し、算出された時間窓長を示す情報を生成し、生成された時間窓長を示す情報を信号切出し手段1911等の複数の信号切出し手段に出力する手段である。
【0067】
ここで、時間窓長算出手段3650は、例えば、信号対雑音比と時間窓長の相関関係を示す所定の係数が設定された一次関数等の関数によって時間窓長を算出する。
【0068】
図10は、本発明の第3の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第3の実施の形態の音源方向推定方法の処理のうち、上記本発明の第1の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0069】
ステップS130で信号対雑音比が算出された後、時間窓長算出手段3650は、算出された信号対雑音比に基づいて時間窓長を算出する(S340)。
【0070】
音源方向推定手段1900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS340で得られた時間窓長と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S160)。
【0071】
以上説明したように、本発明の第3の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓長を算出するため、時間窓長をより細かく定められ、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0072】
(第4の実施の形態)
図11は、本発明の第4の実施の形態の音源方向推定装置4000のブロック構成を示す図である。
音源方向推定装置4000は、本発明の第3の実施の形態の音源方向推定装置3000に、さらに、信号対雑音比算出手段1400によって算出された信号対雑音比に基づいて、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する時間窓長開始点算出手段4700を設けた点が相違する。
【0073】
また、音源方向推定手段4900は、信号切出し手段4911等の信号切出し手段が、本発明の第3の実施の形態の音源方向推定装置3000の音源方向推定手段1900の信号切出し手段1911等の信号切出し手段が行う音響信号の抽出処理に時間窓開始点を考慮する点が相違する。
【0074】
なお、本発明の第4の実施の形態の音源方向推定装置4000を構成する構成手段のうち、上記本発明の第3の実施の形態の音源方向推定装置3000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0075】
時間窓開始点算出手段4700は、信号対雑音比算出手段1400によって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出し、算出された時間窓開始点を示す情報を生成し、生成された時間窓開始点を示す情報を信号切出し手段4911等の複数の信号切出し手段に出力する手段である。
【0076】
ここで、時間窓開始点算出手段4700は、本発明の第2の実施の形態の音源方向推定装置2000の時間窓開始点算出手段2700と同様な動作であるので、詳細な説明は省略する。
【0077】
信号切出し手段4911は、マイクロホン1101によって出力された音響信号と、時間窓長算出手段3650によって出力された時間窓長を示す情報と、時間窓長開始点算出手段4700によって出力された時間窓開始点を示す情報とを入力とし、入力された情報に示される時間窓開始点から入力された情報に示される時間窓長の範囲に入力された音響信号を抽出し、抽出された音響信号を周波数分析手段1921に出力する手段である。
【0078】
図12は、本発明の第4の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第4の実施の形態の音源方向推定方法の処理のうち、上記本発明の第3の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0079】
ステップS340で時間窓長を算出した後、時間窓長開始点算出手段4700は、ステップS130で算出された信号対雑音比に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する(S450)。
【0080】
音源方向推定手段4900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS340で得られた時間窓長と、ステップS450で得られた時間窓開始点と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S460)。
【0081】
以上説明したように、本発明の第4の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0082】
(第5の実施の形態)
図13は、本発明の第5の実施の形態の音源方向推定装置5000のブロック構成を示す図である。
音源方向推定装置5000は、マイクロホン1101、1102、1103等の複数のマイクロホンからなるマイクロホンアレイ1100、複数のマイクロホンによって出力される音響信号を後述の信号対雑音比算出手段1400に出力するか否かを切り替えるスイッチ1201、1202、1203等の複数のスイッチ、複数のスイッチを制御するスイッチ制御手段1300、音響信号を複数の周波数帯域に分割する帯域分割手段5800、周波数帯域毎に分割された音響信号の信号対雑音比を算出する信号対雑音比算出手段5811等の複数の信号対雑音比算出手段、算出された信号対雑音比を示す情報を後述の時間窓長編選択手段1600に出力するか否かを切り替える周波数帯域スイッチ5821等の複数の周波数帯域スイッチ、算出された信号対雑音比のうち1つの信号対雑音比を選択する帯域選択手段5830、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間長である、相互に異なる所定の長さの複数の時間窓長を示す情報を含む情報を格納する記憶手段1500、記憶手段1500に格納された情報から1つの時間窓長を示す情報を選択する時間窓長選択手段1600、および、選択された時間窓長を示す情報とマイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出する音源方向推定手段1900を備えている。
【0083】
なお、本発明の第5の実施の形態の音源方向推定装置5000を構成する構成手段のうち、上記本発明の第1の実施の形態の音源方向推定装置1000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0084】
帯域分割手段5800は、スイッチ1201等の何れかのスイッチによって出力された音響信号を入力とし、入力された音響信号を複数の周波数帯域に分割し、分割した音響信号を信号対雑音比算出手段5811等の複数の信号対雑音比算出手段に周波数帯域毎にそれぞれ出力する手段である。
【0085】
信号対雑音比算出手段5811は、帯域分割手段5811によって出力された1つの周波数帯域の音響信号を入力とし、入力された音響信号の信号対雑音比を算出し、算出した信号対雑音比を示す情報を生成し、生成された信号対雑音比を示す情報を周波数帯域スイッチ5821と帯域選択手段5830とに出力する手段である。
【0086】
ここで、信号対雑音比算出手段5811は、本発明の第1の実施の形態の音源方向推定装置1000の信号対雑音比算出手段1300と同様な動作であるので、詳細な説明は省略する。
【0087】
周波数帯域スイッチ5821は、信号対雑音比算出手段5811によって出力された信号対雑音比を示す情報と帯域選択手段によって出力された制御信号とを入力とし、入力された制御信号に応じて入力された信号対雑音比を示す情報を時間窓長選択手段1600に出力する手段である。
【0088】
ここで、信号対雑音比算出手段5811と周波数帯域スイッチ5821との構成等の信号対雑音比算出手段と周波数帯域スイッチとの構成は、帯域分割手段5800によって分割される周波数帯域の数に応じて設けられる。
【0089】
帯域選択手段5830は、周波数帯域スイッチ5821等の複数の周波数帯域スイッチによって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報のうち最も高い信号対雑音比を示す情報を選択し、選択された信号対雑音比を示す情報を出力した周波数帯域スイッチに対して時間窓長変換手段1600に信号対雑音比を示す情報を出力することを許可する旨の制御信号を生成し、生成された制御信号を周波数帯域スイッチ5821等の複数の周波数帯域スイッチに出力する手段である。
【0090】
ここで、帯域選択手段5830は、入力された信号対雑音比を示す情報のうち最も高い信号対雑音比を示す情報を選択すると説明したが、所定の値より高い信号対雑音比を示す情報のうち何れかを選択するのでもよい。
【0091】
推定方向算出手段1930は、音源位置の方向の推定値を算出するときに、さらに、信号対雑音比算出手段5811等の複数の信号対雑音比算出手段によって生成された信号対雑音比を示す情報に基づいて算出するのでもよい。
【0092】
この場合、推定方向算出手段1930は、周波数分析手段1921等の複数の周波数分析手段によって出力された周波数毎の複素振幅を示す情報のうち、信号対雑音比算出手段5811等の複数の信号対雑音比算出手段によって生成された信号対雑音比を示す情報に基づいて、所定の値以上の信号対雑音が得られた周波数帯域に含まれる周波数の複素振幅を示す情報を入力とする。
【0093】
図14は、本発明の第5の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第5の実施の形態の音源方向推定方法の処理のうち、上記本発明の第1の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0094】
ステップS120で入力された音響信号のうち1つの音響信号を選択した後、帯域分割手段5800は、ステップS120で選択された音響信号を複数の周波数帯域に分割する(S530)。
【0095】
信号対雑音比算出手段5811等の複数の信号対雑音比算出手段は、周波数帯域毎に分割された音響信号の信号対雑音比を算出する(S531)。
帯域選択手段5830は、ステップS531で算出された周波数帯域毎の信号対雑音比のうち1つの信号対雑音比を選択する(S532)。
【0096】
時間窓長選択手段1600は、選択された信号対雑音比に基づいて記憶手段150に格納された時間窓長を示す情報のうち1つの時間窓長を示す情報を取得する(S540)。
【0097】
音源方向推定手段1900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS540で得られた時間窓長を示す情報と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S160)。
【0098】
以上説明したように、本発明の第5の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号を周波数帯域で分割し、分割された周波数帯域毎の音響信号の信号対雑音比を算出し、算出された信号対雑音比のうち高い値を示す信号対雑音比に基づいて時間窓を相互に異なる所定の値の中から選択するため、信号対雑音比の低い周波数帯域の音響信号を除いた音源位置の方向の推定が可能であり、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0099】
(第6の実施の形態)
図15は、本発明の第6の実施の形態の音源方向推定装置6000のブロック構成を示す図である。
音源方向推定装置6000は、本発明の第5の実施の形態の音源方向推定装置5000に、さらに、帯域選択手段5830によって選択された信号対雑音比に基づいて、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する時間窓長開始点算出手段6700を設けた点が相違する。
【0100】
また、音源方向推定手段6900は、信号切出し手段6911等の信号切出し手段が、本発明の第5の実施の形態の音源方向推定装置5000の音源方向推定手段1900の信号切出し手段1911等の信号切出し手段が行う音響信号の抽出処理に時間窓開始点を考慮する点が相違する。
【0101】
なお、本発明の第6の実施の形態の音源方向推定装置6000を構成する構成手段のうち、上記本発明の第5の実施の形態の音源方向推定装置5000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0102】
時間窓開始点算出手段6700は、周波数帯域スイッチ5821等の何れかの周波数帯域スイッチによって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出し、算出された時間窓開始点を示す情報を生成し、生成された時間窓開始点を示す情報を信号切出し手段6911等の複数の信号切出し手段に出力する手段である。
【0103】
ここで、時間窓開始点算出手段6700は、本発明の第2の実施の形態の音源方向推定装置2000の時間窓開始点算出手段2700と同様な動作であるので、詳細な説明は省略する。
【0104】
信号切出し手段6911は、マイクロホン1101によって出力された音響信号と、時間窓長選択手段1600によって出力された時間窓長を示す情報と、時間窓長開始点算出手段6700によって出力された時間窓開始点を示す情報とを入力とし、入力された情報に示される時間窓開始点から入力された情報に示される時間窓長の範囲に入力された音響信号を抽出し、抽出された音響信号を周波数分析手段1921に出力する手段である。
【0105】
図16は、本発明の第6の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第6の実施の形態の音源方向推定方法の処理のうち、上記本発明の第5の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0106】
ステップS540で時間窓長を選択した後、時間窓長開始点算出手段6700は、ステップS532で選択された信号対雑音比に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する(S650)。
【0107】
音源方向推定手段6900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS540で得られた時間窓長を示す情報と、ステップS650で得られた時間窓開始点と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S660)。
【0108】
以上説明したように、本発明の第6の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0109】
(第7の実施の形態)
図17は、本発明の第7の実施の形態の音源方向推定装置7000のブロック構成を示す図である。
音源方向推定装置7000は、マイクロホン1101、1102、1103等の複数のマイクロホンからなるマイクロホンアレイ1100、複数のマイクロホンによって出力される音響信号を後述の信号対雑音比算出手段1400に出力するか否かを切り替えるスイッチ1201、1202、1203等の複数のスイッチ、複数のスイッチを制御するスイッチ制御手段1300、音響信号を複数の周波数帯域に分割する帯域分割手段5800、周波数帯域毎に分割された音響信号の信号対雑音比を算出する信号対雑音比算出手段5811等の複数の信号対雑音比算出手段、算出された信号対雑音比を示す情報を後述の時間窓長編選択手段1600に出力するか否かを切り替える周波数帯域スイッチ5821等の複数の周波数帯域スイッチ、算出された信号対雑音比のうち1つの信号対雑音比を選択する帯域選択手段5830、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間長である時間窓長を算出する時間窓長算出手段7650、および、選択された時間窓長を示す情報とマイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて音源位置の方向の推定値を算出する音源方向推定手段1900を備えている。
【0110】
なお、本発明の第7の実施の形態の音源方向推定装置7000を構成する構成手段のうち、上記本発明の第5の実施の形態の音源方向推定装置5000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0111】
時間窓長算出手段7650は、周波数帯域スイッチ5821等の複数の周波数帯域スイッチによって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて時間窓長を算出し、算出された時間窓長を示す情報を生成し、生成された時間窓長を示す情報を信号切出し手段1911等の複数の信号切出し手段に出力する手段である。
【0112】
ここで、時間窓長算出手段7650は、本発明の第3の実施の形態の音源方向推定装置3000の時間窓長算出手段3650と同様な動作であるので、詳細な説明は省略する。
【0113】
図18は、本発明の第7の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第7の実施の形態の音源方向推定方法の処理のうち、上記本発明の第5の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0114】
ステップS532で信号対雑音比が選択された後、時間窓長算出手段7650は、算出された信号対雑音比に基づいて時間窓長を算出する(S740)。
【0115】
音源方向推定手段1900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS740で得られた時間窓長と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S160)。
【0116】
以上説明したように、本発明の第7の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号を周波数帯域で分割し、分割された周波数帯域毎の音響信号の信号対雑音比を算出し、算出された信号対雑音比のうち高い値を示す信号対雑音比に基づいて前記時間窓を算出するため、信号対雑音比の低い周波数帯域の音響信号を除いた音源位置の方向の推定が可能であり、反射音の音圧レベルの高低および雑音の影響を考慮して音源位置の方向を推定することが可能である。
【0117】
(第8の実施の形態)
図19は、本発明の第8の実施の形態の音源方向推定装置8000のブロック構成を示す図である。
音源方向推定装置8000は、本発明の第7の実施の形態の音源方向推定装置7000に、さらに、帯域選択手段5830によって選択された信号対雑音比に基づいて、マイクロホンアレイ1100に含まれる各マイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する時間窓長開始点算出手段8700を設けた点が相違する。
【0118】
また、音源方向推定手段8900は、信号切出し手段8911等の信号切出し手段が、本発明の第7の実施の形態の音源方向推定装置7000の音源方向推定手段1900の信号切出し手段1911等の信号切出し手段が行う音響信号の抽出処理に時間窓開始点を考慮する点が相違する。
【0119】
なお、本発明の第8の実施の形態の音源方向推定装置8000を構成する構成手段のうち、上記本発明の第7の実施の形態の音源方向推定装置7000における構成手段と同様の処理を行うものには同一の符号を付し、その説明を省略する。
【0120】
時間窓開始点算出手段8700は、周波数帯域スイッチ5821等の何れかの周波数帯域スイッチによって出力された信号対雑音比を示す情報を入力とし、入力された信号対雑音比を示す情報に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出し、算出された時間窓開始点を示す情報を生成し、生成された時間窓開始点を示す情報を信号切出し手段8911等の信号切出し手段に出力する手段である。
【0121】
ここで、時間窓開始点算出手段8700は、本発明の第2の実施の形態の音源方向推定装置2000の時間窓開始点算出手段2700と同様な動作であるので、詳細な説明は省略する。
【0122】
信号切出し手段8911は、マイクロホン1101によって出力された音響信号と、時間窓長算出手段7650によって出力された時間窓長を示す情報と、時間窓長開始点算出手段8700によって出力された時間窓開始点を示す情報とを入力とし、入力された情報に示される時間窓開始点から入力された情報に示される時間窓長の範囲に入力された音響信号を抽出し、抽出された音響信号を周波数分析手段1921に出力する手段である。
【0123】
図20は、本発明の第8の実施の形態の音源方向推定方法における処理の流れを示すフローチャートである。なお、本発明の第8の実施の形態の音源方向推定方法の処理のうち、上記本発明の第7の実施の形態の音源方向推定方法における処理と同様なものには同一の符号を付し、その説明を省略する。
【0124】
ステップS740で時間窓長を算出した後、時間窓長開始点算出手段8700は、ステップS532で選択された信号対雑音比に基づいて音響信号の信号処理対象部分を特定する時間窓の開始点である時間窓開始点を算出する(S850)。
【0125】
音源方向推定手段8900は、マイクロホン1101等のマイクロホンアレイ1100に含まれる複数のマイクロホンによって入力された音響データをステップS740で得られた時間窓長と、ステップS850で得られた時間窓開始点と、マイクロホン1101等のマイクロホンアレイ1100に含まれる各マイクロホンの位置の情報とに基づいて、音源位置の方向の推定値を算出する(S860)。
【0126】
以上説明したように、本発明の第8の実施の形態の音源方向推定装置は、複数のマイクロホンの各々が検知して生成した音響信号から信号対雑音比を算出し、算出された信号対雑音比に基づいて時間窓の開始点を算出するため、入力された音響信号に応じた音源位置の方向を推定することが可能である。
【0127】
なお、本発明の第1の実施の形態から第8の実施の形態までの音源方向推定方法は、音源方向推定装置を用いて実施することができるが、音源方向推定装置の各構成手段は、インタフェイス、演算制御装置、および記憶装置を有する一般的なコンピュータ装置により構成することもできる。
【0128】
また、本発明の第1の実施の形態から第8の実施の形態までの音源方向推定方法の各ステップでの処理を含む音源方向推定動作を実行させるための音源方向推定プログラムを生成し、そのプログラムに基づいて、コンピュータに、これらの各ステップでの処理を含む音源方向推定動作を実行させることも可能である。
【0129】
また、上記の音源方向推定プログラムは、あらかじめ決められた記憶媒体に記憶された上記の音源方向推定プログラムをコンピュータにロードする方法のほかに、音源方向推定プログラムを通信インタフェイスおよびネットワークからファイル形式で取得し、上記コンピュータで実施する方法によっても同様の効果が得られる。さらに、ネットワークを用いることでプログラムの更新や配布が容易となる。
【0130】
【発明の効果】
以上説明したように、本発明は、レベルの大きな反射音や雑音と共に入力された音の音源位置の方向の推定精度の劣化を防止することが可能な音源方向推定装置を提供することができるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図2】本発明の第1の実施の形態の音源方向推定装置の信号対雑音比算出手段の概略のブロック構成を示す図
【図3】本発明の第1の実施の形態の音源方向推定装置に入力された音と時間窓との関係の例を示す図
【図4】本発明の第1の実施の形態の音源方向推定装置に入力された音と時間窓との関係の例を示す図
【図5】本発明の第1の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図6】本発明の第2の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図7】本発明の第2の実施の形態の音源方向推定装置に入力された音と時間窓との関係の例を示す図
【図8】本発明の第2の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図9】本発明の第3の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図10】本発明の第3の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図11】本発明の第5の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図12】本発明の第4の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図13】本発明の第5の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図14】本発明の第5の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図15】本発明の第6の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図16】本発明の第6の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図17】本発明の第7の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図18】本発明の第7の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図19】本発明の第8の実施の形態の音源方向推定装置の概略のブロック構成を示す図
【図20】本発明の第8の実施の形態の音源方向推定方法における処理の流れを示すフローチャート
【図21】従来の音源方向推定装置の概略のブロック構成を示す図
【符号の説明】
310、320、410、420、710、720、730 時間窓
1000、2000、3000、4000、5000、6000、7000、8000、9000 音源方向推定装置
1100、9100 マイクロホンアレイ
1101、1102、1103、9101、9102、9103 マイクロホン
1201、1202、1203 スイッチ(入力信号選択手段)
1300 スイッチ制御手段(入力信号選択手段)
1400、5811、5812、5813 信号対雑音比算出手段
1410 雑音レベル算出手段
1420 信号レベル差分算出手段
1500 記憶手段
1600 時間窓長選択手段
1900、2900、4900、6900、8900 音源方向推定手段
1911、1912、1913、2911、2912、2913、4911、4912、4913、6911、6912、6913、8911、8912、8913、9911、9912、9913 信号切出し手段
1921、1922、1923、9921、9922、9923 周波数分析手段
1930、9930 推定方向算出手段
2700、4700、6700、8700 時間窓開始点算出手段
3650、7650 時間窓長算出手段
5800 帯域分割手段
5821、5822、5823 周波数帯域スイッチ
5830 帯域選択手段

Claims (14)

  1. 音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の情報に基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えたことを特徴とする音源方向推定装置。
  2. 前記信号対雑音比算出手段によって算出された信号対雑音比に基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長選択手段によって選択された時間窓長情報とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定することを特徴とする請求項1記載の音源方向推定装置。
  3. 音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号の信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を、前記信号対雑音比の情報に基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓の時間長に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えたことを特徴とする音源方向推定装置。
  4. 前記信号対雑音比算出手段によって算出された信号対雑音比に基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長算出手段によって算出された時間窓の時間長とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定することを特徴とする請求項3記載の音源方向推定装置。
  5. 前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を選択する入力信号選択手段を備え、前記信号対雑音比算出手段は、前記入力信号選択手段によって選択された音響信号の信号対雑音比を算出することを特徴とする請求項1から請求項4までの何れかに記載の音源方向推定装置。
  6. 前記入力信号選択手段は、前記複数のマイクロホンによって生成された音響信号の信号対雑音比を算出し、前記信号対雑音比の最も高い音響信号を選択することを特徴とする請求項5記載の音源方向推定装置。
  7. 音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長情報を複数保持し、前記信号対雑音比の何れかに基づいて前記時間窓長情報を選択する時間窓長選択手段と、前記時間窓長選択手段によって選択された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えたことを特徴とする音源方向推定装置。
  8. 前記信号対雑音比算出手段によって算出された信号対雑音比の何れかに基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長選択手段によって選択された時間窓長情報とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定することを特徴とする請求項7記載の音源方向推定装置。
  9. 音源が発した音を検知して音響信号を生成する複数のマイクロホンを備えたマイクロホンアレイと、前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を複数の周波数帯域の音響信号に分割する帯域分割手段と、前記周波数帯域毎の音響信号の各々について信号対雑音比を算出する信号対雑音比算出手段と、前記複数のマイクロホンによって生成された音響信号から信号処理対象部分を特定する時間窓の時間長を示す情報である時間窓長を、前記信号対雑音比の何れかに基づいて算出する時間窓長算出手段と、前記時間窓長算出手段によって算出された時間窓長情報に応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定する音源方向推定手段とを備えたことを特徴とする音源方向推定装置。
  10. 前記信号対雑音比算出手段によって算出された信号対雑音比の何れかに基づいて、前記時間窓の開始点を示す時間窓開始点を算出する時間窓長開始点算出手段を備え、前記音源方向推定手段は、前記時間窓長開始点算出手段によって算出された時間窓開始点と前記時間窓長算出手段によって算出された時間窓の時間長とに応じて特定された前記マイクロホン毎の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定することを特徴とする請求項9記載の音源方向推定装置。
  11. 前記複数のマイクロホンによって生成された音響信号のうち、少なくとも1つの音響信号を選択する入力信号選択手段を備え、前記帯域分割手段は、前記入力信号選択手段によって選択された音響信号を複数の周波数帯域の音響信号に分割することを特徴とする請求項7から請求項10までの何れかに記載の音源方向推定装置。
  12. 前記入力信号選択手段は、前記複数のマイクロホンによって生成された音響信号の信号対雑音比を算出し、信号対雑音比の最も高い音響信号を選択することを特徴とする請求項11記載の音源方向推定装置。
  13. 前記音源方向推定手段は、前記時間窓に応じて特定された前記マイクロホン毎の音響信号を周波数毎に抽出し、前記周波数毎に抽出された音響信号のうち、前記信号対雑音比算出手段によって算出された信号対雑音比が所定の値以上の周波数帯域内の周波数の音響信号の信号処理対象部分に基づいて前記音源位置の方向を推定することを特徴とする請求項7から請求項12までの何れかに記載の音源方向推定装置。
  14. 前記音源方向推定手段は、前記時間窓に応じて特定された前記マイクロホン毎の音響信号を周波数毎に抽出し、前記周波数毎に抽出された音響信号に基づいて推定された前記音源位置の方向を平均化することによって前記音源位置の方向を推定することを特徴とする請求項1から請求項13までの何れかに記載の音源方向推定装置。
JP2002162030A 2002-06-03 2002-06-03 音源方向推定装置 Pending JP2004012151A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002162030A JP2004012151A (ja) 2002-06-03 2002-06-03 音源方向推定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002162030A JP2004012151A (ja) 2002-06-03 2002-06-03 音源方向推定装置

Publications (1)

Publication Number Publication Date
JP2004012151A true JP2004012151A (ja) 2004-01-15

Family

ID=30430922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002162030A Pending JP2004012151A (ja) 2002-06-03 2002-06-03 音源方向推定装置

Country Status (1)

Country Link
JP (1) JP2004012151A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006054599A1 (ja) * 2004-11-16 2006-05-26 Nihon University 音源方向判定装置及び方法
JP2007047088A (ja) * 2005-08-11 2007-02-22 Fujitsu Ltd 音源方向検出装置
JP2008064733A (ja) * 2006-08-09 2008-03-21 Fujitsu Ltd 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
JP2009025025A (ja) * 2007-07-17 2009-02-05 Kumamoto Univ 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法
JP2009086055A (ja) * 2007-09-27 2009-04-23 Sony Corp 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
EP2202531A1 (en) * 2007-10-01 2010-06-30 Panasonic Corporation Sound source direction detector
US20110200205A1 (en) * 2010-02-17 2011-08-18 Panasonic Corporation Sound pickup apparatus, portable communication apparatus, and image pickup apparatus
US9961460B2 (en) 2014-12-16 2018-05-01 Nec Corporation Vibration source estimation device, vibration source estimation method, and vibration source estimation program
JPWO2021044470A1 (ja) * 2019-09-02 2021-03-11
CN113281707A (zh) * 2021-05-26 2021-08-20 上海电力大学 一种强噪声下基于加窗lasso的声源定位方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7672196B1 (en) 2004-11-16 2010-03-02 Nihon University Sound source localizing apparatus and method
JP5004276B2 (ja) * 2004-11-16 2012-08-22 学校法人日本大学 音源方向判定装置及び方法
JPWO2006054599A1 (ja) * 2004-11-16 2008-05-29 学校法人日本大学 音源方向判定装置及び方法
WO2006054599A1 (ja) * 2004-11-16 2006-05-26 Nihon University 音源方向判定装置及び方法
JP2007047088A (ja) * 2005-08-11 2007-02-22 Fujitsu Ltd 音源方向検出装置
JP4659556B2 (ja) * 2005-08-11 2011-03-30 富士通株式会社 音源方向検出装置
KR100883712B1 (ko) 2006-08-09 2009-02-12 후지쯔 가부시끼가이샤 음원 방향 추정 방법, 및 음원 방향 추정 장치
US7970609B2 (en) 2006-08-09 2011-06-28 Fujitsu Limited Method of estimating sound arrival direction, sound arrival direction estimating apparatus, and computer program product
JP2008064733A (ja) * 2006-08-09 2008-03-21 Fujitsu Ltd 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
JP2010517047A (ja) * 2007-01-26 2010-05-20 マイクロソフト コーポレーション マルチセンサ音源定位
JP2009025025A (ja) * 2007-07-17 2009-02-05 Kumamoto Univ 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法
US8098843B2 (en) 2007-09-27 2012-01-17 Sony Corporation Sound source direction detecting apparatus, sound source direction detecting method, and sound source direction detecting camera
JP2009086055A (ja) * 2007-09-27 2009-04-23 Sony Corp 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
EP2202531A1 (en) * 2007-10-01 2010-06-30 Panasonic Corporation Sound source direction detector
EP2202531A4 (en) * 2007-10-01 2012-12-26 Panasonic Corp DETECTOR FOR SOUND SOUND ALIGNMENT
US20110200205A1 (en) * 2010-02-17 2011-08-18 Panasonic Corporation Sound pickup apparatus, portable communication apparatus, and image pickup apparatus
US9961460B2 (en) 2014-12-16 2018-05-01 Nec Corporation Vibration source estimation device, vibration source estimation method, and vibration source estimation program
JPWO2021044470A1 (ja) * 2019-09-02 2021-03-11
WO2021044470A1 (ja) * 2019-09-02 2021-03-11 日本電気株式会社 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体
JP7276469B2 (ja) 2019-09-02 2023-05-18 日本電気株式会社 波源方向推定装置、波源方向推定方法、およびプログラム
CN113281707A (zh) * 2021-05-26 2021-08-20 上海电力大学 一种强噪声下基于加窗lasso的声源定位方法
CN113281707B (zh) * 2021-05-26 2022-10-21 上海电力大学 一种强噪声下基于加窗lasso的声源定位方法

Similar Documents

Publication Publication Date Title
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
JP6553111B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP6107151B2 (ja) 雑音抑圧装置、方法、及びプログラム
JP4816711B2 (ja) 通話音声処理装置および通話音声処理方法
JP5838861B2 (ja) 音声信号処理装置、方法及びプログラム
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP2004012151A (ja) 音源方向推定装置
US8731212B2 (en) Sound collecting device, acoustic communication system, and computer-readable storage medium
JP2010232862A (ja) 音声処理装置、音声処理方法、及び、プログラム
JP2005292812A (ja) 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体
KR100657912B1 (ko) 잡음 제거 방법 및 장치
US10015592B2 (en) Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
JP2003259480A (ja) ハウリング検出装置
JPWO2013054459A1 (ja) ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路
JP6276132B2 (ja) 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
JP4548953B2 (ja) 音声自動利得制御装置、音声自動利得制御方法、音声自動利得制御用のアルゴリズムを持つコンピュータプログラムを格納する記憶媒体及び音声自動利得制御用のアルゴリズムを持つコンピュータプログラム
JP2010251937A (ja) 音声処理装置
JP2000081900A (ja) 収音方法、その装置及びプログラム記録媒体
JP6481397B2 (ja) マイクロホン間隔制御装置及びプログラム
JP5076974B2 (ja) 音処理装置およびプログラム
JP2005257805A (ja) 周期性ノイズ抑圧方法、周期性ノイズ抑圧装置、周期性ノイズ抑圧プログラム
JP6644213B1 (ja) 音響信号処理装置、音響システム、音響信号処理方法、及び音響信号処理プログラム
US20210174820A1 (en) Signal processing apparatus, voice speech communication terminal, signal processing method, and signal processing program
US10360922B2 (en) Noise reduction device and method for reducing noise
JP4003580B2 (ja) 振動波判定装置