JP2005077205A - 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム - Google Patents
音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2005077205A JP2005077205A JP2003306779A JP2003306779A JP2005077205A JP 2005077205 A JP2005077205 A JP 2005077205A JP 2003306779 A JP2003306779 A JP 2003306779A JP 2003306779 A JP2003306779 A JP 2003306779A JP 2005077205 A JP2005077205 A JP 2005077205A
- Authority
- JP
- Japan
- Prior art keywords
- correlation
- time delay
- sampling
- signal
- estimating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】音源方向推定装置30は、第1及び第2の位置で同一のサンプリング周期で音声信号のフレームデータをサンプリングするサンプリング部40と、これらサンプルの間の相互相関、及び第1の位置でのサンプルの自己相関を算出する相関算出部44と、この相互相関及び自己相関に基づいて、第2の位置でのサンプルを、第1の位置でのサンプルの線形和で表すための線形予測係数を推定するフィルタ係数計算部48と、この線形予測係数を、所定の位置にピークを有する所定の波形で近似し補間する補間処理部52と、得られた波形のピーク位置に基づき第1の位置と第2の位置での音声信号サンプルの時間遅延を推定するピーク決定部54とを含む。
【選択図】 図3
Description
本発明の実施の形態にかかる時間遅延推定装置について説明するに先立ち、どのような原理で二つのマイクロフォンでサンプリングされた信号の間の遅延を推定するかについて説明する。この推定時間遅延を用いて、DOAを高精度で推定することが可能になる。
後に述べる実施の形態では、時間遅延を推定する際に線形予測(LP)を使用する。受信されたサンプルの一ブロック(通常は30ミリ秒程度のウィンドウで切出されたデータ)を用いてLPの予測式をたてる。
‐構成‐
図3に、本実施の形態の時間遅延推定装置の構成を示す。図3を参照して、本実施の形態に係る時間遅延推定装置30は、マイクロフォン22A及び22Bからそれぞれ入力される第1及び第2のチャンネルの信号x1及びx2に対するフレームデータを所定の周波数でサンプリングするためのフレームサンプリング部40と、サンプリングされた各フレームのデータを記憶するフレームメモリ42と、フレームメモリ42に記憶されたフレームデータに基づいて、前述した自己相関及び相互相関を算出するための相関算出部44と、相関算出部44により算出された相関行列を記憶するための相関記憶部46とを含む。
第1の実施の形態に係る時間遅延推定装置30は以下の様に動作する。フレームサンプリング部40が、マイクロフォン22A及び22Bの出力の各々を所定のサンプリングレートでサンプリングし、それぞれのフレームデータを作成する。フレームメモリ42が、フレームサンプリング部40のサンプリングした第1及び第2のチャンネルのフレームデータを記憶する。
第1の実施の形態の時間遅延推定装置30は、自己相関及び相互相関を時間領域で計算している。しかし、この相関は、周波数領域で算出してから時間領域に戻すことにより求めるのが一般的である。第2の実施の形態では、相関を周波数領域で算出する。
上記した第1の実施の形態に係る時間遅延推定装置30をコンピュータ及びその上で動作するソフトウェアにより実現して、以下の実験を行なった。まず、前述した通り音声信号は平面波として到来すると仮定して、二つのマイクロフォンで受信される第1及び第2の信号間の時間遅延のみを考慮して作成した。これら信号を用い、上記した第1の実施の形態の時間遅延推定装置30によって時間遅延を推定した。音声信号としては、公知の、容易に入手できる音声データベースに含まれる、連続する数字列に対する発声データを用いた。
第1の実験では、10桁の数字の発声サンプルにつき、無音(雑音のみ)のフレーム部分を削除して二つのマイクロフォンに異なる無相関ノイズを加えて実験を行なった。このノイズは、機械により発生させた、互いに独立なランダムなガウス分布に従うサンプルである。SNR(Signal−to−Noise Ratio)は20dBに設定した。13個の係数のLPフィルタを使用した。
第2の実験では、各チャンネルに加えられる独立なホワイトノイズに対する、上記したアルゴリズム中で使用した長さのパラメータΔの影響を調査した。図9に示す様に、Δとして13から29までの種々の長さのものを使用して実験を行なった。
第3の実験では、種々のタイプのノイズを種々のSIR(Signal−to−Interference Ratio)で加えた場合の、上記したアルゴリズムの頑健性を調査した。ノイズのDOAは、中央から見て50度左側(反時計回り)に固定し、音源のDOAは中央から右側(時計回り)に0度から90度まで変化させた。
Claims (13)
- 音源の方向を推定するための音源方向推定装置であって、
互いに既知の間隔だけ離れた第1及び第2の位置において、同一のサンプリング周期で所定数の音声信号サンプルをサンプリングするためのサンプリング手段と、
前記サンプリング手段によりサンプリングされた、第1及び第2の位置における音声信号サンプルの間の相互相関、及び前記第1の位置における音声信号サンプルの自己相関を算出するための相関算出手段と、
前記相関算出手段により算出された前記相互相関及び前記自己相関に基づいて、前記第2の位置においてサンプリングされた音声信号サンプルを、前記第1の位置においてサンプリングされた音声信号の線形和で表すための線形予測係数を推定するための線形予測係数推定手段と、
前記線形予測係数推定手段により推定された線形予測係数を、サンプリング時間に対応付けてプロットし、当該プロットされた点列を、所定の位置にピークを有する所定の波形で近似し補間するための近似手段と、
前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置に基づき、前記第1の位置での音声信号サンプルと前記第2の位置での音声信号サンプルとの間の時間遅延を推定するための時間遅延推定手段と、
前記時間遅延推定手段により推定された時間遅延、前記既知の間隔、及び既知の音速に基づいて前記第1の位置から前記音源への方向角を算出するための方向角算出手段とを含む、音源方向推定装置。 - 前記所定の波形はsinc関数の波形である、請求項1に記載の音源方向推定装置。
- 前記時間遅延推定手段は、前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置を、前記サンプリング周期よりも小さな所定の単位で決定するためのピーク位置決定手段を含む、請求項1〜請求項3のいずれかに記載の音源方向推定装置。
- 前記相関算出手段は、
前記サンプリング手段によりサンプリングされた、第1及び第2の位置における音声信号サンプルに対し所定の直交変換を行なうための直交変換手段と、
前記直交変換手段により変換された前記音声信号サンプルの間の相互相関、及び前記第1の位置における音声信号サンプルの自己相関を算出するための変換後サンプルの相関算出手段と、
前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を、前記所定の直交変換の逆変換を行なうことにより時間領域に戻すための直交逆変換手段とを含む、請求項1〜請求項4のいずれかに記載の音源方向推定装置。 - 前記直交変換手段は、前記サンプリング手段によりサンプリングされた、第1及び第2の位置における音声信号サンプルに対しフーリエ変換を行なうためのフーリエ変換手段を含み、
前記直交逆変換手段は、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関に逆フーリエ変換を行なうことにより、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を時間領域に戻すための逆フーリエ変換手段を含む、請求項5に記載の音源方向推定装置。 - コンピュータにより実行されると、当該コンピュータを請求項1〜請求項6のいずれかに記載の音源方向推定装置として動作させる、コンピュータプログラム。
- 第1及び第2の位置で観測される、同一の信号源からの信号の間の遅延時間を推定するための信号の時間遅延推定装置であって、
互いに既知の間隔だけ離れた第1及び第2の位置において、前記信号に対し同一のサンプリング周期で所定数の信号サンプルをサンプリングするためのサンプリング手段と、
前記サンプリング手段によりサンプリングされた、第1及び第2の位置における信号サンプルの間の相互相関、及び前記第1の位置における信号サンプルの自己相関を算出するための相関算出手段と、
前記相関算出手段により算出された前記相互相関及び前記自己相関に基づいて、前記第2の位置においてサンプリングされた信号サンプルを、前記第1の位置においてサンプリングされた信号の線形和で表すための線形予測係数を推定するための線形予測係数推定手段と、
前記線形予測係数推定手段により推定された線形予測係数を、所定の位置にピークを有する所定の波形で近似し補間するための近似手段と、
前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置に基づき、前記第1の位置での信号サンプルと前記第2の位置での信号サンプルとの間の時間遅延を推定するための時間遅延推定手段とを含む、信号の時間遅延推定装置。 - 前記所定の波形はsinc関数の波形である、請求項8に記載の信号の時間遅延推定装置。
- 前記時間遅延推定手段は、前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置を、前記サンプリング周期よりも小さな所定の単位で決定するためのピーク位置決定手段を含む、請求項8又は請求項9に記載の信号の時間遅延推定装置。
- 前記相関算出手段は、
前記サンプリング手段によりサンプリングされた、第1及び第2の位置における信号サンプルに対し所定の直交変換を行なうための直交変換手段と、
前記直交変換手段により変換された前記信号サンプルの間の相互相関、及び前記第1の位置における信号サンプルの自己相関を算出するための変換後サンプルの相関算出手段と、
前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を、前記所定の直交変換の逆変換を行なうことにより時間領域に戻すための直交逆変換手段とを含む、請求項8〜請求項10のいずれかに記載の信号の時間遅延推定装置。 - 前記直交変換手段は、前記サンプリング手段によりサンプリングされた、第1及び第2の位置における信号サンプルに対しフーリエ変換を行なうためのフーリエ変換手段を含み、
前記直交逆変換手段は、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関に逆フーリエ変換を行なうことにより、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を時間領域に戻すための逆フーリエ変換手段を含む、請求項11に記載の信号の時間遅延推定装置。 - コンピュータにより実行されると、当該コンピュータを請求項8〜請求項12のいずれかに記載の信号の時間遅延推定装置として動作させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003306779A JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003306779A JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005077205A true JP2005077205A (ja) | 2005-03-24 |
JP3862685B2 JP3862685B2 (ja) | 2006-12-27 |
Family
ID=34409769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003306779A Expired - Fee Related JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3862685B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100883712B1 (ko) | 2006-08-09 | 2009-02-12 | 후지쯔 가부시끼가이샤 | 음원 방향 추정 방법, 및 음원 방향 추정 장치 |
EP2133707A2 (en) | 2008-06-11 | 2009-12-16 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
JP2011242288A (ja) * | 2010-05-19 | 2011-12-01 | Honda Elesys Co Ltd | 電子走査型レーダ装置、受信波方向推定方法及び受信波方向推定プログラム |
JP2013512588A (ja) * | 2008-11-05 | 2013-04-11 | ヒア アイピー ピーティーワイ リミテッド | 指向性出力信号の生成システムおよび方法 |
KR101342540B1 (ko) | 2012-04-09 | 2014-01-10 | 주식회사 센서웨이 | 교차 상관 연산에 기초한 시간 지연 추정 방법 및 그 장치 |
JP2014525037A (ja) * | 2011-07-14 | 2014-09-25 | マイクロソフト コーポレーション | 位相スペクトルを使った音源定位 |
JP2015118004A (ja) * | 2013-12-18 | 2015-06-25 | 一般財団法人電力中央研究所 | 音源位置の推定方法、推定装置及び推定プログラム |
CN111863017A (zh) * | 2020-07-20 | 2020-10-30 | 上海汽车集团股份有限公司 | 一种基于双麦克风阵列的车内定向拾音方法及相关装置 |
CN117220802A (zh) * | 2023-10-10 | 2023-12-12 | 白盒子(上海)微电子科技有限公司 | 一种用于5g低采样率场景的时延估计方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08313659A (ja) * | 1995-05-16 | 1996-11-29 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 信号時間差検出装置 |
JPH1118194A (ja) * | 1997-06-26 | 1999-01-22 | Fujitsu Ltd | マイクロホンアレイ装置 |
JPH11142499A (ja) * | 1997-11-05 | 1999-05-28 | Nec Corp | 音源方向推定方法及びその装置 |
JPH11304906A (ja) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 音源位置推定方法およびそのプログラムを記録した記録媒体 |
JP2001236092A (ja) * | 2000-02-23 | 2001-08-31 | Nec Corp | 話者方向検出回路及びそれに用いる話者方向検出方法 |
JP2002303669A (ja) * | 2001-04-03 | 2002-10-18 | Nec Corp | 相互相関関数計算方法および装置 |
JP2002315089A (ja) * | 2001-04-19 | 2002-10-25 | Nec Eng Ltd | 話者方向検出回路 |
JP2003248042A (ja) * | 2001-12-20 | 2003-09-05 | Fujitsu Ltd | 波動信号処理システム |
JP2003271189A (ja) * | 2002-03-14 | 2003-09-25 | Nef:Kk | 話者方向検出回路及びその検出方法 |
JP2004109712A (ja) * | 2002-09-20 | 2004-04-08 | Nec Engineering Ltd | 話者方向検出装置 |
-
2003
- 2003-08-29 JP JP2003306779A patent/JP3862685B2/ja not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08313659A (ja) * | 1995-05-16 | 1996-11-29 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 信号時間差検出装置 |
JPH1118194A (ja) * | 1997-06-26 | 1999-01-22 | Fujitsu Ltd | マイクロホンアレイ装置 |
JPH11142499A (ja) * | 1997-11-05 | 1999-05-28 | Nec Corp | 音源方向推定方法及びその装置 |
JPH11304906A (ja) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 音源位置推定方法およびそのプログラムを記録した記録媒体 |
JP2001236092A (ja) * | 2000-02-23 | 2001-08-31 | Nec Corp | 話者方向検出回路及びそれに用いる話者方向検出方法 |
JP2002303669A (ja) * | 2001-04-03 | 2002-10-18 | Nec Corp | 相互相関関数計算方法および装置 |
JP2002315089A (ja) * | 2001-04-19 | 2002-10-25 | Nec Eng Ltd | 話者方向検出回路 |
JP2003248042A (ja) * | 2001-12-20 | 2003-09-05 | Fujitsu Ltd | 波動信号処理システム |
JP2003271189A (ja) * | 2002-03-14 | 2003-09-25 | Nef:Kk | 話者方向検出回路及びその検出方法 |
JP2004109712A (ja) * | 2002-09-20 | 2004-04-08 | Nec Engineering Ltd | 話者方向検出装置 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100883712B1 (ko) | 2006-08-09 | 2009-02-12 | 후지쯔 가부시끼가이샤 | 음원 방향 추정 방법, 및 음원 방향 추정 장치 |
EP2133707A2 (en) | 2008-06-11 | 2009-12-16 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
US8358563B2 (en) | 2008-06-11 | 2013-01-22 | Sony Corporation | Signal processing apparatus, signal processing method, and program |
JP2013512588A (ja) * | 2008-11-05 | 2013-04-11 | ヒア アイピー ピーティーワイ リミテッド | 指向性出力信号の生成システムおよび方法 |
JP2011242288A (ja) * | 2010-05-19 | 2011-12-01 | Honda Elesys Co Ltd | 電子走査型レーダ装置、受信波方向推定方法及び受信波方向推定プログラム |
JP2014525037A (ja) * | 2011-07-14 | 2014-09-25 | マイクロソフト コーポレーション | 位相スペクトルを使った音源定位 |
US9817100B2 (en) | 2011-07-14 | 2017-11-14 | Microsoft Technology Licensing, Llc | Sound source localization using phase spectrum |
KR101342540B1 (ko) | 2012-04-09 | 2014-01-10 | 주식회사 센서웨이 | 교차 상관 연산에 기초한 시간 지연 추정 방법 및 그 장치 |
JP2015118004A (ja) * | 2013-12-18 | 2015-06-25 | 一般財団法人電力中央研究所 | 音源位置の推定方法、推定装置及び推定プログラム |
CN111863017A (zh) * | 2020-07-20 | 2020-10-30 | 上海汽车集团股份有限公司 | 一种基于双麦克风阵列的车内定向拾音方法及相关装置 |
CN117220802A (zh) * | 2023-10-10 | 2023-12-12 | 白盒子(上海)微电子科技有限公司 | 一种用于5g低采样率场景的时延估计方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3862685B2 (ja) | 2006-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9984702B2 (en) | Extraction of reverberant sound using microphone arrays | |
US10334357B2 (en) | Machine learning based sound field analysis | |
US10123113B2 (en) | Selective audio source enhancement | |
RU2570359C2 (ru) | Прием звука посредством выделения геометрической информации из оценок направления его поступления | |
JP5814476B2 (ja) | 空間パワー密度に基づくマイクロフォン位置決め装置および方法 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
Jensen et al. | Nonlinear least squares methods for joint DOA and pitch estimation | |
US20110274289A1 (en) | Sensor array beamformer post-processor | |
JP2008079256A (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
CN103181190A (zh) | 用于远场多源追踪和分离的系统、方法、设备和计算机可读媒体 | |
JP2006194700A (ja) | 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム | |
Gaubitch et al. | Statistical analysis of the autoregressive modeling of reverberant speech | |
JP3862685B2 (ja) | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム | |
JP2007006253A (ja) | 信号処理装置、マイクロフォンシステム、話者方向検出方法及び話者方向検出プログラム | |
Rosseel et al. | Improved acoustic source localization by time delay estimation with subsample accuracy | |
Bohlender et al. | Least-squares DOA estimation with an informed phase unwrapping and full bandwidth robustness | |
JP5698166B2 (ja) | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP2013175869A (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
Drude et al. | DOA-estimation based on a complex Watson kernel method | |
Garcia-Barrios et al. | Exploiting spatial diversity for increasing the robustness of sound source localization systems against reverberation | |
Jarrett et al. | Eigenbeam-based acoustic source tracking in noisy reverberant environments | |
Firoozabadi et al. | Combination of nested microphone array and subband processing for multiple simultaneous speaker localization | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
Lübeck et al. | A Real-Time Application for Sound Source Localization Inside a Spherical Microphone Array | |
Dmochowski et al. | The generalization of narrowband localization methods to broadband environments via parametrization of the spatial correlation matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060613 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060926 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091006 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101006 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |