JP3862685B2 - 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム - Google Patents
音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP3862685B2 JP3862685B2 JP2003306779A JP2003306779A JP3862685B2 JP 3862685 B2 JP3862685 B2 JP 3862685B2 JP 2003306779 A JP2003306779 A JP 2003306779A JP 2003306779 A JP2003306779 A JP 2003306779A JP 3862685 B2 JP3862685 B2 JP 3862685B2
- Authority
- JP
- Japan
- Prior art keywords
- correlation
- signal
- time delay
- sampling
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
本発明の実施の形態にかかる時間遅延推定装置について説明するに先立ち、どのような原理で二つのマイクロフォンでサンプリングされた信号の間の遅延を推定するかについて説明する。この推定時間遅延を用いて、DOAを高精度で推定することが可能になる。
後に述べる実施の形態では、時間遅延を推定する際に線形予測(LP)を使用する。受信されたサンプルの一ブロック(通常は30ミリ秒程度のウィンドウで切出されたデータ)を用いてLPの予測式をたてる。
‐構成‐
図3に、本実施の形態の時間遅延推定装置の構成を示す。図3を参照して、本実施の形態に係る時間遅延推定装置30は、マイクロフォン22A及び22Bからそれぞれ入力される第1及び第2のチャンネルの信号x1及びx2に対するフレームデータを所定の周波数でサンプリングするためのフレームサンプリング部40と、サンプリングされた各フレームのデータを記憶するフレームメモリ42と、フレームメモリ42に記憶されたフレームデータに基づいて、前述した自己相関及び相互相関を算出するための相関算出部44と、相関算出部44により算出された相関行列を記憶するための相関記憶部46とを含む。
第1の実施の形態に係る時間遅延推定装置30は以下の様に動作する。フレームサンプリング部40が、マイクロフォン22A及び22Bの出力の各々を所定のサンプリングレートでサンプリングし、それぞれのフレームデータを作成する。フレームメモリ42が、フレームサンプリング部40のサンプリングした第1及び第2のチャンネルのフレームデータを記憶する。
第1の実施の形態の時間遅延推定装置30は、自己相関及び相互相関を時間領域で計算している。しかし、この相関は、周波数領域で算出してから時間領域に戻すことにより求めるのが一般的である。第2の実施の形態では、相関を周波数領域で算出する。
上記した第1の実施の形態に係る時間遅延推定装置30をコンピュータ及びその上で動作するソフトウェアにより実現して、以下の実験を行なった。まず、前述した通り音声信号は平面波として到来すると仮定して、二つのマイクロフォンで受信される第1及び第2の信号間の時間遅延のみを考慮して作成した。これら信号を用い、上記した第1の実施の形態の時間遅延推定装置30によって時間遅延を推定した。音声信号としては、公知の、容易に入手できる音声データベースに含まれる、連続する数字列に対する発声データを用いた。
第1の実験では、10桁の数字の発声サンプルにつき、無音(雑音のみ)のフレーム部分を削除して二つのマイクロフォンに異なる無相関ノイズを加えて実験を行なった。このノイズは、機械により発生させた、互いに独立なランダムなガウス分布に従うサンプルである。SNR(Signal−to−Noise Ratio)は20dBに設定した。13個の係数のLPフィルタを使用した。
第2の実験では、各チャンネルに加えられる独立なホワイトノイズに対する、上記したアルゴリズム中で使用した長さのパラメータΔの影響を調査した。図9に示す様に、Δとして13から29までの種々の長さのものを使用して実験を行なった。
第3の実験では、種々のタイプのノイズを種々のSIR(Signal−to−Interference Ratio)で加えた場合の、上記したアルゴリズムの頑健性を調査した。ノイズのDOAは、中央から見て50度左側(反時計回り)に固定し、音源のDOAは中央から右側(時計回り)に0度から90度まで変化させた。
Claims (13)
- 互いに既知の間隔だけ離れた第1及び第2の位置において観測される、同一の音源からの音波からそれぞれ生成される第1及び第2の二つの音声信号を受け、当該二つの音声信号から音源の方向を推定するための音源方向推定装置であって、
前記二つの音声信号から同一のサンプリング周期で所定数の音声信号サンプルをそれぞれサンプリングするためのサンプリング手段と、
前記サンプリング手段により、前記第1及び第2の音声信号からサンプリングされた音声信号サンプルの間の相互相関、及び前記第1の音声信号からサンプリングされた音声信号サンプルの自己相関を算出するための相関算出手段と、
前記相関算出手段により算出された前記相互相関及び前記自己相関に基づいて、前記第2の音声信号からサンプリングされた音声信号サンプルを、前記第1の音声信号からサンプリングされた音声信号サンプルの線形和で表すための線形予測係数を推定するための線形予測係数推定手段と、
前記線形予測係数推定手段により推定された線形予測係数を、サンプリング時間に対応付けてプロットし、当該プロットされた点列を、所定の位置にピークを有する所定の波形で近似し補間するための近似手段と、
前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置に基づき、前記第1の音声信号からサンプリングされた音声信号サンプルと前記第2の音声信号からサンプリングされた音声信号サンプルとの間の時間遅延を推定するための時間遅延推定手段と、
前記時間遅延推定手段により推定された時間遅延、前記既知の間隔、及び既知の音速に基づいて前記第1の位置から前記音源への方向角を算出するための方向角算出手段とを含む、音源方向推定装置。 - 前記所定の波形はsinc関数の波形である、請求項1に記載の音源方向推定装置。
- 前記時間遅延推定手段は、前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置を、前記サンプリング周期よりも小さな所定の単位で決定するためのピーク位置決定手段を含む、請求項1〜請求項3のいずれかに記載の音源方向推定装置。
- 前記相関算出手段は、
前記サンプリング手段により、前記第1及び第2の音声信号からサンプリングされた音声信号サンプルに対し所定の直交変換を行なうための直交変換手段と、
前記直交変換手段により変換された前記音声信号サンプルの間の相互相関、及び前記第1の音声信号からサンプリングされた音声信号サンプルの自己相関を算出するための変換後サンプルの相関算出手段と、
前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を、前記所定の直交変換の逆変換を行なうことにより時間領域に戻すための直交逆変換手段とを含む、請求項1〜請求項4のいずれかに記載の音源方向推定装置。 - 前記直交変換手段は、前記サンプリング手段により、前記第1及び第2の音声信号からサンプリングされた音声信号サンプルに対しフーリエ変換を行なうためのフーリエ変換手段を含み、
前記直交逆変換手段は、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関に逆フーリエ変換を行なうことにより、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を時間領域に戻すための逆フーリエ変換手段を含む、請求項5に記載の音源方向推定装置。 - 外部から音声信号を受けるための手段を備えたコンピュータにより実行されると、当該コンピュータを請求項1〜請求項6のいずれかに記載の音源方向推定装置として動作させる、コンピュータプログラム。
- 互いに既知の間隔だけ離れた第1及び第2の位置で観測される、同一の信号源からの観測対象信号の間の遅延時間を推定するための信号の時間遅延推定装置であって、
前記第1及び第2の位置でそれぞれ観測された前記観測対象信号からそれぞれ生成される、第1及び第2の二つの信号を受け、同一のサンプリング周期で所定数の信号サンプルをそれぞれサンプリングするためのサンプリング手段と、
前記サンプリング手段により、前記第1及び第2の信号からサンプリングされた信号サンプルの間の相互相関、及び前記第1の信号からサンプリングされた信号サンプルの自己相関を算出するための相関算出手段と、
前記相関算出手段により算出された前記相互相関及び前記自己相関に基づいて、前記第2の信号からサンプリングされた信号サンプルを、前記第1の信号からサンプリングされた信号サンプルの線形和で表すための線形予測係数を推定するための線形予測係数推定手段と、
前記線形予測係数推定手段により推定された線形予測係数を、サンプリング時間に対応付けてプロットし、当該プロットされた点列を、所定の位置にピークを有する所定の波形で近似し補間するための近似手段と、
前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置に基づき、前記第1の信号をサンプリングして得られた信号サンプルと前記第2の信号をサンプリングして得られた信号サンプルとの間の時間遅延を推定するための時間遅延推定手段とを含む、信号の時間遅延推定装置。 - 前記所定の波形はsinc関数の波形である、請求項8に記載の信号の時間遅延推定装置。
- 前記時間遅延推定手段は、前記近似手段による近似で得られた前記所定の波形のピーク位置に対応するサンプリング時間軸上の位置を、前記サンプリング周期よりも小さな所定の単位で決定するためのピーク位置決定手段を含む、請求項8又は請求項9に記載の信号の時間遅延推定装置。
- 前記相関算出手段は、
前記サンプリング手段により、前記第1及び第2の信号からサンプリングされた信号サンプルに対し所定の直交変換を行なうための直交変換手段と、
前記直交変換手段により変換された前記信号サンプルの間の相互相関、及び前記第1の信号からサンプリングされた信号サンプルの自己相関を算出するための変換後サンプルの相関算出手段と、
前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を、前記所定の直交変換の逆変換を行なうことにより時間領域に戻すための直交逆変換手段とを含む、請求項8〜請求項10のいずれかに記載の信号の時間遅延推定装置。 - 前記直交変換手段は、前記サンプリング手段により、前記第1及び第2の信号からサンプリングされた信号サンプルに対しフーリエ変換を行なうためのフーリエ変換手段を含み、
前記直交逆変換手段は、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関に逆フーリエ変換を行なうことにより、前記変換後サンプルの相関算出手段により算出された相互相関及び自己相関を時間領域に戻すための逆フーリエ変換手段を含む、請求項11に記載の信号の時間遅延推定装置。 - 第1及び第2の位置でそれぞれ観測された観測対象信号からそれぞれ生成される第1及び第2の二つの信号を受けるための手段を備えたコンピュータにより実行されると、当該コンピュータを請求項8〜請求項12のいずれかに記載の信号の時間遅延推定装置として動作させる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003306779A JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003306779A JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005077205A JP2005077205A (ja) | 2005-03-24 |
JP3862685B2 true JP3862685B2 (ja) | 2006-12-27 |
Family
ID=34409769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003306779A Expired - Fee Related JP3862685B2 (ja) | 2003-08-29 | 2003-08-29 | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3862685B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5070873B2 (ja) | 2006-08-09 | 2012-11-14 | 富士通株式会社 | 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム |
JP5195652B2 (ja) | 2008-06-11 | 2013-05-08 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
JP5617133B2 (ja) * | 2008-11-05 | 2014-11-05 | ヒア アイピー ピーティーワイ リミテッド | 指向性出力信号の生成システムおよび方法 |
JP5647814B2 (ja) * | 2010-05-19 | 2015-01-07 | 日本電産エレシス株式会社 | 電子走査型レーダ装置、受信波方向推定方法及び受信波方向推定プログラム |
US9435873B2 (en) * | 2011-07-14 | 2016-09-06 | Microsoft Technology Licensing, Llc | Sound source localization using phase spectrum |
KR101342540B1 (ko) | 2012-04-09 | 2014-01-10 | 주식회사 센서웨이 | 교차 상관 연산에 기초한 시간 지연 추정 방법 및 그 장치 |
JP6165046B2 (ja) * | 2013-12-18 | 2017-07-19 | 一般財団法人電力中央研究所 | 音源位置の推定方法、推定装置及び推定プログラム |
CN111863017B (zh) * | 2020-07-20 | 2024-06-18 | 上海汽车集团股份有限公司 | 一种基于双麦克风阵列的车内定向拾音方法及相关装置 |
CN117220802A (zh) * | 2023-10-10 | 2023-12-12 | 白盒子(上海)微电子科技有限公司 | 一种用于5g低采样率场景的时延估计方法和装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08313659A (ja) * | 1995-05-16 | 1996-11-29 | Atr Ningen Joho Tsushin Kenkyusho:Kk | 信号時間差検出装置 |
JP3541339B2 (ja) * | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
JP2982766B2 (ja) * | 1997-11-05 | 1999-11-29 | 日本電気株式会社 | 音源方向推定方法及びその装置 |
JPH11304906A (ja) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | 音源位置推定方法およびそのプログラムを記録した記録媒体 |
JP3598932B2 (ja) * | 2000-02-23 | 2004-12-08 | 日本電気株式会社 | 話者方向検出回路及びそれに用いる話者方向検出方法 |
JP3528808B2 (ja) * | 2001-04-03 | 2004-05-24 | 日本電気株式会社 | 相互相関関数計算方法および装置 |
JP2002315089A (ja) * | 2001-04-19 | 2002-10-25 | Nec Eng Ltd | 話者方向検出回路 |
JP3778865B2 (ja) * | 2001-12-20 | 2006-05-24 | 富士通株式会社 | 波動信号処理システム |
JP2003271189A (ja) * | 2002-03-14 | 2003-09-25 | Nef:Kk | 話者方向検出回路及びその検出方法 |
JP2004109712A (ja) * | 2002-09-20 | 2004-04-08 | Nec Engineering Ltd | 話者方向検出装置 |
-
2003
- 2003-08-29 JP JP2003306779A patent/JP3862685B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005077205A (ja) | 2005-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10334357B2 (en) | Machine learning based sound field analysis | |
US9984702B2 (en) | Extraction of reverberant sound using microphone arrays | |
RU2570359C2 (ru) | Прием звука посредством выделения геометрической информации из оценок направления его поступления | |
RU2642353C2 (ru) | Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи | |
JP5814476B2 (ja) | 空間パワー密度に基づくマイクロフォン位置決め装置および方法 | |
US9291697B2 (en) | Systems, methods, and apparatus for spatially directive filtering | |
RU2596592C2 (ru) | Пространственный аудио процессор и способ обеспечения пространственных параметров на основе акустического входного сигнала | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
Jensen et al. | Nonlinear least squares methods for joint DOA and pitch estimation | |
CN103181190A (zh) | 用于远场多源追踪和分离的系统、方法、设备和计算机可读媒体 | |
JP2010517047A (ja) | マルチセンサ音源定位 | |
TW200904226A (en) | Enhanced beamforming for arrays of directional microphones | |
CN103339961A (zh) | 用于通过声波三角测量进行空间性选择声音获取的装置及方法 | |
JP2006194700A (ja) | 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム | |
Gaubitch et al. | Statistical analysis of the autoregressive modeling of reverberant speech | |
JP3862685B2 (ja) | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム | |
CN103890843A (zh) | 信号噪声衰减 | |
Bohlender et al. | Least-squares DOA estimation with an informed phase unwrapping and full bandwidth robustness | |
CN118591737A (zh) | 定位移动声源 | |
JP2013175869A (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP5698166B2 (ja) | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
Jarrett et al. | Eigenbeam-based acoustic source tracking in noisy reverberant environments | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
Lübeck et al. | A Real-Time Application for Sound Source Localization Inside a Spherical Microphone Array | |
Dmochowski et al. | The generalization of narrowband localization methods to broadband environments via parametrization of the spatial correlation matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Effective date: 20060327 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060613 |
|
A521 | Written amendment |
Effective date: 20060714 Free format text: JAPANESE INTERMEDIATE CODE: A523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060926 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 3 Free format text: PAYMENT UNTIL: 20091006 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101006 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |