JP4894638B2 - 音響入力装置 - Google Patents
音響入力装置 Download PDFInfo
- Publication number
- JP4894638B2 JP4894638B2 JP2007149570A JP2007149570A JP4894638B2 JP 4894638 B2 JP4894638 B2 JP 4894638B2 JP 2007149570 A JP2007149570 A JP 2007149570A JP 2007149570 A JP2007149570 A JP 2007149570A JP 4894638 B2 JP4894638 B2 JP 4894638B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound pressure
- differential value
- target speaker
- dead point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本実施形態の音響入力装置は、図1に示すように音圧、当該音圧の時間微分値、当該音圧を二次元直交座標系の各軸方向に微分した空間微分値をそれぞれ検出する集音センサ手段1と、集音センサ手段1で検出される音圧、時間微分値、空間微分値に対して所定の係数ベクトルとの荷重和及び低域通過フィルタ処理を行うことにより集音感度が最小となる死点を予め設定した目的話者の位置に形成する死点形成手段2と、集音センサ手段1で検出される音圧と死点形成手段2から出力される音圧を用いて前記死点に存在する音源(話者)から発せられる音の音圧のみを抽出する目的話者音声抽出手段3とを備えている。
Mt(t)=dfA(t)/dt+dfB(t)/dt+dfC(t)/dt+dfD(t)/dt
Mx(t)=fA(t)+fB(t)−fC(t)−fD(t)
My(t)=fA(t)−fB(t)+fC(t)−fD(t)
死点形成手段2は、集音センサ手段1から出力される同相成分M(t)、時間微分値Mt(t)、x軸方向空間微分値Mx(t)、y軸方向空間微分値My(t)を用いて、時空間勾配法を応用することで死点を形成するものである。ここで、死点形成手段2による死点形成処理を説明するに当たって、初めに時空間勾配法について詳しく説明する。
f(x+δx,y+δy,t+δt)=f(x,y,t)+fxδx+fyδy+ftδt+O(δx+δy+δt) …(1)
となる。ここで、O(δx+δy+δt)はδx,δy,δtの2次以上の項であるが、微小量であるために以降では無視する。この時、時刻tにおいて座標(x,y)にある濃淡パターンが、δt時刻経過した後に座標(x+δx,y+δy)にその濃度値分布を一定に保ったまま移動した時、その対応付けから次式が成り立つ。
=f(x,y,t)+fxδx+fyδy+ftδt …(2)
fxδx+fyδy+ftδt=0 …(3)
式(3)の両辺をδtで割ると、
fxδx/δt+fyδy/δt+ft=0 …(4)
を得る。ここで、δtが無限小であると仮定して、δt→0とすると次式を得る。
オプティカルフロー速度v=(u,v)=(dx/dt,dy/dt)を用いると、式(5)は、
ufx+vfy+ft=0 …(6)
となり、式(6)は動画像の濃淡値の時間、空間に関する勾配とオプティカルフロー速度vとを関係付ける式である。
uSxx+vSxy+Sxt=0,uSxy+vSyy+Syt=0 …(8)
u=(SytSxy-SxtSyy)/(SxxSyy-S2 xy),v=(SxtSxy-SytSxx)/(SxxSyy-S2 xy) …(10)
のように求められる。
ξi x=xi/R2 i,ξi y=yi/R2 i …(15)
は強度勾配と呼ばれ、
τi x=xi/cRi,τi y=yi/cRi …(16)
はx,y方向時間勾配と呼ばれる。
fx=-ξxf-τxft,fy=-ξyf-τyft …(17)
となり、式(1)と同様に最小自乗法を適用してτx,τy,ξx,ξyを求める。短時間の時間窓Γにおいて評価関数を
J=∫Γ{(fx+ξxf+τxft)2+(fy+ξyf+τyft)2}dt …(18)
とする。式(18)をτx,τy,ξx,ξyに関して偏微分し、0とおくと下式が得られる。
∂J/∂ξx=∫Γ2(fx+ξxf+τxft)・ftdt=0,∂J/∂ξy=∫Γ2(fy+ξyf+τyft)・ftdt=0 …(20)
ここで、観測窓Γから推定される共分散行列を
Sxt+ξxSt+τxStt=0,Syt+ξySt+τyStt=0 …(22)
Sx+ξxS+τxSt=0,Sy+ξyS+τySt=0 …(23)
と書き直される。式(22),(23)を解くことにより、τx,τy,ξx,ξyが次式のように求められる。
ξx=(SxtSt-SxStt)/(SStt-S2 t),ξy=(SytSt-SyStt)/(SStt-S2 t) …(25)
音源の方位角(x/R,y/R)=(cτx,cτy)については式(21),(24)から求められる。音源までの距離Rについては、式(15),(16)から最小自乗法を適用することにより求められる。評価関数を
R=c(τ2 x+τ2 y)/(τxξx+τyξy) …(28)
のように音源までの距離が求められる。
r・w=0 …(42)
となる。また、Ht(r)=αの時には式(34)は
1)2つの指向特性H(r),Ht(r)はwを軸とする回転対称体をもつ
2)H(r)=0の時、rの分布は直径1/u(u≠0)の球面または平面(u=0)を成す
3)Ht(r)=0の時、rの分布は頂角2cut(ut≠0)の円錐面または平面(ut=0)を成す
4)H(r)=0とHt(r)=0の時のrの分布の交わりは円または平面を成す
式(32)を周波数領域に変換すると、
T(r,w)=H(r)+jωHt(r) …(47)
となり、H(r),Ht(r)が実数であればT(r,w)=0となる場合には
H(r)=0,Ht(r)=0 …(48)
となる。故に、式(47)からS(ω)=0となる零点分布は、周波数ωに依存せず、音源位置rのみに依存することが分かる。したがって、観測点における音圧の時間勾配とx,y方向の空間勾配が得られる時に、零感度領域(死点)を形成するには、ある瞬間においてf,ft,fx,fyの荷重和を取り、補償フィルタ処理(低域通過フィルタ処理)を施すだけでよい。
本実施形態は、目的話者音声抽出手段3における抽出処理としてスペクトル・サブトラクション法の代わりに独立成分分析の手法を利用する点に特徴があり、その他の構成並びに動作は実施形態1と共通であるから、共通の構成要素には同一の符号を付して図示並びに説明を省略する。
実施形態1,2では目的音の音源(例えば、話者)の位置が既知であることを前提として、当該位置に死点を形成することで音源から発せられる目的音のみを集音している。しかしながら、ドアホン子器のように目的音の音源(来訪者)の位置が一意に定まらない場合も多い。一方、雑音(周囲騒音並びに残響音)が非常に少ない環境下においては、既に説明した時空間勾配法による音源定位の技術を用いて音源の位置を推定することができ、音源の位置が一意に定まらない場合においても、音源の位置を推定して当該位置に死点を形成することで音源から発せられる目的音のみを入力することが可能である。
<参考文献一覧>
参考文献1:安藤 繁 「画像の時空間微分算法を用いた速度ベクトル分布計測システム」 計測自動制御学会論文集 22-12,1330/1336(1986)
参考文献2:安藤 繁・篠田 裕之・小川 勝也・光山 訓 「時空間勾配法に基づく3次元音源定位センサシステム」 計測自動制御学会論文集 第29巻第5号,p520~528,1993
参考文献3:N. Ono, T. Arita, Y. Senjo, and S. Ando, “Directivity steering principle for biomimicry silicon microphone”, Proc. Int. Conf. Solid State Sensors, Actuators, and Microsystems (Transducers '05), pp. 792-795, 2005.
参考文献4:小野, 安藤, “音場の計測と指向性制御, 第22回センシングフォーラム資料, pp. 305-310, 2005.
参考文献5:小野, 有田, 千條, 安藤, “時空間勾配計測に基づく指向性制御と音源分離の理論, 日本音響学会2005年春季研究発表会講演論文集, 2-6-13, pp. 607-608, 2005.
参考文献6:S.F.Boll "Suppression of Acoustic Noise in Speech. using Spectral Subtraction" IEEE Trans.on.Acoustics,Speech and Signal Processing Vol.ASSP-27,No.2,pp.113-1,1979
参考文献7:小野 順貴,斎藤 章人,安藤 繁「ヤドリバエを模倣した超小型音源定位センサの理論と実験(第2報)」,第19回センシングフォーラム,pp.379-382,2002
参考文献8:小野 順貴,斎藤 章人,安藤 繁「ヤドリバエを模倣した微分検出型音源定位センサの理論と実験」,聴覚研究会資料,pp.187-192,2002
2 死点形成手段
3 目的話者音声抽出手段
Claims (7)
- 音圧の同相成分、当該音圧の時間微分値、当該音圧を二次元直交座標系の各軸方向に微分した空間微分値をそれぞれ検出する集音センサ手段と、集音センサ手段で検出される音圧の同相成分、時間微分値、空間微分値を要素とするベクトルを定義し、音圧の同相成分、時間微分値、空間微分値に対する荷重を要素とする係数ベクトルと前記ベクトルとの荷重和を演算した後、この演算結果に対して低域通過フィルタ処理を行うことにより集音感度が最小となる死点を、集音センサ手段から見た方向及び距離が予め設定されている目的話者の位置に形成する死点形成手段と、集音センサ手段で検出される音圧と死点形成手段から出力される音圧を用いて前記目的話者から発せられる音声の音圧のみを抽出する目的話者音声抽出手段とを備えたことを特徴とする音響入力装置。
- 目的話者音声抽出手段は、スペクトル・サブトラクション法によって前記目的話者から発せられる音の音圧を抽出することを特徴とする請求項1記載の音響入力装置。
- 目的話者音声抽出手段は、独立成分分析によって前記目的話者から発せられる音の音圧を抽出することを特徴とする請求項1記載の音響入力装置。
- 目的話者音声抽出手段は、独立成分分析を行う前に主成分分析を行うことを特徴とする請求項3記載の音響入力装置。
- 集音センサ手段は、前記二次元直交座標系の各軸と直交する向きに複数が配置されたマイクロホンを具備することを特徴とする請求項1〜4の何れか1項に記載の音響入力装置。
- 集音センサ手段は、振動板が中央の1点で支持された2軸直交型のジンバル構造を有するマイクロホンを具備することを特徴とする請求項1〜4の何れか1項に記載の音響入力装置。
- 前記目的話者の位置を予め設定されている位置から別の位置へ変更する音源位置変更手段を備え、音源位置変更手段は、集音センサ手段で検出される音圧の瞬時パワーを死点形成手段から出力される音圧の瞬時パワーで除した値が所定のしきい値以上となるときに集音センサ手段で検出される音圧、時間微分値、空間微分値に基づいて推定される位置に前記目的話者の位置を変更することを特徴とする請求項1〜6の何れか1項に記載の音響入力装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007149570A JP4894638B2 (ja) | 2007-06-05 | 2007-06-05 | 音響入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007149570A JP4894638B2 (ja) | 2007-06-05 | 2007-06-05 | 音響入力装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008304555A JP2008304555A (ja) | 2008-12-18 |
JP4894638B2 true JP4894638B2 (ja) | 2012-03-14 |
Family
ID=40233363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007149570A Expired - Fee Related JP4894638B2 (ja) | 2007-06-05 | 2007-06-05 | 音響入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4894638B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5060438B2 (ja) * | 2008-09-10 | 2012-10-31 | パナソニック株式会社 | 収音装置 |
JP5593547B2 (ja) * | 2010-02-26 | 2014-09-24 | 日産自動車株式会社 | 波動源位置演算方法及び波動源位置演算装置 |
CN105989852A (zh) * | 2015-02-16 | 2016-10-05 | 杜比实验室特许公司 | 分离音频源 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP2006058395A (ja) * | 2004-08-17 | 2006-03-02 | Spectra:Kk | 音響信号入出力装置 |
WO2006131959A1 (ja) * | 2005-06-06 | 2006-12-14 | Saga University | 信号分離装置 |
-
2007
- 2007-06-05 JP JP2007149570A patent/JP4894638B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008304555A (ja) | 2008-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Furukawa et al. | Noise correlation matrix estimation for improving sound source localization by multirotor UAV | |
US8155331B2 (en) | Sound source tracking system, method and robot | |
KR100754385B1 (ko) | 오디오/비디오 센서를 이용한 위치 파악, 추적 및 분리장치와 그 방법 | |
KR101413229B1 (ko) | 방향 추정 장치 및 방법 | |
Schauerte et al. | Multimodal saliency-based attention for object-based scene analysis | |
Dagamseh et al. | Imaging dipole flow sources using an artificial lateral-line system made of biomimetic hair flow sensors | |
Jiang et al. | Real-time vibration source tracking using high-speed vision | |
EP3227704B1 (en) | Method for tracking a target acoustic source | |
CN113692750A (zh) | 使用声音场景分析和波束形成的声传递函数个性化 | |
JP2014137226A (ja) | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 | |
Gala et al. | Realtime active sound source localization for unmanned ground robots using a self-rotational bi-microphone array | |
CN113539288A (zh) | 一种语音信号去噪方法及装置 | |
JP2023508063A (ja) | オーディオ信号処理方法、装置、機器及びコンピュータプログラム | |
CN112824925A (zh) | 使用两个麦克风进行轻型全360度音频源位置检测 | |
JP4894638B2 (ja) | 音響入力装置 | |
GB2604227A (en) | Sensing via signal to signal translation | |
Pan et al. | Cognitive acoustic analytics service for Internet of Things | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
Murase et al. | Multiple moving speaker tracking by microphone array on mobile robot. | |
CN114690121A (zh) | 动态时空波束形成 | |
Boztas | Sound source localization for auditory perception of a humanoid robot using deep neural networks | |
JP2009100372A (ja) | 通話装置 | |
JP5060438B2 (ja) | 収音装置 | |
Brian | Auditory occupancy grids with a mobile robot | |
WO2020031594A1 (ja) | 音源分離システム、音源位置推定システム、音源分離方法および音源分離プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100217 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111129 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111212 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150106 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |