JP5512741B2 - 音声取得装置 - Google Patents
音声取得装置 Download PDFInfo
- Publication number
- JP5512741B2 JP5512741B2 JP2012112981A JP2012112981A JP5512741B2 JP 5512741 B2 JP5512741 B2 JP 5512741B2 JP 2012112981 A JP2012112981 A JP 2012112981A JP 2012112981 A JP2012112981 A JP 2012112981A JP 5512741 B2 JP5512741 B2 JP 5512741B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency domain
- microphones
- acquisition device
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
図1は音声取得装置の第1実施形態の全体構成例を示したものであり、図2は図1に示した音声取得装置の処理フローを示したものである。
n)はそれぞれ第2の周波数領域変換部17−1〜17−Qに入力される。第2の周波数
領域変換部17−1〜17−Qは入力された信号を短い時間長(例えばサンプリング周波数16000Hzの場合には256サンプル程度)のフレームに分解し、それぞれのフレームにおいて離散フーリエ変換を行って、得られたΩ個の周波数成分を出力信号Y1(ω
,l),Y2(ω,l),…,YQ(ω,l)として出力する(ステップS6)。周波数領域
変換された信号は信号量推定部18に入力される。
例えば、音声取得装置が図5に示したように4つのマイクロホン111〜114からなるマイクロホンアレー11とスピーカ31とを具備するものとし、このような音声取得装置30が配線により接続されて室内で複数使用されるとする。
重み係数決定部14は図6に示したように抽出部14Aと記憶部14Bを有する。抽出部14Aは死角形成方向決定部13から入力される死角形成方向に対し、各マイクロホンに対する重み係数g1(ω),g2(ω),…,gM(ω)を記憶部14Bから抽出し、その抽出した重み係数g1(ω),g2(ω),…,gM(ω)を出力する。記憶部14Bには各死角形成方向と、その場合に設定すべき各マイクロホンの重み係数gm(ω)とが対とされて格納されている。
図7は重み付き加算部15の構成を示している。乗算部15A−1〜15A−Mは重み係数決定部14から入力された重み係数gm(ω)を第1の周波数領域変換部12−1〜12−Mから入力された対応するマイクロホンの信号Xm(ω,l)にそれぞれ乗算する。乗算部15A−1〜15A−Mの出力は加算部15Bで全て加算され、特定方向周波数領域信号YS(ω,l)が加算部15Bから出力される。
図8はビームフォーマー部16−1〜16−Qの中の一つの構成を示している。同様の処理がすべてのビームフォーマー部において行われる。入力された信号xm(n)(m=1,2,…,M)はフィルタ処理部FC1〜FCMに入力される。フィルタ処理部FC1〜FCMではあらかじめ与えられた(決定方法は後述する)フィルタ係数Wqm(n)を、式(2)に示す畳み込み演算に代入して得られる信号x′qm(n)を出力する。
ここでフィルタ係数Wqm(n)は、それぞれのビームフォーマー部16−1〜16−Qの指向特性Dq(ω,θ)が、図4に示すあらかじめ与えられた第Q方向領域ΘQで発せられる音を強調して受音し、それ以外の方向で発せられる音を抑圧するように設計される。
図9は信号量推定部14の構成を示している。信号量推定部18に入力される周波数成分Y1(ω,l),Y2(ω,l),…,YQ(ω,l)はそれぞれパワー演算部PW−1〜PW−Qに入力され、信号のパワー値|Y1(ω,l)|2,|Y2(ω,l)|2,…,|YQ(ω,l)|2が出力され、領域集約部18Aに入力される(図2のステップS7A)。領域集約部18Aは、あらかじめ決められた収音したい領域の集合Sから発せられる信号のパワー値の平均と、抑圧したい領域の集合Nから発せられる信号のパワー平均を求め、その結果からなる集約パワーベクトルY(ω,l)を出力する(図2のステップS7B)。
ただし、NSは集合Sに含まれる領域の数、NNは集合Nに含まれる領域の数を示している。また、すべての方向領域(1〜Q)を集合Sまたは集合Nに所属するようにあらかじめ定めておく。例えば、Q=4のとき、集合Sと集合NをS={1,2}、N={3,4}のように決めればよい。
このように、方向領域の集約を行って信号のパワー(信号量)を推定するのが、信号量推定部18である。
図11は利得係数算出部19の構成を示している。信号量推定部18より入力された推定信号パワーベクトルXest(ω,l)はベクトル要素抽出部19Aに入力される。推定信号パワーベクトルXest(ω,l)は、式(8)に示すように、入力された推定信号パワーベクトルの収音領域信号推定パワー|S(ω,l)|2を第1成分、入力された推定信号パワーベクトルの抑圧領域信号推定パワー|N(ω,l)|2を第2成分とする。
ベクトル要素抽出部19Aは、収音領域信号推定パワー|S(ω,l)|2と抑圧領域信号推定パワー|N(ω,l)|2を出力し、それらをSN比推定部19Bに入力する。SN比推定部19Bでは式(9)を用いて所望方向領域の信号を強調する利得係数R(ω,l)を計算し出力する。
ω)〜g3(ω)は例えば1のようなマイクロホン114の重み係数g4(ω)と符号は同じ
で絶対値が十分大きい値を与える。このように重み係数g1(ω)〜g4(ω)を決定することで、死角を向けたい方向からの音を抑圧し、ハウリング抑圧効果を高めることができる。
ω)は0とし、マイクロホン112,113の重み係数g2(ω),g3(ω)は1とする。
また、図13(b)の場合、例えばマイクロホン111,113,114の重み係数g1(ω),g3(ω),g4(ω)は0とし、マイクロホン112の重み係数g2(ω)は1とする。
図15は音声取得装置の第2実施形態の全体構成例を示したものであり、この例では図1に示した第1実施形態における重み係数決定部14及び重み付き加算部15に替えて、選択信号生成部22及び特定方向選択部23を具備するものとなっている。
l)〜XM(ω,l)を選択信号生成部22から入力された選択信号に基づき、選択する。
スイッチ23Aによって選択された信号は加算部23Bで全て加算され、特定方向周波数領域信号YS(ω,l)が加算部23Bから出力される。
ω)を乗算する第1実施形態と異なり、所要の周波数領域信号Xm(ω,l)のみを選択す
るものとなっており、このような構成によっても高いハウリング抑圧性能を実現することができる。
図17は音声取得装置の第3実施形態の全体構成例を示したものである。第1実施形態との相違点は、第1の周波数領域変換部12〜1〜12−Mの後段及び第2の周波数領域変換部17−1〜17−Qの後段にそれぞれ帯域分割部24−1〜24−M及び25−1〜25−Qを備え、重み付き加算部15、信号量推定部18、利得係数算出部19、乗算部20の各処理が、Ω個の周波数帯域ごとに行われる点、及び各周波数帯域での乗算部20の後段に帯域合成部27を備え、各帯域の乗算部20からの出力を合成する点である。図18に帯域分割部25−1〜25−Qの構成を、図19に帯域合成部27の構成を示す。
Claims (2)
- スピーカと複数のマイクロホンとを搭載した音声取得装置であって、
前記複数のマイクロホンは、前記音声取得装置の中心からみてそれぞれ異なる方向に配置されており、
前記マイクロホンのそれぞれに対応して前記音声取得装置の中心からみてマイクロホンの方向と同一方向に配置される、前記音声取得装置のマイクロホンで収音した音を再生するスピーカを含む装置の配線接続用の端子と、
前記スピーカを含む装置の配線が接続された配線接続用の端子を検出して、検出された端子の方向を収音の死角形成方向とする死角形成方向決定部と、
を備えることを特徴とする音声取得装置。 - 請求項1記載の音声取得装置であって、
前記複数のマイクロホンを搭載して構成されるマイクロホンアレーの各マイクロホンの出力信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する複数の第1周波数領域変換部と、
前記死角形成方向からの音を抑圧するように、前記各マイクロホンに対する重み係数を決定する重み係数決定部と、
前記各第1周波数領域変換部が出力する各マイクロホンの周波数領域信号に、対応する前記重み係数をそれぞれ乗算した後、全てを加算して特定方向周波数領域信号を求める重み付き加算部と、
前記各マイクロホンの出力信号を利用してそれぞれが異なる方向の角度領域から到来する音を強調して収音する複数のビームフォーマー部と、
前記複数のビームフォーマー部が収音した角度領域信号のそれぞれを複数の帯域成分に分割した周波数領域信号に変換する複数の第2周波数領域変換部と、
前記第2周波数領域変換部が出力する周波数領域信号から、収音領域信号推定パワーと抑圧領域信号推定パワーとを求める信号量推定部と、
前記収音領域信号推定パワーと前記収音領域信号推定パワー及び抑圧領域信号推定パワーの和との比を利得係数として算出する利得係数算出部と、
前記利得係数算出部が算出した利得係数を前記特定方向周波数領域信号の各対応する周波数帯域の信号量に乗算する乗算部と、
をさらに備え、
前記複数のマイクロホンの内、少なくとも二つのマイクロホンが、その二つのマイクロホンを結ぶ開線分の方向かつ外向きに指向性を持つものとし、
前記重み係数決定部は、その二つのマイクロホンに対する重み係数を、絶対値が互いに等しく、かつ、符号が互いに異なる値となるように、決定する、
音声取得装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012112981A JP5512741B2 (ja) | 2012-05-17 | 2012-05-17 | 音声取得装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012112981A JP5512741B2 (ja) | 2012-05-17 | 2012-05-17 | 音声取得装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009274411A Division JP5175262B2 (ja) | 2009-12-02 | 2009-12-02 | 音声取得装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012178869A JP2012178869A (ja) | 2012-09-13 |
JP5512741B2 true JP5512741B2 (ja) | 2014-06-04 |
Family
ID=46980362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012112981A Active JP5512741B2 (ja) | 2012-05-17 | 2012-05-17 | 音声取得装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5512741B2 (ja) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4119328B2 (ja) * | 2003-08-15 | 2008-07-16 | 日本電信電話株式会社 | 収音方法、その装置、そのプログラム、およびその記録媒体。 |
-
2012
- 2012-05-17 JP JP2012112981A patent/JP5512741B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012178869A (ja) | 2012-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4724054B2 (ja) | 特定方向収音装置、特定方向収音プログラム、記録媒体 | |
EP2320675B1 (en) | Audio processing device | |
US20120082322A1 (en) | Sound scene manipulation | |
JP4897519B2 (ja) | 音源分離装置,音源分離プログラム及び音源分離方法 | |
JP5175262B2 (ja) | 音声取得装置 | |
KR101456866B1 (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
CN106572419B (zh) | 一种立体声音效增强系统 | |
EP3113508B1 (en) | Signal-processing device, method, and program | |
JP4928382B2 (ja) | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 | |
JP4473829B2 (ja) | 収音装置、プログラム及びこれを記録した記録媒体 | |
TWI465121B (zh) | 利用全方向麥克風改善通話的系統及方法 | |
JP5635024B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
US20090141912A1 (en) | Object sound extraction apparatus and object sound extraction method | |
JPH09261792A (ja) | 受音方法及びその装置 | |
JP4886616B2 (ja) | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 | |
JP4928376B2 (ja) | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 | |
JP5512741B2 (ja) | 音声取得装置 | |
EP2809086B1 (en) | Method and device for controlling directionality | |
JP2017083566A (ja) | 雑音抑圧装置、雑音抑圧方法、およびプログラム | |
JP3514714B2 (ja) | 収音方法およびその装置 | |
JP2010103617A (ja) | 発話向き推定装置、方法及びプログラム | |
WO2017056288A1 (ja) | 音響信号処理装置、音響処理方法、監視装置および監視方法 | |
JP2017181761A (ja) | 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム | |
JP5713933B2 (ja) | 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JP5060589B2 (ja) | 収音再生装置、方法及びプログラム、ハンズフリー装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130903 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5512741 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |