JP2017107141A - 音源情報推定装置、音源情報推定方法、およびプログラム - Google Patents
音源情報推定装置、音源情報推定方法、およびプログラム Download PDFInfo
- Publication number
- JP2017107141A JP2017107141A JP2016028682A JP2016028682A JP2017107141A JP 2017107141 A JP2017107141 A JP 2017107141A JP 2016028682 A JP2016028682 A JP 2016028682A JP 2016028682 A JP2016028682 A JP 2016028682A JP 2017107141 A JP2017107141 A JP 2017107141A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- frequency domain
- source information
- information estimation
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
最初に、従来の決定論的な手法による直間比推定技術を詳細に説明し、続いて、この発明の音源情報推定技術を適用した直間比推定技術の実施形態を説明する。
残響環境下における音源とマイクロホン間のインパルス応答は、直接音(direct sound)、初期反射音(early reflection)、および後部残響(late reverberation)から構成される。ここでは、簡易なモデル化のために、残響には初期反射音と後部残響とが含まれることとして、図3に示すように、直接音(direct sound)と残響(reverberation)の2要素によりインパルス応答が構成されるものと想定する。インパルス応答の周波数ωにおける特性(以後、伝達特性と呼ぶ)をHωとすると、伝達特性は式(1)でモデル化される。
Xm,ω,τをm番目のマイクロホンにおける観測信号とする。マイクロホンは総計でM本あり、ωは周波数ビン番号、τは時間フレーム番号を表す。式(1)を用いると、Xm,ω,τは式(2)でモデル化される。
異なる方向から到来する波面の強度分布を解析するために、観測信号xω,τに対して、2つ以上のビームフォーミングフィルタを掛け合わせることを想定する。l番目のビームフォーミングの出力信号は、式(8)で表される。
図5に示すように、2つの指向特性が異なるビームフォーミング(Beamformers)をアレイ観測信号に対して畳み込むと想定する。式(16)によると、2つのビームフォーミング出力のPSDは、式(17)のように行列形式で表される。
〔参考文献1〕岡谷貴之著、“深層学習”、第一版、講談社サイエンティフィク、2015年
第一実施形態の直間比推定装置は、図6に示すように、M個のマイクロホン10−1〜10−M、M個の周波数領域変換部11−1〜11−M、2個のビームフォーミング部12−1〜12−2、局所PSD推定部13、およびDNNマッピング部20を備える。この直間比推定装置が後述する各ステップの処理を行うことにより第一実施形態の直間比推定方法が実現される。
第一実施形態では、直接音のPSDPD,ωと残響のPSD−PR,ωを入力として、直間比の推定値Γを出力するN層のディープニューラルネットワークを用いる構成を説明した。第二実施形態では、次式のように複数のビームフォーミング出力を入力として、直間比の推定値Γを出力するN層のディープニューラルネットワークを用いる構成を説明する。
第一実施形態および第二実施形態では、ネットワークパラメータzの初期値をランダムに設定した。第三実施形態では、従来法のように物理的な特性を加味してネットワークパラメータzの初期値を設定する方法について説明する。従来法における直間比推定技術は大きく以下の3ステップで構成されている。
第三実施形態では、第二実施形態の直間比推定装置において、ネットワークパラメータzの初期値を設定する構成を説明した。第四実施形態では、第一実施形態の直間比推定装置において、ネットワークパラメータzの初期値を設定するように構成する。なお、最適化処理については第一実施形態と同様である。
最初に、従来の決定論的手法による音源強調技術を詳細に説明し、続いて、この発明の音源情報推定技術を適用した音源強調技術の実施形態を説明する。
音場にK個の音源が存在し、M(≧2)個のマイクロホンを用いて観測する。この状況は、多入力多出力系(multiple-inputs and multiple-outputs: MIMO)の一つとして見なすことができる。k番目の音源とm番目のマイクロホン間の伝達特性をAm,k,ωとすると、M個の観測信号xω,τは式(61)のように計算できる。
実装形態1:受音設計技術+ビームフォーミング+ウィーナーフィルタリング
実装形態2:受音設計技術+ビームフォーミング
実装形態3:(汎用マイク)+ビームフォーミング
実装形態4:(汎用マイク)+ビームフォーミング+ウィーナーフィルタリング
参考文献2には、(1)音源信号を分離して収音しやすくなるような受音信号の性質と、(2)一つの実装形態として多凹型反射板を用いた受音系について説明されている。
〔参考文献2〕K. Niwa, T. Kako, and K. Kobayashi, “Microphone array for increasing mutual information between sound sources and observation signals,” ICASSP 2015, pp. 534-538, 2015.
〔参考文献3〕K. Niwa, Y. Hioka, K. Furuya, and Y. Haneda, “Diffused sensing for sharp directive beamforming,” IEEE Trans. on Audio, Speech and Language Proc., vol. 21, pp. 2346-2355, 2013.
ビームフォーミングに基づく音源強調法について説明する。ビームフォーミングは、マイクロホン間に生じる位相/振幅差を操作し、加算することで、特定の方向から到来する音源を強調する方法である。観測信号群xω,τに対して、i番目の方向から到来する音源を強調するフィルタwi,ωを掛け合わせることで、出力信号Yi,ω,τを得る。
更に高い精度で雑音抑圧を実施するために、ビームフォーミングの出力信号Yi,ω,τに対してウィーナーフィルタを掛け合わせる方法について説明する。i番目の音源を強調するためのウィーナーフィルタをGi,ω,τとするとき、出力信号Zi,ω,τは式(93)で得られる。
〔参考文献4〕Y. Hioka, K. Furuya, K. Kobayashi, K. Niwa, and Y. Haneda, “Underdetermined sound source separation using power spectrum density estimated by combination of directivity gain,” in Proc. IEEE Trans. on Audio, Speech, and Language Proc., vol. 21, pp. 1240-1250, 2013.
〔参考文献5〕K. Niwa, Y. Hioka, and K. Kobayashi, “Post-filter design for speech enhancement in various noisy environments,” in Proc. IWAENC 2014, pp. 36-40, 2014.
第五実施形態の音源強調装置は、図13に示すように、M個のマイクロホン10−1〜10−M、M個の周波数領域変換部11−1〜11−M、L個のビームフォーミング部12−1〜12−L、局所PSD推定部13、DNNマッピング部22、およびフィルタリング部16を備える。この音源強調装置が後述する各ステップの処理を行うことにより第五実施形態の音源強調方法が実現される。
第五実施形態では、局所PSD^ΦS,ω,τを入力として、事前SNRの推定値^ξω,τを出力するN層のディープニューラルネットワークを各周波数ビンかつ各帯域で設計する構成を説明した。第六実施形態では、次式のように複数のビームフォーミング出力を入力として、事前SNRの推定値を出力するN層のディープニューラルネットワークを用いる構成を説明する。
第五実施形態および第六実施形態では、ネットワークパラメータzωiの初期値をランダムに設定した。第七実施形態では、従来法のように物理的な特性を加味してネットワークパラメータzωiの初期値を設定する方法について説明する。従来法における事前SNR推定技術は大きく以下の3ステップで構成されている。
第七実施形態では、第六実施形態の音源強調装置において、ネットワークパラメータzωiの初期値を設定する構成を説明した。第八実施形態では、第五実施形態の音源強調装置において、ネットワークパラメータzωiの初期値を設定するように構成する。なお、最適化処理については第五実施形態と同様である。
第九実施形態は、第一実施形態から第四実施形態で説明した直間比推定技術と、第五実施形態から第八実施形態で説明した音源強調技術とを包含する上位概念としての音源情報推定技術を説明する。
上述の実施形態では、特にマイクロホンアレイのハードウェア構造を限定せずに説明してきた。本形態では、マイクロホンアレイのハードウェア構造に対称性を持たせるように限定することで、学習したディープニューラルネットワークのネットワークパラメータの頑健性を高め、音源情報の推定性能を高めることを目的とする。なお、処理手続きに関しては、ハードウェア構成が制限される以外は、各実施形態と同様であるため、以下では対称性を持つマイクロホンアレイの具体的なハードウェア構成例と、なぜこの構成によりディープニューラルネットワークのネットワークパラメータの頑健性が高まるのかについて説明をする。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
11−1〜11−M 周波数領域変換部
12−1〜12−L ビームフォーミング部
13 局所PSD推定部
14 パワー比推定部
15 事前SNR計算部
16 フィルタリング部
20〜23 DNNマッピング部
30〜33 初期値設定部
Claims (12)
- 複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域観測信号から各周波数領域観測信号の音源特徴を抽出する音源特徴抽出部と、
各周波数領域観測信号の音源特徴を統計的マッピングモデルへ入力して音源情報の推定値を求める音源情報推定部と、
を含み、
上記統計的マッピングモデルは、複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域音響信号から抽出した音源特徴と各周波数領域音響信号から求めた音源情報の正解値とを用いてパラメータを学習したものである、
音源情報推定装置。 - 請求項1に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、上記複数の周波数領域音響信号から抽出したパワースペクトル密度と各周波数領域音響信号から求めた直間比の正解値とを用いてパラメータを学習したものであり、
上記音源特徴抽出部は、複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域観測信号を入力とし、各周波数領域観測信号のパワースペクトル密度を抽出するものであり、
上記音源情報推定部は、各周波数領域観測信号のパワースペクトル密度を上記統計的マッピングモデルへ入力して直間比の推定値を求めるものである、
音源情報推定装置。 - 請求項1に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、上記複数の周波数領域音響信号から抽出したパワーと各周波数領域音響信号から求めた直間比の正解値とを用いてパラメータを学習したものであり、
上記音源特徴抽出部は、入力された観測信号に対して複数の異なる方向の角度領域から到来する音を強調して複数の周波数領域観測信号を生成し、各周波数領域観測信号のパワーを抽出するものであり、
上記音源情報推定部は、各周波数領域観測信号のパワーを上記統計的マッピングモデルへ入力して直間比の推定値を求めるものである、
を含む音源情報推定装置。 - 請求項2に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、Nを所定の直間比推定処理演算を構成する信号処理演算の単位数とし、N+1層以上のディープニューラルネットワークであり、
上記ディープニューラルネットワークの入力層を各周波数領域観測信号のパワースペクトル密度に設定し、2層目以降の各層のネットワークパラメータの初期値に上記直間比推定処理演算を構成する各信号処理演算を表現したネットワークパラメータを設定する初期値設定部をさらに含む、
音源情報推定装置。 - 請求項3に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、Nを所定の直間比推定処理演算を構成する信号処理演算の単位数とし、N+1層以上のディープニューラルネットワークであり、
上記ディープニューラルネットワークの入力層を各周波数領域観測信号のパワーに設定し、2層目以降の各層のネットワークパラメータの初期値に上記直間比推定処理演算を構成する各信号処理演算を表現したネットワークパラメータを設定する初期値設定部をさらに含む、
音源情報推定装置。 - 請求項1に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、上記複数の周波数領域音響信号から抽出したパワースペクトル密度と各周波数領域音響信号から求めたSN比の正解値とを用いてパラメータを学習したものであり、
上記音源特徴抽出部は、複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域観測信号を入力とし、各周波数領域観測信号のパワースペクトル密度を抽出するものであり、
上記音源情報推定部は、各周波数領域観測信号のパワースペクトル密度を上記統計的マッピングモデルへ入力してSN比の推定値を求めるものであり、
上記SN比の推定値から周波数帯域毎の利得係数を計算し、上記周波数領域観測信号の各対応する周波数帯域のパワースペクトル密度に乗算するフィルタリング部をさらに含む、
音源情報推定装置。 - 請求項1に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、上記複数の周波数領域音響信号から抽出したパワーと各周波数領域音響信号から求めたSN比の正解値とを用いてパラメータを学習したものであり、
上記音源特徴抽出部は、入力された観測信号に対して複数の異なる方向の角度領域から到来する音を強調して複数の周波数領域観測信号を生成し、各周波数領域観測信号のパワーを抽出するものであり、
上記音源情報推定部は、各周波数領域観測信号のパワーを上記統計的マッピングモデルへ入力してSN比の推定値を求めるものであり、
上記SN比の推定値から周波数帯域毎の利得係数を計算し、上記周波数領域観測信号の各対応する周波数帯域のパワースペクトル密度に乗算するフィルタリング部を含む、
音源情報推定装置。 - 請求項6に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、Nを所定のSN比推定処理演算を構成する信号処理演算の単位数とし、N+1層以上のディープニューラルネットワークであり、
上記ディープニューラルネットワークの入力層を各周波数領域観測信号のパワースペクトル密度に設定し、2層目以降の各層のネットワークパラメータの初期値に上記所定の直間比推定処理演算を構成する各信号処理演算を表現したネットワークパラメータを設定する初期値設定部をさらに含む、
音源情報推定装置。 - 請求項7に記載の音源情報推定装置であって、
上記統計的マッピングモデルは、Nを所定のSN比推定処理演算を構成する信号処理演算の単位数とし、N+1層以上のディープニューラルネットワークであり、
上記ディープニューラルネットワークの入力層を各周波数領域観測信号のパワーに設定し、2層目以降の各層のネットワークパラメータの初期値に上記所定の直間比推定処理演算を構成する各信号処理演算を表現したネットワークパラメータを設定する初期値設定部をさらに含む、
音源情報推定装置。 - 請求項1から9のいずれかに記載の音源情報推定装置であって、
上記複数の周波数領域音響信号は、各マイクロホンが正多角形もしくは正多面体の頂点位置に配置されたマイクロホンアレイを用いて収音したものである、
音源情報推定装置。 - 音源特徴抽出部が、複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域観測信号から各周波数領域観測信号の音源特徴を抽出する音源特徴抽出ステップと、
音源情報推定部が、各周波数領域観測信号の音源特徴を統計的マッピングモデルへ入力して音源情報の推定値を求める音源情報推定ステップと、
を含み、
上記統計的マッピングモデルは、複数の異なる方向の角度領域から到来する音を強調して収音した複数の周波数領域音響信号から抽出した音源特徴と各周波数領域音響信号から求めた音源情報の正解値とを用いてパラメータを学習したものである、
音源情報推定方法。 - 請求項1から10のいずれかに記載の音源情報推定装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015240512 | 2015-12-09 | ||
JP2015240512 | 2015-12-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017107141A true JP2017107141A (ja) | 2017-06-15 |
JP6594222B2 JP6594222B2 (ja) | 2019-10-23 |
Family
ID=59060852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016028682A Active JP6594222B2 (ja) | 2015-12-09 | 2016-02-18 | 音源情報推定装置、音源情報推定方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6594222B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017164996A1 (en) * | 2016-03-25 | 2017-09-28 | Qualcomm Incorporated | Audio processing for an acoustical environment |
CN109164414A (zh) * | 2018-09-07 | 2019-01-08 | 深圳市天博智科技有限公司 | 基于麦克风阵列的定位方法、装置和存储介质 |
WO2019049276A1 (ja) * | 2017-09-07 | 2019-03-14 | 三菱電機株式会社 | 雑音除去装置および雑音除去方法 |
KR20190108711A (ko) * | 2018-03-15 | 2019-09-25 | 한양대학교 산학협력단 | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 |
WO2020075008A1 (ja) * | 2018-10-11 | 2020-04-16 | 株式会社半導体エネルギー研究所 | 車両警報装置 |
JP2021500593A (ja) * | 2017-10-23 | 2021-01-07 | アイフライテック カンパニー,リミテッド | 対象音声検出方法及び装置 |
CN113109794A (zh) * | 2020-01-13 | 2021-07-13 | 中国科学院声学研究所 | 一种强噪声环境下基于深度神经网络的深海声源定深方法 |
CN113126027A (zh) * | 2019-12-31 | 2021-07-16 | 财团法人工业技术研究院 | 特定音源的定位方法 |
CN113189571A (zh) * | 2020-01-14 | 2021-07-30 | 中国科学院声学研究所 | 一种基于音色特征提取和深度学习的声源被动测距方法 |
WO2021205494A1 (ja) * | 2020-04-06 | 2021-10-14 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、およびプログラム |
WO2021255925A1 (ja) * | 2020-06-19 | 2021-12-23 | 日本電信電話株式会社 | 目的音信号生成装置、目的音信号生成方法、プログラム |
JP2022049428A (ja) * | 2020-09-16 | 2022-03-29 | 株式会社東芝 | 信号処理装置及び学習済みニューラルネットワーク |
JP7552742B2 (ja) | 2021-02-15 | 2024-09-18 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02289899A (ja) * | 1989-01-24 | 1990-11-29 | Sekisui Chem Co Ltd | 音声検出方式 |
JPH05232986A (ja) * | 1992-02-21 | 1993-09-10 | Hitachi Ltd | 音声信号用前処理方法 |
JP2009044588A (ja) * | 2007-08-10 | 2009-02-26 | Nippon Telegr & Teleph Corp <Ntt> | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 |
JP2013179388A (ja) * | 2012-02-28 | 2013-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
-
2016
- 2016-02-18 JP JP2016028682A patent/JP6594222B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02289899A (ja) * | 1989-01-24 | 1990-11-29 | Sekisui Chem Co Ltd | 音声検出方式 |
JPH05232986A (ja) * | 1992-02-21 | 1993-09-10 | Hitachi Ltd | 音声信号用前処理方法 |
JP2009044588A (ja) * | 2007-08-10 | 2009-02-26 | Nippon Telegr & Teleph Corp <Ntt> | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 |
JP2013179388A (ja) * | 2012-02-28 | 2013-09-09 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
若宮 幸平: "音素別ニューラルネットワークを用いた調音−音響マッピング", 電子情報通信学会技術研究報告, vol. Vol.104 No.388, JPN6019005988, October 2004 (2004-10-01), JP * |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017164996A1 (en) * | 2016-03-25 | 2017-09-28 | Qualcomm Incorporated | Audio processing for an acoustical environment |
US9881619B2 (en) | 2016-03-25 | 2018-01-30 | Qualcomm Incorporated | Audio processing for an acoustical environment |
WO2019049276A1 (ja) * | 2017-09-07 | 2019-03-14 | 三菱電機株式会社 | 雑音除去装置および雑音除去方法 |
JPWO2019049276A1 (ja) * | 2017-09-07 | 2019-12-26 | 三菱電機株式会社 | 雑音除去装置および雑音除去方法 |
US11308974B2 (en) | 2017-10-23 | 2022-04-19 | Iflytek Co., Ltd. | Target voice detection method and apparatus |
JP2021500593A (ja) * | 2017-10-23 | 2021-01-07 | アイフライテック カンパニー,リミテッド | 対象音声検出方法及び装置 |
KR102087307B1 (ko) * | 2018-03-15 | 2020-03-10 | 한양대학교 산학협력단 | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 |
KR20190108711A (ko) * | 2018-03-15 | 2019-09-25 | 한양대학교 산학협력단 | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 |
CN109164414A (zh) * | 2018-09-07 | 2019-01-08 | 深圳市天博智科技有限公司 | 基于麦克风阵列的定位方法、装置和存储介质 |
CN112805764A (zh) * | 2018-10-11 | 2021-05-14 | 株式会社半导体能源研究所 | 车辆警报装置 |
WO2020075008A1 (ja) * | 2018-10-11 | 2020-04-16 | 株式会社半導体エネルギー研究所 | 車両警報装置 |
US12049167B2 (en) | 2018-10-11 | 2024-07-30 | Semiconductor Energy Laboratory Co., Ltd. | Vehicle alarm device |
JP7402811B2 (ja) | 2018-10-11 | 2023-12-21 | 株式会社半導体エネルギー研究所 | 車両警報装置 |
JPWO2020075008A1 (ja) * | 2018-10-11 | 2021-11-25 | 株式会社半導体エネルギー研究所 | 車両警報装置 |
CN113126027A (zh) * | 2019-12-31 | 2021-07-16 | 财团法人工业技术研究院 | 特定音源的定位方法 |
CN113109794A (zh) * | 2020-01-13 | 2021-07-13 | 中国科学院声学研究所 | 一种强噪声环境下基于深度神经网络的深海声源定深方法 |
CN113109794B (zh) * | 2020-01-13 | 2022-12-06 | 中国科学院声学研究所 | 一种强噪声环境下基于深度神经网络的深海声源定深方法 |
CN113189571A (zh) * | 2020-01-14 | 2021-07-30 | 中国科学院声学研究所 | 一种基于音色特征提取和深度学习的声源被动测距方法 |
CN113189571B (zh) * | 2020-01-14 | 2023-04-07 | 中国科学院声学研究所 | 一种基于音色特征提取和深度学习的声源被动测距方法 |
JPWO2021205494A1 (ja) * | 2020-04-06 | 2021-10-14 | ||
JP7444243B2 (ja) | 2020-04-06 | 2024-03-06 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、およびプログラム |
WO2021205494A1 (ja) * | 2020-04-06 | 2021-10-14 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、およびプログラム |
WO2021255925A1 (ja) * | 2020-06-19 | 2021-12-23 | 日本電信電話株式会社 | 目的音信号生成装置、目的音信号生成方法、プログラム |
JP7428251B2 (ja) | 2020-06-19 | 2024-02-06 | 日本電信電話株式会社 | 目的音信号生成装置、目的音信号生成方法、プログラム |
JP2022049428A (ja) * | 2020-09-16 | 2022-03-29 | 株式会社東芝 | 信号処理装置及び学習済みニューラルネットワーク |
JP7387565B2 (ja) | 2020-09-16 | 2023-11-28 | 株式会社東芝 | 信号処理装置、学習済みニューラルネットワーク、信号処理方法及び信号処理プログラム |
JP7552742B2 (ja) | 2021-02-15 | 2024-09-18 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6594222B2 (ja) | 2019-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6594222B2 (ja) | 音源情報推定装置、音源情報推定方法、およびプログラム | |
US9615172B2 (en) | Broadband sensor location selection using convex optimization in very large scale arrays | |
CN111415676B (zh) | 一种基于分离矩阵初始化频点选择的盲源分离方法及系统 | |
Teutsch et al. | Acoustic source detection and localization based on wavefield decomposition using circular microphone arrays | |
JP6837099B2 (ja) | 音響エコーキャンセルのための室内インパルス応答の推定 | |
CN106537501B (zh) | 混响估计器 | |
US10455323B2 (en) | Microphone probe, method, system and computer program product for audio signals processing | |
Landschoot et al. | Model-based Bayesian direction of arrival analysis for sound sources using a spherical microphone array | |
JP2018063200A (ja) | 音源位置推定装置、音源位置推定方法、及びプログラム | |
Malgoezar et al. | On the use of global optimization methods for acoustic source mapping | |
Pujol et al. | BeamLearning: An end-to-end deep learning approach for the angular localization of sound sources using raw multichannel acoustic pressure data | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
JP6538624B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
CN111123202B (zh) | 一种室内早期反射声定位方法及系统 | |
Zhai et al. | A grid-free global optimization algorithm for sound sources localization in three-dimensional reverberant environments | |
Karimi et al. | Acoustic source localisation using vibroacoustic beamforming | |
Durofchalk et al. | Data driven source localization using a library of nearby shipping sources of opportunity | |
KR101354960B1 (ko) | 영역 개념을 이용한 음파 입사 방향 추정 방법 | |
Marković et al. | Estimation of acoustic reflection coefficients through pseudospectrum matching | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
Belloch et al. | Real-time sound source localization on an embedded GPU using a spherical microphone array | |
US11908444B2 (en) | Wave-domain approach for cancelling noise entering an aperture | |
Astapov et al. | Far field speech enhancement at low SNR in presence of nonstationary noise based on spectral masking and MVDR beamforming | |
JP5791685B2 (ja) | マイクロホン配置決定装置、マイクロホン配置決定方法及びプログラム | |
WO2022219558A9 (en) | System and method for estimating direction of arrival and delays of early room reflections |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190226 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190924 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6594222 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |