JP5134525B2 - 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム - Google Patents
方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム Download PDFInfo
- Publication number
- JP5134525B2 JP5134525B2 JP2008324226A JP2008324226A JP5134525B2 JP 5134525 B2 JP5134525 B2 JP 5134525B2 JP 2008324226 A JP2008324226 A JP 2008324226A JP 2008324226 A JP2008324226 A JP 2008324226A JP 5134525 B2 JP5134525 B2 JP 5134525B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- parameter
- direction information
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
M.Mandel,D.Ellis,and T.Jebara,"An EM algorithm for localizing multiple sound sources in reverberant environments,"Proc.Neural Info.Proc.Sys.,2006.
通常、方向情報Dには、2πのk(kは整数)倍の不定性が含まれるため、ここではそれを許すWrapped GMMを用いる。Wrapped GMMであるGは以下の式(2)で表すことができる。
│Q(θ│θt+1)−Q(θ│θt)│<Δ (16)
パラメタ算出手段148により算出されるθは図5Cの混合正規分布の各パラメタである。
式(20)の値が負の場合、μm tとμm t+πの両方について、式(21)に示すQ関数の2次導関数を計算し、式(21)の値が負になるほうをμm t+1とする。
拡散パラメタ更新手段160は例えば以下の式(22)により更新する。
混合重み更新手段146は、例えば、以下の式(23)により混合重みαmを更新する。
この実施例2の方向情報分布推定装置300のように、フォン・ミーゼス分布を用いることで、kに関する推定操作が不要であるため、実施例1の方向情報分布推定装置200と比較して、計算コストやパラメタθの収束時間を削減できる。
図5を用いて、実施例1で説明した方向情報分布推定装置200によるフィッティングの実験結果について説明する。実験条件として8(=M)つの正規分布からなる混合正規分布をフィッティングさせ、ハイパーパラメタφを0.9とする。上述のように図5Aに入力される方向情報dnについての図2Aと同様のヒストグラムHを示し、図5Bに方向情報分布推定装置200のフィッティング処理による正規分布の結果を示し、図5Cに図5Bの正規分布を合計した混合正規分布(GMM)を示す。図5B記載のPの箇所(−115度付近)に注目すると、1つの正規分布でフィッティングできていることが理解されよう。従って、図5Cに示す求められる混合正規分布は、正確なものである。従って、実施例3〜5で説明する音源数推定処理、音源方向測定処理、音源分離処理も正確に行うことができる。
パワー推定部32は周波数領域音信号から音のパワーを求める。求め方の一例として、パワー推定部32は、各時間周波数(f、τ)における周波数領域音信号Xj(f、τ)の信号パワー│Xj(f、τ)│2を演算し出力する。出力された信号パワー│Xj(f、τ)│2が、上述した重み係数anとして、以後用いられる。
q’jj’(f、τ)={arg[Xj(f、τ)X* j’(f、τ)]}/2πf
(24)
Q(f、τ)=CD+Q’(f、τ) (25)
Q(f、τ)=(xQ、yQ、zQ)
=(cosΨ(f、τ)cosΩ(f、τ)、
sinΨ(f、τ)cosΩ(f、τ)、
sinΩ(f、τ)) (26)
p(m’│dn、θ)=Σk=−K Kp(m’、k│dn、θt) (27)
また、音源数測定装置400が、方向情報分布推定装置300を具備している場合には、周辺化処理を行わず、上記式(17)の演算結果を用いる。
Ynm’=Xnp(m’│dn、θ) (28)
ここでXnはX1(f、τ)を上述のn=τF+fで変形したものである。出力される周波数領域目的信号は時間周波数表現(f、τ)を用いると、n=τF+fより以下の式(29)で表される事に留意されたい。
Ym’(f、τ)=X1(f、τ)p(m’│Ψ(f、τ)、θ) (29)
この実施例5のように、音源分離装置600内に具備する方向情報分布推定装置200(300)により、正確な方向情報分布処理がされることから、音源分離装置600は正確な信号分離を行うことができる。
次に、方向情報分布推定装置200を用いた、音源数測定装置400(実施例3で説明)と音源分離装置600(実施例5で説明)と(以下、「発明法」という。)、従来の方向情報分布推定装置100を用いた音源数測定装置、音源分離装置(以下、「従来法」という。)とを比較した実験結果について説明する。まず図9を用いて、実験条件について説明する。長手方向4.45m(=Lb)、短手方向3.55m(=La)、高さ2.5mの室内に、3つのマイクロホンZ1、Z2、Z3が、正三角形の各頂点に配置される。隣接するマイクロホン同士の間隔は4cmであり、3つのマイクロホンの収音面がそれぞれ外側に向けられる。3つのマイクロホンZ1、Z2、Z3がなす正三角形の重心は、図9の左下の頂点Xから長手方向に2.56m(=Ld)であり、短手方向に1.8m(=Lc)の箇所に位置する。また、3つのマイクロホンZ1、Z2、Z3を囲むように2〜4つのスピーカ(図9の例では4つのスピーカS1、S2、S3、S4とする。)が円周Rの方向に配置され、音を発しているとする。当該円周Rの半径は、50cmまたは110cmであり、音の反響時間は128msであるとする。マイクロホンZ1、Z2、Z3、スピーカS1、S2、S3、S4の高さは全て1.2mとする。
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、方向情報分布推定装置200(300)、音源数推定装置400、音源方向測定装置500、音源分離装置600が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、処理機能がコンピュータ上で実現される。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明の方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置は、コンピュータの記録部に、本発明の各構成部としてを動作させるプログラムを読み込ませ、処理部、入力部、出力部などを動作させることで実現できる。また、コンピュータに読み込ませる方法としては、プログラムをコンピュータ読み取り可能な記録媒体に記録しておき、記録媒体からコンピュータに読み込ませる方法、サーバ等に記録されたプログラムを、電気通信回線等を通じてコンピュータに読み込ませる方法などがある。
Claims (13)
- 音源からの音情報の分布が複数のピークを持つ場合に、M(Mは1以上の整数)個の確率分布モデルを用いて、当該確率分布の各パラメタを更新することで、各ピークにそれぞれ1つの確率分布モデルをフィッティングさせる方向情報分布推定装置であって、
現在の確率分布モデルの各パラメタを保持しているパラメタ保持部と、
前記音情報と、前記現在の確率分布モデルの各パラメタを用いて、M個の確率分布モデルごとに事後確率を計算する事後確率計算部と、
前記音情報と、前記M個の確率分布モデルごとの事後確率を用いて、前記現在の確率分布モデルの各パラメタを前記更新し、各パラメタ値が収束していると判断した場合には更新された各パラメタを出力し、各パラメタ値が収束していないと判断した場合には、更新された各パラメタを前記パラメタ保持部に前記現在の確率分布モデルの各パラメタとして保持させる更新部と、を備え、
前記更新部は、前記各パラメタのうち、混合重みの事前分布としてハイパーパラメタを1より小さい正の値に設定したディリクレ分布を用いることを特徴とする方向情報分布推定装置。 - 請求項1記載の方向情報分布推定装置であって、
前記確率分布モデルは、正規分布モデルであり、
前記正規分布モデルの各パラメタは、混合重み、平均、分散、であることを特徴とする方向情報分布推定装置。 - 請求項1記載の方向情報分布推定装置であって、
前記確率分布モデルは、フォン・ミーゼス分布モデルであり、
前記フォン・ミーゼス分布モデルの各パラメタは、混合重み、平均、拡散パラメタ、であることを特徴とする方向情報分布推定装置。 - 複数の収音手段で入力された音信号を周波数領域に変換することで、周波数領域音信号を求める周波数領域変換部と、
前記周波数領域音信号から音の到来方向情報を求める到来方向推定部と、
前記周波数領域音信号のパワーを求めるパワー推定部と、
前記音の到来方向情報を音情報とし、前記パワーを重み係数として、方向情報分布モデルを求める請求項1〜3何れかに記載の方向情報分布推定装置と、
混合重みが予め定められた第1閾値よりも大きな値である音源該当方向情報分布モデルの個数M’を測定することで、音源数を求める音源数測定部と、を備える音源数推定装置。 - 請求項4記載の音源数推定装置と、
各音源該当方向情報分布モデルの各パラメタのうち、平均を音源方向として出力する音源方向測定部と、を備える音源方向測定装置。 - 請求項4記載の音源数推定装置と、
前記M’個の音源該当方向情報分布モデルごとの周辺化事後確率を求め、当該周辺化事後確率と前記周波数領域音信号とを掛け合わせることで、周波数領域目的信号を求める分離部と、
前記周波数領域目的信号を時間領域に変換することで、目的信号を求める時間領域変換部と、を備える音源分離装置。 - 音源からの音情報の分布が複数のピークを持つ場合に、M(Mは1以上の整数)個の確率分布モデルを用いて、各ピークにそれぞれ1つの確率分布モデルをフィッティングさせる方向情報分布推定方法であって、
現在の確率分布モデルの各パラメタを保持しているパラメタ保持過程と、
前記音情報と、前記現在の確率分布モデルの各パラメタを用いて、M個の確率分布モデルごとに事後確率を計算する事後確率計算過程と、
前記音情報と、前記M個の確率分布モデルごとの事後確率を用いて、前記現在の確率分布モデルの各パラメタを更新し、各パラメタ値が収束していると判断した場合には更新された各パラメタを出力し、各パラメタ値が収束していないと判断した場合には、更新された各パラメタを前記パラメタ保持過程に前記現在の確率分布モデルの各パラメタとして保持させる更新過程と、を有し、
前記更新過程は、前記各パラメタのうち、混合重みの事前分布としてハイパーパラメタを1より小さい正の値に設定したディリクレ分布を用いることを特徴とする方向情報分布推定方法。 - 請求項7記載の方向情報分布推定方法であって、
前記確率分布モデルは、正規分布モデルであり、
前記正規分布モデルの各パラメタは、混合重み、平均、分散、であることを特徴とする方向情報分布推定方法。 - 請求項7記載の方向情報分布推定方法であって、
前記確率分布モデルは、フォン・ミーゼス分布モデルであり、
前記フォン・ミーゼス分布モデルの各パラメタは、混合重み、平均、拡散パラメタ、であることを特徴とする方向情報分布推定方法。 - 複数の収音手段で入力された音信号を周波数領域に変換することで、周波数領域音信号を求める周波数領域変換過程と、
前記周波数領域音信号から音の到来方向情報を求める到来方向推定過程と、
前記周波数領域音信号のパワーを求めるパワー推定過程と、
前記音の到来方向情報を音情報とし、前記パワーを重み係数として、方向情報分布モデルを求める請求項7〜9何れかに記載の方向情報分布推定方法の各過程と、
混合重みが予め定められた第1閾値よりも大きな値である音源該当方向情報分布モデルの個数M’を測定することで、音源数を求める音源数測定過程と、を有する音源数推定方法。 - 請求項10記載の音源数推定方法の各過程と、
各音源該当方向情報分布モデルの各パラメタのうち、平均を音源方向として出力する音源方向測定過程と、を有する音源方向測定方法。 - 請求項10記載の音源数推定方法の各過程と、
前記M’個の音源該当方向情報分布モデルごとの周辺化事後確率を求め、当該周辺化事後確率と前記周波数領域音信号とを掛け合わせることで、周波数領域目的信号を求める分離過程と、
前記周波数領域目的信号を時間領域に変換することで、目的信号を求める時間領域変換過程と、を有する音源分離方法。 - 請求項7〜9何れかに記載の方向情報分布推定方法、または請求項10記載の音源数推定方法、または請求項11記載の音源方向測定方法、または請求項12記載の音源分離方法、の各過程をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008324226A JP5134525B2 (ja) | 2008-12-19 | 2008-12-19 | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008324226A JP5134525B2 (ja) | 2008-12-19 | 2008-12-19 | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010145836A JP2010145836A (ja) | 2010-07-01 |
JP5134525B2 true JP5134525B2 (ja) | 2013-01-30 |
Family
ID=42566321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008324226A Active JP5134525B2 (ja) | 2008-12-19 | 2008-12-19 | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5134525B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4964259B2 (ja) * | 2009-02-10 | 2012-06-27 | 日本電信電話株式会社 | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム |
JP5726709B2 (ja) * | 2011-11-01 | 2015-06-03 | 日本電信電話株式会社 | 音源分離装置、音源分離方法及びプログラム |
JP6114053B2 (ja) * | 2013-02-15 | 2017-04-12 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
CN103824561B (zh) * | 2014-02-18 | 2015-03-11 | 北京邮电大学 | 一种语音线性预测编码模型的缺失值非线性估算方法 |
JP6193823B2 (ja) * | 2014-08-19 | 2017-09-06 | 日本電信電話株式会社 | 音源数推定装置、音源数推定方法および音源数推定プログラム |
JP6835694B2 (ja) * | 2017-10-12 | 2021-02-24 | 株式会社デンソーアイティーラボラトリ | 騒音抑圧装置、騒音抑圧方法、プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
JP4652741B2 (ja) * | 2004-08-02 | 2011-03-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 異常検出装置、異常検出方法、異常検出プログラム、及び記録媒体 |
JP4804801B2 (ja) * | 2005-06-03 | 2011-11-02 | 日本電信電話株式会社 | 会話構造推定方法、プログラム、および記録媒体 |
JP2008145610A (ja) * | 2006-12-07 | 2008-06-26 | Univ Of Tokyo | 音源分離定位方法 |
-
2008
- 2008-12-19 JP JP2008324226A patent/JP5134525B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010145836A (ja) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5134525B2 (ja) | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム | |
EP3479377B1 (en) | Speech recognition | |
JP4285457B2 (ja) | 音場測定装置及び音場測定方法 | |
RU2655703C2 (ru) | Определение оценки размера помещения | |
JP5724125B2 (ja) | 音源定位装置 | |
JP4964259B2 (ja) | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム | |
JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
JP6594839B2 (ja) | 話者数推定装置、話者数推定方法、およびプログラム | |
JP6452591B2 (ja) | 合成音声品質評価装置、合成音声品質評価方法、プログラム | |
JP2010175431A (ja) | 音源方向推定装置とその方法と、プログラム | |
JP6345327B1 (ja) | 音声抽出装置、音声抽出方法および音声抽出プログラム | |
JP6606784B2 (ja) | 音声処理装置および音声処理方法 | |
KR20190123996A (ko) | 오차의 가중치 합의 최적화를 활용한 실내 무선 측위 방법 및 장치 | |
JP2018077139A (ja) | 音場推定装置、音場推定方法、プログラム | |
JP6570673B2 (ja) | 音声抽出装置、音声抽出方法および音声抽出プログラム | |
JP2008257110A (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 | |
JP2017083566A (ja) | 雑音抑圧装置、雑音抑圧方法、およびプログラム | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
US20200388298A1 (en) | Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program | |
JP2007226036A (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP2017055156A (ja) | 音場測定装置、音場測定方法、プログラム | |
JP6618885B2 (ja) | 音声区間検出装置、音声区間検出方法、プログラム | |
JP6538002B2 (ja) | 目的音集音装置、目的音集音方法、プログラム、記録媒体 | |
JP6059112B2 (ja) | 音源分離装置とその方法とプログラム | |
JP5134477B2 (ja) | 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110105 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5134525 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |