JP2011164468A - 音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム - Google Patents
音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム Download PDFInfo
- Publication number
- JP2011164468A JP2011164468A JP2010028986A JP2010028986A JP2011164468A JP 2011164468 A JP2011164468 A JP 2011164468A JP 2010028986 A JP2010028986 A JP 2010028986A JP 2010028986 A JP2010028986 A JP 2010028986A JP 2011164468 A JP2011164468 A JP 2011164468A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- signal
- parameter estimation
- sound
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】 この発明の音源パラメータ推定方法は、複数の音源から発せられた音源信号を周波数領域の信号に変換した観測信号を入力として、占有的な音源の音源信号に関する部分関数と、それ以外の各音源の音源信号に関する部分関数との積で表せる観測モデルに基づき、音源モデル記憶部に記憶された上記各音源信号毎の確率密度関数を決定する音源パラメータを推定する音源パラメータ推定過程を含む。
【選択図】図1
Description
音源パラメータ推定装置900は、複数の音源モデル記憶部901〜90Ns、確率密度関数合成部91、最適化基準計算部92、音源パラメータ探索部93、を具備する。音源モデル記憶部901〜90Nsには、音源パラメータの値によって決定される音源信号の短時間スペクトルに関する確率密度関数q(m) nが記憶されている。
〔この発明の基本的な考え〕
この発明では、新しい音源パラメータ推定方法を提案することで、従来の課題を解決する。最初に、説明に用いる記号について説明する。観測信号には、Ns個の音源信号が重畳しており、各音源信号を番号m(1〜Ns)で区別して表記する。m番目の音源からの音源信号を短時間フーリエ変換等を用いて周波数領域信号に変換した信号s(m) nを、式(1)に示すように表記する。また、観測信号の周波数領域信号xnを式(2)、短時間フレームn、周波数ビンkにおける全ての音源信号を要素に持つ集合sn,kを式(3)、全ての音源信号に関する音源パラメータの集合θnを式(4)で表す。
関数を最大化する音源パラメータを効率的に求めることができる。つまり、占有的な音源
mに関する項が独立に扱えるため、音源パラメータ推定の繰り返し計算を、個別の音源パ
ラメータに閉じて最適化する処理に分解することができ、効率的な計算が可能となる。
うに書き換えることができる。
〔音源分離装置〕
図4にこの発明の音源分離装置200の機能構成例を示す。音源分離装置200は、
上記した音源パラメータ推定装置100が出力する音源パラメータと各音源占有度と、観測信号を入力として、音源信号の推定値を計算する音源分離部30とを具備する。
この発明による音源パラメータ推定方法と音源分離方法の効果を確認する目的で、二人の話者からなる混合音を分離する確認実験を行った。混合音としては、女性+男性(F−M)、女性+女性(F+F)、男性+男性(M+M)の三種類を、個別の音声をコンピュータ上で加算して作成した。このとき、混合音のSIR(Signal-to-Interference Ratio)は0dBとした。図5に、この発明の音源パラメータ推定方法及び音源分離方法を用いて、上記した三種類の混合音を分離してSIRとSDR(Signal-to-Distortion Ratio)で評価した結果を示す。
また、各装置の機能構成部は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしても良い。
Claims (7)
- 複数の音源から発せられた音源信号を周波数領域の信号に変換した観測信号を入力として、占有的な音源の音源信号に関する部分関数とそれ以外の各音源の音源信号に関する部分関数との積で表せる観測モデルに基づき、音源モデル記憶部に記憶された上記各音源信号毎の確率密度関数を決定する音源パラメータを推定する音源パラメータ推定過程を、
含む音源パラメータ推定方法。 - 請求項1に記載した音源パラメータ推定方法において、
上記音源パラメータ推定過程は、
更新された音源パラメータを入力として、上記各音源信号の混合比と観測モデルと音源信号モデルに基づく各音源の占有度を更新する音源占有度更新ステップと、
上記観測モデルと上記音源モデルと上記各音源の占有度に基づく音源パラメータの評価関数を最大化することで各音源の音源パラメータを更新する上記複数の音源に対応した数の音源パラメータ更新ステップと、
を備えることを特徴とする音源パラメータ推定方法。 - 請求項1又は2に記載した音源パラメータ推定方法を含み、
上記音源パラメータ推定方法で推定した音源パラメータと各音源占有度と、上記観測信号を入力として、音源信号の推定値を計算する音源分離過程と、
を含む音源分離方法。 - 複数の音源に関して各音源信号毎に音源パラメータに依存して決まる各確率密度関数を記憶した音源モデル記憶部と、
上記音源信号を周波数領域の信号に変換した観測信号を入力として、占有的な音源の音源信号に関する部分関数と、それ以外の各音源の音源信号に関する部分関数との積で表せる観測モデルに基づき、上記音源パラメータを推定する音源パラメータ推定部と、
を具備する音源パラメータ推定装置。 - 請求項4に記載した音源パラメータ推定装置において、
上記音源パラメータ推定部は、
更新された音源パラメータを入力として、上記各音源信号の混合比と観測モデルと音源信号モデルに基づく各音源の占有度を更新する音源占有度更新部と、
上記観測モデルと上記音源モデルと上記各音源の占有度に基づく音源パラメータの評価関数を最大化することで各音源の音源パラメータを更新する上記複数の音源に対応した数の音源パラメータ更新部と、
を備えることを特徴とする音源パラメータ推定装置。 - 請求項4又は5に記載した音源パラメータ推定装置と、
上記音源パラメータ推定装置が出力する音源パラメータと各音源占有度と、上記観測信号を入力として、音源信号の推定値を計算する音源分離部と、
を具備する音源分離装置。 - 請求項4乃至6のいずれか1項に記載した音源パラメータ推定装置の各部の機能、または音源分離装置の各部の機能を、コンピュータに実行させるための装置プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010028986A JP5249968B2 (ja) | 2010-02-12 | 2010-02-12 | 音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010028986A JP5249968B2 (ja) | 2010-02-12 | 2010-02-12 | 音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011164468A true JP2011164468A (ja) | 2011-08-25 |
JP5249968B2 JP5249968B2 (ja) | 2013-07-31 |
Family
ID=44595196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010028986A Active JP5249968B2 (ja) | 2010-02-12 | 2010-02-12 | 音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5249968B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426437A (zh) * | 2012-05-04 | 2013-12-04 | 索尼电脑娱乐公司 | 使用利用混合多元概率密度函数的独立分量分析的源分离 |
-
2010
- 2010-02-12 JP JP2010028986A patent/JP5249968B2/ja active Active
Non-Patent Citations (2)
Title |
---|
CSNJ201010092249; 荒木 章子 Shoko ARAKI 中谷 智広 Tomohiro NAKATANI 澤田 宏 Hiroshi SAWADA: 'ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離 Source number estimation and' 日本音響学会 2009年 秋季研究発表会講演論文集CD-ROM [CD-ROM] , 200909, 日本音響学会 * |
JPN6013000704; 荒木 章子 Shoko ARAKI 中谷 智広 Tomohiro NAKATANI 澤田 宏 Hiroshi SAWADA: 'ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離 Source number estimation and' 日本音響学会 2009年 秋季研究発表会講演論文集CD-ROM [CD-ROM] , 200909, 日本音響学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426437A (zh) * | 2012-05-04 | 2013-12-04 | 索尼电脑娱乐公司 | 使用利用混合多元概率密度函数的独立分量分析的源分离 |
Also Published As
Publication number | Publication date |
---|---|
JP5249968B2 (ja) | 2013-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9721202B2 (en) | Non-negative matrix factorization regularized by recurrent neural networks for audio processing | |
US9966088B2 (en) | Online source separation | |
US20190208320A1 (en) | Sound source separation device, and method and program | |
JP5568530B2 (ja) | 音源分離装置とその方法とプログラム | |
JP2013033196A (ja) | 音響処理装置 | |
JP2008158035A (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
JP2009212599A (ja) | 残響除去装置とその方法と、そのプログラムと記録媒体 | |
JP5351856B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法と、プログラムと記憶媒体 | |
JP6505346B1 (ja) | Dnn音声合成の教師無し話者適応を実現するコンピュータシステム、そのコンピュータシステムにおいて実行される方法およびプログラム | |
WO2012105385A1 (ja) | 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム | |
JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
JP5249968B2 (ja) | 音源パラメータ推定方法と音源分離方法と、それらの装置と、プログラム | |
JP6567478B2 (ja) | 音源強調学習装置、音源強調装置、音源強調学習方法、プログラム、信号処理学習装置 | |
JP5438704B2 (ja) | 音源パラメータ推定装置と音源分離装置とそれらの方法とプログラム | |
JP2014228779A (ja) | 音声処理装置、方法およびプログラム | |
JP2007304445A (ja) | 周波数成分の修復・抽出方法、周波数成分の修復・抽出装置、周波数成分の修復・抽出プログラムならびに周波数成分の修復・抽出プログラムを記録した記録媒体 | |
JP4630203B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
Auvinen et al. | Automatic glottal inverse filtering with the Markov chain Monte Carlo method | |
JP6581054B2 (ja) | 音源分離装置、音源分離方法及び音源分離プログラム | |
JP2011164126A (ja) | 雑音抑圧フィルタ算出方法と、その装置と、プログラム | |
US20220141584A1 (en) | Latent variable optimization apparatus, filter coefficient optimization apparatus, latent variable optimization method, filter coefficient optimization method, and program | |
JP2019049685A (ja) | 音声抽出装置、音声抽出方法および音声抽出プログラム | |
JP6564744B2 (ja) | 信号解析装置、方法、及びプログラム | |
JP6498141B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
JP2021033466A (ja) | 符号化装置、復号装置、パラメータ学習装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110624 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5249968 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |