JP4964259B2 - パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム - Google Patents
パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム Download PDFInfo
- Publication number
- JP4964259B2 JP4964259B2 JP2009028270A JP2009028270A JP4964259B2 JP 4964259 B2 JP4964259 B2 JP 4964259B2 JP 2009028270 A JP2009028270 A JP 2009028270A JP 2009028270 A JP2009028270 A JP 2009028270A JP 4964259 B2 JP4964259 B2 JP 4964259B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- parameter
- distribution model
- probability distribution
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
ここで、周波数観測信号ベクトルは、以下の式(1)で表されると仮定する。
xj(f,t)≒hjn(f)sn(f,t) (2)
となる。ここで、周波数音源信号sn(f,t)は時間周波数スロット(f,t)にて支配的な音源信号である。
μn(f,t)=Dcosφn(f,t)/v (4)
となる。ただし、Dは第1収音手段21、第2収音手段22との距離であり、vは音速である。
dft=arg[x1(f,t)/x2(f,t)] (5)
ここで、前記式(2)(3)より音源10nが支配的な時間周波数スロット(f,t)では以下の式(6)、(7)が成り立つ。
yn(f,t)=x1(f,t)Ln(f,t) (10)
そして、時間領域変換部74は、分離信号yn(f,t)を時間領域に変換することで、時間領域分離信号yn(t)を得る。
2πfμn(f,t)=dft+2πk (11)
=arg[x1(f,t)/x2(f,t)]+2πk
(12)
の関係を満たす−π<dft=arg[x1(f,t)/x2(f,t)]<πとして返されてしまうためである。これを「空間的エイリアジングの問題」や、「2πkの不定性がある」という。ここで、kはμn(f,t)の値が既知であれば、一意に決まる整数であり、不定性係数kという。ただし、一般的には、μn(f,t)の値は未知であるため、不定性係数kは推定すべき整数である。
aft=│xj(f,t)│ ただしj=1,2 (13)
位相差計算部34は時間周波数スロット(f,t)ごとに、第1収音手段21と第2収音手段22との間の位相差dftを計算する(ステップS104)。具体的には、前記式(5)により計算する。念のため式(5)を以下に示す。
dft=arg[x1(f,t)/x2(f,t)] (5)
次に、音源数が2以上(すなわちクラスタが2つ以上)の場合を考える。図6Bに音源数が2の場合の位相差dftの分布を示す。図6Bからも理解されるように、2つの山(=クラスタ)ができることがわかる。このクラスタにそれぞれ1つの正規分布モデルを当てはめることを考える。つまり、分布全体を以下の式(16)で示される混合正規分布モデルG(GMM)で当てはめることを考える。
│Q(θ│θr+1)−Q(θ│θr)│<Δ (29)
このようにして、推定部200は、各音源に対応するクラスタを正規分布モデルで当てはめたときのパラメタθ=(μm,σm,αm)を出力する。
ym’(f,t)=x1(f,t)Ωm’(f,t) (31)
分離部44よりの分離信号ym’(f,t)は、時間領域変換部46に入力される。そして、時間領域変換部46は、分離信号ym’(f,t)を時間領域に変換して時間領域分離信号ym’(t)を求め、出力する。
音源分離装置500の音源分離部72
→音源分離装置300のマスク作成部42と分離部44を統合したもの
音源分離装置500の周波数領域変換部30と位相差計算部34と分類部70を統合
したもの→音源分離装置300のパラメタ推定装置100
また、従来の音源分離装置500では、音源数が既知である場合が多いため、音源分離装置500は、音源分離装置300の有効音源推定部40に対応するものを有していなかった。
φm’=arccos(μm’・v/D) (32)
次に、実施例2で説明した音源分離装置(以下、「本願法」という。)と従来技術で説明した音源分離装置(以下、「従来法」という。)との効果の違いを説明する。まず、図11を用いて、実験条件について説明する。長手方向4.45m(=Lb、以下、「長手辺」という。)、短手方向3.55m(=La、以下、「短手辺」という。)、高さ2.5mの室内に、第1収音手段21、第2収音手段22が部屋の短手方向に一直線上に配置されている。第1収音手段21と第2収音手段22との収音手段間隔Dは20cmである。第1収音手段21と第2収音手段22(この実験例では両方ともマイクロホン)とを結ぶ線分の中央の点をCとする。点Cから部屋の短手方向の辺までの距離Lbは2.25mとし、点Cから部屋の長手方向の辺までの距離Lcは1.75mとする。点Cを中心とし、半径0.55mの円をRとし、図11記載の円Rの円周上に3つの音源(スピーカ)を配置させる。詳細には、点Cを通り長手辺と垂直に交わる直線と、円Rとが交わる箇所を角度0度とした場合に、時計と反対周りの円周方向の様々な角度(図11では、45度、90度、135度)に配置させる。マイクロホンは高さは1.39mとし、スピーカの高さは1.35mとし、サンプリング周波数を16kHzとした。これは、音源信号の周波数が850Hz以上で空間的エイリアジング現象が起こる条件である。
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本実施例の単語追加装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
パラメタ推定装置100、音源分離装置300、方向推定装置400、の入力部、出力部は、所定のプログラムが読み込まれたCPUの制御のもと駆動するLANカード、モデム等の通信装置である。その他の構成部は、所定のプログラムがCPUに読み込まれ、実行されることによって構築される演算部である。記憶部は前記補助記憶装置として機能する。
Claims (9)
- 複数の音源それぞれからの音源信号が混合され、2個の収音手段で収音された観測信号を周波数領域に変換することで周波数観測信号を生成する周波数領域変換部と、
前記周波数観測信号の前記収音手段間の位相差を計算する位相差計算部と、
前記位相差の分布に当てはまり、周波数依存性のある確率分布モデルのパラメタを推定する推定部と、を有するパラメタ推定装置。 - 請求項1記載のパラメタ推定装置であって、
前記推定部は、
現在の前記確率分布モデルの各パラメタを保持するパラメタ保持部と、
前記推定部は、前記位相差と、前記現在の確率分布モデルの各パラメタと、を用いて確率分布モデルごとに事後確率を計算する事後確率計算部と、
確率分布モデルの各パラメタ値を更新する更新部と、を有するパラメタ推定装置。 - 請求項1または2記載のパラメタ推定装置と、
音源に該当する確率分布モデルを示す音源該当情報を求める有効音源推定部と、
前記音源該当情報が示す確率分布モデルごとのマスクを作成するマスク作成部と、
前記周波数観測信号に前記マスクを乗算することで、分離信号を求める分離部と、
前記分離信号を時間領域に変換する時間領域変換部と、を有することを特徴とする音源分離装置。 - 請求項1または2記載のパラメタ推定装置と、
音源に該当する確率分布モデルを示す音源該当情報を求める有効音源推定部と、
前記音源該当情報が示す確率分布モデルの平均を出力する方向出力部と、を有することを特徴とする方向推定装置。 - 複数の音源それぞれからの音源信号が混合され、2個の収音手段で収音された観測信号を周波数領域に変換することで周波数観測信号を生成する周波数領域変換過程と、
前記周波数観測信号の前記収音手段間の位相差を計算する位相差計算過程と、
前記位相差の分布に当てはまり、周波数依存性のある確率分布モデルのパラメタを推定する推定過程と、を有するパラメタ推定方法。 - 請求項5記載のパラメタ推定方法であって、
前記推定過程は、
現在の前記確率分布モデルの各パラメタを保持するパラメタ保持過程と、
前記推定過程は、前記位相差と、前記現在の確率分布モデルの各パラメタと、を用いて確率分布モデルごとに事後確率を計算する事後確率計算過程と、
確率分布モデルの各パラメタ値を更新する更新過程と、を有するパラメタ推定方法。 - 請求項5または6記載のパラメタ推定方法の各過程と、
音源に該当する確率分布モデルを示す音源該当情報を求める有効音源推定過程と、
前記音源該当情報が示す確率分布モデルごとのマスクを作成するマスク作成過程と、
前記周波数観測信号に前記マスクを乗算することで、分離信号を求める分離過程と、
前記分離信号を時間領域に変換する時間領域変換過程と、を有することを特徴とする音源分離方法。 - 請求項5または6記載のパラメタ推定方法の各過程と、
音源に該当する確率分布モデルを示す音源該当情報を求める有効音源推定過程と、
前記音源該当情報が示す確率分布モデルの平均を出力する方向出力過程と、を有することを特徴とする方向推定方法。 - 請求項5または6記載のパラメタ推定方法、または請求項7記載の音源分離方法、または請求項8記載の方向推定方法の各過程をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009028270A JP4964259B2 (ja) | 2009-02-10 | 2009-02-10 | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009028270A JP4964259B2 (ja) | 2009-02-10 | 2009-02-10 | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010187066A JP2010187066A (ja) | 2010-08-26 |
JP4964259B2 true JP4964259B2 (ja) | 2012-06-27 |
Family
ID=42767471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009028270A Expired - Fee Related JP4964259B2 (ja) | 2009-02-10 | 2009-02-10 | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4964259B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11158334B2 (en) | 2018-03-29 | 2021-10-26 | Sony Corporation | Sound source direction estimation device, sound source direction estimation method, and program |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5726790B2 (ja) * | 2012-03-09 | 2015-06-03 | 日本電信電話株式会社 | 音源分離装置、音源分離方法、およびプログラム |
JP5769670B2 (ja) * | 2012-07-10 | 2015-08-26 | 日本電信電話株式会社 | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム |
JP5769671B2 (ja) * | 2012-07-10 | 2015-08-26 | 日本電信電話株式会社 | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム |
KR101825810B1 (ko) * | 2016-05-09 | 2018-02-05 | 한국해양대학교 산학협력단 | 위상 차이를 이용한 선박용 디지털 음향수신장치의 방향 탐지 방법 및 장치 |
KR101840328B1 (ko) | 2017-01-18 | 2018-03-20 | 한국과학기술원 | 3d 레이저 스캐너 |
JP6636973B2 (ja) * | 2017-03-01 | 2020-01-29 | 日本電信電話株式会社 | マスク推定装置、マスク推定方法およびマスク推定プログラム |
DE112021007311T5 (de) | 2021-05-20 | 2024-01-04 | Mitsubishi Electric Corporation | Klangbilderfassungsvorrichtung, klangbilderfassungsverfahren und klangbilderfassungsprogramm |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4676920B2 (ja) * | 2006-05-12 | 2011-04-27 | 日本電信電話株式会社 | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 |
JP2008145610A (ja) * | 2006-12-07 | 2008-06-26 | Univ Of Tokyo | 音源分離定位方法 |
JP4746533B2 (ja) * | 2006-12-21 | 2011-08-10 | 日本電信電話株式会社 | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 |
JP5134525B2 (ja) * | 2008-12-19 | 2013-01-30 | 日本電信電話株式会社 | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム |
-
2009
- 2009-02-10 JP JP2009028270A patent/JP4964259B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11158334B2 (en) | 2018-03-29 | 2021-10-26 | Sony Corporation | Sound source direction estimation device, sound source direction estimation method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2010187066A (ja) | 2010-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4964259B2 (ja) | パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム | |
EP3479377B1 (en) | Speech recognition | |
CN110148422B (zh) | 基于传声器阵列确定声源信息的方法、装置及电子设备 | |
JP3949150B2 (ja) | 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体 | |
JP4746533B2 (ja) | 多音源有音区間判定装置、方法、プログラム及びその記録媒体 | |
WO2021044551A1 (ja) | 到来方向推定装置、モデル学習装置、到来方向推定方法、モデル学習方法、プログラム | |
US20140358534A1 (en) | General Sound Decomposition Models | |
JP5134525B2 (ja) | 方向情報分布推定装置、音源数推定装置、音源方向測定装置、音源分離装置、それらの方法、それらのプログラム | |
BR112014027494B1 (pt) | aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento | |
JP4769238B2 (ja) | 信号分離装置、信号分離方法、プログラム及び記録媒体 | |
JP6822294B2 (ja) | 評価プログラム、情報処理装置、及び評価方法 | |
JP6059072B2 (ja) | モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム | |
JP2019066339A (ja) | 音による診断装置、診断方法、および診断システム | |
JP6721165B2 (ja) | 入力音マスク処理学習装置、入力データ処理関数学習装置、入力音マスク処理学習方法、入力データ処理関数学習方法、プログラム | |
JP5726790B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
WO2012105385A1 (ja) | 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム | |
JP4676893B2 (ja) | 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP2018077139A (ja) | 音場推定装置、音場推定方法、プログラム | |
JP6517124B2 (ja) | 雑音抑圧装置、雑音抑圧方法、およびプログラム | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
JP2020076907A (ja) | 信号処理装置、信号処理プログラム及び信号処理方法 | |
WO2022176045A1 (ja) | モデル学習装置、到来方向推定装置、モデル学習方法、到来方向推定方法、プログラム | |
CN111192569B (zh) | 双麦语音特征提取方法、装置、计算机设备和存储介质 | |
JP2007226036A (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP6114053B2 (ja) | 音源分離装置、音源分離方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101214 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120321 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120327 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |