JP5170465B2 - 音源分離装置、方法及びプログラム - Google Patents
音源分離装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5170465B2 JP5170465B2 JP2009282025A JP2009282025A JP5170465B2 JP 5170465 B2 JP5170465 B2 JP 5170465B2 JP 2009282025 A JP2009282025 A JP 2009282025A JP 2009282025 A JP2009282025 A JP 2009282025A JP 5170465 B2 JP5170465 B2 JP 5170465B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- signal
- frequency
- received
- correcting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
(第1の目的音優勢の信号のスペクトル)−(目的音劣勢の信号のスペクトル)
が演算され、目的音を含む一方の分離音のスペクトルを得る。
(第2の目的音優勢の信号のスペクトル)−(目的音劣勢の信号のスペクトル)
が演算され、目的音を含む他方の分離音のスペクトルを得る。
そこで、マイク2の出力信号X2(t)から、マイク1の出力信号X1(t)を時間差τだけ遅延させた出力信号X1(t−τ)を減じると、お互いが相殺され、抑圧角度θ方向からの音は抑圧される。
そして、第1の本発明は、各信号特性補正手段が、複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正部と、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正部とを有することを特徴とする。
また、第2の本発明は、各信号特性補正手段が、複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正部と、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正部とを有することを特徴とする。
そして、第3の本発明は、信号特性補正工程において、複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正工程と、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正工程とを有することを特徴とする。
また、第4の本発明は、信号特性補正手工程において、複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正工程と、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正工程とを有することを特徴とする。
そして、第5の本発明は、信号特性補正手段が、複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正部、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正部として機能させることを特徴とする。
また、第6の本発明は、信号特性補正手段が、複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、各受音信号に付与するマイクゲインを同一に補正する利得補正部、利得補正部により求められた補正されたマイクゲインを用いて、周波数分析手段からの各受音信号の周波数成分の特性を補正する受音信号補正部として機能させることを特徴とする。
以下では、本発明の音源分離装置、方法及びプログラムの第1の実施形態を図面を参照しながら説明する。
図1は、第1の実施形態の音源分離装置10Aの内部構成を示すブロック図である。
以上のように、第1の実施形態によれば、入力手段における複数のマイクロフォンのマイクゲインのばらつきに関わらず、所望の空間フィルタ特性を得ることができ、その結果、分離後の合成音を非常に聞きやすくすることができる。
次に、本発明の音源分離装置、方法及びプログラムの第2の実施形態を図面を参照しながら説明する。
図3は、第2の実施形態の音源分離装置10Bの内部構成を示すブロック図である。
と第2振幅値算出部362からの振幅値A2(m)とに基づいて、マイクロフォンM22から出力される受音信号に与える利得(ゲイン)を求め、その補正したゲイン値G1を乗算部33に与える。
以上のように、第2の実施形態によれば、マイクの実装、回路構成による振幅特性のばらつきに関わらず、所望の空間フィルタ特性を得ることができ、その結果、分離後の合成音を非常に聞きやすくすることができる。
次に、本発明の音声分離装置、方法及びプログラムの第3の実施形態を図面を参照しながら説明する。
図5は、第3の実施形態の音声分離装置10Cの内部構成を示すブロック図である。図5において、第3の実施形態の音声分離装置10Cは、音源分離手段110A、音源分離手段110B、除去手段51、生成手段60を少なくとも有して構成される。
以上のように、第3の実施形態によれば、マイクロフォンの個数を3個以上とする場合にも適用することができる。
(D−1)第1〜第3の実施形態で説明した音源分離装置及びプログラムは、例えば、音声認識が必要なロボットとの対話、音声認識による音声操作を行うカーナビゲーションシステム等の車載機器、音声メッセージを録音することができる電話システムや電話会議システム、他の装置からの音響又は音声を録音するシステム等幅広く適用することができる。
20及び120…入力手段、M21、M22、M121及びM122…マイクロフォン、
30及び131…分析手段、31及び32…周波数分析部、
70及び80…信号特性補正手段、33及び34…乗算部、35…ゲイン算出部、
36…平均算出部、351…第1パワー算出部、352…第2パワー算出部、
353及び363…第1ゲイン算出部、354及び364…第2ゲイン算出部、
361…第1振幅値算出部、362…第2振幅値算出部、
40…分離手段、41、42、43…空間フィルタ、44…最小選択部、
50及び51…除去手段、60…生成手段。
Claims (6)
- 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離装置において、
所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する1又は複数の入力手段と、
上記各入力手段からの上記各受音信号の周波数成分を分析する1又は複数の周波数分析手段と、
上記各周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する1又は複数の信号特性補正手段と、
上記各信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する1又は複数の分離手段と、
上記各分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去手段と
を備え、
上記各信号特性補正手段が、
上記複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正部と、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正部と
を有することを特徴とする音源分離装置。 - 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離装置において、
所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する1又は複数の入力手段と、
上記各入力手段からの上記各受音信号の周波数成分を分析する1又は複数の周波数分析手段と、
上記各周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する1又は複数の信号特性補正手段と、
上記各信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する1又は複数の分離手段と、
上記各分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去手段と
を備え、
上記各信号特性補正手段が、
上記複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正部と、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正部と
を有することを特徴とする音源分離装置。 - 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離装置の音源分離方法において、
入力手段が、所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する入力工程と、
周波数分析手段が、上記入力手段からの上記各受音信号の周波数成分を分析する周波数分析工程と、
信号特性補正手段が、上記周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する信号特性補正工程と、
分離手段が、上記信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する分離工程と、
除去手段が、上記分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去工程と
を有し、
上記信号特性補正工程において、
上記複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正工程と、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正工程と
を有することを特徴とする音源分離方法。 - 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離装置の音源分離方法において、
入力手段が、所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する入力工程と、
周波数分析手段が、上記入力手段からの上記各受音信号の周波数成分を分析する周波数分析工程と、
信号特性補正手段が、上記周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する信号特性補正工程と、
分離手段が、上記信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する分離工程と、
除去手段が、上記分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去工程と
を有し、
上記信号特性補正手工程において、
上記複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正工程と、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正工程と
を有することを特徴とする音源分離方法。 - 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離プログラムにおいて、
所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する1又は複数の入力手段を備える音源分離装置を、
上記各入力手段からの上記各受音信号の周波数成分を分析する周波数分析手段、
上記周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する信号特性補正手段、
上記信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する分離手段、
上記分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去手段
として機能させ、
上記信号特性補正手段が、
上記複数の受音信号の周波数成分に基づく所定時間区間のそれぞれのパワー値を加算した値を、補正対象のマイクロフォンからの受音信号のパワー値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正部、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正部
として機能させることを特徴とする音源分離プログラム。 - 目的音と、上記目的音の音源とは異なる音源から発生した妨害音とを分離する音源分離プログラムにおいて、
所定の受音処理に従って、2個のマイクロフォンから入力した入力音を受音信号に変換する1又は複数の入力手段を備える音源分離装置を、
上記各入力手段からの上記各受音信号の周波数成分を分析する周波数分析手段、
上記周波数分析手段からの上記各受音信号の周波数成分に基づいて、上記複数の受音信号の周波数成分の特性を補正する信号特性補正手段、
上記信号特性補正手段により周波数成分の特性が補正された上記各受音信号の周波数成分に基づき、上記目的音の到来方向以外の所定方向から到来した音の周波数成分を抑圧して得た1又は複数の第1音信号成分と、上記目的音の到来方向から音の周波数成分を抑圧して得た第2音信号成分とを分離する分離手段、
上記分離手段からの上記1又は複数の第1音信号成分と上記第2音信号成分とを用いて、上記目的音の特性を示す目的音特性成分を求める除去手段
として機能させ、
上記信号特性補正手段が、
上記複数の受音信号の周波数成分の振幅値を加算した値を、補正対象のマイクフォンからの受音信号の振幅値で割った値に応じて、上記各受音信号に付与するマイクゲインを同一に補正する利得補正部、
上記利得補正部により求められた補正されたマイクゲインを用いて、上記周波数分析手段からの上記各受音信号の周波数成分の特性を補正する受音信号補正部
として機能させることを特徴とする音源分離プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009282025A JP5170465B2 (ja) | 2009-12-11 | 2009-12-11 | 音源分離装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009282025A JP5170465B2 (ja) | 2009-12-11 | 2009-12-11 | 音源分離装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011124873A JP2011124873A (ja) | 2011-06-23 |
JP5170465B2 true JP5170465B2 (ja) | 2013-03-27 |
Family
ID=44288314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009282025A Active JP5170465B2 (ja) | 2009-12-11 | 2009-12-11 | 音源分離装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5170465B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112014006281T5 (de) * | 2014-01-28 | 2016-10-20 | Mitsubishi Electric Corporation | Tonsammelvorrichtung, Korrekturverfahren für Eingangssignal von Tonsammelvorrichtung und Mobilgeräte-Informationssystem |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09199961A (ja) * | 1996-01-22 | 1997-07-31 | Oki Electric Ind Co Ltd | Agc装置 |
JP3484112B2 (ja) * | 1999-09-27 | 2004-01-06 | 株式会社東芝 | 雑音成分抑圧処理装置および雑音成分抑圧処理方法 |
JP4583781B2 (ja) * | 2003-06-12 | 2010-11-17 | アルパイン株式会社 | 音声補正装置 |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
JP2006319786A (ja) * | 2005-05-13 | 2006-11-24 | Sony Corp | 音場測定装置及び音場測定方法 |
WO2007018293A1 (ja) * | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
-
2009
- 2009-12-11 JP JP2009282025A patent/JP5170465B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011124873A (ja) | 2011-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4986248B2 (ja) | 音源分離装置、方法及びプログラム | |
JP4912036B2 (ja) | 指向性集音装置、指向性集音方法、及びコンピュータプログラム | |
US9986332B2 (en) | Sound pick-up apparatus and method | |
JP3940662B2 (ja) | 音響信号処理方法及び音響信号処理装置及び音声認識装置 | |
US7991166B2 (en) | Microphone apparatus | |
JP5383867B2 (ja) | オーディオ信号の分解および修正のためのシステムおよび方法 | |
JP2004187283A (ja) | マイクロホン装置および再生装置 | |
JP5620689B2 (ja) | 残響抑圧装置及び残響抑圧方法 | |
US11647344B2 (en) | Hearing device with end-to-end neural network | |
JP2011203414A (ja) | 雑音及び残響抑圧装置及びその方法 | |
JP2011119898A (ja) | 音声取得装置、音声取得方法、音声取得プログラム | |
JP5105336B2 (ja) | 音源分離装置、プログラム及び方法 | |
JP6840302B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP5170465B2 (ja) | 音源分離装置、方法及びプログラム | |
CN113223544A (zh) | 音频的方向定位侦测装置及方法以及音频处理系统 | |
JP4886616B2 (ja) | 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体 | |
JP5635024B2 (ja) | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム | |
JP2007067549A (ja) | 収音装置とその方法とそのプログラムとその記録媒体 | |
Wang et al. | Two-stage enhancement of noisy and reverberant microphone array speech for automatic speech recognition systems trained with only clean speech | |
WO2018167921A1 (ja) | 信号処理装置 | |
JP2001313992A (ja) | 収音装置および収音方法 | |
JP2007028391A (ja) | マイクロホンアレー装置 | |
JP2012049715A (ja) | 音源分離装置、音源分離方法、及び、プログラム | |
US10249286B1 (en) | Adaptive beamforming using Kepstrum-based filters | |
JP2016126136A (ja) | 自動ミキシング装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120308 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120612 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120907 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120918 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5170465 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |