JP5113096B2 - 音源分離方法、装置およびプログラム - Google Patents
音源分離方法、装置およびプログラム Download PDFInfo
- Publication number
- JP5113096B2 JP5113096B2 JP2009010843A JP2009010843A JP5113096B2 JP 5113096 B2 JP5113096 B2 JP 5113096B2 JP 2009010843 A JP2009010843 A JP 2009010843A JP 2009010843 A JP2009010843 A JP 2009010843A JP 5113096 B2 JP5113096 B2 JP 5113096B2
- Authority
- JP
- Japan
- Prior art keywords
- time frequency
- sound
- gain
- main
- frequency component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
R.F.Lyon: "A computational model of binaural localization and separation, " In Proc. ICASSP, 1983. M. Bodden: "Modeling human sound-source localization and the cocktail-party-effect," Acta Acoustica, vol.1, pp.43--55, 1993. O. Yilmaz and S. Rickard: "Blind Separation of Speech Mixtures via Time-Frequency Masking," IEEE Transaction on Signal Processing, Vol. 52, No. 7, pp. 1830-1847, 2004. S. Rickard and O. Yilmaz: "On the Approximate W-disjoint Orthogonality of Speech," Proc. ICASSP, Vol. I, pp. 529-532, 2002.
Claims (5)
- 主・副マイクロホンが出力する受音信号から目的音成分および妨害音成分の少なくとも一方を分離して出力する音源分離方法において、
主・副マイクロホンの信号経路において、主・副マイクロホンが出力する受音信号をそれぞれ時間周波数成分に変換する第1のステップと、
主・副マイクロホンの信号経路の少なくとも一方において、時間周波数成分へ変換される前の受音信号、あるいは時間周波数成分へ変換された後の時間周波数成分にゲインを付与する第2のステップと、
前記第2のステップによりゲインが付与され、前記第1のステップにより変換された後の時間周波数成分の振幅を各時間周波数成分ごとに比較し、マスクパターンを生成する第3のステップと、
前記第2のステップによりゲインが付与され、前記第1のステップにより変換された後の時間周波数成分の少なくとも一方を、前記第3のステップにより生成されるマスクパターンを用いてマスキングする第4のステップと、
前記第4のステップにより出力される時間周波数成分を合成する第5のステップを有することを特徴とする音源分離方法。 - 主・副マイクロホンが出力する受音信号から目的音成分および妨害音成分の少なくとも一方を分離して出力する音源分離装置において、
主・副マイクロホンの信号経路に設けられ、主・副マイクロホンが出力する受音信号をそれぞれ時間周波数成分に変換する変換手段と、
主・副マイクロホンの信号経路の少なくとも一方に設けられ、時間周波数成分へ変換される前の受音信号、あるいは時間周波数成分へ変換された後の時間周波数成分にゲインを付与するゲイン付与手段と、
前記ゲイン付与手段によりゲインが付与され、前記変換手段により変換された後の時間周波数成分の振幅を各時間周波数成分ごとに比較し、マスクパターンを生成するレベル差比較手段と、
前記ゲイン付与手段によりゲインが付与され、前記変換手段により変換された後の時間周波数成分の少なくとも一方を、前記レベル差比較手段により生成されるマスクパターンを用いてマスキングするマスキング処理手段と、
前記マスキング処理手段から出力される時間周波数成分を合成する時間周波数合成手段を備えたことを特徴とする音源分離装置。 - 前記ゲイン付与手段で付与されるゲインは、妨害音に対して主・副マイクロホンがそれぞれ出力する受音信号の時間周波数成分間に振幅差を生じさせ、かつ目的音に対して主・副マイクロホンがそれぞれ出力する受音信号の時間周波数成分の振幅の大小関係が逆転しないように、一定値あるいは周波数依存値に設定されることを特徴とする請求項2に記載の音源分離装置。
- 前記ゲイン付与手段は、主マイクロホンの信号経路における時間周波数成分に周波数依存値のゲインを付与し、さらに、主マイクロホンの信号経路を通して前記マスキング処理手段に入力される時間周波数成分あるいは前記マスキング処理手段から出力される、主マイクロホンの信号経路の時間周波数成分に対し、前記ゲイン付与手段でのゲイン付与と逆の処理を施してゲインを除去するゲイン除去手段を備えたことを特徴とする請求項2または3に記載の音源分離装置。
- 主・副マイクロホンが出力する受音信号から目的音成分および妨害音成分の少なくとも一方を分離して出力する機能を実現するプログラムであって、コンピュータに、
主・副マイクロホンの信号経路において、主・副マイクロホンが出力する受音信号をそれぞれ時間周波数成分に変換する第1の機能と、
主・副マイクロホンの信号経路の少なくとも一方において、時間周波数成分へ変換される前の受音信号、あるいは時間周波数成分へ変換された後の時間周波数成分にゲインを付与する第2の機能と、
前記第2の機能によりゲインが付与され、前記第1の機能により変換された後の時間周波数成分の振幅を各時間周波数成分ごとに比較し、マスクパターンを生成する第3の機能と、
前記第2の機能によりゲインが付与され、前記第1の機能により変換された後の時間周波数成分の少なくとも一方を、前記第3の機能により生成されるマスクパターンを用いてマスキングする第4の機能と、
前記第4の機能により出力される時間周波数成分を合成する第5の機能を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009010843A JP5113096B2 (ja) | 2009-01-21 | 2009-01-21 | 音源分離方法、装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009010843A JP5113096B2 (ja) | 2009-01-21 | 2009-01-21 | 音源分離方法、装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010171585A JP2010171585A (ja) | 2010-08-05 |
JP5113096B2 true JP5113096B2 (ja) | 2013-01-09 |
Family
ID=42703300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009010843A Expired - Fee Related JP5113096B2 (ja) | 2009-01-21 | 2009-01-21 | 音源分離方法、装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5113096B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6524463B2 (ja) * | 2014-12-26 | 2019-06-05 | Kddi株式会社 | 自動ミキシング装置およびプログラム |
CN111276155B (zh) * | 2019-12-20 | 2023-05-30 | 上海明略人工智能(集团)有限公司 | 语音分离方法、装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3434215B2 (ja) * | 1998-02-20 | 2003-08-04 | 日本電信電話株式会社 | 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体 |
-
2009
- 2009-01-21 JP JP2009010843A patent/JP5113096B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010171585A (ja) | 2010-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5375400B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
US7243060B2 (en) | Single channel sound separation | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
US9881634B1 (en) | Multi-microphone speech processing system | |
KR102191736B1 (ko) | 인공신경망을 이용한 음성향상방법 및 장치 | |
KR20090037692A (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
KR20120114327A (ko) | 레벨 큐를 사용한 적응형 잡음 감소 | |
JP6482173B2 (ja) | 音響信号処理装置およびその方法 | |
CN105491495B (zh) | 基于确定性序列的反馈估计 | |
Barros et al. | Estimation of speech embedded in a reverberant and noisy environment by independent component analysis and wavelets | |
JP5107956B2 (ja) | 雑音抑圧方法、装置およびプログラム | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JP5113096B2 (ja) | 音源分離方法、装置およびプログラム | |
KR101658001B1 (ko) | 강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법 | |
JP6524463B2 (ja) | 自動ミキシング装置およびプログラム | |
KR101547344B1 (ko) | 음성복원장치 및 그 방법 | |
Gergen et al. | Source separation by feature-based clustering of microphones in ad hoc arrays | |
KR101966175B1 (ko) | 잡음 제거 장치 및 방법 | |
KR102044970B1 (ko) | 환경 특징 추출 방법 및 이를 이용한 보청기 작동 방법 | |
JP6790659B2 (ja) | 音響処理装置および音響処理方法 | |
Pandey et al. | Attentive Training: A New Training Framework for Talker-independent Speaker Extraction. | |
JP6519801B2 (ja) | 信号解析装置、方法、及びプログラム | |
JP2017040752A (ja) | 音声判定装置、方法及びプログラム、並びに、音声信号処理装置 | |
JP2007178590A (ja) | 目的信号抽出装置、目的信号抽出方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120919 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121011 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5113096 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |