JP2010054728A - 音源抽出装置 - Google Patents
音源抽出装置 Download PDFInfo
- Publication number
- JP2010054728A JP2010054728A JP2008218565A JP2008218565A JP2010054728A JP 2010054728 A JP2010054728 A JP 2010054728A JP 2008218565 A JP2008218565 A JP 2008218565A JP 2008218565 A JP2008218565 A JP 2008218565A JP 2010054728 A JP2010054728 A JP 2010054728A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- sound
- sound source
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 99
- 238000012937 correction Methods 0.000 claims abstract description 41
- 230000001629 suppression Effects 0.000 claims description 47
- 238000000605 extraction Methods 0.000 claims description 25
- 238000002156 mixing Methods 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000003111 delayed effect Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract description 2
- 238000000034 method Methods 0.000 description 37
- 230000002159 abnormal effect Effects 0.000 description 24
- 239000011159 matrix material Substances 0.000 description 24
- 230000008569 process Effects 0.000 description 22
- 238000000926 separation method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 230000006978 adaptation Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000037433 frameshift Effects 0.000 description 3
- 238000012880 independent component analysis Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 101150093676 HUB2 gene Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 241000736851 Tagetes Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】本発明の多チャンネル空間予測及び歪み補正処理により、室内残響環境で、複数の音声が混ざりあった音を音源毎に高精度に分離することが可能となる。
【選択図】図4
Description
図1に、本発明の第一の実施例のハードウェア構成を示す。複数のマイクロホン素子を有するマイクロホンアレイ101にて取り込んだアナログ音圧は、AD変換装置102に送られ、アナログからデジタルデータに変換される。デジタルデータへの変換処理は、マイクロホン素子毎に行われる。変換された各マイクロホン素子のデジタル音圧データは、中央演算装置103に送られ、デジタル信号処理を施される。この際、デジタル信号処理を行うソフトウェア及び必要なデータは不揮発性メモリ105に予め記憶されており、また処理に必要なワークエリアは揮発性メモリ104上に確保される。デジタル信号処理により処理された音圧データはDA変換装置106に送られ、デジタルデータからアナログ音圧に変換される。変換後、スピーカ107から出力され、再生される。本発明の第一実施例におけるソフトウェアブロックは全て中央演算装置103上で実行されるものとする。
mはマイクロホン素子のインデックスを表し、1からMまでの値をとる。Mは雑音抑圧処理に用いるマイクロホン素子数とする。tはサンプリング間隔単位の時間インデックスとする。
Claims (7)
- 複数のマイクロホン素子からなるマイクロホンアレイと、
前記マイクロホンアレイから出力されるアナログ信号をデジタル信号に変換するAD変換装置と、
計算装置と、
記憶装置とを有し、
前記計算装置は、前記AD変換装置によって変換されたデジタル信号中の雑音成分を抑圧するようなデジタル信号処理を施し、雑音抑圧信号を取り出した後、該雑音抑圧信号中に含まれる目的音の歪みを補正し、補正後の信号を再生又は前記記憶装置に記憶することを特徴とする音源抽出装置。 - 請求項1に記載の音源抽出装置において、前記計算装置は、前記複数のマイクロホン素子のうちの1つの素子に含まれる雑音信号を当該素子以外の素子に含まれる雑音信号に第1のFIRフィルタをかけたものの和で近似するとともに近似誤差の2乗和が最少となるように前記第1のFIRフィルタの係数を決定する多チャンネル空間予測部を有し、前記雑音抑圧信号を、前記複数のマイクロホン素子のうちの任意の1素子の信号から当該素子以外の素子に含まれる信号に前記多チャンネル空間予測部で予測した前記第1のFIRフィルタを重畳したものの和を差し引くことで生成することを特徴とする音源抽出装置。
- 請求項2に記載の音源抽出装置において、前記雑音抑圧信号を前記マイクロホンアレイの全てのマイクロホン素子の出力に対して個々に生成し、生成した複数の雑音抑圧信号に第2のFIRフィルタを施して1チャンネルの歪み補正信号を得る多チャンネル歪み補正部を有し、前記歪み補正信号と前記マイクロホンアレイの中の特定のマイクロホン素子の出力信号又はその遅延信号との間の2乗誤差とマイクロホン素子の入力信号が雑音のみの場合の歪み補正信号の2乗和に定数値を掛けたものとの和が最も小さくなるように、前記多チャンネル歪み補正部の前記第2のFIRフィルタを決定することを特徴とする音源抽出装置。
- 請求項3に記載の音源抽出装置において、雑音信号を推定する雑音信号推定部を有し、推定した雑音信号と歪み補正信号に個別の第3のFIRフィルタに重畳したものの和と、前記マイクロホンアレイの中の特定のマイクロホン素子の出力信号又はその遅延信号との間の2乗誤差が最も小さくなるように前記第3のFIRフィルタを決定し、歪み補正信号に前記第3のFIRフィルタを重畳したものを出力する1チャンネル歪み補正部を有することを特徴とする音源抽出装置。
- 請求項4に記載の音源抽出装置において、ユーザーの目的音位置の指定操作により同定した目的音位置の情報に基づいて算出した短時間区間毎の目的音パワーと雑音パワーの比率から計算される混合度をもとに雑音区間を同定することを特徴とする音源抽出装置。
- 請求項5に記載の音源抽出装置において、前記同定した雑音区間の話速をそれ以外の区間の話速より速めて再生することを特徴とする音源抽出装置。
- 請求項5に記載の音源抽出装置において、前記同定した雑音区間以外の区間の音声のみ再生することを特徴とする音源抽出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008218565A JP5231139B2 (ja) | 2008-08-27 | 2008-08-27 | 音源抽出装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008218565A JP5231139B2 (ja) | 2008-08-27 | 2008-08-27 | 音源抽出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010054728A true JP2010054728A (ja) | 2010-03-11 |
JP5231139B2 JP5231139B2 (ja) | 2013-07-10 |
Family
ID=42070735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008218565A Active JP5231139B2 (ja) | 2008-08-27 | 2008-08-27 | 音源抽出装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5231139B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012129873A (ja) * | 2010-12-16 | 2012-07-05 | Chubu Electric Power Co Inc | 指定領域からの伝播音の再生方法とその装置 |
KR101312451B1 (ko) * | 2013-04-05 | 2013-09-27 | 주식회사 시그테크 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
JP2015070321A (ja) * | 2013-09-26 | 2015-04-13 | 本田技研工業株式会社 | 音声処理装置、音声処理方法、及び音声処理プログラム |
JP2015213328A (ja) * | 2010-10-25 | 2015-11-26 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチマイクロフォンを用いた3次元サウンド獲得及び再生 |
JP2016524148A (ja) * | 2013-06-21 | 2016-08-12 | ブリュール アンド ケーア サウンド アンド バイブレーション メジャーメント アクティーゼルスカブ | 原動機駆動移動体のノイズ源のノイズ音寄与度を決定する方法 |
WO2016167141A1 (ja) * | 2015-04-16 | 2016-10-20 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
US9865279B2 (en) | 2013-12-26 | 2018-01-09 | Kabushiki Kaisha Toshiba | Method and electronic device |
JP2018508823A (ja) * | 2015-02-16 | 2018-03-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源の分離 |
WO2019182074A1 (ja) * | 2018-03-20 | 2019-09-26 | ヤマハ株式会社 | 信号処理方法および信号処理装置 |
WO2021171406A1 (ja) * | 2020-02-26 | 2021-09-02 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、およびプログラム |
CN115881151A (zh) * | 2023-01-04 | 2023-03-31 | 广州市森锐科技股份有限公司 | 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质 |
CN117037836A (zh) * | 2023-10-07 | 2023-11-10 | 之江实验室 | 基于信号协方差矩阵重构的实时声源分离方法和装置 |
CN117202077A (zh) * | 2023-11-03 | 2023-12-08 | 恩平市海天电子科技有限公司 | 一种麦克风智能校正方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934497A (ja) * | 1995-07-14 | 1997-02-07 | Matsushita Electric Ind Co Ltd | ノイズ削減装置 |
JP2003302990A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2004078021A (ja) * | 2002-08-21 | 2004-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、収音装置、および収音プログラム |
JP2004187283A (ja) * | 2002-11-18 | 2004-07-02 | Matsushita Electric Ind Co Ltd | マイクロホン装置および再生装置 |
JP2006017961A (ja) * | 2004-06-30 | 2006-01-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号分離方法および装置ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体 |
JP2006215568A (ja) * | 2005-02-03 | 2006-08-17 | Samsung Electronics Co Ltd | 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体 |
JP2008064821A (ja) * | 2006-09-05 | 2008-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 信号区間推定装置、方法、プログラム及びその記録媒体 |
-
2008
- 2008-08-27 JP JP2008218565A patent/JP5231139B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0934497A (ja) * | 1995-07-14 | 1997-02-07 | Matsushita Electric Ind Co Ltd | ノイズ削減装置 |
JP2003302990A (ja) * | 2002-04-12 | 2003-10-24 | Brother Ind Ltd | 文章読み上げ装置、文章読み上げ方法、及びプログラム |
JP2004078021A (ja) * | 2002-08-21 | 2004-03-11 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、収音装置、および収音プログラム |
JP2004187283A (ja) * | 2002-11-18 | 2004-07-02 | Matsushita Electric Ind Co Ltd | マイクロホン装置および再生装置 |
JP2006017961A (ja) * | 2004-06-30 | 2006-01-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号分離方法および装置ならびに信号分離プログラムおよびそのプログラムを記録した記録媒体 |
JP2006215568A (ja) * | 2005-02-03 | 2006-08-17 | Samsung Electronics Co Ltd | 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体 |
JP2008064821A (ja) * | 2006-09-05 | 2008-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 信号区間推定装置、方法、プログラム及びその記録媒体 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015213328A (ja) * | 2010-10-25 | 2015-11-26 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | マルチマイクロフォンを用いた3次元サウンド獲得及び再生 |
JP2012129873A (ja) * | 2010-12-16 | 2012-07-05 | Chubu Electric Power Co Inc | 指定領域からの伝播音の再生方法とその装置 |
KR101312451B1 (ko) * | 2013-04-05 | 2013-09-27 | 주식회사 시그테크 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
WO2014163231A1 (ko) * | 2013-04-05 | 2014-10-09 | 주식회사 금영 | 복수의 음원이 출력되는 환경하에서 음성 인식에 이용될 음성 신호의 추출 방법 및 음성 신호의 추출 장치 |
JP2016524148A (ja) * | 2013-06-21 | 2016-08-12 | ブリュール アンド ケーア サウンド アンド バイブレーション メジャーメント アクティーゼルスカブ | 原動機駆動移動体のノイズ源のノイズ音寄与度を決定する方法 |
US9478230B2 (en) | 2013-09-26 | 2016-10-25 | Honda Motor Co., Ltd. | Speech processing apparatus, method, and program of reducing reverberation of speech signals |
JP2015070321A (ja) * | 2013-09-26 | 2015-04-13 | 本田技研工業株式会社 | 音声処理装置、音声処理方法、及び音声処理プログラム |
US9865279B2 (en) | 2013-12-26 | 2018-01-09 | Kabushiki Kaisha Toshiba | Method and electronic device |
JP2018508823A (ja) * | 2015-02-16 | 2018-03-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオ源の分離 |
WO2016167141A1 (ja) * | 2015-04-16 | 2016-10-20 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
JPWO2016167141A1 (ja) * | 2015-04-16 | 2018-02-08 | ソニー株式会社 | 信号処理装置、信号処理方法、およびプログラム |
WO2019182074A1 (ja) * | 2018-03-20 | 2019-09-26 | ヤマハ株式会社 | 信号処理方法および信号処理装置 |
WO2021171406A1 (ja) * | 2020-02-26 | 2021-09-02 | 日本電信電話株式会社 | 信号処理装置、信号処理方法、およびプログラム |
CN115881151A (zh) * | 2023-01-04 | 2023-03-31 | 广州市森锐科技股份有限公司 | 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质 |
CN117037836A (zh) * | 2023-10-07 | 2023-11-10 | 之江实验室 | 基于信号协方差矩阵重构的实时声源分离方法和装置 |
CN117037836B (zh) * | 2023-10-07 | 2023-12-29 | 之江实验室 | 基于信号协方差矩阵重构的实时声源分离方法和装置 |
CN117202077A (zh) * | 2023-11-03 | 2023-12-08 | 恩平市海天电子科技有限公司 | 一种麦克风智能校正方法 |
CN117202077B (zh) * | 2023-11-03 | 2024-03-01 | 恩平市海天电子科技有限公司 | 一种麦克风智能校正方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5231139B2 (ja) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5231139B2 (ja) | 音源抽出装置 | |
US10455325B2 (en) | Direction of arrival estimation for multiple audio content streams | |
JP5134876B2 (ja) | 音声通信装置及び音声通信方法並びにプログラム | |
EP3189521B1 (en) | Method and apparatus for enhancing sound sources | |
JP5007442B2 (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
US10127912B2 (en) | Orientation based microphone selection apparatus | |
JP5406956B2 (ja) | オーディオ入力信号の反響コンテンツを抽出および変更するためのシステム | |
CN111445920B (zh) | 一种多声源的语音信号实时分离方法、装置和拾音器 | |
CN110537221A (zh) | 用于空间音频处理的两阶段音频聚焦 | |
JP6065028B2 (ja) | 収音装置、プログラム及び方法 | |
CN110610718B (zh) | 一种提取期望声源语音信号的方法及装置 | |
CN110012331B (zh) | 一种红外触发的远场双麦远场语音识别方法 | |
WO2015086895A1 (en) | Spatial audio processing apparatus | |
Ochi et al. | Multi-Talker Speech Recognition Based on Blind Source Separation with ad hoc Microphone Array Using Smartphones and Cloud Storage. | |
US20130253923A1 (en) | Multichannel enhancement system for preserving spatial cues | |
JP4116600B2 (ja) | 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体 | |
Araki et al. | Online meeting recognizer with multichannel speaker diarization | |
CN110706709A (zh) | 一种结合视频信号的多通道卷积混叠语音信道估计算法 | |
US11823698B2 (en) | Audio cropping | |
Samborski et al. | Speaker localization in conferencing systems employing phase features and wavelet transform | |
CN111462771B (zh) | 一种啸叫处理方法 | |
JP2009025025A (ja) | 音源方向推定装置およびこれを用いた音源分離装置、ならびに音源方向推定方法およびこれを用いた音源分離方法 | |
EP3029671A1 (en) | Method and apparatus for enhancing sound sources | |
Kulhandjian et al. | AI-powered Emergency Keyword Detection for Autonomous Vehicles | |
JP2015118284A (ja) | 音処理装置、音処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130321 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5231139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |