JP2015138100A - 音処理装置、音処理方法 - Google Patents
音処理装置、音処理方法 Download PDFInfo
- Publication number
- JP2015138100A JP2015138100A JP2014008859A JP2014008859A JP2015138100A JP 2015138100 A JP2015138100 A JP 2015138100A JP 2014008859 A JP2014008859 A JP 2014008859A JP 2014008859 A JP2014008859 A JP 2014008859A JP 2015138100 A JP2015138100 A JP 2015138100A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- base
- sound
- target sound
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1083—Reduction of ambient noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2225/00—Details of deaf aids covered by H04R25/00, not provided for in any of its subgroups
- H04R2225/39—Aspects relating to automatic logging of sound environment parameters and the performance of the hearing aid during use, e.g. histogram logging, or of user selected programs or settings in the hearing aid, e.g. usage logging
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2227/00—Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
- H04R2227/001—Adaptation of signal processing in PA systems in dependence of presence of noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/07—Mechanical or electrical reduction of wind noise generated by wind passing a microphone
Abstract
【解決手段】 音響信号を周波数変換することで得られる各係数の振幅絶対値から成る音響行列を生成する。音響行列を基底スペクトル行列とアクティビティ行列とに分解する。基底スペクトル行列に含まれている基底を目的音に係る基底と雑音に係る基底とに分類する。アクティビティ行列に含まれている基底を目的音に係る基底と雑音に係る基底とに分類する。基底スペクトル行列から分類された雑音に係る基底から目的音に係る基底を求める。基底スペクトル行列から分類された目的音に係る基底とアクティビティ行列から分類された目的音及び雑音に係る基底と該求めた目的音に係る基底とを用いて目的音の周波数振幅値を要素とする行列を求める。該行列を用いて目的音の音響信号を生成する。
【選択図】 図1
Description
本実施形態では、目的音を含む環境音の信号である音響信号を収集し、該収集した音響信号から、該目的音を高精度に復元して出力する音処理技術について説明する。先ず、本実施形態に係る音処理装置の機能構成例について、図1のブロック図を用いて説明する。
ここで、基底スペクトル行列Hの各列を基底スペクトルと呼ぶ。また、アクティビティ行列Uの各行をアクティビティと呼ぶ。基底スペクトル行列Hにおけるi列目の基底スペクトルとアクティビティ行列Uにおけるi行目のアクティビティとは1対1で対応しており、この二つの行列積を取ることによって、音響行列を構成する基底毎の音響行列を求めることができる。
この式(2)に示すように、本実施形態においては、従来は雑音成分とともに排除していた目的音成分(行列HE)も目的音として復元されるため、より高精度な目的音を復元することができる。
第1の実施形態では、規定スペクトル行列Hから分類された行列HNから、目的音に係る基底から成る行列HEを生成し、該生成した行列HEを用いて目的音の復元を行っていた。
この式(3)に示すように、本実施形態では、目的音成分を排除してより高精度化した基底スペクトル行列を用いるため、より高精度な雑音の音響行列を復元することができる。
第1,2の実施形態では、具体的な説明を行うために、いくつか具体例を挙げて説明したが、上記の実施形態の適用対象は、上記の具体例に限るものではない。例えば、第2の実施形態では、目的音成分を排除した高精度な雑音復元信号を用いて収音信号に含まれる雑音成分を抑制する方法として、スペクトル減算を用いているが、その代わりにウィナーフィルタを用いて実施することもできる。ウィナーフィルタを用いて収音信号に含まれる雑音信号を抑制する音処理装置の機能構成例を図6に示す。図6において、図4に示した機能部と同じ機能部については同じ参照番号を付しており、これらの機能部に係る説明は省略する。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (12)
- 目的音を含む環境音の信号である音響信号を周波数変換することで得られる各係数の振幅絶対値から成る音響行列を生成する手段と、
前記音響行列に対して非負値行列因子分解を行うことで、該音響行列を基底スペクトル行列とアクティビティ行列とに分解する手段と、
前記基底スペクトル行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類すると共に、前記アクティビティ行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類する手段と、
前記基底スペクトル行列から分類された雑音に係る基底から、目的音に係る基底を求める第1の計算手段と、
前記基底スペクトル行列から分類された目的音に係る基底と、前記アクティビティ行列から分類された目的音に係る基底及び雑音に係る基底と、前記第1の計算手段が求めた目的音に係る基底と、を用いて、前記目的音の周波数振幅値を要素とする行列を求める第2の計算手段と、
前記第2の計算手段が求めた行列を用いて、前記目的音の音響信号を生成する生成手段と
を備えることを特徴とする音処理装置。 - 前記第1の計算手段は、
前記音響行列の各行に対するスペクトル成分のヒストグラムを生成する手段と、
前記ヒストグラムを用いて、目的音が占める周波数帯域と雑音が占める周波数帯域との境界部分を閾値として求める手段と、
前記基底スペクトル行列から分類された雑音に係る基底に対し、前記閾値をカットオフ周波数とするハイパスフィルタを適用して、目的音に係る基底を求める手段と
を備えることを特徴とする請求項1に記載の音処理装置。 - 前記第1の計算手段は、
前記基底スペクトル行列から分類された雑音に係る基底から成る行列の各列のうち、目的音の成分を含む列を特定し、該特定した列のスペクトル成分に応じたカットオフ周波数を有するハイパスフィルタを該列に適用して、目的音に係る基底を求める手段と
を備えることを特徴とする請求項1に記載の音処理装置。 - 前記第2の計算手段は、前記基底スペクトル行列から分類された目的音に係る基底から成る行列と前記アクティビティ行列から分類された目的音に係る基底から成る行列との行列積と、前記アクティビティ行列から分類された雑音に係る基底から成る行列と前記第1の計算手段が求めた目的音に係る基底から成る行列との行列積と、の和を、前記目的音の周波数振幅値を要素とする行列として求めることを特徴とする請求項1乃至3の何れか1項に記載の音処理装置。
- 目的音を含む環境音の信号である音響信号を周波数変換することで得られる各係数の振幅絶対値から成る音響行列を生成する手段と、
前記音響行列に対して非負値行列因子分解を行うことで、該音響行列を基底スペクトル行列とアクティビティ行列とに分解する手段と、
前記基底スペクトル行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類すると共に、前記アクティビティ行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類する手段と、
前記基底スペクトル行列から分類された雑音に係る基底から、該基底の高周波数帯域の成分を抑制した基底を求める第1の計算手段と、
前記アクティビティ行列から分類された雑音に係る基底と、前記第1の計算手段が求めた基底と、を用いて、前記雑音の周波数振幅値を要素とする行列を求める第2の計算手段と、
前記音響行列と前記第2の計算手段が求めた行列とを用いて、前記目的音の周波数振幅値を要素とする行列を求める第3の計算手段と、
前記第3の計算手段が求めた行列を用いて、前記目的音の音響信号を生成する生成手段と
を備えることを特徴とする音処理装置。 - 前記第1の計算手段は、
前記音響行列の各行に対するスペクトル成分のヒストグラムを生成する手段と、
前記ヒストグラムを用いて、目的音が占める周波数帯域と雑音が占める周波数帯域との境界部分を閾値として求める手段と、
前記基底スペクトル行列から分類された雑音に係る基底に対し、前記閾値をカットオフ周波数とするローパスフィルタを適用する手段と
を備えることを特徴とする請求項5に記載の音処理装置。 - 前記第2の計算手段は、前記アクティビティ行列から分類された雑音に係る基底から成る行列と、前記第1の計算手段が求めた基底から成る行列と、の行列積を、前記雑音の周波数振幅値を要素とする行列として求めることを特徴とする請求項5又は6に記載の音処理装置。
- 前記第3の計算手段は、前記音響行列から前記第2の計算手段が求めた行列を減算することで、前記目的音の周波数振幅値を要素とする行列を求めることを特徴とする請求項5乃至7の何れか1項に記載の音処理装置。
- 前記第3の計算手段は、前記第2の計算手段が求めた行列を用いて、雑音成分を抑制するためのウィナーフィルタを生成し、該ウィナーフィルタを前記音響行列に対して適用することで、前記目的音の周波数振幅値を要素とする行列を求めることを特徴とする請求項5乃至7の何れか1項に記載の音処理装置。
- 音処理装置が行う音処理方法であって、
前記音処理装置の音響行列を生成する手段が、目的音を含む環境音の信号である音響信号を周波数変換することで得られる各係数の振幅絶対値から成る音響行列を生成する工程と、
前記音処理装置の分解手段が、前記音響行列に対して非負値行列因子分解を行うことで、該音響行列を基底スペクトル行列とアクティビティ行列とに分解する工程と、
前記音処理装置の分類手段が、前記基底スペクトル行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類すると共に、前記アクティビティ行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類する工程と、
前記音処理装置の第1の計算手段が、前記基底スペクトル行列から分類された雑音に係る基底から、目的音に係る基底を求める第1の計算工程と、
前記音処理装置の第2の計算手段が、前記基底スペクトル行列から分類された目的音に係る基底と、前記アクティビティ行列から分類された目的音に係る基底及び雑音に係る基底と、前記第1の計算工程で求めた目的音に係る基底と、を用いて、前記目的音の周波数振幅値を要素とする行列を求める第2の計算工程と、
前記音処理装置の生成手段が、前記第2の計算工程で求めた行列を用いて、前記目的音の音響信号を生成する生成工程と
を備えることを特徴とする音処理方法。 - 音処理装置が行う音処理方法であって、
前記音処理装置の音響行列を生成する手段が、目的音を含む環境音の信号である音響信号を周波数変換することで得られる各係数の振幅絶対値から成る音響行列を生成する工程と、
前記音処理装置の分解手段が、前記音響行列に対して非負値行列因子分解を行うことで、該音響行列を基底スペクトル行列とアクティビティ行列とに分解する工程と、
前記音処理装置の分類手段が、前記基底スペクトル行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類すると共に、前記アクティビティ行列に含まれている各基底を、目的音に係る基底と、雑音に係る基底と、に分類する工程と、
前記音処理装置の第1の計算手段が、前記基底スペクトル行列から分類された雑音に係る基底から、該基底の高周波数帯域の成分を抑制した基底を求める第1の計算工程と、
前記音処理装置の第2の計算手段が、前記アクティビティ行列から分類された雑音に係る基底と、前記第1の計算工程で求めた基底と、を用いて、前記雑音の周波数振幅値を要素とする行列を求める第2の計算工程と、
前記音処理装置の第3の計算手段が、前記音響行列と前記第2の計算工程で求めた行列とを用いて、前記目的音の周波数振幅値を要素とする行列を求める第3の計算工程と、
前記音処理装置の生成手段が、前記第3の計算工程で求めた行列を用いて、前記目的音の音響信号を生成する生成工程と
を備えることを特徴とする音処理方法。 - コンピュータを、請求項1乃至9の何れか1項に記載の音処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014008859A JP6274872B2 (ja) | 2014-01-21 | 2014-01-21 | 音処理装置、音処理方法 |
US14/598,323 US9648411B2 (en) | 2014-01-21 | 2015-01-16 | Sound processing apparatus and sound processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014008859A JP6274872B2 (ja) | 2014-01-21 | 2014-01-21 | 音処理装置、音処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015138100A true JP2015138100A (ja) | 2015-07-30 |
JP2015138100A5 JP2015138100A5 (ja) | 2017-02-23 |
JP6274872B2 JP6274872B2 (ja) | 2018-02-07 |
Family
ID=53545970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014008859A Active JP6274872B2 (ja) | 2014-01-21 | 2014-01-21 | 音処理装置、音処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9648411B2 (ja) |
JP (1) | JP6274872B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696568A (zh) * | 2020-06-16 | 2020-09-22 | 中国科学技术大学 | 一种半监督瞬态噪声抑制方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7140542B2 (ja) | 2018-05-09 | 2022-09-21 | キヤノン株式会社 | 信号処理装置、信号処理方法、およびプログラム |
CN111050250B (zh) * | 2020-01-15 | 2021-11-02 | 北京声智科技有限公司 | 降噪方法、装置、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227417A (ja) * | 2010-04-23 | 2011-11-10 | Yamaha Corp | 音響処理装置 |
JP2012022120A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音響処理装置 |
JP2013037152A (ja) * | 2011-08-05 | 2013-02-21 | Toshiba Corp | 音響信号処理装置および音響信号処理方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US7672834B2 (en) * | 2003-07-23 | 2010-03-02 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for detecting and temporally relating components in non-stationary signals |
US20050288923A1 (en) * | 2004-06-25 | 2005-12-29 | The Hong Kong University Of Science And Technology | Speech enhancement by noise masking |
EP1752969A4 (en) * | 2005-02-08 | 2007-07-11 | Nippon Telegraph & Telephone | SIGNAL SEPARATION DEVICE, SIGNAL SEPARATION METHOD, SIGNAL SEPARATION PROGRAM, AND RECORDING MEDIUM |
DE102007048973B4 (de) * | 2007-10-12 | 2010-11-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung |
US8015003B2 (en) | 2007-11-19 | 2011-09-06 | Mitsubishi Electric Research Laboratories, Inc. | Denoising acoustic signals using constrained non-negative matrix factorization |
US20100174389A1 (en) * | 2009-01-06 | 2010-07-08 | Audionamix | Automatic audio source separation with joint spectral shape, expansion coefficients and musical state estimation |
FR2943875A1 (fr) * | 2009-03-31 | 2010-10-01 | France Telecom | Procede et dispositif de classification du bruit de fond contenu dans un signal audio. |
JP5688406B2 (ja) * | 2009-04-09 | 2015-03-25 | 株式会社ポーラファルマ | 抗真菌医薬組成物 |
US8818806B2 (en) * | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
-
2014
- 2014-01-21 JP JP2014008859A patent/JP6274872B2/ja active Active
-
2015
- 2015-01-16 US US14/598,323 patent/US9648411B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011227417A (ja) * | 2010-04-23 | 2011-11-10 | Yamaha Corp | 音響処理装置 |
JP2012022120A (ja) * | 2010-07-14 | 2012-02-02 | Yamaha Corp | 音響処理装置 |
JP2013037152A (ja) * | 2011-08-05 | 2013-02-21 | Toshiba Corp | 音響信号処理装置および音響信号処理方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696568A (zh) * | 2020-06-16 | 2020-09-22 | 中国科学技术大学 | 一种半监督瞬态噪声抑制方法 |
CN111696568B (zh) * | 2020-06-16 | 2022-09-30 | 中国科学技术大学 | 一种半监督瞬态噪声抑制方法 |
Also Published As
Publication number | Publication date |
---|---|
US20150208167A1 (en) | 2015-07-23 |
US9648411B2 (en) | 2017-05-09 |
JP6274872B2 (ja) | 2018-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6334895B2 (ja) | 信号処理装置及びその制御方法、プログラム | |
JP6482173B2 (ja) | 音響信号処理装置およびその方法 | |
JP5662276B2 (ja) | 音響信号処理装置および音響信号処理方法 | |
JP6054142B2 (ja) | 信号処理装置、方法およびプログラム | |
JP6371516B2 (ja) | 音響信号処理装置および方法 | |
EP3133833B1 (en) | Sound field reproduction apparatus, method and program | |
US9715884B2 (en) | Information processing apparatus, information processing method, and computer-readable storage medium | |
Dufour et al. | Clusterized mel filter cepstral coefficients and support vector machines for bird song identification | |
JP6174856B2 (ja) | 雑音抑制装置、その制御方法、及びプログラム | |
JP6274872B2 (ja) | 音処理装置、音処理方法 | |
JP5605574B2 (ja) | 多チャンネル音響信号処理方法、そのシステム及びプログラム | |
JP6348427B2 (ja) | 雑音除去装置及び雑音除去プログラム | |
JP4705480B2 (ja) | 高調波信号の基本周波数を求める方法 | |
JP4543731B2 (ja) | 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム | |
WO2005029463A1 (en) | A method for recovering target speech based on speech segment detection under a stationary noise | |
Agcaer et al. | Optimization of amplitude modulation features for low-resource acoustic scene classification | |
JP6724290B2 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
US9398387B2 (en) | Sound processing device, sound processing method, and program | |
JP5705190B2 (ja) | 音響信号強調装置、音響信号強調方法、およびプログラム | |
US20180061433A1 (en) | Signal processing device, signal processing method, and computer program product | |
JP4249697B2 (ja) | 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体 | |
US11322169B2 (en) | Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program | |
JP2005062096A (ja) | 話者位置検出方法、装置、プログラム、および記録媒体 | |
JP2006072163A (ja) | 妨害音抑圧装置 | |
JP2020010196A (ja) | 方向別収音装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170119 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171207 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180109 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6274872 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |