JP4469882B2 - 音響信号処理方法及び装置 - Google Patents
音響信号処理方法及び装置 Download PDFInfo
- Publication number
- JP4469882B2 JP4469882B2 JP2007212304A JP2007212304A JP4469882B2 JP 4469882 B2 JP4469882 B2 JP 4469882B2 JP 2007212304 A JP2007212304 A JP 2007212304A JP 2007212304 A JP2007212304 A JP 2007212304A JP 4469882 B2 JP4469882 B2 JP 4469882B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- weighting
- input
- signal processing
- weighting factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 22
- 238000012545 processing Methods 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 65
- 230000001629 suppression Effects 0.000 claims description 44
- 238000004364 calculation method Methods 0.000 claims description 41
- 230000005236 sound signal Effects 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 11
- 238000009826 distribution Methods 0.000 description 10
- 238000004260 weight control Methods 0.000 description 10
- 238000013179 statistical model Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 230000008901 benefit Effects 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Description
Y. Ephraim, D. Malah, "Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. ASSP vol. 32, 1109-1121, 1984. Y. Ephraim, D. Malah, "Speech Enhancement Using a Minimum Mean-Square Error Log-Spectral Amplitude Estimator", IEEE Trans. ASSP vol. 33, 443-445, 1985. R.Zelinski, "A Microphone Array with Adaptive Post-filtering for Noise Reduction," IEEE ICASSP88 pp.2578-2581, 1988
(第1の実施形態)
図1に示されるように、本発明の第1の実施形態に従う音響信号処理装置では、複数(N)のマイクロホン101−1〜101−NからのNチャネルの入力音響信号が特徴量算出部102及び重み付部105−1〜105−Nに入力される。特徴量算出部102では、入力音響信号に含まれる雑音成分の推定を含む処理によって入力音響信号の特徴量が算出される。重み係数辞書103には、予め学習部100による事前学習により求められた多数の重み係数が格納されている。
図3に示される本発明の第2の実施形態に係る音響信号処理装置では、マイクロホン101−1〜110−N(Nは1以上)からの入力音響信号はフーリエ変換部110−1〜110−Nに入力され、時間領域の信号から周波数領域の信号へと変換される。
まず、入力音響信号として学習用音響信号を用意し、理想出力音響信号として目標音響信号を用意する。例えば、雑音に埋もれた音声信号から音声のみ強調したい場合は、学習用音響信号は雑音が重畳した音声の信号であり、目標音響信号は音声のみの信号である。これらの信号は計算機上で雑音成分と音声信号を足し合わせたり、音声信号のみを用いたりすることで実現される場合が多い。
次に、図4を用いて本発明の第3の実施形態について説明する。図4の音響信号処理装置では、重み付部105の前段に重み係数算出部120が追加されている点を除いて、第2の実施形態と同様である。式(6)では、特徴量(ξ(n,k),γ(n,k))から直接重み係数を決定しているが、本実施形態では重み係数を決定するパラメータを選択する。すなわち、
本発明の第4の実施形態に係る音響信号処理装置では、図5に示されるように第2の実施形態に係る図3の音響信号処理装置から事前SNR算出部106が除去されている。本実施形態によると、選択部104に入力される特徴量は事後SNRγ(l,k)のみであるため、第2の実施形態と比較して選択部104における代表点の探索速度が速くなるという利点がある。
本発明の第4の実施形態に係る音響信号処理装置では、図6に示されるように第2の実施形態に係る図3の音響信号処理装置から事後SNR算出部107が除去されている。本実施形態では、選択部104に入力される特徴量は事前SNRξ(l,k)のみであるため、第2の実施形態と比較して選択部104における代表点の探索速度が速くなるという利点がある。
図7は、本発明の第6の実施形態に係る音響信号処理装置であり、図2に示した第2の実施形態に係る音響信号処理装置に、制御信号401によって切り替わる切替器402が追加され、さらに複数の重み係数辞書103−1〜103Mを有している。図7では、簡単のため一つのマイクロホン101を用いた場合について示しているが、これまでと同様に複数のマイクロホンを用いてもよい。
図8は、本発明の第7の実施形態に係る音響信号処理装置であり、図7中の切替器402が重み付け加算器403に置き換えられている。重み付け加算器403では、複数の重み係数辞書103−1〜103−Nの全部から出力される重み係数または重み付け係数辞書103−1〜103−Nの一部から選択された重み係数に重み付け加算(加重平均)が施されることにより、スムージングされる。重み付け加算器403では、重み付け加算に固定の重み係数を用いてもよいし、制御信号に従って制御される可変の重み係数を用いてもよい。
図9に示されるように、本発明の第8の実施形態に従う音響信号処理装置では、複数(N)のマイクロホン101−1〜NからのNチャネルの入力音響信号がチャネル間特徴量算出部202及びアレー部201の重み付け部105−1〜105−Nに入力される。チャネル間特徴量算出部202では、入力音響信号のチャネル間の差異を表す特徴量(本明細書では、これをチャネル間特徴量と呼ぶ)が算出され、選択部204に渡される。選択部204では、多数の重み係数を格納した重み係数辞書203から、チャネル間特徴量に対応付けられた一つの重み係数が選択される。
図11に示される本発明の第9の実施形態に従う音響信号処理装置では、第8の実施形態に従う図9の音響信号処理装置に対して、Nチャネルの入力音響信号を周波数領域の信号に変換するためのフーリエ変換部110−1〜110−Nと、アレー処理及び雑音抑圧後の周波数領域の音響信号を時間領域の信号に戻すためのフーリエ逆変換部111が追加されている。さらに、フーリエ変換部110−1〜110−N及びフーリエ逆変換部111の追加に伴い、重み付け部105−1〜105−Nと加算部205を有するアレー部201及び雑音抑圧部206が周波数領域での重み付け部301−1〜301−Nと加算部305を有するアレー部301及び雑音抑圧部306に置き換えられている。
図12は、本発明の第10の実施形態に従う音響信号処理装置であり、第9の実施形態に従う図11の音響信号処理装置に対して、照合部501と代表点辞書502が追加されている。代表点辞書502には、図13に示すようにLBG法等により得られた複数(I)の代表点の特徴量がインデクスIDと対応付けられて格納されている。ここで代表点とは、チャネル間特徴量をクラスタリングしたときの各クラスタの代表点である。
図15に示されるように、本発明の第11の実施形態に従う音響信号処理装置では、第9の実施形態で説明したチャネル間特徴量算出部202、重み係数辞書203及び選択部204をそれぞれ有する複数(M)の重み制御部600−1〜600−Mが備えられる。
101−1〜101−N・・・マイクロホン
102・・・特徴量算出部
103・・・重み係数辞書
104・・・選択部
105−1〜105−N・・・重み付け部
106・・・事前SNR算出部
107・・・事後SNR算出部
108・・・推定雑音算出部
110−1〜110-N・・・フーリエ変換部
111−1〜111−N・・・フーリエ逆変換部
120・・・重み係数算出部
201・・・アレー部
202・・・チャネル間特徴量算出部
203・・・重み係数辞書
204・・・選択部
205・・・加算器
206・・・雑音抑圧部
401・・・制御信号
402・・・切替器
403・・・重み付け加算器
501・・・照合部
502・・・代表点辞書
600−1〜600−M・・・重み制御部
601・・・制御信号
602・・・入力切替部
603・・・出力切替部
Claims (22)
- 重み付けされた学習用音響信号と該学習用音響信号に対応する目標音響信号によって定められた評価関数を最適化するように学習された、雑音抑圧のための重み付けに用いる重み係数を少なくとも一つの辞書に用意するステップと;
入力音響信号に所望成分が存在しない期間において、前記入力音響信号に含まれる雑音成分を推定するステップと;
推定された雑音成分に基づいて、前記入力音響信号の前記雑音成分に依存する特徴量を求めるステップと;
前記特徴量に対応する重み係数を前記辞書から選択するステップと;
選択された重み係数を用いて前記入力音響信号に対してチャネル毎に個別に重み付けを行い、前記入力音響信号と同じチャネル数の処理された出力音響信号を生成するステップと;を具備する音響信号処理方法。 - 前記評価関数は、前記学習用音響信号と前記目標音響信号との間の誤差の総和であり、前記総和の最小化により前記評価関数は最適化される請求項1記載の音響信号処理方法。
- 前記特徴量に対応する重み係数を前記辞書から選択するステップは、前記特徴量と予め用意された複数の代表点との距離を求めるステップと、前記距離が相対的に小さくなる代表点を決定するステップと、前記距離が相対的に小さくなる代表点に対応付けられた重み係数を前記辞書から選択するステップと、を含む請求項1記載の音響信号処理方法。
- 前記出力音響信号を生成するステップは、前記選択された重み係数を予め定められた関数により変換するステップと、変換された重み係数を用いて前記入力音響信号に対して重み付けを行うステップと、を含む請求項1記載の音響信号処理方法。
- 前記特徴量を求めるステップは、前記入力音響信号に含まれる信号成分と前記雑音成分との間の信号対雑音比を求める請求項1記載の音響信号処理方法。
- 前記特徴量を求めるステップは、前記入力音響信号から前記雑音成分を除いた信号と前記雑音成分との間の信号対雑音比の推定値を求める請求項1記載の音響信号処理方法。
- 前記辞書を複数の辞書から音響環境に応じて選択するステップをさらに具備する含む請求項1乃至7のいずれか一項記載の音響信号処理方法。
- 前記重み係数は時間領域のフィルタ係数であり、前記入力音響信号と前記選択された重み係数との畳み込みによって前記重み付けを行う請求項1記載の音響信号処理方法。
- 前記重み係数は周波数領域のフィルタ係数であり、前記入力音響信号と前記選択された重み係数との積をとることによって前記重み付けを行う請求項1記載の音響信号処理方法。
- 重み付けされた学習用音響信号と該学習用音響信号に対応する目標音響信号によって定められた評価関数を最適化するように学習された、雑音抑圧のための重み付けに用いる重み係数が格納された辞書と;
入力音響信号に所望成分が存在しない期間において、前記入力音響信号に含まれる雑音成分を推定する推定部と;
推定された雑音成分に基づいて、前記入力音響信号の前記雑音成分に依存する特徴量を算出する算出部と;
前記特徴量に対応する重み係数を前記辞書から選択する選択部と;
選択された重み係数を用いて前記入力音響信号に対してチャネル毎に個別に重み付けを行い、前記入力音響信号と同じチャネル数の処理された出力音響信号を生成する重み付け部と;を具備する音響信号処理装置。 - 複数チャネルの入力音響信号のチャネル間の相関を表す少なくとも一つの特徴量を算出するステップと;
前記特徴量に従って少なくとも一つの辞書から学習によって事前に求められた雑音抑圧のための重み係数を選択するステップと;
前記複数チャネルの入力音響信号に対して重み付け加算を含む信号処理を行って単一チャネルの統合音響信号を生成するステップと;
前記統合音響信号に前記重み係数を用いて重み付けを行い、単一チャネルの処理された出力音響信号を生成するステップと;を具備する音響信号処理方法。 - 前記重み係数は、前記特徴量に予め対応付けられている請求項11記載の音響信号処理方法。
- 前記選択するステップは、前記特徴量と予め用意された複数の特徴量の代表点との間の距離を求めるステップと、前記距離が相対的に小さい一つの代表点を決定するステップと、を含み、
前記重み係数は、前記代表点に予め対応付けられている請求項11記載の音響信号処理方法。 - 前記特徴量を算出するステップは、前記入力音響信号のチャネル間の相関係数を算出する請求項11記載の音響信号処理方法。
- 前記特徴量を算出するステップは、前記入力音響信号のチャネル間のクロススペクトルを算出する請求項11記載の音響信号処理方法。
- 前記特徴量を算出するステップは、前記入力音響信号の信号対雑音比を算出する請求項11記載の音響信号処理方法。
- 前記重み係数は時間領域のフィルタ係数であり、前記統合音響信号と前記重み係数との畳み込みによって前記重み付けを行う請求項11記載の音響信号処理方法。
- 前記重み係数は周波数領域のフィルタ係数であり、前記統合音響信号と前記重み係数の積をとることによって前記重み付けを行う請求項11記載の音響信号処理方法。
- 前記辞書を複数の辞書から音響環境に応じて選択するステップをさらに具備する請求項11記載の音響信号処理方法。
- 複数チャネルの入力音響信号のチャネル間の相関を表す少なくとも一つの特徴量を算出する算出部と;
前記特徴量に従って少なくとも一つの辞書から雑音抑圧のための重み係数を選択する選択部と;
前記複数チャネルの入力音響信号に対して重み付け加算を含む信号処理を行って単一チャネルの統合音響信号を生成する信号処理部と;
前記統合音響信号に前記重み係数を用いて重み付けを行い、単一チャネルの処理された出力音響信号を生成する重み付け部と;を具備する音響信号処理装置。 - 重み付けされた学習用音響信号と該学習用音響信号に対応する目標音響信号によって定められた評価関数を最適化するように学習された、雑音抑圧のための重み付けに用いる重み係数を少なくとも一つの辞書に用意する処理と;
入力音響信号に所望成分が存在しない期間において、前記入力音響信号に含まれる雑音成分を推定する処理と;
推定された雑音成分に基づいて、前記入力音響信号の前記雑音成分に依存する特徴量を求める処理と;
前記特徴量に対応する重み係数を前記辞書から選択する処理と;
選択された重み係数を用いて前記入力音響信号に対してチャネル毎に個別に重み付けを行い、前記入力音響信号と同じチャネル数の処理された出力音響信号を生成する処理と;を含む音響信号処理をコンピュータに行わせるためのプログラム。 - 複数チャネルの入力音響信号のチャネル間の相関を表す少なくとも一つの特徴量を算出する処理と;
前記特徴量に従って少なくとも一つの辞書から学習によって事前に求められた雑音抑圧のための重み係数を選択する処理と;
前記複数チャネルの入力音響信号に対して重み付け加算を含む信号処理を行って単一チャネルの統合音響信号を生成する処理と;
前記統合音響信号に前記重み係数を用いて重み付けを行い、単一チャネルの処理された出力音響信号を生成する処理と;を含む音響信号処理をコンピュータに行わせるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007212304A JP4469882B2 (ja) | 2007-08-16 | 2007-08-16 | 音響信号処理方法及び装置 |
US12/192,670 US20090048824A1 (en) | 2007-08-16 | 2008-08-15 | Acoustic signal processing method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007212304A JP4469882B2 (ja) | 2007-08-16 | 2007-08-16 | 音響信号処理方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009047803A JP2009047803A (ja) | 2009-03-05 |
JP4469882B2 true JP4469882B2 (ja) | 2010-06-02 |
Family
ID=40363638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007212304A Expired - Fee Related JP4469882B2 (ja) | 2007-08-16 | 2007-08-16 | 音響信号処理方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20090048824A1 (ja) |
JP (1) | JP4469882B2 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8949120B1 (en) * | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
DE602007004217D1 (de) * | 2007-08-31 | 2010-02-25 | Harman Becker Automotive Sys | Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung |
JP5376635B2 (ja) * | 2009-01-07 | 2013-12-25 | 国立大学法人 奈良先端科学技術大学院大学 | 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム |
JP5605573B2 (ja) * | 2009-02-13 | 2014-10-15 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
US9064499B2 (en) * | 2009-02-13 | 2015-06-23 | Nec Corporation | Method for processing multichannel acoustic signal, system therefor, and program |
CN101986386B (zh) * | 2009-07-29 | 2012-09-26 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
JP4869420B2 (ja) * | 2010-03-25 | 2012-02-08 | 株式会社東芝 | 音情報判定装置、及び音情報判定方法 |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
US20120306823A1 (en) * | 2011-06-06 | 2012-12-06 | Apple Inc. | Audio sensors |
GB2494204B (en) * | 2011-09-05 | 2017-05-24 | Roke Manor Research | Method and apparatus for signal detection |
US20130066452A1 (en) * | 2011-09-08 | 2013-03-14 | Yoshiyuki Kobayashi | Information processing device, estimator generating method and program |
US8879761B2 (en) | 2011-11-22 | 2014-11-04 | Apple Inc. | Orientation-based audio |
JP5865050B2 (ja) * | 2011-12-15 | 2016-02-17 | キヤノン株式会社 | 被検体情報取得装置 |
JP5705190B2 (ja) * | 2012-11-05 | 2015-04-22 | 日本電信電話株式会社 | 音響信号強調装置、音響信号強調方法、およびプログラム |
JP5784075B2 (ja) * | 2012-11-05 | 2015-09-24 | 日本電信電話株式会社 | 信号区間分類装置、信号区間分類方法、およびプログラム |
US9570087B2 (en) * | 2013-03-15 | 2017-02-14 | Broadcom Corporation | Single channel suppression of interfering sources |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6063843B2 (ja) * | 2013-08-28 | 2017-01-18 | 日本電信電話株式会社 | 信号区間分類装置、信号区間分類方法、およびプログラム |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
CN107112025A (zh) | 2014-09-12 | 2017-08-29 | 美商楼氏电子有限公司 | 用于恢复语音分量的系统和方法 |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
US10819414B2 (en) * | 2018-03-26 | 2020-10-27 | Intel Corporation | Methods and devices for beam tracking |
CN108735229B (zh) * | 2018-06-12 | 2020-06-19 | 华南理工大学 | 基于信噪比加权的幅度与相位联合补偿抗噪语音增强方法 |
WO2020079957A1 (ja) * | 2018-10-15 | 2020-04-23 | ソニー株式会社 | 音声信号処理装置、雑音抑圧方法 |
TWI783084B (zh) * | 2018-11-27 | 2022-11-11 | 中華電信股份有限公司 | 權重用量模型應用於動態選擇語音辨識通道的方法與系統 |
JP6854967B1 (ja) * | 2019-10-09 | 2021-04-07 | 三菱電機株式会社 | 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム |
CN113689875B (zh) * | 2021-08-25 | 2024-02-06 | 湖南芯海聆半导体有限公司 | 一种面向数字助听器的双麦克风语音增强方法和装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6473733B1 (en) * | 1999-12-01 | 2002-10-29 | Research In Motion Limited | Signal enhancement for voice coding |
WO2002031815A1 (en) * | 2000-10-13 | 2002-04-18 | Science Applications International Corporation | System and method for linear prediction |
EP1211636A1 (en) * | 2000-11-29 | 2002-06-05 | STMicroelectronics S.r.l. | Filtering device and method for reducing noise in electrical signals, in particular acoustic signals and images |
CA2354858A1 (en) * | 2001-08-08 | 2003-02-08 | Dspfactory Ltd. | Subband directional audio signal processing using an oversampled filterbank |
US7171008B2 (en) * | 2002-02-05 | 2007-01-30 | Mh Acoustics, Llc | Reducing noise in audio systems |
EP1395080A1 (en) * | 2002-08-30 | 2004-03-03 | STMicroelectronics S.r.l. | Device and method for filtering electrical signals, in particular acoustic signals |
JP4247037B2 (ja) * | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
JP2005249816A (ja) * | 2004-03-01 | 2005-09-15 | Internatl Business Mach Corp <Ibm> | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
JP4249697B2 (ja) * | 2004-12-24 | 2009-04-02 | 日本電信電話株式会社 | 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体 |
JP4395772B2 (ja) * | 2005-06-17 | 2010-01-13 | 日本電気株式会社 | ノイズ除去方法及び装置 |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
-
2007
- 2007-08-16 JP JP2007212304A patent/JP4469882B2/ja not_active Expired - Fee Related
-
2008
- 2008-08-15 US US12/192,670 patent/US20090048824A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2009047803A (ja) | 2009-03-05 |
US20090048824A1 (en) | 2009-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4469882B2 (ja) | 音響信号処理方法及び装置 | |
US9741360B1 (en) | Speech enhancement for target speakers | |
Michelsanti et al. | Conditional generative adversarial networks for speech enhancement and noise-robust speaker verification | |
Luo et al. | Real-time single-channel dereverberation and separation with time-domain audio separation network. | |
Subramanian et al. | Speech enhancement using end-to-end speech recognition objectives | |
JP4195267B2 (ja) | 音声認識装置、その音声認識方法及びプログラム | |
US8363850B2 (en) | Audio signal processing method and apparatus for the same | |
WO2009110574A1 (ja) | 信号強調装置、その方法、プログラム及び記録媒体 | |
CN109979476B (zh) | 一种语音去混响的方法及装置 | |
JP2005249816A (ja) | 信号強調装置、方法及びプログラム、並びに音声認識装置、方法及びプログラム | |
MX2011001339A (es) | Aparato y metodo para procesar una señal de audio para mejora de habla, utilizando una extraccion de caracteristica. | |
US9520138B2 (en) | Adaptive modulation filtering for spectral feature enhancement | |
Zhang et al. | Temporal convolutional network with frequency dimension adaptive attention for speech enhancement | |
JP2022529912A (ja) | 深層フィルタを決定するための方法および装置 | |
López-Espejo et al. | Dual-channel spectral weighting for robust speech recognition in mobile devices | |
Martín-Doñas et al. | Dual-channel DNN-based speech enhancement for smartphones | |
Doclo et al. | Multimicrophone noise reduction using recursive GSVD-based optimal filtering with ANC postprocessing stage | |
Bohlender et al. | Neural networks using full-band and subband spatial features for mask based source separation | |
CN114242104A (zh) | 语音降噪的方法、装置、设备及存储介质 | |
JP6361148B2 (ja) | 雑音推定装置、方法及びプログラム | |
Bu et al. | A robust nonlinear microphone array postfilter for noise reduction | |
Ondusko et al. | Blind signal-to-noise ratio estimation of speech based on vector quantizer classifiers and decision level fusion | |
Kawase et al. | Automatic parameter switching of noise reduction for speech recognition | |
Krueger et al. | Bayesian Feature Enhancement for ASR of Noisy Reverberant Real-World Data. | |
CN109074811A (zh) | 音频源分离 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100301 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130305 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140305 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |