JP2008513819A5 - - Google Patents

Download PDF

Info

Publication number
JP2008513819A5
JP2008513819A5 JP2007531797A JP2007531797A JP2008513819A5 JP 2008513819 A5 JP2008513819 A5 JP 2008513819A5 JP 2007531797 A JP2007531797 A JP 2007531797A JP 2007531797 A JP2007531797 A JP 2007531797A JP 2008513819 A5 JP2008513819 A5 JP 2008513819A5
Authority
JP
Japan
Prior art keywords
frame
speech signal
noisy speech
noise
noise reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007531797A
Other languages
English (en)
Other versions
JP2008513819A (ja
JP5068653B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/FR2005/002284 external-priority patent/WO2006032760A1/fr
Publication of JP2008513819A publication Critical patent/JP2008513819A/ja
Publication of JP2008513819A5 publication Critical patent/JP2008513819A5/ja
Application granted granted Critical
Publication of JP5068653B2 publication Critical patent/JP5068653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (33)

  1. 連続した複数のフレームとして構成された、雑音のある音声信号(x(n))を処理する方法であって、前記フレーム(x(k,n))の少なくとも1つに関して、
    前記雑音のある音声信号の前記フレームに、周波数領域への変換を適用するステップと、
    前記フレームに対する前記雑音の電力スペクトル密度
    Figure 2008513819
    を推定するステップと、
    前記雑音の前記推定された電力スペクトル密度と、前記フレームに対応する有用な信号の前記電力スペクトル密度の推定値とにもとづいて、第1の雑音低減フィルタ
    Figure 2008513819
    を計算するステップと、
    前記フレームの第1の、雑音が除去された推定値
    Figure 2008513819
    を得るために、計算された前記第1の雑音低減フィルタを利用して、前記雑音のある音声信号(x(k,n);X(k、f))の前記フレームを濾波するステップと、
    前記雑音のある音声信号の前記フレームに対応する前記有用な信号と実質的に同じ位置にある高調波を有する第2の信号
    Figure 2008513819
    のフレームを、前記雑音のある音声信号の前記フレームの前記第1の、雑音が除去された推定値にもとづいて得るステップと、
    を有する、連続したフレームとして構成された雑音のある音声信号を処理する方法。
  2. 前記雑音の前記推定された電力スペクトル密度と、前記フレームの第1の、雑音が除去された推定値
    Figure 2008513819
    の電力と得られた前記第2の信号
    Figure 2008513819
    の前記フレームの電力の組み合わせとにもとづいて、第2の雑音低減フィルタ
    Figure 2008513819
    を計算するステップと、
    前記フレームの第2の、雑音が除去された推定値
    Figure 2008513819
    を得るために、計算された前記第2の雑音低減フィルタを利用して、前記雑音のある音声信号(x(k,n);X(k、f))の前記フレームを濾波するステップ
    と、
    前記フレームの前記第2の雑音が除去された推定値を合成するステップと
    をさらに有する、請求項1に記載の方法。
  3. 前記第2の雑音低減フィルタを利用して実行された濾波の結果が前記周波数領域にある場合、前記フレームの前記第2の、雑音を除去した推定値を合成する前に、前記濾波の前記結果に前記時間領域への変換を適用する、請求項2に記載の方法。
  4. 前記雑音のある音声信号(x(k,n))の前記フレームに、それに対する前記周波数領域への変換を適用する前に、重みづけウインドウ(w(n))を乗算る、請求項1から請求項3までのいずれか1項に記載の方法。
  5. 前記重みづけウインドウは、サイズが前記雑音のある音声信号の前記フレームの長さLであるハニングウインドウである、請求項4に記載の方法。
  6. 前記重みづけウインドウは、w(n)=0.5−0.5.cos(πn/L)の形式であり、ここで、nは0からL−1の範囲の整数であり、Lは256に等しい、請求項5に記載の方法。
  7. 前記雑音のある音声信号(x(k,n))の前記フレームに適用される前記周波数領域への前記変換は、長さ512の高速フーリエ変換である、請求項1から請求項6までのいずれか1項に記載の方法。
  8. ボーカルアクティビティを前記雑音のある音声信号(x(k,n))の前記フレーム内で検索し、前記フレームに対する前記雑音の前記電力スペクトル密度
    Figure 2008513819
    の推定値は、前記フレーム内でボーカルアクティビティが検出されない場合には、前記フレームに含まれる前記雑音の前記電力スペクトル密度の推定値に対応し、前記フレーム内でボーカルアクティビティが検出される場合には、前記フレームに先行する前記雑音のある音声信号の少なくとも1つのフレームに含まれる前記雑音の前記電力スペクトル密度の推定値に対応する、請求項1から請求項7までのいずれか1項に記載の方法。
  9. 前記雑音のある音声信号のインデックスkbの、ボーカルアクティビティは検出されない少なくとも1つのフレームに含まれる前記雑音の前記電力スペクトル密度は、
    Figure 2008513819
    の形式の指数関数による平滑化によって求め、ここで、X(kb,f)は前記雑音のある音声信号のインデックスkbのフレームの前記周波数領域への変換を表し、αは平滑化量である、請求項8に記載の方法。
  10. 前記第1の雑音低減フィルタの前記計算は、短期スペクトル減衰の技術を実行する第1のパスを有する、請求項1から請求項9までのいずれか1項に記載の方法。
  11. 前記第1の雑音低減フィルタの前記計算は、
    Figure 2008513819
    の形式の伝達関数を有する開ループ・ウイーナー・フィルタを実行する第1のパスを有し、ここで、kは前記雑音のある音声信号の前記フレームのインデックスであり、η(k,f)は前記フレームに対応する前記有用な信号の前記電力スペクトル密度の前記推定値と前記雑音の前記推定電力スペクトル密度の比率を表す、請求項10に記載の方法。
  12. 前記フレームに対応する有用な信号の前記電力スペクトル密度の前記推定値は、形式
    Figure 2008513819
    の有向決定推定値を有し、ここで、βは重心パラメータ、あるいは指数関数平滑化推定値である、請求項11に記載の方法。
  13. 前記第1の雑音低減フィルタの前記計算は短期スペクトル減衰の技術を実行する第2のパスをさらに有し、前記フレームに対応する前記有用な信号の前記電力スペクトル密度の前記推定値は前記第1のパスの間に実行される前記計算を考慮している、請求項10から12のいずれか1項に記載の方法。
  14. 前記第1のパスの間に実行される前記計算を考慮した前記フレームに対応する前記有用な信号の前記電力スペクトル密度の前記推定値は
    Figure 2008513819
    の形式であって、ここで、
    Figure 2008513819
    は前記第1のパスの間に計算された伝達関数を表し、X(k,f)は前記雑音のある音声信号のインデックスkの前記フレームの前記周波数領域への変換を表し、また、前記第1の雑音低減フィルタの前記計算は形式
    Figure 2008513819
    の伝達関数を有する開ループ・ウイーナー・フィルタを実行する第2のパスを有し、ここで、η2(k,f)は前記第1のパスの間に計算された前記計算を考慮した前記フレームに対応する前記有用な信号の前記電力スペクトル密度の前記推定値と前記雑音の前記推定電力スペクトル密度の比率を表す、請求項13に記載の方法。
  15. 前記第1の雑音低減フィルタを利用した、前記雑音のある音声信号(x(k,n);X(k,f))の前記フレームの前記濾波は、前記フレーム(X(k,f))の周波数領域への変換で実行される、請求項1から請求項14までのいずれか1項に記載の方法。
  16. 前記第1の雑音低減フィルタを利用した、前記雑音のある音声信号(x(k,n);X(k,f))の前記フレームの前記濾波は、前記第1の雑音低減フィルタの係数の選択と、前記第1の雑音低減フィルタの前記時間的インパルス応答の重みづけを有する、請求項1から請求項15までのいずれか1項に記載の方法。
  17. 前記第1の雑音低減フィルタの256個の係数を、ハニングウインドウによって選択し、重み付けする、請求項16に記載の方法。
  18. 前記雑音のある音声信号の前記フレームに適用される前記周波数領域への変換は、長さ512の高速フーリエ変換であり、前記第1の雑音低減フィルタ(xw(k,n))の前記時間的インパルス応答を、256個の零で補充する、請求項17に記載の方法。
  19. 前記雑音のある音声信号の前記フレームに対応する前記有用な信号と実質的に同じ位置にある高調波を有する第2の信号
    Figure 2008513819
    のフレームを得ることは、前記第1の推定値が前記時間領域内にある場合には、前記雑音のある音声信号の前記フレームの前記第1の、雑音を除去した推定値
    Figure 2008513819
    への非線形の関数の適用を含み、前記第1の推定値が前記周波数領域内にある場合には、前記雑音のある音声信号の前記フレームの前記第1の、雑音を除去した推定値
    Figure 2008513819
    と非線形の関数(d(k,n))の前記周波数領域への変換の前記第1の、雑音を除去した推定値との間の円形の畳み込みの適用を含む、請求項1から請求項18までのいずれか1項に記載の方法。
  20. 前記非線形の関数(d(k,n))は、単一波の修正関数、絶対値、前記雑音のある音声信号の前記フレームの前記第1の、雑音を除去した推定値と閾値との間の最大値、前記雑音のある音声信号の前記フレームの前記第1の、雑音を除去した推定値と閾値との間の最小値、の中の1つである、請求項19記載の方法。
  21. 前記第2の雑音低減フィルタ
    Figure 2008513819
    の前記計算は、短期スペクトル減衰の技術を実行する、請求項2から請求項20までのいずれか1項に記載の方法。
  22. 前記第2の雑音低減フィルタの前記計算は、
    Figure 2008513819
    である
    Figure 2008513819
    である
    Figure 2008513819
    の伝達関数を有する開ループ・ウイーナー・フィルタを実行し、ここで、
    Figure 2008513819
    はインデックスkの前記フレームの前記第1の、雑音を除去した推定値を表し、
    Figure 2008513819
    は前記第2の信号の前記フレームを表し、ρ(k,f)は前記第2の信号に対する再投入パラメータである、
    請求項21に記載の方法。
  23. ρ(k,f)は、周波数および/または時間の関数として変化する、請求項22に記載の方法。
  24. 前記第2の雑音低減フィルタを利用した前記雑音のある音声信号(x(k,n);X(k,f))の前記フレームの前記濾波は、前記フレーム(X(k,f))の周波数領域への変換実行される、請求項1から請求項23までのいずれか1項に記載の方法。
  25. 前記第2の雑音低減フィルタを利用した、前記雑音のある音声信号(x(k,n);X(k,f))の前記フレームの前記濾波は、前記第2の雑音低減フィルタの時間的インパルス応答の選択と重みづけを有する、請求項2から請求項24までのいずれか1項に記載の方法。
  26. 前記第2の雑音低減フィルタの256個の係数をハニングウインドウによって選択し、重み付けする、請求項25記載の方法。
  27. 前記雑音のある音声信号の前記フレームに適用される前記周波数領域への前記変換は、長さが512の高速フーリエ変換であり、前記第2の雑音低減フィルタの前記時間的インパルス応答を256個の零で補充する、請求項26記載の方法。
  28. 前記フレームの第2の、雑音を除去した推定値の前記合成は、OLAブロック・オーバーラップおよアッド、あるいは、OLSブロック・セーブを使用する、請求項2から請求項27までのいずれか1項に記載の方法。
  29. 請求項1から請求項28までのいずれか1項に記載の方法を実行するように設計された手段を有する、雑音のある音声信号を処理する装置。
  30. 請求項29に記載の装置を含む音声ピックアップ装置。
  31. 請求項29に記載の装置を含む通信装置。
  32. 請求項29に記載の装置を含む音声認識装置。
  33. 情報媒体上のコンピュータ・プログラムにおいて、前記プログラムが計算手段によってロードされ、実行される場合に、請求項1から請求項28までのいずれか1項に記載の方法を実行するように作られた命令を有することを特徴とする、情報媒体上のコンピュータ・プログラム。


JP2007531797A 2004-09-16 2005-09-14 雑音のある音声信号を処理する方法および該方法を実行する装置 Active JP5068653B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0409819 2004-09-16
FR0409819 2004-09-16
PCT/FR2005/002284 WO2006032760A1 (fr) 2004-09-16 2005-09-14 Procede de traitement d'un signal sonore bruite et dispositif pour la mise en œuvre du procede

Publications (3)

Publication Number Publication Date
JP2008513819A JP2008513819A (ja) 2008-05-01
JP2008513819A5 true JP2008513819A5 (ja) 2008-11-06
JP5068653B2 JP5068653B2 (ja) 2012-11-07

Family

ID=34949870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007531797A Active JP5068653B2 (ja) 2004-09-16 2005-09-14 雑音のある音声信号を処理する方法および該方法を実行する装置

Country Status (9)

Country Link
US (1) US7359838B2 (ja)
EP (1) EP1789956B1 (ja)
JP (1) JP5068653B2 (ja)
KR (1) KR101168002B1 (ja)
CN (1) CN101031963B (ja)
AT (1) ATE476733T1 (ja)
DE (1) DE602005022735D1 (ja)
ES (1) ES2349718T3 (ja)
WO (1) WO2006032760A1 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8452316B2 (en) * 2004-06-18 2013-05-28 Qualcomm Incorporated Power control for a wireless communication system utilizing orthogonal multiplexing
US7594151B2 (en) * 2004-06-18 2009-09-22 Qualcomm, Incorporated Reverse link power control in an orthogonal system
US7197692B2 (en) 2004-06-18 2007-03-27 Qualcomm Incorporated Robust erasure detection and erasure-rate-based closed loop power control
US8942639B2 (en) * 2005-03-15 2015-01-27 Qualcomm Incorporated Interference control in a wireless communication system
US8848574B2 (en) * 2005-03-15 2014-09-30 Qualcomm Incorporated Interference control in a wireless communication system
CN101331698B (zh) * 2005-10-27 2012-07-18 高通股份有限公司 用于估计无线通信系统中的反向链路负载的方法和设备
US20080117849A1 (en) * 2006-09-08 2008-05-22 Qualcomm Incorporated Method and apparatus for interaction of fast other sector interference (osi) with slow osi
US8670777B2 (en) * 2006-09-08 2014-03-11 Qualcomm Incorporated Method and apparatus for fast other sector interference (OSI) adjustment
US8442572B2 (en) * 2006-09-08 2013-05-14 Qualcomm Incorporated Method and apparatus for adjustments for delta-based power control in wireless communication systems
US8296135B2 (en) * 2008-04-22 2012-10-23 Electronics And Telecommunications Research Institute Noise cancellation system and method
CA2678828A1 (en) * 2008-09-15 2010-03-15 Johnson Controls Technology Company Hvac controller user interfaces
US20100205628A1 (en) * 2009-02-12 2010-08-12 Davis Bruce L Media processing methods and arrangements
US8954320B2 (en) * 2009-07-27 2015-02-10 Scti Holdings, Inc. System and method for noise reduction in processing speech signals by targeting speech and disregarding noise
WO2012038998A1 (ja) * 2010-09-21 2012-03-29 三菱電機株式会社 雑音抑圧装置
US8818806B2 (en) * 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
JP6076981B2 (ja) 2011-08-19 2017-02-08 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 異なるモダリティのx線画像の周波数依存複合
US20150271439A1 (en) * 2012-07-25 2015-09-24 Nikon Corporation Signal processing device, imaging device, and program
FR2999776B1 (fr) * 2012-12-19 2015-01-09 Electricite De France Procede d'evaluation du colmatage d'un echangeur thermique
CN104103278A (zh) * 2013-04-02 2014-10-15 北京千橡网景科技发展有限公司 一种实时语音去噪的方法和设备
KR101788484B1 (ko) 2013-06-21 2017-10-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Tcx ltp를 이용하여 붕괴되거나 붕괴되지 않은 수신된 프레임들의 재구성을 갖는 오디오 디코딩
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN104215265A (zh) * 2014-08-18 2014-12-17 中国空间技术研究院 一种高精度的psd信号降噪方法
WO2016032972A1 (en) * 2014-08-25 2016-03-03 Draeger Medical Systems, Inc. Rejecting noise in a signal
WO2016093854A1 (en) * 2014-12-12 2016-06-16 Nuance Communications, Inc. System and method for speech enhancement using a coherent to diffuse sound ratio
CN104637489B (zh) * 2015-01-21 2018-08-21 华为技术有限公司 声音信号处理的方法和装置
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
CN106328154B (zh) * 2015-06-30 2019-09-17 芋头科技(杭州)有限公司 一种前端音频处理系统
CN105390142B (zh) * 2015-12-17 2019-04-05 广州大学 一种数字助听器语音噪声消除方法
CN105743818A (zh) * 2016-02-03 2016-07-06 国网智能电网研究院 一种分配方法
CN105788607B (zh) * 2016-05-20 2020-01-03 中国科学技术大学 应用于双麦克风阵列的语音增强方法
CN105845146B (zh) * 2016-05-23 2019-09-06 珠海市杰理科技股份有限公司 语音信号处理的方法及装置
US10785581B2 (en) * 2016-06-13 2020-09-22 Med-El Elektromedizinische Geraete Gmbh Recursive noise power estimation with noise model adaptation
CN109427345B (zh) * 2017-08-29 2022-12-02 杭州海康威视数字技术股份有限公司 一种风噪检测方法、装置及系统
FR3086451B1 (fr) * 2018-09-20 2021-04-30 Sagemcom Broadband Sas Filtrage d'un signal sonore acquis par un systeme de reconnaissance vocale
CN110010144A (zh) * 2019-04-24 2019-07-12 厦门亿联网络技术股份有限公司 语音信号增强方法及装置
CN113015050B (zh) * 2019-12-20 2022-11-22 瑞昱半导体股份有限公司 具有抗噪机制的音频播放装置及方法
US20210012767A1 (en) * 2020-09-25 2021-01-14 Intel Corporation Real-time dynamic noise reduction using convolutional networks
CN112242148B (zh) * 2020-11-12 2023-06-16 北京声加科技有限公司 一种基于头戴式耳机的风噪抑制方法及装置
CN112767962B (zh) * 2021-03-01 2021-08-03 北京电信易通信息技术股份有限公司 一种语音增强方法及系统
CN113270113B (zh) * 2021-05-18 2021-12-03 北京理工大学 一种声音信号混杂度的识别方法及系统
WO2022256577A1 (en) * 2021-06-02 2022-12-08 Board Of Regents, The University Of Texas System A method of speech enhancement and a mobile computing device implementing the method

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
FR2764469B1 (fr) * 1997-06-09 2002-07-12 France Telecom Procede et dispositif de traitement optimise d'un signal perturbateur lors d'une prise de son
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
FR2768546B1 (fr) 1997-09-18 2000-07-21 Matra Communication Procede de debruitage d'un signal de parole numerique
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6459914B1 (en) * 1998-05-27 2002-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
FR2820227B1 (fr) * 2001-01-30 2003-04-18 France Telecom Procede et dispositif de reduction de bruit
JP3960834B2 (ja) 2002-03-19 2007-08-15 松下電器産業株式会社 音声強調装置及び音声強調方法
US7054453B2 (en) * 2002-03-29 2006-05-30 Everest Biomedical Instruments Co. Fast estimation of weak bio-signals using novel algorithms for generating multiple additional data frames
GB2398913B (en) * 2003-02-27 2005-08-17 Motorola Inc Noise estimation in speech recognition
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression

Similar Documents

Publication Publication Date Title
JP2008513819A5 (ja)
JP5068653B2 (ja) 雑音のある音声信号を処理する方法および該方法を実行する装置
CN107845389B (zh) 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法
CN109767783B (zh) 语音增强方法、装置、设备及存储介质
CN105788607B (zh) 应用于双麦克风阵列的语音增强方法
US20170004843A1 (en) Externally Estimated SNR Based Modifiers for Internal MMSE Calculations
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
US20080010063A1 (en) Noise Suppressing Device, Noise Suppressing Method, Noise Suppressing Program, and Computer Readable Recording Medium
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
US20090265168A1 (en) Noise cancellation system and method
US9773509B2 (en) Speech probability presence modifier improving log-MMSE based noise suppression performance
JP4965891B2 (ja) 信号処理装置およびその方法
WO2020024787A1 (zh) 音乐噪声抑制方法及装置
JP5152799B2 (ja) 雑音抑圧装置およびプログラム
TWI594232B (zh) 處理音訊信號之方法及裝置
US20150127329A1 (en) Accurate forward snr estimation based on mmse speech probability presence
KR19990028308A (ko) 전력 스펙트럼밀도 추정방법 및 장치
JP5769671B2 (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
KR20160116440A (ko) 음성인식 시스템의 신호대잡음비 추정 장치 및 방법
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP5769672B2 (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
JP5769670B2 (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
Eatwell Single-channel speech enhancement
WO2006077934A1 (ja) 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
JP3586205B2 (ja) 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体