TWI279776B - Method and device for speech enhancement in the presence of background noise - Google Patents

Method and device for speech enhancement in the presence of background noise Download PDF

Info

Publication number
TWI279776B
TWI279776B TW093140706A TW93140706A TWI279776B TW I279776 B TWI279776 B TW I279776B TW 093140706 A TW093140706 A TW 093140706A TW 93140706 A TW93140706 A TW 93140706A TW I279776 B TWI279776 B TW I279776B
Authority
TW
Taiwan
Prior art keywords
frequency
frequency band
band
voice
patent application
Prior art date
Application number
TW093140706A
Other languages
English (en)
Other versions
TW200531006A (en
Inventor
Milan Jelinek
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of TW200531006A publication Critical patent/TW200531006A/zh
Application granted granted Critical
Publication of TWI279776B publication Critical patent/TWI279776B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Devices For Executing Special Programs (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Description

1279776 九、發明說明: 【發明所屬之技術領域】 士。本發明之發明領域係有關於一項技術,以增強語音 l號據以改進为景雜讯出現時的通訊。尤其是(但是 不排除)本發明有關於雜訊減低系統的設計,、其可^ 低語音信號中背景雜訊的準位。 / 【先前技術】 二❹魏系統中背景雜訊的準位是—項重要的 電話時:::主在忍 气夢θΓΐ事 車内(尤其是非手持式的 电活更疋如此),或者是在街道上, 糸統必需在車子雜訊或街 通: 辦公室中,此聲音的干择及非丰1見^月况下操作。在 中,該二Λ,非手持式網際網路的應用 甲3糸、、先必需有效地去除辦公官 y 境雜訊仍可以在生活中碰到 他變動的環 低’或語音增強成為這些應用中制的雜訊減 在低信號雜訊比(SNR)的情況該^的=’通常必需 系統中雜訊減低也相當重要,:自動語音辨識 廣泛應用在各種環境巾。雜訊:音觸I统現今已 的性能,通常在上述說明的應用文進語音編碼演算法 法。 ^ 使用語音辨識演算 雜訊減低中最常使用的技 B〇11”使用頻譜縮減在語音中抑制爽湧瑨縮減(參考s .F· Acoust,語音,信號處理,力耸,雜訊,,IEEETrans· ’第 113J0 頁,1979 1279776 年8月出版)。頻譜縮減示 計rr音的短期頻譜振:=理二二 雜掩為人耳沒有察覺相位失真。實際上,從 ic雜訊語音頻譜⑽中形成以為基礎的 =N=頻譜縮減。此增益函數乘上輸入頻譜以抑: =NR的頻率分量。其缺點為使用傳統的頻譜縮減智 生的音樂殘餘雜訊包含人耳可聽的Ϊ Ϊί=ίΐ= 吾音處理演算法(此語音編碼)。此 日市曰5周/、要係因頻譜估計的變動所致。 ,必,頻譜平整化,以減少變動但是解析】也 ,/另一種方法是使用全縮減因素結合頻譜底層 JT)減少*樂音調(參考M.Ber。叫R. Schwartz‘ J· Makhoul的”減少聲音雜訊以增強語音”,pr〇c ICASSP ’華盛頓DC,1979年8月,第脈2ιι· 此方法的缺點為當音樂音調足量減少時也同時減少語 音。其他方法為軟決定雜訊抑制濾波(參考r. 了 Mc^ulay.以及M. L. Malpass的,,使用軟決定雜訊抑制滤 波态以進行語音增強”,IEEE Trans·聲音,語音,作^ 處理,ASSP-28,第137-145頁,1980年8月出版广 及非線性頻譜縮減(參考P· Lookwood以及j· B〇udy 的”Markov模型及投影法,係使用在車内的自動‘;5 語音通訊,第11卷,215-228頁,1992年6月版/ 【發明内容】 )〇 在本發明之一觀點中,本發明提供一種用於語音俨

Claims (1)

1279776 「 第 93ΐ4〇7〇1 2 號專利 _請案 L—一 " 補充、修正後無劃線之說明書一式三份τ〜〜〜〜〜 十、申請專利範圍: ,包括: 段(bin)之語音信 1· 一種語音信號之雜訊的抑制方 •實行頻率分析料生含有多個頻 號之頻譜域顯示; -集合該等頻段成為若干頻帶, 其特徵在於當有聲音(voiced)之語音活動以語音信 號方式^貞剩時,依據每頻段(pei·如queney_bin),對 該等頻帶之第一組實行雜訊抑制,及依據每頻帶 (per-frequency-band),對該等頻帶之第二組實行雜訊抑 制。 2·如申請專利範圍第丨項之方法,其中該第一組頻帶 疋依據發聲之頻帶之數目來決定。 、3·如申請專利範圍第1項之方法,其中該第一組頻帶 之決定係與聲音截止頻率有關,語音信號低於該截止頻 率被考慮為有聲音的。 4.=請專利範圍第㈣之方法,其中該第一組頻帶 超出截止頻率之上部頻率之語音信號之所 組頻帶 36 1 .如申請專利範圍第1項之方法,其中該第- 2 是預定之固定數目。 1279776
_(更)正替換買 第93140706號專利申請案 補充、修正後無劃線之說明書一式三
號之…「,·「— 每頻帶為基礎。 、對所有頻帶之雜訊抑制之實行是以
方法疋用於抑制該語音框内之雜訊。 ^ 8.如申請專利範圍第7項之方法,包括實行申請專利 範圍第1項之頻率分析,此係使用相對第丨語音訊框樣本 偏移m樣本之分析視窗。 9·如申請專利範圍第7項之方法,包括使用相對第1 語音訊框樣本偏移m樣本之第丨分析視窗來實行第丨頻率 分析,及使用相對第1語音訊框樣本偏移p樣本之第2分 析視窗來實行第2頻率分析。 10·如申請專利範圍第9項之方法,其中m=24及 p=128 ° 11·如申請專利範圍第9項之方法,其中該第2分析視 窗包括一前置(look-ahead)部分,其之範圍是由該語音訊 框至該語音信號之隨後語音訊框。 37
1279776 s— If,號專利申請案 補充、修正後無刻線之說明書—式三份 P ^ %專利範圍第1項之方法,包括藉使用對頻 二帶之比例調整増益(scaling gain)來實行雜訊抑 制。 專利範圍第1項之方法,其中當雜訊抑制 行疋以每頻段為基礎時,該方法進_步包括決定用 於頻段之舰指定比㈣整增益。 14·如申請專利範圍第丨項之方法,其中當雜訊抑制 之實行是以每頻帶絲礎時,該方法進—步包括決定用 於頻帶之頻帶指定比例調整增益。 15·如申請專利範圍第6項之方法,包括藉使用對所 有頻帶之固定比例調整增益來實行雜訊抑制。 =·如申請專利範圍第13項之方法,包括基於為該頻 段所定之信號雜訊比(SNR),決定頻段之頻段指定比例 調整增益值。 17·如申請專利範圍第14項之方法,包括基於為該頻 帶所疋之仏说雜訊比(SNR),決定頻帶之頻帶指定比例 調整增益值。 38 4 1279776 ,93140706號專利申請案 〜 補充、修正後無劃線之說“書一式三份 18·如申請專利範圍第响之方法 利乾圍第16項之步驟於該第!及第2頻率^實订申請專 _ 19.如申請專利範圍第17項之方法,包 利範圍第17項之步驟於該第1及第2頻率分析。行申凊專 20. 如申請專利範圍第12,13或〗4 尹該比例難增益是平整纽例難料。—方法,其 21. 如申請專利範園第12,13或14項之 括使用一具有與特定頻段或特定頻帶之 法,包 成反比義之平整化參數值, ,整增益 特定頻帶之平整化比例職增益Μ制於特定頻段或 』22.如申請專利範圍第12,13或14項之任 是較 頻帶 強3=1寻2會整化對^較小之比例調整增益值-,包 應用於特定頻段或特定 23·如申請專利範圍第13或14項之任一 方法,其中決 Ϊη該大^調整增益值之次數是各語音訊框發生 其 =2 24·如申請專利範圍第23項之方法,其中n: 39 1279776 「傲 “一― I年月丨日修(身)正替取¥ 第93140706號專利申請案L ,,一 ―., …1 補充、修正後無劃線之說明書一式三份 …' 25·如申請專利範圍第13或14項之任一方法,其中決 疋該比例調整增益之次數是各語音訊框發生〇次,其中JJ 大於1,且其中該有聲音之截止頻率至少部分是先前語 音訊框内之語音信號之函數。 26·如申請專利範圍第13之方法,其中以每頻段為基 礎之雜訊抑制是實行於對應17頻帶之最大74頻段。 27·如申請專利範圍第13之方法,其中以每頻段為基 礎之雜訊抑制是實行於對應3700Hz頻率之最大頻段數。 28·如申請專利範圍第16項之方法,其中對於第}個 SNR值,該比例調整增益是設定為最小值,對於大於該 第1個SNR值之第2個SNR值,該比例調整增益是設定為 單位元。 29.如申請專利範圍第28項之方法,其中該第㈠固 SNR值大約等於ldB,及其中該第2個§]^尺值大約 45dB 〇 ' 、30·如申請專利範圍第2〇項之方法,進一步包括不包 含活動語音之該語音信號之區段之偵測。 40 1279776
第93140706號專利申請案Γ 補充、修正後無劃線之說明書一式三份 31·如申請專利範圍第3〇項之 、 設定該平整化比例調整增益為最法’進一步包括重新 含活動語音之語音信號區段。'、值’以回應偵測不包 j二π τ頊寻刑範圍第7項之方 之最大雜訊能量是小於一個閣 ’其中當多數頻帶 寻,雜訊抑制不實行。 33·如申請專利範圍第7項之方 、 反應短暫時滯語音訊框之發生,’進一步包括,為 使用以每頻帶為基礎所衫之比ϋ初之X頻帶’以 訊抑制,以及對於剩餘之頻帶,§増益來實行雜 單-值來實行雜訊抑制。 ㈣比例調整增益之 頻帶咖…— 立户姑如申"月專利範圍第20項之方法,其中對於窄頻語 曰該方法進一步包括,對於最初對應高達37〇〇Hz 之X頻帶,以使用以每頻帶為基礎所決定之平整化比例 調整增益來實行雜訊抑制,以使用對應3700Hz之頻段之 比例調整增益值於介於3700Hz與4000Hz之頻段來實行 雜訊抑制,以及將該語音信號之頻譜之剩餘頻帶歸零。 36·如辛請專利範圍第35項之方法,其中窄頻語音信 41 1279776 牴 3·μ 第93140706號專利申請案L_ 補充、修正後無劃線之說明書一式三份 號 號是向上取樣至12800Hz之語音信 37.如申請專利範圍第3項之方法進一步包括使用 計算之聲音測量以決定有聲音之截止頻率。 “ 38.如中請專利麵第37項之杨,進—步包括決定 Ϊ:具ί:超過有聲音之截止頻率之上部頻率之臨界 β nl,限之設定使得段為基礎之雜訊抑制 疋實订於最少X頻帶及最多y頻帶。 39.如申請專利範圍第38項之方法,其中χ=3及㈣。 截止4頻0專„37項之方法,其中該有聲音之 3700Hz 〇 |义疋5又疋等於或大於325Hz及等於或小於 以Λ一種抑制語音信號之雜訊之裝置,該裝置係用 號之頻 包括多個頻段㈣之語音信 -集合該等頻段成為 其特徵在於該梦番 當該有聲音之語音活^、心制有聲音之語音活動及 於該等頻帶之第一^以語音信號方式被偵測到時,對 一、、且,實行依每頻段為基礎之雜訊抑 42 1279776 第93140706號專利申請案 % 14 匕修(更)正替換頁 補充、修正後無劃線之說明書一式三份 一—一〜 制’及對於該荨頻帶之第二組,實并 > 雜訊抑制。 母頻帶為基礎之 42·如申請專利範圍第41項之穿 帶是依據發聲之頻帶之數目來決定x。,/、中該第一組頻 43.如申請專利範圍第41項之裴 以決定與聲音截止頻率有關之該第—組=該裝置是用 信號低於該截止頻率被考慮為有聲音的。,其中語音 44.如申請專利範圍第43項之裝置,1 所有頻率帶 帶包括具有不超出截止頻率之上部頻率、第一組頻 4 平之語音信號之 組頻 45·如申請專利範圍第41項之襞 帶是預定之固定數目. ”中該第一 46·如申請專利範圍第41項之裝置,复 語音信號之頻帶不存在,該裝置對所ς若有聲音之 之實行是以每頻帶為基礎。 帶之雜訊抑制 47·如申請專利範圍第41項之裝置,复 包括含有若干樣本之語音訊框及該裝署、該語音信銳 框内之雜訊。 & 用於抑制語音 43
1279776 第93140706號專利申請案 補充、修正後無劃線之說明書 48·如申請專利範圍第47項之裝置,其中該裝置用於 實行該頻率分析且使用相對第1語音訊框樣本偏移瓜樣 本之分析視窗。 49·如申請專利範圍第47項之裝置,其中該裝置使用 相對第1語音訊框樣本偏移m樣本之第丨分析視窗來實行 第1頻率分析,及使用相對第1語音訊框樣本偏移p樣本 之第2分析視窗來實行第2頻率分析。 50·如申請專利範圍第49項之裝置,其*m=24 p=128 〇 、*51·如申請專利範圍第49項之裝置,其中該第2分析 視窗包括一前置(l00k_ahead)部分,其範圍是由該語音訊 才匡至該語音信號之隨後語音訊框。 田祉52·如申請專利範圍第41項之裝置,其中該裝置藉使 =對頻段及/或頻帶之比例調整增益㈣inggain)來實行 雜訊抑制。 幻.如中請專利範圍第41項之裝置,其中當雜訊抑制 頻段為基礎時,該裝置進-步用於決定頻 又之頻段指疋比例調整增益。 44 1279776
第93140706號專利申請案 補充、修正後無劃線之說明書二式兰份 54.如申請專利範圍第41項之裴置,其中當雜訊抑制 之實行是以每頻帶為基礎時,該裝置進一步 決定頻 帶之頻帶指定比例調整增益。 、 55·如申請專利範圍第46項之裝置,其中該裝置藉使 用對所有頻帶之固定比例調整增益來實行雜訊抑制。 56·如申請專利範圍第53項之裝置,其中該裝置基於 為該頻1又所疋之信號雜訊比(SNR),決定頻段之頻段指 定比例調整增益值。 、57·如申請專利範圍第54項之裝置,其中該裝置基於 為該頻帶所疋之仏號雜訊比(SNR),決定頻帶之頻帶指 定比例調整增益值。 58·如中請專利範圍第56項之裝置,其中該裝置用以 實仃申請專利範圍第56項之步驟於該以及第2頻率分 析0 音-5由請專利範圍第57項之裝置,其中該裝置用以 實仃申明專利範圍第57項之步驟於該&及第2頻率分 析0 45 1279776 甑 第93140706號專利申請案 補充、修正後無劃線之說明書一式三份 60.如申請專利範圍第52’ 中該比例調整增益是平整化比例^整=任—裝置,其 中該 整增益成反比關係之平整化^ = 例調 頻段或特定㈣之平整化_難增^减用於特定 62·如申請專利範圍第52,幻或“ 1=1 吏平用整:參得數平值整化對於較小之比例調整増: 定頻帶之平二計算應用於特定頻段或特 63.如申請專利_第53或54項之任—裝置, 定該比例調整增益值之次數是各語音訊框發生η次,复 中η大於1。 八 64·如申請專利範圍第63項之方法,其中η=2。 65·如申請專利範圍第53或54項之任一裝置,其中該 裝置用以決定該比例調整增益值之次數是各語音訊框 發生η次,其中η大於丨,且其中該有聲音之截止頻率至 少部分是先前語音訊框内之語音信號之函數。 46 1279776 . 第93H0706號專利申請案 日修(更)正替換1 補充、修正後無劃線之說明着二:式·互香一 66·如申請專利範圍第53之裝置,其中該裝置以每頻 段為基礎之雜訊抑制是實行於對應17頻帶之最大74頻 段0 67·如申請專利範圍第53之裝置,其中該裝置以每頻 段為基礎之雜訊抑制是實行於對應37〇〇Hz頻率之最大 頻段數。 68·如申請專利範圍第56項之裝置,其中對於第1個 SNR值,該比例調整增益是設定為最小值,對於大於該 第1個SNR值之第2個SNR值,該比例調整增益是設定為 單位元。 69·如申請專利範圍第68項之裝置,其中該第1個 SNR值大約等於ldB,及其中該第2個SNR值大約等於 45dB。 70·如申請專利範圍第60項之裝置,其中該裝置用以 偵測不包含活動語音之該語音信號之區段。 71·如申請專利範圍第70項之裝置,其中該裝置用以 重新設定該平整化比例調整增益為最小值,以回應偵測 不包含活動語音之語音信號區段。 47
第93140706號專利申請案 補充、修正後無劃線之說明書一式三份 符72.如中請專利範圍第47項之|置,其中當多數頻帶 之最大雜訊能量是小於—個閾值時,雜訊抑制不實行。 73.如申請專利範圍第47項之裝置,其中為反應短暫 時滯語音訊框之發生,對於最初之χ頻帶,該裝 置以使 用基於每頻帶所決定之比例調整增益來實行雜訊抑 制,以及對於剩餘之頻帶,該裝置以使用比例調整增益 之單一值來實行雜訊抑制。 74·如申請專利範圍第73項之裝置,其中該最初之又 頻帶對應之頻率高達1700Hz。 75·如申請專利範圍第60項之裝置,其中對於窄頻語 音信號’該裝置,對於最初對應高達37〇〇Hz之χ頻帶, 以使用以每頻帶為基礎所決定之平整化比例調整增益 來實行雜訊抑制,以使用對應3700Hz之頻段之比例調整 增益值於介於3700Hz與4000Hz之頻段來實行雜訊抑 制,以及將該語音信號之頻譜之剩餘頻帶歸零。 76·如申請專利範圍第75項之裝置,其中窄頻語音信 號是向上取樣至12800Hz之語音信號。 77·如申請專利範圍第43項之裝置,其中該裝置以使 用計算之聲音測量來決定有聲音之截止頻率。 48 1279776 wt:IT 第93140706號專利申請案 補充、修正後無劃線之^明^:瓦互吞 年月丨七:¾).(射频I 78·如申請專利範圍第77項之裝置,其中該裝置用以 決定若干具有不超過有聲音之截止頻率之上部頻率之 臨界頻帶,其中界限之設定使得基於頻段之雜訊抑制是 實行於最少X頻帶及最多y頻帶。 79.如申請專利範圍第78項之裝置,其中χ=3及尸17。 、80·如申請專利範圍第77項之裝置,其中該有聲音之 截止頻率之界限是設於或大^325Ηζ 小於 3700Hz 〇 用以 81·-種包括雜訊抑制裝置之語音編碼器,該裝置係 號之頻譜ΪΓ示㈣以產生含有多軸段(bin)之語音信 -集合該等頻段成為若干頻帶, 當該;^ :二貞測有聲音之語音活動及 ΐ 動料信號方式被彳貞咖抹,對 等第頻了之第實行依每頻段 ::Γ頻帶之第二組’實行依每頻帶為基礎之 82· —種包括雜訊抑制裝署+ Α 1利哀置之自動化語音辨識系 49 咚 3· 14 1279776 第93140706號專利申請案 補充、修正後無劃線之說明書一式三份 統,該裝置用以: -實行頻率分析以產生包括多個 號之頻譜域顯示; 以又(bm)之浯s仏 -集合該等頻段成為若干頻帶, 其,徵在於該裝置用以债測有聲音之語 §該有聲音之語音活動以纽音 ^^曰/ 帶之第一組,實躲v頻:為破:=二 _ :訊::於該等頻帶之第二組,實行依每頻帶= 該裝置用 以 :83. 一種包括雜訊抑制裝置之行動電話, 頻段(bin)之語音信 -實行頻率分析以產 號之頻譜域顯示; 栝夕個 -集合該等頻段成為若干頻 書 #其f徵在於該裝置用以偵測右馨立A 虽該有聲音之語音活動以語音作、^之語音活動及 於該等頻帶之第一組,實 方式被偵測到時,對 制,及對於該等頻帶之第二=每頻段為基礎之雜訊抑 雜訊抑制。 一,實行依每頻帶為基礎之 50
TW093140706A 2003-12-29 2004-12-27 Method and device for speech enhancement in the presence of background noise TWI279776B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CA002454296A CA2454296A1 (en) 2003-12-29 2003-12-29 Method and device for speech enhancement in the presence of background noise

Publications (2)

Publication Number Publication Date
TW200531006A TW200531006A (en) 2005-09-16
TWI279776B true TWI279776B (en) 2007-04-21

Family

ID=34683070

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093140706A TWI279776B (en) 2003-12-29 2004-12-27 Method and device for speech enhancement in the presence of background noise

Country Status (19)

Country Link
US (1) US8577675B2 (zh)
EP (1) EP1700294B1 (zh)
JP (1) JP4440937B2 (zh)
KR (1) KR100870502B1 (zh)
CN (1) CN100510672C (zh)
AT (1) ATE441177T1 (zh)
AU (1) AU2004309431C1 (zh)
BR (1) BRPI0418449A (zh)
CA (2) CA2454296A1 (zh)
DE (1) DE602004022862D1 (zh)
ES (1) ES2329046T3 (zh)
HK (1) HK1099946A1 (zh)
MX (1) MXPA06007234A (zh)
MY (1) MY141447A (zh)
PT (1) PT1700294E (zh)
RU (1) RU2329550C2 (zh)
TW (1) TWI279776B (zh)
WO (1) WO2005064595A1 (zh)
ZA (1) ZA200606215B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI488179B (zh) * 2008-06-30 2015-06-11 Audience Inc 藉由歸零處理雜訊減除提供雜訊抑制的方法及系統
US9495951B2 (en) 2013-01-17 2016-11-15 Nvidia Corporation Real time audio echo and background noise reduction for a mobile device
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
US10325612B2 (en) 2012-11-20 2019-06-18 Unify Gmbh & Co. Kg Method, device, and system for audio data processing

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7113580B1 (en) * 2004-02-17 2006-09-26 Excel Switching Corporation Method and apparatus for performing conferencing services and echo suppression
US8438026B2 (en) * 2004-02-18 2013-05-07 Nuance Communications, Inc. Method and system for generating training data for an automatic speech recognizer
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
SG161223A1 (en) 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation
ES2705589T3 (es) * 2005-04-22 2019-03-26 Qualcomm Inc Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US7930178B2 (en) * 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
US7593535B2 (en) * 2006-08-01 2009-09-22 Dts, Inc. Neural network filtering techniques for compensating linear and non-linear distortion of an audio transducer
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
WO2008106036A2 (en) 2007-02-26 2008-09-04 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
JP5186510B2 (ja) * 2007-03-19 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション スピーチ明瞭度強化方法と装置
CN101320559B (zh) * 2007-06-07 2011-05-18 华为技术有限公司 一种声音激活检测装置及方法
CA2690433C (en) * 2007-06-22 2016-01-19 Voiceage Corporation Method and device for sound activity detection and sound signal classification
ATE514163T1 (de) * 2007-09-12 2011-07-15 Dolby Lab Licensing Corp Spracherweiterung
JPWO2009051132A1 (ja) * 2007-10-19 2011-03-03 日本電気株式会社 信号処理システムと、その装置、方法及びそのプログラム
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
CA2715432C (en) 2008-03-05 2016-08-16 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
US8606573B2 (en) * 2008-03-28 2013-12-10 Alon Konchitsky Voice recognition improved accuracy in mobile environments
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8515097B2 (en) * 2008-07-25 2013-08-20 Broadcom Corporation Single microphone wind noise suppression
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2416315B1 (en) * 2009-04-02 2015-05-20 Mitsubishi Electric Corporation Noise suppression device
BR112012000273A8 (pt) * 2009-07-07 2017-10-24 Koninl Philips Electronics Nv método de processamento de sinais respiratórios, sistema de processamento de sinais respiratórios, programa de computador ou produto de programa de computador para realizar o método e transportador de dados
WO2011049515A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and voice activity detector for a speech encoder
AU2010308597B2 (en) * 2009-10-19 2015-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
BR122019025154B1 (pt) * 2010-01-19 2021-04-13 Dolby International Ab Sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
MX2012010350A (es) * 2010-03-09 2012-10-05 Fraunhofer Ges Forschung Aparato y metodo para manejar episodios de sonido de transitorios en señales de audio al cambiar el tono o velocidad de repeticion.
KR101173980B1 (ko) * 2010-10-18 2012-08-16 (주)트란소노 음성통신 기반 잡음 제거 시스템 및 그 방법
KR101176207B1 (ko) * 2010-10-18 2012-08-28 (주)트란소노 음성통신 시스템 및 음성통신 방법
US8831937B2 (en) * 2010-11-12 2014-09-09 Audience, Inc. Post-noise suppression processing to improve voice quality
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
ES2489472T3 (es) 2010-12-24 2014-09-02 Huawei Technologies Co., Ltd. Método y aparato para una detección adaptativa de la actividad vocal en una señal de audio de entrada
KR20120080409A (ko) * 2011-01-07 2012-07-17 삼성전자주식회사 잡음 구간 판별에 의한 잡음 추정 장치 및 방법
EP2663903A1 (de) * 2011-01-11 2013-11-20 Siemens Aktiengesellschaft Verfahren und vorrichtung zur filterung eines signals und regeleinrichtung für einen prozess
US8650029B2 (en) * 2011-02-25 2014-02-11 Microsoft Corporation Leveraging speech recognizer feedback for voice activity detection
US20140114653A1 (en) * 2011-05-06 2014-04-24 Nokia Corporation Pitch estimator
TWI459381B (zh) 2011-09-14 2014-11-01 Ind Tech Res Inst 語音增強方法
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
ES2568640T3 (es) 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN103886867B (zh) * 2012-12-21 2017-06-27 华为技术有限公司 一种噪声抑制装置及其方法
CA2948015C (en) 2012-12-21 2018-03-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
CN110223704B (zh) * 2013-01-29 2023-09-15 弗劳恩霍夫应用研究促进协会 对音频信号的频谱执行噪声填充的装置
JP6303340B2 (ja) 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
DE102013111784B4 (de) 2013-10-25 2019-11-14 Intel IP Corporation Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren
US9449615B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Externally estimated SNR based modifiers for internal MMSE calculators
US9449610B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Speech probability presence modifier improving log-MMSE based noise suppression performance
US9449609B2 (en) * 2013-11-07 2016-09-20 Continental Automotive Systems, Inc. Accurate forward SNR estimation based on MMSE speech probability presence
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
GB2523984B (en) 2013-12-18 2017-07-26 Cirrus Logic Int Semiconductor Ltd Processing received speech data
CN107086043B (zh) 2014-03-12 2020-09-08 华为技术有限公司 检测音频信号的方法和装置
US10176823B2 (en) * 2014-05-09 2019-01-08 Apple Inc. System and method for audio noise processing and noise reduction
KR20160000680A (ko) * 2014-06-25 2016-01-05 주식회사 더바인코퍼레이션 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치
JP6208377B2 (ja) 2014-07-29 2017-10-04 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオ信号における背景雑音の推定
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
US9947318B2 (en) * 2014-10-03 2018-04-17 2236008 Ontario Inc. System and method for processing an audio signal captured from a microphone
US9886966B2 (en) * 2014-11-07 2018-02-06 Apple Inc. System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition
TWI569263B (zh) * 2015-04-30 2017-02-01 智原科技股份有限公司 聲頻訊號的訊號擷取方法與裝置
KR102015742B1 (ko) * 2015-12-01 2019-08-28 미쓰비시덴키 가부시키가이샤 음성 인식 장치, 음성 강조 장치, 음성 인식 방법, 음성 강조 방법 및 네비게이션 시스템
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN108022595A (zh) * 2016-10-28 2018-05-11 电信科学技术研究院 一种语音信号降噪方法和用户终端
CN106782504B (zh) * 2016-12-29 2019-01-22 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN111183476B (zh) * 2017-10-06 2024-03-22 索尼欧洲有限公司 基于子窗口序列内的rms功率的音频文件包络
US10771621B2 (en) * 2017-10-31 2020-09-08 Cisco Technology, Inc. Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications
RU2701120C1 (ru) * 2018-05-14 2019-09-24 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для обработки речевого сигнала
US10681458B2 (en) * 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
KR102327441B1 (ko) * 2019-09-20 2021-11-17 엘지전자 주식회사 인공지능 장치
US11217262B2 (en) * 2019-11-18 2022-01-04 Google Llc Adaptive energy limiting for transient noise suppression
US11264015B2 (en) 2019-11-21 2022-03-01 Bose Corporation Variable-time smoothing for steady state noise estimation
US11374663B2 (en) * 2019-11-21 2022-06-28 Bose Corporation Variable-frequency smoothing
CN111429932A (zh) * 2020-06-10 2020-07-17 浙江远传信息技术股份有限公司 语音降噪方法、装置、设备及介质
CN112634929B (zh) * 2020-12-16 2024-07-23 普联国际有限公司 一种语音增强方法、装置及存储介质

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57161800A (en) * 1981-03-30 1982-10-05 Toshiyuki Sakai Voice information filter
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
JP3297307B2 (ja) * 1996-06-14 2002-07-02 沖電気工業株式会社 背景雑音消去装置
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US6097820A (en) * 1996-12-23 2000-08-01 Lucent Technologies Inc. System and method for suppressing noise in digitally represented voice signals
US6456965B1 (en) * 1997-05-20 2002-09-24 Texas Instruments Incorporated Multi-stage pitch and mixed voicing estimation for harmonic speech coders
US6044341A (en) * 1997-07-16 2000-03-28 Olympus Optical Co., Ltd. Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
US20020002455A1 (en) * 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US7209567B1 (en) * 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6233549B1 (en) * 1998-11-23 2001-05-15 Qualcomm, Inc. Low frequency spectral enhancement system and method
US6363345B1 (en) * 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
JP4242516B2 (ja) 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US6862567B1 (en) * 2000-08-30 2005-03-01 Mindspeed Technologies, Inc. Noise suppression in the frequency domain by adjusting gain according to voicing parameters
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6925435B1 (en) 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7155385B2 (en) * 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
TWI488179B (zh) * 2008-06-30 2015-06-11 Audience Inc 藉由歸零處理雜訊減除提供雜訊抑制的方法及系統
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US10325612B2 (en) 2012-11-20 2019-06-18 Unify Gmbh & Co. Kg Method, device, and system for audio data processing
US10803880B2 (en) 2012-11-20 2020-10-13 Ringcentral, Inc. Method, device, and system for audio data processing
US9495951B2 (en) 2013-01-17 2016-11-15 Nvidia Corporation Real time audio echo and background noise reduction for a mobile device
TWI588820B (zh) * 2013-01-17 2017-06-21 輝達公司 音訊強化系統
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression

Also Published As

Publication number Publication date
ES2329046T3 (es) 2009-11-20
EP1700294B1 (en) 2009-08-26
AU2004309431C1 (en) 2009-03-19
TW200531006A (en) 2005-09-16
CN1918461A (zh) 2007-02-21
JP4440937B2 (ja) 2010-03-24
MY141447A (en) 2010-04-30
US8577675B2 (en) 2013-11-05
EP1700294A4 (en) 2007-02-28
BRPI0418449A (pt) 2007-05-22
KR100870502B1 (ko) 2008-11-25
PT1700294E (pt) 2009-09-28
CN100510672C (zh) 2009-07-08
AU2004309431B2 (en) 2008-10-02
CA2550905C (en) 2010-12-14
AU2004309431A1 (en) 2005-07-14
KR20060128983A (ko) 2006-12-14
HK1099946A1 (en) 2007-08-31
RU2329550C2 (ru) 2008-07-20
RU2006126530A (ru) 2008-02-10
JP2007517249A (ja) 2007-06-28
DE602004022862D1 (de) 2009-10-08
MXPA06007234A (es) 2006-08-18
CA2454296A1 (en) 2005-06-29
ZA200606215B (en) 2007-11-28
EP1700294A1 (en) 2006-09-13
US20050143989A1 (en) 2005-06-30
WO2005064595A1 (en) 2005-07-14
ATE441177T1 (de) 2009-09-15
CA2550905A1 (en) 2005-07-14

Similar Documents

Publication Publication Date Title
TWI279776B (en) Method and device for speech enhancement in the presence of background noise
Monson et al. Ecological cocktail party listening reveals the utility of extended high-frequency hearing
EP2737479B1 (en) Adaptive voice intelligibility enhancement
EP2649813B1 (en) Hearing aid and a method of improved audio reproduction
Cooke et al. Intelligibility-enhancing speech modifications: the hurricane challenge.
AU771444B2 (en) Noise reduction apparatus and method
TW594676B (en) Noise reduction device
US8494199B2 (en) Stability improvements in hearing aids
US8891778B2 (en) Speech enhancement
WO2018028170A1 (zh) 多声道信号的编码方法和编码器
Kim et al. Nonlinear enhancement of onset for robust speech recognition.
KR101837331B1 (ko) 보청기 시스템을 동작시키는 방법 및 보청기 시스템
CN104867499A (zh) 一种用于助听器的分频段维纳滤波去噪方法和系统
EP2151820B1 (en) Method for bias compensation for cepstro-temporal smoothing of spectral filter gains
JP4680099B2 (ja) 音声処理装置および音声処理方法
JP3269669B2 (ja) 聴覚補償装置
JP4785563B2 (ja) 音声処理装置および音声処理方法
EP2675191B1 (en) Frequency translation in hearing assistance devices using additive spectral synthesis
DK2584795T3 (da) Fremgangsmåde til bestemmelse af en kompressionskarakteristik
Bao et al. A novel speech enhancement method using power spectra smooth in wiener filtering
Gobl et al. Inverse filtering of nasalized vowels using synthesized speech
Arioz et al. Preliminary results of a novel enhancement method for high-frequency hearing loss
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
Liu et al. A new frequency lowering technique for Mandarin-speaking hearing aid users
Jiang et al. Speech noise reduction algorithm in digital hearing aids based on an improved sub-band SNR estimation