TWI465121B - 利用全方向麥克風改善通話的系統及方法 - Google Patents

利用全方向麥克風改善通話的系統及方法 Download PDF

Info

Publication number
TWI465121B
TWI465121B TW096146144A TW96146144A TWI465121B TW I465121 B TWI465121 B TW I465121B TW 096146144 A TW096146144 A TW 096146144A TW 96146144 A TW96146144 A TW 96146144A TW I465121 B TWI465121 B TW I465121B
Authority
TW
Taiwan
Prior art keywords
signal
primary
shaped
electrical signal
heart
Prior art date
Application number
TW096146144A
Other languages
English (en)
Other versions
TW200835374A (en
Inventor
Carlos Avendano
Original Assignee
Audience Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/699,732 external-priority patent/US8194880B2/en
Application filed by Audience Inc filed Critical Audience Inc
Publication of TW200835374A publication Critical patent/TW200835374A/zh
Application granted granted Critical
Publication of TWI465121B publication Critical patent/TWI465121B/zh

Links

Description

利用全方向麥克風改善通話的系統及方法
本發明大體上係關於音訊處理且更特定而言係關於使用麥克風間位準差異之通話改善。
目前,存在用於在惡劣環境中減少背景雜訊及改善通話之許多方法。此類方法中之一者為在音訊裝置上使用兩個或兩個以上之麥克風。此等麥克風處於指定位置中且允許音訊裝置判定麥克風信號之間的位準差異。舉例而言,歸因於麥克風之間的空間差異,可利用來自通話源之信號到達麥克風的時間之差異來定位通話源。一旦定位通話源,則可對信號進行空間濾波以抑制發端於不同方向之雜訊。
為了利用兩個全方向麥克風之間的位準差異,通話源需要較接近於該等麥克風中之一者。亦即,為了獲得顯著位準差異,自該源至第一麥克風之距離需要短於自該源至第二麥克風之距離。同樣地,通話源必須維持相對接近於該等麥克風,尤其係在麥克風如行動電話應用所可能要求般非常接近的情況下。
可藉由使用定向麥克風獲得對距離約束之解決方案。使用定向麥克風允許使用者以窄位準間差異(ILD)波束將兩個麥克風之間的有效位準差異擴展到較大範圍。此對於諸如即按即說(PTT)或視訊電話(其中通話源不如(例如)電話應用般非常接近於麥克風)之應用而言可為所要的。
不利地,定向麥克風具有許多實體缺陷。通常,定向麥 克風尺寸大且並不很好地適合小型電話或蜂巢式電話。另外,定向麥克風難以安裝,因為其需要端口以便使聲音自複數個方向到達。製造上之些微變化可導致失配,從而導致更昂貴之製造及生產成本。
因此,需要在通話改善系統中利用定向麥克風之特性而並無使用定向麥克風本身之劣勢。
本發明之實施例克服或大體上減輕與雜訊抑制及通話改善相關聯之先前問題。大體上,提供用於利用麥克風間位準差異(ILD)使雜訊減弱及改善通話的系統及方法。在示範性實施例中,ILD係基於一對全方向麥克風之能量位準差異。
本發明之示範性實施例使用非線性處理來組合來自該對全方向麥克風之聲信號的分量以便獲得ILD。在示範性實施例中,一主要聲信號由一主要麥克風接收,且一次要聲信號由一次要麥克風(例如,全方向麥克風)接收。將該主要聲信號及該次要聲信號轉換成主要電信號及次要電信號以供處理。
差分麥克風陣列(DMA)模組處理該主要電信號及該次要電信號以判定一心形主要信號及一心形次要信號。在示範性實施例中,由延遲節點延遲主要電信號及次要電信號。接著藉由採用在主要電信號與經延遲之次要電信號之間的差異來判定心形主要信號,而藉由採用在次要電信號與經延遲之主要電信號之間的差異來判定心形次要信號。在各 種實施例中,藉由一增益來調節經延遲之主要電信號及經延遲之次要電信號。該增益可為在主要聲信號之量值與次要聲信號之量值之間的比率。
經由一頻率分析模組來對該等心形信號進行濾波,該頻率分析模組採用該等信號且模仿藉由濾波器組在此實施例中模擬之耳蝸(亦即,耳蝸域)之頻率分析。或者,可使用其他濾波器來進行頻率分析及合成,諸如,短時傅立葉變換(STFT)、子頻帶濾波器組、調變複合重疊變換、耳蝸模型、小波等。接著計算與心形主要信號及心形次要信號相關聯之能量位準(例如,作為功率估計),且藉由ILD模組使用非線性組合來處理該等結果以獲得ILD。在示範性實施例中,非線性組合包含用與心形次要信號相關聯之功率估計除與心形主要信號相關聯之功率估計。接著ILD可在雜訊減少系統中用作空間辨別提示以抑制非所欲之聲源及改善通話。
本發明提供用於利用至少兩個麥克風之麥克風間位準差異(ILD)識別由通話所支配之頻率範圍以便改善通話及使背景雜訊及遠場干擾減弱的示範性系統及方法。可對經組態以接收聲音之任何音訊裝置實踐本發明之實施例,該等裝置諸如(但不限於)蜂巢式電話、電話手持機、頭戴式耳機及會議系統。有利地,示範性實施例經組態以對小型裝置或在主要音訊源遠離該裝置之應用中提供改良之雜訊抑制。雖然將參考對蜂巢式電話之操作來描述本發明之一些 實施例,但可對任何音訊裝置實踐本發明。
參看圖1a及圖1b,展示可實踐本發明之實施例的環境。使用者將音訊(通話)源102提供至音訊裝置104。示範性音訊裝置104包含兩個麥克風:一與音訊源102有關之主要麥克風106及一位於距主要麥克風106有一段距離d處之次要麥克風108。在示範性實施例中,麥克風106及108為全方向麥克風。
雖然麥克風106及108自音訊源102接收聲音(亦即,聲信號),但麥克風106及108亦拾取雜訊110。雖然在圖1a及圖1b中雜訊110展示為來自單個位置,但雜訊110可包含來自不同於音訊源102之一或多個位置的任何聲音且可包括迴響及回聲。
本發明之實施例採用在由該兩個麥克風106及108所接收之聲信號之間的位準差異(例如,能量差異),此獨立於獲得該等位準差異之方式。在圖1a中,因為主要麥克風106比次要麥克風108更接近音訊源102,所以在通話/語音段期間對於主要麥克風106而言強度位準較高導致(例如)較大能量位準。在圖1b中,因為主要麥克風106之定向回應在音訊源102之方向上最高,且次要麥克風108之定向回應在音訊源102之方向上較低,所以位準差異在音訊源102之方向上最高且在別處較低。
接著可使用該位準差異來在時間頻率域中辨別通話及雜訊。其他實施例可使用能量位準差異與時間延遲之組合來辨別通話。基於雙耳提示編碼(binaural cue decoding),可 執行通話信號擷取或通話改善。
現參看圖2,更詳細地展示示範性音訊裝置104。在示範性實施例中,音訊裝置104為包含處理器202、主要麥克風106、次要麥克風108、音訊處理引擎204及輸出裝置206的音訊接收裝置。音訊裝置104可包含音訊裝置104操作所必需之其他組件。將結合圖3更詳細地論述音訊處理引擎204。
如先前所論述,主要麥克風106與次要麥克風108分別間隔一段距離以便允許其間存在能量位準差異。在由麥克風106及108接收到聲信號後,聲信號經轉換成電信號(亦即,主要電信號及次要電信號)。根據一些實施例,該等電信號本身可由類比數位轉換器(未圖示)轉換成數位信號以供處理。為了區分聲信號,由主要麥克風106接收之聲信號在本文中被稱作主要聲信號,而由次要麥克風108接收之聲信號在本文中被稱作次要聲信號。
輸出裝置206為向使用者提供音訊輸出的任何裝置。舉例而言,輸出裝置206可為頭戴式耳機或手持機之聽筒或會議裝置上之揚聲器。
圖3為根據本發明之一實施例的示範性音訊處理引擎204之詳細方塊圖。在示範性實施例中,音訊處理引擎204實施於記憶體裝置內。在操作中,將自主要麥克風106及次要麥克風108接收之聲信號(亦即,X1 及X2 )轉換成電信號,且經由差分麥克風陣列(DMA)模組302來處理。DMA模組302經組態以使用DMA理論來為緊密間隔之麥克風106 及108產生定向圖案。DMA模組302可藉由延遲及去掉由麥克風106及108捕獲之聲信號來判定在音訊裝置104周圍之前及後心形區域中之聲音及信號。在下文中將自此等心形區域接收之信號(亦即,聲音)稱作心形信號。在一實例中,來自心形區域內之音訊源102的作為心形主要信號的聲音由主要麥克風106傳輸。來自相同音訊源102的作為心形次要信號的聲音由次要麥克風108傳輸。
對於具有兩個麥克風之系統而言,DMA模組302可在音訊裝置104周圍產生兩個不同之定向圖案。每一定向圖案為音訊裝置104周圍之一區域,在該區域中由該區域內之音訊源102產生之聲音可在幾乎不減弱之情況下由麥克風106及108接收。由在定向圖案外之音訊源102產生之聲音可減弱。
在一實例中,一由DMA模組302產生之定向圖案允許自在音訊裝置104周圍之前心形區域內之音訊源102產生之聲音被接收,且一第二圖案允許來自在音訊裝置104周圍之後心形區域內之第二音訊源102的聲音被接收。來自在此等區域外之音訊源102的聲音亦可被接收,但聲音可能會減弱。
接著由頻率分析模組304處理來自DMA模組302之心形信號。在一實施例中,頻率分析模組304採用該等心形信號且模仿由濾波器組模擬之耳蝸(亦即,耳蝸域)的頻率分析。在一實例中,頻率分析模組304將該等心形信號分離成頻率頻帶。或者,可使用其他濾波器來進行頻率分析及 合成,該等濾波器諸如短時傅立葉變換(STFT)、子頻帶濾波器組、調變複合重疊變換、耳蝸模型、小波等。因為多數聲音(例如,聲信號)為複合的且包含一個以上之頻率,所以對聲信號進行之子頻帶分析判定在一訊框(例如,一預定時間週期)期間何等個別頻率存在於該複合聲信號中。在一實施例中,該訊框為8ms長。
一旦判定出頻率,則將信號轉發至能量模組306,其計算在一時間間隔期間之能量位準估計(亦即,功率估計)。功率估計可基於耳蝸通道及心形信號之頻寬。功率估計接著由麥克風間位準差異(ILD)模組308用於判定ILD。
在各種實施例中,DMA模組302將心形信號發送至能量模組306。能量模組306在由頻率分析模組304對心形信號進行分析之前計算功率估計。
參看圖4a,提供DMA模組302、頻率分析模組304、能量模組306及ILD模組308之一實施例。在此實施例中,由DMA模組302處理由麥克風106及108接收之聲信號。示範性DMA模組302經由延遲節點402 zτ1 延遲主要聲信號X1 。類似地,DMA模組302經由第二延遲節點404 zτ2 延遲次要聲信號X2
在示範性實施例中,在頻域中將心形主要信號(Cf )數學地判定(Z變換)為Cf =X1 -z-τ1 gX2
而將心形次要信號(Cb )數學地判定為Cb =gX2 -z-τ2 X1 增益因數g由增益模組406計算以使信號位準均衡。先前技術系統在麥克風信號具有不同位準時可能會遭受效能損失。在本文中進一步論述增益模組。
在各種實施例中,可經由頻率分析模組304處理心形信號。可將濾波器係數施加至每一麥克風信號。結果,頻率分析模組304之輸出可包含一經濾波之心形主要信號αCf (t,ω)及一經濾波之心形次要信號βCf (t,ω),其中t表示時間指標(t=0,1,…N)且ω表示頻率指標(ω=0,1,…K)。
能量模組306採用來自頻率分析模組304之信號且計算與心形主要信號(Cf )及心形次要信號(Cb )相關聯之功率估計。在示範性實施例中,可藉由對頻率分析模組304之輸出之絕對值求平方及求積分來數學地判定功率估計。來自心形主要信號及心形次要信號之信號的功率估計在本文中被稱作分量。舉例而言,與主要麥克風信號相關聯之能量位準可藉由下式判定 且與次要麥克風信號相關聯之能量位準可藉由下式判定
在給定計算出之能量位準的情況下,可藉由ILD模組308判定ILD。在示範性實施例中,藉由採用能量位準之比率以非線性方式判定ILD,諸如ILD(t,ω)=Ef (t,ω)/Eb (t,ω)將所判定之能量位準施加至此ILD方程式導致
藉由非線性地組合心形主要信號之能量位準(亦即,分量)與心形次要信號之能量位準(亦即,分量),可有效地接收來自在音訊裝置104周圍之前至後心形區域(描繪於圖6中)內之音訊源102的聲音。可藉以擷取信號之空間範圍可由選定之ILD區域指定及控制。相反,若線性地組合心形主要信號及心形次要信號(例如,去掉該等信號),則可有效地接收來自在超心形區域內之音訊源102的聲音。超心形區域可大於(寬於)選定之前至後心形ILD區域,因此經由ILD進行之非線性組合可產生較窄及較大空間選擇性之波束。
一旦判定出ILD,則經由雜訊減少系統310處理該等信號。返回參看圖3,在示範性實施例中,雜訊減少系統310包含雜訊估計模組312、濾波器模組314、濾波器平滑模組316、掩蔽模組318,及頻率合成模組320。
根據本發明之一示範性實施例,使用維納(Wiener)濾波器抑制雜訊/改善通話。然而,為了導出維納濾波器估計,需要特定輸入。此等輸入包含雜訊之功率譜密度及主要聲信號之功率譜密度。
在示範性實施例中,雜訊估計係僅基於來自主要麥克風106之聲信號。根據本發明之一實施例,示範性雜訊估計模組312為可藉由下式在數學上近似之分量N (t ,ω)=λ 1 (t ,ω)E 1 (t ,ω)+(1-λ 1 (t ,ω))min[N (t -1,ω),E 1 (t ,ω)] 如所示,在此實施例中之雜訊估計係基於主要聲信號之當前能量估計E 1 (t ,ω )及前一時間訊框之雜訊估計N(t-1 ,ω) 的最小統計量。結果,有效地及低潛時地執行雜訊估計。
在上述方程式中之λ 1 (t,ω )係自由ILD模組308近似之ILD導出,如
亦即,當ILD在主要麥克風106處小於臨限值(例如,臨限 =0.5)(高於此臨限值被認為係通話)時,λ 1 為小的,且因此雜訊估計值緊密地跟隨雜訊。當ILD開始上升(例如,因為通話存在於大ILD區域內),λ 1 增加。結果,雜訊估計模組312放慢雜訊估計過程,且通話能量並未顯著地影響最終雜訊估計。因此,本發明之示範性實施例可使用最小統計量與語音活動偵測之組合來判定雜訊估計。
濾波器模組314接著基於該雜訊估計導出一濾波器估計。在一實施例中,該濾波器為維納濾波器。替代實施例可涵蓋其他濾波器。因此,根據一實施例,維納濾波器可近似成
其中P s 為通話之功率譜密度,且P n 為雜訊之功率譜密度。根據一實施例,P n 為雜訊估計N (t,ω),其由雜訊估計模組312計算。在一示範性實施例中,P s =E 1 (t,ω)-γN (t,ω),其中E 1 (t,ω)為由能量模組306計算的與主要聲信號(例如,心形主要信號)相關聯之能量估計,且N(t,ω) 為由雜訊估計模 組312提供之雜訊估計。因為雜訊估計隨每一訊框而變,所以濾波器估計亦將隨每一訊框而變。
γ為過度減法項,其為ILD之函數。γ補償雜訊估計模組312之最小統計量的偏差且形成一感覺加權。因為時間常數不同,所以該偏差在純雜訊之部分與雜訊與通話之部分之間不同。因此,在一些實施例中,對此偏差之補償可為必需的。在示範性實施例中,以經驗來判定γ(例如,在大ILD時為2-3 dB,且在低ILD時為6-9 dB)。
在上述示範性維納濾波器方程式中之φ為進一步限制雜訊估計之因數。φ可為任何正值。在一實施例中,可藉由將φ設為2來獲得非線性擴充。根據示範性實施例,以經驗來判定φ且當之主體降至指定值下(例如,自最大可能值W降低了12 dB,其為整體)時施加φ。
因為維納濾波器估計可快速地改變(例如,自一個訊框至下一訊框)且雜訊及通話估計可在每一訊框之間大幅變化,所以按現狀施加維納濾波器估計可導致假影(例如,不連續性、跳波、瞬變等)。因此,提供一可選濾波器平滑模組316以使施加至聲信號之維納濾波器估計根據時間而平滑。在一實施例中,濾波器平滑模組316可數學上近似成M (t ,ω)=λ s (t ,ω)W (t ,ω)+(1-λ s (t ,ω))M (t -1,ω),其中λ s 為維納濾波器估計及主要麥克風能量E1 之函數。
如所示,濾波器平滑模組316在時間(t)時將使用來自在時間(t-1)時之前一訊框之經平滑之維納濾波器估計之值來 使維納濾波器估計平滑。為了允許快速回應於快速改變之聲信號,濾波器平滑模組316對快速改變之信號執行較少平滑,且對改變較慢之信號執行較多平滑。藉由根據E1 相對於時間之加權一階導數使λs 之值變化來達成此。若該一階導數為大的且能量改變為大的,則將λs 設為大值。若該導數為小的則將λs 設為較小值。
在藉由濾波器平滑模組316平滑後,將主要聲信號乘以經平滑之維納濾波器估計以估計通話。在上述維納濾波器實施例中,通話估計由S (t ,ω)=C f (t ,ω)*M (t ,ω)近似,其中C f (t ,ω)為心形主要信號。在示範性實施例中,通話估計發生於掩蔽模組318中。
接下來,將通話估計自耳蝸域轉換回至時域。該轉換包含採用通話估計S (t ,ω)及在頻率合成模組320中將耳蝸通道之相移信號相加。一旦完成轉換,則將信號輸出給使用者。
請注意,圖3之音訊處理引擎204之系統架構為示範性的。替代實施例可包含更多組件、更少組件或相等組件且仍在本發明之實施例之範疇內。可將音訊處理引擎204之各種模組組合成單個模組。舉例而言,可將頻率分析模組304及能量模組306之功能性組合成單個模組。此外,ILD模組308之功能可與能量模組306之功能單獨組合,或與能量模組306協同頻率分析模組304而組合。進一步舉例而言,濾波器模組314之功能性可與濾波器平滑模組316之功能性組合。
現參看圖4b,展示根據本發明之一實施例的DMA模組302之實際實施例。在示範性實施例中,藉由使用使麥克風106及108均衡之濾波器412 F(z)來補償麥克風差異。在一些實施例中,由於濾波器412為非因果濾波器,所以藉由延遲節點414 D(z)將延遲施加至主要麥克風信號。延遲節點414之施加導致兩個通道之對準。
為了實施分數延遲,將全通濾波器416及418(例如,A1 (z)及A2 (z))施加至該等信號。然而,全通濾波器416及418之施加引入延遲。結果,需要兩個以上之延遲節點420及422(例如,D1 (z)及D2 (z))。
可藉由施加由增益模組406計算之增益來修改次要聲信號之量值以使其匹配主要聲信號之量值。增益模組406計算兩個信號(例如,X1 及X2 )之量值且導出該增益g,其為在主要聲信號之量值與次要聲信號之量值之間的比率。接著可使用該增益來計算心形主要信號及心形次要信號。
由於全通濾波器416及418產生高達奈奎斯特(Nyquist)頻率之一半的所要分數延遲,所以以兩倍之系統採樣速率來施加該處理。
結果,提供採樣速率轉換(SRC)節點424及426。SRC節點424及426之輸出為心形主要信號Cf 及心形次要信號Cb
圖5為本發明之替代實施例之方塊圖。在此實施例中,來自麥克風106及108之聲信號在由DMA模組302處理之前係由頻率分析模組304處理。根據本實施例,頻率分析模 組304採用聲信號(亦即,X1 及X2 )且使用濾波器組(諸如,快速傅立葉變換)模仿耳蝸實施例。或者,可使用其他濾波器來進行頻率分析及合成,諸如,短時傅立葉變換(STFT)、子頻帶濾波器組、調變複合重疊變換、耳蝸模型、小波等。頻率分析模組304之輸出可包含複數個信號(例如,每子頻帶或抽頭一個信號)。
藉由計算次要聲信號及主要聲信號之量值且導出增益g(其為在主要聲信號之量值與次要聲信號之量值之間的比率)來修改次要聲信號量值,以使其匹配次要聲信號之量值。隨後,可經由DMA模組302處理該等信號。在本實施例中,利用該等信號之相移(例如,使用)來達成該等信號之分數延遲。
經由能量模組306及ILD模組308進行之處理的剩餘部分類似於結合圖4a描述之處理,但係以每子頻帶或抽頭為基礎。
圖6為根據本發明之示範性實施例產生之前至後心形定向圖案602之極座標圖及ILD圖。心形定向圖案602說明可接收聲信號之範圍。如所示,藉由使用非線性組合處理及延遲節點(例如,420及422),可在向前方向及向後方向上(亦即,沿著x軸)擴展心形定向圖案602之範圍。在向前方向及向後方向上之擴展允許自更遠離麥克風106及108之聲源獲得顯著ILD提示。結果,全方向麥克風106及108可達成模仿定向麥克風之彼等特性的聲學特性。
現參看圖7,展示用於利用全方向麥克風之ILD來抑制雜 訊及改善通話之示範性方法的流程圖700。在步驟702中,由主要麥克風106及次要麥克風108接收聲信號。在示範性實施例中,該等麥克風為全方向麥克風。在一些實施例中,藉由麥克風將聲信號轉換成電信號(亦即,主要電信號及次要電信號)以供處理。
接著於步驟704中,藉由DMA模組302對該等聲信號執行差分陣列分析。在示範性實施例中,DMA模組302經組態以藉由延遲、去掉由麥克風106及108捕獲之聲信號及將一增益因數施加至該等聲信號來判定心形主要信號及心形次要信號。特定地,DMA模組302藉由採用在主要電信號與經延遲之次要電信號之間的差異來判定心形主要信號。類似地,DMA模組302藉由採用在次要電信號與經延遲之主要電信號之間的差異來判定心形次要信號。
在步驟706中,頻率分析模組304對心形主要信號及心形次要信號執行頻率分析。根據一實施例,頻率分析模組304利用濾波器組來判定存在於複合之心形主要信號及心形次要信號中的個別頻率。
在步驟708中,計算用於心形主要信號及心形次要信號之能量估計。在一實施例中,由能量模組306判定能量估計。示範性能量模組306利用一當前心形信號及一先前計算出之能量估計來判定當前心形信號之當前能量估計。
一旦計算出能量估計,則在步驟710中計算麥克風間位準差異(ILD)。在一實施例中,基於心形主要信號及心形次要信號之能量估計的非線性組合來計算ILD。在示範性 實施例中,由ILD模組308計算ILD。
一旦判定出ILD,則在步驟712中經由雜訊減少系統處理心形主要信號及心形次要信號。將結合圖8更詳細地論述步驟712。接著在步驟714中將雜訊減少處理之結果輸出給使用者。在一些實施例中,將電信號轉換成類比信號以供輸出。可經由揚聲器、聽筒或其他類似裝置來輸出。
現參看圖8,提供示範性雜訊減少處理(步驟712)之流程圖。基於計算出之ILD,在步驟802中估計雜訊。根據本發明之實施例,雜訊估計僅基於在主要麥克風106處接收之聲信號。雜訊估計可基於來自主要麥克風106之聲信號之當前能量估計及一先前計算出之雜訊估計。在判定雜訊估計時,根據本發明之示範性實施例,當ILD增加時,停止或放慢雜訊估計。
在步驟804中,藉由濾波器模組314計算濾波器估計。在一實施例中,音訊處理引擎208中所用之濾波器為維納濾波器。一旦判定出濾波器估計,則可在步驟806中使濾波器估計平滑。平滑防止可由音訊假影造成之快速波動。在步驟808中將經平滑之濾波器估計施加至來自主要麥克風106之聲信號以產生通話估計。
在步驟810中,將通話估計轉換回至時域。示範性轉換技術將耳蝸通道之反頻率施加至通話估計。一旦轉換出通話估計,則現在可將音訊信號輸出給使用者。
上述模組可由儲存於儲存媒體上之指令組成。該等指令可由處理器202擷取及執行。指令之一些實例包括軟體、 程式碼及韌體。儲存媒體之一些實例包含記憶體裝置及積體電路。該等指令在由處理器202執行時可操作以指導處理器202根據本發明之實施例來操作。熟習此項技術者熟悉指令、處理器及儲存媒體。
上文參考示範性實施例來描述本發明。對於熟習此項技術者而言顯而易見的係,可在未脫離本發明之較寬範疇之情況下進行各種修改且可使用其他實施例。因此,本發明意欲覆蓋對示範性實施例之此等及其他變化。
102‧‧‧音訊源/聲源
104‧‧‧音訊裝置
106‧‧‧主要麥克風
108‧‧‧次要麥克風
110‧‧‧雜訊
202‧‧‧處理器
204‧‧‧音訊處理引擎
206‧‧‧輸出裝置
302‧‧‧差分麥克風陣列(DMA)模組
304‧‧‧頻率分析模組
306‧‧‧能量模組
308‧‧‧麥克風間位準差異(ILD)模組
310‧‧‧雜訊減少系統
312‧‧‧雜訊估計模組
314‧‧‧濾波器模組
316‧‧‧濾波器平滑模組
318‧‧‧掩蔽模組
320‧‧‧頻率合成模組
402‧‧‧延遲節點
404‧‧‧延遲節點
406‧‧‧增益模組
412‧‧‧濾波器
414‧‧‧延遲節點
416‧‧‧全通濾波器
418‧‧‧全通濾波器
420‧‧‧延遲節點
422‧‧‧延遲節點
424‧‧‧採樣速率轉換(SRC)節點
426‧‧‧採樣速率轉換(SRC)節點
602‧‧‧前至後心形定向圖案
g‧‧‧增益因數
X1 ‧‧‧聲信號
X2 ‧‧‧聲信號
圖1a及圖1b為可實踐本發明之實施例的兩種環境之圖。
圖2為實施本發明之實施例之示範性音訊裝置的方塊圖。
圖3為示範性音訊處理引擎之方塊圖。
圖4a說明DMA模組、頻率分析模組、能量模組及ILD模組之示範性實施例。
圖4b為DMA模組之示範性實施例。
圖5為本發明之替代實施例之方塊圖。
圖6為根據本發明之實施例產生之前至後心形定向圖案之極座標圖及ILD圖。
圖7為用於利用全方向麥克風之ILD來改善通話之示範性方法的流程圖。
圖8為示範性雜訊減少處理之流程圖。
204‧‧‧音訊處理引擎
302‧‧‧差分麥克風陣列(DMA)模組
304‧‧‧頻率分析模組
306‧‧‧能量模組
308‧‧‧麥克風間位準差異(ILD)模組
310‧‧‧雜訊減少系統
312‧‧‧雜訊估計模組
314‧‧‧濾波器模組
316‧‧‧濾波器平滑模組
318‧‧‧掩蔽模組
320‧‧‧頻率合成模組
X1 ‧‧‧聲信號
X2 ‧‧‧聲信號

Claims (28)

  1. 一種用於改善通話之系統,其包含:一主要麥克風及一次要麥克風,該主要麥克風及該次要麥克風經組態以接收一主要聲信號及一次要聲信號;一差分麥克風陣列(DMA)模組,其經組態以基於一自該主要聲信號轉換之主要電信號及自該次要聲信號轉換之次要電信號來判定一心形主要信號及一心形次要信號,該DMA模組經進一步組態以至少部分基於延遲該主要電信號及該次要電信號之至少一者來判定該心形主要信號;及一麥克風間位準差異模組,其經組態以非線性地組合該心形主要信號與該心形次要信號之分量以獲得一麥克風間位準差異。
  2. 如請求項1之系統,其中該DMA模組經組態以藉由採用在一經延遲之主要電信號與一經延遲及位準均衡之次要電信號之間的一差異來判定該心形主要信號。
  3. 如請求項1之系統,其中該DMA模組經組態以藉由判定一增益及採用在一主要電信號與一藉由該增益調節的經延遲之次要電信號之間的一差異來判定該心形主要信號。
  4. 如請求項3之系統,其中該增益為在該主要聲信號之一量值與該次要聲信號之一量值之間的比率。
  5. 如請求項1之系統,其中該DMA模組經組態以藉由採用在該次要電信號與一經延遲之主要電信號之間的一差異 來判定該心形次要信號。
  6. 如請求項1之系統,其進一步包含一經組態以判定該心形主要信號及該心形次要信號之頻率的頻率分析模組。
  7. 如請求項1之系統,其進一步包含一經組態以判定該心形主要信號及該心形次要信號的一訊框之能量估計的能量模組。
  8. 如請求項1之系統,其進一步包含一經組態以基於該心形主要信號之一能量估計及該麥克風間位準差異來判定該主要聲信號之一雜訊估計的雜訊估計模組。
  9. 如請求項1之系統,其進一步包含一經組態以判定一將施加至該主要聲信號之濾波器估計的濾波器模組。
  10. 如請求項9之系統,其進一步包含一經組態以在將該濾波器估計施加至該主要聲信號之前使該濾波器估計平滑的濾波器平滑模組。
  11. 如請求項1之系統,其進一步包含一經組態以判定一通話估計之掩蔽模組。
  12. 如請求項11之系統,其進一步包含一經組態以將該通話估計轉換至一時域中以供輸出的頻率合成模組。
  13. 如請求項1之系統,其中該DMA模組判定該主要電信號之一子頻帶之該心形主要信號及一心形次要信號。
  14. 如請求項1之系統,其中該DMA模組經組態以藉由採用在一位準均衡次要電信號與一經延遲之主要電信號之間的一差異來判定該心形次要信號。
  15. 一種用於改善通話之方法,其包含: 在一主要麥克風處接收一主要聲信號及在一次要麥克風處接收一次要聲信號;基於一自該主要聲信號轉換之主要電信號及一自該次要聲信號轉換之次要電信號來判定一心形主要信號及一心形次要信號;進一步至少部分基於延遲該主要電信號及該次要電信號之至少一者來判定該心形主要信號;及非線性地組合該心形主要信號之分量與該心形次要信號之分量以獲得一麥克風間位準差異。
  16. 如請求項15之方法,其中判定該心形主要信號包含採用在一經延遲之主要電信號與一經延遲之次要電信號之間的一差異。
  17. 如請求項15之方法,其中判定該心形主要信號包含判定一增益及採用在一主要電信號與一由該增益調節的經延遲之次要電信號之間的一差異。
  18. 如請求項17之方法,其中該增益為在該主要聲信號之一量值與該次要聲信號之一量值之間的比率。
  19. 如請求項15之方法,其中判定該心形次要信號包含採用在該次要電信號與一經延遲之主要電信號之間的一差異。
  20. 如請求項15之方法,其中非線性地組合包含用該心形次要信號之該分量除該心形主要信號之該分量。
  21. 如請求項15之方法,其進一步包含判定在一訊框期間該等聲信號中之每一者的一能量估計。
  22. 如請求項15之方法,其進一步包含基於該主要聲信號之一能量估計及該麥克風間位準差異來判定一雜訊估計。
  23. 如請求項22之方法,其進一步包含基於該主要聲信號之該雜訊估計、該主要聲信號之該能量估計及該麥克風間位準差異來判定一濾波器估計。
  24. 如請求項23之方法,其進一步包含藉由將該濾波器估計施加至該主要聲信號來產生一通話估計。
  25. 如請求項23之方法,其進一步包含使該濾波器估計平滑。
  26. 如請求項15之方法,其中該心形主要信號及該心形次要信號係各屬該主要電信號之一子頻帶。
  27. 如請求項15之方法,其中判定該心形主要信號包含採用在一經延遲之主要電信號與一位準均衡次要電信號之間的一差異。
  28. 一種具有在其上包含一程式之非暫態電腦可讀儲存媒體,該程式係藉由一處理器來執行以執行一用於改善通話之方法,該方法包含:在一主要麥克風處接收一主要聲信號及在一次要麥克風處接收一次要聲信號;基於一自該主要聲信號轉換之主要電信號及一自該次要聲信號轉換之次要電信號來判定一心形主要信號及一心形次要信號進一步至少部分基於延遲該主要電信號及該次要電信號之至少一者來判定該心形主要信號;及 非線性地組合該心形主要信號之分量與該心形次要信號之分量以獲得一麥克風間位準差異。
TW096146144A 2007-01-29 2007-12-04 利用全方向麥克風改善通話的系統及方法 TWI465121B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/699,732 US8194880B2 (en) 2006-01-30 2007-01-29 System and method for utilizing omni-directional microphones for speech enhancement

Publications (2)

Publication Number Publication Date
TW200835374A TW200835374A (en) 2008-08-16
TWI465121B true TWI465121B (zh) 2014-12-11

Family

ID=44819699

Family Applications (1)

Application Number Title Priority Date Filing Date
TW096146144A TWI465121B (zh) 2007-01-29 2007-12-04 利用全方向麥克風改善通話的系統及方法

Country Status (1)

Country Link
TW (1) TWI465121B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9437180B2 (en) 2010-01-26 2016-09-06 Knowles Electronics, Llc Adaptive noise reduction using level cues
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030147538A1 (en) * 2002-02-05 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Reducing noise in audio systems
US20030169891A1 (en) * 2002-03-08 2003-09-11 Ryan Jim G. Low-noise directional microphone system
TW200305854A (en) * 2002-03-27 2003-11-01 Aliphcom Inc Microphone and voice activity detection (VAD) configurations for use with communication system
TW200629240A (en) * 2004-12-23 2006-08-16 Motorola Inc Method and apparatus for audio signal enhancement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030147538A1 (en) * 2002-02-05 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Reducing noise in audio systems
US20030169891A1 (en) * 2002-03-08 2003-09-11 Ryan Jim G. Low-noise directional microphone system
TW200305854A (en) * 2002-03-27 2003-11-01 Aliphcom Inc Microphone and voice activity detection (VAD) configurations for use with communication system
TW200629240A (en) * 2004-12-23 2006-08-16 Motorola Inc Method and apparatus for audio signal enhancement

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
US9437180B2 (en) 2010-01-26 2016-09-06 Knowles Electronics, Llc Adaptive noise reduction using level cues
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression

Also Published As

Publication number Publication date
TW200835374A (en) 2008-08-16

Similar Documents

Publication Publication Date Title
US8194880B2 (en) System and method for utilizing omni-directional microphones for speech enhancement
TWI713844B (zh) 用於語音處理的方法及積體電路
JP5762956B2 (ja) ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法
US9312826B2 (en) Apparatuses and methods for acoustic channel auto-balancing during multi-channel signal extraction
US8204252B1 (en) System and method for providing close microphone adaptive array processing
US8958572B1 (en) Adaptive noise cancellation for multi-microphone systems
KR101210313B1 (ko) 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법
US8606571B1 (en) Spatial selectivity noise reduction tradeoff for multi-microphone systems
US8180067B2 (en) System for selectively extracting components of an audio input signal
US8787587B1 (en) Selection of system parameters based on non-acoustic sensor information
US9633670B2 (en) Dual stage noise reduction architecture for desired signal extraction
US8682006B1 (en) Noise suppression based on null coherence
US8761410B1 (en) Systems and methods for multi-channel dereverberation
US20090268920A1 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
KR20120114327A (ko) 레벨 큐를 사용한 적응형 잡음 감소
JP2009503568A (ja) 雑音環境における音声信号の着実な分離
US9699554B1 (en) Adaptive signal equalization
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
CA2574793A1 (en) Headset for separation of speech signals in a noisy environment
US9313573B2 (en) Method and device for microphone selection
KR20130108063A (ko) 다중 마이크로폰의 견고한 잡음 억제
TWI465121B (zh) 利用全方向麥克風改善通話的系統及方法
US11902758B2 (en) Method of compensating a processed audio signal
As’ad et al. Beamforming designs robust to propagation model estimation errors for binaural hearing aids
WO2016045706A1 (en) Method and apparatus for generating a directional sound signal from first and second sound signals

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees