TWI399742B - 音源方向估測方法及系統 - Google Patents
音源方向估測方法及系統 Download PDFInfo
- Publication number
- TWI399742B TWI399742B TW99114817A TW99114817A TWI399742B TW I399742 B TWI399742 B TW I399742B TW 99114817 A TW99114817 A TW 99114817A TW 99114817 A TW99114817 A TW 99114817A TW I399742 B TWI399742 B TW I399742B
- Authority
- TW
- Taiwan
- Prior art keywords
- phase
- sound source
- signal
- frequency
- linear regression
- Prior art date
Links
Description
本發明是有關於一種音源方向估測方法及系統,且特別是有關於一種應用相位平滑化技術的音源方向估測方法及系統。
音源方向估測技術目前己有許多相關研究論文成果發表,但大多都僅存在理論方面之推導驗證及模擬,而其來源訊號大多都以窄頻訊號為主,因此其應用大多僅限於通訊、雷達等系統上。若來源訊號為語音輸入時,則由於語音特性屬於寬頻訊號,在技術處理上則比窄頻訊號困難許多。
若將語音方向估測技術應用在監視系統(加裝麥克風陣列)上,則可使監視系統具有可自動將鏡頭轉至有異常聲音產生之方向、語音定位、多媒體互動等功能,而結合語音定位系統與服務型機器人等技術,則可將使用者所需要的服務透過機器人送至身旁,而有效提升產品價值。
圖1為傳統音源方向估測技術的示意圖。請參照圖1,傳統的音源方向估測系統100包括麥克風陣列110、類比/數位轉換單元120、聲音偵測單元130及音源方向估測單元140,其係利用麥克風陣列110搜集語者所發出的語音訊號,利用類比/數位轉換單元120將類比的語音訊號轉換為數位訊號,再利用聲音偵測單元120找出預設時間區間內此數位訊號中是否包含語音訊號段後,由音源方向估測單元130針對語音訊號段進行音源方向估測以找出訊號來源的角度,而據以判斷音源方向,例如可參照圖2所繪示之麥克風陣列與角度對照圖來判斷音源方向。
雖然傳統的音源方向估測技術在模擬時可得到相當不錯的結果,但在現實環境下則由於語音訊號會受到環境噪音及回聲的影響,因此使得所估測的音源方向不如模擬時估測般的準確。
本發明提供一種音源方向估測方法,可準確估測語音音源的方向。
本發明提供一種音源方向估測系統,利用相位平滑化技術消除音源訊號中因為環境噪音或回聲所造成的相位差異,而增加所估測音源方向的準確性。
本發明提出一種音源方向估測方法,其係利用多個聲音偵測單元分別偵測預設時間內由一個音源發出的音源訊號,接著建構這些聲音偵測單元所偵測之音源訊號的共變異矩陣(Covariance Matrix),並利用線性回歸方式求取最接近這些音源訊號中多個頻率對應之多個相位的相位曲線,並用以更新所述相位,然後利用已更新的相位及共變異矩陣來計算更新共變異矩陣,並過濾此更新共變異矩陣之音源訊號中不屬於語音訊號的多個頻帶,最後則計算已過濾之音源訊號在多個測試角度上的功率值,而以最大功率值對應之測試角度作為所估測的音源方向。
在本發明之一實施例中,上述建構聲音偵測單元所偵測之音源訊號的共變異矩陣的步驟包括經由傅利葉轉換將各個音源訊號由時間域轉換至頻率域,而對頻率域的音源訊號進行赫米特運算及期望值運算,以建構共變異矩陣。
在本發明之一實施例中,上述利用線性回歸方式求取最接近音源訊號中多個頻率對應之相位的相位曲線的步驟包括將音源訊號中各個頻率及其對應之相位標定於相位頻率圖,以求取相位曲線。
在本發明之一實施例中,上述使用相位曲線來更新各個頻率對應之相位的步驟包括計算各個頻率之相位與相位曲線上此頻率對應之預測相位的相位差,並與相位門檻值比較,其中若所計算的相位差大於門檻值,則以預測相位更新此頻率的相位。
在本發明之一實施例中,在上述以預測相位更新頻率的相位的步驟之後,更包括利用線性回歸方式求取最接近已更新之頻率對應之相位的更新相位曲線,而以此更新相位曲線更新各個頻率對應的相位。其中,所述的線性回歸方式包括一次線性回歸、二次線性回歸或多次線性回歸,而這些線性回歸方式包括計算最小平方誤差、主成分回歸或部分最小平方回歸。
在本發明之一實施例中,上述過濾更新共變異矩陣之音源訊號中不屬於語音訊號的頻帶的步驟包括對更新共變異矩陣中的各個頻帶進行特徵值分解,以分解出各個頻帶的多個特徵向量及多個特徵值,其中這些特徵值包括信號子空間及噪聲子空間的特徵值,接著計算各個頻帶中相對應之信號子空間及噪聲子空間之特徵值的比值,並與訊噪比門檻值比較,其中若此頻帶的比值小於訊噪比門檻值,則判斷此頻帶的音源訊號不屬於語音訊號,而將此頻帶的音源訊號濾除。
在本發明之一實施例中,上述計算已過濾之音源訊號在多個測試角度上的功率值的步驟包括透過多重訊號分類演算法或最小變異無失真響應演算法來計算。
本發明提出一種音源方向估測系統,其包括多個聲音偵測單元、共變異矩陣建構單元、相位平滑單元、共變異矩陣重構單元、頻帶過濾單元及方向估測單元。其中,多個聲音偵測單元係分別用以偵測預設時間內由一個音源發出的音源訊號。共變異矩陣建構單元係用以建構這些聲音偵測單元所偵測之音源訊號的共變異矩陣。相位平滑單元係利用線性回歸方式求取最接近上述音源訊號中多個頻率對應之多個相位的相位曲線,並用以更新這些相位。共變異矩陣重構單元係利用已更新的相位及共變異矩陣計算更新共變異矩陣。頻帶過濾單元係用以過濾更新共變異矩陣之音源訊號中不屬於語音訊號的多個頻帶。方向估測單元係用以計算已過濾之音源訊號在多個測試角度上的功率值,而以最大功率值對應之測試角度作為所估測的音源方向。
在本發明之一實施例中,上述之共變異矩陣建構單元包括經由傅利葉轉換將各個音源訊號由時間域轉換至頻率域,並對此頻率域的音源訊號進行赫米特運算及期望值運算,以建構共變異矩陣。
在本發明之一實施例中,上述之相位平滑單元包括將音源訊號中各個頻率及其對應之相位標定於相位頻率圖,以求取相位曲線。
在本發明之一實施例中,上述之相位平滑單元包括計算各個頻率之相位與相位曲線上此頻率對應之預測相位的相位差,並與相位門檻值比較,其中若所計算的相位差大於門檻值,則以預測相位更新此頻率的相位。
在本發明之一實施例中,上述之相位平滑單元包括更利用線性回歸方式求取最接近已更新之頻率對應之相位的更新相位曲線,並以此更新相位曲線更新各個頻率對應的相位。其中,所述的線性回歸方式包括一次線性回歸、二次線性回歸或多次線性回歸,而這些線性回歸方式包括計算最小平方誤差、主成分回歸或部分最小平方回歸。
在本發明之一實施例中,上述之頻帶過濾單元包括特徵值分解子單元、訊噪比計算子單元、訊噪比比較子單元、頻帶濾除子單元。其中,特徵值分解子單元係用以對更新共變異矩陣中的各個頻帶進行特徵值分解,以分解出各個頻帶的多個特徵向量及多個特徵值,其中所述特徵值包括信號子空間及噪聲子空間的特徵值。訊噪比計算子單元係用以計算各個頻帶中相對應之信號子空間及噪聲子空間之特徵值的比值。訊噪比比較子單元係用以將訊噪比計算子單元所計算之比值與訊噪比門檻值比較。頻帶濾除子單元係用以在訊噪比比較子單元判斷頻帶之比值小於訊噪比門檻值,將此頻帶的音源訊號濾除。
在本發明之一實施例中,上述之方向估測單元包括透過多重訊號分類演算法或最小變異無失真響應演算法,計算已由頻帶過濾單元過濾之音源訊號在多個測試角度上的功率值。
基於上述,本發明之音源方向估測方法及系統利用相位平滑化技術消除音源訊號中因為環境噪音或回聲所造成的相位差異,而可以較少數量之麥克風所形成的陣列來估測音源方向,並可維持相當的準確性。
為讓本發明之上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
本發明係藉由相位平滑技術濾除音源訊號中的環境噪音訊號以及不屬於語音訊號的多個頻帶,因此可在使用較少麥克風所組成之陣列的情況下,有效處理因噪聲或回聲所造成之方向估測誤差,而增加音源方向估測的準確性。以下則舉實施例說明本發明之音源方向估測方法及系統的詳細實施方式。
圖3是依照本發明一實施例所繪示之音源方向估測系統的方塊圖,而圖4則是依照本發明一實施例所繪示之音源方向估測方法的流程圖。請同時參照圖3及圖4,本實施例之音源方向估測系統300包括多個聲音偵測單元310、共變異矩陣建構單元320、相位平滑單元330、共變異矩陣重構單元340、頻帶過濾單元350及方向估測單元360,以下即搭配圖3中的各項元件說明本實施例之音源方向估測方法的詳細步驟。
首先,利用聲音偵測單元310分別偵測預設時間內由音源所發出的音源訊號(步驟S410)。其中,對於語音訊號的分析,本實施例係以聲音的能量及振幅大小來做為判斷是否為有聲段之依據,而聲音偵測單元310便是以振幅的大小來做為評估此聲段是否包含語音訊號之依據,振幅Energy x
(m
)的計算公式如下:
其中,m
代表音框數,x
(t
)為代表麥克風所接收之時間域的音源訊號,l
代表音框長度。若振幅Energy x
(m
)大於門檻值,則代表此區段包含語音訊號。
接著,由共變異矩陣建構單元320建構由聲音偵測單元310所偵測之音源訊號的共變異矩陣(Covariance Matrix)(步驟S420)。詳細地說,本實施例係假設聲音偵測單元310的數量為2(如圖5所示),並假設發聲源所發出的訊號為s
(k
),而u 1
及u 2
分別代表兩個聲音偵測單元310所偵測之時間長度為N
的音源訊號,其公式如下:
其中τ為發聲源訊號s
(k
)傳至兩個聲音偵測單元310時,因距離不同所出現之延遲時間。經過傅利葉轉換(Fourier Transform)由時間域轉換到頻率域後,音源訊號可表示為:
U 1
(f
)=S
(f
) (4)
U 2
(f
)=S
(f
)e - j 2π f τ
(5)
其中,f
代表頻率,上述的公式(4)、(5)可改寫成:
其中,A稱為指導向量(Steering Vector),而求其共變異矩陣可得:
其中,H
代表赫米特(Hermitian)運算,E
{‧}為期望值運算,而U 1 U 2 H
與U 2 U 1 H
為:
U 1 U 2 H
=S
(f
)2 e j 2 π f τ
(8)
U 2 U 1 H
=S
(f
)2 e - j 2π f τ
(9)
根據上述,本實施例之共變異矩陣建構單元320係利用傅利葉轉換將各個音源訊號由時間域轉換至頻率域,並對頻率域的音源訊號進行赫米特運算及期望值運算,以建構共變異矩陣。
需說明的是,利用上述公式可針對音源訊號中的每一個頻率f
計算出其相位值ζ=2πf
τ,且集合各個頻率f
所對應的相位值ζ,則可畫出一個相位頻率圖。
舉例來說,圖6為依照本發明一實施例所繪示之相位頻率圖的範例。請參照圖6,本實施例係將發聲源放置在聲音偵測單元310前方30度的位置,而經由上述公式計算音源訊號中多個頻率的相位,以橫軸代表頻率f
(單位為赫茲(Hz)),縱軸代表相位值ζ,而畫出相位頻率圖。由圖6中的相位-頻率的取樣點分佈可知,真實環境下聲音偵測單元310所搜集到之訊號不僅僅只有發聲源所發出之音源訊號,還包括因為環境造成之回響及噪音所產生的訊號,因此使得真實狀況下計算所得的相位與理想狀況下的相位有些許差異。
據此,本實施例即透過相位平滑單元330利用線性回歸方式求取最接近音源訊號中多個頻率對應之相位的相位曲線,並用以更新這些相位,而重建相位曲線(步驟S430)。其中,上述的線性回歸方式例如是一次線性回歸、二次線性回歸或多次線性回歸,而利用線性回歸方式求取相位曲線的方式則包括計算最小平方誤差、主成分回歸或部分最小平方回歸,本實施例不限制其範圍。
詳細地說,圖7為依照本發明一實施例所繪示之相位平滑化方法的流程圖。請參照圖7,本實施例之相位平滑單元330係將音源訊號中的各個頻率及其對應之相位標定於相位頻率圖(步驟S710)。然後,相位平滑單元330即利用線性回歸方式而求取最接近音源訊號相位的相位曲線(步驟S720),其包括在此線性回歸中先找出參考之相位曲線,再將每個頻率的相位與線性回歸後所求得之預測相位比對。其中,相位平滑單元330例如會計算各個頻率之相位與相位曲線上該頻率對應之預測相位的相位差,並與一個相位門檻值比較以決定是否更新相位。其中,若所計算的相位差大於此相位門檻值,則相位平滑單元330會以相位曲線上的預測相位來更新此頻率原先的相位(步驟S730)。在相位更新後,相位平滑單元330會再執行第二次線性回歸以重新求取最接近已更新相位的更新相位曲線(步驟S740),並用以更新原始音源訊號中各個頻率對應的相位(步驟S750)。其中,由於偏離相位曲線(相位差大)的相位已被更新,因此相位平滑單元330第二次求得的更新相位曲線可更貼近原始音源訊號的相位,並可用以去除原始音源訊號中受到環境噪音及回聲影響的相位。
舉例來說,假設代表由方程式(8)、(9)所計算出某一頻率下原始的相位、代表由線性回歸方式所預測的相位、代表新的相位,則其間的關係可用下式來表示:
其中,threshold
即為相位門檻值。若原始相位與預測相位差異太多(即差值絕對值大於門檻值),便以新求得之相位取代。而藉由初步校正差異性較大之相位,再進行第二次線性回歸,即可求得更接近原始相位的相位曲線。
在相位平滑單元330求取相位曲線並用以更新音源訊號的相位後,接著共變異矩陣重構單元340即利用平滑化後所得到之相位及原先由共變異矩陣建構單元320所計算的共變異矩陣,重新計算更新共變異矩陣(步驟S440)。
其中,將公式(8)、(9)中的相位以新求得的相位取代後,可得:
而重新計算的更新共變異矩陣為:
然後,由頻帶過濾單元350過濾更新共變異矩陣之音源訊號中不屬於語音訊號的多個頻帶(步驟S450)。其中,共變異矩陣在經由特徵值分解(Eigenvalue Decomposition,EVD)後,可被分解為由特徵向量(Eigenvector)所形成的矩陣B
以及由特徵值(Eigenvalue)所形成的矩陣Λ。其中,矩陣B
是由訊號及噪聲之特徵向量q s
及q n
所組成;矩陣Λ則是由訊號及噪聲之特徵值λ s
及λ n
所組成,其公式如下:
R uu
=B
ΛB H
(14)
Λ=diag
[λ s λ n
] (15)
B
=[q s q n
] (16)
本發明即利用特徵值分解後的特徵值來進行頻帶過濾,以判別此頻帶是否包含有語音訊號之成分,以下則舉一實施例詳細說明。
圖8是依照本發明一實施例所繪示之頻帶過濾單元的方塊圖,圖9則是依照本發明一實施例所繪示之頻帶過濾方法的流程圖。請同時參照圖8及圖9,本實施例係將頻帶過濾單元350區分為特徵值分解子單元351、訊噪比計算子單元352、訊噪比比較子單元353及頻帶濾除子單元354,以下即搭配圖7中的各項元件說明圖8之頻帶過濾方法的詳細步驟。
首先,由特徵值分解子單元351對更新共變異矩陣中的各個頻帶進行特徵值分解,以分解出各個頻帶的多個特徵向量及多個特徵值(步驟S910)。其中,特徵值分解子單元351例如是利用子空間演算法的特性,將更新共變異矩陣利用特徵值分解為信號子空間及噪聲子空間的特徵值。
接著,由訊噪比計算子單元352計算各個頻帶中相對應之信號子空間及噪聲子空間之特徵值的比值(步驟S920),並由訊噪比比較子單元353將訊噪比計算子單元352所計算之比值與訊噪比門檻值比較,以判斷比值是否小於訊噪比門檻值(步驟S930)。其中,利用特徵值分解後所得之特徵值比值的大小,即可判斷出此頻帶是否包含語音訊號,此特徵值比值又可稱為特徵訊噪比(Eigen Signal-to-Noise Ratio)。
其中,若訊噪比比較子單元353判斷比值小於訊噪比門檻值,則可判斷此頻帶的音源訊號不屬於語音訊號,而由頻帶濾除子單元354濾除此頻帶的音源訊號(步驟S940),並返回步驟S920,由訊噪比計算子單元352繼續計算下一頻帶的特徵值比值;若訊噪比比較子單元353判斷比值不小於訊噪比門檻值,則可判斷此頻帶的音源訊號屬於語音訊號,而保留此頻帶的音源訊號(步驟S950),並返回步驟S920,由訊噪比計算子單元352繼續計算下一頻帶的特徵值比值。
藉由上述方法即可濾除音源訊號中不包含語音訊號的頻帶,而使得最後估測音源方向的結果更為準確。
回到圖4,在頻帶過濾單元350濾除音源訊號中不屬於語音訊號的頻帶之後,方向估測單元360即會計算已過濾之音源訊號在多個測試角度上的功率值,而以最大功率值對應之測試角度作為所估測的音源方向(步驟S460)。
詳細地說,方向估測單元360會針對每個頻帶進行功率計算,其計算公式如下:
其中,power music
(f
)為每個頻帶的功率,power total
(f
)則為所有頻帶功率的總合,q f , n
代表在頻率為f
時所求得之噪聲子空間之特徵向量,Φ
代表欲進行掃描的測試角度,(λ s
/λ n
)為特徵值比值。上述每個頻帶的功率power music
(f
)例如是透過多重訊號分類演算法或最小變異無失真響應演算法所推算而來,在此演算法中特徵向量與指導向量的關係如下:
AR ss A H q n
=0 (18)
A H q n
=0 (19)
兩者結合可得到下式:
A H
(Φ
)q n q n H A
(Φ
)=0 (20)
最後,頻帶的功率power music
(f
)即可藉由求取上式的倒數而得:
方向估測單元360即根據上式,針對各個測試角度Φ
,計算已過濾之音源訊號在此測試角度Φ
上的功率值,最後所求得之最大功率值所對應之測試角度Φ
即為所估測的音源方向。
綜上所述,本發明之音源方向估測方法及系統係在使用者於麥克風陣列前方的任一位置說話時,利用麥克風陣列收集一段預設時間之音源訊號,而找出並計算兩隻麥克風所收到音源訊號的共變異矩陣,並將此共變異矩陣分別送至相位平滑單元及變異矩陣重構單元。經由相位平滑單元計算出相位-頻率圖並對其進行平滑處理後,變異矩陣重構單元即可利用原先計算之共變異矩陣與平滑化後所得之更新共變異矩陣進行矩陣重建,並利用頻帶過濾單元執行特徵值分解及計算特徵訊噪比,據以濾除不屬於語音訊號的頻帶。最終則利用方向估測單元估測音源方向。
藉由本發明的音源方向估測技術,可在對語音訊號進行處理時,針對訊號的來源方向進行語音增強、濾除非訊號來源方向之雜訊,使得此技術可應用在數位家庭生活控制、多媒體互動系統、機器人、監視系統等系統上。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,故本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100...音源方向估測系統
110...麥克風陣列
120...類比/數位轉換單元
130...聲音偵測單元
140...音源方向估測單元
300...音源方向估測系統
310...聲音偵測單元
320...共變異矩陣建構單元
330...相位平滑單元
340...共變異矩陣重構單元
350...頻帶過濾單元
351...特徵值分解子單元
352...訊噪比計算子單元
353...訊噪比比較子單元
354...頻帶濾除子單元
360...方向估測單元
S410~S460...本發明一實施例之音源方向估測方法的步驟
S710~S750...本發明一實施例之相位平滑化方法的步驟
S910~S950...本發明一實施例之頻帶過濾方法的步驟
圖1為傳統音源方向估測技術的示意圖。
圖2為麥克風陣列與角度的對照圖。
圖3是依照本發明一實施例所繪示之音源方向估測系統的方塊圖。
圖4是依照本發明一實施例所繪示之音源方向估測方法的流程圖。
圖5是依照本發明一實施例所繪示之聲音偵測單元與音源的對照圖。
圖6為依照本發明一實施例所繪示之相位頻率圖的範例。
圖7為依照本發明一實施例所繪示之相位平滑化方法的流程圖。
圖8是依照本發明一實施例所繪示之頻帶過濾單元的方塊圖。
圖9是依照本發明一實施例所繪示之頻帶過濾方法的流程圖。
S410~S460...本發明一實施例之音源方向估測方法的步驟
Claims (17)
- 一種音源方向估測方法,包括:利用多個聲音偵測單元分別偵測一預設時間內由一音源發出的一音源訊號;建構該些聲音偵測單元所偵測之該些音源訊號的一共變異矩陣;利用一線性回歸方式求取最接近該些音源訊號中多個頻率對應之多個相位的一相位曲線,並用以更新該些相位;利用已更新的該些相位及該共變異矩陣計算一更新共變異矩陣;過濾該更新共變異矩陣之該些音源訊號中不屬於語音訊號的多個頻帶;以及計算已過濾之該些音源訊號在多個測試角度上的功率值,而以最大功率值對應之該測試角度作為所估測的一音源方向。
- 如申請專利範圍第1項所述之音源方向估測方法,其中建構該些聲音偵測單元所偵測之該些音源訊號的該共變異矩陣的步驟包括:經由一傅利葉轉換將各該些音源訊號由一時間域轉換至一頻率域;以及對該頻率域的該些音源訊號進行一赫米特運算及一期望值運算,以建構該共變異矩陣。
- 如申請專利範圍第1項所述之音源方向估測方法,其中利用該線性回歸方式求取最接近該些音源訊號中多個頻率對應之相位的該相位曲線的步驟包括:標定該音源訊號中該些頻率及其對應之該些相位於一相位頻率圖,以求取該相位曲線。
- 如申請專利範圍第1項所述之音源方向估測方法,其中使用該相位曲線更新該些頻率對應之該些相位的步驟包括:計算各該些頻率之該相位與該相位曲線上該頻率對應之一預測相位的一相位差,並與一相位門檻值比較;以及若該相位差大於該相位門檻值,則以該預測相位更新該頻率的該相位。
- 如申請專利範圍第1項所述之音源方向估測方法,其中在以該預測相位更新該頻率的該相位的步驟之後,更包括:利用該線性回歸方式求取最接近已更新之該些頻率對應之該些相位的一更新相位曲線;以及以該更新相位曲線更新各該些頻率對應的該相位。
- 如申請專利範圍第1項所述之音源方向估測方法,其中該線性回歸方式包括一次線性回歸、二次線性回歸或多次線性回歸,而該線性回歸方式包括計算最小平方誤差、主成分回歸或部分最小平方回歸。
- 如申請專利範圍第1項所述之音源方向估測方法,其中過濾該更新共變異矩陣之該些音源訊號中不屬於語音訊號的頻帶的步驟包括:對該更新共變異矩陣中的該些頻帶進行一特徵值分解,以分解出各該些頻帶的多個特徵向量及多個特徵值,其中該些特徵值包括一信號子空間及一噪聲子空間的特徵值;計算各該些頻帶中相對應之該信號子空間及該噪聲子空間之該些特徵值的一比值,並與一訊噪比門檻值比較;以及若該頻帶的該比值小於該訊噪比門檻值,判斷該頻帶的該音源訊號不屬於該語音訊號,而濾除該頻帶的該音源訊號。
- 如申請專利範圍第1項所述之音源方向估測方法,其中計算已過濾之該些音源訊號在該些測試角度上的功率值的步驟包括透過一多重訊號分類演算法或一最小變異無失真響應演算法來計算。
- 一種音源方向估測系統,包括:多個聲音偵測單元,分別偵測一預設時間內由一音源發出的一音源訊號;一共變異矩陣建構單元,建構該些聲音偵測單元所偵測之該些音源訊號的一共變異矩陣;一相位平滑單元,利用一線性回歸方式求取最接近該些音源訊號中多個頻率對應之多個相位的一相位曲線,並用以更新該些相位;一共變異矩陣重構單元,利用已更新的該些相位及該共變異矩陣計算一更新共變異矩陣;一頻帶過濾單元,過濾該更新共變異矩陣之該些音源訊號中不屬於語音訊號的多個頻帶;以及一方向估測單元,計算已過濾之該些音源訊號在多個測試角度上的功率值,而以最大功率值對應之該測試角度作為所估測的一音源方向。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該共變異矩陣建構單元包括經由一傅利葉轉換將各該些音源訊號由一時間域轉換至一頻率域,並對該頻率域的該些音源訊號進行一赫米特運算及一期望值運算,以建構該共變異矩陣。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該相位平滑單元包括將該音源訊號中該些頻率及其對應之該些相位標定於一相位頻率圖,以求取該相位曲線。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該相位平滑單元包括計算各該些頻率之該相位與該相位曲線上該頻率對應之一預測相位的一相位差,並與一相位門檻值比較,其中若該相位差大於該相位門檻值,則以該預測相位更新該頻率的該相位。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該相位平滑單元包括計算各該些頻率對應之該相位與該相位曲線上該頻率對應之一預測相位的一相位差,並與一相位門檻值比較,其中若該相位差大於該門檻值,則刪除該頻率對應之該相位。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該相位平滑單元包括更利用該線性回歸方式求取最接近已更新之該些頻率對應之該些相位的一更新相位曲線,並以該更新相位曲線更新各該些頻率對應的該相位。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該線性回歸方式包括一次線性回歸、二次線性回歸或多次線性回歸,而該線性回歸方式包括計算最小平方誤差、主成分回歸或部分最小平方回歸。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該頻帶過濾單元包括:一特徵值分解子單元,對該更新共變異矩陣中的該些頻帶進行一特徵值分解,以分解出各該些頻帶的多個特徵向量及多個特徵值,其中該些特徵值包括一信號子空間及一噪聲子空間的特徵值;一訊噪比計算子單元,計算各該些頻帶中相對應之該信號子空間及該噪聲子空間之該些特徵值的一比值;一訊噪比比較子單元,將該訊噪比計算子單元所計算之該些比值與一訊噪比門檻值比較;以及一頻帶濾除子單元,若該訊噪比比較子單元判斷該頻帶之該比值小於該訊噪比門檻值,濾除該頻帶的該音源訊號。
- 如申請專利範圍第9項所述之音源方向估測系統,其中該方向估測單元包括透過一多重訊號分類演算法或一最小變異無失真響應演算法,計算已由該頻帶過濾單元過濾之該些音源訊號在多個測試角度上的功率值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW99114817A TWI399742B (zh) | 2010-05-10 | 2010-05-10 | 音源方向估測方法及系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW99114817A TWI399742B (zh) | 2010-05-10 | 2010-05-10 | 音源方向估測方法及系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201140562A TW201140562A (en) | 2011-11-16 |
TWI399742B true TWI399742B (zh) | 2013-06-21 |
Family
ID=46760357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW99114817A TWI399742B (zh) | 2010-05-10 | 2010-05-10 | 音源方向估測方法及系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI399742B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060106601A1 (en) * | 2004-11-18 | 2006-05-18 | Samsung Electronics Co., Ltd. | Noise elimination method, apparatus and medium thereof |
US20080019548A1 (en) * | 2006-01-30 | 2008-01-24 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
-
2010
- 2010-05-10 TW TW99114817A patent/TWI399742B/zh not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060106601A1 (en) * | 2004-11-18 | 2006-05-18 | Samsung Electronics Co., Ltd. | Noise elimination method, apparatus and medium thereof |
US20080019548A1 (en) * | 2006-01-30 | 2008-01-24 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
Non-Patent Citations (2)
Title |
---|
Ira Clarke and Geoffery Spence, "A space-time estimation for the detection and estimation of multiple sinusoidal signals," in IEE Colloquium, High Resolution Radar and Sonar (Ref. No. 1999/051), 11-11 May 1999, pp. 9/1-9/6 * |
Tze Fen Li, et al., "A simple statistical speech recognition of mandarin monosyllables," Applied Mathematics and Computation 177 (2006), pp. 644-651. 201140562 100/11/16 * |
Also Published As
Publication number | Publication date |
---|---|
TW201140562A (en) | 2011-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6335985B2 (ja) | マルチセンサ音源定位 | |
KR101688354B1 (ko) | 신호 소스 분리 | |
RU2642353C2 (ru) | Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи | |
US9622003B2 (en) | Speaker localization | |
JP5229053B2 (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
JP5305743B2 (ja) | 音響処理装置及びその方法 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
EP2530484B1 (en) | Sound source localization apparatus and method | |
EP2884491A1 (en) | Extraction of reverberant sound using microphone arrays | |
JP6591477B2 (ja) | 信号処理システム、信号処理方法及び信号処理プログラム | |
US9549274B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
US8014230B2 (en) | Adaptive array control device, method and program, and adaptive array processing device, method and program using the same | |
CN109257687B (zh) | 具有非侵入式语音清晰度的听力设备和方法 | |
Bouzid et al. | Investigation of sampling frequency requirements for acoustic source localisation using wireless sensor networks | |
JP2008236077A (ja) | 目的音抽出装置,目的音抽出プログラム | |
JPWO2018037643A1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5406866B2 (ja) | 音源分離装置、その方法及びプログラム | |
Zhang et al. | Multi-Target Ensemble Learning for Monaural Speech Separation. | |
Brendel et al. | Distance estimation of acoustic sources using the coherent-to-diffuse power ratio based on distributed training | |
TWI399742B (zh) | 音源方向估測方法及系統 | |
KR20190073852A (ko) | 우도 최대화를 이용한 빔포밍 방법 | |
JP3862685B2 (ja) | 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム | |
CN116106826A (zh) | 声源定位方法、相关装置和介质 | |
US20210174820A1 (en) | Signal processing apparatus, voice speech communication terminal, signal processing method, and signal processing program | |
Stenzel et al. | Blind-matched filtering for speech enhancement with distributed microphones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |