TWI714303B

TWI714303B - 聲源定位方法及聲音系統

Info

Publication number: TWI714303B
Application number: TW108136524A
Authority: TW
Inventors: 陳宥全
Original assignee: 宇智網通股份有限公司
Priority date: 2019-10-09
Filing date: 2019-10-09
Publication date: 2020-12-21
Also published as: TW202115423A; US20210112336A1

Abstract

一種聲源定位方法，應用於一聲音系統，該聲音系統包括一麥克風陣列，該方法包括該麥克風陣列接收一接收信號；根據該接收信號，建立一成本函數；形成多個粒子，其中該多個粒子為多個虛擬粒子；以及根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個更新位置，並根據該多個更新位置取得至少一聲源位置。

Description

聲源定位方法及聲音系統

本發明係指一種聲源定位方法及聲音系統，尤指一種低運算複雜度且精準定位的聲源定位方法及聲音系統。

空間中的聲源定位(Sound Source Localization)是聲音訊號處理領域中一項重要的技術，在聲源分離或是降低環境噪音干擾的操作中，目標或是干擾聲源的位置資訊對提升分離或降噪效能上有很大的幫助。此外，在語音處理相關應用中，聲源的位置也是整體系統中的一項重要資訊，例如在視訊會議中確認發言者的位置，或是智慧型機器人辨別交談者的方位等。一般較為準確的聲源定位均需麥克風陣列，藉由若干麥克風按照一定的方式佈置在空間不同位置上組成的陣列。麥克風陣列因為其空間選擇性，可以在一定範圍內實現聲源的定位。

多重訊號分類(Multiple Signal Classification，MUSIC)演算法是常用的聲源定位方法。然而，MUSIC演算法的運算複雜度高，且無法聲源定位得很精細。

因此，習知技術實有改善之必要。

因此，本發明之主要目的即在於提供一種低運算複雜度且精準定位的聲源定位方法及聲音系統，以改善習知技術的缺點。

本發明實施例揭露一種聲源定位方法，應用於一聲音系統，該聲音系統包括一麥克風陣列，該方法包括該麥克風陣列接收一接收信號；根據該接收信號，建立一成本函數；形成多個粒子，其中該多個粒子為多個虛擬粒子；以及根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個更新位置，並根據該多個更新位置取得至少一聲源位置。

本發明實施例另揭露一種聲音系統，包括一麥克風陣列，包括多個麥克風，用來接收一接收信號；一聲源定位模組，用來執行以下步驟：根據該接收信號，建立一成本函數；形成多個粒子，其中該多個粒子為多個虛擬粒子；以及根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個更新位置，並根據該多個更新位置取得至少一聲源位置。

10:聲音系統

12:麥克風陣列

14:聲源定位模組

20、30、40:流程

202~208、300~312、400~412:步驟

ULA:均勻線性陣列

UCA:均勻環形陣列

θ、θ_S:仰角

φ、φ_S:水平角

第1圖為本發明實施例一聲音系統之示意圖。

第2圖為本發明實施例一聲源定位流程之示意圖。

第3圖為一均勻線性陣列的示意圖。

第4圖為一均勻環形陣列的示意圖。

第5圖為本發明實施例一流程的示意圖。

第6圖為一二維空間的示意圖。

第7圖為本發明實施例一流程的示意圖。

第1圖為本發明實施例一聲音系統10之示意圖。聲音系統10包括一麥克風陣列12以及一聲源定位模組14。麥克風陣列12包括多個麥克風120_1~120_M，其可排列成一環型陣列(Circular Array)或是一線性陣列(Linear)，且不限於此。於一實施例中，聲源定位模組14可利用特殊應用積體電路(Application-specific integrated circuit)來實現。於一實施例中，聲源定位模組14可包括處理器以及儲存單元，儲存單元可用來儲存一程式碼，該程式碼用來指示處理器執行關於聲源定位的運算，其中，處理器可為處理單元(Processing Unit)、應用處理器(Application Processor)或是數位信號處理器(Digital Signal Processor)，處理單元可為中央處理單元(Central Processing Unit，CPU)、圖形處理單元(Graphics Processing Unit，GPU)甚至張量處理單元(Tensor Processing Unit，TPU)，而不在此限。儲存單元可為一記憶體，其可為一非揮發性記憶體(Non-Volatile Memory，例如，一電子抹除式可複寫唯讀記憶體(Electrically Erasable Programmable Read Only Memory,EEPROM)或一快閃記憶體(Flash Memory))，而不在此限。

與現有技術不同的是，聲源定位模組14可根據麥克風陣列12所接收的接收信號，利用一粒子群最佳化(Particle Swarm Optimization，PSO)演算法，定位出聲源的位置。

第2圖為本發明實施例一聲源定位流程20之示意圖。聲源定位流程20 可由聲音系統10來執行，如第2圖所示，聲源定位流程20包括以下步驟：

步驟202：麥克風陣列接收一接收信號。

步驟204：根據該接收信號，建立一成本函數。

步驟206：形成多個粒子。

步驟208：根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個更新位置，並根據該多個更新位置取得至少一聲源位置。

於步驟202中，麥克風陣列12接收一接收信號r，其中接收信號r可以向量表示法表示為r=[r₁,...r_M]^T，r_m代表麥克風120_m所接收到的信號。

於步驟204中，聲源定位模組14根據接收信號r，建立一成本函數CF。成本函數CF可代表或反映出所計算出聲源位置的可靠度，成本函數CF與所計算出聲源位置的可靠度之間可具有單調遞增關係或單調遞減關係。以成本函數CF與聲源位置可靠度之間為單調遞增，成本函數CF所對應出的成本值越高，代表所計算出聲源位置的可靠度越高。

建立成本函數CF的方式並未有所限，於一實施例中，可利用MUSIC演算法中作為判斷依據的函數(記為S_MUSIC)作為步驟204的成本函數CF。

詳細來說，聲源定位模組14可根據接收信號r，計算對應於接收信號r的一相關矩陣R _rr為R _rr=E[r．r ^H]，其中E[．]為取平均值運算，其可為統計上的總體平均值(Ensemble Average)或是時間平均值(Time Average)。

聲源定位模組14取得相關矩陣R _rr之後，聲源定位模組14可對相關矩陣R _rr進行一特徵值分解(Eigenvalue Decomposition)，以取得對應於相關矩陣R _rr的多個特徵值(Eigenvalue)λ₁,...,λ_M以及多個特徵向量(Eigenvector)v ₁,...,v _M，其中λ₁

...

λ_M且特徵向量v ₁,...,v _M分別對應於特徵值λ₁,...,λ_M。

聲源定位模組14取得特徵向量v ₁,...,v _M之後，聲源定位模組14可建立對應於一雜訊子空間(Noise Subspace)的一投影矩陣P _N為

，其中D為聲源個數，M為麥克風陣列中的麥克風個數。

另外，根據麥克風陣列12的陣型，聲源定位模組14可取得對應於麥克風陣列12的陣列流形向量(Array Manifold Vector)a。舉例來說，若麥克風陣列12為一均勻線性陣列(Uniform Linear Array，ULA，如第3圖所示)，陣列流形向量a可表示為a(θ)=[1 e^{j．kc．d．sinθ}...e^{j．kc．(M-1)．d．sinθ}]^T；若麥克風陣列12為一均勻環形陣列(Uniform Circular Array，UCA，如第4圖所示)，陣列流形向量a可表示為a(θ,φ)=[e^{j．kc．R．sinθcosφ} e^{j．kc．R．sinθcos(φ-2π/M)}...e^{j．kc．R sinθcos(φ-2π(M-1)/M)}]^T，其中d代表均勻線性陣列的間距，R代表均勻環形陣列的半徑，θ代表仰角(Elevation Angle)或垂直面的角度，φ代表水平角(Azimuth Angle)或水平面的角度，kc代表波數(Wave number)而可表示為kc=2πf/c，c代表光速。需注意的是，以上僅以ULA或UCA為例說明陣列流形向量a，事實上，麥克風陣列12的陣型不限於ULA或UCA，可視實際狀況設計適用的陣型，進而取得相應的陣列流形向量a。

聲源定位模組14取得陣列流形向量a之後，聲源定位模組14可根據投影矩陣P _N以及陣列流形向量a，取得成本函數CF或函數S_MUSIC為CF(θ,φ)=S_MUSIC(θ,φ)=1/(a ^H(θ,φ)．P _N．a(θ,φ))。其中，由於信號子空間與雜訊子空間相互正交，因此，當(θ_SS,φ_SS)代表/對應一聲源位置SS時，a ^H(θ_SS,φ_SS)．P _N．a(θ_SS,φ_SS)=0且CF(θ_SS,φ_SS)=S_MUSIC(θ_SS,φ_SS)應趨近於無限大。

於步驟206中，聲源定位模組14形成多個粒子ptc_ij，其中多個粒子ptc_ij為多個虛擬粒子。於一實施例中，聲源定位模組14於仰角θ及水平角φ所展開的二維空間形成多個虛擬粒子ptc_ij，每個虛擬粒子ptc_ij的一粒子位置x_ij對應於一水平角φ_i以及一仰角θ_j，為了方便說明，粒子ptc_ij的粒子位置x_ij可表示為x_ij=(φ_i,θ_j)。

於步驟208中，聲源定位模組14根據多個粒子ptc_ij的多個當下位置x_ij(t _n)以及成本函數CF，計算多個粒子ptc_ij的多個更新位置x_ij(t _n+1)，並根據多個更新位置x_ij(t _n+1)取得至少一聲源位置。

關於步驟208的操作細節，請參考第5圖，第5圖為本發明實施例一流程30的示意圖。流程30為一PSO演算法，PSO演算法為本領域具通常知識者所知，故簡述如下。流程30包括以下步驟：

步驟300：取得多個粒子ptc_ij的多個初始粒子位置x_ij(t ₀)。

步驟302：根據多個粒子ptc_ij的多個粒子位置x_ij(t _n)以及成本函數CF，計算對應於多個粒子ptc_ij的多個成本值CF(φ_i(t _n),θ_j(t _n))。

步驟304：取得一全域最佳位置(Global Best)g(t _n)以及對應於多個粒子ptc_ij的多個個別最佳位置(Personal Best)p_ij(t _n)。

步驟306：根據多個粒子位置x_ij(t _n)、全域最佳位置g(t _n)以及個別最佳位置p_ij(t _n)，計算對應於多個粒子位置x_ij(t _n)的多個粒子速度v_ij(t _n+1)。

步驟308：根據多個粒子位置x_ij(t _n)以及多個粒子速度v_ij(t _n+1)，計算多個粒子位置x_ij(t _n+1)。

步驟310：判斷是否達成停止條件。若是，執行步驟312；若否，執行步驟302。

步驟312：根據多個更新位置x_ij(t _n+1)取得一聲源位置S=(φ_S,θ_S)。

於步驟300中，聲源定位模組14可將多個初始粒子位置x_ij(t ₀)分佈於仰角θ及水平角φ所展開的二維空間中。於一實施例中，聲源定位模組14可將多個初始粒子位置x_ij(t ₀)均勻分佈於仰角θ及水平角φ所展開的二維空間中(如第6圖所示)，而不限於此。舉例來說，若聲源定位模組14在執行流程30之前事先獲得聲源位置的(歷史)資訊，聲源定位模組14可依照該資訊將多個初始粒子位置x_ij(t ₀)分佈於仰角θ及水平角φ所展開的二維空間中。

於步驟302中，聲源定位模組14可將多個粒子ptc_ij的多個粒子位置x_ij(t _n)=(φ_i(t _n),θ_j(t _n))代入成本函數CF，以計算對應於多個粒子ptc_ij的多個成本值CF(φ_i(t _n),θ_j(t _n))。

於步驟304中，聲源定位模組14可根據多個成本值CF(φ_i(t _n),θ_j(t _n))選取全域最佳位置g(t _n)。另外，針對特定粒子ptc_ij，聲源定位模組14可根據粒子ptc_ij的歷史位置(Historical Position)x_ij(t ₀),...,x_ij(t _n)，選取對應於粒子ptc_ij的個別最佳位置p_ij(t _n)。其中，全域最佳位置g(t _n)為多個粒子位置x_ij(t _n)中具有/對應最大成本值CF(φ_i(t _n),θ_j(t _n))的位置，對應於粒子ptc_ij的個別最佳位置p_ij(t _n)為歷史位置x_ij(t ₀),...,x_ij(t _n)中具有/對應最大成本值CF(φ_i(t),θ_j(t))的位置。

於步驟306中，聲源定位模組14可計算粒子速度v_ij(t _n+1)為v_ij(t _n+1)=w v_ij(t _n+1)+r1c1(p_ij(t _n)-x_ij(t _n))+r2c2(g(t _n)-x_ij(t _n))，其中w為慣性權重(Inertia Weight)，c1、c2為加速常數(Acceleration Constant)，r1、r2為隨機變數，其可分佈於區間[0,1]的均勻隨機變數。另外，w v_ij(t _n+1)即為慣性項(Inertia Term)，(p_ij(t _n)-x_ij(t _n))即為認知項(Cognition Term)，(g(t _n)-x_ij(t _n))即為社會項(Social Term)。

於步驟308中，聲源定位模組14可計算粒子位置x_ij(t _n+1)為x_ij(t _n+1)=x_ij(t _n)+v_ij(t _n+1)。

於步驟310中，聲源定位模組14判斷是否達成停止條件(Stopping Criterion)，停止條件可為|x_ij(t _n+1)-x_ij(t _n)|<ε或迭代(Iteration)指標n達到一最大迭代次數N。當|x_ij(t _n+1)-x_ij(t _n)|<ε或n==N成立時，聲源定位模組14即判斷達成停止條件，聲源定位模組14可進入步驟310以根據多個更新位置x_ij(t _n+1)取得一聲源位置S=(φ_S,θ_S)；若否，聲源定位模組14再回到步驟302以進行下一次迭代(包括執行n=n+1)。

其中，對第n次迭代(對應於時間t _n)來說，步驟302的粒子位置x_ij(t _n)可視為粒子ptc_ij的當下位置(Current Position)，步驟308的粒子位置x_ij(t _n+1)可視為粒子ptc_ij的更新位置(Update Position)。

流程30適用於單一聲源的情境，然而，PSO演算法亦可應用於多聲源的情境。

請參考第7圖，第7圖為本發明實施例一流程40的示意圖。流程40類似於PSO演算法，其可應用於多聲源的情境。流程40包括以下步驟：

步驟400：取得多個粒子ptc_ij的多個初始粒子位置x_ij(t ₀)。

步驟402：根據多個粒子ptc_ij的多個粒子位置x_ij(t _n)以及成本函數CF，計算對應於多個粒子ptc_ij的多個成本值CF(φ_i(t _n),θ_j(t _n))。

步驟404：取得對應於多個粒子ptc_ij的多個區域最佳位置(Local Best)L_ij(t _n)以及多個個別最佳位置p_ij(t _n)。

步驟406：根據多個粒子位置x_ij(t _n)、多個區域最佳位置L_ij(t _n)以及個別最佳位置p_ij(t _n)，計算對應於多個粒子位置x_ij(t _n)的多個粒子速度v_ij(t _n+1)。

步驟408：根據多個粒子位置x_ij(t _n)以及多個粒子速度v_ij(t _n+1)，計算多個粒子位置x_ij(t _n+1)。

步驟410：判斷是否達成停止條件。若是，執行步驟312；若否，執行步驟302。

步驟412：根據多個更新位置x_ij(t _n+1)取得多個聲源位置S。

流程40與流程30類似，流程40與流程30不同之處在步驟404、406中，聲源定位模組14以區域最佳位置L_ij(t _n)取代步驟304、306的全域最佳位置g(t _n)，進而進行粒子速度v_ij(t _n+1)的計算。

於步驟404中，聲源定位模組14先形成以粒子ptc_ij或粒子位置x_ij(t _n)為中心的一區域RG_ij，再從多個粒子位置x_ij(t _n)中選取位於區域RG_ij中的多個區域粒子ptc_ij ^(RG)，即對應於多個區域粒子ptc_ij ^(RG)的多個區域粒子位置x_ij ^(RG)位於RG_ij中。

於一實施例中，區域RG_ij為與粒子位置x_ij(t _n)的距離小於一參數σ的粒子位置所形成的集合，廣義來說，區域RG_ij可表示為RG_ij={x=(φ,θ)|∥x- x_ij(t _n)∥

σ}，其中∥．∥泛指廣義的範數(Norm)運算子，∥x∥可代表∥x∥₁、∥x∥₂或∥x∥_∞，範數∥x∥₁、∥x∥₂或∥x∥_∞為本領域具通常知識者所知，於此不再贅述，其中，∥x∥₂為歐幾里德範數，以歐幾里德範數所形成的區域RG_ij可表示為RG_ij={x=(φ,θ)|∥x-x_ij(t _n)∥₂

σ}為圓心為x_ij(t _n)半徑為σ的圓形區域。

另外，區域半徑σ可視實際狀況或經驗法則而設定之。若二聲源過於靠近或區域半徑σ過大，會使所有粒子的區域最好位置指向能量較強的聲源，反而不利聲源分離。

聲源定位模組14可計算對應於多個區域粒子ptc_ij ^(RG)的多個區域成本值CF^(RG)(φ_i(t _n),θ_j(t _n))(其中CF^(RG)(φ_i(t _n),θ_j(t _n))=CF(φ_i(t _n),θ_j(t _n)),x_ij ^(RG)=(φ_i(t _n),θ_j(t _n))

RG_ij)，並根據多個區域成本值CF^(RG)(φ_i(t _n),θ_j(t _n))，選取對應於粒子ptc_ij的區域最佳位置L_ij(t _n)，其中區域最佳位置L_ij(t _n)為多個區域粒子位置x_ij ^(RG)中具有/對應最大區域成本值CF^(RG)(φ_i(t _n),θ_j(t _n))的位置。

於步驟406中，聲源定位模組14可計算粒子速度v_ij(t _n+1)為v_ij(t _n+1)=w v_ij(t _n+1)+r1c1(p_ij(t _n)-x_ij(t _n))+r2c2(L_ij(t _n)-x_ij(t _n))。

流程40的其餘步驟與流程30相同，於此不再贅述。

流程30、40皆是實現步驟208的實施例，其中流程30可應用於單一聲源的情境，流程30可應用於多聲源的情境。

現有技術中，利用MUSIC演算法進行聲源定位需經過窮舉搜索 (Exhaustive Search)而運算複雜度大，且聲源定位的精細度取決於麥克風陣列的麥克風個數M。相較之下，本發明利用PSO演算法進行聲源定位，而不需要額外增加過多的麥克風個數M，即可達到精準的聲源定位。另外，PSO演算法所需的運算複雜度低於MUSIC演算法所需的運算複雜度。

綜上所述，本發明利用PSO演算法進行聲源定位，其可達到較佳的精準度，且運算複雜度較低。

以上所述僅為本發明之較佳實施例，凡依本發明申請專利範圍所做之均等變化與修飾，皆應屬本發明之涵蓋範圍。

20:流程

202~208:步驟

Claims

一種聲源定位方法，應用於一聲音系統，該聲音系統包括一麥克風陣列，該方法包括：該麥克風陣列接收一接收信號；根據該接收信號，建立一成本函數；形成多個粒子，其中該多個粒子為多個虛擬粒子；以及根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個成本值及多個更新位置，並根據該多個更新位置取得至少一聲源位置。
如請求項1所述的聲源定位方法，其中根據該接收信號建立該成本函數的步驟包括：根據該接收信號，建立對應於一雜訊子空間的一投影矩陣；以及根據該投影矩陣，建立該成本函數。
如請求項2所述的聲源定位方法，其中根據該接收信號建立該投影矩陣的步驟包括：根據該接收信號，計算一相關矩陣；對該相關矩陣進行一特徵值分解(Eigenvalue Decomposition)，以取得多個特徵值(Eigenvalue)以及多個特徵向量(Eigenvector)；以及根據該多個特徵向量中多個第一特徵向量，建立該投影矩陣，其中該多個第一特徵向量對應於多個第一特徵值，該多個特徵向量中多個第二特徵向量對應於多個第二特徵值，該多個第一特徵值皆小於該多個第二特徵值。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：根據該多個粒子的該多個當下位置以及該成本函數，計算對應於該多個粒子的該多個成本值；根據該多個成本值，取得一全域最佳位置(Global Best)；根據該全域最佳位置，計算對應於該多個粒子的多個粒子速度；以及根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：根據該多個粒子的該多個當下位置以及該成本函數，計算對應於該多個粒子的該多個成本值；根據該多個成本值，取得一全域最佳位置(Global Best)；取得該多個粒子中一第一粒子經歷過的多個第一歷史位置；根據該多個第一歷史位置以及該成本函數，計算對應於該多個第一歷史位置的多個第一歷史成本值；根據該多個第一歷史成本值，取得對應於該第一粒子的一第一個別最佳位置(Personal Best)；根據該全域最佳位置以及該第一個別最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：自該多個粒子中取得位於一第一區域內的多個第一區域粒子，其中該第一區域係以該多個粒子中一第一粒子為中心；根據該多個第一區域粒子的多個第一區域當下位置以及該成本函數，計算對應於該多個第一區域粒子的多個第一區域成本值；根據該多個第一區域成本值，取得對應於該第一粒子的一第一區域最佳位置(Local Best)；根據該第一區域最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：自該多個粒子中取得位於一第一區域內的多個第一區域粒子，其中該第一區域係以該多個粒子中一第一粒子為中心；根據該多個第一區域粒子的多個第一區域當下位置以及該成本函數，計算對應於該多個第一區域粒子的多個第一區域成本值；根據該多個第一區域成本值，取得對應於該第一粒子的一第一區域最佳位置(Local Best)；取得該多個粒子中一第一粒子經歷過的多個第一歷史位置；根據該多個第一歷史位置以及該成本函數，計算對應於該多個第一歷史位置的多個第一歷史成本值；根據該多個第一歷史成本值，取得對應於該第一粒子的一第一個別最佳位置(Personal Best)；根據該第一區域最佳位置以及該第一個別最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置並根據該多個更新位置取得該至少一聲源位置的步驟包括：取得對應於該多個粒子的多個區域，其中該多個區域分別以該多個粒子為中心；根據該多個區域以及該成本函數，取得對應於該多個粒子的多個區域最佳位置；根據該多個區域最佳位置，計算對應於該多個粒子的多個粒子速度；根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置；以及根據該多個更新位置，取得多個聲源位置。
如請求項1所述的聲源定位方法，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置並根據該多個更新位置取得該至少一聲源位置的步驟包括：取得對應於該多個粒子的多個區域，其中該多個區域分別以該多個粒子為中心；根據該多個區域以及該成本函數，取得對應於該多個粒子的多個區域最佳位置；取得該多個粒子的經歷過的多個歷史位置以及該成本函數，取得對應於該多個粒子的多個個別最佳位置；根據該多個區域最佳位置以及該多個個別最佳位置，計算對應於該多個粒子的多個粒子速度；根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置；以及根據該多個更新位置，取得多個聲源位置。
一種聲音系統，包括：一麥克風陣列，包括多個麥克風，用來接收一接收信號；以及一聲源定位模組，用來執行以下步驟：根據該接收信號，建立一成本函數；形成多個粒子，其中該多個粒子為多個虛擬粒子；以及根據該多個粒子的多個當下位置以及該成本函數，計算該多個粒子的多個成本值及多個更新位置，並根據該多個更新位置取得至少一聲源位置。
如請求項10所述的聲音系統，其中根據該接收信號建立該成本函數的步驟包括：根據該接收信號，建立對應於一雜訊子空間的一投影矩陣；以及根據該投影矩陣，建立該成本函數。
如請求項11所述的聲音系統，其中根據該接收信號建立該投影矩陣的步驟包括：根據該接收信號，計算一相關矩陣；對該相關矩陣進行一特徵值分解(Eigenvalue Decomposition)，以取得多個特徵值(Eigenvalue)以及多個特徵向量(Eigenvector)；以及根據該多個特徵向量中多個第一特徵向量，建立該投影矩陣，其中該多個第一特徵向量對應於多個第一特徵值，該多個特徵向量中多個第二特徵向量對應於多個第二特徵值，該多個第一特徵值皆小於該多個第二特徵值。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：根據該多個粒子的該多個當下位置以及該成本函數，計算對應於該多個粒子的該多個成本值；根據該多個成本值，取得一全域最佳位置(Global Best)；根據該全域最佳位置，計算對應於該多個粒子的多個粒子速度；以及根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：根據該多個粒子的該多個當下位置以及該成本函數，計算對應於該多個粒子的該多個成本值；根據該多個成本值，取得一全域最佳位置(Global Best)；取得該多個粒子中一第一粒子經歷過的多個第一歷史位置；根據該多個第一歷史位置以及該成本函數，計算對應於該多個第一歷史位置的多個第一歷史成本值；根據該多個第一歷史成本值，取得對應於該第一粒子的一第一個別最佳位置(Personal Best)；根據該全域最佳位置以及該第一個別最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：自該多個粒子中取得位於一第一區域內的多個第一區域粒子，其中該第一區域係以該多個粒子中一第一粒子為中心；根據該多個第一區域粒子的多個第一區域當下位置以及該成本函數，計算對應於該多個第一區域粒子的多個第一區域成本值；根據該多個第一區域成本值，取得對應於該第一粒子的一第一區域最佳位置(Local Best)；根據該第一區域最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置的步驟包括：自該多個粒子中取得位於一第一區域內的多個第一區域粒子，其中該第一區域係以該多個粒子中一第一粒子為中心；根據該多個第一區域粒子的多個第一區域當下位置以及該成本函數，計算對應於該多個第一區域粒子的多個第一區域成本值；根據該多個第一區域成本值，取得對應於該第一粒子的一第一區域最佳位置(Local Best)；取得該多個粒子中一第一粒子經歷過的多個第一歷史位置；根據該多個第一歷史位置以及該成本函數，計算對應於該多個第一歷史位置的多個第一歷史成本值；根據該多個第一歷史成本值，取得對應於該第一粒子的一第一個別最佳位置(Personal Best)；根據該第一區域最佳位置以及該第一個別最佳位置，計算對應於該第一粒子的一第一粒子速度；以及根據對應於該第一粒子的一第一當下位置以及該第一粒子速度，計算對應於該第一粒子的一第一更新位置。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置並根據該多個更新位置取得該至少一聲源位置的步驟包括：取得對應於該多個粒子的多個區域，其中該多個區域分別以該多個粒子為中心；根據該多個區域以及該成本函數，取得對應於該多個粒子的多個區域最佳位置；根據該多個區域最佳位置，計算對應於該多個粒子的多個粒子速度；根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置；以及根據該多個更新位置，取得多個聲源位置。
如請求項10所述的聲音系統，其中根據該多個當下位置及該成本函數計算該多個粒子的該多個更新位置並根據該多個更新位置取得該至少一聲源位置的步驟包括：取得對應於該多個粒子的多個區域，其中該多個區域分別以該多個粒子為中心；根據該多個區域以及該成本函數，取得對應於該多個粒子的多個區域最佳位置；取得該多個粒子的經歷過的多個歷史位置以及該成本函數，取得對應於該多個粒子的多個個別最佳位置；根據該多個區域最佳位置以及該多個個別最佳位置，計算對應於該多個粒子的多個粒子速度；根據該多個當下位置以及該多個粒子速度，計算該多個粒子的該多個更新位置；以及根據該多個更新位置，取得多個聲源位置。
如請求項10所述的聲音系統，其中每一粒子對應於一水平角。
如請求項10所述的聲音系統，其中每一粒子對應於一水平角以及一仰角。