TWI417563B

TWI417563B - 遠距離音源定位晶片裝置及其方法

Info

Publication number: TWI417563B
Application number: TW098139484A
Authority: TW
Inventors: Jhing Fa Wang; bo wei Chen; Chi Yuan Chen
Original assignee: Univ Nat Cheng Kung
Priority date: 2009-11-20
Filing date: 2009-11-20
Publication date: 2013-12-01
Also published as: TW201118406A

Description

遠距離音源定位晶片裝置及其方法

本發明係有關於一種遠距離音源定位晶片裝置及其方法，尤指涉及一種可隨時整合至其他晶片內，或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構，特別係指可讓數位監控設備得以即時地拍攝到突發狀況之畫面，以達到更安全之監控功能之裝置及方法者。

隨著科技之進步與經濟之發達，人們對電子產品之功能需求也越來越多，因此許多電子產品，如玩具、會議設備以及機器人等，開始配備有音源定位系統來滿足人們之需求。

對於音源辨位研究，以加拿大多倫多大學之D. Nguyen,P. Aarabi與A. Sheikholeslami於2003年發表一篇以FPGA實現音源辨位文獻，其所採用之技術為廣義互相關性演算法(Generalized Cross Correlation,GCC)，此方法係將訊號轉換到頻域處理後再換回時域，當中幾乎都採用乘法運算，因此運算複雜度較高；此外，該法多以數位訊號處理器(Digital Signal Processor,DSP)來完成，且相較於其他實現方式而言，如系統晶片(System On Chip,SOC)，基於仍採用乘法運算為前提，故所需求之晶片面積必定較大，相對所消耗之功率也較高，因此並無法達到業者首需之低成本設計需求，故，一般習用者係無法符合使用者於實際使用時滿足人們對音源定位系統之所需。

本發明之主要目的係在於，克服習知技藝所遭遇之上述問題並提供一種可隨時整合至其他晶片內，或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構，提供在誤差角度介於±5°範圍內，俾使音源定位之辨識率達90%者。

本發明之次要目的係在於，提供一種高重複利用性、高整合性、少晶片面積、少功率消耗，並達到低成本之裝置及方法者。

本發明之另一目的係在於，提供一種僅使用基本加減法運算之平均幅度差值函數，不需要乘法運算而可減少系統計算複雜度，且在效能部份仍具有高精確度辨識，能更容易實現於硬體電路者。

本發明之再一目的係在於，提供一種可應用到居家生活或者互動產品等領域，藉此讓數位監控設備得以即時地拍攝到突發狀況之畫面，以達到更安全之監控功能者。

本發明之又一目的係在於，提供一種能使音源定位之功能成為附加之功能，不僅能增加產品之價值，亦達到縮短上市時程之功能者。

為達以上之目的，本發明係一種遠距離音源定位晶片裝置及其方法，係整合一類比前端電路(Analog Front End)及一數位運算處理核心(Digital Computing Core)之系統單晶片(System On a Chip,SOC)架構，用以針對同一音源進行處理，透過麥克風輸入至該系統晶片內部之數位類比轉換器，將訊號儲存至內建之記憶體，當聲音訊號轉換為數位資料後，係進行聲音偵測，透過能量及過零率兩種特徵值進行語音活動偵測，之後進行時間延遲估算，透過平均幅度差值函數(Average Magnitude Difference Function,AMDF)進行時間延遲(Time Delay Of Arrival)之分析，最後根據產生之時間差(Time Difference Of Arrival,TDOA)結果進行角度之分析，並找出該音源相對於該第一、二接收器之方位(Direct)。

請參閱『第1圖』所示，係本發明之遠距離音源定位晶片裝置架構示意圖。如圖所示：本發明係一種遠距離音源定位晶片裝置，係整合一類比前端電路(Analog Front End)10及一數位運算處理核心(Digital Computing Core)20之系統晶片(System On Chip,SOC)1架構，用以針對同一音源進行處理，其中該類比前端電路10從該系統晶片1內部接收具有一第一類比電壓位準(AVDD)及一第二類比電壓位準(AVSS)之輸入，並包括有數個放大器11、一第一連續近似類比數位轉換器(SAR ADC1)12及一第二連續近似類比數位轉換器(SAR ADC2)13。而該數位運算處理核心20從該系統晶片1外部接收二時脈(Sys_clk、clkk)，從該系統晶片1內部接收具有一第一數位電壓位準(DVDD)及一第二數位電壓位準(DVSS)之輸入，並輸出一時脈訊號輸出線24至該類比前端電路10之第一、二連續近似類比數位轉換器12、13。該數位運算處理核心20係包括有二記憶單元21、一運算模組22及一系統控制單元(System Controller Unit)23，於其中，該Sys_clk係為該數位運算核心20之系統時脈，該clkk係使用於該數位運算核心20與該第一、二連續近似類比數位轉換器12、13之運算時脈。

上述放大器11分別為一第一放大器11a及一第二放大器11b，用以各別自外部一第一接收器及一第二接收器(圖中未示)接收一第一類比聲音訊號(Vinp1、Vinn1)及一第二類比聲音訊號(Vinp2、Vinn2)，並將其訊號放大後輸出。

該第一連續近似類比數位轉換器12係電性連接該第一放大器11a並接收其放大後輸出之第一類比聲音訊號，用以經該時脈訊號輸出線24輸入該運算時脈為操作頻率，將該第一類比聲音訊號轉換成一第一數位聲音訊號後輸出。

該第二連續近似類比數位轉換器13係電性連接該第二放大器11b並接收其放大後輸出之第二類比聲音訊號，用以經該時脈訊號輸出線24輸入該運算時脈為操作頻率，將該第二類比聲音訊號轉換成一第二數位聲音訊號後輸出。

上述記憶單元21分別為一第一記憶體21a及一第二記憶體21b，其中該第一記憶體21a係接收該第一、二連續近似類比數位轉換器12、13之第一、二數位聲音訊號，並將其儲存供作程式控制資料之存取運作。

該運算模組22係透過一內部資料匯流排(Internal Data Bus)25電性連接該記憶單元21並包含一聲音偵測單元221及一定位演算單元222，其中該聲音偵測單元221係取樣該第一記憶體21a中之聲音訊號進行語音活動偵測，並將提取對應至該第一連續近似類比數位轉換器12之第一取樣聲音訊號與對應至該第二連續近似類比數位轉換器13之第二取樣聲音訊號儲存至該第二記憶體21b，該定位演算單元222則對該第二記憶體21b中之第一、二取樣聲音訊號進行時間延遲(Time Delay Of Arrival)分析，並根據產生之時間差(Time Difference Of Arrival,TDOA)值進行角度(Angle)分析，且該定位演算單元222更包含一對照表(圖中未示)，藉以根據該TDOA值查表對照找出該音源相對於該第一、二接收器之方位(Direct)。

該系統控制單元23係透過一內部控制匯流排(Internal Control Bus)26電性連接該運算模組22，用以提供整體裝置處理之工作環境，並控制該些記憶單元21與該運算模組22之間之運作，透過此系統控制單元23讀取硬體上之設定而分配其資料之使用，以決定並執行於不同之工作模式。

上述第一、二連續近似類比數位轉換器12、13係分別量測一CN接腳及連接一第一參考電壓(Vrefp)、一第二參考電壓(Vrefn)與一偏壓(Vbias)，產生一第一校正類比訊號及一第二校正類比訊號，並根據該第一、二校正類比訊號而產生該第一、二數位聲音訊號。以上所述，係構成一全新之遠距離音源定位晶片裝置。

請參閱『第2圖』所示，係本發明之遠距離音源定位方法流程示意圖。如圖所示：本發明係一種遠距離音源定位方法，於一較佳實施例中，係採用兩隻電容式無指向性麥克風偵測前方180°聲音方位，針對同一音源進行處理，其至少包含下列步驟：

(A)聲音訊號輸入步驟31：透過外部麥克風(圖中未示)接收一聲音訊號，並輸入至一系統晶片1(如第1圖所示)內部之數位類比轉換器12、13，將該聲音訊號從類比資料轉換為數位資料料後儲存至內建之第一記憶體21a；

(B)門檻值偵測(Threshold Value Detection)步驟32：進行聲音偵測，以門檻值偵測提供一預設聲音強度閥值，與上述其中一麥克風輸入之聲音訊號作振幅比較，根據該聲音訊號之強度值是否大於該預設聲音強度閥值提供一比較結果，當該比較結果為否時，回步驟(A)重新取樣偵測；

(C)儲存致能步驟33：當輸入之聲音訊號通過門檻值時，一內建第二記憶體21b將啟動記錄程式將其儲存，並根據一預設取樣數量取樣該聲音訊號768筆；

(D)過零率(Zero Crossing Rate)步驟34：針對步驟(C)儲存之聲音訊號以過零率進行輔助主要聲音偵測，提供一預設過零率閥值，與一過零率計算結果作比較，根據該聲音訊號之過零率是否小於該預設過零率閥值提供一比較結果，當該比較結果為否時，回步驟(A)重新取樣偵測；

(E)聲音資料取樣步驟35：當輸入之聲音訊號通過門檻值與過零率之後，提供一預設取樣數量，根據該預設取樣數量於該些聲音訊號中提取接近最大值之資料256筆；

(F)TDOA計算步驟36：進行時間延遲估算，透過平均幅度差值函數(Average Magnitude Difference Function,AMDF)進行時間延遲分析，計算每個聲道與音框能量之TDOA；以及

(G)角度與方向轉換步驟37：透過步驟(F)結果轉換至對應之角度，並找出該音源相對於該接收器之方位。

上述步驟(D)計算過零率次數，係在聲音訊號波形上定訂一條振幅值為零之直線，當輸入振幅大於零為正，小於零則為負，計算越過零率之次數得到其過零率，該過零率係如公式(1)：

其中N係取樣點數目。

上述步驟(F)平均幅度差值函數係如公式(2)：

其中MIC1和MIC2為兩隻麥克風所接收訊號；j為音框數目；s為平移量。

以一個音框為例，每平移一次，可得到一個AMDF值。當從中得出一組AMDF向量，找到此向量中最小值再除以取樣頻率，便為兩訊號之時間差。以根據公式(3)來決定平移之合理範圍：

其中d為兩隻麥克風間之距離；v為音速，室溫下約347m/s；fs為訊號取樣頻率。

上述步驟(G)當向量中最小值已得知，利用雙曲線原理，轉換到所對應之角度。假設雙曲線焦點距離為2c，即兩個麥克風間距離，如公式(4)；而雙曲線頂點距離為2a，雙曲線上任一點到兩焦點距離之差為2a，即音源到兩隻麥克風距離之差，如公式(5)，因此可由公式(6)推得夾角θ之值：

其中a為頂點；c為焦點；v為音速；fs為訊號取樣頻率。

當運用時，本發明係以台積電之0.18μm CMOS製程完成該系統晶片之實現。使本發明提出之遠距離音源定位晶片裝置可以達到可高重複利用性、高整合性、少晶片面積，並達到低成本之特色，本裝置並透過Altera DEII-70 FPGA開發板完成驗證以及模擬，其中之類比前端電路係透過國家晶片實現中心所提供之TSMC 0.18μm CMOS 1p3M+ MIM Cap混合模製程，而另外之數位運算處理核心則係利用TSMC之Artsain 0.18μm標準元件庫實現，並且透過Cadence SOC Encounter完成自動佈局及佈局後驗證。藉此，使本發明在誤差角度介於±5°範圍內，其音源定位之辨識率可以達到90%。於其中，本發明系統晶片雛型之佈局面積大小約為2.86mm×3.56mm，平均之功率消耗約為43mW，相較於其他實現方式，本發明係提供了面積更小之晶片以及更少之功率消耗；此外，本發明所採用之平均幅度差值函數僅使用基本加減法運算，相較其它系統所用技術，本方法明顯不需要乘法運算，不僅可減少系統計算複雜度，且在效能部份仍具有高精確度辨識，更容易實現於硬體電路。除了透過系統晶片整合完成本裝置外，亦可隨時整合至其他晶片內，或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構，藉此使音源定位之功能成為附加之功能，不僅能增加產品之價值，亦達到縮短上市時程之功能。

據此，透過本裝置之功能，係可應用到居家生活或者互動產品等領域，例如運用於語音玩具、會議追縱及互動式語音系統等，凡舉音源定位相關之應用皆可以採用，藉此可讓數位監控設備得以即時地拍攝到突發狀況之畫面，以達到更安全之監控功能。

綜上所述，本發明係一種遠距離音源定位晶片裝置及其方法，可有效改善習用之種種缺點，係可隨時整合至其他晶片內，或透過個人電腦及數位訊號處理器等開發平台建構，藉此使音源定位之功能成為附加之功能，不僅能增加產品之價值，亦達到縮短上市時程之功能，進而使本發明之產生能更進步、更實用、更符合使用者之所須，確已符合發明專利申請之要件，爰依法提出專利申請。

惟以上所述者，僅為本發明之較佳實施例而已，當不能以此限定本發明實施之範圍；故，凡依本發明申請專利範圍及發明說明書內容所作之簡單的等效變化與修飾，皆應仍屬本發明專利涵蓋之範圍內。

1．．．系統晶片

10．．．類比前端電路

11．．．放大器

11a．．．第一放大器

11b．．．第二放大器

12．．．第一連續近似類比數位轉換器

13．．．第二連續近似類比數位轉換器

20．．．數位運算處理核心

21．．．記憶單元

21a．．．第一記憶體

21b．．．第二記憶體

22．．．運算模組

221．．．聲音偵測單元

222．．．定位演算單元

23．．．系統控制單元

24．．．時脈訊號輸出線

25．．．內部資料匯流排

26．．．內部控制匯流排

31．．．步驟(A)聲音訊號輸入

32．．．步驟(B)門檻值偵測

33．．．步驟(C)儲存致能

34．．．步驟(D)過零率

35．．．步驟(E)聲音資料取樣

36．．．步驟(F)TDOA計算

37．．．步驟(G)角度與方向轉換

第1圖，係本發明之遠距離音源定位晶片裝置架構示意圖。

第2圖，係本發明之遠距離音源定位方法流程示意圖。