TWI417563B - 遠距離音源定位晶片裝置及其方法 - Google Patents

遠距離音源定位晶片裝置及其方法 Download PDF

Info

Publication number
TWI417563B
TWI417563B TW098139484A TW98139484A TWI417563B TW I417563 B TWI417563 B TW I417563B TW 098139484 A TW098139484 A TW 098139484A TW 98139484 A TW98139484 A TW 98139484A TW I417563 B TWI417563 B TW I417563B
Authority
TW
Taiwan
Prior art keywords
sound
analog
digital
signal
sound source
Prior art date
Application number
TW098139484A
Other languages
English (en)
Other versions
TW201118406A (en
Inventor
Jhing Fa Wang
bo wei Chen
Chi Yuan Chen
Original Assignee
Univ Nat Cheng Kung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Cheng Kung filed Critical Univ Nat Cheng Kung
Priority to TW098139484A priority Critical patent/TWI417563B/zh
Publication of TW201118406A publication Critical patent/TW201118406A/zh
Application granted granted Critical
Publication of TWI417563B publication Critical patent/TWI417563B/zh

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

遠距離音源定位晶片裝置及其方法
本發明係有關於一種遠距離音源定位晶片裝置及其方法,尤指涉及一種可隨時整合至其他晶片內,或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構,特別係指可讓數位監控設備得以即時地拍攝到突發狀況之畫面,以達到更安全之監控功能之裝置及方法者。
隨著科技之進步與經濟之發達,人們對電子產品之功能需求也越來越多,因此許多電子產品,如玩具、會議設備以及機器人等,開始配備有音源定位系統來滿足人們之需求。
對於音源辨位研究,以加拿大多倫多大學之D. Nguyen,P. Aarabi與A. Sheikholeslami於2003年發表一篇以FPGA實現音源辨位文獻,其所採用之技術為廣義互相關性演算法(Generalized Cross Correlation,GCC),此方法係將訊號轉換到頻域處理後再換回時域,當中幾乎都採用乘法運算,因此運算複雜度較高;此外,該法多以數位訊號處理器(Digital Signal Processor,DSP)來完成,且相較於其他實現方式而言,如系統晶片(System On Chip,SOC),基於仍採用乘法運算為前提,故所需求之晶片面積必定較大,相對所消耗之功率也較高,因此並無法達到業者首需之低成本設計需求,故,一般習用者係無法符合使用者於實際使用時滿足人們對音源定位系統之所需。
本發明之主要目的係在於,克服習知技藝所遭遇之上述問題並提供一種可隨時整合至其他晶片內,或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構,提供在誤差角度介於±5°範圍內,俾使音源定位之辨識率達90%者。
本發明之次要目的係在於,提供一種高重複利用性、高整合性、少晶片面積、少功率消耗,並達到低成本之裝置及方法者。
本發明之另一目的係在於,提供一種僅使用基本加減法運算之平均幅度差值函數,不需要乘法運算而可減少系統計算複雜度,且在效能部份仍具有高精確度辨識,能更容易實現於硬體電路者。
本發明之再一目的係在於,提供一種可應用到居家生活或者互動產品等領域,藉此讓數位監控設備得以即時地拍攝到突發狀況之畫面,以達到更安全之監控功能者。
本發明之又一目的係在於,提供一種能使音源定位之功能成為附加之功能,不僅能增加產品之價值,亦達到縮短上市時程之功能者。
為達以上之目的,本發明係一種遠距離音源定位晶片裝置及其方法,係整合一類比前端電路(Analog Front End)及一數位運算處理核心(Digital Computing Core)之系統單晶片(System On a Chip,SOC)架構,用以針對同一音源進行處理,透過麥克風輸入至該系統晶片內部之數位類比轉換器,將訊號儲存至內建之記憶體,當聲音訊號轉換為數位資料後,係進行聲音偵測,透過能量及過零率兩種特徵值進行語音活動偵測,之後進行時間延遲估算,透過平均幅度差值函數(Average Magnitude Difference Function,AMDF)進行時間延遲(Time Delay Of Arrival)之分析,最後根據產生之時間差(Time Difference Of Arrival,TDOA)結果進行角度之分析,並找出該音源相對於該第一、二接收器之方位(Direct)。
請參閱『第1圖』所示,係本發明之遠距離音源定位晶片裝置架構示意圖。如圖所示:本發明係一種遠距離音源定位晶片裝置,係整合一類比前端電路(Analog Front End)10及一數位運算處理核心(Digital Computing Core)20之系統晶片(System On Chip,SOC)1架構,用以針對同一音源進行處理,其中該類比前端電路10從該系統晶片1內部接收具有一第一類比電壓位準(AVDD)及一第二類比電壓位準(AVSS)之輸入,並包括有數個放大器11、一第一連續近似類比數位轉換器(SAR ADC1)12及一第二連續近似類比數位轉換器(SAR ADC2)13。而該數位運算處理核心20從該系統晶片1外部接收二時脈(Sys_clk、clkk),從該系統晶片1內部接收具有一第一數位電壓位準(DVDD)及一第二數位電壓位準(DVSS)之輸入,並輸出一時脈訊號輸出線24至該類比前端電路10之第一、二連續近似類比數位轉換器12、13。該數位運算處理核心20係包括有二記憶單元21、一運算模組22及一系統控制單元(System Controller Unit)23,於其中,該Sys_clk係為該數位運算核心20之系統時脈,該clkk係使用於該數位運算核心20與該第一、二連續近似類比數位轉換器12、13之運算時脈。
上述放大器11分別為一第一放大器11a及一第二放大器11b,用以各別自外部一第一接收器及一第二接收器(圖中未示)接收一第一類比聲音訊號(Vinp1、Vinn1)及一第二類比聲音訊號(Vinp2、Vinn2),並將其訊號放大後輸出。
該第一連續近似類比數位轉換器12係電性連接該第一放大器11a並接收其放大後輸出之第一類比聲音訊號,用以經該時脈訊號輸出線24輸入該運算時脈為操作頻率,將該第一類比聲音訊號轉換成一第一數位聲音訊號後輸出。
該第二連續近似類比數位轉換器13係電性連接該第二放大器11b並接收其放大後輸出之第二類比聲音訊號,用以經該時脈訊號輸出線24輸入該運算時脈為操作頻率,將該第二類比聲音訊號轉換成一第二數位聲音訊號後輸出。
上述記憶單元21分別為一第一記憶體21a及一第二記憶體21b,其中該第一記憶體21a係接收該第一、二連續近似類比數位轉換器12、13之第一、二數位聲音訊號,並將其儲存供作程式控制資料之存取運作。
該運算模組22係透過一內部資料匯流排(Internal Data Bus)25電性連接該記憶單元21並包含一聲音偵測單元221及一定位演算單元222,其中該聲音偵測單元221係取樣該第一記憶體21a中之聲音訊號進行語音活動偵測,並將提取對應至該第一連續近似類比數位轉換器12之第一取樣聲音訊號與對應至該第二連續近似類比數位轉換器13之第二取樣聲音訊號儲存至該第二記憶體21b,該定位演算單元222則對該第二記憶體21b中之第一、二取樣聲音訊號進行時間延遲(Time Delay Of Arrival)分析,並根據產生之時間差(Time Difference Of Arrival,TDOA)值進行角度(Angle)分析,且該定位演算單元222更包含一對照表(圖中未示),藉以根據該TDOA值查表對照找出該音源相對於該第一、二接收器之方位(Direct)。
該系統控制單元23係透過一內部控制匯流排(Internal Control Bus)26電性連接該運算模組22,用以提供整體裝置處理之工作環境,並控制該些記憶單元21與該運算模組22之間之運作,透過此系統控制單元23讀取硬體上之設定而分配其資料之使用,以決定並執行於不同之工作模式。
上述第一、二連續近似類比數位轉換器12、13係分別量測一CN接腳及連接一第一參考電壓(Vrefp)、一第二參考電壓(Vrefn)與一偏壓(Vbias),產生一第一校正類比訊號及一第二校正類比訊號,並根據該第一、二校正類比訊號而產生該第一、二數位聲音訊號。以上所述,係構成一全新之遠距離音源定位晶片裝置。
請參閱『第2圖』所示,係本發明之遠距離音源定位方法流程示意圖。如圖所示:本發明係一種遠距離音源定位方法,於一較佳實施例中,係採用兩隻電容式無指向性麥克風偵測前方180°聲音方位,針對同一音源進行處理,其至少包含下列步驟:
(A)聲音訊號輸入步驟31:透過外部麥克風(圖中未示)接收一聲音訊號,並輸入至一系統晶片1(如第1圖所示)內部之數位類比轉換器12、13,將該聲音訊號從類比資料轉換為數位資料料後儲存至內建之第一記憶體21a;
(B)門檻值偵測(Threshold Value Detection)步驟32:進行聲音偵測,以門檻值偵測提供一預設聲音強度閥值,與上述其中一麥克風輸入之聲音訊號作振幅比較,根據該聲音訊號之強度值是否大於該預設聲音強度閥值提供一比較結果,當該比較結果為否時,回步驟(A)重新取樣偵測;
(C)儲存致能步驟33:當輸入之聲音訊號通過門檻值時,一內建第二記憶體21b將啟動記錄程式將其儲存,並根據一預設取樣數量取樣該聲音訊號768筆;
(D)過零率(Zero Crossing Rate)步驟34:針對步驟(C)儲存之聲音訊號以過零率進行輔助主要聲音偵測,提供一預設過零率閥值,與一過零率計算結果作比較,根據該聲音訊號之過零率是否小於該預設過零率閥值提供一比較結果,當該比較結果為否時,回步驟(A)重新取樣偵測;
(E)聲音資料取樣步驟35:當輸入之聲音訊號通過門檻值與過零率之後,提供一預設取樣數量,根據該預設取樣數量於該些聲音訊號中提取接近最大值之資料256筆;
(F)TDOA計算步驟36:進行時間延遲估算,透過平均幅度差值函數(Average Magnitude Difference Function,AMDF)進行時間延遲分析,計算每個聲道與音框能量之TDOA;以及
(G)角度與方向轉換步驟37:透過步驟(F)結果轉換至對應之角度,並找出該音源相對於該接收器之方位。
上述步驟(D)計算過零率次數,係在聲音訊號波形上定訂一條振幅值為零之直線,當輸入振幅大於零為正,小於零則為負,計算越過零率之次數得到其過零率,該過零率係如公式(1):
其中N係取樣點數目。
上述步驟(F)平均幅度差值函數係如公式(2):
其中MIC1和MIC2為兩隻麥克風所接收訊號;j為音框數目;s為平移量。
以一個音框為例,每平移一次,可得到一個AMDF值。當從中得出一組AMDF向量,找到此向量中最小值再除以取樣頻率,便為兩訊號之時間差。以根據公式(3)來決定平移之合理範圍:
其中d為兩隻麥克風間之距離;v為音速,室溫下約347m/s;fs為訊號取樣頻率。
上述步驟(G)當向量中最小值已得知,利用雙曲線原理,轉換到所對應之角度。假設雙曲線焦點距離為2c,即兩個麥克風間距離,如公式(4);而雙曲線頂點距離為2a,雙曲線上任一點到兩焦點距離之差為2a,即音源到兩隻麥克風距離之差,如公式(5),因此可由公式(6)推得夾角θ之值:
其中a為頂點;c為焦點;v為音速;fs為訊號取樣頻率。
當運用時,本發明係以台積電之0.18μm CMOS製程完成該系統晶片之實現。使本發明提出之遠距離音源定位晶片裝置可以達到可高重複利用性、高整合性、少晶片面積,並達到低成本之特色,本裝置並透過Altera DEII-70 FPGA開發板完成驗證以及模擬,其中之類比前端電路係透過國家晶片實現中心所提供之TSMC 0.18μm CMOS 1p3M+ MIM Cap混合模製程,而另外之數位運算處理核心則係利用TSMC之Artsain 0.18μm標準元件庫實現,並且透過Cadence SOC Encounter完成自動佈局及佈局後驗證。藉此,使本發明在誤差角度介於±5°範圍內,其音源定位之辨識率可以達到90%。於其中,本發明系統晶片雛型之佈局面積大小約為2.86mm×3.56mm,平均之功率消耗約為43mW,相較於其他實現方式,本發明係提供了面積更小之晶片以及更少之功率消耗;此外,本發明所採用之平均幅度差值函數僅使用基本加減法運算,相較其它系統所用技術,本方法明顯不需要乘法運算,不僅可減少系統計算複雜度,且在效能部份仍具有高精確度辨識,更容易實現於硬體電路。除了透過系統晶片整合完成本裝置外,亦可隨時整合至其他晶片內,或透過個人電腦及數位訊號處理器(Digital Signal Processor,DSP)等開發平台建構,藉此使音源定位之功能成為附加之功能,不僅能增加產品之價值,亦達到縮短上市時程之功能。
據此,透過本裝置之功能,係可應用到居家生活或者互動產品等領域,例如運用於語音玩具、會議追縱及互動式語音系統等,凡舉音源定位相關之應用皆可以採用,藉此可讓數位監控設備得以即時地拍攝到突發狀況之畫面,以達到更安全之監控功能。
綜上所述,本發明係一種遠距離音源定位晶片裝置及其方法,可有效改善習用之種種缺點,係可隨時整合至其他晶片內,或透過個人電腦及數位訊號處理器等開發平台建構,藉此使音源定位之功能成為附加之功能,不僅能增加產品之價值,亦達到縮短上市時程之功能,進而使本發明之產生能更進步、更實用、更符合使用者之所須,確已符合發明專利申請之要件,爰依法提出專利申請。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍;故,凡依本發明申請專利範圍及發明說明書內容所作之簡單的等效變化與修飾,皆應仍屬本發明專利涵蓋之範圍內。
1...系統晶片
10...類比前端電路
11...放大器
11a...第一放大器
11b...第二放大器
12...第一連續近似類比數位轉換器
13...第二連續近似類比數位轉換器
20...數位運算處理核心
21...記憶單元
21a...第一記憶體
21b...第二記憶體
22...運算模組
221...聲音偵測單元
222...定位演算單元
23...系統控制單元
24...時脈訊號輸出線
25...內部資料匯流排
26...內部控制匯流排
31...步驟(A)聲音訊號輸入
32...步驟(B)門檻值偵測
33...步驟(C)儲存致能
34...步驟(D)過零率
35...步驟(E)聲音資料取樣
36...步驟(F)TDOA計算
37...步驟(G)角度與方向轉換
第1圖,係本發明之遠距離音源定位晶片裝置架構示意圖。
第2圖,係本發明之遠距離音源定位方法流程示意圖。
1...系統晶片
10...類比前端電路
11...放大器
11a...第一放大器
11b...第二放大器
12...第一連續近似類比數位轉換器
13...第二連續近似類比數位轉換器
20...數位運算處理核心
21...記憶單元
21a...第一記憶體
21b...第二記憶體
22...運算模組
221...聲音偵測單元
222...定位演算單元
23...系統控制單元
24...時脈訊號輸出線
25...內部資料匯流排
26...內部控制匯流排

Claims (16)

  1. 一種遠距離音源定位晶片裝置,係整合一類比前端電路(Analog Front End)及一數位運算處理核心(Digital Computing Core)之系統晶片(System On Chip,SOC)架構,用以針對同一音源進行處理,提供在誤差角度介於±5°範圍內,俾使音源定位之辨識率達90%者,其中:該類比前端電路從該系統晶片內部接收具有一第一類比電壓位準及一第二類比電壓位準之輸入,該類比前端電路係包括:數個放大器,分別為一第一放大器及一第二放大器,用以各別自外部一第一接收器及一第二接收器接收一第一類比聲音訊號及一第二類比聲音訊號,並將其訊號放大後輸出;一第一連續近似類比數位轉換器(SAR ADC),係電性連接該第一放大器並接收其放大後輸出之第一類比聲音訊號,用以一操作頻率,將該第一類比聲音訊號轉換成一第一數位聲音訊號後輸出;一第二連續近似類比數位轉換器,係電性連接該第二放大器並接收其放大後輸出之第二類比聲音訊號,用以該操作頻率,將該第二類比聲音訊號轉換成一第二數位聲音訊號後輸出;該數位運算處理核心從該系統晶片外部接收二時脈(Sys_clk、clkk),從該系統晶片內部接收具有一第一數位電壓位準及一第二數位電壓位準之輸入,並輸出一時脈訊號輸出線至該類比前端電路之第一、二連續近似類比數位轉換器,該數位運算處理核心係包括:二記憶單元,分別為一第一記憶體及一第二記憶體,其中該第一記憶體係接收該第一、二連續近似類比數位轉換器之第一、二數位聲音訊號,並將其儲存供作程式控制資料之存取運作;一運算模組,係電性連接該記憶單元並包含一聲音偵測單元及一定位演算單元,其中該聲音偵測單元係取樣該第一記憶體中之聲音訊號進行語音活動偵測,並將提取對應至該第一連續近似類比數位轉換器之第一取樣聲音訊號與對應至該第二連續近似類比數位轉換器之第二取樣聲音訊號儲存至該第二記憶體,該定位演算單元則對該第二記憶體中之第一、二取樣聲音訊號進行時間延遲(Time Delay Of Arrival)分析,並根據產生之時間差(Time Difference Of Arrival,TDOA)值進行角度(Angle)分析,找出該音源相對於該第一、二接收器之方位(Direct);以及一系統控制單元(System Controller Unit),係電性連接該運算模組,用以提供整體裝置處理之工作環境,並控制該些記憶單元與該運算模組之間之運作,透過此系統控制單元讀取硬體上之設定而分配其資料之使用,以決定並執行於不同之工作模式。
  2. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該第一、二連續近似類比數位轉換器係分別量測一CN接腳及連接一第一參考電壓、一第二參考電壓與一偏壓,產生一第一校正類比訊號及一第二校正類比訊號,並根據該第一、二校正類比訊號而產生該第一、二數位聲音訊號。
  3. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該第一記憶體、該第二記憶體與該運算模組之間係透過一內部資料匯流排(Internal Data Bus)電性連接。
  4. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該系統控制單元與該運算模組之間係透過一內部控制匯流排(Internal Control Bus)電性連接。
  5. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該聲音偵測單元係根據能量強度及過零率(Zero Crossing Rate)兩種特徵值進行語音活動偵測。
  6. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該聲音偵測單元係根據門檻值偵測(Threshold Value Detection)該些聲音訊號之能量強度判斷該些聲音訊號是否為雜訊。
  7. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該聲音偵測單元係根據該些聲音訊號之過零率判斷該些聲音訊號是否為雜訊。
  8. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該定位演算單元係採用平均幅度差值函數(Average Magnitude Difference Function,AMDF)進行時間延遲分析。
  9. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該Sys_clk係為該數位運算核心之系統時脈,以及該clkk係使用於該數位運算核心與該第一、二連續近似類比數位轉換器之運算時脈。
  10. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,該定位演算單元尚包含一對照表,用以根據該TDOA值查表對照該音源相對於該第一、二接收器之方位。
  11. 依據申請專利範圍第1項所述之遠距離音源定位晶片裝置,其中,本裝置亦可架構在個人電腦及數位訊號處理器(Digital Signal Processor,DSP)之開發平台上。
  12. 一種遠距離音源定位方法,係用以針對同一音源進行處理,提供在誤差角度介於±5°範圍內,俾使音源定位之辨識率達90%者,其至少包含下列步驟:(A)聲音訊號輸入步驟:透過外部一第一接收器及一第二接收器接收一聲音訊號,並輸入至一系統晶片內部之數位類比轉換器,將該聲音訊號從類比資料轉換為數位資料料後儲存至內建之第一記憶體;(B)門檻值偵測步驟:進行聲音偵測,以門檻值偵測提供一預設聲音強度閥值,與上述其中一接收器輸入之聲音訊號作振幅比較,根據該聲音訊號之強度值是否大於該預設聲音強度閥值提供一比較結果,當該比較結果為否時,回步驟(A)重新取樣偵測;(C)儲存致能步驟:當輸入之聲音訊號通過門檻值時,一內建第二記憶體將啟動記錄程式將其儲存,並根據一預設取樣數量取樣該聲音訊號;(D)過零率步驟:針對步驟(C)儲存之聲音訊號以過零率進行輔助主要聲音偵測,提供一預設過零率閥值,與一過零率計算結果作比較,根據該聲音訊號之過零率是否小於該預設過零率閥值提供一比較結果,當該比較結果為否時,回步驟(A)重新取樣偵測;(E)聲音資料取樣步驟:當輸入之聲音訊號通過門檻值與過零率之後,提供一預設取樣數量,根據該預設取樣數量於該些聲音訊號中提取接近最大值之資料;(F)TDOA計算步驟:進行時間延遲估算,透過平均幅度差值函數進行時間延遲分析,計算每個聲道與音框能量之TDOA;以及(G)角度與方向轉換步驟:透過步驟(F)結果轉換至對應之角度,並找出該音源相對於該接收器之方位。
  13. 依據申請專利範圍第12項所述之遠距離音源定位方法,其中,該步驟(C)預設取樣數量為768筆。
  14. 依據申請專利範圍第12項所述之遠距離音源定位方法,其中,該步驟(D)計算過零率次數,係在聲音訊號波形上定訂一條振幅值為零之直線,當輸入振幅大於零為正,小於零則為負,計算越過零率之次數得到其過零率。
  15. 依據申請專利範圍第12項所述之遠距離音源定位方法,其中,該步驟(E)預設取樣數量為256筆。
  16. 依據申請專利範圍第12項所述之遠距離音源定位方法,其中,本音源定位方法亦可建構於個人電腦及數位訊號處理器上。
TW098139484A 2009-11-20 2009-11-20 遠距離音源定位晶片裝置及其方法 TWI417563B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW098139484A TWI417563B (zh) 2009-11-20 2009-11-20 遠距離音源定位晶片裝置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW098139484A TWI417563B (zh) 2009-11-20 2009-11-20 遠距離音源定位晶片裝置及其方法

Publications (2)

Publication Number Publication Date
TW201118406A TW201118406A (en) 2011-06-01
TWI417563B true TWI417563B (zh) 2013-12-01

Family

ID=44935639

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098139484A TWI417563B (zh) 2009-11-20 2009-11-20 遠距離音源定位晶片裝置及其方法

Country Status (1)

Country Link
TW (1) TWI417563B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778082A (en) * 1996-06-14 1998-07-07 Picturetel Corporation Method and apparatus for localization of an acoustic source
US7035418B1 (en) * 1999-06-11 2006-04-25 Japan Science And Technology Agency Method and apparatus for determining sound source
TW200839737A (en) * 2007-01-26 2008-10-01 Microsoft Corp Multi-sensor sound source localization
TW200916812A (en) * 2007-10-08 2009-04-16 Univ Southern Taiwan Voice direction recognizer using fuzzy-inference structure
TW200918928A (en) * 2007-10-19 2009-05-01 Chi Mei Comm Systems Inc System and method for locating sound sources
TW200943280A (en) * 2008-01-29 2009-10-16 Qualcomm Inc Improving sound quality by intelligently selecting between signals from a plurality of microphones

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5778082A (en) * 1996-06-14 1998-07-07 Picturetel Corporation Method and apparatus for localization of an acoustic source
US7035418B1 (en) * 1999-06-11 2006-04-25 Japan Science And Technology Agency Method and apparatus for determining sound source
TW200839737A (en) * 2007-01-26 2008-10-01 Microsoft Corp Multi-sensor sound source localization
TW200916812A (en) * 2007-10-08 2009-04-16 Univ Southern Taiwan Voice direction recognizer using fuzzy-inference structure
TW200918928A (en) * 2007-10-19 2009-05-01 Chi Mei Comm Systems Inc System and method for locating sound sources
TW200943280A (en) * 2008-01-29 2009-10-16 Qualcomm Inc Improving sound quality by intelligently selecting between signals from a plurality of microphones

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
David Halupka, Nebu John Mathai, Parham Aarabi, Ali Sheikholeslami, "Robust Sound Localization in 0.18 μm CMOS", IEEE TRANSACTIONS ON SIGNAL PROCESSING, VOL. 53, NO. 6, JUNE 2005 *
Silcott, G., Wilson, J., Peterson, N., Peisel, W., Kroekar, K.L., "SOCs drive new product development", Computer , Volume 32 Issue 6 Page(s): 61–66, June 1999 *

Also Published As

Publication number Publication date
TW201118406A (en) 2011-06-01

Similar Documents

Publication Publication Date Title
US10269343B2 (en) Audio processing using an intelligent microphone
US10469967B2 (en) Utilizing digital microphones for low power keyword detection and noise suppression
US10313796B2 (en) VAD detection microphone and method of operating the same
CN107577449B (zh) 唤醒语音的拾取方法、装置、设备及存储介质
Gao et al. Real-time speech recognition for IoT purpose using a delta recurrent neural network accelerator
Oh et al. An acoustic signal processing chip with 142-nW voice activity detection using mixer-based sequential frequency scanning and neural network classification
WO2018077109A1 (zh) 一种声音处理方法和装置
CN105869655A (zh) 音频装置以及语音检测方法
CN108694959A (zh) 语音能量检测
US11435429B2 (en) Method and system of acoustic angle of arrival detection
CN106782591A (zh) 一种在背景噪音下提高语音识别率的装置及其方法
US11172312B2 (en) Acoustic activity detecting microphone
JP4825552B2 (ja) 音声認識装置、周波数スペクトル取得装置および音声認識方法
WO2020043037A1 (zh) 语音转录设备、系统、方法、及电子设备
CN108074581B (zh) 用于人机交互智能终端的控制系统
CN112652320B (zh) 声源定位方法和装置、计算机可读存储介质、电子设备
CN107251576A (zh) 用于麦克风到麦克风通信的接口
TWI417563B (zh) 遠距離音源定位晶片裝置及其方法
US20070076899A1 (en) Audio collecting device by audio input matrix
CN103731768B (zh) 一种声音拾取方法及装置
CN217506534U (zh) 读出电路和处理器
Li et al. A 0.61-$\mu $ W Fully Integrated Keyword-Spotting ASIC With Real-Point Serial FFT-Based MFCC and Temporal Depthwise Separable CNN
CN206804148U (zh) 一种cry2110噪声传感器
CN112885339A (zh) 语音唤醒系统及语音识别系统
Wang et al. An improvement of chip design for auditory source localization awareness

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees