TW201629950A - 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 - Google Patents
針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 Download PDFInfo
- Publication number
- TW201629950A TW201629950A TW105100429A TW105100429A TW201629950A TW 201629950 A TW201629950 A TW 201629950A TW 105100429 A TW105100429 A TW 105100429A TW 105100429 A TW105100429 A TW 105100429A TW 201629950 A TW201629950 A TW 201629950A
- Authority
- TW
- Taiwan
- Prior art keywords
- acoustic signal
- microphone
- data
- clock frequency
- dmic
- Prior art date
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 32
- 238000001514 detection method Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000000694 effects Effects 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims description 22
- 239000000463 material Substances 0.000 claims description 12
- 230000003139 buffering effect Effects 0.000 claims description 4
- 239000000872 buffer Substances 0.000 description 15
- 238000004891 communication Methods 0.000 description 11
- 230000003068 static effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005055 memory storage Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003134 recirculating effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/01—Noise reduction using microphones having different directional characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
Abstract
本發明提供用於在低功耗關鍵字偵測及雜訊抑制中利用數位麥克風之系統及方法。一實例性方法包含接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音。該第一聲學信號包含以一第一時脈頻率傳輸之緩衝資料。該數位麥克風可提供話音活動偵測。該實例性方法亦包含接收至少一個第二聲學信號,其表示藉由一第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料。該第一及該第二聲學信號提供至一音訊處理系統,其可包含雜訊抑制及關鍵字偵測。可以一更高、第二時脈頻率發送緩衝部分以自該第二聲學信號消除該第一聲學信號之一延遲。提供該等信號亦可包含延遲該第二聲學信號。
Description
本申請案主張2015年1月7日申請之美國臨時專利申請案第62/100,758號之權益。前述申請案之標的出於所有目的以引用的方式併入本文中。
本申請案大體上係關於音訊處理且更具體而言,係關於用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之系統及方法。
關鍵字偵測之一典型方法係一個三階段程序。第一階段係發聲偵測。首先,一極低功耗「永遠開啟」實施方案不斷監測周圍聲音且判定一個人是否開始說出一可能關鍵字(通常藉由偵測人類發聲)。當偵測到一可能關鍵字發聲時,第二階段開始。
第二階段執行關鍵字辨識。此操作消耗更多功耗,此係因為此操作比發聲偵測計算上更密集。當完成一說話之檢查(例如,關鍵字辨識)時,結果可係一關鍵字匹配(在此情況下將進入第三階段)或無匹配(在此情況下第一、最低功耗階段重新開始)。
第三階段係用於使用自動語音辨識(ASR)分析關鍵字辨識之後的任何語音。此第三階段係一非常計算密集程序且,因此,可大幅受益於對包含該語音之音訊之部分之信號雜訊比(SNR)之改良。該SNR通
常使用雜訊抑制(NS)信號處理最佳化,其可需要自多個麥克風獲得音訊輸入。
一數位麥克風(DMIC)之用途係熟知。該DMIC通常包含一信號處理部分。一數位信號處理器(DSP)係通常用以執行用於偵測關鍵字之計算。使得某一形式之數位信號處理器(DSP)在相同積體電路(晶片)上執行關鍵字偵測計算作為該DMIC自身之信號處理部分可具有系統功耗優點。例如,當在該第一階段中時,該DMIC可自一內部振盪器操作,因此,節省將一外部時脈供應至該DMIC之功耗及將DMIC資料輸出(通常為一脈衝密度調變(PDM)信號)傳輸至一外部DSP裝置之功耗。
亦已知在該DMIC上實施關鍵字辨識之後續階段對於最低功耗或系統成本可不係最佳。關鍵字辨識之後續階段係計算密集且,因此,消耗顯著動態功耗及晶粒區域。然而,DMIC信號處理晶片通常使用具有比最佳可用數位程序顯著更高之動態功耗及每閘或每記憶體位元更大區域之一程序幾何結構來實施。
找到一最佳實施方案(其利用在DMIC中實施關鍵字辨識之該第一階段之潛在功耗節省)可起因於衝突要求而有挑戰性。為最佳化功耗,DMIC以一「永遠開啟」分立方式操作,而無需在未偵測到發聲時將音訊資料傳輸至一外部裝置。當偵測到發聲時,DMIC需要提供一信號至一外部裝置來指示此情況。與此情況之發生同時或在此情況之發生之後,DMIC需要開始提供音訊資料至(若干)外部裝置來執行後續階段。最佳地,音訊資料介面需要滿足以下要求:傳輸對應於時間(其顯著在發聲偵測之前)的音訊資料、以一外部提供的時脈(樣品)速率傳輸即時音訊資料、且簡化多麥克風雜訊抑制處理。另外,與針對實施關鍵字辨識之該第一階段之DMIC的即時音訊資料相關聯的延時需要實質上與針對習知DMIC之延時相同,該介面需要與現有介面
相容、該接面需要指示當使用該內部振盪器操作時使用之該時脈(樣品)速率、且不應該發生音訊漏失。
具有實施關鍵字辨識之該第一階段之一DMIC的一介面可在很大程度上起因於呈現在發聲偵測之前顯著緩衝之音訊資料之要求而有挑戰性。此緩衝音訊資料先前以藉由該內部振盪器判定之一取樣率獲取。因此,當該緩衝音訊資料連同即時音訊資料一起提供為一單一、相連音訊串流之部分時,可難以使得此即時音訊資料具有與一習知DMIC中之延時相同的延時或難以使用習知多麥克風雜訊抑制技術。
此「發明內容」經提供以介紹在下文「實施方式」中進一步描述之以一簡化形式之概念之一選擇。此「發明內容」不意欲識別所申請之標的之關鍵特徵或基本特徵,亦不意欲用作為判定所申請之標的之範疇之一援助。
本發明提供用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之系統及方法。一實例性方法包含接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料。該實例性方法亦包含接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音。該至少一個第二聲學信號可包含即時資料。在一些實施例中,該至少一個第二麥克風可係一類比麥克風。該至少一個第二麥克風亦可係不具有話音活動偵測功能性之一數位麥克風。
該實例性方法進一步包含將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。該音訊處理系統可至少提供雜訊抑制。
在一些實施例中,發送具有高於該第一時脈頻率的一第二時脈頻率之該緩衝資料以自該第二聲學信號消除該第一聲學信號之一延
遲。
提供該等信號可包含延遲該第二聲學信號。
將自結合以下圖式之以下描述明白本發明之其他實例性實施例及態樣。
100‧‧‧實例性系統/系統
110‧‧‧行動裝置
120‧‧‧麥克風/數位麥克風
130‧‧‧基於雲端之計算資源/計算雲端/雲端
150‧‧‧使用者
160‧‧‧雜訊
210‧‧‧處理器
220‧‧‧音訊處理系統
230‧‧‧記憶體儲存器
240‧‧‧通信裝置
300‧‧‧系統
302‧‧‧傳感器
304‧‧‧放大器
306‧‧‧類比轉數位轉換器
308‧‧‧脈衝密度調變器
310‧‧‧緩衝器
312‧‧‧時脈(CLK)輸入/CLK線
314‧‧‧資料(DATA)輸出
316‧‧‧額外發聲偵測器(DET)輸出/DET線
320‧‧‧發聲偵測器
350‧‧‧(外部或主機)DSP/DSP/主機DSP
500‧‧‧例示性電腦系統/電腦系統
510‧‧‧處理器單元
520‧‧‧主記憶體
530‧‧‧大量資料儲存器
540‧‧‧可攜式儲存裝置
550‧‧‧輸出裝置
560‧‧‧使用者輸入裝置
570‧‧‧圖形顯示器系統
580‧‧‧周邊裝置
590‧‧‧單一匯流排
實施例以實例的方式繪示且不限於附圖之圖中,在圖式中相似元件符號指示類似元件。
圖1係繪示根據各種實例性實施例之一系統之一方塊圖,該系統可用以實施用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之方法。
圖2係一實例性行動裝置之一方塊圖,其中可實踐用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之方法。
圖3係展示根據各種實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一系統的一方塊圖。
圖4係展示根據一實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一方法之步驟的一流程圖。
圖5係可用以實施所揭示之技術之實施例的一實例性電腦系統。
本發明提供用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風的實例性系統及方法。可使用經組態以至少捕獲音訊信號且可允許改良所捕獲的音訊中的自動語音辨識之行動音訊裝置來實踐本發明技術的各種實施例。
在各種實施例中,行動裝置係手持式裝置(諸如,筆記本電腦、平板電腦、平板手機、智慧型電話、個人數位助理、媒體播放器、行動電話、視訊攝影機及其類似者)。該等行動裝置可在靜止及可攜式環境中使用。該等靜止環境可包含住宅及商業建築及其類似者。例
如,該等靜止環境可進一步包含起居室、臥室、家庭影院、會議室、演藝廳、商業事務所及其類似者。可攜式環境可包含移動運載工具、移動個人、其他運輸構件及其類似者。
現在參考圖1,展示其中可實踐本發明之方法之一實例性系統100。系統100可包含一行動裝置110。在各種實施例中,行動裝置110包含經組態以自一使用者150接收話音輸入/聲學信號之(若干)麥克風(例如,(若干)傳感器)120。
話音輸入/聲學聲音可被一雜訊160污染。雜訊源可包含街道雜訊、周圍雜訊、來自除一(若干)預期揚聲器外之實體之語音及其類似者。例如,雜訊源可包含一工作空調、通風機、電視機、行動電話、立體音訊系統及其類似者。特定種類之雜訊可產生於機器(例如,汽車)與操作(例如)一道路、軌道、輪胎、輪、風扇、雨刷、引擎、排放裝置、娛樂系統、風、雨、波浪之環境之操作兩者及其類似雜訊。
在一些實施例中,行動裝置110交換地連接至一或多個基於雲端之計算資源130(亦稱為一(若干)計算雲端130或一雲端130)。(若干)基於雲端之計算資源130可包含在一遠端位置處可用且可在一網路(例如,網際網路或一蜂巢式電話網路)上存取的計算資源(硬體及軟體)。在各種實施例中,(若干)基於雲端之計算資源130由多個使用者共用且可基於需求動態地重新分配。(若干)基於雲端之計算資源130可包含一或多個伺服器場/群集,其包含電腦伺服器之一集合(其可與網路開關及/或路由器共置)。
圖2係展示根據各種實例性實施例之行動裝置110之組件的一方塊圖。在該繪示實施例中,行動裝置110包含一或多個麥克風120、一處理器210、音訊處理系統220、一記憶體儲存器230、及一或多個通信裝置240。在特定實施例中,行動裝置110亦包含行動裝置110之操作所需之額外或其他組件。在其他實施例中,行動裝置110包含執行與
參考圖2描述之該等功能相似或等效的功能之更少組件。
在各種實施例中,(其中(若干)麥克風120包含間隔較小(例如,相隔1cm至2cm)之全向麥克風),一光束形成技術可用以模擬一面向前及一面向後方向麥克風回應。在一些實施例中,可使用所模擬之面向前及面向後方向麥克風獲得一位準差異。該位準差異可用以在(例如)時間頻率域中之語音與雜訊之間辨別,其可進一步在雜訊及/或回聲減少中使用。雜訊減少可包含雜訊消除及/或雜訊抑制。在特定實施例中,一些麥克風120主要用以偵測語音且其他麥克風主要用以偵測雜訊。在其他實施例中,一些麥克風用以偵測雜訊與語音兩者。
在一些實施例中,一旦接收(例如,藉由(若干)麥克風120捕獲)聲學信號,聲學信號將轉換為電信號,電信號又藉由音訊處理系統220轉換為用於根據一些實施例來處理之數位信號。所處理之信號可傳輸至處理器210用於進一步處理。在一些實施例中,一些麥克風120係可操作以捕獲聲學信號且輸出一數位信號的(若干)數位麥克風。(若干)數位麥克風之一些數位麥克風可提供用於話音活動偵測(在本文中亦稱為發聲偵測)且用於顯著在該發聲偵測之前的音訊資料之緩衝。
音訊處理系統220可操作以處理一音訊信號。在一些實施例中,聲學信號藉由(若干)麥克風120捕獲。在特定實施例中,藉由(若干)麥克風120偵測之聲學信號藉由音訊處理系統220使用以將所要的語音(例如,關鍵字)與雜訊分離來提供更穩健的自動語音辨識(ASR)。
適於執行雜訊抑制之一實例性音訊處理系統在於2010年7月8日申請之名稱為「Method for Jointly Optimizing Noise Reduction and Voice Quality in a Mono or Multi-Microphone System」之美國專利申請案第12/832,901號(現為美國專利第8,473,287號,其出於所有目的以引用的方式併入本文中)中更詳細地討論。以實例的方式且無限制,在於2008年6月30日申請之名稱為「System and Method for Providing
Noise Suppression Utilizing Null Processing Noise Subtraction」之美國專利申請案第12/215,980號(現為美國專利第9,185,487號)且在於2007年1月29日申請之名稱為「System and Method for Utilizing Omni-Directional Microphones for Speech Enhancement」之美國專利申請案第11/699,732號(現為美國專利第8,194,880號)中(其等全部內容以引用的方式併入本文中)描述雜訊抑制方法。
亦在共同指派的於2013年1月28日申請之名稱為「Restoration of Noise-Reduced Speech」之美國專利申請案第13/751,907號(現為美國專利第8,615,394號)(其全部內容以引用的方式併入本文中)中描述用於雜訊減少語音之恢復的各種方法。
處理器210可包含可操作以執行儲存在記憶體儲存器230中的電腦程式之硬體及/或軟體。處理器210可使用浮點運算、複數運算、及用於實施本發明之實施例所需之其他運算。在一些實施例中,行動裝置110之處理器210包含(例如)一數位信號處理器(DSP)、影像處理器、音訊處理器、通用處理器及其類似者之至少一者。
在各種實施例中,實例行動裝置110可操作以在一或多個有線或無線通信網路上(例如,經由通信裝置240)通信。在一些實施例中,行動裝置110在一有線或無線通信網路上發送至少音訊信號(語音)。在特定實施例中,行動裝置110囊封及/或編碼用於在一無線網絡(例如,一蜂巢式網路)上傳輸的至少一個數位信號。
該數位信號可在網際網路協定套組(TCP/IP)及/或使用者資料報協定(UDP)上囊封。有線及/或無線通信網路可係電路交換及/或封包交換。在各種實施例中,(若干)有線通信網路在電腦系統、軟體應用與使用者之間提供通信及資料交換,且包含任何數量之網路配接器、中繼器、集線器、開關、橋接器、路由器及防火牆。(若干)無線通信網路包含任何數量之無線存取點、基地台、中繼器及其類似者。有線
及/或無線通信網路可符合一(若干)行業標準(該行業標準係專屬)及其組合。可使用各種其他適合有線及/或無線通信網路、其他協定及其組合。
圖3係展示根據各種實例性實施例之適於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風的一系統300之一方塊圖。系統300包含耦合至一(外部或主機)DSP 350之(若干)麥克風(亦在本文中多樣地稱為(若干)DMIC)120。在一些實施例中,數位麥克風120包含一傳感器302、一放大器304、一類比轉數位轉換器306及一脈衝密度調變器(PDM)308。在特定實施例中,數位麥克風120包含一緩衝器310及一發聲偵測器320。在其他實施例中,DMIC 120與一習知立體DMIC介面介接。該習知立體DMIC介面包含一時脈(CLK)輸入(或CLK線)312及一資料(DATA)輸出314。該資料輸出包含一左頻道及一右頻道。在一些實施例中,該DMIC介面包含一額外發聲偵測器(DET)輸出(或DET線)316。CLK輸入312可藉由DSP 350供應。DSP 350可接收DATA輸出314及DET輸出316。在一些實施例中,數位麥克風120通常經由PDM 308產生一即時數位音訊資料串流。提供發聲偵測的一實例性數位麥克風在於2015年7月13日申請之名稱為「Microphone Apparatus and Method with Catch-up Buffer」之美國專利申請案第14797310號(其揭示內容出於所有目的以引用的方式併入本文中)中更詳細地討論。
實例1
在各種實施例中,在第一階段情況下,DMIC 120在一內部振盪器上操作,該內部振盪器判定在此情況期間之內部取樣率。在第一階段情況下,在發聲偵測之前,CLK線312係靜態(通常為一邏輯0)。DMIC 120在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自其內部振盪器操作之DMIC 120可操作以分
析音訊資料以判定是否已發生一發聲。內部地,DMIC 120將音訊資料緩衝至一再循環記憶體(例如,使用緩衝器310)中。在特定實施例中,該再循環記憶體具有一預定數量(通常為約100k PDM)之樣品。
在各種例示性實施例中,當DMIC 120偵測到一發聲時,DMIC 120開始在DET輸出316上輸出PDM 308樣品時脈(衍生自該內部振盪器)。DSP 350可操作以偵測DET線316上的活動。DSP 350可使用此信號判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,DSP 350可在CLK線312上輸出適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料之一時脈。在一些實施例中,該時脈係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由自該內部取樣率立即切換至所提供的CLK線312之取樣率而回應於CLK輸入312之存在。在特定實施例中,DMIC 120可操作以在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應即時PDM 308資料,且在第二(例如,右)頻道上供應延遲(通常約為100k PDM樣品)緩衝PDM 308資料。DMIC 120可在接收該CLK時停止在該DET信號上提供內部時脈。
在一些實施例中,在已傳輸整個(通常約為100k樣品)緩衝之後,DMIC 120切換至在DATA輸出314之第二(在該實例中,右)頻道上發送該即時音訊資料或一靜態信號(通常為一邏輯0)以節省功耗。
在各種實施例中,DSP 350累積緩衝資料且接著視需要使用先前量測的DMIC 120內部取樣率與主機CLK取樣率的比率而以將緩衝資料匹配至即時音訊資料之一方式處理緩衝資料。例如,DSP 350可將緩衝資料轉換為與主機CLK取樣率相同的速率。熟習此項技術者應瞭解實際取樣率轉換可能並非最佳。相反地,處理資訊之進一步下游頻率域可基於所量測的比率在頻率上偏置。緩衝資料可為關鍵字辨識之
目的預擱置至即時音訊資料。亦可視需要預擱置至用於ASR之資料。
在各種實施例中,因為即時音訊資料未延遲,所以該即時資料具有一低延時且可與來自用於雜訊抑制或其他目的之其他麥克風之該即時音訊資料組合。
將CLK信號返回至一靜態狀態可用以將DMIC 120返回至該第一階段處理狀態。
實例2
在第一階段情況下,DMIC 120在判定PDM 308取樣率之一內部振盪器上操作。在一些例示性實施例中,在第一階段情況下,在發聲偵測之前,CLK輸入312係靜態(通常為一邏輯0)。DMIC 120可在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自其內部振盪器操作之DMIC 120可操作以分析音訊資料以判定是否發生一發聲且亦內部地將音訊資料緩衝至一再循環記憶體中。該再循環記憶體可具有一預定數量(通常約為100k PDM)之樣品。
在一些實施例中,當DMIC 120偵測到發聲時,DMIC 120開始在DET輸出316上輸出一PDM取樣率時脈(衍生自其內部振盪器)。DSP 350可偵測DET線316上的活動。接著,DSP 350可使用DET輸出判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,DSP 350可在CLK線312上輸出一時脈。在特定實施例中,該時脈係以比內部振盪器取樣率更高的一速率,且適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料。在一些實施例中,提供至CLK線312的該時脈係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應緩衝PDM 308資料而回應於CLK線312
處之該時脈之存在。因為CLK頻率係大於內部取樣頻率,所以資料之延遲自緩衝長度逐漸減少至零。當該延遲達到零時,DMIC 120藉由將其取樣率自內部振盪器之取樣率立即切換至藉由CLK線312提供的速率而回應。DMIC 120亦可在DATA輸出314之頻道之一者上立即開始供應即時PDM 308資料。此刻,DMIC 120亦停止在DET輸出316信號上提供內部時脈。
在一些實施例中,DSP 350可累積緩衝資料且基於感測DET輸出316信號何時停止而判定DATA已自緩衝資料切換至即時音訊資料之一點。接著,DSP 350可使用先前量測的DMIC 120內部取樣率與CLK取樣率的比率來邏輯地取樣緩衝資料之轉換速率以匹配即時音訊資料之轉換速率。
在此實例中,一旦完全接收緩衝資料且已發生切換至即時音訊,即時音訊資料便將具有一低延時且可與來自用於雜訊抑制或其他目的之其他麥克風之該即時音訊資料組合。
與一些其他實施例比較,藉由實例2繪示之各種實施例可具有一缺點:自發聲偵測至即時操作需要一更長時間,其在該即時操作期間需要比階段一操作之速率更高的一速率,且亦可需要準確偵測在緩衝與即時音訊資料之間轉變的時間。
另一方面,根據實例2之各種實施例具有僅需要使用立體習知DMIC 120介面之一個頻道之優點,保留另一頻道可由一第二DMIC 120使用。
實例3
在第一階段情況下,DMIC 120可在判定PDM 308取樣率之一內部振盪器上操作。在第一階段情況下,在發聲偵測之前,CLK輸入312係靜態(通常在一邏輯0處)。DMIC 120在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自內部振盪器
操作之DMIC 120可操作以分析音訊資料以判定是否發生一發聲且亦藉由內部將彼資料緩衝至具有一預定數量(通常約為100k PDM)之樣品的一再循環記憶體(例如,緩衝器310)中。
當DMIC 120偵測到一發聲時,DMIC 120開始在DET輸出316上輸出PDM 308取樣率時脈(衍生自其內部振盪器)。DSP 350可偵測DET線316上的活動。接著,DSP 350可使用DET輸出316信號判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,主機DSP 350可在CLK線312上輸出適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料的一時脈。此時脈可係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應緩衝PDM 308資料而回應於CLK輸入312之存在。此刻,DMIC 120亦停止在DET輸出316信號上提供內部時脈。當資料之緩衝器310耗盡時,DMIC 120在DATA輸出314之頻道之一者上開始供應即時PDM 308資料。
DSP 350累積緩衝資料,基於計數所接收的樣品之數量而標記DATA已自緩衝資料切換至即時音訊資料之一點。接著,DSP 350使用先前量測的DMIC 120內部取樣率與CLK取樣率的比率來邏輯地取樣緩衝資料之轉換速率以匹配即時音訊資料之轉換速率。
在一些實施例中,即使在完全接收緩衝資料且已發生切換至即時音訊之後,DMIC 120資料仍保持在一高延時處。在一些實施例中,該延時等於樣品中的緩衝大小乘以CLK線312之取樣率。因為其他麥克風具有低延時,所以另一麥克風無法與此資料使用用於習知雜訊抑制。
在一些實施例中,來自麥克風之信號之間的不匹配藉由將一延遲添加至用於雜訊抑制的其他麥克風之各者而消除。在延遲之後,來
自DMIC 120及其他麥克風之串流可經組合用於雜訊抑制或其他目的。添加至其他麥克風的該延遲可基於DMIC 120之已知延遲特性(例如,起因於緩衝之延時等等)而判定或可(例如)基於比較自DMIC 120接收之音訊資料與自其他麥克風接收之音訊資料(例如,比較時序、取樣率時脈等等)而在演算法上量測。
與實例1之較佳實施例比較,實例3之各種實施例具有以下缺點:自發聲偵測至即時操作需要一更長時間,且當即時操作時,具有顯著額外延時。實例3之實施例具有僅需要使用立體習知DMIC介面之一個頻道之優點,保留另一頻道可由一第二DMIC使用。
圖4係繪示根據一實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一方法400的一流程圖。在方塊402中,實例性方法400可以接收一聲學信號開始,該聲學信號表示由一數位麥克風捕獲之至少一個聲音。該聲學信號可包含在一單一頻道上傳輸之具有一第一(低)時脈頻率的緩衝資料。在方塊404中,實例性方法可繼續接收至少一個第二聲學信號,其表示由至少一個第二麥克風捕獲之該至少一個聲音。在各種實施例中,該至少一個第二聲學信號包含即時資料。
在方塊406中,緩衝資料可經分析以判定緩衝資料包含一話音。在方塊408中,實例性方法400可繼續發送具有一第二時脈頻率之緩衝資料以自該第二聲學信號消除該聲學信號之一延遲。該第二時脈頻率係高於該第一時脈頻率。在方塊410中,實例性方法400可將該第二聲學信號延遲一預定時間週期。可替代方塊408執行方塊410用於消除該延遲。在方塊412中,實例性方法400可繼續將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。該音訊處理系統可包含雜訊抑制及關鍵字偵測。
圖5繪示可用以實施本發明之一些實施例的一例示性電腦系統
500。圖5之電腦系統500可在計算系統、網路、伺服器或其組合之相似背景下實施。圖5之電腦系統500包含一或多個處理器單元510及主記憶體520。主記憶體520部分儲存用於藉由(若干)處理器單元510執行之指令及資料。在此實例中,主記憶體520在操作時儲存可執行碼。圖5之電腦系統500進一步包含一大量資料儲存器530、可攜式儲存裝置540、輸出裝置550、使用者輸入裝置560、一圖形顯示器系統570及周邊裝置580。
圖5中展示之組件係描繪為經由一單一匯流排590連接。該等組件可通過一或多個資料運輸構件連接。(若干)處理器單元510及主記憶體520經由一局部微處理器匯流排連接,且大量資料儲存器530、(若干)周邊裝置580、可攜式儲存裝置540及圖形顯示器系統570經由一或多個輸入/輸出(I/O)匯流排連接。
大量資料儲存器530(其可使用一磁碟驅動器、固態驅動器或一光碟驅動器實施)係用於儲存用於藉由(若干)處理器單元510使用之資料及指令的非揮發性儲存裝置。大量資料儲存器530儲存用於為將該系統軟體載入至主記憶體520中之目的而實施本發明之實施例的該軟體。
可攜式儲存裝置540結合一可攜式非揮發性儲存媒體(諸如一快閃驅動器、軟磁碟、光碟、數位視訊光碟或通用串列匯流排(USB)儲存裝置)一起操作以自圖5之電腦系統500輸入資料及碼且將資料及碼輸出至圖5之電腦系統500。用於實施本發明之實施例的該系統軟體儲存在此一可攜式媒體中且經由可攜式儲存裝置540輸入至電腦系統500。
使用者輸入裝置560可提供一使用者介面之一部分。使用者輸入裝置560可包含一或多個麥克風、一文數字小鍵盤(諸如一鍵盤,用於輸入文數字及其他資訊)、或一指向裝置(諸如一滑鼠、一軌跡球、記錄針或游標方向鍵)。使用者輸入裝置560亦可包含一觸控螢幕。另
外,如圖5中所展示之電腦系統500包含輸出裝置550。適合輸出裝置550包含揚聲器、印表機、網路介面及監測器。
圖形顯示器系統570包含一液晶顯示器(LCD)或其他適合顯示器裝置。圖形顯示器系統570可組態以接收文本及圖形資訊且處理用於輸出至該顯示器裝置之資訊。
周邊裝置580可包含電腦支持裝置之任何類型以添加額外功能性至該電腦系統。
在圖5之電腦系統500中提供之組件係通常存在於可適於與本發明之實施例一起使用且意欲表示此項技術中眾所周知之此等電腦組件之一寬泛類別的電腦系統中之組件。因此,圖5之電腦系統500可係一個人電腦(PC)、手持式電腦系統、電話、行動電腦系統、工作站、平板電腦、平板手機、行動電話、伺服器、小型電腦、主機電腦、隨身或任何其他電腦系統。電腦亦可包含不同匯流排組態,網路平台、多處理器平台及其類似者。可使用包含UNIX、LINUX、WINDOWS、MAC OS、PALM OS、QNX ANDROID、IOS、CHROME、TIZEN之各種作業系統及其他適合作業系統。
用於各種實施例之處理可在基於雲端的軟體中實施。在一些實施例中,電腦系統500實施為一基於雲端的計算環境(諸如在一計算雲端內操作的一虛擬機器)。在其他實施例中,電腦系統500可自身包含一基於雲端的計算環境,其中電腦系統500之功能性以一分佈式方式執行。因此,如將在下文中更詳細描述,當組態為一計算雲端時,電腦系統500可包含呈各種形式之複數個計算裝置。
一般而言,一基於雲端的計算環境係一資源,其通常組合處理器之一大分組(諸如在網頁伺服器內)之計算功耗及/或組合電腦記憶體或儲存裝置之一大分組之儲存容量。提供基於雲端的資源的系統可僅僅由其所有者利用或此等系統可被外部使用者(其在計算基礎建設內
部署應用以獲得大計算或儲存資源之益處)存取。
雲端可(例如)藉由網頁伺服器之一網路(該等網頁伺服器包括複數個計算裝置(諸如電腦系統500),其中各伺服器(或至少其複數個伺服器)提供處理器及/或儲存資源)形成。此等伺服器可管理由多個使用者(例如,雲端資源客戶或其他使用者)提供的工作負荷。通常,各使用者對雲端提出即時變動(有時大幅變動)之工作負荷需求。此等變動之本質及程度通常取決於與使用者相關聯的業務的類型。
上文參考實例性實施例描述本發明技術。因此,對實例性實施例之其他變動意欲由本發明涵蓋。
Claims (24)
- 一種用於音訊處理之方法,該方法包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
- 如請求項1之方法,其中該提供包含發送具有一第二時脈頻率之該緩衝資料用於自該至少一個第二聲學信號消除該第一聲學信號之一延遲,該第二時脈頻率係高於該第一時脈頻率。
- 如請求項1之方法,其中該提供包含將該至少一個第二聲學信號延遲一預定時間週期。
- 如請求項3之方法,其中基於該數位麥克風之一或多個特性判定該預定時間週期。
- 如請求項4之方法,其中該一或多個特性包含該數位麥克風之延時。
- 如請求項5之方法,其中該延時包含歸因於針對該緩衝資料之緩衝之延遲。
- 如請求項3之方法,其中基於比較該第一聲學信號與該至少一個第二聲學信號來判定該預定時間週期。
- 如請求項7之方法,其中該比較包括比較該第一聲學信號及該至少一個第二聲學信號之取樣率。
- 如請求項1之方法,其進一步包括,在該提供之前,接收已偵測話音活動之一指示。
- 如請求項9之方法,其中該指示藉由與該數位麥克風相關聯的一話音活動偵測器提供。
- 如請求項1之方法,其中該至少一個第二麥克風係一類比麥克風。
- 如請求項1之方法,其中該音訊處理系統基於該第一聲學信號及該至少一個第二聲學信號提供雜訊抑制。
- 如請求項12之方法,其中該雜訊抑制係基於該第一聲學信號與該至少一個第二聲學信號之間的位準差異。
- 如請求項1之方法,其中該第一聲學信號包含一脈衝密度調變(PDM)信號。
- 一種用於音訊處理之系統,該系統包括:一處理器;及一記憶體,其通信地與該處理器耦合,該記憶體儲存指令,當藉由該處理器執行時,該等指令執行一方法,其包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
- 如請求項15之系統,其中該音訊處理系統包含基於該第一聲學信號及該至少一個第二聲學信號之雜訊抑制及關鍵字偵測中之 至少一者。
- 如請求項15之系統,其中該提供包含發送具有一第二時脈頻率之該緩衝資料用於自該至少一個第二聲學信號消除該第一聲學信號之一延遲,該第二時脈頻率係高於該第一時脈頻率。
- 如請求項15之系統,其中該提供包含將該至少一個第二聲學信號延遲一預定時間週期。
- 如請求項18之系統,其中基於該數位麥克風之一或多個特性判定該預定時間週期。
- 如請求項18之系統,其中藉由比較該第一聲學信號與該至少一個第二聲學信號來判定該預定時間週期。
- 如請求項15之系統,其進一步包括,在該提供之前,接收已偵測話音活動之一指示。
- 如請求項21之系統,其中該指示藉由與該數位麥克風相關聯的一話音活動偵測器提供。
- 如請求項15之系統,其中該至少一個第二麥克風係一類比麥克風。
- 一種非暫態電腦可讀儲存媒體,其已於其上體現指令,當藉由至少一個處理器執行時,該等指令執行一方法之步驟,該方法包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及 將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562100758P | 2015-01-07 | 2015-01-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201629950A true TW201629950A (zh) | 2016-08-16 |
Family
ID=56286839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105100429A TW201629950A (zh) | 2015-01-07 | 2016-01-07 | 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10045140B2 (zh) |
CN (1) | CN107112012B (zh) |
DE (1) | DE112016000287T5 (zh) |
TW (1) | TW201629950A (zh) |
WO (1) | WO2016112113A1 (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI690919B (zh) * | 2017-05-27 | 2020-04-11 | 大陸商騰訊科技(深圳)有限公司 | 語音關鍵字識別方法、裝置、終端、伺服器、電腦可讀儲存介質及電腦程式產品 |
CN111194439A (zh) * | 2017-08-07 | 2020-05-22 | 搜诺思公司 | 唤醒词检测抑制 |
US11727933B2 (en) | 2016-10-19 | 2023-08-15 | Sonos, Inc. | Arbitration-based voice recognition |
US11750969B2 (en) | 2016-02-22 | 2023-09-05 | Sonos, Inc. | Default playback device designation |
US11778259B2 (en) | 2018-09-14 | 2023-10-03 | Sonos, Inc. | Networked devices, systems and methods for associating playback devices based on sound codes |
US11792590B2 (en) | 2018-05-25 | 2023-10-17 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11790937B2 (en) | 2018-09-21 | 2023-10-17 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11790911B2 (en) | 2018-09-28 | 2023-10-17 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11797263B2 (en) | 2018-05-10 | 2023-10-24 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11817083B2 (en) | 2018-12-13 | 2023-11-14 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US11817076B2 (en) | 2017-09-28 | 2023-11-14 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US11816393B2 (en) | 2017-09-08 | 2023-11-14 | Sonos, Inc. | Dynamic computation of system response volume |
US11854547B2 (en) | 2019-06-12 | 2023-12-26 | Sonos, Inc. | Network microphone device with command keyword eventing |
US11863593B2 (en) | 2016-02-22 | 2024-01-02 | Sonos, Inc. | Networked microphone device control |
US11862161B2 (en) | 2019-10-22 | 2024-01-02 | Sonos, Inc. | VAS toggle based on device orientation |
US11869503B2 (en) | 2019-12-20 | 2024-01-09 | Sonos, Inc. | Offline voice control |
US11881222B2 (en) | 2020-05-20 | 2024-01-23 | Sonos, Inc | Command keywords with input detection windowing |
US11881223B2 (en) | 2018-12-07 | 2024-01-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11887598B2 (en) | 2020-01-07 | 2024-01-30 | Sonos, Inc. | Voice verification for media playback |
US11893308B2 (en) | 2017-09-29 | 2024-02-06 | Sonos, Inc. | Media playback system with concurrent voice assistance |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11934742B2 (en) | 2016-08-05 | 2024-03-19 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US11947870B2 (en) | 2016-02-22 | 2024-04-02 | Sonos, Inc. | Audio response playback |
US11961519B2 (en) | 2020-02-07 | 2024-04-16 | Sonos, Inc. | Localized wakeword verification |
US11973893B2 (en) | 2018-08-28 | 2024-04-30 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11979960B2 (en) | 2016-07-15 | 2024-05-07 | Sonos, Inc. | Contextualization of voice inputs |
US11983463B2 (en) | 2016-02-22 | 2024-05-14 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US12047753B1 (en) | 2017-09-28 | 2024-07-23 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US12062383B2 (en) | 2018-09-29 | 2024-08-13 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US12063486B2 (en) | 2018-12-20 | 2024-08-13 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US12080314B2 (en) | 2016-06-09 | 2024-09-03 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US12093608B2 (en) | 2019-07-31 | 2024-09-17 | Sonos, Inc. | Noise classification for event detection |
US12118273B2 (en) | 2020-01-31 | 2024-10-15 | Sonos, Inc. | Local voice data processing |
US12119000B2 (en) | 2020-05-20 | 2024-10-15 | Sonos, Inc. | Input detection windowing |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10360926B2 (en) | 2014-07-10 | 2019-07-23 | Analog Devices Global Unlimited Company | Low-complexity voice activity detection |
US10121472B2 (en) * | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US10262673B2 (en) | 2017-02-13 | 2019-04-16 | Knowles Electronics, Llc | Soft-talk audio capture for mobile devices |
US10366708B2 (en) | 2017-03-20 | 2019-07-30 | Bose Corporation | Systems and methods of detecting speech activity of headphone user |
US10499139B2 (en) | 2017-03-20 | 2019-12-03 | Bose Corporation | Audio signal processing for noise reduction |
US10311889B2 (en) | 2017-03-20 | 2019-06-04 | Bose Corporation | Audio signal processing for noise reduction |
US10424315B1 (en) | 2017-03-20 | 2019-09-24 | Bose Corporation | Audio signal processing for noise reduction |
US10249323B2 (en) | 2017-05-31 | 2019-04-02 | Bose Corporation | Voice activity detection for communication headset |
US10311874B2 (en) | 2017-09-01 | 2019-06-04 | 4Q Catalyst, LLC | Methods and systems for voice-based programming of a voice-controlled device |
US10332543B1 (en) * | 2018-03-12 | 2019-06-25 | Cypress Semiconductor Corporation | Systems and methods for capturing noise for pattern recognition processing |
US10861462B2 (en) * | 2018-03-12 | 2020-12-08 | Cypress Semiconductor Corporation | Dual pipeline architecture for wakeup phrase detection with speech onset detection |
US10438605B1 (en) | 2018-03-19 | 2019-10-08 | Bose Corporation | Echo control in binaural adaptive noise cancellation systems in headsets |
WO2020028693A1 (en) * | 2018-08-01 | 2020-02-06 | Syntiant | Sensor-processing systems including neuromorphic processing modules and methods thereof |
US11049496B2 (en) * | 2018-11-29 | 2021-06-29 | Microsoft Technology Licensing, Llc | Audio pipeline for simultaneous keyword spotting, transcription, and real time communications |
US11335331B2 (en) | 2019-07-26 | 2022-05-17 | Knowles Electronics, Llc. | Multibeam keyword detection system and method |
CN110580919B (zh) * | 2019-08-19 | 2021-09-28 | 东南大学 | 多噪声场景下语音特征提取方法及可重构语音特征提取装置 |
CN111199751B (zh) * | 2020-03-04 | 2021-04-13 | 北京声智科技有限公司 | 一种麦克风的屏蔽方法、装置和电子设备 |
Family Cites Families (183)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3989897A (en) | 1974-10-25 | 1976-11-02 | Carver R W | Method and apparatus for reducing noise content in audio signals |
US4831558A (en) | 1986-08-26 | 1989-05-16 | The Slope Indicator Company | Digitally based system for monitoring physical phenomena |
US4812996A (en) | 1986-11-26 | 1989-03-14 | Tektronix, Inc. | Signal viewing instrumentation control system |
US4811404A (en) | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
GB8910981D0 (en) | 1989-05-12 | 1989-06-28 | Hi Med Instr Limited | Digital waveform encoder and generator |
JPH0566795A (ja) | 1991-09-06 | 1993-03-19 | Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho | 雑音抑圧装置とその調整装置 |
JP3176474B2 (ja) | 1992-06-03 | 2001-06-18 | 沖電気工業株式会社 | 適応ノイズキャンセラ装置 |
US5555287A (en) | 1992-07-21 | 1996-09-10 | Advanced Micro Devices, Inc. | Integrated circuit and cordless telephone using the integrated circuit |
US5340316A (en) | 1993-05-28 | 1994-08-23 | Panasonic Technologies, Inc. | Synthesis-based speech training system |
US5675808A (en) | 1994-11-02 | 1997-10-07 | Advanced Micro Devices, Inc. | Power control of circuit modules within an integrated circuit |
US6070140A (en) | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5828997A (en) | 1995-06-07 | 1998-10-27 | Sensimetrics Corporation | Content analyzer mixing inverse-direction-probability-weighted noise to input signal |
EP0766494B1 (en) * | 1995-09-29 | 2002-08-14 | STMicroelectronics S.r.l. | Digital microphonic device |
DE19546168C1 (de) | 1995-12-11 | 1997-02-20 | Siemens Ag | Digitale Signalprozessor-Anordnung zum Vergleich von Merkmalsvektoren und deren Verwendung sowie zugehöriges Betriebsverfahren |
US5825898A (en) | 1996-06-27 | 1998-10-20 | Lamar Signal Processing Ltd. | System and method for adaptive interference cancelling |
US5822598A (en) | 1996-07-12 | 1998-10-13 | Ast Research, Inc. | Audio activity detection circuit to increase battery life in portable computers |
JP3328532B2 (ja) | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
EP0867856B1 (fr) | 1997-03-25 | 2005-10-26 | Koninklijke Philips Electronics N.V. | "Méthode et dispositif de detection d'activité vocale" |
JP3541339B2 (ja) | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
JP3216704B2 (ja) | 1997-08-01 | 2001-10-09 | 日本電気株式会社 | 適応アレイ装置 |
US6057791A (en) | 1998-02-18 | 2000-05-02 | Oasis Design, Inc. | Apparatus and method for clocking digital and analog circuits on a common substrate to enhance digital operation and reduce analog sampling error |
SE512228C2 (sv) | 1998-06-24 | 2000-02-14 | Bjoern Svedberg | Förfarande och anordning för magnetisk orientering av fibrer |
JP2000174615A (ja) | 1998-11-27 | 2000-06-23 | Renyo Handotai Kofun Yugenkoshi | 集積回路の内部クロック周波数を自動補正する方法と装置 |
US6381570B2 (en) | 1999-02-12 | 2002-04-30 | Telogy Networks, Inc. | Adaptive two-threshold method for discriminating noise from speech in a communication signal |
US6249757B1 (en) | 1999-02-16 | 2001-06-19 | 3Com Corporation | System for detecting voice activity |
US6549587B1 (en) | 1999-09-20 | 2003-04-15 | Broadcom Corporation | Voice and data exchange over a packet based network with timing recovery |
EP1081685A3 (en) | 1999-09-01 | 2002-04-24 | TRW Inc. | System and method for noise reduction using a single microphone |
US6594367B1 (en) | 1999-10-25 | 2003-07-15 | Andrea Electronics Corporation | Super directional beamforming design and implementation |
US6397186B1 (en) | 1999-12-22 | 2002-05-28 | Ambush Interactive, Inc. | Hands-free, voice-operated remote control transmitter |
AU2001259446A1 (en) | 2000-05-02 | 2001-11-12 | Dragon Systems, Inc. | Error correction in speech recognition |
US7346176B1 (en) | 2000-05-11 | 2008-03-18 | Plantronics, Inc. | Auto-adjust noise canceling microphone with position sensor |
EP1304016B1 (en) | 2000-07-05 | 2004-09-22 | Koninklijke Philips Electronics N.V. | A/d converter with integrated biasing for a microphone |
US6829244B1 (en) | 2000-12-11 | 2004-12-07 | Cisco Technology, Inc. | Mechanism for modem pass-through with non-synchronized gateway clocks |
US20030004720A1 (en) | 2001-01-30 | 2003-01-02 | Harinath Garudadri | System and method for computing and transmitting parameters in a distributed voice recognition system |
WO2002069890A2 (en) | 2001-03-02 | 2002-09-12 | Regeneron Pharmaceuticals, Inc. | Methods of identifying agents affecting atrophy and hypertrophy |
US6876859B2 (en) | 2001-07-18 | 2005-04-05 | Trueposition, Inc. | Method for estimating TDOA and FDOA in a wireless location system |
DE10160830A1 (de) | 2001-12-11 | 2003-06-26 | Infineon Technologies Ag | Mikromechanische Sensoren und Verfahren zur Herstellung derselben |
WO2007106399A2 (en) | 2006-03-10 | 2007-09-20 | Mh Acoustics, Llc | Noise-reducing directional microphone array |
US8098844B2 (en) | 2002-02-05 | 2012-01-17 | Mh Acoustics, Llc | Dual-microphone spatial noise suppression |
US20030171907A1 (en) | 2002-03-06 | 2003-09-11 | Shay Gal-On | Methods and Apparatus for Optimizing Applications on Configurable Processors |
US6756700B2 (en) | 2002-03-13 | 2004-06-29 | Kye Systems Corp. | Sound-activated wake-up device for electronic input devices having a sleep-mode |
US7319959B1 (en) | 2002-05-14 | 2008-01-15 | Audience, Inc. | Multi-source phoneme classification for noise-robust automatic speech recognition |
WO2004021587A1 (en) | 2002-08-29 | 2004-03-11 | Bae Systems Information And Electronic Systems Integration, Inc. | Method for separating interferering signals and computing arrival angles |
KR100477699B1 (ko) | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
WO2005004113A1 (ja) | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
US7386451B2 (en) | 2003-09-11 | 2008-06-10 | Microsoft Corporation | Optimization of an objective measure for estimating mean opinion score of synthesized speech |
GB2405949A (en) | 2003-09-12 | 2005-03-16 | Canon Kk | Voice activated device with periodicity determination |
US7418392B1 (en) | 2003-09-25 | 2008-08-26 | Sensory, Inc. | System and method for controlling the operation of a device by voice commands |
US20050078841A1 (en) | 2003-10-14 | 2005-04-14 | Boor Steven E. | Method and apparatus for resetting a buffer amplifier |
EP1690437B1 (en) | 2003-11-24 | 2011-01-12 | Epcos Pte Ltd | Microphone comprising integral multi-level quantizer and single-bit conversion means |
US7636855B2 (en) | 2004-01-30 | 2009-12-22 | Panasonic Corporation | Multiple choice challenge-response user authorization system and method |
EP1714385A1 (en) | 2004-02-09 | 2006-10-25 | Audioasics A/S | Digital microphone |
DE102004011149B3 (de) | 2004-03-08 | 2005-11-10 | Infineon Technologies Ag | Mikrophon und Verfahren zur Herstellung eines Mikrophons |
US7957542B2 (en) | 2004-04-28 | 2011-06-07 | Koninklijke Philips Electronics N.V. | Adaptive beamformer, sidelobe canceller, handsfree speech communication device |
AU2005253600B2 (en) | 2004-06-04 | 2011-01-27 | Benjamin Firooz Ghassabian | Systems to enhance data entry in mobile and fixed environment |
US20060013415A1 (en) | 2004-07-15 | 2006-01-19 | Winchester Charles E | Voice activation and transmission system |
US20060074658A1 (en) | 2004-10-01 | 2006-04-06 | Siemens Information And Communication Mobile, Llc | Systems and methods for hands-free voice-activated devices |
US7372316B2 (en) | 2004-11-25 | 2008-05-13 | Stmicroelectronics Pvt. Ltd. | Temperature compensated reference current generator |
US7268006B2 (en) | 2004-12-30 | 2007-09-11 | E.I. Du Pont De Nemours And Company | Electronic device including a guest material within a layer and a process for forming the same |
US7102452B1 (en) | 2004-12-31 | 2006-09-05 | Zilog, Inc. | Temperature-compensated RC oscillator |
US7795695B2 (en) | 2005-01-27 | 2010-09-14 | Analog Devices, Inc. | Integrated microphone |
DE102005008511B4 (de) | 2005-02-24 | 2019-09-12 | Tdk Corporation | MEMS-Mikrofon |
US7825484B2 (en) | 2005-04-25 | 2010-11-02 | Analog Devices, Inc. | Micromachined microphone and multisensor and method for producing same |
CN101288337B (zh) | 2005-07-19 | 2012-11-21 | 美国亚德诺半导体公司 | 可编程麦克风 |
EP1923866B1 (en) | 2005-08-11 | 2014-01-01 | Asahi Kasei Kabushiki Kaisha | Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program |
SG130158A1 (en) | 2005-08-20 | 2007-03-20 | Bse Co Ltd | Silicon based condenser microphone and packaging method for the same |
US20070053522A1 (en) | 2005-09-08 | 2007-03-08 | Murray Daniel J | Method and apparatus for directional enhancement of speech elements in noisy environments |
WO2007028250A2 (en) | 2005-09-09 | 2007-03-15 | Mcmaster University | Method and device for binaural signal enhancement |
JP4742226B2 (ja) | 2005-09-28 | 2011-08-10 | 国立大学法人九州大学 | 能動消音制御装置及び方法 |
US7813923B2 (en) | 2005-10-14 | 2010-10-12 | Microsoft Corporation | Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset |
DE102005053765B4 (de) | 2005-11-10 | 2016-04-14 | Epcos Ag | MEMS-Package und Verfahren zur Herstellung |
DE102005053767B4 (de) | 2005-11-10 | 2014-10-30 | Epcos Ag | MEMS-Mikrofon, Verfahren zur Herstellung und Verfahren zum Einbau |
US7856283B2 (en) | 2005-12-13 | 2010-12-21 | Sigmatel, Inc. | Digital microphone interface, audio codec and methods for use therewith |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US8194880B2 (en) * | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
JP5040909B2 (ja) | 2006-02-23 | 2012-10-03 | 日本電気株式会社 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
GB0605576D0 (en) | 2006-03-20 | 2006-04-26 | Oligon Ltd | MEMS device |
US8180067B2 (en) | 2006-04-28 | 2012-05-15 | Harman International Industries, Incorporated | System for selectively extracting components of an audio input signal |
KR100722686B1 (ko) | 2006-05-09 | 2007-05-30 | 주식회사 비에스이 | 부가적인 백 챔버를 갖고 기판에 음향홀이 형성된 실리콘콘덴서 마이크로폰 |
US20070274297A1 (en) | 2006-05-10 | 2007-11-29 | Cross Charles W Jr | Streaming audio from a full-duplex network through a half-duplex device |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US7546498B1 (en) | 2006-06-02 | 2009-06-09 | Lattice Semiconductor Corporation | Programmable logic devices with custom identification systems and methods |
EP2036396B1 (en) | 2006-06-23 | 2009-12-02 | GN ReSound A/S | A hearing instrument with adaptive directional signal processing |
US7957972B2 (en) | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
US8214202B2 (en) | 2006-09-13 | 2012-07-03 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for a speech/audio sender and receiver |
WO2008066836A1 (en) | 2006-11-28 | 2008-06-05 | Treyex Llc | Method and apparatus for translating speech during a call |
US20080175425A1 (en) | 2006-11-30 | 2008-07-24 | Analog Devices, Inc. | Microphone System with Silicon Microphone Secured to Package Lid |
ATE403928T1 (de) | 2006-12-14 | 2008-08-15 | Harman Becker Automotive Sys | Sprachdialogkontrolle basierend auf signalvorverarbeitung |
TWI327357B (en) | 2007-01-10 | 2010-07-11 | Advanced Semiconductor Eng | Mems microphone package and method thereof |
US7986794B2 (en) | 2007-01-11 | 2011-07-26 | Fortemedia, Inc. | Small array microphone apparatus and beam forming method thereof |
JP5401760B2 (ja) | 2007-02-05 | 2014-01-29 | ソニー株式会社 | ヘッドフォン装置、音声再生システム、音声再生方法 |
US8099288B2 (en) | 2007-02-12 | 2012-01-17 | Microsoft Corp. | Text-dependent speaker verification |
US8005238B2 (en) | 2007-03-22 | 2011-08-23 | Microsoft Corporation | Robust adaptive beamforming with enhanced noise suppression |
US7873114B2 (en) | 2007-03-29 | 2011-01-18 | Motorola Mobility, Inc. | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate |
US7769585B2 (en) * | 2007-04-05 | 2010-08-03 | Avidyne Corporation | System and method of voice activity detection in noisy environments |
TWI323242B (en) | 2007-05-15 | 2010-04-11 | Ind Tech Res Inst | Package and packageing assembly of microelectromechanical system microphone |
JP5056157B2 (ja) * | 2007-05-18 | 2012-10-24 | ソニー株式会社 | ノイズ低減回路 |
US20090012786A1 (en) | 2007-07-06 | 2009-01-08 | Texas Instruments Incorporated | Adaptive Noise Cancellation |
US7817808B2 (en) | 2007-07-19 | 2010-10-19 | Alon Konchitsky | Dual adaptive structure for speech enhancement |
DE602007003220D1 (de) | 2007-08-13 | 2009-12-24 | Harman Becker Automotive Sys | Rauschverringerung mittels Kombination aus Strahlformung und Nachfilterung |
US8155346B2 (en) | 2007-10-01 | 2012-04-10 | Panasonic Corpration | Audio source direction detecting device |
US8175291B2 (en) | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
TWM341025U (en) | 2008-01-10 | 2008-09-21 | Lingsen Precision Ind Ltd | Micro electro-mechanical microphone package structure |
US8554551B2 (en) | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
KR100911866B1 (ko) | 2008-04-14 | 2009-08-11 | 주식회사 하이닉스반도체 | 내부전압 생성회로를 포함하는 반도체 메모리장치 |
US8244528B2 (en) | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
JP5804943B2 (ja) | 2008-05-05 | 2015-11-04 | エプコス ピーティーイー リミテッド | 高速で精密な電荷ポンプ |
ES2582232T3 (es) * | 2008-06-30 | 2016-09-09 | Dolby Laboratories Licensing Corporation | Detector de actividad de voz de múltiples micrófonos |
US7619551B1 (en) | 2008-07-29 | 2009-11-17 | Fortemedia, Inc. | Audio codec, digital device and voice processing method |
WO2010022453A1 (en) | 2008-08-29 | 2010-03-04 | Dev-Audio Pty Ltd | A microphone array system and method for sound acquisition |
US8193596B2 (en) | 2008-09-03 | 2012-06-05 | Solid State System Co., Ltd. | Micro-electro-mechanical systems (MEMS) package |
US8712776B2 (en) | 2008-09-29 | 2014-04-29 | Apple Inc. | Systems and methods for selective text to speech synthesis |
US8352272B2 (en) | 2008-09-29 | 2013-01-08 | Apple Inc. | Systems and methods for text to speech synthesis |
US8724829B2 (en) | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
EP2359361B1 (en) | 2008-10-30 | 2018-07-04 | Telefonaktiebolaget LM Ericsson (publ) | Telephony content signal discrimination |
US8111843B2 (en) | 2008-11-11 | 2012-02-07 | Motorola Solutions, Inc. | Compensation for nonuniform delayed group communications |
CN102224675B (zh) | 2008-11-25 | 2014-04-02 | 应美盛股份有限公司 | 动态偏置放大器 |
US8351634B2 (en) | 2008-11-26 | 2013-01-08 | Analog Devices, Inc. | Side-ported MEMS microphone assembly |
US8170238B2 (en) * | 2008-12-02 | 2012-05-01 | Fortemedia, Inc. | Integrated circuit attached to microphone |
US8472648B2 (en) | 2009-01-20 | 2013-06-25 | General Mems Corporation | Miniature MEMS condenser microphone package and fabrication method thereof |
US8325951B2 (en) | 2009-01-20 | 2012-12-04 | General Mems Corporation | Miniature MEMS condenser microphone packages and fabrication method thereof |
US8184822B2 (en) | 2009-04-28 | 2012-05-22 | Bose Corporation | ANR signal processing topology |
CN201438743U (zh) | 2009-05-15 | 2010-04-14 | 瑞声声学科技(常州)有限公司 | 麦克风 |
AU2010251756A1 (en) | 2009-05-19 | 2012-01-12 | Moip Pty Ltd | Communications apparatus, system and method |
US9083288B2 (en) * | 2009-06-11 | 2015-07-14 | Invensense, Inc. | High level capable audio amplification circuit |
US9547642B2 (en) | 2009-06-17 | 2017-01-17 | Empire Technology Development Llc | Voice to text to voice processing |
CN101651917A (zh) | 2009-06-19 | 2010-02-17 | 瑞声声学科技(深圳)有限公司 | 电容麦克风 |
CN101651913A (zh) | 2009-06-19 | 2010-02-17 | 瑞声声学科技(深圳)有限公司 | 麦克风 |
CN101959106A (zh) | 2009-07-16 | 2011-01-26 | 鸿富锦精密工业(深圳)有限公司 | 微机电系统麦克风的封装结构及其封装方法 |
US8275148B2 (en) | 2009-07-28 | 2012-09-25 | Fortemedia, Inc. | Audio processing apparatus and method |
GB2473267A (en) | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
US8787591B2 (en) * | 2009-09-11 | 2014-07-22 | Texas Instruments Incorporated | Method and system for interference suppression using blind source separation |
CN101765047A (zh) | 2009-09-28 | 2010-06-30 | 瑞声声学科技(深圳)有限公司 | 电容麦克风及其制作方法 |
US20110099010A1 (en) | 2009-10-22 | 2011-04-28 | Broadcom Corporation | Multi-channel noise suppression system |
US8261011B2 (en) | 2009-10-29 | 2012-09-04 | Freescale Semiconductor, Inc. | One-time programmable memory device and methods thereof |
US8626498B2 (en) | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
JP5533042B2 (ja) | 2010-03-04 | 2014-06-25 | 富士通株式会社 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
US8606571B1 (en) | 2010-04-19 | 2013-12-10 | Audience, Inc. | Spatial selectivity noise reduction tradeoff for multi-microphone systems |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8958572B1 (en) | 2010-04-19 | 2015-02-17 | Audience, Inc. | Adaptive noise cancellation for multi-microphone systems |
US8515089B2 (en) | 2010-06-04 | 2013-08-20 | Apple Inc. | Active noise cancellation decisions in a portable audio device |
JP5529635B2 (ja) * | 2010-06-10 | 2014-06-25 | キヤノン株式会社 | 音声信号処理装置および音声信号処理方法 |
US8447045B1 (en) | 2010-09-07 | 2013-05-21 | Audience, Inc. | Multi-microphone active noise cancellation system |
TWI446141B (zh) | 2010-11-09 | 2014-07-21 | Nuvoton Technology Corp | 時脈校正方法與裝置以及電子裝置 |
EP2494545A4 (en) | 2010-12-24 | 2012-11-21 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES |
CN102568480A (zh) | 2010-12-27 | 2012-07-11 | 深圳富泰宏精密工业有限公司 | 双模手机语音传输系统 |
GB2501633A (en) | 2011-01-05 | 2013-10-30 | Health Fidelity Inc | A voice based system and method for data input |
JP5621601B2 (ja) | 2011-01-12 | 2014-11-12 | 株式会社リコー | ボリューム調整回路 |
US20130058495A1 (en) | 2011-09-01 | 2013-03-07 | Claus Erdmann Furst | System and A Method For Streaming PDM Data From Or To At Least One Audio Component |
US8996381B2 (en) | 2011-09-27 | 2015-03-31 | Sensory, Incorporated | Background speech recognition assistant |
US8666751B2 (en) | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
US9424849B2 (en) * | 2011-12-14 | 2016-08-23 | Cirrus Logic, Inc. | Data transfer |
US9208772B2 (en) * | 2011-12-23 | 2015-12-08 | Bose Corporation | Communications headset speech-based gain control |
US9337722B2 (en) | 2012-01-27 | 2016-05-10 | Invensense, Inc. | Fast power-up bias voltage circuit |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
US9431012B2 (en) | 2012-04-30 | 2016-08-30 | 2236008 Ontario Inc. | Post processing of natural language automatic speech recognition |
US9093076B2 (en) | 2012-04-30 | 2015-07-28 | 2236008 Ontario Inc. | Multipass ASR controlling multiple applications |
US9479275B2 (en) | 2012-06-01 | 2016-10-25 | Blackberry Limited | Multiformat digital audio interface |
TWI474317B (zh) | 2012-07-06 | 2015-02-21 | Realtek Semiconductor Corp | 訊號處理裝置以及訊號處理方法 |
CN102983868B (zh) | 2012-11-02 | 2015-01-28 | 小米科技有限责任公司 | 信号处理方法、装置及系统 |
KR20140060040A (ko) * | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US9704486B2 (en) | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
CN103117065B (zh) | 2013-01-09 | 2015-09-30 | 上海大唐移动通信设备有限公司 | 平均意见评分语音测试装置及其控制方法、语音测试方法 |
WO2014134216A1 (en) | 2013-02-27 | 2014-09-04 | Audience, Inc. | Voice-controlled communication connections |
US10395651B2 (en) | 2013-02-28 | 2019-08-27 | Sony Corporation | Device and method for activating with voice input |
US9349386B2 (en) | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9112984B2 (en) | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US20140270259A1 (en) | 2013-03-13 | 2014-09-18 | Aliphcom | Speech detection using low power microelectrical mechanical systems sensor |
US9703350B2 (en) | 2013-03-15 | 2017-07-11 | Maxim Integrated Products, Inc. | Always-on low-power keyword spotting |
US20140316783A1 (en) | 2013-04-19 | 2014-10-23 | Eitan Asher Medina | Vocal keyword training from text |
EP2801974A3 (en) | 2013-05-09 | 2015-02-18 | DSP Group Ltd. | Low power activation of a voice activated device |
US20140343949A1 (en) | 2013-05-17 | 2014-11-20 | Fortemedia, Inc. | Smart microphone device |
US9111548B2 (en) | 2013-05-23 | 2015-08-18 | Knowles Electronics, Llc | Synchronization of buffered data in multiple microphones |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9984705B2 (en) | 2013-07-25 | 2018-05-29 | Dsp Group Ltd. | Non-intrusive quality measurements for use in enhancing audio quality |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US20150112690A1 (en) | 2013-10-22 | 2015-04-23 | Nvidia Corporation | Low power always-on voice trigger architecture |
US10079019B2 (en) | 2013-11-12 | 2018-09-18 | Apple Inc. | Always-on audio control for mobile device |
-
2016
- 2016-01-06 US US14/989,445 patent/US10045140B2/en active Active
- 2016-01-06 CN CN201680004787.6A patent/CN107112012B/zh not_active Expired - Fee Related
- 2016-01-06 DE DE112016000287.4T patent/DE112016000287T5/de not_active Withdrawn
- 2016-01-06 WO PCT/US2016/012349 patent/WO2016112113A1/en active Application Filing
- 2016-01-07 TW TW105100429A patent/TW201629950A/zh unknown
-
2018
- 2018-07-23 US US16/043,105 patent/US10469967B2/en active Active
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11983463B2 (en) | 2016-02-22 | 2024-05-14 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US11947870B2 (en) | 2016-02-22 | 2024-04-02 | Sonos, Inc. | Audio response playback |
US11750969B2 (en) | 2016-02-22 | 2023-09-05 | Sonos, Inc. | Default playback device designation |
US11863593B2 (en) | 2016-02-22 | 2024-01-02 | Sonos, Inc. | Networked microphone device control |
US12047752B2 (en) | 2016-02-22 | 2024-07-23 | Sonos, Inc. | Content mixing |
US11832068B2 (en) | 2016-02-22 | 2023-11-28 | Sonos, Inc. | Music service selection |
US12080314B2 (en) | 2016-06-09 | 2024-09-03 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US11979960B2 (en) | 2016-07-15 | 2024-05-07 | Sonos, Inc. | Contextualization of voice inputs |
US11934742B2 (en) | 2016-08-05 | 2024-03-19 | Sonos, Inc. | Playback device supporting concurrent voice assistants |
US11727933B2 (en) | 2016-10-19 | 2023-08-15 | Sonos, Inc. | Arbitration-based voice recognition |
TWI690919B (zh) * | 2017-05-27 | 2020-04-11 | 大陸商騰訊科技(深圳)有限公司 | 語音關鍵字識別方法、裝置、終端、伺服器、電腦可讀儲存介質及電腦程式產品 |
CN111194439B (zh) * | 2017-08-07 | 2023-07-07 | 搜诺思公司 | 唤醒词检测抑制 |
CN111194439A (zh) * | 2017-08-07 | 2020-05-22 | 搜诺思公司 | 唤醒词检测抑制 |
US11900937B2 (en) | 2017-08-07 | 2024-02-13 | Sonos, Inc. | Wake-word detection suppression |
US11816393B2 (en) | 2017-09-08 | 2023-11-14 | Sonos, Inc. | Dynamic computation of system response volume |
US11817076B2 (en) | 2017-09-28 | 2023-11-14 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US12047753B1 (en) | 2017-09-28 | 2024-07-23 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US11893308B2 (en) | 2017-09-29 | 2024-02-06 | Sonos, Inc. | Media playback system with concurrent voice assistance |
US11797263B2 (en) | 2018-05-10 | 2023-10-24 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US11792590B2 (en) | 2018-05-25 | 2023-10-17 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US11973893B2 (en) | 2018-08-28 | 2024-04-30 | Sonos, Inc. | Do not disturb feature for audio notifications |
US11778259B2 (en) | 2018-09-14 | 2023-10-03 | Sonos, Inc. | Networked devices, systems and methods for associating playback devices based on sound codes |
US11790937B2 (en) | 2018-09-21 | 2023-10-17 | Sonos, Inc. | Voice detection optimization using sound metadata |
US11790911B2 (en) | 2018-09-28 | 2023-10-17 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US12062383B2 (en) | 2018-09-29 | 2024-08-13 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US11881223B2 (en) | 2018-12-07 | 2024-01-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11817083B2 (en) | 2018-12-13 | 2023-11-14 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US12063486B2 (en) | 2018-12-20 | 2024-08-13 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
US11798553B2 (en) | 2019-05-03 | 2023-10-24 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
US11854547B2 (en) | 2019-06-12 | 2023-12-26 | Sonos, Inc. | Network microphone device with command keyword eventing |
US12093608B2 (en) | 2019-07-31 | 2024-09-17 | Sonos, Inc. | Noise classification for event detection |
US11862161B2 (en) | 2019-10-22 | 2024-01-02 | Sonos, Inc. | VAS toggle based on device orientation |
US11869503B2 (en) | 2019-12-20 | 2024-01-09 | Sonos, Inc. | Offline voice control |
US11887598B2 (en) | 2020-01-07 | 2024-01-30 | Sonos, Inc. | Voice verification for media playback |
US12118273B2 (en) | 2020-01-31 | 2024-10-15 | Sonos, Inc. | Local voice data processing |
US11961519B2 (en) | 2020-02-07 | 2024-04-16 | Sonos, Inc. | Localized wakeword verification |
US11881222B2 (en) | 2020-05-20 | 2024-01-23 | Sonos, Inc | Command keywords with input detection windowing |
US12119000B2 (en) | 2020-05-20 | 2024-10-15 | Sonos, Inc. | Input detection windowing |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
Also Published As
Publication number | Publication date |
---|---|
US10045140B2 (en) | 2018-08-07 |
US20180332416A1 (en) | 2018-11-15 |
CN107112012B (zh) | 2020-11-20 |
US20160196838A1 (en) | 2016-07-07 |
DE112016000287T5 (de) | 2017-10-05 |
CN107112012A (zh) | 2017-08-29 |
WO2016112113A1 (en) | 2016-07-14 |
US10469967B2 (en) | 2019-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10469967B2 (en) | Utilizing digital microphones for low power keyword detection and noise suppression | |
US9978388B2 (en) | Systems and methods for restoration of speech components | |
US9668048B2 (en) | Contextual switching of microphones | |
JP6713035B2 (ja) | ファーフィールド音声機能の実現方法、設備、システム、記憶媒体及びプログラム | |
US20160162469A1 (en) | Dynamic Local ASR Vocabulary | |
JP7324753B2 (ja) | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 | |
US20210217433A1 (en) | Voice processing method and apparatus, and device | |
CN109155884B (zh) | 用于立体声分离和定向抑制的系统和方法 | |
TWI711035B (zh) | 方位角估計的方法、設備、語音交互系統及儲存介質 | |
US9953634B1 (en) | Passive training for automatic speech recognition | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
WO2016094418A1 (en) | Dynamic local asr vocabulary | |
US20230037824A1 (en) | Methods for reducing error in environmental noise compensation systems | |
US9508345B1 (en) | Continuous voice sensing | |
US20170206898A1 (en) | Systems and methods for assisting automatic speech recognition | |
US20180277134A1 (en) | Key Click Suppression | |
US20150249884A1 (en) | Post-processed reference path for acoustic echo cancellation | |
CN111147655B (zh) | 模型生成方法和装置 | |
WO2020107385A1 (zh) | 增益处理方法及其装置、电子设备、信号采集方法及其系统 | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
CN113593619B (zh) | 用于录制音频的方法、装置、设备和介质 | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
US20230298612A1 (en) | Microphone Array Configuration Invariant, Streaming, Multichannel Neural Enhancement Frontend for Automatic Speech Recognition | |
CN111145792B (zh) | 音频处理方法和装置 | |
CN114203136A (zh) | 回声消除方法、语音识别方法、语音唤醒方法和装置 |