TW201629950A - 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 - Google Patents

針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 Download PDF

Info

Publication number
TW201629950A
TW201629950A TW105100429A TW105100429A TW201629950A TW 201629950 A TW201629950 A TW 201629950A TW 105100429 A TW105100429 A TW 105100429A TW 105100429 A TW105100429 A TW 105100429A TW 201629950 A TW201629950 A TW 201629950A
Authority
TW
Taiwan
Prior art keywords
acoustic signal
microphone
data
clock frequency
dmic
Prior art date
Application number
TW105100429A
Other languages
English (en)
Inventor
大衛P 羅素
尼爾D 沃倫
Original Assignee
樓氏電子有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 樓氏電子有限公司 filed Critical 樓氏電子有限公司
Publication of TW201629950A publication Critical patent/TW201629950A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)

Abstract

本發明提供用於在低功耗關鍵字偵測及雜訊抑制中利用數位麥克風之系統及方法。一實例性方法包含接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音。該第一聲學信號包含以一第一時脈頻率傳輸之緩衝資料。該數位麥克風可提供話音活動偵測。該實例性方法亦包含接收至少一個第二聲學信號,其表示藉由一第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料。該第一及該第二聲學信號提供至一音訊處理系統,其可包含雜訊抑制及關鍵字偵測。可以一更高、第二時脈頻率發送緩衝部分以自該第二聲學信號消除該第一聲學信號之一延遲。提供該等信號亦可包含延遲該第二聲學信號。

Description

針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 [相關申請案之交叉參考]
本申請案主張2015年1月7日申請之美國臨時專利申請案第62/100,758號之權益。前述申請案之標的出於所有目的以引用的方式併入本文中。
本申請案大體上係關於音訊處理且更具體而言,係關於用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之系統及方法。
關鍵字偵測之一典型方法係一個三階段程序。第一階段係發聲偵測。首先,一極低功耗「永遠開啟」實施方案不斷監測周圍聲音且判定一個人是否開始說出一可能關鍵字(通常藉由偵測人類發聲)。當偵測到一可能關鍵字發聲時,第二階段開始。
第二階段執行關鍵字辨識。此操作消耗更多功耗,此係因為此操作比發聲偵測計算上更密集。當完成一說話之檢查(例如,關鍵字辨識)時,結果可係一關鍵字匹配(在此情況下將進入第三階段)或無匹配(在此情況下第一、最低功耗階段重新開始)。
第三階段係用於使用自動語音辨識(ASR)分析關鍵字辨識之後的任何語音。此第三階段係一非常計算密集程序且,因此,可大幅受益於對包含該語音之音訊之部分之信號雜訊比(SNR)之改良。該SNR通 常使用雜訊抑制(NS)信號處理最佳化,其可需要自多個麥克風獲得音訊輸入。
一數位麥克風(DMIC)之用途係熟知。該DMIC通常包含一信號處理部分。一數位信號處理器(DSP)係通常用以執行用於偵測關鍵字之計算。使得某一形式之數位信號處理器(DSP)在相同積體電路(晶片)上執行關鍵字偵測計算作為該DMIC自身之信號處理部分可具有系統功耗優點。例如,當在該第一階段中時,該DMIC可自一內部振盪器操作,因此,節省將一外部時脈供應至該DMIC之功耗及將DMIC資料輸出(通常為一脈衝密度調變(PDM)信號)傳輸至一外部DSP裝置之功耗。
亦已知在該DMIC上實施關鍵字辨識之後續階段對於最低功耗或系統成本可不係最佳。關鍵字辨識之後續階段係計算密集且,因此,消耗顯著動態功耗及晶粒區域。然而,DMIC信號處理晶片通常使用具有比最佳可用數位程序顯著更高之動態功耗及每閘或每記憶體位元更大區域之一程序幾何結構來實施。
找到一最佳實施方案(其利用在DMIC中實施關鍵字辨識之該第一階段之潛在功耗節省)可起因於衝突要求而有挑戰性。為最佳化功耗,DMIC以一「永遠開啟」分立方式操作,而無需在未偵測到發聲時將音訊資料傳輸至一外部裝置。當偵測到發聲時,DMIC需要提供一信號至一外部裝置來指示此情況。與此情況之發生同時或在此情況之發生之後,DMIC需要開始提供音訊資料至(若干)外部裝置來執行後續階段。最佳地,音訊資料介面需要滿足以下要求:傳輸對應於時間(其顯著在發聲偵測之前)的音訊資料、以一外部提供的時脈(樣品)速率傳輸即時音訊資料、且簡化多麥克風雜訊抑制處理。另外,與針對實施關鍵字辨識之該第一階段之DMIC的即時音訊資料相關聯的延時需要實質上與針對習知DMIC之延時相同,該介面需要與現有介面 相容、該接面需要指示當使用該內部振盪器操作時使用之該時脈(樣品)速率、且不應該發生音訊漏失。
具有實施關鍵字辨識之該第一階段之一DMIC的一介面可在很大程度上起因於呈現在發聲偵測之前顯著緩衝之音訊資料之要求而有挑戰性。此緩衝音訊資料先前以藉由該內部振盪器判定之一取樣率獲取。因此,當該緩衝音訊資料連同即時音訊資料一起提供為一單一、相連音訊串流之部分時,可難以使得此即時音訊資料具有與一習知DMIC中之延時相同的延時或難以使用習知多麥克風雜訊抑制技術。
此「發明內容」經提供以介紹在下文「實施方式」中進一步描述之以一簡化形式之概念之一選擇。此「發明內容」不意欲識別所申請之標的之關鍵特徵或基本特徵,亦不意欲用作為判定所申請之標的之範疇之一援助。
本發明提供用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之系統及方法。一實例性方法包含接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料。該實例性方法亦包含接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音。該至少一個第二聲學信號可包含即時資料。在一些實施例中,該至少一個第二麥克風可係一類比麥克風。該至少一個第二麥克風亦可係不具有話音活動偵測功能性之一數位麥克風。
該實例性方法進一步包含將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。該音訊處理系統可至少提供雜訊抑制。
在一些實施例中,發送具有高於該第一時脈頻率的一第二時脈頻率之該緩衝資料以自該第二聲學信號消除該第一聲學信號之一延 遲。
提供該等信號可包含延遲該第二聲學信號。
將自結合以下圖式之以下描述明白本發明之其他實例性實施例及態樣。
100‧‧‧實例性系統/系統
110‧‧‧行動裝置
120‧‧‧麥克風/數位麥克風
130‧‧‧基於雲端之計算資源/計算雲端/雲端
150‧‧‧使用者
160‧‧‧雜訊
210‧‧‧處理器
220‧‧‧音訊處理系統
230‧‧‧記憶體儲存器
240‧‧‧通信裝置
300‧‧‧系統
302‧‧‧傳感器
304‧‧‧放大器
306‧‧‧類比轉數位轉換器
308‧‧‧脈衝密度調變器
310‧‧‧緩衝器
312‧‧‧時脈(CLK)輸入/CLK線
314‧‧‧資料(DATA)輸出
316‧‧‧額外發聲偵測器(DET)輸出/DET線
320‧‧‧發聲偵測器
350‧‧‧(外部或主機)DSP/DSP/主機DSP
500‧‧‧例示性電腦系統/電腦系統
510‧‧‧處理器單元
520‧‧‧主記憶體
530‧‧‧大量資料儲存器
540‧‧‧可攜式儲存裝置
550‧‧‧輸出裝置
560‧‧‧使用者輸入裝置
570‧‧‧圖形顯示器系統
580‧‧‧周邊裝置
590‧‧‧單一匯流排
實施例以實例的方式繪示且不限於附圖之圖中,在圖式中相似元件符號指示類似元件。
圖1係繪示根據各種實例性實施例之一系統之一方塊圖,該系統可用以實施用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之方法。
圖2係一實例性行動裝置之一方塊圖,其中可實踐用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之方法。
圖3係展示根據各種實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一系統的一方塊圖。
圖4係展示根據一實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一方法之步驟的一流程圖。
圖5係可用以實施所揭示之技術之實施例的一實例性電腦系統。
本發明提供用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風的實例性系統及方法。可使用經組態以至少捕獲音訊信號且可允許改良所捕獲的音訊中的自動語音辨識之行動音訊裝置來實踐本發明技術的各種實施例。
在各種實施例中,行動裝置係手持式裝置(諸如,筆記本電腦、平板電腦、平板手機、智慧型電話、個人數位助理、媒體播放器、行動電話、視訊攝影機及其類似者)。該等行動裝置可在靜止及可攜式環境中使用。該等靜止環境可包含住宅及商業建築及其類似者。例 如,該等靜止環境可進一步包含起居室、臥室、家庭影院、會議室、演藝廳、商業事務所及其類似者。可攜式環境可包含移動運載工具、移動個人、其他運輸構件及其類似者。
現在參考圖1,展示其中可實踐本發明之方法之一實例性系統100。系統100可包含一行動裝置110。在各種實施例中,行動裝置110包含經組態以自一使用者150接收話音輸入/聲學信號之(若干)麥克風(例如,(若干)傳感器)120。
話音輸入/聲學聲音可被一雜訊160污染。雜訊源可包含街道雜訊、周圍雜訊、來自除一(若干)預期揚聲器外之實體之語音及其類似者。例如,雜訊源可包含一工作空調、通風機、電視機、行動電話、立體音訊系統及其類似者。特定種類之雜訊可產生於機器(例如,汽車)與操作(例如)一道路、軌道、輪胎、輪、風扇、雨刷、引擎、排放裝置、娛樂系統、風、雨、波浪之環境之操作兩者及其類似雜訊。
在一些實施例中,行動裝置110交換地連接至一或多個基於雲端之計算資源130(亦稱為一(若干)計算雲端130或一雲端130)。(若干)基於雲端之計算資源130可包含在一遠端位置處可用且可在一網路(例如,網際網路或一蜂巢式電話網路)上存取的計算資源(硬體及軟體)。在各種實施例中,(若干)基於雲端之計算資源130由多個使用者共用且可基於需求動態地重新分配。(若干)基於雲端之計算資源130可包含一或多個伺服器場/群集,其包含電腦伺服器之一集合(其可與網路開關及/或路由器共置)。
圖2係展示根據各種實例性實施例之行動裝置110之組件的一方塊圖。在該繪示實施例中,行動裝置110包含一或多個麥克風120、一處理器210、音訊處理系統220、一記憶體儲存器230、及一或多個通信裝置240。在特定實施例中,行動裝置110亦包含行動裝置110之操作所需之額外或其他組件。在其他實施例中,行動裝置110包含執行與 參考圖2描述之該等功能相似或等效的功能之更少組件。
在各種實施例中,(其中(若干)麥克風120包含間隔較小(例如,相隔1cm至2cm)之全向麥克風),一光束形成技術可用以模擬一面向前及一面向後方向麥克風回應。在一些實施例中,可使用所模擬之面向前及面向後方向麥克風獲得一位準差異。該位準差異可用以在(例如)時間頻率域中之語音與雜訊之間辨別,其可進一步在雜訊及/或回聲減少中使用。雜訊減少可包含雜訊消除及/或雜訊抑制。在特定實施例中,一些麥克風120主要用以偵測語音且其他麥克風主要用以偵測雜訊。在其他實施例中,一些麥克風用以偵測雜訊與語音兩者。
在一些實施例中,一旦接收(例如,藉由(若干)麥克風120捕獲)聲學信號,聲學信號將轉換為電信號,電信號又藉由音訊處理系統220轉換為用於根據一些實施例來處理之數位信號。所處理之信號可傳輸至處理器210用於進一步處理。在一些實施例中,一些麥克風120係可操作以捕獲聲學信號且輸出一數位信號的(若干)數位麥克風。(若干)數位麥克風之一些數位麥克風可提供用於話音活動偵測(在本文中亦稱為發聲偵測)且用於顯著在該發聲偵測之前的音訊資料之緩衝。
音訊處理系統220可操作以處理一音訊信號。在一些實施例中,聲學信號藉由(若干)麥克風120捕獲。在特定實施例中,藉由(若干)麥克風120偵測之聲學信號藉由音訊處理系統220使用以將所要的語音(例如,關鍵字)與雜訊分離來提供更穩健的自動語音辨識(ASR)。
適於執行雜訊抑制之一實例性音訊處理系統在於2010年7月8日申請之名稱為「Method for Jointly Optimizing Noise Reduction and Voice Quality in a Mono or Multi-Microphone System」之美國專利申請案第12/832,901號(現為美國專利第8,473,287號,其出於所有目的以引用的方式併入本文中)中更詳細地討論。以實例的方式且無限制,在於2008年6月30日申請之名稱為「System and Method for Providing Noise Suppression Utilizing Null Processing Noise Subtraction」之美國專利申請案第12/215,980號(現為美國專利第9,185,487號)且在於2007年1月29日申請之名稱為「System and Method for Utilizing Omni-Directional Microphones for Speech Enhancement」之美國專利申請案第11/699,732號(現為美國專利第8,194,880號)中(其等全部內容以引用的方式併入本文中)描述雜訊抑制方法。
亦在共同指派的於2013年1月28日申請之名稱為「Restoration of Noise-Reduced Speech」之美國專利申請案第13/751,907號(現為美國專利第8,615,394號)(其全部內容以引用的方式併入本文中)中描述用於雜訊減少語音之恢復的各種方法。
處理器210可包含可操作以執行儲存在記憶體儲存器230中的電腦程式之硬體及/或軟體。處理器210可使用浮點運算、複數運算、及用於實施本發明之實施例所需之其他運算。在一些實施例中,行動裝置110之處理器210包含(例如)一數位信號處理器(DSP)、影像處理器、音訊處理器、通用處理器及其類似者之至少一者。
在各種實施例中,實例行動裝置110可操作以在一或多個有線或無線通信網路上(例如,經由通信裝置240)通信。在一些實施例中,行動裝置110在一有線或無線通信網路上發送至少音訊信號(語音)。在特定實施例中,行動裝置110囊封及/或編碼用於在一無線網絡(例如,一蜂巢式網路)上傳輸的至少一個數位信號。
該數位信號可在網際網路協定套組(TCP/IP)及/或使用者資料報協定(UDP)上囊封。有線及/或無線通信網路可係電路交換及/或封包交換。在各種實施例中,(若干)有線通信網路在電腦系統、軟體應用與使用者之間提供通信及資料交換,且包含任何數量之網路配接器、中繼器、集線器、開關、橋接器、路由器及防火牆。(若干)無線通信網路包含任何數量之無線存取點、基地台、中繼器及其類似者。有線 及/或無線通信網路可符合一(若干)行業標準(該行業標準係專屬)及其組合。可使用各種其他適合有線及/或無線通信網路、其他協定及其組合。
圖3係展示根據各種實例性實施例之適於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風的一系統300之一方塊圖。系統300包含耦合至一(外部或主機)DSP 350之(若干)麥克風(亦在本文中多樣地稱為(若干)DMIC)120。在一些實施例中,數位麥克風120包含一傳感器302、一放大器304、一類比轉數位轉換器306及一脈衝密度調變器(PDM)308。在特定實施例中,數位麥克風120包含一緩衝器310及一發聲偵測器320。在其他實施例中,DMIC 120與一習知立體DMIC介面介接。該習知立體DMIC介面包含一時脈(CLK)輸入(或CLK線)312及一資料(DATA)輸出314。該資料輸出包含一左頻道及一右頻道。在一些實施例中,該DMIC介面包含一額外發聲偵測器(DET)輸出(或DET線)316。CLK輸入312可藉由DSP 350供應。DSP 350可接收DATA輸出314及DET輸出316。在一些實施例中,數位麥克風120通常經由PDM 308產生一即時數位音訊資料串流。提供發聲偵測的一實例性數位麥克風在於2015年7月13日申請之名稱為「Microphone Apparatus and Method with Catch-up Buffer」之美國專利申請案第14797310號(其揭示內容出於所有目的以引用的方式併入本文中)中更詳細地討論。
實例1
在各種實施例中,在第一階段情況下,DMIC 120在一內部振盪器上操作,該內部振盪器判定在此情況期間之內部取樣率。在第一階段情況下,在發聲偵測之前,CLK線312係靜態(通常為一邏輯0)。DMIC 120在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自其內部振盪器操作之DMIC 120可操作以分 析音訊資料以判定是否已發生一發聲。內部地,DMIC 120將音訊資料緩衝至一再循環記憶體(例如,使用緩衝器310)中。在特定實施例中,該再循環記憶體具有一預定數量(通常為約100k PDM)之樣品。
在各種例示性實施例中,當DMIC 120偵測到一發聲時,DMIC 120開始在DET輸出316上輸出PDM 308樣品時脈(衍生自該內部振盪器)。DSP 350可操作以偵測DET線316上的活動。DSP 350可使用此信號判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,DSP 350可在CLK線312上輸出適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料之一時脈。在一些實施例中,該時脈係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由自該內部取樣率立即切換至所提供的CLK線312之取樣率而回應於CLK輸入312之存在。在特定實施例中,DMIC 120可操作以在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應即時PDM 308資料,且在第二(例如,右)頻道上供應延遲(通常約為100k PDM樣品)緩衝PDM 308資料。DMIC 120可在接收該CLK時停止在該DET信號上提供內部時脈。
在一些實施例中,在已傳輸整個(通常約為100k樣品)緩衝之後,DMIC 120切換至在DATA輸出314之第二(在該實例中,右)頻道上發送該即時音訊資料或一靜態信號(通常為一邏輯0)以節省功耗。
在各種實施例中,DSP 350累積緩衝資料且接著視需要使用先前量測的DMIC 120內部取樣率與主機CLK取樣率的比率而以將緩衝資料匹配至即時音訊資料之一方式處理緩衝資料。例如,DSP 350可將緩衝資料轉換為與主機CLK取樣率相同的速率。熟習此項技術者應瞭解實際取樣率轉換可能並非最佳。相反地,處理資訊之進一步下游頻率域可基於所量測的比率在頻率上偏置。緩衝資料可為關鍵字辨識之 目的預擱置至即時音訊資料。亦可視需要預擱置至用於ASR之資料。
在各種實施例中,因為即時音訊資料未延遲,所以該即時資料具有一低延時且可與來自用於雜訊抑制或其他目的之其他麥克風之該即時音訊資料組合。
將CLK信號返回至一靜態狀態可用以將DMIC 120返回至該第一階段處理狀態。
實例2
在第一階段情況下,DMIC 120在判定PDM 308取樣率之一內部振盪器上操作。在一些例示性實施例中,在第一階段情況下,在發聲偵測之前,CLK輸入312係靜態(通常為一邏輯0)。DMIC 120可在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自其內部振盪器操作之DMIC 120可操作以分析音訊資料以判定是否發生一發聲且亦內部地將音訊資料緩衝至一再循環記憶體中。該再循環記憶體可具有一預定數量(通常約為100k PDM)之樣品。
在一些實施例中,當DMIC 120偵測到發聲時,DMIC 120開始在DET輸出316上輸出一PDM取樣率時脈(衍生自其內部振盪器)。DSP 350可偵測DET線316上的活動。接著,DSP 350可使用DET輸出判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,DSP 350可在CLK線312上輸出一時脈。在特定實施例中,該時脈係以比內部振盪器取樣率更高的一速率,且適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料。在一些實施例中,提供至CLK線312的該時脈係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應緩衝PDM 308資料而回應於CLK線312 處之該時脈之存在。因為CLK頻率係大於內部取樣頻率,所以資料之延遲自緩衝長度逐漸減少至零。當該延遲達到零時,DMIC 120藉由將其取樣率自內部振盪器之取樣率立即切換至藉由CLK線312提供的速率而回應。DMIC 120亦可在DATA輸出314之頻道之一者上立即開始供應即時PDM 308資料。此刻,DMIC 120亦停止在DET輸出316信號上提供內部時脈。
在一些實施例中,DSP 350可累積緩衝資料且基於感測DET輸出316信號何時停止而判定DATA已自緩衝資料切換至即時音訊資料之一點。接著,DSP 350可使用先前量測的DMIC 120內部取樣率與CLK取樣率的比率來邏輯地取樣緩衝資料之轉換速率以匹配即時音訊資料之轉換速率。
在此實例中,一旦完全接收緩衝資料且已發生切換至即時音訊,即時音訊資料便將具有一低延時且可與來自用於雜訊抑制或其他目的之其他麥克風之該即時音訊資料組合。
與一些其他實施例比較,藉由實例2繪示之各種實施例可具有一缺點:自發聲偵測至即時操作需要一更長時間,其在該即時操作期間需要比階段一操作之速率更高的一速率,且亦可需要準確偵測在緩衝與即時音訊資料之間轉變的時間。
另一方面,根據實例2之各種實施例具有僅需要使用立體習知DMIC 120介面之一個頻道之優點,保留另一頻道可由一第二DMIC 120使用。
實例3
在第一階段情況下,DMIC 120可在判定PDM 308取樣率之一內部振盪器上操作。在第一階段情況下,在發聲偵測之前,CLK輸入312係靜態(通常在一邏輯0處)。DMIC 120在DATA輸出314與DET輸出316兩者上輸出一靜態信號(通常為一邏輯0)。內部地,自內部振盪器 操作之DMIC 120可操作以分析音訊資料以判定是否發生一發聲且亦藉由內部將彼資料緩衝至具有一預定數量(通常約為100k PDM)之樣品的一再循環記憶體(例如,緩衝器310)中。
當DMIC 120偵測到一發聲時,DMIC 120開始在DET輸出316上輸出PDM 308取樣率時脈(衍生自其內部振盪器)。DSP 350可偵測DET線316上的活動。接著,DSP 350可使用DET輸出316信號判定具有用於進一步運算的一足夠的準確度的DMIC 120之內部取樣率。接著,主機DSP 350可在CLK線312上輸出適於自DMIC 120經由習知DMIC 120介面協定接收即時PDM 308音訊資料的一時脈。此時脈可係以與用於雜訊抑制的其他DMIC之時脈相同的速率。
在一些實施例中,DMIC 120藉由在DATA輸出314之一第一頻道(例如,左頻道)上立即開始供應緩衝PDM 308資料而回應於CLK輸入312之存在。此刻,DMIC 120亦停止在DET輸出316信號上提供內部時脈。當資料之緩衝器310耗盡時,DMIC 120在DATA輸出314之頻道之一者上開始供應即時PDM 308資料。
DSP 350累積緩衝資料,基於計數所接收的樣品之數量而標記DATA已自緩衝資料切換至即時音訊資料之一點。接著,DSP 350使用先前量測的DMIC 120內部取樣率與CLK取樣率的比率來邏輯地取樣緩衝資料之轉換速率以匹配即時音訊資料之轉換速率。
在一些實施例中,即使在完全接收緩衝資料且已發生切換至即時音訊之後,DMIC 120資料仍保持在一高延時處。在一些實施例中,該延時等於樣品中的緩衝大小乘以CLK線312之取樣率。因為其他麥克風具有低延時,所以另一麥克風無法與此資料使用用於習知雜訊抑制。
在一些實施例中,來自麥克風之信號之間的不匹配藉由將一延遲添加至用於雜訊抑制的其他麥克風之各者而消除。在延遲之後,來 自DMIC 120及其他麥克風之串流可經組合用於雜訊抑制或其他目的。添加至其他麥克風的該延遲可基於DMIC 120之已知延遲特性(例如,起因於緩衝之延時等等)而判定或可(例如)基於比較自DMIC 120接收之音訊資料與自其他麥克風接收之音訊資料(例如,比較時序、取樣率時脈等等)而在演算法上量測。
與實例1之較佳實施例比較,實例3之各種實施例具有以下缺點:自發聲偵測至即時操作需要一更長時間,且當即時操作時,具有顯著額外延時。實例3之實施例具有僅需要使用立體習知DMIC介面之一個頻道之優點,保留另一頻道可由一第二DMIC使用。
圖4係繪示根據一實例性實施例之用於針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風之一方法400的一流程圖。在方塊402中,實例性方法400可以接收一聲學信號開始,該聲學信號表示由一數位麥克風捕獲之至少一個聲音。該聲學信號可包含在一單一頻道上傳輸之具有一第一(低)時脈頻率的緩衝資料。在方塊404中,實例性方法可繼續接收至少一個第二聲學信號,其表示由至少一個第二麥克風捕獲之該至少一個聲音。在各種實施例中,該至少一個第二聲學信號包含即時資料。
在方塊406中,緩衝資料可經分析以判定緩衝資料包含一話音。在方塊408中,實例性方法400可繼續發送具有一第二時脈頻率之緩衝資料以自該第二聲學信號消除該聲學信號之一延遲。該第二時脈頻率係高於該第一時脈頻率。在方塊410中,實例性方法400可將該第二聲學信號延遲一預定時間週期。可替代方塊408執行方塊410用於消除該延遲。在方塊412中,實例性方法400可繼續將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。該音訊處理系統可包含雜訊抑制及關鍵字偵測。
圖5繪示可用以實施本發明之一些實施例的一例示性電腦系統 500。圖5之電腦系統500可在計算系統、網路、伺服器或其組合之相似背景下實施。圖5之電腦系統500包含一或多個處理器單元510及主記憶體520。主記憶體520部分儲存用於藉由(若干)處理器單元510執行之指令及資料。在此實例中,主記憶體520在操作時儲存可執行碼。圖5之電腦系統500進一步包含一大量資料儲存器530、可攜式儲存裝置540、輸出裝置550、使用者輸入裝置560、一圖形顯示器系統570及周邊裝置580。
圖5中展示之組件係描繪為經由一單一匯流排590連接。該等組件可通過一或多個資料運輸構件連接。(若干)處理器單元510及主記憶體520經由一局部微處理器匯流排連接,且大量資料儲存器530、(若干)周邊裝置580、可攜式儲存裝置540及圖形顯示器系統570經由一或多個輸入/輸出(I/O)匯流排連接。
大量資料儲存器530(其可使用一磁碟驅動器、固態驅動器或一光碟驅動器實施)係用於儲存用於藉由(若干)處理器單元510使用之資料及指令的非揮發性儲存裝置。大量資料儲存器530儲存用於為將該系統軟體載入至主記憶體520中之目的而實施本發明之實施例的該軟體。
可攜式儲存裝置540結合一可攜式非揮發性儲存媒體(諸如一快閃驅動器、軟磁碟、光碟、數位視訊光碟或通用串列匯流排(USB)儲存裝置)一起操作以自圖5之電腦系統500輸入資料及碼且將資料及碼輸出至圖5之電腦系統500。用於實施本發明之實施例的該系統軟體儲存在此一可攜式媒體中且經由可攜式儲存裝置540輸入至電腦系統500。
使用者輸入裝置560可提供一使用者介面之一部分。使用者輸入裝置560可包含一或多個麥克風、一文數字小鍵盤(諸如一鍵盤,用於輸入文數字及其他資訊)、或一指向裝置(諸如一滑鼠、一軌跡球、記錄針或游標方向鍵)。使用者輸入裝置560亦可包含一觸控螢幕。另 外,如圖5中所展示之電腦系統500包含輸出裝置550。適合輸出裝置550包含揚聲器、印表機、網路介面及監測器。
圖形顯示器系統570包含一液晶顯示器(LCD)或其他適合顯示器裝置。圖形顯示器系統570可組態以接收文本及圖形資訊且處理用於輸出至該顯示器裝置之資訊。
周邊裝置580可包含電腦支持裝置之任何類型以添加額外功能性至該電腦系統。
在圖5之電腦系統500中提供之組件係通常存在於可適於與本發明之實施例一起使用且意欲表示此項技術中眾所周知之此等電腦組件之一寬泛類別的電腦系統中之組件。因此,圖5之電腦系統500可係一個人電腦(PC)、手持式電腦系統、電話、行動電腦系統、工作站、平板電腦、平板手機、行動電話、伺服器、小型電腦、主機電腦、隨身或任何其他電腦系統。電腦亦可包含不同匯流排組態,網路平台、多處理器平台及其類似者。可使用包含UNIX、LINUX、WINDOWS、MAC OS、PALM OS、QNX ANDROID、IOS、CHROME、TIZEN之各種作業系統及其他適合作業系統。
用於各種實施例之處理可在基於雲端的軟體中實施。在一些實施例中,電腦系統500實施為一基於雲端的計算環境(諸如在一計算雲端內操作的一虛擬機器)。在其他實施例中,電腦系統500可自身包含一基於雲端的計算環境,其中電腦系統500之功能性以一分佈式方式執行。因此,如將在下文中更詳細描述,當組態為一計算雲端時,電腦系統500可包含呈各種形式之複數個計算裝置。
一般而言,一基於雲端的計算環境係一資源,其通常組合處理器之一大分組(諸如在網頁伺服器內)之計算功耗及/或組合電腦記憶體或儲存裝置之一大分組之儲存容量。提供基於雲端的資源的系統可僅僅由其所有者利用或此等系統可被外部使用者(其在計算基礎建設內 部署應用以獲得大計算或儲存資源之益處)存取。
雲端可(例如)藉由網頁伺服器之一網路(該等網頁伺服器包括複數個計算裝置(諸如電腦系統500),其中各伺服器(或至少其複數個伺服器)提供處理器及/或儲存資源)形成。此等伺服器可管理由多個使用者(例如,雲端資源客戶或其他使用者)提供的工作負荷。通常,各使用者對雲端提出即時變動(有時大幅變動)之工作負荷需求。此等變動之本質及程度通常取決於與使用者相關聯的業務的類型。
上文參考實例性實施例描述本發明技術。因此,對實例性實施例之其他變動意欲由本發明涵蓋。

Claims (24)

  1. 一種用於音訊處理之方法,該方法包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
  2. 如請求項1之方法,其中該提供包含發送具有一第二時脈頻率之該緩衝資料用於自該至少一個第二聲學信號消除該第一聲學信號之一延遲,該第二時脈頻率係高於該第一時脈頻率。
  3. 如請求項1之方法,其中該提供包含將該至少一個第二聲學信號延遲一預定時間週期。
  4. 如請求項3之方法,其中基於該數位麥克風之一或多個特性判定該預定時間週期。
  5. 如請求項4之方法,其中該一或多個特性包含該數位麥克風之延時。
  6. 如請求項5之方法,其中該延時包含歸因於針對該緩衝資料之緩衝之延遲。
  7. 如請求項3之方法,其中基於比較該第一聲學信號與該至少一個第二聲學信號來判定該預定時間週期。
  8. 如請求項7之方法,其中該比較包括比較該第一聲學信號及該至少一個第二聲學信號之取樣率。
  9. 如請求項1之方法,其進一步包括,在該提供之前,接收已偵測話音活動之一指示。
  10. 如請求項9之方法,其中該指示藉由與該數位麥克風相關聯的一話音活動偵測器提供。
  11. 如請求項1之方法,其中該至少一個第二麥克風係一類比麥克風。
  12. 如請求項1之方法,其中該音訊處理系統基於該第一聲學信號及該至少一個第二聲學信號提供雜訊抑制。
  13. 如請求項12之方法,其中該雜訊抑制係基於該第一聲學信號與該至少一個第二聲學信號之間的位準差異。
  14. 如請求項1之方法,其中該第一聲學信號包含一脈衝密度調變(PDM)信號。
  15. 一種用於音訊處理之系統,該系統包括:一處理器;及一記憶體,其通信地與該處理器耦合,該記憶體儲存指令,當藉由該處理器執行時,該等指令執行一方法,其包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
  16. 如請求項15之系統,其中該音訊處理系統包含基於該第一聲學信號及該至少一個第二聲學信號之雜訊抑制及關鍵字偵測中之 至少一者。
  17. 如請求項15之系統,其中該提供包含發送具有一第二時脈頻率之該緩衝資料用於自該至少一個第二聲學信號消除該第一聲學信號之一延遲,該第二時脈頻率係高於該第一時脈頻率。
  18. 如請求項15之系統,其中該提供包含將該至少一個第二聲學信號延遲一預定時間週期。
  19. 如請求項18之系統,其中基於該數位麥克風之一或多個特性判定該預定時間週期。
  20. 如請求項18之系統,其中藉由比較該第一聲學信號與該至少一個第二聲學信號來判定該預定時間週期。
  21. 如請求項15之系統,其進一步包括,在該提供之前,接收已偵測話音活動之一指示。
  22. 如請求項21之系統,其中該指示藉由與該數位麥克風相關聯的一話音活動偵測器提供。
  23. 如請求項15之系統,其中該至少一個第二麥克風係一類比麥克風。
  24. 一種非暫態電腦可讀儲存媒體,其已於其上體現指令,當藉由至少一個處理器執行時,該等指令執行一方法之步驟,該方法包括:接收一第一聲學信號,其表示藉由一數位麥克風捕獲之至少一個聲音,該第一聲學信號包含在一單一頻道上傳輸之具有一第一時脈頻率之緩衝資料;接收至少一個第二聲學信號,其表示藉由至少一個第二麥克風捕獲之該至少一個聲音,該至少一個第二聲學信號包含即時資料;及 將該第一聲學信號及該至少一個第二聲學信號提供至一音訊處理系統。
TW105100429A 2015-01-07 2016-01-07 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風 TW201629950A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201562100758P 2015-01-07 2015-01-07

Publications (1)

Publication Number Publication Date
TW201629950A true TW201629950A (zh) 2016-08-16

Family

ID=56286839

Family Applications (1)

Application Number Title Priority Date Filing Date
TW105100429A TW201629950A (zh) 2015-01-07 2016-01-07 針對低功耗關鍵字偵測及雜訊抑制而利用數位麥克風

Country Status (5)

Country Link
US (2) US10045140B2 (zh)
CN (1) CN107112012B (zh)
DE (1) DE112016000287T5 (zh)
TW (1) TW201629950A (zh)
WO (1) WO2016112113A1 (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI690919B (zh) * 2017-05-27 2020-04-11 大陸商騰訊科技(深圳)有限公司 語音關鍵字識別方法、裝置、終端、伺服器、電腦可讀儲存介質及電腦程式產品
CN111194439A (zh) * 2017-08-07 2020-05-22 搜诺思公司 唤醒词检测抑制
US11727933B2 (en) 2016-10-19 2023-08-15 Sonos, Inc. Arbitration-based voice recognition
US11750969B2 (en) 2016-02-22 2023-09-05 Sonos, Inc. Default playback device designation
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11817083B2 (en) 2018-12-13 2023-11-14 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US11817076B2 (en) 2017-09-28 2023-11-14 Sonos, Inc. Multi-channel acoustic echo cancellation
US11816393B2 (en) 2017-09-08 2023-11-14 Sonos, Inc. Dynamic computation of system response volume
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US11863593B2 (en) 2016-02-22 2024-01-02 Sonos, Inc. Networked microphone device control
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
US11881222B2 (en) 2020-05-20 2024-01-23 Sonos, Inc Command keywords with input detection windowing
US11881223B2 (en) 2018-12-07 2024-01-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11887598B2 (en) 2020-01-07 2024-01-30 Sonos, Inc. Voice verification for media playback
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11934742B2 (en) 2016-08-05 2024-03-19 Sonos, Inc. Playback device supporting concurrent voice assistants
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11973893B2 (en) 2018-08-28 2024-04-30 Sonos, Inc. Do not disturb feature for audio notifications
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11983463B2 (en) 2016-02-22 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US12047753B1 (en) 2017-09-28 2024-07-23 Sonos, Inc. Three-dimensional beam forming with a microphone array
US12062383B2 (en) 2018-09-29 2024-08-13 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US12063486B2 (en) 2018-12-20 2024-08-13 Sonos, Inc. Optimization of network microphone devices using noise classification
US12080314B2 (en) 2016-06-09 2024-09-03 Sonos, Inc. Dynamic player selection for audio signal processing
US12093608B2 (en) 2019-07-31 2024-09-17 Sonos, Inc. Noise classification for event detection
US12118273B2 (en) 2020-01-31 2024-10-15 Sonos, Inc. Local voice data processing
US12119000B2 (en) 2020-05-20 2024-10-15 Sonos, Inc. Input detection windowing

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10360926B2 (en) 2014-07-10 2019-07-23 Analog Devices Global Unlimited Company Low-complexity voice activity detection
US10121472B2 (en) * 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US10262673B2 (en) 2017-02-13 2019-04-16 Knowles Electronics, Llc Soft-talk audio capture for mobile devices
US10366708B2 (en) 2017-03-20 2019-07-30 Bose Corporation Systems and methods of detecting speech activity of headphone user
US10499139B2 (en) 2017-03-20 2019-12-03 Bose Corporation Audio signal processing for noise reduction
US10311889B2 (en) 2017-03-20 2019-06-04 Bose Corporation Audio signal processing for noise reduction
US10424315B1 (en) 2017-03-20 2019-09-24 Bose Corporation Audio signal processing for noise reduction
US10249323B2 (en) 2017-05-31 2019-04-02 Bose Corporation Voice activity detection for communication headset
US10311874B2 (en) 2017-09-01 2019-06-04 4Q Catalyst, LLC Methods and systems for voice-based programming of a voice-controlled device
US10332543B1 (en) * 2018-03-12 2019-06-25 Cypress Semiconductor Corporation Systems and methods for capturing noise for pattern recognition processing
US10861462B2 (en) * 2018-03-12 2020-12-08 Cypress Semiconductor Corporation Dual pipeline architecture for wakeup phrase detection with speech onset detection
US10438605B1 (en) 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
WO2020028693A1 (en) * 2018-08-01 2020-02-06 Syntiant Sensor-processing systems including neuromorphic processing modules and methods thereof
US11049496B2 (en) * 2018-11-29 2021-06-29 Microsoft Technology Licensing, Llc Audio pipeline for simultaneous keyword spotting, transcription, and real time communications
US11335331B2 (en) 2019-07-26 2022-05-17 Knowles Electronics, Llc. Multibeam keyword detection system and method
CN110580919B (zh) * 2019-08-19 2021-09-28 东南大学 多噪声场景下语音特征提取方法及可重构语音特征提取装置
CN111199751B (zh) * 2020-03-04 2021-04-13 北京声智科技有限公司 一种麦克风的屏蔽方法、装置和电子设备

Family Cites Families (183)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3989897A (en) 1974-10-25 1976-11-02 Carver R W Method and apparatus for reducing noise content in audio signals
US4831558A (en) 1986-08-26 1989-05-16 The Slope Indicator Company Digitally based system for monitoring physical phenomena
US4812996A (en) 1986-11-26 1989-03-14 Tektronix, Inc. Signal viewing instrumentation control system
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8910981D0 (en) 1989-05-12 1989-06-28 Hi Med Instr Limited Digital waveform encoder and generator
JPH0566795A (ja) 1991-09-06 1993-03-19 Gijutsu Kenkyu Kumiai Iryo Fukushi Kiki Kenkyusho 雑音抑圧装置とその調整装置
JP3176474B2 (ja) 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
US5555287A (en) 1992-07-21 1996-09-10 Advanced Micro Devices, Inc. Integrated circuit and cordless telephone using the integrated circuit
US5340316A (en) 1993-05-28 1994-08-23 Panasonic Technologies, Inc. Synthesis-based speech training system
US5675808A (en) 1994-11-02 1997-10-07 Advanced Micro Devices, Inc. Power control of circuit modules within an integrated circuit
US6070140A (en) 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5828997A (en) 1995-06-07 1998-10-27 Sensimetrics Corporation Content analyzer mixing inverse-direction-probability-weighted noise to input signal
EP0766494B1 (en) * 1995-09-29 2002-08-14 STMicroelectronics S.r.l. Digital microphonic device
DE19546168C1 (de) 1995-12-11 1997-02-20 Siemens Ag Digitale Signalprozessor-Anordnung zum Vergleich von Merkmalsvektoren und deren Verwendung sowie zugehöriges Betriebsverfahren
US5825898A (en) 1996-06-27 1998-10-20 Lamar Signal Processing Ltd. System and method for adaptive interference cancelling
US5822598A (en) 1996-07-12 1998-10-13 Ast Research, Inc. Audio activity detection circuit to increase battery life in portable computers
JP3328532B2 (ja) 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
EP0867856B1 (fr) 1997-03-25 2005-10-26 Koninklijke Philips Electronics N.V. "Méthode et dispositif de detection d'activité vocale"
JP3541339B2 (ja) 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
JP3216704B2 (ja) 1997-08-01 2001-10-09 日本電気株式会社 適応アレイ装置
US6057791A (en) 1998-02-18 2000-05-02 Oasis Design, Inc. Apparatus and method for clocking digital and analog circuits on a common substrate to enhance digital operation and reduce analog sampling error
SE512228C2 (sv) 1998-06-24 2000-02-14 Bjoern Svedberg Förfarande och anordning för magnetisk orientering av fibrer
JP2000174615A (ja) 1998-11-27 2000-06-23 Renyo Handotai Kofun Yugenkoshi 集積回路の内部クロック周波数を自動補正する方法と装置
US6381570B2 (en) 1999-02-12 2002-04-30 Telogy Networks, Inc. Adaptive two-threshold method for discriminating noise from speech in a communication signal
US6249757B1 (en) 1999-02-16 2001-06-19 3Com Corporation System for detecting voice activity
US6549587B1 (en) 1999-09-20 2003-04-15 Broadcom Corporation Voice and data exchange over a packet based network with timing recovery
EP1081685A3 (en) 1999-09-01 2002-04-24 TRW Inc. System and method for noise reduction using a single microphone
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
US6397186B1 (en) 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
AU2001259446A1 (en) 2000-05-02 2001-11-12 Dragon Systems, Inc. Error correction in speech recognition
US7346176B1 (en) 2000-05-11 2008-03-18 Plantronics, Inc. Auto-adjust noise canceling microphone with position sensor
EP1304016B1 (en) 2000-07-05 2004-09-22 Koninklijke Philips Electronics N.V. A/d converter with integrated biasing for a microphone
US6829244B1 (en) 2000-12-11 2004-12-07 Cisco Technology, Inc. Mechanism for modem pass-through with non-synchronized gateway clocks
US20030004720A1 (en) 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
WO2002069890A2 (en) 2001-03-02 2002-09-12 Regeneron Pharmaceuticals, Inc. Methods of identifying agents affecting atrophy and hypertrophy
US6876859B2 (en) 2001-07-18 2005-04-05 Trueposition, Inc. Method for estimating TDOA and FDOA in a wireless location system
DE10160830A1 (de) 2001-12-11 2003-06-26 Infineon Technologies Ag Mikromechanische Sensoren und Verfahren zur Herstellung derselben
WO2007106399A2 (en) 2006-03-10 2007-09-20 Mh Acoustics, Llc Noise-reducing directional microphone array
US8098844B2 (en) 2002-02-05 2012-01-17 Mh Acoustics, Llc Dual-microphone spatial noise suppression
US20030171907A1 (en) 2002-03-06 2003-09-11 Shay Gal-On Methods and Apparatus for Optimizing Applications on Configurable Processors
US6756700B2 (en) 2002-03-13 2004-06-29 Kye Systems Corp. Sound-activated wake-up device for electronic input devices having a sleep-mode
US7319959B1 (en) 2002-05-14 2008-01-15 Audience, Inc. Multi-source phoneme classification for noise-robust automatic speech recognition
WO2004021587A1 (en) 2002-08-29 2004-03-11 Bae Systems Information And Electronic Systems Integration, Inc. Method for separating interferering signals and computing arrival angles
KR100477699B1 (ko) 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US7386451B2 (en) 2003-09-11 2008-06-10 Microsoft Corporation Optimization of an objective measure for estimating mean opinion score of synthesized speech
GB2405949A (en) 2003-09-12 2005-03-16 Canon Kk Voice activated device with periodicity determination
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
US20050078841A1 (en) 2003-10-14 2005-04-14 Boor Steven E. Method and apparatus for resetting a buffer amplifier
EP1690437B1 (en) 2003-11-24 2011-01-12 Epcos Pte Ltd Microphone comprising integral multi-level quantizer and single-bit conversion means
US7636855B2 (en) 2004-01-30 2009-12-22 Panasonic Corporation Multiple choice challenge-response user authorization system and method
EP1714385A1 (en) 2004-02-09 2006-10-25 Audioasics A/S Digital microphone
DE102004011149B3 (de) 2004-03-08 2005-11-10 Infineon Technologies Ag Mikrophon und Verfahren zur Herstellung eines Mikrophons
US7957542B2 (en) 2004-04-28 2011-06-07 Koninklijke Philips Electronics N.V. Adaptive beamformer, sidelobe canceller, handsfree speech communication device
AU2005253600B2 (en) 2004-06-04 2011-01-27 Benjamin Firooz Ghassabian Systems to enhance data entry in mobile and fixed environment
US20060013415A1 (en) 2004-07-15 2006-01-19 Winchester Charles E Voice activation and transmission system
US20060074658A1 (en) 2004-10-01 2006-04-06 Siemens Information And Communication Mobile, Llc Systems and methods for hands-free voice-activated devices
US7372316B2 (en) 2004-11-25 2008-05-13 Stmicroelectronics Pvt. Ltd. Temperature compensated reference current generator
US7268006B2 (en) 2004-12-30 2007-09-11 E.I. Du Pont De Nemours And Company Electronic device including a guest material within a layer and a process for forming the same
US7102452B1 (en) 2004-12-31 2006-09-05 Zilog, Inc. Temperature-compensated RC oscillator
US7795695B2 (en) 2005-01-27 2010-09-14 Analog Devices, Inc. Integrated microphone
DE102005008511B4 (de) 2005-02-24 2019-09-12 Tdk Corporation MEMS-Mikrofon
US7825484B2 (en) 2005-04-25 2010-11-02 Analog Devices, Inc. Micromachined microphone and multisensor and method for producing same
CN101288337B (zh) 2005-07-19 2012-11-21 美国亚德诺半导体公司 可编程麦克风
EP1923866B1 (en) 2005-08-11 2014-01-01 Asahi Kasei Kabushiki Kaisha Sound source separating device, speech recognizing device, portable telephone, sound source separating method, and program
SG130158A1 (en) 2005-08-20 2007-03-20 Bse Co Ltd Silicon based condenser microphone and packaging method for the same
US20070053522A1 (en) 2005-09-08 2007-03-08 Murray Daniel J Method and apparatus for directional enhancement of speech elements in noisy environments
WO2007028250A2 (en) 2005-09-09 2007-03-15 Mcmaster University Method and device for binaural signal enhancement
JP4742226B2 (ja) 2005-09-28 2011-08-10 国立大学法人九州大学 能動消音制御装置及び方法
US7813923B2 (en) 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
DE102005053765B4 (de) 2005-11-10 2016-04-14 Epcos Ag MEMS-Package und Verfahren zur Herstellung
DE102005053767B4 (de) 2005-11-10 2014-10-30 Epcos Ag MEMS-Mikrofon, Verfahren zur Herstellung und Verfahren zum Einbau
US7856283B2 (en) 2005-12-13 2010-12-21 Sigmatel, Inc. Digital microphone interface, audio codec and methods for use therewith
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
JP5040909B2 (ja) 2006-02-23 2012-10-03 日本電気株式会社 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
GB0605576D0 (en) 2006-03-20 2006-04-26 Oligon Ltd MEMS device
US8180067B2 (en) 2006-04-28 2012-05-15 Harman International Industries, Incorporated System for selectively extracting components of an audio input signal
KR100722686B1 (ko) 2006-05-09 2007-05-30 주식회사 비에스이 부가적인 백 챔버를 갖고 기판에 음향홀이 형성된 실리콘콘덴서 마이크로폰
US20070274297A1 (en) 2006-05-10 2007-11-29 Cross Charles W Jr Streaming audio from a full-duplex network through a half-duplex device
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US7546498B1 (en) 2006-06-02 2009-06-09 Lattice Semiconductor Corporation Programmable logic devices with custom identification systems and methods
EP2036396B1 (en) 2006-06-23 2009-12-02 GN ReSound A/S A hearing instrument with adaptive directional signal processing
US7957972B2 (en) 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
US8214202B2 (en) 2006-09-13 2012-07-03 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
WO2008066836A1 (en) 2006-11-28 2008-06-05 Treyex Llc Method and apparatus for translating speech during a call
US20080175425A1 (en) 2006-11-30 2008-07-24 Analog Devices, Inc. Microphone System with Silicon Microphone Secured to Package Lid
ATE403928T1 (de) 2006-12-14 2008-08-15 Harman Becker Automotive Sys Sprachdialogkontrolle basierend auf signalvorverarbeitung
TWI327357B (en) 2007-01-10 2010-07-11 Advanced Semiconductor Eng Mems microphone package and method thereof
US7986794B2 (en) 2007-01-11 2011-07-26 Fortemedia, Inc. Small array microphone apparatus and beam forming method thereof
JP5401760B2 (ja) 2007-02-05 2014-01-29 ソニー株式会社 ヘッドフォン装置、音声再生システム、音声再生方法
US8099288B2 (en) 2007-02-12 2012-01-17 Microsoft Corp. Text-dependent speaker verification
US8005238B2 (en) 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
US7873114B2 (en) 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US7769585B2 (en) * 2007-04-05 2010-08-03 Avidyne Corporation System and method of voice activity detection in noisy environments
TWI323242B (en) 2007-05-15 2010-04-11 Ind Tech Res Inst Package and packageing assembly of microelectromechanical system microphone
JP5056157B2 (ja) * 2007-05-18 2012-10-24 ソニー株式会社 ノイズ低減回路
US20090012786A1 (en) 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive Noise Cancellation
US7817808B2 (en) 2007-07-19 2010-10-19 Alon Konchitsky Dual adaptive structure for speech enhancement
DE602007003220D1 (de) 2007-08-13 2009-12-24 Harman Becker Automotive Sys Rauschverringerung mittels Kombination aus Strahlformung und Nachfilterung
US8155346B2 (en) 2007-10-01 2012-04-10 Panasonic Corpration Audio source direction detecting device
US8175291B2 (en) 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
TWM341025U (en) 2008-01-10 2008-09-21 Lingsen Precision Ind Ltd Micro electro-mechanical microphone package structure
US8554551B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context replacement by audio level
KR100911866B1 (ko) 2008-04-14 2009-08-11 주식회사 하이닉스반도체 내부전압 생성회로를 포함하는 반도체 메모리장치
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
JP5804943B2 (ja) 2008-05-05 2015-11-04 エプコス ピーティーイー リミテッド 高速で精密な電荷ポンプ
ES2582232T3 (es) * 2008-06-30 2016-09-09 Dolby Laboratories Licensing Corporation Detector de actividad de voz de múltiples micrófonos
US7619551B1 (en) 2008-07-29 2009-11-17 Fortemedia, Inc. Audio codec, digital device and voice processing method
WO2010022453A1 (en) 2008-08-29 2010-03-04 Dev-Audio Pty Ltd A microphone array system and method for sound acquisition
US8193596B2 (en) 2008-09-03 2012-06-05 Solid State System Co., Ltd. Micro-electro-mechanical systems (MEMS) package
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8352272B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8724829B2 (en) 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
EP2359361B1 (en) 2008-10-30 2018-07-04 Telefonaktiebolaget LM Ericsson (publ) Telephony content signal discrimination
US8111843B2 (en) 2008-11-11 2012-02-07 Motorola Solutions, Inc. Compensation for nonuniform delayed group communications
CN102224675B (zh) 2008-11-25 2014-04-02 应美盛股份有限公司 动态偏置放大器
US8351634B2 (en) 2008-11-26 2013-01-08 Analog Devices, Inc. Side-ported MEMS microphone assembly
US8170238B2 (en) * 2008-12-02 2012-05-01 Fortemedia, Inc. Integrated circuit attached to microphone
US8472648B2 (en) 2009-01-20 2013-06-25 General Mems Corporation Miniature MEMS condenser microphone package and fabrication method thereof
US8325951B2 (en) 2009-01-20 2012-12-04 General Mems Corporation Miniature MEMS condenser microphone packages and fabrication method thereof
US8184822B2 (en) 2009-04-28 2012-05-22 Bose Corporation ANR signal processing topology
CN201438743U (zh) 2009-05-15 2010-04-14 瑞声声学科技(常州)有限公司 麦克风
AU2010251756A1 (en) 2009-05-19 2012-01-12 Moip Pty Ltd Communications apparatus, system and method
US9083288B2 (en) * 2009-06-11 2015-07-14 Invensense, Inc. High level capable audio amplification circuit
US9547642B2 (en) 2009-06-17 2017-01-17 Empire Technology Development Llc Voice to text to voice processing
CN101651917A (zh) 2009-06-19 2010-02-17 瑞声声学科技(深圳)有限公司 电容麦克风
CN101651913A (zh) 2009-06-19 2010-02-17 瑞声声学科技(深圳)有限公司 麦克风
CN101959106A (zh) 2009-07-16 2011-01-26 鸿富锦精密工业(深圳)有限公司 微机电系统麦克风的封装结构及其封装方法
US8275148B2 (en) 2009-07-28 2012-09-25 Fortemedia, Inc. Audio processing apparatus and method
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
US8787591B2 (en) * 2009-09-11 2014-07-22 Texas Instruments Incorporated Method and system for interference suppression using blind source separation
CN101765047A (zh) 2009-09-28 2010-06-30 瑞声声学科技(深圳)有限公司 电容麦克风及其制作方法
US20110099010A1 (en) 2009-10-22 2011-04-28 Broadcom Corporation Multi-channel noise suppression system
US8261011B2 (en) 2009-10-29 2012-09-04 Freescale Semiconductor, Inc. One-time programmable memory device and methods thereof
US8626498B2 (en) 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
JP5533042B2 (ja) 2010-03-04 2014-06-25 富士通株式会社 音声検索装置、音声検索方法、プログラム及び記録媒体
US8606571B1 (en) 2010-04-19 2013-12-10 Audience, Inc. Spatial selectivity noise reduction tradeoff for multi-microphone systems
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8958572B1 (en) 2010-04-19 2015-02-17 Audience, Inc. Adaptive noise cancellation for multi-microphone systems
US8515089B2 (en) 2010-06-04 2013-08-20 Apple Inc. Active noise cancellation decisions in a portable audio device
JP5529635B2 (ja) * 2010-06-10 2014-06-25 キヤノン株式会社 音声信号処理装置および音声信号処理方法
US8447045B1 (en) 2010-09-07 2013-05-21 Audience, Inc. Multi-microphone active noise cancellation system
TWI446141B (zh) 2010-11-09 2014-07-21 Nuvoton Technology Corp 時脈校正方法與裝置以及電子裝置
EP2494545A4 (en) 2010-12-24 2012-11-21 Huawei Tech Co Ltd METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES
CN102568480A (zh) 2010-12-27 2012-07-11 深圳富泰宏精密工业有限公司 双模手机语音传输系统
GB2501633A (en) 2011-01-05 2013-10-30 Health Fidelity Inc A voice based system and method for data input
JP5621601B2 (ja) 2011-01-12 2014-11-12 株式会社リコー ボリューム調整回路
US20130058495A1 (en) 2011-09-01 2013-03-07 Claus Erdmann Furst System and A Method For Streaming PDM Data From Or To At Least One Audio Component
US8996381B2 (en) 2011-09-27 2015-03-31 Sensory, Incorporated Background speech recognition assistant
US8666751B2 (en) 2011-11-17 2014-03-04 Microsoft Corporation Audio pattern matching for device activation
US9424849B2 (en) * 2011-12-14 2016-08-23 Cirrus Logic, Inc. Data transfer
US9208772B2 (en) * 2011-12-23 2015-12-08 Bose Corporation Communications headset speech-based gain control
US9337722B2 (en) 2012-01-27 2016-05-10 Invensense, Inc. Fast power-up bias voltage circuit
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
US9431012B2 (en) 2012-04-30 2016-08-30 2236008 Ontario Inc. Post processing of natural language automatic speech recognition
US9093076B2 (en) 2012-04-30 2015-07-28 2236008 Ontario Inc. Multipass ASR controlling multiple applications
US9479275B2 (en) 2012-06-01 2016-10-25 Blackberry Limited Multiformat digital audio interface
TWI474317B (zh) 2012-07-06 2015-02-21 Realtek Semiconductor Corp 訊號處理裝置以及訊號處理方法
CN102983868B (zh) 2012-11-02 2015-01-28 小米科技有限责任公司 信号处理方法、装置及系统
KR20140060040A (ko) * 2012-11-09 2014-05-19 삼성전자주식회사 디스플레이장치, 음성취득장치 및 그 음성인식방법
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
CN103117065B (zh) 2013-01-09 2015-09-30 上海大唐移动通信设备有限公司 平均意见评分语音测试装置及其控制方法、语音测试方法
WO2014134216A1 (en) 2013-02-27 2014-09-04 Audience, Inc. Voice-controlled communication connections
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
US9349386B2 (en) 2013-03-07 2016-05-24 Analog Device Global System and method for processor wake-up based on sensor data
US9361885B2 (en) 2013-03-12 2016-06-07 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US9112984B2 (en) 2013-03-12 2015-08-18 Nuance Communications, Inc. Methods and apparatus for detecting a voice command
US11393461B2 (en) 2013-03-12 2022-07-19 Cerence Operating Company Methods and apparatus for detecting a voice command
US20140270259A1 (en) 2013-03-13 2014-09-18 Aliphcom Speech detection using low power microelectrical mechanical systems sensor
US9703350B2 (en) 2013-03-15 2017-07-11 Maxim Integrated Products, Inc. Always-on low-power keyword spotting
US20140316783A1 (en) 2013-04-19 2014-10-23 Eitan Asher Medina Vocal keyword training from text
EP2801974A3 (en) 2013-05-09 2015-02-18 DSP Group Ltd. Low power activation of a voice activated device
US20140343949A1 (en) 2013-05-17 2014-11-20 Fortemedia, Inc. Smart microphone device
US9111548B2 (en) 2013-05-23 2015-08-18 Knowles Electronics, Llc Synchronization of buffered data in multiple microphones
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9984705B2 (en) 2013-07-25 2018-05-29 Dsp Group Ltd. Non-intrusive quality measurements for use in enhancing audio quality
US9245527B2 (en) 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
US20150112690A1 (en) 2013-10-22 2015-04-23 Nvidia Corporation Low power always-on voice trigger architecture
US10079019B2 (en) 2013-11-12 2018-09-18 Apple Inc. Always-on audio control for mobile device

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11983463B2 (en) 2016-02-22 2024-05-14 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US11947870B2 (en) 2016-02-22 2024-04-02 Sonos, Inc. Audio response playback
US11750969B2 (en) 2016-02-22 2023-09-05 Sonos, Inc. Default playback device designation
US11863593B2 (en) 2016-02-22 2024-01-02 Sonos, Inc. Networked microphone device control
US12047752B2 (en) 2016-02-22 2024-07-23 Sonos, Inc. Content mixing
US11832068B2 (en) 2016-02-22 2023-11-28 Sonos, Inc. Music service selection
US12080314B2 (en) 2016-06-09 2024-09-03 Sonos, Inc. Dynamic player selection for audio signal processing
US11979960B2 (en) 2016-07-15 2024-05-07 Sonos, Inc. Contextualization of voice inputs
US11934742B2 (en) 2016-08-05 2024-03-19 Sonos, Inc. Playback device supporting concurrent voice assistants
US11727933B2 (en) 2016-10-19 2023-08-15 Sonos, Inc. Arbitration-based voice recognition
TWI690919B (zh) * 2017-05-27 2020-04-11 大陸商騰訊科技(深圳)有限公司 語音關鍵字識別方法、裝置、終端、伺服器、電腦可讀儲存介質及電腦程式產品
CN111194439B (zh) * 2017-08-07 2023-07-07 搜诺思公司 唤醒词检测抑制
CN111194439A (zh) * 2017-08-07 2020-05-22 搜诺思公司 唤醒词检测抑制
US11900937B2 (en) 2017-08-07 2024-02-13 Sonos, Inc. Wake-word detection suppression
US11816393B2 (en) 2017-09-08 2023-11-14 Sonos, Inc. Dynamic computation of system response volume
US11817076B2 (en) 2017-09-28 2023-11-14 Sonos, Inc. Multi-channel acoustic echo cancellation
US12047753B1 (en) 2017-09-28 2024-07-23 Sonos, Inc. Three-dimensional beam forming with a microphone array
US11893308B2 (en) 2017-09-29 2024-02-06 Sonos, Inc. Media playback system with concurrent voice assistance
US11797263B2 (en) 2018-05-10 2023-10-24 Sonos, Inc. Systems and methods for voice-assisted media content selection
US11792590B2 (en) 2018-05-25 2023-10-17 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11973893B2 (en) 2018-08-28 2024-04-30 Sonos, Inc. Do not disturb feature for audio notifications
US11778259B2 (en) 2018-09-14 2023-10-03 Sonos, Inc. Networked devices, systems and methods for associating playback devices based on sound codes
US11790937B2 (en) 2018-09-21 2023-10-17 Sonos, Inc. Voice detection optimization using sound metadata
US11790911B2 (en) 2018-09-28 2023-10-17 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US12062383B2 (en) 2018-09-29 2024-08-13 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
US11881223B2 (en) 2018-12-07 2024-01-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11817083B2 (en) 2018-12-13 2023-11-14 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US12063486B2 (en) 2018-12-20 2024-08-13 Sonos, Inc. Optimization of network microphone devices using noise classification
US11798553B2 (en) 2019-05-03 2023-10-24 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11854547B2 (en) 2019-06-12 2023-12-26 Sonos, Inc. Network microphone device with command keyword eventing
US12093608B2 (en) 2019-07-31 2024-09-17 Sonos, Inc. Noise classification for event detection
US11862161B2 (en) 2019-10-22 2024-01-02 Sonos, Inc. VAS toggle based on device orientation
US11869503B2 (en) 2019-12-20 2024-01-09 Sonos, Inc. Offline voice control
US11887598B2 (en) 2020-01-07 2024-01-30 Sonos, Inc. Voice verification for media playback
US12118273B2 (en) 2020-01-31 2024-10-15 Sonos, Inc. Local voice data processing
US11961519B2 (en) 2020-02-07 2024-04-16 Sonos, Inc. Localized wakeword verification
US11881222B2 (en) 2020-05-20 2024-01-23 Sonos, Inc Command keywords with input detection windowing
US12119000B2 (en) 2020-05-20 2024-10-15 Sonos, Inc. Input detection windowing
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range

Also Published As

Publication number Publication date
US10045140B2 (en) 2018-08-07
US20180332416A1 (en) 2018-11-15
CN107112012B (zh) 2020-11-20
US20160196838A1 (en) 2016-07-07
DE112016000287T5 (de) 2017-10-05
CN107112012A (zh) 2017-08-29
WO2016112113A1 (en) 2016-07-14
US10469967B2 (en) 2019-11-05

Similar Documents

Publication Publication Date Title
US10469967B2 (en) Utilizing digital microphones for low power keyword detection and noise suppression
US9978388B2 (en) Systems and methods for restoration of speech components
US9668048B2 (en) Contextual switching of microphones
JP6713035B2 (ja) ファーフィールド音声機能の実現方法、設備、システム、記憶媒体及びプログラム
US20160162469A1 (en) Dynamic Local ASR Vocabulary
JP7324753B2 (ja) 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調
US20210217433A1 (en) Voice processing method and apparatus, and device
CN109155884B (zh) 用于立体声分离和定向抑制的系统和方法
TWI711035B (zh) 方位角估計的方法、設備、語音交互系統及儲存介質
US9953634B1 (en) Passive training for automatic speech recognition
JP6703525B2 (ja) 音源を強調するための方法及び機器
WO2016094418A1 (en) Dynamic local asr vocabulary
US20230037824A1 (en) Methods for reducing error in environmental noise compensation systems
US9508345B1 (en) Continuous voice sensing
US20170206898A1 (en) Systems and methods for assisting automatic speech recognition
US20180277134A1 (en) Key Click Suppression
US20150249884A1 (en) Post-processed reference path for acoustic echo cancellation
CN111147655B (zh) 模型生成方法和装置
WO2020107385A1 (zh) 增益处理方法及其装置、电子设备、信号采集方法及其系统
JP2020024310A (ja) 音声処理システム及び音声処理方法
CN113593619B (zh) 用于录制音频的方法、装置、设备和介质
JP6361360B2 (ja) 残響判定装置及びプログラム
US20230298612A1 (en) Microphone Array Configuration Invariant, Streaming, Multichannel Neural Enhancement Frontend for Automatic Speech Recognition
CN111145792B (zh) 音频处理方法和装置
CN114203136A (zh) 回声消除方法、语音识别方法、语音唤醒方法和装置